JP2014530573A - 参照ピクチャシグナリングおよび復号ピクチャバッファ管理 - Google Patents

参照ピクチャシグナリングおよび復号ピクチャバッファ管理 Download PDF

Info

Publication number
JP2014530573A
JP2014530573A JP2014532019A JP2014532019A JP2014530573A JP 2014530573 A JP2014530573 A JP 2014530573A JP 2014532019 A JP2014532019 A JP 2014532019A JP 2014532019 A JP2014532019 A JP 2014532019A JP 2014530573 A JP2014530573 A JP 2014530573A
Authority
JP
Japan
Prior art keywords
picture
value
long
current picture
pictures
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2014532019A
Other languages
English (en)
Other versions
JP6009569B2 (ja
Inventor
チェン、イン
ワン、イェ—クイ
ワン、イェ―クイ
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Qualcomm Inc
Original Assignee
Qualcomm Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Qualcomm Inc filed Critical Qualcomm Inc
Publication of JP2014530573A publication Critical patent/JP2014530573A/ja
Application granted granted Critical
Publication of JP6009569B2 publication Critical patent/JP6009569B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/58Motion compensation with long-term prediction, i.e. the reference frame for a current frame not being the temporally closest one
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/105Selection of the reference unit for prediction within a chosen coding or prediction mode, e.g. adaptive choice of position and number of pixels used for prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/107Selection of coding mode or of prediction mode between spatial and temporal predictive coding, e.g. picture refresh
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/109Selection of coding mode or of prediction mode among a plurality of temporal predictive coding modes
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/174Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a slice, e.g. a line of blocks or a group of blocks
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/46Embedding additional information in the video signal during the compression process
    • H04N19/463Embedding additional information in the video signal during the compression process by compressing encoding parameters before transmission
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/70Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N7/00Television systems
    • H04N7/12Systems in which the television signal is transmitted via one channel or a plurality of parallel channels, the bandwidth of each channel being less than the bandwidth of the television signal

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Television Signal Processing For Recording (AREA)
  • Management Or Editing Of Information On Record Carriers (AREA)
  • Measuring And Recording Apparatus For Diagnosis (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Magnetic Resonance Imaging Apparatus (AREA)

Abstract

瞬時デコーダリフレッシュピクチャではないランダムアクセスポイントピクチャから始まるランダムアクセスの実施に関連した技法について、記載する。いくつかの技法は、参照ピクチャセットの長期参照ピクチャについてシグナリングされる情報の量の削減にも関連する。追加技法は、時間的識別値に基づく復号ピクチャの削除など、復号ピクチャバッファ管理にも関連する。

Description

本出願は、各々の内容全体が参照により組み込まれる、
2011年9月23日に出願した米国仮出願第61/538,787号、
2011年9月26日に出願した米国仮特許出願第61/539,433号、および
2011年9月30日に出願した米国仮特許出願第61/542,034号の利益を主張する。
本開示は、ビデオコーディングに関し、より詳細には、ビデオデータをコーディングするための技法に関する。
デジタルビデオ機能は、デジタルテレビジョン、デジタルダイレクトブロードキャストシステム、ワイヤレスブロードキャストシステム、携帯情報端末(PDA)、ラップトップまたはデスクトップコンピュータ、タブレットコンピュータ、電子ブックリーダ、デジタルカメラ、デジタル記録デバイス、デジタルメディアプレーヤ、ビデオゲームデバイス、ビデオゲームコンソール、セルラーまたは衛星無線電話、いわゆる「スマートフォン」、ビデオ遠隔会議デバイス、ビデオストリーミングデバイスなどを含む、広範囲にわたるデバイスに組み込まれ得る。デジタルビデオデバイスは、MPEG−2、MPEG−4、ITU−T H.263、ITU−T H.264/MPEG−4、Part 10、アドバンストビデオコーディング(AVC:Advanced Video Coding)、現在開発中の高効率ビデオコーディング(HEVC)規格によって定義された規格、およびそのような規格の拡張に記載されているビデオ圧縮技法など、ビデオ圧縮技法を実装する。ビデオデバイスは、そのようなビデオ圧縮技法を実装することによって、デジタルビデオ情報をより効率的に送信、受信、符号化、復号、および/または記憶し得る。
ビデオ圧縮技法は、ビデオシーケンスに固有の冗長性を低減または除去するために空間的(イントラピクチャ)予測および/または時間的(インターピクチャ)予測を実施する。ブロックベースのビデオコーディングの場合、ビデオスライス(すなわち、ビデオピクチャまたはビデオピクチャの一部分)が、ツリーブロック、コーティングツリーブロック(CTB)、コーディングツリーユニット(CTU)、コーディングユニット(CU:coding unit)および/またはコーディングノードと呼ばれることもあるビデオブロックに区分され得る。ピクチャのイントラコード化(I)スライス中のビデオブロックは、同じピクチャ中の隣接ブロック内の参照サンプルに対する空間的予測を使用して符号化される。ピクチャのインターコード化(PまたはB)スライス中のビデオブロックは、同じピクチャ中の隣接ブロック中の参照サンプルに対する空間的予測、または他の参照ピクチャ中の参照サンプルに対する時間的予測を使用し得る。ピクチャはフレームと呼ばれることがあり、参照ピクチャは参照フレームと呼ばれることがある。
空間的予測または時間的予測によって、コーディングされるべきブロックの予測ブロックが生じる。残差データは、コーディングされるべき元のブロックと予測ブロックとの間のピクセル差分を表す。インターコード化ブロックは、予測ブロックを形成する参照サンプルのブロックを指す動きベクトル、およびコード化ブロックと予測ブロックとの間の差分を示す残差データに従って符号化される。イントラコード化ブロックは、イントラコーディングモードと残差データとに従って符号化される。さらなる圧縮のために、残差データは、ピクセル領域から変換領域に変換されて、残差変換係数が得られ得、その残差変換係数は、次いで量子化され得る。量子化変換係数は、最初は2次元アレイで構成され、変換係数の1次元ベクトルを生成するために走査され得、なお一層の圧縮を達成するために、エントロピーコーディングが適用され得る。
概して、本開示は、いくつかの参照ピクチャについての識別子をビデオコーダが判断するやり方に関連した技法について記載する。これらの技法は、ビデオコーダが、ある特定のタイプの参照ピクチャが現在のピクチャのインター予測に使われるべきかどうか判断するやり方にも関連する。さらに、これらの技法は、ピクチャバッファに記憶されたどのピクチャを削除してよいかの判断に関連する。
たとえば、いくつかの例では、瞬時デコーダリフレッシュピクチャではないランダムアクセスポイント(RAP)参照ピクチャについての完全識別子値を、ビデオエンコーダは、ビデオデータのコード化ビットストリーム中でシグナリングすることができ、ビデオデコーダは、ビデオデータのコード化ビットストリーム中で受信することができる。こうすることにより、復号順で非IDR RAP参照ピクチャに続く参照ピクチャについての部分的識別子値を、ビデオエンコーダは、ビデオデータのコード化ビットストリーム中でシグナリングし、ビデオデコーダは、ビデオデータのコード化ビットストリーム中で受信することができるようになり得る。そのような参照ピクチャについての部分的識別子値および非IDR RAP参照ピクチャについての完全識別子値から、ビデオデコーダは、復号順で非IDR RAP参照ピクチャに続く参照ピクチャについての完全識別子値を判断することができる。
いくつかの例では、ある特定のタイプの参照ピクチャがインター予測コーディングに使われるかどうかを示す値を、ビデオエンコーダは、ビデオデータのコード化ビットストリーム中でシグナリングすることができ、ビデオデコーダは、ビデオデータのコード化ビットストリーム中で受信することができる。これらの値が、特定のタイプの参照ピクチャがインター予測に必要とされないことを示す場合、特定のタイプの参照ピクチャについての識別子値を、ビデオエンコーダはシグナリングする必要がないことがあり、ビデオデコーダは受信する必要がないことがある。
ビデオエンコーダおよびビデオデコーダは、復号ピクチャバッファと呼ばれるピクチャバッファに復号ピクチャを記憶するように構成され得る。ビデオエンコーダおよびビデオデコーダは、空間を空けるために、復号ピクチャバッファに記憶されたピクチャを削除してよい。いくつかの例では、ビデオエンコーダおよびビデオデコーダは、復号ピクチャバッファに記憶されたピクチャの時間的識別値に基づいて、どのピクチャが復号ピクチャバッファから削除されるべきか判断することができる。
一例では、本開示は、ビデオデータをコーディングするための方法について説明する。この方法は、瞬時デコーダリフレッシュ(IDR)ピクチャではないランダムアクセスポイント(RAP)ピクチャについての完全識別子値をコーディングすることと、RAPピクチャについての完全識別子値に基づいて、非RAPピクチャについての部分的識別子値をコーディングすることとを含む。この例では、部分的識別子値は、非RAPピクチャについての完全識別子値の一部分を表す。
一例では、本開示は、ビデオデータをコーディングするためのデバイスについて説明する。このデバイスは、瞬時デコーダリフレッシュ(IDR)ピクチャではないランダムアクセスポイント(RAP)ピクチャについての完全識別子値をコーディングし、RAPピクチャについての完全識別子値に基づいて、非RAPピクチャについての部分的識別子値をコーディングするように構成されたビデオコーダを含む。この例では、部分的識別子値は、非RAPピクチャについての完全識別子値の一部分を表す。
一例では、本開示は、実行されると、ビデオデータをコーディングするためのデバイスのプロセッサに、瞬時デコーダリフレッシュ(IDR)ピクチャではないランダムアクセスポイント(RAP)ピクチャについての完全識別子値をコーディングさせ、RAPピクチャについての完全識別子値に基づいて、非RAPピクチャについての部分的識別子値をコーディングさせる命令を記憶したコンピュータ可読記憶媒体について記載する。この例では、部分的識別子値は、非RAPピクチャについての完全識別子値の一部分を表す。
一例では、本開示は、ビデオデータをコーディングするためのデバイスについて説明する。このデバイスは、瞬時デコーダリフレッシュ(IDR)ピクチャではないランダムアクセスポイント(RAP)ピクチャについての完全識別子値をコーディングするための手段と、RAPピクチャについての完全識別子値に基づいて、非RAPピクチャについての部分的識別子値をコーディングするための手段とを含む。この例では、部分的識別子値は、非RAPピクチャについての完全識別子値の一部分を表す。
1つまたは複数の例の詳細を添付の図面および以下の説明に記載する。他の特徴、目的、および利点は、その説明および図面、ならびに特許請求の範囲から明らかになろう。
本開示で説明する技法を利用し得る例示的なビデオ符号化および復号システムを示すブロック図。 本開示で説明する技法を実装し得る例示的なビデオエンコーダを示すブロック図。 本開示で説明する技法を実装し得る例示的なビデオデコーダを示すブロック図。 本開示の1つまたは複数の態様による例示的な動作を示すフローチャート。 本開示の1つまたは複数の態様による別の例示的な動作を示すフローチャート。 本開示の1つまたは複数の態様による別の例示的な動作を示すフローチャート。 本開示の1つまたは複数の態様による別の例示的な動作を示すフローチャート。 本開示の1つまたは複数の態様による別の例示的な動作を示すフローチャート。
本開示に記載する技法は概して、参照ピクチャについてのシグナリング情報および復号ピクチャバッファ(DPB)と呼ばれる、復号ピクチャを記憶するピクチャバッファの管理などのビデオコーディングに関する。様々なビデオコーディング規格が、ビデオコーディングが実施される方法を定義する。ビデオコーディング規格の例は、ITU−T H.261、ISO/IEC MPEG−1 Visual、ITU−T H.262またはISO/IEC MPEG−2 Visual、ITU−T H.263、ISO/IEC MPEG−4 Visual、ならびにスケーラブルビデオコーディング(SVC)およびマルチビュービデオコーディング拡張を含むITU−T H.264(ISO/IEC MPEG−4 AVCとしても知られている)を含む。
さらに、ITU−T Video Coding Experts Group(VCEG)とISO/IEC Motion Picture Experts Group(MPEG)とのJoint Collaboration Team on Video Coding(JCT−VC)によって開発されている新しいビデオコーディング規格、すなわち、高効率ビデオコーディング(HEVC)がある。これ以降HEVC WD8と呼ばれる、HEVCの最新の作業草案(WD)が、2012年7月20日の時点で、http://phenix.int−evry.fr/jct/doc_end_user/documents/10_Stockholm/wg11/JCTVC−J1003−v8.zipから入手可能である。
本開示に記載する技法は、これらの例示的規格のうちのいずれに記載されているものも含む、どのビデオコーディング技法にも適用可能であり得る。説明のために、本開示に記載する技法は、HEVC規格のコンテキストで記載されるが、本開示の態様はそのように限定されない。たとえば、本開示に記載する技法は、本開示に記載する技法が他の規格にも拡張可能であり、概してどのビデオコーディング技法にも拡張可能であることを理解した上で、HEVC規格において定義される参照ピクチャセットのコンテキストで記載される。
本開示に記載するビデオコーディング技法は、現在のピクチャのブロックをインター予測するために、参照ピクチャセット中で識別された参照ピクチャを使用することができる。参照ピクチャとは、現在のピクチャ内のブロックをインター予測するために使うことができるピクチャである。たとえば、ビデオデータは、比較的高いフレームレートで再生される一連の個々のピクチャに対応する。ビデオエンコーダおよびビデオデコーダなどのビデオコーダは、一般に、ブロックベースのビデオコーディング技法を使用する。つまり、ビデオコーダは、ピクチャの各々を、1組の個々のビデオデータブロックに分割し、次いでピクチャの各個々のブロックをコーディングすればよい。
ブロックベースのビデオコーディングは一般に、2つの一般的ステップを伴う。第1のステップは、ビデオデータの現在のブロックを予測することを含む。この予測は、イントラ予測(つまり、同じピクチャの隣接し合う事前コード化ブロックに基づく空間予測)またはインター予測(つまり、1つもしくは複数の事前コード化ピクチャに基づく時間的予測)を使用し得る。インター予測に使うことができるこれらの事前コード化ピクチャは、参照ピクチャと呼ばれ得る。この予測プロセスを実施することにより、現在のブロックに対する予測ブロックが生成される。他方のステップは、残差ブロックのコーディングを伴う。概して、現在のブロックの元の非コード化バージョンと予測ブロックとの間の残差ブロックは、ピクセルごとの差を表す。ビデオエンコーダは、ピクセルごとの差を算出することによって残差ブロックを形成し、ビデオデコーダは、残差ブロックを予測ブロックに追加して、元のブロックを再現する。
たとえば、ビデオエンコーダおよびビデオデコーダは各々、それぞれの復号ピクチャバッファを含む。それぞれの復号ピクチャバッファは、復号ピクチャを記憶する。たとえば、ビデオ復号の一部として、ビデオデコーダは、ピクチャを、復号した後でビデオデコーダのDPBに記憶することができる。ビデオデコーダは次いで、復号ピクチャを表示のために後で出力することができ、かつ/または復号ピクチャを、後続インター予測ピクチャを復号するための参照ピクチャとして使用することができる。
ビデオエンコーダはまた、符号化プロセスの一部として復号ピクチャを記憶することができる。たとえば、ピクチャを符号化した後、ビデオエンコーダは再構成プロセスを実施してよく、このプロセスにおいてビデオエンコーダは符号化ピクチャを復号する。ビデオエンコーダは、後続ピクチャをインター予測するために、復号ピクチャをビデオエンコーダのDPBに記憶すればよい。
言い換えると、ビデオエンコーダおよびビデオデコーダは、後続コード化ピクチャを予測するために、および将来の出力のために使われる復号ピクチャをDPBにバッファリングすることができる。バッファメモリ(すなわち、DPB)を効率的に使用するために、現行および開発中のビデオコーディング規格は、DPBへの復号ピクチャの記憶プロセスと、参照ピクチャのマーキングプロセスと、DPBからの復号ピクチャの出力および削除プロセスとを含むDPB管理プロセスを指定することができる。概して、いくつかの現行および開発中のビデオコーディング規格では、DPB管理は、ピクチャ識別および参照ピクチャ識別、参照ピクチャリスト構成、参照ピクチャマーキング、DPBからのピクチャ出力、DPBへのピクチャ挿入、およびDPBからのピクチャ削除という側面のうちの1つまたは複数を含み得る。
上述したように、ビデオデコーダはDPBにピクチャを記憶することができ、1つまたは複数のこれらのピクチャは、参照ピクチャである可能性があり得る。本開示に記載する技法によると、ビデオエンコーダは、ビデオデコーダのDPB中のどのピクチャが現在のピクチャおよび/または復号順で現在のピクチャに続くピクチャをインター予測するために使われ得るかを示す情報をシグナリングすることができる。言い換えると、ビデオエンコーダは、ビデオデコーダが参照ピクチャセットを導出するために使用する、現在のピクチャについての参照ピクチャ情報をシグナリングすることができ、ここで参照ピクチャセットは、現在のピクチャおよび/または復号順で現在のピクチャに続くピクチャをインター予測するために使うことができる参照ピクチャを識別する。インター予測に使うことができる参照ピクチャは、必ずしもインター予測に使われる必要はないことを理解されたい。
ビデオエンコーダは、各ピクチャ用の参照ピクチャセットにどの参照ピクチャが属すかを示す情報をシグナリングすることができる。たとえば、各ピクチャについて、ビデオデコーダは、そのピクチャをインター予測するために、および/または復号順でそのピクチャに続くピクチャをインター予測するためにどの参照ピクチャが使われ得るかを示す情報を受信し得る。
概して、ビデオエンコーダは、ピクチャオーダーカウント(POC)値を使って参照ピクチャを識別する。POC値は、対応するピクチャの相対出力順(つまり、表示順)を記述する。たとえば、より低いPOC値をもつピクチャは、より高いPOC値をもつピクチャよりも早く表示される。ピクチャの表示順とピクチャの復号順は、混同されるべきでない。POC値がより低いピクチャは、必ずしもPOC値がより高いピクチャよりも早く復号される必要はない。同様に、POC値がより高いピクチャは、必ずしもPOC値がより低いピクチャよりも後で復号される必要はない。いくつかの例では、POC値がより低いピクチャが、POC値がより高いピクチャよりも早く復号されることも可能な場合がある。
いくつかの例では、参照ピクチャのPOC値を識別するためにシグナリングされる必要があるビットの数を削減するために、ビデオエンコーダは、ある特定のタイプの参照ピクチャについての完全POC値と、他のタイプの参照ピクチャについての部分的POC値とをシグナリングすればよい。たとえば、ビデオエンコーダは、瞬時復号可能リフレッシュ(IDR)ピクチャについての、最上位ビット(MSB)と最下位ビット(LSB)とを含む完全POC値をシグナリングすればよい。IDRピクチャは、ピクチャシーケンス中の最初のピクチャであり得る。シーケンスの他のピクチャについて、ビデオエンコーダは、LSBのみであり得る部分的POC値をシグナリングすればよい。ビデオデコーダは、非IDRピクチャおよび前のIDRピクチャについての受信したLSBに基づいて、非IDRピクチャについての完全POC値を判断することができる。
これは、POC値についてシグナリングされるべき必要があるビットの数を削減する際にはうまく機能することができるが、非IDRピクチャから始まるランダムアクセスにとっては問題があり得る。ランダムアクセスでは、ビデオデコーダは、任意のランダムアクセスポイントから始まるコード化ビデオシーケンスを復号し得る。ランダムアクセスポイントの一例は、コード化ビデオシーケンス中の、順序が第1のコード化ピクチャではなく、IDRピクチャである、コード化ピクチャである。言い換えると、ランダムアクセスのいくつかの例では、ビデオデコーダは、非IDRピクチャから開始して、ビデオシーケンスを復号することができる。
この場合、ビデオデコーダは、ピクチャについての部分的POC値を受信することができるが、IDRピクチャが利用可能でない場合があり、したがって、IDRピクチャの完全POC値が利用可能でない場合があるので、ピクチャについての完全POC値を再構成することはできない可能性がある。次いで、ビデオデコーダは、参照ピクチャとなるべきピクチャについての完全POC値を受信することができる。ただし、ビデオデコーダは、復号ピクチャの完全POC値を再構成することができない場合があるので、この例では、ビデオデコーダは、記憶されているDPB中のどのピクチャが参照ピクチャとなることを意図されているか判断することができない場合がある。言い換えると、ビデオデコーダは、参照ピクチャのPOC値を、DPBに記憶されたどのピクチャにもマッピングすることができない場合があり、このことは、ビデオデコーダのランダムアクセスを実装する能力に悪影響を与える。
本開示に記載する技法は、ランダムアクセスのためのより堅牢な機構を実現し得る。たとえば、ビデオエンコーダは、ビデオシーケンス中のいくつかの非IDRランダムアクセスポイント(RAP)ピクチャについての完全POC値(たとえば、MSBとLSBとを含む)をシグナリングすることができる。これにより、ビデオデコーダは、復号ピクチャの完全POC値を再構成するためにビデオデコーダがそのPOC値を使用することができる他のピクチャがビデオシーケンス中にあるので、ランダムアクセスをより堅牢に実装することが可能になり得る。このように、本開示に記載する技法は、ビデオシーケンス中の非IDRピクチャから始まるランダムアクセスが実施されるときに存在し得る問題に対処し、他の非IDRピクチャを、ビデオシーケンス中の他のピクチャにおけるランダムアクセスを可能にするRAPとして使用できるようにする。
さらに、参照ピクチャセット中の参照ピクチャは概して、長期参照ピクチャおよび短期参照ピクチャとしてカテゴリー化することができ、長期参照ピクチャは、短期参照ピクチャよりも長くDPBに記憶される。長期参照ピクチャについてのシグナリングオーバーヘッドは、高く複雑である可能性があり得る。
いくつかの他の技法(たとえば、本開示に記載するもの以外の技法)では、ビデオデコーダが、現在のピクチャをインター予測するために長期参照ピクチャを使用する必要がない場合であっても、ビデオエンコーダはそれにもかかわらず、長期参照ピクチャについての情報をシグナリングする場合があるが、それは、ビデオデコーダが、復号順で現在のピクチャの後に続くピクチャをインター予測するために長期参照ピクチャを使う必要があり得るからである。繰返しになるが、ビデオエンコーダは、現在のピクチャおよび/または復号順で現在のピクチャに続くピクチャをインター予測するために、どの参照ピクチャを使うことができるかを示す情報をシグナリングする場合がある。
したがって、ビデオデコーダが、現在のピクチャをインター予測するのに長期参照ピクチャを必要とせず、ビデオエンコーダが長期参照ピクチャの情報をシグナリングしなかった場合、ビデオデコーダは、復号順で現在のピクチャの後に続くどのピクチャも、インター予測するために長期参照ピクチャを使う必要がないと判断してよいが、この判断は正しくない可能性がある。この場合、これらの他の技法では、ビデオデコーダがデコーダのDPBから長期参照ピクチャを削除することが可能な場合があり、その結果、ビデオデコーダはその後、削除された長期参照ピクチャをインター予測に使用する必要が実際にあるピクチャを復号することができない。
本開示に記載する技法は、ビデオデコーダが現在のピクチャをインター予測するために長期参照ピクチャを使う必要がないが、復号順で現在のピクチャの後に続くピクチャをインター予測するために長期参照ピクチャを必要とし得るときにシグナリングされる情報の量を削減するための機構を提供し得る。たとえば、ビデオエンコーダは、ビデオデコーダが現在のピクチャをインター予測するためにいずれかの長期参照ピクチャを必要とするかどうかを示す第1の値を、現在のピクチャのスライスヘッダ中でシグナリングすればよい。ビデオエンコーダは、ビデオデコーダが現在のピクチャをインター予測するために長期参照ピクチャのうちのいずれかを使用する可能性があり得るかどうか(たとえば、すべての長期参照ピクチャが、現在のピクチャをインター予測するために使われ得るかどうか)を示す第2の値も、現在のピクチャのスライスヘッダ中でシグナリングしてよい。これらの値に基づいて、ビデオエンコーダは、長期参照ピクチャ用のスライスヘッダ中で、情報の異なる量をシグナリングすればよい。また、ビデオデコーダは、これらの値に基づいて、長期参照ピクチャ用のスライスヘッダ中にどれだけ多くの情報が期待されるかを判断することができる。
いくつかの例では、本開示に記載する技法は、どのピクチャをDPBから削除すればよいかの判断などのDPB管理に関連し得る。ピクチャ削除とピクチャ出力または表示は混同されるべきでない。ピクチャ出力または表示は、DPBに記憶されたピクチャがいつ表示されるかを指すが、ビデオエンコーダまたはビデオデコーダがそのピクチャを、他のピクチャをインター予測するために使用する可能性があるので、ピクチャは依然としてDPB内に留まり得る。ピクチャ削除は、ピクチャがそれ以上予測目的のために利用可能でなくなるような、DPBからのピクチャの削除を指す。
いくつかの現在の技法は、どのピクチャがDPBから削除されるべきか判断するために、参照ピクチャマーキングに依拠する。参照ピクチャマーキングのために、インター予測に使われる参照ピクチャの、M(num_ref_frames)と呼ばれる最大数が、アクティブシーケンスパラメータセット中で示される。参照ピクチャは、復号されると、「参照に使用される」とマーキングされる。参照ピクチャの復号により、M個より多いピクチャが「参照に使用される」とマーキングされた場合、少なくとも1つのピクチャが「参照に使用されない」とマーキングされていなければならない。DPB削除プロセスは次いで、「参照に使用されない」とマーキングされたピクチャが出力にも必要とされない場合、それらのピクチャをDPBから削除することになる。
ピクチャは、復号されると、非参照ピクチャまたは参照ピクチャのいずれかになり得る。参照ピクチャは、長期参照ピクチャであっても短期参照ピクチャであってもよく、「参照に使用されない」とマーキングされると、参照にはそれ以上必要とされなくなる。いくつかのビデオコーディング規格には、参照ピクチャのステータスを変える参照ピクチャマーキング操作があり得る。
参照ピクチャマーキングには、スライディングウィンドウおよび適応メモリ制御という、2つのタイプの操作があり得る。参照ピクチャマーキングのための操作モードは、ピクチャに基づいて選択されてよく、スライディングウィンドウ操作は、一定数の短期参照ピクチャをもつ先入れ先出しキューとして作用し得る。言い換えると、復号時間が最も早い短期参照ピクチャが、暗黙的に、削除される最初のものである(参照用に使われないピクチャとマーキングされる)。
ただし、適応メモリ制御は、短期または長期ピクチャを明示的に削除する。適応メモリ制御は、短期および長期ピクチャなどのステータスを切り替えることも可能にする。たとえば、適応メモリ制御において、ビデオエンコーダは、どのピクチャが参照に使用されるものとマーキングされるべきかを指定するシンタックス要素をシグナリングすることができる。ビデオデコーダは、シンタックス要素を受信し、指定された通りにピクチャをマーキングすればよい。スライディングウィンドウ中、ビデオエンコーダは、どのピクチャが参照に使用されるものとマーキングされるかはシグナリングする必要はなくてよい。そうではなく、ビデオデコーダは、暗黙的に(すなわち、シンタックス要素を受信せずに)、どのピクチャがスライディングウィンドウ内にあるかに基づいて、どのピクチャが参照に使用されるものとマーキングされるか判断してよい。
本開示に記載する技法は、DPBに記憶されたピクチャおよび現在のピクチャの時間的識別値に依拠して、DPB中のどのピクチャを削除すればよいか判断し得る。いくつかの例では、時間的識別値に加え、DBP中のどのピクチャを削除すればよいかをビデオエンコーダおよびビデオデコーダが判断するのに使用することができる他の要素があり得る。
時間的識別値(temporal_id)は、現在のピクチャをコーディングするために、どのピクチャを使うことができるかを示す階層的値であってよい。概して、特定のtemporal_id値をもつピクチャは、可能性としては、それ以上のtemporal_id値をもつピクチャ用の参照ピクチャになり得るが、逆は成り立たない。たとえば、1のtemporal_id値をもつピクチャは、可能性としては、1、2、3、...のtemporal_id値をもつピクチャ用の参照ピクチャになり得るが、0のtemporal_id値をもつピクチャ用の参照ピクチャにはなり得ない。
最も低いtemporal_id値は、最も低い表示レートも示し得る。たとえば、ビデオデコーダが、0のtemporal_id値をもつピクチャのみを復号した場合、表示レートは、毎秒7.5個のピクチャになり得る。ビデオデコーダが、0および1のtemporal_id値をもつピクチャのみを復号した場合、表示レートは、毎秒15個のピクチャになり得、以下同様である。
いくつかの他の技法(たとえば、本開示に記載するもの以外の技法)では、現在のピクチャに対する参照ピクチャセットは、現在のピクチャよりも高いtemporal_id値をもつピクチャを参照ピクチャセットが含まないように定義することができる。たとえば、ピクチャAとして指定されるピクチャのtemporal_id値が現在のピクチャのものよりも大きい場合、現在のピクチャに対する参照ピクチャセットは、ピクチャAを含むことができない。これらの他の技法では、ピクチャAが出力に必要とされないとき、ビデオエンコーダまたはビデオデコーダは、それぞれのDPBからピクチャAを削除してよい。ただし、ビデオエンコーダおよびビデオデコーダは、temporal_id値が現在のピクチャのものよりも大きい、復号順で現在のピクチャの後に続くピクチャのインター予測のためにピクチャAを必要とし得る。
本開示に記載する技法は、現在のピクチャのものよりも高いtemporal_id値をもつピクチャが必ずしもDPBから削除されないようにするための機構を提供する。たとえば、ビデオエンコーダおよびビデオデコーダは、(1)ピクチャが現在のピクチャの参照ピクチャセットに含まれず、(2)ピクチャが出力に必要とされず、(3)ピクチャのtemporal_id値が現在のピクチャのもの以下である場合、それぞれのDPBからピクチャを削除するように構成されてよい。これらの3つの基準を使用することによって、これらの技法は、temporal_id値が現在のピクチャのものよりも大きい、復号順で現在のピクチャの後に続くピクチャをインター予測するために必要とされる可能性があるかもしれないDPB用のピクチャを、ビデオエンコーダおよびビデオデコーダが不注意に削除することがないようにすることができる。
いくつかの例では、ビデオデコーダが参照ピクチャセットを導出した後、ビデオデコーダは、1つの参照ピクチャリストまたは複数の参照ピクチャリストを構成することができる。ビデオデコーダは次いで、参照ピクチャリスト(1つまたは複数)中で識別された参照ピクチャに基づいて、現在のピクチャをインター予測することができる。以下では、参照ピクチャリスト構成について手短に説明する。さらに、ビデオエンコーダは、DPBに記憶するために符号化ピクチャを復号するのに必要とされる再構成プロセスの一部として、参照ピクチャリストを同様に構成することができる。
いくつかの例では、ビデオエンコーダおよびビデオデコーダは、単一の参照ピクチャリスト(リスト0またはRefPicList0と呼ばれる)を構成することができ、他の例では、ビデオエンコーダおよびビデオデコーダは、2つの参照ピクチャリスト(リスト0およびリスト1)を構成することができる。リスト1は、RefPicList1と呼ばれる場合もある。たとえば、Pスライスなど、単方向予測されるスライス、およびBスライスのいくつかの例に対して、ビデオエンコーダおよびビデオデコーダは、1つの参照ピクチャリスト(リスト0またはリスト1のいずれか)を構成することができる。単方向予測されるスライスは、ピクチャのブロックが1つの参照ピクチャから予測されるピクチャのスライスを指す。双予測されるスライス(たとえば、2つの参照ピクチャを用いてブロックが予測されるスライス)に対して、ビデオエンコーダおよびビデオデコーダは、リスト0とリスト1とを構成することができ、リスト0は参照ピクチャの識別であり、リスト1は他方を識別する。
一般に、第1または第2の参照ピクチャリストについての参照ピクチャリスト構成は、2つのステップ、すなわち参照ピクチャリスト初期化と、参照ピクチャリスト並べ替え(修正)とを含む。参照ピクチャリスト初期化は、参照ピクチャメモリ(たとえば、DPB)中の参照ピクチャを、POC(ピクチャの表示順で整列されるピクチャオーダーカウント)値の順序に基づいてリストに入れる機構である。参照ピクチャリスト並べ替え機構は、参照ピクチャリスト初期化中にリストに入れられたピクチャの位置をどの新しい位置にも修正し、またはDPB中のどの参照ピクチャも、そのピクチャが初期化リストに属さない場合であっても、どの位置に入れてもよい。参照ピクチャリスト並べ替え(修正)後のいくつかのピクチャは、リスト中のはるかに離れた位置に入れられる場合がある。ただし、ピクチャの位置が、リストのアクティブ参照ピクチャの数を超える場合、ピクチャは、最終参照ピクチャリストのエントリとは見なされない。アクティブ参照ピクチャの数は、各リスト用のスライスヘッダに入れてシグナリングされ得る。
図1は、本開示で説明する技法を利用し得る例示的なビデオ符号化および復号システム10を示すブロック図である。図1に示すように、システム10は、宛先デバイス14による復号のために符号化ビデオを生成するソースデバイス12を含む。ソースデバイス12および宛先デバイス14は、それぞれビデオコーディングデバイスの一例であり得る。ソースデバイス12は、通信チャネル16を介して宛先デバイス14に符号化ビデオを送信するか、あるいは、必要に応じて符号化ビデオが宛先デバイス14によってアクセスされ得るように記憶媒体17またはファイルサーバ19に符号化ビデオを記憶し得る。
ソースデバイス12および宛先デバイス14は、いわゆる「スマート」フォン、いわゆる「タブレット」コンピューティングデバイスなどのワイヤレスハンドセット、またはワイヤレス通信のために装備される他のそのようなワイヤレスデバイスを含む、広範なデバイスのうちのどれを備えてもよい。ソースデバイス12および宛先デバイス14の追加例は、デジタルテレビ、デジタルダイレクトブロードキャストシステムにおけるデバイス、ワイヤレスブロードキャストシステムにおけるデバイス、携帯情報端末(PDA)、ラップトップコンピュータ、デスクトップコンピュータ、タブレットコンピュータ、eブックリーダ、デジタルカメラ、デジタル記録デバイス、デジタルメディアプレーヤ、ビデオゲームデバイス、ビデオゲームコンソール、セルラー無線電話、衛星無線電話、テレビ会議デバイス、およびビデオストリーミングデバイス、ワイヤレス通信デバイスなどを含むが、それに限定されない。
上記のように、多くの場合、ソースデバイス12および/または宛先デバイス14は、ワイヤレス通信のために装備され得る。したがって、通信チャネル16は、符号化ビデオデータの送信に好適なワイヤレスチャネル、ワイヤードチャネル、またはワイヤレスチャネルとワイヤードチャネルとの組合せを備え得る。同様に、ファイルサーバ19は、インターネット接続を含む任意の標準データ接続を介して宛先デバイス14によってアクセスされ得る。これは、ファイルサーバに記憶された符号化ビデオデータにアクセスするのに好適であるワイヤレスチャネル(たとえば、Wi−Fi(登録商標)接続)、ワイヤード接続(たとえば、DSL、ケーブルモデムなど)、または両方の組合せを含み得る。
ただし、本開示の技法は、オーバージエアテレビジョン放送、ケーブルテレビジョン送信、衛星テレビジョン送信、たとえばインターネットを介したストリーミングビデオ送信、データ記憶媒体に記憶するためのデジタルビデオの符号化、データ記憶媒体に記憶されたデジタルビデオの復号、または他の適用例など、様々なマルチメディア適用例のいずれかをサポートするビデオコーディングに適用され得る。いくつかの例では、システム10は、ビデオストリーミング、ビデオ再生、ビデオブロードキャスティング、および/またはビデオテレフォニーなどの適用例をサポートするために、単方向または二方向のビデオ送信をサポートするように構成され得る。
図1の例では、ソースデバイス12は、ビデオソース18と、ビデオエンコーダ20と、変調器/復調器(モデム)22と、出力インターフェース24とを含む。ソースデバイス12において、ビデオソース18は、ビデオカメラなどのビデオキャプチャデバイス、以前にキャプチャされたビデオを含んでいるビデオアーカイブ、ビデオコンテンツプロバイダからビデオを受信するためのビデオフィードインターフェース、および/またはソースビデオとしてコンピュータグラフィックスデータを生成するためのコンピュータグラフィックスシステムなどのソース、あるいはそのようなソースの組合せを含み得る。一例として、ビデオソース18がビデオカメラである場合、ソースデバイス12および宛先デバイス14は、いわゆるカメラ付き電話またはテレビ電話を形成し得る。ただし、本開示で説明する技法は、概してビデオコーディングに適用可能であり得、ワイヤレスおよび/またはワイヤード適用例に適用され得る。
キャプチャされたビデオ、以前にキャプチャされたビデオ、またはコンピュータ生成ビデオはビデオエンコーダ20によって符号化され得る。符号化ビデオ情報は、ワイヤレス通信プロトコルなどの通信規格に従ってモデム22によって変調され、出力インターフェース24を介して宛先デバイス14に送信され得る。モデム22は、信号変調のために設計された様々なミキサ、フィルタ、増幅器または他の構成要素を含み得る。出力インターフェース24は、増幅器、フィルタ、および1つまたは複数のアンテナを含む、データを送信するために設計された回路を含み得る。
ビデオエンコーダ20によって符号化された、キャプチャされたビデオ、以前にキャプチャされたビデオ、またはコンピュータ生成されたビデオはまた、後で消費するために記憶媒体17またはファイルサーバ19に記憶され得る。記憶媒体17は、ブルーレイ(登録商標)ディスク、DVD、CD−ROM、フラッシュメモリ、または符号化ビデオを記憶するための他の好適なデジタル記憶媒体を含み得る。記憶媒体17に記憶された符号化ビデオは、次いで、復号および再生のために宛先デバイス14によってアクセスされ得る。
ファイルサーバ19は、符号化ビデオを記憶することと、その符号化ビデオを宛先デバイス14に送信することとが可能な任意のタイプのサーバであり得る。例示的なファイルサーバは、(たとえば、ウェブサイトのための)ウェブサーバ、FTPサーバ、ネットワーク接続ストレージ(NAS)デバイス、ローカルディスクドライブ、または符号化ビデオデータを記憶することと、符号化ビデオデータを宛先デバイスに送信することとが可能な他のタイプのデバイスを含む。ファイルサーバ19からの符号化ビデオデータの送信は、ストリーミング送信、ダウンロード送信、または両方の組合せであり得る。ファイルサーバ19は、インターネット接続を含む任意の標準データ接続を介して宛先デバイス14によってアクセスされ得る。これは、ファイルサーバに記憶された符号化ビデオデータにアクセスするのに好適である、ワイヤレスチャネル(たとえば、Wi−Fi接続)、ワイヤード接続(たとえば、DSL、ケーブルモデム、イーサネット(登録商標)、USBなど)、または両方の組合せを含み得る。
宛先デバイス14は、図1の例では、入力インターフェース26と、モデム28と、ビデオデコーダ30と、ディスプレイデバイス32とを含む。宛先デバイス14の入力インターフェース26は、一例として、チャネル16を介して、または代替例として、記憶媒体17もしくはファイルサーバ17から情報を受信し、モデム28は、情報を復調して、ビデオデコーダ30向けの復調ビットストリームを生じる。復調されたビットストリームは、ビデオデータを復号する際にビデオデコーダ30が使用する、ビデオエンコーダ20によって生成された様々なシンタックス情報を含み得る。そのようなシンタックスはまた、記憶媒体17またはファイルサーバ19に記憶された符号化ビデオデータに含まれ得る。一例として、シンタックスは符号化ビデオデータで埋め込まれ得るが、本開示の態様はそのような要件に限定されると考えられるべきでない。ビデオデコーダ30によっても使用される、ビデオエンコーダ20によって定義されたシンタックス情報は、コーディングツリーユニット(CTU)、コーディングツリーブロック(CTB)、予測ユニット(PU:prediction unit)、コーディングユニット(CU)またはコーディングされたビデオの他のユニット、たとえば、ビデオスライス、ビデオピクチャ、およびビデオシーケンスまたはピクチャのグループ(GOP:group of pictures)などのビデオブロックの特性および/または処理を記述するシンタックス要素を含み得る。ビデオエンコーダ20およびビデオデコーダ30の各々は、ビデオデータを符号化または復号することが可能であるそれぞれのエンコーダデコーダ(コーデック)の一部を形成し得る。
ディスプレイデバイス32は、宛先デバイス14と一体化されるかまたはその外部にあり得る。いくつかの例では、宛先デバイス14は、一体型ディスプレイデバイスを含み、また、外部ディスプレイデバイスとインターフェースするように構成され得る。他の例では、宛先デバイス14はディスプレイデバイスであり得る。概して、ディスプレイデバイス32は、復号ビデオデータをユーザに対して表示し、液晶ディスプレイ(LCD)、プラズマディスプレイ、有機発光ダイオード(OLED)ディスプレイ、または別のタイプのディスプレイデバイスなど、様々なディスプレイデバイスのいずれかを備え得る。
図1の例では、通信チャネル16は、無線周波数(RF)スペクトルあるいは1つまたは複数の物理伝送線路など、任意のワイヤレスまたはワイヤード通信媒体、あるいはワイヤレス媒体とワイヤード媒体との任意の組合せを備え得る。通信チャネル16は、ローカルエリアネットワーク、ワイドエリアネットワーク、またはインターネットなどのグローバルネットワークのような、パケットベースのネットワークの一部を形成することができる。通信チャネル16は、概して、ワイヤード媒体またはワイヤレス媒体の任意の好適な組合せを含む、ビデオデータをソースデバイス12から宛先デバイス14に送信するのに好適な任意の通信媒体、または様々な通信媒体の集合体を表す。通信チャネル16は、ソースデバイス12から宛先デバイス14への通信を支援するのに有用であり得る、ルータ、スイッチ、基地局、または任意の他の機器を含み得る。
ビデオエンコーダ20およびビデオデコーダ30は、ITU−T H.261、ISO/IEC MPEG−1 Visual、ITU−T H.262またはISO/IEC MPEG−2 Visual、ITU−T H.263、ISO/IEC MPEG−4 Visual、ならびにスケーラブルビデオコーディング(SVC)およびマルチビュービデオコーディング(MVC)拡張を含むITU−T H.264(ISO/IEC MPEG−4 AVCとしても知られている)などのビデオ圧縮規格に従って動作し得る。さらに、ITU−T Video Coding Experts Group(VCEG)とISO/IEC Motion Picture Experts Group(MPEG)とのJoint Collaboration Team on Video Coding(JCT−VC)によって現在開発中の新しいビデオコーディング規格、すなわち、高効率ビデオコーディング(HEVC)規格がある。これ以降HEVC WD8と呼ばれる、HEVCの最新の作業草案(WD)が、2012年7月20日の時点で、http://phenix.int−evry.fr/jct/doc_end_user/documents/10_Stockholm/wg11/JCTVC−J1003−v8.zipから入手可能である。
ただし、本開示の技法は、いかなる特定のコーディング規格にも限定されない。単に例示のために、本技法は、HEVC規格に従って説明される。
図1には示されていないが、いくつかの態様では、ビデオエンコーダ20およびビデオデコーダ30は、それぞれオーディオエンコーダおよびオーディオデコーダと統合され得、適切なMUX−DEMUXユニット、または他のハードウェアおよびソフトウェアを含んで、共通のデータストリームまたは別個のデータストリーム中のオーディオとビデオの両方の符号化を処理し得る。適用可能な場合、MUX−DEMUXユニットはITU H.223マルチプレクサプロトコル、またはユーザデータグラムプロトコル(UDP)などの他のプロトコルに準拠することができる。
ビデオエンコーダ20およびビデオデコーダ30はそれぞれ、マイクロプロセッサを含む1つまたは複数のプロセッサ、デジタル信号プロセッサ(DSP)、特定用途向け集積回路(ASIC)、フィールドプログラマブルゲートアレイ(FPGA)、ディスクリート論理、ソフトウェア、ハードウェア、ファームウェアなど、様々な好適なエンコーダ回路のいずれか、またはそれらの任意の組合せとして実装され得る。本技法がソフトウェアで部分的に実施されるとき、デバイスは、好適な非一時的コンピュータ可読媒体にソフトウェアの命令を記憶し、1つまたは複数のプロセッサを使用してその命令をハードウェアで実行して、本開示の技法を実施し得る。
ビデオエンコーダ20およびビデオデコーダ30の各々は1つまたは複数のエンコーダまたはデコーダ中に含まれ得、そのいずれも、それぞれのデバイスにおいて複合エンコーダ/デコーダ(コーデック)の一部として統合され得る。いくつかの事例では、ビデオエンコーダ20およびビデオデコーダ30は、情報(たとえば、ピクチャおよびシンタックス要素)をコーディングするビデオコーダと通常呼ばれ得る。ビデオコーダがビデオエンコーダ20に対応するとき、情報のコーディングは符号化を指し得る。ビデオコーダがビデオデコーダ30に対応するとき、情報のコーディングは復号を指し得る。
さらに、本開示で説明する技法は、情報をシグナリングするビデオエンコーダ20を指し得る。ビデオエンコーダ20が情報をシグナリングするとき、本開示の技法は、概して、ビデオエンコーダ20が情報を提供する任意の方法を指す。たとえば、ビデオエンコーダ20がビデオデコーダ30にシンタックス要素をシグナリングするとき、それは、ビデオエンコーダ20が出力インターフェース24および通信チャネル16を介してビデオデコーダ30にシンタックス要素を送信したこと、あるいはビデオエンコーダ20がビデオデコーダ30による最終的な受信のために記憶媒体17および/またはファイルサーバ19上に出力インターフェース24を介してシンタックス要素を記憶したことを意味し得る。このように、ビデオエンコーダ20からビデオデコーダ30へのシグナリングは、ビデオデコーダ30によって直ちに受信されるビデオエンコーダ20からの送信が、可能ではあり得るが、必要とされると解釈されるべきでない。そうではなく、ビデオエンコーダ20からビデオデコーダ30へのシグナリングは、直接あるいは(たとえば、記憶媒体17および/またはファイルサーバ19内の)中間記憶装置を介して、ビデオエンコーダ20がビデオデコーダ30による最終的な受信についての情報を提供するためのいずれの技法としても解釈されるべきである。
ビデオエンコーダ20およびビデオデコーダ30は、参照ピクチャセットを導出するための、本開示に記載する例示的技法を実装するように構成すればよい。たとえば、ビデオエンコーダ20およびビデオデコーダ30は、ランダムアクセスを可能にし得る。また、ビデオエンコーダ20は、現在のピクチャの各スライス向けに、長期参照ピクチャの軽量シグナリングを実装することができる。こうすることにより、ビデオエンコーダ20は、長期参照ピクチャの情報をシグナリングする比較的複雑でないやり方を実装することが可能になり、それによりビデオデコーダ30は、インター予測にどの長期参照ピクチャが必要とされるか判断するための比較的複雑でないプロセスを実装することが可能になる。さらに、ビデオエンコーダ20およびビデオデコーダ30は、それぞれのDPBに記憶されたピクチャの時間的識別値に基づいて、どのピクチャが削除されるべきか判断することによって、それぞれの復号ピクチャバッファ(DPB)を管理することができる。
これらの技法の各々について、以下でより詳しく説明する。さらに、これらの技法は、別個でも、互いと組み合わせても実装することができる。ただし、これらの技法の説明に先立って、以下で、ビデオエンコーダ20がビデオデータのコード化ビットストリーム中でシグナリングすることができるとともに、ビデオデコーダ30がビデオデータのコード化ビットストリーム中で受信することができるシンタックス要素について説明する。
Figure 2014530573
pic_width_in_luma_samplesは、ルーマサンプル中の各復号ピクチャの幅を指定し得る。pic_width_in_luma_samplesの値は、両端値を含む0〜216−1の範囲内であり得る。
pic_height_in_luma_samplesは、ルーマサンプル中の各復号ピクチャの高さを指定し得る。pic_height_in_luma_samplesの値は、両端値を含む0〜216−1の範囲内であり得る。
テーブル1に示されるように、ビデオデコーダ30は、シーケンスパラメータセット(SPS)中で、log2_max_pic_order_cnt_lsb_minus4シンタックス要素を受信することができる。log2_max_pic_order_cnt_lsb_minu4の値は、POC値を判断するための復号プロセスにおいてビデオデコーダ30が使う変数MaxPicOrderCntLsbの値を指定することができ、ここでMaxPicOrderCntLsb=2(log2_max_pic_order_cnt_lsb_minus4+4)である。
Figure 2014530573
num_short_term_ref_pic_sets_ppsは、ピクチャパラメータセットに含まれるshort_term_ref_pic_set()シンタックス構造の数を指定する。num_short_term_ref_pic_sets_ppsの値は、両端値を含む0〜32の範囲内とする。
0に等しいlong_term_ref_pics_present_flagは、ピクチャパラメータセットを参照するどのコード化ピクチャのインター予測にも、長期参照ピクチャが使われず、シンタックス要素long_term_ref_pic_id_delta_len_minus4、long_term_ref_pic_id_len_deltaおよびnum_long_term_ref_pics_ppsが存在しないことを指定する。1に等しいlong_term_ref_pics_present_flagは、ピクチャパラメータセットを参照する1つまたは複数のコード化ピクチャのインター予測に長期参照ピクチャを使うことができ、シンタックス要素long_term_ref_pic_id_delta_len_minus4、long_term_ref_pic_id_len_deltaおよびnum_long_term_ref_pics_ppsが存在することを指定する。
long_term_ref_pic_id_delta_len_minus4に4を加えたものは、long_term_ref_pic_id_delta_add_foll[i]シンタックス要素のビット長を指定する。long_term_ref_pic_id_delta_len_minus4の値は、両端値を含む0〜12の範囲内とする。
long_term_ref_pic_id_len_deltaプラスlong_term_ref_pic_id_delta_len_minus4プラス4は、long_term_ref_pic_id_pps[i]シンタックス要素のビット長を指定する。long_term_ref_pic_id_len_deltaの値は、両端値を含む0〜28−long_term_ref_pic_id_delta_len_minus4の範囲内であり得る。1つの特定のシーケンスパラメータセットを参照するすべてのピクチャパラメータセット中のlong_term_ref_pic_id_len_delta+long_term_ref_pic_id_delta_len_minus4+4の値は、同一であり得る。
num_long_term_ref_pics_ppsは、ピクチャパラメータセットに含まれる長期参照ピクチャの識別の数を指定する。num_long_term_ref_pics_ppsの値は、両端値を含む0〜32の範囲内であり得る。
long_term_ref_pic_id_pps[i]は、ピクチャパラメータセットに含まれる第iの長期参照ピクチャ識別情報を指定する。long_term_ref_pic_id_pps[i]を表すのに使われるビットの数は、long_term_ref_pic_id_len_delta+long_term_pic_id_len_minus4+4に等しくなり得る。
Figure 2014530573
短期参照ピクチャセットシンタックスは、短期ピクチャ用であり得る。短期ピクチャは、それについての識別情報がコード化ピクチャ用のshort_term_ref_pic_set()シンタックス構造に含まれ、スライスヘッダ(1つもしくは複数)に含まれるか、または参照されるピクチャパラメータセットおよびスライスヘッダ(1つまたは複数)中のshort_term_ref_pic_set_idxシンタックス要素による参照に含まれる参照ピクチャとして定義され得る。スライスヘッダシンタックス要素を、以下のテーブル4に挙げる。
num_short_term_curr0は、以下で説明するように、コード化ピクチャの参照ピクチャセットの導出にshort_term_ref_pic_set()シンタックス構造が使われるとき、RefPicSetStCurr0中の短期参照ピクチャの数を指定する。num_short_term_curr0の値は、両端値を含む0〜max_num_ref_framesの範囲内であり得る。
num_short_term_curr1は、以下で説明するように、コード化ピクチャの参照ピクチャセットの導出にshort_term_ref_pic_set()シンタックス構造が使われるとき、RefPicSetStCurr1中の短期参照ピクチャの数を指定する。num_short_term_curr1の値は、両端値を含む0〜max_num_ref_frames−num_short_term_curr0の範囲内であり得る。
num_short_term_foll0は、以下で説明するように、コード化ピクチャの参照ピクチャセットの導出にshort_term_ref_pic_set()シンタックス構造が使われるとき、RefPicSetStFoll0中の短期参照ピクチャの数を指定する。num_short_term_foll0の値は、両端値を含む0〜max_num_ref_frames−num_short_term_curr0−num_short_term_curr1の範囲内であり得る。
num_short_term_foll1は、以下で説明するように、コード化ピクチャの参照ピクチャセットの導出にshort_term_ref_pic_set()シンタックス構造が使われるとき、RefPicSetStFoll1中の短期参照ピクチャの数を指定する。num_short_term_foll1の値は、両端値を含む0〜max_num_ref_frames−num_short_term_curr0−num_short_term_curr1−num_short_term_foll0の範囲内とする。
short_term_ref_pic_id_delta_minus1[i]は、short_term_ref_pic_set()シンタックス構造に含まれる第iの短期参照ピクチャの識別情報を指定する。
Figure 2014530573
idr_pic_idは、瞬時デコーダリフレッシュ(IDR)ピクチャを識別する。
pic_parameter_set_idは、ピクチャパラメータセットを指示し、ピクチャパラメータセットを指すのに使われる。
変数CraPicFlagは、スライスがクリアランダムアクセス(CRA:clear random access)ピクチャに属す場合、1に等しく設定される。
pic_order_cntは、現在のピクチャのピクチャオーダーカウント(POC)値を指定し得る。long_term_ref_pic_id_len_deltaおよびlong_term_pic_id_len_minus4が、参照されるピクチャパラメータセット中に存在する場合、この値を表すのに使われるビットの数は、long_term_ref_pic_id_len_delta+long_term_pic_id_len_minus4+4に等しくなり得る。そうでない場合、この値を表すのに使われるビットの数は32に等しくなり得る。
no_output_of_prior_pics_flagは、IDRピクチャの復号の後で復号ピクチャバッファ中のあらかじめ復号されたピクチャがどのように扱われるかを指定する。IDRピクチャがビットストリーム中の最初のIDRピクチャであるとき、no_output_of_prior_pics_flagの値は、復号プロセスに影響する可能性はない。IDRピクチャがビットストリーム中の最初のIDRピクチャではなく、アクティブシーケンスパラメータセットから導出されたpic_width_in_luma_samplesまたはpic_height_in_luma_samplesまたはmax_dec_frame_bufferingの値が、先行ピクチャについてのアクティブなシーケンスパラメータセットから導出されたpic_width_in_luma_samplesまたはpic_height_in_luma_samplesまたはmax_dec_frame_bufferingの値とは異なり得るとき、1に等しいno_output_of_prior_pics_flagは、no_output_of_prior_pics_flagの実効値にかかわらず、デコーダによって推論することができるが、必ずしも推論できるわけではない。
1に等しいshort_term_ref_pic_set_pps_flagは、現在のピクチャ用の参照ピクチャセットに含まれる短期参照ピクチャセットの識別情報が、参照されるピクチャパラメータセットに存在することを指定する。0に等しいshort_term_ref_pic_set_pps_flagは、現在のピクチャ用の参照ピクチャセットに含まれる短期参照ピクチャセットの識別情報が、参照されるピクチャパラメータセットに存在しないことを指定する。
short_term_ref_pic_set_idxは、現在のピクチャ用の参照ピクチャセット中の短期参照ピクチャセットの識別情報を含む、参照されるピクチャパラメータセットに含まれる、short_term_ref_pic_set()シンタックス構造の索引を指定する。
変数NumShortTermCurr0およびNumShortTermCurr1は、次のように指定される。
Figure 2014530573
上式で、num_short_term_curr0およびnum_short_term_curr0は、それぞれ、参照されるピクチャパラメータセットに存在し、short_term_ref_pic_set_idxによって参照されるか、またはスライスヘッダに直接存在する、short_term_ref_pic_set()シンタックス構造中の同じ名称のシンタックス要素である。
num_ref_idx_l0_active_minus1は、スライスを復号するのに使われるものとする参照ピクチャリスト0についての最大参照索引を指定する。
現在のスライスがPまたはBスライスであり、num_ref_idx_l0_active_minus1が存在しないとき、num_ref_idx_l0_active_minus1は、num_ref_idx_l0_default_active_minus1に等しいと推論され得る。
num_ref_idx_l0_active_minus1の値は、両端値を含む0〜15の範囲内であり得る。
num_ref_idx_l1_active_minus1は、スライスを復号するのに使われるものとする参照ピクチャリスト1についての最大参照索引を指定する。
現在のスライスがPまたはBスライスであり、num_ref_idx_l1_active_minus1が存在しないとき、num_ref_idx_l1_active_minus1は、num_ref_idx_l1_default_active_minus1に等しいと推論され得る。
num_ref_idx_l1_active_minus1の値は、両端値を含む0〜15の範囲内であり得る。
Figure 2014530573
長期参照ピクチャセットシンタックスは、長期ピクチャ用であり得る。長期ピクチャは、コード化ピクチャ用のlong_term_ref_pic_set()シンタックス構造に、それについての識別情報が含まれる参照ピクチャとして定義され得る。概して、長期参照ピクチャは、短期参照ピクチャよりも長くDPBに記憶されてよい。
1に等しいlong_term_not_used_flagは、どの長期参照ピクチャも、現在のピクチャならびに復号順で現在のピクチャに続くピクチャのインター予測に使われないことを示し得る。0に等しいこのフラグは、長期参照ピクチャの使用が長期参照ピクチャセットシンタックステーブルの残りのシンタックス要素によってシグナリングされることを示し得る。
long_term_not_used_flagが1に等しいとき、num_long_term_pps_curr、num_long_term_add_curr、num_long_term_pps_foll、およびnum_long_term_add_follは、それぞれ、0、0、num_long_term_ref_pics_pps、および0であると推論することができる。
1に等しいlong_term_reuse_pps_flagは、参照されるピクチャパラメータセット中で指定されるすべての長期参照ピクチャを、現在のピクチャの予測に使うことができ、参照されるPPS中で指示されないとともに復号順で現在のピクチャに先立つ長期参照ピクチャは、現在のピクチャまたは復号順で現在のピクチャに続くピクチャのインター予測に使うことができないことを示し得る。0に等しいこのフラグは、長期参照ピクチャの使用が長期参照ピクチャセットシンタックステーブルの残りのシンタックス要素によってシグナリングされることを示し得る。
long_term_reuse_pps_flagが1に等しいとき、num_long_term_pps_curr、num_long_term_add_curr、num_long_term_pps_foll、およびnum_long_term_add_follは、それぞれ、num_long_term_ref_pics_pps、0、0および0であると推論することができる。
表さないとき、このフラグは0に等しいと推論することができる。
num_long_term_pps_currは、参照されるピクチャパラメータセットに識別情報が含まれるとともに現在のピクチャのインター予測に使うことができるすべての長期参照ピクチャの数を指定する。num_long_term_pps_currが存在しない場合、値は、0に等しいものとして導出され得る。num_long_term_pps_currの値は、両端値を含む0〜max_num_ref_framesの範囲内であり得る。
num_long_term_add_currは、参照されるピクチャパラメータセットに識別情報が含まれないとともに現在のピクチャのインター予測に使うことができるすべての長期参照ピクチャの数を指定する。num_long_term_add_currが存在しない場合、値は、0に等しいものとして導出され得る。num_long_term_add_currの値は、両端値を含む0〜max_num_ref_frames−num_long_term_pps_currの範囲内であり得る。
変数NumLongTermCurrは、次のように指定される。
NumLongTermCurr=num_long_term_pps_curr+num_long_term_add_curr
num_long_term_pps_follは、参照されるピクチャパラメータセットに識別情報が含まれ、現在のピクチャのインター予測に使われず、復号順で現在のピクチャに続くピクチャのうちのどのピクチャのインター予測にも使うことができるすべての長期参照ピクチャの数を指定する。num_long_term_pps_follが存在しない場合、値は、0に等しいものとして導出され得る。num_long_term_pps_follの値は、両端値を含む0〜max_num_ref_framesの範囲内であり得る。
num_long_term_add_follは、参照されるピクチャパラメータセットに識別情報が含まれず、現在のピクチャのインター予測に使われず、復号順で後に続くピクチャのうちのどのピクチャのインター予測にも使うことができるすべての長期参照ピクチャの数を指定する。num_long_term_add_follが存在しない場合、値は、0に等しいものとして導出され得る。num_long_term_add_follの値は、両端値を含む0〜max_num_ref_frames−num_long_term_pps_follの範囲内であり得る。
long_term_ref_pic_set_idx_pps[i]は、参照されるピクチャパラメータセットから現在のピクチャの参照ピクチャセットに継承される第iの長期参照ピクチャの、参照されるピクチャパラメータセットに含まれる長期参照ピクチャ識別情報のリストに対する索引を指定する。long_term_ref_pic_set_idx_pps[i]の値は、両端値を含む0〜31の範囲内であり得る。
long_term_ref_pic_id_delta_add[i]は、参照されるピクチャパラメータセットから継承されないが、現在のピクチャの参照ピクチャセットに含まれる第iの長期参照ピクチャの長期参照ピクチャ識別情報を指定する。long_term_ref_pic_id_add_curr[i]を表すのに使われるビットの数は、long_term_pic_id_len_minus4+4に等しくなり得る。
上記シグナリングまたは導出された値(すなわち、テーブル1〜5中のシンタックス要素および値)を用いて、ビデオデコーダ30は、より多くのピクチャを、ランダムアクセスポイント(RAP)として適格とすることが可能になり得る。ランダムアクセスポイントは、ビデオデコーダ30がピクチャを復号し始めることができるビデオシーケンス中のピクチャを指し得る。たとえば、RAPピクチャは、他のどのピクチャに関しても予測されないピクチャであってよく(すなわち、RAPピクチャ内のすべてのスライスがイントラ予測される)、復号順でRAPピクチャの後に続くピクチャは、復号順でRAPピクチャに先立つどのピクチャに関しても予測することができない。したがって、ビデオデコーダ30は、復号順でRAPピクチャよりも早いどのピクチャも必要とせずに、RAPピクチャと、復号順でRAPピクチャに続くピクチャとを復号することが可能であり得る。
RAPピクチャの一例は、ビデオデータからなるビデオシーケンス中の最初のピクチャである瞬時デコーダリフレッシュ(IDR)ピクチャである。より詳しく説明するように、RAPピクチャの他の例があってもよく、これらの技法により、これらのRAPピクチャからもランダムアクセスが起こってよく、IDR RAPピクチャだけに限られない。
本開示に記載する技法では、非RAPピクチャ(たとえば、ビデオデコーダ30が復号を始めることができないピクチャ)に関して、ビデオエンコーダ20は、現在のピクチャの完全POC値の一部を成す部分的識別子値(たとえば、部分的POC値)を、スライスヘッダ中でシグナリングすればよい。たとえば、テーブル4に示したように、ビデオエンコーダ20は、現在のピクチャのpic_order_cnt_lsb値をシグナリングすればよく、ここでpic_order_cnt_lsb値は、現在のピクチャの完全POC値の最下位ビット(LSB)である。たとえば、pic_order_cnt_lsb値は、コード化ピクチャについてのピクチャオーダーカウントモジュロMaxPicOrderCntLsbを指定し得る。pic_order_cnt_lsbシンタックス値は、log2_max_pic_order_cnt_lsb_minus4+4ビットであり得る。pic_order_cnt_lsbの値は、両端値を含む0〜MaxPicOrderCntLsb−1の範囲内であり得る。
pic_order_cnt_lsb値から、ビデオデコーダ30は、現在のピクチャの完全POC値を判断することができる。たとえば、ビデオデコーダ30はまた、ビデオエンコーダ20によってシグナリングされるコード化ビットストリーム中で、log2_max_pic_order_cnt_lsb_minus4シンタックス要素を受信することができる。ビデオデコーダ30は、log2_max_pic_order_cnt_lsb_minus4シンタックス要素を、シーケンスパラメータセット中で受信することができる。log2_max_pic_order_cnt_lsb_minu4の値は、両端値を含む0〜12の範囲内であり得る。log2_max_pic_order_cnt_lsb_minus4シンタックス要素は、ビデオデコーダ30がPOC値を判断するための復号プロセスにおいて使う変数MaxPicOrderCntLsbの値を指定し得る。たとえば、以下のようになる。
Figure 2014530573
これらの受信シンタックス要素から、ビデオデコーダ30は、現在のピクチャのPOC値を次のように判断することができる。たとえば、ビデオデコーダ30は、現在のピクチャについてのPicOrderCntMsbを判断することができる。現在のピクチャについてのPOC値は、現在のピクチャについての判断されたPicOrderCntMsbに、現在のピクチャについての受信されたpic_order_cnt_lsbをプラスしたものとなり得る。
現在のピクチャについてのPOC値を判断するプロセスの一部として、ビデオデコーダ30は、変数prevPicOrderCntMsbおよびprevPicOrderCntLsbを判断すればよい。たとえば、現在のピクチャがIDRピクチャである場合、ビデオデコーダ30は、prevPicOrderCntMsbを0に等しく設定し、prevPicOrderCntLsbを0に等しく設定すればよい。そうでない場合(すなわち、現在のピクチャがIDRピクチャでない場合)、ビデオデコーダ30は、prevPicOrderCntMsbを、現在のピクチャ以下のtemporal_idをもつ、復号順において前の参照ピクチャのPicOrderCntMsbに等しく設定し、prevPicOrderCntLsbを、現在のピクチャ以下のtemporal_idをもつ、復号順において前の参照ピクチャのpic_order_cnt_lsbの値に等しく設定すればよい。
これらの変数値およびシンタックス要素の値(たとえば、prevPicOrderCntMsb、prevPicOrderCntLsb、pic_order_cnt_lsb、およびMaxPicOrderCntLsbの値)を用いて、ビデオデコーダ30は、PicOrderCntMsbの値を、以下の擬似コードに記述するステップに基づいて判断することができる。ビデオデコーダ30は、以下の擬似コードに記述するステップを実装して、現在のピクチャのPOC値を導出するのに使われる、各現在のピクチャについてのPicOrderCntMsbを判断し得ることを理解されたい。
Figure 2014530573
現在のピクチャについてのPicOrderCntMsbを判断した後、ビデオデコーダ30は、現在のピクチャについてのPicOrderCntMsbおよび現在のピクチャについてのpic_order_cnt_lsbに基づいて、現在のピクチャについてのPOC値を判断することができる。ビデオデコーダ30は、現在のピクチャについてのPOC値を次のように判断することができる。
Figure 2014530573
現在のピクチャの復号の後、ビデオデコーダ30は、そのピクチャについてのPicOrderCntMsb値と、pic_order_cnt_lsb値と、POC値とを、ビデオデコーダ30の復号ピクチャバッファ(DPB)に記憶してよい。このように、DPB中の各ピクチャは、POC値、PicOrderCntMsb値、およびpic_order_cnt_lsb値に関連付けられる。
いくつかの事例では、ビデオデコーダ30は、この復号ピクチャを後続ピクチャ用の参照ピクチャとして使うことができるかどうか判断する必要がある場合がある。たとえば、この後続ピクチャについて、ビデオデコーダ30は、ビデオデコーダ30がこの後続ピクチャをインター予測するために使うことができる長期参照ピクチャ用のピクチャパラメータセットなどのパラメータセット中で、完全POC値を受信し得る。この例では、長期参照ピクチャについてのPOC値が、現在のピクチャについての判断されたPOC値に等しいと仮定する。したがって、ビデオデコーダ30は、長期参照ピクチャの受信POC値と、現在の復号ピクチャの判断されたPOC値とに基づいて、後続ピクチャをインター予測するために使うことができる長期参照ピクチャが現在の復号ピクチャであると判断することができる(すなわち、ビデオデコーダ30は、長期参照ピクチャの受信POC値を、現在の復号ピクチャのPOC値にマッピングすることができる)。ビデオデコーダ30は次いで、現在の復号ピクチャを、後続ピクチャをインター予測するために使うことができるピクチャとして識別することができる。
現在のピクチャの部分的識別子値(たとえば、現在のピクチャのPOC値のLSB)をシグナリングすることによって、ビデオエンコーダ20は、シグナリングされる必要があるビットの量を削減することができ、ビデオデコーダ30は、より少ないビットしか受信する必要がないことがある。ただし、ビデオデコーダ30が非IDR RAPピクチャにおいて復号を開始する場合、いくつかの問題があり得る。
たとえば、上述したように、ビデオデコーダ30は、IDRピクチャに基づいて、現在のピクチャの完全POC値を判断することができる(たとえば、完全POC値を判断するのに使われる、上述したprevPicOrderCntLsbおよびprevPicOrderCntMsb変数が、IDRピクチャから始まって増分される)。ビデオデコーダ30が非IDR RAPピクチャにおいて復号を始めるべきである場合、IDRピクチャは利用可能でない場合があり、ビデオデコーダ30は、非IDR RAPピクチャの完全POC値を判断することができない場合がある。この場合、参照ピクチャについての完全POC値をビデオデコーダ30が受信した場合、非IDR RAPピクチャの後に続くピクチャをインター予測するために使われることになる。たとえば、参照ピクチャは長期参照ピクチャであってよく、ビデオエンコーダ20は、長期参照ピクチャの完全POC値を、ピクチャパラメータセット中でシグナリングすればよい。この場合ビデオデコーダ30は、DPB中のピクチャについての完全POC値を判断することができなかった可能性があるので、ビデオデコーダ30は、参照ピクチャについてのPOC値を、DPB中のピクチャにマッピングすることができない場合がある。
たとえば、ピクチャをインター予測するためのいくつかの例では、ビデオデコーダ30は、後でより詳しく説明するように、参照ピクチャセットを共に形成する複数の参照ピクチャサブセットを構成することができる。これらの参照ピクチャサブセットは、ピクチャをインター予測するために使うことができるがピクチャをインター予測するために必ずしも使われなくてもよい参照ピクチャを識別する。
いくつかの例では、ビデオエンコーダ20は、ピクチャをインター予測するために使うことができる長期参照ピクチャについての完全POC値を、ピクチャパラメータセット中でシグナリングすればよい。ただし、ビデオデコーダ30がピクチャについての完全POC値を判断することができない場合、たとえばビデオデコーダ30が非IDR RAPピクチャにおいて復号を始めた場合、ビデオデコーダ30は、DPBに記憶されたどのピクチャが、ピクチャパラメータセット中でシグナリングされる、長期参照ピクチャの完全POC値によって参照されるか判断することができない可能性がある。
こうすることにより、ランダムアクセスのための選択肢が制限され得る。より詳しく説明するように、本開示に記載する技法により、ビデオデコーダ30は、ランダムアクセスに非IDR RAPピクチャを使用するときに存在し得る問題に対処することができるようになり得る。
たとえば、本開示に記載する技法によると、ビデオデコーダ30は、非IDR RAPピクチャから復号することが可能であり得る。非IDR RAPピクチャとは、以下の基準を満たすピクチャであり得る。この例では、非IDR RAPピクチャはpicRとして指定される。
非IDR RAPピクチャpicRについての第1の基準は、picRはIDRピクチャではないことである。非IDR RAPピクチャpicRについての第2の基準は、出力順および復号順でpicRに続くすべてのピクチャが正しく復号され得ることである。たとえば、picRのPOC値をrPOCとし、picAを、復号順と出力順の両方でpicRに続く同じコード化ビデオシーケンス中のピクチャとし、picaのPOC値をaPOCとする。picRにおいてランダムアクセスが実施されると、同じコード化ビデオシーケンス中にあるとともに出力順でpicAに続くすべてのピクチャが正しく復号され得る。
非IDR RAPピクチャpicRに関して、ランダムアクセスがpicRにおいて実施されたとき、同じコード化ビデオシーケンス中にあるとともに出力順でpicRに続くすべてのピクチャが正しく復号され得る場合、クリーンランダムアクセス(CRA)ピクチャと呼ばれる。この条件が非IDR RAPピクチャpicRについて真でない場合、漸進的復号リフレッシュ(GDR)ピクチャと呼ばれる。
非IDR RAPピクチャのさらなる例は、リンク切断アクセス(BLA)ピクチャである。BLAピクチャは、予測構造(たとえば、BLAピクチャに続くどのピクチャがインター予測に使われ得るか)においてCRAピクチャと同様であり得る。
本開示に記載する技法により、ビデオデコーダ30は、非IDR RAPピクチャから始まるランダムアクセスを実施することができるようになり、ランダムアクセスの例は、CRAピクチャ、GDRピクチャ、およびBLAピクチャを含むが、これらの技法は、他のタイプの非IDR RAPピクチャにも拡張可能である。たとえば、テーブル4は、CraPicFlagシンタックス要素を定義する。現在のピクチャがCRAピクチャである場合、テーブル4によると、ビデオエンコーダ20は、CraPicFlagを真(すなわち、1の値)に設定すればよい。テーブル4に示されるように、CraPicFlagが真の場合、ビデオエンコーダ20は、現在のピクチャの完全POC値をシグナリングしてよい。たとえば、CraPicFlagが真の場合、ビデオエンコーダ20は、現在のピクチャのPOC値の最上位ビット(MSB)とLSBとを含むPOC値をシグナリングしてよい。
このように、ビデオデコーダ30がCRAピクチャ(すなわち、非IDR RAPピクチャ)から開始してランダムアクセスを実施する場合、ビデオデコーダ30は、IDRピクチャが利用可能でなくても、非IDR RAPピクチャについての完全POC値をDPBに記憶することができ得る。次いで、ビデオデコーダ30は、CRAピクチャの完全POC値に基づいて、CRAピクチャの後に続くピクチャの完全POC値を判断することができ得る。
たとえば、CRAピクチャの後に続く非RAPピクチャに関して、ビデオデコーダ30は、部分的識別子値(たとえば、POC値のLSB)を受信することができる。CRAピクチャのPOC値および完全POC値のLSBから、ビデオデコーダ30は、後続ピクチャの完全POC値を判断することができ得る。これにより、ビデオデコーダ30は、CRAピクチャと、CRAピクチャの後に続くピクチャとをインター予測に使用することが可能になり得る。たとえば、ビデオエンコーダ20が、以降のピクチャをインター予測するために使うことができる参照ピクチャ(たとえば、短期参照ピクチャまたは長期参照ピクチャ)についての完全POC値をシグナリングする場合、ビデオデコーダ30は、DPB中のどのピクチャが、後続ピクチャをインター予測するために使うことができる参照ピクチャであるかを識別することができる可能性がある。
このように、復号順で非IDR RAPピクチャに続く非RAPピクチャに関して、ビデオデコーダ30は、非IDR RAPピクチャの完全POC値に基づいて、非RAPピクチャをインター予測するために使うことができる参照ピクチャを識別することができる。たとえば、ビデオデコーダ30は、参照ピクチャサブセット中のピクチャパラメータセット中でシグナリングされる長期ピクチャであるとビデオデコーダ30が判断したピクチャをDPBに含めることによって、参照ピクチャサブセットを構成することができる可能性がある。
このように、ビデオデコーダ30は、非IDR RAPピクチャの一例であるCRAピクチャから開始してランダムアクセスを実施することができる。ただし、本開示の態様はそのように限定されない。他の例では、ビデオエンコーダ20は、現在のピクチャがGDRピクチャである場合はGdrPicFlagを真に設定すればよく、GDRピクチャの完全POC値をシグナリングすればよい。同様に、ビデオエンコーダ20は、現在のピクチャがBLAピクチャである場合はBlaPicFlagを真に設定すればよく、BLAピクチャの完全POC値をシグナリングすればよい。たとえば、上記例では、ビデオエンコーダ20は、テーブル4の「if(CraPicFlag)」を、「if(GdrPicFlag)」または「if(BlaPicFlag)で置き換えてよい。
あるいは、ビデオエンコーダ20は、テーブル4の「if(CraPicFlag)」を、「if(CraPicFlag||GdrPicFlag||BlaPicFlag)」で置き換えてよい。この場合、現在のピクチャが、CRAピクチャ、GDRピクチャ、またはBLAピクチャのうちのいずれかである場合、ビデオエンコーダ20は、ピクチャについての完全POC値をシグナリングすればよい。ビデオデコーダ30が、すべての例において、すべての可能な非IDR RAPピクチャに対してランダムアクセスを実施することが必要である必要はなく、ビデオエンコーダ20は、ビデオデコーダ30がランダムアクセスに使用することができる非IDR RAPピクチャを制限してよい。たとえば、ビデオエンコーダ20は、テーブル4中の「if(CraPicFlag)」を「if(CraPicFlag||GdrPicFlag)」で置き換えてよく、そうすることによって、ランダムアクセスをCRAおよびGDRピクチャに限定し、BLAピクチャ向けのランダムアクセスは認めない。ビデオデコーダ30がランダムアクセスに使用することができる、ピクチャについての他の順列および組合せも可能であり得る。
さらに、ビデオエンコーダ20は、RAPピクチャについての完全POC値を必ずしもシグナリングする必要はない。たとえば、いくつかの事例では、ビデオエンコーダ20は、RAPピクチャについてのPOC値のMSBとPOC値のLSBとを別個にシグナリングすればよい。たとえば、ビデオエンコーダ20は、pic_order_cnt_msb値をスライスヘッダ中でシグナリングしてよい。
pic_order_cnt_msbは、現在のピクチャのピクチャオーダーカウントのMSB部を指定する。long_term_ref_pic_id_len_deltaおよびlong_term_pic_id_len_minus4が、参照されるピクチャパラメータセット中に存在する場合、この値を表すのに使われるビットの数は、
Figure 2014530573
に等しくなり得る。そうでない場合、この値を表すのに使われるビットの数は、32−log2_max_pic_order_cnt_lsb_minus4に等しくなり得る。
この例では、ビデオデコーダ30は、現在のピクチャについての完全POC値を次のように判断することができる。
Figure 2014530573
この例では、ビデオエンコーダ20は、非IDR RAPピクチャのビットすべて(たとえば、MSBとLSBの組合せ)をシグナリングするよりもむしろ、非IDR RAPピクチャについてのpic_order_cnt_msbをシグナリングし、pic_order_cnt_lsbを別個にシグナリングすればよい。ビデオデコーダ30は、非IDR RAPピクチャの完全POC値のMSB部とLSB部とを別個に復号することができる。ビデオデコーダ30は次いで、上記技法を使用して、非IDR RAPピクチャについての完全POC値を判断すればよい。
さらに、いくつかの他の例では、ビデオエンコーダ20は、非IDR RAPピクチャについての完全POC値をシグナリングしなくてよい。たとえば、ビデオエンコーダ20は、CRA、GDR、またはBLAピクチャのMSB部をシグナリングすればよい。この例では、ビデオデコーダ30は、これらのピクチャについての完全POC値を、POC値のMSB部から完全POC値を判断するための前の式と同様にして判断することができる。
上記は、ビデオエンコーダ20およびビデオデコーダ30が非IDR RAPピクチャからのランダムアクセスを可能にする例示的なやり方について説明している。したがって、いくつかの例では、ビデオコーダ(たとえば、ビデオエンコーダ20またはビデオデコーダ30)は、瞬時デコーダリフレッシュ(IDR)ピクチャではないランダムアクセスポイント(RAP)ピクチャについての完全識別子値をコーディングする(たとえば、符号化または復号する)ことができる。RAPピクチャとは、ビットストリームの復号を開始するためのピクチャのタイプであり、復号順でRAPピクチャに続く少なくともいくつかのピクチャは、復号順でRAPピクチャの前のどのピクチャに関してもインター予測されない。上述したように、非IDR RAPピクチャの例には、CRA、BLA、およびGDRピクチャがある。
いくつかの例では、ビデオコーダは、非IDR RAPピクチャについての完全識別子値のビットすべて(たとえば、MSB部およびLSB部)をコーディングしてよい。いくつかの他の例では、ビデオコーダは、非IDR RAPピクチャの完全識別子値のMSB部とLSB部とを別個にコーディングしてよい。非IDR RAPピクチャの識別子値の一例は、非IDR RAPピクチャのPOC値である。
ビデオコーダは、第1の非RAPピクチャについての部分的識別子値をコーディングすることができる。この例では、部分的識別子値は、第1の非RAPピクチャの完全POC値の一部分であってよい。この第1の非RAPピクチャは、復号順で非IDR RAPピクチャに続き得る。
ビデオコーダはまた、第1の非RAPピクチャについての完全識別子値に基づいて、第2の非RAPピクチャをインター予測することができる。たとえば、ビデオコーダは、第1の非RAPピクチャについての完全識別子値に基づいて、ビデオコーダが、第2の非RAPピクチャをインター予測するために第1の非RAPピクチャを使うべきであると判断してよい。この場合、ビデオコーダは、第1の非RAPピクチャに基づいて第2の非RAPピクチャをインター予測する。第2の非RAPピクチャは、復号順で非IDR RAPピクチャと第1の非RAPピクチャの両方に続く。
いくつかの例では、ビデオコーダは、ピクチャパラメータセットなどのパラメータセット中で、第2の非RAPピクチャをインター予測するために使うことができる、長期参照ピクチャなど、1つまたは複数の参照ピクチャについての完全識別子値をさらにコーディングすることができる。この例では、ビデオコーダ(たとえば、ビデオデコーダ30)は、非IDR RAPピクチャについての完全識別子値と第1の非RAPピクチャについての部分的識別子値とに基づいて、第1の非RAPピクチャについての完全識別子値を判断することができる。
ビデオコーダは、1つまたは複数の参照ピクチャのうちの少なくとも1つについての完全識別子値が、第1の非RAPピクチャについての完全識別子値と同じかどうか判断することができる。1つまたは複数の参照ピクチャのうちの少なくとも1つについての完全識別子値が、第1の非RAPピクチャについての完全識別子値と同じである場合、ビデオコーダは、第2の非RAPピクチャをインター予測するために使うことができる参照ピクチャを識別する参照ピクチャサブセットに、第1の非RAPピクチャを含めてよい。
いくつかの例では、本開示に記載する技法は、スライスヘッダ中での長期参照ピクチャのシグナリングに関連し得る。概して、参照ピクチャは、短期参照ピクチャまたは長期参照ピクチャとしてカテゴリー化することができる。本開示に記載する技法によると、ビデオエンコーダ20は、現在のピクチャ用の参照ピクチャセットを示す情報をシグナリングすることができる。現在のピクチャ用の参照ピクチャセットは、現在のピクチャをインター予測するために使うことができ、かつ/または復号順で現在のピクチャに続くピクチャをインター予測するために使うことができる参照ピクチャを識別することができる。参照ピクチャセット中の参照ピクチャは、短期参照ピクチャおよび長期参照ピクチャであってよい。
たとえば、ビデオエンコーダ20は、どの短期参照ピクチャが参照ピクチャセットに属すかと、どの長期参照ピクチャが参照ピクチャセットに属すかとを示す情報をシグナリングすることができる。この情報から、ビデオデコーダ30は、複数の参照ピクチャサブセットを構成することができ、各参照ピクチャサブセットは、参照ピクチャセットに属す参照ピクチャのうちのゼロ個以上のピクチャを識別する。構成された参照ピクチャサブセットから、ビデオデコーダ30は、参照ピクチャセットを導出することができる。
ビデオデコーダ30は、ピクチャごとに一度、参照ピクチャセットを導出するための導出プロセスを実装することができる。たとえば、ビデオデコーダ30は、スライスヘッダを復号した後、ただし現在のピクチャ内のどのブロックを復号するのにも先立って、および現在のピクチャ内のスライスをインター予測するのに使われる参照ピクチャ(1つまたは複数)を識別する参照ピクチャリスト(1つまたは複数)を構成するのに先立って、参照ピクチャセットを導出することができる。
参照ピクチャサブセットは、参照ピクチャセットに属す短期参照ピクチャと、参照ピクチャセットに属す長期参照ピクチャとを識別するサブセットを含み得る。いくつかの例では、ビデオデコーダ30は、ゼロ個以上の短期参照ピクチャを含む4つの参照ピクチャサブセット、およびゼロ個以上の長期参照ピクチャを含む2つの参照ピクチャサブセットをもつ、6つの参照ピクチャサブセットを構成することができる。短期参照ピクチャ用の4つの参照ピクチャサブセットは、RefPicSetStCurr0、RefPicSetStCurr1、RefPicSetStFoll0、およびRefPicSetStFoll1と呼ばれ得る。長期参照ピクチャ用の2つの参照ピクチャサブセットは、RefPicSetLtCurrおよびRefPicSetLtFollと呼ばれ得る。
6つの参照ピクチャサブセットは、例示の目的で記載され、限定的と解釈されるべきでないことを理解されたい。一例として、ビデオデコーダ30は、たとえば、サブセットのうちのいくつかを組み合わせることによって、6つの参照ピクチャサブセットよりも少ない参照ピクチャサブセットを構成してよい。ビデオデコーダ30が6未満の参照ピクチャサブセットを構成するこれらの例のうちのいくつかについては、後で説明する。ただし、説明のために、ビデオデコーダ30が6つの参照ピクチャサブセットを構成する例を用いて、本技法を記載する。
いくつかの例では、RefPicSetStCurr0参照ピクチャサブセットは、現在のピクチャよりも出力または表示順が早いとともに、現在のピクチャのインター予測において参照用に使われ得、復号順で現在のピクチャに続く1つまたは複数のピクチャのインター予測において参照用に使われ得るすべての短期参照ピクチャの、POC値などの識別情報を含むことができ、かつそれだけを含むことができる。RefPicSetStCurr1参照ピクチャサブセットは、現在のピクチャよりも出力または表示順が後であるとともに、現在のピクチャのインター予測において参照用に使われ得、復号順で現在のピクチャに続く1つまたは複数のピクチャのインター予測において参照用に使われ得るすべての短期参照ピクチャの識別情報を含むことができ、かつそれだけを含むことができる。
RefPicSetStFoll0参照ピクチャサブセットは、現在のピクチャよりも出力または表示順が早く、復号順で現在のピクチャに続く1つまたは複数のピクチャのインター予測において参照用に使われ得るとともに、現在のピクチャのインター予測においては参照用に使うことができない、すべての短期参照ピクチャの識別情報を含むことができ、かつそれだけを含むことができる。RefPicSetStFoll1参照ピクチャサブセットは、現在のピクチャよりも出力または表示順が遅く、復号順で現在のピクチャに続く1つまたは複数のピクチャのインター予測において参照用に使われ得、現在のピクチャのインター予測においては参照用に使うことができない、すべての短期参照ピクチャの識別情報を含むことができ、かつそれだけを含むことができる。
RefPicSetLtCurr参照ピクチャサブセットは、現在のピクチャのインター予測において参照用に使われ得るとともに復号順で現在のピクチャに続く1つまたは複数のピクチャのインター予測において参照用に使われ得るすべての長期参照ピクチャの識別情報を含むことができ、かつそれだけを含むことができる。RefPicSetLtFoll参照ピクチャサブセットは、復号順で現在のピクチャに続く1つまたは複数のピクチャのインター予測において参照用に使われ得るとともに、現在のピクチャのインター予測においては参照用に使うことができない、すべての長期参照ピクチャの識別情報を含むことができ、かつそれだけを含むことができる。
現在のピクチャがIDRピクチャである場合、ビデオデコーダ30は、RefPicSetStCurr0、RefPicSetStCurr1、RefPicSetStFoll0、RefPicSetStFoll1、RefPicSetLtCurr、およびRefPicSetLtFoll参照ピクチャサブセットを空に設定してよい。上述したように、IDRピクチャはインター予測されず、したがって、IDRピクチャ用の参照ピクチャはない。
テーブル4に示されるように、スライスヘッダは、テーブル3においてさらに定義されるshort_term_ref_pic_set()シンタックス構造を指す。テーブル3は、num_short_term_curr0、num_short_term_curr1、num_short_term_foll0、およびnum_short_term_foll1シンタックス要素を定義する。これらのシンタックス要素は、それぞれ、RefPicSetStCurr0、RefPicSetStCurr1、RefPicSetStFoll0、およびRefPicSetStFoll1参照ピクチャサブセット中のピクチャの数を定義し得る。
これらのシンタックス要素およびshort_term_ref_pic_id_delta_minus1シンタックス要素に基づいて、ビデオデコーダ30は、RefPicSetStCurr0、RefPicSetStCurr1、RefPicSetStFoll0、およびRefPicSetStFoll1参照ピクチャサブセットを構成することができる。概して、短期参照ピクチャを識別するこれらの参照ピクチャサブセットをビデオデコーダ30が構成する具体的やり方は重要でない場合がある。以下の擬似コードは、ビデオデコーダ30が短期参照ピクチャについての参照ピクチャサブセットを構成し得るための一例示的やり方を記述する。
Figure 2014530573
長期参照ピクチャに関して、ビデオエンコーダ20は、ピクチャパラメータセット中の候補長期参照ピクチャのリストについての識別子(たとえば、完全POC値)をシグナリングすればよい。候補長期参照ピクチャは、参照ピクチャセットに属す可能性があり得るが、必ずしも参照ピクチャセットに属さなくてよい長期参照ピクチャを指す。候補長期参照ピクチャリストの一例は、ピクチャパラメータセット中のlong_term_ref_pic_id_pps[i]シンタックス要素である。
ビデオエンコーダ20は、任意選択で、候補長期参照ピクチャについての完全POC値をシーケンスパラメータセット中でシグナリングしてもよいことを理解されたい。説明のために、これらの技法について、ビデオエンコーダ20が候補長期参照ピクチャについての完全POC値をピクチャパラメータセット中でシグナリングする例を用いて記載する。
ビデオエンコーダ20は、どの長期参照ピクチャが参照ピクチャセット中に属すかを示す候補長期参照ピクチャのリスト中への索引をシグナリングすることができる。たとえば、テーブル5は、ビデオデコーダ30が参照ピクチャセットを導出する目的で継承するべき候補長期参照ピクチャのリスト中への索引を指定するlong_term_ref_pic_set_idx_ppsシンタックス要素を含む。
さらに、参照ピクチャセットに属す候補長期参照ピクチャのリストにはない長期参照ピクチャがあり得る。たとえば、テーブル5は、long_term_ref_pic_id_delta_addシンタックス要素を含む。このシンタックス要素は、現在のピクチャの参照ピクチャセットに含まれるべきだがピクチャパラメータセット中で指定されない長期参照ピクチャを示す。
テーブル5は、num_long_term_pps_curr、num_long_term_add_curr、num_long_term_pps_foll、およびnum_long_term_add_follシンタックス要素も含む。これらのシンタックス要素は、RefPicSetLtCurrおよびRefPicSetLtFoll参照ピクチャサブセットに含まれるべき長期参照ピクチャの数を示す。たとえば、num_long_term_pps_currおよびnum_long_term_add_currの値の合計は、RefPicSetLtCurr参照ピクチャサブセットに含まれるべき長期参照ピクチャの数を示す。num_long_term_pps_follおよびnum_long_term_add_follの値の合計は、RefPicSetLtFoll参照ピクチャサブセットに含まれるべき長期参照ピクチャの数を示す。
いくつかの他の技法では、ビデオデコーダ30が現在のピクチャをインター予測するためにどの長期参照ピクチャも必要としない場合であっても、ビデオエンコーダ20は、テーブル5のこれらのシンタックス要素すべてをシグナリングしてよい。たとえば、参照ピクチャセットは、現在のピクチャと復号順で現在のピクチャに続くピクチャをインター予測するために使うことができる参照ピクチャを識別することができるので、ビデオデコーダ30がインター予測にどの長期参照ピクチャも使用する必要がない場合であっても、復号順で現在のピクチャに続くピクチャが長期参照ピクチャを使用することができるので、これらの他の技法は依然として、長期参照ピクチャについてのこれらのシンタックス要素をシグナリングことができる。
説明のための例として、ビデオエンコーダ20が、3つの長期参照ピクチャをピクチャパラメータセット中でシグナリングしたと仮定する。いくつかの例では、ピクチャの多くは、これらの長期参照ピクチャのうちのどれもインター予測に使うことができない。ただし、これらの他の技法では、ビデオデコーダ30がこれらの長期参照ピクチャのうちのどれも、現在のピクチャをインター予測するために必要としない場合であっても、ビデオデコーダ30は、これらの長期参照ピクチャを、復号順で現在のピクチャに続くピクチャをインター予測するために必要とし得るので、ビデオエンコーダ20は依然として、長期参照ピクチャのうち3つすべてについてのシンタックス要素を現在のピクチャのスライスヘッダ中でシグナリングしてよい。これらの他の技法では、ビデオエンコーダ20が、長期参照ピクチャをシグナリングしなかった場合、ビデオデコーダ30は、これらの長期参照ピクチャがインター予測にそれ以上必要とされないと判断してよく、これらの参照ピクチャをDPBから削除してよい。
現在のピクチャをインター予測するために必要とされない長期参照ピクチャ用のシンタックス要素のそのような不必要なシグナリングは、帯域幅を消費する。さらに、ビデオデコーダ20が長期参照ピクチャの候補リスト中への索引値をシグナリングするとともに、候補長期参照ピクチャのリスト中にない長期参照ピクチャについてのPOC値をシグナリングする必要があり得るとき、長期参照ピクチャについてのシグナリングオーバーヘッドは、すでに高く複雑である可能性がある。
これに対処するために、ビデオエンコーダ20は、ビデオデコーダ30が現在のピクチャをインター予測するためにいずれかの長期参照ピクチャを使用する必要があるかどうかを示す値をシグナリングすればよい。この値は、現在のピクチャ復号順に続くピクチャが長期参照ピクチャに関してインター予測されないことをさらに示す。
たとえば、テーブル5は、long_term_not_used_flagを含む。このフラグが真のとき、どの長期参照ピクチャも、現在のピクチャならびに復号順で現在のピクチャに続くピクチャのインター予測に使われない。0に等しいこのフラグは、ビデオエンコーダ20が、num_long_term_pps_curr、num_long_term_add_curr、num_long_term_pps_foll、num_long_term_add_foll、long_term_ref_pic_set_idx_pps、およびlong_term_ref_pic_id_delta_addシンタックス要素など、テーブル5の長期参照ピクチャセットシンタックス中のシンタックス要素を使う、長期参照ピクチャの使用をシグナリングしてよいことを示す。
いくつかの例では、long_term_not_used_flagが真(たとえば、1の値)のとき、ビデオデコーダ30は、現在のピクチャをインター予測するためにどの長期参照ピクチャも必要としないので、ビデオエンコーダ20は、どの長期参照ピクチャが現在のピクチャの参照ピクチャセット中に属すかを示すシンタックス要素をシグナリングしなくてよい。たとえば、long_term_not_used_flagが真のとき、ビデオエンコーダ20は、num_long_term_pps_curr、num_long_term_add_curr、num_long_term_pps_foll、num_long_term_add_foll、long_term_ref_pic_set_idx_pps、およびlong_term_ref_pic_id_delta_addシンタックス要素をシグナリングしなくてよい。
さらに、真であるlong_term_not_used_flagは、復号順で現在のピクチャに続くどのピクチャも、インター予測に長期参照ピクチャを使わないことを、ビデオデコーダ30に対して示す。いくつかの例では、long_term_not_used_flagの値が1のとき、現在のピクチャおよび復号順で現在のピクチャに続くピクチャは長期参照ピクチャをインター予測に使わないので、ビデオデコーダ30は、出力にそれ以上必要とされない場合、その長期参照ピクチャをDPBから削除してよい。
本開示に記載する技法によると、long_term_not_used_flagが偽(たとえば、0の値)の場合、ビデオエンコーダ20は、参照されるパラメータセット中で指定されたすべての長期参照ピクチャが現在のピクチャのインター予測に使われ得ることを示す別の値をシグナリングすればよい。たとえば、テーブル5は、「if(!long_term_not_used_flag)」(すなわち、long_term_not_used_flagが偽である)場合、ビデオエンコーダ20はlong_term_reuse_pps_flagをシグナリングしてよいことを示す。long_term_reuse_pps_flagが真(たとえば、1の値)のとき、参照されるピクチャパラメータセット中で指定されるすべての長期参照ピクチャは、現在のピクチャの予測に使うことができ、参照されるPPS中で指示されないどの長期参照ピクチャも、現在のピクチャまたは復号順で現在のピクチャに続くピクチャのインター予測に使うことはできない。
いくつかの例では、long_term_reuse_pps_flagが真のとき、ビデオエンコーダ20は、num_long_term_pps_curr、num_long_term_add_curr、num_long_term_pps_foll、num_long_term_add_foll、long_term_ref_pic_set_idx_pps、およびlong_term_ref_pic_id_delta_addシンタックス要素をシグナリングしなくてよい。というのは、真であるlong_term_reuse_pps_flagは、参照されるピクチャパラメータセット中のすべての長期参照ピクチャが、現在のピクチャをインター予測するために使われ得ることを示すからであり得る。したがって、候補リスト中への索引をシグナリングする必要がないことがあり、結果としてlong_term_ref_pic_set_idx_ppsシンタックス要素が余分になる。long_term_ref_pic_set_idx_ppsシンタックス要素が必要とされないので、num_long_term_pps_currおよびnum_long_term_pps_follシンタックス要素は必要とされない。
また、真であるlong_term_reuse_pps_flagは、参照されるPPS中で指示されないどの長期参照ピクチャも、現在のピクチャまたは復号順で現在のピクチャに続くピクチャのインター予測に使うことができないことを示す。このことは、long_term_ref_pic_id_delta_addシンタックス要素が必要とされないことを意味する。たとえば、long_term_ref_pic_id_delta_addシンタックス要素は、参照されるPPS中で指定されないが参照ピクチャセットに属す長期参照ピクチャを示す。ただし、long_term_reuse_pps_flagが真のとき、参照されるPPSに含まれないどの参照ピクチャも、現在のピクチャまたは復号順で現在のピクチャに続くピクチャをインター予測するために使われず、このことは、long_term_ref_pic_id_delta_addシンタックス要素についての値がないことを意味する。ビデオエンコーダ20がlong_term_ref_pic_id_delta_addシンタックス要素をシグナリングする必要がないので、ビデオエンコーダ20がnum_long_term_add_currおよびnum_long_term_add_follシンタックス要素をシグナリングする必要がないことがある。
long_term_not_used_flagとlong_term_reuse_pps_flagの両方について本開示に記載するが、本開示の態様は、そのように限定されないことを理解されたい。いくつかの例では、長期参照ピクチャセットシンタックスはlong_term_not_used_flagを含み得るが、long_term_reuse_pps_flagは含まなくてよい。いくつかの例では、長期参照ピクチャセットシンタックスはlong_term_reuse_pps_flagを含み得るが、long_term_not_used_flagは含まなくてよい。
テーブル5に示されるように、long_term_not_used_flagとlong_term_reuse_pps_flagの両方が真でない事例では、ビデオエンコーダ20は、num_long_term_pps_curr、num_long_term_add_curr、num_long_term_pps_foll、num_long_term_add_foll、long_term_ref_pic_set_idx_pps、およびlong_term_ref_pic_id_delta_addシンタックス要素をシグナリングすればよい。たとえば、long_term_not_used_flagとlong_term_reuse_pps_flagの両方が真でないときは、ビデオデコーダ30が現在のピクチャをインター予測するために使用する必要がある長期参照ピクチャが存在する可能性があり、ビデオデコーダ30が現在のピクチャまたは復号順で現在のピクチャに続くピクチャをインター予測するために使用する必要があり得る参照されるピクチャパラメータセットに含まれない長期参照ピクチャが存在する可能性がある。
上述したように、ビデオデコーダ30は、上記擬似コードを実装して、RefPicSetStCurr0、RefPicSetStCurr1、RefPicSetStFoll0、およびRefPicSetStFoll1参照ピクチャサブセットを構成することができる。以下では、ビデオデコーダ30がRefPicSetLtCurrおよびRefPicSetLtFoll参照ピクチャサブセットを構成することができるやり方について説明する。
long_term_ref_pics_present_flagが偽(たとえば、0の値)であることをスライスヘッダが示す場合、ビデオデコーダ30は、RefPicSetLtCurrおよびRefPicSetLtFoll参照ピクチャサブセットを空に設定すればよい。そうではなく、スライスヘッダ中のlong_term_ref_pic_set()シンタックス構造のインスタンスが与えられる場合、ビデオデコーダ30は、次のようにRefPicSetLtCurrおよびRefPicSetLtFoll参照ピクチャサブセットを構成することができる。
long_term_not_used_flagが真(たとえば、1の値)の場合、ビデオデコーダ30は、RefPicSetLtCurr参照ピクチャサブセットを空に設定し、RefPicSetLtFoll参照ピクチャサブセットを空に設定すればよい。このことは、RefPicSetLtCurrおよびRefPicSetLtFoll参照ピクチャサブセットに含まれる参照ピクチャがないことを示す。そうではなく、long_term_not_used_flagが偽(たとえば、0の値)であり、long_term_reuse_pps_flagが真(たとえば、1の値)である場合、ビデオデコーダ30は、ピクチャパラメータセット中の長期参照ピクチャすべてを、RefPicSetLtCurr参照ピクチャサブセットに含めればよい。この場合、ビデオデコーダ30は、RefPicSetLtFoll参照ピクチャサブセットを空に設定してよい。
ビデオデコーダ30は、以下の擬似コードを実装して、RefPicSetLtCurr参照ピクチャサブセットを構成することができる。
Figure 2014530573
そうでない(すなわち、long_term_not_used_flagおよびlong_term_reuse_pps_flagが偽である)場合、ビデオコーダ30は、次の擬似コードにおいて指示されるように、RefPicSetLtCurr参照ピクチャサブセットを構成すればよい。
Figure 2014530573
また、long_term_not_used_flagおよびlong_term_reuse_pps_flagが偽である場合、ビデオコーダ30は、次の擬似コードにおいて指示されるように、RefPicSetLtFoll参照ピクチャサブセットを構成すればよい。
Figure 2014530573
上記は、ビデオエンコーダ20が長期参照ピクチャについての情報をシグナリングすることができる一例示的やり方と、ビデオデコーダ30が、長期参照ピクチャを含む参照ピクチャサブセットを含む、参照ピクチャセットの参照ピクチャサブセットを構成することができるやり方とについて説明している。ただし、本開示の態様はそのように限定されない。以下では、スライスヘッダの一部である長期参照ピクチャセットシンタックスの別の例について説明する。
Figure 2014530573
テーブル6の長期参照ピクチャセットシンタックスは、long_term_pps_curr_flagとlong_term_pps_foll_flagとを含む。
1に等しいlong_term_pps_curr_flagは、参照されるピクチャパラメータセット中で指定されるすべての長期参照ピクチャが、現在のピクチャの予測に使われ得ることを示す。1に等しいこのフラグは、現在のピクチャの長期参照ピクチャの使用が長期参照ピクチャセットシンタックステーブルの残りのシンタックス要素によってシグナリングされることを示す。
long_term_pps_curr_flagが1に等しいとき、num_long_term_pps_currおよびnum_long_term_pps_follは、それぞれ、num_long_term_ref_pics_ppsおよび0に等しいと推論され、long_term_ref_pic_idx_pps[i]は、両端値を含む0〜num_long_term_ref_pics_pps−1の範囲のi個すべての値について、iであると推論される。
1に等しいlong_term_pps_foll_flagは、どの長期参照ピクチャも現在のピクチャのインター予測に使われず、参照されるピクチャパラメータセット(PPS)中で指示されるすべての長期参照ピクチャが、復号順で現在のピクチャに続くピクチャのインター予測に使われ得ることを示す。0に等しいこのフラグは、長期参照ピクチャの使用が長期参照ピクチャセットシンタックステーブルの残りのシンタックス要素によってシグナリングされることを示す。long_term_pps_foll_flagが存在しないとき、値は、0に等しいと推論することができる。
long_term_pps_foll_flagが1に等しいとき、num_long_term_pps_currおよびnum_long_term_pps_follは、それぞれ、0およびnum_long_term_ref_pics_ppsであると推論され、long_term_ref_pic_idx_pps[i]は、両端値を含む0〜num_long_term_ref_pics_pps−1の範囲のi個すべての値について、iであると推論される。
テーブル6のlong_term_pps_curr_flagおよびlong_term_pps_foll_flagは、ビデオエンコーダ20に、long_term_ref_pic_set_idx_pps索引値、およびいくつかのケースではnum_long_term_pps_currおよびnum_long_term_pps_follシンタックス要素をシグナリングさせないようにすることができる。これらのケースでは、ビデオデコーダ30は、ピクチャパラメータセットの候補長期参照ピクチャリスト中の参照ピクチャのうちのいずれも継承する必要がない場合がある。
たとえば、long_term_pps_curr_flagが真(たとえば、1の値)のとき、ビデオデコーダ30は、参照されるピクチャパラメータセット中のすべての長期参照ピクチャが、現在のピクチャをインター予測するために使われ得ると判断してよい。この場合、候補長期参照ピクチャリスト中のすべての長期参照ピクチャが現在のピクチャをインター予測するために使われ得るので、候補長期参照ピクチャリスト中への索引値のシグナリングは必要とされない場合がある。したがって、long_term_pps_curr_flagが真のとき、long_term_ref_pic_set_idx_ppsシンタックス要素を、ビデオエンコーダ20はシグナリングする必要がないことがあり、ビデオデコーダ30は受信する必要がないことがある。long_term_ref_pic_set_idx_ppsシンタックス要素を、ビデオエンコーダ20がシグナリングする必要がないことがあり、ビデオデコーダ30が受信する必要がないことがあるので、num_long_term_pps_currおよびnum_long_term_pps_follシンタックス要素を、ビデオエンコーダ20はシグナリングする必要がないことがあり、ビデオデコーダ30は受信する必要がないことがある。
また、long_term_pps_foll_flagが真(たとえば、1の値)のとき、ビデオデコーダ30は、参照されるピクチャパラメータセット中のどの長期参照ピクチャも、現在のピクチャをインター予測するために使うことができず、すべての長期参照ピクチャが、復号順で現在のピクチャに続くピクチャをインター予測するために使われ得ると判断してよい。この場合、候補長期参照ピクチャリスト中のすべての長期参照ピクチャが、復号順で現在のピクチャに続くピクチャをインター予測するために使われ得るので、候補長期参照ピクチャリスト中への索引値のシグナリングは必要とされない場合がある。したがって、上記と同様に、long_term_pps_foll_flagが真のとき、long_term_ref_pic_set_idx_ppsシンタックス要素を、ビデオエンコーダ20はシグナリングする必要がないことがあり、ビデオデコーダ30は受信する必要がないことがある。long_term_ref_pic_set_idx_ppsシンタックス要素を、ビデオエンコーダ20がシグナリングする必要がないことがあり、ビデオデコーダ30が受信する必要がないことがあるので、num_long_term_pps_currおよびnum_long_term_pps_follシンタックス要素を、ビデオエンコーダ20はシグナリングする必要がないことがあり、ビデオデコーダ30は受信する必要がないことがある。
テーブル6の例における長期参照ピクチャセットシンタックスをビデオエンコーダ20がシグナリングし、ビデオデコーダ30が受信する例では、ビデオエンコーダ20およびビデオデコーダ30は、上述したように、短期参照ピクチャサブセット(たとえば、RefPicSetStCurr0、RefPicSetStCurr1、RefPicSetStFoll0、およびRefPicSetStFoll1参照ピクチャサブセット)を構成することができる。長期参照ピクチャサブセット(たとえば、RefPicSetLtCurrおよびRefPicSetLtFoll参照ピクチャサブセット)を構成するために、ビデオエンコーダ20およびビデオデコーダ30は、以下を実装すればよい。
Figure 2014530573
RefPicSetLtCurrおよびRefPicSetLtFoll参照ピクチャサブセットの上記導出において示されるように、ビデオエンコーダ20およびビデオデコーダ30は、long_term_ref_pic_idx_ppsシンタックス要素を使用して、RefPicSetLtCurrおよびRefPicSetLtFoll参照ピクチャサブセットを構成することができる。ただし、long_term_pps_curr_flagが偽(たとえば、0の値)であり、long_term_pps_foll_flagが偽(たとえば、0の値)である場合、ビデオエンコーダ20は、long_term_ref_pic_idx_ppsシンタックス要素をシグナリングしなくてよい。これらのケースでは、ビデオエンコーダ20およびビデオデコーダ30は、long_term_ref_pic_idx_ppsシンタックス要素の値を推論すればよい。たとえば、ビデオエンコーダ20およびビデオデコーダ30は、long_ref_pic_idx_pps[i]の値を、両端値を含む0〜num_long_term_ref_pics_pps−1の範囲のすべての値について、iに等しいと推論することができる。
テーブル6の例示的シンタックスは、long_term_pps_curr_flagとlong_term_pps_foll_flagの両方を含むが、本開示の態様は、そのように限定されないことを理解されたい。他の例では、ビデオエンコーダ20は、long_term_pps_curr_flagをシグナリングしてよく、long_term_pps_foll_flagはシグナリングしなくてよい。他の例では、ビデオエンコーダ20は、long_term_pps_foll_flagをシグナリングしてよく、long_term_pps_curr_flagをシグナリングしなくてよい。
上記は、現在のピクチャおよび/または復号順で現在のピクチャに続くピクチャをインター予測するために使うことができる長期参照ピクチャについての情報を、ビデオエンコーダ20がシグナリングすることができ、ビデオデコーダ30が受信することができる例示的やり方について説明している。たとえば、ビデオエンコーダ20およびビデオデコーダ30は、テーブル5を参照して上述した例示的技法を実装するように構成すればよい。他の例では、ビデオエンコーダ20およびビデオデコーダ30は、テーブル6を参照して上述した例示的技法を実装するように構成すればよい。
たとえば、ビデオコーダ(たとえば、ビデオエンコーダ20またはビデオデコーダ30)は、長い長期参照ピクチャが現在のピクチャと、復号順で現在のピクチャに続くピクチャとをインター予測するために使われ得るかどうかを示すフラグの値をコーディングすればよい。たとえば、ビデオコーダは、long_term_not_used_flagについての値を、現在のピクチャのスライスのスライスヘッダ中でコーディングすればよい。
フラグの値が第1の値であるとき、ビデオコーダは、1つまたは複数の短期参照ピクチャのみを使用して、現在のピクチャをインター予測することができる。たとえば、long_term_not_used_flagの値が1(たとえば、真)のとき、ビデオコーダは、現在のピクチャと復号順で現在のピクチャに続くピクチャとをインター予測するために、長期参照ピクチャを使うことができない。この例では、ビデオコーダは、RefPicSetLtCurrおよびRefPicSetLtFoll参照ピクチャサブセットを空に設定すればよい。
また、この例では、ビデオコーダは、少なくとも1つの短期参照ピクチャサブセット(たとえば、RefPicSetStCurr0、RefPicSetStCurr1、RefPicSetStFoll0、およびRefPicSetStFoll1参照ピクチャサブセットのうちの少なくとも1つ)を構成することができる。ビデオコーダは、少なくとも1つの短期参照ピクチャサブセットに含まれる短期参照ピクチャのうちの1つまたは複数を使用して、現在のピクチャをインター予測することができる。
いくつかの例では、ビデオコーダは、別のフラグの値をさらにコーディングすることができる。たとえば、long_term_not_use_flagが偽である(たとえば、値が0である)場合、ビデオコーダはlong_term_reuse_pps_flagをコーディングすることができる。この例では、0の値であるlong_term_not_use_flagは、長期参照ピクチャが現在のピクチャと復号順で現在のピクチャに続くピクチャとをインター予測するために使われ得ることを示す。上述したように、long_term_reuse_pps_flagは、パラメータセット中で指定されたすべての長期参照ピクチャ(たとえば、参照されるピクチャパラメータセット)が現在のピクチャのインター予測に使われ得るかどうかと、パラメータセット中で指定されないとともに復号順で現在のピクチャに先立つ長期参照ピクチャが、現在のピクチャまたは復号順で現在のピクチャに続くピクチャのインター予測に使われ得るかどうかとを示す。
long_term_reuse_pps_flagの値が1(たとえば、真)のとき、long_term_reuse_pps_flagは、パラメータセット中で指定されたすべての長期参照ピクチャが現在のピクチャのインター予測に使うことができ、パラメータセット中で指定されないとともに復号順で現在のピクチャに先立つ長期参照ピクチャが、現在のピクチャまたは復号順で現在のピクチャに続くピクチャのインター予測に使うことができないことを示す。long_term_reuse_pps_flagが1のとき、ビデオコーダは、現在のピクチャのインター予測において参照用に使うことができるとともに、復号順で現在のピクチャに続くピクチャのインター予測において参照用に使うことができるすべての長期参照ピクチャを含む長期参照ピクチャサブセット(たとえば、RefPicSetLtCurr)を構成することができる。これらの例では、ビデオコーダは、パラメータセット中への索引をコーディングすることなく、RefPicSetLtCurr参照ピクチャサブセットを構成することができる。
たとえば、long_term_ref_pic_set_idx_pps[i]シンタックス要素は、候補長期参照ピクチャリスト中への索引(たとえば、ピクチャパラメータセット中で指定された長期参照ピクチャ中への索引)を与え得る。long_term_reuse_pps_flagが1である例では、ビデオコーダは、long_term_ref_pic_set_idx_pps[i]シンタックス要素をコーディングすることなく、RefPicSetLtCurr参照ピクチャサブセットを構成することが可能であり得る。
long_term_not_used_flagおよびlong_term_reuse_ppg_flagの値が両方とも0(たとえば偽)のとき、このことは、現在のピクチャおよび復号順で現在のピクチャに続くピクチャが長期参照ピクチャでインター予測され得ることと、パラメータセット中で指定されたすべての長期参照ピクチャが現在のピクチャのインター予測に使われ得るわけではないことと、パラメータセット中で指定されないとともに復号順で現在のピクチャに先立つ長期参照ピクチャが現在のピクチャおよび復号順で現在のピクチャに続くピクチャのインター予測に使われ得ることとを示し得る。この場合、ビデオコーダは、RefPicSetLtCurrおよびRefPicSetLtFoll参照ピクチャサブセットの両方を構成することができる。いくつかの例では、ビデオコーダは、パラメータセット中への少なくとも1つの索引(たとえば、指定された長期参照ピクチャ中への索引)をコーディングすることができ、少なくとも1つの索引に基づいて、RefPicSetLtCurrおよびRefPicSetLtFoll参照ピクチャサブセットを構成することができる。
いくつかの他の例では、ビデオコーダは、パラメータセット中で指定されたすべての長期参照ピクチャが現在のピクチャ用のインター予測に使われ得ることを示すフラグの値を、現在のピクチャのスライス用のスライスヘッダ中でコーディングすることができる。たとえば、ビデオコーダは、long_term_pps_curr_flagをコーディングすることができる。
long_term_pps_curr_flagの値が第1の値(たとえば、1)であるとき、このことは、パラメータセット中で指定されたすべての長期参照ピクチャが現在のピクチャ用のインター予測に使われ得ることを示すことができる。この場合、ビデオコーダは、指定された長期参照ピクチャについてのパラメータセット中への索引をコーディングすることなく(たとえば、候補長期参照ピクチャリスト中への索引を与えるlong_term_ref_pic_set_idx_pps[i]シンタックス要素をコーディングすることなく)、パラメータセット中で指定された長期参照ピクチャを使用して、現在のピクチャをインター予測することができる。
たとえば、long_term_pps_curr_flagの値が1のとき、ビデオコーダは、長期参照ピクチャが現在のピクチャをインター予測するために使われ得ると判断してよい。ビデオコーダは、長期参照ピクチャが、現在のピクチャをインター予測するために使われるべきであるとさらに判断してよい。この場合、ビデオコーダは、長期参照ピクチャが現在のピクチャをインター予測するために使われるべきであるという判断に基づいて、長期参照ピクチャを使用して現在のピクチャをインター予測することができる。
いくつかの例では、ビデオコーダは、long_term_pps_curr_flagの値が0のとき、long_term_pps_foll_flagをさらにコーディングすることができる。long_term_pps_curr_flagが0のとき、およびどの長期参照ピクチャも現在のピクチャのインター予測に使われず、パラメータセット中で指示されるすべての長期参照ピクチャが、復号順で現在のピクチャに続くピクチャのインター予測に使われ得ることを、long_term_pps_foll_flagが示すとき、ビデオコーダは、パラメータセット中で指定されない1つまたは複数の長期参照ピクチャを使用して、およびパラメータセット中で指定される長期参照ピクチャのうちのいずれも使用せずに、現在のピクチャをインター予測することができる。
いくつかの例では、本開示に記載する技法は、復号ピクチャバッファ(DPB)管理を対象とし得る。DPBは、復号ピクチャを記憶するバッファであり得る。
ビデオエンコーダ20およびビデオデコーダ30の各々は、それぞれのDPBを含み得る。たとえば、符号化プロセスの一部として、ビデオエンコーダ20は、現在のピクチャを復号し、復号ピクチャをビデオエンコーダ20のDPBに記憶し、DPBに記憶された復号ピクチャを、後続ピクチャのインター予測のために使用することができる。同様に、復号プロセスの一部として、ビデオデコーダ30は、現在のピクチャを復号し、復号ピクチャをビデオデコーダ30のDPBに記憶することができる。ビデオデコーダ30は次いで、復号ピクチャを、後続ピクチャのインター予測のために使用することができる。
いくつかの例では、ビデオエンコーダ20またはビデオデコーダ30のいずれかのためのDPBは、復号ピクチャを、出力並べ替えまたは出力遅延のために記憶することができる。たとえば、ビデオデコーダ30は、復号ピクチャが出力用に並べ替えられるべきであると、または復号ピクチャの出力が遅らされるべきであると判断してよい。これらの例では、ビデオデコーダ30のDPBは、復号ピクチャを、出力並べ替えまたは出力遅延のために記憶することができる。
本開示に記載するDPB管理技法は、DPBが復号ピクチャを出力および削除する方法を対象とし得る。output_flagシンタックス要素は、復号ピクチャ出力および削除プロセスに影響する場合があり、ネットワークアブストラクションレイヤ(NAL)ユニットセマンティクスの一部として定義され得る。NALユニットは、後に続くべきデータのタイプと、必要に応じてエミュレーション防止バイトをもつ、散在される未加工バイトシーケンスペイロード(RBSP)の形でデータを含むバイトとの指示を含むシンタックス構造として定義され得る。RBSPは、NALユニット中にカプセル化される、整数個のバイトを含むシンタックス構造であり得る。RBSPは、空であってもよく、またはシンタックス要素、それに続くRBSPストップビット、およびそれに続く、0に等しい、ゼロ個以上の後続ビットを含むデータビット列の形を有する。テーブル7は、NALユニットシンタックスを定義する。
Figure 2014530573
テーブル7において、output_flagは、後でより詳しく説明するように、復号ピクチャ出力および削除プロセスに影響し得る。どのピクチャに対しても、output_flagが1に等しい場合、ピクチャは出力を意図されている。そうでない場合、ピクチャが出力されることはない。本開示に記載する技法では、変数OutputFlagは、output_flagシンタックス要素に等しい。
いくつかの例では、現在のアクセスユニットのコード化ピクチャのどのコード化スライスNALユニットも、以下のうちの1つまたは複数のように、前のアクセスユニットのコード化ピクチャのどのコード化スライスNALユニットとも異なってよい。たとえば、nal_ref_idc値のうちの1つが0に等しい場合、pic_parameter_set_id値が異なってよく、nal_ref_idc値が異なってよい。pic_order_cnt_lsb値が異なってよい。IdrPicFlag値が異なってよい。IdrPicFlagは両方に対して1に等しくてよく、idr_pic_id値は異なってよい。
本開示に記載する技法では、アクセスユニットは、復号順において連続するとともに1つのコード化ピクチャを含む1組のNALユニットとして定義され得る。コード化ピクチャに加え、1つの補助コード化ピクチャ、または他のNALユニットは、コード化ピクチャのスライスを含むことはできない。いくつかの例では、アクセスユニットの復号により、復号ピクチャが生じ得る。コード化ピクチャは、復号プロセスによって使用されるべきピクチャのコード化表現であり得る。
テーブル4に示されるように、スライスヘッダシンタックスは、pic_parameter_set_idシンタックス要素と、pic_order_cnt_lsbシンタックス要素と、IdrPicFlagシンタックス要素と、idr_pic_idシンタックス要素とを含み得る。テーブル7に示されるように、NALユニットシンタックスは、nal_ref_idcシンタックス要素を含み得る。
説明のために、DPB管理技法を、仮想参照デコーダ(HRD)の観点から説明する。HRDは、符号化プロセスが生じ得る準拠NALユニットストリームまたは準拠バイトストリームの変動性に対する制約を指定する仮想デコーダモデルとして定義され得る。ただし、本開示に記載する技法によると、ビデオデコーダ30はDPB管理技法を実装することができ、いくつかの例では、ビデオエンコーダ20がDPB管理技法を実装することも可能であり得る。
HDRモデルは、コード化ピクチャバッファ(CPB)と、瞬時復号プロセスと、復号ピクチャバッファ(DPB)とを定義することができる。CPBは、他の以前の規格において定義されるHDRモデルのCPBと同様であり得る(すなわち、CPBは、コード化ピクチャを記憶することができる)。本開示に記載する技法は、他の規格における操作とは異なる、DPB操作を対象とする。繰返しになるが、ビデオデコーダ30および可能性としてはビデオエンコーダ20が、後で説明するようにDPB操作を実装し得ることを理解されたい。
概して、本開示に記載する技法は、DPBにおける復号ピクチャの出力および削除に関連する。復号ピクチャの出力は、このコンテキストでは、復号中のピクチャの、表示、記憶または他の目的での出力を意味する。ただし、出力される復号ピクチャは、必ずしもDPBから削除される必要はない。たとえば、ビデオデコーダ30は、出力される復号ピクチャを、後続ピクチャをインター予測するための参照ピクチャとして使用する必要があり得るので、ビデオデコーダ30は、その復号ピクチャをDPBから削除しなくてよい。復号ピクチャの削除は、このコンテキストでは、DPBからの復号ピクチャの削除を意味する。
たとえば、ビデオデコーダ30は、復号ピクチャを、ビデオデコーダ30のDPBに、ピクチャが復号される順序で記憶すればよい。ただし、ピクチャの復号順は、ピクチャの出力順と同じでなくてよい。たとえば、復号順において現在のピクチャの後に続く、現在のピクチャよりも早く出力されるべきピクチャがあり得る。したがって、いくつかの例では、ビデオデコーダ30は、復号順で並べられている、DPB中のピクチャを、ビデオデコーダ30が出力順に並べ替えるための並べ替えを実施してよい。ビデオデコーダ30は次いで、復号ピクチャを、その出力順に出力すればよい。ビデオデコーダ30は、ピクチャが出力に必要とされない(すなわち、出力済みであるか、または出力を意図されていない)、また、インター予測に必要とされない(すなわち、インター予測のための参照ピクチャとして使われる必要がない)場合、復号ピクチャからピクチャを削除してもよい。
本開示に記載する技法では、以下の基準が満たされるとき、ビデオデコーダ30は、DPBから復号ピクチャを削除することができる。すなわち、(1)導出された参照ピクチャセット中で復号ピクチャが識別されない、(2)復号ピクチャが出力に必要とされない(すなわち、出力済みであり、または出力を意図されない)、(3)ピクチャの時間的識別値(temporal_id)が現在のピクチャの時間的識別値以下である。上述のように、時間的識別値(temporal_id)は、現在のピクチャをインター予測するために、どのピクチャを使うことができるかを示す階層的値であってよい。特定のtemporal_id値をもつピクチャは、それ以上のtemporal_id値をもつピクチャ用の参照ピクチャになり得るが、逆は成り立たない。たとえば、1のtemporal_id値をもつピクチャは、可能性としては、1、2、3、...のtemporal_id値をもつピクチャ用の参照ピクチャになり得るが、0のtemporal_id値をもつピクチャ用の参照ピクチャにはなり得ない。
繰返しになるが、上述したように、参照ピクチャセットは、現在のピクチャをインター予測するのに使われ得るとともに復号順で現在のピクチャに続く1つまたは複数のピクチャをインター予測するのに使われ得る参照ピクチャを識別することができる。いくつかのケースでは、現在のピクチャの参照ピクチャセットは、temporal_id値が現在のピクチャのもの以下である参照ピクチャのみを識別するように制約され得る。
いくつかの他の技法では、DPB中の復号ピクチャのtemporal_id値が現在のピクチャのtemporal_id値よりも大きい場合、その復号ピクチャは、出力に必要とされないとき、DPBから削除される。ただし、削除されたピクチャは、temporal_id値が削除されたピクチャのtemporal_id値以上である別のピクチャをインター予測するための最良候補である場合がある。この場合、ビデオデコーダ30は、temporal_id値が削除されたピクチャのtemporal_id値以上であるこのピクチャをインター予測するための最良候補を使うことができない可能性がある。
本開示に記載する技法によると、上述した例示的基準は、temporal_id値が現在のピクチャのものよりも大きい復号ピクチャが後続ピクチャをインター予測するために利用可能であるように、そのようなピクチャがDPBのままであるようにし得る。たとえば、復号ピクチャが導出された参照ピクチャセット中で識別されない場合であっても、および復号ピクチャが出力に必要とされない場合であっても、復号ピクチャのtemporal_id値が現在のピクチャのものよりも大きい場合、ビデオデコーダ30は、デコーダのDPBから復号ピクチャを削除しなくてよい。このように、現在のピクチャの参照ピクチャセットが、temporal_id値が現在のピクチャのものよりも大きいどのピクチャも識別しない場合であっても、ビデオデコーダ30は、temporal_id値が現在のピクチャのものよりも大きい復号ピクチャを削除しなくてよい。
さらに、本開示に記載する技法では、ビデオデコーダ30は、現在のピクチャの復号に先立って、復号ピクチャを削除してよい。たとえば、上述したように、ビデオデコーダ30は、参照ピクチャセットを導出することができる。ビデオデコーダ30は、現在のピクチャを復号するのに先立って参照ピクチャセットを導出することができるので、ビデオデコーダ30は、出力に必要とされない復号ピクチャが、現在のピクチャを復号するのに先立って削除されるべきかどうか判断するように構成すればよい。たとえば、参照ピクチャセットを導出した後、および現在のピクチャを復号するのに先立って、ビデオデコーダ30は、出力に必要とされず、現在のピクチャの参照ピクチャセット中で識別されず、temporal_id値が現在のピクチャのもの以下である復号ピクチャを識別することができる。次いで、現在のピクチャを復号するのに先立って、ビデオデコーダ30は、DPBから、識別された復号ピクチャを削除してよい。
DPBは複数のバッファを含んでよく、各バッファは、参照ピクチャとして使われるべき、または将来の出力のために保有される復号ピクチャを記憶することができる。最初に、DPBは空である(すなわち、DPB充満度はゼロに設定される)。
本開示は、DPB中の復号ピクチャの削除技法について、少なくとも2つの観点から記載する。第1の観点では、ビデオデコーダ30は、ピクチャが出力を意図されている場合、出力時間に基づいて、復号ピクチャを削除してよい。第2の観点では、ビデオデコーダ30は、ピクチャが出力を意図されている場合、POC値に基づいて、復号ピクチャを削除してよい。いずれの観点でも、ビデオデコーダ30は、復号ピクチャが参照ピクチャセット中にないとき、および現在のピクチャを復号するのに先立って、出力に必要とされない(すなわち、すでに出力されているか、または出力を意図されていない)復号ピクチャを削除してよい。
第1の観点では、以下の技法は、以下の系列で、時間tr(n)において瞬時に起こり得る。この例では、tr(n)は、現在のピクチャを含むアクセスユニットnのCPB削除時間(すなわち、復号時間)である。本開示で説明するように、瞬時に起こる技法は、HDRモデルでは、ピクチャの復号が、ゼロに等しい、ピクチャを復号するための期間をもつ瞬時(すなわち、無制限に高速)であると仮定されることを意味し得る。
現在のピクチャがIDRピクチャである場合、およびIDRピクチャが最初のIDRピクチャではなく、アクティブシーケンスパラメータセットから導出されたpic_width_in_luma_samplesまたはpic_height_in_luma_samplesまたはmax_dec_frame_bufferingの値の値が、それぞれ、先行ピクチャに関してアクティブだったシーケンスパラメータセットから導出されたpic_width_in_luma_samplesまたはpic_height_in_luma_samplesまたはmax_dec_frame_bufferingの値とは異なるとき、ビデオデコーダ30は、no_output_of_prior_pics_flagの実効値にかかわらず、no_output_of_prior_pics_flagシンタックス要素が1に等しいと推論してよい。現在のピクチャがIDRピクチャである場合、およびno_output_of_prior_pics_flagが実際に1に等しく、または1に等しいと推論されるとき、ビデオデコーダ30は、DPB内のピクチャを出力せずに、DPBのすべてのバッファを空にしてよく、DPB充満度を0に設定すればよい。
上でテーブル1に示したように、シーケンスパラメータセットは、pic_width_in_luma_samples、およびpic_height_in_luma_samplesシンタックス要素を含み得る。シーケンスパラメータセットは、max_dec_frame_bufferingシンタックス要素も含み得る。上でテーブル4に示したように、スライスヘッダシンタックスは、no_output_of_prior_pics_flagシンタックス要素を含み得る。
現在のピクチャがIDRピクチャではないとき、ビデオデコーダ30は、以下の条件が真であるDPB内のすべてのピクチャ(m)を削除してよい。第1の条件は、ピクチャが現在のピクチャの参照ピクチャセットに含まれないことであってよい。第2の条件は、ピクチャが、0に等しいOutputFlagをもち、またはピクチャのDPB出力時間が現在のピクチャのCPB削除時間以下であることであり得る。この例では、CPB削除時間は、削除プロセスが起こるtr(n)(たとえば、現在のピクチャの復号に先立つ時間)である。復号ピクチャmのDPB出力時間は、変数to,dpb(m)によって定義することができる。したがって、CPB削除時間以下であるDPB出力時間は、to,dpb(m)≦tr(n)と表すことができる。DPB出力時間(to,dpb)の導出については、以下でより詳しく定義する。第3の条件は、ピクチャのtemporal_idが現在のピクチャのtemporal_id以下であることである。
このようにして、ビデオデコーダ30は、復号ピクチャの出力時間、復号ピクチャが参照ピクチャセット中で識別されるかどうか、および復号ピクチャのtemporal_id値に基づいて、ピクチャを復号するのに先立って、DPBから復号ピクチャを削除することができる。ビデオデコーダ30がDPBから復号ピクチャを削除すると、ビデオデコーダ30は、DPB充満度を1だけ減分してよい。
以下では、復号ピクチャを出力するべき時間(たとえば、復号ピクチャのDPB出力時間)をビデオデコーダ30が判断することができる方法について説明し、いつビデオデコーダ30が復号ピクチャをDPBに記憶することができるかについても説明する。上述したように、ピクチャのDPB出力時間は、そのピクチャがDPBから削除されるかどうか判断する際の要因となり得る。
ビデオデコーダ30がピクチャを復号するとき、ビデオデコーダ30は、ピクチャをDPBに記憶し、DPB充満度を1だけ増分する。ピクチャが、1に等しいOutputFlagを有するとき、ビデオデコーダ30は、以下の式に基づいて、ピクチャについてのDPB出力時間を導出することができる。
Figure 2014530573
この式において、dpb_output_delay(n)は、ピクチャを含むアクセスユニットに関連付けられたピクチャタイミングSEIメッセージ中で指定され得る。SEIメッセージは概して、H.264/AVC規格などの規格において十分に確立され、記載されている。
o,dpb(n)値は、いつピクチャが出力されるべきかを定義し得る。たとえば、OutputFlagが1に等しく、to,dpb(n)がtr(n)に等しい場合、ビデオデコーダ30はピクチャを出力してよい。そうではなく、OutputFlagが0に等しい場合、ビデオデコーダ30はピクチャを出力することができない。OutputFlagが1に等しく、to,dpb(n)がtr(n)よりも大きい事例では、ビデオデコーダ30は、以降の時間に(たとえば、時間to,dpb(n)で)ピクチャを出力することができる。
いくつかの例では、ビデオデコーダ30がピクチャを出力するとき、ビデオデコーダ30はピクチャをクロップしてよい。たとえば、ビデオデコーダ30は、ピクチャ用のアクティブシーケンスパラメータセット中で指定されたクロッピング矩形を使用することができる。ピクチャをクロップするための技法は概して、H.264/AVC規格などの規格において十分に確立され、記載されている。
いくつかの例では、ビデオデコーダ30は、ピクチャについてのDPB出力時間と、出力順においてそのピクチャに続くピクチャについてのDPB出力時間との間の差を判断することができる。たとえば、ピクチャ(n)が、ビデオデコーダ30が出力するピクチャであり、出力される、ビットストリームの最後のピクチャではないとき、ビデオデコーダ30は、Δto,dpb(n)の値が、次のように定義されると判断することができる。
Figure 2014530573
上記式において、nnは、出力順においてピクチャ(n)に続くとともに1に等しいOutputFlagをもつピクチャを示す。また、上記式において、Δto,dpb(n)は、ピクチャと、出力順においてその後に続くピクチャとの間のDPB出力時間の差を表す。
復号ピクチャを削除するための第2の観点において、HDRは、アクセスユニットがCPBから削除されたとき、瞬時にこれらの技法を実装すればよい。繰返しになるが、ビデオデコーダ30は、DPBからの復号ピクチャの削除を実施することができ、ビデオデコーダ30は、必ずしもCPBを含まなくてよい。概して、本開示では、復号ピクチャの削除は、ビデオデコーダ30によって実施され、ビデオエンコーダ20によって実施されてもよい。これらの例では、ビデオデコーダ30およびビデオエンコーダ20は、CPBを要求しなくてよい。そうではなく、CPBは、説明のためにのみ、HDRモデルの一部として説明される。
上記のように、復号ピクチャを削除するための第2の観点において、ビデオデコーダ30は、現在のピクチャの復号の前、ただし現在のピクチャの最初のスライスのスライスヘッダを解析した後、DPBからピクチャを削除してよい。また、復号ピクチャを削除するための第1の観点と同様、第2の観点において、ビデオデコーダ30は、現在のピクチャがIDRピクチャであるとき、第1の観点に関して上述したのと同様の機能を実施することができる。
そうではなく、現在のピクチャがIDRピクチャではない場合、ビデオデコーダ30は、「出力に必要とされない」とマーキングされたピクチャを記憶し、現在のピクチャの参照ピクチャセットに含まれないピクチャを記憶し、temporal_id値が現在のピクチャのもの以下であるピクチャを記憶する、DPBのバッファを、出力せずに空にしてよい。ビデオデコーダ30は、DPB充満度を、ビデオデコーダ30が空にしたバッファの数だけ減分してもよい。
空きバッファがなくなった(すなわち、DPB充満度がDBPサイズに等しくなった)とき、ビデオデコーダ30は、後で説明する「バンピング」プロセスを実施すればよい。いくつかの例では、空きバッファがない場合、ビデオデコーダ30は、ビデオデコーダ30が現在の復号ピクチャを記憶することができる空きバッファがあるバンピングプロセス繰り返しユニットを実装すればよい。
現在のピクチャが、no_output_of_prior_pics_flagが1に等しくないとともに1に等しいと推論されないIDRピクチャであるとき、ビデオデコーダ30は、以下を実施すればよい。ビデオデコーダ30は、「出力に必要とされない」とマーキングされたピクチャを記憶するとともに、現在のピクチャの参照ピクチャセットに含まれないDPBのバッファを、出力せずに空にしてよい。ビデオデコーダ30は、「バンピング」プロセスを繰り返し呼び出すことによって、DPB内のすべての空でないバッファを空にしてよく、DPB充満度を0に設定すればよい。
言い換えると、現在のピクチャがIDRピクチャであるとき、ビデオデコーダ30は、DPB内のすべてのバッファを空にするための技法を実施すればよい。現在のピクチャがIDRピクチャではないとき、ビデオデコーダ30は、復号ピクチャを、現在の復号ピクチャを記憶するためのフリーバッファに移動するための技法を実施すればよい。
たとえば、ビデオデコーダ30が現在のピクチャを復号した後、ビデオデコーダ30は、現在のピクチャをDPBに記憶し、DPB充満度を1だけ増分してよい。いくつかの例では、現在のピクチャのOutputFlagが1に等しい場合、ビデオデコーダ30は、現在のピクチャを、「出力に必要とされる」とマーキングすればよい。そうではなく、現在のピクチャのOutputFlagが0に等しい場合、ビデオデコーダ30は、現在のピクチャを、「出力に必要とされない」とマーキングすればよい。
上述したように、いくつかの例では、ビデオデコーダ30は、バンピングプロセスを実装してよい。概して、バンピングプロセスは、復号ピクチャの出力を伴う。たとえば、ビデオデコーダ30は、現在のピクチャがIDRピクチャであり、no_output_of_prior_pics_flagが1に等しくないとともに、1に等しいと推論されないときのためのバンピングプロセスを実施すればよい。ビデオデコーダ30は、DPB中に空きバッファがなく(すなわち、DPB充満度がDPBのサイズに等しく)、復号(非IDR)ピクチャの記憶に空きバッファが必要とされる場合にバンピングプロセスを実施してもよい。
概して、ビデオデコーダ30は、以下のステップを実施して、バンピングプロセスを実施することができる。ビデオデコーダ30は最初に、出力されるべきピクチャを判断すればよい。たとえば、ビデオデコーダ30は、「出力に必要とされる」とマーキングされている、DPB中のピクチャすべてのうち、最も小さいPOC値をもつピクチャを選択してよい。ビデオデコーダ30は、ピクチャ用のアクティブシーケンスパラメータセット中で指定されたクロッピング矩形を使って、選択されたピクチャをクロップしてよい。ビデオデコーダ30は、クロップされたピクチャを出力すればよく、ピクチャを「出力に必要とされない」とマーキングすればよい。ビデオデコーダ30は、クロップされ出力されたピクチャを記憶したDPBのバッファを調べればよい。ピクチャが参照ピクチャセットに含まれず、ピクチャのtemporal_id値が現在のピクチャのもの以下である場合、ビデオデコーダ30は、そのバッファを空にしてよく、DPB充満度を1だけ減分すればよい。
上記技法を使用することによって、ビデオエンコーダ20およびビデオデコーダ30は、非IDR RAPピクチャにおいてランダムアクセスを実施することができ、現在のピクチャをインター予測するために長期参照ピクチャを使うことができ、または使うことができない例についてシグナリングされる必要がある情報の量を削減することができ、時間的識別値が現在のピクチャのものよりも大きい参照ピクチャがインター予測用にDPB中で利用可能であるようにすることができる。また、上記は、ピクチャのインター予測について説明している。以下では、ピクチャのインター予測が起こる例について説明する。
上述したように、参照ピクチャサブセットを構成した後、ビデオデコーダ30は、参照ピクチャサブセットから、1つまたは2つの参照ピクチャリストを構成することができる。参照ピクチャリストは、現在のピクチャをインター予測するために使うことができる参照ピクチャを識別する。たとえば、現在のピクチャ中のブロックが双予測される(たとえば、2つの参照ピクチャに関して予測される)場合、ビデオデコーダ30は、リスト0およびリスト1またはRefPicList0およびRefPicList1と呼ばれる2つの参照ピクチャを構成することができる。この場合、リスト0は、参照ピクチャのうちの一方を識別し、リスト1は、他方の参照ピクチャを識別する。現在のピクチャ中のブロックが単方向予測される(1つの参照に関して予測される)場合、ビデオデコーダ30は、参照ピクチャを識別する1つの参照ピクチャリスト(たとえば、リスト0またはリスト1のいずれか)を構成することができる。
いくつかの例では、ビデオデコーダ30は最初に、1つまたは複数の初期参照ピクチャリストを構成し得る。参照ピクチャリスト修正が必要とされない場合、1つまたは複数の最終参照ピクチャリストは、1つまたは複数の初期参照ピクチャリストに等しくなり得る。参照ピクチャリスト修正が必要とされる場合、ビデオデコーダ30は、ビデオデコーダ30が1つもしくは複数の初期参照リスト中のピクチャの順序付けを配列し直し、1つのリストもしくは複数のリストに参照ピクチャを追加し、または1つのリストもしくは複数のリストから参照ピクチャを削除する修正プロセスを実装すればよい。
1つまたは複数の参照ピクチャリストの構成の後、ビデオデコーダ30は、構成された1つまたは複数の参照ピクチャリスト中への索引値(1つまたは複数)を受信することができる。索引値(1つまたは複数)から、ビデオデコーダ30は、どの参照ピクチャをインター予測に使用するべきか判断することができ、それらのピクチャをDPBから取り出し、それらのピクチャに関してインター予測を実施すればよい。
以下では、ビデオデコーダ30が初期参照ピクチャリストを構成することができる例示的やり方について説明する。この初期化プロセスは、インター予測ピクチャのスライスヘッダを復号するときに起こり得る。
初期RefPicList0を構成するために、ビデオデコーダ30は、以下の擬似コードを実装すればよい。たとえば、ビデオデコーダ30は、PまたはBスライスの復号を伴う、以下の擬似コードを実装してよい。この例では、少なくとも1つの参照ピクチャが、RefPicSetCurr0、RefPicSetCurr1、およびRefPicSetLtCurr参照ピクチャサブセットにあり得る。
Figure 2014530573
初期RefPicList1を構成するために、ビデオデコーダ30は、以下の擬似コードを実装すればよい。たとえば、ビデオデコーダ30は、Bスライスの復号を伴う、以下の擬似コードを実装してよい。この例では、少なくとも1つの参照ピクチャが、RefPicSetCurr0、RefPicSetCurr1、およびRefPicSetLtCurr参照ピクチャサブセットにあり得る。
Figure 2014530573
上記擬似コードにおいて、num_ref_idx_l0_active_minus1+1は、RefPicList0中の参照ピクチャの数を示し、num_ref_idx_l1_active_minus1+1は、RefPicList1中の参照ピクチャの数を示す。いくつかの例では、参照ピクチャリスト初期化の後、RefPicList0およびRefPicList1中の2つ以上の索引において参照ピクチャが現れる場合がある。
いくつかの例では、参照ピクチャリスト修正は必要とされなくてよい。これらのケースでは、ビデオエンコーダ20は、ref_pic_list_modification_flag_l0シンタックス要素および/またはref_pic_list_modification_flag_l1シンタックス要素をシグナリングすればよい。ref_pic_list_modification_flag_l0シンタックス要素は、RefPicList0の参照ピクチャリスト修正が必要とされることを示し、ref_pic_list_modification_flag_l1シンタックス要素は、RefPicList1の参照ピクチャ修正が必要とされることを示す。参照ピクチャリスト修正が必要とされるとき、ビデオデコーダ30は、初期RefPicList0および初期RefPicList1に含まれていなかったRefPicList0および/またはRefPicList1にピクチャを含めてよい。
上述したように、ビデオエンコーダ20は、どの参照ピクチャが参照ピクチャセットに属すかを示す情報をシグナリングすることができる。ビデオエンコーダ20がそのような情報をシグナリングすることができる様々なやり方があり得る。たとえば、上記例では、ビデオエンコーダ20は、短期参照ピクチャセットシンタックスと長期参照ピクチャセットシンタックスとをスライスヘッダ中でシグナリングして、どの短期および長期参照ピクチャが参照ピクチャセットに属すかを示すことができる。
別の例では、ビデオエンコーダ20は、短期参照ピクチャおよび/または長期参照ピクチャについての参照ピクチャ識別情報(たとえば、POC値)のリストを、ピクチャパラメータセットおよび/またはシーケンスパラメータセット中でシグナリングすることができ、リストに対する索引またはリストのサブセットをスライスヘッダ中でシグナリングすることができ、こうすることによりシグナリングオーバーヘッドを削減することができる。別の例では、ビデオエンコーダ20は、短期参照ピクチャおよび/または長期参照ピクチャについての参照ピクチャ識別情報(たとえば、POC値)のリストを、直接またはピクチャパラメータセットおよび/もしくはシーケンスパラメータセット中でシグナリングされる短期参照ピクチャおよび/もしくは長期参照ピクチャについての参照ピクチャ識別情報リストへの索引を参照することによって、適応パラメータセット中でシグナリングすることができ、スライスヘッダは適応パラメータセットを指す。
上記は、参照ピクチャサブセットを構成するための一例示的やり方についても説明している。これらの例のうちのいくつかでは、参照ピクチャサブセットのうちのどれも、temporal_id値が現在のピクチャよりも大きいピクチャを識別することができない。いくつかの他の例では、参照ピクチャセットのサブセットは、現在のピクチャよりも大きいtemporal_idをもつ短期および/または長期参照ピクチャを含み得る。
さらに、1つまたは複数の参照ピクチャセットに含められるべき参照ピクチャをシグナリングするとき、ビデオエンコーダ20は、参照ピクチャ識別と、参照ピクチャのいくつかの他のプロパティ(たとえば、temporal_idによって識別される時間的レベル情報)との情報をシグナリングすればよい。また、参照ピクチャリスト初期化と参照ピクチャリスト修正とを含む、参照ピクチャリスト構成の少なくとも1つのステップにおいて、ビデオデコーダ30は、現在のピクチャのものよりも大きいtemporal_idをもつ参照ピクチャを参照ピクチャリストに含めなくてよい。
上述したように、本開示に記載する技法は、HEVC規格に従って実施することができる。以下は、理解を助けるための、HEVC規格についての手短な説明である。さらに、これらの技法は、HEVC規格のコンテキストで説明されるが、これらの技法は、固有規格を含む他の規格に拡張可能であり得る。
JCT−VCは、HEVC規格の開発に取り組んでいる。HEVC規格化の取り組みは、HEVCテストモデル(HM)と呼ばれるビデオコーディングデバイスの発展的モデルに基づく。HMは、たとえば、ITU−T H.264/AVCに従う既存のデバイスに対してビデオコーディングデバイスのいくつかの追加の能力を仮定する。たとえば、H.264は9つのイントラ予測符号化モードを提供するが、HMは33個ものイントラ予測符号化モードを提供し得る。
一般に、HMの作業モデルは、ビデオフレームまたはピクチャが、ルーマとクロマの両方のサンプルを含む一連のツリーブロックまたは最大コーディングユニット(LCU)に分割され得ることを記載する。ツリーブロックは、H.264規格のマクロブロックと同様の目的を有する。スライスは、復号順序でいくつかの連続的なツリーブロックを含む。ビデオフレームまたはピクチャは、1つまたは複数のスライスに区分され得る。各ツリーブロックは、4分木に従ってコーディングユニット(CU)に分割され得る。たとえば、4分木のルートノードとしてのツリーブロックは、4つの子ノードに分割され得、各子ノードは、次に、親ノードとなり、別の4つの子ノードに分割され得る。4分木のリーフノードとしての、最終的な、分割されていない子ノードは、コーディングノード、すなわち、コード化ビデオブロックを備える。コード化ビットストリームに関連するシンタックスデータは、ツリーブロックが分割され得る最大回数を定義し得、コーディングノードの最小サイズをも定義し得る。ツリーブロックは、いくつかの例では、LCUと呼ばれることがある。
CUは、コーディングノードと、コーディングノードに関連する予測ユニット(PU)および変換ユニット(TU)とを含む。CUのサイズは、コーディングノードのサイズに対応し、形状が方形でなければならない。CUのサイズは、8×8ピクセルから最大64×64以上のピクセルをもつツリーブロックのサイズまでに及び得る。各CUは、1つまたは複数のPUと、1つまたは複数のTUとを含み得る。CUに関連するシンタックスデータは、たとえば、CUを1つまたは複数のPUに区分することを記述し得る。区分モードは、CUが、スキップモード符号化またはダイレクトモード符号化されるか、イントラ予測モード符号化されるか、あるいはインター予測モード符号化されるかによって異なり得る。PUは、形状が非方形になるように区分され得る。CUに関連するシンタックスデータは、たとえば、4分木に従って、CUを1つまたは複数のTUに区分することも記述し得る。TUは、形状が方形または非方形であり得る。
HEVC規格は、CUごとに異なり得るTUに従う変換を可能にする。TUは、一般に、区分されたLCUについて定義された所与のCU内のPUのサイズに基づいてサイズ決定されるが、常にそうであるとは限らない。TUは、一般にPUと同じサイズであるかまたはPUよりも小さい。いくつかの例では、CUに対応する残差サンプルは、「残差4分木」(RQT:residual quad tree)として知られる4分木構造を使用してより小さいユニットに再分割され得る。RQTのリーフノードは変換ユニット(TU)と呼ばれることがある。TUに関連するピクセル差分値は、変換されて変換係数が生成され得、その変換係数は量子化され得る。
一般に、PUは、予測プロセスに関連したデータを含む。たとえば、PUがイントラモード符号化されるとき、PUは、PUについてのイントラ予測モードを記述するデータを含み得る。別の例として、PUがインターモード符号化されるとき、PUは、そのPUについての動きベクトルを定義するデータを含み得る。PUについての動きベクトルを定義するデータは、たとえば、動きベクトルの水平成分、動きベクトルの垂直成分、動きベクトルの解像度(たとえば、1/4ピクセル精度または1/8ピクセル精度)、動きベクトルが指す参照ピクチャ、および/または動きベクトルの参照ピクチャリスト(たとえば、リスト0またはリスト1)を記述し得る。
概して、TUは、変換プロセスと量子化プロセスとのために使用される。1つまたは複数のPUを有する所与のCUは、1つまたは複数の変換ユニット(TU)をも含み得る。予測の後に、ビデオエンコーダ20は、PUに対応する残差値を計算し得る。残差値は、エントロピーコーディングのためのシリアル化変換係数(serialized transform coefficient)を生成するために、TUを使用して変換係数に変換され、量子化され、走査され得るピクセル差分値を備える。本開示では、一般に、CUのコーディングノードを指すために「ビデオブロック」という用語を使用する。いくつかの特定の場合において、本開示では、コーディングノードならびにPUおよびTUを含む、ツリーブロック、すなわち、LCUまたはCUを指す「ビデオブロック」という用語も使用し得る。
ビデオシーケンスは、一般的に、一連のビデオフレームまたはピクチャを含む。ピクチャグループ(GOP)は、一般に、ビデオピクチャのうちの一連の1つまたは複数を備える。GOPは、GOP内に含まれるいくつかのピクチャを記述するシンタックスデータを、GOPのヘッダ中、1つまたは複数のピクチャのヘッダ中、または他の場所に含み得る。ピクチャの各スライスは、それぞれのスライスの符号化モードを記述するスライスシンタックスデータを含み得る。ビデオエンコーダ20は、一般に、ビデオデータを符号化するために、個々のビデオスライス内のビデオブロックに対して動作する。ビデオブロックは、CU内のコーディングノードに対応し得る。ビデオブロックは、サイズを固定することも変更することもでき、指定のコーディング規格に応じてサイズが異なることがある。
一例として、HMは、様々なPUサイズでの予測をサポートする。特定のCUのサイズが2N×2Nであると仮定すると、HMは、2N×2NまたはN×NのPUサイズでのイントラ予測をサポートし、2N×2N、2N×N、N×2N、またはN×Nの対称的なPUサイズでのインター予測をサポートする。HMはまた、2N×nU、2N×nD、nL×2N、およびnR×2NのPUサイズでのインター予測のための非対称区分をサポートする。非対称区分では、CUの一方向は区分されないが、他の方向は25%と75%とに区分される。25%の区分に対応するCUの部分は、「n」とその後ろに付く「Up」、「Down」、「Left」、または「Right」という表示によって示される。したがって、たとえば、「2N×nU」は、上部の2N×0.5N PUと下部の2N×1.5N PUとで水平方向に区分された2N×2N CUを指す。
本開示では、「N×N(NxN)」および「N×N(N by N)」は、垂直寸法および水平寸法に関するビデオブロックのピクセル寸法、たとえば、16×16(16x16)ピクセルまたは16×16(16 by 16)ピクセルを指すために互換的に使用され得る。概して、16×16ブロックは、垂直方向に16ピクセルを有し(y=16)、水平方向に16ピクセルを有する(x=16)。同様に、N×Nブロックは、一般に、垂直方向にNピクセルを有し、水平方向にNピクセルを有し、ここで、Nは非負整数値を表す。ブロック中のピクセルは行と列に構成され得る。その上、ブロックは、必ずしも、水平方向において垂直方向と同じ数のピクセルを有する必要があるとは限らない。たとえば、ブロックはN×Mピクセルを備えてよく、ただし、Mは必ずしもNに等しいとは限らない。
CUのPUを使用したイントラ予測コーディングまたはインター予測コーディングの後、ビデオエンコーダ20は、CUのTUのための残差データを計算し得る。PUは、(ピクセル領域とも呼ばれる)空間領域においてピクセルデータを備え得、TUは、たとえば、残差ビデオデータへの離散コサイン変換(DCT)、整数変換、ウェーブレット変換、または概念的に同様の変換などの変換の適用後に、変換領域において係数を備え得る。残差データは、符号化されていないピクチャのピクセルと、PUに対応する予測値との間のピクセル差分に対応し得る。ビデオエンコーダ20は、CUのための残差データを含むTUを形成し、次いで、TUを変換して、CUの変換係数を生成し得る。
変換係数を生成するための任意の変換の後に、ビデオエンコーダ20は、変換係数の量子化を実施し得る。量子化は、概して、さらなる圧縮を提供する、係数を表すために使用されるデータの量をできるだけ低減するために変換係数を量子化するプロセスを指す。量子化プロセスは、係数の一部または全部に関連するビット深度を低減し得る。たとえば、量子化中にnビット値がmビット値に切り捨てられ得、この場合、nはmよりも大きい。
いくつかの例では、ビデオエンコーダ20は、エントロピー符号化され得るシリアル化ベクトルを生成するために、量子化変換係数を走査するためにあらかじめ定義された走査順序を利用し得る。他の例では、ビデオエンコーダ20は適応走査を実施し得る。量子化変換係数を走査して1次元ベクトルを形成した後に、ビデオエンコーダ20は、たとえば、コンテキスト適応型可変長コーディング(CAVLC:context-adaptive variable length coding)、コンテキスト適応型バイナリ算術コーディング(CABAC:context-adaptive binary arithmetic coding)、シンタックスベースコンテキスト適応型バイナリ算術コーディング(SBAC:syntax-based context-adaptive binary arithmetic coding)、確率間隔区分エントロピー(PIPE:Probability Interval Partitioning Entropy)コーディング、または別のエントロピー符号化方法に従って1次元ベクトルをエントロピー符号化し得る。ビデオエンコーダ20はまた、ビデオデータを復号する際にビデオデコーダ30が使用するための符号化ビデオデータに関連するシンタックス要素をエントロピー符号化し得る。
CABACを実施するために、ビデオエンコーダ20は、送信されるべきシンボルに、コンテキストモデル内のコンテキストを割り当て得る。コンテキストは、たとえば、シンボルの隣接値が非0であるか否かに関係し得る。CAVLCを実施するために、ビデオエンコーダ20は、送信されるべきシンボルの可変長コードを選択し得る。VLCにおけるコードワードは、比較的短いコードが優勢シンボルに対応し、より長いコードが劣勢シンボルに対応するように構成され得る。このようにして、VLCの使用は、たとえば、送信されるべき各シンボルのために等長コードワードを使用するよりも、ビット節約を達成し得る。確率判断は、シンボルに割り当てられるコンテキストに基づき得る。
図2は、本開示で説明する技法を実装し得る例示的なビデオエンコーダ20を示すブロック図である。ビデオエンコーダ20は、ビデオスライス内のビデオブロックのイントラコーディングおよびインターコーディングを実施し得る。イントラコーディングは、所与のビデオフレームまたはピクチャ内のビデオの空間的冗長性を低減または除去するために空間的予測に依拠する。インターコーディングは、ビデオシーケンスの隣接フレームまたはピクチャ内のビデオの時間的冗長性を低減または除去するために時間的予測に依拠する。イントラモード(Iモード)は、いくつかの空間ベースの圧縮モードのいずれかを指し得る。単方向予測(Pモード)または双予測(Bモード)などのインターモードは、いくつかの時間ベースの圧縮モードのいずれかを指し得る。
図2の例では、ビデオエンコーダ20は、区分ユニット35と、予測モジュール41と、復号ピクチャバッファ(DPB)64と、加算器50と、変換モジュール52と、量子化ユニット54と、エントロピー符号化ユニット56とを含む。予測モジュール41は、動き推定ユニット42と、動き補償ユニット44と、イントラ予測モジュール46とを含む。ビデオブロック再構成のために、ビデオエンコーダ20はまた、逆量子化ユニット58と、逆変換モジュール60と、加算器62とを含む。再構成されたビデオからブロッキネスアーティファクトを除去するためにブロック境界をフィルタ処理するデブロッキングフィルタ(図2に図示せず)も含まれ得る。所望される場合、デブロッキングフィルタは、一般に、加算器62の出力をフィルタ処理することになる。また、デブロッキングフィルタに加えて追加のループフィルタ(ループ内またはループ後)が使用され得る。
図2に示すように、ビデオエンコーダ20はビデオデータを受信し、区分ユニット35はデータをビデオブロックに区分する。この区分は、たとえば、LCUおよびCUの4分木構造に応じて、スライス、タイル、または他のより大きいユニットへの区分、ならびにビデオブロック区分をも含み得る。ビデオエンコーダ20は、概して、符号化されるべきビデオスライス内のビデオブロックを符号化する構成要素を示す。スライスは、複数のビデオブロックに(および、場合によっては、タイルと呼ばれるビデオブロックのセットに)分割され得る。予測モジュール41は、誤り結果(たとえば、コーディングレートおよびひずみレベル)に基づいて現在ビデオブロックのために、複数のイントラコーディングモードのうちの1つ、または複数のインターコーディングモードのうちの1つなど、複数の可能なコーディングモードのうちの1つを選択し得る。予測モジュール41は、得られたイントラコード化ブロックまたはインターコード化ブロックを、残差ブロックデータを生成するために加算器50に与え、参照ピクチャとして使用するための符号化ブロックを再構成するために加算器62に与え得る。
予測モジュール41内のイントラ予測モジュール46は、空間圧縮を行うために、コーディングされるべき現在ブロックと同じピクチャまたはスライス中の1つまたは複数の隣接ブロックに対する現在ビデオブロックのイントラ予測コーディングを実施し得る。予測モジュール41内の動き推定ユニット42および動き補償ユニット44は、時間圧縮を行うために、1つまたは複数の参照ピクチャ中の1つまたは複数の予測ブロックに対する現在ビデオブロックのインター予測コーディングを実施する。
動き推定ユニット42は、ビデオシーケンスの所定のパターンに従ってビデオスライスのためのインター予測モードを判断するように構成され得る。所定のパターンは、シーケンス中のビデオスライスをPスライスまたはBスライスに指定し得る。動き推定ユニット42と動き補償ユニット44とは、高度に統合され得るが、概念的な目的のために別々に示されている。動き推定ユニット42によって実施される動き推定は、ビデオブロックの動きを推定する動きベクトルを生成するプロセスである。動きベクトルは、たとえば、参照ピクチャ内の予測ブロックに対する現在ビデオピクチャ内のビデオブロックのPUの変位を示し得る。
予測ブロックは、絶対値差分和(SAD)、差分2乗和(SSD)、または他の差分メトリックによって判断され得るピクセル差分に関して、コーディングすべきビデオブロックのPUにぴったり一致することがわかるブロックである。いくつかの例では、ビデオエンコーダ20は、復号ピクチャバッファ64に記憶された参照ピクチャのサブ整数ピクセル位置の値を計算し得る。たとえば、ビデオエンコーダ20は、参照ピクチャの1/4ピクセル位置、1/8ピクセル位置、または他の分数ピクセル位置の値を補間し得る。したがって、動き推定ユニット42は、フルピクセル位置と分数ピクセル位置とに対する動き探索を実施し、分数ピクセル精度で動きベクトルを出力し得る。
動き推定ユニット42は、PUの位置を参照ピクチャの予測ブロックの位置と比較することによって、インターコード化スライス中のビデオブロックのPUについての動きベクトルを計算する。参照ピクチャは、第1の参照ピクチャリスト(リスト0)または第2の参照ピクチャリスト(リスト1)から選択され得、それらの参照ピクチャリストの各々は、復号ピクチャバッファ64に記憶された1つまたは複数の参照ピクチャを識別する。動き推定ユニット42は、計算された動きベクトルをエントロピー符号化ユニット56と動き補償ユニット44とに送る。
動き補償ユニット44によって実施される動き補償は、動き推定によって判断された動きベクトルに基づいて予測ブロックをフェッチまたは生成すること、場合によってはサブピクセル精度への補間を実施することを伴い得る。現在のビデオブロックのPUのための動きベクトルを受信すると、動き補償ユニット44は、参照ピクチャリストのうちの1つにおいて動きベクトルが指す予測ブロックの位置を特定し得る。ビデオエンコーダ20は、コーディングされている現在ビデオブロックのピクセル値から予測ブロックのピクセル値を減算し、ピクセル差分値を形成することによって残差ビデオブロックを形成する。ピクセル差分値は、ブロックの残差データを形成し、ルーマ差分成分とクロマ差分成分の両方を含み得る。加算器50は、この減算演算を実施する1つまたは複数の構成要素を表す。動き補償ユニット44はまた、ビデオスライスのビデオブロックを復号する際にビデオデコーダ30が使用するための、ビデオブロックとビデオスライスとに関連するシンタックス要素を生成し得る。
イントラ予測モジュール46は、上記で説明したように、動き推定ユニット42と動き補償ユニット44とによって実施されるインター予測の代替として、現在ブロックをイントラ予測し得る。特に、イントラ予測モジュール46は、現在ブロックを符号化するために使用すべきイントラ予測モードを判断し得る。いくつかの例では、イントラ予測モジュール46は、たとえば、別々の符号化パス中に、様々なイントラ予測モードを使用して現在ブロックを符号化し得、イントラ予測モジュール46(または、いくつかの例では、モード選択ユニット40)は、テストされたモードから使用するのに適切なイントラ予測モードを選択し得る。たとえば、イントラ予測モジュール46は、様々なテストされたイントラ予測モードのためのレートひずみ分析を使用してレートひずみ値を計算し、テストされたモードの中で最良のレートひずみ特性を有するイントラ予測モードを選択し得る。レートひずみ分析は、概して、符号化ブロックと、符号化ブロックを生成するために符号化された元の符号化されていないブロックとの間のひずみ(または誤差)の量、ならびに符号化ブロックを生成するために使用されるビットレート(すなわち、ビット数)を判断する。イントラ予測モジュール46は、どのイントラ予測モードがブロックについて最良のレートひずみ値を呈するかを判断するために、様々な符号化ブロックについてのひずみおよびレートから比率を計算し得る。
ブロック用のイントラ予測モードを選択した後、イントラ予測モジュール46は、ブロック用に選択されたイントラ予測モードを示す情報を、エントロピー符号化ユニット56に提供することができる。エントロピー符号化ユニット56は、本開示の技法に従って選択されたイントラ予測モードを示す情報を符号化し得る。ビデオエンコーダ20は、送信ビットストリーム中に、複数のイントラ予測モードインデックステーブルおよび複数の変更されたイントラ予測モードインデックステーブル(コードワードマッピングテーブルとも呼ばれる)と、様々なブロックの符号化コンテキストの定義と、コンテキストの各々について使用すべき、最確イントラ予測モード、イントラ予測モードインデックステーブル、および変更されたイントラ予測モードインデックステーブルの指示とを含み得る構成データを含み得る。
予測モジュール41が、インター予測またはイントラ予測のいずれかを介して、現在ビデオブロックのための予測ブロックを生成した後、ビデオエンコーダ20は、現在ビデオブロックから予測ブロックを減算することによって残差ビデオブロックを形成する。残差ブロック中の残差ビデオデータは、1つまたは複数のTU中に含まれ、変換モジュール52に適用され得る。変換モジュール52は、離散コサイン変換(DCT)または概念的に同様の変換などの変換を使用して、残差ビデオデータを残差変換係数に変換する。変換モジュール52は、残差ビデオデータをピクセル領域から周波数領域などの変換領域に変換し得る。
変換モジュール52は、得られた変換係数を量子化ユニット54に送り得る。量子化ユニット54は、ビットレートをさらに低減するために変換係数を量子化する。量子化プロセスは、係数の一部または全部に関連するビット深度を低減し得る。量子化の程度は、量子化パラメータを調整することによって変更され得る。いくつかの例では、量子化ユニット54は、次いで、量子化変換係数を含む行列の走査を実施し得る。代替的に、エントロピー符号化ユニット56が走査を実施し得る。
量子化の後、エントロピー符号化ユニット56は、量子化変換係数をエントロピー符号化する。たとえば、エントロピー符号化ユニット56は、コンテキスト適応型可変長コーディング(CAVLC)、コンテキスト適応型バイナリ算術コーディング(CABAC)、シンタックスベースコンテキスト適応型バイナリ算術コーディング(SBAC)、確率間隔区分エントロピー(PIPE)コーディングまたは別のエントロピー符号化方法または技法を実施し得る。エントロピー符号化ユニット56によるエントロピー符号化の後に、符号化ビットストリームは、ビデオデコーダ30に送信されるか、あるいはビデオデコーダ30が後で送信するかまたは取り出すためにアーカイブされ得る。エントロピー符号化ユニット56はまた、コーディングされている現在ビデオスライスのための動きベクトルと他のシンタックス要素とをエントロピー符号化し得る。
逆量子化ユニット58および逆変換モジュール60は、それぞれ逆量子化および逆変換を適用して、参照ピクチャの参照ブロックとして後で使用するためにピクセル領域において残差ブロックを再構成する。動き補償ユニット44は、残差ブロックを参照ピクチャリストのうちの1つ内の参照ピクチャのうちの1つの予測ブロックに加算することによって参照ブロックを計算し得る。動き補償ユニット44はまた、再構成された残差ブロックに1つまたは複数の補間フィルタを適用して、動き推定において使用するためのサブ整数ピクセル値を計算し得る。加算器62は、再構成された残差ブロックを動き補償ユニット44によって生成された動き補償予測ブロックに加算して、復号ピクチャバッファ64に記憶するための参照ブロックを生成する。参照ブロックは、後続のビデオフレームまたはピクチャ中のブロックをインター予測するために、動き推定ユニット42および動き補償ユニット44によって参照ブロックとして使用され得る。
本開示によると、予測モジュール41は、上述した例示的機能を実施するための1つの例示的ユニットを表す。たとえば、予測モジュール41は、ビデオエンコーダ20に、ビデオデコーダ30が非IDR RAPピクチャにおけるランダムアクセスを実装することを可能にする非IDR RAPピクチャについての完全POC値を符号化させることができる。別の例として、予測モジュール41は、ビデオエンコーダ20に、フラグの値に基づいて、テーブル5および6のシンタックス要素中で信号を符号化させることができる。さらに別の例として、予測モジュール41は、復号ピクチャが出力に必要とされるかどうか、復号ピクチャが参照ピクチャセットに含まれるかどうか、および復号ピクチャについてのtemporal_id値が現在のピクチャのtemporal_id値以下であるかどうかに基づいて、どの復号ピクチャを復号ピクチャバッファ64から削除してよいか判断することができる。
他の例では、予測モジュール41以外のユニットが上述の例を実装し得る。いくつかの他の例では、予測モジュール41は、ビデオエンコーダ20の1つまたは複数の他のユニットとともに、上述した例を実装することができる。さらにいくつかの他の例では、ビデオエンコーダ20のプロセッサまたはユニット(図2には図示せず)は、単独で、またはビデオエンコーダ20の他のユニットとともに、上述した例を実装することができる。
図3は、本開示で説明する技法を実装し得る例示的なビデオデコーダ30を示すブロック図である。図3の例では、ビデオデコーダ30は、エントロピー復号ユニット80と、予測モジュール81と、逆量子化ユニット86と、逆変換ユニット88と、加算器90と、復号ピクチャバッファ(DPB)92とを含む。予測モジュール81は、動き補償ユニット82と、イントラ予測モジュール84とを含む。ビデオデコーダ30は、いくつかの例では、図2のビデオエンコーダ20に関して説明した符号化パスとは概して逆の復号パスを実施し得る。
復号プロセス中に、ビデオデコーダ30は、ビデオエンコーダ20から、符号化ビデオスライスのビデオブロックと、関連するシンタックス要素とを表す符号化ビデオビットストリームを受信する。ビデオデコーダ30のエントロピー復号ユニット80は、量子化係数と、動きベクトルと、他のシンタックス要素とを生成するためにビットストリームをエントロピー復号する。エントロピー復号ユニット80は、予測モジュール81に動きベクトルと他のシンタックス要素とを転送する。ビデオデコーダ30は、ビデオスライスレベルおよび/またはビデオブロックレベルでシンタックス要素を受信し得る。
ビデオスライスがイントラコード化(I)スライスとしてコーディングされるとき、予測モジュール81のイントラ予測モジュール84は、シグナリングされたイントラ予測モードと、現在ピクチャの、前に復号されたブロックからのデータとに基づいて、現在ビデオスライスのビデオブロックのための予測データを生成し得る。ビデオピクチャがインターコード化(すなわち、B、またはP)スライスとしてコーディングされるとき、予測モジュール81の動き補償ユニット82は、エントロピー復号ユニット80から受信された動きベクトルおよび他のシンタックス要素に基づいて、現在ビデオスライスのビデオブロックのための予測ブロックを生成する。予測ブロックは、参照ピクチャリストのうちの1つ内の参照ピクチャのうちの1つから生成され得る。ビデオデコーダ30は、復号ピクチャバッファ92に記憶された参照ピクチャに基づいて、デフォルトの構成技法を使用して、参照フレームリスト、すなわち、リスト0およびリスト1を構成し得る。いくつかの例では、ビデオデコーダ30は、導出された参照ピクチャセット中で識別された参照ピクチャから、リスト0とリスト1とを構成することができる。
動き補償ユニット82は、動きベクトルと他のシンタックス要素とを解析することによって現在ビデオスライスのビデオブロックについての予測情報を判断し、予測情報を使用して、復号されている現在ビデオブロックのための予測ブロックを生成する。たとえば、動き補償ユニット82は、ビデオスライスのビデオブロックをコーディングするために使用される予測モード(たとえば、イントラまたはインター予測)と、インター予測スライスタイプ(たとえば、BスライスまたはPスライス)と、スライスの参照ピクチャリストのうちの1つまたは複数についての構成情報と、スライスの各インター符号化ビデオブロックについての動きベクトルと、スライスの各インターコード化ビデオブロックについてのインター予測ステータスと、現在ビデオスライス中のビデオブロックを復号するための他の情報とを判断するために、受信されたシンタックス要素のいくつかを使用する。
動き補償ユニット82はまた、補間フィルタに基づいて補間を実施し得る。動き補償ユニット82は、ビデオブロックの符号化中にビデオ符号器20によって使用される補間フィルタを使用して、参照ブロックのサブ整数ピクセルの補間値を計算し得る。この場合、動き補償ユニット82は、受信されたシンタックス要素からビデオ符号器20によって使用された補間フィルタを判断し、その補間フィルタを使用して予測ブロックを生成し得る。
逆量子化ユニット86は、ビットストリーム中で与えられ、エントロピー復号ユニット80によって復号された、量子化変換係数を逆量子化(inverse quantize)、すなわち、逆量子化(de-quantize)する。逆量子化プロセスは、ビデオスライス中の各ビデオブロックについてビデオエンコーダ20によって計算される量子化パラメータを使用して量子化の程度を判断し、同様に、適用すべき逆量子化の程度を判断することを含み得る。逆変換モジュール88は、ピクセル領域において残差ブロックを生成するために、逆変換、たとえば、逆DCT、逆整数変換、または概念的に同様の逆変換プロセスを変換係数に適用する。
予測モジュール81が、インター予測またはイントラ予測のいずれかに基づいて現在ビデオブロックのための予測ブロックを生成した後、ビデオデコーダ30は、逆変換モジュール88からの残差ブロックを予測モジュール81によって生成された対応する予測ブロックと加算することによって、復号ビデオブロックを形成する。加算器90は、この加算演算を実施する1つまたは複数の構成要素を表す。所望される場合、ブロッキネスアーティファクトを除去するために、復号されたブロックをフィルタ処理するためにデブロッキングフィルタも適用され得る。ピクセル遷移を平滑化するか、またはさもなければビデオ品質を改善するために、(コーディングループ内またはコーディングループ後の)他のループフィルタも使用され得る。次いで、所与のピクチャ内の復号されたビデオブロックは、その後の動き補償に使用される参照ピクチャを記憶する復号ピクチャバッファ92に記憶される。復号ピクチャバッファ92はまた、図1のディスプレイデバイス32などのディスプレイデバイス上での後の表示のための、復号されたビデオを記憶する。
本開示によると、予測モジュール81は、上述した例示的機能を実施するための1つの例示的ユニットを表す。たとえば、予測モジュール81は、非IDR RAPピクチャの完全POC値に基づいて、非RAPピクチャについての完全POC値を判断することができ、ビデオデコーダ30が非IDR RAPピクチャにおけるランダムアクセスを実施できるようにする。別の例として、予測モジュール81は、テーブル5および6のフラグの値に基づいて、現在のピクチャをインター予測するためにどの長期参照ピクチャを使うことができるか判断することができる。さらに別の例として、予測モジュール81は、復号ピクチャが出力に必要とされるかどうか、復号ピクチャが参照ピクチャセットに含まれるかどうか、および復号ピクチャについてのtemporal_id値が現在のピクチャのtemporal_id値以下であるかどうかに基づいて、どの復号ピクチャを復号ピクチャバッファ92から削除してよいか判断することができる。
他の例では、予測モジュール81以外のユニットが上述の例を実装し得る。いくつかの他の例では、予測モジュール81は、ビデオデコーダ30の1つまたは複数の他のユニットとともに、上述した例を実装することができる。さらにいくつかの他の例では、ビデオデコーダ30のプロセッサまたはユニット(図3には図示せず)は、単独で、またはビデオデコーダ30の他のユニットとともに、上述した例を実装することができる。
図4は、本開示の1つまたは複数の態様による例示的な動作を示すフローチャートである。説明のためにのみ、図4の方法は、ビデオエンコーダ20またはビデオデコーダ30のいずれかに対応するビデオコーダによって実施することができる。
ビデオコーダは、非IDR RAPピクチャについての完全識別子値(たとえば、完全POC値)をコーディングすることができる(94)。ビデオコーダは、完全POC値のMSBとLSBとを一緒にコーディングしてもよく、完全POC値のMSBとLSBとを別個にコーディングしてもよい。非IDR RAPピクチャの例には、GDR、CRA、およびBLAピクチャがある。
ビデオコーダは、第1の非RAPピクチャについての部分的識別子値をコーディングすることができる(96)。第1の非RAPピクチャは、復号順で非IDR RAPピクチャの後に続き得る。部分的識別子値は、完全POC値のLSBなど、第1の非RAPピクチャの完全POC値の部分であってよい。
ビデオコーダは、第1の非RAPピクチャの完全識別子値に基づいて、第2の非RAPピクチャをインター予測することができる(98)。たとえば、ビデオコーダは、第1の非RAPピクチャの完全識別子値に基づいて、第1の非RAPピクチャが、第2の非RAPピクチャをインター予測するために使われる予定であると判断することができる。第2の非RAPピクチャは、復号順で第1の非RAPピクチャの後に続き得る。
図5は、本開示の1つまたは複数の態様による別の例示的な動作を示すフローチャートである。説明のためにのみ、図5の方法は、ビデオデコーダ30などのビデオコーダに対応するビデオコーダによって実施することができる。ビデオコーダは、インター予測に使うことができる参照ピクチャについての完全識別子値をコーディングすることができる(100)。たとえば、ビデオコーダは、インター予測に使うことができる長期参照ピクチャについての完全POC値を、ピクチャパラメータセットなどのパラメータセット中でコーディングすればよい。
いくつかの例では、ビデオコーダは、非RAPピクチャについての部分的識別子値と、非IDR RAPピクチャについての完全識別子値とを受信するだけでよい。これらの例では、ビデオコーダは、非IDR RAPピクチャについての完全識別子値と、非RAPピクチャについての部分的識別子値とに基づいて、非RAPピクチャについての完全識別子値を判断することができる(102)。ビデオコーダは、非RAPピクチャについての完全識別子値が参照ピクチャに関して同じであるかどうか判断することができる(104)。同じであるとき、ビデオコーダは、非RAPピクチャを参照ピクチャサブセットに含めてよい(106)。
図6は、本開示の1つまたは複数の態様による別の例示的な動作を示すフローチャートである。説明のためにのみ、図6の方法は、ビデオエンコーダ20またはビデオデコーダ30のいずれかに対応するビデオコーダによって実施することができる。
ビデオコーダは、長期ピクチャが現在のピクチャと復号順で現在のピクチャに続くピクチャとをインター予測するために使われ得るかどうかを示す第1のフラグ(たとえば、long_term_not_used_flag)についての値をコーディングすることができる(108)。ビデオコーダは、第1のフラグが真であるかどうか判断することができる(110)。
真のとき(110の「YES」)、ビデオコーダは、短期参照ピクチャのみを使って、現在のピクチャをインター予測することができる(112)。偽(110の「NO」)のとき、パラメータセット中で指定されたすべての長期参照ピクチャが現在のピクチャの予測に使われ得るかどうかと、パラメータセット中で指示されないとともに、復号順で現在のピクチャに先立つ長期参照ピクチャが、〆在のピクチャまたは復号順で現在のピクチャに続くピクチャのインター予測に使われ得るかどうかとを示す第2のフラグ(たとえば、long_term_reuse_pps_flag)の値をコーディングする。
ビデオコーダは、第2のフラグが真であるかどうか判断することができる(116)。偽(116の「NO」)のとき、ビデオコーダは、指定された長期参照ピクチャについてのパラメータセット中へのコード化索引(たとえば、パラメータセット中で指定された候補長期参照ピクチャリスト中への索引)に基づいて、長期参照ピクチャサブセットを構成することができる(118)。真(116の「YES」)のとき、ビデオコーダは、パラメータセット中への索引をコーディングすることなく(たとえば、パラメータセット中で指定された候補長期参照ピクチャリスト中への索引をコーディングすることなく)、長期参照ピクチャサブセットを構成することができる(120)。
図7は、本開示の1つまたは複数の態様による別の例示的な動作を示すフローチャートである。説明のためにのみ、図7の方法は、ビデオエンコーダ20またはビデオデコーダ30のいずれかに対応するビデオコーダによって実施することができる。
ビデオコーダは、パラメータセット中で指定されたすべての長期ピクチャが現在のピクチャのインター予測に使われ得るかどうかを示す第1のフラグ(たとえば、long_term_pps_curr_flag)の値をコーディングすることができる(122)。ビデオコーダは、第1のフラグが真であるかどうか判断することができる(124)。
真(124の「YES」)のとき、ビデオコーダは、指定された長期参照ピクチャについてのパラメータセット中への索引をコーディングすることなく、現在のピクチャをインター予測することができる(126)。偽(124の「NO」)のとき、ビデオコーダは、どの長期参照ピクチャも現在のピクチャのインター予測に使われないかどうかと、パラメータセット中で指定されたすべての長期参照ピクチャがインター予測に使われ得るかどうかとを示す第2のフラグ(たとえば、long_term_pps_foll_flag)の値をコーディングすればよい(128)。
ビデオコーダは、第2のフラグが真であるかどうか判断することができる(130)。偽(130の「NO」)のとき、ビデオコーダは、パラメータセット中へのコード化索引に基づいて、長期参照ピクチャサブセットを構成することができる(132)。真(130の「YES」)のとき、ビデオコーダは、パラメータセット中で指定されたピクチャを使わず、パラメータセット中で指定されないピクチャを使ってインター予測することができる(134)。
図8は、本開示の1つまたは複数の態様による別の例示的な動作を示すフローチャートである。説明のためにのみ、図8の方法は、ビデオエンコーダ20またはビデオデコーダ30のいずれかに対応するビデオコーダによって実施することができる。
ビデオコーダは、現在のピクチャ用の参照ピクチャセットを導出することができる(138)。ビデオコーダは、DPBに記憶された1つまたは複数の復号ピクチャが出力に必要とされず(140)、1つまたは複数の復号ピクチャが参照ピクチャセット中になく(142、1つまたは複数のピクチャについての時間的識別(temporal_id)値が現在のピクチャのtemporal_id以下であると判断することができる(144)。この場合、ビデオコーダは、1つまたは複数のピクチャをDPBから削除してよい(146)。
1つまたは複数の例では、説明された機能は、ハードウェア、ソフトウェア、ファームウェア、またはそれらの任意の組合せで実装され得る。各機能は、ソフトウェアで実装される場合、1つまたは複数の命令またはコードとしてコンピュータ可読媒体上に記憶されてよく、あるいはコンピュータ可読媒体を介して送信され、ハードウェアベースの処理ユニットによって実行されてよい。コンピュータ可読媒体は、たとえば、通信プロトコルに従って、ある場所から別の場所へのコンピュータプログラムの転送を可能にする任意の媒体を含む、データ記憶媒体または通信媒体などの有形媒体に対応するコンピュータ可読記憶媒体を含み得る。このようにして、コンピュータ可読媒体は、概して、(1)非一時的である有形コンピュータ可読記憶媒体、あるいは(2)信号または搬送波などの通信媒体に対応し得る。データ記憶媒体は、本開示で説明した技法の実装のための命令、コードおよび/またはデータ構造を取り出すために1つまたは複数のコンピュータあるいは1つまたは複数のプロセッサによってアクセスされ得る任意の利用可能な媒体であり得る。コンピュータプログラム製品は、コンピュータ可読媒体を含み得る。
限定ではなく例として、そのようなコンピュータ可読記憶媒体は、RAM、ROM、EEPROM(登録商標)、CD−ROMまたは他の光ディスクストレージ、磁気ディスクストレージ、または他の磁気ストレージデバイス、フラッシュメモリ、あるいは命令またはデータ構造の形態の所望のプログラムコードを記憶するために使用され得、コンピュータによってアクセスされ得る、任意の他の媒体を備えることができる。また、いかなる接続もコンピュータ可読媒体と適切に呼ばれる。たとえば、命令が、同軸ケーブル、光ファイバーケーブル、ツイストペア、デジタル加入者回線(DSL)、または赤外線、無線、およびマイクロ波などのワイヤレス技術を使用して、ウェブサイト、サーバ、または他のリモートソースから送信される場合、同軸ケーブル、光ファイバーケーブル、ツイストペア、DSL、または赤外線、無線、およびマイクロ波などのワイヤレス技術は、媒体の定義に含まれる。ただし、コンピュータ可読記憶媒体およびデータ記憶媒体は、接続、搬送波、信号、または他の一時媒体を含まないが、代わりに非一時的有形記憶媒体を対象とすることを理解されたい。本明細書で使用するディスク(disk)およびディスク(disc)は、コンパクトディスク(disc)(CD)、レーザディスク(disc)、光ディスク(disc)、デジタル多用途ディスク(disc)(DVD)、フロッピー(登録商標)ディスク(disk)およびブルーレイディスク(disc)を含み、ディスク(disk)は、通常、データを磁気的に再生し、ディスク(disc)は、データをレーザで光学的に再生する。上記の組合せもコンピュータ可読媒体の範囲内に含めるべきである。
命令は、1つまたは複数のデジタル信号プロセッサ(DSP)などの1つまたは複数のプロセッサ、汎用マイクロプロセッサ、特定用途向け集積回路(ASIC)、フィールドプログラマブル論理アレイ(FPGA)、あるいは他の等価な集積回路またはディスクリート論理回路によって実行され得る。したがって、本明細書で使用する「プロセッサ」という用語は、前述の構造、または本明細書で説明する技法の実装に好適な他の構造のいずれかを指す。さらに、いくつかの態様では、本明細書で説明した機能は、符号化および復号のために構成された専用のハードウェアおよび/またはソフトウェアモジュール内に与えられ得、あるいは複合コーデックに組み込まれ得る。また、本技法は、1つまたは複数の回路または論理要素中に十分に実装され得る。
本開示の技法は、ワイヤレスハンドセット、集積回路(IC)、またはICのセット(たとえば、チップセット)を含む、多種多様なデバイスまたは装置において実装され得る。本開示では、開示する技法を実行するように構成されたデバイスの機能的態様を強調するために様々な構成要素、モジュール、またはユニットについて説明したが、それらの構成要素、モジュール、またはユニットを、必ずしも異なるハードウェアユニットによって実現する必要があるとは限らない。むしろ、上記で説明したように、様々なユニットが、好適なソフトウェアおよび/またはファームウェアとともに、上記で説明した1つまたは複数のプロセッサを含めて、コーデックハードウェアユニットにおいて組み合わせられるか、または相互動作ハードウェアユニットの集合によって与えられ得る。
様々な例について説明した。これらおよび他の例は以下の特許請求の範囲内に入る。

Claims (41)

  1. ビデオデータをコーディングするための方法であって、
    瞬時デコーダリフレッシュ(IDR)ピクチャではないランダムアクセスポイント(RAP)ピクチャについての完全識別子値をコーディングすることと、
    前記RAPピクチャについての前記完全識別子値に基づいて、非RAPピクチャについての部分的識別子値をコーディングすることであって、前記部分的識別子値が、前記非RAPピクチャについての完全識別子値の一部分を表す、コーディングすることとを備える方法。
  2. 復号順で前記RAPピクチャに続く非RAPピクチャに対して、前記RAPピクチャの前記完全識別子値に基づいて、前記非RAPピクチャをインター予測するために使うことができる参照ピクチャを識別することをさらに備える、請求項1に記載の方法。
  3. 前記完全識別子値をコーディングすることが、前記RAPピクチャについての完全ピクチャオーダーカウント(POC)値をコーディングすることを備える、請求項1に記載の方法。
  4. 前記完全識別子値をコーディングすることが、前記RAPピクチャについての完全ピクチャオーダーカウント(POC)値の最上位ビット(MSB)部分と、前記RAPピクチャについての前記完全POC値の最下位ビット(LSB)部分とを別個にコーディングすることを備える、請求項1に記載の方法。
  5. 前記RAPピクチャが、クリーンランダムアクセス(CRA)ピクチャ、リンク切断アクセス(BLA)ピクチャ、および漸進的復号リフレッシュ(GDR)ピクチャのうちの1つを備える、請求項1に記載の方法。
  6. フラグの値を、スライスを含む現在のピクチャについての前記スライスのヘッダ中でコーディングすることをさらに備え、
    前記フラグの前記値が第1の値であるとき、どの長期参照ピクチャも前記現在のピクチャのインター予測に使うことができず、どの長期参照ピクチャも、復号順で前記現在のピクチャに続くピクチャのインター予測に使うことができず、
    前記フラグの前記値が第2の値であるとき、1つまたは複数の長期参照ピクチャを前記現在のピクチャのインター予測に使うことができ、復号順で前記現在のピクチャに続く前記ピクチャのインター予測に使うことができる、請求項1に記載の方法。
  7. フラグの値を、スライスを含む現在のピクチャについての前記スライスのヘッダ中でコーディングすることをさらに備え、
    前記フラグの前記値が第1の値であるとき、パラメータセット中で指定されたすべての長期参照ピクチャを、前記現在のピクチャのインター予測に使うことができ、前記パラメータセット中で指定されないとともに復号順で前記現在のピクチャに先立つ長期参照ピクチャを、前記現在のピクチャおよび復号順で前記現在のピクチャに続くピクチャのインター予測に使うことができず、
    前記フラグの前記値が第2の値であるとき、パラメータセット中で指定された前記長期参照ピクチャすべてが、前記現在のピクチャのインター予測に使うことができるわけではなく、前記パラメータセット中で指定されないとともに復号順で前記現在のピクチャに先立つ長期参照ピクチャを、前記現在のピクチャおよび復号順で前記現在のピクチャに続くピクチャのインター予測に使うことができる、請求項1に記載の方法。
  8. 前記フラグの前記値が前記第1の値であるとき、
    前記パラメータセット中で指定された長期参照ピクチャを識別する、前記パラメータセット中への索引をコーディングすることなく、参照ピクチャセットの長期参照ピクチャサブセットを構成することをさらに備え、
    前記長期参照ピクチャサブセットを構成することが、前記パラメータセット中で指定された前記長期参照ピクチャすべてを前記参照ピクチャサブセットに含めることを備える、請求項7に記載の方法。
  9. フラグの値を、スライスを含む現在のピクチャについての前記スライスのヘッダ中でコーディングすることをさらに備え、
    前記フラグの前記値が第1の値であるとき、パラメータセット中で指定されたすべての長期参照ピクチャを、前記現在のピクチャのインター予測に使うことができ、
    前記フラグの前記値が第2の値であるとき、前記パラメータセット中で指定された前記長期参照ピクチャすべてを前記現在のピクチャのインター予測に使うことができるわけではない、請求項1に記載の方法。
  10. フラグの値を、スライスを含む現在のピクチャについての前記スライスのヘッダ中でコーディングすることをさらに備え、
    前記フラグの前記値が第1の値であるとき、どの長期参照ピクチャも前記現在のピクチャのインター予測に使うことができず、パラメータセット中で指定されたすべての長期参照ピクチャを、復号順で前記現在のピクチャに続くピクチャのインター予測に使うことができ、
    前記フラグの前記値が第2の値であるとき、前記長期参照ピクチャのうちの1つまたは複数を前記現在のピクチャのインター予測に使うことができ、前記パラメータセット中で指定された前記長期参照ピクチャのすべてを、復号順で前記現在のピクチャに続くピクチャのインター予測に使うことができるわけではない、請求項1に記載の方法。
  11. 現在のピクチャについての参照ピクチャセットを導出することと、
    現在のピクチャの時間的識別値を判断することと、
    前記現在のピクチャの前記時間的識別値以下の時間的識別値を有するとともに前記参照ピクチャセット中で識別されない1つまたは複数のピクチャを、復号ピクチャバッファ(DPB)から削除することとをさらに備え、
    時間的識別値が前記現在のピクチャの前記時間的識別値以下である、前記参照ピクチャセット中で識別された1つまたは複数のピクチャに関して、前記現在のピクチャをインター予測することができる、請求項1に記載の方法。
  12. 前記1つまたは複数のピクチャが出力に必要とされないと判断することをさらに備え、
    前記1つまたは複数のピクチャを削除することが、前記参照ピクチャセット中で識別されないとともに出力に必要とされない、前記現在のピクチャの前記時間的識別値以下の時間的識別値を有する前記1つまたは複数のピクチャを、DPBから削除することを備える、請求項11に記載の方法。
  13. 前記1つまたは複数のピクチャを削除することが、前記現在のピクチャをインター予測するのに先立って、前記1つまたは複数のピクチャを削除することを備える、請求項11に記載の方法。
  14. ビデオデータをコーディングするためのデバイスであって、
    瞬時デコーダリフレッシュ(IDR)ピクチャではないランダムアクセスポイント(RAP)ピクチャについての完全識別子値をコーディングすることと、
    前記RAPピクチャについての前記完全識別子値に基づいて、非RAPピクチャについての部分的識別子値をコーディングすることであって、前記部分的識別子値が、前記非RAPピクチャについての完全識別子値の一部分を表す、コーディングすることとを行うように構成されたビデオコーダを備える、デバイス。
  15. 復号順で前記RAPピクチャに続く非RAPピクチャに対して、前記ビデオコーダが、
    前記RAPピクチャの前記完全識別子値に基づいて、前記非RAPピクチャをインター予測するために使うことができる参照ピクチャを識別するように構成される、請求項14に記載のデバイス。
  16. 前記完全識別子値をコーディングするために、前記ビデオコーダが、前記RAPピクチャについての完全ピクチャオーダーカウント(POC)値をコーディングするように構成される、請求項14に記載のデバイス。
  17. 前記完全識別子値をコーディングするために、前記ビデオコーダが、前記RAPピクチャについての完全ピクチャオーダーカウント(POC)値の最上位ビット(MSB)部分と、前記RAPピクチャについての前記完全POC値の最下位ビット(LSB)部分とをコーディングするように構成される、請求項14に記載のデバイス。
  18. 前記RAPピクチャが、クリーンランダムアクセス(CRA)ピクチャ、リンク切断アクセス(BLA)ピクチャ、および漸進的復号リフレッシュ(GDR)ピクチャのうちの1つを備える、請求項14に記載のデバイス。
  19. 前記ビデオコーダが、
    フラグの値を、スライスを含む現在のピクチャについての前記スライスのヘッダ中でコーディングするようにさらに構成され、
    前記フラグの前記値が第1の値であるとき、どの長期参照ピクチャも前記現在のピクチャのインター予測に使うことができず、どの長期参照ピクチャも、復号順で前記現在のピクチャに続くピクチャのインター予測に使うことができず、
    前記フラグの前記値が第2の値であるとき、1つまたは複数の長期参照ピクチャを前記現在のピクチャのインター予測に使うことができ、復号順で前記現在のピクチャに続く前記ピクチャのインター予測に使うことができる、請求項14に記載のデバイス。
  20. 前記ビデオコーダが、
    フラグの値を、スライスを含む現在のピクチャについての前記スライスのヘッダ中でコーディングするようにさらに構成され、
    前記フラグの前記値が第1の値であるとき、パラメータセット中で指定されたすべての長期参照ピクチャを、前記現在のピクチャのインター予測に使うことができ、前記パラメータセット中で指定されないとともに復号順で前記現在のピクチャに先立つ長期参照ピクチャを、前記現在のピクチャおよび復号順で前記現在のピクチャに続くピクチャのインター予測に使うことができず、
    前記フラグの前記値が第2の値であるとき、パラメータセット中で指定された前記長期参照ピクチャすべてが、前記現在のピクチャのインター予測に使うことができるわけではなく、前記パラメータセット中で指定されないとともに復号順で前記現在のピクチャに先立つ長期参照ピクチャを、前記現在のピクチャおよび復号順で前記現在のピクチャに続くピクチャのインター予測に使うことができる、請求項14に記載のデバイス。
  21. 前記フラグの前記値が前記第1の値であるとき、前記ビデオコーダが、
    前記パラメータセット中で指定された長期参照ピクチャを識別する、前記パラメータセット中への索引をコーディングすることなく、参照ピクチャセットの長期参照ピクチャサブセットを構成するようにさらに構成され、
    前記長期参照ピクチャサブセットを構成するために、前記ビデオコーダが、前記パラメータセット中で指定された前記長期参照ピクチャすべてを前記参照ピクチャサブセットに含めるように構成される、請求項20に記載のデバイス。
  22. 前記ビデオコーダが、
    フラグの値を、スライスを含む現在のピクチャについての前記スライスのヘッダ中でコーディングするようにさらに構成され、
    前記フラグの前記値が第1の値であるとき、パラメータセット中で指定されたすべての長期参照ピクチャを、前記現在のピクチャのインター予測に使うことができ、
    前記フラグの前記値が第2の値であるとき、前記パラメータセット中で指定された前記長期参照ピクチャすべてを前記現在のピクチャのインター予測に使うことができるわけではない、請求項14に記載のデバイス。
  23. 前記ビデオコーダが、
    フラグの値を、スライスを含む現在のピクチャについての前記スライスのヘッダ中でコーディングするようにさらに構成され、
    前記フラグの前記値が第1の値であるとき、どの長期参照ピクチャも前記現在のピクチャのインター予測に使うことができず、パラメータセット中で指定されたすべての長期参照ピクチャを、復号順で前記現在のピクチャに続くピクチャのインター予測に使うことができ、
    前記フラグの前記値が第2の値であるとき、前記長期参照ピクチャのうちの1つまたは複数を前記現在のピクチャのインター予測に使うことができ、前記パラメータセット中で指定された前記長期参照ピクチャのすべてを、復号順で前記現在のピクチャに続くピクチャのインター予測に使うことができるわけではない、請求項14に記載のデバイス。
  24. 前記ビデオコーダが、
    現在のピクチャについての参照ピクチャセットを導出し、
    現在のピクチャの時間的識別値を判断し、
    前記現在のピクチャの前記時間的識別値以下の時間的識別値を有するとともに前記参照ピクチャセット中で識別されない1つまたは複数のピクチャを、復号ピクチャバッファ(DPB)から削除するようにさらに構成され、
    時間的識別値が前記現在のピクチャの前記時間的識別値以下である、前記参照ピクチャセット中で識別された1つまたは複数のピクチャに関して、前記現在のピクチャをインター予測することができる、請求項14に記載のデバイス。
  25. 前記ビデオコーダが、
    前記1つまたは複数のピクチャが出力に必要とされないと判断するようにさらに構成され、
    前記ビデオコーダが、前記参照ピクチャセット中で識別されないとともに出力に必要とされない、前記現在のピクチャの前記時間的識別値以下の時間的識別値を有する前記1つまたは複数のピクチャを、DPBから削除するように構成される、請求項24に記載のデバイス。
  26. 前記1つまたは複数のピクチャを削除するために、前記ビデオコーダが、前記現在のピクチャをインター予測するのに先立って前記1つまたは複数のピクチャを削除するように構成される、請求項24に記載のデバイス。
  27. 前記ビデオコーダがビデオデコーダを備える、請求項14に記載のデバイス。
  28. 前記ビデオコーダがビデオエンコーダを備える、請求項14に記載のデバイス。
  29. ワイヤレス通信デバイス、
    マイクロプロセッサ、および
    集積回路のうちの1つを備える、請求項14に記載のデバイス。
  30. 命令を記憶したコンピュータ可読記憶媒体であって、前記命令が、実行されると、ビデオデータをコーディングするためのデバイスのプロセッサに、
    瞬時デコーダリフレッシュ(IDR)ピクチャではないランダムアクセスポイント(RAP)ピクチャについての完全識別子値をコーディングすることと、
    前記RAPピクチャについての前記完全識別子値に基づいて、部分的識別子値をコーディングすることであって、前記部分的識別子値が、前記非RAPピクチャについての完全識別子値の一部分を表す、コーディングすることとを行わせる、コンピュータ可読記憶媒体。
  31. 前記プロセッサに、
    フラグの値を、スライスを含む現在のピクチャについての前記スライスのヘッダ中でコーディングさせる命令をさらに備え、
    前記フラグの前記値が第1の値であるとき、どの長期参照ピクチャも前記現在のピクチャのインター予測に使うことができず、どの長期参照ピクチャも、復号順で前記現在のピクチャに続くピクチャのインター予測に使うことができず、
    前記フラグの前記値が第2の値であるとき、1つまたは複数の長期参照ピクチャを前記現在のピクチャのインター予測に使うことができ、復号順で前記現在のピクチャに続く前記ピクチャのインター予測に使うことができる、請求項30に記載のコンピュータ可読記憶媒体。
  32. 前記プロセッサに、
    フラグの値を、スライスを含む現在のピクチャについての前記スライスのヘッダ中でコーディングさせる命令をさらに備え、
    前記フラグの前記値が第1の値であるとき、パラメータセット中で指定されたすべての長期参照ピクチャを、前記現在のピクチャのインター予測に使うことができ、前記パラメータセット中で指定されないとともに復号順で前記現在のピクチャに先立つ長期参照ピクチャを、前記現在のピクチャおよび復号順で前記現在のピクチャに続くピクチャのインター予測に使うことができず、
    前記フラグの前記値が第2の値であるとき、パラメータセット中で指定された前記長期参照ピクチャすべてが、前記現在のピクチャのインター予測に使うことができるわけではなく、前記パラメータセット中で指定されないとともに復号順で前記現在のピクチャに先立つ長期参照ピクチャを、前記現在のピクチャおよび復号順で前記現在のピクチャに続くピクチャのインター予測に使うことができる、請求項30に記載のコンピュータ可読記憶媒体。
  33. 前記プロセッサに、
    フラグの値を、スライスを含む現在のピクチャについての前記スライスのヘッダ中でコーディングさせる命令をさらに備え、
    前記フラグの前記値が第1の値であるとき、パラメータセット中で指定されたすべての長期参照ピクチャを、前記現在のピクチャのインター予測に使うことができ、
    前記フラグの前記値が第2の値であるとき、前記パラメータセット中で指定された前記長期参照ピクチャすべてを前記現在のピクチャのインター予測に使うことができるわけではない、請求項30に記載のコンピュータ可読記憶媒体。
  34. 前記プロセッサに、
    フラグの値を、スライスを含む現在のピクチャについての前記スライスのヘッダ中でコーディングさせる命令をさらに備え、
    前記フラグの前記値が第1の値であるとき、どの長期参照ピクチャも前記現在のピクチャのインター予測に使うことができず、パラメータセット中で指定されたすべての長期参照ピクチャを、復号順で前記現在のピクチャに続くピクチャのインター予測に使うことができ、
    前記フラグの前記値が第2の値であるとき、前記長期参照ピクチャのうちの1つまたは複数を前記現在のピクチャのインター予測に使うことができ、前記パラメータセット中で指定された前記長期参照ピクチャのすべてを、復号順で前記現在のピクチャに続くピクチャのインター予測に使うことができるわけではない、請求項30に記載のコンピュータ可読記憶媒体。
  35. 前記プロセッサに、
    現在のピクチャについての参照ピクチャセットを導出させ、
    現在のピクチャの時間的識別値を判断させ、
    前記現在のピクチャの前記時間的識別値以下の時間的識別値を有するとともに前記参照ピクチャセット中で識別されない1つまたは複数のピクチャを、復号ピクチャバッファ(DPB)から削除させる命令をさらに備え、
    時間的識別値が前記現在のピクチャの前記時間的識別値以下である、前記参照ピクチャセット中で識別された1つまたは複数のピクチャに関して、前記現在のピクチャをインター予測することができる、請求項30に記載のコンピュータ可読記憶媒体。
  36. ビデオデータをコーディングするためのデバイスであって、
    瞬時デコーダリフレッシュ(IDR)ピクチャではないランダムアクセスポイント(RAP)ピクチャについての完全識別子値をコーディングするための手段と、
    前記RAPピクチャについての前記完全識別子値に基づいて、非RAPピクチャについての部分的識別子値をコーディングするための手段であって、前記部分的識別子値が、前記非RAPピクチャについての完全識別子値の一部分を表す、コーディングするための手段とを備えるデバイス。
  37. フラグの値を、スライスを含む現在のピクチャについての前記スライスのヘッダ中でコーディングするための手段をさらに備え、
    前記フラグの前記値が第1の値であるとき、どの長期参照ピクチャも前記現在のピクチャのインター予測に使うことができず、どの長期参照ピクチャも、復号順で前記現在のピクチャに続くピクチャのインター予測に使うことができず、
    前記フラグの前記値が第2の値であるとき、1つまたは複数の長期参照ピクチャを前記現在のピクチャのインター予測に使うことができ、復号順で前記現在のピクチャに続く前記ピクチャのインター予測に使うことができる、請求項36に記載のデバイス。
  38. フラグの値を、スライスを含む現在のピクチャについての前記スライスのヘッダ中でコーディングするための手段をさらに備え、
    前記フラグの前記値が第1の値であるとき、パラメータセット中で指定されたすべての長期参照ピクチャを、前記現在のピクチャのインター予測に使うことができ、前記パラメータセット中で指定されないとともに復号順で前記現在のピクチャに先立つ長期参照ピクチャを、前記現在のピクチャおよび復号順で前記現在のピクチャに続くピクチャのインター予測に使うことができず、
    前記フラグの前記値が第2の値であるとき、パラメータセット中で指定された前記長期参照ピクチャすべてが、前記現在のピクチャのインター予測に使うことができるわけではなく、前記パラメータセット中で指定されないとともに復号順で前記現在のピクチャに先立つ長期参照ピクチャを、前記現在のピクチャおよび復号順で前記現在のピクチャに続くピクチャのインター予測に使うことができる、請求項36に記載のデバイス。
  39. フラグの値を、スライスを含む現在のピクチャについての前記スライスのヘッダ中でコーディングするための手段をさらに備え、
    前記フラグの前記値が第1の値であるとき、パラメータセット中で指定されたすべての長期参照ピクチャを、前記現在のピクチャのインター予測に使うことができ、
    前記フラグの前記値が第2の値であるとき、前記パラメータセット中で指定された前記長期参照ピクチャすべてを前記現在のピクチャのインター予測に使うことができるわけではない、請求項36に記載のデバイス。
  40. フラグの値を、スライスを含む現在のピクチャについての前記スライスのヘッダ中でコーディングするための手段をさらに備え、
    前記フラグの前記値が第1の値であるとき、どの長期参照ピクチャも前記現在のピクチャのインター予測に使うことができず、パラメータセット中で指定されたすべての長期参照ピクチャを、復号順で前記現在のピクチャに続くピクチャのインター予測に使うことができ、
    前記フラグの前記値が第2の値であるとき、前記長期参照ピクチャのうちの1つまたは複数を前記現在のピクチャのインター予測に使うことができ、前記パラメータセット中で指定された前記長期参照ピクチャのすべてを、復号順で前記現在のピクチャに続くピクチャのインター予測に使うことができるわけではない、請求項36に記載のデバイス。
  41. 現在のピクチャについての参照ピクチャセットを導出するための手段と、
    現在のピクチャの時間的識別値を判断するための手段と、
    前記現在のピクチャの前記時間的識別値以下の時間的識別値を有するとともに前記参照ピクチャセット中で識別されない1つまたは複数のピクチャを、復号ピクチャバッファ(DPB)から削除するための手段とをさらに備え、
    時間的識別値が前記現在のピクチャの前記時間的識別値以下である、前記参照ピクチャセット中で識別された1つまたは複数のピクチャに関して、前記現在のピクチャをインター予測することができる、請求項36に記載のデバイス。
JP2014532019A 2011-09-23 2012-09-21 参照ピクチャシグナリングおよび復号ピクチャバッファ管理 Active JP6009569B2 (ja)

Applications Claiming Priority (9)

Application Number Priority Date Filing Date Title
US201161538787P 2011-09-23 2011-09-23
US61/538,787 2011-09-23
US201161539433P 2011-09-26 2011-09-26
US61/539,433 2011-09-26
US201161542034P 2011-09-30 2011-09-30
US61/542,034 2011-09-30
US13/623,768 US9998757B2 (en) 2011-09-23 2012-09-20 Reference picture signaling and decoded picture buffer management
US13/623,768 2012-09-20
PCT/US2012/056638 WO2013044075A2 (en) 2011-09-23 2012-09-21 Reference picture signaling and decoded picture buffer management

Publications (2)

Publication Number Publication Date
JP2014530573A true JP2014530573A (ja) 2014-11-17
JP6009569B2 JP6009569B2 (ja) 2016-10-19

Family

ID=47911283

Family Applications (10)

Application Number Title Priority Date Filing Date
JP2014531966A Active JP5940668B2 (ja) 2011-09-23 2012-09-20 ビデオコーディングのための参照ピクチャリスト構成
JP2014531969A Active JP6038929B2 (ja) 2011-09-23 2012-09-20 復号ピクチャバッファ管理
JP2014531975A Active JP5940669B2 (ja) 2011-09-23 2012-09-20 参照ピクチャセットのサブセットを用いたビデオコーディング
JP2014531967A Active JP5937216B2 (ja) 2011-09-23 2012-09-20 ビデオコーディングのための参照ピクチャリスト構成
JP2014531968A Active JP5882475B2 (ja) 2011-09-23 2012-09-20 ビデオコーディングのための参照ピクチャリスト構成
JP2014531973A Active JP5976816B2 (ja) 2011-09-23 2012-09-20 参照ピクチャセットのための参照ピクチャのコーディング
JP2014532019A Active JP6009569B2 (ja) 2011-09-23 2012-09-21 参照ピクチャシグナリングおよび復号ピクチャバッファ管理
JP2016134912A Active JP6275780B2 (ja) 2011-09-23 2016-07-07 復号ピクチャバッファ管理
JP2018002076A Active JP6498794B2 (ja) 2011-09-23 2018-01-10 復号ピクチャバッファ管理
JP2019045732A Withdrawn JP2019126079A (ja) 2011-09-23 2019-03-13 復号ピクチャバッファ管理

Family Applications Before (6)

Application Number Title Priority Date Filing Date
JP2014531966A Active JP5940668B2 (ja) 2011-09-23 2012-09-20 ビデオコーディングのための参照ピクチャリスト構成
JP2014531969A Active JP6038929B2 (ja) 2011-09-23 2012-09-20 復号ピクチャバッファ管理
JP2014531975A Active JP5940669B2 (ja) 2011-09-23 2012-09-20 参照ピクチャセットのサブセットを用いたビデオコーディング
JP2014531967A Active JP5937216B2 (ja) 2011-09-23 2012-09-20 ビデオコーディングのための参照ピクチャリスト構成
JP2014531968A Active JP5882475B2 (ja) 2011-09-23 2012-09-20 ビデオコーディングのための参照ピクチャリスト構成
JP2014531973A Active JP5976816B2 (ja) 2011-09-23 2012-09-20 参照ピクチャセットのための参照ピクチャのコーディング

Family Applications After (3)

Application Number Title Priority Date Filing Date
JP2016134912A Active JP6275780B2 (ja) 2011-09-23 2016-07-07 復号ピクチャバッファ管理
JP2018002076A Active JP6498794B2 (ja) 2011-09-23 2018-01-10 復号ピクチャバッファ管理
JP2019045732A Withdrawn JP2019126079A (ja) 2011-09-23 2019-03-13 復号ピクチャバッファ管理

Country Status (19)

Country Link
US (10) US9420307B2 (ja)
EP (7) EP2759136B1 (ja)
JP (10) JP5940668B2 (ja)
KR (7) KR101614633B1 (ja)
CN (15) CN108337517B (ja)
AR (6) AR089561A1 (ja)
AU (6) AU2012312324B2 (ja)
BR (6) BR112014006867A2 (ja)
CA (7) CA2848406C (ja)
ES (1) ES2776147T3 (ja)
HK (5) HK1247013A1 (ja)
IL (8) IL231211A (ja)
IN (4) IN2014CN01825A (ja)
MY (6) MY172880A (ja)
RU (6) RU2580098C2 (ja)
SG (6) SG11201400317XA (ja)
TW (6) TWI498004B (ja)
WO (7) WO2013043892A2 (ja)
ZA (6) ZA201402902B (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9936197B2 (en) 2011-10-28 2018-04-03 Samsung Electronics Co., Ltd. Method for inter prediction and device therefore, and method for motion compensation and device therefore

Families Citing this family (159)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2749027B1 (en) 2011-08-25 2020-04-29 Sun Patent Trust Methods and apparatuses for encoding and decoding video using updated buffer description
US8804816B2 (en) * 2011-08-30 2014-08-12 Microsoft Corporation Video encoding enhancements
ES2625097T3 (es) 2011-09-07 2017-07-18 Sun Patent Trust Método de codificación de imágenes y aparato de codificación de imágenes
JP5932811B2 (ja) 2011-09-19 2016-06-08 パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカPanasonic Intellectual Property Corporation of America 画像復号方法、及び画像復号装置
US9420307B2 (en) 2011-09-23 2016-08-16 Qualcomm Incorporated Coding reference pictures for a reference picture set
US10674171B2 (en) 2011-09-27 2020-06-02 Telefonaktiebolaget Lm Ericsson (Publ) Decoders and methods thereof for managing pictures in video decoding process
WO2013048316A1 (en) * 2011-09-30 2013-04-04 Telefonaktiebolaget L M Ericsson (Publ) Decoder and encoder for picture outputting and methods thereof
US8768079B2 (en) * 2011-10-13 2014-07-01 Sharp Laboratories Of America, Inc. Tracking a reference picture on an electronic device
US20130094774A1 (en) * 2011-10-13 2013-04-18 Sharp Laboratories Of America, Inc. Tracking a reference picture based on a designated picture on an electronic device
US8787688B2 (en) * 2011-10-13 2014-07-22 Sharp Laboratories Of America, Inc. Tracking a reference picture based on a designated picture on an electronic device
US8855433B2 (en) * 2011-10-13 2014-10-07 Sharp Kabushiki Kaisha Tracking a reference picture based on a designated picture on an electronic device
ES2924280T3 (es) 2011-10-19 2022-10-05 Sun Patent Trust Procedimiento de descodificación de imágenes y aparato de descodificación de imágenes
EP2772052A1 (en) 2011-10-24 2014-09-03 Telefonaktiebolaget LM Ericsson (PUBL) Reference picture marking
JP5320525B1 (ja) 2011-10-27 2013-10-23 パナソニック株式会社 予測動きベクトル導出方法および予測動きベクトル導出装置
CN103688545B (zh) 2011-10-28 2017-05-10 太阳专利托管公司 图像编码方法、图像解码方法、图像编码装置及图像解码装置
CN104041042B (zh) 2011-10-28 2018-10-23 太阳专利托管公司 图像编码方法、图像解码方法、图像编码装置及图像解码装置
CN103096049A (zh) * 2011-11-02 2013-05-08 华为技术有限公司 一种视频处理方法及系统、相关设备
US10003817B2 (en) * 2011-11-07 2018-06-19 Microsoft Technology Licensing, Llc Signaling of state information for a decoded picture buffer and reference picture lists
EP3576412B1 (en) 2011-11-08 2021-09-01 Nokia Technologies Oy Reference picture handling
KR102615301B1 (ko) * 2011-11-11 2023-12-19 엘지전자 주식회사 영상 정보 전송 방법 및 장치와 이를 이용한 복호화 방법 및 장치
JP6078927B2 (ja) * 2012-01-10 2017-02-15 サン パテント トラスト 動画像符号化方法、動画像符号化装置、動画像復号方法、及び、動画像復号装置
US8867852B2 (en) 2012-01-19 2014-10-21 Sharp Kabushiki Kaisha Decoding a picture based on a reference picture set on an electronic device
US9654772B2 (en) * 2012-01-19 2017-05-16 Qualcomm Incorporated Context adaptive entropy coding with a reduced initialization value set
US8693793B2 (en) * 2012-01-19 2014-04-08 Sharp Laboratories Of America, Inc. Reducing reference picture set signal overhead on an electronic device
AU2013210955B2 (en) * 2012-01-20 2017-11-09 Nokia Technologies Oy Method for video coding and an apparatus, a computer-program product, a system, and a module for the same
US20130188709A1 (en) * 2012-01-25 2013-07-25 Sachin G. Deshpande Video decoder for tiles with absolute signaling
KR102137149B1 (ko) * 2012-03-02 2020-07-23 선 페이턴트 트러스트 화상 부호화 방법, 화상 복호 방법, 화상 부호화 장치, 화상 복호 장치 및 화상 부호화 복호 장치
US11039138B1 (en) 2012-03-08 2021-06-15 Google Llc Adaptive coding of prediction modes using probability distributions
KR102094503B1 (ko) * 2012-04-15 2020-03-30 삼성전자주식회사 다계층 비디오 부호화 방법 및 장치, 다계층 비디오 복호화 방법 및 장치
US9532055B2 (en) * 2012-04-16 2016-12-27 Microsoft Technology Licensing, Llc Constraints and unit types to simplify video random access
KR20130116782A (ko) * 2012-04-16 2013-10-24 한국전자통신연구원 계층적 비디오 부호화에서의 계층정보 표현방식
US9420286B2 (en) 2012-06-15 2016-08-16 Qualcomm Incorporated Temporal motion vector prediction in HEVC and its extensions
PL2865177T3 (pl) 2012-06-25 2019-03-29 Huawei Technologies Co., Ltd. Sposób sygnalizowania obrazu stopniowego dostępu do warstwy czasowej
US9225978B2 (en) 2012-06-28 2015-12-29 Qualcomm Incorporated Streaming adaption based on clean random access (CRA) pictures
JP5891975B2 (ja) * 2012-07-02 2016-03-23 富士通株式会社 動画像符号化装置、動画像復号装置、動画像符号化方法および動画像復号方法
CA2878206C (en) * 2012-07-02 2016-05-17 Samsung Electronics Co., Ltd. Method and apparatus for encoding video and method and apparatus for decoding video determining inter-prediction reference picture list depending on block size
US9648322B2 (en) 2012-07-10 2017-05-09 Qualcomm Incorporated Coding random access pictures for video coding
US9167248B2 (en) 2012-07-13 2015-10-20 Qualcomm Incorporated Reference picture list modification for video coding
US9357195B2 (en) 2012-08-16 2016-05-31 Qualcomm Incorporated Inter-view predicted motion vector for 3D video
KR102215438B1 (ko) * 2012-09-13 2021-02-15 엘지전자 주식회사 영상 부호화/복호화 방법 및 장치
US20140092988A1 (en) * 2012-09-28 2014-04-03 Sharp Laboratories Of America, Inc. Systems and methods for reference picture set extension
US9392268B2 (en) 2012-09-28 2016-07-12 Qualcomm Incorporated Using base layer motion information
US9313500B2 (en) 2012-09-30 2016-04-12 Microsoft Technology Licensing, Llc Conditional signalling of reference picture list modification information
US20150281724A1 (en) * 2012-10-10 2015-10-01 Zte Corporation Method and apparatus for encapsulation of random access information for media transport and storage
US20140140406A1 (en) * 2012-11-16 2014-05-22 General Instrument Corporation Devices and methods for processing of non-idr related syntax for high efficiency video coding (hevc)
CN104919803B (zh) * 2013-01-15 2017-09-12 华为技术有限公司 一种用于解码视频比特流的方法
PL3119089T3 (pl) * 2013-01-16 2018-11-30 Telefonaktiebolaget Lm Ericsson (Publ) Dekoder i koder do kodowania sekwencji wideo
US10349074B2 (en) 2013-04-05 2019-07-09 Samsung Electronics Co., Ltd. Method and apparatus for encoding and decoding multi-layer video using decoded picture buffers which operate identically
WO2014163456A1 (ko) * 2013-04-05 2014-10-09 삼성전자 주식회사 멀티 레이어 비디오의 복호화 방법 및 장치, 멀티 레이어 비디오의 부호화 방법 및 장치
KR102383006B1 (ko) * 2013-04-07 2022-04-04 돌비 인터네셔널 에이비 출력 계층 세트들에서의 시그널링 변경
US9591321B2 (en) 2013-04-07 2017-03-07 Dolby International Ab Signaling change in output layer sets
CN103268553A (zh) * 2013-04-11 2013-08-28 蒋月琴 利用点编码的图书交易、租赁电子商务系统
EP2984841B1 (en) 2013-04-12 2016-06-08 Telefonaktiebolaget LM Ericsson (publ) Constructing inter-layer reference picture lists
EP2987326B1 (en) * 2013-04-17 2020-09-02 Nokia Technologies Oy An apparatus, a method and a computer program for video coding and decoding
JP6361866B2 (ja) * 2013-05-09 2018-07-25 サン パテント トラスト 画像処理方法および画像処理装置
US10003815B2 (en) * 2013-06-03 2018-06-19 Qualcomm Incorporated Hypothetical reference decoder model and conformance for cross-layer random access skipped pictures
US9565454B2 (en) * 2013-06-24 2017-02-07 Microsoft Technology Licensing, Llc Picture referencing control for video decoding using a graphics processor
WO2015009009A1 (ko) 2013-07-15 2015-01-22 주식회사 케이티 스케일러블 비디오 신호 인코딩/디코딩 방법 및 장치
KR20150009467A (ko) 2013-07-15 2015-01-26 주식회사 케이티 스케일러블 비디오 신호 인코딩/디코딩 방법 및 장치
WO2015016534A1 (ko) * 2013-07-30 2015-02-05 주식회사 케이티 복수의 레이어를 지원하는 영상의 부호화 및 복호화 방법 및 이를 이용하는 장치
US9894369B2 (en) 2013-07-30 2018-02-13 Kt Corporation Image encoding and decoding method supporting plurality of layers and apparatus using same
US9762909B2 (en) 2013-07-30 2017-09-12 Kt Corporation Image encoding and decoding method supporting plurality of layers and apparatus using same
US9344218B1 (en) * 2013-08-19 2016-05-17 Zoom Video Communications, Inc. Error resilience for interactive real-time multimedia applications
US20160234523A1 (en) * 2013-09-06 2016-08-11 Mitsubishi Electric Corporation Video encoding device, video transcoding device, video encoding method, video transcoding method, and video stream transmission system
CN105765978B (zh) * 2013-10-11 2019-01-29 韩国电子通信研究院 用于编码/解码图像的方法和使用其的装置
WO2015053525A1 (ko) * 2013-10-11 2015-04-16 한국전자통신연구원 영상의 부호화/복호화 방법 및 이를 이용하는 장치
JP6401707B2 (ja) * 2013-10-16 2018-10-10 シャープ株式会社 画像復号装置、画像復号方法、および記録媒体
US9628820B2 (en) * 2013-11-19 2017-04-18 Qualcomm Incorporated POC value design for multi-layer video coding
US9807407B2 (en) * 2013-12-02 2017-10-31 Qualcomm Incorporated Reference picture selection
KR20150075041A (ko) * 2013-12-24 2015-07-02 주식회사 케이티 멀티 레이어 비디오 신호 인코딩/디코딩 방법 및 장치
CN104754347B (zh) * 2013-12-26 2019-05-17 中兴通讯股份有限公司 视频图像序号的编码、解码方法及装置、电子设备
CN105075251B (zh) * 2014-01-02 2016-11-23 维迪奥股份有限公司 利用辅助图片的覆盖的视频解码方法、装置和系统
US10432928B2 (en) 2014-03-21 2019-10-01 Qualcomm Incorporated Using a current picture as a reference for video coding
WO2015147426A1 (ko) 2014-03-24 2015-10-01 주식회사 케이티 멀티 레이어 비디오 신호 인코딩/디코딩 방법 및 장치
US10666968B2 (en) * 2014-05-06 2020-05-26 Hfi Innovation Inc. Method of block vector prediction for intra block copy mode coding
EP3962089A1 (en) 2014-06-18 2022-03-02 Telefonaktiebolaget LM Ericsson (publ) Dependent random access point pictures
US10542288B2 (en) * 2014-06-18 2020-01-21 Telefonaktiebolaget Lm Ericsson (Publ) Random access in a video bitstream
EP2958328A1 (en) * 2014-06-20 2015-12-23 Thomson Licensing Method and device for signaling in a bitstream a picture/video format of an LDR picture and a picture/video format of a decoded HDR picture obtained from said LDR picture and an illumination picture
US9866851B2 (en) * 2014-06-20 2018-01-09 Qualcomm Incorporated Full picture order count reset for multi-layer codecs
US9807419B2 (en) * 2014-06-25 2017-10-31 Qualcomm Incorporated Recovery point SEI message in multi-layer video codecs
KR101610725B1 (ko) * 2014-09-23 2016-04-08 삼성전자주식회사 참조 빈도에 따라 참조 영상 데이터를 제어하는 비디오 부복호화 방법 및 장치
US9848198B2 (en) * 2014-10-06 2017-12-19 Qualcomm Incorporated Diagonal copy for palette mode coding
GB2531271A (en) 2014-10-14 2016-04-20 Nokia Technologies Oy An apparatus, a method and a computer program for image sequence coding and decoding
US20160127728A1 (en) * 2014-10-30 2016-05-05 Kabushiki Kaisha Toshiba Video compression apparatus, video playback apparatus and video delivery system
KR20160071569A (ko) 2014-12-11 2016-06-22 삼성전자주식회사 비디오 장치에서의 영상 처리 방법 및 그에 따른 비디오 장치
US10511834B2 (en) * 2015-04-29 2019-12-17 Hfi Innovation Inc. Method and apparatus for Intra Block Copy reference list construction
KR102162856B1 (ko) 2015-05-21 2020-10-07 후아웨이 테크놀러지 컴퍼니 리미티드 비디오 모션 보상을 위한 장치 및 방법
CN115134609A (zh) 2015-06-11 2022-09-30 杜比实验室特许公司 使用自适应去块滤波编码和解码图像的方法及其装置
CN106528552B (zh) * 2015-09-09 2019-10-22 杭州海康威视数字技术股份有限公司 图像搜索方法及系统
EP3145143B1 (en) * 2015-09-15 2019-03-20 Nxp B.V. Differential detector
US20170085871A1 (en) * 2015-09-22 2017-03-23 Ati Technologies Ulc Real time video coding system with error recovery using earlier reference picture
KR102477964B1 (ko) 2015-10-12 2022-12-16 삼성전자주식회사 미디어 전송 시스템에서 비디오 비트스트림의 임의 접근 및 재생을 가능하게 하는 기법
WO2017075804A1 (en) 2015-11-06 2017-05-11 Microsoft Technology Licensing, Llc Flexible reference picture management for video encoding and decoding
CN106817585B (zh) * 2015-12-02 2020-05-01 掌赢信息科技(上海)有限公司 一种利用长期参考帧的视频编码方法、电子设备和系统
US11595652B2 (en) 2019-01-28 2023-02-28 Op Solutions, Llc Explicit signaling of extended long term reference picture retention
JP6119891B2 (ja) * 2016-02-25 2017-04-26 富士通株式会社 動画像符号化方法
US10404979B2 (en) * 2016-03-17 2019-09-03 Mediatek Inc. Video coding with interpolated reference pictures
JP6237829B2 (ja) * 2016-06-23 2017-11-29 富士通株式会社 動画像符号化用コンピュータプログラム
JP6237830B2 (ja) * 2016-06-23 2017-11-29 富士通株式会社 動画像復号方法
JP6237831B2 (ja) * 2016-06-23 2017-11-29 富士通株式会社 動画像復号用コンピュータプログラム
ES2724568B2 (es) * 2016-06-24 2021-05-19 Kt Corp Método y aparato para tratar una señal de vídeo
SG11201811806TA (en) * 2016-07-01 2019-02-27 Univ Tohoku Prophylactic or therapeutic agent for organ fibrosis
CN107592543B (zh) * 2016-07-06 2019-12-24 北京大学 视频解码处理方法及装置
WO2018124957A1 (en) * 2016-12-30 2018-07-05 Telefonaktiebolaget Lm Ericsson (Publ) Decoded picture buffer management for handling cross-picture data prediction
CN107426567B (zh) * 2017-05-19 2019-11-15 西安电子科技大学 基于编码顺序已知图像集的多参考图像确定方法
EP3721624A1 (en) * 2017-12-06 2020-10-14 V-Nova International Limited Methods and apparatuses for hierarchically encoding and decoding a bytestream
CN108650554A (zh) * 2018-04-26 2018-10-12 维沃移动通信有限公司 一种多媒体文件播放控制方法及移动终端
EP4336832A3 (en) * 2018-08-17 2024-05-22 Huawei Technologies Co., Ltd. Reference picture management in video coding
EP3846471A4 (en) * 2018-08-31 2022-02-23 SZ DJI Technology Co., Ltd. ENCODING METHOD, DECODING METHOD, ENCODING APPARATUS, AND DECODING APPARATUS
KR20230145226A (ko) * 2018-09-12 2023-10-17 후아웨이 테크놀러지 컴퍼니 리미티드 참조 화상 리스트 구조를 위한 인덱스 시그널링
CN112703742B (zh) 2018-09-14 2023-03-31 华为技术有限公司 视频译码中的分块指示
WO2020059687A1 (en) * 2018-09-21 2020-03-26 Sharp Kabushiki Kaisha Systems and methods for signaling reference pictures in video coding
US11394989B2 (en) * 2018-12-10 2022-07-19 Tencent America LLC Method and apparatus for video coding
US11196988B2 (en) * 2018-12-17 2021-12-07 Apple Inc. Reference picture management and list construction
US11095900B2 (en) 2018-12-19 2021-08-17 Sony Group Corporation Point cloud coding structure
CN113068025B (zh) 2018-12-25 2023-05-12 Oppo广东移动通信有限公司 解码预测方法、装置及计算机存储介质
US10904545B2 (en) * 2018-12-26 2021-01-26 Tencent America LLC Method for syntax controlled decoded picture buffer management
KR102504741B1 (ko) 2019-01-02 2023-03-02 엘지전자 주식회사 화면간 예측을 사용하여 비디오 신호를 처리하기 위한 방법 및 장치
CN111416981B (zh) * 2019-01-07 2023-06-02 浙江大学 视频图像解码、编码方法及装置
CN113597768A (zh) * 2019-01-28 2021-11-02 Op方案有限责任公司 扩展长期参考图片保留的在线和离线选择
CN113615184A (zh) * 2019-01-28 2021-11-05 Op方案有限责任公司 扩展长期参考图片保留的显式信令
CN113711615A (zh) 2019-02-15 2021-11-26 北京字节跳动网络技术有限公司 视频压缩中的非二次幂分割树
CN117395439A (zh) 2019-03-01 2024-01-12 北京字节跳动网络技术有限公司 用于视频编解码中的帧内块复制的基于方向的预测
JP7284284B2 (ja) 2019-03-04 2023-05-30 北京字節跳動網絡技術有限公司 映像符号化におけるイントラブロックコピーの実装形態の態様
EP3928511A4 (en) * 2019-03-11 2022-06-22 Huawei Technologies Co., Ltd. STEP-BY-STEP DECODE REFRESH IN VIDEO ENCODING
CN113924784A (zh) * 2019-03-12 2022-01-11 现代自动车株式会社 用于编码和解码影像的方法和装置
CN116708794A (zh) 2019-03-18 2023-09-05 Oppo广东移动通信有限公司 图像分量预测方法、编码器、解码器以及存储介质
CN111726632B (zh) * 2019-03-18 2022-08-26 杭州海康威视数字技术股份有限公司 一种编解码方法、装置及其设备
WO2020226991A1 (en) * 2019-05-06 2020-11-12 Futurewei Technologies, Inc. Hypothetical reference decoder for gradual decoding refresh
US11303913B2 (en) * 2019-06-19 2022-04-12 Qualcomm Incorporated Decoded picture buffer indexing
BR112021026826A2 (pt) * 2019-07-03 2022-02-22 Huawei Tech Co Ltd Tipos de imagens de referência em listas de imagens de referência
BR112022000292A2 (pt) * 2019-07-08 2022-02-22 Huawei Tech Co Ltd Tratamento de múltiplos tamanhos de imagem e janelas de conformidade para reamostragem de imagem de referência em codificação de vídeo
CN114270831A (zh) 2019-08-10 2022-04-01 北京字节跳动网络技术有限公司 视频处理中的子图片尺寸定义
CN117412052A (zh) * 2019-09-24 2024-01-16 华为技术有限公司 图像级非图像级语法元素的指示
EP4026097A4 (en) * 2019-09-24 2023-01-25 Huawei Technologies Co., Ltd. SIGNALING AN IMAGE HEAD IN VIDEO ENCODING
BR112022005394A2 (pt) 2019-09-24 2022-06-21 Huawei Tech Co Ltd Simplificação de dependência de mensagem sei em codificação de vídeo
MX2022004141A (es) * 2019-10-07 2022-04-26 Huawei Tech Co Ltd Evitación de señalización redundante en flujos de bits de video multicapa.
WO2021118263A1 (ko) * 2019-12-12 2021-06-17 엘지전자 주식회사 영상 정보를 시그널링하는 방법 및 장치
WO2021118261A1 (ko) * 2019-12-12 2021-06-17 엘지전자 주식회사 영상 정보를 시그널링하는 방법 및 장치
KR20220088795A (ko) * 2019-12-12 2022-06-28 엘지전자 주식회사 픽처 레벨 또는 슬라이스 레벨에서 적용되는 영상 정보를 시그널링하는 방법 및 장치
WO2021125912A1 (ko) 2019-12-20 2021-06-24 주식회사 윌러스표준기술연구소 비디오 신호 처리 방법 및 이를 위한 장치
KR20220114557A (ko) 2019-12-26 2022-08-17 바이트댄스 아이엔씨 코딩된 픽처 내에서 디코딩 순서를 구현하기 위한 기술들
CN114830662B (zh) 2019-12-27 2023-04-14 阿里巴巴(中国)有限公司 用于对图像执行逐步解码刷新处理的方法和系统
WO2021137597A1 (ko) * 2019-12-30 2021-07-08 엘지전자 주식회사 Ols에 대한 dpb 파라미터를 사용하는 영상 디코딩 방법 및 그 장치
BR112022014484A2 (pt) * 2020-01-23 2022-09-13 Huawei Tech Co Ltd Método de decodificação de uma sequência de vídeo codificada e decodificador, método de codificação de uma sequência de vídeo e codificador, e mídia legível por computador não transitória
EP4088463A4 (en) 2020-02-14 2023-05-10 Beijing Bytedance Network Technology Co., Ltd. USING GENERAL STRESS INDICATORS IN VIDEO BITSTREAMS
AR121127A1 (es) * 2020-02-29 2022-04-20 Beijing Bytedance Network Tech Co Ltd Señalización de información de imagen de referencia en un flujo de bits de video
KR20220155277A (ko) 2020-03-16 2022-11-22 바이트댄스 아이엔씨 스케일러블 비디오 코딩의 랜덤 액세스 포인트 액세스 유닛
WO2021188527A1 (en) 2020-03-17 2021-09-23 Bytedance Inc. Using video parameter set in video coding
JP7490803B2 (ja) * 2020-03-31 2024-05-27 テレフオンアクチーボラゲット エルエム エリクソン(パブル) シンタックスエレメントを使用するビデオ処理
EP4140140A4 (en) 2020-05-21 2023-07-05 ByteDance Inc. PROGRESSIVE DECODING REFRESH SIGNALING AND REFERENCE PICTURE LISTS
CN111770332B (zh) * 2020-06-04 2022-08-09 Oppo广东移动通信有限公司 插帧处理方法、插帧处理装置、存储介质与电子设备
CN115943627A (zh) 2020-06-08 2023-04-07 字节跳动有限公司 对编解码视频图片中条带计数的约束
CN115699728A (zh) 2020-06-08 2023-02-03 字节跳动有限公司 视频编解码中的子层信令
KR102264460B1 (ko) * 2020-12-31 2021-06-11 한전케이피에스 주식회사 공기압축기 전동기 정비 장치
US11621979B1 (en) 2020-12-31 2023-04-04 Benjamin Slotznick Method and apparatus for repositioning meeting participants within a virtual space view in an online meeting user interface based on gestures made by the meeting participants
US11546385B1 (en) 2020-12-31 2023-01-03 Benjamin Slotznick Method and apparatus for self-selection by participant to display a mirrored or unmirrored video feed of the participant in a videoconferencing platform
US11330021B1 (en) * 2020-12-31 2022-05-10 Benjamin Slotznick System and method of mirroring a display of multiple video feeds in videoconferencing systems
CN114466227B (zh) * 2021-12-22 2023-08-04 天翼云科技有限公司 一种视频分析方法、装置、电子设备及存储介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004274732A (ja) * 2003-02-19 2004-09-30 Matsushita Electric Ind Co Ltd 動画像符号化方法、及び、動画像復号化方法
US20080117985A1 (en) * 2006-10-16 2008-05-22 Nokia Corporation System and method for implementing efficient decoded buffer management in multi-view video coding
JP2009543508A (ja) * 2006-07-12 2009-12-03 エルジー エレクトロニクス インコーポレイティド 信号処理方法及び装置
JP2009290389A (ja) * 2008-05-28 2009-12-10 Hitachi Ltd 画像処理装置

Family Cites Families (170)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5777900A (en) * 1994-03-10 1998-07-07 Matsushita Electric Industrial Co., Ltd. Filtering processor and filter method
CN101026762B (zh) 1997-02-13 2015-08-19 三菱电机株式会社 运动图像预测装置和方法
EP1439704A3 (en) 1997-03-17 2011-08-10 Panasonic Corporation Method and apparatus for processing, transmitting and receiving dynamic image data
WO2001086960A2 (en) 2000-05-10 2001-11-15 Picturetel Corporation Video coding using multiple buffers
CN1513268B (zh) 2001-09-14 2010-12-22 株式会社Ntt都科摩 编码方法、译码方法、编码装置、译码装置和图象处理系统
US7505485B2 (en) 2002-01-22 2009-03-17 Microsoft Corporation Methods and systems for start code emulation prevention and data stuffing
US7149247B2 (en) 2002-01-22 2006-12-12 Microsoft Corporation Methods and systems for encoding and decoding video data to enable random access and splicing
EP1670260A3 (en) 2002-01-23 2010-03-03 Nokia Corporation Grouping of image frames in video coding
CN101018329B (zh) * 2002-04-19 2014-05-14 松下电器产业株式会社 图像解码方法及图像解码装置
US20040001546A1 (en) 2002-06-03 2004-01-01 Alexandros Tourapis Spatiotemporal prediction for bidirectionally predictive (B) pictures and motion vector prediction for multi-picture reference motion compensation
SI1742479T1 (sl) 2002-07-11 2009-12-31 Panasonic Corp Virtualni multi-hipotezni B-slikovni prikazovalni pomnilnik z ugrabljenim prostorom v H.264 post dekodnem pomnilniku
AU2003281133A1 (en) 2002-07-15 2004-02-02 Hitachi, Ltd. Moving picture encoding method and decoding method
US7492387B2 (en) 2002-08-05 2009-02-17 Chih-Lung Yang Implementation of MPCP MCU technology for the H.264 video standard
JP3513148B1 (ja) 2002-10-11 2004-03-31 株式会社エヌ・ティ・ティ・ドコモ 動画像符号化方法、動画像復号方法、動画像符号化装置、動画像復号装置、動画像符号化プログラム、及び動画像復号プログラム
FR2849332A1 (fr) 2002-12-20 2004-06-25 St Microelectronics Sa Procede et dispositif et decodage et d'affichage en marche arriere d'images mpeg, circuit pilote video et boitier decodeur incorporant un tel dispositif
KR100984517B1 (ko) 2003-01-10 2010-10-01 톰슨 라이센싱 인터프레임 인코딩을 위한 빠른 모드 결정 방법
US8194751B2 (en) 2003-02-19 2012-06-05 Panasonic Corporation Moving picture coding method and moving picture decoding method
US7266147B2 (en) 2003-03-31 2007-09-04 Sharp Laboratories Of America, Inc. Hypothetical reference decoder
US7724818B2 (en) 2003-04-30 2010-05-25 Nokia Corporation Method for coding sequences of pictures
KR100510138B1 (ko) * 2003-05-01 2005-08-26 삼성전자주식회사 참조 픽처 결정 방법, 그 움직임 보상 방법 및 그 장치
US7489342B2 (en) * 2004-12-17 2009-02-10 Mitsubishi Electric Research Laboratories, Inc. Method and system for managing reference pictures in multiview videos
US8175154B2 (en) 2003-06-03 2012-05-08 General Instrument Corporation Method for restructuring a group of pictures to provide for random access into the group of pictures
WO2005011283A1 (en) * 2003-07-09 2005-02-03 Thomson Licensing S.A. Video encoder with low complexity noise reduction
US8064520B2 (en) 2003-09-07 2011-11-22 Microsoft Corporation Advanced bi-directional predictive coding of interlaced video
FI115589B (fi) 2003-10-14 2005-05-31 Nokia Corp Redundanttien kuvien koodaaminen ja dekoodaaminen
US7529159B2 (en) 2004-01-06 2009-05-05 Pioneer Corporation System and method for recording information onto an information recording medium's first and second recording layers
US20050201471A1 (en) * 2004-02-13 2005-09-15 Nokia Corporation Picture decoding method
US8036271B2 (en) * 2004-02-24 2011-10-11 Lsi Corporation Method and apparatus for determining a second picture for temporal direct-mode block prediction
US20060013318A1 (en) * 2004-06-22 2006-01-19 Jennifer Webb Video error detection, recovery, and concealment
TWI268715B (en) 2004-08-16 2006-12-11 Nippon Telegraph & Telephone Picture encoding method, picture decoding method, picture encoding apparatus, and picture decoding apparatus
KR101407748B1 (ko) 2004-10-13 2014-06-17 톰슨 라이센싱 복잡도 스케일러블 비디오 인코딩 및 디코딩을 위한 방법 및 장치
US20060083298A1 (en) 2004-10-14 2006-04-20 Nokia Corporation Reference picture management in video coding
CN101065780A (zh) * 2004-10-14 2007-10-31 诺基亚公司 视频编码中的参考图像管理
WO2006049412A1 (en) 2004-11-01 2006-05-11 Electronics And Telecommunications Research Institute Method for encoding/decoding a video sequence based on hierarchical b-picture using adaptively-adjusted gop structure
US7166860B2 (en) 2004-12-30 2007-01-23 E. I. Du Pont De Nemours And Company Electronic device and process for forming same
KR100775143B1 (ko) 2005-01-11 2007-11-12 엘지전자 주식회사 영상정보 디코딩 방법
US8050328B2 (en) 2005-01-17 2011-11-01 Panasonic Corporation Image decoding method
US8208564B2 (en) 2005-06-24 2012-06-26 Ntt Docomo, Inc. Method and apparatus for video encoding and decoding using adaptive interpolation
JP4311570B2 (ja) 2005-07-01 2009-08-12 株式会社ソニー・コンピュータエンタテインメント 再生装置、ビデオ復号装置および同期再生方法
JP5484725B2 (ja) 2005-07-21 2014-05-07 トムソン ライセンシング スケーラブルビデオコーディングのための重み付け予測方法及び装置
US8028154B2 (en) 2005-07-29 2011-09-27 Broadcom Corporation Method and system for reducing instruction storage space for a processor integrated in a network adapter chip
US8599925B2 (en) 2005-08-12 2013-12-03 Microsoft Corporation Efficient coding and decoding of transform blocks
JP2007067842A (ja) 2005-08-31 2007-03-15 Victor Co Of Japan Ltd 動画像符号化データ編集装置および動画像符号化データ編集方法
US8879857B2 (en) * 2005-09-27 2014-11-04 Qualcomm Incorporated Redundant data encoding methods and device
KR20070038396A (ko) 2005-10-05 2007-04-10 엘지전자 주식회사 영상 신호의 인코딩 및 디코딩 방법
US20070086521A1 (en) 2005-10-11 2007-04-19 Nokia Corporation Efficient decoded picture buffer management for scalable video coding
CA2633819C (en) 2005-12-08 2016-12-06 Vidyo, Inc. Systems and methods for error resilience and random access in video communication systems
US7956930B2 (en) 2006-01-06 2011-06-07 Microsoft Corporation Resampling and picture resizing operations for multi-resolution video coding and decoding
JP2007184791A (ja) 2006-01-06 2007-07-19 Victor Co Of Japan Ltd 動画像符号化データ再生装置
WO2007080223A1 (en) 2006-01-10 2007-07-19 Nokia Corporation Buffering of decoded reference pictures
EP1806930A1 (en) 2006-01-10 2007-07-11 Thomson Licensing Method and apparatus for constructing reference picture lists for scalable video
WO2007081176A1 (en) 2006-01-12 2007-07-19 Lg Electronics Inc. Processing multiview video
US7673116B2 (en) 2006-01-17 2010-03-02 Advanced Micro Devices, Inc. Input/output memory management unit that implements memory attributes based on translation data
AU2006338425B2 (en) 2006-02-13 2010-12-09 Kabushiki Kaisha Toshiba Moving image encoding/decoding method and device and program
EP1827009A1 (en) 2006-02-28 2007-08-29 Matsushita Electric Industrial Co., Ltd. Video encoder and decoder for an improved zapping service for mobile video reception
US8170116B2 (en) 2006-03-27 2012-05-01 Nokia Corporation Reference picture marking in scalable video encoding and decoding
EP2005752A4 (en) * 2006-03-30 2010-06-09 Lg Electronics Inc METHOD AND APPARATUS FOR DECODING / ENCODING A VIDEO SIGNAL
US20100091845A1 (en) * 2006-03-30 2010-04-15 Byeong Moon Jeon Method and apparatus for decoding/encoding a video signal
CN101449585A (zh) 2006-03-30 2009-06-03 Lg电子株式会社 用于解码/编码视频信号的方法和装置
KR100877680B1 (ko) 2006-04-04 2009-01-09 삼성전자주식회사 반도체 장치 사이의 단일형 병렬데이터 인터페이스 방법,기록매체 및 반도체 장치
JP5155157B2 (ja) 2006-05-12 2013-02-27 パナソニック株式会社 動画像復号化装置
KR20070111968A (ko) 2006-05-19 2007-11-22 엘지전자 주식회사 비디오 신호의 디코딩 방법 및 장치
US20080002770A1 (en) 2006-06-30 2008-01-03 Nokia Corporation Methods, apparatus, and a computer program product for providing a fast inter mode decision for video encoding in resource constrained devices
WO2008005575A2 (en) 2006-07-06 2008-01-10 Thomson Licensing Method and apparatus for decoupling frame number and/or picture order count (poc) for multi-view video encoding and decoding
US8048072B2 (en) 2006-07-12 2011-11-01 Les Hospitaux Universitaires de Geneva Medical device for tissue ablation
US7801223B2 (en) 2006-07-27 2010-09-21 Lsi Corporation Method for video decoder memory reduction
JP4787100B2 (ja) 2006-07-27 2011-10-05 パナソニック株式会社 画像符号化装置
TWI375469B (en) 2006-08-25 2012-10-21 Lg Electronics Inc A method and apparatus for decoding/encoding a video signal
US20080165860A1 (en) 2006-08-31 2008-07-10 Zohair Sahraoui H.264 Data processing
KR100908062B1 (ko) 2006-09-07 2009-07-15 엘지전자 주식회사 비디오 신호의 디코딩/인코딩 방법 및 장치
CN107295350A (zh) 2006-10-13 2017-10-24 汤姆逊许可公司 用于多视点视频编码的参考图像列表管理语法
CN102761744B (zh) 2006-10-13 2015-10-28 汤姆逊许可公司 用于多视点视频编码的参考图像列表管理语法
US7991236B2 (en) 2006-10-16 2011-08-02 Nokia Corporation Discardable lower layer adaptations in scalable video coding
EP2080378B1 (en) * 2006-10-20 2012-08-15 Nokia Corporation Virtual decoded reference picture marking and reference picture list
AU2007309634A1 (en) 2006-10-24 2008-05-02 Thomson Licensing Picture management for multi-view video coding
JP2008118221A (ja) 2006-10-31 2008-05-22 Toshiba Corp 復号装置及び復号方法
KR100856392B1 (ko) 2006-11-08 2008-09-04 한국전자통신연구원 현재 영상의 복원영역을 참조하는 동영상 부호화/복호화장치 및 그 방법
US8416859B2 (en) 2006-11-13 2013-04-09 Cisco Technology, Inc. Signalling and extraction in compressed video of pictures belonging to interdependency tiers
AU2007319261B2 (en) 2006-11-14 2010-12-16 Qualcomm Incorporated Systems and methods for channel switching
JP5157140B2 (ja) 2006-11-29 2013-03-06 ソニー株式会社 記録装置、記録方法、情報処理装置、情報処理方法、撮像装置およびビデオシステム
CN101606389B (zh) 2007-01-08 2013-06-12 汤姆森特许公司 用于视频流拼接的方法及装置
CN101222638B (zh) * 2007-01-08 2011-12-07 华为技术有限公司 多视视频编解码方法及装置
KR100846802B1 (ko) 2007-02-14 2008-07-16 삼성전자주식회사 동영상 프레임의 디코딩 방법 및 인코딩 방법
JP5023739B2 (ja) 2007-02-28 2012-09-12 ソニー株式会社 画像情報符号化装置及び符号化方法
CN101669367A (zh) 2007-03-02 2010-03-10 Lg电子株式会社 用于解码/编码视频信号的方法及设备
US8194151B2 (en) 2007-03-28 2012-06-05 Hitachi Kokusai Electric Inc. Image pickup apparatus
JP5273824B2 (ja) 2007-04-04 2013-08-28 トムソン ライセンシング 参照ピクチャー・リスト管理
US8116537B2 (en) 2007-04-04 2012-02-14 Sony Corporation Image recording device, player device, imaging device, player system, method of recording image, and computer program
US8494049B2 (en) 2007-04-09 2013-07-23 Cisco Technology, Inc. Long term reference frame management with error video feedback for compressed video communication
US20080268877A1 (en) 2007-04-24 2008-10-30 Motorola, Inc. Method and apparatus for exchanging signaling a wireless communication system
US20080301742A1 (en) 2007-06-04 2008-12-04 Nokia Corporation Time-interleaved simulcast for tune-in reduction
US8477852B2 (en) 2007-06-20 2013-07-02 Nvidia Corporation Uniform video decoding and display
US8265144B2 (en) 2007-06-30 2012-09-11 Microsoft Corporation Innovations in video decoder implementations
CN100531400C (zh) 2007-07-26 2009-08-19 上海交通大学 基于宏块级和像素级运动估计的视频差错掩盖方法
TWI338869B (en) * 2007-08-03 2011-03-11 Via Tech Inc Method and apparatus for block-based digital encoded picture
JP5303556B2 (ja) * 2007-08-06 2013-10-02 トムソン ライセンシング 複数のインタービュー参照ピクチャを用いたモーションスキップモードのための方法及び装置
JP5125329B2 (ja) 2007-08-31 2013-01-23 富士通セミコンダクター株式会社 符号化装置と符号化方法、および復号化装置と復号化方法
US8121189B2 (en) 2007-09-20 2012-02-21 Microsoft Corporation Video decoding using created reference pictures
US8194741B2 (en) 2007-10-12 2012-06-05 Broadcom Corporation Method and system for processing B pictures with missing or invalid forward reference pictures
US20100232520A1 (en) 2007-11-05 2010-09-16 Zhenyu Wu Scalable video coding method for fast channel change and increased error relilience
US8425545B2 (en) 2007-12-03 2013-04-23 Covidien Ag Cordless hand-held ultrasonic cautery cutting device and method
TWI459215B (zh) 2007-12-05 2014-11-01 Ol2 Inc 用於將程式碼及資料儲存於應用程式主機代管中心內之系統及方法
US7865675B2 (en) 2007-12-06 2011-01-04 Arm Limited Controlling cleaning of data values within a hardware accelerator
US8718388B2 (en) 2007-12-11 2014-05-06 Cisco Technology, Inc. Video processing with tiered interdependencies of pictures
US8280375B2 (en) 2008-01-25 2012-10-02 Texas Instruments Incorporated System and method for managing radio link failures
JP2009260736A (ja) 2008-03-24 2009-11-05 Fujitsu Ltd エンコーディング装置、デコーディング装置、動画像処理方法、動画像処理システム、エンコーディングプログラムおよびデコーディングプログラム
JP2009260421A (ja) 2008-04-11 2009-11-05 Fujitsu Ltd 動画像処理システム、符号化装置、符号化方法、符号化プログラム、復号化装置、復号化方法および復号化プログラム
US20090262683A1 (en) 2008-04-18 2009-10-22 Amit Khetawat Method and Apparatus for Setup and Release of User Equipment Context Identifiers in a Home Node B System
US8855199B2 (en) 2008-04-21 2014-10-07 Nokia Corporation Method and device for video coding and decoding
US7782903B2 (en) 2008-05-14 2010-08-24 Newport Media, Inc. Hardware accelerated protocol stack
JP2009296078A (ja) 2008-06-03 2009-12-17 Victor Co Of Japan Ltd 符号化データ再生装置、符号化データ再生方法、および符号化データ再生プログラム
WO2009152450A1 (en) 2008-06-12 2009-12-17 Cisco Technology, Inc. Picture interdependencies signals in context of mmco to assist stream manipulation
CN102100069A (zh) 2008-07-16 2011-06-15 汤姆逊许可证公司 用于快速信道改变以增大编码效率的可分级视频编码方法
US8781003B2 (en) 2008-07-17 2014-07-15 Cisco Technology, Inc. Splicing of encrypted video/audio content
CN102106156B (zh) 2008-07-26 2013-06-19 汤姆逊许可证公司 使用可分级视频编码(svc)的用于快速信道改变的实时传输协议(rtp)打包方法
KR101680044B1 (ko) 2008-08-19 2016-11-28 디지맥 코포레이션 콘텐트 처리를 위한 방법들 및 시스템들
US8081018B2 (en) 2008-08-21 2011-12-20 Qualcomm Incorporated Low power radio frequency divider
KR101377527B1 (ko) 2008-10-14 2014-03-25 에스케이 텔레콤주식회사 복수 개의 참조 픽처의 움직임 벡터 부호화/복호화 방법 및장치와 그를 이용한 영상 부호화/복호화 장치 및 방법
US8462849B2 (en) 2008-12-23 2013-06-11 General Instrument Corporation Reference picture selection for sub-pixel motion estimation
EP2392138A4 (en) 2009-01-28 2012-08-29 Nokia Corp METHOD AND APPARATUS FOR VIDEO ENCODING AND DECODING
KR101622950B1 (ko) 2009-01-28 2016-05-23 삼성전자주식회사 오디오 신호의 부호화 및 복호화 방법 및 그 장치
WO2010086500A1 (en) 2009-01-28 2010-08-05 Nokia Corporation Method and apparatus for video coding and decoding
JPWO2010092740A1 (ja) * 2009-02-10 2012-08-16 パナソニック株式会社 画像処理装置、画像処理方法、プログラムおよび集積回路
WO2010096767A1 (en) 2009-02-20 2010-08-26 Cisco Technology, Inc. Signalling of decodable sub-sequences
JP5332773B2 (ja) 2009-03-18 2013-11-06 ソニー株式会社 画像処理装置および方法
JP5072893B2 (ja) 2009-03-25 2012-11-14 株式会社東芝 画像符号化方法および画像復号化方法
JP5574345B2 (ja) 2009-03-26 2014-08-20 パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカ 符号化方法、エラー検出方法、復号方法、符号化装置、エラー検出装置及び復号装置
US20100262711A1 (en) 2009-04-09 2010-10-14 Nokia Corporation Systems, methods, and apparatuses for media file streaming
US8933989B2 (en) 2009-04-22 2015-01-13 Lg Electronics Inc. Reference picture list changing method of multi-view video
CN101547368B (zh) 2009-04-24 2011-03-09 炬力集成电路设计有限公司 一种图像中参考帧的处理装置、方法以及解码器
CN101572817B (zh) 2009-05-26 2011-01-05 北京邮电大学 一种用于空间可分级视频编码的编码模式选择方法
TWI384887B (zh) 2009-06-11 2013-02-01 Univ Nat Central 多視點影像編解碼方法
DK2445224T3 (en) 2009-06-17 2017-08-21 Panasonic Ip Man Co Ltd INFORMATION RECORDING MEDIUM FOR 3D VIDEO RENDERING AND REPLACEMENT DEVICE
US8340510B2 (en) 2009-07-17 2012-12-25 Microsoft Corporation Implementing channel start and file seek for decoder
US8948241B2 (en) 2009-08-07 2015-02-03 Qualcomm Incorporated Signaling characteristics of an MVC operation point
KR101678968B1 (ko) 2009-08-21 2016-11-25 에스케이텔레콤 주식회사 참조 픽처 보간 방법 및 장치와 그를 이용한 영상 부호화/복호화 방법 및 장치
US8457155B2 (en) * 2009-09-11 2013-06-04 Nokia Corporation Encoding and decoding a multi-view video signal
US8990821B2 (en) 2009-09-29 2015-03-24 International Business Machines Corporation Task dispatching based on composite queue size and upper and lower compare values
EP2484090A1 (en) 2009-09-29 2012-08-08 Nokia Corp. System, method and apparatus for dynamic media file streaming
JP2011082683A (ja) 2009-10-05 2011-04-21 Sony Corp 画像処理装置、画像処理方法、及び、プログラム
CN102045557B (zh) 2009-10-20 2012-09-19 鸿富锦精密工业(深圳)有限公司 视频编解码方法及使用其的视频编码、解码装置
EP2497271B1 (en) 2009-11-06 2020-08-19 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Hybrid video coding
TW201121331A (en) 2009-12-10 2011-06-16 Novatek Microelectronics Corp Picture decoder
CN102104781B (zh) 2009-12-18 2013-03-20 联咏科技股份有限公司 图像解码器
US9992456B2 (en) 2010-02-24 2018-06-05 Thomson Licensing Dtv Method and apparatus for hypothetical reference decoder conformance error detection
EP2367394B1 (en) 2010-03-12 2015-11-25 BlackBerry Limited Base station and method for receiving transmissions on an enhanced random access channel
EP2996423B1 (en) 2010-03-12 2017-08-23 BlackBerry Limited Method and device for registration and data transmission using fast/zero contention resolution
JP2011199396A (ja) 2010-03-17 2011-10-06 Ntt Docomo Inc 動画像予測符号化装置、動画像予測符号化方法、動画像予測符号化プログラム、動画像予測復号装置、動画像予測復号方法、及び動画像予測復号プログラム
CN101917615A (zh) * 2010-06-03 2010-12-15 北京邮电大学 一种混合视频编码框架中的增强型双向运动矢量预测方法
CN101888553B (zh) 2010-06-30 2012-01-11 香港应用科技研究院有限公司 用于可伸缩视频编码的方法和装置
TW201210325A (en) 2010-07-21 2012-03-01 Nokia Corp Method and apparatus for indicating switching points in a streaming session
JP5728649B2 (ja) 2010-08-06 2015-06-03 パナソニックIpマネジメント株式会社 再生装置、集積回路、再生方法、プログラム
US20120230409A1 (en) 2011-03-07 2012-09-13 Qualcomm Incorporated Decoded picture buffer management
US9516379B2 (en) 2011-03-08 2016-12-06 Qualcomm Incorporated Buffer management in video codecs
US9706227B2 (en) 2011-03-10 2017-07-11 Qualcomm Incorporated Video coding techniques for coding dependent pictures after random access
US9866859B2 (en) * 2011-06-14 2018-01-09 Texas Instruments Incorporated Inter-prediction candidate index coding independent of inter-prediction candidate list construction in video coding
RU2581566C2 (ru) * 2011-06-30 2016-04-20 Телефонактиеболагет Л М Эрикссон (Пабл) Сигнализация опорного изображения
PT3091744T (pt) 2011-06-30 2017-08-31 ERICSSON TELEFON AB L M (publ) Sinalização de imagem de referência
PT2728861T (pt) 2011-07-02 2017-10-17 Samsung Electronics Co Ltd Método e aparelho para multiplexar e desmultiplexar dados de vídeo para identificar o estado de reprodução de dados de vídeo
EP2732626A1 (en) * 2011-07-15 2014-05-21 Telefonaktiebolaget L M Ericsson (PUBL) An encoder and method thereof for assigning a lowest layer identity to clean random access pictures
CN103907347B (zh) 2011-08-31 2018-01-30 诺基亚技术有限公司 多视图视频编码和解码
CN107659820B (zh) 2011-09-22 2020-03-10 Lg 电子株式会社 用信号发送图像信息的方法和装置,以及使用其的解码方法和装置
US9420307B2 (en) * 2011-09-23 2016-08-16 Qualcomm Incorporated Coding reference pictures for a reference picture set
KR101835625B1 (ko) 2011-10-26 2018-04-19 인텔렉추얼디스커버리 주식회사 움직임 후보 리스트 생성 방법 및 그를 이용한 부호화 장치
US9264717B2 (en) 2011-10-31 2016-02-16 Qualcomm Incorporated Random access with advanced decoded picture buffer (DPB) management in video coding
MX338055B (es) * 2012-01-19 2016-04-01 Vid Scale Inc Metodo y aparato para señalizacion y construccion de listas de imagenes de referencia de codificacion de video.
US9369710B2 (en) * 2012-02-06 2016-06-14 Qualcomm Incorporated Reference picture list modification for video coding
US9602817B2 (en) 2012-07-12 2017-03-21 Cisco Technology, Inc. Management of decoded picture buffer at picture format transitions
KR101981712B1 (ko) * 2012-11-21 2019-05-24 엘지전자 주식회사 영상 디코딩 방법 및 이를 이용하는 장치
US10404979B2 (en) * 2016-03-17 2019-09-03 Mediatek Inc. Video coding with interpolated reference pictures

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004274732A (ja) * 2003-02-19 2004-09-30 Matsushita Electric Ind Co Ltd 動画像符号化方法、及び、動画像復号化方法
JP2009543508A (ja) * 2006-07-12 2009-12-03 エルジー エレクトロニクス インコーポレイティド 信号処理方法及び装置
US20080117985A1 (en) * 2006-10-16 2008-05-22 Nokia Corporation System and method for implementing efficient decoded buffer management in multi-view video coding
JP2009290389A (ja) * 2008-05-28 2009-12-10 Hitachi Ltd 画像処理装置

Non-Patent Citations (5)

* Cited by examiner, † Cited by third party
Title
RICKARD SJOBERG, JONATAN SAMUELSSON: "Absolute signaling of reference pictures", JOINT COLLABORATIVE TEAM ON VIDEO CODING (JCT-VC) OF ITU-T SG16 WP3 AND ISO/IEC JTC1/SC29/WG11 6TH M, vol. JCTVC-F493, JPN6015020988, 22 July 2011 (2011-07-22), pages 1 - 15, XP003031157, ISSN: 0003082241 *
THOMAS WIEGAND: "Editor's Proposed Draft Text Modifications for Joint Video Specification (ITU-T Rec. H.264 | ISO/IEC", JOINT VIDEO TEAM (JVT) OF ISO/IEC MPEG AND ITU-T VCEG 5TH MEETING: GENEVA, SWITZERLAND, vol. JVT-E146d37, JPN6015020987, 17 October 2002 (2002-10-17), pages 57 - 63, ISSN: 0003082240 *
YE-KUI WANG, ET AL.: "On CDR picture", JOINT COLLABORATIVE TEAM ON VIDEO CODING (JCT-VC) OF ITU-T SG16 WP3 AND ISO/IEC JTC1/SC29/WG11 6TH M, vol. JCTVC-F464, JPN6015020990, 1 July 2011 (2011-07-01), pages 1 - 3, ISSN: 0003082242 *
YE-KUI WANG, ET AL.: "POC Recovery in Random Access Point SEI Message", JOINT VIDEO TEAM (JVT) OF ISO/IEC MPEG & ITU-T VCEG (ISO/IEC JTC1/SC29/WG11 AND ITU-T SG16 Q.6) 6TH, vol. JCT-F050, JPN6015020986, 13 December 2002 (2002-12-13), pages 1 - 5, ISSN: 0003082239 *
YE-KUI WANG, YING CHEN: "AHG21: On DPB management", JOINT COLLABORATIVE TEAM ON VIDEO CODING (JCT-VC) OF ITU-T SG16 WP3 AND ISO/IEC JTC1/SC29/WG11 7TH M, vol. JCTVC-G314, JPN6015020991, 23 November 2011 (2011-11-23), pages 1 - 7, ISSN: 0003373314 *

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9936197B2 (en) 2011-10-28 2018-04-03 Samsung Electronics Co., Ltd. Method for inter prediction and device therefore, and method for motion compensation and device therefore
US10575002B2 (en) 2011-10-28 2020-02-25 Samsung Electronics Co., Ltd. Method for inter prediction and device therefor, and method for motion compensation and device therefor
US10819989B2 (en) 2011-10-28 2020-10-27 Samsung Electronics Co., Ltd. Method for inter prediction and device therefor, and method for motion compensation and device therefor
US11206414B2 (en) 2011-10-28 2021-12-21 Samsung Electronics Co., Ltd. Method for inter prediction and device therefor, and method for motion compensation and device therefor
US11962791B2 (en) 2011-10-28 2024-04-16 Samsung Electronics Co., Ltd. Method for inter prediction and device therefor, and method for motion compensation and device therefor

Also Published As

Publication number Publication date
JP2014530571A (ja) 2014-11-17
JP2014526858A (ja) 2014-10-06
WO2013043893A3 (en) 2013-08-22
CA2849281C (en) 2017-02-28
EP2759134A2 (en) 2014-07-30
IL231210A0 (en) 2014-04-30
WO2013043886A3 (en) 2013-10-31
EP2759133A1 (en) 2014-07-30
CN108174202A (zh) 2018-06-15
IL231320A (en) 2016-09-29
TW201330626A (zh) 2013-07-16
EP2759135A2 (en) 2014-07-30
CN108174202B (zh) 2021-06-01
KR20140065004A (ko) 2014-05-28
CA2849284C (en) 2017-01-31
US20200107045A1 (en) 2020-04-02
CN103828365B (zh) 2017-10-31
KR101553788B1 (ko) 2015-10-01
MY166674A (en) 2018-07-18
KR20140065002A (ko) 2014-05-28
SG11201400449UA (en) 2014-05-29
AU2012312323A1 (en) 2014-04-03
CN108513128B (zh) 2022-06-24
RU2014116245A (ru) 2015-10-27
CA2848406C (en) 2017-05-16
US20130077679A1 (en) 2013-03-28
US20130077681A1 (en) 2013-03-28
CN107770523A (zh) 2018-03-06
IN2014CN01825A (ja) 2015-05-29
IL264182B (en) 2021-03-25
AU2012312318B2 (en) 2015-07-30
CN108513128A (zh) 2018-09-07
TWI521944B (zh) 2016-02-11
WO2013044075A3 (en) 2013-10-03
TWI531218B (zh) 2016-04-21
CN103828374B (zh) 2017-09-08
CN103828365A (zh) 2014-05-28
MY172880A (en) 2019-12-13
CA2849283A1 (en) 2013-03-28
IN2014CN01821A (ja) 2015-05-29
CN103828368A (zh) 2014-05-28
EP2759136B1 (en) 2023-01-04
CA2849283C (en) 2020-03-24
TW201334542A (zh) 2013-08-16
IN2014CN01827A (ja) 2015-05-29
TWI521952B (zh) 2016-02-11
CN107580229A (zh) 2018-01-12
US9998757B2 (en) 2018-06-12
HK1247013A1 (zh) 2018-09-14
EP2759136A2 (en) 2014-07-30
JP2016213865A (ja) 2016-12-15
JP2014530569A (ja) 2014-11-17
KR20140065001A (ko) 2014-05-28
AU2012312344B2 (en) 2015-09-17
BR112014006842A2 (pt) 2017-04-04
CN107517381A (zh) 2017-12-26
JP5940669B2 (ja) 2016-06-29
BR112014006842B1 (pt) 2022-03-03
KR101614635B1 (ko) 2016-04-21
US20130077677A1 (en) 2013-03-28
CA2849281A1 (en) 2013-03-28
ZA201402902B (en) 2016-11-30
MY166681A (en) 2018-07-18
US11490119B2 (en) 2022-11-01
CN103828375A (zh) 2014-05-28
SG11201400387PA (en) 2014-05-29
CN108184123B (zh) 2021-06-01
HK1197329A1 (en) 2015-01-09
CN108184123A (zh) 2018-06-19
BR112014006867A2 (pt) 2017-04-04
CN107517381B (zh) 2020-03-24
JP2019126079A (ja) 2019-07-25
TW201320762A (zh) 2013-05-16
AU2012312344A1 (en) 2014-04-03
CN107580229B (zh) 2020-06-09
CN103814575B (zh) 2017-05-24
CN108337517A (zh) 2018-07-27
EP2759133B1 (en) 2020-08-12
CA2849501C (en) 2017-02-28
IL231266A (en) 2016-03-31
BR112014006854A2 (pt) 2017-04-04
IL264182A (en) 2019-02-28
IN2014CN01822A (ja) 2015-05-29
KR101615051B1 (ko) 2016-04-22
RU2580098C2 (ru) 2016-04-10
US10856007B2 (en) 2020-12-01
EP2759132B1 (en) 2019-12-18
RU2551815C1 (ru) 2015-05-27
SG11201400220VA (en) 2014-05-29
AR089558A1 (es) 2014-09-03
IL231267A0 (en) 2014-04-30
IL231320A0 (en) 2014-04-30
JP6498794B2 (ja) 2019-04-10
CN107682695B (zh) 2020-06-30
AU2012312323B2 (en) 2015-05-07
IL231316A0 (en) 2014-04-30
ZA201402900B (en) 2022-11-30
WO2013043892A2 (en) 2013-03-28
IL231210B (en) 2018-02-28
AR089562A1 (es) 2014-09-03
ES2776147T3 (es) 2020-07-29
AR089561A1 (es) 2014-09-03
KR20140066251A (ko) 2014-05-30
CN103828374A (zh) 2014-05-28
US9131245B2 (en) 2015-09-08
BR112014006845B1 (pt) 2022-07-19
CA2849284A1 (en) 2013-03-28
RU2587420C2 (ru) 2016-06-20
CN103814575A (zh) 2014-05-21
US9106927B2 (en) 2015-08-11
TW201338558A (zh) 2013-09-16
HK1247761A1 (zh) 2018-09-28
EP2759130B1 (en) 2020-08-12
KR20140066252A (ko) 2014-05-30
US20130077687A1 (en) 2013-03-28
AR089557A1 (es) 2014-09-03
TWI600311B (zh) 2017-09-21
AR089559A1 (es) 2014-09-03
JP6275780B2 (ja) 2018-02-07
IL231211A0 (en) 2014-04-30
CN108337517B (zh) 2022-03-29
KR20140065003A (ko) 2014-05-28
SG11201400264XA (en) 2014-07-30
CA2849499A1 (en) 2013-03-28
ZA201402898B (en) 2016-05-25
RU2571410C2 (ru) 2015-12-20
WO2013043913A1 (en) 2013-03-28
BR112014006843A2 (pt) 2017-04-04
US10034018B2 (en) 2018-07-24
CN103814574B (zh) 2018-01-26
EP2759132A2 (en) 2014-07-30
US20130077680A1 (en) 2013-03-28
JP6009569B2 (ja) 2016-10-19
RU2549162C1 (ru) 2015-04-20
JP5976816B2 (ja) 2016-08-24
EP2759134B1 (en) 2020-02-19
IL231211A (en) 2017-08-31
MY171041A (en) 2019-09-23
TWI530162B (zh) 2016-04-11
RU2014116246A (ru) 2015-10-27
BR112014006845A2 (pt) 2017-04-04
IL256349A (en) 2018-02-28
IL231316A (en) 2016-09-29
KR101612651B1 (ko) 2016-04-14
CN107770523B (zh) 2020-07-17
CA2849501A1 (en) 2013-03-28
BR112014006839A2 (pt) 2017-04-04
SG11201400265WA (en) 2014-08-28
AU2012312318A1 (en) 2014-04-03
CN107682695A (zh) 2018-02-09
AU2012312317A1 (en) 2014-04-03
US9420307B2 (en) 2016-08-16
ZA201402913B (en) 2017-11-29
ZA201402901B (en) 2017-10-29
IL231267A (en) 2016-08-31
AU2012312317B2 (en) 2015-05-07
TW201338557A (zh) 2013-09-16
US20130077685A1 (en) 2013-03-28
WO2013043892A3 (en) 2013-10-31
TW201325251A (zh) 2013-06-16
JP2014530568A (ja) 2014-11-17
US9338474B2 (en) 2016-05-10
US20210044827A1 (en) 2021-02-11
KR101614634B1 (ko) 2016-04-29
CN103999462A (zh) 2014-08-20
RU2014116243A (ru) 2015-10-27
MY169092A (en) 2019-02-18
MY171154A (en) 2019-09-27
JP5882475B2 (ja) 2016-03-09
AU2012312338A1 (en) 2014-03-27
CA2849499C (en) 2018-03-06
CN103828375B (zh) 2017-06-09
RU2014116250A (ru) 2015-10-27
EP2759135B1 (en) 2017-02-08
HK1253675A1 (zh) 2019-06-28
EP2759131A1 (en) 2014-07-30
AU2012312324B2 (en) 2015-09-24
WO2013043907A1 (en) 2013-03-28
CN103828368B (zh) 2018-03-20
AU2012312338B2 (en) 2015-08-27
IL256349B (en) 2019-02-28
US10542285B2 (en) 2020-01-21
KR20140085460A (ko) 2014-07-07
WO2013043886A2 (en) 2013-03-28
CA2848406A1 (en) 2013-03-28
US20180324458A1 (en) 2018-11-08
RU2584510C2 (ru) 2016-05-20
ZA201402899B (en) 2017-06-28
WO2013044075A2 (en) 2013-03-28
JP6038929B2 (ja) 2016-12-07
CN103814574A (zh) 2014-05-21
SG11201400317XA (en) 2014-06-27
AU2012312324A1 (en) 2014-04-17
JP5940668B2 (ja) 2016-06-29
CN103999462B (zh) 2017-09-22
EP2759130A1 (en) 2014-07-30
HK1243571A1 (zh) 2018-07-13
US20130077678A1 (en) 2013-03-28
JP5937216B2 (ja) 2016-06-22
WO2013043893A2 (en) 2013-03-28
IL231266A0 (en) 2014-04-30
JP2018093506A (ja) 2018-06-14
KR101613804B1 (ko) 2016-04-19
US9237356B2 (en) 2016-01-12
KR101614633B1 (ko) 2016-04-29
WO2013043887A1 (en) 2013-03-28
JP2014530567A (ja) 2014-11-17
JP2014530570A (ja) 2014-11-17
TWI498004B (zh) 2015-08-21
CA3062214A1 (en) 2013-03-28
AR089560A1 (es) 2014-09-03

Similar Documents

Publication Publication Date Title
US10856007B2 (en) Decoded picture buffer management
JP5972984B2 (ja) 参照ピクチャセットの効率的シグナリング

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20150427

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20150602

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20150902

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20160405

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20160705

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20160816

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20160914

R150 Certificate of patent or registration of utility model

Ref document number: 6009569

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250