JP6530035B2 - 復号方法及び復号装置 - Google Patents

復号方法及び復号装置 Download PDF

Info

Publication number
JP6530035B2
JP6530035B2 JP2017207318A JP2017207318A JP6530035B2 JP 6530035 B2 JP6530035 B2 JP 6530035B2 JP 2017207318 A JP2017207318 A JP 2017207318A JP 2017207318 A JP2017207318 A JP 2017207318A JP 6530035 B2 JP6530035 B2 JP 6530035B2
Authority
JP
Japan
Prior art keywords
information
picture
poc
reference picture
frame
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2017207318A
Other languages
English (en)
Other versions
JP2018057002A (ja
Inventor
サーチン ジー. デシュパンダ
サーチン ジー. デシュパンダ
クリストファー エー. セガール
クリストファー エー. セガール
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Velos Media International Ltd
Original Assignee
Velos Media International Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Velos Media International Ltd filed Critical Velos Media International Ltd
Publication of JP2018057002A publication Critical patent/JP2018057002A/ja
Priority to JP2019092162A priority Critical patent/JP6913126B2/ja
Application granted granted Critical
Publication of JP6530035B2 publication Critical patent/JP6530035B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/105Selection of the reference unit for prediction within a chosen coding or prediction mode, e.g. adaptive choice of position and number of pixels used for prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/157Assigned coding mode, i.e. the coding mode being predefined or preselected to be further used for selection of another element or parameter
    • H04N19/159Prediction type, e.g. intra-frame, inter-frame or bidirectional frame prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/172Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a picture, frame or field
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/44Decoders specially adapted therefor, e.g. video decoders which are asymmetric with respect to the encoder
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/46Embedding additional information in the video signal during the compression process
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/573Motion compensation with multiple frame prediction using two or more reference frames in a given prediction direction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/577Motion compensation with bidirectional frame interpolation, i.e. using B-pictures
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/58Motion compensation with long-term prediction, i.e. the reference frame for a current frame not being the temporally closest one
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/70Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Description

本発明は、ビデオの符号化および/または復号に関する。
デジタルビデオは、典型的には一連の画像またはフレームとして表現され、そのそれぞれが画素の配列を含む。各画素は、輝度および/または色情報などの情報を含む。多くの場合、各画素は3色のセットとして表現され、そのそれぞれは8ビットの色値によって定義できる。
例えば、H.264/MPEG−4 AVC(H.264/AVC)などのビデオ符号化方式は、通常、複雑さの増大と引き換えに、より高い符号化効率を提供する。ビデオ符号化方式に対する画像品質要件の増大および画像解像度要件の増大も、符号化の複雑さを増大させている。並列復号に適したビデオデコーダは、復号プロセスの速度を向上させ、メモリ要件を低減させることができ、並列符号化に適したビデオエンコーダは、符号化プロセスの速度を向上させ、メモリ要件を低減させることができる。
H.264/MPEG−4 AVC[ITU−T VCEGおよびISO/IEC MPEGのジョイントビデオチーム、「H.264:オーディオビジュアルサービス全般のための高度ビデオ符号化(H.264:Advanced video coding for generic audiovisual services)」、ITU−T
Recommendation H.264およびISO/IEC 14496−10(MPEG4−Part 10)、2007年11月]、および同様にJCT−VC[「検討中のテストモデル案(Draft Test Model Under Consideration)」、JCTVC−A205、JCT−VCミーティング、ドレスデン、2010年4月(JCT−VC)]は、いずれも参照によりその全体が本願明細書に組み込まれるが、これらは、圧縮効率のためにビデオシーケンス中の参照ピクチャに基づきピクチャを復号するビデオコーデック(エンコーダ/デコーダ)の仕様書である。
参照ピクチャに基づきピクチャを復号するための、より効率の高い方式を提供することが望まれている。
本発明は、ビデオビットストリームを復号する復号方法であって、参照ピクチャセットに基づき、インター予測を使用して現ピクチャを復号する復号ステップと、将来のインター予測のために参照される復号されたピクチャを記憶する記憶ステップと、を含み復号ステップは、参照ピクチャセットを、少なくとも、(a)参照ピクチャに関するピクチャオーダーカウント(POC)を示すビット列のうち、ビットストリーム中でシグナリングされた最下位ビット(LSB)側の所定の数のビットに基づく1つ以上の第1の参照ピクチャ識別子、および(b)前記現ピクチャの長期間参照ピクチャセットに含まれる第i番目の長期間参照ピクチャのPOC値を判断するための1つ以上の第2の参照ピクチャ識別子、を使用して復号する。
本発明の上記その他の目的、特徴、および利点は、添付の図面と併せて以下の本発明の詳細な説明を考察することで、より容易に理解されるであろう。
H.264/AVCビデオエンコーダを示す。 H.264/AVCビデオデコーダを示す。 例示的なスライス構造を示す。 別の例示的なスライス構造を示す。 エントロピースライスの再構築を示す。 図5のエントロピースライスの一部の再構築を示す。 省略されたLSBカウント値を用いたエントロピースライスの再構築を示す。 長期間ピクチャ値を用いたエントロピースライスの再構築を示す。 長期間ピクチャ値を用いて第1の先行フレームを選択することによる、エントロピースライスの再構築を示す。 同じ最下位ビットカウント値を有する重複長期間ピクチャフレームを使用することによる、エントロピースライスの再構築を示す。 参照フレームを選択する方式を示す。 参照フレームを選択する方式を示す。 参照フレームを選択する別の方式を示す。 参照フレームを選択する別の方式を示す。 参照フレームを選択する別の方式を示す。 参照フレームを選択する別の方式を示す。
本願明細書に記載する実施形態により、符号化/復号を使用する任意のビデオコーダ/デコーダ(コーデック)を提供可能であるが、単に説明を目的として、H.264/AVCエンコーダおよびH.264/AVCデコーダに関連させて例示的な実施形態について記載する。多くのビデオ符号化方式は、ブロックベースのハイブリッドビデオ符号化手法に基づいており、情報源符号化方式は、フレーム間とも称するピクチャ間の予測、フレーム内とも称するピクチャ内の予測、および予測残差の変換符号化のハイブリッドである。フレーム間予測は、時間的冗長性を利用することができ、フレーム内、および予測残差の変換符号化は、空間的冗長性を利用することができる。
図1は、電子デバイス102の例示的なエンコーダ104を示すブロック図である。なお、電子デバイス102内に含まれるものとして示されている構成要素のうちの1つ以上は、ハードウェアおよび/またはソフトウェアで実装され得る。例えば、電子デバイス102は、エンコーダ104を含むが、エンコーダ104はハードウェアおよび/またはソフトウェアで実装され得る。
電子デバイス102は、供給器134を含むとよい。供給器134は、ピクチャまたは画像データ(例えばビデオ)を情報源106としてエンコーダ104に供給できる。供給器134の限定的でない例としては、画像センサ、メモリ、通信インターフェース、ネットワークインターフェース、無線受信器、ポート、ビデオフレームコンテンツ、以前に符号化されたビデオコンテンツ、符号化されていないビデオコンテンツなどが挙げられる。
情報源106は、フレーム内予測モジュールおよび再構築バッファ140に供給されるとよい。情報源106はさらに、動き推定および動き補償モジュール166に供給され、さらに減算モジュール146に供給されるとよい。
フレーム内予測モジュールおよび再構築バッファ140は、情報源106および再構築データ180に基づいて、イントラモード情報148およびイントラ信号142を発生さ
せることができる。動き推定および動き補償モジュール166は、情報源106および参照ピクチャバッファ196信号198に基づいて、インターモード情報168およびインター信号144を発生させることができる。
参照ピクチャバッファ196信号198は、参照ピクチャバッファ196に記憶された1つ以上の参照ピクチャからのデータを含むとよい。参照ピクチャバッファ196はさらに、RPS(reference picture set:参照ピクチャセット)インデックスのイニシャライザモジュール108を含んでもよい。イニシャライザモジュール108は、RPSのバッファリングおよびリスト構築に対応する参照ピクチャを処理できる。
エンコーダ104は、モードに従って、イントラ信号142とインター信号144とから選択することができる。イントラ信号142は、イントラ符号化モードにおいて、ピクチャ内の空間的特徴を利用するために使用できる。インター信号144は、インター符号化モードにおいて、ピクチャ間の時間的特徴を利用するために使用できる。イントラ符号化モードの間は、イントラ信号142が減算モジュール146に供給されるとよく、イントラモード情報158がエントロピー符号化モジュール160に供給されるとよい。インター符号化モードの間は、インター信号144が減算モジュール146に供給されるとよく、インターモード情報168がエントロピー符号化モジュール160に供給されるとよい。
予測残差148を生成するために、イントラ信号142またはインター信号144のいずれか(モードによる)が、減算モジュール146にて情報源106から減算される。予測残差148は、変換モジュール150に供給される。変換モジュール150は、予測残差148を圧縮して、変換信号152を生成でき、変換信号152は量子化モジュール154に供給される。量子化モジュール154は、変換信号152を量子化して、変換および量子化された係数(TQC:transformed and quantized coefficient)156を生成する。
TQC156は、エントロピー符号化モジュール160および逆量子化モジュール170に供給される。逆量子化モジュール170は、TQC156に対して逆量子化を行い、逆量子化信号172を生成し、逆量子化信号172は逆変換モジュール174に供給される。逆変換モジュール174は、逆量子化信号172を伸張して伸張信号176を生成し、伸張信号176は再構築モジュール178に供給される。
再構築モジュール178は、伸張信号176に基づいて再構築データ180を生成できる。例えば、再構築モジュール178は、(変更された)ピクチャを再構築できる。再構築データ180は、デブロッキングフィルタ182と、イントラ予測モジュールおよび再構築バッファ140とに供給されるとよい。デブロッキングフィルタ182は、フィルタされた信号184を、再構築データ180に基づいて生成できる。
フィルタされた信号184は、サンプル適応オフセット(SAO:sample adaptive offset)モジュール186に供給されるとよい。SAOモジュール186は、エントロピー符号化モジュール160に供給されるSAO情報188、および適応ループフィルタ(ALF:adaptive loop filter)192に供給されるSAO信号190を生成できる。ALF192は、参照ピクチャバッファ196に供給されるALF信号194を生成する。ALF信号194は、参照ピクチャとして使用できる1つ以上のピクチャからのデータを含んでもよい。
エントロピー符号化モジュール160は、TQC156を符号化してビットストリーム
114を生成できる。さらに、エントロピー符号化モジュール160は、コンテキスト適応型可変長符号化(CAVLC:Context−Adaptive Variable
Length Coding)またはコンテキスト適応型2値算術符号化(CABAC:Context−Adaptive Binary Arithmetic Coding)を使用してTQC156を符号化できる。具体的には、エントロピー符号化モジュール160は、イントラモード情報158、インターモード情報168、およびSAO情報188のうちの1つ以上に基づいてTQC156を符号化できる。ビットストリーム114は、符号化ピクチャデータを含むとよい。多くの場合、エンコーダは、一般にマクロブロックと呼ばれるブロックの連続としてフレームを符号化する。
HEVCなどのビデオ圧縮に関わる量子化は、ある範囲の値を単一の値に圧縮することにより達成される、損失の多い圧縮方式である。量子化パラメータ(QP:quantization parameter)は、再構築されたビデオの品質および圧縮率の両方に基づいて量子化を実行するために使用される、事前定義されたスケーリング・パラメータである。ブロックタイプは、所定のブロックの特徴をブロックサイズおよびその色情報に基づいて表現するよう、HEVCにおいて定義されている。QP、解像度情報、およびブロックタイプは、エントロピー符号化の前に判断されるとよい。例えば、電子デバイス102(例えばエンコーダ104)が、QP、解像度情報、およびブロックタイプを判断して、これらがエントロピー符号化モジュール160に供給されてもよい。
エントロピー符号化モジュール160は、TQC156のブロックに基づいてブロックサイズを求めてもよい。例えば、ブロックサイズは、TQCのブロックの1次元方向のTQC156の数であってもよい。すなわち、TQCのブロック内のTQC156の数は、ブロックサイズの2乗と等しくてもよい。例として、ブロックサイズは、TQCのブロック内のTQC156の数の平方根として求められてもよい。解像度は、画素幅かける画素高さと定義できる。解像度情報は、ピクチャの幅、ピクチャの高さ、または両方の画素数を含んでもよい。ブロックサイズは、TQCの2Dブロックの1次元方向のTQC156の数と定義できる。
一部の構成では、ビットストリーム114が別の電子デバイスに送信されてもよい。例えば、ビットストリーム114は、通信インターフェース、ネットワークインターフェース、無線送信機、ポートなどに供給されてもよい。例として、ビットストリーム114は、LAN、インターネット、携帯電話基地局などを介して別の電子デバイスへ送信されてもよい。さらに、または代わりに、ビットストリーム114は、電子デバイス102またはその他電子デバイス上のメモリに記憶されてもよい。
図2は、電子デバイス202上の例示的なデコーダ212を示すブロック図である。デコーダ212は、電子デバイス202に含まれてもよい。例えば、デコーダ212は、HEVCデコーダであってもよい。デコーダ212および/またはデコーダ212に含まれているように示されている構成要素のうちの1つ以上は、ハードウェアおよび/またはソフトウェアで実装され得る。デコーダ212は、復号すべきビットストリーム214(例えばビットストリーム214に含まれる1つ以上の符号化ピクチャ)を受信できる。一部の構成では、受信されたビットストリーム214は、受信されたスライスヘッダ、受信されたPPS(すなわちピクチャパラメータセット(picture parameter
set))、受信されたバッファ記述情報などの、受信されたオーバーヘッド情報を含み得る。ビットストリーム214に含まれる符号化ピクチャは、1つ以上の符号化参照ピクチャおよび/または1つ以上の他の符号化ピクチャを含み得る。
(ビットストリーム214に含まれる1つ以上の符号化ピクチャの中の)受信されたシンボルは、エントロピー復号モジュール268によってエントロピー復号されるとよく、
それによって動き情報信号270、ならびに量子化、スケーリングおよび/または変換された係数272が生成される。
動き情報信号270は、動き補償モジュール274にてフレームメモリ278からの参照フレーム信号298の一部と組み合わされてもよく、これによりフレーム間予測信号282が生成される。量子化、デスケーリングおよび/または変換された係数272は、逆モジュール262によって逆量子化、スケーリングおよび逆変換されてもよく、それによって、復号残差信号284が生成される。復号残差信号284を予測信号292に加算して、結合信号286を生成することができる。予測信号292は、フレーム間予測信号282、またはフレーム内予測モジュール288によって生成されたフレーム内予測信号290のいずれかから選択された信号とされ得る。いくつかの構成において、この信号選択は、ビットストリーム214に基づいてもよい(例えばビットストリーム214によって制御される)。
フレーム内予測信号290は、(例えば現フレームにおいて)以前に復号された結合信号292からの情報から予測できる。結合信号292は、さらにデブロッキングフィルタ294によってフィルタされるとよい。結果として生じるフィルタされた信号296は、フレームメモリ278に書き込むことができる。結果として生じるフィルタされた信号296は、復号ピクチャを含み得る。
フレームメモリ778は、本願明細書に記載されるDPB(すなわち表示ピクチャバッファ(display picture buffer))を含んでもよい。DPBは、短期間または長期間参照フレームとして保持され得る1つ以上の復号ピクチャを含んでもよい。フレームメモリ278は、復号ピクチャに対応するオーバーヘッド情報も含んでもよい。例えば、フレームメモリ278は、スライスヘッダ、PPS情報、バッファ記述情報などを含んでもよい。これらの情報のうちの1つ以上は、エンコーダ(例えばエンコーダ104)からシグナリングされてもよい。フレームメモリ278は、復号ピクチャ718を供給してもよい。
複数のマクロブロックを含む入力ピクチャは、1つまたはいくつかのスライスへと分割されてもよい。エンコーダおよびデコーダにて使用される参照ピクチャが同じであり、デブロッキングフィルタリングにおいてスライス境界を越える情報が使用されないという条件の下で、スライスが表現するピクチャの区域中のサンプルの値は、他のスライスからのデータを使用せずに適切に復号できる。したがって、あるスライスに対するエントロピー復号およびマクロブロックの再構築は、他のスライスには依存しない。具体的には、エントロピー符号化の状態は、各スライスの開始時にリセットすることができる。他のスライス中のデータは、エントロピー復号および再構築の両方のための近傍利用可能性を定義する際に、利用不可能としてマークすることができる。スライスは、並列にエントロピー復号および再構築されてもよい。好適には、イントラ予測および動きベクトル予測はスライスの境界を越えることができない。これに対し、デブロッキングフィルタリングは、スライス境界を越える情報を使用してもよい。
図3は、水平方向に11個のマクロブロックおよび垂直方向に9個のマクロブロックを含む、例示的なビデオピクチャ90を示す(例示的な9個のマクロブロックが91〜99として標示されている)。図3は、「スライス#0」と示された第1のスライス89、「スライス#1」と示された第2のスライス88、および「スライス#2」と示された第3のスライス87の例示的な3つのスライスを示す。H.264/AVCデコーダは、3つのスライス87、88、89を並列に復号および再構築することができる。スライスはそれぞれ、逐次方式で走査線の順に送信されてもよい。各スライスに対する復号/再構築処理の開始時に、エントロピー復号268が初期化またはリセットされ、他のスライス中の
マクロブロックは、エントロピー復号およびマクロブロック再構築の両方に対し利用不可能としてマークされる。したがって、例えば93と標示されたマクロブロックなどの「スライス#1」中のマクロブロックに対して、「スライス#0」中のマクロブロック(例えば91および92と標示されたマクロブロック)をエントロピー復号または再構築のために使用することはできない。一方、例えば95と標示されたマクロブロックなどの「スライス#1」中のマクロブロックに対しては、「スライス#1」中の他のマクロブロック(例えば93および94と標示されたマクロブロック)をエントロピー復号または再構築のために使用できる。したがって、エントロピー復号およびマクロブロック再構築は、スライス内で順次進行する。スライスが、フレキシブルマクロブロック順序付け(FMO:flexible macroblock ordering)を用いて定義されている場合を除いて、スライス内のマクロブロックは、ラスタ走査の順に処理される。
フレキシブルマクロブロック順序付けは、スライスグループを定義して、ピクチャがどのようにスライスに分割されるかを変更する。スライスグループ中のマクロブロックは、マクロブロック対スライスグループマップによって定義され、マクロブロック対スライスグループマップは、ピクチャパラメータセットのコンテンツおよびスライスヘッダ中の追加情報によってシグナリングされる。マクロブロック対スライスグループマップは、ピクチャ中の各マクロブロックのスライスグループ識別番号から成る。スライスグループ識別番号は、関連するマクロブロックがどのスライスグループに属するかを指定する。各スライスグループは、1つ以上のスライスに分割することができ、スライスは、同じスライスグループ内のマクロブロックのシーケンスであり、該シーケンスは、特定のスライスグループのマクロブロックのセット内のラスタ走査の順に処理される。エントロピー復号およびマクロブロック再構築は、スライスグループ内で順次進行する。
図4は、「スライスグループ#0」と示された第1のスライスグループ86、「スライスグループ#1」と示された第2のスライスグループ85、および「スライスグループ#2」と示された第3のスライスグループ84の3つのスライスグループへの、例示的なマクロブロック割り当てを示す。これらのスライスグループ84、85、86は、ピクチャ90中の2つの前景領域および1つの背景領域に、それぞれ関連し得る。
ピクチャは、1つ以上のスライスに分割されてもよく、エンコーダおよびデコーダにて使用される参照ピクチャが同一であることを条件として、スライスが表現するピクチャ区域中のサンプルの値が他のスライスからのデータを使用せずに正確に再構築可能であるという点で、スライスは自己充足的であるとよい。スライス内の再構築されたマクロブロックはすべて、再構築のための近傍の定義において利用可能であるとよい。
スライスは、2つ以上のエントロピースライスに分割されてもよく、エントロピースライスが表現するピクチャ区域が他のエントロピースライスからのデータを使用せずに正確にエントロピー復号可能であるという点で、エントロピースライスは自己充足的であるとよい。エントロピー復号268は、各エントロピースライスの復号開始時にリセットすることができる。他のエントロピースライス中のデータは、エントロピー復号のための近傍利用可能性を定義する際に利用不可能としてマークすることができる。
ピクチャを復号するよう構成されたデバイスが、現ピクチャを含む一連のピクチャを含んだビットストリームを取得、あるいは受信する。デバイスはさらに、現ピクチャの復号、またはビットストリーム中でピクチャがシグナリングされる順序において現ピクチャの後のピクチャの復号に使用可能な、他のフレームを識別するために使用できる、参照ピクチャセット(RPS)パラメータを取得する。
RPSは、現フレームに関連する参照ピクチャのセットの識別を提供する。RPSは、
現ピクチャのインター予測に使用可能な、表示順で現ピクチャより前の参照ピクチャを識別すること、および/または現ピクチャのインター予測に使用可能な、表示順で現ピクチャより後の参照ピクチャを識別することができる。例えば、システムがフレーム1、3、5を受信し、5が3を参照に使用し、エンコーダがフレーム1をフレーム7の予測に使用する場合、5のRPSは、フレーム1がフレーム5の参照に使用されなくても、フレーム3および1の両方をフレームメモリ278に維持するようシグナリングしてもよい。一実施形態では、5のRPSは、[−2 −4]であってもよい。さらに、フレームメモリ278は、表示ピクチャバッファ、または同様な意味合いでDPBと呼ぶこともできる。この例の場合、フレーム番号は、フレームの表示順、すなわち出力順に対応する。
RPSは、後から使用するために復号ピクチャバッファ(DPB:decoded picture buffer)内に少なくとも限られた持続時間にわたり保持されるべきである1つ以上の参照ピクチャを記述する。RPSの識別は、各ピクチャのスライスヘッダ中に、ピクチャとともに、および/またはピクチャ群とともに含まれ得る。一実施形態では、RPSのリストは、ピクチャパラメータセット(PPS)中で送られてもよい。その場合、スライスヘッダは、スライスに対して使用される、PPS中で送られたRPSのうちの1つを識別するとよい。例えば、ピクチャ群のためのRPSは、ピクチャパラメータセット(PPS)中でシグナリングされてもよい。現フレームのRPSの一部ではない、DPB中の任意のピクチャは、「参照に使用されない」とマークされてもよい。
DPBは、デコーダにて再構築された(例えば復号された)ピクチャを記憶するために使用されてもよい。その結果、記憶されたこれらのピクチャは、例えばインター予測方式において使用されてもよい。さらに、DPB中のピクチャは、ピクチャオーダーカウント(POC)に関連付けられるとよい。POCは、各符号化ピクチャに関連付けられ、出力順におけるピクチャ位置が増加するとともに増加する値を有する、変数とされてもよい。すなわち、POCは、表示のためにピクチャを正しい順で供給するためにデコーダにより使用されてもよい。POCは、参照ピクチャリストの構築、および復号された参照ピクチャの識別中に、参照ピクチャを識別するためにも使用されてもよい。さらに、POCは、エンコーダからデコーダへの送信中に失われたピクチャの識別に使用されてもよい。
図5を参照すると、エンコーダからデコーダに提供されるフレーム300のセットの一例が示されている。フレームはそれぞれ、関連するPOC310を有するとよい。図のように、POCは、負数から大きな正数までインクリメントしてもよい。一部の実施形態では、POCは、ゼロからより大きな正数までインクリメントするだけであってもよい。典型的には、POCは、フレーム毎に1インクリメントされるが、場合によっては、1つ以上のPOCはスキップ、あるいは省略される。例えば、エンコーダ中のフレームのセットに関するPOCは、0、1、2、3、4、5などであってもよい。例えば、POC3がスキップされるか、あるいは省略されて、エンコーダ中の同じまたは別のフレームのセットに関するPOCが、0、1、2、4、5などであってもよい。
POCが十分に大きくなるのに伴い、POCを使用して各フレームを識別するために多数のビットが必要となるであろう。エンコーダは、選択された、POCの最下位ビット(LSB)数、例えば4ビットなどを各フレームの識別に使用することにより、特定のPOCの識別に使用されるビット数を削減することもできる。多くの場合、現フレームを復号するために使用される参照フレームは、現フレームに時間的に近く位置するので、この識別方式は適切であり、システムの計算複雑度の削減と、ビデオのビットレートの全体的な削減とをもたらす。ピクチャの識別に使用するLSBの数は、ビットストリーム中でデコーダにシグナリングされてもよい。
POCの選択されたLSB数が4であれば、図のように、LSBが4ビットであり、L
SBインデックスは16値(2^4)毎に繰り返す。したがって、フレーム0は、0の値を有するLSBを有し、フレーム1は、1の値を有するLSBを有し、…、フレーム14は、14の値を有するLSBを有し、フレーム15は、15の値を有するLSBを有する。しかし、フレーム16は、再び0の値を有するLSBを有し、フレーム17は、再び1の値を有するLSBを有し、フレーム20は、4の値を有するLSBを有する。LSB識別子(概して、POCのLSB、または同様な意味合いでPOC LSBとも呼ばれる)は、LSB=POC%16の特徴を有するとよく、%は、16(2^最下位ビット数、この場合は4)で割った後の余りである。同じく、POCを識別するLSBの選択された数がNビットである場合、LSB識別子は、LSB=POC%(2^N)の特徴を有し、2^Nは、2のN乗を示す。フレームを識別するためにビットストリーム中にPOCを含めるよりも、エンコーダが、デコーダへのビットストリーム中にLSBインデックス(概して、POCのLSB、または同様な意味合いでPOC LSBとも呼ばれる)を提供するほうが好ましい。
現フレームまたは現フレームの後のフレームのインター予測に使用される参照フレームは、相対(例えばデルタ)参照(例えば、POC値間、あるいはdeltaPOCとcurrentPOCを使用する)または絶対参照(例えばPOCを使用する)のいずれかを使用するRPSを用いて識別され得る。一部の実施形態では、相対参照により識別されるフレームは、短期間参照フレームと呼ぶことができ、絶対参照により識別されるフレームは、長期間参照フレームと呼ぶことができる。例えば、POC5 310により識別され、ビットストリーム中でLSB5 320としてデコーダにシグナリングされるフレームは、関連するRPS330[−5,−2,−1]を有してもよい。RPS値の意味は後述する。
図5の一部を示す図6を参照する。[−5,−2,−1]のRPSは、現フレームに対して、5つ前のフレーム320、2つ前のフレーム321、および1つ前のフレーム322を含むフレームを指す。さらにこれは、5のPOC値を備える現フレームに関し、図6に示されているように、それぞれ0、3および4のPOC値を指す。典型的には、RPSは、現フレームのPOC値と、前フレームのPOC値との間の差を指す。例えば、5のPOC値を有する現フレームに対する[−5,−2,−1]のRPSは、5マイナス5=0、5マイナス2=3、および5マイナス1=4のPOC値を有するフレームを指す。RPSは、将来のフレームも含むことができる。将来のフレームは、RPSにおいて正値を用いて示されてもよい(正のdeltaPOC値)。
1つ以上のPOC値がスキップされる場合、あるいはビットストリームの一部で省略される場合など、POC値が連続していない場合、現フレームのPOC値と前フレームのPOC値との差は、図7に示されているように、前フレームと現フレームとの間に出力されるフレームの数と異なるかもしれない。図7に示されているように、[−5,−2,−1]のRPSは、5と等しいPOC値で識別されたフレームのPOCに対して、5つ前のフレーム320、2つ前のフレーム321、および1つ前のフレーム322を含むフレームを指す。RPSは、フレームとともに供給される、またはフレームのセットとともに供給されるなど、任意の適切な形で、ビットストリーム中でシグナリングされ得る。
図8を参照する。参照フレームをシグナリングするための別の方式は、概して長期間ピクチャと呼ばれる絶対参照を、フレームに関連するRPSにおいて使用することである。動きベクトル予測方式などの復号処理は、参照フレームが絶対参照を使用してシグナリングされるか、相対参照を使用してシグナリングされるかに応じて異なってもよい。絶対参照(便宜上、LTと呼ばれる)は、前または後のフレームなどの参照フレームに関連する特定のLSBカウント値を指す。例えば、LT=3(LT3)の絶対参照は、3のPOC
LSB値を有する参照フレームを指すことになる。よって、[LT3,−5]のRPS
は、3のPOC LSB値を有する参照フレームと、現フレームのPOCから5を引いたのと等しいPOCを備える参照フレームとを指すことになる。図8では、このRPSは、3と等しいPOCを備える参照フレーム444、および0と等しいPOCを備える参照フレーム320に対応する。典型的には、LT3は、現フレームに対して前のフレームで、3のPOC LSB値を有する最初のものを指す。一実施形態では、LT3は、出力順で現フレームに対して前のフレームで、3のPOC LSB値を有する最初のものを指す。第2の実施形態では、LT3は、送信順で現フレームに対して前のフレームで、3のPOC LSB値を有する最初のものを指す。そのようなシステムは、多くのビットストリームに適する一方、3のLSBカウント値を備えるが3のLSBカウント値を有する直前のフレームとは異なるフレームを選択するには、十分に強固なものではない。
図9を参照する。例えば、エンコーダがフレーム31(POC=31)を符号化していた場合であって、システムが、POC LSB=0(LT0)を備える長期間ピクチャの使用をシグナリングする場合、フレーム16(POC=16)がLSB=0を備える1つ前のフレームであるので、このシグナリングはフレーム16(POC=16)を指すことになる(A)。しかしながら、エンコーダは、同じく0のPOC LSBカウント値を有する長期間ピクチャフレーム0をシグナリングしたいかもしれない。だが、1つ前のものを参照する当該方式では、長期間ピクチャフレーム0のシグナリングを達成することはできない。この限界を克服する1つの方式は、長期間フレームPOC LSBをシグナリングするために使用される最下位ビット数を増加させることである。そのような最下位ビット数の増加は可能ではあるが、結果として、ビットストリームにかなりの追加ビットが追加されることになる。
結果としてビットストリームに追加される追加ビットがより少ない、より好適な方式は、対応するPOC LSB値を備えるすぐ1つ前のフレームとは異なる長期間ピクチャをシグナリングすることである。例えば、システムは、[LT0|2]として絶対参照を有する現フレームのRPSを示すことができるであろう。ここで0は、POC LSB値を指し、2は、0と等しいPOC LSB値を備える前フレームのうちのどれを使用すべきかを指し、この場合、使用すべき前フレームは、2つ前の0のPOC LSB値となる(例えば図9のフレーム0)。第2の参照が含まれていなければ、システムは、デフォルトの、POC LSB=0[LT0]を備える直前のフレームにするとよい(例えば図9のフレーム16)。
多くの場合、対応するPOC LSB値を備えるすぐ1つ前のフレームではないフレームを、絶対参照を使用してシグナリングする要望が発生する頻度は、比較的低いと考えられる。対応するPOC LSB値を備えるすぐ1つ前のフレームとは異なるフレームを、絶対参照を使用してシグナリングする能力を可能にしながら、使用すべきフレームを示す全体的なビットレートをさらに削減するために、システムは、重複方式を使用し得る。例えば、RPSは、[LT0,LT0|3]という構造であってもよい。同じRPS内にLT0が重複することで、0のPOC LSB値を有する別のフレーム、すなわちこの場合は0のPOC LSB値の3つ前の発生を使用するようデコーダにシグナリングされる。特定のPOC LSB値がPOC LSB値の特定のサイクルに含まれない可能性を除いて、一般に、所望のPOC LSB値は、指示される以前に発生したフレームに対応する。ここで、POC LSB値の1つのサイクルは、出力順に並べられると同じPOC LSB値を含まず、かつセット内にないフレームにより出力順において分離されない、フレームのセットを示す。
図10を参照する。重複方式は、以下のように示すことができる。RPSは、POC LSB値を有する長期間ピクチャの信号を含む(400)(例えば[LT3])。同RPSは、同じPOC LSB値を有する長期間ピクチャの別の信号を含む(410)(例え
ば[LT3,LT3]。同RPSは、所望のフレームの位置を示す、同じLSBカウント値(410)を有する第2の長期間ピクチャの別の信号を含む(420)[LT3,LT3|2]。
所望のフレームの位置のシグナリングは、任意の適切な方式で行われてよい。例として図11A〜図11Bを参照する。現フレームに対する所望のフレームの位置は、1つ以上前のPOC LSB値のサイクル、例えば3つ前のサイクルなどであってもよい。例として図12を参照する。その位置は、現フレームからのフレームオフセット数の絶対値に基づいてもよい。例として図13A〜図13Bを参照する。その位置は、所望のPOC LSB値を備えるすぐ1つ前のフレームに対して、1サイクル以上前のPOC LSB値であってもよい。例として図14を参照する。その位置は、所望のPOC LSB値を備えるすぐ1つ前のフレームに対するフレームオフセット数の絶対値に基づいてもよい。
そのような方式の例示的な一実装は、以下のシンタックスを使用してもよい。
Figure 0006530035
「lightweight_slice_flag」が1と等しい場合、存在しないスライスヘッダシンタックス要素の値が、処理中のスライス中のスライスヘッダシンタックス要素の値と等しいと推測されるべきであることを指定し、処理中のスライスは、位置(LCUAddress−1)を備えるツリーブロックを含むスライスと定義される。lightweight_slice_flagは、LCUAddressが0と等しい場合には0と等しいものとする。ここで、ツリーブロックは、マクロブロックであってもよく、LCUAddressは、ピクチャ内でのツリーブロックの空間的位置を示す。
「slice_type」は、スライスの符号化タイプを以下のように指定する。
Figure 0006530035
nal_unit_typeが5と等しい場合(IDRピクチャ)、slice_typeは2と等しいものとする。max_num_ref_framesが0と等しい場合、slice_typeは2と等しいものとする。
「pic_parameter_set_id」は、使用中のピクチャパラメータセットを指定する。pic_parameter_set_idの値は、両端値を含めて0〜255の範囲内であるものとする。
「idr_pic_id」は、IDRピクチャを識別し、IDRピクチャは以前に送信されたピクチャを参照に使用しないピクチャを示す。IDRピクチャのすべてのスライス中のidr_pic_idの値は、変更されないままであるものとする。復号順で連続した2つのアクセスユニットが、いずれもIDRアクセスユニットである場合、第1の当該IDRアクセスユニットのスライス中のidr_pic_idの値は、第2の当該IDRアクセスユニット中のidr_pic_idとは異なるものとする。idr_pic_idの値は、両端値を含めて0〜65535の範囲内であるものとする。
「no_output_of_prior_pics_flag」は、復号ピクチャバッファ内の以前に復号されたピクチャが、IDRピクチャの復号後にいかに処理されるかを指定する。IDRピクチャが、ビットストリーム中の第1のIDRピクチャである場合、no_output_of_prior_pics_flagの値は、復号処理にまったく影響を与えない。IDRピクチャが、ビットストリーム中の第1のIDRピクチャではない場合であって、アクティブシーケンスパラメータセットから得られる、ピクチャの寸法を示すpic_width_in_luma_samplesもしくはpic_height_in_luma_samples、または送信順のフレームのシーケンスを表示順のフレームのシーケンスに変換するためにデコーダにて要求される並べ替えの最大量を示すmax_dec_frame_bufferingの値が、先行ピクチャに関してアクティブなシーケンスパラメータセットから得られるpic_width_in_luma_samplesまたはpic_height_in_luma_samplesまたはmax_dec_frame_bufferingの値と異なる場合は、no_output_of_prior_pics_flagの実際値にかかわらず、1と等しいno_output_of_prior_pics_flagがデコーダによって推測(されるべきではないが)され得る。
「pic_order_cnt_lsb」は、現ピクチャに関してピクチャオーダーカウントをMaxPicOrderCntLsbで割った時の余りを指定する。pic_order_cnt_lsbシンタックス要素の長さは、log2_max_pic_order_cnt_lsb_minus4+4ビットである。pic_order_cnt_lsbの値は、両端値を含めて0〜MaxPicOrderCntLsb−1の範囲内であるものとする。pic_order_cnt_lsbが存在しない場合、pic_order_cnt_lsbは0と等しいと推測されるものとする。ここで、pic_order_cnt_lsbは、POC LSB中のLSBの数を示す。
1と等しい「short_term_ref_pic_set_pps_flag」は、現ピクチャの短期間参照ピクチャセットが、複数のピクチャ間で共有され得るシンタックス要素を含むアクティブピクチャパラメータセット中のシンタックス要素を使用して作成されるべきであることを指定する。0と等しいshort_term_ref_pic_set_pps_flagは、現ピクチャの短期間参照ピクチャセットが、スライスヘッダ中のshort_term_ref_pic_set()シンタックス構造中のシンタックス要素を使用して作成されるべきであることを指定する。一部の実施形態では、短期間参照ピクチャセットは、デルタ参照のみを使用するピクチャセットを示す。
「short_term_ref_pic_set_idx」は、現ピクチャの参照ピクチャセットの作成に使用されるべきアクティブピクチャパラメータセット中で指定された短期間参照ピクチャセットのリストに対するインデックスを指定する。シンタックス要素short_term_ref_pic_set_idxは、ceil(log2(num_short_term_ref_pic_sets))ビットにより表現されるものとする。short_term_ref_pic_set_idxの値は、両端値を含めて0〜num_short_term_ref_pic_sets−1の範囲内であるものとし、num_short_term_ref_pic_setsは、アクティブピクチャパラメータセットからのシンタックス要素である。
変数StRpsIdxは、以下のように得られる。
Figure 0006530035
「num_long_term_pics」は、現ピクチャの長期間参照ピクチャセット中に含まれるべき長期間参照ピクチャの数を指定する。num_long_term_picsの値は、両端値を含めて0〜max_num_ref_frames−NumNegativePics[StRpsIdx]−NumPositivePics[StRpsIdx]の範囲内であるものとする。存在しない場合、num_long_term_picsの値は0と等しいと推測されるものとする。一部の実施形態では、長期間参照ピクチャは、絶対参照を用いて送信される参照ピクチャを示す。
「delta_poc_lsb_lt_minus1[i]」は、現ピクチャの長期間参照ピクチャセット中に含まれる第iの長期間参照ピクチャのピクチャオーダーカウント値の最下位ビットの値を判断するために使用される。delta_poc_lsb_lt_minus1[i]は、両端値を含めて0〜MaxPicOrderCntLsb−1の範囲内であるものとする。一部の実施形態では、delta_poc_lsb_lt_minus1[i]は、第iの長期間参照ピクチャのPOC LSBを示す。
変数DeltaPocLt[i]は、以下のように得られる。
Figure 0006530035
DeltaPocLt[i]の値は、両端値を含めて0〜MaxPicOrderCntLsbの範囲内であるものとする。
deltaPOCLSBCheck(i)は、以下のとおりの関数である。
Figure 0006530035
「delta_poc_msb_lt_minus1[i]」は、delta_poc_lsb_lt_minus1[i]とともに、現参照ピクチャの長期間参照ピクチャセット中に含まれる第iの長期間参照ピクチャのピクチャオーダーカウントの値を判断するために使用される。
変数delta_poc_msb_lt_minus1[i]は、以下のように得られる。
Figure 0006530035
別の実施形態では、delta_poc_lsb_lt_minus1値が同じである場合、要素delta_poc_msb_lt_minus1を送る代わりに、poc_msb_lt_minus1またはpoc_msb_lt要素が送られてもよい。ここで、poc_msb_lt_minus1は、参照ピクチャのPOC値−1を示す。これは、絶対POC値であってもよい。同様に、poc_msb_ltは、参照ピクチャのPOC値を示す。この場合もやはり、これは絶対POC値であってもよい。
0と等しい「used_by_curr_pic_lt_flag[i]」は、現ピクチャの長期間参照ピクチャセット中に含まれる第iの長期間参照ピクチャが、現ピクチャによって参照またはフレーム間予測に使用されないことを指定する。
1と等しい「num_ref_idx_active_override_flag」は、PおよびBスライスに関してシンタックス要素num_ref_idx_l0_active_minus1が存在し、Bスライスに関してシンタックス要素num_ref_idx_l1_active_minus1が存在することを指定する。0と等しいnum_ref_idx_active_override_flagは、シンタックス要素num_ref_idx_l0_active_minus1およびnum_ref_idx_l1_active_minus1が存在しないことを指定する。
現スライスがPまたはBスライスであり、field_pic_flagが0と等しく、ピクチャパラメータセット中のnum_ref_idx_l0_default_active_minus1の値が15を超える場合、num_ref_idx_active_override_flagは1と等しいものとする。
現スライスがBスライスであり、field_pic_flagが0と等しく、ピクチャパラメータセット中のnum_ref_idx_l1_default_active_minus1の値が15を超える場合、num_ref_idx_active_override_flagは1と等しいものとする。
「num_ref_idx_l0_active_minus1」は、スライスを復号するために使用されるべき参照ピクチャリスト0に関する最大参照インデックスを指定する。
現スライスがPまたはBスライスであり、num_ref_idx_l0_active_minus1が存在しない場合、num_ref_idx_l0_active_minus1は、num_ref_idx_l0_default_active_minus1と等しいと推測されるものとする。
num_ref_idx_l0_active_minus1の範囲は、以下のように指定される。
field_pic_flagが0と等しければ、num_ref_idx_l0_active_minus1は、両端値を含めて0〜15の範囲内であるものとする。MbaffFrameFlagが1と等しい場合、num_ref_idx_l0_active_minus1は、フレームマクロブロックの復号に関する最大インデックス値であり、2*num_ref_idx_l0_active_minus1+1が、フィールドマクロブロックの復号に関する最大インデックス値である。
その他の場合(field_pic_flagが1と等しい)、num_ref_idx_l0_active_minus1は、両端値を含めて0〜31の範囲内であるものとする。
「num_ref_idx_l1_active_minus1」は、スライスを復号するために使用されるべき参照ピクチャリスト1に関する最大参照インデックスを指定する。
現スライスがBスライスであり、num_ref_idx_l1_active_mi
nus1が存在しない場合、num_ref_idx_l1_active_minus1は、num_ref_idx_l1_default_active_minus1と等しいと推測されるものとする。
num_ref_idx_l1_active_minus1の範囲は、num_ref_idx_l0_active_minus1に関しセマンティクスで規定されたとおり制約されるが、l0およびリスト0がそれぞれl1およびリスト1に置き換えられる。
演算deltaPOCLSBCheck(int i)は、同じPOC LSBが、現フレームに関して、絶対参照を使用してエンコーダからデコーダへ送信されることを判断する。別の実施形態では、同じPOC LSBが送信されるかどうかの判断は、値「delta_poc_lsb_lt_minus1」が、エンコーダおよびデコーダの両方に既知の値と等しいかどうかを確認することにより達成可能である。例えば、0と等しい「delta_poc_lsb_lt_minus1」は、POC LSBが、以前に送信されたPOC LSBと同じであることを示すことができるであろう。あるいは、2^N−1と等しい「delta_poc_lsb_lt_minus1」は、NがPOC LSBの送信に使用されるビット数を示し、エンコーダおよびデコーダの両方に既知であり、0は、POC LSBが以前に送信されたPOC LSBと同じであることを示すことができるであろう。別の実施形態では、値「delta_poc_lsb_lt_minus1」は、シンタックス要素「delta_poc_lsb_lt」に置き換えられ、これは概して、「delta_poc_lsb_lt_minus1」プラス1と等しい。これらの実施形態では、エンコーダおよびデコーダの両方に既知の値と等しい「delta_poc_lsb_lt」は、絶対参照を使用して送信されたピクチャが、同じRPS中の絶対参照を使用して送信された前のピクチャと同じPOC LSBを有することを示すことができる。例えば、0と等しい「delta_poc_lsb_lt」は、POC LSBが、以前に送信されたPOC LSBと同じであることを示すことができるであろう。あるいは、2^Nと等しい「delta_poc_lsb_lt」は、NがPOC LSBの送信に使用されるビット数を示し、エンコーダおよびデコーダの両方に既知であり、0は、POC LSBが以前に送信されたPOC LSBと同じであることを示すことができるであろう。
長期間参照ピクチャセットに関して、復号処理は以下のように行われてもよい。
Figure 0006530035
前述の明細書中で用いられた用語および表現は、説明の用語として明細書中で使用されており、限定するものではない。そのような用語および表現を使用するにあたり、提示され説明された特徴またはその一部の等価物を排除する意図はなく、当然のことながら、本発明の範囲は、添付の特許請求の範囲によってのみ定義され、限定される。

Claims (2)

  1. 少なくとも第1の参照ピクチャと第2の参照ピクチャとを含む参照ピクチャセットを用いて、ビデオビットストリームを復号する復号方法であって、
    参照ピクチャのピクチャオーダーカウント(POC)の最下位ビット(LSB)である第1の情報を復号する復号ステップと、
    前記参照ピクチャの前記POCの最上位ビット(MSB)の値を決定するために使用される第2の情報を復号する復号ステップと、
    前記第2の情報が前記ビデオビットストリームに含まれるかを判定するために使用される第3の情報を判定する判定ステップと、
    前記第3の情報を用いて、前記第2の情報が前記ビデオビットストリームに含まれるかを確認する確認ステップと、
    前記参照ピクチャセットを復号する復号ステップと、
    前記参照ピクチャセットに基づき、インター予測を使用して現ピクチャを復号し、復号された現ピクチャを生成する復号ステップと、
    将来のインター予測のために参照される前記復号されたピクチャを記憶する記憶ステップと、を含み
    前記参照ピクチャセットは、少なくとも、前記参照ピクチャの前記第1の情報と前記第3の情報とを用いて復号され、
    前記参照ピクチャの前記第1の情報は、前記ビデオビットストリームのスライスヘッダに含まれており、
    前記第3の情報は、前記スライスヘッダにおいて、少なくとも、前記参照ピクチャの前記第1の情報の後に含まれており、
    前記第2の情報が前記ビデオビットストリームに含まれることを前記確認ステップにおいて示された場合、前記第2の情報は、前記スライスヘッダにおいて、少なくとも、前記第3の情報の後に含まれている、
    復号方法。
  2. ビデオビットストリームを復号する復号装置であって、
    参照ピクチャセットに基づき、インター予測を使用して現ピクチャを復号する復号部と、
    将来のインター予測のために参照される前記復号されたピクチャを記憶する記憶部と、を含み
    前記復号部は、前記参照ピクチャセットを、
    参照ピクチャのピクチャオーダーカウント(POC)の最下位ビット(LSB)である第1の情報を復号し、
    前記参照ピクチャの前記POCの最上位ビット(MSB)の値を決定するために使用される第2の情報を復号し、
    前記第2の情報が前記ビデオビットストリームに含まれるかを判定するために使用される第3の情報を判定し、
    前記第3の情報を用いて、前記第2の情報が前記ビデオビットストリームに含まれるかを確認し、
    前記参照ピクチャセットを復号し、
    前記参照ピクチャセットに基づき、インター予測を使用して前記現ピクチャを復号し、復号された現ピクチャを生成し、
    将来のインター予測のために参照される前記復号された現ピクチャを記憶する、
    ことによって、復号し、
    前記参照ピクチャセットは、少なくとも、前記参照ピクチャの前記第1の情報と前記第3の情報とを用いて復号され、
    前記参照ピクチャの前記第1の情報は、前記ビデオビットストリームのスライスヘッダに含まれており、
    前記第3の情報は、前記スライスヘッダにおいて、少なくとも、前記参照ピクチャの前記第1の情報の後に含まれており、
    前記第2の情報が前記ビデオビットストリームに含まれることが示された場合、前記第2の情報は、前記スライスヘッダにおいて、少なくとも、前記第3の情報の後に含まれている、
    復号装置。
JP2017207318A 2012-01-25 2017-10-26 復号方法及び復号装置 Active JP6530035B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2019092162A JP6913126B2 (ja) 2012-01-25 2019-05-15 符号化方法及び符号化装置

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US13/358,414 US20130188709A1 (en) 2012-01-25 2012-01-25 Video decoder for tiles with absolute signaling
US13/358,414 2012-01-25

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
JP2014527383A Division JP2015508577A (ja) 2012-01-25 2013-01-25 ビデオ復号方法およびビデオ符号化方法

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP2019092162A Division JP6913126B2 (ja) 2012-01-25 2019-05-15 符号化方法及び符号化装置

Publications (2)

Publication Number Publication Date
JP2018057002A JP2018057002A (ja) 2018-04-05
JP6530035B2 true JP6530035B2 (ja) 2019-06-12

Family

ID=48797186

Family Applications (3)

Application Number Title Priority Date Filing Date
JP2014527383A Pending JP2015508577A (ja) 2012-01-25 2013-01-25 ビデオ復号方法およびビデオ符号化方法
JP2017207318A Active JP6530035B2 (ja) 2012-01-25 2017-10-26 復号方法及び復号装置
JP2019092162A Active JP6913126B2 (ja) 2012-01-25 2019-05-15 符号化方法及び符号化装置

Family Applications Before (1)

Application Number Title Priority Date Filing Date
JP2014527383A Pending JP2015508577A (ja) 2012-01-25 2013-01-25 ビデオ復号方法およびビデオ符号化方法

Family Applications After (1)

Application Number Title Priority Date Filing Date
JP2019092162A Active JP6913126B2 (ja) 2012-01-25 2019-05-15 符号化方法及び符号化装置

Country Status (7)

Country Link
US (9) US20130188709A1 (ja)
EP (2) EP4117288A1 (ja)
JP (3) JP2015508577A (ja)
CN (2) CN104067620B (ja)
CA (1) CA2861255C (ja)
MY (2) MY197320A (ja)
WO (1) WO2013111605A1 (ja)

Families Citing this family (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102615301B1 (ko) * 2011-11-11 2023-12-19 엘지전자 주식회사 영상 정보 전송 방법 및 장치와 이를 이용한 복호화 방법 및 장치
SG11201404509QA (en) * 2012-02-01 2014-08-28 Nokia Corp Method and apparatus for video coding
US9838706B2 (en) * 2012-04-16 2017-12-05 Telefonaktiebolaget Lm Ericsson (Publ) Encoder, decoder and methods thereof for video encoding and decoding
CN103907350B (zh) * 2012-09-29 2018-02-23 华为技术有限公司 视频编码及解码方法、装置及系统
EP2946558B1 (en) 2013-01-15 2020-04-29 Huawei Technologies Co., Ltd. Method for decoding an hevc video bitstream
EP3399746B1 (en) * 2013-01-16 2019-08-07 Telefonaktiebolaget LM Ericsson (publ) Decoder and encoder for coding of a video sequence
CN104754347B (zh) * 2013-12-26 2019-05-17 中兴通讯股份有限公司 视频图像序号的编码、解码方法及装置、电子设备
US10158867B2 (en) * 2014-06-20 2018-12-18 Qualcomm Incorporated Picture order count reset for multi-layer codecs
US10097836B2 (en) * 2015-09-28 2018-10-09 Samsung Electronics Co., Ltd. Method and device to mark a reference picture for video coding
US11595652B2 (en) 2019-01-28 2023-02-28 Op Solutions, Llc Explicit signaling of extended long term reference picture retention
EP3815380A4 (en) 2018-07-01 2022-03-30 Sharp Kabushiki Kaisha SYSTEMS AND METHODS FOR SIGNALING PICTURE ORDER COUNT VALUES FOR PICTURES CONTAINED IN ENCODED VIDEO
KR20240058947A (ko) 2018-08-17 2024-05-03 후아웨이 테크놀러지 컴퍼니 리미티드 비디오 코딩에서 참조 화상 관리
WO2020159994A1 (en) * 2019-01-28 2020-08-06 Op Solutions, Llc Online and offline selection of extended long term reference picture retention
MX2021010711A (es) * 2019-03-11 2021-12-10 Vid Scale Inc Extracción y reposicionamiento de secuencia de bits de subimágenes.
EP4024277B1 (en) 2019-08-26 2024-04-03 Konica Minolta, Inc. Tag
CN116781907A (zh) * 2022-03-11 2023-09-19 华为技术有限公司 编解码方法及电子设备

Family Cites Families (40)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100571307B1 (ko) * 1999-02-09 2006-04-17 소니 가부시끼 가이샤 코딩 시스템 및 방법, 부호화 장치 및 방법, 복호화 장치및 방법, 기록 장치 및 방법, 및 재생 장치 및 방법
US6687384B1 (en) 2000-03-27 2004-02-03 Sarnoff Corporation Method and apparatus for embedding data in encoded digital bitstreams
US6887384B1 (en) 2001-09-21 2005-05-03 The Regents Of The University Of California Monolithic microfluidic concentrators and mixers
JP2004007563A (ja) 2002-04-19 2004-01-08 Matsushita Electric Ind Co Ltd 動画像符号化方法および動画像復号化方法
US7372999B2 (en) * 2002-09-09 2008-05-13 Ricoh Company, Ltd. Image coder and image decoder capable of power-saving control in image compression and decompression
US7212571B2 (en) * 2003-01-31 2007-05-01 Seiko Epson Corporation Method and apparatus for DCT domain filtering for block based encoding
US7471726B2 (en) * 2003-07-15 2008-12-30 Microsoft Corporation Spatial-domain lapped transform in digital media compression
US7535959B2 (en) * 2003-10-16 2009-05-19 Nvidia Corporation Apparatus, system, and method for video encoder rate control
JP4434155B2 (ja) * 2006-02-08 2010-03-17 ソニー株式会社 符号化方法、符号化プログラムおよび符号化装置
KR101270167B1 (ko) * 2006-08-17 2013-05-31 삼성전자주식회사 저복잡도의 이미지 압축 방법 및 장치, 저복잡도의 이미지복원 방법 및 장치
PL2642756T3 (pl) 2006-10-16 2019-05-31 Nokia Technologies Oy System i sposób realizacji wydajnego zarządzania dekodowanymi buforami w kodowaniu wideo z wieloma widokami
KR100837410B1 (ko) * 2006-11-30 2008-06-12 삼성전자주식회사 주관적인 무손실 이미지 데이터 압축 방법 및 장치
EP2048886A1 (en) 2007-10-11 2009-04-15 Panasonic Corporation Coding of adaptive interpolation filter coefficients
US9357233B2 (en) * 2008-02-26 2016-05-31 Qualcomm Incorporated Video decoder error handling
US8165204B2 (en) * 2008-02-29 2012-04-24 Michael Bronstein Resource allocation for frame-based controller
CN102165778A (zh) * 2009-02-10 2011-08-24 松下电器产业株式会社 图像处理装置、图像处理方法、程序及集成电路
US8817884B2 (en) * 2009-11-20 2014-08-26 Texas Instruments Incorporated Techniques for perceptual encoding of video frames
US9398308B2 (en) * 2010-07-28 2016-07-19 Qualcomm Incorporated Coding motion prediction direction in video coding
US8617370B2 (en) 2010-09-30 2013-12-31 Cilag Gmbh International Systems and methods of discriminating between a control sample and a test fluid using capacitance
US8885704B2 (en) * 2010-10-01 2014-11-11 Qualcomm Incorporated Coding prediction modes in video coding
EP2630799A4 (en) * 2010-10-20 2014-07-02 Nokia Corp METHOD AND DEVICE FOR VIDEO CODING AND DECODING
US9525884B2 (en) * 2010-11-02 2016-12-20 Hfi Innovation Inc. Method and apparatus of slice boundary filtering for high efficiency video coding
JP5625808B2 (ja) * 2010-11-26 2014-11-19 沖電気工業株式会社 データ更新装置及びプログラム、並びに、動画像復号装置及びプログラム、並びに、動画像配信システム
US9008176B2 (en) * 2011-01-22 2015-04-14 Qualcomm Incorporated Combined reference picture list construction for video coding
US9122609B2 (en) * 2011-03-07 2015-09-01 Texas Instruments Incorporated Caching method and system for video coding
WO2013008247A1 (en) 2011-07-13 2013-01-17 Neon Laboratories Ltd. Process for preparation of (dl) -norepinephrine acid addition salt, a key intermediate of (r) - (-) - norepinephrine
GB2495467B (en) * 2011-09-02 2017-12-13 Skype Video coding
US9131245B2 (en) * 2011-09-23 2015-09-08 Qualcomm Incorporated Reference picture list construction for video coding
US20130089152A1 (en) * 2011-10-05 2013-04-11 Qualcomm Incorporated Signaling picture identification for video coding
US20130094774A1 (en) 2011-10-13 2013-04-18 Sharp Laboratories Of America, Inc. Tracking a reference picture based on a designated picture on an electronic device
CN107277532B (zh) 2011-10-28 2020-04-21 三星电子株式会社 帧间预测的方法及其装置和运动补偿的方法及其装置
US9918080B2 (en) * 2011-11-08 2018-03-13 Nokia Technologies Oy Reference picture handling
KR102615301B1 (ko) * 2011-11-11 2023-12-19 엘지전자 주식회사 영상 정보 전송 방법 및 장치와 이를 이용한 복호화 방법 및 장치
US9648321B2 (en) * 2011-12-02 2017-05-09 Qualcomm Incorporated Coding picture order count values identifying long-term reference frames
CN104380746A (zh) * 2012-04-23 2015-02-25 三星电子株式会社 多视点视频编码方法和装置以及多视点视频解码方法和装置
US9319679B2 (en) * 2012-06-07 2016-04-19 Qualcomm Incorporated Signaling data for long term reference pictures for video coding
US9591303B2 (en) * 2012-06-28 2017-03-07 Qualcomm Incorporated Random access and signaling of long-term reference pictures in video coding
US9332255B2 (en) 2012-06-28 2016-05-03 Qualcomm Incorporated Signaling long-term reference pictures for video coding
US9912966B2 (en) * 2014-01-03 2018-03-06 Nokia Technologies Oy Parameter set coding
CN110915218B (zh) * 2017-07-10 2022-03-15 弗劳恩霍夫应用研究促进协会 对变换系数编码和解码的方法及用于其的编码器和解码器

Also Published As

Publication number Publication date
US20170310960A1 (en) 2017-10-26
US20130188709A1 (en) 2013-07-25
CN104067620B (zh) 2018-01-26
US20200112718A1 (en) 2020-04-09
JP2015508577A (ja) 2015-03-19
MY185225A (en) 2021-04-30
JP2019154062A (ja) 2019-09-12
WO2013111605A1 (en) 2013-08-01
CN107959859A (zh) 2018-04-24
US10911752B2 (en) 2021-02-02
EP2807824B1 (en) 2022-07-20
US20170104991A1 (en) 2017-04-13
US11245893B2 (en) 2022-02-08
MY197320A (en) 2023-06-13
CN107959859B (zh) 2021-04-13
US20150189305A1 (en) 2015-07-02
US20210152817A1 (en) 2021-05-20
JP6913126B2 (ja) 2021-08-04
US10506227B2 (en) 2019-12-10
US20220124315A1 (en) 2022-04-21
CN104067620A (zh) 2014-09-24
CA2861255A1 (en) 2013-08-01
US11582446B2 (en) 2023-02-14
US10250875B2 (en) 2019-04-02
EP4117288A1 (en) 2023-01-11
US9883181B2 (en) 2018-01-30
EP2807824A1 (en) 2014-12-03
JP2018057002A (ja) 2018-04-05
US20190182479A1 (en) 2019-06-13
CA2861255C (en) 2021-04-20
EP2807824A4 (en) 2016-05-18
US20230199172A1 (en) 2023-06-22

Similar Documents

Publication Publication Date Title
JP6530035B2 (ja) 復号方法及び復号装置
US10027978B2 (en) Video decoder with signaling
US20170366823A1 (en) Method for decoding video bitstream
US9510016B2 (en) Methods and apparatus for video coding and decoding with reduced bit-depth update mode and reduced chroma sampling update mode
US20140092976A1 (en) System for signaling idr and bla pictures
US20130272398A1 (en) Long term picture signaling
KR20130118798A (ko) 영상 복호화 방법 및 장치

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20180806

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20180821

A711 Notification of change in applicant

Free format text: JAPANESE INTERMEDIATE CODE: A711

Effective date: 20180928

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20181018

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20181127

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20190416

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20190515

R150 Certificate of patent or registration of utility model

Ref document number: 6530035

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250