JP6156497B2 - 動画像符号化装置、動画像符号化方法、及び動画像復号装置ならびに動画像復号方法 - Google Patents
動画像符号化装置、動画像符号化方法、及び動画像復号装置ならびに動画像復号方法 Download PDFInfo
- Publication number
- JP6156497B2 JP6156497B2 JP2015527092A JP2015527092A JP6156497B2 JP 6156497 B2 JP6156497 B2 JP 6156497B2 JP 2015527092 A JP2015527092 A JP 2015527092A JP 2015527092 A JP2015527092 A JP 2015527092A JP 6156497 B2 JP6156497 B2 JP 6156497B2
- Authority
- JP
- Japan
- Prior art keywords
- picture
- field
- encoding
- pictures
- unit
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/134—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
- H04N19/157—Assigned coding mode, i.e. the coding mode being predefined or preselected to be further used for selection of another element or parameter
- H04N19/16—Assigned coding mode, i.e. the coding mode being predefined or preselected to be further used for selection of another element or parameter for a given display mode, e.g. for interlaced or progressive display mode
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/50—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
- H04N19/503—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
- H04N19/51—Motion estimation or motion compensation
- H04N19/537—Motion estimation other than block-based
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/103—Selection of coding mode or of prediction mode
- H04N19/107—Selection of coding mode or of prediction mode between spatial and temporal predictive coding, e.g. picture refresh
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/103—Selection of coding mode or of prediction mode
- H04N19/114—Adapting the group of pictures [GOP] structure, e.g. number of B-frames between two anchor frames
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/134—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
- H04N19/136—Incoming video signal characteristics or properties
- H04N19/137—Motion inside a coding unit, e.g. average field, frame or block difference
- H04N19/139—Analysis of motion vectors, e.g. their magnitude, direction, variance or reliability
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/17—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
- H04N19/172—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a picture, frame or field
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/30—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability
- H04N19/31—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability in the temporal domain
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/42—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by implementation details or hardware specially adapted for video compression or decompression, e.g. dedicated software implementation
- H04N19/423—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by implementation details or hardware specially adapted for video compression or decompression, e.g. dedicated software implementation characterised by memory arrangements
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/44—Decoders specially adapted therefor, e.g. video decoders which are asymmetric with respect to the encoder
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/90—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using coding techniques not provided for in groups H04N19/10-H04N19/85, e.g. fractals
- H04N19/91—Entropy coding, e.g. variable length coding [VLC] or arithmetic coding
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
Description
AVC規格は、直前に符号化されたピクチャを優先してDPBに保存する、スライディングウィンドウ方式を採用している。DPBに空き容量が無い場合には、先に符号化されたピクチャから順に、DPBから消去される。AVC規格は、さらに、DPBに記憶されているピクチャのうち、指定されたピクチャを消去する方法(Memory Management Control Operations, MMCO)も補完的に採用している。
動画像1010は、ピクチャI0〜P8を含む。このうち、ピクチャI0は、イントラ予測符号化されるIピクチャであり、ピクチャP1〜P8は、それぞれ、1方向についてインター予測符号化されるPピクチャである。本例では、動画像符号化装置に対する各ピクチャの入力順序は、符号化順序と同一とする。また各ピクチャの上に示された矢印は、符号化時の参照関係を表し、矢印の基点のピクチャが矢印の先端のピクチャを参照する。この例に示された符号化構造では、入力順番が3n(nは整数)のピクチャは、入力順番が3(n-1), 3(n-2)のピクチャを優先して参照する。入力順番が(3n+1)のピクチャは、入力順番が3n, {3(n-1)+1}のピクチャを優先して参照する。入力順番が(3n+2)のピクチャは、入力順番が(3n+1), 3n, {3(n-1)+2}のピクチャを優先して参照する。この符号化構造は時間方向階層符号化に相当するものであり、例えば、動画像復号装置は、入力順序が3m(mは整数)のピクチャ以外は復号せずに、入力順序が3mのピクチャのみを正常復号(すなわち、3倍速再生)することができる。
動画像1110は、ピクチャI0〜P8を含む。このうち、ピクチャI0は、イントラ予測符号化されるIピクチャであり、ピクチャP1〜P8は、それぞれ、1方向についてインター予測符号化されるPピクチャである。本例では、動画像符号化装置に対する各ピクチャの入力順序は、符号化順序と同一とする。また各ピクチャの上に示された矢印は、符号化時の参照関係を表し、矢印の基点のピクチャが矢印の先端のピクチャを参照する。
この例では、DPB1130は、DPB1020と同様に、4個のバンクを有している。図2では、各ピクチャの入力時にDPB1020の各バンクが保存しているピクチャが示されている。この例では、DPB1020と異なり、ピクチャP6を符号化する時に、ピクチャI0がバンク0に保存されているので、ピクチャP6はピクチャI0を参照できる。
このように、動画像符号化装置は、RPS方式のみで、スライディングウィンドウ方式とMMCOとで実現される機能を実現可能である。そのため、RPS方式を利用することにより、DPB管理の処理が簡易になる。
AVC規格及びHEVC規格では、二つの参照ピクチャリストL0及びL1が定義される。リストL0は、MPEG-2規格の前方向参照ピクチャに対応し、リストL1は後方向参照ピクチャに対応する。ただし、AVC規格及びHEVC規格では、リストL1が、符号化対象ピクチャよりも入力順序(すなわち、表示順序)で先(すなわち、POCが小さい)の参照ピクチャを含むことができる。またリストL0及びリストL1は、複数の参照ピクチャを含むことができる。PピクチャはリストL0のみを持ち、BピクチャはリストL0とリストL1の両方を持つことができる。リストL0及びリストL1は、DPBに保存されている複数の参照ピクチャのなから選択されたピクチャを示す。そしてリストL0及びリストL1は、符号化(動画像復号装置の場合には復号)するピクチャごとに作成される。インター予測符号化されるピクチャ内のブロックごとに、リストL0またはリストL1に示された参照ピクチャのなかから、インター予測符号化に用いる参照ピクチャが選択される。HEVC規格の場合、インター予測符号化の単位であるPrediction Unit(PU)ごとに、パラメータRefIdxL0及びRefIdxL1が規定される。これらのパラメータは、参照するピクチャについてのリスト内の順序を示す。以降、PUのL0方向の参照ピクチャ、及びL0方向の参照ピクチャをそれぞれ、L0[RefIdxL0]及びL1[RefIdxL1]と表記する。
ピクチャ1210〜1213は、それぞれ、プログレッシブ方式で生成された動画像(以下、単にプログレッシブ動画像と呼ぶ)に含まれるフレームピクチャである。
一方、インターレス動画像は、プログレッシブ動画像の各フレームピクチャから、偶数(0, 2, 4, ...)ラインのみを含むトップフィールドピクチャと、奇数(1, 3, 5, ...)ラインのみを含むボトムフィールドピクチャを交互に切り出したものである。フィールドピクチャの垂直方向のライン数は、フレームピクチャの垂直方向のライン数の1/2になる。図3において、ピクチャ1220及び1222がトップフィールドピクチャであり、ピクチャ1221及び1223がボトムフィールドピクチャである。
インターレス動画像の垂直方向の解像度は、プログレッシブ動画像垂直方向の解像度の1/2になる。人間の視覚は、動きの激しい動画像では知覚できる空間解像度が低下することを利用して、インターレス動画像は人間の主観的な画質を大きく損なわずにデータ量を削減している。
フレーム符号化時には、動画像符号化装置は、キャプチャリングされたトップフィールドピクチャとボトムフィールドピクチャとをラインごとにインタリーブすることにより、一つのフレームピクチャを作成し、そのフレームピクチャを符号化する。この場合、トップフィールドピクチャに含まれるラインがキャプチャリングされた時刻は、ボトムフィールドピクチャに含まれるラインがキャプチャリングされた時刻と異なる。そのため、一般に、ピクチャに写っている物体の動きが大きい場合にはフィールド符号化が選択され、逆に、物体の動きが小さい場合にはフレーム符号化が選択される。
フィールド符号化されるシーケンスでは、動画像符号化装置は、各フィールドピクチャを、垂直方向のライン数がフレームのライン数の1/2、かつ、フレームレートが2倍のフレームピクチャと見なしてフレーム符号化する。AVC規格等で採用されているインターレス動画像に特化した符号化は行われず、各フィールドピクチャのパリティ(トップもしくはボトム)は符号化時に使用されない。また、HEVC規格では、異なるシーケンスに属するピクチャ間でインター予測符号化は適用されない。すなわち、DPBに保存されるピクチャは、必ず全てフィールドピクチャか、もしくは全てフレームピクチャである。RPS方式では、ピクチャがフィールドピクチャかフレームピクチャかによらず、同じ制御が適用される。
また、新規に追加するピクチャパラメータとして、フレームピクチャから参照されるときにペアとなる二つのフィールドピクチャを示す参照ペア情報が、各ピクチャについて規定される。この参照ペア情報は、DPBに保存されている一つのトップフィールドピクチャと、一つのボトムフィールドピクチャとの組を記述する。AVC規格では、トップフィールドピクチャとボトムフィールドピクチャの組は、常に、表示順序が連続する二つのフィールドピクチャの組、すなわち、入力順序が2t(tは整数)のトップフィールドと入力順序が(2t+1)のボトムフィールドの組でなければならない。しかし、本実施形態では、動画像符号化装置は、参照ペア情報を用いることで、時間的に離れたトップフィールドピクチャとボトムフィールドピクチャとを組み合わせて、一つのフレームピクチャとし、そのフレームピクチャを符号化対象ピクチャが参照できる。そのため、符号化効率がさらに向上する。
上記の一般的な記述及び下記の詳細な記述の何れも、例示的かつ説明的なものであり、請求項のように、本発明を限定するものではないことを理解されたい。
また、符号化対象となるインターレス動画像の形式は、フィールドペアにおいて、トップフィールドの入力(表示)順序がボトムフィールドの入力順序よりも先となるトップフィールドファスト形式であってもよい。あるいは、符号化対象となるインターレス動画像の形式は、フィールドペアにおいて、ボトムフィールドの入力(表示)順序がトップフィールドの入力順序よりも先となるボトムフィールドファスト形式であってもよい。なお、符号化対象となるインターレス動画像がボトムフィールドファスト形式である場合、以下の説明におけるトップフィールドとボトムフィールドの表記を入れ替えればよい。
動画像符号化装置10は、制御部11と、参照ピクチャ管理部12と、ソース符号化部13と、バッファインタフェース部14と、フレームバッファ15と、エントロピー符号化部16とを有する。
動画像符号化装置10が有するこれらの各部は、それぞれ、別個の回路として動画像符号化装置10に実装される。あるいは、動画像符号化装置10が有するこれらの各部は、その各部の機能を実現する回路が集積された一つの集積回路として動画像符号化装置10に実装されてもよい。あるいはまた、動画像符号化装置10が有するこれらの各部は、動画像符号化装置10が有するプロセッサ上で実行されるコンピュータプログラムにより実現される機能モジュールであってもよい。
制御部11は、符号化ユニットの構造、符号化対象ピクチャの符号化モード、参照関係、ピクチャ種別を参照ピクチャ管理部12及びソース符号化部13に通知する。
なお、制御部11及び参照ピクチャ管理部12の処理の詳細及び参照ペア情報については後述する。
動画像復号装置20は、エントロピー復号部21と、参照ピクチャ管理部22と、バッファインタフェース部23と、フレームバッファ24と、ソース復号部25とを有する。動画像復号装置20が有するこれらの各部は、それぞれ、別個の回路として動画像復号装置20に実装される。あるいは、動画像復号装置20が有するこれらの各部は、その各部の機能を実現する回路が集積された一つの集積回路として動画像復号装置20に実装されてもよい。あるいはまた、動画像復号装置20が有するこれらの各部は、動画像復号装置20が有するプロセッサ上で実行されるコンピュータプログラムにより実現される機能モジュールであってもよい。
またバッファインタフェース部23は、ソース復号部25からの復号ピクチャ書き込み要求に応じて、受け取った復号ピクチャの各画素の値をフレームバッファ24に書き込む。
まず以下の用語の定義を行う。
・「レイヤ」は、時間方向階層符号化におけるピクチャの階層を示す。HEVC規格では、NAL Unit Headerに含まれるNuhTemporalIdPlus1パラメータによって、ピクチャのレイヤレベル(0, 1, 2, ...)が示される。階層符号化では、レイヤレベルがNのピクチャは、レイヤレベルがN以下のピクチャのみを参照して符号化されるように、参照関係が制約される。これにより、動画像復号装置は、最大のレイヤレベルをM(Mは1以上の整数)とするビットストリームから、レイヤレベルがN(Nは整数、ただしN < M)以下の符号化ピクチャのみを切り出したサブストリームを作成して、そのサブストリーム内の符号化ピクチャの全てを正常復号できる。MPEG-2規格で使用される、Iピクチャ(イントラピクチャ)、Pピクチャ(前方向参照ピクチャ)、Bピクチャ(両方向参照ピクチャ)を含む一般的なGOP構造は、最大のレイヤレベルを1とする時間方向階層符号化に相当する。言い換えると、常に非参照ピクチャとなるBピクチャ(レイヤレベル1に相当)をビットストリームから除いても、動画像復号装置は、残りのIピクチャ及びPピクチャ(レイヤレベル0に相当)を正常復号できる。
・「符号化ユニット」は、レイヤレベルが0となるピクチャを先頭とし、符号化順で次にレイヤレベルが0となるピクチャの直前のピクチャまでを含む、ピクチャの集合である。ただし、レイヤレベルが0となるピクチャが二つ連続し、かつそれらが同一のフィールドペアに含まれる場合には、その二つのピクチャは同一の符号化ユニットに含まれる。
MPEG-2規格におけるGOPの場合、符号化ユニットは、IピクチャもしくはPピクチャを先頭とし、符号化順で後かつ表示順で前となる複数のBピクチャを含むピクチャの集合になる。IピクチャもしくはPピクチャと、符号化順で次のIピクチャもしくはPピクチャとの間のBピクチャの数をLとすると、符号化ユニットに含まれるピクチャ数は(L+1)となる。時間方向階層符号化の場合、符号化ユニットに含まれるピクチャ数は、一般的に(2M)となる。ただしMは最大レイヤレベルであり、符号化順で同一レイヤレベルのピクチャが連続しないことを仮定している。以下の説明ではこの仮定を適用する。
フィールドペア1310〜1313のそれぞれに含まれる二つのフィールドがフィールド符号化される場合、各フィールドには、それぞれ、フィールドピクチャのPOC値として(8m-6)、(8m-5)、(8m-4)、(8m-3)、(8m-2)、(8m-1)、(8m)、(8m+1)が割り当てられる(mは整数)。一方、フィールドペア1310〜1313がフレーム符号化される場合には、各フィールドペアには、それぞれ、フレームピクチャのPOC値としてそれぞれ、(8m-6)、(8m-4)、(8m-2)、(8m)が割り当てられる。
フィールドペア単位の符号化順序は、フィールドペア1313→1311→1310→1312となる。制御部11は、以下に述べる方法に従い、各フィールドペアが符号化される際のピクチャ種別(フレームもしくはフィールド)を決定する。
また、制御部11は、動きベクトルの探索を行うブロックを、HEVC規格のPUとしてもよい。さらに、制御部11は、符号化対象ピクチャ及び参照ピクチャの輝度成分のみを動きベクトルの探索に用いてもよい。
テーブル1430は、各符号化ピクチャに含まれるパラメータを示す。パラメータRefPicPoc及びPairPicPocは、それぞれ、符号化ピクチャのRPS情報、及び参照ペア情報である。例えば、5番目に符号化されるフレームピクチャ(POC値は4)について、RPS情報(RefPicPoc)は、POC値が0, 1, 8, 9であるフィールドピクチャがDPBに保存されることを示す。また、参照ペア情報(PairPicPoc)は、そのフレームピクチャであるフィールドペアに含まれるボトムフィールドのPOC値5となる。
符号化ピクチャのPOC値及びRPS情報は、HEVC規格と同等の方法で動画像復号装置20へ通知される。その通知の方法については後述する。
例えば、POC値が8のピクチャのPairPicPocは9となる。POC値が8のピクチャよりも後に符号化されるPOC値が4のフレームピクチャが、L1[0]参照ピクチャとしてPOC値が8となる(フィールド)ピクチャを参照するときに、そのフレームピクチャは、POC値が8のフィールドピクチャとPOC値が9のフィールドピクチャを組み合わせた一つのフレームピクチャとして参照する。なお、二つのフィールドピクチャがフレームピクチャとして参照される場合には、その二つのフィールドピクチャは必ずDPBに参照ピクチャとして保存されているものとする。
このように、リストL0、L1の各エントリは、符号化ピクチャの種別(フィールドもしくはフレーム)によらず、一つのフィールドピクチャを示す。したがって、本実施形態によるリストL0、L1及びパラメータRefIdxL0、RefIdxL1は、HEVC規格と互換性がある。
NumBanks = (N+1)
LumaW = w
LumaH = h
ChromaW = w/2
ChromaH = h/2
HeaderSize = C0(固定値)
LumaOffset = HeaderSize
CbOffset = HeaderSize + (w * h)
CrOffset = HeaderSize + (w * h) * 3 / 2
PosBank(0) = C1(固定値)
PosBank(1) = PosBank(0) + B
PosBank(2) = PosBank(1) + B, ...
PosBank(N) = PosBank(N-1) + B
ただし、B = (HeaderSize + (w * h) * 2)である。
メモリマップ1520は、フレームバッファ15(動画像復号装置20ではフレームバッファ24)内の、各バンク内部のメモリ構造を表す。各バンクには、先頭から順に、C0バイトのヘッダ領域Header、輝度画素値領域LumaPixel、Cb画素値領域CbPixel、Cr画素領域CrPixelが連続したメモリアドレス上に配置される。
FieldFlag = 1(フィールド)の場合: OffsetA + ((OY + p) * pw)
FieldFlag = 0(フレーム)の場合: OffsetB + (((OY + p)/2) * pw)
ただし、OffsetAはフィールドピクチャの左上端画素のアドレスに対応し、ChannelIdxが0(輝度)、1(Cb)、2(Cr)の場合で、それぞれ、(PosBank(b) + HeaderSize + LumaOffset), (PosBank(b) + HeaderSize + CbOffset)、(PosBank(b) + HeaderSize + CrOffset)となる。またpwは、ChannelIdxが0、1、2の場合に、それぞれ、LumaW、ChromaW、ChromaWとなる。
また、OffsetBは、フレームピクチャに含まれる二つのフィールドピクチャのそれぞれの左上端画素のアドレスに対応し、ChannelIdxが0、1、2の場合で、それぞれ、(X + HeaderSize + LumaOffset)、(X + HeaderSize + CbOffset)、(X + HeaderSize + CrOffset)となる。ただし、Xは、(OY + p)%2が0の場合、すなわち、トップフィールドについてはPosBank(b)となり、(OY + p)%2が1の場合、すなわち、ボトムフィールドについてはPosBank(b')となる。b'は、RWFlagが1の場合にはPairPicPocと同じPOC値を持つバンク番号であり、RWFlagが0の場合には、バンクbのHeader情報に含まれるPairPicPocと同じPOC値を持つバンク番号である。すなわち、FieldFlagが1の場合は、ソース符号化部13は、フレームバッファ15が(動画像復号装置20では、ソース復号部25は、フレームバッファ24が)、フレームピクチャ単位でDPBを管理するものと見なして、フレームピクチャのデータを読み書きする。一方、バッファインタフェース部14(動画像復号装置20では、バッファインタフェース部23)は、ラインごとに、対応するフィールドピクチャが格納されているバンクに対して読み書きすることで、ピクチャ構造の違いに対応する。
データ1600は、ビットストリームの中の、一つの符号化ピクチャに対応するデータである。シンタックスNUH(NAL Unit Header)、VPS(Video Parameter Set)、SPS(Sequence Parameter Set)、PPS(Picture Parameter Set)、SEI(Supplemental Enhancement Information), SH(Slice Segment Header)、SLICE(Slice Segment Data)は、それぞれ、SHを除き、HEVC規格で定義されている同一名のシンタックスと同一である。SHは、HEVC規格で定義されている同一名のシンタックスに比べて一部拡張されている。各シンタックスの詳細は後述する。
パラメータセット1620は、SPSに含まれるパラメータである。ここでは、特に、本実施形態に関連するパラメータのみを示している。各RBSP内でのパラメータは上の方から先にビットストリームに出現する。また図中の垂直の点線は、明示的に列挙したパラメータの間に、本明細書では特に記述しないパラメータが一つ以上存在することを示す。
パラメータGeneralProgressiveSourceFlag及びGeneraInterlaceSourceFlagは、本実施形態では、それぞれ0、1とし、符号化対象の動画像がインターレスであること示す。パラメータLog2MaxPicOrderCntLsbMinus4は、SHで示されるPOC値の復元に用いられる。パラメータNumShortTermRefPicSetsは、SPSで記述するRPSの個数を示す。パラメータShortTermRefPicSetSet(i)は、i番目(i = [0, NumShortTermRefPicSets - 1])のRPSを記述する。パラメータShortTermRefPicSetSet(i)の詳細については後述する。
パラメータPairPicPocDiffは、参照ペア情報の一例であり、フレームピクチャから参照される場合にペアとなる別のフィールドピクチャのPOC値から、データ1600に対応するピクチャのPOC値を減算した値を記述する。
テーブル1430に記述されているように、POC値が6のピクチャ(フレーム)について、POC値がそれぞれ0, 1, 4, 5, 8, 9のピクチャがDPBに保存されている。DPBに保存されている各ピクチャに相当するRPSを記述するには、パラメータnumNegativePics、numPositivePics、DeltaPocS0Minus1()及びDeltaPocS1Minus1()は以下のようになる。
numNegativePics = 4
numPositivePics = 2
DeltaPocS0Minus1(0) = 0 :POC = 5に相当 ( = 6 - (5 + 1))
DeltaPocS0Minus1(1) = 0 :POC = 4に相当 ( = 5 - (4 + 1))
DeltaPocS0Minus1(2) = 2 :POC = 1に相当 ( = 4 - (1 + 1))
DeltaPocS0Minus1(3) = 0 :POC = 0に相当 ( = 1 - (0 + 1))
また、DeltaPocS1Minus1(i)は、それぞれ、符号化対象(復号対象)ピクチャのPOC値より大きいPOC値を持つ、DPBに保存されたピクチャのPOC値を、本ピクチャのPOC値に近い方から順に、そのPOC値から一つ前のピクチャのPOC値を減じた値からさらに1を減じた値で記述する。そのため、この例では、DeltaPocS1Minus1(i)は、以下のように決定される。
DeltaPocS1Minus1(0) = 1 :POC = 8に相当 ( = 8 - (6 + 1))
DeltaPocS1Minus1(1) = 0 :POC = 9に相当 ( = 9 - (8 + 1))
符号化フィールドペアの平均動き量が閾値Th2以上の場合(ステップS107−Yes)、制御部11は、フィールド単位で符号化すると判定する。そして制御部11は、ソース符号化部13に、フィールド単位で符号化することを通知する。
ソース符号化部13は、次に符号化するピクチャを、符号化モードに従って、フィールド単位でインター予測またはイントラ予測符号化する(ステップS111)。
そして動画像復号装置20は、動画像復号処理を終了する。
第2の実施形態による動画像符号化装置及び動画像復号装置は、第1の実施形態による動画像符号化装置及び動画像復号装置と比較して、フィールド単位で符号化順序が指定される符号化ユニット構造(第2の符号化ユニット構造)も利用可能とする点で異なる。以下では、第1の実施形態と第2の実施形態の相違点についてを説明する。
この例では、フィールドピクチャ2012〜2019の符号化順序は、フィールド2019→2015→2013→2012→2014→2017→2016→2018の順となる。
図7及び8の説明と同様に、動画像復号装置20では、局所復号ピクチャは、復号ピクチャと読み替える。
動画像2100は、図7に示された動画像1400と同様に、三つの符号化ユニット2101〜2103を含む。また、各ブロックは、それぞれ、動画像2100に含まれる一つのフィールドピクチャを表す。このうち、'nt'と書かれたブロックは、入力順でn番目のフィールドペアに含まれるトップフィールドピクチャである。一方、'nb'と書かれたブロックは、入力順でn番目のフィールドペアに含まれるボトムフィールドピクチャである。
本実施例では、図8の例と同様に、DPBのバンク数(参照ピクチャ及び局所復号ピクチャの両方を含む)は8であり、L0、L1方向のそれぞれの参照ピクチャ数の上限は2である。バンク数及び参照ピクチャ数の上限は、例えば、何れも外部設定され、制御部11に通知される。動画像復号装置20では、バンク数及び参照ピクチャ数の上限は、ビットストリーム内のパラメータ値で設定される。
この場合、パラメータPairPicPocは、フィールドペアを組むもう一つのフィールドピクチャのPOC値を有さなくてもよい。図16の例において、POC値が6のフィールドピクチャが参照ピクチャとなる場合、POC値が9のフィールドピクチャのパラメータPairPicPocが6に設定され、POC値が6のフィールドピクチャのパラメータPairPicPocが9に設定されてもよい。この場合、POC値が16のフレームピクチャのL0[0]は6となり、POC値が6のピクチャとPOC値が9のピクチャとをインタリーブしたフレームピクチャが、POC値が16のフレームピクチャによって参照される。
11 制御部
12 参照ピクチャ管理部
13 ソース符号化部
14 バッファインタフェース部
15 フレームバッファ
16 エントロピー符号化部
20 動画像復号装置
21 エントロピー復号部
22 参照ピクチャ管理部
23 バッファインタフェース部
24 フレームバッファ
25 ソース復号部
Claims (7)
- 動画像に含まれる複数のフィールドピクチャをインター予測符号化する動画像符号化装置であって、
前記複数のフィールドピクチャのうち、符号化済みのフィールドピクチャを保存するバッファメモリと、
二つのフィールドピクチャを含むペアをインターリーブしてフレームピクチャを作成する場合に、前記複数のフィールドピクチャのそれぞれに前記ペアとなる他方のフィールドピクチャを指定する参照ペア情報を付加する制御部と、
前記複数のフィールドピクチャのうち、符号化されていない二つのフィールドピクチャをインターリーブすることで作成されるフレームピクチャを符号化対象ピクチャとしてインター予測符号化する場合に、前記バッファメモリに保存された符号化済みのフィールドピクチャの前記参照ペア情報を参照して特定されたペアをインターリーブすることで参照ピクチャとしてフレームピクチャを生成するバッファインタフェース部と、
前記符号化対象ピクチャがフレームピクチャである場合、当該符号化対象ピクチャを前記参照ピクチャを用いてフレームピクチャ単位でインター予測符号化することで符号化データを生成する符号化部と、
前記符号化データ及び前記参照ペア情報をエントロピー符号化することにより、エントロピー符号化された参照ペア情報を含む、符号化された動画像データを生成するエントロピー符号化部と、
を有する動画像符号化装置。 - 前記符号化対象ピクチャが属する、複数のピクチャ間の参照関係が規定される単位となる符号化ユニットの当該参照関係を表す構造及び前記符号化対象ピクチャの符号化順序に基づいて、前記バッファメモリに保存する前記符号化済みのフィールドピクチャを決定し、前記バッファメモリに保存されている前記符号化済みのフィールドピクチャのうちで前記参照ピクチャとして利用可能なフィールドピクチャを特定する参照ピクチャ情報を作成し、該参照ピクチャ情報を前記符号化部へ通知する参照ピクチャ管理部をさらに有し、
前記符号化部は、前記参照ピクチャ情報に基づいて、前記バッファメモリから読み出して前記参照ピクチャとして利用する符号化済みのフィールドピクチャを指定する情報を前記バッファインタフェース部へ通知する、請求項1に記載の動画像符号化装置。 - 前記制御部は、前記複数のフィールドピクチャのうち、時間的に連続する二つのフィールドピクチャ間で、当該二つのフィールドピクチャに写っている物体の動き量を求め、該動き量が第1の閾値未満である場合、当該二つのフィールドピクチャをインターリーブすることにより作成されるフレームピクチャを前記符号化対象ピクチャとすることを前記符号化部に通知し、一方、前記動き量が前記第1の閾値以上である場合、前記二つのフィールドピクチャのそれぞれを別個に符号化対象ピクチャとすることを前記符号化部に通知する、請求項2に記載の動画像符号化装置。
- 前記制御部は、前記符号化ユニットに含まれる、表示順序で連続する二つのフィールドピクチャのそれぞれについて、当該二つのフィールドピクチャに写っている物体の動き量を求め、前記符号化ユニット全体で前記動き量を平均することで得られた平均動き量が第2の閾値未満である場合、前記符号化ユニットに含まれる各フィールドピクチャについて、表示順序で連続する二つのフィールドピクチャのペアごとに符号化順序を設定し、
一方、前記平均動き量が前記第2の閾値以上である場合、前記符号化ユニットに含まれるフィールドピクチャごとに符号化順序を設定する、請求項3に記載の動画像符号化装置。 - インター予測符号化された複数のフィールドピクチャを含む符号化動画像を復号する動画像復号装置であって、
エントロピー符号化された、復号対象ピクチャの符号化データと、二つのフィールドピクチャを含むペアをインターリーブしてフレームピクチャを作成する場合に、前記複数のフィールドピクチャのそれぞれについて前記ペアとなる他方のフィールドピクチャを指定する参照ペア情報とを復号するエントロピー復号部と、
前記複数のフィールドピクチャのうち、復号済みのフィールドピクチャを保存するバッファメモリと、
復号対象ピクチャが、前記複数のフィールドピクチャのうちの復号されていない二つのフィールドピクチャをインターリーブすることで作成されるフレームピクチャである場合に、前記参照ペア情報を参照して、参照ピクチャを生成するための復号済みの二つのフィールドピクチャを決定する参照ピクチャ管理部と、
前記複数のフィールドピクチャのうち、復号されていない二つのフィールドピクチャをインターリーブすることで作成されるフレームピクチャを前記復号ピクチャとしてインター予測復号する場合に、前記バッファメモリに保存された復号済みのフィールドピクチャのなかから、前記参照ペア情報に基づいて決定された復号済みの二つのフィールドピクチャのペアをインターリーブすることで前記参照ピクチャとしてフレームピクチャを生成するバッファインタフェース部と、
前記復号対象ピクチャがフレームピクチャである場合、当該復号対象ピクチャの符号化データを前記参照ピクチャを用いてフレームピクチャ単位でインター予測復号することで当該復号対象ピクチャを復号する復号部と、
を有する動画像復号装置。 - 動画像に含まれる複数のフィールドピクチャをインター予測符号化する動画像符号化方法であって、
前記複数のフィールドピクチャのうち、符号化済みのフィールドピクチャをバッファメモリに保存し、
二つのフィールドピクチャを含むペアをインターリーブしてフレームピクチャを作成する場合に、前記複数のフィールドピクチャのそれぞれに前記ペアとなる他方のフィールドピクチャを指定する参照ペア情報を付加し、
前記複数のフィールドピクチャのうち、符号化されていない二つのフィールドピクチャをインターリーブすることで作成されるフレームピクチャを符号化対象ピクチャとしてインター予測符号化する場合に、前記バッファメモリに保存された符号化済みのフィールドピクチャの前記参照ペア情報を参照して特定されたペアをインターリーブすることで参照ピクチャとしてフレームピクチャを生成し、
前記符号化対象ピクチャがフレームピクチャである場合、当該符号化対象ピクチャを前記参照ピクチャを用いてフレームピクチャ単位でインター予測符号化することで符号化データを生成し、
前記符号化データ及び前記参照ペア情報をエントロピー符号化することにより、エントロピー符号化された参照ペア情報を含む、符号化された動画像データを生成する、
ことを含む動画像符号化方法。 - インター予測符号化された複数のフィールドピクチャを含む符号化動画像を復号する動画像復号方法であって、
エントロピー符号化された、復号対象ピクチャの符号化データと、二つのフィールドピクチャを含むペアをインターリーブしてフレームピクチャを作成する場合に、前記複数のフィールドピクチャのそれぞれについて前記ペアとなる他方のフィールドピクチャを指定する参照ペア情報とを復号し、
前記複数のフィールドピクチャのうち、復号済みのフィールドピクチャをバッファメモリに保存し、
復号対象ピクチャが、前記複数のフィールドピクチャのうちの復号されていない二つのフィールドピクチャをインターリーブすることで作成されるフレームピクチャである場合に、前記参照ペア情報を参照して、参照ピクチャを生成するための復号済みの二つのフィールドピクチャを決定し、
前記複数のフィールドピクチャのうち、復号されていない二つのフィールドピクチャをインターリーブすることで作成されるフレームピクチャを前記復号ピクチャとしてインター予測復号する場合に、前記バッファメモリに保存された復号済みのフィールドピクチャのなかから、前記参照ペア情報に基づいて決定された復号済みの二つのフィールドピクチャのペアをインターリーブすることで前記参照ピクチャとしてフレームピクチャを生成し、
前記復号対象ピクチャがフレームピクチャである場合、当該復号対象ピクチャの符号化データを前記参照ピクチャを用いてフレームピクチャ単位でインター予測復号することで当該復号対象ピクチャを復号する、
ことを含む動画像復号方法。
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
PCT/JP2013/069332 WO2015008340A1 (ja) | 2013-07-16 | 2013-07-16 | 動画像符号化装置、動画像符号化方法、及び動画像復号装置ならびに動画像復号方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPWO2015008340A1 JPWO2015008340A1 (ja) | 2017-03-02 |
JP6156497B2 true JP6156497B2 (ja) | 2017-07-05 |
Family
ID=52345836
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2015527092A Expired - Fee Related JP6156497B2 (ja) | 2013-07-16 | 2013-07-16 | 動画像符号化装置、動画像符号化方法、及び動画像復号装置ならびに動画像復号方法 |
Country Status (3)
Country | Link |
---|---|
US (1) | US20160134888A1 (ja) |
JP (1) | JP6156497B2 (ja) |
WO (1) | WO2015008340A1 (ja) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106713927B (zh) * | 2016-11-14 | 2019-08-13 | 珠海格力电器股份有限公司 | 一种图像输出装置、方法及解码器 |
GB201817780D0 (en) * | 2018-10-31 | 2018-12-19 | V Nova Int Ltd | Methods,apparatuses, computer programs and computer-readable media for processing configuration data |
WO2021118191A1 (ko) * | 2019-12-10 | 2021-06-17 | 엘지전자 주식회사 | Tmvp에 기반한 영상 코딩 방법 및 그 장치 |
CN112702602A (zh) * | 2020-12-04 | 2021-04-23 | 浙江智慧视频安防创新中心有限公司 | 一种视频编解码的方法及存储介质 |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
GB9704027D0 (en) * | 1997-02-26 | 1997-04-16 | Discovision Ass | Memory manager for mpeg decoder |
JP2004194297A (ja) * | 2002-11-25 | 2004-07-08 | Matsushita Electric Ind Co Ltd | 動画像の符号化方法および復号化方法 |
AU2003275672C1 (en) * | 2002-11-25 | 2009-04-30 | Godo Kaisha Ip Bridge 1 | Moving Picture Coding Method and Moving Picture Decoding Method |
JP2011066592A (ja) * | 2009-09-16 | 2011-03-31 | Nippon Telegr & Teleph Corp <Ntt> | 符号化モード選択方法,符号化モード選択装置および符号化モード選択プログラム |
US9565431B2 (en) * | 2012-04-04 | 2017-02-07 | Qualcomm Incorporated | Low-delay video buffering in video coding |
-
2013
- 2013-07-16 JP JP2015527092A patent/JP6156497B2/ja not_active Expired - Fee Related
- 2013-07-16 WO PCT/JP2013/069332 patent/WO2015008340A1/ja active Application Filing
-
2016
- 2016-01-15 US US14/996,931 patent/US20160134888A1/en not_active Abandoned
Also Published As
Publication number | Publication date |
---|---|
JPWO2015008340A1 (ja) | 2017-03-02 |
WO2015008340A1 (ja) | 2015-01-22 |
US20160134888A1 (en) | 2016-05-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR102647830B1 (ko) | 비디오 코딩을 위한 방법 및 장치 | |
CN112956190B (zh) | 仿射运动预测 | |
JP6215344B2 (ja) | 非対称空間解像度を有するテクスチャビューコンポーネントおよび深度ビューコンポーネントの中での内部ビュー動き予測 | |
JP7358464B2 (ja) | ビデオ符号化のための方法及び機器 | |
KR101904625B1 (ko) | 비디오 코딩에서 서브-디코딩된 픽처 버퍼 (서브-dpb) 기반의 dpb 동작들을 위한 시그널링 | |
JP5805849B2 (ja) | ビデオコード化における動きベクトル予測 | |
JP7372327B2 (ja) | ビデオ復号の方法及び機器、及びコンピュータプログラム | |
JP6352390B2 (ja) | 高レベルシンタックス専用shvcにおける一般化残差予測ならびにそのシグナリングおよび管理 | |
JP7337166B2 (ja) | アフィン履歴ベース動きベクトル予測子バッファにアクセスする方法及び装置並びにコンピュータプログラム | |
JP2015502095A (ja) | テクスチャビューコンポーネントと深度ビューコンポーネントの間の内部ビュー動き予測 | |
JP2015106747A (ja) | 動画像符号化装置、動画像符号化方法及び動画像符号化用コンピュータプログラム | |
CN110868589B (zh) | 帧间预测方法、装置及其应用的编/解方法及装置 | |
JP7372426B2 (ja) | ビデオビットストリームの中のオフセットによる参照ピクチャ再サンプリングの方法 | |
JP5983430B2 (ja) | 動画像符号化装置、動画像符号化方法及び動画像復号装置ならびに動画像復号方法 | |
CN112840645A (zh) | 视频编码系统中组合多个预测子用于块预测的方法及装置 | |
JP6156497B2 (ja) | 動画像符号化装置、動画像符号化方法、及び動画像復号装置ならびに動画像復号方法 | |
JP2023521609A (ja) | ビデオコーディングのための方法、コンピュータプログラム及び装置 | |
JP6032367B2 (ja) | 動画像符号化装置、動画像符号化方法及び動画像復号装置ならびに動画像復号方法 | |
CN116569553A (zh) | 采用样本填充进行帧内块复制预测的方法和装置 | |
CN111010565B (zh) | 帧间预测方法、装置及其应用的编/解方法及装置 | |
WO2020042990A1 (zh) | 帧间预测方法、装置及其应用的编/解方法及装置 | |
JP2016195326A (ja) | 動画像符号化装置、動画像符号化方法、及び動画像符号化用コンピュータプログラム | |
KR20230117614A (ko) | 움직임 벡터 차이 제한 방법 및 디바이스 | |
JP2024508303A (ja) | ビデオストリームのインター予測ビデオブロックをデコードする方法及び電子デバイス | |
JP2023550041A (ja) | 拡張された精度を有するレンジ拡張のための制約フラグシグナリングのための技術 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20170228 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20170426 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20170509 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20170522 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6156497 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
LAPS | Cancellation because of no payment of annual fees |