JP6046843B2 - 動画像予測符号化装置、動画像予測符号化方法、動画像予測復号装置及び動画像予測復号方法 - Google Patents

動画像予測符号化装置、動画像予測符号化方法、動画像予測復号装置及び動画像予測復号方法 Download PDF

Info

Publication number
JP6046843B2
JP6046843B2 JP2016022435A JP2016022435A JP6046843B2 JP 6046843 B2 JP6046843 B2 JP 6046843B2 JP 2016022435 A JP2016022435 A JP 2016022435A JP 2016022435 A JP2016022435 A JP 2016022435A JP 6046843 B2 JP6046843 B2 JP 6046843B2
Authority
JP
Japan
Prior art keywords
nal
decoding
unit
type
picture
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2016022435A
Other languages
English (en)
Other versions
JP2016106490A (ja
Inventor
順也 瀧上
順也 瀧上
ブン チュンセン
チュンセン ブン
タン ティオ ケン
ティオ ケン タン
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NTT Docomo Inc
Original Assignee
NTT Docomo Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NTT Docomo Inc filed Critical NTT Docomo Inc
Priority to JP2016022435A priority Critical patent/JP6046843B2/ja
Publication of JP2016106490A publication Critical patent/JP2016106490A/ja
Application granted granted Critical
Publication of JP6046843B2 publication Critical patent/JP6046843B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Compression Or Coding Systems Of Tv Signals (AREA)

Description

本発明は、動画像予測符号化装置、動画像予測符号化方法、動画像予測復号装置及び動画像予測復号方法に関するものである。
従来の動画像圧縮技術では、ビットストリームはネットワーク・アブストラクション・レイヤー(NAL)ユニットにカプセル化される。NALユニットは自己完結したパケットを提供し、ビデオ・レイヤーに異なるネットワーク環境における同一性を与える。NALユニットのヘッダにはシステム・レイヤーで必要となる情報が含まれている。NALユニットのヘッダはパケットネットワークにおけるパケットヘッダの一部となり、メディア・アウェア・ネットワーク・エレメンツ(MANEs)によって動作するようになるように設計されている。
従来技術のNALユニットヘッダは以下のシンタックス・エレメンツを含んでいる。nal_ref_flagは、そのNALユニットが他のNALユニットの復号処理において参照に用いられるか否かを指示する。nal_unit_typeはNALユニットによって伝達される内容の型を指示する。NALユニットはパラメータ・セット、符号化スライス、サプリメンタル・エンハンスメント・インフォメーション(SEI)メッセージなどの情報を含む。temporal_idはNALユニットの時間識別子を指示する。
従来技術は非特許文献1に記載されている。
Benjamin Bross et. al.,"Highefficiency video coding (HEVC) text specification draft 7", JointCollaborative Team on Video Coding (JCT-VC) of ITU-T SG16 WP3 and ISO/IECJTC1/SC29/WG11, 9th Meeting: Geneva, CH, 27th April - 7th May 2012
MANEsがパケットの冒頭で最小限のバイト数を調べるように設計されているように、NALユニットヘッダは限られた資源である。従来技術においては、NALユニットヘッダは2バイトに過ぎない。それゆえ、NALユニットヘッダの全てのシンタックスエレメントは重要であり、可能な限り数多くの、かつ、他のシンタックスエレメントとは相関のない情報を伝達するべきである。
大部分のNALユニットタイプの場合、nal_ref_flagは固定値に設定される必要があるため、nal_ref_flagは必要とされない。非特許文献1に記載の仕様において、nal_ref_flagが0または1の値をとりうるNALユニットタイプは3種類のみである。仕様で定義されているその他のNALユニットタイプではnal_ref_flagの値は固定されている。これを表1に示す。
Figure 0006046843

表1は、nal_unit_typeの値(NAL unit type range列)とnal_ref_flagが取りうる値(Possible nal_ref_flag列)との対応を示す表である。ここで、nal_unit_typeの値が1、2、あるいは3であるNALユニットタイプは、nal_ref_flagの値として0あるいは1をとりうる。残りのNALユニットタイプはリザーブされている、あるいは仕様化されていない。
このようにnal_ref_flagの値が、nal_unit_typeの値に応じて一意に決定される場合においても、従来手法ではnal_ref_flag及びnal_unit_typeのそれぞれにビットを割り当てており、非効率な設計となっている。
上述の課題を解決するための解決策はNALユニットヘッダでnal_ref_flagを明示的に送らずに、NALユニットタイプから暗示することである。NALユニットの内容が、参照ピクチャあるいは非参照ピクチャになりうる3通りのNALユニットタイプについて、nal_ref_flagが1であることを暗示する3通りのNALユニットタイプを追加する。元の3通りのNALユニットタイプについては、nal_ref_flagが0であることを暗示している。
上述の課題を解決するために、本発明に係る動画像予測符号化装置は、動画像を構成する複数のピクチャを入力する入力手段と、ピクチャを符号化し、圧縮画像データを生成し、NALユニットヘッダ情報とともにNALユニットにカプセル化する符号化手段と、を具備し、NALユニットヘッダ情報は、nal_unit_typeを含み、符号化手段は、nal_unit_typeを、符号化されたピクチャデータが、他のピクチャを復号する際に参照のために使われるか否かを一意に示すように決定する。
本発明に係る動画像予測復号装置は、動画像を構成する複数のピクチャが符号化され、NALユニットヘッダ情報とともにNALユニットにカプセル化された、圧縮画像データを入力する入力手段と、NALユニットヘッダ情報及び圧縮画像データを復元する復号手段と、を具備し、NALユニットヘッダ情報は、復元されたピクチャデータが、他のピクチャを復号する際に参照のために使われるか否かを一意に示すnal_unit_typeを含み、復号手段は、nal_unit_typeに基づいて、圧縮画像データを復号する。
本発明に係る動画像予測復号装置における復号手段は、nal_unit_typeと、復元されたピクチャデータが、他のピクチャを復号する際に参照のために使われるか否かを示す情報とが対応付いた予め格納された対応表に基づいて、圧縮画像データを復号することとしてもよい。
本発明に係る動画像予測符号化方法は、動画像を構成する複数のピクチャを入力する入力ステップと、ピクチャを符号化し、圧縮画像データを生成し、NALユニットヘッダ情報とともにNALユニットにカプセル化する符号化ステップと、を具備し、NALユニットヘッダ情報は、nal_unit_typeを含み、符号化ステップは、nal_unit_typeを、符号化されたピクチャデータが、他のピクチャを復号する際に参照のために使われるか否かを一意に示すように決定する。
本発明に係る動画像予測復号方法は、動画像を構成する複数のピクチャが符号化され、NALユニットヘッダ情報とともにNALユニットにカプセル化された、圧縮画像データを入力する入力ステップと、NALユニットヘッダ情報及び圧縮画像データを復元する復号ステップと、を具備し、NALユニットヘッダ情報は、復元されたピクチャデータが、他のピクチャを復号する際に参照のために使われるか否かを一意に示すnal_unit_typeを含み、復号ステップは、nal_unit_typeに基づいて、圧縮画像データを復号する。
本発明に係る動画像予測復号方法における復号ステップは、nal_unit_typeと、復元されたピクチャデータが、他のピクチャを復号する際に参照のために使われるか否かを示す情報とが対応付いた予め格納された対応表に基づいて、圧縮画像データを復号することとしてもよい。
本発明の効果は、nal_ref_flagに使われているビットを節約し、他の指示情報として利用可能にすることである。これはNALユニットヘッダのより効率的な利用である。もうひとつの利用法は、NALユニットタイプを6ビットから7ビットに拡張できることである。現時点では利用可能な64通りのnal_unit_typeの値の半分には既存のNALユニットタイプが割り当てられており、32通りのnal_unit_typeの値についてはリザーブされ、将来新しいNALユニットタイプを規定する際に利用可能である。これらリザーブされたNALユニットタイプの値のうち3つを使い、かつNALユニットタイプのビット数を7ビットに拡張することで、将来的に93通り(128−32−3=93)の更なるNALユニットを規定することができる。
本発明の実施形態に係る動画像予測符号化装置を示すブロック図である。 本発明の実施形態に係る動画像予測復号装置を示すブロック図である。 本発明の実施形態に係る動画像予測符号化方法の処理の流れを示すフローチャートである。 本発明の実施形態に係る動画像予測符号化方法の処理のうち一部処理の詳細な流れを示すフローチャートである。 本発明の実施形態に係る動画像予測復号方法の処理の流れを示すフローチャートである。 本発明の実施形態に係る動画像予測復号方法の処理のうち一部処理の詳細な流れを示すフローチャートである。 記録媒体に記録されたプログラムを実行するためのコンピュータのハードウェア構成を示す図である。 記録媒体に記憶されたプログラムを実行するためのコンピュータの斜視図である。 動画像予測符号化プログラムの構成例を示すブロック図である。 動画像予測復号プログラムの構成例を示すブロック図である。
以下、本発明の実施の形態について、図1から図10を用いて説明する。
まず、本発明による動画像予測符号化方法について説明する。図1は本発明の実施形態による動画像予測符号化装置を示すブロック図である。101は入力端子、102はブロック分割器、103は予測信号生成器、104はフレームメモリ、105は減算器、106は変換器、107は量子化器、108は逆量子化器、109は逆変換器、110は加算器、111はエントロピー符号化器、112は出力端子、113は入力端子である。入力端子101は入力手段に対応する。減算器105と変換器106と量子化器107とエントロピー符号化器111とは符号化手段に対応する。逆量子化器108、逆変換器109と加算器110は復号手段に対応する。
以上のように構成された動画像予測符号化装置について、以下その動作を述べる。複数枚の画像からなる動画像の信号は入力端子101に入力される。符号化の対象となる画像はブロック分割器102にて、複数の領域に分割される。本発明による実施形態では、8x8の画素からなるブロックに分割されるが、それ以外のブロックの大きさまたは形に分割してもよい。次に符号化処理の対象となる領域(以下対象ブロックとよぶ)に対して、予測信号を生成する。本発明による実施形態では、2種類の予測方法が用いられる。すなわち画面間予測と画面内予測である。
画面間予測では、過去に符号化されたのちに復元された再生画像を参照画像として、この参照画像から対象ブロックに対する誤差の最も小さい予測信号を与える動き情報を求める。この処理は動き検出とよばれる。また場合に応じて、対象ブロックを再分割し、再分割された小領域に対し画面間予測方法を決定してもよい。この場合、各種の分割方法の中から、対象ブロック全体に対し最も効率のよい分割方法及びそれぞれの動き情報を決定する。本発明による実施形態では、予測信号生成器103にて行われ、対象ブロックはラインL102、参照画像はL104経由で入力される。参照画像としては、過去に符号化され復元された複数の画像を参照画像として用いる。詳細は従来の技術であるMPEG−2、4、H.264のいずれかの方法と同じである。このように決定された動き情報及び小領域の分割方法はラインL112経由でエントロピー符号化器111に送られ符号化した上で出力端子112から送出される。また複数の参照画像の中で、予測信号がどの参照画像から取得するかに関する情報(リファレンス・インデックス)もラインL112経由でエントロピー符号化器111に送られる。予測信号生成器103では、小領域の分割方法及びそれぞれの小領域に対応する、参照画像と動き情報をもとにフレームメモリ104から参照画像信号を取得し、予測信号を生成する。このように生成された画面間予測信号はラインL103経由で減算器105に送られる。
画面内予測では、対象ブロックに空間的に隣接する既再生の画素値を用いて画面内予測信号を生成する。具体的には予測信号生成器103では、フレームメモリ104から同じ画面内にある既再生の画素信号を取得し、これらの信号を外挿することによって画面内予測信号を生成する。外挿の方法に関する情報はラインL112経由でエントロピー符号化器111に送られ符号化した上で出力端子112から送出される。このように生成された画面内予測信号は減算器105に送られる。予測信号生成器103における画面内の予測信号生成方法は、従来の技術であるH.264の方法と同じである。上述のように求められた画面間予測信号と画面内予測信号に対し、誤差の最も小さいものが選択され、減算器105に送られる。
減算器105にて対象ブロックの信号(ラインL102経由)から予測信号(ラインL103経由)を引き算し、残差信号を生成する。この残差信号は変換器106にて離散コサイン変換され、その各係数は量子化器107にて量子化される。最後にエントロピー符号化器111にて量子化された変換係数を符号化して、予測方法に関する情報とともに出力端子112より送出される。
後続の対象ブロックに対する画面内予測もしくは画面間予測を行うために、圧縮された対象ブロックの信号は逆処理し復元される。すなわち、量子化された変換係数は逆量子化器108にて逆量子化されたのちに逆変換器109にて逆離散コサイン変換され、残差信号を復元する。加算器110にて復元された残差信号とラインL103から送られた予測信号とを加算し、対象ブロックの信号を再生し、フレームメモリ104に格納する。本実施の形態では変換器106と逆変換器109を用いているが、これらの変換器に代わるほかの変換処理を用いてもよい。場合によって、変換器106と逆変換器109がなくてもよい。
入力端子113より各画像の表示順番情報や画像を符号化するタイプ(画面内予測符号化、画面間予測符号化、双方向予測符号化)、NALユニットタイプに関する情報が入力され、これらの情報に基づいて予測信号生成器103が動作する。またこれらの情報はラインL113を経由してエントロピー符号化器111に送られ、符号化した上で出力端子112から送出される。NALユニットタイプを符号化するためのエントロピー符号化器111の動作については後述する。
次に本発明による動画像予測復号方法について説明する。図2は本発明の実施形態による画像予測復号装置のブロック図を示す。201は入力端子、202はデータ解析器、203は逆量子化器、204は逆変換器、205は加算器、206は出力端子、207はフレームメモリ、208は予測信号生成器、209はフレームメモリ管理器である。入力端子201は入力手段に対応する。データ解析器202と逆量子化器203と逆変換器204と加算器205とは復号手段に対応する。復号手段としてそれ以外のものを用いてもよい。また逆変換器204がなくてもよい。
以上のように構成された動画像予測復号装置について、以下その動作を述べる。上述した方法で圧縮符号化された圧縮データは入力端子201から入力される。この圧縮データには、画像を複数のブロックに分割された対象ブロックを予測し符号化された残差信号及び予測信号の生成に関連する情報などが含まれている。予測信号の生成に関連する情報として、NALユニットタイプに加え、画面間予測の場合はブロック分割に関する情報(ブロックのサイズ)や、動き情報と上述のリファレンス・インデックスに関する情報が含まれ、画面内予測の場合は周辺の既再生の画素から外挿方法に関する情報が含まれている。
データ解析器202にて、圧縮データから対象ブロックの残差信号、NALユニットタイプを含む予測信号の生成に関連する情報、量子化パラメータ、画像の表示順番情報を抽出する。データ解析器202におけるNALユニットタイプ抽出のための動作については後述する。対象ブロックの残差信号は逆量子化器203にて量子化パラメータ(ラインL202経由)をもとに逆量子化される。その結果は逆変換器204にて逆離散コサイン変換される。
次にラインL206経由で、対象画像の表示順番情報、画像の符号化タイプNALユニットタイプ、およびリファレンス・インデックスなど予測信号の生成に関連する情報が予測信号生成器208に送られる。予測信号生成器208では、予測信号の生成に関連する情報をもとに、フレームメモリ207にアクセスし、複数の参照画像の中から参照信号を取得し(ラインL207経由)予測信号を生成する。この予測信号はラインL208経由で加算器205に送られ、復元された残差信号に加算され、対象ブロック信号を再生し、ラインL205経由で出力端子206から出力すると同時にフレームメモリ207に格納される。
フレームメモリ207には、後続の画像の復号・再生に用いられる再生画像が格納されている。
表2および表3は、NALユニットヘッダの2バイトの使用形態に関する2通りのシンタックスの選択肢を示す表である。
Figure 0006046843

Figure 0006046843

表2および表3において、Descriptor列の括弧内の数字は、対応する項目が有するビット数を表す。
表2のNALユニットヘッダシンタックスでは、nal_ref_flagはリザーブドビット(reserved)に置き換わっている。このビットは現在の復号装置では無視されるが、将来の復号装置のために新たな意味やセマンティクスを割り当てることができる。なお、表2におけるビットの配置は説明のために過ぎず、リザーブドビットは2バイトのヘッダ内の他の場所に配置してもよい。
表3のNALユニットヘッダシンタックスでは、nal_unit_typeに7ビットが割り当てられており、最大128通りの異なるnal_unit_typeを規定することができる。なお、本実施形態においてはnal_unit_typeに7ビットを割り当てることを選択したが、nal_ref_flagで節約されたビットは、temporal_idに割り当てられてもよい。
表4に本実施形態におけるNALユニットタイプを示す。
Figure 0006046843

表4は、nal_unit_typeの値から推定されるnal_ref_flagの値を示す表である。NALユニットタイプは表4の2列目に示されるように、複数のカテゴリにグループ分けすることができる。そのカテゴリとは下記の通りである。1)RAPスライス(RAP slice):ランダム・アクセス・ピクチャの符号化スライスを含んでいるNALユニット
2)TLAスライス(TLA slice):テンポラル・レイヤー・アクセスの符号化スライスを含んでいるNALユニット
3)TFDスライス(TFD slice):ディスカードのためのタグ付けがされたピクチャの符号化スライスを含んでいるNALユニット
4)その他のスライス(Other slice):上記のいずれでもない符号化スライスを含んでいるNALユニット
5)パラメータ・セット(Parameter Set):ビデオ、シーケンス、ピクチャの適応パラメータセットを含んでいるNALユニット
6)インフォメーション(Information):アクセス・デリミタ、フィラーデータ、あるいはサプリメンタル・エンハンスメント・インフォメーション(SEI)を含んでいるNALユニット
本実施形態では、nal_unit_type(ピクチャタイプ)の値として9、10、11に対応する3通りの新しいNALユニットタイプが従来技術のnal_unit_typeに追加される。これらのnal_unit_typeの値をもつNALユニットは、それぞれnal_unit_typeの値として1、2、3をもつNALユニットと同じスライスタイプを含む。nal_unit_type:1は非RAP、非TFDかつ非TLAピクチャの符号化スライスを含み、nal_unit_type:2はTFDピクチャの符号化スライスを含み、nal_unit_type:3は非TFDのTLAピクチャの符号化スライスを含んでいる。
従来技術との違いは、本実施形態において、値1、2、3が非参照ピクチャに属する符号化スライスであり、値9、10、11が非参照ピクチャに属する符号化スライスであることである。
なおそれぞれのカテゴリに割り当てられる値は、上記に限定されない。さらには、それぞれのカテゴリをいくつかのサブカテゴリに拡張し、表4におけるリザーブされた値を用いて、新規の値をそれらのサブカテゴリに割り当ててもよい。
図3に本実施形態におけるNALユニットヘッダの符号化のための動画像予測符号化装置の動作を示す。ステップ110において、動画像予測符号化装置はパケット化されるビデオデータを取得する。ステップ120において、常に0に固定されているNALユニットの最初のビットを符号化する。ステップ130において、nal_unit_typeを決定し、符号化する。ステップ140において、temporal_idを符号化し、ステップ150において、リザーブされている5ビット(reserved_one_5bits)を符号化し、NALユニットヘッダを完結させる。ステップ160において、残りのペイロード(payload)をパケット化し、処理を終了する。
図4に上述のステップ130におけるnal_unit_typeの決定及び符号化における処理の詳細を示す。
ステップ210において、動画像予測符号化装置はパケット化されるデータがランダム・アクセス・ピクチャ(RAP)のいずれかに属する符号化スライスであるか否かを判定し、RAPのいずれかに属する符号化スライスである場合(YES)はステップ220に進む。そうでない場合(NO)はステップ230に進む。
ステップ220において、動画像予測符号化装置はRAPタイプに応じて、nal_ref_flagが1であることを暗示する4から8までのnal_unit_typeを符号化し、ステップ140に進む。
ステップ230において、動画像予測符号化装置はパケット化されるデータがパラメータ・セットであるか否かを判定し、パラメータ・セットである場合(YES)はステップ240に進む。そうでない場合(NO)はステップ250に進む。
ステップ240において、動画像予測符号化装置はパラメータ・セットに応じて、nal_ref_flagが1であることを暗示する25から28までのnal_unit_typeを符号化し、ステップ140に進む。
ステップ250において、動画像予測符号化装置はパケット化されるデータがインフォメーション・データであるか否かを判定し、インフォメーション・データである場合(YES)はステップ260に進む。そうでない場合(NO)はステップ270に進む。
ステップ260において、動画像予測符号化装置はインフォメーション・タイプに応じて、nal_ref_flagが0であることを暗示する29から31までのnal_unit_typeを符号化し、ステップ140に進む。
ステップ270において、動画像予測符号化装置はパケット化されるデータが参照ピクチャであるか否かを判定し、参照ピクチャである場合(YES)はステップ280に進む。そうでない場合(NO)はステップ290に進む。ここで、参照ピクチャであるか否かの判定は、予測信号生成器から出力されるピクチャ間の参照情報に基づいて行われる。
ステップ270における条件分岐は以下の通りでもよい。ステップ270においては、ビデオデータは参照ピクチャや非参照ピクチャかのいずれかでなくてはならない。ステップ270において、動画像予測符号化装置はピクチャが参照ピクチャであるか否かを判定し、参照ピクチャである場合(YES)はステップ280に進む。そうでない場合(NO)はステップ290に進む。
ステップ280において、動画像予測符号化装置はスライスタイプに応じて、nal_ref_flagが1であることを暗示する9から11までのnal_unit_typeを符号化し、ステップ140に進む。
ステップ290において、動画像予測符号化装置はスライスタイプに応じて、nal_ref_flagが0であることを暗示する1から3までのnal_unit_typeを符号化し、ステップ140に進む。
図5に、本実施形態におけるNALユニットヘッダの復号のための動画像予測復号装置の動作を示す。ステップ310において、動画像予測復号装置は復号のための次のパケットを取得する。ステップ320において、常に0に固定されているNALユニットの最初のビット(forbidden_zero_bit)を復号する。ステップ330において、nal_unit_typeを復号し、nal_ref_flagの値を設定する。ステップ340において、temporal_idを復号し、ステップ350において、リザーブされている5ビット(reserved_one_5bits)を復号し、NALユニットヘッダを完結させる。ステップ360において、残りのペイロードをパケットから読み出し、処理を終了する。
図6に、上述のステップ330におけるnal_unit_typeの復号及びnal_ref_flagの値の設定における処理の詳細を示す。
ステップ400において、動画像予測復号装置はNALユニットヘッダを復号することで、nal_unit_typeの値を取得する。
ステップ410において、動画像予測復号装置はnal_unit_typeの値が1から3までのいずれかであるか否かを判定し、1から3までのいずれかである場合(YES)はNALユニットが非参照ピクチャの符号化スライスのひとつを含んでおり、ステップ420に進む。そうでない場合(NO)はステップ430に進む。
ステップ420において、動画像予測復号装置はnal_ref_flagの値を0に設定し、ステップ340に進む。
ステップ430において、動画像予測復号装置はnal_unit_typeの値が4から11までのいずれかであるか否かを判定し、4から11までのいずれかである場合(YES)はNALユニットがランダム・アクセス・ピクチャの符号化スライス、あるいは参照ピクチャの符号化スライスのひとつを含んでおり、ステップ440に進む。そうでない場合(NO)はステップ450に進む。
ステップ450において、動画像予測復号装置はnal_ref_flagの値を1に設定し、ステップ340に進む。
ステップ450において、動画像予測復号装置はnal_unit_typeの値が25から28までのいずれかであるか否かを判定し、25から28までのいずれかである場合(YES)はNALユニットがパラメータ・セットを含んでおり、ステップ460に進む。そうでない場合(NO)はステップ470に進む。
ステップ460において、動画像予測復号装置はnal_ref_flagの値を1に設定し、ステップ340に進む。
ステップ470において、動画像予測復号装置はnal_unit_typeの値が29から31までのいずれかであるか否かを判定し、29から31までのいずれかである場合(YES)はNALユニットがインフォメーション・データを含んでおり、ステップ480に進む。そうでない場合(NO)はnal_unit_typeは無効な値であり、ステップ490に進む。
ステップ480において、動画像予測復号装置はnal_ref_flagの値を0に設定し、ステップ340に進む。
ステップ490において、動画像予測復号装置はnal_ref_flagの値は未定義とし、ステップ340に進む。
本実施形態において、上述したnal_ref_flagの設定は論理的な判定を通じたものであるが、nal_unit_typeをインデックスとしたnal_ref_flagの参照テーブルを用いて、nal_ref_flagの値を設定してもよい。表5は、nal_unit_typeをインデックスとしたnal_ref_flagの参照テーブルの一例である。
Figure 0006046843

表5では、nal_ref_flagの32通りのエントリーは表4の最終列と同様の値に設定されている。
なお、上述したnal_ref_flagの推定あるいは設定方法は動画像予測復号装置に限定されず、MANEsにも適用可能である。
本実施形態において、動画像予測復号装置はnal_ref_flagの設定を行わないことを選択し、復号されたピクチャが参照ピクチャであるか否かを決定する際に、nal_unit_typeの値を直接使用してもよい。これは論理的な表現を用いると以下のように説明される。当該ピクチャのnal_unit_typeが1、2、または3である場合、当該ピクチャは非参照ピクチャである。そうでない場合、当該ピクチャは参照ピクチャであり、他のピクチャが参照に用いるため保存される。
本実施形態では、参照ピクチャ並びに非参照ピクチャの定義は映像全体に対して適用される。しかしながら、映像が、より高いテンポラル・レイヤのピクチャを捨てる、選択フレームドロップの処理が行われた場合には、この定義はもはや正確ではない可能性がある。
そのような状況においては、いくつかの参照ピクチャは実際には参照されないピクチャになりうる。これを回避するために、nal_unit_typeが9、10、11である参照ピクチャ、並びにnal_unit_typeが1、2、3である非参照ピクチャは以下のように定義してもよい。
参照ピクチャとは前記ピクチャと同じテンポラル・レイヤの他のいずれかのピクチャによって画面間予測のために使用されるピクチャである。
非参照ピクチャとは前記ピクチャと同じテンポラル・レイヤの他のいずれのピクチャによっても画面間予測のために使用されないピクチャである。
非特許文献1に記載の従来法においては、画面間予測はどのピクチャが画面間予測のために利用可能かを規定するリファレンス・ピクチャ・セット(RPS)の中身によって指示される。それゆえ、上述の定義は下記のように記載してもよい。
非参照ピクチャ(nal_unit_typeが1、2または3)は前記ピクチャと同じテンポラル・レイヤの他のいずれのピクチャのRPSにも含まれない。
参照ピクチャ(nal_unit_typeが9、10または11)とは前記ピクチャと同じテンポラル・レイヤの他のいずれかのピクチャのRPSに含まれる。
コンピュータを上述の動画像予測符号化装置及び動画像予測復号装置として機能させるための本発明に係る動画像予測符号化プログラム及び動画像予測復号プログラムは、プログラムとして記録媒体に格納されて提供される。記録媒体としては、フロッピー(登録商標)ディスク、CD−ROM、DVD、あるいはROM等の記録媒体、あるいは半導体メモリ等が例示される。
図7は、記録媒体に記録されたプログラムを実行するためのコンピュータのハードウェア構成を示す図であり、図8は、記録媒体に記憶されたプログラムを実行するためのコンピュータの斜視図である。コンピュータとして、CPUを具備しソフトウエアによる処理や制御を行なうDVDプレーヤ、セットトップボックス、携帯電話などを含む。
図7に示すように、コンピュータ30は、フロッピー(登録商標)ディスクドライブ装置、CD−ROMドライブ装置、DVDドライブ装置等の読取装置12と、オペレーティングシステムを常駐させた作業用メモリ(RAM)14と、記録媒体10に記憶されたプログラムを記憶するメモリ16と、ディスプレイといった表示装置18と、入力装置であるマウス20及びキーボード22と、データ等の送受を行うための通信装置24と、プログラムの実行を制御するCPU26とを備えている。コンピュータ30は、記録媒体10が読取装置12に挿入されると、読取装置12から記録媒体10に格納された動画像予測符号化・復号プログラムにアクセス可能になり、当該動画像予測符号化・復号プログラムによって、本発明による動画像予測符号化装置・復号装置として動作することが可能になる。
図8に示すように、動画像予測符号化プログラムもしくは動画像復号プログラは、搬送波に重畳されたコンピュータデータ信号40としてネットワークを介して提供されるものであってもよい。この場合、コンピュータ30は、通信装置24によって受信した動画像予測符号化プログラムもしくは動画像予測復号プログラをメモリ16に格納し、当該動画像予測符号化プログラムもしくは動画像予測復号プログラムを実行することができる。
具体的には、図9に示す通り、動画像予測符号化プログラムP100は、動画像を構成する複数の画像を入力する入力モジュールP101と、画像を、画面内予測もしくは画面間予測のいずれかのプログラムで符号化し、圧縮画像データを生成し、パケットヘッダ情報とともにパケット化する符号化モジュールP102と、を具備し、パケットヘッダ情報は、ピクチャタイプを含み、符号化モジュールP102は、ピクチャタイプを、符号化されたピクチャデータが、他のピクチャを復号する際に参照のために使われるか否かを一意に示すように決定する、ことを特徴とする動画像予測符号化プログラムである。
同様に、図10に示す通り、動画像予測復号プログラムP200は、動画像を構成する複数の画像に対し、画面内予測もしくは画面間予測のいずれかによって符号化され、パケットヘッダ情報とともにパケット化された、圧縮画像データを入力する入力モジュールP201と、パケットヘッダ情報及び圧縮画像データを復元する復号モジュールP202と、を具備し、パケットヘッダ情報は、復元されたピクチャデータが、他のピクチャを復号する際に参照のために使われるか否かを一意に示すピクチャタイプを含み、復号モジュールP202は、ピクチャタイプに基づいて、復元されたピクチャデータが、他のピクチャを復号する際に参照のために使われるか否かを決定することを特徴とする動画像予測復号プログラムである。
復号モジュールP202は、ピクチャタイプと、復元されたピクチャデータが、他のピクチャを復号する際に参照のために使われるか否かを示す情報とが対応付いた予め格納された対応表に基づいて、復元されたピクチャデータが、他のピクチャを復号する際に参照のために使われるか否かを決定する、ことを特徴としてもよい。
上述の課題を解決するために、本発明に係る動画像予測符号化装置は、動画像を構成する複数の画像を入力する入力手段と、画像を、画面内予測もしくは画面間予測のいずれかの方法で符号化し、圧縮画像データを生成し、パケットヘッダ情報とともにパケット化する符号化手段と、を具備し、パケットヘッダ情報は、ピクチャタイプを含み、符号化手段は、ピクチャタイプを、符号化されたピクチャデータが、他のピクチャを復号する際に参照のために使われるか否かを一意に示すように決定する、ことを特徴とする。
また、本発明に係る動画像予測復号装置は、動画像を構成する複数の画像に対し、画面内予測もしくは画面間予測のいずれかによって符号化され、パケットヘッダ情報とともにパケット化された、圧縮画像データを入力する入力手段と、パケットヘッダ情報及び圧縮画像データを復元する復号手段と、を具備し、パケットヘッダ情報は、復元されたピクチャデータが、他のピクチャを復号する際に参照のために使われるか否かを一意に示すピクチャタイプを含み、復号手段は、ピクチャタイプに基づいて、復元されたピクチャデータが、他のピクチャを復号する際に参照のために使われるか否かを決定する、ことを特徴とする。
また、本発明に係る動画像予測復号装置における復号手段は、ピクチャタイプと、復元されたピクチャデータが、他のピクチャを復号する際に参照のために使われるか否かを示す情報とが対応付いた予め格納された対応表に基づいて、復元されたピクチャデータが、他のピクチャを復号する際に参照のために使われるか否かを決定する、ことを特徴とする。
本発明に係る動画像予測符号化方法は、動画像を構成する複数の画像を入力する入力ステップと、画像を、画面内予測もしくは画面間予測のいずれかの方法で符号化し、圧縮画像データを生成し、パケットヘッダ情報とともにパケット化する符号化ステップと、を具備し、パケットヘッダ情報は、ピクチャタイプを含み、符号化ステップは、ピクチャタイプを、符号化されたピクチャデータが、他のピクチャを復号する際に参照のために使われるか否かを一意に示すように決定する、ことを特徴とする。
本発明に係る動画像予測復号方法は、動画像を構成する複数の画像に対し、画面内予測もしくは画面間予測のいずれかによって符号化され、パケットヘッダ情報とともにパケット化された、圧縮画像データを入力する入力ステップと、パケットヘッダ情報及び圧縮画像データを復元する復号ステップと、を具備し、パケットヘッダ情報は、復元されたピクチャデータが、他のピクチャを復号する際に参照のために使われるか否かを一意に示すピクチャタイプを含み、復号ステップは、ピクチャタイプに基づいて、復元されたピクチャデータが、他のピクチャを復号する際に参照のために使われるか否かを決定する、ことを特徴とする。
本発明に係る動画像予測復号方法における復号ステップは、ピクチャタイプと、復元されたピクチャデータが、他のピクチャを復号する際に参照のために使われるか否かを示す情報とが対応付いた予め格納された対応表に基づいて、復元されたピクチャデータが、他のピクチャを復号する際に参照のために使われるか否かを決定する、ことを特徴とする。
本発明に係る動画像予測符号化プログラムは、動画像を構成する複数の画像を入力する入力モジュールと、画像を、画面内予測もしくは画面間予測のいずれかのプログラムで符号化し、圧縮画像データを生成し、パケットヘッダ情報とともにパケット化する符号化モジュールと、を具備し、パケットヘッダ情報は、ピクチャタイプを含み、符号化モジュールは、ピクチャタイプを、符号化されたピクチャデータが、他のピクチャを復号する際に参照のために使われるか否かを一意に示すように決定する、ことを特徴とする。
本発明に係る動画像予測復号プログラムは、動画像を構成する複数の画像に対し、画面内予測もしくは画面間予測のいずれかによって符号化され、パケットヘッダ情報とともにパケット化された、圧縮画像データを入力する入力モジュールと、パケットヘッダ情報及び圧縮画像データを復元する復号モジュールと、を具備し、パケットヘッダ情報は、復元されたピクチャデータが、他のピクチャを復号する際に参照のために使われるか否かを一意に示すピクチャタイプを含み、復号モジュールは、ピクチャタイプに基づいて、復元されたピクチャデータが、他のピクチャを復号する際に参照のために使われるか否かを決定する、ことを特徴とする。
本発明に係る動画像予測復号プログラムにおける復号モジュールは、ピクチャタイプと、復元されたピクチャデータが、他のピクチャを復号する際に参照のために使われるか否かを示す情報とが対応付いた予め格納された対応表に基づいて、復元されたピクチャデータが、他のピクチャを復号する際に参照のために使われるか否かを決定する、ことを特徴とする。
上述の課題を解決するために、本発明に係る動画像予測符号化装置は、動画像を構成する複数のピクチャを入力する入力手段と、ピクチャを符号化し、圧縮画像データを生成し、NALユニットヘッダ情報とともにNALユニットにカプセル化する符号化手段と、を具備し、動画像を構成する複数のピクチャは複数のテンポラル・レイヤに分類され、NALユニットヘッダ情報は、nal_unit_typeを含み、符号化手段は、nal_unit_typeを、符号化されたピクチャデータが、同じテンポラル・レイヤの他のピクチャを復号する際に参照のために使われるか否かを一意に示すように決定する。
また、本発明に係る動画像予測復号装置は、動画像を構成する複数のピクチャが符号化され、NALユニットヘッダ情報とともにNALユニットにカプセル化された、圧縮画像データを入力する入力手段と、NALユニットヘッダ情報及び圧縮画像データを復元する復号手段と、を具備し、動画像を構成する複数のピクチャは複数のテンポラル・レイヤに分類され、NALユニットヘッダ情報は、復元されたピクチャデータが、同じテンポラル・レイヤの他のピクチャを復号する際に参照のために使われるか否かを一意に示すnal_unit_typeを含み、復号手段は、nal_unit_typeに基づいて、圧縮画像データを復元する。
本発明に係る動画像予測符号化方法は、動画像を構成する複数のピクチャを入力する入力ステップと、ピクチャを符号化し、圧縮画像データを生成し、NALユニットヘッダ情報とともにNALユニットにカプセル化する符号化ステップと、を具備し、動画像を構成する複数のピクチャは複数のテンポラル・レイヤに分類され、NALユニットヘッダ情報は、nal_unit_typeを含み、符号化ステップは、nal_unit_typeを、符号化されたピクチャデータが、同じテンポラル・レイヤの他のピクチャを復号する際に参照のために使われるか否かを一意に示すように決定する。
本発明に係る動画像予測復号方法は、動画像を構成する複数のピクチャが符号化され、NALユニットヘッダ情報とともにNALユニットにカプセル化された、圧縮画像データを入力する入力ステップと、NALユニットヘッダ情報及び圧縮画像データを復元する復号ステップと、を具備し、動画像を構成する複数のピクチャは複数のテンポラル・レイヤに分類され、NALユニットヘッダ情報は、復元されたピクチャデータが、同じテンポラル・レイヤの他のピクチャを復号する際に参照のために使われるか否かを一意に示すnal_unit_typeを含み、復号ステップは、nal_unit_typeに基づいて、圧縮画像データを復元する。
本発明に係る動画像予測符号化プログラムは、動画像を構成する複数のピクチャを入力する入力モジュールと、ピクチャを符号化し、圧縮画像データを生成し、NALユニットヘッダ情報とともにNALユニットにカプセル化する符号化モジュールと、を具備し、動画像を構成する複数のピクチャは複数のテンポラル・レイヤに分類され、NALユニットヘッダ情報は、nal_unit_typeを含み、符号化モジュールは、nal_unit_typeを、符号化されたピクチャデータが、同じテンポラル・レイヤの他のピクチャを復号する際に参照のために使われるか否かを一意に示すように決定する。
本発明に係る動画像予測復号プログラムは、動画像を構成する複数のピクチャが符号化され、NALユニットヘッダ情報とともにNALユニットにカプセル化された、圧縮画像データを入力する入力モジュールと、NALユニットヘッダ情報及び圧縮画像データを復元する復号モジュールと、を具備し、動画像を構成する複数のピクチャは複数のテンポラル・レイヤに分類され、NALユニットヘッダ情報は、復元されたピクチャデータが、同じテンポラル・レイヤの他のピクチャを復号する際に参照のために使われるか否かを一意に示すnal_unit_typeを含み、復号モジュールは、nal_unit_typeに基づいて、圧縮画像データを復元する。
101…入力端子、102…ブロック分割器、103…予測信号生成器、104…フレームメモリ、105…減算器、106…変換器、107…量子化器、108…逆量子化器、109…逆変換器、110…加算器、111…エントロピー符号化器、112…出力端子、113…入力端子、201…入力端子、202…データ解析器、203…逆量子化器、204…逆変換器、205…加算器、206…出力端子、207…フレームメモリ、208…予測信号生成器。

Claims (6)

  1. 動画像を構成する複数のピクチャを入力する入力手段と、
    前記ピクチャを符号化し、圧縮画像データを生成し、NALユニットヘッダ情報とともにNALユニットにカプセル化する符号化手段と、を具備し、
    前記NALユニットヘッダ情報は、nal_unit_typeを含み、
    前記符号化手段は、前記nal_unit_typeを、符号化されたピクチャデータが、他のピクチャを復号する際に参照のために使われるか否かを一意に示すように決定する、動画像予測符号化装置。
  2. 動画像を構成する複数のピクチャが符号化され、NALユニットヘッダ情報とともにNALユニットにカプセル化された、圧縮画像データを入力する入力手段と、
    前記NALユニットヘッダ情報及び圧縮画像データを復元する復号手段と、を具備し、
    前記NALユニットヘッダ情報は、復元されたピクチャデータが、他のピクチャを復号する際に参照のために使われるか否かを一意に示すnal_unit_typeを含み、
    前記復号手段は、前記nal_unit_typeに基づいて、前記圧縮画像データを復号する、動画像予測復号装置。
  3. 前記復号手段は、前記nal_unit_typeと、復元されたピクチャデータが、他のピクチャを復号する際に参照のために使われるか否かを示す情報とが対応付いた予め格納された対応表に基づいて、前記圧縮画像データを復号する、請求項2に記載の動画像予測復号装置。
  4. 動画像を構成する複数のピクチャを入力する入力ステップと、
    前記ピクチャを符号化し、圧縮画像データを生成し、NALユニットヘッダ情報とともにNALユニットにカプセル化する符号化ステップと、を具備し、
    前記NALユニットヘッダ情報は、nal_unit_typeを含み、
    前記符号化ステップは、前記nal_unit_typeを、符号化されたピクチャデータが、他のピクチャを復号する際に参照のために使われるか否かを一意に示すように決定する、動画像予測符号化方法。
  5. 動画像を構成する複数のピクチャが符号化され、NALユニットヘッダ情報とともにNALユニットにカプセル化された、圧縮画像データを入力する入力ステップと、
    前記NALユニットヘッダ情報及び圧縮画像データを復元する復号ステップと、を具備し、
    前記NALユニットヘッダ情報は、復元されたピクチャデータが、他のピクチャを復号する際に参照のために使われるか否かを一意に示すnal_unit_typeを含み、
    前記復号ステップは、前記nal_unit_typeに基づいて、前記圧縮画像データを復号する、動画像予測復号方法。
  6. 前記復号ステップは、前記nal_unit_typeと、復元されたピクチャデータが、他のピクチャを復号する際に参照のために使われるか否かを示す情報とが対応付いた予め格納された対応表に基づいて、前記圧縮画像データを復号する、請求項5に記載の動画像予測復号方法。
JP2016022435A 2016-02-09 2016-02-09 動画像予測符号化装置、動画像予測符号化方法、動画像予測復号装置及び動画像予測復号方法 Active JP6046843B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2016022435A JP6046843B2 (ja) 2016-02-09 2016-02-09 動画像予測符号化装置、動画像予測符号化方法、動画像予測復号装置及び動画像予測復号方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2016022435A JP6046843B2 (ja) 2016-02-09 2016-02-09 動画像予測符号化装置、動画像予測符号化方法、動画像予測復号装置及び動画像予測復号方法

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
JP2012152700A Division JP5885604B2 (ja) 2012-07-06 2012-07-06 動画像予測符号化装置、動画像予測符号化方法、動画像予測符号化プログラム、動画像予測復号装置、動画像予測復号方法及び動画像予測復号プログラム

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP2016224323A Division JP6272979B2 (ja) 2016-11-17 2016-11-17 動画像予測復号方法及び動画像予測復号装置

Publications (2)

Publication Number Publication Date
JP2016106490A JP2016106490A (ja) 2016-06-16
JP6046843B2 true JP6046843B2 (ja) 2016-12-21

Family

ID=56120135

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2016022435A Active JP6046843B2 (ja) 2016-02-09 2016-02-09 動画像予測符号化装置、動画像予測符号化方法、動画像予測復号装置及び動画像予測復号方法

Country Status (1)

Country Link
JP (1) JP6046843B2 (ja)

Also Published As

Publication number Publication date
JP2016106490A (ja) 2016-06-16

Similar Documents

Publication Publication Date Title
RU2674928C1 (ru) Устройство кодирования видео с предсказанием, способ кодирования видео с предсказанием, программа кодирования видео с предсказанием, устройство декодирования видео с предсказанием, способ декодирования видео с предсказанием и программа декодирования видео с предсказанием
JP5698644B2 (ja) 動画像予測符号化方法、動画像予測符号化装置、動画像予測符号化プログラム、動画像予測復号方法、動画像予測復号装置及び動画像予測復号プログラム
JP6430045B2 (ja) 動画像予測符号化方法及び動画像予測復号方法
JP6272979B2 (ja) 動画像予測復号方法及び動画像予測復号装置
JP6046843B2 (ja) 動画像予測符号化装置、動画像予測符号化方法、動画像予測復号装置及び動画像予測復号方法
JP5957558B2 (ja) 動画像予測符号化方法、動画像予測符号化装置、動画像予測符号化プログラム、動画像予測復号方法、動画像予測復号装置及び動画像予測復号プログラム

Legal Events

Date Code Title Description
TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20161101

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20161117

R150 Certificate of patent or registration of utility model

Ref document number: 6046843

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250