JP2012070248A - 画像符号化方法、画像復号方法、画像符号化装置、画像復号装置、及びプログラム - Google Patents

画像符号化方法、画像復号方法、画像符号化装置、画像復号装置、及びプログラム Download PDF

Info

Publication number
JP2012070248A
JP2012070248A JP2010213803A JP2010213803A JP2012070248A JP 2012070248 A JP2012070248 A JP 2012070248A JP 2010213803 A JP2010213803 A JP 2010213803A JP 2010213803 A JP2010213803 A JP 2010213803A JP 2012070248 A JP2012070248 A JP 2012070248A
Authority
JP
Japan
Prior art keywords
bit depth
encoding
decoding
lower layer
depth conversion
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2010213803A
Other languages
English (en)
Other versions
JP5339300B2 (ja
Inventor
Takeshi Ito
健 伊藤
Yukihiro Bando
幸浩 坂東
Masayuki Takamura
誠之 高村
Hirohisa Jozawa
裕尚 如澤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2010213803A priority Critical patent/JP5339300B2/ja
Publication of JP2012070248A publication Critical patent/JP2012070248A/ja
Application granted granted Critical
Publication of JP5339300B2 publication Critical patent/JP5339300B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

【課題】符号化済みの周辺画素から得られる予測値と入力画像との差分値を抑え、符号化効率の改善を図る。
【解決手段】符号化モード判定部61は、ビット深度変換処理を用いた画面内符号化を行うか否かを判定する。上位階層符号化部62は、ビット深度変換処理を行わないと判定された場合に、入力画像信号に対して上位階層符号化する。隣接画素ビット深度変換処理部67は、ビット深度変換処理を行うと判定された場合に、隣接画素に対してビット深度変換処理を行った後、下位階層符号化部68で、下位階層符号化し、ビット深度変換誤差判定部72で、ビット深度変換誤差を判定する。最適符号化モード番号・分割ビット深度・下位階層符号化モード番号符号化部77は、ビット深度変換処理を行わない場合、符号化モード番号を符号化し、ビット深度変換処理を行う場合、符号化モード番号と最適分割ビット深度Δとを符号化する。
【選択図】図3

Description

本発明は、画像符号化方法、画像復号方法、画像符号化装置、画像復号装置、及びプログラムに関する。
以下では、画面内に対する符号化手法を画面内符号化と呼び、該画面内符号化において、複数の手法から1つの手法を選ぶ場合、その符号化手法を画面内符号化モードと呼ぶ。例えば、動画像符号化方式の国際標準であるAVC/H.264(例えば、非特許文献1参照)では、符号化効率を向上させるために、同一の画面内から予測を行う画面内予測符号化が取り入れられている。
AVC/H.264の規格を拡張した高忠実度規格(FRExt:非特許文献1参照)では、輝度信号に対して、16×16のマクロブロックを3種類のブロック(16×16、8×8、4×4)に分割し、このブロック単位において画面内予測が行われている。このブロックのサイズに応じて、用いることができる予測モードが異なる。
4×4の場合には、符号化済みである左のブロックの右端の4画素、左上のブロックの右下1画素、上のブロックの下端4画素、右上のブロックの下端4画素の合計13画素の値を用いた9種類の予測モードから予測モードを選択し、ブロック内の画素値を予測する。8×8の場合には、符号化済みである左のブロックの右端の8画素、左上のブロックの右下1画素、上のブロックの下端8画素、右上のブロックの下端8画素の合計25画素の値を用いた9種類の予測モードから予測モードを選択し、ブロック内の画素値を予測する。16×16の場合には、符号化済みである左のマクロブロックの右端の16画素、上のマクロブロックの下端16画素の合計32画素の値を用いた4種類の予測モードから予測モードを選択し、ブロック内の画素値を予測する。
図18(a)から(i)は、ブロックサイズが4×4のときの9種類の予測モードを示す概念図である。画面内予測符号化では、上マクロブロックA、B、C、Dの4画素と左マクロブロックI、J、K、Lの4画素から、垂直予測(予測モード0)、水平予測(予測モード1)、平均値予測(予測モード2)、平面予測(予測モード3〜8)の9種類の予測モードから予測モードを選択することが可能である。選択した予測方向(予測モード)を4×4画素のブロック単位で符号化する。予測モード2に示す平均値は、左マクロブロックI〜Lの4画素と、上マクロブロックA〜Dの4画素との合計8画素の平均値で、対象ブロックの4×4画素すべてを予測する。
AVC/H.264においては、上記9種類の予測モードのうち、コストが最小となる最適予測モードを決定し、その最適予測モードを符号化するとともに、この画面内予測により得られた予測値と入力信号との差分を計算し、その差分信号に対し、量子化と離散コサイン変換(以下、DCT:Discrete Cosine Transform)とを行うことで符号化を行う。
図19は、従来技術による画面内予測符号化装置の構成を示すブロック図である。図19に示す画面内符号化装置は、AVC/H.264に準拠している。画面内符号化装置では、復号済みの隣接画素から対象符号化ユニットにおける画素値の予測を行い、コストが最小となる符号化モードの選択を行う。
図19において、予測モード格納部1は、複数の予測モードを記憶する。予測残差信号生成部2は、入力画像信号を入力とし、予測モード格納部1の予測モードを順次変化させながら予測残差を生成し、DCT、量子化、符号化を行う。
コスト算出部3は、予測残差信号生成部からの符号化ストリームと入力画像信号とを入力とし、ラグランジェコストLcostを算出する。ここで、ラグランジェコストLcostは、符号化ストリームにおける符号量と、符号化による歪みとの加重和である。コスト最小値初期化部4は、ラグランジェコストLminの値を十分大きな値に設定し、初期化を行う。コスト最小値記憶部5は、コスト最小値を記憶する。コスト判定部6は、ラグランジェコストLcostとLminの値とを比較し、Lcost<Lminであるか判定する。
最適予測モード番号記憶部7は、コストの最小値Lminとなる予測モード番号(以下、最適予測モード番号)を記憶する。モード選択終了判定部8は、予測モードの変化終了を判定する。最適予測モード番号符号化部9は、最適予測モード番号を符号化する。画面内予測符号化部10は、符号化された最適予測モード番号と入力画像信号とから生成された予測残差信号を入力とし、該予測残差信号に対して、DCT、量子化、符号化を行い、得られた符号化データを出力する。
図20は、従来技術による画面内予測符号化装置の動作を説明するためのフローチャートである。まず、コスト最小値初期化部4では、ラグランジェコストLminの値を十分大きな値(例えば、216−1など)に設定し、初期化を行う(ステップS1)。次に、予測モードkを0〜(予測モード数−1)まで変化させながら、以下のステップS3〜S7までの処理を繰り返す(ステップS2)。
予測残差信号生成部2では、入力画像信号を入力とし、ステップS2の予測モードkに基づいて予測残差を生成し、DCT、量子化、符号化を行い、符号化ストリームを出力する(ステップS3)。コスト算出部3では、ステップS3の符号化ストリームと入力画像信号とを入力とし、それらの誤差からラグランジェコストLcostを算出して出力する(ステップS4)。
次に、コスト判定部6では、ステップS4で得られたラグランジェコストLcostとLminの値とを比較し、Lcost<Lminであるか判定し(ステップS5)、Lcost<Lminが成立すれば、LminにLcostの値を代入し、コスト最小値記憶部5のLminを更新し(ステップS6)、ステップS7へ進む。一方、Lcost<Lminが不成立ならば、Lminを更新することなく、ステップS7へ進む。
次に、モード選択終了判定部8では、予測モードkの値が、予測モード数−1と一致しているかを判定し(ステップS7)、一致していなければ、次の予測モードの値をkに入力し、ステップS2に戻り、ステップS3〜S7までの処理を繰り返す。
一方、一致していれば、最適予測モード番号符号化部9では、ステップS2〜S7までのループの中で得られたラグランジェコストの最小値Lminとなる予測モード番号(以下、最適予測モード番号)を入力とし、最適予測モード番号を符号化する処理を行う(ステップS9)。
次に、ステップS9で得られた最適予測モード番号と入力画像信号とを入力し、予測残差信号を生成し(ステップS10)、画面内予測符号化部10では、該ステップS10で得られた予測残差信号を入力とし、該予測残差信号に対して、DCT、量子化、符号化を行い、得られた符号化ストリームを出力する(ステップS11)。
図21は、従来技術による画面内予測復号装置の構成を示すブロック図である。図21において、予測モード番号復号部20は、符号化ストリームを入力とし、ストリーム内の予測モード番号nを復号する。予測信号生成部21は、予測モードnと復号済みの隣接画素値とを用いて、予測信号を生成する。予測残差信号復号部22は、符号化ストリームを入力とし、ストリーム内の予測残差信号を復号する。復号画像信号生成部23は、予測信号と予測残差信号とから復号画像信号を生成して出力する。
図22は、従来技術による画面内予測復号装置の動作を説明するためのフローチャートである。まず、予測モード番号復号部20では、符号化ストリームを入力とし、ストリーム内の予測モード番号nを復号して出力する(ステップS21)。次に、予測信号生成部21では、予測モードnと復号済みの隣接画素値とを用いて、予測信号を生成して出力する(ステップS22)。
一方、予測残差信号復号部22では、符号化ストリームを入力とし、ストリーム内の予測残差信号を復号して出力する(ステップS23)。そして、復号画像信号生成部23では、ステップS22で得られた予測信号とステップS23で得られた予測残差信号とから復号画像信号を生成して出力する(ステップS24)。
大久保榮、角野眞也、菊池義浩、鈴木輝彦:" 改訂三版H.264/AVC教科書"、2009
しかしながら、上述した画面内符号化では、異なる画面間で予測を行う画面間符号化ほどの符号化効率を達成できていない。そのため、より高い符号化効率をもつ画面内符号化方式が望まれている。また、画面内符号化方式の符号化効率を向上させることにより、その画面を参照する画面間符号化においても符号化効率の向上が期待される。
また、従来の符号化手法(例えば、AVC/H.264など)においては、ノイズが多く含まれている画像を符号化する場合、符号化済みの周辺画素から得られる予測値と入力画像との差分値が増加してしまい、符号量が大きくなってしまう問題点がある。
本発明は、このような事情を考慮してなされたものであり、その目的は、画面内符号化手法における最小の符号化対象領域である符号化ユニット(例えば、AVC/H.264の場合、符号化ユニットはマクロブロックと呼ぶこととする)単位で行われる画面内符号化を行う際に、符号化効率の改善を図ることができる画像符号化方法、画像復号方法、画像符号化装置、画像復号装置、及びプログラムを提供することにある。
上述した課題を解決するために、本発明は、最小の符号化対象領域である符号化ユニットごとに符号化を行なう画像符号化方法であって、ビット深度変換処理を用いた画面内符号化を行うか否かを判定する判定ステップと、前記判定ステップで前記ビット深度変換処理を行わないと判定された場合、前記ビット深度変換処理を用いない画像内符号化である上位階層符号化を入力画像信号に対して行う上位階層符号化ステップと、前記判定ステップで前記ビット深度変換処理を行うと判定された場合、隣接画素に対して前記ビット深度変換処理を行った後、下位階層符号化する下位階層符号化ステップと、前記判定ステップで前記ビット深度変換処理を行わないと判定された場合、前記上位階層符号化ステップにおける上位階層符号化の方式を示す符号化モード番号を符号化し、前記判定ステップで前記ビット深度変換処理を行うと判定された場合、前記下位階層符号化ステップにおける下位階層符号化の方式を示す符号化モード番号と分割ビット深度とを符号化する符号化ステップとを含むことを特徴とする画像符号化方法である。
また、本発明は、上記に記載の発明において、前記判定ステップでは、予め定められたコスト関数を用いて、前記ビット深度変換処理を用いた画像内符号化を行う場合の符号化のコストと、前記上位階層符号化を行う場合の符号化のコストとが算出され、算出されたコストのうち最も小さいコストに対応する符号化が選択されることを特徴とする。
また、本発明は、上記に記載の発明において、前記符号化ステップでは、前記ビット深度変換処理により生じる前記入力画像信号に対する誤差が最小となるビット数、あるいは、前記コスト関数により算出されるコストが最小となるビット数が前記分割ビット深度として選択されることを特徴とする。
また、本発明は、上記に記載の発明において、前記入力画像信号に複数の色チャネルが含まれる場合、前記判定ステップでは、前記色チャネルごとに前記ビット深度変換処理を用いた画面内符号化を行うか否かが判定され、前記ビット深度変換処理における前記分割ビット深度は、前記色チャネルごとに選択されることを特徴とする。
また、本発明は、最小の符号化対象領域である符号化ユニットごとに符号化データを復号する画像復号法方であって、前記符号化データから符号化モード番号を復号する符号化モード番号復号ステップと、前記符号化モード番号に基づいて、ビット深度変換処理を用いた画面内符号が行われたか否かを判定する判定ステップと、前記符号化データから予測残差信号を復号する予測残差復号ステップと、前記判定ステップで前記ビット深度変換処理を用いた画面内符号化が行われていないと判定された場合、前記符号化データに対して上位階層復号を行う上位階層復号ステップと、前記判定ステップで前記ビット深度変換処理を用いた画面内符号化が行われたと判定された場合、前記符号化データから前記ビット深度変換処理に用いられた分割ビット深度を復号し、前記符号化モード番号と前記分割ビット深度とに基づいて、逆ビット深度変換処理を行い、下位階層復号信号を生成する下位階層復号ステップと、前記上位階層復号ステップで上位階層復号を行うことにより取得された上位階層復号信号と前記予測残差復号ステップで取得された予測残差信号とから復号画像信号を生成する第1の復号画像信号生成ステップと、前記下位階層復号ステップにおいて前記逆ビット深度変換処理を行うことにより取得された下位階層復号信号と前記予測残差復号ステップにおいて取得された予測残差信号とから復号画像信号を生成する第2の復号画像信号生成ステップとを含むことを特徴とする画像復号方法である。
また、本発明は、上記に記載の発明において、前記下位階層復号ステップは、前記符号化データから分割ビット深度を復号する分割ビット深度復号ステップと、前記符号化データに対して下位階層復号を行い、下位階層復号信号を生成する下位階層復号信号生成ステップと、前記分割ビット深度に基づいて、前記下位階層復号信号に対して逆ビット深度変換処理を行う逆ビット深度変換ステップとを含むことを特徴とする。
また、本発明は、上記に記載の発明において、前記下位階層復号ステップは、前記符号化データから分割ビット深度を復号する分割ビット深度復号ステップと、前記符号化データから下位階層予測モード番号を復号出力する下位階層予測モード復号ステップと、前記下位階層予測モード番号に基づいて下位階層予測信号を生成する下位階層予測信号生成ステップと、前記符号化データから下位階層予測残差信号を復号する下位階層残差信号復号ステップと、前記下位階層予測信号と前記下位階層予測残差信号とを足し合わせ、下位階層復号信号を生成する下位階層復号信号生成ステップと、前記分割ビット深度に基づいて、前記下位階層復号信号に対して逆ビット深度変換を行う逆ビット深度変換処理ステップとを含むことを特徴とする。
また、本発明は、上記に記載の発明において、前記分割ビット深度の対象領域が、符号化ユニット、あるいは複数の符号化ユニット、あるいは画面全体であるかを前記符号化データから判定する分割ビット深度対象領域判定ステップを更に含み、前記分割ビット深度対象領域判定ステップで前記分割ビット深度の対象領域が複数の符号化ユニット、あるいは画面全体であると判定された場合、前記分割ビット深度の対象領域に対して、共通の前記分割ビット深度を用いることを特徴とする。
また、本発明は、最小の符号化対象領域である符号化ユニットごとに符号化を行なう画像符号化装置であって、ビット深度変換処理を用いた画面内符号化を行うか否かを判定する判定手段と、前記判定手段でビット深度変換処理を行わないと判定された場合、前記ビット深度変換処理を用いない画像内符号化である上位階層符号化を入力画像信号に対して行う上位階層符号化手段と、前記判定手段で前記ビット深度変換処理を行うと判定された場合、隣接画素に対して前記ビット深度変換処理を行った後、下位階層符号化する下位階層符号化手段と、前記判定手段が前記ビット深度変換処理を行わないと判定した場合、前記上位階層符号化手段における上位階層符号化の方式を示す符号化モード番号を符号化し、前記判定手段が前記ビット深度変換処理を行うと判定した場合、前記下位階層符号化手段における下位階層符号化の方式を示す符号化モード番号と分割ビット深度とを符号化する符号化手段とを備えることを特徴とする画像符号化装置である。
また、本発明は、上記に記載の発明において、前記判定手段は、予め定められたコスト関数を用いて、前記ビット深度変換処理を用いた画像内符号化を行う場合の符号化のコストと、前記上位階層符号化を行う場合の符号化のコストとを算出し、算出したコストのうち最も小さいコストに対応する符号化を選択することを特徴とする。
また、本発明は、上記に記載の発明において、前記判定手段は、前記ビット深度変換処理により生じる前記入力画像信号に対する誤差が最小となるビット数、あるいは、前記コスト関数により算出されるコストが最小となるビット数を前記分割ビット深度として選択することを特徴とする。
また、本発明は、上記に記載の発明において、前記入力画像信号に複数の色チャネルが含まれる場合、前記判定手段は、前記色チャネルごとに前記ビット深度変換処理を用いた画面内符号化を行うか否かを判定し、前記ビット深度変換処理における前記分割ビット深度は、前記色チャネルごとに選択されることを特徴とする。
また、本発明は、最小の符号化対象領域である符号化ユニットごとに符号化データを復号する画像復号装置であって、前記符号化データから符号化モード番号を復号する符号化モード番号復号手段と、前記符号化モード番号に基づいて、ビット深度変換処理を用いた画面内符号が行われたか否かを判定する判定手段と、前記符号化データから予測残差信号を復号する予測残差復号手段と、前記判定手段が前記ビット深度変換処理を用いた画面内符号が行われていないと判定した場合、前記符号化データに対して上位階層復号を行う上位階層復号手段と、前記判定手段が前記ビット深度変換処理を用いた画面内符号が行われたと判定した場合、前記符号化データから前記ビット深度変換処理に用いられた分割ビット深度を復号し、前記予測モード番号と前記分割ビット深度とに基づいて、逆ビット深度変換処理を行い、下位階層復号信号を生成する下位階層復号手段と、前記上位階層復号手段が上位階層復号を行うことにより取得した上位階層復号信号と、前記予測残差復号手段が取得した予測残差信号とから復号画像信号を生成する第1の復号画像信号生成手段と、前記下位階層復号手段が逆ビット深度変換処理を行うことにより取得した下位階層復号信号と、前記予測残差復号手段が取得した予測残差信号とから復号画像信号を生成する第2の復号画像信号生成手段とを備えることを特徴とする画像復号装置である。
また、本発明は、上記に記載の発明において、前記下位階層復号手段は、前記符号化データから分割ビット深度を復号する分割ビット深度復号手段と、前記符号化データに対して下位階層復号を行い、下位階層復号信号を生成する下位階層復号生成手段と、前記分割ビット深度に基づいて、前記下位階層復号信号に対して逆ビット深度変換処理を行う逆ビット深度変換手段とを備えることを特徴とする。
また、本発明は、上記に記載の発明において、前記下位階層復号手段は、前記符号化データから分割ビット深度を復号する分割ビット深度復号手段と、前記符号化データから下位階層復号における復号の方式を示す下位階層予測モード番号を復号出力する下位階層予測モード復号手段と、前記下位階層予測モード番号に基づいて下位階層予測信号を復号する下位階層予測信号復号手段と、前記符号化データから下位階層予測残差信号を復号する下位階層残差信号復号手段と、前記下位階層予測信号と前記下位階層予測残差信号とを足し合わせ、下位階層復号信号を生成する下位階層復号信号生成手段と、前記分割ビット深度に基づいて、前記下位階層復号信号に対して逆ビット深度変換を行う逆ビット深度変換処理手段とを備えることを特徴とする。
また、本発明は、上記に記載の発明において、前記分割ビット深度の対象領域が、符号化ユニット、あるいは複数の符号化ユニット、あるいは画面全体であるかを前記符号化データから判定する分割ビット深度対象領域判定手段を更に備え、前記分割ビット深度対象領域判定手段が前記分割ビット深度の対象領域を複数の符号化ユニット、あるいは画面全体であると判定した場合、前記分割ビット深度の対象領域に対して、共通の前記分割ビット深度を用いることを特徴とする。
また、本発明は、最小の符号化対象領域である符号化ユニットごとに符号化を行なう画像符号化装置に備えられているコンピュータに、ビット深度変換処理を用いた画面内符号化を行うか否かを判定する判定ステップと、前記判定ステップで前記ビット深度変換処理を行わないと判定された場合、前記ビット深度変換処理を用いない画像内符号化である上位階層符号化を入力画像信号に対して行う上位階層符号化ステップと、前記判定ステップで前記ビット深度変換処理を行うと判定された場合、隣接画素に対して前記ビット深度変換処理を行った後、下位階層符号化する下位階層符号化ステップと、前記判定ステップで前記ビット深度変換処理を行わないと判定された場合、前記上位階層符号化ステップにおける上位階層符号化の方式を示す符号化モード番号を符号化し、前記判定ステップで前記ビット深度変換処理を行うと判定された場合、前記下位階層符号化ステップにおける下位階層符号化の方式を示す符号化モード番号と分割ビット深度とを符号化する符号化ステップとを実行させるためのプログラムである。
また、本発明は、最小の符号化対象領域である符号化ユニットごとに符号化データを復号する画像復号装置に備えられているコンピュータに、前記符号化データから符号化モード番号を復号する符号化モード番号復号ステップと、前記符号化モード番号に基づいて、ビット深度変換処理を用いた画面内符号が行われたか否かを判定する判定ステップと、前記符号化データから予測残差信号を復号する予測残差復号ステップと、前記判定ステップで前記ビット深度変換処理を用いた画面内符号化が行われていないと判定された場合、前記符号化データに対して上位階層復号を行う上位階層復号ステップと、前記判定ステップで前記ビット深度変換処理を用いた画面内符号化が行われたと判定された場合、前記符号化データから前記ビット深度変換処理に用いられた分割ビット深度を復号し、前記符号化モード番号と前記分割ビット深度とに基づいて、逆ビット深度変換処理を行い、下位階層復号信号を生成する下位階層復号ステップと、前記上位階層復号ステップで上位階層復号を行うことにより取得された上位階層復号信号と前記予測残差復号ステップで取得された予測残差信号とから復号画像信号を生成する第1の復号画像信号生成ステップと、前記下位階層復号ステップにおいて前記逆ビット深度変換処理を行うことにより取得された下位階層復号信号と前記予測残差復号ステップにおいて取得された予測残差信号とから復号画像信号を生成する第2の復号画像信号生成ステップとを実行させるためのプログラムである。
この発明によれば、画面内符号化手法における最小の符号化対象領域である符号化ユニット(例えば、AVC/H.264の場合、符号化ユニットはマクロブロックと呼ぶこととする)単位で行われる画面内符号化を行う際に、ビット深度変換処理を用いた画面内符号化モードを追加する手法を行うことで、差分信号を抑えることができ、符号化効率の改善を図ることができる。
本発明の実施形態による動画像符号化装置の構成を示すブロック図である。 本発明の実施形態による動画像復号装置の構成を示すブロック図である。 本発明の第1実施形態によるイントラ(画面内)予測符号化装置の構成を示すブロック図である。 本第1実施形態によるイントラ(画面内)予測符号化装置の動作を説明するためのフローチャートである。 本第1実施形態によるイントラ(画面内)予測符号化装置の動作を説明するためのフローチャートである。 本発明の第2実施形態によるイントラ(画面内)予測符号化装置の構成を示すブロック図である。 本第2実施形態によるイントラ(画面内)予測符号化装置の動作を説明するためのフローチャートである。 本第2実施形態によるイントラ(画面内)予測符号化装置の動作を説明するためのフローチャートである。 本第2実施形態によるイントラ(画面内)予測符号化装置の動作を説明するためのフローチャートである。 本発明の第3実施形態によるイントラ(画面内)予測復号装置の構成を示すブロック図である。 本第3実施形態による画面内予測復号装置の動作を説明するためのフローチャートである。 本発明の第4実施形態によるイントラ(画面内)予測復号装置の構成を示すブロック図である。 本第4実施形態による画面内予測復号装置の動作を説明するためのフローチャートである。 本発明の第5実施形態によるイントラ(画面内)予測復号装置の構成を示すブロック図である。 本第5実施形態による画面内予測復号装置の動作を説明するためのフローチャートである。 本発明の第6実施形態によるイントラ(画面内)予測復号装置の構成を示すブロック図である。 本第6実施形態による画面内予測復号装置の動作を説明するためのフローチャートである。 ブロックサイズが4×4のときの9種類の予測モードを示す概念図である。 従来技術による画面内予測符号化装置の構成を示すブロック図である。 従来技術による画面内予測符号化装置の動作を説明するためのフローチャートである。 従来技術による画面内予測復号装置の構成を示すブロック図である。 従来技術による画面内予測復号装置の動作を説明するためのフローチャートである。
以下、本発明の一実施形態を、図面を参照して説明する。
前述したように、従来の符号化手法(例えば,AVC/H.264など)においては、ノイズが多く含まれている画像を符号化する場合、符号化済みの周辺画素から得られる予測値と入力画像との差分値が増加してしまい、符号量が大きくなってしまう。ノイズの多くは、画像の下位ビットに多く存在する。そこで、本発明では、ビット深度変換処理を用い、下位ビットの情報を削減することで、ノイズの影響を抑え、画面内符号化における符号量の削減を図る。また、符号化モードに新しいモードを追加することにより、従来手法との併用を可能とする。
本発明においては、隣接画素を上述したビット深度変換処理でN−Δビットに削減した後に、従来の画面内符号化手法を適用することで、符号化効率を改善させる。具体的には、従来の符号化モードを行う場合に、ビット深度変換処理を行う符号化モードを追加し、その符号化モードが選ばれた場合に、隣接画素をN−Δに削減を行い、N−Δビットの隣接画素値を用いて他の符号化モード(例えば、図18)を用いて画面内符号化を行い、各分割ビット深度毎に下位階層符号化モードを取得して予測画像を生成する。
このときの分割ビット深度Δは、1〜N−1までの値を取り、その値の中で、ビット深度変換誤差(例えば、生成された予測画像を逆ビット深度変換した信号と入力画像信号との誤差)が最小となる分割ビット深度を最適分割ビット深度として出力し、その最適分割ビット深度における下位階層符号化モードを最適下位階層符号化モードとして出力する。これによって得られたコストと従来の符号化モードにおけるコストとを比較し、最もコストが抑えられた手法を用いる。以上により、得られる出力は、最適符号化モードと、この最適符号化モードがビット深度変換処理を用いる符号化モードであれば、最適分割ビット深度と最適下位階層符号化モードと残差信号とが符号化された符号化ストリームである。
図1は、本発明の実施形態による動画像符号化装置の構成を示すブロック図である。図1において、符号化制御部30は、各部の動作を制御する。スイッチ部31は、イントラ予測処理部40、またはインター予測処理部39のいずれか一方からの予測画像情報を選択する。減算器32は、入力画像から予測画像情報を減算する。変換・量子化部33は、画像の差分データに対して直交変換を行うとともに、直交変換された変換係数に対して所定の量子化スケールで量子化を施す。
逆変換・逆量子化部34は、変換・量子化部33において量子化された変換係数に対して所定の逆量子化処理を施すとともに、逆量子化された変換係数を元の画像データ空間に戻すための逆直交変換を行う。加算器35は、画像データ空間に戻された画像差分情報に後述する予測画像情報を加算する。デブロッキングフィルタ36は、予測画像情報により復元された画像データに対して所定の画素ブロック単位の境界データにおける不連続性を補正する。フレームメモリ37は、後述するブロック境界補正処理が行われた復元画像データを予測画像情報の参照画像として利用するために保持する。
動き検出部38は、イントラ予測処理部40から入力された現在の画像データを複数の画素ブロックに分割し、各画素ブロックにおいて、フレームメモリ37に保存されている参照フレーム候補と相関の高い位置を検出する動き探索処理を行い、その位置の差分データをフレーム間の動き情報として検出する。インター(画面間)予測符号化部39は、参照フレームと動き検出部38から出力される動き情報とから現在の画像データの予測画像情報を生成する動き補償を行う。イントラ(画面内)予測処理部40は、画像データを複数の画素ブロックに分割し、各画素ブロックの画像データをブロック周辺の画素から予測し、予測画像情報を生成する。エントロピー符号化部41は、変換・量子化部において量子化された変換係数に対し、エントロピー符号化処理を行ってデータ圧縮し、符号化ストリームとして出力する。
図2は、本発明の実施形態による動画像復号装置の構成を示すブロック図である。図2において、エントロピー復号部50は、符号化された動画像データを含む入力ストリームに対して可変長復号処理を行い、量子化されたDCT係数(以下、量子化DCT係数)、及び量子化パラメータQP(Quantization Parameter)を取得し、参照フレーム番号、予測モード等を含む復号情報を出力する。
逆変換・逆量子化部51は、入力したDCT係数に、DCT変換処理を施し、この処理結果を残差信号として加算部14に出力するとともに、逆量子化処理により、量子化パラメータQPに基づいて量子化DCT係数を逆量子化し、DCT係数を取得する。動きベクトル復号部52は、フレーム間の動きを示す動きベクトルを復号する。
加算器55は、残差信号と、イントラ予測処理部53またはインター予測処理部54から出力される予測画像データとを加算し、フレーム画像のデータを再現する。デブロッキングフィルタ56は、加算器55から出力されるフレーム画像のデータに対して、符号化ブロック間の歪みを改善する処理を施し、この処理結果をフレームメモリ57に出力する。フレームメモリ57は、デブロッキングフィルタ56で処理された復号画像データを記憶する。
イントラ予測処理部53は、加算器55から出力されるフレーム画像のデータと、エントロピー復号部50で得られた量子化DCT係数とに基づいてフレーム内予測を行って、予測画像データを生成する。インター予測処理部54は、エントロピー復号部50が取得した量子化DCT係数や、動きベクトル復号部52からの動きベクトル、フレームメモリ57から出力される参照画像などに基づいてフレーム間予測を行って、予測画像データを生成する。スイッチ部58は、イントラ予測処理部53、またはインター予測処理部54のいずれか一方からの予測画像データを選択し、加算器55に出力する。
本発明は、図1に示すイントラ(画面内)予測処理部40、図2に示すイントラ(画面内)予測処理部53に関するものである。画面内符号化の1つとしてとして、ビット深度変換処理を含んだ符号化モードを追加するという点が最も主要な特徴である。本発明では、後述のビット深度変換処理を用いた画面内符号化とビット深度変換処理を用いた画面内符号化と、該画面内符号化によって得られた符号化データに対する復号手法を提案する。
A.画面内予測符号化
まず、本発明によるビット深度変換処理を用いた画面内符号化手法について説明する。本発明では、符号化効率を改善するために、画面内符号化手法としてビット深度変換処理を用いた手法を提案し、復号時に画面内予測モードにビット深度変換処理を用いた予測モードが選択されたときの復号手法を提案する。ここで、本発明におけるビット深度変換処理とは、外部から与えられる処理であり、入力信号のビット深度を削減する処理を表す。
例えば、下位ビットをビットシフトや、四捨五入することによってビット深度を削減する手法がある。このとき、何ビット削減したのかを表すパラメータを分割ビット深度Δとし、ビット深度変換処理によりビット深度を削減した信号に対し、ビット深度を増やす処理を逆ビット深度変換処理と呼ぶこととする。このとき、分割ビット深度Δの対象領域を画面全体、符号化ユニット、及び複数の符号化ユニットからなる領域などから予め指定することができる。また、分割ビット深度Δにおける符号化モードを下位階層符号化モードと呼ぶこととする。
A−1.第1実施形態
図3は、本発明の第1実施形態によるイントラ(画面内)予測符号化装置の構成を示すブロック図である。図3において、符号化モード格納部60は、複数の符号化モードを記憶する。符号化モード判定部61は、符号化モード番号nがビット深度変換処理を用いた画面内符号化を示す符号化モード番号と一致するかどうかを判定する。
上位階層符号化部62は、入力画像信号を入力し、上位階層符号化を行う。ここで、上位階層符号化とは、例えば、AVC/H.264において用いられている画面内予測符号化である。すなわち、ビット深度変換を用いない画面内予測符号化である。
コスト算出部63は、符号化ストリームと入力画像信号とを入力とし、符号化におけるラグランジェコストLcostをそれらの誤差から算出する。具体的には、コスト算出部63は、符号量と歪みの加重和を算出する予め定められたコスト関数を用いて、ラグランジェコストLcostを算出する。コスト最小値初期化部64は、コストLminの値を十分大きな値に設定し、初期化を行う。コスト最小値記憶部65は、コスト最小値を記憶する。
隣接画素ビット深度変換処理部67は、復号済みの隣接画素を入力とし、その画素値をN−Δビットにビット深度変換処理を行い、N−Δビットの復号済み隣接画素値を出力する。下位階層符号化部68は、N−Δビットの復号済み隣接画素値を入力とし、下位階層符号化を行い、下位階層符号化ストリームを出力する。ビット深度変換誤差算出部69は、下位階層符号化ストリームと入力画像信号とを入力とし、ビット深度変換により生じるビット深度変換誤差Ecostを算出する。
変換誤差最小値初期化部70は、ビット深度変換誤差Eminの値を十分大きな値に設定し、初期化を行う。変換誤差最小値記憶部71は、ビット深度変換誤差Eminを記憶する。ビット深度変換誤差判定部72は、ビット深度変換誤差EcostとEminの値とを比較し、Ecost<Eminが成立するか否かを判定する。分割ビット深度終了判定部73は、分割ビット深度Δの値が、N−1と一致しているか、すなわち、分割ビット深度終了を判定する。
コスト判定部74は、ラグランジェコストLcostの値と、Lminとの値とを比較し、Lcost<Lminが成立するか否かを判定する。モード選択終了判定部75は、符号化モードnの値が、符号化モード数−1と一致しているか、すなわち、モード選択終了を判定する。
最適符号化モード番号・分割ビット深度・下位階層符号化モード番号記憶部76は、最適符号化モード番号、最適分割ビット深度、最適下位階層符号化モード番号を記憶する。最適符号化モード番号・分割ビット深度・下位階層符号化モード番号符号化部77は、符号化モード番号を入力とし、符号化を行い、符号化ストリームを出力するか、ビット深度変換処理を行う符号化モード番号とビット深度変換誤差を最小化する最適分割ビット深度Δとを入力とし、それぞれを符号化し、符号化ストリームを出力する。画面内予測符号化部78は、最適符号化モード番号と最適分割ビット深度と入力画像信号とを入力し、最適符号化モード番号に対応する符号化モードを用いて入力画像信号の符号化を行い、符号化ストリームを出力する。
図4、及び図5は、本第1実施形態によるイントラ(画面内)予測符号化装置の動作を説明するためのフローチャートである。まず、コスト最小値初期化部64で、コストLminの値を十分大きな値(例えば、216−1など)に設定し、初期化を行う(ステップS31)。次に、符号化モードnを0〜符号化モード数−1まで変化させながら(ステップS32)、以下のステップS33〜S48を繰り返す。
まず、符号化モード判定部61で、符号化モード番号nがビット深度変換処理を用いた画面内符号化を用いる符号化モード番号と一致するかどうかを判定する(ステップS33)。そして、符号化モード番号nがビット深度変換処理を用いた画面内符号化を用いる符号化モード番号と一致しない場合、上位階層符号化部62で、入力画像信号を入力し、上位階層符号化(例えば、AVC/H.264における画面内予測符号化など)を行い、符号化ストリームを出力する(ステップS34)。次に、コスト算出部63で、ステップS34で得られた符号化ストリームと入力画像信号とを入力し、それらの誤差からコストLcostを算出して出力する(ステップS35)。次に、後述するステップS46以降へ進む。
一方、符号化モード番号nがビット深度変換処理を用いた画面内符号化を用いる符号化モード番号と一致する場合、変換誤差最小値初期化部70で、ビット深度変換誤差Eminの値を十分大きな値(例えば、216−1など)に設定し、初期化を行う(ステップS36)。次に、分割ビット深度Δを0〜入力画像ビット深度(以下、Nビット)−1まで変化させながら(ステップS37)、以下のステップS38〜S43を繰り返す。
まず、隣接画素ビット深度変換処理部67で、復号済みの隣接画素を入力し、その画素値をN−Δビットにビット深度変換処理を行い、N−Δビットの復号済み隣接画素値を出力する(ステップS38)。次に、下位階層符号化部68で、ステップS38で得られたN−Δビットの復号済み隣接画素値を入力し、下位階層符号化を行い、下位階層符号化ストリームを出力する(ステップS39)。次に、ビット深度変換誤差算出部69で、下位階層符号化ストリームと入力画像信号とを入力し、ビット深度変換誤差Ecostを算出して出力する(ステップS40)。
次に、ビット深度変換誤差判定部72で、ステップS40で得られたビット深度変換誤差EcostとEminの値とを比較し、Ecost<Eminが成立するか否かを判定し(ステップS41)、Ecost<Eminが成立すれば、EminにEcostの値を代入し、Eminを更新し(ステップS42)、ステップS43に進む。一方、Ecost<Eminが不成立ならば、Eminを更新することなく、ステップS43に進む。
ステップS43では、分割ビット深度終了判定部73で、分割ビット深度Δの値が、N−1と一致しているかを判定し、一致していなければ、次の分割ビット深度ΔをΔ+1に更新し(ステップS44)、ステップS37へ戻り、ステップS38〜S43を繰り返す。一方、分割ビット深度Δの値が、N−1と一致していれば、上記のループ処理で得られた最小のビット深度変換誤差EminをコストLcostに代入し(ステップS45)、ステップS46以降へ進む。
ステップS46では、コスト判定部74で、ステップS47、あるいはステップS45で得られたラグランジェコストLcostとLminの値とを比較し、Lcost<Lminが成立するか否かを判定し、Lcost<Lminが成立すれば、コストの最小値LminにLcostの値を代入し、Lminを更新するとともに、このときの符号化モード番号nを最適符号化モード番号として最適符号化モード番号・分割ビット深度・下位階層符号化モード番号記憶部76に記憶させ(ステップS47)、ステップS48に進む。また、ステップS47において、コスト判定部74は、符号化モード番号nがビット深度変換処理を用いた画面内符号化を示す符号化モード番号である場合、ラグランジェコストLcostを算出した際の分割ビット深度Δ、符号化モード番号nを、最適分割ビット深度、最適下位階層符号化モードとして最適符号化モード番号・分割ビット深度・下位階層符号化モード番号記憶部76に記憶させる。
一方、Lcost<Lminが成立しなければ、Lminなどを更新することなく、ステップS48に進む。
ステップS48では、モード選択終了判定部75で、符号化モードnの値が、符号化モード数−1と一致しているかを判定し、一致していなければ、次の符号化モードの値をnに入力し、ステップS32に戻り、上述したステップS33〜S48を繰り返す。
一方、符号化モードnの値が、符号化モード数−1と一致していれば、最適符号化モード番号・分割ビット深度・下位階層符号化モード番号符号化部77で、最適符号化モード番号がビット深度変換処理を用いた符号化モード番号と一致するかどうかを判定する(ステップS50)。そして、一致しなければ、ステップS34、S35で得られた符号化モード番号を入力とし、符号化を行い、符号化ストリームを出力し(ステップS51)、一致すれば、ビット深度変換処理を行う符号化モード番号とビット深度変換誤差を最小化する分割ビット深度Δ(以下、最適分割ビット深度Δ)とを入力し、それぞれを符号化し、符号化ストリームを出力する(ステップS52)。
そして、画面内予測符号化部78で、最適符号化モード番号と最適分割ビット深度と入力画像信号とを入力し、入力画像信号の符号化を行い、最適符号化モード番号に対応する符号化モードを用いて符号化した符号化ストリームを出力する(ステップS53)。
A−2.第2実施形態
次に、本発明の第2実施形態について説明する。
図6は、本発明の第2実施形態によるイントラ(画面内)予測符号化装置の構成を示すブロック図である。図6において、予測モード格納部80は、複数の予測モードを記憶する。予測モード判定部81は、予測モード番号kがビット深度変換処理を用いた画面内符号化を用いる予測モード番号と一致するかどうかを判定する。予測残差信号生成部82は、入力画像信号を入力とし、予測モードkに基づいて予測残差信号を生成し、DCT、量子化、符号化を行う。コスト算出部83は、符号化ストリームと入力画像信号とを入力とし、それらの誤差からラグランジェコストLcostを算出する。コスト最小値初期化部84は、コストLminの値を十分大きな値に設定し、初期化を行う。コスト最小値記憶部85は、コスト最小値を記憶する。
隣接画素ビット深度変換処理部87は、復号済みの隣接画素を入力とし、その画素値をN−Δビットにビット深度変換処理を行い、N−Δビットの復号済み隣接画素値を出力する。予測モード格納部88は、複数の予測モードを記憶する。予測誤差信号生成部89は、入力画像信号を入力とし、予測モードiに基づいて予測残差を生成し、DCT、量子化、符号化を行う。コスト算出部90は、符号化ストリームと入力画像信号とを入力し、それらの誤差からラグランジェコストL’costを算出する。
コスト最小値初期化部91は、ラグランジェコストL’minの値を十分大きな値に設定し、初期化を行う。コスト最小値記憶部92は、ラグランジェコストL’minを記憶する。コスト判定部93は、ラグランジェコストL’costとL’minの値とを比較し、L’cost<L’minが成立するか否かを判定する。モード選択終了判定部94は、下位階層予測モードiの値が、符号化モード数−2と一致しているか、すなわちモード選択終了を判定する。
ビット深度変換誤差算出部95は、下位階層符号化ストリームと入力画像信号とを入力とし、ビット深度変換誤差Ecostを算出する。変換誤差最小値初期化部96は、ビット深度変換誤差Eminの値を十分大きな値に設定し、初期化を行う。変換誤差最小値記憶部97は、ビット深度変換誤差Eminを記憶する。ビット深度変換誤差判定部98は、ビット深度変換誤差EcostとEminの値とを比較し、Ecost<Eminが成立するか否かを判定する。分割ビット深度終了判定部99は、分割ビット深度Δの値が、N−1と一致しているか、すなわち、分割ビット深度終了を判定する。
コスト判定部100は、ラグランジェコストLcostとLminの値とを比較し、Lcost<Lminが成立するか否かを判定する。モード選択終了判定部101は、予測モードkの値が、予測モード数−1と一致しているか、すなわちモード選択終了を判定する。
最適予測モード番号・分割ビット深度・下位階層予測モード番号記憶部102は、最適予測モード番号、分割ビット深度、下位階層予測モード番号を記憶する。最適予測モード番号・分割ビット深度・下位階層予測モード番号符号化部103は、予測モード番号を入力とし、符号化を行い、符号化ストリームを出力するか、ビット深度変換処理を行う予測モード番号とビット深度変換誤差を最小化する最適分割ビット深度Δとを入力とし、それぞれを符号化し、符号化ストリームを出力する。画面内予測符号化部104は、最適符号化モード番号と最適分割ビット深度と入力画像信号とを入力し、入力画像信号の符号化を行い、符号化ストリームを出力する。
図7、図8、及び図9は、本第2実施形態によるイントラ(画面内)予測符号化装置の動作を説明するためのフローチャートである。まず、コスト最小値初期化部84で、ラグランジェコストLminの値を十分大きな値(例えば、216−1など)に設定し、初期化を行う(ステップS61)。次に、予測モードkを0〜予測モード数−1まで変化させながら(ステップS62)、以下のステップS63〜S85を繰り返す。
まず、予測モード判定部81で、予測モード番号kがビット深度変換処理を用いた画面内符号化を示す予測モード番号と一致するかどうかを判定する(ステップS63)。そして、予測モード番号kがビット深度変換処理を用いた画面内符号化を示す予測モード番号と一致しない場合、予測残差信号生成部82で、入力画像信号を入力し、ステップS62の予測モードkに基づいて予測残差を生成し、DCT、量子化、符号化を行い、符号化ストリームを出力する(ステップS64)。次に、コスト算出部83で、ステップS64の符号化ストリームと入力画像信号とを入力し、それらの誤差からラグランジェコストLcostを算出して出力する(ステップS65)。次に、後述するステップS83以降へ進む。
一方、予測モード番号kがビット深度変換処理を用いた画面内符号化を示す予測モード番号と一致する場合、変換誤差最小値初期化部96で、ビット深度変換誤差Eminの値を十分大きな値(例えば、216−1など)に設定し、初期化を行う(ステップS66)。次に、分割ビット深度Δを0〜N−1ビットまで変化させながら(ステップS67)、以下のステップS68〜S80を繰り返す。
まず、復号済みの隣接画素を入力し、その画素値をN−Δビットにビット深度変換処理を行い、N−Δビットの復号済み隣接画素値を出力する(ステップS68)。次に、コスト最小値初期化部91で、ラグランジェコストL’minの値を十分大きな値(例えば、216−1など)に設定し、初期化を行う(ステップS69)。次に、下位階層予測モードiを0〜予測モード数−2まで変化させながら(ステップS70)、以下のステップS71〜S75を繰り返す。
まず、予測誤差信号生成部89で、入力画像信号を入力し、ステップS70の予測モードiに基づいて予測残差を生成し、DCT、量子化、符号化を行い、符号化ストリームを出力する(ステップS71)。次に、コスト算出部90で、ステップS71の符号化ストリームと入力画像信号とを入力し、それらの誤差からラグランジェコストL’costを算出して出力する(ステップS72)。
次に、コスト判定部93で、ステップS72で得られたラグランジェコストL’costとL’minの値とを比較し、L’cost<L’minが成立するか否かを判定し(ステップS73)、L’cost<L’minが成立すれば、ラグランジェコストの最小値L’minにL’costの値を代入し、L’minを更新(ステップS74)、ステップS75に進む。一方、L’cost<L’minが不成立ならば、L’minを更新することなく、ステップS75に進む。
ステップS75では、モード選択終了判定部94で、下位階層予測モードiの値が、符号化モード数−2と一致しているかを判定し、一致していなければ、次の予測モードの値をiに入力し(ステップS76)、ステップS70に戻り、ステップS71〜S75を繰り返す。
一方、下位階層予測モードiの値が、符号化モード数−2と一致していれば、ビット深度変換誤差算出部95で、下位階層符号化ストリームと入力画像信号とを入力し、ビット深度変換誤差Ecostを算出して出力する(ステップS77)。次に、ビット深度変換誤差判定部98で、ステップS77で得られたビット深度変換誤差EcostとEminの値とを比較し、Ecost<Eminが成立するか否かを判定する(ステップS78)。そして、Ecost<Eminが成立すれば、EminにEcostの値を代入し、Eminを更新し(ステップS79)、ステップS80に進む。一方、Ecost<Eminが不成立ならば、Eminを更新することなく、ステップS80に進む。
ステップS80では、分割ビット深度終了判定部99で、分割ビット深度Δの値が、N−1と一致しているかを判定し、一致していなければ、次の分割ビット深度Δ+1に更新し(ステップS81)、ステップS67に戻り、ステップS68〜S80を繰り返す。
一方、分割ビット深度Δの値が、N−1と一致していれば、上記ステップS68〜S80のループで得られた最小のラグランジェコストL’minをラグランジェコストLcostに代入し(ステップS82)、ステップS83以降へ進む。
ステップS83では、コスト判定部100で、ステップS65、あるいはステップS82で得られたラグランジェコストLcostとLminの値とを比較し、Lcost<Lminが成立するか否かを判定し、Lcost<Lminが成立すれば、コストの最小値LminにLcostの値を代入し、Lminを更新するとともに、このときの予測モード番号kを、最適予測モード番号として最適予測モード番号・分割ビット深度・下位階層予測モード番号記憶部102に記憶させ(ステップS84)、ステップS85に進む。また、ステップS84において、コスト判定部100は、予測モード番号kがビット深度変換処理を用いた画面内符号化を示す予測モード番号である場合、ラグランジェコストLcostを算出した際の分割ビット深度Δ、下位階層予測モードiを最適分割ビット深度、最適下位階層予測モード番号として最適予測モード番号・分割ビット深度・下位階層予測モード番号記憶部102に記憶させる。
一方、Lcost<Lminが不成立ならば、Lminを更新することなく、ステップS85に進む。
ステップS85では、モード選択終了判定部101で、予測モードkの値が、予測モード数−1と一致しているかを判定し、一致していなければ、次の符号化モードの値をkに入力し(ステップS86)、ステップS62に戻り、ステップS63〜S85を繰り返す。
一方、予測モードkの値が、予測モード数−1と一致していれば、最適予測モード番号・分割ビット深度・下位階層予測モード番号符号化部103で、最適予測モード番号がビット深度変換処理を用いた予測モード番号と一致するかどうかを判定する(ステップS87)。そして、一致しなければ、最適予測モード番号を入力し、符号化を行い、符号化ストリームを出力し(ステップS88)、一致すれば、ビット深度変換処理を行う予測モード番号と最適分割ビット深度と下位階層最適予測モード番号とを入力し、それぞれを符号化し、符号化ストリームを出力とする(ステップS89)。
そして、画面内予測符号化部104で、最適予測モード番号と最適分割ビット深度と下位階層最適予測モード入力画像信号とを入力し、予測残差信号を生成して出力し(ステップS90)、ステップS90で得られた予測残差信号を入力し、DCT、量子化、符号化を行い、符号化ストリームを出力する(ステップS91)。
上述のように、第1実施形態及び第2実施形態におけるイントラ(画面内)予測符号化装置は、隣接画素を上記で述べたビット深度変換処理でN−Δビットに削減したのちに、一般的に用いられている画面内符号化手法を適用することにより、符号化効率を改善させることができる。
具体的には、一般的に行われている画面内符号化モードに加えて、ビット深度変換処理を用いた画面内符号化モードを追加する。そして、追加した画面内符号化モードが選ばれた場合、隣接画素の情報をN−Δビットに削減し、N−Δビットの隣接画素値を用いて図18に示した符号化モードを用いて画面内符号化を行う。また、各分割ビット深度Δ毎に下位階層符号化モードが得られ、予測画像を生成する。このときの分割ビット深度Δは、1〜N−1までの値を取り、その値の中で、ビット深度変換誤差(例えば、生成された予測画像を逆ビット深度変換した信号と、入力画像信号との誤差)が最小となる分割ビット深度Δを最適分割ビット深度として出力される。また、その最適分割ビット深度Δにおける下位階層符号化モードが最適下位階層符号化モードとして出力される。この追加した符号化モードによって得られたコストと、従来の符号化モードにおけるコストとを比較し、コストの低い符号化モードが選択される。
これにより、得られる出力は、最適符号化モードである。また、この最適符号化モードがビット深度変換処理を用いる符号化モードであれば、符号化ストリームは、最適分割ビット深度と、最適下位階層符号化モードと、残差信号とが符号化されたものとなる。
B.画面内予測復号
次に、本発明によるビット深度変換処理を用いた手法を含む符号化データの復号手法について説明する。ここでは、分割ビット深度の対象領域が符号化ユニットである場合の復号の流れについて説明する。符号化データには、符号化ユニット毎に画面内符号化モードのインデックスnが含まれており、符号化モードのインデックスnがビット深度変換処理を用いた符号化モードである場合、分割ビット深度の情報Δとそのビット深度における画面内符号化モード(下位階層符号化モード)のインデックスmとが含まれている。このΔに基づき、復号済みの隣接画素に対してビット深度変換処理を行い、予測モードmに基づき予測画像信号を生成し、逆ビット深度変換を行い復号画像を生成する。
例えば、上記のAVC/H.264の場合、符号化データには、対象領域毎に画面内予測モードのインデックスnと予測残差信号とが含まれており、予測モードのインデックスnがビット深度変換処理を用いた予測モードである場合、分割ビット深度の情報Δとそのビット深度における最適画面内予測モード(下位階層符号化モード)のインデックスmとがさらに追加される。復号処理の流れは、入力として、符号化データが入力される。復号対象領域iにおける符号化データから、画面内予測モードのインデックスnを符号化し、その予測モードのインデックスに合わせた復号処理を行う。
このとき、予測モードのインデックスが、ビット深度変換処理による画面内予測手法を示した場合、下位階層予測モードのインデックスmと分割ビット深度Δとを復号し、下位階層予測モードmと分割ビット深度Δとに基づいて予測信号を生成する。そして、符号化データから予測残差信号を復号し、生成した予測信号と復号した予測残差信号とに基づいて、低ビット深度の復号画像信号を生成する。出力された復号画像信号に対して逆ビット深度変換を行い、最終的な出力として復号画像信号を得る。これにより、ビット深度変換処理を用いた予測モードが追加された符号化データに対し、復号処理が可能となり、符号化効率の改善につながる。
B−1.第3実施形態
次に、本発明の第3実施形態について説明する。
図10は、本発明の第3実施形態によるイントラ(画面内)予測復号装置の構成を示すブロック図である。図10において、予測モード番号復号部200は、符号化ストリームを入力とし、ストリーム内の符号化モード番号nを復号する。予測モード番号判定部201は、復号された符号化モード番号nがビット深度変換処理を用いた画面内符号化を用いる符号化モード番号と一致するかどうかを判定する。上位階層復号部202は、符号化ストリームを入力とし、上位階層復号を行う。
分割ビット深度復号部203は、符号化ストリームを入力とし、符号化ストリームに含まれる分割ビット深度Δの情報を復号し、分割ビット深度を出力する。下位階層復号部204は、符号化ストリームを入力とし、下位階層復号を行う。逆ビット深度変換処理部205は、分割ビット深度Δと下位階層復号信号とを入力とし、逆ビット深度変換処理を行い、下位階層予測信号を生成する。
予測残差信号復号部206は、符号化ストリームを入力とし、符号化ストリームに含まれる残差信号を復号する。復号画像信号生成部207は、上位階層復号信号と残差信号とを入力とし、復号画像信号を生成するか、下位階層予測信号と残差信号とを入力とし、復号画像信号を生成する。
図11は、本第3実施形態による画面内予測復号装置の動作を説明するためのフローチャートである。まず、予測モード番号復号部200では、符号化ストリームを入力し、ストリーム内の符号化モード番号nを復号して出力する(ステップS101)。次に、予測モード番号判定部201で、復号された符号化モード番号nがビット深度変換処理を用いた画面内符号化の符号化モード番号と一致するかどうかを判定する(ステップS102)。
そして、符号化モード番号nがビット深度変換処理を用いた画面内符号化の符号化モード番号と一致しなければ、上位階層復号部202で、符号化ストリームを入力し、上位階層復号を行い、上位階層復号信号を出力する(ステップS103)。次に、予測残差信号復号部206で、符号化ストリームを入力し、符号化ストリームに含まれる残差信号を復号して出力する(ステップS104)。そして、復号画像信号生成部207で、ステップS103で得られた上位階層復号信号とステップS104で得られた残差信号とを入力し、復号画像信号を生成して出力し(ステップS105)、当該処理を終了する。
一方、符号化モード番号nがビット深度変換処理を用いた画面内符号化の符号化モード番号と一致すれば、分割ビット深度復号部203で、符号化ストリームを入力し、符号化ストリームに含まれる分割ビット深度Δの情報を復号し、分割ビット深度を出力する(ステップS106)。次に、下位階層復号部204で、符号化ストリームを入力し、下位階層復号を行い、下位階層復号信号を出力する(ステップS107)。
次に、逆ビット深度変換処理部205で、ステップS106で得られた分割ビット深度Δと下位階層復号信号とを入力し、逆ビット深度変換処理を行い、下位階層予測信号を生成して出力する(ステップS108)。次に、予測残差信号復号部206で、符号化ストリームを入力し、符号化ストリームに含まれる残差信号を復号して出力し(ステップS109)、復号画像信号生成部207で、ステップS108で得られた下位階層予測信号とステップS109で得られた残差信号とを入力し、復号画像信号を生成して出力し(ステップS110)、当該処理を終了する。
B−2.第4実施形態
次に、本発明の第4実施形態について説明する。
図12は、本発明の第4実施形態によるイントラ(画面内)予測復号装置の構成を示すブロック図である。図12において、予測モード番号復号部300は、符号化ストリームを入力とし、ストリーム内の予測モード番号nを復号する。予測モード番号判定部301は、復号された予測モード番号nがビット深度変換処理を用いた画面内符号化を用いる予測モード番号と一致するかどうかを判定する。予測信号生成部302は、予測モード番号nと復号済みの隣接画素値とを入力とし、予測モード番号nに基づいて予測信号を生成する。
分割ビット深度復号部303は、符号化ストリームを入力とし、符号化ストリームに含まれる分割ビット深度Δを復号し、分割ビット深度を出力する。下位階層予測モード復号部304は、符号化ストリームを入力とし、下位階層予測モード番号mの情報を復号し、下位階層予測モード番号を出力する。
下位階層予測信号生成部305は、下位階層予測モード番号mに基づいて下位階層予測信号を生成する。下位階層残差信号復号部306は、符号化ストリームを入力とし、符号化ストリームに含まれる下位階層復号における予測残差信号である下位階層予測残差信号を復号する。加算器307は、下位階層予測信号と下位階層予測残差信号とを足し合わせることで、N−Δビットの下位階層復号信号を生成する。逆ビット深度変換処理部308は、分割ビット深度ΔとN−Δビットの下位階層復号信号とを入力とし、逆ビット深度変換を行うことで、Nビットの下位階層復号信号を生成する。
予測残差信号復号部309は、符号化ストリームを入力とし、符号化ストリームに含まれる予測残差信号を復号する。復号画像信号生成部310は、予測信号と予測残差信号とを入力とし、復号画像信号を生成するか、下位階層予測信号と予測残差信号とを入力都市、復号画像信号を生成する。
図13は、本第4実施形態による画面内予測復号装置の動作を説明するためのフローチャートである。まず、予測モード番号復号部300で、符号化ストリームを入力し、ストリーム内の予測モード番号nを復号して出力する(ステップS121)。次に、予測モード番号判定部301で、復号された予測モード番号nがビット深度変換処理を用いた画面内符号化の予測モード番号と一致するかどうかを判定する(ステップS122)。
そして、予測モード番号nがビット深度変換処理を用いた画面内符号化の予測モード番号と一致しなければ、予測信号生成部302で、ステップS121で得られた予測モード番号nと復号済みの隣接画素値とを入力し、予測モード番号nに基づいて予測信号を生成して出力する(ステップS123)。次に、予測残差信号復号部309で、符号化ストリームを入力し、符号化ストリームに含まれる予測残差信号を復号して出力し(ステップS124)、復号画像信号生成部310で、ステップS123で得られた予測信号とステップS124で得られた予測残差信号とを入力し、復号画像信号を生成して出力し(ステップS125)、当該処理を終了する。
一方、予測モード番号nがビット深度変換処理を用いた画面内符号化の予測モード番号と一致すれば、分割ビット深度復号部303と下位階層予測モード復号部304とで、符号化ストリームを入力し、符号化ストリームに含まれる分割ビット深度Δと下位階層予測モード番号mとの情報を復号し、分割ビット深度と下位階層予測モード番号とを出力する(ステップS126)。次に、下位階層予測信号生成部305で、上記下位階層予測モード番号mに基づいて下位階層予測信号を生成して出力し(ステップS127)、下位階層残差信号復号部306で、符号化ストリームを入力し、符号化ストリームに含まれる下位階層予測残差信号を復号して出力する(ステップS128)。
次に、加算器307で、ステップ127で得られる下位階層予測信号とステップS128で得られる下位階層予測残差信号とを入力とし、それらの信号を足し合わせることで、N−Δビットの下位階層復号信号を生成して出力する(ステップS129)。次に、逆ビット深度変換処理部308で、ステップS126で得られた分割ビット深度ΔとステップS129で得られたN−Δビットの下位階層復号信号とを入力し、逆ビット深度変換を行うことで、Nビットの下位階層復号信号を生成し(ステップS130)、符号化ストリームを入力し、符号化ストリームに含まれる予測残差信号を復号して出力する(ステップS131)。そして、復号画像信号生成部310で、ステップS130で得られた下位階層予測信号とステップS131で得られた予測残差信号とに基づいて、復号画像信号を生成して出力し(ステップS132)、当該処理を終了する。
B−3.第5実施形態
次に、本発明の第5実施形態について説明する。
図14は、本発明の第5実施形態によるイントラ(画面内)予測復号装置の構成を示すブロック図である。図14において、分割ビット深度復号部400は、符号化ストリームを入力とし、符号化ストリームに含まれる分割ビット深度Δを復号する。予測モード番号復号部401は、符号化ストリームを入力とし、ストリーム内の符号化モード番号nを復号する。予測モード番号判定部402は、復号された符号化モード番号nがビット深度変換処理を用いた画面内符号化の符号化モード番号と一致するかどうかを判定する。
上位階層復号部403は、符号化ストリームを入力とし、上位階層復号を行い、上位階層復号信号を出力する。下位階層復号部404は、符号化ストリームを入力とし、下位階層復号を行い、下位階層復号信号を出力する。逆ビット深度変換処理部405は、分割ビット深度Δと下位階層復号信号とを入力とし、逆ビット深度変換処理を行い、下位階層予測信号を生成して出力する。
予測残差信号復号部406は、符号化ストリームを入力とし、符号化ストリームに含まれる残差信号を復号する。復号画像信号生成部407は、上位階層復号信号と残差信号とを入力とし、復号画像信号を生成するか、下位階層予測信号と残差信号とを入力とし、復号画像信号を生成する。分割ビット深度対象領域判定部408は、次の符号化ユニットが、分割ビット深度対象領域に含まれるかどうかを判定する。
図15は、本第5実施形態による画面内予測復号装置の動作を説明するためのフローチャートである。まず、分割ビット深度復号部400で、符号化ストリームを入力し、符号化ストリームに含まれる分割ビット深度Δを復号し(ステップS141)、予測モード番号復号部401で、符号化ストリームを入力し、ストリーム内の符号化モード番号nを復号して出力する(ステップS142)。次に、予測モード番号判定部402で、該復号された符号化モード番号nがビット深度変換処理を用いた画面内符号化の符号化モード番号と一致するかどうかを判定する(ステップS143)。
そして、符号化モード番号nがビット深度変換処理を用いた画面内符号化の符号化モード番号と一致しなければ、上位階層復号部403で、符号化ストリームを入力し、上位階層復号を行い、上位階層復号信号を出力する(ステップS144)。次に、予測残差信号復号部406で、符号化ストリームを入力し、符号化ストリームに含まれる残差信号を復号して出力する(ステップS145)。そして、復号画像信号生成部407で、ステップS144で得られた上位階層復号信号とステップS145で得られた残差信号とを入力し、復号画像信号を生成して出力し(ステップS146)、当該処理を終了する。
一方、符号化モード番号nが画面内符号化を用いる符号化モード番号と一致すれば、下位階層復号部404で、符号化ストリームを入力し、下位階層復号を行い、下位階層復号信号を出力し(ステップS147)、逆ビット深度変換処理部405で、ステップS141で得られた分割ビット深度Δと下位階層復号信号とを入力し、逆ビット深度変換処理を行い、下位階層予測信号を生成して出力する(ステップS148)。次に、予測残差信号復号部406で、符号化ストリームを入力し、符号化ストリームに含まれる残差信号を復号し(ステップS149)、復号画像信号生成部407で、ステップS148で得られた下位階層予測信号とステップS149で得られた残差信号とを入力し、復号画像信号を生成する(ステップS150)。
次に、分割ビット深度対象領域判定部408で、次の符号化ユニットが、分割ビット深度対象領域に含まれるかどうかを判定する(ステップS151)。そして、含まれていれば、次の符号化ユニットへ移動し(ステップS152)、同じ分割ビット深度Δを用い、ステップS142からの処理を繰り返す。一方、次の符号化ユニットが、分割ビット深度対象領域に含まれていなければ、当該処理を終了する。
B−4.第6実施形態
次に、本発明の第6実施形態について説明する。
図16は、本発明の第6実施形態によるイントラ(画面内)予測復号装置の構成を示すブロック図である。図16において、分割ビット深度復号部500は、符号化ストリームを入力とし、符号化ストリームに含まれる分割ビット深度Δを復号する。予測モード番号復号部501は、符号化ストリームを入力し、ストリーム内の予測モード番号nを復号する。予測モード番号判定部502は、復号された予測モード番号nがビット深度変換処理を用いた画面内符号化を用いる予測モード番号と一致するかどうかを判定する。予測信号生成部503は、予測モード番号nと復号済みの隣接画素値とを入力とし、予測モード番号nに基づいて予測信号を生成する。
下位階層予測モード復号部504は、符号化ストリームを入力とし、符号化ストリームに含まれる下位階層予測モード番号mの情報を復号し、下位階層予測モード番号を出力する。下位階層予測信号生成部505は、下位階層予測モード番号mに基づいて、下位階層予測信号を生成する。下位階層予測残差信号復号部506は、符号化ストリームを入力とし、符号化ストリームに含まれる下位階層予測残差信号を復号する。
加算器507は、下位階層予測信号と下位階層予測残差信号とを入力とし、それらの信号を足し合わせることで、N−Δビットの下位階層復号信号を生成する。逆ビット深度変換処理部508は、分割ビット深度ΔとN−Δビットの下位階層復号信号とを入力とし、分割ビット深度Δに基づいて逆ビット深度変換を行うことで、Nビットの下位階層復号信号を生成する。
予測残差信号復号部509は、符号化ストリームを入力とし、符号化ストリームに含まれる予測残差信号を復号する。復号画像信号生成部510は、予測信号と予測残差信号とを入力とし、復号画像信号を生成して出力するか、下位階層復号信号と予測残差信号とに基づいて、復号画像信号を生成して出力する。分割ビット深度対象領域判定部511は、次の符号化ユニットが、分割ビット深度対象領域に含まれるかどうかを判定する。
図17は、本第6実施形態による画面内予測復号装置の動作を説明するためのフローチャートである。まず、分割ビット深度復号部500で、符号化ストリームを入力し、符号化ストリームに含まれる分割ビット深度Δを復号し(ステップS161)、予測モード番号復号部501で、符号化ストリームを入力し、ストリーム内の予測モード番号nを復号して出力する(ステップS162)。次に、予測モード番号判定部502で、該復号された予測モード番号nがビット深度変換処理を用いた画面内符号化の予測モード番号と一致するかどうかを判定する(ステップS163)。
そして、符号化モード番号nがビット深度変換処理を用いた画面内符号化の予測モード番号と一致しなければ、予測信号生成部503で、ステップS162で得られた予測モード番号nと復号済みの隣接画素値とを入力し、予測モード番号nに基づいて予測信号を生成して出力する(ステップS164)。次に、予測残差信号復号部509で、符号化ストリームを入力し、符号化ストリームに含まれる予測残差信号を復号し(ステップS165)、復号画像信号生成部510で、ステップS164で得られた予測信号とステップS165で得られた予測残差信号とを入力し、復号画像信号を生成して出力し(ステップS125)、当該処理を終了する。
一方、予測モード番号nがビット深度変換処理を用いた画面内符号化の予測モード番号と一致すれば、下位階層予測モード復号部504で、符号化ストリームを入力し、符号化ストリームに含まれる下位階層予測モード番号mの情報を復号し、下位階層予測モード番号を出力する(ステップS167)。次に、下位階層予測信号生成部505で、該得られた下位階層予測モード番号mに基づいて、下位階層予測信号を生成し(ステップS168)、下位階層予測残差信号復号部506で、符号化ストリームを入力し、符号化ストリームに含まれる下位階層予測残差信号を復号して出力する(ステップS169)。
次に、加算器507で、ステップS168で得られる下位階層予測信号とステップS169で得られる下位階層予測残差信号とを入力し、それらの信号を足し合わせることで、N−Δビットの下位階層復号信号を生成し(ステップS170)、逆ビット深度変換処理部508で、ステップS161で得られた分割ビット深度ΔとステップS170で得られたN−Δビットの下位階層復号信号とを入力し、分割ビット深度Δに基づいて逆ビット深度変換を行うことで、Nビットの下位階層復号信号を生成する(ステップS171)。
次に、予測残差信号復号部509で、符号化ストリームを入力し、符号化ストリームに含まれる予測残差信号を復号し(ステップS172)、復号画像信号生成部510で、ステップ171で得られた下位階層復号信号とステップS172で得られた予測残差信号とに基づいて、復号画像信号を生成して出力する(ステップS173)。
次に、分割ビット深度対象領域判定部511で、次の符号化ユニットが、分割ビット深度対象領域に含まれるかどうかを判定する(ステップS174)。そして、含まれていれば、次の符号化ユニットへ移動し(ステップS175)、同じ分割ビット深度Δを用い、ステップS162からの処理を繰り返す。一方、次の符号化ユニットが、分割ビット深度対象領域に含まれていなければ、当該処理を終了する。
上述した第1から第6実施形態によれば、画面内予測モードにビット深度変換処理を用いた予測モードを追加することで、下位ビットの情報を削減し、ノイズの影響を抑え、画面内符号化における符号量の削減を図り、符号化効率の改善を図ることができる。
なお、上述した第1及び第2実施形態における、入力画像信号に複数の色チャネルが含まれる場合、イントラ(画面内)予測符号化装置は、色チャネルごとにビット深度変換処理を用いた画面内符号化を行うか否かを判定して処理を行い、ビット深度変換処理を用いた画面内符号化を行うとき、色チャネルごとに分割ビット深度Δを選択するようにしてもよい。この場合、上述した第3から第6実施形態における、イントラ(画面内)予測復号装置は、色チャネルごと選択された分割ビット深度Δを用いて逆ビット深度変換処理を行い、符号化ストリームを復号する。
また、上述した第1及び第2実施形態における、イントラ(画面内)予測符号化装置は、分割ビット深度の対象領域が、符号化ユニット、あるいは複数の符号化ユニット、あるいは画面全体であるかを示す情報を符号化ストリームに含めるようにしてもよい。この場合、第3から第6実施形態における、イントラ(画面内)予測復号装置は、符号化ストリームに含まれる当該情報が示す対象領域に対して、復号した分割ビット深度を用いた復号を行うようにしてもよい。
上述したイントラ(画面内)予測符号化装置、及び、イントラ(画面内)予測復号装置は内部に、コンピュータシステムを有していてもよい。その場合、図4〜5、図7〜9、図11、図13、図15、図17の各処理過程は、プログラムの形式でコンピュータ読み取り可能な記録媒体に記憶されており、このプログラムをコンピュータが読み出して実行することによって、上記処理が行われることになる。ここでコンピュータ読み取り可能な記録媒体とは、磁気ディスク、光磁気ディスク、CD−ROM、DVD−ROM、半導体メモリ等をいう。また、このコンピュータプログラムを通信回線によってコンピュータに配信し、この配信を受けたコンピュータが当該プログラムを実行するようにしても良い。
60 符号化モード格納部
61 符号化モード判定部
62 上位階層符号化部
63、83、90 コスト算出部
64、84、91 コスト最小値初期化部
65、85、92 コスト最小値記憶部
67、87 隣接画素ビット深度変換処理部
68 下位階層符号化部
69、95 ビット深度変換誤差算出部
70、96 変換誤差最小値初期化部
71、97 変換誤差最小値記憶部
72、98 ビット深度変換誤差判定部
73、99 分割ビット深度終了判定部
74、93、100 コスト判定部
75、94、101 モード選択終了判定部
76 最適符号化モード番号・分割ビット深度・下位階層符号化モード番号記憶部
77 最適符号化モード番号・分割ビット深度・下位階層符号化モード番号符号化部
78、104 画面内予測符号化部
80、88 予測モード格納部
81 予測モード判定部
82 予測残差信号生成部
89 予測誤差信号生成部
102 最適予測モード番号・分割ビット深度・下位階層予測モード番号記憶部
103 最適予測モード番号・分割ビット深度・下位階層予測モード番号符号化部
200、300、401、501 予測モード番号復号部
201、301、402、502 予測モード番号判定部
202、403 上位階層復号部
203、303、400、500 分割ビット深度復号部
204、404 下位階層復号部
205、308、405、508 逆ビット深度変換処理部
206、309、406、509 予測残差信号復号部
207、310、407、510 復号画像信号生成部
302、503 予測信号生成部
304、504 下位階層予測モード復号部
305、505 下位階層予測信号生成部
306 下位階層残差信号復号部
307、507 加算器
408、511 分割ビット深度対象領域判定部
506 下位階層予測残差信号復号部

Claims (18)

  1. 最小の符号化対象領域である符号化ユニットごとに符号化を行なう画像符号化方法であって、
    ビット深度変換処理を用いた画面内符号化を行うか否かを判定する判定ステップと、
    前記判定ステップで前記ビット深度変換処理を行わないと判定された場合、前記ビット深度変換処理を用いない画像内符号化である上位階層符号化を入力画像信号に対して行う上位階層符号化ステップと、
    前記判定ステップで前記ビット深度変換処理を行うと判定された場合、隣接画素に対して前記ビット深度変換処理を行った後、下位階層符号化する下位階層符号化ステップと、
    前記判定ステップで前記ビット深度変換処理を行わないと判定された場合、前記上位階層符号化ステップにおける上位階層符号化の方式を示す符号化モード番号を符号化し、前記判定ステップで前記ビット深度変換処理を行うと判定された場合、前記下位階層符号化ステップにおける下位階層符号化の方式を示す符号化モード番号と分割ビット深度とを符号化する符号化ステップと
    を含むことを特徴とする画像符号化方法。
  2. 前記判定ステップでは、
    予め定められたコスト関数を用いて、前記ビット深度変換処理を用いた画像内符号化を行う場合の符号化のコストと、前記上位階層符号化を行う場合の符号化のコストとが算出され、算出されたコストのうち最も小さいコストに対応する符号化が選択される
    ことを特徴とする請求項1に記載の画像符号化方法。
  3. 前記符号化ステップでは、
    前記ビット深度変換処理により生じる前記入力画像信号に対する誤差が最小となるビット数、あるいは、前記コスト関数により算出されるコストが最小となるビット数が前記分割ビット深度として選択される
    ことを特徴とする請求項2に記載の画像符号化方法。
  4. 前記入力画像信号に複数の色チャネルが含まれる場合、
    前記判定ステップでは、前記色チャネルごとに前記ビット深度変換処理を用いた画面内符号化を行うか否かが判定され、
    前記ビット深度変換処理における前記分割ビット深度は、前記色チャネルごとに選択される
    ことを特徴とする請求項3に記載の画像符号化方法。
  5. 最小の符号化対象領域である符号化ユニットごとに符号化データを復号する画像復号法方であって、
    前記符号化データから符号化モード番号を復号する符号化モード番号復号ステップと、
    前記符号化モード番号に基づいて、ビット深度変換処理を用いた画面内符号が行われたか否かを判定する判定ステップと、
    前記符号化データから予測残差信号を復号する予測残差復号ステップと、
    前記判定ステップで前記ビット深度変換処理を用いた画面内符号化が行われていないと判定された場合、前記符号化データに対して上位階層復号を行う上位階層復号ステップと、
    前記判定ステップで前記ビット深度変換処理を用いた画面内符号化が行われたと判定された場合、前記符号化データから前記ビット深度変換処理に用いられた分割ビット深度を復号し、前記符号化モード番号と前記分割ビット深度とに基づいて、逆ビット深度変換処理を行い、下位階層復号信号を生成する下位階層復号ステップと、
    前記上位階層復号ステップで上位階層復号を行うことにより取得された上位階層復号信号と前記予測残差復号ステップで取得された予測残差信号とから復号画像信号を生成する第1の復号画像信号生成ステップと、
    前記下位階層復号ステップにおいて前記逆ビット深度変換処理を行うことにより取得された下位階層復号信号と前記予測残差復号ステップにおいて取得された予測残差信号とから復号画像信号を生成する第2の復号画像信号生成ステップと
    を含むことを特徴とする画像復号方法。
  6. 前記下位階層復号ステップは、
    前記符号化データから分割ビット深度を復号する分割ビット深度復号ステップと、
    前記符号化データに対して下位階層復号を行い、下位階層復号信号を生成する下位階層復号信号生成ステップと、
    前記分割ビット深度に基づいて、前記下位階層復号信号に対して逆ビット深度変換処理を行う逆ビット深度変換ステップと
    を含むことを特徴とする請求項5に記載の画像復号方法。
  7. 前記下位階層復号ステップは、
    前記符号化データから分割ビット深度を復号する分割ビット深度復号ステップと、
    前記符号化データから下位階層予測モード番号を復号出力する下位階層予測モード復号ステップと、
    前記下位階層予測モード番号に基づいて下位階層予測信号を生成する下位階層予測信号生成ステップと、
    前記符号化データから下位階層予測残差信号を復号する下位階層残差信号復号ステップと、
    前記下位階層予測信号と前記下位階層予測残差信号とを足し合わせ、下位階層復号信号を生成する下位階層復号信号生成ステップと、
    前記分割ビット深度に基づいて、前記下位階層復号信号に対して逆ビット深度変換を行う逆ビット深度変換処理ステップと
    を含むことを特徴とする請求項5に記載の画像復号方法。
  8. 前記分割ビット深度の対象領域が、符号化ユニット、あるいは複数の符号化ユニット、あるいは画面全体であるかを前記符号化データから判定する分割ビット深度対象領域判定ステップを更に含み、
    前記分割ビット深度対象領域判定ステップで前記分割ビット深度の対象領域が複数の符号化ユニット、あるいは画面全体であると判定された場合、前記分割ビット深度の対象領域に対して、共通の前記分割ビット深度を用いる
    ことを特徴とする請求項6又は請求項7のいずれかに記載の画像復号方法。
  9. 最小の符号化対象領域である符号化ユニットごとに符号化を行なう画像符号化装置であって、
    ビット深度変換処理を用いた画面内符号化を行うか否かを判定する判定手段と、
    前記判定手段でビット深度変換処理を行わないと判定された場合、前記ビット深度変換処理を用いない画像内符号化である上位階層符号化を入力画像信号に対して行う上位階層符号化手段と、
    前記判定手段で前記ビット深度変換処理を行うと判定された場合、隣接画素に対して前記ビット深度変換処理を行った後、下位階層符号化する下位階層符号化手段と、
    前記判定手段が前記ビット深度変換処理を行わないと判定した場合、前記上位階層符号化手段における上位階層符号化の方式を示す符号化モード番号を符号化し、前記判定手段が前記ビット深度変換処理を行うと判定した場合、前記下位階層符号化手段における下位階層符号化の方式を示す符号化モード番号と分割ビット深度とを符号化する符号化手段と
    を備えることを特徴とする画像符号化装置。
  10. 前記判定手段は、
    予め定められたコスト関数を用いて、前記ビット深度変換処理を用いた画像内符号化を行う場合の符号化のコストと、前記上位階層符号化を行う場合の符号化のコストとを算出し、算出したコストのうち最も小さいコストに対応する符号化を選択する
    ことを特徴とする請求項9に記載の画像符号化装置。
  11. 前記判定手段は、
    前記ビット深度変換処理により生じる前記入力画像信号に対する誤差が最小となるビット数、あるいは、前記コスト関数により算出されるコストが最小となるビット数を前記分割ビット深度として選択する
    ことを特徴とする請求項10に記載の画像符号化装置。
  12. 前記入力画像信号に複数の色チャネルが含まれる場合、
    前記判定手段は、前記色チャネルごとに前記ビット深度変換処理を用いた画面内符号化を行うか否かを判定し、
    前記ビット深度変換処理における前記分割ビット深度は、前記色チャネルごとに選択される
    ことを特徴とする請求項11に記載の画像符号化装置。
  13. 最小の符号化対象領域である符号化ユニットごとに符号化データを復号する画像復号装置であって、
    前記符号化データから符号化モード番号を復号する符号化モード番号復号手段と、
    前記符号化モード番号に基づいて、ビット深度変換処理を用いた画面内符号が行われたか否かを判定する判定手段と、
    前記符号化データから予測残差信号を復号する予測残差復号手段と、
    前記判定手段が前記ビット深度変換処理を用いた画面内符号が行われていないと判定した場合、前記符号化データに対して上位階層復号を行う上位階層復号手段と、
    前記判定手段が前記ビット深度変換処理を用いた画面内符号が行われたと判定した場合、前記符号化データから前記ビット深度変換処理に用いられた分割ビット深度を復号し、前記予測モード番号と前記分割ビット深度とに基づいて、逆ビット深度変換処理を行い、下位階層復号信号を生成する下位階層復号手段と、
    前記上位階層復号手段が上位階層復号を行うことにより取得した上位階層復号信号と、前記予測残差復号手段が取得した予測残差信号とから復号画像信号を生成する第1の復号画像信号生成手段と、
    前記下位階層復号手段が逆ビット深度変換処理を行うことにより取得した下位階層復号信号と、前記予測残差復号手段が取得した予測残差信号とから復号画像信号を生成する第2の復号画像信号生成手段と
    を備えることを特徴とする画像復号装置。
  14. 前記下位階層復号手段は、
    前記符号化データから分割ビット深度を復号する分割ビット深度復号手段と、
    前記符号化データに対して下位階層復号を行い、下位階層復号信号を生成する下位階層復号生成手段と、
    前記分割ビット深度に基づいて、前記下位階層復号信号に対して逆ビット深度変換処理を行う逆ビット深度変換手段と
    を備えることを特徴とする請求項13に記載の画像復号装置。
  15. 前記下位階層復号手段は、
    前記符号化データから分割ビット深度を復号する分割ビット深度復号手段と、
    前記符号化データから下位階層復号における復号の方式を示す下位階層予測モード番号を復号出力する下位階層予測モード復号手段と、
    前記下位階層予測モード番号に基づいて下位階層予測信号を復号する下位階層予測信号復号手段と、
    前記符号化データから下位階層予測残差信号を復号する下位階層残差信号復号手段と、
    前記下位階層予測信号と前記下位階層予測残差信号とを足し合わせ、下位階層復号信号を生成する下位階層復号信号生成手段と、
    前記分割ビット深度に基づいて、前記下位階層復号信号に対して逆ビット深度変換を行う逆ビット深度変換処理手段と
    を備えることを特徴とする請求項13に記載の画像復号装置。
  16. 前記分割ビット深度の対象領域が、符号化ユニット、あるいは複数の符号化ユニット、あるいは画面全体であるかを前記符号化データから判定する分割ビット深度対象領域判定手段を更に備え、
    前記分割ビット深度対象領域判定手段が前記分割ビット深度の対象領域を複数の符号化ユニット、あるいは画面全体であると判定した場合、前記分割ビット深度の対象領域に対して、共通の前記分割ビット深度を用いる
    ことを特徴とする請求項14又は請求項15のいずれかに記載の画像復号装置。
  17. 最小の符号化対象領域である符号化ユニットごとに符号化を行なう画像符号化装置に備えられているコンピュータに、
    画面内予測を用いる画像符号化装置に備えられているコンピュータに、
    ビット深度変換処理を用いた画面内符号化を行うか否かを判定する判定ステップと、
    前記判定ステップで前記ビット深度変換処理を行わないと判定された場合、前記ビット深度変換処理を用いない画像内符号化である上位階層符号化を入力画像信号に対して行う上位階層符号化ステップと、
    前記判定ステップで前記ビット深度変換処理を行うと判定された場合、隣接画素に対して前記ビット深度変換処理を行った後、下位階層符号化する下位階層符号化ステップと、
    前記判定ステップで前記ビット深度変換処理を行わないと判定された場合、前記上位階層符号化ステップにおける上位階層符号化の方式を示す符号化モード番号を符号化し、前記判定ステップで前記ビット深度変換処理を行うと判定された場合、前記下位階層符号化ステップにおける下位階層符号化の方式を示す符号化モード番号と分割ビット深度とを符号化する符号化ステップと
    を実行させるためのプログラム。
  18. 最小の符号化対象領域である符号化ユニットごとに符号化データを復号する画像復号装置に備えられているコンピュータに、
    前記符号化データから符号化モード番号を復号する符号化モード番号復号ステップと、
    前記符号化モード番号に基づいて、ビット深度変換処理を用いた画面内符号が行われたか否かを判定する判定ステップと、
    前記符号化データから予測残差信号を復号する予測残差復号ステップと、
    前記判定ステップで前記ビット深度変換処理を用いた画面内符号化が行われていないと判定された場合、前記符号化データに対して上位階層復号を行う上位階層復号ステップと、
    前記判定ステップで前記ビット深度変換処理を用いた画面内符号化が行われたと判定された場合、前記符号化データから前記ビット深度変換処理に用いられた分割ビット深度を復号し、前記符号化モード番号と前記分割ビット深度とに基づいて、逆ビット深度変換処理を行い、下位階層復号信号を生成する下位階層復号ステップと、
    前記上位階層復号ステップで上位階層復号を行うことにより取得された上位階層復号信号と前記予測残差復号ステップで取得された予測残差信号とから復号画像信号を生成する第1の復号画像信号生成ステップと、
    前記下位階層復号ステップにおいて前記逆ビット深度変換処理を行うことにより取得された下位階層復号信号と前記予測残差復号ステップにおいて取得された予測残差信号とから復号画像信号を生成する第2の復号画像信号生成ステップと
    を実行させるためのプログラム。
JP2010213803A 2010-09-24 2010-09-24 画像符号化方法、画像復号方法、画像符号化装置、画像復号装置、及びプログラム Active JP5339300B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2010213803A JP5339300B2 (ja) 2010-09-24 2010-09-24 画像符号化方法、画像復号方法、画像符号化装置、画像復号装置、及びプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2010213803A JP5339300B2 (ja) 2010-09-24 2010-09-24 画像符号化方法、画像復号方法、画像符号化装置、画像復号装置、及びプログラム

Publications (2)

Publication Number Publication Date
JP2012070248A true JP2012070248A (ja) 2012-04-05
JP5339300B2 JP5339300B2 (ja) 2013-11-13

Family

ID=46166971

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2010213803A Active JP5339300B2 (ja) 2010-09-24 2010-09-24 画像符号化方法、画像復号方法、画像符号化装置、画像復号装置、及びプログラム

Country Status (1)

Country Link
JP (1) JP5339300B2 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102801996A (zh) * 2012-07-11 2012-11-28 上海大学 基于jndd模型的快速深度图编码模式选择方法
JP2014093760A (ja) * 2012-11-07 2014-05-19 Mitsubishi Electric Corp 画像符号化装置、画像復号装置、及び画像符号化方法、画像復号方法

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105392012A (zh) * 2015-10-28 2016-03-09 清华大学深圳研究生院 一种基于区域链式编码的码率分配方法及装置

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007257641A (ja) * 2006-03-24 2007-10-04 Sharp Corp トーンマッピングのメッセージングのための方法、システム、画像受信装置、画像送信装置、およびプログラム
JP2010507941A (ja) * 2006-10-25 2010-03-11 フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン 品質スケーラブルな符号化方法
JP2010512698A (ja) * 2006-12-14 2010-04-22 トムソン ライセンシング 適応エンハンスメントレイヤ予測を使用したビット深度スケーラブルなビデオデータを符号化及び/又は復号化する方法及び装置

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007257641A (ja) * 2006-03-24 2007-10-04 Sharp Corp トーンマッピングのメッセージングのための方法、システム、画像受信装置、画像送信装置、およびプログラム
JP2010507941A (ja) * 2006-10-25 2010-03-11 フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン 品質スケーラブルな符号化方法
JP2010512698A (ja) * 2006-12-14 2010-04-22 トムソン ライセンシング 適応エンハンスメントレイヤ予測を使用したビット深度スケーラブルなビデオデータを符号化及び/又は復号化する方法及び装置

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102801996A (zh) * 2012-07-11 2012-11-28 上海大学 基于jndd模型的快速深度图编码模式选择方法
JP2014093760A (ja) * 2012-11-07 2014-05-19 Mitsubishi Electric Corp 画像符号化装置、画像復号装置、及び画像符号化方法、画像復号方法

Also Published As

Publication number Publication date
JP5339300B2 (ja) 2013-11-13

Similar Documents

Publication Publication Date Title
TWI759389B (zh) 用於視訊寫碼之低複雜度符號預測
US11843795B2 (en) Method and device for determining reference unit
US12058311B2 (en) Image encoding/decoding method and apparatus, and recording medium storing bitstream
US20240080450A1 (en) Image encoding/decoding method and device, and recording medium storing bitstream
CN113163207B (zh) 一种编解码方法、装置及其设备
WO2015012256A1 (ja) 画像符号化方法、画像符号化装置及び画像符号化プログラム
KR102696422B1 (ko) 디코딩 방법, 인코딩 방법, 장치, 기기 및 저장매체
JPWO2015107887A1 (ja) 動きベクトル探索装置、動きベクトル探索方法、及び動きベクトル探索プログラムを記憶する記録媒体
JP5339300B2 (ja) 画像符号化方法、画像復号方法、画像符号化装置、画像復号装置、及びプログラム
WO2017010073A1 (ja) 動画像符号化装置、動画像符号化方法および動画像符号化プログラムを記憶する記録媒体
JP5126096B2 (ja) 画像符号化処理方法、画像符号化処理装置、画像符号化プログラム
JP2008306413A (ja) 画像符号化装置および画像符号化方法
JP2005244749A (ja) 動画像符号化装置
JP2010081635A (ja) 動き補償予測符号化装置、動き補償予測符号化方法及びプログラム
JP2008092456A (ja) 画像符号化装置および画像復号装置
JP5388977B2 (ja) 画像符号化方法、画像復号方法、画像符号化装置、画像復号装置、及びプログラム
KR20160106348A (ko) 비디오 부호화 방법 및 그 장치
RU2824460C1 (ru) Способы, оборудование, устройства и носители данных для кодирования или декодирования
CN111107372A (zh) 带宽压缩中的后选择预测方法
JP2006157214A (ja) 動画像符号化装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20130213

RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20130605

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20130716

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20130723

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20130725

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20130730

R150 Certificate of patent or registration of utility model

Ref document number: 5339300

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350