以下、本開示を実施するための形態(以下実施の形態とする)について説明する。なお、説明は以下の順序で行う。
1.第1の実施の形態(画像符号化装置)
2.第2の実施の形態(画像符号化装置)
3.第3の実施の形態(多視点画像符号化装置・多視点画像復号装置)
4.第4の実施の形態(階層画像符号化装置・階層画像復号装置)
5.第5の実施の形態(コンピュータ)
6.第6の実施の形態(応用例)
7.第7の実施の形態(セット・ユニット・モジュール・プロセッサ)
<1.第1の実施の形態>
<画像符号化の標準化の流れ>
近年、MPEG-4 Part10 (Advanced Video Coding、以下AVCと記す)より更なる符号化効率の向上を目的として、ITU-T(International Telecommunication Union Telecommunication Standardization Sector)と、ISO/IEC(International Organization for Standardization / International Electrotechnical Commission)の共同の標準化団体であるJCTVC(Joint Collaboration Team - Video Coding)により、HEVC(High Efficiency Video Coding)と呼ばれる符号化方式の標準化が進められている。
また、HEVCにおいて、4:2:2や4:4:4といった色差信号フォーマットの画像や、スクリーンコンテンツ用のプロファイル等、例えばハイエンド向けのフォーマットをサポートするようにレンジエクステンションの検討が行われている(例えば、非特許文献1参照)。
<TR符号化>
ところで、このHEVCでは、coeff_abs_level_remainingと言う、係数情報データのシンタクス処理にTR(Truncated Rice)符号(可変長符号)が用いられている。このTR符号においては、5つの符号化テーブルが予め用意され、各係数データを符号化する際に、使用する符号化テーブルを随時、更新していく。
図1乃至図3にその5つの符号化テーブルの例(Table0乃至Table4)を示す。図1乃至図3に示されるように、同一の係数データを符号化して得られる符号化データの値やデータ長は基本的に符号化テーブル毎に異なるので、符号化効率の低減を抑制するために、係数データの値に適した符号化テーブルを選択することが望ましい。
さらに、追加されたレンジエクステンションのプロファイルでは、21の符号化テーブルを用意することができ、同一の係数データを符号化して得られる符号化データの値やデータ長は、さらに多様化する。したがって、符号化効率の低減を抑制するために、係数データの値に対して、より適した符号化テーブルを選択することが求められる。
しかしながら、各係数データの符号化に用いられる符号化テーブルの更新は、図4のフローチャートのステップS1乃至ステップS5の各処理に示されるように、符号化単位である所定のサイズ(例えば16x16)の符号化サブブロック(coded_sub_block)毎に初期化されるため、係数データに適していない符号化テーブルが選択されるおそれがあり、そのことにより符号化効率が低減するおそれがあった。
なお、追加されたレンジエクステンションのプロファイルでは、図5のフローチャートのステップS11乃至ステップS18の各処理に示されるように、符号化サブブロック(coded_sub_block)の先頭の係数データの符号化に用いる符号化テーブルを、他の符号化サブブロックの先頭の係数データに用いられた符号化テーブルに基づいて設定することができる。しかしながら、この場合も、各符号化サブブロックの先頭の係数データの値が、互いに一致若しくは近似するとは限らない。そのため、係数データに適していない符号化テーブルが選択されるおそれがあり、符号化効率が低減するおそれがあった。
図6を参照してより詳細に説明する。図6に示されるTU(Transform Unit)10は、符号化される画像データにおける直交変換の処理単位となる領域(ピクチャ単位の画像の部分領域)である。この例では、TU10は、8x8(縦8個×横8個)の係数データにより構成される。TU10には、4x4(縦4個×横4個)の係数データにより構成される符号化サブブロック(coded_sub_block)が4個(符号化サブブロック11乃至符号化サブブロック14)が形成されている。つまり、図6において、小さな正方形は係数データを示す。また、各係数データの四角内に示される数字は、その係数データに割り当てられた(その係数データの符号化に用いられる)符号化テーブルのテーブル番号を示している。
図6Aは、図4のフローチャートに示される方法により符号化テーブルを選択した場合の例を示している。この場合、まず最初に、符号化に用いる符号化テーブルのテーブル番号が「0」に設定される(初期化cRiceParam=0)。次に、処理された係数値を使って、条件式(cLastAbsLevel>(3*(1<<cLastRiceParam)))に基づいて、次の係数データの符号化に用いる符号化テーブルのテーブル番号を、現在の処理対象の係数データ(カレント係数データ)の符号化に用いる符号化テーブルのテーブル番号に+1したものとするか、カレント係数データの符号化に用いる符号化テーブルと同じものとするかが選択される。これを繰りかえすことで、処理する係数値に適した符号化テーブルを選択し、符号化効率を向上させる。
しかしながら、この方法の場合、図6Aに示されるように、各符号化サブブロックの先頭の係数データ(最初に処理される係数データ)である符号化サブブロックの右下の係数データには、テーブル番号0の符号化テーブル(Table0)が割り当てられることになる。
一般的に、TU10の係数データの値は、右下から左上に向かって大きくなっていく。そのため、このような方法では、係数データに適していない符号化テーブルが選択されるおそれがあり、符号化効率が低減するおそれがあった。
図6Bは、図5のフローチャートに示される方法により符号化テーブルを選択した場合の例を示している。この場合、まず最初に、StatCoeff[0]=0, StatCoeff[1]=0, StatCoeff[2]=0, StatCoeff[3]=0に初期化する。次に、符号化サブブロックの開始時に、transform_skip_flag, 及びcu_transquant_byppass_flagの値によって、sbTypeの値が「0」乃至「3」のいずれかに設定される。StatCoeff[sBtype]/4で算出された値を、Table番号(cRiceParam=StatCoeff[sbType]/4)とする。次に、符号化サブブロック(coded_sub_block)の最初に処理された係数値の値から、次の符号化サブブロック(coded_sub_block)の処理に使われる、符号化テーブルのテーブル番号が求められる(ステップS15の条件式A)。
次に、処理された係数値を使って、条件式(cLastAbsLevel>(3*(1<<cLastRiceParam)))に基づいて、次の係数データの符号化に用いる符号化テーブルのテーブル番号を、現在の処理対象の係数データ(カレント係数データ)の符号化に用いる符号化テーブルのテーブル番号に+1したものとするか、カレント係数データの符号化に用いる符号化テーブルと同じものとするかが選択される。これを繰りかえすことで、処理する係数値に適した符号化テーブルを選択し、符号化効率を向上させる。この方式の場合、図4の例の方式に比べて、初期値に、テーブル番号「0」以外の符号化テーブルも選択することができ、符号化効率を向上させることができる。
しかしながら、この方法の場合、符号化サブブロックの先頭の係数データには、他の符号化サブブロックの先頭の係数データに割り当てられた符号化テーブルのテーブル番号に基づいて設定されるテーブル番号の符号化テーブルが割り当てられることになる。そのため、この場合も、図6Bに示されるように、符号化サブブロック14の先頭の係数データ割り当てられた符号化テーブルのテーブル番号が、符号化サブブロック11乃至符号化サブブロック13の係数データに割り当てられた符号化テーブルのテーブル番号よりも小さくなるおそれがあり、符号化効率が低減するおそれがあった。
<符号化テーブルの割り当て>
そこで、符号化される画像データの処理対象であるカレント係数データの符号化に用いる符号化テーブルを、そのカレント係数データの周辺の係数データの符号化に用いられた符号化テーブルに基づいて設定し、設定された符号化テーブルを用いて、カレント係数データを符号化するようにする。
例えば、画像処理装置において、符号化される画像データの処理対象であるカレント係数データの符号化に用いる符号化テーブルを、そのカレント係数データの周辺の係数データの符号化に用いられた符号化テーブルに基づいて設定する設定部と、その設定部により設定された符号化テーブルを用いて、カレント係数データを符号化する符号化部とを備えるようにする。
このようにすることにより、カレント係数データにより適した符号化テーブルを割り当てることができ、符号化効率の低減を抑制することができる。
なお、周辺の係数データの符号化に用いられた符号化テーブルとして、カレント係数データの右に隣接する係数データの符号化に用いられた符号化テーブルと、カレント係数データの下に隣接する係数データの符号化に用いられた符号化テーブルとを用いるようにしてもよい。そしてこれらの符号化テーブルに基づいて、カレント係数データの符号化に用いる符号化テーブルを設定するようにしてもよい。
また、利用可能な周辺の係数データの符号化に用いられた符号化テーブルが単数の場合、その符号化テーブルを、カレント係数データの符号化に用いる符号化テーブルとして設定するようにしてもよい。
また、利用可能な前記周辺の係数データの符号化に用いられた符号化テーブルが複数の場合、複数の符号化テーブルのテーブル番号の平均値をテーブル番号とする符号化テーブルを、カレント係数データの符号化に用いる符号化テーブルとして設定するようにしてもよい。
また、カレント係数データが、画像データの符号化単位における先頭の係数データである場合、カレント係数データの符号化に用いる符号化テーブルを、周辺の係数データの符号化に用いられた符号化テーブルに基づいて設定するようにしてもよい。
<符号化方式>
以下においては、HEVC(High Efficiency Video Coding)方式の画像符号化・復号に適用する場合を例に、本技術を説明する。
<コーディングユニット>
AVC(Advanced Video Coding)方式においては、マクロブロックとサブマクロブロックによる階層構造が規定されている。しかしながら、16x16画素のマクロブロックでは、次世代符号化方式の対象となるような、UHD(Ultra High Definition;4000画素x2000画素)といった大きな画枠に対して最適ではない。
これに対して、HEVC方式においては、図7に示されるように、コーディングユニット(CU(Coding Unit))が規定されている。
CUは、Coding Tree Block(CTB)とも呼ばれ、AVC方式におけるマクロブロックと同様の役割を果たす、ピクチャ単位の画像の部分領域である。後者は、16x16画素の大きさに固定されているのに対し、前者の大きさは固定されておらず、それぞれのシーケンスにおいて、画像圧縮情報中において指定されることになる。
例えば、出力となる符号化データに含まれるシーケンスパラメータセット(SPS(Sequence Parameter Set))において、CUの最大サイズ(LCU(Largest Coding Unit))と最小サイズ((SCU(Smallest Coding Unit))が規定される。
それぞれのLCU内においては、SCUのサイズを下回らない範囲で、split-flag=1とすることにより、より小さなサイズのCUに分割することができる。図7の例では、LCUの大きさが128であり、最大階層深度が5となる。2Nx2Nの大きさのCUは、split_flagの値が「1」である時、1つ下の階層となる、NxNの大きさのCUに分割される。
更に、CUは、イントラ若しくはインター予測の処理単位となる領域(ピクチャ単位の画像の部分領域)であるプレディクションユニット(Prediction Unit(PU))に分割され、また、直交変換の処理単位となる領域(ピクチャ単位の画像の部分領域)である、トランスフォームユニット(Transform Unit(TU))に分割される。現在、HEVC方式においては、4x4及び8x8に加え、16x16及び32x32直交変換を用いることが可能である。
以上のHEVC方式のように、CUを定義し、そのCUを単位として各種処理を行うような符号化方式の場合、AVC方式におけるマクロブロックはLCUに相当し、ブロック(サブブロック)はCUに相当すると考えることができる。また、AVC方式における動き補償ブロックは、PUに相当すると考えることができる。ただし、CUは、階層構造を有するので、その最上位階層のLCUのサイズは、例えば128x128画素のように、AVC方式のマクロブロックより大きく設定されることが一般的である。
よって、以下、LCUは、AVC方式におけるマクロブロックをも含むものとし、CUは、AVC方式におけるブロック(サブブロック)をも含むものとする。つまり、以下の説明に用いる「ブロック」は、ピクチャ内の任意の部分領域を示し、その大きさ、形状、および特性等は限定されない。つまり、「ブロック」には、例えば、TU、PU、SCU、CU、LCU、サブブロック、マクロブロック、またはスライス等任意の領域(処理単位)が含まれる。もちろん、これら以外の部分領域(処理単位)も含まれる。サイズや処理単位等を限定する必要がある場合は、適宜説明する。
また、本明細書において、CTU(Coding Tree Unit)は、LCU(最大数のCU)のCTB(Coding Tree Block)と、そのLCUベース(レベル)で処理するときのパラメータを含む単位であるとする。また、CTUを構成するCU(Coding Unit)は、CB(Coding Block)と、そのCUベース(レベル)で処理するときのパラメータを含む単位であるとする。
<画像符号化装置>
図8は、本技術を適用した画像処理装置の一態様である画像符号化装置の構成の一例を示すブロック図である。図8に示される画像符号化装置100は、例えば、HEVCの予測処理、またはそれに準ずる方式の予測処理を用いて動画像の画像データを符号化する。
図8に示されるように画像符号化装置100は、画面並べ替えバッファ111、演算部112、直交変換部113、量子化部114、可逆符号化部115、蓄積バッファ116、逆量子化部117、および逆直交変換部118を有する。また、画像符号化装置100は、演算部119、ループフィルタ120、フレームメモリ121、イントラ予測部122、インター予測部123、予測画像選択部124、およびレート制御部125を有する。
画面並べ替えバッファ111は、入力された画像データの各フレームの画像をその表示順に記憶し、記憶した表示の順番のフレームの画像を、GOP(Group Of Picture)に応じて、符号化のためのフレームの順番に並べ替え、フレームの順番を並び替えた画像を、演算部112に供給する。また、画面並べ替えバッファ111は、フレームの順番を並び替えた画像を、イントラ予測部122およびインター予測部123にも供給する。
演算部112は、画面並べ替えバッファ111から読み出された画像から、予測画像選択部124を介してイントラ予測部122若しくはインター予測部123から供給される予測画像を減算し、その差分情報(残差データ)を直交変換部113に供給する。例えば、イントラ符号化が行われる画像の場合、演算部112は、画面並べ替えバッファ111から読み出された画像から、イントラ予測部122から供給される予測画像を減算する。また、例えば、インター符号化が行われる画像の場合、演算部112は、画面並べ替えバッファ111から読み出された画像から、インター予測部123から供給される予測画像を減算する。
直交変換部113は、演算部112から供給される残差データに対して、離散コサイン変換やカルーネン・レーベ変換等の直交変換を施す。直交変換部113は、その直交変換により得られた変換係数を量子化部114に供給する。
量子化部114は、直交変換部113から供給される変換係数を量子化する。量子化部114は、レート制御部125から供給される符号量の目標値に関する情報に基づいて量子化パラメータを設定し、その量子化を行う。量子化部114は、量子化された変換係数を可逆符号化部115に供給する。
可逆符号化部115は、量子化部114において量子化された変換係数を任意の符号化方式で符号化し、符号化データ(符号化ストリームとも称する)を生成する。また、可逆符号化部115は、例えばシーケンスパラメータセット、ピクチャパラメータセット、スライスヘッダ等のヘッダ情報を生成する。さらに、可逆符号化部115は、イントラ予測のモードを示す情報などをイントラ予測部122から取得し、インター予測のモードを示す情報や差分動きベクトル情報などをインター予測部123から取得し、それらの各種情報をヘッダ情報等に含める。
可逆符号化部115は、符号化して得られた符号化データを蓄積バッファ116に供給して蓄積させる。
可逆符号化部115の符号化方式としては、例えば、可変長符号化または算術符号化等が挙げられる。可変長符号化としては、例えば、H.264/AVC方式で定められているCAVLC(Context-Adaptive Variable Length Coding)などが挙げられる。また、coeff_abs_level_remainingと言う、係数情報データのシンタクス処理にTR符号が用いられる。算術符号化としては、例えば、CABAC(Context-Adaptive Binary Arithmetic Coding)などが挙げられる。
蓄積バッファ116は、可逆符号化部115から供給された符号化データを、一時的に保持する。蓄積バッファ116は、所定のタイミングにおいて、保持している符号化データを、画像符号化装置100の外部に出力する。すなわち、蓄積バッファ116は、符号化データを伝送する伝送部でもある。
また、量子化部114において量子化された変換係数は、逆量子化部117にも供給される。逆量子化部117は、その量子化された変換係数を、量子化部114による量子化に対応する方法で逆量子化する。逆量子化部117は、その逆量子化により得られた変換係数を、逆直交変換部118に供給する。
逆直交変換部118は、逆量子化部117から供給された変換係数を、直交変換部113による直交変換処理に対応する方法で逆直交変換する。逆直交変換部118は、逆直交変換された出力(復元された残差データ)を演算部119に供給する。
演算部119は、逆直交変換部118から供給された、復元された残差データに、予測画像選択部124を介してイントラ予測部122若しくはインター予測部123から供給される予測画像を加算し、局所的に再構成された画像(以下、復号画像とも称する)を得る。その復号画像は、ループフィルタ120若しくはイントラ予測部122に供給される。
ループフィルタ120は、演算部119から供給される復号画像に対して適宜ループフィルタ処理を行う。このループフィルタ処理は、少なくともデブロッキングフィルタ処理を含むフィルタ処理であれば任意である。例えば、ループフィルタ120が、復号画像に対してデブロッキングフィルタ処理を行ってデブロック歪を除去するとともに、ウィナーフィルタ(Wiener Filter)を用いて適応ループフィルタ処理を行うことにより画質改善を行うようにしてもよい。また、ループフィルタ120は、必要に応じて、フィルタ処理に用いたフィルタ係数等の情報を可逆符号化部115に供給し、それを符号化させるようにすることもできる。ループフィルタ120は、フィルタ処理を適宜施した復号画像をフレームメモリ121に供給する。
フレームメモリ121は、供給される復号画像を記憶し、所定のタイミングにおいて、記憶している復号画像を参照画像としてインター予測部123に供給する。
イントラ予測部122は、演算部119から参照画像として供給される復号画像である処理対象ピクチャ内の画素値を用いて予測画像を生成するイントラ予測(画面内予測)を行う。イントラ予測部122は、予め用意された複数のイントラ予測モードでこのイントラ予測を行う。
イントラ予測部122は、候補となる全てのイントラ予測モードで予測画像を生成し、画面並べ替えバッファ111から供給される入力画像を用いて各予測画像のコスト関数値を評価し、最適なモードを選択する。イントラ予測部122は、最適なイントラ予測モードを選択すると、その最適なモードで生成された予測画像を、予測画像選択部124に供給する。
また、上述したように、イントラ予測部122は、採用されたイントラ予測モードを示すイントラ予測モード情報等を、適宜可逆符号化部115に供給し、符号化させる。
インター予測部123は、画面並べ替えバッファ111から供給される入力画像と、フレームメモリ121から供給される参照画像とを用いてインター予測処理(動き予測処理および補償処理)を行う。より具体的には、インター予測部123は、インター予測処理として、動き予測を行って検出された動きベクトルに応じて動き補償処理を行い、予測画像(インター予測画像情報)を生成する。インター予測部123は、予め用意された複数のインター予測モードでこのようなインター予測を行う。
インター予測部123は、候補となる全てのインター予測モードで予測画像を生成する。インター予測部123は、画面並べ替えバッファ111から供給される入力画像と、生成した差分動きベクトルの情報などを用いて、各予測画像のコスト関数値を評価し、最適なモードを選択する。インター予測部123は、最適なインター予測モードを選択すると、その最適なモードで生成された予測画像を、予測画像選択部124に供給する。
インター予測部123は、採用されたインター予測モードを示す情報や、符号化データを復号する際に、そのインター予測モードで処理を行うために必要な情報等を可逆符号化部115に供給し、符号化させる。必要な情報としては、例えば、生成された差分動きベクトルの情報や、予測動きベクトル情報として、予測動きベクトルのインデックスを示すフラグなどがある。
予測画像選択部124は、演算部112や演算部119に供給する予測画像の供給元を選択する。例えば、イントラ符号化の場合、予測画像選択部124は、予測画像の供給元としてイントラ予測部122を選択し、そのイントラ予測部122から供給される予測画像を演算部112や演算部119に供給する。また、例えば、インター符号化の場合、予測画像選択部124は、予測画像の供給元としてインター予測部123を選択し、そのインター予測部123から供給される予測画像を演算部112や演算部119に供給する。
レート制御部125は、蓄積バッファ116に蓄積された符号化データの符号量に基づいて、オーバフローあるいはアンダーフローが発生しないように、量子化部114の量子化動作のレートを制御する。
<可逆符号化部>
図9は、可逆符号化部115の、TR符号化に関する主な構成例を示すブロック図である。図9に示されるように、可逆符号化部115は、TR符号化に関する構成として、例えば、制御部151、テーブル選択部152、TR符号化部153、およびテーブル指定情報バッファ154を有する。
制御部151は、テーブル選択部152乃至テーブル指定情報バッファ154の各処理部をそれぞれ制御する。
テーブル選択部152は、可逆符号化部115に供給される係数データを取得し、各係数データについて、TR符号化に用いられる符号化テーブルを選択する。テーブル選択部152は、選択したテーブルを示すテーブル指定情報をTR符号化部153およびテーブル指定情報バッファ154に供給する。
TR符号化部153は、テーブル選択部152により選択された符号化テーブル(例えば、テーブル選択部152から供給されるテーブル指定情報において指定される符号化テーブル)を用いて、処理対象の係数データ(カレント係数データ)を符号化する。TR符号化部153は、その符号化テーブルを用いた符号化により得られた符号化データを、例えば蓄積バッファ116等に出力する。
テーブル指定情報バッファ154は、テーブル選択部152から供給される各係数データのテーブル指定情報を記憶する。また、テーブル指定情報バッファ154は、必要に応じて(例えばテーブル選択部152の要求に従って)、記憶しているテーブル指定情報を、カレント係数データの周辺の係数データとして、テーブル選択部152に供給する。
このテーブル指定情報は、任意の情報であるが、例えばテーブル番号を含んでいてもよい。以下においては、符号化テーブルのテーブル番号をテーブル指定情報として用いる場合について説明する。
<テーブル選択部>
図10は、テーブル選択部152の主な構成例を示すブロック図である。図10に示されるように、テーブル選択部152は、周辺履歴演算部161、テーブル処理部162、選択部163、ベースレベル決定部164、演算部165、演算部166、選択部167、シフト処理部171、テーブル選択部172、選択部173、ベースレベル決定部174、演算部175、演算部176、および選択部177を有する。
図10に示されるように、テーブル選択部152は、2係数データずつ並行に処理する。点線181で囲まれる図中上段の構成が1つめの係数データを処理するための構成であり、点線182で囲まれる図中下段の構成が2つめの係数データを処理するための構成である。
周辺履歴演算部161は、カレント係数データ(処理対象の係数データ)について、符号化に用いる符号化テーブルのテーブル番号(curr_table No.)を求める。例えば、カレント係数データが画像データの符号化単位の1つである符号化サブブロック(coded_sub_block)の先頭の(最初に処理される)係数データである場合、テーブル指定情報バッファ154からカレント係数データの周辺の係数データの符号化に用いられた符号化テーブルのテーブル番号(周辺Table No.)を取得し、その取得したテーブル番号から、カレント係数データの符号化テーブルのテーブル番号(curr_table No.)を求める。
この演算方法の詳細については後述するが、例えば、カレント係数データに対して周辺の係数データが存在しない場合、周辺履歴演算部161は、所定の初期値(例えばテーブル番号0)を、カレント係数データの符号化テーブルのテーブル番号(curr_table No.)として設定する。
周辺履歴演算部161は、設定したテーブル番号(curr_table No.)を、TR符号化部153やテーブル指定情報バッファ154に供給するとともに、選択部163にも供給する。
また、カレント係数データが符号化サブブロック(coded_sub_block)の先頭の係数データでない場合、周辺履歴演算部161は、選択部177が選択したテーブル番号(next_table_1)(つまり、カレント係数データの1つ前の係数データの処理において、「次の係数データの符号化に用いられる符号化テーブルのテーブル番号」として設定された値)を取得し、その取得したテーブル番号を、カレント係数データの符号化テーブルのテーブル番号(curr_table No.)として選択部163に供給する。
テーブル処理部162は、テーブル選択部152に供給される係数データを、各符号化テーブル(図10の例の場合、テーブル番号0の符号化テーブル(Table_0)乃至テーブル番号4の符号化テーブル(Table_4))を用いてTR符号化する。テーブル処理部162は、各符号化テーブルを用いたTR符号化結果を選択部163に供給する。
選択部163は、テーブル処理部162から供給される各TR符号化結果の中から、周辺履歴演算部161から供給されるテーブル番号(curr_table No.)の符号化テーブルを用いたTR符号化結果を選択する。選択部163は、選択したTR符号化結果をcoeff_abs_level_remainingとして、演算部165に供給する。
ベースレベル決定部164は、ベースレベル(baselevel)の決定に関する処理を行う。例えば、ベースレベル決定部164は、scfが1かどうか、g1_flag[7:0]のどのbitが該当しているか否か、g1_flag=1の時、g2_flagが0か1か、g1_flagがすべて出たかどうか等の条件に基づいてベースレベルを決定する。ベースレベル決定部164は、決定したベースレベル(baselevel)を演算部165に供給する。
演算部165は、選択部163から供給されるcoeff_abs_level_remainingに、ベースレベル決定部164により決定されたベースレベル(baselevel)を加算し、その値を、cLastAbsLevelとして選択部167に供給する。
演算部166は、カレント係数データの符号化に用いられる符号化テーブルのテーブル番号(curr_table)に値「+1」を加算する。選択部167には、カレント係数データの符号化に用いられる符号化テーブルのテーブル番号(curr_table)や演算部166により「+1」が加算されたテーブル番号が供給される。
選択部167は、演算部165から供給されるcLastAbsLevelに基づいて、カレント係数データの符号化に用いられる符号化テーブルのテーブル番号(curr_table)と、演算部166より供給される「+1」が加算されたテーブル番号との内、いずれか一方を選択する。選択部167は、選択したテーブル番号を、次の係数データの符号化に用いられる符号化テーブルのテーブル番号(next_table No.(すなわちnext_table_0))として、TR符号化部153やテーブル指定情報バッファ154に供給するとともに、選択部173にも供給する。
テーブル選択部152に入力された係数データは、シフト処理部171にも供給される。シフト処理部171は、カレント係数データを次の係数データにシフトする。つまり、シフト処理部171は、テーブル処理部162に供給される係数データの次の係数データをテーブル処理部172に供給する。
テーブル処理部172は、シフト処理部171により新たにカレント係数データにされた係数データを、各符号化テーブル(図10の例の場合、テーブル番号0の符号化テーブル(Table_0)乃至テーブル番号4の符号化テーブル(Table_4))を用いてTR符号化する。テーブル処理部172は、各符号化テーブルを用いたTR符号化結果を選択部173に供給する。
選択部173は、テーブル処理部172から供給される各TR符号化結果の中から、選択部167から供給されるテーブル番号(next_table_0)の符号化テーブルを用いたTR符号化結果を選択する。選択部173は、選択したTR符号化結果をcoeff_abs_level_remainingとして、演算部175に供給する。
ベースレベル決定部174は、ベースレベル(baselevel)の決定に関する処理を行う。例えば、ベースレベル決定部174は、scfが1かどうか、g1_flag[7:0]のどのbitが該当しているか否か、g1_flag=1の時、g2_flagが0か1か、g1_flagがすべて出たかどうか等の条件に基づいてベースレベルを決定する。ベースレベル決定部174は、決定したベースレベル(baselevel)を演算部175に供給する。
演算部175は、選択部173から供給されるcoeff_abs_level_remainingに、ベースレベル決定部174により決定されたベースレベル(baselevel)を加算し、その値を、cLastAbsLevelとして選択部177に供給する。
演算部176は、カレント係数データの符号化に用いられる符号化テーブルのテーブル番号(curr_table)に値「+1」を加算する。選択部177には、カレント係数データの符号化に用いられる符号化テーブルのテーブル番号(curr_table)や演算部176により「+1」が加算されたテーブル番号が供給される。
選択部177は、演算部175から供給されるcLastAbsLevelに基づいて、カレント係数データの符号化に用いられる符号化テーブルのテーブル番号(curr_table)と、演算部176より供給される「+1」が加算されたテーブル番号との内、いずれか一方を選択する。選択部177は、選択したテーブル番号を、次の係数データの符号化に用いられる符号化テーブルのテーブル番号(next_table No.(すなわちnext_table_1))として、TR符号化部153やテーブル指定情報バッファ154に供給する。
<符号化テーブルの設定方法>
次に、周辺履歴演算部161による符号化テーブルの設定の仕方について、図11を参照して説明する。
直交変換処理単位であるTUは、複数の符号化サブブロック(coded_sub_block)により構成される。図11Aの例の場合、TU190は、8x8(縦8個×横8個)の係数データにより構成され、2x2の符号化サブブロック(符号化サブブロック191−1乃至符号化サブブロック191−4)が形成されている。なお、図11Aにおいて、小さな正方形は係数データを示している。そして、符号化サブブロック191−1乃至符号化サブブロック191−4は、それぞれ、4x4(縦4個×横4個)の係数データにより構成されている。符号化サブブロック191−1乃至符号化サブブロック191−4を互いに区別して説明する必要が無い場合、符号化サブブロック191と称する。
なお、TU190のサイズは任意であり、8x8に限定されない。例えば、HEVCでは、TUのサイズとして、4x4、8x8、16x16、32x32等が認められている。もちろん、これら以外のサイズであってもよいし、正方形でなくてもよい。符号化サブブロック191も、TU190より小さければよく、4x4に限定されない。
各符号化サブブロック191内において、各係数データは、図11Bに示されるような順序(アップライトスキャン(up-right_scan)順)で符号化される。図11Bにおいて、各小さな四角は係数データを示し、そこに示される数字は、処理順を示す。つまり、符号化サブブロック191の各係数データの符号化は、番号0の係数データから、0→1→2→・・・・→15の順に進む。すなわち、この斜線模様で示される、符号化サブブロック191の右下隅の係数データが、この符号化サブブロック191における先頭の係数データ(最初に処理される係数データ)である。
また、この場合、図11AのTU190において、各符号化サブブロック191は、符号化サブブロック191−1、符号化サブブロック191−2、符号化サブブロック191−3、符号化サブブロック191−4の順に処理される。
なお、スキャン順は、任意であり、アップライトスキャン順に限定されない。例えば、ホリゾンタルスキャン(horizontal_scan)順であってもよいし、バーティカルスキャン(vertical_scan)順であってもよいし、それ以外の順序であってもよい。
このような構成のTU190に対して、周辺履歴演算部161は、符号化サブブロック191の先頭の係数データの符号化に用いる符号化テーブル(のテーブル番号)を、その周辺の係数データの符号化に用いられた符号化テーブル(のテーブル番号)に基づいて設定する。
より具体的には、周辺履歴演算部161は、符号化サブブロック191の先頭の係数データ(図11Aにおいて「C」が示される係数データ)をカレント係数データ(処理対象の係数データ)とする場合、そのカレント係数データの右に隣接する係数データ(図11Aにおいて「A」が示される係数データ)の符号化に用いられた符号化テーブル(のテーブル番号)と、カレント係数データの下に隣接する係数データ(図11Aにおいて「B」が示される係数データ)の符号化に用いられた符号化テーブル(のテーブル番号)とに基づいて、カレント係数データの符号化に用いる符号化テーブル(のテーブル番号)を設定する。
例えば、符号化サブブロック191−1の先頭の係数データをカレント係数データとする場合、図11Aに示されるように、そのカレント係数データの右に隣接する係数データ(「A」が示される係数データ)も、そのカレント係数データの下に隣接する係数データ(「B」が示される係数データ)も存在しない。したがって、周辺履歴演算部161は、そのカレント係数データの符号化に用いる符号化テーブル(のテーブル番号)として所定の初期値(例えばテーブル番号0)を設定する。
また、例えば、符号化サブブロック191−2の先頭の係数データをカレント係数データとする場合、図11Aに示されるように、そのカレント係数データの右に隣接する係数データは存在しないが、そのカレント係数データの下に隣接する係数データが存在する。したがって、周辺履歴演算部161は、そのカレント係数データの符号化に用いる符号化テーブル(のテーブル番号)として、そのカレント係数データの下に隣接する係数データ(「B」が示される係数データ)の符号化に用いられた符号化テーブル(のテーブル番号)を設定する。
同様に、例えば、符号化サブブロック191−3の先頭の係数データをカレント係数データとする場合、図11Aに示されるように、そのカレント係数データの下に隣接する係数データは存在しないが、そのカレント係数データの右に隣接する係数データが存在する。したがって、周辺履歴演算部161は、そのカレント係数データの符号化に用いる符号化テーブル(のテーブル番号)として、そのカレント係数データの右に隣接する係数データ(「A」が示される係数データ)の符号化に用いられた符号化テーブル(のテーブル番号)を設定する。
さらに、例えば、符号化サブブロック191−4の先頭の係数データをカレント係数データとする場合、図11Aに示されるように、そのカレント係数データの右に隣接する係数データも、そのカレント係数データの下に隣接する係数データも存在する。したがって、周辺履歴演算部161は、そのカレント係数データの符号化に用いる符号化テーブルのテーブル番号として、そのカレント係数データの右に隣接する係数データ(「A」が示される係数データ)の符号化に用いられた符号化テーブルのテーブル番号と、そのカレント係数データの下に隣接する係数データ(「B」が示される係数データ)の符号化に用いられた符号化テーブルのテーブル番号との平均値を設定する。
その他の係数データの符号化に用いる符号化テーブル(のテーブル番号)は、図5のフローチャートを参照して説明した場合と同様に設定されるものとすると、TU190の各係数データの符号化に用いる符号化テーブル(のテーブル番号)は、例えば、図12の例のように設定される。
一般的に、TU190の左上により低周波成分が集まり、右下により高周波成分が集まる。つまり、TU190の右下の係数データほどその値が小さくなり、左上の係数データほどその値が大きくなる傾向がある。したがって、TU190の右下の係数データほどテーブル番号が小さな符号化テーブルで符号化し、左上の係数データほどテーブル番号が大きな符号化テーブルで符号化することにより、符号化効率の向上を期待することができる。換言するに、TU190のより右下の係数データをテーブル番号がより大きな符号化テーブルで符号化し、より左上の係数データをテーブル番号がより小さな符号化テーブルで符号化するようにすると、符号化効率が低減するおそれがある。
また、このような値の分布の傾向から、各係数データの値は、その周辺の係数データの値との相関性が高い。つまり、各係数データは、その周辺の係数データの符号化に用いられた符号化テーブルのテーブル番号と一致若しくは近似するテーブル番号の符号化テーブルを用いて符号化することにより、符号化効率の向上を期待することができる。換言するに、互いに位置が近い係数データに、テーブル番号が大きく異なる符号化テーブルを割り当てるようにすると、符号化効率が低減するおそれがある。
図12の例の方が、図6Aや図6Bの場合よりも、TU190のより右下の係数データにより小さなテーブル番号の符号化テーブルを割り当て、より左上の係数データにより大きなテーブル番号の符号化テーブルを割り当てている。また、図12の例の方が、図6Aや図6Bの場合よりも、互いに位置が近い係数データに割り当てられた符号化テーブル同士のテーブル番号の差が小さい。
したがって、図12の例の方が、図6Aや図6Bの場合よりも、符号化効率の低減を抑制することができる。
なお、以上においては、カレント係数データの右に隣接する係数データも、そのカレント係数データの下に隣接する係数データも存在する場合、すなわち、利用可能な周辺の係数データの符号化に用いられた符号化テーブルが複数存在する場合、カレント係数データの符号化に用いる符号化テーブルのテーブル番号として、それらの符号化テーブルのテーブル番号の平均値を設定するように説明したが、これに限らず、例えば、それらの符号化テーブルのテーブル番号の中央値を設定するようにしてもよい。また、その他の演算の結果を、カレント係数データの符号化に用いる符号化テーブルのテーブル番号として設定するようにしてもよい。
また、例えば、カレント係数データの符号化に用いる符号化テーブルのテーブル番号として、それらの符号化テーブルのテーブル番号のいずれかを設定するようにしてもよい。例えば、それらの符号化テーブルのテーブル番号の最大値や最小値を設定するようにしてもよい。
<符号化処理の流れ>
次に、画像符号化装置100により実行される各処理の流れの例を説明する。最初に、符号化処理の流れの例を、図13のフローチャートを参照して説明する。
符号化処理が開始されると、ステップS101において、画面並べ替えバッファ111は、入力された動画像の各フレーム(ピクチャ)の画像をその表示する順番に記憶し、各ピクチャの表示する順番から符号化する順番への並べ替えを行う。
ステップS102において、イントラ予測部122は、イントラ予測モードのイントラ予測処理を行う。
ステップS103において、インター予測部123は、インター予測モードでの動き予測や動き補償等を行うインター予測処理を行う。
ステップS104において、予測画像選択部124は、コスト関数値等に基づいて、ステップS102のイントラ予測により生成された予測画像と、ステップS103のインター予測により生成された予測画像のいずれか一方を選択する。
ステップS105において、演算部112は、ステップS101の処理によりフレーム順を並び替えられた入力画像と、ステップS104の処理により選択された予測画像との差分を演算する。つまり、演算部112は、入力画像と予測画像との残差データを生成する。このようにして求められた残差データは、元の画像データに比べてデータ量が低減される。したがって、画像をそのまま符号化する場合に比べて、データ量を圧縮することができる。
ステップS106において、直交変換部113は、ステップS105の処理により生成された残差データを直交変換する。
ステップS107において、量子化部114は、レート制御部125により算出された量子化パラメータを用いて、ステップS106の処理により得られた直交変換係数を量子化する。
ステップS108において、逆量子化部117は、ステップS107の処理により生成された量子化された係数(量子化係数とも称する)を、その量子化の特性に対応する特性で逆量子化する。
ステップS109において、逆直交変換部118は、ステップS108の処理により得られた直交変換係数を逆直交変換する。
ステップS110において、演算部119は、ステップS109の処理により復元された残差データに、ステップS104の処理により選択された予測画像を加算することにより、復号画像の画像データを生成する。
ステップS111において、ループフィルタ120は、ステップS110の処理により生成された復号画像の画像データに対して適宜ループフィルタ処理を行う。
ステップS112において、フレームメモリ121は、ステップS111の処理が行われた、局所的に復号された復号画像を記憶する。
ステップS113において、可逆符号化部115は、ステップS107の処理により得られた、量子化された係数を符号化する。すなわち、残差データに対応するデータに対して、可変長符号化や算術符号化等の可逆符号化が行われる。
また、可逆符号化部115は、ステップS104の処理により選択された予測画像の予測モードに関する情報を符号化し、符号化データのヘッダ情報に付加する。つまり、可逆符号化部115は、イントラ予測部122から供給される最適イントラ予測モード情報、または、インター予測部123から供給される最適インター予測モードに応じた情報なども符号化し、符号化データのヘッダ情報に付加する。
ステップS114において蓄積バッファ116は、ステップS113の処理により得られた符号化データ等を蓄積する。蓄積バッファ116に蓄積された符号化データ等は、ビットストリームとして適宜読み出され、伝送路や記録媒体を介して復号側に伝送される。
ステップS115においてレート制御部125は、ステップS114の処理により蓄積バッファ116に蓄積された符号化データ等の符号量(発生符号量)に基づいて、オーバフローあるいはアンダーフローが発生しないように、ステップS107の量子化処理のレートを制御する。
ステップS115の処理が終了すると、符号化処理が終了する。
<TR符号化処理の流れ>
次に、ステップS113の可逆符号化処理として実行されるTR符号化処理の流れの例を、図14のフローチャートを参照して説明する。
TR符号化処理が開始されると、ステップS121において、テーブル選択部152は、係数データの符号化に用いる符号化テーブルを選択する。
ステップS122において、TR符号化部153は、ステップS121において選択された符号化テーブルを用いて、係数データを符号化する。
ステップS123において、テーブル指定情報バッファ154は、ステップS121において選択された符号化テーブル(のテーブル番号)を示すテーブル指定情報を記憶する。
ステップS123の処理が終了すると、TR符号化処理が終了する。
<符号化テーブル選択処理の流れ>
次に、図14のステップS121において実行される符号化テーブル選択処理の流れの例を、図15のフローチャートを参照して説明する。
ステップS131において、周辺履歴演算部161は、変数StatCoeffA, StatCoeffB, prevStatCoeffをそれぞれ初期値(例えば「0」)に設定する。
変数StatCoeffAは、カレント係数データの右に隣接する係数データの符号化に用いられた符号化テーブルのテーブル番号を示す。変数StatCoeffBは、カレント係数データの下に隣接する係数データの符号化に用いられた符号化テーブルのテーブル番号を示す。変数prevStatCoeffは、直前に処理された係数データの符号化に用いられた符号化テーブルのテーブル番号を示す。
ステップS132において、制御部151は、当該TU内において、処理対象とする符号化サブブロック(coded_sub_block)を、所定の順に従って選択する。また、制御部151は、選択した符号化サブブロックにおいて、所定のスキャン順における先頭の係数データを処理対象(カレント係数データ)として選択する。
ステップS133において、周辺履歴演算部161は、カレント係数データの周辺の係数データの有無により、変数initValueを設定する。
例えば、カレント係数データが、符号化サブブロック191−1(図11A)の先頭の係数データ(C)である場合、そのカレント係数データの右に隣接する係数データ(A)も、下に隣接する係数データ(B)も、当該TU190の外側に位置するので、変数StatCoeffAも変数StatCoeffBも、値が「invalid」(履歴がない)になる。
したがって、この場合、周辺履歴演算部161は、変数initValueに変数prevStatCoeffの値を設定する。このカレント係数データがTU190の先頭の係数データ(例えば、符号化サブブロック191−1の先頭の係数データ(C))である場合、変数prevStatCoeffの値は、ステップS131において設定された初期値(例えば「0」)である。
また、例えば、カレント係数データが、符号化サブブロック191−2(図11A)の先頭の係数データ(C)である場合、そのカレント係数データの右に隣接する係数データ(A)は、当該TU190の外側に位置するので、変数StatCoeffAの値は「invalid」(履歴がない)になる。これに対して、カレント係数データの下に隣接する係数データ(B)は、当該TU190内に存在するので、変数StatCoeffBの値は、そのカレント係数データの下に隣接する係数データ(B)の符号化に用いられた符号化テーブルのテーブル番号になる。
したがって、この場合、周辺履歴演算部161は、変数initValueに変数StatCoeffBの値を設定する。図12の例の場合、変数initValueの値は、「3」に設定される。
また、例えば、カレント係数データが、符号化サブブロック191−3(図11A)の先頭の係数データ(C)である場合、そのカレント係数データの下に隣接する係数データ(B)は、当該TU190の外側に位置するので、変数StatCoeffBの値は「invalid」(履歴がない)になる。これに対して、カレント係数データの右に隣接する係数データ(A)は、当該TU190内に存在するので、変数StatCoeffAの値は、そのカレント係数データの右に隣接する係数データ(A)の符号化に用いられた符号化テーブルのテーブル番号になる。
したがって、この場合、周辺履歴演算部161は、変数initValueに変数StatCoeffAの値を設定する。図12の例の場合、変数initValueの値は、「4」に設定される。
さらに、例えば、カレント係数データが、符号化サブブロック191−4(図11A)の先頭の係数データ(C)である場合、そのカレント係数データの右に隣接する係数データ(A)も、下に隣接する係数データ(B)も存在する。したがって、変数StatCoeffAの値は、そのカレント係数データの右に隣接する係数データ(A)の符号化に用いられた符号化テーブルのテーブル番号になり、変数StatCoeffBの値は、そのカレント係数データの下に隣接する係数データ(B)の符号化に用いられた符号化テーブルのテーブル番号になる。
したがって、この場合、周辺履歴演算部161は、変数initValueに変数StatCoeffAと変数StatCoeffBの平均値を設定する。図12の例の場合、変数StatCoeffAも変数StatCoeffBも「7」になるので、変数initValueの値は、「7」に設定される。
ステップS134において、周辺履歴演算部161は、以上のように設定した変数initValueを、変数cRiceParamに設定する。変数cRiceParamは、カレント係数データの符号化に用いる符号化テーブルのテーブル番号を示す変数である。つまり、周辺履歴演算部161は、ステップS133において選択した符号化テーブル(のテーブル番号)を、カレント係数データの符号化に用いる符号化テーブル(のテーブル番号)として設定する。この変数cRiceParamがTR符号化部153に供給されて符号化に利用される。つまり、TR符号化部153は、この変数cRiceParamが示す符号化テーブルを用いてカレント係数データを符号化する。
また、ステップS134において、周辺履歴演算部161は、以上のように設定した変数initValueを、変数prevStatCoeffに設定する。つまり、周辺履歴演算部161は、ステップS133において選択した符号化テーブル(のテーブル番号)を、直前に処理された係数データの符号化に用いられた符号化テーブル(のテーブル番号)として設定する。この変数prevStatCoeffの値は、次の係数データに対する処理において利用されるので、現在のカレント係数データの符号化に用いられた符号化テーブル(のテーブル番号)を示す。
ステップS135において、制御部151は、処理対象の符号化サブブロック内に未処理の係数データが存在するか否かを判定する。存在すると判定された場合、制御部151は、当該符号化サブブロック内において、カレント係数データを、所定のスキャン順に従っての次の係数データに移動する。そして、処理はステップS136に進む。
ステップS136において、選択部167は、変数cLastAbsLevelと、変数cLastRiceParamとが、以下の条件式(1)を満たすか否かを判定する。
cLastAbsLevel > (3*(1<<cLastRiceParam)) ・・・(1)
満たすと判定された場合、処理はステップS137に進む。ステップS137において、選択部167は、変数cRiceParamの値に「+1」を加算する。つまり、符号化に用いるテーブルを変更する。
ステップS137の処理が終了すると、処理はステップS135に戻り、それ以降の処理が繰り返される。また、ステップS136において、条件式(1)を満たさないと判定された場合、処理はステップS135に戻り、それ以降の処理が繰り返される。
ステップS135において、当該符号化サブブロックの全ての係数データを処理したと判定された場合、処理はステップS138に進む。
ステップS138において、制御部151は、当該TUについて、全ての符号化サブブロックを処理したか否かを判定する。未処理の符号化サブブロックが存在すると判定された場合、処理はステップS132に戻り、それ以降の処理が繰り返される。
また、ステップS138において、当該TUについて全ての符号化サブブロックを処理したと判定された場合、符号化テーブル選択処理が終了し、処理が図14に戻る。
以上のように各処理を実行することにより、符号化効率の低減を抑制することができる。
<符号化テーブルの設定方法>
以上においては、カレント係数データの周辺の係数データの例として、カレント係数データ(C)の右に隣接する係数データ(A)と、そのカレント係数データ(C)の下に隣接する係数データ(B)とを示したが、カレント係数データの周辺の係数データは、この例に限定されない。例えば、カレント係数データ(C)の右下に隣接する係数データ(図11Aにおいて「D」が示される係数データ)をカレント係数データの周辺の係数データに含めるようにしてもよい。
この場合、カレント係数データ(C)の周辺の係数データが存在しない場合、カレント係数データの右に隣接する係数データ(A)のみが存在する場合、並びに、カレント係数データの下に隣接する係数データ(B)のみが存在する場合は、図12や図15を参照して説明した場合と同様である。
これに対して、例えば、符号化サブブロック191−4の先頭の係数データをカレント係数データとする場合、図11Aに示されるように、そのカレント係数データの右に隣接する係数データ(A)、そのカレント係数データの下に隣接する係数データ(B)、並びに、そのカレント係数データの右下に隣接する係数データ(D)が全て存在する。したがって、周辺履歴演算部161は、そのカレント係数データの符号化に用いる符号化テーブルのテーブル番号として、そのカレント係数データの右に隣接する係数データ(A)、そのカレント係数データの下に隣接する係数データ(B)、並びに、そのカレント係数データの右下に隣接する係数データ(D)の符号化に用いられた符号化テーブルのテーブル番号との平均値を設定する。
この場合の符号化テーブルの割り当ての例を図16に示す。図16に示されるように、符号化サブブロック191−4の先頭の係数データ(カレント係数データ)の符号化に用いられる符号化テーブルのテーブル番号には、そのカレント係数データの右に隣接する係数データの符号化に用いられた符号化テーブルのテーブル番号(7)と、そのカレント係数データの下に隣接する係数データの符号化に用いられた符号化テーブルのテーブル番号(7)と、そのカレント係数データの右下に隣接する係数データの符号化に用いられた符号化テーブルのテーブル番号(10)との平均値((7+7+10)/3=8)が設定されている。
したがって、図16の例の方が、図6Aや図6Bの場合よりも、TU190のより右下の係数データにより小さなテーブル番号の符号化テーブルを割り当て、より左上の係数データにより大きなテーブル番号の符号化テーブルを割り当てている。また、図16の例の方が、図6Aや図6Bの場合よりも、互いに位置が近い係数データに割り当てられた符号化テーブル同士のテーブル番号の差が小さい。
つまり、各係数データ対してこのように符号化テーブルを割り当てることにより、図6Aや図6Bの場合よりも、符号化効率の低減を抑制することができる。
なお、この場合も、図12の例の場合と同様に、平均値の代わりに、中央値等、その他の演算の結果を用いるようにしてもよい。また、例えば、周辺の係数データの符号化に用いられた符号化テーブルのテーブル番号の最大値や最小値等、いずれかのテーブル番号を用いるようにしてもよい。
<符号化テーブル選択処理の流れ>
この場合の符号化テーブル選択処理の流れの例を、図17のフローチャートを参照して説明する。
符号化テーブル選択処理が開始されると、ステップS131において、周辺履歴演算部161は、変数StatCoeffA, StatCoeffB, StatCoeffD, prevStatCoeffをそれぞれ初期値(例えば「0」)に設定する。変数StatCoeffDは、カレント係数データの右下に隣接する係数データの符号化に用いられた符号化テーブルのテーブル番号を示す。
ステップS152の処理は、図15のステップS132の処理と同様に実行される。
ステップS153において、周辺履歴演算部161は、カレント係数データの周辺の係数データの有無により、変数initValueを設定する。
カレント係数データが、符号化サブブロック191−1(図11A)の先頭の係数データ(C)、符号化サブブロック191−2(図11A)の先頭の係数データ(C)、若しくは、符号化サブブロック191−3(図11A)の先頭の係数データ(C)である場合は、図15のステップS133の処理の場合と同様に、変数initValueを設定する。
これに対して、カレント係数データが、符号化サブブロック191−4(図11A)の先頭の係数データ(C)である場合、そのカレント係数データの右に隣接する係数データ(A)も、下に隣接する係数データ(B)も、右下に隣接する係数データ(D)も存在する。したがって、変数StatCoeffAの値は、そのカレント係数データの右に隣接する係数データ(A)の符号化に用いられた符号化テーブルのテーブル番号になり、変数StatCoeffBの値は、そのカレント係数データの下に隣接する係数データ(B)の符号化に用いられた符号化テーブルのテーブル番号になり、変数StatCoeffDの値は、そのカレント係数データの下に隣接する係数データ(D)の符号化に用いられた符号化テーブルのテーブル番号になる。
したがって、この場合、周辺履歴演算部161は、変数initValueに変数StatCoeffA、変数StatCoeffB、および変数StatCoeffDの平均値を設定する。図16の例の場合、変数StatCoeffAと変数StatCoeffBが「7」になり、変数StatCoeffDが「10」になるので、変数initValueの値は、「8」に設定される。
ステップS154乃至ステップS158の各処理は、図15のステップS134乃至ステップS138の各処理と同様に実行される。
このように符号化テーブル選択処理を実行することにより、符号化効率の低減を抑制することができる。
<符号化テーブルの設定方法>
また、カレント係数データの周辺の係数データは、カレント係数データにななめに隣接する係数データとしてもよい。例えば、カレント係数データ(C)の右上に隣接する係数データ(図11Aにおいて「E」が示される係数データ)と、カレント係数データ(C)の左下に隣接する係数データ(図11Aにおいて「F」が示される係数データ)とを、カレント係数データの周辺の係数データとしてもよい。
上述したように、TU190の係数データは、一般的に、右下に位置するほどその値が小さくなり、左上に位置するほどその値が大きくなる傾向がある。したがって、各係数データの値は、右上・左下の斜め方向に相関性が高くなる。つまり、カレント係数データの符号化を、右上に隣接する係数データや左下に隣接する係数データの符号化に用いられた符号化テーブルのテーブル番号と一致若しくは近似するテーブル番号の符号化テーブルを用いて行うことにより、符号化効率の向上を期待することができる。
例えば、図11Aの例において、符号化サブブロック191−1の先頭の係数データをカレント係数データとする場合、そのカレント係数データの右上と左下に隣接する係数データは存在しない。したがって、周辺履歴演算部161は、そのカレント係数データの符号化に用いる符号化テーブル(のテーブル番号)として所定の初期値(例えばテーブル番号0)を設定する。
また、例えば、図11Aの例において、符号化サブブロック191−2の先頭の係数データをカレント係数データとする場合、そのカレント係数データの右上に隣接する係数データは存在しないが、そのカレント係数データの左下に隣接する係数データが存在する。したがって、周辺履歴演算部161は、そのカレント係数データの符号化に用いる符号化テーブル(のテーブル番号)として、そのカレント係数データの左下に隣接する係数データ(「F」が示される係数データ)の符号化に用いられた符号化テーブル(のテーブル番号)を設定する。
同様に、例えば、図11Aの例において、符号化サブブロック191−3の先頭の係数データをカレント係数データとする場合、そのカレント係数データの左下に隣接する係数データは存在しないが、そのカレント係数データの右上に隣接する係数データが存在する。したがって、周辺履歴演算部161は、そのカレント係数データの符号化に用いる符号化テーブル(のテーブル番号)として、そのカレント係数データの右上に隣接する係数データ(「E」が示される係数データ)の符号化に用いられた符号化テーブル(のテーブル番号)を設定する。
さらに、例えば、図11Aの例において、符号化サブブロック191−4の先頭の係数データをカレント係数データとする場合、そのカレント係数データの右上に隣接する係数データも、そのカレント係数データの左下に隣接する係数データも存在する。したがって、周辺履歴演算部161は、そのカレント係数データの符号化に用いる符号化テーブルのテーブル番号として、そのカレント係数データの右上に隣接する係数データ(「E」が示される係数データ)の符号化に用いられた符号化テーブルのテーブル番号と、そのカレント係数データの左下に隣接する係数データ(「F」が示される係数データ)の符号化に用いられた符号化テーブルのテーブル番号との平均値を設定する。
その他の係数データの符号化に用いる符号化テーブル(のテーブル番号)は、図5のフローチャートを参照して説明した場合と同様に設定されるものとすると、TU190の各係数データの符号化に用いる符号化テーブル(のテーブル番号)は、例えば、図18の例のように設定される。
図18において、例えば、カレント係数データが、符号化サブブロック191−1の先頭の係数データである場合、そのカレント係数データの符号化に用いる符号化テーブルのテーブル番号として、初期値「0」が設定されている。
また、例えば、カレント係数データが、符号化サブブロック191−2の先頭の係数データである場合、そのカレント係数データの符号化に用いる符号化テーブルのテーブル番号として、そのカレント係数データの左下に隣接する係数データの符号化に用いられた符号化テーブルのテーブル番号「7」が設定されている。
また、例えば、カレント係数データが、符号化サブブロック191−3の先頭の係数データである場合、そのカレント係数データの符号化に用いる符号化テーブルのテーブル番号として、そのカレント係数データの右上に隣接する係数データの符号化に用いられた符号化テーブルのテーブル番号「5」が設定されている。
また、例えば、カレント係数データが、符号化サブブロック191−4の先頭の係数データである場合、そのカレント係数データの符号化に用いる符号化テーブルのテーブル番号として、そのカレント係数データの右上に隣接する係数データの符号化に用いられた符号化テーブルのテーブル番号「12」と、そのカレント係数データの左下に隣接する係数データの符号化に用いられた符号化テーブルのテーブル番号「12」との平均値「12」が設定されている。
このように、図18の例の方が、図6Aや図6Bの場合よりも、TU190のより右下の係数データにより小さなテーブル番号の符号化テーブルを割り当て、より左上の係数データにより大きなテーブル番号の符号化テーブルを割り当てている。また、図18の例の方が、図6Aや図6Bの場合よりも、互いに位置が近い係数データ(特に、右上・左下の斜め方向に位置が近い係数データ)に割り当てられた符号化テーブル同士のテーブル番号の差が小さい。
つまり、各係数データ対してこのように符号化テーブルを割り当てることにより、図6Aや図6Bの場合よりも、符号化効率の低減を抑制することができる。
なお、この場合も、図12の例の場合と同様に、平均値の代わりに、中央値等、その他の演算の結果を用いるようにしてもよい。また、例えば、周辺の係数データの符号化に用いられた符号化テーブルのテーブル番号の最大値や最小値等、いずれかのテーブル番号を用いるようにしてもよい。
なお、この場合の符号化テーブル選択処理は、カレント係数データの周辺の係数データの位置が異なる以外は、図15のフローチャートを参照して説明した例と同様に実行される。
したがって、この場合も、符号化テーブル選択処理を実行することにより、符号化効率の低減を抑制することができる。
なお、以上のようなカレント係数データの周辺の係数データの位置は、任意であり、上述した例以外の位置であってもよい。また、カレント係数データに隣接していなくてもよい。また、以上のようなカレント係数データの周辺の係数データの数も任意である。例えば、利用するカレント係数データの周辺の係数データが4個以上であってもよい。例えば、上述した各例におけるカレント係数データの周辺の係数データを組み合わせてもよい。また、例えば、上述した各例におけるカレント係数データの周辺の係数データを、上述した各例以外の位置の係数データと組み合わせるようにしてもよい。
<2.第2の実施の形態>
<符号化テーブルの割り当て>
以上においては、符号化サブブロックの先頭の係数データの符号化に用いる符号化テーブルを、周辺の係数データの符号化に用いられた符号化テーブルに基づいて設定するように説明したが、これに限らず、符号化サブブロックの先頭以外の係数データの符号化に用いる符号化テーブルも、周辺の係数データの符号化に用いられた符号化テーブルに基づいて設定するようにしてもよい。
また、周辺の係数データの符号化に用いられた符号化テーブルとして、カレント係数データに隣接し、かつ、当該符号化サブブロックと異なる符号化サブブロックに属する係数データの符号化に用いられた符号化テーブルに基づいて、カレント係数データの符号化に用いる符号化テーブルを設定するようにしてもよい。
<テーブル選択部>
その場合のテーブル選択部152の主な構成例を、図19に示す。図19に示されるように、この場合のテーブル選択部152は、図10の場合と基本的に同様の構成を有するが、図10の選択部167の代わりに選択部211を有し、図10の選択部177の代わりに選択部212を有する。
選択部211には、変数cLastAbsLevel、カレント係数データの符号化に用いられる符号化テーブルのテーブル番号(curr_table)、「+1」が加算されたテーブル番号の他に、周辺係数データのテーブル番号(周辺Table No.)と、係数位置情報_0が供給される。
係数位置情報_0は、カレント係数データの、符号化サブブロック内の位置を示す情報である。
選択部211は、周辺係数データのテーブル番号(周辺Table No.)に基づいて次のカレント係数データの符号化に用いる符号化テーブルを設定するか、カレント係数データの符号化に用いられる符号化テーブルのテーブル番号(curr_table)若しくは「+1」が加算されたテーブル番号を次のカレント係数データの符号化に用いる符号化テーブルとして設定するかを、この係数位置情報_0に基づいて選択する。
そして、周辺係数データのテーブル番号(周辺Table No.)に基づいて次のカレント係数データの符号化に用いる符号化テーブルを設定すると判定された場合、選択部211は、供給される周辺係数データのテーブル番号(周辺Table No.)を選択し、その値に基づいて次のカレント係数データの符号化に用いる符号化テーブル(next_table_0)を設定する。
また、カレント係数データの符号化に用いられる符号化テーブルのテーブル番号(curr_table)か、若しくは「+1」が加算されたテーブル番号を、次のカレント係数データの符号化に用いる符号化テーブルとして設定すると判定された場合、選択部211は、変数cLastAbsLevelに基づいて、カレント係数データの符号化に用いられる符号化テーブルのテーブル番号(curr_table)と、演算部166より供給される「+1」が加算されたテーブル番号との内、いずれか一方を選択し、その値に基づいて次のカレント係数データの符号化に用いる符号化テーブル(next_table_0)を設定する。
選択部211は、設定した次の係数データの符号化に用いられる符号化テーブルのテーブル番号(next_table_0)を、TR符号化部153やテーブル指定情報バッファ154に供給するとともに、選択部173にも供給する。
同様に、選択部211には、変数cLastAbsLevel、カレント係数データの符号化に用いられる符号化テーブルのテーブル番号(curr_table)、「+1」が加算されたテーブル番号の他に、周辺係数データのテーブル番号(周辺Table No.)と、係数位置情報_1が供給される。
係数位置情報_1は、カレント係数データの、符号化サブブロック内の位置を示す情報である。
選択部211は、周辺係数データのテーブル番号(周辺Table No.)に基づいて次のカレント係数データの符号化に用いる符号化テーブルを設定するか、カレント係数データの符号化に用いられる符号化テーブルのテーブル番号(curr_table)若しくは「+1」が加算されたテーブル番号を次のカレント係数データの符号化に用いる符号化テーブルとして設定するかを、この係数位置情報_1に基づいて選択する。
そして、周辺係数データのテーブル番号(周辺Table No.)に基づいて次のカレント係数データの符号化に用いる符号化テーブルを設定すると判定された場合、選択部211は、供給される周辺係数データのテーブル番号(周辺Table No.)を選択し、その値に基づいて次のカレント係数データの符号化に用いる符号化テーブル(next_table_1)を設定する。
また、カレント係数データの符号化に用いられる符号化テーブルのテーブル番号(curr_table)か、若しくは「+1」が加算されたテーブル番号を、次のカレント係数データの符号化に用いる符号化テーブルとして設定すると判定された場合、選択部211は、変数cLastAbsLevelに基づいて、カレント係数データの符号化に用いられる符号化テーブルのテーブル番号(curr_table)と、演算部176より供給される「+1」が加算されたテーブル番号との内、いずれか一方を選択し、その値に基づいて次のカレント係数データの符号化に用いる符号化テーブル(next_table_1)を設定する。
選択部212は、設定した次の係数データの符号化に用いられる符号化テーブルのテーブル番号(next_table_1)を、TR符号化部153やテーブル指定情報バッファ154に供給する。
<符号化テーブルの設定方法>
この場合も、カレント係数データの周辺の係数データの位置や数は、任意である。以下においては、カレント係数データに右上・左下方向にななめに隣接する、当該符号化サブブロック以外の符号化サブブロックに属する係数データを、カレント係数データの周辺の係数データとする場合を例に説明する。
すなわち、カレント係数データ(C)の右上に隣接する係数データ(図11Aにおいて「E」が示される係数データ)と、カレント係数データ(C)の左下に隣接する係数データ(図11Aにおいて「F」が示される係数データ)とが、当該符号化サブブロック以外の符号化サブブロックに属する係数データである場合、その係数データが、カレント係数データの周辺の係数データとされる。
この場合、TU190の各係数データの符号化に用いる符号化テーブル(のテーブル番号)は、例えば、図18の例のように設定される。
利用可能なカレント係数データの周辺の係数データの数が0の場合、カレント係数データの符号化に用いられる符号化テーブルのテーブル番号として、初期値(例えば「0」)が設定される。
また、利用可能なカレント係数データの周辺の係数データの数が1つの場合、その係数データの符号化に用いられた符号化テーブルのテーブル番号が、カレント係数データの符号化に用いられる符号化テーブルのテーブル番号として設定される。
さらに、利用可能なカレント係数データの周辺の係数データの数が2つの場合、それらの係数データの符号化に用いられた符号化テーブルのテーブル番号の平均値が、カレント係数データの符号化に用いられる符号化テーブルのテーブル番号として設定される。
なお、この場合も、図12の例の場合と同様に、平均値の代わりに、中央値等、その他の演算の結果を用いるようにしてもよい。また、例えば、周辺の係数データの符号化に用いられた符号化テーブルのテーブル番号の最大値や最小値等、いずれかのテーブル番号を用いるようにしてもよい。
<符号化テーブル選択処理の流れ>
この場合の符号化テーブル選択処理の流れの例を、図21および図22のフローチャートを参照して説明する。
ステップS201において、周辺履歴演算部161は、変数StatCoeffE, StatCoeffF, prevStatCoeffをそれぞれ初期値(例えば「0」)に設定する。
変数StatCoeffEは、カレント係数データの右上に隣接する係数データの符号化に用いられた符号化テーブルのテーブル番号を示す。変数StatCoeffFは、カレント係数データの左下に隣接する係数データの符号化に用いられた符号化テーブルのテーブル番号を示す。
ステップS202の処理は、図15のステップS132の処理と同様に実行される。
ステップS203において、周辺履歴演算部161は、カレント係数データの周辺の係数データの有無により、変数initValueを設定する。
例えば、カレント係数データが、符号化サブブロック191−1(図11A)の先頭の係数データ(C)である場合、そのカレント係数データの右上に隣接する係数データ(E)も、左下に隣接する係数データ(F)も、当該TU190の外側に位置するので、変数StatCoeffEも変数StatCoeffFも、値が「invalid」(履歴がない)になる。
したがって、この場合、周辺履歴演算部161は、変数initValueに変数prevStatCoeffの値を設定する。このカレント係数データがTU190の先頭の係数データ(例えば、符号化サブブロック191−1の先頭の係数データ(C))である場合、変数prevStatCoeffの値は、ステップS201において設定された初期値(例えば「0」)である。
また、例えば、カレント係数データが、符号化サブブロック191−2(図11A)の先頭の係数データ(C)である場合、そのカレント係数データの右上に隣接する係数データ(E)は、当該TU190の外側に位置するので、変数StatCoeffEの値は「invalid」(履歴がない)になる。これに対して、カレント係数データの左下に隣接する係数データ(F)は、当該TU190内に存在するので、変数StatCoeffFの値は、そのカレント係数データの左下に隣接する係数データ(F)の符号化に用いられた符号化テーブルのテーブル番号になる。
したがって、この場合、周辺履歴演算部161は、変数initValueに変数StatCoeffFの値を設定する。図20の例の場合、変数initValueの値は、「7」に設定される。
また、例えば、カレント係数データが、符号化サブブロック191−3(図11A)の先頭の係数データ(C)である場合、そのカレント係数データの左下に隣接する係数データ(F)は、当該TU190の外側に位置するので、変数StatCoeffFの値は「invalid」(履歴がない)になる。これに対して、カレント係数データの右上に隣接する係数データ(E)は、当該TU190内に存在するので、変数StatCoeffEの値は、そのカレント係数データの右上に隣接する係数データ(E)の符号化に用いられた符号化テーブルのテーブル番号になる。
したがって、この場合、周辺履歴演算部161は、変数initValueに変数StatCoeffEの値を設定する。図20の例の場合、変数initValueの値は、「5」に設定される。
さらに、例えば、カレント係数データが、符号化サブブロック191−4(図11A)の先頭の係数データ(C)である場合、そのカレント係数データの右上に隣接する係数データ(E)も、左下に隣接する係数データ(F)も存在する。したがって、変数StatCoeffEの値は、そのカレント係数データの右上に隣接する係数データ(E)の符号化に用いられた符号化テーブルのテーブル番号になり、変数StatCoeffFの値は、そのカレント係数データの左下に隣接する係数データ(F)の符号化に用いられた符号化テーブルのテーブル番号になる。
したがって、この場合、周辺履歴演算部161は、変数initValueに変数StatCoeffEと変数StatCoeffFの平均値を設定する。図20の例の場合、変数StatCoeffEが「13」で変数StatCoeffFが「16」になるので、変数initValueの値は、「15」に設定される。
ステップS204およびステップS205の各処理は、図15のステップS134およびステップS135の各処理と同様に実行される。
ステップS205において、未処理の係数データが存在すると判定された場合、処理は、図22に進む。
図22のステップS211において、選択部211および選択部212は、カレント係数データの右上に隣接する係数データ(E)も、左下に隣接する係数データ(F)も、当該TU190の外側か当該符号化サブブロック191内に位置し、利用不可能であるか否かが判定される。
カレント係数データの右上に隣接する係数データ(E)と、左下に隣接する係数データ(F)との内、少なくともいずれか一方が、当該TU190かつ当該符号化サブブロック191以外の符号化サブブロック191内に位置し、利用可能であると判定された場合、処理はステップS212に進む。
ステップS212において、周辺履歴演算部161は、カレント係数データの周辺の係数データの有無により、変数cRiceParamを設定する。
例えば、カレント係数データの右上に隣接する係数データ(E)が当該TU190の外側か若しくは当該符号化サブブロック191内に位置し、かつ、カレント係数データの左下に隣接する係数データ(F)が当該TU190内の当該符号化サブブロック191以外の符号化サブブロック191に属する場合、選択部211および選択部212は、変数cRiceParamに変数StatCoeffF(すなわち、カレント係数データの左下に隣接する係数データ(F)の符号化に用いられた符号化テーブルのテーブル番号)を設定する。
また、例えば、カレント係数データの左下に隣接する係数データ(F)が当該TU190の外側か若しくは当該符号化サブブロック191内に位置し、かつ、カレント係数データの右上に隣接する係数データ(E)が当該TU190内の当該符号化サブブロック191以外の符号化サブブロック191に属する場合、選択部211および選択部212は、変数cRiceParamに変数StatCoeffE(すなわち、カレント係数データの右上に隣接する係数データ(E)の符号化に用いられた符号化テーブルのテーブル番号)を設定する。
さらに、例えば、カレント係数データの右上に隣接する係数データ(E)と、カレント係数データの左下に隣接する係数データ(F)との両方が、当該TU190TU190内の当該符号化サブブロック191以外の符号化サブブロック191に属する場合、選択部211および選択部212は、変数cRiceParamに、変数StatCoeffE(すなわち、カレント係数データの右上に隣接する係数データ(E)の符号化に用いられた符号化テーブルのテーブル番号)と、変数StatCoeffF(すなわち、カレント係数データの左下に隣接する係数データ(F)の符号化に用いられた符号化テーブルのテーブル番号)との平均値を設定する。
ステップS212の処理が終了すると、処理は図21のステップS205に戻り、それ以降の処理が繰り返される。
また、ステップS211において、選択部211および選択部212は、カレント係数データの右上に隣接する係数データ(E)も、左下に隣接する係数データ(F)も、当該TU190の外側か当該符号化サブブロック191内に位置し、利用不可能であると判定された場合、処理はステップS213に進む。
ステップS213およびステップS214の各処理は、図15のステップS136およびステップS137の各処理と同様に実行される。
ステップS214の処理が終了すると、処理は図21のステップS205に戻る。
図21のステップS205において、当該符号化サブブロック191の全ての係数データを処理したと判定された場合、処理はステップS206に進む。
ステップS206の処理は、図15のステップS138の処理と同様に実行される。
ステップS206において、当該TU190内の全ての符号化サブブロックを処理したと判定された場合、符号化テーブル選択処理が終了し、処理は図14に戻る。
以上のように符号化テーブル選択処理を実行することにより、符号化サブブロック191の先頭以外の係数データについても、符号化効率の低減を抑制することができる。
本技術は、画像データを符号化するあらゆる画像処理装置に適用することができる。
また、本技術は、例えば、画像情報を、MPEG、H.26x等の様に、離散コサイン変換等の直交変換と動き補償によって圧縮し、そのビットストリームを、衛星放送、ケーブルテレビジョン、インターネット、または携帯電話機などのネットワークメディアを介して送信する際に用いられる画像処理装置に適用することができる。また、本技術は、光、磁気ディスク、およびフラッシュメモリのような記憶メディア上で処理する際に用いられる画像処理装置に適用することができる。
<3.第3の実施の形態>
<多視点画像符号化・復号システムへの適用>
上述した一連の処理は、多視点画像符号化・復号システムに適用することができる。図23は、多視点画像符号化方式の一例を示す。
図23に示されるように、多視点画像は、複数の視点(ビュー(view))の画像を含む。この多視点画像の複数のビューは、他のビューの情報を利用せずに自身のビューの画像のみを用いて符号化・復号を行うベースビューと、他のビューの情報を利用して符号化・復号を行うノンベースビューとによりなる。ノンベースビューの符号化・復号は、ベースビューの情報を利用するようにしても良いし、他のノンベースビューの情報を利用するようにしてもよい。
図23の例のような多視点画像を符号化・復号する場合、多視点画像は、視点毎に符号化される。そして、そのようにして得られた符号化データを復号する場合、各視点の符号化データは、それぞれ(すなわち視点毎に)復号される。このような各視点の符号化・復号に対して、以上の各実施の形態において説明した方法を適用してもよい。このようにすることにより、符号化効率の低減を抑制することができる。つまり、多視点画像の場合も同様に、符号化効率の低減を抑制することができる。
<多視点画像符号化・復号システム>
図24は、上述した多視点画像符号化・復号を行う多視点画像符号化・復号システムの、多視点画像符号化装置を示す図である。図24に示されるように、多視点画像符号化装置600は、符号化部601、符号化部602、および多重化部603を有する。
符号化部601は、ベースビュー画像を符号化し、ベースビュー画像符号化ストリームを生成する。符号化部602は、ノンベースビュー画像を符号化し、ノンベースビュー画像符号化ストリームを生成する。多重化部603は、符号化部601において生成されたベースビュー画像符号化ストリームと、符号化部602において生成されたノンベースビュー画像符号化ストリームとを多重化し、多視点画像符号化ストリームを生成する。
図25は、上述した多視点画像復号を行う多視点画像復号装置を示す図である。図25に示されるように、多視点画像復号装置610は、逆多重化部611、復号部612、および復号部613を有する。
逆多重化部611は、ベースビュー画像符号化ストリームとノンベースビュー画像符号化ストリームとが多重化された多視点画像符号化ストリームを逆多重化し、ベースビュー画像符号化ストリームと、ノンベースビュー画像符号化ストリームとを抽出する。復号部612は、逆多重化部611により抽出されたベースビュー画像符号化ストリームを復号し、ベースビュー画像を得る。復号部613は、逆多重化部611により抽出されたノンベースビュー画像符号化ストリームを復号し、ノンベースビュー画像を得る。
例えば、このような多視点画像符号化・復号システムにおいて、多視点画像符号化装置600の符号化部601および符号化部602として、以上の各実施の形態において説明した画像符号化装置100を適用してもよい。このようにすることにより、多視点画像の符号化においても、以上の各実施の形態において説明した方法を適用することができる。すなわち、符号化効率の低減を抑制することができる。
<4.第4の実施の形態>
<階層画像符号化・復号システムへの適用>
また、上述した一連の処理は、階層画像符号化(スケーラブル符号化)・復号システムに適用することができる。図26は、階層画像符号化方式の一例を示す。
階層画像符号化(スケーラブル符号化)は、画像データを、所定のパラメータについてスケーラビリティ(scalability)機能を有するように、画像を複数レイヤ化(階層化)し、レイヤ毎に符号化するものである。階層画像復号は、その階層画像符号化(スケーラブル復号)は、その階層画像符号化に対応する復号である。
図26に示されるように、画像の階層化においては、スケーラビリティ機能を有する所定のパラメータを基準として1の画像が複数の画像(レイヤ)に分割される。つまり、階層化された画像(階層画像)は、その所定のパラメータの値が互いに異なる複数の階層(レイヤ)の画像を含む。この階層画像の複数のレイヤは、他のレイヤの画像を利用せずに自身のレイヤの画像のみを用いて符号化・復号を行うベースレイヤと、他のレイヤの画像を利用して符号化・復号を行うノンベースレイヤ(エンハンスメントレイヤとも称する)とによりなる。ノンベースレイヤは、ベースレイヤの画像を利用するようにしても良いし、他のノンベースレイヤの画像を利用するようにしてもよい。
一般的に、ノンベースレイヤは、冗長性が低減されるように、自身の画像と、他のレイヤの画像との差分画像のデータ(差分データ)により構成される。例えば、1の画像をベースレイヤとノンベースレイヤ(エンハンスメントレイヤとも称する)に2階層化した場合、ベースレイヤのデータのみで元の画像よりも低品質な画像が得られ、ベースレイヤのデータとノンベースレイヤのデータを合成することで、元の画像(すなわち高品質な画像)が得られる。
このように画像を階層化することにより、状況に応じて多様な品質の画像を容易に得ることができる。例えば携帯電話のような、処理能力の低い端末に対しては、ベースレイヤ(base layer)のみの画像圧縮情報を伝送し、空間時間解像度の低い、或いは、画質の良くない動画像を再生し、テレビやパーソナルコンピュータのような、処理能力の高い端末に対しては、ベースレイヤ(base layer)に加えて、エンハンスメントレイヤ(enhancement layer)の画像圧縮情報を伝送し、空間時間解像度の高い、或いは、画質の高い動画像を再生するといったように、トランスコード処理を行うことなく、端末やネットワークの能力に応じた画像圧縮情報を、サーバから送信することが可能となる。
図26の例のような階層画像を符号化・復号する場合、階層画像は、レイヤ毎に符号化される。そして、そのようにして得られた符号化データを復号する場合、各レイヤの符号化データは、それぞれ(すなわちレイヤ毎に)復号される。このような各レイヤの符号化・復号に対して、以上の各実施の形態において説明した方法を適用してもよい。このようにすることにより、符号化効率の低減を抑制することができる。つまり、階層画像の場合も同様に、符号化効率の低減を抑制することができる。
<スケーラブルなパラメータ>
このような階層画像符号化・階層画像復号(スケーラブル符号化・スケーラブル復号)において、スケーラビリティ(scalability)機能を有するパラメータは、任意である。例えば、空間解像度をそのパラメータとしてもよい(spatial scalability)。このスペーシャルスケーラビリティ(spatial scalability)の場合、レイヤ毎に画像の解像度が異なる。
また、このようなスケーラビリティ性を持たせるパラメータとして、他には、例えば、時間解像度を適用しても良い(temporal scalability)。このテンポラルスケーラビリティ(temporal scalability)の場合、レイヤ毎にフレームレートが異なる。
さらに、このようなスケーラビリティ性を持たせるパラメータとして、例えば、信号雑音比(SNR(Signal to Noise ratio))を適用しても良い(SNR scalability)。このSNRスケーラビリティ(SNR scalability)の場合、レイヤ毎にSN比が異なる。
スケーラビリティ性を持たせるパラメータは、上述した例以外であっても、もちろんよい。例えば、ベースレイヤ(base layer)が8ビット(bit)画像よりなり、これにエンハンスメントレイヤ(enhancement layer)を加えることにより、10ビット(bit)画像が得られるビット深度スケーラビリティ(bit-depth scalability)がある。
また、ベースレイヤ(base layer)が4:2:0フォーマットのコンポーネント画像よりなり、これにエンハンスメントレイヤ(enhancement layer)を加えることにより、4:2:2フォーマットのコンポーネント画像が得られるクロマスケーラビリティ(chroma scalability)がある。
<階層画像符号化・復号システム>
図27は、上述した階層画像符号化・復号を行う階層画像符号化・復号システムの、階層画像符号化装置を示す図である。図27に示されるように、階層画像符号化装置620は、符号化部621、符号化部622、および多重化部623を有する。
符号化部621は、ベースレイヤ画像を符号化し、ベースレイヤ画像符号化ストリームを生成する。符号化部622は、ノンベースレイヤ画像を符号化し、ノンベースレイヤ画像符号化ストリームを生成する。多重化部623は、符号化部621において生成されたベースレイヤ画像符号化ストリームと、符号化部622において生成されたノンベースレイヤ画像符号化ストリームとを多重化し、階層画像符号化ストリームを生成する。
図28は、上述した階層画像復号を行う階層画像復号装置を示す図である。図28に示されるように、階層画像復号装置630は、逆多重化部631、復号部632、および復号部633を有する。
逆多重化部631は、ベースレイヤ画像符号化ストリームとノンベースレイヤ画像符号化ストリームとが多重化された階層画像符号化ストリームを逆多重化し、ベースレイヤ画像符号化ストリームと、ノンベースレイヤ画像符号化ストリームとを抽出する。復号部632は、逆多重化部631により抽出されたベースレイヤ画像符号化ストリームを復号し、ベースレイヤ画像を得る。復号部633は、逆多重化部631により抽出されたノンベースレイヤ画像符号化ストリームを復号し、ノンベースレイヤ画像を得る。
例えば、このような階層画像符号化・復号システムにおいて、階層画像符号化装置620の符号化部621および符号化部622として、以上の各実施の形態において説明した画像符号化装置100を適用してもよい。このようにすることにより、階層画像の符号化においても、以上の各実施の形態において説明した方法を適用することができる。すなわち、符号化効率の低減を抑制することができる。
<5.第5の実施の形態>
<コンピュータ>
上述した一連の処理は、ハードウエアにより実行させることもできるし、ソフトウエアにより実行させることもできる。一連の処理をソフトウエアにより実行する場合には、そのソフトウエアを構成するプログラムが、コンピュータにインストールされる。ここでコンピュータには、専用のハードウエアに組み込まれているコンピュータや、各種のプログラムをインストールすることで、各種の機能を実行することが可能な、例えば汎用のパーソナルコンピュータ等が含まれる。
図29は、上述した一連の処理をプログラムにより実行するコンピュータのハードウエアの構成例を示すブロック図である。
図29に示されるコンピュータ800において、CPU(Central Processing Unit)801、ROM(Read Only Memory)802、RAM(Random Access Memory)803は、バス804を介して相互に接続されている。
バス804にはまた、入出力インタフェース810も接続されている。入出力インタフェース810には、入力部811、出力部812、記憶部813、通信部814、およびドライブ815が接続されている。
入力部811は、例えば、キーボード、マウス、マイクロホン、タッチパネル、入力端子などよりなる。出力部812は、例えば、ディスプレイ、スピーカ、出力端子などよりなる。記憶部813は、例えば、ハードディスク、RAMディスク、不揮発性のメモリなどよりなる。通信部814は、例えば、ネットワークインタフェースよりなる。ドライブ815は、磁気ディスク、光ディスク、光磁気ディスク、または半導体メモリなどのリムーバブルメディア821を駆動する。
以上のように構成されるコンピュータでは、CPU801が、例えば、記憶部813に記憶されているプログラムを、入出力インタフェース810およびバス804を介して、RAM803にロードして実行することにより、上述した一連の処理が行われる。RAM803にはまた、CPU801が各種の処理を実行する上において必要なデータなども適宜記憶される。
コンピュータ(CPU801)が実行するプログラムは、例えば、パッケージメディア等としてのリムーバブルメディア821に記録して適用することができる。その場合、プログラムは、リムーバブルメディア821をドライブ815に装着することにより、入出力インタフェース810を介して、記憶部813にインストールすることができる。
また、このプログラムは、ローカルエリアネットワーク、インターネット、デジタル衛星放送といった、有線または無線の伝送媒体を介して提供することもできる。その場合、プログラムは、通信部814で受信し、記憶部813にインストールすることができる。
その他、このプログラムは、ROM802や記憶部813に、あらかじめインストールしておくこともできる。
なお、コンピュータが実行するプログラムは、本明細書で説明する順序に沿って時系列に処理が行われるプログラムであっても良いし、並列に、あるいは呼び出しが行われたとき等の必要なタイミングで処理が行われるプログラムであっても良い。
また、本明細書において、記録媒体に記録されるプログラムを記述するステップは、記載された順序に沿って時系列的に行われる処理はもちろん、必ずしも時系列的に処理されなくとも、並列的あるいは個別に実行される処理をも含むものである。
また、本明細書において、システムとは、複数の構成要素(装置、モジュール(部品)等)の集合を意味し、全ての構成要素が同一筐体中にあるか否かは問わない。したがって、別個の筐体に収納され、ネットワークを介して接続されている複数の装置、及び、1つの筐体の中に複数のモジュールが収納されている1つの装置は、いずれも、システムである。
また、以上において、1つの装置(または処理部)として説明した構成を分割し、複数の装置(または処理部)として構成するようにしてもよい。逆に、以上において複数の装置(または処理部)として説明した構成をまとめて1つの装置(または処理部)として構成されるようにしてもよい。また、各装置(または各処理部)の構成に上述した以外の構成を付加するようにしてももちろんよい。さらに、システム全体としての構成や動作が実質的に同じであれば、ある装置(または処理部)の構成の一部を他の装置(または他の処理部)の構成に含めるようにしてもよい。
以上、添付図面を参照しながら本開示の好適な実施形態について詳細に説明したが、本開示の技術的範囲はかかる例に限定されない。本開示の技術分野における通常の知識を有する者であれば、特許請求の範囲に記載された技術的思想の範疇内において、各種の変更例または修正例に想到し得ることは明らかであり、これらについても、当然に本開示の技術的範囲に属するものと了解される。
例えば、本技術は、1つの機能を、ネットワークを介して複数の装置で分担、共同して処理するクラウドコンピューティングの構成をとることができる。
また、上述のフローチャートで説明した各ステップは、1つの装置で実行する他、複数の装置で分担して実行することができる。
さらに、1つのステップに複数の処理が含まれる場合には、その1つのステップに含まれる複数の処理は、1つの装置で実行する他、複数の装置で分担して実行することができる。
上述した実施形態に係る画像符号化装置100は、例えば、衛星放送、ケーブルTVなどの有線放送、インターネット上での配信、及びセルラー通信による端末への配信などにおける送信機若しくは受信機、光ディスク、磁気ディスク及びフラッシュメモリなどの媒体に画像を記録する記録装置、又は、これら記憶媒体から画像を再生する再生装置などの様々な電子機器に応用され得る。以下、4つの応用例について説明する。
<6.第6の実施の形態>
<第1の応用例:テレビジョン受像機>
図30は、上述した実施形態を適用したテレビジョン装置の概略的な構成の一例を示している。テレビジョン装置900は、アンテナ901、チューナ902、デマルチプレクサ903、デコーダ904、映像信号処理部905、表示部906、音声信号処理部907、スピーカ908、外部インタフェース(I/F)部909、制御部910、ユーザインタフェース(I/F)部911、及びバス912を備える。
チューナ902は、アンテナ901を介して受信される放送信号から所望のチャンネルの信号を抽出し、抽出した信号を復調する。そして、チューナ902は、復調により得られた符号化ビットストリームをデマルチプレクサ903へ出力する。即ち、チューナ902は、画像が符号化されている符号化ストリームを受信する、テレビジョン装置900における伝送部としての役割を有する。
デマルチプレクサ903は、符号化ビットストリームから視聴対象の番組の映像ストリーム及び音声ストリームを分離し、分離した各ストリームをデコーダ904へ出力する。また、デマルチプレクサ903は、符号化ビットストリームからEPG(Electronic Program Guide)などの補助的なデータを抽出し、抽出したデータを制御部910に供給する。なお、デマルチプレクサ903は、符号化ビットストリームがスクランブルされている場合には、デスクランブルを行ってもよい。
デコーダ904は、デマルチプレクサ903から入力される映像ストリーム及び音声ストリームを復号する。そして、デコーダ904は、復号処理により生成される映像データを映像信号処理部905へ出力する。また、デコーダ904は、復号処理により生成される音声データを音声信号処理部907へ出力する。
映像信号処理部905は、デコーダ904から入力される映像データを再生し、表示部906に映像を表示させる。また、映像信号処理部905は、ネットワークを介して供給されるアプリケーション画面を表示部906に表示させてもよい。また、映像信号処理部905は、映像データについて、設定に応じて、例えばノイズ除去などの追加的な処理を行ってもよい。さらに、映像信号処理部905は、例えばメニュー、ボタン又はカーソルなどのGUI(Graphical User Interface)の画像を生成し、生成した画像を出力画像に重畳してもよい。
表示部906は、映像信号処理部905から供給される駆動信号により駆動され、表示デバイス(例えば、液晶ディスプレイ、プラズマディスプレイ又はOELD(Organic ElectroLuminescence Display)(有機ELディスプレイ)など)の映像面上に映像又は画像を表示する。
音声信号処理部907は、デコーダ904から入力される音声データについてD/A変換及び増幅などの再生処理を行い、スピーカ908から音声を出力させる。また、音声信号処理部907は、音声データについてノイズ除去などの追加的な処理を行ってもよい。
外部インタフェース部909は、テレビジョン装置900と外部機器又はネットワークとを接続するためのインタフェースである。例えば、外部インタフェース部909を介して受信される映像ストリーム又は音声ストリームが、デコーダ904により復号されてもよい。即ち、外部インタフェース部909もまた、画像が符号化されている符号化ストリームを受信する、テレビジョン装置900における伝送部としての役割を有する。
制御部910は、CPUなどのプロセッサ、並びにRAM及びROMなどのメモリを有する。メモリは、CPUにより実行されるプログラム、プログラムデータ、EPGデータ、及びネットワークを介して取得されるデータなどを記憶する。メモリにより記憶されるプログラムは、例えば、テレビジョン装置900の起動時にCPUにより読み込まれ、実行される。CPUは、プログラムを実行することにより、例えばユーザインタフェース部911から入力される操作信号に応じて、テレビジョン装置900の動作を制御する。
ユーザインタフェース部911は、制御部910と接続される。ユーザインタフェース部911は、例えば、ユーザがテレビジョン装置900を操作するためのボタン及びスイッチ、並びに遠隔制御信号の受信部などを有する。ユーザインタフェース部911は、これら構成要素を介してユーザによる操作を検出して操作信号を生成し、生成した操作信号を制御部910へ出力する。
バス912は、チューナ902、デマルチプレクサ903、デコーダ904、映像信号処理部905、音声信号処理部907、外部インタフェース部909及び制御部910を相互に接続する。
このように構成されたテレビジョン装置900において、映像信号処理部905が、例えば、デコーダ904から供給される画像データを符号化し、得られた符号化データを、外部インタフェース部909を介してテレビジョン装置900の外部に出力させることができるようにしてもよい。そして、その映像信号処理部905が、上述した画像符号化装置100の機能を有するようにしてもよい。つまり、映像信号処理部905が、デコーダ904から供給される画像データを以上の各実施の形態において説明した方法で符号化するようにしてもよい。このようにすることにより、テレビジョン装置900は、出力する符号化データの符号化効率の低減を抑制することができる。
<第2の応用例:携帯電話機>
図31は、上述した実施形態を適用した携帯電話機の概略的な構成の一例を示している。携帯電話機920は、アンテナ921、通信部922、音声コーデック923、スピーカ924、マイクロホン925、カメラ部926、画像処理部927、多重分離部928、記録再生部929、表示部930、制御部931、操作部932、及びバス933を備える。
アンテナ921は、通信部922に接続される。スピーカ924及びマイクロホン925は、音声コーデック923に接続される。操作部932は、制御部931に接続される。バス933は、通信部922、音声コーデック923、カメラ部926、画像処理部927、多重分離部928、記録再生部929、表示部930、及び制御部931を相互に接続する。
携帯電話機920は、音声通話モード、データ通信モード、撮影モード及びテレビ電話モードを含む様々な動作モードで、音声信号の送受信、電子メール又は画像データの送受信、画像の撮像、及びデータの記録などの動作を行う。
音声通話モードにおいて、マイクロホン925により生成されるアナログ音声信号は、音声コーデック923に供給される。音声コーデック923は、アナログ音声信号を音声データへ変換し、変換された音声データをA/D変換し圧縮する。そして、音声コーデック923は、圧縮後の音声データを通信部922へ出力する。通信部922は、音声データを符号化及び変調し、送信信号を生成する。そして、通信部922は、生成した送信信号を、アンテナ921を介して基地局(図示せず)へ送信する。また、通信部922は、アンテナ921を介して受信される無線信号を増幅し及び周波数変換し、受信信号を取得する。そして、通信部922は、受信信号を復調及び復号して音声データを生成し、生成した音声データを音声コーデック923へ出力する。音声コーデック923は、音声データを伸張し及びD/A変換し、アナログ音声信号を生成する。そして、音声コーデック923は、生成した音声信号をスピーカ924に供給して音声を出力させる。
また、データ通信モードにおいて、例えば、制御部931は、操作部932を介するユーザによる操作に応じて、電子メールを構成する文字データを生成する。また、制御部931は、文字を表示部930に表示させる。また、制御部931は、操作部932を介するユーザからの送信指示に応じて電子メールデータを生成し、生成した電子メールデータを通信部922へ出力する。通信部922は、電子メールデータを符号化及び変調し、送信信号を生成する。そして、通信部922は、生成した送信信号を、アンテナ921を介して基地局(図示せず)へ送信する。また、通信部922は、アンテナ921を介して受信される無線信号を増幅し及び周波数変換し、受信信号を取得する。そして、通信部922は、受信信号を復調及び復号して電子メールデータを復元し、復元した電子メールデータを制御部931へ出力する。制御部931は、表示部930に電子メールの内容を表示させると共に、電子メールデータを記録再生部929に供給し、その記憶媒体に書き込ませる。
記録再生部929は、読み書き可能な任意の記憶媒体を有する。例えば、記憶媒体は、RAM又はフラッシュメモリなどの内蔵型の記憶媒体であってもよく、ハードディスク、磁気ディスク、光磁気ディスク、光ディスク、USB(Universal Serial Bus)メモリ、又はメモリカードなどの外部装着型の記憶媒体であってもよい。
また、撮影モードにおいて、例えば、カメラ部926は、被写体を撮像して画像データを生成し、生成した画像データを画像処理部927へ出力する。画像処理部927は、カメラ部926から入力される画像データを符号化し、符号化ストリームを記録再生部929に供給し、その記憶媒体に書き込ませる。
さらに、画像表示モードにおいて、記録再生部929は、記憶媒体に記録されている符号化ストリームを読み出して画像処理部927へ出力する。画像処理部927は、記録再生部929から入力される符号化ストリームを復号し、画像データを表示部930に供給し、その画像を表示させる。
また、テレビ電話モードにおいて、例えば、多重分離部928は、画像処理部927により符号化された映像ストリームと、音声コーデック923から入力される音声ストリームとを多重化し、多重化したストリームを通信部922へ出力する。通信部922は、ストリームを符号化及び変調し、送信信号を生成する。そして、通信部922は、生成した送信信号を、アンテナ921を介して基地局(図示せず)へ送信する。また、通信部922は、アンテナ921を介して受信される無線信号を増幅し及び周波数変換し、受信信号を取得する。これら送信信号及び受信信号には、符号化ビットストリームが含まれ得る。そして、通信部922は、受信信号を復調及び復号してストリームを復元し、復元したストリームを多重分離部928へ出力する。多重分離部928は、入力されるストリームから映像ストリーム及び音声ストリームを分離し、映像ストリームを画像処理部927、音声ストリームを音声コーデック923へ出力する。画像処理部927は、映像ストリームを復号し、映像データを生成する。映像データは、表示部930に供給され、表示部930により一連の画像が表示される。音声コーデック923は、音声ストリームを伸張し及びD/A変換し、アナログ音声信号を生成する。そして、音声コーデック923は、生成した音声信号をスピーカ924に供給して音声を出力させる。
このように構成された携帯電話機920において、例えば画像処理部927が、画像符号化装置100の機能を有するようにしてもよい。つまり、画像処理部927が、以上の各実施の形態において説明した方法により、画像データを符号化するようにしてもよい。このようにすることにより、携帯電話機920は、符号化効率の低減を抑制することができる。
<第3の応用例:記録再生装置>
図32は、上述した実施形態を適用した記録再生装置の概略的な構成の一例を示している。記録再生装置940は、例えば、受信した放送番組の音声データ及び映像データを符号化して記録媒体に記録する。また、記録再生装置940は、例えば、他の装置から取得される音声データ及び映像データを符号化して記録媒体に記録してもよい。また、記録再生装置940は、例えば、ユーザの指示に応じて、記録媒体に記録されているデータをモニタ及びスピーカ上で再生する。このとき、記録再生装置940は、音声データおよび映像データを復号する。
記録再生装置940は、チューナ941、外部インタフェース(I/F)部942、エンコーダ943、HDD(Hard Disk Drive)944、ディスクドライブ945、セレクタ946、デコーダ947、OSD(On-Screen Display)948、制御部949、およびユーザインタフェース(I/F)部950を備える。
チューナ941は、アンテナ(図示せず)を介して受信される放送信号から所望のチャンネルの信号を抽出し、抽出した信号を復調する。そして、チューナ941は、復調により得られた符号化ビットストリームをセレクタ946へ出力する。即ち、チューナ941は、記録再生装置940における伝送部としての役割を有する。
外部インタフェース部942は、記録再生装置940と外部機器又はネットワークとを接続するためのインタフェースである。外部インタフェース部942は、例えば、IEEE(Institute of Electrical and Electronic Engineers)1394インタフェース、ネットワークインタフェース、USBインタフェース、又はフラッシュメモリインタフェースなどであってよい。例えば、外部インタフェース部942を介して受信される映像データおよび音声データは、エンコーダ943へ入力される。即ち、外部インタフェース部942は、記録再生装置940における伝送部としての役割を有する。
エンコーダ943は、外部インタフェース部942から入力される映像データおよび音声データが符号化されていない場合に、映像データおよび音声データを符号化する。そして、エンコーダ943は、符号化ビットストリームをセレクタ946へ出力する。
HDD944は、映像および音声などのコンテンツデータが圧縮された符号化ビットストリーム、各種プログラムおよびその他のデータを内部のハードディスクに記録する。また、HDD944は、映像および音声の再生時に、これらデータをハードディスクから読み出す。
ディスクドライブ945は、装着されている記録媒体へのデータの記録および読み出しを行う。ディスクドライブ945に装着される記録媒体は、例えばDVD(Digital Versatile Disc)ディスク(DVD-Video、DVD-RAM(DVD - Random Access Memory)、DVD-R(DVD - Recordable)、DVD-RW(DVD - Rewritable)、DVD+R(DVD + Recordable)、DVD+RW(DVD + Rewritable)等)又はBlu-ray(登録商標)ディスクなどであってよい。
セレクタ946は、映像および音声の記録時には、チューナ941又はエンコーダ943から入力される符号化ビットストリームを選択し、選択した符号化ビットストリームをHDD944又はディスクドライブ945へ出力する。また、セレクタ946は、映像及び音声の再生時には、HDD944又はディスクドライブ945から入力される符号化ビットストリームをデコーダ947へ出力する。
デコーダ947は、符号化ビットストリームを復号し、映像データ及び音声データを生成する。そして、デコーダ947は、生成した映像データをOSD948へ出力する。また、デコーダ947は、生成した音声データを外部のスピーカへ出力する。
OSD948は、デコーダ947から入力される映像データを再生し、映像を表示する。また、OSD948は、表示する映像に、例えばメニュー、ボタン又はカーソルなどのGUIの画像を重畳してもよい。
制御部949は、CPUなどのプロセッサ、並びにRAM及びROMなどのメモリを有する。メモリは、CPUにより実行されるプログラム、及びプログラムデータなどを記憶する。メモリにより記憶されるプログラムは、例えば、記録再生装置940の起動時にCPUにより読み込まれ、実行される。CPUは、プログラムを実行することにより、例えばユーザインタフェース部950から入力される操作信号に応じて、記録再生装置940の動作を制御する。
ユーザインタフェース部950は、制御部949と接続される。ユーザインタフェース部950は、例えば、ユーザが記録再生装置940を操作するためのボタンおよびスイッチ、並びに遠隔制御信号の受信部などを有する。ユーザインタフェース部950は、これら構成要素を介してユーザによる操作を検出して操作信号を生成し、生成した操作信号を制御部949へ出力する。
このように構成された記録再生装置940において、例えばエンコーダ943が、画像符号化装置100の機能を有するようにしてもよい。つまり、エンコーダ943が、以上の各実施の形態において説明方法により、画像データを符号化するようにしてもよい。このようにすることにより、記録再生装置940は、符号化効率の低減を抑制することができる。
<第4の応用例:撮像装置>
図33は、上述した実施形態を適用した撮像装置の概略的な構成の一例を示している。撮像装置960は、被写体を撮像して画像を生成し、画像データを符号化して記録媒体に記録する。
撮像装置960は、光学ブロック961、撮像部962、信号処理部963、画像処理部964、表示部965、外部インタフェース(I/F)部966、メモリ部967、メディアドライブ968、OSD969、制御部970、ユーザインタフェース(I/F)部971、およびバス972を備える。
光学ブロック961は、撮像部962に接続される。撮像部962は、信号処理部963に接続される。表示部965は、画像処理部964に接続される。ユーザインタフェース部971は、制御部970に接続される。バス972は、画像処理部964、外部インタフェース部966、メモリ部967、メディアドライブ968、OSD969、および制御部970を相互に接続する。
光学ブロック961は、フォーカスレンズ及び絞り機構などを有する。光学ブロック961は、被写体の光学像を撮像部962の撮像面に結像させる。撮像部962は、CCD(Charge Coupled Device)又はCMOS(Complementary Metal Oxide Semiconductor)などのイメージセンサを有し、撮像面に結像した光学像を光電変換によって電気信号としての画像信号に変換する。そして、撮像部962は、画像信号を信号処理部963へ出力する。
信号処理部963は、撮像部962から入力される画像信号に対してニー補正、ガンマ補正、色補正などの種々のカメラ信号処理を行う。信号処理部963は、カメラ信号処理後の画像データを画像処理部964へ出力する。
画像処理部964は、信号処理部963から入力される画像データを符号化し、符号化データを生成する。そして、画像処理部964は、生成した符号化データを外部インタフェース部966またはメディアドライブ968へ出力する。また、画像処理部964は、外部インタフェース部966またはメディアドライブ968から入力される符号化データを復号し、画像データを生成する。そして、画像処理部964は、生成した画像データを表示部965へ出力する。また、画像処理部964は、信号処理部963から入力される画像データを表示部965へ出力して画像を表示させてもよい。また、画像処理部964は、OSD969から取得される表示用データを、表示部965へ出力する画像に重畳してもよい。
OSD969は、例えばメニュー、ボタン又はカーソルなどのGUIの画像を生成して、生成した画像を画像処理部964へ出力する。
外部インタフェース部966は、例えばUSB入出力端子として構成される。外部インタフェース部966は、例えば、画像の印刷時に、撮像装置960とプリンタとを接続する。また、外部インタフェース部966には、必要に応じてドライブが接続される。ドライブには、例えば、磁気ディスク又は光ディスクなどのリムーバブルメディアが装着され、リムーバブルメディアから読み出されるプログラムが、撮像装置960にインストールされ得る。さらに、外部インタフェース部966は、LAN又はインターネットなどのネットワークに接続されるネットワークインタフェースとして構成されてもよい。即ち、外部インタフェース部966は、撮像装置960における伝送部としての役割を有する。
メディアドライブ968に装着される記録媒体は、例えば、磁気ディスク、光磁気ディスク、光ディスク、又は半導体メモリなどの、読み書き可能な任意のリムーバブルメディアであってよい。また、メディアドライブ968に記録媒体が固定的に装着され、例えば、内蔵型ハードディスクドライブ又はSSD(Solid State Drive)のような非可搬性の記憶部が構成されてもよい。
制御部970は、CPUなどのプロセッサ、並びにRAM及びROMなどのメモリを有する。メモリは、CPUにより実行されるプログラム、及びプログラムデータなどを記憶する。メモリにより記憶されるプログラムは、例えば、撮像装置960の起動時にCPUにより読み込まれ、実行される。CPUは、プログラムを実行することにより、例えばユーザインタフェース部971から入力される操作信号に応じて、撮像装置960の動作を制御する。
ユーザインタフェース部971は、制御部970と接続される。ユーザインタフェース部971は、例えば、ユーザが撮像装置960を操作するためのボタン及びスイッチなどを有する。ユーザインタフェース部971は、これら構成要素を介してユーザによる操作を検出して操作信号を生成し、生成した操作信号を制御部970へ出力する。
このように構成された撮像装置960において、例えば画像処理部964が、画像符号化装置100の機能を有するようにしてもよい。つまり、画像処理部964が、以上の各実施の形態において説明した方法により、画像データを符号化するようにしてもよい。このようにすることにより、撮像装置960は、符号化効率の低減を抑制することができる。
なお、本技術は、予め用意された解像度等が互いに異なる複数の符号化データの中から適切なものをセグメント単位で選択して使用する、例えばMPEG DASH等のようなHTTPストリーミングにも適用することができる。つまり、このような複数の符号化データ間で、符号化や復号に関する情報を共有することもできる。
<7.第7の実施の形態>
<実施のその他の例>
以上において本技術を適用する装置やシステム等の例を説明したが、本技術は、これに限らず、このような装置またはシステムを構成する装置に搭載するあらゆる構成、例えば、システムLSI(Large Scale Integration)等としてのプロセッサ、複数のプロセッサ等を用いるモジュール、複数のモジュール等を用いるユニット、ユニットにさらにその他の機能を付加したセット等(すなわち、装置の一部の構成)として実施することもできる。
<ビデオセット>
本技術をセットとして実施する場合の例について、図34を参照して説明する。図34は、本技術を適用したビデオセットの概略的な構成の一例を示している。
近年、電子機器の多機能化が進んでおり、その開発や製造において、その一部の構成を販売や提供等として実施する場合、1機能を有する構成として実施を行う場合だけでなく、関連する機能を有する複数の構成を組み合わせ、複数の機能を有する1セットとして実施を行う場合も多く見られるようになってきた。
図34に示されるビデオセット1300は、このような多機能化された構成であり、画像の符号化や復号(いずれか一方でもよいし、両方でも良い)に関する機能を有するデバイスに、その機能に関連するその他の機能を有するデバイスを組み合わせたものである。
図34に示されるように、ビデオセット1300は、ビデオモジュール1311、外部メモリ1312、パワーマネージメントモジュール1313、およびフロントエンドモジュール1314等のモジュール群と、コネクティビティ1321、カメラ1322、およびセンサ1323等の関連する機能を有するデバイスとを有する。
モジュールは、互いに関連するいくつかの部品的機能をまとめ、まとまりのある機能を持った部品としたものである。具体的な物理的構成は任意であるが、例えば、それぞれ機能を有する複数のプロセッサ、抵抗やコンデンサ等の電子回路素子、その他のデバイス等を配線基板等に配置して一体化したものが考えられる。また、モジュールに他のモジュールやプロセッサ等を組み合わせて新たなモジュールとすることも考えられる。
図34の例の場合、ビデオモジュール1311は、画像処理に関する機能を有する構成を組み合わせたものであり、アプリケーションプロセッサ、ビデオプロセッサ、ブロードバンドモデム1333、およびRFモジュール1334を有する。
プロセッサは、所定の機能を有する構成をSoC(System On a Chip)により半導体チップに集積したものであり、例えばシステムLSI(Large Scale Integration)等と称されるものもある。この所定の機能を有する構成は、論理回路(ハードウエア構成)であってもよいし、CPU、ROM、RAM等と、それらを用いて実行されるプログラム(ソフトウエア構成)であってもよいし、その両方を組み合わせたものであってもよい。例えば、プロセッサが、論理回路とCPU、ROM、RAM等とを有し、機能の一部を論理回路(ハードウエア構成)により実現し、その他の機能をCPUにおいて実行されるプログラム(ソフトウエア構成)により実現するようにしてもよい。
図34のアプリケーションプロセッサ1331は、画像処理に関するアプリケーションを実行するプロセッサである。このアプリケーションプロセッサ1331において実行されるアプリケーションは、所定の機能を実現するために、演算処理を行うだけでなく、例えばビデオプロセッサ1332等、ビデオモジュール1311内外の構成を必要に応じて制御することもできる。
ビデオプロセッサ1332は、画像の符号化・復号(その一方若しくは両方)に関する機能を有するプロセッサである。
ブロードバンドモデム1333は、インターネットや公衆電話回線網等の広帯域の回線を介して行われる有線若しくは無線(またはその両方)の広帯域通信により送信するデータ(デジタル信号)をデジタル変調する等してアナログ信号に変換したり、その広帯域通信により受信したアナログ信号を復調してデータ(デジタル信号)に変換したりする。ブロードバンドモデム1333は、例えば、ビデオプロセッサ1332が処理する画像データ、画像データが符号化されたストリーム、アプリケーションプログラム、設定データ等、任意の情報を処理する。
RFモジュール1334は、アンテナを介して送受信されるRF(Radio Frequency)信号に対して、周波数変換、変復調、増幅、フィルタ処理等を行うモジュールである。例えば、RFモジュール1334は、ブロードバンドモデム1333により生成されたベースバンド信号に対して周波数変換等を行ってRF信号を生成する。また、例えば、RFモジュール1334は、フロントエンドモジュール1314を介して受信されたRF信号に対して周波数変換等を行ってベースバンド信号を生成する。
なお、図34において点線1341に示されるように、アプリケーションプロセッサ1331とビデオプロセッサ1332を、一体化し、1つのプロセッサとして構成されるようにしてもよい。
外部メモリ1312は、ビデオモジュール1311の外部に設けられた、ビデオモジュール1311により利用される記憶デバイスを有するモジュールである。この外部メモリ1312の記憶デバイスは、どのような物理構成により実現するようにしてもよいが、一般的にフレーム単位の画像データのような大容量のデータの格納に利用されることが多いので、例えばDRAM(Dynamic Random Access Memory)のような比較的安価で大容量の半導体メモリにより実現するのが望ましい。
パワーマネージメントモジュール1313は、ビデオモジュール1311(ビデオモジュール1311内の各構成)への電力供給を管理し、制御する。
フロントエンドモジュール1314は、RFモジュール1334に対してフロントエンド機能(アンテナ側の送受信端の回路)を提供するモジュールである。図34に示されるように、フロントエンドモジュール1314は、例えば、アンテナ部1351、フィルタ1352、および増幅部1353を有する。
アンテナ部1351は、無線信号を送受信するアンテナおよびその周辺の構成を有する。アンテナ部1351は、増幅部1353から供給される信号を無線信号として送信し、受信した無線信号を電気信号(RF信号)としてフィルタ1352に供給する。フィルタ1352は、アンテナ部1351を介して受信されたRF信号に対してフィルタ処理等を行い、処理後のRF信号をRFモジュール1334に供給する。増幅部1353は、RFモジュール1334から供給されるRF信号を増幅し、アンテナ部1351に供給する。
コネクティビティ1321は、外部との接続に関する機能を有するモジュールである。コネクティビティ1321の物理構成は、任意である。例えば、コネクティビティ1321は、ブロードバンドモデム1333が対応する通信規格以外の通信機能を有する構成や、外部入出力端子等を有する。
例えば、コネクティビティ1321が、Bluetooth(登録商標)、IEEE 802.11(例えばWi-Fi(Wireless Fidelity、登録商標))、NFC(Near Field Communication)、IrDA(InfraRed Data Association)等の無線通信規格に準拠する通信機能を有するモジュールや、その規格に準拠した信号を送受信するアンテナ等を有するようにしてもよい。また、例えば、コネクティビティ1321が、USB(Universal Serial Bus)、HDMI(登録商標)(High-Definition Multimedia Interface)等の有線通信規格に準拠する通信機能を有するモジュールや、その規格に準拠した端子を有するようにしてもよい。さらに、例えば、コネクティビティ1321が、アナログ入出力端子等のその他のデータ(信号)伝送機能等を有するようにしてもよい。
なお、コネクティビティ1321が、データ(信号)の伝送先のデバイスを含むようにしてもよい。例えば、コネクティビティ1321が、磁気ディスク、光ディスク、光磁気ディスク、または半導体メモリ等の記録媒体に対してデータの読み出しや書き込みを行うドライブ(リムーバブルメディアのドライブだけでなく、ハードディスク、SSD(Solid State Drive)、NAS(Network Attached Storage)等も含む)を有するようにしてもよい。また、コネクティビティ1321が、画像や音声の出力デバイス(モニタやスピーカ等)を有するようにしてもよい。
カメラ1322は、被写体を撮像し、被写体の画像データを得る機能を有するモジュールである。カメラ1322の撮像により得られた画像データは、例えば、ビデオプロセッサ1332に供給されて符号化される。
センサ1323は、例えば、音声センサ、超音波センサ、光センサ、照度センサ、赤外線センサ、イメージセンサ、回転センサ、角度センサ、角速度センサ、速度センサ、加速度センサ、傾斜センサ、磁気識別センサ、衝撃センサ、温度センサ等、任意のセンサ機能を有するモジュールである。センサ1323により検出されたデータは、例えば、アプリケーションプロセッサ1331に供給されてアプリケーション等により利用される。
以上においてモジュールとして説明した構成をプロセッサとして実現するようにしてもよいし、逆にプロセッサとして説明した構成をモジュールとして実現するようにしてもよい。
以上のような構成のビデオセット1300において、後述するようにビデオプロセッサ1332に本技術を適用することができる。したがって、ビデオセット1300は、本技術を適用したセットとして実施することができる。
<ビデオプロセッサの構成例>
図35は、本技術を適用したビデオプロセッサ1332(図34)の概略的な構成の一例を示している。
図35の例の場合、ビデオプロセッサ1332は、ビデオ信号およびオーディオ信号の入力を受けてこれらを所定の方式で符号化する機能と、符号化されたビデオデータおよびオーディオデータを復号し、ビデオ信号およびオーディオ信号を再生出力する機能とを有する。
図35に示されるように、ビデオプロセッサ1332は、ビデオ入力処理部1401、第1画像拡大縮小部1402、第2画像拡大縮小部1403、ビデオ出力処理部1404、フレームメモリ1405、およびメモリ制御部1406を有する。また、ビデオプロセッサ1332は、エンコード・デコードエンジン1407、ビデオES(Elementary Stream)バッファ1408Aおよび1408B、並びに、オーディオESバッファ1409Aおよび1409Bを有する。さらに、ビデオプロセッサ1332は、オーディオエンコーダ1410、オーディオデコーダ1411、多重化部(MUX(Multiplexer))1412、逆多重化部(DMUX(Demultiplexer))1413、およびストリームバッファ1414を有する。
ビデオ入力処理部1401は、例えばコネクティビティ1321(図34)等から入力されたビデオ信号を取得し、デジタル画像データに変換する。第1画像拡大縮小部1402は、画像データに対してフォーマット変換や画像の拡大縮小処理等を行う。第2画像拡大縮小部1403は、画像データに対して、ビデオ出力処理部1404を介して出力する先でのフォーマットに応じて画像の拡大縮小処理を行ったり、第1画像拡大縮小部1402と同様のフォーマット変換や画像の拡大縮小処理等を行ったりする。ビデオ出力処理部1404は、画像データに対して、フォーマット変換やアナログ信号への変換等を行って、再生されたビデオ信号として例えばコネクティビティ1321等に出力する。
フレームメモリ1405は、ビデオ入力処理部1401、第1画像拡大縮小部1402、第2画像拡大縮小部1403、ビデオ出力処理部1404、およびエンコード・デコードエンジン1407によって共用される画像データ用のメモリである。フレームメモリ1405は、例えばDRAM等の半導体メモリとして実現される。
メモリ制御部1406は、エンコード・デコードエンジン1407からの同期信号を受けて、アクセス管理テーブル1406Aに書き込まれたフレームメモリ1405へのアクセススケジュールに従ってフレームメモリ1405に対する書き込み・読み出しのアクセスを制御する。アクセス管理テーブル1406Aは、エンコード・デコードエンジン1407、第1画像拡大縮小部1402、第2画像拡大縮小部1403等で実行される処理に応じて、メモリ制御部1406により更新される。
エンコード・デコードエンジン1407は、画像データのエンコード処理、並びに、画像データが符号化されたデータであるビデオストリームのデコード処理を行う。例えば、エンコード・デコードエンジン1407は、フレームメモリ1405から読み出した画像データを符号化し、ビデオストリームとしてビデオESバッファ1408Aに順次書き込む。また、例えば、ビデオESバッファ1408Bからビデオストリームを順次読み出して復号し、画像データとしてフレームメモリ1405に順次書き込む。エンコード・デコードエンジン1407は、これらの符号化や復号において、フレームメモリ1405を作業領域として使用する。また、エンコード・デコードエンジン1407は、例えばマクロブロック毎の処理を開始するタイミングで、メモリ制御部1406に対して同期信号を出力する。
ビデオESバッファ1408Aは、エンコード・デコードエンジン1407によって生成されたビデオストリームをバッファリングして、多重化部(MUX)1412に供給する。ビデオESバッファ1408Bは、逆多重化部(DMUX)1413から供給されたビデオストリームをバッファリングして、エンコード・デコードエンジン1407に供給する。
オーディオESバッファ1409Aは、オーディオエンコーダ1410によって生成されたオーディオストリームをバッファリングして、多重化部(MUX)1412に供給する。オーディオESバッファ1409Bは、逆多重化部(DMUX)1413から供給されたオーディオストリームをバッファリングして、オーディオデコーダ1411に供給する。
オーディオエンコーダ1410は、例えばコネクティビティ1321等から入力されたオーディオ信号を例えばデジタル変換し、例えばMPEGオーディオ方式やAC3(AudioCode number 3)方式等の所定の方式で符号化する。オーディオエンコーダ1410は、オーディオ信号が符号化されたデータであるオーディオストリームをオーディオESバッファ1409Aに順次書き込む。オーディオデコーダ1411は、オーディオESバッファ1409Bから供給されたオーディオストリームを復号し、例えばアナログ信号への変換等を行って、再生されたオーディオ信号として例えばコネクティビティ1321等に供給する。
多重化部(MUX)1412は、ビデオストリームとオーディオストリームとを多重化する。この多重化の方法(すなわち、多重化により生成されるビットストリームのフォーマット)は任意である。また、この多重化の際に、多重化部(MUX)1412は、所定のヘッダ情報等をビットストリームに付加することもできる。つまり、多重化部(MUX)1412は、多重化によりストリームのフォーマットを変換することができる。例えば、多重化部(MUX)1412は、ビデオストリームとオーディオストリームとを多重化することにより、転送用のフォーマットのビットストリームであるトランスポートストリームに変換する。また、例えば、多重化部(MUX)1412は、ビデオストリームとオーディオストリームとを多重化することにより、記録用のファイルフォーマットのデータ(ファイルデータ)に変換する。
逆多重化部(DMUX)1413は、多重化部(MUX)1412による多重化に対応する方法で、ビデオストリームとオーディオストリームとが多重化されたビットストリームを逆多重化する。つまり、逆多重化部(DMUX)1413は、ストリームバッファ1414から読み出されたビットストリームからビデオストリームとオーディオストリームとを抽出する(ビデオストリームとオーディオストリームとを分離する)。つまり、逆多重化部(DMUX)1413は、逆多重化によりストリームのフォーマットを変換(多重化部(MUX)1412による変換の逆変換)することができる。例えば、逆多重化部(DMUX)1413は、例えばコネクティビティ1321やブロードバンドモデム1333等から供給されたトランスポートストリームを、ストリームバッファ1414を介して取得し、逆多重化することにより、ビデオストリームとオーディオストリームとに変換することができる。また、例えば、逆多重化部(DMUX)1413は、例えばコネクティビティ1321により各種記録媒体から読み出されたファイルデータを、ストリームバッファ1414を介して取得し、逆多重化することにより、ビデオストリームとオーディオストリームとに変換することができる。
ストリームバッファ1414は、ビットストリームをバッファリングする。例えば、ストリームバッファ1414は、多重化部(MUX)1412から供給されたトランスポートストリームをバッファリングし、所定のタイミングにおいて、若しくは外部からの要求等に基づいて、例えばコネクティビティ1321やブロードバンドモデム1333等に供給する。
また、例えば、ストリームバッファ1414は、多重化部(MUX)1412から供給されたファイルデータをバッファリングし、所定のタイミングにおいて、若しくは外部からの要求等に基づいて、例えばコネクティビティ1321等に供給し、各種記録媒体に記録させる。
さらに、ストリームバッファ1414は、例えばコネクティビティ1321やブロードバンドモデム1333等を介して取得したトランスポートストリームをバッファリングし、所定のタイミングにおいて、若しくは外部からの要求等に基づいて、逆多重化部(DMUX)1413に供給する。
また、ストリームバッファ1414は、例えばコネクティビティ1321等において各種記録媒体から読み出されたファイルデータをバッファリングし、所定のタイミングにおいて、若しくは外部からの要求等に基づいて、逆多重化部(DMUX)1413に供給する。
次に、このような構成のビデオプロセッサ1332の動作の例について説明する。例えば、コネクティビティ1321等からビデオプロセッサ1332に入力されたビデオ信号は、ビデオ入力処理部1401において4:2:2Y/Cb/Cr方式等の所定の方式のデジタル画像データに変換され、フレームメモリ1405に順次書き込まれる。このデジタル画像データは、第1画像拡大縮小部1402または第2画像拡大縮小部1403に読み出されて、4:2:0Y/Cb/Cr方式等の所定の方式へのフォーマット変換および拡大縮小処理が行われ、再びフレームメモリ1405に書き込まれる。この画像データは、エンコード・デコードエンジン1407によって符号化され、ビデオストリームとしてビデオESバッファ1408Aに書き込まれる。
また、コネクティビティ1321等からビデオプロセッサ1332に入力されたオーディオ信号は、オーディオエンコーダ1410によって符号化され、オーディオストリームとして、オーディオESバッファ1409Aに書き込まれる。
ビデオESバッファ1408Aのビデオストリームと、オーディオESバッファ1409Aのオーディオストリームは、多重化部(MUX)1412に読み出されて多重化され、トランスポートストリーム若しくはファイルデータ等に変換される。多重化部(MUX)1412により生成されたトランスポートストリームは、ストリームバッファ1414にバッファされた後、例えばコネクティビティ1321やブロードバンドモデム1333等を介して外部ネットワークに出力される。また、多重化部(MUX)1412により生成されたファイルデータは、ストリームバッファ1414にバッファされた後、例えばコネクティビティ1321等に出力され、各種記録媒体に記録される。
また、例えばコネクティビティ1321やブロードバンドモデム1333等を介して外部ネットワークからビデオプロセッサ1332に入力されたトランスポートストリームは、ストリームバッファ1414にバッファされた後、逆多重化部(DMUX)1413により逆多重化される。また、例えばコネクティビティ1321等において各種記録媒体から読み出され、ビデオプロセッサ1332に入力されたファイルデータは、ストリームバッファ1414にバッファされた後、逆多重化部(DMUX)1413により逆多重化される。つまり、ビデオプロセッサ1332に入力されたトランスポートストリームまたはファイルデータは、逆多重化部(DMUX)1413によりビデオストリームとオーディオストリームとに分離される。
オーディオストリームは、オーディオESバッファ1409Bを介してオーディオデコーダ1411に供給され、復号されてオーディオ信号が再生される。また、ビデオストリームは、ビデオESバッファ1408Bに書き込まれた後、エンコード・デコードエンジン1407により順次読み出されて復号されてフレームメモリ1405に書き込まれる。復号された画像データは、第2画像拡大縮小部1403によって拡大縮小処理されて、フレームメモリ1405に書き込まれる。そして、復号された画像データは、ビデオ出力処理部1404に読み出されて、4:2:2Y/Cb/Cr方式等の所定の方式にフォーマット変換され、さらにアナログ信号に変換されて、ビデオ信号が再生出力される。
このように構成されるビデオプロセッサ1332に本技術を適用する場合、エンコード・デコードエンジン1407に、上述した各実施形態に係る本技術を適用すればよい。つまり、例えば、エンコード・デコードエンジン1407が、上述した画像符号化装置100の機能を有するようにしてもよい。このようにすることにより、ビデオプロセッサ1332は、図1乃至図22を参照して上述した各実施の形態と同様の効果を得ることができる。
なお、エンコード・デコードエンジン1407において、本技術(すなわち、画像符号化装置100の機能)は、論理回路等のハードウエアにより実現するようにしてもよいし、組み込みプログラム等のソフトウエアにより実現するようにしてもよいし、それらの両方により実現するようにしてもよい。
<ビデオプロセッサの他の構成例>
図36は、本技術を適用したビデオプロセッサ1332の概略的な構成の他の例を示している。図36の例の場合、ビデオプロセッサ1332は、ビデオデータを所定の方式で符号化・復号する機能を有する。
より具体的には、図36に示されるように、ビデオプロセッサ1332は、制御部1511、ディスプレイインタフェース1512、ディスプレイエンジン1513、画像処理エンジン1514、および内部メモリ1515を有する。また、ビデオプロセッサ1332は、コーデックエンジン1516、メモリインタフェース1517、多重化・逆多重化部(MUX DMUX)1518、ネットワークインタフェース1519、およびビデオインタフェース1520を有する。
制御部1511は、ディスプレイインタフェース1512、ディスプレイエンジン1513、画像処理エンジン1514、およびコーデックエンジン1516等、ビデオプロセッサ1332内の各処理部の動作を制御する。
図36に示されるように、制御部1511は、例えば、メインCPU1531、サブCPU1532、およびシステムコントローラ1533を有する。メインCPU1531は、ビデオプロセッサ1332内の各処理部の動作を制御するためのプログラム等を実行する。メインCPU1531は、そのプログラム等に従って制御信号を生成し、各処理部に供給する(つまり、各処理部の動作を制御する)。サブCPU1532は、メインCPU1531の補助的な役割を果たす。例えば、サブCPU1532は、メインCPU1531が実行するプログラム等の子プロセスやサブルーチン等を実行する。システムコントローラ1533は、メインCPU1531およびサブCPU1532が実行するプログラムを指定する等、メインCPU1531およびサブCPU1532の動作を制御する。
ディスプレイインタフェース1512は、制御部1511の制御の下、画像データを例えばコネクティビティ1321等に出力する。例えば、ディスプレイインタフェース1512は、デジタルデータの画像データをアナログ信号に変換し、再生されたビデオ信号として、またはデジタルデータの画像データのまま、コネクティビティ1321のモニタ装置等に出力する。
ディスプレイエンジン1513は、制御部1511の制御の下、画像データに対して、その画像を表示させるモニタ装置等のハードウエアスペックに合わせるように、フォーマット変換、サイズ変換、色域変換等の各種変換処理を行う。
画像処理エンジン1514は、制御部1511の制御の下、画像データに対して、例えば画質改善のためのフィルタ処理等、所定の画像処理を施す。
内部メモリ1515は、ディスプレイエンジン1513、画像処理エンジン1514、およびコーデックエンジン1516により共用される、ビデオプロセッサ1332の内部に設けられたメモリである。内部メモリ1515は、例えば、ディスプレイエンジン1513、画像処理エンジン1514、およびコーデックエンジン1516の間で行われるデータの授受に利用される。例えば、内部メモリ1515は、ディスプレイエンジン1513、画像処理エンジン1514、またはコーデックエンジン1516から供給されるデータを格納し、必要に応じて(例えば、要求に応じて)、そのデータを、ディスプレイエンジン1513、画像処理エンジン1514、またはコーデックエンジン1516に供給する。この内部メモリ1515は、どのような記憶デバイスにより実現するようにしてもよいが、一般的にブロック単位の画像データやパラメータ等といった小容量のデータの格納に利用することが多いので、例えばSRAM(Static Random Access Memory)のような比較的(例えば外部メモリ1312と比較して)小容量だが応答速度が高速な半導体メモリにより実現するのが望ましい。
コーデックエンジン1516は、画像データの符号化や復号に関する処理を行う。このコーデックエンジン1516が対応する符号化・復号の方式は任意であり、その数は1つであってもよいし、複数であってもよい。例えば、コーデックエンジン1516は、複数の符号化・復号方式のコーデック機能を備え、その中から選択されたもので画像データの符号化若しくは符号化データの復号を行うようにしてもよい。
図36に示される例において、コーデックエンジン1516は、コーデックに関する処理の機能ブロックとして、例えば、MPEG-2 Video1541、AVC/H.2641542、HEVC/H.2651543、HEVC/H.265(Scalable)1544、HEVC/H.265(Multi-view)1545、およびMPEG-DASH1551を有する。
MPEG-2 Video1541は、画像データをMPEG-2方式で符号化したり復号したりする機能ブロックである。AVC/H.2641542は、画像データをAVC方式で符号化したり復号したりする機能ブロックである。HEVC/H.2651543は、画像データをHEVC方式で符号化したり復号したりする機能ブロックである。HEVC/H.265(Scalable)1544は、画像データをHEVC方式でスケーラブル符号化したりスケーラブル復号したりする機能ブロックである。HEVC/H.265(Multi-view)1545は、画像データをHEVC方式で多視点符号化したり多視点復号したりする機能ブロックである。
MPEG-DASH1551は、画像データをMPEG-DASH(MPEG-Dynamic Adaptive Streaming over HTTP)方式で送受信する機能ブロックである。MPEG-DASHは、HTTP(HyperText Transfer Protocol)を使ってビデオのストリーミングを行う技術であり、予め用意された解像度等が互いに異なる複数の符号化データの中から適切なものをセグメント単位で選択し伝送することを特徴の1つとする。MPEG-DASH1551は、規格に準拠するストリームの生成やそのストリームの伝送制御等を行い、画像データの符号化・復号については、上述したMPEG-2 Video1541乃至HEVC/H.265(Multi-view)1545を利用する。
メモリインタフェース1517は、外部メモリ1312用のインタフェースである。画像処理エンジン1514やコーデックエンジン1516から供給されるデータは、メモリインタフェース1517を介して外部メモリ1312に供給される。また、外部メモリ1312から読み出されたデータは、メモリインタフェース1517を介してビデオプロセッサ1332(画像処理エンジン1514若しくはコーデックエンジン1516)に供給される。
多重化・逆多重化部(MUX DMUX)1518は、符号化データのビットストリーム、画像データ、ビデオ信号等、画像に関する各種データの多重化や逆多重化を行う。この多重化・逆多重化の方法は任意である。例えば、多重化の際に、多重化・逆多重化部(MUX DMUX)1518は、複数のデータを1つにまとめるだけでなく、所定のヘッダ情報等をそのデータに付加することもできる。また、逆多重化の際に、多重化・逆多重化部(MUX DMUX)1518は、1つのデータを複数に分割するだけでなく、分割した各データに所定のヘッダ情報等を付加することもできる。つまり、多重化・逆多重化部(MUX DMUX)1518は、多重化・逆多重化によりデータのフォーマットを変換することができる。例えば、多重化・逆多重化部(MUX DMUX)1518は、ビットストリームを多重化することにより、転送用のフォーマットのビットストリームであるトランスポートストリームや、記録用のファイルフォーマットのデータ(ファイルデータ)に変換することができる。もちろん、逆多重化によりその逆変換も可能である。
ネットワークインタフェース1519は、例えばブロードバンドモデム1333やコネクティビティ1321等向けのインタフェースである。ビデオインタフェース1520は、例えばコネクティビティ1321やカメラ1322等向けのインタフェースである。
次に、このようなビデオプロセッサ1332の動作の例について説明する。例えば、コネクティビティ1321やブロードバンドモデム1333等を介して外部ネットワークからトランスポートストリームを受信すると、そのトランスポートストリームは、ネットワークインタフェース1519を介して多重化・逆多重化部(MUX DMUX)1518に供給されて逆多重化され、コーデックエンジン1516により復号される。コーデックエンジン1516の復号により得られた画像データは、例えば、画像処理エンジン1514により所定の画像処理が施され、ディスプレイエンジン1513により所定の変換が行われ、ディスプレイインタフェース1512を介して例えばコネクティビティ1321等に供給され、その画像がモニタに表示される。また、例えば、コーデックエンジン1516の復号により得られた画像データは、コーデックエンジン1516により再符号化され、多重化・逆多重化部(MUX DMUX)1518により多重化されてファイルデータに変換され、ビデオインタフェース1520を介して例えばコネクティビティ1321等に出力され、各種記録媒体に記録される。
さらに、例えば、コネクティビティ1321等により図示せぬ記録媒体から読み出された、画像データが符号化された符号化データのファイルデータは、ビデオインタフェース1520を介して多重化・逆多重化部(MUX DMUX)1518に供給されて逆多重化され、コーデックエンジン1516により復号される。コーデックエンジン1516の復号により得られた画像データは、画像処理エンジン1514により所定の画像処理が施され、ディスプレイエンジン1513により所定の変換が行われ、ディスプレイインタフェース1512を介して例えばコネクティビティ1321等に供給され、その画像がモニタに表示される。また、例えば、コーデックエンジン1516の復号により得られた画像データは、コーデックエンジン1516により再符号化され、多重化・逆多重化部(MUX DMUX)1518により多重化されてトランスポートストリームに変換され、ネットワークインタフェース1519を介して例えばコネクティビティ1321やブロードバンドモデム1333等に供給され図示せぬ他の装置に伝送される。
なお、ビデオプロセッサ1332内の各処理部の間での画像データやその他のデータの授受は、例えば、内部メモリ1515や外部メモリ1312を利用して行われる。また、パワーマネージメントモジュール1313は、例えば制御部1511への電力供給を制御する。
このように構成されるビデオプロセッサ1332に本技術を適用する場合、コーデックエンジン1516に、上述した各実施形態に係る本技術を適用すればよい。つまり、例えば、コーデックエンジン1516が、上述した画像符号化装置100を実現する機能ブロックを有するようにすればよい。このようにすることにより、ビデオプロセッサ1332は、図1乃至図22を参照して上述した各実施の形態と同様の効果を得ることができる。
なお、コーデックエンジン1516において、本技術(すなわち、画像符号化装置100の機能)は、論理回路等のハードウエアにより実現するようにしてもよいし、組み込みプログラム等のソフトウエアにより実現するようにしてもよいし、それらの両方により実現するようにしてもよい。
以上にビデオプロセッサ1332の構成を2例示したが、ビデオプロセッサ1332の構成は任意であり、上述した2例以外のものであってもよい。また、このビデオプロセッサ1332は、1つの半導体チップとして構成されるようにしてもよいが、複数の半導体チップとして構成されるようにしてもよい。例えば、複数の半導体を積層する3次元積層LSIとしてもよい。また、複数のLSIにより実現されるようにしてもよい。
<装置への適用例>
ビデオセット1300は、画像データを処理する各種装置に組み込むことができる。例えば、ビデオセット1300は、テレビジョン装置900(図30)、携帯電話機920(図31)、記録再生装置940(図32)、撮像装置960(図33)等に組み込むことができる。ビデオセット1300を組み込むことにより、その装置は、図1乃至図22を参照して上述した各実施の形態と同様の効果を得ることができる。
なお、上述したビデオセット1300の各構成の一部であっても、ビデオプロセッサ1332を含むものであれば、本技術を適用した構成として実施することができる。例えば、ビデオプロセッサ1332のみを本技術を適用したビデオプロセッサとして実施することができる。また、例えば、上述したように点線1341により示されるプロセッサやビデオモジュール1311等を、本技術を適用したプロセッサやモジュール等として実施することができる。さらに、例えば、ビデオモジュール1311、外部メモリ1312、パワーマネージメントモジュール1313、およびフロントエンドモジュール1314を組み合わせ、本技術を適用したビデオユニット1361として実施することもできる。いずれの構成の場合であっても、図1乃至図22を参照して上述した各実施の形態と同様の効果を得ることができる。
つまり、ビデオプロセッサ1332を含むものであればどのような構成であっても、ビデオセット1300の場合と同様に、画像データを処理する各種装置に組み込むことができる。例えば、ビデオプロセッサ1332、点線1341により示されるプロセッサ、ビデオモジュール1311、または、ビデオユニット1361を、テレビジョン装置900(図30)、携帯電話機920(図31)、記録再生装置940(図32)、撮像装置960(図33)等に組み込むことができる。そして、本技術を適用したいずれかの構成を組み込むことにより、その装置は、ビデオセット1300の場合と同様に、図1乃至図22を参照して上述した各実施の形態と同様の効果を得ることができる。
また、本明細書では、各種情報が、符号化ストリームに多重化されて、符号化側から復号側へ伝送される例について説明した。しかしながら、これら情報を伝送する手法はかかる例に限定されない。例えば、これら情報は、符号化ビットストリームに多重化されることなく、符号化ビットストリームと関連付けられた別個のデータとして伝送され又は記録されてもよい。ここで、「関連付ける」という用語は、ビットストリームに含まれる画像(スライス若しくはブロックなど、画像の一部であってもよい)と当該画像に対応する情報とを復号時にリンクさせ得るようにすることを意味する。即ち、情報は、画像(又はビットストリーム)とは別の伝送路上で伝送されてもよい。また、情報は、画像(又はビットストリーム)とは別の記録媒体(又は同一の記録媒体の別の記録エリア)に記録されてもよい。さらに、情報と画像(又はビットストリーム)とは、例えば、複数フレーム、1フレーム、又はフレーム内の一部分などの任意の単位で互いに関連付けられてよい。
なお、本技術は以下のような構成も取ることができる。
(1) 符号化される画像データの処理対象であるカレント係数データの符号化に用いる符号化テーブルを、前記カレント係数データの周辺の係数データの符号化に用いられた符号化テーブルに基づいて設定する設定部と、
前記設定部により設定された符号化テーブルを用いて、前記カレント係数データを符号化する符号化部と
を備える画像処理装置。
(2)
前記設定部は、前記周辺の係数データの符号化に用いられた符号化テーブルとして、前記カレント係数データの右に隣接する係数データの符号化に用いられた符号化テーブルと、前記カレント係数データの下に隣接する係数データの符号化に用いられた符号化テーブルとに基づいて、前記カレント係数データの符号化に用いる符号化テーブルを設定する
(1)に記載の画像処理装置。
(3) 前記設定部は、前記周辺の係数データの符号化に用いられた符号化テーブルとして、前記カレント係数データの右に隣接する係数データの符号化に用いられた符号化テーブルと、前記カレント係数データの下に隣接する係数データの符号化に用いられた符号化テーブルと、前記カレント係数データの右下に隣接する係数データの符号化に用いられた符号化テーブルとに基づいて、前記カレント係数データの符号化に用いる符号化テーブルを設定する
(1)または(2)に記載の画像処理装置。
(4) 前記設定部は、前記周辺の係数データの符号化に用いられた符号化テーブルとして、前記カレント係数データの右上に隣接する係数データの符号化に用いられた符号化テーブルと、前記カレント係数データの左下に隣接する係数データの符号化に用いられた符号化テーブルとに基づいて、前記カレント係数データの符号化に用いる符号化テーブルを設定する
(1)乃至(3)のいずれかに記載の画像処理装置。
(5) 前記設定部は、利用可能な前記周辺の係数データの符号化に用いられた符号化テーブルが単数の場合、前記符号化テーブルを、前記カレント係数データの符号化に用いる符号化テーブルとして設定する
(1)乃至(4)のいずれかに記載の画像処理装置。
(6) 前記設定部は、利用可能な前記周辺の係数データの符号化に用いられた符号化テーブルが複数の場合、複数の前記符号化テーブルのテーブル番号の平均値をテーブル番号とする符号化テーブルを、前記カレント係数データの符号化に用いる符号化テーブルとして設定する
(1)乃至(5)のいずれかに記載の画像処理装置。
(7) 前記設定部は、利用可能な前記周辺の係数データの符号化に用いられた符号化テーブルが複数の場合、複数の前記符号化テーブルのテーブル番号の中央値をテーブル番号とする符号化テーブルを、前記カレント係数データの符号化に用いる符号化テーブルとして設定する
(1)乃至(6)のいずれかに記載の画像処理装置。
(8) 前記設定部は、利用可能な前記周辺の係数データの符号化に用いられた符号化テーブルが複数の場合、複数の前記符号化テーブルのいずれかを、前記カレント係数データの符号化に用いる符号化テーブルとして設定する
(1)乃至(7)のいずれかに記載の画像処理装置。
(9) 前記設定部は、前記カレント係数データが、前記画像データの符号化単位における先頭の係数データである場合、前記カレント係数データの符号化に用いる符号化テーブルを、前記周辺の係数データの符号化に用いられた符号化テーブルに基づいて設定する
(1)乃至(8)のいずれかに記載の画像処理装置。
(10) 前記設定部は、全ての係数データについて、前記カレント係数データの符号化に用いる符号化テーブルを、前記周辺の係数データの符号化に用いられた符号化テーブルに基づいて設定する
(1)乃至(9)のいずれかに記載の画像処理装置。
(11) 前記設定部は、前記周辺の係数データの符号化に用いられた符号化テーブルとして、前記カレント係数データに隣接し、かつ、前記カレント係数データの符号化単位と異なる符号化単位に属する係数データの符号化に用いられた符号化テーブルに基づいて、前記カレント係数データの符号化に用いる符号化テーブルを設定する
(10)に記載の画像処理装置。
(12) 符号化される画像データの処理対象であるカレント係数データの符号化に用いる符号化テーブルを、前記カレント係数データの周辺の係数データの符号化に用いられた符号化テーブルに基づいて設定し、
設定された符号化テーブルを用いて、前記カレント係数データを符号化する
画像処理方法。