JP2008147998A - 動画像階層符号化装置、動画像階層符号化プログラム、動画像階層復号化装置及び動画像階層復号化プログラム - Google Patents

動画像階層符号化装置、動画像階層符号化プログラム、動画像階層復号化装置及び動画像階層復号化プログラム Download PDF

Info

Publication number
JP2008147998A
JP2008147998A JP2006332817A JP2006332817A JP2008147998A JP 2008147998 A JP2008147998 A JP 2008147998A JP 2006332817 A JP2006332817 A JP 2006332817A JP 2006332817 A JP2006332817 A JP 2006332817A JP 2008147998 A JP2008147998 A JP 2008147998A
Authority
JP
Japan
Prior art keywords
signal
orthogonal transform
prediction
coefficient information
image
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2006332817A
Other languages
English (en)
Other versions
JP4626608B2 (ja
Inventor
Motoharu Ueda
基晴 上田
Satoshi Sakazume
智 坂爪
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Victor Company of Japan Ltd
Original Assignee
Victor Company of Japan Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Victor Company of Japan Ltd filed Critical Victor Company of Japan Ltd
Priority to JP2006332817A priority Critical patent/JP4626608B2/ja
Publication of JP2008147998A publication Critical patent/JP2008147998A/ja
Application granted granted Critical
Publication of JP4626608B2 publication Critical patent/JP4626608B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

【課題】従来の動画像階層符号化における直交変換では、下位階層の復号データを拡大した信号と上位階層の画像信号の間での階層間予測効率が、下位階層の符号化品質の劣化により、低下する問題がある。また、上位階層に関して、動き補償予測と階層間予測を選択的に使用した場合に、ブロック間での信号の不連続性による符号化効率の低下がある。
【解決手段】多重調和局所直交変換器108は、符号化対象のブロックの隣接する他のブロックとの境界におけるDCT係数情報から求める画像信号の傾きを境界条件とするポアソン方程式を満たすような、符号化対象のブロック内の推定信号に対してDCTを行うことで得られる近似DCT係数情報を、直交変換器105からのDCT係数情報を利用して生成する。これにより、DCTを導入した際により高い周波数のDCT係数を早く収束させることが可能となり、結果として符号化効率を向上させることができる。
【選択図】図1

Description

本発明は動画像階層符号化装置、動画像階層符号化プログラム、動画像階層復号化装置及び動画像階層復号化プログラムに係り、特に動画像に対して階層符号化を行う際に、ポアソン方程式を満たす条件を境界条件及び拡張情報成分に適したソースモデルに基づいて導出し、その結果を符号化及び復号化に適用することで、従来法よりも符号化効率を向上させることを可能にするための動画像階層符号化装置、動画像階層符号化プログラム、動画像階層復号化装置及び動画像階層復号化プログラムに関する。
従来、映像符号化において空間解像度、時間解像度及びSNR(信号対雑音比)それぞれのスケーラビリティを実現する階層符号化方式が数多く提案されており、様々な分野でこれらの実用化がなされている。なかでも、空間解像度のスケーラビリティに関しては、解像度の異なる表示装置に対する符号化情報のスケーラビリティ性を可能とし、重要な機能となっている。
映像の空間解像度スケーラビリティを実現する符号化装置及び復号化装置が従来から知られている(例えば、特許文献1参照)。図15は上記の特許文献1記載の符号化装置及び復号化装置の一例のブロック図を示す。同図において、階層符号化部1501には、入力端子1504よりオリジナルの映像信号が入力され、階層符号化部1501で生成されたビットストリームが通信回線またはメディア1502を介して階層復号化部1503に伝送される。階層復号化部1503では供給されたビットストリームから必要な情報を取り出して、ディスプレイ等の性能に合った空間解像度のデコード映像信号を出力する。図15の構成例では、低解像度のデコード映像信号が、出力端子1514より、高解像度のデコード映像信号が、出力端子1515より出力される。
階層符号化部1501は、空間的縮小部1505、下位階層符号化(ベースレイヤエンコード)部1506、空間的拡大部1507、上位階層符号化(エンハンスメントレイヤエンコード)部1508及び多重化部1509から構成される。空間的縮小部1505は、オリジナルの映像信号を入力として受け付け、入力された映像信号を所望の空間解像度に空間的縮小(空間デシメーション)する機能と、所望の空間解像度に空間解像度デシメーションされた信号を下位階層符号化部1506に出力する機能とを有する。
下位階層符号化部1506は、空間的縮小部1505の出力信号を入力として受け付け、入力された信号を符号化してビットストリームを生成し、多重化部1509へ出力する機能を有する。ここで、施される符号化としては、MPEG−2(Moving Picture Experts Group 2)等の動画像符号化処理が用いられる。また、下位階層符号化部1506は、MPEG−2等におけるローカルデコードを行った信号を空間的拡大部1507へ出力する機能を有する。
空間的拡大部1507は、下位階層符号化部1506から出力されるローカルデコード信号を入力として受け付け、入力された信号を上位階層(エンハンスメントレイヤ)の信号の解像度に空間的拡大する(空間インターポレーションする)機能と、上位階層の信号の解像度に空間的拡大した信号を上位階層符号化(エンハンスメントレイヤエンコード)部1508へ出力する機能を有する。
上位階層符号化部1508は、オリジナルの映像信号と空間的拡大部1507より出力される信号を入力として受け付け、入力されるそれぞれの信号を用いて、空間解像度間および時間の相関を利用した予測を行い、それに伴って生じる予測誤差信号を符号化する機能と、符号化されて生成したビットストリームを多重化部1509に出力する機能とを有する。
多重化部1509は、下位階層符号化部1506及び上位階層符号化部1508より出力されるそれぞれのビットストリームを入力として受け付け、多重化して一つのビットストリームを生成し、階層符号化部1501の外部、例えば通信回線やメディア1502へ出力する機能を有する。
階層復号化部1503は、領域分割(エクストラクト)部1510、下位階層復号化(ベースレイヤデコード)部1511、空間的拡大(空間インターポレーション)部1512および上位階層復号化(エンハンスメントレイヤデコード)部1513から構成される。
領域分割部1510は、ビットストリームを入力として受け付け、階層復号化部1503またはディスプレイ等の性能に合わせて、入力されたビットストリーム全体から復号に必要なものを切り出し、分割してそれぞれを下位階層復号化部1511および上位階層復号化部1513に出力する機能を有する。
下位階層復号化部1511は、領域分割部1510で切り出された下位階層(ベースレイヤ)のビットストリームを入力として受け付け、入力されたビットストリームを復号し、デコード映像信号を空間的拡大部1512と必要に応じて低解像度映像信号として出力端子1514を介してディスプレイ等への出力を行う機能を有する。ここで、復号にはMPEG−2デコーダなどを用いる。
空間的拡大部1512は、下位階層復号化部1511から出力される下位階層復号化信号を入力として受け付け、入力された信号を上位階層(エンハンスメントレイヤ)の信号の解像度に空間的拡大(空間インターポレーション)する機能と、上位階層の信号の解像度に空間的拡大された信号を上位階層復号化部1513へ出力する機能を有する。
上位階層復号化部1513は、領域分割部1510から得られるビットストリームおよび空間的拡大部1512から出力される信号を入力として受け付け、入力されるそれぞれの信号を用いて、オリジナル映像信号の空間解像度の信号を復号する機能を有する。復号された映像信号は、高解像度塩蔵信号として出力端子1516からディスプレイ等へ出力される。
次に、図15に示した階層符号化部1501の構成例を用いて、映像信号を空間スケーラブル符号化する手順を図16に示す。階層符号化部1501はオリジナルの映像信号を、まず、空間的縮小部1505において空間解像度の空間的縮小(デシメーション)を行う(ステップS1601)。続いて、空間解像度をデシメーションした信号を、下位階層符号化部1506を用いて符号化し、ビットストリームを生成する(ステップS1602)。生成されたビットストリームは多重化部1509へ送られ、符号化過程で得られる下位階層のローカルデコード信号は空間的拡大部1507へ送られる。
下位階層符号化部1506より得られる下位階層のローカルデコード信号は空間的拡大部1507において空間解像度の空間的拡大(インターポレーション)される(ステップS1603)。そして、空間的拡大部1507は、空間的拡大した信号を上位階層符号化部1508に送る。上位階層符号化部1508では、オリジナルの映像信号と空間的拡大部1507の出力信号を用いて、空間解像度間および時間の相関を利用した予測を行い、それに伴って生じる予測誤差信号を符号化する(ステップS1604)。そして、上位階層符号化部1508は符号化により生成されたビットストリームを、多重化部1509へ送る。下位階層符号化部1506および上位階層符号化部1508より得られたそれぞれのビットストリームは多重化部1509において、多重化され、一つのビットストリームを生成する(ステップS1605)。
次に、図15に示した階層復号化部1503の構成例を用いて空間スケーラブル構成のビットストリームを復号してデコード映像信号を得る手順を図17のフローチャーと共に説明する。まず、通信回線やメディア等1502からビットストリームを領域分割部1510が受信すると、その受信したビットストリームを解析し、階層復号化部1503およびディスプレイ等の性能に合わせて必要な符号データを抽出する。そして、下位階層復号化部1511、上位階層復号化部1513それぞれに対応したデータに分割して出力する(ステップS1701)。
続いて、領域分割部1510で分割したベースレイヤに対応するデータ(下位階層信号)を下位階層復号化部1511で復号する(ステップS1702)。位階層復号化部1511はこの復号した下位階層復号化映像信号を空間的拡大部1512に出力し、必要があればディスプレイ等にも出力する。下位階層復号化部1511より得られる下位階層復号化映像信号は、空間的拡大部1512において空間解像度のインターポレーション(空間的拡大)される(ステップS1703)。そして、空間的拡大した信号を上位階層復号化部1513に送る。領域分割部1510で分割したエンハンスメントレイヤに対応するデータ(上位階層信号)および空間的拡大部1512で空間的拡大した信号を上位階層復号化部1513で復号する(ステップS1704)。そして、復号したデコード映像信号をディスプレイ等へ出力する。
次に、下位階層符号化部1506の構成の一例として、MPEG−2エンコーダの符号化処理に関しての説明を行う。まず、時間的に連続する画像フレームを、基準フレームと予測フレームに振り分ける。基準フレームは空間方向の相関のみを用いて符号化する事で、そのフレームの符号化データのみで復元する事ができる。予測フレームは、基準となるフレームからの時間方向の相関と空間方向の相関を共に用いて符号化する事により、基準フレームに対してより符号化効率を高める事ができる。予測フレームの符号化データは、復元された基準フレームと予測フレームの符号化データより復元される。
基準フレームの画像信号は、輝度信号で水平16画素×垂直16画素のマクロブロックと呼ばれる処理単位に分割される。分割されたマクロブロックのデータは、更に8×8画素単位の2次元ブロックに分割され、直交変換の一種であるDCT(Discrete Cosine Transform:離散コサイン変換)処理が行われる。DCT変換後の信号はその2次元ブロックの周波数成分に準じた値を示すため、一般的な画像では低域に成分が集中する。また、高周波数成分の情報劣化は低周波数成分の情報劣化よりも視覚的に目立ちにくい性質がある。よって、低域成分を細かく高域成分を粗く量子化し、その係数成分と成分が無い係数0の連続する長さを可変長符号化する事により、情報量を圧縮している。
予測フレームの画像信号は、基準フレームと同様に、輝度信号で水平16画素×垂直16画素のマクロブロックの単位に分割される。予測フレームにおいては、マクロブロック毎に基準フレームとの間の動きベクトルが求められ、マクロブロックの各画素に対して、動きベクトルにより切り出された2次元ブロックの各画素との差分ブロックが生成される。
正確な動きベクトルが検出された場合には、差分ブロックの情報量は元のマクロブロックの持っている情報量よりも大幅に少なくなるため、基準フレームよりも粗い量子化処理が可能となる。動きベクトルの検出は、一般的にブロックマッチングにより求められる。このブロックマッチングでは、マクロブロックの各画素と、動きベクトル値だけマクロブロックの存在する水平・垂直の位置を動かした場所の基準フレームを水平16×垂直16画素にブロック化した各画素の差分絶対値総和(もしくは差分二乗総和)を求め、その最小値を取る動きベクトルの値を、検出された動きベクトルとして出力する。画面の動きによっては、予測フレームとマッチングする画像が参照フレーム内に存在しない場合もあるため、差分ブロックを符号化するか非差分ブロック(Intraブロック)を符号化するかを選択し(予測モード判定)、選択されたブロックに対して基準フレームと同様のDCT・可変長符号化処理を施し、情報量が圧縮される。
次に、階層符号化装置にMPEG−2画像符号化を使用した従来技術として、図18のブロック図に示すMPEG−2エンコーダを下位階層符号化部1506として用いた場合について説明する。同図において、入力端子1801より入力されたデジタル画像信号は、入力画像メモリ1802に供給されて記憶され、符号化シンタックスに従って符号化される順番に並べ替えを行うため遅延される。入力画像メモリ1802から出力されたデジタル画像信号は、2次元ブロック変換器1803にてマクロブロックが切り出される。
基準フレームにおいては、マクロブロックデータは減算器1804を介して直交変換器1805に供給され、ここで水平8画素×垂直8画素単位でDCT変換が行われてDCT係数が出力される。DCT係数はさらに輝度信号で水平16画素×垂直16画素のマクロブロック単位にまとめられて、量子化器1806に送られる。量子化器1806においては、DCT係数を周波数成分毎に異なった値を持つ量子化マトリクスにより、係数毎に異なった値で除算することにより、量子化処理する。量子化処理されたDCT係数は、エントロピー符号化器1810において、符号化テーブル1809の係数に対応したアドレスを参照する事により、可変長または固定長の符号化が行われる。エントロピー符号化器1810から出力されたビットストリームは、ストリームバッファ1811に格納された後、出力端子1817を介して、記録媒体もしくは伝送路に出力される。
一方、量子化器1806において量子化されたDCT係数は、逆量子化器1807及び逆直交変換器1808において逆量子化及び逆DCT処理が行われ、量子化されたDCT係数が復号され、加算器1819及び2次元ブロック逆変換器1813を介してローカルデコードデータが生成され、参照画像メモリ1814に供給されて格納される。ローカルデコードデータは同時に出力端子1818から出力され、上位階層(エンハンスメントレイヤ)における予測信号に使用される。参照画像メモリ1814に格納されたローカルデコードデータは、予測フレームの符号化処理時に使用される。
続いて、予測フレームにおいては、入力画像メモリ1802から切り出されたマクロブロックデータと参照画像メモリ1814に格納されている画像との間で、ME(動き推定)器1815によって、画像間での動きベクトルが求められる。ME器1815から出力された動きベクトルは、MC(動き補償)器1816に供給され、ここで参照画像メモリ1814内の参照画像から予測ブロックを切り出す。MC器1816では、複数切り出された予測ブロックの中から最適な予測モードの選択を行い、予測ブロックを減算器1804及び加算器1819に供給する。
減算器1804では、入力画像ブロックと予測ブロックとの差分信号を直交変換器1805に送り出す。差分信号は、前記基準フレームの各ブロックと同様の処理が行われ、DCT係数が量子化処理されエントロピー符号化される。エントロピー符号化器1810では、MC器1816から出力される動きベクトルや予測モードを符号化処理されたDCT係数と共に、所定の構文構造に基づいて符号化し出力することで、符号化ビットストリームを生成する。生成された符号化ビットストリームは、ストリームバッファ1811を介して出力端子1817に出力される。
一方、量子化器1806において量子化されたDCT係数は、逆量子化器1807及び逆直交変換器1808において逆量子化及び逆DCT処理が行われ、量子化されたDCT係数が復号され、加算器1819において予測ブロックと加算され、ローカルデコードデータが生成される。ローカルデコードデータは、参照を受ける画像の場合には2次元ブロック逆変換器1813を介して参照画像メモリ1814に供給されて格納される。参照画像メモリ1814に格納された画像が、続く予測フレームの符号化処理時に使用される。MPEG−2エンコード部が、図15の下位階層符号化部1506に用いられた場合には、多重化部1509にビットストリームが出力され、出力端子1818より出力されたローカルデコードデータが空間的拡大部1507に供給される。
符号量の制御に関しては、符号量制御器1812においてエントロピー符号化器1810からストリームバッファ1811に出力されたビットストリームの符号量と、目標とする符号量との間で比較がとられ、目標符号量に近づけるために量子化器1806の量子化の細かさ(量子化スケール)を制御する。結果として、DCT変換後の信号の高い周波数の収束度合いにより量子化スケールが上下する事になり、高周波数成分の多い画像や、動き補償予測の精度が十分でない画像に関しては、量子化スケールが大きくなり、エッジ部などの高周波数成分が存在する領域やブロックの境界において符号化歪を生じる。
特許文献1においては、図15の上位階層符号化部1508においても、MPEG−2エンコード部と同様の機能を有したエンコード部が想定されている。従来のMPEG−2エンコード部と異なる部分は、DCTを行う信号が下位階層のローカルデコード信号に対して空間解像度のインターポレーションを行った拡大ブロックと、動き補償予測された予測ブロックとを適応的に選択、または重み付けを加えた加算ブロックを用いて予測を行った結果の差分ブロックを用いている部分である。
次に従来の上位階層符号化部1508の構成を示し、説明する。図19は上位階層符号化部1508の一例のブロック図を示す。この上位階層符号化部1508は、図18に示した下位階層符号化部と比較すると、入力端子1913より入力された空間的拡大処理された画像信号(インターポレーション画像信号)を、2次元ブロックに切り出す階層間予測器1914と、階層間予測と動き補償予測との間で、両者の重み付け予測を含めて最適な予測方式を選択するモード判定器1915が追加された構成になる。
インターポレーション画像信号は、図15の空間的拡大部1507から出力される拡大されたベースレイヤのローカルデコードデータである。動きベクトルや予測モード情報は、モード判定器1915により、エントロピー符号化器1907に送られ、量子化されたDCT係数と共に符号化され、ビットストリームとしてストリームバッファ1909に出力される。ストリームバッファ1909を介して出力端子1921からは、エンハンスメントレイヤのビットストリームが、図15における多重化部1509に対して出力される。
図19の入力画像メモリ1902、2次元画像ブロック変換器1903、減算器1904、直交変換器1905、量子化器1906、エントロピー符号化器1907、符号化テーブル1908、ストリームバッファ1909、符号量制御器1910、逆量子化器1911、逆直交変換器1912、加算器1916、2次元ブロック逆変換器1917、参照画像メモリ1918、ME器1919、MC器1920の動作は、図18の入力画像メモリ1802、2次元画像ブロック変換器1803、減算器1804、直交変換器1805、量子化器1806、エントロピー符号化器1810、符号化テーブル1809、ストリームバッファ1811、符号量制御器1812、逆量子化器1807、逆直交変換器1808、加算器1819、2次元ブロック逆変換器1813、参照画像メモリ1814、ME器1915、MC器1816の動作と同様である。
次に、上記階層符号化装置を復号する階層復号化装置に関して、まずベースレイヤをMPEG−2で符号化した場合の復号処理を実現した従来技術を、図20にMPEG−2デコーダを使用した下位階層復号化部の形態を示す構成図を示し説明する。図15における領域分割部1510から出力されて図20の入力端子2001に入力された下位階層符号化信号(ベースレイヤビットストリーム)は、ストリームバッファ2002に蓄えられ、エントロピー復号器2003に供給される。
エントロピー復号器2003では、符号化テーブル2004を用いて可変長または固定長の符号を復号し、量子化されたDCT係数と動きベクトルや予測モードを復元する。量子化されたDCT係数は、逆量子化器2005及び逆直交変換器2006において逆量子化及び逆DCT処理が行われ、復号データが生成される。基準フレームの場合には、加算器2007、2次元ブロック逆変換器2008を介してベースレイヤのデコード画像信号として出力画像メモリ2011に蓄えられ出力時刻順に並べ替えられ、出力端子2013より出力される。これは、図15における出力端子1514と同じである。また、デコード画像信号は、参照画像メモリ2009にも供給されて格納されると共に、出力端子2012より図15の空間的拡大部1512に供給され、上位階層(エンハンスメントレイヤ)における予測信号に使用される。
予測フレームにおいては、予測ブロックがエントロピー復号器2003から出力される動きベクトル及びモード信号をMC器2010に入力して、ここで参照画像メモリ2009よりの参照画像を切り出す事により生成される。MC器2010で生成された予測ブロックは加算器2007に供給され、逆直交変換器2006からの復号データと加算される。加算された復号データは、基準フレームと同様に2次元ブロック逆変換器2008を介してベースレイヤのデコード画像信号として出力画像メモリ2011に蓄えられ出力時刻順に並べ替えられ、出力端子2013より出力される。また、デコード画像信号は出力端子2012より出力され、上位階層(エンハンスメントレイヤ)における予測信号に使用されると共に、該当フレームが参照を受ける画像の場合には、参照画像メモリ2009にも供給されて格納される。
次に、上位階層(エンハンスメントレイヤ)の復号処理に関して、図21に示す図15の上位階層復号化部1513の一例のブロック図と共に説明する。図21の上位階層復号化部1513は、図20に示した下位階層復号化部1511と比較すると、下位階層復号化部1511から出力されて、図15の空間的拡大部1512で空間的拡大処理されたベースレイヤの復号インターポレーション画像信号が入力端子2113を介して供給されて2次元ブロックを切り出す階層間予測器2114と、エントロピー復号器から入力された予測モード情報を基に、階層間予測と動き補償予測との間で、両者の重み付け予測を含めて選択された予測方式による予測ブロックを生成する、予測生成器2115が下位階層復号化部1511と同様の構成に追加された構成になる。出力画像メモリ2109から出力端子2110に出力される画像信号が、高解像度映像出力となる。これは、図15における出力端子1515と同じである。
なお、図21の入力端子2101には上位階層符号化信号(エンハンスメントレイヤビットストリーム)が入力される以外は、ストリームバッファ2102、エントロピー復号器2103、符号化テーブル2104、逆量子化器2105、逆直交変換器2106、加算器2107、2次元ブロック逆変換器2108、出力画像メモリ2109、参照画像メモリ2111は、図20のストリームバッファ2002、エントロピー復号器2003、符号化テーブル2004、逆量子化器2005、逆直交変換器2006、加算器2007、2次元ブロック逆変換器2008、出力画像メモリ2011、参照画像メモリ2009と同様の動作を行う。
ところで、近年、自然画像の符号化方式として知られるJPEG(Joint Photographic Experts Group)方式の符号化において、多重調和局所直交変換、特に多重調和局所余弦変換を用いて更なる符号化効率の向上を試みる手法が提案されている(例えば、非特許文献1参照)。この多重調和局所余弦変換手法では、ポアソン方程式の概念を導入してブロック内の原信号に対する推定信号を求め、原信号と求めた推定信号との差分である残差信号を生成することで、DCTを導入した際により高い周波数のDCT係数を早く収束させることが可能となり、結果として符号化効率を向上させることができる。
図22は、この多重調和局所余弦変換手法の基本概念を示すための概念図である。図22は、原画像フレーム内のある特定のブロックにおいて、その中のある特定のラインに注目し、注目したラインの原信号と、ブロック境界上にあるその原信号の境界の状態が、この手法によってどのように推移するかを示している。
図22(a)に示す原信号2201に対して、ブロック境界2204、2205に対応する原信号の両端部分における画像信号の傾き2202、2203を求める。この両端部分の画像信号の傾き2202、2203を境界条件とする。多重調和局所余弦変換手法では、ブロック内の信号の振る舞いを規定する所定のソースモデルを適用し、ブロック内の信号をブロックの境界条件に基づいて推定信号を生成する。
ここでは、図22(b)に示すような原信号の両端部分における画像信号の傾きを境界条件として、ポアソン方程式を満たすような推定信号2206を生成する。所定のソースモデルは、境界条件の下で原信号2201に最も近い信号を推定することができるモデルを採用することが望ましい。一般に、図22のような1次元の信号の場合には所定のソースモデルとして2次関数を適用することで容易に求めることが可能であるが、ここでは特にこのモデルに限定されるものではない。このように所定のソースモデルを導入することで膨大な演算量を費やしてポアソン方程式を数値的に解くことなく、解析的にブロック内の推定信号を生成している。
図22(b)のような境界条件に基づいた推定信号2206を生成した後、原信号2201と推定信号2206との間で差分を求めることで、図22(c)に示すような残差信号2207を生成する。このようにして求めた残差信号2207に対して通常の直交変換であるDCTや量子化およびエントロピー符号化を行うことで、この多重調和局所余弦変換手法を用いた自然画像の符号化が完了する。
図23および図24は、多重調和局所余弦変換手法を用いることで通常のDCTとどのような違いが生じるかを示すための図である。図23は、図22(a)の原信号に対して、通常のDCTを行った場合の例である。図23中、横軸はx方向にのみ注目した際の画像信号のx方向のx、縦軸は画像信号の1ラインの各画素の値(輝度値)を示す。また、図23では便宜上、波形を連続関数で示しているが、実際は離散値である(図24も同様)。
通常、DCTのタイプは、DCT−IIを利用することから、図23(a)が示すようなブロックで区切られた有限な原信号に対してDCTを行う場合には、原信号のブロック境界の片方、ここでは右側を軸として原信号を偶接続し、図23(b)に示すような原信号の周期波形信号とする。
このような周期波形信号とすることにより図23(c)のようなDCT級数で表現することが可能となる。通常、図23(b)の点線部2301、2302、2303が示すように、原信号を偶接続した場合に信号の滑らかさが必ずしも十分でない部分が生じる。この影響から、図23(c)で示すDCT級数の各振幅であるDCT係数は、信号の偶接続によって本来原信号がもつ信号成分とは異なる信号成分が混入することから、図23(c)の点線部2304が示すような高い周波数成分領域であってもDCT係数の収束が必ずしも十分ではない状態となる。従って、このようなDCT係数に対して所定の量子化及びエントロピー符号化を行った場合には相応の符号量が発生することになる。
次に、多重調和局所余弦変換手法を用いた場合が図24である。この手法を用いて図22(b)に示すような推定信号2206を生成した後、図22(a)に示す原信号2201との差分をとることで図22(c)及び図24(a)のような残差信号2207を得る。この残差信号2207を利用することで、図24(a)に示すように、図23(a)と同様に、この残差信号2207を仮に信号の右側を軸として偶接続し、図24(b)に示すような残差信号の周期波形信号が得られる。
得られた残差信号の周期波形信号は、周期接続部分である図24(b)の点線部2401、2402、2403において、図23(b)に示した原信号の周期波形信号の対応する部分の波形よりも滑らかさが向上すると共に、本来原信号には含まれない不要な信号成分の混入を防ぐことが可能となる。従って、図24(b)に示した残差信号の周期波形信号を離散周期波形と見做してDCTを行い、そのスペクトルを表現すると、図24(c)にIで示すようなDCT係数列、すなわち残差直交変換係数(ここでは、残差DCT係数情報)が得られる。
図24(c)にIで示す残差DCT係数情報は、通常のDCTを行った場合の同図(c)にIIで示すDCT係数列と比較すると、図24(c)の点線部2404が示すような高い周波数成分領域でDCT係数が十分収束し、より低い周波数成分をもつDCT係数に偏った状態となる。
従って、このように多重調和局所余弦変換手法を用いたDCT係数に対して所定の量子化及びエントロピー符号化を行うことで、通常のDCTによる符号化を行った場合よりも発生する符号量を抑制することが可能となり、符号化効率の向上につながる。
以上が多重調和局所余弦変換手法を用いた場合の基本概念である。ここでは、多重調和局所余弦変換手法の基本概念を簡単に説明するために、原信号の境界条件に基づいて推定信号を生成し、原信号との差分により残差信号を生成した後にDCTを行うことで実現することを示した。
また非特許文献1では、ブロック内の原信号と境界条件からの推定信号に対してそれぞれDCTを行うことでそれぞれのDCT係数を求めた後に差分をとることで、上記残差信号に対してDCTを行った場合と同様の結果が得られるような方法が示されている。
以下に簡単ではあるが非特許文献1で示される上記の方法について説明する。まず、入力される画像フレームに対して、数1によって表現される図25が示すような各ブロックとして画像フレーム信号をとらえる。
Figure 2008147998
図25のΩ(0,0)が現在処理対象となっているブロックであるものとする。また、各ブロック内の各画素は、数2で表現される。
Figure 2008147998
まず、各ブロックの画像信号に対して直交変換を行う。ここでは数3に示すようなDCTを行う。
Figure 2008147998
次に、境界条件である画像信号の傾きを周波数領域で議論することができるように、DCT級数で表現する。ここでは数4に示した境界条件のDCT級数展開の式を利用して画像信号の傾きをgとした場合に数4に示した式中のGのようなDCT係数で表現する。
Figure 2008147998
また、ポアソン方程式の概念を導入してブロック内の原信号に対する推定信号を求める。ここで、ポアソン方程式は、処理対象ブロックΩjにおいて、ブロック内の推定信号uのラプラシアンであるΔuがソース項Kとの間において、次式が成立する方程式である。
Δu=K
ブロック内の推定信号uはノイマンの境界条件とDCT級数表記を用いることで、数6のように表現することができる。これは、数5で示されるような各境界からの推定信号のDCT級数展開成分を足し合わせることで求められる。
Figure 2008147998
Figure 2008147998
このような推定信号uに対してDCTを行うことで、次式で表される推定信号Uを得ることができる。
k1,k2=Gk1 (1)ηk1,k2+Gk1 (2)η* k1,k2+Gk2 (3)ηk2,k1+Gk2 (4)η* k2,k1 (1)
ただし、(1)式中、ηk,m、η* k,mは次式で表される。
Figure 2008147998
ここで、数7に示した式から、η及びη*はブロック内の位置情報のみに依存し、ブロック内の画像信号には依存しないことから、予め一意に計算して求めておくことができる。従って、推定信号Uを求めるためには、傾きのDCT係数情報Gを求めることが重要となる。
ここで、Gをブロック内の原信号に対してDCTを行った後のDCT係数情報を利用して求めることを可能にするため、境界条件であるブロック境界における画像信号の傾きを求める際に、数8の式で示されるようなブロック内の各方向の信号成分の平均値を代表値としてブロック間の傾きを算出し、この傾きをブロック境界での傾きとして近似することでgを求める。
Figure 2008147998
続いて、この近似されたgに対してDCTを行うことでGを求める。ここで、Gを求める際に数8に示した式を考慮して数9に示した式変形を行うことで、GをF、つまりブロック内のDCT係数情報を利用して求めることが可能となる。
Figure 2008147998
特開平7-162870号公報 山谷 克、斉藤 直樹、"Improvement of DCT-based Compression Algorithms Using Poisson's Equation"
従来は階層符号化を行う際に、エンハンスメントレイヤ(上位階層)の符号化対象となる高い空間解像度を含む画像フレームと、この高い空間解像度を含む画像フレームを画像フレームの縮小処理を伴ってエンハンスメントレイヤ(上位階層)の符号化対象となる高い空間解像度以下に縮小してベースレイヤ(下位階層)の符号化対象とした画像フレームとを用意し、それらの画像フレームに対してベースレイヤの符号化を行う。その後、ベースレイヤの符号化結果を復号化して生成した復号画像フレームとエンハンスメントレイヤ(上位階層)で符号化対象となっている画像フレームとの相関を利用して予測処理を行い、その結果生じる差分画像フレームをエンハンスメントレイヤ(上位階層)の符号化として符号化することで情報量の削減を行っている。
しかし、下位階層で利用する画像フレームにおいては、上位階層で扱う画像フレームに含まれるような高い周波数成分は、下位階層用の画像フレームを縮小処理によって生成する際に周波数の帯域制限によって除去される。また、下位階層における符号化の結果、あまり重要でないと判断された周波数成分が量子化などの符号化処理の過程で除去される。
このような画像フレームを利用して符号化を行う際に、下位階層と上位階層との間で相関を利用するために予測処理を行って差分画像フレームを生成した場合に、低周波数成分を多く含む領域に対しては上位階層において、階層間の正しい予測処理が行われて生成される差分情報の信号振幅を抑えることが可能であるが、画像フレーム中の比較的大きな高周波数成分が連続した領域、つまりエッジ部などを含む領域においては、下位階層から得られる画像フレームでは十分な予測処理を行うことができない。
更にDCTでは、解析単位であるブロック領域を変換する際に、このブロック領域を周期波形とみなして直交変換を行う。つまりブロック領域に対して周期拡張を行うために、ブロック境界で滑らかな接続とはならずに不連続点が生じる。つまり、このブロック境界で画像全体としてみた場合には不必要な高周波数成分が発生し、符号化の際に障害となる。
また、符号量を制御することにより、大きな量子化スケールで符号化された下位階層を用いた場合の差分画像フレームにおいては、低周波数成分を含めて差分情報の成分が残存すると共に、下位階層における符号化歪が予測成分に混入する事による、差分情報の増大が生じる。
また、上位階層の符号化においても、差分情報に対してDCTを施し符号化を行うために、下位階層と同様にブロック境界で滑らかな接続とはならずに不連続点が生じる問題が生じ、不必要な高周波数成分の発生により符号化効率が低下する。
なお、従来、JPEGに対して更なる符号化効率の向上を試みる多重調和局所余弦変換手法を適用することで自然画像に対する符号化の問題点を改善している。しかし、この手法では一般的な自然画像に対する適用を想定しており、ブロックノイズの発生を抑制するために、ブロック間の低周波数成分に依存した符号化が行われる。また、この多重調和局所余弦変換手法は、一般的な自然画像のように、符号化対象となる画像フレームのブロック間の連続性が保たれていることを想定している。
ここで、上位階層における差分情報に対して、従来の多重調和局所余弦変換手法の適用を考えると、下位階層においてブロックの境界において符号化歪を生じた場合に、上位階層において空間解像度のインターポレーション(空間的拡大)を行った拡大ブロックの隣接ブロック間において必ずしも連続性が保たれていないため、拡大ブロックを予測ブロックとして用いた差分ブロックに対しても、隣接ブロック間の連続性が保たれなくなる。
このような差分ブロックに対して従来の多重調和局所余弦変換手法を適用すると、本来ブロック間の不連続な状態を保つように符号化を行う必要があるにも拘らず、ブロック間の相関が高く、連続性が保たれていることを想定して符号化処理を行うため、自然画像の場合と比較して十分な符号化効率が得られない場合がある。
また、上位階層の予測ブロックが拡大ブロックと動き補償ブロックとから適応的に選択されている場合に、拡大ブロックより予測された差分ブロックと、動き補償ブロックより予測された差分ブロックの間においても、隣接ブロック間において連続性が保たれない場合が生じる。つまり、差分ブロックにおいても視覚上ブロック状の歪みが生じ、一般的な自然画像のようなブロック間や画素間に強い相関がある場合とは性質の異なる情報になる。
また、符号化時にブロック間の不連続性を再現するために必要な符号量を量子化などの処理によって削減してしまった場合、従来の多重調和局所余弦変換手法を適用すると、復号化側ではブロック間の連続性を想定して復号してしまうため、ブロック間の不連続性を再現することができず、上位階層の復号画像において、ブロック間の不連続性が解消できずにブロック歪として現れる問題が生じる。
本発明は以上の点に鑑みなされたもので、下位階層の符号化劣化がブロック間の連続性を破壊する事を回避するために、下位階層の符号化において多重調和局所余弦変換手法を適用する事により、下位階層の符号化効率の向上とブロック間の連続性保持を実現し、上位階層の予測効率を向上し得る動画像階層符号化装置、動画像階層符号化プログラム、動画像階層復号化装置及び動画像階層復号化プログラムを提供することを目的とする。
また、本発明の他の目的は、上位階層の符号化において多重調和局所余弦変換手法を適用する事により、上位階層の符号化効率を向上させる動画像階層符号化装置、動画像階層符号化プログラム、動画像階層復号化装置及び動画像階層復号化プログラムを提供することにある。
更に、本発明の他の目的は、符号化する差分ブロックが、下位階層のローカルデコードデータに対する空間的拡大された予測ブロックを用いて生成される場合に、隣接するブロックが上位階層での動き補償予測により符号化された場合には、隣接するブロックの復号データと、隣接ブロックの下位階層のローカルデコードデータに対する空間的拡大された予測ブロックより生成した隣接ブロックの仮想差分ブロック情報を用いて多重調和局所余弦変換処理を行うことにより、差分ブロックのブロック間の連続性を確保し、効率のよい多重調和局所余弦変換処理を実現し得る上位階層の符号化効率を向上させる動画像階層符号化装置、動画像階層符号化プログラム、動画像階層復号化装置及び動画像階層復号化プログラムを提供することにある。
上記の目的を達成するため、第1の発明の動画像階層復号化装置は、動画像の画像信号の一画面を構成する画像フレーム又は画像フィールドを画像単位としたとき、第1の空間解像度の第1の画像単位信号を符号化して得られた下位階層の第1の符号化信号と、第1の空間解像度よりも高い第2の空間解像度の1又は2以上の第2の画像単位信号を符号化して得られた上位階層の第2の符号化信号とを多重して出力する動画像階層符号化装置において、
画像信号の空間的縮小処理を伴って第1の空間解像度に縮小した下位階層の符号化対象となる第1の画像単位信号に対して符号化を行って、第1の符号化信号を生成する下位階層符号化手段と、下位階層符号化手段内にて第1の符号化信号をローカルデコードして得られた局所復号画像信号に対して空間的拡大処理を行って、少なくとも1階層上の上位階層が持つ空間解像度と同じ空間解像度の拡大復号画像信号に変換する空間的拡大手段と、画像信号と拡大復号画像信号とを入力として受け、拡大復号画像信号を予測情報として用い、上位階層の符号化対象となる第2の空間解像度の1又は2以上の第2の画像単位信号に対して符号化を行って、1又は2以上の第2の符号化信号を生成する上位階層符号化手段とを有する。
更に、第1の発明は、上位階層符号化手段は、符号化対象の画像信号の画像単位を所定の画素数から構成される矩形領域に分割し、その矩形領域を最小単位として拡大復号画像信号を切り出して階層間予測信号を生成する階層間予測手段と、階層間予測信号と第1の動き補償予測信号とのうち、それらの予測差分の情報量に基づいて選択して得た最適予測信号と符号化対象の画像信号との差分信号である第1の予測差分画像信号を生成する第1の予測差分生成手段と、第1の予測差分画像信号に対して、矩形領域を処理単位として直交変換を行い、第1の直交変換係数情報を生成する第1の直交変換手段と、符号化対象となっている矩形領域の隣接する他の矩形領域との境界における、第1の直交変換係数情報から求める画像信号の傾きを境界条件とするポアソン方程式を満たすような、符号化対象となっている矩形領域内の推定信号に対して、直交変換した近似直交変換係数情報を、第1の直交変換手段から取得した第1の直交変換係数情報を利用して生成した後、第1の直交変換係数情報と生成した近似直交変換係数情報との差分をとることで第1の残差直交変換係数情報を生成する第1の多重調和局所直交変換手段と、第1の残差直交変換係数情報を所定の量子化パラメータに基づいて量子化する第1の量子化手段と、第1の量子化手段から出力された量子化後の第1の残差直交変換係数情報に対して、画像単位でエントロピー符号化を行うことで、所定の構文構造に従って第2の画像単位信号に対して符号化された第2の符号化信号である符号化ビットストリームを生成する第1のエントロピー符号化手段と、第1の量子化手段から出力された量子化後の第1の残差直交変換係数情報を、所定の量子化パラメータに基づいて逆量子化する第1の逆量子化手段と、復号化対象となっている矩形領域の隣接する他の矩形領域との境界における、逆量子化後の第1の残差直交変換係数情報から求める画像信号の傾きを境界条件とするポアソン方程式を満たすような、復号化対象となっている矩形領域内の推定信号に対して、直交変換した第1の近似直交変換係数情報を、第1の直交変換手段から取得した第1の直交変換係数情報もしくは第1の逆量子化手段によって生成された逆量子化後の第1の残差直交変換係数情報を利用して生成し、逆量子化後の第1の残差直交変換係数情報と生成した第1の近似直交変換係数情報との合成を行うことで、第1の復号直交変換係数情報を生成する第1の逆多重調和局所直交変換手段と、第1の逆多重調和局所直交変換手段により生成された第1の復号直交変換係数情報を逆直交変換することにより、第1の局所復号画像信号を生成する第1の逆直交変換手段と、第1の復号予測差分信号と最適予測信号との加算を行うことで、第1の局所復号画像信号を生成する第1の局部復号画像生成手段と、第1の局所復号画像信号と符号化対象の画像信号とに基づいて、矩形領域を処理単位として第1の動き補償予測信号を生成する第1の動き補償予測手段とを具備することを特徴とする。
この発明では、動画像における階層符号化において多重調和局所直交変換手法を適用することにより、符号化対象となっている矩形領域の隣接する他の矩形領域との境界における、上位階層符号化において第1の直交変換係数情報から求める画像信号の傾きを境界条件とするポアソン方程式を満たすような、符号化対象となっている矩形領域内の推定信号に対して、直交変換した近似直交変換係数情報を、第1の直交変換手段から取得した第1の直交変換係数情報を利用して生成した後、第1の直交変換係数情報と生成した近似直交変換係数情報との差分をとることで第1の残差直交変換係数情報を生成する。すなわち、この発明では、動画像における階層符号化において多重調和局所直交変換手法を適用することにより、直交変換を行う際に生じる矩形領域の境界部分の不連続性を相殺し、境界部分における波形の滑らかさを向上させるような近似波形を矩形領域間の境界条件から特定し、特定した近似波形の直交変換係数である第1の近似直交変換係数情報を利用して、元の第1の直交変換係数情報との差分から第1の残差直交変換係数情報を生成することで、従来法で問題となっていた不必要な高周波数成分の発生を抑制するものである。また、この発明では生成した第1の残差直交変換係数情報を、従来の直交変換係数情報の替わりに符号化対象として所定の量子化および所定のエントロピー符号化を行う。
また、上記の目的を達成するため、第2の発明は、上記の下位階層符号化手段を、
第1の空間解像度に縮小した符号化対象の画像信号の画像単位を所定の画素数から構成される矩形領域に分割し、その矩形領域を処理単位として第2の動き補償予測信号と第1の空間解像度に縮小した符号化対象の画像信号との差分信号である第2の予測差分画像信号を生成する第2の予測差分生成手段と、第2の予測差分画像信号に対して、矩形領域を処理単位として直交変換を行い、第2の直交変換係数情報を生成する第2の直交変換手段と、符号化対象となっている矩形領域の隣接する他の矩形領域との境界における、第2の直交変換係数情報から求める画像信号の傾きを境界条件とするポアソン方程式を満たすような、符号化対象となっている矩形領域内の推定信号に対して、直交変換した近似直交変換係数情報を、第2の直交変換手段から取得した第2の直交変換係数情報を利用して生成した後、第2の直交変換係数情報と生成した近似直交変換係数情報との差分をとることで第2の残差直交変換係数情報を生成する第2の多重調和局所直交変換手段と、第2の残差直交変換係数情報を所定の量子化パラメータに基づいて量子化する第2の量子化手段と、第2の量子化手段から出力された量子化後の第2の残差直交変換係数情報に対して、画像単位でエントロピー符号化を行うことで、所定の構文構造に従って第1の画像単位信号に対して符号化された第1の符号化信号である符号化ビットストリームを生成する第2のエントロピー符号化手段と、第2の量子化手段から出力された量子化後の第2の残差直交変換係数情報を、所定の量子化パラメータに基づいて逆量子化する第2の逆量子化手段と、復号化対象となっている矩形領域の隣接する他の矩形領域との境界における、逆量子化後の第2の残差直交変換係数情報から求める画像信号の傾きを境界条件とするポアソン方程式を満たすような、復号化対象となっている矩形領域内の推定信号に対して、直交変換した第2の近似直交変換係数情報を、第2の直交変換手段から取得した第2の直交変換係数情報もしくは第2の逆量子化手段によって生成された逆量子化後の第2の残差直交変換係数情報を利用して生成し、逆量子化後の第2の残差直交変換係数情報と生成した第2の近似直交変換係数情報との合成を行うことで、第2の復号直交変換係数情報を生成する第2の逆多重調和局所直交変換手段と、第2の逆多重調和局所直交変換手段により生成された第2の復号直交変換係数情報を逆直交変換することにより、第2の復号予測差分信号を生成する第2の逆直交変換手段と、第2の復号予測差分信号と第2の動き補償予測信号との加算を行うことで、第2の局所復号画像信号を生成する第2の局部復号画像生成手段と、第2の局所復号画像信号と第1の空間解像度に縮小した符号化対象の画像信号とに基づいて、矩形領域を処理単位として第2の動き補償予測信号を生成する第2の動き補償予測手段とを具備することを特徴とする。
この発明では、下位階層符号化手段においても、動画像における階層符号化において多重調和局所直交変換手法を適用することにより、直交変換を行う際に生じる矩形領域の境界部分の不連続性を相殺し、境界部分における波形の滑らかさを向上させるような近似波形を矩形領域間の境界条件から特定し、特定した近似波形の直交変換係数である第2の近似直交変換係数情報を利用して、元の第2の直交変換係数情報との差分から第2の残差直交変換係数情報を生成することで、従来法で問題となっていた不必要な高周波数成分の発生を抑制する。
また、上記の目的を達成するため、第3の発明は、第1の発明の第1の多重調和局所直交変換手段は、ポアソン方程式を満たすような符号化対象となっている矩形領域内の推定信号を直交変換して得た第1の近似直交変換係数情報を、直交変換後の第1の直交変換係数情報を利用して生成する際に、直交変換後の第1の直交変換係数情報に対して量子化で用いる量子化パラメータに基づいて量子化後の第1の直交変換係数情報を推定し、この推定結果に基づいて第1の近似直交変換係数情報を生成する手段であることを特徴とする。
また、上記の目的を達成するため、第4の発明は、上記の第1の予測差分生成手段は、第1の予測差分画像信号を生成するために、階層間予測信号と第1の動き補償予測信号とを、矩形領域単位でそれらの予測差分の情報量を比較することにより最適予測方式を選択して最適予測信号を生成するモード判定手段を含んでおり、上記の上位階層符号化部は、最適予測方式が第1の動き補償予測信号による予測方式である場合に、復号後の第1の局所復号画像信号と階層間予測手段からの階層間予測信号との間の仮想差分信号を矩形領域単位で生成し、この矩形領域の仮想差分信号に対して直交変換処理を行い、仮想差分直交変換係数情報を生成する局所復号・階層間予測差分生成手段を更に有し、局所復号・階層間予測差分生成手段で生成された仮想差分直交変換係数情報を用いて、第1の多重調和局所直交変換手段及び第1の逆多重調和局所直交変換手段における、矩形領域内の推定信号を生成するための情報とすることを特徴とする。
この発明では、符号化対象の矩形領域の差分情報が下位階層の局所復号画像信号に対して空間的拡大処理した拡大符号画像信号を用いて生成する際に、隣接する矩形領域が上位階層での動き補償予測信号を用いて符号化される場合には、局所復号・階層間予測差分生成手段により、復号後の第1の局所復号画像信号と階層間予測手段からの階層間予測信号との間の仮想差分信号を矩形領域単位で生成し、この矩形領域の仮想差分信号に対して直交変換処理を行い、仮想差分直交変換係数情報を生成する。
また、上記の目的を達成するため、第5の発明の動画像階層符号化プログラムは、第1の発明をコンピュータにより実行させ、第6の発明の動画像階層符号化プログラムは、第2の発明の下位階層符号化手段をコンピュータにより実行させる。また、第7の発明の動画像階層符号化プログラムは、第3の発明の第1の多重調和局所直交変換手段をコンピュータにより実行させ、第8の発明の動画像階層符号化プログラムは、第4の発明の第1の直交変換手段をコンピュータにより実行させると共に、コンピュータに実行させる上位階層符号化部は、第4の発明の局所復号・階層間予測差分生成手段を有することを特徴とする。
また、上記の目的を達成するため、第9の発明は、第1、第3又は第4の発明の動画像階層符号化装置、又は第5、第7又は第8の発明の動画像階層符号化プログラムにより動作する情報処理装置によって生成された、動画像の画像信号の一画面を構成する画像フレーム又は画像フィールドを画像単位としたとき、第1の空間解像度の第1の画像単位信号を符号化して得られた下位階層の第1の符号化信号と、第1の空間解像度よりも高い第2の空間解像度の1又は2以上の第2の画像単位信号を符号化して得られた上位階層の第2の符号化信号との多重信号を、所定の蓄積媒体又は所定の伝送路から取得し、取得した多重信号に対して復号化動作を行う動画像階層復号化装置であって、
多重信号から第1の符号化信号と第2の符号化信号とを分離して出力する分離手段と、分離手段からの第1の符号化信号に対して復号化処理を行い、第1の空間解像度の第1の画像単位信号を復号して出力する下位階層復号化手段と、下位階層復号化手段内にてローカルデコードして得られた第1の画像単位信号に対して空間的拡大処理を行って、少なくとも1階層上の上位階層が持つ空間解像度と同じ空間解像度の拡大復号画像信号に変換する空間的拡大手段と、分離手段からの第2の符号化信号と拡大復号画像信号とを入力として受け、拡大復号画像信号を予測情報として用い、上位階層の復号化対象となる第2の空間解像度の1又は2以上の第2の画像単位信号を生成する上位階層復号化手段とを有する構成としたものである。
また、この発明では上記の上位階層復号化手段は、入力された第2の符号化信号に対して、所定の構文情報に基づいて符号化情報の多重化分離とエントロピー復号化を行い、量子化後情報、動きベクトル情報、予測モード情報、および所定の構文構造を構成するために必要なパラメータ情報を生成する第1のエントロピー復号化手段と、第1のエントロピー復号化手段から取得した量子化後情報に対して逆量子化を行うことにより、逆量子化後の第1の残差直交変換係数情報を生成する第1の逆量子化手段と、復号化対象となっている矩形領域の隣接する他の矩形領域との境界における、復号後の第1の直交変換係数情報から求める画像信号の傾きを境界条件とするポアソン方程式を満たすような、復号化対象となっている矩形領域内の推定信号に対して、直交変換した第1の近似直交変換係数情報を、逆量子化後の第1の残差直交変換係数情報を利用して生成した後、逆量子化後の第1の残差直交変換係数情報と生成した第1の近似直交変換係数情報との合成を行うことで、第1の復号直交変換係数情報を生成する第1の逆多重調和局所直交変換手段と、第1の逆多重調和局所直交変換手段により生成された第1の復号直交変換係数情報を逆直交変換することにより、第1の復号予測差分信号を生成する逆直交変換手段と、入力された拡大復号画像信号に対して矩形領域を最小単位として切り出して階層間予測信号を取り出す階層間予測手段と、第1のエントロピー復号化手段から取得した予測モード情報に基づき、階層間予測手段から出力された階層間予測信号と、第1のエントロピー復号化手段から取得した動きベクトル情報を利用して第2の画像単位信号の復号信号に対して所定の動き補償を行うことによって生成する動き補償予測信号とのうちの一方の予測信号を選択して出力する予測生成手段と、予測生成手段により選択された予測信号と第1の復号予測差分信号との加算を行うことで、第2の画像単位信号の復号信号を生成する第1の復号手段とを具備すること特徴とする。
この発明では、本発明の動画像階層符号化装置又は動画像階層符号化プログラムで生成された第1の符号化信号及び第2の符号化信号からなる多重信号から第1の空間階層度の第1の画像単位信号を低解像度画像信号として復号できると共に、第2の空間解像度の第2の画像単位信号を高解像度画像信号として復号できる。
また、上記の目的を達成するため、第10の発明は、第2又は第4の発明の動画像階層符号化装置、又は第6又は第8の発明の動画像階層符号化プログラムにより動作する情報処理装置によって生成された、下位階層の第1の符号化信号と上位階層の第2の符号化信号との多重信号を、所定の蓄積媒体又は所定の伝送路から取得し、取得した多重信号に対して復号化動作を行う。この発明では、下位階層復号化手段として、入力された第1の符号化信号に対して、所定の構文構造に基づいて符号化情報の多重化分離とエントロピー復号化を行い、量子化後情報および動きベクトル情報、および所定の構文構造を構成するために必要なパラメータ情報を生成する第2のエントロピー復号化手段と、第2のエントロピー復号化手段から取得した量子化後情報に対して逆量子化を行うことにより、逆量子化後の第2の残差直交変換係数情報を生成する第2の逆量子化手段と、復号化対象となっている矩形領域の隣接する他の矩形領域との境界における、復号後の第2の直交変換係数情報から求める画像信号の傾きを境界条件とするポアソン方程式を満たすような、復号化対象となっている矩形領域内の推定信号に対して、直交変換した第2の近似直交変換係数情報を、逆量子化後の第2の残差直交変換係数情報を利用して生成した後、逆量子化後の第2の残差直交変換係数情報と生成した第2の近似直交変換係数情報との合成を行うことで、第2の復号直交変換係数情報を生成する第2の逆多重調和局所直交変換手段と、第2の逆多重調和局所直交変換手段により生成された第2の直交変換係数情報を逆直交変換することにより、第2の復号予測差分信号を生成する逆直交変換手段と、第2のエントロピー復号化手段から取得した動きベクトル情報を利用して第1の画像単位信号の復号信号に対して所定の動き補償を行うことによって動き補償予測信号を生成して出力する動き補償予測手段と、上記の動き補償予測信号と第2の復号予測差分信号との加算を行うことで、第1の画像単位信号の復号信号を生成する第2の復号手段とを具備することを特徴とする。
この発明では、本発明の動画像階層符号化装置又は動画像階層符号化プログラムで生成された第1の符号化信号及び第2の符号化信号からなる多重信号から第1の空間階層度の第1の画像単位信号を低解像度画像信号として復号できると共に、第2の空間解像度の第2の画像単位信号を高解像度画像信号として復号できる。
また、上記の目的を達成するため、第11の発明は、第9又は第10の発明の上位階層復号化部に、予測生成手段により動き補償予測信号が選択されたときに、矩形領域の復号後の第2の画像単位信号の復号信号と階層間予測手段から出力される階層間予測信号との間で差分情報を生成する局所復号・階層間予測差分生成手段を更に有し、局所復号・階層間予測差分生成手段で生成された差分情報を用いて、第1の逆多重調和局所直交変換手段における、矩形領域内の推定信号を生成するための情報とすることを特徴とする。
また、上記の目的を達成するため、第12の発明の動画像階層復号化プログラムは、第9の発明の動画像階層復号化装置をコンピュータにより実行させ、第13の発明の動画像階層復号化プログラムは、第11の発明の動画像階層復号化装置をコンピュータにより実行させる。
第1、第3、第5、第7の発明によれば、動画像における階層符号化に対して多重調和局所直交変換手法を適用することで、従来の動画像符号化で用いられてきた所定の矩形領域単位での直交変換における問題点を改善するために、矩形領域に対して直交変換を行う際に境界部分の不連続性を相殺し、境界部分における波形の滑らかさを向上させるような近似波形を矩形領域間の境界条件から特定し、特定した近似波形の直交変換係数情報を利用して、元の直交変換係数との差分から残差直交変換係数情報を生成し、更にこのような残差直交変換係数情報を生成するようにしたため、従来法で問題となっていた不必要な高周波数成分の発生を抑制することができ、上位階層の符号化において多重調和局所余弦変換手法を適用する事により、上位階層の符号化効率を向上させることができる。
また、第1乃至第8の発明によれば、生成した残差直交変換係数情報を、従来の直交変換係数情報の替わりに符号化対象として所定の量子化及び所定のエントロピー符号化を行うことで、従来の動画像符号化における符号化効率を改善することができる。
また、第2、第6の発明によれば、階層符号化装置において、下位階層の符号化劣化が矩形領域間の連続性を破壊する事を回避するために、下位階層の符号化においても多重調和局所余弦変換手法を適用することにより、下位階層の符号化効率の向上と矩形領域間の連続性保持を実現し、上位階層の予測効率を向上し、符号化劣化を低減させることができる。
また、第4、第8の発明によれば、符号化対象の矩形領域の差分情報が下位階層の局所復号画像信号に対して空間的拡大処理した拡大符号画像信号を用いて生成する際に、隣接する矩形領域が上位階層での動き補償予測信号を用いて符号化される場合には、局所復号・階層間予測差分生成手段により、復号後の第1の局所復号画像信号と階層間予測手段からの階層間予測信号との間の仮想差分信号を矩形領域単位で生成し、この矩形領域の仮想差分信号に対して直交変換処理を行い、仮想差分直交変換係数情報を生成するようにしたため、矩形領域の差分信号の矩形領域間の連続性を確保し、効率の良い多重調和局所余弦変換処理を実現し、符号化効率を向上させることができる。
また、本発明の動画像階層符号化プログラムでは、このような本発明の階層符号化装置を実現するための手段によって構成した符号化装置をコンピュータによって実現することで、従来よりも符号化効率の良い階層符号化を行うことができる。
また、第9乃至第14の発明では、本発明の動画像階層符号化装置又は動画像階層符号化プログラムによって生成された第1及び第2の符号化信号の多重信号を所定の伝送路または記録媒体から取得し、復号化するようにしたため、従来よりも少ない符号量をもつ多重信号を効率良く伝送、受信、再生することを可能にすることができる。
さらに、本発明の動画像階層復号化プログラムでは、このような本発明の階層復号化装置を実現するための手段によって構成した復号化装置をコンピュータによって実現することで、従来よりも符号化効率の良い階層復号化を行うことができる。
なお、本発明において、多重調和局所直交変換の変換基底としてDCTを用いた場合は、従来の動画像符号化方式で一般的に用いられる直交変換との互換性を保ちながら、従来の動画像符号化における符号化効率を改善することができる。
次に、本発明の各実施の形態について図面と共に説明する。本発明の動画像階層符号化装置は、図15に示した階層符号化部1501と同じブロック図の構成であり、また、本発明の動画像階層復号化装置は、図15に示した階層復号化部1503と同じブロック図の構成であるが、本発明の動画像階層符号化装置は、階層符号化部1501内の下位階層符号化部1506及び上位階層符号化部1508の構成を図18、図19と異なる構成とした点に特徴があり、また、本発明の動画像階層復号化装置は、階層復号化部1503内の下位階層復号化部1511及び上位階層復号化部1513の構成を図20、図21と異なる構成とした点に特徴がある。
すなわち、本発明の動画像階層符号化装置の第1の実施の形態は、図15の下位階層符号化部(ベースレイヤエンコード部)1506を図1のブロック図に示す構成とし、かつ、図15の上位階層符号化部(エンハンスメントレイヤエンコード部)1508を図3のブロック図に示す構成としたものである。まず、本発明になる動画像階層符号化装置の第1の実施の形態の下位階層符号化部について、図1のブロック図と共に説明する。本実施の形態は、図18に示した従来の下位階層符号化部と比較すると、直交変換器105と量子化器109の間に多重調和局所直交変換器108が設けられ、逆量子化器1810と逆直交変換器112の間に逆多重調和直交変換器111が設けられている点が異なる。
図15の空間的縮小部1505により空間的縮小処理されて図1の入力端子101より入力された動画像に関するデジタル画像信号(デシメーション画像信号)は、入力画像メモリ102に供給されて記憶され、符号化シンタックスに従って符号化される順番に並べ替えを行うため遅延される。入力画像メモリ102から出力されたデジタル画像信号は、2次元ブロック変換器103にてマクロブロックが切り出される。切り出されたマクロブロックデータは、動き補償予測を行う場合にはMC(動き補償)器106より出力される予測ブロックデータとの差分が減算器104において算出され、直交変換器105に供給される。直交変換器105では、2次元DCT変換を行い、DCT係数情報を多重調和局所直交変換器108に出力する。
多重調和局所直交変換器108は、直交変換器105から入力されたDCT係数情報を取得し、各ブロックの境界条件に基づいてポアソン方程式を解析的に解くことでブロック内の近似直交変換係数情報(ここでは近似DCT係数情報)を求める機能を有する。更に多重調和局所直交変換器108は、取得したDCT係数情報と、求めた近似DCT係数情報との差分から残差直交変換係数情報、ここでは残差DCT係数情報を生成する機能を有し、生成した残差DCT係数情報を量子化器109に出力する。
また、多重調和局所直交変換器108は、符号化対象となっている所定のブロックの隣接する他のブロックとの境界における直交変換係数情報(ここではDCT係数情報)から求める画像信号の傾きを境界条件とする前記ポアソン方程式を満たすような、符号化対象となっている所定のブロック内の推定信号に対して直交変換(ここではDCT)を行うことで得られる近似DCT係数情報を、直交変換後のDCT係数情報を利用して生成する際に、符号量制御器116により設定する量子化パラメータを受信し、該当するDCT係数情報の量子化処理に用いられる量子化パラメータに基づいて量子化後のDCT係数情報を推定し、この推定結果に基づいて近似DCT係数情報を生成するような機能を有すると更に良い構成となる。
この多重調和局所余弦変換手法では、図22、図24と共に説明したようにポアソン方程式の概念を導入してブロック内の原信号に対する推定信号を求め、原信号と求めた推定信号との差分である残差信号を生成することで、DCTを導入した際により高い周波数のDCT係数を早く収束させることが可能となり、結果として符号化効率を向上させることができる。本実施の形態では、従来の符号化装置からの拡張が比較的容易であることから、一例として前述したブロック内の原信号と境界条件からの推定信号に対してそれぞれDCTを行うことでそれぞれのDCT係数を求めた後に差分をとる構成を採用している。ただし、本発明は特にこの構成に限定されるものではなく、上述の原信号と推定信号との差分である残差信号に対してDCTを行うような構成であっても構わない。
量子化器109においては、多重調和局所直交変換器108から出力されたDCT係数を周波数成分毎に異なった値を持つ量子化マトリクスにより、係数毎に異なった値で除算することにより、量子化処理したDCT係数を生成する。この量子化処理したDCT係数は、エントロピー符号化器118において、符号化テーブル117の係数に対応したアドレスを参照する事により、可変長または固定長の符号化が行われる。エントロピー符号化器118では、さらにMC器106から出力される動きベクトルや予測モードを上記符号化されたDCT係数と共に所定の構文構造に基づいて符号化し出力することで、符号化ビットストリームを生成する。生成された符号化ビットストリームは、ストリームバッファ119に格納された後、出力端子120を介して、記録媒体もしくは伝送路に出力される。
一方、量子化器109において量子化されたDCT係数は、逆量子化器110において逆量子化処理が行われ、逆量子化後の情報を逆多重調和局所直交変換器111に出力する。逆多重調和局所直交変換器111は、入力された逆量子化後の情報に対して、所定の逆多重調和局所直交変換を行うことで、逆量子化後の残差DCT係数情報から復号して得られた復号DCT係数情報を生成する。
ここで、逆多重調和局所直交変換器111は、復号化対象となるブロックの隣接する他のブロックとの境界における逆量子化後の残差直交変換係数情報(ここでは、残差DCT係数情報)の傾きを境界条件とするポアソン方程式を満たすような、復号化対象となっているブロック内の推定信号に対して、直交変換した近似直交変換係数情報(ここでは、近似DCT係数情報)を逆量子化器110によって生成された逆量子化後の残差直交変換係数情報(ここでは、残差DCT係数情報)を利用して生成する。そして、逆量子化後の残差直交変換係数情報(ここでは、残差DCT係数情報)と、生成した近似直交変換係数情報(ここでは、近似DCT係数情報)を合成する事で、復号直交変換係数情報(ここでは、復号DCT係数情報)を生成する。また、逆多重調和局所直交変換器111は、生成した復号DCT係数情報を、逆直交変換器112に出力する。
逆直交変換器112においては、入力された復号DCT係数情報に対して逆DCT処理を行い、これにより復号ブロック(復号予測差分信号)を生成する。加算器113では、逆直交変換器112からの復号ブロックとMC器106からの予測ブロックとの加算を行い、加算したデータを2次元ブロック逆変換器114に供給して2次元ブロック逆変換処理させる。これにより、ローカルデコードデータ(参照画像信号)が生成され、このローカルデコードデータは参照画像メモリ115に供給されて格納される一方、同時に出力端子121から出力され、上位階層における予測信号に使用される。参照画像メモリ115に格納されたローカルデコードデータは、予測フレームの符号化処理時に使用される。
予測フレームにおいては、入力画像メモリ102から切り出されたマクロブロックデータと参照画像メモリ115に格納されているローカルデコードデータとの間で、ME(動き推定)器107によって、画像間での動きベクトルが求められる。ME器107から出力された動きベクトルは、MC(動き補償)器106に供給され、ここで参照画像メモリ115内の参照画像から予測ブロックを切り出す。MC器106では、複数切り出された予測ブロックの中から最適な予測モードの選択を行い、予測ブロックを減算器104及び加算器113に供給する。
符号量の制御に関しては、符号量制御器116においてエントロピー符号化器118からストリームバッファ119に出力されたビットストリームの符号量と、目標とする符号量との間で比較がとられ、目標符号量に近づけるために量子化器109の量子化の細かさを制御する量子化スケールを生成する。量子化スケールは、量子化器109と多重調和局所直交変換器108に送られる。
次に、図1の本発明の要部の下位階層符号化部の第1の実施の形態の動作を、図2のフローチャートに従って説明する。まず入力端子101に入力される、符号化対象となる画像フレームを準備する(ステップS201)。続いて、2次元ブロック変換器103で、画像フレームを2次元画像ブロックに切り出すためのブロック変換処理を行う(ステップS202)。
続いて、符号化するフレームが基準フレームであるか参照フレームであるかを判定する(ステップS203)。参照フレームである場合には、ME器107が、入力画像メモリ102にある符号化対象となっている画像フレームと、参照画像メモリ115に格納されている所定の参照画像フレームを取得し、動き推定処理を行い(ステップS204)、その動き推定処理によって生成した動きベクトル情報をMC器106に通知する。
MC器106は、ME器107が動き推定処理によって生成した動きベクトル情報を取得する。また、ME器107が動きベクトル情報を生成した際に利用した参照画像フレームを参照画像メモリ115から取得する。取得した動きベクトル情報、参照画像フレームから、予測画像ブロックを生成する(ステップS205)。また、MC器106は、動きベクトル情報をエントロピー符号化するために、エントロピー符号化器118に通知する。
減算器104では、2次元ブロック変換器103から得られる2次元画像ブロックと、MC器106から得られる動き補償予測画像ブロックとの差分画像ブロック(予測差分画像信号)を生成する。基準フレームの場合には、2次元画像ブロックがそのまま保持される。その後ステップS206に進む。直交変換器105は、減算器104から取得した差分画像ブロックもしくは2次元画像ブロックに対して所定の直交変換(例えば、DCT)を行い(ステップS206)、得られた直交変換後の係数情報を多重調和局所直交変換器108に通知する。ここで直交変換後の係数情報は、DCT係数情報であるものとする。
次に、符号量制御器116が、ストリームバッファ119から供給されたビットストリームの符号量と、予め設定されている目標とする符号量とより、量子化処理に用いる量子化パラメータを算出する(ステップS207)。多重調和局所直交変換器108は、直交変換器105から直交変換後の係数情報(ここではDCT係数情報)を取得すると共に、符号量制御器116よりの量子化パラメータを取得し、多重調和局所直交変換処理を行い(ステップS208)、これにより生成した残差DCT係数情報を量子化器109に通知する。
量子化器109は、多重調和局所直交変換器108から残差DCT係数情報を取得し、取得した残差DCT係数情報に対して所定の量子化を行う(ステップS209)ことで量子化後の残差DCT係数情報である量子化後情報を生成する。生成した量子化後情報は逆量子化器110、エントロピー符号化器118に供給される。逆量子化器110は、量子化器109から量子化後情報を取得し、取得した量子化後情報に対して所定の逆量子化を行う(ステップS210)ことで、逆量子化後の残差DCT係数情報である逆量子化後情報を生成する。生成した逆量子化後情報は逆多重調和局所直交変換器111に供給される。
逆多重調和局所直交変換器111は、逆量子化器110から逆量子化後情報を取得し、取得した逆量子化後情報に対して、所定の逆多重調和局所直交変換処理を行う(ステップS211)。これにより、逆量子化後の残差DCT係数情報からDCT係数情報が復号され、その復号DCT係数情報は逆直交変換器112に供給される。
逆直交変換器112は、逆多重調和局所直交変換器111から復号DCT係数情報を取得し、取得した復号DCT係数情報に対して逆直交変換を行う(ステップS212)ことで復号差分画像ブロックを生成する。続いて、符号化するフレームが基準フレームであるか参照フレームであるかを判定する(ステップS213)。
参照フレームである場合には、MC器106が生成した予測画像ブロックと、逆直交変換器112からの復号差分画像ブロックとを加算器113にて加算する事により、動き補償復号を行う(ステップS214)。動き補償復号によって生成された復号画像ブロック(局所復号画像信号)もしくは、基準フレームの場合には逆直交変換器112で逆直交変換を施された結果生成された復号画像ブロック(局所復号画像信号)が、2次元ブロック逆変換器114において、ブロック逆変換によりブロック解除され(ステップS215)、得られた復号画像データが参照画像フレームとして利用できるようにするために、参照画像メモリ115に格納される(ステップS216)。そして、復号画像ブロックを上位階層の予測信号として利用するために、出力端子121よりローカルデコードデータとして出力する(ステップS217)。
エントロピー符号化器118は、量子化器109からの量子化後情報と、MC器106からの動きベクトル情報と予測モード情報とを少なくとも取得し、取得した量子化後情報および動きベクトル情報、予測モード情報に対して、所定のエントロピー符号化を行う(ステップS218)ことで、符号化ビットストリームを生成する。生成された符号化ビットストリームは、ストリームバッファ119を介して、ベースレイヤビットストリーム(下位階層符号化信号)として出力端子120より図15における多重化器1509に対して出力される。
以上のような下位階層の符号化処理を符号化対象となる動画像フレームに対して順次行うことで、本実施の形態の階層符号化装置は従来の階層符号化装置よりも符号化効率の良いベースレイヤビットストリーム(下位階層符号化信号)を出力符号として得ることができる。下位階層(ベースレイヤ)の符号化効率が向上する事で、同一符号量での符号化を行う際の量子化スケールが低く抑えられるため、下位階層(ベースレイヤ)において符号化処理の過程で除去される低周波成分が少なくなり、上位階層(エンハンスメントレイヤ)において、階層間の予測処理の精度が向上する。また、符号量が低く抑えられ、大きな量子化スケールにおいて下位階層(ベースレイヤ)が符号化された場合においても、ブロック間の信号連続性を保つDCT係数成分が復元できるため、下位階層(ベースレイヤ)におけるブロック歪が生じにくく、ブロック歪の影響による上位階層の予測精度の劣化と、上位階層(エンハンスメントレイヤ)の復号画像においてブロック間の不連続性が解消できなくなる問題を防ぐ事が可能となる。
次に、本発明になる動画像階層符号化装置の第1の実施の形態の上位階層符号化部について、図3のブロック図と共に説明する。本実施の形態は、図19に示した従来の上位階層符号化部と比較すると、直交変換器305と量子化器307の間に多重調和局所直交変換器306が設けられ、逆量子化器308と逆直交変換器310の間に逆多重調和直交変換器309が設けられている点が異なる。
入力端子301より入力された空間的縮小処理されていないデジタル画像信号は、入力画像メモリ302に供給されて記憶され、符号化シンタックスに従って符号化される順番に並べ替えを行うため遅延される。入力画像メモリ302から出力されたデジタル画像信号は、2次元ブロック変換器303にてマクロブロックが切り出される。
また、入力端子321より入力された図15の空間的拡大部1507で空間的拡大処理された画像信号(インターポレーション画像信号)は、階層間予測器322により切り出されたマクロブロックと画面内で同一位置におけるベースレイヤローカルデコードデータ(下位階層の局所復号画像信号)のインターポレーション画像信号を2次元ブロックで切り出し、階層間予測ブロックを生成する。
また、上位階層における動き補償予測を行うために、ME(動き推定)器315において、入力画像メモリ302から切り出されたマクロブロックデータと参照画像メモリ313に格納されている画像との間で、動きベクトルが検出される。ME(動き補償)器314から出力された動きベクトルはMC器314に供給され、この動きベクトルに基づき、参照画像メモリ313から供給された参照画像から動き補償予測ブロックを切り出す。更に、MC器314では、複数切り出された動き補償予測ブロックの中から最適な予測モードの選択を行い、動き補償予測ブロックを動きベクトル、予測モードと共にモード判定器323へ供給する。
モード判定器323は、階層間予測ブロックと動き補償予測ブロックの内、予測差分の情報量が少ない予測ブロックを選択し(最適予測方式の予測ブロックを選択し)、選択された予測ブロック(最適予測信号)を減算器304及び加算器311に供給する。更に、モード判定器323は、上記選択された結果に基づいて、予測モードをエントロピー符号化器318へ出力し、動き補償予測が選択された場合には、動きベクトルもエントロピー符号化器318へ出力する。
減算器304では、2次元ブロック変換器303から出力されたマクロブロックデータとモード判定器323から出力された最適予測方式の予測ブロック(最適予測信号)との差分を算出し、直交変換器305に供給する。直交変換器305では、2次元DCT変換を行い、得られたDCT係数情報を多重調和局所直交変換器306に出力する。
多重調和局所直交変換器306は、直交変換器305から入力されたDCT係数情報を取得し、各ブロックの境界条件に基づいてポアソン方程式を解析的に解くことでブロック内の直交変換した近似直交変換係数情報(ここでは近似DCT係数情報)を求める機能を有する。更に多重調和局所直交変換器306は、直交変換器305から取得したDCT係数情報と、求めた近似DCT係数情報との差分から残差直交変換係数情報(ここでは残差DCT係数情報)を生成する機能を有し、生成した残差DCT係数情報を量子化器307に出力する。また、多重調和局所直交変換器306は、符号量制御器316より入力される量子化器307において使用される量子化パラメータを用いて、量子化後のDCT係数情報を推定し、この推定結果に基づいて近似DCT係数情報を生成するような機能を有する。
量子化器307においては、多重調和局所直交変換器306から取得した近似DCT係数情報を周波数成分毎に異なった値を持つ量子化マトリクスにより、係数毎に異なった値で除算することにより、量子化処理する。量子化処理された近似DCT係数情報は、エントロピー符号化器318において、符号化テーブル317の係数に対応したアドレスを参照する事により、可変長または固定長の符号化が行われる。
エントロピー符号化器318では、モード判定器323から供給される動きベクトルや予測モードを、上記量子化処理された近似DCT係数情報と共に所定の構文構造に基づいて符号化し出力することで、符号化ビットストリームを生成する。生成された符号化ビットストリームは、ストリームバッファ319に格納された後、出力端子320を介して、エンハンスメントレイヤの符号化ビットストリーム(上位階層符号化信号)として、図15における多重化部1509に出力される。
一方、量子化器309において量子化された近似DCT係数情報は、逆量子化器308において逆量子化処理が行われ、逆量子化後の情報を逆多重調和局所直交変換器309に出力する。逆多重調和局所直交変換器309は、入力された逆量子化後の情報に対して、所定の逆多重調和局所直交変換を行うことで、逆量子化後の残差DCT係数情報から復号して得られた復号DCT係数情報を生成する。
ここで、逆多重調和局所直交変換器309は、復号化対象となるブロックの隣接する他のブロックとの境界における逆量子化後の残差直交変換係数情報(ここでは、残差DCT係数情報)から求める画像信号の傾きを境界条件とするポアソン方程式を満たすような、復号化対象となっているブロック内の推定信号に対して、直交変換した近似直交変換係数情報(ここでは、近似DCT係数情報)を、逆量子化器308によって生成された逆量子化後の残差直交変換係数情報(ここでは、残差DCT係数情報)を利用して生成する。更に、逆多重調和局所直交変換器309は、逆量子化後の残差直交変換係数情報(ここでは、残差DCT係数情報)と、生成した近似直交変換係数情報(ここでは、近似DCT係数情報)を合成する事で、復号直交変換係数情報(ここでは、復号DCT係数情報)を生成する。また、逆多重調和局所直交変換器309は、生成した復号DCT係数情報を、逆直交変換器310に出力する。
逆直交変換器310においては逆DCT処理を行うことにより復号ブロック(復号予測差分信号)が生成される。加算器311では、逆直交変換器310からの復号ブロックとモード判定器323からの予測ブロックとの加算を行い、得られた加算後のデータを2次元ブロック逆変換器312に供給され、ここで2次元ブロック変換処理されることによりローカルデコードデータ(局所復号画像信号)が生成される。このローカルデコードデータは参照画像メモリ313に供給されて格納される。
次に、図3の第1の実施の形態の上位階層符号化部(エンハンスメントレイヤエンコード部)の動作を、図4のフローチャートに従って説明する。まず、入力端子301に入力される、符号化対象となる画像フレームを準備する(ステップS401)。続いて、2次元ブロック変換器303で、画像フレームを2次元画像ブロックに切り出すためのブロック変換処理を行う(ステップS402)。
続いて、ベースレイヤのローカルデコードデータ(下位階層の局所復号画像信号)を図15における空間的拡大部1507にてインターポレーション(空間的拡大処理)された拡大画像信号が図3の入力端子321を介して階層間予測器322に供給され、ここでエンハンメントレイヤ(上位階層)のマクロブロックと画面内で同一位置、すなわち、上位階層の入力画像と同一時刻の下位階層の局所復号画像信号を拡大した拡大復号画像の同一位置における拡大画像ブロックが切り出されて、階層間予測ブロックが生成される(ステップS403)。
また、ME器315が、入力画像メモリ302にある符号化対象となっている画像フレームと、参照画像メモリ313に格納されている所定の参照画像フレームを取得し、動き推定を行う(ステップS404)。動き推定処理によって生成した動きベクトル情報をMC器314に通知する。
MC器314は、ME器315が動き推定処理によって生成した動きベクトル情報を取得する。また、ME器315が動きベクトル情報を生成した際に利用した参照画像フレームを参照画像メモリ313から取得する。MC器314は、取得した動きベクトル情報、参照画像フレームから、動き補償予測ブロックを生成する(ステップS405)。
モード判定器323は、MC器314から取得した動き補償予測ブロック、動きベクトル情報と、階層間予測器322から取得した階層間予測ブロックとより、動き補償予測ブロックと階層間予測ブロックの各予測差分の情報量を比較して、情報量の少ない方の予測ブロックを選択し、選択された予測ブロックを減算器304及び加算器311に供給する(ステップS406)。
減算器304では、2次元ブロック変換器303から得られる2次元画像ブロックと、モード判定器323から得られる予測ブロックとの差分ブロックを取得する。また、モード判定器323は、動きベクトル情報と予測モードをエントロピー符号化するために、選択した予測ブロックをエントロピー符号化器318に通知する。直交変換器305は、取得した差分画像ブロックに対して所定の直交変換を行う(ステップS407)。直交変換器305は、直交変換後の係数情報を多重調和局所直交変換器306に通知する。ここで直交変換後の係数情報は、DCT係数情報であるものとする。
次に、符号量制御器316が、ストリームバッファ319に出力されたビットストリームの符号量と、予め設定された目標とする符号量とより、量子化処理に用いる量子化パラメータを算出する(ステップS408)。多重調和局所直交変換器306は、直交変換器305から直交変換係数情報(ここではDCT係数情報)を取得し、符号量制御器316より量子化パラメータを取得し、多重調和局所直交変換処理を行う(ステップS409)。すなわち、この多重調和局所直交変換器306は、符号化対象となっている矩形領域であるブロックの隣接する他のブロックとの境界における直交変換係数情報(ここではDCT係数情報)から求める画像信号の傾きを境界条件とするポアソン方程式を満たすような、符号化対象となっているブロック内の推定信号に対して、直交変換した近似直交変換係数情報を、直交変換器305から取得した直交変換係数情報(ここではDCT係数情報)を利用して生成した後、直交変換係数情報(ここではDCT係数情報)と生成した上記の直交変換した近似直交変換係数情報との差分をとることで残差直交変換係数情報(ここでは残差DCT係数情報)を生成して、量子化器307に供給する。
量子化器307は、多重調和局所直交変換器306から残差DCT係数情報を取得し、取得した残差DCT係数情報に対して所定の量子化を行う(ステップS410)ことで量子化後の残差DCT係数情報である量子化後情報を生成する。生成した量子化後情報は逆量子化器308、エントロピー符号化器318に供給される。
逆量子化器308は、量子化器307から量子化後情報を取得し、取得した量子化後情報に対して所定の逆量子化を行う(ステップS411)。これにより、逆量子化後の残差DCT係数情報である逆量子化後情報が生成され、その逆量子化後情報を逆多重調和局所直交変換器309に供給する。
逆多重調和局所直交変換器309は、逆量子化器310から逆量子化後情報を取得する。取得した逆量子化後情報に対して、所定の逆多重調和局所直交変換処理を行う(ステップS412)ことで、逆量子化後の残差DCT係数情報から復号して得られた復号DCT係数情報を生成する。生成した復号DCT係数情報を逆直交変換器310に通知する。逆直交変換器310は、逆多重調和局所直交変換器309から復号DCT係数情報を取得し、取得した復号DCT係数情報に対して逆直交変換を行う(ステップS413)ことで復号差分画像ブロックを生成する。
続いて、モード判定器323から出力された予測ブロックと、逆直交変換器310から出力された復号差分ブロックを加算器311にて加算する事により、予測復号を行い復号画像ブロックが生成される(ステップS414)。復号画像ブロックは、2次元ブロック逆変換器312において、ブロック解除され(ステップS415)、参照画像フレームとして利用できるようにするために、参照画像メモリ313に格納される(ステップS416)。
一方、エントロピー符号化器318は、量子化器307から量子化後情報、モード判定器323から予測モード情報を少なくとも取得し、動き補償予測モードが選択された場合には動きベクトルも取得し、取得した量子化後情報および動きベクトル情報、予測モード情報に対して、所定のエントロピー符号化を行う(ステップS417)ことで、符号化ビットストリームを生成する。生成した符号化ビットストリームはストリームバッファ319を介して、エンハンスメントレイヤビットストリーム(上位階層符号化信号)として出力端子320より図15における多重化部1509に対して出力される。
本実施の形態の上位階層符号化部は以上のような上位階層の符号化処理を符号化対象となる動画像フレームに対して順次行うことで、従来の階層符号化装置よりも符号化効率の良いエンハンスメントレイヤの符号化ビットストリーム(上位階層符号化信号)を出力符号として得ることができる。
次に、本発明の動画像階層復号化装置の第1の実施の形態について説明する。本実施の形態の動画像階層復号化装置は、図15の階層復号化部1503と同様のブロック構成であるが、図15の下位階層復号化部(ベースレイヤデコード部)1511を図5のブロック図に示す構成とし、かつ、図15の上位階層復号化部(エンハンスメントレイヤデコード部)1513を図7のブロック図に示す構成としたものである。
まず、本発明になる動画像階層復号化装置の第1の実施の形態の下位階層復号化部について、図5のブロック図と共に説明する。本実施の形態の下位階層復号化部は、図20に示した従来の下位階層復号化部と比較して、逆量子化器506と逆直交変換器508の間に逆多重調和直交変換器507が設けられている点に特徴がある。
図15における領域分割部1510により分割されて図5の入力端子501に入力されたベースレイヤビットストリーム(下位階層符号化信号)は、ストリームバッファ502に一時格納された後、エントロピー復号器503に供給される。エントロピー復号器503では、符号化テーブル504を用いて可変長または固定長の符号を復号し、量子化された残差DCT係数と動きベクトルや予測モードを復元する。
逆量子化器506は量子化された残差DCT係数を入力として受け、逆量子化後の残差DCT係数情報である逆量子化後情報を生成する。また、逆量子化器506は、生成した逆量子化後情報を逆多重調和局所直交変換器507に供給する機能を有する。逆多重調和局所直交変換器507は、逆量子化器506から逆量子化後情報を取得し、取得した逆量子化後情報に対して、所定の逆多重調和局所直交変換を行うことで、逆量子化後の残差DCT係数情報から復号して得られた復号DCT係数情報を生成する。また、逆多重調和局所直交変換器507は、生成した復号DCT係数情報を逆直交変換器508に出力する。
逆直交変換器508は、逆多重調和局所直交変換器507から取得した復号DCT係数情報に対して逆直交変換を行うことで復号差分画像ブロックを生成する。生成した復号差分画像ブロックは基準フレームの場合には、そのまま復号画像ブロックとなり、加算器509、2次元ブロック逆変換器510を介してデコード画像信号として出力画像メモリ512に蓄えられた後、出力時刻順に並べ替えられ、出力端子514より低解像度映像信号として出力される。この出力端子514は、図15における出力端子1514と同じである。また、デコード画像信号は、参照画像メモリ511にも供給されて格納されると共に、出力端子513より図15の空間的拡大部1512に供給され、上位階層(エンハンスメントレイヤ)の復号における予測信号に使用される。
予測フレームにおいては、エントロピー復号器503から出力される動きベクトル及びモード信号をMC器505が取得し、参照画像メモリ511より参照画像を切り出す事により、予測ブロックが生成される。生成された予測ブロックは加算器509に供給され、逆直交変換器508から出力される復号差分画像ブロックと加算される。加算された復号ブロックは、基準フレームと同様に2次元ブロック逆変換器510を介してデコード画像信号として出力画像メモリ512に蓄えられた後、出力時刻順に並べ替えられ、出力端子514より出力される。また、デコード画像信号は出力端子513より出力され、上位階層(エンハンスメントレイヤ)における予測信号に使用されると共に、該当フレームが参照を受ける画像の場合には、参照画像メモリ511にも供給されて格納される。
次に、図5の本実施の形態による下位階層復号化部の動作を、図6のフローチャートに従って説明する。まず、エントロピー復号器503は、入力端子501より入力された、本実施の形態の階層符号化装置および階層符号化方法によって生成したベースレイヤビットストリーム(下位階層符号化信号)を取得し、取得したビットストリームに対して所定の構文構造に基づいて符号化情報の多重化分離を行い(ステップS601)、符号化テーブル504のデータを用いて所定のエントロピー復号化を行う(ステップS602)。このエントロピー復号化により生成された、量子化後情報および動きベクトル情報、およびその他の所定の構文構造を構成するために必要なパラメータ情報などのうち、少なくとも量子化後情報が逆量子化器506に供給されるともに、動きベクトル情報がMC器505に供給される。
逆量子化器506は、エントロピー復号器503から量子化後情報を取得し、取得した量子化後情報に対して所定の逆量子化を行う(ステップS603)ことで、逆量子化後の残差DCT係数情報である逆量子化後情報を生成し、生成した逆量子化後情報を逆多重調和局所直交変換器507に通知する。
続いて、符号化するフレームが基準フレームであるか参照フレームであるかを判定する(ステップS604)。予測フレームの場合には、MC器505がエントロピー復号器503から取得した動きベクトル情報を用いて、動きベクトルが検出された参照フレームを構成するように復号および格納された参照フレームを参照画像メモリ511から取得し、取得したその動きベクトル情報、参照画像フレームを用いて、動き補償を行い(ステップS605)、これにより生成した予測画像ブロック(動き補償予測信号)を加算器509に出力する。基準フレームの場合には、予測画像ブロックは生成されず、加算器509にはMC器505からゼロデータが供給される。
次に、逆多重調和局所直交変換器507は逆量子化器506から逆量子化後情報を取得し、取得したその逆量子化後情報に対して、所定の逆多重調和局所直交変換を行い(ステップS606)、逆量子化後の残差DCT係数情報から復号して得られた復号DCT係数情報を生成し、生成した復号DCT係数情報を逆直交変換器508に供給する。逆直交変換器508は、逆多重調和局所直交変換器507から復号DCT係数情報を取得し、取得した復号DCT係数情報に対して逆直交変換を行い(ステップS607)、復号差分ブロックを生成する。
生成した復号差分画像ブロックは、MC器505から出力された予測画像ブロックと加算器509にて加算されて復号画像ブロックが生成される(ステップ608)。この復号画像ブロックは、2次元ブロック逆変換器508により2次元逆ブロック変換処理が施されて(ステップS609)、デコード画像信号が生成される。
このデコード画像信号は、出力画像メモリ512に蓄えられて出力時刻順に並べ替えられた後、低解像度復号画像(ベースレイヤデコード画像信号)として出力端子514より出力される(ステップS610)。また、デコード画像信号は、参照画像メモリ511にも供給されて格納される(ステップS611)と共に、出力端子513より図15の空間的拡大部1512にベースレイヤのローカルデコードデータとして供給され、エンハンスメントレイヤにおける予測信号に使用される(ステップS612)。その後、更に復号化対象となる符号化ビットストリームが存在するかを判定する(ステップS613)。復号化の必要がある場合にはステップS601に進むことで復号化処理を継続し、復号化の必要がない場合には一連の復号化処理を終了する。
次に、本発明になる動画像階層復号化装置の第1の実施の形態の上位階層復号化部について、図7のブロック図と共に説明する。本実施の形態の上位階層復号化部は、図21に示した従来の上位階層復号化部と比較して、逆量子化器706と逆直交変換器708の間に逆多重調和直交変換器707が設けられている点に特徴がある。
図15における領域分割部1510より図7の入力端子701に入力されたエンハンスメントレイヤビットストリーム(上位階層符号化信号)は、ストリームバッファ702に一時格納された後、エントロピー復号器703に供給される。エントロピー復号器703では、符号化テーブル704を用いて可変長または固定長の符号を復号し、量子化された残差DCT係数と動きベクトルや予測モードを復元する。残差DCT係数は、逆量子化器706に供給され、動きベクトルや予測モードは予測生成器711に供給される。
また、図15の空間的拡大部1512から図7の入力端子709に拡大された下位階層復号画像であるインターポレーション画像信号が入力され、階層間予測器710により2次元ブロックに切り出され、階層間予測ブロックが生成される。
予測生成器711においては、エントロピー復号器703より入力された予測モードより、動き補償予測を行うか階層間予測を行うかを判断し、階層間予測が選択された場合には、階層間予測器710から階層間予測ブロックを受け取る。動き補償予測が選択された場合には、MC器712に動きベクトルを供給し、動き補償予測ブロックを受け取る。MC器712は、予測生成器711より入力された動きベクトルを用いて、参照画像メモリ715内の参照画像から動き補償予測ブロックを切り出す。予測生成器711は、上記選択した予測ブロックを加算器713に出力する。
逆量子化器706は量子化された残差DCT係数を入力し、逆量子化後の残差DCT係数情報である逆量子化後情報を生成する。また、逆量子化器706は、生成した逆量子化後情報を逆多重調和局所直交変換器707に通知する機能を有する。逆多重調和局所直交変換器707は、逆量子化器706から逆量子化後情報を取得し、取得した逆量子化後情報に対して、所定の逆多重調和局所直交変換を行うことで、逆量子化後の残差DCT係数情報から復号した復号DCT係数情報を生成する。また、逆多重調和局所直交変換器707は、生成した復号DCT係数情報を逆直交変換器708に出力する。逆直交変換器708は、逆多重調和局所直交変換器707から取得した復号DCT係数情報に対して逆直交変換を行うことで復号差分画像ブロック(復号予測差分信号)を生成する。
加算器713は、予測生成器711から供給される予測ブロックと、逆直交変換器708より供給される復号差分画像ブロックとを加算し、復号ブロックを生成する。生成された復号ブロックは、2次元ブロック逆変換器714を介してデコード画像信号として出力画像メモリ716に蓄えられ出力時刻順に並べ替えられた後、出力端子717より出力される。出力端子717に出力されるエンハンスメントレイヤデコード画像信号(上位階層復号画像信号)が、高解像度映像出力となる。この出力端子717は、図15における出力端子1515と同じである。また、2次元ブロック逆変換器714から出力されたデコード画像信号は参照画像メモリ715にも供給され、続く画像信号の動き補償予測信号に使用するために格納される。
次に、図7の第1の実施の形態による上位階層復号化部の動作を、図8のフローチャートに従って説明する。まず、エントロピー復号器703は、入力端子701より入力された、本発明の階層符号化装置および階層符号化方法によって生成したエンハンスメントレイヤビットストリーム(上位階層符号化信号)を取得し、取得したビットストリームに対して所定の構文構造に基づいて符号化情報の多重化分離を行い(ステップS801)、符号化テーブル704のデータを用いて所定のエントロピー復号化を行う(ステップS802)ことで、量子化後情報、予測モードおよび動きベクトル情報、およびその他の所定の構文構造を構成するために必要なパラメータ情報などを生成する。その後、少なくとも量子化後情報は逆量子化器706に供給されると共に、予測モード情報、動きベクトル情報が予測生成器711に供給される。
逆量子化器706は、エントロピー復号器703から量子化後情報を取得し、取得したその量子化後情報に対して所定の逆量子化を行い(ステップS803)、逆量子化後の残差DCT係数情報である逆量子化後情報を生成し、生成した逆量子化後情報を逆多重調和局所直交変換器707に供給する。
続いて、予測生成器711において予測ブロックの生成方法が階層間予測であるか、動き補償予測であるかを判定する(ステップS804)。階層間予測の場合には、階層間予測器710が入力端子709より受信した、図15における空間的拡大部1512より供給されたインターポレーション画像信号より、階層間予測ブロックを生成する(ステップS805)。
動き補償予測の場合には、予測生成器711がMC器712に対してエントロピー復号器703からの動きベクトルを供給し、MC器712がその動きベクトルを用いて、動きベクトルが検出された参照フレームを構成するように復号及び格納された参照フレーム(上位階層の復号信号であるデコード画像信号)を参照画像メモリ715から取得し、取得したその動きベクトル情報、参照画像フレームを用いて、動き補償を行う(ステップS806)。これにより、MC器712は動き補償予測画像ブロックを生成し、その動き補償予測画像ブロックを予測生成器711に出力する。予測生成器711は、選択して受信した動き補償予測画像ブロックを、加算器713に出力する。
一方、逆多重調和局所直交変換器707は逆量子化器706から逆量子化後情報を取得し、取得した逆量子化後情報に対して、所定の逆多重調和局所直交変換を行い(ステップS807)、逆量子化後の残差DCT係数情報から復号して得られた復号DCT係数情報を生成し、生成した復号DCT係数情報を逆直交変換器708に供給する。逆直交変換器708は、逆多重調和局所直交変換器707から復号DCT係数情報を取得し、取得した復号DCT係数情報に対して逆直交変換を行い(ステップS808)、復号差分ブロックを生成する。
続いて、予測生成器711から出力された予測画像ブロックと、逆直交変換器708から出力された復号差分画像ブロックとが加算器713に供給されて加算され、復号画像ブロックが生成される(ステップS809)。この復号画像ブロックは、2次元ブロック逆変換器714により逆ブロック変換処理が施されて(ステップS810)、デコード画像信号が生成される。
このデコード画像信号は、出力画像メモリ716に蓄えられて出力時刻順に並べ替えられ、高解像度復号画像信号(エンハンスメントレイヤデコード画像信号)として出力端子717より出力される(ステップS811)。また、上記のデコード画像信号は、参照画像メモリ715にも供給されて、動き補償予測の参照画像として格納される(ステップS812)。その後、更に復号化対象となる符号化ビットストリームが存在するかを判定する(ステップS813)。復号化の必要がある場合にはステップS801に進むことで復号化処理を継続し、復号化の必要がない場合には一連の復号化処理を終了する。
以上のような構成に基づいて動画像フレームに対する階層符号化・階層復号化処理を行うことで、本実施の形態では符号化対象となる動画像フレーム内の下位階層(ベースレイヤ)及び上位階層(エンハンスメントレイヤ)のブロック領域に対して直交変換を行う際に境界部分の不連続性を相殺し、境界部分における波形の滑らかさを向上させるような近似波形をブロック間の境界条件から特定できる。その後、元の直交変換係数との差分から残差直交変換係数を生成できる。本実施の形態では、このような残差直交変換係数を生成することで、従来法で問題となっていた不必要な高周波数成分の発生を抑制できる。
また、生成した残差直交変換係数を、従来の直交変換係数の替わりに符号化対象として所定の量子化及び所定のエントロピー符号化を行うことで、従来の階層符号化に対して、下位階層における符号化効率改善と、上位階層における階層間予測効率の向上による符号化効率改善を可能とする。
次に、本発明の階層符号化装置及び階層符号化方法を実現するための第2の実施の形態について説明する。本発明の動画像階層符号化装置の第2の実施の形態は、図15の下位階層符号化部(ベースレイヤエンコード部)1506を図1のブロック図に示す構成とし、かつ、図15の上位階層符号化部(エンハンスメントレイヤエンコード部)1508を図9のブロック図に示す構成としたものである。すなわち、第2の実施の形態は、下位階層の符号化処理に対しては、第1の実施の形態と同一処理が行われるのに対し、上位階層の符号化処理に対して追加処理を施すことで、更に符号化効率を向上させるようにしたものである。
図9は本発明になる動画像階層符号化装置の第2の実施の形態の上位階層符号化部のブロック図を示す。同図中、図3と同一構成部分には同一符号を付し、その説明を省略する。上位階層の符号化処理においては、ブロック単位で動き補償予測と階層間予測とが選択されて、予測差分情報が少ない予測方式を用いて符号化される。動き補償予測の場合には、他のフレームの同一物体を検出して動き補償を行うが、必ずしも正確な動きを検出できずに、最終的に予測差分が少ない動きベクトルを選択して、予測処理が行われる。一方、階層間予測の場合には、同じ時刻の低解像度情報より予測されるため、同一物体の情報間での予測となっている。よって、階層間予測で予測されているブロック間における信号の連続性は保たれているが、動き補償予測で予測されたブロックと階層間予測で予測されたブロックの間においては、連続性が保たれていない予測画像ブロックが生成される。
この場合、ブロック境界で不連続な状態となり、従来の多重調和局所直交変換手法を適用すると、本来ブロック間の不連続な状態を保つように符号化を行う必要があるにも拘らず、ブロック間の相関が高く、連続性が保たれていることを想定して符号化処理を行うため、自然画像の場合と比較して十分な符号化効率が得られないことがある。
そこで、このような問題点を解決するために、この第2の実施の形態においては、階層符号化装置、階層復号化装置における上位階層の処理に機能追加を行う。すなわち、図9に示す第2の実施の形態の上位階層符号化部では、図3に示した第1の実施の形態の上位階層符号化部に対して、少なくとも局所復号・階層間予測差分生成器901を更に追加したものである。
図9において、局所復号・階層間予測差分生成器901は、モード判定器323よりモード情報と階層間予測ブロックを受信し、モード情報が動き補償予測モードを示した場合には、加算器311から出力される復号画像ブロックを取得し、モード判定器323より受信した階層間予測ブロックとの間で仮想差分ブロックを生成する。この生成した仮想差分ブロックは、続くブロックが階層間予測モードである場合の多重調和局所直交変換器306における境界条件に用いる周辺ブロック情報として使用する。
図9においては、多重調和局所直交変換器306において、境界条件からの推定信号に対してそれぞれDCTを行うことでそれぞれのDCT係数を求めた後に差分をとる構成を採用しているため、局所復号・階層間予測差分生成器901では、生成した上記の仮想差分ブロックに対して更に直交変換を行って仮想差分DCT係数を生成し、その仮想差分DCT係数を多重調和局所直交変換器306に供給する。
ここでは、境界条件として必要となるDCT成分のみを供給すればよいので、必要な成分に関する演算のみを行う処理を具備することも可能である。原信号と推定信号との差分である残差信号に対して、DCTを行うような構成である場合であれば、局所復号・階層間予測差分生成器901において直交変換を行う必要はなく、ブロックで連続性が保たれている推定信号を、動き補償予測モードの場合に仮想的に生成することで、階層間予測モードの場合の予測差分に対する効率の良い多重調和局所余弦変換処理が実現できる。
局所復号・階層間予測差分生成器901で生成された仮想差分DCT係数は、多重調和局所直交変換器306に供給される一方、逆多重調和局所直交変換器309にも供給され、復号時の推定処理に使用される。
次に、図9の上位階層符号化部の第2の実施形態の動作を、図10のフローチャートに従って説明する。図10中、図4と同一処理ステップには同一符号を付し、その説明を省略する。図10では、少なくとも仮想差分DCT係数を取得するための処理(ステップS1019、S1020、S1021)を更に追加する。以下、追加された処理に関するのみ説明を行う。
モード判定器323から出力された予測ブロックと、逆直交変換器310から出力された復号差分ブロックとを加算器311にて加算することにより生成された復号画像ブロックが、局所復号・階層間予測差分生成器901に入力される。また、モード判定器323からは、階層間予測ブロックと予測モード情報が局所復号・階層間予測差分生成器901に供給される。局所復号・階層間予測差分生成器901では、入力された予測モードが動き補償予測モードであるかどうか判定し(ステップS1019)、動き補償予測モードである場合は復号画像ブロックと階層間予測ブロックの間の仮想差分ブロックを生成する(ステップS1020)。そして、局所復号・階層間予測差分生成器901は、この仮想差分ブロックに対して直交変換処理を行い、仮想差分DCT係数を生成して多重調和局所直交変換器306および逆多重調和局所直交変換器309にそれぞれ供給する(ステップS1021)。その後、ステップS415以降の処理が行われる。
なお、ステップS1019で局所復号・階層間予測差分生成器901は、入力された予測モードが動き補償予測モードでないと判定したときは、ステップS1020及びS1021の処理を行わず、ステップS415以降の処理を行う。
次に、本発明の階層復号化装置及び階層復号化方法を実現するための第2の実施の形態について説明する。本発明の動画像階層復号化装置の第2の実施の形態は、図15の下位階層復号化部(ベースレイヤデコード部)1511を図5のブロック図に示す構成とし、かつ、図15の上位階層復号化部(エンハンスメントレイヤデコード部)1513を図11のブロック図に示す構成としたものである。すなわち、第2の実施の形態の動画像階層復号化装置は、下位階層の復号化処理に対しては、第1の実施の形態と同一処理が行われるのに対し、上位階層の復号化処理に対して追加処理を施すようにしたものである。
図11は本発明の動画像階層復号化装置の第2の実施の形態の上位階層復号化部のブロック図を示す。同図中、図7と同一構成部分には同一符号を付し、その説明を省略する。図11の第2の実施の形態の上位階層復号化部においては、図7に示した第1の実施の形態の上位階層復号化部に対して、少なくとも局所復号・階層間予測差分生成器1101を追加した構成である。
図11において、局所復号・階層間予測差分生成器1101は、予測生成器711よりモード情報を受信すると共に、階層間予測器710より階層間予測ブロックを受信する。局所復号・階層間予測差分生成器1101は、モード情報が動き補償予測モードを示した場合には、加算器713から出力される復号画像ブロックを取得し、階層間予測ブロックとの間で仮想差分ブロックを生成する。この仮想差分ブロックは、続くブロックが階層間予測モードである場合の逆多重調和局所直交変換器707における境界条件に用いる周辺ブロック情報として使用する。
図11においては、逆多重調和局所直交変換器707において、境界条件からの推定信号に対してそれぞれDCTを行うことでそれぞれのDCT係数を求めた後に差分をとる構成を採用しているため、局所復号・階層間予測差分生成器1101では更に上記の仮想差分ブロックに対して直交変換を行うことにより、仮想差分DCT係数を生成して逆多重調和局所直交変換器707に供給する。ここでは境界条件として必要となるDCT成分のみを供給すればよいので、必要な成分に関する演算のみを行う処理を具備することも可能である。
なお、原信号と推定信号との差分である残差信号に対して、DCTを行うような構成である場合であれば、局所復号・階層間予測差分生成器1101において直交変換を行う必要はなく、ブロックで連続性が保たれている推定信号を、動き補償予測モードの場合に仮想的に生成することで、階層間予測モードの場合の予測差分に対する効率の良い多重調和局所余弦変換処理が実現できる。
次に、図11に示す上位階層復号化部の第2の実施の形態の動作を、図12のフローチャートに従って説明する。図12中、図8と同一処理ステップには同一符号を付し、その説明を省略する。図12のフローチャートは、図8に示したフローチャートに対して、少なくとも仮想差分DCT係数を取得するための処理(ステップS1214、S1215、S1216)を更に追加したものである。以下、追加された処理に関するのみ説明を行う。
図11において、階層間予測器710から出力された階層間予測ブロックと逆直交変換器708から出力された復号差分ブロックとを加算器713にて加算することにより生成された復号画像ブロックが局所復号・階層間予測差分生成器1101に入力される。また、階層間予測器710から出力された階層間予測ブロックと共に予測生成器711から出力された予測モード情報も局所復号・階層間予測差分生成器1101に供給される。
局所復号・階層間予測差分生成器1101では、予測モードが動き補償予測モードであるかどうか判定し(ステップS1214)、動き補償予測モードである場合は復号差分ブロックと階層間予測ブロックの間の仮想差分ブロックを生成する(ステップS1215)。そして、生成した仮想差分ブロックに対して直交変換処理を行い、仮想差分DCT係数を生成して逆多重調和局所直交変換器707に供給する(ステップS1216)。ステップS1216に続いて図12のステップS810以降の処理が行われる。
一方、局所復号・階層間予測差分生成器1101は、ステップS1214で予測モードが動き補償予測モードでないと判定したときは、ステップS1215及びS1216の処理を行うことなく、図12のステップS810以降の処理を行う。
以上の第2の実施の形態では、符号化する差分ブロックが、下位階層のローカルデコードデータに対する空間的拡大された予測ブロックを用いて生成される場合に、隣接するブロックが上位階層での動き補償予測により符号化された場合には、隣接するブロックの復号データと、隣接ブロックの下位階層のローカルデコードデータに対する空間的拡大された予測ブロックより生成した隣接ブロックの仮想差分ブロック情報を用いて多重調和局所余弦変換処理を行う。これにより、差分ブロックのブロック間の連続性を確保し、効率の良い多重調和局所余弦変換処理を実現し、符号化効率を向上させることができる。
なお、本発明は、上記図1、図3、図5、図7、図9、図11が示す階層符号化装置および階層復号化装置の機能を図13、図14に示すコンピュータである中央処理制御装置1303,1403に実現させるためのプログラムを含むものである。
図13は本発明になる動画像階層符号化プログラムにより動作する情報処理装置の一例の構成図を示す。同図において、情報処理装置1300は、各種の情報を入力するための入力装置1301と、各種の情報を出力するための出力装置1302と、本発明の動画像階層符号化プログラムにより動作する中央処理制御装置1303と、外部記憶装置1304と、中央処理制御装置1303による演算処理の際の作業領域など用いる一時記憶装置1305と、外部と通信するための通信装置1306とが、双方向のバス1307により接続された構成とされている。
中央処理制御装置1303は、本発明の動画像階層符号化プログラムが記録媒体から、あるいは通信ネットワークを介して配信されて通信装置1306により取り込まれ、図1、図3の直交変換器105、305に相当する直交変換手段1308、多重調和局所直交変換器108、306に相当する多重調和局所直交変換手段1309、量子化器109、307に相当する量子化手段1310、逆量子化器110、308に相当する逆量子化手段1311、逆多重調和局所直交変換器111、309に相当する逆多重調和局所直交変換手段1312、逆直交変換器112、310に相当する逆直交変換手段1313、2次元ブロック変換器103、303に相当する2次元ブロック変換手段1314、ME器107、315に相当するME手段1315、MC器106、314に相当するMC手段1316、2次元ブロック逆変換器114、312に相当する2次元ブロック逆変換手段1317、エントロピー符号化器118、318に相当するエントロピー符号化手段1318、符号量制御器116、316に相当する符号量制御手段1319の各機能を少なくとも有し、さらに図15における空間的縮小部1505に相当する空間的縮小手段1320、空間的拡大部1507に相当する空間的拡大手段1321、多重化部1509に相当する多重化手段1322による階層符号化機能を有し、それに加えてモード判定器323に相当するエンハンスメントレイヤ予測モード判定手段1323、階層間予測器322に相当する階層間予測手段1324、図9の局所復号・階層間予測差分生成器901に相当する局所復号・階層間予測差分生成手段1325を有し、図1、図3もしくは図9に示す動画像階層符号化装置と同様の動作をソフトウェア処理により実行する。
図14は本発明になる動画像階層復号化プログラムにより動作する情報処理装置の一例の構成図を示す。同図において、情報処理装置1400は、各種の情報を入力するための入力装置1401と、各種の情報を出力するための出力装置1402と、本発明の動画像階層復号化プログラムにより動作する中央処理制御装置1403と、外部記憶装置1404と、中央処理制御装置1403による演算処理の際の作業領域など用いる一時記憶装置1405と、外部と通信するための通信装置1406とが、双方向のバス1407により接続された構成とされている。
中央処理制御装置1403は、本発明の動画像階層復号化プログラムが記録媒体から、あるいは通信ネットワークを介して配信されて通信装置1406により取り込まれ、図5、図7のエントロピー復号器503、703に相当するエントロピー復号化手段1408、逆量子化器506、706に相当する逆量子化手段1409、逆多重調和局所直交変換器507、707に相当する逆多重調和局所直交変換手段1410、逆直交変換器508、708に相当する逆直交変換手段1411、2次元ブロック逆変換器510、714に相当する2次元ブロック逆変換手段1412、MC器505、712に相当するMC手段1413の各機能を少なくとも有し、さらに図15における領域分割部1510に相当するエクストラクト手段1414、空間的拡大部1512に相当する空間的拡大手段1415による階層復号化機能を有し、それに加えて図7の予測生成器711に相当するエンハンスメントレイヤ予測ブロック生成手段1416、階層間予測器710に相当する階層間予測手段1417、図11の局所復号・階層間予測差分生成器1101に相当する局所復号・階層間予測差分生成手段1418を有し、図5、図7もしくは図11に示す動画像階層復号化装置と同様の動作をソフトウェア処理により実行する。
本発明による動画像階層符号化装置及び動画像階層復号化装置においては、下位階層と上位階層のそれぞれにおいて、多重調和局所余弦変換手法を適用しているが、下位階層に適用されることによる効果と、上位階層に適用されることによる効果は、それぞれ独立して発揮され、どちらか一方の階層に対して適用した場合にも効果は発揮される。
また、本発明による動画像階層符号化装置においては、下位階層の符号化において多重調和局所余弦変換手法を適用する事により、下位階層の符号化効率の向上が実現できると共に、ブロック間の連続性保持が実現されることで、下位階層の復号データを階層間予測に用いる上位階層の予測効率を向上する事ができ、上位階層の符号化劣化を低減させる事が可能となる。
また、本発明の動画像階層符号化装置においては、上位階層の符号化において多重調和局所余弦変換手法を適用する事により、予測差分ブロックに対する不必要な高周波数成分の発生を抑制し、符号化効率を向上させることができる。更に、符号化する差分ブロックが、下位階層の復号データに対する空間的拡大された階層間予測ブロックを用いて生成される場合に、隣接するブロックが上位階層での動き補償予測ブロックとの差分により符号化された場合には、隣接するブロックの復号データと、隣接ブロックの下位階層の復号データに対する空間的拡大された階層間予測ブロックの差分を生成し、隣接ブロックの仮想差分ブロック情報として用い、多重調和局所余弦変換処理を行う。これにより、差分ブロックのブロック間の連続性を確保し、効率の良い多重調和局所余弦変換処理を実現し、更なる符号化効率を可能とする。
なお、以上の本発明の実施の形態では説明を簡単にするために、下位階層と上位階層の2階層構造の動画像階層符号化装置および動画像階層復号化装置について説明を行った。ただし、動画像階層符号化装置および動画像階層復号化装置の構成例としては、本発明は階層数に関しては特に限定するものではなく、本実施の形態の上位階層の符号化・復号化処理を複数階層に拡張することにより、容易に拡張できる。この場合、例えば動画像の画像信号の一画面を構成する画像フレーム又は画像フィールドを画像単位信号としたとき、上記画像信号から上位階層の符号化対象となる互いに異なる空間解像度を含む複数の第1の画像単位信号と、上記画像信号の縮小処理を伴って、複数の上位階層の符号化対象となる第1の画像単位信号の空間解像度以下の空間解像度に縮小した下位階層の符号化対象となる第2の画像単位信号とを用意し、空間方向、時間方向及び階層間の相関を利用して符号化を行うことなる。
また、本発明の実施の形態は動画像符号化の構成としてMPEG−2符号化方式を用いたが、MPEG−1、MPEG−4、H.264などの、直交変換を用いた他の動画像符号化規格を用いても同様の効果を期待でき、適用することが可能である。
本発明の動画像階層符号化装置の第1の実施の形態の下位階層符号化部を示すブロック図である。 図1の動作を説明するフローチャートである。 本発明の動画像階層符号化装置の第1の実施の形態の上位階層符号化部を示すブロック図である。 図3の動作を説明するフローチャートである。 本発明の動画像階層復号化装置の第1の実施の形態の下位階層復号化部を示すブロック図である。 図6の動作を説明するフローチャートである。 本発明の動画像階層復号化装置の第1の実施の形態の上位階層復号化部を示すブロック図である。 図7の動作を説明するフローチャートである。 本発明の動画像階層符号化装置の第2の実施の形態の上位階層符号化部を示すブロック図である。 図9の動作を説明するフローチャートである。 本発明の動画像階層復号化装置の第2の実施の形態の上位階層復号化部を示すブロック図である。 図11の動作を説明するフローチャートである。 本発明の動画像階層符号化装置が備える機能を、本発明の動画像階層符号化プログラムを実行させることにより実現する情報処理装置の基本構成を表す機能ブロック図である。 本発明の動画像階層復号化装置が備える機能を、本発明の動画像階層復号化プログラムを実行させることにより実現する情報処理装置の基本構成を表す機能ブロック図である。 動画像階層符号化装置及び動画像階層復号化装置の一例を示す構成図である。 従来の動画像階層符号化部の動作を説明するフローチャートである。 従来の動画像階層復号化部の動作を説明するフローチャートである。 従来のMPEG−2エンコーダを使用した下位階層符号化部の一例を示すブロック図である。 従来の上位階層符号化部の一例を示すブロック図である。 従来のMPEG−2デコーダを使用した下位階層復号化部の一例を示すブロック図である。 従来の上位階層復号化部の一例を示すブロック図である。 多重調和局所直交変換の基本概念を表す概念図である。 通常のDCTを行った場合の信号の取り扱いと影響を示す概念図である。 多重調和局所直交変換を行った場合の信号の取り扱いと影響を示す概念図である。 各ブロック及びブロック間の境界に関する定義を示すための概念図である。
符号の説明
102、302 入力画像メモリ
103、303 2次元ブロック変換器
104、304 減算器
105、305 直交変換器
106、314、505、712 MC(動き補償)器
107、315 ME(動き推定)器
108、306 多重調和局所直交変換器
109、307 量子化器
110、308、506、706 逆量子化器
111、309、507、707 逆多重調和局所直交変換器
112、310、508、708 逆直交変換器
113、311、509、713 加算器
114、312、510、714 2次元ブロック逆変換器
115、313、511、715 参照画像メモリ
118、318 エントロピー符号化器
321、709 インターポレーション画像信号入力端子
322、710 階層間予測器
323 モード判定器
503、703 エントロピー復号器
512、716 出力画像メモリ
711 予測生成器
901、1101 局所復号・階層間予測差分生成器
1300、1400 情報処理装置
1303、1403 中央処理制御装置
1308 直交変換手段
1309 多重調和局所直交変換手段
1310 量子化手段
1311、1409 逆量子化手段
1312、1410 逆多重調和局所直交変換手段
1313、1411 逆直交変換手段
1314 2次元ブロック変換手段
1315 ME手段
1316、1413 MC手段
1317、1412 2次元ブロック逆変換手段
1318 エントロピー符号化手段
1319 符号量制御手段
1320 空間デシメーション手段
1321、1415 空間インターポレーション手段
1322 多重化手段
1323 エンハンスメントレイヤ予測モード手段
1324、1417 階層間予測手段
1325 局所復号階層間予測差分手段
1408 エントロピー復号化手段
1414 エクストラクト手段
1416 エンハンスメントレイヤ予測ブロック生成手段
1418 局所復号階層間予測差分生成手段
1501 階層符号化部
1502 通信回線またはメディア
1503 階層復号化部
1505 空間的縮小(空間デシメーション)部
1506 下位階層符号化(ベースレイヤエンコード)部
1507、1512 空間的拡大(空間インターポレーション)部
1508 上位階層符号化(エンハンスメントレイヤエンコード)部
1509 多重化部
1510 領域分割(エクストラクト)部
1511 下位階層復号化(ベースレイヤデコード)部
1513 上位階層復号化(エンハンスメントレイヤデコード)部

Claims (14)

  1. 動画像の画像信号の一画面を構成する画像フレーム又は画像フィールドを画像単位としたとき、第1の空間解像度の第1の画像単位信号を符号化して得られた下位階層の第1の符号化信号と、前記第1の空間解像度よりも高い第2の空間解像度の1又は2以上の第2の画像単位信号を符号化して得られた上位階層の第2の符号化信号とを多重して出力する動画像階層符号化装置において、
    前記画像信号の空間的縮小処理を伴って前記第1の空間解像度に縮小した下位階層の符号化対象となる第1の画像単位信号に対して符号化を行って、前記第1の符号化信号を生成する下位階層符号化手段と、
    前記下位階層符号化手段内にて前記第1の符号化信号をローカルデコードして得られた局所復号画像信号に対して空間的拡大処理を行って、少なくとも1階層上の上位階層が持つ空間解像度と同じ空間解像度の拡大復号画像信号に変換する空間的拡大手段と、
    前記画像信号と前記拡大復号画像信号とを入力として受け、前記拡大復号画像信号を予測情報として用い、前記上位階層の符号化対象となる前記第2の空間解像度の1又は2以上の前記第2の画像単位信号に対して符号化を行って、1又は2以上の前記第2の符号化信号を生成する上位階層符号化手段とを有し、
    前記上位階層符号化手段は、
    符号化対象の前記画像信号の前記画像単位を所定の画素数から構成される矩形領域に分割し、その矩形領域を最小単位として前記拡大復号画像信号を切り出して階層間予測信号を生成する階層間予測手段と、
    前記階層間予測信号と第1の動き補償予測信号とのうち、それらの予測差分の情報量に基づいて選択して得た最適予測信号と符号化対象の前記画像信号との差分信号である第1の予測差分画像信号を生成する第1の予測差分生成手段と、
    前記第1の予測差分画像信号に対して、前記矩形領域を処理単位として直交変換を行い、第1の直交変換係数情報を生成する第1の直交変換手段と、
    符号化対象となっている前記矩形領域の隣接する他の矩形領域との境界における、前記第1の直交変換係数情報から求める画像信号の傾きを境界条件とするポアソン方程式を満たすような、前記符号化対象となっている矩形領域内の推定信号に対して、直交変換した近似直交変換係数情報を、前記第1の直交変換手段から取得した前記第1の直交変換係数情報を利用して生成した後、前記第1の直交変換係数情報と生成した前記近似直交変換係数情報との差分をとることで第1の残差直交変換係数情報を生成する第1の多重調和局所直交変換手段と、
    前記第1の残差直交変換係数情報を所定の量子化パラメータに基づいて量子化する第1の量子化手段と、
    前記第1の量子化手段から出力された量子化後の第1の残差直交変換係数情報に対して、前記画像単位でエントロピー符号化を行うことで、所定の構文構造に従って前記第2の画像単位信号に対して符号化された前記第2の符号化信号である符号化ビットストリームを生成する第1のエントロピー符号化手段と、
    前記第1の量子化手段から出力された量子化後の第1の残差直交変換係数情報を、所定の量子化パラメータに基づいて逆量子化する第1の逆量子化手段と、
    復号化対象となっている前記矩形領域の隣接する他の矩形領域との境界における、前記逆量子化後の第1の残差直交変換係数情報から求める画像信号の傾きを境界条件とするポアソン方程式を満たすような、復号化対象となっている前記矩形領域内の推定信号に対して、直交変換した第1の近似直交変換係数情報を、前記第1の直交変換手段から取得した前記第1の直交変換係数情報もしくは前記第1の逆量子化手段によって生成された逆量子化後の前記第1の残差直交変換係数情報を利用して生成し、前記逆量子化後の第1の残差直交変換係数情報と生成した前記第1の近似直交変換係数情報との合成を行うことで、第1の復号直交変換係数情報を生成する第1の逆多重調和局所直交変換手段と、
    前記第1の逆多重調和局所直交変換手段により生成された前記第1の復号直交変換係数情報を逆直交変換することにより、第1の復号予測差分信号を生成する第1の逆直交変換手段と、
    前記第1の復号予測差分信号と前記最適予測信号との加算を行うことで、第1の局所復号画像信号を生成する第1の局所復号画像生成手段と、
    前記第1の局所復号画像信号と符号化対象の前記画像信号とに基づいて、前記矩形領域を処理単位として前記第1の動き補償予測信号を生成する第1の動き補償予測手段と
    を具備することを特徴とする動画像階層符号化装置。
  2. 前記下位階層符号化手段は、
    前記第1の空間解像度に縮小した符号化対象の前記画像信号の前記画像単位を所定の画素数から構成される矩形領域に分割し、その矩形領域を処理単位として第2の動き補償予測信号と前記第1の空間解像度に縮小した符号化対象の前記画像信号との差分信号である第2の予測差分画像信号を生成する第2の予測差分生成手段と、
    前記第2の予測差分画像信号に対して、前記矩形領域を処理単位として直交変換を行い、第2の直交変換係数情報を生成する第2の直交変換手段と、
    符号化対象となっている前記矩形領域の隣接する他の矩形領域との境界における、前記第2の直交変換係数情報から求める画像信号の傾きを境界条件とするポアソン方程式を満たすような、前記符号化対象となっている矩形領域内の推定信号に対して、直交変換した近似直交変換係数情報を、前記第2の直交変換手段から取得した前記第2の直交変換係数情報を利用して生成した後、前記第2の直交変換係数情報と生成した前記近似直交変換係数情報との差分をとることで第2の残差直交変換係数情報を生成する第2の多重調和局所直交変換手段と、
    前記第2の残差直交変換係数情報を所定の量子化パラメータに基づいて量子化する第2の量子化手段と、
    前記第2の量子化手段から出力された量子化後の第2の残差直交変換係数情報に対して、前記画像単位でエントロピー符号化を行うことで、所定の構文構造に従って前記第1の画像単位信号に対して符号化された前記第1の符号化信号である符号化ビットストリームを生成する第2のエントロピー符号化手段と、
    前記第2の量子化手段から出力された量子化後の第2の残差直交変換係数情報を、所定の量子化パラメータに基づいて逆量子化する第2の逆量子化手段と、
    復号化対象となっている前記矩形領域の隣接する他の矩形領域との境界における、前記逆量子化後の第2の残差直交変換係数情報から求める画像信号の傾きを境界条件とするポアソン方程式を満たすような、復号化対象となっている前記矩形領域内の推定信号に対して、直交変換した第2の近似直交変換係数情報を、前記第2の直交変換手段から取得した前記第2の直交変換係数情報もしくは前記第2の逆量子化手段によって生成された逆量子化後の前記第2の残差直交変換係数情報を利用して生成し、前記逆量子化後の第2の残差直交変換係数情報と生成した前記第2の近似直交変換係数情報との合成を行うことで、第2の復号直交変換係数情報を生成する第2の逆多重調和局所直交変換手段と、
    前記第2の逆多重調和局所直交変換手段により生成された前記第2の復号直交変換係数情報を逆直交変換することにより、第2の復号予測差分信号を生成する第2の逆直交変換手段と、
    前記第2の復号予測差分信号と前記第2の動き補償予測信号との加算を行うことで、第2の局所復号画像信号を生成する第2の局所復号画像生成手段と、
    前記第2の局所復号画像信号と前記第1の空間解像度に縮小した符号化対象の前記画像信号とに基づいて、前記矩形領域を処理単位として前記第2の動き補償予測信号を生成する第2の動き補償予測手段と
    を具備することを特徴とする請求項1記載の動画像階層符号化装置。
  3. 前記第1の多重調和局所直交変換手段は、前記ポアソン方程式を満たすような符号化対象となっている前記矩形領域内の推定信号を直交変換して得た前記第1の近似直交変換係数情報を、前記直交変換後の第1の直交変換係数情報を利用して生成する際に、前記直交変換後の第1の直交変換係数情報に対して量子化で用いる量子化パラメータに基づいて量子化後の第1の直交変換係数情報を推定し、この推定結果に基づいて前記第1の近似直交変換係数情報を生成する手段であることを特徴とする請求項1記載の動画像階層符号化装置。
  4. 前記第1の予測差分生成手段は、前記第1の予測差分画像信号を生成するために、前記階層間予測信号と前記第1の動き補償予測信号とを、前記矩形領域単位でそれらの予測差分の情報量を比較することにより最適予測方式を選択して前記最適予測信号を生成するモード判定手段を含んでおり、
    前記上位階層符号化部は、前記最適予測方式が前記第1の動き補償予測信号による予測方式である場合に、復号後の前記第1の局所復号画像信号と前記階層間予測手段からの前記階層間予測信号との間の仮想差分信号を前記矩形領域単位で生成し、この矩形領域の仮想差分信号に対して直交変換処理を行い、仮想差分直交変換係数情報を生成する局所復号・階層間予測差分生成手段を更に有し、
    前記局所復号・階層間予測差分生成手段で生成された前記仮想差分直交変換係数情報を用いて、前記第1の多重調和局所直交変換手段及び前記第1の逆多重調和局所直交変換手段における、前記矩形領域内の前記推定信号を生成するための情報とすることを特徴とする請求項1乃至3のうちいずれか一項記載の動画像階層符号化装置。
  5. 動画像の画像信号の一画面を構成する画像フレーム又は画像フィールドを画像単位としたとき、第1の空間解像度の第1の画像単位信号を符号化して得られた下位階層の第1の符号化信号と、前記第1の空間解像度よりも高い第2の空間解像度の1又は2以上の第2の画像単位信号を符号化して得られた上位階層の第2の符号化信号とを多重して出力することをコンピュータにより実行させるための動画像階層符号化プログラムにおいて、
    前記コンピュータを、
    前記画像信号の空間的縮小処理を伴って前記第1の空間解像度に縮小した下位階層の符号化対象となる第1の画像単位信号に対して符号化を行って、前記第1の符号化信号を生成する下位階層符号化手段と、
    前記下位階層符号化手段にて前記第1の符号化信号をローカルデコードして得られた局所復号画像信号に対して空間的拡大処理を行って、少なくとも1階層上の上位階層が持つ空間解像度と同じ空間解像度の拡大復号画像信号に変換する空間的拡大手段と、
    前記画像信号と前記拡大復号画像信号とを入力として受け、前記拡大復号画像信号を予測情報として用い、前記上位階層の符号化対象となる前記第2の空間解像度の1又は2以上の前記第2の画像単位信号に対して符号化を行って、1又は2以上の前記第2の符号化信号を生成する上位階層符号化手段として機能させると共に、
    前記上位階層符号化手段を、
    符号化対象の前記画像信号の前記画像単位を所定の画素数から構成される矩形領域に分割し、その矩形領域を最小単位として前記拡大復号画像信号を切り出して階層間予測信号を生成する階層間予測手段と、
    前記階層間予測信号と第1の動き補償予測信号とのうち、それらの予測差分の情報量に基づいて選択して得た最適予測信号と符号化対象の前記画像信号との差分信号である第1の予測差分画像信号を生成する第1の予測差分生成手段と、
    前記第1の予測差分画像信号に対して、前記矩形領域を処理単位として直交変換を行い、第1の直交変換係数情報を生成する第1の直交変換手段と、
    符号化対象となっている前記矩形領域の隣接する他の矩形領域との境界における、前記第1の直交変換係数情報から求める画像信号の傾きを境界条件とするポアソン方程式を満たすような、前記符号化対象となっている矩形領域内の推定信号に対して、直交変換した近似直交変換係数情報を、前記第1の直交変換手段から取得した前記第1の直交変換係数情報を利用して生成した後、前記第1の直交変換係数情報と生成した前記近似直交変換係数情報との差分をとることで第1の残差直交変換係数情報を生成する第1の多重調和局所直交変換手段と、
    前記第1の残差直交変換係数情報を所定の量子化パラメータに基づいて量子化する第1の量子化手段と、
    前記第1の量子化手段から出力された量子化後の第1の残差直交変換係数情報に対して、前記画像単位でエントロピー符号化を行うことで、所定の構文構造に従って前記第2の画像単位信号に対して符号化された前記第2の符号化信号である符号化ビットストリームを生成する第1のエントロピー符号化手段と、
    前記第1の量子化手段から出力された量子化後の第1の残差直交変換係数情報を、所定の量子化パラメータに基づいて逆量子化する第1の逆量子化手段と、
    復号化対象となっている前記矩形領域の隣接する他の矩形領域との境界における、前記逆量子化後の第1の残差直交変換係数情報から求める画像信号の傾きを境界条件とするポアソン方程式を満たすような、復号化対象となっている前記矩形領域内の推定信号に対して、直交変換した第1の近似直交変換係数情報を、前記第1の直交変換手段から取得した前記第1の直交変換係数情報もしくは前記第1の逆量子化手段によって生成された逆量子化後の前記第1の残差直交変換係数情報を利用して生成し、前記逆量子化後の第1の残差直交変換係数情報と生成した前記第1の近似直交変換係数情報との合成を行うことで、第1の復号直交変換係数情報を生成する第1の逆多重調和局所直交変換手段と、
    前記第1の逆多重調和局所直交変換手段により生成された前記第1の復号直交変換係数情報を逆直交変換することにより、第1の復号予測差分信号を生成する第1の逆直交変換手段と、
    前記第1の復号予測差分信号と前記最適予測信号との加算を行うことで、第1の局所復号画像信号を生成する第1の局所復号画像生成手段と、
    前記第1の局所復号画像信号と符号化対象の前記画像信号とに基づいて、前記矩形領域を処理単位として前記第1の動き補償予測信号を生成する第1の動き補償予測手段と
    を実行させることを特徴とする動画像階層符号化プログラム。
  6. 前記コンピュータを、
    前記下位階層符号化手段として、
    前記第1の空間解像度に縮小した符号化対象の前記画像信号の前記画像単位を所定の画素数から構成される矩形領域に分割し、その矩形領域を処理単位として第2の動き補償予測信号と前記第1の空間解像度に縮小した符号化対象の前記画像信号との差分信号である第2の予測差分画像信号を生成する第2の予測差分生成手段と、
    前記第2の予測差分画像信号に対して、前記矩形領域を処理単位として直交変換を行い、第2の直交変換係数情報を生成する第2の直交変換手段と、
    符号化対象となっている前記矩形領域の隣接する他の矩形領域との境界における、前記第2の直交変換係数情報から求める画像信号の傾きを境界条件とするポアソン方程式を満たすような、前記符号化対象となっている矩形領域内の推定信号に対して、直交変換した近似直交変換係数情報を、前記第2の直交変換手段から取得した前記第2の直交変換係数情報を利用して生成した後、前記第2の直交変換係数情報と生成した前記近似直交変換係数情報との差分をとることで第2の残差直交変換係数情報を生成する第2の多重調和局所直交変換手段と、
    前記第2の残差直交変換係数情報を所定の量子化パラメータに基づいて量子化する第2の量子化手段と、
    前記第2の量子化手段から出力された量子化後の第2の残差直交変換係数情報に対して、前記画像単位でエントロピー符号化を行うことで、所定の構文構造に従って前記第1の画像単位信号に対して符号化された前記第1の符号化信号である符号化ビットストリームを生成する第2のエントロピー符号化手段と、
    前記第2の量子化手段から出力された量子化後の第2の残差直交変換係数情報を、所定の量子化パラメータに基づいて逆量子化する第2の逆量子化手段と、
    復号化対象となっている前記矩形領域の隣接する他の矩形領域との境界における、前記逆量子化後の第2の残差直交変換係数情報から求める画像信号の傾きを境界条件とするポアソン方程式を満たすような、復号化対象となっている前記矩形領域内の推定信号に対して、直交変換した第2の近似直交変換係数情報を、前記第2の直交変換手段から取得した前記第2の直交変換係数情報もしくは前記第2の逆量子化手段によって生成された逆量子化後の前記第2の残差直交変換係数情報を利用して生成し、前記逆量子化後の第2の残差直交変換係数情報と生成した前記第2の近似直交変換係数情報との合成を行うことで、第2の復号直交変換係数情報を生成する第2の逆多重調和局所直交変換手段と、
    前記第2の逆多重調和局所直交変換手段により生成された前記第2の復号直交変換係数情報を逆直交変換することにより、第2の復号予測差分信号を生成する第2の逆直交変換手段と、
    前記第2の復号予測差分信号と前記第2の動き補償予測信号との加算を行うことで、第2の局所復号画像信号を生成する第2の局所復号画像生成手段と、
    前記第2の局所復号画像信号と前記第1の空間解像度に縮小した符号化対象の前記画像信号とに基づいて、前記矩形領域を処理単位として前記第2の動き補償予測信号を生成する第2の動き補償予測手段と
    して機能させることを特徴とする請求項5記載の動画像階層符号化プログラム。
  7. 前記コンピュータに実行させる前記第1の多重調和局所直交変換手段は、前記ポアソン方程式を満たすような符号化対象となっている前記矩形領域内の推定信号を直交変換して得た前記第1の近似直交変換係数情報を、前記直交変換後の第1の直交変換係数情報を利用して生成する際に、前記直交変換後の第1の直交変換係数情報に対して量子化で用いる量子化パラメータに基づいて量子化後の第1の直交変換係数情報を推定し、この推定結果に基づいて前記第1の近似直交変換係数情報を生成する手段であることを特徴とする請求項5記載の動画像階層符号化プログラム。
  8. 前記コンピュータに実行させる前記第1の予測差分生成手段は、前記第1の予測差分画像信号を生成するために、前記階層間予測信号と前記第1の動き補償予測信号とを、前記矩形領域単位でそれらの予測差分の情報量を比較することにより最適予測方式を選択して前記最適予測信号を生成するモード判定手段を含んでおり、
    前記コンピュータに実行させる前記上位階層符号化部は、前記最適予測方式が前記第1の動き補償予測信号による予測方式である場合に、復号後の前記第1の局所復号画像信号と前記階層間予測手段からの前記階層間予測信号との間の仮想差分信号を前記矩形領域単位で生成し、この矩形領域の仮想差分信号に対して直交変換処理を行い、仮想差分直交変換係数情報を生成する局所復号・階層間予測差分生成手段を更に有し、
    前記局所復号・階層間予測差分生成手段で生成された前記仮想差分直交変換係数情報を用いて、前記第1の多重調和局所直交変換手段及び前記第1の逆多重調和局所直交変換手段における、前記矩形領域内の前記推定信号を生成するための情報とすることを特徴とする請求項5乃至7のうちいずれか一項記載の動画像階層符号化プログラム。
  9. 請求項1、3又は4記載の動画像階層符号化装置、又は請求項5、7又は8記載の動画像階層符号化プログラムにより動作する情報処理装置によって生成された、動画像の画像信号の一画面を構成する画像フレーム又は画像フィールドを画像単位としたとき、第1の空間解像度の第1の画像単位信号を符号化して得られた下位階層の第1の符号化信号と、前記第1の空間解像度よりも高い第2の空間解像度の1又は2以上の第2の画像単位信号を符号化して得られた上位階層の第2の符号化信号との多重信号を、所定の蓄積媒体又は所定の伝送路から取得し、取得した前記多重信号に対して復号化動作を行う動画像階層復号化装置であって、
    前記多重信号から前記第1の符号化信号と前記第2の符号化信号とを分離して出力する分離手段と、
    前記分離手段からの前記第1の符号化信号に対して復号化処理を行い、前記第1の空間解像度の前記第1の画像単位信号を復号して出力する下位階層復号化手段と、
    前記下位階層復号化手段内にてローカルデコードして得られた前記第1の画像単位信号に対して空間的拡大処理を行って、少なくとも1階層上の上位階層が持つ空間解像度と同じ空間解像度の拡大復号画像信号に変換する空間的拡大手段と、
    前記分離手段からの前記第2の符号化信号と前記拡大復号画像信号とを入力として受け、前記拡大復号画像信号を予測情報として用い、前記上位階層の復号化対象となる前記第2の空間解像度の1又は2以上の前記第2の画像単位信号を生成する上位階層復号化手段とを有し、
    前記上位階層復号化手段は、
    入力された前記第2の符号化信号に対して、所定の構文情報に基づいて符号化情報の多重化分離とエントロピー復号化を行い、量子化後情報、動きベクトル情報、予測モード情報、および所定の構文構造を構成するために必要なパラメータ情報を生成する第1のエントロピー復号化手段と、
    前記第1のエントロピー復号化手段から取得した前記量子化後情報に対して逆量子化を行うことにより、逆量子化後の前記第1の残差直交変換係数情報を生成する第1の逆量子化手段と、
    復号化対象となっている前記矩形領域の隣接する他の矩形領域との境界における、復号後の前記第1の直交変換係数情報から求める画像信号の傾きを境界条件とするポアソン方程式を満たすような、復号化対象となっている前記矩形領域内の推定信号に対して、直交変換した前記第1の近似直交変換係数情報を、逆量子化後の前記第1の残差直交変換係数情報を利用して生成した後、逆量子化後の前記第1の残差直交変換係数情報と生成した前記第1の近似直交変換係数情報との合成を行うことで、第1の復号直交変換係数情報を生成する第1の逆多重調和局所直交変換手段と、
    前記第1の逆多重調和局所直交変換手段により生成された前記第1の復号直交変換係数情報を逆直交変換することにより、第1の復号予測差分信号を生成する第1の逆直交変換手段と、
    入力された前記拡大復号画像信号に対して前記矩形領域を最小単位として切り出して階層間予測信号を取り出す階層間予測手段と、
    前記第1のエントロピー復号化手段から取得した前記予測モード情報に基づき、前記階層間予測手段から出力された前記階層間予測信号と、前記第1のエントロピー復号化手段から取得した前記動きベクトル情報を利用して前記第2の画像単位信号の復号信号に対して所定の動き補償を行うことによって生成する動き補償予測信号とのうちの一方の予測信号を選択して出力する予測生成手段と、
    前記予測生成手段により選択された前記予測信号と前記第1の復号予測差分信号との加算を行うことで、前記第2の画像単位信号の復号信号を生成する第1の復号手段と
    を具備すること特徴とする動画像階層復号化装置。
  10. 請求項2又は4記載の動画像階層符号化装置、又は請求項6又は8記載の動画像階層符号化プログラムにより動作する情報処理装置によって生成された、動画像の画像信号の一画面を構成する画像フレーム又は画像フィールドを画像単位としたとき、第1の空間解像度の第1の画像単位信号を符号化して得られた下位階層の第1の符号化信号と、前記第1の空間解像度よりも高い第2の空間解像度の1又は2以上の第2の画像単位信号を符号化して得られた上位階層の第2の符号化信号との多重信号を、所定の蓄積媒体又は所定の伝送路から取得し、取得した前記多重信号に対して復号化動作を行う動画像階層復号化装置であって、
    前記多重信号から前記第1の符号化信号と前記第2の符号化信号とを分離して出力する分離手段と、
    前記分離手段からの前記第1の符号化信号に対して復号化処理を行い、前記第1の空間解像度の前記第1の画像単位信号を復号して出力する下位階層復号化手段と、
    前記下位階層復号化手段内にてローカルデコードして得られた前記第1の画像単位信号に対して空間的拡大処理を行って、少なくとも1階層上の上位階層が持つ空間解像度と同じ空間解像度の拡大復号画像信号に変換する空間的拡大手段と、
    前記分離手段からの前記第2の符号化信号と前記拡大復号画像信号とを入力として受け、前記拡大復号画像信号を予測情報として用い、前記上位階層の復号化対象となる前記第2の空間解像度の1又は2以上の前記第2の画像単位信号を生成する上位階層復号化手段とを有し、
    前記下位階層復号化手段は、
    入力された前記第1の符号化信号に対して、所定の構文構造に基づいて符号化情報の多重化分離とエントロピー復号化を行い、量子化後情報および動きベクトル情報、および所定の構文構造を構成するために必要なパラメータ情報を生成する第2のエントロピー復号化手段と、
    前記第2のエントロピー復号化手段から取得した前記量子化後情報に対して逆量子化を行うことにより、逆量子化後の前記第2の残差直交変換係数情報を生成する第2の逆量子化手段と、
    復号化対象となっている前記矩形領域の隣接する他の矩形領域との境界における、復号後の前記第2の直交変換係数情報から求める画像信号の傾きを境界条件とするポアソン方程式を満たすような、復号化対象となっている前記矩形領域内の推定信号に対して、直交変換した前記第2の近似直交変換係数情報を、逆量子化後の前記第2の残差直交変換係数情報を利用して生成した後、逆量子化後の前記第2の残差直交変換係数情報と生成した前記第2の近似直交変換係数情報との合成を行うことで、第2の復号直交変換係数情報を生成する第2の逆多重調和局所直交変換手段と、
    前記第2の逆多重調和局所直交変換手段により生成された前記第2の直交変換係数情報を逆直交変換することにより、第2の復号予測差分信号を生成する第2の逆直交変換手段と、
    前記第2のエントロピー復号化手段から取得した前記動きベクトル情報を利用して前記第1の画像単位信号の復号信号に対して所定の動き補償を行うことによって動き補償予測信号を生成して出力する動き補償予測手段と、
    前記動き補償予測手段により選択された前記動き補償予測信号と前記第2の復号予測差分信号との加算を行うことで、前記第1の画像単位信号の復号信号を生成する第2の復号手段と
    を具備することを特徴とする動画像階層復号化装置。
  11. 前記上位階層復号化部は、前記予測生成手段により前記動き補償予測信号が選択されたときに、前記矩形領域の復号後の前記第2の画像単位信号の復号信号と前記階層間予測手段から出力される前記階層間予測信号との間で差分情報を生成する局所復号・階層間予測差分生成手段を更に有し、
    前記局所復号・階層間予測差分生成手段で生成された前記差分情報を用いて、前記第1の逆多重調和局所直交変換手段における、前記矩形領域内の前記推定信号を生成するための情報とすることを特徴とする請求項9又は10記載の動画像階層復号化装置。
  12. 請求項1、3又は4記載の動画像階層符号化装置、又は請求項5、7又は8記載の動画像階層符号化プログラムにより動作する情報処理装置によって生成された、動画像の画像信号の一画面を構成する画像フレーム又は画像フィールドを画像単位としたとき、第1の空間解像度の第1の画像単位信号を符号化して得られた下位階層の第1の符号化信号と、前記第1の空間解像度よりも高い第2の空間解像度の1又は2以上の第2の画像単位信号を符号化して得られた上位階層の第2の符号化信号との多重信号を、所定の蓄積媒体又は所定の伝送路から取得し、取得した前記多重信号に対して復号化動作をコンピュータに実行させる動画像階層復号化プログラムであって、
    前記コンピュータを、
    前記多重信号から前記第1の符号化信号と前記第2の符号化信号とを分離して出力する分離手段と、
    前記分離手段からの前記第1の符号化信号に対して復号化処理を行い、前記第1の空間解像度の前記第1の画像単位信号を復号して出力する下位階層復号化手段と、
    前記下位階層復号化手段内にてローカルデコードして得られた前記第1の画像単位信号に対して空間的拡大処理を行って、少なくとも1階層上の上位階層が持つ空間解像度と同じ空間解像度の拡大復号画像信号に変換する空間的拡大手段と、
    前記分離手段からの前記第2の符号化信号と前記拡大復号画像信号とを入力として受け、前記拡大復号画像信号を予測情報として用い、前記上位階層の復号化対象となる前記第2の空間解像度の1又は2以上の前記第2の画像単位信号を生成する上位階層復号化手段として機能させると共に、
    前記上位階層復号化手段を、
    入力された前記第2の符号化信号に対して、所定の構文情報に基づいて符号化情報の多重化分離とエントロピー復号化を行い、量子化後情報、動きベクトル情報、予測モード情報、および所定の構文構造を構成するために必要なパラメータ情報を生成する第1のエントロピー復号化手段と、
    前記第1のエントロピー復号化手段から取得した前記量子化後情報に対して逆量子化を行うことにより、逆量子化後の前記第1の残差直交変換係数情報を生成する第1の逆量子化手段と、
    復号化対象となっている前記矩形領域の隣接する他の矩形領域との境界における、復号後の前記第1の直交変換係数情報から求める画像信号の傾きを境界条件とするポアソン方程式を満たすような、復号化対象となっている前記矩形領域内の推定信号に対して、直交変換した前記第1の近似直交変換係数情報を、逆量子化後の前記第1の残差直交変換係数情報を利用して生成した後、逆量子化後の前記第1の残差直交変換係数情報と生成した前記第1の近似直交変換係数情報との合成を行うことで、第1の復号直交変換係数情報を生成する第1の逆多重調和局所直交変換手段と、
    前記第1の逆多重調和局所直交変換手段により生成された前記第1の復号直交変換係数情報を逆直交変換することにより、第1の復号予測差分信号を生成する第1の逆直交変換手段と、
    入力された前記拡大復号画像信号に対して前記矩形領域を最小単位として切り出して階層間予測信号を取り出す階層間予測手段と、
    前記エントロピー復号化手段から取得した前記予測モード情報に基づき、前記階層間予測手段から出力された前記階層間予測信号と、前記エントロピー復号化手段から取得した前記動きベクトル情報を利用して前記第2の画像単位信号の復号信号に対して所定の動き補償を行うことによって生成する動き補償予測信号とのうちの一方の予測信号を選択して出力する予測生成手段と、
    前記予測生成手段により選択された前記予測信号と前記第1の復号予測差分信号との加算を行うことで、前記第2の画像単位信号の復号信号を生成する第1の復号手段と
    して機能させること特徴とする動画像階層復号化プログラム。
  13. 請求項2又は4記載の動画像階層符号化装置、又は請求項6又は8記載の動画像階層符号化プログラムにより動作する情報処理装置によって生成された、動画像の画像信号の一画面を構成する画像フレーム又は画像フィールドを画像単位としたとき、第1の空間解像度の第1の画像単位信号を符号化して得られた下位階層の第1の符号化信号と、前記第1の空間解像度よりも高い第2の空間解像度の1又は2以上の第2の画像単位信号を符号化して得られた上位階層の第2の符号化信号との多重信号を、所定の蓄積媒体又は所定の伝送路から取得し、取得した前記多重信号に対して復号化動作をコンピュータにより実行させる動画像階層復号化プログラムであって、
    前記コンピュータを、
    前記多重信号から前記第1の符号化信号と前記第2の符号化信号とを分離して出力する分離手段と、
    前記分離手段からの前記第1の符号化信号に対して復号化処理を行い、前記第1の空間解像度の前記第1の画像単位信号を復号して出力する下位階層復号化手段と、
    前記下位階層復号化手段内にてローカルデコードして得られた前記第1の画像単位信号に対して空間的拡大処理を行って、少なくとも1階層上の上位階層が持つ空間解像度と同じ空間解像度の拡大復号画像信号に変換する空間的拡大手段と、
    前記分離手段からの前記第2の符号化信号と前記拡大復号画像信号とを入力として受け、前記拡大復号画像信号を予測情報として用い、前記上位階層の復号化対象となる前記第2の空間解像度の1又は2以上の前記第2の画像単位信号を生成する上位階層復号化手段として機能させると共に、
    前記下位階層復号化手段を、
    入力された前記第1の符号化信号に対して、所定の構文構造に基づいて符号化情報の多重化分離とエントロピー復号化を行い、量子化後情報および動きベクトル情報、および所定の構文構造を構成するために必要なパラメータ情報を生成する第2のエントロピー復号化手段と、
    前記第2のエントロピー復号化手段から取得した前記量子化後情報に対して逆量子化を行うことにより、逆量子化後の前記第2の残差直交変換係数情報を生成する第2の逆量子化手段と、
    復号化対象となっている前記矩形領域の隣接する他の矩形領域との境界における、復号後の前記第2の直交変換係数情報から求める画像信号の傾きを境界条件とするポアソン方程式を満たすような、復号化対象となっている前記矩形領域内の推定信号に対して、直交変換した前記第2の近似直交変換係数情報を、逆量子化後の前記第2の残差直交変換係数情報を利用して生成した後、逆量子化後の前記第2の残差直交変換係数情報と生成した前記第2の近似直交変換係数情報との合成を行うことで、第2の復号直交変換係数情報を生成する第2の逆多重調和局所直交変換手段と、
    前記第2の逆多重調和局所直交変換手段により生成された前記第2の直交変換係数情報を逆直交変換することにより、第2の復号予測差分信号を生成する第2の逆直交変換手段と、
    前記第2のエントロピー復号化手段から取得した前記動きベクトル情報を利用して前記第1の画像単位信号の復号信号に対して所定の動き補償を行うことによって動き補償予測信号を生成して出力する動き補償予測手段と、
    前記動き補償予測手段により選択された前記動き補償予測信号と前記第2の復号予測差分信号との加算を行うことで、前記第1の画像単位信号の復号信号を生成する第2の復号手段と
    して機能させることを特徴とする動画像階層復号化プログラム。
  14. 前記コンピュータに実行させる前記上位階層復号化部は、前記予測生成手段により前記動き補償予測信号が選択されたときに、前記矩形領域の復号後の前記第2の画像単位信号の復号信号と前記階層間予測手段から出力される前記階層間予測信号との間で差分情報を生成する局所復号・階層間予測差分生成手段を更に有し、
    前記局所復号・階層間予測差分生成手段で生成された前記差分情報を用いて、前記第1の逆多重調和局所直交変換手段における、前記矩形領域内の前記推定信号を生成するための情報とすることを特徴とする請求項12又は13記載の動画像階層復号化プログラム。
JP2006332817A 2006-12-11 2006-12-11 動画像階層符号化装置、動画像階層符号化プログラム、動画像階層復号化装置及び動画像階層復号化プログラム Expired - Fee Related JP4626608B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2006332817A JP4626608B2 (ja) 2006-12-11 2006-12-11 動画像階層符号化装置、動画像階層符号化プログラム、動画像階層復号化装置及び動画像階層復号化プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2006332817A JP4626608B2 (ja) 2006-12-11 2006-12-11 動画像階層符号化装置、動画像階層符号化プログラム、動画像階層復号化装置及び動画像階層復号化プログラム

Publications (2)

Publication Number Publication Date
JP2008147998A true JP2008147998A (ja) 2008-06-26
JP4626608B2 JP4626608B2 (ja) 2011-02-09

Family

ID=39607681

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2006332817A Expired - Fee Related JP4626608B2 (ja) 2006-12-11 2006-12-11 動画像階層符号化装置、動画像階層符号化プログラム、動画像階層復号化装置及び動画像階層復号化プログラム

Country Status (1)

Country Link
JP (1) JP4626608B2 (ja)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2011121938A1 (ja) * 2010-03-31 2011-10-06 株式会社Jvcケンウッド 画像符号化装置、画像符号化方法及び画像符号化プログラム、ならびに画像復号装置、画像復号方法及び画像復号プログラム
JP2011217084A (ja) * 2010-03-31 2011-10-27 Jvc Kenwood Corp 画像復号装置、画像復号方法及び画像復号プログラム
JP2011217083A (ja) * 2010-03-31 2011-10-27 Jvc Kenwood Corp 画像符号化装置、画像符号化方法及び画像符号化プログラム
JP2014131210A (ja) * 2012-12-28 2014-07-10 Nippon Telegr & Teleph Corp <Ntt> 映像符号化方法、映像復号方法、映像符号化装置、映像復号装置、映像符号化プログラム、映像復号プログラム及び記録媒体
KR101606852B1 (ko) 2014-05-15 2016-04-11 삼성전자주식회사 영상의 부호화 방법 및 장치, 그 복호화 방법 및 장치
US9402079B2 (en) 2008-07-02 2016-07-26 Samsung Electronics Co., Ltd. Image encoding method and device, and decoding method and device therefor

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH07162870A (ja) * 1993-09-21 1995-06-23 At & T Corp ビデオ信号符号化装置
WO2006054667A1 (ja) * 2004-11-17 2006-05-26 National University Corporation Shizuoka University データ圧縮伸張方法、プログラム及び装置

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH07162870A (ja) * 1993-09-21 1995-06-23 At & T Corp ビデオ信号符号化装置
WO2006054667A1 (ja) * 2004-11-17 2006-05-26 National University Corporation Shizuoka University データ圧縮伸張方法、プログラム及び装置

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9402079B2 (en) 2008-07-02 2016-07-26 Samsung Electronics Co., Ltd. Image encoding method and device, and decoding method and device therefor
WO2011121938A1 (ja) * 2010-03-31 2011-10-06 株式会社Jvcケンウッド 画像符号化装置、画像符号化方法及び画像符号化プログラム、ならびに画像復号装置、画像復号方法及び画像復号プログラム
JP2011217084A (ja) * 2010-03-31 2011-10-27 Jvc Kenwood Corp 画像復号装置、画像復号方法及び画像復号プログラム
JP2011217083A (ja) * 2010-03-31 2011-10-27 Jvc Kenwood Corp 画像符号化装置、画像符号化方法及び画像符号化プログラム
US9225992B2 (en) 2010-03-31 2015-12-29 JVC Kenwood Corporation Image encoding apparatus, image encoding method, image encoding program, image decoding apparatus, image decoding method, and image decoding program
JP2014131210A (ja) * 2012-12-28 2014-07-10 Nippon Telegr & Teleph Corp <Ntt> 映像符号化方法、映像復号方法、映像符号化装置、映像復号装置、映像符号化プログラム、映像復号プログラム及び記録媒体
KR101606852B1 (ko) 2014-05-15 2016-04-11 삼성전자주식회사 영상의 부호화 방법 및 장치, 그 복호화 방법 및 장치

Also Published As

Publication number Publication date
JP4626608B2 (ja) 2011-02-09

Similar Documents

Publication Publication Date Title
JP4844449B2 (ja) 動画像符号化装置、方法、プログラム、動画像復号化装置、方法、およびプログラム
JP4922391B2 (ja) 多階層基盤のビデオエンコーディング方法および装置
JP5369893B2 (ja) 動画像符号化装置、動画像符号化方法、動画像符号化プログラム、動画像復号装置、動画像復号方法、動画像復号プログラム、動画像再符号化装置、動画像再符号化方法、動画像再符号化プログラム
RU2479939C2 (ru) Способ кодирования и декодирования видеосигнала с использованием взвешенного предсказания и устройство для его осуществления
KR100763181B1 (ko) 기초계층과 향상계층의 데이터를 바탕으로 예측 정보를코딩하여 코딩율을 향상시키는 방법 및 장치
US20100118945A1 (en) Method and apparatus for video encoding and decoding
JP2008536440A (ja) ビデオ信号のスケーラブルなエンコーディング方法およびデコーディング方法
JP5971010B2 (ja) 動画像復号装置及びプログラム、並びに、動画像符号化システム
JP4626608B2 (ja) 動画像階層符号化装置、動画像階層符号化プログラム、動画像階層復号化装置及び動画像階層復号化プログラム
JPWO2011039931A1 (ja) 画像符号化装置、画像復号装置、画像符号化方法及び画像復号方法
KR102163477B1 (ko) 비디오 부호화 및 복호화 방법, 그를 이용한 장치
WO2018055910A1 (ja) 動画像復号装置、動画像復号方法、動画像符号化装置、動画像符号化方法及びコンピュータ可読記録媒体
JP4844455B2 (ja) 映像信号階層復号化装置、映像信号階層復号化方法、及び映像信号階層復号化プログラム
KR20150034699A (ko) 인트라 모드를 이용한 쿼터 픽셀 해상도를 갖는 영상 보간 방법 및 장치
JP4844456B2 (ja) 映像信号階層符号化装置、映像信号階層符号化方法、及び映像信号階層符号化プログラム
JP2008536393A (ja) 少なくとも一のデジタル画像をエンコードする方法、エンコーダ、及びコンピュータプログラム製品
JP4719854B2 (ja) 動画像符号化装置、動画像符号化プログラム、動画像復号化装置及び動画像復号化プログラム
JP2008205865A (ja) スケーラブル動画像符号化方法,装置,そのプログラムおよびその記録媒体
JP4561688B2 (ja) 動画像符号化装置、動画像符号化プログラム、動画像復号化装置、及び動画像復号化プログラム
KR20150056679A (ko) 다중 계층 비디오 코딩을 위한 계층 간 참조 픽쳐 생성 방법 및 장치
JP4243205B2 (ja) 動画像符号化装置、その方法及びそのプログラム
JP2018032913A (ja) 映像符号化装置、プログラム及び方法、並びに、映像復号装置、プログラム及び方法、並びに、映像伝送システム
KR101934840B1 (ko) 인트라 모드를 이용한 쿼터 픽셀 해상도를 갖는 영상 보간 방법 및 장치
KR101810198B1 (ko) 인트라 모드를 이용한 쿼터 픽셀 해상도를 갖는 영상 보간 방법 및 장치
JP2008011009A (ja) 映像信号符号化装置、映像信号復号化装置、映像信号符号化プログラム及び映像信号復号化プログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20081226

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20100721

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100727

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100924

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20101012

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20101025

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20131119

Year of fee payment: 3

R151 Written notification of patent or utility model registration

Ref document number: 4626608

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20131119

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20131119

Year of fee payment: 3

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313111

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20131119

Year of fee payment: 3

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

LAPS Cancellation because of no payment of annual fees