JP3781797B2 - ディジタル画像信号の階層符号化装置 - Google Patents

ディジタル画像信号の階層符号化装置 Download PDF

Info

Publication number
JP3781797B2
JP3781797B2 JP2736295A JP2736295A JP3781797B2 JP 3781797 B2 JP3781797 B2 JP 3781797B2 JP 2736295 A JP2736295 A JP 2736295A JP 2736295 A JP2736295 A JP 2736295A JP 3781797 B2 JP3781797 B2 JP 3781797B2
Authority
JP
Japan
Prior art keywords
data
hierarchical
digital image
class
prediction
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP2736295A
Other languages
English (en)
Other versions
JPH08204969A (ja
Inventor
哲二郎 近藤
泰弘 藤森
健治 高橋
邦雄 川口
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Corp
Original Assignee
Sony Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Corp filed Critical Sony Corp
Priority to JP2736295A priority Critical patent/JP3781797B2/ja
Publication of JPH08204969A publication Critical patent/JPH08204969A/ja
Application granted granted Critical
Publication of JP3781797B2 publication Critical patent/JP3781797B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Images

Landscapes

  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Image Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Compression Of Band Width Or Redundancy In Fax (AREA)

Description

【0001】
【産業上の利用分野】
この発明は、ディジタル画像信号の階層符号化装置において、メモリの無駄を防ぐことができるディジタル画像信号の階層符号化装置に関する。
【0002】
【従来の技術】
従来、高能率符号化および復号の例としては、特開昭54−74623号公報に記載されているBTC(Block Truncation Coding )および本出願人が特願平4−155719号において、提案しているクラス分類適応予測があり、さらに、階層符号化としては、特開昭63−306789号公報において提案されているピラミッド符号化などが挙げられる。
【0003】
階層符号化とは、高解像度画像信号を第1の階層(あるいはレベル)として、これより解像度が低い第2の階層の画像信号、第2の階層の画像信号より解像度が低い第3の階層の画像信号、・・・を形成する符号化である。この階層符号化によれば、複数の階層の画像信号を一つの伝送路(通信路、記録/再生プロセス)を介して伝送し、受信側では、複数の階層とそれぞれ対応するテレビジョンモニタの何れか一つにより伝送画像データを再生することができる。
【0004】
より具体的には、標準解像度ビデオ信号、ハイビジョン信号等の高解像度ビデオ信号、コンピュータディスプレイの画像データ、画像データベースを高速検索するための低解像度ビデオ信号等が異なる解像度のビデオ信号として存在している。また、解像度の高低以外に、画像の縮小に対しても、かかる階層符号化を応用することが可能である。
【0005】
従来の階層符号化のエンコーダ構成例を図8に、デコーダ構成例を図9に示す。この例では5段の階層構造が使用されている。例えば、5階層符号化において面積比が逐次、1、1/4、1/16、1/64、1/256のように構成される。処理の基本的な考え方は図8のエンコーダ側において、間引きフィルタと補間フィルタを使用することで、入力画像信号を解像度の異なる複数の階層画像データに分解する。入力画像に間引きフィルタを多段に施すことにより、逐次、画素数の少ない縮小画像を生成する。
【0006】
ここで、従来の階層符号化装置のエンコーダ側の詳細な説明を図8のブロック図を用いて行う。入力端子111を介して原画像データd80として間引き回路112および符号化器116へ供給される。符号化器116では、何らかの圧縮のための処理が原画像データd80に対して実行され、生成された第1階層の符号化データd85が出力端子121を介して伝送される。
【0007】
間引き回路112では、供給された原画像データd80に対して、水平方向に1/2および垂直方向に1/2づつ画素の間引き処理が実行され、間引きデータd81が生成される。この間引きデータd81は、第2階層データに対応する。生成された間引きデータd81は、間引き回路113および符号化器117へ供給される。符号化器117では、上述と同様の処理が原画像データd81に対して実行され、生成された第2階層の符号化データd86が出力端子122を介して伝送される。
【0008】
また、間引きデータd81に対して、間引き回路113では、上述の間引き回路112と同様な処理が施され、間引きデータd82が生成される。この間引きデータd82は、第3階層データに対応する。生成された間引きデータd82は、間引き回路114および符号化器118へ供給される。符号化器118では、上述と同様の処理が原画像データd82に対して実行され、生成された第3階層の符号化データd87が出力端子123を介して伝送される。
【0009】
そして、間引き回路114でも同様に間引きデータd82に対して上述の間引き回路112および113と同様な処理が施され、間引きデータd83が生成される。この間引きデータd83は、第4階層データに対応する。生成された間引きデータd83は、間引き回路115および符号化器119へ供給される。符号化器119では、上述と同様の処理が原画像データd83に対して実行され、生成された第4階層の符号化データd88が出力端子124を介して伝送される。
【0010】
さらに、間引き回路115でも同様に間引きデータd83に対して上述の間引き回路112、113および114と同様な処理が施され、間引きデータd84が生成される。この間引きデータd84は、第5階層データに対応する。生成された間引きデータd84は、符号化器120へ供給される。符号化器120では、上述と同様の処理が原画像データd84に対して実行され、生成された第5階層の符号化データd89が出力端子125を介して伝送される。
【0011】
一方、図9のデコーダ構成例では、図8に示したエンコーダの逆処理が実行される。図8のエンコーダで生成された各階層データd85〜d89は、デコーダにおいて、d110〜d114として受信される。先ず、入力端子131から供給される第1階層入力データd100は、復号器136においてエンコーダで施された符号化に対応する復号処理が行われ、通常の画像データd105となり、第1階層の出力となり、出力端子141から取り出される。
【0012】
入力端子132から供給される第2階層入力データd101は、復号器137においてエンコーダで施された符号化に対応する復号処理が行われ、通常の画像データd106となり、第2階層の出力となり、出力端子142から取り出される。また、入力端子133から供給される第3階層入力データd102は、復号器138においてエンコーダで施された符号化に対応する復号処理が行われ、通常の画像データd107となり、第3階層の出力となり、出力端子143から取り出される。
【0013】
さらに、入力端子134から供給される第4階層入力データd103は、復号器139においてエンコーダで施された符号化に対応する復号処理が行われ、通常の画像データd108となり、第4階層の出力となり、出力端子144から取り出される。そして、入力端子135から供給される第5階層入力データd104は、復号器140においてエンコーダで施された符号化に対応する復号処理が行われ、通常の画像データd109となり、第5階層の出力となり、出力端子145から取り出される。
【0014】
【発明が解決しようとする課題】
上述した従来の階層符号化では、対象画像を複数の解像度の異なる画像で表現することが実現される反面、エンコーダ側において複数の画像に分解した上で符号化を施すため、階層数に応じて符号化対象画素数が増加し圧縮効率が低下するという問題があった。
【0015】
従って、この発明の目的は、これらを鑑みて圧縮効率を低下させることなく、複数の解像度を有する階層を伝送することができるディジタル画像信号の階層符号化装置を提供することにある。
【0016】
【課題を解決するための手段】
この発明は、入力画像データからなる第1の階層データと、第1の階層データより低い解像度を表現する第2の階層データを伝送するようにしたディジタル画像信号の階層符号化装置において、第1の階層の画素を間引くことにより、第2の階層データを形成するための間引き手段と、第1の階層データを符号化し、符号化された第1の階層データを出力する符号化手段と、符号化された第1の階層データを復号化し、復号化された第1の階層データを出力する復号化手段と、符号化及び復号化することによって劣化した第1の階層データから第2の階層データを予測する予測手段と、予測された第2の階層データと第2の階層データとの差分値を符号化する符号化手段と、符号化された第1の階層データと、符号化された差分値とを出力する出力手段と、からなることを特徴とするディジタル画像信号の階層符号化装置である。
【0017】
【作用】
クラス分類適応予測によって、下位階層から上位階層のデータを予測し、その予測データと上位階層データとの差分を形成し、また、予測方式としてクラス分類適応予測を使用することによって効率の良い圧縮を行うことができる。
【0018】
【実施例】
以下、この発明のディジタル画像信号の階層符号化装置の一実施例について、図面を参照しながら説明する。先ず、圧縮効率を向上させるために、下位階層データから上位階層データを予測し、上位階層データとその予測値との差分を符号化する実施例を説明する。ここで、下位階層データとは、画素数の多い階層データであり、上位階層データとは、下位階層データに対して間引き処理を行うことにより画素数が間引かれた階層データを指す。
【0019】
図1は、階層符号化のエンコーダ側の構成例を示す。入力端子1を介して第1階層データが入力画像データd0として間引き回路2および符号化器6へ供給される。入力画像データd0は、間引き回路2において、上述したように水平方向に1/2の画素の間引きが行われると共に、垂直方向にも1/2の画素の間引きが行われる。すなわち、第1階層の入力画像データd0に対して、面積比で1/4に間引き処理が実行され、階層データd1が生成される。この階層データd1は、図2に示す第2階層データに対応する。生成された階層データd1は、間引き回路3および減算器19へ供給される。
【0020】
階層データd1に対して、間引き回路3では、上述の間引き回路2と同様な処理が施され、第1階層の入力画像データd0に対して、面積比で1/16に間引き処理が実行され、階層データd2が生成される。この階層データd2は、第3階層データに対応する。生成された階層データd2は、間引き回路4および減算器20へ供給される。また、間引き回路4でも同様に階層データd2に対して上述の間引き回路2および3と同様な処理が施され、第1階層の入力画像データd0に対して、面積比で1/64に間引き処理が実行され、階層データd3が生成される。この階層データd3は、第4階層データに対応する。階層データd3は、間引き回路5および減算器21へ供給される。さらに、間引き回路5でも同様に階層データd3に対して上述の間引き回路2、3および4と同様な処理が施され、第1階層の入力画像データd0に対して、面積比で1/256に間引き処理が実行され、階層データd4が生成される。この階層データd4は、第5階層データに対応する。生成された階層データd4は、減算器22へ供給される。
【0021】
そして、これら5つの階層データについて隣接階層間データによる差分演算が行われる。先ず、第1階層においては、高能率圧縮符号化、可変長符号化等の何らかの圧縮のための処理が符号化器6において、実行される。この符号化器6の符号化データd5は、出力端子27を介して伝送されると共に、復号器11へも供給される。この符号化データd5は、第1階層のデータである。符号化データd5が供給された復号器11において、復号された復号データd6がクラス分類適応予測回路15へ供給される。クラス分類適応予測回路15では、復号データd6を使用して予測処理がなされ、第2階層データの予測値d7が生成され、減算器19へ供給される。この減算器19では、間引き回路2から供給される階層データd1と予測値d7との差分値が求められ、その差分値d8が符号化器7へ供給される。
【0022】
差分値d8が供給された符号化器7では、符号化器6と同様に圧縮処理が行われる。この符号化器7の符号化データd9は、復号器12へ供給される。この符号化データd9は、第2階層データとして出力端子28を介して伝送される。符号化器7から符号化データが供給された復号器12において、復号された復号データd10がクラス分類適応予測回路16へ供給される。クラス分類適応予測回路16では、復号データd10を使用して予測処理がなされ、第3階層データの予測値d11が生成され、減算器20へ供給される。この減算器20では、間引き回路3から供給される階層データd2と予測値d11との差分値が求められ、その差分値d12が符号化器8へ供給される。
【0023】
次に、差分値d12が供給された符号化器8では、上述した符号化器と同様な圧縮処理が行われる。この符号化器8の符号化データd13は、復号器13へ供給される。この符号化データd13は、第3階層データとして出力端子29を介して伝送される。符号化器8から符号化データd13が供給された復号器13において、復号された復号データd14がクラス分類適応予測回路17へ供給される。クラス分類適応予測回路17では、復号データd14を使用して予測処理がなされ、第4階層データの予測値d15が生成され、減算器21へ供給される。この減算器21では、間引き回路4から供給される階層データd3と予測値d15との差分値が求められ、その差分値d16が符号化器9へ供給される。
【0024】
そして、差分値d16が供給された符号化器9では、上述した符号化器と同様な圧縮処理が行われる。この符号化器9の符号化データd17は、復号器14へ供給される。この符号化データd17は、第4階層データとして出力端子30を介して供給される。符号化器9から符号化データd17が供給された復号器14において、復号された復号データd18がクラス分類適応予測回路18へ供給される。クラス分類適応予測回路18では、復号データd18を使用して予測処理がなされ、第5階層データの予測値d19が生成され、減算器22へ供給される。この減算器22では、間引き回路5から供給される階層データd4と予測値d19との差分値が求められ、その差分値d20が符号化器10へ供給される。
【0025】
また、差分値d20が供給された符号化器10では、上述した符号化器と同様な圧縮処理が行われる。この符号化器10の符号化データd21は、第5階層データとして出力端子31を介して伝送される。このように、符号化対象画素数の増加を防止した階層符号化において、クラス分類適応予測が適用される。
【0026】
次に、この発明の一実施例の階層符号化のデコーダ側の構成例を図2に示す。図1に示すエンコーダで生成された第1〜第5の各階層の符号化データd5、d9、d13、d17、d21は、d30〜d34として受信される。先ず、入力端子41から供給される第1階層入力データd30は、復号器46においてエンコーダで施された符号化に対応する復号処理が行われ、画像データd35となり、クラス分類適応予測回路51へ供給される。また画像データd39は、第1階層の出力として、出力端子59から取り出される。
【0027】
クラス分類適応予測回路51では、第1階層の画像データに対してクラス分類適応予測が施され、第2階層データの予測値d40が生成される。復号器47において復号されたデータd36と予測値d40が加算器55で加算される。加算器55から画像データd41がクラス分類適応予測回路52へ供給される。また画像データd41は、第4階層の出力として、出力端子60から取り出される。
【0028】
そして、クラス分類適応予測回路52では、上述と同様に第2階層の画像データに対してクラス分類適応予測が施され、第3階層データの予測値d42が生成される。復号器48において復号されたデータd37と予測値d42の加算が加算器56で行われる。加算器56から画像データd43がクラス分類適応予測回路53へ供給される。また画像データd43は、第3階層の出力として、出力端子61から取り出される。
【0029】
また、クラス分類適応予測回路53では、上述と同様に第3階層の画像データに対してクラス分類適応予測が施され、第4階層データの予測値d44が生成される。復号器49において復号されたデータd38と予測値d44の加算が加算器57で行われる。加算器57から画像データd45がクラス分類適応予測回路54へ供給される。また画像データd45は、第4階層の出力として、出力端子62から取り出される。
【0030】
さらに、クラス分類適応予測回路54では、上述と同様に第4階層の画像データに対してクラス分類適応予測が施され、第5階層データの予測値d46が生成される。復号器50において復号されたデータd39と予測値d46の加算が加算器58で行われる。加算器58から画像データd47が第5階層の出力として、出力端子63から取り出される。これらにより、最終的に画素数の異なる5階層の復元画像を並列に得ることができる。また、符号化対象画素数の増加を防止した階層符号化において、クラス分類適応予測を導入することで符号化効率の向上を図ることが可能となる。
【0031】
さて、ここで符号化効率の向上のために用いられたクラス分類適応予測について説明を行う。クラス分類適応予測とは、入力信号の特徴に基づき入力信号をいくつかのクラスに分類し、予め用意されたクラス毎の適切な適応予測を実行する手法であり、画質劣化の少ない圧縮効率の高い階層符号化を実現することができるものである。
【0032】
先ず、クラス分類法の例としては、入力信号(8ビットPCMデータ)に対しクラス生成タップを設定し、入力信号の波形特性によりクラスを生成する手法が挙げられる。信号波形のクラス生成法としては次の例などが提案されている。
1)PCMデータを直接使用する方法
2)ADRCを適用する方法
3)DPCMを適用する方法
4)BTCを適用する方法
5)VQを適用する方法
6)DCT(アダマール変換)を適用する方法
【0033】
PCMデータを直接使用する場合、クラス分類用に8ビットデータを7画素使用すると、256という膨大な数のクラスに分類される。信号波形の特徴を掴むという意味では理想的ではあるが、回路上の負担は大きく、実用上は問題である。そこで実際はADRC(Adaptive Dynamic Range Coding )などを適用しクラス数の削減を図る。このADRC、例えば特開昭61−144989号公報に記載されているものは、信号圧縮技術として開発された手法であるが、クラス表現に使用することにも適している。基本的には再量子化処理であり、式(1)で示される。
【0034】
【数1】
Figure 0003781797
但し、ci :ADRCコード
i :上位階層画素値
MIN:近傍領域内最小値
DR:近傍領域内ダイナミックレンジ
k:再量子化ビット数
【0035】
注目画素近傍の数画素に対し式(1)で定義されるADRCを用いて生成されるADRCコードよりクラス分類を行う。例えば7タップデータに対し1ビットADRCを適用すると、7画素のデータから定義されるダイナミックレンジに基づき、7画素中の最小値を除去した上で各タップの画素値を適応的に1ビット量子化するので、128クラスに削減することが可能となる。他に圧縮技術として一般的な、DPCM(予測符号化)、BTC(Blok Truncation Coding)、VQ(Vector Quantization )、DCT(Discrete Cosine Transform )などの周波数領域クラスが挙げられる。
【0036】
また、クラス分類の性能を更に向上させるため、下位階層データのアクティビティーも考慮した上でクラス分類が行われることがある。アクティビティーの判定法の例としては、クラス分類法にADRCを使用した場合、ダイナミックレンジを用いることが多い。また、DPCMならば差分絶対値和、BTCのときは標準偏差の絶対値などが用いられる。また、上記の学習過程において、アクティビティーの小さい学習分布は学習対象からはずす。この理由は、アクティビティーの小さい部分はノイズの影響が大きく、本来のクラスの予測値から外れることが多い。それを学習に入れると予測精度が低下する。これを避けるため、学習においては、アクティビティーの小さい画素分布を除外する。こうして分類されたクラス毎に適応予測を実行するが、適応予測としては予め学習された予測係数を用いた予測演算を行う方式と、重心法により予測値を学習しておく方式が提案されている。
【0037】
次に、予め学習により生成されたクラス毎の予測係数を用いた予測演算を行う適応予測について説明する。図3A、Bに示すように、下位階層の4画素x0 〜x3 から上位階層データy4 が生成される場合、下位階層データより上位階層データを予測する。例えば、下位階層データx0 〜x15の16画素により予測タップを構成し、上位階層データy´を予測する。このときの予測式の一例を式(2)に示す。
【0038】
【数2】
Figure 0003781797
但し、y´:上位階層予測値
i :下位階層予測タップ画素値
i :予測係数
【0039】
例えば、1ビットADRCによって、図3Aに示すある画素をクラス分類した場合、各クラス毎に生成された予測係数と下位階層データとの積和演算により上位階層データを予測する。この例においては、図3Bに示すように、x0 〜x15の16画素よりy4 が予測される。
【0040】
ここで、クラス分類適応予測の一例の回路構成を図3Cに示す。71で示す入力端子から入力信号INがクラス分類部72および予測演算部74へ供給される。クラス分類部72においては、上述のようなクラス分類処理に基づき、入力信号INに対するクラスd60が生成される。このクラスd60をアドレスとして予測係数ROM73より予測係数d61が予測演算部74に供給される。予測演算部74において、入力信号INと予測係数d61を用いて式(2)の予測演算が実行され、出力端子75を介して演算結果、すなわち予測値が取り出される。
【0041】
次に、上述した予測係数は、予め学習により生成しておくが、その学習方法について説明する。式(2)の線形一次結合モデルに基づく予測係数を最小自乗法により生成する一例を示す。最小自乗法は次のように適用される。一般化した例として、Xを入力データ、Wを予測係数、Yを予測値として次の式を考える。
観測方程式:XW=Y (3)
【数3】
Figure 0003781797
【0042】
上述の観測方程式により収集されたデータに最小自乗法を適用する。式(2)の例においては、n=16、mが学習データ数となる。式(3)の観測方程式をもとに、式(5)の残差方程式を考える。
残差方程式:
【数4】
Figure 0003781797
【0043】
式(5)の残差方程式から、各wi の最確値は、
【数5】
Figure 0003781797
を最小にする条件が成り立つ場合と考えられる。すなわち、式(6)の条件を考慮すれば良いわけである。
【0044】
【数6】
Figure 0003781797
式(6)のiに基づく条件を考え、これを満たすw1 、w2 、‥‥、wn を算出すれば良い。そこで、残差方程式の式(5)から式(7)が得られる。
【0045】
【数7】
Figure 0003781797
式(6)と式(7)により式(8)が得られる。
【0046】
【数8】
Figure 0003781797
そして、式(5)と式(8)から正規方程式として式(9)が得られる。
【0047】
【数9】
Figure 0003781797
【0048】
式(9)の正規方程式は、未知数の数nと同じ数の方程式を立てることが可能であるので、各wi の最確値を求めることができる。そして、掃き出し法(Gauss-Jordanの消去法)を用いて連立方程式を解く。
【0049】
ここで、この最小自乗法を用いた学習をソフトウェアで行う一例を図4のフローチャートに示す。先ず、ステップ81の学習データ形成では、入力データに対しクラス分類が行われる。ステップ83のクラス決定において、この例では16画素のデータ変化が検出される。ステップ84の正規方程式生成では、各クラス毎に式(9)に示す正規方程式を生成する。このとき一般に、ノイズの影響を排除するため、入力データ変化のアクティビティーが小さいものを学習対象から除外する。この学習プロセスにおいて、多くの学習データが登録された正規方程式が生成される。学習対象データが終了するまで、正規方程式生成プロセスが繰り返される。
【0050】
すなわち、ステップ82のデータ終了では、学習対象データ数の終了が確認されるまで上述のプロセスが繰り返される。そして、学習対象データ数の終了が確認された場合、このステップ82(データ終了)からステップ85の予測係数決定へ制御が移る。ステップ85(予測係数決定)では、多くの学習データより生成された、クラス毎の式(9)の正規方程式が解かれる。その連立方程式の解法として、この一例では、上述した掃き出し法が用いられる。こうして得られた予測係数は、ステップ86の予測係数登録において、クラス別にアドレス分割されたROM等の記憶部に登録される。このような学習過程により、クラス分類適応予測の予測係数が生成される。
【0051】
次に、クラス分類適応予測の適応処理法として、重心法により予測値を学習するときの手法の一例について説明する。上述のように下位階層データの信号の特徴に基づき分類されたクラス毎に、予め最適補間値を重心法により生成する。例えば、上述したように、図3Bの下位階層を用いて、1ビットADRCを施すことにより、クラス分類する場合を考える。図5の学習フローチャートに沿って手順を示す。ステップ91の初期化では、先ず、全てのクラスの度数カウンタN(*)と、全てのクラスのデータテーブルE(*)を初期化する。ここで、一例として、あるクラスをC0とすると、対応する度数カウンタは、N(C0)、対応するデータテーブルはE(C0)と定義する。また、*はクラスの全てを示す。
【0052】
次に、ステップ92のクラス検出において、学習対象画素近傍データからクラスCを決定する。このクラス分類手法としては、上述したようにADRCの他にも、PCM、DPCM、BTC、VQ、DCTなどの表現法が考えられる。また、クラス分類対象データより構成されるブロックのアクティビティーを考慮する場合は、クラス数をアクティビティーによる分類の種類だけ増やしておく。そして、ステップ93のデータ検出では、この学習対象となる上位階層画素値yが検出され、ステップ94のクラス別データ加算では、クラスC毎に検出された上位階層画素値yを加算する。すなわち、クラスCのデータテーブルE(*)を生成する。
【0053】
そして、ステップ95のクラス別度数加算では、クラスCの学習画素の度数カウンタN(C)を+1インクリメントする。ステップ96の全データ終了では、これらの処理を学習対象画素について繰り返し実行し、最終的な全てのクラスの度数カウンタN(*)と、対応する全てのクラスのデータテーブルE(*)を生成する。全データが終了していれば、ステップ97のクラス別平均値算出へ制御が移る。次に、ステップ97(クラス別平均値算出)では、各クラスのデータテーブルE(*)の内容であるデータ積算値を、対応クラスの度数カウンタN(*)の度数で、除算を実行することで各クラスの平均値を算出する。この値が重心法による各クラスの最適予測値となる。重心法という名称の由来は、学習対象画素値の分布の平均をとることによる。最終的に算出された平均値は、ステップ98のクラス別平均値登録において、クラス別にアドレス分割されたROM等の記憶部に登録される。上述のように学習過程において、ノイズの影響を排除するため、アクティビティーの小さい画素分布は学習対象からはずすことも考えられる。
【0054】
重心法に基づく学習により生成された最適予測値を用い、クラス分類適応予測により予測処理を実行する一例の回路構成を図6に示す。入力端子101を介して供給される下位階層データに対し、クラス分類部102では、クラス分類が行われる。このクラス分類に基づいて重心法により予め生成されたクラス毎の最適予測値が保持されているROM103から予測値が読み出される。このとき、ROM103のアドレスは、各クラスに対応している。読み出された予測値は、出力端子104から取り出される。
【0055】
ここで、重心法に基づく学習により生成された最適予測値を用い、クラス分類適応予測により予測処理を実行する他の例の回路構成を図7に示す。入力端子105を介して供給される下位階層データd70に対し、クラス分類部102においてクラス分類が行われる。このクラスは、d71として後段に伝送される。重心法により予め生成されたクラス毎の最適予測値は、最適予測値ROM107にクラス別に登録されている。この最適予測値ROM107のアドレスは、各クラスに対応させる。
【0056】
上述の図6の構成例においては、下位階層データのアクティビティーを考慮していないが、この例では、下位階層データのアクティビティーを考慮した上でクラス分類が行われる。そこで、アクティビティークラス分類部106において、入力された下位階層データd70のブロック毎のアクティビティーに基づくクラス分類を行う。アクティビティーの具体的なものは、上述したようにブロックのダイナミックレンジ、ブロックデータの標準偏差の絶対値、ブロックデータの平均値に対する各画素の値の差分の絶対値等である。アクティビティーにより画像の性質が異なる場合があるので、このようなアクティビティーをクラス分類のパラメータとして使用することによって、クラス分類をより高精度とすることができ、また、クラス分類の自由度を増すことができる。
【0057】
クラス分類部102およびアクティビティークラス分類部107によるクラス分類の動作は、先ず、アクティビティークラス分類部107によって、ブロックのアクティビティーにより複数のクラスに分け、そのクラス毎にクラス分類部102によるクラス分けを行う。クラス分類部102およびアクティビティークラス分類部107からクラスd71およびd72が最適予測値ROM107に対してアドレスとして供給され、最適予測値ROM107から予測上位階層データd73が発生し、出力端子108から取り出される。以上の処理により重心法を用いたクラス分類適応予測が実行される。
【0058】
上述の実施例の具体的な応用例としては、ハイビジョンテレビ静止画像のデータベースを構成した場合、最下位階層データ、すなわち第1階層(原画像)データがハイビジョン解像度の再生データであり、第2階層データが標準解像度の再生データとなり、最上位階層データ、すなわち第5階層データは、高速検索用の低解像度の再生データとなる。
【0059】
なお、情報量の削減を目的として圧縮符号化を採用する場合には、復号化装置により得られた再生画像データは、入力された原画像データと必ずしも一致しないが、視覚的に劣化を検知できない程度にすることが可能である。また、平均値を形成するのに単純平均値に限らず、加重平均値を形成しても良い。
【0060】
さらに、この発明は、量子化ステップ幅を制御する等によって、発生情報量を制御するバッファリングの構成を備える階層符号化システムに対しても適用することができる。
【0061】
【発明の効果】
この発明に依れば、複数の解像度を有する階層符号化を実現することが容易にできる。また、この発明に依れば、差分を符号化するので、圧縮効率の低下しない階層符号化を実現することが容易にできる。さらに、この発明に依れば、クラス分類適応予測を用いることによって、予測精度が向上でき、従って、画質劣化の少ない階層符号化を実現することができる。これと共に、この発明に依れば、クラス分類適応予測による上位階層データの予測を行うことにより大幅な信号電力の削減を実現することができる。
【図面の簡単な説明】
【図1】この発明のクラス分類適応予測が使用された階層符号化のエンコード側の一例を示すブロック図である。
【図2】この発明のクラス分類適応予測が使用された階層符号化のデコード側の一例を示すブロック図である。
【図3】この発明に係る予測係数方式を使用するクラス分類適応予測の一例の説明に用いる略線図である。
【図4】この発明に係るクラス分類適応予測の予測係数の係数値を学習する一例を示すフローチャートである。
【図5】この発明に係るクラス分類適応予測の重心法の最適予測値を学習する一例を示すフローチャートである。
【図6】この発明に係る重心法方式を使用するクラス分類適応予測の一例の説明に用いるブロック図である。
【図7】この発明に係る重心法方式において、アクティビティーを使用するクラス分類適応予測の一例の説明に用いるブロック図である。
【図8】従来の階層符号化のエンコード側の一例を示すブロック図である。
【図9】従来の階層符号化のデコード側の一例を示すブロック図である。
【符号の説明】
2、3、4、5 間引き回路
6、7、8、9、10 符号化器
11、12、13、14 復号器
15、16、17、18 クラス分類適応予測回路

Claims (10)

  1. 入力画像データからなる第1の階層データと、上記第1の階層データより低い解像度を表現する第2の階層データを伝送するようにしたディジタル画像信号の階層符号化装置において、
    上記第1の階層の画素を間引くことにより、上記第2の階層データを形成するための間引き手段と、
    上記第1の階層データを符号化し、符号化された第1の階層データを出力する符号化手段と、
    符号化された上記第1の階層データを復号化し、復号化された第1の階層データを出力する復号化手段と、
    符号化及び復号化することによって劣化した上記第1の階層データから上記第2の階層データを予測する予測手段と、
    予測された上記第2の階層データと上記第2の階層データとの差分値を符号化する符号化手段と、
    符号化された上記第1の階層データと、符号化された上記差分値とを出力する出力手段と、
    からなることを特徴とするディジタル画像信号の階層符号化装置。
  2. 請求項1に記載のディジタル画像信号の階層符号化装置において、
    上記予測手段は、クラス分類適応予測手段であることを特徴とするディジタル画像信号の階層符号化装置。
  3. 請求項2に記載のディジタル画像信号の階層符号化装置において、
    上記クラス分類適応予測手段、上記第1の階層データからクラスを生成する手段と、
    予め学習により獲得された予測係数値を格納した記憶手段と、
    生成された上記クラスに基づいて、上記記憶手段から上記予測係数値を読み出す手段と、
    読み出された上記予測係数値と上記第1の階層データとを用いた予測式の演算から最適な予測値を生成する手段と
    からなることを特徴とするディジタル画像信号の階層符号化装置。
  4. 請求項3に記載のディジタル画像信号の階層符号化装置において、
    上記予測式は、線形一次結合式であることを特徴とするディジタル画像信号の階層符号化装置。
  5. 請求項3に記載のディジタル画像信号の階層符号化装置において、
    記第1の階層データからクラス毎に上記予測係数値を学習する際に、上記クラスのアクティビティーの小さい画素を学習の対象から除外することを特徴とするディジタル画像信号の階層符号化装置。
  6. 請求項2に記載のディジタル画像信号の階層符号化装置において、
    上記クラス分類適応予測手段、上記第1の階層データからクラスを生成する手段と、
    予め学習により獲得された最適な予測値を格納した記憶手段と、
    上記クラスに対応した最適な上記予測値を読み出して出力する手段と
    からなることを特徴とするディジタル画像信号の階層符号化装置。
  7. 請求項6に記載のディジタル画像信号の階層符号化装置において、
    記第1の階層データからクラス毎に最適な上記予測値を学習する際に、重心法による学習を行うことを特徴とするディジタル画像信号の階層符号化装置。
  8. 請求項6に記載のディジタル画像信号の階層符号化装置において、
    記第1の階層データからクラス毎に最適な上記予測値を学習する際に、上記クラスのアクティビティーの小さい画素を学習の対象から除外することを特徴とするディジタル画像信号の階層符号化装置。
  9. 請求項2に記載のディジタル画像信号の階層符号化装置において、
    上記クラス分類適応予測手段では、第1の階層データの画素値を直接適用することによりクラス分類を行い、上記クラスを表現するビット数を削減することを特徴とするディジタル画像信号の階層符号化装置。
  10. 請求項2に記載のディジタル画像信号の階層符号化装置において、
    上記クラス分類適応予測手段では、第1の階層データの画素値に圧縮符号化を適用することによりクラス分類を行い、上記クラスを表現するビット数を削減することを特徴とするディジタル画像信号の階層符号化装置。
JP2736295A 1995-01-23 1995-01-23 ディジタル画像信号の階層符号化装置 Expired - Lifetime JP3781797B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2736295A JP3781797B2 (ja) 1995-01-23 1995-01-23 ディジタル画像信号の階層符号化装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2736295A JP3781797B2 (ja) 1995-01-23 1995-01-23 ディジタル画像信号の階層符号化装置

Publications (2)

Publication Number Publication Date
JPH08204969A JPH08204969A (ja) 1996-08-09
JP3781797B2 true JP3781797B2 (ja) 2006-05-31

Family

ID=12218946

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2736295A Expired - Lifetime JP3781797B2 (ja) 1995-01-23 1995-01-23 ディジタル画像信号の階層符号化装置

Country Status (1)

Country Link
JP (1) JP3781797B2 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
ATE431677T1 (de) * 2004-07-13 2009-05-15 Koninkl Philips Electronics Nv Verfahren zur räumlichen und snr- bildkomprimierung

Also Published As

Publication number Publication date
JPH08204969A (ja) 1996-08-09

Similar Documents

Publication Publication Date Title
JP3743384B2 (ja) 画像符号化装置及び方法、並びに画像復号装置及び方法
Creusere A new method of robust image compression based on the embedded zerotree wavelet algorithm
CN1125409C (zh) 使用可变块尺寸的分层运动估算装置和方法
US6912318B2 (en) Method and system for compressing motion image information
JP2007503784A (ja) ハイブリッドビデオ圧縮法
WO1999017257A2 (en) System and method for compressing images using multi-threshold wavelet coding
MXPA05012973A (es) Orden de explotacion de coeficiente adaptable.
KR20010033797A (ko) 스케일 가능한 계층적 움직임 추정을 실행하는 장치 및방법
JP2005515727A (ja) 複合文書の圧縮のためのコーダに整合したレイヤ分離および補間
US5719961A (en) Adaptive technique for encoder and decoder signal transformation
CN1695381A (zh) 在数字视频信号的后处理中使用编码信息和局部空间特征的清晰度增强
CN1122247C (zh) 运动补偿预测方法及使用该方法的编码器和解码器
JP2003032496A (ja) 画像符号化装置および方法
Peng et al. Embedded image compression based on wavelet pixel classification and sorting
US7551788B2 (en) Digital image coding device and method for noise removal using wavelet transforms
JP3830549B2 (ja) ディジタル画像信号の階層符号化装置および方法
US6631161B1 (en) Method and system for compressing motion image information
JP3781797B2 (ja) ディジタル画像信号の階層符号化装置
JP3853708B2 (ja) デジタル画像符号化装置および符号化方法ならびにプログラム
JP2004135254A (ja) 画像処理装置
JP2000165873A (ja) 動画像情報の圧縮方法およびそのシステム
KR20020055864A (ko) 칼라 정지영상의 부호화 및 복호화 방법
JPH08307835A (ja) クラス分類適応処理装置および方法
Galan-Hernandez et al. Advances in image and video compression using wavelet transforms and fovea centralis
EP1170956A2 (en) Method and system for compressing motion image information

Legal Events

Date Code Title Description
A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20040116

A911 Transfer of reconsideration by examiner before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20040122

A912 Removal of reconsideration by examiner before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A912

Effective date: 20040305

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20060308

FPAY Renewal fee payment (prs date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100317

Year of fee payment: 4

FPAY Renewal fee payment (prs date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100317

Year of fee payment: 4

FPAY Renewal fee payment (prs date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110317

Year of fee payment: 5

FPAY Renewal fee payment (prs date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130317

Year of fee payment: 7

FPAY Renewal fee payment (prs date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140317

Year of fee payment: 8

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

EXPY Cancellation because of completion of term