JP2001320277A - データ処理装置およびデータ処理方法、並びに記録媒体 - Google Patents

データ処理装置およびデータ処理方法、並びに記録媒体

Info

Publication number
JP2001320277A
JP2001320277A JP2000135356A JP2000135356A JP2001320277A JP 2001320277 A JP2001320277 A JP 2001320277A JP 2000135356 A JP2000135356 A JP 2000135356A JP 2000135356 A JP2000135356 A JP 2000135356A JP 2001320277 A JP2001320277 A JP 2001320277A
Authority
JP
Japan
Prior art keywords
data
tap
circuit
class
prediction
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2000135356A
Other languages
English (en)
Other versions
JP4517448B2 (ja
Inventor
Tetsujiro Kondo
哲二郎 近藤
Toshihiko Hamamatsu
俊彦 浜松
Hideo Nakaya
秀雄 中屋
Takeharu Nishikata
丈晴 西片
Hideki Otsuka
秀樹 大塚
Takeshi Kunihiro
威 國弘
Takafumi Morifuji
孝文 森藤
Masashi Uchida
真史 内田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Corp
Original Assignee
Sony Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority to JP2000135356A priority Critical patent/JP4517448B2/ja
Application filed by Sony Corp filed Critical Sony Corp
Priority to CN2004100558118A priority patent/CN1578159B/zh
Priority to EP01930004A priority patent/EP1282236B1/en
Priority to PCT/JP2001/003873 priority patent/WO2001086820A1/ja
Priority to US10/030,591 priority patent/US7035471B2/en
Priority to KR1020027000250A priority patent/KR100731708B1/ko
Priority to CNB2004100558103A priority patent/CN100568739C/zh
Priority to CNB018019870A priority patent/CN1169303C/zh
Publication of JP2001320277A publication Critical patent/JP2001320277A/ja
Priority to US11/348,720 priority patent/US7206452B2/en
Priority to US11/584,789 priority patent/US7289671B2/en
Priority to US11/584,772 priority patent/US7283678B2/en
Priority to US11/584,483 priority patent/US7336829B2/en
Application granted granted Critical
Publication of JP4517448B2 publication Critical patent/JP4517448B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Compression Of Band Width Or Redundancy In Fax (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

(57)【要約】 【課題】 JPEG符号化されたデータを、効率的に復
号する。 【解決手段】 JPEG符号化されたデータは、エント
ロピー復号されることにより、量子化されたDCT係数
(量子化DCT係数)とされ、予測タップ抽出回路41
およびクラスタップ抽出回路42に供給される。予測タ
ップ抽出回路41とクラスタップ抽出回路42は、量子
化DCT係数から、必要なものを抽出し、予測タップと
クラスタップをそれぞれ構成する。クラス分類回路43
は、クラスタップに基づいてクラス分類を行い、係数テ
ーブル記憶部44は、クラス分類の結果得られるクラス
に対応するタップ係数を、積和演算回路45に供給す
る。積和演算回路45は、タップ係数とクラスタップと
を用いて、線形予測演算を行い、復号された画像データ
を得る。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、データ処理装置お
よびデータ処理方法、並びに記録媒体に関し、特に、例
えば、不可逆圧縮された画像等を復号する場合に用いて
好適なデータ処理装置およびデータ処理方法、並びに記
録媒体に関する。
【0002】
【従来の技術】例えば、ディジタル画像データは、その
データ量が多いため、そのまま記録や伝送を行うには、
大容量の記録媒体や伝送媒体が必要となる。そこで、一
般には、画像データを圧縮符号化することにより、その
データ量を削減してから、記録や伝送が行われる。
【0003】画像を圧縮符号化する方式としては、例え
ば、静止画の圧縮符号化方式であるJPEG(Joint Pho
tographic Experts Group)方式や、動画の圧縮符号化方
式であるMPEG(Moving Picture Experts Group)方式
等がある。
【0004】例えば、JPEG方式による画像データの
符号化/復号は、図1に示すように行われる。
【0005】即ち、図1(A)は、従来のJPEG符号
化装置の一例の構成を示している。
【0006】符号化対象の画像データは、ブロック化回
路1に入力され、ブロック化回路1は、そこに入力され
る画像データを、8×8画素の64画素でなるブロック
に分割する。ブロック化回路1で得られる各ブロック
は、DCT(Discrete Cosine Transform)回路2に供給
される。DCT回路2は、ブロック化回路1からのブロ
ックに対して、DCT(離散コサイン変換)処理を施
し、1個のDC(Direct Current)成分と、水平方向およ
び垂直方向についての63個の周波数成分(AC(Alter
nating Current)成分)の、合計64個のDCT係数に
変換する。各ブロックごとの64個のDCT係数は、D
CT回路2から量子化回路3に供給される。
【0007】量子化回路3は、所定の量子化テーブルに
したがって、DCT回路2からのDCT係数を量子化
し、その量子化結果(以下、適宜、量子化DCT係数と
いう)を、量子化に用いた量子化テーブルとともに、エ
ントロピー符号化回路4に供給する。
【0008】ここで、図1(B)は、量子化回路3にお
いて用いられる量子化テーブルの例を示している。量子
化テーブルには、一般に、人間の視覚特性を考慮して、
重要性の高い低周波数のDCT係数は細かく量子化し、
重要性の低い高周波数のDCT係数は粗く量子化するよ
うな量子化ステップが設定されており、これにより、画
像の画質の劣化を抑えて、効率の良い圧縮が行われるよ
うになっている。
【0009】エントロピー符号化回路4は、量子化回路
3からの量子化DCT係数に対して、例えば、ハフマン
符号化等のエントロピー符号化処理を施して、量子化回
路3からの量子化テーブルを付加し、その結果得られる
符号化データを、JPEG符号化結果として出力する。
【0010】次に、図1(C)は、図1(A)のJPE
G符号化装置が出力する符号化データを復号する、従来
のJPEG復号装置の一例の構成を示している。
【0011】符号化データは、エントロピー復号回路1
1に入力され、エントロピー復号回路11は、符号化デ
ータを、エントロピー符号化された量子化DCT係数
と、量子化テーブルとに分離する。さらに、エントロピ
ー復号回路11は、エントロピー符号化された量子化D
CT係数をエントロピー復号し、その結果得られる量子
化DCT係数を、量子化テーブルとともに、逆量子化回
路12に供給する。逆量子化回路12は、エントロピー
復号回路11からの量子化DCT係数を、同じくエント
ロピー復号回路11からの量子化テーブルにしたがって
逆量子化し、その結果得られるDCT係数を、逆DCT
回路13に供給する。逆DCT回路13は、逆量子化回
路12からのDCT係数に、逆DCT処理を施し、その
結果得られる8×8画素の復号ブロックを、ブロック分
解回路14に供給する。ブロック分解回路14は、逆D
CT回路13からの復号ブロックのブロック化を解くこ
とで、復号画像を得て出力する。
【0012】
【発明が解決しようとする課題】図1(A)のJPEG
符号化装置では、その量子化回路3において、ブロック
の量子化に用いる量子化テーブルの量子化ステップを大
きくすることにより、符号化データのデータ量を削減す
ることができる。即ち、高圧縮を実現することができ
る。
【0013】しかしながら、量子化ステップを大きくす
ると、いわゆる量子化誤差も大きくなることから、図1
(C)のJPEG復号装置で得られる復号画像の画質が
劣化する。即ち、復号画像には、ぼけや、ブロック歪
み、モスキートノイズ等が顕著に現れる。
【0014】従って、符号化データのデータ量を削減し
ながら、復号画像の画質を劣化させないようにするに
は、あるいは、符号化データのデータ量を維持して、復
号画像の画質を向上させるには、JPEG復号した後
に、何らかの画質向上のための処理を行う必要がある。
【0015】しかしながら、JPEG復号した後に、画
質向上のための処理を行うことは、処理が煩雑になり、
最終的に復号画像が得られるまでの時間も長くなる。
【0016】本発明は、このような状況に鑑みてなされ
たものであり、JPEG符号化された画像等から、効率
的に、画質の良い復号画像を得ること等ができるように
するものである。
【0017】
【課題を解決するための手段】本発明の第1のデータ処
理装置は、学習を行うことにより求められたタップ係数
を取得する取得手段と、タップ係数および変換データを
用いて、所定の予測演算を行うことにより、変換データ
を、元のデータに復号する復号手段とを備えることを特
徴とする。
【0018】第1のデータ処理装置において、復号手段
には、タップ係数および変換データを用いて、線形1次
予測演算を行うことにより、変換データを、元のデータ
に復号させることができる。
【0019】第1のデータ処理装置には、タップ係数を
記憶している記憶手段をさらに設けることができ、この
場合、取得手段には、記憶手段から、タップ係数を取得
させることができる。
【0020】第1のデータ処理装置において、変換デー
タは、元のデータを、直交変換または周波数変換し、さ
らに量子化することにより得られたものとすることがで
きる。
【0021】第1のデータ処理装置には、変換データ
を、逆量子化する逆量子化手段をさらに設けることがで
き、この場合、復号手段には、逆量子化された変換デー
タを、元のデータに復号させることができる。
【0022】第1のデータ処理装置において、変換デー
タは、元のデータを、少なくとも、離散コサイン変換し
たものとすることができる。
【0023】第1のデータ処理装置には、元のデータの
うちの、注目している注目データを予測するのにタップ
係数とともに用いる変換データを抽出し、予測タップと
して出力する予測タップ抽出手段をさらに設けることが
でき、この場合、復号手段には、予測タップおよびタッ
プ係数を用いて予測演算を行わせることができる。
【0024】第1のデータ処理装置には、注目データ
を、幾つかのクラスのうちのいずれかにクラス分類する
のに用いる変換データを抽出し、クラスタップとして出
力するクラスタップ抽出手段と、クラスタップに基づい
て、注目データのクラスを求めるクラス分類を行うクラ
ス分類手段とをさらに設けることができ、この場合、復
号手段には、予測タップおよび注目データのクラスに対
応するタップ係数を用いて予測演算を行わせることがで
きる。
【0025】第1のデータ処理装置において、変換デー
タは、元のデータを、所定の単位ごとに、少なくとも、
直交変換処理または周波数変換したものとすることがで
き、この場合、復号手段には、所定の単位ごとに、変換
データを、元のデータに復号させることができる。
【0026】第1のデータ処理装置において、タップ係
数は、タップ係数および変換データを用いて、所定の予
測演算を行うことにより得られる元のデータの予測値の
予測誤差が、統計的に最小になるように、学習を行うこ
とにより得られたものとすることができる。
【0027】第1のデータ処理装置において、元のデー
タは、動画または静止画のデータとすることができる。
【0028】本発明の第1のデータ処理方法は、学習を
行うことにより求められたタップ係数を取得する取得ス
テップと、タップ係数および変換データを用いて、所定
の予測演算を行うことにより、変換データを、元のデー
タに復号する復号ステップとを備えることを特徴とす
る。
【0029】本発明の第1の記録媒体は、学習を行うこ
とにより求められたタップ係数を取得する取得ステップ
と、タップ係数および変換データを用いて、所定の予測
演算を行うことにより、変換データを、元のデータに復
号する復号ステップとを備えるプログラムが記録されて
いることを特徴とする。
【0030】本発明の第2のデータ処理装置は、教師と
なる教師データを、少なくとも、直交変換または周波数
変換することにより、生徒となる生徒データを生成する
生成手段と、タップ係数および生徒データを用いて予測
演算を行うことにより得られる教師データの予測値の予
測誤差が、統計的に最小になるように学習を行い、タッ
プ係数を求める学習手段とを備えることを特徴とする。
【0031】第2のデータ処理装置において、学習手段
には、タップ係数および生徒データを用いて線形1次予
測演算を行うことにより得られる教師データの予測値の
予測誤差が、統計的に最小になるように学習を行わせる
ことができる。
【0032】第2のデータ処理装置において、生成手段
には、教師データを、直交変換または周波数変換し、さ
らに量子化することにより、生徒データを生成させるこ
とができる。
【0033】第2のデータ処理装置において、生成手段
には、教師データを、直交変換または周波数変換して量
子化し、さらに逆量子化することにより、生徒データを
生成させることができる。
【0034】第2のデータ処理装置において、生成手段
には、教師データを、少なくとも、離散コサイン変換す
ることにより、生徒データを生成させることができる。
【0035】第2のデータ処理装置には、教師データの
うちの、注目している注目教師データを予測するのにタ
ップ係数とともに用いる生徒データを抽出し、予測タッ
プとして出力する予測タップ抽出手段をさらに設けるこ
とができ、この場合、学習手段には、予測タップおよび
タップ係数を用いて予測演算を行うことにより得られる
教師データの予測値の予測誤差が、統計的に最小になる
ように学習を行わせることができる。
【0036】第2のデータ処理装置には、注目教師デー
タを、幾つかのクラスのうちのいずれかにクラス分類す
るのに用いる生徒データを抽出し、クラスタップとして
出力するクラスタップ抽出手段と、クラスタップに基づ
いて、注目教師データのクラスを求めるクラス分類を行
うクラス分類手段とをさらに設けることができ、この場
合、学習手段には、予測タップおよび注目教師データの
クラスに対応するタップ係数を用いて予測演算を行うこ
とにより得られる教師データの予測値の予測誤差が、統
計的に最小になるように学習を行わせ、クラスごとのタ
ップ係数を求めさせることができる。
【0037】第2のデータ処理装置において、生成手段
には、教師データを、所定の単位ごとに、少なくとも、
直交変換処理または周波数変換することにより、生徒デ
ータを生成させることができる。
【0038】第2のデータ処理装置において、教師デー
タは、動画または静止画のデータとすることができる。
【0039】本発明の第2のデータ処理方法は、教師と
なる教師データを、少なくとも、直交変換または周波数
変換することにより、生徒となる生徒データを生成する
生成ステップと、タップ係数および生徒データを用いて
予測演算を行うことにより得られる教師データの予測値
の予測誤差が、統計的に最小になるように学習を行い、
タップ係数を求める学習ステップとを備えることを特徴
とする。
【0040】本発明の第2の記録媒体は、教師となる教
師データを、少なくとも、直交変換または周波数変換す
ることにより、生徒となる生徒データを生成する生成ス
テップと、タップ係数および生徒データを用いて予測演
算を行うことにより得られる教師データの予測値の予測
誤差が、統計的に最小になるように学習を行い、タップ
係数を求める学習ステップとを備えるプログラムが記録
されていることを特徴とする。
【0041】本発明の第1のデータ処理装置およびデー
タ処理方法、並びに記録媒体においては、学習を行うこ
とにより求められたタップ係数が取得され、そのタップ
係数と、変換データとを用いて、所定の予測演算が行わ
れることにより、変換データが、元のデータに復号され
る。
【0042】本発明の第2のデータ処理装置およびデー
タ処理方法、並びに記録媒体においては、教師となる教
師データを、少なくとも、直交変換または周波数変換す
ることにより、生徒となる生徒データが生成され、タッ
プ係数および生徒データを用いて予測演算を行うことに
より得られる教師データの予測値の予測誤差が、統計的
に最小になるように学習が行われることにより、タップ
係数が求められる。
【0043】
【発明の実施の形態】図2は、本発明を適用した画像伝
送システムの一実施の形態の構成例を示している。
【0044】伝送すべき画像データは、エンコーダ21
に供給されるようになっており、エンコーダ21は、そ
こに供給される画像データを、例えば、JPEG符号化
し、符号化データとする。即ち、エンコーダ21は、例
えば、前述の図1(A)に示したJPEG符号化装置と
同様に構成されており、画像データをJPEG符号化す
る。エンコーダ21がJPEG符号化を行うことにより
得られる符号化データは、例えば、半導体メモリ、光磁
気ディスク、磁気ディスク、光ディスク、磁気テープ、
相変化ディスクなどでなる記録媒体23に記録され、あ
るいは、また、例えば、地上波、衛星回線、CATV
(Cable Television)網、インターネット、公衆回線な
どでなる伝送媒体24を介して伝送される。
【0045】デコーダ22は、記録媒体23または伝送
媒体24を介して提供される符号化データを受信して、
元の画像データに復号する。この復号化された画像デー
タは、例えば、図示せぬモニタに供給されて表示等され
る。
【0046】次に、図3は、図2のデコーダ22の構成
例を示している。
【0047】符号化データは、エントロピー復号回路3
1に供給されるようになっており、エントロピー復号回
路31は、符号化データを、エントロピー復号して、そ
の結果得られるブロックごとの量子化DCT係数Qを、
係数変換回路32に供給する。なお、符号化データに
は、図1(C)のエントロピー復号回路11で説明した
場合と同様に、エントロピー符号化された量子化DCT
係数の他、量子化テーブルも含まれるが、量子化テーブ
ルは、後述するように、必要に応じて、量子化DCT係
数の復号に用いることが可能である。
【0048】係数変換回路32は、エントロピー復号回
路31からの量子化DCT係数Qと、後述する学習を行
うことにより求められるタップ係数を用いて、所定の予
測演算を行うことにより、ブロックごとの量子化DCT
係数を、8×8画素の元のブロックに復号する。
【0049】ブロック分解回路33は、係数変換回路3
2において得られる、復号されたブロック(復号ブロッ
ク)のブロック化を解くことで、復号画像を得て出力す
る。
【0050】次に、図4のフローチャートを参照して、
図3のデコーダ22の処理について説明する。
【0051】符号化データは、エントロピー復号回路3
1に順次供給され、ステップS1において、エントロピ
ー復号回路31は、符号化データをエントロピー復号
し、ブロックごとの量子化DCT係数Qを、係数変換回
路32に供給する。係数変換回路32は、ステップS2
において、エントロピー復号回路31からのブロックご
との量子化DCT係数Qを、タップ係数を用いた予測演
算を行うことにより、ブロックごとの画素値に復号し、
ブロック分解回路33に供給する。ブロック分解回路3
3は、ステップS3において、係数変換回路32からの
画素値のブロック(復号ブロック)のブロック化を解く
ブロック分解を行い、その結果得られる復号画像を出力
して、処理を終了する。
【0052】次に、図3の係数変換回路32では、例え
ば、クラス分類適応処理を利用して、量子化DCT係数
を、画素値に復号することができる。
【0053】クラス分類適応処理は、クラス分類処理と
適応処理とからなり、クラス分類処理によって、データ
を、その性質に基づいてクラス分けし、各クラスごとに
適応処理を施すものであり、適応処理は、以下のような
手法のものである。
【0054】即ち、適応処理では、例えば、量子化DC
T係数と、所定のタップ係数との線形結合により、元の
画素の予測値を求めることで、量子化DCT係数が、元
の画素値に復号される。
【0055】具体的には、例えば、いま、ある画像を教
師データとするとともに、その画像を、ブロック単位で
DCT処理し、さらに量子化して得られる量子化DCT
係数を生徒データとして、教師データである画素の画素
値yの予測値E[y]を、幾つかの量子化DCT係数x
1,x2,・・・の集合と、所定のタップ係数w1,w2
・・・の線形結合により規定される線形1次結合モデル
により求めることを考える。この場合、予測値E[y]
は、次式で表すことができる。
【0056】 E[y]=w11+w22+・・・ ・・・(1)
【0057】式(1)を一般化するために、タップ係数
jの集合でなる行列W、生徒データxijの集合でなる
行列X、および予測値E[yj]の集合でなる行列Y’
を、
【数1】 で定義すると、次のような観測方程式が成立する。
【0058】 XW=Y’ ・・・(2) ここで、行列Xの成分xijは、i件目の生徒データの集
合(i件目の教師データyiの予測に用いる生徒データ
の集合)の中のj番目の生徒データを意味し、行列Wの
成分wjは、生徒データの集合の中のj番目の生徒デー
タとの積が演算されるタップ係数を表す。また、y
iは、i件目の教師データを表し、従って、E[yi
は、i件目の教師データの予測値を表す。なお、式
(1)の左辺におけるyは、行列Yの成分yiのサフィ
ックスiを省略したものであり、また、式(1)の右辺
におけるx1,x2,・・・も、行列Xの成分xijのサフ
ィックスiを省略したものである。
【0059】そして、この観測方程式に最小自乗法を適
用して、元の画素値yに近い予測値E[y]を求めるこ
とを考える。この場合、教師データとなる真の画素値y
の集合でなる行列Y、および画素値yに対する予測値E
[y]の残差eの集合でなる行列Eを、
【数2】 で定義すると、式(2)から、次のような残差方程式が
成立する。
【0060】 XW=Y+E ・・・(3)
【0061】この場合、元の画素値yに近い予測値E
[y]を求めるためのタップ係数wjは、自乗誤差
【数3】 を最小にすることで求めることができる。
【0062】従って、上述の自乗誤差をタップ係数wj
で微分したものが0になる場合、即ち、次式を満たすタ
ップ係数wjが、元の画素値yに近い予測値E[y]を
求めるため最適値ということになる。
【0063】
【数4】 ・・・(4)
【0064】そこで、まず、式(3)を、タップ係数w
jで微分することにより、次式が成立する。
【0065】
【数5】 ・・・(5)
【0066】式(4)および(5)より、式(6)が得
られる。
【0067】
【数6】 ・・・(6)
【0068】さらに、式(3)の残差方程式における生
徒データxij、タップ係数wj、教師データyi、および
残差eiの関係を考慮すると、式(6)から、次のよう
な正規方程式を得ることができる。
【0069】
【数7】 ・・・(7)
【0070】なお、式(7)に示した正規方程式は、行
列(共分散行列)Aおよびベクトルvを、
【数8】 で定義するとともに、ベクトルWを、数1で示したよう
に定義すると、式 AW=v ・・・(8) で表すことができる。
【0071】式(7)における各正規方程式は、生徒デ
ータxijおよび教師データyiのセットを、ある程度の
数だけ用意することで、求めるべきタップ係数wjの数
Jと同じ数だけたてることができ、従って、式(8)
を、ベクトルWについて解くことで(但し、式(8)を
解くには、式(8)における行列Aが正則である必要が
ある)、最適なタップ係数(ここでは、自乗誤差を最小
にするタップ係数)wjを求めることができる。なお、
式(8)を解くにあたっては、例えば、掃き出し法(Ga
uss-Jordanの消去法)などを用いることが可能である。
【0072】以上のようにして、最適なタップ係数wj
を求めておき、さらに、そのタップ係数wjを用い、式
(1)により、元の画素値yに近い予測値E[y]を求
めるのが適応処理である。
【0073】なお、例えば、教師データとして、JPE
G符号化する画像と同一画質の画像を用いるとともに、
生徒データとして、その教師データをDCTおよび量子
化して得られる量子化DCT係数を用いた場合、タップ
係数としては、JPEG符号化された画像データを、元
の画像データに復号するのに、予測誤差が、統計的に最
小となるものが得られることになる。
【0074】従って、JPEG符号化を行う際の圧縮率
を高くしても、即ち、量子化に用いる量子化ステップを
粗くしても、適応処理によれば、予測誤差が、統計的に
最小となる復号処理が施されることになり、実質的に、
JPEG符号化された画像の復号処理と、その画質を向
上させるための処理とが、同時に施されることになる。
その結果、圧縮率を高くしても、復号画像の画質を維持
することができる。
【0075】また、例えば、教師データとして、JPE
G符号化する画像よりも高画質の画像を用いるととも
に、生徒データとして、その教師データの画質を、JP
EG符号化する画像と同一画質に劣化させ、さらに、D
CTおよび量子化して得られる量子化DCT係数を用い
た場合、タップ係数としては、JPEG符号化された画
像データを、高画質の画像データに復号するのに、予測
誤差が、統計的に最小となるものが得られることにな
る。
【0076】従って、この場合、適応処理によれば、J
PEG符号化された画像の復号処理と、その画質をより
向上させるための処理とが、同時に施されることにな
る。なお、上述したことから、教師データまたは生徒デ
ータとなる画像の画質を変えることで、復号画像の画質
を任意のレベルとするタップ係数を得ることができる。
【0077】図5は、以上のようなクラス分類適応処理
により、量子化DCT係数を画素値に復号する、図3の
係数変換回路32の第1の構成例を示している。
【0078】エントロピー復号回路31(図3)が出力
するブロックごとの量子化DCT係数は、予測タップ抽
出回路41およびクラスタップ抽出回路42に供給され
るようになっている。
【0079】予測タップ抽出回路41は、そこに供給さ
れる量子化DCT係数のブロック(以下、適宜、DCT
ブロックという)に対応する画素値のブロック(この画
素値のブロックは、現段階では存在しないが、仮想的に
想定される)(以下、適宜、画素ブロックという)を、
順次、注目画素ブロックとし、さらに、その注目画素ブ
ロックを構成する各画素を、例えば、いわゆるラスタス
キャン順に、順次、注目画素とする。さらに、予測タッ
プ抽出回路41は、注目画素の画素値を予測するのに用
いる量子化DCT係数を抽出し、予測タップとする。
【0080】即ち、予測タップ抽出回路41は、例え
ば、図6に示すように、注目画素が属する画素ブロック
に対応するDCTブロックのすべての量子化DCT係
数、即ち、8×8の64個の量子化DCT係数を、予測
タップとして抽出する。従って、本実施の形態では、あ
る画素ブロックのすべての画素について、同一の予測タ
ップが構成される。但し、予測タップは、注目画素ごと
に、異なる量子化DCT係数で構成することが可能であ
る。
【0081】予測タップ抽出回路41において得られ
る、画素ブロックを構成する各画素についての予測タッ
プ、即ち、64画素それぞれについての64セットの予
測タップは、積和演算回路45に供給される。但し、本
実施の形態では、上述したように、画素ブロックのすべ
ての画素について、同一の予測タップが構成されるの
で、実際には、1つの画素ブロックに対して、1セット
の予測タップを、積和演算回路45に供給すれば良い。
【0082】クラスタップ抽出回路42は、注目画素
を、幾つかのクラスのうちのいずれかに分類するための
クラス分類に用いる量子化DCT係数を抽出して、クラ
スタップとする。
【0083】なお、JPEG符号化では、画像が、画素
ブロックごとに符号化(DCT処理および量子化)され
ることから、ある画素ブロックに属する画素は、例え
ば、すべて同一のクラスにクラス分類することとする。
従って、クラスタップ抽出回路42は、ある画素ブロッ
クの各画素については、同一のクラスタップを構成す
る。即ち、クラスタップ抽出回路42は、例えば、予測
タップ抽出回路41における場合と同様に、図6に示し
たような、注目画素が属する画素ブロックに対応するD
CTブロックの8×8個のすべての量子化DCT係数
を、クラスタップとして抽出する。
【0084】ここで、画素ブロックに属する各画素を、
すべて同一のクラスにクラス分類するということは、そ
の画素ブロックをクラス分類することと等価である。従
って、クラスタップ抽出回路42には、注目画素ブロッ
クを構成する64画素それぞれをクラス分類するための
64セットのクラスタップではなく、注目画素ブロック
をクラス分類するための1セットのクラスタップを構成
させれば良く、このため、クラスタップ抽出回路42
は、画素ブロックごとに、その画素ブロックをクラス分
類するために、その画素ブロックに対応するDCTブロ
ックの64個の量子化DCT係数を抽出して、クラスタ
ップとするようになっている。
【0085】なお、予測タップやクラスタップを構成す
る量子化DCT係数は、上述したパターンのものに限定
されるものではない。
【0086】クラスタップ抽出回路42において得られ
る、注目画素ブロックのクラスタップは、クラス分類回
路43に供給されるようになっており、クラス分類回路
43は、クラスタップ抽出回路42からのクラスタップ
に基づき、注目画素ブロックをクラス分類し、その結果
得られるクラスに対応するクラスコードを出力する。
【0087】ここで、クラス分類を行う方法としては、
例えば、ADRC(Adaptive Dynamic Range Coding)等を採
用することができる。
【0088】ADRCを用いる方法では、クラスタップを構
成する量子化DCT係数が、ADRC処理され、その結果得
られるADRCコードにしたがって、注目画素ブロックのク
ラスが決定される。
【0089】なお、KビットADRCにおいては、例えば、
クラスタップを構成する量子化DCT係数の最大値MAX
と最小値MINが検出され、DR=MAX-MINを、集合の局所的
なダイナミックレンジとし、このダイナミックレンジDR
に基づいて、クラスタップを構成する量子化DCT係数
がKビットに再量子化される。即ち、クラスタップを構
成する量子化DCT係数の中から、最小値MINが減算さ
れ、その減算値がDR/2Kで除算(量子化)される。そし
て、以上のようにして得られる、クラスタップを構成す
るKビットの各量子化DCT係数を、所定の順番で並べ
たビット列が、ADRCコードとして出力される。従って、
クラスタップが、例えば、1ビットADRC処理された場合
には、そのクラスタップを構成する各量子化DCT係数
は、最小値MINが減算された後に、最大値MAXと最小値MI
Nとの平均値で除算され、これにより、各量子化DCT
係数が1ビットとされる(2値化される)。そして、そ
の1ビットの量子化DCT係数を所定の順番で並べたビ
ット列が、ADRCコードとして出力される。
【0090】なお、クラス分類回路43には、例えば、
クラスタップを構成する量子化DCT係数のレベル分布
のパターンを、そのままクラスコードとして出力させる
ことも可能であるが、この場合、クラスタップが、N個
の量子化DCT係数で構成され、各量子化DCT係数
に、Kビットが割り当てられているとすると、クラス分
類回路43が出力するクラスコードの場合の数は、(2
NK通りとなり、量子化DCT係数のビット数Kに指数
的に比例した膨大な数となる。
【0091】従って、クラス分類回路43においては、
クラスタップの情報量を、上述のADRC処理や、あるいは
ベクトル量子化等によって圧縮してから、クラス分類を
行うのが好ましい。
【0092】ところで、本実施の形態では、クラスタッ
プは、上述したように、64個の量子化DCT係数で構
成される。従って、例えば、仮に、クラスタップを1ビ
ットADRC処理することにより、クラス分類を行うことと
しても、クラスコードの場合の数は、264通りという大
きな値となる。
【0093】そこで、本実施の形態では、クラス分類回
路43において、クラスタップを構成する量子化DCT
係数から、重要性の高い特徴量を抽出し、その特徴量に
基づいてクラス分類を行うことで、クラス数を低減する
ようになっている。
【0094】即ち、図7は、図5のクラス分類回路43
の構成例を示している。
【0095】クラスタップは、電力演算回路51に供給
されるようになっており、電力演算回路51は、クラス
タップを構成する量子化DCT係数を、幾つかの空間周
波数帯域のものに分け、各周波数帯域の電力を演算す
る。
【0096】即ち、電力演算回路51は、クラスタップ
を構成する8×8個の量子化DCT係数を、例えば、図
8に示すような4つの空間周波数帯域S0,S1,S2
3に分割する。
【0097】ここで、クラスタップを構成する8×8個
の量子化DCT係数それぞれを、アルファベットxに、
図6に示したような、ラスタスキャン順に、0からのシ
ーケンシャルな整数を付して表すこととすると、空間周
波数帯域S0は、4個の量子化DCT係数x0,x1
8,x9から構成され、空間周波数帯域S1は、12個
の量子化DCT係数x2,x3,x4,x5,x6,x7,x
10,x11,x12,x13,x14,x15から構成される。ま
た、空間周波数帯域S2は、12個の量子化DCT係数
16,x17,x24,x25,x32,x33,x40,x41,x
48,x49,x56,x57から構成され、空間周波数帯域S
3は、36個の量子化DCT係数x18,x1 9,x20,x
21,x22,x23,x26,x27,x28,x29,x30
31,x34,x3 5,x36,x37,x38,x39,x42,x
43,x44,x45,x46,x47,x50,x5 1,x52
53,x54,x55,x58,x59,x60,x61,x62,x
63から構成される。
【0098】さらに、電力演算回路51は、空間周波数
帯域S0,S1,S2,S3それぞれについて、量子化DC
T係数のAC成分の電力P0,P1,P2,P3を演算し、
クラスコード生成回路52に出力する。
【0099】即ち、電力演算回路51は、空間周波数帯
域S0については、上述の4個の量子化DCT係数x0
1,x8,x9のうちのAC成分x1,x8,x9の2乗和
1 2+x8 2+x9 2を求め、これを、電力P0として、ク
ラスコード生成回路52に出力する。また、電力演算回
路51は、空間周波数帯域S1についての、上述の12
個の量子化DCT係数のAC成分、即ち、12個すべて
の量子化DCT係数の2乗和を求め、これを、電力P1
として、クラスコード生成回路52に出力する。さら
に、電力演算回路51は、空間周波数帯域S2とS3につ
いても、空間周波数帯域S1における場合と同様にし
て、それぞれの電力P2とP3を求め、クラスコード生成
回路52に出力する。
【0100】クラスコード生成回路52は、電力演算回
路51からの電力P0,P1,P2,P3を、閾値テーブル
記憶部53に記憶された、対応する閾値TH0,TH
1,TH2,TH3とそれぞれ比較し、それぞれの大小
関係に基づいて、クラスコードを出力する。即ち、クラ
スコード生成回路52は、電力P0と閾値TH0とを比
較し、その大小関係を表す1ビットのコードを得る。同
様に、クラスコード生成回路52は、電力P1と閾値T
H1、電力P2と閾値TH2、電力P3と閾値TH3を、
それぞれ比較することにより、それぞれについて、1ビ
ットのコードを得る。そして、クラスコード生成回路5
2は、以上のようにして得られる4つの1ビットのコー
ドを、例えば、所定の順番で並べることにより得られる
4ビットのコード(従って、0乃至15のうちのいずれ
かの値)を、注目画素ブロックのクラスを表すクラスコ
ードとして出力する。従って、本実施の形態では、注目
画素ブロックは、24(=16)個のクラスのうちのい
ずれかにクラス分類されることになる。
【0101】閾値テーブル記憶部53は、空間周波数帯
域S0乃至S3の電力P0乃至P3とそれぞれ比較する閾値
TH0乃至TH3を記憶している。
【0102】なお、上述の場合には、クラス分類処理
に、量子化DCT係数のDC成分x0が用いられない
が、このDC成分x0をも用いてクラス分類処理を行う
ことも可能である。
【0103】図5に戻り、以上のようなクラス分類回路
43が出力するクラスコードは、係数テーブル記憶部4
4に、アドレスとして与えられる。
【0104】係数テーブル記憶部44は、後述するよう
な学習処理が行われることにより得られるタップ係数が
登録された係数テーブルを記憶しており、クラス分類回
路43が出力するクラスコードに対応するアドレスに記
憶されているタップ係数を積和演算回路45に出力す
る。
【0105】ここで、本実施の形態では、画素ブロック
がクラス分類されるから、注目画素ブロックについて、
1つのクラスコードが得られる。一方、画素ブロック
は、本実施の形態では、8×8画素の64画素で構成さ
れるから、注目画素ブロックについて、それを構成する
64画素それぞれを復号するための64セットのタップ
係数が必要である。従って、係数テーブル記憶部44に
は、1つのクラスコードに対応するアドレスに対して、
64セットのタップ係数が記憶されている。
【0106】積和演算回路45は、予測タップ抽出回路
41が出力する予測タップと、係数テーブル記憶部44
が出力するタップ係数とを取得し、その予測タップとタ
ップ係数とを用いて、式(1)に示した線形予測演算
(積和演算)を行い、その結果得られる注目画素ブロッ
クの8×8画素の画素値を、対応するDCTブロックの
復号結果として、ブロック分解回路33(図3)に出力
する。
【0107】ここで、予測タップ抽出回路41において
は、上述したように、注目画素ブロックの各画素が、順
次、注目画素とされるが、積和演算回路45は、注目画
素ブロックの、注目画素となっている画素の位置に対応
した動作モード(以下、適宜、画素位置モードという)
となって、処理を行う。
【0108】即ち、例えば、注目画素ブロックの画素の
うち、ラスタスキャン順で、i番目の画素を、piと表
し、画素piが、注目画素となっている場合、積和演算
回路45は、画素位置モード#iの処理を行う。
【0109】具体的には、上述したように、係数テーブ
ル記憶部44は、注目画素ブロックを構成する64画素
それぞれを復号するための64セットのタップ係数を出
力するが、そのうちの画素piを復号するためのタップ
係数のセットをWiと表すと、積和演算回路45は、動
作モードが、画素位置モード#iのときには、予測タッ
プと、64セットのタップ係数のうちのセットWiとを
用いて、式(1)の積和演算を行い、その積和演算結果
を、画素piの復号結果とする。
【0110】次に、図9のフローチャートを参照して、
図5の係数変換回路32の処理について説明する。
【0111】エントロピー復号回路31が出力するブロ
ックごとの量子化DCT係数は、予測タップ抽出回路4
1およびクラスタップ抽出回路42において順次受信さ
れ、予測タップ抽出回路41は、そこに供給される量子
化DCT係数のブロック(DCTブロック)に対応する
画素ブロックを、順次、注目画素ブロックとする。
【0112】そして、クラスタップ抽出回路42は、ス
テップS11において、そこで受信した量子化DCT係
数の中から、注目画素ブロックをクラス分類するのに用
いるものを抽出して、クラスタップを構成し、クラス分
類回路43に供給する。
【0113】クラス分類回路43は、ステップS12に
おいて、クラスタップ抽出回路42からのクラスタップ
を用いて、注目画素ブロックをクラス分類し、その結果
得られるクラスコードを、係数テーブル記憶部44に出
力する。
【0114】即ち、ステップS12では、図10のフロ
ーチャートに示すように、まず最初に、ステップS21
において、クラス分類回路43(図7)の電力演算回路
51が、クラスタップを構成する8×8個の量子化DC
T係数を、図8に示した4つの空間周波数帯域S0乃至
3に分割し、それぞれの電力P0乃至P3を演算する。
この電力P0乃至P3は、電力演算回路51からクラスコ
ード生成回路52に出力される。
【0115】クラスコード生成回路52は、ステップS
22において、閾値テーブル記憶部53から閾値TH0
乃至TH3を読み出し、電力演算回路51からの電力P
0乃至P3それぞれと、閾値TH0乃至TH3それぞれと
を比較し、それぞれの大小関係に基づいたクラスコード
を生成して、リターンする。
【0116】図9に戻り、ステップS12において以上
のようにして得られるクラスコードは、クラス分類回路
43から係数テーブル記憶部44に対して、アドレスと
して与えられる。
【0117】係数テーブル記憶部44は、クラス分類回
路43からのアドレスとしてのクラスコードを受信する
と、ステップS13において、そのアドレスに記憶され
ている64セットのタップ係数を読み出し、積和演算回
路45に出力する。
【0118】そして、ステップS14に進み、予測タッ
プ抽出回路41は、注目画素ブロックの画素のうち、ラ
スタスキャン順で、まだ、注目画素とされていない画素
を、注目画素として、その注目画素の画素値を予測する
のに用いる量子化DCT係数を抽出し、予測タップとし
て構成する。この予測タップは、予測タップ抽出回路4
1から積和演算回路45に供給される。
【0119】ここで、本実施の形態では、各画素ブロッ
クごとに、その画素ブロックのすべての画素について、
同一の予測タップが構成されるので、実際には、ステッ
プS14の処理は、注目画素ブロックについて、最初に
注目画素とされる画素に対してだけ行えば、残りの63
画素に対しては、行う必要がない。
【0120】積和演算回路45は、ステップS15にお
いて、ステップS13で係数テーブル記憶部44が出力
する64セットのタップ係数のうち、注目画素に対する
画素位置モードに対応するタップ係数のセットを取得
し、そのタップ係数のセットと、ステップS14で予測
タップ抽出回路41から供給される予測タップとを用い
て、式(1)に示した積和演算を行い、注目画素の画素
値の復号値を得る。
【0121】そして、ステップS16に進み、予測タッ
プ抽出回路41は、注目画素ブロックのすべての画素
を、注目画素として処理を行ったかどうかを判定する。
ステップS16において、注目画素ブロックのすべての
画素を、注目画素として、まだ処理を行っていないと判
定された場合、ステップS14に戻り、予測タップ抽出
回路41は、注目画素ブロックの画素のうち、ラスタス
キャン順で、まだ、注目画素とされていない画素を、新
たに注目画素として、以下、同様の処理を繰り返す。
【0122】また、ステップS16において、注目画素
ブロックのすべての画素を、注目画素として処理を行っ
たと判定された場合、即ち、注目画素ブロックのすべて
の画素の復号値が得られた場合、積和演算回路45は、
その復号値で構成される画素ブロック(復号ブロック)
を、ブロック分解回路33(図3)に出力し、処理を終
了する。
【0123】なお、図9のフローチャートにしたがった
処理は、予測タップ抽出回路41が、新たな注目画素ブ
ロックを設定するごとに繰り返し行われる。
【0124】次に、図11は、図5の係数テーブル記憶
部44に記憶させるタップ係数の学習処理を行う学習装
置の一実施の形態の構成例を示している。
【0125】ブロック化回路61には、1枚以上の学習
用の画像データが、学習時の教師となる教師データとし
て供給されるようになっており、ブロック化回路61
は、教師データとしての画像を、JPEG符号化におけ
る場合と同様に、8×8画素の画素ブロックにブロック
化する。
【0126】DCT回路62は、ブロック化回路61が
ブロック化した画素ブロックを、順次、注目画素ブロッ
クとして読み出し、その注目画素ブロックを、DCT処
理することで、DCT係数のブロックとする。このDC
T係数のブロックは、量子化回路63に供給される。
【0127】量子化回路63は、DCT回路62からの
DCT係数のブロックを、JPEG符号化に用いられる
のと同一の量子化テーブルにしたがって量子化し、その
結果得られる量子化DCT係数のブロック(DCTブロ
ック)を、予測タップ抽出回路64およびクラスタップ
抽出回路65に順次供給する。
【0128】予測タップ抽出回路64は、注目画素ブロ
ックの画素のうち、ラスタスキャン順で、まだ、注目画
素とされていない画素を、注目画素として、その注目画
素について、図5の予測タップ抽出回路41が構成する
のと同一の予測タップを、量子化回路63の出力から、
必要な量子化DCT係数を抽出することで構成する。こ
の予測タップは、学習時の生徒となる生徒データとし
て、予測タップ抽出回路64から正規方程式加算回路6
7に供給される。
【0129】クラスタップ抽出回路65は、注目画素ブ
ロックについて、図5のクラスタップ抽出回路42が構
成するのと同一のクラスタップを、量子化回路63の出
力から、必要な量子化DCT係数を抽出することで構成
する。このクラスタップは、クラスタップ抽出回路65
からクラス分類回路66に供給される。
【0130】クラス分類回路66は、クラスタップ抽出
回路65からのクラスタップを用いて、図5のクラス分
類回路43と同一の処理を行うことで、注目画素ブロッ
クをクラス分類し、その結果得られるクラスコードを、
正規方程式加算回路67に供給する。
【0131】正規方程式加算回路67は、ブロック化回
路61から、教師データとしての注目画素(の画素値)
を読み出し、予測タップ構成回路64からの生徒データ
としての予測タップ(を構成する量子化DCT係数)、
および注目画素を対象とした足し込みを行う。
【0132】即ち、正規方程式加算回路67は、クラス
分類回路66から供給されるクラスコードに対応するク
ラスごとに、予測タップ(生徒データ)を用い、式
(8)の行列Aにおける各コンポーネントとなってい
る、生徒データどうしの乗算(xinim)と、サメーシ
ョン(Σ)に相当する演算を行う。
【0133】さらに、正規方程式加算回路67は、やは
り、クラス分類回路66から供給されるクラスコードに
対応するクラスごとに、予測タップ(生徒データ)およ
び注目画素(教師データ)を用い、式(8)のベクトル
vにおける各コンポーネントとなっている、生徒データ
と教師データの乗算(xini)と、サメーション
(Σ)に相当する演算を行う。
【0134】なお、正規方程式加算回路67における、
上述のような足し込みは、各クラスについて、注目画素
に対する画素位置モードごとに行われる。
【0135】正規方程式加算回路67は、以上の足し込
みを、ブロック化回路61に供給された教師画像を構成
する画素すべてを注目画素として行い、これにより、各
クラスについて、画素位置モードごとに、式(8)に示
した正規方程式がたてられる。
【0136】タップ係数決定回路68は、正規方程式加
算回路67においてクラスごとに(かつ、画素位置モー
ドごとに)生成された正規方程式を解くことにより、ク
ラスごとに、64セットのタップ係数を求め、係数テー
ブル記憶部69の、各クラスに対応するアドレスに供給
する。
【0137】なお、学習用の画像として用意する画像の
枚数や、その画像の内容等によっては、正規方程式加算
回路67において、タップ係数を求めるのに必要な数の
正規方程式が得られないクラスが生じる場合があり得る
が、タップ係数決定回路68は、そのようなクラスにつ
いては、例えば、デフォルトのタップ係数を出力する。
【0138】係数テーブル記憶部69は、タップ係数決
定回路68から供給されるクラスごとの64セットのタ
ップ係数を記憶する。
【0139】次に、図12のフローチャートを参照し
て、図11の学習装置の処理(学習処理)について説明
する。
【0140】ブロック化回路61には、学習用の画像デ
ータが、教師データとして供給され、ブロック化回路6
1は、ステップS31において、教師データとしての画
像データを、JPEG符号化における場合と同様に、8
×8画素の画素ブロックにブロック化して、ステップS
32に進む。ステップS32では、DCT回路62が、
ブロック化回路61がブロック化した画素ブロックを、
順次読み出し、その注目画素ブロックを、DCT処理す
ることで、DCT係数のブロックとし、ステップS33
に進む。ステップS33では、量子化回路63が、DC
T回路62において得られたDCT係数のブロックを順
次読み出し、JPEG符号化に用いられるのと同一の量
子化テーブルにしたがって量子化して、量子化DCT係
数で構成されるブロック(DCTブロック)とする。
【0141】そして、ステップS34に進み、クラスタ
ップ抽出回路65は、ブロック化回路61でブロック化
された画素ブロックのうち、まだ注目画素ブロックとさ
れていないものを、注目画素ブロックとする。さらに、
クラスタップ抽出回路65は、注目画素ブロックをクラ
ス分類するのに用いる量子化DCT係数を、量子化回路
63で得られたDCTブロックから抽出して、クラスタ
ップを構成し、クラス分類回路66に供給する。クラス
分類回路66は、ステップS35において、図10のフ
ローチャートで説明した場合と同様に、クラスタップ抽
出回路65からのクラスタップを用いて、注目画素ブロ
ックをクラス分類し、その結果得られるクラスコード
を、正規方程式加算回路67に供給して、ステップS3
6に進む。
【0142】ステップS36では、予測タップ抽出回路
64が、注目画素ブロックの画素のうち、ラスタスキャ
ン順で、まだ、注目画素とされていない画素を、注目画
素として、その注目画素について、図5の予測タップ抽
出回路41が構成するのと同一の予測タップを、量子化
回路63の出力から必要な量子化DCT係数を抽出する
ことで構成する。そして、予測タップ抽出回路64は、
注目画素についての予測タップを、生徒データとして、
正規方程式加算回路67に供給し、ステップS37に進
む。
【0143】ステップS37では、正規方程式加算回路
67は、ブロック化回路61から、教師データとしての
注目画素を読み出し、生徒データとしての予測タップ
(を構成する量子化DCT係数)、および教師データと
しての注目画素を対象として、式(8)の行列Aとベク
トルvの、上述したような足し込みを行う。なお、この
足し込みは、クラス分類回路66からのクラスコードに
対応するクラスごとに、かつ注目画素に対する画素位置
モードごとに行われる。
【0144】そして、ステップS38に進み、予測タッ
プ抽出回路64は、注目画素ブロックのすべての画素
を、注目画素として、足し込みを行ったかどうかを判定
する。ステップS38において、注目画素ブロックのす
べての画素を、注目画素として、まだ足し込みを行って
いないと判定された場合、ステップS36に戻り、予測
タップ抽出回路64は、注目画素ブロックの画素のう
ち、ラスタスキャン順で、まだ、注目画素とされていな
い画素を、新たに注目画素として、以下、同様の処理を
繰り返す。
【0145】また、ステップS38において、注目画素
ブロックのすべての画素を、注目画素として、足し込み
を行ったと判定された場合、ステップS39に進み、ブ
ロック化回路61は、教師データとしての画像から得ら
れたすべての画素ブロックを、注目画素ブロックとして
処理を行ったかどうかを判定する。ステップS39にお
いて、教師データとしての画像から得られたすべての画
素ブロックを、注目画素ブロックとして、まだ処理を行
っていないと判定された場合、ステップS34に戻り、
ブロック化回路61でブロック化された画素ブロックの
うち、まだ注目画素ブロックとされていないものが、新
たに注目画素ブロックとされ、以下、同様の処理が繰り
返される。
【0146】一方、ステップS39において、教師デー
タとしての画像から得られたすべての画素ブロックを、
注目画素ブロックとして処理を行ったと判定された場
合、即ち、正規方程式加算回路67において、各クラス
について、画素位置モードごとの正規方程式が得られた
場合、ステップS40に進み、タップ係数決定回路68
は、各クラスの画素位置モードごとに生成された正規方
程式を解くことにより、各クラスごとに、そのクラスの
64の画素位置モードそれぞれに対応する64セットの
タップ係数を求め、係数テーブル記憶部69の、各クラ
スに対応するアドレスに供給して記憶させ、処理を終了
する。
【0147】以上のようにして、係数テーブル記憶部6
9に記憶された各クラスごとのタップ係数が、図5の係
数テーブル記憶部44に記憶されている。
【0148】従って、係数テーブル記憶部44に記憶さ
れたタップ係数は、線形予測演算を行うことにより得ら
れる元の画素値の予測値の予測誤差(ここでは、自乗誤
差)が、統計的に最小になるように学習を行うことによ
り求められたものであり、その結果、図5の係数変換回
路32によれば、JPEG符号化された画像を、元の画
像に限りなく近い画像に復号することができる。
【0149】また、上述したように、JPEG符号化さ
れた画像の復号処理と、その画質を向上させるための処
理とが、同時に施されることとなるので、JPEG符号
化された画像から、効率的に、画質の良い復号画像を得
ることができる。
【0150】次に、図13は、図3の係数変換回路32
の第2の構成例を示している。なお、図中、図5におけ
る場合と対応する部分については、同一の符号を付して
あり、以下では、その説明は、適宜省略する。即ち、図
13の係数変換回路32は、逆量子化回路71が新たに
設けられている他は、基本的に、図5における場合と同
様に構成されている。
【0151】図13の実施の形態において、逆量子化回
路71には、エントロピー復号回路31(図3)におい
て符号化データをエントロピー復号することにより得ら
れるブロックごとの量子化DCT係数が供給される。
【0152】なお、エントロピー復号回路31において
は、上述したように、符号化データから、量子化DCT
係数の他、量子化テーブルも得られるが、図13の実施
の形態では、この量子化テーブルも、エントロピー復号
回路31から逆量子化回路71に供給されるようになっ
ている。
【0153】逆量子化回路71は、エントロピー復号回
路31からの量子化DCT係数を、同じくエントロピー
復号回路31からの量子化テーブルにしたがって逆量子
化し、その結果得られるDCT係数を、予測タップ抽出
回路41およびクラスタップ抽出回路42に供給する。
【0154】従って、予測タップ抽出回路41とクラス
タップ抽出回路42では、量子化DCT係数ではなく、
DCT係数を対象として、予測タップとクラスタップが
それぞれ構成され、以降も、DCT係数を対象として、
図5における場合と同様の処理が行われる。
【0155】このように、図13の実施の形態では、量
子化DCT係数ではなく、DCT係数を対象として処理
が行われるため、係数テーブル記憶部44に記憶させる
タップ係数は、図5における場合と異なるものとする必
要がある。
【0156】そこで、図14は、図13の係数テーブル
記憶部44に記憶させるタップ係数の学習処理を行う学
習装置の一実施の形態の構成例を示している。なお、図
中、図11における場合と対応する部分については、同
一の符号を付してあり、以下では、その説明は、適宜省
略する。即ち、図14の学習装置は、量子化回路63の
後段に、逆量子化回路81が新たに設けられている他
は、図11における場合と基本的に同様に構成されてい
る。
【0157】図14の実施の形態において、逆量子化回
路81は、逆量子化回路63が出力する量子化DCT係
数を、図13の逆量子化回路71と同様に逆量子化し、
その結果得られるDCT係数を、予測タップ抽出回路6
4およびクラスタップ抽出回路65に供給する。
【0158】従って、予測タップ抽出回路64とクラス
タップ抽出回路65では、量子化DCT係数ではなく、
DCT係数を対象として、予測タップとクラスタップが
それぞれ構成され、以降も、DCT係数を対象として、
図11における場合と同様の処理が行われる。
【0159】その結果、DCT係数が量子化され、さら
に逆量子化されることにより生じる量子化誤差の影響を
低減するタップ係数が得られることになる。
【0160】次に、図15は、図3の係数変換回路32
の第3の構成例を示している。なお、図中、図5におけ
る場合と対応する部分については、同一の符号を付して
あり、以下では、その説明は、適宜省略する。即ち、図
13の係数変換回路32は、クラスタップ抽出回路42
およびクラス分類回路43が設けられていない他は、基
本的に、図5における場合と同様に構成されている。
【0161】従って、図15の実施の形態では、クラス
という概念がないが、このことは、クラスが1つである
とも考えるから、係数テーブル記憶部44には、1クラ
スのタップ係数だけが記憶されており、これを用いて処
理が行われる。
【0162】このように、図15の実施の形態では、係
数テーブル記憶部44に記憶されているタップ係数は、
図5における場合と異なるものとなっている。
【0163】そこで、図16は、図15の係数テーブル
記憶部44に記憶させるタップ係数の学習処理を行う学
習装置の一実施の形態の構成例を示している。なお、図
中、図11における場合と対応する部分については、同
一の符号を付してあり、以下では、その説明は、適宜省
略する。即ち、図16の学習装置は、クラスタップ抽出
回路65およびクラス分類回路66が設けられていない
他は、図11における場合と基本的に同様に構成されて
いる。
【0164】従って、図16の学習装置では、正規方程
式加算回路67において、上述の足し込みが、クラスに
は無関係に、画素位置モード別に行われる。そして、タ
ップ係数決定回路68において、画素位置モードごとに
生成された正規方程式を解くことにより、タップ係数が
求められる。
【0165】次に、図17は、図3の係数変換回路32
の第4の構成例を示している。なお、図中、図5または
図13における場合と対応する部分については、同一の
符号を付してあり、以下では、その説明は、適宜省略す
る。即ち、図17の係数変換回路32は、クラスタップ
抽出回路42およびクラス分類回路43が設けられてお
らず、かつ逆量子化回路71が新たに設けられている他
は、基本的に、図5における場合と同様に構成されてい
る。
【0166】従って、図17の実施の形態では、図15
の実施の形態における場合と同様に、係数テーブル記憶
部44には、1クラスのタップ係数だけが記憶されてお
り、これを用いて処理が行われる。
【0167】さらに、図17の実施の形態では、図13
の実施の形態における場合と同様に、予測タップ抽出回
路41において、量子化DCT係数ではなく、逆量子化
回路71が出力するDCT係数を対象として、予測タッ
プが構成され、以降も、DCT係数を対象として、処理
が行われる。
【0168】従って、図17の実施の形態でも、係数テ
ーブル記憶部44に記憶されているタップ係数は、図5
における場合と異なるものとなっている。
【0169】そこで、図18は、図17の係数テーブル
記憶部44に記憶させるタップ係数の学習処理を行う学
習装置の一実施の形態の構成例を示している。なお、図
中、図11または図14における場合と対応する部分に
ついては、同一の符号を付してあり、以下では、その説
明は、適宜省略する。即ち、図18の学習装置は、クラ
スタップ抽出回路65およびクラス分類回路66が設け
られておらず、かつ逆量子化回路81が新たに設けられ
ている他は、図11における場合と基本的に同様に構成
されている。
【0170】従って、図18の学習装置では、予測タッ
プ抽出回路64において、量子化DCT係数ではなく、
DCT係数を対象として、予測タップが構成され、以降
も、DCT係数を対象として処理が行われる。さらに、
正規方程式加算回路67において、上述の足し込みが、
クラスには無関係に行われ、タップ係数決定回路68に
おいて、クラスと無関係に生成された正規方程式を解く
ことにより、タップ係数が求められる。
【0171】次に、以上においては、静止画を圧縮符号
化するJPEG符号化された画像を対象としたが、本発
明は、動画を圧縮符号化する、例えば、MPEG符号化
された画像を対象とすることも可能である。
【0172】即ち、図19は、MPEG符号化が行われ
る場合の、図2のエンコーダ21の構成例を示してい
る。
【0173】MPEG符号化の対象である動画を構成す
るフレーム(またはフィールド)は、順次、動き検出回
路91と演算器92に供給される。
【0174】動き検出回路91は、そこに供給されるフ
レームについて、マクロブロック単位で、動きベクトル
を検出し、エントロピー符号化回路96および動き補償
回路100に供給する。
【0175】演算器92は、そこに供給される画像が、
I(Intra)ピクチャであれば、そのままブロック化回路
93に供給し、P(Predictive)またはB(Bidirectional
ly predictive)ピクチャであれば、動き補償回路100
から供給される参照画像との差分を演算して、その差分
値を、ブロック化回路93に供給する。
【0176】ブロック化回路93は、演算器92の出力
を、8×8画素の画素ブロックにブロック化し、DCT
回路94に供給する。DCT回路94は、ブロック化回
路93からの画素ブロックをDCT処理し、その結果得
られるDCT係数を、量子化回路95に供給する。量子
化回路95は、DCT回路93からのブロック単位のD
CT係数を所定の量子化ステップで量子化し、その結果
得られる量子化DCT係数をエントロピー符号化回路9
6に供給する。エントロピー符号化回路96は、量子化
回路95からの量子化DCT係数をエントロピー符号化
し、動き検出回路91からの動きベクトルや、その他の
必要な情報を付加して、その結果得られる符号化データ
を、MPEG符号化結果として出力する。
【0177】量子化回路95が出力する量子化DCT係
数のうち、IピクチャおよびPピクチャは、後で符号化
されるPピクチャやBピクチャの参照画像として用いる
のにローカルデコードする必要があるため、エントロピ
ー符号化回路96の他、逆量子化回路97にも供給され
る。
【0178】逆量子化回路97は、量子化回路95から
の量子化DCT係数を逆量子化することにより、DCT
係数とし、逆DCT回路98に供給する。逆DCT回路
98は、逆量子化回路97からのDCT係数を逆DCT
処理し、演算器99に出力する。演算器99には、逆D
CT回路98の出力の他、動き補償回路100が出力す
る参照画像も供給されるようになっており、演算器99
は、逆DCT回路98の出力が、Pピクチャのものであ
る場合には、その出力と、動き補償回路100の出力と
を加算することで、元の画像を復号し、動き補償回路1
00に供給する。また、演算器99は、逆DCT回路9
8の出力が、Iピクチャのものである場合には、その出
力は、Iピクチャの復号画像となっているので、そのま
ま、動き補償回路100に供給する。
【0179】動き補償回路100は、演算器99から供
給される、ローカルデコードされた画像に対して、動き
検出回路91からの動きベクトルにしたがった動き補償
を施し、その動き補償後の画像を、参照画像として、演
算器92および99に供給する。
【0180】ここで、図20は、以上のようなMPEG
符号化の結果得られる符号化データを復号する、従来の
MPEGデコーダの一例の構成を示している。
【0181】符号化データは、エントロピー復号回路1
11に供給され、エントロピー復号回路111は、符号
化データをエントロピー復号し、量子化DCT係数、動
きベクトル、その他の情報を得る。そして、量子化DC
T係数は、逆量子化回路112に供給され、動きベクト
ルは、動き補償回路116に供給される。
【0182】逆量子化回路112は、エントロピー復号
回路111からの量子化DCT係数を逆量子化すること
により、DCT係数とし、逆DCT回路113に供給す
る。逆DCT回路113は、逆量子化回路112からの
DCT係数を逆DCT処理し、演算器114に出力す
る。演算器114には、逆量子化回路113の出力の
他、動き補償回路116が出力する、既に復号されたI
ピクチャまたはPピクチャを、エントロピー復号回路1
11からの動きベクトルにしたがって動き補償したもの
が参照画像として供給されるようになっており、演算器
114は、逆DCT回路113の出力が、PまたはBピ
クチャのものである場合には、その出力と、動き補償回
路100の出力とを加算することで、元の画像を復号
し、ブロック分解回路115に供給する。また、演算器
114は、逆DCT回路113の出力が、Iピクチャの
ものである場合には、その出力は、Iピクチャの復号画
像となっているので、そのまま、ブロック分解回路11
5に供給する。
【0183】ブロック分解回路115は、演算器114
から画素ブロック単位で供給される復号画像のブロック
化を解くことで、復号画像を得て出力する。
【0184】一方、動き補償回路116は、演算器11
4が出力する復号画像のうちのIピクチャとPピクチャ
を受信し、エントロピー復号回路111からの動きベク
トルにしたがった動き補償を施す。そして、動き補償回
路116は、その動き補償後の画像を、参照画像とし
て、演算器114に供給する。
【0185】図3のデコーダ22では、MPEG符号化
された符号化データも、上述のように、効率的に、画質
の良い画像に復号することができる。
【0186】即ち、符号化データは、エントロピー復号
回路31に供給され、エントロピー復号回路31は、符
号化データを、エントロピー復号する。このエントロピ
ー復号の結果得られる量子化DCT係数、動きベクト
ル、その他の情報は、エントロピー復号回路31から係
数変換回路32に供給される。
【0187】係数変換回路32は、エントロピー復号回
路31からの量子化DCT係数Qと、学習を行うことに
より求められたタップ係数を用いて、所定の予測演算を
行うとともに、エントロピー復号回路31からの動きベ
クトルにしたがった動き補償を必要に応じて行うことに
より、量子化DCT係数を、元の画素値に復号し、ブロ
ック分解回路33に供給する。
【0188】ブロック分解回路33は、係数変換回路3
2において得られた、復号された画素でなる画素ブロッ
クのブロック化を解くことで、復号画像を得て出力す
る。
【0189】次に、図21は、デコーダ22においてM
PEG符号化された符号化データを復号する場合の、図
3の係数変換回路32の構成例を示している。なお、図
中、図17または図20における場合と対応する部分に
ついては、同一の符号を付してあり、以下では、その説
明は、適宜省略する。即ち、図21の係数変換回路32
は、積和演算回路45の後段に、図20における演算器
114および動き補償回路116が設けられている他
は、図17における場合と同様に構成されている。
【0190】従って、図21の係数変換回路32では、
タップ係数を用いた予測演算が、図20のMPEGデコ
ーダの逆DCT回路113における逆DCT処理に替え
て行われ、以降は、図20における場合と同様にして、
復号画像が得られる。
【0191】次に、図22は、図21の係数テーブル記
憶部44に記憶させるタップ係数を学習する学習装置の
一実施の形態の構成例を示している。なお、図中、図1
8における場合と対応する部分については、同一の符号
を付してあり、以下では、その説明は、適宜省略する。
【0192】動きベクトル検出回路121および演算器
122には、学習用の画像が、教師データとして入力さ
れる。動きベクトル検出回路121、演算器122、ブ
ロック化回路123、DCT回路124、量子化回路1
25、逆量子化回路127、逆DCT回路128、演算
器129、または動き補償回路130は、図19の動き
ベクトル検出回路91、演算器92、ブロック化回路9
3、DCT回路94、量子化回路95、逆量子化回路9
7、逆DCT回路98、演算器99、または動き補償回
路100とそれぞれ同様の処理を行い、これにより、量
子化回路125からは、図19の量子化回路95が出力
するのと同様の量子化DCT係数が出力される。
【0193】量子化回路125が出力する量子化DCT
係数は、逆量子化回路81に供給され、逆量子化回路8
1は、量子化回路125からの量子化DCT係数を逆量
子化し、DCT係数に変換して、予測タップ抽出回路6
4に供給する。予測タップ抽出回路64は、逆量子化回
路81からのDCT係数から、予測タップを構成し、正
規方程式加算回路67に供給する。
【0194】正規方程式加算回路67は、演算器122
の出力を教師データとするとともに、逆量子化回路81
からの予測タップを生徒データとして、上述したような
足し込みを行い、これにより、正規方程式を生成する。
【0195】そして、タップ係数決定回路68は、正規
方程式加算回路67で生成された正規方程式を解くこと
により、タップ係数を求め、係数テーブル記憶部69に
供給して記憶させる。
【0196】図21の積和演算回路45では、このよう
にして求められたタップ係数を用いて、MPEG符号化
された符号化データが復号されるので、やはり、MPE
G符号化された画像の復号処理と、その画質を向上させ
るための処理とを、同時に施すことができ、従って、M
PEG符号化された画像から、効率的に、画質の良い復
号画像を得ることができる。
【0197】なお、図21の係数変換回路32は、逆量
子化回路71を設けずに構成することが可能である。こ
の場合、図22の学習装置は、逆量子化回路81を設け
ずに構成すれば良い。
【0198】また、図21の係数変換回路32は、図5
における場合と同様に、クラスタップ抽出回路42およ
びクラス分類回路43を設けて構成することが可能であ
る。この場合、図22の学習装置は、図11における場
合のように、クラスタップ抽出回路65およびクラス分
類回路66を設けて構成するれば良い。
【0199】次に、上述した一連の処理は、ハードウェ
アにより行うこともできるし、ソフトウェアにより行う
こともできる。一連の処理をソフトウェアによって行う
場合には、そのソフトウェアを構成するプログラムが、
汎用のコンピュータ等にインストールされる。
【0200】そこで、図23は、上述した一連の処理を
実行するプログラムがインストールされるコンピュータ
の一実施の形態の構成例を示している。
【0201】プログラムは、コンピュータに内蔵されて
いる記録媒体としてのハードディスク205やROM2
03に予め記録しておくことができる。
【0202】あるいはまた、プログラムは、フロッピー
(登録商標)ディスク、CD-ROM(Compact Disc Read Onl
y Memory),MO(Magneto optical)ディスク,DVD(Digita
l Versatile Disc)、磁気ディスク、半導体メモリなど
のリムーバブル記録媒体211に、一時的あるいは永続
的に格納(記録)しておくことができる。このようなリ
ムーバブル記録媒体211は、いわゆるパッケージソフ
トウエアとして提供することができる。
【0203】なお、プログラムは、上述したようなリム
ーバブル記録媒体211からコンピュータにインストー
ルする他、ダウンロードサイトから、ディジタル衛星放
送用の人工衛星を介して、コンピュータに無線で転送し
たり、LAN(Local Area Network)、インターネットとい
ったネットワークを介して、コンピュータに有線で転送
し、コンピュータでは、そのようにして転送されてくる
プログラムを、通信部208で受信し、内蔵するハード
ディスク205にインストールすることができる。
【0204】コンピュータは、CPU(Central Processing
Unit)202を内蔵している。CPU202には、バス2
01を介して、入出力インタフェース210が接続され
ており、CPU202は、入出力インタフェース210を
介して、ユーザによって、キーボードや、マウス、マイ
ク等で構成される入力部207が操作等されることによ
り指令が入力されると、それにしたがって、ROM(Read O
nly Memory)203に格納されているプログラムを実行
する。あるいは、また、CPU202は、ハードディスク
205に格納されているプログラム、衛星若しくはネッ
トワークから転送され、通信部208で受信されてハー
ドディスク205にインストールされたプログラム、ま
たはドライブ209に装着されたリムーバブル記録媒体
211から読み出されてハードディスク205にインス
トールされたプログラムを、RAM(Random Access Memor
y)204にロードして実行する。これにより、CPU20
2は、上述したフローチャートにしたがった処理、ある
いは上述したブロック図の構成により行われる処理を行
う。そして、CPU202は、その処理結果を、必要に応
じて、例えば、入出力インタフェース210を介して、
LCD(Liquid CryStal Display)やスピーカ等で構成され
る出力部206から出力、あるいは、通信部208から
送信、さらには、ハードディスク205に記録等させ
る。
【0205】ここで、本明細書において、コンピュータ
に各種の処理を行わせるためのプログラムを記述する処
理ステップは、必ずしもフローチャートとして記載され
た順序に沿って時系列に処理する必要はなく、並列的あ
るいは個別に実行される処理(例えば、並列処理あるい
はオブジェクトによる処理)も含むものである。
【0206】また、プログラムは、1のコンピュータに
より処理されるものであっても良いし、複数のコンピュ
ータによって分散処理されるものであっても良い。さら
に、プログラムは、遠方のコンピュータに転送されて実
行されるものであっても良い。
【0207】なお、本実施の形態では、画像データを対
象としたが、本発明は、その他、例えば、音声データに
も適用可能である。
【0208】また、本実施の形態では、少なくとも、D
CT処理を行うJPEG符号化やMPEG符号化された
符号化データの復号を行うようにしたが、本発明は、そ
の他の直交変換または周波数変換によって変換されたデ
ータの復号に適用可能である。即ち、本発明は、例え
ば、サブバンド符号化されたデータや、フーリエ変換さ
れたデータ等を復号する場合にも適用可能である。
【0209】さらに、本実施の形態では、デコーダ22
において、復号に用いるタップ係数を、あらかじめ記憶
しておくようにしたが、タップ係数は、符号化データに
含めて、デコーダ22に提供するようにすることが可能
である。
【0210】また、本実施の形態では、タップ係数を用
いた線形1次予測演算によって、復号を行うようにした
が、復号は、その他、2次以上の高次の予測演算によっ
て行うことも可能である。
【0211】
【発明の効果】本発明の第1のデータ処理装置およびデ
ータ処理方法、並びに記録媒体によれば、学習を行うこ
とにより求められたタップ係数が取得され、そのタップ
係数と、変換データとを用いて、所定の予測演算が行わ
れることにより、変換データが、元のデータに復号され
る。従って、変換データを、効率的に復号することが可
能となる。
【0212】本発明の第2のデータ処理装置およびデー
タ処理方法、並びに記録媒体によれば、教師となる教師
データを、少なくとも、直交変換または周波数変換する
ことにより、生徒となる生徒データが生成され、タップ
係数および生徒データを用いて予測演算を行うことによ
り得られる教師データの予測値の予測誤差が、統計的に
最小になるように学習が行われることにより、タップ係
数が求められる。従って、そのタップ係数を用いること
により、直交変換または周波数変換されたデータを、効
率的に復号することが可能となる。
【図面の簡単な説明】
【図1】従来のJPEG符号化/復号を説明するための
図である。
【図2】本発明を適用した画像伝送システムの一実施の
形態の構成例を示す図である。
【図3】図2のデコーダ22の構成例を示すブロック図
である。
【図4】図3のデコーダ22の処理を説明するフローチ
ャートである。
【図5】図3の係数変換回路32の第1の構成例を示す
ブロック図である。
【図6】予測タップとクラスタップの例を説明する図で
ある。
【図7】図5のクラス分類回路43の構成例を示すブロ
ック図である。
【図8】図5の電力演算回路51の処理を説明するため
の図である。
【図9】図5の係数変換回路32の処理を説明するフロ
ーチャートである。
【図10】図9のステップS12の処理のより詳細を説
明するフローチャートである。
【図11】本発明を適用した学習装置の第1実施の形態
の構成例を示すブロック図である。
【図12】図11の学習装置の処理を説明するフローチ
ャートである。
【図13】図3の係数変換回路32の第2の構成例を示
すブロック図である。
【図14】本発明を適用した学習装置の第2実施の形態
の構成例を示すブロック図である。
【図15】図3の係数変換回路32の第3の構成例を示
すブロック図である。
【図16】本発明を適用した学習装置の第3実施の形態
の構成例を示すブロック図である。
【図17】図3の係数変換回路32の第4の構成例を示
すブロック図である。
【図18】本発明を適用した学習装置の第4実施の形態
の構成例を示すブロック図である。
【図19】図2のエンコーダ21の構成例を示すブロッ
ク図である。
【図20】MPEGデコーダの一例の構成を示すブロッ
ク図である。
【図21】図3の係数変換回路32の第5の構成例を示
すブロック図である。
【図22】本発明を適用した学習装置の第5実施の形態
の構成例を示すブロック図である。
【図23】本発明を適用したコンピュータの一実施の形
態の構成例を示すブロック図である。
【符号の説明】
21 エンコーダ, 22 デコーダ, 23 記録媒
体, 24 伝送媒体, 31 エントロピー復号回
路, 32 係数変換回路, 33 ブロック分解回
路, 41 予測タップ抽出回路, 42 クラスタッ
プ抽出回路, 43クラス分類回路, 44 係数テー
ブル記憶部, 45積和演算回路, 51電力演算回
路, 52 クラスコード生成回路, 53 閾値テー
ブル記憶部, 61 ブロック化回路, 62 DCT
回路, 63 量子化回路, 64予測タップ抽出回
路, 65 クラスタップ抽出回路, 66 クラス分
類回路, 67 正規方程式加算回路, 68 タップ
係数決定回路, 69 係数テーブル記憶部, 71,
81 逆量子化回路, 114 演算器, 115動き
補償回路, 121 動きベクトル検出回路, 122
演算器, 123ブロック化回路, 124 DCT
回路, 125 量子化回路, 127逆量子化回路,
128 逆DCT回路, 129 演算器, 130
動き補償回路, 201 バス, 202 CPU,
203 ROM, 204 RAM,205 ハードディス
ク, 206 出力部, 207 入力部, 208
通信部, 209 ドライブ, 210 入出力インタ
フェース, 211 リムーバブル記録媒体
───────────────────────────────────────────────────── フロントページの続き (72)発明者 中屋 秀雄 東京都品川区北品川6丁目7番35号 ソニ ー株式会社内 (72)発明者 西片 丈晴 東京都品川区北品川6丁目7番35号 ソニ ー株式会社内 (72)発明者 大塚 秀樹 東京都品川区北品川6丁目7番35号 ソニ ー株式会社内 (72)発明者 國弘 威 東京都品川区北品川6丁目7番35号 ソニ ー株式会社内 (72)発明者 森藤 孝文 東京都品川区北品川6丁目7番35号 ソニ ー株式会社内 (72)発明者 内田 真史 東京都品川区北品川6丁目7番35号 ソニ ー株式会社内 Fターム(参考) 5C059 KK03 KK04 MA00 MA05 MA14 MA23 MC14 MC38 ME01 PP01 PP04 RC14 SS06 SS11 SS20 SS26 TA69 TB08 TC04 TC06 TD06 TD12 TD13 TD15 UA05 5C078 BA21 CA00 DA00 DA02 EA01 5J064 AA02 BA09 BA16 BB03 BC02 BC03 BC08 BC16 BD03 9A001 EE05

Claims (24)

    【特許請求の範囲】
  1. 【請求項1】 少なくとも、直交変換処理または周波数
    変換処理を施すことにより得られる変換データを処理す
    るデータ処理装置であって、 学習を行うことにより求められたタップ係数を取得する
    取得手段と、 前記タップ係数および変換データを用いて、所定の予測
    演算を行うことにより、前記変換データを、元のデータ
    に復号する復号手段とを備えることを特徴とするデータ
    処理装置。
  2. 【請求項2】 前記復号手段は、前記タップ係数および
    変換データを用いて、線形1次予測演算を行うことによ
    り、前記変換データを、元のデータに復号することを特
    徴とする請求項1に記載のデータ処理装置。
  3. 【請求項3】 前記タップ係数を記憶している記憶手段
    をさらに備え、 前記取得手段は、前記記憶手段から、前記タップ係数を
    取得することを特徴とする請求項1に記載のデータ処理
    装置。
  4. 【請求項4】 前記変換データは、前記元のデータを、
    直交変換または周波数変換し、さらに量子化することに
    より得られたものであることを特徴とする請求項1に記
    載のデータ処理装置。
  5. 【請求項5】 前記変換データを、逆量子化する逆量子
    化手段をさらに備え、 前記復号手段は、逆量子化された前記変換データを、前
    記元のデータに復号することを特徴とする請求項4に記
    載のデータ処理装置。
  6. 【請求項6】 前記変換データは、前記元のデータを、
    少なくとも、離散コサイン変換したものであることを特
    徴とする請求項1に記載のデータ処理装置。
  7. 【請求項7】 前記元のデータのうちの、注目している
    注目データを予測するのに前記タップ係数とともに用い
    る前記変換データを抽出し、予測タップとして出力する
    予測タップ抽出手段をさらに備え、 前記復号手段は、前記予測タップおよびタップ係数を用
    いて予測演算を行うことを特徴とする請求項1に記載の
    データ処理装置。
  8. 【請求項8】 前記注目データを、幾つかのクラスのう
    ちのいずれかにクラス分類するのに用いる前記変換デー
    タを抽出し、クラスタップとして出力するクラスタップ
    抽出手段と、 前記クラスタップに基づいて、前記注目データのクラス
    を求めるクラス分類を行うクラス分類手段とをさらに備
    え、 前記復号手段は、前記予測タップおよび前記注目データ
    のクラスに対応する前記タップ係数を用いて予測演算を
    行うことを特徴とする請求項7に記載のデータ処理装
    置。
  9. 【請求項9】 前記変換データは、前記元のデータを、
    所定の単位ごとに、少なくとも、直交変換処理または周
    波数変換したものであり、 前記復号手段は、前記所定の単位ごとに、前記変換デー
    タを、前記元のデータに復号することを特徴とする請求
    項1に記載のデータ処理装置。
  10. 【請求項10】 前記タップ係数は、前記タップ係数お
    よび変換データを用いて、所定の予測演算を行うことに
    より得られる前記元のデータの予測値の予測誤差が、統
    計的に最小になるように、学習を行うことにより得られ
    たものであることを特徴とする請求項1に記載のデータ
    処理装置。
  11. 【請求項11】 前記元のデータは、動画または静止画
    のデータであることを特徴とする請求項1に記載のデー
    タ処理装置。
  12. 【請求項12】 少なくとも、直交変換処理または周波
    数変換処理を施すことにより得られる変換データを処理
    するデータ処理方法であって、 学習を行うことにより求められたタップ係数を取得する
    取得ステップと、 前記タップ係数および変換データを用いて、所定の予測
    演算を行うことにより、前記変換データを、元のデータ
    に復号する復号ステップとを備えることを特徴とするデ
    ータ処理方法。
  13. 【請求項13】 少なくとも、直交変換処理または周波
    数変換処理を施すことにより得られる変換データを処理
    するデータ処理を、コンピュータに行わせるプログラム
    が記録されている記録媒体であって、 学習を行うことにより求められたタップ係数を取得する
    取得ステップと、 前記タップ係数および変換データを用いて、所定の予測
    演算を行うことにより、前記変換データを、元のデータ
    に復号する復号ステップとを備えるプログラムが記録さ
    れていることを特徴とする記録媒体。
  14. 【請求項14】 少なくとも、直交変換処理または周波
    数変換処理を施すことにより得られる変換データを、予
    測演算によって復号するのに用いるタップ係数を学習す
    るデータ処理装置であって、 教師となる教師データを、少なくとも、直交変換または
    周波数変換することにより、生徒となる生徒データを生
    成する生成手段と、 前記タップ係数および生徒データを用いて予測演算を行
    うことにより得られる前記教師データの予測値の予測誤
    差が、統計的に最小になるように学習を行い、前記タッ
    プ係数を求める学習手段とを備えることを特徴とするデ
    ータ処理装置。
  15. 【請求項15】 前記学習手段は、前記タップ係数およ
    び生徒データを用いて線形1次予測演算を行うことによ
    り得られる前記教師データの予測値の予測誤差が、統計
    的に最小になるように学習を行うことを特徴とする請求
    項14に記載のデータ処理装置。
  16. 【請求項16】 前記生成手段は、前記教師データを、
    直交変換または周波数変換し、さらに量子化することに
    より、前記生徒データを生成することを特徴とする請求
    項14に記載のデータ処理装置。
  17. 【請求項17】 前記生成手段は、前記教師データを、
    直交変換または周波数変換して量子化し、さらに逆量子
    化することにより、前記生徒データを生成することを特
    徴とする請求項14に記載のデータ処理装置。
  18. 【請求項18】 前記生成手段は、前記教師データを、
    少なくとも、離散コサイン変換することにより、前記生
    徒データを生成することを特徴とする請求項14に記載
    のデータ処理装置。
  19. 【請求項19】 前記教師データのうちの、注目してい
    る注目教師データを予測するのに前記タップ係数ととも
    に用いる前記生徒データを抽出し、予測タップとして出
    力する予測タップ抽出手段をさらに備え、 前記学習手段は、前記予測タップおよびタップ係数を用
    いて予測演算を行うことにより得られる前記教師データ
    の予測値の予測誤差が、統計的に最小になるように学習
    を行うことを特徴とする請求項14に記載のデータ処理
    装置。
  20. 【請求項20】 前記注目教師データを、幾つかのクラ
    スのうちのいずれかにクラス分類するのに用いる前記生
    徒データを抽出し、クラスタップとして出力するクラス
    タップ抽出手段と、 前記クラスタップに基づいて、前記注目教師データのク
    ラスを求めるクラス分類を行うクラス分類手段とをさら
    に備え、 前記学習手段は、前記予測タップおよび前記注目教師デ
    ータのクラスに対応するタップ係数を用いて予測演算を
    行うことにより得られる前記教師データの予測値の予測
    誤差が、統計的に最小になるように学習を行い、クラス
    ごとの前記タップ係数を求めることを特徴とする請求項
    19に記載のデータ処理装置。
  21. 【請求項21】 前記生成手段は、前記教師データを、
    所定の単位ごとに、少なくとも、直交変換処理または周
    波数変換することにより、前記生徒データを生成するこ
    とを特徴とする請求項14に記載のデータ処理装置。
  22. 【請求項22】 前記教師データは、動画または静止画
    のデータであることを特徴とする請求項14に記載のデ
    ータ処理装置。
  23. 【請求項23】 少なくとも、直交変換処理または周波
    数変換処理を施すことにより得られる変換データを、予
    測演算によって復号するのに用いるタップ係数を学習す
    るデータ処理方法であって、 教師となる教師データを、少なくとも、直交変換または
    周波数変換することにより、生徒となる生徒データを生
    成する生成ステップと、 前記タップ係数および生徒データを用いて予測演算を行
    うことにより得られる前記教師データの予測値の予測誤
    差が、統計的に最小になるように学習を行い、前記タッ
    プ係数を求める学習ステップとを備えることを特徴とす
    るデータ処理方法。
  24. 【請求項24】 少なくとも、直交変換処理または周波
    数変換処理を施すことにより得られる変換データを、予
    測演算によって復号するのに用いるタップ係数を学習す
    るデータ処理を、コンピュータに行わせるプログラムが
    記録されている記録媒体であって、 教師となる教師データを、少なくとも、直交変換または
    周波数変換することにより、生徒となる生徒データを生
    成する生成ステップと、 前記タップ係数および生徒データを用いて予測演算を行
    うことにより得られる前記教師データの予測値の予測誤
    差が、統計的に最小になるように学習を行い、前記タッ
    プ係数を求める学習ステップとを備えるプログラムが記
    録されていることを特徴とする記録媒体。
JP2000135356A 2000-05-09 2000-05-09 データ処理装置およびデータ処理方法、並びに記録媒体 Expired - Fee Related JP4517448B2 (ja)

Priority Applications (12)

Application Number Priority Date Filing Date Title
JP2000135356A JP4517448B2 (ja) 2000-05-09 2000-05-09 データ処理装置およびデータ処理方法、並びに記録媒体
CNB018019870A CN1169303C (zh) 2000-05-09 2001-05-09 数据处理装置和方法以及记录介质
PCT/JP2001/003873 WO2001086820A1 (en) 2000-05-09 2001-05-09 Data processing device and data processing method, and recorded medium
US10/030,591 US7035471B2 (en) 2000-05-09 2001-05-09 Data processing device and data processing method and recorded medium
KR1020027000250A KR100731708B1 (ko) 2000-05-09 2001-05-09 데이터 처리 장치와 데이터 처리 방법, 및 기록 매체
CNB2004100558103A CN100568739C (zh) 2000-05-09 2001-05-09 数据处理装置和方法
CN2004100558118A CN1578159B (zh) 2000-05-09 2001-05-09 数据处理装置和方法
EP01930004A EP1282236B1 (en) 2000-05-09 2001-05-09 Data processing device and data processing method, and recorded medium
US11/348,720 US7206452B2 (en) 2000-05-09 2006-02-07 Data processing apparatus and method and recording medium
US11/584,789 US7289671B2 (en) 2000-05-09 2006-10-20 Data processing apparatus and method and recording medium
US11/584,772 US7283678B2 (en) 2000-05-09 2006-10-20 Data processing apparatus and method and recording medium
US11/584,483 US7336829B2 (en) 2000-05-09 2006-10-20 Data processing apparatus and method and recording medium

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2000135356A JP4517448B2 (ja) 2000-05-09 2000-05-09 データ処理装置およびデータ処理方法、並びに記録媒体

Publications (2)

Publication Number Publication Date
JP2001320277A true JP2001320277A (ja) 2001-11-16
JP4517448B2 JP4517448B2 (ja) 2010-08-04

Family

ID=18643445

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2000135356A Expired - Fee Related JP4517448B2 (ja) 2000-05-09 2000-05-09 データ処理装置およびデータ処理方法、並びに記録媒体

Country Status (1)

Country Link
JP (1) JP4517448B2 (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002149175A (ja) * 2000-11-14 2002-05-24 Sony Corp 音声処理装置および音声処理方法、学習装置および学習方法、並びに記録媒体
WO2004047454A1 (ja) * 2002-11-20 2004-06-03 Sony Corporation 画像信号の処理装置および処理方法、それに使用される係数データの生成装置および生成方法、並びに各方法を実行するためのプログラムおよびそのプログラムを記録したコンピュータ読み取り可能な媒体
JP2007295599A (ja) * 2007-06-04 2007-11-08 Sony Corp 学習装置および学習方法、並びにプログラムおよび記録媒体
US7912711B2 (en) 2000-08-09 2011-03-22 Sony Corporation Method and apparatus for speech data

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0795581A (ja) * 1993-09-20 1995-04-07 Sony Corp ディジタル画像信号の受信/再生装置
JPH07193789A (ja) * 1993-12-25 1995-07-28 Sony Corp 画像情報変換装置
JPH07322215A (ja) * 1994-05-28 1995-12-08 Sony Corp 解像度補償可能な画像変換装置および方法
JPH07321662A (ja) * 1994-05-28 1995-12-08 Sony Corp ディジタル信号処理装置および方法
JPH118838A (ja) * 1997-06-17 1999-01-12 Sony Corp 画像信号処理装置及び方法並びに予測パラメータの学習方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0795581A (ja) * 1993-09-20 1995-04-07 Sony Corp ディジタル画像信号の受信/再生装置
JPH07193789A (ja) * 1993-12-25 1995-07-28 Sony Corp 画像情報変換装置
JPH07322215A (ja) * 1994-05-28 1995-12-08 Sony Corp 解像度補償可能な画像変換装置および方法
JPH07321662A (ja) * 1994-05-28 1995-12-08 Sony Corp ディジタル信号処理装置および方法
JPH118838A (ja) * 1997-06-17 1999-01-12 Sony Corp 画像信号処理装置及び方法並びに予測パラメータの学習方法

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7912711B2 (en) 2000-08-09 2011-03-22 Sony Corporation Method and apparatus for speech data
JP2002149175A (ja) * 2000-11-14 2002-05-24 Sony Corp 音声処理装置および音声処理方法、学習装置および学習方法、並びに記録媒体
JP4517262B2 (ja) * 2000-11-14 2010-08-04 ソニー株式会社 音声処理装置および音声処理方法、学習装置および学習方法、並びに記録媒体
WO2004047454A1 (ja) * 2002-11-20 2004-06-03 Sony Corporation 画像信号の処理装置および処理方法、それに使用される係数データの生成装置および生成方法、並びに各方法を実行するためのプログラムおよびそのプログラムを記録したコンピュータ読み取り可能な媒体
US7729558B2 (en) 2002-11-20 2010-06-01 Sony Corporation Image signal, processing device and processing method, coefficient data generation device and generation method used for the same, program for executing the methods and computer readable medium containing the program
JP2007295599A (ja) * 2007-06-04 2007-11-08 Sony Corp 学習装置および学習方法、並びにプログラムおよび記録媒体

Also Published As

Publication number Publication date
JP4517448B2 (ja) 2010-08-04

Similar Documents

Publication Publication Date Title
US7336829B2 (en) Data processing apparatus and method and recording medium
JP5718363B2 (ja) 大きいサイズの変換単位を用いた映像符号化、復号化方法及び装置
JP4517448B2 (ja) データ処理装置およびデータ処理方法、並びに記録媒体
JP4752088B2 (ja) データ処理装置およびデータ処理方法、並びに記録媒体
JP4538698B2 (ja) データ処理装置およびデータ処理方法、並びに記録媒体
JP4147789B2 (ja) 画像処理装置および画像処理方法、並びにプログラムおよび記録媒体
JP4678454B2 (ja) データ処理装置およびデータ処理方法、並びに記録媒体
JP4419287B2 (ja) 画像処理装置および画像処理方法、並びに記録媒体
US20210266535A1 (en) Data processing apparatus and data processing method
JP4538699B2 (ja) データ処理装置およびデータ処理方法、並びに記録媒体
WO2019131161A1 (ja) 符号化装置、符号化方法、復号装置、及び、復号方法
JP2001345707A (ja) データ処理装置およびデータ処理方法、並びに記録媒体
JP4081745B2 (ja) 復号装置および復号方法、学習装置および学習方法、並びにプログラムおよび記録媒体
JP4154647B2 (ja) データ処理装置およびデータ処理方法、並びにプログラムおよび記録媒体
JP4491701B2 (ja) データ処理装置およびデータ処理方法、並びに記録媒体
KR100744442B1 (ko) 디지털 비디오 및 이미지들에 대한 개선된 캐스케이드 압축 방법 및 시스템
Furht Image presentation and compression
JP2002335405A (ja) 画像データ処理装置および方法、記録媒体、並びにプログラム
JP2003023634A (ja) 画像符号化/復号化方法及び装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20070201

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20090514

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20090713

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20091215

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100208

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20100427

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20100510

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130528

Year of fee payment: 3

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees