JP4491701B2 - データ処理装置およびデータ処理方法、並びに記録媒体 - Google Patents

データ処理装置およびデータ処理方法、並びに記録媒体 Download PDF

Info

Publication number
JP4491701B2
JP4491701B2 JP2000264921A JP2000264921A JP4491701B2 JP 4491701 B2 JP4491701 B2 JP 4491701B2 JP 2000264921 A JP2000264921 A JP 2000264921A JP 2000264921 A JP2000264921 A JP 2000264921A JP 4491701 B2 JP4491701 B2 JP 4491701B2
Authority
JP
Japan
Prior art keywords
data
axis
tap
class
prediction
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2000264921A
Other languages
English (en)
Other versions
JP2002074354A (ja
Inventor
哲二郎 近藤
小林  直樹
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Corp
Original Assignee
Sony Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Corp filed Critical Sony Corp
Priority to JP2000264921A priority Critical patent/JP4491701B2/ja
Publication of JP2002074354A publication Critical patent/JP2002074354A/ja
Application granted granted Critical
Publication of JP4491701B2 publication Critical patent/JP4491701B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Description

【0001】
【発明の属する技術分野】
本発明は、データ処理装置およびデータ処理方法、並びに記録媒体に関し、特に、例えば、SD(Standard Density)画像をHD(High Density)画像に変換する場合等に、効率的な処理を行うことができるようにするデータ処理装置およびデータ処理方法、並びに記録媒体に関する。
【0002】
【従来の技術】
本件出願人は、SD画像をHD画像に変換する技術として、クラス分類適応処理を先に提案している。
【0003】
クラス分類適応処理は、クラス分類処理と適応処理とからなり、クラス分類処理によって、データを、幾つかのクラスのうちのいずれかにクラス分けし、各クラスごとに適応処理を施すものであり、適応処理は、以下のような手法のものである。
【0004】
即ち、適応処理では、例えば、図1に○印で示すような標準解像度または低解像度の画像(SD画像)を構成する画素(以下、適宜、SD画素という)と、所定のタップ係数との線形結合により、そのSD画像の解像度を向上させた、例えば、図1に●印で示すような高解像度の画像(HD画像)の画素の予測値を求めることで、そのSD画像の解像度を向上させた画像(図1においては、横および縦のいずれも方向も、SD画像の解像度の2倍の解像度のHD画像)が得られる。
【0005】
具体的には、例えば、いま、あるHD画像を教師データとするとともに、そのHD画像の解像度を劣化させたSD画像を生徒データとして、HD画像を構成する画素(以下、適宜、HD画素という)の画素値yの予測値E[y]を、幾つかのSD画素(SD画像を構成する画素)の画素値x1,x2,・・・の集合と、所定のタップ係数w1,w2,・・・の線形結合により規定される線形1次結合モデルにより求めることを考える。この場合、予測値E[y]は、次式で表すことができる。
【0006】
E[y]=w11+w22+・・・
・・・(1)
【0007】
式(1)を一般化するために、タップ係数wjの集合でなる行列W、生徒データxijの集合でなる行列X、および予測値E[yj]の集合でなる行列Y’を、
【数1】
Figure 0004491701
で定義すると、次のような観測方程式が成立する。
【0008】
XW=Y’
・・・(2)
ここで、行列Xの成分xijは、i件目の生徒データの集合(i件目の教師データyiの予測に用いる生徒データの集合)の中のj番目の生徒データを意味し、行列Wの成分wjは、生徒データの集合の中のj番目の生徒データとの積が演算されるタップ係数を表す。また、yiは、i件目の教師データを表し、従って、E[yi]は、i件目の教師データの予測値を表す。なお、式(1)の左辺におけるyは、行列Yの成分yiのサフィックスiを省略したものであり、また、式(1)の右辺におけるx1,x2,・・・も、行列Xの成分xijのサフィックスiを省略したものである。
【0009】
そして、この観測方程式に最小自乗法を適用して、HD画素の画素値yに近い予測値E[y]を求めることを考える。この場合、教師データとなるHD画素の真の画素値yの集合でなる行列Y、およびHD画素の画素値yに対する予測値E[y]の残差eの集合でなる行列Eを、
【数2】
Figure 0004491701
で定義すると、式(2)から、次のような残差方程式が成立する。
【0010】
XW=Y+E
・・・(3)
【0011】
この場合、HD画素の画素値yに近い予測値E[y]を求めるためのタップ係数wjは、自乗誤差
【数3】
Figure 0004491701
を最小にすることで求めることができる。
【0012】
従って、上述の自乗誤差をタップ係数wjで微分したものが0になる場合、即ち、次式を満たすタップ係数wjが、HD画素の画素値yに近い予測値E[y]を求めるため最適値ということになる。
【0013】
【数4】
Figure 0004491701
・・・(4)
【0014】
そこで、まず、式(3)を、タップ係数wjで微分することにより、次式が成立する。
【0015】
【数5】
Figure 0004491701
・・・(5)
【0016】
式(4)および(5)より、式(6)が得られる。
【0017】
【数6】
Figure 0004491701
・・・(6)
【0018】
さらに、式(3)の残差方程式における生徒データxij、タップ係数wj、教師データyi、および残差eiの関係を考慮すると、式(6)から、次のような正規方程式を得ることができる。
【0019】
【数7】
Figure 0004491701
・・・(7)
【0020】
なお、式(7)に示した正規方程式は、行列(共分散行列)Aおよびベクトルvを、
【数8】
Figure 0004491701
で定義するとともに、ベクトルWを、数1で示したように定義すると、式
AW=v
・・・(8)
で表すことができる。
【0021】
式(7)における各正規方程式は、生徒データxijおよび教師データyiのセットを、ある程度の数だけ用意することで、求めるべきタップ係数wjの数Jと同じ数だけたてることができ、従って、式(8)を、ベクトルWについて解くことで(但し、式(8)を解くには、式(8)における行列Aが正則である必要がある)、最適なタップ係数wjを求めることができる。なお、式(8)を解くにあたっては、例えば、掃き出し法(Gauss-Jordanの消去法)などを用いることが可能である。
【0022】
以上のようにして、最適なタップ係数wjを求めておき、さらに、そのタップ係数wjを用い、式(1)により、HD画素の画素値yに近い予測値E[y]を求めるのが適応処理である。従って、適応処理とは、図2に示すように、生徒データ(生徒画像)と教師データ(教師画像)とを用いた学習により、タップ係数を求める処理(学習処理)(図2(A))と、そのタップ係数を用いて、入力画像としてのSD画像からHD画像を予測した予測画像を求める処理(予測処理)(図2(B))を意味する。
【0023】
なお、適応処理は、SD画像には含まれていないが、HD画像に含まれる成分が再現される点で、例えば、単なる補間処理とは異なる。即ち、適応処理では、式(1)だけを見る限りは、いわゆる補間フィルタを用いての補間処理と同一に見えるが、その補間フィルタのタップ係数に相当するタップ係数wが、教師データyを用いての、いわば学習により求められるため、HD画像に含まれる成分を再現することができる。このことから、適応処理は、いわば画像の創造(解像度創造)作用がある処理ということができる。
【0024】
また、ここでは、適応処理について、解像度を向上させる場合を例にして説明したが、適応処理によれば、タップ係数を求めるのに用いる教師データおよび生徒データを変えることで、例えば、S/N(Signal to Noise Ratio)の向上や、ぼけの改善等の画質の向上を図ることが可能である。
【0025】
【発明が解決しようとする課題】
ところで、クラス分類適応処理では、データごとに、そのデータに適した適応処理を行うために、データをクラス分類し、その結果得られるクラスごとに、正規方程式がたてられ、タップ係数が求められる。そして、そのクラスごとのタップ係数を用いて、予測値が求められる。
【0026】
この場合、クラス分類は、例えば、SD画像を構成するSD画素の幾つかを、クラス分類に用いるクラスタップとし、そのクラスタップを用いて、KビットADRC(Adaptive Dynamic Range Coding)処理を行うことで行われる。
【0027】
即ち、KビットADRCにおいては、例えば、クラスタップを構成するSD画素の画素値の最大値MAXと最小値MINが検出され、DR=MAX-MINを、集合の局所的なダイナミックレンジとし、このダイナミックレンジDRに基づいて、クラスタップを構成するSD画素がKビットに再量子化される。即ち、クラスタップを構成するSD画素の画素値の中から、最小値MINが減算され、その減算値がDR/2Kで除算(量子化)される。そして、以上のようにして得られる、クラスタップを構成する各SD画素についてのKビットの画素値を、所定の順番で並べたビット列が、ADRCコードとして出力される。従って、クラスタップが、例えば、1ビットADRC処理された場合には、そのクラスタップを構成する各SD画素の画素値は、最小値MINが減算された後に、最大値MAXと最小値MINとの平均値で除算され、これにより、各画素値が1ビットとされる(2値化される)。そして、その1ビットの画素値を所定の順番で並べたビット列が、ADRCコードとして出力され、このADRCコードが、クラス分類結果としてのクラスコードとされる。
【0028】
なお、クラス分類では、例えば、クラスタップを構成するSD画素のレベル分布のパターンを、そのままクラスコードとして出力することも可能であるが、この場合、クラスタップが、N個のSD画素で構成され、各SD画素に、Kビットが割り当てられているとすると、クラスコードの場合の数(全クラス数)は、(2NK個となり、画素値のビット数Kに指数的に比例した膨大な数となる。
【0029】
従って、クラス分類は、上述のように、画素値のビット数等を、いわば圧縮するADRC処理等のような圧縮処理を施してから行うのが好ましい。
【0030】
ところで、クラスタップを構成する複数の画素値(画素の画素値)が、例えば、R(Red)成分を表すR軸、G成分を表すG(Green)軸、およびB成分を表すB(Blue)軸の3軸で規定されるRGB空間で表現されるものである場合には、そのR成分、G成分、B成分それぞれごとに、ADRC処理によるクラス分類が行われ、それぞれのクラス分類結果としてのクラスコードを並べたビット列が、最終的なクラスコードとされる。
【0031】
従って、例えば、クラスタップを構成する複数の画素値が、RGB空間において、同じような形状の分布を有するものであっても、その分布の方向が異なると、異なるクラスコードが得られるため、クラス数が制限された条件の下では、クラスタップを構成する複数の画素値の分布具合を、効率的にクラス分類することが困難な場合があった。
【0032】
即ち、例えば、図3は、画像の輝度変化の大きい部分の複数の画素で構成されるクラスタップと、色変化の大きい部分の複数の画素で構成されるクラスタップそれぞれの、RGB空間における画素値の分布を示している。
【0033】
図3における2つの分布は、形状が同一であるが、方向が異なるため、RGB空間を規定するR軸、G軸、B軸のそれぞれの方向についてクラス分類を行い、それらの3つのクラス分類結果をあわせたものを、最終的なクラス分類結果としたのでは、異なるクラスに分類される。
【0034】
即ち、クラス分類を、RGB軸(RGB空間)で表現される画素値で構成されるクラスタップによって行った場合には、そのクラスタップを構成する複数の画素値の分布の形状と方向の両方が同じようなものでないと、つまり、形状と方向のうちのいずれか一方だけが異なると、異なるクラスコードが得られる。
【0035】
従って、クラス数を制限した場合には、形状や方向が、比較的異なっていても、同一のクラスコードが得られるようなクラス分類が行われ、画素値の分布が比較的異なるクラスタップを、異なるクラスにクラス分けすることが困難となる。
【0036】
そして、クラス分類適応処理では、データごとに、そのデータに適した適応処理を施すために、データをクラス分類することから、上述のように、画素値の分布の形状や方向が比較的異なるクラスタップどうしから、同一のクラスコードが得られる場合には、各データに適した適応処理を施すことが困難となる。
【0037】
一方、学習処理では、クラスごとに、正規方程式がたてられ、予測処理では、クラスごとのタップ係数が用いられる。従って、クラス数を多くすると、処理効率が劣化する。
【0038】
本発明は、このような状況に鑑みてなされたものであり、クラス数を制限しても、データの的確なクラス分けを可能とし、これにより、処理効率を向上させることができるようにするものである。
【0039】
【課題を解決するための手段】
本発明の第1のデータ処理装置は、データを表現する軸を、新たな軸に変換するのに用いる複数のデータとしての軸計算タップを構成する軸計算タップ構成手段と、軸計算タップに基づいて、新たな軸を求める軸計算手段と、注目データをクラス分類するのに用いる複数のデータとしてのクラスタップを構成するクラスタップ構成手段と、クラスタップとしての複数のデータを、新たな軸上で表現されるデータに変換するデータ変換手段と、新たな軸上で表現されるクラスタップに基づいて、クラス分類を行うクラス分類手段とを備えることを特徴とする。
【0040】
本発明の第1のデータ処理方法は、データを表現する軸を、新たな軸に変換するのに用いる複数のデータとしての軸計算タップを構成する軸計算タップ構成ステップと、軸計算タップに基づいて、新たな軸を求める軸計算ステップと、注目データをクラス分類するのに用いる複数のデータとしてのクラスタップを構成するクラスタップ構成ステップと、クラスタップとしての複数のデータを、新たな軸上で表現されるデータに変換するデータ変換ステップと、新たな軸上で表現されるクラスタップに基づいて、クラス分類を行うクラス分類ステップとを備えることを特徴とする。
【0041】
本発明の第1の記録媒体は、データを表現する軸を、新たな軸に変換するのに用いる複数のデータとしての軸計算タップを構成する軸計算タップ構成ステップと、軸計算タップに基づいて、新たな軸を求める軸計算ステップと、注目データをクラス分類するのに用いる複数のデータとしてのクラスタップを構成するクラスタップ構成ステップと、クラスタップとしての複数のデータを、新たな軸上で表現されるデータに変換するデータ変換ステップと、新たな軸上で表現されるクラスタップに基づいて、クラス分類を行うクラス分類ステップとを備えるプログラムが記録されていることを特徴とする。
【0042】
本発明の第2のデータ処理装置は、第1のデータを表現する軸を、新たな軸に変換するのに用いる複数の第1のデータとしての軸計算タップを構成する軸計算タップ構成手段と、軸計算タップに基づいて、新たな軸を求める軸計算手段と、予測対象の第2のデータを注目データとして、その注目データを幾つかのクラスのうちのいずれかにクラス分けするクラス分類を行うのに用いる複数の第1のデータとしてのクラスタップを構成するクラスタップ構成手段と、注目データを予測するのに用いる複数の第1のデータとしての予測タップを構成する予測タップ構成手段と、クラスタップとしての複数の第1のデータと、予測タップとしての複数の第1のデータを、新たな軸上で表現されるデータに変換する変換手段と、新たな軸上で表現されるクラスタップに基づいて、注目データについてのクラス分類を行うクラス分類手段と、新たな軸上で表現される予測タップを用い、注目データのクラスに対応する予測方法に基づいて、注目データの予測値であって、新たな軸上で表現されるものを求める予測手段とを備えることを特徴とする。
【0043】
本発明の第2のデータ処理方法は、第1のデータを表現する軸を、新たな軸に変換するのに用いる複数の第1のデータとしての軸計算タップを構成する軸計算タップ構成ステップと、軸計算タップに基づいて、新たな軸を求める軸計算ステップと、予測対象の第2のデータを注目データとして、その注目データを幾つかのクラスのうちのいずれかにクラス分けするクラス分類を行うのに用いる複数の第1のデータとしてのクラスタップを構成するクラスタップ構成ステップと、注目データを予測するのに用いる複数の第1のデータとしての予測タップを構成する予測タップ構成ステップと、クラスタップとしての複数の第1のデータと、予測タップとしての複数の第1のデータを、新たな軸上で表現されるデータに変換する変換ステップと、新たな軸上で表現されるクラスタップに基づいて、注目データについてのクラス分類を行うクラス分類ステップと、新たな軸上で表現される予測タップを用い、注目データのクラスに対応する予測方法に基づいて、注目データの予測値であって、新たな軸上で表現されるものを求める予測ステップとを備えることを特徴とする。
【0044】
本発明の第2の記録媒体は、第1のデータを表現する軸を、新たな軸に変換するのに用いる複数の第1のデータとしての軸計算タップを構成する軸計算タップ構成ステップと、軸計算タップに基づいて、新たな軸を求める軸計算ステップと、予測対象の第2のデータを注目データとして、その注目データを幾つかのクラスのうちのいずれかにクラス分けするクラス分類を行うのに用いる複数の第1のデータとしてのクラスタップを構成するクラスタップ構成ステップと、注目データを予測するのに用いる複数の第1のデータとしての予測タップを構成する予測タップ構成ステップと、クラスタップとしての複数の第1のデータと、予測タップとしての複数の第1のデータを、新たな軸上で表現されるデータに変換する変換ステップと、新たな軸上で表現されるクラスタップに基づいて、注目データについてのクラス分類を行うクラス分類ステップと、新たな軸上で表現される予測タップを用い、注目データのクラスに対応する予測方法に基づいて、注目データの予測値であって、新たな軸上で表現されるものを求める予測ステップとを備えるプログラムが記録されていることを特徴とする。
【0045】
本発明の第3のデータ処理装置は、第1と第2のデータを、それぞれ生徒データと教師データとして、生徒データおよび教師データを表現する軸を、新たな軸に変換するのに用いる複数の生徒データとしての軸計算タップを構成する軸計算タップ構成手段と、軸計算タップに基づいて、新たな軸を求める軸計算手段と、注目している注目教師データを幾つかのクラスのうちのいずれかにクラス分けするクラス分類を行うのに用いる複数の生徒データとしてのクラスタップを構成するクラスタップ構成手段と、注目教師データを予測するのに用いる複数の生徒データとしての予測タップを構成する予測タップ構成手段と、教師データ、クラスタップとしての複数の生徒データ、および予測タップとしての複数の生徒データを、新たな軸上で表現されるデータに変換する変換手段と、新たな軸上で表現されるクラスタップに基づいて、注目教師データについてのクラス分類を行い、そのクラスを求めるクラス分類手段と、新たな軸上で表現される教師データと予測タップを用い、第2のデータを予測する予測方法を、クラスごとに学習する学習手段とを備えることを特徴とする。
【0046】
本発明の第3のデータ処理方法は、第1と第2のデータを、それぞれ生徒データと教師データとして、生徒データおよび教師データを表現する軸を、新たな軸に変換するのに用いる複数の生徒データとしての軸計算タップを構成する軸計算タップ構成ステップと、軸計算タップに基づいて、新たな軸を求める軸計算ステップと、注目している注目教師データを幾つかのクラスのうちのいずれかにクラス分けするクラス分類を行うのに用いる複数の生徒データとしてのクラスタップを構成するクラスタップ構成ステップと、注目教師データを予測するのに用いる複数の生徒データとしての予測タップを構成する予測タップ構成ステップと、教師データ、クラスタップとしての複数の生徒データ、および予測タップとしての複数の生徒データを、新たな軸上で表現されるデータに変換する変換ステップと、新たな軸上で表現されるクラスタップに基づいて、注目教師データについてのクラス分類を行い、そのクラスを求めるクラス分類ステップと、新たな軸上で表現される教師データと予測タップを用い、第2のデータを予測する予測方法を、クラスごとに学習する学習ステップとを備えることを特徴とする。
【0047】
本発明の第3の記録媒体は、第1と第2のデータを、それぞれ生徒データと教師データとして、生徒データおよび教師データを表現する軸を、新たな軸に変換するのに用いる複数の生徒データとしての軸計算タップを構成する軸計算タップ構成ステップと、軸計算タップに基づいて、新たな軸を求める軸計算ステップと、注目している注目教師データを幾つかのクラスのうちのいずれかにクラス分けするクラス分類を行うのに用いる複数の生徒データとしてのクラスタップを構成するクラスタップ構成ステップと、注目教師データを予測するのに用いる複数の生徒データとしての予測タップを構成する予測タップ構成ステップと、教師データ、クラスタップとしての複数の生徒データ、および予測タップとしての複数の生徒データを、新たな軸上で表現されるデータに変換する変換ステップと、新たな軸上で表現されるクラスタップに基づいて、注目教師データについてのクラス分類を行い、そのクラスを求めるクラス分類ステップと、新たな軸上で表現される教師データと予測タップを用い、第2のデータを予測する予測方法を、クラスごとに学習する学習ステップとを備えるプログラムが記録されていることを特徴とする。
【0048】
本発明の第1のデータ処理装置およびデータ処理方法、並びに記録媒体においては、データを表現する軸を、新たな軸に変換するのに用いる複数のデータとしての軸計算タップが構成され、その軸計算タップに基づいて、新たな軸が求められる。さらに、注目データをクラス分類するのに用いる複数のデータとしてのクラスタップが構成され、そのクラスタップとしての複数のデータが、新たな軸上で表現されるデータに変換される。そして、新たな軸上で表現されるクラスタップに基づいて、クラス分類が行われる。
【0049】
本発明の第2のデータ処理装置およびデータ処理方法、並びに記録媒体においては、第1のデータを表現する軸を、新たな軸に変換するのに用いる複数の第1のデータとしての軸計算タップが構成され、その軸計算タップに基づいて、新たな軸を求められる。さらに、予測対象の第2のデータを注目データとして、その注目データを幾つかのクラスのうちのいずれかにクラス分けするクラス分類を行うのに用いる複数の第1のデータとしてのクラスタップが構成されるとともに、注目データを予測するのに用いる複数の第1のデータとしての予測タップが構成され、クラスタップとしての複数の第1のデータと、予測タップとしての複数の第1のデータが、新たな軸上で表現されるデータに変換される。そして、新たな軸上で表現されるクラスタップに基づいて、注目データについてのクラス分類が行われ、新たな軸上で表現される予測タップを用い、注目データのクラスに対応する予測方法に基づいて、注目データの予測値であって、新たな軸上で表現されるものが求められる。
【0050】
本発明の第3のデータ処理装置およびデータ処理方法、並びに記録媒体においては、第1と第2のデータを、それぞれ生徒データと教師データとして、生徒データおよび教師データを表現する軸を、新たな軸に変換するのに用いる複数の生徒データとしての軸計算タップが構成され、その軸計算タップに基づいて、新たな軸が求められる。さらに、注目している注目教師データを幾つかのクラスのうちのいずれかにクラス分けするクラス分類を行うのに用いる複数の生徒データとしてのクラスタップが構成されるとともに、注目教師データを予測するのに用いる複数の生徒データとしての予測タップが構成され、教師データ、クラスタップとしての複数の生徒データ、および予測タップとしての複数の生徒データが、新たな軸上で表現されるデータに変換される。そして、新たな軸上で表現されるクラスタップに基づいて、注目教師データについてのクラス分類が行われ、新たな軸上で表現される教師データと予測タップを用い、第2のデータを予測する予測方法が、クラスごとに学習される。
【0051】
【発明の実施の形態】
図4は、本発明を適用したデータ処理装置の一実施の形態の構成例を示している。このデータ処理装置は、クラス分類適応処理としての予測処理を行う予測装置として構成されている。
【0052】
即ち、入力画像用メモリ1には、HD画像の予測値に変換しようとするSD画像が、入力画像として供給されるようになっており、入力画像用メモリ1は、その入力画像としてのSD画像を、例えば、1フレーム(または1フィールド)単位で記憶する。
【0053】
なお、ここでは、入力画像としてのSD画像を構成するSD画素(画素値)は、例えば、RGB軸上で表現されるものとする。従って、入力画像用メモリ1には、R成分、G成分、およびB成分の3つの成分からなる画素値が記憶される。
【0054】
タップ構成部2は、入力画像用メモリ1に記憶されたSD画像を構成するSD画素から、各処理に用いるタップを構成する。
【0055】
即ち、タップ構成部2は、入力画像用メモリ1に記憶されたSD画像の解像度を向上させたHD画像(予測装置では、このHD画像は、実際には存在しないが、仮想的に想定される)を構成する所定の画素を、順次、注目画素とし、その注目画素の位置に対応するSD画像の位置から空間的または時間的に近い位置にある幾つかのSD画素を、入力画像用メモリ1のSD画像から選択し、タップ係数との予測演算に用いる予測タップを構成する。
【0056】
さらに、タップ構成部2は、注目画素の位置に対応するSD画像の位置から空間的または時間的に近い位置にある幾つかのSD画素を、入力画像用メモリ1のSD画像から選択し、注目画素を、幾つかのクラスのうちのいずれかに分類するためのクラス分類に用いるクラスタップを構成する。
【0057】
また、タップ構成部2は、注目画素の位置に対応するSD画像の位置から空間的または時間的に近い位置にある幾つかのSD画素を、入力画像用メモリ1のSD画像から選択し、軸計算タップを構成する。
【0058】
即ち、後述する軸変換部4では、画素値を表現する軸(空間)が、RGB軸から、後述するXYZ軸に変換(軸変換)されるが、タップ構成部2は、この軸変換を行うための変換行列の算出に用いる複数のSD画素を、軸計算タップとする。
【0059】
タップ構成部2で得られた軸計算タップは、軸計算部3に、予測タップおよびクラスタップは、軸変換部4に、それぞれ供給される。
【0060】
軸計算部3は、タップ構成部2から供給される軸計算タップ(を構成するSD画素の画素値)に基づいて、X軸、Y軸、Z軸(の方向を表すベクトル)を計算する。
【0061】
即ち、タップ構成部2から供給される軸計算タップを構成する複数のSD画素の画素値は、RGB軸上で表現されるものであるが、軸計算部3は、その複数の画素値を、例えば、主成分分析することにより、第1主成分の方向をX軸に、第2主成分の方向をY軸に、第3主成分の方向をZ軸に、それぞれ設定する。
【0062】
具体的には、例えば、いま、タップ構成部2において、図5に示すように、注目画素に対応するSD画素(図5において、×印を付してある○印で示す画素(後述する図6および図7においても同様))を中心として、その上に隣接する2画素、下に隣接する2画素、左に隣接する2画素、右に隣接する2画素、左上に隣接する1画素、左下に隣接する1画素、右上に隣接する1画素、右下に隣接する1画素の、合計13画素のSD画素が、軸計算タップとして選択された場合には、軸計算部3は、この軸計算タップを構成する13画素を対象として、RGB空間における主成分分析を行い、その結果得られる第1乃至第3主成分の方向を、X軸、Y軸、Z軸とする。従って、軸計算タップを構成する13画素の分布において、最も拡がりのある方向が、X軸とされ、そのX軸と直交し、2番目に拡がりのある方向が、Y軸とされ、X軸およびY軸と直交し、3番目に拡がりのある方向が、Z軸とされる。
【0063】
ここで、X軸、Y軸、およびZ軸の3軸で規定される空間を、以下、適宜、XYZ空間という。
【0064】
軸計算部3は、以上のようにして、XYZ軸を求めた後、RGB軸で表現される画素値を、XYZ軸で表現される画素値に変換するための変換行列を求め、これを、軸データとして、軸変換部4および軸逆変換部8に供給する。
【0065】
軸変換部4は、タップ構成部2から供給される予測タップとクラスタップを構成するSD画素の画素値を、軸計算部3からの軸データとしての変換行列によって軸変換することにより、XYZ軸上で表現される画素値とし、さらに必要な処理を施して出力する。
【0066】
即ち、例えば、いま、タップ構成部2において、注目画素に対応するSD画素を中心とする、図6(A)に示すようなRGB空間上の29のSD画素が、予測タップとして選択された場合には、軸変換部4は、この予測タップを構成する29画素の画素値を、XYZ軸上のものに軸変換する。さらに、軸変換部4は、例えば、図6(B)に示すような、XYZ軸上の予測タップを構成する29の画素値のうちの、29画素のX成分(X軸方向の画素値)、9画素のY成分(Y軸方向の画素値)、および1画素のZ成分(Z軸方向の画素値)の、合計39の値を、予測タップ(この予測タップを、以下、適宜、軸変換後予測タップともいう)として出力する。
【0067】
また、軸変換部4は、タップ構成部2から供給されるクラスタップを構成するSD画素の画素値を、XYZ軸上で表現される画素値とし、そのままクラスタップ(このクラスタップを、以下、適宜、軸変換後クラスタップともいう)として出力する。
【0068】
軸変換部4が出力する軸変換後予測タップは、画素値予測部7に供給され、軸変換後クラスタップは、クラス分類部5に供給される。
【0069】
クラス分類部5は、軸変換部4からのクラスタップ(軸変換後クラスタップ)に基づき、注目画素をクラス分類し、その結果得られるクラスに対応するクラスコードを、係数メモリ6に対して、アドレスとして供給する。
【0070】
即ち、例えば、いま、タップ構成部2において、注目画素に対応するSD画素を中心とする、図7(A)に示すようなRGB空間上の13画素のSD画素が、クラスタップとして選択された場合には、軸変換部4は、このクラスタップを構成する13画素の画素値を、XYZ軸上のものに軸変換する。さらに、クラス分類部5は、そのXYZ軸上で表現された13画素の画素値を、例えば、1ビットADRC処理し、その結果得られるADRCコードを、クラスコードとして出力する。
【0071】
但し、本実施の形態では、クラス分類部5は、例えば、図7(B)に示すように、XYZ軸上で表現された13画素の画素値のうちの、例えば、X成分の13の値だけを対象に、ADRC処理を行う。また、クラス分類部5は、ADRC処理を行う際、13のX成分すべてを対象にして、ダイナミックレンジDRを求め、13のX成分のうちの、注目画素を中心とする3×3画素の合計9画素(図7(B)において、●印で示す画素)のX成分を、DR/2で量子化する。そして、クラス分類部5は、その9画素についてそれぞれ得られる1ビットのコードを並べた9ビットを、ADRCコードとして出力する。従って、本実施の形態では、注目画素は、512(=29)クラスのうちのいずれかにクラス分類されることになる。
【0072】
ここで、クラス分類部5には、例えば、クラスタップを構成するSD画素のX成分のレベル分布のパターンを、そのままクラスコードとして出力させることも可能であるが、この場合、クラス数は、前述したように、膨大な数となる。
【0073】
従って、クラス分類部5においては、上述のように、画素値のビット数等を圧縮するADRC処理等のような圧縮処理を行ってから、クラス分類を行うのが好ましい。なお、クラス分類部5における圧縮処理としては、ADRC処理に限定されるものではなく、その他、例えば、ベクトル量子化等を用いることも可能である。
【0074】
以上のように、クラス分類部5では、軸変換部4によってXYX軸上で表現された画素値で構成されるクラスタップに基づいて、クラス分類が行われるので、注目画素を効率的にクラス分けすることができる。
【0075】
即ち、前述の図3と同様の図8(A)に示すように、画像の輝度変化の大きい部分の複数の画素で構成されるクラスタップと、色変化の大きい部分の複数の画素で構成されるクラスタップとについては、RGB空間では、その画素値の分布の形状が同一であっても、方向(拡がりの方向)が異なるために、異なるクラスに分類される。
【0076】
しかしながら、クラスタップを軸変換した場合には、クラスタップを構成する画素値の分布の最も拡がりのある方向は、X軸方向を向き、そのX軸と直交し、2番目に拡がりのある方向は、Y軸方向を向き、X軸およびY軸と直交し、3番目に拡がりのある方向は、Z軸方向を向いている。
【0077】
従って、RGB空間において形状が同一の分布は、RGB空間における方向がどの方向を向いていても、XYZ空間では、同一の分布として捉えることができる。
【0078】
即ち、画像の輝度変化の大きい部分の複数の画素で構成されるクラスタップを構成する画素値の分布と、色変化の大きい部分の複数の画素で構成されるクラスタップを構成する画素値の分布とは、RGB空間では、図8(A)に示したように、形状が同一であっても、方向が異なる分布となるが、XYZ空間では、図8(B)に示すように、形状が同一であれば、方向も同一の分布となる。従って、XYZ空間においては、画像の輝度変化の大きい部分の複数の画素で構成されるクラスタップを構成する画素値の分布と、色変化の大きい部分の複数の画素で構成されるクラスタップを構成する画素値の分布とは、同一のクラスとすることができ、効率的なクラス分けを行うことができる。
【0079】
さらに、クラス分類は、クラスタップを構成する画素値の分布具合に応じて、クラス分けを行う手法と捉えることができるが、XYZ空間では、分布の拡がり具合は、X軸方向に、最も集中する。従って、図7(B)で説明したように、X,Y,Z成分のうちのX成分だけを用いて、クラス分類を行っても、画素値の分布具合を正確に反映したクラス分けを行うことができる。
【0080】
以上から、クラス分類部5では、少ないクラス数によっても、精度の良いクラス分けを行うことができる。
【0081】
係数メモリ6は、後述するような学習処理が行われることにより得られるクラスごとのタップ係数を記憶している。そして、係数メモリ6は、クラス分類部5から供給されるクラスコードに対応するアドレスに記憶されているタップ係数を読み出し、画素値予測部7に供給する。
【0082】
画素値予測部7は、軸変換部4から供給される予測タップ(軸変換後予測タップ)と、係数メモリ6から供給されるタップ係数とを用いて、式(1)に示した線形予測演算(積和演算)を行い、その結果得られる画素値を、SD画像の解像度を向上させたHD画像の予測値として、軸逆変換部8に出力する。
【0083】
軸逆変換部8は、軸計算部3からの軸データとしての変換行列を受信し、その逆行列(逆変換行列)を求める。さらに、軸逆変換部8は、画素値予測部7からの画素値(HD画像の画素値の予測値)を、逆変換行列によって逆変換する。即ち、画素値予測部7が出力するHD画像の画素値は、XYZ軸上で表現されたものとなっているため、軸逆変換部8は、そのXYZ軸上で表現された画素値を、逆変換行列によって逆変換することにより、RGB軸上で表現されたものに変換する。軸逆変換部8によって逆変換された画素値は、予測画像用メモリ9に供給される。
【0084】
予測画像用メモリ9は、軸逆変換部8からのHD画素の画素値を、そのHD画素の位置に対応するアドレスに記憶し、例えば、1フレーム分の画素値を記憶すると、その1フレーム分の画素値で構成されるHD画像(の予測値)を出力する。
【0085】
次に、図9のフローチャートを参照して、図4の予測装置の処理(予測処理)について説明する。
【0086】
RGBで表現される画素値を有するSD画像が、フレーム(フィールド)単位で、入力画像用メモリ1に供給され、入力画像用メモリ1では、ステップS1において、そこに供給されるSD画像が記憶され、ステップS2に進む。
【0087】
ステップS2では、タップ構成部2が、入力画像用メモリ1に記憶されたSD画像の解像度を向上させたHD画像(予測装置では、このHD画像は、実際には存在しないが、仮想的に想定される)を構成する画素のうち、例えば、ラスタスキャン順で、まだ注目画素としていない画素を、注目画素とする。さらに、タップ構成部2は、注目画素の位置に対応するSD画像の位置から空間的または時間的に近い位置にある幾つかのSD画素を、入力画像用メモリ1のSD画像から選択し、予測タップ、クラスタップ、および軸計算タップを構成する。タップ構成部2で得られた軸計算タップは、軸計算部3に、予測タップおよびクラスタップは、軸変換部4に、それぞれ供給される。
【0088】
そして、ステップS3に進み、軸計算部3が、タップ構成部2から供給される軸計算タップ(を構成するSD画素の画素値)に基づいて主成分分析を行うことにより、第1主成分の方向をX軸に、第2主成分の方向をY軸に、第3主成分の方向をZ軸に、それぞれ設定する。さらに、軸計算部3は、RGB軸で表現される画素値を、XYZ軸で表現される画素値に変換するための変換行列を求め、これを、軸データとして、軸変換部4および軸逆変換部8に供給する。
【0089】
軸変換部4は、ステップS4において、タップ構成部2から供給される予測タップを構成するSD画素の画素値を、軸計算部3からの軸データとしての変換行列によって軸変換することにより、XYZ軸上で表現される画素値とし、さらに、図6(B)に示したような軸変換後予測タップを構成して、画素値予測部7に供給する。さらに、軸変換部4は、ステップS4において、タップ構成部2から供給されるクラスタップを構成するSD画素の画素値を、軸計算部3からの軸データとしての変換行列によって軸変換することにより、XYZ軸上で表現される画素値とし、そのような画素値で構成される軸変換後クラスタップを、クラス分類部5に供給する。
【0090】
そして、ステップS5に進み、クラス分類部5は、軸変換部4から供給される軸変換後クラスタップに基づいて、図7(B)で説明したようなクラス分類を行うことにより、注目画素を、512クラスのうちのいずれかのクラスにクラス分けし、そのクラスに対応するクラスコードを、係数メモリ6に、アドレスとして供給する。これにより、係数メモリ6からは、そのクラスコードに対応するアドレスに記憶されているタップ係数が読み出され、画素値予測部7に供給される。
【0091】
画素値予測部7は、ステップS6において、軸変換部4から供給される予測タップと、係数メモリ6から供給されるタップ係数とを用いて、式(1)に示した線形予測演算を行い、その結果得られる画素値を、注目画素の予測値として、軸逆変換部8に供給して、ステップS7に進む。
【0092】
ステップS7では、軸逆変換部8が、軸計算部3から供給される、注目画素について計算された軸データとしての変換行列に基づいて、逆変換行列を求め、その逆変換行列によって、画素値予測部7から供給されるXYZ空間上の画素値を、RGB空間上のものに逆変換する。このRGB空間上の画素値は、軸逆変換部8から予測画像用メモリ9に供給されて記憶される。
【0093】
その後、ステップS8に進み、タップ構成部2は、入力画像用メモリ1に記憶された1フレーム分のSD画像に対応するHD画像を構成するHD画素すべてを注目画素として処理を行ったかどうかを判定する。ステップS8において、入力画像用メモリ1に記憶された1フレーム分のSD画像に対応するHD画像を構成するHD画素のうち、まだ注目画素としていないものがあると判定された場合、ステップS2に戻り、ラスタスキャン順で、まだ注目画素としていないHD画素を、新たな注目画素として、以下、同様の処理が繰り返される。
【0094】
また、ステップS8において、入力画像用メモリ1に記憶された1フレーム分のSD画像に対応するHD画像を構成するHD画素すべてを、注目画素としたと判定された場合、即ち、予測画像用メモリ9に、入力画像用メモリ1に記憶された1フレームのSD画像の画質を向上させたHD画像が記憶された場合、ステップS9に進み、予測画像用メモリ9は、その1フレームのHD画像を読み出して出力し、処理を終了する。
【0095】
なお、図9の予測処理は、図4の予測装置に、1フレームのSD画像が供給されるごとに、その1フレームのSD画像について行われる。
【0096】
次に、図10は、図4の係数メモリ6に記憶されているクラスごとのタップ係数を求める学習処理を行う学習装置としてのデータ処理装置の一実施の形態の構成例を示している。
【0097】
教師画像用メモリ11には、教師データとしてのHD画像(以下、適宜、教師画像という)が、例えば、フレーム(またはフィールド)単位で供給され、教師画像用メモリ11は、そこに供給される教師画像を順次記憶する。
【0098】
生徒画像用メモリ12には、生徒データとしてのSD画像(以下、適宜、生徒画像という)が、例えば、フレーム(フィールド)単位で供給され、生徒画像用メモリ12は、そこに供給される生徒画像を順次記憶する。
【0099】
なお、図4の予測装置において、例えば、前述の図1に示したように、SD画像の解像度を、その横および縦のいずれの方向についても2倍にしたHD画像を得る場合には、生徒画像は、教師画像の横および縦の画素数を、いずれも1/2に間引いて生成される。
【0100】
タップ構成部13は、教師画像用メモリ11に記憶された教師画像としてのHD画像を構成する所定の画素を、順次、注目画素とし、その注目画素の位置に対応するSD画像の位置から空間的または時間的に近い位置にある幾つかのSD画素を、生徒画像用メモリ12に記憶された生徒画像としてのSD画像から選択することによって、図4のタップ構成部2と同一の軸計算タップ、予測タップ、およびクラスタップを構成する。軸計算タップは、軸計算部14に供給され、予測タップおよびクラスタップは、軸変換部15に供給される。
【0101】
軸計算部14は、タップ構成部13からの軸計算タップに基づいて、図4の軸計算部3における場合と同様にして、RGB軸をXYZ軸に変換するための軸データとしての変換行列を求め、軸変換部15に供給する。
【0102】
軸変換部15は、タップ構成部13から供給される予測タップとクラスタップを、軸計算部14から供給される軸データとしての変換行列にしたがってそれぞれ変換することにより、図4の軸変換部4における場合と同一の軸変換後予測タップと軸変換後クラスタップをそれぞれ構成する。そして、軸変換部15は、軸変換後予測タップを、正規方程式生成部17に供給し、軸変換後クラスタップを、クラス分類部16に供給する。
【0103】
さらに、軸変換部15は、注目画素となっているHD画素の画素値を、教師画像用メモリ11から読み出し、その画素値を、軸計算部14から供給される軸データとしての変換行列にしたがって変換することにより、RGB軸で表現される値から、XYZ軸で表現される値に変換して、正規方程式生成部17に供給する。
【0104】
クラス分類部16は、軸変換部15からの軸変換後クラスタップに基づいて、図4のクラス分類部5と同様の処理を行うことで、注目画素をクラス分類し、その結果得られるクラスコードを、正規方程式生成部17に供給する。
【0105】
正規方程式生成部17は、軸変換部15から供給される、XYZ軸上で表現された教師画像を構成するHD画素(教師画素)と、同じく軸変換部15から供給される軸変換後予測タップ(を構成する生徒画像のSD画素(生徒画素))とを対象とした足し込みを、クラス分類部16から供給されるクラスコードごとに行う。
【0106】
即ち、正規方程式生成部17は、クラス分類部16から供給されるクラスコードに対応するクラスごとに、予測タップ(生徒画素)を用い、式(8)の行列Aにおける各コンポーネントとなっている、生徒画素どうしの乗算(xinim)と、サメーション(Σ)に相当する演算を行う。
【0107】
さらに、正規方程式生成部17は、やはり、クラス分類部16から供給されるクラスコードに対応するクラスごとに、予測タップ(生徒画素)および注目画素(教師画素)を用い、式(8)のベクトルvにおける各コンポーネントとなっている、生徒画素と注目画素(教師画素)の乗算(xini)と、サメーション(Σ)に相当する演算を行う。
【0108】
正規方程式生成部17は、以上の足し込みを、教師画像用メモリ11に記憶された教師画素すべてを、注目画素として行い、これにより、クラスごとに、式(8)に示した正規方程式をたてる。
【0109】
係数計算部18は、正規方程式生成部17においてクラスごとに生成された正規方程式を解くことにより、クラスごとのタップ係数を求める。
【0110】
なお、教師画像として用意する画像の数(フレーム数)や、その画像の内容等によっては、正規方程式生成部17において、タップ係数を求めるのに必要な数の正規方程式が得られないクラスが生じる場合があり得るが、係数計算部18は、そのようなクラスについては、例えば、デフォルトのタップ係数を出力する。
【0111】
次に、図11のフローチャートを参照して、図10の学習装置の処理(学習処理)について説明する。
【0112】
RGBで表現される画素値を有する教師画像としてのHD画像が、フレーム(フィールド)単位で、教師画像用メモリ11に順次供給されるとともに、その教師画像から生成された生徒画像としてのSD画像が、フレーム(フィールド)単位で、生徒画像用メモリ12に順次供給され、ステップS11では、教師画像用メモリ11が、そこに供給される教師画像を順次記憶するとともに、生徒画像用メモリ12が、そこに供給される生徒画像を順次記憶し、ステップS12に進む。
【0113】
ステップS12では、タップ構成部13が、教師画像用メモリ11に記憶され教師画像を構成する教師画素のうち、例えば、ラスタスキャン順で、まだ注目画素としていない画素を、注目画素とする。さらに、タップ構成部13は、注目画素の位置に対応するSD画像の位置から空間的または時間的に近い位置にある幾つかのSD画素を、生徒画像用メモリ12の生徒画像を構成する生徒画素から選択し、予測タップ、クラスタップ、および軸計算タップを構成する。タップ構成部13で得られた軸計算タップは、軸計算部14に、予測タップおよびクラスタップは、軸変換部15に、それぞれ供給される。
【0114】
そして、ステップS13に進み、軸計算部14が、タップ構成部13から供給される軸計算タップ(を構成する生徒画素の画素値)に基づいて主成分分析を行うことにより、第1主成分の方向をX軸に、第2主成分の方向をY軸に、第3主成分の方向をZ軸に、それぞれ設定する。さらに、軸計算部14は、RGB軸で表現される画素値を、XYZ軸で表現される画素値に変換するための変換行列を求め、これを、軸データとして、軸変換部15に供給する。
【0115】
軸変換部15は、ステップS14において、タップ構成部13から供給される予測タップを構成する生徒画素の画素値を、軸計算部14からの軸データとしての変換行列によって軸変換することにより、XYZ軸上で表現される画素値とし、さらに、図6(B)に示したような軸変換後予測タップを構成して、正規方程式生成部17に供給する。さらに、軸変換部15は、ステップS14において、タップ構成部13から供給されるクラスタップを構成する生徒画素の画素値を、軸計算部14からの軸データとしての変換行列によって軸変換することにより、XYZ軸上で表現される画素値とし、そのような画素値で構成される軸変換後クラスタップを、クラス分類部16に供給する。また、軸変換部15は、注目画素となっている教師画素の画素値を、教師画像用メモリ11から読み出し、その画素値を、軸計算部14から供給される軸データとしての変換行列にしたがって変換することにより、RGB軸で表現される値から、XYZ軸で表現される値に変換して、正規方程式生成部17に供給する。
【0116】
そして、ステップS5に進み、クラス分類部16は、軸変換部15から供給される軸変換後クラスタップに基づいて、図7(B)で説明したようなクラス分類を行うことにより、注目画素を、512クラスのうちのいずれかのクラスにクラス分けし、そのクラスに対応するクラスコードを、正規方程式生成部17に供給し、ステップS16に進む。
【0117】
ステップS16では、正規方程式生成部17は、式(8)に示した正規方程式をたてる。即ち、正規方程式生成部17は、軸変換部15からの予測タップ(を構成する生徒画素)と、同じく軸変換部15からの注目画素(教師画素)を対象として、式(8)の行列Aとベクトルvの、上述したような足し込みを、クラス分類部16からのクラスコードごとに行う。
【0118】
そして、ステップS17に進み、教師画像用メモリ11に記憶された教師画像を構成する教師画素すべてを注目画素として、足し込みを行ったかどうかが判定され、まだ、教師画素のすべてを注目画素として、足し込みを行っていないと判定された場合、ステップS12に戻る。この場合、まだ、注目画素されていない教師画素のうちの1つが、新たに注目画素とされ、以下、同様の処理が繰り返される。
【0119】
また、ステップS17において、教師画素すべてを注目画素として、足し込みを行ったと判定された場合、ステップS18に進み、係数計算部18は、その足しこみによってクラスごとに生成された正規方程式を解くことにより、クラスごとのタップ係数を求める。そして、ステップS19に進み、係数計算部18は、上述のようにして、クラスごとに求めたタップ係数を出力し、処理を終了する。
【0120】
次に、図12は、RGB軸上で表現された画素値をそのまま用いて、予測処理を行った場合に得られる予測画像と、図4の予測装置において予測処理を行った場合、即ち、RGB軸上で表現された画素値をXYZ軸上で表現された画素値に変換して、予測処理を行った場合に得られる予測画像のSNR(Signal to Noise Ratio)を計測したシミュレーション結果を示している。
【0121】
なお、XYZ軸上で表現された画素値を用いた予測処理では、予測タップは、図6(B)に示したように、29画素のX成分、9画素のY成分、および1画素のZ成分の合計で39タップで構成し、クラス分類におけるクラス数は、図7で説明したように、512クラスとした。一方、RGB軸上で表現された画素値を用いた予測処理では、予測タップは、13画素のR,G,B成分である39タップで構成し、クラス分類におけるクラス数は、512クラスとした。
【0122】
従って、RGB軸上で表現された画素値を用いた予測処理と、XYZ軸上で表現された画素値を用いた予測処理のシミュレーションにおいて、予測タップを構成するタップ数、およびクラス数は、いずれも同一である。
【0123】
しかしながら、図12のシミュレーション結果から明らかなように、XYZ軸上で表現された画素値を用いた予測処理による方は、クラス分けが精度良く行われている結果、RGB軸上で表現された画素値を用いた予測処理よりも、SNRの高いHD画像を得ることができている。
【0124】
なお、図12は、6種類の異なる画像A,B,C,D,E,FそれぞれのSNRを示している。また、図12に示した値の単位は、dBである。
【0125】
次に、図13は、本発明を適用した伝送システム(システムとは、複数の装置が論理的に集合した物をいい、各構成の装置が同一筐体中にあるか否かは問わない)の一実施の形態の構成例を示している。
【0126】
この画像伝送システムは、送信装置21および受信装置22で構成されており、送信装置21は、符号化対象としての、例えば、画像を符号化して符号化データを出力し、受信装置22は、その符号化データを、元の画像に復号する。
【0127】
即ち、送信装置21は、符号化対象の画像の予測値としての予測画像を求め、その予測画像の、元の画像に対する予測誤差を求める。そして、この予測誤差は、符号化データとして、例えば、半導体メモリ、光磁気ディスク、磁気ディスク、光ディスク、磁気テープ、相変化ディスクなどでなる記録媒体23に記録され、あるいは、また、例えば、地上波、衛星回線、CATV(Cable Television)網、インターネット、公衆回線などでなる伝送媒体24を介して伝送され、受信装置22に提供される。
【0128】
受信装置22は、記録媒体23または伝送媒体24を介して提供される符号化データを受信する。そして、受信装置22は、その符号化データを、元の画像に復号し、例えば、図示せぬモニタに供給して表示させる。
【0129】
次に、図14は、図13の送信装置21の構成例を示している。
【0130】
符号化対象の画像は、例えば、RGB空間で表現されるもので、フレームメモリ31に順次供給されるようになっている。そして、フレームメモリ31は、そこに供給される画像を順次記憶する。
【0131】
予測部32は、フレームメモリ31に記憶された画像のフレームを、順次、注目フレームとし、さらに、注目フレームを構成する画素を、例えば、ラスタスキャン順に、順次、注目画素として、その画素値のXYZ空間における予測値を求める。
【0132】
即ち、予測部32は、軸計算部41、軸変換部42、および重み付け平均部43から構成されている。
【0133】
軸計算部41は、注目画素の位置から空間的または時間的に近い位置にある画素であって、既に、注目画素として処理された幾つかの画素を、フレームメモリ31から選択し、軸計算タップとする。さらに、軸計算部41は、その軸計算タップに基づいて、図4の軸計算部3における場合と同様に、RGB軸上で表現される画素値を、XYZ空間上で表現されるものに変換するための変換行列を求め、軸データとして、軸変換部42に供給する。
【0134】
軸変換部42は、フレームメモリ31から注目画素の位置から空間的または時間的に近い位置にある画素であって、既に、注目画素として処理された幾つかの画素を、フレームメモリ31から選択し、その選択した画素(以下、適宜、選択画素という)の画素値を、軸計算部41からの軸データとしての変換行列にしたがって変換する。即ち、軸変換部42は、RGB軸上で表現される選択画素の画素値を、XYZ軸上で表現されるものに変換する。この変換後の選択画素は、軸変換部42から重み付け平均部43に供給される。
【0135】
重み付け平均部43は、軸変換部42から供給される複数の選択画素の画素値の重み付け平均値を計算し、その重み付け平均値を、注目画素の画素値の予測値として、予測誤差算出部33に供給する。即ち、重み付け平均部43は、例えば、複数の選択画素それぞれに対して、注目画素からの距離の逆数に比例する重みを付し、その平均値を演算する。そして、重み付け平均部43は、その平均値を、注目画素の画素値の予測値として、予測誤差算出部33に供給する。
【0136】
なお、ここでは、注目画素の周辺に位置する複数の画素の重み付け平均値を、その注目画素の予測値とするようにしたが、その他、例えば、簡易的には、注目画素の左や上に隣接する画素の画素値(但し、XYZ軸上で表現される画素値)を、そのまま予測値として用いるようにすることも可能である。
【0137】
予測誤差算出部33は、XYZ空間において、予測部32からの予測値の、注目画素の画素値(真値)に対する予測誤差を求める。
【0138】
即ち、予測誤差算出部33は、軸計算部51、軸変換部52、および誤差計算部53から構成されている。
【0139】
軸計算部51は、軸計算部41と同様にして、軸データとしての変換行列を求め、軸変換部52に供給する。軸変換部52は、フレームメモリ31から注目画素を読み出し、その画素値を、軸計算部51からの軸データとしての変換行列にしたがって変換する。即ち、軸変換部52は、RGB軸上で表現される注目画素の画素値を、XYZ軸上で表現されるものに変換する。この変換後の注目画素は、軸変換部52から誤差計算部53に供給される。
【0140】
誤差計算部53は、予測部32から供給される予測値から、軸変換部52から供給される注目画素の真値を減算することにより、XYZ空間における予測誤差を求め、フレームメモリ34に供給する。
【0141】
フレームメモリ34は、予測誤差算出部33から供給される注目画素についての予測誤差を、その注目画素の位置に対応するアドレスに記憶する。
【0142】
エントロピー符号化部35は、例えば、フレームメモリ34から、1フレームの予測誤差を読み出し、その1フレームの予測誤差を、ハフマン符号化等のエントロピー符号化する。そして、エントロピー符号化部35は、その結果得られる符号化データを出力する。
【0143】
なお、予測部32を構成する軸計算部41と、予測誤差算出部33を構成する軸計算部51とは、いずれか一方によって兼用するようにすることが可能である。同様に、予測部32を構成する軸変換部42と、予測語算出部33を構成する軸変換部52も、いずれか一方によって兼用するようにすることが可能である。
【0144】
次に、図15のフローチャートを参照して、図14の送信装置21の処理(符号化処理)について説明する。
【0145】
符号化対象の画像は、ステップS21において、フレームメモリ31に供給されて記憶され、ステップS22に進む。
【0146】
ステップS22では、軸計算部41および51が、フレームメモリ31に記憶された画像のフレームを、注目フレームとし、さらに、注目フレームを構成する画素のうちの、ラスタスキャン順で、まだ注目画素とされていないものを、注目画素とし、その注目画素についての軸計算タップを、フレームメモリ31から所定の画素を読み出すことで構成する。そして、ステップS23に進み、軸計算部41および51は、軸計算タップに基づいて、RGB軸上で表現される画素値を、XYZ空間上で表現されるものに変換するための変換行列を求める。軸計算部41は、軸データを、軸変換部42に供給し、軸計算部51は、軸データを、軸変換部52に供給して、ステップS24に進む。
【0147】
ステップS24では、軸変換部42は、注目画素の位置から空間的または時間的に近い位置にある画素であって、既に、注目画素として処理された幾つかの画素を、フレームメモリ31から選択し、その複数の選択画素の画素値を、軸計算部41からの軸データとしての変換行列にしたがって変換する。そして、軸変換部42は、その変換によって得られる、XYZ軸上で表現される選択画素の画素値を、重み付け平均部43に供給する。
【0148】
さらに、ステップS24では、軸変換部52が、フレームメモリ31から注目画素を読み出し、その画素値を、軸計算部51からの軸データとしての変換行列にしたがって変換する。そして、軸変換部52は、その変換によって得られる、、XYZ軸上で表現される注目画素の画素値を、誤差計算部53に供給する。
【0149】
その後、ステップS25に進み、重み付け平均部43は、軸変換部42から供給される複数の選択画素の画素値の重み付け平均値を計算し、その重み付け平均値を、注目画素の画素値の予測値として、予測誤差算出部33の誤差計算部53に供給して、ステップS26に進む。
【0150】
ステップS26では、誤差計算部53が、予測部32の重み付け平均部43から供給される予測値から、軸変換部52から供給される注目画素の真値を減算することにより、XYZ空間における予測誤差を求める。この予測誤差は、誤差計算部53からフレームメモリ34に供給され、注目画素の位置に対応するアドレスに記憶される。
【0151】
そして、ステップS27に進み、軸計算部41および51は、注目フレームを構成する画素すべてを注目画素として処理を行ったかどうかを判定する。ステップS27において、注目フレームを構成する画素のうち、まだ注目画素としていないものがあると判定された場合、ステップS22に戻り、ラスタスキャン順で、まだ注目画素としていないものを、新たな注目画素として、以下、同様の処理が繰り返される。
【0152】
また、ステップS27において、注目フレームを構成する画素すべてを、注目画素としたと判定された場合、即ち、フレームメモリ34に、1フレーム分の予測誤差が記憶された場合、ステップS28に進み、エントロピー符号化部35は、フレームメモリ34から、その1フレーム分の予測誤差を読み出して、エントロピー符号化し、その結果得られる符号化データを出力して、処理を終了する。
【0153】
なお、図15の符号化処理は、送信装置21に、1フレームの画像が供給されるごとに、その1フレームの画像を、注目フレームとして行われる。
【0154】
次に、図16は、図13の受信装置22の構成例を示している。
【0155】
送信装置21からの符号化データは、エントロピー復号部61で受信されるようになっており、エントロピー復号部61は、受信した符号化データをエントロピー復号し、その結果得られる予測誤差で構成される画像(以下、適宜、誤差画像という)を、フレームメモリ62に供給する。
【0156】
フレームメモリ62は、エントロピー復号部61から供給される誤差画像を、例えば、フレーム(フィールド)単位で記憶する。
【0157】
復号部63は、フレームメモリ62に記憶された誤差画像のフレームを、順次、注目フレームとするとともに、その注目フレームを構成する画素を、送信装置21における場合と同様に、ラスタスキャン順で、順次、注目画素として、その注目画素を復号する。
【0158】
即ち、復号部63は、加算部71、軸計算部72、および軸逆変換部73で構成される。
【0159】
加算部71は、予測部65から供給される、XYZ軸上で表現される注目画素の予測値と、フレームメモリ62に記憶された注目画素の予測誤差とを加算することで、XYZ軸上で表現される注目画素の画素値を復号し、軸逆変換部73に供給する。
【0160】
軸計算部72は、注目画素について、既に復号され、フレームメモリ64に記憶された画素から、図14の軸計算部41(51)における場合と同一の画素を選択し、軸計算タップとする。さらに、軸計算部72は、その軸計算タップに基づいて、図14の軸計算部41における場合と同様に、RGB軸上で表現される画素値を、XYZ空間上で表現されるものに変換するための変換行列を求め、さらに、その逆行列(逆変換行列)を求めて、軸逆変換部73に供給する。
【0161】
軸逆変換部73は、加算部71からの画素値を、軸計算部72からの逆変換行列にしたがって変換する。即ち、加算部71が出力する注目画素の復号値は、XYZ軸上で表現されたものとなっているため、軸逆変換部73は、そのXYZ軸上で表現された画素値を、逆変換行列によって逆変換することにより、RGB軸上で表現されたものに変換する。軸逆変換部73における逆変換の結果得られる注目画素の復号値は、フレームメモリ64に供給される。
【0162】
フレームメモリ64は、復号部63の軸逆変換部73から供給される注目画素の復号値を、その注目画素の位置に対応するアドレスに記憶する。
【0163】
予測部65は、フレームメモリ64に記憶された、既に復号された画素値に基づいて、注目画素の予測値であって、XYZ軸上で表現されるものを求め、復号部63の加算部71に供給する。
【0164】
即ち、予測部65は、軸計算部81、軸変換部82、および重み付け平均部83で構成されており、この軸計算部81、軸変換部82、または重み付け平均部83は、図14の予測部32を構成する軸計算部41、軸変換部42、または重み付け平均部43と、それぞれ同様に構成されている。従って、予測部65は、フレームメモリ64に記憶された、既に復号された画素値を用いて、図14の予測部32と同様の処理を行うことで、XYZ軸上で表現される注目画素の予測値を求め、復号部63の加算部71に供給する。
【0165】
次に、図17のフローチャートを参照して、図16の受信装置22の処理(復号処理)について説明する。
【0166】
エントロピー復号部61は、符号化データを受信し、ステップS31において、その受信した符号化データをエントロピー復号する。このエントロピー復号の結果得られる誤差画像は、ステップS32において、エントロピー復号部61からフレームメモリ62に供給されて記憶される。
【0167】
そして、軸計算部72および81は、フレームメモリ62に記憶された誤差画像のフレームを注目フレームとし、その注目フレームの誤差画像を構成する画素のうち、ラスタスキャン順で、まだ、注目画素とされていないものを、注目画素とする。さらに、軸計算部72および81は、ステップS33において、注目画素について、既に復号され、フレームメモリ64に記憶された画素から、図14の軸計算部41(51)における場合と同一の画素を選択し、軸計算タップを構成する。そして、ステップS34に進み、軸計算部72は、その軸計算タップに基づいて、図14の軸計算部41における場合と同様にして、RGB軸上で表現される画素値を、XYZ空間上で表現されるものに変換するための変換行列を求め、さらに、その逆行列(逆変換行列)を求めて、軸逆変換部73に供給する。また、ステップS34では、軸計算部81が、軸計算部72と同様にして、変換行列を求め、軸変換部82に供給する。
【0168】
軸変換部82は、ステップS35において、フレームメモリ64に記憶された、既に復号された画素値から、図14の軸変換部42が、注目画素について選択するのと同一の位置関係にある画素(選択画素)の画素値を選択し、その選択画素の画素値を、軸計算部81からの軸データとしての変換行列にしたがって変換する。即ち、軸変換部82は、RGB軸上で表現される選択画素の画素値を、XYZ軸上で表現されるものに変換し、重み付け平均部83に供給する。
【0169】
重み付け平均部83は、ステップS36において、軸変換部82から供給される複数の選択画素の画素値の重み付け平均値を、図14の重み付け平均部43における場合と同様にして計算し、その重み付け平均値を、注目画素の画素値の予測値として、復号部63の加算部71に供給する。
【0170】
加算部71は、ステップS37において、予測部65の重み付け平均部83から供給される、XYZ軸上で表現される注目画素の予測値と、フレームメモリ62に記憶された注目画素の予測値とを加算することで、XYZ軸上で表現される注目画素の画素値を復号し、軸逆変換部73に供給する。
【0171】
軸逆変換部73は、ステップS38において、加算部71からの画素値を、軸計算部72からの逆変換行列にしたがって変換することにより、XYZ軸上で表現された注目画素の画素値を、RGB軸上で表現されたものに変換する。軸逆変換部73における逆変換の結果得られる注目画素の復号値は、フレームメモリ64に供給され、注目画素の位置に対応するアドレスに記憶される。
【0172】
そして、ステップS39に進み、加算部71は、注目フレームを構成する画素すべてを注目画素として処理を行ったかどうかを判定する。ステップS39において、注目フレームを構成する画素のうち、まだ注目画素としていないものがあると判定された場合、ステップS33に戻り、ラスタスキャン順で、まだ注目画素としていないものを、新たな注目画素として、以下、同様の処理が繰り返される。
【0173】
また、ステップS39において、注目フレームを構成する画素すべてを、注目画素としたと判定された場合、即ち、フレームメモリ64に、1フレーム分の復号画素が記憶された場合、その1フレームの復号画素で構成される画像(復号画像)が、フレームメモリ64から出力され、処理を終了する。
【0174】
なお、図17の復号処理は、フレームメモリ62に、1フレームの誤差画像が記憶されるごとに、その1フレームの誤差画像のフレームを、注目フレームとして行われる。
【0175】
次に、上述の場合においては、注目画素の周辺の画素の重み付け平均値を、注目画素の予測値とするようにしたが、予測値は、クラス分類適応処理によって求めることも可能である。
【0176】
即ち、図14の送信装置21における予測部32、および図16の受信装置22における予測部65は、図4の予測装置で構成することが可能である。なお、図4の予測装置によって、予測部32および65を構成する場合には、予測装置を構成する軸逆変換部8と、予測画像用メモリ9は不要である。また、上述の場合には、図4の予測装置では、HD画像を構成する画素の予測値を求めるようになっていたが、予測部32や65として使用する場合には、符号化しようとする画素の予測値を求めることとなる。従って、この場合、図4の予測装置の係数メモリ6に記憶させるタップ係数は、図10の学習装置において、同一の画像を、教師画像および生徒画像とするとともに、軸変換部42(82)で選択画素とされる画素を予測タップとして学習処理を行うことにより求める必要がある。また、図4の予測装置では、タップ構成部2において、軸変換部42(82)で選択される画素を、予測タップとして選択させる必要がある。
【0177】
次に、図18は、RGB軸で表現される画素値をそのまま用いて予測値を求め、その予測値の予測誤差をエントロピー符号化した場合(図18において、「RGB軸」と示す)と、RGB軸で表現される画素値をXYZ軸上で表現されるものに変換してから予測値を求め、その予測値の予測誤差をエントロピー符号化した場合(図18において、「主成分軸」と示す)との圧縮率を、予測方式を変えて求めた、2種類の画像AとBについてのシミュレーション結果を示している。
【0178】
なお、予測方式としては、注目画素の上に隣接する画素の画素値を予測値とする方式(図18において、「垂直」と示す)、注目画素の左に隣接する画素の画素値を予測値とする方式(図18において、「水平」と示す)、およびクラス分類適応処理によって予測値を求める方式(図18において、「クラス分類適応予測」と示す)の3方式を用いた。
【0179】
また、クラス分類適応処理では、RGB軸で表現される画素値をそのまま用いて予測値を求める場合には、クラスタップは、図19(A)に示すような、注目画素(図中、×印を付してある○印)の周辺にある8画素のR,G,B成分の合計24値から構成し、さらに、クラス分類は、8画素のR,G,B成分すべてを対象に、ダイナミックレンジDRを求め、その後、その8画素のうちの、注目画素の上、左、左上にそれぞれ隣接する3画素のR,G,B成分の合計9値を、DR/2で量子化することにより行った。従って、この場合、全クラス数は、512(=29)クラスである。また、予測タップは、図19(B)に示すような、注目画素(図中、×印を付してある○印)の周辺の8画素のR,G,B成分の合計24値から構成した。
【0180】
一方、クラス分類適応処理において、RGB軸で表現される画素値をXYZ軸で表現される画素値に変換してから予測値を求める場合には、クラスタップは、図19(A)における場合と同様に、8画素から構成し、さらに、クラス分類は、図20(A)に示すように、その8画素のX成分のみに、1ビットADRC処理を施すことにより行った。従って、この場合、全クラス数は、256(=28)クラスであり、RGB軸で表現される画素値をそのまま用いて予測値を求める場合のクラス数である512クラスよりも少ない。また、予測タップは、図20(B)に示すような、注目画素(図中、×印を付してある○印)の周辺の8画素のX,Y,Z成分の合計24値から構成した。
【0181】
図18のシミュレーション結果から、注目画素に隣接する画素の画素値を、そのまま、注目画素の予測値とするよりは、クラス分類適応処理によって予測値を求めた方が、圧縮率が高くなることが分かる。さらに、RGB軸で表現される画素値を用いるよりも、その画素値を、XYZ軸で表現したものを用いた方が、圧縮率が高くなることが分かる。
【0182】
次に、上述した一連の処理は、ハードウェアにより行うこともできるし、ソフトウェアにより行うこともできる。一連の処理をソフトウェアによって行う場合には、そのソフトウェアを構成するプログラムが、汎用のコンピュータ等にインストールされる。
【0183】
そこで、図21は、上述した一連の処理を実行するプログラムがインストールされるコンピュータの一実施の形態の構成例を示している。
【0184】
プログラムは、コンピュータに内蔵されている記録媒体としてのハードディスク105やROM103に予め記録しておくことができる。
【0185】
あるいはまた、プログラムは、フロッピーディスク、CD-ROM(Compact Disc Read Only Memory),MO(Magneto optical)ディスク,DVD(Digital Versatile Disc)、磁気ディスク、半導体メモリなどのリムーバブル記録媒体111に、一時的あるいは永続的に格納(記録)しておくことができる。このようなリムーバブル記録媒体111は、いわゆるパッケージソフトウエアとして提供することができる。
【0186】
なお、プログラムは、上述したようなリムーバブル記録媒体111からコンピュータにインストールする他、ダウンロードサイトから、ディジタル衛星放送用の人工衛星を介して、コンピュータに無線で転送したり、LAN(Local Area Network)、インターネットといったネットワークを介して、コンピュータに有線で転送し、コンピュータでは、そのようにして転送されてくるプログラムを、通信部108で受信し、内蔵するハードディスク105にインストールすることができる。
【0187】
コンピュータは、CPU(Central Processing Unit)102を内蔵している。CPU102には、バス101を介して、入出力インタフェース110が接続されており、CPU102は、入出力インタフェース110を介して、ユーザによって、キーボードや、マウス、マイク等で構成される入力部107が操作等されることにより指令が入力されると、それにしたがって、ROM(Read Only Memory)103に格納されているプログラムを実行する。あるいは、また、CPU102は、ハードディスク105に格納されているプログラム、衛星若しくはネットワークから転送され、通信部108で受信されてハードディスク105にインストールされたプログラム、またはドライブ109に装着されたリムーバブル記録媒体111から読み出されてハードディスク105にインストールされたプログラムを、RAM(Random Access Memory)104にロードして実行する。これにより、CPU102は、上述した図9や、図11、図15、図17のフローチャートにしたがった処理、あるいは上述した図4、図10、図13、図14、図16のブロック図の構成により行われる処理を行う。そして、CPU102は、その処理結果を、必要に応じて、例えば、入出力インタフェース110を介して、LCD(Liquid CryStal Display)やスピーカ等で構成される出力部106から出力、あるいは、通信部108から送信、さらには、ハードディスク105に記録等させる。
【0188】
ここで、本明細書において、コンピュータに各種の処理を行わせるためのプログラムを記述する処理ステップは、必ずしもフローチャートとして記載された順序に沿って時系列に処理する必要はなく、並列的あるいは個別に実行される処理(例えば、並列処理あるいはオブジェクトによる処理)も含むものである。
【0189】
また、プログラムは、1のコンピュータにより処理されるものであっても良いし、複数のコンピュータによって分散処理されるものであっても良い。さらに、プログラムは、遠方のコンピュータに転送されて実行されるものであっても良い。
【0190】
なお、予測タップ、クラスタップ、および軸計算タップの構成パターンは、上述したパターンに限定されるものではない。
【0191】
また、本実施の形態では、軸計算タップを構成する画素の分布の方向を、主成分分析によって求め、その主成分の方向を新たな軸とするようにしたが、その他、例えば、軸計算タップを構成する画素のうちの任意の2画素間の距離を計算し、その距離を最も長くする2画素によって決まる方向を、分布の拡がりが最も大きい方向として、近似的に、軸計算タップを構成する画素の分布の方向を求め、その方向に基づいて、新たな軸を設定するようにすることが可能である。
【0192】
さらに、本実施の形態では、タップ係数を用いた線形1次予測演算によって、予測値を求めるようにしたが、予測値は、その他、2次以上の高次の予測演算によって求めることも可能である。
【0193】
また、本実施の形態では、画像データを処理の対象としたが、その他、例えば、音声データ等を処理の対象とすることも可能である。
【0194】
さらに、図4の実施の形態では、クラスごとのタップ係数を、係数メモリ6に、あらかじめ記憶させておくようにしたが、タップ係数は、その他、例えば、処理するSD画像とともに、あるいは別に、外部から供給するようにすることが可能である。
【0195】
また、本実施の形態では、R,G,B値からなる画素を対象としたが、本発明は、その他の色空間で表現される画像にも適用可能である。
【0196】
【発明の効果】
本発明の第1のデータ処理装置およびデータ処理方法、並びに記録媒体によれば、データを表現する軸を、新たな軸に変換するのに用いる複数のデータとしての軸計算タップが構成され、その軸計算タップに基づいて、新たな軸が求められる。さらに、注目データをクラス分類するのに用いる複数のデータとしてのクラスタップが構成され、そのクラスタップとしての複数のデータが、新たな軸上で表現されるデータに変換される。そして、新たな軸上で表現されるクラスタップに基づいて、クラス分類が行われる。従って、効率的に、クラス分けを行うことが可能となる。
【0197】
本発明の第2のデータ処理装置およびデータ処理方法、並びに記録媒体によれば、第1のデータを表現する軸を、新たな軸に変換するのに用いる複数の第1のデータとしての軸計算タップが構成され、その軸計算タップに基づいて、新たな軸を求められる。さらに、予測対象の第2のデータを注目データとして、その注目データを幾つかのクラスのうちのいずれかにクラス分けするクラス分類を行うのに用いる複数の第1のデータとしてのクラスタップが構成されるとともに、注目データを予測するのに用いる複数の第1のデータとしての予測タップが構成され、クラスタップとしての複数の第1のデータと、予測タップとしての複数の第1のデータが、新たな軸上で表現されるデータに変換される。そして、新たな軸上で表現されるクラスタップに基づいて、注目データについてのクラス分類が行われ、新たな軸上で表現される予測タップを用い、注目データのクラスに対応する予測方法に基づいて、注目データの予測値であって、新たな軸上で表現されるものが求められる。従って、効率的なクラス分けが行われ、その結果、精度の良い予測値を求めることが可能となる。
【0198】
本発明の第3のデータ処理装置およびデータ処理方法、並びに記録媒体においては、第1と第2のデータを、それぞれ生徒データと教師データとして、生徒データおよび教師データを表現する軸を、新たな軸に変換するのに用いる複数の生徒データとしての軸計算タップが構成され、その軸計算タップに基づいて、新たな軸が求められる。さらに、注目している注目教師データを幾つかのクラスのうちのいずれかにクラス分けするクラス分類を行うのに用いる複数の生徒データとしてのクラスタップが構成されるとともに、注目教師データを予測するのに用いる複数の生徒データとしての予測タップが構成され、教師データ、クラスタップとしての複数の生徒データ、および予測タップとしての複数の生徒データが、新たな軸上で表現されるデータに変換される。そして、新たな軸上で表現されるクラスタップに基づいて、注目教師データについてのクラス分類が行われ、新たな軸上で表現される教師データと予測タップを用い、第2のデータを予測する予測方法が、クラスごとに学習される。従って、効率的な学習が可能となる。
【図面の簡単な説明】
【図1】SD画素とHD画素とを示す図である。
【図2】クラス分類適応処理を説明する図である。
【図3】RGB空間における画素値の分布を示す図である。
【図4】本発明を適用した予測装置の一実施の形態の構成例を示すブロック図である。
【図5】軸計算タップを示す図である。
【図6】予測タップを示す図である。
【図7】クラスタップを示す図である。
【図8】RGB空間では異なるクラスとされる分布が、XYZ空間では同一のクラスとされることを示す図である。
【図9】予測装置による予測処理を説明するフローチャートである。
【図10】本発明を適用した学習装置の一実施の形態の構成例を示すブロック図である。
【図11】学習装置による学習処理を説明するフローチャートである。
【図12】本件発明者によるシミュレーション結果を示す図である。
【図13】本発明を適用した伝送システムの一実施の形態の構成例を示す図である。
【図14】送信装置21の構成例を示すブロック図である。
【図15】送信装置21による符号化処理を説明するフローチャートである。
【図16】受信装置22の構成例を示すブロック図である。
【図17】受信装置22による復号処理を説明するフローチャートである。
【図18】本件発明者によるシミュレーション結果を示す図である。
【図19】シミュレーションに用いたクラスタップおよび予測タップ、並びにクラス分類の方法を説明する図である。
【図20】シミュレーションに用いたクラスタップおよび予測タップ、並びにクラス分類方法を説明する図である。
【図21】本発明を適用したコンピュータの一実施の形態の構成例を示すブロック図である。
【符号の説明】
1 入力画像用メモリ, 2 タップ構成部, 3 軸計算部, 4 軸変換部, 5 クラス分類部, 6 係数メモリ, 7 画素値予測部, 8 軸逆変換部, 9 予測画像用メモリ, 11 教師画像用メモリ, 12 生徒画像用メモリ, 13 タップ構成部, 14 軸計算部, 15 軸変換部, 16 クラス分類部, 17 正規方程式生成部, 18 係数計算部, 21送信装置, 22 受信装置, 23 記録媒体, 24 伝送媒体, 31フレームメモリ, 32 予測部, 33 予測誤差算出部, 34 フレームメモリ, 35 エントロピー符号化部, 41 軸計算部, 42 軸変換部, 43 重み付け平均部, 51 軸計算部, 52 軸変換部, 53 誤差計算部, 61 エントロピー復号部, 62 フレームメモリ, 63 復号部, 64 フレームメモリ, 65 予測部, 71 加算部, 72 軸計算部, 73 軸逆変換部, 81 軸計算部, 82 軸変換部, 83重み付け平均部, 101 バス, 102 CPU, 103 ROM, 104 RAM, 105 ハードディスク, 106 出力部, 107 入力部, 108 通信部, 109 ドライブ, 110 入出力インタフェース, 111 リムーバブル記録媒体

Claims (29)

  1. データを、幾つかのクラスのうちのいずれかにクラス分けするクラス分類を行うデータ処理装置であって、
    前記データを表現する軸を、新たな軸に変換するのに用いる複数のデータとしての軸計算タップを構成する軸計算タップ構成手段と、
    前記軸計算タップに基づいて、前記新たな軸を求める軸計算手段と、
    注目している注目データをクラス分類するのに用いる複数のデータとしてのクラスタップを構成するクラスタップ構成手段と、
    前記クラスタップとしての複数のデータを、前記新たな軸上で表現されるデータに変換するデータ変換手段と、
    前記新たな軸上で表現されるクラスタップに基づいて、前記注目データについてのクラス分類を行うクラス分類手段と
    を備えることを特徴とするデータ処理装置。
  2. 前記軸計算手段は、前記軸計算タップとしての複数のデータを主成分分析し、その主成分分析結果に基づいて、前記新たな軸を求める
    ことを特徴とする請求項1に記載のデータ処理装置。
  3. 前記軸計算手段は、前記軸計算タップとしての複数のデータのうちの任意の2つのデータどうしの間の距離を計算し、その距離に基づいて、前記新たな軸を求める
    ことを特徴とする請求項1に記載のデータ処理装置。
  4. 前記データは、画像データである
    ことを特徴とする請求項1に記載のデータ処理装置。
  5. 前記軸計算タップ構成手段またはクラスタップ構成手段は、前記注目データに対応する画素の周辺に位置する画素のデータを、前記軸計算タップまたはクラスタップとする
    ことを特徴とする請求項4に記載のデータ処理装置。
  6. データを、幾つかのクラスのうちのいずれかにクラス分けするクラス分類を行うデータ処理方法であって、
    前記データを表現する軸を、新たな軸に変換するのに用いる複数のデータとしての軸計算タップを構成する軸計算タップ構成ステップと、
    前記軸計算タップに基づいて、前記新たな軸を求める軸計算ステップと、
    注目している注目データをクラス分類するのに用いる複数のデータとしてのクラスタップを構成するクラスタップ構成ステップと、
    前記クラスタップとしての複数のデータを、前記新たな軸上で表現されるデータに変換するデータ変換ステップと、
    前記新たな軸上で表現されるクラスタップに基づいて、前記注目データについてのクラス分類を行うクラス分類ステップと
    を備えることを特徴とするデータ処理方法。
  7. データを、幾つかのクラスのうちのいずれかにクラス分けするクラス分類処理を、コンピュータに行わせるプログラムが記録されている記録媒体であって、
    前記データを表現する軸を、新たな軸に変換するのに用いる複数のデータとしての軸計算タップを構成する軸計算タップ構成ステップと、
    前記軸計算タップに基づいて、前記新たな軸を求める軸計算ステップと、
    注目している注目データをクラス分類するのに用いる複数のデータとしてのクラスタップを構成するクラスタップ構成ステップと、
    前記クラスタップとしての複数のデータを、前記新たな軸上で表現されるデータに変換するデータ変換ステップと、
    前記新たな軸上で表現されるクラスタップに基づいて、前記注目データについてのクラス分類を行うクラス分類ステップと
    を備えるプログラムが記録されている
    ことを特徴とする記録媒体。
  8. 第1のデータから第2のデータを予測するデータ処理装置であって、
    前記第1のデータを表現する軸を、新たな軸に変換するのに用いる複数の第1のデータとしての軸計算タップを構成する軸計算タップ構成手段と、
    前記軸計算タップに基づいて、前記新たな軸を求める軸計算手段と、
    予測対象の前記第2のデータを注目データとして、その注目データを幾つかのクラスのうちのいずれかにクラス分けするクラス分類を行うのに用いる複数の第1のデータとしてのクラスタップを構成するクラスタップ構成手段と、
    前記注目データを予測するのに用いる複数の第1のデータとしての予測タップを構成する予測タップ構成手段と、
    前記クラスタップとしての複数の第1のデータと、前記予測タップとしての複数の第1のデータを、前記新たな軸上で表現されるデータに変換する変換手段と、
    前記新たな軸上で表現されるクラスタップに基づいて、前記注目データについてのクラス分類を行うクラス分類手段と、
    前記新たな軸上で表現される予測タップを用い、前記注目データのクラスに対応する予測方法に基づいて、前記注目データの予測値であって、前記新たな軸上で表現されるものを求める予測手段と
    を備えることを特徴とするデータ処理装置。
  9. 前記軸計算手段は、前記軸計算タップとしての複数の第1のデータを主成分分析し、その主成分分析結果に基づいて、前記新たな軸を求める
    ことを特徴とする請求項8に記載のデータ処理装置。
  10. 前記軸計算手段は、前記軸計算タップとしての複数の第1のデータのうちの任意の2つのデータどうしの間の距離を計算し、その距離に基づいて、前記新たな軸を求める
    ことを特徴とする請求項8に記載のデータ処理装置。
  11. 前記新たな軸上で表現される前記注目データの予測値を、元の軸上で表現されるデータに変換する逆変換手段をさらに備える
    ことを特徴とする請求項8に記載のデータ処理装置。
  12. 前記データは、画像データである
    ことを特徴とする請求項8に記載のデータ処理装置。
  13. 前記軸計算タップ構成手段、クラスタップ構成手段、または予測タップ構成手段は、前記注目データに対応する画素の周辺に位置する画素のデータを、前記軸計算タップ、クラスタップ、または予測タップとする
    ことを特徴とする請求項12に記載のデータ処理装置。
  14. 前記予測手段は、前記新たな軸上で表現される予測タップと、あらかじめ学習を行うことにより得られたタップ係数のうちの、前記注目データのクラスに対応するものとを用いて所定の予測演算を行うことにより、前記注目データの予測値を求める
    ことを特徴とする請求項8に記載のデータ処理装置。
  15. 前記予測手段は、前記新たな軸上で表現される予測タップと、前記注目データのクラスに対応するタップ係数とを用いて線形予測演算を行うことにより、前記注目データの予測値を求める
    ことを特徴とする請求項14に記載のデータ処理装置。
  16. 前記クラスごとのタップ係数を記憶している記憶手段をさらに備える
    ことを特徴とする請求項14に記載のデータ処理装置。
  17. 前記タップ係数は、前記タップ係数および第1のデータを用いて所定の予測演算を行うことにより得られる前記第2のデータの予測値の予測誤差が、統計的に最小になるように、学習を行うことにより得られたものである
    ことを特徴とする請求項14に記載のデータ処理装置。
  18. 第1のデータから第2のデータを予測するデータ処理方法であって、
    前記第1のデータを表現する軸を、新たな軸に変換するのに用いる複数の第1のデータとしての軸計算タップを構成する軸計算タップ構成ステップと、
    前記軸計算タップに基づいて、前記新たな軸を求める軸計算ステップと、
    予測対象の前記第2のデータを注目データとして、その注目データを幾つかのクラスのうちのいずれかにクラス分けするクラス分類を行うのに用いる複数の第1のデータとしてのクラスタップを構成するクラスタップ構成ステップと、
    前記注目データを予測するのに用いる複数の第1のデータとしての予測タップを構成する予測タップ構成ステップと、
    前記クラスタップとしての複数の第1のデータと、前記予測タップとしての複数の第1のデータを、前記新たな軸上で表現されるデータに変換する変換ステップと、
    前記新たな軸上で表現されるクラスタップに基づいて、前記注目データについてのクラス分類を行うクラス分類ステップと、
    前記新たな軸上で表現される予測タップを用い、前記注目データのクラスに対応する予測方法に基づいて、前記注目データの予測値であって、前記新たな軸上で表現されるものを求める予測ステップと
    を備えることを特徴とするデータ処理方法。
  19. 第1のデータから第2のデータを予測するデータ処理を、コンピュータに行わせるプログラムが記録されている記録媒体であって、
    前記第1のデータを表現する軸を、新たな軸に変換するのに用いる複数の第1のデータとしての軸計算タップを構成する軸計算タップ構成ステップと、
    前記軸計算タップに基づいて、前記新たな軸を求める軸計算ステップと、
    予測対象の前記第2のデータを注目データとして、その注目データを幾つかのクラスのうちのいずれかにクラス分けするクラス分類を行うのに用いる複数の第1のデータとしてのクラスタップを構成するクラスタップ構成ステップと、
    前記注目データを予測するのに用いる複数の第1のデータとしての予測タップを構成する予測タップ構成ステップと、
    前記クラスタップとしての複数の第1のデータと、前記予測タップとしての複数の第1のデータを、前記新たな軸上で表現されるデータに変換する変換ステップと、
    前記新たな軸上で表現されるクラスタップに基づいて、前記注目データについてのクラス分類を行うクラス分類ステップと、
    前記新たな軸上で表現される予測タップを用い、前記注目データのクラスに対応する予測方法に基づいて、前記注目データの予測値であって、前記新たな軸上で表現されるものを求める予測ステップと
    を備えるプログラムが記録されている
    ことを特徴とする記録媒体。
  20. 第1のデータから第2のデータを予測する予測方法を学習するデータ処理装置であって、
    前記第1と第2のデータを、それぞれ生徒データと教師データとして、前記生徒データおよび教師データを表現する軸を、新たな軸に変換するのに用いる複数の生徒データとしての軸計算タップを構成する軸計算タップ構成手段と、
    前記軸計算タップに基づいて、前記新たな軸を求める軸計算手段と、
    注目している注目教師データを幾つかのクラスのうちのいずれかにクラス分けするクラス分類を行うのに用いる複数の生徒データとしてのクラスタップを構成するクラスタップ構成手段と、
    前記注目教師データを予測するのに用いる複数の生徒データとしての予測タップを構成する予測タップ構成手段と、
    前記教師データ、クラスタップとしての複数の生徒データ、および予測タップとしての複数の生徒データを、前記新たな軸上で表現されるデータに変換する変換手段と、
    前記新たな軸上で表現されるクラスタップに基づいて、前記注目教師データについてのクラス分類を行い、そのクラスを求めるクラス分類手段と、
    前記新たな軸上で表現される教師データと予測タップを用い、前記第2のデータを予測する予測方法を、前記クラスごとに学習する学習手段と
    を備えることを特徴とするデータ処理装置。
  21. 前記軸計算手段は、前記軸計算タップとしての複数の徒データを主成分分析し、その主成分分析結果に基づいて、前記新たな軸を求める
    ことを特徴とする請求項20に記載のデータ処理装置。
  22. 前記軸計算手段は、前記軸計算タップとしての複数の生徒データのうちの任意の2つのデータどうしの間の距離を計算し、その距離に基づいて、前記新たな軸を求める
    ことを特徴とする請求項20に記載のデータ処理装置。
  23. 前記データは、画像データである
    ことを特徴とする請求項20に記載のデータ処理装置。
  24. 前記軸計算タップ構成手段、クラスタップ構成手段、または予測タップ構成手段は、前記注目教師データに対応する前記生徒データとしての画素の周辺に位置する画素のデータを、前記軸計算タップ、クラスタップ、または予測タップとする
    ことを特徴とする請求項23に記載のデータ処理装置。
  25. 前記学習手段は、前記予測タップとの所定の予測演算に用いるタップ係数であって、前記新たな軸上で表現されるものを学習する
    ことを特徴とする請求項20に記載のデータ処理装置。
  26. 前記学習手段は、前記予測タップとの線形予測演算に用いる前記タップ係数を学習する
    ことを特徴とする請求項25に記載のデータ処理装置。
  27. 前記学習手段は、前記タップ係数および生徒データを用いて所定の予測演算を行うことにより得られる前記教師データの予測値の予測誤差が、統計的に最小になるように、前記クラスごとのタップ係数を学習する
    ことを特徴とする請求項25に記載のデータ処理装置。
  28. 第1のデータから第2のデータを予測する予測方法を学習するデータ処理方法であって、
    前記第1と第2のデータを、それぞれ生徒データと教師データとして、前記生徒データおよび教師データを表現する軸を、新たな軸に変換するのに用いる複数の生徒データとしての軸計算タップを構成する軸計算タップ構成ステップと、
    前記軸計算タップに基づいて、前記新たな軸を求める軸計算ステップと、
    注目している注目教師データを幾つかのクラスのうちのいずれかにクラス分けするクラス分類を行うのに用いる複数の生徒データとしてのクラスタップを構成するクラスタップ構成ステップと、
    前記注目教師データを予測するのに用いる複数の生徒データとしての予測タップを構成する予測タップ構成ステップと、
    前記教師データ、クラスタップとしての複数の生徒データ、および予測タップとしての複数の生徒データを、前記新たな軸上で表現されるデータに変換する変換ステップと、
    前記新たな軸上で表現されるクラスタップに基づいて、前記注目教師データについてのクラス分類を行い、そのクラスを求めるクラス分類ステップと、
    前記新たな軸上で表現される教師データと予測タップを用い、前記第2のデータを予測する予測方法を、前記クラスごとに学習する学習ステップと
    を備えることを特徴とするデータ処理方法。
  29. 第1のデータから第2のデータを予測する予測方法を学習するデータ処理を、コンピュータに行わせるプログラムが記録されている記録媒体であって、
    前記第1と第2のデータを、それぞれ生徒データと教師データとして、前記生徒データおよび教師データを表現する軸を、新たな軸に変換するのに用いる複数の生徒データとしての軸計算タップを構成する軸計算タップ構成ステップと、
    前記軸計算タップに基づいて、前記新たな軸を求める軸計算ステップと、
    注目している注目教師データを幾つかのクラスのうちのいずれかにクラス分けするクラス分類を行うのに用いる複数の生徒データとしてのクラスタップを構成するクラスタップ構成ステップと、
    前記注目教師データを予測するのに用いる複数の生徒データとしての予測タップを構成する予測タップ構成ステップと、
    前記教師データ、クラスタップとしての複数の生徒データ、および予測タップとしての複数の生徒データを、前記新たな軸上で表現されるデータに変換する変換ステップと、
    前記新たな軸上で表現されるクラスタップに基づいて、前記注目教師データについてのクラス分類を行い、そのクラスを求めるクラス分類ステップと、
    前記新たな軸上で表現される教師データと予測タップを用い、前記第2のデータを予測する予測方法を、前記クラスごとに学習する学習ステップと
    を備えるプログラムが記録されている
    ことを特徴とする記録媒体。
JP2000264921A 2000-09-01 2000-09-01 データ処理装置およびデータ処理方法、並びに記録媒体 Expired - Fee Related JP4491701B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2000264921A JP4491701B2 (ja) 2000-09-01 2000-09-01 データ処理装置およびデータ処理方法、並びに記録媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2000264921A JP4491701B2 (ja) 2000-09-01 2000-09-01 データ処理装置およびデータ処理方法、並びに記録媒体

Publications (2)

Publication Number Publication Date
JP2002074354A JP2002074354A (ja) 2002-03-15
JP4491701B2 true JP4491701B2 (ja) 2010-06-30

Family

ID=18752262

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2000264921A Expired - Fee Related JP4491701B2 (ja) 2000-09-01 2000-09-01 データ処理装置およびデータ処理方法、並びに記録媒体

Country Status (1)

Country Link
JP (1) JP4491701B2 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5769241B2 (ja) * 2011-07-15 2015-08-26 国立大学法人 筑波大学 超解像画像処理装置及び超解像画像処理用辞書作成装置

Also Published As

Publication number Publication date
JP2002074354A (ja) 2002-03-15

Similar Documents

Publication Publication Date Title
WO1994014278A1 (en) Image signal converter
JPH0974543A (ja) 画像信号変換装置及び画像信号変換方法
JP3864400B2 (ja) 画像処理装置および画像処理方法
JP4238516B2 (ja) データ変換装置およびデータ変換方法、学習装置および学習方法、並びにプログラムおよび記録媒体
JP3702464B2 (ja) データ変換装置およびデータ変換方法、学習装置および学習方法、並びにプログラムおよび記録媒体
JPH0779418A (ja) 画像信号変換装置
JP4491701B2 (ja) データ処理装置およびデータ処理方法、並びに記録媒体
JP2001222702A (ja) 画像処理装置および画像処理方法、並びに記録媒体
JP3743077B2 (ja) 画像信号変換装置および方法
JP4105257B2 (ja) 記憶装置および記憶方法
JP3796844B2 (ja) 画像処理装置、画像処理方法、パラメータ生成装置およびパラメータ生成方法
JP4517448B2 (ja) データ処理装置およびデータ処理方法、並びに記録媒体
JP4752088B2 (ja) データ処理装置およびデータ処理方法、並びに記録媒体
JP3693187B2 (ja) 信号変換装置及び信号変換方法
JP4442076B2 (ja) データ変換装置およびデータ変換方法、学習装置および学習方法、並びにプログラムおよび記録媒体
JP4419287B2 (ja) 画像処理装置および画像処理方法、並びに記録媒体
JP4678454B2 (ja) データ処理装置およびデータ処理方法、並びに記録媒体
US8228995B2 (en) Image processing apparatus, image processing method, and program
JP4154647B2 (ja) データ処理装置およびデータ処理方法、並びにプログラムおよび記録媒体
JP3912558B2 (ja) 画像符号化装置および画像符号化方法、並びに記録媒体
JP4538699B2 (ja) データ処理装置およびデータ処理方法、並びに記録媒体
JPH0888849A (ja) 画像信号処理方法及び画像信号伝送装置
JP4538698B2 (ja) データ処理装置およびデータ処理方法、並びに記録媒体
JP4310691B2 (ja) 画像処理装置および方法、学習装置および方法、記録媒体、並びにプログラム
JP4235918B2 (ja) 画像処理装置および画像処理方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20070226

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20091202

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20091210

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100122

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20100311

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20100324

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130416

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130416

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140416

Year of fee payment: 4

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees