JP4415229B2 - 画像処理装置および方法、並びに記録媒体 - Google Patents

画像処理装置および方法、並びに記録媒体 Download PDF

Info

Publication number
JP4415229B2
JP4415229B2 JP2000241803A JP2000241803A JP4415229B2 JP 4415229 B2 JP4415229 B2 JP 4415229B2 JP 2000241803 A JP2000241803 A JP 2000241803A JP 2000241803 A JP2000241803 A JP 2000241803A JP 4415229 B2 JP4415229 B2 JP 4415229B2
Authority
JP
Japan
Prior art keywords
class
prediction
tap
motion
pixels
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2000241803A
Other languages
English (en)
Other versions
JP2002058034A (ja
Inventor
哲二郎 近藤
淳一 石橋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Corp
Original Assignee
Sony Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Corp filed Critical Sony Corp
Priority to JP2000241803A priority Critical patent/JP4415229B2/ja
Publication of JP2002058034A publication Critical patent/JP2002058034A/ja
Application granted granted Critical
Publication of JP4415229B2 publication Critical patent/JP4415229B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Landscapes

  • Television Systems (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Description

【0001】
【発明の属する技術分野】
本発明は、画像処理装置および方法、並びに記録媒体に関し、特に、データを予測し、または予測に使用するデータを算出する画像処理装置および方法、並びに記録媒体に関する。
【0002】
【従来の技術】
従来より、図1(A)に示すフレームから成る動画像を基に、その動画像のフレームの間に位置するフレームを算出して、図1(B)に示すフレームから成る動画像を生成する方法について、種々の方法が提案されている。そのうちの1つに、クラス分類適応処理を用いる方法がある。
【0003】
クラス分類適応処理とは、入力信号を、その特徴に基づいて幾つかのクラスに分類し、各クラスの入力信号に、そのクラスに適切な適応処理を施すもので、大きく、クラス分類処理と適応処理とに分かれている。
【0004】
ここで、クラス分類処理および適応処理について簡単に説明する。
【0005】
まず、クラス分類処理について説明する。
【0006】
図2(A)に示すように、ある注目画素と、それに隣接する3つの画素により、2×2画素でなるブロック(クラス分類用ブロック)を構成し、また、各画素は、1ビットで表現される(0または1のうちのいずれかのレベルをとる)ものとする。この場合、注目画素を含む2×2の4画素のブロックは、各画素のレベル分布により、図2(B)に示すように、16(=(214)パターンに分類することができる。従って、いまの場合、注目画素は、16のパターンに分類することができる。
【0007】
ここで、通常、各画素には、8ビット程度が割り当てられる。クラス分類用のブロックが、3×3の9画素で構成されると、(289という膨大な数のクラスに分類されることになる。
【0008】
クラス分類用のブロックを構成する画素のビット数を小さくすることで、クラス数は削減される。
【0009】
次に、適応処理について説明する。
【0010】
例えば、いま、元の画像(補間された画像に相当する(以下、適宜、教師データと称する))のフレームの画素値yの予測値E[y]を、そのフレームが間引かれた画像の画素値(以下、適宜、学習データと称する)x1,x2,・・・と、所定の予測係数w1,w2,・・・の線形結合により規定される線形1次結合モデルにより求めることを考える。この場合、予測値E[y]は、次式で表すことができる。
【0011】
E[y]=w11+w22+・・・
・・・(1)
【0012】
そこで、一般化するために、予測係数wの集合でなる行列W、学習データの集合でなる行列X、および予測値E[y]の集合でなる行列Y’を、
【数1】
Figure 0004415229
で定義すると、次のような観測方程式が成立する。
【0013】
XW=Y’
・・・(2)
【0014】
そして、この観測方程式に最小自乗法を適用して、元の画像の画素値yに近い予測値E[y]を求めることを考える。この場合、元の画像の画素値yの集合でなる行列Y、および元の画像の画素値yに対する予測値E[y]の残差eの集合でなる行列Eを、
【数2】
Figure 0004415229
で定義すると、式(2)から、次のような残差方程式が成立する。
【0015】
XW=Y+E
・・・(3)
【0016】
この場合、元の画像の画素値yに近い予測値E[y]を求めるための予測係数wiは、自乗誤差
【数3】
Figure 0004415229
を最小にすることで求めることができる。
【0017】
従って、上述の自乗誤差を予測係数wiで微分したものが0になる場合、即ち、次式を満たす予測係数wiが、元の画像の画素値yに近い予測値E[y]を求めるため最適値ということになる。
【0018】
【数4】
Figure 0004415229
・・・(4)
【0019】
そこで、まず、式(3)を、予測係数wiで微分することにより、次式が成立する。
【0020】
【数5】
Figure 0004415229
・・・(5)
【0021】
式(4)および(5)より、式(6)が得られる。
【0022】
【数6】
Figure 0004415229
・・・(6)
【0023】
さらに、式(3)の残差方程式における学習データx、予測係数w、教師データy、および残差eの関係を考慮すると、式(6)から、次のような正規方程式を得ることができる。
【0024】
【数7】
Figure 0004415229
・・・(7)
【0025】
式(7)の正規方程式は、求めるべき予測係数wの数と同じ数だけたてることができ、従って、式(7)を解くことで、最適な予測係数wを求めることができる。なお、式(7)を解くにあたっては、例えば、掃き出し法(Gauss-Jordanの消去法)などを適用することが可能である。
【0026】
以上のようにして、クラスごとに最適な予測係数wを求め、さらに、その予測係数wを用い、式(1)により、元の画像の画素値yに近い予測値E[y]を求めるのが適応処理である。
【0027】
【発明が解決しようとする課題】
しかしながら、動きの大きい画像からフレームを予測する場合、クラス分類用ブロックに含まれる画素(以下、クラスタップとも称する)の数、または適応処理を適用するブロックに含まれる画素(以下、予測タップとも称する)の数を増やさなければ、予測されるフレームの誤差を少なくすることができず、このため、処理に必要な回路の規模が増加するか、または処理に時間がかかるという問題があった。
【0028】
本発明はこのような状況に鑑みてなされたものであり、動きの大きい画像を、より小さな規模の回路で、迅速に、精度良く、予測できるようにすることを目的とする。
【0029】
【課題を解決するための手段】
本発明の画像処理装置は、入力された画像中の2つのフレームから、その2つのフレームを基に生成され、時間的に当該2つのフレームの中間に位置する新たなフレームと、当該2つのフレームのうちの1のフレームとの間の動きの方向、および動きの大きさを検出する動き検出手段と、前記動き検出手段により検出された動きの方向に沿って前記動きの大きさと同じ間隔で抽出された前記画像中の複数の画素であるクラスタップを選択するクラスタップ選択手段と、選択された前記クラスタップである複数の画素の画素値のパターンに応じて、クラスを算出するクラス算出手段と、前記動き検出手段により検出された動きの方向に沿って前記動きの大きさと同じ間隔で抽出された前記画像中の複数の画素である予測タップを選択する予測タップ選択手段と、予め、前記新たなフレームに相当する教師画像データを時間方向に間引くことにより生成された学習画像データから選択された前記クラスタップに応じて算出されたクラス毎に、当該学習画像データから選択された前記予測タップとの線形一次結合により当該教師画像データの各画素を予測するための予測係数が学習され、記憶されており、前記クラス算出手段により算出されたクラスに対応する予測係数と、前記予測タップ選択手段により選択された前記予測タップである複数の画素の画素値との線形一次結合により、前記新たなフレーム内の画素の画素値を予測する予測実行手段と備え、前記クラスタップ選択手段は、総数が一定の前記クラスタップを選択し、前記予測タップ選択手段は、総数が一定の前記予測タップを選択する。
【0034】
本発明の画像処理方法は、入力された画像中の2つのフレームから、その2つのフレームを基に生成され、時間的に当該2つのフレームの中間に位置する新たなフレームと、当該2つのフレームのうちの1のフレームとの間の動きの方向、および動きの大きさを検出する動き検出ステップと、前記動き検出ステップの処理により検出された動きの方向に沿って前記動きの大きさと同じ間隔で抽出された前記画像中の複数の画素であるクラスタップを選択するクラスタップ選択ステップと、選択された前記クラスタップである複数の画素の画素値のパターンに応じて、クラスを算出するクラス算出ステップと、前記動き検出ステップの処理により検出された動きの方向に沿って前記動きの大きさと同じ間隔で抽出された前記画像中の複数の画素である予測タップを選択する予測タップ選択ステップと、予め、前記新たなフレームに相当する教師画像データを時間方向に間引くことにより生成された学習画像データから選択された前記クラスタップに応じて算出されたクラス毎に、当該学習画像データから選択された前記予測タップとの線形一次結合により当該教師画像データの各画素を予測するための予測係数が学習され、記憶されており、前記クラス算出ステップの処理により算出されたクラスに対応する予測係数と、前記予測タップ選択ステップの処理により選択された前記予測タップである複数の画素の画素値との線形一次結合により、前記新たなフレーム内の画素の画素値を予測する予測実行ステップと含み、前記クラスタップ選択ステップの処理においては、総数が一定の前記クラスタップが選択され、前記予測タップ選択ステップの処理においては、総数が一定の前記予測タップが選択される。
【0035】
本発明の記録媒体は、入力された画像中の2つのフレームから、その2つのフレームを基に生成され、時間的に当該2つのフレームの中間に位置する新たなフレームと、当該2つのフレームのうちの1のフレームとの間の動きの方向、および動きの大きさを検出する動き検出ステップと、前記動き検出ステップの処理により検出された動きの方向に沿って前記動きの大きさと同じ間隔で抽出された前記画像中の複数の画素であるクラスタップを選択するクラスタップ選択ステップと、選択された前記クラスタップである複数の画素の画素値のパターンに応じて、クラスを算出するクラス算出ステップと、前記動き検出ステップの処理により検出された動きの方向に沿って前記動きの大きさと同じ間隔で抽出された前記画像中の複数の画素である予測タップを選択する予測タップ選択ステップと、予め、前記新たなフレームに相当する教師画像データを時間方向に間引くことにより生成された学習画像データから選択された前記クラスタップに応じて算出されたクラス毎に、当該学習画像データから選択された前記予測タップとの線形一次結合により当該教師画像データの各画素を予測するための予測係数が学習され、記憶されており、前記クラス算出ステップの処理により算出されたクラスに対応する予測係数と、前記予測タップ選択ステップの処理により選択された前記予測タップである複数の画素の画素値との線形一次結合により、前記新たなフレーム内の画素の画素値を予測する予測実行ステップと含み、前記クラスタップ選択ステップの処理においては、総数が一定の前記クラスタップが選択され、前記予測タップ選択ステップの処理においては、総数が一定の前記予測タップが選択される処理をコンピュータに実行させるプログラムが記録されている記録媒体である。
【0047】
本発明においては、入力された画像中の2つのフレームから、その2つのフレームを基に生成され、時間的に当該2つのフレームの中間に位置する新たなフレームと、当該2つのフレームのうちの1のフレームとの間の動きの方向、および動きの大きさが検出され、検出された動きの方向に沿って前記動きの大きさと同じ間隔で抽出された前記画像中の複数の画素であるクラスタップが選択される。また、選択された前記クラスタップである複数の画素の画素値のパターンに応じて、クラスが算出され、検出された動きの方向に沿って前記動きの大きさと同じ間隔で抽出された前記画像中の複数の画素である予測タップが選択される。さらに、予め、前記新たなフレームに相当する教師画像データを時間方向に間引くことにより生成された学習画像データから選択された前記クラスタップに応じて算出されたクラス毎に、当該学習画像データから選択された前記予測タップとの線形一次結合により当該教師画像データの各画素を予測するための予測係数が学習され、記憶されており、算出されたクラスに対応する予測係数と、選択された前記予測タップである複数の画素の画素値との線形一次結合により、前記新たなフレーム内の画素の画素値が予測される。前記クラスタップの選択においては、総数が一定の前記クラスタップが選択され、前記予測タップの選択においては、総数が一定の前記予測タップが選択される。
【0051】
【発明の実施の形態】
図3は、フレームを補間する、本発明に係る画像処理装置の一実施の形態の構成を示す図である。動きベクトル検出部11、クラスタップ領域切り出し部12、予測タップ領域切り出し部13、および予測演算部17には、画像処理装置に入力された画像データが供給される。
【0052】
動きベクトル検出部11は、例えば、入力された画像データの2つのフレームを基に、動きベクトルを生成して、生成した動きベクトルをクラスタップ領域切り出し部12および予測タップ領域切り出し部13に供給する。
【0053】
クラスタップ領域切り出し部12は、動きベクトル検出部11から供給された動きベクトルを基に、画像データからクラスタップとしての画素を切り出して、切り出したクラスタップをADRC(Adaptive Dynamic Range Coding)処理部14に供給する。
【0054】
予測タップ領域切り出し部13は、動きベクトル検出部11から供給された動きベクトルを基に、画像データから予測タップとしての画素を切り出して、切り出した予測タップを予測演算部17に供給する。
【0055】
ここで、クラスタップ領域切り出し部12または予測タップ領域切り出し部13によるタップの切り出しについて説明する。
【0056】
タップの切り出しの処理を説明するために、まず、移動する物体を、その物体の移動速度に比較してゆっくりとした速度でパンさせて撮像した画像における画素の動きを図4に示すグラフを参照して説明する。
【0057】
フレームが間引きされる前の元の画像における、背景に対応する画素は、ゆっくりとした速度でパンされて撮像されているので、図4の○で示すように、フレーム毎の画素の位置の差が少ない。
【0058】
フレームが間引きされると、図4の△で示すように、背景に対応する画素は、フレームが間引きされる前の元の画像の場合に比較して、フレーム毎の画素の位置の差が増える。
【0059】
フレームが間引きされる前の元の画像における、移動する物体に対応する画素は、図4の□で示すように、背景の画素に比較して、フレーム毎の画素の位置の差が大きい。
【0060】
移動する物体の速度が大きくなると、フレーム毎の画素の位置の差は、より大きくなる。
【0061】
フレームが間引きされると、図4の×で示すように、移動する物体に対応する画素のフレーム毎の位置の差は、更に大きくなる。
【0062】
図5および図6は、移動する物体に対応する画素の位置と、予測タップの位置の対応を説明する図である。移動する物体に対応する画素を予測しようとする場合、予測タップの間隔が狭いとき、図5に示すように、間引きされた画像において、移動する物体に対応する画素は、予測タップとして利用されない。このような場合、補間されるフレームにおける画素が、移動する物体に対応する画素であるにもかかわらず、移動する物体に対応する画素以外の画素を利用して予測が行われることになるので、予測は、適切に行われない。
【0063】
これに対して、予測タップの間隔を広くすることにより、図6に示すように、間引きされた画像において、移動する物体に対応する画素を、予測タップとして利用することができる。すなわち、移動する物体に対応する画素を利用して予測が行われることになるので、予測は、適切に行われる。
【0064】
このように、移動する物体に対応する画像の動きに対応させて、予測タップの間隔を広くすれば、移動する物体に対応する画素を、予測タップとして利用することができるようになり、画像処理装置は、精度の高い予測をすることができるようになる。
【0065】
予測タップ領域切り出し部13は、例えば、図7に示すように、予め定められたaである基準タップ間隔を記憶している。予測タップ領域切り出し部13は、動きベクトル検出部11から動きベクトルが供給されたとき、動きベクトルから、例えば、水平方向の動き量αおよび垂直方向の動き量βを抽出する。
【0066】
予測タップ領域切り出し部13は、水平方向の動き量αが予め記憶している閾値より大きいか否かを判定し、水平方向の動き量αが予め記憶している閾値より大きいと判定された場合、基準タップ間隔aと水平方向の動き量αとを乗じて、水平方向の予測タップのタップ間隔を求める。
【0067】
予測タップ領域切り出し部13は、垂直方向の動き量βが予め記憶している閾値より大きいか否かを判定し、垂直方向の動き量βが予め記憶している閾値より大きいと判定された場合、基準タップ間隔aと垂直方向の動き量βとを乗じて、垂直方向の予測タップのタップ間隔を求める。
【0068】
例えば、図8に示すように、基準タップ間隔が1であり、垂直方向の動き量βが2であり、水平方向の動き量αが3であり、予め記憶している閾値が1である場合、予測タップ領域切り出し部13は、垂直方向の予測タップのタップ間隔を2とし(垂直方向の予測タップの間に1つ画素が存在する)、水平方向の予測タップのタップ間隔を3とする(水平方向の予測タップの間に2つ画素が存在する)。
【0069】
このように、水平方向の動き量αおよび垂直方向の動き量βが共に閾値より大きい場合、予測タップ領域切り出し部13は、基準タップ間隔aと水平方向の動き量αとを乗じて得られた間隔を、水平方向の予測タップのタップ間隔とし、基準タップ間隔aと垂直方向の動き量βとを乗じて得られた間隔を、垂直方向の予測タップのタップ間隔とする。
【0070】
これに対して、垂直方向の動き量βが予め記憶している閾値以下であると判定された場合、予測タップ領域切り出し部13は、基準タップ間隔aを、垂直方向の予測タップのタップ間隔とする。
【0071】
すなわち、垂直方向の動き量βが予め記憶している閾値以下であり、水平方向の動き量αが閾値より大きい場合、予測タップ領域切り出し部13は、基準タップ間隔aと水平方向の動き量αとを乗じて得られた間隔を、水平方向の予測タップのタップ間隔とし、基準タップ間隔aを、垂直方向の予測タップのタップ間隔とする。
【0072】
例えば、図9に示すように、基準タップ間隔が1であり、垂直方向の動き量βが0であり、水平方向の動き量αが2であり、予め記憶している閾値が1である場合、予測タップ領域切り出し部13は、垂直方向の予測タップのタップ間隔を1とし(垂直方向の予測タップが隣接する)、水平方向の予測タップのタップ間隔を2とする(水平方向の予測タップの間に1つ画素が存在する)。
【0073】
また、水平方向の動き量αが予め記憶している閾値以下であると判定された場合、予測タップ領域切り出し部13は、基準タップ間隔aを、水平方向の予測タップのタップ間隔とする。
【0074】
すなわち、水平方向の動き量αが予め記憶している閾値以下であり、垂直方向の動き量βが閾値より大きい場合、図10に示すように、予測タップ領域切り出し部13は、基準タップ間隔aを、水平方向の予測タップのタップ間隔とし、基準タップ間隔aと垂直方向の動き量βとを乗じて得られた間隔を、垂直方向の予測タップのタップ間隔とする。
【0075】
例えば、図10に示すように、基準タップ間隔が1であり、垂直方向の動き量βが2であり、水平方向の動き量αが0であり、予め記憶している閾値が1である場合、予測タップ領域切り出し部13は、垂直方向の予測タップのタップ間隔を2とし、水平方向の予測タップのタップ間隔を1とする(水平方向の予測タップが隣接する)。
【0076】
このようにすることで、予測タップ領域切り出し部13は、画像に移動する物体の画素が含まれていても、適切な画素を予測タップとすることができ、その結果、画像処理装置は、補間するフレームとして精度の高い画像を予測することができる。
【0077】
予測タップ領域切り出し部13が、例えば、予め記憶している数値に対応させて、その総数が一定である画素を予測タップとするようにしても良い。
【0078】
なお、動きベクトル検出部11が、動きベクトルの方向を示すデータを出力し、予測タップ領域切り出し部13が、動きベクトルの方向を示すデータを基に、予測タップを選択するようにしてもよい。また、例えば、予測タップ領域切り出し部13が、水平方向の動き量αが1以上であるか否か、または垂直方向の動き量βが1以上であるか否かなどを基に、適切な画素を予測タップとするようにしてもよい。
【0079】
なお、動きベクトル検出部11が、動きベクトルの大きさを示すデータを出力し、予測タップ領域切り出し部13が、動きベクトルの大きさを示すデータを基に、予測タップを選択するようにしてもよい。また、例えば、予測タップ領域切り出し部13が、動きベクトルの大きさを基に、適切な画素を予測タップとするようにしてもよい。
【0080】
クラスタップ領域切り出し部12も、以上で説明した予測タップ領域切り出し部13と同様の処理で、動きベクトルに対応して、クラスタップの間隔を変更するので、その説明は省略する。
【0081】
クラスタップ領域切り出し部12が、例えば、予め記憶している数値に対応させて、その総数が一定である画素をクラスタップとするようにしても良い。
【0082】
なお、動きベクトル検出部11が、動きベクトルの方向を示すデータを出力し、クラスタップ領域切り出し部12が、動きベクトルの方向を示すデータを基に、クラスタップを選択するようにしてもよい。また、例えば、クラスタップ領域切り出し部12が、水平方向の動き量αが1以上であるか否か、または垂直方向の動き量βが1以上であるか否かなどを基に、適切な画素をクラスタップとするようにしてもよい。
【0083】
なお、動きベクトル検出部11が、動きベクトルの大きさを示すデータを出力し、クラスタップ領域切り出し部12が、動きベクトルの大きさを示すデータを基に、クラスタップを選択するようにしてもよい。また、例えば、クラスタップ領域切り出し部12が、動きベクトルの大きさを基に、適切な画素をクラスタップとするようにしてもよい。
【0084】
図3に戻り、ADRC処理部14は、クラスタップ領域切り出し部12から供給されるクラスタップに対して、ADRC処理が施し、これにより、クラスタップのビット数を小さくすることで、クラス数を削減する。
【0085】
即ち、例えば、いま、説明を簡単にするため、図11(A)に示すように、直線上に並んだ4画素で構成されるクラスタップを考えると、ADRC処理においては、その画素値の最大値MAXと最小値MINが検出される。そして、DR=MAX−MINを、クラスタップの局所的なダイナミックレンジとし、このダイナミックレンジDRに基づいて、クラスタップを構成する画素の画素値がKビットに再量子化される。
【0086】
即ち、クラスタップ内の各画素値から、最小値MINを減算し、その減算値をDR/2Kで除算する。そして、その結果得られる除算値に対応するコード(ADRCコード)に変換される。具体的には、例えば、K=2とした場合、図11(B)に示すように、除算値が、ダイナミックレンジDRを4(=22)等分して得られるいずれの範囲に属するかが判定され、除算値が、最も下のレベルの範囲、下から2番目のレベルの範囲、下から3番目のレベルの範囲、または最も上のレベルの範囲に属する場合には、それぞれ、例えば、00B,01B,10B、または11Bなどの2ビットにコード化される(Bは2進数であることを表す)。
【0087】
ここで、このようなADRC処理はノンエッジマッチングと呼ばれる。
【0088】
なお、ADRC処理については、本件出願人が先に出願した、例えば、特開平3−53778号公報などに、その詳細が開示されている。
【0089】
クラスタップを構成する画素に割り当てられているビット数より少ないビット数で再量子化を行うADRC処理を施すことにより、上述したように、クラス数を削減することができ、このようなADRC処理が、ADRC処理部14において行われる。
【0090】
ADRC処理部14は、クラスタップにADRC処理を適応して生成した、ダイナミックレンジDR、およびADRCコードをクラスコード発生部15に供給する。
【0091】
クラスコード発生部15は、ADRC処理部14から供給されたダイナミックレンジDR、およびADRCコードを基に、最終的なクラスコードを生成し、クラスコードを予測係数ROM16に供給する。
【0092】
予測係数ROM16は、予め、クラスコードに対応させて予測係数を記憶している。予測係数ROM16は、クラスコード発生部15からクラスコードが供給されたとき、供給されたクラスコードが示すクラスに対応する予測係数を予測演算部17に供給する。
【0093】
予測演算部17は、予測タップ領域切り出し部13から供給された予測タップと、予測係数ROM16から供給された予測係数との線形1次結合により、補間するフレームである予測値を算出する。予測演算部17は、画像処理装置に入力された画像データのフレームに、算出した補間するフレームを加えて、フレーム補間された画像データとして出力する。
【0094】
このように、本発明に係る画像処理装置は、入力された画像の動きを基に、クラスタップまたは予測タップの間隔を適切に変更するので、タップの数を増やすことなく、精度の高いフレームが補間された画像データを出力することができる。
【0095】
次に、画像処理装置における、補間するフレームの予測の処理を図12のフローチャートを参照して、説明する。
【0096】
ステップS11において、動きベクトル検出部11は、入力された画像データから動きベクトルを検出して、動きベクトルをクラスタップ領域切り出し部12および予測タップ領域切り出し部13に供給する。ステップS12において、クラスタップ領域切り出し部12は、動きベクトル検出部11から供給された動きベクトルを基に、クラスタップの間隔を決定する。予測タップ領域切り出し部13は、動きベクトル検出部11から供給された動きベクトルを基に、予測タップの間隔を決定する。
【0097】
ステップS13において、クラスタップ領域切り出し部12は、決定された間隔を基にクラスタップを選択して、選択したクラスタップをADRC処理部14に出力する。ステップS14において、ADRC処理部14は、クラスタップ領域切り出し部12から供給されたクラスタップにADRC処理を適用して、ダイナミックレンジDRおよびADRCコードを生成して、生成したダイナミックレンジDRおよびADRCコードをクラスコード発生部15に供給する。クラスコード発生部15は、ダイナミックレンジDRおよびADRCコードを基に、クラスコードを生成して、クラスコードを予測係数ROM16に主力する。
【0098】
ステップS15において、予測係数ROM16は、クラスコード発生部15から供給されたクラスコードが示すクラスに対応する予測係数を選択して、選択した予測係数を予測演算部17に出力する。
【0099】
ステップS16において、予測タップ領域切り出し部13は、ステップS12の処理で決定された間隔を基に予測タップを選択して、選択した予測タップを予測演算部17に出力する。
【0100】
ステップS17において、予測演算部17は、予測タップ領域切り出し部13から供給された予測タップと、予測係数ROM16から供給された予測係数との線形1次結合により、補間するフレームである予測値を算出する。予測演算部17は、画像処理装置に入力された画像データのフレームに、算出した補間するフレームを加えて、フレーム補間された画像データとして出力し、手続きは、ステップS11に戻り、予測の処理を繰り返す。
【0101】
このように、クラスタップ領域切り出し部12は、動きベクトルに対応して、クラスタップの間隔を設定し、予測タップ領域切り出し部13は、動きベクトルに対応して予測タップの間隔を設定するので、画像処理装置は、迅速に、より精度の高いフレームを予測することができる。
【0102】
次に、図13は、図3の予測係数ROM16に記憶されている予測係数を得るための学習を行う画像処理装置の構成例を示す。
【0103】
フレーム間引きフィルタ51および正規方程式処理部57には、あらゆる画像に適用可能な予測係数を得るための画像データ(教師データに対応する)が提供される。
【0104】
フレーム間引きフィルタ51は、供給される教師データに含まれるフレームを一枚おきに間引いて、フレームが間引かれた画像データ(学習データに対応する)を動きベクトル検出部52、クラスタップ領域切り出し部53、および予測タップ領域切り出し部54に供給する。
【0105】
動きベクトル検出部52は、学習データを基に、動きベクトルを生成して、生成した動きベクトルをクラスタップ領域切り出し部53および予測タップ領域切り出し部54に供給する。
【0106】
クラスタップ領域切り出し部53は、動きベクトル検出部52から供給された動きベクトルを基に、学習データからクラスタップとしての画素を切り出して、切り出したクラスタップをADRC処理部14に供給する。クラスタップ領域切り出し部53は、クラスタップ領域切り出し部12と同様に、動きベクトルに対応して、クラスタップの間隔を変更する。
【0107】
ADRC処理部55は、クラスタップ領域切り出し部53から供給されたクラスタップにADRC処理を適用して、ダイナミックレンジDRとADRCコードを生成して、生成したダイナミックレンジDRとADRCコードをクラスコード発生部56に供給する。
【0108】
クラスコード発生部56は、ADRC処理部55から供給されたダイナミックレンジDR、およびADRCコードを基に、最終的なクラスコードを生成し、クラスコードを正規方程式処理部57に供給する。
【0109】
予測タップ領域切り出し部54は、動きベクトル検出部52から供給された動きベクトルを基に、学習データから予測タップとしての画素を切り出して、切り出した予測タップを正規方程式処理部57に供給する。予測タップ領域切り出し部54は、予測タップ領域切り出し部13と同様に、動きベクトルに対応して、予測タップの間隔を変更する。
【0110】
正規方程式処理部57は、予測タップ領域切り出し部54から供給された予測タップ、および教師データを受信すると、それらを用いて、最小自乗法により、誤差を最小する予測係数を算出する。
【0111】
即ち、例えば、いま、学習データに含まれる予測タップの画素値を、x1,x2,x3,・・・とし、求めるべき予測係数をw1,w2,w3,・・・とするとき、これらの線形1次結合により、教師データの、ある画素の画素値yを求めるには、予測係数w1,w2,w3,・・・は、次式を満たす必要がある。
【0112】
y=w11+w22+w33+・・・
【0113】
そこで、正規方程式処理部57では、同一クラスの予測タップと、対応する教師データの画素とから、真値yに対する、予測値w11+w22+w33+・・・の自乗誤差を最小とする予測係数w1,w2,w3,・・・が、上述した式(7)に示す正規方程式をたてて解くことにより求められる。従って、この処理をクラスごとに行うことにより、各クラスごとに、予測係数が生成される。
【0114】
正規方程式処理部57において求められた、クラスごとの予測係数は、クラスコードと共に、メモリ58に供給される。これにより、メモリ58においては、正規方程式処理部57からの予測係数が、クラスコードが示すクラスに対応するアドレスに記憶される。
【0115】
以上のようにして、メモリ58には、各クラスに対応するアドレスに、そのクラスの画素を予測するのに最適な予測係数が記憶される。
【0116】
図3の予測係数ROM16には、以上のようにしてメモリ58に記憶されたクラスごとの予測係数が記憶されている。
【0117】
次に、図13に示す画像処理装置の予測係数の記憶の処理について、図14のフローチャートを参照して説明する。ステップS31において、フレーム間引きフィルタ51は、入力された画像データから、フレームを間引いて、フレームを間引いた画像データを動きベクトル検出部52、クラスタップ領域切り出し部53、および予測タップ領域切り出し部54に供給する。
【0118】
ステップS32において、動きベクトル検出部52は、フレーム間引きフィルタ51から供給された画像データの動きベクトルを検出する。ステップS33において、クラスタップ領域切り出し部53は、動きベクトル検出部52から供給された動きベクトルを基に、クラスタップの間隔を決定する。予測タップ領域切り出し部54は、動きベクトル検出部52から供給された動きベクトルを基に、予測タップの間隔を決定する。
【0119】
ステップS34において、クラスタップ領域切り出し部53は、決定された間隔を基にクラスタップを選択して、選択したクラスタップをADRC処理部55に出力する。ステップS35において、ADRC処理部55は、クラスタップ領域切り出し部53から供給されたクラスタップにADRC処理を適用して、ダイナミックレンジDRおよびADRCコードを生成して、生成したダイナミックレンジDRおよびADRCコードをクラスコード発生部56に供給する。クラスコード発生部56は、ダイナミックレンジDRおよびADRCコードを基に、クラスコードを生成して、クラスコードを正規方程式処理部57に主力する。
【0120】
ステップS36において、予測タップ領域切り出し部54は、決定された間隔を基に予測タップを選択して、選択した予測タップを正規方程式処理部57に出力する。
【0121】
ステップS37において、正規方程式処理部57は、予測タップと教師データとを基に、クラスコードに対応するクラスの予測係数を算出して、予測係数をクラスコードと共にメモリ58に供給する。
【0122】
ステップS38において、メモリ58は、正規方程式処理部57から供給された予測係数を、クラスコードが示すクラスに対応するアドレスに記憶し、手続きは、ステップS31に戻り、以上の処理を繰り返す。
【0123】
このように、図13に示す情報処理装置は、動きベクトルに対応した間隔を有する予測タップおよびクラスタップを選択するクラス分類適応処理に使用する予測係数をクラス毎に生成して、記憶することができる。
【0124】
なお、本実施の形態では、クラスコード発生部15またはクラスコード発生部56において、ADRC処理部14またはADRC処理部55から出力されるダイナミックレンジDRおよびADRCコードに基づいて、クラス分類処理が行われるが、クラス分類処理は、その他、例えば、DPCM(予測符号化)や、BTC(Block Truncation Coding)、VQ(ベクトル量子化)、DCT(離散コサイン変換)、アダマール変換などを施したデータを対象に行うようにすることも可能である。
【0125】
上述した一連の処理は、ハードウェアにより実行させることもできるが、ソフトウェアにより実行させることもできる。一連の処理をソフトウェアにより実行させる場合には、そのソフトウェアを構成するプログラムが、専用のハードウェアに組み込まれているコンピュータ、または、各種のプログラムをインストールすることで、各種の機能を実行することが可能な、例えば汎用のパーソナルコンピュータなどに、記録媒体からインストールされる。
【0126】
図15は、予測の処理または予測係数の記憶の処理を実行するパーソナルコンピュータの構成例を説明する図である。CPU(Central Processing Unit)101は、各種アプリケーションプログラムや、OS(Operating System)を実際に実行する。ROM(Read-only Memory)102は、一般的には、CPU101が使用するプログラムや演算用のパラメータのうちの基本的に固定のデータを格納する。RAM(Random-Access Memory)103は、CPU101の実行において使用するプログラムや、その実行において適宜変化するパラメータを格納する。これらはCPUバスなどから構成されるホストバス104により相互に接続されている。
【0127】
ホストバス104は、ブリッジ105を介して、PCI(Peripheral Component Interconnect/Interface)バスなどの外部バス106に接続されている。
【0128】
キーボード108は、CPU101に各種の指令を入力するとき、使用者により操作される。ポインティングデバイス109は、ディスプレイ110の画面上のポイントの指示や選択を行うとき、使用者により操作される。ディスプレイ110は、液晶表示装置またはCRT(Cathode Ray Tube)などから成り、各種情報をテキストやイメージで表示する。HDD(Hard Disk Drive)111は、ハードディスクを駆動し、それらにCPU101によって実行するプログラムや情報を記録または再生させる。
【0129】
ドライブ112は、装着されている磁気ディスク121、光ディスク122、光磁気ディスク123、または半導体メモリ124に記録されているデータまたはプログラムを読み出して、そのデータまたはプログラムを、インターフェース107、外部バス106、ブリッジ105、およびホストバス104を介して接続されているRAM103に供給する。これらのキーボード108乃至ドライブ112は、インターフェース107に接続されており、インターフェース107は、外部バス106、ブリッジ105、およびホストバス104を介してCPU101に接続されている。
【0130】
通信ボード113は、例えば、ネットワーク等が接続され、CPU101、またはHDD111から供給された画像データを、所定の方式のパケットに格納して、ネットワークを介して、送信するとともに、ネットワークを介して、受信したパケットに格納されている画像データをCPU101、RAM103、またはHDD111に出力する。
【0131】
通信ボード113は、外部バス106、ブリッジ105、およびホストバス104を介してCPU101に接続されている。
【0132】
上述した一連の処理を実行させるプログラムが記録されている記録媒体は、図15に示すように、コンピュータとは別に、ユーザにプログラムを提供するために配布される、プログラムが記録されている磁気ディスク121(フロッピディスクを含む)、光ディスク122(CD-ROM(Compact Disc-Read Only Memory)、DVD(Digital Versatile Disc)を含む)、光磁気ディスク123(MD(Mini-Disc)を含む)、若しくは半導体メモリ124などよりなるパッケージメディアにより構成されるだけでなく、コンピュータに予め組み込まれた状態でユーザに提供される、プログラムが記録されているROM102や、HDD111に内蔵されるハードディスクなどで構成される。
【0133】
なお、本明細書において、記録媒体に格納されるプログラムを記述するステップは、記載された順序に沿って時系列的に行われる処理はもちろん、必ずしも時系列的に処理されなくとも、並列的あるいは個別に実行される処理をも含むものである。
【0134】
【発明の効果】
本発明によれば、動きの大きい画像を、より小さな規模の回路で、迅速に、精度良く、予測できるようになる。
【図面の簡単な説明】
【図1】フレームを補間する処理を説明する図である。
【図2】クラス分類処理について説明する図である。
【図3】本発明に係る画像処理装置の一実施の形態の構成を示す図である。
【図4】画素の動きを説明する図である。
【図5】移動する物体に対応する画素の位置と、予測タップの位置の対応を説明する図である。
【図6】移動する物体に対応する画素の位置と、予測タップの位置の対応を説明する図である。
【図7】基準タップ間隔を説明する図である。
【図8】動きに対応する予測タップの間隔を説明する図である。
【図9】動きに対応する予測タップの間隔を説明する図である。
【図10】動きに対応する予測タップの間隔を説明する図である。
【図11】ADRC処理を説明する図である。
【図12】補間するフレームの予測の処理を説明するフローチャートである。
【図13】予測係数を得るための学習を行う画像処理装置の構成例を示す図である。
【図14】予測係数の記憶の処理を説明するフローチャートである。
【図15】予測の処理または予測係数の記憶の処理を実行するパーソナルコンピュータの構成例を説明する図である。
【符号の説明】
11 動きベクトル検出部, 12 クラスタップ領域切り出し部, 13 予測タップ領域切り出し部, 14 ADRC処理部, 15 クラスコード発生部, 16 予測係数ROM, 17 予測演算部, 51 フレーム間引きフィルタ, 52 動きベクトル検出部, 53 クラスタップ領域切り出し部, 54 予測タップ領域切り出し部, 55 ADRC処理部, 56 クラスコード発生部, 57 正規方程式処理部, 58 メモリ, 101 CPU, 102 ROM, 103 RAM, 111 HDD, 121 磁気ディスク, 122 光ディスク, 123 光磁気ディスク, 124 半導体メモリ

Claims (3)

  1. 入力された画像中の2つのフレームから、その2つのフレームを基に生成され、時間的に当該2つのフレームの中間に位置する新たなフレームと、当該2つのフレームのうちの1のフレームとの間の動きの方向、および動きの大きさを検出する動き検出手段と、
    前記動き検出手段により検出された動きの方向に沿って前記動きの大きさと同じ間隔で抽出された前記画像中の複数の画素であるクラスタップを選択するクラスタップ選択手段と、
    選択された前記クラスタップである複数の画素の画素値のパターンに応じて、クラスを算出するクラス算出手段と、
    前記動き検出手段により検出された動きの方向に沿って前記動きの大きさと同じ間隔で抽出された前記画像中の複数の画素である予測タップを選択する予測タップ選択手段と、
    予め、前記新たなフレームに相当する教師画像データを時間方向に間引くことにより生成された学習画像データから選択された前記クラスタップに応じて算出されたクラス毎に、当該学習画像データから選択された前記予測タップとの線形一次結合により当該教師画像データの各画素を予測するための予測係数が学習され、記憶されており、前記クラス算出手段により算出されたクラスに対応する予測係数と、前記予測タップ選択手段により選択された前記予測タップである複数の画素の画素値との線形一次結合により、前記新たなフレーム内の画素の画素値を予測する予測実行手段と
    備え、
    前記クラスタップ選択手段は、総数が一定の前記クラスタップを選択し、
    前記予測タップ選択手段は、総数が一定の前記予測タップを選択する
    画像処理装置。
  2. 入力された画像中の2つのフレームから、その2つのフレームを基に生成され、時間的に当該2つのフレームの中間に位置する新たなフレームと、当該2つのフレームのうちの1のフレームとの間の動きの方向、および動きの大きさを検出する動き検出ステップと、
    前記動き検出ステップの処理により検出された動きの方向に沿って前記動きの大きさと同じ間隔で抽出された前記画像中の複数の画素であるクラスタップを選択するクラスタップ選択ステップと、
    選択された前記クラスタップである複数の画素の画素値のパターンに応じて、クラスを算出するクラス算出ステップと、
    前記動き検出ステップの処理により検出された動きの方向に沿って前記動きの大きさと同じ間隔で抽出された前記画像中の複数の画素である予測タップを選択する予測タップ選択ステップと、
    予め、前記新たなフレームに相当する教師画像データを時間方向に間引くことにより生成された学習画像データから選択された前記クラスタップに応じて算出されたクラス毎に、当該学習画像データから選択された前記予測タップとの線形一次結合により当該教師画像データの各画素を予測するための予測係数が学習され、記憶されており、前記クラス算出ステップの処理により算出されたクラスに対応する予測係数と、前記予測タップ選択ステップの処理により選択された前記予測タップである複数の画素の画素値との線形一次結合により、前記新たなフレーム内の画素の画素値を予測する予測実行ステップと
    含み、
    前記クラスタップ選択ステップの処理においては、総数が一定の前記クラスタップが選択され、
    前記予測タップ選択ステップの処理においては、総数が一定の前記予測タップが選択される
    画像処理方法。
  3. 入力された画像中の2つのフレームから、その2つのフレームを基に生成され、時間的に当該2つのフレームの中間に位置する新たなフレームと、当該2つのフレームのうちの1のフレームとの間の動きの方向、および動きの大きさを検出する動き検出ステップと、
    前記動き検出ステップの処理により検出された動きの方向に沿って前記動きの大きさと同じ間隔で抽出された前記画像中の複数の画素であるクラスタップを選択するクラスタップ選択ステップと、
    選択された前記クラスタップである複数の画素の画素値のパターンに応じて、クラスを算出するクラス算出ステップと、
    前記動き検出ステップの処理により検出された動きの方向に沿って前記動きの大きさと同じ間隔で抽出された前記画像中の複数の画素である予測タップを選択する予測タップ選択ステップと、
    予め、前記新たなフレームに相当する教師画像データを時間方向に間引くことにより生成された学習画像データから選択された前記クラスタップに応じて算出されたクラス毎に、当該学習画像データから選択された前記予測タップとの線形一次結合により当該教師画像データの各画素を予測するための予測係数が学習され、記憶されており、前記クラス算出ステップの処理により算出されたクラスに対応する予測係数と、前記予測タップ選択ステップの処理により選択された前記予測タップである複数の画素の画素値との線形一次結合により、前記新たなフレーム内の画素の画素値を予測する予測実行ステップと
    含み、
    前記クラスタップ選択ステップの処理においては、総数が一定の前記クラスタップが選択され、
    前記予測タップ選択ステップの処理においては、総数が一定の前記予測タップが選択される
    処理をコンピュータに実行させるプログラムが記録されている記録媒体。
JP2000241803A 2000-08-09 2000-08-09 画像処理装置および方法、並びに記録媒体 Expired - Fee Related JP4415229B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2000241803A JP4415229B2 (ja) 2000-08-09 2000-08-09 画像処理装置および方法、並びに記録媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2000241803A JP4415229B2 (ja) 2000-08-09 2000-08-09 画像処理装置および方法、並びに記録媒体

Publications (2)

Publication Number Publication Date
JP2002058034A JP2002058034A (ja) 2002-02-22
JP4415229B2 true JP4415229B2 (ja) 2010-02-17

Family

ID=18732937

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2000241803A Expired - Fee Related JP4415229B2 (ja) 2000-08-09 2000-08-09 画像処理装置および方法、並びに記録媒体

Country Status (1)

Country Link
JP (1) JP4415229B2 (ja)

Also Published As

Publication number Publication date
JP2002058034A (ja) 2002-02-22

Similar Documents

Publication Publication Date Title
US7881539B2 (en) Image processing apparatus and method, program recording medium, and program
US20100202711A1 (en) Image processing apparatus, image processing method, and program
JP4915341B2 (ja) 学習装置および方法、画像処理装置および方法、並びにプログラム
JP4362895B2 (ja) データ処理装置およびデータ処理方法、並びに記録媒体
JP3864400B2 (ja) 画像処理装置および画像処理方法
EP1650709A1 (en) Data processing apparatus and data processing methods
JP4324825B2 (ja) データ処理装置およびデータ処理方法、並びに媒体
JP2009003598A (ja) 画像生成装置および方法、学習装置および方法、並びにプログラム
JP4415229B2 (ja) 画像処理装置および方法、並びに記録媒体
JP4035895B2 (ja) 画像変換装置および方法、並びに記録媒体
JP4470280B2 (ja) 画像信号処理装置及び画像信号処理方法
JP4650683B2 (ja) 画像処理装置および方法、プログラム並びに記録媒体
JP4062771B2 (ja) 画像変換装置および方法、並びに記録媒体
JP3723995B2 (ja) 画像情報変換装置および方法
JPH0983961A (ja) クラス予測係数の学習方法並びにクラス分類適応処理を用いた信号変換装置および方法
JP2007251690A (ja) 画像処理装置および方法、学習装置および方法、並びにプログラム
JP3326879B2 (ja) 画像信号変換装置
JP5050944B2 (ja) 画像処理装置、画像処理方法、学習装置、学習方法、及びプログラム
JP3669522B2 (ja) 信号変換装置、信号変換方法、係数学習装置及び係数学習方法
JP4131049B2 (ja) 信号処理装置及び信号処理方法
JP4062326B2 (ja) 係数生成装置および方法
JP4470282B2 (ja) 画像処理装置および画像処理方法
JP2003303330A (ja) データ変換装置およびデータ変換方法、学習装置および学習方法、並びにプログラムおよび記録媒体
JP4650684B2 (ja) 画像処理装置および方法、プログラム並びに記録媒体
JP4623345B2 (ja) 画像処理装置および方法、並びに記録媒体

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20070219

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20090224

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20090305

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20090507

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20091029

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20091111

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121204

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121204

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20131204

Year of fee payment: 4

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees