JP2007251690A - 画像処理装置および方法、学習装置および方法、並びにプログラム - Google Patents

画像処理装置および方法、学習装置および方法、並びにプログラム Download PDF

Info

Publication number
JP2007251690A
JP2007251690A JP2006073560A JP2006073560A JP2007251690A JP 2007251690 A JP2007251690 A JP 2007251690A JP 2006073560 A JP2006073560 A JP 2006073560A JP 2006073560 A JP2006073560 A JP 2006073560A JP 2007251690 A JP2007251690 A JP 2007251690A
Authority
JP
Japan
Prior art keywords
class
image data
image
unit
tap
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2006073560A
Other languages
English (en)
Other versions
JP2007251690A5 (ja
Inventor
Tetsujiro Kondo
哲二郎 近藤
Hideki Mori
英樹 森
Masashi Uchida
真史 内田
Takuo Morimura
卓夫 守村
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Corp
Original Assignee
Sony Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Corp filed Critical Sony Corp
Priority to JP2006073560A priority Critical patent/JP2007251690A/ja
Publication of JP2007251690A publication Critical patent/JP2007251690A/ja
Publication of JP2007251690A5 publication Critical patent/JP2007251690A5/ja
Pending legal-status Critical Current

Links

Images

Abstract

【課題】より高画質の高解像度の画像を生成することができるようにする。
【解決手段】SD画像信号から予測タップ抽出部206は予測タップを抽出し、クラスタップ抽出部203はクラスタップを抽出する。ノイズ加算量指定部202は、クラスタップを構成する画素の画素値から求められるアクティビティに基づいたクラス分類をするためのDR閾値を指定する。DRクラス分類部204は、DR閾値と、クラスタップのアクティビティとを比較した結果に基づいて、DRクラス分類を行う。また、波形クラス分類部205は、抽出したクラスタップに基づいて、波形クラス分類を行う。高解像度処理部207は、DRクラス分類と波形クラス分類の結果により特定される注目画素のクラスに対応する係数と、予測タップに基づいて、より高解像度のHD画像信号を生成する。本発明は、テレビジョン受像機に適用できる。
【選択図】図13

Description

本発明は、画像処理装置および方法、学習装置および方法、並びにプログラムに関し、特に、より高画質の高解像度の画像を生成することができるようにした画像処理装置および方法、学習装置および方法、並びにプログラムに関する。
本出願人は、入力画像信号に乗っているノイズ成分を除去して高解像度の画像信号に変換する手法として、クラス分類適応処理を先に提案している(例えば、特許文献1)。クラス分類適応処理は、入力画像の所定の領域の複数の画素の画素値と、教師画像および生徒画像を用いた学習により、あらかじめ求めておいた予測係数との線形1次式を演算することにより、入力画像から高解像度の出力画像を求める信号処理である。
特開2002−218413号公報
しかしながら、入力画像信号に乗っているノイズ成分を除去する手法として、生徒画像に対してノイズ成分を付加することで学習を行い、それにより得られた予測係数などのノイズ除去成分を用いてノイズ成分を除去する処理を行う場合、ノイズ除去の性能が学習時に付加したノイズ成分の特性に大きく左右されることになる。特に、通常用いられている波形クラス分類の信頼性が、ノイズ成分による原波形の変化によってどのように変化するかといった点が不明確であるために、ボケ易くなるなど、クラス分類適応処理の長所が生かされにくくなる状況にあった。
また、従来の手法では、学習時の環境と出力画像生成時、すなわち予測時の環境とが、基本的に一致している場合にはノイズ除去の性能が高いが、不一致が大きい場合にはその性能が低下するという問題もあった。
本発明はこのような状況に鑑みてなされたものであり、より高画質の高解像度の画像を生成することができるようにするものである。
本発明の第1の側面の画像処理装置は、第1の画像データから第2の画像データを生成する画像処理装置において、前記第2の画像データの注目している画素である注目画素を予測するために用いる複数の画素を、前記第1の画像データから予測タップとして抽出する第1の抽出手段と、前記注目画素を複数のクラスのうちのいずれかにクラス分けするクラス分類に用いる複数の画素を、前記第1の画像データから第1のクラスタップとして抽出する第2の抽出手段と、前記第1のクラスタップのアクティビティに基づいたクラス分類をするための第1の閾値を指定する指定手段と、指定した前記第1の閾値と、前記第1のクラスタップのアクティビティとを比較した結果に基づいて、前記注目画素を第1のクラスに分類する第1の分類手段と、前記第1のクラスタップのパターンに基づいて、前記注目画素を第2のクラスに分類する第2の分類手段と、前記第1のクラスおよび前記第2のクラスにより特定される前記注目画素のクラスに対応する第1の係数と、前記予測タップに基づいて、前記第2の画像データを演算する演算手段とを備える。
前記指定手段には、ユーザにより第2の閾値が指示された場合、指示された前記第2の閾値に基づいた値を、前記第1の閾値として指定させ、前記ユーザにより前記第2の閾値が指示されなかった場合、前記第1の画像データから検出されるノイズレベルに基づいた値を、前記第1の閾値として指定させることができる。
前記第1の分類手段には、前記アクティビティが前記第1の閾値を超える場合、原信号成分が支配的となる前記第1のクラスに属するように前記注目画素を分類させ、前記アクティビティが前記第1の閾値よりも小さい場合、ノイズ成分が支配的となる前記第1のクラスに属するように前記注目画素を分類させることができる。
前記演算手段には、前記第1のクラスに分類されている前記注目画素のうち、前記原信号成分が支配的となる前記第1のクラスに属している前記注目画素に対して、前記原信号成分を保ちながら前記ノイズ成分を除去するように演算させ、前記ノイズ成分が支配的となる前記第1のクラスに属している前記注目画素に対して、前記ノイズ成分を除去するように演算させることができる。
前記第2の画像データの画質を指定するためのパラメータを入力する入力手段と、入力した前記パラメータに基づいて、前記第1の係数を生成するための元となる第2の係数から前記第1の係数を生成する生成手段と、動きにより前記注目画素をクラス分けするクラス分類に用いる複数の画素を、前記第1の画像データから第2のクラスタップとして抽出する第3の抽出手段と、前記第2のクラスタップの動きに基づいて、前記注目画素を第3のクラスに分類する第3の分類手段とをさらに設けることができ、前記演算手段は、前記第1のクラス、前記第2のクラス、および前記第3のクラスにより特定される前記注目画素のクラスに対応する前記第1の係数と、前記予測タップに基づいて、前記第2の画像データを演算させることができる。
前記パラメータには、前記第2の画像データの水平方向と垂直方向の解像度を示す値とさせることができる。
本発明の第1の画像処理方法は、第1の画像データから第2の画像データを生成する画像処理方法において、前記第2の画像データの注目している画素である注目画素を予測するために用いる複数の画素を、前記第1の画像データから予測タップとして抽出する第1の抽出ステップと、前記注目画素を複数のクラスのうちのいずれかにクラス分けするクラス分類に用いる複数の画素を、前記第1の画像データからクラスタップとして抽出する第2の抽出ステップと、前記クラスタップのアクティビティに基づいたクラス分類をするための閾値を指定する指定ステップと、指定した前記閾値と、前記クラスタップのアクティビティとを比較した結果に基づいて、前記注目画素を第1のクラスに分類する第1の分類ステップと、前記クラスタップのパターンに基づいて、前記注目画素を第2のクラスに分類する第2の分類ステップと、前記第1のクラスおよび前記第2のクラスにより特定される前記注目画素のクラスに対応する係数と、前記予測タップに基づいて、前記第2の画像データを演算する演算ステップとを含む。
本発明の第1の側面のプログラムは、第1の画像データから第2の画像データを生成する画像処理をコンピュータに行わせるプログラムにおいて、前記第2の画像データの注目している画素である注目画素を予測するために用いる複数の画素を、前記第1の画像データから予測タップとして抽出する第1の抽出ステップと、前記注目画素を複数のクラスのうちのいずれかにクラス分けするクラス分類に用いる複数の画素を、前記第1の画像データからクラスタップとして抽出する第2の抽出ステップと、前記クラスタップのアクティビティに基づいたクラス分類をするための閾値を指定する指定ステップと、指定した前記閾値と、前記クラスタップのアクティビティとを比較した結果に基づいて、前記注目画素を第1のクラスに分類する第1の分類ステップと、前記クラスタップのパターンに基づいて、前記注目画素を第2のクラスに分類する第2の分類ステップと、前記第1のクラスおよび前記第2のクラスにより特定される前記注目画素のクラスに対応する係数と、前記予測タップに基づいて、前記第2の画像データを演算する演算ステップとを含む。
本発明の第1の側面においては、第2の画像データの注目している画素である注目画素を予測するために用いる複数の画素が、第1の画像データから予測タップとして抽出され、注目画素を複数のクラスのうちのいずれかにクラス分けするクラス分類に用いる複数の画素が、第1の画像データから第1のクラスタップとして抽出され、第1のクラスタップのアクティビティに基づいたクラス分類をするための第1の閾値が指定され、指定された第1の閾値と、第1のクラスタップのアクティビティとを比較した結果に基づいて、注目画素が第1のクラスに分類され、第1のクラスタップのパターンに基づいて、注目画素が第2のクラスに分類され、第1のクラスおよび第2のクラスにより特定される注目画素のクラスに対応する第1の係数と、予測タップに基づいて、第2の画像データが演算される。
本発明の第2の側面の学習装置は、第1の画像データから第2の画像データを生成するために用いられる第1の係数を学習する学習装置において、前記第2の画像データに相当する画像データの注目している画素である注目画素を予測するために用いる複数の画素を、前記第1の画像データに相当する画像データから予測タップとして抽出する第1の抽出手段と、前記注目画素を複数のクラスのうちのいずれかにクラス分けするクラス分類に用いる複数の画素を、前記第1の画像データに相当する画像データから第1のクラスタップとして抽出する第2の抽出手段と、前記第1の画像データに相当する画像データのノイズ成分のアクティビティから求められる閾値と、前記第1のクラスタップのアクティビティとを比較した結果に基づいて、前記注目画素を第1のクラスに分類する第1の分類手段と、前記第1のクラスタップのパターンに基づいて、前記注目画素を第2のクラスに分類する第2の分類手段と、前記第1のクラスおよび前記第2のクラスにより特定される前記注目画素のクラスごとに、前記第1の画像データに相当する画像データと前記予測タップから前記第1の係数を演算する第1の演算手段とを備える。
前記第1の分類手段には、前記アクティビティが前記閾値を超える場合、原信号成分が支配的となる前記第1のクラスに属するように前記注目画素を分類させ、前記アクティビティが前記閾値よりも小さい場合、ノイズ成分が支配的となる前記第1のクラスに属するように前記注目画素を分類させることができる。
前記第1の画像データに相当する画像データの画質を指定するためのパラメータを入力する入力手段と、動きにより前記注目画素をクラス分けするクラス分類に用いる複数の画素を、前記第1の画像データに相当する画像データから第2のクラスタップとして抽出する第3の抽出手段と、前記第2のクラスタップの動きに基づいて、前記注目画素を第3のクラスに分類する第3の分類手段と、入力した前記パラメータに基づいて、前記第1のクラス、前記第2のクラス、および前記第3のクラスにより特定される前記注目画素のクラスごとに、前記第1の画像データに相当する画像データと前記予測タップから第2の係数を演算する第2の演算手段とをさらに設けることができる。
前記第2の係数には、前記パラメータに基づいて、前記第1のクラス、前記第2のクラス、および前記第3のクラスにより特定される前記注目画素のクラスに対応する前記第1の係数を生成するための元となる係数とさせることができる。
前記パラメータには、前記第1の画像データに相当する画像データの水平方向と垂直方向の解像度を示す値とさせることができる。
本発明の第2の側面の学習方法は、第1の画像データから第2の画像データを生成するために用いられる係数を学習する学習方法において、前記第2の画像データに相当する画像データの注目している画素である注目画素を予測するために用いる複数の画素を、前記第1の画像データに相当する画像データから予測タップとして抽出する第1の抽出ステップと、前記注目画素を複数のクラスのうちのいずれかにクラス分けするクラス分類に用いる複数の画素を、前記第1の画像データに相当する画像データからクラスタップとして抽出する第2の抽出ステップと、前記第1の画像データに相当する画像データのノイズ成分のアクティビティから求められる閾値と、前記クラスタップのアクティビティとを比較した結果に基づいて、前記注目画素を第1のクラスに分類する第1の分類ステップと、前記第クラスタップのパターンに基づいて、前記注目画素を第2のクラスに分類する第2の分類ステップと、前記第1のクラスおよび前記第2のクラスにより特定される前記注目画素のクラスごとに、前記第1の画像データに相当する画像データと前記予測タップから前記係数を演算する演算ステップとを含む。
本発明の第2の側面のプログラムは、第1の画像データから第2の画像データを生成するために用いられる係数を学習する学習処理をコンピュータに行わせるプログラムにおいて、前記第2の画像データに相当する画像データの注目している画素である注目画素を予測するために用いる複数の画素を、前記第1の画像データに相当する画像データから予測タップとして抽出する第1の抽出ステップと、前記注目画素を複数のクラスのうちのいずれかにクラス分けするクラス分類に用いる複数の画素を、前記第1の画像データに相当する画像データからクラスタップとして抽出する第2の抽出ステップと、前記第1の画像データに相当する画像データのノイズ成分のアクティビティから求められる閾値と、前記クラスタップのアクティビティとを比較した結果に基づいて、前記注目画素を第1のクラスに分類する第1の分類ステップと、前記第クラスタップのパターンに基づいて、前記注目画素を第2のクラスに分類する第2の分類ステップと、前記第1のクラスおよび前記第2のクラスにより特定される前記注目画素のクラスごとに、前記第1の画像データに相当する画像データと前記予測タップから前記係数を演算する演算ステップとを含む。
本発明の第2の側面においては、第2の画像データに相当する画像データの注目している画素である注目画素を予測するために用いる複数の画素が、第1の画像データに相当する画像データから予測タップとして抽出され、注目画素を複数のクラスのうちのいずれかにクラス分けするクラス分類に用いる複数の画素が、第1の画像データに相当する画像データから第1のクラスタップとして抽出され、第1の画像データに相当する画像データのノイズ成分のアクティビティから求められる閾値と、第1のクラスタップのアクティビティとを比較した結果に基づいて、注目画素が第1のクラスに分類され、第1のクラスタップのパターンに基づいて、注目画素が第2のクラスに分類され、第1のクラスおよび第2のクラスにより特定される注目画素のクラスごとに、第1の画像データに相当する画像データと予測タップから第1の係数が演算される。
以上のように、本発明の第1の側面によれば、より高画質の高解像度の画像を生成することができる。特に、本発明の第1の側面によれば、ノイズ成分による原波形の変化に応じてノイズを除去し、より高画質の高解像度の画像を生成することができる。
本発明の第2の側面によれば、より高画質の高解像度の画像を生成するための係数を生成することができる。
以下に本発明の実施の形態を説明するが、本発明の構成要件と、明細書または図面に記載の実施の形態との対応関係を例示すると、次のようになる。この記載は、本発明をサポートする実施の形態が、明細書または図面に記載されていることを確認するためのものである。従って、明細書または図面中には記載されているが、本発明の構成要件に対応する実施の形態として、ここには記載されていない実施の形態があったとしても、そのことは、その実施の形態が、その構成要件に対応するものではないことを意味するものではない。逆に、実施の形態が構成要件に対応するものとしてここに記載されていたとしても、そのことは、その実施の形態が、その構成要件以外の構成要件には対応しないものであることを意味するものでもない。
本発明の第1の側面の画像処理装置は、第1の画像データから第2の画像データを生成する画像処理装置(例えば、図13の出力画像生成装置112)において、前記第2の画像データの注目している画素である注目画素を予測するために用いる複数の画素を、前記第1の画像データから予測タップとして抽出する第1の抽出手段(例えば、図13の予測タップ抽出部206)と、前記注目画素を複数のクラスのうちのいずれかにクラス分けするクラス分類に用いる複数の画素を、前記第1の画像データから第1のクラスタップとして抽出する第2の抽出手段(例えば、図13のクラスタップ抽出部203)と、前記第1のクラスタップのアクティビティに基づいたクラス分類をするための第1の閾値を指定する指定手段(例えば、図13のノイズ加算量指定部202)と、指定した前記第1の閾値と、前記第1のクラスタップのアクティビティとを比較した結果に基づいて、前記注目画素を第1のクラスに分類する第1の分類手段(例えば、図13のDRクラス分類部204)と、前記第1のクラスタップのパターンに基づいて、前記注目画素を第2のクラスに分類する第2の分類手段(例えば、図13の波形クラス分類部205)と、前記第1のクラスおよび前記第2のクラスにより特定される前記注目画素のクラスに対応する第1の係数と、前記予測タップに基づいて、前記第2の画像データを演算する演算手段(例えば、図13の高解像度化処理部207)とを備える。
前記指定手段は、ユーザにより第2の閾値が指示された場合、指示された前記第2の閾値に基づいた値を、前記第1の閾値として指定し(例えば、図17のステップS46の処理を実行する図13のノイズ加算量指定部202)、前記ユーザにより前記第2の閾値が指示されなかった場合、前記第1の画像データから検出されるノイズレベルに基づいた値を、前記第1の閾値として指定する(例えば、図17のステップS45の処理を実行する図13のノイズ加算量指定部202)ことができる。
前記第1の分類手段は、前記アクティビティが前記第1の閾値を超える場合、原信号成分が支配的となる前記第1のクラスに属するように前記注目画素を分類し(例えば、図17のステップS53の処理を実行する図13のDRクラス分類部204)、前記アクティビティが前記第1の閾値よりも小さい場合、ノイズ成分が支配的となる前記第1のクラスに属するように前記注目画素を分類する(例えば、図17のステップS52の処理を実行する図13のDRクラス分類部204)ことができる。
前記演算手段は、前記第1のクラスに分類されている前記注目画素のうち、前記原信号成分が支配的となる前記第1のクラスに属している前記注目画素に対して、前記原信号成分を保ちながら前記ノイズ成分を除去するように演算し、前記ノイズ成分が支配的となる前記第1のクラスに属している前記注目画素に対して、前記ノイズ成分を除去するように演算する(例えば、図17のステップS55の処理を実行する図13の高解像度化処理部207)ことができる。
この第1の側面の画像処理装置には、前記第2の画像データの画質を指定するためのパラメータを入力する入力手段(例えば、図19の画質選択値入力部321)と、入力した前記パラメータに基づいて、前記第1の係数を生成するための元となる第2の係数から前記第1の係数を生成する生成手段(例えば、図19の係数データ生成部323)と、動きにより前記注目画素をクラス分けするクラス分類に用いる複数の画素を、前記第1の画像データから第2のクラスタップとして抽出する第3の抽出手段(例えば、図19の動きクラスタップ抽出部325)と、前記第2のクラスタップの動きに基づいて、前記注目画素を第3のクラスに分類する第3の分類手段(例えば、図19の動きクラス分類部326)とをさらに設け、前記演算手段は、前記第1のクラス、前記第2のクラス、および前記第3のクラスにより特定される前記注目画素のクラスに対応する前記第1の係数と、前記予測タップに基づいて、前記第2の画像データを演算する(例えば、図21のステップS118の処理)ことができる。
前記パラメータは、前記第2の画像データの水平方向と垂直方向の解像度を示す値であるようにすることができる。
本発明の第1の側面の画像処理方法またはプログラムは、第1の画像データから第2の画像データを生成する画像処理方法、または第1の画像データから第2の画像データを生成する画像処理をコンピュータに行わせるプログラムにおいて、前記第2の画像データの注目している画素である注目画素を予測するために用いる複数の画素を、前記第1の画像データから予測タップとして抽出し(例えば、図17のステップS47の処理)、前記注目画素を複数のクラスのうちのいずれかにクラス分けするクラス分類に用いる複数の画素を、前記第1の画像データからクラスタップとして抽出し(例えば、図17のステップS48の処理)、前記クラスタップのアクティビティに基づいたクラス分類をするための閾値を指定し(例えば、図17のステップS44乃至ステップS45の処理)、指定した前記閾値と、前記クラスタップのアクティビティとを比較した結果に基づいて、前記注目画素を第1のクラスに分類し(図17のステップS50乃至ステップS53の処理)、前記クラスタップのパターンに基づいて、前記注目画素を第2のクラスに分類し(図17のステップS54の処理)、前記第1のクラスおよび前記第2のクラスにより特定される前記注目画素のクラスに対応する係数と、前記予測タップに基づいて、前記第2の画像データを演算する(例えば、図17のステップS55の処理)ステップを含む。
本発明の第2の側面の学習装置は、第1の画像データから第2の画像データを生成するために用いられる第1の係数を学習する学習装置(例えば、図11の学習装置111)において、前記第2の画像データに相当する画像データの注目している画素である注目画素を予測するために用いる複数の画素を、前記第1の画像データに相当する画像データから予測タップとして抽出する第1の抽出手段(例えば、図11の予測タップ抽出部158)と、前記注目画素を複数のクラスのうちのいずれかにクラス分けするクラス分類に用いる複数の画素を、前記第1の画像データに相当する画像データから第1のクラスタップとして抽出する第2の抽出手段(例えば、図11のクラスタップ抽出部155)と、前記第1の画像データに相当する画像データのノイズ成分のアクティビティから求められる閾値と、前記第1のクラスタップのアクティビティとを比較した結果に基づいて、前記注目画素を第1のクラスに分類する第1の分類手段(例えば、図11のDRクラス分類部156)と、前記第1のクラスタップのパターンに基づいて、前記注目画素を第2のクラスに分類する第2の分類手段(例えば、図11の波形クラス分類部157)と、前記第1のクラスおよび前記第2のクラスにより特定される前記注目画素のクラスごとに、前記第1の画像データに相当する画像データと前記予測タップから前記第1の係数を演算する第1の演算手段(例えば、図11の係数学習部159)とを備える。
前記第1の分類手段は、前記アクティビティが前記閾値を超える場合、原信号成分が支配的となる前記第1のクラスに属するように前記注目画素を分類し(例えば、図16のステップS21の処理を実行する図11のDRクラス分類部156)、前記アクティビティが前記閾値よりも小さい場合、ノイズ成分が支配的となる前記第1のクラスに属するように前記注目画素を分類する(例えば、図16のステップS20の処理を実行する図11のDRクラス分類部156)ことができる。
この第2の側面の学習装置には、前記第1の画像データに相当する画像データの画質を指定するためのパラメータを入力する入力手段(例えば、図18の画質選択値入力部301)と、動きにより前記注目画素をクラス分けするクラス分類に用いる複数の画素を、前記第1の画像データに相当する画像データから第2のクラスタップとして抽出する第3の抽出手段(例えば、図18の動きクラスタップ抽出部303)と、前記第2のクラスタップの動きに基づいて、前記注目画素を第3のクラスに分類する第3の分類手段(例えば、図18の動きクラス分類部304)と、入力した前記パラメータに基づいて、前記第1のクラス、前記第2のクラス、および前記第3のクラスにより特定される前記注目画素のクラスごとに、前記第1の画像データに相当する画像データと前記予測タップから第2の係数を演算する第2の演算手段(例えば、図18の係数種学習部306)とを設けることができる。
前記第2の係数は、前記パラメータに基づいて、前記第1のクラス、前記第2のクラス、および前記第3のクラスにより特定される前記注目画素のクラスに対応する前記第1の係数を生成するための元となる係数であるようにすることができる。
前記パラメータは、前記第1の画像データに相当する画像データの水平方向と垂直方向の解像度を示す値であるようにすることができる。
本発明の第2の側面の学習方法またはプログラムは、第1の画像データから第2の画像データを生成するために用いられる係数を学習する学習方法、または第1の画像データから第2の画像データを生成するための用いられる係数を学習する学習処理をコンピュータに行わせるプログラムにおいて、前記第2の画像データに相当する画像データの注目している画素である注目画素を予測するために用いる複数の画素を、前記第1の画像データに相当する画像データから予測タップとして抽出し(例えば、図16のステップS15の処理)、前記注目画素を複数のクラスのうちのいずれかにクラス分けするクラス分類に用いる複数の画素を、前記第1の画像データに相当する画像データからクラスタップとして抽出し(例えば、図16のステップS16の処理)、前記第1の画像データに相当する画像データのノイズ成分のアクティビティから求められる閾値と、前記クラスタップのアクティビティとを比較した結果に基づいて、前記注目画素を第1のクラスに分類し(例えば、図16のステップS18乃至ステップS21の処理)、前記第クラスタップのパターンに基づいて、前記注目画素を第2のクラスに分類し(例えば、図16のステップS22の処理)、前記第1のクラスおよび前記第2のクラスにより特定される前記注目画素のクラスごとに、前記第1の画像データに相当する画像データと前記予測タップから前記係数を演算する(例えば、図16のステップS24の処理)ステップを含む。
以下、図面を参照しながら本発明の実施の形態について説明する。
図1は、本発明を適用した画像変換装置1の一実施の形態の構成を示すブロック図である。画像変換装置1は、巡回型IP変換部11、出力位相変換部12、自然画予測部13、人工画予測部14、自然画人工画判定部15、および合成部16により構成される。また、巡回型IP変換部11は、IP変換部21および巡回型変換部22により構成される。
巡回型IP変換部11のIP変換部21および巡回型変換部22には、処理対象となるインターレース方式のSD(Standard Definition)画像が入力される。
IP変換部21は、所定の方法に基づいて、入力されたインターレース方式のSD画像(以下、入力画像とも称する)をプログレッシブ方式のHD(High Definition)画像(以下、中間画像とも称する)にIP変換し、IP変換したプログレッシブ方式のHD画像を巡回型変換部22に供給する。
巡回型変換部22は、入力画像と、1フレーム前に巡回型変換部22から出力されたプログレッシブ方式のHD画像(以下、出力画像とも称する)との間の動きベクトルを求める。巡回型変換部22は、入力画像の画素値と、求めた動きベクトルに基づいて、出力画像に動き補償を施した画像の画素値とを、巡回係数を用いて重み付け加算することにより、中間画像の画質を向上させる。巡回型変換部22は、中間画像をより高画質のプログレッシブ方式のHD画像である出力画像に変換し、出力画像を出力位相変換部12に供給する。
なお、巡回係数は、中間画像の各画素について、変換前の入力画像において画素が存在する位置にあるか否か、動きベクトルの垂直方向の大きさ、および動きベクトルの確からしさを表す信頼度に基づいて設定される。
出力位相変換部12は、巡回型変換部22から供給されるHD画像に対して、水平方向および垂直方向に補間を行うことにより、より高画質のHD画像を生成する。出力位相変換部12は、そのHD画像を、自然画予測部13、人工画予測部14、および自然画人工画判定部15に供給する。
自然画予測部13は、出力位相変換部12から供給されるHD画像から、そのHD画像に比べて高品質なHD画像(以下、自然高品質画像と称する)を予測する。具体的には、自然画予測部13は、HD画像の特徴に応じて、そのHD画像から求められる自然高品質画像の画素である注目画素を、自然画像の特徴に適したクラスに分類する。そして、自然画予測部13は、そのクラスに対応する、自然高品質画像を予測するための予測係数と、HD画像とを用いて演算することにより、出力位相変換部12から供給されたHD画像から、自然高品質画像を予測する。自然画予測部13は、その自然高品質画像を合成部16に供給する。
ここで、自然画像とは、後述する人工画像ではない画像のことであり、自然界に存在するものをそのまま撮像することにより得られる画像である。
人工画予測部14は、自然画予測部13と同様に、出力位相変換部12から供給されるHD画像から、そのHD画像に比べて高品質なHD画像(以下、人工高品質画像と称する)を予測する。具体的には、人工画予測部14は、HD画像の特徴に応じて、そのHD画像から求められる人工高品質画像の画素である注目画素を、人工画像の特徴に適したクラスに分類する。そして、人工画予測部14は、そのクラスに対応する、人工高品質画像を予測するための予測係数と、HD画像とを用いて演算することにより、出力位相変換部12から供給されたHD画像から、人工高品質画像を予測する。人工画予測部14は、その人工高品質画像を合成部16に出力する。
ここで、人工画像とは、文字や単純な図形などの、階調が少なく位相情報であるエッジ位相情報がはっきりした、すなわち、平坦部分が多い人工的な画像である。換言すれば、人工画像は、文字や単純図形などの階調があまり無く、輪郭などの位相情報が支配的になっている画像である。
自然画人工画判定部15は、出力位相変換部12より供給されるHD画像の各画素について、人工画像に分類される領域、または、自然画像に分類される領域のいずれの領域に属するかを判定し、判定結果を人工画率として合成部16に出力する。すなわち、人工画率とは、人工画像と自然画像との中間に分類される領域において自然画像における人工画像の割合を0乃至1の値で示したものである。
合成部16は、自然画人工画判定部15より供給される判定結果に基づいて、自然画予測部13から供給される自然高品質画像の各画素の画素値と、人工画予測部14から供給される人工高品質画像の各画素の画素値とを人工画率に応じた割合で合成する。
次に、図2のフローチャートを参照して、図1の画像変換装置1により実行される画像変換処理を説明する。なお、この処理は、例えば、外部から画像I1の入力が開始されたとき開始される。
ステップS1において、IP変換部21は、IP変換処理を行う。具体的には、IP変換部21は、外部から入力されるインターレース方式の画像I1をIP変換することにより、画像P1を生成する。
また、画像I1をそのままIP変換するのではなく、IP変換する前に、ノイズ除去などの画質を向上させる画像処理を画像I1に施すようにしてもよい。
ステップS2において、巡回型変換部22は、巡回型変換処理を行う。巡回型変換処理により、画像P1がより高画質の画像P2に変換され、画像P2が出力位相変換部12に供給される。
ステップS3において、出力位相変換部12は、出力位相変換処理を行う。具体的には、出力位相変換部12は、巡回型変換部22から供給されるSD画像に対して、水平方向および垂直方向に補間を行うことにより、HD画像を生成する。出力位相変換部12は、そのHD画像を、自然画予測部13、人工画予測部14、および自然画人工画判定部15に供給する。
ステップS4において、自然画予測部13は、自然画予測処理を行う。具体的には、自然画予測部13は、出力位相変換部12から供給されるHD画像から、そのHD画像に比べて高品質な自然高品質画像を予測する。すなわち、自然画予測部13は、HD画像の特徴に応じて、そのHD画像から求められる自然高品質画像の画素である注目画素を、自然画像の特徴に適したクラスに分類する。そして、自然画予測部13は、そのクラスに対応する、自然高品質画像を予測するための予測係数と、HD画像とを用いて演算することにより、出力位相変換部12から供給されたHD画像から、自然高品質画像を予測する。自然画予測部13は、その自然高品質画像を合成部16に供給する。
ステップS5において、人工画予測部14は、人工画予測処理を行う。具体的には、人工画予測部14は、自然画予測部13と同様に、出力位相変換部12から供給されるHD画像から、そのHD画像に比べて高品質な人工高品質画像を予測する。すなわち、人工画予測部14は、HD画像の特徴に応じて、そのHD画像から求められる人工高品質画像の画素である注目画素を、人工画像の特徴に適したクラスに分類する。そして、人工画予測部14は、そのクラスに対応する、人工高品質画像を予測するための予測係数と、HD画像とを用いて演算することにより、出力位相変換部12から供給されたHD画像から、人工高品質画像を求める。人工画予測部14は、その人工高品質画像を合成部16に出力する。
ステップS6において、自然画人工画判定部15は、自然画人工画判定処理を行う。具体的には、自然画人工画判定部15は、出力位相変換部12より供給されるHD画像の各画素について、人工画像に分類される領域、または、自然画像に分類される領域のいずれの領域に属するかを判定し、判定結果を人工画率として合成部16に出力する。
ステップS7において、合成部16は、画像を合成する。具体的には、合成部16は、自然画人工画判定部15より供給される判定結果に基づいて、自然画予測部13から供給される自然高品質画像の各画素の画素値と、人工画予測部14から供給される人工高品質画像の各画素の画素値とを人工画率に応じた割合で合成する。合成部16は、合成した画像を後段の装置に出力する。
なお、複数の画像の画像変換を連続して行う場合、上述したステップS1乃至ステップS7の処理が繰り返し実行される。
次に、図3乃至図21を参照して、図1のIP変換部21が行うIP変換処理の一例として、クラス分類適応処理を用いたIP変換処理について説明する。すなわち、例えば、図1のIP変換部21は、図3を参照して後述する出力画像生成装置112に対応しており、出力画像生成装置112は、外部から入力される画像I1をIP変換することにより、画像P1を生成する。なお、以下の説明では、画像I1をSD画像、画像P1をHD画像として説明する。
図3は、本発明を適用した画像処理システム101の原理的構成を説明する図である。
図3に示されるように、画像処理システム101は、学習装置111と出力画像生成装置112の2つの装置で構成されている。このうちの出力画像生成装置112がIP変換部21に対応している。
学習装置111においては、入力される画像に対して、後述する学習により、従来から用いられていた波形クラス分類とともに、DRクラス分類を行うことで、クラスごとの予測係数が、入力波形においてノイズ成分が支配的なクラスの係数群であるDR小クラス係数群C1と、原信号成分が支配的なクラスの係数群であるDR大クラス係数群C2とのいずれかに分類される。
また、出力画像生成装置112においても、入力される画像に対して、波形クラス分類とともに、DRクラス分類を行うことで、学習によりDR小クラス係数群C1とDR大クラス係数群C2とに分類されているクラスの予測係数を用いて、例えば、ノイズ除去処理や、DRC(Digital Reality Creation)処理のような高解像度化処理を行うことにより、高解像度の画像が生成される。
なお、学習装置111に入力される高画質画像信号は、高解像度の画像信号であるHD画像信号であるとし、そのHD画像信号を変換することにより得られる画像信号は、例えば、標準解像度の画像信号であるSD画像信号であるとする。また、出力画像生成装置112に入力される画像信号は、SD画像信号であるとし、そのSD画像信号を変換することにより得られる高画質画像信号は、HD画像信号であるとする。なお、以下、適宜、SD画像信号に対応する画像をSD画像とも称し、HD画像信号に対応する画像をHD画像とも称する。
具体的には、学習装置111は、学習により、DR小クラス係数群C1またはDR大クラス係数群C2のいずれか一方に分類される予測係数をクラスごと生成する。すなわち、図4に示されるように、学習装置111は、教師画像信号としてのHD画像信号から、縮小処理により生徒信号としてのSD画像信号を生成し、そのSD画像信号に対して、ノイズ成分を付加して生徒画像信号としてのSD画像信号を生成する。そして、学習装置111は、生徒画像信号としてのノイズ成分が付加されたSD画像信号(以下、ノイズ付加SD画像信号と称し、ノイズ付加SD画像信号に対応する画像をノイズ付加SD画像と称する)と、教師画像信号としてのHD画像信号に基づいて、波形クラス分類およびDRクラス分類の処理を行い、クラスごとの予測係数を学習する。その結果、学習装置111は、DR小クラス係数群C1またはDR大クラス係数群C2のいずれか一方に分類される予測係数をクラスごとに生成することになる。
ここで、波形クラス分類とは、例えば、ADRC(Adaptive Dynamic Range Coding)などにより、生成する画像(予測画像)を構成する画素を、順次、注目画素とし、さらにその注目画素を、幾つか(複数)のクラスのうちのいずれかにクラス分けする処理をいう。なお、クラス分類を行うのに用いる複数の画素、またはその画素値のことをクラスタップという。
DRクラス分類とは、クラスタップのアクティビティに基づいたクラス分類をするための所定の閾値と、クラスタップのアクティビティとを比較し、その結果により、注目画素をDR小クラス係数群C1とDR大クラス係数群C2とにクラス分けする処理をいう。これにより、波形クラス分類の有効性を評価し、ノイズ除去性能と高解像度信号予測性能の両者を適応的なバランスで用いることが可能となる。
また、学習装置111におけるDRクラス分類では、ノイズ成分が持つアクティビティと、入力信号のアクティビティとの比較の結果によってクラス分類されることになる。
すなわち、上述したように、ノイズ付加SD画像信号は、基となるSD画像信号に、ノイズ成分を付加することで生成されるが、ノイズ付加SD画像信号のアクティビティとSD画像信号のアクティビティとの関係を見た場合、図5に示すように、ノイズ付加SD画像信号のアクティビティは、SD画像信号のアクティビティの大きさに対する、付加されるノイズ成分のアクティビティの大きさによって変化する。
なお、アクティビティとは、例えば、ダイナミックレンジ、隣接している画素間の差分の絶対値の総和、または画素値の分散などの、画素の画素値の変化の大きさを示す値である。なお、以下、便宜的に、アクティビティをDRとも称して説明する。
図5のグラフは、SD画像信号とノイズ成分から生成されるノイズ付加SD画像信号の波形を示している。図5において、6つのグラフのうち、左側の2つのグラフはSD画像信号の波形を示し、中央の2つのグラフはノイズ成分の波形を示し、右側の2つのグラフはノイズ付加SD画像信号の波形を示している。また、図5の6つのグラフのうち、上側の3つのグラフはSD画像信号のアクティビティが小さい場合のグラフを示し、下側の3つのグラフはSD画像信号のアクティビティが大きい場合のグラフを示している。
すなわち、図中下側の3つのグラフで示すように、SD画像信号のアクティビティが充分大きい場合、ノイズ成分が付加されても、ノイズ付加SD画像信号の波形が、ノイズ成分から受ける影響は比較的小さく、ほぼSD画像信号の波形が保持されている。
それに対して、図中上側の3つのグラフで示すように、SD画像信号のアクティビティが小さい場合、相対的にノイズ成分のアクティビティが大きくなり、ノイズ付加SD画像信号の波形は、ノイズ成分にマスクされ、ノイズ成分の影響が無視できない状態になる。
具体的には、図中上側のノイズ成分のグラフでは、そのアクティビティが-3から5までの間の値であるが、図中上側のSD画像信号のグラフでは、そのアクティビティが10から14までの間の値となっており、ノイズ成分よりもSD画像信号のほうが、アクティビティが小さくなっている。この場合、図中上側のノイズ付加SD画像信号のグラフでは、ノイズが乗っている波形の情報がノイズにマスクされている。
すなわち、ノイズ付加SD画像信号のアクティビティの値が、ノイズ成分のアクティビティの値と同程度か、またはそれよりも小さくなる場合、ノイズにマスクされて、入力されるSD画像信号の波形が残らない可能性が非常に高くなる。そこで、ノイズ付加SD画像信号のアクティビティに対して、所定の閾値を用いて判定を行うことにより、ノイズ成分の影響を大きく受けるノイズ付加SD画像信号と、ノイズの影響がそれほど大きくないノイズ付加SD画像信号とを別クラスに分けるようにする。
具体的には、学習により、図5の上側に示したような、例えば、ノイズ付加SD画像信号のアクティビティが小さい波形のクラスでは、入力波形の情報に多く含まれているノイズを除去するための、DR小クラス係数群C1に属する予測係数が生成され、図5の下側に示すような、ノイズ付加SD画像信号のアクティビティが大きな波形のクラスでは、入力波形の概形をある程度保ちつつノイズを除去するための、DR大クラス係数群C2に属する予測係数が生成される。
なお、図5のSD画像信号とノイズ付加SD画像信号のグラフにおいては、説明を分かり易くするために、図中上側と下側のグラフにおける縦軸のスケールを変えている(SD画像信号のグラフでは0乃至16と0乃至35、ノイズ付加SD画像信号のグラフでは0乃至18と0乃至35)。
画像処理装置としての出力画像生成装置112は、学習装置111により生成された予測係数を、入力される入力画像に適用して、出力画像を生成し、出力する。すなわち、図6に示されるように、出力画像生成装置112は、入力されるSD画像に対して、波形クラス分類およびDRクラス分類の処理を行うことにより、そのSD画像の特徴に応じて、注目画素を、DR小クラス係数群C1またはDR大クラス係数群C2に属するクラスに分類する。そして、出力画像生成装置112は、SD画像と、学習装置111において、あらかじめ学習しておいたDR小クラス係数群C1またはDR大クラス係数群C2に属しているクラスごとの予測係数とを用いて、高解像度化処理を行うことによりHD画像を生成する。
DRクラス分類の方法は、入力されるSD画像信号のアクティビティが、所定の閾値を超えるかによりクラスを分ける。具体的には、図5の上側のグラフで示したように、ノイズ付加SD画像信号である、SD画像信号のアクティビティが所定の閾値よりも小さい場合、そのクラスは、DR小クラス係数群C1に属するように分類される。これにより、高解像度化処理においては、SD画像信号は、その波形の情報に多く含まれているノイズを積極的に除去するように処理される。また、図5の下側のグラフで示したように、ノイズ付加SD画像信号である、SD画像信号のアクティビティが所定の閾値を超える場合、そのクラスは、DR大クラス係数群C2に属するように分類される。これにより、高解像度化処理においては、SD画像信号は、その波形の概形をある程度保ちつつノイズを除去するように処理される。
また、DRクラス分類に用いる閾値は、図6に示されるように、外部から指定される。例えば、図7に示されるように、ノイズのアクティビティ(以下、ノイズアクティビティと称する)を検出する回路(以下、ノイズ検出回路と称する)が設けられる。ノイズ検出回路は、例えば、入力されるSD画像信号からノイズアクティビティを検出し、検出された検出値(以下、ノイズアクティビティ検出値と称する)に基づいて、動的に閾値を指定する。
具体的には、画像信号は、例えば、MPEG2(Moving Picture Experts Group phase 2)などの方式で圧縮され、伝送される。この場合、離散コサイン変換(DCT(Discrete Cosine Transformation))が行われる。図8に示すように、デジタル画像のフレームは、圧縮の単位であるブロック(以下、DCT処理ブロックと称する)に分けられ(図8では9×14(個)のDCT処理ブロックに分けられ)、各DCT処理ブロックごとに離散コサイン変換が行われる。このためDCT処理ブロックの境界においてブロックノイズが発生する場合がある。そこで、ノイズ検出回路において、このブロックノイズをノイズアクティビティとして検出することができる。
具体的には、図9の左側に示すように、図8のデジタル画像のフレームにおいて、あるブロック境界bにおける境界画素の画素値a1と、この境界画素に対して、ブロック境界線bと直交する方向に隣接する画素の画素値を、それぞれ、画素値a0と画素値a2とし、図9の右側に示すように、境界画素における2次微分値の絶対値を|d|とした場合、絶対値|d|は、次式で表される。
|d|=|(a0−a1)−(a1−a2)|・・・(1)
一般的に、絶対値|d|は、ブロックノイズが大きいほど、値が大きくなる傾向にあるので、絶対値|d|を入力された画像信号に含まれるノイズアクティビティであると考えることが可能となる。すなわち、ノイズ検出回路は、ノイズアクティビティ検出値として絶対値|d|を検出し、その検出された絶対値|d|を用いて、所定の閾値を指定する。
なお、ノイズアクティビティを検出する方法は、上述した例に限らず、例えば、特開2000−350202号公報に開示されている、デジタルノイズ検出に用いられている特徴量を使用することができる。
また、DRクラス分類に用いる閾値は、ユーザにより指定されるようにしてもよい。図10に示すように、ユーザにより閾値が指定される場合、ユーザは、自分の判断で所定の閾値を設定する。この場合、ユーザは、生成するHD画像信号において、どの範囲の信号成分の波形を除去し、どの範囲の信号成分の波形を保つかを選択できる。さらにまた、ユーザが所定の値を指定し、その指定された値に基づいて、動的に閾値を変更して設定することもできる。その結果、ユーザは、ノイズ除去の効果の特性をコントロールすることが可能となる。
このように、出力画像生成時のDRクラス分類の基準値(閾値)を、例えば、ノイズ検出回路やユーザの操作などにより指定することができるようにすることで、学習環境時と一致している場合に限らず、学習環境時とは異なる特性のノイズに対しても対応可能となり、様々な環境で適応的に、より高質の画像を生成することができる。
図11は、学習装置111のより具体的な機能的構成例を示すブロック図である。
学習装置111は、画像入力部151、縮小画像生成部152、ノイズ加算量指定部153、ノイズ成分加算部154、クラスタップ抽出部155、DRクラス分類部156、波形クラス分類部157、予測タップ抽出部158、係数学習部159、および係数記録部160を含むようにして構成される。
画像入力部151は、フレームまたはフィールド単位などにより入力される教師画像としてのHD画像信号を、縮小画像生成部152および係数学習部159に供給する。このHD画像信号は、後述する図13の高解像度化処理部207が生成、出力するHD画像信号に相当する画像信号である。
縮小画像生成部152は、画像入力部151から供給されるHD画像信号に基づいて、HD画像の解像度を落とした縮小画像(SD画像)を生成する。縮小画像生成部152は、生成したSD画像に対応するSD画像信号をノイズ成分加算部154に供給する。
ノイズ加算量指定部153は、生成する係数データが最適となるように、SD画像信号に加算させるノイズ成分のノイズアクティビティを指定し、指定したノイズアクティビティに基づいたノイズ成分をノイズ成分加算部154に供給する。また、ノイズ加算量指定部153は、指定したノイズアクティビティからDR閾値を求め、求められたDR閾値をDRクラス分類部156に供給する。
ここで、DR閾値とは、DRクラス分類を行うときの基準となる閾値である。例えば、DR閾値には、ノイズ成分が持つアクティビティが指定され、DRクラス分類では、その指定されたDR閾値と、入力信号のアクティビティとが比較されることによって、クラス分類が行われる。
ノイズ成分加算部154は、縮小画像生成部152から供給されるSD画像信号に、ノイズ加算量指定部153から供給されるノイズ成分を加算して、生徒画像としてのノイズ付加SD画像信号を生成する。ノイズ成分加算部154は、生成されたノイズ付加SD画像信号をクラスタップ抽出部155および予測タップ抽出部158に供給する。このノイズ付加SD画像信号成分は、後述する図13の低解像度画像入力部201より出力されるSD画像信号に相当する画像信号である。
なお、ノイズ加算量指定部153において指定されたノイズアクティビティをノイズ成分加算部154に供給することにより、ノイズ成分加算部154に、そのノイズアクティビティに基づいたノイズ成分を生成させ、SD画像信号に付加させるようにしてもよい。
クラスタップ抽出部155は、ノイズ成分加算部154から供給されるノイズ付加SD画像信号を変換して得ようとするHD画像信号を構成する画素を、順次、注目画素とし、さらに、その注目画素を、幾つか(複数)のクラスのうちのいずれかにクラス分けするクラス分類を行うのに用いる複数の画素の画素値をクラスタップとして、ノイズ成分加算部154から供給されるノイズ付加SD画像信号から抽出する。クラスタップ抽出部155は、抽出したクラスタップをDRクラス分類部156および波形クラス分類部157に供給する。
DRクラス分類部156は、クラスタップ抽出部155から供給されるクラスタップを構成する画素の画素値から求められるアクティビティ(以下、クラスタップDRと称する)と、ノイズ加算量指定部153から供給されるDR閾値とを比較し、比較の結果に基づいて、DRクラス分類を行う。DRクラス分類部156は、DRクラス分類の結果をDRクラス番号として、係数学習部159に供給する。
波形クラス分類部157は、クラスタップ抽出部155から供給されるクラスタップを構成する画素に基づいて、すなわち、各位置のクラスタップの画素値のパターンに基づいて(つまり波形に基づいて)、注目画素を波形クラス分類する。波形クラス分類部157は、波形クラス分類の結果得られるクラスに対応する波形クラス番号を、係数学習部159に供給する。なお、DRクラス分類部156と波形クラス分類部157の詳細は図12を参照して後述する。
予測タップ抽出部158は、注目画素の画素値を予測するのに用いる複数の画素の画素値を予測タップとして、ノイズ成分加算部154から供給されるノイズ付加SD画像信号から抽出する。予測タップ抽出部158は、抽出した予測タップを係数学習部159に供給する。
具体的には、予測タップ抽出部158は、注目画素に対応するノイズ付加SD画像の画素に対して、空間的または時間的に近い位置にある複数の画素を、ノイズ付加SD画像信号から、予測タップとして抽出する。予測タップ抽出部158は、例えば、ノイズ付加SD画像信号の、注目画素に対応する位置に最も近い画素と、その画素に空間的に隣接する画素などを予測タップとして抽出する。
なお、予測タップとクラスタップは、同一のタップ構造を有するものとすることも、異なるタップ構造を有するものとすることも可能である。
係数学習部159には、画像入力部151から供給されるHD画像信号、波形クラス分類部157から供給される波形クラス番号、および予測タップ抽出部158から供給される予測タップの他に、DRクラス分類部156からDRクラス番号が供給される。係数学習部159は、教師画像としてのHD画像信号を構成する画素のうちの注目画素と、生徒画像としての予測タップを構成する画素とを対象とした足し込みを、波形クラス番号とDRクラス番号に基づいたクラスごとに行う。
すなわち、生徒画像としてのノイズ付加SD画像上の予測タップを構成する画素の画素値をT1,T2,T3,・・・,Ti,・・・,Tnとし、各予測タップに対応する係数データをそれぞれW1,W2,W3,・・・,Wi,・・・,Wnとし、教師画像としてのHD画像上の画素の画素値を求める所定の予測演算として、例えば、線形1次式を採用することとすると、HD画像上の画素の画素値L'は、次の線形1次式によって求められる。
L'=W11+W22+・・・+Wii+・・・+Wnn・・・(2)
実際のHD画像上の画素の画素値としての真値をLとすると、その予測誤差eは、次式で表される。
Figure 2007251690
この誤差eに対して、最小自乗法を適用して、次式が得られる。
Figure 2007251690
上記式から、次の正規方程式が得られる。
Figure 2007251690
係数学習部159は、この正規方程式を、クラスごとにたて、例えば、掃き出し法(Gauss-Jordanの消去法)などで解くことにより、係数データWnをクラスごとに算出する。
係数学習部159は、算出した係数データWnを係数記録部160に供給する。
なお、例えば、波形クラス番号のコードと、DRクラス番号のコードを表すビット列とを一列に並べたビット列などを、注目画素のクラスを表すクラスコードとして表すことが可能である。
係数記録部160は、係数学習部159から供給される係数データを記録する。このとき、係数データは、クラスごとに求められているが、各クラスは、波形クラス番号とDRクラス番号に基づいて分類されているので、波形クラスで分類されているとともに、DRクラスでも分類されていることになる。換言すれば、係数データは、DR小クラス係数群C1またはDR大クラス係数群C2のいずれかに属しているクラスの予測係数となる。
図11のDRクラス分類部156と波形クラス分類部157は、図12に示されるように構成される。この構成例においては、DRクラス分類部156は、ダイナミックレンジ演算部181、判定部182、およびクラス番号出力部183により構成され、波形クラス分類部157は、クラス番号出力部191により構成される。
ダイナミックレンジ演算部181は、クラスタップ抽出部155から供給されるクラスタップを構成する画素の画素値から求められるクラスタップDRを演算する。ダイナミックレンジ演算部181は、演算したクラスタップDRを判定部182に供給する。
判定部182は、ダイナミックレンジ演算部181から供給されるクラスタップDRと、ノイズ加算量指定部153から供給されるDR閾値とを比較し、クラスタップDRがDR閾値以上となるかを判定する。判定部182は、判定結果をクラス番号出力部183に供給する。
クラス番号出力部183は、判定部182から供給される判定結果に基づいて、DRクラス番号を係数学習部159に出力する。具体的には、例えば、クラス番号出力部183は、判定部182からの判定結果が、クラスタップDRがDR閾値以上であることを示している場合、1であるDRクラス番号を係数学習部159に出力し、クラスタップDRがDR閾値よりも小さいことを示している場合、0であるDRクラス番号を係数学習部159に出力する。
すなわち、0であるDRクラス番号が出力されたクラスは、DR小クラス係数群C1に属し、1であるDRクラス番号が出力されたクラスは、DR大クラス係数群C2に属することになり、これにより、DRクラス分類が行われる。
クラス番号出力部191は、クラスタップ抽出部155からのクラスタップを構成する画素に基づいて、波形クラス分類を行う。クラス番号出力部191は、波形クラス分類の結果得られるクラスに対応する波形クラス番号を係数学習部159に出力する。
波形クラス分類を行う方法としては、上述したように、例えば、ADRCなどを採用することができる。ADRCを用いる方法では、クラスタップを構成する画素の画素値が、ADRC処理され、その結果得られるADRCコードにしたがって、注目画素のクラスが決定される。
例えば、KビットADRCにおいては、クラスタップを構成する画素の画素値の最大値MAXと最小値MINが検出され、DR1=MAX-MINを、集合の局所的なダイナミックレンジとし、このダイナミックレンジDR1に基づいて、クラスタップを構成する画素がKビットに再量子化される。すなわち、クラスタップを構成する各画素の画素値から、最小値MINが減算され、その減算値がDR1/2Kで除算される。そして、以上のようにして得られる、クラスタップを構成するKビットの各画素の画素値を、所定の順番で並べたビット列が、ADRCコードとして出力される。したがって、クラスタップが、例えば、1ビットADRC処理された場合には、そのクラスタップを構成する各画素の画素値は、最大値MAXと最小値MINとの平均値で除算され、これにより、各画素の画素値が1ビットとされる。そして、その1ビットの画素値を所定の順番で並べたビット列が、ADRCコードとして出力される。クラス番号出力部191は、このようにして、クラスタップをADRC処理して得られるADRCコードを、波形クラス番号として出力する。
なお、クラス番号出力部191は、その他、例えば、クラスタップを構成する画素を、ベクトルのコンポーネントとみなし、そのベクトルをベクトル量子化することなどによって、クラス分類を行うことも可能である。
図13は、画像処理装置としての出力画像生成装置112のより具体的な機能的構成例を示すブロック図である。
出力画像生成装置112は、低解像度画像入力部201、ノイズ加算量指定部202、クラスタップ抽出部203、DRクラス分類部204、波形クラス分類部205、予測タップ抽出部206、高解像度化処理部207、係数保持部208、および高解像度画像出力部209を含むようにして構成される。なお、クラスタップ抽出部203、DRクラス分類部204、波形クラス分類部205、および予測タップ抽出部206は、図11のクラスタップ抽出部155、DRクラス分類部156、波形クラス分類部157、および予測タップ抽出部158と同一の構成とされている。
低解像度画像入力部201は、フレームまたはフィールド単位などにより入力されるSD画像信号を、ノイズ加算量指定部202、クラスタップ抽出部203、および予測タップ抽出部206に供給する。
ノイズ加算量指定部202は、最適にDRクラスを分類させるDR閾値をDRクラス分類部204に供給する。具体的には、ノイズ加算量指定部202は、ユーザにより所定の閾値が指定された場合、その閾値をDR閾値としてDRクラス分類部204に供給する。また、ノイズ加算量指定部202は、ユーザにより閾値が指定されていない場合、例えば、図7を参照して上述したノイズ検出回路などを内蔵し、ユーザにより閾値が指定されていない場合、低解像度画像入力部201から供給されるSD画像信号から、ノイズアクティビティ検出値を検出し、そのノイズアクティビティ検出値に基づいたDR閾値をDRクラス分類部204に供給する。ノイズ加算量指定部202の詳細は図14を参照して後述する。
クラスタップ抽出部203は、低解像度画像入力部201から供給されるSD画像信号を変換して得ようとするHD画像信号を構成する画素を、順次、注目画素として、SD画像信号からクラスタップを抽出する。クラスタップ抽出部203は、抽出したクラスタップをDRクラス分類部204および波形クラス分類部205に供給する。
DRクラス分類部204は、クラスタップ抽出部203から供給されるクラスタップを構成する画素の画素値から求められるクラスタップDRと、ノイズ加算量指定部202から供給されるDR閾値とを比較し、比較の結果に基づいて、DRクラス分類を行う。DRクラス分類部204は、DRクラス分類の結果をDRクラス番号として、高解像度化処理部207に供給する。
波形クラス分類部205は、クラスタップ抽出部203から供給されるクラスタップを構成する画素に基づいて、注目画素を波形クラス分類する。波形クラス分類部205は、波形クラス分類の結果得られるクラスに対応する波形クラス番号を、高解像度化処理部207に供給する。DRクラス分類部204と波形クラス分類部205の詳細は図15を参照して後述する。
予測タップ抽出部206は、注目画素の画素値を予測するのに用いる複数の画素の画素値である予測タップを、低解像度画像入力部201から供給されるSD画像信号から抽出する。予測タップ抽出部206は、抽出した予測タップを高解像度化処理部207に供給する。
具体的には、予測タップ抽出部206は、注目画素に対応するSD画像の画素に対して、空間的または時間的に近い位置にある複数の画素を、SD画像信号から予測タップとして抽出する。
係数保持部208は、上述した学習装置111による学習によって、所定のクラスごとに求められ、係数記録部160に記録された係数である係数データを保持している。上述したように、この係数データは、クラスごとに求められているが、各クラスは、波形クラス番号とDRクラス番号に基づいて分類されているので、波形クラスで分類されているとともに、DRクラスでも分類されている。
高解像度化処理部207には、波形クラス分類部205から供給される波形クラス番号、および予測タップ抽出部206から供給される予測タップの他に、DRクラス分類部204からDRクラス番号が供給される。高解像度化処理部207は、係数保持部208から、DRクラス番号と波形クラス番号に基づいたクラス対応するアドレスに記憶されている係数データを取得する。そして、高解像度化処理部207は、取得した係数データと予測タップとを用いて、注目画素の真値の予測値を求める、例えば、式(2)などの所定の予測演算を行う。これにより、高解像度化処理部207は、注目画素の画素値の予測値、すなわち、HD画像信号を構成する画素の画素値を求めて、高解像度画像出力部209に供給する。
高解像度画像出力部209は、例えば、高解像度化処理部207から供給されるHD画像信号に対応したHD画像を外部の機器に出力し、表示させる。
また、図13のノイズ加算量指定部202は、図14に示されるように構成される。この構成例においては、ノイズ加算量指定部202は、ノイズ成分検出部221、判定部222、およびDR閾値出力部223を含むようにして構成される。
ノイズ成分検出部221は、例えば、図7を参照して上述した、ノイズ検出回路などからなり、低解像度画像入力部201から供給されるSD画像信号からノイズレベルを検出することにより、ノイズアクティビティ検出値を検出する。ノイズ成分検出部221は、検出したノイズアクティビティ検出値を判定部222に供給する。
判定部222は、ユーザにより所定の閾値が指示されたかを判定する。判定部222は、ユーザにより所定の閾値が指示された場合、その閾値をDR閾値出力部223に供給する。また、判定部222は、ユーザにより所定の閾値が指示されていない場合、ノイズ成分検出部221から供給されたノイズアクティビティ検出値をDR閾値出力部223に供給する。
DR閾値出力部223は、判定部222の判定結果に基づいて、判定部222から供給される閾値に基づいたDR閾値をDRクラス分類部204に出力する。また、DR閾値出力部223は、判定部222の判定結果に基づいて、判定部222から供給されるノイズアクティビティ検出値に基づいたDR閾値をDRクラス分類部204に出力する。
図13のDRクラス分類部204と波形クラス分類部205は、図15に示されるように構成される。この構成例においては、DRクラス分類部204は、ダイナミックレンジ演算部231、判定部232、およびクラス番号出力部233により構成され、波形クラス分類部205は、クラス番号出力部241により構成される。
ダイナミックレンジ演算部231は、クラスタップ抽出部203から供給されるクラスタップを構成する画素の画素値から求められるクラスタップDRを演算する。ダイナミックレンジ演算部231は、演算したクラスタップDRを判定部232に供給する。
判定部232は、ダイナミックレンジ演算部231から供給されるクラスタップDRと、ノイズ加算量指定部202から供給されるDR閾値とを比較し、クラスタップDRがDR閾値以上となるかを判定する。判定部232は、判定結果をクラス番号出力部233に供給する。
クラス番号出力部233は、判定部232から供給される判定結果に基づいて、DRクラス番号を高解像度化処理部207に供給する。具体的には、例えば、クラス番号出力部233は、判定部232からの判定結果が、クラスタップDRがDR閾値以上であることを示している場合、1であるDRクラス番号を高解像度化処理部207に出力し、クラスタップDRがDR閾値よりも小さいことを示している場合、0であるDRクラス番号を高解像度化処理部207に出力する。
クラス番号出力部241は、クラスタップ抽出部203からのクラスタップを構成する画素に基づいて、例えば、ADRCなどを用いて、波形クラス分類を行う。クラス番号出力部241は、波形クラス分類の結果得られるクラスに対応する波形クラス番号を高解像度化処理部207に出力する。なお、クラス番号出力部241の詳細は、クラス番号出力部191と同様であるので、その詳細な説明は省略する。
次に、図16のフローチャートを参照して、図11の学習装置111による、係数学習の処理について説明する。
ステップS11において、画像入力部151は、フレーム単位などで入力される、教師画像としてのHD画像信号を縮小画像生成部152および係数学習部159に供給する。
ステップS12において、縮小画像生成部152は、画像入力部151からのHD画像信号に対して、例えば、HD画像の解像度を落とすように処理を施して、HD画像よりも低解像度のSD画像を生成し、生成したSD画像に対応するSD画像信号をノイズ成分加算部154に供給する。
ステップS13において、ノイズ加算量指定部153は、SD画像信号に加算するノイズアクティビティであるノイズ加算量を指定する。具体的には、ノイズ加算量指定部153は、ユーザからの指示に基づいて、係数学習部159により生成される係数データに適したノイズアクティビティを指定し、指定したノイズアクティビティに基づいたノイズ成分をノイズ成分加算部154に供給する。また、ノイズ加算量指定部153は、指定したノイズアクティビティに基づいたDR閾値として、例えば、指定したノイズアクティビティと同じ値をDRクラス分類部156に供給する。
ステップS14において、ノイズ成分加算部154は、縮小画像生成部152からのSD画像信号に、ノイズ加算量指定部153からのノイズ成分を加算して、生徒画像としてのノイズ付加SD画像信号を生成し、クラスタップ抽出部155および予測タップ抽出部158に供給する。
ステップS15において、予測タップ抽出部158は、ノイズ付加SD画像信号から予測タップを抽出し、係数学習部159に供給する。
ステップS16において、クラスタップ抽出部155は、ノイズ付加SD画像信号からクラスタップを抽出し、DRクラス分類部156および波形クラス分類部157に供給する。
ステップS17において、クラスタップ抽出部155と予測タップ抽出部158は、全フレームのデータが終了したかを判定する。
ステップS17において、データがまだ終了していないと判定された場合、ステップS18において、ダイナミックレンジ演算部181は、クラスタップ抽出部155からのクラスタップからクラスタップDRを演算し、判定部182に供給する。クラスタップDRとしては、例えば、クラスタップのダイナミックレンジが演算される。
ステップS19において、判定部182は、ダイナミックレンジ演算部181からのクラスタップDRと、ノイズ加算量指定部153からのDR閾値とを比較し、クラスタップDRがDR閾値以上となるかを判定する。
ステップS19において、クラスタップDRがDR閾値よりも小さいと判定された場合、ステップS20において、クラス番号出力部183は、判定部182からの判定結果に基づいて、0であるDRクラス番号を係数学習部159に出力する。一方、ステップS19において、クラスタップDRがDR閾値以上であると判定された場合、ステップS21において、クラス番号出力部183は、判定部182からの判定結果に基づいて、1であるDRクラス番号を係数学習部159に出力する。
ステップS22において、クラス番号出力部191は、クラスタップ抽出部155からのクラスタップを構成する画素に基づいて、注目画素を波形クラス分類し、その結果得られるクラスに対応する波形クラス番号を係数学習部159に出力する。
ステップS23において、係数学習部159は、正規化方程式を生成する。具体的には、係数学習部159は、式(5)に示される正規方程式を生成する。その後、処理は、ステップS15に戻り、ステップS17において、全フレームのデータが終了したと判定されるまで、ステップS15乃至ステップS23の処理が繰り返し実行される。
ステップS17において、全フレームのデータが終了したと判定された場合、ステップS24において、係数学習部159は、式(5)に示される正規方程式を、掃き出し法などにより解くことで、係数データを生成し、係数記録部160に供給する。また、式(5)の正規方程式を、波形クラス番号とDRクラス番号に基づいたクラスごとにたてて解くことにより、係数データがクラスごとに求められる。すなわち、係数データは、クラスごとに求められているが、各クラスは、波形クラス番号とDRクラス番号に基づいて分類されているので、波形クラスで分類されているとともに、DRクラスでも分類されていることになる。
ステップS25において、係数記録部160は、係数学習部159からの係数データを記録して、係数学習の処理は終了する。
以上のようにして、学習装置111においては、係数学習の処理を行うことにより、波形クラス番号とDRクラス番号に基づいたクラスごとの係数データが係数記録部160に記録される。このように、係数学習の処理においては、入力される信号の波形を用いて、積極的に高解像度化を行う係数と、ノイズが支配的な波形に対して積極的にノイズ除去を行う係数との2種類に分類される予測係数を求めることができる。
次に、図17のフローチャートを参照して、図13の出力画像生成装置112による、出力画像生成の処理について説明する。
ステップS41において、低解像度画像入力部201は、フレーム単位などで入力されてくるSD画像信号を、ノイズ加算量指定部202、クラスタップ抽出部203、および予測タップ抽出部206に供給する。
ステップS42において、低解像度画像入力部201は、全フレームのデータが終了したかを判定する。
ステップS42において、まだ全フレームのデータが終了していないと判定された場合、ステップS43において、ノイズ成分検出部221は、低解像度画像入力部201からのSD画像信号からノイズレベルを検出することにより、ノイズアクティビティ検出値を検出し、判定部222に供給する。
ステップS44において、判定部222は、ユーザの操作により、所定の閾値が指定されたかを判定する。
ステップS44において、所定の閾値が指定されていないと判定された場合、ステップS45において、DR閾値出力部223は、判定部222の判定結果に基づいて、ノイズ成分検出結果であるノイズアクティビティ検出値に基づいたDR閾値をDRクラス分類部204に出力する。一方、ステップS44において、所定の閾値が指定されたと判定された場合、ステップS46において、DR閾値出力部223は、判定部222の判定結果に基づいて、ユーザにより指定された所定の閾値に基づいたDR閾値をDRクラス分類部204に出力する。
このように、ノイズ成分検出部221を用いることで、入力される信号のノイズ特性に合わせて、予測係数を適応的に選択させることが可能となり、学習時の環境と異なる特性のノイズも確実に抑制し、高画質化を実現することが可能となる。また、ユーザにより、予測係数を使い分ける基準値が指定されることで、ユーザの好みに応じたノイズ除去性能を選択させることも可能となる。
ステップS47において、予測タップ抽出部206は、SD画像信号から予測タップを抽出し、高解像度化処理部207に供給する。
ステップS48において、クラスタップ抽出部203は、SD画像信号からクラスタップを抽出し、DRクラス分類部204および波形クラス分類部205に供給する。
ステップS49において、クラスタップ抽出部203と予測タップ抽出部206は、対象フレームのデータが終了したかを判定する。
ステップS49において、対象フレームのデータがまだ終了していないと判定された場合、ステップS50において、ダイナミックレンジ演算部231は、クラスタップ抽出部203からのクラスタップを構成する画素の画素値からクラスタップDRを演算し、判定部232に供給する。
ステップS51において、判定部232は、ダイナミックレンジ演算部231からのクラスタップDRと、ノイズ加算量指定部202からのDR閾値とを比較して、クラスタップDRがDR閾値以上となるかを判定する。
ステップS51において、クラスタップDRがDR閾値よりも小さいと判定された場合、ステップS52において、クラス番号出力部233は、判定部232からの判定結果に基づいて、0であるDRクラス番号を高解像度化処理部207に出力する。一方、ステップS51において、クラスタップDRがDR閾値以上であると判定された場合、ステップS53において、クラス番号出力部233は、判定部232からの判定結果に基づいて、1であるDRクラス番号を高解像度化処理部207に出力する。
ステップS54において、クラス番号出力部241は、クラスタップ抽出部203からのクラスタップを構成する画素に基づいて、注目画素を波形クラス分類し、その結果得られるクラスに対応する波形クラス番号を高解像度化処理部207に出力する。
ステップS55において、高解像度化処理部207は、HD画像の画素データを生成し、そのHD画像の画素データを高解像度画像出力部209に供給する。具体的には、高解像度化処理部207は、係数保持部208から、DRクラス番号と波形クラス番号に基づいたクラスに対応する予測係数を取得し、その係数係数と、予測タップ抽出部206からの予測タップとを用いて、式(2)の予測演算を行って、HD画像の画素データを生成する。
予測係数は、ノイズのアクティビティに応じて異なるクラスになるように設定されている。したがって、高解像度化処理部207により、DR小クラス係数群C1に属しているクラスに対しては、SD画像信号の波形の情報に多く含まれているノイズが積極的に除去されるように、高解像度化する処理が行われ、DR大クラス係数群C2に属しているクラスに対しては、SD画像信号の波形の概形をある程度保ちつつノイズが除去されるように高解像度化する処理が行われる。その結果、より高画質の高解像度の画像を生成することができる。
ステップS47乃至ステップS55の処理は、ステップS49において、1フレーム分のデータの処理が終了したと判定されるまで繰り返し実行される。1フレーム分のデータの処理が終了したと判定された場合、処理は、ステップS41に戻り、それ以降の処理が繰り返し実行される。ステップS42において、全フレームのデータが終了したと判定された場合、出力画像生成の処理は終了する。
以上のようにして、出力画像生成装置112においては、学習装置111で学習された予測係数に基づき、SD画像信号からHD画像信号が生成される。このように、出力画像生成の処理においては、入力される画像に対してノイズの除去と高解像度化の処理を行うとき、学習により、積極的に高解像度化を行う係数と、ノイズが支配的な波形に対して積極的にノイズ除去を行う係数との2種類に分類される予測係数が求められているので、それらの予測係数によって、ノイズ除去の性能の向上、およびノイズ除去における波形のボケなどの弊害を低減することができる。
ところで、本出願人は、例えば、特開2002−218413号公報などにおいて、係数種形式によるDRC処理を先に提案している。本発明は、このような係数種形式によるDRC処理を適用することもできる。そこで、以下、係数種データの学習によって得られるクラスごとの係数種を用いて行われるDRC処理について説明する。なお、係数種データとは、係数データを生成する、いわば種(元)になるデータである。
図18は、係数種形式による学習装置111の具体的な機能的構成例を示すブロック図である。
なお、図11に示す場合と同様の部分には、同一の番号が付してあり、その説明は繰り返しになるので適宜省略する。すなわち、図18において、学習装置111は、図11の学習装置111に、さらに、画質選択値入力部301、タップ選択制御部302、動きクラスタップ抽出部303、動きクラス分類部304、およびクラス合成部305が追加され、図11の係数学習部159および係数記録部160の代わりに、係数種学習部306および係数種記録部307を含むようにして構成される。
画質選択値入力部301は、SD画像およびノイズ付加SD画像を生成するときに使用する画質選択番号h,vを、縮小画像生成部152およびノイズ加算量指定部153に供給する。
ここで、画質選択番号h,vとは、水平と垂直の解像度を決めるパラメータh,vに対応しており、これにより画像の解像度が決定される。例えば、縮小画像生成部152は、HD画像信号からSD画像信号を生成するとき、パラメータh,vをそれぞれ9段階に可変することにより、合計81種類のSD画像信号を生成する。そして、ノイズ成分加算部154は、パラメータh,vをそれぞれ9段階に可変することによりノイズ加算量指定部153が、合計81種類のノイズ成分を供給してくるので、縮小画像生成部152からの81種類のSD画像信号と、ノイズ加算量指定部153からの81種類のノイズとをそれぞれ加算して、81種類のノイズ付加SD画像信号を生成する。
タップ選択制御部302には、ユーザの指示に基づいて、変換方法を指示するための変換方法選択信号が制御信号として供給される。タップ選択制御部302は、変換方法選択信号に基づいて、動きクラス分類に用いる動きクラスタップ位置データを、動きクラスタップ抽出部303に供給する。また、タップ選択制御部302は、後述する動きクラス分類部304から供給される動きクラス番号および変換方法選択信号に基づいて、クラスタップの抽出に用いるクラスタップ位置データをクラスタップ抽出部155に供給し、予測タップの抽出に用いる予測タップ位置データを予測タップ抽出部158に供給する。これにより、クラスタップ抽出部155、予測タップ抽出部158、および動きクラスタップ抽出部303においては、変換方法に対応したタップ位置データに基づいて、タップの選択が行われる。
動きクラスタップ抽出部303は、ノイズ成分加算部154から供給されるノイズ付加SD画像信号を変換して得ようとするHD画像信号を構成する画素を、順次、注目画素とし、さらに、その注目画素を、主に動きの程度によりクラス分けをする動きクラス分類を行うのに用いる複数の画素の画素値である動きクラスタップを、ノイズ成分加算部154から供給されるノイズ付加SD画像信号から抽出する。動きクラスタップ抽出部303は、抽出した動きクラスタップを動きクラス分類部304に供給する。
動きクラス分類部304は、動きクラスタップ抽出部303から供給される動きクラスタップを構成する画素に基づいて、フレーム間差分を算出し、その差分の絶対値の平均値に対して閾値処理を行うことにより、注目画素を動きクラス分類する。動きクラス分類部304は、動きクラス分類の結果得られる動きクラスに対応する動きクラス番号を、タップ選択制御部302およびクラス合成部305に供給する。
クラス合成部305には、波形クラス分類部157から供給される波形クラス番号と、動きクラス分類部304から供給される動きクラス番号の他に、DRクラス分類部156からDRクラス番号が供給される。クラス合成部305は、波形クラス番号、動きクラス番号、およびDRクラス番号に基づいて、所定の演算を行うことにより、それらの番号を合成し、HD画像信号を構成する画素のうち、注目画素が属するクラスを示す合成クラス番号を生成する。クラス合成部305は、生成した合成クラス番号を係数種学習部306に供給する。
係数種学習部306には、画像入力部151から供給されるHD画像信号と、予測タップ抽出部158から供給される予測タップの他に、クラス合成部305から合成クラス番号が供給される。係数種学習部306は、予測タップを構成する画素を生徒画像とし、HD画像信号を教師画像として、合成クラス番号に基づいたクラスごとの係数種データを生成する。係数種学習部306は、生成した係数種データを係数種記録部307に供給し、記録させる。
すなわち、図19を参照して後述する、係数種形式による出力画像生成装置112の高解像度化処理部207では、次式に基づいて入力されたSD画像信号からより高解像度のHD画像信号を生成し、高解像度画像として出力する。
Figure 2007251690
上記式において、yは、HD画像の画素データを示し、xiは、SD画像の画素データを表し、Wiは、係数データを表す。また、nは、予測タップの数を表し、iは、予測タップの番号を示す。すなわち、HD画素データyは、SD画素データxiと係数データWiとの積和演算により生成される。
係数データWiは、次式により表される。
Figure 2007251690
上記式において、wijは、係数種データを表し、h,vは、水平と垂直の解像度を決めるパラメータを表している。パラメータh,vは、画質選択値入力部301より画質選択番号h,vとして供給されるパラメータである。
また、例えば、上述した式(7)の係数種データwijは、次のようにして求めることができる。すなわち、上述した式(7)は次式のように書き換えることができる。
Figure 2007251690
上記式におけるtj(j=0乃至9)は、次式のように定義される。
0=1,t1=v,t2=h,t3=v2,t4=vh,t5=h2
6=v3,t7=v2h,t8=vh2,t9=h3
・・・(9)
最終的に、学習によって未定係数wxyが求められる。すなわち、最小自乗法により、クラスごとに、複数のSD画素データとHD画素データとを用いて、二乗誤差を最小にする係数値が決定される。学習数をm,k(1≦k≦m)番目の学習データにおける誤差をek、二乗誤差の総和をEとすると、式(6)および式(7)を用いて、二乗誤差の総和Eは式(10)により表される。ここで、xikは、SD画像のi番目の予測タップ位置におけるk番目の画素データ、ykはそれに対応するk番目のHD画像の画素データを表している。
Figure 2007251690
最小自乗法による解法では、式(11)に示されるように、式(10)のwxyによる偏微分が0になるようなwxyが求められる。
Figure 2007251690
以下、Xipjq,Yipを、それぞれ、式(12)または式(13)のように定義すると、式(11)は、行列を用いて式(14)のように書き換えられる。
Figure 2007251690
Figure 2007251690
この方程式は、一般に正規方程式と呼ばれている。この正規方程式は、掃き出し法(Gauss-Jordanの消去法)などを用いて、wxyについて解かれ、係数種データwijが算出される。
図19は、係数種形式による出力画像生成装置112の具体的な機能的構成例を示すブロック図である。
なお、図13に示す場合と同様の部分には、同一の番号が付してあり、その説明は繰り返しになるので適宜省略する。すなわち、図19において、出力画像生成装置112は、図13の出力画像生成装置112に、さらに、画質選択値入力部321、係数種保持部322、係数データ生成部323、タップ選択制御部324、動きクラスタップ抽出部325、動きクラス分類部326、およびクラス合成部327が追加されるようにして構成される。なお、タップ選択制御部324、動きクラスタップ抽出部325、動きクラス分類部326、およびクラス合成部327は、図18のタップ選択制御部302、動きクラスタップ抽出部303、動きクラス分類部304、およびクラス合成部305と同様に構成される。
画質選択値入力部321は、例えば、ユーザによるリモートコントローラの操作などにより入力される画質指定値h,vを取得する。画質選択値入力部321は、取得した画質指定値h,vを係数データ生成部323に供給する。
ここで、画質指定値h,vとは、上述した、画質選択番号h,vと同様に、水平と垂直の解像度を決めるパラメータh,vに対応しており、これにより画像の解像度が決定される。
係数種保持部322は、上述した、係数種の学習により生成され、係数種記録部307に記録された係数種データをクラスごとに保持する。
係数データ生成部323には、画質選択値入力部321から画質指定値h,vが供給され、係数種保持部322から係数種データが供給される。係数データ生成部323は、各クラスの係数種データと画質指定値h,vの値を用いて、式(7)により、クラスごとに、画質指定値h,vの値に対応した推定式の係数データを生成する。係数データ生成部323は、生成した係数データを高解像度化処理部207に供給する。
このとき、生成された各クラスの係数データは、学習時に、合成クラス番号に基づいたクラスごとの予測係数となるので、波形クラスと動きクラスで分類されているとともに、DRクラスでも分類されており、積極的に高解像度化を行う係数と、ノイズが支配的な波形に対して積極的にノイズ除去を行う係数との2種類に分類されている。
タップ選択制御部324には、ユーザからの指示に基づいて、変換方法選択信号が制御信号として供給される。タップ選択制御部324は、変換方法選択信号に基づいて、動きクラスタップ位置データを動きクラスタップ抽出部325に供給する。また、タップ選択制御部324は、後述する動きクラス分類部326から供給される動きクラス番号および変換方法選択信号に基づいて、クラスタップ位置データをクラスタップ抽出部203に供給し、予測タップ位置データを予測タップ抽出部206に供給する。これにより、クラスタップ抽出部203、予測タップ抽出部206、および動きクラスタップ抽出部325においては、変換方法に対応したタップ位置データに基づいて、タップの選択が行われる。
動きクラスタップ抽出部325は、低解像度画像入力部201から供給されるSD画像信号を変換して得ようとするHD画像信号を構成する画素を、順次、注目画素とし、動きクラスタップを、低解像度画像入力部201から供給されるSD画像信号から抽出する。動きクラスタップ抽出部325は、抽出した動きクラスタップを動きクラス分類部326に供給する。
動きクラス分類部326は、動きクラスタップ抽出部325から供給される動きクラスタップを構成する画素に基づいて、フレーム間差分を算出し、その差分の絶対値の平均値に対して閾値処理を行うことにより、注目画素を動きクラス分類する。動きクラス分類部326は、動きクラス分類の結果得られる動きクラスに対応する動きクラス番号を、タップ選択制御部324およびクラス合成部327に供給する。
クラス合成部327には、波形クラス分類部205から供給される波形クラス番号と、動きクラス分類部326から供給される動きクラス番号の他に、DRクラス分類部204からDRクラス番号が供給される。クラス合成部327は、波形クラス番号、動きクラス番号、およびDRクラス番号に基づいて、所定の演算を行うことにより、それらの番号を合成して、合成クラス番号を生成する。クラス合成部327は、生成した合成クラス番号を高解像度化処理部207に供給する。
高解像度化処理部207には、予測タップ抽出部206から予測タップ、係数データ生成部323から係数データ、クラス合成部327から合成クラス番号のそれぞれが供給される。高解像度化処理部207は、合成クラス番号に基づいた各クラスごとの係数データにより、その係数データと予測タップとを用いて、式(6)に従って、注目画素の真値の予測値を求める所定の予測演算を行う。これにより、高解像度化処理部207は、注目画素の画素値、すなわち、HD画像信号を構成する画素値を求めて、高解像度画像出力部209に供給し、出力させる。
次に、図20のフローチャートを参照して、図18の学習装置111による、係数種学習の処理について説明する。
ステップS71において、画質選択値入力部301は、ユーザの指示に基づいて、学習に使用される、例えば、水平と垂直の解像度を決めるパラメータh,vに対応する画質選択番号h,vにより特定される画質のパターンを選択し、選択された画質の画質選択番号h,vを、縮小画像生成部152およびノイズ加算量指定部153に供給する。
ステップS72において、画質選択値入力部301は、まだ全ての画質パターンに対して学習が終了したかを判定する。
ステップS72において、学習が終わっていないと判定された場合、ステップS73において、画像入力部151は、例えば、フレーム単位などで入力されるHD画像信号を、縮小画像生成部152および係数種学習部306に供給する。
ステップS74において、縮小画像生成部152は、画質選択値入力部301により選択された画質選択番号h,vに基づいて、画像入力部151からのHD画像信号の解像度を落とすことにより、SD画像信号を生成し、ノイズ成分加算部154に供給する。
ステップS75において、ノイズ加算量指定部153は、画質選択値入力部301からの画質選択番号h,vに基づいて、生成する画質パターンの係数データに適したノイズアクティビティを指定する。ノイズ加算量指定部153は、指定されたノイズアクティビティに基づいて、ノイズ成分をノイズ成分加算部154に供給し、DR閾値をDRクラス分類部156に供給する。
ステップS76において、ノイズ成分加算部154は、縮小画像生成部152からのSD画像信号と、ノイズ加算量指定部153からのノイズ成分とを加算してノイズ付加SD画像信号を生成し、クラスタップ抽出部155、予測タップ抽出部158、および動きクラスタップ抽出部303に供給する。
ステップS77において、クラスタップ抽出部155、予測タップ抽出部158、および動きクラスタップ抽出部303は、ノイズ付加SD画像信号を構成する画素の画素値を取得する。具体的には、動きクラスタップ抽出部303は、ノイズ成分加算部154からのノイズ付加SD画像信号から、タップ選択制御部302からの動きクラスタップ位置データに基づいて、動きクラスタップを抽出し、動きクラス分類部304に供給する。なお、クラスタップ抽出部155と予測タップ抽出部158による画素値を取得する処理は、図16のステップS15とステップS16の処理と同様であり、その説明は繰り返しになるので省略する。
ステップS78において、クラスタップ抽出部155、予測タップ抽出部158、および動きクラスタップ抽出部303は、全フレームのデータが終了したかを判定する。
ステップS78において、データがまだ終了していないと判定された場合、ステップS79において、動きクラス分類部304は、動きクラスタップ抽出部303からの動きクラスタップを構成する画素に基づいて、動きクラス分類を行う。動きクラス分類部304は、動きクラス分類の結果得られる動きクラスに対応する動きクラス番号を、タップ選択制御部302およびクラス合成部305に供給する。
具体的には、動きクラス分類部304では、動きクラスタップ抽出部303により選択的に取り出される動きクラスタップを構成する、異なるフレームの画素から、その差分が算出され、さらにその差分の絶対値の平均値に対する閾値処理が行われ、動きの指標である動きクラスが検出される。そして、動きクラス分類部304は、検出された動きクラスに基づいて、動きクラス分類を行う。
ステップS80乃至ステップS84の処理において、図16のステップS18乃至ステップS22における場合と同様に、DRクラス分類部156によるDRクラス分類と、波形クラス分類部157による波形クラス分類が行われる。
ステップS85において、クラス合成部305は、DRクラス分類部156からのDRクラス番号、波形クラス分類部157からの波形クラス番号、および動きクラス分類部304からの動きクラス番号に基づいて、注目画素が属するクラスを示す合成クラス番号を得るための演算を行うことにより、合成クラス番号を生成し、係数種学習部306に供給する。
ステップS86において、係数種学習部306は、画像入力部151からのHD画像信号を教師画像とし、予測タップ抽出部158からの予測タップを生徒画像として、クラス合成部305から供給される合成クラス番号に基づいて、クラスごとに、式(14)に示される正規方程式を生成する。その後、処理は、ステップS77に戻り、ステップS78において、全フレームのデータが終了したと判定されるまで、ステップS77乃至ステップS86の処理が繰り返し実行される。
ステップS78において、全フレームのデータが終了したと判定された場合、処理は、ステップS71に戻り、次の画質パターンを選択し、ステップS72において、ステップS71で選択される全ての画質パターンに対して学習が終了したと判定されるまで、ステップS71乃至ステップS86の処理が繰り返し実行される。
すなわち、ステップS71において、画質選択値入力部301からの画質選択番号h,vが順次変更され、水平および垂直の帯域が段階的に変化した複数のノイズ付加SD画像信号が順次生成されるので、これにより、係数種学習部306では、多くの学習データが登録された正規方程式が生成されることになる。
ステップS72において、全ての画質パターンに対して学習が終了したと判定された場合、ステップS87において、係数種学習部306は、式(14)に示される正規方程式を、掃き出し法などによりクラスごとに解くことで、各クラスの係数種データを生成し、係数種記録部307に供給する。
ステップS88において、係数種記録部307は、係数種学習部306からの係数種データを記録して、係数種学習の処理は終了する。
以上のようにして、学習装置111においては、係数種学習の処理を行うことにより、DRクラス番号、波形クラス番号、および動きクラス番号に基づいたクラスごとの係数データを生成するための係数種データが係数種記録部307に記録される。そして、この係数種データが、図19の係数種保持部322に保持される。このように、係数種学習の処理においては、入力される信号の波形を用いて、積極的に高解像度化を行う係数と、ノイズが支配的な波形に対して積極的にノイズ除去を行う係数との2種類に分類される予測係数を求めることができる。
次に、図21のフローチャートを参照して、図19の出力画像生成装置112による、係数種形式での出力画像生成の処理について説明する。
ステップS101およびステップS102の処理は、図17のステップS41およびステップS42の処理と同様であり、その説明は省略する。
ステップS103において、画質選択値入力部321は、例えば、ユーザによるリモートコントローラの操作により入力される画質指定値h,vを取得し、係数データ生成部323に供給する。
ステップS104において、係数データ生成部323は、画質選択値入力部321からの画質指定値h,vおよび係数種保持部322から取得した各クラスの係数種データに基づいて、例えば、式(7)により、式(6)の推定式の係数データを生成し、高解像度化処理部207に供給する。
ステップS105乃至ステップS108の処理は、図17のステップS43乃至ステップS46の処理と同様であり、その説明は省略する。
ステップS109において、クラスタップ抽出部203、予測タップ抽出部206、および動きクラスタップ抽出部325は、SD画像信号を構成する画素の画素値を取得する。
具体的には、動きクラスタップ抽出部325は、タップ選択制御部324からの動きクラスタップ位置データに基づいて、低解像度画像入力部201からのSD画像信号から、動きクラスタップを抽出し、動きクラス分類部326に供給する。また、クラスタップ抽出部203と予測タップ抽出部206により、図17のステップS47とステップS48の処理と同様に、画素値が取得される。
ステップS110において、クラスタップ抽出部203、予測タップ抽出部206、および動きクラスタップ抽出部325は、対象フレームのデータが終了したかを判定する。
ステップS110において、対象フレームのデータがまだ終了していないと判定された場合、ステップS111において、動きクラス分類部326は、動きクラスタップ抽出部325により選択的に取り出される動きクラスタップを構成する画素から、フレーム間の差分を算出し、さらにその差分の絶対値の平均値に対する閾値処理を行って、動きクラスを検出する。動きクラス分類部326は、検出された動きクラスに基づいて、動きクラス分類を行い、その結果得られる動きクラスに対応する動きクラス番号を、タップ選択制御部324およびクラス合成部327に供給する。
ステップS112乃至ステップS116の処理において、図17のステップS50乃至ステップS54における場合と同様に、DRクラス分類部204によるDRクラス分類と、波形クラス分類部205による波形クラス分類が行われる。
ステップS117において、クラス合成部327は、DRクラス分類部204からのDRクラス番号、波形クラス分類部205からの波形クラス番号、および動きクラス分類部326からの動きクラス番号に基づいて、注目画素が属するクラスを示す合成クラス番号を得るための演算を行うことにより、合成クラス番号を生成し、高解像度化処理部207に供給する。
ステップS118において、高解像度化処理部207は、HD画素の画素データを生成し、そのHD画素の画素データを高解像度画像出力部209に出力する。具体的には、高解像度化処理部207は、クラス合成部327からの合成クラス番号に基づいた係数データを係数データ生成部323より取得し、その係数データと、予測タップ抽出部206からの予測タップを用いて、式(6)に従って、注目画素の真値の予測値を求める所定の演算を行うことにより、HD画像信号を生成する。
この場合においても、予測係数は、ノイズアクティビティに応じて異なるクラスになるように設定される。したがって、図13の実施の形態における場合と同様に、DR小クラス係数群C1に属しているクラスに対しては、SD画像信号の波形の情報に多く含まれているノイズが積極的に除去される、すなわち、波形の情報の混ざり具合が積極的に除去されるように、高解像度化する処理が行なわれ、DR大クラス係数群C2に属しているクラスに対しては、SD画像信号の波形の概形をある程度保ちつつノイズが除去されるように高解像度化する処理が行われる。その結果、より高画質で高解像度の画像を生成することが可能となる。
ステップS109乃至ステップS118の処理は、ステップS110において、1フレーム分のデータの処理が終了したと判定されるまで繰り返し実行される。1フレーム分のデータの処理が終了したと判定された場合、処理は、ステップS101に戻り、それ以降の処理が繰り返し実行される。ステップS102において、全フレームのデータが終了したと判定された場合、出力画像生成の処理は終了する。
以上のようにして、出力画像生成装置112においては、学習装置111で学習された係数種データに基づき、SD画像信号からHD画像信号が生成される。このように、入力される画像に対してノイズの除去と高解像度化の処理を行うとき、学習により、積極的に高解像度化を行う係数と、ノイズが支配的な波形に対して積極的にノイズ除去を行う係数の2種類の係数が求められているので、それらの係数によって、ノイズ除去の性能の向上、およびノイズ除去における波形のボケなどの弊害を低減することができる。
このように、本提案では、ノイズ成分が持つと想定されるアクティビティと入力信号のアクティビティとを比較し、その結果によりクラス分類を行うことで、波形クラス分類の有効性を評価し、ノイズ除去性能と高解像度信号予測性能の両者を適応的なバランスで実現することが可能となる。
また、本提案では、出力画像生成時のクラス分類の基準値を外部ノイズ検出回路の値や、ユーザ指定のノイズ除去ボリューム値と連動して動的に決定することにより、学習時環境と一致している場合に限らず、様々な環境で適応的に動作しその性能を保つことができる。
なお、本発明は、テレビジョン受像機、ハードディスクレコーダ、DVD(Digital Versatile Disk)装置などに適用することができる。
上述した一連の処理は、ハードウェアにより実行させることもできるし、ソフトウェアにより実行させることもできる。一連の処理をソフトウェアにより実行させる場合には、そのソフトウェアを構成するプログラムが、専用のハードウェアに組み込まれているコンピュータ、または、各種のプログラムをインストールすることで、各種の機能を実行することが可能な、例えば汎用のパーソナルコンピュータなどに、プログラム記録媒体からインストールされる。
図22は、上述した一連の処理をプログラムにより実行するパーソナルコンピュータの構成の例を示すブロック図である。CPU(Central Processing Unit)401は、ROM(Read Only Memory)402、または記録部408に記録されているプログラムに従って各種の処理を実行する。RAM(Random Access Memory)403には、CPU401が実行するプログラムやデータなどが適宜記憶される。これらのCPU401、ROM402、およびRAM403は、バス404により相互に接続されている。
CPU401にはまた、バス404を介して入出力インターフェース405が接続されている。入出力インターフェース405には、マイクロホンなどよりなる入力部406、ディスプレイ、スピーカなどよりなる出力部407が接続されている。CPU401は、入力部406から入力される指令に対応して各種の処理を実行する。そして、CPU401は、処理の結果を出力部407に出力する。
入出力インターフェース405に接続されている記録部408は、例えばハードディスクからなり、CPU401が実行するプログラムや各種のデータを記録する。通信部409は、インターネットやローカルエリアネットワークなどのネットワークを介して外部の装置と通信する。
また、通信部409を介してプログラムを取得し、記録部408に記録してもよい。
入出力インターフェース405に接続されているドライブ410は、磁気ディスク、光ディスク、光磁気ディスク、或いは半導体メモリなどのリムーバブルメディア411が装着されたとき、それらを駆動し、そこに記録されているプログラムやデータなどを取得する。取得されたプログラムやデータは、必要に応じて記録部408に転送され、記録される。
コンピュータにインストールされ、コンピュータによって実行可能な状態とされるプログラムを格納するプログラム記録媒体は、図22に示すように、磁気ディスク(フレキシブルディスクを含む)、光ディスク(CD-ROM(Compact Disc-Read Only Memory),DVDを含む)、光磁気ディスク、もしくは半導体メモリなどよりなるパッケージメディアであるリムーバブルメディア411、または、プログラムが一時的もしくは永続的に格納されるROM402や、記録部408を構成するハードディスクなどにより構成される。プログラム記録媒体へのプログラムの格納は、必要に応じてルータ、モデムなどのインターフェースである通信部409を介して、ローカルエリアネットワーク、インターネット、デジタル衛星放送といった、有線または無線の通信媒体を利用して行われる。
なお、本明細書において、記録媒体に格納されるプログラムを記述するステップは、記載された順序に沿って時系列的に行われる処理はもちろん、必ずしも時系列的に処理されなくとも、並列的あるいは個別に実行される処理をも含むものである。
また、本明細書において、システムとは、複数の装置により構成される装置全体を表すものである。
さらに、本発明の実施の形態は、上述した実施の形態に限定されるものではなく、本発明の要旨を逸脱しない範囲において種々の変更が可能である。
本発明を適用した画像変換装置の一実施の形態の構成を示すブロック図である。 図1の画像変換装置による画像変換処理を説明するフローチャートである。 本発明を適用した画像処理システムの原理的構成を説明する図である。 係数学習の処理を説明する図である。 ノイズアクティビティについて説明する図である。 高解像度画像生成の処理における閾値の指定を説明する図である。 高解像度画像生成の処理における閾値の指定を説明する図である。 ノイズアクティビティの検出方法について説明する図である。 ノイズアクティビティの検出方法について説明する図である。 高解像度画像生成の処理における閾値の指定を説明する図である。 学習装置の機能的構成を示すブロック図である。 図11のDRクラス分類部と波形クラス分類部の構成を示すブロック図である。 出力画像生成装置の機能的構成を示すブロック図である。 図13のノイズ加算量指定部の構成を示すブロック図である。 図13のDRクラス分類部と波形クラス分類部の構成を示すブロック図である。 係数学習の処理を説明するフローチャートである。 出力画像生成の処理を説明するフローチャートである。 係数種形式による学習装置の機能的構成を示すブロック図である。 係数種形式による出力画像生成装置の機能的構成を示すブロック図である。 係数種学習の処理を説明するフローチャートである。 係数種形式による出力画像生成の処理を説明するフローチャートである。 パーソナルコンピュータの構成を示すブロック図である。
符号の説明
101 画像処理システム, 111 学習装置, 112 出力画像生成装置, 151 画像入力部, 152 縮小画像生成部, 153 ノイズ加算量指定部, 154 ノイズ成分加算部, 155 クラスタップ抽出部, 156 DRクラス分類部, 157 波形クラス分類部, 158 予測タップ抽出部, 159 係数学習部, 160 係数記録部, 181 ダイナミックレンジ演算部, 182 判定部, 183 クラス番号出力部, 191 クラス番号出力部, 201 低解像度画像入力部, 202 ノイズ加算量指定部, 203 クラスタップ抽出部, 204 DRクラス分類部, 205 波形クラス分類部, 206 予測タップ抽出部, 207 高解像度化処理部, 208 係数保持部, 209 高解像度画像出力部, 221 ノイズ成分検出部, 222 判定部, 223 DR閾値出力部, 231 ダイナミックレンジ演算部, 232 判定部, 233 クラス番号出力部, 241 クラス番号出力部, 301 画質選択値入力部, 302 タップ選択制御部, 303 動きクラスタップ抽出部, 304 動きクラス分類部, 305 クラス合成部, 306 係数種学習部, 307 係数種記録部, 321 画質選択値入力部, 322 係数種保持部, 323 係数データ生成部, 324 タップ選択制御部, 325 動きクラスタップ抽出部, 326 動きクラス分類部, 327 クラス合成部

Claims (15)

  1. 第1の画像データから第2の画像データを生成する画像処理装置において、
    前記第2の画像データの注目している画素である注目画素を予測するために用いる複数の画素を、前記第1の画像データから予測タップとして抽出する第1の抽出手段と、
    前記注目画素を複数のクラスのうちのいずれかにクラス分けするクラス分類に用いる複数の画素を、前記第1の画像データから第1のクラスタップとして抽出する第2の抽出手段と、
    前記第1のクラスタップのアクティビティに基づいたクラス分類をするための第1の閾値を指定する指定手段と、
    指定した前記第1の閾値と、前記第1のクラスタップのアクティビティとを比較した結果に基づいて、前記注目画素を第1のクラスに分類する第1の分類手段と、
    前記第1のクラスタップのパターンに基づいて、前記注目画素を第2のクラスに分類する第2の分類手段と、
    前記第1のクラスおよび前記第2のクラスにより特定される前記注目画素のクラスに対応する第1の係数と、前記予測タップに基づいて、前記第2の画像データを演算する演算手段と
    を備える画像処理装置。
  2. 前記指定手段は、ユーザにより第2の閾値が指示された場合、指示された前記第2の閾値に基づいた値を、前記第1の閾値として指定し、前記ユーザにより前記第2の閾値が指示されなかった場合、前記第1の画像データから検出されるノイズレベルに基づいた値を、前記第1の閾値として指定する
    請求項1に記載の画像処理装置。
  3. 前記第1の分類手段は、前記アクティビティが前記第1の閾値を超える場合、原信号成分が支配的となる前記第1のクラスに属するように前記注目画素を分類し、前記アクティビティが前記第1の閾値よりも小さい場合、ノイズ成分が支配的となる前記第1のクラスに属するように前記注目画素を分類する
    請求項1に記載の画像処理装置。
  4. 前記演算手段は、前記第1のクラスに分類されている前記注目画素のうち、前記原信号成分が支配的となる前記第1のクラスに属している前記注目画素に対して、前記原信号成分を保ちながら前記ノイズ成分を除去するように演算し、前記ノイズ成分が支配的となる前記第1のクラスに属している前記注目画素に対して、前記ノイズ成分を除去するように演算する
    請求項3に記載の画像処理装置。
  5. 前記第2の画像データの画質を指定するためのパラメータを入力する入力手段と、
    入力した前記パラメータに基づいて、前記第1の係数を生成するための元となる第2の係数から前記第1の係数を生成する生成手段と、
    動きにより前記注目画素をクラス分けするクラス分類に用いる複数の画素を、前記第1の画像データから第2のクラスタップとして抽出する第3の抽出手段と、
    前記第2のクラスタップの動きに基づいて、前記注目画素を第3のクラスに分類する第3の分類手段と
    をさらに備え、
    前記演算手段は、前記第1のクラス、前記第2のクラス、および前記第3のクラスにより特定される前記注目画素のクラスに対応する前記第1の係数と、前記予測タップに基づいて、前記第2の画像データを演算する
    請求項1に記載の画像処理装置。
  6. 前記パラメータは、前記第2の画像データの水平方向と垂直方向の解像度を示す値である
    請求項5に記載の画像処理装置。
  7. 第1の画像データから第2の画像データを生成する画像処理方法において、
    前記第2の画像データの注目している画素である注目画素を予測するために用いる複数の画素を、前記第1の画像データから予測タップとして抽出する第1の抽出ステップと、 前記注目画素を複数のクラスのうちのいずれかにクラス分けするクラス分類に用いる複数の画素を、前記第1の画像データからクラスタップとして抽出する第2の抽出ステップと、
    前記クラスタップのアクティビティに基づいたクラス分類をするための閾値を指定する指定ステップと、
    指定した前記閾値と、前記クラスタップのアクティビティとを比較した結果に基づいて、前記注目画素を第1のクラスに分類する第1の分類ステップと、
    前記クラスタップのパターンに基づいて、前記注目画素を第2のクラスに分類する第2の分類ステップと、
    前記第1のクラスおよび前記第2のクラスにより特定される前記注目画素のクラスに対応する係数と、前記予測タップに基づいて、前記第2の画像データを演算する演算ステップと
    を含む画像処理方法。
  8. 第1の画像データから第2の画像データを生成する画像処理をコンピュータに行わせるプログラムにおいて、
    前記第2の画像データの注目している画素である注目画素を予測するために用いる複数の画素を、前記第1の画像データから予測タップとして抽出する第1の抽出ステップと、 前記注目画素を複数のクラスのうちのいずれかにクラス分けするクラス分類に用いる複数の画素を、前記第1の画像データからクラスタップとして抽出する第2の抽出ステップと、
    前記クラスタップのアクティビティに基づいたクラス分類をするための閾値を指定する指定ステップと、
    指定した前記閾値と、前記クラスタップのアクティビティとを比較した結果に基づいて、前記注目画素を第1のクラスに分類する第1の分類ステップと、
    前記クラスタップのパターンに基づいて、前記注目画素を第2のクラスに分類する第2の分類ステップと、
    前記第1のクラスおよび前記第2のクラスにより特定される前記注目画素のクラスに対応する係数と、前記予測タップに基づいて、前記第2の画像データを演算する演算ステップと
    を含むプログラム。
  9. 第1の画像データから第2の画像データを生成するために用いられる第1の係数を学習する学習装置において、
    前記第2の画像データに相当する画像データの注目している画素である注目画素を予測するために用いる複数の画素を、前記第1の画像データに相当する画像データから予測タップとして抽出する第1の抽出手段と、
    前記注目画素を複数のクラスのうちのいずれかにクラス分けするクラス分類に用いる複数の画素を、前記第1の画像データに相当する画像データから第1のクラスタップとして抽出する第2の抽出手段と、
    前記第1の画像データに相当する画像データのノイズ成分のアクティビティから求められる閾値と、前記第1のクラスタップのアクティビティとを比較した結果に基づいて、前記注目画素を第1のクラスに分類する第1の分類手段と、
    前記第1のクラスタップのパターンに基づいて、前記注目画素を第2のクラスに分類する第2の分類手段と、
    前記第1のクラスおよび前記第2のクラスにより特定される前記注目画素のクラスごとに、前記第1の画像データに相当する画像データと前記予測タップから前記第1の係数を演算する第1の演算手段と
    を備える学習装置。
  10. 前記第1の分類手段は、前記アクティビティが前記閾値を超える場合、原信号成分が支配的となる前記第1のクラスに属するように前記注目画素を分類し、前記アクティビティが前記閾値よりも小さい場合、ノイズ成分が支配的となる前記第1のクラスに属するように前記注目画素を分類する
    請求項9に記載の学習装置。
  11. 前記第1の画像データに相当する画像データの画質を指定するためのパラメータを入力する入力手段と、
    動きにより前記注目画素をクラス分けするクラス分類に用いる複数の画素を、前記第1の画像データに相当する画像データから第2のクラスタップとして抽出する第3の抽出手段と、
    前記第2のクラスタップの動きに基づいて、前記注目画素を第3のクラスに分類する第3の分類手段と、
    入力した前記パラメータに基づいて、前記第1のクラス、前記第2のクラス、および前記第3のクラスにより特定される前記注目画素のクラスごとに、前記第1の画像データに相当する画像データと前記予測タップから第2の係数を演算する第2の演算手段と
    をさらに備える請求項9に記載の学習装置。
  12. 前記第2の係数は、前記パラメータに基づいて、前記第1のクラス、前記第2のクラス、および前記第3のクラスにより特定される前記注目画素のクラスに対応する前記第1の係数を生成するための元となる係数である
    請求項11に記載の学習装置。
  13. 前記パラメータは、前記第1の画像データに相当する画像データの水平方向と垂直方向の解像度を示す値である
    請求項11に記載の学習装置。
  14. 第1の画像データから第2の画像データを生成するために用いられる係数を学習する学習方法において、
    前記第2の画像データに相当する画像データの注目している画素である注目画素を予測するために用いる複数の画素を、前記第1の画像データに相当する画像データから予測タップとして抽出する第1の抽出ステップと、
    前記注目画素を複数のクラスのうちのいずれかにクラス分けするクラス分類に用いる複数の画素を、前記第1の画像データに相当する画像データからクラスタップとして抽出する第2の抽出ステップと、
    前記第1の画像データに相当する画像データのノイズ成分のアクティビティから求められる閾値と、前記クラスタップのアクティビティとを比較した結果に基づいて、前記注目画素を第1のクラスに分類する第1の分類ステップと、
    前記第クラスタップのパターンに基づいて、前記注目画素を第2のクラスに分類する第2の分類ステップと、
    前記第1のクラスおよび前記第2のクラスにより特定される前記注目画素のクラスごとに、前記第1の画像データに相当する画像データと前記予測タップから前記係数を演算する演算ステップと
    を含む学習方法。
  15. 第1の画像データから第2の画像データを生成するために用いられる係数を学習する学習処理をコンピュータに行わせるプログラムにおいて、
    前記第2の画像データに相当する画像データの注目している画素である注目画素を予測するために用いる複数の画素を、前記第1の画像データに相当する画像データから予測タップとして抽出する第1の抽出ステップと、
    前記注目画素を複数のクラスのうちのいずれかにクラス分けするクラス分類に用いる複数の画素を、前記第1の画像データに相当する画像データからクラスタップとして抽出する第2の抽出ステップと、
    前記第1の画像データに相当する画像データのノイズ成分のアクティビティから求められる閾値と、前記クラスタップのアクティビティとを比較した結果に基づいて、前記注目画素を第1のクラスに分類する第1の分類ステップと、
    前記第クラスタップのパターンに基づいて、前記注目画素を第2のクラスに分類する第2の分類ステップと、
    前記第1のクラスおよび前記第2のクラスにより特定される前記注目画素のクラスごとに、前記第1の画像データに相当する画像データと前記予測タップから前記係数を演算する演算ステップと
    を含むプログラム。
JP2006073560A 2006-03-16 2006-03-16 画像処理装置および方法、学習装置および方法、並びにプログラム Pending JP2007251690A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2006073560A JP2007251690A (ja) 2006-03-16 2006-03-16 画像処理装置および方法、学習装置および方法、並びにプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2006073560A JP2007251690A (ja) 2006-03-16 2006-03-16 画像処理装置および方法、学習装置および方法、並びにプログラム

Publications (2)

Publication Number Publication Date
JP2007251690A true JP2007251690A (ja) 2007-09-27
JP2007251690A5 JP2007251690A5 (ja) 2009-04-30

Family

ID=38595502

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2006073560A Pending JP2007251690A (ja) 2006-03-16 2006-03-16 画像処理装置および方法、学習装置および方法、並びにプログラム

Country Status (1)

Country Link
JP (1) JP2007251690A (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009152820A (ja) * 2007-12-20 2009-07-09 Sony Corp 学習装置および方法、画像処理装置および方法、並びにプログラム
WO2017078072A1 (ja) * 2015-11-06 2017-05-11 クラリオン株式会社 物体検知方法及び物体検知システム
CN109934244A (zh) * 2017-12-15 2019-06-25 京瓷办公信息系统株式会社 格式类别学习系统以及图像处理装置

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000059652A (ja) * 1998-08-07 2000-02-25 Sony Corp ノイズ除去装置及びノイズ除去方法
JP2000348020A (ja) * 1999-06-09 2000-12-15 Sony Corp データ処理装置およびデータ処理方法、並びに媒体
JP2002218413A (ja) * 2000-11-15 2002-08-02 Sony Corp 情報信号処理装置、情報信号処理方法、画像信号処理装置およびそれを使用した画像表示装置、それに使用される係数種データ生成装置および生成方法、係数データ生成装置および生成方法、並びに情報提供媒体

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000059652A (ja) * 1998-08-07 2000-02-25 Sony Corp ノイズ除去装置及びノイズ除去方法
JP2000348020A (ja) * 1999-06-09 2000-12-15 Sony Corp データ処理装置およびデータ処理方法、並びに媒体
JP2002218413A (ja) * 2000-11-15 2002-08-02 Sony Corp 情報信号処理装置、情報信号処理方法、画像信号処理装置およびそれを使用した画像表示装置、それに使用される係数種データ生成装置および生成方法、係数データ生成装置および生成方法、並びに情報提供媒体

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009152820A (ja) * 2007-12-20 2009-07-09 Sony Corp 学習装置および方法、画像処理装置および方法、並びにプログラム
WO2017078072A1 (ja) * 2015-11-06 2017-05-11 クラリオン株式会社 物体検知方法及び物体検知システム
US10755384B2 (en) 2015-11-06 2020-08-25 Clarion Co., Ltd. Object detection method and object detection system
CN109934244A (zh) * 2017-12-15 2019-06-25 京瓷办公信息系统株式会社 格式类别学习系统以及图像处理装置
CN109934244B (zh) * 2017-12-15 2023-04-28 京瓷办公信息系统株式会社 格式类别学习系统以及图像处理装置

Similar Documents

Publication Publication Date Title
US8331710B2 (en) Image processing apparatus and method, learning apparatus and method, and program
JP4470899B2 (ja) 画像処理装置および画像処理方法、並びにプログラム
JP2013021635A (ja) 画像処理装置、画像処理方法、プログラム、及び記録媒体
JP4915341B2 (ja) 学習装置および方法、画像処理装置および方法、並びにプログラム
JP4026491B2 (ja) 画像信号処理装置、画像信号処理方法、並びにプログラムおよび媒体
JP4362895B2 (ja) データ処理装置およびデータ処理方法、並びに記録媒体
JP4193871B2 (ja) 画像処理装置、画像処理方法、およびプログラム
JP4517409B2 (ja) データ処理装置およびデータ処理方法
JP4650123B2 (ja) 画像処理装置、画像処理方法、およびプログラム
JP4470898B2 (ja) 画像処理装置および方法、並びに、プログラム
JP4552261B2 (ja) ディジタル情報変換装置および方法、並びに画像情報変換装置および方法
JP4548942B2 (ja) 分類適応型空間−時間フォーマット変換方法及び装置
JP2007251690A (ja) 画像処理装置および方法、学習装置および方法、並びにプログラム
JP2003319348A (ja) データ変換装置およびデータ変換方法、学習装置および学習方法、並びにプログラムおよび記録媒体
JP4490351B2 (ja) 階層間予測処理方法,階層間予測処理装置,階層間予測処理プログラムおよびその記録媒体
JP2010118940A (ja) 画像処理装置、画像処理方法、及びプログラム
US20110243462A1 (en) Coefficient learning apparatus and method, image processing apparatus and method, program, and recording medium
JPH0983961A (ja) クラス予測係数の学習方法並びにクラス分類適応処理を用いた信号変換装置および方法
JP3693187B2 (ja) 信号変換装置及び信号変換方法
JP2000348019A (ja) データ処理装置およびデータ処理方法、並びに媒体
JP4552262B2 (ja) ノイズ低減装置および方法
JP4770704B2 (ja) 画像処理装置、画像処理方法、およびプログラム
JP4505729B2 (ja) 画像処理装置、画像処理方法、プログラム、および記録媒体
JP4470282B2 (ja) 画像処理装置および画像処理方法
JP4552263B2 (ja) ディジタル信号処理装置および方法、並びにディジタル画像信号処理装置および方法

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20090316

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20090316

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20111226

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20120105

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20120227

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20120515