JP2011217010A - 係数学習装置および方法、画像処理装置および方法、プログラム、並びに記録媒体 - Google Patents
係数学習装置および方法、画像処理装置および方法、プログラム、並びに記録媒体 Download PDFInfo
- Publication number
- JP2011217010A JP2011217010A JP2010081325A JP2010081325A JP2011217010A JP 2011217010 A JP2011217010 A JP 2011217010A JP 2010081325 A JP2010081325 A JP 2010081325A JP 2010081325 A JP2010081325 A JP 2010081325A JP 2011217010 A JP2011217010 A JP 2011217010A
- Authority
- JP
- Japan
- Prior art keywords
- discrimination
- pixel
- value
- image
- regression
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
- 238000000034 method Methods 0.000 title claims description 128
- 230000002093 peripheral effect Effects 0.000 claims abstract description 34
- 238000004364 calculation method Methods 0.000 claims description 150
- 230000008569 process Effects 0.000 claims description 111
- 230000008859 change Effects 0.000 claims description 36
- 230000006870 function Effects 0.000 claims description 6
- 239000000284 extract Substances 0.000 claims description 5
- 238000003672 processing method Methods 0.000 claims 1
- 238000002372 labelling Methods 0.000 description 27
- 230000003252 repetitive effect Effects 0.000 description 22
- 238000010586 diagram Methods 0.000 description 15
- 230000005236 sound signal Effects 0.000 description 8
- 230000003044 adaptive effect Effects 0.000 description 4
- 230000006866 deterioration Effects 0.000 description 4
- 230000006872 improvement Effects 0.000 description 4
- 230000006978 adaptation Effects 0.000 description 3
- 238000004891 communication Methods 0.000 description 3
- 230000003321 amplification Effects 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 2
- 239000004973 liquid crystal related substance Substances 0.000 description 2
- 238000003199 nucleic acid amplification method Methods 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 239000004065 semiconductor Substances 0.000 description 2
- 241000255925 Diptera Species 0.000 description 1
- 230000015556 catabolic process Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 238000006731 degradation reaction Methods 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N5/00—Details of television systems
- H04N5/14—Picture signal circuitry for video frequency region
- H04N5/142—Edging; Contouring
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T5/00—Image enhancement or restoration
- G06T5/70—Denoising; Smoothing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/10—Image acquisition modality
- G06T2207/10004—Still image; Photographic image
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20004—Adaptive image processing
- G06T2207/20008—Globally adaptive
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20081—Training; Learning
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Image Processing (AREA)
- Television Systems (AREA)
- Facsimile Image Signal Circuits (AREA)
Abstract
【課題】多様な入力信号に対して、その画質に応じて適応的に解像度感/鮮鋭感を向上させて高画質化することを、低コストで実現できるようにする。
【解決手段】回帰予測演算と判別予測演算において、入力画像の注目画素に対応する複数の画素の値から得られる特徴量をパラメータとして与える。このパラメータを入力画像の注目画素に対応する複数の画素の値から得られる5つの特徴量によって構成する。なお、回帰予測演算では、入力画像の注目画素に対応する複数の画素の値から得られる5つの特徴量のうち、2つの特徴量が用いられる。上述の5つの特徴量は、高域フィルタ演算値、低域フィルタ演算値、周辺画素値の最大値、周辺画素値の最小値、および周辺画素値の差分絶対値の最大値とされる。
【選択図】図3
【解決手段】回帰予測演算と判別予測演算において、入力画像の注目画素に対応する複数の画素の値から得られる特徴量をパラメータとして与える。このパラメータを入力画像の注目画素に対応する複数の画素の値から得られる5つの特徴量によって構成する。なお、回帰予測演算では、入力画像の注目画素に対応する複数の画素の値から得られる5つの特徴量のうち、2つの特徴量が用いられる。上述の5つの特徴量は、高域フィルタ演算値、低域フィルタ演算値、周辺画素値の最大値、周辺画素値の最小値、および周辺画素値の差分絶対値の最大値とされる。
【選択図】図3
Description
本発明は、係数学習装置および方法、画像処理装置および方法、プログラム、並びに記録媒体に関し、特に、多様な入力信号に対して、その画質に応じて適応的に解像度感/鮮鋭感を向上させて高画質化することを、低コストで実現できるようにする係数学習装置および方法、画像処理装置および方法、プログラム、並びに記録媒体に関する。
近年、映像信号が多様化しており、画像のフォーマットに関わらず様々な帯域が混在している。例えば、HDサイズの画像であっても、実はもともとSD画像がアップコンバートされた画像である場合がある。このような画像は、本来のHD画像と異なり、画像の細部の帯域が小さいため、ディテール感に乏しい画像となる場合が多い。
また、画像に含まれるノイズも、さまざまなレベルのものが混入している。
ノイズなど劣化を含んだ入力画像からノイズのない画像を予測したり、SD信号を高解像度のHD信号に変換するために、クラス分類適応処理を用いる手法が提案されている(例えば、特許文献1参照)。
特許文献1の技術により、SD信号をHD信号に変換する場合、まず、入力SD信号からなるクラスタップの特徴を、ADRC(適応的ダイナミックレンジ符号化)等を用いて求め、得られたクラスタップの特徴に基づいてクラス分類を行う。そして、そのクラス毎に用意された予測係数と、入力SD信号からなる予測タップとの演算を行うことによって、HD信号を得る。
クラス分類は、予測値を求めようとする高S/N画素の位置に対応する低S/N画像の位置から空間的または時間的に近い位置にある低S/N画素の画素値のパターンによって、各高S/N画素を、いわばグループ分けするものであり、適応処理は、各グループ(上述のクラスに相当する)ごとに、そのグループに属する高S/N画素に対して、より適した予測係数を求めて、その予測係数により、画質の向上を図るものであるから、クラス分類は、基本的には、予測値を求めようとする高S/N画素に関係する、より多くの画素からクラスタップを構成して行うのが望ましい。
ところで、劣化を含んだ生徒(入力)画像から教師画像を予測する上で、全画面を生徒(入力)画像の線形和で表されるような1つのモデルで処理するには精度に問題がある。例えば、クラス分類適応処理によって、入力画像の解像度感/鮮鋭感を向上させた画像を予測する場合、多様な入力信号に対応しようとすると画像の帯域や種類(自然画像/人工画像)、ノイズ量に応じても処理を変える必要がある。
しかしながら、そのためには膨大なパターンを考慮する必要があり,全てのケースをカバーするのは難しい。そのため、予測処理を行った結果として得られた画像の解像度感/鮮鋭感が改善していないぼけたものになってしまうことや、逆に処理が強すぎてリンギング劣化やノイズを強調してしまう場合が多い。
本発明はこのような状況に鑑みてなされたものであり、多様な入力信号に対して、その画質に応じて適応的に解像度感/鮮鋭感を向上させて高画質化することを、低コストで実現できるようにするものである。
本発明の第1の側面は、第1の信号の画像から、注目画素および周辺画素の画素値の変化量の周波数帯域を抽出するための複数のフィルタ演算値として構成される回帰タップを取得して、前記回帰タップと回帰係数との演算により第2の信号の画像における前記注目画素に対応する画素の値を求める回帰予測演算の前記回帰係数を算出する回帰係数算出手段と、前記算出された前記回帰係数と、前記第1の信号の画像から得られた回帰タップに基づいて前記回帰予測演算を行って回帰予測値を算出する回帰予測値算出手段と、前記算出された前記回帰予測値と、第2の信号の画像における前記注目画素に対応する画素の値との比較結果に基づいて、前記注目画素に第1の判別クラスに属する画素であるかまたは第2の判別クラスに属する画素であるかを判別するための判別情報を付与する判別情報付与手段と、前記付与された判別情報に基づいて、第1の信号の画像から注目画素および周辺画素の画素値の変化量の周波数帯域を抽出するための複数のフィルタ演算値並びに前記周辺画素の画素値に基づく複数の特徴量を要素として構成される判別タップを取得して、前記判別タップの要素のそれぞれと判別係数との積和演算により前記注目画素が属する判別クラスを特定するための判別予測値を求める判別予測演算の前記判別係数を算出する判別係数算出手段と、前記算出された前記判別係数と、前記第1の信号の画像から得られた判別タップに基づいて前記判別予測演算を行って判別予測値を算出する判別予測値算出手段と、前記算出された前記判別予測値に基づいて、前記第1の信号の画像の画素のそれぞれを、前記第1の判別クラスと前記第2の判別クラスのいずれかに分類する分類手段とを備え、前記回帰係数算出手段は、前記第1の判別クラスに分類された画素のみを用いて前記回帰係数をさらに算出し、前記第2の判別クラスに分類された画素のみを用いて前記回帰係数をさらに算出する係数学習装置である。
前記回帰係数算出手段が前記判別クラス毎に算出した前記回帰係数により前記回帰予測値算出手段が前記判別クラス毎に算出した前記回帰予測値に基づいて、前記判別情報付与手段が判別情報を付与する処理、前記判別係数算出手段が前記判別係数を算出する処理、および前記判別予測値算出手段が前記判別予測値を算出する処理を繰り返し実行するようにすることができる。
前記回帰予測値と、第2の信号の画像における前記注目画素に対応する画素の値と差分が0以上である場合、前記注目画素は、第1の判別クラスに属する画素であると判別され、前記回帰予測値と、第2の信号の画像における前記注目画素に対応する画素の値と差分が0未満である場合、前記注目画素は、第1の判別クラスに属する画素であると判別されるようにすることができる。
前記回帰予測値と、第2の信号の画像における前記注目画素に対応する画素の値と差分絶対値が予め設定された閾値以上である場合、前記注目画素は、第1の判別クラスに属する画素であると判別され、前記回帰予測値と、第2の信号の画像における前記注目画素に対応する画素の値と差分絶対値が前記閾値未満である場合、前記注目画素は、第2の判別クラスに属する画素であると判別されるようにすることができる。
前記第1の信号の画像は、前記第2の信号の画像に対して画素値の変化量の周波数帯域が制限され、所定のノイズが付加された画像であるようにすることができる。
前記第2の信号の画像は、自然画像または人工画像であるようにすることができる。
前記判別タップに含まれる前記周辺画素の画素値に基づく複数の特徴量は、周辺画素値の最大値、周辺画素値の最小値、および周辺画素値の差分絶対値の最大値であるようにすることができる。
本発明の第1の側面は、回帰係数算出手段が、第1の信号の画像から、注目画素および周辺画素の画素値の変化量の周波数帯域を抽出するための複数のフィルタ演算値として構成される回帰タップを取得して、前記回帰タップと回帰係数との演算により第2の信号の画像における前記注目画素に対応する画素の値を求める回帰予測演算の前記回帰係数を算出し、回帰予測値算出手段が、前記算出された前記回帰係数と、前記第1の信号の画像から得られた回帰タップに基づいて前記回帰予測演算を行って回帰予測値を算出し、判別情報付与手段が、前記算出された前記回帰予測値と、第2の信号の画像における前記注目画素に対応する画素の値との比較結果に基づいて、前記注目画素に第1の判別クラスに属する画素であるかまたは第2の判別クラスに属する画素であるかを判別するための判別情報を付与し、判別係数算出手段が、前記付与された判別情報に基づいて、第1の信号の画像から注目画素および周辺画素の画素値の変化量の周波数帯域を抽出するための複数のフィルタ演算値並びに前記周辺画素の画素値に基づく複数の特徴量を要素として構成される判別タップを取得して、前記判別タップの要素のそれぞれと判別係数との積和演算により前記注目画素が属する判別クラスを特定するための判別予測値を求める判別予測演算の前記判別係数を算出し、判別予測値算出手段が、前記算出された前記判別係数と、前記第1の信号の画像から得られた判別タップに基づいて前記判別予測演算を行って判別予測値を算出し、分類手段が、前記算出された前記判別予測値に基づいて、前記第1の信号の画像の画素のそれぞれを、前記第1の判別クラスと前記第2の判別クラスのいずれかに分類し、前記第1の判別クラスに分類された画素のみを用いて前記回帰係数がさらに算出され、前記第2の判別クラスに分類された画素のみを用いて前記回帰係数がさらに算出されるステップを含む係数学習方法である。
本発明の第1の側面は、コンピュータを、第1の信号の画像から、注目画素および周辺画素の画素値の変化量の周波数帯域を抽出するための複数のフィルタ演算値として構成される回帰タップを取得して、前記回帰タップと回帰係数との演算により第2の信号の画像における前記注目画素に対応する画素の値を求める回帰予測演算の前記回帰係数を算出する回帰係数算出手段と、前記算出された前記回帰係数と、前記第1の信号の画像から得られた回帰タップに基づいて前記回帰予測演算を行って回帰予測値を算出する回帰予測値算出手段と、前記算出された前記回帰予測値と、第2の信号の画像における前記注目画素に対応する画素の値との比較結果に基づいて、前記注目画素に第1の判別クラスに属する画素であるかまたは第2の判別クラスに属する画素であるかを判別するための判別情報を付与する判別情報付与手段と、前記付与された判別情報に基づいて、第1の信号の画像から注目画素および周辺画素の画素値の変化量の周波数帯域を抽出するための複数のフィルタ演算値並びに前記周辺画素の画素値に基づく複数の特徴量を要素として構成される判別タップを取得して、前記判別タップの要素のそれぞれと判別係数との積和演算により前記注目画素が属する判別クラスを特定するための判別予測値を求める判別予測演算の前記判別係数を算出する判別係数算出手段と、前記算出された前記判別係数と、前記第1の信号の画像から得られた判別タップに基づいて前記判別予測演算を行って判別予測値を算出する判別予測値算出手段と、前記算出された前記判別予測値に基づいて、前記第1の信号の画像の画素のそれぞれを、前記第1の判別クラスと前記第2の判別クラスのいずれかに分類する分類手段とを備え、前記回帰係数算出手段は、前記第1の判別クラスに分類された画素のみを用いて前記回帰係数をさらに算出し、前記第2の判別クラスに分類された画素のみを用いて前記回帰係数をさらに算出する係数学習装置として機能させるプログラムである。
本発明の第1の側面においては、第1の信号の画像から、注目画素および周辺画素の画素値の変化量の周波数帯域を抽出するための複数のフィルタ演算値として構成される回帰タップを取得して、前記回帰タップと回帰係数との演算により第2の信号の画像における前記注目画素に対応する画素の値を求める回帰予測演算の前記回帰係数が算出され、前記算出された前記回帰係数と、前記第1の信号の画像から得られた回帰タップに基づいて前記回帰予測演算を行って回帰予測値が算出され、前記算出された前記回帰予測値と、第2の信号の画像における前記注目画素に対応する画素の値との比較結果に基づいて、前記注目画素に第1の判別クラスに属する画素であるかまたは第2の判別クラスに属する画素であるかを判別するための判別情報が付与され、前記付与された判別情報に基づいて、第1の信号の画像から注目画素および周辺画素の画素値の変化量の周波数帯域を抽出するための複数のフィルタ演算値並びに前記周辺画素の画素値に基づく複数の特徴量を要素として構成される判別タップが取得され、前記判別タップの要素のそれぞれと判別係数との積和演算により前記注目画素が属する判別クラスを特定するための判別予測値を求める判別予測演算の前記判別係数が算出され、前記算出された前記判別係数と、前記第1の信号の画像から得られた判別タップに基づいて前記判別予測演算を行って判別予測値が算出され、前記算出された前記判別予測値に基づいて、前記第1の信号の画像の画素のそれぞれが、前記第1の判別クラスと前記第2の判別クラスのいずれかに分類され、前記第1の判別クラスに分類された画素のみを用いて前記回帰係数がさらに算出され、前記第2の判別クラスに分類された画素のみを用いて前記回帰係数がさらに算出される。
本発明の第2の側面は、第1の信号の画像から注目画素および周辺画素の画素値の変化量の周波数帯域を抽出するための複数のフィルタ演算値並びに前記周辺画素の画素値に基づく複数の特徴量を要素として構成される判別タップを取得して、前記判別タップの要素のそれぞれと判別係数との積和演算により前記注目画素が属する判別クラスを特定するための判別予測値を求める判別予測演算を行う判別予測手段と、前記判別予測値に基づいて、前記第1の信号の画像の画素のそれぞれを、前記第1の判別クラスと前記第2の判別クラスのいずれかに分類する分類手段と、前記第1の信号の画像から、注目画素および周辺画素の画素値の変化量の周波数帯域を抽出するための複数のフィルタ演算値として構成される回帰タップを取得して、前記回帰タップと回帰係数との演算により回帰予測値を演算することで、第2の信号の画像における前記注目画素に対応する画素の画素値を予測する回帰予測手段とを備える画像処理装置である。
前記判別予測手段が前記判別予測演算を行う処理、および前記分類手段が前記第1の信号の画像の画素のそれぞれを、分類する処理を繰り返し実行するようにすることができる。
前記第1の信号の画像は、前記第2の信号の画像に対して画素値の変化量の周波数帯域が制限され、所定のノイズが付加された画像であるようにすることができる。
前記第2の信号の画像は、自然画像または人工画像であるようにすることができる。
前記判別タップに含まれる前記周辺画素の画素値に基づく複数の特徴量は、周辺画素値の最大値、周辺画素値の最小値、および周辺画素値の差分絶対値の最大値であるようにすることができる。
本発明の第2の側面は、判別予測手段が、第1の信号の画像から注目画素および周辺画素の画素値の変化量の周波数帯域を抽出するための複数のフィルタ演算値並びに前記周辺画素の画素値に基づく複数の特徴量を要素として構成される判別タップを取得して、前記判別タップの要素のそれぞれと判別係数との積和演算により前記注目画素が属する判別クラスを特定するための判別予測値を求める判別予測演算を行い、分類手段が、前記判別予測値に基づいて、前記第1の信号の画像の画素のそれぞれを、前記第1の判別クラスと前記第2の判別クラスのいずれかに分類し、回帰予測手段が、前記第1の信号の画像から、注目画素および周辺画素の画素値の変化量の周波数帯域を抽出するための複数のフィルタ演算値として構成される回帰タップを取得して、前記回帰タップと回帰係数との演算により回帰予測値を演算することで、第2の信号の画像における前記注目画素に対応する画素の画素値を予測するステップを含む画像処理方法である。
本発明の第2の側面は、コンピュータを、第1の信号の画像から注目画素および周辺画素の画素値の変化量の周波数帯域を抽出するための複数のフィルタ演算値並びに前記周辺画素の画素値に基づく複数の特徴量を要素として構成される判別タップを取得して、前記判別タップの要素のそれぞれと判別係数との積和演算により前記注目画素が属する判別クラスを特定するための判別予測値を求める判別予測演算を行う判別予測手段と、前記判別予測値に基づいて、前記第1の信号の画像の画素のそれぞれを、前記第1の判別クラスと前記第2の判別クラスのいずれかに分類する分類手段と、前記第1の信号の画像から、注目画素および周辺画素の画素値の変化量の周波数帯域を抽出するための複数のフィルタ演算値として構成される回帰タップを取得して、前記回帰タップと回帰係数との演算により回帰予測値を演算することで、第2の信号の画像における前記注目画素に対応する画素の画素値を予測する回帰予測手段とを備える画像処理装置として機能させるプログラムである。
本発明の第2の側面においては、第1の信号の画像から注目画素および周辺画素の画素値の変化量の周波数帯域を抽出するための複数のフィルタ演算値並びに前記周辺画素の画素値に基づく複数の特徴量を要素として構成される判別タップが取得され、前記判別タップの要素のそれぞれと判別係数との積和演算により前記注目画素が属する判別クラスを特定するための判別予測値を求める判別予測演算が行われ、前記判別予測値に基づいて、前記第1の信号の画像の画素のそれぞれが、前記第1の判別クラスと前記第2の判別クラスのいずれかに分類され、前記第1の信号の画像から、注目画素および周辺画素の画素値の変化量の周波数帯域を抽出するための複数のフィルタ演算値として構成される回帰タップを取得して、前記回帰タップと回帰係数との演算により回帰予測値を演算することで、第2の信号の画像における前記注目画素に対応する画素の画素値が予測される。
本発明によれば、多様な入力信号に対して、その画質に応じて適応的に解像度感/鮮鋭感を向上させて高画質化することを、低コストで実現できる。
以下、図面を参照して、本発明の実施の形態について説明する。
図1は、本発明の一実施の形態に係る学習装置の構成例を示すブロック図である。
この学習装置10は、画像の高画質化処理に用いられる学習装置とされ、入力された生徒画像および教師画像(または教師信号)のデータに基づいて、高画質化処理において用いられる係数を生成するようになされている。
ここで、高画質化処理は、入力画像の解像度感/鮮鋭感を向上させた画像を生成する処理などとされ、例えば、帯域の小さい画像を帯域の大きい画像に変換したり、画像に含まれるノイズを除去したりする処理とされる。また、入力画像として、CG画像やテロップなどを含む画像(人工画像と称することにする)を入力画像とする場合、テロップなどを含まない画像(自然画像と称することにする)を入力画像とする場合がある。
学習装置10は、生徒画像を入力画像として、教師画像に近い高画質の画像を出力画像として生成するための係数である回帰係数を学習するようになされている。詳細は後述するが、回帰係数は、入力画像の注目画素に対応する複数の画素の値から得られる特徴量をパラメータとし、高画質化された画像において注目画素に対応する画素の値を演算する線形一次式に用いられる係数とされる。なお、回帰係数は、後述するクラス番号毎に学習される。
また、学習装置10は、入力画像の注目画素に対応する複数の画素の値から得られる特徴量に基づいて、注目画素を、複数のクラスのうちのいずれかにクラス分けする。すなわち、学習装置10は、入力画像の注目画素のそれぞれが、高画質化処理のためのどのクラスに属する画素であるかを特定するための判別係数を学習するようになされている。詳細は後述するが、判別係数は、入力画像の注目画素に対応する複数の画素の値から得られる特徴量をパラメータとする線形一次式に用いられる係数とされる。
すなわち、学習装置10により学習された判別係数を用いて、入力画像の注目画素に対応する複数の画素の値から得られる特徴量をパラメータとした線形一次式の演算を繰り返し実行することにより、高画質化処理のためのクラスが特定されるようになされている。そして、特定されたクラスに対応する回帰係数を用いて、入力画像の注目画素に対応する複数の画素の値から得られる特徴量をパラメータとした線形一次式の演算を実行することにより、高画質化された画像の画素値が演算されるようになされている。
学習装置10においては、例えば、教師画像として帯域制限がなくノイズのない画像を入力され、生徒画像として教師画像に対して帯域制限を付加し、ノイズを付加した画像が入力される。教師画像と生徒画像は、1対(学習対と称することにする)ずつ入力されて学習装置10により学習が行われる。
図2は学習対生成装置30の構成例を示すブロック図である。同図に示されるように、学習対生成装置30は、帯域制限部31およびノイズ付加部32を有する構成とされている。
この例では、自然画像または人工画像のHD画像が学習対生成装置30に入力され、入力画像がそのまま教師画像として出力されるようになされている。一方、入力画像に対して、帯域制限部31およびノイズ付加部32の処理が施された画像が生徒画像として出力されるようになされている。
帯域制限部31は、主に入力画像の帯域を小さくするための帯域制限を行う機能ブロックとされる。例えば、帯域制限部31の処理により、入力画像の細部の画素値の変化量が縮退され、ディテール感の乏しい画像が生成される。すなわち、画像の画素値の変化量の周波数帯域がより小さくなるような処理が施される。なお、帯域制限部31は、例えば、「帯域制限なし」を含む9種類の帯域制限を付加できるようになされており、1つの入力画像に対して9通りの出力が得られることになる。
ノイズ付加部32は、主に入力画像に各種のノイズを付加する機能ブロックとされる。例えば、ノイズ付加部32の処理により、入力画像の一部にブロックノイズやモスキートノイズなどが付加された画像が生成される。なお、ノイズ付加部32は、例えば、「ノイズなし」を含む11種類のノイズを付加できるようになされており、帯域制限部31から供給される1つの入力画像に対して11通りの出力が得られることになる。
図2に示される学習対生成装置30によって、例えば、1つの入力画像に対して99(=9×11)通りの出力が得られることになる。しかし、そのうち1通りは、「帯域制限なし」かつ「ノイズなし」であって、入力画像と同じ画像になるから、1つの入力画像から、合計98通りの学習対が学習対生成装置30によって生成されることになる。
学習対生成装置30には、例えば、自然画像、人工画像がそれぞれ複数供給され、上述したように学習対が生成されていく。そして、生成された学習対が、図1の学習装置10に、生徒画像と教師画像として供給されることになる。
図1に戻って、生徒画像のデータは、回帰係数学習部21、回帰予測部23、判別係数学習部25、および判別予測部27に供給される。
回帰係数学習部21は、生徒画像を構成する画素の中から所定の画素を注目画素として設定する。そして、回帰係数学習部21は、生徒画像の注目画素とその周辺の画素値から、注目画素に対応する教師画像画素値を予測するための回帰予測演算式の係数を、例えば、最小二乗法を用いて学習する。
詳細は後述するが、本発明では、上述の回帰予測演算において、予測値は、学習装置10によって学習した回帰係数を用いた線形モデルであると仮定する。この際、回帰予測演算において、入力画像の注目画素に対応する複数の画素の値から得られる特徴量をパラメータとして与えることになる。また、本発明では、上述の判別係数を用いた線形一次式の演算(判別予測演算)においても、入力画像の注目画素に対応する複数の画素の値から得られる特徴量をパラメータとして与えることになる。本発明では、このパラメータを入力画像の注目画素に対応する複数の画素の値から得られる5つの特徴量によって構成する。なお、後述するように、回帰予測演算では、入力画像の注目画素に対応する複数の画素の値から得られる5つの特徴量のうち、2つの特徴量が用いられる。
上述の5つの特徴量は、高域フィルタ演算値、低域フィルタ演算値、周辺画素値の最大値、周辺画素値の最小値、および周辺画素値の差分絶対値の最大値とされる。
図3は、上述した5つの特徴量を算出するために用いられる生徒画像の画素を説明する図である。この例では、xy平面上に並べられた5行9例(=45個)の円によって、生徒画像の画素が示され、各画素は、「x」と「in(n=1,2,・・・45)」からなる符号が付されている。いま、画素値を予測すべき教師画像の画素の位相(座標)に対応する注目画素は、図中3行5列目の画素(「i23」の符号が付された円)であるものとする。なお、図中の円内に付された符号は、各画素を識別する符号であるとともに、各画素の画素値としても用いることとする。
上述した5つの特徴量のうちの第1番目と第2番目の特徴量である高域フィルタ演算値と低域フィルタ演算値は、注目画素およびその周辺の画素の画素値の変化量の周波数帯域に関する情報を抽出するものである。式(1)により演算される。
式(1)により求められるxi t1が高域フィルタ演算値とされ、式(1)により求められるxi t2が低域フィルタ演算値とされる。なお、フィルタ係数は、予め設定されているものとする。
式(1)では、図3に示される5行9例の画素のうち、第3列目乃至第7列目までの画素からなる25個(5行5列)の画素の画素値が演算に用いられている。ここで、注目画素に対する相対的位置が同一である複数の画素の画素値には同一のフィルタ係数が乗じられるようになされている。例えば、注目画素(「i23」の符号が付された円)からの相対的位置が同一である「i14」、「i22」、「i24」、および「i32」の符号が付された画素の画素値には同一のフィルタ係数v2 t1が乗じられている。
式(1)に示されるように、同一のフィルタ係数を乗じる画素値を予め加算しておくこと(式中かっこ内の演算)により、フィルタ係数の数を縮退することができ、処理負荷を軽減することができる。
なお、ここでは、高域フィルタ演算値と低域フィルタ演算値を第1番目の特徴量としているが、第1番目の特徴量には、別のフィルタ演算値が含まれるようにしても構わない。
上述した5つの特徴量のうちの第3番目と第4番目の特徴量である周辺画素値の最大値、周辺画素値の最小値は、式(2)により演算される。
式(2)により求められるxi (max)が周辺画素値の最大値とされ、式(2)により求められるxi (min)が周辺画素値の最小値とされる。
上述した5つの特徴量のうちの第5番目の特徴量である周辺画素値の差分絶対値の最大値は、次のようにして求める。最初に、周辺画素値の水平方向差分絶対値の最大値、周辺画素値の垂直方向差分絶対値の最大値、周辺画素値の右斜め方向差分絶対値の最大値、および周辺画素値の左斜め方向差分絶対値の最大値をそれぞれ求める。
図4は、周辺画素値の水平方向差分絶対値を説明する図である。同図に示されるように、図3に示される45個の画素についてそれぞれ水平方向に隣接する画素値の差分絶対値を演算する。例えば、「i1」の符号が付された画素の画素値と「i2」の符号が付された画素の画素値の差分絶対値が|xi1 (h)|として算出される。
同様にして、周辺画素値の垂直方向差分絶対値は、図5に示されるようにして演算される。周辺画素値の右斜め方向差分絶対値および周辺画素値の左斜め方向差分絶対値は、それぞれ、図6および図7に示されるようにして演算される。
そして、図4乃至図7を参照して上述したように演算された水平方向差分絶対値、垂直方向差分絶対値、右斜め方向差分絶対値、および左斜め方向差分絶対値について、それぞれの最大値を式(3)により求める。
式(3)の|xi (h)|(max)が、周辺画素値の水平方向差分絶対値の最大値とされる。式(3)の|xi (v)|(max)が、周辺画素値の垂直方向差分絶対値の最大値とされる。式(3)の|xi (s1)|(max)が、周辺画素値の右斜め方向差分絶対値の最大値とされる。式(3)の|xi (s2)|(max)が、周辺画素値の左斜め方向差分絶対値の最大値とされる。
さらに、式(3)により得られた4つの最大値のうち、最も大きい値が、式(4)によって求められる。
式(4)の|xi|(max)が、第5番目の特徴量である周辺画素値の差分絶対値の最大値となる。
次に、上述した回帰係数の学習について説明する。上述した教師画像画素値を予測するための回帰予測演算式において、例えば、教師画像の画素値ti(i=1,2,..N)とし、予測値yi(i=1,2,..N)とおくと、式(5)が成立する。ここでNは、生徒画像の画素と教師画像の画素との全サンプル数を表すものとする。
ここで、εi(i=1,2,..N)は、誤差項である。
予測値yiは、回帰係数w0を用いた線形モデルを仮定すると、生徒画像の画素値から求めた高域フィルタ演算値および低域フィルタ演算値をパラメータ(タップとも称する)として用いて、式(6)のように表現できる。
回帰予測演算式の係数を、最小二乗法を用いて学習する場合、上述したように求められた予測値を式(5)に代入し、式(5)の誤差項の全サンプル分の自乗和を式(7)により演算する。
そして、式(7)の誤差項の全サンプル分の自乗和Eが最小となるような、回帰係数w0を導出する。
なお、従来のクラス分類適応処理では、回帰予測演算に用いられる回帰係数が、タップの要素数と同じ要素数のベクトルによって構成されていた。例えば、入力画像から抽出される特徴量(パラメータ)が2つ(例えば、高域フィルタ演算値および低域フィルタ演算値)であれば、2つの係数からなる回帰係数を用いた回帰予測演算が行われていた。
これに対して、本願発明では、1つの係数w0のみからなる回帰係数を用いた回帰予測演算によって画素値を予測することができ、装置の処理負荷を軽減することが可能である。本発明では、後述するように判別係数を用いた判別予測式の演算を反復して実行することにより、注目画素をクラス分類するようにしたので、その分類結果に基づいて特定された回帰係数を用いた回帰予測演算を簡素なものとすることが可能となった。
図1に戻って、回帰係数学習部21は、このようにして回帰係数を求める。回帰係数学習部21により得られた回帰係数は、回帰予測によって、高画質化された画像の画素値を予測するための演算に用いられる係数とされる。
回帰係数学習部21により得られた回帰係数は、回帰係数記憶部22に記憶される。
回帰予測部23は、生徒画像を構成する画素の中から所定の画素を注目画素として設定する。そして、回帰予測部23は、式(1)、式(2)、式(4)の演算によって上述したパラメータ(5つの特徴量)を算出する。
回帰予測部23は、式(6)に高域フィルタ演算値および低域フィルタ演算値と回帰係数w0を代入して予測値yiを演算する。
ラベリング部24は、回帰予測部23により演算された予測値yiを、教師画像の画素値である真値tiと比較する。ラベリング部24は、例えば、予測値yiが真値ti以上となった注目画素を判別クラスAとしてラベリングし、予測値yiが真値ti未満となった注目画素を判別クラスBとしてラベリングする。すなわち、ラベリング部24は、回帰予測部23の演算結果に基づいて、生徒画像の各画素を判別クラスAと判別クラスBに分類するのである。
図8は、ラベリング部24の処理を説明するヒストグラムである。同図の横軸は、予測値yiから真値tiを引いた差分値を表し、縦軸は、その差分値が得られたサンプル(教師画像の画素と生徒画像の画素との組み合わせ)の相対頻度を表している。
同図に示されるように、回帰予測部23の演算により、予測値yiから真値tiを引いた差分値が0となったサンプルの頻度が最も高くなっている。差分値が0である場合、回帰予測部23により正確な予測値(=真値)が演算されたことになり、適切に高画質化の処理がなされたことになる。すなわち、回帰係数学習部21により回帰係数が学習されたので、式(6)により正確な予測値が演算される可能性は高いといえる。
しかし、差分値が0以外のものについては、正確な回帰予測がなされたとはいえない。そうであれば、より適切な回帰係数を学習する余地があると考えられる。
本発明では、例えば、予測値yiが真値ti以上となった注目画素のみを対象として回帰係数を学習すれば、それらの注目画素に対してより適切な回帰係数を学習することができ、予測値yiが真値ti未満となった注目画素のみを対象として回帰係数を学習すれば、それらの注目画素に対してより適切な回帰係数を学習することができると仮定する。このため、ラベリング部24は、回帰予測部23の演算結果に基づいて、生徒画像の各画素を判別クラスAと判別クラスBに分類する。
そして、この後、判別係数学習部25の処理によって、生徒画像の画素値に基づいて、各画素を判別クラスAと判別クラスBに分類するための予測演算に用いられる係数が学習されるのである。すなわち、本発明においては、真値が不明であっても、入力画像の画素値に基づいて各画素を判別クラスAと判別クラスBに分類できるようにするのである。
ここでは、ラベリング部24が生徒画像の各画素をラベリングすると説明したが、ラベリングの単位は、正確には教師画像の画素値である真値tiに対応する生徒画像から得られたタップ(上述した5つの特徴量)毎に1個ずつラベリングされることになる。
なお、ここでは、高域フィルタ演算値、低域フィルタ演算値、周辺画素値の最大値、周辺画素値の最小値、および周辺画素値の差分絶対値の最大値を1組の「タップ」と呼んでいる。すなわち、タップは5次元の特徴量ベクトルということもできる。この1組のタップは、生徒画像の各画素を注目画素とし、それぞれの注目画素に対応して抽出されることになる。
なお、本発明の場合、判別予測値の演算に用いられるタップと、回帰予測値の演算に用いられるタップの要素数が異なっている。すなわち、式(6)に示されるように、回帰予測値の演算に用いられるタップの要素数は2つ(高域フィルタ演算値および低域フィルタ演算値)であるのに対し、判別予測値の演算に用いられるタップの要素数は5つである。以下、適宜、回帰予測値の演算に用いられるタップを回帰タップと称し、判別予測値の演算に用いられるタップを判別タップと称することにする。
また、ここでは、予測値yiが真値ti以上となった注目画素と、予測値yiが真値ti未満となった注目画素とを判別してラベリングする例について説明したが、他の方式でラベリングするようにしてもよい。例えば、予測値yiと真値tiの差分絶対値が予め設定された閾値未満の値となった注目画素を判別クラスAとしてラベリングし、予測値yiと真値tiの差分絶対値が予め設定された閾値以上の値となった注目画素を判別クラスBとしてラベリングするようにしてもよい。さらに、それ以外の方式で注目画素を判別クラスAと判別クラスBにラベリングしてもよい。以下では、予測値yiが真値ti以上となった注目画素と、予測値yiが真値ti未満となった注目画素とを判別してラベリングする場合の例について説明する。
図1に戻って、判別係数学習部25は、生徒画像を構成する画素の中から所定の画素を注目画素として設定する。そして、判別係数学習部25は、生徒画像の注目画素とその周辺の画素値から、判別クラスAと判別クラスBを判定するための予測値の演算に用いられる係数を学習する。
判別係数の学習においては、生徒画像の注目画素とその周辺の画素値から得られる特徴量に基づいて、判別クラスAと判別クラスBを判定するための予測値yiが式(8)により求められるものとする。
なお、zTは、行列式として表されるzの転置行列を表している。zoは、バイアスパラメータであり、定数項である。なお、式(8)において定数項であるバイアスパラメータzoは含まれないようにすることも可能である。
式(8)において、パラメータとして用いられるxi、すなわち、上述した5つの特徴量からなるベクトルを、上述したようにタップ(判別タップ)と称している。
判別係数学習部25は、式(8)の係数zおよびバイアスパラメータzoを学習して、判別係数記憶部26に記憶するようになされている。
判別予測式の係数は、例えば、判別分析によって導出される。または、最小二乗法を用いて学習するようにしてもよい。
このようにして得られる判別予測式の係数zは、上述したタップの要素数と同じ要素数(いまの場合、5個)のベクトルとなる。判別係数学習部25により得られた係数zは、所定の注目画素が判別クラスAまたは判別クラスBのいずれに属するかを予測するための演算に用いられる係数であり、判別係数zと称することにする。なお、バイアスパラメータzoも広義の判別係数であるものとし、必要に応じて判別係数zに対応付けられて記憶されるものとする。
このようにして学習された係数zを用いて判別予測部27により予測値が演算されて生徒画像の注目画素が判別クラスAに属するものであるか判別クラスBに属するものであるかを判定することができる。判別予測部27は、式(8)に判別タップと判別係数z(必要に応じてバイアスパラメータzoも含む)を代入して予測値yiを演算する。
そして、判別予測部27による演算の結果、予測値yiが0以上となった判別タップの注目画素は、判別クラスAに属する画素であり、予測値yiが0未満となった判別タップの注目画素は、判別クラスBに属する画素であるものと推定できる。
しかしながら、判別予測部27による演算の結果に基づく推定が必ずしも真実であるとは限らない。すなわち、式(8)に判別タップと判別係数zを代入して演算された予測値yiは、教師画像の画素値(真値)に係らず、生徒画像の画素値から予測した結果であるから、実際には判別クラスAに属する画素が判別クラスBに属する画素として推定されてしまったり、実際には判別クラスBに属する画素が判別クラスAに属する画素として推定されてしまうことがある。
そこで、本発明においては、反復して判別係数を学習させることにより、より精度の高い予測を可能とする。
すなわち、クラス分割部28が、判別予測部27の予測結果に基づいて、生徒画像を構成する各画素を、判別クラスAに属する画素と判別クラスBに属する画素とに分割する。
そして、回帰係数学習部21が、クラス分割部28により判別クラスAに属する画素のみを対象として、上述した場合と同様に回帰係数を学習して回帰係数記憶部22に記憶する。回帰予測部23は、クラス分割部28により判別クラスAに属するとされた画素のみを対象として、上述した場合と同様に回帰予測による予測値を演算する。
このようにして、得られた予測値と真値とを比較して、ラベリング部24がクラス分割部28により判別クラスAに属するとされた画素を、さらに判別クラスAと判別クラスBにラベリングする。
また、回帰係数学習部21が、クラス分割部28により判別クラスBに属するとされた画素のみを対象として、上述した場合と同様に回帰係数を学習する。回帰予測部23は、クラス分割部28により判別クラスBに属するとされた画素のみを対象として、上述した場合と同様に回帰予測による予測値を演算する。
このようにして、得られた予測値と真値とを比較して、ラベリング部24がクラス分割部28により判別クラスBに属するとされた画素を、さらに判別クラスAと判別クラスBにラベリングする。
つまり、生徒画像の画素が、4つの集合に分割されることになる。第1の集合は、クラス分割部28により判別クラスAに属するとされた画素であって、ラベリング部24により判別クラスAにラベリングされた画素の集合とされる。第2の集合は、クラス分割部28により判別クラスAに属するとされた画素であって、ラベリング部24により判別クラスBにラベリングされた画素の集合とされる。第3の集合は、クラス分割部28により判別クラスBに属するとされた画素であって、ラベリング部24により判別クラスAにラベリングされた画素の集合とされる。第4の集合は、クラス分割部28により判別クラスBに属するとされた画素であって、ラベリング部24により判別クラスBにラベリングされた画素の集合とされる。
この後、判別係数学習部25は、上述した4つの集合のうち、第1の集合と第2の集合に基づいて、あらためて判別係数を、上述した場合と同様にして学習する。また、判別係数学習部25は、上述した4つの集合のうち、第3の集合と第4の集合に基づいて、あらためて判別係数を、上述した場合と同様にして学習する。
図9と図10は、反復して行われる判別係数の学習を説明する図である。
図9は、生徒画像から得られたタップ値であって、タップ値1を横軸とし、タップ値2を縦軸として生徒画像のタップ(判別タップ)のそれぞれを表す空間を示した図である。すなわち、同図においては、説明を簡単にするために、仮想的にタップの要素数を2個として生徒画像において存在し得る全てのタップを2次元空間上に表している。従って、同図においては、タップが2個の要素からなるベクトルであるものと仮定する。
同図に示される円71は、ラベリング部24が最初に判別クラスAとラベリングした画素に対応するタップの集合を表しており、円72は、ラベリング部24が最初に判別クラスBとラベリングした画素に対応するタップの集合を表している。円71に示される記号73は、円71に含まれるタップの要素の値の平均値の位置を表しており、円71に示される記号74は、円72に含まれるタップの要素の値の平均値の位置を表している。
同図に示されるように、円71と円72は、互いに重なり合っているので、生徒画像から得られたタップの要素の値のみに基づいて、正確に判別クラスAとラベリングした画素に対応するタップと判別クラスBとラベリングした画素に対応するタップとを判別することはできなかったことになる。
しかしながら、記号73と記号74とに基づいて、おおよそ2つのクラスを判別するための境界線75を特定することは可能である。ここで、境界線75を特定する処理が、判別係数学習部25により行われる第1回目の学習により得られた判別係数を用いた判別予測部27の判別予測の処理に対応することになる。なお、境界線75上に位置するタップが、式(8)により演算された予測値yiが0となったタップである。
境界線75の図中右側に位置するタップの集合を識別するために、クラス分割部28がそれらのタップに対応する画素にクラスコードビット1を付与する。また、境界線75の図中左側に位置するタップの集合を識別するために、図1のクラス分割部28がそれらのタップに対応する画素にクラスコードビット0を付与する。
なお、第1回目の学習により得られた判別係数は、第1回目の判別予測に用いられる判別係数であることを表すコードなどに対応付けられて、図1の判別係数記憶部26に記憶される。また、第1回目の判別予測の結果に基づいて、クラスコードビット1が付与された画素のみに基づいて、あらためて回帰係数が学習されて回帰予測が行われる。同様に、第1回目の判別予測の結果に基づいて、クラスコードビット0が付与された画素のみに基づいて、あらためて回帰係数が学習されて回帰予測が行われる。
そして、クラスコードビット1が付与された画素群と、クラスコードビット0が付与された画素群のそれぞれに基づいて判別係数の学習が繰り返される。その結果、クラスコードビット1が付与された画素群がさらに2つに分割され、クラスコードビット2が付与された画素群もさらに2つに分割されることになる。このときの分割は、判別係数学習部25により行われる第2回目の学習により得られた判別係数を用いた判別予測部27の判別予測によりなされることになる。
なお、第2回目の学習により得られた判別係数は、第2回目の判別予測に用いられる判別係数であることを表すコードなどに対応付けられて、図1の判別係数記憶部26に記憶される。第2回目の学習により得られる判別係数は、第1回目の判別予測によりクラスコードビット1が付与された画素群と、第1回目の判別予測によりクラスコードビット0が付与された画素群のそれぞれを対象として行われる判別予測に用いられるので、いずれの画素群を対象とする判別予測に用いられるものであるのかを表すコードなどに対応付けられて、図1の判別係数記憶部26に記憶される。すなわち、第2回目の判別予測に用いられる判別係数は、2種類記憶されることになる。
また、第1回目と第2回目の判別予測の結果に基づいて、クラスコードビット11が付与された画素のみに基づいて、あらためて回帰係数が学習されて回帰予測が行われることになる。同様に、第1回目と第2回目の判別予測の結果に基づいて、クラスコードビット10が付与された画素のみに基づいて、あらためて回帰係数が学習されて回帰予測が行われることになる。さらに、第1回目と第2回目の判別予測の結果に基づいて、クラスコードビット01が付与された画素のみに基づいて、あらためて回帰係数が学習されて回帰予測が行われ、クラスコードビット00が付与された画素のみに基づいて、あらためて回帰係数が学習されて回帰予測が行われることになる。
このような処理を繰り返すことにより、図9に示される空間が図10に示されるように分割される。
図10は、図9と同様に、タップ値1を横軸とし、タップ値2を縦軸として生徒画像のタップ(判別タップ)のそれぞれを表す空間を示した図である。同図では、判別係数学習部25により3回反復して判別係数の学習が行われた場合の例が示されている。すなわち、第1回目の学習により得られた判別係数を用いた判別予測により境界線75が特定され、第2回目の学習により得られた判別係数を用いた判別予測により境界線76−1と境界線76−2が特定される。第3回目の学習により得られた判別係数を用いた判別予測により境界線77−1乃至境界線77−4が特定される。
図1のクラス分割部28は、境界線75により分割されたタップの集合を識別するために、第1ビット目のクラスコードビットを付与し、境界線76−1と境界線76−2により分割されたタップの集合を識別するために、第2ビット目のクラスコードビットを付与し、境界線77−1乃至境界線77−4により分割されたタップの集合を識別するために、第3ビット目のクラスコードビットを付与する。
従って、図10に示されるように、生徒画像から得られたタップのそれぞれは、3ビットのクラスコードに基づいて特定されるクラス番号C0乃至C7の8つのクラスに分割(分類)されることになる。
図10に示されるようにクラス分類された場合、図1の判別係数記憶部26に、第1回目の判別予測に用いられる判別係数が1種類記憶され、第2回目の判別予測に用いられる判別係数が2種類記憶され、第3回目の判別予測に用いられる判別係数が4種類記憶されていることになる。
また、図10に示されるようにクラス分類された場合、図1の回帰係数記憶部22に、クラス番号C0乃至C7のそれぞれに対応する8種類の回帰係数が記憶されていることになる。ここで、クラス番号C0乃至C7のそれぞれに対応する8種類の回帰係数は、第3回目の判別予測の結果、クラス番号C0乃至C7のそれぞれに分類された生徒画像の注目画素のタップ(回帰タップ)と、注目画素に対応する教師画像の画素値とをサンプルとし、それぞれのクラス番号毎にあらためて回帰係数の学習が行われて記憶される。
このように、生徒画像と教師画像を用いて予め判別係数を学習しておき、入力された画像について反復して判別予測を繰り返せば、入力画像の画素をクラス番号C0乃至C7の8つのクラスに分類することが可能となる。そして、8つのクラスに分類された画素に対応するタップと、それぞれのクラスに対応する回帰係数を用いて回帰予測を行えば、適切な高画質化処理を行うことが可能となる。
図11は、入力画像を図10のようにクラス分類する場合の例を、2分木構造を用いて説明する図である。入力画像の各画素が、第1回目の判別予測によって、第1ビットのクラスコードビット1または0が付与された画素に分類される。このとき、判別予測に用いられる判別係数は、反復コード1に対応する判別係数として図1の判別係数記憶部26に記憶されているものとする。
第1ビットのクラスコードビット1が付与された画素は、第2ビットのクラスコードビット1または0が付与された画素にさらに分類される。このとき、判別予測に用いられる判別係数は、反復コード21に対応する判別係数として図1の判別係数記憶部26に記憶されているものとする。同様に、第1ビットのクラスコードビット0が付与された画素は、第2ビットのクラスコードビット1または0が付与された画素にさらに分類される。このとき、判別予測に用いられる判別係数は、反復コード22に対応する判別係数として図1の判別係数記憶部26に記憶されているものとする。
第1ビットおよび第2ビットのクラスコードビット11が付与された画素は、第3ビットのクラスコードビット1または0が付与された画素にさらに分類される。このとき、判別予測に用いられる判別係数は、反復コード31に対応する判別係数として図1の判別係数記憶部26に記憶されているものとする。第1ビットおよび第2ビットのクラスコードビット10が付与された画素は、第3ビットのクラスコードビット1または0が付与された画素にさらに分類される。このとき、判別予測に用いられる判別係数は、反復コード32に対応する判別係数として図1の判別係数記憶部26に記憶されているものとする。
同様に、第1ビットおよび第2ビットのクラスコードビット01または00が付与された画素も、第3ビットのクラスコードビット1または0が付与された画素にさらに分類される。そして、反復コード33または反復コード34に対応する判別係数が図1の判別係数記憶部26に記憶されているものとする。
このように、3回反復して判別を行うことにより、入力画像の画素のそれぞれに3ビットからなるクラスコードが設定され、クラス番号が特定される。そして特定されたクラス番号に対応する回帰係数も特定される。
この例では、クラスコードビットを反復回数順に、上位から下位ビットに繋げた値がクラス番号に対応している。従って、最終的なクラスコードに対応するクラス番号Ckは、例えば、式(9)のようにして特定される。
また、図11に示されるように,反復回数pと最終的なクラス数Ncとの関係は、式(10)により表される。
なお、最終的なクラス数Ncは、最終的に使用する回帰係数の総数Nmと等しくなる。
判別係数の総数Ndは、式(11)により表される。
なお、後述する画像処理装置を用いた高画質化処理における判別予測において、適応的に反復回数を減らすことで、処理のロバスト化や高速化を図ることも可能である。そのようにする場合には図11の各分岐において用いられた回帰係数も必要になるので、回帰係数の総数Nmは式(12)により表されるものとなる。
ここでは、主として、判別係数の学習が3回反復して行われる例について説明したが、反復回数は、1回であってもよい。すなわち、第1回目の判別係数の学習が終了した後、判別係数学習部25による判別係数の演算、判別予測部27による判別予測が繰り返し実行されないようにしてもよい。
図12は、本発明の一実施の形態に係る画像処理装置の構成例を示すブロック図である。
同図の画像処理装置100は、図1の学習装置10に対応する画像処理装置とされる。すなわち、画像処理装置100は、学習装置10により学習された判別係数を用いて入力画像の各画素のそれぞれのクラスを判別する。そして、画像処理装置100は、判別されたクラスに対応する回帰係数であって、学習装置10により学習された回帰係数を用いて入力画像から得られるタップの回帰予測演算を行い、入力画像を高画質化する画像処理を行うようになされている。
同図の画像処理装置100は、図1の学習装置10に対応する画像処理装置とされる。すなわち、画像処理装置100は、学習装置10により学習された判別係数を用いて入力画像の各画素のそれぞれのクラスを判別する。そして、画像処理装置100は、判別されたクラスに対応する回帰係数であって、学習装置10により学習された回帰係数を用いて入力画像から得られるタップの回帰予測演算を行い、入力画像を高画質化する画像処理を行うようになされている。
すなわち、画像処理装置100の判別係数記憶部122には、学習装置10の判別係数記憶部26に記憶されていた判別係数が予め記憶される。画像処理装置100の回帰係数記憶部124には、学習装置10の回帰係数記憶部22に記憶されていた回帰係数が予め記憶される。
同図の判別予測部121は、入力画像において注目画素を設定し、注目画素に対応する判別タップ(5次元の特徴量ベクトル)を取得して式(8)を参照して予測した演算を行う。このとき、判別予測部121は、反復回数と判別予測の対象とする画素群に基づいて反復コードを特定し、判別係数記憶部122から反復コードに対応する判別係数を読み出すようになされている。
クラス分割部123は、判別予測部121の予測結果に基づいて、注目画素にクラスコードビットを付与していくことで、入力画像の画素を2つの集合に分割する。このとき、上述したように、例えば、式(8)により演算された予測値yiと0との大小比較を行って、注目画素にクラスコードビットが付与される。
クラス分割部123の処理を経て、判別予測部121は、反復して判別予測を行い、クラス分割部123によってさらなる分割がなされる。判別予測は、予め設定された回数だけ反復して行われる。例えば、判別予測が3回反復して行われる場合、例えば、図10または図11を参照して上述したように、入力画像が3ビットのクラスコードのクラス番号に対応する画素群に分類されることになる。
なお、画像処理装置100における判別予測の反復回数は、学習装置10による判別係数の学習の反復回数と同じとなるように設定される。
クラス分割部123は、入力画像の各画素を特定する情報とその画素のクラス番号とを対応付けて回帰係数記憶部124に供給するようになされている。
回帰予測部125は、入力画像において注目画素を設定し、注目画素に対応する回帰タップ(2次元の特徴量ベクトル)を取得して式(6)を参照して予測した演算を行う。このとき、回帰予測部125は、注目画素を特定する情報を回帰係数記憶部124に供給して、その注目画素のクラス番号に対応する回帰係数を、回帰係数記憶部124から読み出すようになされている。
そして、回帰予測部125の演算により得られた予測値を、注目画素に対応する画素の値とする出力画像が生成される。これにより、入力画像が高画質化された出力画像が得られることになる。
このように、本発明によれば、入力画像に対して判別予測を行うことにより、入力画像を構成する各画素(実際には、注目画素に対応するタップ)を、高画質化処理に適したクラスに分類することができる。
例えば、従来のクラス分類適応処理によって、入力画像の解像度感/鮮鋭感を向上させた画像を予測する場合、多様な入力信号に対応しようとすると画像の帯域や種類(自然画像/人工画像)、ノイズ量に応じても処理を変える必要がある。
しかしながら、そのためには膨大なパターンを考慮する必要があり,全てのケースをカバーするのは難しい。そのため、予測処理を行った結果として得られた画像の解像度感/鮮鋭感が改善していないぼけたものになってしまうことや、逆に処理が強すぎてリンギング劣化やノイズを強調してしまう場合が多い。
これに対して、本発明では、画像の帯域や種類(自然画像/人工画像)、ノイズ量に応じて処理を変える必要がない。また、予測処理を行った結果として得られた画像の解像度感/鮮鋭感が改善していないぼけたものになってしまうことや、逆に処理が強すぎてリンギング劣化やノイズを強調してしまうこともない。
また、従来のクラス分類適応処理では、回帰予測演算に用いられる回帰係数が、タップ(回帰タップ)の要素数と同じ要素数のベクトルによって構成されていた。例えば、入力画像から抽出される特徴量が2つであれば、2つの係数からなる回帰係数を用いた回帰予測演算が行われていた。
これに対して、本願発明では、1つの係数のみからなる回帰係数を用いた回帰予測演算によって画素値を予測することができ、装置の処理負荷を軽減することが可能である。本発明では、上述のように判別係数を用いた判別予測式の演算を反復して実行することにより、注目画素をクラス分類するようにしたので、その分類結果に基づいて特定された回帰係数を用いた回帰予測演算を簡素なものとすることが可能である。
さらに、本発明では、反復して判別予測を行うことにより、より適切にクラス分類することが可能となる。また、反復して行われる判別予測の処理の途中において、入力画像の画素値などに処理を施した中間データなどを生成する必要がないので、処理を高速化することが可能である。すなわち、出力画像を予測する際に,どの画素に対しても高々(p+1)回の予測式の演算で、クラス分類と回帰予測を行うことができるので高速な処理が可能である。また、クラス分類と回帰予測を行う際に、タップの演算の中間データなどを用いることなく、常に入力に対する演算のみで完結しているために、実装においてパイプライン構造を利用することが可能となる。
次に、図13のフローチャートを参照して、判別係数回帰係数学習処理の詳細について説明する。この処理は、図1の学習装置10により実行される。
ステップS101において、判別係数学習部25は、反復コードを特定する。いまの場合、第1回目の学習の処理であるから反復コードは1と特定される。
ステップS102において、回帰係数学習部21乃至ラベリング部24は、図14を参照して後述するラベリング処理を実行する。ここで、図14のフローチャートを参照して図13のステップS102のラベリング処理の詳細な例について説明する。
ステップS131において、回帰係数学習部21は、図15を参照して後述する回帰係数学習処理を実行する。これにより、生徒画像の画素値に基づいて教師画像の画素値を予測するための演算に用いられる回帰係数が求められる。
ステップS132において、回帰予測部23は、ステップS131の処理により求められた回帰係数を用いて回帰予測値を演算する。このとき、例えば、式(6)の演算が行われ、予測値yiが求められる。
ステップS133において、ラベリング部24は、ステップS132の処理により得られた予測値yiを、教師画像の画素値である真値tiと比較する。
ステップS134において、ラベリング部24は、ステップS133の比較結果に基づいて、注目画素(実際には、注目画素に対応するタップ)を判別クラスAまたは判別クラスBにラベリングする。これにより、例えば、図8を参照して上述したように、判別クラスAまたは判別クラスBのラベリングがなされる。
なお、ステップS132乃至ステップS134の処理は、反復コードに対応して定まる処理対象の画素のそれぞれを対象として行われる。
このようにしてラベリング処理が実行される。
次に、図15のフローチャートを参照して、図14のステップS131の回帰係数演算処理の詳細な例について説明する。
ステップS151において、回帰係数学習部21は、ステップS101の処理で特定された反復コードに対応するサンプルを特定する。ここでの、サンプルは、生徒画像の注目画素に対応するタップと、その注目画素に対応する教師画像の画素との組み合わせを意味する。なお、回帰予測演算は、式(6)により表わされるものなので、ここでのタップ(回帰タップ)は、高域フィルタ演算値および低域フィルタ演算値の2つの要素からなるベクトルとなる。
例えば、反復コードが1であれば、第1回目の学習の処理なので、生徒画像の全画素のそれぞれを注目画素としてサンプルが特定される。例えば、反復コードが21であれば、第2回目の学習の処理の一部なので、生徒画像の画素のうち、1回目の学習の処理でクラスコードビット1が付与された画素のそれぞれを注目画素としてサンプルが特定される。例えば、反復コードが34であれば、第3回目の学習の処理の一部なので、生徒画像の画素のうち、1回目の学習の処理でクラスコードビット0が付与され、2回目の学習の処理でクラスコードビット0が付与された画素のそれぞれを注目画素としてサンプルが特定される。
ステップS152において、回帰係数学習部21は、ステップS151の処理で特定されたサンプルの足しこみを行う。このとき、例えば、式(5)にサンプルのタップと教師画像の画素値が足しこまれていく。
ステップS153において、回帰係数学習部21は、全サンプルを足しこんだか否かを判定し、全サンプルを足しこんだと判定されるまで、ステップS152の処理が繰り返し実行される。
ステップS154において、回帰係数学習部21は、例えば、式(7)の演算を行い、最小二乗法を用いて、回帰係数w0を導出する。
このようにして、回帰係数演算処理が実行される。
以上により図13のステップS102のラベリング処理が終了し、処理は、図13のステップS103の判別係数演算処理に進む。
ステップS103において、判別係数学習部25は、図16を参照して後述する判別係数演算処理を実行する。ここで、図16のフローチャートを参照して、図13のステップS103の判別係数演算処理の詳細な例について説明する。
ステップS171において、判別係数学習部25は、ステップS101の処理で特定された反復コードに対応するサンプルを特定する。ここでの、サンプルは、生徒画像の注目画素に対応するタップと、注目画素についての判別クラスAまたは判別クラスBのラベリングの結果との組み合わせを意味する。なお、ここでのタップ(判別タップ)は、高域フィルタ演算値、低域フィルタ演算値、周辺画素値の最大値、周辺画素値の最小値、および周辺画素値の差分絶対値の最大値の5つの特徴量を要素とするベクトルとなる。
例えば、反復コードが1であれば、第1回目の学習の処理なので、生徒画像の全画素のそれぞれを注目画素としてサンプルが特定される。例えば、反復コードが21であれば、第2回目の学習の処理の一部なので、生徒画像の画素のうち、1回目の学習の処理でクラスコードビット1が付与された画素のそれぞれを注目画素としてサンプルが特定される。例えば、反復コードが34であれば、第3回目の学習の処理の一部なので、生徒画像の画素のうち、1回目の学習の処理でクラスコードビット0が付与され、2回目の学習の処理でクラスコードビット0が付与された画素のそれぞれを注目画素としてサンプルが特定される。
ステップS172において、判別係数学習部25は、ステップS171の処理で特定されたサンプルの足しこみを行う。
ステップS173において、判別係数学習部25は、全サンプルを足しこんだか否かを判定し、全サンプルを足しこんだと判定されるまで、ステップS172の処理が繰り返し実行される。
ステップS174において、判別係数学習部25は、例えば、判別分析により(最小二乗法を用いてもよい)、判別係数を導出する。
このようにして、判別係数演算処理が実行される。
図13に戻って、ステップS104において、判別予測部27は、ステップS103の処理により求められた係数と、生徒画像から得られるタップを用いて、判別予測値を演算する。このとき、例えば、式(8)の演算が行われ、予測値yi(判別予測値)が求められる。
ステップS105において、クラス分割部28は、ステップS104の処理により求められた判別予測値が0以上であるか否かを判定する。
ステップS105において、判別予測値が0以上であると判定された場合、処理は、ステップS106に進み、当該注目画素(実際にはタップ)にクラスコードビット1が設定される。一方、ステップS105において、判別予測値が0未満であると判定された場合、処理は、ステップS107に進み、当該注目画素(実際にはタップ)にクラスコードビット0が設定される。
なお、ステップS104乃至ステップS107の処理は、反復コードに対応して定まる処理対象の画素のそれぞれを対象として行われる。
ステップS106、またはステップS107の処理の後、処理は、ステップS108に進み、判別係数記憶部26は、ステップS103の処理で求められた判別係数を、ステップS101で特定された反復コードに対応付けて記憶する。
ステップS109において、学習装置10は、反復が終了したか否かを判定する。例えば、3回反復して学習することが予め設定されている場合、まだ、反復が終了していないと判定され、処理は、ステップS101に戻る。
そして、ステップS101において、あらためて反復コードが特定される。いまの場合、第2回目の学習の最初の処理であるから、反復コードは21と特定される。
そして、同様に、ステップS102乃至S108の処理が実行される。このとき、上述したように、ステップS102の処理と、ステップS103の処理では、生徒画像の画素のうち、1回目の学習の処理でクラスコードビット1が付与された画素のそれぞれを注目画素としてサンプルが特定されることになる。
そして、ステップS109で反復が終了したか否かが判定される。
このように、ステップS109において反復が終了したと判定されるまで、ステップS101乃至S108の処理が繰り返し実行される。3回反復して学習することが予め設定されている場合、ステップS101で反復コードは34であると特定された後、ステップS102乃至S108の処理が実行され、ステップS109において、反復は終了したと判定されることになる。
このように、ステップS101乃至S109の処理が繰り返し実行されたことにより、7種類の判別係数が、それぞれ反復コードに対応付けられて判別係数記憶部26に記憶されたことになる。
ステップS109において、反復は終了したと判定された場合、処理は、ステップS110に進む。
ステップS110において、回帰係数学習部21は、回帰係数演算処理を実行する。この処理は、図15のフローチャートを参照して上述した場合と同様なので、詳細な説明は省略するが、いまの場合、ステップS151では、反復コードに対応するサンプルが特定されるのではなく、各クラス番号に対応するサンプルがそれぞれ特定される。
すなわち、ステップS101乃至S109の処理が繰り返し実行されたことにより、図8を参照して上述したように、生徒画像の各画素は、クラス番号C0乃至C7のいずれかのクラスに分類されたことになる。従って、生徒画像のクラス番号C0の画素を、注目画素としてサンプルが特定されて、第1の回帰係数が導出される。また、生徒画像のクラス番号C1の画素を、注目画素としてサンプルが特定されて、第2の回帰係数が導出され、生徒画像のクラス番号C2の画素を、注目画素としてサンプルが特定されて、第3の回帰係数が導出され、・・・生徒画像のクラス番号C7の画素を、注目画素としてサンプルが特定されて、第8の回帰係数が導出される。
つまり、ステップS110の回帰係数演算処理においては、クラス番号C0乃至C7のそれぞれに対応する8種類の回帰係数が求められることになる。
ステップS111において、回帰係数記憶部22は、ステップS110の処理により求められた8種類の回帰係数のそれぞれを、クラス番号に対応付けて記憶する。
このようにして、判別回帰係数学習処理が実行される。
なお、ここでは、主として、判別係数の学習が3回反復して行われる例について説明したが、反復回数は、1回であってもよい。すなわち、第1回目の判別係数の学習が終了した後、判別係数学習部25による判別係数の演算、判別予測部27による判別予測が繰り返し実行されないようにしてもよい。
次に、図17のフローチャートを参照して、判別回帰予測処理の例について説明する。この処理は、図12の画像処理装置100により実行される。また、処理の実行に先立って、画像処理装置100の判別係数記憶部122と回帰係数記憶部124には、それぞれ、図13の判別回帰係数学習処理によって、判別係数記憶部26に記憶された7種類の判別係数と、回帰係数記憶部22に記憶された8種類の回帰係数とが記憶されているものとする。
ステップS191において、判別予測部121は、反復コードを特定する。いまの場合、第1回目の判別の処理であるから反復コードは1と特定される。
ステップS192において、判別予測部121は、図18を参照して後述する判別処理を実行する。ここで、図18のフローチャートを参照して、図17のステップS192の判別処理の詳細な例について説明する。
ステップS211において、判別予測部121は、反復コードに対応する注目画素を設定する。例えば、反復コードが1であれば、第1回目の判別の処理なので、入力画像の全画素のそれぞれが注目画素として設定される。例えば、反復コードが21であれば、第2回目の判別の処理の一部なので、入力画像の画素のうち、1回目の判別の処理でクラスコードビット1が付与された画素のそれぞれが注目画素として設定される。例えば、反復コードが34であれば、第3回目の判別の処理の一部なので、入力画像の画素のうち、1回目の判別の処理でクラスコードビット0が付与され、2回目の判別の処理でクラスコードビット0が付与された画素のそれぞれが注目画素として設定される。
ステップS212において、判別予測部121は、ステップS211で設定された注目画素に対応する判別タップを取得する。
ステップS213において、判別予測部121は、ステップS211の処理で特定された反復コードに対応する判別係数を特定し、判別係数記憶部122から読み出す。
ステップS214において、判別予測部121は、判別予測値を演算する。このとき、例えば、上述した式(8)の演算が行われることになる。
ステップS215において、クラス分割部123は、ステップS214の処理で演算された判別予測値に基づいて、注目画素にクラスコードビットを設定(付与)する。このとき、上述したように、例えば、式(8)により演算された予測値yiと0との大小比較を行って、注目画素にクラスコードビットが付与される。
なお、ステップS211乃至ステップS215の処理は、反復コードに対応して定まる処理対象の画素のそれぞれを対象として行われる。
このようにして、判別処理が実行される。
図17に戻って、ステップS192の処理の後、ステップS193において、判別予測部121は、反復が終了したか否かを判定する。例えば、3回反復して学習することが予め設定されている場合、まだ、反復が終了していないと判定され、処理は、ステップS191に戻る。
この後、ステップS191では反復コードが21と特定され、同様に、ステップS192の処理が実行される。このとき、上述したように、ステップS192の処理では、入力画像の画素のうち、1回目の判別の処理でクラスコードビット1が付与された画素のそれぞれが注目画素として設定されることになる。
そして、ステップS193で反復が終了したか否かが判定される。
このように、ステップS193において反復が終了したと判定されるまで、ステップS191乃至S193の処理が繰り返し実行される。3回反復して学習することが予め設定されている場合、ステップS191で反復コードは34であると特定された後、ステップS192の処理が実行され、ステップS193において、反復は終了したと判定されることになる。
ステップS193においては、反復が終了したと判定された場合、処理は、ステップS194に進む。なお、ここまでの処理により、図10または図11を参照して上述したように、入力画像が3ビットのクラスコードのクラス番号に対応する画素群に分類されていることになる。また、上述したように、クラス分割部123は、入力画像の各画素を特定する情報とその画素のクラス番号とを対応付けて回帰係数記憶部124に供給するようになされている。
ステップS194において、回帰予測部125は、入力画像において注目画素を設定する。
ステップS195において、回帰予測部125は、ステップS194で設定された注目画素に対応する回帰タップを取得する。
ステップS196において、回帰予測部125は、ステップS194で設定された注目画素を特定する情報を回帰係数記憶部124に供給して、その注目画素のクラス番号に対応する回帰係数を特定し、回帰係数記憶部124から読み出す。
ステップS197において、回帰予測部125は、ステップS195で取得した回帰タップと、ステップS196で特定して読み出した回帰係数を用いて式(6)の演算を行い、回帰予測値を演算する。
なお、ステップS191乃至ステップS197の処理は、入力画像の各画素のそれぞれを対象として行われる。
そして、回帰予測部125の演算により得られた予測値を、注目画素に対応する画素の値とする出力画像が生成される。これにより、入力画像が高画質化された出力画像が得られることになる。
このようにして判別予測処理が実行される。このようにすることで、画像の高画質化処理を、より効率的で高速に行うことができる
図12を参照して上述した画像処理装置は、例えば、高画質化回路としてテレビジョン受像機に搭載することも可能である。図19は、図12を参照して上述した画像処理装置を搭載したテレビジョン受像機511の構成例を示すブロック図である。
同図のテレビジョン受像機511は、被制御部531および制御部532から構成される。被制御部531は、制御部532の制御の下、テレビジョン受像機511の種々の機能を実現する。
被制御部531は、デジタルチューナ553、デマルチプレクサ(Demux)554、MPEG(Moving Picture Expert Group)デコーダ555、映像・グラフィック処理回路556、パネル駆動回路557、表示パネル558、音声処理回路559、音声増幅回路560、スピーカ561、および受信部562を備えている。また、制御部532は、CPU(Central Processing Unit)563、フラッシュROM564、DRAM(Dynamic Random Access Memory)565、および内部バス566を備えている。
デジタルチューナ553は、図示せぬアンテナ端子から入力されたテレビジョン放送信号を処理して、ユーザの選択したチャンネルに対応した所定のTS(Transport Stream)を、デマルチプレクサ554に供給する。
デマルチプレクサ554は、デジタルチューナ553から供給されたTSから、ユーザの選択したチャンネルに対応した、パーシャルTS(映像信号のTSパケット、音声信号のTSパケット)を抽出し、MPEGデコーダ555に供給する。
また、デマルチプレクサ554は、デジタルチューナ553から供給されたTSから、PSI/SI(Program Specific Information/Service Information)を取り出し、CPU563に供給する。デジタルチューナ553から供給されたTSには、複数のチャンネルが多重化されている。デマルチプレクサ554がTSから任意のチャンネルのパーシャルTSを抽出する処理は、PSI/SI(PAT/PMT)から任意のチャンネルのパケットID(PID)の情報を得ることで可能となる。
MPEGデコーダ555は、デマルチプレクサ554から供給される映像信号のTSパケットにより構成される映像PES(Packetized Elementary Stream)パケットに対してデコード処理を行い、その結果得られる映像信号を、映像・グラフィック処理回路556に供給する。また、MPEGデコーダ555は、デマルチプレクサ554から供給される音声信号のTSパケットにより構成される音声PESパケットに対してデコード処理を行い、その結果得られる音声信号を、音声処理回路559に供給する。
映像・グラフィック処理回路556は、MPEGデコーダ555から供給された映像信号に対して、必要に応じて、スケーリング処理、グラフィックスデータの重畳処理等を行い、パネル駆動回路557に供給する。
映像・グラフィック処理回路556には、高画質化回路570が接続されており、パネル駆動回路557に映像信号を供給するのに先立って、高画質化処理が実行される。
高画質化回路570は、図12を参照して上述した画像処理装置と同様の構成とされ、MPEGデコーダ555から供給された映像信号から得られた画像データに対して、図17を参照して上述した判別回帰予測処理を高画質化処理として実行するようになされている。
パネル駆動回路557は、映像・グラフィック処理回路556から供給された映像信号に基づいて、表示パネル558を駆動し、映像を表示させる。表示パネル558は、例えば、LCD(Liquid Crystal Display)またはPDP(Plasma Display Panel)等で構成されている。
音声処理回路559は、MPEGデコーダ555から供給された音声信号に対してD/A(Digital to Analog)変換等の必要な処理を行い、音声増幅回路560に供給する。
音声増幅回路560は、音声処理回路559から供給されるアナログ音声信号を増幅し、スピーカ561に供給する。スピーカ561は、音声増幅回路560からのアナログ音声信号に応じた音声を出力する。
受信部562は、リモートコントローラ567から送信された、例えば赤外線のリモートコントロール信号を受信し、CPU563に供給する。ユーザは、リモートコントローラ567を操作することで、テレビジョン受像機511の操作を行うことができる。
CPU563、フラッシュROM564、およびDRAM565は、内部バス566を介して接続されている。CPU563は、テレビジョン受像機11の各部の動作を制御する。フラッシュROM564は、制御ソフトウェアの格納およびデータの保管を行う。DRAM565は、CPU563のワークエリア等を構成する。すなわち、CPU563は、フラッシュROM564から読み出したソフトウェアやデータをDRAM565上に展開してソフトウェアを起動し、テレビジョン受像機511の各部を制御する。
このように本発明をテレビジョン受像機に適用することができる。
なお、上述した一連の処理は、ハードウェアにより実行させることもできるし、ソフトウェアにより実行させることもできる。上述した一連の処理をソフトウェアにより実行させる場合には、そのソフトウェアを構成するプログラムが、専用のハードウェアに組み込まれているコンピュータにネットワークや記録媒体からインストールされる。また、各種のプログラムをインストールすることで、各種の機能を実行することが可能な、例えば図20に示されるような汎用のパーソナルコンピュータ700などに、ネットワークや記録媒体からインストールされる。
図20において、CPU(Central Processing Unit)701は、ROM(Read Only Memory)702に記憶されているプログラム、または記憶部708からRAM(Random Access Memory)703にロードされたプログラムに従って各種の処理を実行する。RAM703にはまた、CPU701が各種の処理を実行する上において必要なデータなども適宜記憶される。
CPU701、ROM702、およびRAM703は、バス704を介して相互に接続されている。このバス704にはまた、入出力インタフェース705も接続されている。
入出力インタフェース705には、キーボード、マウスなどよりなる入力部706、LCD(Liquid Crystal display)などよりなるディスプレイ、並びにスピーカなどよりなる出力部707が接続されている。また、入出力インタフェース705には、ハードディスクなどより構成される記憶部708、モデム、LANカードなどのネットワークインタフェースカードなどより構成される通信部709が接続されている。通信部709は、インターネットを含むネットワークを介しての通信処理を行う。
入出力インタフェース705にはまた、必要に応じてドライブ710が接続され、磁気ディスク、光ディスク、光磁気ディスク、或いは半導体メモリなどのリムーバブルメディア711が適宜装着されている。そして、それらのリムーバブルメディアから読み出されたコンピュータプログラムが、必要に応じて記憶部708にインストールされる。
上述した一連の処理をソフトウェアにより実行させる場合には、そのソフトウェアを構成するプログラムが、インターネットなどのネットワークや、リムーバブルメディア711などからなる記録媒体からインストールされる。
なお、この記録媒体は、図20に示される、装置本体とは別に、ユーザにプログラムを配信するために配布される、プログラムが記録されている磁気ディスク(フロッピディスク(登録商標)を含む)、光ディスク(CD-ROM(Compact Disk-Read Only Memory),DVD(Digital Versatile Disk)を含む)、光磁気ディスク(MD(Mini-Disk)(登録商標)を含む)、もしくは半導体メモリなどよりなるリムーバブルメディア711により構成されるものだけでなく、装置本体に予め組み込まれた状態でユーザに配信される、プログラムが記録されているROM702や、記憶部708に含まれるハードディスクなどで構成されるものも含む。
なお、本明細書において上述した一連の処理は、記載された順序に沿って時系列的に行われる処理はもちろん、必ずしも時系列的に処理されなくとも、並列的あるいは個別に実行される処理をも含むものである。
また、本発明の実施の形態は、上述した実施の形態に限定されるものではなく、本発明の要旨を逸脱しない範囲において種々の変更が可能である。
10 学習装置, 21 回帰係数学習部, 22 回帰係数記憶部, 23 回帰予測部, 24 ラベリング部, 25 判別係数学習部, 26 判別係数記憶部, 27 判別予測部, 28 クラス分割部, 100 画像処理装置, 121 判別予測部, 122 判別係数記憶部, 123 クラス分割部, 124 回帰係数記憶部, 125 回帰予測部, 511 テレビジョン受像機, 570 高画質化回路, 701 CPU, 702 ROM, 711 リムーバブルメディア
Claims (17)
- 第1の信号の画像から、注目画素および周辺画素の画素値の変化量の周波数帯域を抽出するための複数のフィルタ演算値として構成される回帰タップを取得して、前記回帰タップと回帰係数との演算により第2の信号の画像における前記注目画素に対応する画素の値を求める回帰予測演算の前記回帰係数を算出する回帰係数算出手段と、
前記算出された前記回帰係数と、前記第1の信号の画像から得られた回帰タップに基づいて前記回帰予測演算を行って回帰予測値を算出する回帰予測値算出手段と、
前記算出された前記回帰予測値と、第2の信号の画像における前記注目画素に対応する画素の値との比較結果に基づいて、前記注目画素に第1の判別クラスに属する画素であるかまたは第2の判別クラスに属する画素であるかを判別するための判別情報を付与する判別情報付与手段と、
前記付与された判別情報に基づいて、第1の信号の画像から注目画素および周辺画素の画素値の変化量の周波数帯域を抽出するための複数のフィルタ演算値並びに前記周辺画素の画素値に基づく複数の特徴量を要素として構成される判別タップを取得して、前記判別タップの要素のそれぞれと判別係数との積和演算により前記注目画素が属する判別クラスを特定するための判別予測値を求める判別予測演算の前記判別係数を算出する判別係数算出手段と、
前記算出された前記判別係数と、前記第1の信号の画像から得られた判別タップに基づいて前記判別予測演算を行って判別予測値を算出する判別予測値算出手段と、
前記算出された前記判別予測値に基づいて、前記第1の信号の画像の画素のそれぞれを、前記第1の判別クラスと前記第2の判別クラスのいずれかに分類する分類手段とを備え、
前記回帰係数算出手段は、前記第1の判別クラスに分類された画素のみを用いて前記回帰係数をさらに算出し、前記第2の判別クラスに分類された画素のみを用いて前記回帰係数をさらに算出する
係数学習装置。 - 前記回帰係数算出手段が前記判別クラス毎に算出した前記回帰係数により前記回帰予測値算出手段が前記判別クラス毎に算出した前記回帰予測値に基づいて、前記判別情報付与手段が判別情報を付与する処理、前記判別係数算出手段が前記判別係数を算出する処理、および前記判別予測値算出手段が前記判別予測値を算出する処理を繰り返し実行する
請求項1に記載の係数学習装置。 - 前記回帰予測値と、第2の信号の画像における前記注目画素に対応する画素の値と差分が0以上である場合、前記注目画素は、第1の判別クラスに属する画素であると判別され、
前記回帰予測値と、第2の信号の画像における前記注目画素に対応する画素の値と差分が0未満である場合、前記注目画素は、第1の判別クラスに属する画素であると判別される
請求項1に記載の係数学習装置。 - 前記回帰予測値と、第2の信号の画像における前記注目画素に対応する画素の値と差分絶対値が予め設定された閾値以上である場合、前記注目画素は、第1の判別クラスに属する画素であると判別され、
前記回帰予測値と、第2の信号の画像における前記注目画素に対応する画素の値と差分絶対値が前記閾値未満である場合、前記注目画素は、第2の判別クラスに属する画素であると判別される
請求項1に記載の係数学習装置。 - 前記第1の信号の画像は、前記第2の信号の画像に対して画素値の変化量の周波数帯域が制限され、所定のノイズが付加された画像である
請求項1に記載の係数学習装置。 - 前記第2の信号の画像は、自然画像または人工画像である
請求項5に記載の係数学習装置。 - 前記判別タップに含まれる前記周辺画素の画素値に基づく複数の特徴量は、周辺画素値の最大値、周辺画素値の最小値、および周辺画素値の差分絶対値の最大値である
請求項1に記載の係数学習装置。 - 回帰係数算出手段が、第1の信号の画像から、注目画素および周辺画素の画素値の変化量の周波数帯域を抽出するための複数のフィルタ演算値として構成される回帰タップを取得して、前記回帰タップと回帰係数との演算により第2の信号の画像における前記注目画素に対応する画素の値を求める回帰予測演算の前記回帰係数を算出し、
回帰予測値算出手段が、前記算出された前記回帰係数と、前記第1の信号の画像から得られた回帰タップに基づいて前記回帰予測演算を行って回帰予測値を算出し、
判別情報付与手段が、前記算出された前記回帰予測値と、第2の信号の画像における前記注目画素に対応する画素の値との比較結果に基づいて、前記注目画素に第1の判別クラスに属する画素であるかまたは第2の判別クラスに属する画素であるかを判別するための判別情報を付与し、
判別係数算出手段が、前記付与された判別情報に基づいて、第1の信号の画像から注目画素および周辺画素の画素値の変化量の周波数帯域を抽出するための複数のフィルタ演算値並びに前記周辺画素の画素値に基づく複数の特徴量を要素として構成される判別タップを取得して、前記判別タップの要素のそれぞれと判別係数との積和演算により前記注目画素が属する判別クラスを特定するための判別予測値を求める判別予測演算の前記判別係数を算出し、
判別予測値算出手段が、前記算出された前記判別係数と、前記第1の信号の画像から得られた判別タップに基づいて前記判別予測演算を行って判別予測値を算出し、
分類手段が、前記算出された前記判別予測値に基づいて、前記第1の信号の画像の画素のそれぞれを、前記第1の判別クラスと前記第2の判別クラスのいずれかに分類し、
前記第1の判別クラスに分類された画素のみを用いて前記回帰係数がさらに算出され、前記第2の判別クラスに分類された画素のみを用いて前記回帰係数がさらに算出されるステップ
を含む係数学習方法。 - コンピュータを、
第1の信号の画像から、注目画素および周辺画素の画素値の変化量の周波数帯域を抽出するための複数のフィルタ演算値として構成される回帰タップを取得して、前記回帰タップと回帰係数との演算により第2の信号の画像における前記注目画素に対応する画素の値を求める回帰予測演算の前記回帰係数を算出する回帰係数算出手段と、
前記算出された前記回帰係数と、前記第1の信号の画像から得られた回帰タップに基づいて前記回帰予測演算を行って回帰予測値を算出する回帰予測値算出手段と、
前記算出された前記回帰予測値と、第2の信号の画像における前記注目画素に対応する画素の値との比較結果に基づいて、前記注目画素に第1の判別クラスに属する画素であるかまたは第2の判別クラスに属する画素であるかを判別するための判別情報を付与する判別情報付与手段と、
前記付与された判別情報に基づいて、第1の信号の画像から注目画素および周辺画素の画素値の変化量の周波数帯域を抽出するための複数のフィルタ演算値並びに前記周辺画素の画素値に基づく複数の特徴量を要素として構成される判別タップを取得して、前記判別タップの要素のそれぞれと判別係数との積和演算により前記注目画素が属する判別クラスを特定するための判別予測値を求める判別予測演算の前記判別係数を算出する判別係数算出手段と、
前記算出された前記判別係数と、前記第1の信号の画像から得られた判別タップに基づいて前記判別予測演算を行って判別予測値を算出する判別予測値算出手段と、
前記算出された前記判別予測値に基づいて、前記第1の信号の画像の画素のそれぞれを、前記第1の判別クラスと前記第2の判別クラスのいずれかに分類する分類手段とを備え、
前記回帰係数算出手段は、前記第1の判別クラスに分類された画素のみを用いて前記回帰係数をさらに算出し、前記第2の判別クラスに分類された画素のみを用いて前記回帰係数をさらに算出する係数学習装置として機能させる
プログラム。 - 第1の信号の画像から注目画素および周辺画素の画素値の変化量の周波数帯域を抽出するための複数のフィルタ演算値並びに前記周辺画素の画素値に基づく複数の特徴量を要素として構成される判別タップを取得して、前記判別タップの要素のそれぞれと判別係数との積和演算により前記注目画素が属する判別クラスを特定するための判別予測値を求める判別予測演算を行う判別予測手段と、
前記判別予測値に基づいて、前記第1の信号の画像の画素のそれぞれを、前記第1の判別クラスと前記第2の判別クラスのいずれかに分類する分類手段と、
前記第1の信号の画像から、注目画素および周辺画素の画素値の変化量の周波数帯域を抽出するための複数のフィルタ演算値として構成される回帰タップを取得して、前記回帰タップと回帰係数との演算により回帰予測値を演算することで、第2の信号の画像における前記注目画素に対応する画素の画素値を予測する回帰予測手段とを備える
画像処理装置。 - 前記判別予測手段が前記判別予測演算を行う処理、および前記分類手段が前記第1の信号の画像の画素のそれぞれを、分類する処理を繰り返し実行する
請求項10に記載の画像処理装置。 - 前記第1の信号の画像は、前記第2の信号の画像に対して画素値の変化量の周波数帯域が制限され、所定のノイズが付加された画像である
請求項10に記載の画像処理装置。 - 前記第2の信号の画像は、自然画像または人工画像である
請求項12に記載の画像処理装置。 - 前記判別タップに含まれる前記周辺画素の画素値に基づく複数の特徴量は、周辺画素値の最大値、周辺画素値の最小値、および周辺画素値の差分絶対値の最大値である
請求項10に記載の画像処理装置。 - 判別予測手段が、第1の信号の画像から注目画素および周辺画素の画素値の変化量の周波数帯域を抽出するための複数のフィルタ演算値並びに前記周辺画素の画素値に基づく複数の特徴量を要素として構成される判別タップを取得して、前記判別タップの要素のそれぞれと判別係数との積和演算により前記注目画素が属する判別クラスを特定するための判別予測値を求める判別予測演算を行い、
分類手段が、前記判別予測値に基づいて、前記第1の信号の画像の画素のそれぞれを、前記第1の判別クラスと前記第2の判別クラスのいずれかに分類し、
回帰予測手段が、前記第1の信号の画像から、注目画素および周辺画素の画素値の変化量の周波数帯域を抽出するための複数のフィルタ演算値として構成される回帰タップを取得して、前記回帰タップと回帰係数との演算により回帰予測値を演算することで、第2の信号の画像における前記注目画素に対応する画素の画素値を予測するステップ
を含む画像処理方法。 - コンピュータを、
第1の信号の画像から注目画素および周辺画素の画素値の変化量の周波数帯域を抽出するための複数のフィルタ演算値並びに前記周辺画素の画素値に基づく複数の特徴量を要素として構成される判別タップを取得して、前記判別タップの要素のそれぞれと判別係数との積和演算により前記注目画素が属する判別クラスを特定するための判別予測値を求める判別予測演算を行う判別予測手段と、
前記判別予測値に基づいて、前記第1の信号の画像の画素のそれぞれを、前記第1の判別クラスと前記第2の判別クラスのいずれかに分類する分類手段と、
前記第1の信号の画像から、注目画素および周辺画素の画素値の変化量の周波数帯域を抽出するための複数のフィルタ演算値として構成される回帰タップを取得して、前記回帰タップと回帰係数との演算により回帰予測値を演算することで、第2の信号の画像における前記注目画素に対応する画素の画素値を予測する回帰予測手段とを備える画像処理装置として機能させる
プログラム。 - 請求項9または請求項16に記載のプログラムが記録されている記録媒体。
Priority Applications (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2010081325A JP2011217010A (ja) | 2010-03-31 | 2010-03-31 | 係数学習装置および方法、画像処理装置および方法、プログラム、並びに記録媒体 |
US13/069,489 US20110243462A1 (en) | 2010-03-31 | 2011-03-23 | Coefficient learning apparatus and method, image processing apparatus and method, program, and recording medium |
CN201110075616.1A CN102209224A (zh) | 2010-03-31 | 2011-03-24 | 系数学习设备和方法以及图像处理设备和方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2010081325A JP2011217010A (ja) | 2010-03-31 | 2010-03-31 | 係数学習装置および方法、画像処理装置および方法、プログラム、並びに記録媒体 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2011217010A true JP2011217010A (ja) | 2011-10-27 |
Family
ID=44697861
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2010081325A Withdrawn JP2011217010A (ja) | 2010-03-31 | 2010-03-31 | 係数学習装置および方法、画像処理装置および方法、プログラム、並びに記録媒体 |
Country Status (3)
Country | Link |
---|---|
US (1) | US20110243462A1 (ja) |
JP (1) | JP2011217010A (ja) |
CN (1) | CN102209224A (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2024043116A1 (ja) * | 2022-08-24 | 2024-02-29 | ソニーセミコンダクタソリューションズ株式会社 | 学習装置、推論装置、学習方法、推論方法、符号化装置および復号化装置 |
JP7452149B2 (ja) | 2020-03-20 | 2024-03-19 | 株式会社アイシン | ブロックノイズ検出の為の学習装置及びコンピュータプログラム |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2013021636A (ja) * | 2011-07-14 | 2013-01-31 | Sony Corp | 画像処理装置および方法、学習装置および方法、プログラム、並びに記録媒体 |
-
2010
- 2010-03-31 JP JP2010081325A patent/JP2011217010A/ja not_active Withdrawn
-
2011
- 2011-03-23 US US13/069,489 patent/US20110243462A1/en not_active Abandoned
- 2011-03-24 CN CN201110075616.1A patent/CN102209224A/zh active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP7452149B2 (ja) | 2020-03-20 | 2024-03-19 | 株式会社アイシン | ブロックノイズ検出の為の学習装置及びコンピュータプログラム |
WO2024043116A1 (ja) * | 2022-08-24 | 2024-02-29 | ソニーセミコンダクタソリューションズ株式会社 | 学習装置、推論装置、学習方法、推論方法、符号化装置および復号化装置 |
Also Published As
Publication number | Publication date |
---|---|
US20110243462A1 (en) | 2011-10-06 |
CN102209224A (zh) | 2011-10-05 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US8346003B2 (en) | Image processing for reducing blur | |
JP2013003892A (ja) | 画像処理装置および方法、プログラム、並びに記録媒体 | |
JP2010102696A (ja) | 画像処理装置および係数学習装置。 | |
CN101465943A (zh) | 图像处理设备、图像处理方法、程序和学习设备 | |
JP5347862B2 (ja) | 係数学習装置および方法、画像処理装置および方法、プログラム、並びに記録媒体 | |
JP2008015824A (ja) | フィルタ列生成装置、フィルタ列生成方法、コンピュータをフィルタ列生成装置として機能させるためのプログラム、および記録媒体 | |
JP2011217010A (ja) | 係数学習装置および方法、画像処理装置および方法、プログラム、並びに記録媒体 | |
US7925019B2 (en) | Method and apparatus for converting data, method and apparatus for inverse converting data, and recording medium | |
US20050111749A1 (en) | Data converting apparatus, data converting method, learning apparatus, leaning method, program, and recording medium | |
JP2011211437A (ja) | 画像処理装置および方法、並びにプログラム | |
JP2001084368A (ja) | データ処理装置およびデータ処理方法、並びに媒体 | |
JP2010118940A (ja) | 画像処理装置、画像処理方法、及びプログラム | |
JP2011217011A (ja) | 係数学習装置および方法、画像処理装置および方法、プログラム、並びに記録媒体 | |
JP2007251690A (ja) | 画像処理装置および方法、学習装置および方法、並びにプログラム | |
JP4770711B2 (ja) | 画像処理装置、画像処理方法、およびプログラム | |
JP2021179891A (ja) | 画像処理装置 | |
JP4770704B2 (ja) | 画像処理装置、画像処理方法、およびプログラム | |
JP2000348019A (ja) | データ処理装置およびデータ処理方法、並びに媒体 | |
JP5029869B2 (ja) | 画像処理装置および画像処理方法、学習装置および学習方法、並びにプログラム | |
CN114731455B (en) | Apparatus and method using AI metadata related to image quality | |
JP5050944B2 (ja) | 画像処理装置、画像処理方法、学習装置、学習方法、及びプログラム | |
JP2009284207A (ja) | 画像処理装置および方法、プログラム、並びに学習装置および方法 | |
TWI406188B (zh) | 影像處理方法與影像處理裝置 | |
JP4349299B2 (ja) | データ変換装置および方法、データ逆変換装置および方法、符号化装置および方法、復号装置および方法、情報処理システム、記録媒体、並びにプログラム | |
JP2011217140A (ja) | 係数学習装置および方法、画像処理装置および方法、プログラム、並びに記録媒体 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A300 | Application deemed to be withdrawn because no request for examination was validly filed |
Free format text: JAPANESE INTERMEDIATE CODE: A300 Effective date: 20130604 |