JP2011217140A - 係数学習装置および方法、画像処理装置および方法、プログラム、並びに記録媒体 - Google Patents

係数学習装置および方法、画像処理装置および方法、プログラム、並びに記録媒体 Download PDF

Info

Publication number
JP2011217140A
JP2011217140A JP2010083601A JP2010083601A JP2011217140A JP 2011217140 A JP2011217140 A JP 2011217140A JP 2010083601 A JP2010083601 A JP 2010083601A JP 2010083601 A JP2010083601 A JP 2010083601A JP 2011217140 A JP2011217140 A JP 2011217140A
Authority
JP
Japan
Prior art keywords
pixel
image
correlation direction
class
reliability
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP2010083601A
Other languages
English (en)
Inventor
Yasuhiro Matsuda
康宏 松田
Masashi Uchida
真史 内田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Corp
Original Assignee
Sony Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Corp filed Critical Sony Corp
Priority to JP2010083601A priority Critical patent/JP2011217140A/ja
Publication of JP2011217140A publication Critical patent/JP2011217140A/ja
Withdrawn legal-status Critical Current

Links

Images

Landscapes

  • Television Systems (AREA)

Abstract

【課題】簡単な構成で確実にジャギー低減効果を向上させる高画質化処理を実現することができるようにする。
【解決手段】クラスタップ抽出部201は、入力画像の中で注目画素に対応するクラスタップを抽出する。波形クラス決定部202は、波形クラスを決定し、動きクラス決定部203は、動きクラスを決定する。斜め検出部204は、注目画素についての相関方向を検出し、信頼度クラス決定部205は、検出結果の信頼度を表す信頼度クラスを決定する。予測タップ抽出部206は、固定タップと可変タップによって構成され、斜め検出部204の検出結果に基づいて、可変タップが選択される予測タップを抽出する。クラス分類部207は、最終クラスを決定し、係数算出部208は、最終クラスに対応する予測係数を、係数テーブル209から読み出す。積和演算部210は、予測タップと予測係数を用いた積和演算を行う。
【選択図】図8

Description

本発明は、係数学習装置および方法、画像処理装置および方法、プログラム、並びに記録媒体に関し、特に、簡単な構成で確実にジャギー低減効果を向上させる高画質化処理を実現することができるようにする係数学習装置および方法、画像処理装置および方法、プログラム、並びに記録媒体に関する。
近年、例えば、画像のインターレース・プログレッシブ変換(IP変換)、スケーリングなどの解像度変換が簡単に行えるようになった。画像の解像度を変換する際に、画素の補間を行う必要があるが、例えば、斜め方向のエッジが存在すると、ジャギーと称される悪影響(画像の中のオブジェクトの輪郭が階段状のギザギザになってしまう現象)が発生することがある。
IP変換、スケーリングにおけるジャギー低減技術としては異方性補間が知られており、最も相関の高い斜め方向を検出し、その方向をもとに画素を補間する。これにより斜め線特性が改善する。
また統計処理によるIP変換、スケーリングでは、クラス分類を用いた技術が知られており、低解像度と高解像度との画像間の対応関係を学習し、作成した変換テーブルを入力画像に適用することで、統計的に最適な変換が可能になる(例えば、特許文献1参照)。
特許文献1の技術により、SD信号をHD信号に変換する場合、まず、入力SD信号からなるクラスタップの特徴を、ADRC(適応的ダイナミックレンジ符号化)等を用いて求め、得られたクラスタップの特徴に基づいてクラス分類を行う。そして、そのクラス毎に用意された予測係数と、入力SD信号からなる予測タップとの演算を行うことによって、HD信号を得る。
クラス分類は、予測値を求めようとする高S/N画素の位置に対応する低S/N画像の位置から空間的または時間的に近い位置にある低S/N画素の画素値のパターンによって、各高S/N画素を、いわばグループ分けするものであり、適応処理は、各グループ(上述のクラスに相当する)ごとに、そのグループに属する高S/N画素に対して、より適した予測係数を求めて、その予測係数により、画質の向上を図るものであるから、クラス分類は、基本的には、予測値を求めようとする高S/N画素に関係する、より多くの画素からクラスタップを構成して行うのが望ましい。
特開平7−79418号公報
しかしながら、異方性補間は、相関の高い方向の検出を行い、その情報を用い補間するため、斜め線特性は改善するが、エラー回避のための処理が複雑になる。
また、あらゆる信号において正解を求めることは困難であり、例えば、相関方向の検出エラーが直接画質破綻につながる。
クラス分類による統計処理は、最適な変換が可能になるが、従来のタップ範囲・クラス数では、斜め方向の特徴を捉えきれずジャギー低減効果が低いという問題があった。
本発明はこのような状況に鑑みてなされたものであり、簡単な構成で確実にジャギー低減効果を向上させる高画質化処理を実現することができるようにするものである。
本発明の第1の側面は、第1の画像において注目画素の周辺画素の相関値に基づいて前記注目画素の相関方向を検出する相関方向検出手段と、前記注目画素の周辺の複数の画素のそれぞれについて検出された前記相関方向に基づいて、前記注目画素の相関方向の信頼度を算出する信頼度算出手段と、前記検出された相関方向に基づいて、前記注目画素を中心とする所定の数の画素の値からなる予測タップを、前記第1の画像から抽出する予測タップ抽出手段と、第2の画像における前記注目画素に対応する画素の値と前記予測タップに基づいて、前記予測タップから前記第2の画像の画素値を演算する線形一次式に用いられる予測係数の値を、前記注目画素について検出された相関方向の信頼度に対応づけて算出する予測係数算出手段とを備える係数学習装置である。
前記予測タップは、前記注目画素に対する位置が予め定められた複数または単数の画素の値からなる固定タップと、前記注目画素に対する位置が前記注目画素について検出された相関方向に対応して定まる複数または単数の画素の値からなる可変タップとにより構成されるようにすることができる。
前記第1の画像から、前記注目画素を中心とする所定の数の画素の値からなるクラスタップを抽出するクラスタップ抽出手段と、前記クラスタップを解析して、複数の特徴クラスのいずれかに分類する特徴クラス分類手段と、前記注目画素について検出された相関方向の信頼度を閾値と比較することで複数の信頼度クラスのいずれかに分類する信頼度クラス分類手段と、前記分類された特徴クラスと信頼度クラスに基づいて、最終クラスを決定する最終クラス決定手段をさらに備え、前記予測係数算出手段は、前記最終クラスに対応づけて前記予測係数を算出するようにすることができる。
前記注目画素について検出された相関方向の信頼度は、前記注目画素の周辺の複数の画素のそれぞれについて検出された前記相関方向のばらつきの度合に基づいて算出されるようにすることができる。
本発明の第1の側面は、相関方向検出手段が、第1の画像において注目画素の周辺画素の相関値に基づいて前記注目画素の相関方向を検出し、信頼度算出手段が、前記注目画素の周辺の複数の画素のそれぞれについて検出された前記相関方向に基づいて、前記注目画素の相関方向の信頼度を算出し、予測タップ抽出手段が、前記検出された相関方向に基づいて、前記注目画素を中心とする所定の数の画素の値からなる予測タップを、前記第1の画像から抽出し、予測係数算出手段が、第2の画像における前記注目画素に対応する画素の値と、前記予測タップに基づいて、前記予測タップから前記第2の画像の画素値を演算する線形一次式に用いられる予測係数の値を、前記注目画素について検出された相関方向の信頼度に対応づけて算出するステップを含む係数学習方法である。
本発明の第1の側面は、コンピュータを、第1の画像において注目画素の周辺画素の相関値に基づいて前記注目画素の相関方向を検出する相関方向検出手段と、前記注目画素の周辺の複数の画素のそれぞれについて検出された前記相関方向に基づいて、前記注目画素の相関方向の信頼度を算出する信頼度算出手段と、前記検出された相関方向に基づいて、前記注目画素を中心とする所定の数の画素の値からなる予測タップを、前記第1の画像から抽出する予測タップ抽出手段と、第2の画像における前記注目画素に対応する画素の値と、前記予測タップに基づいて、前記予測タップから前記第2の画像の画素値を演算する線形一次式に用いられる予測係数の値を、前記注目画素について検出された相関方向の信頼度に対応づけて算出する予測係数算出手段とを備える係数学習装置として機能させるプログラムである。
本発明の第1の側面においては、第1の画像において注目画素の周辺画素の相関値に基づいて前記注目画素の相関方向が検出され、前記注目画素の周辺の複数の画素のそれぞれについて検出された前記相関方向に基づいて、前記注目画素の相関方向の信頼度が算出され、前記検出された相関方向に基づいて、前記注目画素を中心とする所定の数の画素の値からなる予測タップが、前記第1の画像から抽出され、第2の画像における前記注目画素に対応する画素の値と、前記予測タップに基づいて、前記予測タップから前記第2の画像の画素値を演算する線形一次式に用いられる予測係数の値が、前記注目画素について検出された相関方向の信頼度に対応づけて算出される。
本発明の第2の側面は、第1の画像において注目画素の周辺画素の相関値に基づいて前記注目画素の相関方向を検出する相関方向検出手段と、前記注目画素の周辺の複数の画素のそれぞれについて検出された前記相関方向に基づいて、前記注目画素の相関方向の信頼度を算出する信頼度算出手段と、前記検出された相関方向に基づいて、前記注目画素を中心とする所定の数の画素の値からなる予測タップを、前記第1の画像から抽出する予測タップ抽出手段と、前記注目画素の相関方向の信頼度に基づいて、予め記憶されている予測係数を読み出す係数読み出し手段と、前記予測タップのそれぞれと前記予測係数とを用いた線形一次式により第2の画像の画素値を演算する画素値演算手段とを備える画像処理装置である。
前記予測タップは、前記注目画素に対する位置が予め定められた複数または単数の画素の値からなる固定タップと、前記注目画素に対する位置が前記注目画素について検出された相関方向に対応して定まる複数または単数の画素の値からなる可変タップとにより構成されるようにすることができる。
前記第1の画像から、前記注目画素を中心とする所定の数の画素の値からなるクラスタップを抽出するクラスタップ抽出手段と、前記クラスタップを解析して、複数の特徴クラスのいずれかに分類する特徴クラス分類手段と、前記注目画素について検出された相関方向の信頼度を閾値と比較することで複数の信頼度クラスのいずれかに分類する信頼度クラス分類手段と、前記分類された特徴クラスと信頼度クラスに基づいて、最終クラスを決定する最終クラス決定手段をさらに備え、前記予測係数読み出し手段は、前記最終クラスに基づいて前記予測係数を読み出すようにすることができる。
前記注目画素について検出された相関方向の信頼度は、前記注目画素の周辺の複数の画素のそれぞれについて検出された前記相関方向のばらつきの度合に基づいて算出されるようにすることができる。
本発明の第2の側面は、相関方向検出手段が、第1の画像において注目画素の周辺画素の相関値に基づいて前記注目画素の相関方向を検出し、信頼度算出手段が、前記注目画素の周辺の複数の画素のそれぞれについて検出された前記相関方向に基づいて、前記注目画素の相関方向の信頼度を算出し、予測タップ抽出手段が、前記検出された相関方向に基づいて、前記注目画素を中心とする所定の数の画素の値からなる予測タップを、前記第1の画像から抽出し、係数読み出し手段が、前記注目画素の相関方向の信頼度に基づいて、予め記憶されている予測係数を読み出し、画素値演算手段が、前記予測タップのそれぞれと前記予測係数とを用いた線形一次式により第2の画像の画素値を演算するステップを含む画像処理方法である。
本発明の第2の側面は、コンピュータを、第1の画像において注目画素の周辺画素の相関値に基づいて前記注目画素の相関方向を検出する相関方向検出手段と、前記注目画素の周辺の複数の画素のそれぞれについて検出された前記相関方向に基づいて、前記注目画素の相関方向の信頼度を算出する信頼度算出手段と、前記検出された相関方向に基づいて、前記注目画素を中心とする所定の数の画素の値からなる予測タップを、前記第1の画像から抽出する予測タップ抽出手段と、前記注目画素の相関方向の信頼度に基づいて、予め記憶されている予測係数を読み出す係数読み出し手段と、前記予測タップのそれぞれと前記予測係数とを用いた線形一次式により第2の画像の画素値を演算する画素値演算手段とを備える画像処理装置として機能させるプログラムである。
本発明の第2の側面においては、第1の画像において注目画素の周辺画素の相関値に基づいて前記注目画素の相関方向が検出され、前記注目画素の周辺の複数の画素のそれぞれについて検出された前記相関方向に基づいて、前記注目画素の相関方向の信頼度が算出され、前記検出された相関方向に基づいて、前記注目画素を中心とする所定の数の画素の値からなる予測タップが、前記第1の画像から抽出され、前記注目画素の相関方向の信頼度に基づいて、予め記憶されている予測係数が読み出され、前記予測タップのそれぞれと前記予測係数とを用いた線形一次式により第2の画像の画素値が演算される。
本発明によれば、簡単な構成で確実にジャギー低減効果を向上させる高画質化処理を実現することができる。
本発明の一実施の形態に係る学習装置の構成例を示すブロック図である。 相関方向の検出方式を説明する図である。 相関方向の検出方式の別の例を説明する図である。 相関方向の検出方式のさらに別の例を説明する図である。 図1の斜め検出部による検出結果の信頼度を説明する図である。 信頼度の算出方式を説明する図である。 予測タップの構成例を示す図である。 本発明の一実施の形態に係る画像処理装置の構成例を示すブロック図である。 信頼度クラスと予測係数の要素の値の関係を説明する図である。 所定の入力画像に対して従来の高画質化処理を施すことにより得られた出力画像を示す図である。 図10と同じ入力画像に対して、図8の画像処理装置により高画質化処理を施して得られ得た出力画像を示す図である。 係数学習処理の例を説明するフローチャートである。 信頼度クラス決定処理の例を説明するフローチャートである。 予測タップ抽出処理の例を説明するフローチャートである。 解像度変換処理の例を説明するフローチャートである。 本発明の画像処理装置を搭載したテレビジョン受像機の構成例を示すブロック図である。 パーソナルコンピュータの構成例を示すブロック図である。
以下、図面を参照して、本発明の実施の形態について説明する。
図1は、本発明の一実施の形態に係る学習装置の構成例を示すブロック図である。
この学習装置50は、画像の高画質化処理に用いられる学習装置とされ、入力された生徒画像および教師画像(または教師信号)のデータに基づいて、高画質化処理において用いられる係数を生成するようになされている。
ここで、高画質化処理は、例えば、低解像度の入力画像を高解像度の出力画像に変換する処理とされる。例えば、画像のインターレース・プログレッシブ変換(IP変換)、スケーリングなどの解像度変換の処理も高画質化処理の1つとされる。
学習装置50は、生徒画像を入力画像として、教師画像に近い高画質の画像を出力画像として生成するための係数である予測係数を学習するようになされている。予測係数は、例えば、入力画像の注目画素に対応する複数の画素の値によって構成される予測タップをパラメータとし、高画質化された画像において注目画素に対応する画素の値を演算する線形一次式に用いられる係数とされる。なお、予測係数は、後述するクラス番号毎に学習される。
また、学習装置50は、入力画像の注目画素に対応する複数の画素の値から得られる特徴量などからなるクラスタップに基づいて、注目画素を、複数のクラスのうちのいずれかにクラス分けする。すなわち、学習装置50は、入力画像の注目画素のそれぞれが、高画質化処理のためのどのクラスに属する画素であるかを特定するようになされている。
さらに、学習装置50は、入力画像に斜めの線やオブジェクトなどが存在するか否かを検出し、その検出結果に応じたクラス分けと予測タップの抽出を行うようになされている。
学習装置50においては、例えば、教師画像として高解像度の画像を入力され、生徒画像として教師画像の画素数を縮退するなどして生成された低解像度の画像が入力される。教師画像と生徒画像は、1対(学習対と称することにする)ずつ入力されて学習装置50により学習が行われる。低解像度画像は、例えば、インターレース画像とされ、高解像度画像は、例えば、プログレッシブ画像とされる。
図1の学習装置50は、クラスタップ抽出部61、波形クラス決定部62、動きクラス決定部63を有している。また、学習装置50には、斜め検出部64、信頼度クラス決定部65、予測タップ抽出部66、クラス分類部67、および係数生成部68が設けられている。
クラスタップ抽出部61は、入力された低解像度画像の中で高解像度画像の画素の座標(出力位相とも称する)を特定する。クラスタップ抽出部61は、例えば、この出力位相を注目画素として設定し、注目画素に対応する複数の画素の値から得られる特徴量などからなるクラスタップを抽出する。
波形クラス決定部62は、抽出されたクラスタップを解析し画像の波形に応じて定まる波形クラスを決定する。動きクラス決定部63は、画像の動きに応じて定まる動きクラスを決定する。
斜め検出部64は、入力画像の注目画素を中心とした複数の画素で構成される画像を解析して画像の中の斜めの線などを検出するようになされている。より具体的には、斜め検出部64は、注目画素についての相関方向を検出するようになされている。
図2は、斜め検出部64による相関方向の検出の方式の例を説明する図である。同図には、注目画素を中心とする11個の画素が示されている。なお、図中の黒い円が注目画素であり、白い円がその周辺の画素を表している。また、図中水平方向の実線は、インターレース画像の画素列を表しており、図中の点線はプログレッシブ画像の画素列を表している。すなわち、生徒画像(入力画像)には、点線上の位置に画素が存在しておらず、教師画像には、点線上の位置に画素が存在する。従って、実際には、入力画像に注目画素は存在せず、出力位相に対応する画素位置の仮想的な画素を注目画素として設定している。
図2に示されるように、注目画素を中心として点対象となる位置の2つの画素の相関が求められて相関方向が検出される。図2の例では、注目画素の中心を通る各方向の直線によって、点対象となる位置の2つの画素の組み合わせが特定されている。具体的には、2つの画素値の差分絶対値の比較などにより相関方向が検出される。
例えば、図2の注目画素の垂直上側の画素と垂直下側の画素との差分絶対値が最も小さい場合、注目画素の相関方向は垂直方向となる。また、注目画素の左上の画素と右下の画素との差分絶対値が最も小さい場合、注目画素の相関方向は斜め右方向となる。さらに、また、注目画素の右上の画素と左下の画素との差分絶対値が最も小さい場合、注目画素の相関方向は斜め左方向となる。なお、図2の例では、2種類の斜め右方向と2種類の斜め左方向が存在する。
図3は、斜め検出部64により相関方向の検出の方式の別の例を説明する図である。同図には、図2の場合と同様に、注目画素を中心とする11個の画素が示されている。
図3の方式の場合、注目画素を中心として対象となる位置の複数の画素の相関が求められて相関方向が検出される。同図の例では、黒い円で示された注目画素の上側と下側にそれぞれハッチングされた円で示される3つの画素の相関が求められる。具体的には、例えば、上下のそれぞれ3つの画素の中で対応する2つの画素同士の値の差分絶対値を3通り求めてそれらの合計値の比較などにより相関方向が検出される。
図3の例では、注目画素の上側の列の左から3つの画素のそれぞれと、注目画素の下側の列の右から3つの画素のそれぞれとの相関が最も高かったものとされ、注目画素の相関方向は、斜め右方向(左上から右下)とされている。
図4は、斜め検出部64により相関方向の検出の方式のさらに別の例を説明する図である。同図には、注目画素を中心とする21個の画素が示されている。
図4の方式の場合、注目画素の周辺の複数の画素群であるブロックを用い、いわゆるブロックマッチング方式により相関が求められて相関方向が検出される。同図の例では、それぞれ矩形の枠で囲まれた6つの画素からなる2つのブロックを用いたブロックマッチングが行われている。
図4の例では、注目画素の左上側のブロックと、注目画素の右下側のブロックとの相関が最も高かったものとされ、注目画素の相関方向は、斜め右方向(左上から右下)とされている。
このように、斜め検出部64は、例えば、注目画素の周辺の対応する画素値の差分絶対値の逆数などを相関値とし、相関性の高い方向を注目画素についての相関方向として検出する。そして、斜め検出部64は、その相関方向を注目画素(出力位相)に対応づけて、信頼度クラス決定部65、および予測タップ抽出部66に出力する。なお、相関方向は、高い相関の検出された方向に対応する直線の傾きを表す情報とされ、例えば、x成分とy成分からなる2次元のベクトルとして出力される。
図1に戻って、信頼度クラス決定部65は、斜め検出部64による検出結果の信頼度を表す信頼度クラスを決定するようになされている。
図5は、斜め検出部64による検出結果の信頼度を説明する図である。同図は、トラック競技などが行われるグランド上を人が行進している画像を示している。このような画像において、例えば、図中左上側のグランドに描かれた線(例えば、白線など)の画像を構成する画素について検出された相関方向は信頼性の高いものとなる。図中左上側のグランドに描かれた白線は、ほぼ一定の方向で続いているからである。
一方、図中右側の群衆の画像を構成する画素について検出された相関方向は信頼性の低いものとなる。図中右側の群衆の画像には、一定の方向に連続するオブジェクトがないからである。
信頼度クラス決定部65は、斜め検出部64による検出結果の信頼度を、例えば、次のようにして求める。
信頼度クラス決定部65は、斜め検出部64による複数画素分の検出結果を取得し、それらの複数の画素の中心の画素についての信頼度を算出する。上述したように、斜め検出部64による検出結果としての相関方向は、注目画素(出力位相)のそれぞれに対応付けられて2次元のベクトルとして出力される。そこで、信頼度クラス決定部65は、相関方向が出力された複数の画素(斜め検出部64の処理における注目画素)における相関方向のばらつき度合を表す値を算出する。
例えば、斜め検出部64による検出結果として、図6に示されるような画素のそれぞれについて検出結果が出力されたものとされる。図6は、信頼度の算出を説明する図である。同図には、図中の点線上に3行5列の15個の画素が示されている。なお、図中水平方向の実線は、インターレース画像の画素列を表しており、図中の点線はプログレッシブ画像の画素列を表している。すなわち、生徒画像(入力画像)には、点線上の位置に画素が存在しておらず、教師画像には、点線上の位置に画素が存在する。
信頼度クラス決定部65は、これら点線上の15個の画素のうち、中心に位置する画素を注目画素とし、その注目画素の相関方向と周辺の画素の相関方向とのばらつき度合を解析する。なお、図中の黒い円が注目画素であり、白い円がその周辺の画素を表している。これら、黒い円と白い円の画素は、教師画像(または出力画像)の画素である。一方、図中に示される点線の円のそれぞれは、生徒画像(入力画像)の画素を表している。
いま、注目画素の相関方向を、(xc,yc)で表わし、周辺の画素の相関方向を(x,y)で表わした場合、図6の注目画素の相関方向と周辺の画素の相関方向とのばらつき度合Diffは、式(1)により求めることができる。
Figure 2011217140
式(1)により求められたばらつき度合Diffの値が大きいほど、注目画素の相関方向は信頼度が低いと言える。また、式(1)により求められたばらつき度合Diffの値が小さいほど、注目画素の相関方向は信頼度が高いと言える。
信頼度クラス決定部65は、式(1)により求められたばらつき度合Diffを予め定められた閾値と比較することにより、信頼度クラスを決定する。
例えば、th1<th2<th3の関係が成立する3つの閾値th1乃至th3を定めておく。
Diff<th1の場合、信頼度クラスは「0」とされる。
th1<Diff<th2の場合、信頼度クラスは「1」とされる。
th3<Diff<th4の場合、信頼度クラスは「2」とされる。
th4<Diffの場合、信頼度クラスは「3」とされる。
このようにして、信頼度クラス決定部65は、出力位相(すなわち教師画像の画素)のそれぞれについて検出された相関方向の信頼度クラスを決定していく。
図1に戻って、予測タップ抽出部66は、入力画像から注目画素に対応する複数の画素の値によって構成される予測タップを抽出するようになされている。ここで、予測タップは、注目画素に対する相対的位置が予め定められた位置となる所定の個数の画素の値からなる固定タップと、注目画素に対する相対的位置が必要に応じて変更された画素の値からなる可変タップによって構成される。予測タップ抽出部66は、予測タップを抽出する際に、斜め検出部64による検出結果に基づいて、可変タップを選択するようになされている。
図7は、予測タップの構成例を示す図である。同図には、注目画素を中心とする37個の画素が示されている。なお、図中の黒い円が注目画素であり、白い円またはハッチングされた円がその周辺の画素を表している。
また、図中水平方向の実線は、インターレース画像の画素列を表しており、図中の点線はプログレッシブ画像の画素列を表している。すなわち、生徒画像(入力画像)には、点線上の位置に画素が存在しておらず、教師画像には、点線上の位置に画素が存在する。従って、実際には、入力画像に注目画素は存在せず、出力位相に対応する画素位置の仮想的な画素を注目画素として設定している。
また、同図においては、予測タップを構成する各画素値の画素を識別するために、円の内部に番号が付されている。
予測タップにおける固定タップは、例えば、注目画素の上側の列にある3つの画素と、注目画素の下側の列にある3つの画素により構成される。図7の例では、1番乃至6番の画素の画素値が固定タップとされる。
図7の例の場合、注目画素の相関方向として右上から左下方向の直線に対応する方向が検出されたものとする。予測タップ抽出部66は、注目画素の相関方向を特定し、その相関方向に対応する直線を特定する。これにより、図中の直線101が特定される。なお、上述したように、斜め検出部64により、高い相関の検出された方向(相関方向)に対応する直線の傾きを表す情報として、例えば、x成分とy成分からなる2次元のベクトルの情報が出力されている。予測タップ抽出部66は、この情報に基づいて、図中の直線101を特定することができる。
そして、予測タップ抽出部66は、直線101と、注目画素の上下に隣接する入力画像の画素列との交点を特定する。これにより、図中の直線101と画素列の線102のとの交点が特定され、直線101と画素列の線103のとの交点が特定される。
予測タップ抽出部66は、上述のように特定された交点に基づいて、予測タップの中の可変タップを抽出するようになされている。この例の場合、可変タップは、7番乃至12番の画素の画素値とされる。
すなわち、予測タップ抽出部66は、直線101と画素列の線102のとの交点に対応する画素(8番の画素)を特定し、その画素からの距離が閾値以内(例えば、1画素分の距離以内)の左右両側の画素を特定する。いまの場合、7番の画素と9番の画素が特定される。同様にして、予測タップ抽出部66は、直線101と画素列の線103のとの交点に対応する画素(11番の画素)を特定し、その画素からの距離が閾値以内(例えば、1画素分の距離以内)の左右両側の画素を特定する。いまの場合、10番の画素と12番の画素が特定される。
予測タップ抽出部は、上述のようにして特定された7番乃至9番の画素の画素値と、10番乃至12番の画素の画素値を可変タップとして抽出する。
なお、仮に注目画素の相関方向として垂直方向の直線に対応する方向が検出された場合、線102のとの交点の画素は2番の画素となり、線103のとの交点の画素は5番の画素となる。この場合、それらの画素からの1画素分の距離以内の画素は、1番と3番の画素および4番と6番の画素となる。つまり、注目画素の相関方向として垂直方向の直線に対応する方向が検出された場合、固定タップと同じものが可変タップとして抽出される。
このように、固定タップと可変タップの一部または全部が重複してもよいが、必ず予め設定された数だけ固定タップと可変タップが抽出される。図7の例の場合、注目画素の相関方向の如何にかかわらず、6個の固定タップと6個の可変タップが抽出されるようになされている。
このようにして、予測タップ抽出部66は、固定タップと可変タップとにより構成される予測タップを抽出する。図7の例では、合計12個のタップが予測タップとして抽出されることになる。
なお、図7は予測タップの構成の一例であり、必ずしも同図に示される通りに固定タップの画素の位置を定める必要はない。また、相関方向に応じた可変タップの画素の位置の選択の方式もこれに限られるものではなく、注目画素と相関方向に基づいて可変タップの画素の位置が選択されるようにすればよい。さらに、予測タップの要素において、固定タップと可変タップの数が必ずしも同数でなくても構わない。例えば、12個の要素のうち、8個が固定タップとされ、4個が可変タップとされるようにしても構わない。
図1に戻って、クラス分類部67は、波形クラス決定部62、動きクラス決定部63、および信頼度クラス決定部65により決定された波形クラス、動きクラス、信頼度クラスに基づいて最終クラスを決定する。最終クラスは、例えば、波形クラスを表すビット列、動きクラスを表すビット列、および信頼度クラスを表すビット列を結合したビット列により表わされる。
係数生成部68は、例えば、教師画像の画素値を真値とし、生徒画像から抽出されたタップと真値の組み合わせからなる複数のサンプルを取得して、タップをパラメータとして真値を算出するための線形一次式の係数を、予測係数として学習するようになされている。係数生成部68は、例えば、取得したサンプルに基づいてタップをパラメータとして真値を算出するための線形一次式の連立式を生成し、その連立式を、例えば最小二乗法により解くことで、予測係数を学習(生成)する。
いま、生徒画像(入力画像)から得られた予測タップのうちの固定タップをxfで表わし、可変タップxhで表わすものとし、教師画像の画素値をyで表わすものとする。この場合、タップをパラメータとして真値を算出するための線形一次式は、式(2)により表わされる。
Figure 2011217140
式(2)に用いられる係数wfは、固定タップに乗じられる予測係数の要素とされ、係数whは、可変タップに乗じられる予測係数の要素とされる。すなわち、式(2)は、予測タップと予測係数の要素のそれぞれとの積和演算とされる。
なお、式(2)は、予測タップが6個の固定タップと6個の可変タップを要素とするベクトルであることを前提とするものである。従って、式(2)の場合、予測係数も12個の要素を有するベクトルであることを前提としており、固定タップに乗じられる予測係数の要素は6個、可変タップに乗じられる予測係数の要素は6個となる。
また、予測係数は、クラス分類部67により決定された最終クラスに対応付けられて出力され、例えば、係数テーブルとして記憶される。
このようにして、学習装置50により予測係数が学習される。
図8は、本発明の一実施の形態に係る画像処理装置の構成例を示すブロック図である。
同図の画像処理装置200は、図1の学習装置50に対応する画像処理装置とされる。すなわち、画像処理装置200は、学習装置50により学習された予測係数を用いた演算を行い、入力画像を高画質化する画像処理を行うようになされている。
図8の画像処理装置200は、クラスタップ抽出部201、波形クラス決定部202、動きクラス決定部203を有している。また、画像処理装置200には、斜め検出部204、信頼度クラス決定部205、予測タップ抽出部206、クラス分類部207、係数算出部208、係数テーブル209、および積和演算部210が設けられている。
クラスタップ抽出部201は、図1のクラスタップ抽出部61と同様に、入力された低解像度画像の中で高解像度画像の画素の座標(出力位相とも称する)を特定する。クラスタップ抽出部201は、例えば、この出力位相を注目画素として設定し、注目画素に対応する複数の画素の値から得られる特徴量などからなるクラスタップを抽出する。
波形クラス決定部202は、図1の波形クラス決定部62と同様に、抽出されたクラスタップを解析し画像の波形に応じて定まる波形クラスを決定する。動きクラス決定部203は、図1の動きクラス決定部63と同様に、画像の動きに応じて定まる動きクラスを決定する。
斜め検出部204は、図1の斜め検出部64と同様に、入力画像の注目画素を中心とした複数の画素で構成される画像を解析して画像の中の斜めの線などを検出するようになされている。斜め検出部204は、例えば、図2乃至図4を参照して上述した方式により注目画素についての相関方向を検出するようになされている。
信頼度クラス決定部205は、図1の信頼度クラス決定部65と同様に、斜め検出部204による検出結果の信頼度を表す信頼度クラスを決定するようになされている。
すなわち、信頼度クラス決定部205は、斜め検出部204による複数画素分の検出結果を取得し、それらの複数の画素の中心の画素についての信頼度を算出する。このとき、図6を参照して上述したように、相関方向が出力された複数の画素(斜め検出部204の処理における注目画素)における相関方向のばらつき度合を表す値が、式(1)により算出される。
そして、信頼度クラス決定部205は、式(1)により求められたばらつき度合Diffを予め定められた閾値と比較することにより、信頼度クラス「0」乃至信頼度クラス「3」のいずれのクラスであるかを決定する。
このようにして、信頼度クラス決定部205は、出力位相のそれぞれについて検出された相関方向の信頼度クラスを決定していく。
予測タップ抽出部206は、図1の予測タップ抽出部66と同様に、入力画像から注目画素に対応する複数の画素の値によって構成される予測タップを抽出するようになされている。ここで、予測タップは、注目画素に対する相対的位置が予め定められた位置となる所定の個数の画素の値からなる固定タップと、注目画素に対する相対的位置が必要に応じて変更された画素の値からなる可変タップによって構成される。予測タップ抽出部206は、予測タップを抽出する際に、斜め検出部204による検出結果に基づいて、可変タップを選択するようになされている。
すなわち、予測タップ抽出部206は、例えば、図7を参照して上述したように、6個の固定タップと6個の可変タップとにより構成される予測タップを抽出する。
クラス分類部207は、図1のクラス分類部67と同様に、波形クラス決定部202、動きクラス決定部203、および信頼度クラス決定部205により決定された波形クラス、動きクラス、信頼度クラスに基づいて最終クラスを決定する。最終クラスは、例えば、波形クラスを表すビット列、動きクラスを表すビット列、および信頼度クラスを表すビット列を結合したビット列により表わされる。
係数算出部208は、クラス分類部207により決定された最終クラスに対応する予測係数を、係数テーブル209から読み出す。これにより、予測タップの要素数と同数の要素を有するベクトルである予測係数が読み出される。
なお、係数テーブル209は、図1の学習装置50によって、最終クラスに対応付けられて学習された予測係数が記憶されている係数テーブルとされる。
積和演算部210は、予測タップ抽出部206が抽出した予測タップと係数算出部208が読み出した予測係数を用いた積和演算を行う。すなわち、積和演算部210により式(2)の演算が行われ、出力位相の画素値が演算される。
積和演算部210が出力画像である高解像度画像の出力位相の画素値のそれぞれを演算して出力していくことにより、出力画像の各画素が生成され、最終的に出力画像が生成されることになる。
このようにして、画像処理装置200による高画質化処理が行われ、例えば、低解像度の入力画像が高解像度の出力画像に変換される。例えば、画像処理装置200にインターレース画像を入力することにより、プログレッシブ画像が出力される。
画像の解像度を変換する際に、画素の補間を行う必要があるが、従来の技術では、例えば、斜め方向のエッジが存在すると、ジャギーと称される悪影響(画像の中のオブジェクトの輪郭が階段状のギザギザになってしまう現象)が発生することがある。
IP変換、スケーリングにおけるジャギー低減技術としては異方性補間が知られており、最も相関の高い斜め方向を検出し、その方向をもとに画素を補間する。これにより斜め線特性が改善する。
しかしながら、異方性補間は、相関の高い方向の検出を行い、その情報を用い補間するため、斜め線特性は改善するが、エラー回避のための処理が複雑になる。また、あらゆる信号において正解を求めることは困難である。さらに、従来のクラス分類による統計処理は、最適な変換が可能になるが、従来のタップ範囲・クラス数では、斜め方向の特徴を捉えきれずジャギー低減効果が低いという問題があった。
これに対して、本発明によれば、画像の高画質化処理を行う際のジャギー低減効果を高めることが可能となる。
すなわち、本発明の画像処理装置200による高画質化処理では、注目画素の相関方向が検出され、検出された相関方向に基づいて可変タップが特定されて予測タップが抽出される。さらに、その相関方向の信頼度が算出され、信頼度クラスが決定された上で最終的なクラス分類が行われる。従って、斜め線特性を改善させるとともに、誤って斜め方向の相関が検出された場合の破綻を回避することが可能となるのである。
図9は、係数テーブル209に記憶された係数を説明する図である。同図は、横軸にタップ番号が示され、縦軸はそれぞれのタップに乗じられる係数値とされている。
同図に示されるグラフは、「conf:0」乃至「conf:3」に対応するプロット点を結んだ折れ線グラフとされている。ここで、「conf:0」乃至「conf:3」は、信頼度クラス決定部205により決定された信頼度クラス「0」乃至信頼度クラス「3」を表している。「conf:0」は最も信頼度が高い信頼度クラスであり、「conf:3」は最も信頼度が低い信頼度クラスである。
また、図9のタップ番号は、それぞれ図7を参照に示される予測タップを構成する要素であって、図中の円に付された番号を表すものである。すなわち、図9の各プロット点は、それぞれのタップ番号に対応する予測タップの要素に乗じられる予測係数の要素の値を表すものとなる。図7を参照して上述したように、予測タップの要素の12個の画素のうち1番乃至6番の画素の画素値は固定タップであり、予測タップの要素の画素のうち7番乃至12番の画素の画素値は可変タップである。
つまり、図9に示されるグラフは、信頼度クラス「0」の場合に予測タップの各要素に乗じられる予測係数の各要素の値、信頼度クラス「1」の場合に予測タップの各要素に乗じられる予測係数の各要素の値、・・・信頼度クラス「3」の場合に予測タップの各要素に乗じられる予測係数の各要素の値をそれぞれ表わしている。
同図に示されるように、信頼度が高いほど可変タップ(7番乃至12番)に乗じられる予測係数の要素の値が大きくなっている。また、信頼度が高いほど固定タップ(1番乃至6番)のうち、2番と5番のタップに乗じられる予測係数の要素の値が小さくなっている。一方、信頼度が低いほど可変タップ(7番乃至12番)に乗じられる要素の値が小さくなり、固定タップ(1番乃至6番)のうち、2番と5番のタップに乗じられる要素の値が大きくなっている。
このように、本発明では、相関方向に基づいて可変タップの画素の位置が適応的に変化するとともに、その相関方向の信頼度に応じて固定タップに乗じられる予測係数の要素と可変タップに乗じられる予測係数の要素の値が適応的に変化する。これにより、斜め線特性を改善させるとともに、誤って斜め方向の相関が検出された場合の破綻を回避することが可能となり、画像の高画質化処理を行う際のジャギー低減効果を高めることが可能となる。
図10と図11は、本発明の効果を説明する図である。図10は、所定の入力画像に対して従来の高画質化処理を施すことにより得られた出力画像を示す図であり、図11は、同じ入力画像に対して、本発明の画像処理装置200により高画質化処理を施して得られ得た出力画像を示す図である。
図10と図11は、図中上側に白色の背景、図中下側に灰色の背景を有する斜めの線が表示された画像の例である。図10の画像では、斜めの線の部分にそれぞれ、階段状のギザギザ(ジャギー)が発生している。一方、図11の画像では、ジャギーがほとんど見られない。すなわち、図11の画像では、ジャギーが低減されていることが分かる。
次に、図12のフローチャートを参照して、図1の学習装置50による係数学習処理の例について説明する。
ステップS21において、学習装置50は、生徒画像と教師画像の入力を受け付ける。
ステップS22において、クラスタップ抽出部61は、クラスタップを抽出する。このとき、例えば、入力された低解像度画像の中で出力位相が注目画素として設定され、注目画素に対応する複数の画素の値から得られる特徴量などからなるクラスタップが抽出される。
ステップS23において、波形クラス決定部62は、ステップS22で抽出されたクラスタップを解析し画像の波形に応じて定まる波形クラスを決定する。
ステップS24において、動きクラス決定部63は、画像の動きに応じて定まる動きクラスを決定する。
ステップS25において、斜め検出部64と信頼度クラス決定部65は、図13を参照して後述する信頼度クラス決定処理を実行する。これにより、上述した信頼度クラスが決定される。
ここで、図13のフローチャートを参照して、図12のステップS25の信頼度クラス決定処理の詳細な例について説明する。
ステップS41において、斜め検出部64は、注目画素についての相関方向を検出する。このとき、例えば、図2乃至図4を参照して上述した方式により、注目画素の相関方向が検出される。
ステップS42において、信頼度クラス決定部65は、ステップS41での斜め検出部64による相関方向の検出結果のばらつきの度合を算出する。
このとき、信頼度クラス決定部65は、斜め検出部64による複数画素分の検出結果を取得し、それらの複数の画素の中心の画素についての信頼度を算出する。すなわち、図6を参照して上述したように、相関方向が出力された複数の画素(斜め検出部64の処理における注目画素)における相関方向のばらつき度合を表す値が、式(1)により算出される。なお、ステップS42の処理に進むにあたり、複数の注目画素についてステップS41の処理が実行されるものとする。
ステップS43において、信頼度クラス決定部65は、信頼度クラスを決定する。このとき、例えば、ステップS42の処理により求められたばらつき度合Diffを予め定められた閾値と比較することにより、信頼度クラス「0」乃至信頼度クラス「3」のいずれのクラスであるかが決定される。
このようにして信頼度クラスが決定される。
図12に戻って、ステップS25の処理の後、処理は、ステップS26に進む。
ステップS26において、クラス分類部67は、ステップS23、ステップS24、およびステップS25の処理により決定された波形クラス、動きクラス、信頼度クラスに基づいて最終クラスを決定する。最終クラスは、例えば、波形クラスを表すビット列、動きクラスを表すビット列、および信頼度クラスを表すビット列を結合したビット列により表わされる。
ステップS27において、予測タップ抽出部66は、図14を参照して後述する予測タップ抽出処理を実行する。これにより、固定タップと可変タップからなる予測タップが抽出される。
ここで、図14のフローチャートを参照して、図12のステップS27の予測タップ抽出処理の詳細な例について説明する。
ステップS61において、予測タップ抽出部66は、図13のステップS41の処理により検出された相関方向をその注目画素とともに特定する。
ステップS62において、予測タップ抽出部66は、ステップS61の処理で特定された相関方向に基づいて可変タップを選択する。
このとき、例えば、図7を参照して上述したように、可変タップが選択される。例えば、図7の直線101と、画素列の線102のとの交点が特定され、直線101と画素列の線103のとの交点が特定され、特定された交点に基づいて、予測タップの中の可変タップとして抽出すべき画素値の画素が選択される。図7の例の場合、可変タップは、7番乃至12番の画素の画素値とされる。
ステップS63において、予測タップ抽出部66は、ステップS62の処理で選択された可変タップと、予め設定された固定タップとを予測タップとして抽出する。なお、図7の例の場合、固定タップは、1番乃至6番の画素の画素値とされる。これにより、注目画素に対応する12個の画素値からなる予測タップが抽出されることになる。
このようにして、予測タップが抽出される。
図12に戻って、ステップS27の処理の後、処理は、ステップS28に進む。
ステップS28において、係数生成部68は、例えば、教師画像の画素値を真値とし、ステップS27の処理で生徒画像から抽出された予測タップと真値の組み合わせからなる複数のサンプルを取得する。そして、係数生成部68は、それらのサンプルをステップS26で決定された最終クラス毎に足しこむ。
ステップS29において、係数生成部68は、例えば、ステップS28の処理結果に基づいて、予測タップをパラメータとして真値を算出するための線形一次式の連立式を生成し、その連立式を、例えば最小二乗法により解くことで、予測係数を導出する。なお、予測タップをパラメータとして真値を算出するための線形一次式は、上述したように、式(2)により表わされる。
これにより、式(2)に用いられる係数wfが、固定タップに乗じられる予測係数の要素として導出され、係数whが、可変タップに乗じられる予測係数の要素として導出され、それらの要素からなるベクトルとして予測係数が導出される。
なお、ステップS29で導出される予測係数は、ステップS26の処理で決定された最終クラスに対応付けられて出力され、例えば、係数テーブルとして記憶される。
このようにして、予測係数学習処理が実行される。
次に、図15のフローチャートを参照して、図8の画像処理装置200による解像度変換処理の例について説明する。この処理は、画像処理装置200による高画質化処理として実行される。
ステップS101において、画像処理装置200は、入力画像を受け付ける。
ステップS102において、クラスタップ抽出部201は、クラスタップを抽出する。このとき、クラスタップ抽出部201は、図1のクラスタップ抽出部61(図12のステップS22の処理)と同様に、注目画素に対応する複数の画素の値から得られる特徴量などからなるクラスタップを抽出する。
ステップS103において、波形クラス決定部202は、波形クラスを決定する。このとき、波形クラス決定部202は、波形クラス決定部62(ステップS23の処理)と同様に、ステップS102の処理で抽出されたクラスタップを解析し画像の波形に応じて定まる波形クラスを決定する。
ステップS104において、動きクラス決定部203は、動きクラスを決定する。このとき、動きクラス決定部203は、動きクラス決定部63(ステップS24の処理)と同様に、画像の動きに応じて定まる動きクラスを決定する。
ステップS105において、斜め検出部204と信頼度クラス決定部205は、信頼度クラス決定処理を実行する。
このとき、斜め検出部204が、例えば、図2乃至図4を参照して上述した方式により注目画素についての相関方向を検出する。また、信頼度クラス決定部205が、斜め検出部204による複数画素分の検出結果を取得し、図6を参照して上述したように、相関方向が出力された複数の画素における相関方向のばらつき度合を表す値を、式(1)により算出する。そして、信頼度クラス決定部205が、ばらつき度合を予め定められた閾値と比較することにより、信頼度クラスを決定する。
なお、ステップS105の処理の詳細は、図13を参照して上述したものと同様なので詳細な説明は省略する。
ステップS106において、クラス分類部207は、クラス分類部67(ステップS26の処理)と同様に、ステップS103、ステップS104、およびステップS105により決定された波形クラス、動きクラス、信頼度クラスに基づいて最終クラスを決定する。最終クラスは、例えば、波形クラスを表すビット列、動きクラスを表すビット列、および信頼度クラスを表すビット列を結合したビット列により表わされる。
ステップS107において、予測タップ抽出部206は、予測タップを抽出する。
このとき、予測タップ抽出部206は、注目画素に対する相対的位置が予め定められた位置となる所定の個数の画素の値からなる固定タップと、注目画素に対する相対的位置が必要に応じて変更された画素の値からなる可変タップによって構成される予測タップを抽出する。予測タップ抽出部206は、予測タップを抽出する際に、ステップS105の処理の際の斜め検出部204による検出結果(相関方向)に基づいて、可変タップを選択するようになされている。
なお、ステップS107の処理の詳細は、図14を参照して上述したものと同様なので詳細な説明は省略するが、これにより、例えば、図7を参照して上述したように、6個の固定タップと6個の可変タップとにより構成される予測タップが抽出される。
ステップS108において、係数算出部208は、ステップS106の処理で決定された最終クラスに対応する予測係数を、係数テーブル209から読み出す。これにより、予測タップの要素数と同数の要素を有するベクトルである予測係数が読み出される。
なお、係数テーブル209は、図12のステップS29で、最終クラスに対応付けられて導出された予測係数が記憶されている係数テーブルとされる。
ステップS109において、積和演算部210は、ステップS107の処理により抽出された予測タップと、ステップS108の処理により読み出された予測係数を用いた積和演算を行う。このとき、積和演算部210により式(2)の演算が行われ、出力位相の画素値が演算される。
ステップS110において、画像処理装置200は、入力画像の解像度が変換された画像を出力する。すなわち、積和演算部210が出力画像である高解像度画像の出力位相の画素値のそれぞれを演算して出力していくことにより、出力画像の各画素が生成され、最終的に出力画像が生成されることになる。
このようにして、解像度変換処理が実行される。
以上においては、解像度変換処理を高画質化処理の例として説明したが、例えば、ぼけ除去、ノイズ除去などの画像処理を高画質化処理として本発明を適用することも可能である。
また、以上においては、クラス分類において、波形クラス、動きクラス、および信頼度クラスに基づいて最終クラスが決定されるようにする構成を説明したが、例えば、波形クラスと信頼度クラスに基づいて最終クラスが決定されるようにしてもよい。また、例えば、波形クラス、動きクラス以外の画像の特徴量に基づくクラスが画像特徴量クラスとして決定され、画像特徴量クラスと信頼度クラスに基づいて最終クラスが決定されるようにしてもよい。あるいはまた、信頼度クラスのみに基づいて最終クラスが決定されるようにしてもよい。
さらに、以上においては、予測タップの要素(または予測係数の要素)が12である場合を例として説明したが、予測タップ(または予測係数)の要素数はこれに限られるものではない。
図8を参照して上述した画像処理装置は、例えば、高画質化回路としてテレビジョン受像機に搭載することも可能である。図16は、図8を参照して上述した画像処理装置を搭載したテレビジョン受像機511の構成例を示すブロック図である。
同図のテレビジョン受像機511は、被制御部531および制御部532から構成される。被制御部531は、制御部532の制御の下、テレビジョン受像機511の種々の機能を実現する。
被制御部531は、デジタルチューナ553、デマルチプレクサ(Demux)554、MPEG(Moving Picture Expert Group)デコーダ555、映像・グラフィック処理回路556、パネル駆動回路557、表示パネル558、音声処理回路559、音声増幅回路560、スピーカ561、および受信部562を備えている。また、制御部532は、CPU(Central Processing Unit)563、フラッシュROM564、DRAM(Dynamic Random Access Memory)565、および内部バス566を備えている。
デジタルチューナ553は、図示せぬアンテナ端子から入力されたテレビジョン放送信号を処理して、ユーザの選択したチャンネルに対応した所定のTS(Transport Stream)を、デマルチプレクサ554に供給する。
デマルチプレクサ554は、デジタルチューナ553から供給されたTSから、ユーザの選択したチャンネルに対応した、パーシャルTS(映像信号のTSパケット、音声信号のTSパケット)を抽出し、MPEGデコーダ555に供給する。
また、デマルチプレクサ554は、デジタルチューナ553から供給されたTSから、PSI/SI(Program Specific Information/Service Information)を取り出し、CPU563に供給する。デジタルチューナ553から供給されたTSには、複数のチャンネルが多重化されている。デマルチプレクサ554がTSから任意のチャンネルのパーシャルTSを抽出する処理は、PSI/SI(PAT/PMT)から任意のチャンネルのパケットID(PID)の情報を得ることで可能となる。
MPEGデコーダ555は、デマルチプレクサ554から供給される映像信号のTSパケットにより構成される映像PES(Packetized Elementary Stream)パケットに対してデコード処理を行い、その結果得られる映像信号を、映像・グラフィック処理回路556に供給する。また、MPEGデコーダ555は、デマルチプレクサ554から供給される音声信号のTSパケットにより構成される音声PESパケットに対してデコード処理を行い、その結果得られる音声信号を、音声処理回路559に供給する。
映像・グラフィック処理回路556は、MPEGデコーダ555から供給された映像信号に対して、必要に応じて、スケーリング処理、グラフィックスデータの重畳処理等を行い、パネル駆動回路557に供給する。
映像・グラフィック処理回路556には、高画質化回路570が接続されており、パネル駆動回路557に映像信号を供給するのに先立って、高画質化処理が実行される。
高画質化回路570は、図8を参照して上述した画像処理装置と同様の構成とされ、MPEGデコーダ555から供給された映像信号から得られた画像データに対して、図15を参照して上述した解像度変換処理を高画質化処理として実行するようになされている。
パネル駆動回路557は、映像・グラフィック処理回路556から供給された映像信号に基づいて、表示パネル558を駆動し、映像を表示させる。表示パネル558は、例えば、LCD(Liquid Crystal Display)またはPDP(Plasma Display Panel)等で構成されている。
音声処理回路559は、MPEGデコーダ555から供給された音声信号に対してD/A(Digital to Analog)変換等の必要な処理を行い、音声増幅回路560に供給する。
音声増幅回路560は、音声処理回路559から供給されるアナログ音声信号を増幅し、スピーカ561に供給する。スピーカ561は、音声増幅回路560からのアナログ音声信号に応じた音声を出力する。
受信部562は、リモートコントローラ567から送信された、例えば赤外線のリモートコントロール信号を受信し、CPU563に供給する。ユーザは、リモートコントローラ567を操作することで、テレビジョン受像機511の操作を行うことができる。
CPU563、フラッシュROM564、およびDRAM565は、内部バス566を介して接続されている。CPU563は、テレビジョン受像機11の各部の動作を制御する。フラッシュROM564は、制御ソフトウェアの格納およびデータの保管を行う。DRAM565は、CPU563のワークエリア等を構成する。すなわち、CPU563は、フラッシュROM564から読み出したソフトウェアやデータをDRAM565上に展開してソフトウェアを起動し、テレビジョン受像機511の各部を制御する。
このように本発明をテレビジョン受像機に適用することができる。
なお、上述した一連の処理は、ハードウェアにより実行させることもできるし、ソフトウェアにより実行させることもできる。上述した一連の処理をソフトウェアにより実行させる場合には、そのソフトウェアを構成するプログラムが、専用のハードウェアに組み込まれているコンピュータにネットワークや記録媒体からインストールされる。また、各種のプログラムをインストールすることで、各種の機能を実行することが可能な、例えば図17に示されるような汎用のパーソナルコンピュータ700などに、ネットワークや記録媒体からインストールされる。
図17において、CPU(Central Processing Unit)701は、ROM(Read Only Memory)702に記憶されているプログラム、または記憶部708からRAM(Random Access Memory)703にロードされたプログラムに従って各種の処理を実行する。RAM703にはまた、CPU701が各種の処理を実行する上において必要なデータなども適宜記憶される。
CPU701、ROM702、およびRAM703は、バス704を介して相互に接続されている。このバス704にはまた、入出力インタフェース705も接続されている。
入出力インタフェース705には、キーボード、マウスなどよりなる入力部706、LCD(Liquid Crystal display)などよりなるディスプレイ、並びにスピーカなどよりなる出力部707が接続されている。また、入出力インタフェース705には、ハードディスクなどより構成される記憶部708、モデム、LANカードなどのネットワークインタフェースカードなどより構成される通信部709が接続されている。通信部709は、インターネットを含むネットワークを介しての通信処理を行う。
入出力インタフェース705にはまた、必要に応じてドライブ710が接続され、磁気ディスク、光ディスク、光磁気ディスク、或いは半導体メモリなどのリムーバブルメディア711が適宜装着されている。そして、それらのリムーバブルメディアから読み出されたコンピュータプログラムが、必要に応じて記憶部708にインストールされる。
上述した一連の処理をソフトウェアにより実行させる場合には、そのソフトウェアを構成するプログラムが、インターネットなどのネットワークや、リムーバブルメディア711などからなる記録媒体からインストールされる。
なお、この記録媒体は、図17に示される、装置本体とは別に、ユーザにプログラムを配信するために配布される、プログラムが記録されている磁気ディスク(フロッピディスク(登録商標)を含む)、光ディスク(CD-ROM(Compact Disk-Read Only Memory),DVD(Digital Versatile Disk)を含む)、光磁気ディスク(MD(Mini-Disk)(登録商標)を含む)、もしくは半導体メモリなどよりなるリムーバブルメディア711により構成されるものだけでなく、装置本体に予め組み込まれた状態でユーザに配信される、プログラムが記録されているROM702や、記憶部708に含まれるハードディスクなどで構成されるものも含む。
なお、本明細書において上述した一連の処理は、記載された順序に沿って時系列的に行われる処理はもちろん、必ずしも時系列的に処理されなくとも、並列的あるいは個別に実行される処理をも含むものである。
また、本発明の実施の形態は、上述した実施の形態に限定されるものではなく、本発明の要旨を逸脱しない範囲において種々の変更が可能である。
50 学習装置, 61 クラスタップ抽出部, 62 波形クラス決定部, 63 動きクラス決定部, 64 斜め検出部, 65 信頼度クラス決定部, 66 予測タップ抽出部, 67 クラス分類部, 68 係数生成部, 200 画像処理装置, 201 クラスタップ抽出部, 202 波形クラス決定部, 203 動きクラス決定部, 204 斜め検出部, 205 信頼度クラス決定部, 206 予測タップ抽出部, 207 クラス分類部, 208 係数算出部, 209 係数テーブル, 210積和演算部, 511 テレビジョン受像機, 570 高画質化回路, 701 CPU, 702 ROM, 711 リムーバブルメディア

Claims (12)

  1. 第1の画像において注目画素の周辺画素の相関値に基づいて前記注目画素の相関方向を検出する相関方向検出手段と、
    前記注目画素の周辺の複数の画素のそれぞれについて検出された前記相関方向に基づいて、前記注目画素の相関方向の信頼度を算出する信頼度算出手段と、
    前記検出された相関方向に基づいて、前記注目画素を中心とする所定の数の画素の値からなる予測タップを、前記第1の画像から抽出する予測タップ抽出手段と、
    第2の画像における前記注目画素に対応する画素の値と前記予測タップに基づいて、前記予測タップから前記第2の画像の画素値を演算する線形一次式に用いられる予測係数の値を、前記注目画素について検出された相関方向の信頼度に対応づけて算出する予測係数算出手段と
    を備える係数学習装置。
  2. 前記予測タップは、
    前記注目画素に対する位置が予め定められた複数または単数の画素の値からなる固定タップと、
    前記注目画素に対する位置が前記注目画素について検出された相関方向に対応して定まる複数または単数の画素の値からなる可変タップとにより構成される
    請求項1に記載の係数学習装置。
  3. 前記第1の画像から、前記注目画素を中心とする所定の数の画素の値からなるクラスタップを抽出するクラスタップ抽出手段と、
    前記クラスタップを解析して、複数の特徴クラスのいずれかに分類する特徴クラス分類手段と、
    前記注目画素について検出された相関方向の信頼度を閾値と比較することで複数の信頼度クラスのいずれかに分類する信頼度クラス分類手段と、
    前記分類された特徴クラスと信頼度クラスに基づいて、最終クラスを決定する最終クラス決定手段をさらに備え、
    前記予測係数算出手段は、前記最終クラスに対応づけて前記予測係数を算出する
    請求項1に記載の係数学習装置。
  4. 前記注目画素について検出された相関方向の信頼度は、前記注目画素の周辺の複数の画素のそれぞれについて検出された前記相関方向のばらつきの度合に基づいて算出される
    請求項1に記載の係数学習装置。
  5. 相関方向検出手段が、第1の画像において注目画素の周辺画素の相関値に基づいて前記注目画素の相関方向を検出し、
    信頼度算出手段が、前記注目画素の周辺の複数の画素のそれぞれについて検出された前記相関方向に基づいて、前記注目画素の相関方向の信頼度を算出し、
    予測タップ抽出手段が、前記検出された相関方向に基づいて、前記注目画素を中心とする所定の数の画素の値からなる予測タップを、前記第1の画像から抽出し、
    予測係数算出手段が、第2の画像における前記注目画素に対応する画素の値と、前記予測タップに基づいて、前記予測タップから前記第2の画像の画素値を演算する線形一次式に用いられる予測係数の値を、前記注目画素について検出された相関方向の信頼度に対応づけて算出するステップ
    を含む係数学習方法。
  6. コンピュータを、
    第1の画像において注目画素の周辺画素の相関値に基づいて前記注目画素の相関方向を検出する相関方向検出手段と、
    前記注目画素の周辺の複数の画素のそれぞれについて検出された前記相関方向に基づいて、前記注目画素の相関方向の信頼度を算出する信頼度算出手段と、
    前記検出された相関方向に基づいて、前記注目画素を中心とする所定の数の画素の値からなる予測タップを、前記第1の画像から抽出する予測タップ抽出手段と、
    第2の画像における前記注目画素に対応する画素の値と、前記予測タップに基づいて、前記予測タップから前記第2の画像の画素値を演算する線形一次式に用いられる予測係数の値を、前記注目画素について検出された相関方向の信頼度に対応づけて算出する予測係数算出手段とを備える係数学習装置として機能させる
    プログラム。
  7. 第1の画像において注目画素の周辺画素の相関値に基づいて前記注目画素の相関方向を検出する相関方向検出手段と、
    前記注目画素の周辺の複数の画素のそれぞれについて検出された前記相関方向に基づいて、前記注目画素の相関方向の信頼度を算出する信頼度算出手段と、
    前記検出された相関方向に基づいて、前記注目画素を中心とする所定の数の画素の値からなる予測タップを、前記第1の画像から抽出する予測タップ抽出手段と、
    前記注目画素の相関方向の信頼度に基づいて、予め記憶されている予測係数を読み出す係数読み出し手段と、
    前記予測タップのそれぞれと前記予測係数とを用いた線形一次式により第2の画像の画素値を演算する画素値演算手段と
    を備える画像処理装置。
  8. 前記予測タップは、
    前記注目画素に対する位置が予め定められた複数または単数の画素の値からなる固定タップと、
    前記注目画素に対する位置が前記注目画素について検出された相関方向に対応して定まる複数または単数の画素の値からなる可変タップとにより構成される
    請求項7に記載の画像処理装置。
  9. 前記第1の画像から、前記注目画素を中心とする所定の数の画素の値からなるクラスタップを抽出するクラスタップ抽出手段と、
    前記クラスタップを解析して、複数の特徴クラスのいずれかに分類する特徴クラス分類手段と、
    前記注目画素について検出された相関方向の信頼度を閾値と比較することで複数の信頼度クラスのいずれかに分類する信頼度クラス分類手段と、
    前記分類された特徴クラスと信頼度クラスに基づいて、最終クラスを決定する最終クラス決定手段をさらに備え、
    前記予測係数読み出し手段は、前記最終クラスに基づいて前記予測係数を読み出す
    請求項7に記載の画像処理装置。
  10. 前記注目画素について検出された相関方向の信頼度は、前記注目画素の周辺の複数の画素のそれぞれについて検出された前記相関方向のばらつきの度合に基づいて算出される
    請求項7に記載の画像処理装置。
  11. 相関方向検出手段が、第1の画像において注目画素の周辺画素の相関値に基づいて前記注目画素の相関方向を検出し、
    信頼度算出手段が、前記注目画素の周辺の複数の画素のそれぞれについて検出された前記相関方向に基づいて、前記注目画素の相関方向の信頼度を算出し、
    予測タップ抽出手段が、前記検出された相関方向に基づいて、前記注目画素を中心とする所定の数の画素の値からなる予測タップを、前記第1の画像から抽出し、
    係数読み出し手段が、前記注目画素の相関方向の信頼度に基づいて、予め記憶されている予測係数を読み出し、
    画素値演算手段が、前記予測タップのそれぞれと前記予測係数とを用いた線形一次式により第2の画像の画素値を演算するステップ
    を含む画像処理方法。
  12. コンピュータを、
    第1の画像において注目画素の周辺画素の相関値に基づいて前記注目画素の相関方向を検出する相関方向検出手段と、
    前記注目画素の周辺の複数の画素のそれぞれについて検出された前記相関方向に基づいて、前記注目画素の相関方向の信頼度を算出する信頼度算出手段と、
    前記検出された相関方向に基づいて、前記注目画素を中心とする所定の数の画素の値からなる予測タップを、前記第1の画像から抽出する予測タップ抽出手段と、
    前記注目画素の相関方向の信頼度に基づいて、予め記憶されている予測係数を読み出す係数読み出し手段と、
    前記予測タップのそれぞれと前記予測係数とを用いた線形一次式により第2の画像の画素値を演算する画素値演算手段とを備える画像処理装置として機能させる
    プログラム。
JP2010083601A 2010-03-31 2010-03-31 係数学習装置および方法、画像処理装置および方法、プログラム、並びに記録媒体 Withdrawn JP2011217140A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2010083601A JP2011217140A (ja) 2010-03-31 2010-03-31 係数学習装置および方法、画像処理装置および方法、プログラム、並びに記録媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2010083601A JP2011217140A (ja) 2010-03-31 2010-03-31 係数学習装置および方法、画像処理装置および方法、プログラム、並びに記録媒体

Publications (1)

Publication Number Publication Date
JP2011217140A true JP2011217140A (ja) 2011-10-27

Family

ID=44946423

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2010083601A Withdrawn JP2011217140A (ja) 2010-03-31 2010-03-31 係数学習装置および方法、画像処理装置および方法、プログラム、並びに記録媒体

Country Status (1)

Country Link
JP (1) JP2011217140A (ja)

Similar Documents

Publication Publication Date Title
US8031267B2 (en) Motion adaptive upsampling of chroma video signals
EP1742472A2 (en) Image processing apparatus, image processing method, and program
US20050111749A1 (en) Data converting apparatus, data converting method, learning apparatus, leaning method, program, and recording medium
JP2000115716A (ja) 映像信号の変換装置および変換方法、並びにそれを使用した画像表示装置およびテレビ受信機
US20110235934A1 (en) Image processing apparatus, image processing method, and program
JP2011217010A (ja) 係数学習装置および方法、画像処理装置および方法、プログラム、並びに記録媒体
JP2010118940A (ja) 画像処理装置、画像処理方法、及びプログラム
JP2011217140A (ja) 係数学習装置および方法、画像処理装置および方法、プログラム、並びに記録媒体
US8139153B2 (en) Method for generating distances representative of the edge orientations in a video picture, corresponding device and use of the method for deinterlacing or format conversion
JP2010073075A (ja) 画像信号処理装置、画像信号処理方法
JP4770704B2 (ja) 画像処理装置、画像処理方法、およびプログラム
JP5029869B2 (ja) 画像処理装置および画像処理方法、学習装置および学習方法、並びにプログラム
JP4770711B2 (ja) 画像処理装置、画像処理方法、およびプログラム
JP4712495B2 (ja) 走査変換装置及びプログラム
JP5050944B2 (ja) 画像処理装置、画像処理方法、学習装置、学習方法、及びプログラム
JP2011217011A (ja) 係数学習装置および方法、画像処理装置および方法、プログラム、並びに記録媒体
JP2005236634A (ja) 画像処理装置および画像処理方法、プログラム、並びに記録媒体
JP2005260309A (ja) 順次走査変換方法
JP4237170B2 (ja) 画像処理装置および画像信号変換方法
JP4752130B2 (ja) 画像処理装置および方法、記録媒体、並びにプログラム
JP4273979B2 (ja) 情報処理装置および方法、記録媒体、並びにプログラム
JP2007235312A (ja) 画像信号処理装置および方法、学習装置および方法、プログラム、並びに記録媒体
JP4311038B2 (ja) 学習装置および方法、画像処理装置および方法、記録媒体、並びにプログラム
JP4957280B2 (ja) 画像処理装置、画像処理方法、およびプログラム
JP2010039364A (ja) 画像表示装置および画像表示方法、画像処理装置および画像処理方法、並びにプログラム

Legal Events

Date Code Title Description
A300 Withdrawal of application because of no request for examination

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 20130604