JP2011211437A - 画像処理装置および方法、並びにプログラム - Google Patents

画像処理装置および方法、並びにプログラム Download PDF

Info

Publication number
JP2011211437A
JP2011211437A JP2010076303A JP2010076303A JP2011211437A JP 2011211437 A JP2011211437 A JP 2011211437A JP 2010076303 A JP2010076303 A JP 2010076303A JP 2010076303 A JP2010076303 A JP 2010076303A JP 2011211437 A JP2011211437 A JP 2011211437A
Authority
JP
Japan
Prior art keywords
pixel
image
output
coefficient
tap
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP2010076303A
Other languages
English (en)
Inventor
Noriaki Takahashi
紀晃 高橋
Takahiro Nagano
隆浩 永野
Yasuhiro Shudo
泰広 周藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Corp
Original Assignee
Sony Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Corp filed Critical Sony Corp
Priority to JP2010076303A priority Critical patent/JP2011211437A/ja
Priority to US13/052,323 priority patent/US20110235934A1/en
Publication of JP2011211437A publication Critical patent/JP2011211437A/ja
Withdrawn legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N7/00Television systems
    • H04N7/01Conversion of standards, e.g. involving analogue television standards or digital television standards processed at pixel level
    • H04N7/0125Conversion of standards, e.g. involving analogue television standards or digital television standards processed at pixel level one of the standards being a high definition standard
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N5/00Details of television systems
    • H04N5/14Picture signal circuitry for video frequency region
    • H04N5/21Circuitry for suppressing or minimising disturbance, e.g. moiré or halo
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N7/00Television systems
    • H04N7/01Conversion of standards, e.g. involving analogue television standards or digital television standards processed at pixel level
    • H04N7/0135Conversion of standards, e.g. involving analogue television standards or digital television standards processed at pixel level involving interpolation processes
    • H04N7/0145Conversion of standards, e.g. involving analogue television standards or digital television standards processed at pixel level involving interpolation processes the interpolation being class adaptive, i.e. it uses the information of class which is determined for a pixel based upon certain characteristics of the neighbouring pixels

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Editing Of Facsimile Originals (AREA)
  • Image Processing (AREA)
  • Facsimile Image Signal Circuits (AREA)

Abstract

【課題】画質を向上させるとともに、簡単な構成で多様な変換パターンに対応できる画質変換処理を実現することができるようにする。
【解決手段】無限の拡大倍率に対応する予測係数、変換情報などを統合データベースに記憶しておき、統合データベースから拡大倍率に応じた予測係数、変換情報などを算出する。被写体の画像が1.5倍、2倍、2.5倍、3倍の各拡大倍率に対応するサイズの画素によって表示される。便宜上3行3列の矩形により各拡大倍率に対応する画像が示されており、各矩形の大きさが上述の画素のサイズを意味する。1.5倍(「×1.5」)、2倍(「×2.0」)、2.5倍(「×2.5」)、3倍(「×3.0」)の拡大倍率に対応する予測係数を個々に記憶せず、統合データベースに記憶された情報に基づいて、各拡大倍率に対応する予測係数が算出される。
【選択図】図4

Description

本発明は、画像処理装置および方法、並びにプログラムに関し、特に、画質を向上させるとともに、簡単な構成で多様な変換パターンに対応できる画質変換処理を実現することができるようにする画像処理装置および方法、並びにプログラムに関する。
従来より統計学習を用いた、画像の拡大変換が知られている。例えば、低解像度の画像と高解像度の画像のペア(学習対)を事前に用意し、両者の対応関係を統計的に学習して変換テーブルを作成する。入力画像に対してこの変換テーブルを利用した変換処理を施すことで高精細な拡大変換が可能になる.
また、ノイズなど劣化を含んだ入力画像からノイズのない画像を予測したり、SD信号を高解像度のHD信号に変換するために、クラス分類適応処理を用いる手法が提案されている(例えば、特許文献1参照)。
特許文献1の技術により、SD信号をHD信号に変換する場合、まず、入力SD信号からなるクラスタップの特徴を、ADRC(適応的ダイナミックレンジ符号化)等を用いて求め、得られたクラスタップの特徴に基づいてクラス分類を行う。そして、そのクラス毎に用意された予測係数と、入力SD信号からなる予測タップとの演算を行うことによって、HD信号を得る。
クラス分類は、予測値を求めようとする高S/N画素の位置に対応する低S/N画像の位置から空間的または時間的に近い位置にある低S/N画素の画素値のパターンによって、各高S/N画素を、いわばグループ分けするものであり、適応処理は、各グループ(上述のクラスに相当する)ごとに、そのグループに属する高S/N画素に対して、より適した予測係数を求めて、その予測係数により、画質の向上を図るものであるから、クラス分類は、基本的には、予測値を求めようとする高S/N画素に関係する、より多くの画素からクラスタップを構成して行うのが望ましい。
しかし、低解像度画像を高解像度画像に拡大する際に、決まった単一の倍率での拡大だけでなく、多くの倍率の拡大に対応しようとした場合、その倍率のパターン分の変換テーブルが必要になる。
そこで、出願人は、予め複数の離散的な倍率の変換テーブルを用意しておき、線形補間によって中間倍率での変換結果を求めたり、変換テーブル間の線形回帰により中間の変換テーブルを作成する手法を提案した(例えば、特許文献2参照)。
特開平7−79418号公報 特開2004−191856号公報
しかしながら、特許文献2のようにして中間倍率での拡大を行っても、直接学習で求めた変換テーブルを使用した場合と比較すると画質的な低下が避けられない。
また超高倍率の拡大変換などのように予め学習対が用意できない場合、従来の手法では対応できない。
本発明はこのような状況に鑑みてなされたものであり、画質を向上させるとともに、簡単な構成で多様な変換パターンに対応できる画質変換処理を実現することができるようにするものである。
本発明の一側面は、出力画素の座標である出力位相、前記出力画素のサイズ、および集光モデルに用いられる変数を含むパラメータを入力するパラメータ入力手段と、入力画像の中で前記出力位相に対応する注目画素および周辺画素の画素値からなるタップを抽出するタップ抽出手段と、前記パラメータと、予め記憶されている係数構成値とを用いて前記タップの要素のそれぞれに乗じられる予測係数を算出する予測係数算出手段と、前記算出された予測係数と、前記タップの要素のそれぞれとの積和演算により出力画素の値を演算する画素値演算手段とを備える画像処理装置である。
前記係数構成値を記憶するデータベースをさらに備え、前記データベースは、前記係数構成値を、前記タップの要素を識別する情報に対応づけて記憶するようにすることができる。
前記入力画像の注目画素周辺の画像を、予め定められた方式で複数のクラスのいずれかに分類するクラス分類手段をさらに備え、前記データベースは、前記係数構成値を、前記クラス毎に記憶するようにすることができる。
前記出力画素により構成される出力画像は、前記入力画像より解像度の高い画像であるようにすることができる。
前記パラメータとして入力される前記出力画素のサイズは、前記出力画像の解像度によって定まるようにすることができる。
前記出力画像より解像度の高い無限解像度画像の複数の画素の値を前記集光モデルにより表わされる集光特性に応じて積分した値を前記出力画素の値と近似して、前記予測係数を前記パラメータと前記係数構成値とを有する関数により記述し、前記データベースは、解像度の高い教師画像と解像度の低い生徒画像を用いて予め学習された予測係数と、前記関数に基づいて求められた前記係数構成値を記憶するようにすることができる。
前記集光モデルは、ガウシアンモデルであるようにすることができる。
前記集光モデルは、サーキュラモデルであるようにすることができる。
本発明の一側面は、パラメータ入力手段が、出力画素の座標である出力位相、前記出力画素のサイズ、および集光モデルに用いられる変数を含むパラメータを入力し、タップ抽出手段が、入力画像の中で前記出力位相に対応する注目画素および周辺画素の画素値からなるタップを抽出し、予測係数算出手段が、前記パラメータと、予め記憶されている係数構成値とを用いて前記タップの要素のそれぞれに乗じられる予測係数を算出し、画素値演算手段が、前記算出された予測係数と、前記タップの要素のそれぞれとの積和演算により出力画素の値を演算するステップを含む画像処理方法である。
本発明の一側面は、コンピュータを、出力画素の座標である出力位相、前記出力画素のサイズ、および集光モデルに用いられる変数を含むパラメータを入力するパラメータ入力手段と、入力画像の中で前記出力位相に対応する注目画素および周辺画素の画素値からなるタップを抽出するタップ抽出手段と、前記パラメータと、予め記憶されている係数構成値とを用いて前記タップの要素のそれぞれに乗じられる予測係数を算出する予測係数算出手段と、前記算出された予測係数と、前記タップの要素のそれぞれとの積和演算により出力画素の値を演算する画素値演算手段とを備える画像処理装置として機能させるプログラムである。
本発明の一側面においては、出力画素の座標である出力位相、前記出力画素のサイズ、および集光モデルに用いられる変数を含むパラメータが入力され、入力画像の中で前記出力位相に対応する注目画素および周辺画素の画素値からなるタップが抽出され、前記パラメータと、予め記憶されている係数構成値とを用いて前記タップの要素のそれぞれに乗じられる予測係数が算出され、前記算出された予測係数と、前記タップの要素のそれぞれとの積和演算により出力画素の値が演算される。
本発明によれば、画質を向上させるとともに、簡単な構成で多様な変換パターンに対応できる画質変換処理を実現することができる。
従来の画像処理装置の構成例を示すブロック図である。 予測係数の学習を説明する図である。 拡大倍率に応じた学習対の例を説明する図である。 本発明による予測係数の算出の例を説明する図である。 低解像度画像と無限解像度画像と高解像度画像の関係を説明する図である。 高解像度画像の画素がどのように構成されているかを説明する図である。 低解像度画像を拡大倍率「5×5」で拡大変換する場合の例を説明する図である。 式(3)、式(7)、式(8)における(i,j)の組み合わせを説明する図である。 低解像度画像を拡大倍率「3×5」で拡大変換する場合の例を説明する図である。 サーキュラモデルを説明する図である。 集光モデルにサーキュラモデルを採用した場合の図6に対応する図である。 本発明の一実施の形態に係る画像処理装置の構成例を示すブロック図である。 図12の画像処理装置により実行される拡大変換処理の例を説明する図である。 本発明による予測係数の算出の別の例を説明する図である。 本発明によって、より高画質の拡大変換を実現する方式を説明する図である。 図15に示される方式により拡大変換処理を行った場合の効果を説明する図である。 本発明の画像処理装置を搭載したテレビジョン受像機の構成例を示すブロック図である。 パーソナルコンピュータの構成例を示すブロック図である。
以下、図面を参照して、本発明の実施の形態について説明する。
最初に従来の技術による画像の拡大変換について説明する。図1は、従来の画像処理装置10の構成例を示すブロック図である。同図に示される画像処理装置10は、例えば、低解像度の画像Lが入力画像として入力され、画像Lの所定の画素に基づいて高解像度Hの画素Hhを生成して出力画像として出力するものとされる。すなわち、画像処理装置10により画像の拡大変換が行われる。
入力画像は、クラスタップ抽出部21に供給され、注目画素が設定される。クラスタップ抽出部21は、例えば、注目画素値およびその周辺画素値などとして構成されるクラスタップLを抽出するようになされている。クラスタップは、例えば、数次元から数十次元のベクトルとなる。
クラス分類部22は、抽出されたクラスタップを解析することにより、当該クラスタップを所定のクラス(class)に分類し、クラスを決定する。
予測係数決定部23は、入力画像の注目画素に対応する出力画像の画素位置h(位相とも称される)の画素を生成するために必要となる予測係数であって、クラス分類部22により決定されたクラスに対応する予測係数を記憶部(ROMなど)から読み出すようになされている。なお、予測係数ωclass,k(h,rzoom)は、画像の拡大倍率rzoomと出力画像の画素の位相h応じてクラス毎に予め記憶されており、予測タップと同数の要素を有するベクトルとされる。
予測タップ抽出部24は、クラス分類部22により決定されたクラスに対応して予め定められた予測タップを、入力画像から抽出する。予測タップLclass,kは、注目画素値およびその周辺画素値などとして構成され、この例では、k個の要素を有するベクトルであるものとする。
予測処理部25は、予測タップ抽出部24から供給された予測タップの要素のそれぞれと、予測係数決定部23から供給された予測係数の要素のそれぞれとの積和演算を行うことにより、高解像度画像の所定の画素Hhを生成して出力するようになされている。
例えば、高解像度画像の画素位置hの画素値を算出する場合、予測タップが注目画素を中心とする9個の画素の画素値とされるとき、次のように演算される。予測係数決定部23により出力画像の画素の位相が画素位置hである場合の予測係数が読み出される。そして、予測係数の第1番目の要素と予測タップの第1番目の要素との積が演算され、予測係数の第2番目の要素と予測タップの第2番目の要素との積が演算され、・・・予測係数の第9番目の要素と予測タップの第9番目の要素との積が演算される。さらにこれらの積の和が算出されて高解像度画像の画素Hhの画素値とされる。
また、例えば、高解像度画像の画素位置iの画素値を算出する場合、予測係数決定部23により出力画像の画素の位相が画素位置iである場合の(9個の要素からなる)予測係数が読み出されて上述の演算がなされる。
例えば、拡大倍率が「5×5」であった場合、入力画像の1画素を注目画素とする予測タップから、出力画像の画素25個の画素値が算出される。この場合、出力画像の画素の位相は25通り存在するので、同一のクラスに分類された予測係数は、出力画像の画素の位相に応じて25通り用意される。そして、予測タップの要素が9個あるので、25個の予測係数のそれぞれが9個の要素を有することになる。
従来、このようにして、画像の拡大変換が行われていた。
従来用いられていた予測係数は、生徒画像と教師画像との組み合わせからなる学習対に基づいて生成される。図2は、予測係数の学習を説明する図である。同図に示されるように、高解像度の画像である教師画像と、教師画像の画素数を縮退させるなどして得られた低解像度の画像である生徒画像に基づいて、予測係数の学習が行われる。なお、図中において、低解像度の画像の面積が、高解像度の画像の面積と比較して小さくなるように記載されている。
例えば、教師画像の画素値を真値とし、生徒画像から抽出されたタップと真値の組み合わせからなる複数のサンプルを取得して、タップをパラメータとして真値を算出するための線形一次式の係数を、予測係数として学習する。学習された予測係数は、データベースに記憶される。なお、データベースには、予測係数とともに、例えば、クラスタップの抽出方式などの変換情報が必要に応じて記憶される。
このように、学習対を用いて予測係数を学習する場合、拡大倍率に応じた学習対を用意する必要がある。例えば、1.5倍、2倍、2.5倍、3倍の拡大倍率での拡大変換を行う画像処理装置を構成する場合、それらの拡大倍率に応じたデータベースをそれぞれ用意しておく必要がある。例えば、図3に示されるように、1.5倍(「×1.5」)、2倍(「×2.0」)、2.5倍(「×2.5」)、3倍(「×3.0」)の拡大倍率に対応する生徒画像と教師画像との組み合わせを用意し、それらの学習対に基づいて予測係数を学習しておく必要がある。
このようにすると、拡大倍率1.5倍用の予測係数等を記憶するデータベース、拡大倍率2倍用の予測係数等を記憶するデータベース、・・・をそれぞれ用意しておく必要があり、コスト増などの要因となる。
そこで、本発明では、拡大倍率に係らず用いることが可能な予測係数、変換情報などを記憶した統合データベースを用意することにする。
本発明では、各拡大倍率の画像は、被写体の画像が集光特性に応じて積分されたものと考える。すなわち、現実の被写体は、無限の拡大倍率の画像であると考え、高解像度画像や低解像度画像の画素は、無限の拡大倍率の画像の画素が複数集まって構成されているものと考える。なお、無限の拡大倍率の画像を、無限解像度画像と称することにする。
上述した考え方のもと、本発明では、例えば、図4に示されるように、無限の拡大倍率に対応する予測係数、変換情報などを統合データベースに記憶しておき、統合データベースから拡大倍率に応じた予測係数、変換情報などを算出するようにする。
図4では、被写体の画像が1.5倍、2倍、2.5倍、3倍の各拡大倍率に対応するサイズの画素によって表示される例を表している。なお、図中では、便宜上3行3列の矩形により各拡大倍率に対応する画像が示されており、各矩形の大きさが上述の画素のサイズを意味することになる。また、同図は、1.5倍(「×1.5」)、2倍(「×2.0」)、2.5倍(「×2.5」)、3倍(「×3.0」)の拡大倍率に対応する予測係数を個々に記憶せず、統合データベースに記憶された情報に基づいて、各拡大倍率に対応する予測係数が算出されることを表している。
以下に、この方式の詳細について説明する。
本発明では、無限解像度画像の各画素値は、画素位置の座標R=(Rx,Ry)を変数とする連続関数G(R)によって記述できるものとする。無限解像度画像の各画素値は、低解像度画像の画素値Lkを用いて式(1)により表わされる。
Figure 2011211437
式(1)において、予測タップは、低解像度画像の注目画素を中心とするk個の画素の画素値からなるベクトルとされ、Nはタップの要素数を表し、kはそれらの要素の番号を意味するものとする。また、式(1)において、予測係数はk個の要素を有するベクトルとして構成され、予測係数のk番目の要素がWkとして表わされている。なお、予測係数の各要素は、従来の方式のものと同様に、出力画像(いまの場合、無限解像度画像)の所定の画素位置の画素を生成するためのものとして与えられるものなので、画素位置の座標Rを変数として記述されている。
ここで、低解像度画像より解像度が高く、無限解像度画像より解像度が低い高解像度画像の画素値Hh(画素Hhの値を意味する)を考える。上述したように、高解像度画像の画素値は、無限解像度画像の画素値が集光特性に応じて積分されたものと考えると、連続関数G(R)と座標r=(rx,ry)を変数とする集光モデルS(r)と積算・積分により得られることになる。なお、座標rは、無限解像度画像の座標Rを中心とする相対座標とされる。
すなわち、図5に示されるように、高解像度画像の画素値Hhは、低解像度画像の画素値Lkを用いて予測された画素値G(R)から、集光モデルS(r)を用いて算出されることになる。
同図においては、無限解像度画像の座標は点で表わされるものとし、図中の中央に示されている。また、低解像度画像は、単位面積の画像が9(=3×3)個の画素で構成されるものとし、図中の左側に示されている。さらに、高解像度画像は、単位面積の画像が36(=6×6)個の画素で構成されるものとし、図中の右側に示されている。
なお、図5において、集光モデルS(r)は、ガウシアンモデルの重み係数を表す三次元空間の図として表現されており、図中右下側に示されている。同図に示されるように、無限解像度画像のxy平面における座標を基準として考えると、低解像度画像の画素はより面積の大きい平面であり、高解像度画像の画素はより面積の小さい平面であるにすぎない。つまり、出力画素値Hhの画素は、無限解像度画像のxy平面における座標Rを中心とした、所定の面積を有する平面を意味することになる。
従って、高解像度画像の画素値Hhは、式(1)を用いて式(2)のように近似できる。
Figure 2011211437
また、本発明では式(1)で用いた予測係数の各要素Wk(R)を、式(3)に示されるように、直交関数の積和式で近似するものとする。ここでは、直交関数の例として余弦関数を用いることにする。なお、式(3)におけるnの値はできるだけ大きくすることが望ましい。
Figure 2011211437
そうすると、式(2)におけるDkは、高解像度画像の画素の中心座標R、高解像度画像の画素サイズZ、集光モデルS(r)におけるガウシアンパラメータσを変数として、式(4)により近似される。なお、Dkは、予測係数と同様に複数の要素からなるベクトルの1要素を表しており、このベクトルを新予測係数と称することにする。なお、式(4)におけるa、b、c、dの値のそれぞれは、画素サイズZに応じて定まるものとされる。
Figure 2011211437
ここで、高解像度画像の画素(画素値Hhの画素)は、図6に示されるように構成されているものとする。すなわち、高解像度画像の画素は、無限解像度画像のxy平面における座標Rを中心とし、水平方向にZx、垂直方向Zyの長さを有する矩形で表わされるものとする。同図において、高解像度画像の画素である矩形の四隅の点が、それぞれ無限解像度画像のxy平面における座標(a,d)、(b,d)、(a,c)、(b,c)で表わされている。なお、図中の円の半径がガウシアンパラメータσを表す。
図6の画素サイズZは、例えば、図5を参照して上述した高解像度画像の画素の平面の大きさを意味し、図6のガウシアンパラメータσは、例えば、図5を参照して上述した集光モデルに用いられるパラメータ(変数)を意味する。従って、画素サイズZは、例えば、表示装置などに実装された実際の画素の大きさを意味するものではなく、画像の解像度に応じて定まるものである。同様に、ガウシアンパラメータσも、表示装置などの実装に対応した実際の集光特性にかかわらず、例えば、解像度を変換して得られる出力画像の特性として適切な値を任意に設定できるものとしてよい。
図6から、式(4)におけるa、b、c、dの値のそれぞれは、式(5)により導出することが可能である。
Figure 2011211437
式(4)に示される新予測係数の要素Dk(R,Z,σ)のそれぞれを、例えば、図2を参照して上述した従来の方式により学習された予測係数の要素のそれぞれと等しいものとして等式を生成する。そして、学習に用いられた生徒画像と教師画像に基づいて特定することが可能な座標R、画素サイズZ、ガウシアンパラメータσを代入して連立式を解くことにより、式(4)におけるwijkを求めることができる。
本発明では、式(4)におけるwijkをそれぞれ求めて統合データベースに記憶するようにする。
図7を参照して詳細に説明する。図7は、低解像度画像を拡大倍率「5×5」で拡大変換する場合の例を説明する図である。
同図の図中左側に示される9個の矩形が入力画像(低解像度画像)のタップを表している。この例では、「L0」乃至「L8」の符号が付された矩形により入力画像の各画素が示されている。また、入力画像における注目画素が図中「L4」の符号が付された矩形で示される画素とされ、注目画素を中心とした9(=3×3)個の画素の画素値のそれぞれがタップとされている。
また、この例では、入力画像の注目画素(「L4」の符号が付された矩形)に対応して図中右側に示される25(=5×5)個の高解像度画像の画素が生成されるものとする。図7中右側に示された25個の矩形が、注目画素に対応して生成される高解像度画像の画素のそれぞれを表している。なお、各矩形内に示される黒い円は、各画素の中心位置を表している。また、図中の最も左上の画素が画素H0とされ、順番に符号が付されて図中の最も右下の画素が画素H24とされている。
なお、図7においては、図中右側の高解像度画像の画素群の4隅の座標のそれぞれを、便宜上(0,1)、(1,1)、(0,0)、(1,0)で表わしている。また、同図の高解像度画像は、低解像度画像の1画素に対応する平面に高解像度画像の画素を25(=5×5)個生成するものだから、画素サイズZのx成分、y成分ともに0.2(=1/5)となる。これにより、画素H0の中心位置の座標は、(0.1,0.9)と特定することができる。同様に、画素H1の中心位置の座標は、(0.3,0.9)と特定され、・・・画素H24の中心位置の座標は、(0.9,0.1)と特定される。
いま、予め学習によって求めた予測係数の各要素ωhkと入力画像から抽出された予測タップの各要素Lkと用いて、高解像度画像の画素値Hhを、式(6)により求めることができるものとする。
Figure 2011211437
式(6)に用いられている予測係数の各要素ωhkは、式(4)によって近似された新予測係数の各要素と等しいものだから、式(7)が成立する。なお、式(7)は、新予測係数Dk(R,Z,σ)のパラメータである座標Rを、高解像度画像の画素H0の中心位置とした場合のものであり、高解像度画像の画素H0を求めるための予測係数の各要素は、要素ω0kとして表わされている。
Figure 2011211437
また、式(6)におけるa0、b0、c0、d0は、それぞれ高解像度画像の画素H0に対応する矩形平面の4隅の座標を表すものであり、画素H0の中心位置の座標(0.1,0.9)と、画素サイズZを式(5)に代入して求めることができる。
このように、式(6)に用いられている予測係数の要素ωhkのそれぞれを、式(4)によって近似された新予測係数の要素のそれぞれと等しいものとし、式(8)に示されるような連立式を得ることができる。式(6)の予測係数の要素ωhkにおけるhは高解像度画像の画素位置を表すものであり、25通りのhが存在するので、25個の式からなる連立式を得ることができる。
Figure 2011211437
なお、式(8)における予測係数の要素ωhkのそれぞれは、例えば、図2を参照して上述した従来の方式により予め学習された予測係数の要素のそれぞれとされる。
いま、式(3)、式(7)、式(8)において採用するnの値を6とする。そうすると、式(3)、式(7)、式(8)における(i,j)の組み合わせは、図8に示される通りとなる。
図8に示されるように、nが6である場合、iの値は0から5までの整数となる。iが0の場合、jの値は0から5までの整数となり、iが1の場合、jの値は0から4までの整数となり、・・・iが5の場合、jの値は0のみとなる。
図8に示されるように、式(3)、式(7)、式(8)において採用するnの値を6とすると、(i,j)の組み合わせは21通りとなる。すなわち、式(8)に示される25個の式からなる連立式において、21個のwijkが未知数となる。
よって、例えば、式(8)に示される連立式の誤差項を最小にするように、最小二乗法によって、21個のwijkを導出することが可能となる。このようにして、kの値毎に21個のwijkを導出していく。
例えば、このようにして導出されたwijkの値をそれぞれ統合データベースに記憶する。上述の例の場合、kは予測タップの要素数と同数の9通りあるから、189(=21×9)個のwijkの値がそれぞれ統合データベースに記憶される。
統合データベースに記憶されたwijkを用いることで、低解像度画像の画素値から高解像度画像の画素値を求めることも可能となる。このようなwijkを係数構成値と称することにする。
なお、係数構成値はクラス毎に分類されて統合データベースに記憶される。すなわち、入力画像から抽出されたクラスタップに基づくクラス分類の結果に応じた係数構成値が統合データベースに記憶される。例えば、式(7)、式(8)に用いられる予測係数の各要素ωhkは予め学習によって求められたものなので、その学習において分類されたクラスと係数構成値とが対応づけられるようにすればよい。
ここで、統合データベースに記憶される係数構成値の詳細について、予測係数を記憶する場合と比較しながら説明する。
従来の画像処理装置において記憶されている予測係数は、クラス毎に分類されて、出力画像の位相に対応づけられて記憶されていた。例えば、9個の画素値からなる予測タップを用いて、低解像度画像を拡大倍率「5×5」で拡大変換する場合、次のような予測係数が記憶されることになる。この場合、1つの注目画素に対応する予測タップから画素値を算出すべき出力画像の位相として、例えば、位相0乃至位相24の25個の位相を考慮する必要がある。
クラスc1に分類された注目画素を中心とする予測タップに乗じられる予測係数の要素として、次の225個(=9×25)の要素が記憶される。
出力画像の位相0を求めるための予測タップの第1番目の要素に乗じられる要素ω01、位相0を求めるための予測タップの第2番目の要素に乗じられる要素ω02、・・・位相0を求めるための予測タップの第9番目の要素に乗じられる要素ω08が記憶される。
同様に、出力画像の位相1を求めるための予測タップの第1番目の要素に乗じられる要素ω11、位相1を求めるための予測タップの第2番目の要素に乗じられる要素ω12、・・・位相1を求めるための予測タップの第9番目の要素に乗じられる要素ω18が記憶される。
このように、出力画像の位相2乃至位相24をそれぞれ求めるための予測タップの第1番目乃至第9番目の要素も記憶される。
そして、同様に、クラスc2に分類された注目画素を中心とする予測タップに乗じられる予測係数の要素として、やはり225個(=9×25)の要素が記憶されている。よって、全体として、クラス数×225個の予測係数の要素が記憶されることになる。
本発明の場合、統合データベースに記憶されている係数構成値は、クラス毎に分類されて、予測係数(または予測タップ)の要素に対応づけられて記憶されている。例えば、9個の画素値からなる予測タップを用いて、低解像度画像を拡大倍率「5×5」で拡大変換する場合、次のような係数構成値が記憶されることになる。なお、式(3)、式(7)、式(8)において採用するnの値は6であるものとし、上述したように、(i,j)の組み合わせは、図8に示される21通りとなる。
クラスc1に分類された注目画素を中心とする予測タップに乗じられる予測係数の要素を算出するための係数構成値として、次の189(=21×9)個の係数構成値が記憶される。
出力画像の画素(位相0乃至位相24のいずれでもよい)を求めるための予測係数の第1番目の要素を算出するための係数構成値w001、予測係数の第1番目の要素を算出するための係数構成値w011、・・・予測係数の第1番目の要素を算出するための係数構成値w501が記憶される。
同様に、出力画像の画素(位相0乃至位相24のいずれでもよい)を求めるための予測係数の第2番目の要素を算出するための係数構成値w002、予測係数の第2番目の要素を算出するための係数構成値w012、・・・予測係数の第2番目の要素を算出するための係数構成値w502が記憶される。
このように、予測係数の第3番目乃至第9番目の要素のそれぞれを算出するための第1番目乃至第21番目の係数構成値も記憶される。
そして同様に、クラスc2に分類された注目画素を中心とする予測タップに乗じられる予測係数の要素を算出するための係数構成値として、やはり189個の係数構成値が記憶される。よって、クラス数×189個の係数構成値が記憶されることになる。
このように、本発明では、拡大倍率を任意に設定可能であるものの、記憶すべき情報の量は、従来の場合と比較して増大するものではない。よって、本発明によれば、簡単な構成で多様な変換パターンに対応できる画質変換処理を実現することができるのである。
上述のような統合データベースを用いて、低解像度画像の画素値から高解像度画像の画素値を求める場合、入力画像(低解像度画像)の解像度、出力すべき高解像度画像の画素数などから座標R、画素サイズZ、ガウシアンパラメータσを特定する。
そして、特定された座標R、画素サイズZ、ガウシアンパラメータσをパラメータとして式(4)に代入するとともに、統合データベースから読み出した係数構成値wijkを式(4)に代入することで新予測係数の要素Dk(R,Z,σ)を求めることができる。
このようにして求められた新予測係数の要素のそれぞれと、入力画像から抽出された予測タップの要素のそれぞれとの積和演算により、高解像度画像の画素値を得ることが可能となる。
図9を参照して詳細に説明する。図9は、低解像度画像を拡大倍率「3×3」で拡大変換する場合の例を説明する図である。
同図の図中左側に示される9個の矩形が入力画像(低解像度画像)のタップを表している。この例では、「L0」乃至「L8」の符号が付された矩形により入力画像の各画素が示されている。また、入力画像における注目画素が図中「L4」の符号が付された矩形で示される画素とされ、注目画素を中心とした9(=3×3)個の画素の画素値のそれぞれがタップとされている。
また、この例では、入力画像の注目画素(「L4」の符号が付された矩形)に対応して図中右側に示される9(=3×3)個の高解像度画像の画素が生成されるものとする。図9中右側に示された9個の矩形が、注目画素に対応して生成される高解像度画像の画素のそれぞれを表している。なお、各矩形内に示される黒い円は、各画素の中心位置を表している。また、図中の最も左上の画素が画素H0とされ、順番に符号が付されて図中の最も右下の画素が画素H8とされている。
なお、図9においては、図中右側の高解像度画像の画素群の4隅の座標のそれぞれを、便宜上(0,1)、(1,1)、(0,0)、(1,0)で表わしている。また、同図の高解像度画像は、低解像度画像の1画素に対応する平面に高解像度画像の画素を9(=3×3)個生成するものだから、画素サイズZのx成分、y成分ともに0.33=(1/3)となる。これにより、画素H0の中心位置の座標は、(1/6,5/6)と特定することができる。同様に、画素H1の中心位置の座標は、(3/6,5/6)と特定され、・・・画素H8の中心位置の座標は、(5/6,1/6)と特定される。
この場合、高解像度画像の画素H0の値を求めるために必要となる予測係数の各要素ω0kは、式(4)を用いて式(9)により求めることができる。
Figure 2011211437
なお、ここでは、高解像度画像の画素値を求めるために必要となる予測係数の各要素をωkとして表わしているが、これらの要素は、式(4)に示される新予測係数の要素Dkのそれぞれと同じものである。よって、式(9)により新予測係数の各要素が算出されると言い換えることもできる。
式(9)に、画素サイズZ、ガウシアンパラメータσをパラメータとして代入するとともに、統合データベースから読み出した係数構成値wijkを代入すれば、予測係数の各要素ω0kの値が算出される。このとき、拡大変換の倍率に係らず、統合データベースに記憶されている係数構成値wijkが全て用いられる。例えば、上述したように、189(=21×9)個の係数構成値がそれぞれ統合データベースに記憶されている場合、21個の係数構成値がそれぞれ式(9)に代入される。
例えば、要素ω00の値を算出するために、21個の係数構成値が式(9)に代入され、要素ω01の値を算出するために、別の21個の係数構成値が式(9)に代入され、要素ω02の値を算出するために、さらに別の21個の係数構成値が式(9)に代入される。このように、要素ω00乃至要素ω08を算出するために189個の係数構成値が用いられることになる。
なお、図7を参照して説明した場合と同様に、式(9)におけるa0、b0、c0、d0は、それぞれ高解像度画像の画素H0に対応する矩形平面の4隅の座標を表すものであり、画素H0の中心位置の座標と、画素サイズを式(5)に代入して求めることができる。
このようにして、81(=9×9)個の予測係数の各要素ω0kの値を求め、それら予測係数の要素のそれぞれと、入力画像から抽出された予測タップの要素のそれぞれとの積和演算により、高解像度画像の画素H0乃至画素H8の画素値のそれぞれを得ることが可能となる。
例えば、高解像度画像の画素H0の画素値をもとめる場合、低解像度画像の画素L0の画素値と予測係数の各要素ω00との積が演算され、低解像度画像の画素L1の画素値と予測係数の各要素ω01との積が演算され、・・・低解像度画像の画素L8の画素値と予測係数の各要素ω08との積が演算される。そしてそれらの積の値の和が演算されて高解像度画像の画素H0の画素値とされる(式(6)に示される演算と同じ)。
このような演算が9(画素H0乃至画素H8)回行われることにより、低解像度画像の画素L0乃至画素L8の画素値(予測タップ)に基づいて、高解像度画像の画素H0乃至画素H8の画素値のそれぞれを得ることができる。そして、入力画像の注目画素を別の画素とした予測タップを新たに抽出し、その予測タップに基づいて、別の9個の高解像度画像の画素値が演算されることになる。このような画素値の演算を繰り返すことにより、最終的には、入力画像を「3×3」の拡大倍率で拡大変換した出力画像が生成されることになる。
なお、式(9)においてガウシアンパラメータσの値を調整することにより、出力画像(高解像度画像)のぼけ感を調整することもできる。例えば、ガウシアンパラメータσの値を大きくするとぼけた画像が出力され、ガウシアンパラメータσの値を小さくするとぼけの少ないシャープな画像が出力される。
また、ここでは、集光特性を表すモデル(集光モデル)としてガウシアンモデルを用いる例について説明したが、ガウシアンモデルに代えてサーキュラモデルを採用することも可能である。
サーキュラモデルは、例えば、図5に示されるガウシアンモデルの場合と異なり、中心から半径Rcの円内での重み係数が一定となる。図10は、サーキュラモデルの重み係数を表す三次元空間の図である。
また、集光モデルにサーキュラモデルを採用する場合、図6は、図11に示されるように書き換えられる。図11においては、図中の円の半径がサーキュラの半径Rcとされている。
集光モデルにサーキュラモデルを採用する場合、式(2)におけるDkは、高解像度画像の画素の中心座標R、高解像度画像の画素サイズZ、集光モデルS(r)におけるサーキュラの半径Rcを変数として、式(10)により近似される。
Figure 2011211437
なお、式(10)における関数J0(x)は、零次ベッセル関数である。
式(10)に示される新予測係数の要素Dk(R,Z,Rc)のそれぞれを、例えば、図2を参照して上述した従来の方式により学習された予測係数の要素のそれぞれと等しいものとして、式(10)における係数構成値wijkを求めるようにしてもよい。
この他、集光モデルに画素積分モデルを採用するようにしてもよい。画素積分モデルは、式(11)により定義されるモデルである。このモデルは、矩形の画素を想定し、式(11)のZxとZyはそれぞれ画素の水平方向の長さと垂直方向の長さを表している。
Figure 2011211437
一方、ガウシアンモデルは、式(12)により定義される。
Figure 2011211437
さらにサーキュラモデルは式(13)により定義される。
Figure 2011211437
このように、集光モデルを他のモデルに置き換えても、本発明による拡大変換処理を行うことが可能である。
図12は、本発明の一実施の形態に係る画像処理装置100の構成例を示すブロック図である。同図に示される画像処理装置100は、例えば、低解像度の画像Lが入力画像として入力され、画像Lの所定の画素に基づいて高解像度Hの画素Hhを生成して出力画像として出力するものとされる。すなわち、画像処理装置100により画像の拡大変換が行われる。
入力画像は、クラスタップ抽出部121に供給され、注目画素が設定される。クラスタップ抽出部121は、例えば、注目画素値およびその周辺画素値などとして構成されるクラスタップLを抽出するようになされている。クラスタップは、例えば、数次元から数十次元のベクトルとなる。
クラス分類部122は、抽出されたクラスタップを解析することにより、当該クラスタップを所定のクラス(class)に分類し、クラスを決定する。
予測タップ抽出部124は、クラス分類部122により決定されたクラスに対応して予め定められた予測タップを、入力画像から抽出する。予測タップLclass,kは、注目画素値およびその周辺画素値などとして構成され、この例では、k個の要素を有するベクトルであるものとする。
なお、クラスタップ抽出部121、クラス分類部122、および予測タップ抽出部124のそれぞれは、図1に示される従来の画像処理装置10のクラスタップ抽出部21、クラス分類部22、および予測タップ抽出部24と同様のものである。
上述したように、本発明では、式(8)における予測係数の要素ωhkのそれぞれは、例えば、図2を参照して上述した従来の方式により予め学習された予測係数の要素のそれぞれとされて、式(8)の連立式を解く。従って、例えば、図1に示される従来の画像処理装置10に用いられる予測係数の要素を式(8)に代入して連立式を解いて求めた係数構成値wijkが統合データベースに記憶されている場合、画像処理装置10と同様のクラス分類とタップの抽出を行えばよい。
例えば、クラスタップ抽出部21が25個の画素値からなるクラスタップを取得し、クラス分類部22が方式Aでクラス分類し、予測タップ抽出部24が9個の画素値からなる予測タップを抽出するものである場合、クラスタップ抽出部121が25個の画素値からなるクラスタップを取得し、クラス分類部122が方式Aでクラス分類し、予測タップ抽出部124が9個の画素値からなる予測タップを抽出するようにする。
また、例えば、クラスタップ抽出部21が9個の画素値からなるクラスタップを取得し、クラス分類部22が方式Bでクラス分類し、予測タップ抽出部24が25個の画素値からなる予測タップを抽出するものである場合、クラスタップ抽出部121が9個の画素値からなるクラスタップを取得し、クラス分類部122が方式Bでクラス分類し、予測タップ抽出部124が25個の画素値からなる予測タップを抽出するようにする。
予測係数決定部123は、入力画像の注目画素に対応する出力画像の画素位置hの画素を生成するために必要となる係数構成値であって、クラス分類部122により決定されたクラスに対応する係数構成値を統合データベース127から読み出すようになされている。この例では、係数構成値wclass,ijkが予測係数決定部123により読みだされて予測係数算出部126に供給されている。
そして、予測係数算出部126は、予測係数決定部123から供給される係数構成値と、座標R、画素サイズZ、ガウシアンパラメータσに基づいて新予測係数の各要素を算出する。このとき、例えば、式(4)を参照して上述した演算が行われる。
なお、座標R、画素サイズZ、ガウシアンパラメータσは、拡大変換における倍率、出力画像の特性などに基づいて予め特定されているものとする。
予測処理部125は、予測タップ抽出部124から供給された予測タップの要素のそれぞれと、予測係数算出部126から供給された新予測係数の要素のそれぞれとの積和演算を行うことにより、高解像度画像の所定の画素Hhを生成して出力するようになされている。
このようにして、本発明による画像の拡大変換が行われる。
次に、図13のフローチャートを参照して、図12の画像処理装置100による拡大変換処理の例について説明する。この処理は、例えば、低解像度の画像Lが入力画像として入力され、画像Lの所定の画素に基づいて高解像度Hの画素を生成して出力画像として出力することが指令されたとき実行される。
ステップS21において、予測係数算出部126は、パラメータの入力を受け付ける。ここで、パラメータは、例えば、生成すべき高解像度画像の画素値の座標R、画素サイズZ、ガウシアンパラメータσとされる。なお、座標R、画素サイズZ、ガウシアンパラメータσは、例えば、ユーザによって、拡大変換における倍率、出力画像の特性などに基づいて特定されるものとする。
ステップS22において、クラスタップ抽出部121は入力画像から、例えば、注目画素値およびその周辺画素値などとして構成されるクラスタップを抽出する。
ステップS23において、クラス分類部122は、ステップS22の処理で抽出されたクラスタップを解析することにより、当該クラスタップを所定のクラスに分類し、クラスを決定する。
ステップS24において、予測係数決定部123は、入力画像の注目画素に対応する出力画像の所定の画素位置の画素を生成するために必要となる係数構成値であって、ステップS23の処理で決定されたクラスに対応する係数構成値を統合データベース127から読み出す。
ステップS25において、予測係数算出部126は、ステップS24の処理で予測係数決定部123から供給される係数構成値と、ステップS21で受け付けた座標R、画素サイズZ、ガウシアンパラメータσに基づいて新予測係数の各要素を算出する。このとき、例えば、式(4)を参照して上述した演算が行われる。
ステップS26において、予測タップ抽出部124は、ステップS23でクラス分類部122により決定されたクラスに対応して予め定められた予測タップを、入力画像から抽出する。予測タップは、注目画素値およびその周辺画素値などとして構成される。
なお、予測タップ抽出部124による予測タップの抽出は、ステップS23の処理の後、ステップS24の処理の前、またはステップS25の処理の前に実行されるようにしてもよい。
ステップS27において、予測処理部125は、ステップS26で予測タップ抽出部124から供給された予測タップの要素のそれぞれと、ステップS25で予測係数算出部126から供給された新予測係数の要素のそれぞれとの積和演算を行う。これにより、拡大変換後の画像(高解像度画像)の所定の画素の画素値が演算されて画素が生成される。
ステップS28において、出力画像の全画素値が演算されたか否かが判定される。
ステップS26において、まだ、全画素値が演算されていないと判定された場合、処理は、ステップS22に戻り、それ以降の処理が繰り返し実行される。
ステップS26において、出力画像の全画素値が演算されたと判定された場合、処理は、終了する。
このようにして拡大変換処理が実行される。
このように、本発明によれば、任意の拡大倍率で自在に拡大変換を行うことが可能となる。
例えば、図14に示されるように、1.5倍(「×1.5」)と2.5倍(「×2.5」)の拡大倍率に対応する生徒画像と教師画像との組み合わせを用意し、それらの学習対に基づいて予測係数を学習すれば、2倍、3倍の拡大倍率での拡大変換も行うことが可能となる。
なお、図14は、2倍(「×2.0」)の拡大倍率および3倍(「×3.0」)の拡大倍率における生徒画像と教師画像の学習対を用意できなかった場合を表している。そして、このような場合でも、統合データベースに記憶された情報を用いれば、2倍または3倍の拡大倍率に対応する予測係数を生成できることを表している。
すなわち、統合データベースに記憶されている係数構成値を用いて式(4)の演算を行えば、実際に学習していない2倍、3倍の拡大倍率に対応する予測係数を簡単に生成することができる。これにより、例えば、超高倍率の拡大変換などのように学習対が用意できない場合でも、本発明の画像処理装置100を用いて拡大変換を行うことが可能となる。
また、式(3)におけるnの値を十分に大きくとれば、拡大変換処理によって生成された出力画像の画質は、直接学習で求めた予測係数を用いて拡大変換された画像の画質と比較しても遜色ないものとなる。
さらに、本発明によれば、従来の拡大変換よりも高い画質の出力画像を得ることができる。図15は、本発明によって、より高画質の拡大変換を実現する方式を説明する図である。
図15においては、便宜上入力画像が12(=4×3)個の矩形により表わされている。白い矩形が低解像度画像の画素(入力画素)を表しており、それらの白い矩形の中の円は画素の中心を表している。また、図中の中央に示される比較的面積の小さい矩形が高解像度画像の画素(出力画素)を表している。出力画素の中に示された「×」の記号が出力画素の中心の位置を表している。拡大変換処理の際に特定すべき出力画像の画素位置(例えば、高解像度画像の所定の画素Hh)の座標(出力位相)が同図の「×」の記号の位置に対応する。この例では、出力位相は、水平方向と垂直方向の位置がそれぞれ、画像の中央となっている。
いま、図15に示されるように、出力位相の水平方向の位置が左から2列目と3列目の中間に位置する場合、予測タップの画素値として用いる画素の位置をどう特定するか問題となる。例えば、従来の画像処理装置10による拡大変換処理では、入力画素のうち左から3列分の9個の画素値によるタップ(予測タップ)を用いて出力画素の画素値を求めていた。入力画素の右から3列分の9個の画素値によるタップを用いて出力画素の画素値を求めてもよい。
つまり、出力位相に近い入力画素が最も相関性が高いと考えられるので、通常、出力位相に近い入力画素の画素値をタップとして用いるが、出力位相が入力画素と入力画素の中央に位置する場合、一意に特定できない。このような場合、例えば、左から3列分の9個の画素値によるタップまたは右から3列分の9個の画素値によるタップのように、所定の基準でいずれかを選択しても、出力画素値を高精度に演算できる保証はない。
本発明によれば、出力画素の面積を半分に分割し、出力画素の左半分の画素値を入力画素の左から3列分の9個の画素値によるタップを用いて算出し、出力画素の右半分の画素値を入力画素の右から3列分の9個の画素値によるタップを用いて算出することができる。そして、算出された左半分の画素値と右半分の画素値を足し合わせて出力画素の画素値とすることができる。
すなわち、従来の拡大変換処理は、出力画素の面積が考慮されておらず、出力画素の中心の位置である出力位相の画素値を算出するものだったので、出力画素を分割して画素値を算出することはできなかった。つまり、実際には、所定の面積を有する画素であるにも関わらず、従来の拡大変換処理は、図中の「×」の記号の位置に対応する点の画素値を算出するのみであった。
これに対して本発明では上述したように、高解像度画像の画素値は、無限解像度画像の画素値が集光特性に応じて積分されたものと考え、予測係数の算出が行われるようにしたので、出力画素の面積を自在に設定することが可能となった。例えば、図13のステップS21で受け付けられるパラメータのうちの座標Rと画素サイズZを適切に設定することにより、図15に示されるような分割された出力画素の画素値を算出することが可能となる。
例えば、図15に示されるように、出力位相が入力画素の画素列の中間に位置している場合、入力画素の左3列分の画素をタップとして用いても、入力画素の右3列分の画素をタップとして用いても、高精度で出力画素の画素値を演算することはできない。
本発明によれば、出力位相が入力画素の画素列の中間に位置している場合、出力画素を分割してそれぞれ画素値を演算することができるので、より高画質の拡大変換を実現することが可能である。
なお、図15では、出力画素を2分割する例について説明したが、勿論、4分割されるようにしてもよい。このように、出力画素を必要に応じて分割してそれぞれ画素値を演算し、それらの画素値を足し合わせて最終的に出力画素の画素値を算出するようにすれば、より高画質の拡大変換を実現することができる。
図16は、図15を参照して上述した方式により拡大変換処理を行った場合の効果を説明する図である。
図16は、横軸が入力画素の中心と出力位相との距離を表し、縦軸が出力画素の画素値のS/N比を表している。図中の線191は、本発明による拡大変換処理であって、図15を参照して上述した方式を採用した拡大変換処理により得られた出力画素の画素値のS/N比の変化を表している。図中の線192は、従来の拡大変換処理により得られた出力画素の画素値のS/N比の変化を表している。
なお、本発明による拡大変換処理の場合、図中垂直方向の点線で示される位置に対応する距離(0.32程度)を境に、それ以上距離が大きい場合は、出力画素を分割して画素値を演算し、それらの画素値を足し合わせて最終的に出力画素の画素値を算出している。
図16に示されるように、線191と線192を比較した場合、出力位相が入力画素の中心から離れるに従って、線191により示されるS/N比が高くなっている(画質が向上している)。この例では、出力位相と入力画素の中心との距離が約「0.45」である場合、従来の技術と比較して5dB程度画質を向上させることができることが分かる。
このように、本発明によれば、画質を向上させるとともに、簡単な構成で多様な変換パターンに対応することができる。
以上においては、本発明により解像度変換処理を行う場合を例として説明したが、他の画質変換処理にも本発明を適用することができる。例えば、ぼけ除去処理、ノイズ除去処理などの高画質化処理を行う場合にも、本発明を適用することができる。すなわち、本発明によれば、例えば、ぼけの度合い、ノイズの大きさに係らず、統合データベースを用いて予測係数を算出することも可能となる。
従って、上述した拡大変換処理は、図12を参照して上述した画像処理装置100により実行される高画質化処理の一例ともいうことができる。
図12を参照して上述した画像処理装置100は、例えば、高画質化回路としてテレビジョン受像機に搭載することも可能である。図17は、図12を参照して上述した画像処理装置を搭載したテレビジョン受像機511の構成例を示すブロック図である。
同図のテレビジョン受像機511は、被制御部531および制御部532から構成される。被制御部531は、制御部532の制御の下、テレビジョン受像機511の種々の機能を実現する。
被制御部531は、デジタルチューナ553、デマルチプレクサ(Demux)554、MPEG(Moving Picture Expert Group)デコーダ555、映像・グラフィック処理回路556、パネル駆動回路557、表示パネル558、音声処理回路559、音声増幅回路560、スピーカ561、および受信部562を備えている。また、制御部532は、CPU(Central Processing Unit)563、フラッシュROM564、DRAM(Dynamic Random Access Memory)565、および内部バス566を備えている。
デジタルチューナ553は、図示せぬアンテナ端子から入力されたテレビジョン放送信号を処理して、ユーザの選択したチャンネルに対応した所定のTS(Transport Stream)を、デマルチプレクサ554に供給する。
デマルチプレクサ554は、デジタルチューナ553から供給されたTSから、ユーザの選択したチャンネルに対応した、パーシャルTS(映像信号のTSパケット、音声信号のTSパケット)を抽出し、MPEGデコーダ555に供給する。
また、デマルチプレクサ554は、デジタルチューナ553から供給されたTSから、PSI/SI(Program Specific Information/Service Information)を取り出し、CPU563に供給する。デジタルチューナ553から供給されたTSには、複数のチャンネルが多重化されている。デマルチプレクサ554がTSから任意のチャンネルのパーシャルTSを抽出する処理は、PSI/SI(PAT/PMT)から任意のチャンネルのパケットID(PID)の情報を得ることで可能となる。
MPEGデコーダ555は、デマルチプレクサ554から供給される映像信号のTSパケットにより構成される映像PES(Packetized Elementary Stream)パケットに対してデコード処理を行い、その結果得られる映像信号を、映像・グラフィック処理回路556に供給する。また、MPEGデコーダ555は、デマルチプレクサ554から供給される音声信号のTSパケットにより構成される音声PESパケットに対してデコード処理を行い、その結果得られる音声信号を、音声処理回路559に供給する。
映像・グラフィック処理回路556は、MPEGデコーダ555から供給された映像信号に対して、必要に応じて、スケーリング処理、グラフィックスデータの重畳処理等を行い、パネル駆動回路557に供給する。
映像・グラフィック処理回路556には、高画質化回路570が接続されており、パネル駆動回路557に映像信号を供給するのに先立って、高画質化処理が実行される。
高画質化回路570は、図12を参照して上述した画像処理装置と同様の構成とされ、MPEGデコーダ555から供給された映像信号から得られた画像データに対して、例えば、図13を参照して上述した拡大変換処理を高画質化処理として実行するようになされている。
パネル駆動回路557は、映像・グラフィック処理回路556から供給された映像信号に基づいて、表示パネル558を駆動し、映像を表示させる。表示パネル558は、例えば、LCD(Liquid Crystal Display)またはPDP(Plasma Display Panel)等で構成されている。
音声処理回路559は、MPEGデコーダ555から供給された音声信号に対してD/A(Digital to Analog)変換等の必要な処理を行い、音声増幅回路560に供給する。
音声増幅回路560は、音声処理回路559から供給されるアナログ音声信号を増幅し、スピーカ561に供給する。スピーカ561は、音声増幅回路560からのアナログ音声信号に応じた音声を出力する。
受信部562は、リモートコントローラ567から送信された、例えば赤外線のリモートコントロール信号を受信し、CPU563に供給する。ユーザは、リモートコントローラ567を操作することで、テレビジョン受像機511の操作を行うことができる。
CPU563、フラッシュROM564、およびDRAM565は、内部バス566を介して接続されている。CPU563は、テレビジョン受像機11の各部の動作を制御する。フラッシュROM564は、制御ソフトウェアの格納およびデータの保管を行う。DRAM565は、CPU563のワークエリア等を構成する。すなわち、CPU563は、フラッシュROM564から読み出したソフトウェアやデータをDRAM565上に展開してソフトウェアを起動し、テレビジョン受像機511の各部を制御する。
このように本発明をテレビジョン受像機に適用することができる。
なお、上述した一連の処理は、ハードウェアにより実行させることもできるし、ソフトウェアにより実行させることもできる。上述した一連の処理をソフトウェアにより実行させる場合には、そのソフトウェアを構成するプログラムが、専用のハードウェアに組み込まれているコンピュータにネットワークや記録媒体からインストールされる。また、各種のプログラムをインストールすることで、各種の機能を実行することが可能な、例えば図18に示されるような汎用のパーソナルコンピュータ700などに、ネットワークや記録媒体からインストールされる。
図18において、CPU(Central Processing Unit)701は、ROM(Read Only Memory)702に記憶されているプログラム、または記憶部708からRAM(Random Access Memory)703にロードされたプログラムに従って各種の処理を実行する。RAM703にはまた、CPU701が各種の処理を実行する上において必要なデータなども適宜記憶される。
CPU701、ROM702、およびRAM703は、バス704を介して相互に接続されている。このバス704にはまた、入出力インタフェース705も接続されている。
入出力インタフェース705には、キーボード、マウスなどよりなる入力部706、LCD(Liquid Crystal display)などよりなるディスプレイ、並びにスピーカなどよりなる出力部707が接続されている。また、入出力インタフェース705には、ハードディスクなどより構成される記憶部708、モデム、LANカードなどのネットワークインタフェースカードなどより構成される通信部709が接続されている。通信部709は、インターネットを含むネットワークを介しての通信処理を行う。
入出力インタフェース705にはまた、必要に応じてドライブ710が接続され、磁気ディスク、光ディスク、光磁気ディスク、或いは半導体メモリなどのリムーバブルメディア711が適宜装着されている。そして、それらのリムーバブルメディアから読み出されたコンピュータプログラムが、必要に応じて記憶部708にインストールされる。
上述した一連の処理をソフトウェアにより実行させる場合には、そのソフトウェアを構成するプログラムが、インターネットなどのネットワークや、リムーバブルメディア711などからなる記録媒体からインストールされる。
なお、この記録媒体は、図18に示される、装置本体とは別に、ユーザにプログラムを配信するために配布される、プログラムが記録されている磁気ディスク(フロッピディスク(登録商標)を含む)、光ディスク(CD-ROM(Compact Disk-Read Only Memory),DVD(Digital Versatile Disk)を含む)、光磁気ディスク(MD(Mini-Disk)(登録商標)を含む)、もしくは半導体メモリなどよりなるリムーバブルメディア711により構成されるものだけでなく、装置本体に予め組み込まれた状態でユーザに配信される、プログラムが記録されているROM702や、記憶部708に含まれるハードディスクなどで構成されるものも含む。
なお、本明細書において上述した一連の処理は、記載された順序に沿って時系列的に行われる処理はもちろん、必ずしも時系列的に処理されなくとも、並列的あるいは個別に実行される処理をも含むものである。
また、本発明の実施の形態は、上述した実施の形態に限定されるものではなく、本発明の要旨を逸脱しない範囲において種々の変更が可能である。
100 画像処理装置, 121 クラスタップ抽出部, 122 クラス分類部, 123 係数決定部, 124 予測タップ抽出部, 125 予測処理部, 126 予測係数算出部, 127 統合データベース, 511 テレビジョン受像機, 570 高画質化回路, 701 CPU, 702 ROM, 711 リムーバブルメディア

Claims (10)

  1. 出力画素の座標である出力位相、前記出力画素のサイズ、および集光モデルに用いられる変数を含むパラメータを入力するパラメータ入力手段と、
    入力画像の中で前記出力位相に対応する注目画素および周辺画素の画素値からなるタップを抽出するタップ抽出手段と、
    前記パラメータと、予め記憶されている係数構成値とを用いて前記タップの要素のそれぞれに乗じられる予測係数を算出する予測係数算出手段と、
    前記算出された予測係数と、前記タップの要素のそれぞれとの積和演算により出力画素の値を演算する画素値演算手段とを備える
    画像処理装置。
  2. 前記係数構成値を記憶するデータベースをさらに備え、
    前記データベースは、
    前記係数構成値を、前記タップの要素を識別する情報に対応づけて記憶する
    請求項1に記載の画像処理装置。
  3. 前記入力画像の注目画素周辺の画像を、予め定められた方式で複数のクラスのいずれかに分類するクラス分類手段をさらに備え、
    前記データベースは、
    前記係数構成値を、前記クラス毎に記憶する
    請求項2に記載の画像処理装置。
  4. 前記出力画素により構成される出力画像は、前記入力画像より解像度の高い画像である
    請求項3に記載の画像処理装置。
  5. 前記パラメータとして入力される前記出力画素のサイズは、前記出力画像の解像度によって定まる
    請求項4に記載の画像処理装置。
  6. 前記出力画像より解像度の高い無限解像度画像の複数の画素の値を前記集光モデルにより表わされる集光特性に応じて積分した値を前記出力画素の値と近似して、前記予測係数を前記パラメータと前記係数構成値とを有する関数により記述し、
    前記データベースは、
    解像度の高い教師画像と解像度の低い生徒画像を用いて予め学習された予測係数と、前記関数に基づいて求められた前記係数構成値を記憶する
    請求項5に記載の画像処理装置。
  7. 前記集光モデルは、ガウシアンモデルである
    請求項1に記載の画像処理装置。
  8. 前記集光モデルは、サーキュラモデルである
    請求項1に記載の画像処理装置。
  9. パラメータ入力手段が、出力画素の座標である出力位相、前記出力画素のサイズ、および集光モデルに用いられる変数を含むパラメータを入力し、
    タップ抽出手段が、入力画像の中で前記出力位相に対応する注目画素および周辺画素の画素値からなるタップを抽出し、
    予測係数算出手段が、前記パラメータと、予め記憶されている係数構成値とを用いて前記タップの要素のそれぞれに乗じられる予測係数を算出し、
    画素値演算手段が、前記算出された予測係数と、前記タップの要素のそれぞれとの積和演算により出力画素の値を演算するステップ
    を含む画像処理方法。
  10. コンピュータを、
    出力画素の座標である出力位相、前記出力画素のサイズ、および集光モデルに用いられる変数を含むパラメータを入力するパラメータ入力手段と、
    入力画像の中で前記出力位相に対応する注目画素および周辺画素の画素値からなるタップを抽出するタップ抽出手段と、
    前記パラメータと、予め記憶されている係数構成値とを用いて前記タップの要素のそれぞれに乗じられる予測係数を算出する予測係数算出手段と、
    前記算出された予測係数と、前記タップの要素のそれぞれとの積和演算により出力画素の値を演算する画素値演算手段とを備える画像処理装置として機能させる
    プログラム。
JP2010076303A 2010-03-29 2010-03-29 画像処理装置および方法、並びにプログラム Withdrawn JP2011211437A (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2010076303A JP2011211437A (ja) 2010-03-29 2010-03-29 画像処理装置および方法、並びにプログラム
US13/052,323 US20110235934A1 (en) 2010-03-29 2011-03-21 Image processing apparatus, image processing method, and program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2010076303A JP2011211437A (ja) 2010-03-29 2010-03-29 画像処理装置および方法、並びにプログラム

Publications (1)

Publication Number Publication Date
JP2011211437A true JP2011211437A (ja) 2011-10-20

Family

ID=44656565

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2010076303A Withdrawn JP2011211437A (ja) 2010-03-29 2010-03-29 画像処理装置および方法、並びにプログラム

Country Status (2)

Country Link
US (1) US20110235934A1 (ja)
JP (1) JP2011211437A (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPWO2021009905A1 (ja) * 2019-07-18 2021-01-21
WO2021009904A1 (ja) * 2019-07-18 2021-01-21 日本電気株式会社 画像処理装置および画像処理方法
US11647152B2 (en) 2019-06-12 2023-05-09 Canon Kabushiki Kaisha Image processing apparatus, image processing method, and non-transitory computer-readable storage medium

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10990778B2 (en) * 2017-10-30 2021-04-27 Electronics And Telecommunications Research Institute Apparatus and method for recognizing barcode based on image detection

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11647152B2 (en) 2019-06-12 2023-05-09 Canon Kabushiki Kaisha Image processing apparatus, image processing method, and non-transitory computer-readable storage medium
JPWO2021009905A1 (ja) * 2019-07-18 2021-01-21
WO2021009904A1 (ja) * 2019-07-18 2021-01-21 日本電気株式会社 画像処理装置および画像処理方法
JPWO2021009904A1 (ja) * 2019-07-18 2021-01-21
WO2021009905A1 (ja) * 2019-07-18 2021-01-21 日本電気株式会社 画像処理装置および画像処理方法
JP7188595B2 (ja) 2019-07-18 2022-12-13 日本電気株式会社 画像処理装置および画像処理方法
JP7188594B2 (ja) 2019-07-18 2022-12-13 日本電気株式会社 画像処理装置および画像処理方法
US11846702B2 (en) 2019-07-18 2023-12-19 Nec Corporation Image processing device and image processing method

Also Published As

Publication number Publication date
US20110235934A1 (en) 2011-09-29

Similar Documents

Publication Publication Date Title
JP5107349B2 (ja) 動きベクトルに基づく画像のスケーリング
US20100202711A1 (en) Image processing apparatus, image processing method, and program
US20110242418A1 (en) Image processing apparatus and image processing method
JP2008098966A (ja) 画像処理装置、画像処理方法、及びプログラム
JP2013031163A (ja) 超解像処理装置及び超解像処理方法
JP2008091979A (ja) 画像高画質化装置、及びその方法、並びに画像表示装置
JP2011211437A (ja) 画像処理装置および方法、並びにプログラム
JP4650123B2 (ja) 画像処理装置、画像処理方法、およびプログラム
JP4691812B2 (ja) 係数データの生成装置および生成方法、それを使用した情報信号の処理装置および処理方法
JP2014146988A (ja) 動画像符号化装置
EP1501296A1 (en) Data converting apparatus, data converting method, learning apparatus, leaning method, program, and recording medium
JP4658875B2 (ja) 画像処理装置
JP4470898B2 (ja) 画像処理装置および方法、並びに、プログラム
JP2006238070A (ja) データ変換装置および方法、データ逆変換装置および方法、情報処理システムおよび方法、記録媒体、並びにプログラム
US20110243462A1 (en) Coefficient learning apparatus and method, image processing apparatus and method, program, and recording medium
WO2011121563A1 (en) Detecting saliency in an image
US9607359B2 (en) Electronic device, method, and computer program product
JP2008017241A (ja) 高解像度画像処理装置
JP4770704B2 (ja) 画像処理装置、画像処理方法、およびプログラム
JP4512978B2 (ja) 画像処理装置および画像処理方法、プログラム、並びに記録媒体
JP5690163B2 (ja) 画像縮小装置、画像拡大装置、画像縮小プログラム、及び画像拡大プログラム
KR20090063101A (ko) 비디오 화상에서 가장자리 방위를 나타내는 거리들을 생성하는 방법, 대응하는 디바이스, 및 디인터레이싱이나 포맷 전환을 위한 방법의 용도
JP2009141445A (ja) サンプリングレート変換装置、およびサンプリングレート変換方法
JP4154647B2 (ja) データ処理装置およびデータ処理方法、並びにプログラムおよび記録媒体
JP2005311588A (ja) 信号処理装置および方法、記録媒体、並びにプログラム

Legal Events

Date Code Title Description
A300 Application deemed to be withdrawn because no request for examination was validly filed

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 20130604