JP6512100B2 - 画像処理を実行する情報処理装置及び画像処理方法 - Google Patents

画像処理を実行する情報処理装置及び画像処理方法 Download PDF

Info

Publication number
JP6512100B2
JP6512100B2 JP2015531723A JP2015531723A JP6512100B2 JP 6512100 B2 JP6512100 B2 JP 6512100B2 JP 2015531723 A JP2015531723 A JP 2015531723A JP 2015531723 A JP2015531723 A JP 2015531723A JP 6512100 B2 JP6512100 B2 JP 6512100B2
Authority
JP
Japan
Prior art keywords
image
feature vector
learning
degraded
unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2015531723A
Other languages
English (en)
Other versions
JPWO2015022771A1 (ja
Inventor
剛志 柴田
剛志 柴田
彰彦 池谷
彰彦 池谷
仙田 修司
修司 仙田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Publication of JPWO2015022771A1 publication Critical patent/JPWO2015022771A1/ja
Application granted granted Critical
Publication of JP6512100B2 publication Critical patent/JP6512100B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/24Character recognition characterised by the processing or recognition method
    • G06V30/248Character recognition characterised by the processing or recognition method involving plural approaches, e.g. verification by template match; Resolving confusion among similar patterns, e.g. "O" versus "Q"
    • G06V30/2504Coarse or fine approaches, e.g. resolution of ambiguities or multiscale approaches
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/22Matching criteria, e.g. proximity measures
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/28Determining representative reference patterns, e.g. by averaging or distorting; Generating dictionaries
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T3/00Geometric image transformations in the plane of the image
    • G06T3/40Scaling of whole images or parts thereof, e.g. expanding or contracting
    • G06T3/4053Scaling of whole images or parts thereof, e.g. expanding or contracting based on super-resolution, i.e. the output image resolution being higher than the sensor resolution
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T5/00Image enhancement or restoration
    • G06T5/60Image enhancement or restoration using machine learning, e.g. neural networks
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/0002Inspection of images, e.g. flaw detection
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/30Noise filtering
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/19Recognition using electronic means
    • G06V30/191Design or setup of recognition systems or techniques; Extraction of features in feature space; Clustering techniques; Blind source separation
    • G06V30/1914Determining representative reference patterns, e.g. averaging or distorting patterns; Generating dictionaries, e.g. user dictionaries
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20081Training; Learning

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Multimedia (AREA)
  • Data Mining & Analysis (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • General Engineering & Computer Science (AREA)
  • Quality & Reliability (AREA)
  • Image Processing (AREA)
  • Image Analysis (AREA)
  • Editing Of Facsimile Originals (AREA)

Description

本発明は、画像処理技術に関し、特に学習型超解像処理に用いる辞書を生成するための技術に関する。
画像処理に関し、様々な関連技術が知られている。
例えば、入力画像(例えば、低解像画像)から復元画像(例えば、高解像画像)を生成する技術の一例として、超解像技術が知られている。超解像技術のうち、辞書を用いて高解像画像を生成する技術は、特に学習型超解像技術と呼ばれる。ここで、その辞書は、学習画像(一般的に高品質な画像)と、その学習画像に対応する劣化画像(例えば、学習画像の解像度を落とした画像)との事例を学習することにより作成された辞書である。尚、その超解像技術により生成される復元画像は、超解像画像とも呼ばれる。
特許文献1は、文字認識装置の一例を開示する。特許文献1に記載の文字認識装置は、カメラにより撮影された対象画像に含まれる、ナンバープレートなどの文字を認識するために超解像処理を実行する。
その文字認識装置は、低解像度辞書画像、その低解像度辞書画像の特徴量及び高解像度辞書画像が関連付けられたデータベース(辞書)を用いて、その超解像処理を実行する。ここで、その低解像度辞書画像は、その対象画像を撮影するカメラを用いて撮影された、文字の画像である。その特徴量は、その低解像度辞書画像のそれぞれに基づいて算出された特徴量である。その高解像度辞書画像は、その対象画像を撮影するそのカメラの解像度よりも高い解像度を持つカメラを用いて撮影された文字の画像である。
特許文献2は、超解像画像処理装置の一例を開示する。特許文献2に記載の超解像画像処理装置は、低解像度の原画像(入力画像データ)から高解像度の画像を出力する。
その超解像画像処理装置は、入力画像データに対して超解像画像処理を施して出力画像データを生成する際、失われた高周波成分を類推するために、辞書作成装置により生成された辞書テーブル等を用いる。ここで、辞書テーブル等は、辞書テーブルと第一主成分基底ベクトルと第二主成分基底ベクトルとである。その辞書作成装置は、以下の手順により、所定のシーンに最適化した、その辞書テーブル等を生成する。
まず、その辞書作成装置は、サンプル画像ファイルから処理対象とする分割ビットマップを取得し、これを複数の分解ビットマップに分けて一時テーブルのレコードに格納する。
次に、その辞書作成装置は、その分解ビットマップに、MP(Max−Plus)ウェーブレット変換処理、並べ替え処理、主成分分析処理、内積演算処理及び頻度分割処理を順番に施し、その一時テーブルの各フィールドに処理結果を格納する。ここで、その辞書作成装置は、主成分分析処理において、その第一主成分基底ベクトルとその第二主成分基底ベクトルとを算出する。
そして最後に、その辞書作成装置は、平均値演算部によって、その一時テーブルよりもレコード数の少ない、その辞書テーブルを作成する。尚、その辞書テーブルは、上述の学習型超解像技術における辞書とは異なる。即ち、その辞書テーブルは、学習画像と劣化画像とが対応付けられた事例を学習することにより作成された辞書ではない。
特許文献3は、画像超解像装置の一例を開示する。特許文献3に記載の画像超解像装置は、符号化及び復号により劣化した入力画像から、予め定められた拡大率で拡大した超解像画像を生成する。ここで、その符号化及びその復号は、予め定められた符号化方式による符号化及び復号である。具体的には、その画像超解像装置は、以下の処理により超解像画像を生成する。
第1に、その画像超解像装置は、入力画像を所定の大きさのブロックに分割し、そのブロックのそれぞれを処理ブロックとして切り出す。次に、その画像超解像装置は、その処理ブロックを所定の拡大率で拡大することにより、拡大処理ブロックを生成する。その所定の拡大率は、その画像超解像装置がその超解像画像を生成する場合に、その画像超解像装置がその入力画像を拡大する際の拡大率である。
第2に、その画像超解像装置は、参照ブロックと劣化参照ブロックとを対応付けてブロック記憶手段に書き込む。ここで、その参照ブロックは、その処理ブロックと同一の大きさの、その入力画像から切り出したブロックである。また、その劣化参照ブロックは、特定の劣化過程により、その参照ブロックが劣化されたブロックである。その特定の劣化過程は、「その入力画像は、その生成しようとしている超解像画像がある劣化過程を経た画像である」と仮定した際の、その劣化過程である。具体的には、その画像超解像装置は、その入力画像が経た符号化方式による劣化モデル(予め定められた直交変換や量子化などを模擬するモデル)でその参照ブロックを劣化させ、その劣化参照ブロックを生成する。
第3に、その画像超解像装置は、その劣化参照ブロックとその処理ブロックとの類似度を算出する。
第4に、その画像超解像装置は、その所定の拡大率でその劣化参照ブロックを拡大して復元参照ブロックを生成する。更に、画像超解像装置は、その復元参照ブロックとその参照ブロックとの差分を損失成分として算出する。
第5に、その画像超解像装置は、その類似度に基づいてその拡大処理ブロックとその損失成分とを合成し、超解像ブロックを生成する。そして、その画像超解像装置は、その超解像ブロックを画像として構成し、その入力画像が拡大されたその超解像画像を生成する。
特開2005−149395号公報 特開2013−026659号公報 特開2012−113513号公報
しかしながら、上述した先行技術文献に記載された技術においては、入力画像から所望の復元画像(超解像画像)を生成するために必要な、学習型超解像処理に使用する、辞書を得ることができない場合があるという問題点がある。
その理由は、入力画像における劣化過程の正確な推定が困難かつ煩雑だからである。
具体的には、特許文献1に記載のその文字認識装置は、その対象画像の劣化過程を推定していない。そして、その文字認識装置において、その低解像度辞書画像(その学習型超解像処理に使用する辞書における劣化画像に相当)は、その対象画像を撮影するカメラを用いて撮影された、文字の画像である。即ち、データベース(辞書)に含まれる低解像度辞書画像は、その対象画像の劣化過程を推定して得たものではない。
特許文献2の超解像画像処理装置は、サンプル画像ファイル(その学習型超解像処理に使用する辞書における学習画像に相当)に基づいて、関数等を利用した演算により辞書テーブル等を生成する。そして、その辞書テーブル等は、所定のシーンに最適化したものであって、劣化過程の推定を行って得たものではない。
特許文献3の画像超解像装置は、劣化過程が予め明らかである場合の超解像処理である。従って、その画像超解像装置は、劣化過程が不明な入力画像を処理できない。
更に、ブラインド・デコンボリューションなどの技術により正確な劣化過程を推定することは、困難である。ここで、ブラインド・デコンボリューションとは、自然画像を対象とする、測定信号から原信号を復元するための手法である。また、利用者(操作者)が経験などによって正確な劣化過程を推定することは、困難かつ非常に煩雑である。
本発明の目的は、上述した問題点を解決できる情報処理装置、画像処理方法、及びそのためのプログラム或いはそのプログラムを記録したコンピュータ読み取り可能な非一時的記録媒体を提供することにある。
本発明の一様態における情報処理装置は、複数の第1の学習画像と入力画像とを取得する画像取得手段と、前記入力画像の任意の領域と、複数の劣化過程のそれぞれに基づいて前記第1の学習画像の前記領域に対応する領域を劣化させた場合の複数の第1の劣化画像のそれぞれと、の間の第1の類似度に基づいて、推定劣化過程を出力する推定手段と、を含み、前記推定劣化過程は、前記入力画像の前記領域に対応する前記劣化過程に対応する。
本発明の一様態における画像処理方法は、コンピュータが、複数の第1の学習画像と入力画像とを取得し、前記入力画像の任意の領域と、複数の劣化過程のそれぞれに基づいて前記第1の学習画像の前記領域に対応する領域を劣化させた場合の複数の第1の劣化画像のそれぞれと、の間の第1の類似度に基づいて、推定劣化過程を出力する。
本発明の一様態におけるプログラムは、複数の第1の学習画像と入力画像とを取得し、前記入力画像の任意の領域と、複数の劣化過程のそれぞれに基づいて前記第1の学習画像の前記領域に対応する領域を劣化させた場合の複数の第1の劣化画像のそれぞれと、の間の第1の類似度に基づいて、推定劣化過程を出力する処理をコンピュータに実行させる。
本発明は、入力画像の劣化過程を正確に推定し、その入力画像から所望の復元画像を生成するために必要な辞書を得ることが可能になるという効果がある。
図1は、本発明の第1の実施形態に係る劣化過程推定装置の構成を示すブロック図である。 図2は、第1の実施形態に係る劣化過程推定装置を含む画像処理システムの構成を示すブロック図である。 図3は、第1の実施形態における対応情報の一例を示す図である。 図4は、第1の実施形態における学習画像と劣化画像と入力画像と特徴ベクトルと類似度との関係を示す図である。 図5は、第1の実施形態における推定劣化過程の選択を説明する図である。 図6は、第1の実施形態に係る劣化過程推定装置を実現するコンピュータのハードウェア構成を示すブロック図である。 図7は、第1の実施形態における劣化過程推定装置の動作を示すフローチャートである。 図8は、第1の実施形態に係る劣化過程推定装置の具体的な構成の一例を示すブロック図である。 図9は、第1の実施形態の第1の変形例に係る劣化過程推定装置の具体的な構成の一例を示すブロック図である。 図10は、第1の実施形態の第2の変形例に係る劣化過程推定装置の具合的な構成の一例を示すブロック図である。 図11は、第1の実施形態の第2の変形例における劣化情報の一例を示す図である。 図12は、第1の実施形態の第2の変形例における劣化情報の一例を示す図である。 図13は、本発明の第2の実施形態に係る劣化過程推定装置の構成を示すブロック図である。 図14は、第2の実施形態に係る劣化過程推定装置を含む画像処理システムの構成を示すブロック図である。 図15は、本発明の第3の実施形態に係る劣化過程推定装置の構成を示すブロック図である。 図16は、第3の実施形態に係る劣化過程推定装置を含む画像処理システムの構成を示すブロック図である。 図17は、第3の実施形態における学習画像と復元画像と類似度との関係を示す図である。 図18は、第3の実施形態における学習画像選択部の動作を示すフローチャートである。 図19は、第3の実施形態における学習部の構成を示すブロック図である。 図20は、第3の実施形態における辞書の生成を説明する図である。 図21は、第3の実施形態における復元部の構成を示すブロック図である。 図22は、第3の実施形態における復元画像の生成を説明する図である。 図23は、第3の実施形態におけるパッチの一例を示す図である。
本発明を実施するための形態について図面を参照して詳細に説明する。尚、各図面及び明細書記載の各実施形態において、同様の構成要素には同様の符号を付与し、適宜説明を省略する。
<<<第1の実施形態>>>
図1は、本発明の第1の実施形態に係る劣化過程推定装置(情報処理装置とも呼ばれる)100の構成を示すブロック図である。
図1に示すように、本実施形態に係る劣化過程推定装置100は、画像取得部150と推定部160とを含む。
図2は、本実施形態に係る劣化過程推定装置100を含む画像処理システム101の構成を示すブロック図である。
図2に示すように、本実施形態に係る画像処理システム101は、劣化過程推定装置100と学習部102と辞書103と復元部104とを含む。尚、画像処理システム101は、情報処理装置とも呼ばれる。
まず、本実施形態に係る劣化過程推定装置100を含む、画像処理システム101の全体的な動作について説明する。
劣化過程推定装置100は、例えば外部から入力される、学習画像411(第1の学習画像)及び入力画像430を取得する。学習画像411は、入力画像430に対応する可能性のある、予め準備された高解像画像(高品質画像)である。また、入力画像430は、復元対象の画像である。一般的に、入力画像430は、低解像画像などの低品質画像である。
劣化過程推定装置100は、学習画像411及び入力画像430に基づいて、推定劣化過程867を学習部102に出力する。尚、推定劣化過程867は、学習部102が、辞書103を生成するために使用する、ある画像の劣化の過程情報(ある画像の劣化の内容を示す情報)である。その辞書103は、復元部104が、入力画像430から所望の復元画像440を生成するために必要な辞書103である。
学習部102は、例えば外部から入力される学習画像410(第2の学習画像)と、劣化過程推定装置100から入力される推定劣化過程867とを取得する。そして、学習部102は、学習画像410と推定劣化過程867とに基づいて、辞書103を生成する。学習画像410は、入力画像430に対応する可能性のある、予め準備された高解像画像(高品質画像)である。尚、学習画像410の集合と学習画像411の集合とは、完全に重なり合ってよいし、部分的に重なってもよいし、或いは全く重ならなくてもよい。
具体的には、第1に、学習部102は、推定劣化過程867に基づいて、学習画像410のそれぞれに対応する劣化画像420(第2の劣化画像、後述、図20に図示)を生成する。第2に、学習部102は、学習画像410のパッチと対応するその劣化画像420のパッチとをペアとして含む辞書103を生成する。ここで、パッチは、画像(学習画像410や劣化画像420など)が小領域に分割された、その小領域である。
復元部104は、外部から入力される入力画像430を取得し、外部へ復元画像440を出力する。復元部104は、辞書103の内容に基づいて、入力画像430に対応する復元画像440を生成する。
次に、第一の実施形態における劣化過程推定装置100が備える各構成要素(画像取得部150及び推定部160)について説明する。尚、図1に示す構成要素は、ハードウェア単位の構成要素でも、コンピュータ装置の機能単位に分割した構成要素でもよい。ここでは、図1に示す構成要素は、コンピュータ装置の機能単位に分割した構成要素として説明する。
===対応情報860===
図3は、劣化過程推定装置100の図示しない記憶手段に記憶される、対応情報860の一例を示す図である。図3に示すように、対応情報860の各レコードは、劣化過程861と特徴ベクトル862(第1の特徴ベクトル、後述、図4)とを含む。図3に示す対応情報860は、劣化過程推定装置100の推定部160の、後述する処理において使用される。
尚、図3に示す劣化過程861は、画像の劣化の過程(劣化の内容)を識別する情報である。その画像の劣化の過程は、例えば、ボケ強度(blur)や、圧縮率(compression)、明度(luminance)、インターレースにおけるフィールド(field)などの、任意の組み合わせである。例えば、劣化過程861は、ボケ強度、圧縮率、明度及びインターレースにおけるフィールドのそれぞれの劣化の過程を、「B3」、「C2」、「L3」及び「F1」のように示す。このほかにも、姿勢やノイズなどが、劣化過程に加えられても良い。
特徴ベクトル862は、例えば、劣化画像421(第1の劣化画像、後述、図4)がフーリエ変換された量の絶対値或いはその絶対値の対数値を要素として持ち、それらの要素がラスタスキャン順に並べられたベクトルである。尚、特徴ベクトル862は、フーリエ変換に限らず、例えばラプラス変換などの周波数部分に着目した積分変換により、劣化画像421が変換された量の絶対値或いはその絶対値の対数値を要素としてもよい。また、特徴ベクトル862は、明度で正規化された劣化画像421の各画素値を要素として持ち、それらの要素をラスタスキャン順に並べられたベクトルであってもよい。
===画像取得部150===
画像取得部150は、複数の学習画像411と入力画像430とを取得する。
===推定部160===
推定部160は、入力画像430の任意の領域と、複数の劣化画像421のそれぞれとの間の類似度851(第1の類似度、後述、図4)に基づいて、推定劣化過程867を出力する。ここで、推定劣化過程867は、入力画像430のその領域に対応する劣化過程861に対応する。
ここで、その任意の領域は、画像の任意の局所領域及び画像の全部の領域のいずれかである。即ち、入力画像430の任意の領域は、入力画像430の任意の一部の画像または入力画像430の全部である。本実施形態では、その任意の領域が画像の全部である場合の実施形態である。任意の領域が局所領域である場合については、第2の実施形態において説明する。従って、本実施形態では、「入力画像430の任意の領域」は、入力画像430の全部、即ち入力画像430そのものである為、以後、「入力画像430の任意の領域である、入力画像430の全部」を、単に「入力画像430」と表記する。
劣化画像421は、複数の劣化過程861のそれぞれに基づいて、学習画像411が劣化された場合の、画像である。
類似度851は、例えば、劣化画像421に対応する特徴ベクトル862と、入力画像430に対応する特徴ベクトル864(第2の特徴ベクトル、後述、図4)との間の関係に対応する。
その関係は、例えば、2つのベクトル(ここでは、特徴ベクトル862及び特徴ベクトル864)の間の距離に基づいた値である。また、その関係は、ある2つの特徴ベクトルの間の角度に基づいた値でもよい。更に、その関係は、正規化相互相関関数により算出される値でもよく、これらに限定されない。尚、特徴ベクトル864は、特徴ベクトル862と同一構造のベクトルである。
図4は、上述した、学習画像411と劣化画像421と入力画像430と特徴ベクトル862と特徴ベクトル864と類似度851との関係を示す図である。
推定劣化過程867は、例えば、入力画像430に対応する劣化過程861である。即ち、推定部160は、類似度851と対応情報860とに基づいて、入力画像430に対応する劣化過程861を、推定劣化過程867として出力する。
この場合、対応情報860は、その劣化画像421の特徴ベクトル862それぞれと、学習画像411(第1の学習画像)からその劣化画像421のそれぞれへの劣化の内容との対応関係を示す。換言すると、対応情報860は、劣化画像421と劣化過程861との関係を示す。
上述したように、劣化過程861は、学習画像411から劣化画像421への劣化の内容を特定する識別情報である。そして、入力画像430に対応する劣化過程861、即ち推定劣化過程867は、入力画像430を特定の画像に対して劣化処理が施された画像であると仮定した場合の、その劣化処理における劣化の内容を示す劣化過程861である。その特定の画像は、復元部104が生成する復元画像(超解像画像とも呼ばれる)440である。
換言すると、推定劣化過程867は、劣化画像421の学習画像411に対する劣化の内容を示す。そして同時に、推定劣化過程867は、劣化画像420の学習画像410に対する劣化の内容を示す。なぜならば、学習画像410及び学習画像411はいずれも、入力画像430に対応する可能性のある高解像画像(高品質画像)だからである。
尚、推定劣化過程867は、劣化過程推定装置100と学習部102とが相互に同期してその劣化の内容を特定できる情報であればよい。例えば、推定劣化過程867は、劣化過程861のようにその劣化の内容を具体的に示すものであってよいし、シリアル番号であってもよい。
図2に示すように、推定部160は、例えば、対応情報生成部110及び劣化過程選択部120を含む。
===対応情報生成部110===
対応情報生成部110は、対応情報860を生成する。
例えば、対応情報生成部110は、劣化過程861に基づいて、学習画像411から劣化画像421を生成する。例えば、劣化過程861のそれぞれは、学習画像410に対応する可能性のあるあらゆる劣化の内容のうち、例えば経験的な知識によって選択された、代表的な劣化の内容を示す。次に、対応情報生成部110はその生成した劣化画像421の特徴ベクトル862を生成する。
学習画像411の数及び劣化過程861の数は、任意である。劣化画像421の数は、学習画像411の数に劣化過程861の数を乗じた数である。例えば、学習画像411が10000枚であり、その劣化過程861の数が100種類である場合、その劣化画像421の数は、1000000枚である。
この場合、特徴ベクトル862の数は、その劣化画像421の数と同数の、1000000である。換言すると、対応情報860は、特徴ベクトル862と劣化過程861とのペアを含むレコードを、1000000レコード含む。
===劣化過程選択部120===
劣化過程選択部120は、入力画像430と劣化画像421との類似度851に基づいて、対応情報860から劣化過程861を選択し、推定劣化過程867として出力する。
具体的には、劣化過程選択部120は、入力画像430に対応する特徴ベクトル864と対応情報860に含まれる特徴ベクトル862との関係に基づいて、対応情報860から劣化過程861を選択する。次に、劣化過程選択部120は、その選択した劣化過程861を推定劣化過程867として、外部(例えば、学習部102)へ出力する。
図5は、劣化過程選択部120による劣化過程861の選択について説明する図である。
ここで、特徴ベクトル(特徴ベクトル862及び特徴ベクトル864)は、3次元のベクトルであるものとする。図5において、点線のそれぞれは、その特徴ベクトルが存在する、3次元空間の軸のそれぞれを示す。
図5において、四角形、三角形及び円形のそれぞれは、四角形クラス、三角形クラス及び円形クラスのそれぞれに属する特徴ベクトル862を示す。ここで、クラスは、劣化過程861の種類に対応する。即ち、四角形クラス、三角形クラス及び円形クラスは、3種類の劣化過程861のそれぞれに対応する。
図5において、星形は、特徴ベクトル864(入力画像430に対応する特徴ベクトル)を示す。
劣化過程選択部120は、特徴ベクトル864(星形)を、四角形クラス、三角形クラス及び円形クラスのいずれかへ分類する。例えば、劣化過程選択部120は、各クラスの特徴ベクトル862のセントロイドと特徴ベクトル864との関係に基づいて、その特徴ベクトル864を、いずれかのクラスへ分類する。例えば、劣化過程選択部120は、その特徴ベクトル864との距離が最も近い特徴ベクトル862が属するクラスへ、その特徴ベクトル864を分類してもよい。
次に、劣化過程選択部120は、特徴ベクトル864(星形)を分類したクラスに対応する劣化過程861を選択する。続けて、劣化過程選択部120は、その選択した劣化過程861を推定劣化過程867として、外部(例えば、学習部102)へ出力する。
上述の説明において、劣化過程選択部120は、特徴ベクトル864を最近傍のクラスに分類し、その最近傍のクラスに対応する劣化過程861を一つだけ選択する。しかし、劣化過程選択部120は、特徴ベクトル864を複数のクラスに分類してもよい。例えば、劣化過程選択部120は、k−近傍(kは、1以上の任意の自然数)のクラスに、特徴ベクトル864を分類してよい。この場合、劣化過程選択部120は、そのk個のクラスのそれぞれに対応する劣化過程861を推定劣化過程867として出力してよい。
以上が、劣化過程推定装置100の機能単位の各構成要素についての説明である。
次に、劣化過程推定装置100のハードウェア単位の構成要素について説明する。
図6は、本実施形態における劣化過程推定装置100を実現するコンピュータ700のハードウェア構成を示す図である。
図6に示すように、コンピュータ700は、CPU(Central Processing Unit)701、記憶部702、記憶装置703、入力部704、出力部705及び通信部706を含む。更に、コンピュータ700は、外部から供給される記録媒体(または記憶媒体)707を含む。記録媒体707は、情報を非一時的に記憶する不揮発性記録媒体であってもよい。
CPU701は、オペレーティングシステム(不図示)を動作させて、コンピュータ700の、全体の動作を制御する。また、CPU701は、例えば記憶装置703に装着された記録媒体707から、プログラムやデータを読み込み、読み込んだプログラムやデータを記憶部702に書き込む。ここで、そのプログラムは、例えば、後述の図7に示すフローチャートの動作をコンピュータ700に実行させるプログラムである。
そして、CPU701は、読み込んだプログラムに従って、また読み込んだデータに基づいて、図1に示す画像取得部150及び推定部160として各種の処理を実行する。
尚、CPU701は、通信網(不図示)に接続されている外部コンピュータ(不図示)から、記憶部702にプログラムやデータをダウンロードするようにしてもよい。
記憶部702は、プログラムやデータを記憶する。記憶部702は、例えば、学習画像411、劣化画像421、入力画像430及び対応情報860を記憶する。
記憶装置703は、例えば、光ディスク、フレキシブルディスク、磁気光ディスク、外付けハードディスク及び半導体メモリであって、記録媒体707を含む。記憶装置703(記録媒体707)は、プログラムをコンピュータ読み取り可能に記憶する。また、記憶装置703は、データを記憶してもよい。記憶装置703は、例えば、学習画像411、劣化画像421、入力画像430及び対応情報860を記憶する。
入力部704は、例えばマウスやキーボード、内蔵のキーボタンなどで実現され、入力操作に用いられる。入力部704は、マウスやキーボード、内蔵のキーボタンに限らず、例えばタッチパネルなどでもよい。
出力部705は、例えばディスプレイで実現され、出力を確認するために用いられる。
通信部706は、外部とのインタフェースを実現する。通信部706は、画像取得部150及び推定部160の一部として含まれる。また、劣化過程推定装置100は、通信部706を介して学習部102と接続されてもよい。
以上説明したように、図1に示す劣化過程推定装置100の機能単位のブロックは、図6に示すハードウェア構成のコンピュータ700によって実現される。但し、コンピュータ700が備える各部の実現手段は、上記に限定されない。すなわち、コンピュータ700は、物理的に結合した1つの装置により実現されてもよいし、物理的に分離した2つ以上の装置を有線または無線で接続し、これら複数の装置により実現されてもよい。
尚、上述のプログラムのコードを記録した記録媒体707が、コンピュータ700に供給され、CPU701は、記録媒体707に格納されたプログラムのコードを読み出して実行するようにしてもよい。或いは、CPU701は、記録媒体707に格納されたプログラムのコードを、記憶部702、記憶装置703またはその両方に格納するようにしてもよい。すなわち、本実施形態は、コンピュータ700(CPU701)が実行するプログラム(ソフトウェア)を、一時的にまたは非一時的に、記憶する記録媒体707の実施形態を含む。尚、情報を非一時的に記憶する記憶媒体は、不揮発性記憶媒体とも呼ばれる。
尚、コンピュータ700は、図2に示す画像処理システム101を実現してもよい。この場合、CPU701は、読み込んだプログラムに従って、また読み込んだデータに基づいて、図2に示す劣化過程推定装置100、学習部102及び復元部104として各種の処理を実行する。記憶部702及び記憶装置703は、辞書103を含んでよい。また、記憶部702及び記憶装置703は、更に、学習画像410、劣化画像420及び復元画像440を記憶するようにしてもよい。
以上が、本実施形態における劣化過程推定装置100を実現するコンピュータ700の、ハードウェア単位の各構成要素についての説明である。
次に本実施形態の動作について、図1〜図7を参照して詳細に説明する。
図7は、本実施形態の動作を示すフローチャートである。尚、このフローチャートによる処理は、前述したCPU701によるプログラム制御に基づいて、実行されても良い。また、処理のステップ名については、S601のように、記号で記載する。
画像取得部150は、学習画像411を取得する(S601)。例えば、画像取得部150は、図6に示す記憶部702或いは記憶装置703に予め記憶されている学習画像411を読み出す。また、画像取得部150は、図6に示す入力部704を介して利用者によって入力された、学習画像411を取得するようにしてもよい。また、画像取得部150は、図6に示す通信部706を介して図示しない機器から、学習画像411を受信するようにしてもよい。また、画像取得部150は、図6に示す記憶装置703を介して、記録媒体707に記録された学習画像411を取得するようにしてもよい。
次に、推定部160の対応情報生成部110は、取得した学習画像411のそれぞれについて、複数の劣化過程861のそれぞれに対応する劣化画像421を生成する(S602)。
ここで、推定部160は、図6に示す記憶部702或いは記憶装置703に予め記憶されている劣化過程861を読み出す。また、推定部160は、図6に示す入力部704を介して利用者によって入力された、劣化過程861を取得するようにしてもよい。また、推定部160は、図6に示す通信部706を介して図示しない機器から、劣化過程861を受信するようにしてもよい。また、推定部160は、図6に示す記憶装置703を介して、記録媒体707に記録された劣化過程861を取得するようにしてもよい。
次に、対応情報生成部110は、各劣化画像421に対応する特徴ベクトル862を算出する(S603)。
次に、対応情報生成部110は、劣化過程861と特徴ベクトル862との組を含む対応情報860を生成し、劣化過程選択部120に出力する(S604)。
次に、画像取得部150は、入力画像430を取得する(S605)。例えば、画像取得部150は、図6に示す記憶部702或いは記憶装置703に、予め記憶されている入力画像430を取得する。また、画像取得部150は、図6に示す入力部704を介して利用者が入力した、入力画像430を取得するようにしてもよい。また、画像取得部150は、図6に示す通信部706を介して図示しない機器から、入力画像430を受信するようにしてもよい。また、画像取得部150は、図6に示す記憶装置703を介して、記録媒体707に記録された入力画像430を取得するようにしてもよい。
次に、推定部160の劣化過程選択部120は、入力画像430に対応する特徴ベクトル864を算出する(S606)。
次に、劣化過程選択部120は、特徴ベクトル864と対応情報860に含まれる特徴ベクトル862との関係に基づいて、対応情報860から入力画像430に対応する劣化過程861を選択する(S607)。
次に、劣化過程選択部120は、その選択された劣化過程861を推定劣化過程867として出力する(S608)。例えば、劣化過程選択部120は、図6に示す通信部706を介して、学習部102に推定劣化過程867を送信する。また、劣化過程選択部120は、推定劣化過程867を図6に示す出力部705を介して出力するようにしてもよい。また、劣化過程選択部120は、図6に示す記憶装置703を介して、記録媒体707に推定劣化過程867を記録するようにしてもよい。
以上が、本実施形態の動作の説明である。
次に、本実施形態のより具体的な構成を説明する。
図8は、劣化過程推定装置100の詳細な構成の一例を示す図である。
図8に示すように、画像取得部150は、学習画像取得部151及び入力画像取得部152を含む。推定部160は、対応情報生成部110、劣化過程選択部120及び劣化過程推定用辞書165を含む。そして、劣化画像群生成部161、特徴ベクトル算出部162及び劣化過程推定用辞書作成部163は、対応情報生成部110を構成する。また、特徴ベクトル算出部162及び特徴ベクトル分類部164は、劣化過程選択部120を構成する。
更に、劣化過程推定用辞書165は、対応情報860に対応する。劣化過程推定用辞書165は、例えば、図6に示す記憶部702や記憶装置703などに記憶される。
図8に示す構成の劣化過程推定装置100の動作を、図7に示すフローチャートに沿って説明する。
学習画像取得部151は、学習画像411を取得する(S601)。
次に、劣化画像群生成部161は、学習画像取得部151が取得した学習画像411のそれぞれについて、複数の劣化過程861に基づいて、複数の劣化過程861のそれぞれに対応する劣化画像421を生成する(S602)。
次に、特徴ベクトル算出部162は、劣化画像群生成部161が作成した各劣化画像421に対応する特徴ベクトル862を算出する(S603)。
次に、劣化過程推定用辞書作成部163は、特徴ベクトル862と劣化過程861との組を含む対応情報860を生成し、劣化過程推定用辞書165に書き込む(S604)。ここで、特徴ベクトル862は、S603において特徴ベクトル算出部162が作成した特徴ベクトル862である。また、劣化過程861は、S603において特徴ベクトル算出部162がその特徴ベクトル862を作成するために利用した劣化過程861である。
次に、入力画像取得部152は、入力画像430を取得する(S605)。
次に、特徴ベクトル算出部162は、特徴ベクトル864を算出する(S606)。
次に、特徴ベクトル分類部164は、特徴ベクトル算出部162が算出した特徴ベクトル864を、劣化過程推定用辞書165に記憶された対応情報860に含まれる特徴ベクトル862との関係に基づいて、前述のクラスのいずれかに分類する。続けて、特徴ベクトル分類部164は、その特徴ベクトル864が分類されたクラスに対応する劣化過程861を選択する(S607)。
次に、特徴ベクトル分類部164は、その選択された劣化過程861を推定劣化過程867として出力する(S608)。
上述した本実施形態における第1の効果は、入力画像430の劣化過程を正確に推定し、入力画像430から所望の復元画像440を復元するために必要な辞書103を得ることが可能になることである。
その理由は、以下のような構成を含むからである。即ち、第1に画像取得部150が学習画像411及び入力画像430を取得する。第2に、推定部160が、特徴ベクトル864と特徴ベクトル862との関係に基づいて、選択された劣化過程861を推定劣化過程867として出力する。
上述した本実施形態における第2の効果は、ボケを含む劣化に対しても、入力画像430の劣化過程を正確に推定することが可能になることである。
その理由は、推定部160が、元の劣化画像421がフーリエ変換された量の絶対値或いはその絶対値の対数値を、ラスタスキャン順に並べた構造の特徴ベクトル862及び特徴ベクトル864を生成するようにしたからである。或いは、その理由は、推定部160が、明度で正規化された劣化画像421の各画素値を、ラスタスキャン順に並べた構造の特徴ベクトル862及び特徴ベクトル864を生成するようにしたからである。
上述した本実施形態における第3の効果は、推定された劣化過程が正確である確率をより大きくすることが可能になることである。
その理由は、劣化過程選択部120が、特徴ベクトル864を複数のクラスに分類し、その複数のクラスのそれぞれに対応する推定劣化過程867を出力するようにしたからである。
<<<第1の実施形態の第1の変形例>>>
図9は、本実施形態の第1の変形例における、劣化過程推定装置100の詳細な構成の一例を示す図である。
図9に示すように、本変形例の推定部160は、劣化過程推定用辞書作成部163に替えて劣化画像推定用辞書作成部166を含む。そして、本変形例の推定部160は、特徴ベクトル分類部164に替えて特徴ベクトル分類部167を含む。そして、本変形例の推定部160は、劣化画像推定用辞書165に替えて劣化画像推定用辞書168を含む。
本変形例の劣化過程推定装置100は、劣化過程861に替えて選択された劣化画像421を、推定劣化過程867として出力する。即ち、本変形例の推定部160は、その類似度851に基づいて、劣化画像421のいずれかを選択し、その選択した劣化画像421を、その推定劣化過程867として出力する。
劣化過程推定用辞書作成部166は、特徴ベクトル算出部162が作成した特徴ベクトル862と、その特徴ベクトル862に対応する劣化画像421と、の組を含む対応情報を生成し、劣化画像推定用辞書168に書き込む。
ここで、劣化画像推定用辞書168は、特徴ベクトル862と劣化画像421との組を含むその対応情報を記憶する。
特徴ベクトル分類部167は、例えば、特徴ベクトル864の最近傍の特徴ベクトル862に対応する劣化画像421を出力する。また、特徴ベクトル分類部167は、特徴ベクトル864のk(kは、1以上の任意の自然数)−近傍の特徴ベクトル862に対応する、k個の劣化画像421を出力するようにしてもよい。
具体的には、特徴ベクトル分類部167は、特徴ベクトル864を、劣化画像推定用辞書168に記憶されたその対応情報に含まれる特徴ベクトル862との関係に基づいて、前述のクラスのいずれかに分類する。次に、特徴ベクトル分類部167は、その特徴ベクトル864が分類されたクラスに対応する(例えば、そのクラスのセントロイドの)劣化画像421を出力する。或いは、特徴ベクトル分類部167は、その特徴ベクトル864を、それらの特徴ベクトル862との関係に基づいて、k−近傍のクラスに分類してよい。この場合、特徴ベクトル分類部167は、そのk個のクラスに対応する劣化画像421を出力してよい。
例えば、本変形例の劣化過程推定装置100は、学習画像410の集合と学習画像411の集合との内、重なり合う学習画像411について、劣化画像421を出力する。
上述の本変形例は、学習部102における劣化画像420の生成処理を省略することができるという効果を有する。
<<<第1の実施形態の第2の変形例>>>
図10は、本実施形態の第2の変形例における、劣化過程推定装置100の詳細な構成の一例を示す図である。
図10に示すように、本変形例の劣化過程推定装置100は、劣化情報入力部170を更に含む。
===劣化情報入力部170===
劣化情報入力部170は、入力画像430の劣化情報を、利用者に入力させる。
図11及び図12のそれぞれは、その劣化情報の一例を示す図である。図11は、その劣化情報であるナンバープレートの4つの頂点を黒丸で示す。また、図12は、その劣化情報である顔の特徴点を黒丸で示す。その劣化情報は、図11及び図12に示すものに限らず、例えば、特定の領域の輪郭を指定する情報であってもよい。
例えば、劣化情報入力部170は、以下の手順により入力画像430の劣化情報を、利用者に入力させる。第1に、劣化情報入力部170は、図6に示す出力部705に入力画像430を表示する。第2に、利用者が、図6に示す入力部704を介して、その表示された入力画像430の頂点位置や特徴点などの位置を指定する。第3に、劣化情報入力部170は、入力部704を介して、その入力された位置を取得する。
なお利用者が入力するその劣化情報は、頂点位置や特徴点に限定されない。例えば、利用者は、点を指定する替わりに、線でその劣化情報を指定してもよいし、面あるいは領域でその劣化情報を指定してもよい。
===推定部160===
本変形例の推定部160の劣化画像群生成部161は、学習画像取得部151が取得した学習画像411のそれぞれについて、複数の劣化過程861と更に劣化情報とに基づいて、複数の劣化過程861のそれぞれに対応する劣化画像421を生成する。
上述の本変形例は、推定部160における劣化画像421の生成処理の負荷を軽減することができるという効果を有する。
即ち、上述のような姿勢を決定するための点の情報を、利用者に入力させることにより、姿勢の推定や倍率、超解像処理の対象物(例えば、ナンバープレートや顔)の検出などの問題を解く必要が無くなる。
<<<第2の実施形態>>>
次に、本発明の第2の実施形態について図面を参照して詳細に説明する。以下、本実施形態の説明が不明確にならない範囲で、前述の説明と重複する内容については説明を省略する。
本実施形態は、任意の領域が局所領域である場合の実施形態である。以下の説明において、入力画像430の任意の領域をその入力画像局所領域と表記する。
本実施形態において、劣化画像421は、複数の劣化過程861のそれぞれに基づいて、学習画像411の局所領域が劣化された場合の、その劣化された局所領域である。ここで、学習画像411のその局所領域は、その入力画像局所領域の局所領域に対応する。
また、本実施形態の劣化過程861は、学習画像411のその局所領域から劣化画像421のその局所領域への劣化の過程を特定する劣化過程である。
本実施形態の特徴ベクトル862は、その劣化された局所領域である劣化画像421の特徴ベクトルである。
本実施形態の特徴ベクトル864は、その入力画像局所領域の特徴ベクトルである。
その入力画像局所領域、その劣化された局所領域である劣化画像421、後述する学習画像410の局所領域及び後述する入力画像430の局所領域のそれぞれは、相互に対応する位置及び形状の局所領域である。その局所領域は、例えばパッチ単位で指定された、局所領域である。
図13は、本発明の第2の実施形態に係る劣化過程推定装置200の構成を示すブロック図である。
図13に示すように、本実施形態における劣化過程推定装置200は、推定部160に替えて、推定部260を含む。
推定部260は、対応情報生成部210及び劣化過程選択部220を含む。
===対応情報生成部210===
対応情報生成部210は、例えば任意の数のパッチ識別子(個々のパッチを特定する識別子)を含む領域指定871に基づいて、劣化画像421を生成する。次に、対応情報生成部210は、劣化画像421のそれぞれに対応する特徴ベクトル862を算出する。尚、対応情報生成部210は、例えば図6に示す記憶部702或いは記憶装置703に予め記憶されている領域指定871を取得する。また、対応情報生成部210は、図6に示す入力部704を介して利用者によって入力された、領域指定871を取得するようにしてもよい。また、対応情報生成部210は、図6に示す通信部706を介して図示しない機器から、領域指定871を受信するようにしてもよい。また、対応情報生成部210は、図6に示す記憶装置703を介して、記録媒体707に記録された領域指定871を取得するようにしてもよい。
===劣化過程選択部220===
劣化過程選択部220は、対応情報生成部210が取得した領域指定871に基づいて、その入力画像局所領域を生成する。次に、劣化過程選択部220は、その入力画像局所領域に対応する特徴ベクトル864を算出する。
劣化過程選択部220は、その特徴ベクトル864と、対応情報860に含まれる特徴ベクトル862との類似度851に基づいて、対応情報860から劣化過程861を選択する。
次に、劣化過程選択部220は、その選択した劣化過程861を推定劣化過程867として、外部(例えば、後述の学習部202)へ出力する。
換言すると、劣化過程推定装置200は、その局所領域に対応する推定劣化過程867を出力する。
図14は、本実施形態に係る劣化過程推定装置200を含む画像処理システム201の構成を示すブロック図である。尚、画像処理システム201は、情報処理装置とも呼ばれる。
図14に示すように、本実施形態に係る画像処理システム101は、劣化過程推定装置200と学習部202と辞書103と復元部104とを含む。
学習部202は、例えば外部から入力される学習画像410と、劣化過程推定装置200から入力される推定劣化過程867と領域指定871とを取得する。そして、学習部202は、推定劣化過程867と領域指定871とに基づいて、学習画像410から辞書103を生成する。具体的には、第1に、学習部202は、推定劣化過程867と領域指定871とに基づいて、学習画像410のそれぞれのその局所領域に対応する劣化画像420を生成する。第2に、学習部202は、学習画像410のパッチと対応するその劣化画像420のパッチとをペアとして含む辞書103を生成する。
上述した本実施形態における第1の効果は、第1の実施形態と同様の効果である。更に、本実施形態における第2の効果は、入力画像430の局所領域ごとに異なる内容の劣化が発生している場合にも、正確な劣化過程861を推定し、正確な超解像画像(復元画像440)を復元するために必要な辞書103を得ることが可能になることである。
その第2の効果を有する理由は、劣化過程推定装置200が更に領域指定871に基づいて、入力画像430の局所領域であるその入力画像局所領域に対応する推定劣化過程867を出力するようにしたからである。
本実施形態は、第1の実施形態と結合してもよい。即ち、その実施形態は、各画像のそれぞれの全体を処理する手段と、各画像の局所領域のそれぞれを処理する手段との両方を含む構成であってもよい。
<<<第3の実施形態>>>
次に、本発明の第3の実施形態について図面を参照して詳細に説明する。以下、本実施形態の説明が不明確にならない範囲で、前述の説明と重複する内容については説明を省略する。
図15は、本発明の第3の実施形態に係る劣化過程推定装置300の構成を示すブロック図である。
図15に示すように、本実施形態における劣化過程推定装置300は、第1の実施形態の劣化過程推定装置100と比べて、学習画像選択部340を更に含む。
図16は、本実施形態に係る劣化過程推定装置300を含む画像処理システム301の構成を示すブロック図である。尚、画像処理システム301は、情報処理装置とも呼ばれる。
図16に示すように、本実施形態に係る画像処理システム301は、劣化過程推定装置300と学習部102と辞書103と復元部104とを含む。劣化過程推定装置300は、画像取得部150と推定部360とを含む。推定部360は、第1の実施形態の推定部160に比べて、学習画像選択部340を更に含む。
===学習画像選択部340===
学習画像選択部340は、学習画像411のそれぞれと復元画像440との類似度(第2の類似度)852に基づいて、学習画像411を選択し、その選択した学習画像411を対応情報生成部110に出力する。ここで、復元画像440は、復元部104により生成された画像である。
ここで、図17及び図18を参照して、学習画像選択部340の動作を説明する。図17は、学習画像411と復元画像440と類似度852との関係を示す図である。図18は、本実施形態の動作を示すフローチャートである。
学習画像選択部340は、複数の学習画像411を取得する(S630)。
次に、学習画像選択部340は、取得した学習画像411を対応情報生成部110に出力する(S631)。
次に、学習画像選択部340は、学習画像選択部340が復元画像440の出力を検出した回数(以後、検出回数と呼ぶ)が所定の閾値に到達したか否かを判定する(S632)。その検出回数がその所定の閾値に到達した場合(S632でYES)、学習画像選択部340は、処理を終了する。
その回数がその所定の閾値に到達していない場合(S632でNO)、学習画像選択部340は、学習画像411のそれぞれに対応する特徴ベクトル881を算出する(S633)。
次に、学習画像選択部340は、復元部104が復元画像440を出力するのを待つ(S634)。
復元部104が復元画像440を出力した場合(S634でYES)、学習画像選択部340は、その検出回数を更新し、復元画像440を取得する(S635)。
次に、学習画像選択部340は、復元画像440のそれぞれに対応する特徴ベクトル884を算出する(S636)。
次に、学習画像選択部340は、特徴ベクトル881と特徴ベクトル884との関係に基づいて、学習画像411を選択する(S637)。
例えば、復元画像440が1つの場合、学習画像選択部340は、特徴ベクトル881のそれぞれと特徴ベクトル884との距離が近い順に、所定の数の特徴ベクトル881に対応する学習画像411を選択する。また、復元画像440が1つの場合、学習画像選択部340は、特徴ベクトル881のそれぞれと特徴ベクトル884との距離が所定の閾値以下の、特徴ベクトル881に対応する学習画像411を選択してもよい。
例えば、復元画像440が複数の場合、学習画像選択部340は、特徴ベクトル881のそれぞれと複数の特徴ベクトル884のセントロイドに対応するベクトルとの間の距離が近い順番に、所定の数の特徴ベクトル881に対応する学習画像411を選択する。また、復元画像440が複数の場合、学習画像選択部340は、特徴ベクトル881のそれぞれと複数の特徴ベクトル884のセントロイドに対応するベクトルとの間の距離が所定の閾値以下の、特徴ベクトル881に対応する学習画像411を選択してもよい。また、復元画像440が複数の場合、学習画像選択部340は、特徴ベクトル884のそれぞれについて、特徴ベクトル881のそれぞれと各特徴ベクトル884との距離が近い順に、所定の数の特徴ベクトル881に対応する学習画像411を選択してもよい。また、復元画像440が複数の場合、学習画像選択部340は、特徴ベクトル884のそれぞれについて、特徴ベクトル881のそれぞれと各特徴ベクトル884との距離が所定の閾値以下の、特徴ベクトル881に対応する学習画像411を選択してもよい。
次に、学習画像選択部340は、選択した学習画像411を、対応情報生成部110へ出力する(S638)。
次に、学習画像選択部340は、その検出回数が所定の閾値に到達したか否かを判定する(S639)。その検出回数がその所定の閾値に到達した場合(S639でYES)、学習画像選択部340は、処理を終了する。その検出回数がその所定の閾値に到達していない場合(S639でNO)、学習画像選択部340は、S634の処理へ戻る。
===対応情報生成部110===
本実施形態の対応情報生成部110は、学習画像選択部340から取得した学習画像411に基づいて、対応情報860を生成し、その生成した対応情報860を劣化過程選択部120に出力する。
===学習部102===
学習部102は、劣化画像420のパッチである劣化パッチと、学習画像410のパッチである復元パッチとを対応付けた複数のパッチペアを格納する辞書103を作成する。ここで、劣化画像420のパッチは、劣化過程推定装置300により出力された推定劣化過程867に基づいて学習画像410が劣化された、劣化画像420のパッチである。
図19は、学習部102の構造を示すブロック図である。図19に示すように、学習部102は、受付部1021、劣化画像生成部1022、パッチペア生成部1023及び登録部1024を含む。
図20は、学習フェーズを説明するための概念図である。図20に示すように、学習部102は、推定劣化過程867に基づいて、学習画像410に劣化処理を施して劣化画像420を生成する。学習部102は、学習画像410及び劣化画像420の対応する位置におけるパッチペア403を辞書103に登録する。パッチペア403は、復元パッチ401及び劣化パッチ402を含む。
===受付部1021===
受付部1021は、学習画像410の入力を受け付ける。受付部1021は、その受け付けた学習画像410を劣化画像生成部1022及びパッチペア生成部1023に出力する。
===劣化画像生成部1022===
劣化画像生成部1022は、受付部1021から出力された学習画像410に対して、劣化過程推定装置200から出力された推定劣化過程867に基づいて、劣化処理を施して劣化画像420を生成する。
複数の推定劣化過程867がある場合、劣化画像生成部1022は、受付部1021から出力された各学習画像410に対して、各推定劣化過程867に基づいて劣化処理を施し、各学習画像410に対応する複数の劣化画像420を生成してもよい。
劣化画像生成部1022は、推定劣化過程867に基づいて、例えば学習画像410をN分の1に縮小することで、劣化画像420を生成する。画像を縮小するアルゴリズムは、例えば、画質劣化が比較的大きいニアレストネイバー法を使用する。また、画像を縮小するアルゴリズムは、例えば、バイリニア法やバイキュービック法を使用してもよい。
劣化画像生成部1022は、推定劣化過程867に基づいて、例えば学習画像410の高周波成分を取り除くなどして、ボケ強度を強めることで劣化画像420を生成してもよい。劣化画像生成部1022は、推定劣化過程867に基づいて、例えば学習画像410を傾かせて、姿勢を変動させることで劣化画像420を生成してもよい。または、劣化画像生成部1022は、推定劣化過程867に基づいて、例えば学習画像410の輝度値を減少させて明度を低くし、劣化画像420を生成してもよい。劣化画像生成部1022は、推定劣化過程867に基づいて、既存の様々な手法によって劣化画像420を生成してもよい。
===パッチペア生成部1023===
パッチペア生成部1023は、受付部1021から学習画像410を受け取り、劣化画像生成部1022から学習画像410の劣化画像420を受け取る。パッチペア生成部1023は、学習画像410と劣化画像420との対応する位置におけるパッチペア403を複数生成する。パッチペア生成部1023は、既存の手法によって復元パッチ401と劣化パッチ402の複数のペア(パッチペア403)を生成すればよい。パッチペア生成部1023は、生成した複数のパッチペア403を登録部1024に出力する。
===登録部1024===
登録部1024は、パッチペア生成部1023から、複数のパッチペア403を受け取る。登録部1024は、複数のパッチペア403を辞書103に登録する。
===辞書103===
辞書103は、学習部102によって生成された複数のパッチペアを格納する。
===復元部104===
復元部104は、辞書103を利用して、入力画像430から復元画像440を生成し、劣化過程推定装置300及び外部へ出力する。
図21は、復元部104の構成を示すブロック図である。図21に示すように、復元部104は、受付部1041、パッチ生成部1042及び復元画像生成部1043を含む。
===受付部1041===
受付部1041は、画像処理の対象となる入力画像430(入力画像)を外部から受け付ける。例えば、受付部1041は、ネットワークに接続して入力画像430を受信してもよいし、入力画像430を記憶するメモリから読み出すことで入力画像430を受け付けてもよい。即ち、受付部1041による入力画像430の受け付けの形態は、限定されない。受付部1041は、受け付けた入力画像430をパッチ生成部1042に出力する。
===パッチ生成部1042===
パッチ生成部1042は、受付部1041から出力された入力画像430から複数のパッチ(入力パッチ)を生成し、復元画像生成部1043に出力する。
===復元画像生成部1043===
図22は、復元フェーズを説明するための概念図である。図22に示すように、復元部104は、入力画像430の入力パッチ431と辞書103中の劣化パッチ402との類似性に基づいて、復元パッチ401を選択する。
復元画像生成部1043は、辞書103に格納されているパッチペア403の中から、入力パッチ431と劣化パッチ402との類似性を表す値であるパッチ類似度に基づいて、入力パッチ431のそれぞれに対応する複数の復元パッチ401を選択する。例えば、復元画像生成部1043は、入力パッチ431に対するパッチ類似度が所定値以上の劣化パッチ402に対応する復元パッチ401を選択する。また、復元画像生成部1043は、入力パッチ431に対するパッチ類似度が大きい順に、所定数の劣化パッチ402に対応する復元パッチ401を選択してもよい。
復元画像生成部1043は、複数の復元パッチ401を合成して、復元画像440を生成する。それらの復元パッチ401のそれぞれは、複数の復元パッチ401の内の1つである。その複数の復元パッチ401は、入力パッチ431のそれぞれに対応する。
復元画像生成部1043は、生成した復元画像440を劣化過程推定装置300に出力する。また、復元画像生成部1043は、その復元画像440を外部へ出力する。例えば、復元部104は、図6に示す通信部706を介して、外部に復元画像440を送信する。また、復元部104は、復元画像440を図6に示す出力部705を介して出力するようにしてもよい。また、復元部104は、図6に示す記憶装置703を介して、記録媒体707に復元画像440を記録するようにしてもよい。
尚、復元部104は、入力パッチ431と劣化パッチ402との類似性に加えて、復元画像440から切り出したパッチと復元パッチ401との類似性にも基づいて、復元パッチ401を選択するようにしてもよい。
次に、画像間(例えば、入力パッチ431と劣化パッチ402)の類似度(例えば、パッチ類似度)について説明する。
図23は、パッチ450の一例を示す図である。図23に示すように、例えばパッチ450は、複数の画素452の画素値を要素として持つ、多次元ベクトルである画素群451を含む。また、パッチ450は、パッチ450を個別に特定するパッチ識別子453を、メタ情報として含む。尚、パッチ450は、復元パッチ401、劣化パッチ402及び入力パッチ431を含む概念である。また、画素値は、輝度値でもよくこれに限定されない。
この場合、2つのパッチ間のパッチ類似度を示す値とは、パッチ間の各画素452の輝度値の差に基づく値でもよい。例えば、パッチ類似度を示す値は、パッチ間の各画素452の輝度値の差の二乗和であるSSD(Sum of Square Distance)に基づく値でもよい。例えば、パッチ類似度を示す値は、SSDを特定の定数から引いた値でもよい。この場合、特定の定数は、例えば、最小輝度のパッチと最大輝度のパッチのSSDであってよい。または、パッチ類似度を示す値は、パッチ間の各画素452の輝度値の差の絶対値和であるSAD(Sum of Absolute Distance)に基づく値でもよい。例えば、パッチ類似度を示す値は、SADを特定の定数から引いた値でもよい。この場合、特定の定数は、例えば、最小輝度のパッチと最大輝度のパッチのSADであってよい。
他に、例えば、パッチ類似度を示す値は、2つの特徴ベクトル間の角度に基づく値でもよい。または、パッチ類似度を示す値は、正規化相互相関関数により算出される値でもよく、これらに限定されない。
即ち、パッチ類似度は、2つのパッチそれぞれの画素群451が表す画像間の類似度である。以上の説明は、パッチ類似度に限らず、類似度851、類似度852についても適用される。
上述した本実施形態における第1の効果は、第1の実施形態の効果と同様である。更に、本実施形態における第2の効果は、入力画像430の劣化過程をより正確に推定し、その入力画像430に対応する、より高精度な超解像画像(復元画像440)を復元するために必要な辞書103を得ることが可能になることである。
その第2の効果を有する理由は、以下の工程を繰り返すようにしたからである。第1に、劣化過程推定装置300が学習画像411に基づいて推定劣化過程867を出力する。第2に、学習部102が推定劣化過程867に基づいて辞書103を生成する。第3に復元部104が、辞書103に基づいて復元画像440を生成する。第4に、劣化過程推定装置300の学習画像選択部340が、復元画像440に基づいて、学習画像411を選択する。
本実施形態は、第2の実施形態に適用されてもよい。即ち、各画像の局所領域が処理単位とされてよい。
以上の各実施形態で説明した各構成要素は、必ずしも個々に独立した存在である必要はない。例えば、各構成要素は、複数の構成要素が1個のモジュールとして実現されてよい。また、各構成要素は、1つの構成要素が複数のモジュールで実現されてもよい。また、各構成要素は、ある構成要素が他の構成要素の一部であるような構成であってよい。また、各構成要素は、ある構成要素の一部と他の構成要素の一部とが重複するような構成であってもよい。
以上説明した各実施形態における各構成要素及び各構成要素を実現するモジュールは、必要に応じ、可能であれば、ハードウェア的に実現されてよい。また、各構成要素及び各構成要素を実現するモジュールは、コンピュータ及びプログラムで実現されてよい。また、各構成要素及び各構成要素を実現するモジュールは、ハードウェア的なモジュールとコンピュータ及びプログラムとの混在により実現されてもよい。
そのプログラムは、例えば、磁気ディスクや半導体メモリなど、不揮発性のコンピュータ可読記録媒体に記録されて提供され、コンピュータの立ち上げ時などにコンピュータに読み取られる。この読み取られたプログラムは、そのコンピュータの動作を制御することにより、そのコンピュータを前述した各実施形態における構成要素として機能させる。
また、以上説明した各実施形態では、複数の動作をフローチャートの形式で順番に記載してあるが、その記載の順番は複数の動作を実行する順番を限定するものではない。このため、各実施形態を実施するときには、その複数の動作の順番は内容的に支障のない範囲で変更することができる。
更に、以上説明した各実施形態では、複数の動作は個々に相違するタイミングで実行されることに限定されない。例えば、ある動作の実行中に他の動作が発生したり、ある動作と他の動作との実行タイミングが部分的に乃至全部において重複していたりしていてもよい。
更に、以上説明した各実施形態では、ある動作が他の動作の契機になるように記載しているが、その記載はある動作と他の動作との全ての関係を限定するものではない。このため、各実施形態を実施するときには、その複数の動作の関係は内容的に支障のない範囲で変更することができる。また各構成要素の各動作の具体的な記載は、各構成要素の各動作を限定するものではない。このため、各構成要素の具体的な各動作は、各実施形態を実施する上で機能的、性能的、その他の特性に対して支障をきたさない範囲内で変更されて良い。
上記の実施形態の一部または全部は、以下の付記のようにも記載されうるが、以下には限られない。
(付記1)複数の第1の学習画像と入力画像とを取得する画像取得手段と、
前記入力画像の任意の領域と、複数の劣化過程のそれぞれに基づいて前記第1の学習画像の前記領域に対応する領域を劣化させた場合の複数の第1の劣化画像のそれぞれと、の間の第1の類似度に基づいて、推定劣化過程を出力する推定手段と、を含み、
前記推定劣化過程は、前記入力画像の前記領域に対応する前記劣化過程に対応する
情報処理装置。
(付記2)前記推定手段は、更に前記第1の劣化画像のそれぞれと前記第1の学習画像から前記第1の劣化画像のそれぞれへの前記劣化過程との対応関係に基づいて、前記入力画像の前記領域に対応する前記劣化過程を識別する情報を前記推定劣化過程として出力する
ことを特徴とする付記1記載の情報処理装置。
(付記3)前記第1の類似度は、前記第1の劣化画像に対応する特徴ベクトルと、前記入力画像の前記領域に対応する特徴ベクトルとの間の関係に対応する
ことを特徴とする付記1または2記載の情報処理装置。
(付記4)前記推定手段は、前記入力画像の前記領域に対応する、k(kは1以上の自然数)−近傍のk個の前記劣化過程に対応する前記推定劣化過程を出力する
ことを特徴とする付記3記載の情報処理装置。
(付記5)前記推定劣化過程に基づいて第2の学習画像を劣化させた第2の劣化画像のパッチである劣化パッチと、前記第2の学習画像のパッチである復元パッチとを含む複数のパッチペアを格納する辞書を作成する学習手段と、
前記辞書を利用して、前記入力画像から復元画像を生成し、出力する復元手段と、
前記第1の学習画像と前記復元画像との間の第2の類似度に基づいて、前記第1の学習画像を選択する選択手段と、を更に含み、
前記推定手段は、更に、前記選択された第1の学習画像の前記領域を劣化させた複数の第1の劣化画像のそれぞれと、前記入力画像の前記領域との間の、前記第1の類似度に基づいて、前記推定劣化過程を出力する
ことを特徴とする付記1乃至4のいずれか1項に記載の情報処理装置。
(付記6)前記推定手段は、更に前記第1の劣化画像のそれぞれと前記選択された第1の学習画像から前記第1の劣化画像のそれぞれへの劣化過程との対応関係に基づいて、前記入力画像の前記領域に対応する前記劣化過程を識別する情報を前記推定劣化過程として出力する
ことを特徴とする付記5記載の情報処理装置。
(付記7)前記第2の類似度は、前記第2の学習画像に対応する特徴ベクトルと前記復元画像に対応する特徴ベクトルとの間の関係に対応する
ことを特徴とする付記5または6記載の情報処理装置。
(付記8)前記推定手段は、劣化画像生成手段と特徴ベクトル算出手段と劣化過程推定用辞書作成手段と劣化過程推定用辞書手段と特徴ベクトル分類手段を含み、
前記劣化画像生成手段は、前記劣化過程に基づいて、前記学習画像から前記第1の劣化画像を生成し、前記生成した第1の劣化画像を前記特徴ベクトル算出手段に出力し、
前記特徴ベクトル算出手段は、前記第1の劣化画像に対応する前記特徴ベクトルを生成し、前記第1の劣化画像に対応する前記特徴ベクトルを前記劣化過程推定用辞書作成手段に出力し、
前記劣化過程推定用辞書作成手段は、前記第1の劣化画像に対応する前記特徴ベクトルと、前記第1の劣化画像に対応する前記特徴ベクトルに対応する前記劣化過程との関係を示す対応情報を生成し、前記生成した対応情報を前記劣化過程推定用辞書手段に出力し、
前記劣化過程推定用辞書手段は、前記対応情報を記憶し、
前記特徴ベクトル算出手段は、前記入力画像の前記領域に対応する前記特徴ベクトルを算出し、前記入力画像の前記領域に対応する前記特徴ベクトルを前記特徴ベクトル分類手段に出力し、
前記特徴ベクトル分類手段は、前記入力画像の前記領域に対応する前記特徴ベクトルと前記対応情報に含まれる前記特徴ベクトルとの間の関係に基づいて、前記入力画像の前記領域に対応する前記特徴ベクトルを、前記対応情報に含まれる前記特徴ベクトルからなる前記劣化過程のクラスのいずれかに分類し、前記入力画像の前記局所領域に対応する前記特徴ベクトルが分類された前記クラスに対応する前記推定劣化過程を外部へ出力する
ことを特徴とする付記1乃至7のいずれか1つに記載の情報処理装置。
(付記9)前記劣化過程推定用辞書作成手段は、前記第1の劣化画像に対応する前記特徴ベクトルを圧縮し、前記圧縮した特徴ベクトルと前記劣化過程との関係を示す前記対応情報を生成する
ことを特徴とする付記8記載の情報処理装置。
(付記10)前記推定手段は、前記入力画像の前記領域に対応する前記劣化過程に対応する前記第1の劣化画像を前記推定劣化過程として出力する
ことを特徴とする付記1乃至9のいずれか1つに記載の情報処理装置。
(付記11)前記入力画像の劣化情報を、利用者に入力させるための劣化情報入力手段を更に含み、
前記推定手段は、更に前記劣化情報に基づいて、前記推定劣化過程を出力する
ことを特徴とする付記1乃至10のいずれか1つに記載の情報処理装置。
(付記12)コンピュータが、
複数の第1の学習画像と入力画像とを取得し、
前記入力画像の任意の領域と、複数の劣化過程のそれぞれに基づいて前記第1の学習画像の前記領域に対応する領域を劣化させた場合の複数の第1の劣化画像のそれぞれと、の間の第1の類似度に基づいて、推定劣化過程を出力する
画像処理方法。
(付記13)前記コンピュータが、更に前記第1の劣化画像のそれぞれと前記第1の学習画像から前記第1の劣化画像のそれぞれへの前記劣化過程との対応関係に基づいて、前記入力画像の前記領域に対応する前記劣化過程を識別する情報を前記推定劣化過程として出力する
ことを特徴とする付記12記載の画像処理方法。
(付記14)前記第1の類似度は、前記第1の劣化画像に対応する特徴ベクトルと、前記入力画像の前記領域に対応する特徴ベクトルとの間の関係に対応する
ことを特徴とする付記12または13記載の画像処理方法。
(付記15)前記コンピュータが、前記入力画像の前記領域に対応する、k(kは1以上の自然数)−近傍のk個の前記劣化過程に対応する前記推定劣化過程を出力する
ことを特徴とする付記14記載の画像処理方法。
(付記16)前記コンピュータが、更に、前記推定劣化過程に基づいて第2の学習画像を劣化させた第2の劣化画像のパッチである劣化パッチと、前記第2の学習画像のパッチである復元パッチとを含む複数のパッチペアを格納する辞書を作成し、
前記辞書を利用して、前記入力画像から復元画像を生成し、出力し、
前記第1の学習画像と前記復元画像との間の第2の類似度に基づいて、前記第1の学習画像を選択し、
前記選択された第1の学習画像の前記領域を劣化させた複数の第1の劣化画像のそれぞれと、前記入力画像の前記領域との間の、前記第1の類似度に基づいて、前記推定劣化過程を出力する
ことを特徴とする付記12乃至15のいずれか1つに記載の画像処理方法。
(付記17)前記コンピュータが、更に前記第1の劣化画像のそれぞれと前記選択された第1の学習画像から前記第1の劣化画像のそれぞれへの劣化過程との対応関係に基づいて、前記入力画像の前記領域に対応する前記劣化過程を識別する情報を前記推定劣化過程として出力する
ことを特徴とする付記16記載の画像処理方法。
(付記18)前記第2の類似度は、前記第2の学習画像に対応する特徴ベクトルと前記復元画像に対応する特徴ベクトルとの間の関係に対応する
ことを特徴とする付記16または17記載の画像処理方法。
(付記19)前記コンピュータが、前記劣化過程に基づいて、前記学習画像から前記第1の劣化画像を生成し、前記生成した第1の劣化画像を出力し、
前記第1の劣化画像に対応する前記特徴ベクトルを生成し、前記第1の劣化画像に対応する前記特徴ベクトルを出力し、
前記第1の劣化画像に対応する前記特徴ベクトルと、前記第1の劣化画像に対応する前記特徴ベクトルに対応する前記劣化過程との関係を示す対応情報を生成し、前記生成した対応情報を出力し、
前記対応情報を記憶し、
前記入力画像の前記領域に対応する前記特徴ベクトルを算出し、前記入力画像の前記領域に対応する前記特徴ベクトルを出力し、
前記入力画像の前記領域に対応する前記特徴ベクトルと前記対応情報に含まれる前記特徴ベクトルとの間の関係に基づいて、前記入力画像の前記領域に対応する前記特徴ベクトルを、前記対応情報に含まれる前記特徴ベクトルからなる前記劣化過程のクラスのいずれかに分類し、前記入力画像の前記局所領域に対応する前記特徴ベクトルが分類された前記クラスに対応する前記推定劣化過程を外部へ出力する
ことを特徴とする付記12乃至18のいずれか1つに記載の画像処理方法。
(付記20)前記コンピュータが、前記第1の劣化画像に対応する前記特徴ベクトルを圧縮し、前記圧縮した特徴ベクトルと前記劣化過程との関係を示す前記対応情報を生成する
ことを特徴とする付記19記載の画像処理方法。
(付記21)前記コンピュータが、前記入力画像の前記領域に対応する前記劣化過程に対応する前記第1の劣化画像を前記推定劣化過程として出力する
ことを特徴とする付記12乃至20のいずれか1つに記載の画像処理方法。
(付記22)複数の第1の学習画像と入力画像とを取得し、
前記入力画像の任意の領域と、複数の劣化過程のそれぞれに基づいて前記第1の学習画像の前記領域に対応する領域を劣化させた場合の複数の第1の劣化画像のそれぞれと、の間の第1の類似度に基づいて、推定劣化過程を出力する処理をコンピュータに実行させる
プログラム。
(付記23)更に前記第1の劣化画像のそれぞれと前記第1の学習画像から前記第1の劣化画像のそれぞれへの前記劣化過程との対応関係に基づいて、前記入力画像の前記領域に対応する前記劣化過程を識別する情報を前記推定劣化過程として出力する処理をコンピュータに実行させる
ことを特徴とする付記22記載のプログラム。
(付記24)前記第1の類似度は、前記第1の劣化画像に対応する特徴ベクトルと、前記入力画像の前記領域に対応する特徴ベクトルとの間の関係に対応する
ことを特徴とする付記22または23記載のプログラム。
(付記25)前記入力画像の前記領域に対応する、k(kは1以上の自然数)−近傍のk個の前記劣化過程に対応する前記推定劣化過程を出力する処理をコンピュータに実行させる
ことを特徴とする付記24記載のプログラム。
(付記26)更に、前記推定劣化過程に基づいて第2の学習画像を劣化させた第2の劣化画像のパッチである劣化パッチと、前記第2の学習画像のパッチである復元パッチとを含む複数のパッチペアを格納する辞書を作成し、
前記辞書を利用して、前記入力画像から復元画像を生成し、出力し、
前記第1の学習画像と前記復元画像との間の第2の類似度に基づいて、前記第1の学習画像を選択し、
前記選択された第1の学習画像の前記領域を劣化させた複数の第1の劣化画像のそれぞれと、前記入力画像の前記領域との間の、前記第1の類似度に基づいて、前記推定劣化過程を出力する処理をコンピュータに実行させる
ことを特徴とする付記22乃至25のいずれか1つに記載のプログラム。
(付記27)更に前記第1の劣化画像のそれぞれと前記選択された第1の学習画像から前記第1の劣化画像のそれぞれへの劣化過程との対応関係に基づいて、前記入力画像の前記領域に対応する前記劣化過程を識別する情報を前記推定劣化過程として出力する処理をコンピュータに実行させる
ことを特徴とする付記26記載のプログラム。
(付記28)前記第2の類似度は、前記第2の学習画像に対応する特徴ベクトルと前記復元画像に対応する特徴ベクトルとの間の関係に対応する処理をコンピュータに実行させる
ことを特徴とする付記26または27記載のプログラム。
(付記29)前記劣化過程に基づいて、前記学習画像から前記第1の劣化画像を生成し、前記生成した第1の劣化画像を出力し、
前記第1の劣化画像に対応する前記特徴ベクトルを生成し、前記第1の劣化画像に対応する前記特徴ベクトルを出力し、
前記第1の劣化画像に対応する前記特徴ベクトルと、前記第1の劣化画像に対応する前記特徴ベクトルに対応する前記劣化過程との関係を示す対応情報を生成し、前記生成した対応情報を出力し、
前記対応情報を記憶し、
前記入力画像の前記領域に対応する前記特徴ベクトルを算出し、前記入力画像の前記領域に対応する前記特徴ベクトルを出力し、
前記入力画像の前記領域に対応する前記特徴ベクトルと前記対応情報に含まれる前記特徴ベクトルとの間の関係に基づいて、前記入力画像の前記領域に対応する前記特徴ベクトルを、前記対応情報に含まれる前記特徴ベクトルからなる前記劣化過程のクラスのいずれかに分類し、前記入力画像の前記局所領域に対応する前記特徴ベクトルが分類された前記クラスに対応する前記推定劣化過程を外部へ出力する処理をコンピュータに実行させる
ことを特徴とする付記22乃至28のいずれか1つに記載のプログラム。
(付記30)前記第1の劣化画像に対応する前記特徴ベクトルを圧縮し、前記圧縮した特徴ベクトルと前記劣化過程との関係を示す前記対応情報を生成する処理をコンピュータに実行させる
ことを特徴とする付記29記載のプログラム。
(付記31)前記入力画像の前記領域に対応する前記劣化過程に対応する前記第1の劣化画像を前記推定劣化過程として出力する処理をコンピュータに実行させる
ことを特徴とする付記22乃至30のいずれか1つに記載のプログラム。
(付記32)付記22乃至付記31のいずれか一つに記載のプログラムを記録したコンピュータ読み取り可能な非一時的記録媒体。
(付記33)プロセッサと、
プロセッサが画像取得手段及び推定手段として動作するための、プロセッサによって実行される命令を保持する記憶部とを含み、
前記画像取得手段は、複数の第1の学習画像と入力画像とを取得し、
前記推定手段は、前記入力画像の任意の領域と、複数の劣化過程のそれぞれに基づいて前記第1の学習画像の前記領域に対応する領域を劣化させた場合の複数の第1の劣化画像のそれぞれと、の間の第1の類似度に基づいて、推定劣化過程を出力し、
前記推定劣化過程は、前記入力画像の前記領域に対応する前記劣化過程に対応する
情報処理装置。
以上、各実施形態を参照して本発明を説明したが、本発明は上記実施形態に限定されるものではない。本発明の構成や詳細には、本発明のスコープ内で当業者が理解しえる様々な変更をすることができる。
この出願は、2013年8月15日に出願された日本出願特願2013−168793を基礎とする優先権を主張し、その開示の全てをここに取り込む。
100 劣化過程推定装置
101 画像処理システム
102 学習部
103 辞書
104 復元部
110 対応情報生成部
120 劣化過程選択部
150 画像取得部
151 学習画像取得部
152 入力画像取得部
160 推定部
161 劣化画像群生成部
162 特徴ベクトル算出部
163 劣化過程推定用辞書作成部
164 特徴ベクトル分類部
165 劣化過程推定用辞書
166 劣化過程推定用辞書作成部
167 特徴ベクトル分類部
168 劣化画像推定用辞書
200 劣化過程推定装置
201 画像処理システム
202 学習部
210 対応情報生成部
220 劣化過程選択部
260 推定部
300 劣化過程推定装置
301 画像処理システム
340 学習画像選択部
360 推定部
401 復元パッチ
402 劣化パッチ
403 パッチペア
410 学習画像
411 学習画像
420 劣化画像
421 劣化画像
430 入力画像
431 入力パッチ
440 復元画像
700 コンピュータ
701 CPU
702 記憶部
703 記憶装置
704 入力部
705 出力部
706 通信部
707 記録媒体
851 類似度
852 類似度
860 対応情報
861 劣化過程
862 特徴ベクトル
864 特徴ベクトル
867 推定劣化過程
1021 受付部
1022 劣化画像生成部
1023 パッチペア生成部
1024 登録部
1041 受付部
1042 パッチ生成部
1043 復元画像生成部

Claims (13)

  1. 複数の第1の学習画像と入力画像とを取得する画像取得手段と、
    前記入力画像の任意の領域と、複数の劣化過程のそれぞれに基づいて前記第1の学習画像の前記領域に対応する領域を劣化させた場合の複数の第1の劣化画像のそれぞれと、の間の第1の類似度に基づいて、推定劣化過程を出力する推定手段と、
    前記推定劣化過程に基づいて第2の学習画像を劣化させた第2の劣化画像のパッチである劣化パッチと、前記第2の学習画像のパッチである復元パッチとを含む複数のパッチペアを格納する辞書を作成する学習手段と、を含み、
    前記推定劣化過程は、前記入力画像の前記領域に対応する前記劣化過程に対応する
    情報処理装置。
  2. 前記推定手段は、更に前記第1の劣化画像のそれぞれと前記第1の学習画像から前記第1の劣化画像のそれぞれへの前記劣化過程との対応関係に基づいて、前記入力画像の前記領域に対応する前記劣化過程を識別する情報を前記推定劣化過程として出力する
    ことを特徴とする請求項1記載の情報処理装置。
  3. 記辞書を利用して、前記入力画像から復元画像を生成し、出力する復元手段と、
    前記第1の学習画像と前記復元画像との間の第2の類似度に基づいて、前記第1の学習画像を選択する選択手段、を更に含み、
    前記推定手段は、更に、前記選択された第1の学習画像の前記領域を劣化させた複数の第1の劣化画像のそれぞれと、前記入力画像の前記領域との間の、前記第1の類似度に基づいて、前記推定劣化過程を出力する
    ことを特徴とする請求項1又は2に記載の情報処理装置。
  4. 前記推定手段は、更に前記第1の劣化画像のそれぞれと前記選択された第1の学習画像から前記第1の劣化画像のそれぞれへの劣化過程との対応関係に基づいて、前記入力画像の前記領域に対応する前記劣化過程を識別する情報を前記推定劣化過程として出力する
    ことを特徴とする請求項記載の情報処理装置。
  5. 前記第2の類似度は、前記第2の学習画像に対応する特徴ベクトルと前記復元画像に対応する特徴ベクトルとの間の関係に対応する
    ことを特徴とする請求項または記載の情報処理装置。
  6. 前記第1の類似度は、前記第1の劣化画像に対応する特徴ベクトルと、前記入力画像の前記領域に対応する特徴ベクトルとの間の関係に対応する
    ことを特徴とする請求項1乃至5のいずれか1項に記載の情報処理装置。
  7. 前記推定手段は、前記入力画像の前記領域に対応する、k(kは1以上の自然数)−近傍のk個の前記劣化過程に対応する前記推定劣化過程を出力する
    ことを特徴とする請求項6記載の情報処理装置。
  8. 前記推定手段は、劣化画像生成手段と特徴ベクトル算出手段と劣化過程推定用辞書作成手段と劣化過程推定用辞書手段と特徴ベクトル分類手段を含み、
    前記劣化画像生成手段は、前記劣化過程に基づいて、前記第1の学習画像から前記第1の劣化画像を生成し、前記生成した第1の劣化画像を前記特徴ベクトル算出手段に出力し、
    前記特徴ベクトル算出手段は、前記第1の劣化画像に対応する前記特徴ベクトルを生成し、前記第1の劣化画像に対応する前記特徴ベクトルを前記劣化過程推定用辞書作成手段に出力し、
    前記劣化過程推定用辞書作成手段は、前記第1の劣化画像に対応する前記特徴ベクトルと、前記第1の劣化画像に対応する前記特徴ベクトルに対応する前記劣化過程との関係を示す対応情報を生成し、前記生成した対応情報を前記劣化過程推定用辞書手段に出力し、
    前記劣化過程推定用辞書手段は、前記対応情報を記憶し、
    前記特徴ベクトル算出手段は、前記入力画像の前記領域に対応する前記特徴ベクトルを算出し、前記入力画像の前記領域に対応する前記特徴ベクトルを前記特徴ベクトル分類手段に出力し、
    前記特徴ベクトル分類手段は、前記入力画像の前記領域に対応する前記特徴ベクトルと前記対応情報に含まれる前記特徴ベクトルとの間の関係に基づいて、前記入力画像の前記領域に対応する前記特徴ベクトルを、前記対応情報に含まれる前記特徴ベクトルからなる前記劣化過程のクラスのいずれかに分類し、前記入力画像の前記領域に対応する前記特徴ベクトルが分類された前記クラスに対応する前記推定劣化過程を外部へ出力する
    ことを特徴とする請求項6又は7に記載の情報処理装置。
  9. 前記劣化過程推定用辞書作成手段は、前記第1の劣化画像に対応する前記特徴ベクトルを圧縮し、前記圧縮した特徴ベクトルと前記劣化過程との関係を示す前記対応情報を生成する
    ことを特徴とする請求項8記載の情報処理装置。
  10. 前記推定手段は、前記入力画像の前記領域に対応する前記劣化過程に対応する前記第1の劣化画像を前記推定劣化過程として出力する
    ことを特徴とする請求項1乃至9のいずれか1項に記載の情報処理装置。
  11. 前記入力画像の劣化情報を、利用者に入力させるための劣化情報入力手段を更に含み、
    前記推定手段は、更に前記劣化情報に基づいて、前記推定劣化過程を出力する
    ことを特徴とする請求項1乃至10のいずれか1項に記載の情報処理装置。
  12. コンピュータが、
    複数の第1の学習画像と入力画像とを取得し、
    前記入力画像の任意の領域と、複数の劣化過程のそれぞれに基づいて前記第1の学習画像の前記領域に対応する領域を劣化させた場合の複数の第1の劣化画像のそれぞれと、の間の第1の類似度に基づいて、推定劣化過程を出力し、
    前記推定劣化過程に基づいて第2の学習画像を劣化させた第2の劣化画像のパッチである劣化パッチと、前記第2の学習画像のパッチである復元パッチとを含む複数のパッチペアを格納する辞書を作成する
    画像処理方法。
  13. 複数の第1の学習画像と入力画像とを取得し、
    前記入力画像の任意の領域と、複数の劣化過程のそれぞれに基づいて前記第1の学習画像の前記領域に対応する領域を劣化させた場合の複数の第1の劣化画像のそれぞれと、の間の第1の類似度に基づいて、推定劣化過程を出力する処理と、
    前記推定劣化過程に基づいて第2の学習画像を劣化させた第2の劣化画像のパッチである劣化パッチと、前記第2の学習画像のパッチである復元パッチとを含む複数のパッチペアを格納する辞書を作成する処理と、をコンピュータに実行させる
    プログラム。
JP2015531723A 2013-08-15 2014-07-18 画像処理を実行する情報処理装置及び画像処理方法 Active JP6512100B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2013168793 2013-08-15
JP2013168793 2013-08-15
PCT/JP2014/003824 WO2015022771A1 (ja) 2013-08-15 2014-07-18 画像処理を実行する情報処理装置及び画像処理方法

Publications (2)

Publication Number Publication Date
JPWO2015022771A1 JPWO2015022771A1 (ja) 2017-03-02
JP6512100B2 true JP6512100B2 (ja) 2019-05-15

Family

ID=52468165

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2015531723A Active JP6512100B2 (ja) 2013-08-15 2014-07-18 画像処理を実行する情報処理装置及び画像処理方法

Country Status (4)

Country Link
US (1) US9875532B2 (ja)
JP (1) JP6512100B2 (ja)
CN (1) CN105453132B (ja)
WO (1) WO2015022771A1 (ja)

Families Citing this family (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10225575B2 (en) * 2014-09-03 2019-03-05 Nec Corporation Image reconstruction in which unknown patch is replaced by selected patch
JP6341059B2 (ja) * 2014-10-31 2018-06-13 オムロン株式会社 文字認識装置、文字認識方法、およびプログラム
JP2016153933A (ja) * 2015-02-20 2016-08-25 株式会社リコー 画像処理装置、画像処理システム、画像処理方法、プログラム、及び記録媒体
KR102271285B1 (ko) * 2016-11-09 2021-07-01 삼성전자주식회사 영상처리장치 및 영상처리방법
JP6769558B2 (ja) * 2017-01-12 2020-10-14 日本電気株式会社 情報処理装置、情報処理方法及びプログラム
JP6919276B2 (ja) * 2017-03-31 2021-08-18 富士通株式会社 画像表示プログラム、画像表示装置および画像表示方法
EP3637363B1 (en) * 2017-06-05 2023-05-24 Rakuten Group, Inc. Image processing device, image processing method and image processing program
JP6773829B2 (ja) * 2019-02-21 2020-10-21 セコム株式会社 対象物認識装置、対象物認識方法、及び対象物認識プログラム
JP7507600B2 (ja) * 2019-05-15 2024-06-28 ベイシス株式会社 計量メータ・設置機器情報管理システム、計量メータ・設置機器情報管理方法及び計量メータ・設置機器情報管理プログラム
JP7383946B2 (ja) * 2019-09-12 2023-11-21 株式会社アイシン 画像復元装置、画像復元方法、画像復元プログラム、復元器生成装置、復元器生成方法、復元器生成プログラム、判定器生成装置、判定器生成方法、判定器生成プログラム、物品判定装置、物品判定方法、および物品判定プログラム
JP7204988B2 (ja) * 2020-03-04 2023-01-16 三菱電機株式会社 ひび割れ検出装置、ひび割れ検出方法及びひび割れ検出プログラム
US20250054110A1 (en) * 2022-01-04 2025-02-13 Sony Group Corporation Image processing device, image processing method, and recording medium

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS57178578A (en) * 1981-04-27 1982-11-02 Toshiba Corp Pattern recognition system
JP4264332B2 (ja) 2003-11-19 2009-05-13 三菱重工業株式会社 文字認識装置、ナンバープレート認識システム
JP4168938B2 (ja) * 2004-01-21 2008-10-22 セイコーエプソン株式会社 画像処理装置、画像処理プログラム及び画像処理方法
JP2009259190A (ja) * 2008-03-28 2009-11-05 Fujitsu Ltd 文字認識プログラムおよび文字認識装置
JP2010273764A (ja) 2009-05-27 2010-12-09 Konica Minolta Medical & Graphic Inc 画像処理装置及び方法
JP5522736B2 (ja) 2010-11-25 2014-06-18 日本放送協会 画像超解像装置およびそのプログラム
JP2012244395A (ja) 2011-05-19 2012-12-10 Sony Corp 学習装置および方法、画像処理装置および方法、プログラム、並びに記録媒体
JP5769241B2 (ja) 2011-07-15 2015-08-26 国立大学法人 筑波大学 超解像画像処理装置及び超解像画像処理用辞書作成装置
JP6075295B2 (ja) * 2011-12-12 2017-02-08 日本電気株式会社 辞書作成装置、画像処理装置、画像処理システム、辞書作成方法、画像処理方法及びプログラム
JP6292911B2 (ja) * 2014-02-07 2018-03-14 キヤノン株式会社 画像処理方法、画像処理プログラムおよび画像処理装置

Also Published As

Publication number Publication date
US20160189357A1 (en) 2016-06-30
US9875532B2 (en) 2018-01-23
CN105453132B (zh) 2019-04-05
WO2015022771A1 (ja) 2015-02-19
CN105453132A (zh) 2016-03-30
HK1220796A1 (zh) 2017-05-12
JPWO2015022771A1 (ja) 2017-03-02

Similar Documents

Publication Publication Date Title
JP6512100B2 (ja) 画像処理を実行する情報処理装置及び画像処理方法
KR102519085B1 (ko) 로컬 및 글로벌 모션에 효율적인 멀티-프레임 초해상도 방법 및 장치
JP6287855B2 (ja) 画像処理装置及び画像処理方法
CN112348958B (zh) 关键帧图像的采集方法、装置、系统和三维重建方法
KR20230054432A (ko) 인물 이미지 복원 방법, 장치, 전자 기기, 기억 매체 및 프로그램 제품
KR101723738B1 (ko) 딕셔너리 학습 기반 해상도 향상 장치 및 방법
US9436981B2 (en) Dictionary creation device, image processing device, image processing system, dictionary creation method, image processing method, and program
JP4948593B2 (ja) 以前に圧縮された画像における合成の検出
JP2007000205A (ja) 画像処理装置及び画像処理方法並びに画像処理プログラム
JP2015232869A (ja) 画像処理装置、画像処理方法及び画像処理プログラム
JP2016212784A (ja) 画像処理装置、画像処理方法
US9767533B2 (en) Image resolution enhancement based on data from related images
JP6075294B2 (ja) 画像処理システム及び画像処理方法
CN114758145A (zh) 一种图像脱敏方法、装置、电子设备及存储介质
JP2016509805A (ja) 画像ストリームの高フレームレート化
US9392146B2 (en) Apparatus and method for extracting object
CN104813362A (zh) 图像处理设备及图像处理方法
JP6443540B2 (ja) 画像処理装置、画像処理方法および記憶媒体
CN119107228A (zh) 图像拼接方法、系统、电子设备及存储介质
Kawulok et al. Towards robust evaluation of super-resolution satellite image reconstruction
JP6056354B2 (ja) 画像処理装置、画像処理方法および画像処理プログラム
Salvador et al. Fast single-image super-resolution with filter selection
JP6751663B2 (ja) 画像処理装置、画像処理方法
Shibata et al. Single image super resolution reconstruction in perturbed exemplar sub-space
HK1220796B (zh) 实施图像处理的信息处理设备和图像处理方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20170615

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20180807

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20181003

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20190312

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20190325

R150 Certificate of patent or registration of utility model

Ref document number: 6512100

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150