JP6769558B2 - 情報処理装置、情報処理方法及びプログラム - Google Patents

情報処理装置、情報処理方法及びプログラム Download PDF

Info

Publication number
JP6769558B2
JP6769558B2 JP2019536114A JP2019536114A JP6769558B2 JP 6769558 B2 JP6769558 B2 JP 6769558B2 JP 2019536114 A JP2019536114 A JP 2019536114A JP 2019536114 A JP2019536114 A JP 2019536114A JP 6769558 B2 JP6769558 B2 JP 6769558B2
Authority
JP
Japan
Prior art keywords
data
coefficient
image
resolution
basis
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2019536114A
Other languages
English (en)
Other versions
JP2020504386A (ja
Inventor
カピック リ
カピック リ
剛志 柴田
剛志 柴田
佐藤 敦
敦 佐藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Publication of JP2020504386A publication Critical patent/JP2020504386A/ja
Application granted granted Critical
Publication of JP6769558B2 publication Critical patent/JP6769558B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T3/00Geometric image transformations in the plane of the image
    • G06T3/40Scaling of whole images or parts thereof, e.g. expanding or contracting
    • G06T3/4053Scaling of whole images or parts thereof, e.g. expanding or contracting based on super-resolution, i.e. the output image resolution being higher than the sensor resolution
    • G06T3/4076Scaling of whole images or parts thereof, e.g. expanding or contracting based on super-resolution, i.e. the output image resolution being higher than the sensor resolution using the original low-resolution images to iteratively correct the high-resolution images
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T3/00Geometric image transformations in the plane of the image
    • G06T3/40Scaling of whole images or parts thereof, e.g. expanding or contracting
    • G06T3/4053Scaling of whole images or parts thereof, e.g. expanding or contracting based on super-resolution, i.e. the output image resolution being higher than the sensor resolution
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T3/00Geometric image transformations in the plane of the image
    • G06T3/40Scaling of whole images or parts thereof, e.g. expanding or contracting
    • G06T3/4053Scaling of whole images or parts thereof, e.g. expanding or contracting based on super-resolution, i.e. the output image resolution being higher than the sensor resolution
    • G06T3/4069Scaling of whole images or parts thereof, e.g. expanding or contracting based on super-resolution, i.e. the output image resolution being higher than the sensor resolution by subpixel displacements
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T5/00Image enhancement or restoration
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T5/00Image enhancement or restoration
    • G06T5/50Image enhancement or restoration using two or more images, e.g. averaging or subtraction

Landscapes

  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Image Processing (AREA)

Description

本発明は情報処理技術に関し、特に画像処理技術に関する。
実例に基づき高解像出力を提供する事例ベースの超解像(exemplar-based super resolution)の超解像システムは、通常、高解像出力の復元のための高周波情報を提供するデータベースを備えている。
特許文献1は、劣化パッチと復元パッチとを含む辞書を用いることによって、復元画像よりも解像度の低い低解像画像から、復元された画像を生成する情報処理装置を開示する。復元パッチは、所定の画像を分割することによって生成される、その所定の画像の部分画像である。劣化パッチは、その所定の画像を劣化させることによって生成される劣化画像の、部分画像である。復元パッチの周波数は、劣化パッチの周波数よりも高い。
特許文献2は、劣化パッチと復元パッチを含む辞書を生成する辞書生成装置を開示する。
特許文献3は、パッチの組み合わせから高周波基底辞書と中周波基底辞書を生成する画像処理装置を開示する。パッチの組み合わせの各々は、高周波パッチと中周波パッチとを含む。高解像パッチは、入力画像の高周波成分を表す高周波画像の部分画像である。中解像パッチは入力画像の中周波成分を表す中周波画像の部分画像である。
特許文献4は、3枚以上のソース画像とソース画像の特徴ベクトルとに基づいて、モーフィング画像を生成する画像生成装置を開示する。特徴ベクトルは、ソース画像の特徴線を表す。
非特許文献1は、高解像顔画像を、大量の他の高解像顔画像によって低解像画像から合成する方法を開示する。
国際公開2013/089261号公報 国際公開2013/089265号公報 特開2015−176500号公報 特開2012−164152号公報
Liu Ce, Heung-Yeung Shum, and William T. Freeman, "Face Hallucination: Theory and Practice," International Journal of Computer Vision 75(1), pp. 115-134, 2007.
超解像システムの上記データベースは、データベースが顔画像等の個人情報を含むことがあるため、プライバシーの問題につながることがある。超解像システムが使用者に販売される又は流通する場合、超解像システムのデータベースのプライバシーは、保護されない。
例えば、特許文献1及び特許文献2の技術によるデータベースは、復元パッチを含む。復元パッチは所定の画像を復元パッチに分割することによって生成されているので、所定の画像を、復元パッチの間の連続性に基づいて、復元パッチから復元できる。所定の画像が顔画像である場合、顔画像を、データベース内の復元パッチから復元できる。
特許文献3の技術による画像処理装置において、中周波パッチと高周波パッチとの組み合わせが、辞書に蓄積される。高周波画像を、高周波パッチの間の連続性に基づいて、高周波パッチから復元できる。高周波画像は、エッジと、アウトラインと、輪郭と、等を表す高周波成分である。したがって、入力画像が顔画像である場合、顔を、高周波画像中において認識できる。
特許文献4の画像生成装置は、画像を含むデータベースを備える必要はない。特許文献4の画像生成装置のためのソース画像として顔画像が用いられる場合、顔画像の顔を、画像生成装置が出力するモーフィング画像の少なくとも一部において認識できる。
非特許文献1の技術によるデータベースは、多くの高解像顔画像そのものを含んでいる。
したがって、特許文献1から4及び非特許文献1による技術は、データベースにおけるプライバシーを高めることができない。
本発明の目的の1つは、データベースにおけるプライバシーを高めることのできる画像処理技術を提供することである。
本発明の一態様に係る情報処理装置は、第1のデータから、複数の基底と複数の第1の係数集合の各々との組み合わせが前記第1のデータを表す、前記複数の基底と前記複数の第1の係数集合とを生成する基底合成手段と、前記複数の第1の係数集合に基づいて、前記複数の第1の係数集合と異なる第2の係数集合を決定し、前記複数の基底と前記第2の係数集合を用いて第2のデータを合成するデータ合成手段と、を備える。
本発明の一態様に係る情報処理方法は、第1のデータから、複数の基底と複数の第1の係数集合の各々との組み合わせが前記第1のデータを表す、前記複数の基底と前記複数の第1の係数集合とを生成し、前記複数の第1の係数集合に基づいて、前記複数の第1の係数集合と異なる第2の係数集合を決定し、前記複数の基底と前記第2の係数集合を用いて第2のデータを合成する。
本発明の一態様に係る記憶媒体は、第1のデータから、複数の基底と複数の第1の係数集合の各々との組み合わせが前記第1のデータを表す、前記複数の基底と前記複数の第1の係数集合とを生成する基底合成処理と、前記複数の第1の係数集合に基づいて、前記複数の第1の係数集合と異なる第2の係数集合を決定し、前記複数の基底と前記第2の係数集合を用いて第2のデータを合成するデータ合成処理と、をコンピュータに実行させるプログラムを記憶する。
本発明は、データベースにおけるプライバシーを高めることができる。
図1は、本発明の第1の実施形態に係る情報処理装置の構成の例を示すブロック図である。 図2は、本発明の第1の実施形態に係る情報処理装置の、データ合成フェーズにおいて動作する要素を示すブロック図である。 図3は、本発明の第1の実施形態に係る情報処理装置のデータ合成フェーズにおける動作を示すフローチャートである。 図4は、顔画像と、顔画像がNMFにより因子分解された基底を表す画像と、の例を模式的に表す図である。 図5は、本発明の第1の実施形態に係る情報処理装置の、高解像画像復元フェーズにおいて動作する要素を示すブロック図である。 図6は、本発明の第1の実施形態に係る情報処理装置の高解像画像復元フェーズにおける動作例を示すフローチャートである。 図7は、本発明の第2の実施形態に係る情報処理装置の構成の例を示すブロック図である。 図8は、第2の実施形態に係る情報処理装置がデータ合成フェーズにある場合に動作する要素を示すブロック図である。 図9は、本発明の第2の実施形態に係る情報処理装置のデータ合成フェーズにおける動作の例を示すフローチャートである。 図10は、本発明の第3の実施形態に係る情報処理装置の構成の例を示すブロック図である。 図11は、本発明の第3の実施形態に係る情報処理装置の動作例を示すフローチャートである。 図12は、本発明のいずれかの実施例に係る情報処理装置を実現するために用いることができるコンピュータのハードウェア構成の例を示すブロック図である。
<第1の実施形態>
図面を参照しながら本発明の第1の実施形態を詳細に説明する。
図1は、本発明の第1の実施形態に係る情報処理装置100の構成の例を示すブロック図である。
情報処理装置100は、超解像部101と、第1入力部102と、基底合成部103と、データ合成部104とを含む。超解像部101は、データ記憶部105と、第2入力部106と、超解像実行部107と、出力部108とを含む。データ記憶部105は、辞書105とも表記されることがある。
まず、超解像部101の概要を説明する。超解像部101は、例えばデータ合成部104からの画像ペア等の、データペアを含む辞書データを受け取ってよく、受け取った辞書データを記憶していてよい。データペアの各々は、低解像辞書データ(以下、低解像データとも表記する)と、その低解像辞書データの高解像辞書データ(以下、高解像データとも表記する)と、を含む。1つのペアに含まれる低解像データ及び高解像データは、同じ物又は同じ人物を表す。低解像データは、高解像データよりも解像度が低いデータである。低解像データ及び高解像データは、例えば顔画像等の画像であってよい。この場合、低解像データを、低解像画像、及び低解像顔画像と表記することがある。高解像データを、高解像画像、及び高解像顔画像と表記することがある。超解像部101は、解像度の高い画像が得られていない低解像画像を受け取る。超解像部101が受け取る、解像度の高い画像が得られていない低解像画像を、クエリ画像と表記する。超解像部101は、辞書データに基づいて、低解像入力画像(例えば低解像顔画像)から高解像画像を復元する。超解像部101が復元した高解像画像は、高解像復元画像とも表記される。超解像部101は、後で詳細に説明する。
第1入力部102は、例えばサーバ又は端末装置から、入力データを受け取る。入力データは、例えば顔画像等の画像であってもよい。その場合、入力データは、入力画像や入力顔画像とも表記される。入力データは、実在する物又は人物の情報を表す。例えば、入力画像は、実在する物又は人物の画像である。顔画像は、実在する人物の顔を表す。以下の説明では、主に入力データが画像である場合について説明するが、入力データは、画像に限られない。
第1入力部102が受け取る入力画像は、情報処理装置100におけるデータベースのための辞書画像を生成するために用いられる。例えば、情報処理装置100が超解像顔画像を復元するよう構成されている場合、第1入力部102は、実在する人物の顔画像を、辞書画像として受け取る。
基底合成部103は、入力データから、因子分解法によって、基底を係数集合と共に生成する。後述するように、係数集合は、基底にそれぞれ割り当てられる係数の集合であり、複数の係数集合のうちそれぞれの係数集合は、基底と共に、例えば1枚の画像等の、1つの入力データを表す。例えば、基底合成部103は、第1入力部102から受け取った、例えば入力画像等の入力データを、非負値行列因子分解(Non−negative Matrix Factrization;NMF)に基づいて、基底及び係数に因子分解する。情報処理装置100が顔画像の高解像画像又は超解像画像を得るために用いられる場合、基底合成部103は、顔画像である入力画像を、NMFによって基底及び係数に因子分解する。NMFによって生成された基底は、NMF基底とも表記される。入力データが顔画像である場合、異なるNMF基底は、異なる顔部品を表すことがある。
まず、基底合成部103は、例えば複数の入力画像等の入力データを表す行列を生成する。入力画像を表す行列を、入力データ行列と表記する。入力データ行列の例を数1に示す。数1において、行列Pは、入力データ行列である。列ベクトルpからpは、それぞれ、行列Pの第1列から第M列の要素に対応する。複数の入力画像は、ベクトルpからpによって表される。ベクトルpからpのそれぞれは、入力データ行列Pに用いられる入力画像の1枚を表す。基底合成部103は、ベクトルpからpのうち1つのベクトルの要素が複数の入力画像のうち1枚の入力画像の画素値を表すように、入力画像の各々を、ベクトルpからpのうちの1つに変換してもよい。スカラーMは、ベクトルpからpの数、すなわち、入力データ行列Pに用いられる入力画像の枚数を表す。入力画像の画素値の各々は、0以上、すなわち、非負である。したがって、行列Pの要素の各々は、0以上である。すなわち、行列Pは、非負値行列である。以下の説明において、ベクトルpからpの各々の、要素の個数は、スカラーKによって表される。すなわち、行列Pは、K×M行列であり、ベクトルpからpの各々は、K次元ベクトルである。以下の説明において、ベクトルpからpは、サンプルベクトルとも表記される。
Figure 0006769558
次に、基底合成部103は、既存のNMF法を用いることによって、入力データ行列Pを2つの非負値行列に因子分解してよい。数2の式は、入力データ行列Pの2つの非負値行列F及びAへの因子分解を表す。以下の説明において、行列Fは、K×N行列であり、行列Aは、N×M行列である。スカラーNは、基底の個数を表し、情報処理装置100の使用者によって、予め定められていてよい。
Figure 0006769558
行列Fは、数3のように、N列ベクトルΦからΦによって表される。ベクトルΦからΦは、それぞれ、行列Fの1つの列の要素を表す。ベクトルΦからΦの各々の、要素の個数はKである。
Figure 0006769558
K次元ベクトルΦからΦは、入力画像の、基底、すなわち、NMFによる基底ベクトルである。上述の通り、基底合成部103は、入力画像をそれぞれ表すサンプルベクトルpからpを用いて生成された行列を、基底ベクトルΦ1からΦNと係数に因子分解する。その結果、サンプルベクトルpからpは、数4の式によって表される。
Figure 0006769558
数4の式において、スカラーanmは、数2の行列Aの(n,m)要素である。サンプル(例えば、サンプルベクトルp)を表すために基底(例えば、基底ベクトルΦ)に割り当てられるスカラー(例えば、anm)を、結合係数とも表記し、単に係数とも表記する。1つのサンプル(例えば、サンプルベクトルp等)を表すための結合係数の集合(例えば、{a1m,...,aNm})を、結合係数集合と表記し、単に係数集合とも表記する。
データ合成部104は、サンプルベクトルpからpの結合係数集合のいずれとも異なる、結合係数集合を生成してよい。データ合成部104が生成する結合係数集合の個数は、予め定められていてよい。データ合成部104は、生成した結合係数集合と基底(例えば、基底ベクトルΦ(n=1,...,N))とを用いて、新たなデータを生成してもよい。データ合成部104は、生成した新たなデータをデータ記憶部105に保存する。データ合成部104が生成した新たなデータを、合成データと表記する。
データ合成部104は、生成した新たなデータ、すなわち合成データから、低解像データを生成してもよい。低解像データの生成方法は、低解像データを生成する既存の方法の1つでよい。データ合成部104は、低解像データを、その低解像データが生成された新たなデータと関連付ける。
データ合成部104によって生成された新たなデータが画像である場合、データ合成部104は、生成された画像の低解像画像を、サンプリング、スムージング等によってさらに生成してもよい。低解像画像が生成された画像を、高解像画像と表記する。画像が顔画像である場合、画像を高解像顔画像と表記し、低解像画像を低解像顔画像と表記する。データ合成部104は、生成した低解像画像を、その低解像画像が生成された画像と関連付けてよい。データ合成部104は、低解像画像が生成された画像とそれぞれ関連付けられた、生成された低解像画像を、データ記憶部105に格納してもよい。
さらに具体的には、データ合成部104は、入力画像(すなわちサンプルベクトルpからp)の結合係数集合に基づいて、サンプルベクトルpからpの結合係数集合と異なる結合係数集合を生成する。データ合成部104は、所定の個数の結合係数集合が生成されるまで、結合係数集合の生成を繰り返してよい。
データ合成部104は、基底ベクトルΦ(nは自然数の集合{1,...,N}に含まれる)のための結合係数を、サンプルベクトルpからpのために基底ベクトルΦの係数として計算された結合係数anm(m=1,...,M)から、ランダムに選択してよい。
データ合成部104は、基底ベクトルの各々のために、結合係数集合の要素として1つの結合係数を選択してよい。データ合成部104は、基底ベクトルのためにそれぞれ選択された結合係数の集合を、結合係数集合として決定してもよい。基底ベクトルのためにそれぞれ選択された結合係数の集合が、サンプルベクトルpからpのために計算された結合係数集合のいずれかと同じである場合、データ合成部104は、選択した結合係数の集合を放棄し、基底ベクトルのための結合係数を選択し直してもよい。
生成される結合係数集合の数が辞書画像(すなわちサンプルベクトル)の数以下である場合、データ合成部104は、どの結合係数も2回以上選ばれないように結合係数集合を生成してもよい。生成される結合係数集合の数が辞書画像(すなわちサンプルベクトル)の数以上である場合、データ合成部104は、どの結合係数も少なくとも1回選ばれるように結合係数集合を生成してもよい。データ合成部104は、それぞれのサンプルベクトルについて、基底と共にいずれかのサンプルベクトルを表す係数のうち、少なくとも1つの係数が選ばれないように、結合係数集合を生成してもよい。
データ合成部104は、決定される結合係数集合が、サンプルベクトルpからpのために計算された結合係数集合のいずれとも同じにならないように定められている規則に従って、基底ベクトルΦの結合係数集合を決定してもよい。
データ合成部104は、サンプルベクトルpからpのために計算される、基底ベクトルΦの結合係数の、分布範囲を決定してもよい。データ合成部104は、基底ベクトルΦのための結合係数を、基底ベクトルΦの、計算される結合係数の、決定された分布範囲に、決定される結合係数が含まれるように、ランダムに決定してもよい。
データ合成部104は、基底ベクトルpのための結合係数を、基底ベクトルpのために計算された結合係数anmから、それらのどの結合係数も2回以上選ばれることを許容して、選択してもよい。
データ合成部104は、生成された基底と結合係数集合とを用いて、例えば画像等のデータを合成する。データ合成部104によって合成される画像は、顔画像であってもよい。
データ合成部104は、複数の結合係数集合のうちの1つの結合係数集合を用いて、基底を1つの合成データに結合してもよい。具体的には、データ合成部104は、複数の結合係数集合から1つの結合係数集合を選択し、その結合係数集合の中の結合係数とその結合係数が割り当てられている基底とを掛けることによってそれぞれ算出される積を合計し、それらの積の合計を、例えば画像等の、1つの合成データにする。データ合成部104は、結合係数集合の各々について、基底を結合することを繰り返してよい。
数5は、例えば合成画像等の、合成データの例である。合成画像は、顔画像であってもよい。数5において、ベクトルb(ここでs=1,...,S)は、合成データを表す。スカラーSは、例えば合成画像の枚数等の、合成データの個数を表す。スカラーanr(n,s)は、サンプルベクトルpからpのために計算された基底ベクトルΦの結合係数の中から、合成されるベクトルbのための基底ベクトルΦの結合係数として選択された、基底ベクトルΦの結合係数を表す。スカラーanr(n,s)は、サンプルベクトルpからpのための基底ベクトルΦの結合係数の中から、s番目の合成データのために、基底ベクトルΦの結合係数としてランダムに選ばれる結合係数である。スカラーr(n,s)は、基底ベクトルΦの結合係数が選択されたサンプルベクトルを示す。サンプルベクトルpm0(ここでm0は集合{1,...,M}に含まれるスカラー)のための基底ベクトルΦの結合係数が、生成されるベクトルbのための基底ベクトルΦの結合係数として選ばれる場合、スカラーr(n,s)は、m0に等しい。
Figure 0006769558
数6は、例えば合成画像等の合成データの他の例を表す。数6の式において、ベクトルb(ここでs=1,...,S)は合成データを表す。スカラーSは、例えば合成画像の枚数等の、合成データの個数を表す。スカラーansは、基底ベクトルΦの結合係数を表す。スカラーansは、スカラーanm(m=1,...,M)の最小値からスカラーanm(m=1,...,M)の最大値までの範囲にスカラーansが含まれるように、ランダムに決定される。スカラーanm(m=1,...,M)は、サンプルベクトルpからpのために計算された基底ベクトルΦの結合係数である。
Figure 0006769558
生成された結合係数集合の各々は、第1入力部102が受け取ったデータを表すサンプルベクトルpからpのために計算された、結合係数集合のいずれとも異なる。したがって、合成データは、第1入力部102が受け取ったデータと異なる。
数4の式におけるスカラーanm(n=1,...,N)の集合は、サンプルベクトルpのために計算された結合係数集合である。数5におけるスカラーanr(n,s)(n=1,...,N)は、1つの合成データを表すベクトルbの、生成された結合係数集合である。数6におけるスカラーans(n=1,...,N)は、1つの合成データを表すベクトルbの、生成された結合係数集合である。
合成されるデータが顔画像である場合は、合成顔画像の各々は、第1入力部102が受け取った顔画像のいずれとも異なる。合成された顔画像の顔は、第1入力部102が受け取った顔画像の顔、すなわち、実在する人物の顔ではない。言い換えると、合成顔画像の顔は、情報処理装置100に入力画像として顔画像が提供された、実在する人物のいずれの顔でもない。
データ合成部104は、合成データをデータ記憶部105に格納する。合成データが合成顔画像である場合、データ合成部104は、合成顔画像をデータ記憶部105に格納する。データ合成部104が合成した顔画像によって表される顔は、第1入力部102が辞書画像として受け取った顔画像によって表されるどの顔とも一致しない。
合成データが画像である場合、データ合成部104は、画像(すなわち、例えば顔画像等の高解像画像)の部分画像を生成してもよい。以下では、高解像画像の部分画像を復元パッチと表記する。復元パッチには、他の復元パッチとの重なりがあってよい。すなわち、高解像画像内の復元パッチが抽出される領域には、他の復元パッチが抽出される領域との重複があってよい。データ合成部104は、低解像画像の部分画像を生成してよい。以下では、低解像画像の部分画像を、劣化パッチと表記する。データ合成部104は、劣化パッチの各々が復元パッチのうちの1つの劣化画像であるように、すなわち、劣化パッチの各々が復元パッチのうちの1つに対応するように、劣化パッチを生成してもよい。データ合成部104は、それぞれ、復元パッチとその復元パッチに対応する劣化パッチとのペアである、パッチペアを記憶していてよい。復元パッチに対応する劣化パッチは、例えば、復元パッチの劣化画像である。
データ記憶部(辞書)105は、データ合成部104によって合成された合成データと、合成データの低解像データと、を、辞書データとして記憶する。辞書データは、合成データと、その合成データの低解像データと、である。辞書データは、第2入力部106によって得られる低解像入力クエリデータの、超解像データを生成するために用いられる。低解像入力クエリデータ(単にクエリデータとも表記する)は、後述するように、第2入力部106が受け取るデータである。低解像入力クエリデータの解像度は、合成データの解像度よりも低くてよい。辞書データが顔画像である場合、実在する人物の顔を表す顔画像ではなく、実在する人物の顔ではない顔を表す合成顔画像が、超解像データを生成するための辞書データとして用いられる。合成データ及び低解像データ(例えば、高解像顔画像(高解像顔画像とも表記する)及び低解像顔画像)は、合成データが低解像データとペアになるようにデータ記憶部(辞書)105に保存される。例えば、合成顔画像(すなわち高解像顔画像)は、低解像顔画像とペアにされる。その低解像顔画像は、その低解像顔画像とペアにされる合成顔画像によって表される顔の画像である。
合成データが画像(例えば、顔画像等)である場合、データ記憶部105は、復元パッチと劣化パッチとを、合成データと低解像データとして記憶していてよい。
第2入力部106は、低解像データ(例えば低解像顔画像等)であるクエリデータ(すなわち上述の低解像入力クエリデータ)をユーザ端末等から受け取る。第2入力部106が受け取る低解像データをクエリデータと表記する。第2入力部106が受け取る低解像データが画像である場合、第2入力部106が受け取る低解像データをクエリ画像と表記することがある。クエリ画像が顔画像である場合、そのクエリ画像をクエリ顔画像と表記することがある。
超解像実行部107は、データ記憶部105に格納されている低解像データと高解像データとのペアを用いて、第2入力部106が受け取ったクエリデータから高解像データを復元する。超解像実行部107は、事例ベース超解像技術に基づいてクエリデータから高解像データを復元してよい。
具体的には、クエリデータが画像である場合、超解像実行部107は、クエリ画像、すなわちクエリデータの、部分画像を生成してよい。クエリ画像の部分画像を、クエリパッチと表記する。クエリパッチには、他のクエリパッチとの重なりがあってよい。超解像実行部107は、劣化パッチとクエリパッチとの間の類似度に基づいて、クエリパッチの各々について劣化パッチを選択してよい。例えば、超解像実行部107は、クエリパッチのために、そのクエリパッチに対する類似度が最も高い劣化パッチを選択してよい。超解像実行部107は、クエリパッチの各々について、劣化パッチの選択を繰り返してもよい。超解像実行部107は、クエリパッチについて選択された劣化パッチに対応する復元パッチから、高解像データとして高解像画像を合成してよい。例えば、超解像実行部107は、復元パッチに対応する劣化パッチが選択されたクエリパッチの、クエリ画像内における位置に従って、復元パッチを配置してもよい。超解像実行部107は、配置された復元パッチから、補間などによって、高解像データとして高解像画像を生成してもよい。
出力部108は、超解像実行部107によって復元された高解像データを出力する。高解像データが画像である場合、出力部108は、高解像データとして高解像画像を出力する。
図2は、本発明の第1の実施形態に係る情報処理装置100の、データ合成フェーズにおいて動作する要素を示すブロック図である。図2において、データ合成フェーズにおいて動作する要素は、実線によって描かれている。データ合成フェーズおいて動作しない要素は、破線によって描かれている。
データ合成フェーズでは、第1入力部102、基底合成部103、データ合成部104、及びデータ記憶部105が動作する。他の部は、破線によって描かれている。
図3は、本発明の本実施形態に係る情報処理装置100の、データ合成フェーズにおける動作を示すフローチャートである。
図3を参照すると、第1入力部102は、入力データ、すなわち、上述の入力データを受け取る(ステップS301)。入力データは、実在する人物の情報を含んでいてもよい。人物の情報は、例えば顔情報や他のバイオメトリクス情報等の、プライバシー情報を含んでいてもよい。上述のように、入力データは、顔画像であってもよい。
基底合成部103は、ステップS301において受け取った入力データから、基底を係数と共に生成する(ステップS302)。具体的には、基底合成部103は、ステップS301において受け取った入力データを、係数を伴う基底に因子分解する。基底合成部103は、入力データを表す行列を、NMFによって、基底を表す行列と係数を表す行列とに因子分解してもよい。入力データが顔画像である場合には、入力データがNMFによって因子分解された基底は、顔部品を表していてもよい。
データ合成部104は、ステップS302において得られた基底の各々について係数を、決定される係数の集合が、ステップS302における入力データから計算された係数の集合のいずれとも異なるように、決定する(ステップS303)。
上述のように係数集合と表記される、係数の集合は、基底にそれぞれ割り当てられた係数の集合である。具体的には、係数の集合に含まれる係数の各々が基底の1つに割り当てられ、その係数の集合に含まれるどの2つの係数も同じ基底には割り当てられない。係数の集合は、ステップS302において得られた基底と共に、それらの基底に因子分解できるデータを表す。上述の係数の集合は、基底と共に、例えば、入力データや合成データ等を表す。具体的には、入力データや合成データ等は、数4の式のように、集合内の係数と基底との線形結合によって表される。入力データや合成データ等は、例えば顔画像等の画像であってもよい。1つの入力データについて計算された、係数の集合すなわち係数集合は、数2の式の行列Aの1つの列の要素によって表されうる。
データ合成部104は、基底の係数を、入力データについて計算されたその基底の係数の中からランダムに選択してよい。例えば入力データ等のデータは、顔画像であってもよい。データ合成部104は、基底の係数を、入力データとして受け取った顔画像について計算されたその基底の係数の中から、ランダムに選択してよい。データ合成部104は、ステップS302において得られた基底の各々について、係数のランダムな選択を繰り返してもよい。上述のように、データ合成部104は、他の方法によって係数を選んでもよい。
データ合成部104は、基底を、決定された係数と共に結合することによって、データを合成する(ステップS304)。言い換えると、データ合成部104は、決定された係数と共に、基底を、例えば線形結合によって結合することにより、合成データを得る。決定された係数の集合は、入力データについて計算された係数の集合のいずれとも異なる。したがって、合成データは、いずれの入力データとも異なる。合成データによって表される情報は、入力データによって表される情報と異なる。合成データと入力データが画像である場合、合成データの画像によって表される物体や人物等は、入力データによって表される画像が表す、実在の物体や人物等のいずれでもない。入力データと合成データが顔画像である場合には、異なる顔部品を表し得る複数の基底が、ランダムに選択され得る係数と共に結合されて、顔画像となる。合成顔画像、すなわち、複数の基底と選択された係数とを結合して得られる顔画像は、入力画像である顔画像が表す顔のいずれとも異なる顔を表す。すなわち、合成顔画像は、実在しない顔を表す。
データ合成部104は、合成データの低解像データを生成する(ステップS305)。合成データと低解像データが、例えば顔画像等の画像である場合、データ合成部104は、合成データすなわち合成画像から、復元パッチを生成してよい。データ合成部104は、復元パッチから劣化パッチ(低解像パッチとも表記される)をさらに生成してもよい。
データ合成部104は、合成データと、その合成データの低解像データと、をデータ記憶部105に格納する(ステップS306)。データ記憶部105に格納された、合成データ及び低解像データは、超解像実行部107によって辞書データとして使用される。合成データ及び低解像データが画像である場合、データ合成部104は、合成画像から生成された復元パッチと、合成画像の低解像画像から生成された劣化パッチとを、データ記憶部105に格納する。
図4は、顔画像と、それらの顔画像が基底合成部103によってNMFにより因子分解された基底を表す画像と、の例を模式的に表す図である。上述のように、基底の各々は、顔の顔部品を表す。画像201は、因子分解される顔画像である。画像202は、基底を表す画像が結合された画像を表す。
図5は、本発明の本実施形態に係る情報処理装置100の、高解像画像復元フェーズにおいて動作する要素を示すブロック図である。図5において、動作する要素は、実線によって描かれ、他の要素は破線によって描かれている。高解像画像復元フェーズは、合成データと、低解像データと、第2入力部106が受け取るクエリデータとが画像である場合の動作を表す。高解像画像復元フェーズにおいては、事例ベース超解像技術に基づいて、復元パッチと劣化パッチとを用いて、低解像画像から高解像画像が生成される。具体的には、低解像画像と劣化パッチとの間の類似度と、劣化パッチと復元パッチとの間の関係と、に基づいて、復元画像が復元パッチから生成される
図5を参照すると、第2入力部106、超解像実行部107、及び出力部108が、高解像画像復元フェーズにおいて動作する。
図6は、本発明の本実施形態に係る情報処理装置100の、高解像画像復元フェーズにおける動作の例を示すフローチャートである。図6に示す動作の説明において、第2入力部106が受け取るデータは、低解像画像、すなわち、クエリ画像である。
第2入力部106は、クエリ画像を受け取る(ステップS601)。ステップS601において受け取られるクエリ画像は、合成画像や第1入力部102によって受け取られる入力データと比較して、解像度が低い。
超解像実行部107は、クエリ画像からクエリパッチを生成する(ステップS602)。クエリパッチは、クエリ画像の部分画像である。超解像実行部107は、クエリ画像をクエリパッチに分割してよい。超解像実行部107は、クエリ画像内における、少なくとも2つのクエリパッチが切り出される領域に、互いに重なりがあるように、クエリ画像からクエリパッチを切り出してよい。
超解像実行部107は、生成されたクエリパッチの中から、クエリパッチを選択する(ステップS603)。
超解像実行部107は、データ記憶部105に格納されている劣化パッチの中から、劣化パッチと選択されたクエリパッチとの間の類似度に基づいて、選択されたクエリパッチについて劣化パッチを選択する(ステップS604)。超解像実行部107は、データ記憶(辞書)部105から、選択されたクエリパッチに最も類似する劣化パッチを選択してよい。
超解像実行部107は、選択されたクエリパッチについて選択された劣化パッチに関連付けられている復元パッチを、例えば、クエリ画像の、クエリパッチが切り出された領域の位置に基づいて配置する(ステップS605)。劣化パッチとその劣化パッチに関連付けられている復元パッチとは、合成画像の同じ部分に対応する。劣化パッチに関連付けられている復元パッチは、その劣化パッチが生成された復元パッチであってよい。
クエリ画像から生成された全てのクエリパッチが選択されたわけではない場合(ステップS606においてNO)、超解像実行部107は、ステップS603からステップS605の動作を繰り返す。
クエリ画像から生成された全てのクエリパッチが選択された場合(ステップS606においてYES)、超解像実行部107は、配置された復元パッチから高解像画像を生成する(ステップS607)。例えば、超解像実行部107は、配置された復元パッチを結合して高解像画像にする。高解像画像の解像度は、クエリ画像の解像度よりも高い。
出力部108は、超解像実行部107によって生成された高解像画像を出力する(ステップS608)。
本実施形態の効果は、本実施形態に係る情報処理装置100が、例えば顔を表す顔画像等の個人の特徴を表す情報を含むデータベースの、プライバシーを強化できることである。
その理由は、基底合成部103が、入力データから基底と係数とを生成し、データ合成部104が、入力データが因子分解された係数の集合のいずれとも異なる係数の集合を、複数の基底のために選択するからである。データ合成部104は、選択された係数とともにその基底を結合することによって、合成データを生成する。データ合成部104によって生成された合成データは、いずれの入力データとも異なる。したがって、入力データが例えば顔等のプライバシー情報を含んでいたとしても、合成データは、入力データに含まれるプライバシー情報を表さない。
<第2の実施形態>
本発明の第2の実施形態を図面を参照しながら詳細に説明する。
図7は、本発明の本実施形態に係る情報処理装置700の構成の例を示すブロック図である。
情報処理装置700は、第1入力部102、基底合成部103、及び超解像部701を備える。超解像部701は、基底記憶部709、データ合成部104、データ記憶部105、第2入力部106、超解像実行部107、及び出力部108を備える。
基底合成部103及び基底記憶部709以外の上述の部は、第1の実施形態の情報処理装置100の部と同じである。
本実施形態に係る情報処理装置700の基底合成部103は、第1の実施形態に係る情報処理装置100の基底合成部103と同様に動作する。基底合成部103は、入力データに基づく、基底と係数とを生成する。
基底合成部103は、基底を基底記憶部709に格納する。基底合成部103は、例えばNMFにより得られた、基底を表す行列を、基底記憶部709に格納してよい。基底を表す行列は、数2の式における行列Fによって表される。以下の説明において、基底を表す行列を、基底行列と表記する。基底合成部103は、例えばベクトルの形で、基底を別々に基底記憶部709に格納してもよい。この場合、ベクトルは、基底行列の列に対応し、数3の式におけるベクトルΦ1からΦnによって表される。
基底合成部103は、入力データから生成された、例えば係数集合などの係数を、データ合成部104に供給してもよい。
データ合成部104は、例えば係数集合などの係数を受け取る。データ合成部104は、第1の実施形態のデータ合成部104と同じ方法で、受け取った係数集合とは異なる係数集合を決定してよい。なお、受け取った係数集合は、入力画像から生成された係数集合である。データ合成部104は、決定された係数集合を、基底記憶部709に格納してもよい。データ合成部104は、基底記憶部709に格納されている、基底と係数集合とを用いて、高解像データを生成してよい。
基底記憶部709は、基底合成部103によって入力データから生成された基底を記憶する。基底記憶部709は、データ合成部104によって決定された係数をさらに記憶していてよい。
上述の相違点を除き、情報処理装置700は、第1の実施形態に係る情報処理装置100と同じである。
次に、本実施形態に係る情報処理装置700の動作の例を説明する。
図8は、情報処理装置700の、データ合成フェーズにおいて動作する要素を示すブロック図である。図8において、データ合成フェーズにおいて動作する要素は、実線によって描かれており、他の要素は、破線によって描かれている。データ合成フェーズでは、第1入力部102、基底合成部103、基底記憶部709、データ合成部104、及びデータ記憶部105が動作する。
図9は、情報処理装置700の、データ合成フェーズにおける動作の例を示すフローチャートである。
第1入力部102は、入力データを受け取る(ステップS901)。ステップS901の動作は、図3のステップS301と同じである。
基底合成部103は、図3のステップS302の動作と同様に、基底を係数集合と共に、入力データから生成する(ステップS902)。基底合成部103は、係数集合をデータ合成部104に供給してよい。
データ合成部104は、図3のステップS303の動作と同様に、入力データの係数集合とは異なる係数集合を決定する(ステップS903)。
基底合成部103は、基底を基底記憶部709に格納する(ステップS904)。ステップS904の動作はステップS903の動作の前に行ってもよい。
データ合成部104は、決定された係数集合を基底記憶部709に格納する(ステップS905)。ステップS905の動作は、ステップS903の動作の後に行われる。ステップS905の動作は、ステップS904の動作の前に行われてもよい。
データ合成部104は、基底記憶部709に格納された基底を、決定された係数集合と共に結合することによって、データを合成する(ステップS906)。
データ合成部104は、合成データの低解像データを生成してよい(ステップS907)。合成データが画像である場合、データ合成部104は、合成画像から復元パッチを生成してよい。データ合成部104は、復元パッチから劣化パッチを生成してよい。データ合成部104は、合成画像から劣化パッチを生成してよい。
データ合成部104は、合成データと、その合成データの低解像データとを、データ記憶部105に格納する(ステップS908)。データ合成部は、復元パッチと劣化パッチとを、合成データと低解像データとしてデータ記憶部105に格納してよい。
図6は、本実施形態に係る情報処理装置700の、高解像画像生成フェーズにおける動作の例を示すフローチャートである。高解像画像生成フェーズにおいて、情報処理装置700は、情報処理装置100と同様に動作する。
本実施形態には、第1の実施形態の効果と同じ効果がある。本実施形態の効果が生じる理由は、第1の実施形態の効果が生じる理由と同じである。
<第3の実施形態>
次に本発明の第3の実施形態を説明する。
図10は、本実施形態に係る情報処理装置1000の構成の例を示すブロック図である。
情報処理装置1000は、基底合成部103及びデータ合成部104を備える。
基底合成部103は、入力データから、基底と係数集合とを生成する。係数集合の各々は、基底にそれぞれ割り当てられた係数の集合である。以下では、これらの係数集合を、第1の係数集合と表記する。入力データは、行列によって表されていてよい。基底の各々は、ベクトルによって表されていてよい。基底合成部103は、NMFによって、基底と係数集合とを生成してよい。基底と第1の係数集合の各々とは、第1のデータの1つを表す。第1のデータは、開画像等の画像であってよい。
データ合成部104は、第1の係数集合に基づく新たな係数集合を決定する。以下では、新たな係数集合を、第2の係数集合と表記する。第2の係数集合は、第1の係数集合の各々と異なる。言い換えると、第2の係数集合は、第1の係数集合の各々と、少なくとも1つの係数を共有しない。データ合成部104は、第2の係数集合において、複数の基底の中のある基底に割り当てられる係数を、複数の第1の係数集合において、その基底に割り当てられている係数から、ランダムに選んでもよい。
データ合成部104は、基底と第2の係数集合を用いて、データを合成する。データ合成部104は、基底と第2の係数集合の係数との線形結合を計算する。
次は、本実施形態に係る情報処理装置1000の動作の例である。
図11は、情報処理装置1000の動作の例を示すフローチャートである。基底合成部103は、入力データから、基底を係数集合と共に生成する(ステップS1102)。データ合成部104は、複数の入力データの係数集合から、新たな係数集合を決定する(ステップS1103)。データ合成部104は、決定された係数集合、すなわち、決定された新たな係数集合と共に、基底を結合することによって、データを合成する(ステップS1104)。
本実施形態には、第1の実施形態と同じ効果がある。本実施形態の効果が生じる理由は、第1の実施形態の効果が生じる理由と同様である。
<他の実施形態>
情報処理装置100、情報処理装置700、及び情報処理装置1000のそれぞれは、専用ハードウェア、メモリとメモリにロードされたプログラムを実行するプロセッサとを備えたコンピュータ、又は、専用ハードウェアと、メモリと及びメモリに保存したプログラムを実行するプロセッサとを備えたコンピュータと、の組み合わせによって実現することができる。
図12は、情報処理装置100、情報処理装置700、及び情報処理装置1000を実現するために用いることができるコンピュータ10000のハードウェア構成の例を示すブロック図である。図12に示すように、コンピュータ10000は、プロセッサ10001、メモリ10002、記憶装置10003、及びI/O(Input/Output)インターフェース10004を備える。コンピュータ10000は、記憶媒体10005にアクセスできる。メモリ10002及び記憶装置10003は、それぞれ、RAM(Random Access Memory)、ハードディスクドライブ等の記憶装置であってもよい。記憶媒体10005は、RAM、ハードディスクドライブ等の記憶装置、ROM(Read Only Memory)、又は、可搬記憶媒体であってもよい。記憶装置10003が、記憶媒体10005として動作してもよい。プロセッサ10001は、メモリ10002と記憶装置10003とからデータとプログラムとを読み出すことができ、メモリ10002と記憶装置10003とにデータとプログラムとを書き込むことができる。プロセッサ10001は、I/Oインターフェース10004を介して、端末装置(図示せず)等と通信することができる。プロセッサ10001は、記憶媒体10005にアクセスできる。記憶媒体10005は、コンピュータ10000を情報処理装置100、情報処理装置700、及び情報処理装置1000のうちの1つとして動作させるプログラムを記憶する。
プロセッサ10001は、コンピュータ10000を情報処理装置100、情報処理装置700、及び情報処理装置1000のうちの1つとして動作させる、記憶媒体10005に記憶されたプログラムをメモリ10002にロードする。メモリ10002にロードされたプログラムをプロセッサ10001が実行することにより、コンピュータ10000は、情報処理装置100、情報処理装置700、及び情報処理装置1000のうちの1つとして動作する。
以下の説明において、超解像部101、第1入力部102、基底合成部103、データ合成部104、第2入力部106、超解像実行部107、出力部108、及び超解像部701からなるグループを第1グループと表記する。データ記憶部105と基底記憶部709とからなるグループを第2グループと表記する。第1グループに含まれる各部は、メモリ10002とメモリ10002にロードされたプログラムを実行するプロセッサ10001とを備えたコンピュータ10000を用いて実現できる。第2グループに含まれる各部は、記憶装置10003を用いて実現できる。第1グループ又は第2グループに含まれる部の各々は、例えば1つ以上の専用回路等の、専用ハードウェアによって実現できる。
上で開示した実施形態の全部又は一部は、以下の2記によって表され得るが、これらに限られない。
<付記1>
第1のデータから、複数の基底と複数の第1の係数集合の各々との組み合わせが前記第1のデータを表す、前記複数の基底と前記複数の第1の係数集合とを生成する基底合成手段と、
前記複数の第1の係数集合に基づいて、前記複数の第1の係数集合と異なる第2の係数集合を決定し、前記複数の基底と前記第2の係数集合を用いて第2のデータを合成するデータ合成手段と、
を備える情報処理装置。
<付記2>
前記データ合成手段は、前記第2のデータから、当該第2のデータと比較して解像度の低い第3のデータを生成し、
前記画像処理装置は、
第4のデータを受け取る入力手段と、
前記第3のデータと前記第4のデータとの間の類似性と、前記第2のデータと前記第3のデータとの関係と、に基づいて、前記第2のデータから第5のデータを生成する実行手段と、
をさらに備える
付記1に記載の情報処理装置。
<付記3>
前記基底合成手段は、前記第2の係数集合に含まれる第2の係数であって、前記複数の基底の中の基底に関連付けられる前記第2の係数を、前記複数の第1の係数集合にそれぞれ含まれる数の第1の係数であって、当該基底に関連付けられている前記複数の第1の係数の範囲に含まれるように決定する、
付記1又は2に記載の情報処理装置。
<付記4>
前記基底合成手段は、前記第2の係数集合の前記第2の係数を、2つ以上の前記第1の係数集合の前記第1の係数から選択する、
付記3に記載の情報処理装置。
<付記5>
第1のデータから、複数の基底と複数の第1の係数集合の各々との組み合わせが前記第1のデータを表す、前記複数の基底と前記複数の第1の係数集合とを生成し、
前記複数の第1の係数集合に基づいて、前記複数の第1の係数集合と異なる第2の係数集合を決定し、前記複数の基底と前記第2の係数集合を用いて第2のデータを合成する、
情報処理方法。
<付記6>
前記第2のデータから、当該第2のデータと比較して解像度の低い第3のデータを生成し、
第4のデータを受け取り、
前記第3のデータと前記第4のデータとの間の類似性と、前記第2のデータと前記第3のデータとの関係と、に基づいて、前記第2のデータから第5のデータを生成する、
付記5に記載の情報処理方法。
<付記7>
前記第2の係数集合に含まれる第2の係数であって、前記複数の基底の中の基底に関連付けられる前記第2の係数を、前記複数の第1の係数集合にそれぞれ含まれる数の第1の係数であって、当該基底に関連付けられている前記複数の第1の係数の範囲に含まれるように決定する、
付記5又は6に記載の情報処理方法。
<付記8>
前記第2の係数集合の前記第2の係数を、2つ以上の前記第1の係数集合の前記第1の係数から選択する、
付記7に記載の情報処理方法。
<付記9>
第1のデータから、複数の基底と複数の第1の係数集合の各々との組み合わせが前記第1のデータを表す、前記複数の基底と前記複数の第1の係数集合とを生成する基底合成処理と、
前記複数の第1の係数集合に基づいて、前記複数の第1の係数集合と異なる第2の係数集合を決定し、前記複数の基底と前記第2の係数集合を用いて第2のデータを合成するデータ合成処理と、
をコンピュータに実行させるプログラムを記憶する記憶媒体。
<付記10>
前記データ合成処理は、前記第2のデータから、当該第2のデータと比較して解像度の低い第3のデータを生成し、
前記プログラムは、
第4のデータを受け取る入力処理と、
前記第3のデータと前記第4のデータとの間の類似性と、前記第2のデータと前記第3のデータとの関係と、に基づいて、前記第2のデータから第5のデータを生成する実行処理と
をコンピュータにさらに実行させる
付記9に記載の記憶媒体。
<付記11>
前記基底合成処理は、前記第2の係数集合に含まれる第2の係数であって、前記複数の基底の中の基底に関連付けられる前記第2の係数を、前記複数の第1の係数集合にそれぞれ含まれる数の第1の係数であって、当該基底に関連付けられている前記複数の第1の係数の範囲に含まれるように決定する、
付記9又は10に記載の記憶媒体。
<付記12>
前記基底合成処理は、前記第2の係数集合の前記第2の係数を、2つ以上の前記第1の係数集合の前記第1の係数から選択する
付記11に記載の記憶媒体。
本発明を実施形態を参照して詳細に提示し説明したが、本発明はこれらの実施形態に限定されない。当業者にとって、請求の範囲に定義されるような、本発明の精神やスコープから逸脱することなく、形体や細部に様々な変更を行うことができることは明らかであろう。
本発明は、事例ベース超解像システムにおいて用いられる、プライバシー情報を含む辞書の保護に用いることができる。
事例ベース超解像システムにおいて、例えば顔や声などのプライバシー情報を含むデータが用いられる場合、システムが販売される又は流通する際に辞書もシステムに含まれている必要があり、システム内に含まれる個人情報は保護されない。
100 情報処理装置
101 超解像部
102 第1入力部
103 基底合成部
104 データ合成部
105 データ記憶部
106 第2入力部
107 超解像実行部
108 出力部
201 画像
202 画像
700 情報処理装置
701 超解像部
709 基底記憶部
1000 情報処理装置
10000 コンピュータ
10001 プロセッサ
10002 メモリ
10003 記憶装置
10004 I/Oインターフェース
10005 記憶媒体

Claims (7)

  1. 第1のデータから、複数の基底と複数の第1の係数集合の各々との組み合わせが前記第1のデータを表す、前記複数の基底と前記複数の第1の係数集合とを生成する基底合成手段と、
    前記複数の第1の係数集合に基づいて、前記複数の第1の係数集合と異なる第2の係数集合を決定し、前記複数の基底と前記第2の係数集合を用いて第2のデータを合成するデータ合成手段と、
    を備え
    前記データ合成手段は、前記第2のデータから、当該第2のデータと比較して解像度の低い第3のデータを生成し、
    第4のデータを受け取る入力手段と、
    前記第3のデータと前記第4のデータとの間の類似性と、前記第2のデータと前記第3のデータとの関係と、に基づいて、前記第2のデータから前記第4のデータと比較して解像度の高い第5のデータを生成する実行手段と、
    をさらに備える
    情報処理装置。
  2. 前記データ合成手段は、前記第2の係数集合に含まれる第2の係数であって、前記複数の基底の中の基底に関連付けられる前記第2の係数を、前記複数の第1の係数集合にそれぞれ含まれる数の第1の係数であって、当該基底に関連付けられている前記複数の第1の係数の範囲に含まれるように決定する、
    請求項に記載の情報処理装置。
  3. 前記データ合成手段は、前記第2の係数集合の前記第2の係数を、2つ以上の前記第1の係数集合の前記第1の係数から選択する、
    請求項に記載の情報処理装置。
  4. 第1のデータから、複数の基底と複数の第1の係数集合の各々との組み合わせが前記第1のデータを表す、前記複数の基底と前記複数の第1の係数集合とを生成し、
    前記複数の第1の係数集合に基づいて、前記複数の第1の係数集合と異なる第2の係数集合を決定し、前記複数の基底と前記第2の係数集合を用いて第2のデータを合成し、
    前記第2のデータから、当該第2のデータと比較して解像度の低い第3のデータを生成し、
    第4のデータを受け取り、
    前記第3のデータと前記第4のデータとの間の類似性と、前記第2のデータと前記第3のデータとの関係と、に基づいて、前記第2のデータから前記第4のデータと比較して解像度の高い第5のデータを生成する、
    情報処理方法。
  5. 前記第2の係数集合に含まれる第2の係数であって、前記複数の基底の中の基底に関連付けられる前記第2の係数を、前記複数の第1の係数集合にそれぞれ含まれる数の第1の係数であって、当該基底に関連付けられている前記複数の第1の係数の範囲に含まれるように決定する、
    請求項に記載の情報処理方法。
  6. 前記第2の係数集合の前記第2の係数を、2つ以上の前記第1の係数集合の前記第1の係数から選択する、
    請求項に記載の情報処理方法。
  7. 第1のデータから、複数の基底と複数の第1の係数集合の各々との組み合わせが前記第1のデータを表す、前記複数の基底と前記複数の第1の係数集合とを生成する基底合成処理と、
    前記複数の第1の係数集合に基づいて、前記複数の第1の係数集合と異なる第2の係数集合を決定し、前記複数の基底と前記第2の係数集合を用いて第2のデータを合成するデータ合成処理と、
    をコンピュータに実行させ
    前記データ合成処理は、前記第2のデータから、当該第2のデータと比較して解像度の低い第3のデータを生成し、
    第4のデータを受け取る入力処理と、
    前記第3のデータと前記第4のデータとの間の類似性と、前記第2のデータと前記第3のデータとの関係と、に基づいて、前記第2のデータから前記第4のデータと比較して解像度の高い第5のデータを生成する実行処理と
    をコンピュータにさらに実行させるプログラム。
JP2019536114A 2017-01-12 2017-01-12 情報処理装置、情報処理方法及びプログラム Active JP6769558B2 (ja)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/JP2017/000742 WO2018131105A1 (en) 2017-01-12 2017-01-12 Information processing device, information processing method and storage medium

Publications (2)

Publication Number Publication Date
JP2020504386A JP2020504386A (ja) 2020-02-06
JP6769558B2 true JP6769558B2 (ja) 2020-10-14

Family

ID=62840534

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2019536114A Active JP6769558B2 (ja) 2017-01-12 2017-01-12 情報処理装置、情報処理方法及びプログラム

Country Status (3)

Country Link
US (1) US20190347769A1 (ja)
JP (1) JP6769558B2 (ja)
WO (1) WO2018131105A1 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111163265A (zh) * 2019-12-31 2020-05-15 成都旷视金智科技有限公司 图像处理方法、装置、移动终端及计算机存储介质
WO2022269963A1 (ja) * 2021-06-23 2022-12-29 ソニーグループ株式会社 情報処理装置、情報処理方法およびプログラム

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4893968B2 (ja) * 2008-06-05 2012-03-07 花王株式会社 顔画像の合成方法
CN101719270B (zh) * 2009-12-25 2012-01-11 武汉大学 一种基于非负矩阵分解的人脸超分辨率处理方法
JP2013175019A (ja) * 2012-02-24 2013-09-05 Mikio Tominaga インターネットを利用した商品化モデル
US8675999B1 (en) * 2012-09-28 2014-03-18 Hong Kong Applied Science And Technology Research Institute Co., Ltd. Apparatus, system, and method for multi-patch based super-resolution from an image
CN103366182B (zh) * 2013-07-05 2016-06-29 西安电子科技大学 基于全监督非负矩阵分解的人脸识别方法
US9875532B2 (en) * 2013-08-15 2018-01-23 Nec Corporation Information processing device that implements image processing, and image processing method

Also Published As

Publication number Publication date
JP2020504386A (ja) 2020-02-06
US20190347769A1 (en) 2019-11-14
WO2018131105A1 (en) 2018-07-19

Similar Documents

Publication Publication Date Title
JP2022526148A (ja) ビデオ生成方法、装置、電子機器及びコンピュータ記憶媒体
AU2020289806B2 (en) Controlling A Neural Network Through Intermediate Latent Spaces
JP6453694B2 (ja) 画像合成装置、画像合成方法、画像合成プログラム及び記録媒体
KR102225024B1 (ko) 이미지 채움 장치 및 방법
JP6278042B2 (ja) 情報処理装置、及び、画像処理方法
JP6769558B2 (ja) 情報処理装置、情報処理方法及びプログラム
JP7303783B2 (ja) 不明のダウンスケーリングカーネルで生成された画像をアップスケールするための手法
JP2009157442A (ja) データ検索装置および方法
Rajput Mixed gaussian-impulse noise robust face hallucination via noise suppressed low-and-high resolution space-based neighbor representation
Choi et al. Toward spatially unbiased generative models
KR102166016B1 (ko) 이미지 대 이미지의 변환을 위한 도메인 인식 기반의 변환 기법
Tirvaudey et al. Non-invasive implementation of nonlinear isogeometric analysis in an industrial FE software
JP6102938B2 (ja) 画像処理装置、及び、画像処理方法
CN106327539A (zh) 基于样例的图像重建方法及装置
Huneke et al. The projective dimension of codimension two algebras presented by quadrics
Harb et al. Diffusion-based generation of Histopathological Whole Slide Images at a Gigapixel scale
WO2019073913A1 (ja) 擬似データ生成装置、その方法、及びプログラム
JP2014016746A (ja) 画像処理装置および画像処理方法
JP6825119B2 (ja) 秘密読み込み装置、秘密書き込み装置、それらの方法、およびプログラム
JP2022010842A (ja) 2次元マップ生成装置、2次元マップ生成方法および2次元マップ生成用プログラム
JP4090969B2 (ja) 信号分離方法、信号分離プログラム及びそのプログラムを記録した記録媒体
Abedjooy et al. Multi-modality image super-resolution using generative adversarial networks
JP2019074892A (ja) アップサンプル装置、コンピュータプログラム、コンピュータシステム、機器、及びアップサンプル方法
JP2016103089A (ja) 情報処理装置、信号処理方法、プログラム
Hasan et al. Interactive multilevel focus+ context visualization framework

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20190701

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20190701

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20191211

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20200602

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20200722

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20200825

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20200907

R150 Certificate of patent or registration of utility model

Ref document number: 6769558

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150