JP5071900B2 - 画像生成装置およびその方法 - Google Patents

画像生成装置およびその方法 Download PDF

Info

Publication number
JP5071900B2
JP5071900B2 JP2008048753A JP2008048753A JP5071900B2 JP 5071900 B2 JP5071900 B2 JP 5071900B2 JP 2008048753 A JP2008048753 A JP 2008048753A JP 2008048753 A JP2008048753 A JP 2008048753A JP 5071900 B2 JP5071900 B2 JP 5071900B2
Authority
JP
Japan
Prior art keywords
image
images
area
region
corresponding points
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2008048753A
Other languages
English (en)
Other versions
JP2009205553A (ja
Inventor
利泰 國井
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Kanazawa Institute of Technology (KIT)
Original Assignee
Kanazawa Institute of Technology (KIT)
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Kanazawa Institute of Technology (KIT) filed Critical Kanazawa Institute of Technology (KIT)
Priority to JP2008048753A priority Critical patent/JP5071900B2/ja
Publication of JP2009205553A publication Critical patent/JP2009205553A/ja
Application granted granted Critical
Publication of JP5071900B2 publication Critical patent/JP5071900B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Processing Or Creating Images (AREA)

Description

本発明は、画像生成装置およびその方法に関し、より詳細には複数画像間の移動に関する処理を実行する画像生成装置およびその方法に関する。
従来から、モーフィングなど最初の画像と最後の画像とを与えて、それらに含まれる像の間の形態を有する1以上の像を生成して、像の形態が次第に変化する動画を生成する技術が提案されている(例えば、特許文献1を参照)。このようなモーフィングは、例えば画像上に設定した制御点を動かすことにより画像が歪む効果を得て、2種類の図形を一方から他方へ滑らかに変形させることによって達成されるが、制御点を自動的に設定するのは一般に容易ではない。すなわち、観察者が両画面を見て変化のパターンを予想し、対応点を設定するといった人手の介在なしでは新たな画像の生成は容易ではない。
一定の分野あるいは一定のレベルでは、中間画像を自動生成するものがあり、例えばディスプレイ装置上に表示された文字を変形させるため、対象となる図形のアウトラインの集合を抽出してアウトライツリーの管理を行う技術が提案されている(例えば、特許文献2を参照)。このようにモーフィング等複数の限られた画像から中間画像を生成して動画像とする画像移動算出処理方法またはシステムが種々提案されている。
特開2005−135046号公報 特開2001−175881号公報
しかしながら、従来の画像生成方法では、中間画像を生成する際に人手が必要であったり、一定の限られた種類の画像しか扱えなかったりといった問題がある。また、中間画像を自動的に生成することができても、元の画像と比較して的確ではなく不自然な画像が生成されることとなったり、変移量の少ない画像にしか適用できなかったりするという問題がある。
本発明は、このような問題に鑑みて為されたものであり、複数の限られた画像からより的確な中間画像を生成してより自然な動画像を得ることができる画像生成装置およびその方法を提供することを目的とする。
このような目的を達成するため、本願の請求項1に記載の方法は、ニューラルネットワークにより2つの画像間の対応点を抽出して画像を生成する方法であって、2つの画像を各々相互に重ならない複数の、M×N個の矩形領域である領域に分割して、分割された領域のそれぞれにおける、領域内の輝度を含む特徴量ベクトルを算出する特徴量算出ステップと、第1の画像の任意の1つの領域について、位置ベクトル間の距離と算出された特徴量ベクトル間の距離とを引数とする探索関数の値が最小となる第2の画像の領域を探索する領域探索と、任意の1つの領域について探索された領域と、探索前の領域との空間差異により2つの画像間の対応関係マッピング情報を生成するマッピング情報生成とを複数回繰り返すことにより2つの画像間の対応点を抽出し、さらにM×N個よりも高い解像度で1回以上抽出を繰り返して対応点を抽出する抽出ステップと、抽出された2つの画像間の任意の画像における各々の対応点の移動量を算出することにより中間画像を取得するステップとを備えたことを特徴とする。
請求項2に記載の発明は、請求項1に記載の方法において、抽出ステップは、M×N個の矩形領域に各々対応して作成されたM×N個のノードからなる自己組織化写像を用いて2つの画像間の対応点を抽出することを特徴とする。
請求項3に記載の発明は、請求項1または2に記載の方法において、探索関数は、位置ベクトル間の距離と、算出された特徴量ベクトル間の距離に特徴量の位置に対する重みを乗算した値とを加算する関数であることを特徴とする。
請求項4に記載の発明は、請求項1ないし3のいずれかに記載の方法においえ、抽出ステップは、第1の画像の任意の1つの領域をランダムに選択することを特徴とする。
請求項5に記載の発明は、請求項1ないし4のいずれかに記載の方法において、マッピング情報生成は、探索した第2の画像の領域およびその近傍について、第1の画像の対応する領域との距離に学習率定数を乗じた値だけ対応する方向に移動させて、第1の画像の領域と対応する第2の画像の領域との関係をマッピング情報として生成することにより実行することを特徴とする。
請求項6に記載の発明は、請求項5に記載の方法において、抽出ステップは、領域探索およびマッピング情報生成を、マッピング生成で移動した移動量が所定の閾値以下になるまで繰り返すことを特徴とする。
請求項7に記載の発明は、ニューラルネットワークにより2つの画像間の対応点を抽出して画像を生成する画像生成装置であって、2つの画像を各々相互に重ならない複数の、M×N個の矩形領域である領域に分割して、分割された領域のそれぞれにおける、領域内の輝度を含む特徴量ベクトルを算出する特徴量算出手段と、第1の画像の任意の1つの領域について、位置ベクトル間の距離と前記算出された特徴量ベクトル間の距離とを引数とする探索関数の値が最小となる第2の画像の領域を探索する領域探索と、任意の1つの領域について探索された領域と、探索前の領域との空間差異により2つの画像間の対応関係マッピング情報を生成するマッピング情報生成とを複数回繰り返すことにより2つの画像間の対応点を抽出し、さらにM×N個よりも高い解像度で1回以上抽出を繰り返して対応点を抽出する抽出手段と、抽出された2つの画像間の任意の画像における各々の対応点の移動量を算出することにより中間画像を取得する手段とを備えたことを特徴とする。
請求項8に記載の発明は、コンピュータに、ニューラルネットワークにより2つの画像間の対応点を抽出して画像を生成する方法を実行させるプログラムであって、方法は、2つの画像を各々相互に重ならない複数の、M×N個の矩形領域である領域に分割して、分割された領域のそれぞれにおける、領域内の輝度を含む特徴量ベクトルを算出する特徴量算出ステップと、第1の画像の任意の1つの領域について、位置ベクトル間の距離と算出された特徴量ベクトル間の距離とを引数とする探索関数の値が最小となる第2の画像の領域を探索する領域探索と、任意の1つの領域について探索された領域と、探索前の領域との空間差異により2つの画像間の対応関係マッピング情報を生成するマッピング情報生成とを複数回繰り返すことにより2つの画像間の対応点を抽出し、さらにM×N個よりも高い解像度で1回以上抽出を繰り返して対応点を抽出する抽出ステップと、抽出された2つの画像間の任意の画像における各々の対応点の移動量を算出することにより中間画像を取得するステップとを備えたことを特徴とする。
以上説明したように、本発明によれば、2つの画像を各々相互に重ならない複数の領域に分割して、分割された領域のそれぞれにおける特徴量ベクトルを算出する特徴量算出ステップと、第1の画像の任意の1つの領域について、位置ベクトル間の距離と算出された特徴量ベクトル間の距離とを引数とする探索関数の値が最小となる第2の画像の領域を探索する領域探索と、任意の1つの領域について探索された領域と、探索前の領域との空間差異により2つの画像間の対応関係マッピング情報を生成するマッピング情報生成とを複数回繰り返すことにより2つの画像間の対応点を抽出する抽出ステップと、抽出された2つの画像間の任意の画像における各々の対応点の移動量を算出することにより中間画像を取得するステップとを備えているので、複数の限られた画像からより的確な中間画像を生成してより自然な画像を得ることが可能となる。
(第1実施形態)
本実施形態では、本願発明の原理を用いてニューラルネットワークを用いて複数画像間のそれぞれの対応点を抽出し、対応点同士を線形補完して任意の場所の中間画像を生成するため、以下まず本願発明の原理について説明する。ここで、本願発明の対応点取得処理が極めて有効であるため、中間画像生成に当たって、線形補間により十分に適切でより実際の動きに近い動画像が得られるが、これに限られることなく本技術分野で知られるいずれの補間処理を採用することもできる。例えば、適当な重み付けなどをして処理を行うことができる。
より具体的に、図1を参照して2枚の異なる画像AおよびB(図1では画像110および120)をもとに、中間画像を生成する場合を想定すると、本願発明の原理によると、先ず画像110と画像120との間でそれぞれ対応する点を抽出する。ここで、元になる画像110および120はどのような画像でも良く、相互に関連性のあるものでも良いし、全く関連性のないものでもよい。つまり、典型的な例では、ある被写体があって実際にある動作をする前と、動作をした後の画像でも良いし、全然関連性のない例えば人間と動物の顔でも良い。本願発明は、画像の具体的性質にかかわらずより適切な対応点を抽出することができる。本願発明の原理を用いれば直感的に理解されるとおり、画像110上の任意の点に対応する画像120上の対応点を定めることができ、本願発明の原理を適用することによりこの対応点の抽出は自動的にコンピュータ等で処理することにより実行される。
このように画像110と画像120とのそれぞれの対応点が抽出されると、例えばそれらの対応点同士を結ぶ線上の中間点をプロットしていくとちょうど真ん中の中間画像130が得られる。このとき中間画像130上で画像110および120の各対応する点に対応する点は両点を結ぶ線分の中間点となる。中間点を取ると真ん中の画像となるが、対応点間を結ぶ線分の任意の比率となる点をプロットしていくことにより画像110と120との間の任意の位置における中間画像を得ることができる。
(本実施形態のシステム構成)
本実施形態のシステムは、上述のソフトウェアプログラム開発手法を用いたプログラム開発を支援する画像移動算出処理装置である。図2は、本実施形態のシステムの概要を示す図である。本システムでは、画像移動処理装置の制御部201に記憶手段であるデータベース204が接続されており、元の画像データが格納されていて、中間画像が算出されると必要であれば格納される。データベース204には本実施形態の処理を実行するプログラムを格納しておくこともできる。本実施形態では、データベース204は、制御部201の外部に接続されているように示されているが、これに限られることなくコンピュータ201内部のメモリを用いたり、図に示さないネットワークを介して他のデータベースに接続して利用したりすることもできる。
なお、制御部201は、画像処理など種々の処理を行うために必要な通常の機能、例えばCPU、ROM、RAMのほか必要なインタフェースドライブを有しているものとする。画像は制御部201に接続されたディスプレイ202に表示されるが、コマンドを入力する際にメニューを表示したり、処理結果を表示したりもする。同様に入力機器はキーボード203に限らず、図示しないマウスや入力パッドなど本技術分野で知られる種々の仕様のものを用いることができる。
本システムの全体の構成は以上のようなものであるが、このようなハードウェアの条件の下、本実施形態の個別の処理の実行はソフトウェアプログラムがこのようなハードウェアにインストールされて行われる。各ソフトウェアは例えば図3に示すようなモジュール構成で示すことができるが、これは単なる例示であり、各モジュールの機能をさらにいくつかのモジュールで分担したり、いくつかのモジュールの機能を統合したモジュールを想定したりすることができるのはいうまでもない。以下に、各モジュール構成を説明するが、これらのモジュールが相互に連携を取って実行され、後述する本実施形態の処理が達成されるのである。
図3は、本実施形態の制御部201上で実行されるプログラムのモジュール構成を示す図である。特徴点抽出部301は、例えば2つの画像を複数の矩形領域に分割して、それぞれの領域における特徴量ベクトルを算出する。対応点抽出部302は、分割された領域とノードとを対応させてノード間の自己組織化写像を作成することにより、例えば最後の画像の任意の1つの領域について、位置ベクトル間の距離と算出された特徴量ベクトル間の距離とを引数とする探索関数の値が最小となる最後の画像の領域を探索し、探索された領域と、探索前の領域との空間差異を算出する。探索されたノードおよびその近傍のノードは一定の関数により更新される。対応点抽出部302は、以上の探索と更新を所定の回数繰り返しは、一定の収束が得られた段階で対応関係を確定して、データベース204に格納する等により保持する。中間画像算出部303は、全ての領域について2つの画像の対応点が決定した後対応点同士を、本実施形態では線形処理して任意の中間画像の対応点を取得し全ての対応点をプロットして中間画像を算出する。算出された中間画像は、動画像の1こまとしてデータベースに格納することができ、ディスプレイ202や図示しないプリンタに出力、または遠隔の装置に送信することができる。
(本実施形態の処理)
以上、本願発明の原理と本実施形態で用いられるシステムの構成について説明したが、次に具体的に本願発明の原理を適用した処理について2つの画像、最初の画像Aおよび最後の画像Bを例に説明する。本実施例では、画像AおよびBから中間画像を算出して画像Aから始まって画像Bで終了する動画像が生成されることとなる。
(1)多重解像度の特徴量ベクトルの作成
図4は、本実施形態の画像移動算出処理の流れを示すフローチャートである。本実施形態ではまず、所与の画像をいずれかの解像度で分割し、ニューラルネットワークによる学習により対応領域を抽出しつつ、解像度を高めていって対応点を抽出する。このため、最初はM×Nの解像度で処理を進めることとし、2つの画像をM×N個の重ならない矩形領域に分割する(S401)。ここで、便宜上分割される領域は矩形としたが、これに限られずいずれの形態の領域にも分割することができる。分割された各領域について、その領域の特徴を示す特徴量を算出する。ここで、特徴量は本技術分野で使用することができるいずれの特徴を表す値を用いることができるが、本実施形態では主に輝度または輝度に対応する性質をあらわすいずれかの値の、その領域内での平均値、最大値、最小値、変極点の値、微分値、二次微分値などの数値のいずれか、あるいはいくつかを組み合わせたものを使用する。
本実施形態では、輝度および輝度に関連する情報を用いて特徴量としたが、画像によっては色情報も特徴を強く表している場合があり、このような場合は色差および関連情報を用いて効果的に処理を進めることもでき、その場合は特徴量の抽出方法が異なるだけであり、一旦特徴量を取得すれば以下の処理はほとんどそのまま使用することができる。同様に、その他画像の特徴を表すその他の属性が使用できれば以下の処理を行って本実施形態の対応点抽出が可能である。通常、特徴量としてはこれらの数値をいくつか、例えばk個組み合わせるため、k次元ベクトルとなり、特徴量ベクトルが作成されることになる。
このようにして、特徴量ベクトルという概念を導入することにより、分割された各領域は画像上の領域の位置を示す位置ベクトルPi,jあるいは画像Aの位置Xi,jおよび画像B上の位置Yi,jと特徴量ベクトルFi,j(1≦i≦M、1≦j≦N)とで表されることとなり、ベクトルを含むそれらの情報用いて画像間の対応する点を抽出していくことができる。
(2)自己組織化写像を用いた特徴領域の抽出
次に各領域をニューラルネットワークのノードに置き換えて、特徴量ベクトルFi,jなどを属性として有するノードとすることにより、これらの自己組織化写像を作成して適切なノードを探索し、その結果をもとにノードを更新する処理を、更新による変位が一定範囲内となるまで繰り返すことにより適切な対応領域を抽出する。
(i)写像の初期化
先ず図4のステップS402において、図5に示すようにM×N個に分割した領域に対応するようにM×Nのノードからなる自己組織化写像を作成すると、ノードi,jは特徴量ベクトルFi,jおよび位置ベクトル位置Xi,jおよび位置Yi,jを属性として有することとなる。ここで、まずXi,j=Yi,jを初期状態とする。すなわち、処理を開始する時点では、2つの画像は同一位置を対応点とし、その画像の状態により実際に対応する点に近づけていくのである。すなわち、初期段階では、図5に示すように画像Aに対応する画像B上の点は同じ場所になっているが、本実施形態の処理が行われる結果、画像Aに対応する点は画像B’上に対応付けできるようになる。
(ii)学習対象領域の選択
次に、画像Bで分割した矩形領域からランダムに処理の対象とする領域を選択する(S404)。実際には、画像B全体としてランダムに選択することにより、対応するノードが選択されそのノードについて後述する処理が実行される。選択された領域について対応点を抽出した後、さらに他の領域を選択して最終的に画像Bの前領域を網羅することになるが、本実施形態ではこの選択はランダムに行われる必要がある。すなわち、本実施形態では領域の選択に規則性を持たせると、領域によっては学習により本来の対応点と異なる点に収束し局所解になる可能性があるため、これを避けるようにランダムに選択する必要があるのである。使用する乱数は完全にランダムである必要はなく擬似乱数でも良く、一定のランダムさを有していれば良い。
この選択に際しては、対応点とは評価されない点や部分、例えば最初の画像に存在しないが最後の画像には存在するような部分、具体的には最初の画像が人物の横を向いた写真であり、最後の写真がその人物が正面を向いた写真である場合に最初隠れていた方の耳などは、その領域を処理しても対応する点は元々ないため、処理不能になるか、誤った点を抽出してしまう可能性がある。このような領域をそのままにして本実施形態の処理を進めると、無駄な処理が多くなり処理能力にも影響を及ぼす。したがって、本実施形態では、ガウス分布を用いてこのような異常な点を取り除いた後処理対象となる領域の選択を行う。
なお、本実施形態では、画像をM×Nの矩形に分割した結果、各矩形領域は相互に重なり合うことなく、コンピュータによる計算処理を円滑に行うことができるが、本願発明の原理は、本実施形態の処理例とは逆に領域ではなく対応点が基準となる。すなわち、本願発明は複数の画像間の対応点を求めるものであるから、もともと画像間の点同士を比較処理すればよく、画像中の任意の点を選択してその特徴量を導出することができれば、適当に点を選択して、選択された点を基準に処理を行うことができる。本実施形態では、輝度や色差を特徴量として用いるため、点そのものではなく点の周囲の一定の領域を対象にして特徴量を算出するほうがコンピュータを使用した処理では容易である場合が多い。この結果、本実施形態では便宜上領域を対象として処理し、領域の中心点同士を対応点として決定するが、点同士を最初から対応させつつ、その点の任意の領域を用いて特徴量を算出し処理を行うこともできる。この場合、本実施形態とは異なり、領域の形状はもとより、各領域は重なり合っても良いし、逆に隙間があってもよい。
(iii)ノードの探索
もっともらしい対応点に近づけるため、選択されたノードについての特徴量の所定の関数の値が最小となるノードを探索する(S405)。すなわち、特徴量に基づいて2つの画像で関連性がありそうな対応点を探索するため一定の類似度を示す関数を設定しその値が一定の値になるように処理していく。具体的には、本実施形態では類似関数Di,j(DPi,j(b)i,j,DFi,j(b))として、例えば以下のような値を用いる(類似関数Di,jは、類似するほど、すなわち類似度が高いほど低い値をとる関数である)。ここで、DPi,jは、現在の対応点と探索すべきノードとの位置ベクトル間の距離、すなわち幾何空間における距離を示しており、例えばL2ノルム||Pb-Yi,j||とすることができる。また、DFi,jは現在の対応点と探索すべきノードとの特徴量ベクトル間の距離、例えば輝度空間あるいは色空間の距離を示しており、例えば
Figure 0005071900
とすることができる。
(I)Di,j= DPi,j(b)+βDFi,j(b) : βは輝度空間の幾何空間に対する重み
(II)Di,j= DPi,j(b)*(DFi,j(b))β : βは輝度空間の幾何空間に対する重み
類似関数として(I)または(II)のいずれかを任意に選択することができ、いずれも本願発明の実施に有効に供することができるが、(I)は線形になっているので比較的扱い易く効果も高いことが知られている。
(iv)隣接ノードの更新
類似関数の値が最小となるよう探索されたノードI,J=arg min Di,j (b)およびその隣接ノードを以下の式に基づき更新する(S406)。
Yi,j(t)= Yi,j(t-1)+αδ(Xi,j(t)- Yi,j(t-1)) (2)
ここで、α(0<α≦1)は、学習率係数であり、例えば0.01といった固定の値や単調減少関数を用いることができるが、これに限られず本技術分野で知られたいずれの適切な値を用いることができる。一般に、比較的動きの少ない画像間の対応点を探索する場合は、0.01といった比較的小さい定数を用いることにより、安定して収束させることができるが、動きの大きな画像間で対応点を探索する場合は、最初から小さいαを用いると極所解となり正確な対応点を見つけられないことがあるため、最初は比較的大きな値を取り後述のδのように単調に減少するような関数を用いることが効果的な場合もある。
δについては、tに対し単調減少し0以上の値をとる関数range(t)を想定すると、|I-i|≦range(t)かつ|J-j|≦range(t)のときδ=1であり、それ以外ではδ=0の値をとるものとする。なお、本実施形態では、図6に示すような対象点(領域)801の8個の近傍の領域について処理を行う8 Neighborsを使用する。すなわち、対象領域801の近傍が上記の式(2)により更新され一定の対応関係に収束する。これは、対象点の周囲の画像の状態を織り込むことによって、より適切な対応点の探索が可能になるからである。
本実施形態では、上述のように隣接ノードとして8 Neighborsを使用するが、これに限られること無く種々の本技術分野で知られた方法を用いることができる。例えば、4 Neighborsを使用することもできる。この場合、上述のδは|I-i|≦range(t)または|J-j|≦range(t)のときδ=1であり、それ以外ではδ=0の値をとるものとする。
このように更新した後、再度類似関数最小となるノードを探索し、以上の処理を繰り返し実行する(S407)。すなわち、上述の(iii)と(iv)の処理を一定以上の回数繰り返すことにより、上述の(ii)で選択した領域について対応領域を取得することができる。ランダムに選択した1つの領域について、上述のような処理を行って対応点を求め、その後やはりランダムに残りの領域について同様の処理を実行して画像全体の処理を行い、対応点の抽出を終了する(S403)。
このようにしてM×Nの解像度の対応点が得られると、図7に示すように段階的に解像度を上げて、M×Nの解像度でより正確な対応点を求める。通常、図7に示すように3段階程度で処理を行うが、これに限られることなく、システムや画像の特性に合わせてより少ない回数やより多い回数で処理することもできる。
ここで、一定の回数は、システムによっても異なるし、対象とする画像の性質によっても異なるが、本実施形態では例えばM×N個に分割した各領域について(iii)と(iv)の処理を16回から64回行い、M=N=256で3段階の解像度を条件に計算すると、約300〜1200万回繰り返す場合もある。この繰り返し回数は、回数自体として所定の値を実験等の結果により定めることもできるが、例えば(iv)の更新処理による変位が一定以下になることを繰り返し回数の判定基準とすることもできる。
(中間画像の生成)
以上の処理により元の複数画像について対応点を定めることができると、この情報に基づいて様々な画像処理が可能となる。本実施形態では、本願発明の種々の応用分野の中で、最も簡易なものとして、特に2枚の画像から画像と画像の間の中間画像の算出を行う。中間画像が得られれば、複数の静止画像として出力することもでき、毎秒一定数のこまを出力して動画を生成することもできる。例えば、上述したように画像Aと画像Bとのそれぞれの対応点が抽出され、それらの対応点同士を結ぶ線上の中間点をプロットすると、中間画像上で画像AおよびBの各対応点に対応する点は両点を結ぶ線分の中間点となる。このような中間点のような中間画像上の点を算出してプロットしていくと中間画像が生成される。中間点を取ると真ん中の画像となるが、対応点間を結ぶ線分の任意の比率となる点をプロットしていくことにより画像AとBとの間の任意の位置における中間画像を得ることができるわけである。
本実施形態では、このように線形処理により比較的自然な中間画像を得られるが、これに限られること無く線形以外、すなわち一定の比率を用いずに画像Bに近づくにしたがって変化が大きくなるように重み付けしたり、中間画像の前後で変化が大きくなるようにしたりすることもできる。したがって、その所望するシステムの目的に応じて任意の重み付け関数を用い、またはその他本技術分野で知られたいずれかの方法で中間画像を生成することができる。
また、本実施形態では2枚の元の画像からその中間の画像を生成するが、その他にも本願発明の原理を用いて複数の画像間のそれぞれの対応点を抽出することができると様々な画像処理に応用することができる。例えば、3枚の画像を用いて上述の2枚の画像で行ったと同じような中間画像抽出処理により、種々の応用処理を実行させることができる。すなわち、例えば3枚の同一人物の顔の画像を用意し、これらを合成して種々の表情を生成することを考える。一般に、最も感情が表れるかの表情は泣き、笑い、怒った顔の3種であるから、これらを元の画像とする。まず、ステップ1として本実施形態の処理を各画像ペアごとに実行することにより3枚のそれぞれの画像の対応点を抽出する。次にステップ2として、2枚の画像ペアを任意に選択して所定の比率により第1の中間画像を生成し、その後残りの1枚の画像と第1の中間画像とに別の所定の比率を適用して、第2の中間画像を生成する。以上により、3種類の元の感情を適度に混合させた様々な顔の表情が得られる。所定の比率を変化させるだけで驚くほど多様な表情をもつ顔の画像を得ることができる。
このようにして得られる様々な例の1つが例えば図1に示すような画像である。
(第2実施形態)
上述の第1実施形態では、本願発明を予め与えられた複数の画像に適用して中間画像や、動画像を生成するものであったが、本実施形態では、インターネットにより接続されたサーバにクライアント装置がアクセスすることにより、サーバ内に有する複数の画像から中間画像を生成してクライアント装置に提供するものである。
本実施形態では、サーバはクライアント装置に対して、例えば商品広告や商品情報を提供するが、その際商品の画像に本願発明の技術を適用して画像処理を施し、顧客の興味をより引くようにすることができる。すなわち、顧客がクライアント装置から所望の商品を選択して情報の提供を要求すると、サーバは対応する商品のその他の情報とともに予め格納されている商品の画像に本願発明を適用して新たな画像を生成し、クライアント装置に送信する。具体的には、複数枚の商品画像から中間画像を生成するが、例えば自動車の正面からの写真と横方向からの写真を基に斜めから見た画像を生成して出力したり、生活用品の静止画から動画を生成して実際の使用状況を説明させたりすることができる。本願発明を使用すると、適切な対応点の抽出により自然な中間画像が得られるだけでなく、計算を効率化できるので、インターネットを介した対話型のシステムにも高速処理を行って対応可能なのである。
以上により、本願発明を用いることにより、インターネットを介した商品情報の提供が可能となる。
本発明にかかる一実施形態の画像と画像との間でそれぞれ対応する点を抽出することを説明する図である。 本発明にかかる一実施形態のシステム構成を示すブロック図である。 本実施形態の機能モジュールの構成を示す図である。 本実施形態の処理の一例を示すフローチャートである。 本実施形態の処理の対応点の探索について説明するための図である。 本実施形態の処理の近傍について説明するための図である。 本実施形態の処理の解像度について説明するための図である。
符号の説明
201 コンピュータ
202 画面
203 入力部
204 データベース
103 ネットワーク
104 サーバ
301 特徴量抽出部
302 対応点抽出部
303 中間画像抽出部

Claims (8)

  1. ニューラルネットワークにより2つの画像間の対応点を抽出して画像を生成する方法であって、
    前記2つの画像を各々相互に重ならない複数の、M×N個の矩形領域である領域に分割して、当該分割された領域のそれぞれにおける、該領域内の輝度を含む特徴量ベクトルを算出する特徴量算出ステップと、
    第1の画像の任意の1つの領域について、位置ベクトル間の距離と前記算出された特徴量ベクトル間の距離とを引数とする探索関数の値が最小となる第2の画像の領域を探索する領域探索と、前記任意の1つの領域について探索された領域と、探索前の領域との空間差異により2つの画像間の対応関係マッピング情報を生成するマッピング情報生成とを複数回繰り返すことにより2つの画像間の対応点を抽出し、さらにM×N個よりも高い解像度で1回以上当該抽出を繰り返して該対応点を抽出する抽出ステップと、
    前記抽出された2つの画像間の任意の画像における各々の対応点の移動量を算出することにより中間画像を取得するステップと
    を備えたことを特徴とする方法。
  2. 前記抽出ステップは、前記M×N個の矩形領域に各々対応して作成されたM×N個のノードからなる自己組織化写像を用いて前記2つの画像間の対応点を抽出することを特徴とする請求項に記載の方法。
  3. 前記探索関数は、前記位置ベクトル間の距離と、前記算出された特徴量ベクトル間の距離に特徴量の位置に対する重みを乗算した値とを加算する関数であることを特徴とする請求項1または2に記載の方法。
  4. 前記抽出ステップは、前記第1の画像の任意の1つの領域をランダムに選択することを特徴とする請求項1ないしのいずれかに記載の方法。
  5. 前記マッピング情報生成は、前記探索した第2の画像の領域およびその近傍について、前記第1の画像の対応する領域との距離に学習率定数を乗じた値だけ当該対応する方向に移動させて、第1の画像の領域と対応する第2の画像の領域との関係をマッピング情報として生成することにより実行することを特徴とする請求項1ないしのいずれかに記載の方法。
  6. 前記抽出ステップは、前記領域探索およびマッピング情報生成を、前記マッピング生成で移動した移動量が所定の閾値以下になるまで繰り返すことを特徴とする請求項に記載の方法。
  7. ニューラルネットワークにより2つの画像間の対応点を抽出して画像を生成する画像生成装置であって、
    前記2つの画像を各々相互に重ならない複数の、M×N個の矩形領域である領域に分割して、当該分割された領域のそれぞれにおける、該領域内の輝度を含む特徴量ベクトルを算出する特徴量算出手段と、
    第1の画像の任意の1つの領域について、位置ベクトル間の距離と前記算出された特徴量ベクトル間の距離とを引数とする探索関数の値が最小となる第2の画像の領域を探索する領域探索と、前記任意の1つの領域について探索された領域と、探索前の領域との空間差異により2つの画像間の対応関係マッピング情報を生成するマッピング情報生成とを複数回繰り返すことにより2つの画像間の対応点を抽出し、さらにM×N個よりも高い解像度で1回以上当該抽出を繰り返して該対応点を抽出する抽出手段と、
    前記抽出された2つの画像間の任意の画像における各々の対応点の移動量を算出することにより中間画像を取得する手段と
    を備えたことを特徴とする画像生成装置。
  8. コンピュータに、ニューラルネットワークにより2つの画像間の対応点を抽出して画像を生成する方法を実行させるプログラムであって、前記方法は、
    前記2つの画像を各々相互に重ならない複数の、M×N個の矩形領域である領域に分割して、当該分割された領域のそれぞれにおける、該領域内の輝度を含む特徴量ベクトルを算出する特徴量算出ステップと、
    第1の画像の任意の1つの領域について、位置ベクトル間の距離と前記算出された特徴量ベクトル間の距離とを引数とする探索関数の値が最小となる第2の画像の領域を探索する領域探索と、前記任意の1つの領域について探索された領域と、探索前の領域との空間差異により2つの画像間の対応関係マッピング情報を生成するマッピング情報生成とを複数回繰り返すことにより2つの画像間の対応点を抽出し、さらにM×N個よりも高い解像度で1回以上当該抽出を繰り返して該対応点を抽出する抽出ステップと、
    前記抽出された2つの画像間の任意の画像における各々の対応点の移動量を算出することにより中間画像を取得するステップと
    を備えたことを特徴とするプログラム。
JP2008048753A 2008-02-28 2008-02-28 画像生成装置およびその方法 Expired - Fee Related JP5071900B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2008048753A JP5071900B2 (ja) 2008-02-28 2008-02-28 画像生成装置およびその方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2008048753A JP5071900B2 (ja) 2008-02-28 2008-02-28 画像生成装置およびその方法

Publications (2)

Publication Number Publication Date
JP2009205553A JP2009205553A (ja) 2009-09-10
JP5071900B2 true JP5071900B2 (ja) 2012-11-14

Family

ID=41147717

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008048753A Expired - Fee Related JP5071900B2 (ja) 2008-02-28 2008-02-28 画像生成装置およびその方法

Country Status (1)

Country Link
JP (1) JP5071900B2 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10115032B2 (en) * 2015-11-04 2018-10-30 Nec Corporation Universal correspondence network
JP6924128B2 (ja) * 2017-11-24 2021-08-25 Kddi株式会社 モーフィング画像生成装置及びモーフィング画像生成方法

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001268431A (ja) * 2000-01-11 2001-09-28 Fujitsu Ltd 補正画像生成装置,補正画像生成方法,補正画像生成用プログラム記録媒体および補正画像生成用プログラム
JP4382744B2 (ja) * 2005-11-25 2009-12-16 日本電信電話株式会社 画像情報抽出方法及び画像情報検索方法及びプログラム
JP4740038B2 (ja) * 2006-05-30 2011-08-03 富士重工業株式会社 画像処理装置

Also Published As

Publication number Publication date
JP2009205553A (ja) 2009-09-10

Similar Documents

Publication Publication Date Title
CN110163640B (zh) 一种在视频中植入广告的方法及计算机设备
US8624901B2 (en) Apparatus and method for generating facial animation
US8154544B1 (en) User specified contact deformations for computer graphics
CN109583509B (zh) 数据生成方法、装置及电子设备
CN117256019A (zh) 用于视频动作识别的多分辨率注意力网络
US20230342592A1 (en) Controlling a neural network through intermediate latent spaces
JP2007000205A (ja) 画像処理装置及び画像処理方法並びに画像処理プログラム
JP6448839B1 (ja) 画像生成装置、画像生成器、画像識別器、画像生成プログラム、及び、画像生成方法
Ahmadi et al. Context-aware saliency detection for image retargeting using convolutional neural networks
JP2020507824A (ja) 電子装置及びその制御方法
JP7437738B2 (ja) 機械学習システム、学習用データセット生成システム、及び機械学習プログラム
JP2019204476A (ja) 画像生成装置、画像生成方法及びプログラム
US20220285024A1 (en) Facilitating interpretability of classification model
JP2020177495A (ja) 動画生成装置、動画生成方法、プログラム、記憶媒体
Houdard et al. Wasserstein generative models for patch-based texture synthesis
US20230290132A1 (en) Object recognition neural network training using multiple data sources
JP5071900B2 (ja) 画像生成装置およびその方法
KR20230028481A (ko) 공간 인식 조건부 gan들을 이용하는 고해상도 제어가능한 얼굴 노화
CN114762004A (zh) 数据生成方法、数据生成装置、模型生成方法、模型生成装置及程序
AU2019200269B2 (en) An interactive user interface and its corresponding engine for improving image completion quality
CN114663980A (zh) 行为识别方法、深度学习模型的训练方法及装置
JP2019220133A (ja) 画像生成装置、画像生成器、画像識別器、画像生成プログラム、及び、画像生成方法
Lee et al. CartoonModes: Cartoon stylization of video objects through modal analysis
JP7497791B2 (ja) 画像生成支援装置
US9240062B2 (en) Node arranging apparatus, node arranging method, and storage medium

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20110204

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20120313

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20120323

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20120522

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20120615

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20120803

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20120813

R150 Certificate of patent or registration of utility model

Ref document number: 5071900

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20150831

Year of fee payment: 3

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees