JP2013536960A - 写真から肖像スケッチを合成するシステム及び方法 - Google Patents
写真から肖像スケッチを合成するシステム及び方法 Download PDFInfo
- Publication number
- JP2013536960A JP2013536960A JP2013526296A JP2013526296A JP2013536960A JP 2013536960 A JP2013536960 A JP 2013536960A JP 2013526296 A JP2013526296 A JP 2013526296A JP 2013526296 A JP2013526296 A JP 2013526296A JP 2013536960 A JP2013536960 A JP 2013536960A
- Authority
- JP
- Japan
- Prior art keywords
- patch
- sketch
- test
- photo
- training set
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T11/00—2D [Two Dimensional] image generation
- G06T11/60—Editing figures and text; Combining figures or text
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2210/00—Indexing scheme for image generation or computer graphics
- G06T2210/22—Cropping
Landscapes
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Image Processing (AREA)
- Processing Or Creating Images (AREA)
Abstract
本出願は、写真から肖像スケッチを合成するシステム及び方法を開示している。この方法は、テスト写真を等間隔で重なる複数のテスト写真パッチに分割するステップと、各テスト写真パッチと、複数のトレーニング集合写真において予め分割された写真パッチとのマッチング情報を確定するステップと、各テスト写真パッチと、複数のトレーニング集合スケッチ画像において予め分割されたスケッチパッチとのマッチング情報を確定するステップと、合成されるスケッチ画像の形状事前分布を確定するステップと、隣接する二つのトレーニング集合スケッチパッチの間の階調一貫性情報と、隣接する二つのトレーニング集合スケッチパッチの間の勾配一貫性情報とを確定するステップと、前記マッチング情報、形状事前分布、階調一貫性情報及び勾配一貫性情報に基づいて、前記各テスト写真パッチに対して、最もマッチングするトレーニングスケッチパッチを確定するステップと、確定されたトレーニングスケッチパッチを肖像スケッチ画像に合成するステップと、を備える。
Description
本出願は、写真から肖像スケッチを合成するシステム及び方法に関する。
最近、自動肖像合成技術は、司法分野とデジタル娯楽産業において広く応用されているため、ますます注目を浴びている。例えば、司法分野において、警察側がスケッチ肖像を利用して写真データベースにおいて犯罪容疑者を検索することは、非常に重要な応用の一つである。人の顔写真をスケッチに変換させ、画家の描いたスケッチと、コンピューターで合成したスケッチとを、顔識別技術で直接にマッチングさせることによって、顔識別の正確性を向上することができる。映画産業において、スケッチ自動合成システムにより、芸術家は顔動画を製作する時間を大幅に短縮できる。普通の人々でも、このようなシステムがあれば、デジタル分野において、例えばMSNアイコンのような身分シンボルを簡単に作ることができるようになる。
流行されるスケッチ合成方法は、ほとんどサンプルライブラリーに基づくものである。対応する写真とスケッチ画像から構成されるトレーニングライブラリーを利用して、写真から豊かなテクスチャを持つスケッチを生成できる。これらの方法は、トレーニングライブラリーを変更させることによって様々なスタイルのスケッチを合成できる。従来技術において、全体的特徴変換により写真からスケッチを合成する方法を提案されているが、人によって髪型が大いに変わるため、もし毛髪領域まで含まれると、このような全体的な線形モデルでは効率よく運用できなくなる。そこで、この問題点を解決するために、この分野において、パッチに基づく合成方法が提案された。しかし、このような方法には、各領域のパッチはそれぞれ個別に合成され、各パッチ間の空間関係へ配慮されていないため、合成の結果として人間の顔の構造がよく維持できないという問題点が存する。また、トレーニングサンプルの線形組合せによって肖像スケッチ合成を行う場合、ぼやけてしまうおそれがある。
要するには、従来の方法は、画像形成の条件が厳しく制限された写真の場合に適用されるが、光照射や姿勢の変化があった写真には応対できない。
本発明は、写真から肖像スケッチを合成する方法であって、テスト写真を複数のテスト写真パッチに分割するステップと、各テスト写真パッチと、複数のトレーニング集合写真において予め分割された写真パッチとの間の第一マッチング情報を確定するステップと、各テスト写真パッチと、複数のトレーニング集合スケッチ画像において予め分割されたパッチとの間の第二マッチング情報を確定するステップと、合成されるスケッチ画像の形状事前分布(shape prior)を確定するステップと、前記第一マッチング情報、前記第二マッチング情報及び前記形状事前分布に基づいて、各テスト写真パッチに対して、最もマッチングするトレーニング集合スケッチ画像を確定するステップと、確定されたトレーニング集合スケッチパッチを肖像スケッチ画像に合成するステップと、を備えることを特徴とする。
前記方法において、更に、各テスト写真パッチに対して、最もマッチングするトレーニング集合スケッチ画像を確定するステップは、前記第一マッチング情報、前記第二マッチング情報及び前記形状事前分布に基づいて、マルコフ確率場モデルを立てるステップと、立てられたマルコフ確率場モデルを最適化させ、各テスト写真パッチに対して、最もマッチングするトレーニング集合スケッチ画像を確定するステップとを備えていてもよい。
また、本発明は写真から肖像スケッチを合成する方法であって、テスト写真を等間隔で重なる複数のテスト写真パッチに分割するステップと、各テスト写真パッチと、複数のトレーニング集合写真において予め分割された写真パッチとの間の第一マッチング情報を確定するステップと、各テストパッチと、複数のトレーニング集合スケッチ画像において予め分割されたパッチとの間の第二マッチング情報を確定するステップと、前記各テスト写真の形状事前分布を確定するステップと、隣接する二つのトレーニング集合パッチの間の階調一貫性情報(gray consistency information)と、隣接する二つのトレーニング集合スケッチパッチの間の勾配一貫性情報(gradient consistency information)とを確定するステップと、前記第一マッチング情報、前記第二マッチング情報、前記形状事前分布、前記階調一貫性情報及び前記勾配一貫性情報に基づいて、前記各テスト写真パッチに対して、最もマッチングするトレーニングスケッチ画像を確定するステップと、確定されたトレーニングスケッチパッチを肖像スケッチ画像に合成するステップと、を備えることを特徴とする。
前記方法において、前記各テスト写真パッチに対して、最もマッチングするトレーニングスケッチ画像を確定するステップは、前記第一マッチング情報、前記第二マッチング情報、前記形状事前分布、前記階調一貫性情報及び前記勾配一貫性情報に基づいて、マルコフ確率場モデルを立てるステップと、立てられたマルコフ確率場モデルを最適化させ、各テスト写真パッチに対して、最もマッチングするトレーニング集合スケッチ画像を確定するステップとを備えていてもよい。
また、本発明は、写真から肖像スケッチを合成する方法であって、テスト写真を複数のテスト写真パッチに分割するステップと、複数のトレーニング集合写真と複数のトレーニング集合スケッチ画像で、前記各テスト写真パッチに対してマルコフ確率場モデルを立てるステップと、前記マルコフ確率場モデルを最適化させ、前記各テストパッチに対して、前記複数のトレーニング集合スケッチ画像から最もマッチングするトレーニングスケッチパッチを選出するステップと、選出されたトレーニングスケッチパッチを肖像スケッチ画像に合成するステップとを備え、前記マルコフ確率場モデルは、前記各テストスケッチ画像の形状事前分布と、前記各テスト写真パッチと前記トレーニング集合写真の写真パッチとの間の第一マッチング情報と、前記各テストパッチと前記トレーニング集合スケッチ画像のパッチとの間の第二マッチング情報とを含むことを特徴とする。
また、本発明は写真から肖像スケッチを合成するためのシステムであって、テスト写真を複数のテスト写真パッチに分割する分割モジュールと、各テスト写真パッチと、複数のトレーニング集合写真において予め分割された写真パッチとの間の第一マッチング情報を確定する写真−写真マッチングモジュールと、各テスト写真パッチと、複数のトレーニング集合スケッチ画像において予め分割されたパッチとの間の第二マッチング情報を確定する写真−画素マッチングモジュールと、各テストパッチの形状事前分布を確定する形状事前分布確定モジュールと、前記第一マッチング情報、前記第二マッチング情報及び前記形状事前分布に基づいて、各テスト写真パッチに対して、最もマッチングするトレーニング集合スケッチ画像を確定する最適化モジュールと、確定されたトレーニング集合スケッチパッチを肖像スケッチ画像に合成する合成モジュールと、を備えることを特徴とする。
一つの実施形態において、前記最適化モジュールは、前記第一マッチング情報、前記第二マッチング情報及び前記形状事前分布に基づいてマルコフ確率場モデルを立て、立てられたマルコフ確率場モデルを最適化させ、各テスト写真パッチに対して、最もマッチングするトレーニング集合スケッチ画像を確定するように配置される。
また、上記写真から肖像スケッチを合成するシステムは、更に、隣接する二つのトレーニング集合パッチの間の階調一貫性情報と、隣接する二つのトレーニング集合スケッチパッチの勾配一貫性情報とを確定するための平滑モジュールを備えても良い。この場合、前記最適化モジュールは、前記第一マッチング情報、第二マッチング情報、形状事前分布、階調一貫性情報及び勾配一貫性情報に基づいてマルコフ確率場モデルを立て、立てられたマルコフ確率場モデルを最適化させ、各テスト写真パッチに対して、最もマッチングするトレーニング集合スケッチ画像を確定するように配置される。
本発明の写真から肖像スケッチを合成する方法及びシステムは、様々な光照射条件と様々な姿勢による顔写真に対して処理を施すことができる。下記の技術内容から少なくとも一つが導入されているため、本発明の上記方法及びシステムは、光照射と写真の姿勢とに対して頑健性(robustness)を持っている。
(1)顔の特徴部位に関する形状事前分布を導入することにより、光照射条件や姿勢の変化による歪みを低減させる。
(2)新規のパッチ記述子と計量を導入することにより、提供された写真パッチが対応するスケッチパッチを捜す。
(3)隣接するパッチに対して階調一貫性情報及び勾配一貫性情報で制限を行う。
以下、図面を参照しながら本発明の実施形態について詳しく説明する。
[実施形態1]
図1は、本発明の一実施形態に係る、写真から肖像スケッチを合成する方法1000を示す。方法はステップS101から始まり、このステップにおいては、入力されたテスト写真をN個の写真パッチに分割できる。一つの実施形態において、テスト写真は、等間隔で重なるN個の写真パッチに分割される。また、分割する前に、両眼の中心が固定位置にあるように、全ての写真と以下で説明するスケッチ画像に対して平行移動、回転及び縮小によって前処理を行う。一つの実施形態において、画像のサイズを250×200とし、両眼の中心の位置を(75、125)、(125、125)とする。すべてのカラ画像をグレースケール画像に変換する。
図1は、本発明の一実施形態に係る、写真から肖像スケッチを合成する方法1000を示す。方法はステップS101から始まり、このステップにおいては、入力されたテスト写真をN個の写真パッチに分割できる。一つの実施形態において、テスト写真は、等間隔で重なるN個の写真パッチに分割される。また、分割する前に、両眼の中心が固定位置にあるように、全ての写真と以下で説明するスケッチ画像に対して平行移動、回転及び縮小によって前処理を行う。一つの実施形態において、画像のサイズを250×200とし、両眼の中心の位置を(75、125)、(125、125)とする。すべてのカラ画像をグレースケール画像に変換する。
経験では、光がほぼ正面から照射される場合、上記したアルゴリズムは前処理ステップを含まなくてもいい。側面から照射の場合は、CLAHE(Contrast Limited Adaptive Histogram Equalization)を使用して前処理を行うことができる。
ステップS102においては、ステップS101において分割したN個のパッチに基づいて、複数のトレーニング集合写真とトレーニング集合スケッチ画像によって、前記各テスト写真パッチに対して、マルコフ確率場(MRF)ネットワークモデルを立てる。
MRFネットワークにおける各ノードはテスト写真のパッチxp iである。MRFネットワークモデルによって推定する目標は、ノードの状態yi=(yp i,ys i)である。言い換えると、各xp iに対して、トレーニング集合において1対の写真−スケッチパッチを確定する。ここで、トレーニング集合において写真とスケッチが幾何学的に整列されている。yp iとys iはそれぞれ、対応する写真パッチとスケッチパッチを示す。テスト写真においてパッチiとjは隣接する場合、一つの辺によってノードyiとノードyjを繋がる。つまり、これらに対して一貫性制約(consistency constraints)を加える。全ての{ys i}をまとめると、テスト写真のスケッチが合成される。
図2は上記形成されたMRFネットワークモデル模式図である。このMRFモデルのエネルギー関数は以下のように定義される。
本発明において、2スケールMRF(two-scale MRF)を使用できる。この場合において、テスト写真とトレーニング集合写真の2層のパッチのサイズは例えばそれぞれ10×10と20×20としてもいい。説明の便宜をはかるために、以下では1スケールMRFモデル(single-scale MRF)を使用して説明する。
ステップS103において、上記MRFモデルを最適化させて、複数のトレーニングスケッチ画像において、各テスト写真パッチに対して、最もマッチングするトレーニングスケッチパッチを選出する。一つの実施形態において、確率伝搬アルゴリズム(belief propagation algorithm)を利用して上記MRFモデルを最適化させることができる。即ち、式(1)における
計算量を減少するため、MRFモデルを最適化する前に、候補パッチを予め選出するアルゴリズムを利用してもよい。各テスト写真パッチxp iに対して、トレーニング集合において、最も小さいエネルギーEL(xp i,yi)+Epi(yi)を有するランキングトップK(K=20)個の写真−スケッチパッチ対を選出する。顔構造を利用するために、候補パッチを、全体画像において選出するのではなく、パッチiの周辺の25×25領域で選出する。ノードiに対する最終的な推定
最後に、ステップS104において、選出されたトレーニングスケッチパッチを肖像スケッチ画像に合成する。一つの実施形態において、ぼやける問題を避けるために、二つのパッチの重なる領域に対して最低誤差境界分割アルゴリズム(minimum error boundary cut algorithm)を利用することができる。これはテクスチャ合成においてよく使われるアルゴリズムである。
[実施形態2]
本発明に係る実施形態2は、ステップS102において、MRFモデルは、
本発明に係る実施形態2は、ステップS102において、MRFモデルは、
以下に、上記式(1)又は(1’)におけるローカル証拠関数、形状事前分布関数及び隣接一貫性関数についてそれぞれ説明する。
1. ローカル証拠関数
ローカル証拠関数は、トレーニングライブラリーにおいて、テスト写真パッチxp iとマッチングするスケッチパッチys iを確定するためのものである。写真はスケッチ画像と異なった形態を有するため、これらを直接にマッチングさせることは非常に難しい。そのため、通常、トレーニングスケッチパッチys iと対応する写真パッチyp iを利用する。yp iとxp iが非常に接近するとする場合、ys iは合成される対象スケッチパッチと非常に近くなる可能性が高い。本出願では、テスト写真パッチとトレーニング写真パッチとのマッチング度合い、並びに、テスト写真パッチとトレーニングスケッチパッチとのマッチング度合いが同時に計算される。つまり、ローカル証拠関数は写真−写真平方偏差距離(squared difference distance)d2 L1と、写真−画像平方偏差距離d2 L2との加重和であると定義付けられる。
ローカル証拠関数は、トレーニングライブラリーにおいて、テスト写真パッチxp iとマッチングするスケッチパッチys iを確定するためのものである。写真はスケッチ画像と異なった形態を有するため、これらを直接にマッチングさせることは非常に難しい。そのため、通常、トレーニングスケッチパッチys iと対応する写真パッチyp iを利用する。yp iとxp iが非常に接近するとする場合、ys iは合成される対象スケッチパッチと非常に近くなる可能性が高い。本出願では、テスト写真パッチとトレーニング写真パッチとのマッチング度合い、並びに、テスト写真パッチとトレーニングスケッチパッチとのマッチング度合いが同時に計算される。つまり、ローカル証拠関数は写真−写真平方偏差距離(squared difference distance)d2 L1と、写真−画像平方偏差距離d2 L2との加重和であると定義付けられる。
すなわち、
式(2)から分かるように、上記ローカル証拠関数は以下の両方を含む。
1.1 写真―写真のパッチマッチングd2 L1(xp i,yp i)
EL()関数の簡単な例は、例えば、従来の技術で使用したxp iとyp iのユークリッド距離(Euclidean distance)であって良い。しかし、光照射の条件に変化がある場合、あまり効果的ではない。スケッチラインの多くは写真におけるエッジ情報に対応するため、ガウス差(DoG)フィルターを利用して写真に対して前処理を施す。即ち、標準偏差がそれぞれσ0とσ1である二つのガウシアンカーネル(Gaussian kernels)の差を利用して各写真に対して畳み込んだ後、平均値がゼロ、平方偏差が1になるように、全ての画素値を標準化させる。一つの実施形態において、好ましくは、(σθ,σ1)=(0,4)又は(1,4)を利用する。DoGフィルターは以下のような利点がある。まず、画像のエッジを検出したり強調したりすることができるため、合成されたスケッチはより鮮明なものになる。次は、低周波成分を除去して光照射条件の変化による影響を抑制できる。例えば、陰影などが取り上げられる。標準化された画素値をゼロ平均値単位平方偏差(zero-mean and unit-variance)に分散させることは、よく使われる光照射標準化の方法であるが、スケッチ合成効果の向上には制限がある。
EL()関数の簡単な例は、例えば、従来の技術で使用したxp iとyp iのユークリッド距離(Euclidean distance)であって良い。しかし、光照射の条件に変化がある場合、あまり効果的ではない。スケッチラインの多くは写真におけるエッジ情報に対応するため、ガウス差(DoG)フィルターを利用して写真に対して前処理を施す。即ち、標準偏差がそれぞれσ0とσ1である二つのガウシアンカーネル(Gaussian kernels)の差を利用して各写真に対して畳み込んだ後、平均値がゼロ、平方偏差が1になるように、全ての画素値を標準化させる。一つの実施形態において、好ましくは、(σθ,σ1)=(0,4)又は(1,4)を利用する。DoGフィルターは以下のような利点がある。まず、画像のエッジを検出したり強調したりすることができるため、合成されたスケッチはより鮮明なものになる。次は、低周波成分を除去して光照射条件の変化による影響を抑制できる。例えば、陰影などが取り上げられる。標準化された画素値をゼロ平均値単位平方偏差(zero-mean and unit-variance)に分散させることは、よく使われる光照射標準化の方法であるが、スケッチ合成効果の向上には制限がある。
1.2 写真―スケッチのパッチマッチングd2 L2(xp i,ys i)
各写真パッチ間の形態内距離(intra-modality distance)は必ずしも常にスケッチパッチを選出できるわけではない。ユークリッド距離において似ている写真パッチは、大いに異なったスケッチパッチに対応することがある。面白いことに、人達はいつも写真とスケッチを直接にマッチングさせることができる。本出願は、それを受けて、テスト写真パッチとトレーニングスケッチパッチとの間の形態内距離を利用して選出の正確度を向上することを提案している。視覚的には、写真とスケッチとは大いに異なっているため、直接にマッチングさせることは容易ではない。ところで、これらの勾配方向はある程度似ている。そのため、以下のステップを利用して写真パッチとスケッチパッチとの形態内距離を取得する。
各写真パッチ間の形態内距離(intra-modality distance)は必ずしも常にスケッチパッチを選出できるわけではない。ユークリッド距離において似ている写真パッチは、大いに異なったスケッチパッチに対応することがある。面白いことに、人達はいつも写真とスケッチを直接にマッチングさせることができる。本出願は、それを受けて、テスト写真パッチとトレーニングスケッチパッチとの間の形態内距離を利用して選出の正確度を向上することを提案している。視覚的には、写真とスケッチとは大いに異なっているため、直接にマッチングさせることは容易ではない。ところで、これらの勾配方向はある程度似ている。そのため、以下のステップを利用して写真パッチとスケッチパッチとの形態内距離を取得する。
先ず、各テスト写真パッチの密なSIFT記述子を確定する。これは、方向ヒストグラムの記述子である。詳しくは、「Lowe, D.: Distinctive image features from scale-invariant keypoints. IJCV 60, 91-110(2004)」を参照できる。一つの実施形態において、各パッチの密なSIFT記述子を計算し、確定された密なSIFT記述子のユークリッド距離を取得し、これを写真パッチと対応するスケッチパッチとの形態内距離とする。広い範囲での構造情報を得るために、パッチより大きい領域で記述子を取出す。各パッチに対して、パッチの中心と重なる36×36(パッチサイズは10×10である)の領域内で取出し、この領域は4×4の同一サイズの空間領域(spatial bin)に分割される。8個の方向領域(orientations bin)は0°〜360°に等間隔で分布されている。各画素のヒストグラムに対する寄与度は、その勾配強度と、σ=6で且つパッチ中心が重なるガウシアン窓(Gaussian window)とによって決められる。そのため、上記記述子は128次元である。一つの実施形態において、L2ノルムで標準化させ、閾値0.2でクリックしてから、改めて標準化させる。詳しくは、「Lowe, D.: Distinctive image features from scale-invariant keypoints. IJCV 60, 91-110(2004)」を参照できる。
2. 形状事前分布関数(shape prior function)
顔画像は特殊な画像で、規則的構造を有する。そのため、様々な箇所に対して形状事前分布を行うことによって、合成の効果を有効に向上することができる。構造全体が考慮されない場合は、一部顔構造、特に輪郭の欠損は、パッチに基づくスケッチ合成においてよく見られる問題である。このような問題が発生すると、顔の一部のライン箇所はブランクに合成されてしまう。それは、光照射条件や姿勢に変化があるとき、特に大きな問題になる。それに対して、スケッチパッチを選出するには形状事前分布が用いられると、このような問題を有効に減少できる。先ず、トレーニング集合スケッチ画像とテスト写真において、予めに定義された特徴点を検出する。一つの実施形態において、顔整列アルゴリズム(face alignment algorithm)によって特徴が確定できる。例えば、「Liang, L., Xiao, R.,Wen, F., Sun, J.: Face alignment via component-based discriminative search. In: Forsyth, D., Torr, P., Zisserman, A. (eds.) ECCV 2008, Part II. LNCS, vol. 5303, pp. 72-85. Springer, Heidelberg(2008)」に提案されたアルゴリズムが取り上げられる。選出された特徴は、構造欠損の発生しやすい領域、特に輪郭部にある。これらの領域に形状事前分布を用いるが、その他領域には用いない。もし一つの特徴点fがテスト写真のパッチiに位置すると、カーネル密度推定を利用して事前検証分布を計算する。
顔画像は特殊な画像で、規則的構造を有する。そのため、様々な箇所に対して形状事前分布を行うことによって、合成の効果を有効に向上することができる。構造全体が考慮されない場合は、一部顔構造、特に輪郭の欠損は、パッチに基づくスケッチ合成においてよく見られる問題である。このような問題が発生すると、顔の一部のライン箇所はブランクに合成されてしまう。それは、光照射条件や姿勢に変化があるとき、特に大きな問題になる。それに対して、スケッチパッチを選出するには形状事前分布が用いられると、このような問題を有効に減少できる。先ず、トレーニング集合スケッチ画像とテスト写真において、予めに定義された特徴点を検出する。一つの実施形態において、顔整列アルゴリズム(face alignment algorithm)によって特徴が確定できる。例えば、「Liang, L., Xiao, R.,Wen, F., Sun, J.: Face alignment via component-based discriminative search. In: Forsyth, D., Torr, P., Zisserman, A. (eds.) ECCV 2008, Part II. LNCS, vol. 5303, pp. 72-85. Springer, Heidelberg(2008)」に提案されたアルゴリズムが取り上げられる。選出された特徴は、構造欠損の発生しやすい領域、特に輪郭部にある。これらの領域に形状事前分布を用いるが、その他領域には用いない。もし一つの特徴点fがテスト写真のパッチiに位置すると、カーネル密度推定を利用して事前検証分布を計算する。
上記統計量は、例えば平均勾配強度、画素値の平方偏差、エッジ画素の割合である。好ましくは、平均勾配強度を統計量β(・)とする。これは、肖像合成における構造損失の問題を解決できる。
3. 隣接一貫性関数
隣接一貫性関数は、推定されるスケッチパッチを平滑させる役割を果たすため、合成された画像の誤りを抑えることができる。本発明の実施形態に係る隣接一貫性関数は、例えば、
隣接一貫性関数は、推定されるスケッチパッチを平滑させる役割を果たすため、合成された画像の誤りを抑えることができる。本発明の実施形態に係る隣接一貫性関数は、例えば、
以上で、本発明に係る、写真から肖像スケッチを合成するための方法について説明した。以下、本発明に係る、写真から肖像スケッチを合成するためのシステム2000について説明する。図3を参照すると、システム2000は、分割モジュール201と、写真−写真マッチングモジュール202と、写真−画素マッチングモジュール203と、形状事前分布確定モジュール204と、最適化モジュール205と、合成モジュール206と、を備える。
分割モジュール201は、テスト写真を複数のテスト写真パッチに分割するためのものである。前述したとおりに、テスト写真を等間隔で重なるN個のパッチに分割できる。また、分割する前に、両眼の中心を固定位置に位置させるように、全ての写真と、以下で説明するすべてのスケッチ画像にと対して平行移動、回転及び縮小によって前処理を行う。
写真−写真マッチングモジュール202は、各テスト写真パッチと、複数のトレーニング集合写真において予め分割された写真パッチとの間の第一マッチング情報を確定するためのものである。第一マッチング情報は、各テスト写真パッチと、対応するトレーニング集合写真パッチとの平方形態内距離(squared inter-modality distance)を含む。写真−画素マッチングモジュール203は、各テスト写真パッチと、複数のトレーニング集合スケッチ画像において予め分割されたパッチとの間の第二マッチング情報を確定するためのものである。第二マッチング情報は、各テスト写真パッチと、対応するトレーニング集合スケッチ画像との平方偏差距離を含む。各テスト写真パッチの密なSIFT記述子を確定し、確定された密なSIFT記述子のユークリッド距離を取得し、テスト写真パッチと、対応するスケッチパッチとの距離とすることができる。
形状事前分布確定モジュール204は、各テスト写真パッチの形状事前分布を確定するためのものである。一つの実施形態において、形状事前分布確定模204は、トレーニング集合スケッチ画像とテスト写真において予め定義された特徴点によって、上記式(3)で前記形状事前分布を確定するように配置される。
最適化モジュール205は、上記第一マッチング情報、第二マッチング情報及び形状事前分布に基づいて、各テスト写真パッチに対して、最もマッチングするトレーニング集合スケッチ画像を確定するように配置される。具体的には、最適化モジュール205は、第一マッチング情報、第二マッチング情報及び形状事前分布に基づいてマルコフ確率場モデルを立て、立てられたマルコフ確率場モデルを最適化させることによって、各テスト写真パッチに対して、最もマッチングするトレーニング集合スケッチ画像を確定するように、配置される。立てられたマルコフ確率場モデルは、例えば、上記式(1’)によって示される。
合成モジュール206は、最適化モジュール205により確定したトレーニング集合スケッチパッチを肖像スケッチ画像に合成するためのものである。
また、本発明のもう一つの実施形態のシステム2000は、更に、隣接する二つのトレーニング集合パッチの階調一貫性情報と、隣接する二つのトレーニング集合スケッチパッチの勾配一貫性情報とを確定するための平滑モジュール207を含むことができる。ここで、階調一貫性情報は、隣接する二つのトレーニング集合パッチの重なる領域における差の平方であり、勾配一貫性情報は、隣接する二つのトレーニング集合スケッチパッチの密なSIFT記述子のユークリッド距離の平方である。平方形態内距離は、以下のステップによって確定される。つまり、各テスト写真パッチの密なSIFT記述子を確定し、確定された密なSIFT記述子のユークリッド距離を取得し、前記テスト写真パッチと、対応するスケッチパッチとの形態内距離とする。この場合に、最適化モジュール205は、第一及び第二マッチング情報、形状事前分布、階調一貫性情報及び勾配一貫性情報に基づいてMRFモデルを立て、立てられたMRFモデルを最適化させることによって、各テスト写真パッチに対して、最もマッチングするトレーニング集合スケッチ画像を確定することができる。
以上なされた具体的な実施形態または実施例は、あくまでも、本発明の技術内容を明らかにするものであって、そのような具体例にのみ限定して狭義に解釈されるべきものではなく、本発明の精神と特許請求事項の範囲内で、いろいろと変更して実施することができるものである。
Claims (29)
- 写真から肖像スケッチを合成する方法であって、
テスト写真を複数のテスト写真パッチに分割するステップと、
各テスト写真パッチと、複数のトレーニング集合写真において予め分割された写真パッチとの第一マッチング情報を確定するステップと、
各テスト写真パッチと、複数のトレーニング集合スケッチ画像において予め分割されたパッチとの第二マッチング情報を確定するステップと、
合成されるスケッチ画像の形状事前分布を確定するステップと、
前記第一マッチング情報、前記第二マッチング情報及び前記形状事前分布に基づいて、前記各テスト写真パッチに対して、最もマッチングするトレーニング集合スケッチパッチを確定するステップと、
確定されたトレーニング集合スケッチパッチを肖像スケッチ画像に合成するステップと、
を備えることを特徴とする方法。 - 前記第一マッチング情報は、各テスト写真パッチと、対応するトレーニング集合写真パッチとの間の平方偏差距離を含み、
前記第二マッチング情報は、各テスト写真パッチと、対応するトレーニング集合スケッチパッチとの間の平方偏差距離を含む、
ことを特徴とする請求項1に記載の方法。 - 各テスト写真パッチに対して、最もマッチングするトレーニング集合スケッチ画像を確定するステップは、更に、
前記第一マッチング情報、第二マッチング情報及び前記形状事前分布に基づいて、マルコフ確率場モデルを立てるステップと、
立てられたマルコフ確率場モデルを最適化させ、各テスト写真パッチに対して、最もマッチングするトレーニング集合スケッチ画像を確定するステップと、
を備えることを特徴とする請求項1に記載の方法。 - 写真から肖像スケッチを合成する方法であって、
テスト写真を等間隔で重なる複数のテスト写真パッチに分割するステップと、
各テスト写真パッチと、複数のトレーニング集合写真において予め分割された写真パッチとの第一マッチング情報を確定するステップと、
各テスト写真パッチと、複数のトレーニング集合スケッチ画像において予め分割されたスケッチパッチとの第二マッチング情報を確定するステップと、
合成されるスケッチ画像の形状事前分布を確定するステップと、
隣接する二つのトレーニング集合スケッチパッチの間の階調一貫性情報と、隣接する二つのトレーニング集合スケッチパッチの間の勾配一貫性情報とを確定するステップと、
前記第一マッチング情報、第二マッチング情報、前記形状事前分布、前記階調一貫性情報及び前記勾配一貫性情報に基づいて、前記各テストパッチに対して、最もマッチングするトレーニングスケッチ画像を確定するステップと、
確定されたトレーニングスケッチパッチを肖像スケッチ画像に合成するステップと、
を備えることを特徴とする方法。 - 前記第一マッチング情報は、各テスト写真パッチと、対応するトレーニング集合写真パッチとの間の平方偏差距離を含み、
前記第二マッチング情報は、各テスト写真パッチと、対応するトレーニング集合スケッチ画像との間の平方偏差距離を含む、
ことを特徴とする請求項4に記載の方法。 - 前記階調一貫性情報は、隣接する二つのトレーニング集合スケッチパッチの重なる領域における差の平方であり、
前記勾配一貫性情報は、隣接する二つのトレーニング集合スケッチパッチの密なSIFT記述子のユークリッド距離の平方である、
ことを特徴とする請求項4に記載の方法。 - 前記各テスト写真パッチに対して、最もマッチングするトレーニングス集合ケッチ画像を確定するステップは、更に、
前記第一マッチング情報、第二マッチング情報、形状事前分布、階調一貫性情報及び勾配一貫性情報に基づいて、マルコフ確率場モデルを立てるステップと、
立てられたマルコフ確率場モデルを最適化させ、各テスト写真パッチに対して、最もマッチングするトレーニング集合スケッチ画像を確定するステップと、
を備えることを特徴とする請求項4に記載の方法。 - 写真から肖像スケッチを合成する方法であって、
テスト写真を複数のテスト写真パッチに分割するステップと、
複数のトレーニング集合写真と複数のトレーニング集合スケッチ画像で、前記各テスト写真パッチに対してマルコフ確率場モデルを立てるステップと、
前記マルコフ確率場モデルを最適化させ、前記各テストパッチに対して、前記複数のトレーニング集合スケッチ画像から最もマッチングするトレーニングスケッチパッチを選出するステップと、
選出されたトレーニングスケッチパッチを肖像スケッチ画像に合成するステップとを備え、
前記マルコフ確率場モデルは、前記各テストスケッチ画像の形状事前分布と、前記各テスト写真パッチと前記トレーニング集合写真の写真パッチとの間の第一マッチング情報と、前記各テストパッチと前記トレーニング集合スケッチ画像のパッチとの間の第二マッチング情報と、を含むことを特徴とする方法。 - 分割された複数のテスト写真パッチは重なる領域が存在し
前記マルコフ確率場モデルは、更に、隣接する二つのトレーニング集合スケッチパッチの間の階調一貫性情報と、隣接する二つのトレーニング集合スケッチパッチの間の勾配一貫性情報とを備える、
ことを特徴とする請求項8に記載の方法。 - 前記階調一貫性情報は、隣接する二つのトレーニング集合スケッチパッチの重なる領域における差の平方であり、
前記勾配一貫性情報は、隣接する二つのトレーニング集合スケッチパッチの密なSIFT記述子のユークリッド距離の平方である、
ことを特徴とする請求項9に記載の方法。 - 前記第一マッチング情報は、各テスト写真パッチと、対応するトレーニング集合写真パッチとの間の平方偏差距離を含み、
前記第二マッチング情報は、各テスト写真パッチと、対応するトレーニング集合スケッチ画像との間の平方偏差距離を含む、
ことを特徴とする請求項1、4又は8に記載の方法。 - 各テスト写真パッチの密なSIFT記述子を確定し、確定された密なSIFT記述子のユークリッド距離を取得して前記テスト写真パッチと対応するスケッチパッチの距離とすることにより、前記平方偏差距離を確定することを特徴とする請求項11に記載の方法。
- マルコフ確率場モデルを立てる前に、二つのガウス差フィルターで、前記写真に対してそれぞれフィルター処理を行うステップを更に備えることを特徴とする請求項8に記載の方法。
- 前記二つのガウス差フィルターはそれぞれ二つの標準偏差パラメーターσθとσ1を有し、ここで、(σθ,σ1)=(0,4)又は(1,4)であることを特徴とする請求項13に記載の方法。
- 前記形状事前分布は、トレーニング集合スケッチ画像とテスト写真において、予め定義された特徴点を検出するステップと、テスト写真のパッチiに特徴点fを備える場合、以下のカーネル密度推定規則で前記形状事前分布を確定するステップとで確定され、
- 前記統計量は、平均勾配強度と、画素値の平方偏差と、エッジ画素の割合との中のいずれか一つであることを特徴とする請求項15に記載の方法。
- 前記特徴点は、前記トレーニング集合スケッチ画像と前記テスト写真との輪郭部に位置することを特徴とする請求項15に記載の方法。
- 前記複数のトレーニング集合写真と前記複数のトレーニング集合スケッチ画像は、それぞれ、幾何学的に整列する写真−スケッチ対を形成することを特徴とする請求項1、4又は8に記載の方法。
- 写真から肖像スケッチを合成する方法であって、
テスト写真を複数のテスト写真パッチに分割するステップと、
複数のトレーニング集合写真と複数のトレーニング集合スケッチ画像で、各テスト写真パッチに対してマルコフ確率場モデルを立てるステップと、
確率伝搬アルゴリズムを使用して前記マルコフ確率場モデルを最適化させ、前記各テスト写真パッチに対して、前記複数のトレーニングスケッチ画像において最もマッチングするトレーニングスケッチパッチを選出するステップと、
選出されたトレーニングスケッチパッチを肖像スケッチ画像に合成するステップと、を備え、
前記マルコフ確率場は、
- 前記統計量は、平均勾配強度と、画素値の平方偏差と、エッジ画素の割合との中のいずれか一つであることを特徴とする請求項19に記載の方法。
- 前記特徴点は、前記トレーニング集合スケッチ画像と前記テスト写真の輪郭部に位置することを特徴とする請求項19に記載の方法。
- 写真から肖像スケッチを合成するためのシステムであって、
テスト写真を複数のテスト写真パッチに分割する分割モジュールと、
各テスト写真パッチと、複数のトレーニング集合写真において予め分割された写真パッチとの間の第一マッチング情報を確定する写真−写真マッチングモジュールと、
各テスト写真パッチと、複数のトレーニング集合スケッチ画像において予め分割されたパッチとの間の第二マッチング情報を確定する写真−画素マッチングモジュールと、
各テストパッチの形状事前分布を確定する形状事前分布確定モジュールと、
前記第一マッチング情報、前記第二マッチング情報及び前記形状事前分布に基づいて、各テスト写真パッチに対して、最もマッチングするトレーニング集合スケッチ画像を確定する最適化モジュールと、
確定されたトレーニング集合スケッチパッチを肖像スケッチ画像に合成する合成モジュールと、
を備えることを特徴とするシステム。 - 前記第一マッチング情報は、各テスト写真パッチと、対応するトレーニング集合写真パッチとの間の平方偏差距離を含み、
前記第二マッチング情報は、各テスト写真パッチと、対応するトレーニング集合スケッチパッチとの間の平方偏差距離を含む、
ことを特徴とする請求項22に記載のシステム。 - 前記最適化モジュールは、
前記第一マッチング情報、前記第二マッチング情報及び前記形状事前分布に基づいてマルコフ確率場モデルを立て、立てられたマルコフ確率場モデルを最適化させ、各テスト写真パッチに対して、最もマッチングするトレーニング集合スケッチ画像を確定するように、構成されることを特徴とする請求項22に記載のシステム。 - 更に、
隣接する二つのトレーニング集合パッチの間の階調一貫性情報と、隣接する二つのトレーニング集合スケッチパッチの間の勾配一貫性情報とを確定するための平滑モジュールを備えることを特徴とする請求項22に記載のシステム。 - 前記最適化モジュールは、
前記第一マッチング情報、前記第二マッチング情報、前記形状事前分布、前記階調一貫性情報及び前記勾配一貫性情報に基づいてマルコフ確率場モデルを立て、立てられたマルコフ確率場モデルを最適化させ、各テスト写真パッチに対して、最もマッチングするトレーニング集合スケッチ画像を確定するように、構成されることを特徴とする請求項25に記載のシステム。 - 前記形状事前分布確定モジュールは、トレーニング集合スケッチ画像とテスト写真において予め定義された特徴点に基づいて、以下のカーネル密度推定規則を利用して前記形状事前分布を確定するように構成され、
- 前記統計量は、平均勾配強度と、画素値の平方偏差と、エッジ画素の割合との中のいずれか一つであることを特徴とする請求項27に記載のシステム。
- 前記特徴点は、前記トレーニング集合スケッチ画像と前記テスト写真の輪郭部に位置することを特徴とする請求項27に記載のシステム。
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
PCT/CN2010/076605 WO2012027904A1 (zh) | 2010-09-03 | 2010-09-03 | 从照片合成肖像素描的系统和方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2013536960A true JP2013536960A (ja) | 2013-09-26 |
Family
ID=45772092
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2013526296A Withdrawn JP2013536960A (ja) | 2010-09-03 | 2010-09-03 | 写真から肖像スケッチを合成するシステム及び方法 |
Country Status (5)
Country | Link |
---|---|
US (1) | US9569699B2 (ja) |
EP (1) | EP2613294A1 (ja) |
JP (1) | JP2013536960A (ja) |
CN (1) | CN103080979B (ja) |
WO (1) | WO2012027904A1 (ja) |
Families Citing this family (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103246895B (zh) * | 2013-05-15 | 2016-03-09 | 中国科学院自动化研究所 | 基于深度信息的图像分类方法 |
CN103984954B (zh) * | 2014-04-23 | 2017-06-13 | 西安电子科技大学宁波信息技术研究院 | 基于多特征融合的图像合成方法 |
CN105096249B (zh) * | 2014-05-23 | 2018-06-26 | 北京大学 | 图像处理方法和装置 |
CN106919885A (zh) * | 2015-12-24 | 2017-07-04 | 掌赢信息科技(上海)有限公司 | 一种基于机器学习的人脸风格化方法及电子设备 |
CN105701782A (zh) * | 2016-01-13 | 2016-06-22 | 无锡北邮感知技术产业研究院有限公司 | 纹理效果显著的人脸简约图生成方法 |
CN106355593A (zh) * | 2016-08-31 | 2017-01-25 | 上海交通大学 | 一种基于马尔科夫随机场的素描画生成方法 |
WO2018176281A1 (zh) * | 2017-03-29 | 2018-10-04 | 华为技术有限公司 | 一种素描图像的生成方法及装置 |
CN107330408B (zh) * | 2017-06-30 | 2021-04-20 | 北京乐蜜科技有限责任公司 | 视频处理方法、装置、电子设备及存储介质 |
CN107945244A (zh) * | 2017-12-29 | 2018-04-20 | 哈尔滨拓思科技有限公司 | 一种基于人脸照片的简笔画生成方法 |
US11871052B1 (en) * | 2018-09-27 | 2024-01-09 | Apple Inc. | Multi-band rate control |
CN117557688B (zh) * | 2024-01-10 | 2024-03-12 | 广州趣丸网络科技有限公司 | 肖像生成模型训练方法、装置、计算机设备和存储介质 |
Family Cites Families (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20040228504A1 (en) * | 2003-05-13 | 2004-11-18 | Viswis, Inc. | Method and apparatus for processing image |
JP4164809B2 (ja) * | 2003-12-19 | 2008-10-15 | 富士フイルム株式会社 | 画像合成処理方法及び装置並びにプログラム |
US7653220B2 (en) * | 2004-04-15 | 2010-01-26 | Panasonic Corporation | Face image creation device and method |
US7660482B2 (en) * | 2004-06-23 | 2010-02-09 | Seiko Epson Corporation | Method and apparatus for converting a photo to a caricature image |
JP2007206651A (ja) | 2006-02-06 | 2007-08-16 | Toshiba Corp | 画像表示装置及びその方法 |
CN101017567A (zh) * | 2007-03-09 | 2007-08-15 | 李昕 | 用于将数字照片转换成人像素描画的方法和设备 |
CN101169830A (zh) * | 2007-11-30 | 2008-04-30 | 西安电子科技大学 | 基于嵌入式隐马尔可夫模型和选择性集成的人脸画像自动生成方法 |
CN101482925B (zh) * | 2009-01-16 | 2012-01-04 | 西安电子科技大学 | 基于局部嵌入式隐马尔可夫模型的照片生成方法 |
CN101551911B (zh) * | 2009-05-07 | 2011-04-06 | 上海交通大学 | 人脸素描肖像画自动生成方法 |
-
2010
- 2010-09-03 US US13/820,729 patent/US9569699B2/en active Active
- 2010-09-03 CN CN201080068894.8A patent/CN103080979B/zh active Active
- 2010-09-03 JP JP2013526296A patent/JP2013536960A/ja not_active Withdrawn
- 2010-09-03 EP EP10856591.2A patent/EP2613294A1/en not_active Withdrawn
- 2010-09-03 WO PCT/CN2010/076605 patent/WO2012027904A1/zh active Application Filing
Also Published As
Publication number | Publication date |
---|---|
CN103080979B (zh) | 2015-12-09 |
CN103080979A (zh) | 2013-05-01 |
US20130308853A1 (en) | 2013-11-21 |
WO2012027904A1 (zh) | 2012-03-08 |
US9569699B2 (en) | 2017-02-14 |
EP2613294A1 (en) | 2013-07-10 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2013536960A (ja) | 写真から肖像スケッチを合成するシステム及び方法 | |
CN110088805B (zh) | 用于检测和分割多个前景对象的方法 | |
CN108681692B (zh) | 一种基于深度学习的遥感图像内新增建筑识别方法 | |
CN110889852B (zh) | 基于残差-注意力深度神经网络的肝脏分割方法 | |
CN108491786B (zh) | 一种基于分级网络和聚类合并的人脸检测方法 | |
CN104899845A (zh) | 一种基于lαβ空间场景迁移的多曝光图像融合方法 | |
JP6100300B2 (ja) | 階層グラフに基づく画像マッティングおよび前景推定の方法およびシステム | |
CN109635814B (zh) | 基于深度神经网络的森林火灾自动检测方法和装置 | |
CN116681636B (zh) | 基于卷积神经网络的轻量化红外与可见光图像融合方法 | |
WO2016062259A1 (zh) | 基于透明度的抠图方法和装置 | |
CN107622239A (zh) | 一种层次化局部结构约束的遥感图像指定建筑区检测方法 | |
CN111783834B (zh) | 一种基于联合图频谱特征分析的异源图像匹配方法 | |
CN111932645B (zh) | 基于生成对抗网络gan自动生成水墨画的方法 | |
CN113538569A (zh) | 一种弱纹理物体位姿估计方法和系统 | |
CN116664892A (zh) | 基于交叉注意与可形变卷积的多时相遥感图像配准方法 | |
JP2003162718A (ja) | 画像処理方法及びプログラム | |
CN114943823B (zh) | 基于深度学习语义感知的无人机图像拼接方法及系统 | |
CN111461139B (zh) | 一种复杂场景下的多目标视觉显著性分层检测方法 | |
JP2014230283A (ja) | ピクチャーを処理する方法および装置 | |
JP5786838B2 (ja) | 画像領域分割装置、方法、およびプログラム | |
CN109615600B (zh) | 一种自适应层次直方图的彩色图像分割方法 | |
CN113723500B (zh) | 基于特征相似性和线性平滑组合的图像数据扩充方法 | |
CN110807776A (zh) | 一种基于全局区域对比度的农作物半翅目害虫图像自动分割算法 | |
CN113076909B (zh) | 一种细胞自动检测方法 | |
KR102488858B1 (ko) | 손상된 유형물의 디지털 복원 방법, 장치 및 프로그램 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A300 | Application deemed to be withdrawn because no request for examination was validly filed |
Free format text: JAPANESE INTERMEDIATE CODE: A300 Effective date: 20131105 |