JP2018129036A - 画像の補完 - Google Patents

画像の補完 Download PDF

Info

Publication number
JP2018129036A
JP2018129036A JP2017237566A JP2017237566A JP2018129036A JP 2018129036 A JP2018129036 A JP 2018129036A JP 2017237566 A JP2017237566 A JP 2017237566A JP 2017237566 A JP2017237566 A JP 2017237566A JP 2018129036 A JP2018129036 A JP 2018129036A
Authority
JP
Japan
Prior art keywords
image
minimization
dictionary
atom
atoms
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2017237566A
Other languages
English (en)
Other versions
JP7029283B2 (ja
Inventor
ミシェル ファブリス・フランシス
Francis Michel Fabrice
ミシェル ファブリス・フランシス
イスマエル ベルギッテ
Belghiti Ismael
イスマエル ベルギッテ
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Dassault Systemes SE
Original Assignee
Dassault Systemes SE
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Dassault Systemes SE filed Critical Dassault Systemes SE
Publication of JP2018129036A publication Critical patent/JP2018129036A/ja
Application granted granted Critical
Publication of JP7029283B2 publication Critical patent/JP7029283B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T5/00Image enhancement or restoration
    • G06T5/77Retouching; Inpainting; Scratch removal
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • G06F18/232Non-hierarchical techniques
    • G06F18/2321Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
    • G06F18/23213Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T5/00Image enhancement or restoration
    • G06T5/20Image enhancement or restoration using local operators
    • G06T5/30Erosion or dilatation, e.g. thinning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T5/00Image enhancement or restoration
    • G06T5/50Image enhancement or restoration using two or more images, e.g. averaging or subtraction
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/10Image acquisition modality
    • G06T2207/10016Video; Image sequence
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20016Hierarchical, coarse-to-fine, multiscale or multiresolution image processing; Pyramid transform
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20072Graph-based image processing

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Probability & Statistics with Applications (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • General Engineering & Computer Science (AREA)
  • Image Processing (AREA)
  • Image Analysis (AREA)

Abstract

【課題】少なくとも1つの穴を有する画像を補完するための、改善された方法、システム、及びプログラムを提供する。【解決手段】画像における既知の部分を表すアトムの辞書を提供するS10と、ノードおよびラベルを有するマルコフ確率場上に定義されたエネルギーの少なくとも1回の最小化を含む処理を用いてアトムの線形結合の最適な分布を決定するS20と、最適な分布で穴を埋めるS30とを含む。各ノードは穴の各位置に対応し各ラベルに関連付けられる。【選択図】図1

Description

本発明は、コンピュータプログラムおよび及びシステムの分野に関し、より具体的には、少なくとも1つの穴を有する画像を補完するための方法、システム、及びプログラムに関する。
オブジェクトの設計、エンジニアリング、製造のため、多数のシステムおよびプログラムが市場に提供されている。CADは、コンピュータ支援設計(Computer−Aided Design)の略語であり、例えば、オブジェクトを設計するためのソフトウェア・ソリューションに関する。CAEは、コンピュータ支援エンジニアリング(Computer−Aided Engineering)の略語であり、例えば、将来の製品の物理的挙動をシミュレーションするためのソフトウェア・ソリューションに関する。CAMは、コンピュータ支援製造(Computer−Aided Manufacturing)の略語であり、例えば、製造工程および動作を定義するためのソフトウェア・ソリューションに関する。このようなコンピュータ支援設計システムにおいて、グラフィカル・ユーザ・インターフェースは、技術の効率に関して、重要な役割を果たす。これらの技術は、製品ライフサイクル管理(Product Lifecycle Management: PLM)システムに組み込むことができる。PLMとは、企業が、拡張エンタープライズの概念全体にわたって、製品データを共有し、共通の工程を適用し、構想に始まり製品寿命の終わりに至る製品開発のための企業知識を活用するのを支援するビジネス戦略を指す。ダッソー・システムズが提供するPLMソリューション(製品名CATIA、ENOVIA、DELMIA)は、製品エンジニアリング知識を体系化するエンジニアリング・ハブ、製品エンジニアリング知識を管理する製造ハブ、およびエンジニアリング・ハブと製造ハブの両方に対するエンタープライズ統合と接続を可能にするエンタープライズ・ハブを提供する。全てのシステムは、製品、工程、リソースを結ぶオープンなオブジェクトモデルを提供し、最適化された製品定義、製造準備、生産およびサービスを推進する、動的な知識ベースの製品作成および意思決定支援を可能にする。
こうした文脈および他の文脈において、画像補完について多くの研究が行われている。画像補完とは、少なくとも1つの穴を有する画像を補完するためのアルゴリズムを指す。画像補完は画像修復を含み、これは、上記の少なくとも1つの穴が比較的小さい箇所における画像補完を指す。比較的大きな穴の画像補完は、画像修復よりも解決が難しい課題である可能性がある。実際、画像修復は補間に似ており、周囲の画素の値のみを外挿することができる。
画像補完は、異なる文脈において有用であり、これには、画像の一部が除去され、例えば、ユーザが除去された部分を埋める必要があるような、すべての画像修整アプリケーションが含まれる。これには、画像内のオブジェクトを移動させたり、または画像内のオブジェクトを別のものに置き換えたりするようなアプリケーションが含まれる。より一般的には、画像補完は、欠けているデータを埋める必要があり、データが連続した2D配列(マトリックス形式)、より一般的には連続したN次元配列として構成されるような、任意の状況において有用であり得る。
画像補完については、3つの既知のカテゴリを特定することができる。
A.PDEベースの方法
B.統計ベースの方法
C.標本ベースの方法
A.PDEベースの方法
PDEベースの方法は、ひび割れ、折り目、アーチファクト、あるいは反射のために穴が形成されることの多い画像を修復するのに初めて導入された。これらの方法では、残された空隙を、空隙の端部から情報を伝搬させることによって充填することを考える。この情報は、画素レベルで解かれる偏微分方程式を用いて伝搬させる。このような方程式には、熱方程式のような伝搬方程式が含まれる。これらの方法では、ディリクレ境界条件を設定したラプラスのPDEを使用するか、異方性拡散処理をシミュレートすることが多い。純粋な拡散法では、ぼけた結果となるが、エッジを保存するように設計されたアルゴリズムもある。
PDEベースの方法の例は、以下の論文に見つけることができる。
・Bertalmio,Marcelo,Andrea L.Bertozzi, and Guillermo Sapiro.Navier−stokes,fluid dynamics,and image and video inpainting.CVPR.2001
・Chan,Tony F.,and Jianhong Shen.Nontexture inpainting by curvature−driven diffusions.Journal of Visual Communication and Image Representation.2001
・Auroux,Didier,and Mohamed Masmoudi.A one−shot inpainting algorithm based on the topological asymptotic analysis.Computational & Applied Mathematics.2006
・Pietro Perona and Jitendra Malik.Scale−space and edge detection using anisotropic diffusion.IEEE Trans.1990
・Ivars Peterson.Filling in blanks:Automating the restoration of a picture’s missing pieces.Science News.2002
B.統計ベースの方法
統計ベースの方法は、主に、テクスチャ(すなわち、画像における反復パターン)を合成する場合に用いられる。自然画像の多くは、テクスチャのパッチワークから形成される(例えば、草地にいる人物の写真の場合、草地はテクスチャとして見ることができる)。テクスチャは一見ランダムであり、テクスチャの合成は、目に快い程度のランダムさを達成することを目指す。これらの方法は、2つのステップからなる。
1)学習ステップ:テクスチャが入力されると、本方法では、関連する統計値をコンパクトなパラメトリック統計モデルを用いて抽出することによってそれを記述することを試みる。このコンパクトな統計モデルはウェーブレット係数に基づくことが多く、マルチスケール手法を組み合わせることができる。
2)拡散ステップ:テクスチャは内側に向かって成長し、未知の領域を補完する。統計ベースの方法では、一般に、画像内の構造を見つけることができる画像補完の問題については、画像の構造がランダムではないため失敗する。
統計ベースの方法の例は、以下の論文に見つけることができる。
・Portilla,Javier,and Eero P.Simoncelli.A parametric texture model based on joint statistics of complex wavelet coefficients.IJCV.2000
・Heeger,David J.,and James R.Bergen.Pyramid−based texture analysis/synthesis.SIGGRAPH.1995
・Li−Yi Wei and Marc Levoy.Fast texture synthesis using tree−structured vector quantization.SIGGRAPH,pages 479−488.2000

C.標本ベースの方法
標本ベースの方法では、既存の画像パッチを用いて残された空隙を埋める。大まかに言えば、これは、画像の区画をコピーして空隙内に貼り付けることからなる。これらのパッチでどのように穴を埋めるかは、選択する方法によって異なる。標本ベースの方法の多くは、次の3つの分類のうちの1つに関連付けることができる。
1)内方拡散法:この最も初期の方法は、空隙を反復的に補完する。論文「Criminisi,Perez,and Toyama.Region filling and object removal by exemplar−based image inpainting.IEEE Transactions on Image Processing. 2004」では、空隙は、外縁から内側に向かって小さなパッチで埋められ、いったん最初の外側の輪が埋められると、空隙が小さかったかのように、アルゴリズムが再開され、空隙が埋まり切るまで繰り返す。別の例を、論文「Xiaowu Chen,Bin Zhou,Fang Xu,and Qinping Zhao.Automatic image completion with structure propagation and texture synthesis.2010」に見つけることができる。残念ながら、これらのアルゴリズムでは、中心部の補完が不可能になるような縁を選択したがために止まってしまうということが多い。
2)マッチングベースの方法:これらの方法は、テクスチャモデルに関連することが多く、パッチ再注入を用いる。これらの方法では、未知の領域のパッチを既知のパッチ(抽出された集合のうち最も近いパッチとされることが多い)で置き換えることによって、現在の充填物の改善を繰り返し試みる。論文「Drori,Iddo,Daniel Cohen−Or,and Hezy Yeshurun.Fragment−based image completion.ACM Transactions on Graphics.2003」では、空隙を1つの画像パッチだけで埋めることができる小さな穴とみなせるような小規模なところから始めて、前の画像からフル解像度まで規模を大きくしていき、前の解像度で作られた充填物にマッチするようなパッチを見つけることによって、空隙を埋める。同様の手法を、論文「Alexei A.Efros and Thomas K.Leung.Texture synthesis by non−parametric sampling.ICCV,pages 1033−1038.1999」および論文「Yonatan Wexler,Eli Shechtman,and Michal Irani.Space−time video completion.CVPR(1),pages 120−127.2004」に見つけることができる。これらの方法にも、重大な欠陥がある。すなわち、繰り返し中に、もし1つのステップが失敗すると、結果が完全にオフになってしまう。よって、画像の幻像部分が空隙中にコピーされ、現実的ではない画像が得られることになる。
3)統計的オフセット解析法:これらの方法では、統計モデルを通じて画像中の主な変位を学習し、この知識を用いて欠損部分を埋める。この種の方法の例は、論文「Kaiming He and Jian Sun.Computing nearest−neighbor fields via propagation−assisted kd−trees.IEEE Conference on Computer Vision and Pattern Recognition.2012」および論文「Kaiming He and Jian Sun.Statistics of patch offsets for image completion.Computer Vision−ECCV.2012」に見つけることができる。これらの方法は、画像が構造的な規則性を含む場合には正常に機能するが(例えば建築物の画像など)、一般的な画像では大きく失敗することが多い。
標本ベースの手法の有名な例は、論文「Connelly Barnes,Eli Shechtman,Adam Finkelstein,and Dan B.Goldman. Patch−match:a randomized correspondence algorithm for structural image editing.ACM Trans.Graph.,28(3),2009」に開示されているPatch−Matchと呼ばれるアルゴリズムである。このアルゴリズムは、Adobe PhotoshopTM Content Fill Awareで用いられたことにより、広く普及している。実際には、このヒューリスティックは実装が簡単であるものの、堅牢ではない。
このような文脈において、少なくとも1つの穴を有する画像を補完するための改善された方法が依然として必要とされている。
したがって、少なくとも1つの穴を有する画像を補完するための、コンピュータにより実施される方法が提供される。本方法は、画像における既知の部分を表すアトムの辞書を提供することを含む。本方法はまた、ノードおよびラベルを有するマルコフ確率場上に定義されたエネルギーの少なくとも1回の最小化を含む処理を用いてアトムの線形結合の最適な分布を決定することであって、各ノードは穴の各位置に対応し各ラベルに関連付けられるような、決定することを含む。本方法はまた、最適な分布で穴を埋めることを含む。
本方法は、以下の1つまたは複数を含んでいてもよい。
・各ラベルは、好ましくは500個未満、200個未満、150個未満、あるいは100個未満の値を含む値の有限集合のうちの値をとる;
・前記処理は、前記少なくとも1回の最小化の結果を用いて初期化され、かつ、前記画像の既知の部分から抽出したパッチに基づく、マッチングベースのアルゴリズムを含む;
・前記決定では、トップダウン手法を実施する。
・エネルギーの前記少なくとも1回の最小化は、第1の最小化であって、当該第1の最小化についての前記マルコフ確率場の各ラベルがアトムの辞書における値をとるような、第1の最小化と、次いで、第2の最小化であって、当該第2の最小化についての前記マルコフ確率場の各ラベルが所定の係数の集合における値をとるような、第2の最小化とを含む;
・前記所定の係数の集合は、前記画像の既知の部分のパッチを生成するための前記アトムに適用される係数の集合のK平均クラスタリングに由来する;
・前記第1の最小化についてのエネルギーは、測光歪みおよび/または統計的歪みにペナルティを課し、かつ/あるいは、前記第2の最小化についてのエネルギーは、測光歪みおよび/または統計的歪みにペナルティを課す;
・前記第1の最小化は、前記穴の縁に合致しない程度についてさらにペナルティを課す;
・本方法はさらに、次いで、第3の最小化であって、当該第3の最小化についての前記マルコフ確率場の各ラベルが前記アトムの辞書における値をとるような、第3の最小化と、次いで、第4の最小化であって、当該第4の最小化についての前記マルコフ確率場の各ラベルが前記所定の係数の集合における値をとるような、第4の最小化とを含む;
・前記第3の最小化についてのエネルギーは、統計的歪みにペナルティを課し、かつ/あるいは、前記第4の最小化についてのエネルギーは、統計的歪みにペナルティを課す;
・前記画像はビデオのフレームである;かつ/あるいは、
・前記ビデオはさらに、前記画像の前に1つまたは複数の他の画像を含み、前記方法はさらに、前記1つまたは複数の他の画像に基づき前記アトムの辞書を決定することを含む。
さらには、前記方法を実行するための命令を含むコンピュータプログラムが提供される。
さらには、前記コンピュータプログラムを記録したコンピュータ読み取り可能記憶媒体が提供される。
さらには、前記コンピュータプログラムを記録したメモリに接続されたプロセッサとグラフィカル・ユーザ・インターフェースを備えるシステムが提供される。
以下、非限定的な例として、本発明の実施の形態を添付の図面を参照しつつ説明する。
本方法を例示したフローチャート。 本システムの一例。 本方法の一例のフローチャート。 本方法により行ったテストの例示。 本方法により行ったテストの例示。 本方法により行ったテストの例示。 本方法により行ったテストの例示。 本方法により行ったテストの例示。
図1は、少なくとも1つの穴を有する画像を補完するための、コンピュータにより実施される方法を示す。本方法は、画像における既知の部分を表すアトムの辞書を提供すること(S10)を含む。本方法はまた、アトムの線形結合の最適な分布を決定すること(S20)を含む。決定(S20)は、ノードおよびラベルを有するマルコフ確率場上に定義されたエネルギーの、少なくとも1回の最小化を含む処理により実行される。各ノードは、穴の各位置に対応し、各ラベルに関連付けられる。本方法はまた、最適な分布で穴を埋めること(S30)を含む。このような方法は、画像補完の分野を改善する。
特に、従来の画像補完手法と比較して、本方法は、比較的短い演算時間で、比較的少ない費用と処理リソースを用い、穴が比較的大きい状況を含む比較的多くの状況において、比較的高品質の結果(例えば、非常に現実的な結果)に到達することを可能にする。
この方法では、S30で画像の穴を埋め、それにより完全な画像を得ることができる。要素の任意の集合ではなく、画像の既知の部分を具体的に表すアトムの辞書をS10で提供することにより、埋めること(S30)では、とりわけ現実的な画像の補完が可能になる。結果は、特に、比較的リッチであり(例えば、穴の輪郭のみの代わりに、例えば画像の既知の部分全体に含まれる情報を統合する)、かつ/あるいは、含まれるアーチファクトや、ぼけや、唐突なテクスチャ形状(例えば、穴の代わりに局所化される)が比較的少ない。また、具体的な辞書を提供すること(S10)のおかげで、最適な分布の決定(S20)の基礎は比較的小さくてもよく、かつ/または、アトムの線形結合が比較的疎であってもよい。これにより、比較的速く収束し、かつ/あるいは、ほぼ真の最適値に到達することが可能になり、したがって、(例えば、最適な分布の決定(S20)において剪定を行うことなく)最も妥当な結果がもたらされる。さらに、S10においてそのような辞書を提供することにより、具体的に、堅牢で収束するのが比較的速いことが知られているマルコフ確率場(MRF)のエネルギー最小化を、S20で用いることが可能になる。
画像は、例えば連続したND配列(すなわち、N次元配列、ここでNは任意の正の整数、例えば2)からなる任意のデータ構造であり、配列の各位置は「画素」と呼ばれ、(例えば同じ)物理的信号の値に関連付けられていてもよい。画像は、特に、写真、すなわち画素が色を表す値に関連付けられた2D配列(例えば、物理的信号値が、RGB値であり、かつ/あるいは、階調値である)であってもよい。画像は、自然画像、すなわち、センサによって取得された画像(例えば、現実のシーン、および/または、1つまたは複数の現実の物体上の画像)、人工画像(例えば、合成画像)、または、1つまたは複数の自然画像と1つまたは複数の仮想画像との組み合わせ、および/または、重ね合わせであってもよい。画像は、数値写真(numeric photograph)のような自然画像であってもよい。あるいは、画像は、奥行き画像、赤外線画像、または、自然画像、人工画像、奥行き画像、および/または、赤外線画像の、任意の組み合わせであってもよい。
画像は、1つまたは複数の穴を含む。穴は、配列における連続した(例えば複数の)位置の集合であり、これらは物理的信号値とは関連付けられておらず、よって値が関連付けられるか、あるいは、既に物理的信号値が関連付けられているが代わりの物理的信号値が割り当てられる(例えば、現在の値が壊れているか、除去される物体に関連付けられているため)。本方法では、S20において、当該割り当て値を決定する。こうした割り当ては、本方法における充填(S30)で実行される。このようにして、充填(S30)では、穴に対して画像の補完を行う。
当該画像補完は、例えば、画像の一部が除去されており、例えばユーザが、除去された部分を埋める必要があるような、画像修整アプリケーションで実施されてもよい。当該画像補完は、画像内のオブジェクトを移動させたり、または画像内のオブジェクトを別のものに置き換えたりするようなアプリケーションで実施されてもよい。当該画像補完は、また、画像(例えばビデオのピクチャフレームとして)を含むビデオ(すなわち、ピクチャフレームの時間シーケンス)を補完するために実施されてもよい。
ビデオ補完の場合、ビデオは、補完された画像の前に、1つまたは複数の他の画像(言い換えれば、充填(S30)で補間されたピクチャフレームよりも時間シーケンスにおいて前に来る1つまたは複数のピクチャフレーム)を含んでいてもよい。このような場合、本方法は、当該1つまたは複数の前の画像に基づいて(例えば、それらの画像だけに基づいて)アトムの辞書を決定することを含んでいてもよい。ビデオは時間的に連続するキャプションに由来していてもよい。このような場合、アトムの辞書は、次の画像を表してもよく、したがって、そのような次の画像の補完に効率的に用いることができる。これにより、あらかじめ辞書を決定することが可能になり、よって、来たる補完を、高速に、例えばビデオが再生されるときにリアルタイムで(すなわち、バッファリングを全く行わずに)実行することができる一例において、辞書は、1つまたは複数の初期画像フレームに基づいて、ビデオ全体について1回だけ決定されてもよい。あるいは、辞書は継続的に更新されてもよい。これにより時間経過に伴う環境の変化を考慮することが可能になる。すべての場合において、図1の方法は異なるフレームについて繰り返されてもよい。
アトムは辞書の要素であるパッチである。パッチは、画像と同じ性質のデータ構造であるが、サイズはそれより小さい。したがって、パッチは「画像パッチ」と呼ばれることがある。画像パッチは、2D画像用の小さな矩形(例えば、正方形)の画素として定義することができる。パッチは、各次元において20画素未満、16画素未満、15画素未満、または10画素未満であってもよく、あるいは1つの次元においてこれらの値未満であってもよく、かつ/あるいは、1つの次元またはそれ以上の次元において20画素未満、16画素未満、15画素未満、または10画素未満であってもよい。パッチは、1つの次元で4画素より大きいか、6画素より大きくてもよく、かつ/あるいは、別の次元において4画素より大きいか、または6画素より大きくてもよい。画像パッチは、例えば常に、例えば8×8画素のサイズであってもよい。
アトムの線形結合は、1つまたは複数の、例えば同じ方向を有するアトムの(代数的意味における)線形結合から生じるパッチである。すなわち、各画素座標について、前記画素座標の前記1つまたは複数のアトムの物理的信号の値が、(線形結合によって)線形的に結合される。したがって、アトムの線形結合は、線形結合に関与するアトムと同じサイズを有していてもよい。S10で提供されるアトムの辞書は、同一の、所定のサイズ(すなわち、上述のとおり、画像のサイズより小さい固定サイズ)のアトムからなっていてもよい。線形結合は、例えば、決定(S20)におけるパラメータに応じて、特に、少なくとも1回の最小化が行われる方法に応じて、固定数の、または可変数のアトムを含んでいてもよい。線形結合は、(例えば、すべて)1つのアトムだけを含んでいてもよい。そのような場合、線形結合は、アトムを正または負の(非ゼロの)スカラで乗算することに相当してもよい。あるいは、少なくとも1つの線形結合(例えば、すべての線形結合)は、厳密に2つ以上のアトム(例えば、正確に2つのアトム)を含んでいてもよい。線形結合は、すべて同一で共通の数のアトムを含んでいてもよい。いずれの場合も、アトムの線形結合はパッチを形成し、したがって画像を局所的に修正する(すなわち、物理的な信号値を生成または置換する)ように画像の位置に割り当てることができる。
アトムの線形結合の分布は、(例えば複数の)アトムの線型結合の集合であり、アトムの線形結合のそれぞれは、他のアトムの線形結合を基準に空間的に配置される。よってアトムの線形結合の分布はパッチの空間分布を形成し、したがって画像を修正するように画像の位置に割り当てることができる。これらの位置は、MRFノードに対応していてもよい。空間分布は、特に、穴のジオメトリに対応してもよく、(例えば、少なくとも実質的に)例えば穴を覆ってもよい。したがって、分布を用いて穴を埋めることは、穴の上に分布を配置する/重ねること、および分布の画素の物理的信号値(例えば、色)を穴の対応する画素に割り当てることを含んでいてもよい。
分布におけるパッチの画素が共に重なり合う場合(すなわち、画素が充填(S30)の際に重ねられる)、結果として得られる画素について保持された物理的信号の値は、重なり合う画素のそれぞれについての画素の物理的信号の値を加算したもの、あるいはその平均に対応してもよい。分布のパッチは、特に、それぞれ、隣接するパッチの同じサイズのバンドと重なる画素のバンド(例えば8×8画素のパッチの場合、例えば幅4)を有していてもよい。分布におけるパッチの画素が穴の外の画像の画素に重なる場合、結果として得られる画素について保持された物理的信号の値は、重なり合う画素のそれぞれについての画素の物理的信号の値を加算したもの、あるいはその平均、または、画像の画素を分布のパッチの画素で置き換えたものに対応してもよい。そのような重なりは、いずれの場合も、所定の規則に従って処理されてもよい。前記所定の規則は、各MRFエネルギーの定式化において考慮されてもよい。
1つまたは複数の穴のうちの少なくとも1つが大きくてもよい。大きな穴は、単一のパッチやアトム、またはアトムの線形結合では完全にカバーすることができない穴として定義することができる。この穴は、例えば、画像から除去されるべき前景オブジェクトに対応していてもよい。実際、画像の補完の例には、ピクチャ内の大きな前景オブジェクトを除去し、残された空隙を埋めることが含まれる。反対に、画像修復を、画像上の小さな構造の補完として定義することができる。画像修復では、構造物は、典型的には、単一の重なり合うパッチで充填することができる。画像修復の例には、ピクチャ上のテキストを除去し、残された空隙を埋めることが含まれる。図1の方法は、どちらの場合にも適用することができる。特に、図1の方法では、穴が大きい場合でも、効率的に適用する(すなわち、良好な結果を速やかに提供する)ことができる。この穴は、例えば画像の穴のサイズの10%より大きく、例えば画像の穴のサイズの1/4の大きさであってもよい。
ここで、S10で提供されるアトムの辞書について説明する。
辞書は、「アトム」と呼ばれる要素の集合であり、辞書は所与のデータセットを表す。所与のデータセットは、図1の方法の場合、画像の既知の部分であり、これは画像の穴の外側の部分である。「画像の既知の部分を表す」とは、辞書の少なくとも1つのアトムと同じサイズの所与の既知の部分の(例えば実質的に)それぞれについて、当該所与のパッチに少なくとも類似したパッチが結果として得られるような上記サイズを有するアトムの線型結合が存在することを意味する。S10で与えられる辞書のアトムは、すべて同じ所与のサイズを有していてもよい。このような場合、「画像の既知の部分を表す」とは、上記所与の同じサイズを有する所与の既知の部分の(例えば実質的に)それぞれについて、当該所与のパッチに少なくとも類似したパッチが結果として得られるようなアトムの線型結合が存在することを意味する。同じサイズの2つのパッチは、当該2つのパッチが所定のパッチ距離に対して少なくとも互いに近接する場合に「少なくとも類似している」と言われる。所定のパッチ距離は、2つの画像間の任意の距離であり、例えば測光歪みであってもよい。「互いに接近する」とは、2つの画像間の距離が所定の(例えば、比較的低い)閾値を下回ることを意味する。閾値は、2つのパッチ内の画素数についての増加関数であってもよい。
ここで、辞書がそのような集合でなく、辞書の少なくとも1つのアトムと同じサイズの所与の既知の部分の(例えば実質的に)それぞれについて、当該所与のパッチに少なくとも類似したパッチが結果として得られるような上記サイズを有するアトムの疎な線型結合が存在することを特に保証するようなものである。「アトムの疎な線形結合」とは、線形結合に関与するアトムの数が少なく、例えば常に15より小さいか、常に10より小さいか、または常に5より小さいことを意味する。また、辞書は、比較的小さなサイズの集合であってもよい。
一例において、辞書は、画像の既知の部分からそのように抽出されたパッチの集合(例えば、画像の既知の部分のパッチの数の5%を超え、例えば10%程度)を含んでいてもよい。辞書は、例えば以下を含むか、あるいは以下からなっていてもよい:
・画像の既知の部分における規則的な場所で抽出されたパッチ;
・画像の既知の部分における関心のある場所で抽出されたパッチ(例えば、Harrisの検出器を含む、そのような関心のある場所についての1つまたは複数の検出器を使用する);
・画像の既知の部分に対して操作した統計モデルから抽出されたパッチ(例えば、画像が異なるテクスチャをわずかしか含まない場合);および/または
・画像の既知の部分から抽出されたパッチの密な集合。
あるいは、または追加的に、辞書は、辞書学習によって得たパッチを含む集合であってもよい。したがって、アトムの辞書は、辞書学習したパッチの集合を含むか、それからなっていてもよい。
辞書学習の概念は、少なくとも論文「Elad M, Aharon M.K−svd:An algorithm for designing overcomplete dictionaries for sparse representation.IEEE Transactions on Signal Processing.2006」以来知られている。辞書学習は、形式的には、ウェーブレット理論を画像パッチに適用して拡張したものである。ウェーブレット理論では、ウェーブレットからなるベクトルベースで画像パッチを分解することができる。従って、画像パッチは、ウェーブレットの線形結合として表すことができる。画像パッチのウェーブレット基底は、画像パッチ内の画素と同じ数の基底ベクトルから構成される。このような基底に基づき画像パッチを分解することは興味深い。なぜなら、ほとんどのウェーブレット係数はゼロまたはゼロに近く、良好な圧縮率が実現できるからである。ほとんどの係数をゼロにするか、またはゼロに近づけることが、疎な分解の定義である。
辞書学習は、例えば、「辞書」と呼ばれる過完備族(すなわち、画像パッチ内の画素よりも例えばはるかに多くのベクトルが存在する集合)上の画像パッチを分解することによって、この理論をさらに進歩させる。次元nの空間内におけるk個のベクトルの集合は、k個のベクトルが空間全体を生成し、k>nであるときに、過完備であると言われる。言い換えると、集合は厳密に、ベクトル基底を含む一例において、kはnよりはるかに大きく、例えばk≧2nである。この分解は、辞書作成処理で実施されるため、設計によって疎となる。
辞書学習の目的は、全ての画像パッチについて疎な表現xを見つけることができるような辞書を見つけることである。xの疎らさの程度と分解の精度との間のトレードオフは、異なる方法で表現することができる。文献では、しばしば以下の最小化問題(いずれも図1の方法によって実施することができる)を見つけることができる:
1.
のとき
を最小化。
2.
のとき
を最小化。
3.(
のとき)
を最小化。
ここでT、M、およびλは、疎さの程度を制御するパラメータである。
上記の問題を解決するためのアルゴリズムはそれ自体知られており、概説を、論文「Mairal,Julien,Francis Bach,and Jean Ponce.Sparse modeling for image and vision processing.2014」に見つけることができる(なお、概説におけるアルゴリズムは、いずれも図1の方法によって実施できる)。
この表現では、xは、その非ゼロ係数が、信号yの説明に関与する辞書の列(すなわちアトム)に対応する疎ベクトルである。これらの係数の値はアトム間の混合率を定量化する。なお、本方法は、論文「Rodolphe Jenatton,Julien Mairal,Guillaume Obozinski,and Francis Bach.Proximal methods for hierarchical sparse coding.Journal of Machine Learning Research. 2011」に示されるように、(非ゼロの係数を得た)選択されたアトムの選択において何らかの構造を実施してもよい。
辞書を効果的に学習することは、画像または画像の集合のパッチを最もよく表すアトムの集合を学習することであり、それらを線型的に結合させると、画像の再構成が可能になる。図1の方法は、この事実を利用することにより、画像から内容をコピーすることなしに(この手法は、望ましくないアーチファクトを生み出し、よって本物らしくない結果につながる)、関連する欠落部分を作り出すことができる。
S10で提供される辞書は、図1の方法を実行するときに上記に従って例えばその場で(例えば、少なくとも部分的に)学習した辞書、および/または、(例えば部分的に)予め学習した辞書を含むか、または、それからなっていてもよい。その場で学習する場合、提供すること(S10)は、辞書を学習することを含んでいてもよい。辞書学習が実行されるデータベースは、辞書を得るのに適切な任意の適切なパッチのデータベースであってもよい。データベースは、画像の既知の部分から抽出されたパッチの集合(以前に提供されたそのような抽出されたパッチの集合の任意の例など)、および/または、画像の既知の部分に類似したパッチの集合を含むか、または、それからなっていてもよい。
一例において、辞書は、そのようなデータベースに基づき、以下を含むか、または以下からなっていてもよい:
・K平均クラスタリングの結果として得られるパッチの集合;
・階層的K平均クラスタリングの結果として得られるパッチの集合;
・K−SVDアルゴリズムの結果として得られるパッチの集合;
・アーキタイプ分析(Archetypal Analysis)の結果として得られるパッチの集合(例えば論文「A.Cutler and L.Breiman.Archetypal analysis.Technometrics,36(4):338−347,1994」に開示);および/または、
・フーリエ分解の結果として得られるパッチの集合。
したがって、学習は、そのような既知の辞書学習処理に相当してもよい。
画像の既知の部分に類似したパッチの集合は、画像の既知の部分と同じ性質の画像のデータベースから抽出してもよい。例えば、画像が建築物(あるいは内装、あるいはビーチ)の画像である場合、画像のデータベースは、建築物(あるいは内装、あるいはビーチ)の画像のデータベースである。一例では、本方法は、ラベル付き画像(ImageNetなど)の非常に大きなデータベースに基づいていてもよい。このような場合、本方法は、入力画像のラベル付けまたは分類、およびデータベース内の同じラベルまたはクラスを有するデータベースの画像に由来するパッチに関する辞書学習を含んでいてもよい。ディープラーニングのように、ラベル付けまたは分類のための異なる既存の方法が知られており、図1の方法によって実施することができる。
ここで、決定(S20)について説明する。
決定(S20)は、S10で提供される辞書に基づいており、各MRFエネルギーの少なくとも1回の最小化を含む。広く知られているように、MRFエネルギーはノードのグラフ上に定義され、ノードは「ラベル」と呼ばれる異なる値を取ることができる。エネルギーの最小化(すなわち、エネルギーに対応する尤度の最大化を含むそのような最小化に相当する任意の最適化アルゴリズム)は、MRFエネルギーに関与する1つまたは複数の基準に関して最適条件を提供する。MRFエネルギーは、そのような1つまたは複数の基準に、(例えば、それぞれが各基準に対応するペナルティ条件または「コスト」を用いて)ペナルティを課す。
図1の方法の場合、グラフは、各ノードが穴の各位置に対応し、各ラベルに関連付けられるように構成される。各MRHエネルギーの最小化が2回以上実行される場合、エネルギーのグラフは同じ構造(すなわち、同じノード、すなわち同じ穴の位置)を有していてもよい。MRFエネルギーの基礎をなすグラフは、例えば、穴を覆う(例えば、規則的な)グリッドを形成してもよい。グリッドは、(例えば、上述したように)線形結合が空間的に重複するようなものであってもよい。これにより、画像に強いエッジが生成され、高品質の結果が得られる。
ここで、明確化のため、広く知られているグラフのラベル付けの概念について説明する。
グラフは、ノードとエッジからなる数学的オブジェクトである。グラフのラベル付けの問題は、グラフの各ノードにラベルを割り当てる問題である。各ノードは、ラベルの所定の集合の中から選択することができ、そのような選択は、ルールの集合に従って行うことができる。グラフのエッジは、ノードのペア、またはクリーク(完全に接続されたノードの集合)にルールを適用することによって、ノードのラベル選択に影響を与えてもよい。
ここでマルコフ確率場について説明する。
マルコフ確率場(MRF)は、ランダム変数の集合が所定のラベルの集合における値を取ることができる統計モデルである。これらのモデルは、異なる変数の部分集合間における同時確率を、同時に符号化することを目的としている。図1の方法は、特に次のように説明することができる2次のMRFを考慮してもよい。
・基礎をなす無向グラフ(V,E)に関して、V=(v1,・・・,vn)はグラフの頂点の集合であり、各ノードviは変数Viに対応し、Eは、グラフの双方向エッジの集合である。
・各変数Viは、ラベルの有限集合{1,・・・,Li}における値のみをとることができる。
・同時確率p(V1=l1,・・・,Vn=ln)は、以下のように書き表すことができる。
ここで、関数
は単項に対応し、関数
はバイナリ項に対応する。
文献および実践において、MRFの解法は対数尤度と反対の働きをすることが多い。このような方法は、−log変換を用いてラベルごとにコスト(エネルギーとも呼ばれる)を導出する。
関数Uiは単項に対応し、Bi,jはバイナリ項に対応する。
ここでラベル付けの問題について説明する。
そのようなMRFが与えられたとき、本方法は、エネルギーE(l1,・・・,ln)が最小化される(このエネルギーを最小化することにより、上式の尤度が最大になる)ような割り当て(V1=l1,・・・,Vn=ln)を探すという問題を考慮することに相当してもよい。
なお、この最小化がNP困難であることが知られていることが重要である。しかし、MRFは、1980年代から広く研究されてきており、いくつかのヒューリスティックアルゴリズムは、例えば、論文「Kolmogorov,V.Convergent tree−reweighted message passing for energy minimization.Pattern Analysis and Machine Intelligence,IEEE 2006」に記載されているTree ReWeighted Message Passingのように、非常に良好な結果をもたらしており、本方法でこれを実施してもよい。
さらに、各ラベルが値の有限集合のうちの値をとるように、最小化が実行されてもよい。そのような場合、従来技術から離散的なマルコフ確率場(MRF)のオプティマイザが収束することが知られており、そのような任意のアルゴリズムが、任意のMRFエネルギー最小化のための方法によって実施されてもよい。
例えば、以下の文献に記載されている任意のMRF解法を実施してもよい:
・J.Kappes et al,A Comparative Study of Modern Inference Techniques for Discrete Minimization Problems, in CVPR 2013。
・Convex Relaxation MRF解法(例えばLinear Programming(Schlesinger 1976),Semidefinite Programming(Lasserre 2000)、あるいはSecond−Order Cone Programming(Muramatsu and Suzuki,2003))。
LinearProgrammingRelaxationMRF解法の二重化(例えばTree Reweighted Message Passing,Dual Decomposition)。
・Graph Cut MRF解法 (例えばAlpha Expansion,Alpha−Beta Swap,FastPD)。
・Belief Propagation MRF解法(例えばLoopy Belief Propagation,Generalized Belief Propagation)。
特に、MRFエネルギー最小化は、各ラベルが、500個未満、200個未満、150個未満、あるいは100個未満の値を含む値の有限集合のうちの値をとるように構成されてもよい。そのような場合、(1回または複数回の)最小化は、特に高速になる。
図1の方法は、各MRFエネルギーの少なくとも1回の最小化を含む。前記少なくとも1つの最小化は、ちょうど1つの最小化(すなわち、1つのMRFのみが定義され、ラベルは、最適な分布に関与し得る辞書のアトムの、あり得るすべての線形結合に対応する)からなっていてもよい。
あるいは、図1の方法は、トップダウン手法を実施してもよい。「トップダウン手法を実施する」とは、本方法が、例えばいくつかの連続したMRFエネルギー最小化など、別個のMRF最小化(それぞれ、各MRFエネルギーに対応する)を含み、すべての最小化の結果(すなわち最適値)を組み合わせてアトム線形結合の最適分布を提供することを意味する。言い換えれば、各最小化は、最終結果(すなわち、アトム線形結合の最適分布)のそれぞれの(例えば、所定の)部分を提供する。
例えば、最小化は最適なアトムを検索し、別の最小化は最適な係数を検索する。追加的または代替的に、最小化は、決定されるべき最適な線形結合における第1のメンバー(アトムおよび/または係数)を検索し、別の最小化が第2のメンバー(アトムおよび/または係数)を検索する。
そのような場合、辞書は、最小化のMRFスキームの構造、例えば階層化された構造を想定して編成されてもよい。辞書のアトムは、それぞれの最小化用に準備されるか、または割り当てられてもよい。これにより、MRFの最小化をより速く実行することができる。なぜなら、探索される変数の集合が(的を絞られているために)縮小されているからである。
このようなトップダウン手法は、最初の複雑な問題を一連のより小さな問題に分割することを可能にする。各最小化は比較的容易であり、よって決定(S20)は全体的に高速である。しかし、問題の分割が、最終的に出力される最適値の質に与える影響は、比較的小さい。
本方法は、コンピュータにより実施される。すなわち、本方法のステップ(あるいは略全てのステップ)が少なくとも1つのコンピュータ、または類似の任意のシステムによって実行される。よって本方法のステップは、コンピュータにより、完全に自動的に、あるいは半自動的に実行される可能性がある。例えば、本方法の少なくともいくつかのステップは、ユーザとコンピュータの対話を通じて始動されてもよい。求められるユーザとコンピュータの対話レベルは、想定される自動性のレベルに応じたものであって、ユーザの要望を実装する必要性との間でバランスをとるものとしてもよい。例えば、このレベルは、ユーザが設定し、かつ/あるいは、予め定義されていてもよい。
方法のコンピュータによる実施の典型的な例は、この目的に適したシステムを用いて本方法を実行することである。当該システムは、本方法を実行するための命令を含むコンピュータプログラムを記録したメモリに接続されたプロセッサ、および、グラフィカル・ユーザ・インターフェース(GUI)を備えていてもよい。メモリは、データベースを記憶していてもよい。メモリは、そのような記憶に適した任意のハードウェアであり、場合により、物理的に区別可能ないくつかの部分(例えば、プログラム用に1つ、場合によりデータベース用に1つ)を含む。
図2は、本システムの一例を示すものであって、当該システムは、クライアントコンピュータシステム、例えばユーザのワークステーションである。
本例のクライアントコンピュータは、内部通信バス1000に接続された中央演算処理装置(CPU)1010、および同じくバスに接続されたランダムアクセスメモリ(RAM)1070とを備える。クライアントコンピュータは、さらに、バスに接続されたビデオランダムアクセスメモリ1100と関連付けられたグラフィックス処理装置(GPU)1110を備える。ビデオRAM1100は、当該技術分野において、フレームバッファとしても知られる。大容量記憶装置コントローラ1020は、ハードドライブ1030などの大容量記憶装置へのアクセスを管理する。コンピュータプログラムの命令及びデータを具体的に実現するのに適した大容量メモリ装置は、例として、EPROM、EEPROM及びフラッシュメモリ装置のような半導体メモリ装置、内蔵ハードディスクやリムーバブルディスクなどの磁気ディスク、光磁気ディスク、およびCD−ROMディスク1040を含む、全ての形式の不揮発性メモリを含む。前述のいずれも、特別に設計されたASIC(特定用途向け集積回路)によって補完されてもよいし、組み入れられてもよい。ネットワークアダプタ1050は、ネットワーク1060へのアクセスを管理する。クライアントコンピュータはまた、カーソル制御装置、キーボードなどの触覚装置1090を含んでいてもよい。カーソル制御装置は、ユーザがディスプレイ1080上の任意の所望の位置にカーソルを選択的に位置させることを可能にするために、クライアントコンピュータ内で使用される。さらに、カーソル制御デバイスは、ユーザが様々なコマンドを選択し、制御信号を入力することを可能にする。カーソル制御装置は、システムに制御信号を入力するための多数の信号生成装置を含む。典型的には、カーソル制御装置はマウスであってもよく、マウスのボタンは信号を生成するために使用される。あるいは、または追加的に、クライアントコンピュータシステムは、感知パッドおよび/または感知スクリーンを備えてもよい。
コンピュータプログラムは、コンピュータによって実行可能な命令を含んでいてもよく、命令は、上記システムに方法を実行させるための手段を含む。プログラムは、システムのメモリを含む任意のデータ記憶媒体に記録可能であってもよい。プログラムは、例えば、デジタル電子回路、またはコンピュータハードウェア、ファームウェア、ソフトウェア、またはそれらの組み合わせで実装されてもよい。プログラムは、例えばプログラマブルプロセッサによる実行のための機械読み取り可能な記憶装置に具体的に実現された製品のような装置として実装されてもよい。方法ステップは、プログラム可能なプロセッサが命令のプログラムを実行し、入力データを操作して出力を生成することによって方法の機能を実行することによって実行されてもよい。したがって、プロセッサは、データ記憶システム、少なくとも1つの入力デバイス、および少なくとも1つの出力デバイスからデータおよび命令を受信し、また、それらにデータおよび命令を送信するようにプログラム可能であってもよく、またそのように接続されていてもよい。アプリケーションプログラムは、高水準の手続き型またはオブジェクト指向のプログラミング言語で、または必要に応じてアセンブリ言語または機械語で実装されていてもよい。いずれの場合も、言語はコンパイラ型言語またはインタープリタ型言語であってもよい。プログラムは、フルインストールプログラムまたは更新プログラムであってもよい。いずれの場合も、プログラムをシステムに適用すると、本方法を実行するための指示が得られる。
図3は、トップダウン手法を実施する本方法の一例を示しており、ここで、決定(S20)は、各マルコフ確率場に定義されたエネルギーについて、それぞれちょうど4回の別個の最小化を含む。この例は、特に効率的であるとともに質の高い補完が得られることを証明している。
S10で提供される(例えば、学習した)辞書は、ルートアトムの層と補正/修正(correction/corrective)アトムの層とを含む。穴の各位置について、第1の最小化で最適なルートアトムを見つけ出し、第2の最小化でルートアトムの最適な係数を見つけ出し、第3の最小化で最適な補正アトムを見つけ出し、第4の最小化で補正アトムの最適な係数を見つけ出す。第3の最小化に関して、ラベルは、保持されているルートアトムに依存する辞書におけるアトムの集合の内の値をとってもよい。言い換えれば、辞書は階層的で、ルートアトムを含み、各ルートアトムについては、補正アトムであってもよい。ルートアトムに対して提供されるそのような補正アトムの集合は、各ルートアトムに対して比較的小さくてもよい。これにより、本方法はとりわけ効率的になる。
第2および第4の最小化に関して、ラベルが取る値を含む所定の係数の集合は、それぞれ、または、ともに、係数が、例えば辞書学習によって定義されている領域の規則的なサンプリングに由来し、画像の既知の部分のパッチを生成する(例えば、[0,1]の規則的なサンプリング)。あるいは、所定の係数の集合は、それぞれ、あるいは、ともに、画像の既知の部分のパッチを生成するための辞書のアトムに適用される係数の集合に由来してもよい。言い換えれば、辞書のアトムの線形結合により既知の部分のパッチを生成するために実際に用いられる係数は、所定の係数の集合の精緻化に基づいており、それによりMRF最小化をより速くする一例において、実際の係数の集合は、K平均クラスタリングを用いて量子化される。K=20は、実験に基づく効率的な値であり、既存のMRFオプティマイザによって効率的に探索され、かつ十分なバリエーションを実現する集合に対応する。
辞書は、100個未満のルートアトム、例えば25個から75個まで、例えば50個のルートアトムを含んでいてもよい。各ルートアトムは、それに関連付けられた15個未満の補正アトム、例えば5〜10個の補正アトムを有していてもよい。このように、辞書は、ルートと修正との間でアトムを階層化してもよい。階層は、ツリーデータ構造として実施してもよい。
ここで、図3の方法のテストについて説明する。
我々は、論文「Elad M,Aharon M.K−svd:An algorithm for designing overcomplete dictionaries for sparse representation.2006」または論文「Rodolphe Jenatton,Julien Mairal,Guillaume Obozinski,and Francis Bach.Proximal methods for hierarchical sparse coding.Journal of Machine Learning Research,2011」に記載されているK−SVDアルゴリズムを、画像の既知の部分から抽出した8×8画素のサイズ(他のサイズでもテストを行い類似の良好な結果を得たが、8×8のサイズが特に効率的である)のパッチの集合からなる「トレーニング信号の集合」(すなわち入力データベース)と共に用いて、本手法をテストした。しかし、(例えば上記のような)他の任意の入力の基礎、および/または、他の任意の辞書学習アルゴリズム(例えば、論文「MairalJulien,FrancisBach,andJeanPonce.Sparsemodelingforimageandvisionprocessing.2014」で提供されている辞書学習アルゴリズムの概説のいずれか)でも同様に、許容可能な結果が得られたであろう。
本テスト法では、穴が大きい場合の画像補完パラダイムにおける画像修復方法の精度を活用する。そのために、本テスト法では、マルコフ確率場と辞書学習という2つの強力なツールを使用する。
本テスト法は、以下により、辞書学習技術を用いて画像における大きな空隙を埋めることを可能にする:
・空隙上に定義されたグラフの各ノードについて、線形結合が行われるアトムのリストを知ることができるようなグラフベースの手法を用いて、辞書のアトムの選択を全体的に解決する。アトムの選択は、画像の既知の部分から未知の部分へと、構造とテクスチャが保存されるような方法で行われる。
・係数の選択を全体的に解決する:アトムのリストが与えられたとき、グラフ内の各ノードについて、グラフ内のノード間が滑らかに遷移するように、線形結合の係数を調整する。
本テスト法は、画像からコピーすることなしに画像内の空隙を埋めることができるため、より現実的である。
テストは、ここで説明する、図3の方法の1つの単純な実施例について実行した。この実施例は、特に良好な結果を生み出した。この実施例では、本方法は2層の階層的モデルを用いており、ここで、各パッチは、ルートアトムと、適切な係数を有する補正アトムの組み合わせとして取得することができる(このように階層的辞書学習手法が考慮される)。
1)第1ステップ:(2層の)辞書の学習(S10)
まず初めに、画像の既知の部分から、パッチの大きな集合を抽出した。次に、S10に関して、それらパッチについてK−SVDアルゴリズムを用いて辞書Drootの学習を行った。ここで、分解は1のサイズでなければならない(考慮したすべての画像についてDrootは50〜150個のアトムを用いる)。同様の手法を用いて、アトムdkを用いた分解で残った残余パッチに基づいて、Drootの各アトムdkについて、(5個程度のアトムを用いて)辞書
を算出した。このように、S10で提供される階層的辞書は、Drootおよび関連付けられたすべての
として決定される。
2)第2ステップ:グリッドグラフの構築(S20の開始)
グラフは、ノード同士が規則的に離間してグリッドを定義するように、欠落領域上に構築される。隣接する2つのノード間のスペースは、例えば、パッチのサイズの半分(例えば、パッチのサイズが8×8の場合、隣接する2つのノード間のスペースは4画素)とすることができる。そして、各ノードは、例えば四連結を用いて近傍ノードに接続される。
3)第3ステップ:分解の算出(S20の終了)
このステップでは、グリッドグラフの各ノードに、4つのパラメータ、すなわち、Drootのアトムdk、このルートアトムの係数、
における補正アトム、およびこの補正アトムの係数を割り当てたい。目標は、可能な限り良好な補完を達成するために、これらの割り当てを全体的に最適化することである。
この処理は、異なるステージに分けられる。
a.第1ステップでは、マルチスケール手法を用いて、ルートアトムのみの最適化を試みる。
b.第2ステップは、それらのルートアトムの係数を取得することからなる。
c.第3ステップは、各位置において補正アトムを見つけることを目的とする。
d.最後に、第4ステップでは、これらの補正アトムの係数を算出する。
これらの4つの最適化は、同じMRFグラフ(第2ステップで構築されたもの)を用いるが、ラベルの性質、および使用されるコスト関数に関して互いに異なる。
以下、これら最適化ステージのそれぞれについて詳細を説明する。
a)ルートアトムの選択:
この第1ステップは、ルートアトムを有するノードのラベル付けを見つけることを目的とする。大まかに言えば、このステップは「粗い」解決策を見つけることからなる。大きな幅(幅とは、2つの隣接するノード間の距離を意味する)についての解を最初に算出し、幅がより小さくなるように繰り返す。このマルチスケール手法は、主に、演算時間を短縮するために実行される。演算時間は、直接的に小さな幅を扱うMRF最適化における最適化と比較して、結果の質について大きな犠牲を払うことなく、典型的には5分の1であることが経験上示されている。
ここでエネルギーについて説明する。
テストでは、第1の最小化についてのエネルギーは、測光歪みおよび統計的歪みにペナルティを課し、第2の最小化についてのエネルギーもまた、測光歪みおよび統計的歪みにペナルティを課す(以下「バイナリ項またはバイナリ・コスト」)。
異なる基準を用いてMRFのユナリ・コストとバイナリ・コストを設計し、それらを線形結合によって混合することもできる。ここでは、テストで用いた幾つかのコスト関数を示す(これらのコストの任意の組み合わせを実施できる)。
・縁の基準(ユナリ・コスト):穴の縁上のラベルを既知の部分と一致させるユナリ・コスト関数を設計できる。アトムが係数を持たないため、縁に合致し得る最良の係数を用いてコストを構築する(これは幾分楽観的である)。
・測光基準(バイナリ・コスト):係数を持たないアトムを扱う場合も、2つのアトムの一定の重複領域が得られるような所与のオフセットを基準とした比較方法を確立することができる。重複領域上のアトムのコサイン類似度の逆数を測光エネルギーを得るためのバイナリ・コストとして用いた。
・統計的オフセット基準(バイナリ・コスト):さらに、画像中のアトムの発生率の再分割が、幾つかの空間的性質を有することを見出した。この知識をエネルギー関数に組み入れるために、アトムのラベルl1、l2の各対と各オフセットd(ここでは、四連結に対応するものと八連結に対応するもののうちいずれかを使用する)について、以下に比例する対称コストを算出する:−log(p1×p2)、ここでp1は、画像の既知の部分における、ルートアトムl1からの変位dに位置する探索ルートアトムl2の相対的頻度として算出され、p2は対称的に定義される。より正確には、Occ(l1)とOcc(l2)が画像の既知の部分におけるこれらのルートアトムの発生率を表し、Occd(l1,l2)がオフセットdに基づく既知の領域における対(l1,l2)の発生率を表すとすると、p1=Occd(l1,l2)/Occ(l1)となり、またp2=Occd(l1,l2)/Occ(l2)となる。
測光歪みとは、近傍パッチが互いに異なる程度(例えば、光度正規化係数を法とする)のことである。統計的歪みとは、パッチのシーケンスが既知の部分の構造を再現する程度のことである。
測光歪みには、コサイン類似度を用いてペナルティを課すことができる。そのため、アトムは正規化されてもよい。正規化は、アトムにノルム1を課すことからなる(すなわち、それら画素の値の二乗の和が1に等しい)。パッチの大きさがn×nであるとする。パッチは垂直方向または水平方向に重なる。水平の場合、左側のパッチの最後のx列が、右側のパッチの最初のx列と共通する。したがって、共通部分は、高さはnだが幅がわずかxの一種のパッチそれ自体である(例えば、xはn/4とn/2の間)。測光歪みは、この重なり部分のみに適用される。
統計的歪みモデルに用いられる式は、均質性および対称性の制約を考慮して、確率的な方法で正準的に配列される。
これらの歪みは、所定のパッチが別のパッチに対して右/左/上/下に位置するような傾向のモデル化を可能にする。測光歪みは、この状況とは関係なしに、2つのパッチが「良い」近傍パッチであるという事実をモデル化する。統計的歪みは、既知の部分の統計量に基づく(複雑な画像の場合でも、その部分から多くの構造が実験的に出力される)。実際には、統計的歪みが弱い場合、既知の部分にパターンが数回現れたことを意味する。逆は真ではない。しかしながら、画像の残りの部分で観察されないように全体の一部を埋める必要がある場合には、測光歪みがそのような充填のほとんどを行う。ある意味では、統計的歪みはより精細だが、常に応答するわけではなく、一方、測光歪はより堅牢であるが、場合によっては精細さが劣る。この2つの組み合わせは、両世界の利点が達成されているため、特に強力である。
テストでは、第1の最小化は、穴の縁に合致しない程度についてさらにペナルティを課す(以下「単項またはユナリ・コスト」)。
また、線形構造を穴内に拡張することを目的としたユナリ・コスト関数を実装した。この関数を構築するために、同じルートアトムを用いる画素の(八連結のための)連結成分への分割を算出する(この演算は、深さ優先探索アルゴリズムで行われる)。次に、穴に隣接する各成分について、その中心点cおよびその2つの主ベクトルe1およびe2を、これらの点の共分散行列(e1は最大固有値λ1に関連付けられ、e2は最小固有値λ2に関連付けられる)に対してSVDを用いて算出する。
比λ1/λ2が20より大きく、成分が少なくとも15個の画素を含む場合、以下を行う:穴内の各画素位置xに対して、以下に比例する「ボーナススコア」を与える:
ここで、
であり、また
であって、σは、合理的な消滅率を有するように調整したシグモイド関数である:
この単項は、内装および建築物の画像に対するアルゴリズムの結果を大幅に改善した。
b)ルートアトム係数の最適化:
係数は連続的であるため、アトムごとに約20個の可能な係数を有するようにそれらを定量化することを選択した。これらの値は、それぞれ、新しいMRFのラベルに対応し、ラベル付けはルートアトムの係数に対する結合選択に対応する。実験により、与えられたアトムに用いられた係数の集合は一様に分布せず、クラスタを形成することがわかった。したがって、量子化ステップを選択するために、K平均クラスタリングを用いることを考えた。最初の組み合わせステップについては、測光の部分と統計モデルの両方を組み込んだエネルギーを設計した。
測光の部分は、近傍パッチにおける異なるパッチのL2ノルムを用いて(その重なり部分に対して)算出される。なぜなら、アトムと係数の組み合わされた知識がパッチに対応するからである。
統計的部分に関しては、各オフセットdとルートアトムラベルの対(l1,l2)について、l1とl2の係数の差についてのガウスモデルを(既知の領域について)学習した(このモデルは、数多くのルートモデルの対についてこれらの違いを表示し、それが全体的に、データセットの画像のガウス分布に従うことに気付くことによって発見された)。コストは以下に比例する:
ここで
は学習したガウス関数であり、c1、c2は係数パラメータである。
c)係数アトム選択
この第3のステップは、各ノードについて、使用される補正アトムを見つけることからなる。すでにルートアトムを選択しているため、各ノードについて可能性のある少数のなかから選択するだけでよい(典型的には、この3番目の最適化では、各ノードは5個程度の異なるラベルを取ることができる)。
このエネルギーの設計は、測光コストを用いなかったことを除けば、ルートラベルの最適化の場合と非常に似ている。したがって、縁とエッジ拡張のためのオフセットとユナリ・コストを用いた統計モデルのみを使用した。
d)補正アトム係数の最適化:
この最適化ステップの最後のステップは、測光コストを用いて係数を見つけるだけであるため、最も簡単なステップである(各ノードについて、ルートアトムとその係数、および選択した補正アトムを既に知っているため)。この演算はまた、モデルを学習する必要がないため、非常に高速である。
なお、最終的な実施例においては、2つの係数検索ステップは実際には2次であるが、非2次のエネルギーを試す可能性があるため、2次オプティマイザの代わりにMRF最適化を用いた。
4)第4ステップ:仕上げ
結果をより良く仕上げるために、マッチングベースのアルゴリズムを実装した。このアルゴリズムは反復的であり、初期化が良好に行われることを前提としている(この場合、初期化は、前の4つのMRF最適化の結果である)。各繰り返しにおいて、再構築された領域におけるいくつかのパッチの集合Sを選択し、それらを既知の領域から抽出したパッチの集合のうちの最も近いパッチで置き換える。集合Sは互いに重なり合う多数のパッチを含み得るため、異なるパッチに存在する画素の最終的な値を、平均値を処理して得る必要がある。
ここで、テストの結果について、図4〜8を参照して提示する。
図4は、左から右へ、穴を有する入力画像、エッジ拡張ユナリ・コストなしの結果、およびエッジ拡張ユナリ・コストありの結果を示す。エッジ拡張ユナリ・コストなしの場合でも結果が比較的高品質であることがわかる。
図5はテストに使用されたGUIインターフェースのスクリーンショットを示す。ここでは、異なる画像、パッチサイズ、アトムの数、分解のサイズを選択し、所与の画像502の任意のパッチの分解をインタラクティブに視覚化することができる。入力画像502に基づき辞書学習した比較的小さなパッチ504の集合を使用すると、入力画像における任意の元のパッチが、辞書のパッチの線形結合(この例では5つ)により、比較的良好に再構成できることがわかる。
図6は、大きな穴を補完するためのアルゴリズムの別のテストを示す。このアルゴリズムは、1.6秒で高品質の補完ができた。
図7は、左から右へ、初期劣化画像、充填する領域の選択、および結果画像を示す。
図8は、マルチスケール手法による第1層演算を示す。左から右に、各繰り返しにおいてステップが2つに分割されていることが分かる。各色は、所与のアトムラベル用いたことに対応している。
このように、MRF手法を辞書学習と併用することにより以下が得られることがテストにより示された:
・妥当な結果:結果画像は、たとえ細部が矛盾しているように見えても、人間にとっては自然に見えた。
・堅牢なアルゴリズム:アルゴリズムが誤った判断で止まってしまうことがなく、異なる種類の画像(自然画像、内装画像、深度マップ画像、さらには人工画像)について機能した。
・リアルタイムに近い演算(例えば、3秒未満)。これにより、ユーザは、画像内のオブジェクトをインタラクティブに除去または置換することができる。

Claims (15)

  1. 少なくとも1つの穴を有する画像を補完するための、コンピュータにより実施される方法であって、
    前記画像における既知の部分を表すアトムの辞書を提供すること(S10)と、
    ノードおよびラベルを有するマルコフ確率場上に定義されたエネルギーの少なくとも1回の最小化(S22〜S28)を含む処理を用いてアトムの線形結合の最適な分布を決定することであって、各ノードは前記穴の各位置に対応し各ラベルに関連付けられるような、決定すること(S20)と、
    前記最適な分布で前記穴を埋めること(S30)と
    を含むことを特徴とする方法。
  2. 各ラベルは、好ましくは500個未満、200個未満、150個未満、あるいは100個未満の値を含む値の有限集合のうちの値をとる
    ことを特徴とする請求項1に記載の方法。
  3. 前記処理は、前記少なくとも1回の最小化の結果を用いて初期化され、かつ、前記画像の既知の部分から抽出したパッチに基づく、マッチングベースのアルゴリズムを含む
    ことを特徴とする請求項1または2に記載の方法。
  4. 前記決定(S20)ではトップダウン手法を実施する
    ことを特徴とする請求項1〜3のいずれかに記載の方法。
  5. エネルギーの前記少なくとも1回の最小化は、
    第1の最小化であって、当該第1の最小化についての前記マルコフ確率場の各ラベルがアトムの辞書における値をとるような、第1の最小化(S22)と、次いで、
    第2の最小化であって、当該第2の最小化についての前記マルコフ確率場の各ラベルが所定の係数の集合における値をとるような、第2の最小化(S24)と、 を含むことを特徴とする請求項4に記載の方法。
  6. 前記所定の係数の集合は、前記画像の既知の部分のパッチを生成するための前記アトムに適用される係数の集合のK平均クラスタリングに由来する
    ことを特徴とする請求項5に記載の方法。
  7. 前記第1の最小化についてのエネルギーは、測光歪みおよび/または統計的歪みにペナルティを課し、かつ/あるいは、前記第2の最小化についてのエネルギーは、測光歪みおよび/または統計的歪みにペナルティを課す
    ことを特徴とする請求項5または6に記載の方法。
  8. 前記第1の最小化は、前記穴の縁に合致しない程度についてさらにペナルティを課す
    ことを特徴とする請求項7に記載の方法。
  9. 第3の最小化であって、当該第3の最小化についての前記マルコフ確率場の各ラベルが前記アトムの辞書における値をとるような、第3の最小化(S26)と、次いで、
    第4の最小化であって、当該第4の最小化についての前記マルコフ確率場の各ラベルが前記所定の係数の集合における値をとるような、第4の最小化(S28)と、
    を次いでさらに含むことを特徴とする請求項5〜8のいずれかに記載の方法。
  10. 前記第3の最小化についてのエネルギーは、統計的歪みにペナルティを課し、かつ/あるいは、前記第4の最小化についてのエネルギーは、統計的歪みにペナルティを課す
    ことを特徴とする請求項9に記載の方法。
  11. 前記画像はビデオのフレームである
    ことを特徴とする請求項1〜10のいずれかに記載の方法。
  12. 前記ビデオはさらに、前記画像の前に1つまたは複数の他の画像を含み、前記方法はさらに、前記1つまたは複数の他の画像に基づき前記アトムの辞書を決定することを含む
    ことを特徴とする請求項11に記載の方法。
  13. 請求項1〜12のいずれかに記載の方法を実行するための命令を含むコンピュータプログラム。
  14. 請求項13に記載のコンピュータプログラムを記録したコンピュータ読み取り可能記憶媒体。
  15. 請求項13に記載のコンピュータプログラムを記録したメモリに接続されたプロセッサと、グラフィカル・ユーザ・インターフェースとを備えるシステム。
JP2017237566A 2016-12-21 2017-12-12 画像の補完 Active JP7029283B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
EP16306754.9 2016-12-21
EP16306754.9A EP3340166A1 (en) 2016-12-21 2016-12-21 Completing an image

Publications (2)

Publication Number Publication Date
JP2018129036A true JP2018129036A (ja) 2018-08-16
JP7029283B2 JP7029283B2 (ja) 2022-03-03

Family

ID=57799509

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2017237566A Active JP7029283B2 (ja) 2016-12-21 2017-12-12 画像の補完

Country Status (4)

Country Link
US (1) US10621705B2 (ja)
EP (1) EP3340166A1 (ja)
JP (1) JP7029283B2 (ja)
CN (1) CN108230268B (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2021025845A (ja) * 2019-08-02 2021-02-22 株式会社島津製作所 変位分布計測装置、変位分布計測方法、及び変位分布計測装置の制御プログラム
JP2022540934A (ja) * 2019-07-15 2022-09-20 リアルシー・(ベイジン)・テクノロジー・カンパニー・リミテッド インテリアデザインのための人工知能システム及び方法

Families Citing this family (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10699453B2 (en) * 2017-08-17 2020-06-30 Adobe Inc. Digital media environment for style-aware patching in a digital image
US10672164B2 (en) 2017-10-16 2020-06-02 Adobe Inc. Predicting patch displacement maps using a neural network
US10614557B2 (en) 2017-10-16 2020-04-07 Adobe Inc. Digital image completion using deep learning
US10755391B2 (en) 2018-05-15 2020-08-25 Adobe Inc. Digital image completion by learning generation and patch matching jointly
CN109409388B (zh) * 2018-11-07 2021-08-27 安徽师范大学 一种基于图形基元的双模深度学习描述子构造方法
CN111239724B (zh) * 2020-01-20 2022-01-28 中国人民解放军国防科技大学 一种基于雷达传感网络的目标识别方法
CN113327190A (zh) 2020-02-28 2021-08-31 阿里巴巴集团控股有限公司 图像、数据处理的方法和装置
CN113284072A (zh) * 2021-06-30 2021-08-20 北京师范大学珠海校区 一种图像的增强方法
KR102551097B1 (ko) * 2021-10-08 2023-07-04 주식회사 쓰리아이 3차원 가상모델 제공을 위한 홀 필링 방법 및 그를 위한 컴퓨팅 장치
CN114299076B (zh) * 2021-11-10 2023-09-19 西北大学 基于离散小波分解的深度图像空洞填充方法及装置

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8718340B2 (en) * 2008-09-03 2014-05-06 Trustees Of The University Of Pennsylvania System and method for accurate and rapid identification of diseased regions on biological images with applications to disease diagnosis and prognosis
CN102682477B (zh) * 2012-05-16 2015-04-08 南京邮电大学 一种基于结构先验的规则场景三维信息提取方法
EP2747427B1 (en) * 2012-12-21 2016-03-16 imcube labs GmbH Method, apparatus and computer program usable in synthesizing a stereoscopic image
US9594976B2 (en) * 2014-02-18 2017-03-14 Siemens Healthcare Gmbh Sparse appearance learning-based segmentation
EP3032495B1 (en) * 2014-12-10 2019-11-13 Dassault Systèmes Texturing a 3d modeled object
EP3330919A1 (en) * 2016-11-30 2018-06-06 Thomson Licensing Method for filling-in missing regions in an image of a multimedia content, corresponding computer program product and apparatus

Non-Patent Citations (6)

* Cited by examiner, † Cited by third party
Title
MARKO FILIPOVIC, 外2名: ""Inpainting color images in learned dictionary"", 2012 PROCEEDINGS OF THE 20TH EUROPEAN SIGNAL PROCESSING CONFERENCE (EUSIPCO), JPN6021040759, 31 August 2012 (2012-08-31), US, pages 66 - 70, XP032254297, ISSN: 0004619103 *
MICHAL AHARON, 外2名: ""K-SVD: An algorithm for designing overcomplete dictionaries for sparse representation"", IEEE TRANSACTIONS ON SIGNAL PROCESSING, vol. 第54巻, 第11号, JPN6021040763, November 2006 (2006-11-01), US, pages 4311 - 4322, ISSN: 0004619107 *
NIKOS KOMODAKIS, 外1名: ""Image Completion Using Efficient Belief Propagation Via Priority Scheduling and Dynamic Pruning"", IEEE TRANSACTIONS ON IMAGE PROCESSING, vol. 第16巻, 第11号, JPN6021040756, 15 October 2007 (2007-10-15), US, pages 2649 - 2661, ISSN: 0004619102 *
TIJANA RUZIC, 外1名: ""Context-Aware Patch-Based Image Inpainting Using Markov Random Field Modeling"", IEEE TRANSACTIONS ON IMAGE PROCESSING, vol. 第24巻, 第1号, JPN6021040760, January 2015 (2015-01-01), US, pages 444 - 456, ISSN: 0004619104 *
山本文香, 外3名: ""事例データに基づく移動物体の抽出"", 電子情報通信学会論文誌, vol. 第J95-D巻, 第8号, JPN6021040762, 1 August 2012 (2012-08-01), JP, pages 1573 - 1584, ISSN: 0004619106 *
河合紀彦: ""画像中の不要物除去のための画像修復"", 画像ラボ, vol. 第25巻, 第2号, JPN6021040761, 10 February 2014 (2014-02-10), JP, pages 42 - 46, ISSN: 0004619105 *

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2022540934A (ja) * 2019-07-15 2022-09-20 リアルシー・(ベイジン)・テクノロジー・カンパニー・リミテッド インテリアデザインのための人工知能システム及び方法
JP7325602B2 (ja) 2019-07-15 2023-08-14 リアルシー・(ベイジン)・テクノロジー・カンパニー・リミテッド インテリアデザインのための人工知能システム及び方法
JP2021025845A (ja) * 2019-08-02 2021-02-22 株式会社島津製作所 変位分布計測装置、変位分布計測方法、及び変位分布計測装置の制御プログラム
JP7238676B2 (ja) 2019-08-02 2023-03-14 株式会社島津製作所 変位分布計測装置、変位分布計測方法、及び変位分布計測装置の制御プログラム

Also Published As

Publication number Publication date
US10621705B2 (en) 2020-04-14
EP3340166A1 (en) 2018-06-27
JP7029283B2 (ja) 2022-03-03
US20180174276A1 (en) 2018-06-21
CN108230268A (zh) 2018-06-29
CN108230268B (zh) 2023-07-18

Similar Documents

Publication Publication Date Title
JP7029283B2 (ja) 画像の補完
Pistilli et al. Learning graph-convolutional representations for point cloud denoising
He et al. Image completion approaches using the statistics of similar patches
US8665267B2 (en) System and method for generating 3D surface patches from unconstrained 3D curves
Wang et al. Surge: Surface regularized geometry estimation from a single image
Osher et al. Level set methods and their applications in image science
US8610706B2 (en) Parallel surface reconstruction
US9245382B2 (en) User-guided surface reconstruction
Nana et al. Automatic reconstruction of beam structures from 3D topology optimization results
JP7294788B2 (ja) 3d配置のタイプに応じた2d画像の分類
Akl et al. A survey of exemplar-based texture synthesis methods
Ping et al. Visual enhancement of single-view 3D point cloud reconstruction
Wei et al. GeoDualCNN: Geometry-supporting dual convolutional neural network for noisy point clouds
Thayyil et al. Local Delaunay-based high fidelity surface reconstruction from 3D point sets
Lalos et al. Signal processing on static and dynamic 3d meshes: Sparse representations and applications
Ma et al. Efficient antialiased edit propagation for images and videos
Wu et al. Optimized synthesis of art patterns and layered textures
Pan et al. Phase-field guided surface reconstruction based on implicit hierarchical B-splines
Sheng et al. Efficient convex optimization-based texture mapping for large-scale 3D scene reconstruction
Dubois et al. Highly Efficient Controlled Hierarchical Data Reduction techniques for Interactive Visualization of Massive Simulation Data.
JP2010128618A (ja) 画像処理装置、画像処理方法
Alotaibi et al. Image completion by structure reconstruction and texture synthesis
Huang et al. Retargeting 3d objects and scenes with a general framework
Bíscaro et al. Comparing efficient data structures to represent geometric models for three-dimensional virtual medical training
US20240212227A1 (en) Methods and systems for optimizing an image generator

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20201113

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20211011

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20211019

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20220112

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20220125

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20220218

R150 Certificate of patent or registration of utility model

Ref document number: 7029283

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150