JP2018129036A - 画像の補完 - Google Patents
画像の補完 Download PDFInfo
- Publication number
- JP2018129036A JP2018129036A JP2017237566A JP2017237566A JP2018129036A JP 2018129036 A JP2018129036 A JP 2018129036A JP 2017237566 A JP2017237566 A JP 2017237566A JP 2017237566 A JP2017237566 A JP 2017237566A JP 2018129036 A JP2018129036 A JP 2018129036A
- Authority
- JP
- Japan
- Prior art keywords
- image
- minimization
- dictionary
- atom
- atoms
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 claims abstract description 135
- 238000009826 distribution Methods 0.000 claims abstract description 25
- 238000011049 filling Methods 0.000 claims abstract description 18
- 230000008569 process Effects 0.000 claims abstract description 12
- 238000004422 calculation algorithm Methods 0.000 claims description 27
- 238000004590 computer program Methods 0.000 claims description 10
- 238000003064 k means clustering Methods 0.000 claims description 6
- 238000003860 storage Methods 0.000 claims description 6
- 238000012360 testing method Methods 0.000 description 14
- 230000006870 function Effects 0.000 description 13
- 238000005457 optimization Methods 0.000 description 13
- 238000012937 correction Methods 0.000 description 12
- 238000013459 approach Methods 0.000 description 10
- 238000000354 decomposition reaction Methods 0.000 description 9
- 239000013598 vector Substances 0.000 description 9
- 230000000295 complement effect Effects 0.000 description 8
- 238000002372 labelling Methods 0.000 description 7
- 238000004519 manufacturing process Methods 0.000 description 7
- 238000013179 statistical model Methods 0.000 description 7
- 238000012545 processing Methods 0.000 description 6
- 230000015572 biosynthetic process Effects 0.000 description 5
- 238000003786 synthesis reaction Methods 0.000 description 5
- 239000011800 void material Substances 0.000 description 5
- 238000004458 analytical method Methods 0.000 description 4
- 238000013461 design Methods 0.000 description 4
- 238000009792 diffusion process Methods 0.000 description 4
- 239000010410 layer Substances 0.000 description 4
- 238000010998 test method Methods 0.000 description 4
- IJJWOSAXNHWBPR-HUBLWGQQSA-N 5-[(3as,4s,6ar)-2-oxo-1,3,3a,4,6,6a-hexahydrothieno[3,4-d]imidazol-4-yl]-n-(6-hydrazinyl-6-oxohexyl)pentanamide Chemical compound N1C(=O)N[C@@H]2[C@H](CCCCC(=O)NCCCCCC(=O)NN)SC[C@@H]21 IJJWOSAXNHWBPR-HUBLWGQQSA-N 0.000 description 3
- 230000008901 benefit Effects 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 230000008439 repair process Effects 0.000 description 3
- 238000005070 sampling Methods 0.000 description 3
- 238000004364 calculation method Methods 0.000 description 2
- 238000011960 computer-aided design Methods 0.000 description 2
- 238000013500 data storage Methods 0.000 description 2
- 238000006073 displacement reaction Methods 0.000 description 2
- 238000002474 experimental method Methods 0.000 description 2
- 230000003993 interaction Effects 0.000 description 2
- 239000011159 matrix material Substances 0.000 description 2
- 239000000203 mixture Substances 0.000 description 2
- 238000010606 normalization Methods 0.000 description 2
- 230000002123 temporal effect Effects 0.000 description 2
- 238000012356 Product development Methods 0.000 description 1
- 230000006399 behavior Effects 0.000 description 1
- 230000008033 biological extinction Effects 0.000 description 1
- 230000003139 buffering effect Effects 0.000 description 1
- 230000015556 catabolic process Effects 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 230000000052 comparative effect Effects 0.000 description 1
- 239000002131 composite material Substances 0.000 description 1
- 238000007906 compression Methods 0.000 description 1
- 230000006835 compression Effects 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 230000008094 contradictory effect Effects 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 238000006731 degradation reaction Methods 0.000 description 1
- 230000009977 dual effect Effects 0.000 description 1
- 239000002355 dual-layer Substances 0.000 description 1
- 239000012530 fluid Substances 0.000 description 1
- 238000009472 formulation Methods 0.000 description 1
- 239000012634 fragment Substances 0.000 description 1
- 230000014509 gene expression Effects 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 238000011551 log transformation method Methods 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 238000007726 management method Methods 0.000 description 1
- 238000002156 mixing Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000002360 preparation method Methods 0.000 description 1
- 230000000644 propagated effect Effects 0.000 description 1
- 230000001902 propagating effect Effects 0.000 description 1
- 238000013138 pruning Methods 0.000 description 1
- 238000011002 quantification Methods 0.000 description 1
- 238000013139 quantization Methods 0.000 description 1
- 230000003252 repetitive effect Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000010845 search algorithm Methods 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 238000000638 solvent extraction Methods 0.000 description 1
- 230000002194 synthesizing effect Effects 0.000 description 1
- 238000012549 training Methods 0.000 description 1
- 230000007704 transition Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T5/00—Image enhancement or restoration
- G06T5/77—Retouching; Inpainting; Scratch removal
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
- G06F18/232—Non-hierarchical techniques
- G06F18/2321—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
- G06F18/23213—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T5/00—Image enhancement or restoration
- G06T5/20—Image enhancement or restoration using local operators
- G06T5/30—Erosion or dilatation, e.g. thinning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T5/00—Image enhancement or restoration
- G06T5/50—Image enhancement or restoration using two or more images, e.g. averaging or subtraction
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/10—Image acquisition modality
- G06T2207/10016—Video; Image sequence
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20016—Hierarchical, coarse-to-fine, multiscale or multiresolution image processing; Pyramid transform
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20072—Graph-based image processing
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- Probability & Statistics with Applications (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- General Engineering & Computer Science (AREA)
- Image Processing (AREA)
- Image Analysis (AREA)
Abstract
Description
A.PDEベースの方法
B.統計ベースの方法
C.標本ベースの方法
PDEベースの方法は、ひび割れ、折り目、アーチファクト、あるいは反射のために穴が形成されることの多い画像を修復するのに初めて導入された。これらの方法では、残された空隙を、空隙の端部から情報を伝搬させることによって充填することを考える。この情報は、画素レベルで解かれる偏微分方程式を用いて伝搬させる。このような方程式には、熱方程式のような伝搬方程式が含まれる。これらの方法では、ディリクレ境界条件を設定したラプラスのPDEを使用するか、異方性拡散処理をシミュレートすることが多い。純粋な拡散法では、ぼけた結果となるが、エッジを保存するように設計されたアルゴリズムもある。
・Bertalmio,Marcelo,Andrea L.Bertozzi, and Guillermo Sapiro.Navier−stokes,fluid dynamics,and image and video inpainting.CVPR.2001
・Chan,Tony F.,and Jianhong Shen.Nontexture inpainting by curvature−driven diffusions.Journal of Visual Communication and Image Representation.2001
・Auroux,Didier,and Mohamed Masmoudi.A one−shot inpainting algorithm based on the topological asymptotic analysis.Computational & Applied Mathematics.2006
・Pietro Perona and Jitendra Malik.Scale−space and edge detection using anisotropic diffusion.IEEE Trans.1990
・Ivars Peterson.Filling in blanks:Automating the restoration of a picture’s missing pieces.Science News.2002
統計ベースの方法は、主に、テクスチャ(すなわち、画像における反復パターン)を合成する場合に用いられる。自然画像の多くは、テクスチャのパッチワークから形成される(例えば、草地にいる人物の写真の場合、草地はテクスチャとして見ることができる)。テクスチャは一見ランダムであり、テクスチャの合成は、目に快い程度のランダムさを達成することを目指す。これらの方法は、2つのステップからなる。
1)学習ステップ:テクスチャが入力されると、本方法では、関連する統計値をコンパクトなパラメトリック統計モデルを用いて抽出することによってそれを記述することを試みる。このコンパクトな統計モデルはウェーブレット係数に基づくことが多く、マルチスケール手法を組み合わせることができる。
2)拡散ステップ:テクスチャは内側に向かって成長し、未知の領域を補完する。統計ベースの方法では、一般に、画像内の構造を見つけることができる画像補完の問題については、画像の構造がランダムではないため失敗する。
・Portilla,Javier,and Eero P.Simoncelli.A parametric texture model based on joint statistics of complex wavelet coefficients.IJCV.2000
・Heeger,David J.,and James R.Bergen.Pyramid−based texture analysis/synthesis.SIGGRAPH.1995
・Li−Yi Wei and Marc Levoy.Fast texture synthesis using tree−structured vector quantization.SIGGRAPH,pages 479−488.2000
C.標本ベースの方法
標本ベースの方法では、既存の画像パッチを用いて残された空隙を埋める。大まかに言えば、これは、画像の区画をコピーして空隙内に貼り付けることからなる。これらのパッチでどのように穴を埋めるかは、選択する方法によって異なる。標本ベースの方法の多くは、次の3つの分類のうちの1つに関連付けることができる。
1)内方拡散法:この最も初期の方法は、空隙を反復的に補完する。論文「Criminisi,Perez,and Toyama.Region filling and object removal by exemplar−based image inpainting.IEEE Transactions on Image Processing. 2004」では、空隙は、外縁から内側に向かって小さなパッチで埋められ、いったん最初の外側の輪が埋められると、空隙が小さかったかのように、アルゴリズムが再開され、空隙が埋まり切るまで繰り返す。別の例を、論文「Xiaowu Chen,Bin Zhou,Fang Xu,and Qinping Zhao.Automatic image completion with structure propagation and texture synthesis.2010」に見つけることができる。残念ながら、これらのアルゴリズムでは、中心部の補完が不可能になるような縁を選択したがために止まってしまうということが多い。
2)マッチングベースの方法:これらの方法は、テクスチャモデルに関連することが多く、パッチ再注入を用いる。これらの方法では、未知の領域のパッチを既知のパッチ(抽出された集合のうち最も近いパッチとされることが多い)で置き換えることによって、現在の充填物の改善を繰り返し試みる。論文「Drori,Iddo,Daniel Cohen−Or,and Hezy Yeshurun.Fragment−based image completion.ACM Transactions on Graphics.2003」では、空隙を1つの画像パッチだけで埋めることができる小さな穴とみなせるような小規模なところから始めて、前の画像からフル解像度まで規模を大きくしていき、前の解像度で作られた充填物にマッチするようなパッチを見つけることによって、空隙を埋める。同様の手法を、論文「Alexei A.Efros and Thomas K.Leung.Texture synthesis by non−parametric sampling.ICCV,pages 1033−1038.1999」および論文「Yonatan Wexler,Eli Shechtman,and Michal Irani.Space−time video completion.CVPR(1),pages 120−127.2004」に見つけることができる。これらの方法にも、重大な欠陥がある。すなわち、繰り返し中に、もし1つのステップが失敗すると、結果が完全にオフになってしまう。よって、画像の幻像部分が空隙中にコピーされ、現実的ではない画像が得られることになる。
3)統計的オフセット解析法:これらの方法では、統計モデルを通じて画像中の主な変位を学習し、この知識を用いて欠損部分を埋める。この種の方法の例は、論文「Kaiming He and Jian Sun.Computing nearest−neighbor fields via propagation−assisted kd−trees.IEEE Conference on Computer Vision and Pattern Recognition.2012」および論文「Kaiming He and Jian Sun.Statistics of patch offsets for image completion.Computer Vision−ECCV.2012」に見つけることができる。これらの方法は、画像が構造的な規則性を含む場合には正常に機能するが(例えば建築物の画像など)、一般的な画像では大きく失敗することが多い。
・各ラベルは、好ましくは500個未満、200個未満、150個未満、あるいは100個未満の値を含む値の有限集合のうちの値をとる;
・前記処理は、前記少なくとも1回の最小化の結果を用いて初期化され、かつ、前記画像の既知の部分から抽出したパッチに基づく、マッチングベースのアルゴリズムを含む;
・前記決定では、トップダウン手法を実施する。
・エネルギーの前記少なくとも1回の最小化は、第1の最小化であって、当該第1の最小化についての前記マルコフ確率場の各ラベルがアトムの辞書における値をとるような、第1の最小化と、次いで、第2の最小化であって、当該第2の最小化についての前記マルコフ確率場の各ラベルが所定の係数の集合における値をとるような、第2の最小化とを含む;
・前記所定の係数の集合は、前記画像の既知の部分のパッチを生成するための前記アトムに適用される係数の集合のK平均クラスタリングに由来する;
・前記第1の最小化についてのエネルギーは、測光歪みおよび/または統計的歪みにペナルティを課し、かつ/あるいは、前記第2の最小化についてのエネルギーは、測光歪みおよび/または統計的歪みにペナルティを課す;
・前記第1の最小化は、前記穴の縁に合致しない程度についてさらにペナルティを課す;
・本方法はさらに、次いで、第3の最小化であって、当該第3の最小化についての前記マルコフ確率場の各ラベルが前記アトムの辞書における値をとるような、第3の最小化と、次いで、第4の最小化であって、当該第4の最小化についての前記マルコフ確率場の各ラベルが前記所定の係数の集合における値をとるような、第4の最小化とを含む;
・前記第3の最小化についてのエネルギーは、統計的歪みにペナルティを課し、かつ/あるいは、前記第4の最小化についてのエネルギーは、統計的歪みにペナルティを課す;
・前記画像はビデオのフレームである;かつ/あるいは、
・前記ビデオはさらに、前記画像の前に1つまたは複数の他の画像を含み、前記方法はさらに、前記1つまたは複数の他の画像に基づき前記アトムの辞書を決定することを含む。
以下、非限定的な例として、本発明の実施の形態を添付の図面を参照しつつ説明する。
・画像の既知の部分における規則的な場所で抽出されたパッチ;
・画像の既知の部分における関心のある場所で抽出されたパッチ(例えば、Harrisの検出器を含む、そのような関心のある場所についての1つまたは複数の検出器を使用する);
・画像の既知の部分に対して操作した統計モデルから抽出されたパッチ(例えば、画像が異なるテクスチャをわずかしか含まない場合);および/または
・画像の既知の部分から抽出されたパッチの密な集合。
1.
2.
3.(
・K平均クラスタリングの結果として得られるパッチの集合;
・階層的K平均クラスタリングの結果として得られるパッチの集合;
・K−SVDアルゴリズムの結果として得られるパッチの集合;
・アーキタイプ分析(Archetypal Analysis)の結果として得られるパッチの集合(例えば論文「A.Cutler and L.Breiman.Archetypal analysis.Technometrics,36(4):338−347,1994」に開示);および/または、
・フーリエ分解の結果として得られるパッチの集合。
・基礎をなす無向グラフ(V,E)に関して、V=(v1,・・・,vn)はグラフの頂点の集合であり、各ノードviは変数Viに対応し、Eは、グラフの双方向エッジの集合である。
・各変数Viは、ラベルの有限集合{1,・・・,Li}における値のみをとることができる。
・同時確率p(V1=l1,・・・,Vn=ln)は、以下のように書き表すことができる。
・J.Kappes et al,A Comparative Study of Modern Inference Techniques for Discrete Minimization Problems, in CVPR 2013。
・Convex Relaxation MRF解法(例えばLinear Programming(Schlesinger 1976),Semidefinite Programming(Lasserre 2000)、あるいはSecond−Order Cone Programming(Muramatsu and Suzuki,2003))。
LinearProgrammingRelaxationMRF解法の二重化(例えばTree Reweighted Message Passing,Dual Decomposition)。
・Graph Cut MRF解法 (例えばAlpha Expansion,Alpha−Beta Swap,FastPD)。
・Belief Propagation MRF解法(例えばLoopy Belief Propagation,Generalized Belief Propagation)。
・空隙上に定義されたグラフの各ノードについて、線形結合が行われるアトムのリストを知ることができるようなグラフベースの手法を用いて、辞書のアトムの選択を全体的に解決する。アトムの選択は、画像の既知の部分から未知の部分へと、構造とテクスチャが保存されるような方法で行われる。
・係数の選択を全体的に解決する:アトムのリストが与えられたとき、グラフ内の各ノードについて、グラフ内のノード間が滑らかに遷移するように、線形結合の係数を調整する。
1)第1ステップ:(2層の)辞書の学習(S10)
まず初めに、画像の既知の部分から、パッチの大きな集合を抽出した。次に、S10に関して、それらパッチについてK−SVDアルゴリズムを用いて辞書Drootの学習を行った。ここで、分解は1のサイズでなければならない(考慮したすべての画像についてDrootは50〜150個のアトムを用いる)。同様の手法を用いて、アトムdkを用いた分解で残った残余パッチに基づいて、Drootの各アトムdkについて、(5個程度のアトムを用いて)辞書
2)第2ステップ:グリッドグラフの構築(S20の開始)
グラフは、ノード同士が規則的に離間してグリッドを定義するように、欠落領域上に構築される。隣接する2つのノード間のスペースは、例えば、パッチのサイズの半分(例えば、パッチのサイズが8×8の場合、隣接する2つのノード間のスペースは4画素)とすることができる。そして、各ノードは、例えば四連結を用いて近傍ノードに接続される。
3)第3ステップ:分解の算出(S20の終了)
このステップでは、グリッドグラフの各ノードに、4つのパラメータ、すなわち、Drootのアトムdk、このルートアトムの係数、
a.第1ステップでは、マルチスケール手法を用いて、ルートアトムのみの最適化を試みる。
b.第2ステップは、それらのルートアトムの係数を取得することからなる。
c.第3ステップは、各位置において補正アトムを見つけることを目的とする。
d.最後に、第4ステップでは、これらの補正アトムの係数を算出する。
a)ルートアトムの選択:
この第1ステップは、ルートアトムを有するノードのラベル付けを見つけることを目的とする。大まかに言えば、このステップは「粗い」解決策を見つけることからなる。大きな幅(幅とは、2つの隣接するノード間の距離を意味する)についての解を最初に算出し、幅がより小さくなるように繰り返す。このマルチスケール手法は、主に、演算時間を短縮するために実行される。演算時間は、直接的に小さな幅を扱うMRF最適化における最適化と比較して、結果の質について大きな犠牲を払うことなく、典型的には5分の1であることが経験上示されている。
・縁の基準(ユナリ・コスト):穴の縁上のラベルを既知の部分と一致させるユナリ・コスト関数を設計できる。アトムが係数を持たないため、縁に合致し得る最良の係数を用いてコストを構築する(これは幾分楽観的である)。
・測光基準(バイナリ・コスト):係数を持たないアトムを扱う場合も、2つのアトムの一定の重複領域が得られるような所与のオフセットを基準とした比較方法を確立することができる。重複領域上のアトムのコサイン類似度の逆数を測光エネルギーを得るためのバイナリ・コストとして用いた。
・統計的オフセット基準(バイナリ・コスト):さらに、画像中のアトムの発生率の再分割が、幾つかの空間的性質を有することを見出した。この知識をエネルギー関数に組み入れるために、アトムのラベルl1、l2の各対と各オフセットd(ここでは、四連結に対応するものと八連結に対応するもののうちいずれかを使用する)について、以下に比例する対称コストを算出する:−log(p1×p2)、ここでp1は、画像の既知の部分における、ルートアトムl1からの変位dに位置する探索ルートアトムl2の相対的頻度として算出され、p2は対称的に定義される。より正確には、Occ(l1)とOcc(l2)が画像の既知の部分におけるこれらのルートアトムの発生率を表し、Occd(l1,l2)がオフセットdに基づく既知の領域における対(l1,l2)の発生率を表すとすると、p1=Occd(l1,l2)/Occ(l1)となり、またp2=Occd(l1,l2)/Occ(l2)となる。
b)ルートアトム係数の最適化:
係数は連続的であるため、アトムごとに約20個の可能な係数を有するようにそれらを定量化することを選択した。これらの値は、それぞれ、新しいMRFのラベルに対応し、ラベル付けはルートアトムの係数に対する結合選択に対応する。実験により、与えられたアトムに用いられた係数の集合は一様に分布せず、クラスタを形成することがわかった。したがって、量子化ステップを選択するために、K平均クラスタリングを用いることを考えた。最初の組み合わせステップについては、測光の部分と統計モデルの両方を組み込んだエネルギーを設計した。
c)係数アトム選択
この第3のステップは、各ノードについて、使用される補正アトムを見つけることからなる。すでにルートアトムを選択しているため、各ノードについて可能性のある少数のなかから選択するだけでよい(典型的には、この3番目の最適化では、各ノードは5個程度の異なるラベルを取ることができる)。
d)補正アトム係数の最適化:
この最適化ステップの最後のステップは、測光コストを用いて係数を見つけるだけであるため、最も簡単なステップである(各ノードについて、ルートアトムとその係数、および選択した補正アトムを既に知っているため)。この演算はまた、モデルを学習する必要がないため、非常に高速である。
4)第4ステップ:仕上げ
結果をより良く仕上げるために、マッチングベースのアルゴリズムを実装した。このアルゴリズムは反復的であり、初期化が良好に行われることを前提としている(この場合、初期化は、前の4つのMRF最適化の結果である)。各繰り返しにおいて、再構築された領域におけるいくつかのパッチの集合Sを選択し、それらを既知の領域から抽出したパッチの集合のうちの最も近いパッチで置き換える。集合Sは互いに重なり合う多数のパッチを含み得るため、異なるパッチに存在する画素の最終的な値を、平均値を処理して得る必要がある。
・妥当な結果:結果画像は、たとえ細部が矛盾しているように見えても、人間にとっては自然に見えた。
・堅牢なアルゴリズム:アルゴリズムが誤った判断で止まってしまうことがなく、異なる種類の画像(自然画像、内装画像、深度マップ画像、さらには人工画像)について機能した。
・リアルタイムに近い演算(例えば、3秒未満)。これにより、ユーザは、画像内のオブジェクトをインタラクティブに除去または置換することができる。
Claims (15)
- 少なくとも1つの穴を有する画像を補完するための、コンピュータにより実施される方法であって、
前記画像における既知の部分を表すアトムの辞書を提供すること(S10)と、
ノードおよびラベルを有するマルコフ確率場上に定義されたエネルギーの少なくとも1回の最小化(S22〜S28)を含む処理を用いてアトムの線形結合の最適な分布を決定することであって、各ノードは前記穴の各位置に対応し各ラベルに関連付けられるような、決定すること(S20)と、
前記最適な分布で前記穴を埋めること(S30)と
を含むことを特徴とする方法。 - 各ラベルは、好ましくは500個未満、200個未満、150個未満、あるいは100個未満の値を含む値の有限集合のうちの値をとる
ことを特徴とする請求項1に記載の方法。 - 前記処理は、前記少なくとも1回の最小化の結果を用いて初期化され、かつ、前記画像の既知の部分から抽出したパッチに基づく、マッチングベースのアルゴリズムを含む
ことを特徴とする請求項1または2に記載の方法。 - 前記決定(S20)ではトップダウン手法を実施する
ことを特徴とする請求項1〜3のいずれかに記載の方法。 - エネルギーの前記少なくとも1回の最小化は、
第1の最小化であって、当該第1の最小化についての前記マルコフ確率場の各ラベルがアトムの辞書における値をとるような、第1の最小化(S22)と、次いで、
第2の最小化であって、当該第2の最小化についての前記マルコフ確率場の各ラベルが所定の係数の集合における値をとるような、第2の最小化(S24)と、 を含むことを特徴とする請求項4に記載の方法。 - 前記所定の係数の集合は、前記画像の既知の部分のパッチを生成するための前記アトムに適用される係数の集合のK平均クラスタリングに由来する
ことを特徴とする請求項5に記載の方法。 - 前記第1の最小化についてのエネルギーは、測光歪みおよび/または統計的歪みにペナルティを課し、かつ/あるいは、前記第2の最小化についてのエネルギーは、測光歪みおよび/または統計的歪みにペナルティを課す
ことを特徴とする請求項5または6に記載の方法。 - 前記第1の最小化は、前記穴の縁に合致しない程度についてさらにペナルティを課す
ことを特徴とする請求項7に記載の方法。 - 第3の最小化であって、当該第3の最小化についての前記マルコフ確率場の各ラベルが前記アトムの辞書における値をとるような、第3の最小化(S26)と、次いで、
第4の最小化であって、当該第4の最小化についての前記マルコフ確率場の各ラベルが前記所定の係数の集合における値をとるような、第4の最小化(S28)と、
を次いでさらに含むことを特徴とする請求項5〜8のいずれかに記載の方法。 - 前記第3の最小化についてのエネルギーは、統計的歪みにペナルティを課し、かつ/あるいは、前記第4の最小化についてのエネルギーは、統計的歪みにペナルティを課す
ことを特徴とする請求項9に記載の方法。 - 前記画像はビデオのフレームである
ことを特徴とする請求項1〜10のいずれかに記載の方法。 - 前記ビデオはさらに、前記画像の前に1つまたは複数の他の画像を含み、前記方法はさらに、前記1つまたは複数の他の画像に基づき前記アトムの辞書を決定することを含む
ことを特徴とする請求項11に記載の方法。 - 請求項1〜12のいずれかに記載の方法を実行するための命令を含むコンピュータプログラム。
- 請求項13に記載のコンピュータプログラムを記録したコンピュータ読み取り可能記憶媒体。
- 請求項13に記載のコンピュータプログラムを記録したメモリに接続されたプロセッサと、グラフィカル・ユーザ・インターフェースとを備えるシステム。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EP16306754.9 | 2016-12-21 | ||
EP16306754.9A EP3340166A1 (en) | 2016-12-21 | 2016-12-21 | Completing an image |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2018129036A true JP2018129036A (ja) | 2018-08-16 |
JP7029283B2 JP7029283B2 (ja) | 2022-03-03 |
Family
ID=57799509
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2017237566A Active JP7029283B2 (ja) | 2016-12-21 | 2017-12-12 | 画像の補完 |
Country Status (4)
Country | Link |
---|---|
US (1) | US10621705B2 (ja) |
EP (1) | EP3340166A1 (ja) |
JP (1) | JP7029283B2 (ja) |
CN (1) | CN108230268B (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2021025845A (ja) * | 2019-08-02 | 2021-02-22 | 株式会社島津製作所 | 変位分布計測装置、変位分布計測方法、及び変位分布計測装置の制御プログラム |
JP2022540934A (ja) * | 2019-07-15 | 2022-09-20 | リアルシー・(ベイジン)・テクノロジー・カンパニー・リミテッド | インテリアデザインのための人工知能システム及び方法 |
Families Citing this family (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10699453B2 (en) * | 2017-08-17 | 2020-06-30 | Adobe Inc. | Digital media environment for style-aware patching in a digital image |
US10672164B2 (en) | 2017-10-16 | 2020-06-02 | Adobe Inc. | Predicting patch displacement maps using a neural network |
US10614557B2 (en) | 2017-10-16 | 2020-04-07 | Adobe Inc. | Digital image completion using deep learning |
US10755391B2 (en) | 2018-05-15 | 2020-08-25 | Adobe Inc. | Digital image completion by learning generation and patch matching jointly |
CN109409388B (zh) * | 2018-11-07 | 2021-08-27 | 安徽师范大学 | 一种基于图形基元的双模深度学习描述子构造方法 |
CN111239724B (zh) * | 2020-01-20 | 2022-01-28 | 中国人民解放军国防科技大学 | 一种基于雷达传感网络的目标识别方法 |
CN113327190A (zh) | 2020-02-28 | 2021-08-31 | 阿里巴巴集团控股有限公司 | 图像、数据处理的方法和装置 |
CN113284072A (zh) * | 2021-06-30 | 2021-08-20 | 北京师范大学珠海校区 | 一种图像的增强方法 |
KR102551097B1 (ko) * | 2021-10-08 | 2023-07-04 | 주식회사 쓰리아이 | 3차원 가상모델 제공을 위한 홀 필링 방법 및 그를 위한 컴퓨팅 장치 |
CN114299076B (zh) * | 2021-11-10 | 2023-09-19 | 西北大学 | 基于离散小波分解的深度图像空洞填充方法及装置 |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8718340B2 (en) * | 2008-09-03 | 2014-05-06 | Trustees Of The University Of Pennsylvania | System and method for accurate and rapid identification of diseased regions on biological images with applications to disease diagnosis and prognosis |
CN102682477B (zh) * | 2012-05-16 | 2015-04-08 | 南京邮电大学 | 一种基于结构先验的规则场景三维信息提取方法 |
EP2747427B1 (en) * | 2012-12-21 | 2016-03-16 | imcube labs GmbH | Method, apparatus and computer program usable in synthesizing a stereoscopic image |
US9594976B2 (en) * | 2014-02-18 | 2017-03-14 | Siemens Healthcare Gmbh | Sparse appearance learning-based segmentation |
EP3032495B1 (en) * | 2014-12-10 | 2019-11-13 | Dassault Systèmes | Texturing a 3d modeled object |
EP3330919A1 (en) * | 2016-11-30 | 2018-06-06 | Thomson Licensing | Method for filling-in missing regions in an image of a multimedia content, corresponding computer program product and apparatus |
-
2016
- 2016-12-21 EP EP16306754.9A patent/EP3340166A1/en active Pending
-
2017
- 2017-12-12 JP JP2017237566A patent/JP7029283B2/ja active Active
- 2017-12-14 US US15/841,837 patent/US10621705B2/en active Active
- 2017-12-21 CN CN201711391028.2A patent/CN108230268B/zh active Active
Non-Patent Citations (6)
Title |
---|
MARKO FILIPOVIC, 外2名: ""Inpainting color images in learned dictionary"", 2012 PROCEEDINGS OF THE 20TH EUROPEAN SIGNAL PROCESSING CONFERENCE (EUSIPCO), JPN6021040759, 31 August 2012 (2012-08-31), US, pages 66 - 70, XP032254297, ISSN: 0004619103 * |
MICHAL AHARON, 外2名: ""K-SVD: An algorithm for designing overcomplete dictionaries for sparse representation"", IEEE TRANSACTIONS ON SIGNAL PROCESSING, vol. 第54巻, 第11号, JPN6021040763, November 2006 (2006-11-01), US, pages 4311 - 4322, ISSN: 0004619107 * |
NIKOS KOMODAKIS, 外1名: ""Image Completion Using Efficient Belief Propagation Via Priority Scheduling and Dynamic Pruning"", IEEE TRANSACTIONS ON IMAGE PROCESSING, vol. 第16巻, 第11号, JPN6021040756, 15 October 2007 (2007-10-15), US, pages 2649 - 2661, ISSN: 0004619102 * |
TIJANA RUZIC, 外1名: ""Context-Aware Patch-Based Image Inpainting Using Markov Random Field Modeling"", IEEE TRANSACTIONS ON IMAGE PROCESSING, vol. 第24巻, 第1号, JPN6021040760, January 2015 (2015-01-01), US, pages 444 - 456, ISSN: 0004619104 * |
山本文香, 外3名: ""事例データに基づく移動物体の抽出"", 電子情報通信学会論文誌, vol. 第J95-D巻, 第8号, JPN6021040762, 1 August 2012 (2012-08-01), JP, pages 1573 - 1584, ISSN: 0004619106 * |
河合紀彦: ""画像中の不要物除去のための画像修復"", 画像ラボ, vol. 第25巻, 第2号, JPN6021040761, 10 February 2014 (2014-02-10), JP, pages 42 - 46, ISSN: 0004619105 * |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2022540934A (ja) * | 2019-07-15 | 2022-09-20 | リアルシー・(ベイジン)・テクノロジー・カンパニー・リミテッド | インテリアデザインのための人工知能システム及び方法 |
JP7325602B2 (ja) | 2019-07-15 | 2023-08-14 | リアルシー・(ベイジン)・テクノロジー・カンパニー・リミテッド | インテリアデザインのための人工知能システム及び方法 |
JP2021025845A (ja) * | 2019-08-02 | 2021-02-22 | 株式会社島津製作所 | 変位分布計測装置、変位分布計測方法、及び変位分布計測装置の制御プログラム |
JP7238676B2 (ja) | 2019-08-02 | 2023-03-14 | 株式会社島津製作所 | 変位分布計測装置、変位分布計測方法、及び変位分布計測装置の制御プログラム |
Also Published As
Publication number | Publication date |
---|---|
US10621705B2 (en) | 2020-04-14 |
EP3340166A1 (en) | 2018-06-27 |
JP7029283B2 (ja) | 2022-03-03 |
US20180174276A1 (en) | 2018-06-21 |
CN108230268A (zh) | 2018-06-29 |
CN108230268B (zh) | 2023-07-18 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7029283B2 (ja) | 画像の補完 | |
Pistilli et al. | Learning graph-convolutional representations for point cloud denoising | |
He et al. | Image completion approaches using the statistics of similar patches | |
US8665267B2 (en) | System and method for generating 3D surface patches from unconstrained 3D curves | |
Wang et al. | Surge: Surface regularized geometry estimation from a single image | |
Osher et al. | Level set methods and their applications in image science | |
US8610706B2 (en) | Parallel surface reconstruction | |
US9245382B2 (en) | User-guided surface reconstruction | |
Nana et al. | Automatic reconstruction of beam structures from 3D topology optimization results | |
JP7294788B2 (ja) | 3d配置のタイプに応じた2d画像の分類 | |
Akl et al. | A survey of exemplar-based texture synthesis methods | |
Ping et al. | Visual enhancement of single-view 3D point cloud reconstruction | |
Wei et al. | GeoDualCNN: Geometry-supporting dual convolutional neural network for noisy point clouds | |
Thayyil et al. | Local Delaunay-based high fidelity surface reconstruction from 3D point sets | |
Lalos et al. | Signal processing on static and dynamic 3d meshes: Sparse representations and applications | |
Ma et al. | Efficient antialiased edit propagation for images and videos | |
Wu et al. | Optimized synthesis of art patterns and layered textures | |
Pan et al. | Phase-field guided surface reconstruction based on implicit hierarchical B-splines | |
Sheng et al. | Efficient convex optimization-based texture mapping for large-scale 3D scene reconstruction | |
Dubois et al. | Highly Efficient Controlled Hierarchical Data Reduction techniques for Interactive Visualization of Massive Simulation Data. | |
JP2010128618A (ja) | 画像処理装置、画像処理方法 | |
Alotaibi et al. | Image completion by structure reconstruction and texture synthesis | |
Huang et al. | Retargeting 3d objects and scenes with a general framework | |
Bíscaro et al. | Comparing efficient data structures to represent geometric models for three-dimensional virtual medical training | |
US20240212227A1 (en) | Methods and systems for optimizing an image generator |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20201113 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20211011 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20211019 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20220112 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20220125 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20220218 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7029283 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |