JP2004178592A - 画像の幾何学的に変換されたコピーを検出する方法及びシステム - Google Patents

画像の幾何学的に変換されたコピーを検出する方法及びシステム Download PDF

Info

Publication number
JP2004178592A
JP2004178592A JP2003392857A JP2003392857A JP2004178592A JP 2004178592 A JP2004178592 A JP 2004178592A JP 2003392857 A JP2003392857 A JP 2003392857A JP 2003392857 A JP2003392857 A JP 2003392857A JP 2004178592 A JP2004178592 A JP 2004178592A
Authority
JP
Japan
Prior art keywords
image
digital image
interest
points
images
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2003392857A
Other languages
English (en)
Inventor
Peter O Stubler
オー スタブラー ピーター
Nathan D Cahill
ディー キャヒル ネイザン
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Eastman Kodak Co
Original Assignee
Eastman Kodak Co
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Eastman Kodak Co filed Critical Eastman Kodak Co
Publication of JP2004178592A publication Critical patent/JP2004178592A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T3/00Geometric image transformations in the plane of the image
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/58Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/583Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
    • G06F16/5854Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using shape and object relationship
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/30Determination of transform parameters for the alignment of images, i.e. image registration
    • G06T7/33Determination of transform parameters for the alignment of images, i.e. image registration using feature-based methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/70Determining position or orientation of objects or cameras
    • G06T7/73Determining position or orientation of objects or cameras using feature-based methods
    • G06T7/74Determining position or orientation of objects or cameras using feature-based methods involving reference images or patches
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/74Image or video pattern matching; Proximity measures in feature spaces
    • G06V10/75Organisation of the matching processes, e.g. simultaneous or sequential comparisons of image or video features; Coarse-fine approaches, e.g. multi-scale approaches; using context analysis; Selection of dictionaries
    • G06V10/757Matching configurations of points or features

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Databases & Information Systems (AREA)
  • Library & Information Science (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Software Systems (AREA)
  • Computing Systems (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • Multimedia (AREA)
  • Medical Informatics (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • Image Analysis (AREA)
  • Image Processing (AREA)
  • Editing Of Facsimile Originals (AREA)
  • Facsimile Image Signal Circuits (AREA)

Abstract

【課題】 本発明の目的は、他の画像の少なくとも一部分の画像からの内容の幾何学的に変換されたコピーを検出することである。
【解決手段】 第1と第2のディジタル画像を供給し、各画像内の関心のオブジェクトを検索し、画像内の対応するオブジェクトの組を識別し、各オブジェクト上の特徴点の位置
を特定し、第1の画像内の特徴点と、第2の画像内の対応する特徴点の一致するものを見つけ、各画像についての対応する点の組を発生し、第1の画像の対応する点の組を、第2の画像の対応する点の組へマップする幾何学的変換のパラメータを決定し、決定した幾何学的変換のパラメータに従い第1の画像を変換し、変換された第1の画像と第2の画像の内容の間の類似の領域を検出し、第2の画像が第1の画像の領域の幾何学的に変換されたコピーである領域を含むかを決定する、画像の少なくとも一部分の内容の幾何学的に変換されたコピーを検出する方法である。
【選択図】 図1

Description

本発明は、一般的にはディジタル画像処理の分野に関連し、特に、画像の幾何学的に変換されたコピーを検出することに関連する。
ディジタル画像コレクションの数とサイズは、民生及び商業領域の両方で急速に成長している。ディジタル画像の、共有、販売、及び他の配布は、しばしば、データベース内に実質的に同様な画像が既に含まれているコレクション又はデータベースへ、導入される。これらの同様な画像は、貴重な記憶資源を消費しそして、コレクションへ重要な価値を付加することなしにコレクションの管理を複雑にする。商用のデータベースについては、冗長画像の存在は、これらの資産の商品性に悪影響を及ぼす。冗長画像を識別しそして選択的にコレクションからそれらを取り除くことにより、画像データベース内のこの冗長性を制御する必要がある。
更に加えて、画像の捕捉と再使用の相対的な容易さは、画像資産の所有者が、それらの画像の許可されていない再使用を検出することを困難にする。そのような所有者は、それらの画像資産内に、視覚的に知覚されないディジタルウォータマークを埋め込むことができる。他の画像内の資産の部分の許可されていない再使用は、ウォータマークされた部分から情報を抽出することを困難にする。画像のコピーされた部分の識別は、ウォータマークの回復の可能性を改善できる。このように、それらの資産の全て又は一部の許可されていない再使用の検出で助けとなる必要がある。
複製又は実質的に同様な画像の検出は、全体的な画像分析により実行される。この例は、Jain他の特許文献1及びDoermannの非特許文献1により使用されている方法がある。JainとDoermannは、各画像から描写の特徴を抽出し、そして、画像データベースへの画像の挿入を制御するために、そのような特徴を使用する。これらの方法は、それらのオリジナルから実質的に異ならないコピーの検出に適用可能である。それらは、オリジナル画像の一部のみを複写するコピーを検出するのに失敗し得る。
指紋分析も画像の一致を扱うが、しかし、目標は、複製画像又は画像部分を見つけることから実質的に異なる。この領域では、問題は、2つの画像又はその部分が共通の画像のオリジン(起源)を共有するかどうかではなく、むしろ、2つの別個の画像が同じ指により作られたかである。確かに、典型的には、2つの画像が明確に異なるオリジンを有する印象であることは、先験的に知られている。
指紋分析技術は、部分的な指紋、画像歪み、及び多数の向きに適応しなければならない。特許文献2では、Monden他は、各指紋の関心の多くの点を選択する。それらは、1つの点が各画像から来るように、同様な点のペアを構成する。そしてそれらは、これら点のペアが最も整列する仮定の幾何学変換を構築するために、点のこれらのペアの間の位置関係を分析する。変換に従わないペアは、捨てられ、そして、残りのペアの付近で抽出された局所的な特徴は、2つの指紋の間の比較の基礎として使用される。
対応する点の検索は、画像領域の先験的な知識により簡単になされる。指紋は、規模が大きく変わらず、そして、指紋一致は、指紋パターンの実質的な部分を含む画像に試行される。画像の類似性の最終的な分析は、注目の各点を囲む局所的な特徴に基づいており、選択された点を越えて何の情報も発生されない。
Forstnerは、非特許文献2で、画像一致を説明している。この説明では、各画像の特徴点が選択されそして組にされ、そして、空間マッピング関数が、ロバスト推定法を使用して決定される。最終ステップで、結果は受け入れられる対応する点をわたり評価される。
指紋一致及びForstnerにより説明された方法は、それらが有している意味上の重要性に関係無く、注目の点が選択されそして局所的な特徴に基づいて組にされる、画像の組と取り組む。しばしば、画像は、意味上の重要性を有する画像内のオブジェクトの数と比較して、多くの数の関心の点を含む。これらのアルゴリズムは、画像内の意味上のオブジェクトに頼らないので、それらは、少ない数の意味上のオブジェクトの一致に頼るアルゴリズムよりも、2つの画像を強く一致させる多くの量の計算労力を必要としがちである。更に、一旦、対応関数が決定されると、指紋一致法とForstnerにより説明された方法のいずれも、この関係が有効である領域の範囲を定めようとしない。従って、説明されたどの方法も、新たな画像を形成するためにコピーされうる又は他の画像と結合されうる画像又は画像部分の識別と取り組まない。このように、他の画像の幾何学的に変換された部分でありうる画像の部分を検出し且つ識別する必要が存在する。
幾何学的変換は、画像内の点と変換された相対物の間の空間的な対応を確立する、マッピング関数である。多くの異なる形式のマッピング関数が、画像処理の種々の領域で使用される。例えば、画像のリサイジング(大きさを変更する)は、異なる画素寸法と明らかな解像度を有する画像を生成するために、オリジナル画像の水平と垂直のスケーリングとして考えられる。画像の回転は、典型的には、画像捕捉中のカメラの僅かの回転のずれを補償するのに又は、肖像(風景)画像を風景(肖像)画モードで記憶するために、実行される。画像移動は、典型的には、画像捕捉中のカメラの僅かな移動のずれを補償する又は、画像の関心の領域を中心にする、画像座標の水平及び垂直移動である。アフィン又は透視変換は、典型的には、平行であるべき又は、ある方向へ支配的に向けられた、画像内のエッジ又は線を修正するために画像に適用される。バイリニア、多項式、局所多項式及びスプラインモデルは、典型的には、レンズ歪み又は収差のような、画像内の更に複雑な現象をモデル化するのに使用される。ある場合には、マッピング機能は、画像の全体の領域をわたって定義されないが、しかし、画像クロッピングのような、むしろ関心の領域をわたってのみ定義される。画像クロッピングでは、関心の領域は、オリジナル画像内で選択されそして、関心の領域外の画像データは消去される。多くの場合には、幾何学的変換は、複数のマッピング関数の合成である考えられる。例えば、典型的な画像化動作は、オリジナル画像をクロップ又はリサイズする(大きさを変更する)ことであり、それにより、関心のオブジェクトが、中心にされそして、”ズームイン”される。画像の幾何学的変換に関する更なる一般的な情報は、非特許文献12を参照する。
同じコレクション又はデータベース内の他の画像の幾何学的変換版であるコレクション又はデータベース内の画像は、親画像に既に含まれていない情報をなにも加えない。従って、これらの幾何学的にに変換された画像は、大きな記憶空間を占有するが、しかし、情報的な価値をなにも加えない。
他の画像の幾何学的変換版である画像を識別する明白な自動の方法は、変換のパラメータの組合せの種々の値で、2つの画像の内容を比較することであろう。この解決方法は、画像リサイジングのような単純な場合でさえも、2つの画像を比較するために実質的に無限の数の可能な相対的なスケールの組み合わせのために、計算的に手に負えない。他の形式の幾何学的変換は、更に多くの程度の自由度を必要とし、それにより、更に計算的な要求は増加する。従って、1つの部分が他の幾何学的変換版であるかどうかを決定するために、2つの画像を自動的且つ効率的にテストする方法についての技術的な要求がある。
更に加えて、しばしば、幾何学的に変換された画像は、小さなカラー補正も受ける。これらの場合には、カラー補正を和らげる許容値で同様な内容関係を検出することが望ましい。
米国特許番号5,911,139号 米国特許番号6,094,507号 "The Detection of Duplicates in Document Image Database"、by David Doermann,Huiping Li, Omid Kia,and Kemal Kilic.Proceedings of the International Conference on Document Analysis and Recognition,1997. "Image Matching"by Robert M.Haralick and Linda G.Shapiro.Computer and Robot Vision,VolumeII,Chapter16.5,Addison Wesley,1993. "A Robust Technique for Matching Two Uncalibrated Images Through the Recovery of the Unknown Epipolar Geometry" by Zhengyou Zhang,Richard Dreriche,Oliver Faugeras,Quang−Tuan Luong.INRIA Research Report No.2273,May 1994. "A Direct Method for Stereo Correspondence based on Singular Value Decomposition"by Maurizio Pilu.Proc.CVPR,pp.261−266,1997. "The Elements of Integration and Lebesgue measure"by R.Bartle.John Wiley & Sons,1995、pp.52−64. "Digital Image Processing"by Rafael C.Gonzalez and Richard E.Woods.Addison−Wesley、1992.pp.185−187,518−548. "Detecting Faces In Images:A Survey"by Ming−Hsuan Yang,David Kriegman,Narendra Ahuja.IEEE Trans.Pattern Analysis and Machine Intelligence,Vol.24,No.1,pp.34−58,2002. "Face Recognition:A Literature Survay"by W.Zhao,R.Chellappa,A.Rosenfeld,and P.J.Phillips.University of Maryland, Center for Automation Research Technical Reprot,CAR−TR−948、2000. "An Automatic Facial Feature Finding System for Portrait Images"by Mark R.Bolin and Shoupu Chen.Proceedings of the 55th Annual Conference of the Society for Imaging Science and Technology(PICTS2002),pp.266−231. "Digital Image Processing"by William K.Pratt.Second Edition. John Wiley & Sons,1991、pp.112−117. "Eigenfaces for Recognition"by Matthew Turk and Alex Pentland.Journal of Cognitive Neuroscience,Volume3,Number1,1991,pp.71−86. "Digital Image Warping"、G.Wolberg,IEEEComputer Society Press,1990.
本発明の目的は、他の画像の少なくとも一部分の1つの画像からの内容の幾何学的に変換されたコピーを検出することである。
本発明の更なる目的は、2つの画像の同様な領域の空間的な範囲を識別することである。
本発明は、上述の1つ又はそれ以上の問題の組みを解決することに向けられている。本発明は、画像の少なくとも一部分の内容の幾何学的に変換されたコピーを検出する方法であって、(a)第1と第2のディジタル画像を供給するステップを有し、;(b)各ディジタル画像内の関心のオブジェクトを検索するステップを有し、;(c)ディジタル画像内の対応する関心のオブジェクトの組を識別するステップを有し、対応する関心のオブジェクトの各組は、第1のディジタル画像内の位置を特定された関心のオブジェクトと、第1の画像内の位置を特定された関心のオブジェクトに対応する、第2のディジタル画像内の対応する位置を特定された関心のオブジェクトを有し、;(d)各ディジタル画像内の各位置を特定された関心のオブジェクト上の特徴点の位置を特定するステップを有し、;(e)第1のディジタル画像内の位置を特定された関心のオブジェクト上の特徴点と、第2のディジタル画像内の対応する関心のオブジェクト上の特徴点の一致するものを見つけ、それにより、各画像についての対応する点の組を発生するステップを有し、;(f)第1のディジタル画像の対応する点の組を、第2のディジタル画像の対応する点の組へマップする幾何学的変換のパラメータを決定するステップを有し、;(g)ステップ(f)で決定した幾何学的変換のパラメータに従って第1のディジタル画像を変換するステップを有し、;(h)変換された第1のディジタル画像と第2のディジタル画像の内容の間の類似の領域を検出し、それにより、第2のディジタル画像が第1のディジタル画像の領域の幾何学的に変換されたコピーである領域を含むかどうかを決定するステップを有する方法に存在する。
本発明の更なる面は、2つの画像の同様な領域の空間的な範囲を識別することである。この識別は、3段のアプローチを使用して実行される。第1に、対応点は、各画像内の関心のオブジェクトについて検索され、対応する関心のオブジェクトの一致を見つけ、関心の各オブジェクト上の特徴点の位置を特定し、そして、一致する関心のオブジェクト上の特徴点の一致を見つけることにより、識別される。第2に、対応点に関連する幾何学的変換が計算される。第3に、2つの画像の同様な領域の空間的な範囲が、計算された幾何学的変換に従って第1の画像をひずませ(warp)、そして、歪ませられた第1の画像の画素コード値とオリジナルの第2の画像のとを比較することにより、見つけられる。
商用データベースについては、本発明の利点は、冗長画像を識別しそして選択的にコレクションからそれらを取り除くことにより、画像データベース及びコレクション内の冗長性を認識し且つ制御する能力にある。更に加えて、画像の一部分の内容の幾何学的に変換されたコピーを検出する能力は、画像資産の所有者が、それらの画像の許可されていない再使用を、特に、許可されていない再使用が画像の所定の一部分にのみ現れる場合を、検出することを可能とする。
本発明のこれらのそして他の面、目的、特徴及び利点は、添付の図面を参照して、以下の好ましい実施例の詳細な説明と添付の請求項を読めば、更に明確に理解されそして評価されよう。
以下の記載では、本発明の好ましい実施例を、ソフトウェアプログラムとして通常は実行されうることに関して記載する。当業者は、そのようなソフトウェアの等価物はハードウェアでも構成されうることは、容易に認識する。画像操作アルゴリズムとシステムは良く知られているので、本記載は、本発明に従ったシステムと方法の、一部を構成する又は、直接的に協働する、アルゴリズム及びシステムに、特に向けられている。ここに特に示されておらず説明されていない、そのようなアルゴリズムとシステムの他の面、及びそれに関連する画像信号を発生しそして、そうでなければ処理するハードウェア及び/又はソフトウェアは、技術的に知られたそのようなシステム、アルゴリズム、構成要素及び要素から選択される。以下の資料で本発明に従って記載されるシステムとすれば、本発明を実行するのに有益な、ここに特に示されていない、暗示又は記載されていないソフトウェアは、伝統的なものでありそして、そのような技術の通常の知識内である。
更に、ここで使用するように、コンピュータプログラムは、コンピュータ読み出し可能な記憶媒体に記憶され、これは、例えば、(ハードドライブ又はフレキシブルディスクのような)磁気ディスク又は磁気テープのような磁気記憶媒体;光ディスク、光テープ又は、機械読み出し可能なバーコードのような光記憶媒体;ランダムアクセスメモリ(RAM)又は、読み出し専用メモリ(ROM)のような固体電気記憶装置;又は、コンピュータプログラムを記憶するのに使用される他の物理装置又は媒体を含みうる。
本発明を記載する前に、本発明は、パーソナルコンピュータのような、良く知られたコンピュータシステム上で使用されるのが好ましいことを注意するのは理解を容易にする。従って、コンピュータシステムは、ここでは詳細には説明しない。画像はコンピュータシステムに直接的に入力されるか(例えば、ディジタルカメラにより)又は、コンピュータシステムに入力前にディジタル化されるか(例えば、銀ハロゲン化物ようなオリジナルを操作することにより)のいずれかであることに注意することも有益である。
図1を参照すると、本発明を実行するコンピュータシステム110が示されている。コンピュータシステム110は、好ましい実施例を説明するために示されているが、本発明は、示されたコンピュータシステム110に限定されず、しかし、ホームコンピュータ、キオスク、小売又は、卸売り、現像又は、ディジタル画像を処理する他のシステムで見つかるような、電子処理システムで使用されうる。コンピュータシステム110は、ソフトウェアプログラムを受信し且つ処理しそして他の処理機能を実行する、マイクロプロセッサベースのユニット112を有する。ディスプレイ114は、例えばグラフィックユーザインターフェースにより、ソフトウェアに関連するユーザに関連する情報を表示する、マイクロプロセッサベースのユニット112に電気的に接続されている。キーボード116も、ユーザがソフトウェアへ情報を入力することを可能とするためにマイクロプロセッサベースのユニット112に接続されている。入力のためにキーボード116を使用する代わりに、ディスプレイ114上のセレクタ120を移動しそして、セレクタ120が重なるアイテムを選択するために、技術的に良く知られているように、マウス118が使用されうる。
コンパクトディスク読み出し専用メモリ(CD−ROM)124は、これは典型的にはソフトウェアプログラムを含み、マイクロプロセッサベースのユニット112へソフトウェアプログラムと他の情報を入力する手段を提供するために、マイクロプロセッサベースのユニットへ挿入される。更に加えて、フレキシブルディスク126も、ソフトウェアプログラムを含んでもよく、そして、ソフトウェアプログラムを入力するためにマイクロプロセッサベースのユニット112へ挿入される。コンパクトディスク読み出し専用メモリ(CD−ROM)124又はフレキシブルディスク126は、代わりに、外部に配置されたマイクロプロセッサベースのユニット112に接続されたディスクドライブユニット122に挿入されても良い。更に、マイクロプロセッサベースのユニット112は、技術的に知られているように、ソフトウェアプログラムを内部で記憶するために、プログラムされうる。マイクロプロセッサベースのユニット112は、電話線のような、ローカルエリアネットワーク又はインターネットのような、外部ネットワークへのネットワーク接続127も有しても良い。プリンタ128も、コンピュータシステム110からの出力のハードコピーを印刷するために、マイクロプロセッサベースのユニット112に接続されうる。
画像は、以前に知られていたカード130内に電子的に具体化されたディジタル化された画像を含む(パーソナルコンピュータメモリカードインターナショナルアソシーエーションの使用に基づいた)PCMCIAカードのような、パーソナルコンピュータカード(PCカード)130を介してディスプレイ114に表示されてもよい。PCカード130は、ディスプレイ114上に画像の視覚的表示を可能とするために、最後に、マイクロプロセッサベースのユニット112に挿入される。代わりに、PCカード130は、マイクロプロセッサベースのユニット112に接続された、外部に配置されたPCカードリーダ132に挿入されることが可能である。画像は、コンパクトディスク124、フレキシブルディスク126、又は、ネットワーク接続127を介して入力されてもよい。PCカード130、フレキシブルディスク126又はコンパクトディスク124、に記憶された又は、ネットワーク接続127を通して入力されたどの画像も、ディジタルカメラ又はスキャナ(図示していない)のような、種々のソースから得られうる。例えば、画像は、マイクロプロセッサベースのユニット112に接続されたカメラドッキングポート136を介してディジタルカメラ134から直接的に、又は、マイクロプロセッサベースのユニット112へのケーブル接続138を介して又はマイクロプロセッサベースのユニット112への無線接続140を介してディジタルカメラ134から直接的に入力されてもよい。
本発明に従って、アルゴリズムは、今まで述べたどの記憶装置へも記憶され得そして、他の画像の幾何学的変換版である画像を検出するために、適用される。
図2は、画像の幾何学的に変換されたコピーを検出する本発明の方法を示す。第1のステップ200では、2つのディジタル画像:第1のディジタル画像202と第2のディジタル画像204が提供される。ディジタル画像は、種々の手段で提供されることが可能であり;例えば、それらはディジタルカメラにより捕捉され、ビデオシーケンスから抽出され、ハードコピー出力走査され又は、他の手段により発生される。次に、第1のディジタル画像202と第2のディジタル画像204の間の対応する点の組みが識別される(ステップ206)。対応する点は、同じシーンの点に対応する第1のディジタル画像202と第2のディジタル画像204の画素の位置であるように定義される。例えば、画像内容の先験的な(a priori)知識なしの対応する点の識別は、強く行うのが難しい。この問題を解決するために、2つの画像の間の幾何学的な差が増加するにつれて減少する制限された成功を有する、幾つかのアルゴリズムが開発されている。例えば、そのようなアルゴリズムは、Zhang,Z.,Dreriche,R.,Faugeras,O.,Luong、Q.−T.の”未知のエピポーラ幾何学の回復を通して2つの未較正画像の一致を見つけるロバスト技術(A Robust Technique for Matching Two Uncalibrated Images Through the Recovery of the Unknown Epipolar Geometry)”、INRIAリサーチレポート、No.2273,1994年5月及び、Pilu、M.,の”特異値分解に基づくステレオ対応のための直接的方法(A Direct Method for Stereo Correspondence based on Singular Value Decomposition)”、Proc.CVPR,1997年pp.261−266を参照する。各画像内の関心のオブジェクトの知られた位置のような、先験的な情報が存在するときには、この情報は、対応する点の組みを識別する処理を単純化するのに使用されることが可能である。先験的な情報を使用する本発明の実施例の例は、図3に記載されている。
対応する点の組みが識別されると(ステップ206)、第1のディジタル画像202からの対応する点から第2のディジタル画像204からの対応する点への幾何学的変換マッピングのパラメータが決定される(ステップ208)。前述の幾何学的変換は、ある数のパラメータ又は自由度で表現される。例えば、画像リサイジングは、スケーリングパラメータを必要とする。画像回転は、(回転の中心が固定されている、即ち画像の中心でと仮定し)回転の角度を記述する角度パラメータを必要とする。画像の移動は、移動の水平及び垂直オフセットを記述する2つのパラメータを必要とする。アフィン変換は、6つのパラメータを必要とし、そして、透視及びバイリニア変換の両方は、8パラメータを必要とする。多項式、局所多項式及び、スプライン変換は、多項式又はスプラインの程度及び使用される局所多項式又はスプライン間隔の数に依存して増加する数のパラメータを必要とする。2つの画像間の幾何学的変換が、Nのパラメータを必要とする場合には、(一般的な位置の;例えば、アフィン変換については少なくとも3の同一線上でない対応する点の組みの)少なくとも
Figure 2004178592
の対応する点の組みが識別されたときに、それらのパラメータは、推定される。正確に
Figure 2004178592
の一般的な位置の対応する点の組みが識別された場合には、幾何学的変換のパラメータは、正確に計算されることが可能である。
Figure 2004178592
以上の一般的な位置の対応する点の組みが識別される場合には、多過ぎるマッピングが決定され、それにより、幾何学的変換のパラメータはある意味で最適に推定される。例えば、第2のディジタル画像204の対応する点と第2のディジタル画像204の予測された対応する点の間の誤差又は差は、lノルムのようなノルム内で最小化される(Bartlw,R.,積分の要素とルベーグ手段(The Elements of Integration and Lebesgue Measure、Jhon Wiley&Son、1995、pp.52−64を参照する))。代わりに、メジアン絶対誤差が最小化され又は、推定されたパラメータを、不正確に識別された対応する点に対して強くするために、最大尤度推定がなされる。
ステップ210では、第1のディジタル画像202がそして、ステップ208で決定されたパラメータを有する幾何学的に変換に従って、変換されて、変換された第1のディジタル画像212を形成する。前述の幾何学的変換のすべては、クロッピングは別として、2段階処理の画像に適用されうる。最初に、画像の画素位置が、幾何学的変換に従って、変換される。そして、画像値は、規則的なグリッドの点で補間され、変換された画像を形成する。種々の補間技術の詳細は、Gonzalez,R.,及びWoods,R.,のディジタル画像処理(Digital Image Processing)、Addison−Wesley,1992年に記載されている。
最後に、ステップ214で、変換された第1のディジタル画像212と第2のディジタル画像204の間の類似性が検出される。類似性の存在は、1つの画像の少なくとも一部分が他の画像の幾何学的に変換されたコピーであることを示す。類似性を検出する1つの単純な技術は、第2のディジタル画像204から変換された第1のディジタル画像を減算して、差画像を形成することである。画像が同様な場合には、差画像のヒストグラムは、ゼロのまわりに大きなクラスタリングの値を示す。画像のコピーされた部分に適用されるカラー又は輝度変換について補償することが必要である。画像の部分のみが共通である場合には、差画像は両方の画像に共通な領域の空間の範囲を示すマップを発生しうる。結果の類似性マップと空間及びカラー変換は、報告される(ステップ216)。(差分技術に関する更なる情報は、前述のGonzalez及びWoodsの参照文献のpp.185−187を参照する)。
図3は、第1のディジタル画像202と第2のディジタル画像204の間の対応する点の組を識別するステップ206の実施例を示す。最初に、各ディジタル画像は、関心のオブジェクトについて、検索される(ステップ300)。関心のオブジェクトの例は、人間の顔、人、動物、建築構造、実際の世界のオブジェクトに対応しない画素値の構造化されたパターン等を含む。ディジタル画像は、種々の手段により検索されうる。多重解像度テンプレートマッチング、ニューラルネットワーク及びベイズの推論のようなパターン認識技術は、画像内の関心のオブジェクトを検索するのに使用されうる多くのディジタル画像処理アルゴリズムの幾つかである。更に加えて、関心のオブジェクトの位置が、ある手動又は、自動技術により先験的に見つかる場合には、それらの位置は、各提供された画像202と204の画像ファイル内にメタデータとして記憶されうる。単純な手動技術の例は、ユーザが各ディジタル画像の関心の各オブジェクトの周りに円又は境界となるボックスを描くとき又は、ディジタル画像のメタデータにテキストメッセージを置き、各画像に画像内容を記述するテキストメッセージを知らせるときである。関心のオブジェクトの位置が、画像202と204の画像ファイル内にメタデータとして記憶される場合には、ステップ300は、画像ファイルからメタデータを抽出することのみが必要であり、そして、更なるディジタル画像処理を必要としない。
一旦、関心のオブジェクトを検索するステップ300が発生すると、各画像は関心のオブジェクトを含むかどうかに関する質問302がなされる。質問302に対する否定の応答は、利用できる先験的な情報がないことを示し、そして、対応する点の組は、前述の(Zhang他又は、Pilu)のロバスト画像一致アルゴリズムの1つで識別される(ステップ304)。質問302への肯定の応答は、対応する関心のオブジェクトの組が識別されるべきであることを示す(ステップ306)。対応する関心のオブジェクトの組は、シーンの同じ関心のオブジェクトに対応する、第1のディジタル画像202内の位置を特定された関心のオブジェクトと第2のディジタル画像204内の位置を特定された関心のオブジェクトとして、定義される。対応する関心のオブジェクトは、種々の技術により識別されうる。K−の最も近い隣接、ニューラルネットワークのような分類アルゴリズム又は、サポートベクトルマシンが、関心のオブジェクトに、1つ又はそれ以上のクラスの組に属するとラベル付けするのに使用されうる。(分類アルゴリズムの調査については、Fukunaga,K.,の統計的パターン認識(Statistical Pattern Recognition),2ndEd.,Academic Press、1990年を参照する)。両画像が同じクラスに属する場合には、1つのディジタル画像内の関心のオブジェクトは、他のディジタル画像内の関心のオブジェクに対応するといわれる。1つの画像内の1つ以上の関心のオブジェクトが同じクラスに属する場合には、例えば、画像値を比較しそして関心のオブジェクトとして同じ画像値メトリックに関して最も近いものを選択することにより、対応が決定されうる。分類アルゴリズムの代わりとして、関心のオブジェクトは、予め分類され、そして、それらの分類は画像ファイルのメタデータに格納される。関心のオブジェクトが人間の顔でありそしてディジタル画像が2人の人である場合を考えて欲しい。2人の人間の顔は、画像内に現れ、そして、”第1の人間”及び”第2の人間”としてそれぞれ分類される。第1の人間の(それぞれ、第2の人間の)顔の位置とラベル”第1の人間”(それぞれ、”第2の人間”)は、画像のメタデータに記憶される。
一旦、対応する関心のオブジェクトの組を識別するステップ306が発生すると、対応する関心のオブジェクトの組が識別されたかどうかに関する質問308が、なされる。質問308に対する否定の応答は、利用できる先験的な情報がないことを示し、そして、対応する点の組は、前述の(Zhang他又は、Pilu)のロバスト画像一致アルゴリズムの1つで識別される(ステップ304)。質問308への肯定の応答は、特徴点が各関心のオブジェクト上に位置を特定されるべきであることを示す(ステップ310)。特徴点の例は、角、分岐点、ある特定の画像値を有する点及び、関心のオブジェクト上で知られた構造を示す点を含む。特徴点は、種々のディジタル画像処理技術を通して検出され得又は、それらは、先験的に見つけられ又はラベルが付され、そして、それらの位置は第1と第2のディジタル画像の画像ファイルのメタデータ内に記憶される。
関心のオブジェクト上の特徴点の、位置が特定されたときに(ステップ310)、それらは、他のディジタル画像の対応する関心のオブジェクト上の特徴点との一致が見つけられる(ステップ312)。これは、前述のパターン認識技術の1つによりなされることが可能である。代わりに、特徴点は、ラベル付けされ又は分類され、そして、それらは、他の画像内の対応する関心のオブジェクト内の同様にラベル付けされた又は分類された特徴点との一致が見つけられる。例えば、関心のオブジェクトが人間の顔である場合には、特徴点は”右目の中心”、”鼻ばしら”等とラベル付けされうる。一旦、特徴点が、全ての対応する関心のオブジェクトについて一致見つけられると、一致した点の結果の組は、対応する点314の組のセットを構成する。
好ましい実施例では、関心のオブジェクトは人間の顔である。画像内の顔を検出しそして認識する従来技術で利用できる多くのアルゴリズムがある。顔検出及び認識についての良好な調査論文については、Yang,M.−H.,Kriegman,D.,及びAhuja,N.,の”画像内の顔の検出:調査(Detecting Faces In Images:A Survey)”の、IEEE Trans.Pattern Analysis and Machine Intelligence,Vol.24,No.1,pp.34−58,2002及び、Zhao,W.,Chellappa,R.,Rosenfeld,A.,及びPhillips,P.J.,の”顔認識:論文調査(Face Recognition:A Literature Survay)”、メリーランド大学(University of Maryland),自動化研究センタ技術報告(Center for Automation Research Technical Reprot),CAR−TR−948、2000を参照する。顔検出アルゴリズムは、ステップ300を実行するのに使用され、そして、顔認識アルゴリズムは、ステップ306の一部として顔及を分類するのに使用されうる。個々の顔は、Visionnics社のFaceItシステムのような顔認識システムを通して識別され、;同様な識別を有する顔は、組にされる。代わりに、組にすることは、最も高い類似性を有する顔を見つけることにより達成されうる。顔の間の類似性は、Turk及びPentlandによる、”認識のための固有の顔(Eigenfaces for Recognition)”、Journal of Cognitive Neuroscience3(1),1991又は、以下に記載するのと同じ方法を使用してスケール、回転、及び移動の差について補正後に、顔の特徴点の間の最も高い相関を検出こと、により記載されたもののような種々の方法を使用して計算されうる。顔は、目、鼻、口及び他の明確な特徴の位置のような、多くの認識可能な特徴点を有する。顔の特徴点は、Bolin,M.,及びChen,S.による、”肖像画の児童会特徴検出システム(An Automatic Facial Feature Finding System for Portrait Images)”、画像科学及び技術の55回年次会議のプロシーディング(Proceedings of the 55th Annual Conference of the Society for Imaging Science and Technology)(PICTS2002)により記載のもののような方法を使用して得られうる。
図4Aを参照すると、ステップ200で供給された各ディジタル画像は、ディジタル画像ファイル400に記憶され、これは、画像データ402とメタデータ404の両方を含む。メタデータ404は、画像に関連する補助データと(画像データ402それ自身以外のデータ)して定義される。例えば、画像内の関心のオブジェクトの位置は、自動ディジタル画像処理技術により又は、手動のラベル付けにより、先験的に識別され得、そして、これらの位置は、画像ファイル400のメタデータ404内に格納される。他の例では、関心の各オブジェクトの分類はメタデータ内に記憶される。そのようなメタデータを画像ファイル内の画像データに単に追加することが可能である。TIFFのようなあるファイルフォーマットは、ユーザ定義の情報についてのセグメントを提供する。代わりに、メタデータは、より広い種々の標準ファイルフォーマットの使用を可能とするために、そして、メタデータが、(”鍵”値のような)埋め込み処理のある知識でのみ回復されるあるレベルの安全性を提供するために、画像データそれ自身内に埋め込まれうる。
図4Bを参照すると、第1(202)と第2(204)のディジタル画像を供給するステップ200は、第1(406)と第2(408)のソース画像を提供すること及び、各画像の解像度を減少させ401、第1(202)と第2(204)のディジタル画像を発生することを含む。各ソース画像の解像度を減少させるステップ410は、第1のディジタル画像を幾何学的に変換し210そして、変換された第1のディジタル画像212と第2のディジタル画像204の内容の間の類似性を検出する214、後続のステップの計算の速度の上昇を可能とする。ステップ210と214は、第1(202)と第2(204)のディジタル画像の各画素に関する操作を含むので、減少された解像度の第1(202)と第2(204)のディジタル画像を(ステップ200で)供給することは、画素の数を減少させ、それにより、必要な操作の数を減少させる。その技術の種々の技術は、第1(202)と第2(204)のディジタル画像を縮小するのに適用されうる(前述のGonzalezの引用文献を参照する)。
図5Aと5Bを参照すると、第1のディジタル画像202内の対応する点500の組は、(u,v),i=1,...,Nとラベルが付され、そして、第2のディジタル画像204202内の対応する点500の組は、(x,y),i=1,...,Nとラベルが付され、ここで、Nは対応する点の組の合計の数である。対応する点の組をマップする幾何学的変換のパラメータを決定するステップ208の実施例は、図5Bに示されている。ステップ502では、対応する点の組をマップする特定の形式の変換が、選択される。好ましい実施例では、選択された変換は、アフィン変換である。数学的には、アフィン変換は、以下の方法で対応する点に関連する、(j,k)エントリajkを有する2×3マトリクスAとして記述されうる:
Figure 2004178592
選択された変換は正確に2Nのパラメータを含むかどうかに関する質問504が、なされる。選択された変換がアフィン変換である、好ましい実施例では、質問504が肯定的な応答に値するためのみのNの値は、N=3である。この場合には、アフィン変換は、以下の方法で、直接的に計算される(ステップ506):
Figure 2004178592
実際には、逆マトリクスを直接的に計算することは、最も数値的に安定な手順ではなく、そのために、部分的行ピボットを有するガウスの消去法、、QR因数分解等のような、他の数値線形代数技術が使用される。(数値線形代数技術の調査に関しては、Stewart,G.,の”マトリクスアルゴリズム第1巻:基本分解(Matrix Algorithm Volume 1:Basic Decompositions)”、SIAM,1998を参照する)。更に、大きな状態数のマトリクスを避けるために、ユーザが各画像内の画素値を正規化するのが有利である。適切な正規化機構は、画像の中心に原点を設定し、そして、画素位置をスケーリングしそれにより平均の対応する点は原点から単位距離を有する。
質問504への応答が否定の場合には、変換が2Nよりも少ないパラメータを含むかどうかに関する質問508が、なされる。好ましい実施例では、選択された変換がアフィン変換の場合には、質問504は、N>3のときはいつでも否定の応答に値する。この場合には、対応する点を正確にマップするアフィン変換はない。従って、ステップ510により示されたように、”最良適合”変換が得られる(即ち、第2の画像内の各対応する点とアフィン変換を通したその予測の間の誤差を最小化する変換)。典型的には、誤差は、前述のlノルムに関して最小化されるがしかし、どのようなノルム、又は、2乗最小メジアン、最大尤度等のようなロバスト手順に関しても最小化されうる。
Figure 2004178592
を定義し、最良適合アフィン変換は、特異値分解C=UΣVに従ってCを分解し、そして、
Figure 2004178592
を計算することにより計算されることが可能であり、ここで、
Figure 2004178592
は、Σの左3×3サブマトリクス、及び
Figure 2004178592
は、Vの左N×3サブマトリクスである。特異値分解の詳細は、前述のStewartの引用文献に示されている。当業者は、QR分解、線形最小2乗を介した解法、のようなlノルムの最良適合アフィン変換を決定する種々の他の技術があることがわかる(最小2乗問題を解決する方法の調査に関しては、Lawson,C.,及びHanson,R.,の”最小2乗問題の解法(Solving Least Square Problem)”、SIAM,1995を参照する)。
質問508が否定の場合には、現在の変換よりも少ないパラメータを有する他の変換がステップ512で選択され、そして、処理は、新たな変換を使用して繰返され、質問504で開始する。アフィン変換が好ましいが、他の変換も本発明の精神及び範囲から離れることなしに使用され得る。他の変換は、2つの画像巻の幾何学的関係に関する知識がある状況又は、計算効率が優先である状況で好ましい。
他の実施例では、対応する点をマップする幾何学的変換は、水平及び垂直方向に、単一のスカラーパラメータによる画像リサイジング(大きさ変更)である。数学的には、原点が画像の中心にあるように画素座標が正規化される場合には、画像リサイジングは、以下の方法で対応する点に関連するスカラー倍数aとして記述されうる:
Figure 2004178592
Nの対応する点の組がある場合には、aの最良適合値が以下の方法で得られる。定義すると:
Figure 2004178592
aの最良適合値は
Figure 2004178592
により与えられる。
他の実施例では、対応する点の組をマップする幾何学的変換は、水平及び垂直方向の異なるスカラーパラメータによる画像リサイジングである。数学的には、原点が画像の中心であるように画素座標が正規化される場合には、2つの方向の画像リサイジングは、以下の方法:
Figure 2004178592
で対応する点を関連付けるベクトルA=(a,a)により記述される。1つのみの対応する点の組がありそして、uもvもゼロではない場合には、スケールパラメータは、正確に、a=x/u及びa=y/vと計算されうる。Nの対応する点の組がある場合には、Aの最良適合値が以下の方法で得られる。定義すると:
Figure 2004178592
Aの最良適合値は、特異値分解C=UΣVに従ってCを分解し、そして、
Figure 2004178592
を計算することにより計算されることが可能であり、ここで、
Figure 2004178592
は、Σの左2×2サブマトリクス、及び
Figure 2004178592
は、Vの左N×2サブマトリクスである。
他の実施例では、対応する点の組をマップする幾何学的変換は、原点に関する画像の回転である。数学的には、原点が画像の中心にあるように画素座標が正規化される場合には、画像回転は、以下の方法:
Figure 2004178592
で、対応する点に関連する時計周り角度パラメータθにより記述されうる。Nの対応する点の組がある場合には、Aの最良適合値は、以下の方法で得られる。(x,y)と(u,v)を極形式:(r,α)及び(p,β)に変換する(それぞれ、x=rcosα、y=rsinα、u=pcosβ、及び、v=psinβ)。そして、θの最良適合値は、
Figure 2004178592
により与えられる。代わりに、θの最良適合値は、非線形最小2乗最小化により、推定されうる。例えば、典型的な非線形最適化技術は、Fletcher,R.,の”最適化の実際的な方法(Practical Method of Optimization)”、第2版,John Wiley & Sons,1987を参照する。
他の実施例では、対応する点の組をマップする幾何学的変換は、画像の水平及び垂直方向への移動である。数学的には、原点が画像の中心であるように画素座標が正規化される場合には、2つの方向の移動は、以下の方法:
Figure 2004178592
で、対応する点を関連付ける、ベクトルA=(a,aにより、記述されうる。Nの対応する点の組がある場合には、Aの最良適合値は、
Figure 2004178592
により与えられる。
他の実施例では、対応する点の組をマップする幾何学的変換は、水平及び垂直方向のせん断加工(shearing)である。数学的には、原点が画像の中心であるように画素座標が正規化される場合には、2つの方向の画像せん断加工は、以下の方法:
Figure 2004178592
で対応する点を関連付けるベクトルA=(a,a)により記述される。1つのみの対応する点の組がありそして、uもvもゼロではない場合には、せん断は、正確に、a=(x−u)/v及びa=(y−v)/uと計算されうる。Nの対応する点の組がある場合には、Aの最良適合値が以下の方法で得られる。定義すると:
Figure 2004178592
Aの最良適合値は、特異値分解C=UΣVに従ってCを分解し、そして、
Figure 2004178592
を計算することにより計算されることが可能であり、ここで、
Figure 2004178592
は、Σの左2×2サブマトリクス、及び
Figure 2004178592
は、Vの左N×2サブマトリクスである。
当業者は、これらの実施例のいずれの構成も、本発明の範囲を超えないことがわかる。例えば、対応する点の組をマップする幾何学的変換が、数学的に:
Figure 2004178592
により表される、回転、移動及び画像リサイジングの構成である場合には、パラメータの最良適合セットは、前述のFletcherの引用文献に従った非線形最適化ルーチンにより解かれうる。
他の実施例では、対応する点の組をマップする幾何学的変換は、透視変換である。数学的には、透視変換は、以下の方法:
Figure 2004178592
で対応する点を関連付けるマトリクスAにより記述されることが可能である。変数wは、実際には、ダミー変数であり;透視変換は、代わりに、有理線形関数:
Figure 2004178592
として考えられうる。透視変換のパラメータの最適なセットは、前述のFletcherの引用文献に従った非線形最適化ルーチンにより解かれる。
他の実施例では、対応する点の組をマップする幾何学的変換は、多項式、局所多項式又は、スプライン変換のような、高次の変換である。これらの変換は、前述のWolbergの引用文献に全て記載されており、そして、それらの最適なパラメータは、種々の最適化技術を通して見つけることができる。
図6は、変換された第1の画像と第2の画像の間の類似性のある領域を検出する実施例を示す。ステップ208で決定された変換は、対応する点の位置の誤差による又は、変換モデルを適合させる幾つかの点の失敗による、ある程度の不正確さを有しうる。この不正確さは、後続の動作の性能を劣化させうる2つの画像の間の僅かの位置ずれを導きうる。画像一致処理内のそのような誤差を適合させるために、低域通過フィルタが、変換後の対応する点の間の差を測定することにより、予想された位置ずれを軽減するために設計されうる。好ましい実施例では、ガウスブラーカーネル(Gaussian blur kernel)が構成される(ステップ610)。カーネルの不鮮明の程度とサイズは、変換後の対応する点の間の誤差に比例する。画像は、輝度のみの表現に変換され(ステップ620)、そして、各画像は、構成されたカーネルと畳み込みされる(ステップ630)。
画像のコントラストと輝度は、しばしば、画像の再使用で修正され;従って、これらの変更は画像を比較するときに合わされねばならない。関心の対応するオブジェクトを含む画素は、変換と低域通過フィルタリング動作を通して空間的に相関がとられる。この空間的な相関は、2つの画像間の輝度変換を決定するのに使用される(ステップ640)。対応する画素値は、画像の輝度とコントラストを調整する線形変換を生成するのに使用されることができる。これは、直線回帰又は上述の方法を使用して解かれうる。
Figure 2004178592
更に複雑なモデルは、ガンマ補正を適合するために生成されうるが、しかし、これらの変換内でクリップするダイナミックレンジは、解法を複雑化しうる。代わりのものは、単純に、2つの画素の対応するオブジェクトの間の画素値をマップする、ルックアップテーブルを構築することである。補間と外挿技術が、ルックアップテーブル内に場所を占めていない対応を決定するために使用され得る。決定された輝度変換は、第1の画像に適用され(ステップ650)、そして、差画像が、その画像を減算することにより生成される(ステップ660)。差画像への絶対値へしきい値を適用することは、同様な画素の2値マップを生成する(ステップ670)。このマップは、形態上の操作を適用することにより又は、接続されたコンポーネント分析を介して領域併合及び充填により、整理され且つ単純化される(ステップ680)。結果のマップは、2つの画像の間の類似の領域を記述する。種々の形態上の動作と接続されたコンポーネント技術の詳細は、Gonzalez,R.,及びWoods,R.,の”ディジタル画像処理(Digital Image Processing)”、Addison−Wesley,1992年、ページ518−548に、記載されている。
類似性の領域を検出する前の記載は、画像の輝度チャネルに関する動作を参照してなされる。当業者は、本発明の範囲から離れることなしに、画像のフルカラー表現についても類似の動作がなされうることは認識するであろう。
本発明がシステムであると考えられる場合には、図2の処理ステップは、別の処理段階と見られることができる。基本的には、本発明は、第2の画像が、第1の画像内の領域の幾何学的に変換されたコピーである少なくともその領域を含むかどうかを検出するシステムを提供する。図2を参照すると、第1の処理段階206は、各ディジタル画像内の関心のオブジェクトを検索することにより2つの画像の間の対応する点の組を識別し;ディジタル画像内の対応する関心のオブジェクトの組を識別し、対応する関心のオブジェクトの各組は、第1のディジタル画像内の位置を特定された関心のオブジェクトと、第1の画像内の位置を特定された関心のオブジェクトに対応する、第2のディジタル画像内の対応する位置を特定された関心のオブジェクトを有し、;各ディジタル画像内の各位置を特定された関心のオブジェクト上の特徴点の位置を特定し、;第1のディジタル画像内の位置を特定された関心のオブジェクト上の特徴点と、第2のディジタル画像内の対応する関心のオブジェクト上の特徴点の一致するものを見つけ、それにより、各画像についての対応する点の組を発生する。第2の処理段階208は、第1のディジタル画像の対応する点の組を、第2のディジタル画像の対応する点の組へマップする幾何学的変換のパラメータを決定する。第3の処理段階210は、段階208で決定した幾何学的変換のパラメータに従って第1のディジタル画像を変換し、第4の処理段階214は、変換された第1のディジタル画像と第2のディジタル画像の内容の間の類似の領域を検出し、それにより、第2の画像が第1の画像の領域の幾何学的に変換されたコピーである領域を含むかどうかを決定する。更に、第5の処理段階216で、第2のディジタル画像の内容と実質的に同様であると検出される変換された第1のディジタル画像の内容の空間的な範囲を報告する。各処理段階は、図1に示されたマイクロプロセッサベースのユニット112により実行されるコンピュータコードにより実行される。
本発明を実行するコンピュータシステムの展望図である。 本発明の方法を示すフローチャートである。 本発明のステップの1つの実施例を示すフローチャートである。 画像データとメタデータを含む画像ファイルの図である。 本発明のステップの1つの実施例を示すフローチャートである。 対応する点の組のセットを示す図である。 幾何学的変換のパラメータを決定する処理を示すフローチャートである。 変換された画像間の類似の領域を検出する処理を示すフローチャートである。
符号の説明
110 コンピュータシステム110 名詞
112 マイクロプロセッサベースのユニット112 名詞
114 ディスプレイ114 名詞
116 キーボード116 名詞
118 マウス118 名詞
120 ディプレイ上のセレクタ120 名詞
122 ディスクドライブユニット
124 コンパクトディスク読み出し専用メモリ(CD−ROM)
126 フレキシブルディスク126 名詞
127 ネットワーク接続127 名詞
128 プリンタ128 名詞
130 パーソナルコンピュータカード(PCカード)
132 PCカードリーダ132 名詞
134 ディジタルカメラ134 名詞
136 カメラドッキングポート136 名詞
138 ケーブル接続138 名詞
140 無線接続140 名詞
200 供給するステップ
202 第1のディジタル画像202 名詞
204 第2のディジタル画像204 名詞
206 識別ステップ
208 決定ステップ
210 幾何学的変換ステップ
212 変換された第1のディジタル画像212 名詞
214 類似性検出ステップ
216 報告ステップ
300 位置を見つけるステップ
302 質問
304 画像一致ステップ
306 識別ステップ
308 質問
310 位置を見つけるステップ
312 一致ステップ
314 対応する点
400 画像ファイル400 名詞
402 画像データ402 名詞
404 メタデータ404 名詞
406 第1ソースデータ
408 第2ソースデータ
410 減少ステップ
500 対応点
502 変換選択ステップ
504 質問
506 正確なパラメータを計算するステップ
508 質問
510 最良適合パラメータ推定ステップ
512 他の変換を選択するステップ
610 位置合わせを分析するステップ
620 変換ステップ
630 フィルタステップ
640 画素検査ステップ
650 変換ステップ
660 減算ステップ
670 しきい値ステップ
680 2値マップ整理ステップ

Claims (3)

  1. 画像の少なくとも一部分の内容の幾何学的に変換されたコピーを検出する方法であって、前記方法は、
    (a)第1と第2のディジタル画像を供給するステップを有し、
    (b)各ディジタル画像内の関心のオブジェクトを検索するステップを有し、
    (c)ディジタル画像内の対応する関心のオブジェクトの組を識別するステップを有し、対応する関心のオブジェクトの各組は、第1のディジタル画像内の位置を特定された関心のオブジェクトと、第1の画像内の位置を特定された関心のオブジェクトに対応する、第2のディジタル画像内の対応する位置を特定された関心のオブジェクトを有し、
    (d)各ディジタル画像内の各位置を特定された関心のオブジェクト上の特徴点の位置を特定するステップを有し、
    (e)第1のディジタル画像内の位置を特定された関心のオブジェクト上の特徴点と、第2のディジタル画像内の対応する関心のオブジェクト上の特徴点の一致するものを見つけ、それにより、各画像についての対応する点の組を発生するステップを有し、
    (f)第1のディジタル画像の対応する点の組を、第2のディジタル画像の対応する点の組へマップする幾何学的変換のパラメータを決定するステップを有し、
    (g)ステップ(f)で決定した幾何学的変換のパラメータに従って第1のディジタル画像を変換するステップを有し、
    (h)変換された第1のディジタル画像と第2のディジタル画像の内容の間の類似の領域を検出し、それにより、第2のディジタル画像が第1のディジタル画像の領域の幾何学的に変換されたコピーである領域を含むかどうかを決定するステップを有する、
    方法。
  2. 前記領域は、各画像の実質的に全てを含む、請求項1に記載の方法。
  3. 前記領域は、各画像の一部分を含む、請求項1に記載の方法。
JP2003392857A 2002-11-25 2003-11-21 画像の幾何学的に変換されたコピーを検出する方法及びシステム Pending JP2004178592A (ja)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
US10/304,023 US7228006B2 (en) 2002-11-25 2002-11-25 Method and system for detecting a geometrically transformed copy of an image

Publications (1)

Publication Number Publication Date
JP2004178592A true JP2004178592A (ja) 2004-06-24

Family

ID=32325109

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2003392857A Pending JP2004178592A (ja) 2002-11-25 2003-11-21 画像の幾何学的に変換されたコピーを検出する方法及びシステム

Country Status (3)

Country Link
US (1) US7228006B2 (ja)
EP (1) EP1434165A1 (ja)
JP (1) JP2004178592A (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008165774A (ja) * 2006-12-13 2008-07-17 Canon Inc ドキュメント画像からのパラメータ化された形状の認識方法
JP2012527850A (ja) * 2009-05-21 2012-11-08 ディジマーク コーポレイション ウォーターマーキングとフィンガープリンティングとの組合せ
US9905233B1 (en) 2014-08-07 2018-02-27 Digimarc Corporation Methods and apparatus for facilitating ambient content recognition using digital watermarks, and related arrangements
JP2018194956A (ja) * 2017-05-15 2018-12-06 日本電信電話株式会社 画像認識装置、方法、及びプログラム

Families Citing this family (47)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
FR2841422B1 (fr) * 2002-06-19 2004-11-12 Canon Kk Insertion et extraction d'un message dans une image
SE0203906D0 (sv) * 2002-12-31 2002-12-31 Abb Ab Container character recognition system
US20050097120A1 (en) * 2003-10-31 2005-05-05 Fuji Xerox Co., Ltd. Systems and methods for organizing data
US7421113B2 (en) * 2005-03-30 2008-09-02 The Trustees Of The University Of Pennsylvania System and method for localizing imaging devices
US8243999B2 (en) 2006-05-03 2012-08-14 Ut-Battelle, Llc Method and system for the diagnosis of disease using retinal image content and an archive of diagnosed human patient data
CN100440255C (zh) * 2006-07-20 2008-12-03 中山大学 一种鲁棒的图像区域复制篡改检测方法
CN100465996C (zh) * 2006-07-20 2009-03-04 中山大学 一种jpeg图像合成区域的检测方法
US20080062429A1 (en) * 2006-09-12 2008-03-13 Rongguang Liang Low coherence dental oct imaging
EP2315161A1 (en) * 2006-10-11 2011-04-27 Mitsubishi Electric Information Technology Centre Europe B.V. Image descriptor for image recognition
CN101201371B (zh) * 2006-12-15 2011-12-21 鸿富锦精密工业(深圳)有限公司 印刷电路检测装置和方法
US20100103258A1 (en) * 2007-03-21 2010-04-29 Nxp, B.V. Camera arrangement and method for determining a relative position of a first camera with respect to a second camera
JP5096776B2 (ja) * 2007-04-04 2012-12-12 キヤノン株式会社 画像処理装置及び画像検索方法
US9571675B2 (en) * 2007-06-29 2017-02-14 Nokia Technologies Oy Apparatus, method and computer program product for using images in contact lists maintained in electronic devices
US9313504B2 (en) * 2007-07-02 2016-04-12 Vixs Systems, Inc. Pattern detection module with region detection, video encoding system and method for use therewith
JP5294343B2 (ja) * 2008-06-10 2013-09-18 国立大学法人東京工業大学 画像位置合わせ処理装置、領域拡張処理装置及び画質改善処理装置
US20100054542A1 (en) * 2008-09-03 2010-03-04 Texas Instruments Incorporated Processing video frames with the same content but with luminance variations across frames
US8218838B2 (en) * 2008-11-03 2012-07-10 Ut-Battelle, Llc Method and system for assigning a confidence metric for automated determination of optic disc location
US8326046B2 (en) 2009-02-11 2012-12-04 Ecole De Technologie Superieure Method and system for determining structural similarity between images
US8515181B2 (en) * 2009-02-11 2013-08-20 Ecole De Technologie Superieure Method and system for determining a quality measure for an image using a variable number of multi-level decompositions
US8515182B2 (en) 2009-02-11 2013-08-20 Ecole De Technologie Superieure Method and system for determining a quality measure for an image using multi-level decomposition of images
CN101504655B (zh) * 2009-03-06 2011-03-23 中山大学 一种基于彩色关系特征的图像近似拷贝检测方法
KR20100101204A (ko) * 2009-03-09 2010-09-17 한국전자통신연구원 관심영역 기반의 유씨씨 영상 검색 방법 및 그 장치
US8948524B2 (en) * 2009-10-29 2015-02-03 Hewlett-Packard Development Company, L.P. Joint image compression method and apparatus
US8594700B2 (en) * 2010-02-04 2013-11-26 Jan Nabbefeld Location-determining system and method
JP5825256B2 (ja) * 2010-05-26 2015-12-02 日本電気株式会社 画像処理装置、画像処理方法および画像処理用プログラム
US8768101B1 (en) 2010-06-30 2014-07-01 The United States Of America As Represented By The Secretary Of The Air Force Target image registration and fusion
JP2012033022A (ja) * 2010-07-30 2012-02-16 Panasonic Corp 空間における変化領域検出装置及び方法
US8792728B2 (en) 2010-09-27 2014-07-29 Hewlett-Packard Development Company, L.P. Near-duplicate image detection
TWI453696B (zh) * 2011-02-25 2014-09-21 Altek Corp 影像處理裝置及其處理方法
US8983206B2 (en) 2011-05-04 2015-03-17 Ecole de Techbologie Superieure Method and system for increasing robustness of visual quality metrics using spatial shifting
US8874557B2 (en) * 2011-09-02 2014-10-28 Adobe Systems Incorporated Object retrieval and localization using a spatially-constrained similarity model
US8781255B2 (en) 2011-09-17 2014-07-15 Adobe Systems Incorporated Methods and apparatus for visual search
EP2608062A1 (en) 2011-12-23 2013-06-26 Thomson Licensing Method of automatic management of images in a collection of images and corresponding device
US20150124059A1 (en) * 2012-06-08 2015-05-07 Nokia Corporation Multi-frame image calibrator
US8880563B2 (en) 2012-09-21 2014-11-04 Adobe Systems Incorporated Image search by query object segmentation
US20140205139A1 (en) * 2013-01-18 2014-07-24 Caterpillar Inc. Object recognition system implementing image data transformation
US10062083B2 (en) * 2013-03-08 2018-08-28 Curalate, Inc. Method and system for clustering and classifying online visual information
JP6593327B2 (ja) * 2014-05-07 2019-10-23 日本電気株式会社 画像処理装置、画像処理方法およびコンピュータ可読記録媒体
US10157439B2 (en) * 2015-07-20 2018-12-18 Qualcomm Incorporated Systems and methods for selecting an image transform
CN105069089B (zh) * 2015-08-04 2019-02-12 小米科技有限责任公司 图片检测方法及装置
US10354364B2 (en) * 2015-09-14 2019-07-16 Intel Corporation Automatic perspective control using vanishing points
RU2640298C1 (ru) 2015-10-12 2017-12-27 Общество С Ограниченной Ответственностью "Яндекс" Способ обработки и хранения изображений
US9824299B2 (en) * 2016-01-04 2017-11-21 Bank Of America Corporation Automatic image duplication identification
US9626596B1 (en) 2016-01-04 2017-04-18 Bank Of America Corporation Image variation engine
CN106155994B (zh) * 2016-06-30 2019-04-26 广东小天才科技有限公司 一种页面内容的比较方法及装置、终端设备
UA121545C2 (uk) * 2016-08-16 2020-06-25 Микола Петрович Чаплагін Автоматичний метод для визначення подібних зображень та фрагментів зображень, який базується на вмісті зображень
KR102587693B1 (ko) * 2021-10-08 2023-10-12 주식회사 디알엠인사이드 이미지 저작권 보호를 위한 이미지 식별 장치 및 이의 동작 방법

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5911139A (en) 1996-03-29 1999-06-08 Virage, Inc. Visual image database search engine which allows for different schema
JP3002721B2 (ja) * 1997-03-17 2000-01-24 警察庁長官 図形位置検出方法及びその装置並びにプログラムを記録した機械読み取り可能な記録媒体
US6456340B1 (en) * 1998-08-12 2002-09-24 Pixonics, Llc Apparatus and method for performing image transforms in a digital display system
EP0990997A1 (en) 1998-09-29 2000-04-05 Eastman Kodak Company A method for controlling and managing redundancy in an image database by elimination of automatically detected exact duplicate and near duplicate images
US6792128B1 (en) * 1999-02-16 2004-09-14 Canon Kabushiki Kaisha Method of inserting and extracting a digital signature
US6941323B1 (en) * 1999-08-09 2005-09-06 Almen Laboratories, Inc. System and method for image comparison and retrieval by enhancing, defining, and parameterizing objects in images
JP3280001B2 (ja) * 1999-09-16 2002-04-30 富士重工業株式会社 ステレオ画像の位置ずれ調整装置
FR2819331B1 (fr) * 2001-01-10 2003-03-28 Canon Kk Procede et dispositif de traitement et de marquage d'un ensemble de coefficients representatifs d'une image numerique
US6744933B2 (en) * 2001-01-18 2004-06-01 Siemens Corporate Research, Inc. Method for image alignment under non-uniform illumination variations

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008165774A (ja) * 2006-12-13 2008-07-17 Canon Inc ドキュメント画像からのパラメータ化された形状の認識方法
JP4594372B2 (ja) * 2006-12-13 2010-12-08 キヤノン株式会社 ドキュメント画像からのパラメータ化された形状の認識方法
JP2012527850A (ja) * 2009-05-21 2012-11-08 ディジマーク コーポレイション ウォーターマーキングとフィンガープリンティングとの組合せ
US9280977B2 (en) 2009-05-21 2016-03-08 Digimarc Corporation Content recognition employing fingerprinting at different resolutions
US9905233B1 (en) 2014-08-07 2018-02-27 Digimarc Corporation Methods and apparatus for facilitating ambient content recognition using digital watermarks, and related arrangements
JP2018194956A (ja) * 2017-05-15 2018-12-06 日本電信電話株式会社 画像認識装置、方法、及びプログラム

Also Published As

Publication number Publication date
US7228006B2 (en) 2007-06-05
US20040103101A1 (en) 2004-05-27
EP1434165A1 (en) 2004-06-30

Similar Documents

Publication Publication Date Title
US7228006B2 (en) Method and system for detecting a geometrically transformed copy of an image
Qureshi et al. A bibliography of pixel-based blind image forgery detection techniques
US8467596B2 (en) Method and apparatus for object pose estimation
JP4739355B2 (ja) 統計的テンプレートマッチングによる高速な物体検出方法
KR101548928B1 (ko) 불변적인 시각적 장면 및 객체 인식
Ruzon et al. Color edge detection with the compass operator
US10410087B2 (en) Automated methods and systems for locating document subimages in images to facilitate extraction of information from the located document subimages
JP5726125B2 (ja) 奥行き画像内の物体を検出する方法およびシステム
Zhang et al. Detecting and extracting the photo composites using planar homography and graph cut
US7542591B2 (en) Target object detecting method, apparatus, and program
Tokuda et al. Computer generated images vs. digital photographs: A synergetic feature and classifier combination approach
EP1296279A2 (en) Method and computer program product for locating facial features
JP2004265407A (ja) デジタル画像におけるカラーオブジェクトの検出方法
KR101781358B1 (ko) 디지털 영상 내의 얼굴 인식을 통한 개인 식별 시스템 및 방법
JP4948593B2 (ja) 以前に圧縮された画像における合成の検出
Thajeel et al. State of the art of copy-move forgery detection techniques: a review
CN111626295B (zh) 车牌检测模型的训练方法和装置
Zhao et al. Optimal chroma-like channel design for passive color image splicing detection
US20030169340A1 (en) Method and apparatus for tracking moving objects in pictures
US7684594B2 (en) Method and apparatus for estimating object part location in digital image data using feature value analysis
JP2010176504A (ja) 画像処理装置、画像処理方法及びプログラム
Hossein-Nejad et al. Copy-move image forgery detection using redundant keypoint elimination method
US7957555B2 (en) Method and apparatus for localizing an object part in digital image data by updating an initial position estimate based on a displacement of the object part
Nataraj et al. Holistic image manipulation detection using pixel co-occurrence matrices
Kumar et al. A review of image features extraction techniques and their applications in image forensic

Legal Events

Date Code Title Description
RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20040415