JP2000112996A - 自動的に検出された正確な複製及び複製画像に近い画像の除去により画像デ―タベ―スの冗長性を制御し、管理する方法 - Google Patents

自動的に検出された正確な複製及び複製画像に近い画像の除去により画像デ―タベ―スの冗長性を制御し、管理する方法

Info

Publication number
JP2000112996A
JP2000112996A JP11275157A JP27515799A JP2000112996A JP 2000112996 A JP2000112996 A JP 2000112996A JP 11275157 A JP11275157 A JP 11275157A JP 27515799 A JP27515799 A JP 27515799A JP 2000112996 A JP2000112996 A JP 2000112996A
Authority
JP
Japan
Prior art keywords
image
database
images
picture
color
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP11275157A
Other languages
English (en)
Inventor
Rajiv Mehrotra
メロットラ ラジィヴ
Zhu Wei
ジュ ウェイ
Donna Marie Romer
マリー ロマー ダナ
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Eastman Kodak Co
Original Assignee
Eastman Kodak Co
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Eastman Kodak Co filed Critical Eastman Kodak Co
Publication of JP2000112996A publication Critical patent/JP2000112996A/ja
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/58Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/583Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
    • G06F16/5862Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using texture

Landscapes

  • Engineering & Computer Science (AREA)
  • Library & Information Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Processing Or Creating Images (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

(57)【要約】 【課題】 与えられた画像の複製及び複製に近いものを
検出するために画像のデータベースを検出し、画像の冗
長性を制御するためにデータベースのユーザー指示編集
のための方法を提供する。 【解決手段】 データベースのデジタル画像を提供し;
画像の描出された特徴に基づく表現を自動的に抽出する
ためにデータベースの一以上のデジタル画像を分析し;
データベースのデジタル画像の描出された特徴に基づく
画像表現を比較することによりデジタル画像の提供され
たデータベースで完全に複製された画像を自動的に検出
し;与えられたデータベースに対応する複製画像のない
画像データベースを形成するために冗長な完全に複製さ
れた画像を自動的に除去する各段階からなる。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明はデジタル画像データ
ベースを処理する方法に関する。
【0002】
【従来の技術】デジタル画像データコレクションの数及
び大きさは急速に成長している。故に、有効で効率的な
画像データ管理技術が本質的に求められている。画像デ
ータベース管理の最近のR&D活動のほとんどは類似性
に基づく検索に関する。画像データ冗長性の管理に対す
る適切な出版物はほとんどが無視されてきた。伝統的な
データベースと同様に、複製され、又は冗長な画像デー
タは画像データベースに望ましくない。
【0003】数千のデジタル画像の所有者のほとんどの
目次は正確な複製画像ファイルに関する。複製画像は画
像ファイルがファイルシステム、CD媒体又は他の画像
データベースシステムから組織のデスクトップへコピー
されることを容易にする結果として画像データベースに
導入される。複数画像ファイルがそれらが由来する同一
のシステムにしばしば再導入される。フォトCDのよう
なCD媒体は容易に配布するために組織内でしばしばコ
ピーされる。組織が画像管理システムを確立したとき
に、同じファイルの複製は管理のワークフローにしばし
ば導入される。ソースがどうであれ、複製された画像デ
ータを識別し、除去する自動的な方法がないことは膨大
なマルチメディアコレクションを効率的に管理するボト
ルネックである。そのような画像データの予め存在する
コレクションに対して、存在する複製された画像データ
を自動的に検出し、及び/又は除去し、コレクションの
ベースラインを再設定することの可能な方法を用いるこ
とが臨界的である。以下にこのことをデータベースクリ
ーニングと称する。リセットされたベースライン(即ち
複製されたいかなる画像データをも持たない)コレクシ
ョンに対して、コレクションへ新たな又は複製でない画
像データのみの挿入を許容する方法がコレクションがど
のような冗長な画像データも含まないことを確実にする
ために必要となる。
【0004】デジタル画像データ冗長性の他の型の制御
及び管理は意図しない(好ましくない)”複製に近いも
の”を含むコレクションに対して必要とされる。意図的
な(好ましくない)”複製に近いもの”の型は”類似
物”と称される画像シーケンスの種類により示される。
例えば幾つかの創造的な応用では写真のショットは”類
似物”と称される一組の画像をほとんど生ずる。内容が
僅かに違う同じ場面の幾つかのフレームが通常撮影され
る。この違いは顧客の種々の要求に一致するために場面
の内容を最大に利用する。換言すると、”類似物”は価
値を有する”複製に近いもの”である。これらの応用
で、デジタル画像のコレクションの価値は内容の選択が
目的にかない、編集ガイドラインに基づくときに大きく
なる。画像コレクションの所有者がデータの冗長性を制
御し、減少するためにデジタル画像データベースの内容
を継続的に編集することは価値がある。”類似物”が望
ましい複製の一例である一方で、そうでないこの範疇の
他のものが存在する。例えば、ある応用で、実質的に類
似の他の存在する画像に関するデータベースにある画像
のベストバージョンを挿入することのみによりデータベ
ースポピュレーションの処理を制御することは価値があ
る。ある条件下で、ある画像を存在する実質的に類似な
画像に加えてデータベースに加えることがより価値のあ
ることもある。他の場合では、実質的に類似の内容で存
在する画像に関するデータベースに新たな画像の挿入を
排除し、廃棄可能な”複製に近いもの”の中に存在する
ある画像を潜在的に削除することがより価値がある。
【0005】内容のランダムで偶然な選択は入力が顧客
の組の選択された行動又はトレンドによりフィルタされ
てきたのと同じく市場性があるわけでは通常ない。組織
化(オーガニゼーション)はそのデジタルコレクション
に内容を加えることに関する通知された決定をなすため
に必要である。最も普通に存在する慣行は純粋に視覚的
な方法によりデータベースから除去し又はそれに挿入す
るために複製及び複製に近い画像をマニュアルで検出す
ることである。画像処理の従来技術から得られる明らか
に自動的な方法は完全(正確)な又はほぼ複製の画像を
検出するためにデータベースの画像の全ての対の画素毎
の比較をなすことである。この処理は計算的に高価であ
り、大きな画像コレクションに対して受容不可能であ
る。
【0006】”類似”又は”複製に近い”画像を自動的
かつ効率的に検出し、ユーザー指示データベース更新を
なすことは価値のある又は目的のあるデジタル画像デー
タコレクションの形成及び維持を助けるために必要とさ
れる。
【0007】
【発明が解決しようとする課題】本発明の目的は上記の
欠点を克服することにある。
【0008】
【課題を解決するための手段】短く要約すると、本発明
の一特徴によれば、(a) データベースのデジタル画
像を提供し;(b) 画像の描出された特徴に基づく表
現を自動的に抽出するためにデータベースの一以上のデ
ジタル画像を分析し;(c) データベースのデジタル
画像の描出された特徴に基づく画像表現を比較すること
によりデジタル画像の提供されたデータベースで完全に
複製された画像を自動的に検出し;(d) 与えられた
データベースに対応する複製画像のない画像データベー
スを形成するために冗長な完全に複製された画像を自動
的に除去する各段階からなる完全な複製画像のない画像
データベースを形成するためにデジタル画像の与えられ
たデータベースを処理する方法が提供される。
【0009】本発明の目的は如何なる与えられた画像の
複製及び複製に近いものを検出するために画像のデータ
ベースを検出する方法を提供することにある。本発明の
更なる目的は如何なる複製画像もないベースライン画像
データベースを形成するために画像データベースを自動
的に処理するための方法を提供することにある。
【0010】本発明の更に他の目的は画像の冗長性を制
御するためにデータベースのユーザー指示編集のための
方法を提供することにある。加えるに、本発明の目的は
入力画像がデータベースに存在する完全な複製であるか
否かを自動的に検出し、複製画像でない画像の挿入だけ
を許容することにより存在する複製画像のない画像デー
タベースへの画像の挿入を管理する方法を提供すること
にある。
【0011】最終的に、本発明の目的は入力画像の複製
に近いものの自動的な検出及びユーザー指示データベー
ス更新動作をなすことによりユーザーによる画像挿入処
理の制御を可能にすることである。
【0012】
【発明の実施の形態】これらの及び他の関連する目的は
以下に図面を参照した説明により明らかとなる。以下の
説明で、本発明はソフトウエアプログラムとしての好ま
しい実施例で記載される。当業者はそのようなソフトウ
エアの等価物はハードウエアにより構成可能であること
は容易に理解しうる。そのようなソフトウエアプログラ
ムはコンピュータシステム上で用いることができ、故に
そのようなシステムは当業者に良く知られており、その
詳細はここでは説明しない。
【0013】このソフトウエアプログラムはコンピュー
タ如何なる読み取り可能な記憶媒体にも記憶されうる。
ここで用いる場合に、コンピュータ読み取り可能記憶媒
体は例えば、磁気ディスク(フロッピーディスクのよう
な)又は磁気テープ磁気記憶媒体、光ディスク、光テー
プのような光記憶媒体、又は機械読み取り可能なバーコ
ード;ランダムアクセスメモリ(RAM)又は読み取り
専用メモリ(ROM)のようなコンピュータ固体電子記
憶装置、又はコンピュータプログラムを記憶するために
用いられる他の物理的装置又は媒体を含む。
【0014】画像データベースのデータ冗長性の主なソ
ースは複製画像である。故に、画像データベースのデー
タ冗長性の管理及び制御は本質的に複製画像の検出及び
除去を必要とする。複製された画像を含まないベースラ
インデータベース20を形成するために存在するデジタ
ル画像コレクション10をコンピュータを用いて処理す
る方法は図1に示される。全体の処理はまず空のベース
ライン画像データベース20から開始する。与えられた
画像コレクション10の各画像は如何なる冗長性をも形
成することなしにベースラインデータベースに加えられ
るか否かを決定するために選択されるS10。冗長性チ
ェックをなすために、選択された画像はその描出された
特徴に基づく表現を抽出されるよう処理されるS20。
カラー、カラー組成、カラーテクスチャー特徴(以下で
決定される)は描出された特徴として好ましい画像表現
スキームで用いられる。好ましいカラー内容に基づく表
現スキームは整合的カラー領域の主に生ずるカラーの組
により画像を表す。そのようなカラーのそれぞれは所定
のカラー空間のカラー値及び画像の整合的カラー領域の
そのカラーの発生頻度により表される。カラーCの画素
はその隣接画素の顕著な数がまたカラーCである場合に
整合的カラー領域に属する。好ましいカラー組成に基づ
く表現スキームはそれぞれの主に発生した整合的カラー
R、Rに接続された整合的カラーの組に関連する。カラ
ーRの接続されたカラーはカラーRの整合カラー領域に
隣接しそれに囲まれ、又はそれを囲む整合カラー領域の
カラーである。好ましいテクスチャーに基づく画像表現
スキームは主に生ずるカラー遷移の組により画像を表現
する。そのようなカラー遷移のそれぞれは所定のカラー
空間の一対の関連するカラー値及び平均、最大、最小及
び遷移で傾斜方向から得られる分散/共分散のような一
組の統計的特性により表される。この実施例では、上記
のカラー、カラー組成、テクスチャー表現の如何なる組
合せも画像を表現するために用いられ得る。例えば、統
合されたカラー及びカラー組成画像表現は一組の主に生
ずる整合的カラーにより画像を表現する。各主な整合的
カラーに関するのは一組の接続された領域整合的カラー
である。各整合的カラー領域は次に発生頻度及びそのカ
ラー値により表される。この画像表現は全ての3つの描
写された特徴に基づく統合された表現を得るようカラー
テクスチャー特徴を加えることにより論証される。当業
者は他の描出的特徴に基づく画像表現が本発明で可能で
あることを認識する。そのような表現は画像を処理する
ことにより自動的に抽出される。テクスチャーに基づく
表現及び抽出方法のある例はR.M.Haralic
k, L.G.Shapiro,Addison−We
sley出版1992年のComputer and
Robot Vision,Vol.I,Chapte
r 9,pp.453−481に記載されている。カラ
ー及びカラー組成に基づく表現及び抽出の例はM.Da
s,E.M.Risse,B.A.Draper,IE
E 1063−6919,1997のFOCUS:Se
arching for Multi−colored
Objects in aDiverse Imag
e Databaseに記載される。この実施例では、
画像は重複しないセクションで埋め尽くされる。各セク
ションに対して、主に生ずる整合的なカラーはセクショ
ンの整合カラーヒストグラムの局部最大を配置すること
により見いだされる。所定の閾値より大きな画素の数を
有するヒストグラムの局部最大に対応するカラーは主に
生ずる整合カラーと考えられる。好ましい閾値は画像セ
クションの画素の全体の数の1%である。或いは主に生
ずる整合カラーは画像の整合カラーヒストグラムの画素
の顕著な数を有するカラーである。セクション内及び隣
接するセクションの主に生ずるカラーは接続されると考
えられる。主に生ずるカラー遷移を配置するために、画
像の各セクションの局部カラー極値又はカラーエッジ画
素は識別される。隣接する極値/エッジ画素の対のカラ
ーは遷移に対応するカラー対を決定する。各セグメント
のカラー対が共に生ずる頻度及びその関連する特性はテ
クスチャーに基づく表現を計算するために解析される。
抽出された画像表現はベースラインデータベースが選択
された画像の完全な複製を含むか否かを決定するため
に、その時のベースライン画像コレクションを検索する
ために用いられるS30。ベースラインデータベースで
完全な複製が見いだされた場合にはS40、選択された
画像がベースラインデータベースに加えられない。そう
でなければ、選択された画像及び画像表現はベースライ
ン画像データベースS50に加えられる。与えられた画
像コレクションの画像の選択及び処理の上記の処理はコ
レクションの全ての画像に対して繰り返される。与えら
れたコレクションの全ての画像を処理した後に得られた
ベースライン画像データベースは複製画像により引き起
こされるデータ冗長性を免れる。
【0015】複製画像に対する検索をなすベースライン
データベースの処理は選択された画像と完全に同じ表現
での画像の識別を含む。この検索を容易にするために、
ベースラインデータベース20はまた全ての記憶された
画像の表現を含む。この実施例では”仮説を立てて検証
する”ことに基づく検索方法が複製画像決定用に用いら
れる。この検索処理は図2に示される。このアプローチ
で、ベースラインデータベース20の画像の表現は下記
の一以上のインデックス構造で構成される。これらの表
現インデックス構造は選択された画像の複製に対する候
補である画像を識別するために更に解析するために一組
の画像ids及び関連する画像表現を得るために検索さ
れるS115。この組の全ての画像表現は選択された画
像の表現と比較されるS120。選択された画像表現と
完全に適合する表現を有する画像は選択された画像の複
製用の候補と考えられる。選択された画像の複製画像に
対する候補が見いだされた場合にS125各候補の認証
が確認されるS135。候補の画像Aが選択された画像
Bの実際の複製であるか否かを確認するためにS13
5、画像Aはベースラインデータベース20から検索さ
れ、測度D=Σ|A(i,j)−B(i,j)|,i=
1,N及びj=1,Mを用いて画素毎の差の計算をなす
ことにより選択された画像Bと比較され、ここでA
(i,j)は候補画像Aの位置(i,j)での画素のカ
ラーであり、B(i,j)は選択された画像Bの位置
(i,j)での画素のカラーであり、2つの画像の大き
さはNxMである。画像AはD=0の場合にのみBの完
全な複製である。この確認テストを満足する如何なる候
補も選択された画像の完全な複製であるS145。画像
は描写された特徴に基づく表現の抽出及び確認テストに
対して所望の大きさにスケールダウンされうる。
【0016】多次元点(multi−dimensio
nal point)又は空間アクセス法が画像表現を
構成するために用いられる。そのようなインデックス構
造の例はKD−B木、R−木、及びその変形、バディ
(buddy)木、グリッドファイルを含む。この実施
例では、2つの2次元R木に基づくポイントアクセス法
が画像表現を構成するために用いられる。これらの構造
の一つは主に生じる整合カラーにに基づく画像表現を組
織化しその他はカラーテクスチャー特性に基づく画像表
現を組織化する。画像の唯一の主に生じる整合カラーの
全体の数Kは整合カラーに基づくインデックス構造の第
一の次元を構成し、これらのカラー値のカラー関数は第
二の次元を構成する。画像の唯一の主に発生するカラー
対の全体の数Kはテクスチャーに基づくインデックス構
造の第一の次元を形成し、インデックスの第二の次元は
これらのカラー対の値のカラー関数である。両方の場合
で好ましいカラー関数は[Σ(Ci)2 1 /2,i=
1,nでありここでnはKの唯一の主な整合カラーの組
又は画像から見いだされた主なカラー対(遷移)からの
所定のスキームを用いて選択された唯一の主な整合カラ
ー又は主なカラー対(カラー遷移)であり、Ciはi番
目のカラー又はカラー対の値である。この実施例では、
画像で見いだされた唯一の主な整合カラー又はカラー対
(遷移)の全体の数が所定の最大値Tより小さい場合に
は全てのカラー又はカラー対(遷移)値はカラーに基づ
く関数の計算に用いられる。そうでなければ、Tの最も
主な整合カラー又はカラー対(遷移)がインデックス位
置に対するカラー関数の計算に用いられる。Tの最も主
な整合カラー又はカラー対(遷移)の複数の組が画像に
対して形成され、故に、カラー又はカラー対(遷移)の
そのような各組がその画像の二次元ポイント表現を形成
するよう用いられる。この実施例では、Tは4から8ま
での任意の数である。そのような二次元表現のそれぞれ
はインデックスに加えられる。(画像ID、関連する完
全な画像表現)の対のリストが各インデックス構造の各
リーフノードに関係する。選択された画像の表現は二次
元表現の適合を有する画像を識別するためにこれらのイ
ンデックス構造の一つ又は両方を検索するために用いら
れる。好ましい検索スキームは選択された画像の表現が
一以上の整合カラー領域を含む場合に整合カラーに基づ
くインデックスを検索することである。テクスチャーに
基づくインデックスは選択された画像表現が整合カラー
領域を含まない場合のみこの実施例で検索される。選択
肢がまたインデックス構造を検索し、2つの検索により
得られた画像IDの組の挿入の両方をなす。検索が終了
する全てのリーフノードにより示される画像IDのリス
ト及びその画像表現は選択された画像の表現に完全に適
合する描写された特徴に基づく表現を有する画像を識別
するために更に解析される。これらの画像は選択された
画像の複製に対する候補画像の組を形成する。当業者に
はインデックス構造は画像表現スキームに依存し、故に
他の表現スキーム及び関連するインデックス構造が本発
明の範囲内で複製を検出するために用いられることは明
らかである。またインデックス構造はコンピュータの第
一及び/又は第二の記憶に全体又は部分が駐在しうる。
【0017】複製に近い画像はまた画像データベースの
データ冗長性を生ずる。複製に近いものの編集選択は冗
長性を制御する一方で最も価値のある又は市場性のある
画像コレクションを維持するために重要である。与えら
れたデジタル画像コレクションからベースライン画像デ
ータベースの編集形成を助けるコンピュータ実施方法は
図3に示される。与えられたベースラインコレクション
35で、コレクションの各画像は選択されS200、処
理される。処理は選択された画像の描写特徴に基づく画
像表現の自動抽出で開始するS210。本発明のこの実
施例では上記の統合されたカラー、カラー組成(com
position)、テクスチャーに基づく画像表現ス
キームが用いられる。抽出された表現は選択された画像
の完全な複製及び複製に近い候補に対するその時のベー
スラインデータベースを検索するために用いられるS2
20。好ましい実施例では、上記の二次元R木に基づく
ポイントアクセス法がベースラインデータベースの画像
の表現を構成するために用いられる。故に、インデック
スに基づく検索が選択された画像の正確な複製(dup
licate)及び複製に近いものに対する候補を識別
するために用いられる。
【0018】ベースラインデジタル画像データベースの
インデックスに基づく検索の処理は図4に示される。選
択された画像の抽出された表現が与えられると、適切な
インデックス構造が同じ二次元ポイント表現を有する画
像に対して検索されるS221。画像IDの組及び検索
が終了するリーフノードにより指示された関連する表現
が得られる。この組の全ての画像表現は選択された画像
と同じ二次元ポイント表現にマップされる。この組の画
像表現は選択された画像の完全な複製及び複製に近いも
のの候補を識別するS222。好ましい実施例は複製に
近い画像は主に生ずるカラー、接続されたカラー、主に
共に生ずるカラー対の同一の組を有すると仮定される。
しかしそれらは主なカラー、接続されたカラーの大き
さ、テクスチャー特性の発生の頻度で若干異なる。選択
された画像Sの複写及び複写に近い候補の識別のため
に、二つの選択肢が好ましい実施例で利用可能である。
第一の選択肢はSを各描出された特徴に基づく表現(即
ちカラー、カラー組成、カラーテクスチャー)に関する
インデックス検索を表すことにより得られた画像の組の
各画像Iと比較する。画像Iは全ての特徴fに対して、
f (If ,Sf )<H f である場合には、Sの複製に
近い候補と考えられ、ここでDf (If ,Sf )はIと
Sとの特徴fに基づく表現の間の距離であり、Hf は対
応する閾値である。最適な適合に対して値1を得るDf
に対する好ましいHf の値は0.95である。最適な適
合に対して値0を得るDf に対する好ましいHf の値は
0.05である。完全な複製及び複製に近い候補の識別
に対する第二の選択肢は選択された画像Sの統合された
表現はインデックス検索を表すことにより得られる画像
の組の各画像Iの統合表現(integrated r
epresentation)と比較される。好ましい
実施例では使用された距離関数はV(I,S)=Σω z
*diff(Iz ,Sz )の形であり、ここでzは画像
表現の要素であり、I z ,Sz はそれぞれ画像I及び選
択された画像Sの表現で特性zの値であり、diffは
z ,Sz の間の差を測定する距離関数であり、ωz
全ての重みの和が1であるような特性zの重みである。
【0019】和は画像表現の全ての特性にわたって計算
される。この実施例では、diff関数は完全な適合に
対して1の値、最悪の適合に対して最小値0を出力す
る。好ましくは0.95である所定の閾値より小さいV
(I,S)の値を有する画像Iは画像Sの複製に近いと
考えられる。複製に近い候補PはV(P、S)の値が1
に等しい場合に、Sの正確な複製に対する候補である。
当業者には他の距離関数が本発明の範囲内でV()の計
算のために用いられることが明らかである。完全な複製
の候補が見いだされた場合にはS223、上記の確認テ
ストが選択された画像の正確な複製の候補に対してなさ
れるS224。完全な複製の候補が確認テストを満足し
た場合にS225、それは真の複製に近い組を得るため
に複製に近い組から除去される。真の複製に近い候補が
存在する場合にはS226、確認法方が選択された画像
の真の複製に近いものの最終リストを得るために真の複
製に近いものの認証をテストするために選択的に用いら
れるS227−S228。好ましい実施例では、真の複
製に近い候補の確認は
【0020】
【数1】
【0021】のカラーヒストグラムを比較することによ
り確認され、距離測度を用いる真の複製に近い候補c及
び選択された画像sである。ここでHg (n)は大きさ
Ωg の画像gのカラーnの画素の数を示し、Nはヒスト
グラムのカラーの総数を示す。画像cはZ(c,s)<
Θの場合に複製に近いものと確認され、ここでΘは所定
の閾値である。Θの好ましい値は0.05である。
【0022】図3を参照するに、その時に基づいたデー
タベースで真の複製に近いもの又は完全な複製が見いだ
されない場合にはS230、選択された画像及びその表
現はベースラインデータベースS240に加えられる。
完全な複製がベースラインデータベースで見いだされた
場合にはS250、選択された画像がベースラインデー
タベースに加えられない。真の複製に近いものが見いだ
されたときにはS260,全ての真の複製に近い画像が
検索され、編集データベースの更新決定をなす処理に対
して選択された画像に沿って表示又は出力されるS28
0。ユーザー指示ベースラインデータベース更新動作が
なされるS290。与えられたデジタル画像コレクショ
ンの画像を選択し、処理する処理はコレクションの全て
の画像に対して繰り返される。与えられたコレクション
の画像全てを処理した後に得られたベースライン画像デ
ータベース45は複製画像を含まず、選択された複製に
近いものにより生じた編集的に制御された冗長性を有す
る。完全な複製画像なしに、ユーザー選択又は所望の複
製に近い画像を有する画像データベースは制御された冗
長性を有する画像データベースと称される。複製に近い
ものの表示S280および編集的なベースラインデータ
ベースの更新S290は対話的又はオフラインでなされ
る。上記の段階は与えられたコレクションで全ての画像
に対して繰り返される。検出された複製画像に近い組に
ついての情報は複製に近い画像に対する将来の検索の計
算コストを減少するためにシステム選択的にに記憶され
る。この場合に複製に近い画像の組βに属している画像
pが如何なる与えられた画像kの”複製に近い”ことが
見いだされた場合にはβの組の全ての画像は更なる解析
なしに画像kの複製に近い画像と考えられる。
【0023】ユーザー指示ベースラインデータベース更
新処理のキー段階は図5に示される。選択された画像及
び検出された真の複製に近いものはユーザーのレビュー
及び決定のために表示され又は出力されるS300。ユ
ーザーはデータベースから除去又はそれに記憶するため
に一以上の表示された画像を選択するS310。ユーザ
ーが選択された画像を記憶するために選択した場合には
S320、選択された画像及びその表現はベースライン
データベースに加えられるS230。そうでなければ、
ユーザーが現在のベースラインデータベースから存在す
る複製に近い画像のいずれかを消去するために選択した
場合にS340、その画像及び関連した表現は現在のベ
ースラインデータベースから消去されるS350。選択
された画像、その複製に近いものを表示し、データベー
ス更新動作に対するユーザーのフィードバックを得るた
めに如何なるフォーマットも本発明の範囲内である。
【0024】一旦ベースラインデータベースが所定のデ
ジタル画像コレクションから形成されると、付加的な画
像の挿入はベースラインデータベースの制御されたデー
タ冗長性を維持するために管理される必要がある。好ま
しい実施例で用いられたコンピュータ実施画像挿入管理
方法は図6に要約されている。挿入される画像50が提
供される。その描出された特徴に基づく表現は計算され
るS400。現在のベースラインデジタル画像データベ
ースは完全な複製又は複製に近いものを見いだすために
検索されるS410。入力画像の完全又は複製に近いも
のが見いだされない場合にはS420、画像及びその表
現はベースラインデータベースに付加されるS430。
入力画像の完全な複製が見いだされた場合にはS44
0、入力画像はベースラインデータベースに付加されな
い。一以上の複製に近いものが見いだされた場合にはS
450、入力画像及び検出された複製に近いものはユー
ザーのレビュー及びフィードバックのために出力又は表
示されるS460。ユーザー指示ベースラインデータベ
ース更新動作はなされS470、更新されたベースライ
ン画像データベース60が得られる。
【0025】好ましい実施例の上記の対象を通して、当
業者にはそれは対応する特徴に基づく画像表現を用いる
ことによりモノクロ又は濃度画像に容易に延在すること
が可能であることが明らかである。例えば、濃度画像は
主に生ずる整合的な濃度領域及び主に生ずる濃度遷移の
特性及び組成の項目で表される。本発明はデジタル画像
理解に関する。
【図面の簡単な説明】
【図1】完全な複製画像の自動検出及び除去により完全
な複製画像のないベースラインデジタル画像データベー
スの形成を示すフローチャートである。
【図2】与えられた画像の完全な複製画像を検出するた
めにベースラインデジタル画像データベースの自動検索
を示すフローチャートである。
【図3】(a)完全な複製画像の自動検出及び除去、
(b)複製画像に近いものの自動検出、(c)複製画像
に近い望ましくない画像のユーザー指示による除去によ
り制御されたデータ冗長性を有するベースラインデジタ
ル画像データベースの形成を示すフローチャートであ
る。
【図4】与えられた画像の完全な複製画像及び複製画像
に近いものの検出のために制御されたデータ冗長性を有
するベースラインデジタル画像データベースの自動検索
を示すフローチャートである。
【図5】デジタル画像データベースのデータ冗長性のユ
ーザー指示による制御を示すフローチャートである。
【図6】デジタル画像のベースラインデジタル画像デー
タベースへの挿入を示すフローチャートである。
【符号の説明】
10 入力デジタル画像コレクション 20 ベースラインデジタル画像データベース 45 編集的に形成されたベースラインデジタル画像デ
ータベース 40 ベースライン画像データベース 50 画像 60 更新されたベースライン画像データベース
───────────────────────────────────────────────────── フロントページの続き (72)発明者 ウェイ ジュ アメリカ合衆国,ニューヨーク 14620, ロチェスター,クリッテンデン・ブルヴァ ード 60,アパートメント1231 (72)発明者 ダナ マリー ロマー アメリカ合衆国,ヴァージニア 22311, アレクサンドリア,ノース・ハイヴュー・ レーン 1461,アパートメント310

Claims (3)

    【特許請求の範囲】
  1. 【請求項1】(a) データベースデジタル画像を提供
    し; (b) 画像の描出された特徴に基づく表現を自動的に
    抽出するためにデータベースの一以上のデジタル画像を
    分析し; (c) データベースのデジタル画像の描出された特徴
    に基づく画像表現を比較することによりデジタル画像の
    提供されたデータベースで正確に複製された画像を自動
    的に検出し; (d) 与えられたデータベースに対応する複製画像の
    ない画像データベースを形成するために冗長な正確に複
    製された画像を自動的に除去する各段階からなる正確な
    複製画像のない画像データベースを形成するためにデジ
    タル画像の与えられたデータベースを処理する方法。
  2. 【請求項2】 デジタル画像を表すために描出された特
    徴としてカラー、カラー組成、テクスチャーを単独で、
    又は組み合わせて用いることを更に含む請求項1記載の
    方法。
  3. 【請求項3】(a) デジタル画像のデータベースを提
    供し; (b) 画像の描出された特徴に基づく画像表現を自動
    的に抽出するためにデータベースの一以上のデジタル画
    像を分析し; (c) データベースのデジタル画像の描出された特徴
    に基づく画像表現を比較することによりデジタル画像の
    提供されたデータベースで正確に複製された画像を自動
    的に検出し; (d) データベースのデジタル画像の描出された特徴
    に基づく画像表現を比較することによりデジタル画像の
    提供されたデータベースで複製に近い画像を自動的に検
    出し; (e) 制御された冗長性を有する画像データベースを
    得るために冗長な正確に複製された画像及び望ましくな
    い複製に近い画像を除去する各段階からなる、正確な複
    製画像のない、望ましい複製に近い画像を含む画像デー
    タベースの形成を助けるためにデジタル画像の与えられ
    たデータベースを処理する方法。
JP11275157A 1998-09-29 1999-09-28 自動的に検出された正確な複製及び複製画像に近い画像の除去により画像デ―タベ―スの冗長性を制御し、管理する方法 Pending JP2000112996A (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US16290398A 1998-09-29 1998-09-29
US162903 1998-09-29

Publications (1)

Publication Number Publication Date
JP2000112996A true JP2000112996A (ja) 2000-04-21

Family

ID=22587603

Family Applications (1)

Application Number Title Priority Date Filing Date
JP11275157A Pending JP2000112996A (ja) 1998-09-29 1999-09-28 自動的に検出された正確な複製及び複製画像に近い画像の除去により画像デ―タベ―スの冗長性を制御し、管理する方法

Country Status (2)

Country Link
EP (1) EP0990997A1 (ja)
JP (1) JP2000112996A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006134255A (ja) * 2004-11-09 2006-05-25 Sharp Corp 画像検索装置、画像形成装置、画像検索方法、画像検索プログラムおよびコンピュータ読取り可能な記録媒体
JP2013538402A (ja) * 2010-09-01 2013-10-10 アップル インコーポレイテッド 重複画像に関するメタデータの統合

Families Citing this family (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7228006B2 (en) 2002-11-25 2007-06-05 Eastman Kodak Company Method and system for detecting a geometrically transformed copy of an image
FR2861870B1 (fr) * 2003-11-05 2006-04-21 Canon Res Ct France S A S Aide a la publication d'image
US8243999B2 (en) * 2006-05-03 2012-08-14 Ut-Battelle, Llc Method and system for the diagnosis of disease using retinal image content and an archive of diagnosed human patient data
FR2913277B1 (fr) * 2007-03-02 2009-05-29 Jean Baptiste Dumont Procede pour indexer et rechercher, dans une base de donnees des informations associees a des images, evitant la redondance d'informations, base sur une analyse de similarite entre les images.
US8295651B2 (en) 2008-09-23 2012-10-23 Microsoft Corporation Coherent phrase model for efficient image near-duplicate retrieval
CN102265598A (zh) * 2008-10-26 2011-11-30 惠普开发有限公司 使用基于内容的过滤和基于主题的聚类将图像布置到页面中
US8218838B2 (en) 2008-11-03 2012-07-10 Ut-Battelle, Llc Method and system for assigning a confidence metric for automated determination of optic disc location
US9710491B2 (en) 2009-11-02 2017-07-18 Microsoft Technology Licensing, Llc Content-based image search
US8433140B2 (en) 2009-11-02 2013-04-30 Microsoft Corporation Image metadata propagation
US8805165B2 (en) 2010-11-09 2014-08-12 Kodak Alaris Inc. Aligning and summarizing different photo streams
US8380039B2 (en) 2010-11-09 2013-02-19 Eastman Kodak Company Method for aligning different photo streams
US8908911B2 (en) 2011-03-04 2014-12-09 Qualcomm Incorporated Redundant detection filtering
CN103020086B (zh) * 2011-09-26 2016-10-05 北大方正集团有限公司 一种图片查重的方法及装置
EP2608062A1 (en) * 2011-12-23 2013-06-26 Thomson Licensing Method of automatic management of images in a collection of images and corresponding device
US9530072B2 (en) 2013-03-15 2016-12-27 Dropbox, Inc. Duplicate/near duplicate detection and image registration
GB201310007D0 (en) * 2013-06-04 2013-07-17 Lyst Ltd Merchant system
RU2640298C1 (ru) 2015-10-12 2017-12-27 Общество С Ограниченной Ответственностью "Яндекс" Способ обработки и хранения изображений
CA3134394A1 (en) * 2019-04-01 2020-10-08 Citrix Systems, Inc. Automatic image capture
CN110413603B (zh) * 2019-08-06 2023-02-24 北京字节跳动网络技术有限公司 重复数据的确定方法、装置、电子设备及计算机存储介质

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH10269338A (ja) * 1997-03-26 1998-10-09 Dainippon Screen Mfg Co Ltd 画像データベースシステム

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006134255A (ja) * 2004-11-09 2006-05-25 Sharp Corp 画像検索装置、画像形成装置、画像検索方法、画像検索プログラムおよびコンピュータ読取り可能な記録媒体
US7602999B2 (en) 2004-11-09 2009-10-13 Sharp Kabushiki Kaisha Image searching device, image forming device, image searching method, image searching program, and computer-readable storage medium
JP2013538402A (ja) * 2010-09-01 2013-10-10 アップル インコーポレイテッド 重複画像に関するメタデータの統合
US8774561B2 (en) 2010-09-01 2014-07-08 Apple Inc. Consolidating information relating to duplicate images
KR101430889B1 (ko) * 2010-09-01 2014-08-18 애플 인크. 복사 이미지들에 관한 메타데이터의 통합
US9805086B2 (en) 2010-09-01 2017-10-31 Apple Inc. Consolidating information relating to duplicate images

Also Published As

Publication number Publication date
EP0990997A1 (en) 2000-04-05

Similar Documents

Publication Publication Date Title
JP2000112996A (ja) 自動的に検出された正確な複製及び複製画像に近い画像の除去により画像デ―タベ―スの冗長性を制御し、管理する方法
US9430719B2 (en) System and method for providing objectified image renderings using recognition information from images
US7809722B2 (en) System and method for enabling search and retrieval from image files based on recognized information
US8897505B2 (en) System and method for enabling the use of captured images through recognition
US7809192B2 (en) System and method for recognizing objects from images and identifying relevancy amongst images and information
JP5537557B2 (ja) 事象毎に意味論的に分類する方法
US6396963B2 (en) Photocollage generation and modification
US8032539B2 (en) Method and apparatus for semantic assisted rating of multimedia content
JP4139615B2 (ja) 前景/背景セグメント化を用いた画像のイベント・クラスタリング
Cao et al. Annotating photo collections by label propagation according to multiple similarity cues
JP4160305B2 (ja) 画像の類似性を決定するシステム及び方法
EP1004967B1 (en) Photocollage generation and modification using image recognition
JP2004348591A (ja) 文書検索方法及び装置
WO2006096384A1 (en) Additive clustering of images lacking temporal information
US20200210746A1 (en) Floating form processing based on topological structures of documents
JP2001243236A (ja) 映像特徴抽出方法、映像特徴抽出装置、映像検索方法、映像検索装置、およびそのプログラムを記録した記録媒体
JP2005107931A (ja) 画像検索装置
CN115221856A (zh) 一种同时基于图像、视频和文本内容对文档相似性进行判断的方法
Xu et al. Object-based image labeling through learning by example and multi-level segmentation
JP3529036B2 (ja) 文書付き画像の分類方法
JP2011100240A (ja) 代表画像抽出方法,代表画像抽出装置および代表画像抽出プログラム
Das et al. Automatic segmentation and indexing in a database of bird images
Umamaheswaran et al. Variants, meta-heuristic solution approaches and applications for image retrieval in business–comprehensive review and framework
Carvalho et al. Attributing semantics to personal photographs
YAN et al. CONTENT AND CONTENT BASED APPROACH FOR PHOTOGRAPH ORGANIZING IN EVENTS