JP2007524952A - 画像処理システムおよび方法 - Google Patents

画像処理システムおよび方法 Download PDF

Info

Publication number
JP2007524952A
JP2007524952A JP2007500317A JP2007500317A JP2007524952A JP 2007524952 A JP2007524952 A JP 2007524952A JP 2007500317 A JP2007500317 A JP 2007500317A JP 2007500317 A JP2007500317 A JP 2007500317A JP 2007524952 A JP2007524952 A JP 2007524952A
Authority
JP
Japan
Prior art keywords
data
image
descriptor
library
digital image
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2007500317A
Other languages
English (en)
Other versions
JP4904255B2 (ja
Inventor
バンダス,ピーター
Original Assignee
エイティーアイ・テクノロジーズ,インコーポレイテッド
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by エイティーアイ・テクノロジーズ,インコーポレイテッド filed Critical エイティーアイ・テクノロジーズ,インコーポレイテッド
Publication of JP2007524952A publication Critical patent/JP2007524952A/ja
Application granted granted Critical
Publication of JP4904255B2 publication Critical patent/JP4904255B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/58Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/583Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
    • G06F16/5838Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using colour
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/10Terrestrial scenes
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/99941Database schema or data structure
    • Y10S707/99944Object-oriented database structure
    • Y10S707/99945Object-oriented database structure processing
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/99941Database schema or data structure
    • Y10S707/99948Application of database or data structure, e.g. distributed, multimedia, or image

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Library & Information Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Image Analysis (AREA)
  • Processing Or Creating Images (AREA)

Abstract

デジタル画像の選択されたオブジェクトデータを含む画像データを受信し、電子認識プロセスにより、デジタル画像の選択されたオブジェクトデータと、画像記述子ライブラリデータと関連した画像オブジェクトライブラリデータとの間で認識適合が得られるかを判定する画像処理システムと方法が提供される。ユーザインタフェースは、デジタル画像の選択されたオブジェクトデータと画像記述子ライブラリデータとの間で認識適合が生じたら、画像記述子ライブラリデータに関連する選択可能な適合したオブジェクト記述子データを提示する。それを受けて、ユーザインタフェースは、画像記述子ライブラリデータがデジタル画像の選択されたオブジェクトデータと対応することを確認するためにユーザフィードバックデータを提供するか、または適合が生じなかったり誤った適合が生じると、画像関連記述子データを生成するために、入力された記述子データを提供する。

Description

本発明は一般に画像処理システム、特に、画像データを編成するための画像処理システムに関する。
昨今、デジタル画像、デジタルビデオおよびデジタルオーディオのライブラリといったマルチメディアライブラリが急増している。これは少なくとも一部には、例えばデジタルカメラや、デジタルビデオおよびデジタルボイスレコーダの普及により、画像、ビデオおよびオーディオのデジタル化が容易になったことと、これらのメディアに効率的にアクセスしかつ交換するための通信媒体としてインターネットが利用し易くなったことに起因する。このため、画像処理システムが、アーカイブ、インターネットコンテンツサイトなどだけでなく、これらのマルチメディアライブラリも編成して、これらのマルチメディアライブラリで画像データを閲覧し、検索し、取り出すことを可能にすることの重要性がますます増大している。
マルチメディアライブラリや他のアーカイブの急激な成長は特定の情報の検索をますますより困難なものにしている。この困難は少なくとも一部には、記述的なマルチメディアライブラリの効率的な作成を支援したり、これらのリソースの検索を容易にするためのツールが欠如していることに因るものである。利用できる情報が膨大な量に上るため、デジタル画像、ビデオまたはオーディオを保存し、後日それを再生することはそう単純ではない。このため斯かる膨大なマルチメディアライブラリを作成し、編成し、そして検索するための新たな技術が必要とされている。
マルチメディアライブラリを効率的に作成するのに伴う問題に加えて、そこから必要な情報を検索することに問題が存在する。テキストの検索では一般的にキーワードを使用する。加えて、マルチメディアライブラリはマルチメディアに関連する1つ以上のフィルタ基準(filter criteria)に基づいて検索された上で結果が表示される場合がある。例えば、第1および第2のフィルタ基準がデジタル画像に関連する記述的ファイル名に適用されることがある。しかしながら、マルチメディアライブラリ内のデジタル画像のコンテンツの包括的なリストは決して作成されなかったので、デジタル画像に関連する特定の記述的ファイル名は可能ではなかったと思われる。
マルチメディアデータベースの検索を容易にするための1つの方法として、例えば特定のデジタル画像またはビデオクリップをより効率的に検索するために、記述子がデジタル画像内のオブジェクトデータと手作業で関連付けされることがあるが、しかしながら、オブジェクトデータに関連する記述子は手作業で入力されなければならない。例えば、ユーザは一般的に画像内の各オブジェクトを外観し、次に表示画像と関連付けられる記述子を手作業で入力しなければならない。しかしながら、このプロセスは時間がかかり、非効率的で、法外にコスト高であって、その結果、多くの場合、実行されない。さらに、画像データと関連付けるための記述子を手作業で入力することから、記述子のスペルの間違いや同一の記述子でも様々なスペルがあることに起因して、選択されたオブジェクトが異なった記述子で保存される蓋然性が増大する。結果として、マルチメディアライブラリを作成するための斯かる方法によれば、検索はマルチメディアライブラリと以前手作業で関連付けられた記述子に制限され、それ故、記述子のスペルが間違ったままだったりそのオブジェクトに以前から何も記述子が関連付けられていなければ画像の抽出は不可能である。結果的に、マルチメディアデータベースの効率的で完全なサーチは不可能である。
本発明の第1の形態として画像処理方法が提供される。この画像処理方法は、
電子認識プロセスによって、デジタル画像の選択されたオブジェクトデータと、画像オブジェクトライブラリデータ(image object library data)との間で認識の適合が生じるかどうかを判定し、
デジタル画像の選択されたオブジェクトデータと画像オブジェクトライブラリデータとの間で認識の適合があると判定されたら、画像記述子ライブラリデータと関連付けられた選択可能な適合したオブジェクト記述子データを提示し、
画像記述子ライブラリデータがデジタル画像の選択されたオブジェクトデータと対応することを確認するため、選択可能な適合したオブジェクト記述子データを提示したことを受けてユーザフィードバックデータを受信し、
画像記述子ライブラリデータをデジタル画像と関連付けて画像関連(画像と関連付けられた)記述子ライブラリデータ(descriptor associated image library data)を生成する、ことから成る。
本発明の第2の形態として別の画像処理方法が提供される。この画像処理方法は、
デジタル画像を表現する画像データを受信し、
画像データを受信したことを受けて、デジタル画像の選択されたオブジェクトデータを生成し、
電子認識プロセスによって、デジタル画像の選択されたオブジェクトデータと、画像記述子ライブラリデータと関連した画像オブジェクトライブラリデータとの間で認識の適合が生じるかどうかを判定し、
デジタル画像の選択されたオブジェクトデータと画像オブジェクトライブラリデータとの間で認識の適合があると判定されたら、画像記述子ライブラリデータと関連付けられた選択可能な適合したオブジェクト記述子データを提示し、
画像記述子ライブラリデータがデジタル画像の選択されたオブジェクトデータと対応することを確認するため、選択可能な適合したオブジェクト記述子データを提示したことを受けてユーザフィードバックデータを受信し、
画像記述子ライブラリデータをデジタル画像と関連付けて画像関連記述子ライブラリデータを生成する、ことから成る。
本発明の第3の形態として画像処理システムが提供される。この画像処理システムは、
画像オブジェクトライブラリデータ、および画像オブジェクトライブラリデータと関連した画像記述子ライブラリデータを含むメモリと、
メモリと動作可能に結合しており、デジタル画像の選択されたオブジェクトデータ、画像オブジェクトライブラリデータおよび画像記述子ライブラリデータを受信し、それを受けて、電子認識プロセスによって、デジタル画像の選択されたオブジェクトデータと画像オブジェクトライブラリデータとの間で認識の適合が生じるかどうかを判定し、デジタル画像の選択されたオブジェクトデータと画像オブジェクトライブラリデータとの間で認識の適合があると判定されたら、画像記述子ライブラリデータに関連する選択可能な適合したオブジェクト記述子データを提示し、画像記述子ライブラリデータがデジタル画像の選択されたオブジェクトデータと対応することを確認するため、選択可能な適合したオブジェクト記述子データが提示されたことを受けてユーザフィードバックデータを受信し、画像記述子ライブラリデータをデジタル画像と関連付けて画像関連記述子ライブラリデータを生成する働きをするオブジェクト認識器(object recognizer)とを具備する。
本発明の第4の形態として別の画像処理方法が提供される。この画像処理方法は、
画像オブジェクトライブラリデータ、および画像オブジェクトライブラリデータと関連した画像記述子ライブラリデータを含むメモリと、
メモリに動作可能に結合しており、画像オブジェクトライブラリデータと画像記述子ライブラリデータを生成する働きをするライブラリアクセス回路(library access circuit)と、
ライブラリアクセス回路と動作可能に結合されており、デジタル画像の選択されたオブジェクトデータ、画像オブジェクトライブラリデータおよび画像記述子ライブラリデータを受信し、それを受けて、電子認識プロセスによって、デジタル画像の選択されたオブジェクトデータと画像オブジェクトライブラリデータとの間で認識の適合が生じるかどうかを判定し、デジタル画像の選択されたオブジェクトデータと画像オブジェクトライブラリデータとの間で認識の適合があると判定されたら、画像オブジェクトライブラリデータに関連する選択可能な適合したオブジェクト記述子データを生成する働きをするオブジェクト認識器と、
オブジェクト認識器に動作可能に結合しており、選択可能な適合したオブジェクト記述子データを表示し、それを受けて、画像記述子ライブラリデータがデジタル画像の選択されたオブジェクトデータと対応することを確認するためにユーザフィードバックデータをオブジェクト認識器に提供する働きをするユーザインタフェース(user interface)とを具備し、画像識別子ライブラリデータは画像関連記述子ライブラリデータを生成するためにデジタル画像の選択されたオブジェクトデータと関連付けられる、ことを特徴とする。
本発明の第5の形態として1つ以上の処理装置によって実行可能な命令を含むメモリが提供される。前記命令は、
電子認識プロセスによって、デジタル画像の選択されたオブジェクトデータと、画像記述子ライブラリデータと関連した画像オブジェクトライブラリデータとの間で認識の適合が生じるかどうかを判定することと、
デジタル画像の選択されたオブジェクトデータと画像オブジェクトライブラリデータとの間で認識の適合があると判定されたら、画像記述子ライブラリデータに関連する選択可能な適合したオブジェクト記述子データを提示することと、
画像記述子ライブラリデータがデジタル画像の選択されたオブジェクトデータと対応することを確認するために選択可能な適合したオブジェクト記述子データを提示したことを受けてユーザフィードバックデータを受信することと、
画像記述子ライブラリデータをデジタル画像と関連付けて画像関連記述子ライブラリデータを生成することを前記1つ以上の処理装置に実行させる。
本発明の画像処理システムおよび方法は、デジタル画像の選択されたオブジェクトデータを含む画像データを受信し、電子認識プロセスによって、デジタル画像の選択されたオブジェクトデータと画像オブジェクトライブラリデータとの間で認識の適合が生じるかどうかを判定する。画像オブジェクトライブラリデータはライブラリデータベースに保存され、画像記述子ライブラリデータと関連付けられている。ユーザインタフェースは、デジタル画像の選択されたオブジェクトデータと画像記述子ライブラリデータとの間で認識の適合があると判定されたら、画像記述子ライブラリデータと関連付けられた選択可能な適合したオブジェクト記述子データを提示する。ユーザインタフェースは、画像記述子ライブラリデータがデジタル画像の選択されたオブジェクトデータと対応することを確認するため、選択可能な適合したオブジェクト記述子データを提示したことを受けてユーザフィードバックデータを提供する。代わりに、画像記述子ライブラリデータとデジタル画像の選択されたオブジェクトデータとの間で認識の適合がなかったりまたは適合が誤っていたりした場合には、ユーザインタフェースは入力された記述子データを提供する。本発明の画像処理システムおよび方法は画像記述子ライブラリデータまたは入力された記述子データをデジタル画像と関連付けて画像関連記述子ライブラリデータを生成する。
本発明の画像処理システムはオブジェクト認識器とメモリを含む。メモリは少なくとも画像オブジェクトライブラリデータとこの画像オブジェクトライブラリデータと関連した画像記述子ライブラリデータを記憶する。画像オブジェクトライブラリデータは画像記述子ライブラリデータと既に関連付けられており、メモリに保存されている場合がある。オブジェクト認識器は、ホストプロセッサの一部、グラフィックス・コプロセッサ(graphics coprocessor)といったコプロセッサの一部、あるいはデジタル画像の選択されたオブジェクトデータに関して画像認識を実行するための任意の適切な装置の一部である場合がある。オブジェクト認識器は、デジタル画像の選択されたオブジェクトデータ、画像オブジェクトライブラリデータおよび画像記述子ライブラリデータを受信し、受信したことを受けて、デジタル画像の選択されたオブジェクトデータと画像オブジェクトライブラリデータとの間で認識の適合が生じるかどうかを判定する。デジタル画像の選択されたオブジェクトデータと画像オブジェクトライブラリデータとの間で認識の適合が得られる場合、オブジェクト認識器は画像オブジェクトライブラリデータに関連した選択可能な適合したオブジェクト記述子データを提示する。メモリはユーザフィードバックデータを受信したことを受けて画像関連記述子ライブラリデータを受信する。
他の利点として、本発明は迅速かつ効率的に、画像データに関連付けられた記述子のライブラリ(ここでは画像関連記述子ライブラリデータと称される)を生成する。オブジェクト認識器は、デジタル画像の選択されたオブジェクトデータを、既に画像記述子ライブラリデータと関連付けられた画像オブジェクトライブラリデータと照合することによって、画像認識を自動的に実行する。画像オブジェクトライブラリデータとデジタル画像の選択されたオブジェクトデータとの間で認識の適合が生じたら、オブジェクト認識器は画像記述子ライブラリデータに関連した選択可能な適合したオブジェクト記述子データをユーザに自動的に提示する。ユーザは、選択可能な適合したオブジェクト記述子データに関連した画像記述子ライブラリデータが実際にデジタル画像の選択されたオブジェクトデータと適合することを確認するためにユーザフィードバックデータを提供することがある。選択可能な適合したオブジェクト記述子データはオブジェクト認識器によって自動的に生成されるため、ユーザは、デジタル画像と関連付けるための選択可能な適合したオブジェクト記述子データから生成された利用可能な記述子のリストから選ぶだけでよい。代わりに、ユーザはデジタル画像と関連付けるためにプルダウンメニューから属性を選ぶだけでよい。結果として、オブジェクト認識器は、所望する画像データを後で検索することを容易にするために、迅速かつ効率的に画像関連記述子データのライブラリを生成することができる。
デジタル画像の選択されたオブジェクトデータと画像オブジェクトライブラリデータとの間で認識の適合がない場合には、ユーザはデジタル画像の選択されたオブジェクトデータと関連付けるために、入力された記述子データを提供することがあり、それにより新たな画像オブジェクトライブラリデータおよび対応する画像記述子ライブラリデータの生成が容易になる。例えば、選択可能な適合したオブジェクト記述子データは適合が生じない場合には最近のもしくは多く選択される記述子データを含むことがある。従って、画像処理システムは将来の自動認識のために新たな画像オブジェクトライブラリデータおよび関連する新たな画像記述子ライブラリデータを“学習”する。画像オブジェクトライブラリデータおよび記述子画像データのライブラリのサイズが大きくなるにつれ、デジタル画像の選択されたオブジェクトデータが既に以前、画像記述子ライブラリデータと関連付けられた蓋然性は大きくなる。それゆえ、ライブラリのサイズが大きくなるにつれ、画像処理システムは選択可能な適合したオブジェクト記述子データを生成する速度と効率性を増大させる。さらに、画像関連記述子データのライブラリの生成は特定の画像記述子ライブラリデータを検索する能力を更に改善する。
画像関連記述子ライブラリデータは、特定の画像関連記述子ライブラリデータの後の検索を容易にするため、コンテンツのテーブル、インデクスまたは任意の適切なデータベース構造といったユーザ定義リストにコンパイルされることがある。例えば、幾つかのデジタル画像は対応する画像記述子ライブラリデータと関連付けられる場合がある。従って、画像記述子ライブラリデータおよびデジタル画像は、特定のデジタル画像または関係するデジタル画像の検索を容易にするために、ユーザによってフォトアルバムといった形に編成されることがある。
図1に、オブジェクト認識器20およびメモリ30を含む画像処理システム10のブロック図を示す。オブジェクト認識器20は、当該分野では知られているように、任意の適切なハードウェアまたは市販の画像認識ソフトなど任意の適切なソフトウェアを含む場合がある。例えば、オブジェクト認識器20はデジタル画像の中の1つ以上のオブジェクトの画像認識を当該分野において知られている少なくとも1つの特徴認識法(feature recognition characteristic)に基づいて実行することがある。
オブジェクト認識器20は、マイクロプロセッサ、マイクロコントローラまたはデジタル信号プロセッサ(digital signal processor:DSP)などの1つ以上の適切にプログラムされたプロセッサでよく、従って、実行されたときにオブジェクト認識器20にここで述べる作業(オペレーション)を実行させるための命令を格納するメモリ30といった関連付けられたメモリを含む。加えて、ここで使用されるオブジェクト認識器20は、離散ロジック、状態マシン、またはハードウェア、ソフトウェア、ミドルウェアおよび/もしくはファームウェアの任意の他の適切な組み合わせを含むことがある。画像処理システム10の様々な構成要素は複数のリンクで接続される。リンクは必要に応じて電気信号またはデータを搬送するための任意の適切なメカニズムでよい。
メモリ30は、画像オブジェクトライブラリデータ40、画像記述子ライブラリデータ50および画像関連記述子ライブラリデータ60を含む。例えば、画像オブジェクトライブラリデータ40はデジタル画像内の例えば人や場所や物といった1つ以上のオブジェクトを表現することがある。画像記述子ライブラリデータ50は、より詳しくは後述するように、人の名前などの記述子を画像オブジェクトライブラリデータ40と関連付けることがある。
メモリ30は、例えば、RAM(random access memory)、ROM(read-only memory)、光学メモリ、または例えばサーバを通じて現地もしくは遠隔地に置かれた任意の適切な記憶媒体でよい。加えて、メモリ30は、インターネット、WAN(wide area network)、LAN(local area network)、WWAN(wireless wide access network)、WLAN(wireless local area network)、IEEE802.11無線ネットワーク、ブルートュース(Bluetooth(登録商標))ネットワーク、赤外線通信ネットワーク、衛星通信ネットワーク、または任意の適切な通信インタフェースもしくはネットワークを通じて、無線基地局、交換システムまたは任意の適切なネットワーク要素によってアクセスできる場合がある。
1つの態様として、オブジェクト認識器20はコンピュータ・システムまたは他のプロセッサベースのシステムの一部である場合がある。コンピュータ・システムまたは他のプロセッサベースのシステムは、中央処理ユニット、ビデオグラフィックス回路、システムメモリおよび他の適切な周辺回路を含むことがある。斯かるシステムにおいて、中央処理ユニットはホストプロセッサとして機能し、一方、ビデオグラフィックス回路(例えばグラフィックス・コプロセッサ)は疎結合コプロセッサ(loosely coupled coprocessor)として機能する。一例として、ビデオグラフィックス回路はASIC(application-specific integrated circuit)といった単一半導体ダイ上の集積回路である場合がある。加えて、ビデオグラフィックス回路は、限定はされないがDRAM(dynamic random access memory)といったメモリを含む場合がある。このメモリはビデオグラフィックス回路と同じ半導体ダイ上に存在する場合がある、あるいはそれは別々になっており、基板レベルもしくはパッケージレベルのトレース(配線)を通じて接続されている場合がある。1つの態様として、オブジェクト認識器20はホストプロセッサの一部である場合がある、あるいは代わりに、ビデオグラフィックス回路の一部である場合がある。同様に、メモリ30は、システムメモリ、グラフィックスメモリまたは任意の他の適切なメモリの一部である場合がある。
図2に画像処理方法200を示す。方法200は図1の画像処理システム10によって実行可能である。しかしながら、任意の他の適切な構造も使用される場合がある。方法200は、ステップ210から始まる一連の作業として記述されるが、それらの作業は任意の適切な順序で実行されてよく、また任意の適切な組み合わせで繰り返されることがある、ということは理解されよう。
ステップ220に示すように、オブジェクト認識器20は、既に述べたように、デジタル画像70の選択されたオブジェクトデータと画像オブジェクトライブラリデータ40との間で認識の適合が生じるかどうかを判定する。画像オブジェクトライブラリデータ40は例えば方法200によって既に画像記述子ライブラリデータ50と関連付けられている場合がある。
ステップ230に示すように、デジタル画像70の選択されたオブジェクトデータと画像オブジェクトライブラリデータ40との間で認識の適合が得られる場合、オブジェクト認識器20はデジタル画像70の選択されたオブジェクトデータと関連付けるための可能性のある記述子データとして選択可能な適合したオブジェクト記述子データ80を提示する。選択可能な適合したオブジェクト記述子データ80は1つ以上の認識の適合が生じる場合に各認識適合に関連する画像記述子ライブラリデータ50に基づく。例えば、オブジェクト認識器20がデジタル画像70の選択されたオブジェクトデータと画像オブジェクトライブラリデータ40との間で2つ以上の適合を生じさせる場合、各適合ごとの対応する画像記述子ライブラリデータ50が選択可能な適合したオブジェクト記述子データ80としてユーザに提示されることがある。
ステップ240に示すように、メモリ30は画像記述子ライブラリデータ50がデジタル画像70の選択されたオブジェクトデータと対応することを確認するためにユーザフィードバックデータ90を受信する。画像記述子ライブラリデータ50がデジタル画像70の選択されたオブジェクトデータと対応することをユーザフィードバックデータ90が確認した場合、画像記述子ライブラリデータ50はそのデジタル画像と関連付けられることがある。例えば、デジタル画像70の選択されたオブジェクトデータと画像オブジェクトライブラリデータ40との間で2つ以上の適合が生じる場合、ユーザは所望の画像オブジェクトライブラリデータ40に対応する画像記述子ライブラリデータ50をデジタル画像70の選択されたオブジェクトデータと関連付けるために画像関連記述子ライブラリデータ60として選択する場合がある。1つの態様として、ユーザインタフェースはメニューに画像記述子ライブラリデータ50を表示し、ユーザは画像記述子ライブラリデータ50から記述子の1つを選択することによってユーザフィードバックデータ90を提供する。
しかしながら、デジタル画像70の選択されたオブジェクトデータと画像オブジェクトライブラリデータ40との間で間違った適合が生じた場合、選択可能な適合したオブジェクト記述子データ80はユーザには提供されない。その代わり、ユーザはデジタル画像70の選択されたオブジェクトデータと関連付けるための画像関連記述子ライブラリデータ60として、入力された記述子データ348(図3との関連で後述される)を提供する。例えば、ユーザは画像関連記述子ライブラリデータ60を生成するために手作業で記述子データを入力することがある。代わりに、ユーザは選択肢として事前に選び出された記述子のリストのプルダウンメニューから選択する場合がある。1つの態様として、ユーザは最も多くの場合にデジタル画像の中でキャプチャされた家族構成員の名前を入力する場合、ユーザは名前のプルダウンメニューから単に選択するだけでデジタル画像70の選択されたオブジェクトデータと迅速かつ効率的に関連付けるようにすることがある。
ステップ250に示すように、オブジェクト認識器20は画像関連記述子ライブラリデータ60をデジタル画像70と関連付けることがある。既に述べたように、画像関連記述子ライブラリデータ60はメモリ30の中でデジタル画像70の選択されたオブジェクトデータとリンクされることがある。既に述べたように、認識の適合がなかったりあるいは誤った認識の適合が生じた場合、入力された記述子データ348がデジタル画像と関連付けられることがある。
図3に図1に関して既に議論された画像処理システム10において本発明の実施の別の一形態としてオブジェクト認識器20を採用するプロセッサ300を更に含む画像処理システムのブロック図を示す。画像処理システム10は、オブジェクト検出器310、ユーザインタフェース320、入力装置330、表示装置340およびライブラリアクセス回路350を更に具備する。メモリ30はライブラリ画像データ342および画像関連記述子ライブラリデータ60を更に含む。
プロセッサ300は、マイクロプロセッサ、マイクロコントローラまたはデジタル信号プロセッサ(DSP)といった、1つ以上の適切にプログラムされたプロセッサでよく、それ故、実行されたときにここで述べる作業(オペレーション)をプロセッサ300に実行させる命令を含むメモリ30といった関連付けられたメモリを含む。加えて、ここで使用されるプロセッサ300は、離散ロジック、状態マシンまたは、ハードウェア、ソフトウェア、ミドルウェアおよび/またはファームウェアの任意の他の適切な組み合わせを含むことがある。
オブジェクト検出器310は画像データ346を解析して、画像データ346内に2つ以上のオブジェクトが存在する場合に画像データ346内のオブジェクトの1つを選択し、それを受けて、選択されたオブジェクトに基づいてデジタル画像70の選択されたオブジェクトデータを生成する。例えば、ユーザは数個のオブジェクトから、複数の人物の画像の中の第1の人物といった1つのオブジェクトを選択する場合がある。結果として、オブジェクト検出器310は、デジタル画像70の選択されたオブジェクトデータとして異なったオブジェクトを選択し、既に述べたオブジェクト認識方法200を実行するためにオブジェクト認識器20に提供することがある。オブジェクト検出器310はオブジェクト認識器20の外部に存在する場合がある、あるいは代わりに、オブジェクト認識器20が画像データ346を直に受信することができるようにオブジェクト認識器20内に組み込まれる場合がある。
ライブラリアクセス回路350はオブジェクト認識器20をメモリ30と繋ぐ。ライブラリアクセス回路350は従って、画像オブジェクトライブラリデータ40、画像記述子ライブラリデータ50および画像データ346を生成するため、メモリ20にアクセスする。
オブジェクト検出器310は画像データ346を受信し、それを受けて、デジタル画像70の選択されたオブジェクトデータを生成することがある。画像データ346は、静止画、写真画、ビデオフィルムやビデオチップといった動画などの画像を表現する場合がある。1つの態様として、画像データ346は1つまたは複数のオブジェクトを含む画像を表現することがある。ライブラリアクセス回路350はメモリ30に保存されたライブラリ画像データ342から順次データを生成することに基づいて画像データ346を生成することがある。
オブジェクト認識器20は、デジタル画像70の選択されたオブジェクトデータと画像オブジェクトライブラリデータ40との間で認識の適合が生じると、画像関連記述子ライブラリデータ60をライブラリアクセス回路350に提供する。同様に、デジタル画像70の選択されたオブジェクトデータと画像オブジェクトライブラリデータ40との間に認識の適合が生じないときには、ユーザはユーザインタフェース320を通じて、入力された記述子データ348をライブラリアクセス回路350に提供することがある。それを受けて、ライブラリアクセス回路350は画像関連記述子ライブラリデータ60と入力された記述子データ348をメモリ30に保存する。
ユーザインタフェース320は、オブジェクト認識器20、表示装置340、入力回路330およびライブラリアクセス回路350と結合している。入力装置330は入力データ352をプロセッサ300に提供する。ユーザインタフェース320は認識の適合が生じたときに選択可能な適合したオブジェクト記述子データ80をオブジェクト認識器20から受信する。ユーザインタフェース320は選択可能な適合したオブジェクト記述子データ80を選択可能な適合したオブジェクト記述子データ80を表示するための表示データ356として表示装置340に提供する。既に言及したように、2つ以上の認識の適合が生じたために2つ以上のオブジェクト記述子が選択可能な適合したオブジェクト記述子データ80に提供される場合には、表示装置340は適合したオブジェクト記述子をユーザが選択するための選択可能なマークされたオブジェクト記述子データ80として適切に提供することがある。結果として、このときユーザは適切な入力データ352をメモリ30に保存するための画像関連記述子ライブラリデータ60としてライブラリアクセス回路350に提供することによってオブジェクト記述子を選択することがある。
図4に1つ以上のオブジェクトに対してオブジェクト認識方法200を実行し、少なくとも1つの記述子と選択的に少なくとも1つの副記述子を画像関連記述子ライブラリデータ60としてデジタル画像と関連付けるための方法400を示す。方法400はオブジェクト認識器20によって実行されることがある。しかしながら、任意の適切な構造も利用されてよい。方法400はステップ410から始まる一連の作業(オペレーション)として記述されるが、しかしそれらの作業は任意の適切な順序で実行されることがあり、かつ任意の適切な組み合わせで繰り返されることがあることも認識されよう。
ステップ420に示すように、オブジェクト認識器20、または代わりにオブジェクト検出器310は、画像データ346を受信することがある。既に述べたように、画像データ346はメモリ30に保存されたライブラリ画像データ342と関連している場合がある。ライブラリ画像データ342は外部画像データ354を、例えばデジタルカメラ、ビデオカメラ、メモリカード、インターネットまたは外部画像データ354を提供するための他の適切なソースから受信することがある。
ステップ430に示すように、オブジェクト検出器310は受信された画像データ346の中の少なくとも1つのオブジェクトを識別する。既に述べたように、オブジェクト検出器310は当該分野で知られている画像認識法を受信された画像データ346に対して実行することによってオブジェクト認識を実行することがある。既に言及したように、オブジェクト検出器310は画像データ346内の複数のオブジェクトを検出し、オブジェクト認識器20によって順次処理されるよう一度に1つのオブジェクトを選択することがある。代わりに、オブジェクト認識器20が逐次処理よりも高速に画像データ346のオブジェクト認識を実行するために、オブジェクト検出器310は複数のオブジェクトをオブジェクト認識器20に同時に提供する場合がある。1つの態様として、オブジェクト検出は、オブジェクト認識器20によって画像認識が実行されると同時に、オブジェクト認識器20によって実行されることがある。
ステップ440に示すように、オブジェクト検出器310はステップ430で検出された1つ以上のオブジェクトから少なくとも1つのオブジェクトを選択し、デジタル画像70の選択されたオブジェクトデータをオブジェクト認識器20へ提供する。代わりに、ユーザがオブジェクト認識器20によって処理するためのオブジェクトを選択することがある。オブジェクト検出器310は処理するための第1のオブジェクトを選択し、次いでオブジェクト認識器20によって処理するため残りのオブジェクトを順次選択する。
ステップ450に示すように、オブジェクト認識器20は画像記述子ライブラリデータ50をデジタル画像70と関連付けて画像関連記述子ライブラリデータ60を生成するか、あるいはユーザはデジタル画像70と関連付けるため入力された記述子データ348を提供して方法200に関して既に説明したように画像関連記述子ライブラリデータ60を生成することがある。ユーザはデジタル画像と関連付けるために新しい記述子を入力された記述子データ348として追加して画像関連記述子ライブラリデータ60を生成する場合もある。
ステップ460に示すように、方法200は少なくとも1つの副記述子(subdescriptor)をデジタル画像と関連付けて画像関連記述子ライブラリデータ60を生成するために繰り返されることがある。例えば、ステップ450に関して既に述べたように、画像関連記述子ライブラリデータ60は、記述子が人物の属性タイプを有することを示す人物属性データといった記述子タイプ属性と関連している場合がある。従って、図5との関連で後述するように、副記述子データは、表情属性データ518や活動属性データ522といった人物属性データ510と関連している場合がある。他の例示的な属性の関連付けも記述される。ユーザはデジタル画像70と関連付けるため新しい副記述子を入力された記述子データ348として追加して画像関連記述子ライブラリデータ60を生成することがある。
ステップ470に示すように、ユーザが第2のまたは任意のその次に選択された副記述子といった別の副記述子を選択する場合、画像関連記述子ライブラリデータ60はデジタル画像70の選択されたオブジェクトデータとの更なる関連付けのため他の副記述子データと関連付けられる場合がある。例えば、オブジェクト認識器20は、デジタル画像70の選択されたオブジェクトデータに関連する副記述子データが画像オブジェクトライブラリデータ40と適合するかどうかを判定するため、ステップ460におけるその他の選択されたオブジェクトデータ70について認識解析を実行する場合がある。オブジェクト認識器20が副記述子データを画像オブジェクトデータ40と適合させた場合、オブジェクト認識器20は選択可能な適合したオブジェクト記述子データ80を適切な副記述子データ選択肢と共にユーザインタフェース320に提供する。既に説明したように、ユーザは選択可能な適合したオブジェクト記述子データ80に提供された副記述子データ選択肢から選択することがある。
ステップ480に示すように、別の副記述子が選択されない場合、オブジェクト認識器20は別の記述子が選ばれるべきかどうかを判定する。例えば、ユーザが別の記述子を画像データ346内のオブジェクトと関連付けたいと思っている場合、ユーザは記述子データを提供するか、あるいはステップ450に関して既に説明したようにユーザによって選択された別のオブジェクトについて画像認識をオブジェクト認識器20に実行させることがある。
ステップ490に示すように、ユーザが画像データ346内において、第2のオブジェクト、第3のオブジェクト等々といった別のオブジェクトを識別する場合、オブジェクト認識器20はデジタル画像内の識別された他のオブジェクトに対応するデジタル画像70の選択されたオブジェクトデータを受信する。結果として、任意の画像関連記述子ライブラリデータ60および任意の望ましい副記述子データを識別された他のオブジェクトに対応するデジタル画像70の選択されたオブジェクトデータと関連付けるために処理はステップ440に戻る。オブジェクト認識器20は既に議論したようにステップ450においてデジタル画像70の選択されたオブジェクトデータについて画像認識を実行する。例えば、ユーザが画像データ346内の新しいオブジェクトを識別する場合、ユーザはデジタル画像70の選択されたオブジェクトデータと関連付けるための新しい記述子も識別することがある。ユーザがデジタル画像70の選択されたオブジェクトデータと関連付けるための新しい副記述子を追加したいと思う場合、ユーザは画像関連記述子ライブラリデータ60と関連付けるため新しい副記述子をライブラリアクセス回路350とメモリ30へ入力された記述子データ348と同定することがある。例えば、新しく追加された画像関連記述子ライブラリデータ60および任意の関連副記述子データは、新しい画像記述子ライブラリデータ50の学習を容易にするために、デジタル画像と関連付けられることがある。
ステップ492に示すように、ユーザが画像関連記述子ライブラリデータ60と関連付けるため別のデジタル画像を選択する場合、斯かる他のデジタル画像の処理はステップ420に戻る。新しいデジタル画像が選ばれない場合、現下のデジタル画像に対する画像処理は終了する。ステップ494に示すように、画像関連記述子ライブラリデータ60はメモリ30に保存される。ステップ494で処理が終了するものとして示されているが、方法400はステップ410を含む任意の適切な段階で処理を継続する場合がある。
図5に本発明の実施形態の一例としてユーザインタフェーススクリーン500と一部の可能な付随するプルダウンメニューを例示する。ユーザインタフェーススクリーン500は、オブジェクト502、503、504、506、507および508を含む画像データを示している。1つの態様として、各オブジェクト502、503、504、506、507および508は、オブジェクト認識器20が受信した画像データの選択されたオブジェクトデータ70を代表している。それを受けて、オブジェクト検出器310またはオブジェクト認識器20はオブジェクト502、503、504、506、507および508を識別する。斯かる形態によれば、画像関連記述子ライブラリデータ60は人物(person)属性データ510、場所(place)属性データ512および事物(thing)属性データ514を含むことがある。
一例として、ユーザは画像データ515からオブジェクト502を選び、オブジェクト502を画像記述子ライブラリデータ50または入力された記述子データ348と関連付けて人物属性データ510といった画像関連記述子ライブラリデータ60を生成することがある。次にユーザは更に副記述子を例えば名前属性データ516を追加することによって人物属性データ510と関連付けることがある。図5に示すように、画像認識方法200を実行する際、選択可能な適合したオブジェクト記述子データ80に関連する名前属性データ516は、ジョン(John)、マット(Matt)、クリス(Chris)およびティム(Tim)517を含むプルダウンメニューの中の名前といった選択肢を含む場合がある。従って、ユーザは、名前属性データ516としてジョン(John)、マット(Matt)、クリス(Chris)およびティム(Tim)517を含むプルダウンメニューの中の名前の1つを選択することによって、名前属性データ516と関連付けるための所望の名前を選択する場合がある。さらに、ユーザは表情属性データ518といった追加の副記述子データを選択する場合がある。本実施例によれば、表情属性データ518は、微笑み、号泣、驚き、おしゃべり520を含むプルダウンメニューを含むことがある。他の適切な(人物的)特徴に対応する他の表情属性データ518も含まれる場合がある。
別の態様として、人物属性データ510は活動(activity)属性データ522と関連付けられる場合がある。例えば、活動属性データ522は、歩行、起立、睡眠およびラニング524などのプルダウンメニューを含むことがある。属性のプルダウンメニュー選択肢524はもっと多数、少数、あるいは任意の数の属性プルダウンメニュー選択肢を含むことがある。ユーザは必要に応じて人物属性データ510と関連付けるための新たな属性データ526を追加する場合がある。ユーザは新たな属性データ526を既に述べたように新たな特定のプルダウンメニュー属性528と関連付けることができる。
場所属性データ512は景観(landscape)属性データ530と関連付けられる場合がある。景観属性データ530は、市街地、郊外、森および砂漠532といったプルダウンメニューの中の景観属性選択肢を含むことがある。場所属性データ512は同様に天候属性データ534と関連付けられることがある。例えば、天候属性データ534は、プルダウンメニューの中に、雨天、晴天および曇り536といった天候属性選択肢を含むことがある。加えて、場所属性データ512は季節属性データ538と関連付けられることがある。季節属性データ538はプルダウンメニューの中に春、夏、秋、冬540といった属性選択肢を含むことがある。さらに、場所属性データ512は更に照明(lighting)属性データ542と関連付けられることがある。照明属性データ542は、プルダウンメニューの中に、屋内の照明、昼間の照明、夜間の照明544といった照明属性選択肢を含む場合がある。さらに、ユーザが場所属性データ512と関連付けるための新しい副記述子を入力したいと思えば、ユーザは新しい属性データ545を追加することがある。ユーザは新しい属性データ545をプルダウンメニューの中の新しい属性選択肢546と関連付けることができる。
事物属性データ514はプルダウンメニューの中の動物属性データ548と関連付けられる場合がある。動物属性データ548は、犬、猫および鳥550といった動物属性と関連付けられることがある。事物属性データ514は更に建物属性データ552と関連付けられることがある。建物属性データ552はプルダウンメニューの中に更に、住宅、超高層ビルまたは任意の適切なタイプの建物もしくは構造物554を含む場合がある。ユーザは別の副記述子をこの事物属性データ514と関連付けたいと思えば、ユーザは新しい属性データ556を選択することができる。ユーザは新しい属性データ556をプルダウンメニューの中の新しい属性選択肢558と関連付けることができる。
画像関連記述子ライブラリデータ60はイベント属性データといった任意の他の適切なタイプの属性データを含むことがある。例えば、ユーザは更に副記述子を例えばパーティ属性データ、家族イベント属性データおよび休暇属性データを追加することによってイベント属性データと関連付けることがある。
図6に本発明の別の実施形態による例示的な画像処理システム600のブロック図を示す。図6は、プロセッサ300、マウス616とキーボード618を含む入力装置330、デジタルカメラ610、ビデオカメラ612、およびインターネット614を含む。画像処理システム600の様々な構成要素は複数のリンクで繋がっている。リンクは電気信号またはデータを搬送するためのそれぞれに応じた任意の適切な機構でよい。
斯かる実施形態によれば、外部の画像データ354は、当該分野では周知のように、デジタルカメラ610、ビデオカメラ612、およびインターネット614から提供されることがある。既に述べたように、画像データ346はメモリ30からも提供されることがある。入力装置330は入力データ352をプロセッサ300に提供するためのマウス616およびキーボード618を具備してよい。斯かる実施形態によれば、図3のユーザインタフェース320はプロセッサ300に組み込まれてよいが、ユーザインタフェース320はプロセッサ300の外部にある場合がある。画像処理システム600は、図6に図示された要素よりも多いまたは少ない他の要素を含むことがある。
他の利点として、本発明は迅速かつ効率的に画像関連記述子ライブラリデータ60を生成する。オブジェクト認識器20は、デジタル画像70の選択されたオブジェクトデータを、既に画像記述子ライブラリデータ50と関連付けられた画像オブジェクトライブラリデータ40と照合することによって、画像認識を自動的に実行する。画像オブジェクトライブラリデータ40とデジタル画像70の選択されたオブジェクトデータとの間で認識の適合が生じたら、オブジェクト認識器20は画像記述子ライブラリデータ50と関連付けられた選択可能な適合したオブジェクト記述子データ80をユーザに自動的に提示する。ユーザは、選択可能な適合したオブジェクト記述子データ80に関連した画像記述子ライブラリデータが実際にデジタル画像の選択されたオブジェクトデータと適合することを確認するためにユーザフィードバックデータを提供することがある。選択可能な適合したオブジェクト記述子データ80はオブジェクト認識器20によって自動的に生成されるため、ユーザは、デジタル画像と関連付けるための選択可能な適合したオブジェクト記述子データから生成された利用可能な記述子のリストから選ぶだけでよい。代わりに、ユーザはデジタル画像と関連付けるためにプルダウンメニューから属性を選ぶだけでよい。結果として、オブジェクト認識器20は、所望する画像データを後で検索することを容易にするために、迅速かつ効率的に画像関連記述子データ60のライブラリを生成することができる。
デジタル画像70の選択されたオブジェクトデータと画像オブジェクトライブラリデータ40との間で認識の適合がない場合には、ユーザはデジタル画像70の選択されたオブジェクトデータと関連付けるために、入力された記述子データを提供することがあり、それにより新たな画像オブジェクトライブラリデータ40および対応する画像記述子ライブラリデータ50の生成が容易になる。例えば、選択可能な適合したオブジェクト記述子データ80は適合が生じない場合には最近のもしくは多く選択される記述子データを含むことがある。従って、画像処理システム10、600は将来の自動認識のために新たな画像オブジェクトライブラリデータ40および関連する新たな画像記述子ライブラリデータ50を“学習”する。画像オブジェクトライブラリデータ40および画像記述子ライブラリデータ50のサイズが大きくなるにつれ、デジタル画像70の選択されたオブジェクトデータが既に以前に画像記述子ライブラリデータ50と関連付けられた蓋然性は大きくなる。それゆえ、ライブラリのサイズが大きくなるにつれ、画像処理システム10は選択可能な適合したオブジェクト記述子データ80を生成する速度と効率性を増大させる。さらに、選択可能な適合したオブジェクト記述子データ80の生成は特定の画像記述子ライブラリデータ50を検索する能力を更に増大もしくは改善する。
本発明の実施の他の変形もしくは変更形態並びにその様々な態様については当業者にとっては明らかであること、また、本発明はここで述べた特定の実施形態に限定されないことは理解されよう。ゆえに本願特許請求の範囲の各請求項によって宣明された本発明の開示された基本原理の範囲に包含される任意かつ全ての変更、変形、および均等形態が本願においてカバーされることが意図されている。
本発明の実施の一形態による画像処理システムを例示したブロック図である。 本発明の実施の一形態による画像処理システムの方法の一連の手続を例示したフロー図である。 本発明の実施の別の一形態による画像処理システムを例示したブロック図である。 本発明の実施の別の一形態による画像処理システムの方法の一連の手続を例示したフロー図である。 本発明の実施の一形態によるユーザインタフェーススクリーンを例示した図である。 本発明の実施の更に別の一形態による画像処理システムを例示したブロック図である。

Claims (20)

  1. 電子認識プロセスによって、デジタル画像(70;354)の選択されたオブジェクトデータと、画像オブジェクトライブラリデータ(40)との間で認識の適合が生じるかどうかを判定し、
    デジタル画像(70;354)の選択されたオブジェクトデータと画像オブジェクトライブラリデータ(40)との間で認識の適合があると判定されたら、画像記述子ライブラリデータ(50)と関連付けられた選択可能な適合したオブジェクト記述子データ(80)を提示し、
    画像記述子ライブラリデータ(50)がデジタル画像(70;354)の選択されたオブジェクトデータと対応することを確認するため、選択可能な適合したオブジェクト記述子データ(80)を提示したことを受けてユーザフィードバックデータ(90)を受信し、
    画像記述子ライブラリデータ(50)をデジタル画像(70;354)と関連付けて画像関連記述子ライブラリデータ(60)を生成する、ことから成ることを特徴とする画像処理方法。
  2. デジタル画像(70;354)と関連付けるための入力された記述子データを受信し、
    (a)デジタル画像(70;354)の選択されたオブジェクトデータと画像オブジェクトライブラリデータ(50)との間で認識の適合がないと判定されること、および(b)画像記述子ライブラリデータ(50)がデジタル画像(70;354)の選択されたオブジェクトデータと対応しないことをユーザフィードバックデータが示していることのうち少なくとも一方の条件が成り立つときは、入力された記述子を受信したことを受けて記述子画像ライブラリデータ(60)を生成する、ことを含むことを特徴とする請求項1に記載の画像処理方法。
  3. デジタル画像(70;354)の選択されたオブジェクトデータはデジタル画像(70;354)内の複数のオブジェクトを表現するものであって、当該方法は、
    電子認識プロセスによって、デジタル画像(70;354)内の複数のオブジェクトの各オブジェクトと画像オブジェクトライブラリデータ(50)との間で認識の適合が生じるかどうかを判定し、
    画像オブジェクトライブラリデータ(50)とデジタル画像(70;354)内の対応する複数のオブジェクトとの間で認識の適合があると判定されたら、画像記述子ライブラリデータ(50)と関連付けられた選択可能な適合したオブジェクト記述子データ(80)を提示し、
    選択可能な適合したオブジェクト記述子データ(80)に関連する画像記述子ライブラリデータ(50)がデジタル画像(70;354)内の対応する複数のオブジェクトと適合することを確認するため、選択可能な適合したオブジェクト記述子データ(80)を提示したことを受けてユーザフィードバックデータを受信し、
    画像記述子ライブラリデータ(50)を対応する複数のオブジェクトの各オブジェクトごとにデジタル画像(70;354)と関連付けて対応する画像関連記述子ライブラリデータ(60)を生成する、ことを更に含むことを特徴とする請求項1または2に記載の画像処理方法。
  4. 画像関連記述子ライブラリデータ(60)はデジタル画像(70;354)の選択されたオブジェクトデータに関連する副記述子データを含むことを特徴とする請求項1乃至3のいずれか一項に記載の画像処理方法。
  5. 画像関連記述子ライブラリデータ(60)は、人物属性データ(510)、場所属性データ、事物属性データおよびイベント属性データの少なくとも1つから選ばれる、ことを特徴とする請求項1乃至4のいずれか一項に記載の画像処理方法。
  6. 人物属性データ(510)は、名前属性データ(516)、表情属性データ(518)および活動属性データ(522)の少なくとも1つと関連しており、場所属性データは、景観属性データ、天候属性データ、季節属性データおよび照明属性データの少なくとも1つから選択され、事物属性データは、動物属性データおよび建物属性データの少なくとも1つから選択され、イベント属性データは、パーティ属性データ、家族イベント属性データおよび休暇属性データから選択される、ことを特徴とする請求項5に記載の画像処理方法。
  7. ユーザおよび電子オブジェクト認識器の少なくとも一方が、デジタル画像、およびデジタル画像の一部分の少なくとも一方を選んだことを受けて、デジタル画像(70;354)の選択されたオブジェクトデータを生成することを含む、ことを特徴とする請求項1乃至6のいずれか一項に記載の画像処理方法。
  8. デジタル画像(70;354)を表現する画像データを受信し、
    画像データを受信したことを受けて、デジタル画像の選択されたオブジェクトデータを生成することを更に含む、ことを特徴とする請求項1乃至7のいずれか一項に記載の画像処理方法。
  9. 複数のデジタル画像の各画像が、対応する画像関連記述子ライブラリデータ(60)と関連するように、画像データは複数のデジタル画像を表現するものであって、当該方法は、
    対応する複数のデジタル画像の各画像に関連した画像関連記述子ライブラリデータ(60)を保存し、
    対応する複数のデジタル画像の各画像に関連した画像関連記述子ライブラリデータを含む、コンテンツのテーブル、インデクスおよびフォトアルバムの少なくとも1つを生成する、ことを含むことを特徴とする請求項8に記載の画像処理方法。
  10. ユーザおよび電子オブジェクト認識器の少なくとも一方が、デジタル画像、およびデジタル画像の一部分の少なくとも一方を選んだことに基づいて、デジタル画像の選択されたオブジェクトデータを生成することを含む、ことを特徴とする請求項8または9に記載の画像処理方法。
  11. 画像オブジェクトライブラリデータ(40)、および画像オブジェクトライブラリデータ(40)と関連した画像記述子ライブラリデータ(50)を含むメモリ(30)と、
    メモリ(30)と動作可能に結合しており、デジタル画像(7;354)の選択されたオブジェクトデータ、画像オブジェクトライブラリデータ(40)および画像記述子ライブラリデータ(50)を受信し、それを受けて、電子認識プロセスによって、デジタル画像(7;354)の選択されたオブジェクトデータと画像オブジェクトライブラリデータ(40)との間で認識の適合が生じるかどうかを判定し、デジタル画像(7;354)の選択されたオブジェクトデータと画像オブジェクトライブラリデータ(40)との間で認識の適合があると判定されたら、画像記述子ライブラリデータ(40)に関連する選択可能な適合したオブジェクト記述子データ(80)を提示し、画像記述子ライブラリデータ(50)がデジタル画像(7;354)の選択されたオブジェクトデータと対応することを確認するため、選択可能な適合したオブジェクト記述子データ(80)が提示されたことを受けてユーザフィードバックデータ(90)を受信し、画像記述子ライブラリデータ(50)をデジタル画像(7;354)と関連付けて画像関連記述子ライブラリデータ(60)を生成する働きをするオブジェクト認識器(20)とを具備する、ことを特徴とする画像処理システム(10;600)。
  12. メモリ(30)は、デジタル画像(7;354)と関連付けるために、入力された記述子データを受信し、(a)デジタル画像(7;354)の選択されたオブジェクトデータと画像オブジェクトライブラリデータ(50)との間で認識の適合がないと判定されること、および(b)画像記述子ライブラリデータ(50)がデジタル画像(7;354)の選択されたオブジェクトデータと対応しないことをユーザフィードバックデータ(90)が示していること、のうち少なくとも一方の条件が成り立つときは、画像関連記述子ライブラリデータ(60)を生成する働きをする、ことを特徴とする請求項11に記載の画像処理システム。
  13. オブジェクト認識器(20)に動作可能に結合しており、選択可能な適合したオブジェクト記述子データ(60)を受信し、それを受けて、選択可能な適合したオブジェクト記述子データ(60)を表示する働きをするユーザインタフェース(320)を含む、ことを特徴とする請求項11または12に記載の画像処理システム。
  14. メモリ(30)とオブジェクト認識器(20)とに動作可能に結合しており、デジタル画像(7;354)を表現する画像データを受信し、それを受けて、デジタル画像(7;354)の選択されたオブジェクトデータをオブジェクト認識器に提供する働きをするオブジェクト検出器(310)を含む、ことを特徴とする請求項11乃至13のいずれか一項に記載の画像処理システム。
  15. デジタル画像の選択されたオブジェクトデータは、ユーザおよびオブジェクト認識器の少なくとも一方が、デジタル画像、およびデジタル画像の一部分の少なくとも一方を選んだことを受けて生成される、ことを特徴とする請求項11乃至14のいずれか一項に記載の画像処理システム。
  16. ライブラリアクセス回路(350)とユーザインタフェース(320)とを更に含み、
    ライブラリアクセス回路(350)は、メモリ(30)に動作可能に結合しており、画像オブジェクトライブラリデータ(40)と画像記述子ライブラリデータ(50)を生成する働きをし、オブジェクト認識器(20)は、ライブラリアクセス回路(35)と動作可能に結合されており、デジタル画像(7;354)の選択されたオブジェクトデータ、画像オブジェクトライブラリデータ(40)および画像記述子ライブラリデータ(50)を受信し、それを受けて、電子認識プロセスによって、デジタル画像(7;354)の選択されたオブジェクトデータと画像オブジェクトライブラリデータ(50)との間で認識の適合が生じるかどうかを判定し、デジタル画像(7;354)の選択されたオブジェクトデータと画像オブジェクトライブラリデータ(50)との間で認識の適合があると判定されたら、画像オブジェクトライブラリデータ(50)に関連する選択可能な適合したオブジェクト記述子データ(60)を生成する働きをし、
    ユーザインタフェース(320)は、オブジェクト認識器(20)に動作可能に結合しており、選択可能な適合したオブジェクト記述子データ(60)を表示し、それを受けて、画像記述子ライブラリデータ(50)がデジタル画像(7;354)の選択されたオブジェクトデータと対応することを確認するためにユーザフィードバックデータ(90)をオブジェクト認識器(20)に提供する働きをし、画像識別子ライブラリデータ(50)は画像関連記述子ライブラリデータ(60)を生成するためにデジタル画像(7;354)の選択されたオブジェクトデータと関連付けられる、ことを特徴とする請求項11乃至15のいずれか一項に記載の画像処理システム。
  17. ライブラリアクセス回路(350)は、デジタル画像(7;354)と関連付けるために、入力された記述子データを受信し、それを受けて、(a)デジタル画像(7;354)の選択されたオブジェクトデータと画像オブジェクトライブラリデータ(40)との間で認識の適合がないと判定されること、および(b)画像記述子ライブラリデータ(50)がデジタル画像(7;354)の選択されたオブジェクトデータと対応しないことをユーザフィードバックデータ(90)が示していること、のうち少なくとも一方の条件が成り立つときは、画像関連記述子ライブラリデータ(60)を生成する、ことを特徴とする請求項16に記載の画像処理システム。
  18. ライブラリアクセス回路(350)とオブジェクト認識器(20)とに動作可能に結合されており、デジタル画像(7;354)を表現する画像データを受信し、それを受けて、デジタル画像の選択されたオブジェクトデータをオブジェクト認識器(20)に提供する働きをするオブジェクト検出器(310)を含む、ことを特徴とする請求項16または17に記載の画像処理システム。
  19. 1つ以上の処理装置(300)によって実行可能な命令を含むメモリ(30)であって、前記命令は、
    電子認識プロセスによって、デジタル画像(7;354)の選択されたオブジェクトデータと、画像記述子ライブラリデータ(50)と関連した画像オブジェクトライブラリデータ(40)との間で認識の適合が生じるかどうかを判定することと、
    デジタル画像(7;354)の選択されたオブジェクトデータと画像オブジェクトライブラリデータ(40)との間で認識の適合があると判定されたら、画像記述子ライブラリデータ(50)に関連する選択可能な適合したオブジェクト記述子データ(80)を提示することと、
    画像記述子ライブラリデータ(50)がデジタル画像(7;354)の選択されたオブジェクトデータと対応することを確認するために選択可能な適合したオブジェクト記述子データを提示したことを受けてユーザフィードバックデータ(90)を受信することと、
    画像記述子ライブラリデータ(50)をデジタル画像(7;354)と関連付けて画像関連記述子ライブラリデータ(60)を生成することを前記1つ以上の処理装置(300)実行させる、ことを特徴とするメモリ。
  20. デジタル画像(7;354)と関連付けるために、入力された記述子データを受信し、それを受けて、(a)デジタル画像(7;354)の選択されたオブジェクトデータと画像オブジェクトライブラリデータ(40)との間で認識の適合がないと判定されること、および(b)画像記述子ライブラリデータ(50)がデジタル画像(7;354)の選択されたオブジェクトデータと対応しないことをユーザフィードバックデータ(90)が示していること、のうち少なくとも一方の条件が成り立つときは、画像関連記述子ライブラリデータ(60)を生成することを前記1つ以上の処理装置(300)に実行させる、実行可能な命令を更に含む、ことを特徴とする請求項19に記載のメモリ。
JP2007500317A 2004-02-26 2005-02-25 画像処理システムおよび方法 Active JP4904255B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US10/787,780 2004-02-26
US10/787,780 US7624123B2 (en) 2004-02-26 2004-02-26 Image processing system and method
PCT/IB2005/000489 WO2005086030A1 (en) 2004-02-26 2005-02-25 An image processing system and method

Publications (2)

Publication Number Publication Date
JP2007524952A true JP2007524952A (ja) 2007-08-30
JP4904255B2 JP4904255B2 (ja) 2012-03-28

Family

ID=34886854

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2007500317A Active JP4904255B2 (ja) 2004-02-26 2005-02-25 画像処理システムおよび方法

Country Status (4)

Country Link
US (2) US7624123B2 (ja)
EP (1) EP1719064B1 (ja)
JP (1) JP4904255B2 (ja)
WO (1) WO2005086030A1 (ja)

Families Citing this family (25)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7624123B2 (en) * 2004-02-26 2009-11-24 Ati Technologies, Inc. Image processing system and method
US7970771B2 (en) * 2004-12-20 2011-06-28 Microsoft Corporation Method and system for tracking objects associated with an activity
JP5009577B2 (ja) * 2005-09-30 2012-08-22 富士フイルム株式会社 画像検索装置および方法並びにプログラム
US20080008391A1 (en) * 2006-07-10 2008-01-10 Amir Geva Method and System for Document Form Recognition
WO2009111047A2 (en) 2008-03-05 2009-09-11 Ebay Inc. Method and apparatus for image recognition services
US9495386B2 (en) 2008-03-05 2016-11-15 Ebay Inc. Identification of items depicted in images
US20090287655A1 (en) * 2008-05-13 2009-11-19 Bennett James D Image search engine employing user suitability feedback
US8818978B2 (en) 2008-08-15 2014-08-26 Ebay Inc. Sharing item images using a similarity score
US8520979B2 (en) * 2008-08-19 2013-08-27 Digimarc Corporation Methods and systems for content processing
GB0818089D0 (en) * 2008-10-03 2008-11-05 Eastman Kodak Co Interactive image selection method
JP5264396B2 (ja) * 2008-10-03 2013-08-14 キヤノン株式会社 画像処理装置及び画像種別特定方法
US7991646B2 (en) * 2008-10-30 2011-08-02 Ebay Inc. Systems and methods for marketplace listings using a camera enabled mobile device
TWI388205B (zh) * 2008-12-19 2013-03-01 Ind Tech Res Inst 目標追蹤之方法與裝置
US8825660B2 (en) * 2009-03-17 2014-09-02 Ebay Inc. Image-based indexing in a network-based marketplace
US20100257252A1 (en) * 2009-04-01 2010-10-07 Microsoft Corporation Augmented Reality Cloud Computing
US9164577B2 (en) 2009-12-22 2015-10-20 Ebay Inc. Augmented reality system, method, and apparatus for displaying an item image in a contextual environment
US10127606B2 (en) 2010-10-13 2018-11-13 Ebay Inc. Augmented reality system and method for visualizing an item
JP5551140B2 (ja) * 2011-10-19 2014-07-16 東芝テック株式会社 情報処理装置及びプログラム
US9449342B2 (en) 2011-10-27 2016-09-20 Ebay Inc. System and method for visualization of items in an environment using augmented reality
US9934522B2 (en) 2012-03-22 2018-04-03 Ebay Inc. Systems and methods for batch- listing items stored offline on a mobile device
US10846766B2 (en) 2012-06-29 2020-11-24 Ebay Inc. Contextual menus based on image recognition
CN105224582B (zh) * 2014-07-03 2018-11-09 联想(北京)有限公司 信息处理方法和设备
US9984100B2 (en) * 2015-09-29 2018-05-29 International Business Machines Corporation Modification of images and associated text
JP6992342B2 (ja) * 2017-09-13 2022-01-13 富士フイルムビジネスイノベーション株式会社 情報処理装置及びプログラム
WO2020007460A1 (en) * 2018-07-04 2020-01-09 Telefonaktiebolaget Lm Ericsson (Publ) Wireless device, computer server node, and methods thereof

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH09293081A (ja) * 1996-04-25 1997-11-11 Japan Aviation Electron Ind Ltd 画像データベース作成方法及び画像検索方法
JPH10228521A (ja) * 1997-02-13 1998-08-25 Nec Corp 文字認識装置および方法
JPH11272707A (ja) * 1998-03-26 1999-10-08 Sharp Corp 情報処理システム
JP2001188904A (ja) * 1999-12-28 2001-07-10 Keyence Corp 画像処理方法及び画像処理装置並びに記録媒体
JP2002259410A (ja) * 2001-03-05 2002-09-13 Nippon Telegr & Teleph Corp <Ntt> オブジェクト分類管理方法、オブジェクト分類管理システム、オブジェクト分類管理プログラム及び記録媒体

Family Cites Families (28)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US120673A (en) * 1871-11-07 Improvement in spittoons
US33296A (en) * 1861-09-17 Improvement in mowing-machines
US6418424B1 (en) 1991-12-23 2002-07-09 Steven M. Hoffberg Ergonomic man-machine interface incorporating adaptive pattern recognition based control system
US6182069B1 (en) * 1992-11-09 2001-01-30 International Business Machines Corporation Video query system and method
US5579471A (en) * 1992-11-09 1996-11-26 International Business Machines Corporation Image query system and method
US5835667A (en) 1994-10-14 1998-11-10 Carnegie Mellon University Method and apparatus for creating a searchable digital video library and a system and method of using such a library
JPH1091634A (ja) * 1996-08-15 1998-04-10 Hewlett Packard Co <Hp> 写真画像検索システム
US6819783B2 (en) * 1996-09-04 2004-11-16 Centerframe, Llc Obtaining person-specific images in a public venue
US6594406B1 (en) 1996-12-20 2003-07-15 Xerox Corporation Multi-level selection methods and apparatus using context identification for embedded data graphical user interfaces
AU732696B2 (en) 1997-04-01 2001-04-26 Medic Interactive, Inc. System for automated generation of media programs from a database of media elements
EP1025517A1 (en) * 1997-10-27 2000-08-09 Massachusetts Institute Of Technology Image search and retrieval system
US6304259B1 (en) 1998-02-09 2001-10-16 International Business Machines Corporation Computer system, method and user interface components for abstracting and accessing a body of knowledge
US6445834B1 (en) * 1998-10-19 2002-09-03 Sony Corporation Modular image query system
US6564263B1 (en) 1998-12-04 2003-05-13 International Business Machines Corporation Multimedia content description framework
US6490370B1 (en) 1999-01-28 2002-12-03 Koninklijke Philips Electronics N.V. System and method for describing multimedia content
GB2349460B (en) * 1999-04-29 2002-11-27 Mitsubishi Electric Inf Tech Method of representing colour images
AU6503800A (en) * 1999-07-30 2001-02-19 Pixlogic Llc Perceptual similarity image retrieval
JP2001101191A (ja) 1999-09-27 2001-04-13 Cadix Inc 画像識別装置及び画像識別に用いられるデータベースシステム
JP3550681B2 (ja) * 1999-12-10 2004-08-04 日本電気株式会社 画像検索装置及び方法、並びに類似画像検索プログラムを格納した記憶媒体
US7415662B2 (en) 2000-01-31 2008-08-19 Adobe Systems Incorporated Digital media management apparatus and methods
GB2364590B (en) * 2000-07-07 2004-06-02 Mitsubishi Electric Inf Tech Method and apparatus for representing and searching for an object in an image
EP1302865A1 (en) * 2001-10-10 2003-04-16 Mitsubishi Electric Information Technology Centre Europe B.V. Method and apparatus for searching for and retrieving colour images
US7353224B2 (en) * 2001-12-04 2008-04-01 Hewlett-Packard Development Company, L.P. System and method for efficiently finding near-similar images in massive databases
US7197493B2 (en) 2001-12-21 2007-03-27 Lifestory Productions, Inc. Collection management database of arbitrary schema
US20040059754A1 (en) * 2002-07-13 2004-03-25 Lauren Barghout Perceptual information processing system
WO2004034236A2 (en) * 2002-10-11 2004-04-22 Digimarc Corporation Systems and methods for recognition of individuals using multiple biometric searches
AU2003298731A1 (en) * 2002-11-26 2004-06-18 Digimarc Id Systems Systems and methods for managing and detecting fraud in image databases used with identification documents
US7624123B2 (en) 2004-02-26 2009-11-24 Ati Technologies, Inc. Image processing system and method

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH09293081A (ja) * 1996-04-25 1997-11-11 Japan Aviation Electron Ind Ltd 画像データベース作成方法及び画像検索方法
JPH10228521A (ja) * 1997-02-13 1998-08-25 Nec Corp 文字認識装置および方法
JPH11272707A (ja) * 1998-03-26 1999-10-08 Sharp Corp 情報処理システム
JP2001188904A (ja) * 1999-12-28 2001-07-10 Keyence Corp 画像処理方法及び画像処理装置並びに記録媒体
JP2002259410A (ja) * 2001-03-05 2002-09-13 Nippon Telegr & Teleph Corp <Ntt> オブジェクト分類管理方法、オブジェクト分類管理システム、オブジェクト分類管理プログラム及び記録媒体

Also Published As

Publication number Publication date
US8874596B2 (en) 2014-10-28
US20090276464A1 (en) 2009-11-05
EP1719064A1 (en) 2006-11-08
JP4904255B2 (ja) 2012-03-28
US7624123B2 (en) 2009-11-24
WO2005086030A1 (en) 2005-09-15
EP1719064B1 (en) 2013-08-07
US20050193006A1 (en) 2005-09-01

Similar Documents

Publication Publication Date Title
JP4904255B2 (ja) 画像処理システムおよび方法
US10289643B2 (en) Automatic discovery of popular landmarks
US8934717B2 (en) Automatic story creation using semantic classifiers for digital assets and associated metadata
TWI278757B (en) Presenting a collection of media objects
US7734654B2 (en) Method and system for linking digital pictures to electronic documents
CN110457504B (zh) 数字资产搜索技术
US20080306995A1 (en) Automatic story creation using semantic classifiers for images and associated meta data
KR20160015838A (ko) 컨텐츠 분류 방법 및 이를 위한 디바이스
US20190179848A1 (en) Method and system for identifying pictures
US20060026127A1 (en) Method and apparatus for classification of a data object in a database
US11100159B2 (en) Image metadata enrichment generator
US8862582B2 (en) System and method of organizing images
CN113297452A (zh) 多级检索方法、多级检索装置及电子设备
JP2002007413A (ja) 画像検索装置
JP2007094750A (ja) 画像検索装置、画像検索プログラム、および画像検索プログラム記憶媒体
JP2005107931A (ja) 画像検索装置
EP3905060A1 (en) Artificial intelligence for content discovery
KR20210094396A (ko) 이미지 기반 검색 어플리케이션 및 그를 위한 검색 서버
Kuo et al. MPEG-7 based dozen dimensional digital content architecture for semantic image retrieval services
JP2018169661A (ja) 情報処理方法、装置、及びプログラム
JP2003281168A (ja) マルチメディアコンテンツ提供方法、装置、プログラム、および同プログラムを記録した記録媒体
JPH10260979A (ja) 情報収集方法及び装置
JP2005078429A (ja) 図面文書管理システム及びその管理方法
JP2006048384A (ja) 情報処理装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20080225

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20101102

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20101109

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20110207

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20110215

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110309

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20110401

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110801

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110811

A911 Transfer to examiner for re-examination before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20110902

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20111209

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20120106

R150 Certificate of patent or registration of utility model

Ref document number: 4904255

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20150113

Year of fee payment: 3

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250