JP2022500802A - 領域ベースのメタデータ索引付けを用いる画像管理 - Google Patents

領域ベースのメタデータ索引付けを用いる画像管理 Download PDF

Info

Publication number
JP2022500802A
JP2022500802A JP2021538166A JP2021538166A JP2022500802A JP 2022500802 A JP2022500802 A JP 2022500802A JP 2021538166 A JP2021538166 A JP 2021538166A JP 2021538166 A JP2021538166 A JP 2021538166A JP 2022500802 A JP2022500802 A JP 2022500802A
Authority
JP
Japan
Prior art keywords
image
data
user
photo
display
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2021538166A
Other languages
English (en)
Other versions
JP7488821B2 (ja
JPWO2020055733A5 (ja
Inventor
ウォーラー,クレイグ
Original Assignee
リワインダー,エルエルシー
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by リワインダー,エルエルシー filed Critical リワインダー,エルエルシー
Publication of JP2022500802A publication Critical patent/JP2022500802A/ja
Publication of JPWO2020055733A5 publication Critical patent/JPWO2020055733A5/ja
Application granted granted Critical
Publication of JP7488821B2 publication Critical patent/JP7488821B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/30Scenes; Scene-specific elements in albums, collections or shared content, e.g. social network photos or video
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/51Indexing; Data structures therefor; Storage structures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/53Querying
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/58Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/583Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
    • G06F16/5854Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using shape and object relationship
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/58Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/5866Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using information manually generated, e.g. tags, keywords, comments, manually generated location and time information
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/048Interaction techniques based on graphical user interfaces [GUI]
    • G06F3/0484Interaction techniques based on graphical user interfaces [GUI] for the control of specific functions or operations, e.g. selecting or manipulating an object, an image or a displayed text element, setting a parameter value or selecting a range
    • G06F3/04842Selection of displayed objects or displayed text elements
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T19/00Manipulating 3D models or images for computer graphics
    • G06T19/006Mixed reality
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/768Arrangements for image or video recognition or understanding using pattern recognition or machine learning using context analysis, e.g. recognition aided by known co-occurring patterns
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/20Scenes; Scene-specific elements in augmented reality scenes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/70Labelling scene content, e.g. deriving syntactic or semantic representations
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/14Digital output to display device ; Cooperation and interconnection of the display device with other functional units
    • G06F3/1454Digital output to display device ; Cooperation and interconnection of the display device with other functional units involving copying of the display data of a local workstation or window to a remote workstation or window so that an actual copy of the data is displayed simultaneously on two or more displays, e.g. teledisplay
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/16Sound input; Sound output
    • G06F3/167Audio in a user interface, e.g. using voice commands for navigating, audio feedback
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V2201/00Indexing scheme relating to image or video recognition or understanding
    • G06V2201/10Recognition assisted with metadata

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Library & Information Science (AREA)
  • Software Systems (AREA)
  • Human Computer Interaction (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Computational Linguistics (AREA)
  • Evolutionary Computation (AREA)
  • Computing Systems (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Artificial Intelligence (AREA)
  • Computer Graphics (AREA)
  • Computer Hardware Design (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Processing Or Creating Images (AREA)

Abstract

一実施形態は、装置からユーザ識別表示を受信することと、ストレージ装置に、画像の1つ又は複数の領域を特定する第1の自由形式のユーザ入力によって生成される第1のデータ、及び画像の1つ又は複数の領域を記述する第2の自由形式のユーザ入力を含む第2のデータを記憶することと、それぞれの第1のデータが、対応する第2のデータに関連して記憶される、対応する第2のデータを含むことと、プロセッサを使用して、ユーザ識別表示に少なくとも部分的に基づいて、第1のデータ及び第2のデータの少なくとも一部分を含むデータセットを選択することと、選択されたデータセットを表示するために提供することとを含む方法を提供する。他の実施形態も説明され、特許請求の範囲に記載されている。

Description

関連出願の相互参照
本出願は、「SYSTEM AND METHOD FOR IMAGE CONTENT AND CONTEXT IDENTIFICATION, COLLABORATION AND MANAGEMENT」と題する第62729411号、「COMMUNITY BASED AUGMENTED IMAGE SYSTEM WITH ENHANCED PHOTO CONTENT」と題する第62729416号、「COMMUNITY BASED MEMORY REFLECTION SYSTEM WITH ENHANCED PHOTO CONTENT」と題する第62729415号、「PHOTO MANAGEMENT SYSTEM WITH OBJECT BASED IDENTIFICATION INDEX UTILIZING EMBEDDED METADATA」と題する第62729414号など、それぞれが2018年9月10日に出願された上記の米国仮特許出願の優先権を主張するものであり、その内容を参考として本明細書に援用する。
背景
デジタル画像を瞬時にキャプチャすることが標準となっている今日のデジタル時代では、広く分散した場所に雑然と記憶されたデジタル化画像が数多く存在する。過去一世紀において、又はさらに最近になって、標準的な撮影機器を使用して、数多くの画像が作成された。場合によっては、物理的な写真が、画像に表示されたシーン及び/又は人々をキャプチャしたままの唯一の媒体である。残念ながら、デジタル化されている場合でも、その多くがインターネットを介してアクセス可能な様々なメディア・ストレージ及び共有のネットワーク(たとえば、コンテンツ・ストレージ・ネットワーク、ソーシャル・ネットワークなど)は、ファイル名それ自体と各画像が属してもよいファイル・フォルダとは別にして、こうした画像に関連付けられてもよい情報が非常に限定される。ソーシャル・メディア・ネットワークなど、場合によっては、フェイス・タギングやジオタギングなど基本的なメタデータは、画像又はそのコンテンツの限定された記述を提供する場合がある。
概要
本明細書に記載の主題は、画像及びその領域についての情報索引付けに関する。この主題は、画像の各領域又は区域を詳細情報に関連付けることができるように、特定の領域たとえば特定の画素によって、画像についての情報に索引付けするように設計された、画像管理システム並びに関連する方法及び製品に関する。
先に述べたことは概要であり、いかなる形でも限定するものではない。例示的な各実施形態をさらによく理解するために、詳細な説明及び各図面を参照することができる。本発明の範囲は、特許請求の範囲によって規定される。
図面の簡単な説明
画像及び関連付けられたメタデータを作成、記憶、及び提供する例示的な方法を示す。 例示的な画像及び関連付けられた自由形式のユーザ入力を示す。 スクリプトつきのデータセットを提供する一例を示す。 メタデータ支援型の画像検索を実現する一例を示す。 画像関連のデータ・エンティティの例示的な論理構成を示す。 拡張可能なストレージ構造の一例を示す。 拡張現実用に領域固有のデータセットを提供する一例を示す。 画像用のコンテンツ識別子のグループ分けの一例を示す。 画像へのタグ付け/コメント付けするためのプロセス又はアプリケーションの一例を示す。 画像へのタグ付け/コメント付けするためのプロセス又はアプリケーションの一例を示す。 写真管理システムを用いる動作の基本的な流れを示す。 写真管理システムを用いる検索動作の基本的な流れを示す。 写真管理システムを用いる埋込み情報動作の基本的な流れを示す。 写真管理システムでの動作の詳細な説明を提示する。 ユーザ・インターフェースに表示されるピクチャの一例を示す。 ピクチャ・ディスプレイ用の例示的なインターフェースの各区域を示す。 ユーザ・インターフェースに表示されるピクチャの別の例を示す。 例示的なコンピューティング装置を示す。
詳細な説明
本明細書の各図において一般に説明し図示した例示的な実施形態の構成要素は、説明し図示した例に加えて、多種多様な異なる構成で構成及び設計されてもよいことが容易に理解されよう。したがって、以下の詳細な説明は、特許請求の範囲に記載の範囲を限定するものではなく、選択された例示的な実施形態を単に示す。本明細書の様々な場所で目にする「一実施形態では」などの語句は、必ずしも同じ実施形態を指す必要はない。さらに、1つ又は複数の実施形態において任意の適切な方式で、説明してある特徴、構造、又は特性を組み合わせてもよい。以下の説明では、十分に理解できるように数多くの具体的な詳細内容を提示しているが、具体的な詳細内容のうち1つ又は複数の内容がなくても、又は他の方法、構成要素、材料などを用いて、様々な実施形態を実施できることが当業者には理解されよう。他の例では、各実施形態の他の態様を曖昧にしないように、よく知られた構造、材料、又は動作を図示することはなく、又は詳細に説明することもない。
既存の画像管理システムは、所定の固定されたカテゴリの中から、しばしばシングル・ユーザによって選択される画像又は画像パーツ用の限定されたラベルを利用する。したがって、従来の手法では、結果として記述が限定された画像になる。画像ラベリング専用のソフトウェアは、画像パーツにラベルを付加するためのツールを提供するが、このようなソフトウェアは、ラベリング専用であり、過度に複雑であり、ラベルを付加しない他のアプリケーションと互換性がない。画像を記憶及び管理するのに使用される現在の手法のこうした欠点により、結果として画像の検索及び取得が最適ではなくなり、産業訓練、監査、及び同様の用途など、様々な状況において画像の有用性が限定される。さらに、既存の手法は、画像及び関連付けられたメタデータを保護することができ、特定のユーザに提示することができる粒度を制限する。
図1を参照すると、一実施形態は、画像及び領域固有のメタデータを作成、記憶、及び取得する方法を提供する。本明細書に記載の通り、画像に関連付けられた領域固有のメタデータは、現在不可能な画像での様々な使用を可能にする。
図1の例では、101において画像が得られ、たとえば、デジタル・カメラを搭載するスマートフォンなどの装置を使用してキャプチャされる。その後、102において受信される領域選択、及び103において受信される記述をユーザが入力するためのユーザ・インターフェースが提供される。図2を簡潔に参照すると、自由形式のユーザ入力220、230、240、260、及び270が、画像領域選択(220、230)及び領域記述(240、260、270)の形でユーザから提供されてもよいことが理解されよう。このユーザ入力は、あらかじめ定められていないという点で自由形式であり、すなわち、ユーザは、タッチ・スクリーン上のタッチ入力を介して提示される選択部分220、230、マウス入力装置を使用する強調表示など、自由形式の入力タイプを使用して画像の任意の部分を選択してもよい。
一実施形態では、たとえば、ユーザが102において自由形式のユーザ入力を実行する前に、101において得られる画像が画像処理を受けてもよい。たとえば、101においてキャプチャされる画像は、物体検出(バウンディング・ボックスの配置)及び/又は物体の認識若しくは識別(人工知能若しくは機械学習を使用して、バウンディング・ボックスにおいて識別される物体の包括的若しくは特定用途向けラベリング)を受けてもよい。こうした自動化ステップ、たとえば、物体検出及び/又は物体認識は、ユーザが102において自由形式のユーザ入力を作成するのを支援する際に使用してもよい。たとえば、一実施形態では、物体検出に基づく領域選択用の場所を提案してもよい。
同様に、領域記述240、260、270は、特定のカテゴリ又はフォーマットに限定されないという点で自由形式であり、すなわち、ユーザは、テキスト、オーディオ、画像、ハイパーリンク、又はこうした入力タイプの組合せを使用して、領域についての任意の記述を入力してもよい。この場合も、自動処理を適用して、ユーザが領域記述を提供するのを支援してもよい。たとえば、本明細書でさらに説明するように、人工知能による物体識別を使用して、提案されたラベル又はカテゴリ(任意選択としてサブカテゴリを含む)を提供して、記述的テキスト又はオーディオ形で自由形式のユーザ入力をユーザが作成するのを支援してもよい。
やはり図1を参照すると、一実施形態は、104に示すように、(たとえば、図2の領域220、230などの各領域を選択する)自由形式のユーザ入力と、自由形式の記述、たとえば図2の記述240、260、270とを関連付ける。この関連付けは、自動化されてもよく、又は半自動化されてもよい。たとえば、一実施形態は、記述入力区域、たとえばタイトル区域240又は自由形式の記述区域250(テキスト又はオーディオの入力区域)をアクティブにして、画像領域のユーザによる選択、たとえば図2の220の形で輪郭を描くことに対処してもよく、その結果、選択された領域220、230に関連して、記述的入力260、270が記憶される。さらに、一実施形態は、104において、複数の領域と同じ記述(又はその一部分)とを関連付けることができ、並びに、所与の領域において複数の記述を入力することができる。一例として、ユーザは、2つの領域選択、たとえば図2の選択220、230を提供し、同じ記述的テキスト260の一部分と各領域を具体的に関連付けてもよい。この関連付けは、たとえば、この例では280においてまとめて示してある差分カラー・ハイライトの使用を介して、表示インターフェースにおいて示してもよい。
一実施形態では、図8に示す例で説明するように、ユーザが提供するデータ・エントリ、たとえば、テキスト・データ・エントリと画像の各領域を整然と関連付ける、領域固有のコンテンツ識別子のグループ分けの提示及び/又は記憶の結果として、関連付けがなされてもよい。したがって、記述的データ(たとえば、テキスト、オーディオ、若しくは画像のデータ)、又はその一部分は、画像の特定の領域、たとえば画像の特定の画素座標に関連付けられる。画像の特定の領域は、たとえば、ユーザ入力220又は230によって境界が定められる画像など、ユーザによって選択される画像の画素であり、これらは、記述、たとえば自由形式の記述260、270と論理的に関連付けられる。
画像における領域及び関連付けられた記述的メタデータの特定を可能にすることによって、数多くの実用的な実施形態を形成してもよい。たとえば、105に示すように、ユーザは、ユーザIDと画像及び記述的メタデータとを関連付けて、データセットを形成してもよい。このデータセットは、画像、各領域のうち1つ若しくは複数の領域、及び1つ若しくは複数の記述的メタデータ・エントリ、又はこれらの適切な組合せを含んでもよい。105に示すように、ユーザIDは、データセットと直接に関連付けられてもよく、すなわち、ユーザID(ユーザ名とパスワードのペアなど)が、データセットへの直接のアクセスを可能にし、又は間接的に関連付けられてもよく、すなわち、ユーザIDが、データセットへの役割を許可されたアクセスとの関連付けを可能にする。他の例では、ユーザIDは、たとえば、ドメイン、ネットワーク・アドレス、地理的な場所、又は他のクレデンシャル情報若しくは識別情報から推定される。本明細書でさらに説明するように、(広く理解された)ユーザIDとデータセットとの関連付けは、後で使用するために、たとえば様々なアプリケーション向けのデータセットとして、画像及びメタデータを差分取得するために、106において記憶される。図1の例では、107においてユーザIDを受信し、このユーザIDを使用して、108において、このユーザIDについてデータセットについて関連付けが記憶されたかどうか判定する。記憶された場合は、109においてこのデータセットが提供される。記憶されていない場合は、このデータセットは提供されず、ユーザは再び、ユーザIDの入力を試みることができ、又は処理を終了してもよい。
具体例として、たとえば、タブレット又はスマートフォンなどでの装置画面に表示され、ユーザID又は他の識別データ(たとえば、図7について本明細書でさらに説明される画像識別子)の入力に応答して提示される画像210を含むデータセットが、図2に示してある。画像210は、強調表示された領域220、230に関連して表示されるようなメタデータ、並びに、タイトル区域240(「漏れているガスケット」)と、この例では記述的テキスト260及び記述的オーディオ270を含む記述的区域250とにおける自由形式の記述的メタデータに関連付けられる。記述的区域250は、領域220、230にそれぞれマッチするように色分けされた280である記述的テキスト260を表示する。
一実施形態では、たとえば図1の109において提供されるデータセットは、画像ではなくユーザIDに依存する。たとえば、105において、ユーザIDは、領域選択220、230のすべてよりも小さい領域選択、又は記述的メタデータ260、270のすべてよりも小さい記述的メタデータに関連付けられてもよい。具体例としては、第1のユーザIDは、そのユーザ向けに画像が表示されるときに、それぞれが強調されて表示されるように、領域220、230のそれぞれに関連付けられてもよい。しかし、第1のユーザIDは、テキスト記述260だけに限定されてもよい。その一方で、第2のユーザIDは、領域220と230の両方、及び自由形式の記述260と270の両方に関連していてもよく、すなわち、第2のユーザIDは又、オーディオ入力270(たとえば、オーディオ・ファイルへのリンク)にアクセスしてもよく、又それを提供されてもよい。これにより、たとえばユーザIDに基づいて、画像とともに戻されるデータのタイプ及び量に粒度が与えられる。当業者には容易に理解されるように、この粒度は、たとえば、ユーザの役割に基づいて機械の画像に関連付けられた技術的なデータへのアクセスを制限すること、グループのメンバーシップに基づいて人々の画像に関連付けられた識別情報へのアクセスを個人的に制限すること、検索クエリに応答してユーザの関心に基づくある特定の情報をフィルタリング及び表示することなど、数多くの実現可能な用途を有する。
図3を参照すると、この詳細な画像及びメタデータの例示的な使用法は、産業訓練又は監査プロセスなど、画像に焦点を当てたプログラムをユーザがスクリプティングすることを含む。図に示すように、ユーザは、画像の領域に注釈を付けるための入力を提示することができ、こうした入力は、たとえば入力220、230、260、270など、図2の例で概要を説明したものと同様に、301において受信される、たとえば、熟練の機械工は、タッチ・スクリーンの入力を提示して、修理すべきガスケットが漏れている機械の画像の区域220、230を強調表示したり、又は丸で囲んだりしてもよい。さらに、区域220、230を強調表示するか、又は丸で囲むための入力のうち1つ又は複数の入力を提示した後、ユーザは、こうした領域の記述、たとえば、領域220では画像に示してある、漏れているガスケットをテキストで記述すること、及び領域230では流体漏れが目に見えていることを特定することなどを提示してもよい。
データセット、たとえば産業訓練用のトレーニング・セットの一部分であるこのような各画像について、302に示すように、ユーザは、スクリプトに従って、領域固有の選択及び記述とトレーニング画像とを関連付けることができる。スクリプティングのプロセスは半自動でもよく、すなわち、スクリプト化されたトレーニング・プログラムに特定の画像及び記述を含めるための提案をユーザに案内することができる。たとえば、一実施形態は、漏れているガスケットを示す第1の画像をユーザがキャプチャするように促し、その適切な記述とともに、漏れているガスケットの位置、及び画像に含まれる、漏れている任意の流体をユーザが示すように促してもよい。同様にして、(漏れているガスケットを交換するための)メンテナンスを実施するユーザが機械の電源をオフにすることができる機械の区域を、第2の画像が示し、漏れているガスケットを露出させるために機械の領域に適用されるツールを、第3の画像が示し、新規のガスケットの適用を第4の画像が示し、新規のガスケットについて機械の再組立てを第5の画像が示し、それぞれ、適切な領域が強調表示され、関連付けられた記述を含むように、トレーニング又はメンテナンスのスクリプトがユーザによって記入されてもよい。したがって、一実施形態を使用して、スクリプト化され画像に焦点を当てたトレーニング・プログラムを形成してもよい。
本明細書に記載の通り、303に図示するように、このように形成されたスクリプト化プログラムは、適切なユーザIDに関連付けられてもよい。たとえば、トレーニング・プログラム又はメンテナンス・プログラムを作成するユーザは、トレーニング・プログラムをユーザの役割又はコミュニティに割り当てることによってユーザIDを関連付けてもよく、その結果、こうしたユーザはトレーニング・プログラム及び関連するデータセットにアクセスすることができる。このようなスクリプト化プログラムは他にも実現可能である。たとえば、スクリプトの一部として、ユーザに画像をキャプチャする(任意選択としては注釈を付ける)ように要求する、スクリプト化されて画像に焦点を当てた監査データセットを作成してもよい。この監査データセットは、特定のユーザに割り当てられ、クラウド・ストレージ位置に記憶され、他のユーザ、たとえばマネージャによってアクセスされて、要求された手順の遵守を確実にすることができる。たとえば、社会的プレゼンテーション用又は教育的プレゼンテーション用のスクリプト化スライド・ショーなど、他のスクリプト化プログラムがもちろん実現可能である。
図4に示すように、一実施形態によって、ユーザは、領域固有の記述を使用してさらに容易に画像を記述できるようになり、さらにこれを利用して、検索クエリ、画像収集、及び結果処理の改善を容易にすることができる。画像領域に関連した記述を収集及び編成することにより、このようなアプリケーションを容易にする固有の画像シグネチャが得られる。
画像検索については、一実施形態では、画像に関連付けられた豊富なデータセットが与えられている場合に柔軟である、401に示してある1つ又は複数の検索入力を受信する。たとえば、画像領域は(直接的又は間接的に)記述テキストに関連付けられるので、これによりユーザは、対象となるデータを記述しているとユーザが考えるキーワードのテキスト入力を使用して、又は対象となる写真の領域を選択して検索できるようになる。領域選択の例では、一実施形態は、領域選択と、検索するのに使用される記述用語のセットとを関連付ける。
402において、一実施形態では、検索入力に関連付けられたデータセットを識別する。一実施形態では、402において実行される識別は、画像の領域に対する記述的メタデータを利用することによって容易になる。一例として、たとえば図8に示すような特定のシーンの画像をユーザが事前に記述しているので、これにより、そのシーンに含まれる物体に関係するテキスト入力、たとえば人名、街路名、都市名などを含む検索クエリが、画像を戻すことができるようになる。さらに、ユーザが画像の領域を選択する場合、たとえば、画像に含まれる人物を選択する場合、一実施形態では、その領域選択を使用して、検索語、たとえば、その領域での記述的メタデータに含まれる人物の名前を識別し、その人物も含む他の画像を検索して戻してもよい。
一実施形態では、様々な技法を使用して、画像で索引付けされた検索可能な用語を拡張してもよい。たとえば、ユーザが画像領域についての記述的メタデータとしてオーディオ入力を含んでいた場合、一実施形態では、自然言語処理を使用し、記述的オーディオ入力を検索可能なテキストに変換することによって、オーディオをテキストに転記してもよい。一実施形態ではまた、記述を一般化するために単語拡張技法を使用してもよく、たとえば、ユーザによって記述的メタデータ・テキストに含まれる記述用語についての同義語を含んでもよい。
一実施形態ではまた、記述的メタデータを使用して、物体の3次元(3D)モデルを学習するための人工知能プログラムを利用してもよい。たとえば、一実施形態では、同じ領域固有の記述を共有する画像を利用して、様々な画像(又は、その領域)が、同じ物体のもの、たとえば様々な角度で見た同じ物体の画像であることを学習してもよい。具体例として、1人又は複数人のユーザが、同じ物体、たとえば機械の画像をキャプチャし、それぞれが、この機械を含む各領域を同じ又は同様の記述的メタデータを使用してラベル付けする場合、一実施形態では、記述的メタデータに基づいてこうした画像領域を関連付けることになる。画像の数、及び物体(たとえば、機械又はその一部分)を含む領域が指定される確度に応じて、一実施形態では、ある期間にわたって物体の形状の3Dモデルを学習することができる。これにより、一実施形態では、この3Dモデル・データを利用して、たとえばラベル付けされていない画像内の物体を識別できるようになり、又物体の学習済み3Dモデルに基づいて、仮想現実又は拡張現実の表示内に物体の仮想表示を提示するなど、他の機能を実行できるようになる。
この点に関しては、一実施形態では、ユーザが、画像の領域を正確に示して、領域固有のメタデータ記述を追加するのを支援してもよい。一実施形態では、領域は、たとえばグリッド・システムを使用して事前に画定されてもよく、ここでユーザは、画像内の適切なグリッド領域(たとえば、正方形、自動検出された物体のバウンディング・ボックスなど)を選択することによって、自由形式で領域固有のメタデータを提示する。本明細書に記載の通り、一実施形態では、手動入力、たとえばマウス、タッチ・スクリーン入力などを用いて、自由形式の入力を提示することができるようになる。さらに、一実施形態では、物体を選択するための境界適合を半自動処理することによって、領域選択が容易になる。一例として、一実施形態では、ユーザによる初期入力、たとえば1つ又は複数の元画素の表示を取得し、画像解析を使用して、この選択を段階的に拡張することによって、対象となる領域、たとえば人物、建物、道路などをユーザが正確に選択又は強調表示するのを支援する。たとえば、ユーザが個々の物体の元画素を初めに示す場合、境界適合処理は、たとえばグレースケール、カラーなどの画素値などの画質尺度を使用して、画像の外側に元画素を拡張して、その物体の論理的境界、たとえば対象となる画素値が閾値分だけ変化するポイントを見つける。識別された物体の境界が正確である場合、ユーザは、自動適合された境界を受け入れることができるが、正確でない場合には、さらなる入力、たとえば、現在示してある境界内での継続的又は反復的な手動選択によって、一実施形態では、プロセスを繰り返し、すなわち画像解析技法を使用して次の論理的境界を見つけて、段階的に外側へと進行する。このようにして、ユーザは、半自動の物体検出機能を制御する際に支援を受ける。理解されるように、関連データ、たとえばこの物体又は同様の物体ついての関連付けられたメタデータ記述を使用して、画像内の物体の境界を見つける半自動プロセスを、これから先の境界適合のために改善することができ、場合によっては、境界適合プロセスを完全に自動化してもよい。
本明細書に記載の各実施形態は、画像領域に関連付けられた豊富なデータセットを提供し、こうしたデータセットは、データセット、及びデータセットと他の画像関連エンティティとの関係に依存する様々なアプリケーションにおいて活用してもよい。図5に移ると、一実施形態では、ユーザ、コミュニティ、各瞬間、写真又は画像データ、領域データ、及びコメント又は記述データの間の論理関係を利用して、画像及び関連するメタデータに索引付けして、検索、トレーニング、及び協働セッション、並びに他のアプリケーションを容易にする。図に示すように、ユーザ・エンティティ501は、たとえば、役割に割り当てられ、又はたとえば仕事グループ、ソーシャル・ネットワーク・グループなどのグループに含まれる、ユーザのグループであるコミュニティに関連付けられてもよい。コミュニティ又は役割エンティティ502はさらに、瞬間データ503、すなわち1つ又は複数の写真又は画像、領域、及び関連付けられた記述的メタデータを含むデータセットに関連付けられる。瞬間データ503はさらに、写真又は画像データ504に関連付けられ、このデータはさらに、領域データ505及びコメントすなわち記述データ506に関連付けられる。この論理構造により、本明細書に記載の通り、画像に関係するいくつかの実現可能な機能が容易になる。
図6には、ユーザIDが、写真ID、領域ID、記述ID、及び各記述に直接関連付けられて記憶されている、関係記憶の一例が示してある。図6の例では、第1のユーザIDであるユーザAが、写真IDの列入力である写真ID1234に論理的に関連付けられた列に記憶される。第2のユーザであるユーザBが、後続の行に記憶され、やはり写真ID1234に論理的に関連付けられる。しかし、ユーザAは、記述ID001に関連付けられ、ユーザBは、記述ID002に関連付けられる。したがって、ユーザAは、テキストAの記述にアクセスすることができ、ユーザBは、オーディオAの記述にアクセスすることができる。これにより、どのデータセット(たとえば、画像、領域、及び記述)が特定のユーザに戻されるかを、区別して取り扱うことが可能になる。
一例として、一実施形態は、たとえばソーシャル・ネットワークの一部分として、又はオンライン画像共有セッションなどのリアルタイムの協働セッションとともに、オンラインの協働セッションで使用されてもよい。図1を参照すると、ユーザID、たとえばユーザAが107において受信される場合、一実施形態では、108において、ユーザAが写真ID1234に関連付けられていることと、したがって、109において、たとえばブラウザ又はモバイル・アプリケーションにおいてユーザAに提供できる特定の画像とを決定してもよい。同様に、ユーザID、たとえばユーザBが107において受信される場合、一実施形態では、108において、同様にユーザBが写真ID1234に関連付けられていると判定し、したがって、ユーザAと同様の特定の画像をユーザBに提示してもよい。たとえば、ユーザAとユーザBが特定の画像を同時に目にし、たとえばテキスト、音声、又はビデオの通信を介して互いに対話し、画像と対話し、たとえば画像の領域にさらに注釈を付けて記述するように、同じセッション中にこれを実行してもよい。本明細書に記載の通り、各ユーザは、提供された特定のデータセットを有してもよく、このデータセットは、同じリアルタイムの協働セッションの一部分として、別のユーザに提示されるデータセットと部分的に重なり合っていてもいなくてもよく、又は互いに異なる時点において提供されてもよい。図6の例では、ユーザAとユーザBには同じ画像が提供されてもよいが、各ユーザには、写真の同じ領域について様々な記述が提供されてもよい。これは、様々な理由で実行されてもよく、たとえば、場合によってはユーザBがオーディオ・ベースの記述を好み、ユーザAが機械の一部分を記述するある特定のデータにのみアクセスすることを許可されてもよく、ソーシャル・グループのユーザが、もっぱら画像の領域についてのある特定のテキスト記述を見ることができてもよい、などである。当業者には理解されるように、列及び行のレベルのセキュリティを適用することで、たとえば、ユーザID(又は他の識別子)をある特定のデータ・アクセスに制限することができる。
さらに、一実施形態では、画像についての追加情報に索引付けするために、たとえば図6に示すように、データベースの動的な拡張が可能になる。図6に示すように、追加の列N及び関連する行を含むことで示す通り、いくつかの追加の領域及び記述を加えることができる。一実施形態では、画像についての追加の領域選択及び関連する記述に対応するために、追加の列を含んでもよい。さらに、たとえば、ユーザIDとグループID(明示的には図示せず)及びこのグループIDに関連付けられた(アクセス可能な)テーブル・データとをリンクさせるために、他のデータ・テーブルへのリンクを含んでもよい。さらに、領域IDなどデータベース内のエントリは、特定の画像についての画素座標など他のデータと論理的に関連付けられてもよく、これらは、別の列又は表テーブルに記憶されてもよい。
一実施形態の索引付け構造はまた、拡張現実(AR)又は仮想現実(VR)を含む様々なシーン・ベースの状況に適用されてもよい。拡張現実の非限定的な例において図7を参照すると、一実施形態では、たとえばヘッドマウント・ディスプレイ、AR若しくはVRのゴーグル若しくはヘッドセット、又はスマートフォンに関連付けられたカメラから、701においてキャプチャされた、キャプチャ済み画像データを分析してもよい。キャプチャされた画像は、702において受信され、その内容を識別するために分析されてもよい。たとえば、ヘッドセットから局所プロセッサ又は遠隔プロセッサにストリーミングされる画像は、この画像内の特定の領域又は物体の認識を容易にする、物体の検出や識別などの画像処理技法を使用して分析されてもよい。たとえば、目にしている部屋を示す位置ベースのデータ、見る方向を示すコンパス又は加速度計のデータなど、他のデータが、このプロセスを補い又は容易にしてもよい。
その後、703において決定されたように、画像識別(又は、領域識別若しくは物体識別)がデータセットに関連付けられる場合、704に示すように、ライブ画像との組合せのために、このデータセットをユーザのヘッドセット又は他のARディスプレイ装置に提示して戻すことができる。たとえば、このデータセットは、ディスプレイでの画像を拡張する領域固有のメタデータを含む。具体例として図2を参照すると、図2に示してあるタイプの機械を目にするユーザは、たとえばクラウドベースの画像処理アプリケーションによって画像を分析して、特定の機械タイプ及び画角を識別してもよい。この画像識別を、他のデータ、たとえばユーザIDと組み合わせて使用して、適切なデータセット、たとえば、その特定の機械タイプのその特定の視点でのガスケット位置など、領域及び関連付けられた記述のセットを選択してもよい。この記述的な領域固有のメタデータは、たとえば704において、AR表示のためにユーザ装置に戻して提供される。これにより、ユーザは、ローカル装置を使用して機械を画像化し、前もって準備された記述的メタデータ、たとえば、その特定の機械タイプでのガスケットの位置など、たとえば検査や修理などにおいてガスケットの位置を見つけるのに有用な記述的メタデータを取得できるようになる。本明細書に記載の通り、画像又は画像コンテンツの識別は、機械学習又は人工知能を使用して実行して、たとえば画像内に含まれるこれまでにトレーニングされた物体を識別してもよい。この点に関しては、たとえば図5に関連して説明するように、領域IDは、物体IDの形をとってもよい。人工知能プログラムが、目にしている物体を識別することを徐々に学習するように、更新されたユーザ注釈を提示して、さらなる肯定的又は否定的なトレーニング例として使用してもよい。一実施形態では、たとえばARシーンの拡張に使用するための画像メタデータは、任意の適切な識別子、たとえば画像識別子、地理的識別子などを使用して、事前に決定され、提供されてもよい。
図8に示すように、一実施形態では、領域固有の記述を追加するためのユーザ・インターフェース801を画像800に設けて、画像800をコンテンツ識別子のグループ分けに関連付ける。一実施形態では、様々なコンテンツ識別子のグループ分けを様々なタイプの写真に追加するためのユーザ・インターフェース801を設けてもよい。たとえば、一実施形態では、図8に示すような集合写真800について、D(日付)、N(名前)、L(場所)、R(経路)、S(構造物)、P(ペット)、E(環境/イベント)、I(個人)、T(他の物)など、コンテンツ識別子のグループ分けを含んでもよい。もちろん、他のコンテンツ識別子のグループ分けも可能である。非限定的な例として、図8に示す画像800は、コンテンツ識別子のグループ分けE1(環境/イベント)、L1(場所)、I1〜I4(個人)、S1〜S2(構造物)、R1(経路)、T1(物)がユーザ・インターフェース801に設けられた屋外の集合写真を含む。
コンテンツ識別子のグループ分けはそれぞれ、図に示すように、実現可能なデータ・エントリ・タイプのサブセットを含む。一実施形態では、ユーザは、既知のデータ・エントリ・タイプそれぞれについて、手動でテキストを入力する。図8の例では、I(個人)のコンテンツ識別子のグループ分けは、名前、ニックネーム、写真での年齢、生年月日、性別、N1との関係、商業/職業、雇用主、及び学校の、可能なデータ・エントリを含む。ユーザは、インターフェース801を介して、こうしたフィールドのうち任意のフィールドに手動でデータを入力してもよく、一実施形態では、それぞれの画像領域に関連付けられた画像メタデータとしてこのデータを記憶することになる。すなわち、一実施形態では、画像メタデータは、画像800の特定の領域に関連付けられており、たとえば、そのメタデータに関連付けられた画像800の各領域に近接して画像800内に現れるコンテンツ識別子のグループ分け(T1、R1、S2、E1、I1、I2、I3、I4、S1、及びL1)によって図8の例に示してある。したがって、画像800と対話するユーザは、たとえば、I1識別子の特徴又はそれに関連付けられた個人(画素のグループ)に触れることによって、一実施形態では、関連付けられたメタデータ、たとえば個人1の職業を決定し、たとえば同様に関連付けられた画像メタデータを用いて、それに関連付けられた画像又は他のデータを検索できるようになる。
一実施形態では、画像処理に基づいてユーザ・インターフェース801に表示するためのコンテンツ識別子のグループ分けを自動的に提案してもよく、たとえば、物体の検出及び識別を使用して、コンテンツ識別子のグループ分けをユーザが手動で選択してもよく、又は前述の組合せを使用してもよい。一実施形態では、画像内の物体又は領域に関連付けられた、手動選択済みのコンテンツ識別子のグループ分けを使用して、人工知能プログラム用、たとえば人工ニューラル・ネットワーク用のトレーニング・セットを作成する。これにより、肯定的なトレーニング画像と、それに関連付けられたコンテンツ・カテゴリの識別子及び/又はデータ・エントリのセットを提供することによって、このような人工知能プログラムのトレーニングを支援する。したがって、一実施形態では、物体のタイプが画像内に含まれているかどうか、及び、どのコンテンツ・カテゴリの識別子が、その物体のタイプに関連付けられているかを識別することについて、時間が経つにつれて改善することになる。したがって、より多くのコミュニティ・メンバーが注釈付きの画像を追加し、これらが肯定的なトレーニング例として使用されるように、画像処理が改善することになる。これにより、画像領域又は物体と、コンテンツ・カテゴリの識別子及び/又は関連付けられたデータ・エントリとの間の関連付けを自動的に識別する際の一実施形態を支援する。たとえば、一実施形態では、顔が、カテゴリIタイプの識別子に関連付けられており、道路又は橋が、コンテンツRタイプの識別子に関連付けられていることを学習することができる。さらには、たとえば一実施形態をトレーニングして、特定の物体タイプに関連付けられた記述的メタデータ、たとえば特定の機械モデルを使用して、この特定の物体タイプを認識するような改善も可能である。
学習済みのこうした関連付けを使用して、たとえば、学習済みの類似性に基づいて、ある特定の結果を促すことによって、画像検索を改善するなど、ある特定の機能を自動化又は改善することができる。一実施形態では、人工知能を利用して、画像のコンテンツ・カテゴリの識別子及び関連付けられたデータ・エントリを使用して、この画像を関連付けてもよい。一例として、画像のコンテンツ・カテゴリの識別子及び関連付けられたデータ・エントリが写真ゲノムを構成し、この写真ゲノムは、時間が経つにつれて(すなわち、コンテンツ・カテゴリ及び/又はデータ・エントリが追加、削除、又は修正されるにつれて)変化することができ、これによって、写真を互いに関連付けることができる。たとえば、同様のコンテンツ・カテゴリを有する画像は、同様のコンテンツを有すると推定することができる。同様に、コンテンツ・カテゴリの識別子データ・エントリを使用して、さらに洗練された類似性の採点を遂行することができる。一例として、同じコンテンツ・カテゴリの識別子、たとえばRをそれぞれが有する2つの画像は、そのレベルの類似性を共有するが、同じコンテンツ・カテゴリの識別子、たとえばR、及びデータ・エントリ、たとえば経路79を有する2つの画像は、さらに洗練されたレベルの類似性を共有する。理解できるように、2つの画像が共有するコンテンツ・カテゴリの識別子及びコンテンツ・カテゴリの識別子データ・エントリが多くなると、この2つの画像の関連性が強くなる。画像のこの特性は、たとえば画像検索、コンテンツ推奨など、様々な機能に活用することができる。当業者には理解されるように、画像の写真ゲノムは、様々な技法を使用して関連付け、類別し、クラスタ化し、又は他の方法で関係することができる。
図9及び図10には、1つ又は複数のデータ処理構成要素及びキャプチャ装置の関連付けられたデータ・ストレージ構成要素(たとえば、アプリケーションのプロセッサ及び集積回路メモリ、デジタル信号プロセッサ、マイクロコントローラなど)及び/又はコンピュータ1810、及び/又はクラウド・コンピューティング/ストレージ・インフラストラクチャを構成し、又はプログラムして、列挙された動作及びその変形形態を実行する、コンテンツ識別のためのアプリケーション又はプロセスの実施形態が示してある。タグ付け、関連付け、及び/又はコメント付けのアプリケーションへの以下の言及は、タグ付け、関連付け、及び/又はコメント付けのプロセスと交換可能であり、これらは、コンテンツ識別アプリケーションを実行するときに、コンテンツ・キャプチャ装置及び/又はコンピュータ1810及び/又はクラウド・コンピューティング/ストレージ・インフラストラクチャを介して実行されるプロセス/アプリケーションである。
図9〜図10に示すように、コンテンツ識別アプリケーションは、識別、選択、認識、及び/又は関連付けのステップを含む複数のステップを有してもよい。図9〜図10をまとめて参照すると、1つ又は複数の識別ステップ960、1002において、コンテンツ識別アプリケーションは、コンテンツを識別するためにコンテンツ・キャプチャ装置及び/又はコンピュータ1810を利用するユーザから、識別されたデジタル画像905を受け入れて処理してもよく(964)、コンテンツ・データベースに記憶するために、コンテンツ管理システムにおいて一意な識別子を画像905に割り当ててもよい。特定のデジタル画像905に関連付けられた一意な識別子は、サード・パーティのサーバ及び/又はコンピュータ1810上で実行されている他のアプリケーションによって識別されるいくつかのコンテンツを有してもよく、これはサード・パーティのデータ及び/又はストレージを介して、及び/又はキャプチャ装置のストレージ自体に記憶されてもよく、及び/又はコンテンツ識別アプリケーションに入るときに識別されるコンテンツはない。さらに、一意な識別子は、たとえばシリアル・ナンバー、英数字の識別子、バーコード、又は、デジタル画像905に示してある明/暗の画素の既定のサブセット若しくはその全体によって定義された画像ベースの2Dバーコードを含んでもよい。
図9の画像コンテンツ識別ステップ966〜990、及び図10の1012〜1016において、コンテンツ識別アプリケーションは、画像905、1005に表示された対象となる特定のコンテンツにおいてユーザを介して、選択された画像コンテンツ982、1014についてID情報を関連付けてもよい。図10に示すように、ステップ1006において、コンテンツ識別アプリケーションは、一般にデジタル画像内の物体/コンテンツを検出及び分析するのに使用される様々なアプリケーションによって実行されてもよいように、アップロードされたデジタル画像1005内のコンテンツを特定し、特定されたコンテンツについての認識シグネチャを計算するようにさらに構成されてもよい。以下でさらに詳細に説明し、図8にも示すように、特定されたコンテンツは、顔、場所、構造物、街路、植物、動物、イベント、物などを含め、画像1005の特定の部分に関連付けられた様々なコンテンツを含んでもよい。図8に示すように、このようなコンテンツはさらに、類別及び/又は分類されてもよく、画像1005内での日付(D)、名前(N)、場所(L)、経路(R)、構造物(S)、ペット(P)、環境/イベント(E)、他の物(T)など、コンテンツ識別子のグループ分けが与えられてもよい。
図9に示すように、ステップ970〜990を介して、コンテンツ識別アプリケーションは、このコンテンツ識別アプリケーションを利用するユーザが、コンテンツ・フィールド970を選択して、ステップ976において画像コンテンツと選択されたコンテンツ・フィールドとを関連付けてもよいように、(たとえば、図8に示すように)コンテンツ識別可能な画像968を表示してもよい(966)。ユーザが識別したい画像内の情報についてのコンテンツ・フィールドを見つけない場合、このユーザは、特定用途向けコンテンツ・フィールド974を選択し、これにラベル付けしてもよい。或いは、当業者には理解されるように、たとえば図8のタッチ・スクリーン・ディスプレイ上に示すように、ユーザの指入力選択及び/又はマウス選択を介して、最初に画像物体を選択し、次いで、その選択された画像物体についての選択されたコンテンツ・フィールド内のID情報(たとえば、人物、住居など)を選択することによって、ユーザは開始してもよい。画像情報識別ステップ976〜982において、アプリケーションは、画像905内のコンテンツについてのID情報、ステップ980を介したユーザ入力を関連付け、たとえば1830又は1870などのコンピュータ読取り可能な記憶媒体に伝送するために、ステップ982を介してコンテンツ強化画像984を準備してもよい。追加の画像ID情報は、ステップ990を介して入力してもよい。
他の実施形態では、図10のステップ1008〜1011に示すように、コンテンツ識別アプリケーションは、特定されたコンテンツ認識シグネチャと、関連する記憶されたコンテンツ・シグネチャとを予備的にマッチさせることにより、コンテンツ・データベース及び/又はインフラストラクチャ及び/又はデジタル画像1005内のデータにおける、記憶された/既知のコンテンツ・シグネチャに対して、この特定されたコンテンツ認識シグネチャを処理してもよい。ステップ1012において、コンテンツ識別アプリケーションを利用するユーザは、可能な場合は、既知のコンテンツ・フィールドについてのID情報の予備的マッチングの確度を検証してもよく、又は否定してもよい。画像情報識別ステップ1012〜1014において、このアプリケーションは、ステップ1012を介したユーザ検証、又はステップ1015を介したユーザ入力のいずれかによって、写真1005内のコンテンツのID情報を関連付け、たとえば1830又は1870などのコンピュータ読取り可能な記憶媒体に伝送するためのコンテンツ強化画像1016を準備してもよい。図9でのステップ990と同様に、必要な場合、コンテンツについての追加ID情報を入力してもよい。
別の実施形態では、図2に示す実用的なアプリケーションによって示すように、コンテンツ識別用の1つ又は複数のステップ960〜990を実行してもよい。コンテンツ識別アプリケーションは、工業環境において1人又は複数人の工場労働者(図示せず)によって利用されて、(たとえば、図2において、工場労働者によってキャプチャされた機械の写真210として示すような)コンテンツ識別可能な画像968を表示してもよい(966)。画像968、210のこのような表示966は、たとえば、タブレット又はスマートフォンのコンピューティング装置などでの装置画面を介して表示されてもよい。コンテンツ識別アプリケーションを利用する工場労働者は、ステップ976において、画像コンテンツと選択されたコンテンツ・フィールドとを関連付けるように、(たとえば、タイトル区域240及び/又は記述的区域250として示す)コンテンツ・フィールド970を選択してもよい。図2に示す一実施形態では、工場労働者は、タイトル区域240として示してある特定用途向けコンテンツ・フィールド974を選択し、テキスト「漏れているガスケット」を入力してもよい。或いは、当業者には理解されるように、工場労働者は、最初に画像物体、たとえばユーザの指入力選択及び/又はマウス選択を介して、図2に示すガスケットの境界輪郭220に適合する形を選択し、次いで、ガスケットにおける選択されたコンテンツ・フィールド(たとえば、タイトル区域240)のID情報980を選択することによって開始してもよい。さらに、又は代替的に、工場労働者は、テキスト260又はオーディオ入力270を介して、ガスケットにおける記述的区域250を使用する情報識別ステップ976、982を使用して、画像210におけるID情報980をさらに埋め込み、このような自由形式の記述260、270と、色、数字など視覚的な識別特徴とを関連付けて、これと特定のそれぞれの領域220、230とを関連付けてもよい。一実施形態では、このような識別特徴は、特定用途向けのコンテンツ・フィールド及びラベル974を利用して、選択された画像物体(たとえば、ガスケット選択220)と、選択された各画像物体に関連付けられた特定のID情報280とを視覚的に接続するために、画像物体とそれに関するID情報とをさらに関係付ける。アプリケーションは、画像968、210内のコンテンツについてのID情報980(たとえば、メタデータ260)、ステップ980を介したユーザ入力を関連付け(982)、装置及び/又は、たとえば1830若しくは1870など他のコンピュータ読取り可能な記憶媒体への伝送及び/又は記憶のために、ステップ982を介してコンテンツ強化画像984を準備してもよい。
一実施形態では、コンテンツ識別アプリケーションの1つ又は複数のステップは、動作960、1002において、スキャナ(カメラ/CCDとも呼ばれる)を使用して、写真をデジタルでキャプチャするためのユーザ・コマンドに応答して、動作を自動的に開始してもよい。本明細書では、写真を識別又はキャプチャすること、及びその変形形態は、物理的な写真又は他の物体など、ある物体からの光波であって、電荷結合デバイス(CCD)又は相補型金属酸化膜半導体(CMOS)チップなどの電子撮像装置によって検知される光波を、画素からなるデジタル画像に変換するプロセスから生まれるものと理解されている。デジタル画像905、1005は、デジタル画像ファイル・フォーマット(たとえば、ジョイント・フォトグラフィック・エキスパート・グループ(JPEG)、エクスチェンジャブル・イメージ・ファイル・フォーマット(Exif)、タグ付き画像ファイル形式(TIFF)、ポータブル・ネットワーク・グラフィックス(PNG)、RAW画像ファイル形式、グラフィックス・インターチェンジ・フォーマット(GIF)、BMPファイル形式など)で、一過性又は永続性いずれかのメモリに記憶されてもよい。
別の実施形態では、識別ステップは、キャプチャ装置、又はこのような画像用の他の記憶位置に記憶された、これまでにキャプチャされた画像905、1005上でコンテンツ識別アプリケーションが動作するように、ユーザによって手動で呼び出された後に動作を開始してもよい。
図11は、たとえば図18に示すようなコンピューティング・システムを使用して実行してもよい、例示的な実施形態を使用する動作の基本的な流れを示す図である。第1に、ユーザは、1101に示すように、システムへアクセスするように登録されるはずである。第2に、ユーザは、1102においてシステムにログインしてもよい。次いで、ユーザは、1103において写真をシステムにアップロードしてもよい。同じプロセスにおいて、ユーザは、1104において写真の価値を識別するために、写真に1つ又は複数のカテゴリを付与してもよい。その後、ユーザは、1105において、自分又は他のユーザにとって興味深い可能性のある写真の領域を強調表示し、領域座標のセットを用いてこの領域を選択してもよい。領域を選択した後、ユーザは、1106において、この領域にカテゴリを付与して、この領域の価値を識別してもよい。写真に関連付けられたメタデータが1107において更新されることになり、最終的に1108において写真がデータベースに記憶されることになる。
図12には、関係する写真を検索するための例示的な実施形態の動作の基本的な流れが示してあり、これは、たとえば図18に示すようなコンピューティング・システムを使用して実行してもよい。1201において、ユーザは、システムにログインし、1202において1つ又は1組のキーワードを入力することになる。1203、1204に示すように、キーボードに関連するカテゴリを含むあらゆる写真が、データベース内に見つかり、取得されることになる。次いで、システムは、1205において領域カテゴリを検索することになり、したがって、キーワードに類似した領域カテゴリを有するそうした写真が、1206において見つけられ、取得されることになる。1207に示すように、このようにして見つかったあらゆる写真が、その関連性に基づいて構成され、1208において適宜表示されることになる。
図13には、システムを使用して、写真のメタデータに情報を追加し、したがってこの写真があらゆるユーザにとって価値を増すものになるようにする動作の基本的な流れが示してあり、この動作は、たとえば図18に示すようなコンピューティング・システムを使用して実行してもよい。システムにアクセスするユーザは、1301に示すように、対象となる写真をまず選択することになる。次いで、ユーザは、1302において写真をカテゴリで識別することになる。このようなカテゴリは、写真全体に適用され、全体としてこの写真に適用される識別情報を伝達することになる。次いで、1303に示すように、ユーザは、コメントを用いて写真のカテゴリをさらに説明して、このカテゴリの意味を詳しく述べることを選択してもよい。次に、1304において、ユーザは、自分にとって興味深い可能性のある写真の特定の領域を識別してもよい。このような特定の領域は、建物、人物、物体、又は活動とすることができる。1305に示すように、各領域に領域カテゴリが追加されることになり、1306に示すように、このような領域カテゴリにさらなるコメントを追加することができる。最終的に、1307に示すように、写真のメタデータが新規のカテゴリ及び領域カテゴリで更新されることになり、1308に示すように、写真がデータベースに記憶されることになる。写真内の様々な価値を探している数多くのユーザにとって、このような写真は、ここでさらに検索しやすくなるはずである。
一実施形態では、データベースは写真を含み、この写真のそれぞれはメタデータによって記述される。さらに重要なことに、各写真は、領域座標によってさらに小さいセクションに分割することができる。こうした相対的に小さいセクションを使用して、大きな写真に含まれる特定の物体を識別し、その結果、各写真を正確にラベル付けして、写真内に存在するあらゆる物体を反映することができる。各写真領域に領域コメントを関連付けてもよく、その結果、特定の領域についての詳細な記述を入力することができる。続いて、この領域コメントは、任意のユーザによって検索可能になる。写真領域を領域カテゴリ内にさらに分類することができ、その結果、写真領域内の各物体をデータベース内で、さらに良好に編成及び管理することができる。
ユーザのプロファイルは、データベース内で管理されてもよく、このデータベースは写真へのアクセスも提供する。物体ベースの画像管理システムのユーザは、あらゆる写真を閲覧し、写真領域及び写真領域コメントを編集することができるようになる。これにより、特定の写真の価値に様々な洞察を加えることのできるユーザのコミュニティが形成される。各写真において識別及び分析できる物体の数が増えるので、このようなコミュニティは、関係するあらゆる人に、価値あるサービスを提供することができる。写真において何が価値あるかの考えはユーザごとに異なるので、複数の人々にとって、写真をさらに価値あるものにすることができる。
コミュニティ・ベースの写真管理の利点の一例は、以下の例によって説明することができる。ある卒業生が、自分の学生時代の集まりの写真を見つけ、卒業生コミュニティの残りの卒業生とその写真を共有しようとした。領域編集機能を使用して、写真において自分の知っているあらゆる人を識別している間に、自分の寮の4階で寮生活アドバイザを務めていた人を認識した。しかし、彼は、この人の名前を知らなかった。したがって、彼は単に、この特定の写真領域と「4階のRA」の領域コメントとを関連付けた。この写真をふと目にした別の卒業生が、4階のRAを務めた人物を知っており、領域コメントが彼の実際の識別情報を反映していないことを知った。次いで、このような卒業生は、領域コメントを編集して、この人物を正しく識別できるようになる。したがって、協働メカニズムを通して、次に写真を正しくラベル付けして、対象となるあらゆる人物を識別してもよい。このような成果は、既存の画像共有システムでは、これまでのところ利用できない可能性がある。
別の例は、同じ写真内の追加の物体を識別することになる。集まりの写真において、卒業生の誰もが熱気球を知らず、又はそれを気にもかけていないが、この特定の熱気球は、別のメンバーにとっては何らかの価値があると仮定する。ユーザのうちある1人は、この特定の写真領域をここで検索できるように、年、場所、又は作製者(必要な場合)などの情報とともに、この熱気球にラベル付けする必要があると感じる場合もある。
ユーザのうちある1人は、何からの重要な思い出のために、この特定の熱気球を探してきて、ウェブ上で検索してきたが成功しなかったと仮定する。一実施形態のユーザが写真領域を識別した後、もともとは昔の大学の集まりを記念するだけのものであったこの画像が、ここで特定の気球を検索する際に現れるようになる。したがって、熱気球に興味のあるユーザは、ここでこの写真を見つけ、関連付けられたその他すべての写真領域のコメントを使用して、熱気球の所有者を特定するのに役立つことができる。1人のユーザによる対象の記述によって、あらゆる画像が制限されるので、オンラインでの現在の画像共有システムでは、このような成果は不可能である。ユーザのコミュニティに写真領域のタグ付け機能を付与することによって、通常は画像ストレージ・システムに関連付けられる偏りをなくすことができる。
図14を見て分かるように、又本明細書に記載の通り、このシステムは、以下のセクション、すなわちクライアント・アプリケーション、プレゼンテーション層API、ビジネス・ロジック、データ・アクセス、データベース、並びに最終レベルでは写真及びそれに関連付けられたメタデータに分割されてもよい。ユーザは、写真をアップロードしようとするとき、クライアント・アプリケーションが存在する装置から画像を選択し、それをシステムに渡してもよい。このような画像は、ユーザの装置に前もって記憶されていてもよく、この装置には、コンピュータ、携帯電話、又は他のモバイル装置が含まれ得る。実施形態によっては、画像は、ユーザの装置に関連付けられた画像キャプチャ手段を介して、リアルタイムにキャプチャされてもよい。
ユーザがシステムに渡したい画像を選択すると、プレゼンテーション層APIが、直感的なインターフェースを提供して、アップロード手順の残りを通してユーザを案内することになる。続いて、ビジネス・ロジックがデータ・アクセスに画像を挿入することになる。このデータ・アクセスは、画像が記憶され、編成されることになる場所でもよいデータベースへの経路を提供する。このシステムは、アップロードされた画像にユーザが名前を付けるように促すことになり、この名前は、画像に付けられた写真IDに変換されることになる。最終的に、この写真は、IDに関連付けられ、写真に関連付けられた任意のメタデータとともにデータベースに記憶されてもよい。この写真IDは、アップローダにとっては役に立ち、画像を要求するのに使用することができるが、画像の唯一の識別子ではない場合がある。写真とその写真IDとを関連付けていない人によって画像を識別及び取得できるように、所与の各画像について可変の識別子を作成するのに、これは一実施形態の目的に沿うものである。
画像がアップロードされると、ユーザは、クライアント・アプリケーション(クライアント・アプリ)を使用して、写真にカテゴリを割り当ててもよい。一実施形態では、データベースへのアクセス権を有するどんなユーザも、アップロードされた写真にカテゴリを割り当てることが許可されることになり、その結果、写真の可能なあらゆる価値をユーザのコミュニティによって識別することができる。ファイル名のテキスト及びデータの価値は限定されており、各写真に利用可能な価値のあらゆる範囲を完全に反映することができないので、写真を単なるそのファイル名を超えて、カテゴリに関連付けることが重要になる場合がある。したがって、「カテゴリ」と呼ばれる別々の識別子が使用されて、画像をさらに識別することになる。
プレゼンテーション層APIは、写真に埋め込まれた情報としてカテゴリを追加するための、包括的なユーザ・インターフェースを提供する。ビジネス・ロジックは、埋め込まれた情報モジュールから受信するカテゴリを、写真に挿入することになる。データベース内の写真について、写真カテゴリ・レコードが作成されることになり、このようなカテゴリが、写真のメタデータに追加されることになる。このようなデータは、システムへのアクセス権を有するあらゆる人に検索可能になる。既存のメタデータなしで写真がアップロードされることもある場合、システムは、写真に関連付けられた新規のメタデータ・ファイルを作成することになる。
一実施形態では、写真のあらゆる領域も識別及び分類することができる。写真は、花瓶又はトランプなど、識別及びラベル付けすることができる様々な物体を含んでもよい。一例では、熱気球は領域によって識別することができ、カテゴリは熱気球に関連付けることができる。したがって、写真は、ある特定の人物又はイベントだけでなく、物理的な物体にも関連付けられることになる。写真内のあらゆる物体は、1組の画素座標内に囲まれていてもよいので、あらゆる物体は、適切な座標によって識別することができる。したがって、写真は、画素座標によって識別される写真の物体に基づいて、このような領域によってさらに分類することができる。このような領域ベースのカテゴリは、メタデータ内の写真にも関連付けられることになり、写真の価値が高まる。
写真が適切にアップロードされ、カテゴリ情報が埋め込まれると、この写真は、そのメタデータに基づいて取得できるアイテムになる。すなわち、この画像は、そのカテゴリのいずれかがユーザの検索において現れると、取得されることになる。したがって、この画像は、そのファイル名だけで取得することがもはやできなくなり、他の方法で非表示になっているそのユーティリティに基づいてユーザからアクセス可能になることができる。カテゴリ内の関連付けられた画像を検索するには、ユーザは、プレゼンテーション層APIからの検索モジュールを利用してもよい。ユーザは、キーワード又はフレーズを識別してもよく、ビジネス・ロジックは、写真のメタデータの一部分として存在することになる1組の写真の物体又はカテゴリをユーザに戻すことになる。次いで、ユーザは、キーワード又はフレーズに最も関連性の高いカテゴリを選択してもよく、ビジネス・ロジックは、選択された写真の物体又はカテゴリを含むメタデータを取得することになる。1組のメタデータがビジネス・ロジックに戻されると、この1組のメタデータに対して関連付けアルゴリズムが実行されて、一致するあらゆる写真を識別することになる。最終的に、一致するこうした写真がデータベースから再試行され、ユーザのクライアント・アプリケーションに戻されることになる。
上記プロセスが示すように、写真のあらゆる可能な価値を識別及び利用できるように、このシステムに渡されるあらゆる写真には、複数の識別子が与えられることになる。アーキテクチャ上の各要素は、写真の適切な記憶及び分析のための即時動作の役割を担うことになる。一実施形態では、ユーザのコミュニティはあらゆる写真にアクセスし、したがって、数多くの写真の物体を識別することができ、適用可能なカテゴリを埋め込むことができる。したがって、あらゆる写真は、関連付けられたメタデータによって提供される、かなりの検索能力及び価値を有することになる。
写真のメタデータ構造の一例が、図15及び図16に示してある。このシステムに、写真をアップロードしてもよい。ユーザは、この写真での1人の人物を知っており、この人物の名前はMike Toddである。したがって、この写真は、「Mike Todd」を識別するように、初めにラベル付けされてもよい。従来の画像管理システムでは、この写真のみが、Mike Toddに関係する用語を検索可能にする。この写真には数多くの人々が存在しており、他のユーザはこうした人々を知っている場合があるので、これは非常に紛らわしい。又は、このような写真において、知っている人物に会いたいはずである。しかし、既存の写真管理システムでは、「Mike Todd」が写真に存在していることを知らない限り、この写真を見つけることはないはずである。
一方で、一実施形態を使用すると、他のカテゴリを追加して、この写真をさらに識別することができる。所与の例では、ポーカー・ゲームを強調表示する領域が識別されてもよく、カテゴリがこのような領域にちなんで名付けられる。1人のユーザが「イベント:ポーカー・ナイト」の下でこの領域を識別し、別のユーザが「ゲーム:3カード・ポーカー」の下でこの領域を識別した。したがって、ここでこの写真は、「ポーカー・ナイト」又は「3カード・ポーカー」に関係する検索語の下で取得可能である。このようなシステムの有用性は、次のように説明することができる、すなわち、あるユーザは、写真の中の人物たちのうち1人を知っていることもあるが、誰がMike Toddなのか知らない。彼が知っていたのは、自分の友人が在学中にポーカーで遊んでいたこと、又は具体的には、3カード・ポーカーを楽しんでいたことだけである。ここで彼は、このシステムのユーザとして、このデータベース内で「ポーカー・ナイト」又は「3カード・ポーカー」を検索してもよい。このユーザにとって幸運なことに、この写真が現れることになる。従来のシステムの下では、この写真は、初めのうちユーザには未知の可能性がある属性に関連付けられていたので、このユーザは写真を見つけることができないはずである。
一実施形態では、このシステムはまた、写真内でインポートされたメタデータを検索できる場合がある。場合によっては、写真には、どんなユーザにも見えないか又は未知である可能性のある、埋め込まれた情報がある、しかし、このような埋め込まれたメタデータは、どこを見るべきか知っている人には見える場合がある。このシステムは、既存の任意のメタデータにおけるアップロードされた写真を徹底的に探し出し、それをデータベースにインポートできるようにする。このようなメタデータは、このシステムのユーザによって特に編成されてはいないので、別々の「インポートされたメタデータ」フィールドの下に表示されることになる。したがって、この写真を見ている任意のユーザは、インポートされたメタデータを使用して、写真及びそれに関連付けられた領域をさらに正確に分類できるようになる。
図16には、一実施形態での画像表示のレイアウトが示してある。この写真のすぐ下には、主要な写真カテゴリ1610及びそれに関連付けられたコメント1620が存在する。写真をアップロードするユーザは、写真に適用可能な自分の価値観に従って写真にラベル付けできるようになり、及びカテゴリ・コメントを使用して、写真をより詳細に作成又は記述できるようになるはずである。画像が記憶されると、他のユーザは、カテゴリ1630及びカテゴリ・コメント1640を全体として写真に帰することもできる。次に、写真を各領域に分割し、特殊性をさらに際立たせて識別することができる。またしても、領域カテゴリを渡す人には、領域カテゴリ・コメントを提供して、ある特定の領域について詳述するための機能が与えられることになる。写真を最初にアップロードするユーザと、関連付けられた検索によって写真を見つけたユーザとを含むあらゆるユーザが、写真及びその領域の分類に寄与できるようになる。最後に、各写真に関連付けられたインポート済みのメタデータ1650が、他の情報とともに表示されて、有機的な情報フィールドを提供することになる。このような情報フィールドは、どのようにして写真をさらに識別できるかについての洞察を、他のユーザに提供することができる。一実施形態では、関連付けられた画像を見つけるために、上記フィールドでのあらゆるテキスト情報が、システムを通して検索可能になってもよい。
シナリオの別の例を図17に示すことができる。これは、カーネギー・メロン大学のキャンパスでのある区域の写真である。この写真には様々な建物が見えており、それぞれが様々なユーザによって詳細に記述されていてもよい。たとえば、Hamerschlag Hallの輪郭を描く領域は1710で識別されてもよく、又この領域を反映するカテゴリは1711で追加されてもよい。さらに、建設された年及び位置を含め、この建物に関するさらなる情報も、この領域に添付される。ユーザのコミュニティは、この建物に関するさらなるコメント及び考察を提供することができる。このようなコメントは、通常なら建物へ個別に関連付けることができない追加の洞察を、その建物に提供する。別の例では、ユーザは、コーヒーの品質についての意見(1721)を述べたWean Hallの輪郭を描く領域についてコメントした(1720)。別のユーザは単に、コーヒーを販売する場所を検索していてもよく、このコメントのおかげでこの画像まで誘導されることになる。このユーザはここで、Wean Hallが美味しいコーヒーを販売する事実を秘かに知る。当業者には理解されるように、このタイプのアプリケーションは、このシステムの自然な利用でもよい。
一実施形態では、本明細書に記載の通り、写真内の領域の輪郭は、物体の境界アルゴリズムを利用して、領域内の対象となる物体にさらに適合することができる。たとえば、図15での柱にぶら下がっている帽子は、その形状に応じて強調表示することができる。このような画素情報は、拡張部としてこのデータベースにさらに記憶することができ、したがって、このような輪郭を含む他の画像をさらに関連付けることができる。一実施形態では、写真は、カテゴリ、コメント、及び他のメタデータに加えて、画素調整によって検索可能である。
一実施形態では、システムは、ユーザがユーザ登録を利用し、システムにログインし、システムの外側の誰かにeメール又は通信を送信し、関連付けられた写真を閲覧し、キーワード・ベースの写真検索を実行し、サード・パーティのリポジトリから写真及びメタデータをインポートし、ユーザの写真コレクションからある写真を削除し、ユーザのファイル・システムから写真を一括アップロードし、写真を閲覧し、写真に情報を埋め込み、写真にコメントを追加することができるようにする。上記機能のうち、アプリケーション・エージェントを利用して、関連付けられた写真を閲覧してもよい。検索エージェントを利用して、キーワード・ベースの写真検索を実行し、XMLパーサを利用して、サード・パーティのリポジトリから写真をインポートしてもよい。
適用可能な各機能が、各モジュールを通して実装される。別々のモジュールに機能を割り当てることにより、効率及びトラブルシューティング能力が改善するようにシステムを設計することができる。ユーザ管理モジュールでは、ユーザは、ユーザ登録、システム・ログイン、及びシステム外部のユーザとのeメール管理を通してシステムと対話してもよい。ユーザ管理モジュールは特に、ユーザのプロファイル及び外部ユーザとの対話を統制する。このモジュールは、システム内の写真へのユーザのアクセスを規定し、外部リソースとユーザの対話を制御する。一実施形態では、ユーザ管理モジュールは、ユーザが写真アクセスに制限を課して、データの確度及び一貫性を維持できるようにする。さらなる一実施形態では、ユーザ管理モジュールは、ユーザがシステムの非ユーザを招待して、写真及びそれに関連付けられたメタデータを閲覧できるようにする。一実施形態では、ユーザ管理モジュールは、ユーザが友人又はグループとして互いを追加して、このシステムのソーシャル・メディアの価値を高めることができるようにする。
埋込み情報モジュールは、データベースに記憶された写真を閲覧し、写真に情報を埋め込み、このような写真にコメントを追加することによって、ユーザがシステムと対話できるようにする。埋込み情報モジュールは、ユーザと写真に添付されたメタデータとの間の対話を統制する。このモジュールを通して、写真は、単一のファイル名を有する単純な画像から、データ関連付けが無数の潜在的可能性を有する複雑なエンティティに変換されてもよい。写真に追加のデータ点を付加することによって、写真は、一画像であることを超えて、豊富な情報の結合体へと変わる。一実施形態では、埋込み情報モジュールは、ユーザが、音声からテキストへの技術を使用して、写真に情報を埋め込めるようにする。さらなる実施形態では、埋込み情報モジュールは、同様の写真に基づいて、同様のフィールドに断定的なテキストを追加してもよい。一実施形態では、写真内の各領域は、その領域座標の類似性に基づいて編成することができる。一実施形態では、写真管理システムは、写真内のある特定の物体の実際の形状に基づいて編成されることになる。
アップロード・モジュールは、サード・パーティのリポジトリから写真及びメタデータをインポートし、ユーザの写真コレクションから写真を削除し、ユーザのファイル・システムから一括アップロードすることによって、ユーザがシステムと対話できるようにする。このモジュールは、ユーザの装置からこのシステムのストレージ構成要素への写真の送出を統制する。一実施形態では、写真は、アップロードされた後、任意の潜在的なメタデータについてスキャンされてもよい。したがって、写真は、単なる画像ではなく、画像に結びついた関連情報の結合体でもよい。一実施形態では、ユーザがサード・パーティのリポジトリから事前記憶された写真をアップロードできるように、サード・パーティのユーザ・ファイル・システムをリンクすることができる。
検索モジュールは、ユーザが、関連付けられた写真を閲覧し、キーワード・ベースの写真検索を実行することができるようにする。写真は、写真全体又は写真の領域全体に基づいて、ここで数多くのカテゴリに関連付けられているので、従来のデータベースと比較して結果の量が増加することになる。一実施形態では、検索モジュールは、最も適切な結果が最も目に見えるように、検索結果を統制することができるようになる。一実施形態では、複数の検索判定基準を組み合わせて、特定の写真を特定することができる。さらなる一実施形態では、検索モジュールは、このシステムの外部にあるサード・パーティの写真ビューアに写真を表示できるようにする。
一実施形態では、検索モジュールは、ユーザが、検索とのその関連性に基づいて写真を格付けできるようにする。これにより、検索結果の編成がさらに良好になり、したがってユーザは、その結果を通してさらに容易に解析できるようになる。さらなる一実施形態では、検索モジュールは、自動的に実行され、変更の更新をユーザに通知するようにスケジュールすることができる検索エージェントを利用してもよい。
本明細書において述べるあらゆるモジュールは、連携して、首尾一貫したシステムを形成し、メタデータと写真のシームレスな統合を可能にして、包括的な索引付けシステムを提供し、これによってあらゆるユーザに無制限の関連性と検索機能を提供する。一実施形態では、写真管理システムは、フェイスブック、インスタグラム、ツイッター、リンクトイン、又は他の卒業生関係のウェブサイトなど、ソーシャル・メディア・ウェブサイトと一体化されて、拡張されたユーザ・コミュニティを実現することができる。この拡張されたユーザ・コミュニティを利用して、多数の写真での情報をロック解除することができ、その結果、画像は、百科事典のエントリと同様の情報の接続されたポートになる。一実施形態では、このシステムが提供されて、画像及びその関連付けられた領域に基づく情報のウェブを作成する。この写真管理システムでの写真は、どれだけ言葉を尽くしても説明しきれないものになり、こうした言葉は、コミュニティでのユーザ間の具体的な連結の形になる。
一実施形態を使用して、様々な垂直的市場向けの複数のフロントエンドをサポートするための、バックエンド機能を提供してもよい。たとえば、複数の組織又は企業実体が、フロントエンド・コンテンツのサポートにおいて単一のバックエンド・システムを利用することもできる。一実施形態を異なる学校によって使用して、インタラクティブな写真アーカイブを作成してもよい。それぞれの学校は、それ独自の卒業生ネットワークによって共有及びアクセスできる、個々の写真アーカイブを有することになるが、単一のプラットフォーム上でバックエンド・システムのサポートが提供されて、様々なフロントエンドにおいてデータの一致を確実にすることになる。
一例として、たとえば、ウェブ・インターフェース・ページに表示される画像の一部又はすべては、拡張画像システムへのアクセス可能性を示すための記号を用いて示されることになる。システムによる注釈においてこうした画像が有効になっているはずであり、したがって、ユーザは各写真に関連付けられた機能の可能性を理解できるはずである。拡張画像システムに関連付けられた写真は、他のシステムでは利用不能になる様々なインタラクティブ機能をユーザに提供することになる。
対象となる写真をユーザが選択すると、たとえば写真の隣のポップアップ・ウィンドウを介して、情報フィールドが提示されてもよい。この情報フィールドは、通常は写真に関連付けられた、単純な識別ファイル名を超えるコンテンツを含む。拡張画像システムによって有効化された写真は、この写真についての詳細情報を提供するメタデータの深さを有することになる。たとえば、写真の日付が表示されるが、このような日付は、通常は他のシステムでの写真に関連付けられることになる、アップロード、デジタル化、又は最終版の日付ではない。むしろ、このような日付は、このような写真が撮影された日付を実際に反映するメタデータの一部分である。これにより、ユーザは、このシステムにおいて写真を正確に検索できるようになる。一実施形態では、ユーザは、このようなパラメータを用いて検索することによって、データベース内の写真を閲覧してもよい。
一実施形態では、ユーザはまた、ズームインなどの写真閲覧機能を実行して、選択された写真をより良好に閲覧してもよい。ユーザにはまた、自分が知っている任意の情報で写真に注釈を付ける役に立つように、ログインする選択肢が与えられることになる。
たとえば、ユーザは、ログインして、注釈メタデータ、たとえば写真の場所を、たとえば「大聖堂の芝生」に修正してもよい。したがって、「大聖堂の芝生」で発生したイベントを検索する別のユーザは、データベースを検索することによって、この写真を特定することができるようになる。写真をアップロードする人物は、その写真を「大聖堂の芝生」に関連付けなくてもよいので、このシステムは、そのような情報を画像に関連付けることができるように、注釈を用いて写真を関連付けるための機能を提供する。さらに、ユーザは、写真の領域を強調表示して、さらなる情報を提供するように選択してもよい。一実施形態は、可能な限り多くの情報を写真内の様々な物体に関連付け、したがって、様々な物体に応じて、各画像間で情報のネットワークを接続することができる。さらに、ユーザは、他のユーザによって注釈が付けられた写真内の領域を閲覧するように選択してもよい。たとえば、熱気球が領域によって強調表示される場合、ユーザは、それを閲覧するように選択してもよい。
この領域、たとえば熱気球を選択すると、新規の情報フィールドが生成される。この新規の情報フィールドは、選択された熱気球についての追加情報を含む。拡張画像システムは、タグ付けする人だけに写真の注釈を制限するものではない。むしろ、このシステムは、写真の領域内のありとあらゆるものについての詳細情報を提供するように設計されており、したがって、ユーザは、情報フィールド内の注釈付きのコンテンツに目を通すことによって、他の写真又は情報を見つけてもよい。たとえば、熱気球に関する情報は、それだけには限定されないが、検索における所有者の名前、飛行計画、乗客の番号又は識別情報、パイロットの識別情報、ライセンス情報、製造者、及び年齢を含んでもよい。このすべての情報は、多くの様々なユーザに知られていてもよく、このシステムは、ユーザのコミュニティを利用して、選択された物体についての正確な情報を提供することになる。これにより、選択された物体に正確に注釈付けするためのピアレビュー済みコンテンツの供給システムが実現する。さらに、注釈付きの熱気球は、モデルや製造元などの詳細に至るまで、この特定の熱気球を含んでもよい他の写真にリンクされることになり、ユーザは、「どこか他の所で見つける」のリンク又は同様のインターフェース要素にアクセスすることによって、そのような熱気球を含む他の写真を見つけてもよい。
写真の複数の領域を識別し、それに注釈を付けることができる。たとえば、建物は領域によって識別されてもよく、表示された情報フィールドは、新規に選択された領域を反映するように変更される。選択された領域には様々なパラメータが関連付けられてもよく、このパラメータは情報フィールドに表示されることになる。このようなパラメータは、それだけには限定されないが、構造物の名前、建設データ、可能な場合は取り壊しの日付、居住者リスト、及び居住者アドバイザのリストを含んでもよい。このような領域に利用可能なこのレベルの詳細により、既存の他の画像システムでは単に利用できない豊富な情報を画像に埋め込むことができるようになる。熱気球の場合と同様に、強調表示された建物は、同じパラメータを含む他の写真に関係付けることができ、ユーザは、関係する写真をブラウズすることによって、そうした写真に移動して見てもよい。たとえば、同じ区域でのイベント中に撮影された別の写真を選択してもよく、情報フィールドが表示されて、写真を詳細に識別する。写真に関する全般的情報が提供される。選択された写真は、同じイベント中に同時に撮影されたものなので、一実施形態では、情報フィールドは、全体としての写真に関する同じ基本情報を表示する。
さらに、人物は、この人物の周りに輪郭を描かれた領域を有することによって識別されてもよい。この領域は、人物を識別し、情報フィールドは、システムのユーザによって提供される、この個人についての詳細情報を示すことになる。この人物は別のユーザによって識別されるので、このようなコンテンツが、他のユーザによって提供され、現在のユーザにとって利用可能である限り、この写真を閲覧するユーザは、写真についてのさらに詳細な情報を閲覧するように選択してもよい。
各情報フィールドに一覧表示されたあらゆるパラメータは、関連するページ、たとえば、ビデオ、画像、又はテキスト・データなど、関連するデータに対するサーバへのリンク又は呼出しにハイパーリンクを張られてもよいことに留意することが重要である。このように、情報フィールドは、単なる情報の受動的な表示ではない。むしろ、情報フィールドは、各パラメータに関連付けられたコンテンツについて、さらに多くを学ぶ方式をユーザに提供する。この場合、ユーザは、タグ付けされた人物の名前をクリックして、その人物についてさらに詳しく調べるように選択してもよい。選択された人物について、ある人物がさらに詳しく調べるように選択する場合、このユーザは、写真内で識別された人物専用のページに誘導されてもよい。
様々な実施形態を実装することに関連して、様々な装置を使用してもよいことが理解されよう。コンピュータ1810の形で、例示的なコンピューティング・システムが図18に示してあり、このコンピュータは、ネットワーク化された環境で使用されて遠隔装置1870と通信してもよく、これを使用して、本明細書に記載されてきた各機能の多くを実装してもよい。例示的なコンピュータ1810の構成要素は、それだけには限定されないが、処理ユニット1820、システム・メモリ1830、及びこのシステム・メモリ1830を含む様々なシステム構成要素を処理ユニット1820に結合するシステム・バス1822を含む。コンピュータ1810は、様々なコンピュータ読取り可能な媒体を含んでもよく、又はそれにアクセスしてもよい。システム・メモリ1830には、リードオンリ・メモリ(ROM)及び/又はランダム・アクセス・メモリ(RAM)など、揮発性及び/又は不揮発性のメモリの形でのコンピュータ読取り可能な記憶媒体が含まれ得る。一例として、また限定することなく、システム・メモリ1830はまた、オペレーティング・システム、画像管理ソフトウェアなどのアプリケーション・プログラム、他のプログラム・モジュール、及びプログラム・データを含んでもよい。
ユーザは、入力インターフェース1840を介してコンピュータ1810とインターフェースする(たとえば、コマンド及び情報を入力する)ことができる。モニタ又は他のタイプの装置はまた、出力インターフェース1850などのインターフェースを介して、システム・バス1822に接続することができる。さらに、コンピュータはまた、たとえば、物理的に統合された、又はネットワーク・インターフェース1860を介して接続された、他の周辺の入力装置又は出力装置を含んでもよい。コンピュータ1810は、コンピュータ又はデータベースを含むが、それだけには限定されない、1つ又は複数の他の遠隔装置1870への論理接続を使用して、ネットワーク化された、又は分散された環境において動作してもよい。この論理接続には、ローカル・エリア・ネットワーク(LAN)又は広域ネットワーク(WAN)などのネットワークが含まれ得るが、他のネットワーク/バスも含まれ得る。
例示的な実施形態による、方法、機器(システム)、及びコンピュータ・プログラム製品(実行可能コードを記憶する持続的な媒体)の説明図及び/又はブロック図を参照して、各態様が本明細書に記載されている。説明図及び/又はブロック図の各要素、並びにその組合せは、コンピュータ・プログラム命令によって実施できることが理解されよう。こうしたコンピュータ・プログラム命令は、コンピュータ、又は他のプログラム可能なデータ処理機器のプロセッサに送られてマシンを生成し、その結果、コンピュータ又は他のプログラム可能なデータ処理機器のプロセッサを用いて実行される命令は、流れ図及び/又は1つ若しくは複数のブロック図のブロックで指定された機能/動作を実施するための手段を生成する。
当業者には理解されるように、各実施形態は、システム、方法、又はコンピュータ・プログラム製品として実装してもよい。したがって、各実施形態は、もっぱらハードウェアの実施形態、もっぱらソフトウェアの実施形態(ファームウェア、常駐ソフトウェア、マイクロコードなどを含む)、又は、本明細書ではすべて全体として「回路」、「モジュール」、若しくは「システム」と呼んでもよい、ソフトウェアとハードウェアの態様を組み合わせる実施形態の形をとってもよい。さらに、各態様は、コンピュータ読取り可能なプログラム・コードが実装された、1つ又は複数のコンピュータ・プログラム読取り可能な媒体に実装されたコンピュータ・プログラム製品の形をとってもよい。
1つ又は複数のコンピュータ読取り可能な媒体の任意の組合せを利用してもよい。コンピュータ読取り可能な媒体は、持続的なコンピュータ読取り可能な記憶媒体、たとえば、それだけには限定されないが、電子、磁気、光学、電磁、赤外線、若しくは半導体のシステム、機器、若しくは装置、又はそれらの任意の適切な組合せでもよい。持続的なコンピュータ読取り可能な記憶媒体のさらに具体的な例(限定的なリスト)には、1つ又は複数のワイヤを有する電気接続部、ポータブル・コンピュータ・ディスケット、ハードディスク、ランダム・アクセス・メモリ(RAM)、リードオンリ・メモリ(ROM)、消去可能なプログラマブル・リードオンリ・メモリ(EPROM又はフラッシュ・メモリ)、揮発性メモリ、不揮発性ストレージ、又はこれらの任意の適切な組合せが含まれる。
様々な実施形態向けの動作を実行するためのコンピュータ・プログラム・コードは、1つ又は複数のプログラミング言語の任意の組合せで書いてもよく、そうした言語には、JAVA、Smalltalk、C++などのオブジェクト指向のプログラミング言語、及び、「C」プログラミング言語又は同様のプログラミング言語など、従来の手続き型プログラミング言語が含まれる。プログラム・コードは、もっぱら単一のコンピュータ(装置)上で実行してもよく、部分的にはスタンドアロンのソフトウェア・パッケージとして単一のコンピュータ上で実行してもよく、部分的には単一のコンピュータ上、又部分的には遠隔コンピュータ上で実行してもよく、又はもっぱら遠隔コンピュータ若しくは遠隔サーバ上で実行してもよい。後者の状況では、遠隔コンピュータは、ローカル・エリア・ネットワーク(LAN)若しくは広域ネットワーク(WAN)を含め、任意のタイプのネットワークを介して別のコンピュータに接続してもよく、又は、たとえばインターネット・サービス・プロバイダを使用してインターネットを介して接続してもよい。
添付図面を参照して、図示された例示的な実施形態を本明細書に説明してきたが、各実施形態は、そうした厳密で例示的な実施形態に限定されるものではなく、本開示の範囲又は精神から逸脱することなく、他の様々な変更形態及び修正形態が、そこで当業者によって影響を受けてもよいことを理解されたい。

Claims (46)

  1. 装置からユーザ識別表示を受信することと、
    ストレージ装置に、画像の1つ又は複数の領域を特定する第1の自由形式のユーザ入力によって生成される第1のデータ、及び前記画像の前記1つ又は複数の領域を記述する第2の自由形式のユーザ入力を含む第2のデータを記憶することと、
    それぞれの第1のデータが、対応する第2のデータに関連して記憶される、前記対応する第2のデータを含むことと、
    プロセッサを使用して、前記ユーザ識別表示に少なくとも部分的に基づいて、前記第1のデータ及び前記第2のデータの少なくとも一部分を含むデータセットを選択することと、
    前記選択されたデータセットを表示するために提供することと
    を含む、方法。
  2. 前記提供することが、協働セッションにおいて表示するための前記データセットを、複数の遠隔装置に提供することを含む、請求項1に記載の方法。
  3. 前記第1の自由形式のユーザ入力が、前記画像の一群の画素を指定し、
    前記第2の自由形式のユーザ入力が、英数字の入力、オーディオ入力、及び画像入力のうちの1つ又は複数を含む、請求項1に記載の方法。
  4. 前記第1のデータ、前記第2のデータ、及び前記画像のうちの1つ又は複数を、前記装置から受信することを含む、請求項1に記載の方法。
  5. 前記提供することが、スクリプトに従って表示するための前記データセットを提供することを含む、請求項1に記載の方法。
  6. 前記スクリプトがトレーニング・スクリプトを含み、
    前記第2のデータが、前記画像の前記1つ又は複数の領域に表示される物体に関係する技術データを含む、請求項5に記載の方法。
  7. 前記ユーザ識別表示が、ユーザ名、役割、及びドメインからなる群から選択される、請求項1に記載の方法。
  8. 第2のユーザ識別表示を受信することと、
    前記第2のユーザ識別表示に基づいて第2のデータセットを選択することと
    を含み、
    前記第2のデータセットが、第1のデータセットと異なる、請求項1に記載の方法。
  9. 検索クエリを受信することと、
    プロセッサを使用して、少なくとも前記第2のデータに基づいて前記画像を識別することと、
    前記画像を含むクエリ結果を提供することと
    を含む、請求項1に記載の方法。
  10. 前記第2のデータに含まれる1つ又は複数の用語と、1つ又は複数の他の用語とを関連付けることを含み、
    前記識別することが、前記1つ又は複数の他の用語を使用して、前記クエリ結果を提供することを含む、請求項9に記載の方法。
  11. シーンを示すデータを受信することを含み、
    前記選択することが、前記シーンを示す前記データに少なくとも部分的に基づき、
    前記提供することが、前記選択されたデータセットを提供して、拡張現実表示内に含めることを含む、請求項1に記載の方法。
  12. 前記第1のデータを得ることに関連して、前記第2のデータについての1つ又は複数のデータベース属性を作成することを含む、請求項1に記載の方法。
  13. 前記作成することが、新規に作成されたタイプの第2のデータについて新規の属性を含むように、データベースを動的に拡張することを含む、請求項12に記載の方法。
  14. 前記ユーザ識別表示を前記受信することが、前記ユーザ識別表示を遠隔ユーザ装置から受信することを含む、請求項1に記載の方法。
  15. 前記遠隔ユーザ装置から、前記第1のデータ及び前記第2のデータを受信することを含む、請求項14に記載の方法。
  16. 前記画像を前記遠隔ユーザ装置から受信することを含む、請求項14に記載の方法。
  17. ユーザ装置のカメラでキャプチャされた画像を得ることと、
    画像の1つ又は複数の領域を特定する第1の自由形式のユーザ入力によって生成される第1のデータ、及び前記画像の前記1つ又は複数の領域を記述する第2の自由形式のユーザ入力を、互いに関連して記憶することと、
    前記画像の前記1つ又は複数の領域に関係する一連の命令を含む追加データを記憶することと、
    ユーザ識別表示と、前記第1のデータ、前記第2の自由形式のユーザ入力、前記画像、及び前記追加データの少なくとも一部分を含むデータセットとの間の関連付けを記憶することと、
    前記関連付けを使用して、その後、要求に応答して、前記ユーザ識別表示を含む前記データセットを選択して、前記画像を閲覧することと
    を含む、方法。
  18. 前記ユーザ識別表示が、ユーザ名、役割、及びドメインからなる群から選択される、請求項17に記載の方法。
  19. 前記関連付けが、複数のユーザ識別表示と複数のデータセットとの間の複数の関連付けを含む、請求項17に記載の方法。
  20. プロセッサと、
    前記プロセッサに動作可能に結合されたストレージ装置と、
    前記ストレージ装置に記憶され、前記プロセッサから実行可能なコードであって、
    画像の1つ又は複数の領域を特定する第1の自由形式のユーザ入力によって生成される第1のデータ、及び前記画像の前記1つ又は複数の領域を記述する第2の自由形式のユーザ入力を、互いに関連して記憶するコード、
    前記画像の前記1つ又は複数の領域に関係する一連の命令を含む追加データを記憶するコード、
    ユーザ識別表示と、前記第1のデータ、前記第2の自由形式のユーザ入力、前記画像、及び前記追加データの少なくとも一部分を含むデータセットとの間の関連付けを記憶するコード、及び
    前記関連付けを使用して、その後、要求に応答して前記データセットを選択して、前記ユーザ識別表示を含む前記画像を閲覧するコードを含むコードと
    を含む、システム。
  21. 装置において、カメラを使用してキャプチャされた画像を受信することと、
    前記装置に関連付けられたプロセッサを使用して、前記画像に表示された1つ又は複数の物体を識別することと、
    前記装置に関連付けられたプロセッサを使用して、前記識別することの結果による識別表示に基づいてデータセットを選択することと、
    前記データセットが、画像の1つ又は複数の領域を特定する第1のデータ、及び前記画像の前記1つ又は複数の領域についての1つ又は複数の記述を含む第2のデータを含むことと、
    前記装置を使用して、前記データセットを別の装置に提供することと
    を含む、方法。
  22. 前記第1のデータが、前記1つ又は複数の領域を特定する第1の自由形式のユーザ入力によって生成されるデータを含む、請求項21に記載の方法。
  23. 前記第2のデータが、前記画像の前記1つ又は複数の領域の前記記述を形成する第2の自由形式のユーザ入力を含む、請求項22に記載の方法。
  24. 前記別の装置が、ヘッドマウント・ディスプレイを備える、請求項21に記載の方法。
  25. 前記識別及び提供するステップが、実質的にリアルタイムに実行される、請求項21に記載の方法。
  26. 前記提供することが、拡張現実ディスプレイに出力するようにフォーマットされた前記データセットを提供することを含む、請求項21に記載の方法。
  27. 前記データセットが、前記画像内の物体及び領域のうちの1つ又は複数を特定するのに使用される物体識別子及び領域識別子のうちの1つ又は複数を含む、請求項26に記載の方法。
  28. 前記データセットが、前記1つ又は複数の記述を有する前記物体識別子及び前記領域識別子のうちの1つ又は複数を関連付けるデータを含む、請求項27に記載の方法。
  29. ディスプレイ装置に、画像をキャプチャするための命令を含む表示データを提供することと、
    前記ディスプレイ装置に、記述を入力するための命令を含む表示データを提供することと、
    カメラから画像を受信することと、
    入力装置から入力記述を受信することと、
    プロセッサを使用して、前記画像と前記入力記述を関連付けることと、
    ストレージ装置において、監査プログラムに関連付けて前記画像及び前記入力記述を記憶することと
    を含む、方法。
  30. 画像領域の選択を含む検索クエリを受信することと、
    プロセッサを使用して、前記検索クエリで受信された前記画像領域の前記選択に少なくとも基づいて別の画像を識別することと、
    前記別の画像を含むクエリ結果を提供することと
    を含む、方法。
  31. 前記識別することが、前記画像領域に関連付けられたテキスト・データを識別することと、前記テキスト・データを使用して前記別の画像を識別することとを含む、請求項30に記載の方法。
  32. ストレージ装置において、画像の1つ又は複数の領域を特定する第1のユーザ入力によって生成される第1のデータ、及び前記画像の前記1つ又は複数の領域を記述する第2のユーザ入力を含む第2のデータを記憶することと、
    それぞれの第1のデータが、対応する第2のデータに関連して記憶される、前記対応する第2のデータを含むことと、
    プロセッサを使用して、前記第1のデータ及び前記第2のデータの少なくとも一部分を使用する第2の画像を識別することであって、前記第2の画像が、前記第1のデータ及び前記第2のデータそれぞれと閾値類似性を共有する1つ又は複数の領域、及び1つ又は複数の対応する記述に関連付けられることと、
    前記第2の画像を提供することと
    を含む、方法。
  33. ユーザ装置に、ユーザ・インターフェースを提供して、前記第2のデータを供給することを含む、請求項32に記載の方法。
  34. 前記ユーザ・インターフェースが、複数の所定のコンテンツ識別子カテゴリを表示する、請求項33に記載の方法。
  35. 前記複数の所定のコンテンツ識別子カテゴリが、前記画像のコンテンツを分析することに基づいて表示するように選択される、請求項34に記載の方法。
  36. 前記分析することが、物体検出及び物体識別表示のうちの1つ又は複数を含む、請求項35に記載の方法。
  37. 前記ユーザ・インターフェースが、前記画像の領域に関連付けられた複数の表示を示す、請求項34に記載の方法。
  38. 前記複数の表示のそれぞれが、対応する画像領域にそれぞれ関連付けられる、請求項37に記載の方法。
  39. それぞれの画像領域が、前記ユーザ・インターフェースのコンテンツ・カテゴリ識別子に関連付けられる、請求項38に記載の方法。
  40. 前記複数の所定のコンテンツ識別子カテゴリが、1つ又は複数のデータ・エントリ・フィールドを含む、請求項34に記載の方法。
  41. ユーザ装置に、表示用の画像データを提供することと、
    前記ユーザ装置に、前記画像データの表示に近いユーザ・インターフェースを提供することと、
    前記ユーザ・インターフェースが、
    画像の1つ又は複数の領域を特定する第1のユーザ入力によって生成される第1のデータ、及び
    前記画像の前記1つ又は複数の領域を記述する第2のユーザ入力を含む第2のデータを受信するように構成されることと、
    それぞれの第1のデータが、対応する第2のデータに関連して記憶される、前記対応する第2のデータを含むことと、
    前記第1のデータ及び前記第2のデータと関連して前記画像データを記憶することと
    を含む、方法。
  42. 装置画面上に、物体を含む画像を表示することと、
    入力装置から、前記物体内の原点を示すデータを受信することと、
    プロセッサを使用して、前記原点に近い画素の1つ又は複数の画素値を分析することと、
    プロセッサを使用して、前記分析することに基づいて、前記物体の第1の境界を識別することと、
    前記装置画面上に、前記第1の境界を表示することと、
    前記第1の境界を拡張すべきであると示すデータを、前記入力装置から受信することと、
    その後、前記第1の境界の外側の画素値を分析することによって、第2の境界を分析及び識別することと、
    前記装置画面上に、前記第2の境界を表示することと
    を含む、方法。
  43. 前記入力装置から、前記第2の境界が受け入れ可能であると示すデータを受信することを含む、請求項42に記載の方法。
  44. 前記第2の境界と物体識別表示とを関連付けることを含む、請求項43に記載の方法。
  45. 前記物体識別表示と記述的メタデータとを関連付けることを含む、請求項44に記載の方法。
  46. 前記記述的メタデータが、前記物体識別表示によって識別された物体を記述する、請求項45に記載の方法。
JP2021538166A 2018-09-10 2019-09-09 領域ベースのメタデータ索引付けを用いる画像管理 Active JP7488821B2 (ja)

Applications Claiming Priority (9)

Application Number Priority Date Filing Date Title
US201862729415P 2018-09-10 2018-09-10
US201862729411P 2018-09-10 2018-09-10
US201862729416P 2018-09-10 2018-09-10
US201862729414P 2018-09-10 2018-09-10
US62/729,416 2018-09-10
US62/729,414 2018-09-10
US62/729,411 2018-09-10
US62/729,415 2018-09-10
PCT/US2019/050179 WO2020055733A1 (en) 2018-09-10 2019-09-09 Image management with region-based metadata indexing

Publications (3)

Publication Number Publication Date
JP2022500802A true JP2022500802A (ja) 2022-01-04
JPWO2020055733A5 JPWO2020055733A5 (ja) 2022-09-15
JP7488821B2 JP7488821B2 (ja) 2024-05-22

Family

ID=69776896

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2021538166A Active JP7488821B2 (ja) 2018-09-10 2019-09-09 領域ベースのメタデータ索引付けを用いる画像管理

Country Status (8)

Country Link
US (1) US20220050867A1 (ja)
EP (1) EP3850538A4 (ja)
JP (1) JP7488821B2 (ja)
KR (1) KR20210056404A (ja)
AU (1) AU2019338200A1 (ja)
CA (1) CA3112703A1 (ja)
SG (1) SG11202102261PA (ja)
WO (1) WO2020055733A1 (ja)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9864925B2 (en) * 2016-02-15 2018-01-09 Ebay Inc. Digital image presentation
US12008034B2 (en) 2016-02-15 2024-06-11 Ebay Inc. Digital image presentation
US11574246B2 (en) * 2020-01-21 2023-02-07 Microsoft Technology Licensing, Llc Updating training examples for artificial intelligence

Family Cites Families (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20050080818A1 (en) * 2003-10-10 2005-04-14 Kindberg Timothy P. Active images
US7970763B2 (en) * 2006-02-21 2011-06-28 Microsoft Corporation Searching and indexing of photos based on ink annotations
JP2009070201A (ja) 2007-09-14 2009-04-02 Fujifilm Corp 読影レポート作成システム及び読影レポート作成装置並びに読影レポート作成方法
US20110182493A1 (en) * 2010-01-25 2011-07-28 Martin Huber Method and a system for image annotation
US9122321B2 (en) * 2012-05-04 2015-09-01 Microsoft Technology Licensing, Llc Collaboration environment using see through displays
JP2014123260A (ja) 2012-12-21 2014-07-03 Hitachi High-Tech Solutions Corp システム監視画面の画像作成装置
JP5415642B2 (ja) 2013-06-07 2014-02-12 株式会社キーエンス 波形観測装置
US9607015B2 (en) * 2013-12-20 2017-03-28 Qualcomm Incorporated Systems, methods, and apparatus for encoding object formations
US10719123B2 (en) * 2014-07-15 2020-07-21 Nant Holdings Ip, Llc Multiparty object recognition
JP6707316B2 (ja) 2014-08-29 2020-06-10 カシオ計算機株式会社 文書表示装置及びプログラム
JP6385213B2 (ja) 2014-09-11 2018-09-05 能美防災株式会社 支援システム
US10606941B2 (en) * 2015-08-10 2020-03-31 Open Text Holdings, Inc. Annotating documents on a mobile device
US9953242B1 (en) * 2015-12-21 2018-04-24 Amazon Technologies, Inc. Identifying items in images using regions-of-interest
US10635746B2 (en) * 2016-04-29 2020-04-28 Microsoft Technology Licensing, Llc Web-based embeddable collaborative workspace
CN110036356B (zh) * 2017-02-22 2020-06-26 腾讯科技(深圳)有限公司 Vr系统中的图像处理
US10042935B1 (en) * 2017-04-27 2018-08-07 Canva Pty Ltd. Systems and methods of matching style attributes
US11080838B1 (en) * 2018-08-13 2021-08-03 State Farm Mutual Automobile Insurance Company Systems and methods for image labeling using artificial intelligence
US11355242B2 (en) * 2019-08-12 2022-06-07 International Business Machines Corporation Medical treatment management

Also Published As

Publication number Publication date
CA3112703A1 (en) 2020-03-19
EP3850538A4 (en) 2022-06-08
AU2019338200A1 (en) 2021-04-01
JP7488821B2 (ja) 2024-05-22
KR20210056404A (ko) 2021-05-18
EP3850538A1 (en) 2021-07-21
SG11202102261PA (en) 2021-04-29
US20220050867A1 (en) 2022-02-17
WO2020055733A1 (en) 2020-03-19

Similar Documents

Publication Publication Date Title
US11768882B2 (en) Method and apparatus for managing digital files
US10515114B2 (en) Facial recognition with social network aiding
JP6706647B2 (ja) 画像に表されたオブジェクトの認識及び照合のための方法及び装置
JP5869054B2 (ja) デジタル画像集合内に自動顔認識を組み込む方法および装置
JP5801395B2 (ja) シャッタクリックを介する自動的メディア共有
WO2018072071A1 (zh) 知识图谱构建系统及方法
JP7488821B2 (ja) 領域ベースのメタデータ索引付けを用いる画像管理
US10885095B2 (en) Personalized criteria-based media organization
TW202318229A (zh) 透過社群媒體平台進行產品搜尋
KR20180093293A (ko) 스마트 폰을 이용한 가상현실 스마트 영상 서비스 기술

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20220907

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20220907

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20231030

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20231116

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20240206

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20240311

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20240408

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20240510

R150 Certificate of patent or registration of utility model

Ref document number: 7488821

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150