JP2011520208A - 人気ランドマークの自動的発見 - Google Patents

人気ランドマークの自動的発見 Download PDF

Info

Publication number
JP2011520208A
JP2011520208A JP2011509474A JP2011509474A JP2011520208A JP 2011520208 A JP2011520208 A JP 2011520208A JP 2011509474 A JP2011509474 A JP 2011509474A JP 2011509474 A JP2011509474 A JP 2011509474A JP 2011520208 A JP2011520208 A JP 2011520208A
Authority
JP
Japan
Prior art keywords
image
landmark
computer
images
visual
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2011509474A
Other languages
English (en)
Other versions
JP2011520208A5 (ja
JP5476369B2 (ja
Inventor
フェルナンド エー. ブルーシェル,
ウルリッヒ ブッドマイヤー,
ハルトヴィーク アダム,
ハルトムト ネヴェン,
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Google LLC
Original Assignee
Google LLC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Google LLC filed Critical Google LLC
Publication of JP2011520208A publication Critical patent/JP2011520208A/ja
Publication of JP2011520208A5 publication Critical patent/JP2011520208A5/ja
Application granted granted Critical
Publication of JP5476369B2 publication Critical patent/JP5476369B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/58Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/583Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/29Geographical information databases
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/51Indexing; Data structures therefor; Storage structures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/58Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/58Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/583Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
    • G06F16/5838Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using colour
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/58Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/583Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
    • G06F16/5846Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using extracted text
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/58Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/5866Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using information manually generated, e.g. tags, keywords, comments, manually generated location and time information
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/58Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/587Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using geographical or spatial information, e.g. location
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/048Interaction techniques based on graphical user interfaces [GUI]
    • G06F3/0484Interaction techniques based on graphical user interfaces [GUI] for the control of specific functions or operations, e.g. selecting or manipulating an object, an image or a displayed text element, setting a parameter value or selecting a range
    • G06F3/04842Selection of displayed objects or displayed text elements
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F7/00Methods or arrangements for processing data by operating upon the order or content of the data handled
    • G06F7/06Arrangements for sorting, selecting, merging, or comparing data on individual record carriers
    • G06F7/08Sorting, i.e. grouping record carriers in numerical or other ordered sequence according to the classification of at least some of the information they carry
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/97Determining parameters from multiple pictures

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Library & Information Science (AREA)
  • Remote Sensing (AREA)
  • Software Systems (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Human Computer Interaction (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Processing Or Creating Images (AREA)

Abstract

一実施形態では、本発明は、地理的近さに従って、地理的タグ付画像を地理的にクラスタ化し、1つ以上の地理的クラスタを生成することと、画像類似性に従って、1つ以上の地理的クラスタを視覚的にクラスタ化し、1つ以上の視覚的クラスタを生成することとを含む、ランドマークの画像のデータベースを追加し、更新するための方法である。別の実施形態では、本発明は、地理的タグ付画像のデータベースと、ランドマークデータベースと、地理的クラスタ化モジュールと、視覚的クラスタ化モジュールとを含む、デジタル画像からランドマークを識別するためのシステムである。他の実施形態では、本発明は、ランドマークの画像を読み出すためのユーザクエリを促進する方法、または新しいデジタル画像にテキストラベルを自動的にタグ付けする方法であり得る。

Description

本発明は、概して、デジタル画像コレクションに関し、より具体的には、大規模デジタル画像コレクション内の人気のあるランドマークの識別に関する。
デジタル画像の使用の増加、デジタル記憶媒体の容量および可用性の増大、およびインターネット等のデジタル伝送媒体によって供給される相互接続性に伴って、従来よりも大規模なコーパスのデジタル画像が、益々多くの人々にアクセス可能となっている。世界中の種々の場所から、様々な関心を有する人々が、種々の被写体の写真を撮影し、それらの写真は、例えば、インターネット上で利用可能となり得る。例えば、世界中の種々のランドマークおよび観光地のデジタル写真は、異なる写真撮影技術レベルを伴う人によって撮影され、ウェブ上に掲載され得る。写真は、異なる視点からの同一ランドマークを示し、同一または異なる距離から撮影され得る。
これらの大規模なコーパスのデジタル画像内に含まれる情報を利用するために、コーパスが整理される必要がある。例えば、Google PhotosまたはPicasa等のデジタル画像のウェブサイトでは、高レベルメニューから開始し、写真が利用可能な被写体の詳細リストへと掘り下げ得る。代替として、デジタル写真を有する1つ以上のサイトを検索可能であり得る。いくつかの観光情報ウェブサイトは、例えば、人気観光地の公開リストと関連付けられたランドマークの画像をダウンロードしている。
しかしながら、これらの大規模コレクションから、最も人気のある観光目的地等の情報を自動的に抽出可能な周知のシステムは存在しない。多数の新しい写真が、これらのデジタル画像コレクションに追加されるにつれて、ユーザが、それらのデジタル画像コレクションの有用性を増加させる完全かつ一貫した方法によって、写真を手動でラベル付けすることは容易ではなくなる場合がある。したがって、大規模デジタル画像コレクション内の人気ランドマークを自動的に識別し、ラベル付け可能なシステムおよび方法が、必要とされる。
一実施形態では、本発明は、地理的近さに従って、地理的タグ付画像を地理的にクラスタ化し、1つ以上の地理的クラスタを生成することと、画像類似性に従って、1つ以上の地理的クラスタを視覚的にクラスタ化し、1つ以上の視覚的クラスタを生成することとを含む、ランドマークの画像のデータベースを追加し、更新するための方法である。
別の実施形態では、本発明は、地理的タグ付画像のデータベースと、ランドマークデータベースと、地理的タグ付画像のデータベースと通信する地理的クラスタ化モジュールであって、地理的タグ付画像は、1つ以上の地理的クラスタにグループ化される、地理的クラスタ化モジュールと、該地理的クラスタ化モジュールと通信する視覚的クラスタ化モジュールであって、1つ以上の地理的クラスタは、1つ以上の視覚的クラスタにグループ化され、視覚的クラスタデータは、ランドマークデータベースに格納される、視覚的クラスタ化モジュールとを含む、デジタル画像からランドマークを識別するためのシステムである。
さらなる実施形態では、本発明は、ユーザクエリを受信する段階と、ユーザクエリ内の1つ以上のトリガワードを識別する段階と、1つ以上のトリガワードに対応する1つ以上の対応タグをランドマークデータベースから選択する段階と、ユーザクエリを1つ以上の対応タグで補足する段階と、補足されたユーザクエリを生成する段階とを含む、ランドマークの画像を読み出すためのユーザクエリを促進する方法である。
さらに別の実施形態では、本発明は、新しいデジタル画像とランドマーク画像データベース内の画像とを比較する段階であって、ランドマーク画像データベースは、1つ以上のランドマークの画像の視覚的クラスタを含む、段階と、視覚的クラスタのうちの少なくとも1つに基づいて、新しいデジタル画像に少なくとも1つのタグをタグ付けする段階とを含む、新しいデジタル画像に自動的にタグを付ける方法である。
本発明の実施形態を参照して、その実施例が、付随の図面に例証され得る。これらの図は、例証であって、制限を意図するものではない。本発明は、概して、これらの実施形態に照らして説明されるが、本発明の範囲をこれらの特定の実施形態に制限することを意図するものではないことを理解されたい。
図1は、本発明の実施形態による、ランドマーク画像データベースを追加し、更新するためのシステムである。 図2は、本発明の実施形態を実装する方法の高レベル工程図を示す。 図3は、一実施形態における、図2に示される地理的クラスタ化段階のより詳細な操作を示す、工程図である。 図4は、一実施形態における、図3に示される地理的クラスタ生成段階のより詳細な操作を示す、工程図である。 図5は、一実施形態における、図2に示される視覚的クラスタ化段階のより詳細な操作を示す、工程図である。 図6は、本発明の一実施形態で使用される、グラフィカルユーザインターフェースである。 図7は、本発明の実施形態による、ランドマーク画像データベースを更新する方法である。 図8は、本発明の実施形態による、格納されたランドマーク情報を使用して、ユーザクエリを促進する方法である。 図9は、本発明の実施形態による、ランドマークを含む画像に自動的に注釈を施すための方法である。 図10は、本発明の実施形態による、例示的ユーザインターフェース画面であって、ユーザ指定選択基準によって読み出される、ランドマークおよび対応するクラスタに関する情報を示す。 図11は、本発明の実施形態による、クラスタおよびランドマークを維持する方法の動作を例証する、工程図である。 図12は、本発明の実施形態による、1つの視覚的クラスタに関する詳細を示す、例示的ユーザインターフェース画面である。 図13は、本発明の実施形態による、視覚的クラスタを維持する方法の動作を例証する、工程図である。
本明細書において、特定の用途の例示的な実施形態を参照しながら本発明を説明するが、本発明はそれに限定されないことを理解されたい。当業者は、本明細書における教示を利用して、本発明の範囲内、および本発明が有意に実用的となる追加の分野の範囲内で、追加の修正、用途、および実施形態を認識する。
本発明は、デジタル画像内の物体を自動的に識別および分類するための方法ならびにシステムを含む。例えば、本発明の実施形態は、インターネット上でアクセス可能なデジタル画像コレクションに基づいて、最も人気のある観光ランドマークを識別、分類、および優先化し得る。本発明の方法およびシステムは、最も人気のある観光地のための最新リストおよび画像コレクションの効率的維持を可能にし、観光地の人気度は、ユーザによってインターネット上に掲載されたその場所の画像数によって求めることが可能である。
本発明の実施形態による、人気ランドマーク認識システム100が、図1に示される。処理モジュール101は、地理的クラスタ化モジュール102と、視覚的クラスタ化モジュール103とを含む。また、視覚的クラスタ化モジュール103は、人気度モジュール104を含み得る。モジュール102−104の処理機能は、後述される。地理的クラスタ化モジュール102は、図3−4に関連して説明され、視覚的クラスタ化モジュールは、図5に関連して説明される。モジュール102−104の処理機能は、ソフトウェア、ハードウェア、またはそれらの組み合わせにおいて達成され得る。例えば、モジュール102−104は、ソフトウェアモジュールとして、全体的に実装されてもよく、または地理的クラスタ化モジュール102の機能の一部は、フィールド・プログラマブル・ゲート・アレイ(FPGA)等のハードウェアを使用して実装され得る。処理モジュール101は、本発明の機能を促進する、付加的構成要素およびモジュールを含み得ることが、当業者によって理解されるであろう。例えば、処理モジュール101は、1つ以上のプロセッサと、メモリと、記憶デバイスと、グラフィカルユーザインターフェース130、地理的タグ付画像コーパス110、およびランドマークデータベースシステム120を含む、外部デバイスとインターフェースをとるためのモジュールとを含み得る。
ランドマークデータベースシステム120は、ランドマークデータベース121と、関連付けられたインデックス122とを含み得る。ランドマークデータベースシステム120は、モジュール101と同一処理プラットフォーム上に共同設置され得、または別個に設置され得る。ランドマークデータベース121は、システム100によって認識される、ランドマークのコレクションを含み得る。各ランドマークのためにランドマークデータベース121内に格納された情報は、ランドマークの画像または画像のリストと、画像および特徴テンプレートと、地理的座標、時間、およびユーザ情報を含む画像からのメタデータとを含み得る。また、ランドマークデータベース121は、処理モジュール101内での処理に必要とされる、視覚的クラスタ化および地理的クラスタ化データを含み得る。インデックス122は、例えば、人気度、地理的領域、時間、または着目被写体としての他のユーザ定義基準(それらに限定されない)のうちの1つ以上の順番において、ランドマークデータベース121内にランドマークを配列するインデックスを含み得る。リンク141は、例えば、周辺構成要素相互接続(PCI)バス、IEEE 1394ファイヤワイヤインターフェース、イーサネット(登録商標)インターフェース、またはIEEE 802.11インターフェースを含むが、それらに限定されない、相互接続機構のうちの任意の1つ、またはそれらの組み合わせであり得る。
ユーザインターフェース130によって、ユーザまたは他の外部エンティティは、処理システム101、ランドマークデータベースシステム120、および地理的タグ付画像コーパス110と相互作用可能となる。ユーザインターフェース130は、例えば、PCIバス、IEEE 1394ファイヤワイヤインターフェース、イーサネット(登録商標)インターフェース、またはIEEE 802.11インターフェースを含むが、それらに限定されない、相互接続機構のうちの任意の1つ、またはそれらの組み合わせを使用して、システム100の他のエンティティに接続され得る。グラフィカルユーザインターフェース、ウェブインターフェース、およびアプリケーションプログラミングインターフェースのうちの1つ以上は、ユーザインターフェース130内に含まれ得る。
地理的タグ付画像コーパス110は、1つ以上のネットワークにわたって分散される、1つ以上のデジタルの地理的タグ付画像コーパスを含み得る。また、当業者は、コーパス110は、ネットワーク全体に分散される地理的タグ付画像コレクションにアクセス可能なリンクの収集として実装され得ることを理解するであろう。また、コーパス110は、分散された場所において利用可能な全部または一部の画像のコピーを作成する(例えば、ダウンロードし、ローカル記憶装置内に格納する)ことによって実装され得る。いくつかの実施形態では、地理的タグ付画像コーパスの一部は、処理システム101および/またはランドマークデータベースシステム120と同一処理プラットフォーム上に存在し得る。地理的タグ付画像コーパス110を構成する、地理的タグ付画像の異なるコレクションは、インターネット、イントラネットワーク、または他の形態のインターネットワークを通して相互接続され得る。処理システム101は、地理的タグ付画像コーパスから利用可能となった画像を入力として受け取る。いくつかの実施形態では、分散された画像コレクションからの画像は、コーパス110内に格納される際、または処理モジュール101に入力される前に、GIF等の標準的グラフィックフォーマットに変換され得る。また、実施形態は、コーパス110内に格納される際、または処理モジュール101に入力される前に先立って、解像度の低下または向上等の他の形態の標準化、または、処理が、画像に対して行なわれることを必要とし得る。コーパス110は、例えば、PCIバス、IEEE 1394ファイヤワイヤインターフェース、イーサネット(登録商標)インターフェース、またはIEEE 802.11インターフェースを含むが、それらに限定されない、相互接続機構のうちの1つ、あるいはそれらの組み合わせを使用して、リンク142および143によって、システムの他の構成要素に接続され得る。
図2は、画像コーパス110からの地理的コード付画像を使用して、ランドマーク121のデータベースを生成または更新する本発明の実施形態のプロセス200の工程図である。プロセス200は、地理的クラスタ化段階201と、視覚的クラスタ化段階202の2つの主要処理段階を含む。地理的コード付デジタル画像のコレクション、例えば、種々の観光目的地のデジタル画像の大規模コレクションを仮定すると、地理的クラスタ化段階201は、各写真の地理的場所コードに基づいて、利用可能画像を別個のグループに分割し得る。地理的クラスタ化段階は、各写真内で利用可能な地理的コードを利用して、異なるグループまたは地理的クラスタに画像の比較的迅速な分離を行なう。画像が同一地理的クラスタに属すると考えられるデフォルト半径を含む事前に構成されたパラメータが、利用され得る。次いで、地理的クラスタ化段階201で生成された地理的クラスタは、視覚的クラスタ化段階202に入力される。視覚的クラスタ化段階202では、システムは、類似性に基づいて、同一物体またはランドマークの画像のクラスタ(すなわち、視覚的クラスタ)に下位分割することによって、各地理的クラスタ内の画像の分離を試行する。一般に、写真コレクションの地理的クラスタ化は、少なくとも部分的に、各写真内に既に含まれた地理的場所情報の比較であるため、同じ画像コレクションの視覚的クラスタ化より計算コストが安価であることに留意されたい。対照的に、例えば、視覚的クラスタ化202は、物体認識、特徴ベクトル生成、および画像それぞれ内の各識別可能物体の比較を行なうことと、次いで、異なる画像の特徴ベクトルを比較することとを含み得る。
いくつかの実施形態では、関連付けられた画像および/または関連付けられた画像の参照を含む視覚的クラスタ情報は、ランドマークデータベース121等のデータベース内に格納され得る。ランドマークデータベース121内に格納される画像および/または仮想画像は、人気度を含む構成可能な基準に基づいて格納された視覚的クラスタにアクセスすることを可能にする1つ以上のインデックス122を使用して、アクセス可能であり得る。例えば、格納された視覚的クラスタは人気度モジュール104によって処理され得、人気度モジュール104はインデックス122を更新し、各クラスタに画像を提示した一意のユーザの数の順番にアクセスを可能にする。
いくつかの実施形態では、選択された視覚的クラスタは、ユーザによるレビューを受けてもよく、および/またはコンピュータプログラムによってさらに処理され得る。例えば、随意に、所定の数未満の画像を有する等、指定基準を満たす視覚的クラスタは、ユーザによるレビューを受けてもよい。ユーザは、画像の削除、画像の追加、または画像の別のクラスタへの再割当を含む行為によって、1つ以上の視覚的クラスタを修正し得る。また、ユーザは、新しいタグ情報を指定し得るか、または既存タグ情報を修正し得る。当業者は、ユーザまたはコンピュータプログラムから受信した外部データに従って、視覚的クラスタを処理するステップが、データベースシステム120内に格納された地理的クラスタおよび視覚的クラスタ情報の一貫性を維持するために、システムに付加的機能を行なわせることを必要とし得ることを理解するであろう。
図3は、本発明のいくつかの実施形態において、地理的クラスタ化段階201内に含まれる、地理的クラスタ301の生成と、地理的クラスタ302の検証の2つの処理段階を示す。地理的クラスタ301を生成することは、1つ以上の所定の半径パラメータを使用して、ある画像が、別の画像の地理的半径内にあるかどうかを、両画像に関する地理的場所コードに基づいて決定することを含み得る。地理的クラスタ化アルゴリズムは、物体またはランドマークの場所の代わりに、カメラの場所を実際に示す、地理的場所コード化を考慮することを必要とし得ることに留意された。写真の地理的タグ付けは、GPS対応デジタルカメラ、カメラと別個のGPSデバイスと併せて、整合ソフトウェア、Google Earth等のツールの使用、または写真のエグジフ(EXIF)タグの手動編集を含むいくつかの手段を通して達成され得る。地理的タグ付けの方法は、概して、当技術分野において周知であって、本開示には説明されない。また、デフォルトの地理的クラスタ半径は、ほとんどの着目ランドマークまたは物体にとって適切であり得るが、いくつかのランドマークは、画像の最も効果的グループ化をもたらすために、異なるクラスタ半径パラメータを必要とし得る。段階301では、1つ以上の画像のクラスタは、地理的近さに基づいて生成される。
地理的クラスタ検証段階302では、地理的クラスタ化段階301で生成された地理的クラスタのそれぞれが、選択された基準に基づいて、検証され得る。例えば、本発明の一実施形態では、さらなる処理のために選択される各地理的クラスタが、合理的に、観光ランドマーク、すなわち、人気ランドマークを含むことを確実にすることを目標とし得る。故に、検証基準は、所定の閾値より多くの一意のユーザからの画像を有する地理的クラスタのみ、さらに処理することであり得る。同一ランドマークの画像を提示する少なくとも所定数の一意のユーザを有する等の検証基準は、惹き付ける魅力がほとんどない他の建物、構造物、記念碑、公園、山脈、風景等の画像を除外することが見込まれる。例えば、惹き付ける魅力のない新築の家の写真を掲載することに夢中になっている住宅所有者が、インターネットデジタル画像コレクションサイトの全ユーザによって掲載される任意の人気ランドマークの画像数と比較して相当数となる、その家の画像を掲載する可能性は低い。一実施形態では、閾値は、季節および/または地理的エリア毎に設定され得る。他の実施形態では、閾値は、最初に、一意のユーザの分布に対して、地理的クラスタを分析することによって導出され得る。さらに他の実施形態では、閾値は、各種類のランドマークのために設定され得る。閾値を設定するための手段の上述の説明は、例証にすぎない。当業者は、各用途の焦点に従って地理的クラスタを検証可能である多くの他の手段が存在することを理解するであろう。
図4は、本発明の実施形態における、地理的クラスタ化段階の処理のさらなる詳細301を例証する。各地理的タグ付画像に対して、段階401−405が、繰り返され得る。クラスタに未だ属していない各地理的タグ付画像に対して、画像から各クラスタまでの距離が、段階401で決定される。距離決定は、画像の中心の地理的座標に基づき得る。例えば、一実施形態では、距離は、画像の中心から、クラスタの移動平均画像中心までであってもよく、移動平均は、新しい画像がクラスタに追加される度に更新され、クラスタ内の画像それぞれの中心の平均として計算され得る。段階402では、画像が、既存クラスタと整合するかどうか判定される。判定は、クラスタの中心の地理的座標から所定の半径によって画定されるエリア内にある画像の地理的座標に基づき得る。所定の半径は、例えば、地理的エリア当たりの基準に基づくか、各クラスタ内の画像の中心座標の分析に基づくか、またはランドマークの種類に基づき得る。画像が、既存クラスタに整合されるとみなされる場合、段階403において、そのクラスタに追加される。そうでなければ、新しいクラスタが、段階404で生成される。画像を既存クラスタに追加すること、または新しいクラスタを生成することは、クラスタのための地理的中心座標等のいくつかのクラスタパラメータが、計算される必要があり得る。プロセス301が、地理的タグ付画像の入力集合に対して完了すると、一式の地理的クラスタが、利用可能となるはずである。地理的クラスタと併せて、関連付けられた情報は、地理的タグ付画像コーパス110または処理モジュール101にアクセス可能な別の記憶デバイスの一部として格納され得る。各画像または地理的クラスタと関連付けられた情報は、地理的場所と、画像、画像に割り当てられるテキストタグ(利用可能な場合)、および画像のための地理的場所情報に基づく付加的場所情報(すなわち、国および都市を指定するテキストラベル)を記述する他のメタデータとを含み得る。
図5は、本発明の実施形態における、視覚的クラスタ化段階202の詳細図である。段階201で生成される各地理的クラスタに対して、段階501−505が、繰り返される。視覚的クラスタ化段階202への入力は、段階201において生成される、一式の地理的クラスタである。視覚的クラスタ化段階202からの出力は、入力された地理的クラスタそれぞれのための1つ以上の視覚的クラスタである。各視覚的クラスタは、同一の、例えば、人気観光ランドマークを有する画像を含むはずである。一式の視覚的クラスタは、種々のカメラ角度、カメラ距離、および光条件において、特定のランドマークを描写する、全画像を収集し得る。一式の視覚的クラスタが、全画像を含むか、特定のランドマークを有する画像のみ含むかは、視覚的クラスタ化方法およびパラメータの有効性に応じる。本開示の教示は、一式の視覚的クラスタが、全画像を有するか、特定のランドマークを含む画像のみ有するかにかかわらず適用される。地理的クラスタに対して、段階501は、クラスタ内の画像のインデックスを生成する。インデックスは、元画像または元画像の参照を含む、データ要素、元画像から派生される画像(例えば、元画像の低解像度版)、1つ以上の画像テンプレートおよび特徴ベクトル、ユーザ識別、地理的タグ付け、時間情報、ならびに任意の割り当てられたタグを有するクラスタ内の画像のリストであり得る。段階502では、地理的クラスタ内の各画像は、対応するインデックスに対して整合される。整合プロセス502は、地理的クラスタ内の各画像のために整合画像の参照を生成する。整合プロセス502の後、インデックスは、各画像に対して、地理的クラスタ内のあらゆる他の整合画像への参照を含み得る。段階502における整合ステップは、各画像内の被写体認識を含み、ランドマーク等の着目被写体を識別し、各識別された被写体のための特徴ベクトルを生成し、次いで、特徴ベクトルを比較し、整合情報を取得し得る。比較は、特徴ベクトル内に含まれる特徴に割り当てられた構成可能な数値スコアと、構成可能な数値閾値とに基づいて、整合対として2つの画像を分類可能である。画像内の被写体認識および特徴ベクトル生成の方法は、当技術分野において周知である。例えば、画像内の被写体認識の方法は、David G. Lowe, "Object recognition from local scale−invariant features," International Conference on Computer Vision, Corfu, Greece (September 1999), pp. 1150−1157に記載されている。
段階503では、段階501−502で生成されたインデックスおよび整合に基づいて、整合領域グラフが生成される。整合領域グラフでは、ノードは、画像であって、ノード間のリンクは、画像間の関係を示す。例えば、段階502に従って整合する一対の画像は、それらの間にリンクを有するであろう。整合領域グラフを使用して、段階504では、視覚的クラスタを生成する。要するに、視覚的クラスタは、段階504における付加的処理に基づいて、弱リンクが剪定された後の整合領域グラフ内の接続されたサブツリーである。弱リンクは、画像が、画像または特徴テンプレートに基づいて整合される場合、閾値数未満の整合特徴を伴うリンクであり得る。いくつかの実施形態は、指定集合の特徴に整合しないリンクを弱リンクとみなし得る。クラスタ内の画像間のテキストラベルの一致(利用可能である場合)は、別の基準であり得る。また、クラスタ内の画像数は、画像がほとんどないクラスタを最小限にするように、弱リンクを剪定する際に考慮され得る。当業者は、弱リンクの剪定は、本明細書に記載されるものに加え、種々の基準に基づき得ることを理解するであろう。最後に、視覚的クラスタデータは、段階505において保存される。視覚的クラスタは、ランドマークデータベース121に保存され得る。各視覚的クラスタの画像および被写体情報とともに、クラスタを記述する1つ以上のテキストラベルと、クラスタを具体的に表す1つ以上の画像とを含むが、それらに限定されない他の関連データが、保存され得る。視覚的クラスタを記述するテキストラベルは、例えば、そのクラスタの各成分画像のテキストラベルをマージすることによって生成され得る。視覚的クラスタを具体的に表す1つ以上の画像は、例えば、人気観光ランドマークのインデックス内に表示するために有用であり得る。
本発明の別の実施形態では、生成された視覚的クラスタのユーザ検証が、実装される。図6は、各視覚的クラスタ内の画像をユーザに表示し、ユーザに各クラスタの種々の側面を手動で編集する機能を提供し得るグラフィカルユーザインターフェース601を例証する。例えば、グラフィカルユーザインターフェースは、ランドマークデータベース621内に格納された視覚的クラスタを読み出し、編集された視覚的クラスタを同一データベース621に再び書き込み得る。グラフィカルユーザインターフェース601は、ユーザに新しいテキストラベルを割り当てさせ、および/または現在各クラスタおよび/または画像に割り当てられているテキストラベルを編集させるクラスタラベル付けモジュール602を含み得る。例えば、クラスタラベル付けモジュール602は、その現在のテキストラベルおよびクラスタ内の個々の画像に割り当てられたラベルとともに、各クラスタを表示し、ユーザにクラスタに割り当てられたテキストラベルを修正させ得る。クラスタマージモジュール603は、ユーザにクラスタをマージまたは分割させ得る。そのようなクラスタの手動マージまたは分割は、1つ以上のクラスタ内の画像を閲覧後、ユーザによって所望され得る。クラスタ編集モジュール604は、ユーザに、個々の画像を追加およびクラスタから削除させ得る。モジュール604は、クラスタの対応するランドマークの低画質表示を手動で排除する際、ならびにクラスタに対応するランドマークの1つ以上の新しい画像を手動で追加する際に有用であり得る。上述に加え、本発明の実施形態は、システム100との相互作用において、種々の選択肢をユーザに供与し得る。
図1に戻ると、いくつかの実施形態では、人気度モジュール104は、各視覚的クラスタに対する人気度スコアを計算し、それに従って、視覚的クラスタをランク付けし得る。ランドマークデータベース121にアクセスするために使用される、インデックス122のうちの1つ以上は、人気度モジュールによって計算される人気度のランク付けに基づき得る。クラスタの人気度スコアは、クラスタ内の画像総数、クラスタに画像を提供した一意のユーザ数、画像数、または視覚的クラスタの中心のある所定の半径内にある一意のユーザ識別子を伴う画像のうちの1つ以上に基づき得る。また、人気度スコアが、上記方法とは異なる方法を用いて計算され得ることを理解されたい。
本発明の別の実施形態では、ランドマークデータベースは、漸増的に拡張する。図7は、ランドマークデータベースを漸増的に拡張するために使用され得る例示的プロセスである。新しく利用可能な地理的タグ付画像は、段階701において、ローカル記憶装置にダウンロードされる、または他の手段によって、処理モジュール101に対して利用可能にされる。段階702では、地理的クラスタ化は、新しい地理的タグ付画像を含む全利用可能地理的タグ付画像にわたって実装される。地理的クラスタ化は、図3−4に関して説明された。段階703では、段階702から生じる地理的クラスタが、視覚的クラスタ化を受ける。視覚的クラスタ化は、図5に関して説明された。視覚的クラスタ化が完了すると、段階704では、いくつかの実施形態は、ランドマークデータベース内に以前に格納された視覚的クラスタ化内の以前のクラスタ化に、ユーザによってもたらされた変更の一部または全部を拡充し得る。例えば、ユーザ割当または修正タグが、新しいクラスタ化に拡充され得る。随意に、段階705では、新しい視覚的クラスタ化は、ユーザ検証および手動編集を受け得る。いくつかの種類のユーザ相互作用は、図6に関して説明された。
ランドマークデータベース121を有するシステム100は、多くの用途を可能にし得る。例えば、ランドマークデータベース121を使用して、クエリにより焦点を当てるために、ユーザクエリを補足するように用いられ得る。図8は、一実施形態における、ユーザクエリを補足するために使用され得るプロセスを例証する。受信されたユーザクエリは、段階802において、一式の所定のトリガワードに対して構文解析され得る。例えば、「Paris(パリ)」等の都市名を使用して、都市内のランドマークまたはその逆をトリガし得る。クエリ内のトリガワードを識別すると、ランドマークデータベースは、段階803において、それらのトリガワードを検索し、関連付けられたタグワードを識別し得る。上述の実施例に従って、トリガワード「Paris」は、「Eiffel Tower(エッフェル塔)」を発見するための検索をもたらし得る。次いで、段階804において、識別される関連付けられたタグワードを使用して、クエリ文字列を補足する。そのような補足されたクエリ文字列は、より広範な関連情報を見つけるために有用であり得る。
本発明の一実施形態における別の用途は、図9に示される。プロセス900は、オンライン上でのデジタル画像の自動タグ付けのために使用され得る。例えば、段階901では、新しいデジタル画像が、ランドマーク画像データベース内の画像と比較される。1つ以上の整合画像が見つけられる場合、タグは、段階902において、全整合画像に基づいて生成される。段階903では、新しい画像は、新しく生成されたタグによってタグ付けされる。
図10は、本発明の実施形態におけるユーザインターフェース1000を例証し、一式のランドマークが、ユーザ入力に従って選択され、各選択されたランドマークの視覚的クラスタに関する詳細が表示される。ユーザ指定基準に従って選択される、ランドマークは、1010等の各エリア内に表示され得る。また、各選択されたランドマークは、例えば、チェックボックス1040等のユーザ入力を受信するためのエリアを有し得る。各表示されたランドマークに対して、視覚的クラスタの要約リストを表示可能である。視覚的クラスタの要約リストは、特定の表示されたランドマークに属することが明確に示されるように表示可能であって、例えば、第1の表示されたランドマークのための視覚的クラスタの要約リストは、第1の表示されたランドマークに対応する表示エリア1010内に含まれることが可能である。表示されたランドマークのための視覚的クラスタの要約リストの各エントリ1020は、例えば、1020内に表される視覚的クラスタに対応するチェックボックス1030等、そのクラスタに指定のユーザ入力を受信するための対応する場所を有することが可能である。各エントリ1020は、クラスタ1022に関する記述情報と、さらなる詳細を読み出すためのリンク1021とを含むことが可能である。例えば、各クラスタに関する記述情報は、画像数、クラスタに画像を提供する一意のユーザまたは作者数の観点からの人気度、クラスタの手動修正または検証に関する情報、およびキー等の任意のアクセス情報を含み得る。リンク1021は、ユーザナビゲート可能ハイパーリンク等のリンク方法を含み、選択されたクラスタの画像および個々の画像関連データを読み出す。
図11は、本発明の実施形態における、インターフェース1000に関連する処理を示す工程図である。段階1110では、ユーザは、国、都市、地域、および/または他のキーワード等、1つ以上の選択基準を指定する。キーワードを含むユーザ指定情報を使用して、画像に割り当てられたタグに基づいて、画像を検索可能である。また、ユーザは、表示されたランドマークの人気度の最小限レベル、およびユーザによって提示された画像の数の最小限を有するランドマーク等、他の読み出し基準を指定し得る。例えば、ユーザは、少なくとも10名の別個のユーザが画像を提示したEgypt(エジプト)内のランドマークを閲覧することを所望し得る。また、ユーザは、少なくとも指定数の画像を有するランドマークのみ表示されるように指定し得る。段階1112から1120は、ユーザ指定選択基準を満たす、各ランドマークに対して繰り返される。段階1112では、ユーザ指定選択基準を満たす1つ以上のランドマークが見つけられる。各選択されたランドマークに対して、段階1114から1116が繰り返され、選択されたランドマークを有する視覚的クラスタを表示する。段階1114では、視覚的クラスタが選択され、段階1116では、視覚的クラスタの情報記述1020が表示される。例えば、画像数、画像の一意のユーザ識別子または作者数、クラスタ内の画像にアクセスするためのリンク、他のアクセス情報等、各視覚的クラスタに対して表示され得る。段階1116で表示される各視覚的クラスタに対して、例えば、チェックボックス1030等のユーザ入力グラフィックが表示され、ユーザに入力させることが可能である。
段階1118では、選択されたランドマークに対応する表示されるべき視覚的クラスタがさらに存在するかどうかについて決定が行なわれる。選択されたランドマークに対して、表示されるべきさらなる視覚的クラスタが存在しない場合、段階1120において、ランドマークに関する情報が表示される。例えば、ランドマークの名称および場所、人気度、画像数等の情報を表示可能である。また、段階1120で表示された各ランドマークに対して、対応するユーザ入力グラフィックが表示され、ユーザに入力させることが可能である。例えば、図10では、チェックボックス1040は、エリア1010に表示されるランドマークに対応するユーザ入力を受信し得る。段階1122では、表示されるべきさらなるランドマークが存在するかどうについて、決定が行なわれる。ユーザ指定選択基準を満たす全ランドマークが表示されている場合、段階1124において、視覚的クラスタに対応するユーザ入力が受信される。視覚的クラスタに対応するユーザ入力は、例えば、1つ以上のクラスタがマージされるべきであること、または1つ以上のクラスタが選択されたランドマークから分断されるべきであることを示し得る。段階1126では、視覚的クラスタは、それに従って処理される。段階1128では、各ランドマークに対応するユーザ入力が受信される。各ランドマークに対応するユーザ入力は、例えば、1つ以上のランドマークがマージされるべきであること、および/または削除されるべきであることを示し得る。
図12は、本発明の実施形態におけるユーザインターフェース1200を示し、ユーザは、選択された視覚的クラスタに関する情報を閲覧可能である。インターフェース1200は、選択された視覚的クラスタの1つ以上の例示的画像表現が表示されるエリア1210と、視覚的クラスタ内の各画像の詳細を含む記述データ要素のグループがリスト化されるエリア1220と、選択された画像が表示されるエリア1230とを含み得る。エリア1220は、選択されたクラスタ内の各画像に対して、記述情報1224と、チェックボックス1222等の対応するユーザ入力グラフィックとを含み得る。記述情報1224は、例えば、対応する画像を読み出すためのリンク、画像のデータおよび時間情報、画像の作者情報、およびタグ情報を含み得るが、それらに限定されない。エリア1230は、1220内に表示されたリストから読み出された画像を表示可能である。エリア1230内に表示された画像は、ユーザに、例えば、表示された画像内の着目領域1232を閲覧させることを含み得るが、それに限定されない。任意の画像内の着目領域を確認するための機能は、例えば、ユーザに、現在のクラスタ内に存在する特定の画像の好適性をより高度に決定可能にし得る。
図13は、一実施形態における、インターフェース1200に関連する処理を示す、工程図である。段階1310では、視覚的クラスタを選択するユーザ入力が受信される。段階1312では、選択された視覚的クラスタの1つ以上の画像表現が選択され、例えば、エリア1210内に表示される。段階1314では、選択されたクラスタ内の各画像のための情報が、例えば、エリア1220内に表示される。情報は、例えば、対応する画像を読み出すためのリンク、画像のデータおよび時間情報、画像の作者情報、およびタグ情報を含むが、それらに限定されない、各種々のデータ要素をリスト化する。また、例えば、チェックボックス1222等のユーザ入力グラフィックが、各リスト化された画像のために表示され、ユーザに入力させ得る。段階1316では、ユーザ入力が、受信される。段階1318では、視覚的クラスタは、受信されたユーザ入力に従って処理される。例えば、画像は、選択されたクラスタから削除可能であって、いくつかのタグ情報は、変更可能である、等である。
本発明の実施形態では、本明細書に説明される、本発明のシステムおよび構成要素は、周知のコンピュータを使用して実装される。そのようなコンピュータは、International Business Machines、Apple、Silicon Graphics Inc.、Sun、HP、Dell、Compaq、Digital、Cray等から市販のコンピュータ等、本明細書に説明される機能を行なうことが可能な任意の市販および周知のコンピュータであり得る。
その中に格納される制御論理(ソフトウェア)を有するコンピュータ使用可能または可読媒体から成る任意の装置あるいは製造物は、コンピュータプログラム製品もしくはプログラム記憶デバイスと称される。これは、コンピュータ、メインメモリ、ハードディスク、またはリムーバブル記憶ユニットを含むが、これらに限定されない。1つ以上のデータ処理デバイスによって実行されると、そのようなデータ処理デバイスに、本明細書に説明されるように動作させるその中に格納される制御論理を有するそのようなコンピュータプログラム製品は、本発明の実施形態を表す。
概要および要約の項ではなく、発明を実施するための形態の項は、特許請求の範囲を解釈するために使用されることを目的とすることを理解されたい。概要および要約の項は、本発明者らにより企図されるように、本発明の例示的実施形態のすべてではないが1つ以上を説明し得るが、本発明および添付の特許請求の範囲を制限することを全く意図しない。
特定の機能の実装およびその関係を例示した機能的な基礎的要素の助けにより本発明を上で説明した。これらの機能的な基礎的要素の境界は、説明に便利なように本明細書において適宜画定されている。特定の機能およびその関係が適切に実行される限り、代替の境界を画定することができる。
特定の実施形態の上記説明は、当技術の範囲内の知識を適用することにより、必要以上の実験を行わずに、また本発明の一般的概念から逸脱せずに、他の者がそのような特定の実施形態を様々な用途に合わせ容易に修正および/または適合させることができるように、本発明の一般的性質を十分明らかとしている。したがって、そのような適合および修正は、本明細書に示された教示および指針に基づき、開示された実施形態の同等物の意味および範囲内であることが意図される。
本発明の広さおよび範囲は、上述の例示的な実施形態のいずれによっても限定されるべきではなく、以下の請求項およびその同等物によってのみ定義されるべきである。

Claims (36)

  1. ランドマークの画像のデータベースを追加し、更新するための方法であって、
    (a)地理的近さに従って、地理的タグ付画像を地理的にクラスタ化し、1つ以上の地理的クラスタを生成することと、
    (b)画像類似性に従って、該1つ以上の地理的クラスタを視覚的にクラスタ化し、1つ以上の視覚的クラスタを生成することと
    を含む、方法。
  2. 前記地理的にクラスタ化することは、前記1つ以上の地理的クラスタを検証することを含む、請求項1に記載の方法。
  3. 前記検証することは、少なくとも所定数の関連付けられた一意のユーザ識別子を有する前記1つ以上の地理的クラスタを選択することを含む、請求項2に記載の方法。
  4. 前記視覚的にクラスタ化することは、領域グラフに基づいて、視覚的クラスタを選択することを含む、請求項1に記載の方法。
  5. 前記領域グラフは、地理的クラスタ内の整合画像に基づいて生成される、請求項4に記載の方法。
  6. 前記視覚的にクラスタ化することは、少なくとも1つの視覚的クラスタのためのテキストラベルを生成することを含む、請求項1に記載の方法。
  7. 前記少なくとも1つの視覚的クラスタのためのテキストラベルは、前記少なくとも1つの視覚的クラスタ内の個々の画像のテキストラベルに基づく、請求項6に記載の方法。
  8. 前記少なくとも1つの視覚的クラスタのためのテキストラベルは、先行視覚的クラスタに以前に割り当てられたテキストラベルに基づき、該先行視覚的クラスタは、ユーザ割当テキストラベルを有するクラスタである、請求項6に記載の方法。
  9. (c)外部データを受信することと、
    (d)該外部データに基づいて、視覚的クラスタを処理することと
    をさらに含む、請求項1に記載の方法。
  10. 前記外部データは、テキストタグを含む、請求項9に記載の方法。
  11. 前記外部データは、ユーザ入力を含む、請求項9に記載の方法。
  12. (e)視覚的クラスタを格納することをさらに含む、請求項1に記載の方法。
  13. デジタル画像からランドマークを識別するためのシステムであって、
    (a)地理的タグ付画像のデータベースと、
    (b)ランドマークデータベースと、
    (c)該地理的タグ付画像のデータベースと通信する地理的クラスタ化モジュールであって、該地理的タグ付画像は、1つ以上の地理的クラスタにグループ化される、地理的クラスタ化モジュールと、
    (d)該地理的クラスタ化モジュールと通信する視覚的クラスタ化モジュールであって、該1つ以上の地理的クラスタは、1つ以上の視覚的クラスタにグループ化され、視覚的クラスタデータは、該ランドマークデータベース内に格納される、視覚的クラスタ化モジュールと
    を含む、システム。
  14. 前記ランドマークデータベースは、ランドマークの画像と、関連付けられたテキストラベルとを含む、請求項13に記載のシステム。
  15. (e)外部データを受信するためのインターフェースであって、該外部データは、前記1つ以上の視覚的クラスタためのタグを含む、インターフェースをさらに含む、請求項13に記載のシステム。
  16. 前記外部データは、前記1つ以上の視覚的クラスタのための画像をさらに含む、請求項15に記載のシステム。
  17. 前記インターフェースは、グラフィカルユーザインターフェースである、請求項15に記載のシステム。
  18. 前記視覚的クラスタ化モジュールは、人気度インデックスモジュールをさらに含む、請求項13に記載のシステム。
  19. ランドマークの画像を読み出すためのユーザクエリを促進する方法であって、
    (a)ユーザクエリを受信することと、
    (b)該ユーザクエリ内の1つ以上のトリガワードを識別することと、
    (c)該1つ以上のトリガワードに対応する1つ以上の対応タグを、ランドマークデータベースから選択することと、
    (d)該ユーザクエリを該1つ以上の対応タグで補足し、補足されたユーザクエリを生成することと
    を含む、方法。
  20. (e)前記補足されたユーザクエリに基づいて、画像を読み出すことをさらに含む、請求項19に記載の方法。
  21. (f)ランドマークの人気度に従って、前記読み出された画像を順序付けることをさらに含む、請求項20に記載の方法。
  22. 前記ランドマークの人気度は、各ランドマークを有する画像と関連付けられた一意のユーザ識別子の数に基づく、請求項21に記載の方法。
  23. 新しいデジタル画像に自動的にタグを付ける方法であって、
    (a)該新しいデジタル画像をランドマーク画像データベース内の画像と比較することであって、該ランドマーク画像データベースは、1つ以上のランドマークの画像の視覚的クラスタを含む、ことと、
    (b)該視覚的クラスタのうちの少なくとも1つに基づいて、該新しいデジタル画像に少なくとも1つのタグをタグ付けすることと
    を含む、方法。
  24. コンピュータ使用可能媒体を含むコンピュータプログラム製品であって、該コンピュータ使用可能媒体は、コンピュータにランドマークの画像のデータベースを追加し、更新させるための該コンピュータ使用可能媒体に格納された制御論理を有し、該制御論理は、
    (a)該コンピュータに、地理的近さに従って、地理的タグ付画像をクラスタ化し、1つ以上の地理的クラスタを生成させる、第1のコンピュータ可読プログラムコードと、
    (b)該コンピュータに、画像類似性に従って、該1つ以上の地理的クラスタをクラスタ化させる、第2のコンピュータ可読プログラムコードと
    を含む、コンピュータプログラム製品。
  25. コンピュータ使用可能媒体を含むコンピュータプログラム製品であって、該コンピュータ使用可能媒体は、コンピュータにユーザクエリを促進させるために該コンピュータ使用可能媒体に格納された制御論理を有し、該制御論理は、
    (b)該コンピュータに、該ユーザクエリ内の1つ以上のトリガワードを識別させる、第1のコンピュータ可読プログラムコードと、
    (c)該コンピュータに、該1つ以上のトリガワードに対応する1つ以上の対応タグを、ランドマークデータベースから選択させる、第2のコンピュータ可読プログラムコードと、
    (d)該コンピュータに、該ユーザクエリを該1つ以上の対応タグで補足させる、第3のコンピュータ可読プログラムコードと
    を含む、コンピュータプログラム製品。
  26. 画像コレクション内にランドマークの画像を維持する方法であって、
    (a)第1の集合の画像および第2の集合の画像を選択することであって、該第1の集合および該第2の集合は、第1のランドマーク集合のメンバーである、ことと、
    (b)第1のリスト要素および第2のリスト要素を含む、第1のリストを表示することであって、該第1のリスト要素は、該第1の集合の画像に対応する第1の記述データ要素と、第1の入力を含み、該第2のリスト要素は、該第2の集合の画像に対応する第2の記述データ要素と、第2の入力とを含む、ことと、
    (c)該第1および第2の入力におけるユーザ入力を受信することと
    を含む、方法。
  27. (d)前記ユーザ入力に基づいて、前記第1の集合と前記第2の集合とをマージすることをさらに含む、請求項26に記載の方法。
  28. (e)前記ユーザ入力に基づいて、前記第1のランドマーク集合から前記第1の集合を除去することをさらに含む、請求項26に記載の方法。
  29. 前記第1の記述データ要素は、少なくとも1つのユーザナビゲート可能リンクを含む、請求項26に記載の方法。
  30. 前記選択することは、選択基準に基づき、該選択基準は、ユーザ指定選択基準を含む、請求項26に記載の方法。
  31. 前記選択基準は、ランドマークの人気度を含む、請求項30に記載の方法。
  32. コンピュータ使用可能媒体を含むコンピュータプログラム製品であって、該コンピュータ使用可能媒体は、コンピュータに画像コレクション内にランドマークの画像を維持させるために該コンピュータ使用可能媒体に格納された制御論理を有し、該制御論理は、
    (a)該コンピュータに、第1の集合の画像および第2の集合の画像を選択させる、第1のコンピュータ可読プログラムコードであって、該第1の集合および該第2の集合は、第1のランドマーク集合のメンバーである、第1のコンピュータ可読プログラムコードと、
    (b)該コンピュータに、第1のリスト要素と、第2のリスト要素とを含む第1のリストを表示させる第2のコンピュータ可読プログラムコードであって、該第1のリスト要素は、該第1の集合の画像に対応する第1の記述データ要素と、第1の入力とを含み、該第2のリスト要素は、該第2の集合の画像に対応する第2の記述データ要素と、第2の入力とを含む、第2のコンピュータ可読プログラムコードと、
    (c)該コンピュータに、該第1および第2の入力におけるユーザ入力を受信させる、第3のコンピュータ可読プログラムコードと
    を含む、コンピュータプログラム製品。
  33. 画像コレクション内にランドマークの画像を維持する方法であって、
    (a)少なくとも1つの例示的画像を表示することであって、該例示的画像は、第1の集合内に含まれ、該第1の集合は、第1のランドマークを有する画像を含む、ことと、
    (b)1つ以上の記述データグループを表示することであって、各記述データグループは、関連ユーザ入力を含み、各記述データグループは、該第1の集合内の1つの画像に対応する、ことと
    を含む、方法。
  34. (c)ユーザ入力を受信することであって、該ユーザ入力は、第1の画像の選択を示し、該第1の画像は、前記少なくとも1つの例示的画像のうちの1つである、ことと、
    (d)該第1の画像上の着目有界領域を表示することであって、該着目有界領域は、前記第1のランドマークを含む、ことと
    をさらに含む、請求項33に記載の方法。
  35. (e)1つ以上の記述データグループの関連ユーザ入力グラフィックにおいて、ユーザ入力を受信することと、
    (f)ユーザ入力に基づいて、前記第1の集合から少なくとも1つの画像を除去することと
    をさらに含む、請求項33に記載の方法。
  36. コンピュータ使用可能媒体を含むコンピュータプログラム製品であって、該コンピュータ使用可能媒体は、コンピュータに画像コレクション内にランドマークの画像を維持させるために該コンピュータ使用可能媒体に格納された制御論理を有し、該制御論理は、
    (a)該コンピュータに、少なくとも1つの例示的画像を表示させる第1のコンピュータ可読プログラムコードであって、該例示的画像は、第1の集合内に含まれ、該第1の集合は、第1のランドマークを有する画像を含む、第1のコンピュータ可読プログラムコードと、
    (b)該コンピュータに、1つ以上の記述データグループを表示させる第2のコンピュータ可読プログラムコードであって、各記述データグループは、関連ユーザ入力を含み、各記述データグループは、該第1の集合内の1つの画像に対応する、第2のコンピュータ可読プログラムコードと
    を含む、コンピュータプログラム製品。
JP2011509474A 2008-05-12 2009-05-12 人気ランドマークの自動的発見 Active JP5476369B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US12/119,359 US8676001B2 (en) 2008-05-12 2008-05-12 Automatic discovery of popular landmarks
US12/119,359 2008-05-12
PCT/US2009/002916 WO2009139844A2 (en) 2008-05-12 2009-05-12 Automatic discovery of popular landmarks

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP2014021923A Division JP5766830B2 (ja) 2008-05-12 2014-02-07 人気ランドマークの自動的発見

Publications (3)

Publication Number Publication Date
JP2011520208A true JP2011520208A (ja) 2011-07-14
JP2011520208A5 JP2011520208A5 (ja) 2012-06-28
JP5476369B2 JP5476369B2 (ja) 2014-04-23

Family

ID=41266941

Family Applications (2)

Application Number Title Priority Date Filing Date
JP2011509474A Active JP5476369B2 (ja) 2008-05-12 2009-05-12 人気ランドマークの自動的発見
JP2014021923A Active JP5766830B2 (ja) 2008-05-12 2014-02-07 人気ランドマークの自動的発見

Family Applications After (1)

Application Number Title Priority Date Filing Date
JP2014021923A Active JP5766830B2 (ja) 2008-05-12 2014-02-07 人気ランドマークの自動的発見

Country Status (5)

Country Link
US (4) US8676001B2 (ja)
JP (2) JP5476369B2 (ja)
KR (1) KR101579634B1 (ja)
CN (2) CN102089761B (ja)
WO (1) WO2009139844A2 (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009301416A (ja) * 2008-06-16 2009-12-24 Kddi Corp コンテンツ分類装置、コンテンツ検索装置、コンテンツ検索システム及びコンピュータプログラム
JP2015506045A (ja) * 2012-01-17 2015-02-26 アリババ・グループ・ホールディング・リミテッドAlibaba Group Holding Limited 画像特徴の類似性に基づく画像索引作成
US10922480B2 (en) 2014-06-09 2021-02-16 Alibaba Group Holding Limited Place-based information processing method and apparatus

Families Citing this family (103)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20170286434A1 (en) * 2005-10-26 2017-10-05 Cortica, Ltd. System and method for signature-based clustering of multimedia content elements
US8525825B2 (en) 2008-02-27 2013-09-03 Google Inc. Using image content to facilitate navigation in panoramic image data
KR101659097B1 (ko) * 2008-04-14 2016-09-22 티피 비전 홀딩 비.브이. 복수의 저장된 디지털 이미지들을 탐색하기 위한 방법 및 장치
US8676001B2 (en) 2008-05-12 2014-03-18 Google Inc. Automatic discovery of popular landmarks
US8406531B2 (en) * 2008-05-15 2013-03-26 Yahoo! Inc. Data access based on content of image recorded by a mobile device
US9646025B2 (en) * 2008-05-27 2017-05-09 Qualcomm Incorporated Method and apparatus for aggregating and presenting data associated with geographic locations
EP2297703A1 (en) * 2008-06-03 2011-03-23 ETH Zurich Method and system for generating a pictorial reference database using geographical information
US8788493B2 (en) 2008-06-30 2014-07-22 Verizon Patent And Licensing Inc. Digital image tagging apparatuses, systems, and methods
TWI390177B (zh) * 2008-11-24 2013-03-21 Inst Information Industry 景點推薦裝置和方法以及儲存媒體
US8396287B2 (en) * 2009-05-15 2013-03-12 Google Inc. Landmarks from digital photo collections
JP5268787B2 (ja) * 2009-06-04 2013-08-21 キヤノン株式会社 情報処理装置及びその制御方法、プログラム
US8768313B2 (en) 2009-08-17 2014-07-01 Digimarc Corporation Methods and systems for image or audio recognition processing
US8121618B2 (en) 2009-10-28 2012-02-21 Digimarc Corporation Intuitive computing methods and systems
US20110184949A1 (en) * 2010-01-25 2011-07-28 Jiebo Luo Recommending places to visit
US20110211737A1 (en) * 2010-03-01 2011-09-01 Microsoft Corporation Event Matching in Social Networks
US9465993B2 (en) 2010-03-01 2016-10-11 Microsoft Technology Licensing, Llc Ranking clusters based on facial image analysis
US20110292230A1 (en) 2010-05-28 2011-12-01 Winters Dustin L Method for managing privacy of digital images
US9703895B2 (en) * 2010-06-11 2017-07-11 Microsoft Technology Licensing, Llc Organizing search results based upon clustered content
US20110310088A1 (en) * 2010-06-17 2011-12-22 Microsoft Corporation Personalized navigation through virtual 3d environments
US8385593B2 (en) * 2010-06-18 2013-02-26 Google Inc. Selecting representative images for establishments
US8270684B2 (en) 2010-07-27 2012-09-18 Google Inc. Automatic media sharing via shutter click
US8724910B1 (en) * 2010-08-31 2014-05-13 Google Inc. Selection of representative images
US8581997B2 (en) 2010-10-28 2013-11-12 Intellectual Ventures Fund 83 Llc System for locating nearby picture hotspots
US8442716B2 (en) 2010-10-31 2013-05-14 Microsoft Corporation Identifying physical locations of entities
CN103314395B (zh) * 2010-11-01 2016-09-28 寇博租赁有限公司 创建、连接和显示三维空间物体的方法
US8655889B2 (en) * 2010-12-10 2014-02-18 Microsoft Corporation Autonomous mobile blogging
US8566325B1 (en) 2010-12-23 2013-10-22 Google Inc. Building search by contents
US8533187B2 (en) * 2010-12-23 2013-09-10 Google Inc. Augmentation of place ranking using 3D model activity in an area
US9542471B2 (en) * 2010-12-30 2017-01-10 Telefonaktiebolaget Lm Ericsson (Publ) Method of building a geo-tree
US20120213404A1 (en) 2011-02-18 2012-08-23 Google Inc. Automatic event recognition and cross-user photo clustering
US9552376B2 (en) 2011-06-09 2017-01-24 MemoryWeb, LLC Method and apparatus for managing digital files
US10453226B1 (en) * 2011-07-26 2019-10-22 Google Llc Presenting information on a map
US9280545B2 (en) * 2011-11-09 2016-03-08 Microsoft Technology Licensing, Llc Generating and updating event-based playback experiences
US9165206B2 (en) * 2011-12-12 2015-10-20 Google Inc. Updating point of interest data based on an image
CN103164480A (zh) * 2011-12-13 2013-06-19 北京千橡网景科技发展有限公司 用于在社交网络中推荐兴趣点的方法和设备
CN103294712B (zh) * 2012-02-29 2016-09-21 三星电子(中国)研发中心 实时热点区域推荐系统和方法
JP2013207357A (ja) * 2012-03-27 2013-10-07 Sony Corp サーバ、クライアント端末、システムおよびプログラム
US8996305B2 (en) * 2012-06-07 2015-03-31 Yahoo! Inc. System and method for discovering photograph hotspots
US9020278B2 (en) * 2012-06-08 2015-04-28 Samsung Electronics Co., Ltd. Conversion of camera settings to reference picture
US9391792B2 (en) 2012-06-27 2016-07-12 Google Inc. System and method for event content stream
CN103577400A (zh) * 2012-07-18 2014-02-12 三星电子(中国)研发中心 一种提供地点信息的方法及系统
US9036865B2 (en) * 2012-09-12 2015-05-19 International Business Machines Corporation Location determination for an object using visual data
US20140072226A1 (en) * 2012-09-13 2014-03-13 International Business Machines Corporation Searching and Sorting Image Files
US9677886B2 (en) * 2013-02-10 2017-06-13 Qualcomm Incorporated Method and apparatus for navigation based on media density along possible routes
US9230191B2 (en) * 2013-03-15 2016-01-05 Dropbox, Inc. Presentation and organization of content
US9076079B1 (en) 2013-03-15 2015-07-07 Google Inc. Selecting photographs for a destination
EP2782058A1 (en) * 2013-03-20 2014-09-24 Valuetainment AG Information system to obtain an exposition rating of a geographical area
US9465513B2 (en) * 2013-04-11 2016-10-11 General Electric Company Visual representation of map navigation history
CN103198162B (zh) * 2013-04-28 2016-08-31 冠捷显示科技(厦门)有限公司 一种图像浏览交互方法
CN103488769B (zh) * 2013-09-27 2017-06-06 中国科学院自动化研究所 一种基于多媒体数据挖掘的地标信息检索方法
US9069794B1 (en) * 2013-10-11 2015-06-30 Google Inc. Determining location information for images using landmark, caption, and metadata location data
US9531722B1 (en) 2013-10-31 2016-12-27 Google Inc. Methods for generating an activity stream
US9542457B1 (en) 2013-11-07 2017-01-10 Google Inc. Methods for displaying object history information
US9614880B1 (en) 2013-11-12 2017-04-04 Google Inc. Methods for real-time notifications in an activity stream
US10242080B1 (en) * 2013-11-20 2019-03-26 Google Llc Clustering applications using visual metadata
US9471834B1 (en) * 2013-11-22 2016-10-18 Google Inc. System and method for updating map views
US9311639B2 (en) 2014-02-11 2016-04-12 Digimarc Corporation Methods, apparatus and arrangements for device to device communication
US9509772B1 (en) 2014-02-13 2016-11-29 Google Inc. Visualization and control of ongoing ingress actions
WO2015134364A1 (en) * 2014-03-04 2015-09-11 Google Inc. Schematic representation of geographic locations
US9972121B2 (en) * 2014-04-22 2018-05-15 Google Llc Selecting time-distributed panoramic images for display
USD781318S1 (en) 2014-04-22 2017-03-14 Google Inc. Display screen with graphical user interface or portion thereof
US9934222B2 (en) 2014-04-22 2018-04-03 Google Llc Providing a thumbnail image that follows a main image
USD781317S1 (en) 2014-04-22 2017-03-14 Google Inc. Display screen with graphical user interface or portion thereof
USD780777S1 (en) 2014-04-22 2017-03-07 Google Inc. Display screen with graphical user interface or portion thereof
US9536199B1 (en) 2014-06-09 2017-01-03 Google Inc. Recommendations based on device usage
US9507791B2 (en) 2014-06-12 2016-11-29 Google Inc. Storage system user interface with floating file collection
US10078781B2 (en) 2014-06-13 2018-09-18 Google Llc Automatically organizing images
US9870420B2 (en) 2015-01-19 2018-01-16 Google Llc Classification and storage of documents
US9495614B1 (en) 2015-02-27 2016-11-15 Google Inc. Verifying labels for images using image recognition
US9754413B1 (en) 2015-03-26 2017-09-05 Google Inc. Method and system for navigating in panoramic images using voxel maps
RU2015111646A (ru) * 2015-03-31 2016-10-20 Общество С Ограниченной Ответственностью "Яндекс" Система и способ ранжирования точек интереса с использованием фоторейтинга
RU2015125820A (ru) 2015-06-30 2017-01-10 Общество С Ограниченной Ответственностью "Яндекс" Способ и сервер обработки пользовательского запроса на предоставление рекомендованной области интереса
US10467284B2 (en) 2015-08-03 2019-11-05 Google Llc Establishment anchoring with geolocated imagery
US10169659B1 (en) * 2015-09-24 2019-01-01 Amazon Technologies, Inc. Video summarization using selected characteristics
US10476827B2 (en) 2015-09-28 2019-11-12 Google Llc Sharing images and image albums over a communication network
KR102465332B1 (ko) * 2015-12-29 2022-11-11 에스케이플래닛 주식회사 사용자 장치, 그의 제어 방법 및 컴퓨터 프로그램이 기록된 기록매체
US10235623B2 (en) * 2016-02-12 2019-03-19 Adobe Inc. Accurate tag relevance prediction for image search
US10664719B2 (en) 2016-02-12 2020-05-26 Adobe Inc. Accurate tag relevance prediction for image search
TWI626428B (zh) * 2016-03-29 2018-06-11 群邁通訊股份有限公司 路線規劃系統及方法
US10007867B2 (en) * 2016-04-04 2018-06-26 Google Llc Systems and methods for identifying entities directly from imagery
US10628463B2 (en) * 2016-04-07 2020-04-21 Adobe Inc. Applying geo-tags to digital media captured without location information
CN106528807A (zh) * 2016-11-15 2017-03-22 杭州壹晨仟阳科技有限公司 地标注册方法、装置、设备以及地标查询方法和装置
CN106991404B (zh) * 2017-04-10 2019-06-28 山东师范大学 基于众源地理数据的地表覆盖更新方法及系统
CN110770717B (zh) 2017-05-17 2024-04-16 谷歌有限责任公司 通过通信网络与指定用户的自动图像共享
JPWO2019082606A1 (ja) * 2017-10-24 2019-11-14 パナソニックIpマネジメント株式会社 コンテンツ管理機器、コンテンツ管理システム、および、制御方法
CN109725980B (zh) * 2017-10-27 2023-05-16 伊姆西Ip控股有限责任公司 生成镜像标签的方法、设备以及计算机可读介质
US11232115B2 (en) * 2018-04-11 2022-01-25 Nokia Technologies Oy Identifying functional zones within a geographic region
CN108829801B (zh) * 2018-06-06 2020-11-20 大连理工大学 一种基于文档级别注意力机制的事件触发词抽取方法
CN109255365B (zh) * 2018-07-26 2021-09-28 河海大学 一种基于K-medoids算法的地理适宜性分类方法
US10740400B2 (en) * 2018-08-28 2020-08-11 Google Llc Image analysis for results of textual image queries
CN109583484B (zh) * 2018-11-14 2022-04-05 西北工业大学 一种三类海域地标点自动选取方法
CN111209419B (zh) * 2018-11-20 2023-09-19 浙江宇视科技有限公司 一种图像数据存储的方法及装置
US10936178B2 (en) 2019-01-07 2021-03-02 MemoryWeb, LLC Systems and methods for analyzing and organizing digital photos and videos
US10887531B2 (en) 2019-03-27 2021-01-05 Rovi Guides, Inc. Replacing a background portion of an image
US10944921B2 (en) 2019-03-27 2021-03-09 Rovi Guides, Inc. Replacing a background portion of an image
US11025837B2 (en) 2019-03-27 2021-06-01 ROVl GUIDES, INC. Replacing a background portion of an image
WO2020198677A1 (en) * 2019-03-27 2020-10-01 Rovi Guides, Inc. Replacing a background portion of an image
US10848920B1 (en) * 2019-09-17 2020-11-24 Microsoft Technology Licensing, Llc Generation of precise geospatial coordinates
US11182612B2 (en) * 2019-10-28 2021-11-23 The Chinese University Of Hong Kong Systems and methods for place recognition based on 3D point cloud
CN111325249B (zh) * 2020-02-10 2022-05-17 上海携旅信息技术有限公司 图像应季判别方法、系统、电子设备和介质
KR102310446B1 (ko) * 2020-12-31 2021-10-07 (주)트레블씨투비 심층학습모델을 기초로 위치 변화에 무관하게 랜드 마크를 식별하기 위한 장치 및 이를 위한 방법
CN113435443B (zh) * 2021-06-28 2023-04-18 中国兵器装备集团自动化研究所有限公司 一种从视频中自动识别地标的方法
CN114626483A (zh) * 2022-03-30 2022-06-14 北京爱奇艺科技有限公司 一种地标图像生成方法及装置

Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH07168855A (ja) * 1993-09-21 1995-07-04 Toshiba Corp 情報記録再生装置
JP2002010178A (ja) * 2000-06-19 2002-01-11 Sony Corp 画像管理システム及び画像管理方法、並びに、記憶媒体
JP2004021717A (ja) * 2002-06-18 2004-01-22 Toshiba Corp 空間データ分析装置、空間データ分析プログラムおよび空間データ分析方法
JP2007507775A (ja) * 2003-10-02 2007-03-29 ノキア コーポレイション メディア項目のクラスタリングとクエリとを行う方法
JP2007142672A (ja) * 2005-11-16 2007-06-07 Fujifilm Corp 画像分類装置及び方法、並びにデジタルカメラ
JP2007194948A (ja) * 2006-01-19 2007-08-02 Fujifilm Corp 画像編集装置及び画像編集プログラム
JP2007334505A (ja) * 2006-06-13 2007-12-27 Mitsubishi Electric Corp 施設検索システムならびにこれに用いられる移動体端末およびサーバ
JP2008521133A (ja) * 2004-11-17 2008-06-19 イーストマン コダック カンパニー 分散ベースのイベント・クラスタリング
JP2008521354A (ja) * 2004-11-17 2008-06-19 イーストマン コダック カンパニー イベントによる複数段階画像クラスタリング
JP2008529105A (ja) * 2004-11-04 2008-07-31 ヴェリセプト コーポレーション クラスタリング及び分類のための方法、装置、及びシステム
JP2009518704A (ja) * 2005-11-22 2009-05-07 イーストマン コダック カンパニー 地図分類方法及び地図分類システム

Family Cites Families (64)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3307843B2 (ja) 1996-10-30 2002-07-24 松下電器産業株式会社 ハイパーテキスト構造における地図表示装置
DE69910757T2 (de) 1998-04-13 2004-06-17 Eyematic Interfaces, Inc., Santa Monica Wavelet-basierte gesichtsbewegungserfassung für avataranimation
JPH11328194A (ja) * 1998-05-13 1999-11-30 Nippon Telegr & Teleph Corp <Ntt> キーワード検索方法及び装置及びキーワード検索プログラムを格納した記憶媒体
US6711293B1 (en) 1999-03-08 2004-03-23 The University Of British Columbia Method and apparatus for identifying scale invariant features in an image and use of same for locating an object in an image
JP2000259669A (ja) 1999-03-12 2000-09-22 Ntt Data Corp 文書分類装置及びその方法
US6411724B1 (en) 1999-07-02 2002-06-25 Koninklijke Philips Electronics N.V. Using meta-descriptors to represent multimedia information
US7233942B2 (en) 2000-10-10 2007-06-19 Truelocal Inc. Method and apparatus for providing geographically authenticated electronic documents
JP3437555B2 (ja) 2001-03-06 2003-08-18 キヤノン株式会社 特定点検出方法及び装置
GB0114271D0 (en) 2001-06-12 2001-08-01 Univ Manchester Parameterisation
KR20030059403A (ko) * 2001-12-29 2003-07-10 엘지전자 주식회사 멀티미디어 검색방법 및 장치
US7911497B2 (en) * 2003-04-25 2011-03-22 Lockheed Martin Corporation Method and apparatus for video on demand
JP4388301B2 (ja) * 2003-05-08 2009-12-24 オリンパス株式会社 画像検索装置、画像検索方法、画像検索プログラム及びそのプログラムを記録した記録媒体
US20060155761A1 (en) * 2003-06-30 2006-07-13 Van De Sluis Bartel M Enhanced organization and retrieval of digital images
WO2005055138A2 (en) * 2003-11-26 2005-06-16 Yesvideo, Inc. Statical modeling of a visual image for use in determining similarity between visual images
US20060020597A1 (en) * 2003-11-26 2006-01-26 Yesvideo, Inc. Use of image similarity in summarizing a collection of visual images
US20060015497A1 (en) * 2003-11-26 2006-01-19 Yesvideo, Inc. Content-based indexing or grouping of visual images, with particular use of image similarity to effect same
US7697792B2 (en) * 2003-11-26 2010-04-13 Yesvideo, Inc. Process-response statistical modeling of a visual image for use in determining similarity between visual images
DE102004046563B4 (de) * 2004-09-24 2008-01-03 Aerodyn Energiesysteme Gmbh Windenergieanlage mit vollintegriertem Maschinensatz
US7707239B2 (en) 2004-11-01 2010-04-27 Scenera Technologies, Llc Using local networks for location information and image tagging
US8027832B2 (en) 2005-02-11 2011-09-27 Microsoft Corporation Efficient language identification
US8732175B2 (en) 2005-04-21 2014-05-20 Yahoo! Inc. Interestingness ranking of media objects
US7760917B2 (en) 2005-05-09 2010-07-20 Like.Com Computer-implemented method for performing similarity searches
US7353114B1 (en) * 2005-06-27 2008-04-01 Google Inc. Markup language for an interactive geographic information system
WO2007013432A1 (ja) 2005-07-26 2007-02-01 Matsushita Electric Industrial Co., Ltd. 画像データ管理装置および画像データ管理方法
US7840558B2 (en) 2005-11-04 2010-11-23 Microsoft Corporation Geo-tagged based listing service and mapping engine
US8098899B2 (en) * 2005-11-14 2012-01-17 Fujifilm Corporation Landmark search system for digital camera, map data, and method of sorting image data
JP2007179368A (ja) * 2005-12-28 2007-07-12 Mekiki Creates Co Ltd 画像編集支援システムとその装置、方法、及びプログラム
EP1816836A3 (en) 2005-12-30 2010-01-13 LG Electronics Inc. Apparatus and method for managing images of mobile terminal
US7725451B2 (en) * 2006-01-23 2010-05-25 Microsoft Corporation Generating clusters of images for search results
JP4671235B2 (ja) 2006-01-26 2011-04-13 田岡化学工業株式会社 フルオレン誘導体の製造方法
KR100641791B1 (ko) 2006-02-14 2006-11-02 (주)올라웍스 디지털 데이터에 대한 태깅 방법 및 시스템
US20070208776A1 (en) 2006-03-06 2007-09-06 Microsoft Corporation Assignment of metadata
JP2007316876A (ja) 2006-05-25 2007-12-06 Hitachi Ltd 文書検索プログラム
US8015183B2 (en) * 2006-06-12 2011-09-06 Nokia Corporation System and methods for providing statstically interesting geographical information based on queries to a geographic search engine
US7739221B2 (en) * 2006-06-28 2010-06-15 Microsoft Corporation Visual and multi-dimensional search
JP2008033399A (ja) 2006-07-26 2008-02-14 Fujifilm Corp 情報提供システム
US7657504B2 (en) 2006-10-10 2010-02-02 Microsoft Corporation User interface for displaying images of sights
US7707208B2 (en) * 2006-10-10 2010-04-27 Microsoft Corporation Identifying sight for a location
WO2008055120A2 (en) 2006-10-30 2008-05-08 Seeqpod, Inc. System and method for summarizing search results
US8037051B2 (en) * 2006-11-08 2011-10-11 Intertrust Technologies Corporation Matching and recommending relevant videos and media to individual search engine results
US20080118160A1 (en) * 2006-11-22 2008-05-22 Nokia Corporation System and method for browsing an image database
JP4891740B2 (ja) 2006-11-22 2012-03-07 株式会社日立製作所 コンテンツ検索装置及びコンテンツ検索方法
JP2008165303A (ja) 2006-12-27 2008-07-17 Fujifilm Corp コンテンツ登録装置、及びコンテンツ登録方法、及びコンテンツ登録プログラム
JP4672692B2 (ja) 2007-03-14 2011-04-20 株式会社東芝 単語認識システムおよび単語認識プログラム
US20080268876A1 (en) * 2007-04-24 2008-10-30 Natasha Gelfand Method, Device, Mobile Terminal, and Computer Program Product for a Point of Interest Based Scheme for Improving Mobile Visual Searching Functionalities
US8155399B2 (en) 2007-06-12 2012-04-10 Utc Fire & Security Corporation Generic face alignment via boosting
WO2008152805A1 (ja) 2007-06-14 2008-12-18 Panasonic Corporation 画像認識装置及び画像認識方法
US20080320036A1 (en) 2007-06-22 2008-12-25 Winter Gentle E Automatic data collection
US7870227B2 (en) 2007-07-31 2011-01-11 Yahoo! Inc. System and method for merging internet protocol address to location data from multiple sources
US10318110B2 (en) 2007-08-13 2019-06-11 Oath Inc. Location-based visualization of geo-referenced context
US20080104040A1 (en) * 2007-09-26 2008-05-01 Ramakrishna Krishnamsetty C Visually intuitive search method
US9612126B2 (en) * 2007-12-03 2017-04-04 Nokia Technologies Oy Visual travel guide
US8150098B2 (en) * 2007-12-20 2012-04-03 Eastman Kodak Company Grouping images by location
US8019536B2 (en) * 2007-12-28 2011-09-13 At&T Intellectual Property I, L.P. Methods, devices, and computer program products for geo-tagged photographic image augmented GPS navigation
US7925653B2 (en) * 2008-02-27 2011-04-12 General Electric Company Method and system for accessing a group of objects in an electronic document
US8676001B2 (en) 2008-05-12 2014-03-18 Google Inc. Automatic discovery of popular landmarks
US20090292685A1 (en) * 2008-05-22 2009-11-26 Microsoft Corporation Video search re-ranking via multi-graph propagation
US8086048B2 (en) * 2008-05-23 2011-12-27 Yahoo! Inc. System to compile landmark image search results
US8126249B2 (en) 2008-05-30 2012-02-28 Optasia Medical Limited Methods of and system for detection and tracking of osteoporosis
US20100076976A1 (en) 2008-09-06 2010-03-25 Zlatko Manolov Sotirov Method of Automatically Tagging Image Data
US8037011B2 (en) 2008-09-15 2011-10-11 Motorola Mobility, Inc. Method and apparatus for recommending content items
US20100205176A1 (en) * 2009-02-12 2010-08-12 Microsoft Corporation Discovering City Landmarks from Online Journals
US8483715B2 (en) 2009-03-26 2013-07-09 Yahoo! Inc. Computer based location identification using images
US8396287B2 (en) 2009-05-15 2013-03-12 Google Inc. Landmarks from digital photo collections

Patent Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH07168855A (ja) * 1993-09-21 1995-07-04 Toshiba Corp 情報記録再生装置
JP2002010178A (ja) * 2000-06-19 2002-01-11 Sony Corp 画像管理システム及び画像管理方法、並びに、記憶媒体
JP2004021717A (ja) * 2002-06-18 2004-01-22 Toshiba Corp 空間データ分析装置、空間データ分析プログラムおよび空間データ分析方法
JP2007507775A (ja) * 2003-10-02 2007-03-29 ノキア コーポレイション メディア項目のクラスタリングとクエリとを行う方法
JP2008529105A (ja) * 2004-11-04 2008-07-31 ヴェリセプト コーポレーション クラスタリング及び分類のための方法、装置、及びシステム
JP2008521133A (ja) * 2004-11-17 2008-06-19 イーストマン コダック カンパニー 分散ベースのイベント・クラスタリング
JP2008521354A (ja) * 2004-11-17 2008-06-19 イーストマン コダック カンパニー イベントによる複数段階画像クラスタリング
JP2007142672A (ja) * 2005-11-16 2007-06-07 Fujifilm Corp 画像分類装置及び方法、並びにデジタルカメラ
JP2009518704A (ja) * 2005-11-22 2009-05-07 イーストマン コダック カンパニー 地図分類方法及び地図分類システム
JP2007194948A (ja) * 2006-01-19 2007-08-02 Fujifilm Corp 画像編集装置及び画像編集プログラム
JP2007334505A (ja) * 2006-06-13 2007-12-27 Mitsubishi Electric Corp 施設検索システムならびにこれに用いられる移動体端末およびサーバ

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009301416A (ja) * 2008-06-16 2009-12-24 Kddi Corp コンテンツ分類装置、コンテンツ検索装置、コンテンツ検索システム及びコンピュータプログラム
JP2015506045A (ja) * 2012-01-17 2015-02-26 アリババ・グループ・ホールディング・リミテッドAlibaba Group Holding Limited 画像特徴の類似性に基づく画像索引作成
US10922480B2 (en) 2014-06-09 2021-02-16 Alibaba Group Holding Limited Place-based information processing method and apparatus

Also Published As

Publication number Publication date
US20150213057A1 (en) 2015-07-30
CN102089761A (zh) 2011-06-08
JP2014081964A (ja) 2014-05-08
US9483500B2 (en) 2016-11-01
JP5766830B2 (ja) 2015-08-19
WO2009139844A3 (en) 2010-04-15
CN104298710A (zh) 2015-01-21
US10289643B2 (en) 2019-05-14
US20090279794A1 (en) 2009-11-12
KR101579634B1 (ko) 2016-01-05
WO2009139844A2 (en) 2009-11-19
US20130138685A1 (en) 2013-05-30
CN104298710B (zh) 2018-05-18
US20170024415A1 (en) 2017-01-26
CN102089761B (zh) 2014-10-15
KR20110016936A (ko) 2011-02-18
US8676001B2 (en) 2014-03-18
US9014511B2 (en) 2015-04-21
JP5476369B2 (ja) 2014-04-23

Similar Documents

Publication Publication Date Title
JP5766830B2 (ja) 人気ランドマークの自動的発見
US9817895B2 (en) Associating video content with geographic maps
US9489402B2 (en) Method and system for generating a pictorial reference database using geographical information
KR101672570B1 (ko) 디지털 이미지들 내의 랜드마크들 검출 및 주석 달기
US20170185670A1 (en) Generating labels for images associated with a user
US20130294649A1 (en) Mobile Image Search and Indexing System and Method
Ji et al. When location meets social multimedia: A survey on vision-based recognition and mining for geo-social multimedia analytics
JP5608680B2 (ja) モバイルの画像検索及びインデキシングのシステム及び方法
CN104520848B (zh) 按照出席者搜索事件
Ivanov et al. Geotag propagation in social networks based on user trust model
US10885095B2 (en) Personalized criteria-based media organization
Tahmasebzadeh et al. Geowine: Geolocation based wiki, image, news and event retrieval
Vaziri et al. Discovering tourist attractions of cities using Flickr and OpenStreetMap data
Jones et al. Automated annotation of landmark images using community contributed datasets and web resources
Ardizzone et al. Extracting touristic information from online image collections
GENTILE Using Flickr geotags to find similar tourism destinations
Deeksha et al. A spatial clustering approach for efficient landmark discovery using geo-tagged photos
Girdhar et al. Mobile Visual Search for Digital Heritage Applications
Papadopoulos et al. Tourism knowledge discovery in social multimedia
Ardizzone et al. Automatic Generation of Custom Tourist Routes
Ennis et al. Evaluation Of MediaPlace: a geospatial semantic enrichment system for photographs
Pfoser et al. Geoblogging: User-contributed geospatial data collection and fusion
Chimlek et al. Landmark image searching with inattentive salient regions

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20120511

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20120511

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20130813

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20131113

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20131120

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20131211

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20140108

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20140207

R150 Certificate of patent or registration of utility model

Ref document number: 5476369

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S533 Written request for registration of change of name

Free format text: JAPANESE INTERMEDIATE CODE: R313533

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: R3D02

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250