JP6141305B2 - 画像検索 - Google Patents

画像検索 Download PDF

Info

Publication number
JP6141305B2
JP6141305B2 JP2014543557A JP2014543557A JP6141305B2 JP 6141305 B2 JP6141305 B2 JP 6141305B2 JP 2014543557 A JP2014543557 A JP 2014543557A JP 2014543557 A JP2014543557 A JP 2014543557A JP 6141305 B2 JP6141305 B2 JP 6141305B2
Authority
JP
Japan
Prior art keywords
image
label
search
images
processor
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2014543557A
Other languages
English (en)
Other versions
JP2014533868A (ja
Inventor
ジン ホワシン
ジン ホワシン
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Alibaba Group Holding Ltd
Original Assignee
Alibaba Group Holding Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Alibaba Group Holding Ltd filed Critical Alibaba Group Holding Ltd
Publication of JP2014533868A publication Critical patent/JP2014533868A/ja
Application granted granted Critical
Publication of JP6141305B2 publication Critical patent/JP6141305B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/53Querying
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/58Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/583Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/58Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/5866Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using information manually generated, e.g. tags, keywords, comments, manually generated location and time information

Description

本開示は、ネットワーク検索技術の分野に関し、より具体的には、画像検索のための方法および装置に関する。
本出願は、2011年11月25日出願の中国特許出願第201110380442.X号、表題「Image Searching Method and Apparatus」に対する外国優先権を主張するものであり、参照によりその全体が本明細書に組み込まれる。
画像検索技術の適用と開発に伴い、視覚的特徴に基づく画像検索技術が画像検索技術の主流である。視覚的特徴に基づく画像検索技術の実装は、視覚的特徴に基づく画像検索データベースの事前構築を必要とする。具体的には、図1は、視覚的特徴に基づく画像検索データベースの構築のための例示の方法のフローチャートを図解する。
102において、特徴抽出システムが構築される。特徴抽出システムは、画像から抽出されるテンプレートの視覚的特徴を定義する。
104において、視覚的特徴は、構築された特徴抽出システムを利用して、画像検索データベース内の複数の画像から抽出される。画像は、その画像から抽出された1つ以上の視覚的特徴によって表現され得る。
106において、各画像に対応する視覚的特徴は、索引キーワードとして使用されて逆索引を構築し、視覚的特徴に基づく画像検索データベースを生成する。視覚的特徴に基づく画像検索データベース構築のワークフローは、このようにして完了する。
102から106までの操作に基づいて、視覚的特徴に基づく画像検索データベースが構築される。サーバは、視覚的特徴に基づく画像検索データベースに基づいて画像検索を行い得る。図2は、サーバによる画像検索データベース内の画像検索のための例示の方法のフローチャートを図解する。
202において、サーバは、クライアント端末により提出される画像検索要求を受信する。202において、サーバは、視覚的特徴に基づく画像検索データベースを含み得るか、またはサーバは、視覚的特徴に基づく画像検索データベースにアクセスし得る。画像検索要求は、ユーザが要求する検索用の画像を含む。
204において、サーバは、画像検索要求時に受信した検索用の画像から視覚的特徴を抽出する。204において、視覚的特徴が検索用の画像から抽出される方法は、視覚的特徴に基づく画像検索データベースが構築されるときに視覚的特徴がその画像から抽出される方法と同一であり得る。
206において、サーバは、抽出された視覚的特徴に基づいて、構築された逆索引に従って、視覚的特徴に基づく画像検索データベースから抽出された視覚的特徴に対応する一組の画像を検索する。
208において、サーバは、画像検索要求を送信するクライアント端末に、検索結果を送信する。サーバが画像を検索する操作がその後完了する。
204から208までの操作に基づいて、サーバは、視覚的特徴に基づく画像検索データベースに基づいて、ユーザによって要求された一組の画像を返す。
実際の適用において、上述の視覚的特徴に基づく画像検索技術は、検索機能を有するサーバが通常装備しているテキスト検索エンジンを使用する代わりに、新しい視覚的特徴に基づく検索エンジンを作成することによって実装され得る。したがって、サーバリソースを効果的に利用することができない。
本発明の概要は、以下の発明を実施するための形態においてさらに記載される概念の選択を簡潔な形態で導入するために提供される。本発明の概要は、特許請求される主題のすべての重要な特徴または基本的な特徴を特定するよう意図されるものでも、特許請求される主題の範囲の決定を支援するものとして使用されるよう単独で意図されるものでもない。例えば、「技術」という用語は、上述の文脈および本開示内で許可されるデバイス(複数を含む)、システム(複数を含む)、方法(複数を含む)、および/またはコンピュータ可読命令を指し得る。
本開示は、画像検索のための方法および装置を提供する。本技術は、サーバリソースの利用率を改善し得る。
本開示は、画像検索のための方法を提供する。画像検索データベース内の各画像について、それぞれの画像のそれぞれのラベルが、それぞれの画像に対応する記述情報に基づいて生成される。生成されたそれぞれのラベルとそれぞれの画像との間の対応関係が記憶される。画像検索のための方法は、以下の操作を含み得る。
受信された画像検索要求に基づいて、画像検索要求内の検索用の画像に対応する記述情報が取得される。
検索用の画像の記述情報に基づいて、検索用の画像のラベルが生成される。検索用の画像のラベルを生成するための方法は、画像検索データベース内の各画像のそれぞれのラベルを生成するための方法と同一であるか、または実質的に類似している。
それぞれのラベルとそれぞれの画像との間の記憶された対応関係に基づいて、検索用の画像のラベルに対応する1つ以上の画像が決定される。決定された1つ以上の画像は、画像検索要求を送信するクライアント端末に送信される。
本開示は、画像検索用の装置も提供する。この装置は、対応関係生成ユニット、記述情報検索ユニット、ラベル生成ユニット、画像決定ユニット、および画像供給ユニットを含み得る。
対応関係生成ユニットは、画像検索データベース内の各画像について、それぞれの画像に対応する記述情報に基づいてそれぞれの画像のそれぞれのラベルを生成し、生成されたそれぞれのラベルとそれぞれの画像との間の対応関係を記憶する。画像検索のための方法は、以下の操作を含み得る。
記述情報検索ユニットは、受信された画像検索要求に基づいて、画像検索要求中の検索用の画像に対応する記述情報を取得する。
ラベル生成ユニットは、記述情報検索ユニットによって取得された検索用の画像の記述情報に基づいて、検索用の画像のラベルを生成する。検索用の画像のラベルを生成するための方法は、画像検索データベース内の各画像のそれぞれのラベルを生成するための方法と同一であるか、または実質的に類似している。
画像決定ユニットは、それぞれのラベルとそれぞれの画像との間の記憶された対応関係に基づいて、ラベル生成ユニットによって生成される検索用の画像のラベルに対応する1つ以上の画像を決定する。画像供給ユニットは、画像検索要求を送信するクライアント端末に、決定された1つ以上の画像を送信する。
本開示に提供される本技術のうちの少なくとも1つは、最初に、画像検索データベース内の各画像について、それぞれの画像に対応する記述情報に基づいてそれぞれの画像のそれぞれのラベルを生成し、生成されたそれぞれのラベルとそれぞれの画像との間の対応関係を記憶し得る。本技術は、画像検索要求に基づいて、画像検索要求内の検索用の画像に対応する記述情報を取得する。本開示は、次に、検索用の画像の記述情報に基づいて、検索用の画像のラベルを生成する。検索用の画像のラベルを生成するための方法は、画像検索データベース内の各画像のラベルを生成するための方法と同一であるか、または実質的に類似している。
さらに、本技術は、それぞれのラベルとそれぞれの画像との間の記憶された対応関係に基づいて、検索用の画像のラベルに対応する1つ以上の画像を決定し、画像検索用の要求を送信するクライアント端末に、決定された1つ以上の画像を送信する。
本技術において、画像の記述情報に基づいて生成される対応画像のラベルは、テキスト形式であり得る。したがって、ラベルに基づく画像検索は、既存のテキスト検索エンジンを利用することができ、それによって、サーバリソースの利用率を改善する。
本開示の実施形態をより良好に図解するために、以下は、実施形態の説明において使用される図の簡単な導入である。以下の図が本開示の一部の実施形態にのみ関連しており、本開示を限定するために使用されるものではないことは明らかである。当業者は、創造的に工夫することなく、本開示における図に従って他の図を得ることができる。
図1は、視覚的特徴に基づく画像検索データベースを構築するための例示の方法のフローチャートを図解する。 図2は、サーバによる画像検索データベース内の画像検索のための例示の方法のフローチャートを図解する。 図3は、画像検索データベース内の各画像のラベルを生成するための例示の方法のフローチャートを図解する。 図4は、画像検索データベース内の各画像のラベルを生成するための別の例示の方法のフローチャートを図解する。 図5は、画像に対応するラベルを生成するための別の例示の方法のフローチャートを図解する。 図6は、画像の記述情報から抽出されるキーワードに基づいて画像のラベルを生成するための例示の方法のフローチャートを図解する。 は、サーバによって実施される画像検索ための例示の方法のフローチャートを図解する。 は、サーバによる画像検索のための別の例示の方法のフローチャートを図解する。 は、本開示の第2の実施例に従う製品のテキストラベルを抽出するための例示の方法のフローチャートを図解する。 は、本開示の第3の実施形態例に従う画像検索用の例示の装置の構成図を図解する。 は、本開示の第3の実施形態例に従う画像検索用の別の例示の装置の構成図を図解する。
本開示は、画像検索のための方法および装置を提供する。本技術は、サーバリソースの利用率を改善し得る。本技術は、画像検索のプロセスにおいて適用され得、方法または装置のいずれかとして実装され得る。以下は、図の参照による本技術の詳細な説明である。本明細書に記載される実施形態は、例示の実施形態であり、本開示の範囲を限定するために使用されるものではない。
本開示は、本開示の第1の実施形態例に従う画像検索のための方法を提供する。この方法は、サーバのテキスト検索エンジンを使用して画像検索を行うためにインターネット上で情報検索機能を有するサーバにおいて使用され得、それによって、サーバリソースの利用率を改善する。
第1の実施形態例における画像検索のための方法は、画像を検索するサーバの基礎として、画像検索データベース内の各画像のラベルを事前構築し得る。したがって、サーバのテキスト検索エンジンは、画像検索を行うために使用され得る。以下の説明は、各画像のラベルを構築する2つの例を説明する。
各画像のラベルを構築する1つの例では、画像検索データベース内の各画像についてそれぞれのラベルが構築され、それぞれのラベルとそれぞれの画像との間の対応関係が記憶される。図3は、画像検索データベース内の各画像のラベルを生成するための例示の方法のフローチャートを図解する。302において、それぞれの画像が画像検索データベースから選択され、それぞれの画像の記述情報が取得される。それぞれの画像の記述情報を取得するためのプロセスは、以下の通りである。それぞれの画像に対応するエンティティが決定され、そのエンティティの記述情報がそれぞれの画像の記述情報として使用される。例えば、それぞれの画像の記述情報は主としてそれぞれの画像に対応するエンティティの属性を記述する。それぞれの画像の記述情報はエンティティの記述情報を概して含み得る。それぞれの画像に対応するエンティティは、それぞれの画像に含まれる特定内容を含んでよい。例えば、電子商取引の分野では、それぞれの画像に対応するエンティティは概して製品でよい。対応して、画像の記述情報は製品のさまざまな記述情報を含み得、例えば製品名、製品属性(実際の色、実際の寸法等)、製品の使用法、製品のカテゴリ等である。
304では、それぞれの画像のそれぞれのラベルは取得されたそれぞれの画像の記述情報に基づいて生成される。302において、それぞれの画像の記述情報は、概してテキスト形式である。対応して、それぞれの画像の記述情報に基づいて生成されるそれぞれのラベルも、概してテキスト形式である。それぞれのラベルは、それぞれの画像に対応するエンティティの属性特性を識別するために主として使用される。例えば、1つのラベルは異なる画像に対応し得る。
306において、生成されたそれぞれのラベルとそれぞれの画像との間の対応関係が記憶される。例えば、索引付けのための方法は、対応関係を記憶するために使用され得、画像検索の速度を改善する。画像検索データベース内のそれぞれの画像に対応するそれぞれのラベルは、索引として使用され得る。逆索引付け方法は、それぞれのラベルとそれぞれの画像との間の対応関係を記憶するために使用される。それぞれのラベルとそれぞれの画像を記憶するための本明細書に記述される方法は単に例であることを理解されたい。表またはリスト等の対応関係を記憶するために異なる記憶方法を柔軟に設定可能であり、本明細書中では列挙されない。
308において、画像検索データベース内に生成されたラベルを有しない画像があるかどうかが決定される。決定結果が肯定的である場合、プロセスは、302の操作に戻る。そうでない場合、プロセスは打ち切られる。
308において、画像検索データベース内にラベルの付けられていない画像があるかどうかの決定は、画像検索データベース内に未選択画像があるかどうかの決定となる。画像検索データベース内の画像用の索引を構築するプロセスは、このようにして完了する。
302から308までの操作を介して、画像検索データベース内の対応するそれぞれの画像のそれぞれのラベルが生成され、それぞれのラベルとそれぞれの画像との間の対応関係が記憶される。
以下の説明は、各画像のラベルを構築する第2の例を記述する。画像検索データベース内の各画像のラベルを生成することに加え、それぞれの画像内の1つまたはそれ以上のそれぞれの視覚的特徴がさらに抽出される。それぞれのラベルとそれぞれの画像との間の対応関係が記憶されると、それぞれの視覚的特徴とそれぞれのラベルとの間の対応関係も記憶される。それぞれの画像について生成されるそれぞれのラベルと、それぞれのラベルに対応するそれぞれの画像と、それぞれの画像から抽出されるそれぞれの視覚的特徴との間の対応関係が記憶される。
図4は、画像検索データベース内の各画像のラベルを生成するための別の例示の方法のフローチャートを図解する。
402において、それぞれの画像が画像検索データベースから選択され、それぞれの画像の記述情報が取得される。402の操作は、302の操作と実質的に同一であるか、または類似しており、したがって、本明細書において詳述されない。
404においてそれぞれの画像のラベルが、取得されたそれぞれの画像の記述情報に基づいて生成される。404の操作は、304の操作と実質的に同一であるか、または類似しており、したがって、本明細書において詳述されない。
406において、それぞれの画像の1つまたはそれ以上の画像特徴が抽出される。それぞれの画像の画像特徴は、事前設定画像特徴テンプレートに基づいて抽出され得る。画像特徴はそれぞれの画像の視覚的特徴、またはそれぞれの画像のスクリーンショット等のそれぞれの画像を表現する任意の他の情報を含み得る。詳細な抽出プロセスは、画像処理技術を介して実装され得る。
1つの例において、404および406の操作は、シーケンス順序を有さず、したがって、404および406の操作は、同時に行われ得るか、または406の操作は、404の操作の前に行われ得る。
408において、それぞれの画像のために生成されるそれぞれのラベルと、それぞれの画像から抽出されるそれぞれの1つまたはそれ以上の画像特徴と、それぞれの画像との間の対応関係が記憶される。408において、それぞれの画像のために生成されるそれぞれのラベルと、それぞれの画像から抽出されるそれぞれの1つまたはそれ以上の画像特徴と、それぞれの画像との間の対応関係は、索引付けを介して記憶され得、画像検索の速度を増加する。例えば、画像検索データベース内のそれぞれの画像に対応するそれぞれのラベルは、索引として使用され得る。逆索引付け方法を用いて、それぞれの画像のために生成されるそれぞれのラベルと、それぞれの画像から抽出されるそれぞれの1つまたはそれ以上の画像特徴と、それぞれの画像との間の対応関係を記憶し得る。それぞれのラベルおよびそれぞれの画像を記憶するための本明細書中に記述される方法は単に例であることを理解されたい。表またはリスト等の対応関係を記憶するために異なる記憶方法を柔軟に設定し得るが、本明細書中には列挙されない。
410において、画像検索データベース内に生成されたラベルを有しない画像があるかどうかが決定される。決定結果が肯定的である場合、プロセスは、402の操作に戻る。そうでない場合、プロセスは打ち切られる。画像検索データベース内の各画像用の索引を構築するためのプロセスは完了する。
402から410の操作を通し、それぞれのラベルが生成され、画像検索データベース内の各画像についてそれぞれの画像特徴が抽出され、そして、それぞれの生成されたラベルと、それぞれの抽出された画像特徴と、およびそれぞれの画像との間の対応関係が記憶される。
画像検索データベース内の各画像用のそれぞれのラベルを創生するための前述の第1および第2の例示の方法は、検索機能、画像検索データベース、または画像検索データベースにアクセスするための機能を有する他のエンティティを有するサーバによって実装し得る。
本開示は、304の操作および404の操作を実装するための例をさらに提供する。それぞれの画像の取得された記述情報に基づいて、それぞれのラベルがそれぞれの画像のために生成される。図5に対応するラベルを生成するための別の例示の方法のフローチャートを図解する。
502において、あるカテゴリに関する1つまたはそれ以上のキーワードが、それぞれの画像の記述情報から抽出される。例えば、ラベルを生成するために取得された記述情報から抽出されるキーワードは、それぞれの画像に対応するそれぞれのエンティティのカテゴリに基づいて設定し得る。例えば、製品のあるカテゴリを有するエンティティの記述情報は、製品名、製品属性、製品の使用法、製品分類等を含み得る。製品名および製品属性は、それぞれの画像の記述情報から抽出されるキーワードとして設定し得、そして製品名および製品属性に対応する情報を抽出するために使用し得る。上に述べられたことは、それぞれの画像に対応する記述情報からラベル生成用の前述のキーワードを抽出するための単なる例であることを理解されたい。いくつかの例においては、それぞれの画像に対応するそれぞれのエンティティの特定タイプに基づいて、画像の記述情報から抽出されるように異なるキーワードを設定し得るが、本明細書中には詳述されない。
504において、それぞれの画像に対応するそれぞれのラベルは、抽出されたキーワードに基づいて生成される。504において、それぞれの画像のそれぞれのラベルを生成するためのアルゴリズムは、記述情報から抽出されるキーワードに基づいて、それぞれのラベルを生成するように事前設定し得る。適用例においては、アルゴリズムは柔軟に設定し得る。画像に対応するラベルを生成するプロセスは完了する。
本開示の第1の実施形態例は、502においてより多くの例を提供し得、それぞれの画像の記述情報から抽出されるキーワードに基づいて、それぞれの画像に対応するそれぞれのラベルを生成する。図6は、それぞれの画像の記述情報から抽出されるキーワードに基づいてそれぞれの画像に対応するそれぞれのラベルを生成するための例示の方法のフローチャートを図解する。
602において、それぞれの画像の記述情報から抽出されるキーワードから、キーワードが選択される。例えば、602において、選択されるキーワードはすべての抽出されたキーワードから無作為に選択し得、あるいは事前設定順序に従って選択し得る。
604において、選択されたキーワードのカテゴリが決定され、そのキーワードに対応するラベルベクトルが、キーワードのカテゴリに対応するアルゴリズムに基づいて生成される。例えば、キーワードのカテゴリに対応するアルゴリズムは、柔軟に設定し得、例えば、抽出されたキーワードの正規化、キーワードに対応する情報のサンプル処理等である。本開示は制限を課さない。
606において、それぞれの画像の記述情報から抽出された各キーワードが選択されたかどうかが決定される。決定結果が肯定的である場合、608の操作が行われる。そうでない場合、プロセスは、602の操作に戻る。
608において、それぞれの画像のそれぞれのラベルは、各キーワードに対応する各ラベルベクトルならびに各キーワードのカテゴリの重み値に基づいて生成される。例えば、それぞれのラベルが生成されるとき、各キーワードのラベルベクトルをその重みで乗じ、すべてのキーワードに関するそれぞれの重みを有するそれぞれのラベルベクトルの積が加算されて、それぞれの画像に対応するそれぞれのラベルを決定する。別の例では、それぞれの画像に対応するそれぞれのラベルは、それぞれの重みを乗じたすべてのキーワードのそれぞれのラベルベクトルの平均値によって決定される。いくつかの他の例では、それぞれの画像に対応するそれぞれのラベルを生成するためのアルゴリズムは、各キーワードに対応するラベルベクトルならびに各キーワードのカテゴリの重みに基づいて柔軟に設定され得る。例えば、それぞれのカテゴリのそれぞれの重みは1として設定され得、これは、それぞれのカテゴリが重み処理を必要としないことを表す。
画像のラベルを生成するために画像の対応する記述情報からキーワードを抽出するプロセスは完了する。
画像検索データベース内の画像についてラベルが生成され、ラベルと画像との間の対応関係が前述の実施形態例における技術に従って記憶された後、サーバは対応関係に基づいて画像検索を実施し得る。図7はサーバによって実施される画像検索のための例示の方法のフローチャートを図解する。
702において、サーバはクライアント端末から画像検索要求を受信する。画像検索要求は、概してユーザによって要求される検索用の画像が含まれ得る(検索用の画像)。
704において、受け取られた画像検索要求に基づいて、サーバは画像検索要求に含まれる検索用の画像の対応情報を取得する。サーバが検索用の画像の対応情報を取得する704の操作は、概して、選択された画像の対応する記述情報を取得する302の操作と同一であるか、または類似している。したがって、詳細は本明細書中では記述されない。
706において、検索用の画像のラベルは、検索用の画像に対応する記述情報に基づいて生成される。検索用の画像のラベルを生成する706の操作は、画像検索データベース内の画像のラベルを生成する304の操作と概して同一あるいは類似する。したがって、詳細は本明細書中では記述されない。
708において、検索用の画像のラベルに対応する1つまたはそれ以上の画像は、ラベルと画像との間の記憶された対応関係に基づいて決定される。例えば、検索用の画像のラベルに基づいて、ラベルと画像との間の記憶された対応関係は、検索用の画像のラベルに対応する1つまたはそれ以上の画像を発見するために検索される。ラベルと画像との間の記憶された対応関係は、ラベル創生の第1の例に従って構築される記憶された対応関係、あるいはラベル創生の第2の例に従って構築される記憶された対応関係であり得る。
710において、サーバは、画像検索要求を送信するクライアント端末に、決定された1つまたはそれ以上の画像を送信する。710においてサーバが決定された画像をクライアント端末に送信する前に、サーバは、1つまたは複数の事前設定規則に基づいて決定された画像を処理し得る。この事前設定規則は柔軟に設定し得る。例えば、事前設定規則はサーバによってあるいはクライアント端末によって設定し得る。事前設定規則は、高から低までの解像度に基づく決定された画像のランク付け、あるいは高から低までの画像に対応するエンティティの属性に基づく画像のランク付けであり得る。詳細は本明細書中では記述されない。
前述のプロセスに基づいて、サーバは、検索用の画像のラベルに基づいて画像検索を行い得る。それぞれのラベルがそれぞれの画像に対応する記述情報に基づいて生成されるため、ラベルは、概して、テキスト形式である。したがって、サーバのこのテキスト検索エンジンは、画像検索を行うために使用され得、それによって、サーバリソースの利用率を改善する。
前述の画像検索プロセスにおいて、ラベルと画像検索用の画像との間の対応関係は、ラベル創生用の第1の例示の方法に従って構築される対応関係、あるいは、ラベル創生の例に関する第2の例示の方法に従い構築される対応関係であり得る。
本開示の第1の実施形態例は、画像検索のための方法を提供する。画像検索データベース内の画像のラベル生成のための方法は、ラベル創生の第2の例に従い生成される対応関係に基づき得る。図8は、サーバによる画像検索用の別の例示の方法のフローチャートを図解する。
802において、サーバはクライアント端末から画像検索要求を受信する。この画像検索要求は、概して検索用の画像を含み得る。
804において、受け取った画像検索要求に基づいて、サーバは、画像検索要求に含まれる検索用の画像の対応情報を取得する。サーバが検索用の画像の対応情報について取得する804の操作は、概して、選択された画像の対応する記述情報を取得する302の操作と同一であるか、または類似している。したがって、詳細は本明細書中では記述されない。
806において、検索用の画像のラベルは、検索用の画像に対応する記述情報に基づいて生成される。検索用の画像のラベルを生成する806の操作は、画像検索データベース内の画像のラベルを生成するための304の操作と概して同一あるいは類似する。したがって、詳細は本明細書中では記述されない。
808において、サーバは検索用の画像の1つまたはそれ以上の画像特徴を抽出する。検索用の画像から画像特徴を抽出する808の操作は、それぞれの画像の画像特徴を生成する406の操作と概して同一であるか、または類似している。したがって、詳細は本明細書において記載されない。さらに、808の操作は、804または806の操作の前に行われ得る。
810において、サーバはそれぞれ、検索用の画像の抽出された画像特徴と1つまたはそれ以上の決定された画像の画像特徴との間の類似度の比較を実施する。例えば、検索用の画像のラベルに対応する1つ以上の画像は、ラベルと画像との間の記憶された対応関係に基づいて決定し得る。
812において、決定された画像は、決定された画像と検索用の画像との間の類似度に基づいて、高から低までそれぞれランク付けされる。
814において、サーバは、画像検索要求を送信するクライアント端末に、決定された画像を送信する。814の操作は、710の操作と概して同一であるか、または類似している。したがって、詳細は本明細書に記載されない。
前述のプロセスに基づいて、サーバは、検索用の画像のラベルに基づいて画像検索を行い得る。それぞれのラベルは、それぞれの画像に対応する記述情報に基づいて生成されるため、ラベルは概してテキスト形式である。したがって、サーバの現行テキスト検索エンジンは画像検索を実施するために使用し得、それにより、サーバリソースの利用率を改善する。さらに、クライアント端末への戻り結果は類似度のランク付けに基づいて処理されるため、画像検索に最も関連する画像がクライアントに優先的に再提出され得る。
本開示の第2の実施形態例は、ラベルを生成するための適用シナリオ例を提供する。電子商取引ウェブサイトは、大量の製品情報を有する情報データベースを持ち得る。各製品はテキスト形式で記述情報を有し得る。テキスト記述情報は、製品の画像と比較的強い相関関係を有するが、何故ならばそれらは両方とも製品の記述であるからである。製品のテキスト記述情報は、製品の画像の記述情報と同等であり得る。したがって、テキストラベルは画像の内容を表現し得る。製品画像検索はテキストラベルに基づいて関連画像を検索し、その後に類似度に基づいて画像をランク付けし得る。
テキスト記述情報(簡単な記述、キーワード、分類、属性等)は製品に対応し、人による批評の後に手作業で加えられるラベルをも含み得る。本開示の実施形態例はそのような記述情報からキーワードを抽出し、テキストラベルを生成する。いくつかの例では、これらのテキストラベルはその相対性程度に従ってランク付けられ得る。1つの例では、製品の異なる次元のラベルを含む一組のラベルは、ベクトル空間を形成する。この次元は、本開示の第1の実施形態例の図5に示されるように、502において設定されるカテゴリであり得る。以下の記述の便宜上、いくつかの符号が以下に定義される。
Tは製品のテキストラベルを表す。
T1は、製品について手作業で加えられたラベルに基づいて生成されるラベルを表す。
T2は、製品内の簡単な記述に基づいて生成されるラベルを表す。
T3は、製品のキーワードに基づいて生成されるラベルを表す。
T4は、製品の分類に基づいて生成されるラベルを表す。
T5は、製品の属性に基づいて生成されるラベルを表す。
w1、w2、w3、w4、w5は、T1、T2、T3、T4、およびT5のそれぞれの重みを表す。
製品のテキストラベルは以下の式に基づいて計算され得る。
T=w1T1+w2T2+w3T3+w4T4+w5T5
製品について手作業で加えられるラベル、製品内の簡単な記述、製品のキーワード、製品の分類、および製品の属性は、502において設定されるカテゴリに対応する。
図9は、本開示の第2の実施形態例に従う製品のテキストラベルを抽出する例示の方法のフローチャートを図解する。
902において、手作業ラベルが入力される。さまざまな理由により、電子商取引ウェブサイト上の製品に関するユーザの記入情報は、しばしば非公式で、しばしば機械識別によってエラーを生じる。したがって、人が製品情報を批評した後、人により手作業でマークされたラベルが存在する。機械による自動ラベル付けに対する訂正として、手作業ラベルがシステムに入力される。製品は、高から低までの相対性に基づいて入力される複数のラベルを有し得る。例えば、製品IDは、索引キーとして使用され得、一組のラベルまたは一連のラベルは、索引値として使用され得る。そのような索引キーおよび索引値は、Trieデータベース等の高性能検索データ構造に記憶され得る。
904において、手作業ラベルが製品IDに従って検索され、ラベルT1が手作業ラベルに基づいて生成される。904の操作は、604の操作と対応し得る。例えば、手作業ラベルが入力されるとき、その手作業ラベルは相対性に従って高から低までランク付けされている。T1の計算式は、以下の通りである。
T1=1/log(ランク+1)
式中、ランクは、ラベルの相対性に従うそれぞれのラベルのランクを表す。前述の式に基づいて、ランク付けは、ラベルT1に正規化される。
906において、ラベルT2は製品の簡単な記述に基づいて生成される。906の操作は、604の操作に対応し得る。例えば、製品の簡単な記述は短くなり得る。自然言語処理(NPL)を簡単な記述を前処理するために使用でき、3種類のワード(コアワード、名詞、および他のワード)を取得する。各ワードはラベルとして使用し得る。ワードの重要性のシーケンスは:コアワード>名詞>他のワード。重み値は、経験に基づいて各タイプにつき設定し得る。
ラベルT2=カテゴリ重み*そのようなカテゴリにおけるそれぞれのワードのワード出現頻度
その後、ラベルT2は、正規化を介して取得される。
908において、ラベルT3は製品のキーワードに基づいて生成される。908の操作は、604の操作に対応する。例えば、ユーザは複数のキーワードを記入し得る。各キーワードは短い長さを有し得る。記入シーケンスは、統計に基づいて高から低まで重要性のシーケンスとして取り扱われる。例えば、重要性の計算の式は、以下の通りであり得る。
1/log(ランク+1)
自然言語処理(NPL)を用いて各キーワードを前処理し、3種類のワード(コアワード、名詞、および他のワード)を取得し得る。各ワードはラベルとして使用され得る。ワードの重要性のシーケンスは、コアワード>名詞>その他のワードである。重み値は、経験に基づいて各種類に設定され得る。
ラベルT3=ランク付け重み*カテゴリ重み*それぞれのワードのワード出現頻度。
その後、ラベルT3は、正規化を介して取得される。
910において、ラベルT4は製品の分類に基づいて生成される。
910の操作は、604の操作と対応し得る。例えば、各製品は分類システムに所属する。この分類システムは階層である。それぞれのラベルは階層の各レベルの分類名から抽出し得る。分類がより詳細になれば、それぞれのラベルはより重要になる。例えば、階層内のラベルの重要性レベルの計算式は、以下の通りであり得る。
1/1og(粒度+1)
粒度=1、2…n、式中、nは任意の整数であり得る。値が小さいほど、粒度はよりきめ細かくなる。
ラベルT4=階層レベルの重要性得点*それぞれのワードのワード出現頻度。
ラベルT4は、そのような正規化を介して取得される。
912において、ラベルT5は製品の属性に基づいて生成される。912の操作は、604の操作に対応し得る。例えば、製品は複数の属性次元を有し得る。各属性次元はそれぞれのラベルに対応する。各ラベルの重要性得点は同一であり得、ラベルベクトルT5を取得するために正規化される。
例えば、前述の操作において、902および904の操作がシーケンス順序を有する場合を除き、904〜912の操作は独立となり得る。操作番号はそれぞれを差別化するために使用し得る。
914において、製品のテキストラベルTはさまざまなラベルに基づいて生成される。
914の操作は、606の操作に対応し得る。例えば、ラベルTは前述の式に基づいて決定し得る。
T=w1T1+w2T2+w3T3+w4T4+w5T5
製品のラベルTが決定された後、ラベルTと製品との間の対応関係が記憶される。
図9に示されるように、ラベルT1、T2、T3、T4、およびT5を生成するキーワードのソースは、製品916の記述情報から到来し得る。902における手作業ラベル入力は、手作業ラベルデータベース918において記憶し得る。T1は手作業ラベルデータベース918からの1つ以上の手作業ラベルに基づいて生成される。
さらに、前述のプロセスに基づいて、画像特徴は製品画像からさらに抽出し得る。例えば、画像処理技術を使用して画像特徴、(形状特徴、色特徴、部分特徴、分配特徴等)を抽出し得る。この画像処理技術は従来型画像処理技術を参照し得る。
画像に対応するラベルが決定され、画像特徴が抽出された後、画像との対応関係を保存し得る。例えば、索引を構築し得る。テキストラベルおよび画像特徴は、索引に含めることができる。テキストラベルを逆索引のキーとして使用し得、製品IDと共に画像内容を索引の値として使用し得る。
本開示の実施形態例中に記述されるテキストラベル生成方法は、各エンティティが画像およびテキスト記述情報に対応し、そしてテキスト記述情報と画像の両方が単一概念を記述するようなシナリオに適応し得る。電子商取引ファイルの例においては、そのような概念は製品である。適用においては、例えば、ユーザは画像をクリックする。サーバは関連テキスト記述情報を検索し、テキストラベルを生成し、テキスト検索エンジンを使って、テキストラベルに基づいて関連製品を検索し、そして類似性に基づいて発見された画像をランク付けすることによって応答し得る。
本開示の第3の実施形態例は、画像を検索するための装置を提供する。例えば、画像検索用の装置は検索サーバに配置し得る。検索サーバにおける画像検索用の装置は、サーバのリソース利用率を改善し得る。
図10は本開示の第3の実施形態例に従って画像を検索するための例示の装置のダイアグラムを図解する。装置はソフトウェア、ハードウエア、あるいはそれらの組み合わせを含み得る。実施形態例においては、図10の装置1000は1つ以上のプロセッサ1002およびメモリ1004を含み得る。メモリ1004はコンピュータ記憶媒体の一例である。
コンピュータ記憶媒体は、コンピュータ実行可能命令、データ構造、プログラムモジュール、あるいは他のデータ等の情報の記憶用の、任意の方法あるいは技術で実装された、揮発性および不揮発性、取り外し可能および取り外し不能媒体を含む。コンピュータ記憶媒体の例に含まれるのは、これらに限定されないが、相変化メモリ(PRAM)、スタティックランダムアクセスメモリ(SRAM)、ダイナミックランダムアクセスメモリ(DRAM)、他のタイプのランダムアクセスメモリ(RAM)、読み取り専用メモリ(ROM)、電気的消去可能プログラム可能読み取り専用メモリ(EEPROM)、フラッシュメモリまたは他のメモリテクノロジー、コンパクトディスク読み取り専用メモリ(CD−ROM)、デジタル汎用ディスク(DVD)または他の光記憶、磁気カセット、磁気テープ、磁気ディスク記憶または他の磁気記憶装置、または演算装置によるアクセス用の情報を記憶するために使用可能な任意の他の非転送媒体である。本明細書中に定義されるように、コンピュータ記憶媒体はモジュール化データ信号およびキャリア波等の一過性媒体を含まない。
メモリ1004は、プログラムユニットまたはモジュールおよびプログラムデータをその中に記憶し得る。図10の例においては、メモリ1004は、その中に、対応関係生成ユニット1006、記述情報取得ユニット1008、ラベル生成ユニット1010、画像決定ユニット1012、および画像供給ユニット1014を記憶し得る。
対応関係生成ユニット1006は、画像検索データベース内の各画像について、それぞれの画像の記述情報に基づいてそれぞれの画像のそれぞれのラベルを生成し、それぞれのラベルとそれぞれの画像との間の対応関係を記憶する。
記述情報取得ユニット1008は、画像検索要求に基づいて、画像検索要求内に含まれる検索用の画像の対応記述情報を取得する。
ラベル生成ユニット1010は、記述情報取得ユニット1008によって取得される検索用の画像に対応する記述情報に基づいて、検索用の画像の対応ラベルを生成する。検索用の画像のラベルを生成するための方法は、対応関係生成ユニット1006によって画像検索データベース内の画像のラベルを生成するための方法と同一であり得る。
画像決定ユニット1012は、対応関係生成ユニット1006によって記憶されるそれぞれのラベルとそれぞれの画像との間の対応関係に基づいて、ラベル生成ユニット1010によって生成される検索用の画像のラベルに対応する1つ以上の画像を決定する。
画像供給ユニット1014は、画像決定ユニット1012によって決定される1つ以上の画像を、画像検索要求を送信するクライアント端末に送信する。
ある例では、記述情報取得ユニット1008は、画像検索要求に含まれる検索用の画像に基づいて、検索用の画像に対応するエンティティを決定し、検索用の画像の記述情報としてそのエンティティの記述情報を取得する。
ある例では、ラベル生成ユニット1010は、検索用の画像の記述情報から定義されたカテゴリのキーワードを抽出し、抽出されたキーワードに基づいて検索用の画像のラベルを生成し得る。
別の例では、ラベル生成ユニット1010は、各定義されたカテゴリの抽出されたキーワードに基づいて、定義されたカテゴリに対応するアルゴリズムを使用してキーワードに対応するラベルベクトルを生成し、そして、各キーワードに対応するラベルベクトルとキーワードの各カテゴリの重み値とに基づいて、検索用の画像のラベルを生成し得る。
ある例では、対応関係生成ユニット1006は、各画像の生成されたラベルを索引として使用し、そして逆索引を使用してラベルと画像との間の対応関係を記憶し得る。
別の例では、対応関係生成ユニット1006は、画像検索データベース内の各画像の画像特徴を抽出し、記憶されたラベルと、ラベルに対応する画像と、画像から抽出された画像特徴との間の対応関係を記憶し得る。
図11に示されるように、装置1000は画像ランク付けユニット1016をさらに含み得る。画像ランク付けユニット1016は、画像供給ユニット1014が、画像検索要求を送信するクライアント端末に決定された画像を送信する前に、受け取られた画像検索要求に基づいて、画像検索要求に含まれる検索用の画像の画像特徴を抽出する。画像ランク付けユニット1016は、検索用の画像の画像特徴を、各決定された画像に対応する画像特徴と比較し、高から低までの、検索用の画像との類似度に従って決定された画像をランク付けする。
各前述のユニットの機能は、本開示の第1の実施形態例に従う画像検索プロセスの関連操作に対応し得る。したがって、詳細は本明細書中では記述されない。
本開示の第3の実施形態例において記述される画像検索用の装置は、コンピュータ実行可能命令で構成される1つ以上のプロセッサを介して実装され得る。当業者は、前述のユニットの分類は多数のユニット分類の1つにすぎないことを理解すべきである。ユニットが他の形で分類されても、またはユニットの分類がない場合であっても、画像検索用の装置が前述の機能を有する限り、そのような装置は依然として本開示の保護範囲内にある。
さらに、本開示の第3の実施形態例内で記述される画像検索用の装置は、本開示の前述の第1の実施形態例において記述されるそれぞれの機能を実装するために、さらに複数のユニットを含み得る。ユニットのそのような分類は本明細書中では記述されない。
本開示によって提供される少なくとも1つの例は、既存のテキスト検索エンジンを再使用し得、それにより、サーバリソースの利用率を改善する。
当業者は、本開示の実施形態は方法、システム、またはコンピュータのプログラミング製品が可能であることを理解すべきである。したがって、本開示はハードウエア、ソフトウェア、または両方の組み合わせによって実装可能である。さらに、本開示は、コンピュータ記憶媒体(ディスク、CD−ROM、光ディスク等を含むが、これらに限定されない)内で実装可能なコンピュータ実行可能またはプロセッサ実行可能命令を含む1つ以上のコンピュータプログラムの形式が可能である。
本開示は、本開示の実施形態の方法、装置(システム)およびコンピュータプログラムのフローチャートおよび/またはブロックダイアグラムを参照して記述される。フローチャートおよび/またはブロックダイアグラムの各流れおよび/またはブロック、ならびに、流れおよび/またはブロックの組み合わせは、コンピュータプログラム命令によって実装可能であることを理解されたい。これらのコンピュータプログラム命令は、一般的コンピュータ、特定コンピュータ、埋め込みプロセッサ、または機械を生成するための他のプログラム可能データプロセッサに対して提供され、フローチャートの1つ以上の流れおよび/またはブロックダイアグラムの1つ以上のブロックを実装する装置が、コンピュータまたは他のプログラム可能データプロセッサによって操作される命令によって生成され得る。
これらのコンピュータプログラム命令は、コンピュータまたは他のプログラム可能データプロセッサに対してある形で操作するように命令可能な他のコンピュータ記憶媒体内にも記憶可能であり、したがって、コンピュータ可読記憶内に記憶される命令は、命令装置を含む製品を生成し、その命令装置は、フローチャートの1つ以上の流れおよび/またはブロックダイアグラムの1つ以上のブロック内で指定された機能を実装するものである。
これらのコンピュータプログラム命令は、コンピュータまたは他のプログラムデータプロセッサ内にもロード可能であり、それにより、コンピュータまたは他のプログラム可能データプロセッサがコンピュータによって実装されるプロセスを生成するために一連の操作ステップを操作可能である。したがって、コンピュータまたは他のプログラム可能データプロセッサ内で操作される命令は、フローチャートの1つ以上の流れおよび/またはブロックダイアグラムの1つ以上のブロック内に指定される機能を実装するためのステップを提供可能である。
実施形態は単に本開示を図解するためのものであり、本開示の範囲を限定することは意図されていない。当業者は、特定の修正および改善は可能であることを理解されるべきであり、当開示の原理から逸脱することなく本開示の保護のもとに考察されるべきである。

Claims (11)

  1. コンピュータ実行可能命令で構成されるプロセッサによって実施される方法であって、
    前記プロセッサは、検索用の画像を含む画像検索要求を受信することと、
    前記プロセッサは、前記画像検索要求に基づいて、検索用の前記画像の記述情報を取得することと、
    前記プロセッサは、検索用の前記画像に対応する前記記述情報に基づいて、簡単なエンティティの記述のラベルベクトルと、エンティティのキーワードのラベルベクトルと、エンティティの分類のラベルベクトルと、エンティティの属性のラベルベクトルとを含むグループから選択される定義されたカテゴリに対応する、1つ以上の正規化されたラベルベクトルを生成することと、
    前記プロセッサは、前記1つ以上の正規化されたラベルベクトルの各々にそれぞれの重みを乗じることと、
    前記プロセッサは、前記1つ以上の正規化されたラベルベクトルに基づいて、検索用の前記画像のラベルを生成することと、
    前記プロセッサは、1つ以上のそれぞれのラベルと画像検索データベース内の1つ以上のそれぞれの画像との間の対応関係に基づいて、検索用の前記画像の前記ラベルに対応する前記画像検索データベース内の1つ以上の画像を決定し、前記画像検索データベース内の前記1つ以上の画像が、前記画像検索データベース内の1つ以上のそれぞれの画像に対応する1つ以上のそれぞれのラベルを生成する前記プロセッサによって前処理されることと、
    前記プロセッサは、前記1つ以上のそれぞれのラベルと前記1つ以上のそれぞれの画像との間の対応関係を記憶することと、
    を含む、方法。
  2. 前記プロセッサは、前記決定された1つ以上の画像を、前記画像検索要求を送信したクライアント端末に送信することをさらに含む、請求項1に記載の方法。
  3. 前記1つ以上のそれぞれのラベルと前記1つ以上のそれぞれの画像との間の前記対応関係を前記記憶することは、
    前記1つ以上のそれぞれの画像に対応する前記1つ以上のそれぞれのラベルを索引として使用することと、
    前記1つ以上のそれぞれのラベルと前記1つ以上のそれぞれの画像との間の前記対応関係を記憶するために逆索引付けを使用することと、
    を含む、請求項1に記載の方法。
  4. 前記1つ以上のそれぞれのラベルと前記1つ以上のそれぞれの画像との間の前記対応関係を前記記憶することは、
    前記画像検索データベース内の前記1つ以上のそれぞれの画像の1つ以上の画像特徴を抽出することと、
    前記1つ以上のそれぞれのラベルと、前記1つ以上のそれぞれのラベルに対応する前記1つ以上のそれぞれの画像と、前記それぞれの画像の前記1つ以上の抽出された画像特徴との間の対応関係を記憶することと、
    を含む、請求項1に記載の方法。
  5. 前記プロセッサは、前記画像検索要求に含まれる検索用の前記画像の画像特徴を抽出することと、
    前記プロセッサは、検索用の前記画像の前記画像特徴を前記決定された画像の画像特徴と比較することと、
    前記プロセッサは、検索用の前記画像の前記画像特徴との類似度に基づいて、前記決定された画像をランク付けすることと、
    をさらに含む、請求項1に記載の方法。
  6. 画像検索データベース内の各画像に関して、それぞれの画像の記述情報に基づいて前記それぞれの画像のそれぞれのラベルを生成し、かつ前記それぞれのラベルと前記それぞれの画像との間の対応関係を記憶する、対応関係を生成するためのプロセッサと、
    画像検索要求に基づいて、前記画像検索要求に含まれる検索用の画像の対応する記述情報を取得する、記述情報を取得するためのメモリのユニットと、
    検索用の前記画像に対応する前記記述情報に基づいて、簡単なエンティティの記述のラベルベクトルと、エンティティのキーワードのラベルベクトルと、エンティティの分類のラベルベクトルと、エンティティの属性のラベルベクトルとを含むグループから選択される定義されたカテゴリに対応する複数の正規化されたラベルベクトルを生成し、前記複数の正規化されたラベルベクトルの各々にそれぞれの重みを乗じ、前記複数の正規化されたラベルベクトルに基づいて、検索用の前記画像の対応するラベルを生成する、ラベル生成のためのメモリのユニットと、
    前記対応関係を生成する前記プロセッサによって記憶される前記それぞれのラベルと前記それぞれの画像との間の前記対応関係に基づいて、ラベル生成によって生成される検索用の前記画像の前記対応するラベルに対応する1つ以上の画像を決定する画像決定のためのメモリのユニットと、
    を備える、装置。
  7. 前記画像決定によって決定される前記1つ以上の画像を、前記画像検索要求を送信するクライアント端末に送信する画像供給のためのメモリのユニットをさらに備える、請求項6に記載の装置。
  8. 対応関係を生成するための前記プロセッサは、索引として各画像の前記生成されたラベルを使用し、かつラベルと画像との間の前記対応関係を記憶するために逆索引を使用する、請求項6に記載の装置。
  9. 対応関係を生成するための前記プロセッサは、前記画像検索データベース内の各画像の画像特徴を抽出し、かつ前記それぞれのラベルと、前記それぞれのラベルに対応する前記それぞれの画像と、前記それぞれの画像から抽出されたそれぞれの画像特徴との間の前記対応関係を記憶する、請求項6に記載の装置。
  10. 画像ランク付けのためのメモリのユニットであって、画像供給のための前記メモリのユニットが、前記画像検索要求を送信する前記クライアント端末に前記決定された画像を送信する前に、受信された前記画像検索要求に基づいて、前記画像検索要求に含まれる検索用の前記画像の画像特徴を抽出し、検索用の前記画像の前記画像特徴を前記決定された画像の各々に対応する画像特徴と比較し、かつ検索用の前記画像との類似度に従って、前記決定された画像を高いランクから低いランクまでランク付けする、画像ランク付けのためのメモリのユニットをさらに備える、請求項7に記載の装置。
  11. 1つ以上のプロセッサによって実行されるときに、前記1つ以上のプロセッサに方法を実施するように指図する、プロセッサ実行可能命令を含む1つ以上のコンピュータ記憶媒体であって、前記方法は、
    検索用の画像を含む画像検索要求を受信することと、
    前記画像検索要求に基づいて、検索用の前記画像の記述情報を取得することと、
    検索用の前記画像に対応する前記記述情報に基づいて、簡単なエンティティの記述のラベルベクトルと、エンティティのキーワードのラベルベクトルと、エンティティの分類のラベルベクトルと、エンティティの属性のラベルベクトルとを含むグループから選択される定義されたカテゴリに対応する、1つ以上の正規化されたラベルベクトルを生成することと、
    前記1つ以上の正規化されたラベルベクトルの各々にそれぞれの重みを乗じることと、
    前記1つ以上の正規化されたラベルベクトルに基づいて、検索用の前記画像のラベルを生成することと、
    1つ以上のそれぞれのラベルと画像検索データベース内の1つ以上のそれぞれの画像との間の対応関係に基づいて、検索用の前記画像の前記ラベルに対応する前記画像検索データベース内の1つ以上の画像を決定することであって、前記画像検索データベース内の前記1つ以上の画像は前処理されることと、を含み、前記決定することは、
    前記画像検索データベース内の前記1つ以上のそれぞれの画像に対応する1つ以上のそれぞれのラベルを生成することと、
    前記1つ以上のそれぞれのラベルと前記1つ以上のそれぞれの画像との間の前記対応関係を記憶することと、
    を含む、1つ以上のコンピュータ記憶媒体。
JP2014543557A 2011-11-25 2012-11-21 画像検索 Active JP6141305B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
CN201110380442.X 2011-11-25
CN201110380442XA CN103136228A (zh) 2011-11-25 2011-11-25 一种图片搜索方法以及图片搜索装置
PCT/US2012/066251 WO2013078307A1 (en) 2011-11-25 2012-11-21 Image searching

Publications (2)

Publication Number Publication Date
JP2014533868A JP2014533868A (ja) 2014-12-15
JP6141305B2 true JP6141305B2 (ja) 2017-06-07

Family

ID=47263610

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2014543557A Active JP6141305B2 (ja) 2011-11-25 2012-11-21 画像検索

Country Status (6)

Country Link
US (1) US9460117B2 (ja)
EP (1) EP2783310A1 (ja)
JP (1) JP6141305B2 (ja)
CN (1) CN103136228A (ja)
TW (1) TW201322021A (ja)
WO (1) WO2013078307A1 (ja)

Families Citing this family (60)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9111012B2 (en) * 2012-11-26 2015-08-18 Accenture Global Services Limited Data consistency management
US10223454B2 (en) * 2013-05-01 2019-03-05 Cloudsight, Inc. Image directed search
US10831820B2 (en) * 2013-05-01 2020-11-10 Cloudsight, Inc. Content based image management and selection
CN104239336B (zh) * 2013-06-19 2018-03-16 华为技术有限公司 一种图像筛选方法、装置及终端
US11250203B2 (en) 2013-08-12 2022-02-15 Microsoft Technology Licensing, Llc Browsing images via mined hyperlinked text snippets
CN104424257A (zh) * 2013-08-28 2015-03-18 北大方正集团有限公司 信息检索装置和信息检索方法
CN103714125A (zh) * 2013-12-11 2014-04-09 广州亿码科技有限公司 一种搜索方法
CN103744860A (zh) * 2013-12-12 2014-04-23 中国科学院深圳先进技术研究院 一种查找图片的方法、装置及手机
CN103699679A (zh) * 2013-12-31 2014-04-02 上海华勤通讯技术有限公司 目标对象的信息检索方法及信息检索设备
WO2015130185A1 (ru) * 2014-02-26 2015-09-03 Андрей Юрьевич ЩЕРБАКОВ Способ индексирования, сравнения и поиска изображений в компьютерной системе
CN103995848B (zh) * 2014-05-06 2017-04-05 百度在线网络技术(北京)有限公司 图片搜索方法及装置
US10013436B1 (en) * 2014-06-17 2018-07-03 Google Llc Image annotation based on label consensus
US20160139777A1 (en) * 2014-11-18 2016-05-19 Sony Corporation Screenshot based indication of supplemental information
CN104484438A (zh) * 2014-12-23 2015-04-01 小米科技有限责任公司 图片处理方法及装置
CN104504110B (zh) * 2014-12-30 2019-05-03 百度在线网络技术(北京)有限公司 搜索方法和装置
CN104504109B (zh) * 2014-12-30 2017-03-15 百度在线网络技术(北京)有限公司 图片搜索方法和装置
CN104462590B (zh) * 2014-12-30 2019-03-12 百度在线网络技术(北京)有限公司 信息搜索方法及装置
US9760792B2 (en) 2015-03-20 2017-09-12 Netra, Inc. Object detection and classification
US9922271B2 (en) 2015-03-20 2018-03-20 Netra, Inc. Object detection and classification
US9852131B2 (en) 2015-05-18 2017-12-26 Google Llc Techniques for providing visual translation cards including contextually relevant definitions and examples
CN104899744B (zh) * 2015-06-29 2018-03-16 汪新淮 钱币邮票收藏品交易系统与交易方法
CN105138680A (zh) * 2015-09-14 2015-12-09 郑州悉知信息科技股份有限公司 关键词分类方法、装置及产品搜索方法、装置
CN105138681A (zh) * 2015-09-15 2015-12-09 成都品果科技有限公司 基于空间坐标定位的图片搜索方法及系统
CN106570714B (zh) * 2015-10-08 2021-01-15 阿里巴巴集团控股有限公司 一种搭配对象图片的推荐方法、映射关系建立方法及装置
CN105389333B (zh) * 2015-10-13 2019-04-09 深圳市红坚果科技有限公司 一种检索系统构建方法及服务器架构
CN105468716A (zh) * 2015-11-19 2016-04-06 努比亚技术有限公司 图片查找装置、方法及终端
CN106779791B (zh) * 2015-11-25 2021-01-15 阿里巴巴集团控股有限公司 一种搭配对象图片组合的生成方法及装置
CN105528428A (zh) * 2015-12-09 2016-04-27 深圳市金立通信设备有限公司 一种图像显示方法及终端
US10599731B2 (en) * 2016-04-26 2020-03-24 Baidu Usa Llc Method and system of determining categories associated with keywords using a trained model
CN106126647A (zh) * 2016-06-24 2016-11-16 宇龙计算机通信科技(深圳)有限公司 图片搜索方法及装置
CN106202316A (zh) * 2016-07-01 2016-12-07 传线网络科技(上海)有限公司 基于视频的商品信息获取方法及装置
CN106779304A (zh) * 2016-11-24 2017-05-31 广州宝钢南方贸易有限公司 一种面向钢材贸易的内部抢单系统及方法
CN108268571A (zh) * 2017-01-04 2018-07-10 腾讯科技(深圳)有限公司 一种特征筛选方法及装置
CN107861970A (zh) * 2017-09-15 2018-03-30 广州唯品会研究院有限公司 一种商品图片搜索方法和装置
CN107862239A (zh) * 2017-09-15 2018-03-30 广州唯品会研究院有限公司 一种结合文本与图片进行图片识别的方法及其装置
CN107861971A (zh) * 2017-09-15 2018-03-30 广州唯品会研究院有限公司 一种商品搜索方法和装置
CN110019903A (zh) * 2017-10-10 2019-07-16 阿里巴巴集团控股有限公司 图像处理引擎组件的生成方法、搜索方法及终端、系统
CN107741972A (zh) * 2017-10-12 2018-02-27 广东欧珀移动通信有限公司 一种图片的搜索方法、终端设备及存储介质
CN107679208A (zh) * 2017-10-16 2018-02-09 广东欧珀移动通信有限公司 一种图片的搜索方法、终端设备及存储介质
CN107590291A (zh) * 2017-10-30 2018-01-16 广东欧珀移动通信有限公司 一种图片的搜索方法、终端设备及存储介质
CN107895050A (zh) * 2017-12-07 2018-04-10 联想(北京)有限公司 图片搜索方法及系统
CN108228826A (zh) * 2018-01-02 2018-06-29 联想(北京)有限公司 一种信息查找方法及电子设备
CN108256010A (zh) * 2018-01-03 2018-07-06 阿里巴巴集团控股有限公司 内容推荐方法及装置
US10592782B2 (en) * 2018-01-22 2020-03-17 International Business Machines Corporation Image analysis enhanced related item decision
CN110309464A (zh) * 2018-03-01 2019-10-08 北京京东尚科信息技术有限公司 信息展示系统、方法及装置
CN108596280A (zh) * 2018-04-27 2018-09-28 佛山市日日圣科技有限公司 用于文献搜索的图片识别方法
TWI693524B (zh) * 2018-05-22 2020-05-11 正修學校財團法人正修科技大學 專屬個性化圖片搜尋優化方法
CN108717464A (zh) * 2018-05-31 2018-10-30 中国联合网络通信集团有限公司 照片处理方法、装置及终端设备
CN108848270B (zh) * 2018-06-29 2021-05-11 维沃移动通信(深圳)有限公司 一种截屏图像的处理方法和移动终端
CN109635135A (zh) * 2018-11-30 2019-04-16 Oppo广东移动通信有限公司 图像索引生成方法、装置、终端及存储介质
CN109840288A (zh) * 2019-02-21 2019-06-04 北京一品智尚信息科技有限公司 图片检索方法、设备和存储介质
CN111753181A (zh) * 2019-03-28 2020-10-09 北京京东尚科信息技术有限公司 基于图像的搜索方法、装置、服务器、客户端及介质
CN112131417B (zh) * 2019-06-25 2024-04-02 北京百度网讯科技有限公司 图像标签生成方法及装置
CN112347289A (zh) * 2019-08-06 2021-02-09 Tcl集团股份有限公司 一种图像管理方法及终端
CN110598038A (zh) * 2019-09-27 2019-12-20 京东方科技集团股份有限公司 画作标签生成方法及电子设备
CN110765301B (zh) * 2019-11-06 2022-02-25 腾讯科技(深圳)有限公司 图片处理方法、装置、设备及存储介质
CN111522967B (zh) * 2020-04-27 2023-09-15 北京百度网讯科技有限公司 知识图谱构建方法、装置、设备以及存储介质
CN112860929A (zh) * 2021-02-09 2021-05-28 北京百度网讯科技有限公司 一种图片搜索方法、装置、电子设备及存储介质
CN114741550B (zh) * 2022-06-09 2023-02-10 腾讯科技(深圳)有限公司 图像搜索方法、装置、电子设备和计算机可读存储介质
CN115168637B (zh) * 2022-06-17 2023-03-17 杭州晶彩数字科技有限公司 一种图片添加标签方法、系统及存储介质

Family Cites Families (29)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE69942901D1 (de) * 1998-04-02 2010-12-16 Canon Kk Einrichtung und Verfahren zum Suchen von Bildern
KR100367932B1 (ko) * 1999-11-26 2003-01-14 주식회사 메디슨 초음파영상검색장치
US7076498B2 (en) 2002-06-10 2006-07-11 International Business Machines Corporation Method and apparatus for processing user input selecting images from a web page in a data processing system
US8032483B1 (en) * 2004-12-03 2011-10-04 Google Inc. Using game responses to gather data
US7660468B2 (en) * 2005-05-09 2010-02-09 Like.Com System and method for enabling image searching using manual enrichment, classification, and/or segmentation
JP2007134934A (ja) * 2005-11-10 2007-05-31 Matsushita Electric Ind Co Ltd 映像情報検索システムおよび映像監視システム
US8341112B2 (en) * 2006-05-19 2012-12-25 Microsoft Corporation Annotation by search
JP2008004081A (ja) * 2006-05-23 2008-01-10 Hitachi High-Technologies Corp 画像検索装置、画像検索システム、画像検索方法、および画像検索方法を実行するためのプログラム
JP5098253B2 (ja) * 2006-08-25 2012-12-12 コニカミノルタエムジー株式会社 データベースシステム、プログラム、及びレポート検索方法
US20080126191A1 (en) 2006-11-08 2008-05-29 Richard Schiavi System and method for tagging, searching for, and presenting items contained within video media assets
US20090024577A1 (en) 2007-07-20 2009-01-22 Gregory Prestel System and method for organizing, posting and searching information on a network
CN101458695A (zh) * 2008-12-18 2009-06-17 西交利物浦大学 基于关键词和内容特征的混合图片索引构建和查询方法及其应用
CN101458711B (zh) * 2008-12-30 2011-01-05 国家电网公司 一种图形描述和变换方法及系统
CN101782904A (zh) * 2009-01-21 2010-07-21 神达电脑股份有限公司 自动替照片加入标签的个人导航装置及方法
US8452794B2 (en) * 2009-02-11 2013-05-28 Microsoft Corporation Visual and textual query suggestion
WO2010101187A1 (ja) 2009-03-04 2010-09-10 公立大学法人大阪府立大学 画像データベースの作成方法、作成プログラム及び画像検索方法
WO2010139091A1 (en) 2009-06-03 2010-12-09 Google Inc. Co-selected image classification
US9384214B2 (en) * 2009-07-31 2016-07-05 Yahoo! Inc. Image similarity from disparate sources
CN101694657B (zh) * 2009-09-18 2011-11-09 浙江大学 面向Web2.0标签图片共享空间的图片检索聚类方法
US8503739B2 (en) 2009-09-18 2013-08-06 Adobe Systems Incorporated System and method for using contextual features to improve face recognition in digital images
US20110072047A1 (en) * 2009-09-21 2011-03-24 Microsoft Corporation Interest Learning from an Image Collection for Advertising
US9710491B2 (en) * 2009-11-02 2017-07-18 Microsoft Technology Licensing, Llc Content-based image search
US9323784B2 (en) 2009-12-09 2016-04-26 Google Inc. Image search using text-based elements within the contents of images
CN102110122B (zh) 2009-12-24 2013-04-03 阿里巴巴集团控股有限公司 一种建立样本图片索引表和图片过滤、搜索方法及装置
US8631004B2 (en) * 2009-12-28 2014-01-14 Yahoo! Inc. Search suggestion clustering and presentation
CN101826102B (zh) * 2010-03-26 2012-07-25 浙江大学 一种图书关键字自动生成的方法
US8401282B2 (en) 2010-03-26 2013-03-19 Mitsubishi Electric Research Laboratories, Inc. Method for training multi-class classifiers with active selection and binary feedback
CN101853297A (zh) 2010-05-28 2010-10-06 英华达(南昌)科技有限公司 一种在电子设备中快速获得期望图像的方法
US8898169B2 (en) * 2010-11-10 2014-11-25 Google Inc. Automated product attribute selection

Also Published As

Publication number Publication date
TW201322021A (zh) 2013-06-01
CN103136228A (zh) 2013-06-05
JP2014533868A (ja) 2014-12-15
EP2783310A1 (en) 2014-10-01
WO2013078307A1 (en) 2013-05-30
US20130138636A1 (en) 2013-05-30
US9460117B2 (en) 2016-10-04

Similar Documents

Publication Publication Date Title
JP6141305B2 (ja) 画像検索
US10452691B2 (en) Method and apparatus for generating search results using inverted index
US10528907B2 (en) Automated categorization of products in a merchant catalog
US8918348B2 (en) Web-scale entity relationship extraction
JP5860456B2 (ja) 検索語重み付けの決定および利用
JP5736469B2 (ja) ユーザ意図の有無に基づく検索キーワードの推薦
US7849081B1 (en) Document analyzer and metadata generation and use
US8560539B1 (en) Query classification
US11609920B2 (en) Ranking and presenting search engine results based on category-specific ranking models
US20080065602A1 (en) Selecting advertisements for search results
US20110246457A1 (en) Ranking of search results based on microblog data
US20060095852A1 (en) Information storage and retrieval
JP2013541793A (ja) マルチモード検索クエリー入力手法
EP1426882A2 (en) Information storage and retrieval
US20130339369A1 (en) Search Method and Apparatus
US11663280B2 (en) Search engine using joint learning for multi-label classification
US20180060427A1 (en) Navigating a Taxonomy Using Search Queries
KR100954842B1 (ko) 카테고리 태그 정보를 이용한 웹 페이지 분류 방법, 그 시스템 및 이를 기록한 기록매체
CN104239552A (zh) 生成关联关键词、提供关联关键词的方法及系统
US8750629B2 (en) Method for searching and ranking images clustered based upon similar content
WO2021055868A1 (en) Associating user-provided content items to interest nodes
Hall et al. Enabling the discovery of digital cultural heritage objects through wikipedia
Zhou et al. Evaluating large-scale distributed vertical search
CN112270177A (zh) 基于内容相似性的新闻封面配图方法、装置及计算设备
EP3580666A1 (en) Visual leaf page identification and processing

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20151022

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20160708

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20160802

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20161031

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20161227

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20170323

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20170404

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20170502

R150 Certificate of patent or registration of utility model

Ref document number: 6141305

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250