JP2018523251A - カタログ内の製品を検索するためのシステムおよび方法 - Google Patents

カタログ内の製品を検索するためのシステムおよび方法 Download PDF

Info

Publication number
JP2018523251A
JP2018523251A JP2018526283A JP2018526283A JP2018523251A JP 2018523251 A JP2018523251 A JP 2018523251A JP 2018526283 A JP2018526283 A JP 2018526283A JP 2018526283 A JP2018526283 A JP 2018526283A JP 2018523251 A JP2018523251 A JP 2018523251A
Authority
JP
Japan
Prior art keywords
products
query
searching
catalog
search
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2018526283A
Other languages
English (en)
Inventor
ヌニェス、ファン マヌエル バリオス
ヌニェス、ファン マヌエル バリオス
リサナ、マウリシオ エドゥアルド パルマ
リサナ、マウリシオ エドゥアルド パルマ
ロンド、ホセ マヌエル サアベドラ
ロンド、ホセ マヌエル サアベドラ
Original Assignee
オランド エセ.ア.
オランド エセ.ア.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by オランド エセ.ア., オランド エセ.ア. filed Critical オランド エセ.ア.
Publication of JP2018523251A publication Critical patent/JP2018523251A/ja
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/58Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/583Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/248Presentation of query results
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/12Protocols specially adapted for proprietary or special-purpose networking environments, e.g. medical networks, sensor networks, networks in vehicles or remote metering networks

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Library & Information Science (AREA)
  • Computational Linguistics (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Health & Medical Sciences (AREA)
  • Evolutionary Computation (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本発明は、カタログ内の製品を検索するためのシステムおよびその関連方法に関し、本発明は、ユーザがクエリを生成し、クエリを処理装置に送信し、結果を表示することを可能にするアプリケーションを有するネットワーク接続されたデバイスであって、クエリが検索を所望する製品の視覚的な例である、デバイスと、ユーザからのクエリを受信し、カタログ内の検索を解決する処理装置であって、(i)視覚特徴抽出コンポーネント、(ii)自己ラベル付けコンポーネント、(iii)類似性に基づく検索コンポーネント、および(iv)結果グループ化コンポーネントを含む、処理装置と、1つ以上の店舗からのカタログ製品からの情報を絶えず維持するデータ記憶装置と、を含む。

Description

本発明は、小売業界およびカタログ内の製品を検索することに関する。本発明は、特に画像、手書きの画像(スケッチ)、ビデオまたはテキストを介してデジタルカタログ内の製品を検索するための技術に関する。
従来技術は、カタログ内で検索しようと意図された一連の技術について述べている。例えば、文献WO2013/184073A1は、身体の部分を検出することに基づいて、衣類の検索に限定した技術について述べている。この文献は、デザイン、構成、住宅、ファッション等の品目を含めた製品の検索メカニズムを、概して提供していない。
文献US2012/0054177は、スケッチを表して検索するための方法を開示しているが、この方法は、カタログ検索の場合を意図されていない。この方法は、クエリの中の、およびデータベースからの画像の中の「凸角曲線」に基づく。スケッチと画像との間の類似性は、曲線の複数点の位置および向きに関する情報を使用する面取り距離の変形を使って「凸角曲線」同士間の類似性を測定することに基づく。
さらに、文献US2011/0274314は、ビデオ内の衣類を認識するためのアプリケーションに関する。最初、人の登場は、顔検出アルゴリズムによって検出され、次いで切り出し処理が、L*a*b*色空間上の領域による成長に基づく方策を使って実行される。衣類を認識するため、SVMモデルが、HOG、BoWおよびDCT等の様々な画像記述子と一緒にトレーニングされる。この文献は、衣類の分類に関する意味コンポーネントを示しているが、いかなる種類の製品を検索することについても焦点を当てていない。
別の種類の解決策が、文献US2014/0328544A1により示されている。この文献は、スケッチラベル付け、および以前ラベル付けされた一組の画像を利用する認識システムについて述べている。次のように、このシステムは、入力スケッチをデータセットからの一組の画像と関連付け、この関連付けは、類似性に基づいて検索システムにより実行され、次いでその画像と関連付けられたラベルまたはテキストを使用してその入力スケッチに対する最善のラベルを判定する確率的なモデルを生成する。この提案は、カタログ内の製品を検索することをねらいとしていない。
文献US2015/0049943A1は、画像の特徴を表す3つの種類の構造を使って画像検索のアプリケーションを示している。この解決策は、意味分類コンポーネントを欠いており、またスケッチおよびビデオに基づいた検索を含んでいない。
文献US006728706B2により示された解決策は、各製品が特徴ベクトルにより表されているカタログ内の製品を検索するためのシステムに関連し、その類似性は、距離関数により取得される。この文献は、分類器を使用して入力画像の確度の高いカテゴリを予測し、確度の高いカテゴリ内およびすべてのカテゴリ内で検索した結果を組み合わせることについて述べていない。
文献US2005/0185060A1およびUS007565139B2は、携帯写真に基づく画像検索システムについて述べている。この画像検索システムは、博物館またはシティガイドの一部として考えられている。この写真技術がテキストを含む場合、光学文字認識が実行され、またこの写真技術が顔を含む場合、顔の識別が実行される。これらの文献は、対象物が、光学文字認識を必要とせず、視覚特徴を使って検索されるカタログからの製品に基づいているシステムについて述べていない。
現在のインターネット販売のシナリオでは、ある具体的な製品を購入することに興味を持つ潜在的な顧客は、3つの選択肢を持つ。すなわち、1)その店舗のサイトに入って、そのカタログのカテゴリをあちこち見てまわり、関係ありそうな各カテゴリ内の製品リストをあちこち見てまわること、2)その店舗のサイトに入って、キーワードに基づく製品検索機能を使うこと、および3)インターネット検索エンジン(例えば、Google(登録商標))に入って、キーワードを使って検索し、取得された結果の中で、その製品を申し込むことに関心のある店舗のページを選択すること、である。
一方で、(キーワードに基づく)選択肢2および3は、ある一定の種類の製品に対しては、極めて効果的であり得る。例えば、誰かがある一定の容量およびブランドのハードディスクを購入したい場合、気に入った店舗がそのハードディスクを販売しているか否かを判定するには、3つのキーワードで十分であり得る。それにもかかわらず、この注目点が多くの製品に対して効果的である場合でさえも、長いテキスト列をスマートフォンに入力することは、失望させる可能性があることに留意しなければならない。例えば、あなたが製品「粉末低脂肪乳、400グラム」の店舗内の価格を見積もりたい場合、店舗の検索エンジンにこれらの単語を記入することで十分であるが、多くのユーザは、どちらかといえばこの単語の記入も避けたいであろう。このことは、現在、オートフィルアプリケーションおよび音声テキスト化アプリケーションを開発している理由の1つである。
さらに、その製品が、装飾、衣類、家具および他の品目の場合と同じように、その外観またはデザインに関する特徴を有する場合、選択肢2および3は効果的ではない。例えば、黒い線の入った緑色で卵形の吊り下げランプを検索するため、総称的なキーワード「ランプ」は多くの検索結果をもたらすが、これに対してより具体的な単語である「卵形」または「緑色」は、その製品がそれらの単語と一緒にラベル付けされていなかった場合、何も見つけることができないことがある。この場合、カテゴリによりそのカタログにざっと目を通す選択肢(選択肢1)は、概して、単なる実行可能な別の選択肢にすぎず、その理由は、単語ベースの検索は、各製品がその外観の完全な記述を有していること、およびそのユーザがその製品を検索するためのそれらの単語を使用することを必要とするからである。残念ながら、このような完璧なラベル付けは、ラベル付けのコスト、および人々が様々な対象物を記述する基となる条件が多すぎるという理由から、非現実的である。
本発明は、画像、手書きの画像(スケッチ)、ビデオまたはテキストを介してデジタルカタログ内の製品を検索するための技術に関する。本発明の目標は、店舗カタログ内の製品を見つけるための、効率的で、効果的で、タイミングよく、かつ極めて魅力的な技術をユーザに提供することである。本発明の技術は、即時の結果を得るのにユーザによる努力をほとんど必要としないため効率的であり、該当製品が見つかるのを可能にするため効率的であり、ユーザは望むときにはいつでも彼らのスマートフォン上にそのアプリケーションを使用することができるためタイミングがよく、そしてこの技術が楽しい経験を提供するため極めて魅力的である。さらに、この技術は、高い表現力を持つことによって特徴付けられており、その理由は、その検索が画像自体の内容を分析することに基づいているからである。視覚特徴と以前にトレーニングされた分類器により自動的に生成される記述ラベルとを組み合わせて使う場合、提案された技術により、ユーザが取り込んだ画像に基づいたカタログ内の製品検索が可能となり、検索結果に対する効果の度合いが高い。本発明は、ユーザが、所望の製品の写真を撮り、図(スケッチ)を作成し、またはユーザが見つけたい製品を含むシーンを録画することができるように、モバイルデバイスの特徴をうまく利用する。さらに、ユーザは、必要に応じて、その検索をある一定の製品または製品のカテゴリに限定するようにテキストを追加することができる。
本発明は、使い方のカテゴリが変更されることを可能にし、それらのカテゴリのいくつかは、以下に述べられる。
1.ラベルによる検索:ユーザは、ある具体的な製品を検索し、そのラベルまたはバーコードの写真を撮る。例えば、そのユーザは、ワインラベルまたはジュース瓶の写真を撮ることができ、そのシステムは、検索されている製品、ならびにその店舗価格を正確に送り返すであろう。この方法は、はるかにより使い勝手がよく、「粉末低脂肪乳、400グラム」に対する上述の場合のように、複数のキーワードをタイピング入力することと比較して、優れたユーザ体験をもたらす。
2.写真による検索:ユーザは、似たようなどのような製品がカタログの中に存在するかどうかを知るため、そのユーザが関心を持つデザインを有する製品の写真を撮る。例えば、あるユーザが、パイロット部門で話す花瓶の写真を撮ると、そのシステムは、同じ色の組み合わせを有する製品、様々な形状および色の花瓶、視覚的に似たようなパターンを有する他の製品等のいくつかの条件に基づいて類似する様々な製品を表示する。
3.スケッチによる検索:ユーザは、ある具体的なデザインを有する製品を検索したいが、写真を撮る対象物を有していないため、タッチスクリーン式デバイス上にその製品のおおよその形状を描くことができる。システムは、入力された形状に類似する全体形状を有する製品をそのユーザに示し、それらの製品は、そのスケッチと同じ方位を持つ端部を有する。
4.ビデオによる検索:ユーザは、1つ以上の関心のある製品を含むシーン、例えば寝室または台所を録画する。システムは、そのカタログ内で検索し、そのシーンに登場する製品に最も類似する製品をそのカタログから表示する。
技術的便益
本発明は、以前に説明されたこの種類の課題を解決する従来の方法と比較して、以下の便益を含む。
− 高い表現力:本発明は、クエリとして画像自体の内容を使用し、これに加えて補足としてキーワードを含むことができ、このことがより大きな表現力を提供する。スケッチを使った伝達は、人と人との意思疎通の自然な形式であり、すなわち単純かつ高度に記述的であり、ユーザが検索したいものの構成要素を表す。
− 高速:ユーザは、そのユーザが望むものを記述するための最善のテキストをタイピング入力する必要がない。そのユーザは、単に自身のデバイス上にあるカメラの正面に製品を置くか、またはスケッチを描くだけである。検索時間は数秒であるため、ユーザは直ちに結果を得ることができる。
− 効果的:高い記述的なクエリを使用しているため、検索の質は、より高い。このことは、そのシステムにより、高い割合でそのクエリから該当対象物が抽出されることができることを意味し、そのことによりキーワード検索エンジンと比較してオンライン販売の増大を可能にする。
− タイムリ:本発明は、モバイル技術を使用するため、本発明者の技術は、購入の機会が生じたそのときに、いつでも入手可能である。例えば、ある消費者が関心のある製品を見るまたは想像する場合、その消費者は、提供された技術を使用し、お気に入りの店舗でその製品を検索する。
− ユーザに魅力的:その使いやすさ、ならびに図面作成および驚きの検索結果によるファン効果によって、本発明を極めて魅力的にし、ユーザに対して楽しい体験をもたらす。
図1は、検索システムの全体図を示す図である。 図2は、システムの準備段階を示す図である。 図3は、ユーザクエリを解決するためのステップを示す図である。 図4は、視覚+テキストクエリを解決するためのステップを示す図である。 図5は、視覚クエリを解決するためのステップを示す図である。 図6は、自己記述視覚検索モジュール(320)のコンポーネントを詳述する図である。 図7は、一般視覚検索モジュール(330)のコンポーネントを詳述する図である。
本発明は、カタログ内の製品を検索するためのシステムおよびその関連方法に関する。
製品検索用システムの全体的な枠組みは、ユーザの相互関係、少なくとも1つの処理装置、および1つ以上の店舗からの少なくとも1つの製品カタログを含む(図1参照)。ユーザ(100)は、処理装置(110)のネットワークを介して処理装置(200)に製品検索クエリ(300)を送信する。その製品検索エンジンは、複数の店舗(120)からの少なくとも複数の製品カタログを含むデータ記憶装置(121)を維持する。そのユーザは、デバイス(110)上のアプリケーションを介してクエリを作り出して送信し、そのデバイスは、ネットワーク接続を有し、写真を撮ることができ、スケッチをすることができ、および/またはビデオを録画することができる。
データ記憶装置(121)の製品カタログは、販売用店舗により提供された一組の製品を含む。各製品は、記述および1つ以上のサンプル画像により表される。1つのカテゴリは、1つの製品グループに対応する。これらのカテゴリは、各店舗により定義された条件に応じてカタログ内に製品を編成する。カタログ内の各製品は、1つ以上のカテゴリに属する。
システムの準備段階中(図2参照)、製品検索システムは、店舗からデータベースに製品を追加する。テキスト特徴抽出モジュール(280)は、製品の記述を処理し、各製品に対するテキスト特徴ベクトル(505)を作り出す。視覚特徴抽出コンポーネントまたはモジュール(210)は、画像を処理し、各製品に対する視覚特徴ベクトル(510)を生成する。自己ラベル付けコンポーネントまたはモジュール(230)は、画像を処理し、対象物の色、形状、種類等のいくつかの条件に応じて類似の視覚特徴を示す製品を一緒にグループ化するラベルを作り出す(515)。
視覚特徴抽出モジュール(210)は、SIFT、SURF、HOG、またはいくつかの変形体等の局所記述アルゴリズムを使って視覚特徴ベクトルを計算し、このアルゴリズムは、ある一定の形状変形、見通しの変化、および閉鎖に直面しても不変性をもたらす。ある画像に対して計算された局所記述子は、コードブックを使ってコード化されまたは集約され、視覚特徴ベクトルまたは製品画像を取得する。このコードブックは、K平均法(K−Means)のようなグループ化アルゴリズムまたはクラスタ化アルゴリズムを、カタログ内のすべての画像の局所記述子のうちのあるサンプルに適用した結果である。このようにして、そのコードブックは、クラスタ化アルゴリズムにより取得されたK中心に対応する。
局所記述子のグループ化により、単一特徴ベクトルが画像ごとに生成されることが可能になる。グループ化処理の1つの実施形態は、バッグオブフィーチャー(BoF)法を使用する。Iが画像であり、L={x,x,...,xNI}が、画像IのN個の局所記述子の組である場合、BoF法の下で、Iの各記述子が、そのコードブックの大きさに等しい長さのコードを使ってコード化される。したがって、xの場合のコードは、次式のように得られる。

ここで、gは核(kernel)関数であり、d(.)は距離の関数である。この核関数は、距離の値が大きいほどgの値が小さくなるように選択される。l個の特徴のベクトルは、l個の局所記述子に関して生成されたコードに対するプーリング(pooling)法を使って計算される。1つの実施形態は、合計に基づくプーリングを使用し、この方法は、局所記述子コードを合計することによりl個の特徴のベクトルを判定する。
別の集約の実施形態は、VLAD(局所集約記述子のベクトル(Vector of Locally Aggregated Descriptor))であり、それは局所記述子に関するより多くの情報を考慮している。この場合、残差ベクトルは、とりわけ各局所記述子およびコードブックを定義する重心から取得される。このため、xの残差ベクトルは、重心jに関して、次式のように定義される。
次いで、この残差ベクトルは、各クラスタに関して次のように累積される。
l個の特徴ベクトルを生成するため、VLADに基づいて、次第に増加する残差ベクトルは、以下に示されるように、一緒に結合される。
上述のように、視覚特徴抽出モジュール(210)は画像Iを受信し、特徴ベクトルDを生成する。
自己ラベル付けモジュール(230)は、様々な分類条件に基づいて画像を分類する。このコンポーネントの1つの実施形態は、3つの条件、すなわち色、形状および種類を定義する。このため、自己ラベル付けモジュールは、各条件に対して1つの3つの分類モデルから構成される。各モデルは、教師あり学習の処理を介して「分類モデル生成」コンポーネント(220)により生成され、この処理は、トレーニングする(002)ための一組の製品画像を必要とする。トレーニングの組の中で、各画像は、確立された分類条件に基づいて1つ以上のカテゴリと関連付けられる。トレーニング処理の場合、その画像の視覚特徴が使用される。これらの特徴は、同じ分類器を使って手入力でまたは自動的に定義されてもよい。このコンポーネントの1つの実施形態では、特徴が、例えば畳み込み神経回路網を使うことによって自動的に学習される分類モデルを使用する。別の実施形態では、コンポーネントは、特徴が手入力で定義される識別モデルを使用してもよい。これらのモデルの例としては、サポートベクターマシン(SVM)、神経回路網、K近傍法(KNN)およびランダムフォレストとすることができる。トレーニング処理(002)で生成されたモデルは、「分類器モデル」コンポーネント(401)に記憶される。
テキスト特徴抽出モジュール(280)は、製品の記述を処理し、tf−idf(単語頻度−逆文書頻度:term frequency−inverse document frequency)ベクトルモデルに基づいて記述子を生成する。それらの記述のすべての単語は、処理され、冠詞および前置詞等の頻繁に繰り返される(ストップリスト)または意味のない単語を除去する。それらの単語の語根が取得され、各語根の出現頻度が、各製品の記述テキストに対して計算される。各語根の頻度は、この語根が出現する製品記述の逆数の対数を乗ぜられる。
それらの製品に対して計算されたテキスト特徴ベクトルおよび視覚特徴ベクトルは、データベース(402)に記憶される。そのテキストベクトルに対して転置インデックス構造が計算され、その転置インデックス構造は、各単語に対してその単語が含む製品記述のリストが含まれる表を作り出すことで構成される。これにより、ユーザにより入力されたある一定の単語を含むすべての製品を判定することが可能になる。視覚特徴ベクトルの場合、多次元インデックスにより、クエリベクトルに最も近いベクトルを効率よく判定することが可能になる。
図3は、本発明の1つの実施形態に基づくシステムの動作図を示す。1人のユーザ(100)が、モバイルデバイス(110)上のアプリケーションを使ってクエリ(300)を作り出す。そのクエリは、そのユーザがテキストコンポーネントと一緒に検索される製品の視覚的な例を入力する場合、視覚+テキストクエリ(301)型とすることができ、あるユーザがその検索される製品の視覚的な例のみを入力する場合、視覚クエリ(302)型とすることができる。1つの視覚的な例は、対象物の写真、対象物を含むビデオ、または求められている対象物の形状を表している手書きの画像であってもよい。1つのテキストコンポーネントは、検索される製品のある特徴を記述する1つ以上の単語に対応する。このクエリ(300)は、コンピュータネットワーク(110)を介して処理装置(400)に送信され、その検索を解決してそのクエリに該当した複数の製品を含むクエリ応答(001)を送り返す。
処理装置(200)は、その製品データベース(402)を読み込み、システムの準備段階中(図2)に計算されたすべてのデータが、クエリ(300)を受信し、製品カタログ内の製品を検索し、そのユーザ(001)に該当製品を送り返す。クエリを解決するためその処理装置により使用される方法は、ユーザが視覚+テキストクエリ(301)または視覚クエリ(302)のどちらかを受信するかに依存するであろう。
視覚+テキストクエリ(301)は、ある対象物の1つの視覚的な例、および1つのテキストコンポーネントを含む。この種類のクエリを解決するのに必要とされる処理を、図4に示す。このテキストコンポーネントを使用して、製品検索空間を限定する。その転置インデックスを使用して、テキストコンポーネントの単語のうちの少なくとも1つを含むすべての製品を検索するため、類似性の検索は、このテキスト製品リスト(520)のみに限定されるであろう。視覚特徴抽出モジュール(210)は、その視覚的な例を処理し、視覚特徴ベクトル(525)を取得する。このベクトルは、1つの類似性検索モジュールまたはコンポーネント(240)を通じてテキスト製品リスト中のすべての製品と比較される。視覚ベクトル同士の間のこの比較は、距離関数を介して実行され、この距離関数は、例えばユークリッド距離、マンハッタン、マハラノビス距離、ヘリンガー距離、カイ二乗などとしてもよい。この類似性検索モジュール(240)は、モジュールまたは結果グループ化コンポーネント(260)を通過する製品のリスト(003)を送り返し、そのクエリの結果を生成する。
視覚クエリ(302)は、ある対象物の1つの視覚的な例を含む。視覚+テキストクエリ(301)と異なって、そのユーザは、テキストを全く入力しない。視覚検索処理(図5)は、1つの自動記述視覚検索モジュール(320)および1つの一般視覚検索モジュール(330)の2つのモジュールから構成されている。各モジュールは、該当製品のリストを生成し、そのリストは、リスト組み合わせコンポーネント(340)を使って組み合わされ、該当製品のリスト(003)を生成する。以前の場合と同様に、その該当製品のリストは、グループ化コンポーネント(260)に送信され、そのクエリの最終的な応答を取得する。
自己記述視覚検索モジュール(320)は、自己ラベル付けコンポーネントを使用して、そのサンプルクエリ(図6)を記述する一組のラベル(530)を自動的に生成する。生成された記述と一緒に、製品選択モジュール(270)は、そのクエリ例と共通の少なくとも1つのラベルを有するサブグループ製品を取得する。視覚特徴ベクトル(525)は、そのクエリサンプルから計算され、類似性検索が、一致するラベルを有するサブグループ製品に限定されて実行される。この類似性検索は、VSD(視覚自己記述)製品リスト(004)として送り返されたサブグループ製品中のそのクエリ例と最も類似しているK個の製品を取得する。
一般視覚検索モジュール(330)は、データベースに存在するすべての製品を考慮しながら製品を検索する。視覚特徴ベクトル(525)は、そのクエリサンプルから計算され、すべての製品の間で類似性検索が実行される。この類似性検索は、データベース中のそのクエリ例に最も類似しているK個の製品を取得し、これらの製品は、GV(全体図)製品リスト(005)として送り返される。
ある製品の妥当性は、ゼロより大きい数値、すなわち点数であり、この点数は、検索クエリと製品特徴との間の一致の度合いを表す。リスト組み合わせモジュール(340)は、VSD製品リスト(004)およびGV製品リスト(005)を混合する。この混合は、各類似性検索における各製品の妥当性の数値を合計することに対応し、いかなる重複する製品の妥当性も累積する。累積された最も大きい妥当性を取得するK個の製品は、該当製品リスト(003)を生成する。
結果グループ化モジュール(260)は、該当製品のリスト(003)を受信し、最も多数を占める分類に関して製品を編成する。これらの各分類には、リスト上に現れる製品分類に関する点数が付与され、最高票を獲得したM個の分類が選択される。この点数は、各カテゴリに対する、リスト上の各製品の妥当性の合計を考慮している。クエリ応答(001)は、そのカテゴリに投票された製品とともに最高票を獲得したカテゴリを有するリストである。このクエリ応答は、顧客のアプリケーションに送り返され、そのユーザにより表示される。

Claims (14)

  1. カタログ内の製品を検索するためのシステムであって、
    a.ユーザがクエリを生成し、クエリを処理装置に送信し、結果を表示することを可能にするアプリケーションを有するネットワーク接続されたデバイスであって、クエリが検索を所望する製品の視覚的な例である、デバイスと、
    b.前記ユーザからのクエリを受信し、前記カタログ内の検索を解決する処理装置であって、
    i.視覚特徴抽出コンポーネント、
    ii.自己ラベル付けコンポーネント、
    iii.類似性に基づく検索コンポーネント、および
    iv.結果グループ化コンポーネントを含む、処理装置と、
    c.1つ以上の店舗からのカタログからの製品に関する情報を絶えず維持するデータ記憶装置と、を含むことを特徴とする、カタログ内の製品を検索するためのシステム。
  2. 前記視覚的な例は、1つ以上の写真、1つ以上の手製の図面、またはビデオに相当することを特徴とする、請求項1に記載のカタログ内の製品を検索するためのシステム。
  3. 前記クエリは、視覚的な例、そしてまた、前記ユーザにより入力された1つ以上の単語も含むことを特徴とする、請求項1に記載のカタログ内の製品を検索するためのシステム。
  4. 前記自己ラベル付けコンポーネントは、トレーニングおよび神経回路網の使用に基づくことを特徴とする、請求項1に記載のカタログ内の製品を検索するためのシステム。
  5. 前記自己ラベル付けコンポーネントは、分類器を使用することを特徴とする、請求項1に記載のカタログ内の製品を検索するためのシステム。
  6. 前記分類器は、サポートベクターマシン(SVM)、神経回路網、K近傍法(KNN)、およびランダムフォレストに含まれることを特徴とする、請求項5に記載のカタログ内の製品を検索するためのシステム。
  7. カタログ内の製品を検索するための方法であって、
    a.インストールされたアプリケーションを介してネットワーク接続されたデバイスの中へのクエリのユーザ入力ステップおよび処理装置への前記クエリの送出ステップと、
    b.処理装置による前記クエリの受信ステップであって、
    i.前記クエリの視覚特徴を抽出し、
    ii.視覚特徴を使って、クエリとデータ記憶装置に記憶されたすべての製品との間の視覚的類似性検索を実行し、
    iii.前記クエリのための一組のラベルを自動的に生成し、
    iv.少なくとも1つのラベルにより前記クエリと一致するサブグループの製品に限定された類似性に基づく検索を実行し、
    v.検索iiおよび検索ivの前記結果を混合し、前記クエリに対する応答を生成するための、受信ステップと、
    c.ネットワーク接続されたデバイスによる前記クエリの応答の受信ステップ、および前記ユーザディスプレイの生成ステップと、を含むことを特徴とする、カタログ内の製品を検索するための方法。
  8. 前記視覚的な例は、1つ以上の写真、1つ以上の手製の図面、またはビデオに相当することを特徴とする、請求項7に記載のカタログ内の製品を検索するための方法。
  9. 前記クエリは、視覚的な例、そしてまた、前記ユーザにより入力された1つ以上の単語も含むことを特徴とする、請求項7に記載のカタログ内の製品を検索するための方法。
  10. 前記類似性に基づく検索の方法は、少なくとも1つの単語により前記クエリと一致するサブセットの製品に限定されることを特徴とする、請求項9に記載のカタログ内の製品を検索するための方法。
  11. 前記クエリの視覚特徴を抽出する前記方法が、局所記述子集約法(local descriptor aggregation methods)に基づくことを特徴とする、請求項7に記載のカタログ内の製品を検索するための方法。
  12. ラベル付け生成段階が、トレーニングおよび神経回路網の使用に基づくことを特徴とする、請求項7に記載のカタログ内の製品を検索するための方法。
  13. 前記ラベルを生成するステップは、分類器を使用することを特徴とする、請求項7に記載のカタログ内の製品を検索するための方法。
  14. 前記分類器は、サポートベクターマシン(SVM)、神経回路網、K近傍法(KNN)、およびランダムフォレストに含まれることを特徴とする、請求項13に記載のカタログ内の製品を検索するための方法。
JP2018526283A 2015-08-03 2015-08-03 カタログ内の製品を検索するためのシステムおよび方法 Pending JP2018523251A (ja)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/CL2015/050027 WO2017020139A1 (es) 2015-08-03 2015-08-03 Sistema y método para buscar productos en catálogos

Publications (1)

Publication Number Publication Date
JP2018523251A true JP2018523251A (ja) 2018-08-16

Family

ID=57942193

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2018526283A Pending JP2018523251A (ja) 2015-08-03 2015-08-03 カタログ内の製品を検索するためのシステムおよび方法

Country Status (5)

Country Link
US (1) US20180322208A1 (ja)
EP (1) EP3333769A4 (ja)
JP (1) JP2018523251A (ja)
CN (1) CN108431829A (ja)
WO (1) WO2017020139A1 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2022534805A (ja) * 2019-06-07 2022-08-03 イーエルシー マネージメント エルエルシー 化粧品製品推奨のための方法及び装置

Families Citing this family (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2017020140A1 (es) * 2015-08-03 2017-02-09 Orand S.A. Sistema de búsqueda de imágenes por sketches usando histogramas de orientaciones de celdas y extracción de contornos basado en características de nivel medio
US11769193B2 (en) * 2016-02-11 2023-09-26 Ebay Inc. System and method for detecting visually similar items
US10860898B2 (en) * 2016-10-16 2020-12-08 Ebay Inc. Image analysis and prediction based visual search
US11861675B2 (en) 2019-04-22 2024-01-02 Home Depot Product Authority, Llc Methods for product collection recommendations based on transaction data
US11120313B2 (en) 2019-07-15 2021-09-14 International Business Machines Corporation Generating search determinations for assortment planning using visual sketches
US11176209B2 (en) * 2019-08-06 2021-11-16 International Business Machines Corporation Dynamically augmenting query to search for content not previously known to the user
US11200445B2 (en) 2020-01-22 2021-12-14 Home Depot Product Authority, Llc Determining visually similar products
CN111949814A (zh) * 2020-06-24 2020-11-17 百度在线网络技术(北京)有限公司 搜索方法、装置、电子设备和存储介质
CN111967533B (zh) * 2020-09-03 2022-09-23 中山大学 一种基于场景识别的草图图像翻译方法
CN111932323B (zh) * 2020-09-29 2021-01-15 北京每日优鲜电子商务有限公司 物品信息界面显示方法、装置、设备和计算机可读介质

Family Cites Families (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6035055A (en) * 1997-11-03 2000-03-07 Hewlett-Packard Company Digital image management system in a distributed data access network system
JP4859025B2 (ja) * 2005-12-16 2012-01-18 株式会社リコー 類似画像検索装置、類似画像検索処理方法、プログラム及び情報記録媒体
US8489987B2 (en) * 2006-07-31 2013-07-16 Ricoh Co., Ltd. Monitoring and analyzing creation and usage of visual content using image and hotspot interaction
US7840076B2 (en) * 2006-11-22 2010-11-23 Intel Corporation Methods and apparatus for retrieving images from a large collection of images
US9195898B2 (en) * 2009-04-14 2015-11-24 Qualcomm Incorporated Systems and methods for image recognition using mobile devices
US9135277B2 (en) * 2009-08-07 2015-09-15 Google Inc. Architecture for responding to a visual query
JP2013501976A (ja) * 2009-08-07 2013-01-17 グーグル インコーポレイテッド 視覚クエリの複数の領域についての検索結果を提示するためのユーザインターフェイス
US9087059B2 (en) * 2009-08-07 2015-07-21 Google Inc. User interface for presenting search results for multiple regions of a visual query
US8171049B2 (en) * 2009-09-18 2012-05-01 Xerox Corporation System and method for information seeking in a multimedia collection
US8977639B2 (en) * 2009-12-02 2015-03-10 Google Inc. Actionable search results for visual queries
US8447767B2 (en) * 2010-12-15 2013-05-21 Xerox Corporation System and method for multimedia information retrieval
US8798362B2 (en) * 2011-08-15 2014-08-05 Hewlett-Packard Development Company, L.P. Clothing search in images
US8831358B1 (en) * 2011-11-21 2014-09-09 Google Inc. Evaluating image similarity
US9075824B2 (en) * 2012-04-27 2015-07-07 Xerox Corporation Retrieval system and method leveraging category-level labels
US8995716B1 (en) * 2012-07-12 2015-03-31 Google Inc. Image search results by seasonal time period
US8935246B2 (en) * 2012-08-08 2015-01-13 Google Inc. Identifying textual terms in response to a visual query
CN104346370B (zh) * 2013-07-31 2018-10-23 阿里巴巴集团控股有限公司 图像搜索、获取图像文本信息的方法及装置

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2022534805A (ja) * 2019-06-07 2022-08-03 イーエルシー マネージメント エルエルシー 化粧品製品推奨のための方法及び装置
JP7257553B2 (ja) 2019-06-07 2023-04-13 イーエルシー マネージメント エルエルシー 化粧品製品推奨のための方法及び装置

Also Published As

Publication number Publication date
EP3333769A4 (en) 2019-05-01
WO2017020139A1 (es) 2017-02-09
US20180322208A1 (en) 2018-11-08
CN108431829A (zh) 2018-08-21
EP3333769A1 (en) 2018-06-13

Similar Documents

Publication Publication Date Title
JP2018523251A (ja) カタログ内の製品を検索するためのシステムおよび方法
WO2022022002A1 (zh) 一种信息展示方法、信息搜索方法及装置
US9042659B2 (en) Method and system for fast and robust identification of specific product images
US20180181569A1 (en) Visual category representation with diverse ranking
KR20230087622A (ko) 스트리밍 비디오 내의 객체를 검출하고, 필터링하고 식별하기 위한 방법 및 장치
US10410224B1 (en) Determining item feature information from user content
US20160284007A1 (en) Information processing apparatus, information processing method, and recording medium
CN110147499B (zh) 打标签方法、推荐方法及记录介质
CN104268175B (zh) 一种数据搜索的装置及其方法
San Pedro et al. Leveraging user comments for aesthetic aware image search reranking
Huang et al. Revminer: An extractive interface for navigating reviews on a smartphone
US10229190B2 (en) Latent semantic indexing in application classification
US20140122470A1 (en) Hierarchical ranking of facial attributes
US10776417B1 (en) Parts-based visual similarity search
TW201411515A (zh) 於線上商店之互動式衣服搜尋技術
US9906588B2 (en) Server and method for extracting content for commodity
Liu et al. Event-based media enrichment using an adaptive probabilistic hypergraph model
Wankhede et al. Content-based image retrieval from videos using CBIR and ABIR algorithm
KR101498944B1 (ko) 상품 판매 업체 관련 글 판단 방법 및 그 장치
US20180181570A1 (en) Contextual ranking of photos and text in search
McGuinness et al. The AXES research video search system
US11403697B1 (en) Three-dimensional object identification using two-dimensional image data
JP7316477B1 (ja) 処理実行システム、処理実行方法、及びプログラム
Ashraf et al. Improved Ingredients-based Recipe Recommendation Software using Machine Learning
Martínez et al. VETE: improving visual embeddings through text descriptions for eCommerce search engines

Legal Events

Date Code Title Description
A524 Written submission of copy of amendment under article 19 pct

Free format text: JAPANESE INTERMEDIATE CODE: A525

Effective date: 20180329

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20180725

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20190522

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20190621

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20200303