JP5767413B1 - 情報処理システム、情報処理方法、および情報処理プログラム - Google Patents

情報処理システム、情報処理方法、および情報処理プログラム Download PDF

Info

Publication number
JP5767413B1
JP5767413B1 JP2014555033A JP2014555033A JP5767413B1 JP 5767413 B1 JP5767413 B1 JP 5767413B1 JP 2014555033 A JP2014555033 A JP 2014555033A JP 2014555033 A JP2014555033 A JP 2014555033A JP 5767413 B1 JP5767413 B1 JP 5767413B1
Authority
JP
Japan
Prior art keywords
image data
image
name
user
information processing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2014555033A
Other languages
English (en)
Other versions
JPWO2015140922A1 (ja
Inventor
圭司 新里
圭司 新里
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Rakuten Group Inc
Original Assignee
Rakuten Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Rakuten Inc filed Critical Rakuten Inc
Application granted granted Critical
Publication of JP5767413B1 publication Critical patent/JP5767413B1/ja
Publication of JPWO2015140922A1 publication Critical patent/JPWO2015140922A1/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/58Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/5866Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using information manually generated, e.g. tags, keywords, comments, manually generated location and time information
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/248Presentation of query results
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/54Browsing; Visualisation therefor
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/58Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/58Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/587Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using geographical or spatial information, e.g. location
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9538Presentation of query results

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Library & Information Science (AREA)
  • Computational Linguistics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

一実施形態に係る情報処理システムは抽出部および生成部を備える。抽出部は、ユーザ端末から送信されたリクエストに含まれる、ユーザにより指定された語句と、該リクエストに応答して該ユーザ端末上に選択肢として表示された画像とを抽出する。生成部は、画像に対応しかつ画像記憶部から得られた画像データと、語句に基づく名称とを関連付けることで組合せデータを生成する。

Description

本発明の一側面は、画像を処理する情報処理システム、情報処理方法、および情報処理プログラムに関する。
画像に写った対象物の名称を特定する一般物体認識という技術がある。この一般物体認識の例として、下記特許文献1に記載の画像特徴量抽出装置が挙げられる。この装置は、フレーム画像データから検出した特徴点の周辺領域、すなわち局所領域における局所特徴量の共起に基づいて、画像の内容を特徴付ける特徴量を生成する。
特開2013−037539号公報
このような一般物体認識においては、対象物毎の局所特徴量の分布をコンピュータに機械学習させるために、画像と名称との組合せを示すデータを予め多く準備しておく必要がある。しかしながら、そのようなデータを人手で大量に準備するのは容易ではなく手間が掛かる。そこで、画像と名称との組合せを自動的に収集することが望まれている。
本発明の一側面に係る情報処理システムは、ユーザ端末から送信されたリクエストに含まれる、ユーザにより指定された語句と、該リクエストに応答して該ユーザ端末上に選択肢として表示された画像とを抽出する抽出部と、画像に対応しかつ画像記憶部から得られた画像データと、語句に基づく名称とを関連付けることで組合せデータを生成する生成部とを備える。
本発明の一側面に係る情報処理方法は、プロセッサを備える情報処理システムにより実行される情報処理方法であって、ユーザ端末から送信されたリクエストに含まれる、ユーザにより指定された語句と、該リクエストに応答して該ユーザ端末上に選択肢として表示された画像とを抽出する抽出ステップと、画像に対応しかつ画像記憶部から得られた画像データと、語句に基づく名称とを関連付けることで組合せデータを生成する生成ステップとを含む。
本発明の一側面に係る情報処理プログラムは、ユーザ端末から送信されたリクエストに含まれる、ユーザにより指定された語句と、該リクエストに応答して該ユーザ端末上に選択肢として表示された画像とを抽出する抽出部と、画像に対応しかつ画像記憶部から得られた画像データと、語句に基づく名称とを関連付けることで組合せデータを生成する生成部としてコンピュータを機能させる。
このような側面においては、ユーザにより指定された語句と画像データとの対応が得られ、その語句に基づく名称および画像データが互いに関連付けられる。したがって、人手を介さずに画像と名称との組合せを自動的に収集することができる。
本発明の一側面によれば、画像と名称との組合せを自動的に収集することできる。
実施形態に係る情報処理システムでの処理の概念図である。 実施形態に係る情報処理システムを構成するコンピュータのハードウェア構成を示す図である。 実施形態に係る情報処理システムの機能構成を示すブロック図である。 ページ処理の一例を示す図である。 ページ処理の別の例を示す図である。 組合せデータの例を示す図である。 画像データの例を示す図である。 特徴点が抽出された画像データの例を示す図である。 実施形態に係る情報処理システムの動作を示すフローチャートである。 実施形態に係る情報処理プログラムの構成を示す図である。
以下、添付図面を参照しながら本発明の実施形態を詳細に説明する。なお、図面の説明において同一又は同等の要素には同一の符号を付し、重複する説明を省略する。
まず、図1〜8を用いて、実施形態に係る情報処理システム10の機能および構成を説明する。情報処理システム10は、画像データと名称とを関連付けることで組合せデータを生成するコンピュータシステムである。言い換えると、情報処理システム10は、画像データにラベル付けを行うコンピュータシステムである。
本明細書における「画像」とは、人の視覚で捉えることができるように対象物を媒体に定着させた像である。また、「画像データ」とは、コンピュータでの処理が可能な、画像を示すデータである。したがって、本明細書における画像は、メモリなどの記憶装置に記録され、プロセッサの処理によりモニタやプリンタなどの出力装置に出力されることで、視認可能となる。画像は静止画でもよいし動画でもよい。静止画の例としては写真や絵画などがあり、動画の例としてはビデオ映像やアニメーションなどがあるが、画像の種類はこれらに限定されない。画像はカメラやスキャナなどの電子機器により得られたものでもよいし、コンピュータ・グラフィックスにより作成されたものでもよい。
本明細書において、「対象物」は被写体と言い換えることもできる。対象物の種類は何ら限定されず、現実に存在する事物でもよいし、描画により可視化された仮想の事物であってもよい。例えば、対象物は商品であり得る。本明細書における「商品」とは、有償または無償で取引され得る任意の有体物または無体物である。有体物は何ら限定されるものではなく、動産でも不動産でもよい。また、無体物も何ら限定されるものではなく、例えば任意のサービスの提供が考えられる。
本明細書における「名称」とは、画像を識別または区分するための文字列である。なお、名称は個々の画像を一意に識別するものである必要はなく、したがって、一つの名称に対して複数の画像データが対応する場合がある。名称は名詞でもよいし、名詞以外の品詞でもよい。名称は一般名称でもよいし固有名称でもよい。ここで、一般名称とは、同じ種類に属する事物を広く指す名称であり、例えば普通名詞が挙げられる。一方、固有名称とは、ある事物を同じ種類に属する他の事物と区別するために用いられる名称であり、例えば、人名、地名、またはブランド名などの固有名詞が挙げられる。
ある対象物の画像データに関連付けられる名称は、その対象物そのものの名称かもしれないし、その対象物の一部(例えば、対象物を構成する部品)の名称かもしれない。例えば、自転車の画像データに対して「自転車」という名称が関連付けられるかもしれないし、「タイヤ」という名称が関連付けられるかもしれない。
情報処理システム10は、ページ処理に関するログを参照することで画像データと語句との対応を抽出し、対応し合うと判定した画像データとその語句に基づく名称とを互いに関連付けることで組合せデータを生成する。
図1に、本実施形態に係る情報処理システム10での処理の概念を簡潔に示す。ユーザUは自身の端末(ユーザ端末)Tを用いてオンライン・ショッピング・サイトにアクセスして、商品を検索したり、複数の商品を比較したり、商品の購入手続を行ったりすることができる。
ここで、本明細書における「ユーザ」とは、任意のコンピュータシステムから提供される、画像データを含む情報を利用する人である。図1の例では、理解の容易さを考慮して、ユーザがオンライン・ショッピング・サイトを利用する場合を示すが、ユーザが利用するオンラインサービスはこれに限定されるものではない。ユーザは自身の端末を用いてそのコンピュータシステムにアクセスすることができる。端末の種類は何ら限定されず、例えば、据置型又は携帯型のパーソナルコンピュータ(PC)でもよいし、高機能携帯電話機(スマートフォン)や携帯電話機、携帯情報端末(PDA)などの携帯端末でもよい。なお、図1ではユーザUおよび端末Tを一つのみ示しているが、一般に、ユーザUおよび端末Tは複数(例えば多数)存在し得る。
端末Tはユーザ操作に応じてオンライン・ショッピング・サイトのサーバEにアクセスしてページを要求し、そのサーバEからページを受信して画面上にそのページを表示する。この一連の処理により、例えば、画像を含むページがユーザの端末T上に表示される。ここで、本明細書における「ページ」とは、インターネット上で提供される電子的な文書である。ページの例としてウェブページが挙げられるが、ページを提供する仕組みはウェブページに限定されない。端末T上においてページはウェブブラウザ上に表示されてもよいし、ウェブブラウザ以外のアプリケーション・プログラムにより実現される画面上に表示されてもよい。本明細書における「ページ処理」とは、そのページに関する任意の処理を示す。ページ処理の例として、端末TからサーバEへのリクエストの送信、そのリクエストに基づくページの生成、およびサーバEから端末Tへの生成されたページの送信(リクエストに対する応答)が挙げられる。ここで、本明細書における「リクエスト」とは、ユーザ端末がサーバからページを取得するためにそのサーバに送信する信号である。
端末TとサーバEとの間でページ処理が実行される度に、そのページ処理に関するログが所定の記憶装置に書き込まれる。本明細書における「ログ」とは、実行された処理を所定のレベルで詳細に記述した記録である。一般に、ログは時系列で記述されるが、ログの記述方法はこれに限定されるものではない。
例えば、処理された入力データ、処理の種類、処理中に取得されたデータ、最終的に出力されたデータなどがログとして所定の記憶装置に書き込まれる。例えば、入力データの例として、次のページのURL(Uniform Resource Locator)、ユーザにより指定されたパラメータ、および端末Tで自動的に指定されたパラメータが挙げられる。処理の種類を示す情報の例としては、呼び出されて実行されたファンクション(function)またはプロシージャ(procedure)の名前が挙げられる。処理中に取得されたデータの例としては、処理により生成されたデータ、および処理中に記憶装置(例えばメモリやデータベースなど)から読み出されたデータが挙げられる。出力データの例として、端末Tに送信されたページのURL、およびそのページに含まれるデータ(例えばテキストデータや画像データなど)が挙げられる。図1に示すログの例からは、検索キーワードとして「自転車」が指定されたことと、そのキーワードに対して商品A,Bが検索結果として抽出されたこととがわかる。
情報処理システム10はそのログから、ユーザにより指定された語句と、その語句に対応して表示された画像とを抽出し、その画像に対応する画像データとその語句に基づく名称とを互いに関連付けることで組合せデータを生成する。
ユーザが語句を指定する態様は限定されない。例えば、ユーザが端末T上で入力するかまたは選択した文字列は、ユーザにより指定された語句の例である。具体的には、ユーザがページ上のテキストボックス内に入力したキーワードや、ユーザがリスト(例えば商品カテゴリ選択欄や商品タグ選択欄など)内の選択肢から選んだキーワードなどが、ユーザにより指定された語句として処理され得る。
情報処理システム10は画像データそのものをログから取得することはできないので、情報処理システム10はログの記述に合致する画像データを画像データベース(画像記憶部)から読み出す。画像データベースは、画像データと、その画像データに関連する1以上の属性値とを含むレコードを記憶する装置である。属性値は、画像データそのものの性質または特徴を示す値であってもよいし、画像データで表される対象物の性質または特徴を示す値であってもよい。画像データそのものについての属性値の例として、画像の解像度、作成日時、データサイズなどが挙げられる。一方、対象物についての属性値の例として、対象物の名称やカテゴリなどが挙げられる。例えば対象物が商品であれば、商品名、商品カテゴリ、販売者、価格などが属性値の例として挙げられる。
図1の例では、情報処理システム10はまず、検索キーワード「自転車」と二つの商品A,Bとが対応すると判定する。続いて、情報処理システム10は商品A,Bにそれぞれ対応する画像データGa,Gbを画像データベースから読み出す。そして、情報処理システム10はキーワード「自転車」および画像データGaが関連付けられたデータDaと、キーワード「自転車」および画像データGbが関連付けられたデータDbとを生成する。なお、この例では情報処理システム10は検索キーワード(語句)そのものを名称として用いている。これらのデータDa,Dbが組合せデータである。本明細書では、画像データXおよび名称Yの関連を示す組合せデータを“{画像データX,名称Y}”とも表現する。
上述したように、ユーザが利用するオンラインサービスはこれに限定されるものではないから、ログの内容も限定されない。ユーザにより指定された語句と、その語句に対応して画面に表示された画像データとを特定できるのであれば、ログはどのようなオンラインサービスから生成されてもよい。
情報処理システム10は1台以上のコンピュータを備え、複数台のコンピュータを備える場合には、後述する情報処理システム10の各機能要素は分散処理により実現される。個々のコンピュータの種類は限定されない。例えば、据置型または携帯型のパーソナルコンピュータ(PC)を用いてもよいし、ワークステーションを用いてもよいし、高機能携帯電話機(スマートフォン)や携帯電話機、携帯情報端末(PDA)などの携帯端末を用いてもよい。あるいは、様々な種類のコンピュータを組み合わせて情報処理システム10を構築してもよい。複数台のコンピュータを用いる場合には、これらのコンピュータはインターネットやイントラネットなどの通信ネットワークを介して接続される。
情報処理システム10内の個々のコンピュータ100の一般的なハードウェア構成を図2に示す。コンピュータ100は、オペレーティングシステムやアプリケーション・プログラムなどを実行するCPU(プロセッサ)101と、ROM及びRAMで構成される主記憶部102と、ハードディスクやフラッシュメモリなどで構成される補助記憶部103と、ネットワークカードあるいは無線通信モジュールで構成される通信制御部104と、キーボードやマウスなどの入力装置105と、ディスプレイやプリンタなどの出力装置106とを備える。当然ながら、搭載されるハードウェアモジュールはコンピュータ100の種類により異なる。例えば、据置型のPCおよびワークステーションは入力装置および出力装置としてキーボード、マウス、およびモニタを備えることが多いが、スマートフォンはタッチパネルが入力装置および出力装置として機能することが多い。
後述する情報処理システム10の各機能要素は、CPU101または主記憶部102の上に所定のソフトウェアを読み込ませ、CPU101の制御の下で通信制御部104や入力装置105、出力装置106などを動作させ、主記憶部102または補助記憶部103におけるデータの読み出し及び書き込みを行うことで実現される。処理に必要なデータやデータベースは主記憶部102または補助記憶部103内に格納される。
図3に示すように、情報処理システム10は機能的構成要素として抽出部11、生成部12、および選択部13を備える。以下では、理解の容易さを考慮して、情報処理システム10がオンライン・ショッピング・サイト内での処理を記録したログを参照して、ユーザにより指定された語句に基づく名称と商品の画像データとを関連付ける例を説明する。しかし、上述したように、ログを生成するオンラインサービスや、画像データが示す対象物などは何ら限定されない。
抽出部11は、ログ記憶部21に蓄積されたログを読み出して、ユーザにより指定された語句と、その語句に対応して表示された画像データとを抽出する機能要素である。ここで、「表示される」とは、ユーザが視認可能なように画像データがユーザ端末上に表示されることである。また、「語句に対応して表示される」とは、語句を用いた何らかの処理により得られた画像データが表示されることである。その処理の例として検索、収集、生成などが挙げられるが、これらに限定されるものではない。例えばその処理が検索であれば、ユーザ端末がユーザにより指定された語句を含むリクエストを送信すると、そのリクエストに応答して、画像が該ユーザ端末上に検索結果および/または選択肢として表示される。ユーザにより指定される語句の個数は一つとは限らず、一回の処理で複数の語句が指定される場合もあり得る。本明細書における「選択肢として表示される」とは、ユーザが直接的に画像データを選択できるように表示される態様と、ユーザが画像データに関連する情報(例えば文字列で示されるリンク)を選択することで間接的にその画像データを選択できるように表示される態様とを含む概念である。
まず、抽出部11は情報処理システム10の管理者から入力された指示または予め設定されたスケジュールに応じて、ログ記憶部21からログを読み出す。抽出部11が読み出すログの範囲は限定されず、例えば抽出部11はログ記憶部21内のすべてのログを読み出してもよいし、過去の所定期間(例えば最近の1ヵ月間)に書き込まれたログのみを読み出してもよいし、特定の処理に関するログのみを読み出してもよい。
続いて、抽出部11はユーザにより指定された語句と、その語句に対応して表示された画像データとを抽出する。言い換えると、抽出部11は、ユーザ端末から送信されたリクエストに含まれる、ユーザにより指定された語句と、そのリクエストに応答して該ユーザ端末上に検索結果および/または選択肢として表示された画像データとを抽出する。語句と画像データとが対応する態様は様々であり、したがって、語句と画像データとの対応関係を抽出する手法についても様々な態様が考えられる。いずれにしても、抽出部11は、ログにどのような記述がある場合にその記述から語句または画像データを取得するかという規則を示す規則情報を予め内部に保持しており、その規則にしたがって、語句および画像データの対応を抽出する。以下に、抽出手法の様々な例を説明する。
[第1の手法(表示のみを考慮する手法)]
抽出部11は単純に、ユーザにより指定された語句と、その語句に対応して表示された画像データとの組合せを抽出してもよい。例えば、抽出部11はユーザにより指定されたキーワードと、そのキーワードにより検索された1以上の画像データとをログから抽出する。
例えば、ログから下記の3行が得られたとする。この例の1行目はユーザ端末からのリクエストを示し、3行目はそのリクエストに応答してユーザ端末に検索結果および/または選択肢として表示された画像を示す。
Search(category=null,Keyword=“カメラ”)
Get(商品A,商品B,商品C)
CreatePage(Product=”商品A,商品B,商品C”)
この場合に、抽出部11はキーワード「カメラ」をユーザにより指定された語句として取得する。また、抽出部11はそのキーワードに対して三つの商品A〜Cが検索されてページ内に埋め込まれ、そのページ(すなわち、商品A〜Cの画像データ)が表示されたことを特定する。この特定は、語句と画像との組を一つ以上抽出する処理に相当する。続いて、抽出部11は商品A〜Cに対応する三つの画像データを商品データベース(画像記憶部)22から取得する。ここで、商品データベース22は画像データベースの一種であり、商品が写された画像データと、その画像データに関連する1以上の商品の属性値(商品名および商品カテゴリなど)とを少なくとも含むレコードを記憶する。なお、同じ構図の画像データでも、画面表示用のサムネイル画像のファイルとオリジナルの商品画像のファイルとを分けて管理する場合がある。したがって、実際にユーザ端末上に表示された画像ファイル(画像データ)と商品データベース22から読み出される画像ファイル(画像データ)とが異なる場合があり得る。いずれにしても、抽出部11はユーザ端末上に表示された画像に対応する画像データを商品データベース22から取得する。
[第2の手法(表示後の操作を考慮する手法)]
抽出部11は、ユーザにより指定された語句と、その語句に対応して表示され、かつそのユーザに選択された画像データとを抽出してもよい。ここで、本明細書における「ユーザに選択された画像データ」とは、ユーザが直接的に画像データを選択する態様と、ユーザが画像データに関連する情報(例えば文字列で示されるリンク)を選択したことで間接的にその画像データが選択される態様との双方を含む概念である。間接的な選択の例として、ある商品の商品ページへのリンクがクリックされることで、その商品の画像データが選択されるという場面が挙げられる。
抽出部11は、ユーザにより指定されたキーワードと、そのキーワードにより検索され、かつその後にユーザにより選択された1以上の画像データとをログから抽出してもよい。例えば、ログから下記の4行が得られたとする。この例の1行目はユーザ端末からのリクエストを示し、3行目はそのリクエストに応答してユーザ端末に検索結果および/または選択肢として表示された画像を示す。
Search(category=null,Keyword=“カメラ”)
Get(商品A,商品B,商品C)
CreatePage(Product=”商品A,商品B,商品C”)
Select(商品B,商品C)
この場合に、抽出部11はキーワード「カメラ」をユーザにより指定された語句として取得する。また、抽出部11はそのキーワードに対して三つの商品A〜Cが検索されてページ内に埋め込まれ、そのページが表示され、その後そのページにおいて商品B,C(すなわち、商品B,Cの画像データ)がユーザにより選択されたことを特定する。この特定は、語句と画像との組を一つ以上抽出する処理に相当する。続いて、抽出部11は商品B,Cに対応する二つの画像データのみを商品データベース22から取得する。
この手法において、ユーザ端末上に表示された1以上の画像からユーザが特定の画像を選択する態様は何ら限定されない。
例えば、抽出部11は、ユーザがある商品の詳細情報を示す商品ページにアクセスするためにその商品ページへのリンクをクリックした場合に、ユーザがその商品の画像データを選択したと判定してもよい。図4の例では、まず、ユーザがページPaで二つのキーワード「自転車」「ライト(light)」を指定して商品検索を行うことで、「自転車用ライトP」や「自転車用ライトQ」などの複数の商品を掲載した検索結果ページPbが表示される。その後、ユーザがそのページPb内の「自転車用ライトQ」へのリンクをクリックすることで、「自転車用ライトQ」の商品ページPcが表示される。この場合には、抽出部11はそれら一連の処理のログから、二つのキーワード「自転車」「ライト」をユーザにより指定された語句として取得する。また、抽出部11は選択された商品「自転車用ライトQ」の画像データのみを商品データベース22から取得する。
あるいは、抽出部11は、ユーザがある特定の商品を買物かごに入れたか、またはその商品の購入手続を完了した場合に、ユーザがその商品の画像データを選択したと判定してもよい。この場合には、抽出部11はそのような処理のログから、ユーザにより指定された語句を取得する。また、抽出部11は買物かごに入れられた商品または購入手続が行われた商品をログから特定し、その商品の画像データを商品データベース22から取得する。
一般に、オンライン・ショッピング・サイトにおいて商品を買物かごに入れるか、またはその商品の購入手続を完了させるためには、ユーザはその商品に関するリンクまたはボタンを複数回クリックする必要がある。これは、そのような手続を行うためにはユーザがその商品を複数回選択する必要があることを意味する。
具体的にいうと、商品を買物かごに入れるためには、ユーザはキーワードを指定して得られた検索結果からその商品を選択する必要があり(図4参照)、続いて、その商品のページ上にある「買物かごに入れる」ボタン(同図参照)をクリックする必要がある。その「買物かごに入れる」ボタンをクリックする操作もユーザが商品を選択したことの一態様であるから、この場合には、ユーザは商品(およびその画像データ)を2回選択したといえる。
また、商品を購入するためには、ユーザはキーワードを指定して得られた検索結果からその商品を選択し(図4参照)、その商品のページ上にある「買物かごに入れる」ボタン(同図参照)をクリックし、最後にその商品を購入対象として確定する必要がある。「購入」ボタンをクリックして購入を確定する操作もユーザがその商品を選択したことの一態様であるから、この場合には、ユーザはその商品(およびその画像データ)を3回選択したといえる。
したがって、買物かごに入れる態様や購入手続の態様などを含む概念を定義することができる。すなわち、抽出部11は、ユーザにより指定された語句と、その語句に対応して表示され、かつそのユーザに複数回選択された画像データとを抽出してもよい。なお、ユーザが画像データを複数回選択する処理は、買物かごに関する操作および購入手続に限定されるものではなく、任意の処理であり得る。
あるいは、抽出部11は、ユーザが商品同士を比較するために複数の商品を比較対象として指定した場合に、ユーザが当該複数の商品の画像データを選択したと判定してもよい。図5の例では、まず、ユーザがページPdで二つのキーワード「自転車」「ライト」を指定して商品検索を行うことで、「自転車用ライトP」や「自転車用ライトQ」などの複数の商品を掲載した検索結果ページPeが表示される。その後、ユーザがそのページPe内で「自転車用ライトP」「自転車用ライトQ」「自転車用ライトT」をチェックして比較処理を指示させることで、それら3商品の画像データを含む比較表のページPfが表示される。この場合には、抽出部11はそれら一連の処理のログから、二つのキーワード「自転車」「ライト」をユーザにより指定された語句として取得する。また、抽出部11は「自転車用ライトP」「自転車用ライトQ」「自転車用ライトT」に対応する三つの画像データのみを商品データベース22から取得する。この場合には、ユーザにより指定された二つの語句「自転車」「ライト」と、選択された「自転車用ライトP」「自転車用ライトQ」「自転車用ライトT」に対応する三つの画像データとが対応し合うことになる。
[第3の手法(表示時間を考慮する手法)]
抽出部11は、ユーザにより指定された語句と、その語句に対応して所定の時間以上表示された画像データとの組合せを抽出してもよい。例えば、抽出部11はユーザにより指定されたキーワードと、そのキーワードにより検索され、かつユーザ端末上にある程度長い間表示された1以上の画像データとをログから抽出する。
例えば、ログから下記の8行が得られたとする。ここで、各行の括弧[]で括られた部分は時刻を示す。この例の1行目はユーザ端末からのリクエストを示し、3行目はそのリクエストに応答してユーザ端末に検索結果および/または選択肢として表示された画像を示す。8行目もユーザ端末からのリクエストを示す。
[11:50:00]Search(category=”カメラ”,Keyword=“一眼レフカメラ”)
[11:50:02]Get(商品W,商品X,商品Y,商品Z)
[11:50:02]CreatePage(Product=”商品W,商品X,商品Y,商品Z”)
[11:50:03]SendPage
[11:50:15]RequestPage(Product=“商品X”)
[11:52:30]RequestPage(Product=“商品Y”)
[11:52:35]RequestPage(Product=“商品Z”)
[11:53:10]Search(category=null,Keyword=“カメラ”)
この場合に、抽出部11はキーワード「カメラ」「一眼レフカメラ」をユーザにより指定された語句として取得する。また、抽出部11はそのキーワードに対して四つの商品W〜Zが検索されてページ内に埋め込まれ、そのページが表示されたことを特定する。さらに、抽出部11は、商品Xのページ(すなわち、商品Xの画像データ)が要求されて2分15秒間表示され、続いて商品Yのページ(すなわち、商品Yの画像データ)が要求されて5秒間表示され、続いて商品Zのページ(すなわち、商品Zの画像データ)が要求されて35秒間表示されたことを特定する。この特定は、語句と画像との組を一つ以上抽出する処理に相当する。
そして、抽出部11は所定の閾値以上の間表示された画像データを取得する。ここで、閾値は絶対値であってもよいし相対値であってもよい。例えば、抽出部11は「60秒」という絶対値を閾値して予め保持しており、その時間以上表示された商品Xの画像データのみを取得してもよい。あるいは、抽出部11は表示時間が長い上位n個の画像データを取得してもよく、この場合には、その値nが閾値であるといえる。上記のログの例においてn=2であれば、抽出部11は商品X,Zに対応する二つの画像データを取得する。あるいは、抽出部11は表示時間の絶対値とランキングの上位n個(相対値)という二つの閾値を併用する条件を用いてもよい。例えば、抽出部11は、60秒以上表示された画像データのうち、表示時間が長い上位3個の画像データを取得してもよい。あるいは、抽出部11はオンライン・ショッピング・サイト内でユーザが商品を購入したことを示す1以上のログを参照して、購入手続が行われた商品のページの最短表示時間を閾値に設定し、その閾値以上の時間だけ表示された画像データを取得してもよい。
このように、語句および画像データを抽出する方法は限定されない。いずれにしても、抽出部11はログ内の個々の部分(語句を抽出すべき1以上の箇所)から該語句を抽出し、それぞれの部分から抽出した語句について、対応する画像データを抽出する。抽出部11は、語句と画像データとの対応関係がわかる形式で、抽出した語句および画像データを生成部12に出力する。
生成部12は、画像データと語句に基づく名称とを関連付けることで組合せデータを生成する機能要素である。組合せデータは、画像データと名称との対応関係を表すデータである。画像データと名称とを関連付ける手法は一つに限定されるものではない。
[第1の手法(名称の候補が一つのみの場合)]
画像データに関連付ける名称の候補が一つのみの場合には、生成部12は単純にその名称を画像データに関連付けてもよい。例えば、語句「カメラ」に対して画像データGa,Gb,Gcが抽出された場合には、生成部12は三つの組合せデータ{画像データGa,“カメラ”},{画像データGb,“カメラ”},{画像データGc,“カメラ”}を生成する。この例では、生成部12は語句をそのまま名称として用いている。
あるいは、生成部12は、抽出された語句が一般名称である場合のみ、その語句に基づく名称を画像データに関連付けてもよい。例えば、生成部12は一般名称と判定された語句そのものを名称として画像データに関連付けてもよい。この場合には、生成部12は一般名称および固有名称の少なくとも一方の辞書を予め内部に保持し、その辞書を参照しながら、何が一般名称であるかを判定する。
抽出された語句が固有名称しかない場合(例えば、カテゴリが指定されず(すなわち、指定されたカテゴリの値がnull)、固有名称のみが検索キーワードとして指定された場合)には、生成部12はその固有名称に対応する一つの一般名称を選択し、その一般名称を含む組合せデータを生成してもよい。この場合には、生成部12は固有名称と一般名称との対応関係を示す辞書を予め内部に保持し、その辞書を用いて固有名称から一般名称を取得すればよい。例えば、検索キーワード「ビアンキ」のみが語句として抽出され、その語句に対応して画像データGs,Gtが抽出されたとする。この場合には、辞書を参照して固有名称「ビアンキ」に対応する一般名称「自転車」を選択し、二つの組合せデータ{画像データGs,“自転車”},{画像データGt,“自転車”}を生成する。
[第2の手法(名称の候補が複数の場合)]
画像データに関連付ける名称の候補が複数ある場合には、生成部12はそれらの中から選択した一つの名称を画像データに関連付ける。一つの名称を選択する方法は様々である。
例えば、生成部12は一般名称を選択してそれを画像データに関連付けてもよい。例えば、「ビアンキ」(Bianchi;商標または登録商標;以下同じ)という固有名称と「自転車」という一般名称が抽出され、これら二つの語句に対応して画像データGdが抽出されたとする。この場合には、生成部12は「自転車」という一般名称を選択し、一つの組合せデータ{画像データGd,“自転車”}を生成する。この場合には、生成部12は一般名称および固有名称の少なくとも一方の辞書を用いて、何が一般名称であるかを判定すればよい。なお、この例では、生成部12は選択された語句をそのまま名称として用いている。
あるいは、生成部12は、語句が対象物のカテゴリとして指定されたものか、あるいは検索キーワードとして指定されたものかを判定し、検索キーワードとして指定された語句の方を選択してもよい。この場合には、抽出部11が、どの語句がユーザによりどのように指定されたかをログから推定し、その推定結果を個々の語句に付加することで、生成部12はそのような判定および選択を実行することができる。例えば、検索キーワードとして指定された語句「ライト(light)」と、カテゴリとして指定された語句「自転車」とが抽出され、これら二つの語句に対応して画像データGp,Gq,Grが抽出されたとする。この場合には、生成部12は「ライト」を選択し、三つの組合せデータ{画像データGp,“ライト”},{画像データGq,“ライト”},{画像データGr,“ライト”}を生成する。なお、この例では、生成部12は選択された語句をそのまま名称として用いている。
生成部12は、一般名称/固有名称を考慮する手法と、検索キーワード/カテゴリを考慮する手法との双方を用いてもよい。例えば、検索キーワードとして指定された二つの語句「ビアンキ」および「ライト」と、カテゴリとして指定された語句「自転車」とが抽出され、これら三つの語句に対応して画像データGs,Gtが抽出されたとする。この場合には、生成部12は辞書を参照して「ビアンキ」を排除すると共に、カテゴリとして指定された「自転車」を排除することで、「ライト」を名称として選択する。そして、生成部12は二つの組合せデータ{画像データGs,“ライト”},{画像データGt,“ライト”}を生成する。これは、画像データと一般名称とを関連付ける処理に相当する。なお、この例では、生成部12は選択された語句をそのまま名称として用いている。
生成部12は、ユーザにより指定された複数の語句を組み合わせることで、画像データと関連付ける名称を生成してもよい。例えば、生成部12は、上記の「自転車」および「ライト」から「自転車用ライト」という名称を生成し、二つの組合せデータ{画像データGs,“自転車用ライト”},{画像データGt,“自転車用ライト”}を生成してもよい。さらに別の例として、生成部12は画像データGs,Gtのそれぞれに、“ライト”および“自転車用ライト”という二つの名称を関連付けることで、二つの組合せデータを生成してもよい。
複数の語句を組み合わせる場合には、生成部12は語句の組合せに関するルールの情報を予め内部に記憶しており、その情報に基づいて語句同士を組み合わせる。このルールは任意の方針で設定してよい。例えば、ルールは語句同士の包含関係や一般的な概念などを考慮して定められる。一例として、「自転車用ライト」という名称は適切だが、「ライト用自転車」という名称は一般的に有り得ないので、二つの語句「自転車」「ライト」から「自転車用ライト」という名称を生成する、というルールが予め設定される。あるいは、生成部12は複数の語句から生成したキーワードを用いてウェブ検索を実行し(例えば、オンライン・ショッピング・サイト内の検索や、インターネット上のすべてのウェブサイトの検索)、ヒット件数の最も多いキーワードを名称として選択してもよい。例えば、生成部12は、上記の「自転車」および「ライト」から「自転車用ライト」および「ライト用自転車」というキーワードとを生成する。そして、生成部12は各キーワードを用いてオンライン・ショッピング・サイト内を検索する。もし、「自転車用ライト」のヒット件数が50で「ライト用自転車」のヒット件数が25であれば、生成部12は「自転車用ライト」という名称を選択し、この名称を用いて組合せデータを生成する。
検索キーワードとして固有名称しか指定されておらず、かつカテゴリが指定された場合には、生成部12はカテゴリとして指定された語句を選択してもよい。例えば、検索キーワードとして指定された語句「ビアンキ」とカテゴリとして指定された「自転車」とが抽出され、これら二つの語句に対応して画像データGs,Gtが抽出されたとする。この場合には、生成部12はカテゴリとして指定された「自転車」を選択し、二つの組合せデータ{画像データGs,“自転車”},{画像データGt,“自転車”を生成する。これは、画像データと属性とを関連付ける処理に相当する。
このように、組合せデータを生成する手順は限定されない。いずれにしても、生成部12はログ内の個々の部分から得られた結果(名称と画像との1以上の組)に基づいて、1以上の組合せデータを生成する。この結果、各画像データが名称によりラベル付けされる。上記の通り、生成部12が組合せデータを生成するために最終的に用いる名称は一つだけでもよいし複数でもよい。生成部12はその組合せデータを選択部13に出力する。
図6に組合せデータの五つの例を示す。この例では個々の組合せデータを一意に識別するデータIDも示されているが、このデータIDは必須の項目ではない。一方、組合せデータは他の任意の項目を含んでもよい。
選択部13は、入力された1以上の組合せデータの中から、対象物以外の要素の出現度が所定の閾値より低い画像データを有する組合せデータを選択する機能要素である。ここで、「対象物以外の要素の出現度」とは、画像データで示される画像(以下では単に「画像」ともいう)内において対象物以外の要素が占める領域の面積ということもできる。あるいは、その出現度は、画像中で対象物以外の要素が目立つ程度であるともいうことができる。
選択部13の処理の目的は、対象物以外の要素が画像中になるべく現れていない画像データを取得する点にある。このような画像データは対象物そのものを明確に表すので、様々な場面に活用することができる。例えば、対象物毎の局所特徴量の分布をコンピュータに機械学習させるためには、サンプルとなる画像データをトレーニングデータとして予め用意しておく必要があるが、その画像データは、対象物のみが写されているものが望ましい。
図7は、オンライン・ショッピング・サイトで見受けられる典型的な画像の例である。画像Ha,Hb,Hcはいずれも椅子の商品の写真であり、したがって、これら3画像の対象物は椅子である。画像Haには対象物のみが写っているので、機械学習などに適した画像であるといえる。一方、画像Hbには対象物の椅子以外にテーブル、商品の価格、「送料無料」という宣伝文句、同種のテーブルセットなどの要素が現れており、椅子(対象物)そのものが目立たない。また、画像Hcには、文字列はないものの、机、モニタ、椅子に座る人、あるいは、重畳表示された同種の椅子などの要素が現れており、やはり、椅子(対象物)そのものが目立たない。このように、画像Hb,Hcでは椅子以外のものが写っているので、これらの画像Hb,Hcに基づいて椅子の画像に関する機械学習を行うと、誤ったモデルが構築される可能性がある。したがって、画像Hb,Hcは、機械学習などに適した画像であるとはいえない。選択部13は、画像Hb,Hcのような画像を含む組合せデータを廃棄して、画像Haのような画像を含む組合せデータを選択することを目指す。
選択部13は、個々の組合せデータに対して以下の処理を実行する。
まず、選択部13は画像データを解析して画像内の特徴点を抽出する。この特徴点抽出は周知技術であり、任意の手法を用いることができる。画像Ha,Hb,Hcのそれぞれから多数の特徴点Cが抽出された状態を図8に示す。
続いて、選択部13はその特徴点の分布に基づいて、どの組合せデータを選択するかを決める。この方法も様々考えられるが、以下にいくつかの例を示す。
[第1の手法(画像周縁部の特徴点の密度で判定)]
選択部13は、画像の周縁部の特徴点の密度を算出する。そして、選択部13はその密度が所定の閾値Ta未満であるか否かを判定する。この判定のために、選択部13はその閾値Taを予め保持する。算出された密度が閾値Ta未満であれば、選択部13は、その画像において対象物以外の要素の出現度が所定の閾値より低いと判定し、その画像を有する組合せデータを廃棄することなく選択する。一方、その密度が閾値Ta以上であれば、選択部13はその画像において対象物以外の要素の出現度が所定の閾値以上であると判定し、その画像を有する組合せデータを廃棄する。
対象物に関する補足情報を埋め込む場合には、その情報を画像の周縁部に載せることが多い。例えば、図8の画像Hbの周縁部(破線Lよりも外側の領域)には、価格や宣伝文句、同種のテーブルセットなどが表示されている。このような画像では特徴点Cがその周縁部に多く発生する傾向がある。したがって、周縁部の特徴点の密度を考慮することで、対象物以外の要素の出現度が相対的に高い画像を排除することができる。
[第2の手法(画像全体での特徴点の密度で判定)]
選択部13は、画像全体での特徴点の密度を算出する。そして、選択部13はその密度が所定の閾値Tb未満であるか否かを判定する。この判定のために、選択部13はその閾値Tbを予め保持する。算出された密度が閾値Tb未満であれば、選択部13は、その画像において対象物以外の要素の出現度が所定の閾値より低いと判定し、その画像を有する組合せデータを廃棄することなく選択する。一方、その密度が閾値Tb以上であれば、選択部13はその画像において対象物以外の要素の出現度が所定の閾値以上であると判定し、その画像を有する組合せデータを廃棄する。
対象物の使用場面を分かりやすく示すために、その使用場面を写した画像が用いられることがあるが、この場合には画像内に様々な物が存在することが多い。例えば、図8の画像Hcはオフィス内を写した写真であるともいえ、人、机、モニタなどの様々な物が映り込んでいる。このような画像では対象物以外の要素についての特徴点Cも抽出されるので、画像の全体にわたって多くの特徴点Cが分布する傾向がある。したがって、画像全体での特徴点の密度を考慮することで、対象物以外の要素の出現度が相対的に高い画像を排除することができる。
[第3の手法(画像の周縁部および全体の双方の密度で判定)]
選択部13は、上記第1および第2の手法を用いて、どちらの判定でも対象物以外の要素の出現度が所定の閾値より低いとの結果が出た組合せデータのみを選択してもよい。この場合には、画像HbまたはHcを含むような組合せデータを排除して、画像Haを含むような組合せデータを選択することができる。
このように、選択部13は様々な手法を用いて特定の組合せデータを選択することができる。なお、選択部13は特徴点の密度と所定の閾値とを比較して組合せデータを廃棄するか選択するかを決めるので、特徴点の抽出結果や閾値の高低などの事情により、対象物以外の要素が現れた画像を含む組合せデータが選択されることがあり得る。しかし、選択部13の処理により、機械学習などに適した組合せデータを多くかつ効率的に得ることができる。
選択部13は、選択した組合せデータを処理結果23として出力する。処理結果23の出力先は何ら限定されない。例えば、選択部13は処理結果23をモニタ上に表示したりプリンタに印刷したりしてもよいし、処理結果23をテキストファイルに書き出してもよいし、処理結果23をメモリやデータベースなどの記憶装置に格納してもよい。あるいは、選択部13は処理結果23を通信ネットワーク経由で他のコンピュータシステム(例えば機械学習用のシステム)に出力してもよい。
次に、図9を用いて、情報処理システム10の動作を説明するとともに本実施形態に係る情報処理方法について説明する。
まず、抽出部11がログ記憶部21からログを取得し(ステップS11)、そのログに基づいて、ユーザにより指定された語句と、その語句に対応して表示された画像データとを抽出する(ステップS12、抽出ステップ)。この抽出方法は上記の通り様々である。例えば、抽出部11は画像データの表示のみを考慮してもよいし、画像データが表示された後のユーザの操作を考慮してもよいし、画像データの表示時間を考慮してもよい。
続いて、生成部12が画像データと語句に基づく名称とを関連付けることで組合せデータを生成する(ステップS13、生成ステップ)。この生成方法についても上記の通り様々である。例えば、名称の候補が一つの場合には、生成部12は単純にその名称を対応する各画像データと関連付ける。名称の候補が複数の場合には、生成部12は一般名称/固有名称を考慮する手法を用いるか、検索キーワード/カテゴリを考慮する手法を用いるか、あるいはその二つの手法の双方を用いてもよい。また、生成部12はユーザに指定された語句そのものを名称として設定してもよいし、該語句に基づいて生成した新たな文字列を名称として設定してもよい。
続いて、選択部13が画像内での対象物以外の要素の出現度を考慮して組合せデータを選択する(ステップS14)。この選択方法についても上記の通り様々である。例えば、選択部13は画像周縁部での特徴点の密度が低い画像データを有する組合せデータを選択してもよいし、画像全体での特徴点の密度が低い画像データを有する組合せデータを選択してもよい。あるいは、選択部13はそれら二種類の密度の双方を考慮して組合せデータを選択してもよい。最後に、選択部13が選択した組合せデータを処理結果として出力する(ステップS15)。その処理結果は、機械学習による一般物体認識に用いられてもよいし、他の目的で用いられてもよい。
次に、図10を用いて、情報処理システム10を実現するための情報処理プログラムP1を説明する。
情報処理プログラムP1は、メインモジュールP10、抽出モジュールP11、生成モジュールP12、および選択モジュールP13を備える。
メインモジュールP10は、組合せデータの生成に関する処理を統括的に制御する部分である。抽出モジュールP11、生成モジュールP12、および選択モジュールP13を実行することにより実現される機能はそれぞれ、上記の抽出部11、生成部12、および選択部13の機能と同様である。
情報処理プログラムP1は、例えば、CD−ROMやDVD−ROM、半導体メモリなどの有形の記録媒体に固定的に記録された上で提供されてもよい。また、情報処理プログラムP1は、搬送波に重畳されたデータ信号として通信ネットワークを介して提供されてもよい。
以上説明したように、本発明の一側面に係る情報処理システムは、ユーザ端末から送信されたリクエストに含まれる、ユーザにより指定された語句と、該リクエストに応答して該ユーザ端末上に選択肢として表示された画像とを抽出する抽出部と、画像に対応しかつ画像記憶部から得られた画像データと、語句に基づく名称とを関連付けることで組合せデータを生成する生成部とを備える。
本発明の一側面に係る情報処理方法は、プロセッサを備える情報処理システムにより実行される情報処理方法であって、ユーザ端末から送信されたリクエストに含まれる、ユーザにより指定された語句と、該リクエストに応答して該ユーザ端末上に選択肢として表示された画像とを抽出する抽出ステップと、画像に対応しかつ画像記憶部から得られた画像データと、語句に基づく名称とを関連付けることで組合せデータを生成する生成ステップとを含む。
本発明の一側面に係る情報処理プログラムは、ユーザ端末から送信されたリクエストに含まれる、ユーザにより指定された語句と、該リクエストに応答して該ユーザ端末上に選択肢として表示された画像とを抽出する抽出部と、画像に対応しかつ画像記憶部から得られた画像データと、語句に基づく名称とを関連付けることで組合せデータを生成する生成部としてコンピュータを機能させる。
このような側面においては、ユーザにより指定された語句と画像データとの対応が得られ、その語句に基づく名称および画像データが互いに関連付けられる。したがって、人手を介さずに画像と名称との組合せを自動的に収集することができる。
画像データの対象物に対して予め設定されている属性(すなわち、画像データの提供者が設定した属性)をそのまま画像データに関連付けることで組合せデータを生成することも考えられる。例えば、オンライン・ショッピング・サイトでは一般に、各商品について商品カテゴリが設定されるので、商品の画像データとその商品カテゴリ名とを関連付けることで組合せデータを生成することが考えられる。しかし、画像データの提供者が適切でない属性を設定することがあるので(例えば、オンライン・ショッピング・サイトにおいて商品カテゴリの設定が適切でない場合がある)、予め設定された属性を頼りにしてしまうと、機械学習などへの利用に適さない組合せデータが多くできてしまう。
これに対して、本実施形態では、画像データのラベル付けに用いられる名称は、ページを閲覧するユーザにより指定されたものである。このように、ページ処理に関するログから抽出されたユーザ操作に基づいて画像データをラベル付けすることで、従来よりも精度の高い組合せデータを生成することができる。画像と名称とを関連付けて組合せデータを生成する処理を繰り返すことで、多くの組合せデータを得ることができる。例えば機械学習に適した多くのトレーニングデータを自動的に収集することができる。
他の側面に係る情報処理システムでは、抽出部が、ユーザ端末上に表示された後にユーザにより選択された画像を抽出してもよい。表示された画像がユーザに選択されたということは、ユーザが、自ら指定した名称にその画像が対応すると判断した蓋然性が高いと推定される。このような一般人の判断をログで示される事実から推定して、ユーザに選択された画像だけを抽出することで、精度の高い組合せデータを自動的に生成することができる。
他の側面に係る情報処理システムでは、抽出部が、ユーザ端末上に表示された後にユーザにより他の画像との比較のために選択された画像を抽出してもよい。表示された画像が比較のためにユーザに選択されたということは、ユーザが自ら指定した名称にその画像が対応すると判断した蓋然性が高いと推定される。このような一般人の判断をログで示される事実から推定して、ユーザに選択された画像だけを抽出することで、精度の高い組合せデータを自動的に生成することができる。
他の側面に係る情報処理システムでは、抽出部が、ユーザ端末上に表示された後にユーザにより複数回選択された画像を抽出してもよい。表示された画像がユーザに複数回選択されたということは、ユーザが、自ら指定した名称にその画像が対応すると判断した蓋然性が高いと推定される。したがって、上記と同様の理由により、精度の高い組合せデータを自動的に生成することができる。
他の側面に係る情報処理システムでは、抽出部が、ユーザ端末上に所定の時間以上表示された画像を抽出してもよい。画像がある程度長く表示されたということは、ユーザが、自ら指定した名称にその画像が対応すると判断した蓋然性が高いと推定される。このような一般人の判断をログで示される事実から推定して、ユーザに選択された画像だけを抽出することで、精度の高い組合せデータを自動的に生成することができる。
他の側面に係る情報処理システムでは、生成部が、語句が一般名称である場合に限って、画像データと名称とを関連付けてもよい。このように一般名称を用いて画像データをラベル付けすることで、汎用的な組合せデータを生成することができる。
他の側面に係る情報処理システムでは、ユーザにより指定された語句が、検索キーワードと、画像データの対象物の属性とであり、生成部が、検索キーワードが一般名称である場合には画像データと検索キーワードに基づく名称とを関連付け、検索キーワードが固有名称である場合には画像データと属性に基づく名称とを関連付けてもよい。この場合には、検索条件の態様に応じて組合せデータを生成することができる。一般に、検索キーワードの方が属性(例えば商品カテゴリ)よりも具体的な記述であることが多い。したがって、検索キーワードが一般名称であれば該キーワードに基づく名称を画像データと関連付けることで、精度の高い組合せデータを自動的に生成することができる。一方で、その検索キーワードが固有名称である場合には属性に基づく名称を用いて画像データをラベル付けすることで、汎用的な組合せデータを生成することができる。
他の側面に係る情報処理システムは、対象物の画像データと名称とが関連付けられた組合せデータを解析して画像内の特徴点を抽出し、該特徴点の分布に基づいて、該対象物以外の要素の出現度が所定の閾値より低い場合に該組合せデータを選択する選択部を備える。
他の側面に係る情報処理方法は、プロセッサを備える情報処理システムにより実行される情報処理方法であって、対象物の画像データと名称とが関連付けられた組合せデータを解析して画像内の特徴点を抽出し、該特徴点の分布に基づいて、該対象物以外の要素の出現度が所定の閾値より低い場合に該組合せデータを選択する選択ステップを含む。
他の側面に係る情報処理プログラムは、対象物の画像データと名称とが関連付けられた組合せデータを解析して画像内の特徴点を抽出し、該特徴点の分布に基づいて、該対象物以外の要素の出現度が所定の閾値より低い場合に該組合せデータを選択する選択部としてコンピュータを機能させる。
このような側面においては、画像内の特徴点の分布に基づいて対象物以外の要素の出現度が低い組合せデータだけが選択されるので、対象物以外の要素が画像中になるべく現れていない画像データを取得することができる。このような画像データは様々な目的に利用可能である。
以上、本発明をその実施形態に基づいて詳細に説明した。しかし、本発明は上記実施形態に限定されるものではない。本発明は、その要旨を逸脱しない範囲で様々な変形が可能である。
情報処理システム10において選択部13は必須ではない。情報処理システム10ではなく他のコンピュータシステムが選択部13を備えてもよい。例えば、抽出部11および生成部12を備える情報処理システムと、選択部13を備える別の情報処理システムとが存在し、組合せデータなどの必要なデータが通信ネットワークを介してこれらのシステム間で伝送されてもよい。あるいは、どのシステムも選択部13を備えなくてもよい。
組合せデータの利用目的は何ら限定されず、一般物体認識のための機械学習以外のために組合せデータを用いてもよい。したがって、情報処理システム10はその機械学習のための専用システムではなく、汎用システムである。
上記実施形態では情報処理システム10がログを参照することで画像データと語句との対応を抽出したが、情報処理システムはログを用いることなく画像データと語句との対応を抽出してもよい。具体的には、抽出部はユーザ端末からサーバに送信されたリクエストと、そのリクエストに応答してサーバからユーザ端末に送信されたページとを該サーバから取得する。そして、抽出部はユーザにより指定された語句をそのリクエストから抽出するとともに、検索結果および/または選択肢として表示された画像をそのページから抽出する。この場合には、抽出部は、ユーザにより選択された画像、またはユーザ端末上に所定の時間以上表示された画像も、ユーザからサーバに送信されたデータを該サーバから取得することで抽出する。
上記実施形態では抽出部11が商品データベース22から画像データを取得したが、生成部が画像記憶部から画像データを取得してもよい。
10…情報処理システム、11…抽出部、12…生成部、13…選択部、21…ログ記憶部、22…商品データベース、P1…情報処理プログラム、P10…メインモジュール、P11…抽出モジュール、P12…生成モジュール、P13…選択モジュール。

Claims (11)

  1. ユーザ端末から送信されたリクエストに含まれる、オンライン・ショッピング・サイトでユーザにより指定された語句と、該リクエストに応答して該ユーザ端末上に選択肢として表示された商品画像とを抽出する抽出部と、
    前記商品画像に対応しかつ画像記憶部から得られた商品画像データと、前記語句に基づく一般名称とを関連付けることで、該商品画像データが該一般名称によりラベル付けされた、一般物体認識のための機械学習で用いられる組合せデータを生成する生成部とを備える情報処理システム。
  2. 前記抽出部が、前記ユーザ端末上に表示された後に前記ユーザにより選択された前記商品画像を抽出する、
    請求項1に記載の情報処理システム。
  3. 前記抽出部が、前記ユーザ端末上に表示された後に前記ユーザにより他の画像との比較のために選択された前記商品画像を抽出する、
    請求項2に記載の情報処理システム。
  4. 前記抽出部が、前記ユーザ端末上に表示された後に前記ユーザにより複数回選択された前記商品画像を抽出する、
    請求項2に記載の情報処理システム。
  5. 前記抽出部が、前記ユーザ端末上に所定の時間以上表示された前記商品画像を抽出する、
    請求項1に記載の情報処理システム。
  6. 前記ユーザにより指定された語句が、検索キーワードと、商品画像データの対象物の属性とであり、
    前記生成部が、前記検索キーワードが一般名称である場合には前記商品画像データと前記検索キーワードに基づく前記一般名称とを関連付け、前記検索キーワードが固有名称である場合には前記商品画像データと前記属性に基づく前記一般名称とを関連付ける、
    請求項1〜5のいずれか一項に記載の情報処理システム。
  7. ユーザ端末から送信されたリクエストに含まれる、ユーザにより指定された語句と、該リクエストに応答して該ユーザ端末上に選択肢として表示された画像とを抽出する抽出部と、
    前記画像に対応しかつ画像記憶部から得られた画像データと、前記語句に基づく名称とを関連付けることで組合せデータを生成する生成部とを備え、
    前記ユーザにより指定された語句が、検索キーワードと、画像データの対象物の属性とであり、
    前記生成部が、前記検索キーワードが一般名称である場合には前記画像データと前記検索キーワードに基づく前記名称とを関連付け、前記検索キーワードが固有名称である場合には前記画像データと前記属性に基づく前記名称とを関連付ける、
    情報処理システム。
  8. プロセッサを備える情報処理システムにより実行される情報処理方法であって、
    ユーザ端末から送信されたリクエストに含まれる、オンライン・ショッピング・サイトでユーザにより指定された語句と、該リクエストに応答して該ユーザ端末上に選択肢として表示された商品画像とを抽出する抽出ステップと、
    前記商品画像に対応しかつ画像記憶部から得られた商品画像データと、前記語句に基づく一般名称とを関連付けることで、該商品画像データが該一般名称によりラベル付けされた、一般物体認識のための機械学習で用いられる組合せデータを生成する生成ステップと
    を含む情報処理方法。
  9. プロセッサを備える情報処理システムにより実行される情報処理方法であって、
    ユーザ端末から送信されたリクエストに含まれる、ユーザにより指定された語句と、該リクエストに応答して該ユーザ端末上に選択肢として表示された画像とを抽出する抽出ステップと、
    前記画像に対応しかつ画像記憶部から得られた画像データと、前記語句に基づく名称とを関連付けることで組合せデータを生成する生成ステップとを含み、
    前記ユーザにより指定された語句が、検索キーワードと、画像データの対象物の属性とであり、
    前記生成ステップでは、前記検索キーワードが一般名称である場合には前記画像データと前記検索キーワードに基づく前記名称とを関連付け、前記検索キーワードが固有名称である場合には前記画像データと前記属性に基づく前記名称とを関連付ける、
    情報処理方法。
  10. ユーザ端末から送信されたリクエストに含まれる、オンライン・ショッピング・サイトでユーザにより指定された語句と、該リクエストに応答して該ユーザ端末上に選択肢として表示された商品画像とを抽出する抽出部と、
    前記商品画像に対応しかつ画像記憶部から得られた商品画像データと、前記語句に基づく一般名称とを関連付けることで、該商品画像データが該一般名称によりラベル付けされた、一般物体認識のための機械学習で用いられる組合せデータを生成する生成部と
    してコンピュータを機能させるための情報処理プログラム。
  11. ユーザ端末から送信されたリクエストに含まれる、ユーザにより指定された語句と、該リクエストに応答して該ユーザ端末上に選択肢として表示された画像とを抽出する抽出部と、
    前記画像に対応しかつ画像記憶部から得られた画像データと、前記語句に基づく名称とを関連付けることで組合せデータを生成する生成部としてコンピュータを機能させ、
    前記ユーザにより指定された語句が、検索キーワードと、画像データの対象物の属性とであり、
    前記生成部が、前記検索キーワードが一般名称である場合には前記画像データと前記検索キーワードに基づく前記名称とを関連付け、前記検索キーワードが固有名称である場合には前記画像データと前記属性に基づく前記名称とを関連付ける、
    情報処理プログラム。
JP2014555033A 2014-03-18 2014-03-18 情報処理システム、情報処理方法、および情報処理プログラム Active JP5767413B1 (ja)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/JP2014/057323 WO2015140922A1 (ja) 2014-03-18 2014-03-18 情報処理システム、情報処理方法、および情報処理プログラム

Publications (2)

Publication Number Publication Date
JP5767413B1 true JP5767413B1 (ja) 2015-08-19
JPWO2015140922A1 JPWO2015140922A1 (ja) 2017-04-06

Family

ID=53888056

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2014555033A Active JP5767413B1 (ja) 2014-03-18 2014-03-18 情報処理システム、情報処理方法、および情報処理プログラム

Country Status (3)

Country Link
US (1) US10402449B2 (ja)
JP (1) JP5767413B1 (ja)
WO (1) WO2015140922A1 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6154968B1 (ja) * 2015-12-28 2017-06-28 楽天株式会社 情報処理装置、情報処理方法及び情報処理プログラム

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20160015838A (ko) * 2014-07-31 2016-02-15 삼성전자주식회사 컨텐츠 분류 방법 및 이를 위한 디바이스
EP3731108A4 (en) * 2018-03-16 2020-11-18 Rakuten, Inc. RESEARCH SYSTEM, RESEARCH PROCESS AND PROGRAM
CN111221882A (zh) * 2018-11-26 2020-06-02 英业达科技有限公司 搜寻方法及搜寻系统

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7657100B2 (en) * 2005-05-09 2010-02-02 Like.Com System and method for enabling image recognition and searching of images
JP2008027154A (ja) * 2006-07-20 2008-02-07 Seiko Epson Corp 画像表示装置及びプログラム
JP5094891B2 (ja) * 2010-01-28 2012-12-12 ヤフー株式会社 検索スコア算出装置
JP5663742B2 (ja) * 2010-09-21 2015-02-04 ネイバー コーポレーションNAVER Corporation 画像検索サーバ及び画像検索サーバの画像情報管理方法
US20120117051A1 (en) * 2010-11-05 2012-05-10 Microsoft Corporation Multi-modal approach to search query input
JP2012113348A (ja) * 2010-11-19 2012-06-14 Ntt Docomo Inc 分類装置、コンテンツ検索システム、コンテンツ分類方法、コンテンツ検索方法及びプログラム
JP5693369B2 (ja) * 2011-05-13 2015-04-01 キヤノン株式会社 情報処理装置、その制御方法及びコンピュータプログラム
JP5656768B2 (ja) 2011-08-08 2015-01-21 日本放送協会 画像特徴量抽出装置およびそのプログラム
JP5998807B2 (ja) * 2012-09-28 2016-09-28 株式会社メルコホールディングス 情報処理システム、情報処理装置、情報処理方法及び情報処理プログラム
US20140129552A1 (en) * 2012-11-02 2014-05-08 Linkedln Corporation Leveraging homophily in ranking search results
US20140344259A1 (en) * 2013-05-15 2014-11-20 Google Inc. Answering people-related questions

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6154968B1 (ja) * 2015-12-28 2017-06-28 楽天株式会社 情報処理装置、情報処理方法及び情報処理プログラム
WO2017115420A1 (ja) * 2015-12-28 2017-07-06 楽天株式会社 情報処理装置、情報処理方法及び情報処理プログラム
US11416905B2 (en) 2015-12-28 2022-08-16 Rakuten Croup. Inc. Information processing device, information processing method, and information processing program for associating categories with items using feature points of a reference image

Also Published As

Publication number Publication date
US20170124120A1 (en) 2017-05-04
US10402449B2 (en) 2019-09-03
JPWO2015140922A1 (ja) 2017-04-06
WO2015140922A1 (ja) 2015-09-24

Similar Documents

Publication Publication Date Title
RU2720536C1 (ru) Фреймворк приема видео для платформы визуального поиска
US10146743B2 (en) Systems and methods for optimizing content layout using behavior metrics
KR101511050B1 (ko) 상품 정보를 제공하고 표시하는 방법, 장치, 시스템 및 컴퓨터 프로그램
US9348935B2 (en) Systems and methods for augmenting a keyword of a web page with video content
US10133710B2 (en) Generating preview data for online content
US10503803B2 (en) Animated snippets for search results
AU2014309040B9 (en) Presenting fixed format documents in reflowed format
US20130054356A1 (en) Systems and methods for contextualizing services for images
US20130054672A1 (en) Systems and methods for contextualizing a toolbar
US20150006333A1 (en) Generating websites and online stores from seed input
US20150007022A1 (en) Generating websites and business documents from seed input
TW201118620A (en) Systems and methods for providing advanced search result page content
US20140249935A1 (en) Systems and methods for forwarding users to merchant websites
US20180121470A1 (en) Object Annotation in Media Items
US20150302011A1 (en) Image management device, image generation program, image management method, and image management program
US9183577B2 (en) Selection of images to display next to textual content
US9679081B2 (en) Navigation control for network clients
JP5767413B1 (ja) 情報処理システム、情報処理方法、および情報処理プログラム
JP2008146492A (ja) 情報提供装置、情報提供方法、及びコンピュータプログラム
US8903817B1 (en) Determining search relevance from user feedback
US20190318386A1 (en) Information processing method, program, information processing system, and information processing apparatus
JP6499763B2 (ja) ビデオ情報に対して検証を行うための方法及び装置
US20230044463A1 (en) System and method for locating products
WO2013033445A2 (en) Systems and methods for contextualizing a toolbar, an image and inline mobile banner advertising
JP5669330B2 (ja) レコメンド装置、レコメンド方法、およびレコメンドプログラム

Legal Events

Date Code Title Description
TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20150616

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20150618

R150 Certificate of patent or registration of utility model

Ref document number: 5767413

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: R3D02

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S533 Written request for registration of change of name

Free format text: JAPANESE INTERMEDIATE CODE: R313533

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250