JP2018032304A - 情報解析装置、情報解析方法、および情報解析プログラム - Google Patents

情報解析装置、情報解析方法、および情報解析プログラム Download PDF

Info

Publication number
JP2018032304A
JP2018032304A JP2016165503A JP2016165503A JP2018032304A JP 2018032304 A JP2018032304 A JP 2018032304A JP 2016165503 A JP2016165503 A JP 2016165503A JP 2016165503 A JP2016165503 A JP 2016165503A JP 2018032304 A JP2018032304 A JP 2018032304A
Authority
JP
Japan
Prior art keywords
content
vector
query
information
search
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2016165503A
Other languages
English (en)
Other versions
JP6160018B1 (ja
Inventor
進一郎 安井
Shinichiro Yasui
進一郎 安井
カウステューブ クルカルニ
Kausuteyubu Kulkarni
カウステューブ クルカルニ
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Yahoo Japan Corp
Original Assignee
Yahoo Japan Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Yahoo Japan Corp filed Critical Yahoo Japan Corp
Priority to JP2016165503A priority Critical patent/JP6160018B1/ja
Application granted granted Critical
Publication of JP6160018B1 publication Critical patent/JP6160018B1/ja
Publication of JP2018032304A publication Critical patent/JP2018032304A/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

【課題】コンテンツに対して適切なメタ情報を付与することができる情報解析装置、情報解析方法、および情報解析プログラムを提供する。【解決手段】情報解析装置は、コンテンツの検索時に入力された検索クエリと、検索クエリの入力に応じて選択されたコンテンツとが対応付けられた履歴情報に基づいて、履歴情報に含まれる着目コンテンツに関して、着目コンテンツに対応付けられた検索クエリを抽出する抽出部と、抽出部により抽出された検索クエリがベクトルに変換されたクエリベクトルに対して、着目コンテンツが選択されたことへの寄与度を示す指標値に基づく重みを付与する付与部と、付与部により重みが付与されたクエリベクトルに基づいて、着目コンテンツに関連付けるメタ情報を生成する生成部と、を備える。【選択図】図2

Description

本発明は、情報解析装置、情報解析方法、および情報解析プログラムに関する。
従来、画像などの複数のコンテンツの中から、あるコンテンツに類似したコンテンツを、近似最近傍探索手法などを用いて検索する技術が知られている(例えば、特許文献1参照)。この技術では、コンテンツを高次元の特徴ベクトルで表現し、特徴ベクトル間の距離に基づいて類似検索を行っている。
特開2012−78930号公報
しかしながら、従来の技術では、コンテンツ自体を特徴ベクトルに変換するため、特定のニューラルネットワーク(Convolutional Neural Network:CNN)での利用に制限されたり、機械学習モデルの素性として利用する利便性が低下したりする場合があった。また、コンテンツ自体の特徴ベクトルをコンテンツのメタ情報として用いる場合、利用者の意図が反映されず、メタ情報が適切でなくなる場合があった。
本発明は、上記の課題に鑑みてなされたものであって、コンテンツに対して適切なメタ情報を付与することができる情報解析装置、情報解析方法、および情報解析プログラムを提供することを目的としている。
本発明の一態様は、コンテンツの検索時に入力された検索クエリと、前記検索クエリの入力に応じて選択されたコンテンツとが対応付けられた履歴情報に基づいて、前記履歴情報に含まれる着目コンテンツに関して、前記着目コンテンツに対応付けられた検索クエリを抽出する抽出部と、前記抽出部により抽出された検索クエリがベクトルに変換されたクエリベクトルに対して、前記着目コンテンツが選択されたことへの寄与度を示す指標値に基づく重みを付与する付与部と、前記付与部により重みが付与されたクエリベクトルに基づいて、前記着目コンテンツに関連付けるメタ情報を生成する生成部と、を備える情報解析装置である。
本発明の一態様によれば、コンテンツに対して適切なメタ情報を付与することができる。
第1実施形態における情報解析装置100を含む情報解析システム1の一例を示す図である。 第1実施形態における情報解析装置100の一例を示す図である。 ログ情報131の一例を示す図である。 コーパス132の一例を示す図である。 ベクトル変換情報133の一例を示す図である。 画像ベクトルの生成方法を説明するための図である。 コンテンツベクトル情報135の一例を示す図である。 第1実施形態における情報解析システム1による一連の処理の流れの一例を示すフローチャートである。 サービス提供装置20による分析処理結果の一例を示す図である。 第2実施形態における情報解析装置100Aの一例を示す図である。 ショッピングログ情報140の一例を示す図である。 コーパス132の他の例を示す図である。 転置アイテム検索ログ情報134bの一例を示す図である。 コンテンツベクトルのクラスタリングの様子を示す図である。 画像と位置情報との関連性について分析した分析結果の利用例を模式的に示す図である。 第3実施形態における情報解析装置100Bの一例を示す図である。 実施形態のサービス提供装置20および情報解析装置100、100A、100Bのハードウェア構成の一例を示す図である。
以下、本発明を適用した情報解析装置、情報解析方法、および情報解析プログラムを、図面を参照して説明する。
[概要]
情報解析装置は、一以上のプロセッサによって実現される。情報解析装置は、コンテンツの検索時に入力された検索クエリが、ベクトルに変換されたクエリベクトルを取得または導出し、当該クエリベクトルに対してコンテンツの選択に寄与した程度に基づく重みを付与し、重みを付与したクエリベクトルに基づいて、メタ情報を生成してコンテンツに付与する装置である。コンテンツに付与されたメタ情報は、コンテンツ間の類似検索や、検索クエリ−コンテンツ間の類似検索など、種々の類似検索に利用することができる。
検索クエリとは、例えば、インターネット上のウェブ画像、或いは端末装置により表示されるアプリ画像の検索窓に入力された、単語や文章(複合語)のことをいう。また、コンテンツは、例えば、画像や、音声、動画などであってもよいし、画像などを参照するための参照子(例えばURL(Uniform Resource Locator))であってもよい。
また、ウェブ画像やアプリ画像が、ショッピングサイトやオークションサイトなどのように、商品またはサービス(以下、アイテムと称する)を販売するための画像である場合、コンテンツは、その画像で販売されるアイテムそのもの、或いはアイテムの画像などであってもよい。そして、上述したクエリベクトルは、例えば、検索クエリに対して分散表現の考え方に基づいて導出されたものである。以下、検索クエリは画像検索サイトに入力され、コンテンツは画像検索サイトで提供される画像であるものとして説明する。
<第1実施形態>
[全体構成]
図1は、第1実施形態における情報解析装置100を含む情報解析システム1の一例を示す図である。第1実施形態における情報解析システム1は、例えば、ログ取得装置10と、サービス提供装置20と、クエリ‐ベクトル変換装置30と、情報解析装置100とを備える。これらの装置は、ネットワークNWを介して接続される。なお、情報解析システム1に含まれる複数の装置の一部または全部は、一つの情報解析装置100内に集約されていてもよい。
図1に示す各装置は、ネットワークNWを介して種々の情報を送受信する。ネットワークNWは、例えば、無線基地局、Wi‐Fiアクセスポイント、通信回線、プロバイダ、インターネットなどを含む。なお、図1に示す各装置の全ての組み合わせが相互に通信可能である必要はなく、ネットワークNWは、一部にローカルなネットワークを含んでもよい。
ログ取得装置10は、画像検索サイトにおいて入力された検索クエリ、検索結果として提示された画像の中から選択された画像などを含むログを取得する。ログには、入力または選択された時刻、或いは、取得された時刻が付与されていてよい。ログ取得装置10は、自らが画像検索サイトを提供するウェブサーバ装置であってもよいし、別体のウェブサーバ装置(不図示)からログを取得する装置であってもよい。ログ取得装置10は、取得したログに基づくログ情報を、情報解析装置100に送信する。
サービス提供装置20は、情報解析装置100により送信された情報を分析して、種々のサービスを提供する。例えば、サービス提供装置20は、端末装置に広告を表示させる広告サービスを提供してもよいし、ウェブサイトのアクセスログを分析する分析サービスを提供してもよい。また、サービス提供装置20は、地図情報などを提供する地図検索サービスを提供してもよい。サービス提供装置20は、例えば、画像検索サイトに検索クエリを入力したユーザと、検索クエリの入力によって提示された画像との関連性を分析したり、情報解析装置100により送信された情報を機械学習したり、画像同士の関連性を分析したりすることで、自身が提供するサービスに分析結果を反映させてもよい。
クエリ‐ベクトル変換装置30は、情報解析装置100から受信したコーパスに含まれる検索クエリを、例えば分散表現としてのクエリベクトルに変換する。例えば、クエリ‐ベクトル変換装置30は、word2vecと称されているツール(プログラム)を利用して、検索クエリをクエリベクトルに変換する。word2vecとは、ニューラルネットワークと呼ばれるモデルを利用したツールであり、入力されたコーパスに含まれる単語(検索クエリ)を、その単語の特徴を示す特徴ベクトルに変換して出力するものである。コーパスとは、複数の単語などが記載されたテキスト情報である。
情報解析装置100は、画像検索サイトにおいて検索された画像に、当該画像を検索する際に入力された検索クエリから変換されたクエリベクトルに基づいて多次元のコンテンツベクトルを生成し、検索クエリの入力に応じて検索されたコンテンツに対して、生成したコンテンツベクトルをメタ情報として関連付ける。
[情報解析装置の構成]
以下、図を参照して情報解析装置100の構成について説明する。図2は、第1実施形態における情報解析装置100の一例を示す図である。図示のように、情報解析装置100は、例えば、通信部102と、制御部110と、記憶部130とを備える。
通信部102は、例えば、NIC(Network Interface Card)等の通信インターフェースやDMA(Direct Memory Access)コントローラを含む。通信部102は、ネットワークNWを介して、ログ取得装置10、サービス提供装置20、またはクエリ‐ベクトル変換装置30と通信する。例えば、通信部102は、ログ取得装置10からログ情報を受信し、記憶部130にログ情報131として記憶させる。ログ情報131は、「履歴情報」の一例である。また、通信部102は、クエリ‐ベクトル変換装置30により送信された情報を受信し、ベクトル変換情報133として記憶部130に記憶させる。通信部102は、「取得部」の一例である。
図3は、ログ情報131の一例を示す図である。ログ情報131は、例えば、一つの検索クエリに対して、一以上の画像の識別子(図中画像ID)と、時刻とが対応付けられた情報である。ログ情報131において検索クエリに対応付けられる画像の識別子は、検索クエリの入力に応じて提示された複数の画像のうち、クリックやタップなどのユーザの操作によって選択された画像の識別子である。
また、ログ情報131において検索クエリに対応付けられる時刻は、検索クエリが入力された時刻であってもよいし、検索クエリの入力に応じて提示された画像が選択された時刻であってもよい。一つの検索クエリの入力に応じて提示された複数の画像から、ユーザの操作によって複数の画像が選択された場合には、図示のように、複数の検索クエリに対して同じ画像の識別子が対応付けられてよい。その逆に、複数の単語から構成される文章が検索クエリとして入力された場合は、複数の単語すなわち複数の検索クエリに対して一つの画像の識別子が対応付けられてよい。
なお、ログ情報131は、検索クエリや画像IDを示す情報であるものとしたが、画像IDに代えて(或いは、加えて)、その画像IDを参照するための参照子(例えばURL)や画像データそのものがログ情報131に格納されてもよい。
ここで、図2の説明に戻る。制御部110は、例えば、コーパス生成部112と、抽出部114と、重み付与部116と、コンテンツベクトル生成部118と、コンテンツ関連付部120とを備える。
これらの構成要素は、例えば、CPU(Central Processing Unit)などのプロセッサが記憶部130に格納されたプログラムを実行することにより実現される。また制御部110の構成要素の一部または全部は、LSI(Large Scale Integration)、ASIC(Application Specific Integrated Circuit)、またはFPGA(Field-Programmable Gate Array)などのハードウェア(回路部;circuitry)により実現されてもよいし、ソフトウェアとハードウェアの協働によって実現されてもよい。
記憶部130は、例えば、HDD(Hard Disc Drive)、フラッシュメモリ、EEPROM(Electrically Erasable Programmable Read Only Memory)、ROM(Read Only Memory)、またはRAM(Random Access Memory)、或いはこれらのうち複数を組み合わせたハイブリッド型記憶装置により実現される。記憶部130は、ファームウェアやアプリケーションプログラムなどの各種プログラムなどを記憶する他、ログ情報131、コーパス132、ベクトル変換情報133、転置ログ情報134、コンテンツベクトル情報135などの情報を記憶する。
コーパス生成部112は、記憶部130に記憶されたログ情報131を参照して、クエリ‐ベクトル変換装置30に送信するコーパス132を生成する。図4は、コーパス132の一例を示す図である。例えば、コーパス生成部112は、ログ情報131に含まれる検索クエリを、画像検索サイトにおいて検索クエリを入力した一人のユーザのセッションごとに集約することで、一つのコーパス132を生成する。
セッションとは、例えば、クッキー等の状態管理機能の有効期間である。例えば、画像検索サイト内のあるウェブページにアクセスしてから所定時間経過(タイムアウト)するまでの期間が一つのセッションとして扱われる。また、セッションとは、画像検索サイト内のあるウェブページにアクセスしてから、当該画像検索サイト内の他のウェブページ、または他のウェブサイト内のウェブページに切り替わるまでの期間であってもよい。また、セッションとは、画像検索サイト内のあるウェブページにアクセスしてから、当該ウェブページを表示するウェブブラウザを閉じるまでの期間であってもよい。
コーパス生成部112は、例えば、ログ情報131の各検索クエリの入力時刻を参照して各セッションの期間を導出することで、セッションごとに検索クエリを集約する。そして、コーパス生成部112は、一人のユーザの各セッションにおいて入力された検索クエリを集約したコーパス132を、通信部102を用いてクエリ‐ベクトル変換装置30に送信する。これを受けて、クエリ‐ベクトル変換装置30は、コーパス132に含まれる検索クエリを示す単語をクエリベクトルに変換して、検索クエリとクエリベクトルとの組み合わせ(ペア)を複数含むベクトル変換情報133を、情報解析装置100に送信する。
図5は、ベクトル変換情報133の一例を示す図である。図示のように、ベクトル変換情報133は、検索クエリに対して、その検索クエリから変換されたクエリベクトルが対応付けられている。
抽出部114は、例えば、まず、記憶部130に記憶されたログ情報131に基づいて、転置ログ情報134を生成する。なお、抽出部114による転置ログ情報134の生成機能は、ログ取得装置10が備えてもよく、この場合、情報解析装置100は、ログ取得装置10から、転置ログ情報134と同等の情報を取得する。転置ログ情報134は、「履歴情報」の他の例である。
図6は、転置ログ情報134の一例を示す図である。転置ログ情報134は、例えば、ログ情報131における検索クエリおよび画像の識別子のフィールド情報(列の情報)を入れ替え、一つの画像の識別子に対して、一以上の検索クエリと、時刻とが対応付けられた情報である。ログ情報131において複数の検索クエリにそれぞれ、共通する一つの画像の識別子が対応付けられている場合、転置ログ情報134において、当該一つの画像の識別子に複数の検索クエリが対応付けられてよい。
そして、抽出部114は、転置ログ情報134に含まれる複数の画像の識別子のうち、着目する画像の識別子(以下、着目画像IDと称する)を選択して、着目画像IDに対応付けられた検索クエリ(以下、着目検索クエリと称する)を転置ログ情報134から抽出する。なお、抽出部114は、転置ログ情報134を生成する処理を省略してもよい。この場合、抽出部114は、ログ情報131から直接、着目画像IDに対応付けられた着目検索クエリを抽出する。着目画像IDが示す画像は、「着目コンテンツ」の一例である。
重み付与部116は、通信部102によってクエリ‐ベクトル変換装置30から受信されたベクトル変換情報133を検索し、抽出部114により抽出された着目検索クエリに対応付けられたクエリベクトルに対して、所定の評価値に基づく重みを付与する。
所定の評価値とは、検索クエリのそれぞれに関する、着目画像IDにより示される着目画像が選択されたことへの寄与の程度を示す指標値である。具体的には、評価値は、例えば、セッション中において、着目検索クエリが入力されることに応じた着目画像の選択回数を、全ての検索クエリが入力されることに応じた着目画像の選択回数で除算した値である。また、評価値は、本実施例がショッピングサイトやオークションサイトに適用される場合、セッション中において、着目検索クエリが入力されることに応じた着目アイテム(着目画像をアイテムに置き換えたもの)のコンバージョン回数を、セッション中において、全ての検索クエリが入力されることに応じた着目アイテムのコンバージョン回数で除算した値であってもよい。なお、コンバージョンとは、アイテムの購買や詳細情報の問い合わせなど、アイテムの提供主が期待する所定の行動をとったことを意味する。
また、これらはCTR(Click Through Rate)やCVR(Conversion Rate)の考え方に準じた評価値であるが、これらに限らず、インプレッション数やCPA(Cost Per Acquisition)、CPO(Cost per Order)など、他の観点からコンテンツが選択されたことへの寄与の程度が評価されてもよい。
例えば、重み付与部116は、転置ログ情報134を参照して、着目検索クエリに対応付けられている着目画像の一セッション中の選択回数をカウントし、カウントした着目画像の選択回数を、検索クエリを問わない一セッション中の着目画像の選択回数で除算することで、評価値を導出する。そして、重み付与部116は、着目クエリのクエリベクトルに対して、導出した評価値を重みとして付与する。
コンテンツベクトル生成部118は、重み付与部116によって重みが付与されたクエリベクトルに基づいて、コンテンツベクトルを生成する。本実施形態では、コンテンツが画像であることを前提としているため、コンテンツベクトルを特に「画像ベクトル」と称して説明する。
図7は、画像ベクトルの生成方法を説明するための図である。例えば、一セッション中に、Q1からQ3のそれぞれの検索クエリが画像検索サイトに入力されて、各検索クエリが入力される度に画像IMと画像IMが提示されたとする。このとき、図示のように、画像IMのクリック回数が、「人工衛星」という単語が検索クエリQ1として入力されたときには50回、「地球」という単語が検索クエリQ2として入力されたときには10回、「宇宙」という単語が検索クエリQ3として入力されたときには1回であった場合、画像ベクトルは、以下の数式(1)に基づいて生成される。
数式中、vec(IM)は、画像IMの画像ベクトルを表している。また、vec(人工衛星)は、検索クエリQ1のクエリベクトルを表し、vec(地球)は、検索クエリQ2のクエリベクトルを表し、vec(宇宙)は、検索クエリQ3のクエリベクトルを表している。数式(1)に示すように、画像ベクトルは、重みが付与された複数のクエリベクトルを加算した多次元ベクトルである。また、式中w1は、検索クエリQ1が入力されたことに応じた画像IMのクリック回数(上述した例では50)を表し、w2は、検索クエリQ2が入力されたことに応じた画像IMのクリック回数(上述した例では10)を表し、w3は、検索クエリQ3が入力されたことに応じた画像IMのクリック回数(上述した例では1)を表している。数式(1)に示すように、各検索クエリQのクエリベクトルvec(Q)は、全てのクエリベクトルに対して乗算されるクリック回数の総和で除算されている。すなわち、数式(1)は、クエリベクトルに対して上述した評価値を重みとして付与(乗算)し、加重和を求めた式である。
なお、上述した数式(1)は、画像IMの画像ベクトルの導出式を表すものであるが、他の画像についても同様に画像ベクトルを導出してよい。この際、各クエリベクトルに乗算するw1からw3の値は、適宜変更するものとする。例えば、画像IMの画像ベクトルvec(IM)の導出時には、w1からw3に対して、各検索クエリが入力されたときの画像IMのクリック回数が代入される。また、上述した例では、検索クエリが3種類の場合について説明したがこれに限られず、1、2種類、あるいは4種類以上であってもよい。この場合、数式(1)の右辺の分子におけるクエリベクトルの数を変更してよい。
コンテンツ関連付部120は、コンテンツベクトル生成部118により生成された画像ベクトルを、その画像ベクトルが示す画像(すなわち着目画像)にメタ情報として関連付ける。例えば、コンテンツ関連付部120は、画像に対して画像ベクトルを関連付けた情報を生成し、生成した当該情報をコンテンツベクトル情報135として記憶部130に記憶させる。
図8は、コンテンツベクトル情報135の一例を示す図である。例えば、コンテンツベクトル情報135は、画像の識別子に対して画像ベクトルが対応付けられた情報である。コンテンツ関連付部120は、例えば、画像に対して画像ベクトルを関連付けたコンテンツベクトル情報135を、通信部102を用いてサービス提供装置20に送信する。これを受けて、サービス提供装置20は、コンテンツベクトル情報135を種々のサービスに利用する。
[情報解析システム全体の処理フロー]
以下、情報解析システム1による処理についてフローチャートを用いて説明する。図9は、第1実施形態における情報解析システム1による一連の処理の流れの一例を示すフローチャートである。本フローチャートの処理は、例えば、所定の周期で繰り返し行われる。
まず、ログ取得装置10は、画像検索サイトにおいて入力された検索クエリのログを取得し(S100)、取得したログに基づくログ情報を情報解析装置100に送信する。これを受けて、情報解析装置100の通信部102は、ログ取得装置10からログ情報を受信し、記憶部130にログ情報131として記憶させる。
次に、情報解析装置100のコーパス生成部112は、ログ情報131を参照して、コーパス132を生成し(S102)、生成したコーパス132をクエリ‐ベクトル変換装置30に送信する。
次に、クエリ‐ベクトル変換装置30は、情報解析装置100から受信したコーパス132に含まれる検索クエリをクエリベクトルに変換し(S104)、変換したクエリベクトルと検索クエリとの組み合わせを複数含むベクトル変換情報133を情報解析装置100に送信する。これを受けて、情報解析装置100の通信部102は、クエリ‐ベクトル変換装置30からベクトル変換情報133を受信し、記憶部130に記憶させる。
次に、情報解析装置100の抽出部114は、ログ情報131を参照して、検索クエリと画像の識別子との対応関係を反転させた転置ログ情報134を生成する(S106)。次に、抽出部114は、生成した転置ログ情報134に含まれる複数の画像の識別子の中から、着目画像IDを選択して、当該着目画像IDに対応付けられた着目検索クエリを転置ログ情報134から抽出する(S108)。
次に、情報解析装置100の重み付与部116は、ベクトル変換情報133を検索し、抽出部114により抽出された着目検索クエリに対応付けられたクエリベクトルに対して、所定の評価値に基づく重みを付与する(S110)。
次に、情報解析装置100のコンテンツベクトル生成部118は、重み付与部116によって重みが付与されたクエリベクトルに基づいて、画像ベクトルを生成する(S112)。
次に、情報解析装置100のコンテンツ関連付部120は、コンテンツベクトル生成部118により生成された画像ベクトルを、その画像ベクトルが示す画像にメタ情報として関連付け(S114)、画像に対して画像ベクトルを関連付けたコンテンツベクトル情報135を、通信部102を用いてサービス提供装置20に送信する。
次に、サービス提供装置20は、コンテンツベクトル情報135に含まれる画像ベクトルに基づいて種々の分析を行い(S116)、その分析結果を、例えばウェブサービス上で提供するサービスに反映させる。これによって、本フローチャートの処理が終了する。
[第1実施形態におけるコンテンツベクトルの利用例]
以下、第1実施形態において生成されたコンテンツベクトルの利用例について説明する。例えば、サービス提供装置20は、あるユーザが画像検索サイトに入力した検索クエリを、クエリ‐ベクトル変換装置30に依頼する等してベクトル(以下、ユーザベクトルと称する)に変換し、ユーザベクトルと、画像などのコンテンツをベクトル化したコンテンツベクトル(上述した画像ベクトルに相当するベクトル)との類似性について分析する。ユーザベクトルは、例えば、ユーザを識別することが可能な情報(例えば氏名や電話番号など)をベクトルに変換したものである。
例えば、サービス提供装置20は、ユーザベクトルおよびコンテンツベクトルのノルムと、これらのベクトルの内積とを用いて、コサイン類似度を導出する。以下の数式(2)は、コサイン類似度の導出式を表す。式中x、yのいずれか一方はユーザベクトルを表し、他方はコンテンツベクトルを表している。
図10は、サービス提供装置20による分析処理結果の一例を示す図である。図示のように、分析処理結果を示す情報において、ユーザベクトルに対し、コンテンツベクトルと、コサイン類似度を示す値とが対応付けられている。例えば、サービス提供装置20は、ユーザベクトルに対して、最も類似度の高いコンテンツベクトルや、類似度が所定値(例えば平均値)以上のコンテンツベクトルなどを抽出する。このようなコンテンツベクトルによって表されるコンテンツは、他のコンテンツに比べてユーザの関心の高いコンテンツであると評価することができる。例えば、「サッカー」に高い関心を示すユーザが入力する検索クエリは、「サッカー」に関連した単語であることが多く、また「サッカー」に関連した単語の入力頻度は他の単語の入力頻度に比べて高くなりやすい。そのため、「サッカー」に関連した単語が検索クエリとして入力されると、この検索クエリから変換されたクエリベクトルを用いて生成されたコンテンツベクトルは、他の検索クエリ(例えば野球やバスケットボールなどの検索クエリ)から変換されたクエリベクトルを用いて生成されたコンテンツベクトルに比して、ユーザベクトルとの類似度が高く導出される傾向がある。従って、類似度の高いコンテンツベクトルを抽出して、その抽出したコンテンツベクトルが関連付けられたコンテンツを分析することにより、ユーザの趣味嗜好に合ったコンテンツを特定することができる。例えば、「サッカー」に関連した単語を検索クエリとして頻繁に入力するユーザには、サッカーの試合のチケットの購入案内などを広告することにより、チケットの販売事業の収益をより向上させることができる。
また、サービス提供装置20は、情報解析装置100により生成されたコンテンツベクトルを素性として機械学習を行ってもよい。例えば、サービス提供装置20は、GBDT(Gradient Boosting Decision Tree)やSVM(Support Vector Machine)などの機械学習モデルを利用して、コンテンツベクトルを素性ベクトルとして機械学習モデルに入力する。これによって、例えば、入力されたコンテンツベクトルが二値に分類される。例えば、「きれい」、「美しい」といったポジティブな内容の検索クエリで検索された画像を正例として学習させ、「汚い」、「醜い」といったネガティブな内容の検索クエリで検索された画像を負例として学習させる。これによって、画像そのものの特徴量などから画像を評価するのではなく、その画像の検索時に入力された検索クエリの内容から画像を評価することができる。
以上説明した第1実施形態によれば、コンテンツの検索時に入力された検索クエリと、検索クエリの入力に応じて選択されたコンテンツとが対応付けられたログ情報131或いは転置ログ情報134に基づいて、これらのログ情報に含まれる着目するコンテンツに関して、着目するコンテンツに対応付けられた着目検索クエリを抽出し、着目検索クエリがベクトルに変換されたクエリベクトルに対して、着目するコンテンツが選択されたことへの寄与度を示す指標値に基づく重みを付与し、重みが付与されたクエリベクトルに基づいて、着目するコンテンツに関連付けるメタ情報を生成することにより、コンテンツに対して適切なメタ情報を付与することができる。この結果、コンテンツに付与されたメタ情報を基に、コンテンツとそのコンテンツを検索したユーザとの関係性について分析したり、メタ情報に含まれる検索クエリを基に、コンテンツそのものを評価したりすることができる。
<第2実施形態>
以下、第2実施形態について説明する。第2実施形態における情報解析システム1Aでは、提供するコンテンツが互いに異なる複数のウェブサービスの各々において検索クエリが入力された場合に、各ウェブサービスで提供されるコンテンツのそれぞれについて、コンテンツベクトルを生成する点で上述した第1実施形態と相違する。第2実施形態では、一例として、画像およびアイテムの2つのコンテンツについてコンテンツベクトルを生成するものとして説明するが、種類の異なる3つ以上のコンテンツについてコンテンツベクトルが生成されてもよい。以下、第1実施形態との相違点を中心に説明し、第1実施形態と共通する点については説明を省略する。なお、第2実施形態の説明において、第1実施形態と同じ部分については同一符号を付して説明する。
第2実施形態におけるログ取得装置10は、例えば、画像検索サイトにおいて入力された検索クエリや、検索クエリの入力に対する検索結果として提示された画像の中から選択された画像(或いは画像の識別子)などを含むログを取得する。また、ログ取得装置10は、ショッピングサイトにおいて入力された検索クエリや、検索クエリの入力に対する検索結果として提示されたアイテムの中から選択されたアイテム(或いはアイテムの識別子)などを含むログを取得する。そして、ログ取得装置10は、取得したログに基づく複数のログ情報を情報解析装置100に送信する。
図11は、第2実施形態における情報解析装置100Aの一例を示す図である。第2実施形態における通信部102は、ログ取得装置10から2つのウェブサイトのログ情報を受信する。そして、通信部102は、受信したログ情報のうち、画像検索サイトにおけるログ情報を、画像検索ログ情報131aとして記憶部130Aに記憶させると共に、ショッピングサイトにおけるログ情報を、アイテム検索ログ情報131bとして記憶部130Aに記憶させる。
第2実施形態における情報解析装置100Aのコーパス生成部112は、記憶部130に記憶された画像検索ログ情報131aとアイテム検索ログ情報131bを参照して、コーパス132を生成する。
図12は、コーパス132の他の例を示す図である。図中(a)に示すコーパスは、画像検索ログ情報131aに基づくコーパスを表し、図中(b)に示すコーパスは、アイテム検索ログ情報131bに基づくコーパスを表している。これらのコーパスのうち、図中(a)のコーパスの方が(b)のコーパスを包含している。例えば、画像検索サイトで検索される画像に、ショッピングサイト上で掲載されるアイテムの画像が含まれ得る場合には、図中(a)のコーパスが(b)のコーパスを包含することになる。第2実施形態におけるコーパス生成部112は、これらのコーパスのうち、他のコーパスに含まれる検索クエリを包含するコーパス(図示の例では(a)のコーパス)を、クエリ‐ベクトル変換装置30に送信する対象のコーパスとして選択する。これによって、クエリ‐ベクトル変換装置30により生成されるベクトル変換情報133は、画像検索サイトで入力された検索クエリを変換したクエリベクトルと、ショッピングサイトで入力された検索クエリを変換したクエリベクトルとの双方を兼ねることになる。この結果、ショッピングサイト上で掲載されるアイテムに関連付けるメタ情報も、画像検索サイトで入力された検索クエリを用いて生成することができる。
すなわち、コーパス生成部112が、複数のコーパスのうち、他のコーパスに含まれる検索クエリを包含するコーパスを、クエリ‐ベクトル変換装置30に送信する対象のコーパスとして選択することにより、コーパスが共通する複数のサービスにおける指標値に基づいて生成したメタ情報(コンテンツベクトル)を、互いに関連する情報として出力することができる。なお、送信対象のコーパス132として選択されるコーパスは、他のコーパスに含まれる全ての検索クエリを包含している必要はなく、例えば、9割程度以上同じ検索クエリを包含していればよい。
第2実施形態における情報解析装置100Aの抽出部114は、画像検索ログ情報131aに基づいて、画像検索ログ情報131a内の情報を入れ替えた転置画像検索ログ情報134aを生成すると共に、アイテム検索ログ情報131bに基づいて、アイテム検索ログ情報131b内の情報を入れ替えた転置アイテム検索ログ情報134bを生成する。転置画像検索ログ情報134aについては、上述した図6の転置ログ情報134と同様であるため説明を省略する。
図13は、転置アイテム検索ログ情報134bの一例を示す図である。図示のように、転置アイテム検索ログ情報134bは、アイテムの識別子(図中アイテムID)に対して、検索クエリとして入力された単語と、検索クエリが入力された時刻などが対応付けられている。例えば、ある検索クエリがショッピングサイト上に入力されて、当該検索クエリの入力に対する応答として複数のアイテムが提示された場合に、ユーザが提示された複数のアイテムの中から一つのアイテムを選択すると、その選択されたアイテムの識別子には、検索時に入力された検索クエリが対応付けられる。なお、アイテムが選択された後にさらにそのアイテムが購入された場合に、購入されたアイテムの識別子に対して、そのアイテムの検索時に入力された検索クエリが対応付けられてもよい。
そして、抽出部114は、転置画像検索ログ情報134aと転置アイテム検索ログ情報134bとの各々から、着目するコンテンツの識別子に対応付けられた着目検索クエリを抽出する。
第2実施形態における情報解析装置100Aの重み付与部116は、ベクトル変換情報133を検索し、抽出部114により転置画像検索ログ情報134aから抽出された着目検索クエリに対応付けられたクエリベクトルと、転置アイテム検索ログ情報134bから抽出された着目検索クエリに対応付けられたクエリベクトルとのそれぞれに対して、ウェブサイトごとの評価値に基づく重みを付与する。
例えば、重み付与部116は、画像検索サイト上で入力された検索クエリから変換されたクエリベクトルに対しては、CTRに基づく重みを付与する。また、重み付与部116は、ショッピングサイト上で入力された検索クエリから変換されたクエリベクトルに対しては、CVRに基づく重みを付与する。
第2実施形態における情報解析装置100Aのコンテンツベクトル生成部118は、例えば、以下の数式(3)に基づき、画像のコンテンツベクトルである画像ベクトルvec(IM)と、アイテムのコンテンツベクトルであるアイテムベクトルvec(Item)とを生成する。式中vec(IM)は、画像ベクトルを表し、vec(Item)は、アイテムベクトルを表している。また、例えば、wIMは、検索クエリが入力されたときの画像のクリック回数を表し、wItemは、検索クエリが入力されたときのアイテムのコンバージョン数(例えば購入数など)を表している。なお、数式(3)として例示したコンテンツベクトルの導出式は、あくまでも一例であり、クエリベクトルの数に応じて適時変更してよい。
[第2実施形態におけるコンテンツベクトルの利用例]
以下、第2実施形態において生成されたコンテンツベクトルの利用例について説明する。例えば、第2実施形態におけるサービス提供装置20は、クエリ‐ベクトル変換装置30によって、一つのコーパス132から作成された複数のクエリベクトルに基づいて生成された複数のコンテンツベクトルを、そのコンテンツベクトル同士の関連性に基づいてクラスタリング処理を行って分類する。第2実施形態におけるサービス提供装置20は、「分類部」の一例である。
図14は、コンテンツベクトルのクラスタリングの様子を示す図である。例えば、サービス提供装置20は、一つのコーパス132から作成された複数のクエリベクトルのそれぞれを次元とした特徴空間において、k−means法などのクラスタリング手法を用いてコンテンツベクトルをクラスタリングする。
具体的には、サービス提供装置20は、特徴空間上において、複数の重心G(図中G1、G2)を設定して、各コンテンツベクトルについて最短距離の重心Gを探索する。そして、サービス提供装置20は、最短距離の重心Gが共通するコンテンツベクトルを、互いに関連したコンテンツベクトルの集合としてクラスタ化する。図示の例では、コンテンツベクトルが2つのクラスタC1、C2に分類されている。このような処理によって、例えば、動画およびアイテムといったように異なる種類のコンテンツの関連性について一括して評価することができる。例えば、あるアイテムが販売されるショッピングサイトに、当該アイテムと同カテゴリに属する画像(或いは動画など)を合わせて掲載することによって、ユーザの購買意欲をより向上させることができる。
なお、上述した第2実施形態では、コンテンツが画像およびアイテムの組み合わせであるものとして説明したがこれ限られず、例えば、画像と位置情報の組み合わせであってもよい。この場合、コンテンツベクトル生成部118は、画像ベクトルと、位置情報のコンテンツベクトルである位置情報ベクトルとを生成する。これを受けて、サービス提供装置20は、画像ベクトルと位置情報ベクトルとに基づいて、画像と位置情報との関連性について分析する。例えば、サービス提供装置20は、上述したクラスタリング手法を用いて、画像および位置情報の2つのコンテンツを関連付ける。
図15は、画像と位置情報との関連性について分析した分析結果の利用例を模式的に示す図である。図示のように、サービス提供装置20は、地図検索ウェブサービスなどにおいて、位置情報ベクトルによって表される地図上の座標に、同カテゴリに属する画像を表示させる。これによって、サービス提供装置20は、位置情報をユーザに提供すると共に、その位置での景観やその位置の建物に関連した画像(例えば購入可能な商品の画像など)を合わせて提供することができる。この結果、ユーザの利便性をより向上させることができる。
以上説明した第2実施形態によれば、提供するコンテンツが互いに異なる複数のウェブサービスの各々において検索クエリが入力された場合に、各ウェブサービスで提供されるコンテンツのそれぞれについて、コンテンツベクトルを生成することにより、互いに異なるコンテンツのそれぞれに対して適切なメタ情報を付与することができる。この結果、画像やアイテム、位置情報など、異なるコンテンツ同士でも互いに関連付けることができる。
<第3実施形態>
以下、第3実施形態について説明する。第3実施形態における情報解析装置100Bは、クエリ‐ベクトル変換装置30の機能を有する点で上述した第1および第2実施形態と相違する。以下、第1および第2実施形態との相違点を中心に説明し、これらの実施形態と共通する点については説明を省略する。
図16は、第3実施形態における情報解析装置100Bの一例を示す図である。第3実施形態における制御部110Bは、上述したコーパス生成部112、抽出部114、重み付与部116、コンテンツベクトル生成部118、およびコンテンツ関連付部120の他に、クエリ‐ベクトル変換部122を備える。
クエリ‐ベクトル変換部122は、コーパス生成部112により生成されたコーパス132に含まれる検索クエリをクエリベクトルに変換して、検索クエリとクエリベクトルの組み合わせを複数含むベクトル変換情報133を生成し、記憶部130に記憶させる。
重み付与部116は、ベクトル変換情報133を検索することで、クエリ‐ベクトル変換部122により変換されたクエリベクトルの中から、抽出部114により抽出された着目検索クエリに対応するクエリベクトル(着目クエリから変換されたクエリベクトル)を選び出し、当該クエリベクトルに対して重みを付与する。
これによって、第3実施形態における情報解析装置100Bは、上述した第1および第2実施形態と同様に、コンテンツに対して適切なメタ情報を付与することができる。
<ハードウェア構成>
上述した実施形態の情報解析システムに含まれる複数の装置のうち、少なくともサービス提供装置20および情報解析装置100、100A、100Bは、例えば、図17に示すようなハードウェア構成により実現される。図17は、実施形態のサービス提供装置20および情報解析装置100、100A、100Bのハードウェア構成の一例を示す図である。
サービス提供装置20は、NIC20−1、CPU20−2、RAM20−3、ROM20−4、フラッシュメモリやHDDなどの二次記憶装置20−5、およびドライブ装置20−6が、内部バスあるいは専用通信線によって相互に接続された構成となっている。ドライブ装置20−6には、光ディスクなどの可搬型記憶媒体が装着される。二次記憶装置20−5、またはドライブ装置20−6に装着された可搬型記憶媒体に格納されたプログラムがDMAコントローラ(不図示)などによってRAM20−3に展開され、CPU20−2によって実行される。CPU20−2が参照するプログラムは、ネットワークNWを介して他の装置からダウンロードされてもよい。
情報解析装置100、100A、100Bは、NIC100−1、CPU100−2、RAM100−3、ROM100−4、フラッシュメモリやHDDなどの二次記憶装置100−5、およびドライブ装置100−6が、内部バスあるいは専用通信線によって相互に接続された構成となっている。ドライブ装置100−6には、光ディスクなどの可搬型記憶媒体が装着される。二次記憶装置100−5、またはドライブ装置100−6に装着された可搬型記憶媒体に格納されたプログラムがDMAコントローラ(不図示)などによってRAM100−3に展開され、CPU100−2によって実行されることで、制御部110が実現される。制御部110が参照するプログラムは、ネットワークNWを介して他の装置からダウンロードされてもよい。
以上、本発明を実施するための形態について実施形態を用いて説明したが、本発明はこうした実施形態に何ら限定されるものではなく、本発明の要旨を逸脱しない範囲内において種々の変形及び置換を加えることができる。
1…情報解析システム、10…ログ取得装置、20…サービス提供装置、30…クエリ‐ベクトル変換装置、100…情報解析装置、102…通信部、110…制御部、112…コーパス生成部、114…抽出部、116…重み付与部、118…コンテンツベクトル生成部、120…コンテンツ関連付部、130…記憶部、131…ログ情報、132…コーパス、133…ベクトル変換情報、134…転置ログ情報、135…コンテンツベクトル情報、NW…ネットワーク

Claims (11)

  1. コンテンツの検索時に入力された検索クエリと、前記検索クエリの入力に応じて選択されたコンテンツとが対応付けられた履歴情報に基づいて、前記履歴情報に含まれる着目コンテンツに関して、前記着目コンテンツに対応付けられた検索クエリを抽出する抽出部と、
    前記抽出部により抽出された検索クエリがベクトルに変換されたクエリベクトルに対して、前記着目コンテンツが選択されたことへの寄与度を示す指標値に基づく重みを付与する付与部と、
    前記付与部により重みが付与されたクエリベクトルに基づいて、前記着目コンテンツに関連付けるメタ情報を生成する生成部と、
    を備える情報解析装置。
  2. 前記検索クエリと、前記検索クエリが変換されたクエリベクトルとが対応付けられた組み合わせを複数含むベクトル変換情報を取得する取得部を更に備え、
    前記抽出部は、前記取得部により取得された前記ベクトル変換情報を検索することで、前記抽出した検索クエリに対応付けられている前記クエリベクトルを抽出する、
    請求項1に記載の情報解析装置。
  3. 前記履歴情報に含まれる前記検索クエリを前記クエリベクトルに変換する変換部を更に備え、
    前記付与部は、前記変換部により変換された前記クエリベクトルの中から、前記抽出部により抽出された検索クエリから変換されたクエリベクトルを検索し、前記検索して得られたクエリベクトルに対して前記重みを付与する、
    請求項1に記載の情報解析装置。
  4. 前記抽出部は、前記履歴情報において、前記着目コンテンツに複数の検索クエリが対応付けられている場合、前記複数の検索クエリを抽出し、
    前記付与部は、前記抽出部により抽出された前記複数の検索クエリの各々がベクトルに変換された複数のクエリベクトルに対して前記重みを付与し、
    前記生成部は、前記付与部により前記重みが付与された前記複数のクエリベクトルを加算したベクトルを、前記メタ情報として生成する、
    請求項1から3のうちいずか1項に記載の情報解析装置。
  5. 前記履歴情報は、提供するコンテンツが互いに異なる複数のウェブサービスの各々において前記検索クエリが入力される場合に、前記複数のウェブサービスの各々に基づいて生成され、
    前記検索クエリが前記クエリベクトルに変換される際に、前記複数のウェブサービスの各々に基づいて生成された履歴情報のうち、他の履歴情報に含まれる内容を包含する履歴情報が用いられる、
    請求項1から4のうちいずれか1項に記載の情報解析装置。
  6. 前記付与部は、前記抽出部により抽出された検索クエリがベクトルに変換されたクエリベクトルに対して、前記検索クエリが入力された対象のサービスにおいて前記着目コンテンツが選択されたことへの寄与度を示す指標値に基づく重みを付与する、
    請求項1から5のうちいずれか1項に記載の情報解析装置。
  7. 前記抽出部により抽出された前記検索クエリがベクトルに変換される際に用いられるコーパスが共通する複数のサービスにおける、前記着目コンテンツが選択されたことへの寄与度を示す指標値に基づいて生成したメタ情報を、互いに関連する情報として出力する、
    請求項1から6のうちいずれか1項に記載の情報解析装置。
  8. 前記着目コンテンツに関連付けられた前記メタ情報に対してクラスタリング処理を行って、前記着目コンテンツを分類する分類部を更に備える、
    請求項1から7のうちいずれか1項に記載の情報解析装置。
  9. コンテンツの検索時に入力された検索クエリの集合と、前記集合に含まれる検索クエリのそれぞれをベクトル化したクエリベクトルに基づいて、前記コンテンツにメタ情報を付与する情報解析装置。
  10. コンピュータが、
    コンテンツの検索時に入力された検索クエリと、前記検索クエリの入力に応じて選択されたコンテンツとが対応付けられた履歴情報に基づいて、前記履歴情報に含まれる着目コンテンツに関して、前記着目コンテンツに対応付けられた検索クエリを抽出し、
    前記抽出した検索クエリがベクトルに変換されたクエリベクトルに対して、前記着目コンテンツが選択されたことへの寄与度を示す指標値に基づく重みを付与し、
    前記重みを付与したクエリベクトルに基づいて、前記着目コンテンツに関連付けるメタ情報を生成する、
    情報解析方法。
  11. コンピュータに、
    コンテンツの検索時に入力された検索クエリと、前記検索クエリの入力に応じて選択されたコンテンツとが対応付けられた履歴情報に基づいて、前記履歴情報に含まれる着目コンテンツに関して、前記着目コンテンツに対応付けられた検索クエリを抽出させ、
    前記抽出させた検索クエリがベクトルに変換されたクエリベクトルに対して、前記着目コンテンツが選択されたことへの寄与度を示す指標値に基づく重みを付与させ、
    前記重みを付与させたクエリベクトルに基づいて、前記着目コンテンツに関連付けるメタ情報を生成させる、
    情報解析プログラム。
JP2016165503A 2016-08-26 2016-08-26 情報解析装置、情報解析方法、および情報解析プログラム Active JP6160018B1 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2016165503A JP6160018B1 (ja) 2016-08-26 2016-08-26 情報解析装置、情報解析方法、および情報解析プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2016165503A JP6160018B1 (ja) 2016-08-26 2016-08-26 情報解析装置、情報解析方法、および情報解析プログラム

Publications (2)

Publication Number Publication Date
JP6160018B1 JP6160018B1 (ja) 2017-07-12
JP2018032304A true JP2018032304A (ja) 2018-03-01

Family

ID=59308890

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2016165503A Active JP6160018B1 (ja) 2016-08-26 2016-08-26 情報解析装置、情報解析方法、および情報解析プログラム

Country Status (1)

Country Link
JP (1) JP6160018B1 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6560843B1 (ja) * 2018-03-16 2019-08-14 楽天株式会社 検索システム、検索方法、及びプログラム

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009266096A (ja) * 2008-04-28 2009-11-12 Sony Corp 情報処理装置、および関連アイテムの提供方法
JP2010033377A (ja) * 2008-07-29 2010-02-12 Yahoo Japan Corp Webクエリに対する検索要求属性を自動推定する検索装置、検索方法及びプログラム
JP2010123036A (ja) * 2008-11-21 2010-06-03 Nippon Telegr & Teleph Corp <Ntt> 文書検索装置、文書検索方法、および文書検索プログラム
US20160085860A1 (en) * 2013-05-14 2016-03-24 Telefonaktiebolaget L M Ericsson (Publ) Search engine for textual content and non-textual content

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009266096A (ja) * 2008-04-28 2009-11-12 Sony Corp 情報処理装置、および関連アイテムの提供方法
JP2010033377A (ja) * 2008-07-29 2010-02-12 Yahoo Japan Corp Webクエリに対する検索要求属性を自動推定する検索装置、検索方法及びプログラム
JP2010123036A (ja) * 2008-11-21 2010-06-03 Nippon Telegr & Teleph Corp <Ntt> 文書検索装置、文書検索方法、および文書検索プログラム
US20160085860A1 (en) * 2013-05-14 2016-03-24 Telefonaktiebolaget L M Ericsson (Publ) Search engine for textual content and non-textual content

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
村田 眞哉,他: ""クリックログ解析による情報要求ベースの検索結果ランキング"", 日本データベース学会論文誌, vol. 第7巻,第4号, JPN6016046781, 27 March 2009 (2009-03-27), pages 37 - 42, ISSN: 0003556443 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6560843B1 (ja) * 2018-03-16 2019-08-14 楽天株式会社 検索システム、検索方法、及びプログラム
WO2019176102A1 (ja) * 2018-03-16 2019-09-19 楽天株式会社 検索システム、検索方法、及びプログラム

Also Published As

Publication number Publication date
JP6160018B1 (ja) 2017-07-12

Similar Documents

Publication Publication Date Title
KR102056822B1 (ko) 학습 서비스 제공 방법 및 그 장치
JP7343568B2 (ja) 機械学習のためのハイパーパラメータの識別および適用
US10671812B2 (en) Text classification using automatically generated seed data
US9818142B2 (en) Ranking product search results
CN105247507B (zh) 用于确定品牌的影响力得分的方法、系统和存储介质
US20140222503A1 (en) Dynamic prediction of online shopper&#39;s intent using a combination of prediction models
US20140095308A1 (en) Advertisement distribution apparatus and advertisement distribution method
US20100079464A1 (en) Information processing apparatus capable of easily generating graph for comparing of a plurality of commercial products
US9128988B2 (en) Search result ranking by department
CN109564573A (zh) 来自计算机应用元数据的平台支持集群
CN108269122B (zh) 广告的相似度处理方法和装置
US10515378B2 (en) Extracting relevant features from electronic marketing data for training analytical models
WO2018227930A1 (zh) 智能提示答案的方法及装置
JP2018005662A (ja) 情報解析装置、情報解析方法、および情報解析プログラム
JP6434954B2 (ja) 情報処理装置、情報処理方法、およびプログラム
CN110209780B (zh) 一种问题模板生成方法、装置、服务器及存储介质
US10394804B1 (en) Method and system for increasing internet traffic to a question and answer customer support system
US20130332440A1 (en) Refinements in Document Analysis
US20180239790A1 (en) Provision device, provision method and non-transitory computer readable storage medium
JP6160018B1 (ja) 情報解析装置、情報解析方法、および情報解析プログラム
JP7227412B1 (ja) 情報処理システム、コンピュータプログラム、及び情報処理方法
JP6258246B2 (ja) 解析装置、解析方法及びプログラム
JP6985181B2 (ja) 情報処理装置、情報処理方法、およびプログラム
JP7297855B2 (ja) キーワード抽出装置、キーワード抽出方法、およびプログラム
CN111597220B (zh) 数据挖掘方法和装置

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20170420

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20170516

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20170526

R150 Certificate of patent or registration of utility model

Ref document number: 6160018

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

S533 Written request for registration of change of name

Free format text: JAPANESE INTERMEDIATE CODE: R313533

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313111

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313111

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250