JP6434954B2 - 情報処理装置、情報処理方法、およびプログラム - Google Patents

情報処理装置、情報処理方法、およびプログラム Download PDF

Info

Publication number
JP6434954B2
JP6434954B2 JP2016230061A JP2016230061A JP6434954B2 JP 6434954 B2 JP6434954 B2 JP 6434954B2 JP 2016230061 A JP2016230061 A JP 2016230061A JP 2016230061 A JP2016230061 A JP 2016230061A JP 6434954 B2 JP6434954 B2 JP 6434954B2
Authority
JP
Japan
Prior art keywords
word
vector
user
information
vectors
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2016230061A
Other languages
English (en)
Other versions
JP2018088051A (ja
Inventor
進一郎 安井
進一郎 安井
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Yahoo Japan Corp
Original Assignee
Yahoo Japan Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Yahoo Japan Corp filed Critical Yahoo Japan Corp
Priority to JP2016230061A priority Critical patent/JP6434954B2/ja
Publication of JP2018088051A publication Critical patent/JP2018088051A/ja
Application granted granted Critical
Publication of JP6434954B2 publication Critical patent/JP6434954B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

本発明は、情報処理装置、情報処理方法、およびプログラムに関する。
従来、ユーザが閲覧したコンテンツに基づいて配信対象コンテンツを予測してレコメンド情報として配信する技術が知られている(例えば、特許文献1参照)。
特開2010−262383号公報
しかしながら、従来の技術では、ユーザが閲覧したコンテンツに含まれる単語同士が共起するような関係性については考慮されていないため、ユーザにとってより興味関心の高いコンテンツをレコメンドするためには、より多くのコンテンツの閲覧履歴が必要であった。この結果、処理の対象とする情報が増加し、処理が煩雑となって処理負荷が増大する傾向にあった。
本発明は、上記の課題に鑑みてなされたものであって、処理負荷を低減させながら、ユーザにとって興味関心の高い情報を特定することができる情報処理装置、情報処理方法、およびプログラムを提供することを目的としている。
本発明の一態様は、端末装置を使用するユーザのログ情報に関連するワードがベクトルに変換されたワードベクトルに基づいて、前記ユーザを分散表現したユーザベクトルを生成する生成部と、前記端末装置に配信する複数のコンテンツの候補がベクトルで表された複数のコンテンツベクトルのそれぞれと、前記生成部により生成されたユーザベクトルとを比較して、前記複数のコンテンツベクトルの中から一以上のコンテンツベクトルを選択する選択部と、を備える情報処理装置である。
本発明の一態様によれば、処理負荷を低減させながら、ユーザにとって興味関心の高い情報を特定することができる情報処理装置、情報処理方法、およびプログラムを提供することができる。
第1実施形態における情報処理装置100を含む情報処理システム1の一例を示す図である。 第1実施形態における情報処理システム1の一連の処理の一例を示すシーケンス図である。 第1実施形態における情報処理装置100の一例を示す図である。 ログ情報関連ワード131の一例を示す図である。 制御部110により実行される処理の一例を示すフローチャートである。 コーパス132の一例を示す図である。 ワード‐ベクトル変換情報133の一例を示す図である。 ユーザベクトル情報134の一例を示す図である。 配信候補ワードの配信優先度を決定する処理を模式的に示す図である。 配信優先度情報135の一例を示す図である。 コンテンツに対応付けられたメタ情報の一例を示す図である。 興味関心の傾向が似ているユーザ同士を分類した図である。 レコメンドワードの適切可否が選択される様子を模式的に示す図である。 ユーザベクトルのグループごとにネガティブフィードバック情報を反映させる様子を模式的に示す図である。 第5実施形態における情報処理装置100Dの一例を示す図である。 画像ベクトルの生成方法を説明するための図である。 画像ベクトル情報136の一例を示す図である。 画像の配信優先度を決定する処理を模式的に示す図である。 実施形態のワード‐ベクトル変換装置30および情報処理装置100、100Dのハードウェア構成の一例を示す図である。
以下、本発明を適用した情報処理装置、情報処理方法、およびプログラムを、図面を参照して説明する。
[概要]
情報処理装置は、一以上のプロセッサによって実現される。情報処理装置は、端末装置を使用するユーザのログ情報に関連するワードがベクトルに変換されたワードベクトルに基づいて、ユーザを分散表現したユーザベクトルを生成する。そして、情報処理装置は、端末装置に配信する複数のコンテンツの候補がベクトルで表された複数のコンテンツベクトルのそれぞれと、生成したユーザベクトルとを比較して、複数のコンテンツベクトルの中から一以上のコンテンツベクトルを選択する。これによって、処理負荷を低減させながら、ユーザにとって興味関心の高い情報を特定することができる。
本実施形態におけるログ情報とは、ユーザが特定のワード(単語や文章(複合語))に興味を示したうえで、そのワードが入力または選択された、ということがわかる履歴情報である。例えば、ログ情報には、検索時に入力または選択されたクエリの履歴(いわゆる検索ログ)や、ユーザによりハイパーリンクが選択されることで、または直接入力されることで選択されたURL(Uniform Resource Locator)などの参照子の履歴、アクセス先のウェブページのIPアドレスなどが含まれる。クエリが「選択された」とは、検索サイトやこれに相当するアプリケーションなどの検索窓に入力されたクエリに応じてサジェストされた複数のサブクエリのうち、いずれかが選択されたことをいう。この場合、選択されたサブクエリがワードとなる。
<第1実施形態>
[全体構成]
図1は、第1実施形態における情報処理装置100を含む情報処理システム1の一例を示す図である。第1実施形態における情報処理システム1は、例えば、一以上の端末装置10と、サービス提供装置20と、ワード‐ベクトル変換装置30と、情報処理装置100とを備える。これらの装置は、ネットワークNWを介して接続される。なお、情報処理システム1に含まれる複数の装置の一部または全部は、一つの情報処理装置100内に集約されていてもよい。
図1に示す各装置は、ネットワークNWを介して種々の情報を送受信する。ネットワークNWは、例えば、無線基地局、Wi‐Fiアクセスポイント、通信回線、プロバイダ、インターネットなどを含む。なお、図1に示す各装置の全ての組み合わせが相互に通信可能である必要はなく、ネットワークNWは、一部にローカルなネットワークを含んでもよい。
端末装置10は、ユーザによって使用される装置である。端末装置10は、例えば、スマートフォンなどの携帯電話、タブレット端末、パーソナルコンピュータなどのコンピュータ装置である。例えば、端末装置10は、ユーザによる操作を受け付けて、所定のウェブブラウザを介して、サービス提供装置20が提供するウェブサイトにアクセスしてもよいし、予めインストールされたアプリケーションを介してサービス提供装置20と通信を行い、アプリケーション上で表示或いは再生するコンテンツ(例えば画像や動画、テキストなど)を取得してもよい。このアプリケーションは、例えば、ショッピングアプリなどの商品やサービスを購入可能なアプリケーションであってもよいし、SNS(Social Networking Service)、メールサービス、天気予報などの情報提供サービスといった各種サービスを享受可能なアプリケーションであってもよい。
サービス提供装置20は、インターネット上において、検索サイト等のウェブサイトを提供するウェブサーバ装置であってよいし、アプリケーションが起動された端末装置10と通信を行って、各種情報の受け渡しを行うアプリケーションサーバ装置であってもよい。アプリケーションサーバ装置が提供する情報に基づいて端末装置10のアプリケーションプログラムが生成する画面では、ウェブサーバ装置が提供するウェブサイトと同様のサービスが提供される。
例えば、サービス提供装置20は、SNSにおいて、現在インターネット上で注目を集めているワードをレコメンドワードとして、端末装置10にプッシュ通知などを利用して配信する。
また、サービス提供装置20は、例えば、提供するサービス内で入力または選択されたクエリ、およびそのクエリが入力または選択された時刻を含むログをユーザ毎に蓄積する。また、サービス提供装置20は、ウェブページなどにおいて、ハイパーリンクの貼られた領域がユーザによって選択された場合、この領域に含まれるワードをログとして蓄積してもよい。また、サービス提供装置20は、ユーザによってURLなどで指示されたウェブページなどにタイトルが付されている場合、そのタイトルをログに付随する情報(ログに関連するワード)として蓄積してもよい。「ユーザ毎」とは、例えば、端末装置10毎であってもよいし、一つの端末装置10におけるOS(Operating System)単位でのアカウント毎であってもよいし、ウェブブラウザまたはアプリケーション単位でのアカウント毎であってもよい。なお、サービス提供装置20は、自らが提供するサービスのログを蓄積する代わりに、或いは加えて、他のサービス提供装置(不図示)により提供されるサービスのログを取得して蓄積してもよい。サービス提供装置20は、ユーザ毎に蓄積したログを含むログ情報を、情報処理装置100に送信する。
ワード‐ベクトル変換装置30は、情報処理装置100から受信したコーパスに含まれるワードを、例えば分散表現としてのワードベクトルに変換する。例えば、ワード‐ベクトル変換装置30は、word2vecと称されているツール(プログラム)を利用して、コーパスに含まれる複数のワードのそれぞれをワードベクトルに変換する。word2vecとは、ニューラルネットワークと呼ばれるモデルを利用したツールであり、コーパスに含まれるワードを、そのワードの特徴を示す特徴ベクトル(ワードベクトル)に変換して出力するものである。
情報処理装置100は、サービス提供装置20により送信されたログ情報からコーパスを生成し、このコーパスをワード‐ベクトル変換装置30に送信する。また、情報処理装置100は、ワード‐ベクトル変換装置30から、コーパスに含まれるワードのそれぞれがベクトルに変換されたワードベクトルを受信し、このワードベクトルに基づいて、コーパスに含まれるワードを入力または選択したユーザを分散表現したユーザベクトルを生成する。そして、情報処理装置100は、生成したユーザベクトルと、コンテンツベクトル(後述)とを比較して、その比較結果に基づく情報をサービス提供装置20に送信する。
図2は、第1実施形態における情報処理システム1の一連の処理の一例を示すシーケンス図である。まず、サービス提供装置20は、ログ情報やそれに付随する情報を情報処理装置100に送信する(S100)。
次に、情報処理装置100は、ログ情報などに基づいてコーパスを生成し(S102)、このコーパスをワード‐ベクトル変換装置30に送信する(S104)。なお、コーパスの生成は、サービス提供装置20により行われてもよい。この場合、サービス提供装置20は、生成したコーパスをワード‐ベクトル変換装置30に送信する。
次に、ワード‐ベクトル変換装置30は、コーパスに含まれるワードをワードベクトルに変換し(S106)、変換したワードベクトルと、変換元のワードとの対応関係を示すワード‐ベクトル変換情報を、情報処理装置100に送信する(S108)。
次に、情報処理装置100は、ワード‐ベクトル変換情報に含まれるワードベクトルに基づいて、コーパスに含まれるワードを入力または選択したユーザを分散表現したユーザベクトルを生成する(S110)。
次に、サービス提供装置20は、端末装置10への配信候補となるワードを示す配信候補ワード情報を、情報処理装置100に送信する(S112)。例えば、サービス提供装置20は、提供するサービス内で使用されたワードのうち、ある観測期間において入力や選択の頻度が高かったワードを、配信候補ワードとして決定する。また、サービス提供装置20は、優先的にユーザに周知したいワードを配信候補ワードとして決定してもよい。なお、サービス提供装置20は、S100の処理の前や、S100の処理と同時または直後に、配信候補ワード情報を送信してもよい。
次に、情報処理装置100は、配信候補ワード情報を参照して、配信候補ワードに対応するワードベクトルをワード‐ベクトル変換情報から選択し(S114)、この選択したワードベクトルと、ユーザベクトルとを比較し(S116)、その比較結果に基づく情報をサービス提供装置20に送信する(S118)。配信候補ワードに対応するワードベクトルは、「コンテンツベクトル」の一例である。
これを受けて、サービス提供装置20は、配信候補ワードの中からレコメンドワードを決定し、このレコメンドワードを端末装置10に送信する(S120)。これによって、端末装置10には、レコメンドワードが提示された画面が表示される(S122)。
[情報処理装置の構成]
以下、図を参照して情報処理装置100の構成について説明する。図3は、第1実施形態における情報処理装置100の一例を示す図である。図示のように、情報処理装置100は、例えば、通信部102と、制御部110と、記憶部130とを備える。
通信部102は、例えば、NIC(Network Interface Card)等の通信インターフェースやDMA(Direct Memory Access)コントローラを含む。通信部102は、ネットワークNWを介して、サービス提供装置20、またはワード‐ベクトル変換装置30と通信する。例えば、通信部102は、サービス提供装置20からログ情報や、そのログ情報に付随する情報を受信し、これらを記憶部130にログ情報関連ワード131として記憶させる。ログ情報関連ワード131は、サービス提供装置20によって蓄積されたログ情報から、直接的にワードを認識できない情報(URLなど)を除いたものである。
また、通信部102は、ワード‐ベクトル変換装置30により送信されたワード‐ベクトル変換情報を受信し、これをワード‐ベクトル変換情報133として記憶部130に記憶させる。
図4は、ログ情報関連ワード131の一例を示す図である。ログ情報関連ワード131は、ユーザの識別情報(図中ユーザID)に対して、サービス提供装置20から取得したログ情報に関連するワード(ログ情報に含まれるワードやそのログ情報に付随するワード)と、そのワードが入力または選択された時刻とが対応付けられた情報である。
制御部110は、例えば、コーパス生成部112と、ユーザベクトル生成部114と、選択決定部116とを備える。選択決定部116は、「選択部」の一例である。
これらの構成要素は、例えば、CPU(Central Processing Unit)などのプロセッサが記憶部130に格納されたプログラムを実行することにより実現される。また、制御部110の構成要素の一部または全部は、LSI(Large Scale Integration)、ASIC(Application Specific Integrated Circuit)、またはFPGA(Field-Programmable Gate Array)などのハードウェア(回路部;circuitry)により実現されてもよいし、ソフトウェアとハードウェアの協働によって実現されてもよい。
記憶部130は、例えば、HDD(Hard Disc Drive)、フラッシュメモリ、EEPROM(Electrically Erasable Programmable Read Only Memory)、ROM(Read Only Memory)、RAM(Random Access Memory)などにより実現される。記憶部130は、ファームウェアやアプリケーションプログラムなどの各種プログラムや上述したログ情報関連ワード131、コーパス132、ワード‐ベクトル変換情報133、ユーザベクトル情報134、配信優先度情報135などを記憶する。これらの情報については後述する。
以下、フローチャートに即して、制御部110による一連の処理について説明する。図5は、制御部110により実行される処理の一例を示すフローチャートである。例えば、本フローチャートの処理は、所定の周期で繰り返し行われる。
まず、コーパス生成部112は、通信部102によりサービス提供装置20からログ情報関連ワード131が受信されるまで待機し(S200)、通信部102によりログ情報関連ワード131が受信されると、このログ情報関連ワード131を参照して、コーパス132を生成する(S202)。
図6は、コーパス132の一例を示す図である。例えば、コーパス生成部112は、ログ情報関連ワード131の時刻を参照して各セッションの期間を導出し、各ユーザについて、セッション毎にワードを集約することで、一つのコーパス132を生成する。
例えば、セッションは、検索サイトなどのウェブサイトを介してサービスが提供される場合、クッキー等の状態管理機能の有効期間である。例えば、検索サイト内のあるウェブページにアクセスしてから所定時間経過(タイムアウト)するまでの期間が一つのセッションとして扱われる。また、セッションは、検索サイト内のあるウェブページにアクセスしてから、当該検索サイト内の他のウェブページ、または他のウェブサイト内のウェブページに切り替わるまでの期間であってもよい。また、セッションは、検索サイト内のあるウェブページにアクセスしてから、当該ウェブページを表示するウェブブラウザを閉じるまでの期間であってもよい。また、アプリケーションを介してサービスが提供される場合、セッションは、例えば、上述したクッキー等の状態管理機能の有効期間であってもよいし、OAuth等のプロトコルに基づく有効期間であってもよい。
そして、コーパス生成部112は、ユーザの各セッションにおいて入力または選択されたワードを集約したコーパス132を、通信部102を用いてワード‐ベクトル変換装置30に送信する(S204)。
これを受けて、ワード‐ベクトル変換装置30は、コーパス132に含まれるワードをワードベクトルに変換して、ワードとワードベクトルとの組み合わせ(ペア)を複数含むワード‐ベクトル変換情報133を、情報処理装置100に送信する。
図7は、ワード‐ベクトル変換情報133の一例を示す図である。図示のように、ワード‐ベクトル変換情報133は、コーパス132に含まれる各ワード(図中Q)に対して、そのワードから変換されたワードベクトル(図中vec(Q))と、そのワードが入力または選択された時刻とが対応付けられた情報である。
次に、ユーザベクトル生成部114は、通信部102によりワード‐ベクトル変換装置30からワード‐ベクトル変換情報133が受信されるまで待機し(S206)、通信部102によりワード‐ベクトル変換情報133が受信されると、このワード‐ベクトル変換情報133に含まれるワードベクトルに基づいて、ユーザベクトルを生成する(S208)。
例えば、ユーザベクトル生成部114は、以下の数式(1)に基づいて、ユーザベクトルを生成する。数式(1)に示すように、ユーザベクトルは、ワード‐ベクトル変換情報133に含まれる複数のワードベクトルvec(Q)からvec(Q)の加重和で表すことができる。wは、ワードベクトルの重みを表している。また、nは任意の自然数を表している。
例えば、あるユーザAが、一セッション中に、「野球」、「サッカー」、「テニス」の合計3つのワードを入力した場合、ユーザベクトル生成部114は、ワード‐ベクトル変換情報133に含まれる複数のワードベクトルから、これらの3つのワードに対応するワードベクトルを選択し、このワードベクトルを用いてユーザAのユーザベクトルを生成する。例えば、ユーザAのユーザベクトルvec(USER)は、以下の数式(2)のように表すことができる。
ここで、ユーザベクトル生成部114は、ログ情報関連ワード131を参照して、各ワードベクトルの重みwを、ある集計期間(例えば、一セッション)中において、各ワードベクトルの元となったワードが入力または選択された回数に基づいて決定してよい。例えば、一セッション中に「野球」というワードが10回入力された場合、wは、10となる。
また、ユーザベクトル生成部114は、ログ情報関連ワード131を参照して、各ワードベクトルの重みwを、例えば、ワードベクトルの元となったワードの入力または選択時刻に基づく指標(以下、フレッシュネスと称する)に基づいて決定してもよい。例えば、ある集計期間(セッション期間)を一か月とした場合、昨日入力または選択されたワードと、一か月前に入力または選択されたワードとでは、昨日の時点のワードの方が、ユーザベクトル生成時の時点ではよりユーザの興味関心が高いと判断することができる。従って、ワードの入力または選択時刻からの経過時間が長くなるほどフレッシュネスが低下するため、ユーザベクトル生成部114は、そのワードベクトルの重みwをより小さくする。一方、ワードの入力または選択時刻からの経過時間が短くなるほどフレッシュネスが向上するため、ユーザベクトル生成部114は、そのワードベクトルの重みwをより大きくする。
また、ユーザベクトル生成部114は、各ワードベクトルの重みwを、検索のために入力されたクエリや、サジェストされたサブクエリの中から選択されたサブクエリの概念の広さの度合に基づいて決定してもよい。例えば、ユーザベクトル生成部114は、一検索あたりに同時に入力されるクエリの数が多いほど、そのクエリの概念は狭いものと評価し、それらのクエリベクトルの重みwを大きくする。例えば、「野球_ホームラン」よりも、「野球_ホームラン_○○選手_成績」といったクエリの入力の方が、そのクエリの概念は狭くなるものの、ユーザが積極的に物事を検索していることからユーザの興味がより高いものであると判断することができる。従って、ユーザベクトル生成部114は、一検索あたりに同時に入力されるクエリの数が多くなるほど、そのクエリに対応するワードベクトルの重みwをより大きくしてよい。
また、例えば、ユーザベクトル生成部114は、word2vecを利用する際に、ワードベクトルの元となったワード同士の類似性を評価することで、そのワードベクトルの重みwを決定してもよい。ワード同士の類似性とは、各ワードのワードベクトルを所定の特徴空間上に配置したときの、そのワードベクトル同士の距離を表している。所定の特徴空間とは、例えば、GBDT(Gradient Boosting Decision Tree)やSVM(Support Vector Machine)などの機械学習モデルを用いて機械学習が行われる際に、各ワードベクトルのそれぞれを次元とした特徴空間である。特徴空間上のワードベクトルの距離の大きさに応じて、そのワードベクトルの元となったワードの共起性が評価される。
例えば、ワードベクトル同士の距離が短いほど、その元となったワードの類似性は高くなる(共起性が高い)。例えば、ユーザベクトル生成部114は、複数のワードベクトルのうち、あるワードベクトルに着目すると、この着目したワードベクトルに対して最も近い所定数のワードベクトルを選択し、この所定数のそれぞれのワードベクトルと、着目ワードベクトルとの間の距離を導出する。そして、ユーザベクトル生成部114は、着目ワードベクトルとの距離が長くなるほど、選択した所定数のワードベクトルの重みwを大きくする。なお、ベクトル間の距離は、後述するコサイン類似度として求められてよい。
このようにしてユーザベクトルを生成すると、ユーザベクトル生成部114は、ユーザベクトルとしてワードベクトルにより分散表現したユーザと、そのユーザベクトルとの対応関係を示すユーザベクトル情報134を記憶部130に記憶させる。
図8は、ユーザベクトル情報134の一例を示す図である。図示のように、ユーザベクトル情報134は、ユーザの識別情報(図中ユーザID)に対して、ユーザベクトルが対応付けられており、更にそのユーザベクトルに分散表現として用いたワードベクトルが対応付けられた情報である。
次に、選択決定部116は、通信部102によりサービス提供装置20から配信候補ワード情報が受信されたか否かを判定し(S210)、通信部102により配信候補ワード情報が受信されると、受信されたワード‐ベクトル変換情報133を参照して、配信候補ワード情報が示す配信候補ワードに対応するワードベクトルを抽出する(S212)。例えば、配信候補ワードが「オリンピック」である場合、選択決定部116は、「オリンピック」のワードベクトルをワード‐ベクトル変換情報133から抽出する。これによって、配信候補ワードのワードベクトルと、ユーザベクトルに用いたワードベクトルは、同じ変換手法を用いて生成されたことになる。言い換えれば、配信候補ワードのワードベクトルと、ユーザベクトルに用いたワードベクトルは、同じコーパス132を用いて変換されたワードベクトルであると見做すことができる。
次に、選択決定部116は、抽出したワードベクトルと、ユーザベクトル情報134に含まれる各ユーザベクトルとを比較して、これらのベクトルの類似度を導出する(S214)。例えば、選択決定部116は、ユーザベクトルおよび抽出したワードベクトルのノルムと、これらのベクトルの内積とを用いて、コサイン類似度を導出する。以下の数式(3)は、コサイン類似度の導出式を表す。式中x、yのいずれか一方はユーザベクトルを表し、他方はワードベクトルを表している。
そして、選択決定部116は、導出した類似度に基づいて、ユーザごとに配信候補ワードを配信する場合の優先度を決定する(S216)。
図9は、配信候補ワードの配信優先度を決定する処理を模式的に示す図である。例えば、配信候補ワードがQ、Q、Qであった場合、選択決定部116は、それらのワードベクトルvec(Q)、vec(Q)、vec(Q)と、各ユーザのユーザベクトルとの類似度を導出する。図示のように、配信対象として、ユーザAとユーザBが存在する場合、選択決定部116は、ユーザAのユーザベクトルvec(USER)およびユーザBのユーザベクトルvec(USER)のそれぞれと、ワードベクトルvec(Q)、vec(Q)、vec(Q)との類似度を導出する。例えば、選択決定部116は、対象とするワードとの類似度が高いユーザほど、そのワードの配信優先度を高くしてもよいし、対象とするワードとの類似度が閾値以上となるワード全てを、ユーザに配信するように決定してもよい。すなわち、選択決定部116は、類似度が閾値以上であるワードについて優先度を一律に設定してもよい。
例えば、選択決定部116は、ユーザごとに決定した配信候補ワードの配信優先度を示す情報を、配信優先度情報135として記憶部130に記憶させる。
図10は、配信優先度情報135の一例を示す図である。図示のように、配信優先度情報135は、ユーザベクトルに対して、配信候補ワードのワードベクトルと、そのワードベクトルとの類似度と、その類似度に基づく配信優先順位とが対応付けられた情報である。
次に、選択決定部116は、通信部102に、配信優先度情報135をサービス提供装置20に送信させる(S218)。これを受けて、サービス提供装置20は、配信優先度情報135を参照して、配信候補ワードの中から、配信優先度に応じてユーザごとに配信するレコメンドワードを決定し、決定したレコメンドワードの情報をプッシュ通知などで端末装置10に送信する。これによって、本フローチャートの処理が終了する。
このようにユーザを分散表現した場合、例えば、ユーザを局所表現した場合と比べて、処理負荷を低減させながら、ユーザにとって興味関心の高い情報を特定することができる。例えば、ユーザを局所表現した場合、「野球_○○選手」のように、複数のクエリが検索窓などに一度に入力されると、クエリごとのコーパスを保有していない場合、クエリ同士の類似度を導出できない。そのため、例えば、ユーザの興味が、概念的に一番下の階層(最下位層)のクエリにある場合や最下位層の一つ上の階層にある場合といったように、各階層に跨って混在している場合、各階層のクエリごとに、そのクエリとベクトルが対応付けられた情報(本実施形態におけるワード‐ベクトル変換情報133に相当する情報)を用意しておき、ユーザごとに、これらの情報との全パターンの類似度を求める必要がある。
これに対して、本実施形態では、ユーザをワードベクトルにより分散表現するため、コーパス内に特定のワードが存在しない場合でも、存在しないワードのワードベクトルとの類似度を導出することができる。これによって、配信候補ワードを入力または選択したことがないユーザに対して、その配信候補ワードを配信することができる。例えば、「野球」というワードを入力または選択したユーザに対して、その「野球」の下位概念にあたる「□□野球チーム_優勝」といったワードを配信することができる。また、本実施形態では、分散表現によって複数のワードベクトルを要素としてもつベクトルとして、ユーザベクトルを表しているため、比較対象のユーザが変更された場合であっても、数式(1)における各ワードベクトルの重みwを変更することで、類似度を求めることができるため、処理が簡素化され、情報処理システム1の負荷が軽減される。
以上説明した第1実施形態によれば、端末装置10を使用するユーザのログ情報に関連するワードがベクトルに変換されたワードベクトルに基づいて、ユーザを分散表現したユーザベクトルを生成し、ユーザが使用する端末装置10に配信する複数のコンテンツの候補(配信候補ワード)がベクトルで表された複数のコンテンツベクトルのそれぞれと、生成したユーザベクトルとを比較して、複数のコンテンツベクトルの中から一以上のコンテンツベクトルを選択する。これによって、処理負荷を低減させながら、ユーザにとって興味関心の高い情報(ワード)を特定することができる。
例えば、急上昇ワードのような検索頻度の高い配信候補のワードのうち、ユーザの興味関心の高いワードを優先的にユーザに配信することができるため、SNSなどにおいて、よりユーザの利便性を向上させることができる。
また、本実施形態の技術を広告配信に適用した場合、ユーザ毎に興味関心の高い広告ワードを配信することができるため、不特定多数のユーザに広告を配信するよりも、費用対効果を向上させることができる。
<第1実施形態の変形例>
以下、第1実施形態の変形例について説明する。上述した実施形態では、ログ情報に関連するワードは、検索サイトやこれに相当するアプリケーションなどの検索窓に入力されたクエリ、クエリが入力されたことでサジェストされた複数のサブクエリのうち、ユーザにより選択されたサブクエリ、ウェブサイト上などに提示されたURLのうち、ユーザにより選択されたURLを表すワード、ハイパーリンクの貼られた領域内のワード、URLなどで参照されるウェブページのタイトルといった各種ワードを含むものとして説明したがこれに限られない。例えば、ログ情報に関連するワードには、検索の対象となるコンテンツに対応付けられたメタ情報に含まれる語句などが含まれてもよい。
図11は、コンテンツに対応付けられたメタ情報の一例を示す図である。図示のように、画像データである場合、メタ情報は、そのデータのタイトルやタグ名などである。また、コンテンツが音楽などの音声データの場合、メタ情報は、そのデータのタイトルや歌詞、アーティスト名などである。また、コンテンツが映画などの動画データの場合、メタ情報は、そのデータのタイトルやキャプション(字幕)などである。また、コンテンツが新聞などの記事を示すテキストデータの場合、メタ情報は、そのデータを表す代表的なワード(テーマ)のことである。
例えば、記事を示すテキストデータのメタ情報をログ情報に関連するワードとして用いる場合、ユーザベクトル生成部114は、記事全体のテキストを形態素解析により形態素ごとに分割し、分割した複数の形態素のそれぞれを表すワードの希少性に応じて各ワードを評価し、ワード毎の希少性を評価した評価値に基づいて、ユーザベクトルを生成する。より具体的には、ユーザベクトル生成部114は、分割した複数の形態素のそれぞれを表すワードを、TF(Term Frequency)‐IDF(Inverse Document Frequency)などで重み付けることにより、複数のワードの中から、その記事が何のテーマについて記載されたものであるのかを表すワードを抽出する。例えば、ユーザベクトル生成部114は、最も重みwの大きいワードを、記事全体を表す代表的なテーマのワードとして選択してもよいし、全ワードの平均の重みwに最も近いワードを、記事全体を表す代表的なテーマのワードとして選択してもよい。このとき、例えば、「野球」をテーマとした記事の場合、その記事には、野球の開催地や開催時刻などの情報が含まれる場合がある。ここで、単に記事を形態素に分割し、それぞれの形態素を表すワードを分散表現によりユーザに対応付ける場合、特定の場所や特定の時刻といったユーザの関心の低い情報が、ユーザベクトルとしてユーザに対応付けらえてしまう場合がある。これに対して、分割した形態素を表すワードをTF‐IDFなどで重み付け、記事全体を表す代表的なテーマのワードを抽出することで、ユーザの関心の低い情報を予め除いてユーザを分散表現することができる。
また、選択決定部116は、導出した類似度に基づいて、ユーザごとに配信候補ワードの配信優先度を決定するのに代えて、例えば、バズ度に基づいて配信候補ワードの中から、ユーザに配信するワードを決定してもよい。バズ度とは、複数のユーザ間においてワードがどの程度注目されているのかを表す指標値であり、例えば、インターネット上での口コミ数などに基づく指標値である。例えば、選択決定部116は、ログ情報関連ワード131を参照して、ある期間におけるワードの出現回数を導出し、ワードごとにバズ度を導出する。例えば、短時間に頻出するワードほど、そのバズ度は高くなる。そして、選択決定部116は、配信候補ワードのうち、ユーザベクトルとの類似度が高く、且つバズ度の高いワードほど、優先して配信するワードとして決定する。なお、選択決定部116は、ユーザベクトルとの類似度に関わらず、配信候補ワードのうち、バズ度の高いワードを優先して配信するワードとして決定してもよい。
<第2実施形態>
以下、第2実施形態について説明する。第2実施形態における情報処理システム1Aでは、ある配信対象のユーザに、ユーザベクトルとの類似度の高い配信候補ワードをレコメンドワードとして配信する際に、この配信対象のユーザと興味関心の傾向が似ている類似ユーザに、合わせてワードを配信する点で上述した第1実施形態と相違する。以下、第1実施形態との相違点を中心に説明し、第1実施形態と共通する点については説明を省略する。なお、第2実施形態の説明において、第1実施形態と同じ部分については同一符号を付して説明する。
図12は、興味関心の傾向が似ているユーザ同士を分類した図である。例えば、選択決定部116は、k−means法などのクラスタリング手法を用いて、ユーザベクトル生成部114により生成されたユーザベクトル同士をグループ化する。図示のように、選択決定部116は、グループAに属するユーザに配信するレコメンドワードとして決定した配信候補ワードを、グループAに属する他のユーザへのレコメンドワードとして決定してよい。
以上説明した第2実施形態によれば、ログ情報関連ワード131に含まれる情報量が乏しいユーザでも興味関心の高い情報を特定し、特定した情報を配信することができる。
<第3実施形態>
以下、第3実施形態について説明する。第3実施形態における情報処理システム1Bでは、レコメンドワードが端末装置10に配信された結果、ユーザによって、そのレコメンドワードが適切かそうでないかが分類される点で上述した第1および第2実施形態と相違する。以下、第1および第2実施形態との相違点を中心に説明し、第1および第2実施形態と共通する点については説明を省略する。なお、第3実施形態の説明において、第1および第2実施形態と同じ部分については同一符号を付して説明する。
図13は、レコメンドワードの適切可否が選択される様子を模式的に示す図である。図中(a)に示すように、サービス提供装置20により端末装置10に対してレコメンドワードが配信された場合、このレコメンドワードは、ユーザによって興味関心がないと判断され、その表示がブロックされる場合がある。この場合、図中(b)に示すように、端末装置10から、サービス提供装置20を介して、或いは直接に情報処理装置100に対して、表示がブロックされたレコメンドワードの情報(以下、ネガティブフィードバック情報と称する)が通知される。なお、レコメンドワードがプッシュ通知などによって端末装置10に配信されてから、所定時間経過しても端末装置10に対して何らかの操作が無かった場合、端末装置10から情報処理装置100に対してネガティブフィードバック情報が通知されてもよい。
第3実施形態におけるユーザベクトル生成部114は、通信部102によりネガティブフィードバック情報が受信されると、ユーザベクトルを再生成する。例えば、ユーザベクトル生成部114は、ネガティブフィードバック情報によって示されるネガティブフィードバック情報の発信元の端末装置10のユーザのユーザベクトルにおいて、ネガティブフィードバック情報によって示されるワードベクトルの重みwを小さくする(例えばゼロに近似できる程度に小さくする)ことによって、ユーザベクトルを再生成する。これによって、ユーザベクトルにおいて、相対的に他のワードベクトルの重みwの寄与度が増すため、レコメンドワードとして配信予定のワードとの類似度が変化する。この結果、例えば、図中(c)のように、ブロックされなかったレコメンドワード(例えば図中「日本シリーズ」)と同じような概念のワード(例えば図中「優勝予想」や「○○選手」といった語句)がレコメンドワードとして配信されやすくなる。
以上説明した第3実施形態によれば、配信されたレコメンドワードに対するユーザの意向をユーザベクトルにフィードバックさせることによって、よりユーザの興味関心に適合したレコメンドワードを配信することができる。
<第4実施形態>
以下、第4実施形態について説明する。第4実施形態における情報処理システム1Cでは、クラスタリング処理の結果、同じグループに属するユーザによってブロックされたレコメンドワードを、同じグループの他のユーザについても配信しにくくするようにする点で上述した第1から第3実施形態と相違する。以下、第1から第3実施形態との相違点を中心に説明し、第1から第3実施形態と共通する点については説明を省略する。なお、第4実施形態の説明において、第1から第3実施形態と同じ部分については同一符号を付して説明する。
図14は、ユーザベクトルのグループごとにネガティブフィードバック情報を反映させる様子を模式的に示す図である。図示の例では、グループAにユーザベクトルが属するユーザと、グループBにユーザベクトルが属するユーザの双方に対して、ワードA、ワードB、ワードCをレコメンドワードとして配信している。例えば、図中(a)の状況において、グループAにユーザベクトルが属する、あるユーザによって、配信されたレコメンドワードのうち、ワードAがブロックされている。また、グループBにユーザベクトルが属する、あるユーザによって、配信されたレコメンドワードのうち、ワードBがブロックされている。
この場合、第4実施形態におけるユーザベクトル生成部114は、ブロックされたワードAに対応するワードベクトルの重みwを低下させる処理を、ブロックを行ったユーザのユーザベクトルと、ブロックを行ったユーザが属するグループA内の他のユーザのユーザベクトルについて行う。また、ユーザベクトル生成部114は、ブロックされたワードBに対応するワードベクトルの重みwを低下させる処理を、ブロックを行ったユーザのユーザベクトルと、ブロックを行ったユーザが属するグループB内の他のユーザのユーザベクトルについて行う。これによって、同じような興味関心の傾向を有するグループに属するユーザについて、一括してユーザベクトルを再生成することができる。この結果、グループAに属するユーザについては、ワードAがレコメンドワードとして配信されにくくなり、グループBに属するユーザについては、ワードBがレコメンドワードとして配信されにくくなる。
以上説明した第4実施形態によれば、配信されたレコメンドワードに対する、あるユーザの意向を、同じような興味関心の傾向を有するグループに属する他のユーザについてもフィードバックさせることによって、グループ毎に、よりユーザの興味関心に適合したレコメンドワードを配信することができる。
<第5実施形態>
以下、第5実施形態について説明する。第5実施形態における情報処理システム1Dでは、レコメンドされるコンテンツがワードである代わりに、画像データや音声データ、動画データといった情報である点で上述した第1から第4実施形態と相違する。第5実施形態では、一例としてコンテンツが画像ベクトルである例について説明する。以下、第1から第4実施形態との相違点を中心に説明し、第1から第4実施形態と共通する点については説明を省略する。なお、第5実施形態の説明において、第1から第4実施形態と同じ部分については同一符号を付して説明する。
図15は、第5実施形態における情報処理装置100Dの一例を示す図である。図示のように、情報処理装置100Dは、例えば、通信部102と、制御部110Dと、記憶部130Dとを備える。第5実施形態における制御部110Dは、上述したコーパス生成部112、ユーザベクトル生成部114、および選択決定部116に加えて、更に画像ベクトル生成部118を備える。
第5実施形態における記憶部130Dは、上述したログ情報関連ワード131、コーパス132、ワード‐ベクトル変換情報133、ユーザベクトル情報134、および配信優先度情報135に加えて、更に画像ベクトル情報136を記憶する。
画像ベクトル生成部118は、ワード‐ベクトル変換装置30により生成されたワード‐ベクトル変換情報133に含まれるワードベクトルに基づいて、画像を分散表現した画像ベクトルを生成する。この画像は、例えば、ユーザに配信する複数の画像の候補である。複数の画像の候補については、配信候補となるワードと同様に、サービス提供装置20により決定されてよい。配信候補の画像を画像ベクトルに分散表現する際に、ワード‐ベクトル変換情報133に含まれるワードベクトルを用いているため、画像ベクトルに用いたワードベクトルと、ユーザベクトルに用いたワードベクトルとは、同じコーパス132を用いて変換されたワードベクトルであると見做すことができる。
例えば、画像ベクトル生成部118は、配信候補となる画像が検索されたときに入力または選択されたワードのワードベクトルを、ワード‐ベクトル変換情報133から抽出し、抽出したワードベクトルに所定の評価値に基づく重みwを付与する。
所定の評価値とは、例えば、あるセッション中において、各ワードに関する、配信候補となる画像が選択されたことへの寄与の度合を示す指標値である。具体的には、評価値は、例えば、セッション中において、ある着目するワードが入力されることに応じた対象の画像の選択回数を、全てのワードが入力されることに応じた対象の画像の選択回数で除算した値である。
そして、画像ベクトル生成部118は、重みwを付与したワードベクトルの加重和を、画像ベクトルとして生成する。例えば、画像ベクトル生成部118は、以下の数式(4)に基づいて、画像ベクトルを生成する。式中vec(IMG)は、画像ベクトルを表している。
図16は、画像ベクトルの生成方法を説明するための図である。例えば、一セッション中に、Q1からQ3のそれぞれのクエリが画像検索サイトに入力されて、各ワードが入力される度に画像IMと画像IMが提示されたとする。このとき、図示のように、画像IMのクリック回数が、「人工衛星」というワードが入力されたときには50回、「地球」というワードが入力されたときには10回、「宇宙」というワードが入力されたときには1回であった場合、画像ベクトルは、以下の数式(5)のように表される。
数式中、vec(IM)は、画像IMの画像ベクトルを表している。また、vec(人工衛星)は、ワードQのワードベクトルを表し、vec(地球)は、ワードQのワードベクトルを表し、vec(宇宙)は、ワードQのワードベクトルを表している。数式(5)に示すように、画像ベクトルは、重みが付与された複数のワードベクトルを加算した多次元ベクトルである。また、式中wは、ワードQが入力されたことに応じた画像IMのクリック回数(上述した例では50)を表し、wは、ワードQが入力されたことに応じた画像IMのクリック回数(上述した例では10)を表し、wは、ワードQが入力されたことに応じた画像IMのクリック回数(上述した例では1)を表している。数式(5)に示すように、各ワードQのワードベクトルvec(Q)は、全てのワードベクトルに対して乗算されるクリック回数の総和で除算されている。すなわち、数式(5)は、ワードベクトルに対して上述した評価値を重みとして付与(乗算)し、加重和を求めた式である。
なお、上述した数式(5)は、画像IMの画像ベクトルの導出式を表すものであるが、他の画像についても同様に画像ベクトルを導出してよい。この際、各ワードベクトルに乗算するwからwの値は、適宜変更するものとする。例えば、画像IMの画像ベクトルvec(IM)の導出時には、wからwに対して、各ワードが入力されたときの画像IMのクリック回数が代入される。また、上述した例では、ワードが3種類の場合について説明したがこれに限られず、1、2種類、あるいは4種類以上であってもよい。この場合、数式(5)の右辺の分子におけるワードベクトルの数を変更してよい。
このようにして画像ベクトルを生成すると、画像ベクトル生成部118は、ワードベクトルにより分散表現した画像と、その画像の画像ベクトルとの対応関係を示す画像ベクトル情報136を記憶部130に記憶させる。
図17は、画像ベクトル情報136の一例を示す図である。図示のように、画像ベクトル情報136は、画像データの識別情報(図中画像ID)に対して、画像ベクトルが対応付けられており、更にその画像ベクトルに分散表現として用いたワードベクトルが対応付けられた情報である。
第5実施形態における選択決定部116は、画像ベクトル生成部118により生成された画像ベクトルと、ユーザベクトル情報134に含まれる各ユーザベクトルとを比較して、これらのベクトルの類似度を導出する。例えば、選択決定部116は、ユーザベクトルおよび画像ベクトルのノルムと、これらのベクトルの内積とを用いて、コサイン類似度を導出する。
そして、選択決定部116は、導出した類似度に基づいて、ユーザごとに画像ベクトルの元となった画像を配信する場合の優先度を決定する。
図18は、画像の配信優先度を決定する処理を模式的に示す図である。例えば、配信対象の画像がIM、IM、IMであった場合、選択決定部116は、それらの画像ベクトルvec(IM)、vec(IM)、vec(IM)と、各ユーザのユーザベクトルとの類似度を導出する。例えば、選択決定部116は、類似度の高い画像ほど、そのユーザに配信する優先度を高くしてもよいし、ある閾値以上の類似度の画像全てをユーザに配信するように決定してもよい。
以上説明した第5実施形態によれば、ユーザに配信する複数の画像の候補を、ユーザベクトル生成時のワードベクトルにより分散表現した画像ベクトルに変換するため、ユーザベクトルと画像ベクトルとを同じ次元で比較することができる。これにより、ユーザベクトルと画像ベクトルとの類似度を求めることができ、処理負荷を低減させながら、ユーザにとって興味関心の高い画像を特定することができる。
なお、上述した第5実施形態では、コンテンツが画像データである場合について説明したがこれに限られない。例えば、情報処理装置100Dは、コンテンツが音声データや動画データである場合についても同様に、そのコンテンツを分散表現したベクトルを生成し、ユーザベクトルとの類似度を求めてもよい。
<ハードウェア構成>
上述した実施形態の情報処理システムに含まれる複数の装置のうち、少なくともワード‐ベクトル変換装置30および情報処理装置100、100Dは、例えば、図19に示すようなハードウェア構成により実現される。図19は、実施形態のワード‐ベクトル変換装置30および情報処理装置100、100Dのハードウェア構成の一例を示す図である。
ワード‐ベクトル変換装置30は、NIC30−1、CPU30−2、RAM30−3、ROM30−4、フラッシュメモリやHDDなどの二次記憶装置30−5、およびドライブ装置30−6が、内部バスあるいは専用通信線によって相互に接続された構成となっている。ドライブ装置30−6には、光ディスクなどの可搬型記憶媒体が装着される。二次記憶装置30−5、またはドライブ装置30−6に装着された可搬型記憶媒体に格納されたプログラムがDMAコントローラ(不図示)などによってRAM30−3に展開され、CPU30−2によって実行される。CPU30−2が参照するプログラムは、ネットワークNWを介して他の装置からダウンロードされてもよい。
情報処理装置100、100Dは、NIC100−1、CPU100−2、RAM100−3、ROM100−4、フラッシュメモリやHDDなどの二次記憶装置100−5、およびドライブ装置100−6が、内部バスあるいは専用通信線によって相互に接続された構成となっている。ドライブ装置100−6には、光ディスクなどの可搬型記憶媒体が装着される。二次記憶装置100−5、またはドライブ装置100−6に装着された可搬型記憶媒体に格納されたプログラムがDMAコントローラ(不図示)などによってRAM100−3に展開され、CPU100−2によって実行されることで、制御部110が実現される。制御部110が参照するプログラムは、ネットワークNWを介して他の装置からダウンロードされてもよい。
以上、本発明を実施するための形態について実施形態を用いて説明したが、本発明はこうした実施形態に何ら限定されるものではなく、本発明の要旨を逸脱しない範囲内において種々の変形及び置換を加えることができる。
1…情報処理システム、10…端末装置、20…サービス提供装置、30…ワード‐ベクトル変換装置、100…情報処理装置、102…通信部、110…制御部、112…コーパス生成部、114…ユーザベクトル生成部、116…選択決定部、130…記憶部、131…ログ情報関連ワード、132…コーパス、133…ワード‐ベクトル変換情報、134…ユーザベクトル情報、135…配信優先度情報、NW…ネットワーク

Claims (14)

  1. 端末装置を使用するユーザのログ情報に関連するワードが予め与えられたテキスト情報内におけるワード同士の共起性に基づいてベクトルに変換されたワードベクトルの線形和を、前記ユーザを前記ワードベクトルにより分散表現したユーザベクトルとして生成する生成部と、
    前記端末装置に配信する複数のコンテンツの候補がベクトルで表された複数のコンテンツベクトルのそれぞれと、前記生成部により生成されたユーザベクトルとを比較して、前記複数のコンテンツベクトルの中から一以上のコンテンツベクトルを選択する選択部と、
    を備える情報処理装置。
  2. 前記ワードベクトルと、前記コンテンツベクトルとは、同じ変換手法で生成される、
    請求項1に記載の情報処理装置。
  3. 前記コンテンツベクトルは、前記コンテンツに含まれるワードをベクトルに変換したものである、
    請求項1または2に記載の情報処理装置。
  4. 前記コンテンツベクトルは、前記コンテンツが検索された際に入力されたクエリをベクトルに変換したものである、
    請求項1から3のうちいずれか1項記載の情報処理装置。
  5. 前記コンテンツベクトルは、コンテンツが選択された際に操作された領域内に含まれるワードをベクトルに変換したものである、
    請求項1から4のうちいずれか1項記載の情報処理装置。
  6. 前記生成部は、前記ワードベクトルの元となったワードが前記ログ情報として記録された回数に基づいて、前記ワードベクトルを重み付けして加重和を求めることで、前記ユーザベクトルを生成する、
    請求項1から5のうちいずれか1項に記載の情報処理装置。
  7. 前記生成部は、前記ワードベクトルの元となったワードが前記ログ情報として記録された時刻に基づいて、前記ワードベクトルを重み付けして加重和を求めることで、前記ユーザベクトルを生成する、
    請求項1から6のうちいずれか1項に記載の情報処理装置。
  8. 前記生成部は、前記ログ情報がクエリである場合、同時に入力または選択されたクエリの数に基づいて、前記ワードベクトルを重み付けして加重和を求めることで、前記ユーザベクトルを生成する、
    請求項1から7のうちいずれか1項に記載の情報処理装置。
  9. 前記生成部は、前記ログ情報に複数のクエリが含まれる場合、クエリの類似性に基づいて、前記ワードベクトルを重み付けして加重和を求めることで、前記ユーザベクトルを生成する、
    請求項1から8のうちいずれか1項に記載の情報処理装置。
  10. 前記生成部は、前記ログ情報に関連するワードを形態素解析により形態素ごとに分割し、前記分割した形態素を表すワードの希少性に応じて前記ワードを評価した値に基づいて、前記ワードベクトルを重み付けして加重和を求めることで、前記ユーザベクトルを生成する、
    請求項1から9のうちいずれか1項に記載の情報処理装置。
  11. 前記選択部は、前記コンテンツベクトルと前記ユーザベクトルとの類似度に基づいて、前記一以上のコンテンツベクトルを選択する、
    請求項1から10のうちいずれか1項に記載の情報処理装置。
  12. 前記選択部は、更に、複数の前記ユーザ間における前記ログ情報に関連するワードの注目度合に基づいて、前記一以上のコンテンツベクトルを選択する、
    請求項1から11のうちいずれか1項に記載の情報処理装置。
  13. コンピュータが、
    端末装置を使用するユーザのログ情報に関連するワードが予め与えられたテキスト情報内におけるワード同士の共起性に基づいてベクトルに変換されたワードベクトルの線形和を、前記ユーザを前記ワードベクトルにより分散表現したユーザベクトルとして生成し、
    前記端末装置に配信する複数のコンテンツの候補がベクトルで表された複数のコンテンツベクトルのそれぞれと、前記生成したユーザベクトルとを比較して、前記複数のコンテンツベクトルの中から一以上のコンテンツベクトルを選択する、
    情報処理方法。
  14. コンピュータに、
    端末装置を使用するユーザのログ情報に関連するワードが予め与えられたテキスト情報内におけるワード同士の共起性に基づいてベクトルに変換されたワードベクトルの線形和を、前記ユーザを前記ワードベクトルにより分散表現したユーザベクトルとして生成させ、
    前記端末装置に配信する複数のコンテンツの候補がベクトルで表された複数のコンテンツベクトルのそれぞれと、前記生成させたユーザベクトルとを比較させて、前記複数のコンテンツベクトルの中から一以上のコンテンツベクトルを選択させる、
    プログラム。
JP2016230061A 2016-11-28 2016-11-28 情報処理装置、情報処理方法、およびプログラム Active JP6434954B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2016230061A JP6434954B2 (ja) 2016-11-28 2016-11-28 情報処理装置、情報処理方法、およびプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2016230061A JP6434954B2 (ja) 2016-11-28 2016-11-28 情報処理装置、情報処理方法、およびプログラム

Publications (2)

Publication Number Publication Date
JP2018088051A JP2018088051A (ja) 2018-06-07
JP6434954B2 true JP6434954B2 (ja) 2018-12-05

Family

ID=62494451

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2016230061A Active JP6434954B2 (ja) 2016-11-28 2016-11-28 情報処理装置、情報処理方法、およびプログラム

Country Status (1)

Country Link
JP (1) JP6434954B2 (ja)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7041018B2 (ja) * 2018-07-25 2022-03-23 ヤフー株式会社 学習装置、学習方法及び学習プログラム
JP6679683B2 (ja) * 2018-09-20 2020-04-15 ヤフー株式会社 情報処理装置、情報処理方法及び情報処理プログラム
WO2022244339A1 (ja) * 2021-05-21 2022-11-24 シャープ株式会社 コンテンツ提供端末およびそれに用いられるコンテンツ提供プログラム
JP7419329B2 (ja) * 2021-12-10 2024-01-22 Lineヤフー株式会社 情報処理装置、情報処理方法および情報処理プログラム

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3587703B2 (ja) * 1998-10-30 2004-11-10 シャープ株式会社 ヘルプ機能付き情報処理装置及びヘルプ情報検索方法並びにヘルプ情報検索プログラムを記録した媒体
JP3730451B2 (ja) * 1999-08-24 2006-01-05 シャープ株式会社 情報提供装置
JP5547030B2 (ja) * 2010-10-18 2014-07-09 日本電信電話株式会社 情報分析装置及び方法及びプログラム
JP2013105309A (ja) * 2011-11-14 2013-05-30 Sony Corp 情報処理装置、情報処理方法、及びプログラム
JP2016136355A (ja) * 2015-01-23 2016-07-28 ソニー株式会社 情報処理装置、情報処理方法、及び、プログラム

Also Published As

Publication number Publication date
JP2018088051A (ja) 2018-06-07

Similar Documents

Publication Publication Date Title
US11151203B2 (en) Interest embedding vectors
US11347752B2 (en) Personalized user feed based on monitored activities
US10521469B2 (en) Image Re-ranking method and apparatus
US7519588B2 (en) Keyword characterization and application
KR101700352B1 (ko) 이력적 검색 결과들을 사용한 향상된 문서 분류 데이터 생성
JP5881153B2 (ja) 相関性のある情報の推薦
CN104835072B (zh) 用于社交网络中用户的兼容性评分的方法和系统
US20160321261A1 (en) System and method of providing a content discovery platform for optimizing social network engagements
US20090234825A1 (en) Information distribution system and information distribution method
US11294974B1 (en) Golden embeddings
US20170060993A1 (en) Creating a Training Data Set Based on Unlabeled Textual Data
Qian et al. Social media based event summarization by user–text–image co-clustering
US8380727B2 (en) Information processing device and method, program, and recording medium
EP3529714B1 (en) Animated snippets for search results
KR20160057475A (ko) 소셜 데이터를 능동적으로 획득하기 위한 시스템 및 방법
JP6434954B2 (ja) 情報処理装置、情報処理方法、およびプログラム
JP6767342B2 (ja) 検索装置、検索方法および検索プログラム
US20190258719A1 (en) Emoji classifier
US11249993B2 (en) Answer facts from structured content
JP2016153972A (ja) 抽出装置、抽出方法及び抽出プログラム
JP2009223537A (ja) 情報提供システム及び情報提供方法
JP6501936B1 (ja) 情報処理装置、情報処理方法、およびプログラム
US11200288B1 (en) Validating interests for a search and feed service
US20150169562A1 (en) Associating resources with entities
Yengi et al. Distributed recommender systems with sentiment analysis

Legal Events

Date Code Title Description
A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20170919

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20181109

R150 Certificate of patent or registration of utility model

Ref document number: 6434954

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

S533 Written request for registration of change of name

Free format text: JAPANESE INTERMEDIATE CODE: R313533

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313111

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313111

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350