JP6405704B2 - 情報処理装置、情報処理方法、及び、プログラム - Google Patents

情報処理装置、情報処理方法、及び、プログラム Download PDF

Info

Publication number
JP6405704B2
JP6405704B2 JP2014107710A JP2014107710A JP6405704B2 JP 6405704 B2 JP6405704 B2 JP 6405704B2 JP 2014107710 A JP2014107710 A JP 2014107710A JP 2014107710 A JP2014107710 A JP 2014107710A JP 6405704 B2 JP6405704 B2 JP 6405704B2
Authority
JP
Japan
Prior art keywords
target
user
information
article
unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2014107710A
Other languages
English (en)
Other versions
JP2015225352A (ja
JP2015225352A5 (ja
Inventor
宮嵜 充弘
充弘 宮嵜
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Corp
Original Assignee
Sony Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Corp filed Critical Sony Corp
Priority to JP2014107710A priority Critical patent/JP6405704B2/ja
Priority to US15/305,128 priority patent/US10482142B2/en
Priority to PCT/JP2015/002515 priority patent/WO2015182064A1/en
Priority to EP15726357.5A priority patent/EP3149615A1/en
Publication of JP2015225352A publication Critical patent/JP2015225352A/ja
Publication of JP2015225352A5 publication Critical patent/JP2015225352A5/ja
Application granted granted Critical
Publication of JP6405704B2 publication Critical patent/JP6405704B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/40Information retrieval; Database structures therefor; File system structures therefor of multimedia data, e.g. slideshows comprising image and additional audio data
    • G06F16/43Querying
    • G06F16/435Filtering based on additional data, e.g. user or group profiles
    • G06F16/437Administration of user profiles, e.g. generation, initialisation, adaptation, distribution
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/903Querying
    • G06F16/9038Presentation of query results
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Multimedia (AREA)
  • Computational Linguistics (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Information Transfer Between Computers (AREA)

Description

本技術は、情報処理装置、情報処理方法、及び、プログラムに関し、例えば、情報や物等の推薦を行う場合に用いて好適な情報処理装置、情報処理方法、及び、プログラムに関する。
従来、ユーザの短期的興味、長期的嗜好、及び、知識との関連性に基づいて計画される複数の方略に基づいて、コンテンツの推薦を行うことが提案されている(例えば、特許文献1参照)。特許文献1に記載の発明は、例えば、ニュース等の記事の推薦に適用することができる。
特開2009−140075号公報
ところで、ユーザが記事を閲覧するスタイルは様々である。例えば、ユーザは、特定のトピックに限定せずに様々なトピックに関する記事を閲覧する場合もあれば、特定のトピックに関する記事を深掘りする場合もある。しかしながら、単にユーザの嗜好に基づいて記事を推薦するだけでは、そのような閲覧スタイルの違いに対応できず、その結果、ユーザが所望する記事をなかなか見つけられない場合がある。
本技術は、このような状況に鑑みてなされたものであり、ユーザが所望の情報等を入手しやすくするものである。
本技術の一側面の情報処理装置は、ーザに提示した対象のうち前記ユーザが所定の反応を示した対象である反応対象の分布を異なる観点によりそれぞれ分析した複数の分析値をそれぞれ良くすることが可能な対象であって、前記ユーザに提示する対象である提示対象を前記観点毎に選択する選択部と、前記観点毎に前記提示対象を前記分析値とともに提示するように制御する提示制御部とを備える。
前記提示制御部には、前記ユーザにより指定された前記観点により選択された前記提示対象を提示するように制御させることができる。
前記観点には、前記反応対象が属するクラスタの範囲の広さに基づく第1の観点、前記反応対象の前記クラスタ毎の分布に基づく第2の観点、前記反応対象の新しさに基づく第3の観点、及び、前記反応対象の人気度に基づく第4の観点のうち少なくとも2以上を含ませることができる。
前記選択部には、前記第1の観点により前記提示対象を選択する場合、前記クラスタ内の前記反応対象の量が所定の閾値未満の前記クラスタから前記提示対象を選択させることができる。
前記選択部には、前記第2の観点により前記提示対象を選択する場合、前記ユーザが直前に反応した前記反応対象が属する前記クラスタから前記提示対象を選択させることができる。
前記選択部には、前記第2の観点により前記提示対象を選択する場合、前記クラスタ内の前記反応対象の量が所定の閾値以上の前記クラスタから前記提示対象を選択させることができる。
前記選択部には、前記第3の観点により前記提示対象を選択する場合、直前の所定の期間内に追加又は更新された前記対象の中から前記提示対象を選択させることができる。
前記選択部には、前記第4の観点により前記提示対象を選択する場合、前記人気度が所定の閾値以上の前記対象の中から前記提示対象を選択させることができる。
前記対象はテキスト情報を含み、前記テキスト情報の言語解析の結果に基づいて、前記対象のクラスタリングを行うクラスタリング部をさらに設けることができる。
前記クラスタリング部には、前記対象を前記テキスト情報の主観性に基づく2以上の主観タイプに分類させることができる。
前記提示制御部には、前記主観タイプ毎に個別に前記提示対象を提示するように制御させることができる。
前記提示制御部には、前記ユーザにより指定された前記主観タイプの前記提示対象を提示するように制御させることができる。
前記観点には、前記反応対象の前記主観タイプに基づく第5の観点を含ませることができる。
前記選択部には、前記第5の観点により前記提示対象を選択する場合、前記反応対象の前記主観タイプの偏りを是正することが可能な前記対象を前記提示対象に選択させることができる。
前記対象に対する前記ユーザの嗜好を前記観点毎に学習する学習部をさらに設け、前記選択部には、前記観点毎に異なる学習結果を用いて前記提示対象を選択させることができる。
各前記観点に対する前記ユーザの嗜好を学習する学習部をさらに設け、前記選択部には、前記ユーザの嗜好度が高い前記観点を優先して前記ユーザへの前記提示対象の選択に用いらせることができる。
前記反応対象は、前記ユーザがポジティブな反応を示した前記対象とすることができる。
本技術の一側面の情報処理方法は、ーザに提示した対象のうち前記ユーザが所定の反応を示した対象である反応対象の分布を異なる観点によりそれぞれ分析した複数の分析値をそれぞれ良くすることが可能な対象であって、前記ユーザに提示する対象である提示対象を前記観点毎に選択する選択ステップと、前記観点毎に前記提示対象を前記分析値とともに提示するように制御する提示制御ステップとを含む。
本技術の一側面のプログラムは、ーザに提示した対象のうち前記ユーザが所定の反応を示した対象である反応対象の分布を異なる観点によりそれぞれ分析した複数の分析値をそれぞれ良くすることが可能な対象であって、前記ユーザに提示する対象である提示対象を前記観点毎に選択する選択ステップと、前記観点毎に前記提示対象を前記分析値とともに提示するように制御する提示制御ステップとを含む処理をコンピュータに実行させる。
本技術の一側面においては、ーザに提示した対象のうち前記ユーザが所定の反応を示した対象である反応対象の分布を異なる観点によりそれぞれ分析した複数の分析値をそれぞれ良くすることが可能な対象であって、前記ユーザに提示する対象である提示対象が前記観点毎に選択され、前記観点毎に前記提示対象が前記分析値とともに提示されるように制御される。
本技術の一側面によれば、ユーザが所望の情報等を入手しやすくなる。
なお、ここに記載された効果は必ずしも限定されるものではなく、本開示中に記載されたいずれかの効果であってもよい。
本技術を適用した情報処理システムの一実施の形態を示すブロック図である。 サーバの機能の構成例を示すブロック図である。 クライアントの機能の構成例を示すブロック図である。 情報取得処理を説明するためのフローチャートである。 情報解析処理を説明するためのフローチャートである。 情報提示処理を説明するためのフローチャートである。 クライアントにおいて提示される画面の第1の例を示す図である。 クライアントにおいて提示される画面の第2の例を示す図である。 クライアントにおいて提示される画面の第3の例を示す図である。 コンピュータの構成例を示すブロック図である。
以下、本技術を実施するための形態(以下、実施の形態という)について説明する。なお、説明は以下の順序で行う。
1.実施の形態
2.変形例
<1.実施の形態>
{情報処理システム1の構成例}
図1は、本技術を適用した情報処理システム1の一実施の形態を示している。
情報処理システム1は、サーバ11及びクライアント12−1乃至12−nを含むように構成される。サーバ11及びクライアント12−1乃至12−nは、ネットワーク13を介して相互に接続されており、互いに通信を行う。サーバ11及びクライアント12−1乃至12nの通信方式は、有線又は無線に関わらず、任意の通信方式を採用することが可能である。
サーバ11は、クライアント12−1乃至12−nを使用するユーザに対して、各種の情報や物等の検索及び推薦を行う検索・推薦サービスを提供する。また、サーバ11は、必要に応じて、検索・推薦サービスを利用するのに必要なアプリケーションプログラム(以下、検索・推薦サービスAPPと称する)をクライアント12−1乃至12−nに提供する。
クライアント12−1乃至12−nは、例えば、サーバ11が提供する検索・推薦サービスを各ユーザが利用する際に用いられる。なお、クライアント12−1乃至12−nは、検索・推薦サービスを利用可能な装置であれば、その実施形態は問わない。例えば、クライアント12−1乃至12−nは、スマートフォン、タブレット、携帯電話機、ノート型のパーソナルコンピュータ等の携帯情報端末、デスクトップ型のパーソナルコンピュータ、ゲーム機、動画再生装置、音楽再生装置等により構成される。
なお、以下、サーバ11が、ニュース、SNS(Social Networking Service)への投稿等のテキスト情報を含む記事の検索及び推薦を行う場合を例に挙げて説明する。なお、サーバ11が検索及び推薦する記事には、テキスト情報以外の動画、画像、音声等の情報が含まれていてもよい。
また、以下、クライアント12−1乃至12−nを個々に区別する必要がない場合、単にクライアント12と称する。
{サーバ11の機能の構成例}
図2は、サーバ11の機能の構成例を示している。サーバ11は、情報収集モジュール111、情報編集モジュール112、言語解析モジュール113、トピック解析モジュール114、情報探索度計算モジュール115、情報検索・推薦モジュール116、及び、情報統合モジュール117を含むように構成される。
情報収集モジュール111は、入力部121、情報収集部122、表示部123、及び、記憶部124を含むように構成される。
入力部121は、例えば、キーボード、マウス、ボタン、スイッチ、マイクロフォン等の各種の入力デバイスにより構成される。入力部121は、例えば、情報収集モジュール111に対する指令やデータ等の入力に用いられ、入力された指令やデータ等を情報収集部122に供給する。
情報収集部122は、例えば、プロセッサ等により構成される。情報収集部122は、ネットワーク13を介して、図示せぬサーバ等からユーザに提示する記事の収集を行い、収集した記事に関する情報を情報統合モジュール117の管理部181に供給する。
表示部123は、例えば、ディスプレイ等により構成され、情報収集モジュール111を使用するための画面等の表示を行う。
記憶部124は、例えば、記憶装置により構成され、情報収集部122の処理に必要なデータ等を記憶する。
情報編集モジュール112は、入力部131、情報編集部132、表示部133、及び、記憶部134を含むように構成される。
入力部131は、例えば、キーボード、マウス、ボタン、スイッチ、マイクロフォン等の各種の入力デバイスにより構成される。入力部131は、例えば、情報収集モジュール111に対する指令やデータ等の入力に用いられ、入力された指令やデータ等を情報編集部132に供給する。
情報編集部132は、例えば、プロセッサ等により構成される。情報編集部132は、情報収集モジュール111が収集した記事に関する情報を管理部181から取得し、情報編集を行う。ここで、情報編集とは、例えば、悪質な記事や、セキュリティ面に問題があるウエブサイト上の記事等を除外したり、優先的にユーザに推薦する記事の選択を行ったりすることである。情報編集部132は、情報編集の結果を示す情報を管理部181に供給する。
表示部133は、例えば、ディスプレイ等により構成され、情報編集モジュール112を使用するための画面等の表示を行う。
記憶部134は、例えば、記憶装置により構成され、情報編集部132の処理に必要なデータ等を記憶する。
なお、情報収集モジュール111及び情報編集モジュール112により、情報取得部101が構成される。
言語解析モジュール113は、言語解析部141及び記憶部142を含むように構成される。
言語解析部141は、例えば、プロセッサ等により構成される。言語解析部141は、各記事のメタデータを管理部181から取得し、各記事の言語解析を行う。言語解析部141は、言語解析の結果を管理部181に供給する。
記憶部142は、例えば、記憶装置により構成され、言語解析部141の処理に必要なデータ等を記憶する。
トピック解析モジュール114は、トピック解析部151及び記憶部152を含むように構成される。
トピック解析部151は、例えば、プロセッサ等により構成される。トピック解析部151は、各記事の言語解析の結果を管理部181から取得し、言語解析の結果に基づいて、各記事のトピック解析を行う。トピック解析部151は、各記事のトピック解析の結果を管理部181に供給する。
記憶部152は、例えば、記憶装置により構成され、トピック解析部151の処理に必要なデータ等を記憶する。
なお、言語解析モジュール113及びトピック解析モジュール114により、クラスタリング部102が構成される。
情報探索度計算モジュール115は、情報探索度計算部161及び記憶部162を含むように構成される。
情報探索度計算部161は、例えば、プロセッサ等により構成される。情報探索度計算部161は、各ユーザの各記事に対するフィードバックの内容を示すデータ(以下、ユーザ反応データと称する)を管理部181から取得し、各ユーザがフィードバックを行った記事が属するトピックの分布を示すトピック頻度の集計を行う。また、情報探索度計算部161は、トピック頻度の集計結果に基づいて、各ユーザの情報探索度を計算する。ここで、情報探索度とは、ユーザの情報探索の傾向(ユーザがフィードバックを行った記事の分布)を複数の観点により分析した値であり、詳細については後述する。情報探索度計算部161は、各ユーザのトピック頻度の集計結果及び情報探索度の計算結果を管理部181に供給する。
記憶部162は、例えば、記憶装置により構成され、情報探索度計算部161の処理に必要なデータ等を記憶する。
情報検索・推薦モジュール116は、情報検索部171、情報推薦部172、学習部173、及び、記憶部174を含むように構成される。
情報検索部171は、情報推薦部172、及び、学習部173は、例えば、プロセッサ等により構成される。
情報検索部171は、各ユーザに提示する記事の検索を行う。例えば、情報検索部171は、ユーザにより指定された検索条件、及び、ユーザに提示する対象となる記事に関する情報を管理部181から取得し、検索条件と合致する記事を検索する。情報検索部171は、検索結果を管理部181に供給する。
情報推薦部172は、各ユーザに推薦する記事の選択を行う。例えば、情報推薦部172は、各ユーザのユーザ反応データ及びトピック頻度の集計結果、並びに、ユーザに提示する対象となる記事に関する情報を管理部181から取得する。また、情報推薦部172は、各ユーザの嗜好の学習結果を学習部173から取得する。そして、情報推薦部172は、取得したデータ等に基づいて、各ユーザに推薦する記事を選択する。情報推薦部172は、各ユーザに推薦する記事を示す情報を管理部181に供給する。
このように、情報検索部171と情報推薦部172により、ユーザに提示する記事を選択する選択部が構成される。
学習部173は、各ユーザの嗜好の学習を行う。例えば、学習部173は、各ユーザのユーザ反応データ、並びに、各記事の言語解析及びトピック解析の結果を管理部181から取得する。学習部173は、取得したデータ等に基づいて、各ユーザの記事に対する嗜好を学習する。学習部173は、各ユーザの嗜好の学習結果を情報推薦部172及び管理部181に供給する。
記憶部174は、例えば、記憶装置により構成され、情報検索部171、情報推薦部172、及び、学習部173の処理に必要なデータ等を記憶する。
なお、情報探索度計算モジュール115及び情報検索・推薦モジュール116により、提示情報生成部103が構成される。
情報統合モジュール117は、管理部181、情報提示制御部182、ユーザ操作情報取得部183、及び、記憶部184を含むように構成される。
管理部181、情報提示制御部182、及び、ユーザ操作情報取得部183は、例えば、プロセッサ等により構成される。
管理部181は、例えば、各モジュールの処理を制御したり、各モジュール間のデータ等の授受を制御したりする。また、管理部181は、各モジュール、情報提示制御部182、及び、ユーザ操作情報取得部183から取得したデータ等を記憶部184に記憶させたり、記憶部184に記憶されているデータ等を各モジュール及び情報提示制御部182に供給したりする。
情報提示制御部182は、ネットワーク13を介して、ユーザに記事を提示するためのデータ等を各クライアント12に送信し、各クライアント12における記事の提示の制御を行う。
ユーザ操作情報取得部183は、各ユーザの検索・推薦サービスに対する操作内容を示すユーザ操作情報を、ネットワーク13を介して各クライアント12から受信する。ユーザ操作情報取得部183は、受信したユーザ操作情報を管理部181に供給する。
記憶部184は、例えば、記憶装置により構成され、サーバ11全体の処理に必要なデータ等を記憶する。
{クライアント12の機能の構成例}
図3は、クライアント12の機能の構成例を示している。クライアント12は、情報閲覧モジュール201を含むように構成される。
情報閲覧モジュール201は、入力部211、制御部212、表示部213、及び、記憶部214を含むように構成される。
入力部211は、例えば、キーボード、マウス、ボタン、スイッチ、マイクロフォン等の各種の入力デバイスにより構成される。入力部211は、例えば、情報閲覧モジュール201に対する指令やデータ等の入力に用いられ、入力された指令やデータ等を制御部212に供給する。
制御部212は、例えば、プロセッサ等により構成される。制御部212は、クライアント12における検索・推薦サービスの処理の制御を行う。例えば、制御部212は、ネットワーク13を介してサーバ11から送信されるデータ等を受信し、受信したデータ等に基づいて、表示部213におけるユーザへの記事の提示を制御する。また、制御部212、入力部211を用いてユーザにより入力されたユーザ操作の内容を示すユーザ操作情報を、ネットワーク13を介してサーバ11に送信する。
表示部213は、例えば、ディスプレイ等により構成され、情報閲覧モジュール201を使用するための画面等の表示を行う。
記憶部214は、例えば、記憶装置により構成され、制御部212の処理に必要なデータ等を記憶する。
{情報処理システム1の処理}
次に、図4乃至図9を参照して、情報処理システム1の処理について説明する。
(情報取得処理)
まず、図4のフローチャートを参照して、サーバ11により実行される情報取得処理について説明する。なお、この処理は、例えば、1日に1回、1時間に1回等、定期的に実行される。或いは、この処理は、例えば、検索・推薦サービスの管理者(以下、サービス管理者と称する)からの指令により実行される。
ステップS1において、サーバ11は、情報収集を行う。例えば、情報収集モジュール111の情報収集部122は、ネットワーク13を介して、RSS情報を提供しているウエブサイト(以下、RSSサイトと称する)のクロールを行う。情報収集部122は、クロールの結果得られた各RSSサイトの新着記事及び更新記事に関する情報(以下、新着・更新記事情報と称する)を、情報統合モジュール117の管理部181に供給する。管理部181は、取得した新着・更新記事情報を記憶部184に記憶させる。
なお、新着・更新記事情報は、各記事のメタデータを含む。また、各記事のメタデータは、例えば、記事のタイトル、記事の本文、発行日時、更新日時、記事を掲載しているウエブページのURL、使用言語等を含む。
ステップS2において、サーバ11は、情報編集を行う。具体的には、管理部181は、ステップS1の処理で取得した新着・更新記事情報を、情報編集モジュール112の情報編集部132に供給する。情報編集部132は、新着・更新記事情報に含まれる記事の中から問題のある記事を抽出し、ブラックリストに登録する。ここで、問題のある記事とは、例えば、悪質な記事や、セキュリティ面に問題のあるウエブサイト上の記事等である。
なお、このブラックリストへの登録処理は、人手によりマニュアルで行うようにしてもよいし、情報編集部132が自動的に実行するようにしてもよい。前者の場合、例えば、サービス管理者が、ブラックリストに登録する記事を選択する。後者の場合、例えば、情報編集部132が、学習モデル等を用いて、ブラックリストに登録する記事を自動的に選択する。
また、情報編集部132は、例えば、サービス管理者により入力部131を介して入力される指令に従って、新着・更新記事情報に含まれる記事の中から優先的にユーザに推薦する記事を選択して、ピックアップリストに登録する。
情報編集部132は、ブラックリスト及びピックアップリストを管理部181に供給する。管理部181は、ブラックリスト及びピックアップリストを記憶部184に記憶させる。
ステップS3において、情報統合モジュール117の管理部181は、解析対象記事の登録を行う。具体的には、管理部181は、新着・更新記事情報に含まれる記事のうち、ブラックリストに登録されている記事を除く記事を解析対象記事に登録する。
その後、情報取得処理は終了する。
(情報解析処理)
次に、図5のフローチャートを参照して、サーバ11により実行される情報解析処理について説明する。なお、この処理は、例えば、1日に1回、1時間に1回等、定期的に実行される。或いは、この処理は、例えば、図4を参照して上述した情報取得処理の後に実行される。或いは、この処理は、例えば、サービス管理者からの指令により実行される。
ステップS51において、サーバ11は、解析対象記事の言語解析を行う。具体的には、言語解析モジュール113の言語解析部141は、管理部181を介して、解析対象記事のメタデータを記憶部184から取得する。言語解析部141は、例えば、記憶部142に予め記憶されている単語辞書を用いて、各解析対象記事のタイトル及び本文の形態素解析を行い、各記事のタイトル及び本文から単語を抽出する。
なお、以下、単語辞書に登録されている単語の総数をMとし、各単語を単語wi(i=1,2,・・・,M)で表す。また、以下、解析対象記事の総数をNとし、各記事を記事dj(j=1,2,・・・,N)で表す。また、以下、単語wiを個々に区別する必要がない場合、単に単語w又は単語と称し、記事djを個々に区別する必要がない場合、単に記事d又は記事と称する。
言語解析部141は、予め保持している単語辞書に登録されている各単語wiについて、tfi,j及びdfiを計算する。ここで、tfi,jは、記事djにおける単語wiの出現頻度(出現回数)である。また、dfiは、単語wiを含む記事dの数を表す。
また、言語解析部141は、次式(1)に従って、各記事djにおける各単語wiのtfidfi,jを計算する。
Figure 0006405704
さらに、言語解析部141は、次式(2)に従って、各記事djにおける各単語wiの重みからなる単語ベクトルWjを生成する。
j={tfidf1,j,tfidf2,j,・・・,tfidfM,j} ・・・(2)
すなわち、単語ベクトルWjは、各単語wiの重みに基づいて各記事djの特徴を表す特徴ベクトルである。
言語解析部141は、解析対象記事の言語解析結果を管理部181に供給し、管理部181は、解析対象記事の言語解析結果を記憶部184に記憶させる。なお、各解析対象記事の言語解析結果は、各解析対象記事のtfi,j及びtfidfi,jの計算結果、並びに、単語ベクトルWjを含む。
ステップS52において、サーバ11は、トピック解析を行う。具体的には、管理部181は、解析対象記事の言語解析結果をトピック解析モジュール114のトピック解析部151に供給する。トピック解析部151は、例えば、PLSA(Probabilistic Latent Semantic Analysis;確率的潜在意味解析)やLDA(Latent Dirichlet Allocation;潜在的ディリクレ配分法)等の確率的トピックモデルを用いて、解析対象記事のトピック解析を行う。
例えば、トピック解析部151は、解析対象記事の言語解析結果であるtfi,j及びtfidfi,j、並びに、分類したいトピック(クラスタ)の数Kを入力とし、次式(3)で表されるPLSAを用いて、各記事djの各トピックzk(k=1,2,・・・,K)への帰属確率p(zk|dj)、及び、各トピックzkにおける各単語wiの生起確率p(wi|zk)を計算する。
Figure 0006405704
なお、p(wi|dj)は、記事djにおける単語wiの生起確率である。
さらに、トピック解析部151は、次式(4)に従って、各記事djの各トピックzkへのトピック帰属確率p(zk|dj)からなるトピックベクトルTjを生成する。
j={p(z1|dj),p(z2|dj),・・・,p(zK|dj)} ・・・(4)
すなわち、トピックベクトルTjは、各トピックzkに帰属する確率に基づいて各記事djの特徴を表す特徴ベクトルである。
トピック解析部151は、解析対象記事のトピック解析結果を管理部181に供給し、管理部181は、解析対象記事のトピック解析結果を記憶部184に記憶させる。なお、各解析対象記事のトピック解析結果は、各解析対象記事の単語ベクトルWjを含む。
なお、PLSAの詳細については、"Thomas Hofmann, "Probabilistic latent semantic indexing", 1999, Proceedings of the 22nd annual international ACM SIGIR conference on Research and development in information retrieval"等に記載されている。また、LDAの詳細については、"David M. Blei, Andrew Y. Ng, Michael I. Jordan, "Latent Dirichlet Allocation", 2003, Journal of Machine Learning Research, Volume 3"等に記載されている。
また、以下、トピックzkを個々に区別する必要がない場合、単にトピックz又はトピックと称する。さらに、以下、単語ベクトルWj及びトピックベクトルTjを個々に区別する必要がない場合、それぞれ単に単語ベクトルW及びトピックベクトルTと称する。また、以下、トピック帰属確率p(zk|dj)を個々に区別する必要がない場合、単にトピック帰属確率p(z|d)と称する。
ステップS53において、情報統合モジュール117の管理部181は、閲覧対象情報の登録を行う。具体的には、管理部181は、各解析対象記事を、各記事のメタデータ、単語ベクトルWj、トピックベクトルTj、及び、帰属確率最大トピックとともに、閲覧対象情報に登録する。
ここで、帰属確率最大トピックとは、記事djのトピック帰属確率p(zk|dj)が最大となるトピックのことである。例えば、トピックの分類数(以下、総トピック数と称する)Kが10であり、記事d1のトピックベクトルT1の値が{0.2,0.4,0.8,0.1,0.3,0.5,0.1,0.1,0.3,0.6}である場合、記事d1の帰属確率最大トピックは、トピックz3となる。すなわち、記事d1は、トピックz3に属する確率が最も高く、トピックz3に関する内容を最も多く含んでいると予測される。
なお、以下、閲覧対象情報に登録された記事を閲覧対象記事と称する。
その後、情報解析処理は終了する。
(情報提示処理)
次に、図6のフローチャートを参照して、情報処理システム1により実行される情報提示処理について説明する。なお、この処理は、例えば、ユーザがクライアント12の入力部211を用いて、サーバ11が提供する検索・推薦サービスを利用するための操作(例えば、検索・推薦サービスAPPの起動操作等)を行ったとき開始される。
ステップS101において、クライアント12の情報閲覧モジュール201の制御部212は、ユーザの操作を待つか否かを判定する。ユーザの操作を待つと判定された場合、処理はステップS102に進む。
ステップS102において、情報処理システム1は、ユーザ操作情報を取得する。具体的には、ユーザがクライアント12の情報閲覧モジュール201の入力部211を用いて検索・推薦サービスに対する操作を行った場合、入力部211は、ユーザの操作内容を示す情報を制御部212に供給する。
ここで、検索・推薦サービスに対する操作として、例えば、以下のような操作が想定される。例えば、検索・推薦サービスの画面の表示を開始又は更新する操作、検索・推薦サービスを終了させる操作が想定される。また、例えば、検索クエリの入力、記事を検索する期間(日時)の設定、記事に用いられている言語の設定、記事を配信するRSSサイトの選択等の記事の検索条件を設定する操作が想定される。さらに、例えば、提示された記事に対するフィードバック(例えば、提示された記事の選択や評価等)の入力が想定される。また、例えば、重視する情報探索度の選択、すなわち、後述する広さ、深さ、新しさ、人気のうちいずれの観点の情報探索度を優先して記事の推薦を受けるかを指定する操作が想定される。
制御部212は、ユーザの操作内容を示すユーザ操作情報を生成し、ネットワーク13を介してサーバ11に送信する。サーバ11の情報統合モジュール117のユーザ操作情報取得部183は、クライアント12から送信されたユーザ操作情報を受信し、管理部181に供給する。管理部181は、取得したユーザ操作情報を、必要に応じて各モジュールに供給する。また、管理部181は、提示した記事に対するユーザのフィードバックが、取得したユーザ操作情報に含まれる場合、提示した記事とフィードバックの内容を示すデータを、ユーザ反応データとしてユーザ毎に分けて記憶部184に記憶させる。
ステップS103において、クライアント12の制御部212は、情報の提示を終了するか否かを判定する。例えば、制御部212は、ステップS102の処理で取得したユーザの操作内容が、検索・推薦サービスを終了させる操作でない場合、情報の提示を継続すると判定し、処理はステップS101に戻る。
その後、ステップS101において、ユーザの操作を待たないと判定されるか、ステップS103において、情報の提示を終了すると判定されるまで、ステップS101乃至S103の処理が繰り返し実行される。
一方、ステップS101において、クライアント12の制御部212は、例えば、ステップS102の処理において取得したユーザの操作内容が、検索・推薦サービスの画面の表示を開始又は更新させる操作である場合、ユーザの操作を待たないと判定する。或いは、制御部212は、例えば、ユーザ操作なしに検索・推薦サービスの画面の表示の開始又は更新を行う場合、ユーザの操作を待たないと判定する。そして、制御部212がユーザの操作を待たないと判定した場合、処理はステップS104に進む。
ステップS104において、サーバ11の情報探索度計算モジュール115の情報探索度計算部161は、ユーザの情報探索度の計算を行う。具体的には、情報探索度計算部161は、ユーザの過去のユーザ反応データを、管理部181を介して記憶部184から取得する。そして、情報探索度計算部161は、取得したユーザ反応データに基づいて、ユーザがポジティブなフィードバックを行った記事、換言すれば、ユーザがポジティブな反応を示した記事が属するトピックの分布を示すトピック頻度の集計を行う。例えば、情報探索度計算部161は、ユーザがポジティブなフィードバックを行った記事の帰属確率最大トピックを集計することにより、トピック頻度を集計する。従って、ユーザがポジティブなフィードバックを行う記事が多く属するトピックのトピック頻度の値が大きくなる。
ここで、ユーザがポジティブなフィードバックを行った記事とは、例えば、ユーザが良い評価を与えた記事や、ユーザが提示された記事に対して実際にアクセスした記事等である。
なお、以下、ユーザがポジティブなフィードバックを行った記事を、ポジティブ反応記事と称する。また、以下、ユーザがネガティブなフィードバックを行った記事を、ネガティブ反応記事と称する。なお、ユーザがネガティブなフィードバックを行った記事とは、例えば、ユーザが悪い評価を与えた記事等である。また、以下、ポジティブかネガティブかに関わらずユーザがフィードバックを行った記事を、ユーザ反応記事と称する。
なお、トピック頻度の集計期間は、任意の期間に設定することができる。例えば、トピック頻度の集計期間は、これまでユーザが検索・推薦サービスを利用した全期間、又は、直前の所定の期間(例えば、1日、1週間、1か月、1年等)に設定される。或いは、例えば、トピック頻度の集計期間は、今回の検索・推薦サービスの利用期間(例えば、今回の検索・推薦サービスへのログイン期間)に設定される。
また、例えば、ユーザがポジティブなフィードバックを行った記事のトピックベクトルを積算していくことにより、トピック頻度を集計するようにしてもよい。この場合、ユーザがポジティブなフィードバックを行う記事が属するトピックの分布が、より正確にトピック頻度に反映される。
また、情報探索度計算部161は、集計したトピック頻度に基づいて、複数の観点からユーザの情報探索の傾向を示す情報探索度を計算する。
なお、以下、トピック頻度の分布が、{1,7,0,3,0,1,0,0,2,1}である場合、すなわち、トピックz1のトピック頻度が1、トピックz2のトピック頻度が7、・・・、トピックz10のトピック頻度が1である場合について説明する。また、以下、直前にユーザがポジティブな反応を行った記事の帰属確率最大トピック(以下、直前反応トピックと称する)がトピックz2である場合について説明する。
例えば、情報探索度計算部161は、「広さ」、「深さ」、「新しさ」、及び、「人気」の4つの観点に基づいて、情報探索度を計算する。
情報探索度(広さ)は、ユーザがポジティブなフィードバックを行った記事が属するトピックの範囲の広さ、換言すれば、ユーザがポジティブなフィードバックを行った記事の種類の広さに基づく観点による情報探索度である。例えば、情報探索度(広さ)は、次式(5)により計算される。
情報探索度(広さ)
=トピック頻度が閾値TH1以上のトピックの数÷トピックの総数×100
・・・(5)
例えば、閾値TH1を1に設定した場合、先に示したトピック頻度の例において、トピック頻度が閾値TH1以上のトピック数は6となる。そして、総トピック数が10なので、情報探索度(広さ)は60%となる。
情報探索度(広さ)は、ユーザがポジティブなフィードバックを行った記事が属するトピックの範囲が広いほど大きくなり、ユーザがポジティブなフィードバックを行った記事が属するトピックの範囲が狭いほど小さくなる。従って、情報探索度(広さ)は、ユーザがどの程度の広さまで情報を探索しているかを示す指標となる。
情報探索度(深さ)は、ユーザがポジティブなフィードバックを行った記事のトピック毎の分布に基づく観点による情報探索度である。例えば、情報探索度(深さ)は、次式(6)により計算される。
情報探索度(深さ)=直前反応トピックのトピック頻度÷上限値×100 ・・・(6)
ここで、直前反応トピックのトピック頻度とは、ユーザが直前にポジティブなフィードバックを行った記事の帰属確率最大トピックのトピック頻度である。従って、現在の例では、ユーザの直前反応トピックであるトピックz2のトピック頻度が7なので、上限値を10に設定した場合、情報探索度(深さ)は70%となる。
情報探索度(深さ)は、ユーザが直前反応トピックに属する記事に対してポジティブなフィードバックを行った回数が多いほど大きくなり、ユーザが直前反応トピックに属する記事に対してポジティブなフィードバックを行った回数が少ないほど小さくなる。従って、情報探索度(深さ)は、ユーザが、直前反応トピック(例えば、ユーザが現在注目している記事が属するトピック)に対して、どの程度の深さまで情報を探索しているかを示す指標となる。
なお、上限値の値は、ポジティブ反応記事の総数に従って変更するようにしてもよい。すなわち、ポジティブ反応記事の総数が多いほど、上限値を大きくし、ポジティブ反応記事の総数が少ないほど、上限値を小さくするようにしてもよい。
また、情報探索度(深さ)が、100%を超えるようにしてもよい。
情報探索度(新しさ)は、ユーザがポジティブなフィードバックを行った記事の新しさを基準とする分布に基づく観点による情報探索度である。例えば、情報探索度(新しさ)は、次式(7)により計算される。
情報探索度(新しさ)
=ポジティブ反応記事のうち新しい記事の数÷ポジティブ反応記事の総数 ・・・(7)
例えば、直前の所定の期間内(例えば、直前の6時間以内)に追加又は更新された記事を新しい記事と定義し、新しい記事のみを対象にしたトピック頻度の分布を{0,4,0,1,0,0,0,0,1,0}とした場合、ポジティブ反応記事のうち新しい記事の数は6となる。そして、ポジティブ反応記事の総数が15なので、情報探索度(新しさ)は40%となる。
情報探索度(新しさ)は、新しい記事に対してポジティブなフィードバックを行った回数が多いほど大きくなり、新しい記事に対してポジティブなフィードバックを行った回数が少ないほど小さくなる。従って、情報探索度(新しさ)は、ユーザが新しい情報をどの程度探索しているかを示す指標となる。
情報探索度(人気)は、ユーザがポジティブなフィードバックを行った記事の人気度を基準とする分布に基づく観点による情報探索度である。例えば、情報探索度(人気)は、次式(8)により計算される。
情報探索度(人気)
=ポジティブ反応記事のうち人気記事の数÷ポジティブ反応記事の総数 ・・・(8)
例えば、人気度スコアが所定の閾値以上の記事を人気記事と定義し、人気記事のみを対象にしたトピック頻度の分布を{0,2,0,0,0,0,0,0,1,0}とした場合、ポジティブ反応記事のうち人気記事の数は3となる。そして、ポジティブ反応記事の総数が15なので、情報探索度(人気)は20%となる。
なお、記事の人気度スコアは、例えば、記事のアクセス数や、その記事に良い評価を与えたユーザ数等に基づいて計算される。例えば、ある記事Aに対する全ユーザのアクセス回数をp回、全ての記事に対する全ユーザのアクセス回数をP回とした場合、記事Aの人気度スコアは、p/P×100により計算することができる。
情報探索度(人気)は、人気記事に対してポジティブなフィードバックを行った回数が多いほど大きくなり、人気記事に対してポジティブなフィードバックを行った回数が少ないほど小さくなる。従って、情報探索度(人気)は、ユーザが人気のある情報(例えば、話題になったり、注目されている情報)をどの程度探索しているかを示す指標となる。
なお、例えば、人気記事を、地域、性別、年齢、職業等のユーザのデモグラフィック情報でフィルタリングするようにしてもよい。例えば、ユーザが横浜市在住の30代の男性である場合、横浜市在住の30代の男性の間において人気度スコアが閾値以上の記事のみを、人気記事に設定するようにしてもよい。
また、情報探索度計算部161は、各観点の情報探索度に基づいて、次式(9)により総合探索度を計算する。
総合探索度=(情報探索度(広さ)+情報探索度(深さ)+情報探索度(新しさ)
+情報探索度(人気))÷4 ・・・(9)
すなわち、総合探索度は、各観点の情報探索度の平均値である。
情報探索度計算部161は、ユーザのトピック頻度の集計結果、並びに、情報探索度及び総合探索度の計算結果を管理部181に供給する。管理部181は、ユーザのトピック頻度の集計結果、並びに、情報探索度及び総合探索度の計算結果を記憶部184に記憶させる。
ステップS105において、サーバ11の情報検索・推薦モジュール116の情報検索部171は、記事を検索するか否かを判定する。記事を検索すると判定された場合、処理はステップS106に進む。
ステップS106において、情報検索部171は、記事の検索を行う。具体的には、情報検索部171は、管理部181を介して、閲覧対象情報を記憶部184から取得する。そして、情報検索部171は、例えば、ユーザにより指定された検索条件と合致する記事を、閲覧対象記事の中から検索する。情報検索部171は、検索結果を管理部181に供給する。
なお、以下、ステップS106の処理で検索された記事を検索記事と称する。
その後、処理はステップS107に進む。
一方、ステップS105において、記事を検索しないと判定された場合、ステップS106の処理はスキップされ、処理はステップS107に進む。
ステップS107において、サーバ11の情報検索・推薦モジュール116の情報推薦部172は、記事を推薦するか否かを判定する。記事を推薦すると判定された場合、処理はステップS108に進む。
ステップS108において、サーバ11の情報検索・推薦モジュール116は、ユーザの嗜好及び情報探索度に基づいて、推薦する記事を選択する。具体的には、情報検索・推薦モジュール116の学習部173は、管理部181を介して、閲覧対象情報及びユーザ反応データを記憶部184から取得する。
学習部173は、例えば、ユーザがフィードバックを行った記事(ユーザ反応記事)の単語ベクトル及びトピックベクトルに基づいて、ユーザの単語嗜好ベクトル及びトピック嗜好ベクトルを生成する。例えば、学習部173は、ユーザ反応記事の単語ベクトルを加算することにより、単語嗜好ベクトルを生成する。同様に、例えば、学習部173は、ユーザ反応記事のトピックベクトルを加算することにより、トピック嗜好ベクトルを生成する。学習部173は、ユーザの単語嗜好ベクトル及びトピック嗜好ベクトルを情報推薦部172に供給する。
ここで、学習部173は、ユーザの反応の種類によって、各ユーザ反応記事の単語ベクトル及びトピックベクトルを、重みをつけて加算するようにしてもよい。例えば、学習部173は、ユーザの反応がポジティブかネガティブか等により異なる重みをつけたり、ユーザが実際に記事にアクセスしたか、又は、ユーザが良い評価を与えたかにより異なる重みをつけたりする。
また、例えば、学習部173は、ユーザがポジティブなフィードバックを行った記事(ポジティブ反応記事)の単語ベクトル及びトピックベクトルのみに基づいて、単語嗜好ベクトル及びトピック嗜好ベクトルを生成するようにしてもよい。
さらに、単語嗜好ベクトル及びトピック嗜好ベクトルの生成に用いるユーザのフィードバックの対象期間は、任意の期間に設定することができる。例えば、学習部173は、これまでユーザが検索・推薦サービスを利用した全期間のユーザのフィードバックを用いたり、或いは、直前の所定の期間(例えば、1日、1週間、1か月、1年等)内のユーザのフィードバックを用いたりする。
また、情報推薦部172は、管理部181を介して、ユーザのトピック頻度の集計結果、ユーザ反応データ、並びに、閲覧対象情報を記憶部184から取得する。情報推薦部172は、例えば、ユーザの単語嗜好ベクトルと各閲覧対象記事の単語ベクトルとの間の類似度、及び、ユーザのトピック嗜好ベクトルと各閲覧対象記事のトピックベクトルとの間の類似度の少なくとも一方に基づいて、各閲覧対象記事に対する推薦スコアを算出する。なお、ベクトル間の類似度は、例えばコサイン距離等により算出される。また、推薦スコアは、ベクトル間の類似度が高くなるほど大きくなる。そして、情報推薦部172は、推薦スコアが上位の所定の件数の記事を、ユーザの嗜好に基づいて推薦する記事(以下、嗜好推薦記事と称する)として選択する。
また、情報推薦部172は、情報探索度(広さ)の観点に基づいて、嗜好推薦記事の中からユーザに推薦する記事(以下、広さ推薦記事と称する)を選択する。例えば、情報推薦部172は、嗜好推薦記事のうち、ユーザのトピック頻度が所定の閾値未満(例えば、トピック頻度が0)のトピックと帰属確率最大トピックが一致する記事を広さ推薦記事に選択する。これにより、例えば、ユーザがこれまでほとんどポジティブなフィードバックを行っていない記事が属するトピック(例えば、ユーザがあまりアクセスしていない記事が属するトピック)に属し、かつ、ユーザの嗜好に合う記事が、広さ推薦記事に選択される。
さらに、情報推薦部172は、情報探索度(深さ)の観点に基づいて、嗜好推薦記事の中からユーザに推薦する記事(以下、深さ推薦記事と称する)を選択する。例えば、情報推薦部172は、嗜好推薦記事のうち、直前にユーザがポジティブなフィードバックを行った記事と帰属確率最大トピックが一致する記事を深さ推薦記事に選択する。これにより、例えば、ユーザが直前にポジティブなフィードバックを行った記事と同じトピックに属し、かつ、ユーザの嗜好に合う記事が、深さ推薦記事に選択される。
なお、情報推薦部172は、直前にユーザがポジティブなフィードバックを行った所定のq個の記事に基づいて、深さ推薦記事を選択するようにしてもよい。例えば、情報推薦部172は、嗜好推薦記事のうち、q個の記事のトピックベクトルを加算した後のベクトルにおいてトピック帰属確率p(z|d)が最大となるトピックと帰属確率最大トピックが一致する記事を、深さ推薦記事に選択するようにしてもよい。
また、情報推薦部172は、例えば、嗜好推薦記事のうち、ユーザのトピック頻度が所定の閾値以上のトピックと帰属確率最大トピックが一致する記事を深さ推薦記事に選択するようにすることも可能である。さらに、情報推薦部172は、例えば、嗜好推薦記事のうち、ユーザのトピック頻度が最大となるトピックと帰属確率最大トピックが一致する記事を深さ推薦記事に選択するようにすることも可能である。
また、情報推薦部172は、情報探索度(新しさ)の観点に基づいて、嗜好推薦記事の中からユーザに推薦する記事(以下、新しさ推薦記事と称する)を選択する。例えば、情報推薦部172は、嗜好推薦記事のうち新しい記事を新しさ推薦記事に選択する。これにより、例えば、ユーザの嗜好に合う新しい記事が、新しさ推薦記事に選択される。
さらに、情報推薦部172は、情報探索度(人気)の観点に基づいて、嗜好推薦記事の中からユーザに推薦する記事(以下、人気推薦記事と称する)を選択する。例えば、情報推薦部172は、嗜好推薦記事のうち人気記事を人気推薦記事に選択する。これにより、例えば、ユーザの嗜好に合う人気記事が、人気推薦記事に選択される。
情報推薦部172は、嗜好推薦記事、広さ推薦記事、深さ推薦記事、新しさ推薦記事、及び、人気推薦記事の選択結果を示す情報を管理部181に供給する。
なお、以下、ステップS108の処理でユーザに推薦する記事として選択された記事を推薦記事と総称する。すなわち、推薦記事は、嗜好推薦記事、広さ推薦記事、深さ推薦記事、新しさ推薦記事、及び、人気推薦記事を含む。
その後、処理はステップS109に進む。
一方、ステップS107において、記事を推薦しないと判定された場合、ステップS108の処理はスキップされ、処理はステップS109に進む。
ステップS109において、情報処理システム1は、情報探索度とともに記事を提示する。具体的には、管理部181は、ユーザに提示する記事のメタデータ、すなわち、検索記事及び推薦記事のメタデータを記憶部184から取得する。そして、管理部181は、検索記事及び推薦記事のメタデータ、検索記事の検索結果を示す情報、推薦記事の選択結果を示す情報、並びに、ユーザの情報探索度及び総合探索度の計算結果を示す情報を情報提示制御部182に供給する。
情報提示制御部182は、ユーザに検索記事及び推薦記事、並びに、情報探索度及び総合探索度を提示するための画面の表示に用いる情報提示制御データを生成する。そして、情報提示制御部182は、ネットワーク13を介して、情報提示制御データをクライアント12に送信する。
クライアント12の情報閲覧モジュール201の制御部212は、サーバ11から情報提示制御データを受信する。制御部212は、情報提示制御データに基づいて、検索記事及び推薦記事、並びに、情報探索度を提示するための画面を表示部213に表示させる。
図7の画面301及び図8の画面331は、このとき表示部213に表示される画面の例を示している。なお、画面301と画面331とは、1つの画面内に並べて或いは重ねて表示してもよいし、別画面にして、所定の操作により表示が切り替わるようにしてもよい。
図7の画面301は、検索記事及び嗜好推薦記事をユーザに提示するための画面の例である。例えば、検索記事のうち所定のSNS(Social Networking Service)から提供される記事が、サムネイル311a乃至311cにより提示されている。また、例えば、嗜好推薦記事が、サムネイル312a乃至312cにより提示されている。さらに、例えば、検索記事のうち所定の動画サイトから提供される記事(動画を含む)が、サムネイル313a乃至313cにより提示されている。また、検索記事のうち特定のトピック(この例の場合、経済)に属する記事が、サムネイル314a乃至314cにより提示されている。
なお、検索記事や嗜好推薦記事の中に、優先的にユーザに推薦するように設定されている記事があれば、その記事が優先的に提示される。また、例えば、ユーザにより重視する情報探索度が選択されている場合、その選択された情報探索度に基づいて検索された記事が優先的に提示される。例えば、ユーザに情報探索度(広さ)を重視するように設定されている場合、検索記事や嗜好推薦記事の中に広さ推薦記事が含まれる場合、その記事が優先的に提示される。
そして、例えば、ユーザは、入力部211を操作して、サムネイル311a乃至314cのいずれかのサムネイルをクリックすることにより、クリックしたサムネイルに対応する記事が掲載されているウエブページを表示部213に表示させることができる。
図8の画面331は、ユーザの情報探索度及び総合探索度、並びに、情報探索度に基づく推薦記事をユーザに提示するための画面の例である。具体的には、画面331内には、ガイダンス表示部341、探索度表示部342a乃至342e、及び、推薦情報表示部343a乃至343dが配置されている。より具体的には、ガイダンス表示部341は、画面331の右上に配置されている。推薦情報表示部343a乃至343dは、ガイダンス表示部341の下に上下方向に並ぶように配置されている。探索度表示部342a乃至342dは、それぞれ推薦情報表示部343a乃至343dの左に並ぶように配置されている。また、探索度表示部342eは、探索度表示部342dの下に配置されている。
ガイダンス表示部341には、推薦情報表示部343a乃至343d内の記事をクリックし、選択することにより、その記事の左に表示されている情報探索度を上げるよう促すメッセージが表示されている。
探索度表示部342a内の右側には、ユーザの情報探索度(広さ)を示すグラフが表示されている。この例では、ユーザの情報探索度(広さ)は60%である。探索度表示部342a内の左側には、推薦情報表示部343a内の記事が、ユーザの情報探索の範囲を広げる記事であることを示すメッセージが表示されている。
推薦情報表示部343aには、情報探索度(広さ)を上げることが可能な記事の一部又はヘッドラインが表示される。具体的には、推薦情報表示部343a内の記事は、上述した広さ推薦記事の中から選択される。例えば、広さ推薦記事のうち最も推薦スコアが高い記事が選択される。或いは、例えば、広さ推薦記事の中に優先的にユーザに推薦するように設定されている記事があれば、その記事が選択される。
探索度表示部342b内の右側には、ユーザの情報探索度(深さ)を示すグラフが表示されている。この例では、ユーザの情報探索度(深さ)は70%である。また、探索度表示部342b内の左側には、推薦情報表示部343b内の記事が、ユーザの情報探索を深める記事であることを示すメッセージが表示されている。
推薦情報表示部343bには、情報探索度(深さ)を上げることが可能な記事の一部又はヘッドラインが表示される。具体的には、推薦情報表示部343bに表示される記事は、上述した深さ推薦記事の中から選択される。例えば、深さ推薦記事のうち最も推薦スコアが高い記事が選択される。或いは、例えば、深さ推薦記事の中に優先的にユーザに推薦するように設定されている記事があれば、その記事が選択される。
探索度表示部342c内の右側には、ユーザの情報探索度(新しさ)を示すグラフが表示されている。この例では、ユーザの情報探索度(新しさ)は40%である。また、探索度表示部342c内の左側には、推薦情報表示部343c内の記事が新しい記事であることを示すメッセージが表示されている。
推薦情報表示部343cには、情報探索度(新しさ)を上げることが可能な記事の一部又はヘッドラインが表示される。具体的には、推薦情報表示部343cに表示される記事は、上述した新しさ推薦記事の中から選択される。例えば、新しさ推薦記事のうち最も推薦スコアが高い記事が選択される。或いは、例えば、新しさ推薦記事の中に優先的にユーザに推薦するように設定されている記事があれば、その記事が選択される。
探索度表示部342d内の右側には、ユーザの情報探索度(人気)を示すグラフが表示されている。この例では、ユーザの情報探索度(人気)が30%である。また、探索度表示部342d内の左側には、推薦情報表示部343d内の記事が現在人気の記事であることを示すメッセージが表示されている。
推薦情報表示部343dには、情報探索度(人気)を上げることが可能な記事の一部又はヘッドラインが表示される。具体的には、推薦情報表示部343dに表示される記事は、上述した人気推薦記事の中から選択される。例えば、人気推薦記事のうち最も推薦スコアが高い記事が選択される。或いは、例えば、人気推薦記事の中に優先的にユーザに推薦するように設定されている記事があれば、その記事が選択される。
探索度表示部342eには、ユーザの総合探索度の値を示すグラフが表示されている。この例では、ユーザの総合探索度は50%である。
このように、画面331では、情報探索度の観点毎に個別に推薦記事が提示されるので、ユーザは、各観点に基づく推薦記事を容易に選択することができる。また、ユーザは、自分の情報探索の網羅性や多様性等を容易に把握することができる。例えば、ユーザは、情報探索度(広さ)に基づいて、どの程度まで広く情報を探索しているかを客観的な数値で知ることができる。また、ユーザは、情報探索度(深さ)に基づいて、どの程度まで深く情報を探索しているかを客観的な数値で知ることができる。さらに、ユーザは、情報探索度(新しさ)に基づいて、新しい情報をどの程度探索しているかを客観的な数値で知ることができる。また、ユーザは、情報探索度(人気)に基づいて、人気のある情報をどの程度探索しているかを客観的な数値で知ることができる。
その後、処理はステップS101に戻り、ステップS103において情報の提示を終了すると判定されるまで、ステップS101乃至S109の処理が繰り返し実行される。そして、例えば、ユーザ操作等に従って、検索記事や推薦記事を提示する画面が更新されたり、ユーザが選択した記事を掲載するウエブページが表示されたりする。
例えば、図9に示されるように、ユーザが、入力部211を用いて、画面331の推薦情報表示部343cをクリックすることにより、推薦情報表示部343c内の記事が実際に掲載されているウエブページを提示するための画面361が表示される。画面361は、例えば、画面331の上にオーバーレイ表示してもよいし、画面331と並べて表示するようにしてもよい。
また、推薦情報表示部343cをクリックすることにより、画面331内の探索度表示部342a乃至342e内の各情報探索度及び総合探索度の値が変化する。例えば、推薦情報表示部343c内の記事の帰属確率最大トピックがz9であり、新しい記事であり、人気記事でない場合、情報探索度(広さ)は60%のままとなる。一方、情報探索度(深さ)は30%に変化し、情報探索度(新しさ)は43.75%(ただし、図9内では44%と表示)に変化し、情報探索度(人気)は25%に変化する。また、総合探索度は、39.9375%(ただし、図9内では40%と表示)に変化する。
一方、ステップS103において、クライアント12の制御部212は、ステップS102の処理で取得したユーザの操作内容が、検索・推薦サービスを終了させる操作である場合、情報の提示を終了すると判定し、処理はステップS110に進む。
ステップS110において、クライアント12は、情報の提示を終了する。例えば、クライアント12の制御部212は、検索・推薦サービスの画面の表示を終了させる。或いは、制御部212は、検索・推薦サービスAPPの実行を終了する。
その後、情報提示処理は終了する。
以上のように、情報探索度に基づいて異なる観点で記事が推薦されるので、ユーザは、所望の記事を見つけやすくなる。また、ユーザは、例えば、興味のある記事の範囲を容易に広げたり、自分の興味のある記事を容易に深掘りしたり、未知の新しい記事や人気のある記事に容易にアクセスしたりすることができる。従って、ユーザは、効率的かつ容易に所望の情報や満足度の高い情報を入手することができる。また、検索クエリ等を用いて、明確な目的を持って記事の検索を行う場合だけでなく、目的が不明確なザッピング等を行う場合にも、ユーザは、所望の情報や満足度の高い情報を容易に入手することができる。また、情報探索度に基づいて記事の推薦を行うことにより、冗長な記事の推薦が回避される。
また、ユーザは、情報探索度に基づいて、自分の情報探索の網羅性や多様性等を客観的に認識することができる。これにより、例えば、ユーザは、自分の情報探索行動が十分であるか、満足できるか等を客観的に判断することができる。そして、例えば、ユーザが自分の情報探索行動に満足感を覚えることにより、ザッピング等で無為に時間を消費するインターネット依存症等の予防効果が生じる。
さらに、クラスタリング部102は、確率的トピックモデルを用いて各記事のトピックを分類することにより、事前知識を用いることなく、適切に記事の分類を行うことができる。これにより、例えば、シソーラス等の事前知識が必要ないため、インターネット上に溢れる最新の語彙やフレーズの特徴を簡単かつ迅速に反映した記事の分類が実現される。また、意味的つながりを反映した動的な記事の分類が可能になる。
<2.変形例>
以下、上述した本技術の実施の形態の変形例について説明する。
{トピック解析に関する変形例}
例えば、特開2010−272004号公報(以下、特許文献2と称する)や、「N. Kobayashi他, "Opinion Mining from Web documents: Extraction and Structurization", 人工知能学会論文誌, Vol.22, No.2, March 2007, pp.227-238」(以下、非特許文献1と称する)等に開示されている主観判別の手法を用いて、各記事を主観性に基づいて2以上のタイプ(以下、主観タイプと称する)に分類することができる。例えば、各記事は、主観的な記事と客観的な(中立的な)記事の2種類に分類できる。また、例えば、主観的な記事は、ポジティブな記事とネガティブな記事に分類できる。
ここで、主観的な記事とは、例えば、主観的な表現(例えば、思考、意見、感情等)を含む記事のことであり、特許文献2の意見文に該当する。一方、客観的な記事とは、例えば、主観的な表現を含まず、客観的な事実のみを含む記事であり、特許文献2の非意見文に該当する。また、ポジティブな記事とは、例えば、ポジティブな表現を含む記事のことである。一方、ネガティブな記事とは、例えば、ネガティブな表現を含む記事のことである。
このように、各記事は、主観判別の手法を用いて、ポジティブな記事、ネガティブな記事、及び、客観的な記事の3種類の主観タイプに分類することができる。そして、例えば、各記事を主観判別により、ポジティブな記事、ネガティブな記事、及び、客観的な記事の3つの主観タイプに分類した後、主観タイプ毎にトピック解析を行うことにより、各記事を分類するトピックの数は、実質的に3倍になる。
例えば、トピック解析部151は、まず、各記事をポジティブな記事、ネガティブな記事、及び、客観的な記事の3種類の主観タイプに分類する。そして、トピック解析部151は、ポジティブな記事のグループに対して、上述した方法によりトピック解析を行う。これにより、ポジティブな記事のグループにおいて、K個のトピックが生成され、各記事の各トピックへの帰属確率p(z|d)が計算される。同様にして、ネガティブな記事のグループにおいて、K個のトピックが生成され、各記事の各トピックへの帰属確率p(z|d)が計算される。また、客観的な記事のグループにおいて、K個のトピックが生成され、各記事の各トピックへの帰属確率p(z|d)が計算される。
このように、各記事が、ポジティブな記事、ネガティブな記事、及び、客観的な記事の3つの主観タイプに分類され、さらに、主観タイプ毎に各記事のトピックの分類が行われる。これにより、サーバ11は、主観タイプ毎に記事を分類して提示したり、推薦したりすることができる。
例えば、サーバ11の情報提示制御部182は、同じトピックに属する記事(例えば、同じ話題に関する記事)について、ポジティブな記事、ネガティブな記事、及び、客観的な記事を個別に並べて提示することができる。これにより、例えば、ユーザは、ある話題について、好みの主観タイプの記事のみを選択して閲覧したり、異なる主観タイプの記事を比較したりすることが可能になる。
また、例えば、情報提示制御部182は、情報探索度の観点毎に、ポジティブな記事、ネガティブな記事、及び、客観的な記事の3種類の記事を個別に並べて提示させるようにすることが可能である。例えば、情報提示制御部182は、図8の推薦情報表示部343aに、ポジティブな広さ推薦記事、ネガティブな広さ推薦記事、及び、客観的な広さ推薦記事の3種類を縦に並べて表示し、それぞれ個別に選択できるようにすることが可能である。
ここで、推薦情報表示部343aに並べて表示する記事は、同じ話題に関する記事であってもよいし、異なる話題に関する記事であってもよい。例えば、前者の場合、同じ製品に関するポジティブな記事、ネガティブな記事、客観的な記事のように、同じ話題について、それぞれ異なる主観タイプの記事が同時に提示される。一方、後者の場合、例えば、野球に関するポジティブな記事、サッカーに関するネガティブな記事、科学に関する客観的な記事のように、異なる話題について、それぞれ異なる主観種別の記事が同時に提示される。
さらに、例えば、情報提示制御部182は、情報探索度の観点毎に、どの主観タイプの記事を提示させるかをユーザに指定させるようにすることができる。例えば、情報提示制御部182は、図8の推薦情報表示部343aの近く又は内部に、ユーザが主観タイプを指定するためのボタン等を表示させ、ユーザが指定した主観タイプの広さ推薦記事を推薦情報表示部343a内に表示させるようにすることができる。
これにより、ユーザは、情報探索度の各観点に従って推薦された各記事の中から、好みの主観タイプの記事のみを選択して閲覧したり、異なる主観タイプの記事を閲覧し、比較したりすることが可能になる。
さらに、例えば、情報提示制御部182は、各記事を提示する場合に、各記事がどの主観タイプの記事であるかを明示させることもできる。これにより、ユーザは、記事の内容を読む前に、その記事がポジティブな記事、ネガティブな記事、又は、中立な記事のいずれであるかを知ることができる。
また、例えば、サーバ11の情報推薦部172は、主観タイプが偏らないようにバランスを取りながら、記事の推薦を行うことができる。例えば、情報推薦部172は、ユーザがポジティブなフィードバックを行った記事に関連する記事群を推薦する場合に、推薦する記事の主観タイプを、順番に或いはランダムに切り替えることが可能である。
さらに、例えば、情報推薦部172は、ユーザが指定した主観タイプの記事を優先して推薦することができる。例えば、情報推薦部172は、ユーザがポジティブなフィードバックを行った記事に関連する記事群を推薦する場合に、ユーザが指定した主観タイプの記事(例えば、ポジティブな記事)を優先的に推薦することが可能である。また、例えば、情報推薦部172は、図8の推薦情報表示部343a乃至343d内に表示する情報探索度の各観点に基づいて推薦する記事として、ユーザが指定した主観タイプの記事(例えば、ポジティブな記事)を優先的に推薦することが可能である。
また、例えば、ユーザがポジティブなフィードバックを行った記事の主観タイプを基準とする分布に基づく情報探索度(公平性)を追加することが可能である。すなわち、情報探索度(公平性)は、ユーザがポジティブなフィードバックを行った記事を主観タイプ毎に分類した場合、各主観タイプ間の記事の数の偏りが小さいほど大きくなり、各主観タイプ間の記事の数の偏りが大きいほど小さくなる。従って、ユーザが、ポジティブな記事、ネガティブな記事、及び、客観的な記事に対して万遍なくポジティブなフィードバックを行っている場合、情報探索度(公平性)は大きくなる。一方、ユーザがポジティブなフィードバックを行っている記事が、ポジティブな記事、ネガティブな記事、及び、客観的な記事のいずれか1つ又は2つに偏っている場合、情報探索度(公平性)は小さくなる。
さらに、例えば、情報推薦部172は、情報探索度(公平性)の観点に基づいて、推薦する記事を選択するようにしてもよい。例えば、情報推薦部172は、ユーザがポジティブなフィードバックを行う記事(ポジティブ反応記事)が、ポジティブな記事、ネガティブな記事、及び、客観的な記事のいずれか1つ又は2つに偏っている場合、フィードバックの数が少ない主観タイプの記事を優先して推薦するようにしてもよい。例えば、ユーザのポジティブ反応記事がネガティブな記事に偏っている場合、情報推薦部172は、ポジティブな記事又は客観的な記事を優先してユーザに推薦するようにしてもよい。
なお、各記事をポジティブな記事とネガティブな記事の2種類の主観タイプ、又は、主観的な記事と客観的な記事の2種類の主観タイプに分類して、上記の処理を行うようにしてもよい。或いは、ポジティブ度に基づいてポジティブな記事をさらに細分化したり、ネガティブ度に基づいてネガティブな記事をさらに細分化したりするようにしてもよい。また、例えば、ポジティブ、ネガティブ以外の主観表現に基づいて、記事を分類するようにしてもよい。
{推薦方法に関する変形例}
以上の説明では、情報探索度の各観点に基づく推薦記事を、ユーザが嗜好する記事(嗜好推薦記事)の中から選択する例を示したが、嗜好推薦記事以外の記事の中から選択するようにしてもよい。
また、図8の画面331では、情報探索度の観点毎に個別に並べて推薦記事を提示する例を示したが、例えば、ユーザが所望の観点を指定し、ユーザが指定した観点に基づく推薦記事を提示するようにしてもよい。
{嗜好学習に関する変形例}
また、例えば、図8の画面331のように、情報探索度の観点毎に記事の推薦を行うことにより、サーバ11の学習部173は、情報探索度の観点毎にユーザの嗜好を学習することができる。
例えば、学習部173は、情報探索度(広さ)に基づいて推薦した記事に対してユーザがポジティブなフィードバックを行った記事のみに基づいて学習を行うことにより、情報探索度(広さ)に基づいて推薦した記事に対するユーザの嗜好を学習することができる。同様に、学習部173は、情報嗜好度(深さ)、情報嗜好度(新しさ)、及び、情報嗜好度(人気)に基づいて推薦した記事に対するユーザの嗜好をそれぞれ学習することができる。
これにより、例えば、情報推薦部172は、情報嗜好度の観点毎に異なる学習結果を用いて、異なる傾向で記事の推薦をすることができる。例えば、情報推薦部172は、情報嗜好度(広さ)に基づいて記事を推薦する場合と、情報嗜好度(深さ)に基づいて記事を推薦する場合とで、推薦する記事が属するトピックの傾向を変えることができる。これにより、例えば、ユーザが知識を広げる場合と、知識の深掘りをする場合とで、アクセスする記事の傾向が異なる場合でも、その傾向に応じて適切な記事が推薦される。
また、例えば、学習部173は、情報探索度の各観点に基づいて推薦した記事に対してポジティブなフィードバックを行った回数を個別に集計することにより、情報探索度の各観点に対するユーザの嗜好を学習することができる。これにより、例えば、学習部173は、情報を幅広く収集するタイプ、知識を深掘りするタイプ、最新の情報をチェックするタイプ、流行を追いかけるタイプ等にユーザを分類することができる。そして、例えば、情報推薦部172は、ユーザに記事を推薦する場合に、ユーザがより好む情報探索度の観点を優先的に用いて記事を推薦することにより、よりユーザの嗜好に合った記事を推薦することが可能になる。
また、例えば、学習部173は、情報探索度と時間や場所等のコンテクスト情報とを組み合わせることにより、ユーザの嗜好をより細分化して学習することが可能である。例えば、学習部173は、情報探索度(広さ)に基づいて推薦した記事に対するユーザの嗜好を場所や時間等により分類して学習することができる。そして、例えば、情報推薦部172は、学習結果に基づいて、ユーザが職場にいる場合と自宅にいる場合とで、情報探索度(広さ)に基づいて推薦する記事の傾向を変えることができる。
また、例えば、学習部173は、情報探索度の各観点に対する嗜好を場所や時間等で分けて学習することができる。そして、例えば、情報推薦部172は、学習結果に基づいて、ユーザが会社にいる職場と自宅にいる場合とで、優先して推薦に用いる情報探索度の観点を切り替えることができる。
{トピック頻度の集計方法に関する変形例}
また、以上の説明では、情報探索度計算部161は、ユーザがポジティブなフィードバックを行った記事のみを対象にしてトピック頻度の集計を行ったが、ユーザがネガティブなフィードバックを行った記事も対象に含めるようにしてもよい。すなわち、情報探索度計算部161は、ユーザがフィードバックを行った全ての記事、換言すれば、ユーザが反応を示した全ての記事を対象にしてトピック頻度の集計を行うようにしてもよい。或いは、例えば、情報探索度計算部161は、ユーザが所定の内容のフィードバックを行った記事のみを対象にしてトピック頻度の集計を行うようにしてもよい。
さらに、情報探索度計算部161は、例えば、トピック頻度の集計を行う場合に、フィードバックの内容に応じて重み付け加算するようにしてもよい。例えば、情報探索度計算部161は、ユーザが実際に記事にアクセスしたか、又は、ユーザが良い評価を与えたか等により異なる重みをつけるようにしてもよい。また、例えば、情報探索度計算部161は、ユーザがポジティブなフィードバックを行った場合には、トピック頻度を加算し、ユーザがネガティブなフィードバックを行った場合には、トピック頻度を減算するようにしてもよい。
{提示方法に関する変形例}
また、本技術において、記事等の情報の提示に用いるデバイスには、任意の種類のデバイスを採用することができる。例えば、ディスプレイ方式、投影方式等の各種の表示デバイスを採用することができる。また、例えば、眼鏡型、腕時計型、ブレスレット型、ネックレス型、ネックバンド型、イヤフォン型、ヘッドセット型、ヘッドマウント型等の各種のウエアラブルデバイスを採用することができる。
さらに、ユーザが所望の記事を選択する方法も、上述したクリックだけでなく、デバイスの種類に応じて、タッチ操作等の任意の方法を採用することができる。
また、記事等の情報の提示に用いるデバイスには、例えば、画像等の視覚情報を伝達するデバイスだけでなく、音声等の聴覚情報を伝達するデバイスを採用することができる。例えば、ネックバンド型やヘッドセット型等の聴覚情報を伝達するウエアラブルデバイスを採用した場合、情報探索度に基づいて推薦する記事のヘッドライン等を音声でユーザに伝えるようにすることが可能である。また、この場合、音声認識の技術を用いて、ユーザが所望の記事を選択できるようにすることが可能である。例えば、ユーザが、「もっと広く」、「深掘りして」、「最新ニュースは」、「流行の話題は」等の音声コマンドを入力することにより、情報探索度の各観点に基づいて推薦された記事を選択可能にすることができる。
また、例えば、クライアント12において記事の提示を行うだけでなく、クライアント12から他の装置(例えば、携帯情報端末やウエアラブルデバイス等)に記事を転送して、他の装置が、転送された記事を提示するようにすることも可能である。
{提示対象に関する変形例}
また、以上の説明では、ユーザに提示する提示対象を記事とする例を示したが、記事以外の各種の情報を提示対象とする場合にも、その提示対象が複数のクラスタに分類することが可能であれば、本技術を適用することが可能である。例えば、本技術では、記事のようなテキスト情報だけでなく、動画、画像、音声等のテキスト情報以外の情報(以下、非テキスト情報と称する)を提示対象とすることができる。
ここで、非テキスト情報を提示対象とする場合、例えば、クラスタリング部102は、非テキスト情報に関連するテキスト情報に基づいて、上述した潜在トピックモデル用いて、各非テキスト情報を複数のクラスタに分類することができる。この場合、例えば、非テキスト情報のメタデータ(例えば、タイトル、アーティスト、出演者、ジャンル、生成場所、生成日時等)、非テキスト情報に関する評論文、感想文、記事等に含まれるテキスト情報に基づいて、クラスタリングが行われる。
また、例えば、クラスタリング部102は、非テキスト情報の属性や、非テキスト情報自身の特徴量(例えば、動画、画像、音声等の特徴量)に基づいて、非テキスト情報を複数のクラスタに分類することができる。例えば、クラスタリング部102は、楽曲データの特徴量に基づいて、楽曲データを複数のクラスタ(例えば、ジャンル)に分類することが可能である。
また、本技術では、例えば、情報以外の商品、行動、場所、人等も、提示対象とすることができる。なお、情報以外の提示対象についても、上述したように、提示対象に関連するテキスト情報や、提示対象自身の特徴量に基づいて、クラスタリングが行われる。
さらに、本技術においては、上述した潜在トピックモデル以外の任意のクラスタリング手法を採用することも可能である。また、例えば、本技術に採用するクラスタリング手法は、階層的手法であってもよいし、非階層的手法であってもよい。さらに、例えば、本技術に採用するクラスタリング手法は、ソフトクラスタリングであってもよいし、ハードクラスタリングであってもよい。或いは、人がマニュアルで提示対象のクラスタリングを行うようにしてもよい。
{機能分担等に関する変形例}
上述したサーバ11とクライアント12の機能の分担は、その一例であり、任意に変更することが可能である。例えば、情報探索度計算モジュール115及び情報検索・推薦モジュール116を、クライアント12に設けるようにしてもよい。
また、例えば、適宜各モジュールを統合したり、分離したりすることも可能である。例えば、複数のモジュールの入力部、表示部、記憶部を、適宜共用することが可能である。
{コンピュータの構成例}
上述した一連の処理は、ハードウエアにより実行することもできるし、ソフトウエアにより実行することもできる。一連の処理をソフトウエアにより実行する場合には、そのソフトウエアを構成するプログラムが、コンピュータにインストールされる。ここで、コンピュータには、専用のハードウエアに組み込まれているコンピュータや、各種のプログラムをインストールすることで、各種の機能を実行することが可能な、例えば汎用のパーソナルコンピュータなどが含まれる。
図10は、上述した一連の処理をプログラムにより実行するコンピュータのハードウエアの構成例を示すブロック図である。
コンピュータにおいて、CPU(Central Processing Unit)501,ROM(Read Only Memory)502,RAM(Random Access Memory)503は、バス504により相互に接続されている。
バス504には、さらに、入出力インタフェース505が接続されている。入出力インタフェース505には、入力部506、出力部507、記憶部508、通信部509、及びドライブ510が接続されている。
入力部506は、キーボード、マウス、マイクロフォンなどよりなる。出力部507は、ディスプレイ、スピーカなどよりなる。記憶部508は、ハードディスクや不揮発性のメモリなどよりなる。通信部509は、ネットワークインタフェースなどよりなる。ドライブ510は、磁気ディスク、光ディスク、光磁気ディスク、又は半導体メモリなどのリムーバブルメディア511を駆動する。
以上のように構成されるコンピュータでは、CPU501が、例えば、記憶部508に記憶されているプログラムを、入出力インタフェース505及びバス504を介して、RAM503にロードして実行することにより、上述した一連の処理が行われる。
コンピュータ(CPU501)が実行するプログラムは、例えば、パッケージメディア等としてのリムーバブルメディア511に記録して提供することができる。また、プログラムは、ローカルエリアネットワーク、インターネット、デジタル衛星放送といった、有線または無線の伝送媒体を介して提供することができる。
コンピュータでは、プログラムは、リムーバブルメディア511をドライブ510に装着することにより、入出力インタフェース505を介して、記憶部508にインストールすることができる。また、プログラムは、有線または無線の伝送媒体を介して、通信部509で受信し、記憶部508にインストールすることができる。その他、プログラムは、ROM502や記憶部508に、あらかじめインストールしておくことができる。
なお、コンピュータが実行するプログラムは、本明細書で説明する順序に沿って時系列に処理が行われるプログラムであっても良いし、並列に、あるいは呼び出しが行われたとき等の必要なタイミングで処理が行われるプログラムであっても良い。
また、本明細書において、システムとは、複数の構成要素(装置、モジュール(部品)等)の集合を意味し、すべての構成要素が同一筐体中にあるか否かは問わない。したがって、別個の筐体に収納され、ネットワークを介して接続されている複数の装置、及び、1つの筐体の中に複数のモジュールが収納されている1つの装置は、いずれも、システムである。
さらに、本技術の実施の形態は、上述した実施の形態に限定されるものではなく、本技術の要旨を逸脱しない範囲において種々の変更が可能である。
例えば、本技術は、1つの機能をネットワークを介して複数の装置で分担、共同して処理するクラウドコンピューティングの構成をとることができる。
また、上述のフローチャートで説明した各ステップは、1つの装置で実行する他、複数の装置で分担して実行することができる。
さらに、1つのステップに複数の処理が含まれる場合には、その1つのステップに含まれる複数の処理は、1つの装置で実行する他、複数の装置で分担して実行することができる。
また、本明細書に記載された効果はあくまで例示であって限定されるものではなく、他の効果があってもよい。
さらに、例えば、本技術は以下のような構成も取ることができる。
(1)
ユーザに対して所定の対象の提示を行う場合に、前記ユーザに提示した前記対象のうち前記ユーザが所定の反応を示した前記対象である反応対象の分布に基づく2以上の観点毎に、前記ユーザに提示する前記対象である提示対象を選択する選択部と、
前記提示対象の提示を制御する提示制御部と
を備える情報処理装置。
(2)
前記提示制御部は、前記観点毎に個別に前記提示対象を提示するように制御する
前記(1)に記載の情報処理装置。
(3)
前記提示制御部は、前記ユーザにより指定された前記観点により選択された前記提示対象を提示するように制御する
前記(1)又は(2)に記載の情報処理装置。
(4)
前記提示制御部は、さらに前記反応対象の分布を前記観点により分析した値を提示するように制御する
前記(1)乃至(3)のいずれかに記載の情報処理装置。
(5)
前記選択部は、前記反応対象が属するクラスタの範囲の広さに基づく第1の観点、前記反応対象の前記クラスタ毎の分布に基づく第2の観点、前記反応対象の新しさを基準とする分布に基づく第3の観点、及び、前記反応対象の人気度を基準とする分布に基づく第4の観点のうち少なくとも2以上の観点毎に、前記提示対象を選択する
前記(1)乃至(4)のいずれかに記載の情報処理装置。
(6)
前記選択部は、前記第1の観点により前記提示対象を選択する場合、前記クラスタ内の前記反応対象の量が所定の閾値未満の前記クラスタから前記提示対象を選択する
前記(5)に記載の情報処理装置。
(7)
前記選択部は、前記第2の観点により前記提示対象を選択する場合、前記ユーザが直前に反応した前記反応対象が属する前記クラスタから前記提示対象を選択する
前記(5)又は(6)に記載の情報処理装置。
(8)
前記選択部は、前記第2の観点により前記提示対象を選択する場合、前記クラスタ内の前記反応対象の量が所定の閾値以上の前記クラスタから前記提示対象を選択する
前記(5)又は(6)に記載の情報処理装置。
(9)
前記選択部は、前記第3の観点により前記提示対象を選択する場合、直前の所定の期間内に追加又は更新された前記対象の中から前記提示対象を選択する
前記(5)乃至(8)のいずれかに記載の情報処理装置。
(10)
前記選択部は、前記第4の観点により前記提示対象を選択する場合、前記人気度が所定の閾値以上の前記対象の中から前記提示対象を選択する
前記(5)乃至(9)のいずれかに記載の情報処理装置。
(11)
前記対象はテキスト情報を含み、
前記テキスト情報の言語解析の結果に基づいて、前記対象のクラスタリングを行うクラスタリング部を
さらに備える前記(1)乃至(10)のいずれかに記載の情報処理装置。
(12)
前記クラスタリング部は、前記対象を前記テキスト情報の主観性に基づく2以上の主観タイプに分類する
前記(11)に記載の情報処理装置。
(13)
前記提示制御部は、前記主観タイプ毎に個別に前記提示対象を提示するように制御する
前記(12)に記載の情報処理装置。
(14)
前記提示制御部は、前記ユーザにより指定された前記主観タイプの前記提示対象を提示するように制御する
前記(12)又は(13)に記載の情報処理装置。
(15)
前記選択部は、前記反応対象の前記主観タイプを基準とする分布に基づく第5の観点により、前記提示対象を選択する
前記(12)乃至(14)のいずれかに記載の情報処理装置。
(16)
前記対象に対する前記ユーザの嗜好を前記観点毎に学習する学習部を
さらに備え、
前記選択部は、前記観点毎に異なる学習結果を用いて前記提示対象を選択する
前記(1)乃至(15)のいずれかに記載の情報処理装置。
(17)
各前記観点に対する前記ユーザの嗜好を学習する学習部を
さらに備え、
前記選択部は、前記ユーザの嗜好度が高い前記観点を優先して前記ユーザへの前記提示情報の選択に用いる
前記(1)乃至(15)のいずれかに記載の情報処理装置。
(18)
前記反応対象は、前記ユーザがポジティブな反応を示した前記対象である
前記(1)乃至(17)のいずれかに記載の情報処理装置。
(19)
ユーザに対して所定の対象の提示を行う場合に、前記ユーザに提示した前記対象のうち前記ユーザが所定の反応を示した前記対象である反応対象の分布に基づく2以上の観点毎に、前記ユーザに提示する前記対象である提示対象を選択する選択ステップと、
前記提示対象の提示を制御する提示制御ステップと
を含む情報処理方法。
(20)
ユーザに対して所定の対象の提示を行う場合に、前記ユーザに提示した前記対象のうち前記ユーザが所定の反応を示した前記対象である反応対象の分布に基づく2以上の観点毎に、前記ユーザに提示する前記対象である提示対象を選択する選択ステップと、
前記提示対象の提示を制御する提示制御ステップと
を含む処理をコンピュータに実行させるためのプログラム。
1 情報処理ステム, 11 サーバ, 12 クライアント, 101 情報取得部, 102 クラスタリング部, 103 提示情報生成部, 111 情報収集モジュール, 112 情報編集モジュール, 113 言語解析モジュール, 114 トピック解析モジュール, 115 情報探索度計算モジュール, 116 情報検索・推薦モジュール, 117 情報統合モジュール, 122 情報収集部, 132 情報編集部, 141 言語解析部, 151 トピック解析部, 161 情報探索度計算部, 171 情報検索部, 172 情報推薦部, 173 学習部, 181 管理部, 182 情報提示制御部, 183 ユーザ操作情報取得部, 201 情報閲覧モジュール, 212 制御部, 301 画面, 311a乃至314c サムネイル, 331 画面, 342a乃至342e 探索度表示部, 343a乃至343d 推薦情報表示部, 361 画面

Claims (19)

  1. ーザに提示した対象のうち前記ユーザが所定の反応を示した対象である反応対象の分布を異なる観点によりそれぞれ分析した複数の分析値をそれぞれ良くすることが可能な対象であって、前記ユーザに提示する対象である提示対象を前記観点毎に選択する選択部と、
    前記観点毎に前記提示対象を前記分析値とともに提示するように制御する提示制御部と
    を備える情報処理装置。
  2. 前記提示制御部は、前記ユーザにより指定された前記観点により選択された前記提示対象を提示するように制御する
    請求項1に記載の情報処理装置。
  3. 前記観点は、前記反応対象が属するクラスタの範囲の広さに基づく第1の観点、前記反応対象の前記クラスタ毎の分布に基づく第2の観点、前記反応対象の新しさに基づく第3の観点、及び、前記反応対象の人気度に基づく第4の観点のうち少なくとも2以上を含む
    請求項1又は2に記載の情報処理装置。
  4. 前記選択部は、前記第1の観点により前記提示対象を選択する場合、前記クラスタ内の前記反応対象の量が所定の閾値未満の前記クラスタから前記提示対象を選択する
    請求項に記載の情報処理装置。
  5. 前記選択部は、前記第2の観点により前記提示対象を選択する場合、前記ユーザが直前に反応した前記反応対象が属する前記クラスタから前記提示対象を選択する
    請求項3又は4に記載の情報処理装置。
  6. 前記選択部は、前記第2の観点により前記提示対象を選択する場合、前記クラスタ内の前記反応対象の量が所定の閾値以上の前記クラスタから前記提示対象を選択する
    請求項3又は4に記載の情報処理装置。
  7. 前記選択部は、前記第3の観点により前記提示対象を選択する場合、直前の所定の期間内に追加又は更新された前記対象の中から前記提示対象を選択する
    請求項3乃至6のいずれかに記載の情報処理装置。
  8. 前記選択部は、前記第4の観点により前記提示対象を選択する場合、前記人気度が所定の閾値以上の前記対象の中から前記提示対象を選択する
    請求項3乃至7のいずれかに記載の情報処理装置。
  9. 前記対象はテキスト情報を含み、
    前記テキスト情報の言語解析の結果に基づいて、前記対象のクラスタリングを行うクラスタリング部を
    さらに備える請求項1乃至8のいずれかに記載の情報処理装置。
  10. 前記クラスタリング部は、前記対象を前記テキスト情報の主観性に基づく2以上の主観タイプに分類する
    請求項に記載の情報処理装置。
  11. 前記提示制御部は、前記主観タイプ毎に個別に前記提示対象を提示するように制御する
    請求項10に記載の情報処理装置。
  12. 前記提示制御部は、前記ユーザにより指定された前記主観タイプの前記提示対象を提示するように制御する
    請求項10又は11に記載の情報処理装置。
  13. 前記観点は、前記反応対象の前記主観タイプに基づく第5の観点を含む
    請求項10乃至12のいずれかに記載の情報処理装置。
  14. 前記選択部は、前記第5の観点により前記提示対象を選択する場合、前記反応対象の前記主観タイプの偏りを是正することが可能な前記対象を前記提示対象に選択する
    請求項13に記載の情報処理装置。
  15. 前記対象に対する前記ユーザの嗜好を前記観点毎に学習する学習部を
    さらに備え、
    前記選択部は、前記観点毎に異なる学習結果を用いて前記提示対象を選択する
    請求項1乃至14のいずれかに記載の情報処理装置。
  16. 各前記観点に対する前記ユーザの嗜好を学習する学習部を
    さらに備え、
    前記選択部は、前記ユーザの嗜好度が高い前記観点を優先して前記ユーザへの前記提示対象の選択に用いる
    請求項1乃至14のいずれかに記載の情報処理装置。
  17. 前記反応対象は、前記ユーザがポジティブな反応を示した前記対象である
    請求項1乃至16のいずれかに記載の情報処理装置。
  18. ーザに提示した対象のうち前記ユーザが所定の反応を示した対象である反応対象の分布を異なる観点によりそれぞれ分析した複数の分析値をそれぞれ良くすることが可能な対象であって、前記ユーザに提示する対象である提示対象を前記観点毎に選択する選択ステップと、
    前記観点毎に前記提示対象を前記分析値とともに提示するように制御する提示制御ステップと
    を含む情報処理方法。
  19. ーザに提示した対象のうち前記ユーザが所定の反応を示した対象である反応対象の分布を異なる観点によりそれぞれ分析した複数の分析値をそれぞれ良くすることが可能な対象であって、前記ユーザに提示する対象である提示対象を前記観点毎に選択する選択ステップと、
    前記観点毎に前記提示対象を前記分析値とともに提示するように制御する提示制御ステップと
    を含む処理をコンピュータに実行させるためのプログラム。
JP2014107710A 2014-05-26 2014-05-26 情報処理装置、情報処理方法、及び、プログラム Active JP6405704B2 (ja)

Priority Applications (4)

Application Number Priority Date Filing Date Title
JP2014107710A JP6405704B2 (ja) 2014-05-26 2014-05-26 情報処理装置、情報処理方法、及び、プログラム
US15/305,128 US10482142B2 (en) 2014-05-26 2015-05-19 Information processing device, information processing method, and program
PCT/JP2015/002515 WO2015182064A1 (en) 2014-05-26 2015-05-19 Information processing device, information processing method, and program
EP15726357.5A EP3149615A1 (en) 2014-05-26 2015-05-19 Information processing device, information processing method, and program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2014107710A JP6405704B2 (ja) 2014-05-26 2014-05-26 情報処理装置、情報処理方法、及び、プログラム

Publications (3)

Publication Number Publication Date
JP2015225352A JP2015225352A (ja) 2015-12-14
JP2015225352A5 JP2015225352A5 (ja) 2017-02-23
JP6405704B2 true JP6405704B2 (ja) 2018-10-17

Family

ID=53276222

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2014107710A Active JP6405704B2 (ja) 2014-05-26 2014-05-26 情報処理装置、情報処理方法、及び、プログラム

Country Status (4)

Country Link
US (1) US10482142B2 (ja)
EP (1) EP3149615A1 (ja)
JP (1) JP6405704B2 (ja)
WO (1) WO2015182064A1 (ja)

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2017100970A1 (en) 2015-12-14 2017-06-22 Microsoft Technology Licensing, Llc Facilitating discovery of information items using dynamic knowledge graph
US10496637B2 (en) * 2016-02-16 2019-12-03 Intuit Inc. Method and system for personalizing software based on real time tracking of voice-of-customer feedback
US9715495B1 (en) 2016-12-15 2017-07-25 Quid, Inc. Topic-influenced document relationship graphs
JP6895167B2 (ja) * 2017-06-30 2021-06-30 国立大学法人東京農工大学 効用値推定装置及びプログラム
JP7098579B2 (ja) * 2019-06-28 2022-07-11 富士フイルム株式会社 情報処理装置及び方法並びにプログラム
JP7112634B2 (ja) * 2020-06-04 2022-08-04 株式会社コンテンツデータマーケティング コンテンツ配信システム、配信装置、配信方法、及びプログラム
JP7402444B2 (ja) * 2021-03-30 2023-12-21 ワンセブンライブ(ユーエスエー)コーポレーション メッセージ配布システム及びメッセージ配布方法
US11704371B1 (en) * 2022-02-07 2023-07-18 Microsoft Technology Licensing, Llc User centric topics for topic suggestions

Family Cites Families (22)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002358455A (ja) * 2001-05-31 2002-12-13 Matsushita Electric Ind Co Ltd 広告情報配信装置及び課金装置
JP2008117222A (ja) * 2006-11-06 2008-05-22 Sony Corp 情報処理装置および方法、並びにプログラム
US7801885B1 (en) * 2007-01-25 2010-09-21 Neal Akash Verma Search engine system and method with user feedback on search results
US8275764B2 (en) * 2007-08-24 2012-09-25 Google Inc. Recommending media programs based on media program popularity
JP4433326B2 (ja) * 2007-12-04 2010-03-17 ソニー株式会社 情報処理装置および方法、並びにプログラム
JP2008234672A (ja) * 2008-04-07 2008-10-02 Sony Corp コンテンツ提供装置およびコンテンツ提供システム
JP4770868B2 (ja) * 2008-04-21 2011-09-14 ソニー株式会社 情報提供装置及び情報提供方法、並びにコンピュータ・プログラム
US9646025B2 (en) * 2008-05-27 2017-05-09 Qualcomm Incorporated Method and apparatus for aggregating and presenting data associated with geographic locations
US8090680B2 (en) * 2008-06-18 2012-01-03 Dublin City University Method and system for locating data
JP2010002944A (ja) * 2008-06-18 2010-01-07 Hitachi Ltd コンテンツ推薦装置とその方法
US9171078B2 (en) * 2009-04-29 2015-10-27 Microsoft Technology Licensing, Llc Automatic recommendation of vertical search engines
JP2010272004A (ja) 2009-05-22 2010-12-02 Sony Corp 判別装置及び判別方法、並びにコンピューター・プログラム
JP2011060182A (ja) * 2009-09-14 2011-03-24 Aim Co Ltd コンテンツ選択システム
US9405848B2 (en) * 2010-09-15 2016-08-02 Vcvc Iii Llc Recommending mobile device activities
JP5360918B2 (ja) * 2011-03-02 2013-12-04 Jetrunテクノロジ株式会社 電子書籍用目次生成システム
WO2012173670A1 (en) * 2011-06-13 2012-12-20 United Video Properties, Inc. Systems and methods for providing media recommendations
US8495484B2 (en) * 2011-08-02 2013-07-23 International Business Machines Corporation Intelligent link population and recommendation
US20140279196A1 (en) * 2013-03-15 2014-09-18 Nara Logics, Inc. System and methods for providing spatially segmented recommendations
US8732101B1 (en) * 2013-03-15 2014-05-20 Nara Logics, Inc. Apparatus and method for providing harmonized recommendations based on an integrated user profile
JP2013092911A (ja) * 2011-10-26 2013-05-16 Sony Corp 情報処理装置、情報処理方法、および、プログラム
WO2013121470A1 (ja) * 2012-02-15 2013-08-22 パナソニック株式会社 コンテンツ提示装置、端末、システム、プログラム、および、方法
JP5999425B2 (ja) * 2012-09-26 2016-09-28 ソニー株式会社 情報処理装置及び情報処理方法

Also Published As

Publication number Publication date
US20170046440A1 (en) 2017-02-16
US10482142B2 (en) 2019-11-19
JP2015225352A (ja) 2015-12-14
WO2015182064A1 (en) 2015-12-03
EP3149615A1 (en) 2017-04-05

Similar Documents

Publication Publication Date Title
JP6405704B2 (ja) 情報処理装置、情報処理方法、及び、プログラム
TWI636416B (zh) 內容個人化之多相排序方法和系統
KR101506380B1 (ko) 무한 브라우즈
US8234311B2 (en) Information processing device, importance calculation method, and program
Shmueli et al. Care to comment? Recommendations for commenting on news stories
US7860878B2 (en) Prioritizing media assets for publication
TWI533246B (zh) 使用者未知興趣之探索方法與系統
US10180979B2 (en) System and method for generating suggestions by a search engine in response to search queries
JP5581408B2 (ja) 情報処理システム、情報処理装置、情報処理方法及びプログラム
WO2018040069A1 (zh) 信息推荐系统及方法
WO2016117382A1 (ja) 情報処理装置、情報処理方法、及び、プログラム
JP2013517563A (ja) ユーザ通信の解析システムおよび方法
JP2009157907A (ja) 情報処理装置および方法、並びに、プログラム
JP6593873B2 (ja) 情報分析装置及び情報分析方法
US9058328B2 (en) Search device, search method, search program, and computer-readable memory medium for recording search program
JP2014164576A (ja) 予測対象コンテンツにおける将来的なコメント数を予測する予測サーバ、プログラム及び方法
JP6060833B2 (ja) 情報処理装置、情報処理方法、及び情報処理プログラム
WO2008032037A1 (en) Method and system for filtering and searching data using word frequencies
Milajevs et al. Real time discussion retrieval from twitter
JP6446851B2 (ja) レコメンドシステム、レコメンド方法及びプログラム
CN113420209A (zh) 基于天气搜索的推荐方法、装置、设备及存储介质
Gudla et al. Relevancy ranking of user recommendations of services based on browsing patterns
JP2016139216A (ja) 話題語ランキング装置、話題語ランキング方法、およびプログラム
JP7462198B1 (ja) キーワード収集方法、情報処理装置およびプログラム
Tokarchuk et al. Piecing together the puzzle: Improving event content coverage for real-time sub-event detection using adaptive microblog crawling

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20170118

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20170118

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20180320

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20180416

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20180821

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20180903

R151 Written notification of patent or utility model registration

Ref document number: 6405704

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151