JP2011248831A - 情報処理装置および方法、並びに、プログラム - Google Patents

情報処理装置および方法、並びに、プログラム Download PDF

Info

Publication number
JP2011248831A
JP2011248831A JP2010124183A JP2010124183A JP2011248831A JP 2011248831 A JP2011248831 A JP 2011248831A JP 2010124183 A JP2010124183 A JP 2010124183A JP 2010124183 A JP2010124183 A JP 2010124183A JP 2011248831 A JP2011248831 A JP 2011248831A
Authority
JP
Japan
Prior art keywords
evaluation
user
information
content
evaluation information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2010124183A
Other languages
English (en)
Other versions
JP5454357B2 (ja
Inventor
Hiroshi Tateno
啓 舘野
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Corp
Original Assignee
Sony Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Corp filed Critical Sony Corp
Priority to JP2010124183A priority Critical patent/JP5454357B2/ja
Priority to US13/112,206 priority patent/US8682830B2/en
Priority to CN201110139803.1A priority patent/CN102262647B/zh
Publication of JP2011248831A publication Critical patent/JP2011248831A/ja
Priority to US14/147,008 priority patent/US9208441B2/en
Application granted granted Critical
Publication of JP5454357B2 publication Critical patent/JP5454357B2/ja
Priority to US14/940,834 priority patent/US9785888B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/237Lexical tools
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/02Knowledge representation; Symbolic representation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/04Inference or reasoning models
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0241Advertisements
    • G06Q30/0251Targeted advertisements
    • G06Q30/0269Targeted advertisements based on user profile or attribute
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/45Management operations performed by the client for facilitating the reception of or the interaction with the content or administrating data related to the end-user or to the client device itself, e.g. learning user preferences for recommending movies, resolving scheduling conflicts
    • H04N21/466Learning process for intelligent management, e.g. learning user preferences for recommending movies
    • H04N21/4661Deriving a combined profile for a plurality of end-users of the same client, e.g. for family members within a home

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Software Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Business, Economics & Management (AREA)
  • Mathematical Physics (AREA)
  • Computational Linguistics (AREA)
  • Computing Systems (AREA)
  • Evolutionary Computation (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Development Economics (AREA)
  • Accounting & Taxation (AREA)
  • Strategic Management (AREA)
  • Finance (AREA)
  • Game Theory and Decision Science (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Economics (AREA)
  • Multimedia (AREA)
  • General Business, Economics & Management (AREA)
  • Signal Processing (AREA)
  • Marketing (AREA)
  • Health & Medical Sciences (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • General Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Medical Informatics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

【課題】コンテンツに対する評価を予測する場合の予測精度を向上させる。
【解決手段】評価情報抽出部114は、ユーザにより言語で表現された情報である言語表現から評価対象および評価対象への評価を含む評価情報を抽出する。タイプ識別部115は、評価情報がコンテンツに関する第1のタイプの評価情報であるか、または、他のユーザに関する第2のタイプの評価情報であるかを識別する。評価予測部121は、注目ユーザによる第1のタイプの評価情報、および、注目ユーザによる第2のタイプの評価情報における他のユーザによる評価情報に基づいて、注目ユーザのコンテンツに対する評価を予測する。本発明は、例えば、ユーザにコンテンツを推薦するシステムに適用できる。
【選択図】図1

Description

本発明は、情報処理装置および方法、並びに、プログラムに関し、特に、ユーザのコンテンツに対する評価を予測する場合に用いて好適な情報処理装置および方法、並びに、プログラムに関する。
近年、ブログ(Weblog)、SNS(ソーシャル・ネットワーキング・サービス)、twitter(登録商標)などのインターネットを介したサービスを利用して、一般のユーザが様々な事象や事物に対して個人の意見を述べる機会が増えている。
従来、このようなユーザにより言語で表現された情報(以下、言語表現と称する)から、ある事象や事物に対する評価を表す表現(以下、評価表現と称する)を抽出する技術が提案されている(例えば、非特許文献1参照)。
また、従来、評価表現がポジティブなものかネガティブなものかを判別する技術が提案されている(例えば、非特許文献2参照)。
N. Kobayashi他, "Opinion Mining from Web Documents: Extraction and Structurization", 人工知能学会論文誌, Vol. 22, No. 2, pp.227-238, 2007 T. Nasukawa他, T., "Sentiment Analysis: Capturing Favorability Using Natural Language Processing", Proceedings of International Conference on Knowledge Capture, 2003
例えば、非特許文献1および非特許文献2に記載されている技術を用いて、ユーザの嗜好を推定し、様々なコンテンツに対する評価を予測することが考えられる。しかしながら、必ずしも個々のユーザが直接表した評価表現を十分な量だけ得られるとは限らず、その結果、コンテンツに対する評価の予測精度が低下する恐れがある。
本発明は、このような状況を鑑みてなされたものであり、言語表現に基づいてユーザのコンテンツに対する評価を予測する場合の予測精度を向上させるようにするものである。
本発明の一側面の情報処理装置は、ユーザにより言語で表現された情報である言語表現から評価対象および前記評価対象への評価を含む評価情報を抽出する評価情報抽出手段と、前記評価情報がコンテンツに関する第1のタイプの評価情報であるか、または、他のユーザに関する第2のタイプの評価情報であるかを識別する識別手段と、注目ユーザによる前記第1のタイプの評価情報、および、前記注目ユーザによる前記第2のタイプの評価情報における前記他のユーザによる前記評価情報に基づいて、前記注目ユーザのコンテンツに対する評価を予測する評価予測手段とを含む。
前記第2のタイプの評価情報は、前記他のユーザの前記言語表現を前記評価対象とする前記評価情報を含み、前記評価予測手段には、前記注目ユーザによる前記第1のタイプの評価情報、および、前記注目ユーザによる前記第2のタイプの評価情報において前記評価対象とされた前記他のユーザの前記言語表現に含まれる前記評価情報に基づいて、前記注目ユーザのコンテンツに対する評価を予測させることができる。
前記第2のタイプの評価情報は、前記他のユーザ自身を前記評価対象とする前記評価情報を含み、前記評価予測手段には、前記注目ユーザによる前記第1のタイプの評価情報、および、前記注目ユーザによる前記第2のタイプの評価情報において前記評価対象とされた前記他のユーザによる前記評価情報に基づいて、前記注目ユーザのコンテンツに対する評価を予測させることができる。
前記評価予測手段には、前記注目ユーザによる前記第1のタイプの評価情報、および、前記注目ユーザによる前記第2のタイプの評価情報における前記他のユーザによる前記評価情報に基づいて、前記注目ユーザのコンテンツに対する評価予測に用いるパラメータを推定する推定手段と、前記注目ユーザの前記パラメータに基づいて、前記注目ユーザのコンテンツに対する評価を予測する予測手段とを設けることができる。
前記推定手段には、さらに、前記注目ユーザの前記パラメータと、前記注目ユーザによりポジティブな評価が与えられた前記他のユーザの前記パラメータとを重み付け加算することにより得られる値を、前記注目ユーザの前記パラメータに設定させることができる。
前記推定手段には、さらに、前記注目ユーザと、前記注目ユーザによりポジティブな評価が与えられた前記他のユーザとの間で前記パラメータの事前分布を共有して、前記注目ユーザの前記パラメータを推定させることができる。
前記予測手段nは、さらに、前記前記注目ユーザによりポジティブな評価が与えられた他のユーザの前記パラメータを用いて、前記注目ユーザのコンテンツに対する評価を予測させることができる。
本発明の一側面の情報処理方法は、ユーザのコンテンツに対する評価を予測する情報処理装置が、ユーザにより言語で表現された情報である言語表現から評価対象および前記評価対象への評価を含む評価情報を抽出し、前記評価情報がコンテンツに関する第1のタイプの評価情報であるか、または、他のユーザに関する第2のタイプの評価情報であるかを識別し、注目ユーザによる前記第1のタイプの評価情報、および、前記注目ユーザによる前記第2のタイプの評価情報における前記他のユーザによる前記評価情報に基づいて、前記注目ユーザのコンテンツに対する評価を予測するステップを含む。
本発明のプログラムは、ユーザにより言語で表現された情報である言語表現から評価対象および前記評価対象への評価を含む評価情報を抽出し、前記評価情報がコンテンツに関する第1のタイプの評価情報であるか、または、他のユーザに関する第2のタイプの評価情報であるかを識別し、注目ユーザによる前記第1のタイプの評価情報、および、前記注目ユーザによる前記第2のタイプの評価情報における前記他のユーザによる前記評価情報に基づいて、前記注目ユーザのコンテンツに対する評価を予測するステップを含む処理をコンピュータに実行させる。
本発明の一側面においては、ユーザにより言語で表現された情報である言語表現から評価対象および前記評価対象への評価を含む評価情報が抽出され、前記評価情報がコンテンツに関する第1のタイプの評価情報であるか、または、他のユーザに関する第2のタイプの評価情報であるかが識別され、注目ユーザによる前記第1のタイプの評価情報、および、前記注目ユーザによる前記第2のタイプの評価情報における前記他のユーザによる前記評価情報に基づいて、前記注目ユーザのコンテンツに対する評価が予測される。
本発明の一側面によれば、言語表現に基づいてユーザのコンテンツに対する評価を予測することができる。また、本発明の一側面によれば、その予測精度を向上させることができる。
本発明を適用した情報処理システムの一実施の形態の構成例を示すブロック図である。 情報処理システムにより実行されるコンテンツ推薦処理を説明するためのフローチャートである。 他者評価情報解析処理の詳細を説明するためのフローチャートである。 ブログ情報の例を示す図である。 言語表現情報の例を示す図である。 評価情報の例を示す図である。 コンテンツ評価情報の例を示す図である。 ユーザ参照情報の例を示す図である。 予測学習に用いるパラメータの推定結果の第1の例を示す図である。 予測学習に用いるパラメータの推定結果の第2の例を示す図である。 コンテンツの特徴量の例を示す図である。 コンピュータの構成例を示すブロック図である。
以下、本発明を実施するための形態(以下、実施の形態という)について説明する。なお、説明は以下の順序で行う。
1.実施の形態
2.変形例
<1.実施の形態>
[情報処理システムの構成例]
図1は、本発明を適用した情報処理システムの一実施の形態を示すブロック図である。情報処理システム101は、例えば、コンピュータ、サーバ、記憶装置、通信装置などにより構成される。そして、情報処理システム101は、インターネットなどのネットワーク(不図示)を介して、各ユーザのコンテンツ等に対する評価情報を収集し、収集した評価情報に基づいて、各ユーザのコンテンツに対する評価予測の学習を行う。また、情報処理システム101は、学習結果に基づいて、各ユーザのコンテンツに対する評価を予測し、ネットワークを介して、ユーザにコンテンツを推薦する処理を行う。
ここで、コンテンツとは、例えば、画像データ、動画データ、楽曲データ、各種の商品、文書データなどを指し、特定の種類に限定されるものではない。
情報処理システム101は、ブログ情報保持部111、言語表現収集部112、言語表現保持部113、評価情報抽出部114、タイプ識別部115、評価情報保持部116、評価情報解析部117、コンテンツ評価情報取得部118、コンテンツ評価情報保持部119、ユーザ参照情報保持部120、評価予測部121、コンテンツ情報保持部122、および、コンテンツ提示部123を含むように構成される。また、評価予測部121は、パラメータ推定部131、ユーザパラメータ保持部132、および、予測部133を含むように構成される。
また、ブログ情報保持部111、言語表現保持部113、評価情報保持部116、コンテンツ評価情報保持部119、ユーザ参照情報保持部120、コンテンツ情報保持部122、および、ユーザパラメータ保持部132は、例えば、ハードディスクドライブ、フラッシュメモリなどの各種の記憶装置により構成される。なお、ブログ情報保持部111、言語表現保持部113、評価情報保持部116、コンテンツ評価情報保持部119、ユーザ参照情報保持部120、コンテンツ情報保持部122、および、ユーザパラメータ保持部132を、それぞれ異なる記憶装置により構成するようにしてもよいし、一部または全部を同じ記憶装置により構成するようにしてもよい。
言語表現収集部112は、図4を参照して後述するブログ情報をブログ情報保持部111から取得する。言語表現収集部112は、ネットワーク(不図示)を介して、ブログ情報に登録されている各ユーザのブログにアクセスして、各ユーザによる言語表現を収集する。言語表現収集部112は、収集した言語表現を含む言語表現情報を言語表現保持部113に保存する。
ここで、言語表現とは、テキストデータや音声データなど、文字や音声を用いて言語により表現された情報のことである。
評価情報抽出部114は、言語表現保持部113に保存されている言語表現から、各種の事物や事象などの評価対象への評価を含む評価情報を抽出する。評価情報抽出部114は、抽出した評価情報をタイプ識別部115に供給する。
タイプ識別部115は、評価情報において評価されている評価対象のタイプ(以下、対象タイプと称する)を識別する。タイプ識別部115は、識別した対象タイプを加えた評価情報を評価情報保持部116に保存する。
評価情報解析部117は、評価情報保持部116に保存されている評価情報を解析する。そして、評価情報解析部117は、解析結果に基づいて、各ユーザの各コンテンツに対する評価を表すコンテンツ評価情報を生成し、コンテンツ評価情報保持部119に保存する。また、評価情報解析部117は、解析結果に基づいて、各ユーザの他のユーザに対する評価を表すユーザ参照情報を生成し、ユーザ参照情報保持部120に保存する。
コンテンツ評価情報取得部118は、外部から入力されるコンテンツ評価情報を取得し、コンテンツ評価情報保持部119に保存する。
評価予測部121は、各ユーザのコンテンツに対する評価予測のための学習を行い、学習結果に基づいて、各ユーザのコンテンツに対する評価を予測する。
より具体的には、評価予測部121のパラメータ推定部131は、コンテンツ評価情報保持部119からコンテンツ評価情報を取得し、ユーザ参照情報保持部120からユーザ参照情報を取得する。そして、パラメータ推定部131は、コンテンツ評価情報およびユーザ参照情報に基づいて、所定の学習手法を用いて、各ユーザのコンテンツに対する評価予測のための学習を行う。また、パラメータ推定部131は、学習結果を表すユーザ毎のパラメータをユーザパラメータ保持部132に保存する。
予測部133は、ユーザパラメータ保持部132から各ユーザのパラメータを取得し、コンテンツ情報保持部122から各コンテンツの特徴量を取得する。そして、予測部133は、各ユーザのパラメータおよび各コンテンツの特徴量に基づいて、各ユーザの各コンテンツに対する評価を予測し、予測した結果をコンテンツ提示部123に供給する。
コンテンツ情報保持部122は、コンテンツの特徴量を含む各種のコンテンツに関する情報を保存する。なお、コンテンツに関する情報とともにコンテンツ自身もコンテンツ情報保持部122に保存するようにしてもよい。
コンテンツ提示部123は、各ユーザの各コンテンツに対する評価予測の結果に基づいて、各ユーザに推薦するコンテンツに関する情報をコンテンツ情報保持部122から取得し、提示する。
[コンテンツ推薦処理]
次に、図2および図3のフローチャートを参照して、情報処理システム101により実行されるコンテンツ推薦処理について説明する。なお、適宜、図4乃至図11を具体例として参照しながら説明する。
ステップS1において、言語表現収集部112は、言語表現を収集する。具体的には、まず、言語表現収集部112は、ブログ情報保持部111からブログ情報を取得する。
図4は、ブログ情報の例を示している。ブログ情報は、言語表現を収集する対象となるブログが登録されており、例えば、収集対象となるブログを開設しているユーザ、および、各ユーザのブログのトップページのURL(Uniform Resource Locator)を含む。例えば、図4の1番目のレコードには、ユーザ1が開設し、かつ、トップページのURLがhttp://blog.example.com/user1/entry-1.htmlであるブログが登録されている。
次に、言語表現収集部112は、ネットワーク(不図示)を介して、ブログ情報に登録されている各ユーザのブログにアクセスする。次に、言語表現収集部112は、各ブログサービスのフォーマットに基づいて、各ブログに掲載されている記事を収集および整形し、後の処理に必要な言語表現のみを抽出する。そして、言語表現収集部112は、抽出した言語表現を含む言語表現情報を言語表現保持部113に保存する。
図5は、言語表現情報の例を示している。言語表現情報は、例えば、各言語表現を個々に識別するための言語表現ID、言語表現を発信したユーザ、および、言語表現を含む。なお、この例では、言語表現を抽出したサイト(ブログのページ)のURLが、言語表現IDとして用いられている。
例えば、図5の1番目のレコードには、ユーザ1が発信した言語表現「アーティストAの楽曲Aは素晴らしいね。」が登録されている。また、言語表現の抽出元となるユーザ1のブログのページのURL「http://blog.example.com/ user1/entry-1.html」が、言語表現IDとして登録されている。
なお、言語表現に他のサイトへのリンク情報が含まれる場合、後の処理を考慮して、そのリンク情報をそのまま残しておくことが望ましい。例えば、図5の2番目のレコードの言語表現には、アンカータグで囲まれたリンク情報「<a href="http://blog.example.com/user3/entry-1.html">〜</a>」が、そのまま残されている。
図2に戻り、ステップS2において、評価情報抽出部114は、言語表現保持部113に保存されている言語表現情報から、評価情報を抽出する。
図6は、図5の言語表現情報から抽出された評価情報の例を示している。評価情報は、例えば、評価者、評価表現、評価極性、対象タイプ、および、評価対象を含む。
評価情報抽出部114は、言語表現保持部113に保存されている言語表現情報に含まれる各言語表現を解析して、各言語表現から評価表現、および、その評価表現の評価対象を抽出する。また、評価情報抽出部114は、抽出した評価表現の極性(以下、評価極性と称する)が、ポジティブまたはネガティブのいずれであるかを判別する。なお、評価表現および評価対象の抽出、並びに、評価極性の判別を行う手法として、例えば、上述した非特許文献2に記載されている手法を採用することが可能である。
そして、評価情報抽出部114は、評価者、評価表現、評価極性、および、評価対象を含む評価情報をタイプ識別部115に供給する。なお、評価情報の抽出元となる言語表現を発信したユーザが、評価情報の評価者に設定される。
ステップS3において、タイプ識別部115は、評価対象のタイプ(すなわち、対象タイプ)を識別する。具体的には、評価情報抽出部114は、対象タイプが、最終的にユーザに推薦する単位となるコンテンツ、他のユーザによる言語表現、または、人物(他のユーザ)のいずれであるかを識別する。
例えば、タイプ識別部115は、アーティスト名や曲名等が登録されている辞書を用いたり、ユーザの名前またはニックネーム等が登録されているユーザ登録情報を用いたり、引用符(例えば、"など)で囲まれているか否かのルールを用いたり、固有表現の抽出技術等を用いたりして、対象タイプを識別する。なお、固有表現の抽出技術の詳細は、例えば、特許4200645号公報(以下、特許文献1と称する)、「Erik F. Tjong他, "Introduction to the CoNLL-2003 Shared Task: Language-Independent Named Entity Recognition", CoNLL, 2003」(以下、非特許文献3と称する)などに記載されている。
また、例えば、タイプ識別部115は、評価対象がリンク付きのアンカータグ(<a href=・・・>〜</A>など)で囲まれている場合、ドメイン名の辞書を用いて、リンク先のURLのドメイン名により対象タイプがコンテンツまたは言語表現のいずれであるかを識別する。例えば、ドメイン名が動画投稿サイトのものである場合、対象タイプをコンテンツ(動画)に分類することができる。なお、この方法は、評価対象が、あるサイトのページのURLである場合にも適用することができる。
さらに、例えば、タイプ識別部115は、所定の手法の学習処理を行って、アンカーテキストの内容に基づいて、対象タイプを識別する。
また、例えば、タイプ識別部115は、評価対象が画像データである場合、所定の手法の学習処理を行って、画像データに埋め込まれている埋め込みテキストの内容に基づいて、対象タイプを識別する。
このようにして、各評価情報が、コンテンツに関するもの(対象タイプがコンテンツ)であるか、または、他のユーザに関するもの(対象タイプが言語表現または人物)であるかが識別される。さらに、他のユーザに関する評価情報が、他のユーザによる言語表現に関するもの(対象が言語表現)であるか、または、他のユーザ自身に関するもの(対象タイプが人物)であるかが識別される。
なお、以上は、対象タイプの識別方法の一例であり、対象タイプの識別方法は、特に以上の例に限定されるものではなく、任意の方法を採用することが可能である。
そして、タイプ識別部115は、対象タイプを加えた評価情報を評価情報保持部116に保存する。なお、タイプ識別部115は、対象タイプがコンテンツ、言語表現、および、人物のいずれにも該当しない場合、その評価情報を破棄し、評価情報保持部116に保存しない。
以上のステップS2およびステップS3の処理により、例えば、図5の1番目のレコードの言語表現「アーティストAの楽曲Aは素晴らしいね。」から、「素晴らしい」が評価表現として抽出され、「楽曲A」が評価対象として抽出される。また、評価表現「素晴らしい」の評価極性がポジティブであると判別され、評価対象「楽曲A」の対象タイプがコンテンツに分類される。そして、図6の1番目のレコードである、評価者「ユーザ1」、評価表現「素晴らしい」、評価極性「ポジティブ」、対象タイプ「コンテンツ」、および、評価対象「楽曲A」を含む評価情報が生成される。
また、例えば、図5の2番目のレコードの言語表現「<a href="http://blog.example.com/user3/entry-1.html">こんな考え方</a>はちょっと酷いな。」から、「酷い」が評価表現として抽出される。また、このレコードの言語表現の文章中では、評価対象は「こんな考え方」になるが、この文字列がリンク付きのアンカータグで囲まれているので、「http://blog.example.com/user3/entry-1.html」が実際に評価対象として抽出される。また、評価表現「酷い」の評価極性がネガティブであると判別され、評価対象「http://blog.example.com/user3/entry-1.html」の対象タイプが言語表現に分類される。そして、図6の2番目のレコードである、評価者「ユーザ1」、評価表現「酷い」、評価極性「ネガティブ」、対象タイプ「言語表現」、および、評価対象「http://blog.example.com/user3/entry-1.html」を含む評価情報が生成される。
さらに、例えば、図5の3番目のレコードの言語表現「ユーザ2さんは本当にセンスが良い。」から、「良い」が評価表現として抽出され、「ユーザ2さん」が評価対象として抽出される。また、評価表現「良い」の評価極性がポジティブであると判別され、評価対象「ユーザ2さん」の対象タイプが人物に分類される。そして、図6の3番目のレコードである、評価者「ユーザ1」、評価表現「良い」、評価極性「ポジティブ」、対象タイプ「人物」、および、評価対象「ユーザ2さん」を含む評価情報が生成される。
同様にして、図5の4番目のレコードおよび5番目のレコードの言語表現情報から、図6の4番目のレコードおよび5番目のレコードの評価情報が生成される。
図2に戻り、ステップS4において、評価情報解析部117は、コンテンツ評価情報を生成する。具体的には、評価情報解析部117は、評価情報保持部116に保存されている評価情報の中から、対象タイプがコンテンツである評価情報を抽出する。そして、評価情報解析部117は、抽出した評価情報に基づいて、コンテンツ評価情報を生成する。
図7は、コンテンツ評価情報の例を示している。コンテンツ評価情報は、例えば、評価者、評価対象となるコンテンツ、および、評価極性を含む。例えば、図6の1番目のレコードの評価情報に基づいて、図7の1番目のレコードである、評価者「ユーザ1」、コンテンツ「楽曲A」、および、評価極性「ポジティブ」を含むコンテンツ評価情報が生成される。すなわち、ユーザ1が楽曲Aをポジティブに評価していることを示すコンテンツ評価情報が生成される。同様に、図6の4番目および5番目のレコードの評価情報に基づいて、図7の4番目および5番目のレコードのコンテンツ評価情報が生成される。そして、評価情報解析部117は、生成したコンテンツ評価情報をコンテンツ評価情報保持部119に保存する。
ステップS5において、評価情報解析部117は、他者評価情報解析処理を実行する。ここで、図3のフローチャートを参照して、他者評価情報解析処理の詳細について説明する。
ステップS51において、評価情報解析部117は、評価情報保持部116に保存されている評価情報の中から、解析する評価情報を選択する。例えば、評価情報解析部117は、図6の1番目のレコードから順番に解析する評価情報を選択していく。
ステップS52において、評価情報解析部117は、解析する評価情報の対象タイプに基づいて、言語表現への評価であるか否かを判定する。言語表現への評価であると判定された場合、処理はステップS53に進む。
ステップS53において、評価情報解析部117は、言語表現内で評価されているコンテンツを抽出する。ここで、対象タイプが言語表現である図6の2番目のレコードの評価情報を解析している場合について考える。
例えば、評価情報解析部117は、上述した図2のステップS1と同様の処理により、当該評価情報の評価対象である「http://blog.example.com/user3/entry-1.html」に掲載されている記事から、言語表現「楽曲Bなんて子供だましだね。」を抽出する。次に、評価情報解析部117は、上述した図2のステップS2と同様の処理により、言語表現内で評価されているコンテンツ「楽曲B」を抽出する。
なお、いまの場合、先に実行されたステップS1およびステップS2の処理において、当該言語表現内からコンテンツ「楽曲B」がすでに抽出されているので、この処理は省略することが可能である。
また、言語表現内で評価されている評価対象が、別の言語表現である場合、評価情報解析部117は、さらに、その別の言語表現内で評価されているコンテンツを抽出する処理を実行する。
ステップS54において、評価情報解析部117は、抽出したコンテンツに対するコンテンツ評価情報を生成する。
例えば、いまの場合、ユーザ1がユーザ3の言語表現に対してネガティブな評価をしており、ユーザ3は、その言語表現の中で楽曲Bに対してネガティブな評価をしている。従って、ユーザ1が、間接的に楽曲Bに対してポジティブな評価をしているとみなすことができる。
そこで、評価情報解析部117は、図7の2番目のレコードである、評価者「ユーザ1」、コンテンツ「楽曲B」、評価極性「ポジティブ」を含むコンテンツ評価情報を生成する。そして、評価情報解析部117は、生成したコンテンツ評価情報をコンテンツ評価情報保持部119に保存する。その後、処理はステップS58に進む。
このようにして、ユーザ1によるユーザ3の言語表現に対する評価に基づいて、ユーザ3の言語表現内で評価されている楽曲Bに対するユーザ1の評価が推定され、推定した結果を示すコンテンツ評価情報が生成され、保存される。
一方、ステップS52において、言語表現への評価ではないと判定された場合、処理はステップS55に進む。
ステップS55において、評価情報解析部117は、解析する評価情報の対象タイプに基づいて、人物への評価であるか否か判定する。人物への評価であると判定された場合、処理はステップS56に進む。
ステップS56において、評価情報解析部117は、ユーザ参照情報を保存する。ここで、対象タイプが人物である図6の3番目のレコードの評価情報を解析している場合について考える。
図8は、ユーザ参照情報の例を示している。ユーザ参照情報は、例えば、参照元ユーザ、参照先ユーザ、および、評価極性を含む。例えば、図6の3番目のレコードの評価情報では、ユーザ1が、ユーザ2に対してポジティブな評価をしている。従って、評価情報解析部117は、図8の1番目のレコードである、参照元ユーザ「ユーザ1」、参照先ユーザ「ユーザ2」、評価極性「ポジティブ」を含むユーザ参照情報を生成する。すなわち、このユーザ参照情報は、評価対象である参照先ユーザ「ユーザ2」に対する評価者である参照元ユーザ「ユーザ1」の評価極性が「ポジティブ」であることを示している。そして、評価情報解析部117は、生成したユーザ参照情報をユーザ参照情報保持部120に保存する。
ステップS57において、評価情報解析部117は、参照先ユーザのコンテンツ評価情報を利用して、参照元ユーザのコンテンツ評価情報を生成する。例えば、いまの場合、参照元ユーザであるユーザ1が、参照先ユーザであるユーザ2をポジティブに評価している。従って、ユーザ2のコンテンツ評価情報をそのまま利用して、ユーザ1のコンテンツ評価情報を生成することが可能である。すなわち、評価情報解析部117は、ユーザ2が評価者である図7の4番目のコンテンツ評価情報をコピーし、さらに評価者をユーザ1に変更することにより、ユーザ1のコンテンツ評価情報を生成する。これにより、図7の3番目のレコードである、評価者「ユーザ1」、コンテンツ「アルバム1」、評価極性「ポジティブ」を含むコンテンツ評価情報が生成される。
なお、このとき、ユーザ2に対するユーザ1の評価がネガティブである場合、評価極性を反転するようにすればよい。
そして、評価情報解析部117は、生成したコンテンツ評価情報をコンテンツ評価情報保持部119に保存する。その後、処理はステップS58に進む。
一方、ステップS55において、人物への評価ではないと判定された場合、すなわち、コンテンツへの評価である場合、ステップS56およびステップS57の処理はスキップされ、処理はステップS58に進む。すなわち、対象タイプがコンテンツである評価情報については、上述した図2のステップS4の処理でコンテンツ評価情報がすでに生成されているので、新たにコンテンツ評価情報は生成されない。
ステップS58において、評価情報解析部117は、全ての評価情報を解析したか否かを判定する。まだ全ての評価情報が解析されていないと判定された場合、処理はステップS51に戻り、ステップS58において、全ての評価情報が解析されたと判定されるまで、ステップS51乃至S58の処理が繰返し実行される。
一方、ステップS58において、全ての評価情報が解析されたと判定された場合、他者評価情報解析処理は終了する。
このようにして、あるユーザのコンテンツ評価情報が、当該ユーザが評価を行った他のユーザの評価情報に基づいて生成され、保存される。
図2に戻り、ステップS6において、パラメータ推定部131は、各ユーザのコンテンツに対する評価予測に用いるパラメータを推定する。
一般的に、コンテンツ推薦における評価予測の方法は、協調フィルタリング(Collaborative Filtering,CF)と内容ベースフィルタリング(Content Based Filtering,CBF)に分けられる。前者は、例えば、米国特許出願公開2010/0030764号明細書(以下、特許文献2と称する)、あるいは、「Yehuda Koren, "Factorization Meets the Neighborhood: a Multifaceted Collaborative Filtering Model", Proceedings of International Conference on Knowledge Discovery and Data Mining, 2008」(以下、非特許文献4と称する)などに記載されているような、行列分解に基づく手法がよく知られている。一方、後者は、SVM(Support Vector Machine)などのパターン認識的手法がよく用いられる。
いずれの手法も、与えられたデータ(ここでは、ユーザのコンテンツに対する評価情報とコンテンツ自体の情報)に基づいて、ユーザごとあるいはコンテンツごとのパラメータを推定する課題に落とし込まれる。
なお、以下、学習の手法として、ロジスティック回帰を用いたCBFを用いた場合について説明する。なお、ロジスティック回帰を用いたCBFについては、例えば、「C. M. ビショップ著, 元田 浩他訳, ”パターン認識と機械学習−ベイズ理論による統計的予測”, シュプリンガー・ジャパン株式会社, 2007年12月」(以下、非特許文献5と称する)等に詳細な説明が記載されている。
ロジスティック回帰では、コンテンツの各特徴量(例えば、ジャンルやキーワード、音楽であればテンポやキーなど信号的特徴など)に対する重みと定数項を含む、実数値ベクトルにより表されるパラメータが学習される。
まず、パラメータ推定部131は、コンテンツ評価情報保持部119に保存されているコンテンツ評価情報に基づいて、ユーザ毎に個別にコンテンツに対する評価予測の学習を行う。例えば、パラメータ推定部131は、評価者がユーザ1であるコンテンツ評価情報(例えば、図6の1番目乃至3番目のレコード)に基づいて、ユーザ1のコンテンツに対する評価予測の学習を行う。また、パラメータ推定部131は、評価者がユーザ2であるコンテンツ評価情報(例えば、図6の4番目のレコード)に基づいて、ユーザ2のコンテンツに対する評価予測の学習を行う。さらに、パラメータ推定部131は、評価者がユーザ3であるコンテンツ評価情報(例えば、図6の5番目のレコード)に基づいて、ユーザ3のコンテンツに対する評価予測の学習を行う。
図9は、コンテンツの特徴量が4種類である場合の、ユーザ毎のコンテンツに対する評価予測の学習結果の例を示している。この場合、学習結果として、4種類のコンテンツ特徴量にそれぞれ対応する4種類のパラメータ1乃至4、および、定数項の5種類のパラメータが、ユーザ毎に求められる。
次に、パラメータ推定部131は、ユーザ参照情報保持部120に保存されているユーザ参照情報に基づいて、パラメータを融合する。例えば、パラメータ推定部131は、あるユーザに対するパラメータと、当該ユーザがポジティブに評価しているユーザのパラメータとの加重平均(重み付け加算値)を、当該ユーザのパラメータに設定する。
例えば、図8のユーザ参照情報では、ユーザ1がユーザ2に対してポジティブな評価を与えている。従って、パラメータ推定部131は、ユーザ1のパラメータとユーザ2のパラメータとを、例えば2:1の割合で重み付けして加重平均を取ることにより、ユーザ1のパラメータを算出する。これにより、ユーザ1のパラメータは、図10に示されるように、0.13、1.03、0.83、4.63、-2.50となる。
なお、例えば、ユーザ1が複数のユーザ(例えば、ユーザ2とユーザ3)に対してポジティブな評価を与えている場合、ユーザ1とその複数のユーザのパラメータの加重平均が、ユーザ1のパラメータに設定される。なお、ポジティブな評価を与えている複数のユーザの中から所定の人数のユーザを抽出して、加重平均をとるようにしてもよい。
また、例えば、ユーザ1が1人のユーザ(例えば、ユーザ2)に対して複数回評価を与えている場合、ポジティブな評価回数がネガティブな評価回数を上回っているとき、その比率に基づいて、加重平均の重みを決定するようにすればよい。一方、ポジティブな評価回数がネガティブな評価回数以下であるユーザのパラメータは、加重平均に用いないようにすることが望ましい。
さらに、例えば、ユーザ1がポジティブな評価を与えているユーザ2のパラメータを、そのままユーザ1のパラメータとして利用するようにしてもよい。これは、例えば、ユーザ1のコンテンツ評価情報が少なく、ユーザ1のパラメータの信頼度が低い一方で、ユーザ2のコンテンツ評価情報が多く、ユーザ2のパラメータの信頼度が高い場合に特に有効である。
なお、ユーザ2およびユーザ3のユーザ参照情報はないため、ユーザ2およびユーザ3のパラメータには、それぞれ単独で推定されたパラメータが用いられる。
そして、パラメータ推定部131は、学習処理の結果得られた各ユーザのパラメータをユーザパラメータ保持部132に保存する。
なお、上述した非特許文献5等に記載されているように、パラメータに事前分布を仮定するベイズ学習の枠組みを利用することにより、コンテンツなどの分類を行う分類器等を精度良く学習できることが知られている。
この事前分布は全ユーザで共有するようにしてもよいし、ユーザ毎に保持するようにしてもよい。ただし、前者の場合、粒度が粗すぎて精度が出ない場合があり、後者の場合、データ数が少ないために適切に事前分布を学習できない場合がある。そこで、「Kai Yu他, "A Nonparametric Hierarchical Bayesian Framework For Information Filtering", Proceedings of the 27th annual international ACM SIGIR conference on Research and development in information retrieval, USA, Association for Computing Machinery, 2004, pp.353-360」(以下、非特許文献6と称する)に記載されているように、似た傾向のユーザ同士で事前分布を共有することが考えられる。この似た傾向のユーザの選択は、確率モデル上で表現することが可能であるが、本実施の形態では、ユーザ参照情報においてポジティブな評価を与えている参照先ユーザの事前分布をそのまま利用してパラメータ学習を行うことが可能である。
この場合、例えば、ユーザ毎にパラメータを学習したのち、共有する事前分布を学習する。後者の処理によって、共有する他のユーザのパラメータ学習に影響を与えることができる。
図2に戻り、ステップS7において、予測部133は、評価予測に参照先ユーザのパラメータを使用するか否かを判定する。ここで、評価予測を行う対象となるユーザ(以下、注目ユーザと称する)のコンテンツに対する評価を予測する方法として、例えば、注目ユーザのパラメータを使用する方法と、参照先ユーザのパラメータを使用する方法がある。
例えば、注目ユーザがポジティブな評価を与えている参照先ユーザが存在しない場合、注目ユーザのパラメータを用いて評価予測が行われる。この場合、予測部133は、評価予測に参照先ユーザのパラメータを使用しないと判定する。
また、例えば、注目ユーザのパラメータが他のユーザのパラメータとの加重平均により求められている場合、注目ユーザのパラメータを用いて評価予測が行われる。この場合も、予測部133は、評価予測に参照先ユーザのパラメータを使用しないと判定する。
さらに、例えば、注目ユーザがポジティブな評価を与えている参照先ユーザが存在し、かつ、注目ユーザのパラメータが他のユーザのパラメータとの加重平均を用いずに単独で推定された場合、確率α(0<α≦1)で、当該参照先ユーザのパラメータを用いて評価予測が行われ、確率1−αで、注目ユーザのパラメータを用いて評価予測が行われる。すなわち、この場合、予測部133は、確率1−αで、評価予測に参照先ユーザのパラメータを使用しないと判定し、確率αで、評価予測に参照先ユーザのパラメータを使用すると判定する。
なお、注目ユーザがポジティブな評価を与えている参照先ユーザが複数存在する場合、例えば、確率αが当該参照先ユーザの数で等分される。あるいは、当該参照先ユーザ毎にそれぞれ異なる確率を設定するようにしてもよい。
そして、ステップS7において、評価予測に参照先ユーザのパラメータを使用しないと判定された場合、処理はステップS8に進む。
ステップS8において、予測部133は、注目ユーザのパラメータを取得する。例えば、ユーザ1が注目ユーザである場合、予測部133は、図9(または図10)に示される各ユーザのパラメータのうち、ユーザ1のパラメータを取得する。その後、処理はステップS10に進む。
一方、ステップS7において、評価予測に参照先ユーザのパラメータを使用すると判定された場合、処理はステップS9に進む。
ステップS9において、予測部133は、参照先ユーザのパラメータを取得する。例えば、ユーザ1が注目ユーザである場合、予測部133は、図8のユーザ参照情報に基づいて、ユーザ1がポジティブな評価を与えている参照先ユーザがユーザ2であることを特定する。そして、予測部133は、図9(または図10)に示される各ユーザのパラメータの中から、ユーザ2のパラメータを取得する。その後、処理はステップS10に進む。
ステップS10において、予測部133は、評価予測を行う。具体的には、予測部133は、コンテンツ情報保持部122に情報が保存されているコンテンツのうち、注目ユーザがまだ評価していないコンテンツに対する評価を予測する。すなわち、予測部133は、コンテンツ情報保持部122に情報が保存されているコンテンツのうち、コンテンツ評価情報保持部119に注目ユーザのコンテンツ評価情報が保存されていないコンテンツに対する注目ユーザの評価を予測する。
例えば、評価予測に用いるユーザのパラメータを表すベクトルをw、評価対象となるコンテンツの特徴量を表すベクトルをxとすると、予測部133は、以下の式(1)に基づいて、ロジスティック回帰の出力値fw(x)を算出する。
fw(x)=1/(1+exp(−wTx)) ・・・(1)
なお、行列xには、パラメータの定数項に対応して常に値が1となる要素を含んでいる。
そして、予測部133は、算出した出力値fw(x)を、注目ユーザの当該コンテンツに対する予測評価値とする。
例えば、図9のユーザ1のパラメータを評価予測に用い、評価対象となるコンテンツ1乃至3の特徴量1乃至4が、図11に示される値に設定されている場合、ユーザ1のコンテンツ1乃至3に対する予測評価値fw(x)は、それぞれ0.51,0.81,0.14となる。
また、予測部133は、予測評価値fw(x)をベルヌーイ分布の期待値として、特徴量xを有するコンテンツに対する注目ユーザの評価がポジティブまたはネガティブのいずれであるかを予測する。なお、予測評価値fw(x)の値が大きければ大きいほど、注目ユーザが当該コンテンツを好きである(ポジティブな評価を与える)確率が高くなる。逆に、予測評価値fw(x)の値が小さければ小さいほど、注目ユーザが当該コンテンツを嫌いである(ネガティブな評価を与える)確率が高くなる。
そして、予測部133は、注目ユーザの未評価コンテンツに対する予測評価値fw(x)をコンテンツ提示部123に供給する。
ステップS11において、コンテンツ提示部123は、コンテンツを提示する。例えば、コンテンツ提示部123は、予測評価値fw(x)が上位n個に入るコンテンツを抽出し、抽出したコンテンツに関する情報をコンテンツ情報保持部122から取得する。そして、コンテンツ提示部123は、取得したコンテンツに関する情報を、例えば、図示せぬネットワークを介して注目ユーザが有する情報機器(例えば、コンピュータ、携帯電話機、携帯情報端末など)に送信する。そして、注目ユーザの情報機器において、抽出したコンテンツに関する情報が表示されることにより、注目ユーザに対してコンテンツの推薦が行われる。
その後、コンテンツ推薦処理は終了する。
以上のようにして、注目ユーザの評価情報に加えて、注目ユーザが言語表現またはユーザ自身を評価した他のユーザの評価情報に基づいて、注目ユーザのコンテンツに対する評価が予測される。従って、より多くの信頼度の高い評価情報に基づいて、注目ユーザのコンテンツに対する評価が予測される。その結果、注目ユーザのコンテンツに対する評価の予測精度が向上し、より注目ユーザの嗜好に合致したコンテンツを推薦することが可能になる。
<3.変形例>
なお、以上の説明では、コンテンツに対する評価予測の学習手法として、ロジスティック回帰を用いたCBFを用いる例を示したが、本発明の実施の形態では、その他の任意の学習手法を採用することができる。なお、ロジスティック回帰やSVMなどの分類手法の代わりに、線形回帰やSupport Vector Regressionなどの連続値を予測する回帰手法を用いる場合には、図2のステップS2において評価極性を判別するときに、例えば、「非常に」や「少々」などの副詞表現等を利用して、評価極性のポジティブおよびネガティブの度合いを設定するようにすることが考えられる。
また、以上の説明では、言語情報の収集先をブログとする例を示したが、特にこの例に限定されるものではなく、本発明の実施の形態では、SNS、twitter(登録商標)などの他の任意の収集先を設定することが可能である。
さらに、収集した言語表現から抽出したコンテンツ評価情報だけでなく、コンテンツ評価情報取得部118が外部から取得したコンテンツ評価情報を利用して、学習処理を行うようにしてもよい。
なお、本発明は、例えば、ユーザのコンテンツに対する評価を予測したり、ユーザに対してコンテンツを推薦したりする各種の情報処理装置、情報処理システム、ソフトウエア等に適用することが可能である。
[コンピュータの構成例]
上述した一連の処理は、ハードウエアにより実行することもできるし、ソフトウエアにより実行することもできる。一連の処理をソフトウエアにより実行する場合には、そのソフトウエアを構成するプログラムが、コンピュータにインストールされる。ここで、コンピュータには、専用のハードウエアに組み込まれているコンピュータや、各種のプログラムをインストールすることで、各種の機能を実行することが可能な、例えば汎用のパーソナルコンピュータなどが含まれる。
図12は、上述した一連の処理をプログラムにより実行するコンピュータのハードウエアの構成例を示すブロック図である。
コンピュータにおいて、CPU(Central Processing Unit)201,ROM(Read Only Memory)202,RAM(Random Access Memory)203は、バス204により相互に接続されている。
バス204には、さらに、入出力インタフェース205が接続されている。入出力インタフェース205には、入力部206、出力部207、記憶部208、通信部209、及びドライブ210が接続されている。
入力部206は、キーボード、マウス、マイクロフォンなどよりなる。出力部207は、ディスプレイ、スピーカなどよりなる。記憶部208は、ハードディスクや不揮発性のメモリなどよりなる。通信部209は、ネットワークインタフェースなどよりなる。ドライブ210は、磁気ディスク、光ディスク、光磁気ディスク、又は半導体メモリなどのリムーバブルメディア211を駆動する。
以上のように構成されるコンピュータでは、CPU201が、例えば、記憶部208に記憶されているプログラムを、入出力インタフェース205及びバス204を介して、RAM203にロードして実行することにより、上述した一連の処理が行われる。
コンピュータ(CPU201)が実行するプログラムは、例えば、パッケージメディア等としてのリムーバブルメディア211に記録して提供することができる。また、プログラムは、ローカルエリアネットワーク、インターネット、デジタル衛星放送といった、有線または無線の伝送媒体を介して提供することができる。
コンピュータでは、プログラムは、リムーバブルメディア211をドライブ210に装着することにより、入出力インタフェース205を介して、記憶部208にインストールすることができる。また、プログラムは、有線または無線の伝送媒体を介して、通信部209で受信し、記憶部208にインストールすることができる。その他、プログラムは、ROM202や記憶部208に、あらかじめインストールしておくことができる。
なお、コンピュータが実行するプログラムは、本明細書で説明する順序に沿って時系列に処理が行われるプログラムであっても良いし、並列に、あるいは呼び出しが行われたとき等の必要なタイミングで処理が行われるプログラムであっても良い。
また、本明細書において、システムの用語は、複数の装置、手段などより構成される全体的な装置を意味するものとする。
さらに、本発明の実施の形態は、上述した実施の形態に限定されるものではなく、本発明の要旨を逸脱しない範囲において種々の変更が可能である。
101 情報処理システム, 111 ブログ情報保持部, 112 言語表現収集部, 113 言語表現保持部, 114 評価情報抽出部, 115 タイプ識別部, 116 評価情報保持部, 117 評価情報解析部, 118 コンテンツ評価情報取得部, 119 コンテンツ評価情報保持部, 120 ユーザ参照情報保持部, 121 評価予測部, 122 コンテンツ情報保持部, 123 コンテンツ提示部, 131 パラメータ推定部, 132 ユーザパラメータ保持部, 133 予測部

Claims (9)

  1. ユーザにより言語で表現された情報である言語表現から評価対象および前記評価対象への評価を含む評価情報を抽出する評価情報抽出手段と、
    前記評価情報がコンテンツに関する第1のタイプの評価情報であるか、または、他のユーザに関する第2のタイプの評価情報であるかを識別する識別手段と、
    注目ユーザによる前記第1のタイプの評価情報、および、前記注目ユーザによる前記第2のタイプの評価情報における前記他のユーザによる前記評価情報に基づいて、前記注目ユーザのコンテンツに対する評価を予測する評価予測手段と
    を含む情報処理装置。
  2. 前記第2のタイプの評価情報は、前記他のユーザの前記言語表現を前記評価対象とする前記評価情報を含み、
    前記評価予測手段は、前記注目ユーザによる前記第1のタイプの評価情報、および、前記注目ユーザによる前記第2のタイプの評価情報において前記評価対象とされた前記他のユーザの前記言語表現に含まれる前記評価情報に基づいて、前記注目ユーザのコンテンツに対する評価を予測する
    請求項1に記載の情報処理装置。
  3. 前記第2のタイプの評価情報は、前記他のユーザ自身を前記評価対象とする前記評価情報を含み、
    前記評価予測手段は、前記注目ユーザによる前記第1のタイプの評価情報、および、前記注目ユーザによる前記第2のタイプの評価情報において前記評価対象とされた前記他のユーザによる前記評価情報に基づいて、前記注目ユーザのコンテンツに対する評価を予測する
    請求項1に記載の情報処理装置。
  4. 前記評価予測手段は、
    前記注目ユーザによる前記第1のタイプの評価情報、および、前記注目ユーザによる前記第2のタイプの評価情報における前記他のユーザによる前記評価情報に基づいて、前記注目ユーザのコンテンツに対する評価予測に用いるパラメータを推定する推定手段と、
    前記注目ユーザの前記パラメータに基づいて、前記注目ユーザのコンテンツに対する評価を予測する予測手段と
    を含む請求項1に記載の情報処理装置。
  5. 前記推定手段は、さらに、前記注目ユーザの前記パラメータと、前記注目ユーザによりポジティブな評価が与えられた前記他のユーザの前記パラメータとを重み付け加算することにより得られる値を、前記注目ユーザの前記パラメータに設定する
    請求項4に記載の情報処理装置。
  6. 前記推定手段は、さらに、前記注目ユーザと、前記注目ユーザによりポジティブな評価が与えられた前記他のユーザとの間で前記パラメータの事前分布を共有して、前記注目ユーザの前記パラメータを推定する
    請求項4に記載の情報処理装置。
  7. 前記予測手段は、さらに、前記前記注目ユーザによりポジティブな評価が与えられた他のユーザの前記パラメータを用いて、前記注目ユーザのコンテンツに対する評価を予測する
    請求項4に記載の情報処理装置。
  8. ユーザのコンテンツに対する評価を予測する情報処理装置が、
    ユーザにより言語で表現された情報である言語表現から評価対象および前記評価対象への評価を含む評価情報を抽出し、
    前記評価情報がコンテンツに関する第1のタイプの評価情報であるか、または、他のユーザに関する第2のタイプの評価情報であるかを識別し、
    注目ユーザによる前記第1のタイプの評価情報、および、前記注目ユーザによる前記第2のタイプの評価情報における前記他のユーザによる前記評価情報に基づいて、前記注目ユーザのコンテンツに対する評価を予測する
    ステップを含む情報処理方法。
  9. ユーザにより言語で表現された情報である言語表現から評価対象および前記評価対象への評価を含む評価情報を抽出し、
    前記評価情報がコンテンツに関する第1のタイプの評価情報であるか、または、他のユーザに関する第2のタイプの評価情報であるかを識別し、
    注目ユーザによる前記第1のタイプの評価情報、および、前記注目ユーザによる前記第2のタイプの評価情報における前記他のユーザによる前記評価情報に基づいて、前記注目ユーザのコンテンツに対する評価を予測する
    ステップを含む処理をコンピュータに実行させるためのプログラム。
JP2010124183A 2010-05-31 2010-05-31 情報処理装置および方法、並びに、プログラム Active JP5454357B2 (ja)

Priority Applications (5)

Application Number Priority Date Filing Date Title
JP2010124183A JP5454357B2 (ja) 2010-05-31 2010-05-31 情報処理装置および方法、並びに、プログラム
US13/112,206 US8682830B2 (en) 2010-05-31 2011-05-20 Information processing apparatus, information processing method, and program
CN201110139803.1A CN102262647B (zh) 2010-05-31 2011-05-24 信息处理装置、信息处理方法和程序
US14/147,008 US9208441B2 (en) 2010-05-31 2014-01-03 Information processing apparatus, information processing method, and program
US14/940,834 US9785888B2 (en) 2010-05-31 2015-11-13 Information processing apparatus, information processing method, and program for prediction model generated based on evaluation information

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2010124183A JP5454357B2 (ja) 2010-05-31 2010-05-31 情報処理装置および方法、並びに、プログラム

Publications (2)

Publication Number Publication Date
JP2011248831A true JP2011248831A (ja) 2011-12-08
JP5454357B2 JP5454357B2 (ja) 2014-03-26

Family

ID=45009277

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2010124183A Active JP5454357B2 (ja) 2010-05-31 2010-05-31 情報処理装置および方法、並びに、プログラム

Country Status (3)

Country Link
US (3) US8682830B2 (ja)
JP (1) JP5454357B2 (ja)
CN (1) CN102262647B (ja)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2014021757A (ja) * 2012-07-19 2014-02-03 Nippon Telegr & Teleph Corp <Ntt> コンテンツ評価値予測装置、方法、及びプログラム
JP2015531119A (ja) * 2012-08-03 2015-10-29 フェイスブック,インク. 広告ターゲティングのための否定的なシグナル
JPWO2013179558A1 (ja) * 2012-05-29 2016-01-18 パナソニックIpマネジメント株式会社 画像評価装置、画像評価方法、プログラム、集積回路
JP2016157182A (ja) * 2015-02-23 2016-09-01 富士ゼロックス株式会社 情報処理装置及び情報処理プログラム
JP2016530651A (ja) * 2013-09-10 2016-09-29 フェイスブック,インク. ソーシャル・ネットワーキング・システムのユーザについての感情極性
US9779385B2 (en) 2011-06-24 2017-10-03 Facebook, Inc. Inferring topics from social networking system communications
WO2023182063A1 (ja) * 2022-03-22 2023-09-28 株式会社Jvcケンウッド コンテンツ資産管理装置、コンテンツ資産管理方法、コンテンツ資産管理プログラム

Families Citing this family (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2013102926A2 (en) * 2011-12-13 2013-07-11 Tata Consultancy Services Limited A user specific plan generation method and system
KR101616909B1 (ko) * 2012-10-31 2016-04-29 에스케이텔레콤 주식회사 자동 채점 장치 및 방법
CN107960127A (zh) 2015-05-04 2018-04-24 康德克斯罗吉克股份有限公司 用于对在线市场中的商品进行呈现和评级的系统和技术
US10101870B2 (en) * 2015-10-16 2018-10-16 Microsoft Technology Licensing, Llc Customizing program features on a per-user basis
CN106604044A (zh) * 2016-11-21 2017-04-26 武汉斗鱼网络科技有限公司 一种直播间推荐策略的评估方法、用户设备和服务器系统
CN106488267A (zh) * 2016-11-21 2017-03-08 武汉斗鱼网络科技有限公司 一种直播间推荐策略的评估方法、用户设备和服务器系统
CN106658074A (zh) * 2016-11-21 2017-05-10 武汉斗鱼网络科技有限公司 一种直播间推荐策略的评估方法、用户设备和服务器系统
US11205103B2 (en) 2016-12-09 2021-12-21 The Research Foundation for the State University Semisupervised autoencoder for sentiment analysis
CN108268464B (zh) * 2016-12-30 2021-01-12 广东精点数据科技股份有限公司 一种基于协同过滤与logistic回归的个性化推荐方法及装置
US10883995B2 (en) * 2017-03-28 2021-01-05 Faizan Ahmed Methods and systems for managing the temperature of medicines
CN108416375B (zh) * 2018-02-13 2020-07-07 中国联合网络通信集团有限公司 工单分类方法及装置
CN108446951A (zh) * 2018-02-13 2018-08-24 李杰波 评分展示方法及系统
CN113704630B (zh) * 2021-10-27 2022-04-22 武汉卓尔数字传媒科技有限公司 一种信息推送方法、装置、可读存储介质和电子设备

Family Cites Families (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6314420B1 (en) * 1996-04-04 2001-11-06 Lycos, Inc. Collaborative/adaptive search engine
US6317722B1 (en) * 1998-09-18 2001-11-13 Amazon.Com, Inc. Use of electronic shopping carts to generate personal recommendations
US6981040B1 (en) * 1999-12-28 2005-12-27 Utopy, Inc. Automatic, personalized online information and product services
US20030101166A1 (en) * 2001-11-26 2003-05-29 Fujitsu Limited Information analyzing method and system
JP2007011933A (ja) * 2005-07-04 2007-01-18 Nippon Telegr & Teleph Corp <Ntt> 近辺情報検索装置
US20080077574A1 (en) * 2006-09-22 2008-03-27 John Nicholas Gross Topic Based Recommender System & Methods
US8166026B1 (en) * 2006-12-26 2012-04-24 uAffect.org LLC User-centric, user-weighted method and apparatus for improving relevance and analysis of information sharing and searching
US20090307168A1 (en) * 2008-05-06 2009-12-10 Likeme Inc. Systems and methods for photo-based content discovery and recommendation
US8037080B2 (en) 2008-07-30 2011-10-11 At&T Intellectual Property Ii, Lp Recommender system utilizing collaborative filtering combining explicit and implicit feedback with both neighborhood and latent factor models
US20100057560A1 (en) * 2008-09-04 2010-03-04 At&T Labs, Inc. Methods and Apparatus for Individualized Content Delivery
US7974983B2 (en) * 2008-11-13 2011-07-05 Buzzient, Inc. Website network and advertisement analysis using analytic measurement of online social media content
JP2010124183A (ja) 2008-11-19 2010-06-03 Yazaki Corp 駆動回路
CN101477556B (zh) * 2009-01-22 2010-09-15 苏州智讯科技有限公司 一种从互联网海量信息中发现热点的方法
US8751521B2 (en) * 2010-04-19 2014-06-10 Facebook, Inc. Personalized structured search queries for online social networks

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9779385B2 (en) 2011-06-24 2017-10-03 Facebook, Inc. Inferring topics from social networking system communications
JPWO2013179558A1 (ja) * 2012-05-29 2016-01-18 パナソニックIpマネジメント株式会社 画像評価装置、画像評価方法、プログラム、集積回路
JP2014021757A (ja) * 2012-07-19 2014-02-03 Nippon Telegr & Teleph Corp <Ntt> コンテンツ評価値予測装置、方法、及びプログラム
JP2015531119A (ja) * 2012-08-03 2015-10-29 フェイスブック,インク. 広告ターゲティングのための否定的なシグナル
US10380606B2 (en) 2012-08-03 2019-08-13 Facebook, Inc. Negative signals for advertisement targeting
JP2016530651A (ja) * 2013-09-10 2016-09-29 フェイスブック,インク. ソーシャル・ネットワーキング・システムのユーザについての感情極性
US10679147B2 (en) 2013-09-10 2020-06-09 Facebook, Inc. Sentiment polarity for users of a social networking system
US10706367B2 (en) 2013-09-10 2020-07-07 Facebook, Inc. Sentiment polarity for users of a social networking system
JP2016157182A (ja) * 2015-02-23 2016-09-01 富士ゼロックス株式会社 情報処理装置及び情報処理プログラム
WO2023182063A1 (ja) * 2022-03-22 2023-09-28 株式会社Jvcケンウッド コンテンツ資産管理装置、コンテンツ資産管理方法、コンテンツ資産管理プログラム

Also Published As

Publication number Publication date
CN102262647A (zh) 2011-11-30
US20160071015A1 (en) 2016-03-10
US20140122405A1 (en) 2014-05-01
US9208441B2 (en) 2015-12-08
CN102262647B (zh) 2016-02-17
US8682830B2 (en) 2014-03-25
US9785888B2 (en) 2017-10-10
US20110295787A1 (en) 2011-12-01
JP5454357B2 (ja) 2014-03-26

Similar Documents

Publication Publication Date Title
JP5454357B2 (ja) 情報処理装置および方法、並びに、プログラム
Tatar et al. From popularity prediction to ranking online news
Balaanand et al. An enhanced graph-based semi-supervised learning algorithm to detect fake users on Twitter
KR101888919B1 (ko) 사용자 영향력 기반의 광고 마케팅 방법 및 그를 위한 장치
Bach et al. Personalized recommendation of stories for commenting in forum-based social media
US20160170982A1 (en) Method and System for Joint Representations of Related Concepts
US10747771B2 (en) Method and apparatus for determining hot event
US8990208B2 (en) Information management and networking
CN106845644B (zh) 一种通过相互关系学习用户及移动应用的联系的异构网络
JP5615857B2 (ja) 分析装置、分析方法及び分析プログラム
JP6097126B2 (ja) レコメンド情報生成装置及びレコメンド情報生成方法
Natarajan et al. Recommending news based on hybrid user profile, popularity, trends, and location
JP2017146720A (ja) 特許要件適否予測装置および特許要件適否予測プログラム
EP2613275B1 (en) Search device, search method, search program, and computer-readable memory medium for recording search program
Menaria et al. Tweet sentiment classification by semantic and frequency base features using hybrid classifier
Tondulkar et al. Get me the best: predicting best answerers in community question answering sites
Khan et al. Comparative analysis on Facebook post interaction using DNN, ELM and LSTM
JP6680663B2 (ja) 情報処理装置、情報処理方法、予測モデルの生成装置、予測モデルの生成方法、およびプログラム
Alahmadi et al. Improving recommendation using trust and sentiment inference from osns
US20200226159A1 (en) System and method of generating reading lists
Griné et al. A Social Media Tool for Domain-Specific Information Retrieval-A Case Study in Human Trafficking
Wang et al. A novel feature-based text classification improving the accuracy of twitter sentiment analysis
US11934472B1 (en) System and method for feature determination and content selection
JP6696018B1 (ja) 情報処理装置、情報処理方法及び情報処理プログラム
Kaur et al. Classification of Followee Recommendation Techniques in Twitter

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20130422

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20131129

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20131210

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20131223

R151 Written notification of patent or utility model registration

Ref document number: 5454357

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250