JP2962264B2 - ユーザ嗜好自動学習方式 - Google Patents

ユーザ嗜好自動学習方式

Info

Publication number
JP2962264B2
JP2962264B2 JP9048512A JP4851297A JP2962264B2 JP 2962264 B2 JP2962264 B2 JP 2962264B2 JP 9048512 A JP9048512 A JP 9048512A JP 4851297 A JP4851297 A JP 4851297A JP 2962264 B2 JP2962264 B2 JP 2962264B2
Authority
JP
Japan
Prior art keywords
user
content
learning
weight
preference
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP9048512A
Other languages
English (en)
Other versions
JPH10228487A (ja
Inventor
直樹 安倍
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
Nippon Electric Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Electric Co Ltd filed Critical Nippon Electric Co Ltd
Priority to JP9048512A priority Critical patent/JP2962264B2/ja
Publication of JPH10228487A publication Critical patent/JPH10228487A/ja
Application granted granted Critical
Publication of JP2962264B2 publication Critical patent/JP2962264B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、コンピュータネッ
トワーク上等で、ニュース記事やホームページ等のコン
テンツ・サービスにおいて、個々のユーザの嗜好に合っ
たコンテンツを提供するためのユーザ嗜好の学習技術に
関するものである。
【0002】
【従来の技術】コンピュータネットワーク上等で、ニュ
ース記事やホームページ等のコンテンツに対するユーザ
の嗜好を学習し、個々のユーザの嗜好に合ったコンテン
ツを提供する学習型ナビゲーション・システムにおい
て、コンピュータネットワーク上のコンテンツに対する
嗜好の学習法として従来知られている方法は、同一ユー
ザによる類似のコンテンツに対する過去の嗜好を基に予
測・学習する「コンテンツベース方式」と、同一コンテ
ンツに対する類似ユーザの嗜好を基に予測・学習する
「ユーザベース方式」とに大別できる。
【0003】前者のコンテンツベース方式の例として
は、例えばカーネギーメロン大学のKen Langに
よるニュース・ウィーダー(NewsWeeder)が
知られており、Proceedings of the
12th International Confe
rence on Machine Learning
に掲載の論文「NewsWeeder:Learnin
g to filternetnews」に詳細に掲載
されている。また、同じくコンテンツベース方式の例と
して、日本電気株式会社C&C研究所の中村篤祥等によ
る逐次型学習方式もあり、第52回情報処理学会全国大
会の予稿集掲載の論文「ブール変数実数多項式を用いた
嗜好関数の学習」に詳細に記載されている。
【0004】後者のユーザベース方式の例としては、M
ITのPaul Resnick等による「グループ・
レンズ(Group Lens)」が知られており、P
roceedings of CSCW(1994)掲
載の論文「GroupLens:An Open Ar
chitecture for Collaborat
ive Filtering of Netnews」
に詳細に記載されている。
【0005】
【発明が解決しようとする課題】近年、上記の二種類の
方式を融合し、類似するユーザの過去の嗜好の情報と、
類似するコンテンツに対する過去の嗜好の情報の両方を
利用し、ユーザの嗜好を学習・予測する方式の重要性が
強く認識されており、これを達成する有効な方式の発明
が待望されていた。本発明は、まさにこの条件を満た
す、具体的かつ有効な方式を提案するものである。
【0006】
【課題を解決するための手段】
(A)本発明のユーザ嗜好自動学習方式は、ニュース記
事やホームページ等のコンテンツに対するユーザの嗜好
を、データとして与えられたコンテンツとそのコンテン
ツに対するユーザの嗜好度を表す数値からなるデータを
用いて学習する装置において、ユーザ・コンテンツ対お
よび該コンテンツに対する該ユーザの嗜好度を表す数値
からなる学習データを入力する学習データ入力部と、過
去に与えられた学習データを一括して格納する学習デー
タ格納部と、ユーザ間の類似度を表すユーザ間重みを格
納するユーザ間重み記憶部と、コンテンツ間の類似度を
表すコンテンツ間重みを格納するコンテンツ間重み記憶
部と、前記学習データ入力部に与えられたユーザ・コン
テンツ対に対して、前記学習データ格納部に格納された
学習データ、前記ユーザ間重み記憶部に格納されたユー
ザ間重み、および前記コンテンツ間重み記憶部に格納さ
れたコンテンツ間重みを用いて、そのユーザのそのコン
テンツに対する嗜好度を予測する予測部と、前記学習デ
ータ入力部から入力された前記ユーザ・コンテンツ対の
正しい嗜好度、前記学習データ格納部に格納された過去
に与えられた学習データ、前記ユーザ間重み記憶部に格
納されたユーザ間重み、および前記コンテンツ間重み記
憶部に格納されたコンテンツ間重みを用いて、前記ユー
ザ間重み記憶部に格納されたユーザ間重みおよび前記コ
ンテンツ間重み記憶部に格納されたコンテンツ間重みを
更新する学習部とを備え、前記予測部における予測は、
前記学習データ格納部に格納される過去の学習データの
嗜好度の値の、新たに与えられたユーザ・コンテンツ対
との間のユーザ間重みとコンテンツ間重みの積を重みと
する、重みつき平均によって行われる構成を有し、前記
学習部における重み更新は、過去の学習データ中の各ユ
ーザ・コンテンツ対に対して、新たに与えられたユーザ
・コンテンツ対との間のユーザ間重みとコンテンツ間重
みとの双方に対して行われ、且つ、ユーザ間重みは、過
去の学習データ中のユーザ・コンテンツ対に対する嗜好
度と新たに与えられたユーザ・コンテンツ対に対する嗜
好度との差と、前記コンテンツ間重みとの関数として更
新され、コンテンツ間重みは、過去の学習データ中のユ
ーザ・コンテンツ対に対する嗜好度と新たに与えられた
ユーザ・コンテンツ対に対する嗜好度との差と、前記ユ
ーザ間重みとの関数として更新される構成を有する。
【0007】上記(A)のように構成された本発明のユ
ーザ嗜好自動学習方式にあっては、学習データ入力部か
らユーザ・コンテンツ対が入力されると、予測部が、そ
のユーザ・コンテンツ対に対して、学習データ格納部に
格納された過去の学習データ、ユーザ間重み記憶部に格
納されたユーザ間重み、およびコンテンツ間重み記憶部
に格納されたコンテンツ間重みを現在の仮説として、そ
のユーザのそのコンテンツに対する嗜好度の予測値とし
て、過去の学習データの嗜好度の値の、新たに与えられ
たユーザ・コンテンツ対との間のユーザ間重みとコンテ
ンツ間重みの積を重みとする、重みつき平均によって求
める。また、そのユーザ・コンテンツ対の正しい嗜好度
が学習データ入力部から入力されると、学習部が、この
正しい嗜好度、学習データ格納部に格納された過去に与
えられた学習データ、ユーザ間重み記憶部に格納された
現在のユーザ間重み、およびコンテンツ間重み記憶部に
格納された現在のコンテンツ間重みを用いて、ユーザ間
重み記憶部に格納されたユーザ間重みおよびコンテンツ
間重み記憶部に格納されたコンテンツ間重み、つまり現
在の仮説を更新する。具体的には、過去の学習データ中
の各ユーザ・コンテンツ対に対して、新たに与えられた
ユーザ・コンテンツ対との間のユーザ間重みとコンテン
ツ間重みとの双方を更新し、その際、ユーザ間重みは、
過去の学習データ中のユーザ・コンテンツ対に対する嗜
好度と新たに与えられたユーザ・コンテンツ対に対する
嗜好度との差と、前記コンテンツ間重みとの関数として
更新し、コンテンツ間重みは、過去の学習データ中のユ
ーザ・コンテンツ対に対する嗜好度と新たに与えられた
ユーザ・コンテンツ対に対する嗜好度との差と、前記ユ
ーザ間重みとの関数として更新する。このような重みの
更新を行うことにより、ユーザ間の類似度のみを考慮す
る場合や、コンテンツ間の類似度のみを考慮する場合に
比べて、立上がりの早い学習が可能となる。なお、以上
の動作例では、ユーザ・コンテンツ対が与えられたとき
に、その予測と学習とを行うようにしたが、これは毎回
学習を行ういわゆる逐次学習式の動作であり、別の動作
例として、学習中は予測を行わずに学習だけを行い、或
る程度学習が進んだ段階以降は、予測だけを行う所謂バ
ッチ式の動作を行わせることもできる。
【0008】(B)また本発明の別のユーザ嗜好自動学
習方式は、前記の学習部において、過去の学習データ中
の各ユーザ・コンテンツ対に対して、新たに与えられた
ユーザ・コンテンツ対との間のユーザ間重みとコンテン
ツ間重みとの双方を更新するのに代えて、乱数を用いて
ランダムに、ユーザ間重み又はコンテンツ間重みを更新
する構成を有する。
【0009】(C)更に本発明の別のユーザ嗜好自動学
習方式は、ニュース記事やホームページ等のコンテンツ
に対するユーザの嗜好を、データとして与えられたコン
テンツとそのコンテンツに対するユーザの嗜好度を表す
数値からなるデータを用いて学習する装置において、ユ
ーザ・コンテンツ対および該コンテンツに対する該ユー
ザの嗜好度を表す数値からなる学習データを入力する学
習データ入力部と、過去に与えられた学習データを一括
して格納する学習データ格納部と、複数の学習方式を格
納する学習方式記憶部と、前記学習データ入力部に与え
られたユーザ・コンテンツ対に対して、そのユーザのそ
のコンテンツに対する嗜好度を、前記学習方式記憶部に
格納された各学習方式により予測させ、それらの予測値
の、各学習方式に対する信頼度を表す重み付き平均値を
もって予測する予測部と、複数のユーザ・コンテンツ対
からなる質問対候補集合の各ユーザ・コンテンツ対につ
いて、そのユーザのそのコンテンツに対する嗜好度を前
記学習方式記憶部中の各学習方式により予測させて、最
も予測値のばらつきの大きいユーザ・コンテンツ対の正
しい嗜好度を質問してその値を得る質問部と、前記学習
データ入力部から入力された前記ユーザ・コンテンツ対
の正しい嗜好度および前記質問部が質問して得た前記ユ
ーザ・コンテンツ対の正しい嗜好度に基づいて、前記学
習方式記憶部中の各学習方式の保持する仮説を更新する
と共に、前記予測部が使用する各学習方式に対する信頼
度を表す重みを、各重みの現在値および各学習方式の予
測値と入力として与えられた正しい嗜好度との差の関数
として更新する学習部とを有する。
【0010】上記(C)のように構成された本発明のユ
ーザ嗜好自動学習方式にあっては、学習データ入力部か
らユーザ・コンテンツ対が入力されると、予測部が、そ
のユーザ・コンテンツ対に対して、そのユーザのそのコ
ンテンツに対する嗜好度を、学習方式記憶部に格納され
た各学習方式により予測させてその予測値の重み付き平
均値をもって予測し、そのユーザ・コンテンツ対の正し
い嗜好度が学習データ入力部から入力されると、学習部
が、その正しい嗜好度に基づいて、学習方式記憶部中の
各学習方式の保持する仮説を更新すると共に、予測部が
使用する各学習方式に対する信頼度を表す重みを、各重
みの現在値および各学習方式の予測値と入力として与え
られた正しい嗜好度との差の関数として更新する。この
ように、各学習方式の仮説の更新と共に、各学習方式に
対する信頼度を表す重みの更新を行うことにより、学習
が進むにつれ、より信頼度の高い学習方式の予測値が大
きい影響力を持つようになり、少ない学習データによっ
て高い精度の予測が可能となる。
【0011】他方、質問部は、システム自らが学習すべ
きユーザ・コンテンツ対を決定することにより、学習す
べきユーザ・コンテンツ対を入力する利用者の手間を削
減すると同時に、より効率的な学習を可能にする。つま
り、質問部は、複数のユーザ・コンテンツ対からなる質
問対候補集合中の各ユーザ・コンテンツ対について、そ
のユーザのそのコンテンツに対する嗜好度を学習方式記
憶部中の各学習方式により予測させて、最も予測値のば
らつきの大きいユーザ・コンテンツ対の正しい嗜好度を
質問してその値を取得する。そして、学習部が、質問部
が質問したユーザ・コンテンツ対について利用者が回答
した正しい嗜好度に基づいて、学習方式記憶部中の各学
習方式の保持する仮説を更新すると共に、予測部が使用
する各学習方式に対する信頼度を表す重みを、更新す
る。このように情報量の高いユーザ・コンテンツ対に基
づいて学習を進めることにより、少ない質問数で高い精
度の予測が可能となる。
【0012】学習の順序は、学習データ入力部から1つ
のユーザ・コンテンツ対を入力してその予測を行った後
に、正しい嗜好度を学習データ入力部から入力して学習
するといった逐次式であっても良く、学習中は予測を行
わずに学習だけを行い、或る程度学習が進んだ段階以降
は、予測だけを行うバッチ式であっても良い。また、学
習データ入力部からの入力と質問部による質問との関係
については、学習データ入力部から1つのユーザ・コン
テンツ対の入力を受け、それを処理した後に、質問部で
可能であれば1つの質問を出すようにしても良く、複数
のユーザ・コンテンツ対の入力を学習データ入力部から
受け付け、それを処理した後に、質問部から幾つかの質
問を出すようにしても良い。
【0013】(D)更に本発明の別のユーザ嗜好自動学
習方式は、上記(C)におけるユーザ嗜好自動学習方式
において、学習方式記憶部に格納する学習方式に上記
(B)で述べたユーザ嗜好自動学習方式を使用する。つ
まり、学習方式記憶部に格納される個々の学習方式は、
ユーザ間の類似度を表すユーザ間重みを格納するユーザ
間重み記憶部と、コンテンツ間の類似度を表すコンテン
ツ間重みを格納するコンテンツ間重み記憶部と、予測部
と、学習部とを含む。個々の学習方式における予測部
は、与えられたユーザ・コンテンツ対に対して、学習デ
ータ格納部に格納された学習データ、ユーザ間重み記憶
部に格納されたユーザ間重み、およびコンテンツ間重み
記憶部に格納されたコンテンツ間重みを用いて、そのユ
ーザのそのコンテンツに対する嗜好度を予測する。その
際、予測は、学習データ格納部に格納される過去の学習
データの嗜好度の値の、新たに与えられたユーザ・コン
テンツ対との間のユーザ間重みとコンテンツ間重みの積
を重みとする、重みつき平均によって行われる。また、
個々の学習方式における学習部は、ユーザ・コンテンツ
対の正しい嗜好度、学習データ格納部に格納された過去
に与えられた学習データ、ユーザ間重み記憶部に格納さ
れたユーザ間重み、およびコンテンツ間重み記憶部に格
納されたコンテンツ間重みを用いて、ユーザ間重み記憶
部に格納されたユーザ間重み,コンテンツ間重み記憶部
に格納されたコンテンツ間重みを更新する。その際、乱
数を用いてランダムに、ユーザ間重み又はコンテンツ間
重みを更新する。すなわち、学習方式記憶部中の学習方
式はそれぞれ同一の学習方式であるが、一般に、ユーザ
間重み,コンテンツ間重みの更新にあたって異なる乱数
が発生され、異なる重みの更新が行われていくので、実
質的には、特定の場面において異なる予測を行う複数の
学習方式となる。
【0014】また更に本発明の別のユーザ嗜好自動学習
方式は、上記(D)のユーザ嗜好自動学習方式におい
て、前記質問部は、前記複数のユーザ・コンテンツ対か
らなる質問対候補集合として、過去の学習データ中に現
れるユーザとコンテンツとからなるユーザ・コンテンツ
対の中で、過去にデータとして嗜好度を与えられていな
い対の集合の全て又は一部を用いる構成を有する。
【0015】
【発明の実施の形態】次に本発明の実施の形態の例につ
いて図面を参照して詳細に説明する。
【0016】図1を参照すると、本発明のユーザ嗜好自
動学習方式の第1の実施の形態は、学習データ入力部1
と、学習データ格納部2と、ユーザ間重み記憶部3と、
コンテンツ間重み記憶部4と、予測部5と、学習部6と
から構成されている。これらは、例えばプログラム制御
されたCPU,キーボード等の入力装置,磁気ディスク
等の記憶装置を有するデータ処理装置(コンピュータ)
で実現することができる。
【0017】学習データ入力部1は、学習データを逐次
的に入力する部分である。入力される学習データは、ユ
ーザ・コンテンツ対と、そのコンテンツに対するそのユ
ーザの正しい嗜好度を表す数値とから構成される。
【0018】学習データ格納部2は過去に与えられた学
習データを一括して格納する部分、ユーザ間重み記憶部
3はユーザ間の類似度を表す重み行列(ユーザ間重みの
行列)を格納する部分、コンテンツ間重み記憶部4はコ
ンテンツ間の類似度を表す重み行列(コンテンツ間重み
の行列)を格納する部分である。
【0019】予測部5は、学習データ入力部1から入力
されたユーザ・コンテンツ対について、そのユーザのそ
のコンテンツに対する嗜好度を予測する部分である。こ
の予測は、学習データ格納部2に格納されている過去の
学習データと、ユーザ間重み記憶部3に格納されている
ユーザ間重みと、コンテンツ間重み記憶部4に格納され
ているコンテンツ間重みを参照して行われる。
【0020】学習部6は、学習データ入力部1から新た
な学習データ(ユーザ・コンテンツ対とその正しい嗜好
度を表す数値)が入力された場合に、入力されたユーザ
・コンテンツ対の正しい嗜好度、学習データ格納部2に
格納された過去に与えられた学習データ、ユーザ間重み
記憶部3に格納されたユーザ間重み、およびコンテンツ
間重み記憶部4に格納されたコンテンツ間重みを用い
て、ユーザ間重み記憶部3に格納されたユーザ間重み及
びコンテンツ間重み記憶部4に格納されたコンテンツ間
重みを更新する部分である。
【0021】図2は本実施の形態の動作の一例を示すフ
ローチャートである。この動作例は、学習データ入力部
1から1つのユーザ・コンテンツ対を入力し、そのコン
テンツに対するそのユーザの嗜好度を予測部5において
予測し、学習データ入力部1からそのユーザ・コンテン
ツ対の正しい嗜好度を入力し、学習部6においてユーザ
間重み及びコンテンツ間重みを更新する、という処理を
繰り返す逐次式の学習を採った場合のものである。
【0022】いま、ユーザの集合をX、コンテンツの集
合をYとすると、本発明の第1の実施の形態において
は、以下のようなステップを実行する。 (1)新しいユーザx∈Xと新しいコンテンツy∈Yの
対を学習データ入力部1にて入力する(ステップS
1)。 (2)入力されたユーザxとコンテンツyの対につい
て、ユーザxのコンテンツyに対する嗜好度f(x,
y)を、現在の仮説を用いて予測部5で予測する(ステ
ップS2)。f(x,y)の値は一般に実数値であると
仮定する。例えば、5段階評価(1,2,…,5)等が
想定される。 (3)ユーザxのコンテンツyに対する正しい嗜好度f
(x,y)の値を学習データ入力部1にて入力し(ステ
ップS3)、学習データ格納部2に格納する(ステップ
S4)。 (4)学習部6において現在の仮説を更新(学習)する
(ステップS5)。 (5)学習を終了するか否かを判定し、終了しない場合
はステップS1に戻る(ステップS6)。
【0023】予測・学習アルゴリズムの目標は、なるべ
く少ない数の学習データで、高い精度の予測を行うこと
にある。ステップS6で終了とする条件(停止条件)と
しては様々な条件が考えられるが、本発明については本
質的な影響はなく、また一般に適用環境に大きく依存す
るので、ここでは特に特定しない。なお、上記(1)〜
(4)を際限なく繰り返すようにしても良い。
【0024】上記(2)の予測段階では、以下のような
仮説形式を用いる。まず、過去に与えられた正しい嗜好
度f(x,y)の値がデータ行列Mとして学習データ格
納部2に格納されているものとする。このとき、過去に
f(x,y)の値が与えられたx,yについては、M
(x,y)=f(x,y)であり、そうでないx,yに
ついては、M(x,y)=*である。ここで、*は未設
定であることを示す。次に、任意のユーザの対(x1,
2 )∈X×Xに対して、それらユーザ間の類似度を表す
重みu(x1,2 )を記述したユーザ間の重み行列u
を、ユーザ間重み記憶部3に設ける。同様に、任意のコ
ンテンツの対(y1,2 )∈Y×Yに対して、それらコ
ンテンツ間の類似度を表す重みv(y1,2 )を記述し
たコンテンツ間の重み行列vを、コンテンツ間重み記憶
部4に設ける。現在の仮説とは、上記のデータ行列M
と、ユーザ間の重み行列uと、コンテンツ間の重み行列
vからなる。そして、新たに与えられた(x,y)∈X
×Yに対する嗜好度の予測は、データ行列Mに格納され
た全データによる重み付き平均をもって行う。ここで、
重み付き平均をとる場合の重みとしては、新しいユー
ザ,コンテンツ対をx,y、データ行列M中のユーザ,
コンテンツ対をx’,y’とすると、ユーザ間の重みと
コンテンツ間の重みの積、u(x,x’)・v(y,
y’)を用いる。すなわち、新しい対(x,y)の嗜好
の予測値f^(x,y)を以下のように計算する。
【0025】
【数1】
【0026】重みとしてユーザ間の重みとコンテンツ間
の重みの積を用いているのは、以下のような意味があ
る。f(x’,y’)の値がf(x,y)の値と近い値
をとるのは、x,x’と、y,y’が両方とも高い類似
度を持つ場合に限るので、(x,y)と(x’,y’)
が類似するという命題は、x,x’が類似するという命
題と、y,y’が類似するという命題との論理積である
と考えられる。しかし、ノイズを含む環境からのしかも
不完全なデータから学習を行う場合には論理的な推論は
危険なので、ここでは、論理積の代わりに、類似度を表
す重みによる実数積を用いている。そうすることによ
り、ノイズに対する頑健性を備えた予測を実現してい
る。
【0027】次に学習の手順、すなわち現在の仮説を更
新する手順について説明する。今、新しい対x,yに対
する嗜好度の正解f(x,y)を与えられたとする。過
去に与えられた各正解f(x’,y’)に対して、もし
|f(x,y)−f(x’,y’)|が大きい値をとる
ならば、(x,y)と(x’,y’)が類似していると
いう命題が否定されることになる。上記の観察から、こ
れは、(x,x’)が類似しているという命題と(y,
y’)が類似しているという命題の論理積が否定された
ことになるから、(x,x’)が類似していないという
命題と(y,y’)が類似していないという命題のどち
らかが正しいことになる。しかし、そのどちらが正しい
かは、これだけの情報からは特定できない。そこで、過
去のデータにより学習された(x,x’)の類似度の推
定値u(x,x’)と、(y,y’)の類似度の推定値
v(y,y’)を参照して以下のような推論を行う。す
なわち、もしu(x,x’)の値が大きく(x,x’)
が類似しているという証拠が強いならば、新しく与えら
れた命題は、(y,y’)が類似していないという命題
を指示し、また逆に、v(y,y’)の値が大きく
(y,y’)が類似しているという証拠が強いならば、
(x,x’)が類似していないという命題を指示する。
上記の「大きい」や「強い」という判断は、閾値等を用
いて論理値として推論することも可能であるが、ノイズ
を含んだ環境からの不完全なデータを用いた学習におい
てはそれは危険であるので、|f(x,y)−f
(x’,y’)|の大きさとu(x,x’)の値の大き
さによって連続的にv(y,y’)の更新幅を決定し、
また|f(x,y)−f(x’,y’)|の大きさとv
(y,y’)の値の大きさによって連続的にu(x,
x’)の更新幅を決定する。例えば、ユーザ間の重みu
は以下のように更新し、
【0028】
【数2】
【0029】コンテンツ間の重みvは以下のように更新
する。
【0030】
【数3】
【0031】なお、上式のc,dは正の定数である。c
は学習レートと呼ばれデータ数に依存して変化させるこ
とも可能である。dには|f(x’,y’)−f(x,
y)|の平均値の推定値等を用いるのが適当である。ま
た、以上の更新を行う際に、一回の更新における重みの
変化量の上限を指定することも可能である。例えば、ユ
ーザ間の重みuは以下のように更新し、
【0032】
【数4】
【0033】コンテンツ間の重みvは以下のように更新
しても良い。
【0034】
【数5】
【0035】また、アンダーフロー等の問題を避けるた
めに、重みの更新を行う度に、以下のように正規化を行
っても良い。
【0036】
【数6】
【0037】
【数7】
【0038】上のような重みの更新法を用いることによ
り、ノイズに対する頑健な帰納推論を実現することが可
能になると同時に、ユーザ間の類似度のみを考慮する場
合や、コンテンツ間の類似度のみを考慮する場合に比べ
て、立上がりの早い学習が可能となる。
【0039】次に、嗜好度の予測および重み行列の更新
の具体例を説明する。例としては、図4に示すようにu
1からu5までの5人のユーザとc1からc7までの7
つのコンテンツとを想定し、学習データ格納部2におけ
る過去の学習データを示すデータ行列Mの要素が全て未
設定(図4では?で示す)である状態において、f(u
2,c3)=4、f(u4,c3)=4、f(u2,c
6)=1、f(u4,c6)=1の順序で学習データが
与えられたものとする。また、ユーザ間重み記憶部3に
設けられているユーザ間重み及びコンテンツ間重み記憶
部4に設けられているユーザ間重みはそれぞれ初期値1
に設定されているものとする。更に、定数cは、−lo
g0.8 に設定、すなわちe-c=0.8 であり、dは2であ
るとする。また、自分自身の重みu(x,x)、v
(y,y)は更新しないものとする。このとき、各学習
データが与えられた後の嗜好度の予測値および重みの更
新は以下のようになる。
【0040】1.f(u2,c3)=4 この場合、過去の学習データが存在しないため、重みの
更新はない。また、嗜好度の予測値は任意のものとな
る。
【0041】2.f(u4,c3)=4 ○嗜好度の予測値
【数8】 ○重みの更新 (a)(u2,c3)v.s.(u4,c3)
【数9】
【0042】3.f(u2,c6)=1 ○嗜好度の予測値
【数10】 ○重みの更新 (a)(u4,c3)v.s.(u2,c6)
【数11】 (b)(u2,c3)v.s.(u2,c6)
【数12】
【0043】4.f(u4,c6)=1 ○嗜好度の予測値
【数13】 ○重みの更新 (a)(u2,c3)v.s.(u4,c6)
【数14】 (b)(u4,c3)v.s.(u4,c6)
【数15】 (c)(u2,c6)v.s.(u4,c6)
【数16】
【0044】以下、学習データが順次与えられる毎に重
みの更新が行われ、それに応じて嗜好度の予測値の精度
が高まっていく。図3に嗜好度の例(ユーザ嗜好関数の
例)を示す。この例のユーザ嗜好関数では、例えば、コ
ンテンツc1とコンテンツc3に対する各ユーザu1〜
u5の嗜好度が類似していることから、コンテンツc1
とコンテンツc3は高い類似度であることがわかる。ま
た、各コンテンツc1〜c7に対するユーザu2の嗜好
度とユーザu4の嗜好度が類似していることから、ユー
ザu2とユーザu4とが高い類似度であることがわか
る。
【0045】次に本発明の第2の実施の形態について説
明する。
【0046】上述した第1の実施の形態においては、新
しいユーザ・コンテンツ対に対する嗜好の正解を与えら
れる度に、ユーザ間の重みuと、コンテンツ間の重みv
との両方を更新するが、この第2の実施の形態において
は、乱数を用いてランダムにそのどちらか一方を第1の
実施の形態における更新式等を用いて更新する。それ以
外は第1の実施の形態と基本的に同じである。このと
き、各更新を確率2分の1で行うことも可能であるが、
関連する重みに依存した確率でランダムに行うことも可
能である。例えば、各ユーザ間の重みu(x,x’)の
更新を以下の確率pで行い、ユーザ間の重みが更新され
ない場合(即ち確率1−p)、コンテンツ間の重みv
(y,y’)を更新することが考えられる。
【0047】
【数17】
【0048】次に本発明の第3の実施の形態について説
明する。
【0049】図5を参照すると、本発明のユーザ嗜好自
動学習方式の第3の実施の形態は、学習データ入力部1
1と、学習データ格納部12と、予測部13と、学習方
式記憶部14と、学習部15と、質問部16とから構成
されている。これらは、例えばプログラム制御されたC
PU,キーボード等の入力装置,磁気ディスク等の記憶
装置,ディスプレイ装置などを有するデータ処理装置
(コンピュータ)で実現することができる。
【0050】学習データ入力部11は、学習データを逐
次的に入力する部分である。入力される学習データは、
ユーザ・コンテンツ対と、そのコンテンツに対するその
ユーザの正しい嗜好度を表す数値とから構成される。
【0051】学習データ格納部12は過去に与えられた
学習データを一括して格納する部分である。
【0052】学習方式記憶部14は、複数の学習方式を
格納する部分である。ここで、各学習方式は、与えられ
たユーザ・コンテンツ対に対して、そのユーザのそのコ
ンテンツに対する嗜好度を現在の仮説に基づいて予測す
る機能と、そのユーザのそのコンテンツ対に対する正し
い嗜好度に基づき現仮説を更新(学習)する機能とを持
つ。
【0053】予測部13は、学習データ入力部11から
入力されたユーザ・コンテンツ対について、そのユーザ
のそのコンテンツに対する嗜好度を予測する部分であ
る。この予測は、そのユーザのそのコンテンツに対する
嗜好度を、学習方式記憶部14に格納された各学習方式
により予測させ、各学習方式に対する現在の信頼度を表
す重みを用いて、それらの予測値の重み付き平均値をと
ることで行われる。
【0054】質問部16は、システム自らユーザ・コン
テンツ対を指定した質問を出し、そのユーザ・コンテン
ツ対に対する嗜好度の入力を受け取る部分である。質問
は例えばディスプレイの画面に出され、回答はキーボー
ドや画面上から入力される。
【0055】学習部15は、学習方式記憶部14に記憶
された各学習方式の現仮説および各学習方式の信頼度を
表す重みを更新する部分である。
【0056】図6は本実施の形態の動作の一例を示すフ
ローチャートである。この動作例では、学習データ入力
部11から1つのユーザ・コンテンツ対を入力し、その
コンテンツに対するそのユーザの嗜好度を予測部13に
おいて予測し、次いで学習データ入力部11からそのユ
ーザ・コンテンツ対の正しい嗜好度を入力して学習部1
5において各学習方式の現仮説および各学習方式の信頼
度を表す重みを更新し、そして、質問部16において可
能であれば1つのユーザ・コンテンツ対の嗜好度を質問
し、その回答に応じて学習部15において各学習方式の
現仮説および各学習方式の信頼度を表す重みを更新す
る、という処理を繰り返す逐次式の学習を行う。以下、
本実施の形態について詳述する。
【0057】いま、ユーザの集合をX、コンテンツの集
合をYとすると、本実施の形態においては、図6に示さ
れるように、以下のようなステップを実行する。 (1)新しいユーザx∈Xと新しいコンテンツy∈Yの
対を学習データ入力部11にて入力する(ステップS1
1)。 (2)入力されたユーザxとコンテンツyの対につい
て、ユーザxのコンテンツyに対する嗜好度f(x,
y)を、予測部13が学習方式記憶部14に格納された
複数の学習方式による予測値および各学習方式の現在の
信頼度を表す重みを用いて予測する(ステップ12,1
3)。f(x,y)の値は一般に実数値であると仮定す
る。例えば、5段階評価(1,2,…,5)等が想定さ
れる。 (3)ユーザxのコンテンツyに対する正しい嗜好度f
(x,y)の値を学習データ入力部11にて入力し(ス
テップS14)、学習データ格納部12に格納する(ス
テップS15)。 (4)ステップS14で入力された正しい嗜好度に基づ
き、学習部6において複数の学習方式の現在の仮説を更
新(学習)し(ステップS16)、また、各学習方式の
信頼度を表す重みを更新する(ステップS17)。 (5)質問部16において、複数の学習方式の現在の仮
説を用いて、嗜好度を質問すべき新たなユーザx’とコ
ンテンツy’の対を求め、その対に対する正しい嗜好度
をユーザから入力として得る(ステップS18)。 (6)上記ユーザx’とコンテンツy’の対,その正し
い嗜好度から構成される学習データを学習データ格納部
12に格納する(ステップS19)。 (7)ステップS18で入力された正しい嗜好度に基づ
き、学習部6において複数の学習方式の現在の仮説を更
新(学習)し(ステップS20)、また、各学習方式の
信頼度を表す重みを更新する(ステップS21)。 (8)学習を終了するか否かを判定し、終了しない場合
はステップS11に戻る(ステップS22)。
【0058】予測・学習アルゴリズムの目標は、なるべ
く少ない数の学習データおよび質問数で、高い精度の予
測を行うことにある。ステップS22で終了とする条件
(停止条件)としては、或る一定の学習精度か達成され
たこと等の様々な条件が考えられるが、本発明について
は本質的な影響はなく、また一般に適用環境に大きく依
存するので、ここでは特に特定しない。なお、上記
(1)〜(7)を際限なく繰り返すようにしても良い。
【0059】本実施の形態において、少ない学習データ
による高い精度の予測に関しては、学習方式記憶部14
に記憶された複数の学習方式にそれぞれ与えられたユー
ザ・コンテンツ対における嗜好度を予測させて、それら
の学習方式の信頼度を表す重みを用いた重み付け平均等
で予測を行うことで達成される。すなわち、各学習方式
による予測値をAi (x,y)、その重みをwi とし
て、f(x,y)の値を以下のf^(x,y)をもって
予測する。
【0060】
【数18】
【0061】なお、(x,y)に対する正しい嗜好度f
(x,y)が入力として与えられたとき、各学習方式A
i の重みwi は以下のように更新される。
【0062】
【数19】
【0063】以上のような重み更新により、学習が進む
と共に、より信頼度の高い学習方式の予測値が大きい影
響力を持つようになる。
【0064】次に、少ない数の質問数での高い精度の予
測を行うためには、情報量の高いユーザ・コンテンツ対
についてその嗜好度を質問することが必要になる。この
ために、学習方式記憶部14に記憶された複数の学習方
式の予測値がばらついているユーザ・コンテンツ対を発
見し、その対に対する嗜好度を質問する。或るユーザ・
コンテンツ対に対する予測値のばらつきは、予測値の分
散または予測値の重み付き平均嗜好度に対する自乗誤差
の、各学習方式の重みを用いた重み付き平均等によって
測ることができる。予測値のばらつきの多い対を発見す
る方法については、例えば乱数を用いて発生された多数
のユーザ・コンテンツ対の中から、予測値が上記の意味
で最もばらついている対を選んで質問するといった方法
が採用できる。すなわち、質問に用いるユーザ・コンテ
ンツ対(x* ,y* )は、候補として考慮されるユーザ
・コンテンツ対の集合をPとして、以下のように求める
ことができる。
【0065】
【数20】
【0066】なお、求めたユーザ・コンテンツ対が既に
学習データに存在する場合には、次点以降の候補の中か
ら学習データに存在しない対の候補の質問を選択すれば
良い。
【0067】次に第4の実施の形態について説明する。
【0068】第4の実施の形態は、第3の実施の形態に
おいて、学習方式記憶部14に記憶する複数の学習方式
として、第2の実施の形態のユーザ嗜好自動学習方式を
実現するアルゴリズムの多数のコピーを用いる。すなわ
ち、それぞれ同一の学習方式を用いているが、一般に、
ユーザ間重み,コンテンツ間重みの更新にあたって異な
る乱数が発生され、異なる重みの更新が行われていくの
で、特定の場面において異なる予測を行う複数の学習方
式となる。特に、乱数が発生されるのは、(x,y)と
(x’,y’)が類似していないという命題から、
(x,x’)が類似していないという命題と(y,
y’)が類似していないという命題のどちらを結論づけ
るかの曖昧性を解消するために行われるので、これらの
曖昧性に関して異なった結論を下した多数のコピーが共
存することになる。それらの予測値の、各学習方式の信
頼度を表す重みによる重み付き平均をもって実際の嗜好
度の予測を行うことにより、より高い精度の学習が可能
になるし、またそれらの予測値のばらつきを最大にする
ユーザ・コンテンツ対に対して質問を行うことにより情
報量の多い質問を実現することができる。
【0069】次に第5の実施の形態について説明する。
【0070】第5の実施の形態においては、第4の実施
の形態と同様に、学習方式記憶部14に記憶する複数の
学習方式として、第2の実施の形態のユーザ嗜好自動学
習方式を実現するアルゴリズムの多数のコピーを用い
る。また、第3および第4の実施の形態においては、予
測値のばらつきの多い対の発見については、多数の対を
生成し比較する方法を採用したが、この第5の実施の形
態においては、この予測値のばらつきの多い対の発見に
ついて或る特定の方法を用いる。
【0071】すなわち、複数のコンテンツとユーザの対
からなる質問対候補集合として、過去の学習データ中に
現れるユーザとコンテンツからなるユーザ・コンテンツ
対の中で、過去にデータとして嗜好度を与えられていな
い対の集合の全て又は一部を用いて、それらの中で最も
予測値のばらつきの大きいものについて質問を行う方法
である。
【0072】この方法は、f(x,y)とf(x’,
y’)が与えられて、その差が大きいことが判明したと
き生じる曖昧性、すなわちx,x’の類似度が低いの
か、y,y’の類似度が低いのかの曖昧性の具体的な解
消法として、f(x,y’)またはf(x’,y)の値
を質問により知ることが有効であるという知見に基づい
ている。すなわち、そのような対に対する質問は情報量
が多いので、その中で最も予測値のばらつきの大きい対
を選択して質問することにより、確実に情報量の大きい
質問を実現することが可能になる。
【0073】図7に第5の実施の形態の構成例を示す。
同図に示すように、本実施の形態は、学習データを逐次
的に入力する学習データ入力部11と、過去に与えられ
た学習データを一括して格納する学習データ格納部12
と、複数の学習方式14−1,14−2,…を格納する
学習方式記憶部14と、学習データ入力部11から入力
されたユーザ・コンテンツ対について、その嗜好度を各
学習方式14−1,14−2,…に予測させ、各学習方
式の信頼度を表す重みを用いて、それらの予測値の重み
付き平均値をとり、それを当該ユーザ・コンテンツ対の
予測値とする予測部13と、システム自らユーザ・コン
テンツ対を指定した質問を出し、そのユーザ・コンテン
ツ対に対する嗜好度の入力を受け取る質問部16と、学
習方式記憶部14に記憶された各学習方式14−1,1
4−2,…の現仮説および各学習方式の信頼度を表す重
みを更新する学習部15とから構成されている。
【0074】そして、各学習方式14−1,14−2
は、図1で説明したようなユーザ間重み記憶部3,コン
テンツ間重み記憶部4,予測部5および学習部6で構成
されている。第2の実施の形態のユーザ嗜好自動学習方
式の実装なので、学習部6は、乱数を用いてランダム
に、ユーザ間重み又はコンテンツ間重みを更新する。
【0075】なお、この第5の実施の形態の動作例は図
6に示したフローチャートと同じである。
【0076】図7において、利用者から1つのユーザ・
コンテンツ対が学習データ入力部11に入力されると
(ステップS11)、学習データ入力部11は、それを
予測部13に伝達する。予測部13は、伝達されたユー
ザ・コンテンツ対を各学習方式14−1,14−2,…
に与え、その嗜好度を予測させる。
【0077】各学習方式14−1,14−2,…におい
ては、その各々の予測部5が、学習データ格納部12に
格納された学習データ、自方式内のユーザ間重み記憶部
3に格納されたユーザ間重み及びコンテンツ間重み記憶
部4に格納されたコンテンツ間重みを用いて、そのユー
ザのそのコンテンツに対する嗜好度を予測する(ステッ
プS12)。つまり、式(1)に基づき、学習データ格
納部12に格納される過去の学習データの嗜好度の値
の、新たに与えられたユーザ・コンテンツ対との間のユ
ーザ間重みとコンテンツ間重みの積を重みとする、重み
つき平均を予測値とし、予測部13に返却する。
【0078】予測部13は、各学習方式14−1,14
−2,…の予測値と、各学習方式14−1,14−2,
…の現在の信頼度を表す重みとを用いて、前述した式1
8によって予測値を計算する(ステップS13)。
【0079】次いで、学習データ入力部11から上記ユ
ーザ・コンテンツ対の正しい嗜好度が入力されると(ス
テップS14)、それが学習データ格納部12に格納さ
れると共に(ステップS15)、学習部15に伝達され
る。学習部15は、伝達された嗜好度を各学習方式14
−1,14−2,…の学習部6に伝達し、各々のユーザ
間重み,コンテンツ間重みを更新させる(ステップS1
6)。このとき、各学習方式14−1,14−2,…に
おける学習部6は、前述した式(17)の確率で前述し
た式(2)等によってユーザ間重みを更新し、ユーザ間
重みを更新しない場合は前述した式(3)等によってコ
ンテンツ間重みを更新する。
【0080】学習部15は、各学習方式14−1,14
−2,…における学習と同時に、予測部13が使用する
各学習方式の信頼度を表す重みを前述した式(19)に
よって更新する(ステップS17)。
【0081】次に、質問部16は、複数のユーザ・コン
テンツ対からなる質問対候補集合として、学習データ格
納部12中に現れるユーザとコンテンツとからなるユー
ザ・コンテンツ対の中で、過去にデータとして嗜好度を
与えられていない対の集合の全て又は一部を用い、その
集合中の各対について各学習方式14−1,14−2,
…にその嗜好度を予測させ、その予測値のばらつきの最
も大きいユーザ・コンテンツ対の嗜好度を利用者に質問
する。なお、このとき各学習方式14−1,14−2,
…は予測部13からユーザ・コンテンツ対が与えられた
場合と同様にして予測を行う。次いで、質問部16は、
質問したユーザ・コンテンツ対に対して利用者から正し
い嗜好度が入力されると、それを学習データ格納部12
に格納すると共に(ステップS19)、それを学習部1
5に伝達する。
【0082】学習部15は、伝達された学習データの嗜
好度を各学習方式14−1,14−2,…の学習部6に
伝達し、各々のユーザ間重み,コンテンツ間重みを更新
させる(ステップS20)。このとき、各学習方式14
−1,14−2,…における学習部6は、前述した式
(17)の確率で前述した式(2)等によってユーザ間
重みを更新し、ユーザ間重みを更新しない場合は前述し
た式(3)等によってコンテンツ間重みを更新する。同
時に学習部15は、予測部13が使用する各学習方式の
信頼度を表す重みを前述した式(19)によって更新す
る(ステップS21)。
【0083】次に、嗜好度の予測および重み行列の更新
の具体例を説明する。例としては、簡単のために、学習
方式記憶部14に記憶された学習方式は、14−1と1
4−2の2つとする。また、図4に示すようにu1から
u5までの5人のユーザとc1からc7までの7つのコ
ンテンツとを想定し、学習データ格納部12における過
去の学習データを示すデータ行列Mの要素は全て未設定
(図4では?で示す)とする。更に、各学習方式14−
1,14−2のユーザ間重み記憶部3に設けられている
ユーザ間重み及びコンテンツ間重み記憶部4に設けられ
ているコンテンツ間重みはそれぞれ初期値1に設定され
ているものとする。更に、定数cは、−log0.8 に設
定、すなわちe-c=0.8 であり、dは2であるとする。
また、自分自身の重みu(x,x)、v(y,y)は更
新しないものとする。このとき、学習データとして、f
(u2,c3)=4が与えられ、この時点では質問する
対の候補が空集合なので質問はされず、次に学習データ
f(u4,c6)=1が与えられたとする。これらのデ
ータに対して、学習方式14−1,14−2におけるユ
ーザ間重み又はコンテンツ間重みは、例えば以下のよう
になる。
【0084】○学習方式14−1 1.f(u2,c3)=4 重みの更新なし。 2.f(u4,c6)=1
【数21】
【0085】○学習方式14−2 1.f(u2,c3)=4 重みの更新なし。 2.f(u4,c6)=1
【数22】
【0086】つまり、f(u4,c6)=1の学習デー
タに対して、学習方式14−1ではコンテンツ間重みを
更新し、学習方式14−2ではユーザ間重みを更新して
いる。
【0087】この段階において、質問する対の候補は、
(u2,c6)と(u4,c3)であり、その各々に対
する嗜好度の学習方式14−1,14−2による予測値
は以下のようになる。 1.f(u2,c6) (a)学習方式14−1
【数23】 (b)学習方式14−2
【数24】
【0088】2.f(u4,c3) (a)学習方式14−1
【数25】 (b)学習方式14−2
【数26】
【0089】この場合、両候補対に対する両学習方式1
4−1,14−2の予測値は、それぞれ2.67,2.33
と、2.33,2.67 であるので、両対とも同等にばらつき
を示しており、この段階においては、両対とも同等に情
報量が多いので、任意にどちらかの対を選択し質問を行
う。ここでは、(u2,c6)が選択されて質問が行わ
れたと仮定する。
【0090】次に、この段階までの各学習方式14−
1,14−2による上記のデータに対する予測値と、そ
の結果行われる各学習方式の信頼度を表す重みの更新を
以下に示す。なお、以下の例において、各学習方式Ai
の重みwi の初期値は1.0 とし、以下のように更新す
る。また、最初に与えられる対に対する予測は、嗜好度
の中間点である3点とする。
【0091】
【数27】
【0092】○学習方式14−1において 1.A1 (u2,c3)=3
【数28】 2.A1 (u4,c6)=4
【数29】 3.A1 (u2,c6)=2.33
【数30】
【0093】○学習方式14−2において 1.A2 (u2,c3)=3
【数31】 2.A2 (u4,c6)=4
【数32】 3.A2 (u2,c6)=2.33
【数33】
【0094】上記の例において、f(u2,c3)=4
およびf(u4,c6)=1が学習データとして与えら
れた段階で、u2,u4またはc3,c6のいずれかの
類似度が低いが、どちらかはわからないという曖昧性が
存在している。この曖昧性を、学習方式14−1と学習
方式14−2においてランダムに解消しているが、上記
の例においては、学習方式14−1においては、v
(3,6)を減らす方向に更新しており、学習方式14
−2においては、u(2,4)を減らす方向に更新して
いる(図3によればu2,u4は高い類似度をもってい
るので、学習方式14−1の方が正しい判定を下してい
る)。この結果、上記の例において選択された質問点に
対する両学習方式による予測値の誤差に差が生じ、結果
的に正しい曖昧性解消を行った学習方式14−1の方
が、重みが大きくなっており(すなわちw1 >w2 )、
次に与えられるユーザ・コンテンツ対に対する予測にお
いては、学習方式14−1の予測値の方が重んじられる
ことが分かる。
【0095】
【発明の効果】請求項1または2記載のユーザ嗜好自動
学習方式によれば、ノイズに対して頑健な帰納推論を実
現することが可能になると同時に、ユーザ間の類似度の
みを考慮する場合や、コンテンツ間の類似度のみを考慮
する従来方法に比べて、立上がりの早い学習が可能にな
る。
【0096】また、請求項3,4または5記載のユーザ
嗜好自動学習方式によれば、従来方法と比べて格段に少
ない数の質問数で、精度の良い学習を達成することが可
能になる。
【図面の簡単な説明】
【図1】本発明のユーザ嗜好自動学習方式の第1の実施
の形態の構成例を示すブロック図である。
【図2】本発明の第1の実施の形態の動作の一例を示す
フローチャートである。
【図3】嗜好度(ユーザ嗜好関数)の例を示す図であ
る。
【図4】過去の学習データの例を示す図である。
【図5】本発明のユーザ嗜好自動学習方式の第3の実施
の形態の構成例を示すブロック図である。
【図6】本発明の第3の実施の形態の動作の一例を示す
フローチャートである。
【図7】本発明の第5の実施の形態の構成例を示すブロ
ック図である。
【符号の説明】
1…学習データ入力部 2…学習データ格納部 3…ユーザ間重み記憶部 4…コンテンツ間重み記憶部 5…予測部 6…学習部 11…学習データ入力部 12…学習データ格納部 13…予測部 14…学習方式記憶部 14−1,14−2…学習方式 15…学習部 16…質問部
フロントページの続き (56)参考文献 早川和宏、鶴巻宏治、浜田洋,「ユー ザの利用履歴に基づくWWWサーバの類 似検索」,情報処理学会研究報告(95− IM−21),Vol.95,No.40, 1995年5月12日,p.11−17 中村篤祥、馬見塚拓、鳥羽弘康、安部 直樹,「ブール変数実数多項式による嗜 好関数の学習」、情報処理学会全国大会 講演論文集,Vol.52(第52回),N o.1,平成8年3月6日,p.1−55 〜1−56 (58)調査した分野(Int.Cl.6,DB名) G06F 17/30 JICSTファイル(JOIS)

Claims (5)

    (57)【特許請求の範囲】
  1. 【請求項1】 ニュース記事やホームページ等のコンテ
    ンツに対するユーザの嗜好を、データとして与えられた
    コンテンツとそのコンテンツに対するユーザの嗜好度を
    表す数値からなるデータを用いて学習する装置におい
    て、 ユーザ・コンテンツ対および該コンテンツに対する該ユ
    ーザの嗜好度を表す数値からなる学習データを入力する
    学習データ入力部と、 過去に与えられた学習データを一括して格納する学習デ
    ータ格納部と、 ユーザ間の類似度を表すユーザ間重みを格納するユーザ
    間重み記憶部と、 コンテンツ間の類似度を表すコンテンツ間重みを格納す
    るコンテンツ間重み記憶部と、 前記学習データ入力部に与えられたユーザ・コンテンツ
    対に対して、前記学習データ格納部に格納された学習デ
    ータ、前記ユーザ間重み記憶部に格納されたユーザ間重
    み、および前記コンテンツ間重み記憶部に格納されたコ
    ンテンツ間重みを用いて、そのユーザのそのコンテンツ
    に対する嗜好度を予測する予測部と、 前記学習データ入力部から入力された前記ユーザ・コン
    テンツ対の正しい嗜好度、前記学習データ格納部に格納
    された過去に与えられた学習データ、前記ユーザ間重み
    記憶部に格納されたユーザ間重み、および前記コンテン
    ツ間重み記憶部に格納されたコンテンツ間重みを用い
    て、前記ユーザ間重み記憶部に格納されたユーザ間重み
    および前記コンテンツ間重み記憶部に格納されたコンテ
    ンツ間重みを更新する学習部とを備え、 前記予測部における予測は、前記学習データ格納部に格
    納される過去の学習データの嗜好度の値の、新たに与え
    られたユーザ・コンテンツ対との間のユーザ間重みとコ
    ンテンツ間重みの積を重みとする、重みつき平均によっ
    て行われる構成を有し、 前記学習部における重み更新は、過去の学習データ中の
    各ユーザ・コンテンツ対に対して、新たに与えられたユ
    ーザ・コンテンツ対との間のユーザ間重みとコンテンツ
    間重みとの双方に対して行われ、且つ、ユーザ間重み
    は、過去の学習データ中のユーザ・コンテンツ対に対す
    る嗜好度と新たに与えられたユーザ・コンテンツ対に対
    する嗜好度との差と、前記コンテンツ間重みとの関数と
    して更新され、コンテンツ間重みは、過去の学習データ
    中のユーザ・コンテンツ対に対する嗜好度と新たに与え
    られたユーザ・コンテンツ対に対する嗜好度との差と、
    前記ユーザ間重みとの関数として更新される構成を有す
    ることを特徴とするユーザ嗜好自動学習方式。
  2. 【請求項2】 請求項1記載の学習部において、過去の
    学習データ中の各ユーザ・コンテンツ対に対して、新た
    に与えられたユーザ・コンテンツ対との間のユーザ間重
    みとコンテンツ間重みとの双方を更新するのに代えて、
    乱数を用いてランダムに、ユーザ間重み又はコンテンツ
    間重みを更新する構成を有することを特徴とする請求項
    1記載のユーザ嗜好自動学習方式。
  3. 【請求項3】 ニュース記事やホームページ等のコンテ
    ンツに対するユーザの嗜好を、データとして与えられた
    コンテンツとそのコンテンツに対するユーザの嗜好度を
    表す数値からなるデータを用いて学習する装置におい
    て、 ユーザ・コンテンツ対および該コンテンツに対する該ユ
    ーザの嗜好度を表す数値からなる学習データを入力する
    学習データ入力部と、 過去に与えられた学習データを一括して格納する学習デ
    ータ格納部と、 複数の学習方式を格納する学習方式記憶部と、 前記学習データ入力部に与えられたユーザ・コンテンツ
    対に対して、そのユーザのそのコンテンツに対する嗜好
    度を、前記学習方式記憶部に格納された各学習方式によ
    り予測させ、それらの予測値の、各学習方式に対する信
    頼度の重み付き平均値をもって予測する予測部と、 複数のユーザ・コンテンツ対からなる質問対候補集合の
    各ユーザ・コンテンツ対について、そのユーザのそのコ
    ンテンツに対する嗜好度を前記学習方式記憶部中の各学
    習方式により予測させて、最も予測値のばらつきの大き
    いユーザ・コンテンツ対の正しい嗜好度を質問してその
    値を得る質問部と、 前記学習データ入力部から入力された前記ユーザ・コン
    テンツ対の正しい嗜好度および前記質問部が質問して得
    た前記ユーザ・コンテンツ対の正しい嗜好度に基づい
    て、前記学習方式記憶部中の各学習方式の保持する仮説
    を更新すると共に、前記予測部が使用する各学習方式に
    対する信頼度を表す重みを、各重みの現在値および各学
    習方式の予測値と入力として与えられた正しい嗜好度と
    の差の関数として更新する学習部とを有することを特徴
    とするユーザ嗜好自動学習方式。
  4. 【請求項4】 前記学習方式記憶部に記憶される各学習
    方式が、請求項2記載のユーザ嗜好自動学習方式である
    請求項3記載のユーザ嗜好自動学習方式。
  5. 【請求項5】 前記質問部は、前記複数のユーザ・コン
    テンツ対からなる質問対候補集合として、過去の学習デ
    ータ中に現れるユーザとコンテンツとからなるユーザ・
    コンテンツ対の中で、過去にデータとして嗜好度を与え
    られていない対の集合の全て又は一部を用いる構成を有
    することを特徴とする請求項4記載のユーザ嗜好自動学
    習方式。
JP9048512A 1997-02-17 1997-02-17 ユーザ嗜好自動学習方式 Expired - Fee Related JP2962264B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP9048512A JP2962264B2 (ja) 1997-02-17 1997-02-17 ユーザ嗜好自動学習方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP9048512A JP2962264B2 (ja) 1997-02-17 1997-02-17 ユーザ嗜好自動学習方式

Publications (2)

Publication Number Publication Date
JPH10228487A JPH10228487A (ja) 1998-08-25
JP2962264B2 true JP2962264B2 (ja) 1999-10-12

Family

ID=12805433

Family Applications (1)

Application Number Title Priority Date Filing Date
JP9048512A Expired - Fee Related JP2962264B2 (ja) 1997-02-17 1997-02-17 ユーザ嗜好自動学習方式

Country Status (1)

Country Link
JP (1) JP2962264B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101792587B1 (ko) * 2009-01-23 2017-11-02 삼성전자주식회사 컨텐츠에 대한 선호도 예측 방법 및 장치와, 샘플 컨텐츠 선정 방법 및 장치

Families Citing this family (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6334127B1 (en) * 1998-07-17 2001-12-25 Net Perceptions, Inc. System, method and article of manufacture for making serendipity-weighted recommendations to a user
US6321221B1 (en) 1998-07-17 2001-11-20 Net Perceptions, Inc. System, method and article of manufacture for increasing the user value of recommendations
US6412012B1 (en) 1998-12-23 2002-06-25 Net Perceptions, Inc. System, method, and article of manufacture for making a compatibility-aware recommendations to a user
US7461058B1 (en) 1999-09-24 2008-12-02 Thalveg Data Flow Llc Optimized rule based constraints for collaborative filtering systems
US7788123B1 (en) 2000-06-23 2010-08-31 Ekhaus Michael A Method and system for high performance model-based personalization
JP4529058B2 (ja) * 2000-10-12 2010-08-25 ソニー株式会社 配信システム
JP4538934B2 (ja) * 2000-10-12 2010-09-08 ソニー株式会社 配信システム
US7259694B2 (en) * 2001-02-26 2007-08-21 International Business Machines Corporation Wireless communication system and method to provide geo-spatial related event data
US6825256B2 (en) 2002-01-14 2004-11-30 Crompton Corporation Stability improvement of carbon monoxide ethylene copolymer in pvc compound
JP2009265754A (ja) * 2008-04-22 2009-11-12 Ntt Docomo Inc 情報提供装置、情報提供方法及び情報提供プログラム

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
中村篤祥、馬見塚拓、鳥羽弘康、安部直樹,「ブール変数実数多項式による嗜好関数の学習」、情報処理学会全国大会講演論文集,Vol.52(第52回),No.1,平成8年3月6日,p.1−55〜1−56
早川和宏、鶴巻宏治、浜田洋,「ユーザの利用履歴に基づくWWWサーバの類似検索」,情報処理学会研究報告(95−IM−21),Vol.95,No.40,1995年5月12日,p.11−17

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101792587B1 (ko) * 2009-01-23 2017-11-02 삼성전자주식회사 컨텐츠에 대한 선호도 예측 방법 및 장치와, 샘플 컨텐츠 선정 방법 및 장치

Also Published As

Publication number Publication date
JPH10228487A (ja) 1998-08-25

Similar Documents

Publication Publication Date Title
US6401087B2 (en) Information retrieval system, apparatus and method for selecting databases using retrieval terms
US6321179B1 (en) System and method for using noisy collaborative filtering to rank and present items
US7769763B1 (en) Large scale machine learning systems and methods
JP4003468B2 (ja) 適合性フィードバックによる類似データ検索方法および装置
US6327590B1 (en) System and method for collaborative ranking of search results employing user and group profiles derived from document collection content analysis
US6915295B2 (en) Information searching method of profile information, program, recording medium, and apparatus
JP2962264B2 (ja) ユーザ嗜好自動学習方式
US8005774B2 (en) Determining a relevance function based on a query error derived using a structured output learning technique
US5787424A (en) Process and system for recursive document retrieval
Li et al. Fuzzy knowledge-based prediction through weighted rule interpolation
CN110033097B (zh) 基于多个数据域确定用户与物品的关联关系的方法及装置
KR20200000216A (ko) 단어자질을 강화한 음성 대화 방법 및 시스템
US7373021B2 (en) Image search program, information storage medium, image search apparatus and image search method
CN113221019A (zh) 基于即时学习的个性化推荐方法和系统
CN110008396B (zh) 对象信息推送方法、装置、设备及计算机可读存储介质
JP3085254B2 (ja) 情報物件推薦装置
CN106095941B (zh) 基于大数据知识库的解决方案推荐方法和系统
CN112328881B (zh) 文章推荐方法、装置、终端设备及存储介质
JP4194680B2 (ja) データ処理装置及びその方法、及びそのプログラムを記憶した記憶媒体
JPH0916627A (ja) 情報フィルタ装置及び情報フィルタ方法
JP2024006879A (ja) 情報処理システム、情報処理方法およびプログラム
JPH1063679A (ja) 情報提供装置
JP3547338B2 (ja) 情報検索方法及び装置
JP2003016106A (ja) 関連度値算出装置
WO2020085374A1 (ja) 熟練指数提供装置、熟練指数提供方法、及びプログラム

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20070806

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080806

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080806

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090806

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090806

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100806

Year of fee payment: 11

LAPS Cancellation because of no payment of annual fees