JP2962264B2

JP2962264B2 - ユーザ嗜好自動学習方式

Info

Publication number: JP2962264B2
Application number: JP9048512A
Authority: JP
Inventors: 直樹安倍
Original assignee: Nippon Electric Co Ltd
Current assignee: NEC Corp
Priority date: 1997-02-17
Filing date: 1997-02-17
Publication date: 1999-10-12
Anticipated expiration: 2017-02-17
Also published as: JPH10228487A

Description

【発明の詳細な説明】

【０００１】

【発明の属する技術分野】本発明は、コンピュータネッ
トワーク上等で、ニュース記事やホームページ等のコン
テンツ・サービスにおいて、個々のユーザの嗜好に合っ
たコンテンツを提供するためのユーザ嗜好の学習技術に
関するものである。

【０００２】

【従来の技術】コンピュータネットワーク上等で、ニュ
ース記事やホームページ等のコンテンツに対するユーザ
の嗜好を学習し、個々のユーザの嗜好に合ったコンテン
ツを提供する学習型ナビゲーション・システムにおい
て、コンピュータネットワーク上のコンテンツに対する
嗜好の学習法として従来知られている方法は、同一ユー
ザによる類似のコンテンツに対する過去の嗜好を基に予
測・学習する「コンテンツベース方式」と、同一コンテ
ンツに対する類似ユーザの嗜好を基に予測・学習する
「ユーザベース方式」とに大別できる。

【０００３】前者のコンテンツベース方式の例として
は、例えばカーネギーメロン大学のＫｅｎＬａｎｇに
よるニュース・ウィーダー（ＮｅｗｓＷｅｅｄｅｒ）が
知られており、Ｐｒｏｃｅｅｄｉｎｇｓｏｆｔｈｅ
１２ｔｈＩｎｔｅｒｎａｔｉｏｎａｌＣｏｎｆｅ
ｒｅｎｃｅｏｎＭａｃｈｉｎｅＬｅａｒｎｉｎｇ
に掲載の論文「ＮｅｗｓＷｅｅｄｅｒ：Ｌｅａｒｎｉｎ
ｇｔｏｆｉｌｔｅｒｎｅｔｎｅｗｓ」に詳細に掲載
されている。また、同じくコンテンツベース方式の例と
して、日本電気株式会社Ｃ＆Ｃ研究所の中村篤祥等によ
る逐次型学習方式もあり、第５２回情報処理学会全国大
会の予稿集掲載の論文「ブール変数実数多項式を用いた
嗜好関数の学習」に詳細に記載されている。

【０００４】後者のユーザベース方式の例としては、Ｍ
ＩＴのＰａｕｌＲｅｓｎｉｃｋ等による「グループ・
レンズ（ＧｒｏｕｐＬｅｎｓ）」が知られており、Ｐ
ｒｏｃｅｅｄｉｎｇｓｏｆＣＳＣＷ（１９９４）掲
載の論文「ＧｒｏｕｐＬｅｎｓ：ＡｎＯｐｅｎＡｒ
ｃｈｉｔｅｃｔｕｒｅｆｏｒＣｏｌｌａｂｏｒａｔ
ｉｖｅＦｉｌｔｅｒｉｎｇｏｆＮｅｔｎｅｗｓ」
に詳細に記載されている。

【０００５】

【発明が解決しようとする課題】近年、上記の二種類の
方式を融合し、類似するユーザの過去の嗜好の情報と、
類似するコンテンツに対する過去の嗜好の情報の両方を
利用し、ユーザの嗜好を学習・予測する方式の重要性が
強く認識されており、これを達成する有効な方式の発明
が待望されていた。本発明は、まさにこの条件を満た
す、具体的かつ有効な方式を提案するものである。

【０００６】

【課題を解決するための手段】

（Ａ）本発明のユーザ嗜好自動学習方式は、ニュース記
事やホームページ等のコンテンツに対するユーザの嗜好
を、データとして与えられたコンテンツとそのコンテン
ツに対するユーザの嗜好度を表す数値からなるデータを
用いて学習する装置において、ユーザ・コンテンツ対お
よび該コンテンツに対する該ユーザの嗜好度を表す数値
からなる学習データを入力する学習データ入力部と、過
去に与えられた学習データを一括して格納する学習デー
タ格納部と、ユーザ間の類似度を表すユーザ間重みを格
納するユーザ間重み記憶部と、コンテンツ間の類似度を
表すコンテンツ間重みを格納するコンテンツ間重み記憶
部と、前記学習データ入力部に与えられたユーザ・コン
テンツ対に対して、前記学習データ格納部に格納された
学習データ、前記ユーザ間重み記憶部に格納されたユー
ザ間重み、および前記コンテンツ間重み記憶部に格納さ
れたコンテンツ間重みを用いて、そのユーザのそのコン
テンツに対する嗜好度を予測する予測部と、前記学習デ
ータ入力部から入力された前記ユーザ・コンテンツ対の
正しい嗜好度、前記学習データ格納部に格納された過去
に与えられた学習データ、前記ユーザ間重み記憶部に格
納されたユーザ間重み、および前記コンテンツ間重み記
憶部に格納されたコンテンツ間重みを用いて、前記ユー
ザ間重み記憶部に格納されたユーザ間重みおよび前記コ
ンテンツ間重み記憶部に格納されたコンテンツ間重みを
更新する学習部とを備え、前記予測部における予測は、
前記学習データ格納部に格納される過去の学習データの
嗜好度の値の、新たに与えられたユーザ・コンテンツ対
との間のユーザ間重みとコンテンツ間重みの積を重みと
する、重みつき平均によって行われる構成を有し、前記
学習部における重み更新は、過去の学習データ中の各ユ
ーザ・コンテンツ対に対して、新たに与えられたユーザ
・コンテンツ対との間のユーザ間重みとコンテンツ間重
みとの双方に対して行われ、且つ、ユーザ間重みは、過
去の学習データ中のユーザ・コンテンツ対に対する嗜好
度と新たに与えられたユーザ・コンテンツ対に対する嗜
好度との差と、前記コンテンツ間重みとの関数として更
新され、コンテンツ間重みは、過去の学習データ中のユ
ーザ・コンテンツ対に対する嗜好度と新たに与えられた
ユーザ・コンテンツ対に対する嗜好度との差と、前記ユ
ーザ間重みとの関数として更新される構成を有する。

【０００７】上記（Ａ）のように構成された本発明のユ
ーザ嗜好自動学習方式にあっては、学習データ入力部か
らユーザ・コンテンツ対が入力されると、予測部が、そ
のユーザ・コンテンツ対に対して、学習データ格納部に
格納された過去の学習データ、ユーザ間重み記憶部に格
納されたユーザ間重み、およびコンテンツ間重み記憶部
に格納されたコンテンツ間重みを現在の仮説として、そ
のユーザのそのコンテンツに対する嗜好度の予測値とし
て、過去の学習データの嗜好度の値の、新たに与えられ
たユーザ・コンテンツ対との間のユーザ間重みとコンテ
ンツ間重みの積を重みとする、重みつき平均によって求
める。また、そのユーザ・コンテンツ対の正しい嗜好度
が学習データ入力部から入力されると、学習部が、この
正しい嗜好度、学習データ格納部に格納された過去に与
えられた学習データ、ユーザ間重み記憶部に格納された
現在のユーザ間重み、およびコンテンツ間重み記憶部に
格納された現在のコンテンツ間重みを用いて、ユーザ間
重み記憶部に格納されたユーザ間重みおよびコンテンツ
間重み記憶部に格納されたコンテンツ間重み、つまり現
在の仮説を更新する。具体的には、過去の学習データ中
の各ユーザ・コンテンツ対に対して、新たに与えられた
ユーザ・コンテンツ対との間のユーザ間重みとコンテン
ツ間重みとの双方を更新し、その際、ユーザ間重みは、
過去の学習データ中のユーザ・コンテンツ対に対する嗜
好度と新たに与えられたユーザ・コンテンツ対に対する
嗜好度との差と、前記コンテンツ間重みとの関数として
更新し、コンテンツ間重みは、過去の学習データ中のユ
ーザ・コンテンツ対に対する嗜好度と新たに与えられた
ユーザ・コンテンツ対に対する嗜好度との差と、前記ユ
ーザ間重みとの関数として更新する。このような重みの
更新を行うことにより、ユーザ間の類似度のみを考慮す
る場合や、コンテンツ間の類似度のみを考慮する場合に
比べて、立上がりの早い学習が可能となる。なお、以上
の動作例では、ユーザ・コンテンツ対が与えられたとき
に、その予測と学習とを行うようにしたが、これは毎回
学習を行ういわゆる逐次学習式の動作であり、別の動作
例として、学習中は予測を行わずに学習だけを行い、或
る程度学習が進んだ段階以降は、予測だけを行う所謂バ
ッチ式の動作を行わせることもできる。

【０００８】（Ｂ）また本発明の別のユーザ嗜好自動学
習方式は、前記の学習部において、過去の学習データ中
の各ユーザ・コンテンツ対に対して、新たに与えられた
ユーザ・コンテンツ対との間のユーザ間重みとコンテン
ツ間重みとの双方を更新するのに代えて、乱数を用いて
ランダムに、ユーザ間重み又はコンテンツ間重みを更新
する構成を有する。

【０００９】（Ｃ）更に本発明の別のユーザ嗜好自動学
習方式は、ニュース記事やホームページ等のコンテンツ
に対するユーザの嗜好を、データとして与えられたコン
テンツとそのコンテンツに対するユーザの嗜好度を表す
数値からなるデータを用いて学習する装置において、ユ
ーザ・コンテンツ対および該コンテンツに対する該ユー
ザの嗜好度を表す数値からなる学習データを入力する学
習データ入力部と、過去に与えられた学習データを一括
して格納する学習データ格納部と、複数の学習方式を格
納する学習方式記憶部と、前記学習データ入力部に与え
られたユーザ・コンテンツ対に対して、そのユーザのそ
のコンテンツに対する嗜好度を、前記学習方式記憶部に
格納された各学習方式により予測させ、それらの予測値
の、各学習方式に対する信頼度を表す重み付き平均値を
もって予測する予測部と、複数のユーザ・コンテンツ対
からなる質問対候補集合の各ユーザ・コンテンツ対につ
いて、そのユーザのそのコンテンツに対する嗜好度を前
記学習方式記憶部中の各学習方式により予測させて、最
も予測値のばらつきの大きいユーザ・コンテンツ対の正
しい嗜好度を質問してその値を得る質問部と、前記学習
データ入力部から入力された前記ユーザ・コンテンツ対
の正しい嗜好度および前記質問部が質問して得た前記ユ
ーザ・コンテンツ対の正しい嗜好度に基づいて、前記学
習方式記憶部中の各学習方式の保持する仮説を更新する
と共に、前記予測部が使用する各学習方式に対する信頼
度を表す重みを、各重みの現在値および各学習方式の予
測値と入力として与えられた正しい嗜好度との差の関数
として更新する学習部とを有する。

【００１０】上記（Ｃ）のように構成された本発明のユ
ーザ嗜好自動学習方式にあっては、学習データ入力部か
らユーザ・コンテンツ対が入力されると、予測部が、そ
のユーザ・コンテンツ対に対して、そのユーザのそのコ
ンテンツに対する嗜好度を、学習方式記憶部に格納され
た各学習方式により予測させてその予測値の重み付き平
均値をもって予測し、そのユーザ・コンテンツ対の正し
い嗜好度が学習データ入力部から入力されると、学習部
が、その正しい嗜好度に基づいて、学習方式記憶部中の
各学習方式の保持する仮説を更新すると共に、予測部が
使用する各学習方式に対する信頼度を表す重みを、各重
みの現在値および各学習方式の予測値と入力として与え
られた正しい嗜好度との差の関数として更新する。この
ように、各学習方式の仮説の更新と共に、各学習方式に
対する信頼度を表す重みの更新を行うことにより、学習
が進むにつれ、より信頼度の高い学習方式の予測値が大
きい影響力を持つようになり、少ない学習データによっ
て高い精度の予測が可能となる。

【００１１】他方、質問部は、システム自らが学習すべ
きユーザ・コンテンツ対を決定することにより、学習す
べきユーザ・コンテンツ対を入力する利用者の手間を削
減すると同時に、より効率的な学習を可能にする。つま
り、質問部は、複数のユーザ・コンテンツ対からなる質
問対候補集合中の各ユーザ・コンテンツ対について、そ
のユーザのそのコンテンツに対する嗜好度を学習方式記
憶部中の各学習方式により予測させて、最も予測値のば
らつきの大きいユーザ・コンテンツ対の正しい嗜好度を
質問してその値を取得する。そして、学習部が、質問部
が質問したユーザ・コンテンツ対について利用者が回答
した正しい嗜好度に基づいて、学習方式記憶部中の各学
習方式の保持する仮説を更新すると共に、予測部が使用
する各学習方式に対する信頼度を表す重みを、更新す
る。このように情報量の高いユーザ・コンテンツ対に基
づいて学習を進めることにより、少ない質問数で高い精
度の予測が可能となる。

【００１２】学習の順序は、学習データ入力部から１つ
のユーザ・コンテンツ対を入力してその予測を行った後
に、正しい嗜好度を学習データ入力部から入力して学習
するといった逐次式であっても良く、学習中は予測を行
わずに学習だけを行い、或る程度学習が進んだ段階以降
は、予測だけを行うバッチ式であっても良い。また、学
習データ入力部からの入力と質問部による質問との関係
については、学習データ入力部から１つのユーザ・コン
テンツ対の入力を受け、それを処理した後に、質問部で
可能であれば１つの質問を出すようにしても良く、複数
のユーザ・コンテンツ対の入力を学習データ入力部から
受け付け、それを処理した後に、質問部から幾つかの質
問を出すようにしても良い。

【００１３】（Ｄ）更に本発明の別のユーザ嗜好自動学
習方式は、上記（Ｃ）におけるユーザ嗜好自動学習方式
において、学習方式記憶部に格納する学習方式に上記
（Ｂ）で述べたユーザ嗜好自動学習方式を使用する。つ
まり、学習方式記憶部に格納される個々の学習方式は、
ユーザ間の類似度を表すユーザ間重みを格納するユーザ
間重み記憶部と、コンテンツ間の類似度を表すコンテン
ツ間重みを格納するコンテンツ間重み記憶部と、予測部
と、学習部とを含む。個々の学習方式における予測部
は、与えられたユーザ・コンテンツ対に対して、学習デ
ータ格納部に格納された学習データ、ユーザ間重み記憶
部に格納されたユーザ間重み、およびコンテンツ間重み
記憶部に格納されたコンテンツ間重みを用いて、そのユ
ーザのそのコンテンツに対する嗜好度を予測する。その
際、予測は、学習データ格納部に格納される過去の学習
データの嗜好度の値の、新たに与えられたユーザ・コン
テンツ対との間のユーザ間重みとコンテンツ間重みの積
を重みとする、重みつき平均によって行われる。また、
個々の学習方式における学習部は、ユーザ・コンテンツ
対の正しい嗜好度、学習データ格納部に格納された過去
に与えられた学習データ、ユーザ間重み記憶部に格納さ
れたユーザ間重み、およびコンテンツ間重み記憶部に格
納されたコンテンツ間重みを用いて、ユーザ間重み記憶
部に格納されたユーザ間重み，コンテンツ間重み記憶部
に格納されたコンテンツ間重みを更新する。その際、乱
数を用いてランダムに、ユーザ間重み又はコンテンツ間
重みを更新する。すなわち、学習方式記憶部中の学習方
式はそれぞれ同一の学習方式であるが、一般に、ユーザ
間重み，コンテンツ間重みの更新にあたって異なる乱数
が発生され、異なる重みの更新が行われていくので、実
質的には、特定の場面において異なる予測を行う複数の
学習方式となる。

【００１４】また更に本発明の別のユーザ嗜好自動学習
方式は、上記（Ｄ）のユーザ嗜好自動学習方式におい
て、前記質問部は、前記複数のユーザ・コンテンツ対か
らなる質問対候補集合として、過去の学習データ中に現
れるユーザとコンテンツとからなるユーザ・コンテンツ
対の中で、過去にデータとして嗜好度を与えられていな
い対の集合の全て又は一部を用いる構成を有する。

【００１５】

【発明の実施の形態】次に本発明の実施の形態の例につ
いて図面を参照して詳細に説明する。

【００１６】図１を参照すると、本発明のユーザ嗜好自
動学習方式の第１の実施の形態は、学習データ入力部１
と、学習データ格納部２と、ユーザ間重み記憶部３と、
コンテンツ間重み記憶部４と、予測部５と、学習部６と
から構成されている。これらは、例えばプログラム制御
されたＣＰＵ，キーボード等の入力装置，磁気ディスク
等の記憶装置を有するデータ処理装置（コンピュータ）
で実現することができる。

【００１７】学習データ入力部１は、学習データを逐次
的に入力する部分である。入力される学習データは、ユ
ーザ・コンテンツ対と、そのコンテンツに対するそのユ
ーザの正しい嗜好度を表す数値とから構成される。

【００１８】学習データ格納部２は過去に与えられた学
習データを一括して格納する部分、ユーザ間重み記憶部
３はユーザ間の類似度を表す重み行列（ユーザ間重みの
行列）を格納する部分、コンテンツ間重み記憶部４はコ
ンテンツ間の類似度を表す重み行列（コンテンツ間重み
の行列）を格納する部分である。

【００１９】予測部５は、学習データ入力部１から入力
されたユーザ・コンテンツ対について、そのユーザのそ
のコンテンツに対する嗜好度を予測する部分である。こ
の予測は、学習データ格納部２に格納されている過去の
学習データと、ユーザ間重み記憶部３に格納されている
ユーザ間重みと、コンテンツ間重み記憶部４に格納され
ているコンテンツ間重みを参照して行われる。

【００２０】学習部６は、学習データ入力部１から新た
な学習データ（ユーザ・コンテンツ対とその正しい嗜好
度を表す数値）が入力された場合に、入力されたユーザ
・コンテンツ対の正しい嗜好度、学習データ格納部２に
格納された過去に与えられた学習データ、ユーザ間重み
記憶部３に格納されたユーザ間重み、およびコンテンツ
間重み記憶部４に格納されたコンテンツ間重みを用い
て、ユーザ間重み記憶部３に格納されたユーザ間重み及
びコンテンツ間重み記憶部４に格納されたコンテンツ間
重みを更新する部分である。

【００２１】図２は本実施の形態の動作の一例を示すフ
ローチャートである。この動作例は、学習データ入力部
１から１つのユーザ・コンテンツ対を入力し、そのコン
テンツに対するそのユーザの嗜好度を予測部５において
予測し、学習データ入力部１からそのユーザ・コンテン
ツ対の正しい嗜好度を入力し、学習部６においてユーザ
間重み及びコンテンツ間重みを更新する、という処理を
繰り返す逐次式の学習を採った場合のものである。

【００２２】いま、ユーザの集合をＸ、コンテンツの集
合をＹとすると、本発明の第１の実施の形態において
は、以下のようなステップを実行する。（１）新しいユーザｘ∈Ｘと新しいコンテンツｙ∈Ｙの
対を学習データ入力部１にて入力する（ステップＳ
１）。（２）入力されたユーザｘとコンテンツｙの対につい
て、ユーザｘのコンテンツｙに対する嗜好度ｆ（ｘ，
ｙ）を、現在の仮説を用いて予測部５で予測する（ステ
ップＳ２）。ｆ（ｘ，ｙ）の値は一般に実数値であると
仮定する。例えば、５段階評価（１，２，…，５）等が
想定される。（３）ユーザｘのコンテンツｙに対する正しい嗜好度ｆ
（ｘ，ｙ）の値を学習データ入力部１にて入力し（ステ
ップＳ３）、学習データ格納部２に格納する（ステップ
Ｓ４）。（４）学習部６において現在の仮説を更新（学習）する
（ステップＳ５）。（５）学習を終了するか否かを判定し、終了しない場合
はステップＳ１に戻る（ステップＳ６）。

【００２３】予測・学習アルゴリズムの目標は、なるべ
く少ない数の学習データで、高い精度の予測を行うこと
にある。ステップＳ６で終了とする条件（停止条件）と
しては様々な条件が考えられるが、本発明については本
質的な影響はなく、また一般に適用環境に大きく依存す
るので、ここでは特に特定しない。なお、上記（１）〜
（４）を際限なく繰り返すようにしても良い。

【００２４】上記（２）の予測段階では、以下のような
仮説形式を用いる。まず、過去に与えられた正しい嗜好
度ｆ（ｘ，ｙ）の値がデータ行列Ｍとして学習データ格
納部２に格納されているものとする。このとき、過去に
ｆ（ｘ，ｙ）の値が与えられたｘ，ｙについては、Ｍ
（ｘ，ｙ）＝ｆ（ｘ，ｙ）であり、そうでないｘ，ｙに
ついては、Ｍ（ｘ，ｙ）＝＊である。ここで、＊は未設
定であることを示す。次に、任意のユーザの対（ｘ_1,ｘ
₂）∈Ｘ×Ｘに対して、それらユーザ間の類似度を表す
重みｕ（ｘ_1,ｘ₂）を記述したユーザ間の重み行列ｕ
を、ユーザ間重み記憶部３に設ける。同様に、任意のコ
ンテンツの対（ｙ_1,ｙ₂）∈Ｙ×Ｙに対して、それらコ
ンテンツ間の類似度を表す重みｖ（ｙ_1,ｙ₂）を記述し
たコンテンツ間の重み行列ｖを、コンテンツ間重み記憶
部４に設ける。現在の仮説とは、上記のデータ行列Ｍ
と、ユーザ間の重み行列ｕと、コンテンツ間の重み行列
ｖからなる。そして、新たに与えられた（ｘ，ｙ）∈Ｘ
×Ｙに対する嗜好度の予測は、データ行列Ｍに格納され
た全データによる重み付き平均をもって行う。ここで、
重み付き平均をとる場合の重みとしては、新しいユー
ザ，コンテンツ対をｘ，ｙ、データ行列Ｍ中のユーザ，
コンテンツ対をｘ’，ｙ’とすると、ユーザ間の重みと
コンテンツ間の重みの積、ｕ（ｘ，ｘ’）・ｖ（ｙ，
ｙ’）を用いる。すなわち、新しい対（ｘ，ｙ）の嗜好
の予測値ｆ＾（ｘ，ｙ）を以下のように計算する。

【００２５】

【数１】

【００２６】重みとしてユーザ間の重みとコンテンツ間
の重みの積を用いているのは、以下のような意味があ
る。ｆ（ｘ’，ｙ’）の値がｆ（ｘ，ｙ）の値と近い値
をとるのは、ｘ，ｘ’と、ｙ，ｙ’が両方とも高い類似
度を持つ場合に限るので、（ｘ，ｙ）と（ｘ’，ｙ’）
が類似するという命題は、ｘ，ｘ’が類似するという命
題と、ｙ，ｙ’が類似するという命題との論理積である
と考えられる。しかし、ノイズを含む環境からのしかも
不完全なデータから学習を行う場合には論理的な推論は
危険なので、ここでは、論理積の代わりに、類似度を表
す重みによる実数積を用いている。そうすることによ
り、ノイズに対する頑健性を備えた予測を実現してい
る。

【００２７】次に学習の手順、すなわち現在の仮説を更
新する手順について説明する。今、新しい対ｘ，ｙに対
する嗜好度の正解ｆ（ｘ，ｙ）を与えられたとする。過
去に与えられた各正解ｆ（ｘ’，ｙ’）に対して、もし
｜ｆ（ｘ，ｙ）−ｆ（ｘ’，ｙ’）｜が大きい値をとる
ならば、（ｘ，ｙ）と（ｘ’，ｙ’）が類似していると
いう命題が否定されることになる。上記の観察から、こ
れは、（ｘ，ｘ’）が類似しているという命題と（ｙ，
ｙ’）が類似しているという命題の論理積が否定された
ことになるから、（ｘ，ｘ’）が類似していないという
命題と（ｙ，ｙ’）が類似していないという命題のどち
らかが正しいことになる。しかし、そのどちらが正しい
かは、これだけの情報からは特定できない。そこで、過
去のデータにより学習された（ｘ，ｘ’）の類似度の推
定値ｕ（ｘ，ｘ’）と、（ｙ，ｙ’）の類似度の推定値
ｖ（ｙ，ｙ’）を参照して以下のような推論を行う。す
なわち、もしｕ（ｘ，ｘ’）の値が大きく（ｘ，ｘ’）
が類似しているという証拠が強いならば、新しく与えら
れた命題は、（ｙ，ｙ’）が類似していないという命題
を指示し、また逆に、ｖ（ｙ，ｙ’）の値が大きく
（ｙ，ｙ’）が類似しているという証拠が強いならば、
（ｘ，ｘ’）が類似していないという命題を指示する。
上記の「大きい」や「強い」という判断は、閾値等を用
いて論理値として推論することも可能であるが、ノイズ
を含んだ環境からの不完全なデータを用いた学習におい
てはそれは危険であるので、｜ｆ（ｘ，ｙ）−ｆ
（ｘ’，ｙ’）｜の大きさとｕ（ｘ，ｘ’）の値の大き
さによって連続的にｖ（ｙ，ｙ’）の更新幅を決定し、
また｜ｆ（ｘ，ｙ）−ｆ（ｘ’，ｙ’）｜の大きさとｖ
（ｙ，ｙ’）の値の大きさによって連続的にｕ（ｘ，
ｘ’）の更新幅を決定する。例えば、ユーザ間の重みｕ
は以下のように更新し、

【００２８】

【数２】

【００２９】コンテンツ間の重みｖは以下のように更新
する。

【００３０】

【数３】

【００３１】なお、上式のｃ，ｄは正の定数である。ｃ
は学習レートと呼ばれデータ数に依存して変化させるこ
とも可能である。ｄには｜ｆ（ｘ’，ｙ’）−ｆ（ｘ，
ｙ）｜の平均値の推定値等を用いるのが適当である。ま
た、以上の更新を行う際に、一回の更新における重みの
変化量の上限を指定することも可能である。例えば、ユ
ーザ間の重みｕは以下のように更新し、

【００３２】

【数４】

【００３３】コンテンツ間の重みｖは以下のように更新
しても良い。

【００３４】

【数５】

【００３５】また、アンダーフロー等の問題を避けるた
めに、重みの更新を行う度に、以下のように正規化を行
っても良い。

【００３６】

【数６】

【００３７】

【数７】

【００３８】上のような重みの更新法を用いることによ
り、ノイズに対する頑健な帰納推論を実現することが可
能になると同時に、ユーザ間の類似度のみを考慮する場
合や、コンテンツ間の類似度のみを考慮する場合に比べ
て、立上がりの早い学習が可能となる。

【００３９】次に、嗜好度の予測および重み行列の更新
の具体例を説明する。例としては、図４に示すようにｕ
１からｕ５までの５人のユーザとｃ１からｃ７までの７
つのコンテンツとを想定し、学習データ格納部２におけ
る過去の学習データを示すデータ行列Ｍの要素が全て未
設定（図４では？で示す）である状態において、ｆ（ｕ
２，ｃ３）＝４、ｆ（ｕ４，ｃ３）＝４、ｆ（ｕ２，ｃ
６）＝１、ｆ（ｕ４，ｃ６）＝１の順序で学習データが
与えられたものとする。また、ユーザ間重み記憶部３に
設けられているユーザ間重み及びコンテンツ間重み記憶
部４に設けられているユーザ間重みはそれぞれ初期値１
に設定されているものとする。更に、定数ｃは、−ｌｏ
ｇ0.8 に設定、すなわちｅ^-c＝0.8 であり、ｄは２であ
るとする。また、自分自身の重みｕ（ｘ，ｘ）、ｖ
（ｙ，ｙ）は更新しないものとする。このとき、各学習
データが与えられた後の嗜好度の予測値および重みの更
新は以下のようになる。

【００４０】１．ｆ（ｕ２，ｃ３）＝４この場合、過去の学習データが存在しないため、重みの
更新はない。また、嗜好度の予測値は任意のものとな
る。

【００４１】２．ｆ（ｕ４，ｃ３）＝４ ○嗜好度の予測値

【数８】 ○重みの更新（ａ）（ｕ２，ｃ３）ｖ．ｓ．（ｕ４，ｃ３）

【数９】

【００４２】３．ｆ（ｕ２，ｃ６）＝１ ○嗜好度の予測値

【数１０】 ○重みの更新（ａ）（ｕ４，ｃ３）ｖ．ｓ．（ｕ２，ｃ６）

【数１１】（ｂ）（ｕ２，ｃ３）ｖ．ｓ．（ｕ２，ｃ６）

【数１２】

【００４３】４．ｆ（ｕ４，ｃ６）＝１ ○嗜好度の予測値

【数１３】 ○重みの更新（ａ）（ｕ２，ｃ３）ｖ．ｓ．（ｕ４，ｃ６）

【数１４】（ｂ）（ｕ４，ｃ３）ｖ．ｓ．（ｕ４，ｃ６）

【数１５】（ｃ）（ｕ２，ｃ６）ｖ．ｓ．（ｕ４，ｃ６）

【数１６】

【００４４】以下、学習データが順次与えられる毎に重
みの更新が行われ、それに応じて嗜好度の予測値の精度
が高まっていく。図３に嗜好度の例（ユーザ嗜好関数の
例）を示す。この例のユーザ嗜好関数では、例えば、コ
ンテンツｃ１とコンテンツｃ３に対する各ユーザｕ１〜
ｕ５の嗜好度が類似していることから、コンテンツｃ１
とコンテンツｃ３は高い類似度であることがわかる。ま
た、各コンテンツｃ１〜ｃ７に対するユーザｕ２の嗜好
度とユーザｕ４の嗜好度が類似していることから、ユー
ザｕ２とユーザｕ４とが高い類似度であることがわか
る。

【００４５】次に本発明の第２の実施の形態について説
明する。

【００４６】上述した第１の実施の形態においては、新
しいユーザ・コンテンツ対に対する嗜好の正解を与えら
れる度に、ユーザ間の重みｕと、コンテンツ間の重みｖ
との両方を更新するが、この第２の実施の形態において
は、乱数を用いてランダムにそのどちらか一方を第１の
実施の形態における更新式等を用いて更新する。それ以
外は第１の実施の形態と基本的に同じである。このと
き、各更新を確率２分の１で行うことも可能であるが、
関連する重みに依存した確率でランダムに行うことも可
能である。例えば、各ユーザ間の重みｕ（ｘ，ｘ’）の
更新を以下の確率ｐで行い、ユーザ間の重みが更新され
ない場合（即ち確率１−ｐ）、コンテンツ間の重みｖ
（ｙ，ｙ’）を更新することが考えられる。

【００４７】

【数１７】

【００４８】次に本発明の第３の実施の形態について説
明する。

【００４９】図５を参照すると、本発明のユーザ嗜好自
動学習方式の第３の実施の形態は、学習データ入力部１
１と、学習データ格納部１２と、予測部１３と、学習方
式記憶部１４と、学習部１５と、質問部１６とから構成
されている。これらは、例えばプログラム制御されたＣ
ＰＵ，キーボード等の入力装置，磁気ディスク等の記憶
装置，ディスプレイ装置などを有するデータ処理装置
（コンピュータ）で実現することができる。

【００５０】学習データ入力部１１は、学習データを逐
次的に入力する部分である。入力される学習データは、
ユーザ・コンテンツ対と、そのコンテンツに対するその
ユーザの正しい嗜好度を表す数値とから構成される。

【００５１】学習データ格納部１２は過去に与えられた
学習データを一括して格納する部分である。

【００５２】学習方式記憶部１４は、複数の学習方式を
格納する部分である。ここで、各学習方式は、与えられ
たユーザ・コンテンツ対に対して、そのユーザのそのコ
ンテンツに対する嗜好度を現在の仮説に基づいて予測す
る機能と、そのユーザのそのコンテンツ対に対する正し
い嗜好度に基づき現仮説を更新（学習）する機能とを持
つ。

【００５３】予測部１３は、学習データ入力部１１から
入力されたユーザ・コンテンツ対について、そのユーザ
のそのコンテンツに対する嗜好度を予測する部分であ
る。この予測は、そのユーザのそのコンテンツに対する
嗜好度を、学習方式記憶部１４に格納された各学習方式
により予測させ、各学習方式に対する現在の信頼度を表
す重みを用いて、それらの予測値の重み付き平均値をと
ることで行われる。

【００５４】質問部１６は、システム自らユーザ・コン
テンツ対を指定した質問を出し、そのユーザ・コンテン
ツ対に対する嗜好度の入力を受け取る部分である。質問
は例えばディスプレイの画面に出され、回答はキーボー
ドや画面上から入力される。

【００５５】学習部１５は、学習方式記憶部１４に記憶
された各学習方式の現仮説および各学習方式の信頼度を
表す重みを更新する部分である。

【００５６】図６は本実施の形態の動作の一例を示すフ
ローチャートである。この動作例では、学習データ入力
部１１から１つのユーザ・コンテンツ対を入力し、その
コンテンツに対するそのユーザの嗜好度を予測部１３に
おいて予測し、次いで学習データ入力部１１からそのユ
ーザ・コンテンツ対の正しい嗜好度を入力して学習部１
５において各学習方式の現仮説および各学習方式の信頼
度を表す重みを更新し、そして、質問部１６において可
能であれば１つのユーザ・コンテンツ対の嗜好度を質問
し、その回答に応じて学習部１５において各学習方式の
現仮説および各学習方式の信頼度を表す重みを更新す
る、という処理を繰り返す逐次式の学習を行う。以下、
本実施の形態について詳述する。

【００５７】いま、ユーザの集合をＸ、コンテンツの集
合をＹとすると、本実施の形態においては、図６に示さ
れるように、以下のようなステップを実行する。（１）新しいユーザｘ∈Ｘと新しいコンテンツｙ∈Ｙの
対を学習データ入力部１１にて入力する（ステップＳ１
１）。（２）入力されたユーザｘとコンテンツｙの対につい
て、ユーザｘのコンテンツｙに対する嗜好度ｆ（ｘ，
ｙ）を、予測部１３が学習方式記憶部１４に格納された
複数の学習方式による予測値および各学習方式の現在の
信頼度を表す重みを用いて予測する（ステップ１２，１
３）。ｆ（ｘ，ｙ）の値は一般に実数値であると仮定す
る。例えば、５段階評価（１，２，…，５）等が想定さ
れる。（３）ユーザｘのコンテンツｙに対する正しい嗜好度ｆ
（ｘ，ｙ）の値を学習データ入力部１１にて入力し（ス
テップＳ１４）、学習データ格納部１２に格納する（ス
テップＳ１５）。（４）ステップＳ１４で入力された正しい嗜好度に基づ
き、学習部６において複数の学習方式の現在の仮説を更
新（学習）し（ステップＳ１６）、また、各学習方式の
信頼度を表す重みを更新する（ステップＳ１７）。（５）質問部１６において、複数の学習方式の現在の仮
説を用いて、嗜好度を質問すべき新たなユーザｘ’とコ
ンテンツｙ’の対を求め、その対に対する正しい嗜好度
をユーザから入力として得る（ステップＳ１８）。（６）上記ユーザｘ’とコンテンツｙ’の対，その正し
い嗜好度から構成される学習データを学習データ格納部
１２に格納する（ステップＳ１９）。（７）ステップＳ１８で入力された正しい嗜好度に基づ
き、学習部６において複数の学習方式の現在の仮説を更
新（学習）し（ステップＳ２０）、また、各学習方式の
信頼度を表す重みを更新する（ステップＳ２１）。（８）学習を終了するか否かを判定し、終了しない場合
はステップＳ１１に戻る（ステップＳ２２）。

【００５８】予測・学習アルゴリズムの目標は、なるべ
く少ない数の学習データおよび質問数で、高い精度の予
測を行うことにある。ステップＳ２２で終了とする条件
（停止条件）としては、或る一定の学習精度か達成され
たこと等の様々な条件が考えられるが、本発明について
は本質的な影響はなく、また一般に適用環境に大きく依
存するので、ここでは特に特定しない。なお、上記
（１）〜（７）を際限なく繰り返すようにしても良い。

【００５９】本実施の形態において、少ない学習データ
による高い精度の予測に関しては、学習方式記憶部１４
に記憶された複数の学習方式にそれぞれ与えられたユー
ザ・コンテンツ対における嗜好度を予測させて、それら
の学習方式の信頼度を表す重みを用いた重み付け平均等
で予測を行うことで達成される。すなわち、各学習方式
による予測値をＡ_i（ｘ，ｙ）、その重みをｗ_iとし
て、ｆ（ｘ，ｙ）の値を以下のｆ＾（ｘ，ｙ）をもって
予測する。

【００６０】

【数１８】

【００６１】なお、（ｘ，ｙ）に対する正しい嗜好度ｆ
（ｘ，ｙ）が入力として与えられたとき、各学習方式Ａ
_iの重みｗ_iは以下のように更新される。

【００６２】

【数１９】

【００６３】以上のような重み更新により、学習が進む
と共に、より信頼度の高い学習方式の予測値が大きい影
響力を持つようになる。

【００６４】次に、少ない数の質問数での高い精度の予
測を行うためには、情報量の高いユーザ・コンテンツ対
についてその嗜好度を質問することが必要になる。この
ために、学習方式記憶部１４に記憶された複数の学習方
式の予測値がばらついているユーザ・コンテンツ対を発
見し、その対に対する嗜好度を質問する。或るユーザ・
コンテンツ対に対する予測値のばらつきは、予測値の分
散または予測値の重み付き平均嗜好度に対する自乗誤差
の、各学習方式の重みを用いた重み付き平均等によって
測ることができる。予測値のばらつきの多い対を発見す
る方法については、例えば乱数を用いて発生された多数
のユーザ・コンテンツ対の中から、予測値が上記の意味
で最もばらついている対を選んで質問するといった方法
が採用できる。すなわち、質問に用いるユーザ・コンテ
ンツ対（ｘ^*，ｙ^*）は、候補として考慮されるユーザ
・コンテンツ対の集合をＰとして、以下のように求める
ことができる。

【００６５】

【数２０】

【００６６】なお、求めたユーザ・コンテンツ対が既に
学習データに存在する場合には、次点以降の候補の中か
ら学習データに存在しない対の候補の質問を選択すれば
良い。

【００６７】次に第４の実施の形態について説明する。

【００６８】第４の実施の形態は、第３の実施の形態に
おいて、学習方式記憶部１４に記憶する複数の学習方式
として、第２の実施の形態のユーザ嗜好自動学習方式を
実現するアルゴリズムの多数のコピーを用いる。すなわ
ち、それぞれ同一の学習方式を用いているが、一般に、
ユーザ間重み，コンテンツ間重みの更新にあたって異な
る乱数が発生され、異なる重みの更新が行われていくの
で、特定の場面において異なる予測を行う複数の学習方
式となる。特に、乱数が発生されるのは、（ｘ，ｙ）と
（ｘ’，ｙ’）が類似していないという命題から、
（ｘ，ｘ’）が類似していないという命題と（ｙ，
ｙ’）が類似していないという命題のどちらを結論づけ
るかの曖昧性を解消するために行われるので、これらの
曖昧性に関して異なった結論を下した多数のコピーが共
存することになる。それらの予測値の、各学習方式の信
頼度を表す重みによる重み付き平均をもって実際の嗜好
度の予測を行うことにより、より高い精度の学習が可能
になるし、またそれらの予測値のばらつきを最大にする
ユーザ・コンテンツ対に対して質問を行うことにより情
報量の多い質問を実現することができる。

【００６９】次に第５の実施の形態について説明する。

【００７０】第５の実施の形態においては、第４の実施
の形態と同様に、学習方式記憶部１４に記憶する複数の
学習方式として、第２の実施の形態のユーザ嗜好自動学
習方式を実現するアルゴリズムの多数のコピーを用い
る。また、第３および第４の実施の形態においては、予
測値のばらつきの多い対の発見については、多数の対を
生成し比較する方法を採用したが、この第５の実施の形
態においては、この予測値のばらつきの多い対の発見に
ついて或る特定の方法を用いる。

【００７１】すなわち、複数のコンテンツとユーザの対
からなる質問対候補集合として、過去の学習データ中に
現れるユーザとコンテンツからなるユーザ・コンテンツ
対の中で、過去にデータとして嗜好度を与えられていな
い対の集合の全て又は一部を用いて、それらの中で最も
予測値のばらつきの大きいものについて質問を行う方法
である。

【００７２】この方法は、ｆ（ｘ，ｙ）とｆ（ｘ’，
ｙ’）が与えられて、その差が大きいことが判明したと
き生じる曖昧性、すなわちｘ，ｘ’の類似度が低いの
か、ｙ，ｙ’の類似度が低いのかの曖昧性の具体的な解
消法として、ｆ（ｘ，ｙ’）またはｆ（ｘ’，ｙ）の値
を質問により知ることが有効であるという知見に基づい
ている。すなわち、そのような対に対する質問は情報量
が多いので、その中で最も予測値のばらつきの大きい対
を選択して質問することにより、確実に情報量の大きい
質問を実現することが可能になる。

【００７３】図７に第５の実施の形態の構成例を示す。
同図に示すように、本実施の形態は、学習データを逐次
的に入力する学習データ入力部１１と、過去に与えられ
た学習データを一括して格納する学習データ格納部１２
と、複数の学習方式１４−１，１４−２，…を格納する
学習方式記憶部１４と、学習データ入力部１１から入力
されたユーザ・コンテンツ対について、その嗜好度を各
学習方式１４−１，１４−２，…に予測させ、各学習方
式の信頼度を表す重みを用いて、それらの予測値の重み
付き平均値をとり、それを当該ユーザ・コンテンツ対の
予測値とする予測部１３と、システム自らユーザ・コン
テンツ対を指定した質問を出し、そのユーザ・コンテン
ツ対に対する嗜好度の入力を受け取る質問部１６と、学
習方式記憶部１４に記憶された各学習方式１４−１，１
４−２，…の現仮説および各学習方式の信頼度を表す重
みを更新する学習部１５とから構成されている。

【００７４】そして、各学習方式１４−１，１４−２
は、図１で説明したようなユーザ間重み記憶部３，コン
テンツ間重み記憶部４，予測部５および学習部６で構成
されている。第２の実施の形態のユーザ嗜好自動学習方
式の実装なので、学習部６は、乱数を用いてランダム
に、ユーザ間重み又はコンテンツ間重みを更新する。

【００７５】なお、この第５の実施の形態の動作例は図
６に示したフローチャートと同じである。

【００７６】図７において、利用者から１つのユーザ・
コンテンツ対が学習データ入力部１１に入力されると
（ステップＳ１１）、学習データ入力部１１は、それを
予測部１３に伝達する。予測部１３は、伝達されたユー
ザ・コンテンツ対を各学習方式１４−１，１４−２，…
に与え、その嗜好度を予測させる。

【００７７】各学習方式１４−１，１４−２，…におい
ては、その各々の予測部５が、学習データ格納部１２に
格納された学習データ、自方式内のユーザ間重み記憶部
３に格納されたユーザ間重み及びコンテンツ間重み記憶
部４に格納されたコンテンツ間重みを用いて、そのユー
ザのそのコンテンツに対する嗜好度を予測する（ステッ
プＳ１２）。つまり、式（１）に基づき、学習データ格
納部１２に格納される過去の学習データの嗜好度の値
の、新たに与えられたユーザ・コンテンツ対との間のユ
ーザ間重みとコンテンツ間重みの積を重みとする、重み
つき平均を予測値とし、予測部１３に返却する。

【００７８】予測部１３は、各学習方式１４−１，１４
−２，…の予測値と、各学習方式１４−１，１４−２，
…の現在の信頼度を表す重みとを用いて、前述した式１
８によって予測値を計算する（ステップＳ１３）。

【００７９】次いで、学習データ入力部１１から上記ユ
ーザ・コンテンツ対の正しい嗜好度が入力されると（ス
テップＳ１４）、それが学習データ格納部１２に格納さ
れると共に（ステップＳ１５）、学習部１５に伝達され
る。学習部１５は、伝達された嗜好度を各学習方式１４
−１，１４−２，…の学習部６に伝達し、各々のユーザ
間重み，コンテンツ間重みを更新させる（ステップＳ１
６）。このとき、各学習方式１４−１，１４−２，…に
おける学習部６は、前述した式（１７）の確率で前述し
た式（２）等によってユーザ間重みを更新し、ユーザ間
重みを更新しない場合は前述した式（３）等によってコ
ンテンツ間重みを更新する。

【００８０】学習部１５は、各学習方式１４−１，１４
−２，…における学習と同時に、予測部１３が使用する
各学習方式の信頼度を表す重みを前述した式（１９）に
よって更新する（ステップＳ１７）。

【００８１】次に、質問部１６は、複数のユーザ・コン
テンツ対からなる質問対候補集合として、学習データ格
納部１２中に現れるユーザとコンテンツとからなるユー
ザ・コンテンツ対の中で、過去にデータとして嗜好度を
与えられていない対の集合の全て又は一部を用い、その
集合中の各対について各学習方式１４−１，１４−２，
…にその嗜好度を予測させ、その予測値のばらつきの最
も大きいユーザ・コンテンツ対の嗜好度を利用者に質問
する。なお、このとき各学習方式１４−１，１４−２，
…は予測部１３からユーザ・コンテンツ対が与えられた
場合と同様にして予測を行う。次いで、質問部１６は、
質問したユーザ・コンテンツ対に対して利用者から正し
い嗜好度が入力されると、それを学習データ格納部１２
に格納すると共に（ステップＳ１９）、それを学習部１
５に伝達する。

【００８２】学習部１５は、伝達された学習データの嗜
好度を各学習方式１４−１，１４−２，…の学習部６に
伝達し、各々のユーザ間重み，コンテンツ間重みを更新
させる（ステップＳ２０）。このとき、各学習方式１４
−１，１４−２，…における学習部６は、前述した式
（１７）の確率で前述した式（２）等によってユーザ間
重みを更新し、ユーザ間重みを更新しない場合は前述し
た式（３）等によってコンテンツ間重みを更新する。同
時に学習部１５は、予測部１３が使用する各学習方式の
信頼度を表す重みを前述した式（１９）によって更新す
る（ステップＳ２１）。

【００８３】次に、嗜好度の予測および重み行列の更新
の具体例を説明する。例としては、簡単のために、学習
方式記憶部１４に記憶された学習方式は、１４−１と１
４−２の２つとする。また、図４に示すようにｕ１から
ｕ５までの５人のユーザとｃ１からｃ７までの７つのコ
ンテンツとを想定し、学習データ格納部１２における過
去の学習データを示すデータ行列Ｍの要素は全て未設定
（図４では？で示す）とする。更に、各学習方式１４−
１，１４−２のユーザ間重み記憶部３に設けられている
ユーザ間重み及びコンテンツ間重み記憶部４に設けられ
ているコンテンツ間重みはそれぞれ初期値１に設定され
ているものとする。更に、定数ｃは、−ｌｏｇ0.8 に設
定、すなわちｅ^-c＝0.8 であり、ｄは２であるとする。
また、自分自身の重みｕ（ｘ，ｘ）、ｖ（ｙ，ｙ）は更
新しないものとする。このとき、学習データとして、ｆ
（ｕ２，ｃ３）＝４が与えられ、この時点では質問する
対の候補が空集合なので質問はされず、次に学習データ
ｆ（ｕ４，ｃ６）＝１が与えられたとする。これらのデ
ータに対して、学習方式１４−１，１４−２におけるユ
ーザ間重み又はコンテンツ間重みは、例えば以下のよう
になる。

【００８４】○学習方式１４−１１．ｆ（ｕ２，ｃ３）＝４重みの更新なし。２．ｆ（ｕ４，ｃ６）＝１

【数２１】

【００８５】○学習方式１４−２１．ｆ（ｕ２，ｃ３）＝４重みの更新なし。２．ｆ（ｕ４，ｃ６）＝１

【数２２】

【００８６】つまり、ｆ（ｕ４，ｃ６）＝１の学習デー
タに対して、学習方式１４−１ではコンテンツ間重みを
更新し、学習方式１４−２ではユーザ間重みを更新して
いる。

【００８７】この段階において、質問する対の候補は、
（ｕ２，ｃ６）と（ｕ４，ｃ３）であり、その各々に対
する嗜好度の学習方式１４−１，１４−２による予測値
は以下のようになる。１．ｆ（ｕ２，ｃ６）（ａ）学習方式１４−１

【数２３】（ｂ）学習方式１４−２

【数２４】

【００８８】２．ｆ（ｕ４，ｃ３）（ａ）学習方式１４−１

【数２５】（ｂ）学習方式１４−２

【数２６】

【００８９】この場合、両候補対に対する両学習方式１
４−１，１４−２の予測値は、それぞれ２.67,２.33
と、２.33,２.67 であるので、両対とも同等にばらつき
を示しており、この段階においては、両対とも同等に情
報量が多いので、任意にどちらかの対を選択し質問を行
う。ここでは、（ｕ２，ｃ６）が選択されて質問が行わ
れたと仮定する。

【００９０】次に、この段階までの各学習方式１４−
１，１４−２による上記のデータに対する予測値と、そ
の結果行われる各学習方式の信頼度を表す重みの更新を
以下に示す。なお、以下の例において、各学習方式Ａ_i
の重みｗ_iの初期値は1.0 とし、以下のように更新す
る。また、最初に与えられる対に対する予測は、嗜好度
の中間点である３点とする。

【００９１】

【数２７】

【００９２】○学習方式１４−１において１．Ａ₁（ｕ２，ｃ３）＝３

【数２８】２．Ａ₁（ｕ４，ｃ６）＝４

【数２９】３．Ａ₁（ｕ２，ｃ６）＝２.33

【数３０】

【００９３】○学習方式１４−２において１．Ａ₂（ｕ２，ｃ３）＝３

【数３１】２．Ａ₂（ｕ４，ｃ６）＝４

【数３２】３．Ａ₂（ｕ２，ｃ６）＝２.33

【数３３】

【００９４】上記の例において、ｆ（ｕ２，ｃ３）＝４
およびｆ（ｕ４，ｃ６）＝１が学習データとして与えら
れた段階で、ｕ２，ｕ４またはｃ３，ｃ６のいずれかの
類似度が低いが、どちらかはわからないという曖昧性が
存在している。この曖昧性を、学習方式１４−１と学習
方式１４−２においてランダムに解消しているが、上記
の例においては、学習方式１４−１においては、ｖ
（３，６）を減らす方向に更新しており、学習方式１４
−２においては、ｕ（２，４）を減らす方向に更新して
いる（図３によればｕ２，ｕ４は高い類似度をもってい
るので、学習方式１４−１の方が正しい判定を下してい
る）。この結果、上記の例において選択された質問点に
対する両学習方式による予測値の誤差に差が生じ、結果
的に正しい曖昧性解消を行った学習方式１４−１の方
が、重みが大きくなっており（すなわちｗ₁＞ｗ₂）、
次に与えられるユーザ・コンテンツ対に対する予測にお
いては、学習方式１４−１の予測値の方が重んじられる
ことが分かる。

【００９５】

【発明の効果】請求項１または２記載のユーザ嗜好自動
学習方式によれば、ノイズに対して頑健な帰納推論を実
現することが可能になると同時に、ユーザ間の類似度の
みを考慮する場合や、コンテンツ間の類似度のみを考慮
する従来方法に比べて、立上がりの早い学習が可能にな
る。

【００９６】また、請求項３，４または５記載のユーザ
嗜好自動学習方式によれば、従来方法と比べて格段に少
ない数の質問数で、精度の良い学習を達成することが可
能になる。

【図面の簡単な説明】

【図１】本発明のユーザ嗜好自動学習方式の第１の実施
の形態の構成例を示すブロック図である。

【図２】本発明の第１の実施の形態の動作の一例を示す
フローチャートである。

【図３】嗜好度（ユーザ嗜好関数）の例を示す図であ
る。

【図４】過去の学習データの例を示す図である。

【図５】本発明のユーザ嗜好自動学習方式の第３の実施
の形態の構成例を示すブロック図である。

【図６】本発明の第３の実施の形態の動作の一例を示す
フローチャートである。

【図７】本発明の第５の実施の形態の構成例を示すブロ
ック図である。

【符号の説明】

１…学習データ入力部２…学習データ格納部３…ユーザ間重み記憶部４…コンテンツ間重み記憶部５…予測部６…学習部１１…学習データ入力部１２…学習データ格納部１３…予測部１４…学習方式記憶部１４−１，１４−２…学習方式１５…学習部１６…質問部

フロントページの続き (56)参考文献早川和宏、鶴巻宏治、浜田洋，「ユーザの利用履歴に基づくＷＷＷサーバの類似検索」，情報処理学会研究報告（95− ＩＭ−21），Ｖｏｌ．95，Ｎｏ．40, 1995年５月12日，ｐ．11−17 中村篤祥、馬見塚拓、鳥羽弘康、安部直樹，「ブール変数実数多項式による嗜好関数の学習」、情報処理学会全国大会講演論文集，Ｖｏｌ．52（第52回），Ｎｏ．１，平成８年３月６日，ｐ．１−55 〜１−56 (58)調査した分野(Int.Cl.⁶，ＤＢ名) G06F 17/30 ＪＩＣＳＴファイル（ＪＯＩＳ)

Claims

(57)【特許請求の範囲】

【請求項１】ニュース記事やホームページ等のコンテ
ンツに対するユーザの嗜好を、データとして与えられた
コンテンツとそのコンテンツに対するユーザの嗜好度を
表す数値からなるデータを用いて学習する装置におい
て、ユーザ・コンテンツ対および該コンテンツに対する該ユ
ーザの嗜好度を表す数値からなる学習データを入力する
学習データ入力部と、過去に与えられた学習データを一括して格納する学習デ
ータ格納部と、ユーザ間の類似度を表すユーザ間重みを格納するユーザ
間重み記憶部と、コンテンツ間の類似度を表すコンテンツ間重みを格納す
るコンテンツ間重み記憶部と、前記学習データ入力部に与えられたユーザ・コンテンツ
対に対して、前記学習データ格納部に格納された学習デ
ータ、前記ユーザ間重み記憶部に格納されたユーザ間重
み、および前記コンテンツ間重み記憶部に格納されたコ
ンテンツ間重みを用いて、そのユーザのそのコンテンツ
に対する嗜好度を予測する予測部と、前記学習データ入力部から入力された前記ユーザ・コン
テンツ対の正しい嗜好度、前記学習データ格納部に格納
された過去に与えられた学習データ、前記ユーザ間重み
記憶部に格納されたユーザ間重み、および前記コンテン
ツ間重み記憶部に格納されたコンテンツ間重みを用い
て、前記ユーザ間重み記憶部に格納されたユーザ間重み
および前記コンテンツ間重み記憶部に格納されたコンテ
ンツ間重みを更新する学習部とを備え、前記予測部における予測は、前記学習データ格納部に格
納される過去の学習データの嗜好度の値の、新たに与え
られたユーザ・コンテンツ対との間のユーザ間重みとコ
ンテンツ間重みの積を重みとする、重みつき平均によっ
て行われる構成を有し、前記学習部における重み更新は、過去の学習データ中の
各ユーザ・コンテンツ対に対して、新たに与えられたユ
ーザ・コンテンツ対との間のユーザ間重みとコンテンツ
間重みとの双方に対して行われ、且つ、ユーザ間重み
は、過去の学習データ中のユーザ・コンテンツ対に対す
る嗜好度と新たに与えられたユーザ・コンテンツ対に対
する嗜好度との差と、前記コンテンツ間重みとの関数と
して更新され、コンテンツ間重みは、過去の学習データ
中のユーザ・コンテンツ対に対する嗜好度と新たに与え
られたユーザ・コンテンツ対に対する嗜好度との差と、
前記ユーザ間重みとの関数として更新される構成を有す
ることを特徴とするユーザ嗜好自動学習方式。
【請求項２】請求項１記載の学習部において、過去の
学習データ中の各ユーザ・コンテンツ対に対して、新た
に与えられたユーザ・コンテンツ対との間のユーザ間重
みとコンテンツ間重みとの双方を更新するのに代えて、
乱数を用いてランダムに、ユーザ間重み又はコンテンツ
間重みを更新する構成を有することを特徴とする請求項
１記載のユーザ嗜好自動学習方式。
【請求項３】ニュース記事やホームページ等のコンテ
ンツに対するユーザの嗜好を、データとして与えられた
コンテンツとそのコンテンツに対するユーザの嗜好度を
表す数値からなるデータを用いて学習する装置におい
て、ユーザ・コンテンツ対および該コンテンツに対する該ユ
ーザの嗜好度を表す数値からなる学習データを入力する
学習データ入力部と、過去に与えられた学習データを一括して格納する学習デ
ータ格納部と、複数の学習方式を格納する学習方式記憶部と、前記学習データ入力部に与えられたユーザ・コンテンツ
対に対して、そのユーザのそのコンテンツに対する嗜好
度を、前記学習方式記憶部に格納された各学習方式によ
り予測させ、それらの予測値の、各学習方式に対する信
頼度の重み付き平均値をもって予測する予測部と、複数のユーザ・コンテンツ対からなる質問対候補集合の
各ユーザ・コンテンツ対について、そのユーザのそのコ
ンテンツに対する嗜好度を前記学習方式記憶部中の各学
習方式により予測させて、最も予測値のばらつきの大き
いユーザ・コンテンツ対の正しい嗜好度を質問してその
値を得る質問部と、前記学習データ入力部から入力された前記ユーザ・コン
テンツ対の正しい嗜好度および前記質問部が質問して得
た前記ユーザ・コンテンツ対の正しい嗜好度に基づい
て、前記学習方式記憶部中の各学習方式の保持する仮説
を更新すると共に、前記予測部が使用する各学習方式に
対する信頼度を表す重みを、各重みの現在値および各学
習方式の予測値と入力として与えられた正しい嗜好度と
の差の関数として更新する学習部とを有することを特徴
とするユーザ嗜好自動学習方式。
【請求項４】前記学習方式記憶部に記憶される各学習
方式が、請求項２記載のユーザ嗜好自動学習方式である
請求項３記載のユーザ嗜好自動学習方式。
【請求項５】前記質問部は、前記複数のユーザ・コン
テンツ対からなる質問対候補集合として、過去の学習デ
ータ中に現れるユーザとコンテンツとからなるユーザ・
コンテンツ対の中で、過去にデータとして嗜好度を与え
られていない対の集合の全て又は一部を用いる構成を有
することを特徴とする請求項４記載のユーザ嗜好自動学
習方式。