JP3284972B2

JP3284972B2 - 情報フィルタリング方法及び方式

Info

Publication number: JP3284972B2
Application number: JP15059398A
Authority: JP
Inventors: 篤祥中村
Original assignee: NEC Corp
Current assignee: NEC Corp
Priority date: 1998-05-14
Filing date: 1998-05-14
Publication date: 2002-05-27
Anticipated expiration: 2018-05-14
Also published as: JPH11328275A

Description

【発明の詳細な説明】

【０００１】

【発明の属する技術分野】本発明は情報フィルタリング
技術に関し、特にユーザの情報に対する評価値を他のユ
ーザの情報に対する評価値から予測する協調フィルタリ
ング技術に関する。

【０００２】

【従来の技術】情報フィルタリングとは、データベー
ス、パソコン通信、ＷＷＷ（Ｗorld Ｗide Ｗeb）等
情報システムが提供する大量の情報や多数のサービスの
中から利用者の興味や嗜好に適うものを選択的に抽出す
るフィルタリング技術である。

【０００３】従来より、ユーザの情報に対する評価値を
他のユーザの情報に対する評価値から予測する協調フィ
ルタリング（「Collaborative Filtering」または「So
cialFiltering」とも呼ばれる）としては、Proceedings
of CSCW（1994)）掲載の「GroupLens: An Open A
rchitecture for Collaborative Filtering of Ne
tnews」やProceedings of CHI(1995)掲載の「Social
Information Filtering: Algorithms and Automat
ing "Word of Mouth"」に記載されているように、ユ
ーザ間の相関係数を重みとして既に評価済の他のユーザ
の評価値の重み付き平均により予測値を計算する方法が
用いられている。

【０００４】また、上記従来の方法における他のユーザ
の評価点が集中していると、集中している値の影響が大
きすぎるという、問題点に対処すべく、例えば特開平9-
265478号公報には、人口密度を考慮する情報フィルタリ
ング方式が提案されている。

【０００５】

【発明が解決しようとする課題】しかしながら、上記従
来の情報フィルタリング方式は下記記載の問題点を有し
ている。

【０００６】第１の問題点は、例えば１００個の情報を
共通に評価していて、その１００個に同じ評価をしてい
るユーザ間の重みも、１個の情報を共通に評価している
だけでその１つが同じ評価であるユーザ間も、相関係数
による重みは、同一となる、ということである。

【０００７】その理由は、相関係数による方法は、信頼
度を考慮していないからである。

【０００８】第２の問題点は、特別評価が似ているユー
ザがいても、そのユーザとの間の重みが他と比べて特別
高くはならない、ということである。

【０００９】その理由は、相関係数の値の範囲は−１か
ら１までであるからである。

【００１０】第３の問題点は、データの数が少ない時の
予測性能が悪い、ということである。

【００１１】その理由は、上記第１、第２の問題点が解
消されていないためである。

【００１２】したがって本発明は、上記問題点に鑑みて
なされたものであって、その目的は、信頼度を考慮し、
類似しているユーザ間とそうでないユーザ間の重みの差
がより大きくなるようにユーザ間の重み付けを可能と
し、これにより予測性能を向上する情報フィルタリング
方法及び方式を提供することにある。

【００１３】

【課題を解決するための手段】前記目的を達成するた
め、本発明の情報フィルタリング方式は、ユーザの情報
に対する評価値の予測を、過去のユーザ、情報、評価値
の３つ組のデータを使って学習したユーザ間の重みによ
る多数決により、同じ情報を既に評価した他のユーザの
評価値から行う方式であって、各候補値に投票する値の
集合を定義し、該集合に入る場合にその候補値に投票す
る予測手段を備える。

【００１４】また本発明の情報フィルタリング方式は、
ユーザの情報に対する評価値の予測を、過去のユーザ、
情報、評価値の３つ組のデータを使って学習したユーザ
間の重みと情報間の重みによる多数決により行う方式で
あって、同じ情報を既に評価した他のユーザの評価値の
みでなく同じユーザの既に評価した他の情報の評価値も
使い、各候補値に投票する値の集合を定義し、該集合に
入る場合にその候補値に投票する予測手段を備える。

【００１５】さらに本発明においては、正解値に投票す
る集合に入る場合は１より大きい定数を掛けることによ
り重みを増やし、入らない場合には１より小さい定数を
掛けることにより重みを減らす学習手段を備える。

【００１６】

【発明の実施の形態】本発明の実施の形態について以下
に説明する。本発明の情報フィルタリング方式は、その
好ましい実施の形態において、図１を参照すると、各候
補値に投票する値の集合を定義し、その集合に入る評価
値のユーザとの間の重みの合計による多数決により予測
値を決める予測手段（３）を有する。

【００１７】また、ユーザ間の重みは、正解に投票した
数と不正解に投票した数からそのユーザ間の予測の正解
度、誤り度を計算し、１に正解度の値だけ１より大きい
数を掛け、誤り度の値だけ１より小さい数を掛けること
により計算する。ユーザ間の重みの学習は計算した値を
記憶するか、または、正解数、誤り数を記憶することに
より行う学習手段（４）を有する。なお、重み記憶部及
び評価点記憶部の初期化を行う初期化手段（２）、予測
手段（３）、及び学習手段（４）は、コンピュータ上で
実行されるプログラムによってその機能を実現すること
ができる。本発明の実施の形態によれば、ユーザ間の重
みを相関係数とし、信頼度を考慮し、類似しているユー
ザ間とそうでないユーザ間の重みの差が大となるように
ユーザ間での重みの差が大となるようにユーザ間での重
み付けを可能とし、少ないデータ数でも予測性能を向上
している。

【００１８】

【実施例】次に、上記した本発明の実施の形態について
さらに詳細に説明すべく、本発明の実施例について図面
を参照して詳細に説明する。

【００１９】図１は、本発明の一実施例の構成を示すブ
ロック図である。図１を参照すると、本発明の一実施例
は、評価点の入力及び予測点の表示を行う入力装置１
と、重み記憶部５及び評価点記憶部６の初期化を行う初
期化手段２と、与えられたユーザＩＤと情報ＩＤに対し
て予測点を出力する予測手段３と、入力評価データから
学習して、重み記憶部５を更新し、評価点記憶部６に入
力データを加える学習手段４と、を含む。

【００２０】［実施例１］図２乃至図５は、本発明の第
１の実施例の処理フローを説明するための流れ図であ
る。図１乃至図５を参照して、本発明の第１実施例の動
作について詳細に説明する。

【００２１】図２は、本発明の第１の実施例における初
期化手段２の処理フローを示す流れ図である。任意のユ
ーザｉとユーザｉ’（ｉ’はｉ＋１〜ｎ、ｉは１〜ｎ）
の間の重みｗ（ｉ，ｉ’）を「１」にセットし（ステッ
プ２３０）、その時までに観測した行列エントリの値
（（ｉ，ｊ）成分はユーザｉによる情報ｊの評価値）を
記憶するために使う観測行列の任意のエントリ（ｉ，
ｊ）の値Ｏ（ｉ，ｊ）を「？」（未定）にセットする
（ステップ２４）。

【００２２】図３は、本発明の第１の実施例における予
測手段３の処理フローを示す流れ図である。（ｉ，ｊ）
エントリの値Ｍ（ｉ，ｊ）（正解値）を予測するとき、
評価値の候補値ａ毎にａに投票する重みの合計ｓｕｍを
計算し（ステップ３４）、ｓｕｍが最大となるａを出力
する（ステップ３８）。

【００２３】図４は、図３において、ｓｕｍの計算をす
るステップ３４の処理フローの詳細を示す流れ図であ
る。候補値ａに投票する値の集合をＶ（ａ）とする。同
じ列ｊで値が既に分かっている行ｉ’の値Ｏ（ｉ’，
ｊ）がＶ（ａ）に含まれているような行ｉ’と行ｉとの
間の重みｗ（ｉ，ｉ’）の合計を、候補値ａに投票する
重みの合計ｓｕｍとする（ステップ３４２０１）。

【００２４】図５は、本発明の第１の実施例における学
習手段４の処理フローを示す流れ図である。正解値Ｍ
（ｉ，ｊ）に投票した行ｉ’（Ｏ（ｉ’，ｊ）∈Ｖ（Ｍ
（ｉ，ｊ）））と、行ｉとの間の重みｗ（ｉ，ｉ’）
は、（２−γ）倍にし（ステップ４５０）、Ｍ（ｉ，
ｊ）に投票しないで他の値に投票した行ｉ’（Ｏ
（ｉ’，ｊ）が「？」でなく、しかもＶ（Ｍ（ｉ，
ｊ））に含まれていない）と行ｉとの間の重みｗ（ｉ，
ｉ’）はγ倍にする（ステップ４６０）。但し、γは０
以上１未満の定数である。

【００２５】重みの更新後、観測行列の（ｉ，ｊ）エン
トリの値Ｏ（ｉ，ｊ）を、Ｍ（ｉ，ｊ）に更新する（ス
テップ４８）。

【００２６】［実施例２］図６乃至図８は、本発明の第
２の実施例の処理フローを説明するための流れ図であ
る。図６乃至図８を参照して本発明の第２の実施例の動
作について詳細に説明する。

【００２７】図６は、本発明の第２の実施例における初
期化手段２の処理フローを示す流れ図である。任意のユ
ーザｉとユーザｉ’間の正しい投票回数Ｃ（ｉ，ｉ’）
と間違った投票回数Ｄ（ｉ，ｉ’）を「０」にセットし
（ステップ２３１）、その時までに観測した行列エント
リの値（（ｉ，ｊ）成分はユーザｉによる情報ｊの評価
値）を記憶するために使う観測行列の任意のエントリ
（ｉ，ｊ）の値Ｏ（ｉ，ｊ）を「？」にセットする（ス
テップ２４）。

【００２８】本発明の第２の実施例における予測手段３
の処理は、図３に示した第１の実施例における予測手段
３の処理フローと同じである。

【００２９】図７は、本発明の第２の実施例において、
図３のｓｕｍの計算をするステップ３４の処理フローを
示す流れ図である。候補値ａに投票する値の集合をＶ
（ａ）とする。同じ列ｊで値が既に分かっている行ｉ’
の値Ｏ（ｉ’，ｊ）がＶ（ａ）に含まれているような行
ｉ’と行ｉとの間の重みｐｏｗ（２−γ，Ｃ（ｉ，
ｉ’））ｐｏｗ（γ，Ｄ（ｉ，ｉ’））の合計を、候補
値ａに投票する重みの合計ｓｕｍとする（ステップ３４
２１１）。但しｐｏｗ（ｘ，ｙ）はｘのｙ乗を表す。

【００３０】図８は、本発明の第２の実施例における学
習手段４の処理フローを示す流れ図である。正解値Ｍ
（ｉ，ｊ）に投票した行ｉ’（Ｏ（ｉ’，ｊ）∈Ｖ（Ｍ
（ｉ，ｊ）））と行ｉとの間の正しい投票回数を数える
カウンタＣ（ｉ，ｉ’）に１を加え（ステップ４５
１）、Ｍ（ｉ，ｊ）に投票しないで他の値に投票した行
ｉ’（Ｏ（ｉ’，ｊ）は「？」でなくしかもＶ（Ｍ
（ｉ，ｊ））に含まれていない）と行ｉとの間の間違っ
た投票回数を数えるカウンタＤ（ｉ，ｉ’）に「１」を
加える（ステップ４６１）。重みの更新後、観測行列の
（ｉ，ｊ）エントリの値Ｏ（ｉ，ｊ）をＭ（ｉ，ｊ）に
更新する（ステップ４８）。

【００３１】［実施例３］図９及び図１０は、本発明の
第３の実施例の処理フローを説明するための流れ図であ
る。図９及び図１０を参照して本発明の第３の実施例の
動作について詳細に説明する。

【００３２】本発明の第３の実施例における初期化手段
２の処理は、図６に示した前記第２の実施例における初
期化手段２と同じである。本発明の第３の実施例におけ
る予測手段３の処理は、図３に示した前記第１の実施例
における予測手段３と同じである。

【００３３】図９は、本発明の第３の実施例において、
図３の重み合計ｓｕｍの計算をするステップ３４の処理
フローを示す流れ図である。候補値ａに投票する値の集
合をＶ（ａ）とする。同じ列ｊで値が既に分かっている
行ｉ’の値Ｏ（ｉ’，ｊ）がＶ（ａ）に含まれているよ
うな行ｉ’と行ｉとの間の重みｐｏｗ（２−γ，ｃ
（ｉ，ｉ’））・ｐｏｗ（γ，ｄ（ｉ，ｉ’））の合計
を、候補値ａに投票する重みの合計ｓｕｍとする（ステ
ップ３４２−２１）。但しｐｏｗ（ｘ，ｙ）はｘのｙ乗
を表す。

【００３４】ここで、計算に使うｃ（ｉ，ｉ’），ｄ
（ｉ，ｉ’）は、図１０に示されている処理に従って算
出する。ｃ（ｉ，ｉ’）は行ｉ’による行ｉへの投票が
正しいと推測される証拠の量であり直接的な証拠の量Ｃ
（ｉ，ｉ’）と間接的な証拠の量との和である。

【００３５】直接的な証拠は、ステップ３４２２１０で
加算される。

【００３６】間接的な証拠は、ｉ’’≠ｉかつｉ’’≠
ｉ’であるようなすべての行ｉ’’について計算し加算
する。先ず、行ｉと行ｉ’’との類似度ｇ（ｉ，
ｉ’’）＝Ｃ（ｉ，ｉ’’）−Ｄ（ｉ，ｉ’’）と、行
ｉ’と行ｉ’’との類似度ｇ（ｉ’，ｉ’’）＝Ｃ
（ｉ’，ｉ’’）−Ｄ（ｉ’，ｉ’’）を計算する（ス
テップ３４２２１３）。

【００３７】ｇ（ｉ，ｉ’’）とｇ（ｉ’，ｉ’’）が
ともに非負であるとき（ステップ３４２２１４）のみ、
間接的な証拠としてｇ（ｉ，ｉ’’）とｇ（ｉ’，
ｉ’’）の絶対値の大きくない方をδ倍したものをｃ
（ｉ，ｉ’）に加える（ステップ３４２２１５）。但
し、δは非負定数である。

【００３８】ｄ（ｉ，ｉ’）は行ｉ’による行ｉへの投
票が間違っていると推測される証拠の量であり直接的な
証拠の量Ｄ（ｉ，ｉ’）と間接的な証拠の量との和であ
る。

【００３９】直接的な証拠は、ステップ３４２２１０で
加算される。

【００４０】間接的な証拠は、ｉ’’≠ｉかつｉ’’≠
ｉ’であるようなすべての行ｉ’’について計算し加算
する。先ず、行ｉと行ｉ’’との類似度ｇ（ｉ，
ｉ’’）＝Ｃ（ｉ，ｉ’’）−Ｄ（ｉ，ｉ’’）と行
ｉ’と行ｉ’’との類似度ｇ（ｉ’，ｉ’’）＝Ｃ
（ｉ’，ｉ’’）−Ｄ（ｉ’，ｉ’’）を計算する（ス
テップ３４２２１３）。

【００４１】ｇ（ｉ，ｉ’’）とｇ（ｉ’，ｉ’’）の
一方が正でもう一方が負であるとき（ステップ３４２２
１６）のみ、間接的な証拠としてｇ（ｉ，ｉ’’）とｇ
（ｉ’，ｉ’’）の絶対値の大きくない方をδ倍したも
のをｄ（ｉ，ｉ’）に加える（ステップ３４２２１
７）。

【００４２】本発明の第３の実施例における学習手段４
の処理フローは、図８に示した前記第２の実施例におけ
る学習手段４と同じである。

【００４３】［実施例４］図１１乃至図１３は、本発明
の第４の実施例の処理フローを説明するための流れ図で
ある。図１１及び図１３を参照して本発明の第４の実施
例の動作について詳細に説明する。

【００４４】図１１は、本発明の第４の実施例における
初期化手段２の処理フローを示す流れ図である。前記第
１の実施例における初期化手段２の流れ図（図２）のス
テップ２１、２２、２３０、２４、２５を実行し、ｗ
（ｉ，ｉ’）を’１’にＯ（ｉ，ｊ）を「？」にセット
する。さらに、任意の情報ｊと情報ｊ’の間の重みｖ
（ｊ，ｊ’）を「１」にセットする（ステップ２８
０）。

【００４５】本発明の第４の実施例における予測手段３
の処理は、図３に示した前記第１の実施例における予測
手段３の処理フローと同じである。

【００４６】図１２は、本発明の第４の実施例におい
て、図３のｓｕｍの計算をするステップ３４の処理を示
す流れ図である。候補値ａに投票する値の集合をＶ
（ａ）とする。

【００４７】前記第１の実施例における場合（図４）と
同様に、同じ列ｊで値が既に分かっている行ｉ’の値Ｏ
（ｉ’，ｊ）がＶ（ａ）に含まれているような行ｉ’と
行ｉとの間の重みｗ（ｉ，ｉ’）の合計を、候補値ａに
投票する重みの合計ｓｕｍとする（ステップ３４２０
１）。さらに、同じ行ｉで値が既に分かっている列ｊ’
の値Ｏ（ｉ，ｊ’）がＶ（ａ）に含まれているような列
ｊ’と列ｊとの間の重みｖ（ｊ，ｊ’）の合計を、ｓｕ
ｍに加える（ステップ３４２０２）。

【００４８】図１３は、本発明の第４の実施例における
学習手段４の処理フローを示す流れ図である。前記第１
の実施例における学習手段４の処理フローを示す流れ図
である図５のステップ４１、４２、４３、４４、４５
０、４６０、４７を実行し、ｗ（ｉ，ｉ’）を更新す
る。

【００４９】さらに、正解値Ｍ（ｉ，ｊ）に投票した列
ｊ’（Ｏ（ｉ，ｊ’）∈Ｖ（Ｍ（ｉ，ｊ）））と列ｊと
の間の重みｖ（ｊ，ｊ’）は（２−γ）倍にし（ステッ
プ４ｄ０）、Ｍ（ｉ，ｊ）に投票しないで他の値に投票
した列ｊ’（Ｏ（ｉ，ｊ’）は「？」でなくしかもＶ
（Ｍ（ｉ，ｊ））に含まれていない）と列ｊとの間の重
みｖ（ｊ，ｊ’）はγ倍にする（ステップ４ｅ０）。但
し、γは０以上１未満の定数である。重みの更新後、観
測行列の（ｉ，ｊ）エントリの値Ｏ（ｉ，ｊ）をＭ
（ｉ，ｊ）に更新する（ステップ４８）。

【００５０】［実施例５］図１４乃至図１６は、本発明
の第５の実施例の処理フローを説明するための流れ図で
ある。図１４及び図１６を参照して本発明の第５の実施
例の動作について詳細に説明する。

【００５１】図１４は、本発明の第５の実施例における
初期化手段２の処理フローを示す流れ図である。前記第
２の実施例における初期化手段２の流れ図である図６の
ステップ２１、２２、２３１、２４、２５を実行しＣ
（ｉ，ｉ’）とＤ（ｉ，ｉ’）を’０’にセットし、Ｏ
（ｉ，ｊ）を「？」にセットする。

【００５２】さらに、任意の情報ｊと情報ｊ’間の正し
い投票回数Ｅ（ｊ，ｊ’）と間違った投票回数Ｆ（ｊ，
ｊ’）を’０’にセットする（ステップ２８１）。

【００５３】本発明の第５の実施例における予測手段３
の処理フローは、図３に示した前記第１の実施例におけ
る予測手段３の処理と同じである。

【００５４】図１５は、本発明の第５の実施例におい
て、図３のｓｕｍの計算をするステップ３４の処理フロ
ーを示す流れ図である。

【００５５】候補値ａに投票する値の集合をＶ（ａ）と
する。前記第２の実施例における場合（図７）と同様
に、同じ列ｊで値が既に分かっている行ｉ’の値Ｏ
（ｉ’，ｊ）がＶ（ａ）に含まれているような行ｉ’と
行ｉとの間の重みｐｏｗ（２−γ，Ｃ（ｉ，ｉ’））ｐ
ｏｗ（γ，Ｄ（ｉ，ｉ’））の合計を、候補値ａに投票
する重みの合計ｓｕｍとする（ステップ３４２１１）。
但しｐｏｗ（ｘ，ｙ）はｘのｙ乗を表す。

【００５６】さらに、同じ行ｉで値が既に分かっている
列ｊ’の値Ｏ（ｉ，ｊ’）がＶ（ａ）に含まれているよ
うな列ｊ’と列ｊとの間の重みｐｏｗ（２−γ，Ｅ
（ｊ，ｊ’））ｐｏｗ（γ，Ｆ（ｊ，ｊ’））の合計
を、ｓｕｍに加える（ステップ３４２１２）。

【００５７】図１６は、本発明の第５の実施例における
学習手段４の処理フローを示す流れ図である。前記第２
の実施例における学習手段４と同様に、図８のステップ
４１、４２、４３、４４、４５１、４６１、４７を実行
しＣ（ｉ，ｉ’）とＤ（ｉ，ｉ’）を更新する。さら
に、正解値Ｍ（ｉ，ｊ）に投票した列ｊ’（Ｏ（ｉ，
ｊ’）∈Ｖ（Ｍ（ｉ，ｊ）））と列ｊとの間の正しい投
票回数を数えるカウンタＥ（ｊ，ｊ’）に１を加え（ス
テップ４ｄ１）、Ｍ（ｉ，ｊ）に投票しないで他の値に
投票した列ｊ’（Ｏ（ｉ，ｊ’）は「？」でなく、しか
もＶ（Ｍ（ｉ，ｊ））に含まれていない）と列ｊとの間
の間違った投票回数を数えるカウンタＦ（ｊ，ｊ’）に
「１」を加える（ステップ４ｅ１）。重みの更新後、観
測行列の（ｉ，ｊ）エントリの値Ｏ（ｉ，ｊ）をＭ
（ｉ，ｊ）に更新する（ステップ４８）。

【００５８】［実施例６］図１７乃び図１８は、本発明
の第６の実施例の処理フローを説明するための流れ図で
ある。図１７及び図１８を参照して本発明の第６の実施
例の動作について詳細に説明する。

【００５９】本発明の第６の実施例における初期化手段
２の処理は、図１４に示した前記第５の実施例における
初期化手段２の処理フローと同じである。

【００６０】本発明の第６の実施例における予測手段３
の処理は、図３に示した前記第１の実施例における予測
手段３の処理フローと同じである。前記第３の実施例に
おける場合（図９）と同様に、同じ列ｊで値が既に分か
っている行ｉ’の値Ｏ（ｉ’，ｊ）がＶ（ａ）に含まれ
ているような行ｉ’と行ｉとの間の重みｐｏｗ（２−
γ，ｃ（ｉ，ｉ’））ｐｏｗ（γ，ｄ（ｉ，ｉ’））の
合計を、候補値ａに投票する重みの合計ｓｕｍとする
（ステップ３４２２１）。但しｐｏｗ（ｘ，ｙ）はｘの
ｙ乗を表す。ここで計算に使うｃ（ｉ，ｉ’），ｄ
（ｉ，ｉ’）は、図１０に示されている処理に従って算
出する。

【００６１】さらに同じ行ｉで値が既に分かっている列
ｊ’の値Ｏ（ｉ，ｊ’）がＶ（ａ）に含まれているよう
な列ｊ’と列ｊとの間の重みｐｏｗ（２−γ，ｅ（ｊ，
ｊ’））ｐｏｗ（γ，ｆ（ｊ，ｊ’））の合計を、ｓｕ
ｍに加える（ステップ３４２２２）。ここで計算に使う
ｅ（ｊ，ｊ’），ｆ（ｊ，ｊ’）は、図１８に示されて
いる処理に従って算出する。

【００６２】ｅ（ｊ，ｊ’）は列ｊ’による列ｊへの投
票が正しいと推測される証拠の量であり、直接的な証拠
の量Ｅ（ｊ，ｊ’）と間接的な証拠の量との和である。

【００６３】直接的な証拠は、ステップ３４２２２０で
加算される。

【００６４】間接的な証拠は、ｊ’’≠ｊかつｊ’’≠
ｊ’であるようなすべての列ｊ’’について計算し加算
する。

【００６５】先ず、列ｊと列ｊ’’との類似度ｇ（ｊ，
ｊ’’）＝Ｅ（ｊ，ｊ’’）−Ｆ（ｊ，ｊ’’）と、列
ｊ’と列ｊ’’との類似度ｇ（ｊ’，ｊ’’）＝Ｅ
（ｊ’，ｊ’’）−Ｆ（ｊ’，ｊ’’）を計算する（ス
テップ３４２２２３）。

【００６６】ｇ（ｊ，ｊ’’）とｇ（ｊ’，ｊ’’）が
ともに非負であるとき（ステップ３４２２２４）のみ、
間接的な証拠としてｇ（ｊ，ｊ’’）とｇ（ｊ’，
ｊ’’）の絶対値の大きくない方をδ倍したものをｅ
（ｊ，ｊ’）に加える（ステップ３４２２２５）。但
し、δは非負定数である。ｆ（ｊ，ｊ’）は列ｊ’によ
る列ｊへの投票が間違っていると推測される証拠の量で
あり直接的な証拠の量Ｆ（ｊ，ｊ’）と間接的な証拠の
量との和である。

【００６７】直接的な証拠は、ステップ３４２２２０で
加算される。

【００６８】間接的な証拠は、ｊ’’≠ｊかつｊ’’≠
ｊ’であるようなすべての列ｊ’’について計算し加算
する。先ず、列ｊと列ｊ’’との類似度ｇ（ｊ，
ｊ’’）＝Ｅ（ｊ，ｊ’’）−Ｆ（ｊ，ｊ’’）と列
ｊ’と列ｊ’’との類似度ｇ（ｊ’，ｊ’’）＝Ｅ
（ｊ’，ｊ’’）−Ｆ（ｊ’，ｊ’’）を計算する（ス
テップ３４２２２３）。

【００６９】ｇ（ｊ，ｊ’’）とｇ（ｊ’，ｊ’’）の
一方が正でもう一方が負であるとき（ステップ３４２２
２６）のみ、間接的な証拠としてｇ（ｊ，ｊ’’）とｇ
（ｊ’，ｊ’’）の絶対値の大きくない方をδ倍したも
のをｆ（ｊ，ｊ’）に加える（ステップ３４２２２
７）。

【００７０】なお、本発明の第６の実施例における学習
手段４の処理フローは、図１６に示した前記第５の実施
例における学習手段４の処理フローと同じである。

【００７１】

【発明の効果】以上説明したように、本発明によれば下
記記載の効果を奏する。

【００７２】本発明の第１の効果は、ユーザ間の重みが
信頼度を考慮した値に設定される、ということである。

【００７３】その理由は、本発明においては、共通に評
価している情報の数が少ないユーザ間の重みは特別に大
きくなったり小さくなったりすることがないからであ
る。

【００７４】本発明の第２の効果は、類似しているユー
ザ間とそうでないユーザ間の重みの差が、従来法よりも
大きくなる、ということである。

【００７５】その理由は、本発明においては、相関係数
法よりも重みの取り得る値の幅が大きく、データの数の
増加に伴って重みの差が大きくなっていくように構成し
たためである。

【００７６】本発明の第３の効果は、データの数が少な
い時の予測性能を向上する、ということである。

【００７７】その理由は、本発明においては、重みの更
新がかけ算であるために、学習が速く、さらに同じユー
ザの他の情報に対する評価値も使ったり、同じ情報に対
する評価値の分かっていないユーザ間の重みや、同じユ
ーザに対する評価値の分かっていない情報間の重みを使
う方法を行うことで、より多くの情報に基づいて予測し
ているからである。

【図面の簡単な説明】

【図１】本発明の実施の形態の構成を示すブロック図で
ある。

【図２】本発明の第１の実施例における初期化手段の処
理フローを示す流れ図である。

【図３】本発明の第１の実施例における予測手段を示す
流れ図である。

【図４】本発明の第１の実施例における予測手段のステ
ップ３４（図３）の詳細を示す流れ図である。

【図５】本発明の第１の実施例における学習手段の処理
フローを示す流れ図である。

【図６】本発明の第２の実施例における初期化手段の処
理フローを示す流れ図である。

【図７】本発明の第２の実施例における予測手段のステ
ップ３４（図３）の詳細を示す流れ図である。

【図８】本発明の第２の実施例における学習手段の処理
フローを示す流れ図である。

【図９】本発明の第３の実施例における予測手段のステ
ップ３４（図３参照）の詳細を示す流れ図である。

【図１０】本発明の第３の実施例における、図９のステ
ップ３４２２１の詳細を示す流れ図である。

【図１１】本発明の第４の実施例における初期化手段の
処理フローを示す流れ図である。

【図１２】本発明の第４の実施例における予測手段のス
テップ３４（図３参照）の詳細を示す流れ図である。

【図１３】本発明の第４の実施例における学習手段の処
理フローを示す流れ図である。

【図１４】本発明の第５の実施例における初期化手段の
処理フローを示す流れ図である。

【図１５】本発明の第５の実施例における予測手段のス
テップ３４（図３参照）の詳細を示す流れ図である。

【図１６】本発明の第５の実施例における学習手段の処
理フローを示す流れ図である。

【図１７】本発明の第６の実施例における予測手段のス
テップ３４（図３参照）の詳細を示す流れ図である。

【図１８】本発明の第６の実施例における、図１７のス
テップ３４２２２の詳細を示す流れ図である。

【符号の説明】

１入出力装置２初期化手段３予測手段４学習手段５重み記憶部６評価点記憶部

フロントページの続き (56)参考文献特開平９−265478（ＪＰ，Ａ) 特開平７−234881（ＪＰ，Ａ) 特開平９−81630（ＪＰ，Ａ) 特開平10−91686（ＪＰ，Ａ) 国際公開97／2537（ＷＯ，Ａ１) 鈴木義一郎、グラフィック統計学，日本，実教出版株式会社，1997年11月28日有吉，市山，多変量解析を用いたソーシャル情報フィルタリング，情報処理学会研究報告，日本，社団法人情報処理学会，1998年９月17日，Ｖｏｌ．98, Ｎｏ．82（98−ＮＬ−127），ｐ．17− 24 有吉，市山，目利き利用者の発見と利用によるソーシャルフィルタリング方式，情報処理学会全国大会講演論文集, 日本，社団法人情報処理学会，1996年９月４日，第53回（平成８年後期），ｐ．３−25〜３−26 有吉，市山，内容に応じた配送を行う情報流通システム：情報発信型エージェント情報処理学会全国大会講演論文集, 日本，社団法人情報処理学会，1998年３月17日，第56回（平成10年前期）, ｐ．３−246〜３−247 (58)調査した分野(Int.Cl.⁷，ＤＢ名) G06F 17/30 ＪＩＣＳＴファイル（ＪＯＩＳ)

Claims

(57)【特許請求の範囲】

【請求項１】ユーザの情報に対する評価値の予測を、過
去のユーザ、情報、評価値の３つ組のデータを使って学
習したユーザ間の重みによる多数決により同じ情報を既
に評価した他のユーザの評価値から行う方式であって、予測対象情報の各候補値に対しそれに投票するユーザを
そのユーザが予測対象情報に与えた評価値があらかじめ
定められた集合に含まれるか否かで定め、含まれる場合
には、その候補値に、予測対象ユーザとそのユーザとの
間の重みを投票する予測手段と、重みを保持せず、ユーザの情報に対する評価が与えられ
た時に、その評価値がその情報に対する予測値に投票す
るユーザを定めるのに使われた集合に含まれる場合に正
解であると定め、予測の正解数と誤り数をそれぞれ計数
する計数手段を備え、前記予測手段は、前記計数手段のカウンタ値からユーザ
間の重みを計算し、正解値に投票する集合に入る場合には正解数の計数手段
の計数値を増やし、入らない場合には誤り数の計数手段
の計数値を増やす学習手段と、を備えたことを特徴とする情報フィルタリング方式。
【請求項２】ユーザの情報に対する評価値の予測を、過
去のユーザ、情報、評価値の３つ組のデータを使って学
習したユーザ間の重みと情報間の重みによる多数決によ
り行う方式であって、同じ情報を既に評価した他のユーザの評価値のみでな
く、同じユーザの既に評価した他の情報の評価値も使
い、予測対象情報の各候補値に対しそれに投票するユー
ザをそのユーザが予測対象情報に与えた評価値があらか
じめ定められた集合に含まれるか否かで定め、含まれる
場合には、その候補値に、予測対象ユーザとそのユーザ
との間の重みを投票する予測手段と、重みを保持せず、ユーザの情報に対する評価が与えられ
た時に、その評価値がその情報に対する予測値に投票す
るユーザを定めるのに使われた集合に含まれる場合に正
解であると定め、予測の正解数と誤り数をそれぞれ計数
する計数手段を備え、前記予測手段は、前記計数手段のカウンタ値からユーザ
間と情報間の重みを計算し、正解値に投票する集合に入る場合には正解数の計数手段
の計数値を増やし、入らない場合には誤り数の計数手段
の計数値を増やす学習手段と、を備えたことを特徴とする情報フィルタリング方式。
【請求項３】前記学習手段が、正解値に投票する集合に
入る場合には１よりも大きな所定の数を掛けることによ
り重みを増やし、入らない場合には１よりも小さな所定
の数を掛けることにより重みを減らすことを特徴とする
請求項１または２記載の情報フィルタリング方式。
【請求項４】前記予測手段が、正解数と誤り数の計数手
段からユーザｉと他のユーザｉ’の間の重みを計算する
際に、それらのユーザ間の計数値のみでなく、他の全て
のユーザｉ’’と前記ユーザｉとの間の計数値、及びユ
ーザｉ’’と前記ユーザｉ’との間の計数値を使って、
ユーザ間の重みを算出し、情報ｊと他の情報ｊ’の間の
重みを計算する際に、それらの情報間の計数値のみでな
く、他の全ての情報ｊ’’と前記情報ｊとの間の計数
値、及び情報ｊ’’と前記情報ｊ’との間の計数値を使
って情報間の重みを算出する、ことを特徴とする請求項
１又は２記載の情報フィルタリング方式。
【請求項５】ユーザの情報に対する評価値の予測を、過
去のユーザ、情報、評価値の３つ組のデータを使って学
習したユーザ間の重みによる多数決により同じ情報を既
に評価した他のユーザの評価値から行う方法であって、予測対象情報の各候補値に対しそれに投票するユーザを
そのユーザが予測対象情報に与えた評価値があらかじめ
定められた集合に含まれるか否かで定め、含まれる場合
には、その候補値に、予測対象ユーザとそのユーザとの
間の重みを投票し、重みを保持せず、ユーザの情報に対する評価が与えられ
た時に、その評価値がその情報に対する予測値に投票す
るユーザを定めるのに使われた集合に含まれる場合に正
解であると定め、予測の正解数と誤り数をそれぞれ計数
部で計数し、前記計数部のカウンタ値からユーザ間の重みを計算し、正解値に投票する集合に入る場合には正解数の計数部の
計数値を増やし、入らない場合には誤り数の計数部の計
数値を増やす、学習を行う、ことを特徴とする情報フィルタリング方法。
【請求項６】正解値を予測する際に、評価値の候補値毎
に前記候補値に投票する重みの合計を計算し、重みの合
計が最大となる候補値を出力し、正解値に投票する集合に入る場合には１よりも大きな所
定の数を掛けることにより重みを増やし、入らない場合
には１よりも小さな所定の数を掛けることにより重みを
減らす、ことを特徴とする請求項５記載の情報フィルタ
リング方法。
【請求項７】評価点の入力及び予測点の表示を行う入出
力手段と、重みを記憶する重み記憶部と、評価点を記憶する評価点記憶部と、前記重み記憶部及び評価点記憶部の初期化を行う初期化
手段と、与えられたユーザＩＤと情報ＩＤに対して予測点を出力
する予測手段と、入力評価データから学習して前記重み記憶部を更新し、
前記評価点記憶部に入力データを加える学習手段と、を
備え、ユーザの情報に対する評価が与えられた時に、その評価
値がその情報に対する予測値に投票するユーザを定める
のに使われた集合に含まれる場合に正解であると定め、前記予測手段が、正解値を予測する際に、評価値の候補
値毎に前記候補値に投票する重みの合計を計算し、重み
の合計が最大となる候補値を出力し、前記学習手段が、正解値に投票する集合に入る場合には
１よりも大きな所定の数を掛けることにより重みを増や
し、入らない場合には１よりも小さな所定の数を掛ける
ことにより重みを減らし、前記予測手段において、任意のユーザｉとユーザｉ’の
間の重みをｗ（ｉ，ｉ’）とし、観測した行列エントリ
（ただし（ｉ，ｊ）成分がユーザｉによる情報ｊの評価
値となる）の値を記憶するための行列を観測行列Ｏ
（ｉ，ｊ）とし、（ｉ，ｊ）エントリの正解値Ｍ（ｉ，
ｊ）を予測する際に、候補値ａに投票する値の集合をＶ
（ａ）とし、同じ列ｊで値が既に分かっている行ｉ’の
値Ｏ（ｉ’，ｊ）が前記集合Ｖ（ａ）に含まれているよ
うな行ｉ’と行ｉとの間の重みｗ（ｉ，ｉ’）の合計
を、候補値ａに投票する重みの合計（ｓｕｍ）とし、評価値の候補値ａ毎にａに投票する重みの合計（ｓｕ
ｍ）を計算し、前記合計（ｓｕｍ）が最大となる候補値
ａを出力する、ことを特徴とする情報フィルタリングシ
ステム。
【請求項８】前記学習手段が、正解値Ｍ（ｉ，ｊ）に投
票した行ｉ’（Ｏ（ｉ’，ｊ）∈Ｖ（Ｍ（ｉ，ｊ）））
と、行ｉとの間の重みｗ（ｉ，ｉ’）は、（２−γ）倍
し（ただしγは０以上１未満の定数）、Ｍ（ｉ，ｊ）に
投票しないで他の値に投票した行ｉ’（Ｏ（ｉ’，ｊ）
が未定でなく、Ｖ（Ｍ（ｉ，ｊ））に含まれていない）
と行ｉとの間の重みｗ（ｉ，ｉ’）はγ倍とし、重み更
新後、観測行列の（ｉ，ｊ）エントリの値Ｏ（ｉ，ｊ）
を、正解値Ｍ（ｉ，ｊ）に更新する、ことを特徴とする
請求項７記載の情報フィルタリングシステム。
【請求項９】前記予測手段において、任意のユーザｉと
ユーザｉ’間の正しい投票回数のカウンタＣ（ｉ，
ｉ’）と間違った投票回数のカウンタＤ（ｉ，ｉ’）を
用意し、候補値ａに投票する値の集合をＶ（ａ）とし、同じ列ｊ
で値が既に分かっている行ｉ’の値Ｏ（ｉ’，ｊ）が前
記集合Ｖ（ａ）に含まれているような行ｉ’と行ｉとの
間の重みｐｏｗ（２−γ，Ｃ（ｉ，ｉ’））・ｐｏｗ
（γ，Ｄ（ｉ，ｉ’））（ただし、pow（ｘ、ｙ）はｘ
のｙ乗の演算子）の合計を、候補値ａに投票する重みの
合計とする、ことを特徴とする請求項７記載の情報フィ
ルタリングシステム。
【請求項１０】前記学習手段が、正解値Ｍ（ｉ，ｊ）に
投票した行ｉ’（Ｏ（ｉ’，ｊ）∈Ｖ（Ｍ（ｉ，
ｊ）））と行ｉとの間の正しい投票回数を数えるカウン
タＣ（ｉ，ｉ’）に「１」を加え、前記正解値Ｍ（ｉ，
ｊ）に投票しないで他の値に投票した行ｉ’（Ｏ
（ｉ’，ｊ）が未定でなくしかも集合Ｖ（Ｍ（ｉ，
ｊ））に含まれていない）と行ｉとの間の間違った投票
回数を数えるカウンタＤ（ｉ，ｉ’）に「１」を加え、
重みの更新後、観測行列の（ｉ，ｊ）エントリの値Ｏ
（ｉ，ｊ）をＭ（ｉ，ｊ）に更新する、ことを特徴とす
る請求項７又は８記載の情報フィルタリングシステム。
【請求項１１】行ｉ’による行ｉへの投票が正しいと推
測される証拠の量であり直接的な証拠の量Ｃ（ｉ，
ｉ’）と間接的な証拠の量との和であるｃ（ｉ，ｉ’）
と、行ｉ’による行ｉへの投票が間違っていると推測さ
れる証拠の量であり直接的な証拠の量Ｄ（ｉ，ｉ’）と
間接的な証拠の量との和であるｄ（ｉ，ｉ’）を用い、
重みｐｏｗ（２−γ，ｃ（ｉ，ｉ’））・ｐｏｗ（γ，
ｄ（ｉ，ｉ’））（ただし、pow（ｘ、ｙ）はｘのｙ乗
の演算子）の合計を求める、ことを特徴とする請求項９
記載の情報フィルタリングシステム。
【請求項１２】前記間接的な証拠の量が、ｉ’’≠ｉか
つｉ’’≠ｉ’であるようなすべての行ｉ’’につい
て、先ず、行ｉと行ｉ’’との類似度ｇ（ｉ，ｉ’’）
＝Ｃ（ｉ，ｉ’’）−Ｄ（ｉ，ｉ’’）と、行ｉ’と行
ｉ’’との類似度ｇ（ｉ’，ｉ’’）＝Ｃ（ｉ’，
ｉ’’）−Ｄ（ｉ’，ｉ’’）を計算し、ｇ（ｉ，ｉ’’）とｇ（ｉ’，ｉ’’）がともに非負で
あるときのみ、間接的な証拠としてｇ（ｉ，ｉ’’）と
ｇ（ｉ’，ｉ’’）の絶対値の大きくない方を所定倍δ
（但し、δは非負定数）したものを加えることで求め
る、ことを特徴とする請求項９記載の情報フィルタリン
グシステム。
【請求項１３】ユーザの情報に対する評価値の予測を、
過去のユーザＩＤ、情報ＩＤ、評価値の３つ組のデータ
を使って学習したユーザ間の重みによる多数決により、
同じ情報を、既に評価した他のユーザの評価値から行う
情報フィルタリングシステムをコンピュータ上で実現す
るための処理であって、ユーザの情報に対する評価が与えられた時に、その評価
値がその情報に対する予測値に投票するユーザを定める
のに使われた集合に含まれる場合に正解であると定め、（ａ）正解値を予測する際に、評価値の候補値毎に前記
候補値に投票する重みの合計を計算し、重みの合計が最
大となる候補値を出力する処理、（ｂ）正解値に投票する集合に入る場合には１よりも大
きな所定の数を掛けることにより重みを増やし、入らな
い場合には１よりも小さな所定の数を掛けることにより
重みを減らす処理、（ｃ）任意のユーザｉとユーザｉ’の間の重みをｗ
（ｉ，ｉ’）とし、観測した行列エントリ（ただし
（ｉ，ｊ）成分がユーザｉによる情報ｊの評価値とな
る）の値を記憶するための行列を観測行列Ｏ（ｉ，ｊ）
とし、（ｉ，ｊ）エントリの正解値Ｍ（ｉ，ｊ）を予測
する際に、候補値ａに投票する値の集合をＶ（ａ）と
し、同じ列ｊで値が既に分かっている行ｉ’の値Ｏ
（ｉ’，ｊ）が前記集合Ｖ（ａ）に含まれているような
行ｉ’と行ｉとの間の重みｗ（ｉ，ｉ’）の合計を、候
補値ａに投票する重みの合計（ｓｕｍ）とし、評価値の
候補値ａ毎にａに投票する重みの合計（ｓｕｍ）を計算
し、前記合計（ｓｕｍ）が最大となる候補値ａを出力す
る処理、の上記（ａ）、（ｂ）、（ｃ）の処理をコンピュータ上
で実行する為のプログラムを記録した記録媒体。