JP3284972B2 - 情報フィルタリング方法及び方式 - Google Patents

情報フィルタリング方法及び方式

Info

Publication number
JP3284972B2
JP3284972B2 JP15059398A JP15059398A JP3284972B2 JP 3284972 B2 JP3284972 B2 JP 3284972B2 JP 15059398 A JP15059398 A JP 15059398A JP 15059398 A JP15059398 A JP 15059398A JP 3284972 B2 JP3284972 B2 JP 3284972B2
Authority
JP
Japan
Prior art keywords
value
information
user
weight
evaluation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP15059398A
Other languages
English (en)
Other versions
JPH11328275A (ja
Inventor
篤祥 中村
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP15059398A priority Critical patent/JP3284972B2/ja
Publication of JPH11328275A publication Critical patent/JPH11328275A/ja
Application granted granted Critical
Publication of JP3284972B2 publication Critical patent/JP3284972B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Complex Calculations (AREA)

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は情報フィルタリング
技術に関し、特にユーザの情報に対する評価値を他のユ
ーザの情報に対する評価値から予測する協調フィルタリ
ング技術に関する。
【0002】
【従来の技術】情報フィルタリングとは、データベー
ス、パソコン通信、WWW(World Wide Web)等
情報システムが提供する大量の情報や多数のサービスの
中から利用者の興味や嗜好に適うものを選択的に抽出す
るフィルタリング技術である。
【0003】従来より、ユーザの情報に対する評価値を
他のユーザの情報に対する評価値から予測する協調フィ
ルタリング(「Collaborative Filtering」または「So
cialFiltering」とも呼ばれる)としては、Proceedings
of CSCW(1994))掲載の「GroupLens: An Open A
rchitecture for Collaborative Filtering of Ne
tnews」やProceedings of CHI(1995)掲載の「Social
Information Filtering: Algorithms and Automat
ing "Word of Mouth"」に記載されているように、ユ
ーザ間の相関係数を重みとして既に評価済の他のユーザ
の評価値の重み付き平均により予測値を計算する方法が
用いられている。
【0004】また、上記従来の方法における他のユーザ
の評価点が集中していると、集中している値の影響が大
きすぎるという、問題点に対処すべく、例えば特開平9-
265478号公報には、人口密度を考慮する情報フィルタリ
ング方式が提案されている。
【0005】
【発明が解決しようとする課題】しかしながら、上記従
来の情報フィルタリング方式は下記記載の問題点を有し
ている。
【0006】第1の問題点は、例えば100個の情報を
共通に評価していて、その100個に同じ評価をしてい
るユーザ間の重みも、1個の情報を共通に評価している
だけでその1つが同じ評価であるユーザ間も、相関係数
による重みは、同一となる、ということである。
【0007】その理由は、相関係数による方法は、信頼
度を考慮していないからである。
【0008】第2の問題点は、特別評価が似ているユー
ザがいても、そのユーザとの間の重みが他と比べて特別
高くはならない、ということである。
【0009】その理由は、相関係数の値の範囲は−1か
ら1までであるからである。
【0010】第3の問題点は、データの数が少ない時の
予測性能が悪い、ということである。
【0011】その理由は、上記第1、第2の問題点が解
消されていないためである。
【0012】したがって本発明は、上記問題点に鑑みて
なされたものであって、その目的は、信頼度を考慮し、
類似しているユーザ間とそうでないユーザ間の重みの差
がより大きくなるようにユーザ間の重み付けを可能と
し、これにより予測性能を向上する情報フィルタリング
方法及び方式を提供することにある。
【0013】
【課題を解決するための手段】前記目的を達成するた
め、本発明の情報フィルタリング方式は、ユーザの情報
に対する評価値の予測を、過去のユーザ、情報、評価値
の3つ組のデータを使って学習したユーザ間の重みによ
る多数決により、同じ情報を既に評価した他のユーザの
評価値から行う方式であって、各候補値に投票する値の
集合を定義し、該集合に入る場合にその候補値に投票す
る予測手段を備える。
【0014】また本発明の情報フィルタリング方式は、
ユーザの情報に対する評価値の予測を、過去のユーザ、
情報、評価値の3つ組のデータを使って学習したユーザ
間の重みと情報間の重みによる多数決により行う方式で
あって、同じ情報を既に評価した他のユーザの評価値の
みでなく同じユーザの既に評価した他の情報の評価値も
使い、各候補値に投票する値の集合を定義し、該集合に
入る場合にその候補値に投票する予測手段を備える。
【0015】さらに本発明においては、正解値に投票す
る集合に入る場合は1より大きい定数を掛けることによ
り重みを増やし、入らない場合には1より小さい定数を
掛けることにより重みを減らす学習手段を備える。
【0016】
【発明の実施の形態】本発明の実施の形態について以下
に説明する。本発明の情報フィルタリング方式は、その
好ましい実施の形態において、図1を参照すると、各候
補値に投票する値の集合を定義し、その集合に入る評価
値のユーザとの間の重みの合計による多数決により予測
値を決める予測手段(3)を有する。
【0017】また、ユーザ間の重みは、正解に投票した
数と不正解に投票した数からそのユーザ間の予測の正解
度、誤り度を計算し、1に正解度の値だけ1より大きい
数を掛け、誤り度の値だけ1より小さい数を掛けること
により計算する。ユーザ間の重みの学習は計算した値を
記憶するか、または、正解数、誤り数を記憶することに
より行う学習手段(4)を有する。なお、重み記憶部及
び評価点記憶部の初期化を行う初期化手段(2)、予測
手段(3)、及び学習手段(4)は、コンピュータ上で
実行されるプログラムによってその機能を実現すること
ができる。本発明の実施の形態によれば、ユーザ間の重
みを相関係数とし、信頼度を考慮し、類似しているユー
ザ間とそうでないユーザ間の重みの差が大となるように
ユーザ間での重みの差が大となるようにユーザ間での重
み付けを可能とし、少ないデータ数でも予測性能を向上
している。
【0018】
【実施例】次に、上記した本発明の実施の形態について
さらに詳細に説明すべく、本発明の実施例について図面
を参照して詳細に説明する。
【0019】図1は、本発明の一実施例の構成を示すブ
ロック図である。図1を参照すると、本発明の一実施例
は、評価点の入力及び予測点の表示を行う入力装置1
と、重み記憶部5及び評価点記憶部6の初期化を行う初
期化手段2と、与えられたユーザIDと情報IDに対し
て予測点を出力する予測手段3と、入力評価データから
学習して、重み記憶部5を更新し、評価点記憶部6に入
力データを加える学習手段4と、を含む。
【0020】[実施例1]図2乃至図5は、本発明の第
1の実施例の処理フローを説明するための流れ図であ
る。図1乃至図5を参照して、本発明の第1実施例の動
作について詳細に説明する。
【0021】図2は、本発明の第1の実施例における初
期化手段2の処理フローを示す流れ図である。任意のユ
ーザiとユーザi’(i’はi+1〜n、iは1〜n)
の間の重みw(i,i’)を「1」にセットし(ステッ
プ230)、その時までに観測した行列エントリの値
((i,j)成分はユーザiによる情報jの評価値)を
記憶するために使う観測行列の任意のエントリ(i,
j)の値O(i,j)を「?」(未定)にセットする
(ステップ24)。
【0022】図3は、本発明の第1の実施例における予
測手段3の処理フローを示す流れ図である。(i,j)
エントリの値M(i,j)(正解値)を予測するとき、
評価値の候補値a毎にaに投票する重みの合計sumを
計算し(ステップ34)、sumが最大となるaを出力
する(ステップ38)。
【0023】図4は、図3において、sumの計算をす
るステップ34の処理フローの詳細を示す流れ図であ
る。候補値aに投票する値の集合をV(a)とする。同
じ列jで値が既に分かっている行i’の値O(i’,
j)がV(a)に含まれているような行i’と行iとの
間の重みw(i,i’)の合計を、候補値aに投票する
重みの合計sumとする(ステップ34201)。
【0024】図5は、本発明の第1の実施例における学
習手段4の処理フローを示す流れ図である。正解値M
(i,j)に投票した行i’(O(i’,j)∈V(M
(i,j)))と、行iとの間の重みw(i,i’)
は、(2−γ)倍にし(ステップ450)、M(i,
j)に投票しないで他の値に投票した行i’(O
(i’,j)が「?」でなく、しかもV(M(i,
j))に含まれていない)と行iとの間の重みw(i,
i’)はγ倍にする(ステップ460)。但し、γは0
以上1未満の定数である。
【0025】重みの更新後、観測行列の(i,j)エン
トリの値O(i,j)を、M(i,j)に更新する(ス
テップ48)。
【0026】[実施例2]図6乃至図8は、本発明の第
2の実施例の処理フローを説明するための流れ図であ
る。図6乃至図8を参照して本発明の第2の実施例の動
作について詳細に説明する。
【0027】図6は、本発明の第2の実施例における初
期化手段2の処理フローを示す流れ図である。任意のユ
ーザiとユーザi’間の正しい投票回数C(i,i’)
と間違った投票回数D(i,i’)を「0」にセットし
(ステップ231)、その時までに観測した行列エント
リの値((i,j)成分はユーザiによる情報jの評価
値)を記憶するために使う観測行列の任意のエントリ
(i,j)の値O(i,j)を「?」にセットする(ス
テップ24)。
【0028】本発明の第2の実施例における予測手段3
の処理は、図3に示した第1の実施例における予測手段
3の処理フローと同じである。
【0029】図7は、本発明の第2の実施例において、
図3のsumの計算をするステップ34の処理フローを
示す流れ図である。候補値aに投票する値の集合をV
(a)とする。同じ列jで値が既に分かっている行i’
の値O(i’,j)がV(a)に含まれているような行
i’と行iとの間の重みpow(2−γ,C(i,
i’))pow(γ,D(i,i’))の合計を、候補
値aに投票する重みの合計sumとする(ステップ34
211)。但しpow(x,y)はxのy乗を表す。
【0030】図8は、本発明の第2の実施例における学
習手段4の処理フローを示す流れ図である。正解値M
(i,j)に投票した行i’(O(i’,j)∈V(M
(i,j)))と行iとの間の正しい投票回数を数える
カウンタC(i,i’)に1を加え(ステップ45
1)、M(i,j)に投票しないで他の値に投票した行
i’(O(i’,j)は「?」でなくしかもV(M
(i,j))に含まれていない)と行iとの間の間違っ
た投票回数を数えるカウンタD(i,i’)に「1」を
加える(ステップ461)。重みの更新後、観測行列の
(i,j)エントリの値O(i,j)をM(i,j)に
更新する(ステップ48)。
【0031】[実施例3]図9及び図10は、本発明の
第3の実施例の処理フローを説明するための流れ図であ
る。図9及び図10を参照して本発明の第3の実施例の
動作について詳細に説明する。
【0032】本発明の第3の実施例における初期化手段
2の処理は、図6に示した前記第2の実施例における初
期化手段2と同じである。本発明の第3の実施例におけ
る予測手段3の処理は、図3に示した前記第1の実施例
における予測手段3と同じである。
【0033】図9は、本発明の第3の実施例において、
図3の重み合計sumの計算をするステップ34の処理
フローを示す流れ図である。候補値aに投票する値の集
合をV(a)とする。同じ列jで値が既に分かっている
行i’の値O(i’,j)がV(a)に含まれているよ
うな行i’と行iとの間の重みpow(2−γ,c
(i,i’))・pow(γ,d(i,i’))の合計
を、候補値aに投票する重みの合計sumとする(ステ
ップ342−21)。但しpow(x,y)はxのy乗
を表す。
【0034】ここで、計算に使うc(i,i’),d
(i,i’)は、図10に示されている処理に従って算
出する。c(i,i’)は行i’による行iへの投票が
正しいと推測される証拠の量であり直接的な証拠の量C
(i,i’)と間接的な証拠の量との和である。
【0035】直接的な証拠は、ステップ342210で
加算される。
【0036】間接的な証拠は、i’’≠iかつi’’≠
i’であるようなすべての行i’’について計算し加算
する。先ず、行iと行i’’との類似度g(i,
i’’)=C(i,i’’)−D(i,i’’)と、行
i’と行i’’との類似度g(i’,i’’)=C
(i’,i’’)−D(i’,i’’)を計算する(ス
テップ342213)。
【0037】g(i,i’’)とg(i’,i’’)が
ともに非負であるとき(ステップ342214)のみ、
間接的な証拠としてg(i,i’’)とg(i’,
i’’)の絶対値の大きくない方をδ倍したものをc
(i,i’)に加える(ステップ342215)。但
し、δは非負定数である。
【0038】d(i,i’)は行i’による行iへの投
票が間違っていると推測される証拠の量であり直接的な
証拠の量D(i,i’)と間接的な証拠の量との和であ
る。
【0039】直接的な証拠は、ステップ342210で
加算される。
【0040】間接的な証拠は、i’’≠iかつi’’≠
i’であるようなすべての行i’’について計算し加算
する。先ず、行iと行i’’との類似度g(i,
i’’)=C(i,i’’)−D(i,i’’)と行
i’と行i’’との類似度g(i’,i’’)=C
(i’,i’’)−D(i’,i’’)を計算する(ス
テップ342213)。
【0041】g(i,i’’)とg(i’,i’’)の
一方が正でもう一方が負であるとき(ステップ3422
16)のみ、間接的な証拠としてg(i,i’’)とg
(i’,i’’)の絶対値の大きくない方をδ倍したも
のをd(i,i’)に加える(ステップ34221
7)。
【0042】本発明の第3の実施例における学習手段4
の処理フローは、図8に示した前記第2の実施例におけ
る学習手段4と同じである。
【0043】[実施例4]図11乃至図13は、本発明
の第4の実施例の処理フローを説明するための流れ図で
ある。図11及び図13を参照して本発明の第4の実施
例の動作について詳細に説明する。
【0044】図11は、本発明の第4の実施例における
初期化手段2の処理フローを示す流れ図である。前記第
1の実施例における初期化手段2の流れ図(図2)のス
テップ21、22、230、24、25を実行し、w
(i,i’)を’1’にO(i,j)を「?」にセット
する。さらに、任意の情報jと情報j’の間の重みv
(j,j’)を「1」にセットする(ステップ28
0)。
【0045】本発明の第4の実施例における予測手段3
の処理は、図3に示した前記第1の実施例における予測
手段3の処理フローと同じである。
【0046】図12は、本発明の第4の実施例におい
て、図3のsumの計算をするステップ34の処理を示
す流れ図である。候補値aに投票する値の集合をV
(a)とする。
【0047】前記第1の実施例における場合(図4)と
同様に、同じ列jで値が既に分かっている行i’の値O
(i’,j)がV(a)に含まれているような行i’と
行iとの間の重みw(i,i’)の合計を、候補値aに
投票する重みの合計sumとする(ステップ3420
1)。さらに、同じ行iで値が既に分かっている列j’
の値O(i,j’)がV(a)に含まれているような列
j’と列jとの間の重みv(j,j’)の合計を、su
mに加える(ステップ34202)。
【0048】図13は、本発明の第4の実施例における
学習手段4の処理フローを示す流れ図である。前記第1
の実施例における学習手段4の処理フローを示す流れ図
である図5のステップ41、42、43、44、45
0、460、47を実行し、w(i,i’)を更新す
る。
【0049】さらに、正解値M(i,j)に投票した列
j’(O(i,j’)∈V(M(i,j)))と列jと
の間の重みv(j,j’)は(2−γ)倍にし(ステッ
プ4d0)、M(i,j)に投票しないで他の値に投票
した列j’(O(i,j’)は「?」でなくしかもV
(M(i,j))に含まれていない)と列jとの間の重
みv(j,j’)はγ倍にする(ステップ4e0)。但
し、γは0以上1未満の定数である。重みの更新後、観
測行列の(i,j)エントリの値O(i,j)をM
(i,j)に更新する(ステップ48)。
【0050】[実施例5]図14乃至図16は、本発明
の第5の実施例の処理フローを説明するための流れ図で
ある。図14及び図16を参照して本発明の第5の実施
例の動作について詳細に説明する。
【0051】図14は、本発明の第5の実施例における
初期化手段2の処理フローを示す流れ図である。前記第
2の実施例における初期化手段2の流れ図である図6の
ステップ21、22、231、24、25を実行しC
(i,i’)とD(i,i’)を’0’にセットし、O
(i,j)を「?」にセットする。
【0052】さらに、任意の情報jと情報j’間の正し
い投票回数E(j,j’)と間違った投票回数F(j,
j’)を’0’にセットする(ステップ281)。
【0053】本発明の第5の実施例における予測手段3
の処理フローは、図3に示した前記第1の実施例におけ
る予測手段3の処理と同じである。
【0054】図15は、本発明の第5の実施例におい
て、図3のsumの計算をするステップ34の処理フロ
ーを示す流れ図である。
【0055】候補値aに投票する値の集合をV(a)と
する。前記第2の実施例における場合(図7)と同様
に、同じ列jで値が既に分かっている行i’の値O
(i’,j)がV(a)に含まれているような行i’と
行iとの間の重みpow(2−γ,C(i,i’))p
ow(γ,D(i,i’))の合計を、候補値aに投票
する重みの合計sumとする(ステップ34211)。
但しpow(x,y)はxのy乗を表す。
【0056】さらに、同じ行iで値が既に分かっている
列j’の値O(i,j’)がV(a)に含まれているよ
うな列j’と列jとの間の重みpow(2−γ,E
(j,j’))pow(γ,F(j,j’))の合計
を、sumに加える(ステップ34212)。
【0057】図16は、本発明の第5の実施例における
学習手段4の処理フローを示す流れ図である。前記第2
の実施例における学習手段4と同様に、図8のステップ
41、42、43、44、451、461、47を実行
しC(i,i’)とD(i,i’)を更新する。さら
に、正解値M(i,j)に投票した列j’(O(i,
j’)∈V(M(i,j)))と列jとの間の正しい投
票回数を数えるカウンタE(j,j’)に1を加え(ス
テップ4d1)、M(i,j)に投票しないで他の値に
投票した列j’(O(i,j’)は「?」でなく、しか
もV(M(i,j))に含まれていない)と列jとの間
の間違った投票回数を数えるカウンタF(j,j’)に
「1」を加える(ステップ4e1)。重みの更新後、観
測行列の(i,j)エントリの値O(i,j)をM
(i,j)に更新する(ステップ48)。
【0058】[実施例6]図17乃び図18は、本発明
の第6の実施例の処理フローを説明するための流れ図で
ある。図17及び図18を参照して本発明の第6の実施
例の動作について詳細に説明する。
【0059】本発明の第6の実施例における初期化手段
2の処理は、図14に示した前記第5の実施例における
初期化手段2の処理フローと同じである。
【0060】本発明の第6の実施例における予測手段3
の処理は、図3に示した前記第1の実施例における予測
手段3の処理フローと同じである。前記第3の実施例に
おける場合(図9)と同様に、同じ列jで値が既に分か
っている行i’の値O(i’,j)がV(a)に含まれ
ているような行i’と行iとの間の重みpow(2−
γ,c(i,i’))pow(γ,d(i,i’))の
合計を、候補値aに投票する重みの合計sumとする
(ステップ34221)。但しpow(x,y)はxの
y乗を表す。ここで計算に使うc(i,i’),d
(i,i’)は、図10に示されている処理に従って算
出する。
【0061】さらに同じ行iで値が既に分かっている列
j’の値O(i,j’)がV(a)に含まれているよう
な列j’と列jとの間の重みpow(2−γ,e(j,
j’))pow(γ,f(j,j’))の合計を、su
mに加える(ステップ34222)。ここで計算に使う
e(j,j’),f(j,j’)は、図18に示されて
いる処理に従って算出する。
【0062】e(j,j’)は列j’による列jへの投
票が正しいと推測される証拠の量であり、直接的な証拠
の量E(j,j’)と間接的な証拠の量との和である。
【0063】直接的な証拠は、ステップ342220で
加算される。
【0064】間接的な証拠は、j’’≠jかつj’’≠
j’であるようなすべての列j’’について計算し加算
する。
【0065】先ず、列jと列j’’との類似度g(j,
j’’)=E(j,j’’)−F(j,j’’)と、列
j’と列j’’との類似度g(j’,j’’)=E
(j’,j’’)−F(j’,j’’)を計算する(ス
テップ342223)。
【0066】g(j,j’’)とg(j’,j’’)が
ともに非負であるとき(ステップ342224)のみ、
間接的な証拠としてg(j,j’’)とg(j’,
j’’)の絶対値の大きくない方をδ倍したものをe
(j,j’)に加える(ステップ342225)。但
し、δは非負定数である。f(j,j’)は列j’によ
る列jへの投票が間違っていると推測される証拠の量で
あり直接的な証拠の量F(j,j’)と間接的な証拠の
量との和である。
【0067】直接的な証拠は、ステップ342220で
加算される。
【0068】間接的な証拠は、j’’≠jかつj’’≠
j’であるようなすべての列j’’について計算し加算
する。先ず、列jと列j’’との類似度g(j,
j’’)=E(j,j’’)−F(j,j’’)と列
j’と列j’’との類似度g(j’,j’’)=E
(j’,j’’)−F(j’,j’’)を計算する(ス
テップ342223)。
【0069】g(j,j’’)とg(j’,j’’)の
一方が正でもう一方が負であるとき(ステップ3422
26)のみ、間接的な証拠としてg(j,j’’)とg
(j’,j’’)の絶対値の大きくない方をδ倍したも
のをf(j,j’)に加える(ステップ34222
7)。
【0070】なお、本発明の第6の実施例における学習
手段4の処理フローは、図16に示した前記第5の実施
例における学習手段4の処理フローと同じである。
【0071】
【発明の効果】以上説明したように、本発明によれば下
記記載の効果を奏する。
【0072】本発明の第1の効果は、ユーザ間の重みが
信頼度を考慮した値に設定される、ということである。
【0073】その理由は、本発明においては、共通に評
価している情報の数が少ないユーザ間の重みは特別に大
きくなったり小さくなったりすることがないからであ
る。
【0074】本発明の第2の効果は、類似しているユー
ザ間とそうでないユーザ間の重みの差が、従来法よりも
大きくなる、ということである。
【0075】その理由は、本発明においては、相関係数
法よりも重みの取り得る値の幅が大きく、データの数の
増加に伴って重みの差が大きくなっていくように構成し
たためである。
【0076】本発明の第3の効果は、データの数が少な
い時の予測性能を向上する、ということである。
【0077】その理由は、本発明においては、重みの更
新がかけ算であるために、学習が速く、さらに同じユー
ザの他の情報に対する評価値も使ったり、同じ情報に対
する評価値の分かっていないユーザ間の重みや、同じユ
ーザに対する評価値の分かっていない情報間の重みを使
う方法を行うことで、より多くの情報に基づいて予測し
ているからである。
【図面の簡単な説明】
【図1】本発明の実施の形態の構成を示すブロック図で
ある。
【図2】本発明の第1の実施例における初期化手段の処
理フローを示す流れ図である。
【図3】本発明の第1の実施例における予測手段を示す
流れ図である。
【図4】本発明の第1の実施例における予測手段のステ
ップ34(図3)の詳細を示す流れ図である。
【図5】本発明の第1の実施例における学習手段の処理
フローを示す流れ図である。
【図6】本発明の第2の実施例における初期化手段の処
理フローを示す流れ図である。
【図7】本発明の第2の実施例における予測手段のステ
ップ34(図3)の詳細を示す流れ図である。
【図8】本発明の第2の実施例における学習手段の処理
フローを示す流れ図である。
【図9】本発明の第3の実施例における予測手段のステ
ップ34(図3参照)の詳細を示す流れ図である。
【図10】本発明の第3の実施例における、図9のステ
ップ34221の詳細を示す流れ図である。
【図11】本発明の第4の実施例における初期化手段の
処理フローを示す流れ図である。
【図12】本発明の第4の実施例における予測手段のス
テップ34(図3参照)の詳細を示す流れ図である。
【図13】本発明の第4の実施例における学習手段の処
理フローを示す流れ図である。
【図14】本発明の第5の実施例における初期化手段の
処理フローを示す流れ図である。
【図15】本発明の第5の実施例における予測手段のス
テップ34(図3参照)の詳細を示す流れ図である。
【図16】本発明の第5の実施例における学習手段の処
理フローを示す流れ図である。
【図17】本発明の第6の実施例における予測手段のス
テップ34(図3参照)の詳細を示す流れ図である。
【図18】本発明の第6の実施例における、図17のス
テップ34222の詳細を示す流れ図である。
【符号の説明】
1 入出力装置 2 初期化手段 3 予測手段 4 学習手段 5 重み記憶部 6 評価点記憶部
フロントページの続き (56)参考文献 特開 平9−265478(JP,A) 特開 平7−234881(JP,A) 特開 平9−81630(JP,A) 特開 平10−91686(JP,A) 国際公開97/2537(WO,A1) 鈴木義一郎、グラフィック統計学,日 本,実教出版株式会社,1997年11月28日 有吉,市山,多変量解析を用いたソー シャル情報フィルタリング,情報処理学 会研究報告,日本,社団法人 情報処理 学会,1998年 9月17日,Vol.98, No.82(98−NL−127),p.17− 24 有吉,市山,目利き利用者の発見と利 用によるソーシャルフィルタリング方 式,情報処理学会全国大会講演論文集, 日本,社団法人 情報処理学会,1996年 9月 4日,第53回(平成8年後 期),p.3−25〜3−26 有吉,市山,内容に応じた配送を行う 情報流通システム:情報発信型エージェ ント情報処理学会全国大会講演論文集, 日本,社団法人 情報処理学会,1998年 3月17日,第56回(平成10年前期), p.3−246〜3−247 (58)調査した分野(Int.Cl.7,DB名) G06F 17/30 JICSTファイル(JOIS)

Claims (13)

    (57)【特許請求の範囲】
  1. 【請求項1】ユーザの情報に対する評価値の予測を、過
    去のユーザ、情報、評価値の3つ組のデータを使って学
    習したユーザ間の重みによる多数決により同じ情報を既
    に評価した他のユーザの評価値から行う方式であって、予測対象情報の各候補値に対しそれに投票するユーザを
    そのユーザが予測対象情報に与えた評価値があらかじめ
    定められた集合に含まれるか否かで定め、含まれる場合
    には、その候補値に、予測対象ユーザとそのユーザとの
    間の重み を投票する予測手段と、 重みを保持せず、ユーザの情報に対する評価が与えられ
    た時に、その評価値がその情報に対する予測値に投票す
    るユーザを定めるのに使われた集合に含まれる場合に正
    解であると定め、予測の正解数と誤り数をそれぞれ計数
    する計数手段を備え、 前記予測手段は、前記計数手段のカウンタ値からユーザ
    間の重みを計算し、 正解値に投票する集合に入る場合には正解数の計数手段
    の計数値を増やし、入らない場合には誤り数の計数手段
    の計数値を増やす学習手段と、 を備えたことを特徴とする情報フィルタリング方式。
  2. 【請求項2】ユーザの情報に対する評価値の予測を、過
    去のユーザ、情報、評価値の3つ組のデータを使って学
    習したユーザ間の重みと情報間の重みによる多数決によ
    り行う方式であって、 同じ情報を既に評価した他のユーザの評価値のみでな
    く、同じユーザの既に評価した他の情報の評価値も使
    い、予測対象情報の各候補値に対しそれに投票するユー
    ザをそのユーザが予測対象情報に与えた評価値があらか
    じめ定められた集合に含まれるか否かで定め、含まれる
    場合には、その候補値に、予測対象ユーザとそのユーザ
    との間の重みを投票する予測手段と、 重みを保持せず、ユーザの情報に対する評価が与えられ
    た時に、その評価値がその情報に対する予測値に投票す
    るユーザを定めるのに使われた集合に含まれる場合に正
    解であると定め、予測の正解数と誤り数をそれぞれ計数
    する計数手段を備え、 前記予測手段は、前記計数手段のカウンタ値からユーザ
    間と情報間の重みを計算し、 正解値に投票する集合に入る場合には正解数の計数手段
    の計数値を増やし、入らない場合には誤り数の計数手段
    の計数値を増やす学習手段と、 を備えたことを特徴とする情報フィルタリング方式。
  3. 【請求項3】前記学習手段が、正解値に投票する集合に
    入る場合には1よりも大きな所定の数を掛けることによ
    り重みを増やし、入らない場合には1よりも小さな所定
    の数を掛けることにより重みを減らすことを特徴とする
    請求項1または2記載の情報フィルタリング方式。
  4. 【請求項4】前記予測手段が、正解数と誤り数の計数手
    段からユーザiと他のユーザi’の間の重みを計算する
    際に、それらユーザ間の計数値のみでなく、他の全て
    のユーザi’’と前記ユーザiとの間の計数値、及び
    ーザi’’と前記ユーザi’との間の計数値を使って、
    ユーザ間の重みを算出し、情報jと他の情報j’の間の
    重みを計算する際に、それらの情報間の計数値のみでな
    く、他の全ての情報j’’と前記情報jとの間の計数
    値、及び情報j’’と前記情報j’との間の計数値を使
    って情報間の重みを算出する、ことを特徴とする請求項
    1又は2記載の情報フィルタリング方式。
  5. 【請求項5】ユーザの情報に対する評価値の予測を、過
    去のユーザ、情報、評価値の3つ組のデータを使って学
    習したユーザ間の重みによる多数決により同じ情報を既
    に評価した他のユーザの評価値から行う方法であって、予測対象情報の各候補値に対しそれに投票するユーザを
    そのユーザが予測対象情報に与えた評価値があらかじめ
    定められた集合に含まれるか否かで定め、含まれる場合
    には、その候補値に、予測対象ユーザとそのユーザとの
    間の重みを 投票し、 重みを保持せず、ユーザの情報に対する評価が与えられ
    た時に、その評価値が その情報に対する予測値に投票す
    るユーザを定めるのに使われた集合に含まれる場合に正
    解であると定め、予測の正解数と誤り数をそれぞれ計数
    部で計数し、 前記計数部のカウンタ値からユーザ間の重みを計算し、 正解値に投票する集合に入る場合には正解数の計数部の
    計数値を増やし、入らない場合には誤り数の計数部の計
    数値を増やす、学習を行う、 ことを特徴とする情報フィルタリング方法。
  6. 【請求項6】正解値を予測する際に、評価値の候補値毎
    に前記候補値に投票する重みの合計を計算し、重みの合
    計が最大となる候補値を出力し、 正解値に投票する集合に入る場合には1よりも大きな所
    定の数を掛けることにより重みを増やし、入らない場合
    には1よりも小さな所定の数を掛けることにより重みを
    減らす、ことを特徴とする請求項5記載の情報フィルタ
    リング方法。
  7. 【請求項7】評価点の入力及び予測点の表示を行う入出
    力手段と、 重みを記憶する重み記憶部と、 評価点を記憶する評価点記憶部と、 前記重み記憶部及び評価点記憶部の初期化を行う初期化
    手段と、 与えられたユーザIDと情報IDに対して予測点を出力
    する予測手段と、 入力評価データから学習して前記重み記憶部を更新し、
    前記評価点記憶部に入力データを加える学習手段と、を
    備え、ユーザの情報に対する評価が与えられた時に、その評価
    値がその情報に対する予測値に投票するユーザを定める
    のに使われた集合に含まれる場合に正解であると定め、 前記予測手段が、正解値を予測する際に、評価値の候補
    値毎に前記候補値に投票する重みの合計を計算し、重み
    の合計が最大となる候補値を出力し、 前記学習手段が、正解値に投票する集合に入る場合には
    1よりも大きな所定の数を掛けることにより重みを増や
    し、入らない場合には1よりも小さな所定の数を掛ける
    ことにより重みを減らし、 前記予測手段において、任意のユーザiとユーザi’の
    間の重みをw(i,i’)とし、観測した行列エントリ
    (ただし(i,j)成分がユーザiによる情報jの評価
    値となる)の値を記憶するための行列を観測行列O
    (i,j)とし、(i,j)エントリの正解値M(i,
    j)を予測する際に、候補値aに投票する値の集合をV
    (a)とし、同じ列jで値が既に分かっている行i’の
    値O(i’,j)が前記集合V(a)に含まれているよ
    うな行i’と行iとの間の重みw(i,i’)の合計
    を、候補値aに投票する重みの合計(sum)とし、 評価値の候補値a毎にaに投票する重みの合計(su
    m)を計算し、前記合計(sum)が最大となる候補値
    aを出力する、ことを特徴とする情報フィルタリングシ
    ステム。
  8. 【請求項8】前記学習手段が、正解値M(i,j)に投
    票した行i’(O(i’,j)∈V(M(i,j)))
    と、行iとの間の重みw(i,i’)は、(2−γ)倍
    し(ただしγは0以上1未満の定数)、M(i,j)に
    投票しないで他の値に投票した行i’(O(i’,j)
    が未定でなく、V(M(i,j))に含まれていない)
    と行iとの間の重みw(i,i’)はγ倍とし、重み更
    新後、観測行列の(i,j)エントリの値O(i,j)
    を、正解値M(i,j)に更新する、ことを特徴とする
    請求項7記載の情報フィルタリングシステム。
  9. 【請求項9】前記予測手段において、任意のユーザiと
    ユーザi’間の正しい投票回数のカウンタC(i,
    i’)と間違った投票回数のカウンタD(i,i’)を
    用意し、 候補値aに投票する値の集合をV(a)とし、同じ列j
    で値が既に分かっている行i’の値O(i’,j)が前
    記集合V(a)に含まれているような行i’と行iとの
    間の重みpow(2−γ,C(i,i’))・pow
    (γ,D(i,i’))(ただし、pow(x、y)はx
    のy乗の演算子)の合計を、候補値aに投票する重みの
    合計とする、ことを特徴とする請求項7記載の情報フィ
    ルタリングシステム。
  10. 【請求項10】前記学習手段が、正解値M(i,j)に
    投票した行i’(O(i’,j)∈V(M(i,
    j)))と行iとの間の正しい投票回数を数えるカウン
    タC(i,i’)に「1」を加え、前記正解値M(i,
    j)に投票しないで他の値に投票した行i’(O
    (i’,j)が未定でなくしかも集合V(M(i,
    j))に含まれていない)と行iとの間の間違った投票
    回数を数えるカウンタD(i,i’)に「1」を加え、
    重みの更新後、観測行列の(i,j)エントリの値O
    (i,j)をM(i,j)に更新する、ことを特徴とす
    る請求項7又は8記載の情報フィルタリングシステム。
  11. 【請求項11】行i’による行iへの投票が正しいと推
    測される証拠の量であり直接的な証拠の量C(i,
    i’)と間接的な証拠の量との和であるc(i,i’)
    と、行i’による行iへの投票が間違っていると推測さ
    れる証拠の量であり直接的な証拠の量D(i,i’)と
    間接的な証拠の量との和であるd(i,i’)を用い、
    重みpow(2−γ,c(i,i’))・pow(γ,
    d(i,i’))(ただし、pow(x、y)はxのy乗
    の演算子)の合計を求める、ことを特徴とする請求項9
    記載の情報フィルタリングシステム。
  12. 【請求項12】前記間接的な証拠の量が、i’’≠iか
    つi’’≠i’であるようなすべての行i’’につい
    て、先ず、行iと行i’’との類似度g(i,i’’)
    =C(i,i’’)−D(i,i’’)と、行i’と行
    i’’との類似度g(i’,i’’)=C(i’,
    i’’)−D(i’,i’’)を計算し、 g(i,i’’)とg(i’,i’’)がともに非負で
    あるときのみ、間接的な証拠としてg(i,i’’)と
    g(i’,i’’)の絶対値の大きくない方を所定倍δ
    (但し、δは非負定数)したものを加えることで求め
    る、ことを特徴とする請求項9記載の情報フィルタリン
    グシステム。
  13. 【請求項13】ユーザの情報に対する評価値の予測を、
    過去のユーザID、情報ID、評価値の3つ組のデータ
    を使って学習したユーザ間の重みによる多数決により、
    同じ情報を、既に評価した他のユーザの評価値から行う
    情報フィルタリングシステムをコンピュータ上で実現す
    るための処理であって、ユーザの情報に対する評価が与えられた時に、その評価
    値がその情報に対する 予測値に投票するユーザを定める
    のに使われた集合に含まれる場合に正解であると定め、 (a)正解値を予測する際に、評価値の候補値毎に前記
    候補値に投票する重みの合計を計算し、重みの合計が最
    大となる候補値を出力する処理、 (b)正解値に投票する集合に入る場合には1よりも大
    きな所定の数を掛けることにより重みを増やし、入らな
    い場合には1よりも小さな所定の数を掛けることにより
    重みを減らす処理、 (c)任意のユーザiとユーザi’の間の重みをw
    (i,i’)とし、観測した行列エントリ(ただし
    (i,j)成分がユーザiによる情報jの評価値とな
    る)の値を記憶するための行列を観測行列O(i,j)
    とし、(i,j)エントリの正解値M(i,j)を予測
    する際に、候補値aに投票する値の集合をV(a)と
    し、同じ列jで値が既に分かっている行i’の値O
    (i’,j)が前記集合V(a)に含まれているような
    行i’と行iとの間の重みw(i,i’)の合計を、候
    補値aに投票する重みの合計(sum)とし、評価値の
    候補値a毎にaに投票する重みの合計(sum)を計算
    し、前記合計(sum)が最大となる候補値aを出力す
    る処理、 の上記(a)、(b)、(c)の処理をコンピュータ上
    で実行する為のプログラムを記録した記録媒体。
JP15059398A 1998-05-14 1998-05-14 情報フィルタリング方法及び方式 Expired - Fee Related JP3284972B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP15059398A JP3284972B2 (ja) 1998-05-14 1998-05-14 情報フィルタリング方法及び方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP15059398A JP3284972B2 (ja) 1998-05-14 1998-05-14 情報フィルタリング方法及び方式

Publications (2)

Publication Number Publication Date
JPH11328275A JPH11328275A (ja) 1999-11-30
JP3284972B2 true JP3284972B2 (ja) 2002-05-27

Family

ID=15500282

Family Applications (1)

Application Number Title Priority Date Filing Date
JP15059398A Expired - Fee Related JP3284972B2 (ja) 1998-05-14 1998-05-14 情報フィルタリング方法及び方式

Country Status (1)

Country Link
JP (1) JP3284972B2 (ja)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6952678B2 (en) * 2000-09-01 2005-10-04 Askme Corporation Method, apparatus, and manufacture for facilitating a self-organizing workforce
JP3995074B2 (ja) 2001-05-29 2007-10-24 富士通株式会社 情報閲覧支援方法,プログラム及び情報閲覧支援装置
US7143054B2 (en) * 2001-07-02 2006-11-28 The Procter & Gamble Company Assessment of communication strengths of individuals from electronic messages
JP4326174B2 (ja) * 2001-10-04 2009-09-02 ソニー株式会社 情報処理システム、情報処理装置および方法、記録媒体、並びにプログラム

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5583763A (en) * 1993-09-09 1996-12-10 Mni Interactive Method and apparatus for recommending selections based on preferences in a multi-user system
IL118580A0 (en) * 1995-06-30 1996-10-16 Massachusetts Inst Technology Method and apparatus for item recommendation using automated collaborative filtering
JPH0981630A (ja) * 1995-09-13 1997-03-28 Toshiba Corp 評価機能付き情報提供システム
JP2800769B2 (ja) * 1996-03-29 1998-09-21 日本電気株式会社 情報フィルタリング方式
JPH1091686A (ja) * 1996-09-17 1998-04-10 Hitachi Ltd サービス提供方法

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
有吉,市山,内容に応じた配送を行う情報流通システム:情報発信型エージェント情報処理学会全国大会講演論文集,日本,社団法人 情報処理学会,1998年 3月17日,第56回(平成10年前期),p.3−246〜3−247
有吉,市山,多変量解析を用いたソーシャル情報フィルタリング,情報処理学会研究報告,日本,社団法人 情報処理学会,1998年 9月17日,Vol.98,No.82(98−NL−127),p.17−24
有吉,市山,目利き利用者の発見と利用によるソーシャルフィルタリング方式,情報処理学会全国大会講演論文集,日本,社団法人 情報処理学会,1996年 9月 4日,第53回(平成8年後期),p.3−25〜3−26
鈴木義一郎、グラフィック統計学,日本,実教出版株式会社,1997年11月28日

Also Published As

Publication number Publication date
JPH11328275A (ja) 1999-11-30

Similar Documents

Publication Publication Date Title
Omi et al. Fully neural network based model for general temporal point processes
Papadopoulos Inductive conformal prediction: Theory and application to neural networks
Kim et al. Fractional hot deck imputation
Esteban et al. Small area estimation of proportions under area-level compositional mixed models
Laqueur et al. SuperMICE: An ensemble machine learning approach to multiple imputation by chained equations
US20210374582A1 (en) Enhanced Techniques For Bias Analysis
Khabazian et al. Vulnerability analysis of the financial network
CN111079009A (zh) 一种用于政务地图服务的用户兴趣检测方法及系统
Inamura Estimating continuous time transition matrices from discretely observed data
Lu et al. Estimation of Sobol's sensitivity indices under generalized linear models
CN114330752A (zh) 排序模型训练方法和排序方法
Christopher et al. Missing value analysis of numerical data using fractional hot deck imputation
D'Orazio et al. Package ‘StatMatch’
Adelfio et al. Financial contagion through space-time point processes
JP3284972B2 (ja) 情報フィルタリング方法及び方式
CN111402028A (zh) 一种信息处理方法、装置及设备
Liefooghe et al. Dominance, indicator and decomposition based search for multi-objective QAP: landscape analysis and automated algorithm selection
Almomani et al. Selecting a good stochastic system for the large number of alternatives
CN116451841A (zh) 企业贷款违约概率预测方法、装置、电子设备和存储介质
CN115099933A (zh) 一种业务预算方法、装置及设备
Inoue et al. Estimating customer impatience in a service system with unobserved balking
Yuan et al. High-dimensional inference for linear model with correlated errors
Jaspersen Convex combinations in judgment aggregation
US20200410586A1 (en) Adjusting Method and Adjusting Device, Server and Storage Medium for Scorecard Model
Fan et al. Tests and variables selection on regression analysis for massive datasets

Legal Events

Date Code Title Description
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20020205

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080308

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090308

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090308

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100308

Year of fee payment: 8

LAPS Cancellation because of no payment of annual fees