JP2019114053A - 推薦装置、推薦方法及び推薦プログラム - Google Patents
推薦装置、推薦方法及び推薦プログラム Download PDFInfo
- Publication number
- JP2019114053A JP2019114053A JP2017247025A JP2017247025A JP2019114053A JP 2019114053 A JP2019114053 A JP 2019114053A JP 2017247025 A JP2017247025 A JP 2017247025A JP 2017247025 A JP2017247025 A JP 2017247025A JP 2019114053 A JP2019114053 A JP 2019114053A
- Authority
- JP
- Japan
- Prior art keywords
- matrix
- evaluation
- factor matrix
- value
- elements
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
Description
そこで、ポイゾニング攻撃への対策として、ユーザの評価データに主成分分析を適用し、分散の大きい、例えば第3主成分までの主成分に対して貢献度の高いユーザを正常なユーザと考え、それ以外のユーザを削除する方法がある。
図1は、本実施形態に係る推薦装置1の機能構成を示す図である。
推薦装置1は、サーバ装置又はパーソナルコンピュータ等の情報処理装置(コンピュータ)であり、制御部10、記憶部20、及び各種の入出力デバイスを備える。
推薦装置1は、これらの機能部が協働することで、ユーザに対する協調フィルタリングによるアイテム推薦を実現する。すなわち、推薦装置1は、複数ユーザの複数アイテムに対する評価値を要素とする評価行列を入力として、この評価行列を分解したユーザ因子行列及びアイテム因子行列を掛け合わせることにより、評価値を補完した補完行列を出力する。
このとき、削除処理部13は、想定されるポイゾニング攻撃に用いられる毒データの最小量に基づいて、所定の割合を決定する。
Mをm人のユーザのn個のアイテムに対する評価行列とする。Mi,jは、評価行列Mのi番目の行(ユーザ)のj番目の列(アイテム)の評価を示す。
Ωを評価行列Mにおいて評価が観測された要素のインデックス集合とする。RΩ(A)は、行列Aが与えられたときに、(i,j)∈ΩであればAi,jを返し、そうでなければ0を返す関数とする。
推薦装置1は、これらの補完された値を評価の予測値として利用し、予測値が高いアイテムをユーザに推薦する。
図2は、本実施形態に係る推薦装置1における補完行列の生成処理を示すフローチャートである。
なお、V0 3は、RΩ0(M)から導出されるため、未観測の評価値にも0が補完されており、n行3列の全ての要素に値が設定される。
したがって、推薦装置1は、総和の大きさが下位の行を評価行列から削除することで、分散が小さい因子へ貢献しているユーザを削除できる。毒データは特定の目的をもって作られることから分散が小さいため、この方法により毒データが削除される。
さらに、推薦装置1は、このような毒データに共通な特性を用いているため、異なる種類のポイゾニング攻撃に包括して有効である。
各部分集合には、それぞれ毒データが混入している可能性があるため、推薦装置1は、最初の特異値分解で得られた右特異ベクトルについて4列目以降を削除した状態で保管しておき、他の部分集合に対応する評価行列それぞれに、保管しておいた右特異ベクトルを右から掛け合わせ、行毎の総和を計算し、総和の大きさが下位の評価値を削除する。ここで、部分集合は評価行列からランダムに生成されるため、削除する割合はすべての部分集合で同じとする。これにより、部分集合毎に行列分解を行う必要がないため、計算量が交互最小二乗法における元のオーダと変わらない。
10 制御部
11 初期処理部
12 抽出処理部
13 削除処理部
14 算出処理部
15 出力部
20 記憶部
Claims (4)
- 複数ユーザの複数アイテムに対する評価値を要素とする評価行列を入力として、当該評価行列を分解したユーザ因子行列及びアイテム因子行列を掛け合わせることにより、評価値を補完した補完行列を出力する推薦装置であって、
前記評価行列の列毎に、観測された各評価値について平均値からの差分で当該評価値を更新する初期処理部と、
前記観測された各評価値を複数の部分集合にランダムに分割した後、前記評価行列の各要素のうち、1番目の部分集合に対応する要素以外をゼロとした行列を特異値分解し、所定数の左特異ベクトルからなる初期ユーザ因子行列、及び設定された主成分数の右特異ベクトルからなる主成分アイテム因子行列を算出する抽出処理部と、
前記評価行列の要素のうち、前記複数の部分集合それぞれに対応する要素以外をゼロとした各行列に、前記主成分アイテム因子行列を掛け、各行の総和が大きい方から前記部分集合の数に応じた所定の割合を残して、他の行に対応する当該部分集合の評価値をゼロに更新する削除処理部と、
前記初期ユーザ因子行列の各行のうち、前記削除処理部により前記1番目の部分集合の評価値を更新した行の値をゼロに更新した後、前記削除処理部により更新された2番目以降の部分集合を順に用いて、交互最小二乗法により、前記ユーザ因子行列及び前記アイテム因子行列の転置の積と当該部分集合との2次のフロベニウスノルムを最小化する前記アイテム因子行列及び前記ユーザ因子行列を交互に算出する算出処理部と、
前記算出処理部により算出された前記ユーザ因子行列及び前記アイテム因子行列の転置の積に対して、列毎に前記平均値を加算した前記補完行列を出力する出力部と、を備える推薦装置。 - 前記削除処理部は、ポイゾニング攻撃に用いられる毒データの最小量に基づいて、前記所定の割合を決定する請求項1に記載の推薦装置。
- コンピュータが複数ユーザの複数アイテムに対する評価値を要素とする評価行列を入力として、当該評価行列を分解したユーザ因子行列及びアイテム因子行列を掛け合わせることにより、評価値を補完した補完行列を出力する推薦方法であって、
前記評価行列の列毎に、観測された各評価値について平均値からの差分で当該評価値を更新する初期処理ステップと、
前記観測された各評価値を複数の部分集合にランダムに分割した後、前記評価行列の各要素のうち、1番目の部分集合に対応する要素以外をゼロとした行列を特異値分解し、所定数の左特異ベクトルからなる初期ユーザ因子行列、及び設定された主成分数の右特異ベクトルからなる主成分アイテム因子行列を算出する抽出処理ステップと、
前記評価行列の要素のうち、前記複数の部分集合それぞれに対応する要素以外をゼロとした各行列に、前記主成分アイテム因子行列を掛け、各行の総和が大きい方から前記部分集合の数に応じた所定の割合を残して、他の行に対応する当該部分集合の評価値をゼロに更新する削除処理ステップと、
前記初期ユーザ因子行列の各行のうち、前記削除処理ステップにおいて前記1番目の部分集合の評価値を更新した行の値をゼロに更新した後、前記削除処理ステップにおいて更新された2番目以降の部分集合を順に用いて、交互最小二乗法により、前記ユーザ因子行列及び前記アイテム因子行列の転置の積と当該部分集合との2次のフロベニウスノルムを最小化する前記アイテム因子行列及び前記ユーザ因子行列を交互に算出する算出処理ステップと、
前記算出処理ステップにおいて算出された前記ユーザ因子行列及び前記アイテム因子行列の転置の積に対して、列毎に前記平均値を加算した前記補完行列を出力する出力ステップと、を実行する推薦方法。 - コンピュータに、複数ユーザの複数アイテムに対する評価値を要素とする評価行列を入力として、当該評価行列を分解したユーザ因子行列及びアイテム因子行列を掛け合わせることにより、評価値を補完した補完行列を出力させるための推薦プログラムであって、
前記評価行列の列毎に、観測された各評価値について平均値からの差分で当該評価値を更新する初期処理ステップと、
前記観測された各評価値を複数の部分集合にランダムに分割した後、前記評価行列の各要素のうち、1番目の部分集合に対応する要素以外をゼロとした行列を特異値分解し、所定数の左特異ベクトルからなる初期ユーザ因子行列、及び設定された主成分数の右特異ベクトルからなる主成分アイテム因子行列を算出する抽出処理ステップと、
前記評価行列の要素のうち、前記複数の部分集合それぞれに対応する要素以外をゼロとした各行列に、前記主成分アイテム因子行列を掛け、各行の総和が大きい方から前記部分集合の数に応じた所定の割合を残して、他の行に対応する当該部分集合の評価値をゼロに更新する削除処理ステップと、
前記初期ユーザ因子行列の各行のうち、前記削除処理ステップにおいて前記1番目の部分集合の評価値を更新した行の値をゼロに更新した後、前記削除処理ステップにおいて更新された2番目以降の部分集合を順に用いて、交互最小二乗法により、前記ユーザ因子行列及び前記アイテム因子行列の転置の積と当該部分集合との2次のフロベニウスノルムを最小化する前記アイテム因子行列及び前記ユーザ因子行列を交互に算出する算出処理ステップと、
前記算出処理ステップにおいて算出された前記ユーザ因子行列及び前記アイテム因子行列の転置の積に対して、列毎に前記平均値を加算した前記補完行列を出力する出力ステップと、を実行させるための推薦プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2017247025A JP6787876B2 (ja) | 2017-12-22 | 2017-12-22 | 推薦装置、推薦方法及び推薦プログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2017247025A JP6787876B2 (ja) | 2017-12-22 | 2017-12-22 | 推薦装置、推薦方法及び推薦プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2019114053A true JP2019114053A (ja) | 2019-07-11 |
JP6787876B2 JP6787876B2 (ja) | 2020-11-18 |
Family
ID=67222689
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2017247025A Active JP6787876B2 (ja) | 2017-12-22 | 2017-12-22 | 推薦装置、推薦方法及び推薦プログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6787876B2 (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112785331A (zh) * | 2021-01-07 | 2021-05-11 | 之江实验室 | 一种结合评价文本的抗注入攻击的鲁棒推荐方法和系统 |
CN112905873A (zh) * | 2019-12-03 | 2021-06-04 | 京东数字科技控股有限公司 | 数据处理方法、装置和计算机可读存储介质 |
-
2017
- 2017-12-22 JP JP2017247025A patent/JP6787876B2/ja active Active
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112905873A (zh) * | 2019-12-03 | 2021-06-04 | 京东数字科技控股有限公司 | 数据处理方法、装置和计算机可读存储介质 |
CN112785331A (zh) * | 2021-01-07 | 2021-05-11 | 之江实验室 | 一种结合评价文本的抗注入攻击的鲁棒推荐方法和系统 |
Also Published As
Publication number | Publication date |
---|---|
JP6787876B2 (ja) | 2020-11-18 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109299728B (zh) | 基于构建梯度树模型的样本联合预测方法、系统及介质 | |
McInerney et al. | Counterfactual evaluation of slate recommendations with sequential reward interactions | |
US10140342B2 (en) | Similarity calculation system, method of calculating similarity, and program | |
CN112818290B (zh) | 多方联合确定隐私数据中对象特征相关性的方法及装置 | |
US10678765B2 (en) | Similarity calculation system, method of calculating similarity, and program | |
CN110837603B (zh) | 一种基于差分隐私保护的集成推荐方法 | |
JP2019114053A (ja) | 推薦装置、推薦方法及び推薦プログラム | |
CN114611128A (zh) | 一种纵向联邦学习方法、装置、系统、设备及存储介质 | |
CN111241381A (zh) | 信息推荐方法、装置、电子设备及计算机可读存储介质 | |
Yang et al. | Local matrix approximation based on graph random walk | |
US10579752B2 (en) | Generating a model based on input | |
Wang et al. | QPIN: a quantum-inspired preference interactive network for E-commerce recommendation | |
US20170302437A1 (en) | Nondecreasing sequence determining device, method and program | |
JP2018055057A (ja) | データ撹乱装置、方法及びプログラム | |
KR101630642B1 (ko) | 사용자 맞춤형 항목 추천 방법 및 장치 | |
Thirunavukarasu et al. | People to people recommendation using coupled nonnegative boolean matrix factorization | |
Diop et al. | Binary Matrix Factorization applied to Netflix dataset analysis | |
Chen et al. | Using nonregular designs to generate space-filling designs | |
US20210357955A1 (en) | User search category predictor | |
JP7017528B2 (ja) | 学習装置、学習方法及び学習プログラム | |
JP2020017101A (ja) | 匿名化装置、匿名化方法及び匿名化プログラム | |
US20190266216A1 (en) | Distributed processing of a large matrix data set | |
JP6474741B2 (ja) | 秘匿決定木計算システム、装置、方法及びプログラム | |
JP5632506B1 (ja) | 情報推薦装置、情報推薦方法及び情報推薦プログラム | |
CN108295475B (zh) | 一种数据处理方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20200108 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20201027 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20201029 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20201030 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6787876 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |