CN113204793A - 一种基于个性化差分隐私保护的推荐方法 - Google Patents

一种基于个性化差分隐私保护的推荐方法 Download PDF

Info

Publication number
CN113204793A
CN113204793A CN202110642458.7A CN202110642458A CN113204793A CN 113204793 A CN113204793 A CN 113204793A CN 202110642458 A CN202110642458 A CN 202110642458A CN 113204793 A CN113204793 A CN 113204793A
Authority
CN
China
Prior art keywords
privacy
user
matrix
users
recommendation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202110642458.7A
Other languages
English (en)
Inventor
张全贵
孙玲玉
李鑫
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Liaoning Technical University
Original Assignee
Liaoning Technical University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Liaoning Technical University filed Critical Liaoning Technical University
Priority to CN202110642458.7A priority Critical patent/CN113204793A/zh
Publication of CN113204793A publication Critical patent/CN113204793A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/60Protecting data
    • G06F21/62Protecting access to data via a platform, e.g. using keys or access control rules
    • G06F21/6218Protecting access to data via a platform, e.g. using keys or access control rules to a system of files or objects, e.g. local or distributed file system or database
    • G06F21/6245Protecting personal data, e.g. for financial or medical purposes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9536Search customisation based on social or collaborative filtering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/16Matrix or vector computation, e.g. matrix-matrix or matrix-vector multiplication, matrix factorization
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/213Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/22Matching criteria, e.g. proximity measures

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Computation (AREA)
  • Evolutionary Biology (AREA)
  • Mathematical Physics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Mathematical Analysis (AREA)
  • Pure & Applied Mathematics (AREA)
  • Bioethics (AREA)
  • General Health & Medical Sciences (AREA)
  • Software Systems (AREA)
  • Computational Mathematics (AREA)
  • Mathematical Optimization (AREA)
  • Computer Security & Cryptography (AREA)
  • Computing Systems (AREA)
  • Computer Hardware Design (AREA)
  • Medical Informatics (AREA)
  • Algebra (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种基于个性化差分隐私保护的推荐方法(PDP‑IR),该方法包括以下步骤:S1、数据采集及划分;S2、基于个性化差分隐私保护的协同过滤(PPCF)算法的构造;S3、随机采样;S4、隐私保护的集成推荐算法;S5、生成推荐。本发明将个性化差分隐私机制应用到集成推荐算法中,考虑到每个用户对各种项目的隐私级别的需求是不一样的,PDP‑IR方法能够为用户提供个性化隐私需求和项目级别的隐私保护,还可以提供高质量地推荐服务。根据个性化差分隐私的定义,从理论上证明了PDP‑IR方案是满足个性化差分隐私的,从而保证了整个方案的隐私安全。

Description

一种基于个性化差分隐私保护的推荐方法
技术领域
本发明属于数据挖掘和自然语言处理的技术领域,尤其涉及一种基于个性化差分隐私保护的推荐方法。
背景技术
最近二十年中,互联网上的信息呈爆炸式增长,人们不可能通过搜索所有的网络信息,去寻找自己想要获取的信息。推荐系统能够为用户提供个性化的内容和服务推荐,也能提高用户的在线服务体验。推荐系统在电子商务中已经得到广泛应用,可以为用户提供商品推荐服务。推荐系统中最常用的算法是协同过滤算法,该算法利用用户的历史行为数据为用户产生推荐服务。如果攻击者获取到一些用户的历史行为数据,就可以推断出用户的其他信息。研究者Dwork针对用户的历史行为信息提出了三种类型的推荐攻击,这些攻击会给用户的隐私带来极大的威胁。差分隐私是一种密码学技术,当从统计数据库查询时,可以在保证查询结果准确性的同时,最大程度地减少识别其记录的机会。差分隐私技术已经被广泛应用于推荐系统中。有人提出了一种差分隐私矩阵分解机制,该机制能够防止不可信的推荐系统获取到用户的隐私信息。其基本思想是,首先获取不加隐私的用户因子矩阵,将其保密存储,然后扰动目标函数得到加噪后项目因子矩阵,最后发布加噪后的项目因子矩阵。由于项目因子矩阵是满足差分隐私的,攻击者无法通过项目因子矩阵以推断用户的隐私信息,从而保证了用户的隐私安全。
传统的差分隐私保护方法有一个重要的限制,它只能为数据集中的所有用户提供统一级别的隐私保护。这种方法忽略了一个事实,每个人都会对他自己的隐私信息有不同的要求。而在实践中,用户对自己的隐私级别会有个性化的需求,即用户根据自己的意愿以设置自己的隐私级别。个性化的差分隐私保护,可以实现更高地推荐准确度。因为在传统的差分隐私保护中,一般会将数据集中用户要求最高的隐私级别设置成统一的隐私级别,这样会导致更多的噪声,也降低了预测的准确度。个性化隐私保护模型很好地解决了这个问题,它考虑到了用户的个人隐私需求,并允许用户指定自己隐私保护级别。基于邻域的协同过滤算法,由于评分数据集过于稀疏,导致其预测精度不高。而基于模型的矩阵分解算法只关注评分矩阵的全局信息,没有考虑到评分矩阵的局部信息,导致预测评分在准确度和多样性较差。
发明内容
针对现有技术中存在的不足,本发明所要解决的技术问题在于提供一种基于个性化差分隐私保护的推荐方法,考虑到在实践中用户对自己的隐私级别会有个性化的需求,即用户希望可以根据自己的意愿来设置自己的隐私级别,个性化的差分隐私保护,在保护用户个人隐私的前提下,还能为用户提供高质量地推荐服务。
为了实现以上技术方案,提出了一种基于个性化差分隐私的集成推荐方法,包括以下步骤:
S1、数据的采集及划分:将处理好的数据集随机选取80%的历史交互作为训练集,用于训练模型;其余作为测试集,从训练集中随机选取10%的交互作为验证集,用于调整超参数;
S2、PPCF算法的构造:个性化差分隐私的协同过滤算法通过用户的邻域以预测用户评分
Figure BDA0003108523850000031
首先利用Johnson Lindenstrauss变换的随机预处理方法,将原始评分矩阵从高维降为低维,得到降维矩阵G;然后计算用户间的相似度,并使用拉普拉斯噪声扰动相似度的值,并基于扰动的相似度选取k个最近邻域用户;基于这k个邻域用户以预测评分
Figure BDA0003108523850000032
S3、随机采样:根据用户的隐私偏好级别以决定用户评分随机抽样的概率,对原始评分矩阵的数据进行随机抽样,可以得到随机抽样后的评分矩阵DRS
S4、隐私保护的集成推荐算法:将步骤S2阶段得到的基于邻域预测评分
Figure BDA0003108523850000033
和步骤S3阶段得到的评分矩阵DRS作为输入,先运行不带差分隐私保护的集成推荐算法,可以得到原始的用户因子矩阵P和项目因子矩阵Q,将用户因子矩阵P进行保密存储;然后,将得到的项目因子矩阵Q代入到基于个性化差分隐私的集成推荐算法,获得扰动后的项目因子矩阵
Figure BDA0003108523850000034
S5、生成推荐:通过用户因子矩阵P和项目因子矩阵
Figure BDA0003108523850000035
得到预测评分矩阵
Figure BDA0003108523850000037
再利用预测评分矩阵
Figure BDA0003108523850000036
向用户推荐若干个项目;
优选的,所述步骤S1的数据的采集及划分的具体步骤如下:
S101、将下载的Netflix电影数据集进行数据预处理;
S102、将数据按照8:1:1的比例分别划分训练集、测试集和验证集。
进一步的,所述步骤S2中PPCF算法的构造的具体步骤如下:
S201、数据的预处理:首先是通过对高斯分布N(0,1/m)中的每个原始评分进行采样构造了一个过渡矩阵A。其次是通过将原始矩阵与过渡矩阵相乘得到新评分矩阵,将新评分矩阵的维度降到了d维;
S202、相似度扰动处理:采用拉普拉斯机制噪声对相似度进行扰动,以保护用户的隐私。由于全局敏感度衡量的是所有相邻数据集查询结果之间的最大差异,通常考虑最坏的情况,对所有用户都采用相同的标准,而实际中发生最坏情况的概率非常小,所以采用了即时敏感度;
S203、隐私参数的选择:由于不同用户对隐私的需求不同,在个性化的隐私保护中,用户会根据自己的隐私需求来设定自己的隐私保护级别。计算任意两个用户之间的相似度时,由于隐私预算是根据用户变化的,所以通常会选择较小的隐私预算值,这样可以同时保证两个用户的隐私,公式如下:
Figure BDA0003108523850000046
其中εp是用户ui的隐私级别,εx是用户ux的隐私级别;
S204、PPCF算法:个性化差分隐私的协同过滤算法通过用户的邻域以预测用户评分
Figure BDA0003108523850000044
基于扰动的相似度选取k个最近邻域用户来预测评分
Figure BDA0003108523850000045
该方法满足差分隐私,为每个用户提供相应级别的隐私保护。
进一步的,所述步骤S3中随机采样的具体步骤如下:
S301、采样机制:通过用户的个人隐私偏好,以一定的概率进行采样。根据用户的隐私偏好级别,决定用户评分随机抽样的概率,然后对原始评分数据进行随机抽样,最后输出采样后的评分矩阵DRS,并将其中未抽样的评分置为零。抽样概率为π(rij),计算公式如下:
Figure BDA0003108523850000041
其中t称为个性化隐私参数,其取值范围为min(εij)≤t≤max(εij),并且t的值是一个可变参数。
进一步的,所述步骤S4中隐私保护的集成推荐算法的具体步骤如下:
Figure BDA0003108523850000042
Figure BDA0003108523850000043
其中pi表示用户因子矩阵P的第i个列向量,qj表示项目因子矩阵Q的第j个列向量,μ为调节参数,η为样本噪声矢量,γ为学习率,t为取样阈值。
进一步的,所述步骤S5中生成推荐的具体步骤如下:
S501、由S4得到用户因子矩阵P和扰动项目因子矩阵
Figure BDA0003108523850000051
利用P和
Figure BDA0003108523850000052
得到预测评分矩阵
Figure BDA0003108523850000053
再利用预测评分矩阵
Figure BDA0003108523850000054
向用户提供推荐服务。
由上,本发明将个性化差分隐私机制应用到集成推荐算法中,考虑到每个用户对各种项目的隐私级别的需求是不一样的,PDP-IR方法能够为用户提供个性化隐私需求和项目级别的隐私保护,还可以提供高质量地推荐服务。根据个性化差分隐私的定义,从理论上证明了PDP-IR方案是满足个性化差分隐私的,从而保证了整个方案的隐私安全。
上述说明仅是本发明技术方案的概述,为了能够更清楚了解本发明的技术手段,而可依照说明书的内容予以实施,并且为了让本发明的上述和其他目的、特征和优点能够更明显易懂,以下结合优选实施例,并配合附图,详细说明如下。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对实施例的附图作简单地介绍。
图1为本发明的基于个性化差分隐私保护的推荐方法的基本流程图;
图2为PPCF算法流程图;
图3为基于差分隐私保护的集成推荐算法流程图。
具体实施方式
下面结合附图详细说明本发明的具体实施方式,其作为本说明书的一部分,通过实施例来说明本发明的原理,本发明的其他方面、特征及其优点通过该详细说明将会变得一目了然。在所参照的附图中,不同的图中相同或相似的部件使用相同的附图标号来表示。
如图1至图3所示,本发明的基于个性化差分隐私保护的推荐方法,包括:
数据的采集及划分模块,下载的Netflix电影数据集进行数据预处理,将数据按照8:1:1的比例分别划分训练集、测试集和验证集。
PPCF算法的构造模块,首先利用随机预处理方法,将原始评分矩阵从高维降为低维,得到降维矩阵G;然后计算用户间的相似度,并使用拉普拉斯噪声扰动相似度的值,并基于扰动的相似度选取k个最近邻域用户;基于这k个邻域用户得到预测评分
Figure BDA0003108523850000061
随机采样原始数据模块,根据用户的隐私偏好级别以决定用户评分随机抽样的概率,对原始评分矩阵的数据进行随机抽样,得到随机抽样后的评分矩阵DRS
隐私保护的集成推荐算法模块,将基于邻域的预测评分
Figure BDA0003108523850000062
和评分矩阵DRS作为输入,先运行不带差分隐私保护的集成推荐算法,得到原始的用户因子矩阵P和项目因子矩阵Q,将用户因子矩阵P进行保密存储;然后,将得到的项目因子矩阵Q代入到基于个性化差分隐私的集成推荐算法,获得扰动后的项目因子矩阵
Figure BDA0003108523850000063
生成推荐模块,通过用户因子矩阵P和项目因子矩阵
Figure BDA0003108523850000064
得到预测评分矩阵
Figure BDA0003108523850000065
再利用预测评分矩阵
Figure BDA0003108523850000066
向用户推荐若干个项目。
如图1所示,本发明的基于个性化差分隐私保护的推荐方法包括如下步骤:
S1、数据的采集及划分:将处理好的数据集随机选取80%的历史交互作为训练集,用于训练模型;其余作为测试集,从训练集中随机选取10%的交互作为验证集,用于调整超参数;
S2、PPCF算法的构造:个性化差分隐私的协同过滤算法通过用户的邻域以预测用户评分
Figure BDA0003108523850000071
首先利用Johnson Lindenstrauss变换的随机预处理方法,将原始评分矩阵从高维降为低维,得到降维矩阵G;然后计算用户间的相似度,并使用拉普拉斯噪声扰动相似度的值,并基于扰动的相似度选取k个最近邻域用户;基于这k个邻域用户以预测评分
Figure BDA0003108523850000072
S3、随机采样:根据用户的隐私偏好级别以决定用户评分随机抽样的概率,对原始评分矩阵的数据进行随机抽样,可以得到随机抽样后的评分矩阵DRS
S4、隐私保护的集成推荐算法:将S2阶段得到的基于邻域预测评分
Figure BDA0003108523850000073
和S3阶段得到的评分矩阵DRS作为输入,先运行不带差分隐私保护的集成推荐算法,可以得到原始的用户因子矩阵P和项目因子矩阵Q,将用户因子矩阵P进行保密存储;然后,将得到的项目因子矩阵Q代入到基于个性化差分隐私的集成推荐算法,获得扰动后的项目因子矩阵
Figure BDA0003108523850000074
S5、生成推荐:通过用户因子矩阵P和项目因子矩阵
Figure BDA0003108523850000075
得到预测评分矩阵
Figure BDA0003108523850000076
再利用预测评分矩阵
Figure BDA0003108523850000077
向用户推荐若干个项目。
步骤S1中的数据的采集及划分的具体步骤如下:
S101、将下载的Netflix电影数据集进行数据预处理;
S102、将数据按照8:1:1的比例分别划分训练集、测试集和验证集。
如图2所示,步骤S2中PPCF算法的构造的具体步骤如下:
S201、数据的预处理:首先是通过对高斯分布N(0,1/m)中的每个原始评分进行采样构造了一个过渡矩阵A。其次是通过将原始矩阵与过渡矩阵相乘得到新评分矩阵,将新评分矩阵的维度降到了d维;
S202、相似度扰动处理:采用拉普拉斯机制噪声对相似度进行扰动,以保护用户的隐私。由于全局敏感度衡量的是所有相邻数据集查询结果之间的最大差异,通常考虑最坏的情况,对所有用户都采用相同的标准,而实际中发生最坏情况的概率非常小,所以采用了即时敏感度;
S203、隐私参数的选择:由于不同用户对隐私的需求不同,在个性化的隐私保护中,用户会根据自己的隐私需求来设定自己的隐私保护级别。计算任意两个用户之间的相似度时,由于隐私预算是根据用户变化的,所以通常会选择较小的隐私预算值,这样可以同时保证两个用户的隐私,公式如下:
Figure BDA0003108523850000085
其中εp是用户ui的隐私级别,εx是用户ux的隐私级别;
S204、PPCF算法:个性化差分隐私的协同过滤算法通过用户的邻域以预测用户评分
Figure BDA0003108523850000081
基于扰动的相似度选取k个最近邻域用户来预测评分
Figure BDA0003108523850000082
该方法满足差分隐私,为每个用户提供相应级别的隐私保护。
其中,步骤S3中的随机采样的具体步骤如下:
S301、采样机制:通过用户的个人隐私偏好,以一定的概率进行采样。根据用户的隐私偏好级别,决定用户评分随机抽样的概率,然后对原始评分数据进行随机抽样,最后输出采样后的评分矩阵DRS,并将其中未抽样的评分置为零。抽样概率为π(rij),计算公式如下:
Figure BDA0003108523850000083
其中t称为个性化隐私参数,其取值范围为min(εij)≤t≤max(εij),并且t的值是一个可变参数。
如图3所示,步骤S4隐私保护的集成推荐算法的具体步骤如下:
S401、将步骤S2阶段得到的基于邻域预测评分
Figure BDA0003108523850000084
和步骤S3阶段得到的评分矩阵DRS作为输入,先运行不带差分隐私保护的集成推荐算法,得到原始的用户因子矩阵P和项目因子矩阵Q,将用户因子矩阵P进行保密存储;
S402、将得到的项目因子矩阵Q代入到基于个性化差分隐私的集成推荐算法,获得扰动后的项目因子矩阵
Figure BDA0003108523850000091
公式如下:
Figure BDA0003108523850000092
Figure BDA0003108523850000093
其中pi表示用户因子矩阵P的第i个列向量,qj表示项目因子矩阵Q的第j个列向量,μ为调节参数,η为样本噪声矢量,γ为学习率,t为取样阈值。
其中,步骤S5生成推荐的具体步骤如下:
S501、由步骤S4得到用户因子矩阵P和扰动项目因子矩阵
Figure BDA0003108523850000094
利用P和
Figure BDA0003108523850000095
得到预测评分矩阵
Figure BDA0003108523850000096
再利用预测评分矩阵
Figure BDA0003108523850000097
向用户提供推荐服务。
以上所述是本发明的优选实施方式而已,当然不能以此来限定本发明之权利范围,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和变动,这些改进和变动也视为本发明的保护范围。

Claims (6)

1.一种基于个性化差分隐私保护的推荐方法,其特征在于,包括以下步骤:
S1、数据的采集及划分:将处理好的数据集随机选取80%的历史交互作为训练集,用于训练模型;其余作为测试集,从训练集中随机选取10%的交互作为验证集,用于调整超参数;
S2、PPCF算法的构造:个性化差分隐私的协同过滤算法通过用户的邻域以预测用户评分
Figure FDA0003108523840000011
首先利用Johnson Lindenstrauss变换的随机预处理方法,将原始评分矩阵从高维降为低维,得到降维矩阵G;然后计算用户间的相似度,并使用拉普拉斯噪声扰动相似度的值,并基于扰动的相似度选取k个最近邻域用户;基于这k个邻域用户以预测评分
Figure FDA0003108523840000012
S3、随机采样:根据用户的隐私偏好级别以决定用户评分随机抽样的概率,对原始评分矩阵的数据进行随机抽样,可以得到随机抽样后的评分矩阵DRS
S4、隐私保护的集成推荐算法:将步骤S2阶段得到的基于邻域预测评分
Figure FDA0003108523840000013
和步骤S3阶段得到的评分矩阵DRS作为输入,先运行不带差分隐私保护的集成推荐算法,可以得到原始的用户因子矩阵P和项目因子矩阵Q,将用户因子矩阵P进行保密存储;然后,将得到的项目因子矩阵Q代入到基于个性化差分隐私的集成推荐算法,获得扰动后的项目因子矩阵
Figure FDA0003108523840000014
S5、生成推荐:通过用户因子矩阵P和项目因子矩阵
Figure FDA0003108523840000015
得到预测评分矩阵
Figure FDA0003108523840000016
再利用预测评分矩阵
Figure FDA0003108523840000017
向用户推荐若干个项目。
2.如权利要求1所述的基于个性化差分隐私保护的推荐方法,其特征在于,所述步骤S1的数据采集及划分的具体步骤如下:
S101、将下载的Netflix电影数据集进行数据预处理;
S102、将数据按照8:1:1的比例分别划分训练集、测试集和验证集。
3.如权利要求1所述的基于个性化差分隐私保护的推荐方法,其特征在于,所述步骤S2中PPCF算法的构造的具体步骤如下:
S201、数据的预处理:首先是通过对高斯分布N(0,1/m)中的每个原始评分进行采样构造了一个过渡矩阵A,其次是通过将原始矩阵与过渡矩阵相乘得到新评分矩阵,将新评分矩阵的维度降到了d维;
S202、相似度扰动处理:采用拉普拉斯机制噪声对相似度进行扰动,以保护用户的隐私;
S203、隐私参数的选择:由于不同用户对隐私的需求不同,在个性化的隐私保护中,用户会根据自己的隐私需求来设定自己的隐私保护级别,计算任意两个用户之间的相似度时,由于隐私预算是根据用户变化的,所以通常会选择较小的隐私预算值,这样可以同时保证两个用户的隐私,公式如下:
Figure FDA0003108523840000021
其中εp是用户ui的隐私级别,εx是用户ux的隐私级别;
S204、PPCF算法:个性化差分隐私的协同过滤算法通过用户的邻域以预测用户评分
Figure FDA0003108523840000022
基于扰动的相似度选取k个最近邻域用户来预测评分
Figure FDA0003108523840000023
4.如权利要求1所述的基于个性化差分隐私保护的推荐方法,其特征在于,所述步骤S3中随机采样的具体步骤如下:
S301、采样机制:通过用户的个人隐私偏好,以一定的概率进行采样,根据用户的隐私偏好级别,决定用户评分随机抽样的概率,然后对原始评分数据进行随机抽样,最后输出采样后的评分矩阵DRS,并将其中未抽样的评分置为零,抽样概率为π(rij),计算公式如下:
Figure FDA0003108523840000031
其中t称为个性化隐私参数,其取值范围为min(εij)≤t≤max(εij),并且t的值是一个可变参数。
5.如权利要求1所述的基于个性化差分隐私保护的推荐方法,其特征在于,所述步骤S4中隐私保护的集成推荐算法的具体步骤如下:
Figure FDA0003108523840000032
Figure FDA0003108523840000033
其中pi表示用户因子矩阵P的第i个列向量,qj表示项目因子矩阵Q的第j个列向量,μ为调节参数,η为样本噪声矢量,γ为学习率,t为取样阈值。
6.如权利要求1所述的基于个性化差分隐私保护的推荐方法,其特征在于,所述步骤S5中生成推荐的具体步骤如下:
S501、由步骤S4得到用户因子矩阵P和扰动项目因子矩阵
Figure FDA0003108523840000034
利用P和
Figure FDA0003108523840000035
得到预测评分矩阵
Figure FDA0003108523840000036
利用预测评分矩阵
Figure FDA0003108523840000037
向用户提供推荐服务。
CN202110642458.7A 2021-06-09 2021-06-09 一种基于个性化差分隐私保护的推荐方法 Pending CN113204793A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110642458.7A CN113204793A (zh) 2021-06-09 2021-06-09 一种基于个性化差分隐私保护的推荐方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110642458.7A CN113204793A (zh) 2021-06-09 2021-06-09 一种基于个性化差分隐私保护的推荐方法

Publications (1)

Publication Number Publication Date
CN113204793A true CN113204793A (zh) 2021-08-03

Family

ID=77024520

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110642458.7A Pending CN113204793A (zh) 2021-06-09 2021-06-09 一种基于个性化差分隐私保护的推荐方法

Country Status (1)

Country Link
CN (1) CN113204793A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114547687A (zh) * 2022-02-22 2022-05-27 浙江星汉信息技术股份有限公司 基于差分隐私技术的问答系统模型训练方法和装置

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20110064221A1 (en) * 2009-09-11 2011-03-17 Microsoft Corporation Differential privacy preserving recommendation
KR20160064447A (ko) * 2014-11-28 2016-06-08 이종찬 협력적 필터링의 예측 선호도를 이용한 처음 사용자에 대한 추천 제공 방법
CN106557654A (zh) * 2016-11-16 2017-04-05 中山大学 一种基于差分隐私技术的协同过滤算法
CN107392049A (zh) * 2017-07-26 2017-11-24 安徽大学 一种基于差分隐私保护的推荐方法
CN107491557A (zh) * 2017-09-06 2017-12-19 徐州医科大学 一种基于差分隐私的TopN协同过滤推荐方法
CN107766742A (zh) * 2017-11-02 2018-03-06 广西师范大学 非独立同分布环境下的多相关性差分隐私矩阵分解方法
CN108280217A (zh) * 2018-02-06 2018-07-13 南京理工大学 一种基于差分隐私保护的矩阵分解推荐方法
WO2019056573A1 (zh) * 2017-09-25 2019-03-28 深圳大学 隐私保护协同Web服务质量的差分隐私预测系统及方法
CN110837603A (zh) * 2019-11-09 2020-02-25 安徽大学 一种基于差分隐私保护的集成推荐方法
CN111125517A (zh) * 2019-12-06 2020-05-08 陕西师范大学 一种基于差分隐私和时间感知的隐式矩阵分解推荐方法

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20110064221A1 (en) * 2009-09-11 2011-03-17 Microsoft Corporation Differential privacy preserving recommendation
KR20160064447A (ko) * 2014-11-28 2016-06-08 이종찬 협력적 필터링의 예측 선호도를 이용한 처음 사용자에 대한 추천 제공 방법
CN106557654A (zh) * 2016-11-16 2017-04-05 中山大学 一种基于差分隐私技术的协同过滤算法
CN107392049A (zh) * 2017-07-26 2017-11-24 安徽大学 一种基于差分隐私保护的推荐方法
CN107491557A (zh) * 2017-09-06 2017-12-19 徐州医科大学 一种基于差分隐私的TopN协同过滤推荐方法
WO2019056573A1 (zh) * 2017-09-25 2019-03-28 深圳大学 隐私保护协同Web服务质量的差分隐私预测系统及方法
CN107766742A (zh) * 2017-11-02 2018-03-06 广西师范大学 非独立同分布环境下的多相关性差分隐私矩阵分解方法
CN108280217A (zh) * 2018-02-06 2018-07-13 南京理工大学 一种基于差分隐私保护的矩阵分解推荐方法
CN110837603A (zh) * 2019-11-09 2020-02-25 安徽大学 一种基于差分隐私保护的集成推荐方法
CN111125517A (zh) * 2019-12-06 2020-05-08 陕西师范大学 一种基于差分隐私和时间感知的隐式矩阵分解推荐方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
何明;常盟盟;吴小飞;: "一种基于差分隐私保护的协同过滤推荐方法", 计算机研究与发展, no. 07 *
胡飞: "差分隐私保护的集成推荐算法研究", 《中国优秀硕士学位论文全文数据库 信息科技辑》, no. 2020, pages 39 - 46 *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114547687A (zh) * 2022-02-22 2022-05-27 浙江星汉信息技术股份有限公司 基于差分隐私技术的问答系统模型训练方法和装置

Similar Documents

Publication Publication Date Title
US20200410116A1 (en) Sensitive Data Classification
Toyoda et al. A novel methodology for hyip operators’ bitcoin addresses identification
Pena et al. Bias in multimodal AI: Testbed for fair automatic recruitment
US9858426B2 (en) Computer-implemented system and method for automatically identifying attributes for anonymization
US20220103589A1 (en) Predicting data tampering using augmented machine learning models
CN104462385B (zh) 一种基于用户兴趣模型的电影个性化相似度计算方法
CN107491557A (zh) 一种基于差分隐私的TopN协同过滤推荐方法
Almarashdeh et al. An overview of technology evolution: Investigating the factors influencing non-bitcoins users to adopt bitcoins as online payment transaction method
CN110532480B (zh) 一种用于人读威胁情报推荐的知识图谱构建方法及威胁情报推荐方法
CN111488524B (zh) 一种面向注意力的语义敏感的标签推荐方法
Beigi et al. Similar but different: Exploiting users’ congruity for recommendation systems
Saito et al. Improving lime robustness with smarter locality sampling
Xiong et al. Private collaborative filtering under untrusted recommender server
CN113204793A (zh) 一种基于个性化差分隐私保护的推荐方法
Gounaridis et al. The social anatomy of climate change denial in the United States
Peng et al. Automatic News Generation and Fact-Checking System Based on Language Processing
Shafiq et al. CoopGBFS: A federated learning and game-theoretic based approach for personalized security, recommendation in 5G beyond IoT environments for consumer electronics
CN117390289A (zh) 基于用户画像的房屋建造方案推荐方法、装置、设备
Benson et al. Using enhanced patent data for future-oriented technology analysis
CN109543094B (zh) 一种基于矩阵分解的隐私保护内容推荐方法
Arora et al. A Framework for the Detection of Suspicious Discussion on Online Forums using Integrated approach of Support Vector Machine and Particle Swarm Optimization.
Paul et al. Authorship disambiguation in a collaborative editing environment
Kattler et al. National internal security policies across Europe–a comparative analysis applying big data clustering techniques
Qu et al. Detecting fake reviews with generative adversarial networks for mobile social networks
Roy et al. Password recovery mechanism based on keystroke dynamics

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination