CN114117306B - 一种基于本地化差分隐私保护的多目标推荐方法 - Google Patents
一种基于本地化差分隐私保护的多目标推荐方法 Download PDFInfo
- Publication number
- CN114117306B CN114117306B CN202111443344.6A CN202111443344A CN114117306B CN 114117306 B CN114117306 B CN 114117306B CN 202111443344 A CN202111443344 A CN 202111443344A CN 114117306 B CN114117306 B CN 114117306B
- Authority
- CN
- China
- Prior art keywords
- population
- generation
- user
- equal
- matrix
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/958—Organisation or management of web site content, e.g. publishing, maintaining pages or automatic linking
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9535—Search customisation based on user profiles and personalisation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F21/00—Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
- G06F21/60—Protecting data
- G06F21/62—Protecting access to data via a platform, e.g. using keys or access control rules
- G06F21/6218—Protecting access to data via a platform, e.g. using keys or access control rules to a system of files or objects, e.g. local or distributed file system or database
- G06F21/6245—Protecting personal data, e.g. for financial or medical purposes
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/004—Artificial life, i.e. computing arrangements simulating life
- G06N3/006—Artificial life, i.e. computing arrangements simulating life based on simulated virtual individual or collective life forms, e.g. social simulations or particle swarm optimisation [PSO]
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Databases & Information Systems (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Bioethics (AREA)
- Software Systems (AREA)
- Computer Security & Cryptography (AREA)
- Computer Hardware Design (AREA)
- Medical Informatics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Evolutionary Computation (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了一种基于本地化差分隐私保护的多目标推荐方法,其步骤包括:1、从网站上获取访问用户对项目的评分信息得到评分矩阵;2、将评分矩阵映射成01矩阵;3、使用随即响应机制扰动01矩阵;4、对扰动后的01矩阵使用概率传播算法得到权值矩阵;5、根据权值矩阵初始化种群;6、迭代的对种群进行交叉、变异和更新;7、根据迭代后的种群生成多个推荐结果。本发明能有效地保护用户隐私,同时维持推荐准确性和多样性之间的平衡。
Description
技术领域
本发明属于多目标推荐领域,具体的说是一种基于本地化差分隐私保护的多目标推荐方法。
背景技术
随着大数据时代的到来,人们每天都要面临数量庞大、种类繁杂的信息。这些信息可能是社交APP上的文本、音频、文件;也可能是购物商城上琳琅满目的商品。面对这些信息,用户往往会陷入信息过载的窘境,无法从众多的选择中找到最有价值的那一个。推荐系统被认为是缓解信息过载最有前景的技术,因为它能够主动分析用户的历史行为,从海量的数据中为用户快速推荐符合偏好的物品。但是,随着推荐系统的逐渐发展,人们对推荐系统又有了进一步的期望,传统的单目标推荐旨在提高推荐的准确性,这不能满足人们个性化的需求。一个用户满意的推荐列表应该不仅有较高的准确性,还要有推荐多样性、新颖性等其他特点,每一个推荐结果都是为用户量身定做,才更能增加推荐系统与用户之间的粘合度。
然而,在多目标推荐算法中,用户将自己的数据毫无保留的上传给第三方,这些数据可能是电影评分、购物记录、社交记录等包含用户敏感信息的数据,如果不可信的第三方因为商业利益将数据泄露给其他机构或个人,这势必会造成用户隐私的泄露,使得用户对互联网服务的兴趣度下降,从而造成用户的流失,影响互联网经济的发展。因此,如何在不泄露个人敏感信息的前提下实现高效的多目标推荐变得尤为重要。
发明内容
本发明是为了解决上述现有技术存在的不足之处,提出一种基于本地化差分隐私保护的多目标推荐方法,以期能有效解决现有多目标推荐推荐方案中用户数据的安全性差的问题,从而能更好的保护用户数据的隐私并维持推荐结果准确度和多样性之间的平衡。
本发明为达到上述发明目的,采用如下技术方案:
本发明一种基于本地化差分隐私保护的多目标推荐方法的特点是按如下步骤进行:
步骤1、从网站上获取访问用户对项目的评分信息:
假设所述网站上有n个访问用户,记为U={u1,u2,...,ui,...,un},ui表示第i个访问用户,1≤i≤n;所述网站上存在m个项目,记为V={v1,v2,...,vj,...,vm},vj表示第j个项目,1≤j≤m;令第i个访问用户ui对第j个项目vj的评分信息记为rij,从而得到所有访问用户对所有项目的评分信息组成的评分矩阵Rn×m;
步骤2、将评分矩阵Rn×m映射成01矩阵R′n×m;
步骤3、根据随机响应机制对01矩阵R′n×m进行扰动,再使用概率传播算法对扰动后的01矩阵R″n×m进行两次资源分配得到权值矩阵:
步骤3.2、对所述01矩阵R′n×m中第i行第j列的元素r′ij,利用式(1)得到扰动后的元素r″ij:
式(1)中,α表示随机数,且α∈[0,1];
步骤3.3、根据访问用户与项目之间的关系构建用户-项目二部图网络;
步骤3.4、定义变量t并初始化t=1;
步骤3.5、以第t个访问用户ut作为目标用户,利用式(2)计算第一次资源分配后第i个访问用户ui得到的资源值f(uti):
式(2)中,kj表示对第j个项目vj评分过的访问用户数;r″tj表示目标用户ut对第j个项目vj的评分分信息;1≤t≤n;
步骤3.6、利用式(3)计算第二次资源分配后第j个项目vj得到的资源值f(vtj),并作为权值ωtj:
步骤3.7、将t+1赋值给t后,判断t>n是否成立,若成立,则表示得到每个访问用户对每个项目的权值;若不成立,则返回步骤3.5顺序执行;
步骤4、定义种群规模为N,初始化种群P={p1,p2,...,ps,...,pN},其中,ps表示第s个个体,且 表示第s个个体ps中第i个染色体,且第i个染色体samplei s表示第i个访问用户ui随机选取k个项目所组成的推荐列表;令第1个个体p1={top_k1,top_k2,...,top_ki,...,top_kn},其中,top_ki表示第i个访问用户ui选取前k个权值最大的项目所组成的推荐列表;1≤s≤N;
步骤5、确定种群中个体的准确性目标函数值和多样性目标函数值;
步骤5.1、利用式(4)计算第e个个体pe的准确性目标函数值PRe:
步骤5.2、利用式(5)计算第e个个体pe的多样性目标函数值CVe:
式(5)中,dife表示给第e个个体pe中n个访问用户推荐的不同的项目数;
步骤6、初始化NSGA-II算法的各个参数,包括:进化次数G,最大进化次数Gmax,并初始化G=1;
步骤10.1、初始化θ=1;
步骤10.2、选取第G代中第θ层级的全部个体放入到第G+1代的父代种群中,判断父代种群中的全部个体数是否大于N,若是,则根据拥挤度距离来淘汰部分个体,直至数目等于N为止,从而得到规模为N的第G+1代父代种群并跳到步骤11,否则,执行步骤10.3;
步骤10.3、令θ+1赋值给θ,并判断θ>γ是否成立,若成立,则执行步骤11;否则,返回步骤10.2;
与现有技术相比,本发明的有益效果在于:
1、相对于传统的多目标推荐算法,本发明将本地化差分隐私技术用来保护用户隐私,通过使用随机响应机制,首先将评分矩阵映射成01矩阵,再对01矩阵进行扰动,然后使用概率传播算法对扰动后的01矩阵进行两次资源分配得到权值矩阵,最后采用NSGA-II算法进行多目标优化,最终获得pareto最优解集;使用了本地化差分隐私技术的多目标推荐算法,解决了用户隐私泄露的问题,得到的推荐方案,不仅维持了推荐的准确性,而且还提高了推荐的多样性。
2、本发明的种群初始化过程中,每个访问用户选取前k个权值最大的项目组成推荐列表,作为初始种群中的第一个个体的基因;而每个访问用户随机选取k个项目组成的推荐列表作为初始种群中的其余个体的基因。这种初始化方式,既保证了初始种群中个体的多样性,也确保了各个体中基因变量的合理性。
3、本发明通过拥挤度距离淘汰部分过于拥挤的个体,解决了进化过程中种群个体过于密集的问题,遵循依次从低层级到高层级的淘汰原则,保证了种群中个体的离散程度,使得个体分布更加均匀。
附图说明
图1为本发明基于本地化差分隐私保护的多目标推荐方法流程图。
具体实施方式
本实施例中,一种基于本地化差分隐私保护的多目标推荐方法,适用于多目标推荐过程中的保护用户隐私,首先从网站上得到用户对项目的评分,对评分进行映射,然后使用随机响应机制扰动映射后的评分,接着使用概率传播算法对用户未评分项目进行评分预测,最终通过NSGA-II算法完成推荐,具体的说,如图1所示,是按如下步骤进行:
步骤1、从网站上获取访问用户对项目的评分信息:
假设网站上有n个访问用户,记为U={u1,u2,...,ui,...,un},ui表示第i个访问用户,1≤i≤n;网站上存在m个项目,记为V={v1,v2,...,vj,...,vm},vj表示第j个项目,1≤j≤m;令第i个访问用户ui对第j个项目vj的评分信息记为rij,从而得到所有访问用户对所有项目的评分信息组成的评分矩阵Rn×m;
步骤2、将评分矩阵Rn×m映射成01矩阵R′n×m,映射规则为:首先设定一个评分阈值threshold,如果rij≥threshold,则r′ij=1;否则r′ij=0;
步骤3、根据随机响应机制对01矩阵R′n×m进行扰动,再使用概率传播算法对扰动后的01矩阵R″n×m进行两次资源分配得到权值矩阵:
步骤3.1、定义隐私预算ε,ε越小安全性越好,因为隐私预算是可以灵活设置的,若隐私预算过大安全性小,过小则会破坏数据的可用性,因此在实际操作中应该根据具体的数据来调整隐私预算的值。计算概率p表示不发生扰动的概率,在式(1)中α大于或等于p时才发生扰动;
步骤3.2、对01矩阵R′n×m中第i行第j列的元素r′ij,利用式(1)得到扰动后的元素r″ij:
式(1)中,α表示随机数,且α∈[0,1];
步骤3.3、根据访问用户与项目之间的关系构建用户-项目二部图网络,在网络中用户结点用圆圈表示,项目结点用方块表示;若r″ij=1,表示用户结点i与项目结点j之间有边连接,否则,没有边连接;
步骤3.4、定义变量t并初始化t=1;
步骤3.5、以第t个访问用户ut作为目标用户,利用式(2)计算第一次资源分配后第i个访问用户ui得到的资源值f(uti):
式(2)中,kj表示对第j个项目vj评分过的访问用户数;r″tj表示目标用户ut对第j个项目vj的评分分信息;1≤t≤n;
步骤3.6、利用式(3)计算第二次资源分配后第j个项目vj得到的资源值f(vtj),并作为权值ωtj:
步骤3.7、将t+1赋值给t后,判断t>n是否成立,若成立,则表示得到每个访问用户对每个项目的权值;若不成立,则返回步骤3.5顺序执行;
步骤4、定义种群规模为N,初始化种群P={p1,p2,...,ps,...,pN},其中,ps表示第s个个体,且 表示第s个个体ps中第i个染色体,且第i个染色体表示第i个访问用户ui随机选取k个项目所组成的推荐列表;令第1个个体p1={top_k1,top_k2,...,top_ki,...,top_kn},其中,top_ki表示第i个访问用户ui选取前k个权值最大的项目所组成的推荐列表;1≤s≤N;
步骤5、确定种群中个体的准确性目标函数值和多样性目标函数值;
步骤5.1、利用式(4)计算第e个个体pe的准确性目标函数值PRe:
步骤5.2、利用式(5)计算第e个个体pe的多样性目标函数值CVe:
式(5)中,dife表示给第e个个体pe中n个访问用户推荐的不同的项目数;
步骤6、初始化NSGA-II算法的各个参数,包括:进化次数G,最大进化次数Gmax,并初始化G=1;
步骤9、将第G代种群和第G代子代种群为合并后的所有个体进行快速非支配排序,得到2N个个体,并将在第G代合并种群中2N个个体所处的层级集合记为其中,表示第G代中第θ层级,γ表示种群被划分的层级数,通过对种群的快速非支配排序可以将种群划分为多个层级,有利于对种群的筛选,使得适应度更高基因更优秀的个体更容易存活下来,提高了种群的收敛速度;
步骤10.1、初始化θ=1;
步骤10.2、选取第G代中第θ层级的全部个体放入到第G+1代的父代种群中,判断父代种群中的全部个体数是否大于N,若是,则根据拥挤度距离来淘汰部分个体,直至数目等于N为止,从而得到规模为N的第G+1代父代种群并跳到步骤11,否则,执行步骤10.3;基于拥挤度距离的淘汰机制遵循从低层级到高层级对种群进行筛选的原则,在不同层级之间选取层级更低的个体进入到下一次迭代中,在同一层级中,选取拥挤度距离更大的个体,使得在保证种群收敛速度的同时,提高种群分布的均匀性。
步骤10.3、令θ+1赋值给θ,并判断θ>γ是否成立,若成立,则执行步骤11;否则,返回步骤10.2;
Claims (1)
1.一种基于本地化差分隐私保护的多目标推荐方法,其特征是按如下步骤进行:
步骤1、从网站上获取访问用户对项目的评分信息:
假设所述网站上有n个访问用户,记为U={u1,u2,...,ui,...,un},ui表示第i个访问用户,1≤i≤n;所述网站上存在m个项目,记为V={v1,v2,...,vj,...,vm},vj表示第j个项目,1≤j≤m;令第i个访问用户ui对第j个项目vj的评分信息记为rij,从而得到所有访问用户对所有项目的评分信息组成的评分矩阵Rn×m;
步骤2、将评分矩阵Rn×m映射成01矩阵R′n×m;
步骤3、根据随机响应机制对01矩阵R′n×m进行扰动,再使用概率传播算法对扰动后的01矩阵R″n×m进行两次资源分配得到权值矩阵:
步骤3.2、对所述01矩阵R′n×m中第i行第j列的元素r′ij,利用式(1)得到扰动后的元素r″ij:
式(1)中,α表示随机数,且α∈[0,1];
步骤3.3、根据访问用户与项目之间的关系构建用户-项目二部图网络;
步骤3.4、定义变量t并初始化t=1;
步骤3.5、以第t个访问用户ut作为目标用户,利用式(2)计算第一次资源分配后第i个访问用户ui得到的资源值f(uti):
式(2)中,kj表示对第j个项目vj评分过的访问用户数;r″tj表示目标用户ut对第j个项目vj的评分分信息;1≤t≤n;
步骤3.6、利用式(3)计算第二次资源分配后第j个项目vj得到的资源值f(vtj),并作为权值ωtj:
步骤3.7、将t+1赋值给t后,判断t>n是否成立,若成立,则表示得到每个访问用户对每个项目的权值;若不成立,则返回步骤3.5顺序执行;
步骤4、定义种群规模为N,初始化种群P={p1,p2,...,ps,...,pN},其中,ps表示第s个个体,且表示第s个个体ps中第i个染色体,且第i个染色体表示第i个访问用户ui随机选取k个项目所组成的推荐列表;令第1个个体p1={top_k1,top_k2,...,top_ki,...,top_kn},其中,top_ki表示第i个访问用户ui选取前k个权值最大的项目所组成的推荐列表;1≤s≤N;
步骤5、确定种群中个体的准确性目标函数值和多样性目标函数值;
步骤5.1、利用式(4)计算第e个个体pe的准确性目标函数值PRe:
步骤5.2、利用式(5)计算第e个个体pe的多样性目标函数值CVe:
式(5)中,dife表示给第e个个体pe中n个访问用户推荐的不同的项目数;
步骤6、初始化NSGA-II算法的各个参数,包括:进化次数G,最大进化次数Gmax,并初始化G=1;
步骤10.1、初始化θ=1;
步骤10.2、选取第G代中第θ层级的全部个体放入到第G+1代的父代种群中,判断父代种群中的全部个体数是否大于N,若是,则根据拥挤度距离来淘汰部分个体,直至数目等于N为止,从而得到规模为N的第G+1代父代种群并跳到步骤11,否则,执行步骤10.3;
步骤10.3、令θ+1赋值给θ,并判断θ>γ是否成立,若成立,则执行步骤11;否则,返回步骤10.2;
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111443344.6A CN114117306B (zh) | 2021-11-30 | 2021-11-30 | 一种基于本地化差分隐私保护的多目标推荐方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111443344.6A CN114117306B (zh) | 2021-11-30 | 2021-11-30 | 一种基于本地化差分隐私保护的多目标推荐方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN114117306A CN114117306A (zh) | 2022-03-01 |
CN114117306B true CN114117306B (zh) | 2022-07-15 |
Family
ID=80368837
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111443344.6A Active CN114117306B (zh) | 2021-11-30 | 2021-11-30 | 一种基于本地化差分隐私保护的多目标推荐方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114117306B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114510645B (zh) * | 2022-04-08 | 2022-07-15 | 浙大城市学院 | 一种基于提取有效多目标群组来解决长尾推荐问题的方法 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107203590A (zh) * | 2017-04-24 | 2017-09-26 | 北京工业大学 | 基于改进nsga‑ii的个性化电影推荐方法 |
CN107392049A (zh) * | 2017-07-26 | 2017-11-24 | 安徽大学 | 一种基于差分隐私保护的推荐方法 |
CN108460147A (zh) * | 2018-03-20 | 2018-08-28 | 西安电子科技大学 | 基于多子种群协同进化构建信息核的推荐方法 |
-
2021
- 2021-11-30 CN CN202111443344.6A patent/CN114117306B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107203590A (zh) * | 2017-04-24 | 2017-09-26 | 北京工业大学 | 基于改进nsga‑ii的个性化电影推荐方法 |
CN107392049A (zh) * | 2017-07-26 | 2017-11-24 | 安徽大学 | 一种基于差分隐私保护的推荐方法 |
CN108460147A (zh) * | 2018-03-20 | 2018-08-28 | 西安电子科技大学 | 基于多子种群协同进化构建信息核的推荐方法 |
Non-Patent Citations (2)
Title |
---|
Personalized recommendation via integrated diffusion on user-item-tag tripartite graphs;Zi-Ke Zhang 等;《Elsevier》;20091212;第179–186页 * |
基于改进NSGA-II的推荐算法;张海潮 等;《计算机工程与设计》;20200930;第2495-2500页 * |
Also Published As
Publication number | Publication date |
---|---|
CN114117306A (zh) | 2022-03-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Valavi et al. | Modelling species presence‐only data with random forests | |
CN109408734B (zh) | 一种融合信息熵相似度与动态信任的协同过滤推荐方法 | |
Park et al. | Penalized logistic regression for detecting gene interactions | |
Fleishman et al. | Using indicator species to predict species richness of multiple taxonomic groups | |
Lin et al. | Multiobjective personalized recommendation algorithm using extreme point guided evolutionary computation | |
US10692587B2 (en) | Global ancestry determination system | |
US20060230018A1 (en) | Mahalanobis distance genetic algorithm (MDGA) method and system | |
Qiu et al. | LIDDE: A differential evolution algorithm based on local-influence-descending search strategy for influence maximization in social networks | |
Wang et al. | A novel RNA genetic algorithm for parameter estimation of dynamic systems | |
CN107256241B (zh) | 基于网格与差异替换改进多目标遗传算法的电影推荐方法 | |
CN108153918B (zh) | 基于自适应正交交叉的多目标优化算法的个性化电影推荐方法 | |
Li et al. | Nature-inspired multiobjective epistasis elucidation from genome-wide association studies | |
CN114117306B (zh) | 一种基于本地化差分隐私保护的多目标推荐方法 | |
CN113268669A (zh) | 基于联合神经网络的面向关系挖掘的兴趣点推荐方法 | |
CN114707644A (zh) | 图神经网络的训练方法及装置 | |
Nowak et al. | Complementary hierarchical clustering | |
Amini et al. | The look ahead trace back optimizer for genomic selection under transparent and opaque simulators | |
CN108683534A (zh) | 一种面向社区发现的网络薄弱节点搜索方法 | |
Li et al. | Fast diffusion of domesticated maize to temperate zones | |
Zhang et al. | A community division-based evolutionary algorithm for large-scale multi-objective recommendations | |
Dessì et al. | An evolutionary method for combining different feature selection criteria in microarray data classification | |
Pfennig et al. | Challenges of accurately estimating sex-biased admixture from X chromosomal and autosomal ancestry proportions | |
CN113205185A (zh) | 网络模型优化方法、装置、计算机设备和存储介质 | |
Qian et al. | An improved MOEA/D algorithm for complex data analysis | |
Frommlet | A neutral comparison of algorithms to minimize L0 penalties for high‐dimensional variable selection |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |