CN111563789B

CN111563789B - 基于隐私保护的推荐方法

Info

Publication number: CN111563789B
Application number: CN202010235625.1A
Authority: CN
Inventors: 刘文炎; 王晓玲
Original assignee: East China Normal University
Current assignee: East China Normal University
Priority date: 2020-03-30
Filing date: 2020-03-30
Publication date: 2022-03-25
Anticipated expiration: 2040-03-30
Also published as: CN111563789A

Abstract

本发明公开了一种基于隐私保护的推荐方法，在用户和电子商务平台服务器中设置半可信第三方机构，电子商务平台服务器公开所有商品的特征向量，用户从服务器中获取商品特征向量，根据其自身的购买数据在本地学习其用户特征向量，并据此计算对商品特征向量的更新梯度，采用全局噪声向量和临时噪声进行扰动后发送至半可信第三方机构，半可信第三方机构对扰动后的更新梯度进行聚合并发送给服务器，服务器对接收到的更新梯度去除扰动，然后对商品特征向量进行更新，用户再根据更新后的商品特征向量计算得到预测交互向量，从而得到商品推荐结果。采用本发明可以有效实现商品推荐过程中对用户隐私的保护。

Description

基于隐私保护的推荐方法

技术领域

本发明属于商品推荐技术领域，更为具体地讲，涉及一种基于隐私保护的推荐方法。

背景技术

随着计算设备的普及，与日常生活息息相关的应用纷纷落地，许多组织和机构收集和存储了大量用户的数字信息。例如，导航系统收集车辆的地理位置信息，电子商务站点收集顾客的购物习惯。借助矩阵分解等推荐算法，这些数据可以为数据收集者提供提高服务质量并且带来社会和经济效益的机会。例如，通过分析实时路况，导航系统可以帮助司机躲避拥堵；通过分析顾客的历史订单，可以帮助商家精准地投放广告。

在现实生活中，上述的数据大多都包含隐私信息。恶意主体根据用户的历史行为数据进行推理或非法攻击，敏感的个人信息很可能被泄露。因此，如何构建一个能够保护用户的隐私信息的推荐系统成为了亟待解决的问题。

隐私保护的商品推荐方法需要权衡个性化的服务需求和隐私保证，是个具有挑战性的问题，目前行业内尚没有有效的解决方法。

发明内容

本发明的目的在于克服现有技术的不足，提供一种基于隐私保护的推荐方法，实现商品推荐过程中对用户隐私的保护。

为实现上述发明目的，本发明基于隐私保护的推荐方法包括以下步骤：

S1：在用户和电子商务平台服务器之间设置一个半可信第三方机构；

S2：电子商务平台的服务器初始化该平台中每个商品K维的特征向量V_m＝(v_m1,v_m2,…,v_mK)，v_mk表示商品m的特征向量中第k个元素值，m＝1,2,…,M， M表示商品数量，k＝1,2,…,K，服务器将各商品的特征向量向所有用户公开；

S3：用户注册并登陆电子商务平台，积累自己购买商品的记录，构建原始的交互向量R_n＝(r_n1,r_n2,…,r_nM)，其中r_nm表示用户n对商品m的购买次数， n＝1,2,…,N，N表示用户数量；

S4：服务器生成服从标准指数分布的N个K维随机向量ω_n，分别发送给每个用户，每个用户生成服从标准正态分布的K维随机向量z_n，然后根据接收到的向量ω_n计算该用户的全局噪声向量

*表示哈达马积；

S5：当用户需要获取商品推荐时，首先根据用户当前的交互向量R_n获取二值向量C_n＝(c_n1,c_n2,…,c_nM)，当r_nm＝0时，c_nm＝0，当r_nm＞0时，c_nm＝1；计算权重向量W_n＝(w_n1,w_n2,…,w_nM)＝1+log(1+R_n10^ε)，其中w_nm表示用户n对于商品m的权重，ε表示预设的用于控制权重增量的常数；

S6：采用如下方法对商品特征向量进行更新：

S6.1：用户n初始化K维的用户特征向量U_n(0)＝(u_n1(0),u_n2(0),…,u_nK(0))，

表示用户n的特征向量中第k个元素值，n＝1,2,…,N，N表示用户数量， k＝1,2,…,K；

S6.2：令迭代次数t＝1；

S6.3：用户n生成一个商品集

其中a_nd表示商品集A_n中第d个商品在原始商品序列中的序号，d＝1,2,…,D_n，D_n表示商品集A_n中商品数量，然后将该商品集A_n发送给服务器；

S6.4：服务器在接收到用户的商品集A_n之后，为商品集A_n中各个商品a_nd分别生成一个K维的临时噪声向量

然后连同商品集中各个商品当前的特征向量

一起反馈给用户；

S6.5：用户n在接收到商品集A_n中各个商品a_nd的特征向量

和临时噪声向量

后，基于梯度下降的方法更新其用户特征向量U_n(t)，计算公式如下：

S6.6：采用以下公式计算商品a_nd的特征向量更新梯度

然后对商品特征向量的更新梯度进行扰动并发送给半可信第三方机构，扰动后的商品特征向量更新梯度

的计算公式如下：

S6.7：半可信第三方机构在接收到各个用户反馈的扰动后的商品特征向量更新梯度

后，对相同商品的更新梯度进行聚合，并将各商品的聚合更新梯度发送给电子商务平台的服务器，记当前半可信第三方机构本批次所接收到扰动后的商品特征向量更新梯度中所涉及的商品集合为Q，所涉及的用户集合为 P，则商品m′的更新梯度聚合公式如下：

其中，m′∈Q，▽′_n′V_m′(t)表示用户n′所计算得到的商品m′的扰动后的商品特征向量更新梯度；

S6.8：服务器在接收到本批次的各商品的聚合更新梯度后，对所涉及的商品特征向量进行更新，其具体方法为：首先从商品m′的更新梯度▽V_m′中去除所涉及用户的全局噪声和临时噪声总和，得到更新梯度▽′V_m′，然后更新商品m′的特征向量V_m′＝V_m′+α▽′V_m′；

S6.9：判断是否t＜t_max，t_max表示预设的最大迭代次数，如果是，进入步骤 S6.10，否则本次商品特征向量更新结束；

S6.10：令t＝t+1，返回步骤S6.3；

S7：用户n从服务器获取当前所有商品特征向量V_m，并将

作为列向量构成商品特征矩阵V，计算预测交互向量

将用户n未购买过的商品按照预测交互向量

中所对应的元素值从大到小进行排列，选择前 H个商品作为推荐商品，其中H根据实际需要设置，从而获得推荐结果。

本发明基于隐私保护的推荐方法，在用户和电子商务平台服务器中设置半可信第三方机构，电子商务平台服务器公开所有商品的特征向量，用户从服务器中获取商品特征向量，根据其自身的购买数据在本地学习其用户特征向量，并据此计算对商品特征向量的更新梯度，采用全局噪声向量和临时噪声进行扰动后发送至半可信第三方机构，半可信第三方机构对扰动后的更新梯度进行聚合并发送给服务器，服务器对接收到的更新梯度去除扰动，然后对商品特征向量进行更新，用户再根据更新后的商品特征向量计算得到预测交互向量，从而得到商品推荐结果。

本发明具有以下有益效果：

1)用户在本地学习自己的特征向量，不发送原始的购买行为数据给其他实体，而是发送扰动后的商品特征向量更新梯度，从而实现了对用户购买行为数据的保护；

2)用户在更新自己的特征向量时，采用随机梯度下降法，批量请求商品特征向量，服务器无法分辨哪些商品是用户购买过的，哪些商品是用户未购买过的，从而保护了用户的偏好信息；

3)用户对商品特征向量更新梯度进行扰动时采用了全局噪声向量和临时噪声，其中全局噪声向量是独立产生的，所以单个用户的背叛不会对其他用户产生影响；而临时噪声可以防止半可信第三方机构获知用户的真实更新梯度；

4)半可信第三方机构对于商品特征向量更新梯度的聚合操作降低了服务器的计算代价，同时可以将用户隐没在社群中，更好地保护用户的隐私。

附图说明

图1是本发明基于隐私保护的推荐方法的具体实施方式流程图；

图2是本发明中更新商品特征向量的流程图。

具体实施方式

下面结合附图对本发明的具体实施方式进行描述，以便本领域的技术人员更好地理解本发明。需要特别提醒注意的是，在以下的描述中，当已知功能和设计的详细描述也许会淡化本发明的主要内容时，这些描述在这里将被忽略。

实施例

图1是本发明基于隐私保护的推荐方法的具体实施方式流程图。如图1所示，本发明基于隐私保护的推荐方法的具体步骤包括：

S101：设置半可信第三方机构：

在用户和电子商务平台服务器之间设置一个半可信第三方机构。半可信第三方机构具有以下2个特点：

1)诚实的：该机构会按照约定的协议，完成自己承担的任务，不会篡改用户发送的信息；

2)好奇的：该机构会利用接收到的信息，想办法为自己牟利；例如：利用用户发送的中间计算结果，想办法挖掘用户的偏好，倒卖给其他平台的行为。

在电子商务领域，半可信第三方机构可以是通讯公司(如移动、电信或网络宽带公司)，这些机构已经和用户签订了通讯服务的合同，用户和这些机构已经就数据传输的披露规则达成了共识，因此，这些机构的设置不会引起额外的信息公开。另外，这些机构通过从用户和服务器的通讯中收取费用盈利，本身不贩卖商品，因此它盗取用户偏好的可能性较小，相对较为安全。

S102：服务器初始化商品特征向量：

电子商务平台的服务器初始化该平台中每个商品K维的特征向量 V_m＝(v_m1,v_m2,…,v_mK)，v_mk表示商品m的特征向量中第k个元素值，m＝1,2,…,M， M表示商品数量，k＝1,2,…,K，服务器将各商品的特征向量向所有用户公开。

在实际应用中，商品的特征向量可以根据经验设置。本实施例中假设有4 种商品，分别为日记本、键盘、耳机、钢笔，设置K＝2，初始的特征向量分别是V₁＝(1.3,0.13)、V₂＝(0.33,-0.93)、V₃＝(0.3,-0.93)和V₄＝(1,0.31)。

S103：用户数据积累：

用户注册并登陆电子商务平台，积累自己购买商品的记录，构建原始的交互向量R_n＝(r_n1,r_n2,…,r_nM)，其中r_nm表示用户n对商品m的购买次数，n＝1,2,…,N， N表示用户数量。

本实施例中，用户1的交互向量R₁＝(0,0,2,0)，即用户1购买过2次耳机，用户2的交互向量R₂＝(5,0,0,0)，用户3的交互向量R₃＝(3,4,0,0)。

S104：协同计算全局噪声：

服务器生成服从标准指数分布的N个K维随机向量ω_n，分别发送给每个用户，每个用户生成服从标准正态分布的K维随机向量z_n，然后根据接收到的向量ω_n计算该用户的全局噪声向量

*表示哈达马积，即对应元素相乘。采用这种方式，全体用户生成的全局噪声是独立的、服从拉普拉斯分布的。

本实施例中服务器发送给各个用户的随机向量分别为：ω₁＝(0.831,0.411)， ω₂＝(0.380,0.922)，ω₃＝(0.830,0.488)，每个用户生成的随机向量分别为： z₁＝(-0.504,0.423)，z₂＝(-0.388,0.593)，z₃＝(1.171,-1.081)，每个用户所计算得到的全局噪声向量分别为：x₁＝(-0.65,0.384)，x₂＝(-0.338,0.805)，x₃＝(1.509,-1.068)。

S105：用户购买数据处理：

当用户n需要获取商品推荐时，首先根据用户当前的交互向量R_n获取二值向量C_n＝(c_n1,c_n2,…,c_nM)，当r_nm＝0时，c_nm＝0，当r_nm＞0时，c_nm＝1。为了区分购买过的商品和未购买过的商品，用户需要计算权重向量 W_n＝(w_n1,w_n2,…,w_nM)＝1+log(1+R_n10^ε)，其中w_nm表示用户n对于商品m的权重， w_nm＝1+log(1+r_nm10^ε)，ε表示预设的用于控制权重增量的常数。

本实施例中，假设3名用户同时需要获取商品推荐，用户1的二值向量 C₁＝(0,0,1,0)，用户2的二值向量C₂＝(1,0,0,0)，用户3的二值向量C₃＝(1,1,0,0)。在本实施例中，设置常数ε为3，即用户1的权重向量W₁＝(1,1,8.6,1)，用户2的权重向量W₂＝(9.517,1,1,1)，用户3的权重向量W₁＝(9.007,9.294,1,1)。

S106：更新商品特征向量：

用户n根据当前的购买数据，对商品特征向量进行更新。图2是本发明中更新商品特征向量的流程图。如图2所示，本发明中更新商品特征向量的具体步骤包括：

S201：初始化用户特征向量：

用户n初始化K维的用户特征向量U_n(0)＝(u_n1(0),u_n2(0),…,u_nK(0))，

表示用户n的特征向量中第k个元素值，n＝1,2,…,N，N表示用户数量，k＝1,2,…,K。

特征向量的初始化可以采用随机方式初始化，本实施例中假设3名用户所初始化得到的用户特征向量分别为：用户1的用户特征向量U₁(0)＝(0.15,-0.95)，用户2的用户特征向量U₂(0)＝(0.95,-0.4)，用户3的用户特征向量 U₃(0)＝(1.05,-0.65)。

S202：令迭代次数t＝1。

S203：用户请求商品特征：

用户n生成一个商品集

其中a_nd表示商品集A_n中第d个商品在原始商品序列中的序号，d＝1,2,…,D_n，D_n表示商品集A_n中商品数量，然后将该商品集A_n发送给服务器。

在本实施例中，假设用户1的商品集中包含键盘和耳机，则A₁＝(2,3)，用户2的商品集包含日记本和键盘，则A₂＝(1,2)，用户3的商品集包含日记本和耳机，即A₃＝(1,3)。

S204：服务器反馈商品特征和临时噪声：

服务器在接收到用户的商品集A_n之后，为商品集A_n中各个商品a_nd分别生成一个K维的临时噪声向量

然后连同商品集中各个商品a_nd当前的特征向量

一起反馈给用户。

在本实施例中，用户1将收到键盘的特征向量V₂＝(0.33,-0.93)和临时噪声 η_1,2＝(0.996,0.771)，以及耳机的特征向量V₃＝(0.3,-0.93)和临时噪声向量 η_1,3＝(0.592,0.015)，用户2将收到日记本的特征向量V₁＝(1.3,0.13)和临时噪声向量η_2,1＝(0.035,0.597)，以及键盘的特征向量V₂＝(0.33,-0.93)和临时噪声向量 η_2,2＝(0.504,0.408)，用户3将收到日记本的特征向量V₁＝(1.3,0.13)和临时噪声向量η_3,1＝(0.03,0.092)，以及耳机的特征向量V₃＝(0.3,-0.93)和临时噪声向量 η_3,3＝(0.938,0.274)，

S205：更新用户特征向量：

用户n在接收到商品集A_n中各个商品a_nd的特征向量

和临时噪声向量

其中，α表示预设的学习率，上标T表示转置。本实施例中α＝0.05。

本实施例中，用户1更新其用户特征向量：

U₁(1)＝U₁(0)+α(2w₁₂V₂(c₁₂-U₁(0)V₂))+α(2w₁₃V₃(c₁₃-U₁(0)V₃))

＝(0.138,-0.92)

同理，用户2更新其用户特征向量U₂(1)＝(0.597,-0.441)。

S206：计算商品特征向量更新梯度：

采用以下公式计算商品a_nd的特征向量更新梯度

的计算公式如下：

以商品2为例，用户1计算得到的商品2的特征向量更新梯度为 ▽₁V₂(1)＝α(2w₁₂U₁(t)(c₁₂-U₁(t-1)^TV₂))＝(-0.001,0.089)，则扰动后的商品2的特征向量更新梯度▽₁′V₂(1)＝(-0.322,2.928)。用户2计算得到的商品2的更新梯度 ▽₂V₂(1)＝(0.006,0.002)，则扰动后的商品2的特征向量更新梯度 ▽′₂V₂(1)＝(0.172,1.215)。

S207：聚合扰动后的更新梯度：

半可信第三方机构在接收到各个用户反馈的扰动后的商品特征向量更新梯度

后，对相同商品的更新梯度进行聚合，并将各商品的聚合更新梯度发送给电子商务平台的服务器，记当前半可信第三方机构本批次所接收到扰动后的商品特征向量更新梯度中所涉及的商品集合为Q，所涉及的用户集合为P，则商品m′的更新梯度聚合公式如下：

其中，m′∈Q，▽′_n′V_m′(t)表示用户n′所计算得到的商品m′的扰动后的商品特征向量更新梯度。

本实施例中，半可信第三方机构对商品2的扰动后的商品特征向量更新梯度进行聚合，得到▽V₂＝(-0.322,2.928)+(0.172,1.215)＝(0.15,4.143)。

S208：服务器更新商品特征向量：

服务器在接收到本批次的各商品的聚合更新梯度后，对所涉及的商品特征向量进行更新，其具体方法为：首先从商品m′的更新梯度▽V_m′中去除所涉及用户的全局噪声和临时噪声总和，得到更新梯度▽′V_m′，然后更新商品m′的商品特征向量V_m′＝V_m′+α▽′V_m′。

以商品2为例，本次更新得到的商品特征向量V₂＝(0.337,-0.839)。

S209：判断是否t＜t_max，t_max表示预设的最大迭代次数，如果是，进入步骤 S210，否则本次商品特征向量更新结束。

S210：令t＝t+1，返回步骤S203。

本实施例中设置最大迭代次数t_max＝2，第2次迭代时各用户均请求第1次迭代时未请求的商品特征向量，商品特征向量更新结束后，4个商品的特征向量分别为V₁＝(0.8,0.198)、V₂＝(0.396,-0.863)、V₃＝(0.247,-0.919)和V₄＝(0.837,0.315)。

S107：用户计算推荐结果：

用户n从服务器获取当前所有商品特征向量V_m，并将

作为列向量构成商品特征矩阵V，计算预测交互向量

将用户n未购买过的商品按照预测交互向量

中所对应的元素值从大到小进行排列，选择前H个商品作为推荐商品，其中H根据实际需要设置，从而获得推荐结果。

本实施例中，3个用户所计算得到的预测交互向量分别为

假设H＝1，以用户1为例，由于其购买过耳机(商品3)，因此在剩余商品中键盘(商品2)的所对应的元素值最大，因此用户1 的推荐结果为键盘。类似地，用户2的推荐结果为钢笔，用户3的推荐结果为耳机。

为了进一步优化商品推荐结果，服务器可以计算当前电子商务平台上各个商品之间的相似程度，据此将所有商品划分为多个类别，并将划分结果向所有用户公开。用户在其未被推荐的商品中搜索出与其购买过商品属于同一类别的商品，判断该商品在预测交互向量

中所对应的元素值是否大于预设阈值，如果是，则将该商品加入用户的推荐结果，否则不作任何操作。

尽管上面对本发明说明性的具体实施方式进行了描述，以便于本技术领域的技术人员理解本发明，但应该清楚，本发明不限于具体实施方式的范围，对本技术领域的普通技术人员来讲，只要各种变化在所附的权利要求限定和确定的本发明的精神和范围内，这些变化是显而易见的，一切利用本发明构思的发明创造均在保护之列。

Claims

1.一种基于隐私保护的推荐方法，其特征在于，包括以下步骤：

S2：电子商务平台的服务器初始化该平台中每个商品K维的特征向量V_m＝(v_m1，v_m2，…，v_mK)，v_mk表示商品m的特征向量中第k个元素值，m＝1，2，…，M，M表示商品数量，k＝1，2，…，K；

S3：用户注册并登陆电子商务平台，积累自己购买商品的记录，构建原始的交互向量R_n＝(r_n1，r_n2，…，r_nM)，其中r_nm表示用户n对商品m的购买次数，n＝1，2，…，N，N表示用户数量；

*表示哈达马积；

S5：当用户需要获取商品推荐时，首先根据用户当前的交互向量R_n获取二值向量C_n＝(c_n1，c_n2，…，c_nM)，当r_nm＝0时，c_nm＝0，当r_nm＞0时，c_nm＝1；计算权重向量W_n＝(w_n1，w_n2，…，w_nM)＝1+log(1+R_n10^ε)，其中w_nm表示用户n对于商品m的权重，ε表示预设的用于控制权重增量的常数；

S6：采用如下方法对商品特征向量进行更新：

S6.1：用户n初始化K维的用户特征向量U_n(0)＝(u_n1(0)，u_n2(0)，…，u_nK(0))，