CN111563789B - 基于隐私保护的推荐方法 - Google Patents

基于隐私保护的推荐方法 Download PDF

Info

Publication number
CN111563789B
CN111563789B CN202010235625.1A CN202010235625A CN111563789B CN 111563789 B CN111563789 B CN 111563789B CN 202010235625 A CN202010235625 A CN 202010235625A CN 111563789 B CN111563789 B CN 111563789B
Authority
CN
China
Prior art keywords
commodity
user
vector
feature vector
commodities
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010235625.1A
Other languages
English (en)
Other versions
CN111563789A (zh
Inventor
刘文炎
王晓玲
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
East China Normal University
Original Assignee
East China Normal University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by East China Normal University filed Critical East China Normal University
Priority to CN202010235625.1A priority Critical patent/CN111563789B/zh
Publication of CN111563789A publication Critical patent/CN111563789A/zh
Application granted granted Critical
Publication of CN111563789B publication Critical patent/CN111563789B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/06Buying, selling or leasing transactions
    • G06Q30/0601Electronic shopping [e-shopping]
    • G06Q30/0631Item recommendations
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/60Protecting data
    • G06F21/62Protecting access to data via a platform, e.g. using keys or access control rules
    • G06F21/6218Protecting access to data via a platform, e.g. using keys or access control rules to a system of files or objects, e.g. local or distributed file system or database
    • G06F21/6245Protecting personal data, e.g. for financial or medical purposes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/60Protecting data
    • G06F21/64Protecting data integrity, e.g. using checksums, certificates or signatures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/06Buying, selling or leasing transactions
    • G06Q30/0601Electronic shopping [e-shopping]

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Finance (AREA)
  • Accounting & Taxation (AREA)
  • Physics & Mathematics (AREA)
  • Bioethics (AREA)
  • General Health & Medical Sciences (AREA)
  • Computer Security & Cryptography (AREA)
  • Health & Medical Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • Software Systems (AREA)
  • Computer Hardware Design (AREA)
  • Development Economics (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • Strategic Management (AREA)
  • General Business, Economics & Management (AREA)
  • Databases & Information Systems (AREA)
  • Medical Informatics (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种基于隐私保护的推荐方法,在用户和电子商务平台服务器中设置半可信第三方机构,电子商务平台服务器公开所有商品的特征向量,用户从服务器中获取商品特征向量,根据其自身的购买数据在本地学习其用户特征向量,并据此计算对商品特征向量的更新梯度,采用全局噪声向量和临时噪声进行扰动后发送至半可信第三方机构,半可信第三方机构对扰动后的更新梯度进行聚合并发送给服务器,服务器对接收到的更新梯度去除扰动,然后对商品特征向量进行更新,用户再根据更新后的商品特征向量计算得到预测交互向量,从而得到商品推荐结果。采用本发明可以有效实现商品推荐过程中对用户隐私的保护。

Description

基于隐私保护的推荐方法
技术领域
本发明属于商品推荐技术领域,更为具体地讲,涉及一种基于隐私保护的 推荐方法。
背景技术
随着计算设备的普及,与日常生活息息相关的应用纷纷落地,许多组织和 机构收集和存储了大量用户的数字信息。例如,导航系统收集车辆的地理位置 信息,电子商务站点收集顾客的购物习惯。借助矩阵分解等推荐算法,这些数 据可以为数据收集者提供提高服务质量并且带来社会和经济效益的机会。例如, 通过分析实时路况,导航系统可以帮助司机躲避拥堵;通过分析顾客的历史订 单,可以帮助商家精准地投放广告。
在现实生活中,上述的数据大多都包含隐私信息。恶意主体根据用户的历 史行为数据进行推理或非法攻击,敏感的个人信息很可能被泄露。因此,如何 构建一个能够保护用户的隐私信息的推荐系统成为了亟待解决的问题。
隐私保护的商品推荐方法需要权衡个性化的服务需求和隐私保证,是个具 有挑战性的问题,目前行业内尚没有有效的解决方法。
发明内容
本发明的目的在于克服现有技术的不足,提供一种基于隐私保护的推荐方 法,实现商品推荐过程中对用户隐私的保护。
为实现上述发明目的,本发明基于隐私保护的推荐方法包括以下步骤:
S1:在用户和电子商务平台服务器之间设置一个半可信第三方机构;
S2:电子商务平台的服务器初始化该平台中每个商品K维的特征向量Vm=(vm1,vm2,…,vmK),vmk表示商品m的特征向量中第k个元素值,m=1,2,…,M, M表示商品数量,k=1,2,…,K,服务器将各商品的特征向量向所有用户公开;
S3:用户注册并登陆电子商务平台,积累自己购买商品的记录,构建原始 的交互向量Rn=(rn1,rn2,…,rnM),其中rnm表示用户n对商品m的购买次数, n=1,2,…,N,N表示用户数量;
S4:服务器生成服从标准指数分布的N个K维随机向量ωn,分别发送给每 个用户,每个用户生成服从标准正态分布的K维随机向量zn,然后根据接收到 的向量ωn计算该用户的全局噪声向量
Figure BDA0002430862410000021
*表示哈达马积;
S5:当用户需要获取商品推荐时,首先根据用户当前的交互向量Rn获取二 值向量Cn=(cn1,cn2,…,cnM),当rnm=0时,cnm=0,当rnm>0时,cnm=1;计算权 重向量Wn=(wn1,wn2,…,wnM)=1+log(1+Rn10ε),其中wnm表示用户n对于商品m的 权重,ε表示预设的用于控制权重增量的常数;
S6:采用如下方法对商品特征向量进行更新:
S6.1:用户n初始化K维的用户特征向量Un(0)=(un1(0),un2(0),…,unK(0)),
Figure BDA0002430862410000022
表示用户n的特征向量中第k个元素值,n=1,2,…,N,N表示用户数量, k=1,2,…,K;
S6.2:令迭代次数t=1;
S6.3:用户n生成一个商品集
Figure BDA0002430862410000023
其中and表示商品集An中 第d个商品在原始商品序列中的序号,d=1,2,…,Dn,Dn表示商品集An中商品数 量,然后将该商品集An发送给服务器;
S6.4:服务器在接收到用户的商品集An之后,为商品集An中各个商品and分 别生成一个K维的临时噪声向量
Figure BDA0002430862410000024
然后连同商品集中各个商品当前的特征 向量
Figure BDA0002430862410000025
一起反馈给用户;
S6.5:用户n在接收到商品集An中各个商品and的特征向量
Figure BDA0002430862410000026
和临时噪声向 量
Figure BDA0002430862410000027
后,基于梯度下降的方法更新其用户特征向量Un(t),计算公式如下:
Figure BDA0002430862410000028
S6.6:采用以下公式计算商品and的特征向量更新梯度
Figure BDA0002430862410000029
Figure BDA00024308624100000210
然后对商品特征向量的更新梯度进行扰动并发送给半可信第三方机构,扰 动后的商品特征向量更新梯度
Figure BDA00024308624100000211
的计算公式如下:
Figure BDA00024308624100000212
S6.7:半可信第三方机构在接收到各个用户反馈的扰动后的商品特征向量更 新梯度
Figure BDA0002430862410000031
后,对相同商品的更新梯度进行聚合,并将各商品的聚合更新梯 度发送给电子商务平台的服务器,记当前半可信第三方机构本批次所接收到扰 动后的商品特征向量更新梯度中所涉及的商品集合为Q,所涉及的用户集合为 P,则商品m′的更新梯度聚合公式如下:
Figure BDA0002430862410000032
其中,m′∈Q,▽′n′Vm′(t)表示用户n′所计算得到的商品m′的扰动后的商品特 征向量更新梯度;
S6.8:服务器在接收到本批次的各商品的聚合更新梯度后,对所涉及的商品 特征向量进行更新,其具体方法为:首先从商品m′的更新梯度▽Vm′中去除所涉 及用户的全局噪声和临时噪声总和,得到更新梯度▽′Vm′,然后更新商品m′的特 征向量Vm′=Vm′+α▽′Vm′
S6.9:判断是否t<tmax,tmax表示预设的最大迭代次数,如果是,进入步骤 S6.10,否则本次商品特征向量更新结束;
S6.10:令t=t+1,返回步骤S6.3;
S7:用户n从服务器获取当前所有商品特征向量Vm,并将
Figure BDA0002430862410000033
作为列向量构 成商品特征矩阵V,计算预测交互向量
Figure BDA0002430862410000034
将用户n未购 买过的商品按照预测交互向量
Figure BDA0002430862410000035
中所对应的元素值从大到小进行排列,选择前 H个商品作为推荐商品,其中H根据实际需要设置,从而获得推荐结果。
本发明基于隐私保护的推荐方法,在用户和电子商务平台服务器中设置半 可信第三方机构,电子商务平台服务器公开所有商品的特征向量,用户从服务 器中获取商品特征向量,根据其自身的购买数据在本地学习其用户特征向量, 并据此计算对商品特征向量的更新梯度,采用全局噪声向量和临时噪声进行扰 动后发送至半可信第三方机构,半可信第三方机构对扰动后的更新梯度进行聚 合并发送给服务器,服务器对接收到的更新梯度去除扰动,然后对商品特征向 量进行更新,用户再根据更新后的商品特征向量计算得到预测交互向量,从而 得到商品推荐结果。
本发明具有以下有益效果:
1)用户在本地学习自己的特征向量,不发送原始的购买行为数据给其他实 体,而是发送扰动后的商品特征向量更新梯度,从而实现了对用户购买行为数 据的保护;
2)用户在更新自己的特征向量时,采用随机梯度下降法,批量请求商品特 征向量,服务器无法分辨哪些商品是用户购买过的,哪些商品是用户未购买过 的,从而保护了用户的偏好信息;
3)用户对商品特征向量更新梯度进行扰动时采用了全局噪声向量和临时噪 声,其中全局噪声向量是独立产生的,所以单个用户的背叛不会对其他用户产 生影响;而临时噪声可以防止半可信第三方机构获知用户的真实更新梯度;
4)半可信第三方机构对于商品特征向量更新梯度的聚合操作降低了服务器 的计算代价,同时可以将用户隐没在社群中,更好地保护用户的隐私。
附图说明
图1是本发明基于隐私保护的推荐方法的具体实施方式流程图;
图2是本发明中更新商品特征向量的流程图。
具体实施方式
下面结合附图对本发明的具体实施方式进行描述,以便本领域的技术人员 更好地理解本发明。需要特别提醒注意的是,在以下的描述中,当已知功能和 设计的详细描述也许会淡化本发明的主要内容时,这些描述在这里将被忽略。
实施例
图1是本发明基于隐私保护的推荐方法的具体实施方式流程图。如图1所 示,本发明基于隐私保护的推荐方法的具体步骤包括:
S101:设置半可信第三方机构:
在用户和电子商务平台服务器之间设置一个半可信第三方机构。半可信第 三方机构具有以下2个特点:
1)诚实的:该机构会按照约定的协议,完成自己承担的任务,不会篡改用 户发送的信息;
2)好奇的:该机构会利用接收到的信息,想办法为自己牟利;例如:利用 用户发送的中间计算结果,想办法挖掘用户的偏好,倒卖给其他平台的行为。
在电子商务领域,半可信第三方机构可以是通讯公司(如移动、电信或网 络宽带公司),这些机构已经和用户签订了通讯服务的合同,用户和这些机构已 经就数据传输的披露规则达成了共识,因此,这些机构的设置不会引起额外的 信息公开。另外,这些机构通过从用户和服务器的通讯中收取费用盈利,本身 不贩卖商品,因此它盗取用户偏好的可能性较小,相对较为安全。
S102:服务器初始化商品特征向量:
电子商务平台的服务器初始化该平台中每个商品K维的特征向量 Vm=(vm1,vm2,…,vmK),vmk表示商品m的特征向量中第k个元素值,m=1,2,…,M, M表示商品数量,k=1,2,…,K,服务器将各商品的特征向量向所有用户公开。
在实际应用中,商品的特征向量可以根据经验设置。本实施例中假设有4 种商品,分别为日记本、键盘、耳机、钢笔,设置K=2,初始的特征向量分别 是V1=(1.3,0.13)、V2=(0.33,-0.93)、V3=(0.3,-0.93)和V4=(1,0.31)。
S103:用户数据积累:
用户注册并登陆电子商务平台,积累自己购买商品的记录,构建原始的交 互向量Rn=(rn1,rn2,…,rnM),其中rnm表示用户n对商品m的购买次数,n=1,2,…,N, N表示用户数量。
本实施例中,用户1的交互向量R1=(0,0,2,0),即用户1购买过2次耳机, 用户2的交互向量R2=(5,0,0,0),用户3的交互向量R3=(3,4,0,0)。
S104:协同计算全局噪声:
服务器生成服从标准指数分布的N个K维随机向量ωn,分别发送给每个用 户,每个用户生成服从标准正态分布的K维随机向量zn,然后根据接收到的向 量ωn计算该用户的全局噪声向量
Figure BDA0002430862410000051
*表示哈达马积,即对应元素相 乘。采用这种方式,全体用户生成的全局噪声是独立的、服从拉普拉斯分布的。
本实施例中服务器发送给各个用户的随机向量分别为:ω1=(0.831,0.411), ω2=(0.380,0.922),ω3=(0.830,0.488),每个用户生成的随机向量分别为: z1=(-0.504,0.423),z2=(-0.388,0.593),z3=(1.171,-1.081),每个用户所计算得到 的全局噪声向量分别为:x1=(-0.65,0.384),x2=(-0.338,0.805),x3=(1.509,-1.068)。
S105:用户购买数据处理:
当用户n需要获取商品推荐时,首先根据用户当前的交互向量Rn获取二值向 量Cn=(cn1,cn2,…,cnM),当rnm=0时,cnm=0,当rnm>0时,cnm=1。为了区分购 买过的商品和未购买过的商品,用户需要计算权重向量 Wn=(wn1,wn2,…,wnM)=1+log(1+Rn10ε),其中wnm表示用户n对于商品m的权重, wnm=1+log(1+rnm10ε),ε表示预设的用于控制权重增量的常数。
本实施例中,假设3名用户同时需要获取商品推荐,用户1的二值向量 C1=(0,0,1,0),用户2的二值向量C2=(1,0,0,0),用户3的二值向量C3=(1,1,0,0)。 在本实施例中,设置常数ε为3,即用户1的权重向量W1=(1,1,8.6,1),用户2的 权重向量W2=(9.517,1,1,1),用户3的权重向量W1=(9.007,9.294,1,1)。
S106:更新商品特征向量:
用户n根据当前的购买数据,对商品特征向量进行更新。图2是本发明中更 新商品特征向量的流程图。如图2所示,本发明中更新商品特征向量的具体步 骤包括:
S201:初始化用户特征向量:
用户n初始化K维的用户特征向量Un(0)=(un1(0),un2(0),…,unK(0)),
Figure BDA0002430862410000061
表示用户n的特征向量中第k个元素值,n=1,2,…,N,N表示用户数量,k=1,2,…,K。
特征向量的初始化可以采用随机方式初始化,本实施例中假设3名用户所 初始化得到的用户特征向量分别为:用户1的用户特征向量U1(0)=(0.15,-0.95), 用户2的用户特征向量U2(0)=(0.95,-0.4),用户3的用户特征向量 U3(0)=(1.05,-0.65)。
S202:令迭代次数t=1。
S203:用户请求商品特征:
用户n生成一个商品集
Figure BDA0002430862410000062
其中and表示商品集An中第d个 商品在原始商品序列中的序号,d=1,2,…,Dn,Dn表示商品集An中商品数量,然 后将该商品集An发送给服务器。
在本实施例中,假设用户1的商品集中包含键盘和耳机,则A1=(2,3),用 户2的商品集包含日记本和键盘,则A2=(1,2),用户3的商品集包含日记本和 耳机,即A3=(1,3)。
S204:服务器反馈商品特征和临时噪声:
服务器在接收到用户的商品集An之后,为商品集An中各个商品and分别生成 一个K维的临时噪声向量
Figure BDA0002430862410000063
然后连同商品集中各个商品and当前的特征向量
Figure BDA0002430862410000071
一起反馈给用户。
在本实施例中,用户1将收到键盘的特征向量V2=(0.33,-0.93)和临时噪声 η1,2=(0.996,0.771),以及耳机的特征向量V3=(0.3,-0.93)和临时噪声向量 η1,3=(0.592,0.015),用户2将收到日记本的特征向量V1=(1.3,0.13)和临时噪声向 量η2,1=(0.035,0.597),以及键盘的特征向量V2=(0.33,-0.93)和临时噪声向量 η2,2=(0.504,0.408),用户3将收到日记本的特征向量V1=(1.3,0.13)和临时噪声向 量η3,1=(0.03,0.092),以及耳机的特征向量V3=(0.3,-0.93)和临时噪声向量 η3,3=(0.938,0.274),
S205:更新用户特征向量:
用户n在接收到商品集An中各个商品and的特征向量
Figure BDA0002430862410000072
和临时噪声向量
Figure BDA0002430862410000073
后,基于梯度下降的方法更新其用户特征向量Un(t),计算公式如下:
Figure BDA0002430862410000074
其中,α表示预设的学习率,上标T表示转置。本实施例中α=0.05。
本实施例中,用户1更新其用户特征向量:
U1(1)=U1(0)+α(2w12V2(c12-U1(0)V2))+α(2w13V3(c13-U1(0)V3))
=(0.138,-0.92)
同理,用户2更新其用户特征向量U2(1)=(0.597,-0.441)。
S206:计算商品特征向量更新梯度:
采用以下公式计算商品and的特征向量更新梯度
Figure BDA0002430862410000075
Figure BDA0002430862410000076
然后对商品特征向量的更新梯度进行扰动并发送给半可信第三方机构,扰 动后的商品特征向量更新梯度
Figure BDA0002430862410000077
的计算公式如下:
Figure BDA0002430862410000078
以商品2为例,用户1计算得到的商品2的特征向量更新梯度为 ▽1V2(1)=α(2w12U1(t)(c12-U1(t-1)TV2))=(-0.001,0.089),则扰动后的商品2的特征 向量更新梯度▽1′V2(1)=(-0.322,2.928)。用户2计算得到的商品2的更新梯度 ▽2V2(1)=(0.006,0.002),则扰动后的商品2的特征向量更新梯度 ▽′2V2(1)=(0.172,1.215)。
S207:聚合扰动后的更新梯度:
半可信第三方机构在接收到各个用户反馈的扰动后的商品特征向量更新梯 度
Figure BDA0002430862410000081
后,对相同商品的更新梯度进行聚合,并将各商品的聚合更新梯度发 送给电子商务平台的服务器,记当前半可信第三方机构本批次所接收到扰动后 的商品特征向量更新梯度中所涉及的商品集合为Q,所涉及的用户集合为P,则 商品m′的更新梯度聚合公式如下:
Figure BDA0002430862410000082
其中,m′∈Q,▽′n′Vm′(t)表示用户n′所计算得到的商品m′的扰动后的商品特 征向量更新梯度。
本实施例中,半可信第三方机构对商品2的扰动后的商品特征向量更新梯 度进行聚合,得到▽V2=(-0.322,2.928)+(0.172,1.215)=(0.15,4.143)。
S208:服务器更新商品特征向量:
服务器在接收到本批次的各商品的聚合更新梯度后,对所涉及的商品特征 向量进行更新,其具体方法为:首先从商品m′的更新梯度▽Vm′中去除所涉及用 户的全局噪声和临时噪声总和,得到更新梯度▽′Vm′,然后更新商品m′的商品特 征向量Vm′=Vm′+α▽′Vm′
以商品2为例,本次更新得到的商品特征向量V2=(0.337,-0.839)。
S209:判断是否t<tmax,tmax表示预设的最大迭代次数,如果是,进入步骤 S210,否则本次商品特征向量更新结束。
S210:令t=t+1,返回步骤S203。
本实施例中设置最大迭代次数tmax=2,第2次迭代时各用户均请求第1次 迭代时未请求的商品特征向量,商品特征向量更新结束后,4个商品的特征向量 分别为V1=(0.8,0.198)、V2=(0.396,-0.863)、V3=(0.247,-0.919)和V4=(0.837,0.315)。
S107:用户计算推荐结果:
用户n从服务器获取当前所有商品特征向量Vm,并将
Figure BDA0002430862410000083
作为列向量构成商 品特征矩阵V,计算预测交互向量
Figure BDA0002430862410000084
将用户n未购买过 的商品按照预测交互向量
Figure BDA0002430862410000085
中所对应的元素值从大到小进行排列,选择前H个 商品作为推荐商品,其中H根据实际需要设置,从而获得推荐结果。
本实施例中,3个用户所计算得到的预测交互向量分别为
Figure BDA0002430862410000086
Figure BDA0002430862410000091
假设H=1,以用户1为例,由于其购买过耳机(商 品3),因此在剩余商品中键盘(商品2)的所对应的元素值最大,因此用户1 的推荐结果为键盘。类似地,用户2的推荐结果为钢笔,用户3的推荐结果为 耳机。
为了进一步优化商品推荐结果,服务器可以计算当前电子商务平台上各个 商品之间的相似程度,据此将所有商品划分为多个类别,并将划分结果向所有 用户公开。用户在其未被推荐的商品中搜索出与其购买过商品属于同一类别的 商品,判断该商品在预测交互向量
Figure BDA0002430862410000092
中所对应的元素值是否大于预设阈值,如 果是,则将该商品加入用户的推荐结果,否则不作任何操作。
尽管上面对本发明说明性的具体实施方式进行了描述,以便于本技术领域 的技术人员理解本发明,但应该清楚,本发明不限于具体实施方式的范围,对 本技术领域的普通技术人员来讲,只要各种变化在所附的权利要求限定和确定 的本发明的精神和范围内,这些变化是显而易见的,一切利用本发明构思的发 明创造均在保护之列。

Claims (2)

1.一种基于隐私保护的推荐方法,其特征在于,包括以下步骤:
S1:在用户和电子商务平台服务器之间设置一个半可信第三方机构;
S2:电子商务平台的服务器初始化该平台中每个商品K维的特征向量Vm=(vm1,vm2,…,vmK),vmk表示商品m的特征向量中第k个元素值,m=1,2,…,M,M表示商品数量,k=1,2,…,K;
S3:用户注册并登陆电子商务平台,积累自己购买商品的记录,构建原始的交互向量Rn=(rn1,rn2,…,rnM),其中rnm表示用户n对商品m的购买次数,n=1,2,…,N,N表示用户数量;
S4:服务器生成服从标准指数分布的N个K维随机向量ωn,分别发送给每个用户,每个用户生成服从标准正态分布的K维随机向量zn,然后根据接收到的向量ωn计算该用户的全局噪声向量
Figure FDA0003460073290000011
*表示哈达马积;
S5:当用户需要获取商品推荐时,首先根据用户当前的交互向量Rn获取二值向量Cn=(cn1,cn2,…,cnM),当rnm=0时,cnm=0,当rnm>0时,cnm=1;计算权重向量Wn=(wn1,wn2,…,wnM)=1+log(1+Rn10ε),其中wnm表示用户n对于商品m的权重,ε表示预设的用于控制权重增量的常数;
S6:采用如下方法对商品特征向量进行更新:
S6.1:用户n初始化K维的用户特征向量Un(0)=(un1(0),un2(0),…,unK(0)),
Figure FDA0003460073290000012
表示用户n的特征向量中第k个元素值,n=1,2,…,N,N表示用户数量,k=1,2,…,K;
S6.2:令迭代次数t=1;
S6.3:用户n生成一个商品集
Figure FDA0003460073290000013
其中and表示商品集An中第d个商品在原始商品序列中的序号,d=1,2,…,Dn,Dn表示商品集An中商品数量,然后将该商品集An发送给服务器;
S6.4:服务器在接收到用户的商品集An之后,为商品集An中各个商品and分别生成一个K维的临时噪声向量
Figure FDA0003460073290000014
然后连同商品集中各个商品and当前的特征向量
Figure FDA0003460073290000015
一起反馈给用户;
S6.5:用户n在接收到商品集An中各个商品and的特征向量
Figure FDA0003460073290000016
和临时噪声向量
Figure FDA0003460073290000017
后,基于梯度下降的方法更新其用户特征向量Un(t),计算公式如下:
Figure FDA0003460073290000021
其中,α表示预设的学习率;
S6.6:采用以下公式计算商品and的特征向量更新梯度
Figure FDA0003460073290000022
Figure FDA0003460073290000023
然后对商品特征向量的更新梯度进行扰动并发送给半可信第三方机构,扰动后的商品特征向量更新梯度
Figure FDA0003460073290000024
的计算公式如下:
Figure FDA0003460073290000025
S6.7:半可信第三方机构在接收到各个用户反馈的扰动后的商品特征向量更新梯度
Figure FDA0003460073290000026
后,对相同商品的更新梯度进行聚合,并将各商品的聚合更新梯度发送给电子商务平台的服务器,记当前半可信第三方机构本批次所接收到扰动后的商品特征向量更新梯度中所涉及的商品集合为Q,所涉及的用户集合为P,则商品m′的更新梯度聚合公式如下:
Figure FDA0003460073290000027
其中,m′∈Q,
Figure FDA0003460073290000028
表示用户n′所计算得到的商品m′的扰动后的商品特征向量更新梯度;
S6.8:服务器在接收到本批次的各商品的聚合更新梯度后,对所涉及的商品特征向量进行更新,其具体方法为:首先从商品m′的更新梯度
Figure FDA0003460073290000029
中去除所涉及用户的全局噪声和临时噪声总和,得到更新梯度
Figure FDA00034600732900000210
然后更新商品m′的特征向量
Figure FDA00034600732900000211
S6.9:判断是否t<tmax,tmax表示预设的最大迭代次数,如果是,进入步骤S6.10,否则本次商品特征向量更新结束;
S6.11:令t=t+1,返回步骤S6.3;
S7:用户n从服务器获取当前所有商品特征向量Vm,并将
Figure FDA00034600732900000212
作为列向量构成商品特征矩阵V,计算预测交互向量
Figure FDA00034600732900000213
将用户n未购买过的商品按照预测交互向量
Figure FDA00034600732900000214
中所对应的元素值从大到小进行排列,选择前H个商品作为推荐商品,其中H根据实际需要设置,从而获得推荐结果。
2.根据权利要求1所述的基于隐私保护的推荐方法,其特征在于,所述的步骤S7中,还包括以下步骤:服务器计算当前电子商务平台上各个商品之间的相似程度,据此将所有商品划分为多个类别,并将划分结果向所有用户公开;用户在其未被推荐的商品中搜索出与其购买过商品属于同一类别的商品,判断该商品在预测交互向量
Figure FDA0003460073290000031
中所对应的元素值是否大于预设阈值,如果是,则将该商品加入用户的推荐结果,否则不作任何操作。
CN202010235625.1A 2020-03-30 2020-03-30 基于隐私保护的推荐方法 Active CN111563789B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010235625.1A CN111563789B (zh) 2020-03-30 2020-03-30 基于隐私保护的推荐方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010235625.1A CN111563789B (zh) 2020-03-30 2020-03-30 基于隐私保护的推荐方法

Publications (2)

Publication Number Publication Date
CN111563789A CN111563789A (zh) 2020-08-21
CN111563789B true CN111563789B (zh) 2022-03-25

Family

ID=72070308

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010235625.1A Active CN111563789B (zh) 2020-03-30 2020-03-30 基于隐私保护的推荐方法

Country Status (1)

Country Link
CN (1) CN111563789B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113656688A (zh) * 2021-08-09 2021-11-16 Oppo广东移动通信有限公司 数据处理方法、装置、存储介质及计算机设备

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104050267A (zh) * 2014-06-23 2014-09-17 中国科学院软件研究所 基于关联规则满足用户隐私保护的个性化推荐方法及系统
CN107360146A (zh) * 2017-07-03 2017-11-17 深圳大学 一种接受保证的隐私保护空间众包任务分配系统及方法
CN107454070A (zh) * 2017-07-24 2017-12-08 华东师范大学 一种基于区块链的个性化隐私信息检索方法

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8234498B2 (en) * 2005-07-25 2012-07-31 Britti Michael A Screening using a personal identification code
US20160071127A1 (en) * 2013-10-12 2016-03-10 Chian Chiu Li Systems And Methods for Conducting Survey to Get Opinions on People

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104050267A (zh) * 2014-06-23 2014-09-17 中国科学院软件研究所 基于关联规则满足用户隐私保护的个性化推荐方法及系统
CN107360146A (zh) * 2017-07-03 2017-11-17 深圳大学 一种接受保证的隐私保护空间众包任务分配系统及方法
CN107454070A (zh) * 2017-07-24 2017-12-08 华东师范大学 一种基于区块链的个性化隐私信息检索方法

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
"Optimized data de-identification using multidimensional k-anonymity";Kai-Cheng Liu Chuan-Wei Kuo;《IEEE International Conference On Big Data Science And Engineering》;20191230;第1-8页 *
"个性化推荐系统中差分隐私保护方法研究与应用";邵荣敏;《中国博士学位论文全文信息科技辑》;20181230;第131-168页 *
"基于商品领域知识的交互式推荐系统";胡新明;《现代图书情报技术》;20181230;第1-7页 *

Also Published As

Publication number Publication date
CN111563789A (zh) 2020-08-21

Similar Documents

Publication Publication Date Title
US7685232B2 (en) Method for anonymous collaborative filtering using matrix factorization
US10332015B2 (en) Particle thompson sampling for online matrix factorization recommendation
KR101060487B1 (ko) 태그 클라우드를 이용한 콘텐츠 추천 장치 및 방법
US20170293865A1 (en) Real-time updates to item recommendation models based on matrix factorization
US9767475B2 (en) Real time audience forecasting
US9092739B2 (en) Recommender system with training function based on non-random missing data
CN105337924B (zh) 网络服务提供商系统数据访问控制方法及设备
CN105138664B (zh) 一种隐私保护的大数据推荐方法及系统
US20170148083A1 (en) Recommending of an item to a user
US20100153216A1 (en) Determining advertising conversion
US10102542B2 (en) Optimization and attribution of marketing resources
US8478693B1 (en) Framework for specifying access to protected content
CN102123141A (zh) 在个性化内容递送期间维持私密性
CN108230051A (zh) 一种基于标签权重算法的用户对商品关注度的确定方法
US11120157B2 (en) System and method for safe usage and fair tracking of user profile data
US20200026876A1 (en) Recommendation System Based on Individualized Privacy Settings
CA3040681C (en) Secret sharing with a trusted initializer
CN109767302B (zh) 大数据精准模型的构建方法及装置
CN113761350B (zh) 一种数据推荐方法、相关装置和数据推荐系统
CN111563789B (zh) 基于隐私保护的推荐方法
AU2008232558B2 (en) Determining advertising conversion
CN111859360A (zh) 一种安全的多设备联合数据计算系统、方法及装置
US20160312234A1 (en) Determining user charges using tracking information
US20160005099A1 (en) Method and system for item recommendation
CN108763515B (zh) 一种基于概率矩阵分解的时间敏感个性化推荐方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant