CN110175283B - 一种推荐模型的生成方法及装置 - Google Patents

一种推荐模型的生成方法及装置 Download PDF

Info

Publication number
CN110175283B
CN110175283B CN201910389347.2A CN201910389347A CN110175283B CN 110175283 B CN110175283 B CN 110175283B CN 201910389347 A CN201910389347 A CN 201910389347A CN 110175283 B CN110175283 B CN 110175283B
Authority
CN
China
Prior art keywords
gradient information
parameter
server
node
vector
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910389347.2A
Other languages
English (en)
Other versions
CN110175283A (zh
Inventor
郑文琛
杨强
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
WeBank Co Ltd
Original Assignee
WeBank Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by WeBank Co Ltd filed Critical WeBank Co Ltd
Priority to CN201910389347.2A priority Critical patent/CN110175283B/zh
Publication of CN110175283A publication Critical patent/CN110175283A/zh
Application granted granted Critical
Publication of CN110175283B publication Critical patent/CN110175283B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Transfer Between Computers (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明涉及金融技术领域,尤其涉及一种推荐方法及装置,适用于以对象为节点、对象间的关系为边的网络嵌入模型;所述方法包括:第一服务器获取第二网络嵌入模型的重叠节点的第二特征向量和所述重叠节点的邻居节点的第二参数向量;所述重叠节点为所述第二网络嵌入模型和第一网络嵌入模型具有的相同对象;所述第一服务器根据所述第二特征向量和所述第二参数向量更新所述第一网络嵌入模型的重叠节点的第一特征向量和所述第一网络嵌入模型的重叠节点的邻居节点的第一参数向量;所述第一服务器通过更新后的第一网络嵌入模型确定第二特征梯度信息和第二参数梯度信息;所述第二特征梯度信息和所述第二参数梯度信息至少用于更新所述第二网络嵌入模型。

Description

一种推荐模型的生成方法及装置
技术领域
本发明涉及金融技术领域,尤其涉及一种推荐模型的生成方法及装置。
背景技术
随着互联网技术的发展,网络平台上信息大量而多样,随着用户和产品数据的不断丰富(比如用户有社交关系,产品有属性、类别关联等)、以及用户和产品之间的交互变得越来越多样(除了点击、还有点赞、转发、浏览时长等行为),如何实现为用户推荐个性化和感兴趣的信息服务,是非常重要的。
现有技术中,信息推荐方法中考虑的用户和产品数据间的关联关系难以全面覆盖,影响用户覆盖率和推荐信息的多样性。
发明内容
本发明实施例提供一种信息推荐模型的生成方法及装置,以解决现有技术中信息推荐多样性和用户覆盖率较低的问题。
本发明实施例提供的具体技术方案如下:
本发明一个实施例提供了一种推荐模型的生成方法,适用于以对象为节点、对象间的关系为边的网络嵌入模型;所述网络嵌入模型中的每个节点包括表征节点属性的特征向量和表征节点作为邻居节点的参数向量;所述方法包括:
第一服务器获取第二网络嵌入模型的重叠节点的第二特征向量和所述重叠节点的邻居节点的第二参数向量;所述重叠节点为所述第二网络嵌入模型和第一网络嵌入模型具有的相同对象;所述第一网络嵌入模型是通过第一数据训练得到的;所述第二网络嵌入模型是通过第二数据训练得到的;
所述第一服务器根据所述第二特征向量和所述第二参数向量更新所述第一网络嵌入模型的重叠节点的第一特征向量和所述第一网络嵌入模型的重叠节点的邻居节点的第一参数向量;
所述第一服务器通过更新后的第一网络嵌入模型确定第二特征梯度信息和第二参数梯度信息;所述第二特征梯度信息和所述第二参数梯度信息至少用于更新所述第二网络嵌入模型。
本发明实施例中,第一服务器获取第二网络嵌入模型的重叠节点的第二特征向量和所述重叠节点的邻居节点的第二参数向量;所述重叠节点为所述第二网络嵌入模型和第一网络嵌入模型具有的相同对象;所述第一网络嵌入模型是通过第一数据训练得到的;所述第二网络嵌入模型是通过第二数据训练得到的;
所述第一服务器根据所述第二特征向量和所述第二参数向量更新所述第一网络嵌入模型的重叠节点的第一特征向量和所述第一网络嵌入模型的重叠节点的邻居节点的第一参数向量;所述第一服务器通过更新后的第一网络嵌入模型确定第一特征梯度信息和第一参数梯度信息;所述第一特征梯度信息和所述第一参数梯度信息至少用于更新所述第二网络嵌入模型,从而利用了第二服务器中的第二网络嵌入模型中的特征,以更新第一网络嵌入模型的参数,提高了训练出的第一网络嵌入模型的推荐准确性;且由于更新了所述重叠节点的邻居节点的第二参数向量,从而考虑了多方数据中的相似用户,提高了用户覆盖率和推荐的信息的多样性。
为提高传输过程的用户数据的安全性,一种可能的实现方式,所述方法还包括:
所述第一服务器将所述第一特征向量和所述第一参数向量经过同态加密后发送给第二服务器,所述第二服务器用于通过所述第一特征向量和所述第一参数向量更新所述第二网络嵌入模型,从而确定第一特征梯度信息和第一参数梯度信息;所述第一特征梯度信息和所述第一参数梯度信息至少用于更新所述第一网络嵌入模型。
为提高传输过程的用户数据的安全性,一种可能的实现方式,所述第一服务器确定第一特征梯度信息和第一参数梯度信息之后,还包括:
所述第一服务器将所述第二特征梯度信息和所述第二参数梯度信息发送给第三服务器;
所述第一服务器接收所述第三服务器发送的第三特征梯度信息和第三参数梯度信息;所述第三特征梯度信息和所述第三参数梯度信息是通过所述第一特征梯度信息、所述第一参数梯度信息、所述第二特征梯度信息和所述第二参数梯度信息确定的;
所述第一服务器根据所述第三特征梯度信息和所述第三参数梯度信息重新训练更新前的所述第一网络嵌入模型。
为提高传输过程的用户数据的安全性,一种可能的实现方式,所述第三特征梯度信息和所述第三参数梯度信息是通过所述第一特征梯度信息、所述第一参数梯度信息、所述第二特征梯度信息和所述第二参数梯度信息确定的,包括:
所述第三特征梯度信息为通过所述第一特征梯度信息和所述第二特征梯度信息在所述第三服务器分别解密后确定的;
所述第三参数梯度信息为通过所述第一参数梯度信息和所述第二参数梯度信息在所述第三服务器分别解密后确定的。
为提高模型训练效果,一种可能的实现方式,所述方法还包括:
若确定所述第一特征向量和所述第一参数向量的相似度大于预设阈值;
若确定所述第一特征向量和所述第二特征向量的相似度大于预设阈值;
所述第二特征向量与所述第二参数向量的相似度大于预设阈值;
所述第一参数向量与所述第二参数向量的相似度大于预设阈值;
则确定所述第一网络嵌入模型训练完成。
本发明实施例提供一种推荐模型的生成装置,适用于以对象为节点、对象间的关系为边的网络嵌入模型;所述网络嵌入模型中的每个节点包括表征节点属性的特征向量和表征节点作为邻居节点的参数向量;所述装置包括:
收发单元,用于获取第二网络嵌入模型的重叠节点的第二特征向量和所述重叠节点的邻居节点的第二参数向量;所述重叠节点为所述第二网络嵌入模型和第一网络嵌入模型具有的相同对象;所述第一网络嵌入模型是通过第一数据训练得到的;所述第二网络嵌入模型是通过第二数据训练得到的;
处理单元,用于根据所述第二特征向量和所述第二参数向量更新所述第一网络嵌入模型的重叠节点的第一特征向量和所述第一网络嵌入模型的重叠节点的邻居节点的第一参数向量;通过更新后的第一网络嵌入模型确定第二特征梯度信息和第二参数梯度信息;所述第二特征梯度信息和所述第二参数梯度信息至少用于更新所述第二网络嵌入模型。
一种可能的实现方式,所述收发单元还用于:
将所述第一特征向量和所述第一参数向量经过同态加密后发送给第二服务器,所述第二服务器用于通过所述第一特征向量和所述第一参数向量更新所述第二网络嵌入模型,从而确定第一特征梯度信息和第一参数梯度信息;所述第一特征梯度信息和所述第一参数梯度信息至少用于更新所述第一网络嵌入模型。
一种可能的实现方式,所述收发单元,还用于:
将所述第二特征梯度信息和所述第二参数梯度信息发送给第三服务器;接收所述第三服务器发送的第三特征梯度信息和第三参数梯度信息;所述第三特征梯度信息和所述第三参数梯度信息是通过所述第一特征梯度信息、所述第一参数梯度信息、所述第二特征梯度信息和所述第二参数梯度信息确定的;
所述处理单元,还用于:根据所述第三特征梯度信息和所述第三参数梯度信息重新训练更新前的所述第一网络嵌入模型。
本发明另一个实施例提供了一种电子设备,包括:
至少一个存储器,用于存储程序指令;
至少一个处理器,用于调用所述存储器中存储的程序指令,按照获得的程序指令执行上述任一种信息推荐方法。
一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述任一种信息推荐方法的步骤。
附图说明
图1为本发明实施例中信息推荐模型的架构示意图;
图2为本发明实施例中信息推荐模型的生成方法的流程示意图;
图3为本发明实施例中信息推荐装置结构示意图;
图4为本发明实施例中电子设备结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,并不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
随着用户和产品数据的不断丰富(比如用户有社交关系,产品有属性、类别关联等)、以及用户和产品之间的交互变得越来越多样(除了点击、还有点赞、转发、浏览时长等行为),传统的推荐和广告方法主要将用户和产品的交互数据处理成非结构化数据(比如用户-产品点击矩阵),然后通过矩阵分解等方法来进行计算用户对产品的感兴趣度。该方法无法很好的利用产品和用户间的关联关系。
本发明实施例中,将用户和产品数据处理成网络形状的结构化数据。其中,网络:可以由可以用G=(V,E)表示,其中V表示网络的节点,E表示网络的边。表示,反映对象之间的联系,对象可以为用户或产品,网络反映了用户与产品之间的联系;比如用户有社交关系,产品有属性、类别关联等、以及用户和产品之间的交互,如点击、点赞、转发、浏览时长等行为。V是对象集合,E是边集,对于任意两个对象,如果对象Vp与对象Vm具有关联关系,则网络中的节点Vp和节点Vm之间会有一条边Epm∈E,否则这条边不存在。对于一个产品推荐场景,网络的节点是用户、产品、及其相关属性,网络的边是点对点的关系。
网络嵌入模型:为以对象为节点、对象间的关系为边的网络嵌入模型;所述网络嵌入模型中的每个节点包括表征节点属性的特征向量和表征节点作为邻居节点的参数向量。具体的,可以根据网络,定义每个节点的随机游走规则;根据规则对网络进行随机游走,保存游走记录;求得游走记录的最大似然函数,得到每个用户节点的节点属性的特征向量和表征节点作为邻居节点的参数向量。给定一个用户节点,通过网络嵌入模型确定的特征向量,确定出在网络上和他相关度高的产品节点。
由于在实际推荐和广告系统中,由于数据隐私等原因,不同场景、不同平台或不同公司可能有不同的网络,但相互之间网络并不直接相通,各自确定的网络嵌入模型的推荐的准确度较低。
如图1所示的推荐模型的装置的架构,以2个参与方为例进行说明。包括第一服务器101,第二服务器102,第三服务器103。第一服务器101为第一参与方,第二服务器102为第二参与方;假设第一参与方和第二参与方联合训练一个网络嵌入模型,举例来说,第一参与方拥有第一数据,第二参与方拥有第二数据。第一参与方(对应第一服务器)和第二参与方(对应第二服务器)都可以在其各自的行为数据上进行各种运算。第一参与方和第二参与方希望在不暴露第一数据和第二数据及其中用户隐私的前提下,更准确地训练网络嵌入模型,以实现更准确的推荐。
需要说明的是,由于两个参与方的用户或商品并非完全重合,系统利用基于加密的样本对齐技术,在第一参与方和第二参与方不公开各自数据的前提下确认双方的重叠对象,并且不暴露不互相重叠的对象,以便联合这些对象的特征进行建模。假设第一参与方和第二参与方两方拥有重叠用户,或第一参与方和第二参与方两方拥有重叠商品。若两方不拥有任何重叠用户或重叠商品,则第一服务器和第二服务器仅利用自身的数据训练的各自的信息推荐模型。第三服务器作为独立的第三方,用于保证数据传输过程中的数据安全。
本发明实施例提供一种推荐模型的生成方法,如图2所示,包括:
步骤201:第一服务器获取第二网络嵌入模型的重叠节点的第二特征向量和所述重叠节点的邻居节点的第二参数向量;
其中,所述重叠节点为所述第二网络嵌入模型和第一网络嵌入模型具有的相同对象;
在具体实施过程中,为避免数据泄露,重叠节点的确定可以通过同态加密的方式确定;具体的确定方式在下面的实施例中详细描述。
所述第一网络嵌入模型是通过第一数据训练得到的;所述第二网络嵌入模型是通过第二数据训练得到的。
需要说明的是,在本实施例中,采用服务器的方式,第一参与方和第二参与方都拥有独立的服务器,即第一服务器和第二服务器,用于各自数据的聚合更新同步,同时避免各自数据的泄露,且第一参与方和第二参与方对应的参数,即模型参数都是各自存储的,提高了第一参与方和第二参与方数据的安全性。
本发明以两方的网络为例,多方的网络可以参考该实施例,在此不再赘述。举例来说,假定两方为A和B,A方拥有第一数据对应的网络A,B方拥有第二数据对应的网络B。网络A包含A方的用户、产品、属性及其交互所构成的网络。此处,可以用GA=(VA,EA)表示网络A,其中VA表示网络的节点,EA表示网络的边。同样的,用GB=(VB,EB)表示网络B,其中VB表示网络的节点,EB表示网络的边。第一网络嵌入模型是通过第一数据对应的网络A训练得到的;所述第二网络嵌入模型是通过第二数据对应的网络B训练得到的。
举例来说,第二网络嵌入模型的重叠节点v的特征向量可以表示为
Figure GDA0002960988320000071
重叠节点v的参数向量可以表示为
Figure GDA0002960988320000072
用于表征该重叠节点与重叠节点对应的邻居节点间的相关性。
其中,重叠节点v的邻居节点可以通过以下方式确定:将节点v根据随机游走,确定K1个采样路径,以节点v为起点采样得到的这K1条路径集合记为
Figure GDA0002960988320000073
GA上所有采样得到的路径记为
Figure GDA0002960988320000074
将K1个采样路径上位于节点v的m步之内的节点作为节点v的邻居节点。则重叠节点v的邻居节点可以表示为
Figure GDA0002960988320000081
GB上所有采样得到的路径记为
Figure GDA0002960988320000082
将K2个采样路径上位于节点v的m步之内的节点作为节点v的邻居节点。则重叠节点v的邻居节点可以表示为
Figure GDA0002960988320000083
一种可能的实现方式,所述第二参数向量为重叠节点v的邻居节点u的参数向量
Figure GDA0002960988320000084
Figure GDA0002960988320000085
举例来说,若重叠节点为节点1和节点2,在网络A中,节点1的邻居节点为节点3-5;节点2的邻居节点为节点6-8;在网络B中,节点1的邻居节点为节点4,7;节点2的邻居节点为节点3,7;则,第一服务器获取到的第二特征向量为节点1的特征向量,及节点2的特征向量;第一服务器获取到的第二参数特征向量为节点3-8的参数向量。
为避免数据泄露,一种可能的实现方式,第一服务器获取的所述第二特征向量和所述第二参数向量为第二服务器经过同态加密后发送的。
具体的,可以为对
Figure GDA0002960988320000086
Figure GDA0002960988320000087
做同态加密,即
Figure GDA0002960988320000088
Figure GDA0002960988320000089
从A传给B。
步骤202:第一服务器根据所述第二特征向量和所述第二参数向量更新所述第一网络嵌入模型的重叠节点的第一特征向量和所述第一网络嵌入模型的重叠节点的邻居节点的第一参数向量;
结合上述实施例,在具体实施过程中,第一服务器根据同态加密的方式,确定所述第二特征向量和所述第二参数向量对应的节点,将所述第一网络嵌入模型中对应节点上的特征向量,或参数向量更新为所述第二特征向量和所述第二参数向量。
结合上述举例,第一服务器将第一网络嵌入模型中的节点1的特征向量替换为第二特征向量中的节点1的特征向量;第一服务器将第一网络嵌入模型中的节点2的特征向量替换为第二特征向量中的节点2的特征向量;
第一服务器将第一网络嵌入模型中的节点3,4,5的参数向量分别替换为第二特征向量中的节点3-8的参数向量。
步骤203:第一服务器通过更新后的第一网络嵌入模型确定第二特征梯度信息和第二参数梯度信息;
具体的,第一服务器根据网络A,确定重叠节点v的采样路径Pv A,根据更新后的第一网络嵌入模型,聚合出针对第二特征向量
Figure GDA0002960988320000091
在网络A上的梯度
Figure GDA0002960988320000092
以及针对第二参数向量
Figure GDA0002960988320000093
在网络A上的梯度
Figure GDA0002960988320000094
结合上述举例,节点1在网络A确定的采样路径Pv A包括路径1:节点1→节点3→节点5;则根据路径1确定节点1的特征梯度信息;节点3的参数梯度;节点5的参数梯度信息。
结合上述实施例,在具体实施过程中,由于第一服务器获取的所述第二特征向量和所述第二参数向量为第二服务器经过同态加密后发送的,因此,第一服务器根据更新后的第一网络嵌入模型,确定出的第二特征梯度信息和第二参数梯度信息也是经过同态加密的第二特征梯度和第二参数梯度。
其中,所述第二特征梯度信息和所述第二参数梯度信息至少用于更新所述第二网络嵌入模型。
一种可能的实现方式,所述第一服务器确定第二特征梯度信息和第二参数梯度信息之后,还包括:
步骤一、第一服务器将所述第二特征梯度信息和所述第二参数梯度信息发送给第三服务器;
其中,第三服务器作为拥有第一服务器与第二服务器的私钥的第三方,以保证第一服务器与第二服务器的数据安全。
步骤二、第一服务器接收所述第三服务器发送的第三特征梯度信息和第三参数梯度信息;
其中,所述第三特征梯度信息和所述第三参数梯度信息是通过所述第一特征梯度信息、所述第一参数梯度信息、所述第二特征梯度信息和所述第二参数梯度信息确定的;
一种可能的实现方式,所述第三特征梯度信息为通过所述第一特征梯度信息和所述第二特征梯度信息在所述第三服务器分别解密后确定的;
所述第三参数梯度信息为通过所述第一参数梯度信息和所述第二参数梯度信息在所述第三服务器分别解密后确定的。
具体的确定方式,可以通过加权平均的方式确定,也可以通过其他方式确定,在此不做限定。
步骤三、第一服务器根据所述第三特征梯度信息和所述第三参数梯度信息重新训练更新前的所述第一网络嵌入模型。
对应的,针对第一网络嵌入模型的更新,本发明实施例提供一种信息推荐模型的生成方法,包括:
步骤一、第一服务器将所述第一特征向量和所述第一参数向量经过同态加密后发送给第二服务器;
步骤二、所述第二服务器用于通过所述第一特征向量和所述第一参数向量更新所述第二网络嵌入模型,从而确定第一特征梯度信息和第一参数梯度信息;
步骤三、所述第一特征梯度信息和所述第一参数梯度信息至少用于更新所述第一网络嵌入模型。
具体的,确定是否重新训练可以根据第三服务器确定,举例来说,第三服务器确定整体目标函数的损失值,当损失值收敛时,确定第一网络嵌入模型和第二网络嵌入模型不需要重新训练,训练完成。
一种可能的实现方式,所述方法还包括:若确定所述第一特征向量和所述第一参数向量的相似度大于预设阈值;若确定所述第一特征向量和所述第二特征向量的相似度大于预设阈值;所述第二特征向量与所述第二参数向量的相似度大于预设阈值;所述第一参数向量与所述第二参数向量的相似度大于预设阈值;则确定所述第一网络嵌入模型训练完成。
本发明实施例中,由于利用了第二服务器中的第二网络嵌入模型中的特征,以更新第一网络嵌入模型的参数,提高了训练出的第一网络嵌入模型的推荐准确性;且由于更新了所述重叠节点的邻居节点的第二参数向量,从而考虑了多方数据中的相似节点,提高了用户覆盖率和推荐的信息的多样性。在保证多方用户隐私和行为数据不被泄露的前提下,可以有效的利用多方网络数据稀疏的问题,并更准确地学习得到每个网络节点的特征。A和B两方希望在不暴露网络A和网络B隐私的前提下,通过联合对方的网络,来更精准地学习到VA和VB中每个节点的低维特征向量。
进一步地,本发明信息推荐模型的生成方法中,确定重叠节点的方法,包括:
步骤一,所述第一服务器采用预存的第一公钥加密第一标识,并将加密后的第一标识发送给所述第二服务器,并检测是否接收到所述第二服务器发送的,采用预存的第二公钥加密后的第二标识。
当需要得到待训练模型的模型参数后,第一服务器采用预先存储的第一公钥加密第一标识,得到加密后的第一标识,并将加密后的第一标识发送给第二服务器。第一服务器检测是否接收到第二服务器发送的,采用预存的第二公钥加密后的第二标识。
当需要得到待训练模型的模型参数后,第二服务器采用预先存储的第二公钥加密第二标识,得到加密后的第二标识,并将加密后的第二标识发送给第一服务器。
需要说明的是,加密后的第一标识为第一服务器加密其所持有的数据对应的数据标识后所得到的,第二标识为第二服务器数据对应的数据标识。具体地,第一服务器可采用其预先生成的公钥加密第一标识。第一服务器和第二服务器加密所用的公钥是通过非对称加密算法生成的。
步骤二,当接收到加密后的第二标识后,采用所述第一公钥对所述第二标识进行二次加密,得到第二加密值,并检测是否接收到所述第二服务器发送的第一加密值。
当第一服务器接收到第二服务器发送的加密后的第二标识后,第一服务器采用其公钥,即采用第一公钥对第二标识进行二次加密,将经过二次加密后的第二标识记为第二加密值,并检测是否接收到第二服务器发送的第一加密值。其中,当第二服务器接收到第一服务器发送的加密后的第一标识后,第二服务器采用其公钥,即采用第二公钥对加密后的第二标识进行二次加密,将经过二次加密后的第一标识记为第一加密值,并将第一加密值发送给第一服务器。
当接收到所述加密值后,判断所述第一加密值与所述第二加密值是否相等。
具体的,若所述第一加密值与所述第二加密值相等,则确定所述第一标识与所述第二标识相同,并将所述第一标识对应的数据确定为与所述第二服务器的重叠节点数据。
当第一服务器接收到第一服务器发送的第二加密值后,第一服务器判断第一加密值与第二加密值是否相等。若确定第一加密值与第二加密值相等,第一服务器则确定对应携带第一标识的数据为重叠节点数据;若确定第一加密值与第二加密值不相等,第一服务器则确定携带第一标识的数据不是重叠节点数据。可以理解的是,当第一加密值与第二加密值相等时,表明第一加密值对应的第一标识与第二加密值对应的第二标识是相同的。
需要说明的是,第二服务器确定其与第一服务器中携带相同标识的重叠节点数据的过程,与第一服务器确定其与第二服务器中携带相同标识的重叠节点数据的过程一致,在本实施例中不再详细赘述。
在确定模型参数的过程中,当得到第一服务器对应的重叠节点数据和第二服务器对应的重叠节点数据后,第一服务器可将其重叠节点数据划分成若干份,然后第二服务器根据第一服务器划分数据的划分结果,通过标识对进行匹配,以对自己的重叠节点数据进行划分。
本实施例通过在第一服务器和第二服务器不泄露自己所拥有数据的情况下,得到第一服务器和第二服务器数据的重叠节点数据,提高了计算数据信息值过程中,第一服务器和第二服务器数据的安全性。
本发明实施例中,基于学到的VA和VB中每个节点的特征向量,A和B两方可以计算各自的某个特定用户和多个候选产品之间的相似度,以进行广告和推荐。具体的,可以包括:
步骤一,当所述第二服务器确定模型参数,且接收到信息推荐请求后,所述第二服务器将所述信息推荐请求发送给所述第一服务器,以供所述第一服务器在接收到所述信息推荐请求后,根据对应的所述模型参数和所述信息推荐请求对应特征变量的变量值返回第一预测分数给所述第二终端。
步骤二,当接收到所述第一预测分数后,根据对应的所述模型参数和所述信息推荐请求对应特征变量的变量值计算第二预测分数。
步骤三,将所述第一预测分数和所述第二预测分数加权,得到预测分数总和,并根据所述预测分数总和输入所述待训练模型中,得到模型分数,并根据所述模型分数确定是否执行所述信息推荐请求。
当得到模型的预测值后,第二服务器可根据该模型的预测值判断是否执行该信息推荐请求。如当该待训练模型为信息推荐模型,该信息推荐请求为信息推荐请求时,若计算所得的模型对应的产品对象的推荐值大于或者等于预设分数,第二服务器则确定产品对象作为该信息推荐请求的推荐数据。
本实施例通过第二服务器接收到信息推荐请求后,通过待训练模型分析该信息推荐请求,以确定该信息推荐请求的推荐数据,提高了第二服务器推送数据的准确性。
基于相同的发明构思,如图3所示,本发明实施例提供一种信息推荐模型的生成装置,适用于以对象为节点、对象间的关系为边的网络嵌入模型;所述网络嵌入模型中的每个节点包括表征节点属性的特征向量和表征节点作为邻居节点的参数向量;所述装置包括:
收发单元301,用于获取第二网络嵌入模型的重叠节点的第二特征向量和所述重叠节点的邻居节点的第二参数向量;所述重叠节点为所述第二网络嵌入模型和第一网络嵌入模型具有的相同对象;所述第一网络嵌入模型是通过第一数据训练得到的;所述第二网络嵌入模型是通过第二数据训练得到的;
处理单元302,用于根据所述第二特征向量和所述第二参数向量更新所述第一网络嵌入模型的重叠节点的第一特征向量和所述第一网络嵌入模型的重叠节点的邻居节点的第一参数向量;通过更新后的第一网络嵌入模型确定第二特征梯度信息和第二参数梯度信息;所述第二特征梯度信息和所述第二参数梯度信息至少用于更新所述第二网络嵌入模型。
一种可能的实现方式,收发单元301还用于:
将所述第一特征向量和所述第一参数向量经过同态加密后发送给第二服务器,所述第二服务器用于通过所述第一特征向量和所述第一参数向量更新所述第二网络嵌入模型,从而确定第一特征梯度信息和第一参数梯度信息;所述第一特征梯度信息和所述第一参数梯度信息至少用于更新所述第一网络嵌入模型。
一种可能的实现方式,收发单元301还用于:
将所述第二特征梯度信息和所述第二参数梯度信息发送给第三服务器;接收所述第三服务器发送的第三特征梯度信息和第三参数梯度信息;所述第三特征梯度信息和所述第三参数梯度信息是通过所述第一特征梯度信息、所述第一参数梯度信息、所述第二特征梯度信息和所述第二参数梯度信息确定的;
处理单元302,还用于:根据所述第三特征梯度信息和所述第三参数梯度信息重新训练更新前的所述第一网络嵌入模型。
所述第三特征梯度信息和所述第三参数梯度信息是通过所述第一特征梯度信息、所述第一参数梯度信息、所述第二特征梯度信息和所述第二参数梯度信息确定的,包括:
所述第三特征梯度信息为通过所述第一特征梯度信息和所述第二特征梯度信息在所述第三服务器分别解密后确定的;
所述第三参数梯度信息为通过所述第一参数梯度信息和所述第二参数梯度信息在所述第三服务器分别解密后确定的。
一种可能的实现方式,处理单元301还用于:
若确定所述第一特征向量和所述第一参数向量的相似度大于预设阈值;
若确定所述第一特征向量和所述第二特征向量的相似度大于预设阈值;
所述第二特征向量与所述第二参数向量的相似度大于预设阈值;
所述第一参数向量与所述第二参数向量的相似度大于预设阈值;
则确定所述第一网络嵌入模型训练完成。
基于上述实施例,参阅图4所示,本发明实施例中,一种计算机设备的结构示意图。
本发明实施例提供了一种计算机设备,该计算机设备可以包括:处理器1001,例如CPU,网络接口1004,用户接口1003,存储器1005,通信总线1002。其中,通信总线1002用于实现这些组件之间的连接通信。用户接口1003可以包括显示屏(Display)、输入单元比如键盘(Keyboard),可选用户接口1003还可以包括标准的有线接口、无线接口。网络接口1004可选的可以包括标准的有线接口、无线接口(如WI-FI接口)。存储器1005可以是高速RAM存储器,也可以是稳定的存储器(non-volatile memory),例如磁盘存储器。存储器1005可选的还可以是独立于前述处理器1001的存储装置。
本领域技术人员可以理解,图4中示出的结构并不构成对计算机设备的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。
作为一种计算机存储介质的存储器1005中可以包括操作系统、网络通信模块、用户接口模块以及信息推荐模型的生成程序。其中,操作系统是管理和控制模型参数获取系统硬件和软件资源的程序,支持信息推荐模型的生成程序以及其它软件或程序的运行。
用户接口1003主要用于连接第一服务器、第二服务器和第三服务器等,与各个服务器进行数据通信;网络接口1004主要用于连接后台服务器,与后台服务器进行数据通信;而处理器1001可以用于调用存储器1005中存储的信息推荐模型的生成程序,并执行以下操作:
根据所述第二特征向量和所述第二参数向量更新所述第一网络嵌入模型的重叠节点的第一特征向量和所述第一网络嵌入模型的重叠节点的邻居节点的第一参数向量;通过更新后的第一网络嵌入模型确定第二特征梯度信息和第二参数梯度信息;所述第二特征梯度信息和所述第二参数梯度信息至少用于更新所述第二网络嵌入模型。
一种可能的实现方式,处理器1001还用于:根据所述第三特征梯度信息和所述第三参数梯度信息重新训练更新前的所述第一网络嵌入模型。
一种可能的实现方式,所述第三特征梯度信息和所述第三参数梯度信息是通过所述第一特征梯度信息、所述第一参数梯度信息、所述第二特征梯度信息和所述第二参数梯度信息确定的,包括:所述第三特征梯度信息为通过所述第一特征梯度信息和所述第二特征梯度信息在所述第三服务器分别解密后确定的;所述第三参数梯度信息为通过所述第一参数梯度信息和所述第二参数梯度信息在所述第三服务器分别解密后确定的。
一种可能的实现方式,处理器1001还用于:
若确定所述第一特征向量和所述第一参数向量的相似度大于预设阈值;
若确定所述第一特征向量和所述第二特征向量的相似度大于预设阈值;
所述第二特征向量与所述第二参数向量的相似度大于预设阈值;
所述第一参数向量与所述第二参数向量的相似度大于预设阈值;
则确定所述第一网络嵌入模型训练完成。
基于上述实施例,本发明实施例中,提供了一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述任意方法实施例中的信息推荐方法。
本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
尽管已描述了本发明的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例作出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本发明范围的所有变更和修改。
显然,本领域的技术人员可以对本发明实施例进行各种改动和变型而不脱离本发明实施例的精神和范围。这样,倘若本发明实施例的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。

Claims (10)

1.一种推荐模型的生成方法,其特征在于,适用于以对象为节点、对象间的关系为边的网络嵌入模型;所述网络嵌入模型中的每个节点包括表征节点属性的特征向量和表征节点作为邻居节点的参数向量;所述方法包括:
第一服务器获取第二网络嵌入模型的重叠节点的第二特征向量和所述重叠节点的邻居节点的第二参数向量;所述重叠节点为所述第二网络嵌入模型和第一网络嵌入模型具有的相同对象;所述第一网络嵌入模型是通过第一数据训练得到的;所述第二网络嵌入模型是通过第二数据训练得到的;
所述第一服务器根据所述第二特征向量和所述第二参数向量更新所述第一网络嵌入模型的重叠节点的第一特征向量和所述第一网络嵌入模型的重叠节点的邻居节点的第一参数向量;
所述第一服务器通过更新后的第一网络嵌入模型确定第二特征梯度信息和第二参数梯度信息;所述第二特征梯度信息和所述第二参数梯度信息至少用于更新所述第二网络嵌入模型。
2.如权利要求1所述的方法,其特征在于,所述方法还包括:
所述第一服务器将所述第一特征向量和所述第一参数向量经过同态加密后发送给第二服务器,所述第二服务器用于通过所述第一特征向量和所述第一参数向量更新所述第二网络嵌入模型,从而确定第一特征梯度信息和第一参数梯度信息;所述第一特征梯度信息和所述第一参数梯度信息至少用于更新所述第一网络嵌入模型。
3.如权利要求2所述的方法,其特征在于,所述第一服务器确定第一特征梯度信息和第一参数梯度信息之后,还包括:
所述第一服务器将所述第二特征梯度信息和所述第二参数梯度信息发送给第三服务器;
所述第一服务器接收所述第三服务器发送的第三特征梯度信息和第三参数梯度信息;所述第三特征梯度信息和所述第三参数梯度信息是通过所述第一特征梯度信息、所述第一参数梯度信息、所述第二特征梯度信息和所述第二参数梯度信息确定的;
所述第一服务器根据所述第三特征梯度信息和所述第三参数梯度信息重新训练更新前的所述第一网络嵌入模型。
4.如权利要求3所述的方法,其特征在于,所述第三特征梯度信息和所述第三参数梯度信息是通过所述第一特征梯度信息、所述第一参数梯度信息、所述第二特征梯度信息和所述第二参数梯度信息确定的,包括:
所述第三特征梯度信息为通过所述第一特征梯度信息和所述第二特征梯度信息在所述第三服务器分别解密后确定的;
所述第三参数梯度信息为通过所述第一参数梯度信息和所述第二参数梯度信息在所述第三服务器分别解密后确定的。
5.如权利要求1所述的方法,其特征在于,所述方法还包括:
若确定所述第一特征向量和所述第一参数向量的相似度大于预设阈值;
若确定所述第一特征向量和所述第二特征向量的相似度大于预设阈值;
所述第二特征向量与所述第二参数向量的相似度大于预设阈值;
所述第一参数向量与所述第二参数向量的相似度大于预设阈值;
则确定所述第一网络嵌入模型训练完成。
6.一种推荐模型的生成装置,其特征在于,适用于以对象为节点、对象间的关系为边的网络嵌入模型;所述网络嵌入模型中的每个节点包括表征节点属性的特征向量和表征节点作为邻居节点的参数向量;所述装置包括:
收发单元,用于获取第二网络嵌入模型的重叠节点的第二特征向量和所述重叠节点的邻居节点的第二参数向量;所述重叠节点为所述第二网络嵌入模型和第一网络嵌入模型具有的相同对象;所述第一网络嵌入模型是通过第一数据训练得到的;所述第二网络嵌入模型是通过第二数据训练得到的;
处理单元,用于根据所述第二特征向量和所述第二参数向量更新所述第一网络嵌入模型的重叠节点的第一特征向量和所述第一网络嵌入模型的重叠节点的邻居节点的第一参数向量;通过更新后的第一网络嵌入模型确定第二特征梯度信息和第二参数梯度信息;所述第二特征梯度信息和所述第二参数梯度信息至少用于更新所述第二网络嵌入模型。
7.如权利要求6所述的装置,其特征在于,所述收发单元还用于:
将所述第一特征向量和所述第一参数向量经过同态加密后发送给第二服务器,所述第二服务器用于通过所述第一特征向量和所述第一参数向量更新所述第二网络嵌入模型,从而确定第一特征梯度信息和第一参数梯度信息;所述第一特征梯度信息和所述第一参数梯度信息至少用于更新所述第一网络嵌入模型。
8.如权利要求7所述的装置,其特征在于,所述收发单元,还用于:
将所述第二特征梯度信息和所述第二参数梯度信息发送给第三服务器;接收所述第三服务器发送的第三特征梯度信息和第三参数梯度信息;所述第三特征梯度信息和所述第三参数梯度信息是通过所述第一特征梯度信息、所述第一参数梯度信息、所述第二特征梯度信息和所述第二参数梯度信息确定的;
所述处理单元,还用于:根据所述第三特征梯度信息和所述第三参数梯度信息重新训练更新前的所述第一网络嵌入模型。
9.一种计算机存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1-5任一项所述的方法中的步骤。
10.一种计算机设备,其特征在于,包括:
至少一个存储器,用于存储程序指令;
至少一个处理器,用于调用所述存储器中存储的程序指令,按照获得的程序指令执行上述权利要求1-5任一项所述的方法。
CN201910389347.2A 2019-05-10 2019-05-10 一种推荐模型的生成方法及装置 Active CN110175283B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910389347.2A CN110175283B (zh) 2019-05-10 2019-05-10 一种推荐模型的生成方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910389347.2A CN110175283B (zh) 2019-05-10 2019-05-10 一种推荐模型的生成方法及装置

Publications (2)

Publication Number Publication Date
CN110175283A CN110175283A (zh) 2019-08-27
CN110175283B true CN110175283B (zh) 2021-04-13

Family

ID=67691419

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910389347.2A Active CN110175283B (zh) 2019-05-10 2019-05-10 一种推荐模型的生成方法及装置

Country Status (1)

Country Link
CN (1) CN110175283B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112182399A (zh) * 2020-10-16 2021-01-05 中国银联股份有限公司 一种联邦学习的多方安全计算方法及装置
CN115249073A (zh) * 2021-04-25 2022-10-28 华为技术有限公司 一种联邦学习方法以及装置

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106777339A (zh) * 2017-01-13 2017-05-31 深圳市唯特视科技有限公司 一种基于异构网络嵌入模型识别作者的方法
CN107145977A (zh) * 2017-04-28 2017-09-08 电子科技大学 一种对在线社交网络用户进行结构化属性推断的方法
CN108520303A (zh) * 2018-03-02 2018-09-11 阿里巴巴集团控股有限公司 一种推荐系统构建方法及装置
CN108596774A (zh) * 2018-04-24 2018-09-28 山东师范大学 基于深层次网络嵌入特征的社会化信息推荐算法及系统
CN109165725A (zh) * 2018-08-10 2019-01-08 深圳前海微众银行股份有限公司 基于迁移学习的神经网络联邦建模方法、设备及存储介质

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10699321B2 (en) * 2017-10-17 2020-06-30 Adobe Inc. Global vector recommendations based on implicit interaction and profile data

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106777339A (zh) * 2017-01-13 2017-05-31 深圳市唯特视科技有限公司 一种基于异构网络嵌入模型识别作者的方法
CN107145977A (zh) * 2017-04-28 2017-09-08 电子科技大学 一种对在线社交网络用户进行结构化属性推断的方法
CN108520303A (zh) * 2018-03-02 2018-09-11 阿里巴巴集团控股有限公司 一种推荐系统构建方法及装置
CN108596774A (zh) * 2018-04-24 2018-09-28 山东师范大学 基于深层次网络嵌入特征的社会化信息推荐算法及系统
CN109165725A (zh) * 2018-08-10 2019-01-08 深圳前海微众银行股份有限公司 基于迁移学习的神经网络联邦建模方法、设备及存储介质

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
node2vec: Scalable Feature Learning for Networks;Grover A, Leskovec J.;《 Knowledge Discovery and Data Mining》;20160831;第855-864页 *
闭回路采样的网络结点特征学习方法;刘世超,朱福喜;《小型微型计算机系统》;20170930;第38卷(第9期);第1940-1944页 *

Also Published As

Publication number Publication date
CN110175283A (zh) 2019-08-27

Similar Documents

Publication Publication Date Title
WO2021164365A1 (zh) 图神经网络模型训练方法、装置及系统
CN110399742B (zh) 一种联邦迁移学习模型的训练、预测方法及装置
Hidano et al. Model inversion attacks for prediction systems: Without knowledge of non-sensitive attributes
WO2022089256A1 (zh) 联邦神经网络模型的训练方法、装置、设备、计算机程序产品及计算机可读存储介质
JP7095140B2 (ja) 特徴抽出に基くマルチモデルトレーニング方法及び装置、電子機器と媒体
US20230078061A1 (en) Model training method and apparatus for federated learning, device, and storage medium
Hu et al. Targeted poisoning attacks on social recommender systems
CN112989399B (zh) 数据处理系统及方法
CN112116008A (zh) 基于智能决策的目标检测模型的处理方法、及其相关设备
Lin et al. Shilling black-box recommender systems by learning to generate fake user profiles
CN110175283B (zh) 一种推荐模型的生成方法及装置
CN111324812A (zh) 基于迁移学习的联邦推荐方法、装置、设备及介质
CN114186256A (zh) 神经网络模型的训练方法、装置、设备和存储介质
CN111382403A (zh) 用户行为识别模型的训练方法、装置、设备及存储介质
US20190138914A1 (en) Autonomous bot personality generation and relationship management
Ji et al. Multi-range gated graph neural network for telecommunication fraud detection
CN109598289B (zh) 跨平台的数据处理方法、装置、设备及可读存储介质
CN113962286A (zh) 一种基于分段函数的去中心化逻辑回归分类预测方法
CN117521102A (zh) 一种基于联邦学习的模型训练方法及装置
CN114723012B (zh) 基于分布式训练系统的计算方法和装置
CN116226532A (zh) 基于联邦学习的信息推荐方法及相关装置
CN116032590A (zh) 一种ddos攻击的检测模型训练方法及相关装置
Wang et al. Trust Management for Reliable Cross-Platform Cooperation Based on Blockchain
Chen et al. Advances in Robust Federated Learning: Heterogeneity Considerations
CN113887740A (zh) 联合更新模型的方法、装置及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant