发明内容
本申请提供一种基于隐私保护的信息和金融信息推荐方法及装置,以提升推荐的信息准确性。
第一个方面,本申请提供一种基于隐私保护的信息推荐方法,应用于第一应用,包括:
基于第一应用中采集的目标对象相关的对象相关数据,获取用户的第一用户特征,并从共享存储空间中获取其它应用上传的用户的第二用户特征;
基于第一用户特征和第二用户特征进行融合,得到融合特征,并将融合特征上传给第一服务平台,以使第一服务平台基于融合特征和训练好的全局模型从目标对象对应的全量推荐信息中,筛选出第一推荐信息,全局模型依据多方的个性推荐模型融合得到;
接收第一推荐信息,并基于本地的个性推荐模型依据融合特征对第一推荐信息进行筛选,确定并展示第二推荐信息。
在一种可能的设计中,基于第一用户特征和第二用户特征进行融合,得到融合特征,包括:
判断第一用户特征和第二用户特征是否为同一对象的特征;
若是,则将第一用户特征和第二用户特征进行纵向对齐处理,并进行融合后得到融合特征;
若否,则将第一用户特征和第二用户特征进行横向对齐处理,并进行融合后得到融合特征。
在一种可能的设计中,将第一用户特征和第二用户特征进行纵向对齐处理,并进行融合后得到融合特征,包括:
将第一用户特征中目标对象对应的关键词,与第二用户特征中目标对象在其它应用对应的第二行为进行融合;和/或,
将第一用户特征中目标对象对应的第一行为与第二行为进行纵向融合处理;
将第一用户特征和第二用户特征进行横向对齐处理,并进行融合后得到融合特征,包括:
将第一用户特征中目标对象对应的关键词与第二用户特征中针对于目标对象的相关对象的第二行为进行融合;
将第一用户特征中目标对象对应的关键词与第二用户特征中针对于目标对象的相关对象的关键词进行融合;
将第一用户特征中目标对象对应的第一行为与第二用户特征中针对于目标对象的相关对象的关键词进行融合;
将第一用户特征中目标对象对应的第一行为与第二用户特征中针对于目标对象的相关对象的第二行为进行横向融合处理。
在一种可能的设计中,在展示第二推荐信息之后,还包括:
基于用户对第二推荐信息的操作数据以及预设的偏好规则,更新对象相关数据。
在一种可能的设计中,当用户首次使用第一应用时,该方法还包括:
通过第一服务平台获取全局模型中的第一模型参数;
基于第一模型参数构建个性推荐模型。
在一种可能的设计中,该方法还包括:
获取第一训练数据,并存储到暂存区;第一训练数据包括历史融合特征和第一标注结果,历史融合特征依据目标对象的第一历史用户特征和第二历史用户特征确定,第一标注结果依据对目标对象选择结果确定;
在空闲时段,从暂存区提取第一训练数据,并依据个性推荐模型,对历史融合特征进行分析,确定个性分析结果,以依据个性分析结果和第一标注结果之间的差异,对个性推荐模型进行更新,以确定训练好的个性推荐模型;
在个性推荐模型训练完成后,上传个性推荐模型的参数给第一服务平台,以使得第一服务平台依据多方的个性推荐模型的参数,更新全局模型。
在一种可能的设计中,当用户首次使用当前用户终端时,还包括:
通过第一服务平台以及用户的用户信息,获取原始用户终端中的个性推荐模型的第二模型参数,原始用户终端为用户已使用过的用户终端;
根据第二模型参数在当前用户终端的共享存储空间中重新建立个性推荐模型。
在一种可能的设计中,在展示第二推荐信息之后,还包括:
基于用户对第二推荐信息的操作数据,判断操作数据是否满足过拟合触发条件;
若是,则基于操作数据对应的用户行为特征,降低个性推荐模型中用户行为权重;
基于降低后的用户行为权重、融合特征和标注数据重新训练个性推荐模型。
第二个方面,本申请提供一种基于隐私保护的金融信息推荐方法,包括:
基于第一金融相关应用中采集的第一金融产品相关的产品相关数据,获取用户的第一用户特征;
从共享存储空间中获取其它应用上传的用户的第二用户特征,包括:从共享存储空间中获取其它金融服务应用上传的用户的第二用户特征;
基于第一用户特征和第二用户特征进行融合,得到融合特征,并将融合特征上传给第一金融服务平台,以使第一金融服务平台基于融合特征和训练好的全局模型从第一金融产品相关对应的全量推荐信息中,筛选出第一推荐信息,全局模型依据多方的个性推荐模型融合得到;
接收第一推荐信息,并基于本地的个性推荐模型依据融合特征对第一推荐信息进行筛选,确定并展示第二金融相关信息。
第三个方面,本申请提供一种基于隐私保护的信息推荐装置,包括:
获取模块,用于基于第一应用中采集的目标对象相关的对象相关数据,获取用户的第一用户特征,并从共享存储空间中获取其它应用上传的用户的第二用户特征;
处理模块,用于:
基于第一用户特征和第二用户特征进行融合,得到融合特征,并将融合特征上传给第一服务平台,以使第一服务平台基于融合特征和训练好的全局模型从目标对象对应的全量推荐信息中,筛选出第一推荐信息,全局模型依据多方的个性推荐模型融合得到;
接收第一推荐信息,并基于本地的个性推荐模型依据融合特征对第一推荐信息进行筛选,确定并展示第二推荐信息。
第四个方面,本申请提供一种电子设备,包括:
存储器,用于存储程序指令;
处理器,用于调用并执行所述存储器中的程序指令,执行第一方面或第二方面所提供的任意一种可能的方法。
第五个方面,本申请提供一种存储介质,所述可读存储介质中存储有计算机程序,所述计算机程序用于执行第一方面或第二方面所提供的任意一种可能的方法。
第六个方面,本申请还提供一种计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现第一方面或第二方面所提供的任意一种可能的方法。
本申请提供了一种基于隐私保护的信息和金融信息推荐方法及装置,基于第一应用中采集的目标对象相关的对象相关数据,获取用户的第一用户特征,并从共享存储空间中获取其它应用上传的用户的第二用户特征;基于第一用户特征和第二用户特征进行融合,得到融合特征,并将融合特征上传给第一服务平台,以使第一服务平台基于融合特征和训练好的全局模型从目标对象对应的全量推荐信息中,筛选出第一推荐信息,全局模型依据多方的个性推荐模型融合得到;接收第一推荐信息,并基于本地的个性推荐模型依据融合特征对第一推荐信息进行筛选,确定并展示第二推荐信息。服务平台反馈的信息是根据全局模型确定的符合多个用户偏好的信息,提升了用户信息的安全性,并且,在本地融合了多个同类型应用的特征,可以更准确的为用户进行信息推荐。通过本地的共享存储空间融合多方应用的用户特征,解决了如何在不暴露用户隐私数据的前提下,共享用户的偏好特征的技术问题。达到了保护用户相关隐私数据、降低服务平台的中心计算压力、提升服务体验感的技术效果。
具体实施方式
为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,包括但不限于对多个实施例的组合,都属于本申请保护的范围。
本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”、“第三”、“第四”等(如果存在)是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本申请的实施例例如能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
随着互联网技术的快速发展,越来越多的线下服务方式通过线上服务平台转换到了线上进行,这满足了人们生产生活中各个方面的需求,但随着各种各样的服务平台的快速崛起发展,各类服务平台之间的市场竞争愈发激烈。因此为了更加精准地向用户推送服务信息成为了各个服务平台提升竞争力的关键技术。
因此,如何在不暴露用户隐私数据的前提下,根据用户的偏好特征来推荐信息,提高推荐的信息准确性成为了亟待解决的技术问题。
为解决上述问题,本申请的发明构思是:
在用户终端本地构造一个共享存储空间来,存储用户的偏好特征,应用在向共享存储空间发送数据时需要用户的授权,且需要进行加密传输。将用户偏好特征存储到共享存储空间中后,一方面将用户的多项偏好特征进行横向或纵向融合,得到融合特征,并将此融合特征发送给服务平台的服务器,另一方面,在共享存储空间中根据用户偏好特征或者时融合特征构建或训练一个个性推荐模型。服务平台的服务器根据这个融合特征以及全局模型来筛选服务平台中的各项服务信息,得到第一推荐信息,然后服务平台将此第一推荐信息发送到共享存储空间中。用户终端再利用个性推荐模型对第一推荐信息进行再次过滤筛选,得到最终在用户终端展示给用户的第二推荐信息。对于用户来说,第二推荐信息是高度符合其偏好的,这样可以减少用户寻找关键商品的时间。同时,由于分别在服务平台的服务器和用户终端本地进行两次筛选,可以达到降低服务平台的服务器的计算压力和推送压力的同时,还在一定程度上提高了用户隐私保护的技术效果。
下面具体介绍本申请提供的基于隐私保护的信息推荐方法:
图1为本申请实施例提供的一种基于隐私保护的信息推荐方法的流程示意图。如图1所示,该基于隐私保护的信息推荐方法应用于任意一个商品或服务应用,下文称为第一应用,其具体步骤包括:
S101、基于第一应用中采集的目标对象相关的对象相关数据,获取用户的第一用户特征,并从共享存储空间中获取其它应用上传的用户的第二用户特征。
在本步骤中,对象相关数据包括目标对象的关键词、对目标对象的行为等,第二用户特征包含目标对象的相关特征(关键词、行为)和目标对象的相关对象的相关特征(关键词、行为)。
具体的,目标对象包括:一种或多种商品或服务,对象相关数据包括:用户对目标对象进行搜索、查询、浏览、下订单、加购物车、收藏等等操作行为对应的数据。获取到对象相关数据之后,可以提取对象相关数据的数据特征,形成第一用户特征,第一用户特征包括:上述操作行为和该操作行为对应的目标对象的关键词。
图2为本申请提供的一种现有的基于隐私保护的信息推荐方法的应用场景示意图。如图2所示,用户终端100安装有多个提供商品和/或服务的应用,其中包括第一应用101,用户通过用户终端100中的第一应用110对其所提供的商品和/或服务进行了对应的操作行为,产生了对一个或多个目标对象的对象相关数据,第一应用110根据目标对象的对象相关数据获取到用户的第一用户特征111。同样的,用户通过用户终端100中的其它应用120对一个或多个目标对象进行了相应的操作行为,也产生了对应的对象相关数据,从而得到了第二用户特征121。第一应用110和其它应用120将获取到的第一用户特征111和第二用户特征121,通过用户授权的安全认证通道进行加密处理后,分别存储到了共享存储空间130中。
S102、基于第一用户特征和第二用户特征进行融合,得到融合特征,并将融合特征上传给第一服务平台,以使第一服务平台基于融合特征和训练好的全局模型从目标对象对应的全量推荐信息中,筛选出第一推荐信息。
在本步骤中,全局模型依据多方的个性推荐模型融合得到,即全局模型融合了多个应用对应的个性推荐模型的模型参数,以通过全局模型筛选出符合多个用户的对象(如商品或金融相关产品)。
具体的,基于第一用户特征和第二用户特征进行融合,得到融合特征,包括:
S1021、判断第一用户特征和第二用户特征是否为同一对象的特征。
在本步骤中,如果第一用户特征和第二用户特征对应的是同一个目标对象,则执行S1022,否则,执行S1023。
例如,用户在第一应用和其它应用中都对某个目标对象,如桌子,进行了相同的行为,如搜索,那么第一用户特征和第二用户特征就是对应了同一个对象,反之,如果用户在第一应用中搜索了桌子,但是在第二应用中搜索了椅子,那么其对应的就不是同一个目标对象。行为与目标对象直接具有对应关系。
还需要说明的是,这里第一用户特征和第二用户特征对应的目标对象可以不只一个,即可以是多个目标对象,如对应的是同一个目标对象集。
S1022、将第一用户特征和第二用户特征进行纵向对齐处理,并进行融合后得到融合特征。
在本步骤中,具体包括:
将第一用户特征中目标对象对应的关键词,与第二用户特征中目标对象在其它应用对应的第二行为进行融合;和/或,将第一用户特征中目标对象对应的第一行为与第二行为进行纵向融合处理。
例如,用户在第一应用中“搜索”了桌子,形成了第一用户特征的关键词“桌子”,而用户在其它应用中“浏览”了桌子,“桌子”这个关键词可以与“浏览”这个第二行为融合,“搜索”这个第一行为也可以和“浏览类型A的桌子”这个第二行为融合,最后得到的融合特征是代表“搜索桌子并浏览了类型A的桌子”的特征。本实施例还可以去除第一用户特征和第二用户特征中重合的部分。
S1023、将第一用户特征和第二用户特征进行横向对齐处理,并进行融合后得到融合特征。
在本实施例中,具体包括:
将第一用户特征中目标对象对应的关键词与第二用户特征中针对于目标对象的相关对象的第二行为进行融合;将第一用户特征中目标对象对应的关键词与第二用户特征中针对于目标对象的相关对象的关键词进行融合;将第一用户特征中目标对象对应的第一行为与第二用户特征中针对于目标对象的相关对象的关键词进行融合;将第一用户特征中目标对象对应的第一行为与第二用户特征中针对于目标对象的相关对象的第二行为进行横向融合处理。
例如,用户在第一应用中“搜索”了桌子,形成了第一用户特征的关键词“桌子”,而用户在其它应用中“浏览”了与桌子相关的椅子,即第一用户特征是“搜索桌子”,第二用户特征是“浏览了类型B的椅子”,由于桌子和椅子是同一类属家具下的,即两者相关,则可以得到融合特征。
对于S1022和S1023中的纵向融合和横向融合,两者对比来看,所融合的信息量是有区别的,横向融合的特征较少,因为横向融合时与目标对象关联小。反之,若与目标对象的关联越大,则信息量越多,例如,桌子椅子配套关联大,桌子和衣服关联小。
值得注意的是,第一服务平台是第一应用的云端服务平台,或者说是其后台服务器,第一服务平台中存储有全局模型,全局模型以融合特征为用户偏好的标准,对一个或多个目标对象对应的全量推荐信息进行筛选,得到第一推荐信息。
例如,如图2所示,第一用户特征和第二用户特征在共享存储空间130中进行了融合,得到融合特征后,上传到第一服务平台200中,第一服务平台200,依据全局模型201和融合特征筛选出第一推荐信息,并将其发送给用户终端100。
S203、接收第一推荐信息,并基于本地的个性推荐模型依据融合特征对第一推荐信息进行筛选,确定并展示第二推荐信息。
在本实施例中,如图2所示,用户终端100将第一推荐信息接收后,存储到共享存储空间130中,然后基于共享存储空间130中的个性推荐模型131,依据融合特征对第一推荐信息进行筛选,得到第二推荐信息,再将第二推荐信息在第一应用中展示出来,供用户操作。
需要说明的是,本申请实施例提供的基于隐私保护的信息推荐方法,可以应用于多个电商购物平台间用户标签数据的共享推荐场景,对应的,第一应用包括:线上购物应用,第一服务平台包括:电商购物平台,对象相关数据包括:用户在电商购物平台上浏览过的商品数据,和/或订单数据。
图3为本申请实施例提供的对图3对应流程应用在电商购物场景时的业务流示意图。如图3所示,整个业务流包括:
数据生成301:将多电商平台关于用户数据,包括搜索字段、商品标签、类别、单价、浏览时长、用途等多个维度数据进行加密,传输至安全可信共享数据存储空间。
样本特征对齐302:将多个电商平台数据进行对比相关特征,以特征重叠比例进行区分采用不同联邦学习方式进行数据整合。
数据融合303:将特征数据进行合并,增加数据样本及特征,形成统一的个性商品推荐数据特征集。
个性推荐模型304:以个性商品推荐数据特征集为数据样本,(并依据数据样本进行训练)建立商品内容推荐或协同过滤推荐模型,形成个性推荐模型。
全局模型305:依赖各用户的个性推荐模型中间梯度参数,通过电商平台客户端数据回传至云平台进行全局模型迭代更新。
商品数据集306:包括电商平台相关商品数据资源,对商品资源进行上架,对用户进行开放购买。
商户申请307:相关商品提供方将已有商品资源在电商平台上进行填报,提供电商公司审核上架。
商品展示308:在用户终端上对电商平台的推荐数据进行展示,其支持相关商品检索及推荐展示。
商品购买浏览309:用户在用户终端上的应用中,通过检索或推荐方式点击查看商品,确认后进行下单购买,形成相关数据后,提供至共享数据存储空间进行模型迭代,最终形成流程闭环。
此外,该方法也可以应用于多个金融机构间用户标签数据的共享推荐场景,对应的,第一应用包括:金融服务应用,第一服务平台包括:银行或其它金融机构对应的云服务端,对象相关数据包括:用户浏览过的金融产品,和/或金融订单数据。
本申请实施例提供了一种基于隐私保护的信息推荐方法,通过基于第一应用中采集的目标对象相关的对象相关数据,获取用户的第一用户特征,并从共享存储空间中获取其它应用上传的用户的第二用户特征;基于第一用户特征和第二用户特征进行融合,得到融合特征,并将融合特征上传给第一服务平台,以使第一服务平台基于融合特征和训练好的全局模型从目标对象对应的全量推荐信息中,筛选出第一推荐信息;接收第一推荐信息,并基于本地的个性推荐模型依据融合特征对第一推荐信息进行筛选,确定并展示第二推荐信息。通过本地的共享存储空间融合多方应用的用户特征,解决了如何在不暴露用户隐私数据的前提下,共享用户的偏好特征的技术问题。达到了保护用户相关隐私数据、降低服务平台的中心计算压力、提升对用户的服务信息推荐效率和服务体验感的技术效果。
基于上述实施例所提供的信息推荐方法,将其应用在金融相关场景中时,可以得到一种基于隐私保护的金融信息推荐方法,包括:
基于所述第一金融相关应用中采集的第一金融产品相关的产品相关数据,获取用户的第一用户特征;
从共享存储空间中获取其它应用上传的所述用户的第二用户特征,包括:从共享存储空间中获取其它金融服务应用上传的所述用户的第二用户特征;
基于所述第一用户特征和所述第二用户特征进行融合,得到融合特征,并将所述融合特征上传给第一金融服务平台,以使第一金融服务平台基于所述融合特征和训练好的全局模型从第一金融产品相关对应的全量推荐信息中,筛选出第一推荐信息,所述全局模型依据多方的个性推荐模型融合得到;
接收所述第一推荐信息,并基于本地的个性推荐模型依据融合特征对所述第一推荐信息进行筛选,确定并展示第二金融相关信息。
值得注意的是,图1所示实施例所提供的信息推荐方法,还需要解决冷启动问题,冷启动情况包括两种,第一种是用户首次使用第一应用时,需要构建个性推荐模型,第二种是用户更换了用户终端,即用户首次使用当前用户终端时,也需要重新在当前用户终端构建个性推荐模型。
一、当用户首次使用该第一应用时,参考图4,图4为本申请实施提供的另一种基于隐私保护的信息推荐方法的流程示意图。该信息推荐方法应用于第一应用,且当用户首次使用该第一应用时,该信息推荐方法包括:
S401、通过第一服务平台获取全局模型中的第一模型参数。
S402、基于第一模型参数构建个性推荐模型。
对于步骤S401~S402,具体的,通过第一服务平台获取全局模型中的第一模型参数;根据第一模型参数调整预设机器学习模型中的参数,建立初始的个性推荐模型。
例如,以多个电商购物平台间用户标签数据的共享推荐场景为例,电商云平台将全局模型的梯度参数进行加密,并经由电商平台对应的应用回传至共享数据存储空间即共享存储空间,直接完成个性推荐模型的建立。
为提升商品推荐体验,在起始周期内(如1天、3天、1周等)用户进行商品字段搜索或商品推荐模块中,采用以全局模型处理后的商品推荐目录直接在客户端进行商品数据展示,不经过个性推荐模型进行商品数据处理。其中,在起始周期内,可以在共享数据存储空间中的特征缓存空间缓存用户在多平台的特征,并在空闲时段进行个性推荐模型的训练,达到以客户端本地算力资源耗费低的时段内进行特征数据解密、对比、融合及模型训练,如用户夜间睡眠、手机充电不使用等情况。通过空闲时段进行本地个性推荐模型的迭代更新,有效利用本地算力资源,同时提升用户电商平台使用的顺畅及舒适度。
超出起始周期后,个性推荐模型根据本地多个电商平台特征数据的模型迭代生成,更换成先以全局模型商品推荐目录,后以个性推荐模型生成商品推荐目录进行展现的方式执行。
S403、获取第一训练数据,并存储到暂存区。
在本步骤中,第一训练数据包括历史融合特征和第一标注结果,历史融合特征依据目标对象的第一历史用户特征和第二历史用户特征确定,第一标注结果依据对目标对象选择结果确定。
具体的,如图2所示,用户终端100中安装有第一应用110和其它应用120,每个应用对应一个服务平台,每个应用通过预设传输方式向共享存储空间130中对应输出一个用户特征数据,这些用户特征数据所形成的数据集合就称为第一训练数据。并且用户操作每个应用时,对目标对象进行了选择,此时对应的应用就会记录该项数据,形成第一标注结果。
在本实施例中,预设传输方式包括:用户授权的加密传输通道,该加密传输通道能够确保传输过程中用户的隐私数据的安全。通过预设的安全认证通道,获取多个应用加密传输的用户特征数据,并将用户特征数据存储到缓存空间中。
为了便于理解,本实施例以应用于多个电商购物平台间用户标签数据的共享推荐场景为例进行说明。
具体的,首先在用户终端100本地构建安全的共享存储空间130,此共享存储空间130与多个电商购物平台的应用建立可信安全通道,并为该可信安全通道建立对应的授权方式。在用户进行有效授权后,多个电商购物平台的应用分别使用自有密钥,对用户在电商购物平台上浏览过的商品数据,和/或订单数据等用户特征数据进行加密,加密完成后通过可信安全通道传输至共享存储空间。
可选的,在共享存储空间130可以单独设立特征缓存存储空间即暂存区,该特征缓存存储空间可以存储各个应用发送的用户特征数据,即将第一训练数据存储到暂存区。特征缓存存储空间的作用是使得共享存储空间130可以在用户终端100本地的算力资源有较多剩余的时候才进行后续的处理,如用户夜间睡眠、手机充电不使用等情况。通过空闲时段进行后续的处理有效利用本地算力资源,同时提升服务平台,如电商购物平台的使用顺畅度和舒适度。
S404、在空闲时段,从暂存区提取第一训练数据,并依据个性推荐模型,对历史融合特征进行分析,确定个性分析结果,以依据个性分析结果和第一标注结果之间的差异,对个性推荐模型进行更新,以确定训练好的个性推荐模型。
具体的,在空闲时段,首先将暂存区即上述特征缓存存储空间中的用户特征数据即第一训练数据进行解密处理;然后利用特征分析模型,对解密后的各个用户特征数据即历史融合特征进行特征比对,以确定特征重合比例。所谓特征重合比例是指不同的应用所提供的用户特征数据中所提取出来的用户特征的重合度。
在一种可能的实施方式中,将任意两个应用提供的用户特征数据进行特征比对,确定这两个应用对应的特征重合比例,重复上述步骤,直至将所有的应用所提供的用户特征数据都进行了两两之间的特征比对,从而确定多个特征重合比例。这样对于后续的个性推荐模型的训练就可以通过任意两个应用对应的特征数据进行多次训练。需要说明的是,本步骤中的个性分析结果包括上述各个特征重合比例。
然后,依据个性分析结果和第一标注结果之间的差异,对个性推荐模型进行更新。利用预设学习模型,根据特征重叠比例以及各个用户特征数据,对初始推荐模型进行训练,以确定个性推荐模型。具体包括:
(1)根据特征重叠比例以及预设比例阈值,确定训练时需要使用的机器学习模式。
在本步骤中,机器学习模式包括:联邦学习方式,该联邦学习方式包括了两种方式:横向联邦学习和纵向联邦学习。
横向联邦学习:对于特征重合度较高,但样本重合度较低的用户特征数据,则需要通过横向扩充样本数目,以提升模型训练效果。
纵向联邦学习:对于特征重合度较低,但样本重合度较高的用户特征数据,则需要纵向丰富样本特征维度,以提升模型训练效果。
(2)根据机器学习模式对各个用户特征数据进行数据融合,以确定个性推荐特征集。
在本步骤中,当机器学习模式为横向联邦学习时,数据融合过程如图5所示。
图5为本申请实施例提供的横向联邦学习的逻辑示意图。如图5所示,用户特征数据501与用户特征数据502之间特征重合度较高,但样本重合度较低,则对用户特征数据501和用户特征数据502进行横向的样本特征对齐,确定横向重合特征数据503,然后去除用户特征数据501或用户特征数据502中的横向重合特征数据503,然后再将剩余部分进行融合,得到个性推荐特征集504。
当机器学习模式为纵向联邦学习时,数据融合过程如图6所示。
图6为本申请实施例提供的纵向联邦学习的逻辑示意图。如图6所示,用户特征数据601与用户特征数据602之间特征重合度较低,但样本重合度较高,则对用户特征数据601和用户特征数据602进行横向的样本特征对齐,确定纵向重合特征数据603,然后去除用户特征数据601或用户特征数据602中的纵向重合特征数据603,然后再将剩余部分进行融合,得到个性推荐特征集604。
具体的,在用户终端对应的安全可信的共享数据存储空间即共享推荐空间内,个性推荐模型的训练和生成,依赖于各类服务平台对应的应用中所产生的用户特征数据,利用每个应用对应的密钥针对多个用户特征数据进行解密后,优先进行数据样本特征对比,通过对比确认数据特征重叠率即特征重叠比例,若特征重叠比例超出50%,则以横向联邦学习的方式进行数据融合,即进行横向的扩充样本数目;反之,则以纵向联邦学习的方式进行数据融合,完成纵向的样本特征维度的丰富。经过横向或纵向联邦学习的数据融合,得到数据较为完整的数据样本集即个性推荐特征集,然后采用商品推荐算法,建立商品或服务的内容推荐,和/或协同过滤推荐,形成本地化的个性推荐模型,通过个性推荐模型对各个服务平台的商品数据或服务数据进行过滤后,对得到的个性推荐信息进行排序和展示,以提高商品或服务的成交概率。
(3)利用预设学习模型,根据个性推荐特征集,对初始推荐模型进行训练,以确定个性推荐模型。
在本步骤中,初始推荐模型包括:新建的未经训练的联邦学习模型,或者上一次训练后的个性推荐模型。
具体的,在共享存储空间中,利用联邦学习技术,根据个性推荐特征集构建或重新训练个性推荐模型。
对于(1)~(3),以电商购物平台为例,在共享数据存储空间即共享存储空间,以联邦学习技术,将各电商购物平台对应的购物应用中的用户特征数据进行特征对比,对比完成后执行横向联邦或纵向联邦进行数据融合,依赖数据融合结果,在数据共享存储空间内构建个性推荐模型,根据个性推荐模型获得模型中间梯度参数。获得联合多方电商平台数据形成的中间梯度参数,进行用户级密钥进行加密,经由各电商平台客户端进行转发回至电商云平台进行存储,并进行全局模型更新迭代。
S405、在个性推荐模型训练完成后,上传个性推荐模型的参数给第一服务平台,以使得第一服务平台依据多方的个性推荐模型的参数,更新全局模型。
首先将个性推荐模型中的第一模型参数确定为共享特征参数。
在本步骤中,个性推荐模型在训练时会产生多个中间参数,如中间梯度向量,这些中间参数也称为第一模型参数,其是构建或训练个性推荐模型的关键参数,但是这些参数是无法逆向推导出用户特征数据的。将这些第一模型参数作为共享特征参数传输给服务平台,就不会暴露用户的隐私数据,既实现了用户特征的共享,便于精准推送服务信息或商品信息,又能够达到保护用户隐私安全的技术效果。
然后,将共享特征参数分别发送给各个服务平台,以使各个服务平台根据模型参数对各个云端中的各个全局模型进行迭代更新。
在本步骤中,每个服务平台对应至少一个全局模型,全局模型用于对服务平台提供的各项服务数据进行个性化过滤,以确定针对不同用户的个性化推送信息。
在本实施例中,根据预设传输方式,将共享特征参数分别返回各个应用中,并通过各个应用将共享特征参数发送给各个服务平台。
在本实施例中,预设传输方式包括客户授权的安全认证通道,即通过用户已经授权的安全认证通过将共享特征参数进行加密传输,返回给各个应用,然后由各个应用再发送给各个服务平台。然后,由各个服务平台分别利用共享特征参数对各自的全局模型进行训练,得到迭代更新后的全局模型。
这样就完成了用户首次使用第一应用时的冷启动。
二、当用户首次使用当前用户终端时,在图1所示的实施例的基础上,该信息推送方法还包括:A.通过第一服务平台以及用户的用户信息,获取原始用户终端中的个性推荐模型的第二模型参数。
在本步骤中,原始用户终端为用户已使用过的用户终端。
B.根据第二模型参数在当前用户终端的共享存储空间中重新建立个性推荐模型。
对于步骤A~B,可以通过第一应用,根据第一应用对应的第一服务平台以及用户的用户信息,获取原始用户终端中的个性推荐模型的第一模型参数,原始用户终端为用户已使用过的用户终端;根据第一模型参数在当前用户终端中重新建立个性推荐模型。
具体的,以多个电商购物平台间用户标签数据的共享推荐场景为例,电商云平台通过用户信息来关联原有用户终端的个性推荐模型的中间梯度参数,经由电商平台对应的应用回传至共享数据存储空间即共享存储空间,完成个性推荐模型的生成,由于老用户使用过的电商平台存储的个性推荐模型中间参数一致,新终端可通过任一电商云平台都可同步到对应的模型中间参数信息。
图7为本申请实施例提供的又一种基于隐私保护的信息推荐方法的流程示意图。如图7所示,该方法具体包括:
S701、基于第一应用中采集的目标对象相关的对象相关数据,获取用户的第一用户特征,并从共享存储空间中获取其它应用上传的用户的第二用户特征。
S702、基于第一用户特征和第二用户特征进行融合,得到融合特征,并将融合特征上传给第一服务平台,以使第一服务平台基于融合特征和训练好的全局模型从目标对象对应的全量推荐信息中,筛选出第一推荐信息。
在本步骤中,全局模型依据多方的个性推荐模型融合得到。
S703、接收第一推荐信息,并基于本地的个性推荐模型依据融合特征对第一推荐信息进行筛选,确定并展示第二推荐信息。
对于S701~S703的具体名词解释及实现原理可以参考S101~S103,在此不再赘述。
S704、基于用户对第二推荐信息的操作数据以及预设的偏好规则,更新对象相关数据。
在本步骤中,在用户通过第一应用显示的第二推荐信息进行操作后,比如浏览、收藏、加购物车、下订单等等,则将此操作数据收集起来,预设的偏好规则包括:浏览时长超过了预设时间阈值,点击了收藏,点击了加购物车,下达了订单,进行了相关产品或服务的搜索等等。当满足了偏好规则后,就可以将这些操作数据更新到对象相关数据中,便于后续完善个性化信息推荐。
S705、基于用户对第二推荐信息的操作数据,判断操作数据是否满足过拟合触发条件。
在本步骤中,若是,则执行S706。
S706、基于操作数据对应的用户行为特征,降低个性推荐模型中用户行为权重。
S707、基于降低后的用户行为权重、融合特征和标注数据重新训练个性推荐模型。
对于S705~S707,值得注意的是,由于个性推荐模型用于对服务平台通过全局模型过滤后的商品或服务的第一推送信息进行二次个性化过滤,这样做能够进一步提高个性化推送的准确性。但是本申请发明人在实际测试过程中发现,如果个性化推送在各个应用中的重合度过高,就会影响用户体验,因为用户无法获得新的商品或服务信息,也不利于服务平台进行多样性地商品或服务推广,我们将这种现象称为过拟合现象。为了防止过拟合现象影响用户的使用体验,因此本申请还可以在个性化推荐模型内,结合用户的商品或服务的浏览特征,如在商品或服务的推荐目录中对应的浏览时间的长短、搜索商品或服务的前置目录的浏览时间的长短、搜索前置商品或服务的下单率的高低等情况下,将本次商品数据或服务数据对应的用户行为特征的权重进行一定比例降低,且根据艾宾浩斯遗忘曲线可以得出,被推荐商品或服务具有一定的时效性,因此对应用户行为特征对应的权重降低比例可以根据用户行为发生时间与当前时间间隔的长短进行进一步加权,这样通过行为及时间两个方面的加权计算,提升更早之前的历史周期中对应的兴趣商品或服务,或者同类商品或服务的权重比例,防止个性推荐模型的商品或服务推荐目录过拟合,提升用户商品推荐目录的成交概率。
图8为本申请实施例提供的一种对个性推荐模型采取防止过拟合的权重调整的示意图。如图8所示,将商品推荐目录浏览时间短、搜索前置商品目标浏览时间短和搜索前置商品的下单率低等等对应的用户行为特征对应的用户行为权重的比例下调,根据推荐商品时间遗忘度,将之前推荐的商品的遗忘度权重提高,最后根据用户行为权重和遗忘度权重得到综合商品权重或综合服务权重,并将此权重与对应的用户特征数据相结合,形成对个性推荐模型的训练数据,从而达到使得个性推荐模型防止过拟合的技术效果。
图9为本申请实施例提供的一种基于隐私保护的商品信息推送装置的结构示意图。该基于隐私保护的商品信息推送装置900可以通过软件、硬件或者两者的结合实现。
如图9所示,该基于隐私保护的商品信息推送装置900包括:
获取模块901,用于基于第一应用中采集的目标对象相关的对象相关数据,获取用户的第一用户特征,并从共享存储空间中获取其它应用上传的用户的第二用户特征;
处理模块902,用于:
基于第一用户特征和第二用户特征进行融合,得到融合特征,并将融合特征上传给第一服务平台,以使第一服务平台基于融合特征和训练好的全局模型从目标对象对应的全量推荐信息中,筛选出第一推荐信息,全局模型依据多方的个性推荐模型融合得到;
接收第一推荐信息,并基于本地的个性推荐模型依据融合特征对第一推荐信息进行筛选,确定并展示第二推荐信息。
在一种可能的设计中,处理模块902,用于:
判断第一用户特征和第二用户特征是否为同一对象的特征;
若是,则将第一用户特征和第二用户特征进行纵向对齐处理,并进行融合后得到融合特征;
若否,则将第一用户特征和第二用户特征进行横向对齐处理,并进行融合后得到融合特征。
在一种可能的设计中,处理模块902,用于:
将第一用户特征中目标对象对应的关键词,与第二用户特征中目标对象在其它应用对应的第二行为进行融合;和/或,
将第一用户特征中目标对象对应的第一行为与第二行为进行纵向融合处理;
将第一用户特征中目标对象对应的关键词与第二用户特征中针对于目标对象的相关对象的第二行为进行融合;
将第一用户特征中目标对象对应的关键词与第二用户特征中针对于目标对象的相关对象的关键词进行融合;
将第一用户特征中目标对象对应的第一行为与第二用户特征中针对于目标对象的相关对象的关键词进行融合;
将第一用户特征中目标对象对应的第一行为与第二用户特征中针对于目标对象的相关对象的第二行为进行横向融合处理。
在一种可能的设计中,处理模块902,还用于:
基于用户对第二推荐信息的操作数据以及预设的偏好规则,更新对象相关数据。
在一种可能的设计中,当用户首次使用第一应用时,获取模块901,还用于通过第一服务平台获取全局模型中的第一模型参数;
处理模块902,还用于基于第一模型参数构建个性推荐模型。
在一种可能的设计中,获获取模块901,还用于取第一训练数据,并存储到暂存区;第一训练数据包括历史融合特征和第一标注结果,历史融合特征依据目标对象的第一历史用户特征和第二历史用户特征确定,第一标注结果依据对目标对象选择结果确定;
处理模块902,还用于:
在空闲时段,从暂存区提取第一训练数据,并依据个性推荐模型,对历史融合特征进行分析,确定个性分析结果,以依据个性分析结果和第一标注结果之间的差异,对个性推荐模型进行更新,以确定训练好的个性推荐模型;
在个性推荐模型训练完成后,上传个性推荐模型的参数给第一服务平台,以使得第一服务平台依据多方的个性推荐模型的参数,更新全局模型。
在一种可能的设计中,当用户首次使用当前用户终端时,获取模块901,还用于通过第一服务平台以及用户的用户信息,获取原始用户终端中的个性推荐模型的第二模型参数,原始用户终端为用户已使用过的用户终端;
处理模块902,还用于:
根据第二模型参数在当前用户终端的共享存储空间中重新建立个性推荐模型。
在一种可能的设计中,处理模块902,还用于:
基于用户对第二推荐信息的操作数据,判断操作数据是否满足过拟合触发条件;若是,则基于操作数据对应的用户行为特征,降低个性推荐模型中用户行为权重;基于降低后的用户行为权重、融合特征和标注数据重新训练个性推荐模型。
值得说明的是,图9所示实施例提供的装置,可以执行上述任一方法实施例中所提供的方法,其具体实现原理、技术特征、专业名词解释以及技术效果类似,在此不再赘述。
图10为本申请实施例提供的一种电子设备的结构示意图。如图10所示,该电子设备1000,可以包括:至少一个处理器1001和存储器1002。图10示出的是以一个处理器为例的电子设备。
存储器1002,用于存放程序。具体地,程序可以包括程序代码,程序代码包括计算机操作指令。
存储器1002可能包含高速RAM存储器,也可能还包括非易失性存储器(non-volatile memory),例如至少一个磁盘存储器。
处理器1001用于执行存储器1002存储的计算机执行指令,以实现以上各方法实施例所述的方法。
其中,处理器1001可能是一个中央处理器(central processing unit,简称为CPU),或者是特定集成电路(application specific integrated circuit,简称为ASIC),或者是被配置成实施本申请实施例的一个或多个集成电路。
可选地,存储器1002既可以是独立的,也可以跟处理器1001集成在一起。当所述存储器1002是独立于处理器1001之外的器件时,所述电子设备1000,还可以包括:
总线1003,用于连接所述处理器1001以及所述存储器1002。总线可以是工业标准体系结构(industry standard architecture,简称为ISA)总线、外部设备互连(peripheral component, PCI)总线或扩展工业标准体系结构(extended industrystandard architecture, EISA)总线等。总线可以分为地址总线、数据总线、控制总线等,但并不表示仅有一根总线或一种类型的总线。
可选的,在具体实现上,如果存储器1002和处理器1001集成在一块芯片上实现,则存储器1002和处理器1001可以通过内部接口完成通信。
本申请实施例还提供了一种计算机可读存储介质,该计算机可读存储介质可以包括:U盘、移动硬盘、只读存储器(read-only memory ,ROM)、随机存取存储器(randomaccess memory,RAM)、磁盘或者光盘等各种可以存储程序代码的介质,具体的,该计算机可读存储介质中存储有程序指令,程序指令用于上述各方法实施例中的方法。
本申请实施例还提供一种计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现上述各方法实施例中的方法。
本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本申请的其它实施方案。本申请旨在涵盖本申请的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本申请的一般性原理并包括本申请未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本申请的真正范围和精神由本申请的权利要求书指出。
应当理解的是,本申请并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本申请的范围仅由所附的权利要求书来限制。