CN113205183B

CN113205183B - 物品推荐网络训练方法、装置、电子设备及存储介质

Info

Publication number: CN113205183B
Application number: CN202110442477.5A
Authority: CN
Inventors: 舒程珣; 温明星; 宋洋
Original assignee: Beijing Dajia Internet Information Technology Co Ltd
Current assignee: Beijing Dajia Internet Information Technology Co Ltd
Priority date: 2021-04-23
Filing date: 2021-04-23
Publication date: 2024-05-14
Anticipated expiration: 2041-04-23
Also published as: CN113205183A

Abstract

本公开关于一种物品推荐网络训练方法、装置、电子设备及存储介质，涉及计算机技术领域。本公开实施例中，第一物品推荐网络能够对用户账号的账号数据和物品的物品数据分别进行特征提取，将用户账号数据和物品数据的特征提取过程解耦，具有很高的处理效率。在训练第一物品推荐网络时，通过新增第二物品推荐网络来为训练过程引入目标组合数据，以提高第一物品推荐网络的性能，该目标组合数据通常能够明显地体现出用户账号是否可能对该物品感兴趣，且第二物品推荐网络的输入还包括第一物品推荐网络处理的结果，两个网络之间联系密切，能够大大提高第一物品推荐网络处理数据的准确性。

Description

物品推荐网络训练方法、装置、电子设备及存储介质

技术领域

本公开涉及计算机技术领域，尤其涉及物品推荐网络训练方法、装置、电子设备及存储介质。

背景技术

物品推荐场景中通常训练有物品推荐网络，由物品推荐网络分析用户账号和物品的数据，来确定是否向该用户账号推荐该物品。

相关技术中，物品推荐网络训练方法通常是通过物品推荐网络分别对用户账号的账号数据和物品的物品数据进行特征提取，再确定用户账号和物品之间的匹配度，根据该匹配度和参考匹配度来训练物品推荐网络。

上述物品推荐网络中用户账号和物品解耦，分开处理，无法准确分析出用户账号对物品的偏好情况，因而处理结果不够准确。

发明内容

本公开提供一种物品推荐网络训练方法、装置、电子设备及存储介质，能够提高物品推荐网络处理数据的准确性。本公开的技术方案如下：

根据本公开实施例的第一方面，提供一种物品推荐网络训练方法，包括：

基于第一物品推荐网络对用户账号的账号数据和物品的物品数据分别进行特征提取，得到账号特征和物品特征，基于所述账号特征和所述物品特征，确定所述用户账号和所述物品之间的第一匹配度；

基于第二物品推荐网络，对所述账号特征、所述物品特征以及目标组合数据进行特征提取，得到目标特征，基于所述目标特征，获取所述用户账号和所述物品之间的第二匹配度，所述目标组合数据包括将所述账号数据中的一种属性与所述物品数据中的一种属性组合得到的数据；

根据第一差异和第二差异，对所述第一物品推荐网络进行训练，所述第一差异为所述第一匹配度和参考匹配度之间的差异，所述第二差异为所述第二匹配度与所述参考匹配度之间的差异。

在一些实施例中，所述基于第二物品推荐网络，对所述账号特征、所述物品特征以及目标组合数据进行特征提取，得到目标特征，包括：

基于所述账号特征和所述物品特征，获取至少一个待处理特征；

基于第二物品推荐网络，对所述至少一个待处理特征以及目标组合数据进行特征提取，得到目标特征。

在一些实施例中，所述基于所述账号特征和所述物品特征，获取至少一个待处理特征，包括下述任一项：

对所述账号特征和所述物品特征进行处理，得到至少一个综合特征，将所述至少一个综合特征作为所述至少一个待处理特征；

对所述账号特征和所述物品特征进行处理，得到至少一个综合特征，将所述至少一个综合特征、所述账号特征和所述物品特征分别作为一个待处理特征。

在一些实施例中，所述对所述账号特征和所述物品特征进行处理，得到至少一个综合特征，包括下述至少一项：

获取所述账号特征和所述物品特征的哈达玛积，将所述哈达玛积作为一个综合特征；

获取所述账号特征和所述物品特征的哈达玛积，对所述哈达玛积中的元素进行求和处理，得到一个综合特征；

基于深度神经网络，对所述账号特征和所述物品特征进行前向计算，得到一个综合特征。

在一些实施例中，所述基于第二物品推荐网络，对所述至少一个待处理特征以及目标组合数据进行特征提取，得到目标特征，包括：

基于第二物品推荐网络，对所述至少一个待处理特征、目标组合数据、所述账号数据和所述物品数据进行特征提取，得到目标特征。

在一些实施例中，所述基于第二物品推荐网络，对所述账号特征、所述物品特征以及目标组合数据进行特征提取，得到目标特征，包括下述任一项：

将所述账号特征、所述物品特征以及所述目标组合数据分别输入第二物品推荐网络，由所述第二物品推荐网络对输入的多种数据进行特征提取并进行加权，得到目标特征；

将所述账号特征、所述物品特征以及所述目标组合数据进行并联处理，得到综合数据；将所述综合数据输入第二物品推荐网络中，由所述第二物品推荐网络对所述综合数据进行特征提取，得到目标特征。

在一些实施例中，所述第二物品推荐网络为深度神经网络；

所述基于第二物品推荐网络，对所述账号特征、所述物品特征以及目标组合数据进行特征提取，得到目标特征，基于所述目标特征，获取所述用户账号和所述物品之间的第二匹配度，包括：

基于所述深度神经网络，对所述账号特征、所述物品特征以及目标组合数据进行前向计算，得到目标特征，对所述目标特征进行降维处理，得到所述用户账号和所述物品之间的第二匹配度。

在一些实施例中，所述根据第一差异和第二差异，对所述第一物品推荐网络进行训练，包括：

基于所述第一匹配度与所述参考匹配度，获取第一损失值；

基于所述第二匹配度与所述参考匹配度，获取第二损失值；

基于所述第一损失值和所述第二损失值，对所述第一物品推荐网络进行训练。

在一些实施例中，所述方法还包括：

基于所述第二差异，对所述第二物品推荐网络进行训练。

在一些实施例中，所述方法还包括：

响应于对目标用户账号和目标物品的推荐指令，基于训练好的所述第一物品推荐网络，对所述目标用户账号的账号数据和所述目标物品的物品数据分别进行特征提取，得到目标账号特征和目标物品特征；基于所述目标账号特征和所述目标物品特征，确定所述目标用户账号和所述目标物品之间的第三匹配度；

响应于所述第三匹配度满足推荐条件，向所述目标用户账号推荐所述目标物品。

根据本公开实施例的第二方面，提供一种物品推荐网络训练装置，包括：

处理单元，被配置为执行基于第一物品推荐网络对用户账号的账号数据和物品的物品数据分别进行特征提取，得到账号特征和物品特征，基于所述账号特征和所述物品特征，确定所述用户账号和所述物品之间的第一匹配度；

所述处理单元，还被配置为执行基于第二物品推荐网络，对所述账号特征、所述物品特征以及目标组合数据进行特征提取，得到目标特征，基于所述目标特征，获取所述用户账号和所述物品之间的第二匹配度，所述目标组合数据包括将所述账号数据中的一种属性与所述物品数据中的一种属性组合得到的数据；

训练单元，被配置为执行根据第一差异和第二差异，对所述第一物品推荐网络进行训练，所述第一差异为所述第一匹配度和参考匹配度之间的差异，所述第二差异为所述第二匹配度与所述参考匹配度之间的差异。

在一些实施例中，所述处理单元被配置为执行：

在一些实施例中，所述处理单元被配置为执行下述任一项：

在一些实施例中，所述处理单元被配置为执行下述至少一项：

在一些实施例中，所述处理单元被配置为执行基于第二物品推荐网络，对所述至少一个待处理特征、目标组合数据、所述账号数据和所述物品数据进行特征提取，得到目标特征。

在一些实施例中，所述处理单元被配置为执行下述任一项：

在一些实施例中，所述第二物品推荐网络为深度神经网络；

所述处理单元被配置为执行基于所述深度神经网络，对所述账号特征、所述物品特征以及目标组合数据进行前向计算，得到目标特征，对所述目标特征进行降维处理，得到所述用户账号和所述物品之间的第二匹配度。

在一些实施例中，所述训练单元被配置为执行：

基于所述第一匹配度与所述参考匹配度，获取第一损失值；

基于所述第二匹配度与所述参考匹配度，获取第二损失值；

在一些实施例中，所述训练单元还被配置为执行基于所述第二差异，对所述第二物品推荐网络进行训练。

在一些实施例中，所述处理单元还被配置为执行响应于对目标用户账号和目标物品的推荐指令，基于训练好的所述第一物品推荐网络，对所述目标用户账号的账号数据和所述目标物品的物品数据分别进行特征提取，得到目标账号特征和目标物品特征；基于所述目标账号特征和所述目标物品特征，确定所述目标用户账号和所述目标物品之间的第三匹配度；

所述装置还包括：

推荐单元，被配置为执行响应于所述第三匹配度满足推荐条件，向所述目标用户账号推荐所述目标物品。

根据本公开实施例的第三方面，提供一种电子设备，电子设备包括：

一个或多个处理器；

用于存储所述一个或多个处理器可执行指令的一个或多个存储器；

其中，所述一个或多个处理器被配置为执行所述指令，以实现第一方面任一项所述的物品推荐网络训练方法。

根据本公开实施例的第四方面，提供一种计算机可读存储介质，当所述计算机可读存储介质中的指令由电子设备的处理器执行时，使得所述电子设备能够执行第一方面任一项所述的物品推荐网络训练方法。

根据本公开实施例的第五方面，提供一种计算机程序产品，包括一条或多条计算机指令，所述一条或多条计算机指令存储在计算机可读存储介质中。电子设备的一个或多个处理器能够从计算机可读存储介质中读取所述一条或多条计算机指令，所述一个或多个处理器执行所述一条或多条计算机指令，使得电子设备能够执行上述任一种可能实施方式的物品推荐网络训练方法。

本公开的实施例提供的技术方案至少带来以下有益效果：

本公开实施例中，第一物品推荐网络能够对用户账号的账号数据和物品的物品数据分别进行特征提取，将用户账号数据和物品数据的特征提取过程解耦，具有很高的处理效率。在训练第一物品推荐网络时，通过新增第二物品推荐网络来为训练过程引入目标组合数据，以提高第一物品推荐网络的性能。其中，该第一物品推荐网络训练时，不仅考虑到了第一物品推荐网络的输出，也考虑到了第二物品推荐网络的输出，这样该第一物品推荐网络不仅具有较高的处理效率，训练时也考虑到了用户账号和物品的目标组合数据，目标组合数据通常能够明显地体现出用户账号是否可能对该物品感兴趣，另外，该第二物品推荐网络不仅能够对目标组合数据进行处理，其输入也包括第一物品推荐网络处理的结果，两个网络之间联系密切，通过第二物品推荐网络的输出能够更好地辅助第一物品推荐网络的训练，因而，通过上述方法训练第一物品推荐网络，能够大大提高其处理数据的准确性。

应当理解的是，以上的一般描述和后文的细节描述仅是示例性和解释性的，并不能限制本公开。

附图说明

此处的附图被并入说明书中并构成本说明书的一部分，示出了符合本公开的实施例，并与说明书一起用于解释本公开的原理，并不构成对本公开的不当限定。

图1是根据一示例性实施例示出供的一种物品推荐网络训练方法的实施环境的示意图。

图2是根据一示例性实施例示出的一种物品推荐网络训练方法的流程图。

图3是根据一示例性实施例示出的一种物品推荐网络训练方法的流程图。

图4是根据一示例性实施例示出的一种第一物品推荐网络和第二物品推荐网络的结构示意图。

图5是根据一示例性实施例示出的一种物品推荐方法的流程图。

图6是根据一示例性实施例示出的一种物品推荐网络训练装置框图。

图7是根据一示例性实施例示出的一种电子设备的结构示意图。

图8是根据一示例性实施例示出的一种终端的结构框图。

图9是根据一示例性实施例示出的一种服务器的结构示意图。

具体实施方式

为了使本领域普通人员更好地理解本公开的技术方案，下面将结合附图，对本公开实施例中的技术方案进行清楚、完整地描述。

需要说明的是，本公开的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象，而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换，以便这里描述的本公开的实施例能够以除了在这里图示或

描述的那些以外的顺序实施。以下示例性实施例中所描述的实施方式并不代表与本公开相一致的所有实施方式。相反，它们仅是与如所附权利要求书中所详述的、本公开的一些方面相一致的装置和方法的例子。

本公开所涉及的用户信息可以为经用户授权或者经过各方充分授权的信息。

图1是根据一示例性实施例示出供的一种物品推荐网络训练方法的实施环境的示意图。该实施环境包括终端101，或者该实施环境包括终端101和物品推荐平台102。终端101通过无线网络或有线网络与物品推荐平台102相连。

终端101是智能手机、游戏主机、台式计算机、平板电脑、电子书阅读器、MP3(Moving Picture Experts Group Audio Layer III，动态影像专家压缩标准音频层面3)播放器或MP4(Moving Picture Experts Group Audio Layer IV，动态影像专家压缩标准音频层面4)播放器，膝上型便携计算机，智能机器人中的至少一种。终端101安装和运行有支持物品推荐网络训练的应用程序，例如，该应用程序是系统应用、即时通讯应用、新闻推送应用、购物应用、在线视频应用、社交应用。

示例性地，该终端101可以具有物品显示功能，在该终端101有推荐需求时，可以向物品推荐平台102发送推荐请求，由该物品推荐平台102对该终端101所登录的用户账号与待推荐的物品的相关数据进行处理，以确定向该用户账号推荐哪些物品。

示例性地，该终端101具有物品推荐网络训练功能，该终端101能够通过用户账号的账号数据以及物品的物品数据进行训练，得到第一物品推荐网络。该终端101可以将第一物品推荐网络发送至物品推荐平台102。示例性地，终端101可以独立完成该工作，也通过物品推荐平台102为其提供数据服务。本申请实施例对此不作限定。

示例性地，该物品推荐平台102可以通过第一物品推荐网络来对用户账号和物品的相关数据进行处理，该第一物品推荐网络可以在该物品推荐平台102中提前训练好，也可以由其他电子设备训练好发送至该物品推荐平台102，或者也可以由该终端101训练好发送至该物品推荐平台102。

物品推荐平台102包括一台服务器、多台服务器、云计算平台和虚拟化中心中的至少一种。物品推荐平台102用于为支持物品推荐网络训练的应用程序提供后台服务。可选地，物品推荐平台102承担主要处理工作，终端101承担次要处理工作；或者，物品推荐平台102承担次要处理工作，终端101承担主要处理工作；或者，物品推荐平台102或终端101分别单独承担处理工作。或者，物品推荐平台102和终端101两者之间采用分布式计算架构进行协同计算。

可选地，该物品推荐平台102包括至少一台服务器1021以及数据库1022，该数据库1022用于存储数据，在本申请实施例中，该数据库1022中存储有用户账号的账号数据和物品的物品数据，为至少一台服务器1021提供数据服务。

服务器是独立的物理服务器，也是多个物理服务器构成的服务器集群或者分布式系统，还是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、CDN、以及大数据和人工智能平台等基础云计算服务的云服务器。终端是智能手机、平板电脑、笔记本电脑、台式计算机、智能音箱、智能手表等，但并不局限于此。

本领域技术人员知晓，上述终端101、服务器1021的数量更多或更少。比如上述终端101、服务器1021仅为一个，或者上述终端101、服务器1021为几十个或几百个，或者更多数量，本申请实施例对终端或服务器的数量和设备类型不加以限定。

图2是根据一示例性实施例示出的一种物品推荐网络训练方法的流程图，如图2所示，物品推荐网络训练方法可以由电子设备执行，包括以下步骤。

在步骤S21中，基于第一物品推荐网络对用户账号的账号数据和物品的物品数据分别进行特征提取，得到账号特征和物品特征，基于该账号特征和该物品特征，确定该用户账号和该物品之间的第一匹配度。

在步骤S22中，基于第二物品推荐网络，对该账号特征、该物品特征以及目标组合数据进行特征提取，得到目标特征，基于该目标特征，获取该用户账号和该物品之间的第二匹配度，该目标组合数据包括将该账号数据中的一种属性与该物品数据中的一种属性组合得到的数据。

在步骤S23中，根据第一差异和第二差异，对该第一物品推荐网络进行训练，该第一差异为该第一匹配度和参考匹配度之间的差异，该第二差异为该第二匹配度与该参考匹配度之间的差异。

在一些实施例中，该基于第二物品推荐网络，对该账号特征、该物品特征以及目标组合数据进行特征提取，得到目标特征，包括：

基于该账号特征和该物品特征，获取至少一个待处理特征；

基于第二物品推荐网络，对该至少一个待处理特征以及目标组合数据进行特征提取，得到目标特征。

在一些实施例中，该基于该账号特征和该物品特征，获取至少一个待处理特征，包括下述任一项：

对该账号特征和该物品特征进行处理，得到至少一个综合特征，将该至少一个综合特征作为该至少一个待处理特征；

对该账号特征和该物品特征进行处理，得到至少一个综合特征，将该至少一个综合特征、该账号特征和该物品特征分别作为一个待处理特征。

在一些实施例中，该对该账号特征和该物品特征进行处理，得到至少一个综合特征，包括下述至少一项：

获取该账号特征和该物品特征的哈达玛积，将该哈达玛积作为一个综合特征；

获取该账号特征和该物品特征的哈达玛积，对该哈达玛积中的元素进行求和处理，得到一个综合特征；

基于深度神经网络，对该账号特征和该物品特征进行前向计算，得到一个综合特征。

在一些实施例中，该基于第二物品推荐网络，对该至少一个待处理特征以及目标组合数据进行特征提取，得到目标特征，包括：

基于第二物品推荐网络，对该至少一个待处理特征、目标组合数据、该账号数据和该物品数据进行特征提取，得到目标特征。

在一些实施例中，该基于第二物品推荐网络，对该账号特征、该物品特征以及目标组合数据进行特征提取，得到目标特征，包括下述任一项：

将该账号特征、该物品特征以及该目标组合数据分别输入第二物品推荐网络，由该第二物品推荐网络对输入的多种数据进行特征提取并进行加权，得到目标特征；

将该账号特征、该物品特征以及该目标组合数据进行并联处理，得到综合数据；将该综合数据输入第二物品推荐网络中，由该第二物品推荐网络对该综合数据进行特征提取，得到目标特征。

在一些实施例中，该第二物品推荐网络为深度神经网络；

该基于第二物品推荐网络，对该账号特征、该物品特征以及目标组合数据进行特征提取，得到目标特征，基于该目标特征，获取该用户账号和该物品之间的第二匹配度，包括：

基于该深度神经网络，对该账号特征、该物品特征以及目标组合数据进行前向计算，得到目标特征，对该目标特征进行降维处理，得到该用户账号和该物品之间的第二匹配度。

在一些实施例中，该根据第一差异和第二差异，对该第一物品推荐网络进行训练，包括：

基于该第一匹配度与该参考匹配度，获取第一损失值；

基于该第二匹配度与该参考匹配度，获取第二损失值；

基于该第一损失值和该第二损失值，对该第一物品推荐网络进行训练。

在一些实施例中，该方法还包括：

基于该第二差异，对该第二物品推荐网络进行训练。

在一些实施例中，该方法还包括：

响应于对目标用户账号和目标物品的推荐指令，基于训练好的该第一物品推荐网络，对该目标用户账号的账号数据和该目标物品的物品数据分别进行特征提取，得到目标账号特征和目标物品特征；基于该目标账号特征和该目标物品特征，确定该目标用户账号和该目标物品之间的第三匹配度；

响应于该第三匹配度满足推荐条件，向该目标用户账号推荐该目标物品。

图3是根据一示例性实施例示出的一种物品推荐网络训练方法的流程图，如图3所示，物品推荐网络训练方法可以由电子设备执行，包括以下步骤。

在步骤S31中，电子设备获取用户账号的账号数据和物品的物品数据。

在本公开实施例中，该用户账号的账号数据和物品的物品数据作为训练样本，用于对第一物品推荐网络进行训练，使得该第一物品推荐网络具有分析用户账号和物品之间匹配度的能力。这样训练后该第一物品推荐网络即可用于物品推荐。

该用户账号的账号数据可以包括至少一个用户账号的账号数据，物品的物品数据也可以包括至少一个物品的物品数据。其中，该至少一个是指一个或一个以上。在不同的物品推荐场景中，该用户账号数据和物品数据可能不同，相关技术人员可以根据需求来设置当前物品推荐场景中，账号数据和物品数据分别包括哪些种类的数据。

例如，在视频推荐场景中，物品可以是视频。在一个具体示例中，该视频可以为短视频，视频推荐场景可以为短视频推荐场景。该用户账号的账号数据可以包括该用户账号浏览过的视频、该用户账号进行过反馈操作的视频、该用户账号的属性数据。其中，该反馈操作可以为点击操作、转发操作、分享操作、下载操作中的至少一个。该属性数据可以包括用户账号的等级数据、所使用用户的性别、用户的偏好设置中的至少一个。这里的反馈操作和属性数据均是一种示例性说明，该反馈操作还可以为其他操作，该属性数据均还可以包括其他种类的数据，本公开实施例在此不一一列举，也对此不作限定。

又例如，在商品推荐场景中，物品可以是商品。该用户账号的账号数据可以包括该用户账号购买过或浏览过的商品、该用户账号的属性数据等。该物品数据可以包括商品的适用人群、商品的类型、商品的价格等。

上述仅提供了两种推荐场景的具体示例，本公开实施例可以应用于任一种推荐场景中，例如，本公开实施例可以应用于广告推荐场景中，物品可以是广告。又例如，本公开实施例可以应用于新闻推荐场景中，物品可以是新闻。本公开实施例对本公开实施例的具体应用场景不作限定。

该账号数据和物品数据可以存储于该电子设备中，也可以存储于数据库中。根据这些数据的存储位置不同，电子设备获取这些数据的方式也可以不同。

在一些实施例中，电子设备可以从本地存储中获取该账号数据和物品数据。在另一些实施例中，电子设备可以从数据库中提取该账号数据和物品数据。本公开实施例对具体采用哪种方式来获取账号数据和物品数据不作限定。

在步骤S32中，电子设备基于第一物品推荐网络对用户账号的账号数据和物品的物品数据分别进行特征提取，得到账号特征和物品特征。

电子设备获取到训练样本后，可以用待训练的第一物品推荐网络来对其进行处理。需要说明的是，这里该第一物品推荐网络中的网络参数为初始值，可能对账号数据和物品数据的处理结果还不够准确，处理结果可以理解为一种预测值、预估值。在训练过程中可以使用标注数据来确定处理结果是否准确。该用户账号和物品可以已标注有匹配度，在此称该已标注的匹配度为参考匹配度，也即是，该参考匹配度为一种真实值、正确的值，通过对比第一物品推荐网络得到的预测值与真实值，能够获知该第一物品推荐网络的处理准确性，以此来确定是否还需要对其进行优化，以提高该处理准确性。

在一些实施例中，该第一物品推荐网络的特征提取部分可以包括两个分支，电子设备可以将用户账号的账号数据和物品的物品数据分别输入该第一物品推荐网络的两个分支中，基于每个分支对账号数据和物品数据中的一种数据进行特征提取，得到相应的特征。其中，用于处理账号数据的分支能够输出账号特征，用于处理物品数据的分支能够输出物品特征。

其中，特征是指一事物异于其他事物的特点。通过获取到账号特征和物品特征，能够较好地对用户账号和物品的特点进行表达，进而能够基于表达进一步确定二者是否匹配。

该第一物品推荐网络这种具有两个分支的结构可以称之为双塔结构，因而，该第一物品推荐网络还可以称为双塔网络。该双塔网络中将用户账号和物品解耦，二者的数据分离开进行特征提取，在训练过程中能够训练该双塔网络学习到对二者的数据进行特征提取得到准确的表达，该表达也即是指上述账号特征和物品特征。

在一些实施例中，该第一物品推荐网络可以包括嵌入层和至少一个隐藏层；相应地，该第一物品推荐网络中两个分支中的嵌入层可以分别对账号数据和物品数据进行嵌入处理，得到账号嵌入和物品嵌入，然后两个分支中的隐藏层可以分别对账号嵌入和物品嵌入进行处理得到账号特征和物品特征。

具体地，账号特征和物品特征可以为多维向量，通过多个维度针对两种数据进行表达，进而后续能够从多个维度对用户账号和物品进行匹配，得到的匹配度更加准确，以此进行物品推荐，能够使得推荐的物品更加符合用户账号的特点，提高推荐的转化率和成功率。

在一个具体的可能实施例中，该隐藏层可以为全连接层，对于每个全连接层，可以对输入数据与该全连接层的权重做乘积处理，然后对乘积与偏置进行求和处理，得到输出数据。其中，第一个隐藏层的输入数据即为账号嵌入或物品嵌入，后面隐藏层的输入数据为前一个隐藏层的输出数据，后面隐藏层的输出数据可以作为下一个隐藏层的输入数据。该隐藏层还可以为卷积层，卷积层的处理过程与上述同理，本公开实施例对此不作限定。其中，该权重和偏置为该隐藏层的参数，也即是该第一物品推荐网络的部分网络参数，在训练过程中能够不断优化更新。

在步骤S33中，电子设备基于该账号特征和该物品特征，确定该用户账号和该物品之间的第一匹配度。

电子设备提取到账号特征和物品特征后，可以基于两个特征来确定用户账号和物品之间的第一匹配度。可以理解地，账号特征和物品特征用于表示用户账号和物品的特点，两个特征之间的匹配度也即可用于表示用户账号和物品之间的第一匹配度。

在一些实施例中，该第一匹配度可以通过相似度度量函数实现。电子设备可以获取账号特征和物品特征之间的相似度，将该相似度作为第一匹配度。例如，该相似度度量函数可以为余弦函数，也可以为其他函数，比如杰卡德相似系数等，本公开实施例对此不作限定。

例如，如图4所示，第一物品推荐网络可以为一种双塔网络(Two Tower Network)，该双塔网络包括两个分支，该两个分支可以称为两个塔，在图4中以每个分支包括一个嵌入层(Embedding)和多个隐藏层(Hidden Layer)为例进行说明。其中一个塔的输入是用户数据，该用户数据也即是指用户账号的账号数据，另一个塔的输入是物品数据。用户数据和物品数据分开进行特征提取，分别得到账号特征和物品特征，该账号特征和物品特征也即是该双塔网络的顶层特征，在具体示例中，这两种特征可以采用向量形式，因而，账号特征可以称为双塔顶层网络用户侧输出向量，物品特征可以称之为双塔顶层网络物品侧输出向量。在得到账号特征和物品特征后，可以计算两个特征之间的相似度，也即是第一匹配度，在图4中，该第一匹配度为双塔网络中的目标(Objective)。

需要说明的是，第一物品推荐对用户账号的账号数据和物品的物品数据进行特征提取时，将用户账号数据和物品数据的特征提取过程解耦，也即是账号数据和物品数据分别进行特征提取，提取到的特征分别用于表示用户账号和物品，尤其是在用户账号和物品数量较多的场景中，对于每个用户账号和物品做一次特征提取即可，无需针对每个用户账号-物品的组合对均进行一次特征提取，从而能够有效减少运算量，具有很高的处理效率。

在步骤S34中，电子设备基于第二物品推荐网络，对该账号特征、该物品特征以及目标组合数据进行特征提取，得到目标特征，基于该目标特征，获取该用户账号和该物品之间的第二匹配度。

该目标组合数据包括将该账号数据中的一种属性与该物品数据中的一种属性组合得到的数据。通过将账号数据和物品数据进行组合，能够挖掘出该用户账号与该物品之间显性或隐性的关系，以进一步分析该用户账号是否对物品感兴趣。

下面通过具体示例对该目标组合数据进行解释说明。在具体示例一中，可以将账号数据中的性别与物品数据中的类型进行组合得到一种目标组合数据。比如该用户账号的性别为男性，物品的类型为体育类，则该目标组合数据可以为男性且体育类物品；比如该用户账号的性别为女性，物品的类型为家庭类，则该目标组合数据可以为女性且家庭类物品。在具体示例二中，可以将账号数据中的年龄与物品数据中的类型进行组合得到一种目标组合数据。比如该用户账号的年龄小于18岁，物品的类型为电子游戏类，则该目标组合数据可以为未成年且电子游戏类物品。在此仅为一种示例性说明，本公开实施例对此不作限定。

该目标组合数据可以包括一种，也可以包括多种。上述账号数据和物品数据中可以分别包括多种属性，可以将账号数据中的第一种属性与物品数据中的第二种属性进行组合得到一种目标组合数据，还可以将账号数据中的第一种属性与物品数据中的第三种属性进行组合得到另一种目标组合数据，还可以将账号数据中的第四种属性与物品数据中的第五种属性进行组合得到另一种目标组合数据。具体如何组合得到目标组合数据，以及上述步骤S34中具体包括几种目标组合数据可以由相关技术人员根据需求进行设置，本公开实施例对此不作限定。

在此需要说明的是，本公开提供的方法，通过增加第二物品推荐网络来辅助第一物品推荐网络训练，相较于相关技术中直接用账号数据和物品数据单独对物品推荐网络进行训练，引入了目标组合数据，正好补上了相关技术中训练数据未使用到目标组合数据的缺陷，且其结构依然为双塔结构，保留了双塔网络计算效率高的优点，做到了既利用组合特征(或称为交叉特征)提升了网路预估的准确度，提升了推荐效果，又能够高效地应用到线上推荐场景，高速预估大量用户账号-物品组合。

另外，上述训练方式与蒸馏学习方式不同，蒸馏方式中教师网络和学生网络之间通常并无数据交互，仅将教师网络的输出计算得到损失值来训练学生网络，而本公开提供的方法中，两个网络之前的联系密切，处理得到的用户特征共享，能够达到更好的联合训练效果，训练得到的第一物品推荐网络处理数据的准确性更好。

在一些实施例中，第二物品推荐网络的输入包括该多种数据。针对该多种数据在输入时，可以将每种数据作为一个维度输入第二物品推荐网络中，也可以对多种数据进行处理后，作为整体输入第二物品推荐网络中。具体地，电子设备对该目标数据时可以通过多种方式实现。

在方式一中，电子设备可以将该账号特征、该物品特征以及该目标组合数据分别输入第二物品推荐网络，由该第二物品推荐网络对输入的多种数据进行特征提取并进行加权，得到目标特征。在该方式一中，每种数据均作为一个输入，该第二物品推荐网络则具有多个输入，该第二物品推荐网络对多种数据进行处理时，能够综合考虑多种数据，且针对每种数据能够采用相应的处理方式，得到更准确的处理结果。

在方式二中，电子设备可以将该账号特征、该物品特征以及该目标组合数据进行并联处理，得到综合数据；将该综合数据输入第二物品推荐网络中，由该第二物品推荐网络对该综合数据进行特征提取，得到目标特征。在该方式二中，将多种数据并联在一起作为一个输入，该第二物品推荐网络的输入层无需分为多个维度，多种数据之间具有一定联系，有些数据组合到一起更能够体现用户账号与物品的特点，将其作为一个整体进行处理，该第二物品推荐网络能够学习到如何融合多种数据，以得到更准确的处理结果。

在上述两种方式中，特征提取步骤的作用在于能够将一对数据中无关紧要的数据进行忽略，将不同数据组合得到新的特征，将输入的所有数据中重要特征提取出来，并发现一些原本比较隐形的特征，以此来得到更能够体现用户账号与物品是否匹配的特征。特征提取后再进行匹配度获取步骤，能够综合所有特征得到更加准确的第二匹配度。

在一些实施例中，该第二物品推荐网络为DNN，相应地，该步骤S34中，电子设备可以基于该深度神经网络，对该账号特征、该物品特征以及目标组合数据进行前向计算，得到目标特征。然后对目标进行降维处理，得到该用户账号和该物品之间的第二匹配度。在一些实施例中，该DNN的前向计算过程可以为：电子设备可以分别获取目标组合数据、账号特征和物品特征与权重的乘积，然后对乘积进行加权后，获取加权结果与偏置之和，作为目标特征。DNN可以理解为有很多隐藏层的神经网络，该DNN中每个隐藏层可以采用全连接层，也可以采用卷积层，本公开实施例对此不作限定。通过DNN的前向计算，能够对输入的多种数据进行联合处理，挖掘不同数据中间的隐形关联，最终得到准确表达，该准确表达归一化处理能够得到准确的分类结果，在本公开实施例中，准确表达进行降维处理后，得到的也即是能够用于指示用户账号和物品之间的第二匹配度。

下面针对上述目标数据中每种数据进行一下介绍。其中，目标组合数据在前面内容中已经详细说明。账号特征和物品特征为第一物品推荐网络对账号数据和物品数据进行特征提取得到。在一些实施例中，还可以对账号特征和物品特征进行处理后，再输入第二物品推荐网络，或者对二者进行处理后，将处理结果以及两个特征都输入该第二物品推荐网络中。具体地，电子设备可以基于该账号特征和该物品特征，获取至少一个待处理特征，然后基于第二物品推荐网络，对该至少一个待处理特征以及目标组合数据进行特征提取，得到目标特征。通过对账号特征和物品特征进行处理，能够将账号特征和物品特征联合起来，发掘用户账号和物品的组合特征，更好地将二者之间的关系表示出来，以此再分析二者之间的匹配度，能够得到更准确的结果。

在得到综合特征之后，账号特征和物品特征可以作为输入，也可以不再作为输入。在方式一中，电子设备可以对该账号特征和该物品特征进行处理，得到至少一个综合特征，将该至少一个综合特征作为该至少一个待处理特征。通过处理步骤得到的综合特征能够更好的体现用户账号和物品之间的关系，以此来进行匹配度分析能够得到更准确的第二匹配度。

在方式二中，电子设备可以对该账号特征和该物品特征进行处理，得到至少一个综合特征，将该至少一个综合特征、该账号特征和该物品特征分别作为一个待处理特征。通过处理步骤得到的综合特征能够更好的体现用户账号和物品之间的关系，在进行匹配度分析时，不仅考虑综合特征，还考虑未处理的特征，通过多元化的输入，能够使得第二物品推荐网络自己来挖掘用户账号和物品之间的关系，得到更多的信息，以进一步确定出更准确的第二匹配度。

其中，综合特征的数量可以为一个，也可以为多个。下面提供了多种综合特征，本公开实施例可以采用其中任意一种，或者任意两种的组合，又或者采用三种。

方式一、电子设备获取该账号特征和该物品特征的哈达玛积，将该哈达玛积作为一个综合特征。

方式二、电子设备获取该账号特征和该物品特征的哈达玛积，对该哈达玛积中的元素进行求和处理，得到一个综合特征。

在该方式一和方式二中，哈达玛积(Hadamard product)是矩阵的一类运算，若A＝(aij)和B＝(bij)是两个同阶矩阵，若cij＝aij×bij，则称矩阵C＝(cij)为A和B的哈达玛积，或称基本积。也即是，哈达玛积为将两个向量按位相乘得到的新的向量(矩阵)。上述账号特征和物品特征可以采用同阶矩阵的方式，通过对两个矩阵进行按位相乘，得到一个新的矩阵。方式一中将该新的矩阵作为第二目标特征。方式二中将新的矩阵中所有元素进行求和得到一个数值，将该数值作为第二目标特征。

方式三、电子设备基于深度神经网络，对该账号特征和该物品特征进行前向计算，得到一个综合特征。

该方式三中，将账号特征和物品特征输入到一个DNN中，由DNN来对两种特征进行融合，得到更能够体现用户账号和物品之间是否匹配的第二目标特征。

通过对账号特征和物品特征进行多种方式的处理，将其作为第二物品推荐网络的输入，能够得到多元化的输入，使得第二物品推荐网络能够充分利用到用户账号和物品的相关特征，以得到更加准确的估算结果。

在一些实施例中，该第二物品推荐网络的输入还可以包括用户账号的账号数据和物品的物品数据，该账号数据、物品数据可以与上述目标组合数据和其他特征并联作为第二物品推荐网络的输入。也即是，电子设备可以基于第二物品推荐网络，对该至少一个待处理特征、目标组合数据、该账号数据和该物品数据进行特征提取，得到目标特征。该账号数据和物品数据为原始数据，第二物品推荐网络可以自己学习对原始数据进行特征提取，这样即使第一物品推荐网络的特征提取步骤不够准确，该第二物品推荐网络能够学习到准确的特征以分析匹配度，进而更好地辅助第一物品推荐网络学习到更准确的特征表达，这种方式也进一步丰富第二物品推荐网络的输入，使得第二物品推荐网络能够利用到更多种数据，以得到更加准确的估算结果。

例如，如图4所示，第二物品推荐网络用于对目标组合数据进行处理，以辅助第一物品推荐网络，因而可以将第二物品推荐网络称为CGO网络(Cross-Feature GuidedOptimization Network，交叉特征引导优化网络)，其中，目标组合数据也是将用户账号的数据与物品的数据组合在一起，用来描述用户账号和物品的特点，因而也可以称之为交叉特征(Cross-Feature)。该账号特征和物品特征也即是该双塔网络的顶层特征，在图4所示的具体示例中，这两种特征均可以作为CGO网络的输入，该可以采用向量形式，因而，双塔顶层网络用户侧输出向量和双塔顶层网络物品侧输出向量均可以作为CGO网络的输入。该CGO网络的输入还可以包括用户数据、物品数据以及目标组合数据并列得到的数据。该具体示例采用了上述方式三，该CGO网络的输入还包括DNN对双塔顶层网络用户侧输出向量和双塔顶层网络物品侧输出向量进行处理得到的第二目标特征。综上，双塔网络提供给CGO网络的输入可以是双塔用户侧网络顶层向量、双塔物品侧网络顶层向量、双塔用户侧网络顶层向量和双塔物品侧网络顶层向量按位相乘得到的向量、双塔用户侧网络顶层向量和双塔物品侧网络顶层向量按位相乘得到的向量求和后得到的值、双塔用户侧网络顶层向量和双塔物品侧网络顶层向量并联之后经过多层神经网络(例如DNN)得到的向量中的任意一种或几种的组合。CGO网络采用了DNN层的结构，通过对输入进行处理，能够得到第二匹配度。在图4中，该第二匹配度为CGO网络中的目标(Objective)。

在步骤S35中，电子设备基于该第一匹配度与该参考匹配度，获取第一损失值。

第一匹配度为第一物品推荐网络对账号数据和物品数据处理得到的一种预测值、预估值，电子设备可以对比第一匹配度和参考匹配度，来衡量第一物品推荐网络输出的第一匹配度的准确性如何，可以理解地，两个匹配度越相似，第一匹配度越准确，第一物品推荐网络的预测、预估能力越强。

在一些实施例中，该第一损失值的获取过程可以通过损失函数实现，该损失函数可以为任一种损失函数，例如，该损失函数可以为交叉熵损失函数(Cross-entropy lossfunction)，也可以为KL(Kullback-Leibler Divergence)散度，还可以为平方损失函数等，其中，KL散度也叫作也叫做相对熵(Relative Entropy)，本公开实施例对此不作限定。

在步骤S36中，电子设备基于该第二匹配度与该参考匹配度，获取第二损失值。

该步骤S36与上述步骤S35同理，只是用于比较的匹配度从第一匹配度变为第二匹配度，本公开实施例在此不多做赘述。

在步骤S37中，电子设备基于该第一损失值和该第二损失值，对该第一物品推荐网络进行训练。

电子设备基于第一物品推荐网络和第二物品推荐网络得到了两个损失值，该第二物品推荐网络用于辅助第一物品推荐网络训练，则对第一物品推荐网络进行训练时，可以将第二品推荐网络得到的损失值也考虑在内。

在一些实施例中，电子设备可以对第一损失值和该第二损失值进行加权，得到目标损失值，基于目标损失值对该第一物品推荐网络进行训练。这样通过加权求和的方式，综合考虑多种损失值，通过多个方面对第一物品推荐网络处理数据的过程进行了优化，能够提高第一物品推荐网络的准确性。其中，该第一损失值和第二损失值的权重可以由相关技术人员根据需求进行设置，也可以在训练过程中进行不断更新，本公开实施例对此不作限定。

电子设备响应于该目标损失值大于损失值阈值，对该第一物品推荐网络的网络参数进行更新；电子设备响应于该目标损失值小于或等于损失值阈值，结束训练过程，将当前迭代过程中第一物品推荐网络作为训练好的第一物品推荐网络。

需要说明的是，上述步骤S32至步骤S34为一次迭代过程中数据处理的步骤，该步骤S35、步骤S36以及响应于目标损失值大于损失值阈值或响应于目标损失值小于或等于损失值阈值执行不同步骤的为一次迭代过程中基于损失值确定是否更新网络参数的步骤。在每次迭代过程中，电子设备均可以进行特征提取以及匹配度获取的步骤，然后计算损失值，来确定是否更新网络参数，如果更新了网络参数，则基于更新后的网络参数再进行下一次迭代过程；如果确定无需更新网络参数，则可以结束训练，将本次迭代过程所使用的第一物品推荐网络作为训练好的第一物品推荐网络。

上述仅以加权得到目标损失值为例进行了说明，电子设备也可以无需加权，分别通过第一损失值和第二损失值确定是否大于损失值阈值，响应于任一个损失值大于损失值阈值，则更新网络参数，响应于两个损失值均小于或等于损失值阈值，则结束训练过程。

在一些实施例中，该第一物品推荐网络的网络参数更新可以通过梯度下降算法实现，例如，该梯度下降算法可以为SGD(stochastic gradient descent，随机梯度下降)算法或Adam算法，也可以为其他算法，本公开实施例对此不作限定。

具体地，电子设备可以基于本次迭代过程得到的第一损失值和第二损失值，获取第一梯度和第二梯度，响应于两个梯度均小于梯度阈值，结束训练。电子设备响应于任一梯度大于或等于梯度阈值，则对第一物品推荐网络的网络参数进行更新。或者电子设备可以基于目标损失值获取目标梯度，响应于目标梯度小于梯度阈值，结束训练。电子设备响应于目标梯度大于或等于梯度阈值，则对第一物品推荐网络的网络参数进行更新。其中，梯度小于梯度阈值，说明损失值收敛至最小值，当前第一物品推荐网络的性能已经很好了，可以结束训练。

需要说明的是，该步骤S35至步骤S37为根据第一差异和第二差异，对该第一物品推荐网络进行训练的过程，该过程中仅以基于第一匹配度和第二匹配度获取到各自对应的损失值，进而基于损失值进行训练为例进行了说明，通过综合两个损失值来进行训练，该训练过程中考虑到了第二物品推荐网络对包含目标组合数据的目标数据的处理情况，因而，能促使第一物品推荐网络也学习到对目标组合数据的处理能力，使得第一物品推荐网络能够更准确地进行物品推荐。在一些实施例中，电子设备也可以无需分别计算损失值，而是用其他方式来表征第一匹配度和第二匹配度与参考匹配度之间的差异，比如通过相似度度量函数计算该差异，然后基于差异来进行网络训练，本公开实施例对此不作限定。

在一些实施例中，在第一物品推荐网络的训练过程中，电子设备还基于该第二差异，对该第二物品推荐网络进行训练。同理地，该第二差异也可以通过上述第二损失值来表征，或者使用其他方式表征。在通过第二损失值表征的方式中，电子设备也可以响应于第二损失值大于损失值阈值，对第二物品推荐网络的网络参数进行更新；响应于第二损失值小于或等于损失值阈值，结束训练过程。在一个可能实施例中，电子设备可以将本次迭代过程中所使用的第二物品推荐网络作为最终训练的第二物品推荐网络。在另一个可能实施例中，本公开实施例旨在训练第一物品推荐网络，结束训练过程后，也可以不对训练的第二物品推荐网络进行处理。本公开实施例对具体训练结束后是否还对第二物品推荐网络进行处理不作限定。

上述过程中还对第二物品推荐网络进行训练，这样在第一物品推荐网络的训练过程中，第二物品推荐网络的网络参数也在不断优化，这样该第二物品推荐网络针对用户账号和物品的目标组合数据处理的结果会更加准确，以此来训练第一物品推荐网络，该第一物品推荐网络虽不能直接利用该目标组合数据，但第二物品推荐网络会对第一物品推荐网络进行梯度反向传播，而第二物品推荐网络利用到了目标组合数据，也即可以理解为：第一物品推荐网络简单明了地利用到了目标组合数据，提高了第一物品推荐网络的准确性，使得第一物品推荐网络能够更加准确地对账号数据和物品数据进行处理，得到准确的推荐结果。

在离线训练过程和在线阶段有不同的形式，离线阶段优化CGO网络和双塔网络，在线预估可以利用双塔网络进行估计，不依赖CGO网络，从而保留了双塔网络线上预估高效的优点的基础上利用了组合特征辅助优化双塔网络，其中，在离线训练阶段中，CGO网络需要对双塔网络回传梯度起到辅助训练的效果。

通过上述方法能够训练得到第一物品推荐网络，该第一物品推荐网络训练结束后，可以用于对任一用户账号进行物品推荐，线上进行预估服务时，可以利用双塔网络(也即是第一物品推荐网络)的预估值，也就是说使用双塔网络的参数和输入数据进行计算来产生预估值，不依赖CGO网络的任何参数，从而保留了双塔网络在线预估时用户和物品解耦，计算高效的优点。具体该推荐过程可以参见下述图5所示实施例，在此不多做赘述。

本公开实施例可以通过目标组合数据(也可以称为交叉特征或组合特征)的引入提高双塔网络的预估效果，同时保留双塔网络计算高效的特点。上述训练过程可以离线实现，也可以在线实现。后续该第一物品推荐网络训练好后，可以用于在线推荐。通过在短视频推荐场景中进行离线实验，实验结果表明本公开实施例通过增加CGO网络后，离线测试的AUC、用户平均AUC(UAUC)以及用户加权平均AUC(WUAUC)相较于相关技术中的双塔网络有明显提升。其中，AUC(Area Under Curve)被定义为ROC曲线(receiver operatingcharacteristic curve，接收者工作特征曲线)下与坐标轴围成的面积，显然这个面积的数值不会大于1。又由于ROC曲线一般都处于y＝x这条直线的上方，所以AUC的取值范围在0.5和1之间。AUC越接近1.0，检测方法真实性越高。AUC等于0.5时，则真实性最低。另外，也在线上进行了AB测试，其中，AB测试是为Web(网页)或App(Application，应用程序)界面或流程制作两个(A/B)或多个(A/B/n)版本，在同一时间维度，分别让组成成分相同(相似)的访客群组(目标人群)随机的访问这些版本，收集各群组的用户体验数据和业务数据，最后分析、评估出最好版本以正式采用的过程。AB测试实验表明，采用本公开实施例提出的方法后，推荐系统的关键指标，如人均使用时长、次日留存率、人均点赞数量、人均转发数量、人均评论数量均较基线版本有明显的提升。同时，在线AB实验表明，本公开提供的方法在线上应用时相较于基线版本并没有增加预估耗时，保留了双塔模型线上性能高，可短时间进行大量样本预估的优点。

上述图3所示实施例中对第一物品推荐网络的训练过程进行了说明，该第一物品推荐网络训练好后，能够用于为任一用户账号进行物品推荐。下面通过图5所示实施例，对通过该第一物品推荐网络进行物品推荐的流程进行说明。

图5是根据一示例性实施例示出的一种物品推荐方法的流程图，如图5所示，物品推荐方法可以由电子设备执行，包括以下步骤。

在步骤S51，电子设备响应于对目标用户账号和目标物品的推荐指令，获取目标用户账号的账号数据和目标物品的物品数据。

在步骤S52，电子设备基于训练好的该第一物品推荐网络，对该目标用户账号的账号数据和该目标物品的物品数据分别进行特征提取，得到目标账号特征和目标物品特征。

在步骤S53，电子设备基于该目标账号特征和该目标物品特征，确定该目标用户账号和该目标物品之间的第三匹配度。

需要说明的是，该步骤S51至步骤S53为响应于对目标用户账号和目标物品的推荐指令，基于训练好的该第一物品推荐网络，对该目标用户账号的账号数据和该目标物品的物品数据分别进行特征提取，得到目标账号特征和目标物品特征；基于该目标账号特征和该目标物品特征，确定该目标用户账号和该目标物品之间的第三匹配度的过程，上述过程中仅以在接收到推荐指令时，获取目标用户账号的账号数据和目标物品的物品数据为例进行了说明。在一些实施例中，电子设备也可以在接收到推荐指令时，即接收到了该目标用户账号的账号数据和目标物品的物品数据，本公开实施例对此不作限定。

在步骤S54中，电子设备响应于该第三匹配度满足推荐条件，向该用户账号推荐该目标物品。

其中，该推荐条件可以由相关技术人员根据需求进行设置，本公开实施例对此不作限定。

在一些实施例中，该推荐条件可以为第三匹配度大于匹配度阈值，也即是，该步骤S54可以为：电子设备响应于第三匹配度大于匹配度阈值，向该用户账号推荐该目标物品。

在另一些实施例中，待推荐的物品除了目标物品之外，还有其他物品。电子设备也可以基于该目标用户账号的账号数据和该其他物品的物品数据，得到该目标用户账号与其他物品的第四匹配度。如果该其他物品的数量为一个，则可以得到一个第四匹配度；如果该其他物品的数量为多个，则可以得到多个第四匹配度。相应地，该推荐条件可以为该第三匹配度为第三匹配度和至少一个第四匹配度中的最大值。

该步骤S54中针对第三匹配度满足推荐条件的情况进行了说明，在一些实施例中，还有另一种可能情况：第三匹配度不满足推荐条件，电子设备响应于第三匹配度不满足推荐条件，可以不执行向该用户账号推荐该目标物品的步骤。电子设备也可以再基于该目标用户账号的账号数据与其他物品的物品数据进行处理，以确定是否向该目标用户账号推荐其他物品，推荐过程与上述步骤S51至步骤S54同理，本公开实施例在此不多做赘述。

第一物品推荐网络能够分别对用户账号的账号数据和物品的物品数据进行特征提取，将用户账号数据和物品数据的特征提取过程解耦，具有很高的处理效率。该第一物品推荐网络在训练时，通过新增第二物品推荐网络来为训练过程引入用户账号和物品的目标组合数据，该目标组合数据通常能够明显地体现出用户账号是否可能对该物品感兴趣，且第二物品推荐网络的输入也包括第一物品推荐网络处理的结果，两个网络之间联系密切，通过第二物品推荐网络的输出能够更好地辅助第一物品推荐网络的训练，因而，第一物品推荐网络处理数据的准确性比较好。

图6是根据一示例性实施例示出的一种物品推荐网络训练装置框图。参照图6，该装置包括处理单元601和训练单元602。

处理单元601，被配置为执行基于第一物品推荐网络对用户账号的账号数据和物品的物品数据分别进行特征提取，得到账号特征和物品特征，基于该账号特征和该物品特征，确定该用户账号和该物品之间的第一匹配度；

该处理单元601，还被配置为执行基于第二物品推荐网络，对该账号特征、该物品特征以及目标组合数据进行特征提取，得到目标特征，基于该目标特征，获取该用户账号和该物品之间的第二匹配度，该目标组合数据包括将该账号数据中的一种属性与该物品数据中的一种属性组合得到的数据；

训练单元602，被配置为执行根据第一差异和第二差异，对该第一物品推荐网络进行训练，该第一差异为该第一匹配度和参考匹配度之间的差异，该第二差异为该第二匹配度与该参考匹配度之间的差异。

在一些实施例中，该处理单元601被配置为执行：

基于该账号特征和该物品特征，获取至少一个待处理特征；

在一些实施例中，该处理单元601被配置为执行下述任一项：

在一些实施例中，该处理单元601被配置为执行下述至少一项：

在一些实施例中，该处理单元601被配置为执行基于第二物品推荐网络，对该至少一个待处理特征、目标组合数据、该账号数据和该物品数据进行特征提取，得到目标特征。

在一些实施例中，该处理单元601被配置为执行下述任一项：

在一些实施例中，该第二物品推荐网络为深度神经网络；

该处理单元601被配置为执行基于该深度神经网络，对该账号特征、该物品特征以及目标组合数据进行前向计算，得到目标特征，对该目标特征进行降维处理，得到该用户账号和该物品之间的第二匹配度。

在一些实施例中，该训练单元602被配置为执行：

基于该第一匹配度与该参考匹配度，获取第一损失值；

基于该第二匹配度与该参考匹配度，获取第二损失值；

在一些实施例中，该训练单元602还被配置为执行基于该第二差异，对该第二物品推荐网络进行训练。

在一些实施例中，该处理单元601还被配置为执行响应于对目标用户账号和目标物品的推荐指令，基于训练好的该第一物品推荐网络，对该目标用户账号的账号数据和该目标物品的物品数据分别进行特征提取，得到目标账号特征和目标物品特征；基于该目标账号特征和该目标物品特征，确定该目标用户账号和该目标物品之间的第三匹配度；

该装置还包括：

推荐单元，被配置为执行响应于该第三匹配度满足推荐条件，向该目标用户账号推荐该目标物品。

关于上述实施例中的装置，其中各个模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述，此处将不做详细阐述说明。

图7是根据一示例性实施例示出的一种电子设备的结构示意图，该电子设备700可因配置或性能不同而产生比较大的差异，包括一个或一个以上处理器(CentralProcessing Units，CPU)701和一个或一个以上的存储器702，其中，该存储器702中存储有至少一条指令，该至少一条指令由该处理器701加载并执行以实现上述各个方法实施例提供的物品推荐网络训练方法或物品推荐方法。该电子设备还包括其他用于实现设备功能的部件，例如，该电子设备还具有有线或无线网络接口以及输入输出接口等部件，以便进行输入输出。本申请实施例在此不做赘述。

上述方法实施例中的电子设备实现为终端。例如，图8是根据一示例性实施例示出的一种终端的结构框图。该终端800可以是便携式移动终端，比如：智能手机、平板电脑、MP3(Moving Picture Experts Group Audio Layer III，动态影像专家压缩标准音频层面3)播放器、MP4(Moving Picture Experts Group Audio Layer IV，动态影像专家压缩标准音频层面4)播放器、笔记本电脑或台式电脑。终端800还可能被称为用户设备、便携式终端、膝上型终端、台式终端等其他名称。

通常，终端800包括有：处理器801和存储器802。

处理器801可以包括一个或多个处理核心，比如4核心处理器、8核心处理器等。处理器801可以采用DSP(Digital Signal Processing，数字信号处理)、FPGA(Field－Programmable Gate Array，现场可编程门阵列)、PLA(Programmable Logic Array，可编程逻辑阵列)中的至少一种硬件形式来实现。处理器801也可以包括主处理器和协处理器，主处理器是用于对在唤醒状态下的数据进行处理的处理器，也称CPU(Central ProcessingUnit，中央处理器)；协处理器是用于对在待机状态下的数据进行处理的低功耗处理器。在一些实施例中，处理器801可以集成有GPU(Graphics Processing Unit，图像处理器)，GPU用于负责显示屏所需要显示的内容的渲染和绘制。一些实施例中，处理器801还可以包括AI(Artificial Intelligence，人工智能)处理器，该AI处理器用于处理有关机器学习的计算操作。

存储器802可以包括一个或多个计算机可读存储介质，该计算机可读存储介质可以是非暂态的。存储器802还可包括高速随机存取存储器，以及非易失性存储器，比如一个或多个磁盘存储设备、闪存存储设备。在一些实施例中，存储器802中的非暂态的计算机可读存储介质用于存储至少一个指令，该至少一个指令用于被处理器801所执行以实现本申请中方法实施例提供的物品推荐网络训练方法或物品推荐方法。

在一些实施例中，终端800还可选包括有：外围设备接口803和至少一个外围设备。处理器801、存储器802和外围设备接口803之间可以通过总线或信号线相连。各个外围设备可以通过总线、信号线或电路板与外围设备接口803相连。具体地，外围设备包括：射频电路804、显示屏805、摄像头组件806、音频电路807、定位组件808和电源809中的至少一种。

外围设备接口803可被用于将I/O(Input/Output，输入/输出)相关的至少一个外围设备连接到处理器801和存储器802。在一些实施例中，处理器801、存储器802和外围设备接口803被集成在同一芯片或电路板上；在一些其他实施例中，处理器801、存储器802和外围设备接口803中的任意一个或两个可以在单独的芯片或电路板上实现，本实施例对此不加以限定。

射频电路804用于接收和发射RF(Radio Frequency，射频)信号，也称电磁信号。射频电路804通过电磁信号与通信网络以及其他通信设备进行通信。射频电路804将电信号转换为电磁信号进行发送，或者，将接收到的电磁信号转换为电信号。可选地，射频电路804包括：天线系统、RF收发器、一个或多个放大器、调谐器、振荡器、数字信号处理器、编解码芯片组、用户身份模块卡等等。射频电路804可以通过至少一种无线通信协议来与其它终端进行通信。该无线通信协议包括但不限于：万维网、城域网、内联网、各代移动通信网络(2G、3G、4G及5G)、无线局域网和/或WiFi(Wireless Fidelity，无线保真)网络。在一些实施例中，射频电路804还可以包括NFC(Near Field Communication，近距离无线通信)有关的电路，本申请对此不加以限定。

显示屏805用于显示UI(User Interface，用户界面)。该UI可以包括图形、文本、图标、视频及其它们的任意组合。当显示屏805是触摸显示屏时，显示屏805还具有采集在显示屏805的表面或表面上方的触摸信号的能力。该触摸信号可以作为控制信号输入至处理器801进行处理。此时，显示屏805还可以用于提供虚拟按钮和/或虚拟键盘，也称软按钮和/或软键盘。在一些实施例中，显示屏805可以为一个，设置在终端800的前面板；在另一些实施例中，显示屏805可以为至少两个，分别设置在终端800的不同表面或呈折叠设计；在另一些实施例中，显示屏805可以是柔性显示屏，设置在终端800的弯曲表面上或折叠面上。甚至，显示屏805还可以设置成非矩形的不规则图形，也即异形屏。显示屏805可以采用LCD(Liquid Crystal Display，液晶显示屏)、OLED(Organic Light-Emitting Diode，有机发光二极管)等材质制备。

摄像头组件806用于采集图像或视频。可选地，摄像头组件806包括前置摄像头和后置摄像头。通常，前置摄像头设置在终端的前面板，后置摄像头设置在终端的背面。在一些实施例中，后置摄像头为至少两个，分别为主摄像头、景深摄像头、广角摄像头、长焦摄像头中的任意一种，以实现主摄像头和景深摄像头融合实现背景虚化功能、主摄像头和广角摄像头融合实现全景拍摄以及VR(Virtual Reality，虚拟现实)拍摄功能或者其它融合拍摄功能。在一些实施例中，摄像头组件806还可以包括闪光灯。闪光灯可以是单色温闪光灯，也可以是双色温闪光灯。双色温闪光灯是指暖光闪光灯和冷光闪光灯的组合，可以用于不同色温下的光线补偿。

音频电路807可以包括麦克风和扬声器。麦克风用于采集用户及环境的声波，并将声波转换为电信号输入至处理器801进行处理，或者输入至射频电路804以实现语音通信。出于立体声采集或降噪的目的，麦克风可以为多个，分别设置在终端800的不同部位。麦克风还可以是阵列麦克风或全向采集型麦克风。扬声器则用于将来自处理器801或射频电路804的电信号转换为声波。扬声器可以是传统的薄膜扬声器，也可以是压电陶瓷扬声器。当扬声器是压电陶瓷扬声器时，不仅可以将电信号转换为人类可听见的声波，也可以将电信号转换为人类听不见的声波以进行测距等用途。在一些实施例中，音频电路807还可以包括耳机插孔。

定位组件808用于定位终端800的当前地理位置，以实现导航或LBS(LocationBased Service，基于位置的服务)。定位组件808可以是基于美国的GPS(GlobalPositioning System，全球定位系统)、中国的北斗系统或俄罗斯的伽利略系统的定位组件。

电源809用于为终端800中的各个组件进行供电。电源809可以是交流电、直流电、一次性电池或可充电电池。当电源809包括可充电电池时，该可充电电池可以是有线充电电池或无线充电电池。有线充电电池是通过有线线路充电的电池，无线充电电池是通过无线线圈充电的电池。该可充电电池还可以用于支持快充技术。

在一些实施例中，终端800还包括有一个或多个传感器810。该一个或多个传感器810包括但不限于：加速度传感器811、陀螺仪传感器812、压力传感器813、指纹传感器814、光学传感器815以及接近传感器816。

加速度传感器811可以检测以终端800建立的坐标系的三个坐标轴上的加速度大小。比如，加速度传感器811可以用于检测重力加速度在三个坐标轴上的分量。处理器801可以根据加速度传感器811采集的重力加速度信号，控制显示屏805以横向视图或纵向视图进行用户界面的显示。加速度传感器811还可以用于游戏或者用户的运动数据的采集。

陀螺仪传感器812可以检测终端800的机体方向及转动角度，陀螺仪传感器812可以与加速度传感器811协同采集用户对终端800的3D动作。处理器801根据陀螺仪传感器812采集的数据，可以实现如下功能：动作感应(比如根据用户的倾斜操作来改变UI)、拍摄时的图像稳定、游戏控制以及惯性导航。

压力传感器813可以设置在终端800的侧边框和/或显示屏805的下层。当压力传感器813设置在终端800的侧边框时，可以检测用户对终端800的握持信号，由处理器801根据压力传感器813采集的握持信号进行左右手识别或快捷操作。当压力传感器813设置在显示屏805的下层时，由处理器801根据用户对显示屏805的压力操作，实现对UI界面上的可操作性控件进行控制。可操作性控件包括按钮控件、滚动条控件、图标控件、菜单控件中的至少一种。

指纹传感器814用于采集用户的指纹，由处理器801根据指纹传感器814采集到的指纹识别用户的身份，或者，由指纹传感器814根据采集到的指纹识别用户的身份。在识别出用户的身份为可信身份时，由处理器801授权该用户执行相关的敏感操作，该敏感操作包括解锁屏幕、查看加密信息、下载软件、支付及更改设置等。指纹传感器814可以被设置在终端800的正面、背面或侧面。当终端800上设置有物理按键或厂商Logo时，指纹传感器814可以与物理按键或厂商Logo集成在一起。

光学传感器815用于采集环境光强度。在一个实施例中，处理器801可以根据光学传感器815采集的环境光强度，控制显示屏805的显示亮度。具体地，当环境光强度较高时，调高显示屏805的显示亮度；当环境光强度较低时，调低显示屏805的显示亮度。在另一个实施例中，处理器801还可以根据光学传感器815采集的环境光强度，动态调整摄像头组件806的拍摄参数。

接近传感器816，也称距离传感器，通常设置在终端800的前面板。接近传感器816用于采集用户与终端800的正面之间的距离。在一个实施例中，当接近传感器816检测到用户与终端800的正面之间的距离逐渐变小时，由处理器801控制显示屏805从亮屏状态切换为息屏状态；当接近传感器816检测到用户与终端800的正面之间的距离逐渐变大时，由处理器801控制显示屏805从息屏状态切换为亮屏状态。

本领域技术人员可以理解，图8中示出的结构并不构成对终端800的限定，可以包括比图示更多或更少的组件，或者组合某些组件，或者采用不同的组件布置。

上述方法实施例中的电子设备实现为服务器。例如，图9是根据一示例性实施例示出的一种服务器的结构示意图，该服务器900可因配置或性能不同而产生比较大的差异，包括一个或一个以上处理器(Central Processing Units，CPU)901和一个或一个以上的存储器902，其中，该存储器902中存储有至少一条指令，该至少一条指令由该处理器901加载并执行以实现上述各个方法实施例提供的物品推荐网络训练方法或物品推荐方法。当然，该服务器还具有有线或无线网络接口以及输入输出接口等部件，以便进行输入输出，该服务器还包括其他用于实现设备功能的部件，在此不做赘述。

在示例性实施例中，还提供了一种计算机可读存储介质，例如包括至少一条指令的存储器，上述至少一条指令由可由电子设备的处理器执行以完成上述实施例中的物品推荐网络训练方法或物品推荐方法。可选地，计算机可读存储介质是只读存储器(Read-OnlyMemory，简称：ROM)、随机存取存储器(Random Access Memory，简称：RAM)、只读光盘(Compact Disc Read-Only Memory，简称：CD-ROM)、磁带、软盘和光数据存储设备等。

在示例性实施例中，还提供了一种计算机程序产品，该计算机程序产品或该计算机程序包括一条或多条指令，该一条或多条指令存储在计算机可读存储介质中。电子设备的一个或多个处理器从计算机可读存储介质中读取该一条或多条指令，该一个或多个处理器执行该一条或多条指令，使得电子设备执行上述物品推荐网络训练方法或物品推荐方法。

在一些实施例中，本申请实施例所涉及的计算机程序可被部署在一个计算机设备上执行，或者在位于一个地点的多个计算机设备上执行，又或者，在分布在多个地点且通过通信网络互连的多个计算机设备上执行，分布在多个地点且通过通信网络互连的多个计算机设备可以组成区块链系统。

本领域技术人员在考虑说明书及实践这里公开的发明后，将容易想到本公开的其它实施方案。本申请旨在涵盖本公开的任何变型、用途或者适应性变化，这些变型、用途或者适应性变化遵循本公开的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的，本公开的真正范围和精神由下面的权利要求指出。

应当理解的是，本公开并不局限于上面已经描述并在附图中示出的精确结构，并且可以在不脱离其范围进行各种修改和改变。本公开的范围仅由所附的权利要求来限制。

Claims

1.一种物品推荐网络训练方法，其特征在于，包括：

基于第二物品推荐网络，对所述至少一个待处理特征以及目标组合数据进行特征提取，得到目标特征，基于所述目标特征，获取所述用户账号和所述物品之间的第二匹配度，所述目标组合数据为将所述账号数据中的一种属性与所述物品数据中的一种属性组合得到的数据；

2.根据权利要求1所述的物品推荐网络训练方法，其特征在于，所述基于所述账号特征和所述物品特征，获取至少一个待处理特征，包括下述任一项：

3.根据权利要求2所述的物品推荐网络训练方法，其特征在于，所述对所述账号特征和所述物品特征进行处理，得到至少一个综合特征，包括下述至少一项：

4.根据权利要求1-3任一项所述的物品推荐网络训练方法，其特征在于，所述基于第二物品推荐网络，对所述至少一个待处理特征以及目标组合数据进行特征提取，得到目标特征，包括：

5.根据权利要求1-3任一项所述的物品推荐网络训练方法，其特征在于，所述基于第二物品推荐网络，对所述账号特征、所述物品特征以及目标组合数据进行特征提取，得到目标特征，包括下述任一项：

6.根据权利要求1所述的物品推荐网络训练方法，其特征在于，所述第二物品推荐网络为深度神经网络；

所述基于所述目标特征，获取所述用户账号和所述物品之间的第二匹配度，包括：

基于所述深度神经网络，对所述目标特征进行降维处理，得到所述用户账号和所述物品之间的第二匹配度。

7.根据权利要求1所述的物品推荐网络训练方法，其特征在于，所述方法还包括：

8.一种物品推荐网络训练装置，其特征在于，包括：

所述处理单元，还被配置为执行基于所述账号特征和所述物品特征，获取至少一个待处理特征；基于第二物品推荐网络，对所述至少一个待处理特征以及目标组合数据进行特征提取，得到目标特征，基于所述目标特征，获取所述用户账号和所述物品之间的第二匹配度，所述目标组合数据为将所述账号数据中的一种属性与所述物品数据中的一种属性组合得到的数据；

9.根据权利要求8所述的物品推荐网络训练装置，其特征在于，所述处理单元被配置为执行下述任一项：

10.根据权利要求9所述的物品推荐网络训练装置，其特征在于，所述处理单元被配置为执行下述至少一项：

11.根据权利要求8-10任一项所述的物品推荐网络训练装置，其特征在于，所述处理单元被配置为执行基于第二物品推荐网络，对所述至少一个待处理特征、目标组合数据、所述账号数据和所述物品数据进行特征提取，得到目标特征。

12.根据权利要求8-10任一项所述的物品推荐网络训练装置，其特征在于，所述处理单元被配置为执行下述任一项：

13.根据权利要求8所述的物品推荐网络训练装置，其特征在于，所述第二物品推荐网络为深度神经网络；

所述处理单元被配置为执行基于所述深度神经网络，对所述目标特征进行降维处理，得到所述用户账号和所述物品之间的第二匹配度。

14.根据权利要求8所述的物品推荐网络训练装置，其特征在于，

所述处理单元还被配置为执行响应于对目标用户账号和目标物品的推荐指令，基于训练好的所述第一物品推荐网络，对所述目标用户账号的账号数据和所述目标物品的物品数据分别进行特征提取，得到目标账号特征和目标物品特征；基于所述目标账号特征和所述目标物品特征，确定所述目标用户账号和所述目标物品之间的第三匹配度；

所述装置还包括：

15.一种电子设备，其特征在于，包括：

一个或多个处理器；

其中，所述一个或多个处理器被配置为执行所述指令，以实现如权利要求1至7中任一项所述的物品推荐网络训练方法。

16.一种计算机可读存储介质，当所述计算机可读存储介质中的指令由电子设备的处理器执行时，使得所述电子设备能够执行如权利要求1至7中任一项所述的物品推荐网络训练方法。