CN111143686B

CN111143686B - 资源推荐方法及装置

Info

Publication number: CN111143686B
Application number: CN201911398834.1A
Authority: CN
Inventors: 文豪
Original assignee: Beijing Baidu Netcom Science and Technology Co Ltd
Current assignee: Beijing Baidu Netcom Science and Technology Co Ltd
Priority date: 2019-12-30
Filing date: 2019-12-30
Publication date: 2023-07-07
Anticipated expiration: 2039-12-30
Also published as: CN111143686A

Abstract

本申请公开了一种资源推荐方法及装置，涉及互联网技术领域。具体实现方案为：服务器接收到终端设备发送的推荐请求后，对于召回队列中的每一条资源，分别确定对应资源的交叉特征向量，并利用资源对应资源向量和交叉特征向量和用户向量，分别确定各资源的粗排分，利用粗排分对各资源进行排序从而确定出待推荐资源并推荐给目标用户。采用该种方案，服务器利用加入用户和资源的交叉特征的粗排模型对召回队列召回的资源排序，取得高准确率的同时节约机器，从而达到资源推荐过程中提升准确度的同时节约机器的目的。

Description

资源推荐方法及装置

技术领域

本申请实施例涉及互联网技术领域，尤其涉及一种资源推荐方法及装置。

背景技术

随着互联网技术的飞速发展，互联网可以为用户提供越来越多的功能，例如，用户可通过应用程序(application，APP)来浏览互联网上的资源，如新闻、资讯、视频、图片等。同时，资源增长呈爆发式的指数型增长，服务器向用户推荐资源时，不得不从海量资源中找到待推荐的资源并推荐给用户。

图1是FEED推荐系统的架构实体图。请参照图1，资源推荐过程中，当用户进行刷新时，触发低层的队列召回资源，每个队列按照一定的规则进行召回，例如：视频队列只召回视频资源，新热队列只召回最新最热资源等。队列召回资源后，会访问粗排服务。粗排服务的作用是将队列召回的资源按照一定目标进行排序。之后，每个队列中TOP N的资源被汇聚到一起，汇聚后的资源再请求精排，进行更加细致的排序，最终将精排后的TOP M的资源推荐给用户。其中，TOP N的资源和TOP M的资源是预估用户最可能点击的资源。

粗排过程中，通常使用的粗排模型包括梯度下降树(Gradient BoostingDecision Tree，GBDT)模型和深度神经网络(Deep Neural Networks，DNN)模型。然而，GBDT模型虽然能够节约机器但准确性较低，而DNN模型的准确性较高但是对机器的消耗多大。因此，粗排过程中，如何兼顾准确性以及节约机器，实为急待解决的问题。

发明内容

本申请实施例提供一种资源推荐方法及装置，利用加入用户和资源的交叉特征的粗排模型对召回队列召回的资源排序，达到资源推荐过程中提升准确度的同时节约机器的目的。

第一方面，本申请实施例提供一种资源推荐方法，包括：接收到终端设备发送的推荐请求后，根据召回方式确定召回队列，所述召回队列包含至少一个资源，所述推荐请求是所述终端设备响应目标用户的刷新指令生成的，对于召回队列中的资源，利用所述资源的资源特征和所述目标用户的用户特征，确定所述资源的交叉特征向量，所述交叉特征向量用于指示所述目标用户与所述资源的匹配程度，将所述资源的交叉特征向量和所述用户的用户向量输入至粗排模型，以得到所述召回队列的资源的粗排分，所述粗排分指示所述目标用户点击所述资源的概率，所述用户向量用于指示所述用户的特征，根据所述召回队列中的资源的粗排分，确定在所述推荐页面待显示的待推荐资源。采用该种方案，服务器利用加入用户和资源的交叉特征的粗排模型对召回队列召回的资源排序，取得高准确率的同时节约机器，从而达到资源推荐过程中提升准确度的同时节约机器的目的。

一种可行的设计中，所述粗排模型包括交叉特征子模型，所述对于召回队列中的资源，利用所述资源的资源特征和所述目标用户的用户特征，确定所述资源的交叉特征向量，包括：对于召回队列中的资源，将所述资源的资源特征和所述目标用户的用户特征，输入至所述交叉特征子模型，运行所述交叉特征子模型，以输出所述资源的交叉特征向量，所述召回队列中资源的资源特征是预先获取到的。采用该种方案，离线算好资源特征，在线时利用资源特征和目标用户的用户特征，即可快速得到交叉特征向量。

一种可行的设计中，所述接收到终端设备发送的推荐请求后，根据召回方式确定召回队列之前，还包括：离线获取资源池中资源的资源特征集合，从所述资源池中确定出所述召回队列中的资源，从所述资源特征集合中确定出所述召回队列中资源的资源特征。采用该种方案，由于资源池中的资源数量庞大，离线算好资源特征，避免在线时计算量大，导致消耗机器过多的弊端。

一种可行的设计中，所述接收到终端设备发送的推荐请求后，根据召回方式确定召回队列之前，还包括：根据所述目标用户的点击记录，确定所述目标用户的用户特征。采用该种方案，实现灵活确定出用户特征的目的。

一种可行的设计中，所述接收到终端设备发送的推荐请求后，根据召回方式确定召回队列之前，还之前，还包括：根据点展日志从资源池中确定出被历史用户点击过的资源，以及未被历史用户点击过的资源，所述点展日志用于记录所述资源池中资源的资源特征，以及所述历史用户的用户特征，利用正样本和负样本训练所述粗排模型，所述正样本包括被历史用户点击过的资源的资源特征和所述历史用户的用户特征，所述负样本包括未被历史用户点击的资源的资源特征，所述资源池至少包含所述召回队列中的资源。采用该种方案，实现服务器训练粗排模型的目的。

一种可行的设计中，所述粗排模型包括用户神经子网络模型、资源神经网络子模型、交叉特征子模型和粗排分计算子模型，所述利用所述正样本、所述负样本和所述历史用户的用户特征，训练所述用户神经子网络模型、所述资源神经网络子模型、所述交叉特征子模型和所述粗排分计算子模型，包括：利用所述历史用户的用户特征作训练所述用户神经子网络模型，利用将所述正样本和/或所述负样本训练所述资源神经网络子模型，利用所述历史用户的用户特征和所述资源池中资源的资源特征训练所述交叉特征子模型，利用所述用户神经子网络模型输出的用户向量、所述资源神经网络子模型输出的资源向量和所述交叉特征子模型输出的交叉特征向量训练所述粗排分计算子模型。采用该种方案，实现服务器训练粗排模型的目的。

一种可行的设计中，所述资源特征包括下述特征中的至少一个：资源分类、资源发布时间、资源作者；所述用户特征包括下述特征中的至少一个：用户年龄、请求时间、兴趣点、经纬度；所述交叉特征包括下述特征中的至少一个：用户和资源分类匹配的个数、用户与资源匹配的兴趣点的名称。

第二方面，本申请实施例提供一种资源推荐装置，包括：

处理模块，用于在接收到终端设备发送的推荐请求后，根据召回方式确定召回队列，所述召回队列包含至少一个资源，所述推荐请求是所述终端设备响应目标用户的刷新指令生成的；

第一确定模块，用于对于召回队列中的资源，利用所述资源的资源特征和所述目标用户的用户特征，确定所述资源的交叉特征向量，所述交叉特征向量用于指示所述目标用户与所述资源的匹配程度；

第二确定模块，用于将所述资源的交叉特征向量和所述用户的用户向量输入至粗排模型，以得到所述召回队列的资源的粗排分，所述粗排分指示所述目标用户点击所述资源的概率，所述用户向量用于指示所述用户的特征；

第三确定模块，用于根据所述召回队列中的资源的粗排分，确定在所述推荐页面待显示的待推荐资源。

一种可行的设计中，所述第一确定模块，用于对于召回队列中的资源，将所述资源的资源特征和所述目标用户的用户特征，输入至所述交叉特征子模型，运行所述交叉特征子模型，以输出所述资源的交叉特征向量，所述召回队列中资源的资源特征是预先获取到的。

一种可行的设计中，所述处理模块，在接收到终端设备发送的推荐请求后，根据召回方式确定召回队列之前，还离线获取资源池中资源的资源特征集合，从所述资源池中确定出所述召回队列中的资源，从所述资源特征集合中确定出所述召回队列中资源的资源特征。

一种可行的设计中，所述处理模块，在接收到终端设备发送的推荐请求后，根据召回方式确定召回队列之前，还根据所述目标用户的点击记录，确定所述目标用户的用户特征。

一种可行的设计中，所述处理模块，在接收到终端设备发送的推荐请求后，根据召回方式确定召回队列之前，还根据点展日志从资源池中确定出被历史用户点击过的资源，以及未被历史用户点击过的资源，所述点展日志用于记录所述资源池中资源的资源特征，以及所述历史用户的用户特征，利用正样本和负样本训练所述粗排模型，所述正样本包括被历史用户点击过的资源的资源特征和所述历史用户的用户特征，所述负样本包括未被历史用户点击的资源的资源特征，所述资源池至少包含所述召回队列中的资源。

一种可行的设计中，所述粗排模型包括用户神经子网络模型、资源神经网络子模型、交叉特征子模型和粗排分计算子模型，所述处理模块在利用所述正样本、所述负样本和所述历史用户的用户特征，训练所述用户神经子网络模型、所述资源神经网络子模型、所述交叉特征子模型和所述粗排分计算子模型时，利用所述历史用户的用户特征作训练所述用户神经子网络模型，利用将所述正样本和/或所述负样本训练所述资源神经网络子模型，利用所述历史用户的用户特征和所述资源池中资源的资源特征训练所述交叉特征子模型，利用所述用户神经子网络模型输出的用户向量、所述资源神经网络子模型输出的资源向量和所述交叉特征子模型输出的交叉特征向量训练所述粗排分计算子模型。

第三方面、本申请实施例提供一种电子设备，包括：

至少一个处理器；以及

与所述至少一个处理器通信连接的存储器；其中，

所述存储器存储有可被所述至少一个处理器执行的指令，所述指令被所述至少一个处理器执行，以使所述至少一个处理器能够执行第一方面或第一方面任意可能实现的方法。

第四方面，本申请实施例提供一种包含指令的计算机程序产品，当其在电子设备上运行时，使得电子设备计算机执行上述第一方面或第一方面的各种可能的实现方式中的方法。

第五方面，本申请实施例提供一种存储有计算机指令的非瞬时计算机可读存储介质，所述非瞬时计算机可读存储介质中存储有指令，当其在电子设备上运行时，使得电子设备执行如上述第一方面或第一方面的各种可能的实现方式中的方法。

第六方面，本申请实施例提供一种资源推荐方法，包括：

将所述目标用户的用户特征输入至粗排模型包含的户神经网络模型，得到所述目标用户的用户向量；对于所述召回队列中的每一条资源，将对应资源的交叉特征向量、资源向量和所述目标用户的用户向量输入至所述粗排模型包含的粗排分计算子模型，以得到对应资源的粗排分，所述召回队列中不同的资源对应不同的资源向量；根据所述召回队列中每一条资源的粗排分，确定待推荐资源。

上述申请中的一个实施例具有如下优点或有益效果：服务器接收到终端设备发送的推荐请求后，对于召回队列中的每一条资源，分别确定对应资源的交叉特征向量，并利用资源对应资源向量和交叉特征向量和用户向量，分别确定各资源的粗排分，利用粗排分对各资源进行排序从而确定出待推荐资源并推荐给目标用户。采用该种方案，服务器利用加入用户和资源的交叉特征的粗排模型对召回队列召回的资源排序，取得高准确率的同时节约机器，从而达到资源推荐过程中提升准确度的同时节约机器的目的。

上述可选方式所具有的其他效果将在下文中结合具体实施例加以说明。

附图说明

附图用于更好地理解本方案，不构成对本申请的限定。其中：

图1是FEED推荐系统的架构实体图；

图2是本申请实施例提供的资源推荐方法的应用环境示意图；

图3是本申请实施例提供的资源推荐方法的流程图；

图4是本申请实施例提供的资源推荐方法中用户发出刷新指令的示意图；

图5是本申请实施例提供的资源推荐方法所适用的粗排模型的示意图；

图6是本申请实施例提供的资源推荐方法中粗排模型的离线和在线的架构示意图；

图7为本申请实施例提供的资源推荐装置的结构示意图；

图8是用来实现本申请实施例的资源推荐方法的电子设备的框图。

具体实施方式

以下结合附图对本申请的示范性实施例做出说明，其中包括本申请实施例的各种细节以助于理解，应当将它们认为仅仅是示范性的。因此，本领域普通技术人员应当认识到，可以对这里描述的实施例做出各种改变和修改，而不会背离本申请的范围和精神。同样，为了清楚和简明，以下的描述中省略了对公知功能和结构的描述。

目前，资源推荐过程中，排序(rank)是推荐算法中的重要功能模块，负责将召回队列返回的资源，按照一定的规则进行排序。例如，FEED推荐系统中，召回队列包括新热队列、ucf队列等，新热队列负载召回最新最热的资源，ucf队列负责召回相似用户阅读过的资源、视频队列只召回视频资源。召回队列召回资源后，各个召回队列的资源分别经过粗排后，汇聚在一起进行精排，最终将精排后排名靠前的资源推荐给用户。粗排过程中，按照一定目标对召回队列召回的资源进行排序，目标是指按照预估的用户点击率等进行排序。每个召回队列根据粗排分排序选择出TOP N的资源，统计汇聚到一起。汇聚后的资源再请求精排，进行更加细致的排序。粗排相当于对资源进行第一次排序，针对的资源是召回队列召回的资源；精排相当于对资源进行第二词排序，针对的资源是经过粗排后，各个队列TOP N的资源，粗排面对的资源量远远大于精排。粗排和精排的区别在于：精排使用的模型特征较多，而且使用了大量的用户与资源之间的交叉特征，预估准确性更高，但是模型更加复杂，模型的性能开销更大，需要耗费更多的机器才能满足模型的正常预估。

粗排过程中，由于召回队列召回的资源很大，一般都在几千条甚至更多，因此，粗排除了要保证预估的精确性外，还要保证模型的性能能够承受大量的预估需求。粗排的预估准确性和性能同样重要。常见的粗排模型包括GBDT模型和DNN模型，其中，GBDT模型被大量运用在竞价排名广告和FEED信息流点击通过率(Click-Through-Rate，CTR)的预估过程中。在线上使用时，相较于DNN模型，GBDT模型的计算复杂度较低，运行该模型所需的机器数量也更少。随着计算机运行能力的加强，DNN模型也逐渐被用于解决排序问题。DNN模型模拟人脑对数据的处理过程，对于数据特征的学习能力更强，并且对于一个复杂的优化问题，可以快速找到问题的优化解。

然而，GBDT模型和DNN模型无法同时兼顾预估准确性和机器开销的问题。这是因为对于GBDT模型而言，由于粗排时多个召回队列公用一个GBDT模型，并不需要针对每个队列训练各自的模型进行排序，因此GBDT模型能够在很大程度上节约机器，但是，GBDT模型的准确性很差。对于DNN模型而言，虽然其预估准确率很高，适合用于数据量大的FEED信息流的推荐场景，但是DNN模型对机器的消耗过大。若对召回队列召回的每条资源计算粗排分，则会导致模型运行速度很慢。若要保证模型的正常预估，只能大量的添加机器。

有鉴于此，本申请实施例提供一种资源推荐方法，利用加入用户和资源的交叉特征的粗排模型对召回队列召回的资源排序，取得高准确率的同时节约机器，从而达到资源推荐过程中提升准确度的同时节约机器的目的。

图2是本申请实施例提供的资源推荐方法的应用环境示意图。请参照图2，该应用环境包括终端设备1和服务器2，终端设备1和服务器通过网络建立连接。其中，服务器2上加载粗排模型，并且服务器2本地存储资源池中的各个资源的资源特征和资源向量。用户进行刷新时，触发终端设备1向服务器2发送推荐请求，服务器根据用户的用户特征确定出用户向量，对于召回队列中的每一条资源，服务器利用用户特征和对应资源的资源特征确定出交叉特征向量，进而利用用户向量、资源向量和该资源向量对应的交叉特征向量得到粗排分。也就是说，服务器确定出召回队列中的每个资源的粗排分，根据粗排分对召回队列中的资源进行排序，从而完成粗排。之后，多个召回队列中每个召回队列根据粗排分排序选择出TOPN的资源，统计汇聚到一起。汇聚后的资源再请求精排，进行更加细致的排序。最终将精排后的TOP M个资源推荐给目标用户。

图2中，终端设备1可以为台式终端或移动终端，台式终端可以为电脑等，移动终端可以为手机、平板电脑、笔记本电脑等，服务器可以是独立的服务器或者多个服务器组成的服务器集群等。

图3是本申请实施例提供的资源推荐方法的流程图，本实施例是从服务器的角度对上述的资源推荐方法进行详细说明的，本实施例包括：

101、接收终端设备发送的推荐请求。

其中，所述推荐请求是所述终端设备响应目标用户的刷新指令生成的。

用户使用APP或网页时，需要对页面进行刷新时，向终端设备发出刷新指令。示例性的，请参照图4，图4是本申请实施例提供的资源推荐方法中用户发出刷新指令的示意图。请参照图4，初始时，浏览器的页面上显示资源a～资源e。用户在终端设备的屏幕上按压并下拉，页面上出现下拉刷新字样，从而触发终端设备向服务器发送推荐请求。之后，服务器将新的资源发送给终端设备，终端设备接收并展示。该新的资源例如为资源f～资源j。其中，资源可以是视频、文本、图片、链接等。

102、根据召回方式确定召回队列，所述召回队列包含至少一个资源。

示例性的，召回方式可以是新热召回方式、视频召回方式等，其中，新热召回方式召回的是最新最热的资源，视频召回方式召回的是视频资源，召回方式可以是预先设置好的，或者服务器随机选择的。

终端设备在向服务器发送推荐请求时，同时将目标用户的用户特征发送给服务器，用户特征可以是用户的年龄、兴趣点、用户性别、刷新时间等。或者，终端设备也可以将目标用户的身份标识发送给服务器，服务器根据该身份标识和目标用户的点击记录等，确定出该目标用户的用户特征。

103、对于召回队列中的资源，利用所述资源的资源特征和所述目标用户的用户特征，确定所述资源的交叉特征向量。

其中，所述交叉特征向量用于指示所述目标用户与所述资源的匹配程度。

本申请实施例中，服务器本地或与服务器连接的数据库中存储几百万条甚至更多的资源，用户进行页面刷新时，触发各个召回队列召回资源，各召回队列的召回规则不同。例如，新热队列只召回最新最热的资源，视频队列仅召回视频资源。之后，对于每个召回队列召回的每一条资源，服务器利用该资源的资源特征和用户特征，确定资源的交叉特征向量。例如，新热队列召回1000条资源，服务器确定出1000个交叉特征向量，视频队列召回1000条资源，服务器同样确定出每个视频资源对应的交叉特征向量。

本申请实施例中，预先离线训练好资源池中每个资源的资源特征并存储，从而得到资源特征集合，同时训练出每个资源的资源向量。目标用户请求刷新的时候，即在线时，服务器根据召回方式得到召回队列后，就可以确定出资源向量，并从资源池中确定出召回队列中的资源，进而从资源特征集合中确定出召回队列中资源的资源特征。这样做的好处是：由于资源池中的资源数量庞大，离线算好资源特征，避免在线时计算量大，导致消耗机器过多的弊端。

得到召回队列中每个资源的资源特征后，对于召回队列中的每个资源，将该资源的资源特征和目标用户的用户特征输入至粗排模型包括的交叉特征子模型中，运行该交叉特征子模型，从而得到召回队列中每个资源的交叉特征向量。采用该种方案，离线算好资源特征，在线时利用资源特征和目标用户的用户特征，即可快速得到交叉特征向量。

104、将所述资源的交叉特征向量、所述资源的资源向量和所述用户的用户向量输入至粗排模型，以得到所述召回队列的资源的粗排分。

其中，所述召回队列中不同的资源对应不同的资源向量，所述粗排分指示所述目标用户点击所述资源的概率，所述资源向量用于指示所述资源的特征，所述用户向量用于指示所述用户的特征。

示例性的，服务器上预先加载粗排模型，并且，服务器上本地或与服务器连接的数据库中被写入召回队列中每条资源的资源向量和资源特征。因此，对于召回队列中的每一条资源，将该资源的资源向量、交叉特征向量以及用户向量输入至该粗排模型，得到一个粗排分，对每条资源进行同样的操作，从而得到每条资源对应的粗排分。对于一条具体的资源而言，该资源对应的粗排分用于指示目标用户点击该资源的概率，即预估目标用户可能点击该资源的概率的大小。该过程中，服务器并未针对每条资源计算资源向量，而是利用预先训练好的资源向量，避免由于资源过多导致服务器的机器开销大的问题。

105、根据所述召回队列中的资源的粗排分，确定在所述推荐页面待显示的待推荐资源。

示例性的，服务器根据各资源的粗排分从大到小的顺序，对各资源进行排序，排名越靠前说明该资源被用户点击的概率越大。因此，服务器将粗排后TOP M的资源推荐给终端设备。其中，M≥1。

另外，粗排后，还可以进一步的进行精排，将精排后的资源推荐给目标用户。此时，服务器按照各资源的粗排分从高到低的顺序，对召回队列中的资源排序后，从排序后的资源中确定出排名靠前的、第一数量的资源，如TOP N的资源；之后，对第一数量的资源精排序，将排序后的资源中排名靠前的第二数量的资源作为所述待推荐资源，比如，将TOP M的资源作为待推荐资源。其中，M和N均为整数，N和M的相对大小不受限制。

示例性的，召回队列包括新热队列和视频队列，该两个队列召回的资源进过粗排后，服务器从新热队列中选择出排名前十的资源，从视频队列中选择出排名前10的，对该20条资源进行精排，得到该20条资源的精排分，按照该20条资源的精排分从高到底的顺序，选择出10条资源作为待推荐资源。

106、向所述终端设备发送推荐响应，所述推荐响应携带所述待推荐资源。

示例性的，服务器通过数据网、固定宽度网络等向终端设备发送携带待推荐资源的推荐响应。终端设备接收到该推荐响应后，利用该些资源刷新页面并展示刷新后的页面。

本申请示例提供的资源推荐方法，服务器接收到终端设备发送的推荐请求后，对于召回队列中的每一条资源，分别确定对应资源的交叉特征向量，并利用资源对应资源向量和交叉特征向量和用户向量，分别确定各资源的粗排分，利用粗排分对各资源进行排序从而确定出待推荐资源并推荐给目标用户。采用该种方案，服务器利用加入用户和资源的交叉特征的粗排模型对召回队列召回的资源排序，取得高准确率的同时节约机器，从而达到资源推荐过程中提升准确度的同时节约机器的目的。

下面，对上述实施例中的粗排模型进行详细说明。示例性的，请参照图5和图6。

图5是本申请实施例提供的资源推荐方法所适用的粗排模型的示意图。请参照图5，该粗排模型包括3个DNN塔和一个全连接的DNN小网络，3个DNN塔分别为用户神经子网络模型、资源神经网络子模型、交叉特征子模型，全连接的小网络为粗排分计算子模型。其中，用户神经子网络模型和资源神经网络子模型均为全连接网络，用户神经子网络模型包含6层，分别为H1～H6，各层神经元的个数依次为512、256、128、128、128、32；同理，资源神经网络子模型包含6层，分别为H1～H6，神经元的个数依次为512、256、128、128、128、32。全连接的小网络包含3层，分别为H1～H3，各层神经元的个数依次为128、64、1，全连接的小网络还包括一个神经网络的激活函数simoid以及loos函数。需要说明的是，本申请实施例并不限制用户神经子网络模型、资源神经网络子模型、交叉特征子模型以及粗排分计算子模型的结构。

图6是本申请实施例提供的资源推荐方法中粗排模型的离线和在线的架构示意图，离线指训练粗排模型的过程，在线指适用粗排模型的过程。粗排模型训练过程中，根据点展日志从资源池中确定出被历史用户点击过的资源，以及未被历史用户点击过的资源，所述点展日志用于记录所述资源池中资源的资源特征，以及所述历史用户的用户特征，利用正样本和负样本训练所述粗排模型，所述正样本包括被历史用户点击过的资源的资源特征和所述历史用户的用户特征，所述负样本包括未被历史用户点击的资源的资源特征，所述资源池至少包含所述召回队列中的资源。

示例性的，模型训练过程实际上是一个不断优化模型参数，得到最优模型的过程。训练过程中，服务器读取点展日志，该点展日志中存储历史用户的用户特征和资源特征，用户特征包括用户年龄、性别、经纬度位置、兴趣点等，资源特征包括资源的发布时间、类型等。对于资源池中的每一个资源，若历史用户点击过该资源，则点展日志中记录了该点击的相关信息。服务器将历史用户点击过的资源作为正样本，将未被历史用户点击过的资源作为负样本。因此，服务器读取点展日志可以确定出被历史用户点击过的资源，以及未被历史用户点击过的资源。然后，服务器根据被历史用户点击过的资源的资源特征和所述历史用户的用户特征确定正样本，根据未被历史用户点击的资源的资源特征确定负样本，所述资源池至少包含所述召回队列中的资源，所述点展日志用于记录所述资源池中资源的资源特征，以及所述历史用户的用户特征。最后，服务器利用所述正样本和所述负样本训练所述用户神经子网络模型、所述资源神经网络子模型、所述交叉特征子模型和所述粗排分计算子模型。

服务器利用正样本和负样本训练粗排模型时，利用所述历史用户的用户特征作训练所述用户神经子网络模型，利用将所述正样本和/或所述负样本训练所述资源神经网络子模型，利用所述历史用户的用户特征和所述资源池中资源的资源特征训练所述交叉特征子模型，利用所述用户神经子网络模型输出的用户向量、所述资源神经网络子模型输出的资源向量和所述交叉特征子模型输出的交叉特征向量训练所述粗排分计算子模型。

示例性的，对于正样本，服务器将该正样本对应的资源的资源特征作为资源神经网络子模型的输入，将点击该资源的历史用户的用户特征作为用户神经子网络模型的输入，将该资源特征和历史用户特征作为交叉神经网络模型的输入，进而将该三个模型的输出作为粗排分计算子模型的输入。对于负样本，服务器将该负样本的资源特征作为资源神经网络子模型的输入，将预设的用户特征作为用户神经子网络模型的输入，将该资源特征和预设的用户特征作为交叉神经网络模型的输入，进而将该三个模型的输出作为粗排分计算子模型的输入。

其中，用户神经子网络模型以用户特征作为输入，输出用户向量，用户向量用于代表用户，其中，用户特征可以是用户年龄、请求时间或用户兴趣点等。资源神经网络子模型以资源特征作为输入，输出资源向量，资源向量用于代表资源，其中，资源特征包括资源发布时间、资源类型、资源所属分类等。交叉特征子模型以用户特征和资源特征作为输入，输出是交叉特征向量，交叉特征向量用于指示所述目标用户与所述资源的匹配程度。例如，用户的兴趣点是军事和体育，资源包括体育新闻、军事新闻和明星娱乐新闻，则交叉特征包括用户和资源分类匹配的个数，且该分类个数为2个，交叉特征还包括用户和资源分类匹配的兴趣点的名称，该名称是军事和体育。

再请参照图6，离线部分得到的是粗排模型、资源池中各资源的资源向量和资源特征。服务器将该资源池中每一条资源分别对应资源向量和资源特征存储在本地或与该服务器连接的数据库中。之所以在离线时候生成各个资源的资源向量，是因为召回队列召回的资源一般都在几千条，若全部依次输入资源神经网络子模型则导致机器开销大。因此，在离线时候就确定出每个资源的资源向量，使得在线时不用针对每条资源都计算一遍资源向量，线上使用的时候字节从资源向量池中查询资源向量即可，省去了计算资源向量的时间，并降低了机器开销。

再请参照图6，在线部分，服务器使用训练好的粗排模型，根据目标用户的用户特征确定目标用户的用户特征，由于每个推荐请求来自一个用户，因此只需要计算一次用户向量。虽然召回队列每次召回的资源有几千条，但是服务器无需在线计算资源向量，只需要从离线计算好的资源向量中查询资源向量即可。对于每条资源，该资源对应的粗排分表示目标用户可能点击该资源的概率，服务器按照粗排分从大到小的顺序，对各资源进行排序，排名越靠前说明该资源被用户点击的概率越大。因此，服务器将粗排后TOP N的资源返回给上游模块，即汇聚模块，汇聚模块汇聚多个召回队列返回的TOP N的资源，并对该些资源进行精排。

上述介绍了本申请实施例提到的资源推荐方法的具体实现，下述为本申请装置实施例，可以用于执行本申请方法实施例。对于本申请装置实施例中未披露的细节，请参照本申请方法实施例。

图7为本申请实施例提供的资源推荐装置的结构示意图。该装置可以集成在电子设备中或通过电子设备实现，电子设备可以终端设备或服务器等。如图7所示，在本实施例中，该资源推荐装置100可以包括：

处理模块11，用于在接收到终端设备发送的推荐请求后，根据召回方式确定召回队列，所述召回队列包含至少一个资源，所述推荐请求是所述终端设备响应目标用户的刷新指令生成的；

第一确定模块12，用于对于召回队列中的资源，利用所述资源的资源特征和所述目标用户的用户特征，确定所述资源的交叉特征向量，所述交叉特征向量用于指示所述目标用户与所述资源的匹配程度；

第二确定模块13，用于将所述资源的交叉特征向量和所述用户的用户向量输入至粗排模型，以得到所述召回队列的资源的粗排分，所述粗排分指示所述目标用户点击所述资源的概率，所述用户向量用于指示所述用户的特征；

第三确定模块14，用于根据所述召回队列中的资源的粗排分，确定在所述推荐页面待显示的待推荐资源。

一种可行的设计中，所述第一确定模块12，用于对于召回队列中的资源，将所述资源的资源特征和所述目标用户的用户特征，输入至所述交叉特征子模型，运行所述交叉特征子模型，以输出所述资源的交叉特征向量，所述召回队列中资源的资源特征是预先获取到的。

一种可行的设计中，所述处理模块11，在接收到终端设备发送的推荐请求后，根据召回方式确定召回队列之前，还离线获取资源池中资源的资源特征集合，从所述资源池中确定出所述召回队列中的资源，从所述资源特征集合中确定出所述召回队列中资源的资源特征。

一种可行的设计中，所述处理模块11，在接收到终端设备发送的推荐请求后，根据召回方式确定召回队列之前，还根据所述目标用户的点击记录，确定所述目标用户的用户特征。

一种可行的设计中，所述处理模块11，在接收到终端设备发送的推荐请求后，根据召回方式确定召回队列之前，还根据点展日志从资源池中确定出被历史用户点击过的资源，以及未被历史用户点击过的资源，所述点展日志用于记录所述资源池中资源的资源特征，以及所述历史用户的用户特征，利用正样本和负样本训练所述粗排模型，所述正样本包括被历史用户点击过的资源的资源特征和所述历史用户的用户特征，所述负样本包括未被历史用户点击的资源的资源特征，所述资源池至少包含所述召回队列中的资源。

一种可行的设计中，所述粗排模型包括用户神经子网络模型、资源神经网络子模型、交叉特征子模型和粗排分计算子模型，所述处理模块11在利用所述正样本、所述负样本和所述历史用户的用户特征，训练所述用户神经子网络模型、所述资源神经网络子模型、所述交叉特征子模型和所述粗排分计算子模型时，利用所述历史用户的用户特征作训练所述用户神经子网络模型，利用将所述正样本和/或所述负样本训练所述资源神经网络子模型，利用所述历史用户的用户特征和所述资源池中资源的资源特征训练所述交叉特征子模型，利用所述用户神经子网络模型输出的用户向量、所述资源神经网络子模型输出的资源向量和所述交叉特征子模型输出的交叉特征向量训练所述粗排分计算子模型。

本申请实施例提供的装置，可用于如上实施例中电子设备执行的方法，其实现原理和技术效果类似，在此不再赘述。

根据本申请的实施例，本申请还提供了一种电子设备和一种可读存储介质。

图8是用来实现本申请实施例的资源推荐方法的电子设备的框图。电子设备旨在表示各种形式的数字计算机，诸如，膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备还可以表示各种形式的移动装置，诸如，个人数字处理、蜂窝电话、智能电话、可穿戴设备和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例，并且不意在限制本文中描述的和/或者要求的本申请的实现。

如图8所示，该电子设备包括：一个或多个处理器21、存储器22，以及用于连接各部件的接口，包括高速接口和低速接口。各个部件利用不同的总线互相连接，并且可以被安装在公共主板上或者根据需要以其它方式安装。处理器可以对在电子设备内执行的指令进行处理，包括存储在存储器中或者存储器上以在外部输入/输出装置(诸如，耦合至接口的显示设备)上显示GUI的图形信息的指令。在其它实施方式中，若需要，可以将多个处理器和/或多条总线与多个存储器和多个存储器一起使用。同样，可以连接多个电子设备，各个设备提供部分必要的操作(例如，作为服务器阵列、一组刀片式服务器、或者多处理器系统)。图8中以一个处理器21为例。

存储器22即为本申请所提供的非瞬时计算机可读存储介质。其中，所述存储器存储有可由至少一个处理器执行的指令，以使所述至少一个处理器执行本申请所提供的资源推荐方法。本申请的非瞬时计算机可读存储介质存储计算机指令，该计算机指令用于使计算机执行本申请所提供的资源推荐方法。

存储器22作为一种非瞬时计算机可读存储介质，可用于存储非瞬时软件程序、非瞬时计算机可执行程序以及模块，如本申请实施例中的资源推荐方法对应的程序指令/模块(例如，附图7所示的处理模块11、第一确定模块12、第二确定模块13和第三确定模块14)。处理器21通过运行存储在存储器22中的非瞬时软件程序、指令以及模块，从而执行服务器的各种功能应用以及数据处理，即实现上述方法实施例中的资源推荐方法。

存储器22可以包括存储程序区和存储数据区，其中，存储程序区可存储操作系统、至少一个功能所需要的应用程序；存储数据区可存储根据资源推荐电子设备的使用所创建的数据等。此外，存储器22可以包括高速随机存取存储器，还可以包括非瞬时存储器，例如至少一个磁盘存储器件、闪存器件、或其他非瞬时固态存储器件。在一些实施例中，存储器22可选包括相对于处理器21远程设置的存储器，这些远程存储器可以通过网络连接至资源推荐电子设备。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。

用于资源推荐方法的电子设备还可以包括：输入装置23和输出装置24。处理器21、存储器22、输入装置23和输出装置24可以通过总线或者其他方式连接，图8中以通过总线连接为例。

输入装置23可接收输入的数字或字符信息，以及产生与资源推荐电子设备的用户设置以及功能控制有关的键信号输入，例如触摸屏、小键盘、鼠标、轨迹板、触摸板、指示杆、一个或者多个鼠标按钮、轨迹球、操纵杆等输入装置。输出装置24可以包括显示设备、辅助照明装置(例如，LED)和触觉反馈装置(例如，振动电机)等。该显示设备可以包括但不限于，液晶显示器(LCD)、发光二极管(LED)显示器和等离子体显示器。在一些实施方式中，显示设备可以是触摸屏。

此处描述的系统和技术的各种实施方式可以在数字电子电路系统、集成电路系统、专用ASIC(专用集成电路)、计算机硬件、固件、软件、和/或它们的组合中实现。这些各种实施方式可以包括：实施在一个或者多个计算机程序中，该一个或者多个计算机程序可在包括至少一个可编程处理器的可编程系统上执行和/或解释，该可编程处理器可以是专用或者通用可编程处理器，可以从存储系统、至少一个输入装置、和至少一个输出装置接收数据和指令，并且将数据和指令传输至该存储系统、该至少一个输入装置、和该至少一个输出装置。

这些计算程序(也称作程序、软件、软件应用、或者代码)包括可编程处理器的机器指令，并且可以利用高级过程和/或面向对象的编程语言、和/或汇编/机器语言来实施这些计算程序。如本文使用的，术语“机器可读介质”和“计算机可读介质”指的是用于将机器指令和/或数据提供给可编程处理器的任何计算机程序产品、设备、和/或装置(例如，磁盘、光盘、存储器、可编程逻辑装置(PLD))，包括，接收作为机器可读信号的机器指令的机器可读介质。术语“机器可读信号”指的是用于将机器指令和/或数据提供给可编程处理器的任何信号。

为了提供与用户的交互，可以在计算机上实施此处描述的系统和技术，该计算机具有：用于向用户显示信息的显示装置(例如，CRT(阴极射线管)或者LCD(液晶显示器)监视器)；以及键盘和指向装置(例如，鼠标或者轨迹球)，用户可以通过该键盘和该指向装置来将输入提供给计算机。其它种类的装置还可以用于提供与用户的交互；例如，提供给用户的反馈可以是任何形式的传感反馈(例如，视觉反馈、听觉反馈、或者触觉反馈)；并且可以用任何形式(包括声输入、语音输入或者、触觉输入)来接收来自用户的输入。

可以将此处描述的系统和技术实施在包括后台部件的计算系统(例如，作为数据服务器)、或者包括中间件部件的计算系统(例如，应用服务器)、或者包括前端部件的计算系统(例如，具有图形用户界面或者网络浏览器的用户计算机，用户可以通过该图形用户界面或者该网络浏览器来与此处描述的系统和技术的实施方式交互)、或者包括这种后台部件、中间件部件、或者前端部件的任何组合的计算系统中。可以通过任何形式或者介质的数字数据通信(例如，通信网络)来将系统的部件相互连接。通信网络的示例包括：局域网(LAN)、广域网(WAN)和互联网。

计算机系统可以包括客户端和服务器。客户端和服务器一般远离彼此并且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端-服务器关系的计算机程序来产生客户端和服务器的关系。

本申请实施例还提供一种资源推荐方法，该方法中，将所述目标用户的用户特征输入至粗排模型包含的户神经网络模型，得到所述目标用户的用户向量；对于所述召回队列中的每一条资源，将对应资源的交叉特征向量、资源向量和所述目标用户的用户向量输入至所述粗排模型包含的粗排分计算子模型，以得到对应资源的粗排分，所述召回队列中不同的资源对应不同的资源向量；根据所述召回队列中每一条资源的粗排分，确定待推荐资源。

根据本申请实施例的技术方案，服务器接收到终端设备发送的推荐请求后，对于召回队列中的每一条资源，分别确定对应资源的交叉特征向量，并利用资源对应资源向量和交叉特征向量和用户向量，分别确定各资源的粗排分，利用粗排分对各资源进行排序从而确定出待推荐资源并推荐给目标用户。采用该种方案，服务器利用加入用户和资源的交叉特征的粗排模型对召回队列召回的资源排序，取得高准确率的同时节约机器，从而达到资源推荐过程中提升准确度的同时节约机器的目的。

应该理解，可以使用上面所示的各种形式的流程，重新排序、增加或删除步骤。例如，本发申请中记载的各步骤可以并行地执行也可以顺序地执行也可以不同的次序执行，只要能够实现本申请公开的技术方案所期望的结果，本文在此不进行限制。

上述具体实施方式，并不构成对本申请保护范围的限制。本领域技术人员应该明白的是，根据设计要求和其他因素，可以进行各种修改、组合、子组合和替代。任何在本申请的精神和原则之内所作的修改、等同替换和改进等，均应包含在本申请保护范围之内。

Claims

1.一种资源推荐方法，其特征在于，包括：

接收到终端设备发送的推荐请求后，根据召回方式确定召回队列，所述召回队列包含至少一个资源，所述推荐请求是所述终端设备响应目标用户的刷新指令生成的；

对于召回队列中的资源，利用所述资源的资源特征和所述目标用户的用户特征，确定所述资源的交叉特征向量，所述交叉特征向量用于指示所述目标用户与所述资源的匹配程度；

将所述资源的交叉特征向量、所述资源的资源向量和所述用户的用户向量输入至粗排模型，以得到所述召回队列的资源的粗排分，所述粗排分指示所述目标用户点击所述资源的概率，所述用户向量用于指示所述用户的特征，其中，所述粗排模型为深度神经网络模型，包括用户神经子网络模型、资源神经网络子模型、交叉特征子模型和粗排分计算子模型，所述粗排分计算子模型为利用所述用户神经子网络模型输出的用户向量、所述资源神经网络子模型输出的资源向量和所述交叉特征子模型输出的交叉特征向量训练得到的；

根据所述召回队列中的资源的粗排分，确定在推荐页面待显示的待推荐资源。

2.根据权利要求1所述的方法，其特征在于，所述粗排模型包括交叉特征子模型，所述对于召回队列中的资源，利用所述资源的资源特征和所述目标用户的用户特征，确定所述资源的交叉特征向量，包括：

对于召回队列中的资源，将所述资源的资源特征和所述目标用户的用户特征，输入至所述交叉特征子模型；

运行所述交叉特征子模型，以输出所述资源的交叉特征向量，所述召回队列中资源的资源特征是预先获取到的。

3.根据权利要求1所述的方法，其特征在于，所述接收到终端设备发送的推荐请求后，根据召回方式确定召回队列之前，还包括：

离线获取资源池中资源的资源特征集合；

从所述资源池中确定出所述召回队列中的资源；

从所述资源特征集合中确定出所述召回队列中资源的资源特征。

4.根据权利要求1所述的方法，其特征在于，所述接收到终端设备发送的推荐请求后，根据召回方式确定召回队列之前，还包括：

根据所述目标用户的点击记录，确定所述目标用户的用户特征。

5.根据权利要求1～4任一项所述的方法，其特征在于，所述接收到终端设备发送的推荐请求后，根据召回方式确定召回队列之前，还包括：

根据点展日志从资源池中确定出被历史用户点击过的资源，以及未被历史用户点击过的资源，所述点展日志用于记录所述资源池中资源的资源特征，以及所述历史用户的用户特征；

利用正样本和负样本训练所述粗排模型，所述正样本包括被历史用户点击过的资源的资源特征和所述历史用户的用户特征，所述负样本包括未被历史用户点击的资源的资源特征，所述资源池至少包含所述召回队列中的资源。

6.根据权利要求5所述的方法，其特征在于，所述利用所述正样本、所述负样本和所述历史用户的用户特征，训练所述用户神经子网络模型、所述资源神经网络子模型、所述交叉特征子模型和所述粗排分计算子模型，包括：

利用所述历史用户的用户特征作训练所述用户神经子网络模型；

利用将所述正样本和/或所述负样本训练所述资源神经网络子模型；

利用所述历史用户的用户特征和所述资源池中资源的资源特征训练所述交叉特征子模型；

利用所述用户神经子网络模型输出的用户向量、所述资源神经网络子模型输出的资源向量和所述交叉特征子模型输出的交叉特征向量训练所述粗排分计算子模型。

7.根据权利要求1～4任一项所述的方法，其特征在于，

所述资源特征包括下述特征中的至少一个：资源分类、资源发布时间、资源作者；

所述用户特征包括下述特征中的至少一个：用户年龄、请求时间、兴趣点、经纬度；

所述交叉特征包括下述特征中的至少一个：用户和资源分类匹配的个数、用户与资源匹配的兴趣点的名称。

8.一种资源推荐装置，其特征在于，包括：

第二确定模块，用于将所述资源的交叉特征向量和所述用户的用户向量输入至粗排模型，以得到所述召回队列的资源的粗排分，所述粗排分指示所述目标用户点击所述资源的概率，所述用户向量用于指示所述用户的特征，其中，所述粗排模型为深度神经网络模型，包括用户神经子网络模型、资源神经网络子模型、交叉特征子模型和粗排分计算子模型，所述粗排分计算子模型为利用所述用户神经子网络模型输出的用户向量、所述资源神经网络子模型输出的资源向量和所述交叉特征子模型输出的交叉特征向量训练得到的；

第三确定模块，用于根据所述召回队列中的资源的粗排分，确定在推荐页面待显示的待推荐资源。

9.一种电子设备，其特征在于，包括：

至少一个处理器；以及

与所述至少一个处理器通信连接的存储器；其中，

所述存储器存储有可被所述至少一个处理器执行的指令，所述指令被所述至少一个处理器执行，以使所述至少一个处理器能够执行权利要求1-7中任一项所述的方法。

10.一种存储有计算机指令的非瞬时计算机可读存储介质，其特征在于，所述计算机指令用于使电子设备执行权利要求1-7中任一项所述的方法。

11.一种资源推荐方法，其特征在于，包括：

将目标用户的用户特征输入至粗排模型包含的用户神经网络模型，得到所述目标用户的用户向量；

将资源的资源特征输入至所述粗排模型包含的资源神经网络子模型，得到所述资源的资源向量；

对于召回队列中的每一条资源，将对应资源的交叉特征向量、资源向量和所述目标用户的用户向量输入至所述粗排模型包含的粗排分计算子模型，以得到对应资源的粗排分，所述召回队列中不同的资源对应不同的资源向量，其中，所述粗排模型为深度神经网络模型，所述粗排分计算子模型为利用所述用户神经子网络模型输出的用户向量、所述资源神经网络子模型输出的资源向量和所述交叉特征子模型输出的交叉特征向量训练得到的；

根据所述召回队列中每一条资源的粗排分，确定待推荐资源。