CN114500642A

CN114500642A - 模型应用方法、装置及电子设备

Info

Publication number: CN114500642A
Application number: CN202210177935.1A
Authority: CN
Inventors: 蒋泽辉; 王一泓; 李健; 华强; 李梓实; 苏东; 廖小超
Original assignee: Beijing Baidu Netcom Science and Technology Co Ltd
Current assignee: Beijing Baidu Netcom Science and Technology Co Ltd
Priority date: 2022-02-25
Filing date: 2022-02-25
Publication date: 2022-05-13

Abstract

本公开提供了一种模型应用方法、装置及电子设备，涉及数据处理技术领域，具体涉及推荐技术领域。具体实现方案为：应用于终端，获取第一用户在信息页面针对N个任务目标的操作信息，N为正整数；将目标数据发送给第一节点，以使得所述第一节点基于训练数据对第一模型进行训练，得到所述第一模型的更新参数数据，所述目标数据包括所述操作信息，所述训练数据包括基于所述目标数据确定的行为数据；接收第二节点发送的推荐信息，所述推荐信息为所述第二节点基于训练好的所述第一模型确定的所述第一用户的推荐信息，所述训练好的所述第一模型的更新参数数据为所述第二节点通过点对点方式从所述第一节点处下载的。

Description

模型应用方法、装置及电子设备

技术领域

本公开涉及数据处理技术领域，尤其涉及推荐技术领域，具体涉及一种模型应用方法、装置及电子设备。

背景技术

近年来随着信息技术的迅速发展，互联网上的信息量越来越多，为了解决信息过载的问题，为用户提供更好的服务，很多应用如短视频、新闻资讯、电子商务等应用上均部署有推荐系统，以进行信息推荐。

目前，推荐系统通常是通过模型来进行信息推荐，且通常是在一节点上训练模型，在另一节点上应用模型，因此，从模型训练完成到模型应用通常需要配送流程，以将模型从一节点配送到另一节点上进行模型应用。

相关技术中，通常是将模型以词典的形式加载到另一节点进行模型应用。

发明内容

本公开提供了一种模型应用方法、装置及电子设备。

根据本公开的第一方面，提供了一种模型应用方法，应用于终端，包括：

获取第一用户在信息页面针对N个任务目标的操作信息，N为正整数；

将目标数据发送给第一节点，以使得所述第一节点基于训练数据对第一模型进行训练，得到所述第一模型的更新参数数据，所述目标数据包括所述操作信息，所述训练数据包括基于所述目标数据确定的行为数据；

接收第二节点发送的推荐信息，所述推荐信息为所述第二节点基于训练好的所述第一模型确定的所述第一用户的推荐信息，所述训练好的所述第一模型的更新参数数据为所述第二节点通过点对点方式从所述第一节点处下载的。

根据本公开的第二方面，提供了一种模型应用方法，应用于第三节点，包括：

接收第二节点发送的第一访问请求，所述第一访问请求用于请求从第一节点处下载第一模型的更新参数数据，所述第一节点为训练所述第一模型的节点，所述更新参数数据是所述第一节点基于训练数据对第一模型进行训练得到，所述训练数据包括目标数据确定的行为数据，所述目标数据包括用户在信息页面针对N个任务目标的操作信息，N为正整数；

响应于所述第一访问请求，控制所述第二节点通过点对点方式从所述第一节点处下载所述更新参数数据，以使所述第二节点基于训练好的所述第一模型针对用户发送推荐信息给所述用户对应的终端，训练好的所述第一模型包括所述更新参数数据。

根据本公开的第三方面，提供了一种模型应用方法，应用于第一节点，包括：

接收终端发送的目标数据，所述目标数据包括用户在信息页面针对N个任务目标的操作信息，N为正整数；

获取训练数据，所述训练数据包括基于所述目标数据确定的行为数据；

基于所述训练数据对第一模型进行训练，得到所述第一模型的更新参数数据；

通过点对点方式向第二节点发送所述更新参数数据，以使所述第二节点基于训练好的所述第一模型针对用户发送推荐信息给所述用户对应的终端，训练好的所述第一模型包括所述更新参数数据。

根据本公开的第四方面，提供了一种模型应用装置，应用于终端，包括：

第一获取模块，用于获取第一用户在信息页面针对N个任务目标的操作信息，N为正整数；

第一发送模块，用于将目标数据发送给第一节点，以使得所述第一节点基于训练数据对第一模型进行训练，得到所述第一模型的更新参数数据，所述目标数据包括所述操作信息，所述训练数据包括基于所述目标数据确定的行为数据；

第一接收模块，用于接收第二节点发送的推荐信息，所述推荐信息为所述第二节点基于训练好的所述第一模型确定的所述第一用户的推荐信息，所述训练好的所述第一模型的更新参数数据为所述第二节点通过点对点方式从所述第一节点处下载的。

根据本公开的第五方面，提供了一种模型应用装置，应用于第三节点，包括：

第二接收模块，用于接收第二节点发送的第一访问请求，所述第一访问请求用于请求从第一节点处下载第一模型的更新参数数据，所述第一节点为训练所述第一模型的节点，所述更新参数数据是所述第一节点基于训练数据对第一模型进行训练得到，所述训练数据包括目标数据确定的行为数据，所述目标数据包括用户在信息页面针对N个任务目标的操作信息，N为正整数；

第一控制模块，用于响应于所述第一访问请求，控制所述第二节点通过点对点方式从所述第一节点处下载所述更新参数数据，以使所述第二节点基于训练好的所述第一模型针对用户发送推荐信息给所述用户对应的终端，训练好的所述第一模型包括所述更新参数数据。

根据本公开的第六方面，提供了一种模型应用装置，应用于第一节点，包括：

第三接收模块，用于接收终端发送的目标数据，所述目标数据包括用户在信息页面针对N个任务目标的操作信息，N为正整数；

第二获取模块，用于获取训练数据，所述训练数据包括基于所述目标数据确定的行为数据；

训练模块，用于基于所述训练数据对第一模型进行训练，得到所述第一模型的更新参数数据；

第二发送模块，用于通过点对点方式向第二节点发送所述更新参数数据，以使所述第二节点基于训练好的所述第一模型针对用户发送推荐信息给所述用户对应的终端，训练好的所述第一模型包括所述更新参数数据。

根据本公开的第七方面，提供了一种电子设备，包括：

至少一个处理器；以及

与至少一个处理器通信连接的存储器；其中，

存储器存储有可被至少一个处理器执行的指令，该指令被至少一个处理器执行，以使至少一个处理器能够执行第一方面中的任一项方法，或者执行第二方面中的任一项方法，或者执行第三方面中的任一项方法。

根据本公开的第八方面，提供了一种存储有计算机指令的非瞬时计算机可读存储介质，该计算机指令用于使计算机执行第一方面中的任一项方法，或者执行第二方面中的任一项方法，或者执行第三方面中的任一项方法。

根据本公开的第九方面，提供了一种计算机程序产品，包括计算机程序，该计算机程序在被处理器执行时实现第一方面中的任一项方法，或者实现第二方面中的任一项方法，或者执行第三方面中的任一项方法。

根据本公开的技术解决了模型从训练到生效的时间比较长的问题，降低了模型从训练到生效的时间，提高了模型应用的时效性。

应当理解，本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征，也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。

附图说明

附图用于更好地理解本方案，不构成对本公开的限定。其中：

图1是根据本公开第一实施例的模型应用方法的流程示意图；

图2是根据本公开第二实施例的模型应用方法的流程示意图；

图3是配送流程的下载机制示意图；

图4是根据本公开第三实施例的模型应用方法的流程示意图；

图5是根据本公开第四实施例的模型应用装置的结构示意图；

图6是根据本公开第五实施例的模型应用装置的结构示意图；

图7是根据本公开第六实施例的模型应用装置的结构示意图；

图8是用来实施本公开的实施例的示例电子设备的示意性框图。

具体实施方式

以下结合附图对本公开的示范性实施例做出说明，其中包括本公开实施例的各种细节以助于理解，应当将它们认为仅仅是示范性的。因此，本领域普通技术人员应当认识到，可以对这里描述的实施例做出各种改变和修改，而不会背离本公开的范围和精神。同样，为了清楚和简明，以下的描述中省略了对公知功能和结构的描述。

第一实施例

如图1所示，本公开提供一种模型应用方法，应用于终端，包括如下步骤：

步骤S101：获取第一用户在信息页面针对N个任务目标的操作信息，N为正整数；

步骤S102：将目标数据发送给第一节点，以使得所述第一节点基于训练数据对第一模型进行训练，得到所述第一模型的更新参数数据，所述目标数据包括所述操作信息，所述训练数据包括基于所述目标数据确定的行为数据；

步骤S103：接收第二节点发送的推荐信息，所述推荐信息为所述第二节点基于训练好的所述第一模型确定的所述第一用户的推荐信息，所述训练好的所述第一模型的更新参数数据为所述第二节点通过点对点方式从所述第一节点处下载的。

本实施例中，模型应用方法涉及数据处理技术领域，尤其涉及推荐技术领域，其可以广泛应用于推荐场景下。本公开实施例的模型应用方法，可以由本公开实施例的模型应用装置执行。本公开实施例的模型应用装置可以配置在任意电子设备中，该电子设备可以为终端，以执行本公开实施例的模型应用方法。

在推荐场景下，如短视频、新闻资讯、电子商务等应用上的推荐场景，信息召回和排序等环节均需要用到模型，以进行信息推荐，该模型可以为深度学习模型，且该模型通常比较大，如容量可以达到TG级别。

通常情况下，模型训练和模型应用不在一个节点上，若将该模型以词典的形式进行配送，其配送的时间比较长，导致无法及时捕捉到用户的需求。本实施例的目的即是解决模型的配送问题，以使得模型训练到模型应用的整个过程的时间比较短，具体可以使模型应用的第二节点通过点对点方式直接从第一节点处下载第一模型的更新参数信息，以减少第一模型从训练节点(指的是第一节点)到应用节点(指的是第二节点)的配送时间，进而可以减少第一模型从应用节点生效到线上的时间，提高模型应用的时效性。其中，模型生效指的是第一模型应用于推荐系统中，使得该推荐系统可以基于该第一模型进行线上预估，实现信息推荐给终端。

在步骤S101中，第一用户可以为在终端的目标应用上登录的任一用户，该目标应用可以为短视频、新闻资讯、电子商务等应用。该终端可以显示该目标应用的信息页面，该信息页面可以为信息流页面，信息页面中可以包括第二节点(推荐系统中模型的应用节点)基于历史更新版本的第一模型向该终端推荐的信息如资讯。其中，历史更新版本的第一模型可以为第二节点对第一模型最近一次更新的版本。

用户可以对信息页面上显示的信息进行操作，如点击操作、点赞操作、分享操作等。相应的，终端可以获取第一用户在信息页面针对N个任务目标的操作信息。其中，针对N个任务目标的操作可以指的是针对信息页面上显示的信息进行的操作，若操作为关闭信息页面的操作，则该操作不是针对N个任务目标的操作。

第一用户在信息页面针对N个任务目标的操作信息可以包括操作类型(如点击操作、点赞操作或分享操作等)和所操作的信息标识(如资讯1或资讯2等)。

可以通过第一用户的操作位置、信息显示位置、信息的显示状态或所操作的控件，来获取该操作信息。比如，若第一用户的操作位置为资讯1的显示位置，且该资讯1的显示状态为缩略图的显示状态，则该操作信息中操作类型可以为点击操作，该点击操作用于打开该信息的落地页，以对该资讯1进行浏览，操作信息中所操作的信息标识为资讯1。

又比如，若第一用户所操作的控件为资讯2关联的点赞控件，则该操作信息中操作类型可以为点赞操作，且操作信息中所操作的信息标识为资讯2。

在步骤S102中，目标数据可以为普通数据，可以定期向第一节点发送目标数据，目标数据也可以为流数据，这里不进行具体限定。

目标数据以流数据为例，可以以数据流的方式，将终端获取的操作信息发送给第一节点，即所述终端会将包括所述操作信息的流数据发送给第一节点，使得第一节点可以采用现有的或新的训练方式，基于训练数据(该训练数据可以包括流数据确定的行为数据)对第一模型进行训练，得到第一模型的更新参数数据。

其中，流数据确定的行为数据可以包括以下至少一项：

所述流数据中目标操作信息确定的第一行为信息；

所述流数据中相邻两个操作信息确定的第二行为信息；

在所述流数据包括第K个操作信息、且在预设时间内未接收到第K+1个操作信息的情况下，基于所述第K个操作信息和所述预设时间确定的第三行为信息，K为正整数。

目标操作信息可以包括分享操作的操作信息、点击操作以打开信息页面中信息落地页的操作信息、点赞操作的操作信息等，相应的，第一行为信息可以包括点赞行为信息、分享行为信息、打开信息落地页的行为信息等。

流数据中相邻两个操作信息可以包括针对同一信息的相邻两次点击操作的操作信息，相应的，第二行为信息可以包括对信息的浏览行为信息(浏览行为信息可以包括浏览时长)。

在一场景中，若第一节点接收到第K个操作信息后，很长时间未接收到第K+1个操作信息，此时可能会丢失用户的一些行为信息。比如，第K个操作信息为打开信息落地页的行为信息，如阅读某条资讯后退出应用程序，一段时间内不再有操作，此时会丢失用户对该资讯的浏览行为信息，在该种场景下，可以基于预设时间和第K个操作信息，确定第三行为信息，第三行为信息可以包括对某一资讯浏览了该预设时间的浏览行为信息。

训练数据除了可以包括第一用户对应的流数据之外，还可以包括其他用户对应的流数据，第一节点可以基于各个用户对应的流数据确定训练数据，其确定的方式可以在第三实施例中详细介绍。

第一模型的更新参数数据可以为第一模型的所有参数数据，也可以为第一模型的部分参数数据。在一可选实施方式中，可以以预设时间周期为单位，依次获取每一预设时间周期内第一用户在信息页面针对N个任务目标的操作信息，如预设时间周期为10分钟，可以依次获取每10分钟内第一用户在信息页面针对N个任务目标的操作信息，针对每个预设时间周期，将该预设时间周期内的操作信息以数据流的方式发送给第一节点，以使得第一节点可以基于流数据确定的行为数据对第一模型进行训练。

其中，对第一模型进行训练可以指的是：对第一模型进行更新训练，即可以在上一预设时间周期内训练得到的第一模型进行继续训练，得到第一模型的更新参数数据。该更新参数数据可以为相对于上一预设时间周期内训练得到的第一模型的参数数据更新部分的参数数据，比如，上一预设时间周期内训练得到的第一模型的参数数据包括参数1、参数2和参数3，当前预设时间周期内训练得到的第一模型的参数数据包括参数1、参数2和参数4，则参数4即为第一模型的更新参数数据，若当前预设时间周期为第一模型的第一个训练时间周期，则第一模型的更新参数数据即为第一模型的所有参数数据。

在步骤S103中，第二节点可以为第一模型的应用节点，该第二节点可以用于针对用户进行信息推荐，其中，第二节点的数量可以为1个，也可以为多个，这里不进行具体限定。

第一节点可以将第一模型的更新参数数据配送给第二节点，通过将第一模型的更新参数数据进行配送，而不是整个模型进行配送，可以减少第一模型的配送时间。其配送的方式可以为：通知第二节点，通过点对点方式从第一节点处下载更新参数数据，这样可以取消第一模型中间落盘的过程，将文件读写变为远程内存访问，可以进一步减少第一模型的配送时间。

第一模型的参数数据可以存储在键值key-内容value的存储系统中，其中，key可以表征第一模型的配送版本，即第一模型的训练版本，value可以表征该配送版本的第一模型的参数数据，第二节点在获取到第一模型的更新参数数据的情况下，可以通过查询存储系统，基于该更新参数数据确定第一模型当前版本的参数数据。比如，可以获取存储系统中最近版本的第一模型的参数数据，融合最近版本的第一模型的参数数据和更新参数数据，得到第一模型当前版本的参数数据，将第一模型当前版本的参数数据存储至该存储系统中。

相应的，第二节点可以基于训练好的第一模型针对第一用户进行信息推荐，具体可以基于训练好的当前版本的第一模型，召回第一用户感兴趣的信息，并基于第一模型对召回的信息进行评分，以确定第一用户的推荐信息，将第一用户的推荐信息发送给第一用户对应的终端，实现信息推荐。

本实施例中，通过将第一模型的更新参数数据进行配送，而不是整个模型进行配送，可以减少第一模型的配送时间，而且通知第二节点，通过点对点方式从第一节点处下载更新参数数据，这样可以取消第一模型中间落盘的过程，将文件读写变为远程内存访问，可以进一步减少第一模型的配送时间，使得第一模型的训练到第一模型的应用的这整个过程的时间比较短，即模型从获取训练、到应用、再到生效的这整个过程的时间比较短，如此可以提高模型应用的时效性，达到模型的实时推荐效果，及时捕捉到用户的兴趣，满足用户的体验。

需要说明的是，第一节点与第二节点可以通过点对点(Peer to Peer，P2P)的网络如libp2p进行通信，以进行远程数据传输，实现第一模型的更新参数数据的下载。

可选的，所述目标数据为流数据，所述步骤S102具体包括：

以数据流的方式，将所述第一用户在信息页面针对N个任务目标的操作信息发送给第一节点。

本实施方式中，终端通过数据流的方式发送用户的操作信息给第一节点进行第一模型的训练，得到第一模型的更新参数数据，这样可以及时捕捉到用户的兴趣，可以缩短从捕捉到用户的兴趣到第一模型的训练的这个过程的时间，从而进一步提高模型应用的时效性。

可选的，所述N个任务目标包括以下至少一项：

点击目标；

点赞目标；

分享目标；

浏览时长目标。

本实施方式中，在训练第一模型时，通过考虑用户的点击、浏览时长、点赞、分享等多项因素，同时对点击率和浏览时长等多个任务目标进行建模，并基于支持多个任务目标训练的样本进行模型训练，在实时捕捉用户动态兴趣的基本需求的同时，可以提高模型的推荐效果。

第二实施例

如图2所示，本公开提供一种模型应用方法，应用于第三节点，包括如下步骤：

步骤S201：接收第二节点发送的第一访问请求，所述第一访问请求用于请求从第一节点处下载第一模型的更新参数数据，所述第一节点为训练所述第一模型的节点，所述更新参数数据是所述第一节点基于训练数据对第一模型进行训练得到，所述训练数据包括目标数据确定的行为数据，所述目标数据包括用户在信息页面针对N个任务目标的操作信息，N为正整数；

步骤S202：响应于所述第一访问请求，控制所述第二节点从所述第一节点处下载所述更新参数数据，以使所述第二节点基于训练好的所述第一模型针对用户发送推荐信息给所述用户对应的终端，训练好的所述第一模型包括所述更新参数数据。

本实施例中，模型应用方法涉及数据处理技术领域，尤其涉及推荐技术领域，其可以广泛应用于推荐场景下。本公开实施例的模型应用方法，可以由本公开实施例的模型应用装置执行。本公开实施例的模型应用装置可以配置在任意电子设备中，该电子设备可以为服务器，该电子设备作为第三节点，以执行本公开实施例的模型应用方法。

本实施例中，第三节点可以指的是配送过程中的控制节点，该第三节点可以控制下载节点从第一节点处下载模型的目标参数数据。第二节点可以指的是推荐系统中第一模型的应用节点，第二节点可以基于该模型进行信息推荐。

其中，第二节点的数量可以为至少一个，在推荐系统包括服务器集群的情况下，第二节点的数量可以为多个。在一场景中，推荐系统可以包括服务器集群，服务器集群中可以包括多个服务器，这多个服务器可以位于至少一个机房内，每个服务器可以为一个第二节点，用于下载第一模型的更新参数数据进行模型应用。

第一节点可以为第一模型的训练节点，该第一节点的数量可以为一个，也可以为多个，这里不进行具体限定。通过第一节点对第一模型进行训练，得到第一模型的更新参数数据。

在步骤S201中，第二节点可以向第三节点发送第一访问请求，以请求第三节点允许其从第一节点处下载第一模型的更新参数数据。

第二节点可以在接收到启动信息的情况下，向第三节点发送第一访问请求，在一可选实施方式中，启动信息可以由第一节点发送，如第一节点在第一模型训练完成的情况下，可以向推荐系统中的服务器集群发送启动信息，以通知服务器集群中的每个服务器，第一模型的更新参数数据已经准备好，可以进行下载。

在另一可选实施方式中，启动信息可以由配送节点发送，配送节点可以实时或周期查询模型的当前版本，在查询到当前版本为更新版本的情况下，可以向推荐系统中的服务器集群发送启动信息，以通知服务器集群中的每个服务器，第一模型的更新参数数据已经准备好，可以进行下载。

相应的，第二节点在接收到启动信息的情况下，可以向第三节点发送第一访问请求，以请求允许其从第一节点处下载第一模型的更新参数数据。其中，第一访问请求可以携带有请求内容和下载节点的节点信息如标识。

需要说明的是，在一可选实施方式中，第一节点或配送节点可以向第二节点发送一个启动信息，该启动信息用于指示第二节点下载第一模型的更新参数数据。相应的，第二节点向第三节点发送第一访问请求，第一访问请求用于请求从第一节点处一次性下载第一模型的更新参数数据。

在另一可选实施方式中，可以通过将更新参数数据进行分片的形式，将更新参数数据分成多个分片patch，来进行数据配送。第一节点或配送节点可以周期向第二节点发送启动信息，该启动信息可以指示所需要下载的分片patch，如更新参数数据被分成10个分片patch，则第一节点或配送节点可以周期向M个下载节点发送10个启动信息，每个启动信息用于指示可启动下载一个分片patch。

第一节点或配送节点也可以在接收到第三节点的反馈信息的情况下，向第二节点再次发送启动信息，该反馈信息可以指的是推荐系统中的所有第二节点针对当前所需要下载的分片patch已经下载完成。相应的，第二节点可以向第三节点发送访问子请求，该访问子请求用于请求从第一节点处下载第一模型的目标参数数据，目标参数数据为所述更新参数数据中的部分参数数据即分片patch，第三节点可以依次接收第二节点发送的访问子请求，直至所有的分片patch下载完成。

在步骤S202中，第三节点在接收到M个下载节点发送的第一访问请求的情况下，响应于第一访问请求，控制第二节点从第一节点处下载更新参数数据。

其中，控制的方式可以包括但不限于以下几种：

第三节点可以发送一个使能信号给第二节点，该使能信号指示第二节点允许从第一节点处下载更新参数数据，相应的，第二节点在接收到使能信号的情况下，可以向第一节点发送下载请求，这样第三节点可以通过使能信号控制第二节点发送下载请求给第一节点，以进行更新参数数据的下载。

第三节点也可以发送一个禁止信号给不允许从第一节点处下载更新参数数据的第二节点，该禁止信号指示第二节点禁止从第一节点处下载更新参数数据，相应的，某一第二节点在未接收到禁止信号的情况下，可以向第一节点发送下载请求，这样第三节点可以通过禁止信号控制第二节点发送下载请求给第一节点，以进行更新参数数据的下载。

相应的，第二节点在下载完成第一模型的更新参数数据的情况下，可以基于训练好的所述第一模型针对用户发送推荐信息给用户对应的终端，其信息推荐的方式与第一实施例类似，这里不进行赘述。

本实施例中，通过接收第二节点发送的第一访问请求；响应于第一访问请求，控制第二节点通过点对点方式从第一节点处下载第一模型的更新参数数据，以使第二节点基于训练好的所述第一模型针对用户发送推荐信息给所述用户对应的终端。如此，第三节点可以通过控制第二节点通过点对点方式进行远程内存访问，以直接从第一节点处下载第一模型的更新参数信息，从而可以减少模型从训练到生效的时间，进而可以提高模型应用的时效性。

可选的，所述第二节点的数量包括M个，M为大于1的整数，所述步骤S202具体包括：

响应于所述第一访问请求，从M个所述第二节点中确定第一下载节点；

控制所述第一下载节点发送第一下载请求给所述第一节点，所述第一下载请求用于所述第一下载节点通过点对点方式，从所述第一节点处下载所述更新参数数据。

本实施方式中，可以从M个第二节点中确定第一下载节点，其确定方式包括但不限于以下几种。

第一种：可以确定M个第二节点所属的机房，随机从每个机房中确定第一下载节点，使得第一下载节点可以从第一节点处下载更新参数数据或更新参数数据的分片patch。由于从第一节点处下载数据是跨机房的数据传输，因此，第三节点从每个机房最多确定出L个第一下载节点从第一节点处下载数据，L为正整数，这样在降低下载源端带宽的同时，可以减少下载时长。

第二种：可以根据M个第二节点性能，从M个第二节点中确定第一下载节点，比如，由于下载节点通常离第一节点较远，因此，可以挑选性能较好的第二节点作为第一下载节点，从第一节点处下载更新参数数据或更新参数数据的分片patch。比如，挑选网络性能好、运行性能好的第二节点作为第一下载节点。

另外，在M个第二节点未全部下载好同一个分片patch的情况下，M个第二节点又接收到下载另一个分片patch的启动信息，在该种情况下，第三节点可以优先从下载好上一个分片patch的第二节点中确定第一下载节点，这样可以依次有序地进行分片patch的下载。

第一下载请求可以携带有请求内容和第二节点的节点信息，请求内容可以包括所需要下载的数据。第一下载请求用于第一下载节点通过点对点方式，从所述第一节点处下载更新参数数据或更新参数数据的分片patch。

在第一下载节点对数据下载完成的情况下，推荐系统中的其他第二节点可以从第一下载节点处下载数据。在一可选实施方式中，互联网协议(Internet Protocol Address，IP)地址相近的第二节点通常物理链路最短，从邻近的第二节点处下载数据的速度极快，且通常不存在下载长尾，因此，其他第二节点可以从邻近的第二节点(可以称之为peer节点)处下载数据。

图3是配送流程的下载机制示意图，如图3所示，配送过程中，包括第三节点301，下载节点302，下载节点303，下载节点304，下载节点305，下载节点306，下载节点307，第一节点308。第三节点从6个第二节点中确定出第二节点302作为第一下载节点。

相应的，第二节点302可以从第一节点处下载数据，而邻近的第二节点303和第二节点307可以从第二节点302处下载数据，这样，可以保证第一模型的更新参数数据可以从第一节点处迅速向每个机房的各个下载节点扩散开来，如一个分片patch从第一节点到各个机房下载完毕可以降低到30秒(s)内，从而可以包括模型应用的时效性。

各个分片patch下载完成后，可以得到第一模型的更新参数数据，可以将其存储至可供实时查询的键值key-内容value的存储系统中，以更新当前版本模型的参数数据，同时可以更新推荐系统中线上预估服务的模型中的参数数据，以生效到线上进行在线预估。

本实施方式中，响应于第一访问请求，从M个所述第二节点中确定第一下载节点；控制第一下载节点发送第一下载请求给第一节点，第一下载请求用于第一下载节点通过点对点方式，从第一节点处下载更新参数数据。如此，在第二节点包括多个的情况下，第三节点也可以控制第二节点快速从第一节点处下载第一模型的更新参数数据，从而提高模型应用的时效性。

可选的，所述步骤S201具体包括：

依次接收第二节点发送的访问子请求，所述第一访问请求包括所述访问子请求，所述访问子请求用于请求从所述第一节点处下载所述第一模型的目标参数数据，所述目标参数数据为所述更新参数数据中的部分参数数据；

其中，不同访问子请求从所述第一节点处所请求下载的目标参数数据不同。

本实施方式中，可以通过将更新参数数据进行分片的形式，将更新参数数据分成多个分片patch，来进行数据配送。第一节点或配送节点可以周期向第二节点发送启动信息，该启动信息可以指示所需要下载的分片patch，如更新参数数据被分成10个分片patch，则第一节点或配送节点可以周期向M个下载节点发送10个启动信息，每个启动信息用于指示可启动下载一个分片patch。

本实施方式中，通过将更新参数数据划分成分片patch进行数据配送，如此，M个第二节点可以并行从第一节点处下载第一模型的更新参数数据，从而可以进一步减少数据配送的时间，进一步提高模型应用的时效性。

可选的，所述控制所述第一下载节点发送第一下载请求给所述第一节点之后，所述方法还包括：

在监控到M个所述第二节点中的第一目标下载节点数据下载完成的情况下，将所述第一目标下载节点存储至预设列表中；

其中，所述第一目标下载节点包括所述第一下载节点和第二下载节点，所述第二下载节点为M个所述第二节点中从匹配的第二节点处下载数据的第二节点。

本实施方式中，匹配的第二节点可以为邻近的第二节点，如IP地址相近的第二节点，可以称之为peer节点，从peer节点处下载数据可以作为推荐系统中的第二节点对数据的第二级下载，而第一级下载可以指的是第一下载节点从第一节点处下载。

如图3所示，第二节点302为第二节点303和第二节点307的peer节点，第二节点303为第二节点304的peer节点，第二节点307为第二节点306的peer节点，而第二节点304和第二节点306均为第二节点305的peer节点。

也就是说，推荐系统中的第二节点对数据的下载至少包括两级下载，第一级下载为推荐系统中的第一下载节点从第一节点处下载数据(如分片patch)，第一级下载为在第一下载节点下载完成的情况下，未下载数据的第二节点可以轮询其peer节点对数据是否下载完成，在轮询到其peer节点下载完成的情况下，从peer节点处下载数据，这样可以保证第一模型的更新参数数据可以从第一节点处迅速向每个机房的各个第二节点扩散开来。

第三节点可以分别对M个第二节点对数据的下载进度进行读写，或者可以接收第二节点在下载完成的情况下发送的下载完成信号，以监控M个第二节点对数据的下载进度。

相应的，在监控到M个第二节点中的第一目标下载节点对数据下载完成的情况下，可以将第一目标下载节点存储至预设列表中，具体可以将第一目标下载节点的节点信息如标识存储至预设列表中。如图3所示，可以将第二节点302、第二节点303和第二节点307的节点信息存储至预设列表中。

其中，第一目标下载节点可以包括第一下载节点和第二下载节点，第一下载节点可以为第一级下载完成的第二节点，第一节点可以为第二级下载完成的第二节点。

该预设列表中的第二节点可以用于第三节点确定下一个分片patch的第一下载节点，如从M个第二节点中除预设列表之外的第二节点中，确定第一下载节点，也可以用于其他第二节点在下载超时的情况下进行本地下载，以下实施方式再对此进行详细说明。

本实施方式中，在监控到M个所述第二节点中的第一目标下载节点数据下载完成的情况下，将所述第一目标下载节点存储至预设列表中；其中，所述第一目标下载节点包括所述第一下载节点和第二下载节点，所述第二下载节点为M个所述第二节点中从匹配的第二节点处下载数据的第二节点。如此，第三节点可以基于预设列表中的第二节点进行下载管理，如其他第二节点在下载超时的情况下从预设列表中挑选第二节点进行本地下载。

可选的，所述将所述第一目标下载节点存储至预设列表中之后，所述方法还包括：

在接收到第二目标下载节点发送的第二访问请求的情况下，从所述预设列表中确定第三下载节点，所述第二目标下载节点为M个所述第二节点中第一下载时长超过第一预设阈值的第二节点，所述第一下载时长为从匹配的第二节点处下载数据的时长，所述第二访问请求用于请求从所述预设列表中的下载节点处下载所述更新参数数据；

控制所述第二目标下载节点发送第二下载请求给所述第三下载节点，所述第二下载请求用于所述第二目标下载节点通过点对点方式，从所述第三下载节点处下载所述更新参数数据。

本实施方式中，由于第一节点的数量较少，且数据从第一节点开始逐步传播蔓延到第二节点的peer节点有一定耗时，因此，在第二节点的第一下载时长超过第一预设阈值的情况下，即第二节点在第一下载时长内对数据还未下载完毕的情况下，可以认为该第二节点离第一节点距离较远，使得数据还没有传播到其peer节点。如图3所示，第二节点305离第一节点距离较远，中间跨越了很多个peer节点。

其中，第一下载时长为从匹配的第二节点处下载数据的时长，即第二目标下载节点对peer节点轮询的时长，第一预设阈值可以根据实际情况进行设置，这里不进行具体限定。

在该种情况下，第二目标下载节点可以向第三节点发送第二访问请求，第二访问请求用于请求从预设列表中的第二节点处下载数据，以进行第三级下载，即从本地已经下载好的第二节点处下载更新参数数据。其中，第二访问请求可以携带有请求内容和第二目标下载节点的节点信息。

相应的，第三节点在接收到第二目标下载节点发送的第二访问请求的情况下，从预设列表中确定第三下载节点。其中，第三下载节点的确定方式可以与第一下载节点的确定方式相同。如图3所示，第三节点确定第二节点302为第三下载节点。

除此之外，第三节点还可以将预设列表中与第二目标下载节点跨越peer节点层数最少，即距离第二目标下载节点链路最短的第二节点确定为第三下载节点。如图3所示，针对第二节点305，预设列表中的第二节点303和第二节点307，相对于第二节点305来说，中间跨越了一层peer节点，预设列表中的第二节点302，相对于第二节点305来说，中间跨越了两层peer节点，因此，第三节点可以将第二节点303和第二节点307中任一第二节点确定为第三下载节点，这样可以缩短第二节点之间的物理链路，进一步缩短数据下载时间。

在确定第三下载节点的情况下，第三节点可以向第二目标下载节点发送目标信息，该目标信息可以包括第三下载节点的节点信息，相应的，第二目标下载节点在接收到目标信息的情况下，可以确定下载的目标即第三下载节点，并发送第二下载请求给第三下载节点，从而第三节点可以控制第二目标下载节点发送第二下载请求给第三下载节点。

其中，第二下载请求可以携带有请求内容和第二目标下载节点的节点信息，用于第二目标下载节点通过点对点方式，从第三下载节点处下载更新参数数据。

本实施方式中，通过点对点方式从第一节点处下载更新参数数据，并通过三级下载机制，下载更新参数数据，使第一模型的更新参数数据从第一节点处逐步向各个机房的第二节点处快速扩散，从而可以进一步降低模型训练到生效的时间，进而进一步提高模型应用的时效性。

可选的，所述控制所述第二目标下载节点发送第二下载请求给所述第三下载节点之后，所述方法还包括：

在监控到所述第二目标下载节点的第二下载时长超过第二预设阈值的情况下，控制所述第二目标下载节点发送第三下载请求给所述第一节点，所述第三下载请求用于所述第二目标下载节点通过点对点方式，从所述第一节点处下载所述更新参数数据，所述第二下载时长为从所述第三下载节点处下载数据的时长。

本实施方式中，第三节点可以对第二目标下载节点向第三下载节点下载数据的进度进行读写，也可以接收在第二目标下载节点下载超时的情况下发送的下载超时信号，以监控第二目标下载节点的第二下载时长。

相应的，在监控到第二目标下载节点的第二下载时长超过第二预设阈值的情况下，控制第二目标下载节点发送第三下载请求给第一节点，其中，其控制方式可以与控制第一下载节点发送第一下载请求给第一节点的方式类似，这里不进行赘述。其中，第二预设阈值可以根据实际情况进行设置，这里不进行具体限定。

本实施方式中，通过在监控到所述第二目标下载节点的第二下载时长超过第二预设阈值的情况下，控制所述第二目标下载节点发送第三下载请求给所述第一节点。如此，可以保证每个第二节点均能够在较短的时间内完成对第一模型的更新参数数据的下载。

第三实施例

如图4所示，本公开提供一种模型应用方法，应用于第一节点，包括如下步骤：

步骤S401：接收终端发送的目标数据，所述目标数据包括用户在信息页面针对N个任务目标的操作信息，N为正整数；

步骤S402：获取训练数据，所述训练数据包括基于所述目标数据确定的行为数据；

步骤S403：基于所述训练数据对第一模型进行训练，得到所述第一模型的更新参数数据；

步骤S404：通过点对点方式向第二节点发送所述更新参数数据，以使所述第二节点基于训练好的所述第一模型针对用户发送推荐信息给所述用户对应的终端，训练好的所述第一模型包括所述更新参数数据。

本实施例中，模型应用方法涉及数据处理技术领域，尤其涉及推荐技术领域，其可以广泛应用于推荐场景下。本公开实施例的模型应用方法，可以由本公开实施例的模型应用装置执行。本公开实施例的模型应用装置可以配置在任意电子设备中，该电子设备作为第一节点，以执行本公开实施例的模型应用方法。该电子设备可以为服务器，也可以为终端，这里不进行具体限定。

本实施例中，可以基于训练数据对第一模型进行训练，其中，可以通过定时从线上拉取目标数据，该目标数据包括用户在信息页面针对N个任务目标的操作信息，基于该目标数据确定用户的行为数据，并通过大数据平台如Hadoop平台处理成标准样本，得到训练数据。第一模型可以定时训练指定时间内的样本，得到当前版本相对于上一版本的更新参数数据，训练完成之后将该更新参数数据进行配送。

也可以以实时数据流的方式从线上订阅用户在信息页面针对N个任务目标的操作信息，基于流数据确定用户的行为数据，得到训练数据，第一模型实时对样本进行训练，得到当前版本相对于上一版本的更新参数数据，训练完成之后将该更新参数数据进行配送。

其中，行为数据可以包括行为信息，该行为数据可以通过拼接用户的行为信息得到，用户的行为信息可以包括：在指定时间窗口期内拼接用户的不同目标操作得到的行为信息；在接收到第K次目标操作、且预设时间内未接收到第K+1次目标操作的情况下，基于第K次目标操作和预设时间确定的行为信息；以及基于目标操作确定的行为信息中至少一项，K为正整数。

目标操作可以指的是用户针对任务目标所执行的操作，如任务目标为资讯的浏览时长，目标操作可以包括点击打开资讯以及点击退出资讯，而用户点击退出应用程序APP，则不为目标操作。

训练数据可以仅包括一个任务目标的行为数据，如仅包括点赞目标、分享目标、点击目标和浏览时长目标等任一项任务目标的行为数据，训练数据也可以包括多个任务目标的行为数据，如同时包括点赞目标、分享目标、点击目标和浏览时长目标等多个任务目标的行为数据。

训练数据可以同时包括正样本行为数据和负样本行为数据，训练数据可以为正样本和负样本的行为组合数据，其中，针对点击目标，正样本行为数据可以指的是用户针对资讯进行了点击的行为数据，负样本行为数据可以指的是用户针对资讯未进行点击的行为数据。

可以采用现有的或新的训练方式，基于训练数据对第一模型进行训练，得到所述第一模型的更新参数数据。

在得到第一模型的更新参数数据，且接收到第二节点(如第一下载节点)发送的第一下载请求的情况下，可以通过点对点方式向第二节点发送第一模型的更新参数数据或更新参数数据的分片patch，其中，第一下载节点、第一下载请求和分片patch等相关概念已经在第一实施例和第二实施例中详细描述，这里不进行赘述。

本实施例中，通过接收终端发送的目标数据，所述目标数据包括用户在信息页面针对N个任务目标的操作信息；获取训练数据，所述训练数据包括基于所述目标数据确定的行为数据；基于所述训练数据对第一模型进行训练，得到所述第一模型的更新参数数据；通过点对点方式向第二节点发送所述更新参数数据，以使所述第二节点基于训练好的所述第一模型针对用户发送推荐信息给所述用户对应的终端，训练好的所述第一模型包括所述更新参数数据。如此，第二节点可以通过点对点方式进行远程内存访问，以直接从第一节点处下载第一模型的更新参数信息，从而可以减少模型从训练到生效的时间，进而可以提高模型应用的时效性。

可选的，所述训练数据包括每个任务目标对应的第一行为数据，所述第一行为数据包括正样本行为数据和负样本行为数据，所述步骤S403具体包括：

针对每个任务目标，基于所述任务目标对应的预设拼接率和所述正样本行为数据，对所述负样本行为数据进行调整，得到所述任务目标对应的第二行为数据，所述第二行为数据包括所述正样本行为数据和调整后的所述负样本行为数据；

基于所述N个任务目标对应的第二行为数据对第一模型进行训练，得到所述第一模型的更新参数数据。

本实施方式中，训练数据可以包括第一任务目标对应的第一行为数据，且第一行为数据可以包括正样本行为数据和负样本行为数据。其中，任务目标可以指的是为实现推荐任务而设定的建模目标，如根据用户点击资讯的行为数据进行信息推荐，根据用户对资讯浏览时长的行为数据进行信息推荐等，而第一任务目标可以指的是所需要建模的N个任务目标中的任一任务目标，N为正整数。

针对不同的任务目标，正样本行为数据和负样本行为数据所指的行为数据不同，如针对点击目标，正样本行为数据指的是用户针对资讯进行了点击的行为数据，负样本行为数据指的是用户针对资讯未进行点击的行为数据。

可以通过定时从线上拉取用户针对第一任务目标执行目标操作产生的行为信息，通过大数据平台如Hadoop平台处理成标准样本，得到正样本行为数据。也可以以实时数据流的方式从线上订阅用户针对第一任务目标执行目标操作产生的行为信息，得到正样本行为数据。

而负样本行为数据可以通过用户对资讯的行为反馈反推得到，如推荐系统给用户推荐了两条资讯，仅接收到用户对资讯1的行为反馈，则可以反推到用户对资讯2未进行行为反馈，从而可以得到用户未对资讯2进行点击。也可以采用其他方式获取负样本行为数据，这里不进行具体限定。

第一任务目标对应的预设拼接率指的是针对第一任务目标的正样本的预设采集率，如第一任务目标为点击目标，针对推荐系统推荐的资讯，采集到用户点击了10次，未点击90次，则针对点击目标，采集率为10％。

通常情况下，针对第一任务目标，在长期采集样本的试验下对于正样本的预设拼接率相对固定，如在时效性不高的场景，对于正样本的预设拼接率为10％。由于时效性的提升，导致部分样本采集可能有损或者未采集到，比如，用户对于资讯发生了长时间的浏览，最终分享了该资讯，然而样本采集过程中由于时间窗口的设置提前结束而导致该正样本未采集完全，又比如，由于时效性的提升，一些用户的点击行为并未采集到。

在该种场景下，可以基于第一任务目标对应的预设拼接率和正样本行为数据，对负样本行为数据进行调整，得到第二行为数据。在一可选实施方式中，可以删除负样本行为数据中行为信息，得到第二行为数据，第二行为数据包括正样本行为数据和负样本行为数据中剩余的行为信息，比如，针对点击目标，预设拼接率为10％，正样本行为数据中行为信息的数量为8条，负样本行为数据中行为信息的数量为89条，可以删除负样本行为数据中17条行为信息，使得负样本行为数据中剩余的行为信息的数量保持在72条，保证预设拼接率保持在10％左右。如此，可以使得在线上应用模型的时候保持推荐系统的相对稳定，不至于导致模型的预估目标过于偏高或者偏低。

在另一可选实施方式中，可以整合负样本行为数据中不同的行为信息，以降低负样本行为数据中行为信息的数量，使得预设拼接率保持在相对固定的水平。

之后，可以采用现有的或新的训练方式，基于第二行为数据对第一模型进行训练，得到第一模型的更新参数数据。

本实施方式中，通过负样本采集的方式，并基于任务目标对应的预设拼接率和正样本行为数据，对负样本行为数据进行调整，得到第二行为数据，基于第二行为数据对第一模型进行训练。如此，可以基于预设拼接率对负样本行为数据进行动态调整，将正样本的预设拼接率保持在相对固定的水平，这样可以在满足第一模型的推荐时效性的同时，改善第一模型训练的效果。

可选的，所述目标数据为流数据，所述训练数据包括第二用户针对所述N个任务目标的第三行为数据，所述第三行为数据通过以下方式获取：

将所述第二用户针对所述N个任务目标的操作信息确定的行为信息进行拼接，得到所述第三行为数据；

其中，所述行为信息包括以下至少一项：

所述流数据中目标操作信息确定的第一行为信息；

所述流数据中相邻两个操作信息确定的第二行为信息；

本实施方式中，可以以实时数据流的方式从线上订阅用户执行目标操作产生的行为信息，以满足实时捕捉用户动态兴趣的基本需求。

为了能同时对多个任务目标进行建模，可以将第二用户针对N个任务目标所执行的目标操作产生的各个行为信息(包括第一行为信息和第二行为信息)进行拼接，并合并到一条正样本中，得到第三行为数据，其中，第三行为数据可以包含第二用户针对点击目标、浏览时长目标、点赞目标和分享目标等多个任务目标的行为信息，这样能够同时产出支持多个任务目标训练的一份样本，从而可以捕捉用户的多个信号。

训练数据可以包括第三行为数据，第三行为数据可以包括正样本行为数据中第二用户的行为信息，可以由正样本行为数据中第二用户的行为信息与该第二用户针对其他任务目标所执行的目标操作产生的各个行为信息进行拼接得到。

在具体实现过程中，以针对信息流页面采集第二用户的行为信息为例，由于第二用户在信息流页面会进行刷新、点击、浏览等多个目标操作，为了能更及时地同时捕捉点击和浏览时长等多个信号，可以在第二用户下一次执行目标操作时，完整采集并拼接上一次第二用户执行目标操作产生的行为信息，该行为信息可以为点击、浏览时长、点赞或分享等，并合并到一条样本中，得到第三行为数据。

然而，完全依赖下一次行为反馈的方式来拼接用户的行为信息，会导致可能丢失第二用户的最后一次行为反馈，如阅读某条资讯后退出应用程序APP，且一段时间内不会再有行为反馈。在该种场景下，可以设置一个预设时间，该预设时间可以为一个时间窗口，超过该时间窗口之后，会确定基于第K次目标操作(即离时间窗口最近的一次目标操作)和预设时间产生的第三行为信息，并将该行为信息与该第二用户之前产生的行为信息进行拼接，保证行为不发生遗漏。其中，该预设时间可以根据实际情况进行设置，这里不进行具体限定。

本实施方式中，通过将所述第二用户针对所述N个任务目标的操作信息确定的行为信息进行拼接，得到所述第三行为数据，基于第三行为数据进行第一模型的训练。如此，通过考虑用户的点击、浏览时长、点赞、分享等多项因素，同时对点击率和浏览时长等多个任务目标进行建模，并基于支持多个任务目标训练的样本进行第一模型的训练，在实时捕捉用户动态兴趣的基本需求的同时，可以提高第一模型的推荐效果。

可选的，所述步骤S404之后，所述方法还包括：

在接收到第二目标下载节点发送的第三下载请求的情况下，通过点对点方式向所述第二目标下载节点发送所述更新参数数据；

其中，所述第二目标下载节点为M个第二节点中第一下载时长超过第一预设阈值，且第二下载时长超过第二预设阈值的第二节点，所述第一下载时长为从匹配的第二节点处下载数据的时长，所述第二下载时长为从第三下载节点处下载数据的时长，所述第三下载节点为所述第三节点在接收到所述第二目标下载节点发送的第二访问请求的情况下，从预设列表中确定的下载节点，所述预设列表包括第一目标下载节点，所述第一目标下载节点包括M个第二节点中数据下载完成的第二节点。

本实施方式中，第二目标下载节点、第三下载请求、第一下载时长、第二下载时长、第三下载节点等相关概念已经在第一实施例和第二实施例中详细描述，这里不进行赘述。

本实施方式中，第一下载节点通过点对点方式从第一节点处下载更新参数数据，并通过三级下载机制，下载更新参数数据，使第一模型的更新参数数据从第一节点处逐步向各个机房的第二节点处快速扩散；同时，通过在监控到所述第二目标下载节点的第二下载时长超过第二预设阈值的情况下，控制第二目标下载节点通过点对点方式向第一节点处下载更新参数数据。如此，可以在提高模型应用的时效性同时，保证每个第二节点均能够在较短的时间内完成对第一模型的更新参数数据的下载。

第四实施例

如图5所示，本公开提供一种模型应用装置500，应用于终端，包括：

第一获取模块501，用于获取第一用户在信息页面针对N个任务目标的操作信息，N为正整数；

第一发送模块502，用于将目标数据发送给第一节点，以使得所述第一节点基于训练数据对第一模型进行训练，得到所述第一模型的更新参数数据，所述目标数据包括所述操作信息，所述训练数据包括基于所述目标数据确定的行为数据；

第一接收模块503，用于接收第二节点发送的推荐信息，所述推荐信息为所述第二节点基于训练好的所述第一模型确定的所述第一用户的推荐信息，所述训练好的所述第一模型的更新参数数据为所述第二节点通过点对点方式从所述第一节点处下载的。

可选的，所述目标数据为流数据，所述第一发送模块502，具体用于：

本公开提供的模型应用装置500能够实现模型应用方法第一实施例实现的各个过程，且能够达到相同的有益效果，为避免重复，这里不再赘述。

第五实施例

如图6所示，本公开提供一种模型应用装置600，应用于第三节点，包括：

第二接收模块601，用于接收第二节点发送的第一访问请求，所述第一访问请求用于请求从第一节点处下载第一模型的更新参数数据，所述第一节点为训练所述第一模型的节点，所述更新参数数据是所述第一节点基于训练数据对第一模型进行训练得到，所述训练数据包括目标数据确定的行为数据，所述目标数据包括用户在信息页面针对N个任务目标的操作信息，N为正整数；

第一控制模块602，用于响应于所述第一访问请求，控制所述第二节点通过点对点方式从所述第一节点处下载所述更新参数数据，以使所述第二节点基于训练好的所述第一模型针对用户发送推荐信息给所述用户对应的终端，训练好的所述第一模型包括所述更新参数数据。

可选的，所述第二节点的数量包括M个，M为大于1的整数，所述第一控制模块602，具体用于：

可选的，所述第二接收模块601，具体用于：

可选的，还包括：

存储模块，用于在监控到M个所述第二节点中的第一目标下载节点数据下载完成的情况下，将所述第一目标下载节点存储至预设列表中；

可选的，还包括：

确定模块，用于在接收到第二目标下载节点发送的第二访问请求的情况下，从所述预设列表中确定第三下载节点，所述第二目标下载节点为M个所述第二节点中第一下载时长超过第一预设阈值的第二节点，所述第一下载时长为从匹配的第二节点处下载数据的时长，所述第二访问请求用于请求从所述预设列表中的下载节点处下载所述更新参数数据；

第二控制模块，用于控制所述第二目标下载节点发送第二下载请求给所述第三下载节点，所述第二下载请求用于所述第二目标下载节点通过点对点方式，从所述第三下载节点处下载所述更新参数数据。

可选的，还包括：

第三控制模块，用于在监控到所述第二目标下载节点的第二下载时长超过第二预设阈值的情况下，控制所述第二目标下载节点发送第三下载请求给所述第一节点，所述第三下载请求用于所述第二目标下载节点通过点对点方式，从所述第一节点处下载所述更新参数数据，所述第二下载时长为从所述第三下载节点处下载数据的时长。

本公开提供的模型应用装置600能够实现模型应用方法第二实施例实现的各个过程，且能够达到相同的有益效果，为避免重复，这里不再赘述。

第六实施例

如图7所示，本公开提供一种模型应用装置700，应用于第一节点，包括：

第三接收模块701，用于接收终端发送的目标数据，所述目标数据包括用户在信息页面针对N个任务目标的操作信息，N为正整数；

第二获取模块702，用于获取训练数据，所述训练数据包括基于所述目标数据确定的行为数据；

训练模块703，用于基于所述训练数据对第一模型进行训练，得到所述第一模型的更新参数数据；

第二发送模块704，用于通过点对点方式向第二节点发送所述更新参数数据，以使所述第二节点基于训练好的所述第一模型针对用户发送推荐信息给所述用户对应的终端，训练好的所述第一模型包括所述更新参数数据。

可选的，所述训练数据包括每个任务目标对应的第一行为数据，所述第一行为数据包括正样本行为数据和负样本行为数据，所述训练模块703，具体用于：

其中，所述行为信息包括以下至少一项：

所述流数据中目标操作信息确定的第一行为信息；

所述流数据中相邻两个操作信息确定的第二行为信息；

本公开提供的模型应用装置700能够实现模型应用方法第三实施例实现的各个过程，且能够达到相同的有益效果，为避免重复，这里不再赘述。

本公开的技术方案中，所涉及的用户个人信息的收集、存储、使用、加工、传输、提供和公开等处理，均符合相关法律法规的规定，且不违背公序良俗。

根据本公开的实施例，本公开还提供了一种电子设备、一种可读存储介质和一种计算机程序产品。

图8示出了可以用来实施本公开的实施例的示例电子设备的示意性框图。电子设备旨在表示各种形式的数字计算机，诸如，膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备还可以表示各种形式的移动装置，诸如，个人数字处理、蜂窝电话、智能电话、可穿戴设备和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例，并且不意在限制本文中描述的和/或者要求的本公开的实现。

如图8所示，设备800包括计算单元801，其可以根据存储在只读存储器(ROM)802中的计算机程序或者从存储单元808加载到随机访问存储器(RAM)803中的计算机程序，来执行各种适当的动作和处理。在RAM 803中，还可存储设备800操作所需的各种程序和数据。计算单元801、ROM 802以及RAM 803通过总线804彼此相连。输入/输出(I/O)接口805也连接至总线804。

设备800中的多个部件连接至I/O接口805，包括：输入单元806，例如键盘、鼠标等；输出单元807，例如各种类型的显示器、扬声器等；存储单元808，例如磁盘、光盘等；以及通信单元809，例如网卡、调制解调器、无线通信收发机等。通信单元809允许设备800通过诸如因特网的计算机网络和/或各种电信网络与其他设备交换信息/数据。

计算单元801可以是各种具有处理和计算能力的通用和/或专用处理组件。计算单元801的一些示例包括但不限于中央处理单元(CPU)、图形处理单元(GPU)、各种专用的人工智能(AI)计算芯片、各种运行机器学习模型算法的计算单元、数字信号处理器(DSP)、以及任何适当的处理器、控制器、微控制器等。计算单元801执行上文所描述的各个方法和处理，例如模型应用方法。例如，在一些实施例中，模型应用方法可被实现为计算机软件程序，其被有形地包含于机器可读介质，例如存储单元808。在一些实施例中，计算机程序的部分或者全部可以经由ROM 802和/或通信单元809而被载入和/或安装到设备800上。当计算机程序加载到RAM 803并由计算单元801执行时，可以执行上文描述的模型应用方法的一个或多个步骤。备选地，在其他实施例中，计算单元801可以通过其他任何适当的方式(例如，借助于固件)而被配置为执行模型应用方法。

本文中以上描述的系统和技术的各种实施方式可以在数字电子电路系统、集成电路系统、场可编程门阵列(FPGA)、专用集成电路(ASIC)、专用标准产品(ASSP)、芯片上系统的系统(SOC)、负载可编程逻辑设备(CPLD)、计算机硬件、固件、软件、和/或它们的组合中实现。这些各种实施方式可以包括：实施在一个或者多个计算机程序中，该一个或者多个计算机程序可在包括至少一个可编程处理器的可编程系统上执行和/或解释，该可编程处理器可以是专用或者通用可编程处理器，可以从存储系统、至少一个输入装置、和至少一个输出装置接收数据和指令，并且将数据和指令传输至该存储系统、该至少一个输入装置、和该至少一个输出装置。

用于实施本公开的方法的程序代码可以采用一个或多个编程语言的任何组合来编写。这些程序代码可以提供给通用计算机、专用计算机或其他可编程数据处理装置的处理器或控制器，使得程序代码当由处理器或控制器执行时使流程图和/或框图中所规定的功能/操作被实施。程序代码可以完全在机器上执行、部分地在机器上执行，作为独立软件包部分地在机器上执行且部分地在远程机器上执行或完全在远程机器或服务器上执行。

在本公开的上下文中，机器可读介质可以是有形的介质，其可以包含或存储以供指令执行系统、装置或设备使用或与指令执行系统、装置或设备结合地使用的程序。机器可读介质可以是机器可读信号介质或机器可读储存介质。机器可读介质可以包括但不限于电子的、磁性的、光学的、电磁的、红外的、或半导体系统、装置或设备，或者上述内容的任何合适组合。机器可读存储介质的更具体示例会包括基于一个或多个线的电气连接、便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦除可编程只读存储器(EPROM或快闪存储器)、光纤、便捷式紧凑盘只读存储器(CD-ROM)、光学储存设备、磁储存设备、或上述内容的任何合适组合。

为了提供与用户的交互，可以在计算机上实施此处描述的系统和技术，该计算机具有：用于向用户显示信息的显示装置(例如，CRT(阴极射线管)或者LCD(液晶显示器)监视器)；以及键盘和指向装置(例如，鼠标或者轨迹球)，用户可以通过该键盘和该指向装置来将输入提供给计算机。其它种类的装置还可以用于提供与用户的交互；例如，提供给用户的反馈可以是任何形式的传感反馈(例如，视觉反馈、听觉反馈、或者触觉反馈)；并且可以用任何形式(包括声输入、语音输入或者、触觉输入)来接收来自用户的输入。

可以将此处描述的系统和技术实施在包括后台部件的计算系统(例如，作为数据服务器)、或者包括中间件部件的计算系统(例如，应用服务器)、或者包括前端部件的计算系统(例如，具有图形用户界面或者网络浏览器的用户计算机，用户可以通过该图形用户界面或者该网络浏览器来与此处描述的系统和技术的实施方式交互)、或者包括这种后台部件、中间件部件、或者前端部件的任何组合的计算系统中。可以通过任何形式或者介质的数字数据通信(例如，通信网络)来将系统的部件相互连接。通信网络的示例包括：局域网(LAN)、广域网(WAN)和互联网。

计算机系统可以包括客户端和服务器。客户端和服务器一般远离彼此并且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端-服务器关系的计算机程序来产生客户端和服务器的关系。服务器可以是云服务器，也可以为分布式系统的服务器，或者是结合了区块链的服务器。

应该理解，可以使用上面所示的各种形式的流程，重新排序、增加或删除步骤。例如，本公开中记载的各步骤可以并行地执行也可以顺序地执行也可以不同的次序执行，只要能够实现本公开公开的技术方案所期望的结果，本文在此不进行限制。

上述具体实施方式，并不构成对本公开保护范围的限制。本领域技术人员应该明白的是，根据设计要求和其他因素，可以进行各种修改、组合、子组合和替代。任何在本公开的精神和原则之内所作的修改、等同替换和改进等，均应包含在本公开保护范围之内。

Claims

1.一种模型应用方法，应用于终端，包括：

2.根据权利要求1所述的方法，其中，所述目标数据为流数据，所述将目标数据发送给第一节点，包括：

3.一种模型应用方法，应用于第三节点，包括：

4.根据权利要求3所述的方法，其中，所述第二节点的数量包括M个，M为大于1的整数，所述响应于所述第一访问请求，控制所述第二节点通过点对点方式从所述第一节点处下载所述更新参数数据，包括：

5.根据权利要求3所述的方法，其中，所述接收第二节点发送的第一访问请求，包括：

6.根据权利要求4所述的方法，所述控制所述第一下载节点发送第一下载请求给所述第一节点之后，所述方法还包括：

7.根据权利要求6所述的方法，所述将所述第一目标下载节点存储至预设列表中之后，所述方法还包括：

8.根据权利要求7所述的方法，所述控制所述第二目标下载节点发送第二下载请求给所述第三下载节点之后，所述方法还包括：

9.一种模型应用方法，应用于第一节点，包括：

10.根据权利要求9所述的方法，其中，所述训练数据包括每个任务目标对应的第一行为数据，所述第一行为数据包括正样本行为数据和负样本行为数据，所述基于所述训练数据对第一模型进行训练，得到所述第一模型的更新参数数据，包括：

11.根据权利要求9所述的方法，其中，所述目标数据为流数据，所述训练数据包括第二用户针对所述N个任务目标的第三行为数据，所述第三行为数据通过以下方式获取：

其中，所述行为信息包括以下至少一项：

所述流数据中目标操作信息确定的第一行为信息；

所述流数据中相邻两个操作信息确定的第二行为信息；

12.一种模型应用装置，应用于终端，包括：

13.根据权利要求12所述的装置，其中，所述目标数据为流数据，所述第一发送模块，具体用于：

14.一种模型应用装置，应用于第三节点，包括：

15.根据权利要求14所述的装置，其中，所述第二节点的数量包括M个，M为大于1的整数，所述第一控制模块，具体用于：

16.根据权利要求14所述的装置，其中，所述第二接收模块，具体用于：

17.根据权利要求15所述的装置，还包括：

18.根据权利要求17所述的装置，还包括：

19.根据权利要求18所述的装置，还包括：

20.一种模型应用装置，应用于第一节点，包括：

21.根据权利要求20所述的装置，其中，所述训练数据包括每个任务目标对应的第一行为数据，所述第一行为数据包括正样本行为数据和负样本行为数据，所述训练模块，具体用于：

22.根据权利要求20所述的装置，其中，所述目标数据为流数据，所述训练数据包括第二用户针对所述N个任务目标的第三行为数据，所述第三行为数据通过以下方式获取：

其中，所述行为信息包括以下至少一项：

所述流数据中目标操作信息确定的第一行为信息；

所述流数据中相邻两个操作信息确定的第二行为信息；

23.一种电子设备，包括：

至少一个处理器；以及

与所述至少一个处理器通信连接的存储器；其中，

所述存储器存储有可被所述至少一个处理器执行的指令，所述指令被所述至少一个处理器执行，以使所述至少一个处理器能够执行权利要求1-2中任一项所述的方法，或者权利要求3-8中任一项所述的方法，或者权利要求9-11中任一项所述的方法。

24.一种存储有计算机指令的非瞬时计算机可读存储介质，其中，所述计算机指令用于使所述计算机执行根据权利要求1-2中任一项所述的方法，或者权利要求3-8中任一项所述的方法，或者权利要求9-11中任一项所述的方法。

25.一种计算机程序产品，包括计算机程序，所述计算机程序在被处理器执行时实现根据权利要求1-2中任一项所述的方法，或者权利要求3-8中任一项所述的方法，或者权利要求9-11中任一项所述的方法。