CN113779386A

CN113779386A - 模型训练方法和信息推荐方法

Info

Publication number: CN113779386A
Application number: CN202110973960.6A
Authority: CN
Inventors: 曹雄; 田晓宇
Original assignee: Beijing Dajia Internet Information Technology Co Ltd
Current assignee: Beijing Dajia Internet Information Technology Co Ltd
Priority date: 2021-08-24
Filing date: 2021-08-24
Publication date: 2021-12-10
Anticipated expiration: 2041-08-24
Also published as: CN113779386B

Abstract

本公开关于一种模型训练方法和信息推荐方法，属于信息处理技术领域。该模型训练方法包括获取与第一类型账号对应的第一信息推荐模型；根据第一信息推荐模型，构造初始第二信息推荐模型；获取与第二类型账号对应的第二历史数据；其中，第二历史数据包括向第二类型账号推荐的第二历史推荐信息及其对应的反馈信息；根据第二历史数据对所述初始第二信息推荐模型进行训练，得到与第二类型账号对应的第二信息推荐模型；其中，第一类型账号的账号时间属性信息满足第一预设条件，第二类型账号的账号时间属性信息满足第二预设条件。采用本公开提供的模型训练方法和信息推荐方法，至少解决现有技术中信息推荐模型不够准确的问题。

Description

模型训练方法和信息推荐方法

技术领域

本公开涉及信息处理技术领域，尤其涉及一种模型训练方法和信息推荐方法。

背景技术

在这个信息爆炸的时代，如何准确地向用户推荐相关的信息，提高用户对推荐信息的点击率，成为亟待解决的问题。

现有技术中，在训练特定类型用户的信息推荐模型的过程中，例如向新用户推荐短视频的视频推荐模型，一种方式是，使用该特定类型用户有限的可参考数据，来训练信息推荐模型；另一种方式是，直接复用其他类型用户的信息推荐模型作为该特定类型用户的信息推荐模型，例如使用老用户推荐信息时所采用的信息推荐模型，向新用户推荐信息。

这样，一方面，由于特定类型用户的数据太少，因此，训练得到的信息推荐模型不够收敛，推荐模型的准确性不高，另一方面，由于不同类型的用户之间，用户偏好并不一致，因此，直接采用向其他类型用户推荐信息时所采用的推荐模型，会给特定类型用户的信息推荐结果带来偏差。综上两方面，会导致信息推荐模型不够准确。

发明内容

本公开提供一种模型训练方法和信息推荐方法，以至少解决现有信息推荐模型不够准确的问题。

本公开的技术方案如下：

根据本公开实施例的第一方面，提供一种模型训练方法，该方法可以包括：

获取与第一类型账号对应的第一信息推荐模型；

根据所述第一信息推荐模型，构造初始第二信息推荐模型；

获取与第二类型账号对应的第二历史数据；其中，所述第二历史数据包括向所述第二类型账号推荐的第二历史推荐信息及其对应的反馈信息；

根据所述第二历史数据对所述初始第二信息推荐模型进行训练，得到与所述第二类型账号对应的第二信息推荐模型；

其中，所述第一类型账号的账号时间属性信息满足第一预设条件，所述第二类型账号的账号时间属性信息满足第二预设条件。

在其中一个实施例中，上述涉及的第一信息推荐模型包括嵌入层和N个第一隐藏层；

上述涉及的根据所述第一信息推荐模型，构造初始第二信息推荐模型，包括：

根据所述嵌入层和所述N个第一隐藏层中的M个第一隐藏层，构造所述初始第二信息推荐模型，所述初始第二信息推荐模型包括所述嵌入层、所述M个第一隐藏层、L个第二隐藏层和第二输出层；

其中，N、M、L为正整数，N≥M。

基于此，在其中一个实施例中，上述涉及的根据所述第二历史数据对所述初始第二信息推荐模型进行训练，得到与所述第二类型账号对应的第二信息推荐模型，包括：

将所述第二历史推荐信息输入至所述嵌入层，输出得到第一特征信息；

将所述第一特征信息输入至所述M个第一隐藏层，输出得到第二特征信息；

将所述第一特征信息与所述第二特征信息拼接为第三特征信息，将所述第三特征信息输入至所述L个第二隐藏层，输出得到第四特征信息；

将所述第四特征信息输入至所述第二输出层，输出得到第一结果；

根据所述第一结果以及与所述第二历史推荐信息对应的反馈信息，调整所述初始第二信息推荐模型的参数，以得到与所述第二类型账号对应的第二信息推荐模型。

在其中一个实施例中，上述涉及的获取与第一类型账号对应的第一信息推荐模型，包括：

获取与所述第一类型账号对应的第一历史数据；其中，所述第一历史数据包括第一历史推荐信息及其对应的反馈信息；

根据所述第一历史数据对初始第一信息推荐模型进行训练，得到与所述第一类型账号对应的所述第一信息推荐模型。

在其中一个实施例中，上述涉及的初始第一信息推荐模型包括嵌入层、N个第一隐藏层和第一输出层；

上述涉及的根据所述第一历史数据对初始第一信息推荐模型进行训练，得到与所述第一类型账号对应的所述第一信息推荐模型，包括：

将所述第一历史推荐信息输入至所述嵌入层，得到第五特征信息；

将所述第五特征信息输入至所述N个第一隐藏层，得到第六特征信息；

将所述第六特征信息输入至所述第一输出层，输出得到第二结果；

根据所述第二结果以及与所述第一历史推荐信息对应的反馈信息，调整所述初始第一信息推荐模型的参数，以得到与所述第一类型账号对应的所述第一信息推荐模型。

基于上述各实施例，在其中一个实施例中，上述涉及的第一预设条件为在信息推荐平台上的累积在线时长大于预设在线时长；所述第二预设条件为在所述信息推荐平台上的累积在线时长不大于所述预设在线时长。

根据本公开实施例的第二方面，提供一种信息推荐方法，该方法可以包括：

接收在客户端上登录信息推荐平台的账号发送的信息推荐请求；其中，所述推荐请求中包括所述账号的账号时间属性信息；

响应于所述信息推荐请求，获取推荐信息集合；其中，所述推荐信息集合包括多个推荐信息；

在所述账号时间属性信息满足第二预设条件的情况下，将所述推荐信息集合输入至信息推荐模型，得到所述多个推荐信息的推荐顺序；其中，所述信息推荐模型为根据如第一方面的任一项实施例中所示的模型训练方法训练得到的第二信息推荐模型；

按照所述推荐顺序，向所述账号推送所述多个推荐信息。

基于此，在其中一个实施例中，上述涉及的第二预设条件为在所述信息推荐平台上的累积在线时长不大于预设在线时长。

根据本公开实施例的第三方面，提供一种模型训练装置，该装置可以包括：

模型获取模块，被配置为执行获取与第一类型账号对应的第一信息推荐模型；

模型构造模块，被配置为执行根据所述第一信息推荐模型，构造初始第二信息推荐模型；

数据获取模块，被配置为执行获取与第二类型账号对应的第二历史数据；其中，所述第二历史数据包括向所述第二类型账号推荐的第二历史推荐信息及其对应的反馈信息；

模型训练模块，被配置为执行根据所述第二历史数据对所述初始第二信息推荐模型进行训练，得到与所述第二类型账号对应的第二信息推荐模型；

上述涉及的模型构造模块，包括：

构造子模块，被配置为执行根据所述嵌入层和所述N个第一隐藏层中的M个第一隐藏层，构造所述初始第二信息推荐模型，所述初始第二信息推荐模型包括所述嵌入层、所述M个第一隐藏层、L个第二隐藏层和第二输出层；

其中，N、M、L为正整数，N≥M。

基于此，在其中一个实施例中，上述涉及的模型训练模块包括：

第一输入子模块，被配置为执行将所述第二历史推荐信息输入至所述嵌入层，输出得到第一特征信息；

第二输入子模块，被配置为执行将所述第一特征信息输入至所述M个第一隐藏层，输出得到第二特征信息；

第三输入子模块，被配置为执行将所述第一特征信息与所述第二特征信息拼接为第三特征信息，将所述第三特征信息输入至所述L个第二隐藏层，输出得到第四特征信息；

第四输入子模块，被配置为执行将所述第四特征信息输入至所述第二输出层，输出得到第一结果；

参数调整子模块，被配置为执行根据所述第一结果以及与所述第二历史推荐信息对应的反馈信息，调整所述初始第二信息推荐模型的参数，以得到与所述第二类型账号对应的第二信息推荐模型。

在其中一个实施例中，上述涉及的模型获取模块，包括：

获取子模块，被配置为执行获取与所述第一类型账号对应的第一历史数据；其中，所述第一历史数据包括第一历史推荐信息及其对应的反馈信息；

训练子模块，被配置为执行根据所述第一历史数据对初始第一信息推荐模型进行训练，得到与所述第一类型账号对应的所述第一信息推荐模型。

上述涉及的训练子模块，包括：

第一输入单元，被配置为执行将所述第一历史推荐信息输入至所述嵌入层，得到第五特征信息；

第二输入单元，被配置为执行将所述第五特征信息输入至所述N个第一隐藏层，得到第六特征信息；

第三输入单元，被配置为执行将所述第六特征信息输入至所述第一输出层，输出得到第二结果；

参数调整单元，被配置为执行根据所述第二结果以及与所述第一历史推荐信息对应的反馈信息，调整所述初始第一信息推荐模型的参数，以得到与所述第一类型账号对应的所述第一信息推荐模型。

根据本公开实施例的第四方面，提供一种信息推荐装置，该装置可以包括：

接收模块，被配置为执行接收在客户端上登录信息推荐平台的账号发送的信息推荐请求；其中，所述推荐请求中包括所述账号的账号时间属性信息；

集合获取模块，被配置为执行响应于所述信息推荐请求，获取推荐信息集合；其中，所述推荐信息集合包括多个推荐信息；

输入模块，被配置为执行在所述账号时间属性信息满足第二预设条件的情况下，将所述推荐信息集合输入至信息推荐模型，得到所述多个推荐信息的推荐顺序；其中，所述信息推荐模型为根据如第一方面的任一项实施例中所示的模型训练方法训练得到的第二信息推荐模型；

推送模块，被配置为执行按照所述推荐顺序，向所述账号推送所述多个推荐信息。

根据本公开实施例的第五方面，提供一种电子设备，该电子设备可以包括：

处理器；

用于存储所述处理器可执行指令的存储器；

其中，所述处理器被配置为执行所述指令，以实现如第一方面的任一项实施例中所示的模型训练方法或第二方面的任一项实施例中所示的信息推荐方法。

根据本公开实施例的第六方面，提供一种计算机可读存储介质，当计算机可读存储介质中的指令由电子设备执行时，以使电子设备实现如第一方面的任一项实施例中所示的模型训练方法或第二方面的任一项实施例中所示的信息推荐方法。

根据本公开实施例的第七方面，提供一种计算机程序产品，该计算机程序产品包括计算机程序，该计算机程序存储在计算机可读存储介质中，电子设备的至少一个处理器从计算机可读存储介质读取并执行计算机程序，使得电子设备执行第一方面的任一项实施例中所示的模型训练方法或第二方面的任一项实施例中所示的信息推荐方法。

本公开的实施例提供的技术方案至少带来以下有益效果：

本公开实施例通过利用与第一类型账号对应的第一信息推荐模型，构造初始第二信息推荐模型，使得在对初始第二信息推荐模型进行训练生成第二信息推荐模型的过程中，可以参考已训练的第一信息推荐模型，从而减少模型训练次数，帮助模型快速收敛。另外，本公开实施例还通过使用第二类型账号对应的第二历史数据，对初始第二信息推荐模型进行训练，进而避免直接使用第一推荐模型作为第二类型账号的推荐模型时可能带来的偏差。综上，本公开实施例提供的模型训练方法可以提高信息推荐模型的准确性。

应当理解的是，以上的一般描述和后文的细节描述仅是示例性和解释性的，并不能限值本公开。

附图说明

此处的附图被并入说明书中并构成本说明书的一部分，示出了符合本公开的实施例，并与说明书一起用于解释本公开的原理，并不构成对本公开的不当限定。

图1是根据一示例性实施例示出的一种信息推荐的架构图；

图2是根据一示例性实施例示出的一种模型训练方法的流程图；

图3是根据一示例性实施例示出的一种神经网络的结构图；

图4是根据一示例性实施例示出的一种信息推荐方法的流程图；

图5是根据一示例性实施例示出的一种模型训练装置的结构框图；

图6是根据一示例性实施例示出的一种信息推荐装置的结构框图；

图7是根据一示例性实施例示出的一种电子设备的结构框图。

具体实施方式

为了使本领域普通人员更好地理解本公开的技术方案，下面将结合附图，对本公开实施例中的技术方案进行清楚、完整地描述。

需要说明的是，本公开的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象，而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换，以便这里描述的本公开的实施例能够以除了在这里图示或描述的那些以外的顺序实施。以下示例性实施例中所描述的实施方式并不代表与本公开相一致的所有实施方式。相反，它们仅是与如所附权利要求书中所详述的、本公开的一些方面相一致的装置和方法的例子。

本公开所提供的信息推荐方法，可以应用于如图1所示的架构中，具体结合图1进行详细说明。

图1是根据一示例性实施例示出的一种信息推荐的架构图。

如图1所示，该架构图中可以包括至少一个客户端10和服务器11。用户可通过登录任一客户端10，与服务器11建立网络连接并进行信息交互。其中，客户端10可以是手机、平板电脑、一体机等具有通讯功能的设备，也可以是虚拟机或模拟器模拟的设备。服务器11可以是云服务器或者服务器集群等具有存储以及计算功能的设备。

基于上述架构，用户可以在客户端10登录信息推荐平台，通过客户端10向服务器11发送信息推荐请求，服务器11接收到该信息推荐请求后，通过信息推荐模型得到多个推荐信息的推荐顺序，并按照该推荐顺序将多个推荐信息发送给客户端10。

目前，通常采用以下两种方式来训练特定类型用户的信息推荐模型：一是，使用该特定类型用户有限的可参考数据，来训练信息推荐模型；二是，直接复用其他类型用户的信息推荐模型作为该特定类型用户的信息推荐模型。但是，由于特定类型用户的数据太少，第一种方式训练得到的信息推荐模型不够收敛，推荐模型的准确性不高；由于不同类型的用户之间，用户偏好并不一致，第二种方式训练得到的信息推荐模型会给特定类型用户的信息推荐结果带来偏差。因此，目前的两种方式均会导致信息推荐模型不够准确。

由此，为了提高信息推荐模型的准确性，本公开实施例通过如下方式对信息推荐模型进行训练。首先，获取与第一类型账号对应的第一历史数据，并根据第一历史数据对初始第一信息推荐模型进行训练，得到与第一类型账号对应的第一信息推荐模型；然后将第一信息推荐模型中包括的嵌入层与部分或全部的第一隐藏层共享给第二信息推荐模型，以构造初始第二信息推荐模型；再获取与第二类型账号对应的第二历史数据；然后，根据第二历史数据对初始第二信息推荐模型进行训练，得到与第二类型账号对应的第二信息推荐模型。

这样，在对初始第二信息推荐模型进行训练生成第二信息推荐模型的过程中，可以参考已训练的第一信息推荐模型，从而减少模型训练次数，帮助模型快速收敛，并且使用第二历史数据对初始第二信息推荐模型进行训练，避免了直接使用第一推荐模型作为第二类型账号的推荐模型时可能带来的偏差。因此，上述模型训练方法可以提高信息推荐模型的准确性。

根据上述架构以及应用场景，下面结合图2-图3对本公开实施例提供的模型训练方法进行详细说明。

图2是根据一示例性实施例示出的一种模型训练方法的流程图。该模型训练方法可以由任一具有计算功能的电子设备来执行。

如图2所示，该模型训练方法具体可以包括如下步骤：

步骤210，获取与第一类型账号对应的第一信息推荐模型。

步骤220，根据第一信息推荐模型，构造初始第二信息推荐模型。

步骤230，获取与第二类型账号对应的第二历史数据。

步骤240，根据第二历史数据对初始第二信息推荐模型进行训练，得到与第二类型账号对应的第二信息推荐模型。

由此，通过利用与第一类型账号对应的第一信息推荐模型，构造初始第二信息推荐模型，使得在对初始第二信息推荐模型进行训练生成第二信息推荐模型的过程中，可以参考已训练的第一信息推荐模型，从而减少模型训练次数，帮助模型快速收敛。另外，本公开实施例还通过使用第二类型账号对应的第二历史数据，对初始第二信息推荐模型进行训练，进而避免直接使用第一推荐模型作为第二类型账号的推荐模型时可能带来的偏差。综上，本公开实施例提供的模型训练方法可以提高信息推荐模型的准确性。

下面对上述步骤进行详细说明，具体如下所示：

首先，涉及步骤210，本公开实施例中第一类型账号可以是信息推荐平台的老用户使用的账号，第二类型账号可以是信息推荐平台的新用户使用的账号，其中，信息推荐平台包括但不限于短视频平台，该短视频平台可以向老用户和新用户推荐短视频。

这里，第一信息推荐模型可以为满足第一预设条件的账号所对应的信息推荐模型，该第一信息推荐模型可用于向老用户推荐信息。其中，第一信息推荐模型可以是使用第一类型账号对应的第一历史数据训练过的模型，该模型已收敛。推荐的信息可以是文字信息、图片信息、视频信息等，具体可根据信息推荐平台的服务类型来确定，在此不作限定。

另外，第一类型账号与第二类型账号之间的账号类型划分方式包括但不限于通过时间属性信息来区分，其中，时间属性信息包括但不限于在信息推荐平台上的注册时间、在线时长等。具体的，第一类型账号的账号时间属性信息满足第一预设条件，第二类型账号的账号时间属性信息满足第二预设条件。这里，第一预设条件可以是累积在线时长大于预设时长，也可以是预设时间段内累积在线时长大于预设时长，还可以是账号注册时长大于预设时长等。第二预设条件可以是累积在线时长不大于预设时长，也可以是预设时间段内累积在线时长不大于预设时长，还可以是账号注册时长不大于预设时长等。

在一种可选的实施方式中，第一预设条件可以为在信息推荐平台上的累积在线时长大于预设在线时长；第二预设条件可以为在信息推荐平台上的累积在线时长不大于预设在线时长。

在一个具体例子中，预设在线时长为20小时，所以，在短视频平台上的累积在线时长大于20小时的账号为老用户账号，也即第一类型账号；在短视频平台上的累积在线时长不大于20小时的账号为新用户账号，也即第二类型账号。

如此，通过累积在线时长来区分不同类型的用户，可以使新老用户区分地更准确，从而提高信息推荐模型的针对性。

具体的，在一种可选的实施方式中，上述步骤210可以包括：

获取与第一类型账号对应的第一历史数据；

根据第一历史数据对初始第一信息推荐模型进行训练，得到与第一类型账号对应的第一信息推荐模型。

这里，第一历史数据可以包括第一历史推荐信息及其对应的反馈信息，该第一历史数据可以作为训练初始第一信息推荐模型时所使用的训练样本。其中，第一历史推荐信息可以包括已经推荐给第一类型账号的历史信息，具体的，当信息推荐平台为短视频平台时，第一历史推荐信息可以为历史推荐给老用户的短视频；反馈信息可以包括正反馈和/或负反馈，具体的，正反馈可以为老用户，也即第一类型账号所属用户，针对第一历史推荐信息所进行的选择操作，相应的，负反馈可以为老用户针对第一历史推荐信息的非选择操作。这里，该第一历史数据可以通过访问第一类型账号的操作日志来获取。

示例性的，可以将该第一历史数据输入到初始第一信息推荐模型中，以对该初始第一信息推荐模型进行训练，待初始第一信息推荐模型收敛后，可得到第一信息推荐模型。初始第一信息推荐模型可以为预设的未经训练的神经网络，该初始第一信息推荐模型可用于经训练得到第一信息推荐模型。

在一个具体例子中，可以在一个短视频平台，获取累积在线时长超过20小时的账号的历史推荐视频，以及该账号所属用户是否点击该历史推荐视频的操作日志，将获取到的相应数据输入到预先设置的神经网络中，对该神经网络进行训练，即可得到该账号对应的收敛的信息推荐模型，也即第一信息推荐模型。

如此，使用老用户的历史数据对神经网络进行训练，这样，在训练新用户的神经网络时，可以参考到老用户的历史数据，解决了新用户可参考的历史数据有限的问题。

基于此，在一种可选的实施方式中，上述初始第一信息推荐模型可以包括嵌入层、N个第一隐藏层和第一输出层；

上述根据第一历史数据对初始第一信息推荐模型进行训练，得到与第一类型账号对应的第一信息推荐模型，具体可以包括：

将第一历史推荐信息输入至嵌入层，得到第五特征信息；

将第五特征信息输入至N个第一隐藏层，得到第六特征信息；

将第六特征信息输入至第一输出层，输出得到第二结果；

根据第二结果以及与第一历史推荐信息对应的反馈信息，调整初始第一信息推荐模型的参数，以得到与第一类型账号对应的第一信息推荐模型。

这里，初始第一信息推荐模型可以为未经训练的多层感知机(MultilayerPerceptron，MLP)，该MLP中可以包括一个嵌入层以及一个或多个隐藏层，也即N个第一隐藏层，当然，还可以包括其他的层，例如第一输出层。

示例性地，以N＝2为例，初始第一信息推荐模型可以包括嵌入层和两个隐藏层，也即隐藏层a和隐藏层b。具体的，在对第一信息推荐模型的训练过程中，可以将第一历史数据中的第一历史推荐信息输入至嵌入层，得到嵌入层输出的第五特征信息，再将该第五特征信息输入至隐藏层a，并将输出结果再输入至隐藏层b，得到隐藏层b输出的第六特征信息，最后，将该第六特征信息输入至第一输出层，进而得到初始第一信息推荐模型最终输出的第二结果。这样，可根据该第二结果，以及第一历史数据中与该第一历史推荐信息对应的反馈信息，调整该模型的参数，直至模型收敛，从而可得到第一信息推荐模型。当然，以上仅仅是举例，初始第一信息推荐模型中包括的第一隐藏层的数量可以是一个，也可以是其他多个。

在一个具体例子中，可将老用户的历史推荐信息顺序输入至嵌入层、一个或多个第一隐藏层以及输出层，进而利用最终的输出结果，并参考该历史推荐信息对应的老用户的反馈信息，对老用户塔的神经网络进行训练，进而可得到用于为老用户推荐视频的老用户塔，也即第一信息推荐模型。

这样，通过在初始第一信息推荐模型中设置嵌入层和N个第一隐藏层，并利用第一类型账号的历史数据对初始第一信息推荐模型进行训练，进而得到经训练的第一信息推荐模型，如此，可为构造第二类型账号对应的初始第二信息推荐模型提供基础，为将第一信息推荐模型中训练好的嵌入层和部分或全部隐藏层共享给初始第二信息推荐模型，以作为训练基础提供准备。

其次，涉及步骤220，初始第二信息推荐模型可以为根据第一信息推荐模型生成的未经训练的神经网络，该初始第二信息推荐模型经训练并收敛后可成为第二信息推荐模型。这里，初始第二信息推荐模型可根据第一信息推荐模型中的某一层或某几层生成，也即，第一信息推荐模型中的某一层或某几层，可构成初始第二信息推荐模型中的一层，进而帮助初始第二信息推荐模型在训练过程中能够快速收敛。

在一种可选的实施方式中，上述涉及的第一信息推荐模型可以包括嵌入层和N个第一隐藏层，因此，上述步骤220具体可以包括：

根据嵌入层和N个第一隐藏层中的M个第一隐藏层，构造初始第二信息推荐模型，初始第二信息推荐模型包括嵌入层、M个第一隐藏层、L个第二隐藏层和第二输出层；

其中，N、M、L为正整数，N≥M。

这里，第一信息推荐模型可以为经训练的多层感知机(Multilayer Perceptron，MLP)，该MLP中可以包括一个嵌入层以及一个或多个隐藏层，也即N个第一隐藏层，当然，还可以包括其他的层，例如第一输出层。类似地，初始第二信息推荐模型也可以为MLP，该MLP中可包括第一信息推荐模型的嵌入层和部分或全部的N个第一隐藏层，以及其他隐藏层，也即L个第二隐藏层。此外，初始第二信息推荐模型还可包括其他的层，例如第二输出层。

其中，隐藏层可用于对输入的特征进行多层次的抽象，以更好地线性划分不同类型的数据；嵌入层可用于将获取到的训练样本或数据翻译为特征向量。具体的，可以将第一信息推荐模型的嵌入层和部分第一隐藏层作为初始第二信息推荐模型的一部分，当然，也可以将第一信息推荐模型的嵌入层和全部第一隐藏层作为初始第二信息推荐模型的一部分，在此不做限定。

在一个具体例子中，可以将老用户的信息推荐模型的嵌入层和一个隐藏层，作为新用户的初始神经网络的一部分，来训练生成新用户的信息推荐模型。

如此，可以根据老用户信息推荐模型的嵌入层和隐藏层来生成新用户的初始信息推荐模型，使新用户的初始信息推荐模型可以直接在老用户信息推荐模型的基础上进行训练，减少训练时所需的样本数据，帮助新用户的初始信息推荐模型快速收敛。

再次，涉及步骤230，第二历史数据可以包括第二历史推荐信息及其对应的反馈信息，该第二历史数据可以作为训练初始第二信息推荐模型时所使用的训练样本。其中，第二历史推荐信息可以包括已经推荐给第二类型账号的历史信息，具体的，当信息推荐平台为短视频平台时，第二历史推荐信息可以为历史推荐给新用户的短视频。另外，反馈信息可以包括正反馈和/或负反馈，具体的，正反馈可以为新用户，也即第二类型账号所属用户，针对第二历史推荐信息所进行的选择操作，相应的，负反馈可以为新用户针对第二历史推荐信息的非选择操作。这里，该第二历史数据可以通过访问第二类型账号的操作日志来获取。例如，可以通过访问操作日志来获取累积在线时长不大于20小时的新用户账号的历史推荐视频，以及新用户是否点击该历史推荐视频的操作日志。

然后，涉及步骤240，第二信息推荐模型可以为满足第二预设条件的账号所对应的信息推荐模型，该第二信息推荐模型可用于向新用户推荐信息。其中，第二信息推荐模型可以是使用第二类型账号对应的第二历史数据训练过的模型，该模型已收敛。例如，可以将新用户账号的历史推荐视频以及新用户是否点击该推荐视频的反馈，作为训练样本，输入到初始第二信息推荐模型，进行训练，得到收敛的针对新用户的信息推荐模型，也即第二信息推荐模型。

基于此，在初始第二信息推荐模型包括嵌入层、M个第一隐藏层、L个第二隐藏层和第二输出层的条件下，在一种可选的实施方式中，上述步骤240具体可以包括：

将第二历史推荐信息输入至嵌入层，输出得到第一特征信息；

将第一特征信息输入至M个第一隐藏层，输出得到第二特征信息；

将第一特征信息与第二特征信息拼接为第三特征信息，将第三特征信息输入至L个第二隐藏层，输出得到第四特征信息；

将第四特征信息输入至第二输出层，输出得到第一结果；

根据第一结果以及与第二历史推荐信息对应的反馈信息，调整初始第二信息推荐模型的参数，以得到与第二类型账号对应的第二信息推荐模型。

示例性地，以N＝2、M＝1、L＝2为例，第一信息推荐模型可以包括嵌入层和两个隐藏层，也即隐藏层a和隐藏层b。可将嵌入层和隐藏层b，作为初始第二信息推荐模型的输入，生成初始第二信息推荐模型。另外，初始第二信息推荐模型还可以包括隐藏层c、隐藏层d和输出层。具体的，在对第二信息推荐模型的训练过程中，可以将第二历史数据中的第二历史推荐信息输入至嵌入层，得到嵌入层输出的第一特征信息，然后，将第一特征信息输入至隐藏层b，得到隐藏层b输出的第二特征信息，再将第一特征信息和第二特征信息进行拼接处理，得到第三特征信息，进而将该第三特征信息输入至隐藏层c，再将输出结果输入至隐藏层d，最后将隐藏层d输出的结果输入至输出层，得到该初始第二信息推荐模型最终输出的第一结果。这样，可根据该第一结果，以及第二历史数据中与该第二历史推荐信息对应的反馈信息，调整该模型的参数，直至模型收敛，从而可得到第二信息推荐模型。

在一个具体例子中，如图3所示，在老用户塔30中，以老用户点击为训练目标，使用老用户的历史数据对神经网络进行训练，待模型收敛后，可以将老用户塔30中神经网络的嵌入层31和隐藏层32共享给新用户塔40，作为新用户塔40中神经网络的输入。然后，以新用户点击为训练目标，使用新用户的历史数据对该新用户塔40的神经网络进行训练，直至模型收敛。这里，老用户塔30可以是第一推荐模型的训练塔，新用户塔40可以是第二推荐模型的训练塔。

如此，通过直接使用已收敛的第一信息推荐模型中的嵌入层和部分或全部隐藏层，作为初始第二信息推荐模型的一部分，并通过使用第二历史数据来训练包含第一信息推荐模型中嵌入层和部分或全部第一隐藏层的初始第二信息推荐模型，可以在提高第二信息推荐模型训练的准确性的同时，使第二信息推荐模型的训练过程能够参考第一信息推荐模型，从而进一步降低模型训练次数，使初始第二信息推荐模型更快收敛。

下面结合图4对本公开实施例提供的信息推荐方法进行详细说明。

图4是根据一示例性实施例示出的一种信息推荐方法的流程图。该信息推荐方法可以由图1所示架构中的服务器11来执行。

如图4所示，该信息推荐方法具体可以包括如下步骤：

首先，步骤410，接收在客户端上登录信息推荐平台的账号发送的信息推荐请求。

其次，步骤420，响应于信息推荐请求，获取推荐信息集合。

再次，步骤430，在账号时间属性信息满足第二预设条件的情况下，将推荐信息集合输入至信息推荐模型，得到多个推荐信息的推荐顺序。

然后，步骤440，按照推荐顺序，向账号推送多个推荐信息。

由此，通过按照上述所涉及的模型训练方法训练得到的信息推荐模型，可以在接收到来自账号时间属性信息满足第二预设条件的账号所发送的信息推荐请求时，针对该特定类型的用户，利用该信息推荐模型对推荐信息集合中包括的多个推荐信息进行排序，进而按照该推荐顺序，向该特定类型用户推送该推荐信息，由于使用的信息推荐模型更加精确，同时也具有对该特定类型用户的针对性，因此，可以使该特定类型用户接收到的推荐信息更满足用户的喜好，从而可以提高推荐信息的点击率，提升推荐效果。

下面对上述步骤进行详细说明，具体如下所示：

首先，涉及步骤410，本公开实施例中信息推荐平台包括但不限于短视频平台，该短视频平台可以向老用户和新用户分别推荐短视频。

另外，在信息推荐平台为短视频平台的情况下，信息推荐请求可以是获取短视频的请求，该信息推荐请求可以是用户登录客户端时发送，也可以是用户在客户端上切换到视频推荐界面时发送。该信息推荐请求中可以包括账号的账号时间属性信息，其中，账号时间属性信息包括但不限于在信息推荐平台上的注册时间、在线时长等。该信息推荐请求可用于触发服务器进行信息推送。

其次，涉及步骤420，推荐信息集合可以包括多个推荐信息，其中，推荐信息可以是文字信息、图片信息、视频信息等，具体可根据信息推荐平台的服务类型来确定，在此不作限定。例如，对于短视频推荐平台，推荐信息集合可以是召回的短视频的集合。这里，召回的短视频包括但不限于用户上传的短视频。

另外，针对不同类型的账号，服务器可对应设置不同的推荐信息集合，当然，也可设置相同的推荐信息集合，在此不作限定。

示例性的，可将服务器获取到的推荐信息集合作为信息推荐模型的输入，以通过信息推荐模型对该推荐信息集合中的多个推荐信息进行排序。

再次，涉及步骤430，信息推荐模型可以为根据上述实施例记载的模型训练方法训练得到的第二信息推荐模型。推荐顺序可以为将推荐信息推送给该账号进行展示时的排列顺序。

示例性的，将推荐信息集合输入至信息推荐模型后，该信息推荐模型可输出推荐信息集合中包括的各个推荐信息及其对应的被用户选择的概率值，然后，按照概率值的大小，对推荐信息集合中包括的多个推荐信息进行排序，作为该多个推荐信息在客户端展示时的推荐顺序。

这里，第二预设条件可以是累积在线时长不大于预设时长，也可以是预设时间段内累积在线时长不大于预设时长，还可以是账号注册时长不大于预设时长等。

基于此，在一种可选的实施方式中，第二预设条件可以为在信息推荐平台上的累积在线时长不大于预设在线时长。

在一个具体例子中，预设在线时长为20小时，在短视频平台上的累积在线时长不大于20小时的账号的时间属性信息满足该第二预设条件，也即，说明发送该信息推荐请求的账号为新用户账号。

如此，可以通过该第二预设条件判定该账号是否为新用户账号，是否使用新用户的信息推荐模型向该账号推送推荐信息。

然后，涉及步骤440，在输出确定多个推荐信息的推荐顺序后，可根据该推荐顺序，将推荐信息依次发送给账号所在的客户端，当然，也可以是将推荐顺序信息以及整个推荐信息集合发送给账号所在的客户端，以使客户端根据该推荐顺序信息，对推荐信息集合中包括的多个推荐信息进行排列后展示出来。

为了更好地描述整个方案，基于上述信息推荐方法的实施例，举一个具体例子。

在一个具体例子中，用户在客户端上登录短视频平台，此时，服务器会接收到该用户账号发送的短视频推荐请求，进而响应于该请求获取包括多个推荐短视频的推荐短视频集合。若该账号的视频推荐请求中携带的账号时间属性为累积在线时长10小时，满足累积在线时长不大于20小时的第二预设条件，也就是说，检测到该用户为新用户，则将上述视频集合输入到新用户的信息推荐模型中，得到该多个推荐短视频的推荐顺序，然后按照得出的推荐顺序，向该用户依次推送该多个推荐短视频。

需要说明的是，上述本公开实施例描述的应用场景是为了更加清楚的说明本公开实施例的技术方案，并不构成对于本公开实施例提供的技术方案的限定，本领域普通技术人员可知，随着新应用场景的出现，本公开实施例提供的技术方案对于类似的技术问题，同样适用。

基于相同的发明构思，本公开还提供了一种模型训练装置。具体结合图5进行详细说明。

图5是根据一示例性实施例示出的一种模型训练装置的结构示意图。

如图5所示，该模型训练装置5具体可以包括：

模型获取模块501，被配置为执行获取与第一类型账号对应的第一信息推荐模型；

模型构造模块502，被配置为执行根据第一信息推荐模型，构造初始第二信息推荐模型；

数据获取模块503，被配置为执行获取与第二类型账号对应的第二历史数据；其中，第二历史数据包括向第二类型账号推荐的第二历史推荐信息及其对应的反馈信息；

模型训练模块504，被配置为执行根据第二历史数据对初始第二信息推荐模型进行训练，得到与第二类型账号对应的第二信息推荐模型；

其中，第一类型账号的账号时间属性信息满足第一预设条件，第二类型账号的账号时间属性信息满足第二预设条件。

下面对上述模型训练装置5进行详细说明，具体如下所示：

上述涉及的模型构造模块502,可以包括：

构造子模块，被配置为执行根据嵌入层和N个第一隐藏层中的M个第一隐藏层，构造初始第二信息推荐模型，初始第二信息推荐模型包括嵌入层、M个第一隐藏层、L个第二隐藏层和第二输出层；

其中，N、M、L为正整数，N≥M。

基于此，在其中一个实施例中，上述涉及模型训练模块504可以包括：

第一输入子模块，被配置为执行将第二历史推荐信息输入至嵌入层，输出得到第一特征信息；

第二输入子模块，被配置为执行将第一特征信息输入至M个第一隐藏层，输出得到第二特征信息；

第三输入子模块，被配置为执行将第一特征信息与第二特征信息拼接为第三特征信息，将第三特征信息输入至L个第二隐藏层，输出得到第四特征信息；

第四输入子模块，被配置为执行将第四特征信息输入至第二输出层，输出得到第一结果；

参数调整子模块，被配置为执行根据第一结果以及与第二历史推荐信息对应的反馈信息，调整初始第二信息推荐模型的参数，以得到与第二类型账号对应的第二信息推荐模型。

在其中一个实施例中，上述涉及的模型获取模块501，可以包括：

获取子模块，被配置为执行获取与第一类型账号对应的第一历史数据；其中，第一历史数据包括第一历史推荐信息及其对应的反馈信息；

训练子模块，被配置为执行根据第一历史数据对初始第一信息推荐模型进行训练，得到与第一类型账号对应的第一信息推荐模型。

上述涉及的训练子模块，包括：

第一输入单元，被配置为执行将第一历史推荐信息输入至嵌入层，得到第五特征信息；

第二输入单元，被配置为执行将第五特征信息输入至N个第一隐藏层，得到第六特征信息；

第三输入单元，被配置为执行将第六特征信息输入至第一输出层，输出得到第二结果；

参数调整单元，被配置为执行根据第二结果以及与第一历史推荐信息对应的反馈信息，调整初始第一信息推荐模型的参数，以得到与第一类型账号对应的第一信息推荐模型。

基于上述各实施例，在其中一个实施例中，上述涉及的第一预设条件为在信息推荐平台上的累积在线时长大于预设在线时长；第二预设条件为在信息推荐平台上的累积在线时长不大于预设在线时长。

图6是根据一示例性实施例示出的一种信息推荐装置的结构示意图。

如图6所示，该信息推荐装置6具体可以包括：

接收模块601，被配置为执行接收在客户端上登录信息推荐平台的账号发送的信息推荐请求；其中，推荐请求中包括账号的账号时间属性信息；

集合获取模块602，被配置为执行响应于信息推荐请求，获取推荐信息集合；其中，推荐信息集合包括多个推荐信息；

输入模块603，被配置为执行在账号时间属性信息满足第二预设条件的情况下，将推荐信息集合输入至信息推荐模型，得到多个推荐信息的推荐顺序；其中，信息推荐模型为根据本公开实施例记载的模型训练方法训练得到的第二信息推荐模型；

推送模块604，被配置为执行按照推荐顺序，向账号推送多个推荐信息。

基于此，在其中一个实施例中，上述涉及的第二预设条件为在信息推荐平台上的累积在线时长不大于预设在线时长。

基于同一发明构思，本公开实施例还提供了一种电子设备，具体结合图7进行详细说明。

图7是根据一示例性实施例示出的一种电子设备的结构框图。

如图7所示，该电子设备7能够实现根据本公开实施例中的模型训练方法和信息推荐方法以及模型训练装置和信息推荐装置的电子设备的示例性硬件架构的结构图。

该电子设备7可以包括处理器701以及存储有计算机程序指令的存储器702。

具体地，上述处理器701可以包括中央处理器(CPU)，或者特定集成电路(application specific integrated circuit，ASIC)，或者可以被配置成实施本申请实施例的一个或多个集成电路。

存储器702可以包括用于信息或指令的大容量存储器。举例来说而非限制，存储器702可包括硬盘驱动器(hard disk drive，HDD)、软盘驱动器、闪存、光盘、磁光盘、磁带或通用串行总线(universal serial bus，USB)驱动器或者两个及其以上这些的组合。在合适的情况下，存储器702可包括可移除或不可移除(或固定)的介质。在合适的情况下，存储器702可在综合网关设备的内部或外部。在特定实施例中，存储器702是非易失性固态存储器。在特定实施例中，存储器702包括只读存储器(ROM)。在合适的情况下，该ROM可以是掩模编程的ROM、可编程ROM(PROM)、可擦除PROM(EPROM)、电可擦除PROM(EEPROM)、电可改写ROM(EAROM)或闪存，或者两个或及其以上这些的组合。

在电子设备7为电子设备时，对应的，处理器701通过读取并执行存储器702中存储的计算机程序指令，以执行如下步骤：

处理器701，执行获取与第一类型账号对应的第一信息推荐模型；根据第一信息推荐模型，构造初始第二信息推荐模型；获取与第二类型账号对应的第二历史数据；其中，第二历史数据包括向第二类型账号推荐的第二历史推荐信息及其对应的反馈信息；根据第二历史数据对初始第二信息推荐模型进行训练，得到与第二类型账号对应的第二信息推荐模型；其中，第一类型账号的账号时间属性信息满足第一预设条件，第二类型账号的账号时间属性信息满足第二预设条件。

在其中一个实施例中，处理器701具体执行根据嵌入层和N个第一隐藏层中的M个第一隐藏层，构造初始第二信息推荐模型，初始第二信息推荐模型包括嵌入层、M个第一隐藏层、L个第二隐藏层和第二输出层；

其中，N、M、L为正整数，N≥M。

基于此，在其中一个实施例中，处理器701还执行将嵌入层与第二隐藏层连接，作为初始第二信息推荐模型的输入层，生成初始第二信息推荐模型；其中，初始第二信息推荐模型包括输入层、第三隐藏层和第四隐藏层。

在其中一个实施例中，上述涉及的处理器701还执行将第二历史推荐信息输入至嵌入层，输出得到第一特征信息；

将第四特征信息输入至第二输出层，输出得到第一结果；

在其中一个实施例中，上述涉及的处理器701还执行获取与第一类型账号对应的第一历史数据；其中，第一历史数据包括第一历史推荐信息及其对应的反馈信息；根据第一历史数据对初始第一信息推荐模型进行训练，得到与第一类型账号对应的第一信息推荐模型。

在其中一个实施例中，上述涉及的处理器701还执行将第一历史推荐信息输入至嵌入层，得到第五特征信息；

将第五特征信息输入至N个第一隐藏层，得到第六特征信息；

将第六特征信息输入至第一输出层，输出得到第二结果；

在电子设备7为服务器时，对应的，处理器701通过读取并执行存储器702中存储的计算机程序指令，以执行如下步骤：

处理器701，执行接收在客户端上登录信息推荐平台的账号发送的信息推荐请求；其中，推荐请求中包括账号的账号时间属性信息；响应于信息推荐请求，获取推荐信息集合；其中，推荐信息集合包括多个推荐信息；在账号时间属性信息满足第二预设条件的情况下，将推荐信息集合输入至信息推荐模型，得到多个推荐信息的推荐顺序；其中，信息推荐模型为根据上述实施例公开的模型训练方法训练得到的第二信息推荐模型；按照推荐顺序，向账号推送多个推荐信息。

在一个示例中，该电子设备7还可包括收发器703和总线704。其中，如图7所示，处理器701、存储器702和收发器703通过总线704连接并完成相互间的通信。

总线704包括硬件、软件或两者。举例来说而非限制，总线可包括加速图形端口(AGP)或其他图形总线、增强工业标准架构(EISA)总线、前端总线(FSB)、超传输(HT)互连、工业标准架构(ISA)总线、无限带宽互连、低引脚数(LPC)总线、存储器总线、微信道架构(MCA)总线、外围控件互连(PCI)总线、PCI-Express(PCI-X)总线、串行高级技术附件(SATA)总线、视频电子标准协会局部(VLB)总线或其他合适的总线或者两个或更多个以上这些的组合。在合适的情况下，总线704可包括一个或多个总线。尽管本申请实施例描述和示出了特定的总线，但本申请考虑任何合适的总线或互连。

本公开实施例还提供了一种计算机可读存储介质，所述计算机可读存储介质中存储有计算机可执行指令，所述计算机可执行指令用于实现本公开实施例所记载的模型训练方法和信息推荐方法。

在一些可能的实施方式中，本公开提供的方法的各个方面还可以实现为一种程序产品的形式，其包括程序代码，当所述程序产品在计算机设备上运行时，所述程序代码用于使所述计算机设备执行本说明书上述描述的根据本公开各种示例性实施方式的方法中的步骤，例如，所述计算机设备可以执行本公开实施例所记载的模型训练方法和信息推荐方法。

所述程序产品可以采用一个或多个可读介质的任意组合。可读介质可以是可读信号介质或者可读存储介质。可读存储介质例如可以是但不限于：电、磁、光、电磁、红外线、或半导体的系统、装置或器件，或者任意以上的组合。可读存储介质的更具体的例子(非穷举的列表)包括：具有一个或多个导线的电连接、便携式盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。

本公开是参照根据本公开的方法、设备和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程信息处理设备的处理器以产生一个机器，使得通过计算机或其他可编程信息处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其他可编程信息处理设备以特定方式工作的计算机可读存储器中，使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品，该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程信息处理设备上，使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理，从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

本领域技术人员在考虑说明书及实践这里公开的发明后，将容易想到本公开的其它实施方案。本申请旨在涵盖本公开的任何变型、用途或者适应性变化，这些变型、用途或者适应性变化遵循本公开的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的，本公开的真正范围和精神由下面的权利要求指出。

应当理解的是，本公开并不局限于上面已经描述并在附图中示出的精确结构，并且可以在不脱离其范围进行各种修改和改变。本公开的范围仅由所附的权利要求来限制。

Claims

1.一种模型训练方法，其特征在于，包括：

获取与第一类型账号对应的第一信息推荐模型；

根据所述第一信息推荐模型，构造初始第二信息推荐模型；

2.根据权利要求1所述的方法，其特征在于，所述第一信息推荐模型包括嵌入层和N个第一隐藏层；

所述根据所述第一信息推荐模型，构造初始第二信息推荐模型，包括：

其中，N、M、L为正整数，N≥M。

3.根据权利要求2所述的方法，其特征在于，所述根据所述第二历史数据对所述初始第二信息推荐模型进行训练，得到与所述第二类型账号对应的第二信息推荐模型，包括：

4.根据权利要求1所述的方法，其特征在于，所述获取与第一类型账号对应的第一信息推荐模型，包括：

5.一种信息推荐方法，其特征在于，包括：

在所述账号时间属性信息满足第二预设条件的情况下，将所述推荐信息集合输入至信息推荐模型，得到所述多个推荐信息的推荐顺序；其中，所述信息推荐模型为根据权利要求1-4任一项所述的模型训练方法训练得到的第二信息推荐模型；

按照所述推荐顺序，向所述账号推送所述多个推荐信息。

6.一种模型训练装置，其特征在于，包括：

7.一种信息推荐装置，其特征在于，包括：

输入模块，被配置为执行在所述账号时间属性信息满足第二预设条件的情况下，将所述推荐信息集合输入至信息推荐模型，得到所述多个推荐信息的推荐顺序；其中，所述信息推荐模型为根据权利要求1-4任一项所述的模型训练方法训练得到的第二信息推荐模型；

8.一种电子设备，其特征在于，包括：

处理器；

用于存储所述处理器可执行指令的存储器；

其中，所述处理器被配置为执行所述指令，以实现如权利要求1至4中任一项所述的模型训练方法或权利要求5所述的信息推荐方法。

9.一种计算机可读存储介质，其特征在于，当所述计算机可读存储介质中的指令由电子设备执行时，以使所述电子设备实现如权利要求1至4中任一项所述的模型训练方法或权利要求5所述的信息推荐方法。

10.一种计算机程序产品，包括计算机程序，其特征在于，所述计算机程序被处理器执行时实现权利要求1至4中任一项所述的模型训练方法或权利要求5所述的信息推荐方法。