CN112052386A

CN112052386A - 信息推荐方法、装置和存储介质

Info

Publication number: CN112052386A
Application number: CN202010794109.2A
Authority: CN
Inventors: 陈峭霖; 庞炳之; 季康
Original assignee: Tencent Technology Shenzhen Co Ltd
Current assignee: Tencent Technology Shenzhen Co Ltd
Priority date: 2020-08-10
Filing date: 2020-08-10
Publication date: 2020-12-08
Anticipated expiration: 2040-08-10
Also published as: CN112052386B

Abstract

本发明实施例公开了一种信息推荐方法、装置和存储介质；本发明实施例可以获取待预测用户的用户特征信息、以及目标游戏的游戏特征信息，将用户特征信息和游戏特征信息进行融合，再通过多标签深度森林模型中的多个集成树模型层依次对待预测用户针对目标游戏的注册行为进行预测，得到每一集成树模型层对应的注册概率集合，在当前集成树模型层为最后一层时，从当前集成树模型层的注册概率集合中选取待预测用户注册目标游戏的注册概率最大值，得到待预测用户对目标游戏的注册概率，再根据该注册概率对该待预测用户进行游戏推荐。该方案可以有效地提高预测用户注册游戏行为的覆盖率，进而提高信息推荐效率。

Description

信息推荐方法、装置和存储介质

技术领域

本发明涉及通信技术领域，具体涉及一种信息推荐方法、装置和存储介质。

背景技术

随着互联网技术的蓬勃发展，各种手机游戏、客户端游戏开始不断的丰富着人们的日常生活。很多游戏厂商想要从自己海量的游戏中，针对不同的用户推荐他感兴趣并可能注册预测体验的多款游戏。

多标签深度森林模型(Multi-Label Learning with Deep Forest，MLDF)，是近年来提出的一种可以替代传统的神经网络多标签模型的方法。该模型是一个多层模型，每一层由若干的传统的集成树模型构成，最后通过层级的不断加深，实现更加准确的标签输出。但是在真实的游戏注册业务中，这种方法存在着输出少标签甚至无标签的结果。这主要是因为用户游戏注册的场景，存在极高的稀疏性，也就是用于针对海量的游戏可能只有几个游戏注册，从而达不到有效的标签预测结果。

发明内容

本发明实施例提供一种信息推荐方法、装置和存储介质，可以有效地提高预测用户注册游戏行为的覆盖率。

本发明实施例提供一种信息推荐方法，包括：

获取待预测用户的用户特征信息、以及目标游戏的游戏特征信息；

将所述用户特征信息和所述游戏特征信息进行融合，得到原始特征信息；

基于所述原始特征信息，通过多标签深度森林模型中的多个集成树模型层依次对所述待预测用户针对所述目标游戏的注册行为进行预测，得到每一集成树模型层对应的注册概率集合；

在当前集成树模型层为所述多标签深度森林模型中最后一层时，从所述当前集成树模型层的注册概率集合中选取所述待预测用户注册所述目标游戏的注册概率最大值，得到所述待预测用户对所述目标游戏的注册概率；

根据所述待预测用户对所述目标游戏的注册概率对所述待预测用户进行游戏推荐。

相应的，本发明实施例还提供一种信息推荐装置，包括：

获取单元，用于获取待预测用户的用户特征信息、以及目标游戏的游戏特征信息；

融合单元，用于将所述用户特征信息和所述游戏特征信息进行融合，得到原始特征信息；

预测单元，用于基于所述原始特征信息，通过多标签深度森林模型中的多个集成树模型层依次对所述待预测用户针对所述目标游戏的注册行为进行预测，得到每一集成树模型层对应的注册概率集合；

选取单元，用于在当前集成树模型层为所述多标签深度森林模型中最后一层时，从所述当前集成树模型层的注册概率集合中选取所述待预测用户对所述目标游戏的注册概率最大值，得到所述待预测用户对所述目标游戏的注册概率；

推荐单元，用于根据所述待预测用户对所述目标游戏的注册概率对所述待预测用户进行游戏推荐。

可选的，在一些实施例中，所述预测单元可以包括确定子单元和预测子单元，如下：

所述确定子单元，用于从多标签深度森林模型中的多个集成树模型层确定当前集成树模型层；

所述预测子单元，用于基于所述原始特征信息，采用当前集成树模型层对所述待预测用户针对所述目标游戏的注册行为进行预测，得到所述当前集成树模型层对应的注册概率集合。

可选的，在一些实施例中，所述预测子单元可以包括第一预测模块和第二预测模块，如下：

所述第一预测模块，用于当所述当前集成树模型层为第一集成树模型层时，将原始特征信息输入至当前集成树模型层，对所述待预测用户针对所述目标游戏的注册行为进行预测；

所述第二预测模块，用于当所述当前集成树模型层不为第一集成树模型层时，将上一集成树模型层的注册概率集合和原始特征信息输入至当前集成树模型层，对所述待预测用户针对所述目标游戏的注册行为进行预测。

可选的，在一些实施例中，所述第二预测模块可以包括第一预测子模块和第二预测子模块，如下：

所述第一预测子模块，用于当所述当前集成树模型层为第二集成树模型层时，将第一集成树模型层的注册概率集合和原始特征信息进行融合，得到融合后特征信息，将所述融合后特征信息输入至当前集成树模型层；

所述第二预测子模块，用于当所述当前集成树模型层不为第二集成树模型层时，基于历史集成树模型层的注册概率集合对上一集成树模型层的注册概率集合进行更新，得到更新后注册概率集合，将更新后注册概率集合和原始特征信息进行融合，得到融合后特征信息，将所述融合后特征信息输入至当前集成树模型层。

可选的，在一些实施例中，所述第二预测子模块，具体用于确定所述上一集成树模型层的特征复用函数，其中，每个集成树模型层的特征复用函数基于所述多标签深度森林模型的训练确定；基于所述特征复用函数将所述历史集成树模型层的注册概率集合与上一集成树模型层的注册概率集合进行特征映射，生成更新后注册概率集合。

可选的，在一些实施例中，所述集成树模型层包括多个集成树模型，所述选取单元，具体用于在当前集成树模型层为所述多标签深度森林模型中最后一层时，所述当前集成树模型层中每个集成树模型输出所述待预测用户注册所述目标游戏的注册概率；从多个集成树模型输出的所述待预测用户注册所述目标游戏的注册概率中获取注册概率最大值；将所述注册概率最大值确定为所述待预测用户对所述目标游戏的注册概率。

可选的，在一些实施例中，所述信息推荐装置还可以包括训练单元，所述训练单元可以包括获取子单元、提取子单元和训练子单元，如下：

所述获取子单元，用于获取多组样本用户和样本游戏；

所述提取子单元，用于分别将所述样本用户和样本游戏进行特征提取，得到用户特征样本和游戏特征样本；

所述训练子单元，用于利用所述用户特征样本和游戏特征样本对预设多标签森林模型进行训练，得到多标签深度森林模型。

可选的，在一些实施例中，所述预设多标签森林模型包括多个集成树模型层，所述集成树模型层包括预设特征复用函数，所述训练子单元，具体可以用于基于所述用户特征样本和游戏特征样本，利用预设多标签森林模型的多个集成树模型层依次对所述样本用户针对所述样本游戏的注册行为进行预测；根据预测结果更新所述集成树模型层的预设特征复用函数，直到所述预设多标签森林模型的训练满足预设条件，得到多标签深度森林模型。

此外，本发明实施例还提供一种计算机可读存储介质，所述计算机可读存储介质存储有多条指令，所述指令适于处理器进行加载，以执行本发明实施例提供的任一种信息推荐方法中的步骤。

此外，本发明实施例还提供一种电子设备，包括存储器，处理器及存储在存储器上并可在处理器上运行的计算机程序，所述处理器执行所述程序时实现如本发明实施例提供的任一种信息推荐方法中的步骤。

本发明实施例可以获取待预测用户的用户特征信息、以及目标游戏的游戏特征信息，然后，将所述用户特征信息和所述游戏特征信息进行融合，得到原始特征信息，再基于所述原始特征信息，通过多标签深度森林模型中的多个集成树模型层依次对所述待预测用户针对所述目标游戏的注册行为进行预测，得到每一集成树模型层对应的注册概率集合，接着，在当前集成树模型层为所述多标签深度森林模型中最后一层时，从所述当前集成树模型层的注册概率集合中选取所述待预测用户注册所述目标游戏的注册概率最大值，得到所述待预测用户对所述目标游戏的注册概率，再然后，根据所述待预测用户对所述目标游戏的注册概率对所述待预测用户进行游戏推荐。该方案可以有效地提高预测用户注册游戏行为的覆盖率，进而提高信息推荐效率。

附图说明

为了更清楚地说明本发明实施例中的技术方案，下面将对实施例描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1a是本发明实施例提供的信息推荐方法的场景示意图；

图1b是本发明实施例提供的信息推荐方法的流程图；

图1c是本发明实施例提供的多标签深度森林模型的结构示意图；

图2a是本发明实施例提供的信息推荐方法的另一流程图；

图2b是本发明实施例提供的信息推荐方法的又一流程图；

图3是本发明实施例提供的信息推荐装置的结构示意图；

图4是本发明实施例提供的电子设备的结构示意图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

本发明实施例提供一种信息推荐方法、装置和存储介质。其中，该信息推荐可以集成在电子设备中，该电子设备可以是计算机设备，可以是服务器，也可以是终端等设备。

例如，参见图1a，首先，该集成了信息推荐装置的电子设备可以获取待预测用户的用户特征信息、以及目标游戏的游戏特征信息，然后，将所述用户特征信息和所述游戏特征信息进行融合，得到原始特征信息，再基于所述原始特征信息，通过多标签深度森林模型中的多个集成树模型层依次对所述待预测用户针对所述目标游戏的注册行为进行预测，得到每一集成树模型层对应的注册概率集合，接着，在当前集成树模型层为所述多标签深度森林模型中最后一层时，从所述当前集成树模型层的注册概率集合中选取所述待预测用户注册所述目标游戏的注册概率最大值，得到所述待预测用户对所述目标游戏的注册概率，再然后，根据所述待预测用户对所述目标游戏的注册概率对所述待预测用户进行游戏推荐。

本申请实施例提供的信息推荐方法涉及人工智能领域中的机器学习方向。本申请实施例可以通过语义理解技术，提取出待分类文本对的词特征信息和语义特征信息，进而对待分类的文本对进行分类。

其中，人工智能(Artificial Intelligence，AI)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能，感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。换句话说，人工智能是计算机科学的一个综合技术，它企图了解智能的实质，并生产出一种新的能以人类智能相似的方式做出反应的智能机器。人工智能也就是研究各种智能机器的设计原理与实现方法，使机器具有感知、推理与决策的功能。人工智能技术是一门综合学科，涉及领域广泛，既有硬件层面的技术也有软件层面的技术。其中，人工智能软件技术主要包括计算机视觉技术、机器学习/深度学习等方向。

机器学习(Machine Learning,ML)是一门多领域交叉学科，涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为，以获取新的知识或技能，重新组织已有的知识结构使之不断改善自身的性能。机器学习是人工智能的核心，是使计算机具有智能的根本途径，其应用遍及人工智能的各个领域。机器学习和深度学习通常包括人工神经网络、置信网络、强化学习、迁移学习、归纳学习、式教学习等技术。

由于该方案利用多标签深度森林模型来预测用户海量的游戏注册行为的问题，同时针对这种海量的游戏多标签问题，本方案利用阈值输出标签的方案，能有效地防止最后预测结果出现少量标签或者无标签的问题，可以有效地提高预测用户注册游戏行为的覆盖率，使得其在用户游戏拉新注册场景具有更好的预测效果，进而可以更准确地向用户推荐游戏，提高了游戏推荐的效率。

以下分别进行详细说明。需说明的是，以下实施例的描述顺序不作为对实施例优选顺序的限定。

本实施例将从信息推荐装置的角度进行描述，该信息推荐装置具体可以集成在电子设备中，该电子设备可以是计算机设备，可以是服务器，也可以是终端等设备；其中，该终端可以包括手机、平板电脑、笔记本电脑、以及个人计算(Personal Computer，PC)等设备。

一种信息推荐方法，包括：获取待预测用户的用户特征信息、以及目标游戏的游戏特征信息，然后，将该用户特征信息和该游戏特征信息进行融合，得到原始特征信息，再基于该原始特征信息，通过多标签深度森林模型中的多个集成树模型层依次对该待预测用户针对该目标游戏的注册行为进行预测，得到每一集成树模型层对应的注册概率集合，接着，在当前集成树模型层为该多标签深度森林模型中最后一层时，从该当前集成树模型层的注册概率集合中选取该待预测用户注册该目标游戏的注册概率最大值，得到该待预测用户对该目标游戏的注册概率，再然后，根据该待预测用户对该目标游戏的注册概率对该待预测用户进行游戏推荐。

如图1b所示，该信息推荐方法的具体流程可以如下：

101、获取待预测用户的用户特征信息、以及目标游戏的游戏特征信息。

例如，可以通过互联网、网络数据库等方式实时获取一个或多个待预测用户的用户信息，以及需要推荐给用户或者拉回流的一个或多个目标游戏的游戏信息，然后对该用户信息和游戏信息分别进行特征提取，得到用户特征信息和游戏特征信息。

例如，具体可以获取至少一个待预测用户的用户信息、以及至少一个目标游戏的游戏信息；对该用户信息进行特征提取，得到用户特征信息；对该游戏信息进行特征提取，得到游戏特征信息。

其中，用户信息的获取具体可以通过获取该待预测用户的身份标识(id，Identity document)，比如、微信号、QQ号或者游戏账号等等，通过该待预测用户的身份标识去获取该待预测用户的用户信息，比如历史玩过游戏的平均登记、历史玩过游戏的平均活跃程度、历史游戏的平均付费、以及平均在线时长等等。

其中，游戏信息可以包括游戏类比、是角色扮演游戏(RPG，Role-playing Game)还是策略游戏(SLG，Simulation Game)、是否支持多人在线、是否热门、以及游戏的日均收入等等。

102、将该用户特征信息和该游戏特征信息进行融合，得到原始特征信息。

其中，将该用户特征信息和该游戏特征信息进行融合的方式可以有很多种，例如，具体可以将该用户特征信息的特征矩阵和该游戏特征信息的特征矩阵按对应行列的方式拼接在一起，得到原始特征矩阵，即原始特征信息。

103、基于该原始特征信息，通过多标签深度森林模型中的多个集成树模型层依次对该待预测用户针对该目标游戏的注册行为进行预测，得到每一集成树模型层对应的注册概率集合。

例如，可以获取多标签深度森林模型，该多标签深度森林模型包括多个集成树模型层，每一集成树模型层包括多个集成树模型；基于该原始特征信息，依次通过多个集成树模型层中的集成树模型对该待预测用户针对该目标游戏的注册行为进行预测，得到每一集成树模型层对应的注册概率集合。

例如，具体可以从多标签深度森林模型中的多个集成树模型层确定当前集成树模型层；基于该原始特征信息，采用当前集成树模型层对该待预测用户针对该目标游戏的注册行为进行预测，得到该当前集成树模型层对应的注册概率集合。

其中，采用当前集成树模型层对该待预测用户针对该目标游戏的注册行为进行预测的情况有很多种，比如，当该当前集成树模型层为第一集成树模型层时，将原始特征信息输入至当前集成树模型层，对该待预测用户针对该目标游戏的注册行为进行预测；当该当前集成树模型层不为第一集成树模型层时，将上一集成树模型层的注册概率集合和原始特征信息输入至当前集成树模型层，对该待预测用户针对该目标游戏的注册行为进行预测。

其中，当该当前集成树模型层不为第一集成树模型层时，还可以包括当该当前集成树模型层为第二集成树模型层以及当该当前集成树模型层不为第二集成树模型层的情况，比如，具体可以当该当前集成树模型层为第二集成树模型层时，将第一集成树模型层的注册概率集合和原始特征信息进行融合，得到融合后特征信息，将该融合后特征信息输入至当前集成树模型层；当该当前集成树模型层不为第一集成树模型层且不为第二集成树模型层时，基于历史集成树模型层的注册概率集合对上一集成树模型层的注册概率集合进行更新，得到更新后注册概率集合，将更新后注册概率集合和原始特征信息进行融合，得到融合后特征信息，将该融合后特征信息输入至当前集成树模型层。

其中，该历史集成树模型层为上一集成树模型层的前一集成树模型层，比如，当前集成树模型层为第五集成树模型层时，则当前集成树模型层的上一集成树模型层为第四集成树模型层，当前集成树模型层的历史集成树模型层为第三集成树模型层。

可选的，基于历史集成树模型层的注册概率集合对上一集成树模型层的注册概率集合进行更新，得到更新后注册概率集合的方式可以有很多种，比如，具体可以确定该上一集成树模型层的特征复用函数，其中，每个集成树模型层的特征复用函数基于该多标签深度森林模型的训练确定；基于该特征复用函数将该历史集成树模型层的注册概率集合与上一集成树模型层的注册概率集合进行特征映射，生成更新后注册概率集合。

可选的，该多标签深度森林模型可以除了可以由运维人员预先进行训练之外，也可以由该信息推荐装置自行训练来得到。即在通过多标签深度森林模型之前，该信息推荐方法还可以包括：

(1)获取多组样本用户和样本游戏。

例如，具体可以获取多个样本用户和多个样本游戏，比如可以从网络或者数据库中获取样本用户的样本用户信息、以及样本游戏的样本游戏信息。其中，样本用户信息可以包括用户数据，该数据主要包含了用户的基本属性特征，主要包括用户的自然人信息，年龄性别等，以及用户历史游戏数据，通过转化计算得到的用户对不同游戏的偏好特征等。基于这些信息来预测用户目前海量的游戏业务中会注册那些游戏。然后，基于这些信息制作标签，比如，可以选取用户在某一个较长时间段内注册过那些游戏，将这些游戏的标签变为1，其他游戏变为0。

(2)分别将该样本用户和样本游戏进行特征提取，得到用户特征样本和游戏特征样本。

例如，可以将获取样本用户的样本用户信息、以及样本游戏的样本游戏信息进行处理，比如，可以进行清洗、分析和提取特征等等。比如，具体可以对样本用户的样本用户信息进行特征提取，得到用户特征样本，对样本游戏的样本游戏信息进行特征提取，得到游戏特征样本，然后将提取到的用户特征样本和游戏特征样本进行融合，得到原始特征样本，以输入至预设多标签森林模型。

(3)利用该用户特征样本和游戏特征样本对预设多标签森林模型进行训练，得到多标签深度森林模型。

其中，预设多标签森林模型可以包括多个集成树模型层，每个集成树模型层可以包括预设特征复用函数，例如，具体可以基于该用户特征样本和游戏特征样本，利用预设多标签森林模型的多个集成树模型层依次对该样本用户针对该样本游戏的注册行为进行预测；根据预测结果更新该集成树模型层的预设特征复用函数，直到该预设多标签森林模型的训练满足预设条件，得到多标签深度森林模型。

其中，预设条件的设定方式可以有很多种，比如，可以根据实际应用的需求灵活设置，也可以预先设置好存储在电子设备中。此外，预设条件可以内置于电子设备中，或者，也可以保存在存储器中并发送给电子设备，等等。比如，在实际应用中，预设条件可以为模型是否连续3层都没有更新，如果模型连续3 层都没有更新，则停止训练。

比如，预设多标签森林模型的结构图可以如图1c所示，该模型有两个非常重要的参数，分别是度量感知特征复用机制(简称复用机制)，以及度量感知层增长机制(简称增长机制)。其中，复用机制是将模型的每一层拼接在一切的决定方法，而增长机制是控制整个模型网络加深的方法。

该预设多标签森林模型从左向右看，表示着数据在其中的流转情况，按照整理好训练数据之后，从第一层输入。每一层模型都是由多个集成树模型构成的，为了能够使的模型的结果更准确，每一层的模型主要由不同的集成树模型构成，例如，随机森林模型或者极端梯度提升树模型等。每一个集成树模型都可以各自生成这个用户对全量游戏的注册标签，但是这里让每一层模型输出对应游戏的可能注册概率，是一个分布在0到1之间的值。

假设数据集是X_mn，其中每一行为X_i(i＝0,…,m-1)＝[x₀,…,x_n-1]，对应的数据的标签集合为Y_ml，其中每一行为Y_i(i＝0,…,m-1)＝[y₀,…,y_l-1]。其中m,n,l分别表示的是样本总数，特征总数以及标签总数。模型的每一层里面的集成树模型，除了会输出用户是否会注册游戏这个非0即1的数以外，还会生成用户注册这个游戏的概率值，算法针对这个概率值还设置了一个阈值θ，如果概率值大于阈值θ，则模型输出标签1，否则为0。模型设定的最大深度为T，每一层当中有K个集成树模型。

对每一层模型来说，遍历全部的K个集成森林模型，每个集成森林模型都采用多折交叉训练的方式，目的是为有效的提高数据的利用率。这样每个模型都会输出一个m行l列的矩阵，表示的是每一个用户对每一个游戏注册概率值，这也对应着图1c中每一个集成树模型输出的深色方块。因此，每一层K个森林总共会输出K个标签的概率矩阵，如果把他们按照列拼接在一起，用H表示输出矩阵的话，也就是

其中t表示的是第t层输出的结果矩阵，而m×Kl表示的矩阵的规模是m行，K*l列。

而层与层之间的连接是依靠的是复用机制。复用机制是指的是否将当前层所有的输出作为第二层的输入。按照前一步的训练来看，每一层都会输出一个

矩阵，如果是第一层的训练输出的话，可以直接将这个矩阵与原始的数据特征矩阵按照列拼接在一起，变成新的数据，新的矩阵规模就是 m×(n+Kl)，也就是m行，(n+Kl)列。

下一层同样按照第一层进行训练，生成

结果矩阵。复用机制就在这个时候起作用，这个机制将当前层的训练输出和上一层的训练输出矩阵做了一个映射，从而生成一个新的矩阵

这个映射关系的表达式如下所示：

从图1c的模型结构图和以上的公式表达可以看出来，可以根据评价指标的不同确定上一层中性能表现的好的列或者行替换当前层的输出的某些行或者列，比如，如果层数等于1，就直接利用输出拼接原始数据矩阵输入到第二层，如果t＝2就将第一层的输出和第二层的输出的某些性能表现的好的列或者行替换要输入第三层的列或者行，其他的情况就是利用转换后的G矩阵在作为输入。

其中，映射关系F_复用函数的确立首先需要确定模型的评价指标，针对多标签问题的评价指标可以分为两种，分别是基于样本的评价指标以及基于标签的评价指标。其中，基于标签的评价指标有汉明损失(hamming loss)、全局精准率(macro-AUC)等。基于样本的评价指标有排序误差(ranking-loss)、差一错误(one-error)、覆盖率(coverage)等。

在复用机制的作用下，MLDF的层数不断加深，模型不断变优。随着模型的加深，增长机制会密切跟踪每一层模型的性能，根据相对应的指标，基于标签或者基于样本来计算对应的当前层模型性能p_t，如果性能比最好的层的性能还要好，则将最好的性能层数换为当前层，然后将p_best设为p_t。反之，如果模型连续3层都没有更新p_best，也就是说t-L>3，那么模型可能再不断加深意义不大了，因此模型停止训练，或者模型已经训练到设定的可能最大深度，由于内存和时间的要求，也可以停止训练模型了。然后保留第一层到第L层之间的层的模型即可。

由于传统的神经网络模型会需要不断的调整网络的各种参数来实现更优的性能，通常上线调试周期长，性能不稳定。而MLDF模型内部的集成森林在实际中是属于内部的固定参数，通常来说参数可以是固定的，不需要改动，整体模型的输入参数只需要确定评价指标，模型的最大深度限制，早停止的层数即可，避免了传统神经网络多标签方法的复杂调参过程。

104、在当前集成树模型层为该多标签深度森林模型中最后一层时，从该当前集成树模型层的注册概率集合中选取该待预测用户注册该目标游戏的注册概率最大值，得到该待预测用户对该目标游戏的注册概率。

其中，该集成树模型层包括多个集成树模型，比如，具体在当前集成树模型层为该多标签深度森林模型中最后一层时，该当前集成树模型层中每个集成树模型输出该待预测用户注册该目标游戏的注册概率；从多个集成树模型输出的该待预测用户注册该目标游戏的注册概率中获取注册概率最大值；将该注册概率最大值确定为该待预测用户对该目标游戏的注册概率。

比如，为了适应海量用户大量游戏注册预测的场景，可以利用最大概率投票法，具体表达如下:

105、根据该待预测用户对该目标游戏的注册概率对该待预测用户进行游戏推荐。

例如，具体可以获取注册概率的预设阈值，将该待预测用户对该目标游戏的注册概率与该预设阈值进行比较，根据比较结果确定该待预测用户的注册行为，比如，若该待预测用户对该目标游戏的注册概率大于或等于该预设阈值，则预测该待预测用户对该目标游戏进行注册；若该待预测用户对该目标游戏的注册概率小于该预设阈值，则预测该待预测用户对该目标游戏不注册。然后，将预测该待预测用户注册的目标游戏推荐给该待预测用户。

其中，预设阈值的设定方式也可以有很多种，比如，可以根据实际应用的需求灵活设置，也可以预先设置好存储在电子设备中。此外，预设阈值可以内置于电子设备中，或者，也可以保存在存储器中并发送给电子设备，等等。

根据本申请的一个方面，提供了一种计算机程序产品或计算机程序，该计算机产品或计算机程序包括计算机指令，该计算机指令存储在计算机可读存储介质中，计算机设备的处理器从计算机可读存储介质读取该计算机指令，处理器执行该计算机指令，使得该计算机设备执行上述信息推荐方面的各种可选实现方式中提供的方法。

由上可知，本实施例可以获取待预测用户的用户特征信息、以及目标游戏的游戏特征信息，然后，将该用户特征信息和该游戏特征信息进行融合，得到原始特征信息，再基于该原始特征信息，通过多标签深度森林模型中的多个集成树模型层依次对该待预测用户针对该目标游戏的注册行为进行预测，得到每一集成树模型层对应的注册概率集合，接着，在当前集成树模型层为该多标签深度森林模型中最后一层时，从该当前集成树模型层的注册概率集合中选取该待预测用户注册该目标游戏的注册概率最大值，得到该待预测用户对该目标游戏的注册概率，再然后，根据该待预测用户对该目标游戏的注册概率对该待预测用户进行游戏推荐。由于该方案利用多标签深度森林模型来预测用户海量的游戏注册行为的问题，同时针对这种海量的游戏多标签问题，本方案利用阈值输出标签的方案，能有效地防止最后预测结果出现少量标签或者无标签的问题，可以有效地提高预测用户注册游戏行为的覆盖率，使得其在用户游戏拉新注册场景具有更好的预测效果，进而可以更准确地向用户推荐游戏，提高了游戏推荐的效率，同时，避免了传统神经网络多标签方法的复杂调参过程。

根据上一个实施例所描述的方法，以下将举例作进一步详细说明。

在本实施例中，将以该信息推荐装置具体集成在电子设备中为例进行说明。

(一)首先，如图2a所示，需要对多标签深度森林模型进行训练，具体可以如下：

(1)获取多组样本用户和样本游戏。

例如，电子设备具体可以从网络或者数据库中获取样本用户的样本用户信息、以及样本游戏的样本游戏信息。其中，样本用户信息可以包括用户数据，比如，用户的基本属性特征，包括用户的自然人信息，年龄性别等，以及用户历史游戏数据，通过转化计算得到的用户对不同游戏的偏好特征等。然后，对样本游戏进行标注，得到样本游戏的标签，比如，可以将用户在某一个较长时间段内注册过的样本游戏标记为1，即注册过的样本游戏的标签为1，然后，将其他游戏(即用户在某一个较长时间段内未注册过的样本游戏)标记为0，即未注册过的样本游戏的标签为0。相对应的防止出现特征的穿越性问题，选取的用户特征与用户的游戏偏好描述等特征应当是这一个时间段之前统计出来的。

例如，电子设备具体可以对样本用户的样本用户信息进行特征提取，得到用户特征样本，对样本游戏的样本游戏信息进行特征提取，得到游戏特征样本，将用户特征样本与游戏特征样本拼接好，接下来将进行数据清洗、特征构造以及标签特征；同时将用户过去注册过的游戏作为标签，至此完成了特征工程的内容。

对于游戏放行公司或者游戏广告推广的公司，想要预测的游戏往往是海量的，这也就造成了上述数据中可能每一个用户的游戏标签是很稀疏的，只有少量几个是标签为1。这个问题很容易使得MLDF模型的表现很差。为了更好的解决这个问题，以下将详细介绍MLDF模型的具体训练过程。

其中，预设多标签森林模型可以包括多个集成树模型层，每个集成树模型层可以包括预设特征复用函数，例如，电子设备具体可以基于该用户特征样本和游戏特征样本，利用预设多标签森林模型的多个集成树模型层依次对该样本用户针对该样本游戏的注册行为进行预测，根据预测结果更新该集成树模型层的预设特征复用函数，直到该预设多标签森林模型的训练满足预设条件，得到多标签深度森林模型。比如，可以将数据按照一定合适的比例分割成测试集和训练集，训练集用来训练MLDF模型，而测试集用来做效果评估。

其中，预设多标签森林模型的结构图可以如图1c所示，该模型有两个非常重要的参数，分别是度量感知特征复用机制(简称复用机制)，以及度量感知层增长机制(简称增长机制)。其中，复用机制是将模型的每一层拼接在一切的决定方法，而增长机制是控制整个模型网络加深的方法。

假设数据集是X_mn，其中每一行为X_i(i＝0,…,m-1)＝[x₀,…,x_n-1]，对应的数据的标签集合为Y_ml，其中每一行为Y_i(i＝0,…,m-1)＝[y₀,…,y_l-1]。其中m,n,l分别表示的是样本总数，特征总数以及标签总数。模型的每一层里面的集成树模型，除了会输出用户是否会注册游戏这个非0即1的数以外，还会生成用户注册这个游戏的概率值，算法针对这个概率值还设置了一个阈值θ，如果概率值大于阈值θ，则模型输出标签1，否则为0。模型设定的最大深度为 T，每一层当中有K个集成树模型。

下一层同样按照第一层进行训练，生成

这个映射关系的表达式如下所示：

其中，映射关系F复用函数的确立首先需要确定模型的评价指标，针对多标签问题的评价指标可以分为两种，分别是基于样本的评价指标以及基于标签的评价指标。其中，基于标签的评价指标有汉明损失(hamming loss)、全局精准率(macro-AUC)等。基于样本的评价指标有排序误差(ranking-loss)、差一错误(one-error)、覆盖率(coverage)等。

比如，基于标签的评价指标可以使用汉明损失，表达式如下：

汉明损失是标签型的损失函数。这个表达式中h_ij表示预测的第i个用户的第j个标签的结果，y_ij表示的是真实的第i个用户的第j个标签的结果，所以汉明损失其实表达的是所有用户的标签结果预测错的数据的和与总标签数的比值。因此这个损失函数是越小越好，但从表达式没有看出来考虑到了标签之间的关联性。

比如，基于样本的评价指标可以使用排序误差，表达式如下：

排序误差(ranking-loss)，表达式如下所示，他是样本型的损失函数。这个表达式中

表示的是用户的真实正标签的数据，也就是标签为1的数目。而

表示的是用户的真实负标签的数目。相对应的f_u(x_i)表示的是模型在用户正标签的位置输出的标签为1的概率，而f_v(x_i)则表示的是模型在用户负标签的位置输出为1的概率，如果这个概率大于在正标签位置输出为1的概率f_u(x_i)，则表示模型预测是错误的，因此，

表示的就是模型预测出错的数目，而这个公式同时也考虑进了模型正负标签之间的关联。排序误差(ranking-loss)实际上就是表示的模型的在正负标签上面预测出错的总数目与正负标签的乘积的比值。在ML-DF模型中，利用这种损失函数也是用来一定程度的学习到标签之间的关联性，从而实现更好的性能表现。

复用机制除了利用到评价指标之外，还引入了置信度。随着层数的不断加深，每一层在迭代加深的同时，都会尽可能选择那些置信度比上一层更好的标签结果行或者列，至于是取行还是列是根据的评价指标是样本型或者标签型来决定的。其中，汉明损失和排序误差两个指标的置信度计算方式可以如下：

具体地，复用机制的算法流程可以如下：

该流程详细阐述了MLDF每一层树结构的内部逻辑流程，首先计算置信度的平均阈值，也就是步骤一。步骤一会根据模型选用的指标不同，从而采取不同的计算方法，如果是基于标签(例如hamming loss)的计算方式的话，就是以列的方式迭代计算，计算当前每一列的汉明损失，如果这个损失比上一层的相同森林模型相同列的损失要大，也就是性能更差的话，就把这一列计算出来的置信度放进集合了。迭代之后呢，就获得当前预测结果中表现不好的那些列的置信度，然后对这个置信度集合S求平均，就得到了平均置信度。那么模型的每一列，如果置信度要小于这个平均置信度，则表明模型的这一列不如上一层相同位置的预测结果，因此用上一层的结果来替代这一列。整体的思路就是不断迭代置信度更高的也就是性能更好的预测结果。如果是基于样本的评价指标，例如排序损失，也是类似的方法，其改为按照行的形式，也就是按照用户的形式迭代即可。

其中，让ML_DF模型停止训练的机制是增长机制，增长机制的算法流程可以如下：

由于传统的神经网络模型会需要不断的调整网络的各种参数来实现更优的性能，通常上线调试周期长，性能不稳定。而MLDF模型内部的集成森林在实际中是属于内部的固定参数，通常来说参数可以是固定的，不需要改动，整体模型的输入参数只需要确定评价指标，模型的最大深度限制，早停止的层数 (对应上面的连续多少层没有性能提升就停止训练的参数，通常为3)即可，避免了传统神经网络多标签方法的复杂调参过程。

训练好模型之后就可以在线上做实时预测了。线上实时拉取获取到的用户信息，然后放进模型里面进行预测就可以得到用户对所有游戏可能的注册结果，也就对应的标签为1的游戏。

(二)通过训练好的多标签深度森林模型，便可以对待预测用户进行游戏推荐，具体可以参见图2a和2b。

如图2b所示，一种信息推荐方法，具体流程可以如下：

201、电子设备获取待预测用户的用户特征信息、以及目标游戏的游戏特征信息。

例如，电子设备可以通过互联网、网络数据库等方式实时获取一个或多个待预测用户的用户信息，以及需要推荐给用户或者拉回流的一个或多个目标游戏的游戏信息，然后，对该用户信息和游戏信息分别进行特征提取，得到用户特征信息和游戏特征信息。

例如，现有2个用户，3个游戏，需要预测这两个用户分别对这3个游戏的预测行为，比如，电子设备具体可以获取2个待预测用户的用户信息、以及2 个游戏的游戏信息，对该用户信息进行特征提取，得到用户特征信息，对该游戏信息进行特征提取，得到游戏特征信息。

202、电子设备将该用户特征信息和该游戏特征信息进行融合，得到原始特征信息。

例如，电子设备具体可以将该用户特征信息的特征矩阵和该游戏特征信息的特征矩阵按对应行列的方式拼接在一起，得到原始特征矩阵，即原始特征信息。

203、电子设备从多标签深度森林模型中的多个集成树模型层确定当前集成树模型层。

例如，电子设备具体可以从多标签深度森林模型中的多个集成树模型层确定当前用于预测用户注册游戏行为的当前集成树模型层的位置，根据确定的当前集成树模型层的位置，即层数，确定该当前集成树模型层的输入信息，也就是输入矩阵。

204、基于该原始特征信息，电子设备采用当前集成树模型层对该待预测用户针对该目标游戏的注册行为进行预测，得到该当前集成树模型层对应的注册概率集合。

比如，当该当前集成树模型层为第一集成树模型层时，将原始特征信息输入至当前集成树模型层，对该待预测用户针对该目标游戏的注册行为进行预测。

当该当前集成树模型层为第二集成树模型层时，将第一集成树模型层的注册概率集合和原始特征信息进行融合，得到融合后特征信息，将该融合后特征信息输入至当前集成树模型层。

当该当前集成树模型层不为第一集成树模型层且不为第二集成树模型层时，基于历史集成树模型层的注册概率集合对上一集成树模型层的注册概率集合进行更新，得到更新后注册概率集合，将更新后注册概率集合和原始特征信息进行融合，得到融合后特征信息，将该融合后特征信息输入至当前集成树模型层。

其中，电子设备具体可以确定该上一集成树模型层的特征复用函数，基于该特征复用函数将该历史集成树模型层的注册概率集合与上一集成树模型层的注册概率集合进行特征映射，生成更新后注册概率集合。

205、在当前集成树模型层为该多标签深度森林模型中最后一层时，电子设备从该当前集成树模型层的注册概率集合中选取该待预测用户注册该目标游戏的注册概率最大值，得到该待预测用户对该目标游戏的注册概率。

比如，该集成树模型层包括K个集成树模型，电子设备具体可以在当前集成树模型层为该多标签深度森林模型中最后一层时，该当前集成树模型层中每个集成树模型输出该待预测用户注册该目标游戏的注册概率；从K个集成树模型输出的该待预测用户注册该目标游戏的注册概率中选取注册概率最大值，将该注册概率最大值确定为该待预测用户对该目标游戏的注册概率。

比如，现有2个用户，3个游戏，每一层由2个集成森林模型，在最后一层的输出为如下所示：

表示的最后一层的第i个集成森林模型，每一个概率表示的用户在某个游戏上面注册的可能性。从2个集成树模型输出的该待预测用户注册该目标游戏的注册概率中获取注册概率最大值，将该注册概率最大值确定为该待预测用户对该目标游戏的注册概率，最后选取结果可以如下：

206、电子设备根据该待预测用户对该目标游戏的注册概率对该待预测用户进行游戏推荐。

例如，电子设备具体可以设置注册概率的预设阈值为0.5，将该待预测用户对该目标游戏的注册概率与该预设阈值进行比较，根据比较结果确定该待预测用户的注册行为，比如，若该待预测用户对该目标游戏的注册概率大于或等于0.5，则预测该待预测用户对该目标游戏进行注册；若该待预测用户对该目标游戏的注册概率小于0.5，则预测该待预测用户对该目标游戏不注册。然后，将预测该待预测用户注册的目标游戏推荐给该待预测用户。

根据步骤205中的输出结果，根据0.5为阈值，取标签结果可以得到最后用户1的第3个游戏、以及用户2的第1和第2个游戏都会被预测为可能注册，有效地提高了预测的精准率和覆盖率。

而对于用户游戏注册的业务场景，可以用来对用户做游戏推荐或者拉回流等。将最终模型获得的标签过滤到用户已注册的游戏，将剩下的游戏推荐给用户即可实现对用户的游戏拉新，如果是将用户的流失作为标签的话，还可以对用户进行流失干预推荐等等。也就是，基于MLDF模型的用户游戏标签预测产品在游戏测可以大大优化游戏的推广，提高游戏的效益。

由上可知，本实施例可以获取待预测用户的用户特征信息、以及目标游戏的游戏特征信息，然后，将该用户特征信息和该游戏特征信息进行融合，得到原始特征信息，再基于该原始特征信息，通过多标签深度森林模型中的多个集成树模型层依次对该待预测用户针对该目标游戏的注册行为进行预测，得到每一集成树模型层对应的注册概率集合，接着，在当前集成树模型层为该多标签深度森林模型中最后一层时，从该当前集成树模型层的注册概率集合中选取该待预测用户注册该目标游戏的注册概率最大值，得到该待预测用户对该目标游戏的注册概率，再然后，根据该待预测用户对该目标游戏的注册概率对该待预测用户进行游戏推荐。由于该方案利用多标签深度森林模型来预测用户海量的游戏注册行为的问题，同时针对这种海量的游戏多标签问题，本方案利用阈值输出标签的方案，能有效地防止最后预测结果出现少量标签或者无标签的问题，可以有效地提高预测用户注册游戏行为的覆盖率，使得其在用户游戏拉新注册场景具有更好的预测效果，进而可以更准确地向用户推荐游戏，提高了游戏推荐的效率。同时，避免了传统神经网络多标签方法的复杂调参过程。

为了更好地实施以上方法，相应的，本发明实施例还提供一种信息推荐装置，该信息推荐装置具体可以集成在电子设备中，该电子设备可以是服务器，也可以是终端等设备。

例如，如图3所示，该信息推荐装置可以包括获取单元301、融合单元302、预测单元303、选取单元304和推荐单元305，如下：

(1)获取单元301；

获取单元301，用于获取待预测用户的用户特征信息、以及目标游戏的游戏特征信息。

例如，获取单元301，具体可以获取至少一个待预测用户的用户信息、以及至少一个目标游戏的游戏信息；对所述用户信息进行特征提取，得到用户特征信息；对所述游戏信息进行特征提取，得到游戏特征信息。

(2)融合单元302；

融合单元302，用于将所述用户特征信息和所述游戏特征信息进行融合，得到原始特征信息。

例如，融合单元302，具体可以将所述用户特征信息的特征矩阵和所述游戏特征信息的特征矩阵按对应行列的方式拼接在一起，得到原始特征矩阵，即原始特征信息。

(3)预测单元303；

预测单元303，用于基于所述原始特征信息，通过多标签深度森林模型中的多个集成树模型层依次对所述待预测用户针对所述目标游戏的注册行为进行预测，得到每一集成树模型层对应的注册概率集合。

确定子单元，用于从多标签深度森林模型中的多个集成树模型层确定当前集成树模型层；

预测子单元，用于基于所述原始特征信息，采用当前集成树模型层对所述待预测用户针对所述目标游戏的注册行为进行预测，得到所述当前集成树模型层对应的注册概率集合。

第一预测模块，用于当所述当前集成树模型层为第一集成树模型层时，将原始特征信息输入至当前集成树模型层，对所述待预测用户针对所述目标游戏的注册行为进行预测；

第二预测模块，用于当所述当前集成树模型层不为第一集成树模型层时，将上一集成树模型层的注册概率集合和原始特征信息输入至当前集成树模型层，对所述待预测用户针对所述目标游戏的注册行为进行预测。

第一预测子模块，用于当所述当前集成树模型层为第二集成树模型层时，将第一集成树模型层的注册概率集合和原始特征信息进行融合，得到融合后特征信息，将所述融合后特征信息输入至当前集成树模型层；

第二预测子模块，用于当所述当前集成树模型层不为第二集成树模型层时，基于历史集成树模型层的注册概率集合对上一集成树模型层的注册概率集合进行更新，得到更新后注册概率集合，将更新后注册概率集合和原始特征信息进行融合，得到融合后特征信息，将所述融合后特征信息输入至当前集成树模型层。

可选的，在一些实施例中，该多标签深度森林模型可以除了可以由运维人员预先进行训练之外，也可以由该信息推荐装置自行训练来得到。即信息推荐装置还可以包括训练单元306，所述训练单元306可以包括获取子单元、提取子单元和训练子单元，如下：

获取子单元，用于获取多组样本用户和样本游戏；

提取子单元，用于分别将所述样本用户和样本游戏进行特征提取，得到用户特征样本和游戏特征样本；

训练子单元，用于利用所述用户特征样本和游戏特征样本对预设多标签森林模型进行训练，得到多标签深度森林模型。

(4)选取单元304；

选取单元304，用于在当前集成树模型层为所述多标签深度森林模型中最后一层时，从所述当前集成树模型层的注册概率集合中选取所述待预测用户对所述目标游戏的注册概率最大值，得到所述待预测用户对所述目标游戏的注册概率。

(5)推荐单元305；

推荐单元305，用于根据所述待预测用户对所述目标游戏的注册概率对所述待预测用户进行游戏推荐。

例如，推荐单元305，具体可以获取注册概率的预设阈值，将所述待预测用户对所述目标游戏的注册概率与所述预设阈值进行比较，根据比较结果确定所述待预测用户的注册行为，比如，若所述待预测用户对所述目标游戏的注册概率大于或等于所述预设阈值，则预测所述待预测用户对所述游戏进行注册；若所述待预测用户对所述目标游戏的注册概率小于所述预设阈值，则预测所述待预测用户对所述游戏不注册。然后，将预测所述待预测用户注册的目标游戏推荐给所述待预测用户。

具体实施时，以上各个单元可以作为独立的实体来实现，也可以进行任意组合，作为同一或若干个实体来实现，以上各个单元的具体实施可参见前面的方法实施例，在此不再赘述。

由上可知，本实施例可以由获取单元301获取待预测用户的用户特征信息、以及目标游戏的游戏特征信息，然后，由融合单元302将所述用户特征信息和所述游戏特征信息进行融合，得到原始特征信息，再由预测单元303基于所述原始特征信息，通过多标签深度森林模型中的多个集成树模型层依次对所述待预测用户针对所述目标游戏的注册行为进行预测，得到每一集成树模型层对应的注册概率集合，接着，由选取单元304在当前集成树模型层为所述多标签深度森林模型中最后一层时，从所述当前集成树模型层的注册概率集合中选取所述待预测用户注册所述目标游戏的注册概率最大值，得到所述待预测用户对所述目标游戏的注册概率，再然后，由推荐单元305根据所述待预测用户对所述目标游戏的注册概率对所述待预测用户进行游戏推荐。由于该方案利用多标签深度森林模型来预测用户海量的游戏注册行为的问题，同时针对这种海量的游戏多标签问题，本方案利用阈值输出标签的方案，能有效地防止最后预测结果出现少量标签或者无标签的问题，可以有效地提高预测用户注册游戏行为的覆盖率，使得其在用户游戏拉新注册场景具有更好的预测效果，进而可以更准确地向用户推荐游戏，提高了游戏推荐的效率。

此外，本发明实施例还提供一种电子设备，如图4所示，其示出了本发明实施例所涉及的电子设备的结构示意图，具体来讲：

该电子设备可以包括一个或者一个以上处理核心的处理器401、一个或一个以上计算机可读存储介质的存储器402、电源403和输入单元404等部件。本领域技术人员可以理解，图4中示出的电子设备结构并不构成对电子设备的限定，可以包括比图示更多或更少的部件，或者组合某些部件，或者不同的部件布置。其中：

处理器401是该电子设备的控制中心，利用各种接口和线路连接整个电子设备的各个部分，通过运行或执行存储在存储器402内的软件程序和/或模块，以及调用存储在存储器402内的数据，执行电子设备的各种功能和处理数据，从而对电子设备进行整体监控。可选的，处理器401可包括一个或多个处理核心；优选的，处理器401可集成应用处理器和调制解调处理器，其中，应用处理器主要处理操作系统、用户界面和应用程序等，调制解调处理器主要处理无线通信。可以理解的是，上述调制解调处理器也可以不集成到处理器401中。

存储器402可用于存储软件程序以及模块，处理器401通过运行存储在存储器402的软件程序以及模块，从而执行各种功能应用以及数据处理。存储器 402可主要包括存储程序区和存储数据区，其中，存储程序区可存储操作系统、至少一个功能所需的应用程序(比如声音播放功能、图像播放功能等)等；存储数据区可存储根据电子设备的使用所创建的数据等。此外，存储器402可以包括高速随机存取存储器，还可以包括非易失性存储器，例如至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。相应地，存储器402还可以包括存储器控制器，以提供处理器401对存储器402的访问。

电子设备还包括给各个部件供电的电源403，优选的，电源403可以通过电源管理系统与处理器401逻辑相连，从而通过电源管理系统实现管理充电、放电、以及功耗管理等功能。电源403还可以包括一个或一个以上的直流或交流电源、再充电系统、电源故障检测电路、电源转换器或者逆变器、电源状态指示器等任意组件。

该电子设备还可包括输入单元404，该输入单元404可用于接收输入的数字或字符信息，以及产生与用户设置以及功能控制有关的键盘、鼠标、操作杆、光学或者轨迹球信号输入。

尽管未示出，电子设备还可以包括显示单元等，在此不再赘述。具体在本实施例中，电子设备中的处理器401会按照如下的指令，将一个或一个以上的应用程序的进程对应的可执行文件加载到存储器402中，并由处理器401来运行存储在存储器402中的应用程序，从而实现各种功能，如下：

获取待预测用户的用户特征信息、以及目标游戏的游戏特征信息，然后，将所述用户特征信息和所述游戏特征信息进行融合，得到原始特征信息，再基于所述原始特征信息，通过多标签深度森林模型中的多个集成树模型层依次对所述待预测用户针对所述目标游戏的注册行为进行预测，得到每一集成树模型层对应的注册概率集合，接着，在当前集成树模型层为所述多标签深度森林模型中最后一层时，从所述当前集成树模型层的注册概率集合中选取所述待预测用户注册所述目标游戏的注册概率最大值，得到所述待预测用户对所述目标游戏的注册概率，再然后，根据所述待预测用户对所述目标游戏的注册概率对所述待预测用户进行游戏推荐。

以上各个操作的具体实施可参见前面的实施例，在此不再赘述。

由上可知，本实施例可以获取待预测用户的用户特征信息、以及目标游戏的游戏特征信息，然后，将所述用户特征信息和所述游戏特征信息进行融合，得到原始特征信息，再基于所述原始特征信息，通过多标签深度森林模型中的多个集成树模型层依次对所述待预测用户针对所述目标游戏的注册行为进行预测，得到每一集成树模型层对应的注册概率集合，接着，在当前集成树模型层为所述多标签深度森林模型中最后一层时，从所述当前集成树模型层的注册概率集合中选取所述待预测用户注册所述目标游戏的注册概率最大值，得到所述待预测用户对所述目标游戏的注册概率，再然后，根据所述待预测用户对所述目标游戏的注册概率对所述待预测用户进行游戏推荐。由于该方案利用多标签深度森林模型来预测用户海量的游戏注册行为的问题，同时针对这种海量的游戏多标签问题，本方案利用阈值输出标签的方案，能有效地防止最后预测结果出现少量标签或者无标签的问题，可以有效地提高预测用户注册游戏行为的覆盖率，使得其在用户游戏拉新注册场景具有更好的预测效果，进而可以更准确地向用户推荐游戏，提高了游戏推荐的效率。

本领域普通技术人员可以理解，上述实施例的各种方法中的全部或部分步骤可以通过指令来完成，或通过指令控制相关的硬件来完成，该指令可以存储于一计算机可读存储介质中，并由处理器进行加载和执行。

为此，本发明实施例还提供一种存储介质，其中存储有多条指令，该指令能够被处理器进行加载，以执行本发明实施例所提供的任一种信息推荐方法中的步骤。例如，该指令可以执行如下步骤：

其中，该存储介质可以包括：只读存储器(ROM，Read Only Memory)、随机存取记忆体(RAM，Random Access Memory)、磁盘或光盘等。

由于该存储介质中所存储的指令，可以执行本发明实施例所提供的任一种信息推荐方法中的步骤，因此，可以实现本发明实施例所提供的任一种信息推荐方法所能实现的有益效果，详见前面的实施例，在此不再赘述。

以上对本发明实施例所提供的一种信息推荐方法、装置和存储介质进行了详细介绍，本文中应用了具体个例对本发明的原理及实施方式进行了阐述，以上实施例的说明只是用于帮助理解本发明的方法及其核心思想；同时，对于本领域的技术人员，依据本发明的思想，在具体实施方式及应用范围上均会有改变之处，综上所述，本说明书内容不应理解为对本发明的限制。

Claims

1.一种信息推荐方法，其特征在于，包括：

2.根据权利要求1所述的方法，其特征在于，所述基于所述原始特征信息，通过多标签深度森林模型中的多个集成树模型层依次对所述待预测用户针对所述目标游戏的注册行为进行预测，得到每一集成树模型层对应的注册概率集合，包括：

从多标签深度森林模型中的多个集成树模型层确定当前集成树模型层；

基于所述原始特征信息，采用当前集成树模型层对所述待预测用户针对所述目标游戏的注册行为进行预测，得到所述当前集成树模型层对应的注册概率集合。

3.根据权利要求2所述的方法，其特征在于，所述基于所述原始特征信息，采用当前集成树模型层对所述待预测用户针对所述目标游戏的注册行为进行预测，包括：

当所述当前集成树模型层为第一集成树模型层时，将原始特征信息输入至当前集成树模型层，对所述待预测用户针对所述目标游戏的注册行为进行预测；

当所述当前集成树模型层不为第一集成树模型层时，将上一集成树模型层的注册概率集合和原始特征信息输入至当前集成树模型层，对所述待预测用户针对所述目标游戏的注册行为进行预测。

4.根据权利要求3所述的方法，其特征在于，所述当所述当前集成树模型层不为第一集成树模型层时，将上一集成树模型层的注册概率集合和原始特征信息输入至当前集成树模型层，包括：

当所述当前集成树模型层为第二集成树模型层时，将第一集成树模型层的注册概率集合和原始特征信息进行融合，得到融合后特征信息，将所述融合后特征信息输入至当前集成树模型层；

当所述当前集成树模型层不为第二集成树模型层时，基于历史集成树模型层的注册概率集合对上一集成树模型层的注册概率集合进行更新，得到更新后注册概率集合，将更新后注册概率集合和原始特征信息进行融合，得到融合后特征信息，将所述融合后特征信息输入至当前集成树模型层。

5.根据权利要求4所述的方法，其特征在于，所述基于历史集成树模型层的注册概率集合对上一集成树模型层的注册概率集合进行更新，得到更新后注册概率集合，包括：

确定所述上一集成树模型层的特征复用函数，其中，每个集成树模型层的特征复用函数基于所述多标签深度森林模型的训练确定；

基于所述特征复用函数将所述历史集成树模型层的注册概率集合与上一集成树模型层的注册概率集合进行特征映射，生成更新后注册概率集合。

6.根据权利要求1所述的方法，其特征在于，所述集成树模型层包括多个集成树模型，所述在当前集成树模型层为所述多标签深度森林模型中最后一层时，从所述当前集成树模型层的注册概率集合中选取所述待预测用户注册所述目标游戏的注册概率最大值，得到所述待预测用户对所述目标游戏的注册概率，包括：

在当前集成树模型层为所述多标签深度森林模型中最后一层时，所述当前集成树模型层中每个集成树模型输出所述待预测用户注册所述目标游戏的注册概率；

从多个集成树模型输出的所述待预测用户注册所述目标游戏的注册概率中获取注册概率最大值；

将所述注册概率最大值确定为所述待预测用户对所述目标游戏的注册概率。

7.根据权利要求1所述的方法，其特征在于，所述将所述用户特征信息和所述游戏特征信息进行融合，得到原始特征信息之前，还包括：

获取多组样本用户和样本游戏；

分别将所述样本用户和样本游戏进行特征提取，得到用户特征样本和游戏特征样本；

利用所述用户特征样本和游戏特征样本对预设多标签森林模型进行训练，得到多标签深度森林模型。

8.根据权利要求7所述的方法，其特征在于，所述预设多标签森林模型包括多个集成树模型层，所述集成树模型层包括预设特征复用函数，所述利用所述用户特征样本和游戏特征样本对预设多标签森林模型进行训练，得到多标签深度森林模型，包括：

基于所述用户特征样本和游戏特征样本，利用预设多标签森林模型的多个集成树模型层依次对所述样本用户针对所述样本游戏的注册行为进行预测；

根据预测结果更新所述集成树模型层的预设特征复用函数，直到所述预设多标签森林模型的训练满足预设条件，得到多标签深度森林模型。

9.一种信息推荐装置，其特征在于，包括：

10.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质存储有多条指令，所述指令适于处理器进行加载，以执行权利要求1至8中任一项所述的信息推荐方法中的步骤。

11.一种电子设备，包括存储器，处理器及存储在存储器上并可在处理器上运行的计算机程序，其中，所述处理器执行所述程序时实现如权利要求1至8任一项所述方法的步骤。