CN111861588B

CN111861588B - 流失预测模型的训练方法、玩家流失原因分析方法及装置

Info

Publication number: CN111861588B
Application number: CN202010784091.8A
Authority: CN
Inventors: 熊宇; 张怡婷; 吴润泽; 陶建容; 范长杰; 胡志鹏
Original assignee: Netease Hangzhou Network Co Ltd
Current assignee: Netease Hangzhou Network Co Ltd
Priority date: 2020-08-06
Filing date: 2020-08-06
Publication date: 2023-10-31
Anticipated expiration: 2040-08-06
Also published as: CN111861588A

Abstract

本申请提供了一种流失预测模型的训练方法、玩家流失原因分析方法及装置，该训练方法包括：获取多个目标玩家分别对应的游戏日志，并构造包括多个类别的流失原因特征和流失结果的训练数据集；将流失原因特征作为流失预测模型的输入，根据流失预测模型的输出结果以及流失原因特征对应的流失结果，调整流失预测模型，直至流失预测模型的损失值最小或者所有的模型参数都训练结束时，选取对应的准确率最高的内部结构，得到训练好的流失预测模型。本申请，能够提高流失预测模型预测结果的准确率，并且，通过流失预测模型输出目标玩家流失的预测值，降低了人工成本，提高了分析效率；另外，模型的可解释好，便于玩家查看；且模型易于扩展，适用性好。

Description

流失预测模型的训练方法、玩家流失原因分析方法及装置

技术领域

本申请涉及游戏技术领域，具体而言，涉及一种流失预测模型的训练方法、玩家流失原因分析方法及装置。

背景技术

在游戏领域，玩家的行为与游戏的运营息息相关，比如，玩家长时间未登录游戏(也即玩家流失)，会影响游戏的营收。

以玩家流失为例，游戏厂商通常要分析玩家流失的原因，通过分析玩家流失的原因，针对性地改进游戏，增强玩家的游戏体验，提升玩家留存率，进而增加游戏营收。目前，游戏厂商基于以下方法分析游戏玩家流失的原因：通过玩家的历史数据对流失玩家群体和留存玩家群体进行对比分析，以确定流失玩家的流失原因。

但是，该种方式中，需要人工对大量数据进行对比分析，人工成本高，分析效率低，且不易扩展，因此，无法满足如今无处不在的在线游戏。

发明内容

有鉴于此，本申请的目的在于提供一种流失预测模型的训练方法、玩家流失原因分析方法及装置，在训练阶段，通过包括多个类别的流失原因特征的训练数据集训练流失预测模型，提高了模型预测结果的准确率；在应用阶段，通过流失预测模型输出目标玩家流失的预测值，并对该预测值进行解释，降低了人工成本，提高了分析效率和分析准确率，便于玩家查看；另外，模型易于扩展，适用性好。

第一方面，本申请实施例提供了一种流失预测模型的训练方法，所述训练方法包括：

获取多个目标玩家分别对应的游戏日志，并根据所述游戏日志构造训练数据集；其中，所述训练数据集中的每个训练数据包括多个类别的流失原因特征和流失结果，所述流失结果包括是或否；

将所述流失原因特征作为流失预测模型的输入，根据所述流失预测模型的输出结果以及所述流失原因特征对应的流失结果，训练所述流失预测模型，直至所述流失预测模型的损失值最小或者所有的模型参数都训练结束时，选取对应的准确率最高的内部结构，得到训练好的流失预测模型；其中，训练好的所述流失预测模型用于基于输入的目标流失原因特征输出用于表征所述流失结果为是的预测值。

在一种可能的实施方式中，所述流失原因特征的类别包括以下至少之一：

社交影响类别、资源平衡类别、玩法挫败类别、游戏角色成长类别、游戏元素偏好类别。

在一种可能的实施方式中，所述根据所述游戏日志构造训练数据集，包括：

基于目标玩家对应的游戏日志，构建所述目标玩家对应的特征画像表，所述特征画像表中包括所述目标玩家对应的多个类别的流失原因特征；

基于所述目标玩家对应的游戏日志，确定所述目标玩家对应的流失结果；

基于多个目标玩家分别对应的特征画像表和该多个目标玩家分别对应的流失结果，构造训练数据集。

在一种可能的实施方式中，所述获取多个目标玩家分别对应的游戏日志，包括：

获取每个目标玩家在以每个目标时间点为中心的第一预设时间段内的登录信息；所述目标时间点为该目标玩家的流失起始时间点之前一段时间内的时间点；

根据该目标玩家在每个目标时间点对应的登录信息以及预设的标准值，确定该目标玩家对应的转折时间点；

获取该目标玩家对应的转折时间点之前的第二预设时间段内的游戏日志。

在一种可能的实施方式中，所述流失预测模型为集成树模型，该集成树模型中包括预设好的模型参数，所述模型参数包括：子模型树的数量、学习率、树的分支中的最小子模型树的权重值。

在一种可能的实施方式中，所述训练方法还包括：

获取所述目标玩家的反馈结果，所述反馈结果中包括反馈流失原因；

从所述反馈结果对应的反馈流失原因中，选取符合预设条件的参考流失原因；

根据所述参考流失原因以及所述流失原因特征，重新构造更新训练数据集，并基于所述更新训练数据集重新训练所述流失预测模型。

在一种可能的实施方式中，所述根据所述参考流失原因以及所述流失原因特征，重新构造更新训练数据集，包括：

基于所述参考流失原因、所述流失原因特征以及所述目标玩家对应的游戏日志，更新所述目标玩家对应的特征画像表，得到更新特征画像表；

根据所述更新特征画像表以及所述目标玩家对应的流失结果，重新构造训练数据集。

在一种可能的实施方式中，所述目标玩家为对应的游戏资源信息大于预设阈值的玩家。

第二方面，本申请实施例还提供了一种玩家流失原因分析方法，所述方法包括：

获取目标玩家对应的游戏日志，并从所述游戏日志中提取多个类别的流失原因特征；

将所述多个类别的流失原因特征输入到预先训练好的流失预测模型中，得到用于表征所述目标玩家的流失结果为是的第一预测值；

根据每个所述流失原因特征对所述第一预测值的影响，确定所述流失预测模型输出所述第一预测值的目标流失原因。

在一种可能的实施方式中，所述根据每个所述流失原因特征对所述第一预测值的影响，确定所述流失预测模型输出所述第一预测值的目标流失原因，包括：

根据每个所述流失原因特征、该流失原因特征对应的特征子集以及预设个数的训练数据，计算所述流失预测模型在该流失原因特征缺失时输出的第二预测值；

根据该流失原因特征对应的特征子集以及所述流失预测模型在该流失原因特征缺失时输出的第二预测值，确定该流失原因特征对应的特征重要性；

基于每个所述流失原因特征对应的特征重要性，确定所述流失预测模型输出所述第一预测值的目标流失原因。

在一种可能的实施方式中，所述基于每个所述流失原因特征对应的特征重要性，确定所述流失预测模型输出所述第一预测值的目标流失原因，包括：

基于每个所述流失原因特征对应的特征重要性，绘制第一解释图形；

在图形玩家界面中显示所述第一解释图形；其中，所述第一解释图形展示了在个体维度下每个所述流失原因特征对所述第一预测值的影响。

在一种可能的实施方式中，所述基于每个所述流失原因特征对应的特征重要性，确定所述流失预测模型输出所述第一预测值的目标流失原因，还包括：

基于多个目标玩家分别对应的流失原因特征的特征重要性，确定每个流失原因特征对应的特征重要性总和；

根据每个流失原因特征对应的特征重要性总和，绘制第二解释图形；

在图形玩家界面中显示所述第二解释图形；其中，所述第二解释图形展示了在全局维度下每个所述流失原因特征对所述第一预测值的影响。

在一种可能的实施方式中，所述分析方法还包括：

基于每个所述流失原因特征的不同特征值对所述第一预测值的影响，绘制第三解释图形；

在图形玩家界面中显示所述第三解释图形。

基于每一个所述流失原因特征对所述第一预测值的影响，确定在满足预设的准确率的前提下，对应的覆盖率最高的解释规则；

基于所述解释规则，确定所述流失预测模型输出所述第一预测值的目标流失原因。

在一种可能的实施方式中，所述基于所述解释规则，确定所述流失预测模型输出所述第一预测值的目标流失原因，包括：

基于所述解释规则对应的覆盖率的大小，从所述解释规则中选取预设个数的目标解释规则；

在图形玩家界面中显示所述目标解释规则。

在一种可能的实施方式中，在确定该流失原因特征对应的特征重要性之后，所述分析方法包括：

基于多个目标玩家分别对应的流失原因特征的特征重要性，对所述多个目标玩家进行聚类，得到多个玩家群组；其中，每一个玩家群组中的目标玩家对应相同的目标流失原因。

在一种可能的实施方式中，所述分析方法还包括：

基于多个目标玩家分别对应的目标流失原因，确定运营所述游戏的目标策略；

基于所述目标策略运营所述游戏。

第三方面，本申请实施例还提供了一种流失预测模型的训练装置，所述训练装置包括：

第一获取模块，用于获取多个目标玩家分别对应的游戏日志；

构造模块，用于根据所述游戏日志构造训练数据集；其中，所述训练数据集中的每个训练数据包括多个类别的流失原因特征和流失结果，所述流失结果包括是或否；

训练模块，用于将所述流失原因特征作为流失预测模型的输入，根据所述流失预测模型的输出结果以及所述流失原因特征对应的流失结果，训练所述流失预测模型，直至所述流失预测模型的损失值最小或者所有的模型参数都训练结束时，选取对应的准确率最高的内部结构，得到训练好的流失预测模型；其中，训练好的所述流失预测模型用于基于输入的目标流失原因特征输出用于表征所述流失结果为是的预测值。

第四方面，本申请实施例还提供了一种玩家流失原因分析装置，所述装置包括：

获取模块，用于获取目标玩家对应的游戏日志，并从所述游戏日志中提取多个类别的流失原因特征；

处理模块，用于将所述多个类别的流失原因特征输入到预先训练好的流失预测模型中，得到用于表征所述目标玩家的流失结果为是的第一预测值；

第一确定模块，用于根据每个所述流失原因特征对所述第一预测值的影响，确定所述流失预测模型输出所述第一预测值的目标流失原因。

第五方面，本申请实施例还提供了一种电子设备，包括：处理器、存储介质和总线，所述存储介质存储有所述处理器可执行的机器可读指令，当电子设备运行时，所述处理器与所述存储介质之间通过总线通信，所述处理器执行所述机器可读指令，以执行如第一方面任一项所述的流失预测模型的训练方法的步骤。

第六方面，本申请实施例还提供了一种计算机可读存储介质，所述计算机可读存储介质上存储有计算机程序，所述计算机程序被处理器运行时执行如第一方面任一项所述的流失预测模型的训练方法的步骤。

第七方面，本申请实施例还提供了一种电子设备，包括：处理器、存储介质和总线，所述存储介质存储有所述处理器可执行的机器可读指令，当电子设备运行时，所述处理器与所述存储介质之间通过总线通信，所述处理器执行所述机器可读指令，以执行如第二方面任一项所述的玩家流失原因分析方法的步骤。

第八方面，本申请实施例还提供了一种计算机可读存储介质，所述计算机可读存储介质上存储有计算机程序，所述计算机程序被处理器运行时执行如第二方面任一项所述的玩家流失原因分析方法的步骤。

本申请实施例提供了一种流失预测模型的训练方法，该训练方法包括：获取多个目标玩家分别对应的游戏日志，并根据游戏日志构造包括多个类别的流失原因特征和流失结果训练数据集；基于训练数据集对流失预测模型进行训练，得到训练好的流失预测模型；其中，训练好的流失预测模型用于基于输入的目标流失原因特征输出用于表征流失结果为是的预测值。这样，通过包括多个类别的流失原因特征的训练数据集训练流失预测模型，提高了模型预测结果的准确率。并且，基于训练好的流失预测模型输出目标玩家流失的预测值，降低了人工成本，提高了分析效率，且模型易于扩展，适用性好。

本申请实施例提供了一种玩家流失原因分析方法，该分析方法包括：获取目标玩家对应的游戏日志，并从游戏日志中提取多个类别的流失原因特征；将多个类别的流失原因特征输入到预先训练好的流失预测模型中，得到用于表征目标玩家的流失结果为是的第一预测值；根据每个流失原因特征对第一预测值的影响，确定流失预测模型输出第一预测值的目标流失原因。本申请中，通过流失预测模型输出目标玩家流失的预测值，并对该预测值进行解释，降低了人工成本，提高了分析效率，并且能够直观的展示各个流失原因特征对预测值的影响，便于玩家查看；另外，模型易于扩展，适用性好，能够满足实时的在线游戏。

附图说明

为了更清楚地说明本申请实施例的技术方案，下面将对实施例中所需要使用的附图作简单地介绍，应当理解，以下附图仅示出了本申请的某些实施例，因此不应被看作是对范围的限定，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他相关的附图。

图1示出了本申请实施例提供的一种流失预测模型的训练方法的流程图；

图2a示出了本申请实施例提供的一种流失预测模型的训练方法的流程图；

图2b示出了玩家不活跃天数分布图；

图3示出了本申请实施例提供的一种流失预测模型的训练方法的流程图；

图4示出了本申请实施例提供的一种流失预测模型的训练方法的流程图；

图5示出了本申请实施例提供的一种玩家流失原因分析方法的流程图；

图6示出了本申请实施例提供的另一种玩家流失原因分析方法的流程图；

图7示出了本申请实施例提供的另一种玩家流失原因分析方法的流程图；

图8a示出了本申请实施例提供的另一种玩家流失原因分析方法的流程图；

图8b示出了Summary Plot可视化工具基于SHAP值绘制的个人流失解释示意图；

图9a示出了本申请实施例提供的另一种玩家流失原因分析方法的流程图；

图9b示出了Summary Plot可视化工具基于SHAP值绘制的全局流失解释对模型输出结果影响的示意图；

图9c示出了子模选择算法选择的Top10规则的示意图；

图9d示出了SHAP依赖图-剧情观看百分比的示意图；

图10示出了本申请实施例提供的一种流失预测模型的训练装置的结构示意图；

图11示出了本申请实施例提供的一种玩家流失原因分析装置的结构示意图；

图12示出了本申请实施例提供的一种电子设备的结构示意图；

图13示出了本申请实施例提供的另一种电子设备的结构示意图。

具体实施方式

为使本申请实施例的目的、技术方案和优点更加清楚，下面将结合本申请实施例中的附图，对本申请实施例中的技术方案进行清楚、完整地描述，应当理解，本申请中附图仅起到说明和描述的目的，并不用于限定本申请的保护范围。另外，应当理解，示意性的附图并未按实物比例绘制。本申请中使用的流程图示出了根据本申请的一些实施例实现的操作。应该理解，流程图的操作可以不按顺序实现，没有逻辑的上下文关系的步骤可以反转顺序或者同时实施。此外，本领域技术人员在本申请内容的指引下，可以向流程图添加一个或多个其他操作，也可以从流程图中移除一个或多个操作。

另外，所描述的实施例仅仅是本申请一部分实施例，而不是全部的实施例。通常在此处附图中描述和示出的本申请实施例的组件可以以各种不同的配置来布置和设计。因此，以下对在附图中提供的本申请的实施例的详细描述并非旨在限制要求保护的本申请的范围，而是仅仅表示本申请的选定实施例。基于本申请的实施例，本领域技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例，都属于本申请保护的范围。

需要说明的是，本申请实施例中将会用到术语“包括”，用于指出其后所声明的特征的存在，但并不排除增加其它的特征。本申请实施例中“玩家”和用户可以互换。

目前分析玩家流失的原因通常如下：通过玩家的历史数据对流失玩家群体和留存玩家群体进行对比分析，以确定流失玩家的流失原因。但是，该种方式中，需要人工对大量数据进行对比分析，人工成本高，分析效率低，且不易扩展，因此，无法满足如今无处不在的在线游戏。

基于此，本申请实施例提供一种流失预测模型的训练方法、玩家流失原因分析方法及装置，在训练阶段，通过包括多个类别的流失原因特征的训练数据集训练流失预测模型，提高了模型预测结果的准确率；在应用阶段，通过流失预测模型输出目标玩家流失的预测值，并对该预测值进行解释，降低了人工成本，提高了分析效率；并且，能够直观的展示各个流失原因特征对预测值的影响，便于玩家查看；另外，模型易于扩展，适用性好，能够满足实时的在线游戏。

为了构建一个精确的、可扩展的、解释性好的流失预测模型，以通过该流失预测模型发现游戏玩家的流失原因、改进游戏、挽留玩家、提升游戏营收，本申请实施例提供了一种基于模型可解释性的游戏玩家流失原因分析方案，首先基于游戏领域专家知识设计一系列的流失原因特征，并基于目标人群限制和流失定义构建流失原因分析数据集(即训练数据集)，然后，基于训练数据集训练流失预测模型，之后，基于模型可解释性算法对流失预测模型进行解释，进一步利用分析算法和可视化技术对流失解释进行直观呈现，获得潜在的流失原因；最后，使用玩家调研和A/B测试评估流失原因分析效果，并可进一步迭代优化流失原因特征。

下面对本申请实施例提供的一种流失预测模型的训练方法、玩家流失原因分析方法分别进行详细介绍。

如图1所示，为本申请实施例提供的一种流失预测模型的训练方法，所述训练方法包括：

S101、获取多个目标玩家分别对应的游戏日志，并根据所述游戏日志构造训练数据集；其中，所述训练数据集中的每个训练数据包括多个类别的流失原因特征和流失结果，所述流失结果包括是或否。

S102、将所述流失原因特征作为流失预测模型的输入，根据所述流失预测模型的输出结果以及所述流失原因特征对应的流失结果，训练所述流失预测模型，直至所述流失预测模型的损失值最小或者所有的模型参数都训练结束时，选取对应的准确率最高的内部结构，得到训练好的流失预测模型；其中，训练好的所述流失预测模型用于基于输入的目标流失原因特征输出用于表征所述流失结果为是的预测值。

本申请实施例提供了一种流失预测模型的训练方法，通过包括多个类别的流失原因特征的训练数据集训练流失预测模型，提高了模型预测结果的准确率；相应的，通过训练好的流失预测模型输出目标玩家流失的预测值，并对该预测值进行解释，降低了人工成本，提高了分析效率，并且能够直观的展示各个流失原因特征对预测值的影响，便于玩家查看；另外，模型易于扩展，适用性好，能够满足实时的在线游戏。

下面分别对本申请上述实施例示例性的各步骤进行说明：

本申请实施例中，多个类别包括以下至少之一：社交影响类别、资源平衡类别、玩法挫败类别、游戏角色成长类别、游戏元素偏好类别。其中，每个类别中包括多个流失原因特征；每个流失原因特征对应一个维度，相应的，每个训练数据中包括多个维度的流失原因特征，比如，为82维。

其中，目标玩家为样本玩家，通过获取每个样本玩家的游戏日志，从游戏日志中提取该样本玩家在多个类别下的流失原因特征和该样本玩家对应的流失结果(比如，该样本玩家流失，还是未流失)，并构造训练数据集。

另外，本申请实施例中，目标玩家为对应的游戏资源信息大于预设阈值的玩家。考虑到不同玩家对游戏营收影响差异，游戏中大部分玩家是休闲玩家，有些甚至是外挂玩家损害游戏服务，基于此，本申请实施例中进行目标人群限制，选取对游戏营收具有贡献的玩家，比如，筛选充值金额超过预设阈值的玩家作为目标玩家进行分析，即基于目标玩家的游戏日志，构造训练数据集。

本申请实施例中，预先构建集成树模型，该集成树模型中包括预设好的模型参数，该模型参数包括子树的数量、学习率、树的分支中的最小子模型树的权重值。比如，设置子模型树棵数为1000，学习率为0.025，同时，在训练数据集和特征列中使用概率为75％的下采样，设置树的最大深度为6以及树分支的最小孩子权重为2等。然后，基于构造好的训练数据集训练该集成树模型，具体的训练过程包括：根据预先设置好的模型参数训练得到各个子树的内部结构，也即，决策树内部的if-else(是-否)分支决策结构，直至达到预设的训练截止条件时，选取对应的准确率最高的子树的内部结构，得到训练好的流失预测模型。其中，上述训练截止条件包括：集成树模型的损失值最小，或者说，损失不再下降；或者，所有的模型参数都训练结束，也即，完成集成树模型的所有子树的训练，比如，到达最大子树棵树1000。

实际中，集成树模型的1000棵子树是串行训练的，训练优化的目标是使集成树模型的损失(即loss)下降，在训练过程中，集成树模型是一棵子树一棵子树的训练使loss下降，并且，训练每一棵子树时都会记录当前子树的内部结构对应的准确率，当基于训练数据集对集成树模型进行训练，达到训练截止条件时，选取对应的准确率最高的子树的内部结构，得到包括该的准确率最高的子树的内部结构的集成树模型(也即流失预测模型)。

其中，对集成树模型的训练过程如下：选取训练数据集中的任一训练数据，将该训练数据对应的流失原因特征作为集成树模型的输入，根据该集成树模型基于该流失原因特征的输出结果(即玩家流失的概率)以及该训练数据对应的流失结果，训练集成树模型，重复该过程，直至集成树模型达到上述训练截止条件，选取对应的准确率最高的子树的内部结构，得到训练好的流失预测模型。

实际中，潜在流失原因特征有着各自的含义，且没有很强的多尺度空间结构，因此，集成树模型(即XGBoost)具有更好的预测性能，且能够基于模型的预测结果进行流失分析并给出模型输出预测结果的合理流失解释。另外，流失原因特征与流失结果有着复杂的非线性关系，基于集成树模型XGBoost，这一种高效、灵活、可移植的分布式梯度提升树的库，能够实现对训练数据集进行训练，捕捉这种非线性关系。

其中，本申请实施例中的流失预测模型为流失二分类模型，记玩家流失为1，玩家留存为0，将每个训练数据中的流失原因特征作为该流失预测模型的输入，流失预测模型的输出会是一个介于0到1之间的值，即玩家流失的概率。

进一步的，如图2a所示，本申请实施例提供的流失预测模型的训练方法中，所述根据所述游戏日志构造训练数据集，包括：

S201、基于目标玩家对应的游戏日志，构建所述目标玩家对应的特征画像表，所述特征画像表中包括所述目标玩家对应的多个类别的流失原因特征。

在本申请实施例中，服务器中包括五部分模块，分别为：原因特征构建和数据预处理模块、模型训练模块、模型解释模块、流失分析模块、评估和干预模块。其中，原因特征构建和数据预处理模块用于进行流失原因特征设计、潜在流失原因特征开发和训练数据集构建，具体内容如下：

1、潜在流失原因特征设计

其中，设计良好的潜在原因特征不仅使流失预测模型更易于学习，且使得流失解释也更有意义。基于此，本申请实施例中，基于游戏领域相关知识，设计一系列的游戏原因特征(即多个类别的游戏原因特征)，如社交影响、资源平衡、玩法挫败、角色成长、游戏元素偏好等类别的潜在流失原因特征。本申请的可选实施例中，设计了82维的特征。下面对各个类别的流失原因特征进行具体说明：

·社交影响：包含了师徒、情缘、好友、组队等社交因素对玩家流失造成影响的相关特征，如师父未登录天数、徒弟未登录天数、情缘未登录天数、流失好友占比、创建队伍次数占比等。

·资源平衡：包含了帮会、经验、装备、货币等资源因素对玩家流失造成影响的相关特征，如帮会资金、经验收支比、副本获得的高阶装备数量、元宝收支比等。

·玩法挫败：包含了死亡、破产、低收益等玩法挫败因素对玩家流失造成影响的相关特征，如坐牢用时占比、被玩家击杀次数、装备玩法耗时占比、商店破产次数等。

·角色成长：包含了等级、能力、成就、装备、技能等角色成长因素对玩家流失造成影响的相关特征，如等级提升量、角色评分提升量、称号获得个数、高阶装备升级数、技能平均等级提升等。

·游戏元素偏好：包含了游戏内各特定玩法元素偏好对玩家流失造成影响的相关特征，如捏脸用时、剧情观看百分比、支线任务完成个数、庄园用时占比、拥有店铺数量等。

2、潜在流失原因特征开发

本申请实施例中，通过分布式数据引擎对目标玩家的原始游戏日志进行预处理，构建玩家基础画像表，基于基础画像表开发原因特征画像，最后，将各类原因特征画像统一拼接为原因特征画像表，并使用例行部署工具对原因特征画像表部署例行。

S202、基于所述目标玩家对应的游戏日志，确定所述目标玩家对应的流失结果。

本申请实施例中，游戏中的玩家流失不同于电信服务中的玩家流失，在电信服务中，玩家流失可以通过玩家取消订阅进行简单地定义。在游戏中，游戏玩家很少删除账号或取消订阅，因此，在游戏领域，通过玩家登出-登录间隔时间超过一定阈值定义玩家流失。

在一种可选实施方式中，通过参考玩家不活跃天数的分布进行定义，分布如图2b所示，图2b中，显示离开游戏大于14天占总统计次数不到5％，即95％以上的14天以上不活跃玩家真正的流失了，基于此，将14天不登陆定义为流失玩家，否则为留存玩家。

本申请实施例中，基于每个目标玩家对应的游戏日志中该玩家登出-登录的时间间隔以及上述流失定义，确定每个目标玩家对应的流失结果，即该目标玩家是流失(对应1)，还是存留(对应0)。

S203、基于多个目标玩家分别对应的特征画像表和该多个目标玩家分别对应的流失结果，构造训练数据集。

本申请实施例中，针对每个目标玩家，基于该目标玩家对应的特征画像表和该个目标玩家对应的流失结果，构造训练数据，得到训练数据集。

进一步的，为了使玩家流失原因特征更明显，本申请实施例中，采用不玩家在流失衰退之前的时间段的游戏日志，通过这个阶段的游戏日志构建训练数据集，使玩家流失的特征更明显。如图3所示，本申请实施例提供的流失预测模型的训练方法中，所述获取多个目标玩家分别对应的游戏日志，包括：

S301、获取每个目标玩家在以每个目标时间点为中心的第一预设时间段内的登录信息；所述目标时间点为该目标玩家的流失起始时间点之前一段时间内的时间点。

本申请实施例中，为了防止流失分析出的结果仅仅是流失的表现，需找到玩家从活跃状态到衰退状态的衰退倾向转折点，并使用衰退倾向转折点之前的游戏日志构造训练数据集(即使用流失窗口前固定的数据段中的数据构造训练数据集)，为了防止流失分析出的结果仅仅是流失的表现，流失分析需找到玩家从活跃状态到衰退状态的转折点，使用转折点之前的数据进行分析。

其中，通过参考近两周不同活跃天数玩家的留存率分布，分布显示近两周活跃天数不少于10天的玩家留存率大于95％，因此，将距离流失窗口最近的近两周活跃天数不少于10天的时间作为衰退倾向转折点。基于此，第一预设时间段大于等于10。

本申请实施例中，目标时间点为该目标玩家的流失起始时间点之前一段时间内的时间段，该一段时间可以是提前设置好的，比如，为1个月，2个月等。针对每个流失的目标玩家，确定该目标玩家对应的流失起始时间点(即最后一次登出的时间)，然后，针对该流失起始时间点之前一段时间内的每个目标时间点，判断以该目标时间点为中心的第一预设时间段内，该目标玩家的登录次数。比如，以第一预设时间段为11天，最后一次登出的时间为2020年5月20号为例，以2020年5月19号为中心，对应的第一时间段为2020年5月14号到2020年5月24号，获取上述时间段内目标玩家1的登录次数。相应的，依次获取以2020年5月18号为中心，以2020年5月17号为中心该目标玩家1的登录次数。

S302、根据该目标玩家在每个目标时间点对应的登录信息以及预设的标准值，确定该目标玩家对应的转折时间点。

这里，针对每个目标玩家的任一目标时间点，将该目标玩家在该目标时间点对应的登录信息与预设的标准值进行比较，若该目标时间点对应的登录信息大于预设的标准值，则确定该目标时间点为该目标玩家对应的转折时间点(即上述衰退倾向转折点)。

比如，针对上述目标玩家1，该目标玩家1在5月19号对应的登录次数小于预设的标准值(比如8次)，5月19号则不是转折时间点。相应的，以此类推，继续判断5月18号、5月17号…等，最后，该目标玩家1在5月10号对应的登录次数大于预设的标准值(比如8次)，则确定5月10号为转折时间点。

S303、获取该目标玩家对应的转折时间点之前的第二预设时间段内的游戏日志。

这里，第二预设时间段为转折时间点之前的最近一段时间，通过获取转折时间点之前最近一段时间该目标玩家的游戏日志，能够更好的构造训练数据集，更精确的训练模型。其中，上述第二预设时间段可以根据需要进行设置，其可以与第一时间段相同，也可以不同。

进一步的，本申请实施例中，还可以通过对目标玩家进行调研，基于目标玩家的反馈结果调整流失原因特征，基于调整后的流失原因特征重新训练流失预测模型，如图4所示，本申请实施例提供的流失预测模型的训练方法中，所述训练方法还包括：

S401、获取所述目标玩家的反馈结果，所述反馈结果中包括反馈流失原因。

本申请实施例中，游戏运营团队通过对流失玩家做玩家调研，获取流失玩家的反馈结果，该反馈结果中包括流失玩家的反馈流失原因(即玩家真实流失原因)。可选的，玩家调研通常通过电话回访、问卷调查(比如电子问卷调查)的方式完成，通过玩家调研来从流失玩家的反馈结果中挖掘该玩家的反馈流失原因。

S402、从所述反馈结果对应的反馈流失原因中，选取符合预设条件的参考流失原因。

实际中，玩家的反馈结果中可能会包括不符合预设条件的流失原因，不能和设计的流失原因特征进行映射，比如，外部流失原因(如忙碌)；或者，反馈的原因不够具体(如玩法单调)。因此，需要预先从目标玩家的反馈结果中剔除上述不符合预设条件的流失原因，进而获得符合预设条件的参考流失原因。

在具体的实验案例中，通过玩家调研收集了190份有效玩家反馈，反馈的流失原因主要包括：忙碌、玩法单调、装备获取困难、帮会资金出现问题等。考虑到反馈结果中包括外部流失原因(即外部因素)，如忙碌，还有一些反馈的原因不够具体，如玩法单调，不能和设计的流失原因特征进行映射，因此，剔除这一部分反馈，得到116份有效的反馈。

S403、根据所述参考流失原因以及所述流失原因特征，重新构造更新训练数据集，并基于所述更新训练数据集重新训练所述流失预测模型。

本申请实施例中，根据流失玩家的反馈结果，游戏运营可以执行一些小规模的干预，以提升目标玩家(比如，高付费玩家)回流的概率。进一步的，将训练好的流失预测模型的输出结果(包括玩家流失的概率值和该概率值的解释信息)和玩家反馈流失原因进行比对，以评估本申请实施例中流失预测模型的效果。相应的，在116份有效的反馈中，有37％的反馈能与本申请中的流失原因分析结果匹配成功。本申请实施例中，具体的实验案例的游戏是一款内容丰富的大型角色扮演类游戏，通过上述调研比对的方式能够证明本申请方法的有效性。

另外，还可以根据比对的差异进一步迭代优化设计的潜在流失原因特征，其中，重新构造更新训练数据集的方法，包括：基于所述参考流失原因、所述流失原因特征以及所述目标玩家对应的游戏日志，更新所述目标玩家对应的特征画像表，得到更新特征画像表；根据所述更新特征画像表以及所述目标玩家对应的流失结果，重新构造训练数据集。

具体的，根据参考流失原因优化设计好的流失原因特征，得到优化流失原因特征，基于优化流失原因特征和目标玩家对应的游戏日志，更新所述目标玩家对应的特征画像表，得到更新特征画像表；根据所述更新特征画像表以及所述目标玩家对应的流失结果，重新构造训练数据集，并基于重新构造的训练数据集，重新训练流失预测模型。

本申请实施例提供的流失预测模型的训练方法，通过包括多个类别的流失原因特征的训练数据集训练流失预测模型，提高了模型预测结果的准确率。并且，基于训练好的流失预测模型输出目标玩家流失的预测值，降低了人工成本，提高了分析效率，且模型易于扩展，适用性好。

如图5所示，为本申请第二实施例提供的一种玩家流失原因分析方法，在训练好的流失预测模型的应用阶段，所述方法包括：

S501、获取目标玩家对应的游戏日志，并从所述游戏日志中提取多个类别的流失原因特征。

S502、将所述多个类别的流失原因特征输入到预先训练好的流失预测模型中，得到用于表征所述目标玩家的流失结果为是的第一预测值。

S503、根据每个所述流失原因特征对所述第一预测值的影响，确定所述流失预测模型输出所述第一预测值的目标流失原因。

本申请实施例提供了一种游戏中流失原因的分析方法，通过流失预测模型输出目标玩家流失的预测值，并对该预测值进行解释，降低了人工成本，提高了分析效率，并且能够直观的展示各个流失原因特征对预测值的影响，便于玩家查看；另外，模型易于扩展，适用性好，能够满足实时的在线游戏。

下面分别对本申请上述实施例示例性的各步骤进行说明：

本申请实施例中，目标玩家也即待检测玩家，通过获取该目标玩家的游戏日志，并从游戏日志中提取该目标玩家的多个类别的流失原因特征。

这里，与模型训练阶段一样，多个类别的流失原因特征包括以下至少之一：社交影响类别、资源平衡类别、玩法挫败类别、游戏角色成长类别、游戏元素偏好类别。其中，每个类别中包括多个流失原因特征(具体流失原因特征如S201的解释部分)；每个流失原因特征对应一个维度，相应的，每个目标玩家对应多个维度的流失原因特征，比如，为82维。

本申请实施例中，将目标多个类别的流失原因特征输入到预先训练好的流失预测模型中，得到用于表征该目标玩家的流失结果为是的第一预测值，即该目标玩家流失的概率值。

本申请实施例中，根据每个流失原因特征对流失预测模型的输出结果(即第一预测值)的影响，对该流失预测模型的输出结果进行解释，得到解释原因(即目标流失原因)，并对得到的解释原因进行展示，供工作游戏厂商工作人员查看。

本申请实施例中，通过两种方式对流失预测模型的输出结果进行解释，下面分别进行说明；

第一种方式：快速局部特征重要性计算(即SHAP值计算)。具体的，计算“流失预测模型”的“局部特征重要性(即SHAP值)”。其中，流失预测模型对单个玩家样本进行预测，相当于形成了一个局部决策边界；因此，局部特征重要性是单个玩家样本的特征重要性的一种术语表达。

如图6所示，本申请实施例提供的玩家流失原因分析方法中，所述根据每个所述流失原因特征对所述第一预测值的影响，确定所述流失预测模型输出所述第一预测值的目标流失原因，包括：

S601、根据每个所述流失原因特征、该流失原因特征对应的特征子集以及预设个数的训练数据，计算所述流失预测模型在该流失原因特征缺失时输出的第二预测值。

本申请实施例中，针对一个目标玩家，该目标玩家对应的多维度的流失原因特征组成流失原因特征集，该流失原因特征集中每个流失原因特征为一个特征子集。相应的，流失预测模型针对该目标玩家的SHAP值＝该目标玩家的各特征子集的边际贡献＝每个所述流失原因特征对应的特征重要性。

其中，SHAP值拥有如一致性、局部准确性等模型解释的良好性质。可选的，利用TreeExplainer方法计算流失预测模型针对单个目标玩家的SHAP，这样，能够将SHAP值复杂的计算过程简化，计算复杂度从原来的指数时间下降为多项式时间。

为了计算流失预测模型每次预测的SHAP值，需要估计当特定输入特征缺失时模型的预测值，相应的，本申请实施例中通过在训练数据集中采样并使用采样样本中已有的取值替代缺失特征值。通过嵌套采样，即外层采样用于计算SHAP值，内层采样用于计算特征缺失时模型的预测值，我们极大的减少了SHAP值计算的复杂度，这里，内层采样使用K中位数聚类在训练数据集中找到预设个数(比如20个)具有代表性的中位数样本点，并基于这些中位数样本点进行近似计算。

相应的，TreeExplainer方法内层的计算过程如下：针对该目标玩家对应的每个流失原因特征，首先计算流失预测模型在每个流失原因特征缺失时，对应输出的第二预测值。比如，目标玩家对应10个流失原因特征，分别为特征1～特征10；首先，计算流失预测模型(简称模型)在特征1缺失时，输出的第二预测值。具体的，获取特征1对应的特征子集以及预设个数的训练数据；这里，特征1对应的特征子集可以为多个，多个特征子集均不相同；其中，每个特征子集中包括除特征1(即当前特征)之外的至少一个其他特征，比如，子集1：特征2～特征9；子集2；特征2～特征8；子集3；特征2～特征7……子集10：特征5、特征7、特征9等。

其中，上述训练数据(即上述中位数样本点)的目的是为了替代缺失特征的特征值，这些训练数据是从模型训练过程中构建的训练数据集中随机选取的；其中，上述训练数据的预设个数可以根据需要进行设置，比如设置为20。并且，基于特征1，特征1对应的特征子集以及预设个数的训练数据，即可计算出模型在特征1缺失时，输出的第二预测值。相应的，还能够依次算出模型在特征2缺失时输出的第二预测值，在特征3缺失时输出的第二预测值等等。

S602、根据该流失原因特征对应的特征子集以及所述流失预测模型在该流失原因特征缺失时输出的第二预测值，确定该流失原因特征对应的特征重要性。

本申请实施例中，TreeExplainer方法外层基于内层的计算结果(即流失预测模型在各个失原因特征缺失时输出的第二预测值)和各个流失原因特征对应的特征子集，计算该流失预测模型中目标玩家的各个流失原因特征对应的特征重要性。

S603、基于每个所述流失原因特征对应的特征重要性，确定所述流失预测模型输出所述第一预测值的目标流失原因。

本申请实施例中，在知道了流失预测模型中目标玩家的各个流失原因特征对应的特征重要性之后，可以基于各个流失原因特征的特征重要性，可以获知哪个流失原因特征影响目标玩家流失，进而基于相应的流失原因特征，确定流失预测模型输出第一预测值的目标流失原因。

比如，玩家是否加入了一个健康的帮会对玩家留存有着关键性的影响，玩家未加入健康的帮会是影响流失预测模型输出玩家流失概率为80％的主要原因。也即，玩家未加入健康的帮会是玩家流失的主要原因。

第二种方式：局部解释规则提取。其中，基于决策规则的解释(也即解释规则)往往更加直观，易于工作人员的理解。本申请实施例中，利用Anchor方法解释每个样本(即每个目标玩家对应的数据)，生成解释规则，Anchor生成的每条规则都有清晰的准确率和覆盖率。

进一步的，如图7所示，所述根据每个所述流失原因特征对所述第一预测值的影响，确定所述流失预测模型输出所述第一预测值的目标流失原因，包括：

S701、基于每一个所述流失原因特征对所述第一预测值的影响，确定在满足预设的准确率的前提下，对应的覆盖率最高的解释规则。

S702、基于所述解释规则，确定所述流失预测模型输出所述第一预测值的目标流失原因。

结合步骤701和步骤702，将每个目标玩家的数据作为一个被预测样本，Anchor通过找到一个决策规则来充分地锚定流失预测模型的预测，决策规则决定了被预测样本的其他特征值发生变化不影响流失预测模型的预测值。Anchor旨在找到满足给定准确率阈值时拥有最高样本覆盖率的规则。在一种实施方式中，考虑到准确率和覆盖率存在权衡，以及，玩家短期记忆容量为5-9条谓词，设置准确率阈值为0.95，规则的最大谓词长度为6。

另外，基于模型解释模块生成的局部解释，本申请实施例运用四种应用来分析玩家流失的原因：个人流失解释、全局流失解释、SHAP依赖图分析和监督聚类分析。

第一，个人流失解释。考虑到各个流失原因特征对应的特征重要性不便于工作人员查看，基于此，本申请实施例中运用可视化工具(比如Force Plot可视化工具)对各个流失原因特征对应的特征重要性进行直观的呈现，以得到更易于理解的个人流失解释分析。其中，TreeExplainer和Anchor方法均生成局部解释。

如图8a所示，在基于每个所述流失原因特征对应的特征重要性，确定所述流失预测模型输出所述第一预测值的目标流失原因，包括：

S801、基于每个所述流失原因特征对应的特征重要性，绘制第一解释图形。

S802、在图形玩家界面中显示所述第一解释图形；其中，所述第一解释图形展示了在个体维度下每个所述流失原因特征对所述第一预测值的影响。

结合步骤801和步骤802，在个体维度下，通过对单个目标玩家的各个流失原因特征对应的特征重要性进行可视化处理，得到每个流失原因特征对该目标玩家流失预测值的影响。

图8b展示了Force Plot可视化工具的一个例子，0.97左侧的特征对流失起正向作用，将流失预测模型的输出从基准值(base value)推向更高的预测值，0.97右侧的特征则相反，对流失起负向作用，将流失预测模型的输出推向更低的预测值。图8b中显示帮会资金缺乏、好友流失等因素对该玩家有着较强的流失影响。

对于Anchor生成的解释规则，本申请实施例中，使用文本表格进行呈现，实验结果显示Anchor生成的解释规则一定程度上能与TreeExplainer生成的SHAP值解释相对应，并有一定额外的解释补充，因此，两种方法可以相互验证和补充，本申请实施例中同时使用这两种方法进行个人流失解释分析。

第二，全局流失解释。本申请实施例中，还可以从全局维度下对SHAP值进行可视化处理，进一步的，如图9a所示，所述基于每个所述流失原因特征对应的特征重要性，确定所述流失预测模型输出所述第一预测值的目标流失原因，还包括：

S901、基于多个目标玩家分别对应的流失原因特征的特征重要性，确定每个流失原因特征对应的特征重要性总和。

S902、根据每个流失原因特征对应的特征重要性总和，绘制第二解释图形。

S903、在图形玩家界面中显示所述第二解释图形；其中，所述第二解释图形展示了在全局维度下每个所述流失原因特征对所述第一预测值的影响。

结合步骤901至步骤903，全局流失解释为流失预测模型提供一个整体的解释，以帮助工作人员快速理解流失原因的概要。对于TreeExplainer方法生成的SHAP值，本申请实施例中，使用Summary Plot可视化工具对玩家流失原因进行了直观的整体呈现，SummaryPlot可视化工具绘制了所有样本(每个目标玩家为一个样本)所有特征的SHAP值，其根据特征在所有样本的SHAP值大小之和进行排序，并展示了各个特征对流失影响的分布。如图9b所示，图中展示了SHAP值重要性排名前20特征的流失影响分布(也即展示了SHAP值比较大的，排序在前的一部分的流失原因特征对应第一预测值的影响)，其中颜色表示了特征值的大小，即左侧表示特征值大，右侧表示特征值小，结果显示称号获取、高阶技能学习、非绑定元宝数、任务困难、逐出队伍和剧情观看是最重要的整体玩家流失原因，该结果获得了游戏运营的认可。同时，本申请实施例中还使用Standard Bar Plot可视化工具来展示基于特征SHAP值的整体流失影响排序。

其中，在Anchor生成的解释规则下，所述基于所述解释规则，确定所述流失预测模型输出所述第一预测值的目标流失原因，包括：基于所述解释规则对应的覆盖率的大小，从所述解释规则中选取预设个数的目标解释规则；在图形玩家界面中显示所述目标解释规则。

其中，对于Anchor生成的解释规则，在图形用户界面使用文本表格进行呈现，该呈现结果为对应的覆盖率大于特定阈值的目标解释规则，或者，选取出来的覆盖率排序在前的预设个数的目标解释规则。在本申请实施例中，使用子模选择(SP)算法来找到一个最优的规则子集用于尽可能多地覆盖流失的样本，以表达模型的全局行为。图9c展示了通过子模选择算法得到的前10条规则，结果显示玩家是否加入了一个健康的帮会对玩家留存有着关键性的影响，同时，也展示了一些其他原因如游戏货币获取占比、高阶装备获取、游戏剧情观看程度对流失有着重要影响。两种方法在全局流失解释上互相验证并互相补充。

第三，SHAP依赖图分析。在局部维度下，每个流失原因特征的不同特征值对流失预测模型的输出结果也有一定的影响。进一步的，所述分析方法还包括：

基于每个所述流失原因特征的不同特征值对所述第一预测值的影响，绘制第三解释图形；在图形玩家界面中显示所述第三解释图形。

本申请实施例中，该第三解释图形即SHAP依赖图，其是局部依赖图(PDP)的另外一种更丰富的选择。其中，SHAP依赖图将特征值作为x轴，特征重要性SHAP值作为y轴，通过将数据集中各个特征的这些值绘制出来，则可以从中观察到特征重要性SHAP值如何随着特征值的变化改变。图9d的上半部分图中展示了剧情观看百分比特征对应的SHAP依赖图，可以看到不同的剧情观看程度对流失行为有着不同的影响，图中的颜色越深表明玩家密度越大。图9d的上半部分图中显示了，当剧情观看百分比小于60％时，对玩家留存有积极影响，而当其大于60％时，对玩家流失有一定的影响，但当剧情观看百分比大于95％时，又对玩家留存起到了积极影响，这暗示了一小部分人确实很热爱游戏的剧情。同时，图9d的下半部分图中还显示了高留存玩家和高流失玩家对应的SHAP依赖图以及特征分布图，用于辅助流失分析。

第四，监督聚类分析。进一步的，本申请实施例提供的玩家流失原因分析方法，在确定该流失原因特征对应的特征重要性之后，所述分析方法包括：

其中，监督聚类用于找到拥有相同流失原因的群体，本申请实施例中的聚类方式，直接在数据特征上聚类，监督聚类在特征重要性SHAP值上进行聚类(也即采用流失原因特征的特征重要性进行聚类)，能够对流失群体(也即流失用户)进行聚类，且获知每一类用户到底是什么群体，比如都是没有加入帮会的群体，还是都是装备差的群体等。监督聚类天然地将模型的输入特征(即流失原因特征)转化为具有相同单位的值(即SHAP值)，这解决了无监督聚类中如何处理不同特征权重的问题，并且减少了异常点的影响。基于此，通过详细地对每个玩家群体进行流失原因分析，对不同流失群体有更深的理解。

进一步的，本申请实施例中，所述分析方法还包括：基于多个目标玩家分别对应的目标流失原因，确定运营所述游戏的目标策略；基于所述目标策略运营所述游戏。

本申请实施例中，还可以通过对目标玩家进行调研，一方面基于目标玩家的反馈结果调整流失原因特征，基于调整后的流失原因特征重新训练流失预测模型。另一方面，基于目标玩家的反馈结果对游戏进行干预，基于目标流失原因(或者基于目标玩家的反馈结果和目标流失原因)确定特定的目标策略，并基于该目标策略运营游戏。

具体的，根据流失玩家的反馈结果，游戏运营可以执行一些小规模的干预，以提升目标玩家(比如，高付费玩家)回流的概率。进一步的，将流失预测模型的输出结果(包括玩家流失的概率值和该概率值的解释信息)和玩家反馈流失原因进行比对，以评估本申请实施例中流失预测模型的效果。

干预是探索流失分析方法商业价值的一种方式，通过结合本申请实施例得到的流失分析结果和玩家调研结果，当确切的流失原因被发现时，游戏运营和游戏开发将执行特定的干预。更进一步，本申请实施例中，使用A/B测试用以评估干预的有效性。在具体实验案例中，根据流失分析结果发现剧情观看对玩家流失有着重要影响，游戏策划由于为了让玩家有更好的代入感，玩家在观看剧情时不能在百分比低于80％时跳过剧情，为了分析不能跳过剧情的设置对流失的影响，可以对玩家剧情观看是否能在80％前跳过剧情进行A/B测试，观察实验组(即A，可以跳过剧情)的近两周平均在线时长是否显著大于对照组(即B，不可跳过剧情)。这里，使用独立双样本t检验，结果显示，实验组的近两周平均在线时长比对照组的近两周平均在线时长增加了346秒，显著性检验P值为0.001，表明了干预效果的显著性，展示了玩家流失分析方法的有效性。在实际运营游戏时，比如，针对一个视频观看，设置玩家必须观看剧情，不能跳过，能够减少玩家的流失。

本申请实施例提供了一种玩家流失原因分析方法，通过流失预测模型输出目标玩家流失的预测值，并对该预测值进行解释，降低了人工成本，提高了分析效率，并且能够直观的展示各个流失原因特征对预测值的影响，便于玩家查看；另外，模型易于扩展，适用性好，能够满足实时的在线游戏。

基于同一发明构思，本申请第三实施例中还提供了与第一实施例中流失预测模型的训练方法对应的流失预测模型的训练装置，由于本申请第三实施例中的装置解决问题的原理与本申请第一实施例中流失预测模型的训练方法相似，因此，装置的实施可以参见方法的实施，重复之处不再赘述。

如图10所示，本申请实施例提供了一种流失预测模型的训练装置，所述训练装置包括：

第一获取模块1001，用于获取多个目标玩家分别对应的游戏日志。

构造模块1002，用于根据所述游戏日志构造训练数据集；其中，所述训练数据集中的每个训练数据包括多个类别的流失原因特征和流失结果，所述流失结果包括是或否。

训练模块1003，用于将所述流失原因特征作为流失预测模型的输入，根据所述流失预测模型的输出结果以及所述流失原因特征对应的流失结果，训练所述流失预测模型，直至所述流失预测模型的损失值最小或者所有的模型参数都训练结束时，选取对应的准确率最高的内部结构，得到训练好的流失预测模型；其中，训练好的所述流失预测模型用于基于输入的目标流失原因特征输出用于表征所述流失结果为是的预测值。

在一种可能的实施方式中，所述构造模块1002根据所述游戏日志构造训练数据集，包括：

在一种可能的实施方式中，所述第一获取模块1001获取多个目标玩家分别对应的游戏日志，包括：

获取每个目标玩家在以每个目标时间点为中心的第一预设时间段内的登录信息；

在一种可能的实施方式中，所述训练装置还包括：

第二获取模块，用于获取所述目标玩家的反馈结果，所述反馈结果中包括反馈流失原因；

选取模块，用于从所述反馈结果对应的反馈流失原因中，选取符合预设条件的参考流失原因；

构造模块1002，还用于根据所述参考流失原因，重新构造更新训练数据集；

训练模块1003，还用于基于所述更新训练数据集重新训练所述流失预测模型。

在一种可能的实施方式中，所述构造模块1002根据所述参考流失原因，重新构造更新训练数据集，还包括：

基于所述参考流失原因以及所述目标玩家对应的游戏日志，更新所述目标玩家对应的特征画像表，得到更新特征画像表；

本申请实施例提供了一种流失预测模型的训练装置，通过包括多个类别的流失原因特征的训练数据集训练流失预测模型，提高了模型预测结果的准确率；相应的，通过训练好的流失预测模型输出目标玩家流失的预测值，并对该预测值进行解释，降低了人工成本，提高了分析效率，并且能够直观的展示各个流失原因特征对预测值的影响，便于玩家查看；另外，模型易于扩展，适用性好，能够满足实时的在线游戏。

基于同一发明构思，本申请第四实施例中还提供了与第二实施例中的玩家流失原因分析方法对应的玩家流失原因分析装置，由于本申请实施例中的装置解决问题的原理与本申请实施例上述玩家流失原因分析方法相似，因此装置的实施可以参见方法的实施，重复之处不再赘述。

如图11所示，为本申请第四实施例提供的一种玩家流失原因分析装置，所述装置包括：

获取模块1101，用于获取目标玩家对应的游戏日志，并从所述游戏日志中提取多个类别的流失原因特征；

处理模块1102，用于将所述多个类别的流失原因特征输入到预先训练好的流失预测模型中，得到用于表征所述目标玩家的流失结果为是的第一预测值；

第一确定模块1103，用于根据每个所述流失原因特征对所述第一预测值的影响，确定所述流失预测模型输出所述第一预测值的目标流失原因。

在一种可能的实施方式中，所述第一确定模块1103根据每个所述流失原因特征对所述第一预测值的影响，确定所述流失预测模型输出所述第一预测值的目标流失原因，包括：

在一种可能的实施方式中，所述第一确定模块1103基于每个所述流失原因特征对应的特征重要性，确定所述流失预测模型输出所述第一预测值的目标流失原因，包括：

在一种可能的实施方式中，所述第一确定模块1103基于每个所述流失原因特征对应的特征重要性，确定所述流失预测模型输出所述第一预测值的目标流失原因，还包括：

在一种可能的实施方式中，所述分析装置还包括：

绘制模块，用于基于每个所述流失原因特征的不同特征值对所述第一预测值的影响，绘制第三解释图形；

显示模块，用于在图形玩家界面中显示所述第三解释图形。

在一种可能的实施方式中，所述第一确定模块1103基于所述解释规则，确定所述流失预测模型输出所述第一预测值的目标流失原因，包括：

在图形玩家界面中显示所述目标解释规则。

在一种可能的实施方式中，所述分析装置包括：

聚类模块，用于在确定该流失原因特征对应的特征重要性之后，基于多个目标玩家分别对应的流失原因特征的特征重要性，对所述多个目标玩家进行聚类，得到多个玩家群组；其中，每一个玩家群组中的目标玩家对应相同的目标流失原因。

在一种可能的实施方式中，所述分析装置还包括：

第二确定模块，用于基于多个目标玩家分别对应的目标流失原因，确定运营所述游戏的目标策略；

运营模块，用于基于所述目标策略运营所述游戏。

本申请实施例提供了一种玩家流失原因分析装置，通过流失预测模型输出目标玩家流失的预测值，并对该预测值进行解释，降低了人工成本，提高了分析效率，并且能够直观的展示各个流失原因特征对预测值的影响，便于玩家查看；另外，模型易于扩展，适用性好，能够满足实时的在线游戏。

如图12所示，本申请第五实施例提供的一种电子设备1200，包括：处理器1201、存储器1202和总线，所述存储器1202存储有所述处理器1201可执行的机器可读指令，当电子设备运行时，所述处理器1201与所述存储器1202之间通过总线通信，所述处理器1201执行所述机器可读指令，以执行如上述第一实施例中的流失预测模型的训练方法的步骤。

具体地，上述存储器1202和处理器1201能够为通用的存储器和处理器，这里不做具体限定，当处理器1201运行存储器1202存储的计算机程序时，能够执行上述第一实施例中的流失预测模型的训练方法。

对应于上述第一实施例中的流失预测模型的训练方法，本申请第六实施例还提供了一种计算机可读存储介质，所述计算机可读存储介质上存储有计算机程序，所述计算机程序被处理器运行时执行上述第一实施例中的流失预测模型的训练方法的步骤。

如图13所示，本申请第七实施例提供的一种电子设备1300，包括：处理器1301、存储器1302和总线，所述存储器1302存储有所述处理器1301可执行的机器可读指令，当电子设备运行时，所述处理器1301与所述存储器1302之间通过总线通信，所述处理器1301执行所述机器可读指令，以执行如上述第二实施例中的玩家流失原因分析方法的步骤。

具体地，上述存储器1302和处理器1301能够为通用的存储器和处理器，这里不做具体限定，当处理器1301运行存储器1302存储的计算机程序时，能够执行上述第二实施例中的玩家流失原因分析方法。

对应于上述第二实施例中的玩家流失原因分析方法，本申请第八实施例还提供了一种计算机可读存储介质，所述计算机可读存储介质上存储有计算机程序，所述计算机程序被处理器运行时执行上述第二实施例中的玩家流失原因分析方法的步骤。

所属领域的技术人员可以清楚地了解到，为描述的方便和简洁，上述描述的系统和装置的具体工作过程，可以参考方法实施例中的对应过程，本申请中不再赘述。在本申请所提供的几个实施例中，应该理解到，所揭露的系统、装置和方法，可以通过其它的方式实现。以上所描述的装置实施例仅仅是示意性的，例如，所述模块的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，又例如，多个模块或组件可以结合或者可以集成到另一个系统，或一些特征可以忽略，或不执行。另一点，所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些通信接口，装置或模块的间接耦合或通信连接，可以是电性，机械或其它的形式。

所述作为分离部件说明的模块可以是或者也可以不是物理上分开的，作为模块显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。

另外，在本申请各个实施例中的各功能单元可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个单元中。

所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个处理器可执行的非易失的计算机可读取存储介质中。基于这样的理解，本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括：U盘、移动硬盘、ROM、RAM、磁碟或者光盘等各种可以存储程序代码的介质。

以上仅为本申请的具体实施方式，但本申请的保护范围并不局限于此，任何熟悉本技术领域的技术人员在本申请揭露的技术范围内，可轻易想到变化或替换，都应涵盖在本申请的保护范围之内。因此，本申请的保护范围应以权利要求的保护范围为准。

Claims

1.一种流失预测模型的训练方法，其特征在于，所述训练方法包括：

获取多个目标玩家分别对应的游戏日志，并根据所述游戏日志构造训练数据集；其中，所述训练数据集中的每个训练数据包括多个类别的流失原因特征和流失结果，所述流失结果包括是或否；所述目标玩家为对应的游戏资源信息大于预设阈值的玩家，所述游戏日志为目标玩家在流失衰退之前时间段的游戏日志；流失玩家对应玩家登出登录间隔时间大于预设阈值，所述预设阈值是通过参考玩家不活跃天数的分布确定的；所述多个类别的流失原因特征包括：社交影响类别下社交关系因素对玩家流失造成影响的相关特征；资源平衡类别下玩家所在组织以及玩家本身多方面的资源因素对玩家流失造成影响的相关特征；所述资源因素包括帮会资金、经验收支比、副本获得的高阶装备数量、元宝收支比；玩法挫败类别下多方面玩法挫败因素对玩家流失造成影响的相关特征；所述玩法挫败因素包括坐牢用时占比、被玩家击杀次数、装备玩法耗时占比、商店破产次数；游戏角色成长类别下多方面角色成长因素对玩家流失造成影响的相关特征；所述角色成长因素包括等级提升量、角色评分提升量、称号获得个数、高阶装备升级数、技能平均等级提升；游戏元素偏好类别下游戏内各特定玩法元素偏好对玩家流失造成影响的相关特征；玩法元素偏好至少包括捏脸用时、剧情观看百分比、支线任务完成个数、庄园用时占比和拥有店铺数量；

将每个训练数据的多类别流失原因特征作为流失预测模型的输入，根据所述流失预测模型的输出结果以及所述多类别流失原因特征对应的流失结果，训练所述流失预测模型，直至所述流失预测模型的损失值最小或者所有的模型参数都训练结束时，选取对应的准确率最高的内部结构，得到训练好的流失预测模型；其中，训练好的所述流失预测模型用于基于输入的目标流失原因特征输出用于表征所述流失结果为是的预测值；

所述获取多个目标玩家分别对应的游戏日志，包括：获取每个目标玩家在以每个目标时间点为中心的第一预设时间段内的登录信息；所述目标时间点为该目标玩家的流失起始时间点之前一段时间内的时间点；根据该目标玩家在每个目标时间点对应的登录信息以及预设的标准值，确定该目标玩家对应的转折时间点；获取该目标玩家对应的转折时间点之前的第二预设时间段内的游戏日志；所述登录信息包括登录次数。

2.根据权利要求1所述的流失预测模型的训练方法，其特征在于，所述根据所述游戏日志构造训练数据集，包括：

3.根据权利要求1-2任一项所述的流失预测模型的训练方法，其特征在于，所述流失预测模型为集成树模型，该集成树模型中包括预设好的模型参数，所述模型参数包括：子模型树的数量、学习率、树的分支中的最小子模型树的权重值。

4.根据权利要求1所述的流失预测模型的训练方法，其特征在于，所述训练方法还包括：

5.根据权利要求4所述的流失预测模型的训练方法，其特征在于，所述根据所述参考流失原因以及所述流失原因特征，重新构造更新训练数据集，包括：

6.一种玩家流失原因分析方法，其特征在于，所述方法包括：

将所述多个类别的流失原因特征输入到预先训练好的流失预测模型中，得到用于表征所述目标玩家的流失结果为是的第一预测值；其中，所述流失预测模型是基于权利要求1中流失预测模型的训练方法训练得到的；

7.根据权利要求6所述的玩家流失原因分析方法，其特征在于，所述根据每个所述流失原因特征对所述第一预测值的影响，确定所述流失预测模型输出所述第一预测值的目标流失原因，包括：

8.根据权利要求7所述的玩家流失原因分析方法，其特征在于，所述基于每个所述流失原因特征对应的特征重要性，确定所述流失预测模型输出所述第一预测值的目标流失原因，包括：

9.根据权利要求7所述的玩家流失原因分析方法，其特征在于，所述基于每个所述流失原因特征对应的特征重要性，确定所述流失预测模型输出所述第一预测值的目标流失原因，还包括：

10.根据权利要求7所述的玩家流失原因分析方法，其特征在于，所述分析方法还包括：

在图形玩家界面中显示所述第三解释图形。

11.根据权利要求6所述的玩家流失原因分析方法，其特征在于，所述根据每个所述流失原因特征对所述第一预测值的影响，确定所述流失预测模型输出所述第一预测值的目标流失原因，包括：

12.根据权利要求11所述的玩家流失原因分析方法，其特征在于，所述基于所述解释规则，确定所述流失预测模型输出所述第一预测值的目标流失原因，包括：

在图形玩家界面中显示所述目标解释规则。

13.根据权利要求7所述的玩家流失原因分析方法，其特征在于，在确定该流失原因特征对应的特征重要性之后，所述分析方法包括：

14.根据权利要求6所述的玩家流失原因分析方法，其特征在于，所述分析方法还包括：

基于所述目标策略运营所述游戏。

15.一种流失预测模型的训练装置，其特征在于，所述训练装置包括：

第一获取模块，用于获取多个目标玩家分别对应的游戏日志；其中，所述获取多个目标玩家分别对应的游戏日志，包括：获取每个目标玩家在以每个目标时间点为中心的第一预设时间段内的登录信息；所述目标时间点为该目标玩家的流失起始时间点之前一段时间内的时间点；根据该目标玩家在每个目标时间点对应的登录信息以及预设的标准值，确定该目标玩家对应的转折时间点；获取该目标玩家对应的转折时间点之前的第二预设时间段内的游戏日志；所述登录信息包括登录次数；

构造模块，用于根据所述游戏日志构造训练数据集；其中，所述训练数据集中的每个训练数据包括多个类别的流失原因特征和流失结果，所述流失结果包括是或否；所述目标玩家为对应的游戏资源信息大于预设阈值的玩家，所述游戏日志为目标玩家在流失衰退之前时间段的游戏日志；流失玩家对应玩家登出登录间隔时间大于预设阈值，所述预设阈值是通过参考玩家不活跃天数的分布确定的；所述多个类别的流失原因特征包括：社交影响类别下社交关系因素对玩家流失造成影响的相关特征；资源平衡类别下玩家所在组织以及玩家本身多方面的资源因素对玩家流失造成影响的相关特征；所述资源因素包括帮会资金、经验收支比、副本获得的高阶装备数量、元宝收支比；玩法挫败类别下多方面玩法挫败因素对玩家流失造成影响的相关特征；所述玩法挫败因素包括坐牢用时占比、被玩家击杀次数、装备玩法耗时占比、商店破产次数；游戏角色成长类别下多方面角色成长因素对玩家流失造成影响的相关特征；所述角色成长因素至少包括等级提升量、角色评分提升量、称号获得个数、高阶装备升级数、技能平均等级提升；游戏元素偏好类别下游戏内各特定玩法元素偏好对玩家流失造成影响的相关特征；玩法元素偏好至少包括捏脸用时、剧情观看百分比、支线任务完成个数、庄园用时占比和拥有店铺数量；

训练模块，用于将每个训练数据的多类别流失原因特征作为流失预测模型的输入，根据所述流失预测模型的输出结果以及所述多类别流失原因特征对应的流失结果，训练所述流失预测模型，直至所述流失预测模型的损失值最小或者所有的模型参数都训练结束时，选取对应的准确率最高的内部结构，得到训练好的流失预测模型；其中，训练好的所述流失预测模型用于基于输入的目标流失原因特征输出用于表征所述流失结果为是的预测值。

16.一种玩家流失原因分析装置，其特征在于，所述装置包括：

处理模块，用于将所述多个类别的流失原因特征输入到预先训练好的流失预测模型中，得到用于表征所述目标玩家的流失结果为是的第一预测值；其中，所述流失预测模型是基于权利要求1中流失预测模型的训练方法训练得到的；

17.一种电子设备，其特征在于，包括：处理器、存储介质和总线，所述存储介质存储有所述处理器可执行的机器可读指令，当电子设备运行时，所述处理器与所述存储介质之间通过总线通信，所述处理器执行所述机器可读指令，以执行如权利要求1至5任一项所述的流失预测模型的训练方法的步骤。

18.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质上存储有计算机程序，所述计算机程序被处理器运行时执行如权利要求1至5任一项所述的流失预测模型的训练方法的步骤。

19.一种电子设备，其特征在于，包括：处理器、存储介质和总线，所述存储介质存储有所述处理器可执行的机器可读指令，当电子设备运行时，所述处理器与所述存储介质之间通过总线通信，所述处理器执行所述机器可读指令，以执行如权利要求6至14任一项所述的玩家流失原因分析方法的步骤。

20.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质上存储有计算机程序，所述计算机程序被处理器运行时执行如权利要求6至14任一项所述的玩家流失原因分析方法的步骤。