CN107229943A

CN107229943A - 一种网络游戏玩家流失的预测方法

Info

Publication number: CN107229943A
Application number: CN201710282946.5A
Authority: CN
Inventors: 姚进
Original assignee: XIAMEN G-BITS NETWORK TECHNOLOGY CO LTD
Current assignee: XIAMEN G-BITS NETWORK TECHNOLOGY CO LTD
Priority date: 2017-04-26
Filing date: 2017-04-26
Publication date: 2017-10-03

Abstract

本发明涉及一种网络游戏玩家流失的预测方法，其通过建立包含流失帐号和活跃帐号的训练知识库和验证知识库，并提取出最后一周付费次数、最后一周登陆天数以及累积充值作为样本特征变量，依据该样本特征变量通过神经网络算法对训练知识库进行学习并强化权重，并用验证知识库验证识别准确率，当验证通过权重确定后，即可用于预测将要流失的游戏玩家。

Description

一种网络游戏玩家流失的预测方法

技术领域

本发明涉及一种网络游戏玩家流失的预测方法。

背景技术

网络游戏是指通过互联网登陆后可以多人在线进行的游戏，游戏客户端可以是台式机、笔记本、浏览器、手机、平板电脑、VR设备等。

游戏玩家流失是指在网络游戏中玩家存在一定时间不登陆游戏的现象，不登陆游戏的原因常见为对游戏失去兴趣或者精力不足等。其中对游戏失去兴趣原因可能是多方面的，比如一起玩的伙伴不玩了，不喜欢游戏某些设定等等。玩家流失原因分析有助于游戏运营提前制定挽留玩家措施，包括游戏后续版本改进等。

神经网络算法是一种学习型算法，分为有监督学习和无监督学习两类。其中，有监督学习的算法结构一般分为输入层(Input layer)、隐藏层(Hidden Layer)、输出层(Output Layer)，如图1所示，输入层负责接受特征变量传参；隐藏层负责计算传参，是算法的学习机构，通过训练不断调整并最终确定各变量权重值；输出层负责输出分类结果。

发明内容

本发明的目的在于提供一种网络游戏玩家流失的预测方法，该方法基于大数据基础通过算法学习流失玩家行为特征实现提前识别处将要流失玩家。

为实现上述目的，本发明采用的技术方案是：

一种网络游戏玩家流失的预测方法，其特征在于：包括以下具体步骤：

步骤1、从游戏账号中筛选出一定数量包括流失账号和活跃账号的样本账号，随机筛选一部分的流失账号和活跃账号作为训练知识库；剩下的流失账号和活跃账号作为验证知识库，对所有训练知识库和验证知识库中的账号都标注为流失帐号还是活跃帐号，后续算法将基于该标注来强化或验证特征变量对应的权重，所述流失账号指的是连续阈值天数未登录的游戏账号；

步骤2、采集上述游戏账号的游戏行为数据，提取出最后一周付费次数、最后一周登陆天数以及累积充值作为能区分玩家是否流失的特征数据，将该特征数据作为样本特征变量x_i，i为特征变量序号，所述最后一周为流失帐号流失之前的一周；

步骤3、根据神经网络算法学习训练知识库，开始学习时，先将一个样本账号的样本特征变量x_i与对应权重w_i作为激励函数的计算参数，权重w_i初始化值取标准差为1的高斯分布中随机值初始化参数，θ为偏移量，当激励函数y计算出的激励值过大或过小时，偏移量θ调整激励值回到零值附近，此处设定为0；激励函数y计算出每一个样本账号对应的激励值，然后使用sigmoid函数对激励值进行计算，公式中p是一个用来控制曲线形状变化快慢或陡峭性的参数，sigmoid函数的计算结果就是期望输出信号值S_i，该期望输出信号值趋于1或0，该期望输出信号值即为对该样本账号的学习结果；通过期望输出信号值1或0分别对应流失账号或者活跃账号；

训练前样本流失账号被标记为1，活跃账号标记为0，与期望输出信号值S_i存在误差e_i，若样本账号为流失账号，则误差e_i＝1-S_i；若样本账号为活跃账号，则e_i＝S_i，当误差e_i不超过预置的期望误差e时，该样本账号学习结束，执行下一个样本账号的学习过程，否则调整权重w_i大小并重复上述学习过程，直至训练知识库的所有样本账号学习完成后，得到最终的权重w_i，其中w_i∈(-1,1)；

步骤4、将验证知识库的所有样本数据输入验证，如果此时验证正确率达到预定要求，即算法训练完成；如果验证准确率没有达到要求，则需要重新对训练知识库进行学习，重复步骤3，直到验证准确率达到要求，此时权重w_i已确定；

步骤5、输入待预测账号的特征变量即最后一周付费次数、最后一天登陆天数和累积充值，经计算后输出预测结果，根据该结果可知该待预测帐号是流失玩家或者活跃玩家。

本发明通过建立包含流失帐号和活跃帐号的训练知识库和验证知识库，并将最后一周付费次数、最后一周登陆天数以及累积充值作为样本特征变量，依据该样本特征变量通过神经网络算法对训练知识库进行学习并强化权重，并用验证知识库验证识别准确率，当验证通过权重确定后，即可用于预测将要流失的游戏玩家。

附图说明

图1为神经网络算法结构示意图；

图2为本发明实例流失预测流程示意图；

图3为本发明实例学习过程示意图。

以下结合附图和实施例对本发明作进一步详述。

具体实施方式

本实例只是本发明的一部分应用实例。

本实例应用提供的游戏玩家流失的预测方法不受限于游戏客户端，所以无论是基于台式机、笔记本、浏览器、手机、平板电脑、VR设备等联网设备皆可适用。

本发明指出玩家流失基于一定时间不登陆游戏，实际应用中时间长短基于各自游戏可自行确定。本实例将连续7天未登陆的玩家定义为流失玩家，因为根据大量样例游戏统计发现玩家连续7天未登陆游戏时，没有任何挽留措施的情况下，之后回归游戏的概率仅3％，即97％玩家不会再玩这款游戏。

如图2所示，本发明一种网络游戏玩家流失的预测方法，具体包括如下步骤。

步骤1、筛选2907条高付费样本账号数据，其中流失账号1454个，活跃账号1453个，随机筛选1000条流失账号和999条活跃账号作为训练知识库；其他454条流失账号和453条活跃账号作为验证知识库；对所有训练知识库和验证知识库中的帐号都标注为流失帐号还是活跃帐号，后续算法将基于该标注来强化或验证特征变量对应的权重，所述流失账号指的是连续阈值天数未登录的游戏账号。

步骤2、采集上述游戏账号的游戏行为数据，提取出最后一周付费次数、最后一周登陆天数以及累积充值作为能区分玩家是否流失的特征数据(如下表所示)，将该特征数据作为样本特征变量x_i，i为特征变量序号。

特征变量	活跃玩家均值	流失玩家均值	倍率	特征区别描述
					最后一周付费次数	2.9	1.1	≈2.6倍	流失玩家付费次数减少
最后一周登陆天数	6.4	4.0	≈1.6倍	流失玩家登陆次数减少
					累计充值	19616.0	16459.2	≈1.2倍	累计充值减少

上述样本特征变量x_i中的最后一周是指流失玩家连续7日未登录之前的一周，比如2017年1月8日-14日连续7日未登录，则最后一周是指2017年1月1日-7日。

步骤3、如图3所示，根据神经网络算法学习训练知识库，开始学习时，先将一个样本账号的样本特征变量x_i与对应权重w_i作为激励函数的计算参数，权重w_i初始化值取标准差为1的高斯分布中随机值初始化参数，θ为偏移量，当激励函数y计算出的激励值过大或过小时，偏移量θ调整激励值回到零值附近，此处设定为0；激励函数y计算出每一个样本账号对应的激励值，然后使用sigmoid函数对激励值进行计算，公式中p是一个用来控制曲线形状变化快慢或陡峭性的参数，sigmoid函数的计算结果就是期望输出信号值S_i，该期望输出信号值趋于1或0，该期望输出信号值即为对该样本账号的学习结果；通过期望输出信号值1或0分别对应流失账号或者活跃账号；

当超过期望误差e时，对权重w_i按0.01的刻度逐步加或者减，就是通过调整对应特征变量权重w_i来升高或者降低对应特征变量对该样本学习结果的影响。

步骤4、将验证知识库的所有样本数据输入验证，如果此时验证正确率达到预定要求，即算法训练完成；如果验证准确率没有达到要求，则需要重新对训练知识库进行学习，重复步骤3，直到验证准确率达到要求，此时权重w_i已确定。

本发明通过建立包含流失帐号和活跃帐号的训练知识库和验证知识库，并提取出最后一周付费次数、最后一周登陆天数以及累积充值作为样本特征变量，依据该样本特征变量通过神经网络算法对训练知识库进行学习并强化权重，并用验证知识库验证识别准确率，当验证通过权重确定后，即可用于预测将要流失的游戏玩家。

以上所述，仅是本发明较佳实施例而已，并非对本发明的技术范围作任何限制，故凡是依据本发明的技术实质对以上实施例所作的任何细微修改、等同变化与修饰，均仍属于本发明技术方案的范围内。

Claims

1.一种网络游戏玩家流失的预测方法，其特征在于：包括以下具体步骤：