CN107229943A - 一种网络游戏玩家流失的预测方法 - Google Patents

一种网络游戏玩家流失的预测方法 Download PDF

Info

Publication number
CN107229943A
CN107229943A CN201710282946.5A CN201710282946A CN107229943A CN 107229943 A CN107229943 A CN 107229943A CN 201710282946 A CN201710282946 A CN 201710282946A CN 107229943 A CN107229943 A CN 107229943A
Authority
CN
China
Prior art keywords
account
sample
lost
knowledge base
value
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201710282946.5A
Other languages
English (en)
Inventor
姚进
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
XIAMEN G-BITS NETWORK TECHNOLOGY CO LTD
Original Assignee
XIAMEN G-BITS NETWORK TECHNOLOGY CO LTD
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by XIAMEN G-BITS NETWORK TECHNOLOGY CO LTD filed Critical XIAMEN G-BITS NETWORK TECHNOLOGY CO LTD
Priority to CN201710282946.5A priority Critical patent/CN107229943A/zh
Publication of CN107229943A publication Critical patent/CN107229943A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Evolutionary Computation (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computational Linguistics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Evolutionary Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明涉及一种网络游戏玩家流失的预测方法,其通过建立包含流失帐号和活跃帐号的训练知识库和验证知识库,并提取出最后一周付费次数、最后一周登陆天数以及累积充值作为样本特征变量,依据该样本特征变量通过神经网络算法对训练知识库进行学习并强化权重,并用验证知识库验证识别准确率,当验证通过权重确定后,即可用于预测将要流失的游戏玩家。

Description

一种网络游戏玩家流失的预测方法
技术领域
本发明涉及一种网络游戏玩家流失的预测方法。
背景技术
网络游戏是指通过互联网登陆后可以多人在线进行的游戏,游戏客户端可以是台式机、笔记本、浏览器、手机、平板电脑、VR设备等。
游戏玩家流失是指在网络游戏中玩家存在一定时间不登陆游戏的现象,不登陆游戏的原因常见为对游戏失去兴趣或者精力不足等。其中对游戏失去兴趣原因可能是多方面的,比如一起玩的伙伴不玩了,不喜欢游戏某些设定等等。玩家流失原因分析有助于游戏运营提前制定挽留玩家措施,包括游戏后续版本改进等。
神经网络算法是一种学习型算法,分为有监督学习和无监督学习两类。其中,有监督学习的算法结构一般分为输入层(Input layer)、隐藏层(Hidden Layer)、输出层(Output Layer),如图1所示,输入层负责接受特征变量传参;隐藏层负责计算传参,是算法的学习机构,通过训练不断调整并最终确定各变量权重值;输出层负责输出分类结果。
发明内容
本发明的目的在于提供一种网络游戏玩家流失的预测方法,该方法基于大数据基础通过算法学习流失玩家行为特征实现提前识别处将要流失玩家。
为实现上述目的,本发明采用的技术方案是:
一种网络游戏玩家流失的预测方法,其特征在于:包括以下具体步骤:
步骤1、从游戏账号中筛选出一定数量包括流失账号和活跃账号的样本账号,随机筛选一部分的流失账号和活跃账号作为训练知识库;剩下的流失账号和活跃账号作为验证知识库,对所有训练知识库和验证知识库中的账号都标注为流失帐号还是活跃帐号,后续算法将基于该标注来强化或验证特征变量对应的权重,所述流失账号指的是连续阈值天数未登录的游戏账号;
步骤2、采集上述游戏账号的游戏行为数据,提取出最后一周付费次数、最后一周登陆天数以及累积充值作为能区分玩家是否流失的特征数据,将该特征数据作为样本特征变量xi,i为特征变量序号,所述最后一周为流失帐号流失之前的一周;
步骤3、根据神经网络算法学习训练知识库,开始学习时,先将一个样本账号的样本特征变量xi与对应权重wi作为激励函数的计算参数,权重wi初始化值取标准差为1的高斯分布中随机值初始化参数,θ为偏移量,当激励函数y计算出的激励值过大或过小时,偏移量θ调整激励值回到零值附近,此处设定为0;激励函数y计算出每一个样本账号对应的激励值,然后使用sigmoid函数对激励值进行计算,公式中p是一个用来控制曲线形状变化快慢或陡峭性的参数,sigmoid函数的计算结果就是期望输出信号值Si,该期望输出信号值趋于1或0,该期望输出信号值即为对该样本账号的学习结果;通过期望输出信号值1或0分别对应流失账号或者活跃账号;
训练前样本流失账号被标记为1,活跃账号标记为0,与期望输出信号值Si存在误差ei,若样本账号为流失账号,则误差ei=1-Si;若样本账号为活跃账号,则ei=Si,当误差ei不超过预置的期望误差e时,该样本账号学习结束,执行下一个样本账号的学习过程,否则调整权重wi大小并重复上述学习过程,直至训练知识库的所有样本账号学习完成后,得到最终的权重wi,其中wi∈(-1,1);
步骤4、将验证知识库的所有样本数据输入验证,如果此时验证正确率达到预定要求,即算法训练完成;如果验证准确率没有达到要求,则需要重新对训练知识库进行学习,重复步骤3,直到验证准确率达到要求,此时权重wi已确定;
步骤5、输入待预测账号的特征变量即最后一周付费次数、最后一天登陆天数和累积充值,经计算后输出预测结果,根据该结果可知该待预测帐号是流失玩家或者活跃玩家。
本发明通过建立包含流失帐号和活跃帐号的训练知识库和验证知识库,并将最后一周付费次数、最后一周登陆天数以及累积充值作为样本特征变量,依据该样本特征变量通过神经网络算法对训练知识库进行学习并强化权重,并用验证知识库验证识别准确率,当验证通过权重确定后,即可用于预测将要流失的游戏玩家。
附图说明
图1为神经网络算法结构示意图;
图2为本发明实例流失预测流程示意图;
图3为本发明实例学习过程示意图。
以下结合附图和实施例对本发明作进一步详述。
具体实施方式
本实例只是本发明的一部分应用实例。
本实例应用提供的游戏玩家流失的预测方法不受限于游戏客户端,所以无论是基于台式机、笔记本、浏览器、手机、平板电脑、VR设备等联网设备皆可适用。
本发明指出玩家流失基于一定时间不登陆游戏,实际应用中时间长短基于各自游戏可自行确定。本实例将连续7天未登陆的玩家定义为流失玩家,因为根据大量样例游戏统计发现玩家连续7天未登陆游戏时,没有任何挽留措施的情况下,之后回归游戏的概率仅3%,即97%玩家不会再玩这款游戏。
如图2所示,本发明一种网络游戏玩家流失的预测方法,具体包括如下步骤。
步骤1、筛选2907条高付费样本账号数据,其中流失账号1454个,活跃账号1453个,随机筛选1000条流失账号和999条活跃账号作为训练知识库;其他454条流失账号和453条活跃账号作为验证知识库;对所有训练知识库和验证知识库中的帐号都标注为流失帐号还是活跃帐号,后续算法将基于该标注来强化或验证特征变量对应的权重,所述流失账号指的是连续阈值天数未登录的游戏账号。
步骤2、采集上述游戏账号的游戏行为数据,提取出最后一周付费次数、最后一周登陆天数以及累积充值作为能区分玩家是否流失的特征数据(如下表所示),将该特征数据作为样本特征变量xi,i为特征变量序号。
特征变量 活跃玩家均值 流失玩家均值 倍率 特征区别描述
最后一周付费次数 2.9 1.1 ≈2.6倍 流失玩家付费次数减少
最后一周登陆天数 6.4 4.0 ≈1.6倍 流失玩家登陆次数减少
累计充值 19616.0 16459.2 ≈1.2倍 累计充值减少
上述样本特征变量xi中的最后一周是指流失玩家连续7日未登录之前的一周,比如2017年1月8日-14日连续7日未登录,则最后一周是指2017年1月1日-7日。
步骤3、如图3所示,根据神经网络算法学习训练知识库,开始学习时,先将一个样本账号的样本特征变量xi与对应权重wi作为激励函数的计算参数,权重wi初始化值取标准差为1的高斯分布中随机值初始化参数,θ为偏移量,当激励函数y计算出的激励值过大或过小时,偏移量θ调整激励值回到零值附近,此处设定为0;激励函数y计算出每一个样本账号对应的激励值,然后使用sigmoid函数对激励值进行计算,公式中p是一个用来控制曲线形状变化快慢或陡峭性的参数,sigmoid函数的计算结果就是期望输出信号值Si,该期望输出信号值趋于1或0,该期望输出信号值即为对该样本账号的学习结果;通过期望输出信号值1或0分别对应流失账号或者活跃账号;
训练前样本流失账号被标记为1,活跃账号标记为0,与期望输出信号值Si存在误差ei,若样本账号为流失账号,则误差ei=1-Si;若样本账号为活跃账号,则ei=Si,当误差ei不超过预置的期望误差e时,该样本账号学习结束,执行下一个样本账号的学习过程,否则调整权重wi大小并重复上述学习过程,直至训练知识库的所有样本账号学习完成后,得到最终的权重wi,其中wi∈(-1,1);
当超过期望误差e时,对权重wi按0.01的刻度逐步加或者减,就是通过调整对应特征变量权重wi来升高或者降低对应特征变量对该样本学习结果的影响。
步骤4、将验证知识库的所有样本数据输入验证,如果此时验证正确率达到预定要求,即算法训练完成;如果验证准确率没有达到要求,则需要重新对训练知识库进行学习,重复步骤3,直到验证准确率达到要求,此时权重wi已确定。
步骤5、输入待预测账号的特征变量即最后一周付费次数、最后一天登陆天数和累积充值,经计算后输出预测结果,根据该结果可知该待预测帐号是流失玩家或者活跃玩家。
本发明通过建立包含流失帐号和活跃帐号的训练知识库和验证知识库,并提取出最后一周付费次数、最后一周登陆天数以及累积充值作为样本特征变量,依据该样本特征变量通过神经网络算法对训练知识库进行学习并强化权重,并用验证知识库验证识别准确率,当验证通过权重确定后,即可用于预测将要流失的游戏玩家。
以上所述,仅是本发明较佳实施例而已,并非对本发明的技术范围作任何限制,故凡是依据本发明的技术实质对以上实施例所作的任何细微修改、等同变化与修饰,均仍属于本发明技术方案的范围内。

Claims (1)

1.一种网络游戏玩家流失的预测方法,其特征在于:包括以下具体步骤:
步骤1、从游戏账号中筛选出一定数量包括流失账号和活跃账号的样本账号,随机筛选一部分的流失账号和活跃账号作为训练知识库;剩下的流失账号和活跃账号作为验证知识库,对所有训练知识库和验证知识库中的账号都标注为流失帐号还是活跃帐号,后续算法将基于该标注来强化或验证特征变量对应的权重,所述流失账号指的是连续阈值天数未登录的游戏账号;
步骤2、采集上述游戏账号的游戏行为数据,提取出最后一周付费次数、最后一周登陆天数以及累积充值作为能区分玩家是否流失的特征数据,将该特征数据作为样本特征变量xi,i为特征变量序号,所述最后一周为流失帐号流失之前的一周;
步骤3、根据神经网络算法学习训练知识库,开始学习时,先将一个样本账号的样本特征变量xi与对应权重wi作为激励函数的计算参数,权重wi初始化值取标准差为1的高斯分布中随机值初始化参数,θ为偏移量,当激励函数y计算出的激励值过大或过小时,偏移量θ调整激励值回到零值附近,此处设定为0;激励函数y计算出每一个样本账号对应的激励值,然后使用sigmoid函数对激励值进行计算,公式中p是一个用来控制曲线形状变化快慢或陡峭性的参数,sigmoid函数的计算结果就是期望输出信号值Si,该期望输出信号值趋于1或0,该期望输出信号值即为对该样本账号的学习结果;通过期望输出信号值1或0分别对应流失账号或者活跃账号;
训练前样本流失账号被标记为1,活跃账号标记为0,与期望输出信号值Si存在误差ei,若样本账号为流失账号,则误差ei=1-Si;若样本账号为活跃账号,则ei=Si,当误差ei不超过预置的期望误差e时,该样本账号学习结束,执行下一个样本账号的学习过程,否则调整权重wi大小并重复上述学习过程,直至训练知识库的所有样本账号学习完成后,得到最终的权重wi,其中wi∈(-1,1);
步骤4、将验证知识库的所有样本数据输入验证,如果此时验证正确率达到预定要求,即算法训练完成;如果验证准确率没有达到要求,则需要重新对训练知识库进行学习,重复步骤3,直到验证准确率达到要求,此时权重wi已确定;
步骤5、输入待预测账号的特征变量即最后一周付费次数、最后一天登陆天数和累积充值,经计算后输出预测结果,根据该结果可知该待预测帐号是流失玩家或者活跃玩家。
CN201710282946.5A 2017-04-26 2017-04-26 一种网络游戏玩家流失的预测方法 Pending CN107229943A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710282946.5A CN107229943A (zh) 2017-04-26 2017-04-26 一种网络游戏玩家流失的预测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710282946.5A CN107229943A (zh) 2017-04-26 2017-04-26 一种网络游戏玩家流失的预测方法

Publications (1)

Publication Number Publication Date
CN107229943A true CN107229943A (zh) 2017-10-03

Family

ID=59933554

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710282946.5A Pending CN107229943A (zh) 2017-04-26 2017-04-26 一种网络游戏玩家流失的预测方法

Country Status (1)

Country Link
CN (1) CN107229943A (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107944915A (zh) * 2017-11-21 2018-04-20 北京深极智能科技有限公司 一种游戏用户行为分析方法及计算机可读存储介质
CN110389945A (zh) * 2019-06-05 2019-10-29 上海黑桃互动网络科技股份有限公司 一种游戏监控系统及监控方法
CN110580554A (zh) * 2018-05-21 2019-12-17 阿里巴巴集团控股有限公司 交互业务的数据处理方法、装置及电子设备
CN111861588A (zh) * 2020-08-06 2020-10-30 网易(杭州)网络有限公司 流失预测模型的训练方法、玩家流失原因分析方法及装置

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20130110480A1 (en) * 2011-11-02 2013-05-02 ThinkVine Corporation Agent Awareness Modeling for Agent-Based Modeling Systems
CN105915957A (zh) * 2015-12-15 2016-08-31 乐视致新电子科技(天津)有限公司 智能电视展示播放内容的方法、装置及系统

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20130110480A1 (en) * 2011-11-02 2013-05-02 ThinkVine Corporation Agent Awareness Modeling for Agent-Based Modeling Systems
CN105915957A (zh) * 2015-12-15 2016-08-31 乐视致新电子科技(天津)有限公司 智能电视展示播放内容的方法、装置及系统

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
刘天舒: "BP神经网络的改进研究及应用", 《中国优秀硕士学位论文全文数据库信息科技辑》 *
张彦俊: "游戏运营中的数据挖掘", 《中国优秀硕士学位论文全文数据库信息科技辑》 *

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107944915A (zh) * 2017-11-21 2018-04-20 北京深极智能科技有限公司 一种游戏用户行为分析方法及计算机可读存储介质
CN110580554A (zh) * 2018-05-21 2019-12-17 阿里巴巴集团控股有限公司 交互业务的数据处理方法、装置及电子设备
CN110580554B (zh) * 2018-05-21 2022-12-16 阿里巴巴华北技术有限公司 交互业务的数据处理方法、装置及电子设备
CN110389945A (zh) * 2019-06-05 2019-10-29 上海黑桃互动网络科技股份有限公司 一种游戏监控系统及监控方法
CN111861588A (zh) * 2020-08-06 2020-10-30 网易(杭州)网络有限公司 流失预测模型的训练方法、玩家流失原因分析方法及装置
CN111861588B (zh) * 2020-08-06 2023-10-31 网易(杭州)网络有限公司 流失预测模型的训练方法、玩家流失原因分析方法及装置

Similar Documents

Publication Publication Date Title
CN107185243A (zh) 一种网络游戏外挂的识别方法
CN107229943A (zh) 一种网络游戏玩家流失的预测方法
CN106874581B (zh) 一种基于bp神经网络模型的建筑空调能耗预测方法
CN112037012A (zh) 一种基于pso-bp神经网络的互联网金融信用评价方法
CN107679477A (zh) 基于空洞卷积神经网络的人脸深度和表面法向量预测方法
CN109360604B (zh) 一种卵巢癌分子分型预测系统
CN105404947A (zh) 用户质量侦测方法及装置
CN107798600A (zh) 互联网金融小微贷款的信用风险识别方法及装置
CN107633323A (zh) 核保难度预测的方法、装置、计算机设备及存储介质
CN106485528A (zh) 检测数据的方法和装置
US20220004912A1 (en) Training method for multi-output land cover classification model, classification method, and device
CN104866699B (zh) 一种网络游戏智能化数据分析方法
CN107578071A (zh) 基于Epoch的解决数据不均衡方法
CN108090628A (zh) 一种基于pso-lssvm算法的粮情安全检测分析方法
CN108181812A (zh) 一种基于bp神经网络的阀门定位器pi参数整定方法
CN103795592B (zh) 网络水军的检测方法及装置
CN106557605B (zh) 机械学习装置和方法以及转子设计装置
CN112633359A (zh) 一种基于梯度平衡的多类别模型训练方法、介质及设备
Clarke et al. Adjusting bookmaker’s odds to allow for overround
CN106874852A (zh) 一种基于加速度传感器的设备指纹提取和识别方法
CN107273659A (zh) 一种基于ransac算法改进的用于空间碎片光电跟踪的轨迹预测方法
CN114021665A (zh) 一种卷烟批次缩小数据范围时间逼近方法及装置
CN108549899A (zh) 一种图像识别方法及装置
CN108711100A (zh) 一种基于神经网络的p2p平台运营风险评估的系统
CN116560322A (zh) 一种装配式生产线的生产控制方法及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20171003