CN117009171A - 一种预流失对象的处理方法、装置以及存储介质 - Google Patents

一种预流失对象的处理方法、装置以及存储介质 Download PDF

Info

Publication number
CN117009171A
CN117009171A CN202211372503.2A CN202211372503A CN117009171A CN 117009171 A CN117009171 A CN 117009171A CN 202211372503 A CN202211372503 A CN 202211372503A CN 117009171 A CN117009171 A CN 117009171A
Authority
CN
China
Prior art keywords
window
training
snapshot
features
determining
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202211372503.2A
Other languages
English (en)
Inventor
徐广根
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tencent Technology Shenzhen Co Ltd
Original Assignee
Tencent Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tencent Technology Shenzhen Co Ltd filed Critical Tencent Technology Shenzhen Co Ltd
Priority to CN202211372503.2A priority Critical patent/CN117009171A/zh
Publication of CN117009171A publication Critical patent/CN117009171A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3003Monitoring arrangements specially adapted to the computing system or computing system component being monitored
    • G06F11/302Monitoring arrangements specially adapted to the computing system or computing system component being monitored where the computing system component is a software system
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3065Monitoring arrangements determined by the means or processing involved in reporting the monitored data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/34Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment
    • G06F11/3438Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment monitoring of user actions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • G06N20/20Ensemble learning
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computing Systems (AREA)
  • Quality & Reliability (AREA)
  • Software Systems (AREA)
  • Mathematical Physics (AREA)
  • Computer Hardware Design (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Medical Informatics (AREA)
  • Artificial Intelligence (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本申请公开了一种预流失对象的处理方法、装置以及存储介质,可应用于地图或车辆网技术。通过获取待预测对象对应的窗口特征和快照特征;并功根据决策树模型得到流失概率值;从而确定预流失对象;并确定窗口特征和快照特征对应的贡献特征值;进而基于贡献特征值向预流失对象进行资源分发。从而实现动态的预流失对象识别过程,由于采用时间窗口内交互数据中的动作维度的窗口特征和属性维度的快照特征进行流失概率的估计,提高了预流失对象识别的准确性,并通过贡献特征值进行针对性的资源分发,提高了资源分发的准确性。

Description

一种预流失对象的处理方法、装置以及存储介质
技术领域
本申请涉及计算机技术领域,尤其涉及一种预流失对象的处理方法、装置以及存储介质。
背景技术
随着互联网技术的迅速发展,人们通过网络应用的交互越发频发。而在众多的网络应用中,如何保留对象成为难题;因此,可以对预流失的对象进行识别,并进行资源分发操作。
一般,对预流失对象进行识别的过程基于特征参数进行比对确定,例如人工经验筛选出部分和个人玩家活跃、付费、社交、活动相关的特征,从而对不符合相关特征的对象进行筛选。
但是,在大规模的应用数据中,对象的交互方式可能出现改变,基于人工经验筛选的特征参数进行比对的过程可能造成识别错误,从而影响资源分发操作的准确性。
发明内容
有鉴于此,本申请提供一种预流失对象的处理方法,可以有效提高资源分发操作的准确性。
本申请第一方面提供一种预流失对象的处理方法,可以应用于终端设备中包含预流失对象的处理功能的系统或程序中,具体包括:
获取目标应用中的待预测对象;
确定预设时间窗口内所述待预测对象在所述目标应用中的交互数据,以基于所述交互数据确定对应的窗口特征和快照特征;
将所述窗口特征和所述快照特征输入决策树模型,以得到所述待预测对象对应的流失概率值,所述决策树模型基于标记了活跃度标签的训练对象对应的训练数据训练所得,所述训练数据包括所述预设时间窗口对应时间范围内的训练窗口特征和训练快照特征,所述流失概率值基于所述窗口特征与所述训练窗口特征的相似度以及所述快照特征与所述训练快照特征的相似度确定;
基于所述流失概率值确定所述待预测对象中的预流失对象;
确定所述预流失对象在所述决策树模型的计算过程中所述窗口特征和所述快照特征对应的贡献特征值;
基于所述贡献特征值确定满足预设条件的目标特征,以根据所述目标特征向所述预流失对象进行资源分发。
可选的,在本申请一些可能的实现方式中,所述将所述窗口特征和所述快照特征输入决策树模型,以得到所述待预测对象对应的流失概率值之前,所述方法还包括:
对所述训练对象在所述预设时间窗口对应时间范围内交互数据进行解析,以得到训练数据;
获取所述训练数据中的动作信息,以得到所述训练数据对应的训练窗口特征;
获取所述训练数据中的属性信息,以得到所述训练数据对应的训练快照特征;
确定所述训练对象对应的活跃度标签;
基于所述活跃度标签关联对应的训练窗口特征和训练快照特征,以得到训练数据集;
调用预设树模型;
根据所述训练数据集对所述预设树模型的参数进行调整,以得到所述决策树模型。
可选的,在本申请一些可能的实现方式中,所述对所述训练对象在所述预设时间窗口对应时间范围内交互数据进行解析,以得到训练数据,包括:
获取目标应用对应的离线日志数据;
确定所述离线日志数据中对应的活跃度信息;
根据所述活跃度信息对应的活跃度分布情况确定活跃窗口,以将所述活跃窗口作为所述预设时间窗口;
对所述训练对象在所述预设时间窗口对应时间范围内交互数据进行解析,以得到所述训练数据。
可选的,在本申请一些可能的实现方式中,所述根据所述训练数据集对所述预设树模型的参数进行调整,以得到所述决策树模型,包括:
确定所述训练数据集中样本对应的负梯度信息;
基于所述负梯度信息拟合所述预设树模型对应的回归树,所述回归树包括多个叶子区域;
计算所述叶子区域对应的目标拟合值,以根据所述目标拟合值确定对应的决策树拟合函数,所述决策树拟合函数用于更新所述回归树对应的预设表达式;
基于所述预设表达式配置目标函数,并对所述目标函数进行二阶泰勒公式展开得到展开函数;
对所述展开函数中的常数项进行去除,并加入正则项,以得到正则函数;
基于训练目标对所述正则函数进行求解,以得到参数配置信息;
根据所述参数配置信息对所述预设树模型的参数进行调整,以得到所述决策树模型。
可选的,在本申请一些可能的实现方式中,所述基于所述流失概率值确定所述待预测对象中的预流失对象,包括:
将所述流失概率值于流失等级阈值进行比较,以得到所述待预测对象对应的流失等级;
基于所述流失等级确定所述待预测对象中的预流失对象。
可选的,在本申请一些可能的实现方式中,所述确定所述预流失对象在所述决策树模型的计算过程中所述窗口特征和所述快照特征对应的贡献特征值,包括:
获取所述预流失对象在所述决策树模型的计算过程中所述窗口特征和所述快照特征对应的变量均值;
确定所述窗口特征和所述快照特征对应的预测值与所述变量均值的差异信息;
根据所述差异信息确定所述预流失对象在所述决策树模型的计算过程中所述窗口特征和所述快照特征对应的贡献特征值。
可选的,在本申请一些可能的实现方式中,所述基于所述贡献特征值确定满足预设条件的目标特征,以根据所述目标特征向所述预流失对象进行资源分发,包括:
基于所述贡献特征值进行排序,以得到贡献序列;
对所述贡献序列中处于所述预设条件指示的次序范围的特征进行收集,以得到所述目标特征;
获取所述目标应用中所述目标特征对应的参数平均值;
确定所述预流失对象在所述目标特征对应的目标特征值;
基于所述目标特征值与与所述参数平均值的差异信息向所述预流失对象进行资源分发。
本申请第二方面提供一种预流失对象的处理装置,包括:
获取单元,用于获取目标应用中的待预测对象;
确定单元,用于确定预设时间窗口内所述待预测对象在所述目标应用中的交互数据,以基于所述交互数据确定对应的窗口特征和快照特征;
输入单元,用于将所述窗口特征和所述快照特征输入决策树模型,以得到所述待预测对象对应的流失概率值,所述决策树模型基于标记了活跃度标签的训练对象对应的训练数据训练所得,所述训练数据包括所述预设时间窗口对应时间范围内的训练窗口特征和训练快照特征,所述流失概率值基于所述窗口特征与所述训练窗口特征的相似度以及所述快照特征与所述训练快照特征的相似度确定;
处理单元,用于基于所述流失概率值确定所述待预测对象中的预流失对象;
所述处理单元,还用于确定所述预流失对象在所述决策树模型的计算过程中所述窗口特征和所述快照特征对应的贡献特征值;
所述处理单元,还用于基于所述贡献特征值确定满足预设条件的目标特征,以根据所述目标特征向所述预流失对象进行资源分发。
可选的,在本申请一些可能的实现方式中,所述输入单元,具体用于对所述训练对象在所述预设时间窗口对应时间范围内交互数据进行解析,以得到训练数据;
所述输入单元,具体用于获取所述训练数据中的动作信息,以得到所述训练数据对应的训练窗口特征;
所述输入单元,具体用于获取所述训练数据中的属性信息,以得到所述训练数据对应的训练快照特征;
所述输入单元,具体用于确定所述训练对象对应的活跃度标签;
所述输入单元,具体用于基于所述活跃度标签关联对应的训练窗口特征和训练快照特征,以得到训练数据集;
所述输入单元,具体用于调用预设树模型;
所述输入单元,具体用于根据所述训练数据集对所述预设树模型的参数进行调整,以得到所述决策树模型。
可选的,在本申请一些可能的实现方式中,所述输入单元,具体用于获取目标应用对应的离线日志数据;
所述输入单元,具体用于确定所述离线日志数据中对应的活跃度信息;
所述输入单元,具体用于根据所述活跃度信息对应的活跃度分布情况确定活跃窗口,以将所述活跃窗口作为所述预设时间窗口;
所述输入单元,具体用于对所述训练对象在所述预设时间窗口对应时间范围内交互数据进行解析,以得到所述训练数据。
可选的,在本申请一些可能的实现方式中,所述输入单元,具体用于确定所述训练数据集中样本对应的负梯度信息;
所述输入单元,具体用于基于所述负梯度信息拟合所述预设树模型对应的回归树,所述回归树包括多个叶子区域;
所述输入单元,具体用于计算所述叶子区域对应的目标拟合值,以根据所述目标拟合值确定对应的决策树拟合函数,所述决策树拟合函数用于更新所述回归树对应的预设表达式;
所述输入单元,具体用于基于所述预设表达式配置目标函数,并对所述目标函数进行二阶泰勒公式展开得到展开函数;
所述输入单元,具体用于对所述展开函数中的常数项进行去除,并加入正则项,以得到正则函数;
所述输入单元,具体用于基于训练目标对所述正则函数进行求解,以得到参数配置信息;
根据所述参数配置信息对所述预设树模型的参数进行调整,以得到所述决策树模型。
可选的,在本申请一些可能的实现方式中,所述处理单元,具体用于将所述流失概率值于流失等级阈值进行比较,以得到所述待预测对象对应的流失等级;
所述处理单元,具体用于基于所述流失等级确定所述待预测对象中的预流失对象。
可选的,在本申请一些可能的实现方式中,所述处理单元,具体用于获取所述预流失对象在所述决策树模型的计算过程中所述窗口特征和所述快照特征对应的变量均值;
所述处理单元,具体用于确定所述窗口特征和所述快照特征对应的预测值与所述变量均值的差异信息;
所述处理单元,具体用于根据所述差异信息确定所述预流失对象在所述决策树模型的计算过程中所述窗口特征和所述快照特征对应的贡献特征值。
可选的,在本申请一些可能的实现方式中,所述处理单元,具体用于基于所述贡献特征值进行排序,以得到贡献序列;
所述处理单元,具体用于对所述贡献序列中处于所述预设条件指示的次序范围的特征进行收集,以得到所述目标特征;
所述处理单元,具体用于获取所述目标应用中所述目标特征对应的参数平均值;
所述处理单元,具体用于确定所述预流失对象在所述目标特征对应的目标特征值;
所述处理单元,具体用于基于所述目标特征值与与所述参数平均值的差异信息向所述预流失对象进行资源分发。
本申请第三方面提供一种计算机设备,包括:存储器、处理器以及总线系统;所述存储器用于存储程序代码;所述处理器用于根据所述程序代码中的指令执行上述第一方面或第一方面任一项所述的预流失对象的处理方法。
本申请第四方面提供一种计算机可读存储介质,所述计算机可读存储介质中存储有指令,当其在计算机上运行时,使得计算机执行上述第一方面或第一方面任一项所述的预流失对象的处理方法。
在本申请的一个方面,提供了一种计算机程序产品或计算机程序,该计算机程序产品或计算机程序包括计算机指令,该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令,使得该计算机设备执行上述第一方面或者第一方面的各种可选实现方式中提供的预流失对象的处理方法。
从以上技术方案可以看出,本申请实施例具有以下优点:
通过获取目标应用中的待预测对象;然后确定预设时间窗口内待预测对象在目标应用中的交互数据,以基于交互数据确定对应的窗口特征和快照特征;并将窗口特征和快照特征输入决策树模型,以得到待预测对象对应的流失概率值,该决策树模型基于标记了活跃度标签的训练对象对应的训练数据训练所得,其训练数据包括预设时间窗口对应时间范围内的训练窗口特征和训练快照特征,且流失概率值基于窗口特征与训练窗口特征的相似度以及快照特征与训练快照特征的相似度确定;然后基于流失概率值确定待预测对象中的预流失对象;并确定预流失对象在决策树模型的计算过程中窗口特征和快照特征对应的贡献特征值;进而基于贡献特征值确定满足预设条件的目标特征,以根据目标特征向预流失对象进行资源分发。从而实现动态的预流失对象识别过程,由于采用时间窗口内交互数据中的动作维度的窗口特征和属性维度的快照特征进行流失概率的估计,提高了预流失对象识别的准确性,并通过贡献特征值进行针对性的资源分发,提高了资源分发的准确性。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
图1为预流失对象的处理系统运行的网络架构图;
图2为本申请实施例提供的一种预流失对象的处理的流程架构图;
图3为本申请实施例提供的一种预流失对象的处理方法的流程图;
图4为本申请实施例提供的一种预流失对象的处理方法的场景示意图;
图5为本申请实施例提供的另一种预流失对象的处理方法的场景示意图;
图6为本申请实施例提供的另一种预流失对象的处理方法的场景示意图;
图7为本申请实施例提供的一种预流失对象的处理装置的结构示意图;
图8为本申请实施例提供的一种终端设备的结构示意图;
图9为本申请实施例提供的一种服务器的结构示意图。
具体实施方式
本申请实施例提供了一种预流失对象的处理方法以及相关装置,可以应用于终端设备中包含预流失对象的处理功能的系统或程序中,通过获取目标应用中的待预测对象;然后确定预设时间窗口内待预测对象在目标应用中的交互数据,以基于交互数据确定对应的窗口特征和快照特征;并将窗口特征和快照特征输入决策树模型,以得到待预测对象对应的流失概率值,该决策树模型基于标记了活跃度标签的训练对象对应的训练数据训练所得,其训练数据包括预设时间窗口对应时间范围内的训练窗口特征和训练快照特征,且流失概率值基于窗口特征与训练窗口特征的相似度以及快照特征与训练快照特征的相似度确定;然后基于流失概率值确定待预测对象中的预流失对象;并确定预流失对象在决策树模型的计算过程中窗口特征和快照特征对应的贡献特征值;进而基于贡献特征值确定满足预设条件的目标特征,以根据目标特征向预流失对象进行资源分发。从而实现动态的预流失对象识别过程,由于采用时间窗口内交互数据中的动作维度的窗口特征和属性维度的快照特征进行流失概率的估计,提高了预流失对象识别的准确性,并通过贡献特征值进行针对性的资源分发,提高了资源分发的准确性。
本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”、“第三”、“第四”等(如果存在)是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本申请的实施例例如能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“对应于”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
首先,对本申请实施例中可能出现的一些名词进行解释。
预流失对象:有流失倾向,但还没有开始真正流失的对象,可以是用户、玩家等执行主体。
梯度提升决策树(Extreme Gradient Boosting,XGBoost):一种在提升树的基础上,用梯度来替代残差构造新树的模型。
Shapley值法:一种描述模型在对特定数据点进行预测时特定特征的“权重”或“重要性”的方法,其中SHAP为由Shapley值启发的可加性解释模型(SHapley AdditiveexPlanation)。
应理解,本申请提供的预流失对象的处理方法可以应用于终端设备中包含预流失对象的处理功能的系统或程序中,例如互动剧,具体的,预流失对象的处理系统可以运行于如图1所示的网络架构中,如图1所示,是预流失对象的处理系统运行的网络架构图,如图可知,预流失对象的处理系统可以提供与多个信息源的预流失对象的处理过程,即通过终端侧的交互操作产生相应的交互数据,服务器根据交互数据进行预流失对象的识别,并进行相应的资源分发;可以理解的是,图1中示出了多种终端设备,终端设备可以为计算机设备,在实际场景中可以有更多或更少种类的终端设备参与到预流失对象的处理的过程中,具体数量和种类因实际场景而定,此处不做限定,另外,图1中示出了一个服务器,但在实际场景中,也可以有多个服务器的参与,具体服务器数量因实际场景而定。
本实施例中,服务器可以是独立的物理服务器,也可以是多个物理服务器构成的服务器集群或者分布式系统,还可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、CDN、以及大数据和人工智能平台等基础云计算服务的云服务器。终端可以是智能手机、平板电脑、笔记本电脑、台式计算机、智能音箱、智能手表、智能语音交互设备、智能家电、车载终端等,但并不局限于此。终端以及服务器可以通过有线或无线通信方式进行直接或间接地连接,终端以及服务器可以连接组成区块链网络,本申请在此不做限制。
可以理解的是,上述预流失对象的处理系统可以运行于个人移动终端,例如:作为互动剧这样的应用,也可以运行于服务器,还可以作为运行于第三方设备以提供预流失对象的处理,以得到信息源的预流失对象的处理处理结果;具体的预流失对象的处理系统可以是以一种程序的形式在上述设备中运行,也可以作为上述设备中的系统部件进行运行,还可以作为云端服务程序的一种,本实施例可应用于云技术、自动驾驶等场景,具体运作模式因实际场景而定,此处不做限定。
随着互联网技术的迅速发展,人们通过网络应用的交互越发频发。而在众多的网络应用中,如何保留对象成为难题;因此,可以对预流失的对象进行识别,并进行资源分发操作。
一般,对预流失对象进行识别的过程基于特征参数进行比对确定,例如人工经验筛选出部分和个人玩家活跃、付费、社交、活动相关的特征,从而对不符合相关特征的对象进行筛选。
但是,在大规模的应用数据中,对象的交互方式可能出现改变,基于人工经验筛选的特征参数进行比对的过程可能造成识别错误,从而影响资源分发操作的准确性。
为了解决上述问题,本申请提出了一种预流失对象的处理方法,该方法应用于图2所示的预流失对象的处理的流程框架中,如图2所示,为本申请实施例提供的一种预流失对象的处理的流程架构图,用户通过终端的交互操作使得服务器对交互数据进行预流失对象的识别,并进行对应的资源分发进程。
可以理解的是,本申请所提供的方法可以为一种程序的写入,以作为硬件系统中的一种处理逻辑,也可以作为一种预流失对象的处理装置,采用集成或外接的方式实现上述处理逻辑。作为一种实现方式,该预流失对象的处理装置通过获取目标应用中的待预测对象;然后确定预设时间窗口内待预测对象在目标应用中的交互数据,以基于交互数据确定对应的窗口特征和快照特征;并将窗口特征和快照特征输入决策树模型,以得到待预测对象对应的流失概率值,该决策树模型基于标记了活跃度标签的训练对象对应的训练数据训练所得,其训练数据包括预设时间窗口对应时间范围内的训练窗口特征和训练快照特征,且流失概率值基于窗口特征与训练窗口特征的相似度以及快照特征与训练快照特征的相似度确定;然后基于流失概率值确定待预测对象中的预流失对象;并确定预流失对象在决策树模型的计算过程中窗口特征和快照特征对应的贡献特征值;进而基于贡献特征值确定满足预设条件的目标特征,以根据目标特征向预流失对象进行资源分发。从而实现动态的预流失对象识别过程,由于采用时间窗口内交互数据中的动作维度的窗口特征和属性维度的快照特征进行流失概率的估计,提高了预流失对象识别的准确性,并通过贡献特征值进行针对性的资源分发,提高了资源分发的准确性。
本申请实施例提供的方案涉及人工智能的机器学习技术,具体通过如下实施例进行说明:
结合上述流程架构,下面将对本申请中预流失对象的处理方法进行介绍,请参阅图3,图3为本申请实施例提供的一种预流失对象的处理方法的流程图,该管理方法可以是由终端或服务器执行的,本申请实施例至少包括以下步骤:
301、获取目标应用中的待预测对象。
本实施例中,待预测对象可以是用户、玩家、终端或具有代表性的标识,此处以玩家为例进行说明,具体的对象形式因实际场景而定。
具体的,目标应用可以为游戏应用或其他存在对象交互的应用,待预测对象可以是目标应用中注册时间达到一定时长的对象,也可以是根据规则划分的对象集体,例如充值用户、VIP用户等。
302、确定预设时间窗口内待预测对象在目标应用中的交互数据,以基于交互数据确定对应的窗口特征和快照特征。
本实施例中,预设时间窗口可以是统计得到的用户可能的“活跃窗口”,从而提高数据的代表性。
具体的,对于窗口特征WindowFeatureList即为动作信息所得的特征;快照特征SnapFeatureList即为属性信息所得的特征;其中WindowFeatureList包括但不限于活跃特征、付费特征、社交特征、活动参与特征等,例如玩家在时间窗口内的死伤兵数量、医馆爆满次数、大地图玩法战斗胜率、副本玩法战斗胜率等;而对于SnapFeatureList包括但不限于龙脉的攻击(防御、生命)加成、神器的攻击(防御、生命)加成、武将兵法的攻击(防御、生命)加成、武将阵法的攻击(防御、生命)加成、武将计策的攻击(防御、生命)加成、天尊科技的攻击(防御、生命)加成等等,具体的特征形式因实际场景而定。
在一种可能的场景中,玩家的“窗口特征”和“快照特征”都是属于统计数值特征和玩家两周后的是否流失标签,该特征也可以采用玩家在游戏内的动作序列变化特征,从而捕捉玩家在“活跃窗口”内的活跃/付费/社交程度和玩家发育各条核心成长线的兴趣变化走势,并获取玩家在哪个时间节点有流失倾向。因此也可以考虑从输入特征和预流失模型上面做改进,窗口特征何快照特征为玩家在“活跃窗口”内的各类行为动作序列,例如付费、社交、活动参与、成长线属性提升等序列。
303、将窗口特征和快照特征输入决策树模型,以得到待预测对象对应的流失概率值。
本实施例中,决策树模型可以是XGBoost模型,该模型基于标记了活跃度标签的训练对象对应的训练数据训练所得,训练数据包括预设时间窗口对应时间范围内的训练窗口特征和训练快照特征,流失概率值基于窗口特征与训练窗口特征的相似度以及快照特征与训练快照特征的相似度确定;即输入所有待预测玩家的特征(“窗口特征”和“快照特征”)到训练完成的XGBoost模型,得到待预测玩家两周后的流失概率。
对于XGBoost模型的训练过程,首先对训练对象在预设时间窗口对应时间范围内交互数据进行解析,以得到训练数据;并获取训练数据中的动作信息,以得到训练数据对应的训练窗口特征;获取训练数据中的属性信息,以得到训练数据对应的训练快照特征;然后确定训练对象对应的活跃度标签;基于活跃度标签关联对应的训练窗口特征和训练快照特征,以得到训练数据集;然后调用预设树模型;从而根据训练数据集对预设树模型的参数进行调整,以得到决策树模型。
可以理解的是,对于训练数据的获取可以是根据活跃度进行可信的数据进行,即首先获取目标应用对应的离线日志数据;然后确定离线日志数据中对应的活跃度信息;并根据活跃度信息对应的活跃度分布情况确定活跃窗口,以将活跃窗口作为预设时间窗口;进而对训练对象在预设时间窗口对应时间范围内交互数据进行解析,以得到训练数据。
具体的,对于训练数据的获取,可以基于TDW离线日志数据,从中选择某个时间窗口大小为两周内的活跃玩家,并将该窗口记为:“活跃窗口”,统计“活跃窗口”内玩家的各类窗口特征WindowFeatureList和玩家的各类成长线属性的快照特征SnapFeatureList,以及将玩家在“活跃窗口”的两周后的一周记为:“标签窗口”,“标签窗口”内是否仍有活跃的标签Y。其中,WindowFeatureList包括但不限于活跃特征、付费特征、社交特征、活动参与特征等,SnapFeatureList包括但不限于;Y是玩家在“标签窗口”是否流失的标记,如果“标签窗口”内没有活跃,则Y=1;否则Y=0。选取玩家窗口特征、快照特征和“标签窗口”内是否流失的前提原因是假设认为玩家窗口特征能够反应玩家在“活跃窗口”的活跃、付费、社交等参与程度,快照特征能够反映玩家自身各条核心成长线的发育情况,窗口特征和快照特征相结合能够更加精准刻画玩家的当前状态;另外玩家在“标签窗口”内的流失与否可以明确表示玩家的活跃情况。
可以理解的是,由于基于离线日志数据,采用Spark分布式计算框架编写,但是这里的方案对硬件和网络条件没有显著限制。其中,离线日志数据是一种可支撑海量数据处理的公司级数据仓库;而Spark分布式计算框架是基于内存计算的大数据并行计算框架,提高了在大数据环境下数据处理的实时性,同时保证了高容错性和高可伸缩性。
另外,对于决策树模型的训练损失配置,可以首先确定训练数据集中样本对应的负梯度信息;然后基于负梯度信息拟合预设树模型对应的回归树,回归树包括多个叶子区域;并计算叶子区域对应的目标拟合值,以根据目标拟合值确定对应的决策树拟合函数,决策树拟合函数用于更新回归树对应的预设表达式;然后基于预设表达式配置目标函数,并对目标函数进行二阶泰勒公式展开得到展开函数;接下来对展开函数中的常数项进行去除,并加入正则项,以得到正则函数;并基于训练目标对正则函数进行求解,以得到参数配置信息;进而根据参数配置信息对预设树模型的参数进行调整,以得到决策树模型。
在一种可能的场景中,上述训练损失配置过程即构建一个XGBoost梯度提升决策树分类模型,输入为“活跃窗口”内玩家的“窗口特征”WindowFeatureList、“快照特征”SnapFeatureList和玩家在“标签窗口”内是否流失的标记Y。选择合适超参数:学习率、树的棵数、树的深度、正负样本权重、正则化系数,优化损失函数,直到收敛为止,表示XGBoost模型训练完成;因此对于决策树模型的训练过程首先初始化弱学习器(预设树模型):
然后进行参数迭代过程,即确定训练数据集中样本对应的负梯度信息,对于训练数据集T={(x1,y1),(x2,y2),…,(xn,yn),xi∈Rn,xi∈R},对迭代轮数t=1,2,3,…,T执行:对样本i=1,2,3,…,m,计算负梯度:
进一步的,基于负梯度信息拟合预设树模型对应的回归树,该回归树包括多个叶子区域;即利用负梯度信息(xi,rti)(i=1,2,3,…,m),可以拟合一颗CART回归树,从而得到第t颗回归树,其对应的叶子结点区域为Rtj,j=1,2,3,…,J,其中J为回归树t的叶子节点的个数。
从而可以计算叶子区域对应的目标拟合值,以根据目标拟合值确定对应的决策树拟合函数,该决策树拟合函数用于更新回归树对应的预设表达式;即对叶子区域,计算最佳拟和值:得到本轮的最优决策树拟合函数
然后,基于预设表达式配置目标函数,即更新强学习器并得到表达式:
并进行XGBoost的函数更新过程,即对目标函数进行二阶泰勒公式展开得到展开函数;并对展开函数中的常数项进行去除,并加入正则项,以得到正则函数;然后基于训练目标对正则函数进行求解,以得到参数配置信息。
具体的,对于上述XGBoost的函数更新过程,更新XGBoost的函数为:
其中/>
然后,将目标函数处进行二阶泰勒公式展开,得到:
其中去掉公式中的常数项后,可得到/>加入正则项:即可解出使得目标函数最小的ω,从而可以得到目标函数的最优解,即为XGBoost模型训练完成,进而根据参数配置信息对预设树模型的参数进行调整,以得到决策树模型。
在一种可能的场景中,本实施例的决策树模型的应用过程如图4所示,图4为本申请实施例提供的一种预流失对象的处理方法的场景示意图;图中示出了游戏场景的预流失对象的识别过程,即首先选择某个时间窗口大小为两周内的活跃玩家,统计玩家在时间窗口内的死伤兵数量、医馆爆满次数、大地图玩法战斗胜率、副本玩法战斗胜率等各类窗口特征WindowFeatureList,玩家在各条核心成长线截至统计日期的快照特征SnapFeatureList:龙脉的攻击(防御、生命)加成、神器的攻击(防御、生命)加成、武将兵法的攻击(防御、生命)加成、武将阵法的攻击(防御、生命)加成、武将计策的攻击(防御、生命)加成、天尊科技的攻击(防御、生命)加成等等,以及玩家在时间窗口后两周的活跃与否(活跃为0,流失为1)记为Y。
然后构建一个XGBoost梯度提升决策树的分类模型,输入为固定时间窗口内活跃玩家的窗口特征WindowFeatureList、快照特征SnapFeatureList和时间窗口后两周的活跃与否Y。选择合适超参数:学习率、树的棵数、树的深度、正负样本权重、正则化系数,优化损失函数,直到收敛为止,表示XGBoost模型训练完成。
应当注意的是,每天都可以将近两周内窗口特征WindowFeatureList和快照特征SnapFeatureList,输入到按天更新训练完成的XGBoost模型,从而模型计算出玩家在两周后的流失概率,保证XGBoost模型预测的准确性。
进一步的,根据玩家流失概率值将玩家分为“轻-中-重”不同的流失等级,选定流失等级为“重”的玩家认为预流失玩家;并使用SHAP框架对训练完成的XGBoost预流失模型进行可解释分析,可以得到每个样本的所有特征都有一组Shapley值,并将该值作为每个特征对于该玩家流失的贡献。
然后,对于每个玩家,根据影响玩家流失的贡献程度降序排序,选择影响该玩家流失贡献程度靠前的Top-N个特征;从而可以选择各个特征的相关道具,根据各个特征对于玩家流失的贡献程度大小,在玩家参与某些活动后,个性化投放不同类型不同数量的道具奖励。
通过上述处理过程,可以更加准确、及时地识别出预流失玩家,并且对能够针对预流失玩家采取个性化的关怀举措。方案中用于计算玩家预流失分数的特征和个性化关怀措施涉及到的游戏道具可以自适应迭代,减少了人工筛选或者替换。
304、基于流失概率值确定待预测对象中的预流失对象。
本实施例中,可以根据事先设置的阈值,将所有待预测玩家划分为“轻-中-重”的流失等级,将流失等级为“重”的玩家设定为潜在流失玩家,即预流失对象;
具体的,对于根据等级划分确定预流失对象的过程,可以首先将流失概率值于流失等级阈值进行比较,以得到待预测对象对应的流失等级;然后基于流失等级确定待预测对象中的预流失对象。
305、确定预流失对象在决策树模型的计算过程中窗口特征和快照特征对应的贡献特征值。
本实施例中,为了分析哪些因素是导致玩家可能流失的真正原因,使用SHAP框架得到的贡献特征值对训练完成的XGBoost预流失模型进行可解释分析,可以得到每个潜在流失玩家的所有特征都有一组Shapley值(贡献特征值),并将该值作为每个特征对于该玩家流失的贡献程度。
具体的,对于贡献特征值的确定过程,首先获取预流失对象在决策树模型的计算过程中窗口特征和快照特征对应的变量均值;然后确定窗口特征和快照特征对应的预测值与变量均值的差异信息;并根据差异信息确定预流失对象在决策树模型的计算过程中窗口特征和快照特征对应的贡献特征值。
可以理解的是,对于贡献特征值的确定,即采用SHAP模型计算源自合作博弈论的概念Shapley值。对于变量均值的确定,假设第i个样本为xi,第i个样本的第j个特征为xij,模型对该样本的预测值为yi,整个模型的基线ybase,该基线即由所有样本的目标变量的均值所得。其中,Shapley值计算公式为:
yi=ybase+f(xi1)+f(xi2)+…++f(xip)
其中,f(xij)为xij的Shapley值。f(xi1)是第i个样本中第1个特征对最终预测值yi的贡献值。
由于每个特征的Shapley值表示该特征为条件时预期模型预测的变化。Shapley值表示实例的平均模型预测与实际预测之间的差异。因此,当f(xi1)>0,表示该特征提升了预测值,反之,表示该特征使得贡献降低。Shapley值最大的优势是能反映出每个样本中的每个特征的影响力以及影响的正负性,从而可以实现根据差异信息确定预流失对象在决策树模型的计算过程中窗口特征和快照特征对应的贡献特征值的过程。
306、基于贡献特征值确定满足预设条件的目标特征,以根据目标特征向预流失对象进行资源分发。
本实施例中,目标特征即为对于预流失对象的确定具有影响性的特征,故对于每个玩家,根据影响玩家流失的贡献程度降序排序,选择影响该玩家流失贡献程度靠前的Top-N个特征;然后个性化投放奖励:即选择各个Top-N贡献程度特征的相关道具,根据各个特征对于玩家流失的贡献程度大小,在玩家参与某些活动后,个性化投放不同类型不同数量的道具奖励。
可以理解的是,资源分发的形式不仅限于道具奖励,还可以是界面更新(皮肤优化)或操作配置更新(简化操作模式)等,具体的资源分发形式因具体场景而定。
在一种可能的场景中,对于资源分发的具体数值,可以是根据应用均值确定的,即首先基于贡献特征值进行排序,以得到贡献序列;然后对贡献序列中处于预设条件指示的次序范围的特征进行收集,以得到目标特征,例如前3项;并获取目标应用中目标特征对应的参数平均值;然后确定预流失对象在目标特征对应的目标特征值;进而基于目标特征值与与参数平均值的差异信息向预流失对象进行资源分发,使得预流失对象在目标应用中可以得到符合于应用场景的资源,提高用户的稳定性。
在具体的游戏场景中,对于预流失对象的处理过程,即为预流失玩家的关怀过程,如图5所示,图5为本申请实施例提供的另一种预流失对象的处理方法的场景示意图;图中示出了游戏运营根据XGBoost模型按天计算出两周后的流失等级较高的玩家名单,给这批玩家配置对应的防流失助力活动,在游戏界面中会展示助力活动内容详情A1,进而玩家通过参与助力活动后所获得的奖励。
可以理解的是,对玩家而言,在被识别成预流失玩家后,可以从游戏内得到些许个性化的关怀,提升游戏体验。
另外,从应用(游戏)的角度,可以得到如图6所示的数据,图6为本申请实施例提供的另一种预流失对象的处理方法的场景示意图;图中示出了对于预流失玩家识别的精度,相对传统方法提升17.8%,关怀后预流失玩家的周平均在线时长(小时):相对传统方法提升53.5%。因此,本实施例可以更加准确及时地计算玩家预流失概率,并可以更精细化、更有效地向预流失玩家投放个性化奖励道具,从而使得游戏运营可以及时地对预流失等级较高的玩家采取个性化关怀措施,进而提升玩家的游戏体验和维持游戏活跃的稳定,最终促进游戏的商业化价值。
结合上述实施例可知,通过获取目标应用中的待预测对象;然后确定预设时间窗口内待预测对象在目标应用中的交互数据,以基于交互数据确定对应的窗口特征和快照特征;并将窗口特征和快照特征输入决策树模型,以得到待预测对象对应的流失概率值,该决策树模型基于标记了活跃度标签的训练对象对应的训练数据训练所得,其训练数据包括预设时间窗口对应时间范围内的训练窗口特征和训练快照特征,且流失概率值基于窗口特征与训练窗口特征的相似度以及快照特征与训练快照特征的相似度确定;然后基于流失概率值确定待预测对象中的预流失对象;并确定预流失对象在决策树模型的计算过程中窗口特征和快照特征对应的贡献特征值;进而基于贡献特征值确定满足预设条件的目标特征,以根据目标特征向预流失对象进行资源分发。从而实现动态的预流失对象识别过程,由于采用时间窗口内交互数据中的动作维度的窗口特征和属性维度的快照特征进行流失概率的估计,提高了预流失对象识别的准确性,并通过贡献特征值进行针对性的资源分发,提高了资源分发的准确性。
为了更好的实施本申请实施例的上述方案,下面还提供用于实施上述方案的相关装置。请参阅图7,图7为本申请实施例提供的一种预流失对象的处理装置的结构示意图,预流失对象的处理装置700包括:
获取单元701,用于获取目标应用中的待预测对象;
确定单元702,用于确定预设时间窗口内所述待预测对象在所述目标应用中的交互数据,以基于所述交互数据确定对应的窗口特征和快照特征;
输入单元703,用于将所述窗口特征和所述快照特征输入决策树模型,以得到所述待预测对象对应的流失概率值,所述决策树模型基于标记了活跃度标签的训练对象对应的训练数据训练所得,所述训练数据包括所述预设时间窗口对应时间范围内的训练窗口特征和训练快照特征,所述流失概率值基于所述窗口特征与所述训练窗口特征的相似度以及所述快照特征与所述训练快照特征的相似度确定;
处理单元704,用于基于所述流失概率值确定所述待预测对象中的预流失对象;
所述处理单元704,还用于确定所述预流失对象在所述决策树模型的计算过程中所述窗口特征和所述快照特征对应的贡献特征值;
所述处理单元704,还用于基于所述贡献特征值确定满足预设条件的目标特征,以根据所述目标特征向所述预流失对象进行资源分发。
可选的,在本申请一些可能的实现方式中,所述输入单元703,具体用于对所述训练对象在所述预设时间窗口对应时间范围内交互数据进行解析,以得到训练数据;
所述输入单元703,具体用于获取所述训练数据中的动作信息,以得到所述训练数据对应的训练窗口特征;
所述输入单元703,具体用于获取所述训练数据中的属性信息,以得到所述训练数据对应的训练快照特征;
所述输入单元703,具体用于确定所述训练对象对应的活跃度标签;
所述输入单元703,具体用于基于所述活跃度标签关联对应的训练窗口特征和训练快照特征,以得到训练数据集;
所述输入单元703,具体用于调用预设树模型;
所述输入单元703,具体用于根据所述训练数据集对所述预设树模型的参数进行调整,以得到所述决策树模型。
可选的,在本申请一些可能的实现方式中,所述输入单元703,具体用于获取目标应用对应的离线日志数据;
所述输入单元703,具体用于确定所述离线日志数据中对应的活跃度信息;
所述输入单元703,具体用于根据所述活跃度信息对应的活跃度分布情况确定活跃窗口,以将所述活跃窗口作为所述预设时间窗口;
所述输入单元703,具体用于对所述训练对象在所述预设时间窗口对应时间范围内交互数据进行解析,以得到所述训练数据。
可选的,在本申请一些可能的实现方式中,所述输入单元703,具体用于确定所述训练数据集中样本对应的负梯度信息;
所述输入单元703,具体用于基于所述负梯度信息拟合所述预设树模型对应的回归树,所述回归树包括多个叶子区域;
所述输入单元703,具体用于计算所述叶子区域对应的目标拟合值,以根据所述目标拟合值确定对应的决策树拟合函数,所述决策树拟合函数用于更新所述回归树对应的预设表达式;
所述输入单元703,具体用于基于所述预设表达式配置目标函数,并对所述目标函数进行二阶泰勒公式展开得到展开函数;
所述输入单元703,具体用于对所述展开函数中的常数项进行去除,并加入正则项,以得到正则函数;
所述输入单元703,具体用于基于训练目标对所述正则函数进行求解,以得到参数配置信息;
根据所述参数配置信息对所述预设树模型的参数进行调整,以得到所述决策树模型。
可选的,在本申请一些可能的实现方式中,所述处理单元704,具体用于将所述流失概率值于流失等级阈值进行比较,以得到所述待预测对象对应的流失等级;
所述处理单元704,具体用于基于所述流失等级确定所述待预测对象中的预流失对象。
可选的,在本申请一些可能的实现方式中,所述处理单元704,具体用于获取所述预流失对象在所述决策树模型的计算过程中所述窗口特征和所述快照特征对应的变量均值;
所述处理单元704,具体用于确定所述窗口特征和所述快照特征对应的预测值与所述变量均值的差异信息;
所述处理单元704,具体用于根据所述差异信息确定所述预流失对象在所述决策树模型的计算过程中所述窗口特征和所述快照特征对应的贡献特征值。
可选的,在本申请一些可能的实现方式中,所述处理单元704,具体用于基于所述贡献特征值进行排序,以得到贡献序列;
所述处理单元704,具体用于对所述贡献序列中处于所述预设条件指示的次序范围的特征进行收集,以得到所述目标特征;
所述处理单元704,具体用于获取所述目标应用中所述目标特征对应的参数平均值;
所述处理单元704,具体用于确定所述预流失对象在所述目标特征对应的目标特征值;
所述处理单元704,具体用于基于所述目标特征值与与所述参数平均值的差异信息向所述预流失对象进行资源分发。
通过获取目标应用中的待预测对象;然后确定预设时间窗口内待预测对象在目标应用中的交互数据,以基于交互数据确定对应的窗口特征和快照特征;并将窗口特征和快照特征输入决策树模型,以得到待预测对象对应的流失概率值,该决策树模型基于标记了活跃度标签的训练对象对应的训练数据训练所得,其训练数据包括预设时间窗口对应时间范围内的训练窗口特征和训练快照特征,且流失概率值基于窗口特征与训练窗口特征的相似度以及快照特征与训练快照特征的相似度确定;然后基于流失概率值确定待预测对象中的预流失对象;并确定预流失对象在决策树模型的计算过程中窗口特征和快照特征对应的贡献特征值;进而基于贡献特征值确定满足预设条件的目标特征,以根据目标特征向预流失对象进行资源分发。从而实现动态的预流失对象识别过程,由于采用时间窗口内交互数据中的动作维度的窗口特征和属性维度的快照特征进行流失概率的估计,提高了预流失对象识别的准确性,并通过贡献特征值进行针对性的资源分发,提高了资源分发的准确性。
本申请实施例还提供了一种终端设备,如图8所示,是本申请实施例提供的另一种终端设备的结构示意图,为了便于说明,仅示出了与本申请实施例相关的部分,具体技术细节未揭示的,请参照本申请实施例方法部分。该终端可以为包括手机、平板电脑、个人数字助理(personal digital assistant,PDA)、销售终端(point of sales,POS)、车载电脑等任意终端设备,以终端为手机为例:
图8示出的是与本申请实施例提供的终端相关的手机的部分结构的框图。参考图8,手机包括:射频(radio frequency,RF)电路810、存储器820、输入单元830、显示单元840、传感器850、音频电路860、无线保真(wireless fidelity,WiFi)模块870、处理器880、以及电源890等部件。本领域技术人员可以理解,图8中示出的手机结构并不构成对手机的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。
下面结合图8对手机的各个构成部件进行具体的介绍:
RF电路810可用于收发信息或通话过程中,信号的接收和发送,特别地,将基站的下行信息接收后,给处理器880处理;另外,将设计上行的数据发送给基站。通常,RF电路810包括但不限于天线、至少一个放大器、收发信机、耦合器、低噪声放大器(low noiseamplifier,LNA)、双工器等。此外,RF电路810还可以通过无线通信与网络和其他设备通信。上述无线通信可以使用任一通信标准或协议,包括但不限于全球移动通讯系统(globalsystem of mobile communication,GSM)、通用分组无线服务(general packet radioservice,GPRS)、码分多址(code division multiple access,CDMA)、宽带码分多址(wideband code division multiple access,WCDMA)、长期演进(long term evolution,LTE)、电子邮件、短消息服务(short messaging service,SMS)等。
存储器820可用于存储软件程序以及模块,处理器880通过运行存储在存储器820的软件程序以及模块,从而执行手机的各种功能应用以及数据处理。存储器820可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序(比如声音播放功能、图像播放功能等)等;存储数据区可存储根据手机的使用所创建的数据(比如音频数据、电话本等)等。此外,存储器820可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。
输入单元830可用于接收输入的数字或字符信息,以及产生与手机的用户设置以及功能控制有关的键信号输入。具体地,输入单元830可包括触控面板831以及其他输入设备832。触控面板831,也称为触摸屏,可收集用户在其上或附近的触摸操作(比如用户使用手指、触笔等任何适合的物体或附件在触控面板831上或在触控面板831附近的操作,以及在触控面板831上一定范围内的隔空触控操作),并根据预先设定的程式驱动相应的连接装置。可选的,触控面板831可包括触摸检测装置和触摸控制器两个部分。其中,触摸检测装置检测用户的触摸方位,并检测触摸操作带来的信号,将信号传送给触摸控制器;触摸控制器从触摸检测装置上接收触摸信息,并将它转换成触点坐标,再送给处理器880,并能接收处理器880发来的命令并加以执行。此外,可以采用电阻式、电容式、红外线以及表面声波等多种类型实现触控面板831。除了触控面板831,输入单元830还可以包括其他输入设备832。具体地,其他输入设备832可以包括但不限于物理键盘、功能键(比如音量控制按键、开关按键等)、轨迹球、鼠标、操作杆等中的一种或多种。
显示单元840可用于显示由用户输入的信息或提供给用户的信息以及手机的各种菜单。显示单元840可包括显示面板841,可选的,可以采用液晶显示器(liquid crystaldisplay,LCD)、有机发光二极管(organic light-emitting diode,OLED)等形式来配置显示面板841。进一步的,触控面板831可覆盖显示面板841,当触控面板831检测到在其上或附近的触摸操作后,传送给处理器880以确定触摸事件的类型,随后处理器880根据触摸事件的类型在显示面板841上提供相应的视觉输出。虽然在图8中,触控面板831与显示面板841是作为两个独立的部件来实现手机的输入和输入功能,但是在某些实施例中,可以将触控面板831与显示面板841集成而实现手机的输入和输出功能。
手机还可包括至少一种传感器850,比如光传感器、运动传感器以及其他传感器。具体地,光传感器可包括环境光传感器及接近传感器,其中,环境光传感器可根据环境光线的明暗来调节显示面板841的亮度,接近传感器可在手机移动到耳边时,关闭显示面板841和/或背光。作为运动传感器的一种,加速计传感器可检测各个方向上(一般为三轴)加速度的大小,静止时可检测出重力的大小及方向,可用于识别手机姿态的应用(比如横竖屏切换、相关游戏、磁力计姿态校准)、振动识别相关功能(比如计步器、敲击)等;至于手机还可配置的陀螺仪、气压计、湿度计、温度计、红外线传感器等其他传感器,在此不再赘述。
音频电路860、扬声器861,传声器862可提供用户与手机之间的音频接口。音频电路860可将接收到的音频数据转换后的电信号,传输到扬声器861,由扬声器861转换为声音信号输出;另一方面,传声器862将收集的声音信号转换为电信号,由音频电路860接收后转换为音频数据,再将音频数据输出处理器880处理后,经RF电路810以发送给比如另一手机,或者将音频数据输出至存储器820以便进一步处理。
WiFi属于短距离无线传输技术,手机通过WiFi模块870可以帮助用户收发电子邮件、浏览网页和访问流式媒体等,它为用户提供了无线的宽带互联网访问。虽然图8示出了WiFi模块870,但是可以理解的是,其并不属于手机的必须构成,完全可以根据需要在不改变发明的本质的范围内而省略。
处理器880是手机的控制中心,利用各种接口和线路连接整个手机的各个部分,通过运行或执行存储在存储器820内的软件程序和/或模块,以及调用存储在存储器820内的数据,执行手机的各种功能和处理数据,从而对手机进行整体检测。可选的,处理器880可包括一个或多个处理单元;可选的,处理器880可集成应用处理器和调制解调处理器,其中,应用处理器主要处理操作系统、用户界面和应用程序等,调制解调处理器主要处理无线通信。可以理解的是,上述调制解调处理器也可以不集成到处理器880中。
手机还包括给各个部件供电的电源890(比如电池),可选的,电源可以通过电源管理系统与处理器880逻辑相连,从而通过电源管理系统实现管理充电、放电、以及功耗管理等功能。
尽管未示出,手机还可以包括摄像头、蓝牙模块等,在此不再赘述。
在本申请实施例中,该终端所包括的处理器880还具有执行如上述页面处理方法的各个步骤的功能。
本申请实施例还提供了一种服务器,请参阅图9,图9是本申请实施例提供的一种服务器的结构示意图,该服务器900可因配置或性能不同而产生比较大的差异,可以包括一个或一个以上中央处理器(central processing units,CPU)922(例如,一个或一个以上处理器)和存储器932,一个或一个以上存储应用程序942或数据944的存储介质930(例如一个或一个以上海量存储设备)。其中,存储器932和存储介质930可以是短暂存储或持久存储。存储在存储介质930的程序可以包括一个或一个以上模块(图示没标出),每个模块可以包括对服务器中的一系列指令操作。更进一步地,中央处理器922可以设置为与存储介质930通信,在服务器900上执行存储介质930中的一系列指令操作。
服务器900还可以包括一个或一个以上电源926,一个或一个以上有线或无线网络接口950,一个或一个以上输入输出接口958,和/或,一个或一个以上操作系统941,例如Windows ServerTM,Mac OS XTM,UnixTM,LinuxTM,FreeBSDTM等等。
上述实施例中由管理装置所执行的步骤可以基于该图9所示的服务器结构。
本申请实施例中还提供一种计算机可读存储介质,该计算机可读存储介质中存储有预流失对象的处理指令,当其在计算机上运行时,使得计算机执行如前述图3至图6所示实施例描述的方法中预流失对象的处理装置所执行的步骤。
本申请实施例中还提供一种包括预流失对象的处理指令的计算机程序产品,当其在计算机上运行时,使得计算机执行如前述图3至图6所示实施例描述的方法中预流失对象的处理装置所执行的步骤。
本申请实施例还提供了一种预流失对象的处理系统,所述预流失对象的处理系统可以包含图7所描述实施例中的预流失对象的处理装置,或图8所描述实施例中的终端设备,或者图9所描述的服务器。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统,装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在本申请所提供的几个实施例中,应该理解到,所揭露的系统,装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,预流失对象的处理装置,或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(read-only memory,ROM)、随机存取存储器(random access memory,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述,以上实施例仅用以说明本申请的技术方案,而非对其限制;尽管参照前述实施例对本申请进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本申请各实施例技术方案的精神和范围。

Claims (10)

1.一种预流失对象的处理方法,其特征在于,包括:
获取目标应用中的待预测对象;
确定预设时间窗口内所述待预测对象在所述目标应用中的交互数据,以基于所述交互数据确定对应的窗口特征和快照特征;
将所述窗口特征和所述快照特征输入决策树模型,以得到所述待预测对象对应的流失概率值,所述决策树模型基于标记了活跃度标签的训练对象对应的训练数据训练所得,所述训练数据包括所述预设时间窗口对应时间范围内的训练窗口特征和训练快照特征,所述流失概率值基于所述窗口特征与所述训练窗口特征的相似度以及所述快照特征与所述训练快照特征的相似度确定;
基于所述流失概率值确定所述待预测对象中的预流失对象;
确定所述预流失对象在所述决策树模型的计算过程中所述窗口特征和所述快照特征对应的贡献特征值;
基于所述贡献特征值确定满足预设条件的目标特征,以根据所述目标特征向所述预流失对象进行资源分发。
2.根据权利要求1所述的方法,其特征在于,所述将所述窗口特征和所述快照特征输入决策树模型,以得到所述待预测对象对应的流失概率值之前,所述方法还包括:
对所述训练对象在所述预设时间窗口对应时间范围内交互数据进行解析,以得到训练数据;
获取所述训练数据中的动作信息,以得到所述训练数据对应的训练窗口特征;
获取所述训练数据中的属性信息,以得到所述训练数据对应的训练快照特征;
确定所述训练对象对应的活跃度标签;
基于所述活跃度标签关联对应的训练窗口特征和训练快照特征,以得到训练数据集;
调用预设树模型;
根据所述训练数据集对所述预设树模型的参数进行调整,以得到所述决策树模型。
3.根据权利要求2所述的方法,其特征在于,所述对所述训练对象在所述预设时间窗口对应时间范围内交互数据进行解析,以得到训练数据,包括:
获取目标应用对应的离线日志数据;
确定所述离线日志数据中对应的活跃度信息;
根据所述活跃度信息对应的活跃度分布情况确定活跃窗口,以将所述活跃窗口作为所述预设时间窗口;
对所述训练对象在所述预设时间窗口对应时间范围内交互数据进行解析,以得到所述训练数据。
4.根据权利要求3所述的方法,其特征在于,所述根据所述训练数据集对所述预设树模型的参数进行调整,以得到所述决策树模型,包括:
确定所述训练数据集中样本对应的负梯度信息;
基于所述负梯度信息拟合所述预设树模型对应的回归树,所述回归树包括多个叶子区域;
计算所述叶子区域对应的目标拟合值,以根据所述目标拟合值确定对应的决策树拟合函数,所述决策树拟合函数用于更新所述回归树对应的预设表达式;
基于所述预设表达式配置目标函数,并对所述目标函数进行二阶泰勒公式展开得到展开函数;
对所述展开函数中的常数项进行去除,并加入正则项,以得到正则函数;
基于训练目标对所述正则函数进行求解,以得到参数配置信息;
根据所述参数配置信息对所述预设树模型的参数进行调整,以得到所述决策树模型。
5.根据权利要求1所述的方法,其特征在于,所述基于所述流失概率值确定所述待预测对象中的预流失对象,包括:
将所述流失概率值于流失等级阈值进行比较,以得到所述待预测对象对应的流失等级;
基于所述流失等级确定所述待预测对象中的预流失对象。
6.根据权利要求1所述的方法,其特征在于,所述确定所述预流失对象在所述决策树模型的计算过程中所述窗口特征和所述快照特征对应的贡献特征值,包括:
获取所述预流失对象在所述决策树模型的计算过程中所述窗口特征和所述快照特征对应的变量均值;
确定所述窗口特征和所述快照特征对应的预测值与所述变量均值的差异信息;
根据所述差异信息确定所述预流失对象在所述决策树模型的计算过程中所述窗口特征和所述快照特征对应的贡献特征值。
7.根据权利要求1所述的方法,其特征在于,所述基于所述贡献特征值确定满足预设条件的目标特征,以根据所述目标特征向所述预流失对象进行资源分发,包括:
基于所述贡献特征值进行排序,以得到贡献序列;
对所述贡献序列中处于所述预设条件指示的次序范围的特征进行收集,以得到所述目标特征;
获取所述目标应用中所述目标特征对应的参数平均值;
确定所述预流失对象在所述目标特征对应的目标特征值;
基于所述目标特征值与与所述参数平均值的差异信息向所述预流失对象进行资源分发。
8.一种预流失对象的处理装置,其特征在于,包括:
获取单元,用于获取目标应用中的待预测对象;
确定单元,用于确定预设时间窗口内所述待预测对象在所述目标应用中的交互数据,以基于所述交互数据确定对应的窗口特征和快照特征;
输入单元,用于将所述窗口特征和所述快照特征输入决策树模型,以得到所述待预测对象对应的流失概率值,所述决策树模型基于标记了活跃度标签的训练对象对应的训练数据训练所得,所述训练数据包括所述预设时间窗口对应时间范围内的训练窗口特征和训练快照特征,所述流失概率值基于所述窗口特征与所述训练窗口特征的相似度以及所述快照特征与所述训练快照特征的相似度确定;
处理单元,用于基于所述流失概率值确定所述待预测对象中的预流失对象;
所述处理单元,还用于确定所述预流失对象在所述决策树模型的计算过程中所述窗口特征和所述快照特征对应的贡献特征值;
所述处理单元,还用于基于所述贡献特征值确定满足预设条件的目标特征,以根据所述目标特征向所述预流失对象进行资源分发。
9.一种计算机设备,其特征在于,所述计算机设备包括处理器以及存储器:
所述存储器用于存储程序代码;所述处理器用于根据所述程序代码中的指令执行权利要求1至7任一项所述的预流失对象的处理方法。
10.一种计算机程序产品,包括计算机程序/指令,所述计算机程序/指令存储于计算机可读存储介质,其特征在于,所述计算机可读存储介质中的所述计算机程序/指令被处理器执行时实现上述权利要求1至7任一项所述的预流失对象的处理方法的步骤。
CN202211372503.2A 2022-11-03 2022-11-03 一种预流失对象的处理方法、装置以及存储介质 Pending CN117009171A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211372503.2A CN117009171A (zh) 2022-11-03 2022-11-03 一种预流失对象的处理方法、装置以及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211372503.2A CN117009171A (zh) 2022-11-03 2022-11-03 一种预流失对象的处理方法、装置以及存储介质

Publications (1)

Publication Number Publication Date
CN117009171A true CN117009171A (zh) 2023-11-07

Family

ID=88566148

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211372503.2A Pending CN117009171A (zh) 2022-11-03 2022-11-03 一种预流失对象的处理方法、装置以及存储介质

Country Status (1)

Country Link
CN (1) CN117009171A (zh)

Similar Documents

Publication Publication Date Title
CN111078479B (zh) 一种内存检测模型训练的方法、内存检测的方法及装置
CN111813532B (zh) 一种基于多任务机器学习模型的图像管理方法及装置
CN112052841B (zh) 一种视频摘要的生成方法以及相关装置
CN110995810B (zh) 一种基于人工智能的对象识别方法和相关装置
CN110634474B (zh) 一种基于人工智能的语音识别方法和装置
CN113284142B (zh) 图像检测方法、装置、计算机可读存储介质及计算机设备
CN110162603B (zh) 一种智能对话方法、动态存储方法和装置
CN110929882A (zh) 一种基于人工智能的特征向量计算方法和相关装置
CN116959059A (zh) 一种活体检测的方法、装置以及存储介质
CN117009171A (zh) 一种预流失对象的处理方法、装置以及存储介质
CN112131482B (zh) 一种时效确定方法和相关装置
CN113822435B (zh) 一种用户转化率的预测方法及相关设备
CN116259083A (zh) 一种图像质量识别模型的确定方法和相关装置
CN114971635A (zh) 一种交易风险的管理方法以及相关装置
CN115080840A (zh) 一种内容推送方法、装置及存储介质
CN115239356A (zh) 一种推荐内容的管理方法以及相关装置
CN116450808B (zh) 一种数据的处理方法、装置以及存储介质
CN111368211B (zh) 关系链确定方法、装置及存储介质
CN117555815B (zh) 参数预测方法、模型训练方法和相关装置
CN112163164B (zh) 一种用户标签确定方法和相关装置
CN111475732B (zh) 一种信息处理方法和装置
CN113648659B (zh) 一种确定用户活跃度的方法和相关装置
CN117237652A (zh) 一种对象集合的检测方法、装置以及存储介质
CN116992162A (zh) 一种对象的推荐方法、装置以及存储介质
CN116712736A (zh) 一种用户推荐的方法以及相关装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication