CN111686451A - 一种业务处理方法、装置、设备及计算机存储介质 - Google Patents
一种业务处理方法、装置、设备及计算机存储介质 Download PDFInfo
- Publication number
- CN111686451A CN111686451A CN202010530088.3A CN202010530088A CN111686451A CN 111686451 A CN111686451 A CN 111686451A CN 202010530088 A CN202010530088 A CN 202010530088A CN 111686451 A CN111686451 A CN 111686451A
- Authority
- CN
- China
- Prior art keywords
- account
- trial period
- predicted
- historical
- data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- A—HUMAN NECESSITIES
- A63—SPORTS; GAMES; AMUSEMENTS
- A63F—CARD, BOARD, OR ROULETTE GAMES; INDOOR GAMES USING SMALL MOVING PLAYING BODIES; VIDEO GAMES; GAMES NOT OTHERWISE PROVIDED FOR
- A63F13/00—Video games, i.e. games using an electronically generated display having two or more dimensions
- A63F13/70—Game security or game management aspects
- A63F13/79—Game security or game management aspects involving player-related data, e.g. identities, accounts, preferences or play histories
-
- A—HUMAN NECESSITIES
- A63—SPORTS; GAMES; AMUSEMENTS
- A63F—CARD, BOARD, OR ROULETTE GAMES; INDOOR GAMES USING SMALL MOVING PLAYING BODIES; VIDEO GAMES; GAMES NOT OTHERWISE PROVIDED FOR
- A63F13/00—Video games, i.e. games using an electronically generated display having two or more dimensions
- A63F13/45—Controlling the progress of the video game
-
- A—HUMAN NECESSITIES
- A63—SPORTS; GAMES; AMUSEMENTS
- A63F—CARD, BOARD, OR ROULETTE GAMES; INDOOR GAMES USING SMALL MOVING PLAYING BODIES; VIDEO GAMES; GAMES NOT OTHERWISE PROVIDED FOR
- A63F2300/00—Features of games using an electronically generated display having two or more dimensions, e.g. on a television screen, showing representations related to the game
- A63F2300/50—Features of games using an electronically generated display having two or more dimensions, e.g. on a television screen, showing representations related to the game characterized by details of game servers
- A63F2300/51—Server architecture
-
- A—HUMAN NECESSITIES
- A63—SPORTS; GAMES; AMUSEMENTS
- A63F—CARD, BOARD, OR ROULETTE GAMES; INDOOR GAMES USING SMALL MOVING PLAYING BODIES; VIDEO GAMES; GAMES NOT OTHERWISE PROVIDED FOR
- A63F2300/00—Features of games using an electronically generated display having two or more dimensions, e.g. on a television screen, showing representations related to the game
- A63F2300/50—Features of games using an electronically generated display having two or more dimensions, e.g. on a television screen, showing representations related to the game characterized by details of game servers
- A63F2300/53—Features of games using an electronically generated display having two or more dimensions, e.g. on a television screen, showing representations related to the game characterized by details of game servers details of basic data processing
Abstract
本申请提供一种业务处理方法、装置、设备及计算机存储介质,涉及计算机技术领域,用以自动估计账户针对特定操作转移电子资源的操作意向概率。该方法包括:利用历史数据中,各个历史账户的账户特征数据和各个历史账户在各自的非试用时段中的转换操作结果的关联度,基于待预测账户的账户特征数据,估计待预测账户在非试用时段中进行转换操作的操作意向概率值,其中目标行为包括在非试用时段中进行转移电子资源的转换操作后可使用的操作;账户特征数据包括账户的属性特征数据和账户在目标行为的试用时段中行为特征数据。该方法能在不依赖人工的情况下自动估计待预测账户的操作意向概率阈值,提升了估计账户进行转换操作的操作意向概率阈值的效率。
Description
技术领域
本申请涉及计算机技术领域,尤其涉及一种业务处理方法、装置、设备及计算机存储介质。
背景技术
相关技术中,针对有试用时段的指定操作而言,账户在试用时段可以在不转移电子资源的情况下使用上述特定操作,但账户在非试用时段需针对上述特定操作转移电子资源后才可继续使用上述指定操作;但在估计账户在非试用时段是否会针对上述指定操作转移电子资源时,常通过人工分析账户对应的操作数据,根据分析结果估计账户在非试用时段是否会转移电子资源,因此,如何将估计账户针对特定操作是否会转移电子资源的构成自动化,并根据估计结果进行业务处理成为了一个需要考虑的问题。
发明内容
本申请实施例提供一种业务处理方法、装置、设备及计算机存储介质,用于至少自动预估账户针对特定操作转移电子资源的操作意向概率。
本申请第一方面,提供一种业务处理方法,包括:
获取待预测账户的账户特征数据,所述账户特征数据包括所述待预测账户的属性特征数据和所述待预测账户在目标行为的试用时段中行为特征数据,所述属性特征数据用于表征所述待预测账户的电子资源的持有量估计值,所述行为特征数据用于表征账户对目标行为的偏好程度,所述行为特征数据表征所述待预测账户对所述目标行为的偏好程度,所述目标行为包括在非试用时段中进行转移电子资源的转换操作后可使用的操作,所述非试用时段为所述试用时段结束之后的时段;
利用历史数据中,各个历史账户的账户特征数据和各个历史账户在各自的非试用时段中的转换操作结果的关联度,基于所述待预测账户的账户特征数据,估计所述待预测账户在非试用时段中进行转换操作的操作意向概率值,其中,所述转换操作结果包括是否进行所述转换操作的结果,每个历史账户的账户特征数据包括历史账户的属性特征数据和历史账户在各自的试用时段中的行为特征数据;
根据所述待预测账户在非试用时段进行转换操作的操作意向概率值,针对所述待预测账户进行业务处理。
在一种可能的实施方式中,实现所述目标行为的目标应用包括加速器,所述目标行为包括通过所述加速器为游戏应用加速的操作,所述行为特征数据还包括如下至少一种数据:
账户在试用时段中接入所述游戏应用的游戏接入信息;
账户在试用时段中接入同类应用的信息,所述同类应用包括所述加速器外的其他加速器。
在一种可能的实施方式中,所述目标行为操作信息包括如下至少一种信息:
账户在试用时段中通过所述加速器为所述游戏应用进行加速后,所述游戏应用的网络效率变化信息;
账户在试用时段中通过所述加速器为所述游戏应用进行加速的加速时长信息;
账户在试用时段中通过所述加速器为所述游戏应用进行加速的加速成功率。
在一种可能的实施方式中,账户在试用时段中通过所述加速器为所述游戏应用进行加速后,所述游戏应用的网络效率变化信息包括如下至少一种信息:
账户在试用时段中通过所述加速器为所述游戏应用进行加速后,所述游戏应用的平均网络延迟,所述平均网络延迟包括所述游戏应用中通过所述加速器创建的网络传输通道的网络延迟的平均值;
账户在第一子时段中游戏应用的第二平均网络延迟和第二子时段中游戏应用的第二平均网络延迟的比值,其中所述平均网络延迟包括所述游戏应用中通过所述加速器创建的网络传输通道的网络延迟的平均值,所述第一子时段为所述试用时段的子时段,所述第二子时段为所述试用时段的子时段,且所述第一子时段为所述第二子时段结束之后的相邻时段。
在一种可能的实施方式中,账户在试用时段中通过所述加速器为所述游戏应用进行加速的加速时长信息,至少包括如下一种信息:
账户在试用时段中通过所述加速器为所述游戏应用进行加速的加速总时长;
账户在第三子时段中的加速总时长,所述第三子时段为所述试用时段的子时段;
账户在第四子时段中的加速总时长与第五子时段中的加速总时长的比值,其中所述第四子时段为所述试用时段的子时段,所述第五子时段为所述试用时段的子时段,且所述第四子时段为所述第五子时段结束之后的相邻时段。
在一种可能的实施方式中,所述属性特征数据还包括如下用于表征所述第三方账户的网络偏好程度的至少一个数据:
所述第三方账户在与所述第三方账户对应的应用中的群组信息;
所述第三方账户在指定时段接入与所述第三方账户对应的应用的账户接入信息。
本申请第二方面,提供一种业务处理装置,包括:
特征提取单元,用于获取待预测账户的账户特征数据,所述账户特征数据包括所述待预测账户的属性特征数据和所述待预测账户在目标行为的试用时段中行为特征数据,所述属性特征数据用于表征所述待预测账户的电子资源的持有量估计值,所述行为特征数据用于表征账户对目标行为的偏好程度,所述行为特征数据表征所述待预测账户对所述目标行为的偏好程度,所述目标行为包括在非试用时段中进行转移电子资源的转换操作后可使用的操作,所述非试用时段为所述试用时段结束之后的时段;
操作意向预测单元,用于利用历史数据中,各个历史账户的账户特征数据和各个历史账户在各自的非试用时段中的转换操作结果的关联度,基于所述待预测账户的账户特征数据,估计所述待预测账户在非试用时段中进行转换操作的操作意向概率值,其中,所述转换操作结果包括是否进行所述转换操作的结果,每个历史账户的账户特征数据包括历史账户的属性特征数据和历史账户在各自的试用时段中的行为特征数据;
业务处理单元,用于根据所述待预测账户在非试用时段进行转换操作的操作意向概率值,针对所述待预测账户进行业务处理。
在一种可能的实现方式中,所述操作意向预测单元具体用于:
采用已训练的操作意向预估模型,输入所述待预测账户的账户特征数据,并获得所述操作意向预估模型输出的所述待预测账户在非试用时段进行所述转换操作的操作意向概率值,所述操作意向预估模型是基于集成学习方法,采用各个历史账户的账户特征数据和各个历史账户在各自的非试用时段是否进行所述转换操作的操作数据作为训练样本训练得到的,所述已训练的操作意向预估模型包括多个分类器和一个决策器,其中:
各分类器分别根据所述待预测账户的账户特征数据进行判定并输出第一分类结果,所述第一分类结果用于指示所述账户特征数据与非试用时段的转换操作结果的关联度;
所述决策器根据各分类器输出的第一分类结果,获得所述待预测账户在非试用时段进行所述转换操作的操作意向概率值。
在一种可能的实现方式中,所述操作意向预测单元还用于:
通过如下方式得到所述已训练的操作意向预估模型:
提取各训练样本中历史账户的账户特征数据以及历史账户在非试用时段是否进行转换操作的操作数据;
根据各训练样本中历史账户在非试用时段是否进行所述转换操作的操作数据,确定各训练样本的第二分类结果,所述第二分类结果用于指示各历史账户在各自的非试用时段是否进行所述转换操作的操作结果;
利用各训练样本中历史账户的账户特征数据和第二分类结果的映射关系,调整历史训练得到的操作意向预估模型或者初始的操作意向预估模型,得到所述已训练的操作意向预估模型。
在一种可能的实现方式中,所述操作意向预测单元还用于:
对所述历史数据进行如下至少一种数据处理,将进行数据处理后的历史数据确定为所述训练样本:
丢弃试用时段存在所述转换操作的历史数据;
丢弃非试用时段存在通过设定资源转换方式进行所述转换操作的历史数据;
丢弃目标行为的总时长小于时长阈值的历史数据。
在一种可能的实现方式中,所述行为特征数据包括如下至少一种数据:
账户在试用时段中进行所述目标行为的目标行为操作信息;
账户在试用时段中接入实现所述目标行为的目标应用的目标应用接入信息;
账户在试用时段中的网络环境信息;
账户在试用时段中的网络使用程度。
在一种可能的实现方式中,实现所述目标行为的目标应用包括加速器,所述目标行为包括通过所述加速器为游戏应用加速的操作,所述行为特征数据还包括如下至少一种数据:
账户在试用时段中接入所述游戏应用的游戏接入信息;
账户在试用时段中接入同类应用的接入信息,所述同类应用包括所述加速器外的其他加速器。
在一种可能的实现方式中,所述目标行为操作信息包括如下至少一种信息:
账户在试用时段中通过所述加速器为所述游戏应用进行加速后,所述游戏应用的网络效率变化信息;
账户在试用时段中通过所述加速器为所述游戏应用进行加速的加速时长信息;
账户在试用时段中通过所述加速器为所述游戏应用进行加速的加速成功率。
在一种可能的实现方式中,账户在试用时段中通过所述加速器为所述游戏应用进行加速后,所述游戏应用的网络效率变化信息包括如下至少一种信息:
账户在试用时段中通过所述加速器为所述游戏应用进行加速后,所述游戏应用的平均网络延迟,所述平均网络延迟包括所述游戏应用中通过所述加速器创建的网络传输通道的网络延迟的平均值;
账户在第一子时段中游戏应用的第二平均网络延迟和第二子时段中游戏应用的第二平均网络延迟的比值,其中所述平均网络延迟包括所述游戏应用中通过所述加速器创建的网络传输通道的网络延迟的平均值,所述第一子时段为所述试用时段的子时段,所述第二子时段为所述试用时段的子时段,且所述第一子时段为所述第二子时段结束之后的相邻时段。
在一种可能的实现方式中,账户在试用时段中通过所述加速器为所述游戏应用进行加速的加速时长信息,至少包括如下一种信息:
账户在试用时段中通过所述加速器为所述游戏应用进行加速的加速总时长;
账户在第三子时段中的加速总时长,所述第三子时段为所述试用时段的子时段;
账户在第四子时段中的加速总时长与第五子时段中的加速总时长的比值,其中所述第四子时段为所述试用时段的子时段,所述第五子时段为所述试用时段的子时段,且所述第四子时段为所述第五子时段结束之后的相邻时段。
在一种可能的实现方式中,所述账户包括登录实现所述目标行为的目标应用的第三方账户,所述属性特征数据包括如下至少一种数据:
所述第三方账户的账户设置信息;
所述第三方账户的创建时长信息;
所述第三方账户的账户等级信息。
在一种可能的实现方式中,述属性特征数据还包括如下用于表征所述第三方账户的网络偏好程度的至少一个数据:
所述第三方账户在与所述第三方账户对应的应用中的群组信息;
所述第三方账户在指定时段接入与所述第三方账户对应的应用的账户接入信息。
在一种可能的实现方式中,所述业务处理单元具体用于:
若所述待预测账户在非试用时段进行转换操作的操作意向概率值小于意向概率阈值,则向所述待预测账户发送设定电子媒体信息,以使所述待预测账户通过设定资源转换方式进行所述转换操作。
本申请第三方面,提供一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现第一方面及任一种可能的实施方式中任一所述的方法。
本申请第四方面,提供一种计算机可读存储介质,所述计算机可读存储介质存储有计算机指令,当所述计算机指令在计算机上运行时,使得计算机执行如第一方面及任一种可能的实施方式中任一所述的方法。
由于本申请实施例采用上述技术方案,至少具有如下技术效果:
本申请实施示例中,利用历史账户的账户特征数据和非试用时段中是否进行转换操作的转换操作结果的关联度,能够自动基于待预测账户的账户特征数据,估计待预测账户在非试用时段进行转换操作的操作意向概率值,进而根据估计出的操作意向概率值针对待预测账户进行业务处理。
附图说明
图1为本申请实施例提供的一种业务处理的应用场景的示例图;
图2为本申请实施例提供的一种业务处理的流程示例图;
图3为本申请实施例提供的一种估计操作意向概率值原理示例图;
图4为本申请实施例提供的一种业务处理装置的结构图;
图5为本申请实施例提供的一种计算机设备的结构图。
具体实施方式
为了更好的理解本申请实施例提供的技术方案,下面将结合说明书附图以及具体的实施方式进行详细的说明。
为了便于本领域技术人员更好地理解本申请的技术方案,下面对本申请涉及的技术名词进行说明。
目标行为:满足在试用时段中在不进行电子资源的转换操作的情况下可以使用,且在非试用时段需进行电子资源的转换操作才可使用的条件的操作;目标行为可以包括通过第一应用改变第二应用的网络效率的操作,如通过加速器为游戏应用进行加速的操作;目标行为也可以包括提升指定应用中某种行为效率的操作,如游戏应用中的使用指定游戏装备提升游戏角色的战斗能力的游戏装备使用操作;目标行为还可以包括在指定应用中获取某种服务的权限的操作,如视频应用中获得观看指定类视频的权限的操作。
电子资源:本申请实施例中的电子资源包括用于购买指定资源的资金,如购买使用目标行为的权限的资金,其可至少包括法币、电子货币等;所谓法币是指一种以法律形式赋予其强制流通使用的货币,如人民币、美元等;所谓电子货币是指以电子形式存储在账户所持有的电子钱包(如QQ钱包、微信钱包等)中的货币,电子货币可以但不局限于包括电子票据、数字货币(一种不受管制的、数字化的货币)、游戏资源(如游戏币、游戏装备等)等。
转换操作:本申请实施例的转换操作包括转移电子资源的操作,如转移账户中数字货币的付费操作,或转移游戏应用中的游戏币的游戏付费操作,或转移游戏应用中的游戏装备的游戏资源转换操作等。
集成学习(Ensemble Learning):有时也被笼统地称作提升(Boosting)方法,广泛用于分类和回归任务,其使用一些不同的方法改变原始训练样本的分布,从而构建多个不同的分类器,然后对各分类器的分类结果使用投票法得到最终的分类结果。
极端梯度提升(Extreme Gradient Boosting,xgboost):一种基于决策树的集成学习算法,采用了梯度提升(Gradient Boosting)框架;其在预测有关非结构化数据(如图像、文本等)的问题时,往往表现得比其他算法或框架更出色。
下面对本申请的设计思想进行说明。
相关技术中,针对改变指定应用的网络效率的特定操作,或获取指定应用中某种权限的特定操作,或改善指定应用中的某些操作的效果的指定操作而言,这类指定应用常具有对应的试用时段和非试用时段,账户在试用时段可以在不转移电子资源的情况下使用上述特定操作,但账户在非试用时段需针对上述特定操作转移电子资源后才可继续使用上述指定操作;但在估计账户在非试用时段针对特定操作是否会转移电子资源时,常通过实现上述特定操作的应用的运营人员分析账户的操作数据,以确定估计结果。如针对有试用时段的加速器,在预估新接入加速器的账户在非试用时段是否会为加速行为转移电子资源时,运营人员常常需要分析该账户接入加速器后的行为数据,根据分析结果估计该账户在非试用时段是否会为加速行为转移电子资源,该过程中需要消耗较多的人力物力,且估计结果严重依赖于运营人员的业务经验。
鉴于此,发明人设计了一种业务处理方法、装置、设备及计算机存储介质,考虑到账户是否会针对目标行为转移电子资源,与账户的电子资源的持有情况和对目标行为的偏好程度关联性很强,因此本申请实施例中基于表征待预测账户的电子资源的持有量估计值以及预测账户在目标行为的试用时段对目标行为的偏好程度的账户特征数据,估计待预测账户在非试用时段是否会针对目标行为转移电子资源;另一方面,考虑到使用目标行为的账户通常情况下具有相类似的行为特征,因此本申请实施例中将待预测账户的账户特征数据,结合各历史账户的账户特征数据与各历史账户在各自的非试用时段是否转移电子资源的关联度,估计待预测账户在非试用时段针对目标行为转移电子资源的操作意向概率。
此处对本申请实施例中的试用时段和非试用时段进行说明:
非试用时段为试用时段结束之后的时间段,非试用时段可以是试用时段结束之后的相邻时段,也可以是试用时段结束后的不相邻的时间段;其中试用时段可以为账户在不进行转换操作的情况下具有目标行为的权限的时间段,试用时段可以为从账户首次获得进行目标行为的权限的时刻开始至设定时长后的时间段;试用时段还可以为从账户首次接入实现目标行为的目标应用的时刻至设定时长后的时间段,本领域的技术人员可根据实际需求设置上述试用时段和非试用时段。
如目标行为是指定游戏装备的游戏装备使用操作时,试用时段可以是账户首次获得使用上述指定游戏装备的时刻开始至m1小时或m2天后的时间段,非试用时段为账户首次获得使用上述指定游戏装备m1小时后的时间段,m1和m2均为正数且对m1和m2的数值不做限定,如将m1设置为24,将m2设置为3等;目标行为是通过加速器为游戏应用进行加速的操作时,试用时段可以是账户接入加速器(即目标应用)的开始时刻开始至m3小时或开始时刻所在日之后的m4天的时间段,m3和m4均为正数且对m3和m4的数值不做限定,如将m3设置为24,将m4设置为3等,此时试用时段为账户接入加速器后的3天内,则非试用时段为账户接入加速器后的第4至10天,或非试用时段为账户接入加速器后的第6至10天。
为了更清楚地理解本申请的设计思路,以下结合附图进行详细说明。
请参照图1,表示一种业务处理的应用场景示例图。该应用场景中包括多个终端设备100和服务器200,用户可以通过账户在每个终端设备100上接入第一应用和第二应用,终端设备100和服务器200可以相互通信。
终端设备100可以在账户接入第一应用后,采集与账户相关的数据并通过终端设备100与服务器200之间的通信网络,将采集的与账户相关的数据发送给服务器200。
服务器200接收终端设备100发送的与账户相关的数据,并从中提取账户的账户特征数据,并利用历史数据中,各个历史账户的账户特征数据和各个历史账户在各自的非试用时段中的转换操作结果的关联度,基于上述待预测账户的账户特征数据,估计上述待预测账户在非试用时段进行转换操作的操作意向概率值,上述转换操作包括是否进行上述转换操作的结果。
基于图1的应用场景,下面对本申请实施例中涉及的业务处理方法进行示例说明;请参照图2,表示本申请实施例设计的业务处理方法具体包括如下步骤:
步骤S201,获取待预测账户的账户特征数据,账户特征数据包括待预测账户的属性特征数据和待预测账户在目标行为的试用时段中行为特征数据,目标行为包括在非试用时段中进行转移电子资源的转换操作后可使用的操作,非试用时段为试用时段结束之后的相邻时段。
其中,上述属性特征数据用于表征上述待预测账户的电子资源的持有量估计值,行为特征数据表征上述待预测账户对上述目标行为的偏好程度;且关于目标行为、电子资源以及转换操作的介绍可参见上述内容,此处不再重复叙述。
考虑到账户进行上述目标行为的情况直观的反映账户对目标行为的偏好程度,偏好程度高则账户进行转换操作的意愿越高;另一方面接入实现目标行为的目标应用的情况、账户的网络环境信息、账户的网络使用程度均能在一定程度上反映账户进行目标操作的可能性,因此本申请实施例中的行为特征数据可以包括账户在试用时段中的目标行为操作信息、接入实现目标行为的目标应用的目标应用接入信息、网络环境信息以及网络使用程度中的至少一种数据。
作为一种实施例,账户的电子资源的持有情况会很大程度上影响账户是否进行转换操作,且账户的网络使用程度也会对账户是否进行转换操作产生影响,账户包括登录目标应用的第三方账户时,第三方账户的账户信息能很大程度上反映账户的电子资源的持有情况,因此本申请实施例中可以将第三方账户的账户设置信息、创建时长信息以及账户等级信息中的至少一种数据,作为属性特征数据,以表征待预测账户的电子资源的持有量估计值。
步骤S202,利用历史数据中,各个历史账户的账户特征数据和各个历史账户在各自的非试用时段中的转换操作结果的关联度,基于待预测账户的账户特征数据,估计待预测账户在非试用时段中进行转换操作的操作意向概率值,其中,转换操作结果包括是否进行上述转换操作的结果,每个历史账户的账户特征数据包括历史账户的属性特征数据和历史账户在各自的试用时段中的行为特征数据。
作为一种实施例,本申请实施例中可以通过机器学习,学习历史数据中各历史账户的账户特征数据和各历史账户在非试用时段的转换操作结果的关联度,基于学习到的关联度,估计待预测账户的账户特征数据表征的在非试用时段中进行转换操作的操作意向概率;如通过有监督的分类学习、无监督的分类学习、强化学习、深度强化学习等机器学习方法,学习上述关联度。
步骤S203,根据待预测账户在非试用时段进行转换操作的操作意向概率值,针对上述待预测账户进行业务处理。
作为一种实施例,在估计待预测账户在非试用时段进行转换操作的操作意向概率值之后,可以根据估计的操作意向概率值的大小,对待预测账户进行业务处理。具体地,若待预测账户在非试用时段进行转换操作的操作意向概率值小于意向概率阈值,则可以向待预测账户发送设定电子媒体信息,以使待预测账户通过设定资源转换方式进行上述转换操作。
其中,电子资源为账户对应的电子钱包中的电子货币,转换操作为针对目标行为转移电子货币的付费操作时,上述设定电子媒体信息可以是电子货币优惠券如限定指定的时间段内可以使用的电子货币优惠券或不限定使用的时间段的电子货币优惠券,此种情况下上述设定资源转换方式为折扣支付方式。
以下对本申请实施例中的待预测账户和历史账户的账户特征数据进行详细说明,其中的账户既可以指代待预测账户,也可以指代历史账户。
本申请实施例的账户特征数据中的行为特征数据可以包括如下行为特征数据A1至行为特征数据A4中的至少一种数据:
行为特征数据A1:账户在试用时段中进行上述目标行为的目标行为操作信息。
上述目标行为操作信息可以包括试用时段中目标行为的次数信息、目标行为的时长信息、目标操作为账户带来的网络收益信息等中的至少一种信息。
行为特征数据A2:账户在试用时段中接入实现目标行为的目标应用的目标应用接入信息。
账户接入目标应用的时间越长、接入次数越多,则账户通过目标应用进行目标行为的可能性越大,故而上述目标应用接入信息可以包括账户在试用时段中接入目标应用的总时长、在试用时段接入目标应用的总次数、在试用时段接入目标应用的具体时段、在试用时段接入目标应用的具体时刻等中的至少一个信息。
行为特征数据A3:账户在试用时段中的网络环境信息。
上述网络环境信息可以包括网络速度、网络稳定性等。
行为特征数据A4:账户在试用时段中的网络使用程度。
账户在试用时段的网络使用程度越高,其使用目标行为的可能性越高,进而其针对目标行为进行转换操作的可能性也较高,因此上述网络使用程度可以但不局限于包括账户在试用时段接入网络的总时长、账户在试用时段接入网络的具体时段、账户在试用时段接入网络的总次数等。
以下给出针对不同的目标行为,行为特征数据的可能情况的示例:
示例1:
该示例中目标应用为游戏应用,目标行为是使用游戏应用中指定游戏装备的游戏装备使用操作。
行为特征数据中的目标行为操作信息可以是账户在指定游戏装备的试用时段中游戏应用中的游戏装备使用操作的信息,其可以包括在试用时段中使用上述指定游戏装备的次数、使用上述指定游戏装备的时长信息、使用上述指定游戏装备的具体时刻所属日期的日期类型、使用上述指定游戏装备为账户带来的网络收益信息等信息中的至少一个信息,该网络收益信息可以是游戏应用中的竞赛活动的胜利次数,本申请实施例中的日期类型可以包括工作日(星期一至星期五)和非工作日(星期六和星期日)。
上述目标应用接入信息可以包括账户在试用时段接入游戏应用的时长信息、试用时段接入游戏应用的次数、试用时期接入游戏应用使用的设备的设备信息、接入游戏应用的具体时刻或具体时段等信息中的至少一个信息。
上述账户在试用时段中的网络环境信息可以包括:账户在试用时段接入游戏应用的网络速度、账户在试用时段的网络稳定性等信息中的至少一个信息。
上述账户在试用时段中的网络使用程度可以包括:账户在试用时段接入网络的时长信息、账户在试用时段接入网络的次数信息等。
示例2:
该示例中,目标应用为加速器,目标行为包括通过上述加速器为游戏应用进行加速的操作。
为了便于说明,该示例中的试用时期包括接入加速器的时刻及接入加速器之日起的3天内组成的时段,以下将本示例中的试用时段表述为3天试用期;但3天试用期仅为便于理解设置,并不是本示例中对试用时段的限定,本领域的技术人员可根据实际需求对本示例中的时段进行限定。
考虑到账户通过加速器为游戏应用进行加速时,加速效果(如加速成功率和加速后游戏应用的网络效率等)会对账户的加速体验产生较大影响,且加速体验在很大程度上会影响账户对目标行为的偏好程度,账户的加速体验效果好则账户进行转换操作的可能性越大;因此示例中账户在试用时段中行为特征数据中的目标行为操作信息,可以但不局限于包括如下加速信息B1至加速信息B3中的至少一种数据。
加速信息B1:账户在试用时段中通过加速器为游戏应用进行加速后,游戏应用的网络效率变化信息。
游戏应用的网络效率变化信息可以包括账户在试用时段中通过加速器为游戏应用进行加速后,游戏应用的平均网络延迟;该平均网络延迟包括游戏应用中通过加速器创建的网络传输通道的网络延迟的平均值;如将3天试用期内游戏应用中通过加速器创建的网络传输通道的网络延迟的平均值,确定为上述网络效率变化信息。
进一步,账户在试用时段中的不同子时段内,通过加速器为游戏应用进行加速的加速效果的稳定性,会影响账户的加速体验,即加速效果的稳定性越高,账户对目标行为的偏好程度也就越高,进而账户进行转换操作的意愿就越强,因此,可以将账户在试用时段通过加速器为游戏应用进行加速的加速效果的稳定性,确定为上述游戏应用的网络效率变化信息。
故而,网络效率变化信息可以是账户在第一子时段中游戏应用的第二平均网络延迟和第二子时段中游戏应用的第二平均网络延迟的比值,其中上述平均网络延迟包括游戏应用中通过加速器创建的网络传输通道的网络延迟的平均值,上述第一子时段为试用时段的子时段,第二子时段为试用时段的子时段,且第一子时段为第二子时段结束之后的相邻时段,如第一子时段为3天试用期的第2天,第二子时段为3天试用期的第3天,可以将游戏应用在上述第2天的平均网络延迟与游戏应用在上述第1天的平均网络延迟的比值,确定为网络效率变化信息;第一子时段为3天试用期的第3天,第二子时段为3天试用期的第2天,可以将游戏应用在上述第3天的平均网络延迟与游戏应用在上述第2天的平均网络延迟的比值,确定为网络效率变化信息。
加速信息B2:账户在试用时段中通过加速器为游戏应用进行加速的加速时长信息。
进一步,账户在试用时段的加速总时长、进行加速的具体时段以及加速时长的稳定性比较能反映账户对通过加速器为游戏应用进行加速的操作的依赖程度,依赖程度越高则账户对目标行为的偏好程度越高,其进行转换操作的意愿越大。因此上述加速时长信息包括如下加速时长信息C1至加速时长信息C3中的至少一个信息:
加速时长信息C1:账户在试用时段中通过加速器为游戏应用进行加速的加速总时长;如账户在3天试用期内为游戏应用进行加速的加速总时长。
加速时长信息C2:账户在第三子时段中的加速总时长,上述第三子时段为上述试用时段的子时段;
第三子时段可以但不局限于包括工作时段、文娱时段、睡眠时段中的至少一个时段;上述工作时段可以包括每天的早上7:00至晚上6:00的时间段,上述文娱时段可以包括每天的晚上18:00至晚上23:00的时间段,上述睡眠时段可以包括每天的晚上23:00-24:00以及0:00至7:00的时间段,其中一天的24:00和后一天的0:00为相同的表达,本领域的技术人员也可以根据实际需求划分试用时段的第三子时段。
且上述第三子时段的加速总时长能在一定程度反映账户对应的用户的生活状态,用户的生活状态能在一定程度上反映用户是否有充足的时间玩游戏,当用户有充足的时间玩游戏的情况下,用户对应的账户通过加速器为游戏应用进行加速的可能性越大,则其进行转换操作的意愿就越强。
加速时长信息C3:账户在第四子时段中的加速总时长与第五子时段中的加速总时长的比值,其中上述第四子时段为上述试用时段的子时段,上述第五子时段为上述试用时段的子时段,且上述第四子时段为上述第五子时段结束之后的相邻时段。
如第四子时段为3天试用期的第2天,第五子时段为3天试用期的第1天,可以将游戏应用在上述第2天的加速总时长与游戏应用在上述第1天的加速总时长的比值,确定为加速时长信息;第四子时段为3天试用期的第3天,第五子时段为3天试用期的第2天,可以将游戏应用在上述第3天的加速总时长与游戏应用在上述第2天的加速总时长的比值,确定为网络效率变化信息。
加速信息B3:账户在试用时段中通过加速器为游戏应用进行加速的加速成功率。
由于网络环境等因素,账户通过加速器为游戏应用进行加速时,有可能出现加速失败的情况,加速失败会降低账户对目标行为的偏好程度,进而影响账户进行转换操作的意愿。
作为一种实施例,考虑到账户通过加速器为游戏应用进行加速时,账户接入加速器的一些信息,会在一定程度上影响账户通过加速器为游戏应用进行加速的意愿,进而影响账户进行转换操作的意向,具体地,上述账户在试用时段中行为数据特征中的目标应用接入信息,可以包括如下至少一种信息:
账户在试用时段接入加速器的时长信息、账户在试用时段接入加速器的次数、账户在试用时段首次接入加速器的首次接入信息等。
上述首次接入信息可以包括账户在试用时段中首次接入加速器对应的加速器推广链接、首次接入上述加速器的时间信息等信息;其中加速器推广链接可以是加速器的运营商通过各广告网站平台创建的用于推广加速器的广告链接;上述首次接入加速器的时间信息可以是首次接入加速器的具体时间,或首次接入加速器的具体时间所属日期的日期类型等。
作为一种实施例,账户接入网络的网络环境会影响账户对目标行为的偏好程度,如网络速度较差的情况下账户更偏好使用加速器;且账户接入加速器的设备的设备信息能在一定程度上反映网络环境,账户接入加速器时的网络环境;因此,上述账户在试用时段的网络环境信息包括账户在试用时段中接入加速器使用的设备的设备信息,和账户在试用时段接入加速器的网络环境;
设备信息可以是账户在试用时段接入加速器使用的设备的数量,其能在一定程度上反映账户接入网络的接入环境的稳定性,而账户接入网络的环境的稳定性在一定程度上,会影响账户对通过加速器为游戏应用进行加速的操作的偏好程度。
设备信息也可以是账户在试用时段接入加速器的异常设备占比,该异常设备占比为账户接入加速器使用的异常设备的数量与账户接入加速器使用的设备的总数量的比值,其中若一个设备在指定时间段接入加速器的账户的数量大于账户数量阈值,则该设备为上述异常设备,上述指定时间段可以为一个月或一个星期等时间段。
设备信息还可以是账户在试用时段接入加速器使用的设备对应的设备环境,该设备环境可以上述设备是否是网吧中的设备,或者上述设备是否是某企业的设备等。
进一步,电子资源为账户对应的电子钱包中的电子货币,转换操作为针对目标行为转移电子货币的付费操作时,设备的设备类型能在一定程度上反映账户对电子货币的持有情况,因而上述设备信息还可以是账户在试用时段接入加速器使用的设备的设备类型,如设备类型为某售价较高的设备,则该设备类型对应的账户可能持有较多的电子货币,进而其进行转换操作的可能性也较高。
上述账户在试用时段接入加速器的网络环境可以是通过账户在试用时段接入加速器时的地理位置信息;上述账户接入加速器时的地理位置信息可以通过账户接入加速器时使用的设备的网络协议地址(IP地址),将上述网络协议地址对应的地理位置确定为账户接入加速器时的地理位置信息,上述地理位置可以但不局限于为对应的经纬度或行政区等。
上述地理位置信息可以反应账户使用的设备的地理位置,设备的地理位置能在一定程度上反映账户对应的用户的地理位置;电子资源为账户对应的电子钱包中的电子货币,转换操作为针对目标行为转移电子货币的付费操作时,不同地理位置处的账户对电子货币的持有情况不同,账户对电子货币的持有情况很大程度上会对账户是否进行付费操作产生影响,如账户接入加速器时的地理位置信息对应的地理位置处的经济情况良好的情况下,该账户对应的用户可能会更赋予,该账户针对目标行为进行付费操作的意向会更强。
上述账户在试用时段接入加速器的网络环境,也可以是账户使用的流量的网络运营商的信息,不同的网络运营商在不同区域的网络信号强度及信号稳定度等,且网络信号强度及信号稳定度会影响账户的网络环境。
作为一种实施例,账户接入的游戏应用的情况在一定程度上会反映账户对游戏应用的偏好程度,一般情况下账户对游戏应用的偏好程度越高,则账户通过加速器为游戏应用进行加速的意愿更强,因此,上述行为特征数据还可以包括账户在试用时段接入游戏应用的游戏接入信息。
由于账户在试用时段接入游戏应用的次数、接入的游戏应用的数量,接入的游戏应用的时长以及接入的游戏应用对网速的要求等,都能在一定程度上反映账户通过加速器为游戏应用进行加速的意愿,如账户接入游戏应用的次数较多、或账户接入游戏应用的时间较长,或账户接入了对网速要求高的游戏应用时,账户通过加速器为游戏应用进行加速的意愿,因此,上述游戏接入信息可以是接入游戏应用的次数、接入游戏应用的时长、接入的游戏应用的游戏类型、接入的游戏应用的数量中至少一个信息,如游戏接入信息包括账户在试用时段中接入的游戏应用的总次数、接入游戏应用的总时长、是否接入国外服务器服务的游戏应用以及接入的游戏应用的总数量等信息;其中上述游戏类型可以包括竞技类游戏、虚拟现实类游戏、国内游戏、国外游戏、第一人称射击类游戏等。
作为一种实施例,目前已出现多种加速器,账户使用上述加速器之外的其它加速器的体验,也会对账户使用上述加速器的意愿产生一定程度的影响,因此,上述行为特征数据还可以包括账户在试用时段中接入同类应用的接入信息,该同类应用可以是上述加速器外的其它加速器。
以下对本申请实施例的账户特征数据中的属性特征数据进行详细说明。
上述第三方账户可以为即时通讯应用的账户如QQ应用的QQ账户,账户为第三方账户时,属性特征数据至少包括如下至少一种数据:
第三方账户的账户设置信息、上述第三方账户的创建时长信息、上述第三方账户的账户等级信息。
考虑到不同年龄的人对应的账户持有电子资源的情况不同,男性和女性对应的账户持有电子资源的情况有所不同,不同地域的用户对应的账户持有电子资源的情况也会有不同,因此本申请实施例中以用户设置的年龄、性别、籍贯等表征第三方账户的电子资源的持有量估计值,即上述账户设置信息可以包括用户通过第三方账户设置的年龄、性别、籍贯等信息;如电子资源为电子货币,转换操作为付费操作时,年龄较大的人相对富裕,其对应的账户持有的电子货币相对较多,则较大年龄对应的账户更愿意针对目标行为以转移电子货币的形式进行付费操作。
上述第三方账户的创建时长信息中,第三方账户创建的时间越久,则第三方账户上网程度一般较高且持有的电子资源越多,该第三方账户进行上述转换操作的意愿值更高,因而本申请实施例中以第三方账户的创建时长信息表征第三方账户的电子资源的持有量估计值。
第三方账户的账户等级信息中账户等级越高,则第三方账户上网程度一般较高且持有的电子资源越多,该第三方账户进行转换操作的意愿值更高,因而本申请实施例中以第三方账户的账户等级信息表征第三方账户的电子资源的持有量估计值。
进一步,上述属性特征数据还包括用于表征第三方账户的网络偏好程度的至少一个数据:上述第三方账户在与上述第三方账户对应的应用中的群组信息、上述第三方账户在指定时段接入与上述第三方账户对应的应用的账户接入信息;其中对上述指定时段不做限定,如可以将其设置为当前时刻之前的一个月或者一星期等。
本申请实施例以下内容,给出一种在上述步骤S202中通过有监督的分类学习中的集成学习方法,估计待预测账户在非试用时段进行转换操作的操作意向概率值的过程,具体如下:
首先在估计待预测账户在非试用时段进行转换操作的操作意向概率值之前,可以基于集成学习方法,采用各个历史账户的账户特征数据和各个历史账户在各自的非试用时段是否进行转换操作的操作数据作为训练样本训练得到一个操作意向预估模型。
进而在估计待预测账户在非试用时段进行转换操作的操作意向概率值时,采用已训练的操作意向预估模型,输入提取的待预测账户的账户特征数据,并获得上述操作意向预估模型输出的待预测账户在非试用时段进行上述转换操作的操作意向概率值。
具体地,上述已训练的操作意向预估模型包括多个分类器和一个决策器,在估计待预测账户在非试用时段中进行转换操作的操作意向概率值时,各分类器分别根据待预测账户的账户特征数据进行判定并输出第一分类结果,第一分类结果用于指示账户特征数据与非试用时段的转换操作结果的关联度;决策器根据各分类器输出的第一分类结果,获得待预测账户在非试用时段进行上述转换操作的操作意向概率值。
进一步地,上述已训练的操作意向预估模型可以是采用xgboost的回归树作为分类器的机器学习模型,上述第一分类结果可以是各xgboost的回归树的分类结果,采用xgboost作为分类器的操作意向预估模型的预测原理如下公式1所示。
公式1中,K表示操作意向预估模型中分类器的数量(即操作意向预估模型中的回归树的数量),其中每个分类器是操作意向预估模型自动根据账户特征数据中至少一个特征数据构建的;为估计的账户在非试用时段进行转换操作的操作意向概率值;fk()为第k棵回归树(即第k个分类器)的预测函数,用于将训练样本到回归树的叶子节点的映射;xi为上述作为训练样本的历史数据中的账户特征数据组成的特征向量。
表征上述采用xgboost作为分类器的操作意向预估模型的损失函数如下公式2所示。
公式2中,Obj为操作意向预估模型的优化目标,其由操作意向预估模型预测训练样本的转化操作结果的误差和操作意向预估模型的复杂度惩罚;n为训练样本的数量;yi为第i各训练样本的在非试用时段的转换操作结果;表示操作意向预估模型的第i个训练样本的输出值;K表示操作意向预估模型中分类器的数量;fk()为第k棵回归树(即第k个分类器)的预测函数,用于将训练样本到回归树的叶子节点的映射;xi为上述作为训练样本的历史数据中的账户特征数据组成的特征向量,为操作意向预估模型预测第i个训练样本的转化操作结果的误差,Ω(fk)为第k棵回归树(即第k个分类器)的正则项,即操作意向预估模型中第k棵回归树的复杂度惩罚。
本申请实施例以下内容提供一种操作意向预估模型的训练过程,该训练过程主要包括样本处理过程和模型训练过程,具体如下:
(一)样本处理过程
首先从实现目标行为的目标应用中获取历史数据作为训练样本。
考虑到训练样本中的账户特征数据中包括多项离散的数据,且多项离散的数据的数据类型也可能不同,不便于操作意向预估模型学习到账户特征数据和在非试用时段中的转换操作结果的关联度,因此可以在训练操作意向预估模型之前对账户特征数据进行设定处理,将账户特征数据中多项离散的数据转换成具有一定分布特征且便于处理的数据。
如可以将从训练样本中提取出的账户特征数据进行特征归一化处理和onehot编码处理等,进而保存上述归一化处理时使用的数据处理规则和onehot编码处理中使用的编码规则,以便预测服务器根据操作意向预估模型的输出以及数据处理规则和编码规则获知最终的估计结果;其中特征归一化处理可以包括,按照数据处理规则将账户特征数据中每项表示特征的数据变换为0至1之间的数值;onehot编码处理又称为一位有效编码,其是采用N位状态寄存器来对N个状态进行编码,每个状态都由他独立的寄存器位,并且在任意时候只有一位有效,在本申请实施例中onehot编码处理可以按照设定编码规则将账户特征数据中离散的每项数据进行特征数字化。
作为一种实施例,考虑到操作意向预估模型的特定应用场景,由于一些异常的历史数据或包含指定特征的历史数据,会影响操作意向预估模型的预测准确度,因此可以对获取的历史数据进行如下至少一种数据清洗处理,将进行数据清洗处理后的历史数据确定为训练使用的训练样本。
第一种数据清洗处理:丢弃试用时段存在转换操作的历史数据。
由于操作意向预估模型需学习历史数据中各历史账户的账户特征数据和各历史账户在非试用时段的转换操作结果的关联度,则历史账户在试用时段的转换操作会对操作意向预估模型的学习过程产生影响,有可能学习到的历史账户的账户特征数据和历史账户在试用时段中的转换操作结果的关联度,进而对操作意向预估模型的估计结果产生影响,因此,可以丢弃试用时段存在转换操作的历史数据,以提升操作意向预估模型学习历史账户的账户特征数据和历史账户在非试用时段的转换操作结果的关联度的准确度。
第二种数据清洗处理:非试用时段存在通过设定资源转换方式进行上述转换操作的历史数据。
考虑到操作意向预估模型的特定应用场景,其在一些应用场景中可能是要预测在没有干扰条件的情况下账户在非试用时段进行转换操作的操作意向概括值,上述干扰条件可以是账户拥有通过设定资源转换方式进行转换操作的权限,然而通过设定资源转换方式进行转换操作的历史数据,由于操作意向预估模型学习到的历史账户的账户特征数据和历史账户在非试用时段中的转换操作结果的关联度中,存在非试用时段中以设定资源转换方式进行转换操作的转换操作结果,进而影响操作意向预估模型的估计准确度;如转换操作为付费操作时,设定资源转换方式包括账户使用折扣优惠券的方式进行付费操作,操作意向预估模型可能会学习到历史账户的账户特征数据和历史账户在非试用时段通过这就优惠券的方式进行付费操作的关联度,进而将操作意向预估模型应用在预测账户在非试用时段中不使用优惠方式进行付费操作的应用场景时,其估计的准确度会下降,因此本申请实施例中可以删除非试用时段存在通过设定资源转换方式进行上述转换操作的历史数据,以提升操作意向预估模型在特定应用场景下的估计准确度。
第三种数据清洗处理:丢弃目标行为的总时长小于时长阈值的历史数据。
具体地,考虑到非试用时段中进行转换操作的历史账户在训练样本中占比偏小,若一些历史数据中的目标行为的总时长过短时就进行了转换操作,在一定程度上表征历史账户在对目标行为的偏好程度较低的情况下进行了转换操作,且若这部分历史账户的账户特征数据中的其他数据与其他历史账户对应的账户特征数据区别不大的情况下,则操作意向预估模型可能学习到账户在对目标行为的偏好程度低的情况下进行转换操作,训练后的操作意向预估模型的估计准确度可能会下降,故而可以在获取训练样本的时候丢弃目标行为的总时长小于时长阈值的历史数据。
在获取的历史数据中获取的历史数据可能存在数据缺失的问题,如缺失属性特征数据中的某一项数据或多项数据,在这种情况下,可以通过设定字符串对历史数据中的缺失的数据进行处理,如通过0填充缺失的数值类数据,通过空字符串填充缺失的字符类数据等。
(二)模型训练过程
本申请实施例中训练操作意向预估模型的任务就是找到一组使得优化目标(上述公式2中的Obj)最小的回归树的参数值,。
在训练操作意向预估模型时,可以提取各训练样本中历史账户的账户特征数据以及历史账户在非试用时段是否进行转换操作的操作数据;进而根据各训练样本中历史账户在非试用时段是否进行转换操作的操作数据,确定各训练样本的第二分类结果,上述第二分类结果用于指示各历史账户在各自的非试用时段是否进行上述转换操作的操作结果;利用各训练样本中历史账户的账户特征数据和第二分类结果的映射关系,调整历史训练得到的操作意向预估模型或者初始的操作意向预估模型,得到训练后的操作意向预估模型。
具体地,在利用训练样本训练操作意向预估模型时,可以基于初始获得的训练样本训练通过集成学习方法创建的初始的操作意向预估模型;也可以在初次获得已训练后的操作意向预估模型后,根据目标应用中新产生的历史数据对操作意向模型进行更新,如通过根据目标应用中新产生的历史数据更新训练样本,利用更新后的训练样本中历史账户的账户特征数据和历史账户在非试用时段的转换操作结果,调整历史训练得到的操作意向预估模型,得到新的训练后的操作预估模型。
本申请实施例在训练操作意向预估模型的过程中,根据训练样本中历史账户在非试用时段的转换操作结果确定训练样本的第二分类结果(即训练样本的标签),将转换操作结果中进行了转换操作的训练样本的标签设置为正样本标签,将转换操作结果中未进行转换操作的训练样本的标签设置为负样本标签,进而学习训练样本中账户特征数据和训练样本的标签的映射关系,调整历史训练得到的操作意向预估模型或者初始的操作意向预估模型的模型参数,得到训练后的操作意向预估模型;其中上述调整的模型参数可以但不局限于包括xgboost的迭代次数正样本标签的权重以及xgboost中子回归树的最大深度等,且在调整模型参数时,可以但不局限于采用网格搜索法自动搜索上述各模型参数的最佳取值。
为了便于理解,本申请实施例中以下内容提供一个业务处理的具体示例。
该示例中,目标应用为加速器,目标行为包括通过加速器为游戏应用进行加速的操作;电子资源为账户的电子钱包中的电子货币,转换操作包括账户以转移电子货币的形式为试用加速器进行的付费操作,以便账户在非试用时段能继续通过加速器为游戏应用进行加速的操作;账户为QQ账户。
本示例为了便于说明,将试用时期设置为账户接入加速器之日起的3天内组成的时段,非试用时段为账户接入加速器之日起的第4-10天组成的时段,以下将本示例中的试用时段表述为3天试用期;但3天试用期仅为便于理解设置,并不是本示例中对试用时段的限定,本领域的技术人员可根据实际需求对本示例中的时段进行限定。
请参见图3示意出的估计操作意向概率值原理图,首先收集接入加速器的历史账户触发的历史数据,并根据上述第一种数据清洗处理至第三种数据清洗处理的方式丢弃影响估计准确度的历史数据,将并将进行数据清洗处理后的历史数据确定为训练使用的训练样本,上述影响估计准确度的历史数据包括:历史账户在3天试用期中进行了转移电子货币的付费操作的历史数据、历史账户接入加速器后的第4-10天以优惠方式进行了转移电子货币的付费操作的历史数据、通过加速器为游戏应用进行加速的加速总时长小于30分钟的历史数据。
获取训练样本之后,通过特征引擎对训练样本进行归一化处理和onehot编码处理的数据处理;进而利用数据处理后的训练样本中各历史账户的账户特征数据和各历史账户在各自的非试用时段的转换操作结果的映射关系,对历史训练得到的操作意向预估模型或初始的操作意向预估模型进行训练,得到训练后的操作意向预估模型,该操作意向预估模型是以xgboost作为分类器的模型,具体细节可参照上述内容,此处不再重复叙述。
得到训练后的操作意向预估模型之后,获取待测试账户接入加速器后触发的数据,从应用数据中提取待预测账户的账户特征数据,通过特征引擎提取的账户特征数据包括待预测账户的属性特征数据和待预测账户在3天试用期中的行为特征数据;进而将待预测账户的账户特征数据,输入训练后的操作意向预估模型,得到训练后的操作意向预估模型输出的待预测账户在非试用时段进行上述付费操作的操作意向概率值,该操作意向概率值可以是一个0至1之间的数值。
在根据估计结果进行业务操作时,若待预测账户的意向概率阈值为0.6,估计的待预测账户的操作意向概率值为0.45,则向该待预测账户发送电子货币优惠券,以使该待预测账户通过电子货币优惠券以优惠支付的方式针对加速器进行付费操作。
本示例中的账户特征数据,具体可以包括如下多项数据。
(一)账户特征数据中的行为特征数据包括如下项数据:
1、账户在试用时段中通过加速器为游戏应用进行加速的操作的目标行为操作信息,具体包括如下几项数据:
(1)账户在试用时段中通过加速器为游戏应用进行加速后,游戏应用的网络效率变化信息,具体包括:
3天试用期的平均网络延迟:将3天试用期内游戏应用中通过加速器创建的网络传输通道的网络延迟的平均值,确定为上述网络效率变化信息。
第2天和第1天的网络延迟比:游戏应用在3天试用期的第2天的平均网络延迟与游戏应用在3天试用期的第1天的平均网络延迟的比值。
第3天和第2天的网络延迟比:游戏应用在3天试用期的第3天的平均网络延迟与游戏应用在3天试用期的第2天的平均网络延迟的比值。
(2)账户在试用时段中通过加速器为游戏应用进行加速的加速时长信息,具体包括:
3天试用期的加速总时长:账户在3天试用期内通过加速器为游戏应用进行加速的操作的加速的总时长。
工作时段的加速总时长:账户在3天试用期内早上7:00至晚上6:00的时间段,通过加速器为游戏应用进行加速的总时长。
文娱时段的加速总时长:账户在3天试用期内晚上18:00至晚上23:00的时间段,通过加速器为游戏应用进行加速的总时长。
睡眠时段的加速总时长:账户在3天试用期内晚上23:00-24:00以及0:00至7:00的时间段,通过加速器为游戏应用进行加速的总时长。
第2天和第1天的加速时长比:账户在3天试用期的第2天的加速总时长,与3天试用期的第2天的加速总时长的比值。
第3天和第2天的加速时长比:账户在3天试用期的第3天的加速总时长,与3天试用期的第3天的加速总时长的比值。
(3)账户在试用时段中的加速成功率:账户在3天试用期的加速成功的次数与加速总次数的比值。
2、账户在试用时段中首次接入加速器的首次接入信息,具体包括:
(1)新入日类型:账户首次接入加速器的具体时间所属日期的日期类型(是否属于工作日)。
(2)新入渠道:账户首次接入加速器对应的加速器推广链接,即账户是通过哪个平台创建的加速器推广链接接入加速器的。
(3)首次接入环境:账户第一次接入加速器使用的设备是否是网吧中的设备。
3、账户在试用时段中的网络环境信息,具体包括:
(1)账户在试用时段接入加速器使用的设备的设备信息,具体包括:
设备总数量:账户在3天试用期接入加速器使用的设备的总数量。
异常设备占比:账户在3天试用期内接入加速器使用的异常设备的数量与账户在3天试用期内接入加速器使用的设备的总数量的比值。
(2)账户在3天试用期中接入加速器最多的地理区域:账户在3天免费期中接入加速器使用的设备的ip地址对应的省份中,接入次数最多的省份。
(3)账户在3天试用期中使用的流量的网络运营商的信息:账户3天试用期中接入网络使用的流量最多的网络运营商的信息。
4、账户在试用时段中接入的游戏应用的游戏接入信息,具体包括:
(1)接入游戏应用的总数量:账户在3天试用期中接入的游戏应用的总数量。
(2)接入的外服游戏应用的总数量:账户在3天试用期中接入的通过国外服务器服务的游戏应用的总数量。
5、接入其它加速器的接入信息:账户在3天试用期中接入上述加速器外的其它加速器的总数量或总时长。
(二)账户特征数据中的属性特征数据包括如下项数据:
1、QQ账户的账户设置信息,具体包括:
性别:用户通过QQ账户向QQ应用上报的性别,可以包括男性、女性、未知等。
年龄:用户通过QQ账户向QQ应用上报的年龄。
2、QQ账户的创建时长信息:QQ账户创建的时长,单位可以为天、月或年等。
3、QQ账户的账户等级信息:QQ账户在数据层面的一个连续指。
4、QQ账户的群组信息,具体包括:
参与群数量:QQ账户在对应的应用中加入的群组的总数量。
自建群数量:QQ账户在对应的应用中历史创建的群组的总数量。
5、QQ账户的网络使用程度,具体包括:
月登陆总时长:QQ账户在当前时刻所属的月份中保持在线的时长,单位可以为秒。
月登陆总天数:QQ账户在当前时刻所属的月份中保持在线的总天数。
本申请实施示例中,利用历史账户的账户特征数据和非试用时段中是否进行转换操作的转换操作结果的关联度,能够自动基于待预测账户的账户特征数据,估计待预测账户在非试用时段进行转换操作的操作意向概率值,且能根据估计出的操作意向概率值针对待预测账户进行业务处理,此过程中提升了估计账户在非试用时段针对目标行为进行转换操作的效率,且估计过程中不用依赖于人员的经验,减少了由于人员经验不足而导致的估计结果不准确的情况,进而提升了估计出的操作意向概率值的准确度。
请参照图4,基于同一发明构思,本申请实施例提供一种业务处理装置400,包括:
特征提取单元401,用于获取待预测账户的账户特征数据,所述账户特征数据包括上述待预测账户的属性特征数据和上述待预测账户在目标行为的试用时段中行为特征数据,上述属性特征数据用于表征上述待预测账户的电子资源的持有量估计值,上述行为特征数据表征上述待预测账户对上述目标行为的偏好程度,上述目标行为包括在非试用时段中进行转移电子资源的转换操作后可使用的操作,上述非试用时段为上述试用时段结束之后的时段;
操作意向预测单元402,用于利用历史数据中,各个历史账户的账户特征数据和各个历史账户在各自的非试用时段中的转换操作结果的关联度,基于上述待预测账户的账户特征数据,估计上述待预测账户在非试用时段中进行转换操作的操作意向概率值,其中,上述转换操作结果包括是否进行上述转换操作的结果,每个历史账户的账户特征数据包括历史账户的属性特征数据和历史账户在各自的试用时段中的行为特征数据;
业务处理单元403,用于根据上述待预测账户在非试用时段进行转换操作的操作意向概率值,针对上述待预测账户进行业务处理。
作为一种实施例,操作意向预测单元402具体用于::
采用已训练的操作意向预估模型,输入上述待预测账户的账户特征数据,并获得上述操作意向预估模型输出的上述待预测账户在非试用时段进行上述转换操作的操作意向概率值,上述操作意向预估模型是基于集成学习方法,采用各个历史账户的账户特征数据和各个历史账户在各自的非试用时段是否进行上述转换操作的操作数据作为训练样本训练得到的,上述已训练的操作意向预估模型包括多个分类器和一个决策器,其中:
各分类器分别根据上述待预测账户的账户特征数据进行判定并输出第一分类结果,上述第一分类结果用于指示上述账户特征数据与非试用时段的转换操作结果的关联度;
上述决策器根据各分类器输出的第一分类结果,获得上述待预测账户在非试用时段进行上述转换操作的操作意向概率值。
作为一种实施例,操作意向预测单元402还用于通过如下方式得到上述已训练的操作意向预估模型:
提取各训练样本中历史账户的账户特征数据以及历史账户在非试用时段是否进行转换操作的操作数据;
根据各训练样本中历史账户在非试用时段是否进行上述转换操作的操作数据,确定各训练样本的第二分类结果,上述第二分类结果用于指示各历史账户在各自的非试用时段是否进行上述转换操作的操作结果;
利用各训练样本中历史账户的账户特征数据和第二分类结果的映射关系,调整历史训练得到的操作意向预估模型或者初始的操作意向预估模型,得到上述已训练的操作意向预估模型。
作为一种实施例,操作意向预测单元402还用于对上述历史数据进行如下至少一种数据处理,将进行数据处理后的历史数据确定为上述训练样本:
丢弃试用时段存在上述转换操作的历史数据;
丢弃非试用时段存在通过设定资源转换方式进行上述转换操作的历史数据;
丢弃目标行为的总时长小于时长阈值的历史数据。
作为一种实施例,上述行为特征数据包括如下至少一种数据:
账户在试用时段中进行上述目标行为的目标行为操作信息;
账户在试用时段中接入实现目标行为的目标应用的目标应用接入信息;
账户在试用时段中的网络环境信息;
账户在试用时段中的网络使用程度。
作为一种实施例,实现目标行为的目标应用包括加速器,目标行为包括通过上述加速器为游戏应用加速的操作,上述行为特征数据还包括如下至少一种数据:
账户在试用时段中接入上述游戏应用的游戏接入信息;
账户在试用时段中接入同类应用的接入信息,上述同类应用包括账户接入上述加速器外的其他加速器。
作为一种实施例,上述目标行为操作信息包括如下至少一种信息:
账户在试用时段中通过上述加速器为上述游戏应用进行加速后,上述游戏应用的网络效率变化信息;
账户在试用时段中通过上述加速器为上述游戏应用进行加速的加速时长信息;
账户在试用时段中通过上述加速器为上述游戏应用进行加速的加速成功率。
作为一种实施例,账户在试用时段中通过上述加速器为上述游戏应用进行加速后,上述游戏应用的网络效率变化信息包括如下至少一种信息:
账户在试用时段中通过上述加速器为上述游戏应用进行加速后,上述游戏应用的平均网络延迟,上述平均网络延迟包括上述游戏应用中通过上述加速器创建的网络传输通道的网络延迟的平均值;
账户在第一子时段中游戏应用的第二平均网络延迟和第二子时段中游戏应用的第二平均网络延迟的比值,其中上述平均网络延迟包括上述游戏应用中通过上述加速器创建的网络传输通道的网络延迟的平均值,上述第一子时段为上述试用时段的子时段,上述第二子时段为上述试用时段的子时段,且上述第一子时段为上述第二子时段结束之后的相邻时段。
作为一种实施例于,账户在试用时段中通过上述加速器为上述游戏应用进行加速的加速时长信息,至少包括如下一种信息:
账户在试用时段中通过上述加速器为上述游戏应用进行加速的加速总时长;
账户在第三子时段中的加速总时长,上述第三子时段为上述试用时段的子时段;
账户在第四子时段中的加速总时长与第五子时段中的加速总时长的比值,其中上述第四子时段为上述试用时段的子时段,上述第五子时段为上述试用时段的子时段,且上述第四子时段为上述第五子时段结束之后的相邻时段。
作为一种实施例,上述账户包括登录实现上述目标行为的目标应用的第三方账户,上述属性特征数据包括如下至少一种数据:
上述第三方账户的账户设置信息;
上述第三方账户的创建时长信息;
上述第三方账户的账户等级信息。
作为一种实施例,上述属性特征数据还包括如下用于表征上述第三方账户的网络偏好程度的至少一个数据:
上述第三方账户在与上述第三方账户对应的应用中的群组信息;
上述第三方账户在指定时段接入与上述第三方账户对应的应用的账户接入信息。
作为一种实施例,业务处理单元403具体用于:
若上述待预测账户在非试用时段进行转换操作的操作意向概率值小于意向概率阈值,则向上述待预测账户发送设定电子媒体信息,以使上述待预测账户通过设定资源转换方式进行上述转换操作。
作为一种实施例,图4中的装置可以用于实现前文论述的任意一种业务处理方法。
该业务处理装置400作为硬件实体的一个实例如图5所示的计算机设备,该计算机设备包括处理器501、存储介质502以及至少一个外部通信接口503;上述处理器501、存储介质502以及外部通信接口503均通过总线504连接。
存储介质502中存储有计算机程序;
处理器501执行该计算机程序时实现前文论述的移动设备的导航方法。
图5中是以一个处理器501为例,但是实际上不限制处理器501的数量。
其中,存储介质502可以是易失性存储介质(volatile memory),例如随机存取存储介质(random-access memory,RAM);存储介质502也可以是非易失性存储介质(non-volatile memory),例如只读存储介质,快闪存储介质(flash memory),硬盘(hard diskdrive,HDD)或固态硬盘(solid-state drive,SSD)、或者存储介质502是能够用于携带或存储具有指令或数据结构形式的期望的程序代码并能够由计算机存取的任何其它介质,但不限于此。存储介质502可以是上述存储介质的组合。
基于同一技术构思,本申请实施例还一种计算机可读存储介质,该计算机可读存储介质存储有计算机指令,当上述计算机指令在计算机上运行时,使得计算机执行如前文论述的业务处理方法。
本领域内的技术人员应明白,本申请的实施例可提供为方法、系统、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
显然,本领域的技术人员可以对本申请进行各种改动和变型而不脱离本申请的精神和范围。这样,倘若本申请的这些修改和变型属于本申请权利要求及其等同技术的范围之内,则本申请也意图包含这些改动和变型在内。
Claims (10)
1.一种业务处理方法,其特征在于,包括:
获取待预测账户的账户特征数据,所述账户特征数据包括所述待预测账户的属性特征数据和所述待预测账户在目标行为的试用时段中行为特征数据,所述属性特征数据用于表征所述待预测账户的电子资源的持有量估计值,所述行为特征数据表征所述待预测账户对所述目标行为的偏好程度,所述目标行为包括在非试用时段中进行转移电子资源的转换操作后可使用的操作,所述非试用时段为所述试用时段结束之后的时段;
利用历史数据中,各个历史账户的账户特征数据和各个历史账户在各自的非试用时段中的转换操作结果的关联度,基于所述待预测账户的账户特征数据,估计所述待预测账户在非试用时段中进行转换操作的操作意向概率值,其中,所述转换操作结果包括是否进行所述转换操作的结果,每个历史账户的账户特征数据包括历史账户的属性特征数据和历史账户在各自的试用时段中的行为特征数据;
根据所述待预测账户在非试用时段进行转换操作的操作意向概率值,针对所述待预测账户进行业务处理。
2.如权利要求1所述的方法,其特征在于,所述利用历史数据中,各个历史账户的账户特征数据和各个历史账户在各自的非试用时段中的转换操作结果的关联度,基于所述待预测账户的账户特征数据,估计所述待预测账户在非试用时段中进行转换操作的操作意向概率值,具体包括:
采用已训练的操作意向预估模型,输入所述待预测账户的账户特征数据,并获得所述操作意向预估模型输出的所述待预测账户在非试用时段进行所述转换操作的操作意向概率值,所述操作意向预估模型是基于集成学习方法,采用各个历史账户的账户特征数据和各个历史账户在各自的非试用时段是否进行所述转换操作的操作数据作为训练样本训练得到的,所述已训练的操作意向预估模型包括多个分类器和一个决策器,其中:
各分类器分别根据所述待预测账户的账户特征数据进行判定并输出第一分类结果,所述第一分类结果用于指示所述账户特征数据与非试用时段的转换操作结果的关联度;
所述决策器根据各分类器输出的第一分类结果,获得所述待预测账户在非试用时段进行所述转换操作的操作意向概率值。
3.如权利要求2所述的方法,其特征在于,通过如下方式得到所述已训练的操作意向预估模型:
提取各训练样本中历史账户的账户特征数据以及历史账户在非试用时段是否进行转换操作的操作数据;
根据各训练样本中历史账户在非试用时段是否进行所述转换操作的操作数据,确定各训练样本的第二分类结果,所述第二分类结果用于指示各历史账户在各自的非试用时段是否进行所述转换操作的操作结果;
利用各训练样本中历史账户的账户特征数据和第二分类结果的映射关系,调整历史训练得到的操作意向预估模型或者初始的操作意向预估模型,得到所述已训练的操作意向预估模型。
4.如权利要求2所述的方法,其特征在于,还包括:
对所述历史数据进行如下至少一种数据处理,将进行数据处理后的历史数据确定为所述训练样本:
丢弃试用时段存在所述转换操作的历史数据;
丢弃非试用时段存在通过设定资源转换方式进行所述转换操作的历史数据;
丢弃目标行为的总时长小于时长阈值的历史数据。
5.如权利要求1-4任一项所述的方法,其特征在于,所述行为特征数据包括如下至少一种数据:
账户在试用时段中进行所述目标行为的目标行为操作信息;
账户在试用时段中接入实现所述目标行为的目标应用的目标应用接入信息;
账户在试用时段中的网络环境信息;
账户在试用时段中的网络使用程度。
6.如权利要求1-4任一项所述的方法,其特征在于,所述账户包括登录实现所述目标行为的目标应用的第三方账户,所述属性特征数据包括如下至少一种数据:
所述第三方账户的账户设置信息;
所述第三方账户的创建时长信息;
所述第三方账户的账户等级信息。
7.如权利要求1-4任一项所述的方法,其特征在于,所述根据所述待预测账户在非试用时段进行转换操作的操作意向概率值,针对所述待预测账户进行业务处理,包括:
若所述待预测账户在非试用时段进行转换操作的操作意向概率值小于意向概率阈值,则向所述待预测账户发送设定电子媒体信息,以使所述待预测账户通过设定资源转换方式进行所述转换操作。
8.一种业务处理装置,其特征在于,包括:
特征提取单元,用于获取待预测账户的账户特征数据,所述账户特征数据包括所述待预测账户的属性特征数据和所述待预测账户在目标行为的试用时段中行为特征数据,所述属性特征数据用于表征所述待预测账户的电子资源的持有量估计值,所述行为特征数据表征所述待预测账户对所述目标行为的偏好程度,所述目标行为包括在非试用时段中进行转移电子资源的转换操作后可使用的操作,所述非试用时段为所述试用时段结束之后的时段;
操作意向预测单元,用于利用历史数据中,各个历史账户的账户特征数据和各个历史账户在各自的非试用时段中的转换操作结果的关联度,基于所述待预测账户的账户特征数据,估计所述待预测账户在非试用时段中进行转换操作的操作意向概率值,其中,所述转换操作结果包括是否进行所述转换操作的结果,每个历史账户的账户特征数据包括历史账户的属性特征数据和历史账户在各自的试用时段中的行为特征数据;
业务处理单元,用于根据所述待预测账户在非试用时段进行转换操作的操作意向概率值,针对所述待预测账户进行业务处理。
9.一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现权利要求1-7中任一权利要求所述方法的步骤。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机指令,当所述计算机指令在计算机上运行时,使得计算机执行如权利要求1-7中任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010530088.3A CN111686451A (zh) | 2020-06-11 | 2020-06-11 | 一种业务处理方法、装置、设备及计算机存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010530088.3A CN111686451A (zh) | 2020-06-11 | 2020-06-11 | 一种业务处理方法、装置、设备及计算机存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN111686451A true CN111686451A (zh) | 2020-09-22 |
Family
ID=72480358
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010530088.3A Pending CN111686451A (zh) | 2020-06-11 | 2020-06-11 | 一种业务处理方法、装置、设备及计算机存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111686451A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113011884A (zh) * | 2021-01-29 | 2021-06-22 | 腾讯科技(深圳)有限公司 | 账户特征的提取方法、装置、设备及可读存储介质 |
-
2020
- 2020-06-11 CN CN202010530088.3A patent/CN111686451A/zh active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113011884A (zh) * | 2021-01-29 | 2021-06-22 | 腾讯科技(深圳)有限公司 | 账户特征的提取方法、装置、设备及可读存储介质 |
CN113011884B (zh) * | 2021-01-29 | 2023-08-04 | 腾讯科技(深圳)有限公司 | 账户特征的提取方法、装置、设备及可读存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11659050B2 (en) | Discovering signature of electronic social networks | |
CN110033314B (zh) | 广告数据处理方法及装置 | |
Josang et al. | Dirichlet reputation systems | |
US8712952B2 (en) | Method and system for selecting a target with respect to a behavior in a population of communicating entities | |
CN109784959B (zh) | 一种目标用户预测方法、装置、后台服务器及存储介质 | |
CN108014496A (zh) | 游戏记录分析方法 | |
WO2018145586A1 (zh) | 信用评分方法及服务器 | |
CN109118155B (zh) | 一种生成操作模型的方法及装置 | |
CN112580952A (zh) | 用户行为风险预测方法、装置、电子设备及存储介质 | |
CN113011884B (zh) | 账户特征的提取方法、装置、设备及可读存储介质 | |
CN110991789B (zh) | 置信区间的确定方法和装置、存储介质及电子装置 | |
CN111967807A (zh) | 计算机执行的风险事件判别规则的生成方法及装置 | |
CN112214499A (zh) | 图数据处理方法、装置、计算机设备和存储介质 | |
CN107784511A (zh) | 一种用户流失预测方法及装置 | |
CN111686451A (zh) | 一种业务处理方法、装置、设备及计算机存储介质 | |
CN110210885B (zh) | 挖掘潜在客户的方法、装置、设备及可读存储介质 | |
CN112950258B (zh) | 活动分析方法、装置和电子设备 | |
US20220114607A1 (en) | Method, apparatus and computer readable storage medium for data processing | |
CN109859012B (zh) | 基于IaaS的不确定性需求服务预购实例分时共享方法与系统 | |
US20220270126A1 (en) | Reinforcement Learning Method For Incentive Policy Based On Historic Data Trajectory Construction | |
CN113705682B (zh) | 用户行为特征的处理方法及装置 | |
CN112818241B (zh) | 一种内容推广方法、装置、计算机设备和存储介质 | |
CN110020334B (zh) | 一种用户人群扩散方法及装置 | |
CN110689423B (zh) | 一种信用评估的方法及装置 | |
CN115936749A (zh) | 活动信息推送方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |