CN117786478B - 基于多模型的用户活跃度预测方法、系统、设备及介质 - Google Patents

基于多模型的用户活跃度预测方法、系统、设备及介质 Download PDF

Info

Publication number
CN117786478B
CN117786478B CN202311623017.8A CN202311623017A CN117786478B CN 117786478 B CN117786478 B CN 117786478B CN 202311623017 A CN202311623017 A CN 202311623017A CN 117786478 B CN117786478 B CN 117786478B
Authority
CN
China
Prior art keywords
data
user
training
prediction model
users
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202311623017.8A
Other languages
English (en)
Other versions
CN117786478A (zh
Inventor
朱盛
茹吉
项轼辙
罗家胜
曹涛
张灿阳
张旭
胡影超
魏冉
褚坤
王斌
刘哲祺
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Blue Creation Network Technology Co ltd
Original Assignee
Beijing Blue Creation Network Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Blue Creation Network Technology Co ltd filed Critical Beijing Blue Creation Network Technology Co ltd
Priority to CN202311623017.8A priority Critical patent/CN117786478B/zh
Publication of CN117786478A publication Critical patent/CN117786478A/zh
Application granted granted Critical
Publication of CN117786478B publication Critical patent/CN117786478B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了基于多模型的用户活跃度预测方法、系统、设备及介质,涉及活跃度预测技术领域。本发明结合用户综合数据和每日数据有助于提取用户的固有行为特征与每日行为特征对活跃度的影响。用户划分使得多模型聚焦于某类用户,有助于提取相似活跃程度对活跃度的影响。是否登录预测模型作为二分类模型具备高准确率,利用其过滤出预测结果为不登录的非活跃用户,更具准确性。而对于预测结果为登录的用户,再基于登录次数预测模型和对局次数预测模型联合计算预测用户的活跃度。本发明的方案关注用户的行为特征与固有特征,以及发挥了Transformer、二分类模型和回归模型各自的优势,可以有效地提高用户活跃度预测的准确率。

Description

基于多模型的用户活跃度预测方法、系统、设备及介质
技术领域
本发明涉及活跃度预测技术领域,尤其涉及基于多模型的用户活跃度预测方法、系统、设备及介质。
背景技术
游戏用户活跃度通常被用来衡量游戏的受欢迎程度和用户参与程度。高活跃度意味着用户对游戏的兴趣和参与度较高,而低活跃度可能表示用户对游戏失去了兴趣或者参与度较低。活跃的游戏用户对于游戏的发展和成功具有重要的价值。因此,通过预测用户未来的活跃情况,有助于平台提前制定更有效的用户留存策略,提高用户活跃度。
常规的预测方法通常需要手动选择和提取特征。这可能需要领域知识和经验,并且可能导致遗漏重要的特征或引入不必要的特征。另外,常规方法通常受限于内置的模型和算法。如果数据具有特殊的特征或模式,常规方法可能无法很好地适应。
基于深度学习的活跃度预测方法采用回归模型进行预测,并没有考虑到用户之间的关系。事实上,行为相似的用户在活跃程度上是存在某种关联。另外,不同活跃程度的用户的数据分布差异较大,直接使用活跃度预测模型受输入样本影响较大,其准确程度往往不高。因此,单一的预测模型难以在实际应用中进行推广。
发明内容
本发明所要解决的技术问题是针对现有技术的不足,具体针对预测准确度不高的问题,具体提供了基于多模型的用户活跃度预测方法、系统、设备及介质,具体如下:
1)第一方面,本发明提供一种基于多模型的用户活跃度预测方法,具体技术方案如下:
S1,基于所有用户在指定游戏平台上对应的历史活跃度数据,对所有用户进行排序分类;
S2,对每个类别下的用户对应的历史每日数据进行预处理,得到布尔型数据,根据每个类别下每个用户对应的历史每日数据确定每个类别下每个用户对应的综合数据,根据每个类别下所有综合数据以及所有布尔型数据构建第一训练数据集,根据所述第一训练数据集训练二分类预测模型,所述二分类预测模型用于预测用户是否登录;
S3,根据每个用户对应的历史每日数据以及每个用户对应的综合数据构建第二训练集,根据所述第二训练集训练第二预测模型以及第三预测模型,所述第二预测模型用于预测用户登录次数,所述第三预测模型用于预测用户对局次数;
S4,将待预测活跃度的用户对应的历史活跃度、历史每日数据以及综合数据分别输入至所述待预测活跃度的用户对应的类别下的第一预测模型、第二预测模型以及第三预测模型对待预测活跃度的用户进行活跃度预测。
本发明提供的一种基于多模型的用户活跃度预测方法的有益效果如下:
结合用户综合数据和每日数据有助于提取用户的固有行为特征与每日行为特征对活跃度的影响。用户划分使得多模型聚焦于某类用户,有助于提取相似活跃程度对活跃度的影响。是否登录预测模型作为二分类模型具备高准确率,利用其过滤出预测结果为不登录的非活跃用户,更具准确性。而对于预测结果为登录的用户,再基于登录次数预测模型和对局次数预测模型联合计算预测用户的活跃度。本发明的方案关注用户的行为特征与固有特征,以及发挥了Transformer、二分类模型和回归模型各自的优势,可以有效地提高用户活跃度预测的准确率,并辅助运营制定更有效的用户留存策略。
在上述方案的基础上,本发明还可以做如下改进。
进一步,S1之前还包括:
对用户的历史每日数据进行数据清洗,得到清洗后的历史每日数据;
数据清洗包括:
删除注册时间未超过第一阈值的用户的所有历史每日数据;
删除当前时间之前的第一设定时间段内未登录过账号的用户对应的所有历史每日数据,其中,第一设定时间段的最晚时间为当前时间;
删除任意一个用户注册账号至当前并未参与游戏对决的用户对应的所有历史每日数据;
删除所有用户第二设定时间段内的所有历史每日数据,其中,第二设定时间段的最晚时间为当前时间。
进一步,对所有用户进行排序分类具体包括:
按照所有用户的历史活跃数据对应的活跃值,对所有用户进行活跃值降序排列,并对排列后的活跃值进行分区,不同分区对应不同的用户类别。
进一步,根据每个类别下所有综合数据以及所有布尔型数据构建第一训练数据集之后还包括:
对每个第一训练数据集中的历史每日数据对应的布尔型数据进行编码,得到每个布尔型数据对应的第一字典格式数据;
对每个第一训练集中的综合数据进行编码,得到每个综合数据对应的第二字典格式数据并存储;
将所有第一训练数据集对应的第一字典格式数据进行整合,并重新对所有第一字典格式数据对应的历史每日数据进行编码,得到第三字典格式数据并存储。
进一步,根据所述第一训练数据集训练二分类预测模型具体包括:
将所述第一训练数据集整合成多个训练输入对,当前训练输入对包括:当前输入数据、当前输入数据对应的标签以及当前任意一个用户对应的综合数据,所述当前输入数据为连续预设天数内的任意一个用户对应的历史每日数据对应的布尔型数据以及连续预设天数内的任意一个用户对应的综合数据,所述当前输入数据对应的标签为当前连续预设天数的下一天对应的登录次数;
第二训练输入对包括:第二输入数据、第二输入数据对应的标签以及第二任意一个用户对应的综合数据,第二输入数据中的第一个数据为所述当前输入数据中的第二个数据,所述第二输入数据中的最后一个为所述当前连续预设天数的下一天对应的历史每日数据,所述第二输入数据对应的标签为当前连续预设天数的下两天对应的登录次数;
根据多个训练输入对以及损失函数进行二分类预测模型的训练。
进一步,将待预测活跃度的用户对应的历史活跃度、历史每日数据以及综合数据分别输入至所述待预测活跃度的用户对应的类别下的第一预测模型、第二预测模型以及第三预测模型对待预测活跃度的用户进行活跃度预测具体包括:
确定待预测活跃度的用户的历史活跃度,基于所述历史活跃度确定所述待预测活跃度的用户的类别;
根据所述待预测活跃度的用于的类别,将所述待预测活跃度的用户对应的历史活跃度、历史每日数据以及综合数据分别输入至所述所述待预测活跃度的用于的类别对应的第一预测模型、第二预测模型以及第三预测模型中,得到待预测活跃度的用户的当前活跃度。
2)第二方面,本发明还提供一种基于多模型的用户活跃度预测系统,具体技术方案如下:
分类模块用于:基于所有用户在指定游戏平台上对应的历史活跃度数据,对所有用户进行排序分类;
第一训练模块用于:对每个类别下的用户对应的历史每日数据进行预处理,得到布尔型数据,根据每个类别下每个用户对应的历史每日数据确定每个类别下每个用户对应的综合数据,根据每个类别下所有综合数据以及所有布尔型数据构建第一训练数据集,根据所述第一训练数据集训练二分类预测模型,所述二分类预测模型用于预测用户是否登录;
第二训练模块用于:根据每个用户对应的历史每日数据以及每个用户对应的综合数据构建第二训练集,根据所述第二训练集训练第二预测模型以及第三预测模型,所述第二预测模型用于预测用户登录次数,所述第三预测模型用于预测用户对局次数;
预测模块用于:将待预测活跃度的用户对应的历史活跃度、历史每日数据以及综合数据分别输入至所述待预测活跃度的用户对应的类别下的第一预测模型、第二预测模型以及第三预测模型对待预测活跃度的用户进行活跃度预测。
在上述方案的基础上,本发明还可以做如下改进。
进一步,还包括:
剔除模块用于:对用户的历史每日数据进行数据清洗,得到清洗后的历史每日数据;
数据清洗包括:
删除注册时间未超过第一阈值的用户的所有历史每日数据;
删除当前时间之前的第一设定时间段内未登录过账号的用户对应的所有历史每日数据,其中,第一设定时间段的最晚时间为当前时间;
删除任意一个用户注册账号至当前并未参与游戏对决的用户对应的所有历史每日数据;
删除所有用户第二设定时间段内的所有历史每日数据,其中,第二设定时间段的最晚时间为当前时间。
进一步,对所有用户进行排序分类具体包括:
按照所有用户的历史活跃数据对应的活跃值,对所有用户进行活跃值降序排列,并对排列后的活跃值进行分区,不同分区对应不同的用户类别。
进一步,根据每个类别下所有综合数据以及所有布尔型数据构建第一训练数据集之后还包括:
对每个第一训练数据集中的历史每日数据对应的布尔型数据进行编码,得到每个布尔型数据对应的第一字典格式数据;
对每个第一训练集中的综合数据进行编码,得到每个综合数据对应的第二字典格式数据并存储
将所有第一训练数据集对应的第一字典格式数据进行整合,并重新对所有第一字典格式数据对应的历史每日数据进行编码,得到第三字典格式数据并存储。
进一步,根据所述第一训练数据集训练二分类预测模型具体包括:
将所述第一训练数据集整合成多个训练输入对,当前训练输入对包括:当前输入数据、当前输入数据对应的标签以及当前任意一个用户对应的综合数据,所述当前输入数据为连续预设天数内的任意一个用户对应的历史每日数据对应的布尔型数据以及连续预设天数内的任意一个用户对应的综合数据,所述当前输入数据对应的标签为当前连续预设天数的下一天对应的登录次数;
第二训练输入对包括:第二输入数据、第二输入数据对应的标签以及第二任意一个用户对应的综合数据,第二输入数据中的第一个数据为所述当前输入数据中的第二个数据,所述第二输入数据中的最后一个为所述当前连续预设天数的下一天对应的历史每日数据,所述第二输入数据对应的标签为当前连续预设天数的下两天对应的登录次数;
根据多个训练输入对以及损失函数进行二分类预测模型的训练。
进一步,将待预测活跃度的用户对应的历史活跃度、历史每日数据以及综合数据分别输入至所述待预测活跃度的用户对应的类别下的第一预测模型、第二预测模型以及第三预测模型对待预测活跃度的用户进行活跃度预测具体包括:
确定待预测活跃度的用户的历史活跃度,基于所述历史活跃度确定所述待预测活跃度的用户的类别;
根据所述待预测活跃度的用于的类别,将所述待预测活跃度的用户对应的历史活跃度、历史每日数据以及综合数据分别输入至所述所述待预测活跃度的用于的类别对应的第一预测模型、第二预测模型以及第三预测模型中,得到待预测活跃度的用户的当前活跃度。
3)第三方面,本发明还提供一种计算机设备,所述计算机设备包括处理器,所述处理器与存储器耦合,所述存储器中存储有至少一条计算机程序,所述至少一条计算机程序由所述处理器加载并执行,以使所述计算机设备实现如上任一项方法。
4)第四方面,本发明还提供一种计算机可读存储介质,所述计算机可读存储介质中存储有至少一条计算机程序,所述至少一条计算机程序由处理器加载并执行,以使计算机实现如上任一项方法。
需要说明的是,本发明的第二方面至第四方面的技术方案及对应的可能的实现方式所取得的有益效果,可以参见上述对第一方面及其对应的可能的实现方式的技术效果,此处不再赘述。
附图说明
通过阅读参照以下附图所作的对非限制性实施例的详细描述,本发明的其它特征、目的和优点将会变得更明显:
图1为本发明实施例的一种基于多模型的用户活跃度预测方法的流程示意图;
图2为本发明实施例的一种基于多模型的用户活跃度预测系统的结构框架图;
图3为计算机设备的结构示意图;
图4为从游戏平台采集用户数据流程示意图;
图5为游戏平台用户特征数据示意图;
图6为每日布尔型数据示意图;
图7为多模型训练流程示意图;
图8为预测流程示意图;
图9为实施场景示意图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面将结合附图对本发明实施方式作进一步地详细描述。
如图1、图4以及图7所示,本发明实施例的一种基于多模型的用户活跃度预测方法,包括如下步骤:
S1,基于所有用户在指定游戏平台上对应的历史活跃度数据,对所有用户进行排序分类;
S2,对每个类别下的用户对应的历史每日数据进行预处理,得到布尔型数据,根据每个类别下每个用户对应的历史每日数据确定每个类别下每个用户对应的综合数据,根据每个类别下所有综合数据以及所有布尔型数据构建第一训练数据集,根据所述第一训练数据集训练二分类预测模型,所述二分类预测模型用于预测用户是否登录;
S3,根据每个用户对应的历史每日数据以及每个用户对应的综合数据构建第二训练集,根据所述第二训练集训练第二预测模型以及第三预测模型,所述第二预测模型用于预测用户登录次数,所述第三预测模型用于预测用户对局次数;
S4,将待预测活跃度的用户对应的历史活跃度、历史每日数据以及综合数据分别输入至所述待预测活跃度的用户对应的类别下的第一预测模型、第二预测模型以及第三预测模型对待预测活跃度的用户进行活跃度预测。
本发明提供的一种基于多模型的用户活跃度预测方法的有益效果如下:
结合用户综合数据和每日数据有助于提取用户的固有行为特征与每日行为特征对活跃度的影响。用户划分使得多模型聚焦于某类用户,有助于提取相似活跃程度对活跃度的影响。是否登录预测模型作为二分类模型具备高准确率,利用其过滤出预测结果为不登录的非活跃用户,更具准确性。而对于预测结果为登录的用户,再基于登录次数预测模型和对局次数预测模型联合计算预测用户的活跃度。本发明的方案关注用户的行为特征与固有特征,以及发挥了Transformer,二分类模型和回归模型各自的优势,可以有效地提高用户活跃度预测的准确率,并辅助运营制定更有效的用户留存策略。
S1,基于所有用户在指定游戏平台上对应的历史活跃度数据,对所有用户进行排序分类。其中:
在S1之前还包括,对所有用户的历史每日数据进行清洗,清洗方式包括但不仅限于以下几种:
1.删除从注册到现在总天数不足一个月的用户的每日数据。
2.删除最近一个月从未登陆过或从未对局过的用户的每日数据。
3.最近一个月对局过的用户,删除所述用户一个月以前的每日数据,即只保留最近一个月的每日数据。按上述方式进行数据清洗。
本发明专利接下来所涉及的用户和用户数据都是经过数据清洗后,剩余的用户和用户数据。
对所有用户进行排序分类的过程为:
首先需先明确,用户的历史每日数据指的是基于运营平台认定的对用户未来活跃度程度存在的影响的用户行为数据。
如图5所示,数据清洗后剩余所有用户的数据为Dall={D1,D2,...,Du,...,DU}。U表示用户总数,Du表示所述用户中第u个用户过去一个月内的每日数据。M是过去一个月的总天数,/>表示第u个用户过去第m天的每日数据。
包括第u个用户的登录次数/>购买次数/>周几登录/>对局次数/>逃跑次数/>胜利次数/>以及失败次数/>数据组成。
计算用户综合数据Fall={F1,F2,...,Fu,...,FU}。第u个用户的综合数据Fu由第u个用户的每日数据计算而来。具体地,/> 表示第u个用户的登陆天数频率,/> 为指示函数,条件满足时取值为1,否则为0。/>表示第u个用户的登陆次数频率, 表示第u个用户的对局频率,/> 表示第u个用户的胜率/> 表示第u个用户的购买频率,/> 所述用户综合数据是用户阶段性的数据,其值更加稳定,作为用户固有行为数据对活跃度的变化趋势存在影响。
如图8所示,计算用户历史活跃度数据[a1,a2,...,au,...,aU]。au表示第u个用户的历史活跃度。所述用户历史活跃度是用户在过去一个天内每日活跃度的总和的均值,和每日活跃度通过每日登录次数和每日对局次数采用均值加权计算而得。即
基于所述用户历史活跃度数据从高至低进行排序,得到历史活跃度数据排序结果并基于所述排序结果计算历史活跃度的三等分临界值A1,A2,其中下标指的是划分三等分点的位置,U/3向下取整。例如,总用户数为9,U/3向下取整就是9/3=3。
由用户中历史活跃度大于A1的用户的每日数据和综合数据分别组成和/>H为历史活跃度大于A1的用户总数。由所述用户中历史活跃度介于A1和A2之间的用户的每日数据和综合数据分别组成和/>N为历史活跃度介于A1和A2之间的用户总数。由所述用户中历史活跃度小于A2的用户的每日数据和综合数据分别组成/>和/>L为历史活跃度小于A2的用户总数。
S2,对每个类别下的用户对应的历史每日数据进行预处理,得到布尔型数据,根据每个类别下每个用户对应的历史每日数据确定每个类别下每个用户对应的综合数据,根据每个类别下所有综合数据以及所有布尔型数据构建第一训练数据集,根据所述第一训练数据集训练二分类预测模型,所述二分类预测模型用于预测用户是否登录。其中:
预处理的过程为:
如图6所示,将所述类别用户的每日数据预处理为每日布尔型数据。以所述高活跃度类别用户的每日数据为例预处理为每日布尔型数据其中所述高活跃度用户中第h个用户的每日布尔型数据 表示所述高活跃度用户中第h个用户过去第m天的每日布尔型数据。/> 表示所述高活跃度用户中第h个用户过去第m天是否登陆,/> 表示所述高活跃度用户中第h个用户过去第m天是否购买,/> 表示所述高活跃度用户中第h个用户过去第m天是周几,/> 表示所述高活跃度用户中第h个用户过去第m天是否对局;/>表示所述高活跃度用户中第h个用户过去第m天是否逃跑过, 表示所述高活跃度用户中第h个用户过去第m天是否胜利过,/> 表示所述高活跃度用户中第h个用户过去第m天是否逃跑过,/>按上述方式依次预处理得到普通活跃度类别用户的每日布尔型数据/>和低活跃度类别用户的每日布尔型数据
根据每个类别下每个用户对应的历史每日数据确定每个类别下每个用户对应的综合数据的过程可参考上文中的计算用户综合数据Fall的具体过程,在此不进行赘述。
根据每个类别下所有综合数据以及所有布尔型数据构建第一训练数据集的过程为:
基于类别用户的每日布尔型数据和综合数据构建数据集。以高活跃度类别的用户的每日布尔型数据和综合数据/>为例构建数据集/>
依次从h=1到H依次遍历中第h个用户的每日数据/> 由过去一个月的每日数据组成,即/>从s=1到M-8依次遍历取第h个用户过去一个月中从s到s+6(连续七天)的每日布尔型数据/>和综合数据/>作为一条输入数据,取第s+7天是否登录/>作为这输入数据的标签,以此构建数据集/>同样地,针对普通活跃类别用户和低活跃类别用户分别构建数据集/>和/>
在构建第一训练数据集的过程中可以看出,本方案不同类别对应不同的第一训练数据集,每个类别下的第一训练数据集的构建均采用上文提及的方法进行处理。
根据所述第一训练数据集训练二分类预测模型的具体过程为:
依次针对不同类别数据集和/>构建基于Transformer结构的预测玩家是否登陆二分类模型/>和/>分别采用如下交叉熵损失函数对三个模型依次进行训练直至收敛。
其中,对于Lossh1是从数据集/>中采样训练数据x1以及数据x1对应的标签y1,/>是/>对于输入x1的预测结果。Lossn1和Lossl1同理。
在本方案的另一个实施例中,对于构建好的不同类别下的第一训练数据集进行编码处理,具体过程为:
首先需要鲜明确定,编码的目的是将用户数据转换成便于Transformer模型识别的数据。
编码的原因是原始数据很多数值是重复的,模型无法区分这些值的含义。例如,用1和0表示是否登录,也用1和0表示是否购买。对于不登陆,也不购买的数据会有2个0,模型无法区分这些0的含义。但是编码后,不登陆的值0,而不购买的值为2。模型将会学习到这些不同值的含义。因此编码要求所有的取值不重复,且每个取值的含义不同。
依次对不同类别数据集和/>中的每日布尔型数据进行编码。以数据集/>为例,具体地,对于所述数据集/>将其中的每一条数据中的每日布尔型数据编码成一个字典的数据。其字典值含义和编码转换为:0表示不登录、1表示登录,对任意的是否登陆值/>编码后值依然为/>2表示不购买、3表示购买,对任意的是否购买值编码后值为/>4~10表示周几,对任意的周几/>编码后值为/>11表示没对局过,12表示对局过,对任意的是否对局值/>编码后值为/>13表示没逃跑过,14表示逃跑过,对任意的是否逃跑值/>编码后值为/>15表示没胜过,16表示胜过,对任意的是否胜过值/>编码后值为/>17表示没失败过,18表示失败过,对任意的是否失败过值/>编码后值为/>
依次对不同类别数据集和/>中的综合数据进行编码。以数据集为例,将所述数据集/>中的每一条数据中的综合数据编码成一个字典格式数据,其字典值含义和编码转换为:0~100表示登录频率(向下取值,例如登录频率为86.4%,使用86表示),对任意的登录频率值/>编码后值依然为/>101~201表示登录次数频率,对任意的登录次数频率值/>编码后值为/>202~302表示对局频率,对任意的对局次数频率值/>编码后值为/>303~403表示游戏胜率,对任意的游戏胜率值/>编码后值为/>404~504表示购买率,对任意的购买率值/>编码后值为/>最终,所述数据集/>中的每条数据转换为可供模型输入的字典格式数据,其形式为:[[过去第i天字典格式每日布尔型数据],[过去第i+1天字典格式每日布尔型数据],[过去第i+2天字典格式每日布尔型数据],[过去第i+3天字典格式每日布尔型数据],[过去第i+4天字典格式每日布尔型数据],[过去第i+5天字典格式每日布尔型数据],[过去第i+6天字典格式每日布尔型数据],[字典格式的综合数据],[过去第i+7天是否登录]]。
依次对不同类别数据集和/>中用户的所述字典格式数据中的每日数据进行位置编码。由于每条所述字典格式数据中包含过去连续7天字典格式的每日数据,这些数据存在时序性关系。为了在模型输入中体现这一关系,将位置编码与输入嵌入编码相加,得到带有位置编码信息的模型输入。采用以下公式计算位置编码:
其中,pos是位置的索引,i是位置编码向量中的维度,dmodel是Transformer模型的嵌入维度。通过这种方式,位置编码向量可以捕捉到不同时间数据之间的相对关系。
S3,根据每个用户对应的历史每日数据以及每个用户对应的综合数据构建第二训练集,根据所述第二训练集训练第二预测模型以及第三预测模型,所述第二预测模型用于预测用户登录次数,所述第三预测模型用于预测用户对局次数。其中:
构建不同类别下的第二训练集的过程为:
基于所述类别用户的每日数据和综合数据构建数据集。以所述高活跃度类别的用户的每日数据和综合数据/>为例构建数据集/>具体地,依次从h=1到H依次遍历Dhigh中第h个用户的每日数据/> 由过去一个月的每日数据组成,即/>从s=1到M-8依次遍历取第h个用户过去一个月中从s到s+6(连续七天)的每日布尔型数据和综合数据/>作为一条输入数据,取第s+7天登录次数/>作为这输入数据的标签,以此构建数据集/>同样地,针对普通活跃类别用户和低活跃类别用户分别构建数据集/>和/>
根据构建好的数据集和/>构建玩家登录次数模型和/>采用以下损失函数分别训练预测玩家登录次数模型,直至收敛。
其中,对于Lossh2是从数据集/>中采样训练数据x4以及数据x4对应的标签y4,/>是/>对于输入x4的预测结果。Lossn2和Lossl2同理。
在本方案的另一个实施例中,构建好的数据集和/>后,可以进行编码处理,将编码处理后的数据集/>和/>进行第二预测模型的训练,具体过程为:/>
依次对不同类别数据集和/>中每个用户的每日数据进行编码。以/>为例,将其中的每一条数据中的每日数据编码成一个字典的数据,其字典值含义和编码转换为:0~60表示登录次数,对任意的登陆次数/>编码后值依然为/>61~161表示购买次数,对任意的购买次数值/>编码后值为/>162~168分别表示周一至周日,对任意的周几/>编码后值为/>169~468表示对局次数,对任意的对局次数编码后值为/>469~529表示逃跑次数,对任意的逃跑次数/>编码后值为530~829表示胜利次数,对任意的胜利次数/>编码后值为/>830~1129表示失败次数,对任意的失败次数/>编码后值为
依次对不同类别数据集 和/>中每个用户的综合数据字典编码方式与数据集S1中的综合数据字典编码方式一致,本说明书对此不复赘述。最终,所述数据集S2中的每条数据转换为可供预测模型输入的字典格式数据,其形式为:[[过去第i天字典格式每日数据],[过去第i+1天字典格式每日数据],[过去第i+2天字典格式每日数据],[过去第i+3天字典格式每日数据],[过去第i+4天字典格式每日数据],[过去第i+5天字典格式每日数据],[过去第i+6天字典格式每日数据],[字典格式的综合数据],[过去第i+7天登录次数]]。
采用上文中对于构建好的不同类别下的第一训练数据集进行编码处理方式,分别对所述数据集和/>中的用户的每日数据进行位置编码,将编码处理后的数据集/>和/>作为数据集/>和/>进行第二预测模型的训练。
构建不同类别下的第三训练集的过程为:
分别将数据集和/>中的每一条数据的第s+7天登录次数/>标签替换为第s+7天对局次数/>标签。从而得到预测不同类别用户对局次数模型的数据集/>和/>
分别对数据集和/>构建玩家对局次数模型/> 采用以下损失函数分别训练预测玩家对局次数模型,直至收敛。
/>
其中,对于Lossh3是从数据集/>中采样训练数据x7以及数据x7对应的登陆次数标签y7,/>是/>对于输入x7的预测结果。Lossn3和Lossl3同理。
S4,将待预测活跃度的用户对应的历史活跃度与历史每日数据分别输入至第一预测模型、第二预测模型以及第三预测模型对待预测活跃度的用户进行活跃度预测。其中:
如图9所示,优先确定待预测活跃度的用户对应类别,具体过程如下:
根据待预测用户的历史数据,计算历史活跃度a'。所述用户历史活跃度是用户在过去一个月内内每日活跃度的总和的均值。所述每日活跃度通过每日登录次数和每日对局次数采用均值加权计算而得。
判断待预测用户历史活跃度a'与A1,A2的大小关系。若a'大于A1,则将所述待预测用户归纳至高活跃用户类别;若a'小于A2,则将所述待预测用户归纳至低活跃用户类别;否则,则将所述待预测用户归纳至普通活跃用户类别。
通过第一预测模型、第二预测模型以及第三预测模型对待预测活跃度的用户进行活跃度预测的过程包括:
将待预测用户的每日布尔型数据和综合数据按照上文中提及的编码方式进行编码处理得到第一预测模型、第二预测模型以及第三预测模型的输入数据。
例如:将待预测用户的每日布尔型数据和综合数据按“对于构建好的不同类别下的第一训练数据集进行编码处理”的方式编码成模型输入数据x1,将待预测用户的每日数据和综合数据按“构建好的数据集和/>后,可以进行编码处理”的方式编码成模型输入数据x2。将所述输入数据x1输入至待预测用户所述类别对应的是否登录预测模型进行预测。若预测结果值/>表示预测该用户明天不登录,则所述待预测用户的活跃度预测结果0,预测过程结束。否则,预测结果值/>表示预测该用户未来会登录。将所述输入数据x2输入至待预测用户所述类别对应的登录次数预测模型和对局次数预测模型,得到登录次数预测结果/>和对局次数预测结果/>所述待预测用户的活跃度预测结果为/>根据该结果,可以确定出待预测活跃度的用户为高活跃度用户还是低活跃度用户,根据确定出的结果进行适当优惠或推荐信息的发放。
综上,本方案能够达到的效果为:
(1)在本申请中,将用户的数据划分为每日数据和综合数据,每日数据包含多种影响用户活跃度的每日行为特征,而综合数据体现了用户固有的行为特征。将两类特征作为多模型的输入将有利于模型挖掘出每日行为特征与固有行为特征之间联系。例如,如果两个用户的固有特征相似,那么这两个用户的行为特征也可能存在某种相关性,反之,亦然。模型将能更加准确的识别这两个用户的活跃趋势。
(2)在本申请中,按等分将用户预划分为高活跃用户、普通活跃用户和低活跃用户三类,并按划分后的类别分别训练多模型。这有利于多模型关注于某一类用户。例如,基于高活跃度的用户数据训练的多模型,只用于预测高活跃用户未来的活跃情况。有利于多模型将注意力集中于高活跃度用户的行为特征上,而排除了普通、低活跃度用户的行为特征对所述模型的影响,能显著地提供多模型预测的准确率。
(3)在本申请中,使用多模型思想,分别训练是否登录预测模型、对局次数预测模型和登录次数预测模型。是否登录预测模型是二分类模型,二分类模型的学习难度更低,准确率更高。因此优先使用是否登录预测模型筛选预测结果为不登录的用户,能提升不登录用户的预测准确率。而是否登录预测模型预测结果为登录的用户,则分别使用登录次数预测模型和对局次数预测模型分别预测并加权计算预测活跃度,这种方式预测的活跃度解释性更强。
进一步,S1之前还包括:
对用户的历史每日数据进行数据清洗,得到清洗后的历史每日数据;
数据清洗包括:
删除注册时间未超过第一阈值的用户的所有历史每日数据;
删除当前时间之前的第一设定时间段内未登录过账号的用户对应的所有历史每日数据,其中,第一设定时间段的最晚时间为当前时间;
删除任意一个用户注册账号至当前并未参与游戏对决的用户对应的所有历史每日数据;
删除所有用户第二设定时间段内的所有历史每日数据,其中,第二设定时间段的最晚时间为当前时间。
进一步,对所有用户进行排序分类具体包括:
按照所有用户的历史活跃数据对应的活跃值,对所有用户进行活跃值降序排列,并对排列后的活跃值进行分区,不同分区对应不同的用户类别。
进一步,根据每个类别下所有综合数据以及所有布尔型数据构建第一训练数据集之后还包括:
对每个第一训练数据集中的历史每日数据对应的布尔型数据进行编码,得到每个布尔型数据对应的第一字典格式数据;
对每个第一训练集中的综合数据进行编码,得到每个综合数据对应的第二字典格式数据并存储
将所有第一训练数据集对应的第一字典格式数据进行整合,并重新对所有第一字典格式数据对应的历史每日数据进行编码,得到第三字典格式数据并存储。
进一步,根据所述第一训练数据集训练二分类预测模型具体包括:
将所述第一训练数据集整合成多个训练输入对,当前训练输入对包括:当前输入数据、当前输入数据对应的标签以及当前任意一个用户对应的综合数据,所述当前输入数据为连续预设天数内的任意一个用户对应的历史每日数据对应的布尔型数据以及连续预设天数内的任意一个用户对应的综合数据,所述当前输入数据对应的标签为当前连续预设天数的下一天对应的登录次数;
第二训练输入对包括:第二输入数据、第二输入数据对应的标签以及第二任意一个用户对应的综合数据,第二输入数据中的第一个数据为所述当前输入数据中的第二个数据,所述第二输入数据中的最后一个为所述当前连续预设天数的下一天对应的历史每日数据,所述第二输入数据对应的标签为当前连续预设天数的下两天对应的登录次数;
根据多个训练输入对以及损失函数进行二分类预测模型的训练。
进一步,将待预测活跃度的用户对应的历史活跃度、历史每日数据以及综合数据分别输入至所述待预测活跃度的用户对应的类别下的第一预测模型、第二预测模型以及第三预测模型对待预测活跃度的用户进行活跃度预测具体包括:
确定待预测活跃度的用户的历史活跃度,基于所述历史活跃度确定所述待预测活跃度的用户的类别;
根据所述待预测活跃度的用于的类别,将所述待预测活跃度的用户对应的历史活跃度、历史每日数据以及综合数据分别输入至所述所述待预测活跃度的用于的类别对应的第一预测模型、第二预测模型以及第三预测模型中,得到待预测活跃度的用户的当前活跃度。
如图2所示,本发明还提供一种基于多模型的用户活跃度预测系统200,具体技术方案如下:
分类模块210用于:基于所有用户在指定游戏平台上对应的历史活跃度数据,对所有用户进行排序分类;
第一训练模块220用于:对每个类别下的用户对应的历史每日数据进行预处理,得到布尔型数据,根据每个类别下每个用户对应的历史每日数据确定每个类别下每个用户对应的综合数据,根据每个类别下所有综合数据以及所有布尔型数据构建第一训练数据集,根据所述第一训练数据集训练二分类预测模型,所述二分类预测模型用于预测用户是否登录;
第二训练模块230用于:根据每个用户对应的历史每日数据以及每个用户对应的综合数据构建第二训练集,根据所述第二训练集训练第二预测模型以及第三预测模型,所述第二预测模型用于预测用户登录次数,所述第三预测模型用于预测用户对局次数;
预测模块240用于:将待预测活跃度的用户对应的历史活跃度、历史每日数据以及综合数据分别输入至所述待预测活跃度的用户对应的类别下的第一预测模型、第二预测模型以及第三预测模型对待预测活跃度的用户进行活跃度预测。
进一步,还包括:
剔除模块用于:对用户的历史每日数据进行数据清洗,得到清洗后的历史每日数据;
数据清洗包括:
删除注册时间未超过第一阈值的用户的所有历史每日数据;
删除当前时间之前的第一设定时间段内未登录过账号的用户对应的所有历史每日数据,其中,第一设定时间段的最晚时间为当前时间;
删除任意一个用户注册账号至当前并未参与游戏对决的用户对应的所有历史每日数据;
删除所有用户第二设定时间段内的所有历史每日数据,其中,第二设定时间段的最晚时间为当前时间。
进一步,对所有用户进行排序分类具体包括:
按照所有用户的历史活跃数据对应的活跃值,对所有用户进行活跃值降序排列,并对排列后的活跃值进行分区,不同分区对应不同的用户类别。
进一步,根据每个类别下所有综合数据以及所有布尔型数据构建第一训练数据集之后还包括:
对每个第一训练数据集中的历史每日数据对应的布尔型数据进行编码,得到每个布尔型数据对应的第一字典格式数据;
对每个第一训练集中的综合数据进行编码,得到每个综合数据对应的第二字典格式数据并存储
将所有第一训练数据集对应的第一字典格式数据进行整合,并重新对所有第一字典格式数据对应的历史每日数据进行编码,得到第三字典格式数据并存储。
进一步,根据所述第一训练数据集训练二分类预测模型具体包括:
将所述第一训练数据集整合成多个训练输入对,当前训练输入对包括:当前输入数据、当前输入数据对应的标签以及当前任意一个用户对应的综合数据,所述当前输入数据为连续预设天数内的任意一个用户对应的历史每日数据对应的布尔型数据以及连续预设天数内的任意一个用户对应的综合数据,所述当前输入数据对应的标签为当前连续预设天数的下一天对应的登录次数;
第二训练输入对包括:第二输入数据、第二输入数据对应的标签以及第二任意一个用户对应的综合数据,第二输入数据中的第一个数据为所述当前输入数据中的第二个数据,所述第二输入数据中的最后一个为所述当前连续预设天数的下一天对应的历史每日数据,所述第二输入数据对应的标签为当前连续预设天数的下两天对应的登录次数;
根据多个训练输入对以及损失函数进行二分类预测模型的训练。
进一步,将待预测活跃度的用户对应的历史活跃度、历史每日数据以及综合数据分别输入至所述待预测活跃度的用户对应的类别下的第一预测模型、第二预测模型以及第三预测模型对待预测活跃度的用户进行活跃度预测具体包括:
确定待预测活跃度的用户的历史活跃度,基于所述历史活跃度确定所述待预测活跃度的用户的类别;
根据所述待预测活跃度的用于的类别,将所述待预测活跃度的用户对应的历史活跃度、历史每日数据以及综合数据分别输入至所述所述待预测活跃度的用于的类别对应的第一预测模型、第二预测模型以及第三预测模型中,得到待预测活跃度的用户的当前活跃度。
在上述各实施例中,虽然对步骤进行了编号S1、S2等,但只是本发明给出的具体实施例,本领域的技术人员可根据实际情况调整S1、S2等的执行顺序,此也在本发明的保护范围内,可以理解,在一些实施例中,可以包含如上述各实施方式中的部分或全部。
需要说明的是,上述实施例提供的一种基于多模型的用户活跃度预测系统的有益效果与上述一种基于多模型的用户活跃度预测方法的有益效果相同,在此不再赘述。此外,上述实施例提供的系统在实现其功能时,仅以上述各功能模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能模块完成,即将系统根据实际情况划分成不同的功能模块,以完成以上描述的全部或者部分功能。另外,上述实施例提供的系统与方法实施例属于同一构思,其具体实现过程详见方法实施例,在此不再赘述。
如图3所示,本发明实施例的一种计算机设备300,计算机设备300包括处理器320,处理器320与存储器310耦合,存储器310中存储有至少一条计算机程序330,至少一条计算机程序330由处理器320加载并执行,以使计算机设备300实现上述任一项方法,具体地:
计算机设备300可因配置或性能不同而产生比较大的差异,可以包括一个或多个处理器320(Central Processing Units,CPU)和一个或多个存储器310,其中,该一个或多个存储器310中存储有至少一条计算机程序330,该至少一条计算机程序330由该一个或多个处理器320加载并执行,以使该计算机设备300实现上述实施例提供的一种基于多模型的用户活跃度预测方法。当然,该计算机设备300还可以具有有线或无线网络接口、键盘以及输入输出接口等部件,以便进行输入输出,该计算机设备300还可以包括其他用于实现设备功能的部件,在此不做赘述。
本发明实施例的一种计算机可读存储介质,计算机可读存储介质中存储有至少一条计算机程序,至少一条计算机程序由处理器加载并执行,以使计算机实现上述任一项方法。
可选地,计算机可读存储介质可以是只读存储器(Read-Only Memory,ROM)、随机存取存储器(RandomAccess Memory,RAM)、只读光盘(Compact Disc Read-Only Memory,CD-ROM)、磁带、软盘和光数据存储设备等。
在示例性实施例中,还提供了一种计算机程序产品或计算机程序,该计算机程序产品或计算机程序包括计算机指令,该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令,使得该计算机设备执行上述任一项方法。
需要说明的是,本申请的说明书和权利要求书中的术语“第一”、“第二”、等是用于区别类似的对象,而代表对特定的顺序或先后次序进行限定。在适当情况下对于类似的对象的使用顺序可以互换,以便这里描述的本申请的实施例能够以除了图示或描述的顺序以外的顺序实施。
所属技术领域的技术人员知道,本发明可以实现为系统、方法或计算机程序产品,因此,本公开可以具体实现为以下形式,即:可以是完全的硬件、也可以是完全的软件(包括固件、驻留软件、微代码等),还可以是硬件和软件结合的形式,本文一般称为“电路”、“模块”或“系统”。此外,在一些实施例中,本发明还可以实现为在一个或多个计算机可读介质中的计算机程序产品的形式,该计算机可读介质中包含计算机可读的程序代码。
可以采用一个或多个计算机可读的介质的任意组合。计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质。计算机可读存储介质例如可以是一一但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机存取存储器(RAM),只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本文件中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。
尽管上面已经示出和描述了本发明的实施例,可以理解的是,上述实施例是示例性的,不能理解为对本发明的限制,本领域的普通技术人员在本发明的范围内可以对上述实施例进行变化、修改、替换和变型。

Claims (10)

1.一种基于多模型的用户活跃度预测方法,其特征在于,包括:
S1,基于所有用户在指定游戏平台上对应的历史活跃度数据,对所有用户进行排序分类;
S2,对每个类别下的用户对应的历史每日数据进行预处理,得到布尔型数据,根据每个类别下每个用户对应的历史每日数据确定每个类别下每个用户对应的综合数据,根据每个类别下所有综合数据以及所有布尔型数据构建第一训练数据集,根据所述第一训练数据集训练二分类预测模型,所述二分类预测模型用于预测用户是否登录;
S3,根据每个类别下的每个用户对应的历史每日数据以及每个类别下的每个用户对应的综合数据构建第二训练集,根据所述第二训练集训练第二预测模型以及第三预测模型,所述第二预测模型用于预测用户登录次数,所述第三预测模型用于预测用户对局次数;
S4,将待预测活跃度的用户对应的历史活跃度、历史每日数据以及综合数据分别输入至所述待预测活跃度的用户对应的类别下的第一预测模型、第二预测模型以及第三预测模型对待预测活跃度的用户进行活跃度预测。
2.根据权利要求1所述的一种基于多模型的用户活跃度预测方法,其特征在于,S1之前还包括:
对用户的历史每日数据进行数据清洗,得到清洗后的历史每日数据;
数据清洗包括:
删除注册时间未超过第一阈值的用户的所有历史每日数据;
删除当前时间之前的第一设定时间段内未登录过账号的用户对应的所有历史每日数据,其中,第一设定时间段的最晚时间为当前时间;
删除任意一个用户注册账号至当前并未参与游戏对决的用户对应的所有历史每日数据;
删除所有用户第二设定时间段内的所有历史每日数据,其中,第二设定时间段的最晚时间为当前时间。
3.根据权利要求1所述的一种基于多模型的用户活跃度预测方法,其特征在于,对所有用户进行排序分类具体包括:
按照所有用户的历史活跃数据对应的活跃值,对所有用户进行活跃值降序排列,并对排列后的活跃值进行分区,不同分区对应不同的用户类别。
4.根据权利要求1所述的一种基于多模型的用户活跃度预测方法,其特征在于,根据每个类别下所有综合数据以及所有布尔型数据构建第一训练数据集之后还包括:
对每个第一训练数据集中的历史每日数据对应的布尔型数据进行编码,得到每个布尔型数据对应的第一字典格式数据;
对每个第一训练集中的综合数据进行编码,得到每个综合数据对应的第二字典格式数据并存储;
将所有第一训练数据集对应的第一字典格式数据进行整合,并重新对所有第一字典格式数据对应的历史每日数据进行编码,得到第三字典格式数据并存储。
5.根据权利要求1所述的一种基于多模型的用户活跃度预测方法,其特征在于,根据所述第一训练数据集训练二分类预测模型具体包括:
将所述第一训练数据集整合成多个训练输入对,当前训练输入对包括:当前输入数据、当前输入数据对应的标签以及当前任意一个用户对应的综合数据,所述当前输入数据为连续预设天数内的任意一个用户对应的历史每日数据对应的布尔型数据以及连续预设天数内的任意一个用户对应的综合数据,所述当前输入数据对应的标签为当前连续预设天数的下一天对应的登录次数;
第二训练输入对包括:第二输入数据、第二输入数据对应的标签以及第二任意一个用户对应的综合数据,第二输入数据中的第一个数据为所述当前输入数据中的第二个数据,所述第二输入数据中的最后一个为所述当前连续预设天数的下一天对应的历史每日数据,所述第二输入数据对应的标签为当前连续预设天数的下两天对应的登录次数;
根据多个训练输入对以及损失函数进行二分类预测模型的训练。
6.根据权利要求1所述的一种基于多模型的用户活跃度预测方法,其特征在于,将待预测活跃度的用户对应的历史活跃度、历史每日数据以及综合数据分别输入至所述待预测活跃度的用户对应的类别下的第一预测模型、第二预测模型以及第三预测模型对待预测活跃度的用户进行活跃度预测具体包括:
确定待预测活跃度的用户的历史活跃度,基于所述历史活跃度确定所述待预测活跃度的用户的类别;
根据所述待预测活跃度的用于的类别,将所述待预测活跃度的用户对应的历史活跃度、历史每日数据以及综合数据分别输入至所述所述待预测活跃度的用于的类别对应的第一预测模型、第二预测模型以及第三预测模型中,得到待预测活跃度的用户的当前活跃度。
7.一种基于多模型的用户活跃度预测系统,其特征在于,包括:
分类模块用于:基于所有用户在指定游戏平台上对应的历史活跃度数据,对所有用户进行排序分类;
第一训练模块用于:对每个类别下的用户对应的历史每日数据进行预处理,得到布尔型数据,根据每个类别下每个用户对应的历史每日数据确定每个类别下每个用户对应的综合数据,根据每个类别下所有综合数据以及所有布尔型数据构建第一训练数据集,根据所述第一训练数据集训练二分类预测模型,所述二分类预测模型用于预测用户是否登录;
第二训练模块用于:根据每个类别下的每个用户对应的历史每日数据以及每个类别下的每个用户对应的综合数据构建第二训练集,根据所述第二训练集训练第二预测模型以及第三预测模型,所述第二预测模型用于预测用户登录次数,所述第三预测模型用于预测用户对局次数;
预测模块用于:将待预测活跃度的用户对应的历史活跃度、历史每日数据以及综合数据分别输入至所述待预测活跃度的用户对应的类别下的第一预测模型、第二预测模型以及第三预测模型对待预测活跃度的用户进行活跃度预测。
8.根据权利要求7所述的一种基于多模型的用户活跃度预测系统,其特征在于,还包括:
剔除模块用于:对用户的历史每日数据进行数据清洗,得到清洗后的历史每日数据;
数据清洗包括:
删除注册时间未超过第一阈值的用户的所有历史每日数据;
删除当前时间之前的第一设定时间段内未登录过账号的用户对应的所有历史每日数据,其中,第一设定时间段的最晚时间为当前时间;
删除任意一个用户注册账号至当前并未参与游戏对决的用户对应的所有历史每日数据;
删除所有用户第二设定时间段内的所有历史每日数据,其中,第二设定时间段的最晚时间为当前时间。
9.一种计算机设备,其特征在于,所述计算机设备包括处理器,所述处理器与存储器耦合,所述存储器中存储有至少一条计算机程序,所述至少一条计算机程序由所述处理器加载并执行,以使所述计算机设备实现如权利要求1至6任一项权利要求所述的方法。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质中存储有至少一条计算机程序,所述至少一条计算机程序由处理器加载并执行,以使计算机实现如权利要求1至6任一项权利要求所述的方法。
CN202311623017.8A 2023-11-30 2023-11-30 基于多模型的用户活跃度预测方法、系统、设备及介质 Active CN117786478B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202311623017.8A CN117786478B (zh) 2023-11-30 2023-11-30 基于多模型的用户活跃度预测方法、系统、设备及介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202311623017.8A CN117786478B (zh) 2023-11-30 2023-11-30 基于多模型的用户活跃度预测方法、系统、设备及介质

Publications (2)

Publication Number Publication Date
CN117786478A CN117786478A (zh) 2024-03-29
CN117786478B true CN117786478B (zh) 2024-05-14

Family

ID=90395318

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202311623017.8A Active CN117786478B (zh) 2023-11-30 2023-11-30 基于多模型的用户活跃度预测方法、系统、设备及介质

Country Status (1)

Country Link
CN (1) CN117786478B (zh)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109636047A (zh) * 2018-12-17 2019-04-16 江苏满运软件科技有限公司 用户活跃度预测模型训练方法、系统、设备及存储介质
CN111967521A (zh) * 2020-08-18 2020-11-20 中国银行股份有限公司 跨境活跃用户识别方法及装置
CN112445690A (zh) * 2020-11-27 2021-03-05 广州三七互娱科技有限公司 信息获取方法、装置及电子设备

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109636047A (zh) * 2018-12-17 2019-04-16 江苏满运软件科技有限公司 用户活跃度预测模型训练方法、系统、设备及存储介质
CN111967521A (zh) * 2020-08-18 2020-11-20 中国银行股份有限公司 跨境活跃用户识别方法及装置
CN112445690A (zh) * 2020-11-27 2021-03-05 广州三七互娱科技有限公司 信息获取方法、装置及电子设备

Also Published As

Publication number Publication date
CN117786478A (zh) 2024-03-29

Similar Documents

Publication Publication Date Title
CN109902222B (zh) 一种推荐方法及装置
CN107316198B (zh) 账户风险识别方法及装置
CN107851462B (zh) 使用循环神经网络分析健康事件
CN110334843B (zh) 一种时变注意力改进Bi-LSTM的住院就医行为预测方法及装置
CN108734338A (zh) 基于lstm模型的信用风险预测方法及装置
CN107995992A (zh) 使用递归神经网络分析健康事件
CN109657890A (zh) 一种转账欺诈的风险确定方法及装置
JP2015525086A (ja) 問題賭博行為の自動検出、ならびにゲーム機および賭博装置機能の抑止および制御のためのシステム
CN109033309B (zh) 数据处理方法、装置、设备及存储介质
CN112138403B (zh) 交互行为的识别方法和装置、存储介质及电子设备
CN111080360A (zh) 行为预测方法、模型训练方法、装置、服务器及存储介质
CN115510042A (zh) 基于生成对抗网络的电力系统负荷数据填补方法及装置
CN109308903A (zh) 语音模仿方法、终端设备及计算机可读存储介质
Li et al. Introduce structural equation modelling to machine learning problems for building an explainable and persuasive model
CN114519508A (zh) 基于时序深度学习和法律文书信息的信用风险评估方法
Li et al. A credit risk model with small sample data based on G-XGBoost
CN117786478B (zh) 基于多模型的用户活跃度预测方法、系统、设备及介质
CN112819256A (zh) 一种基于注意力机制的卷积时序房价预测方法
CN113705092B (zh) 基于机器学习的疾病预测方法及装置
Dang et al. Conditional neural ODE processes for individual disease progression forecasting: a case study on COVID-19
CN110354501B (zh) 行为预测方法、装置及电子设备
Patrick Evans et al. Bounded strategic reasoning explains crisis emergence in multi-agent market games
CN114491410A (zh) 运动模式的识别方法、系统、智能穿戴设备及存储介质
CN115204381A (zh) 弱监督模型训练方法及装置、电子设备
CN112348257A (zh) 一种多源数据融合与时序分析驱动的选举预测方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant