CN109522197B - 一种用户app行为的预测方法 - Google Patents
一种用户app行为的预测方法 Download PDFInfo
- Publication number
- CN109522197B CN109522197B CN201811406452.4A CN201811406452A CN109522197B CN 109522197 B CN109522197 B CN 109522197B CN 201811406452 A CN201811406452 A CN 201811406452A CN 109522197 B CN109522197 B CN 109522197B
- Authority
- CN
- China
- Prior art keywords
- user
- data
- app
- behavior
- equal
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/30—Monitoring
- G06F11/34—Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment
- G06F11/3438—Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment monitoring of user actions
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/30—Monitoring
- G06F11/3003—Monitoring arrangements specially adapted to the computing system or computing system component being monitored
- G06F11/302—Monitoring arrangements specially adapted to the computing system or computing system component being monitored where the computing system component is a software system
Abstract
本发明涉及一种用户APP行为的预测方法,包括:步骤S1,获取待预测的用户APP行为数据N=[N1,N2,…,Nm]T,其中Ni为第i个用户APP行为特征的数据,1≤i≤m,m为所述数据N中包括的数据个数;步骤S2,基于所述行为数据N获取用户APP行为预测概率P;步骤S3,根据所述用户APP行为预测概率P,预测用户APP行为。
Description
技术领域
本发明涉及信息处理技术,尤其涉及一种终端用户的行为信息处理方法。
背景技术
随着智能终端的快速发展,应用程序(又称为软件或APP)已经成为人们生活、学习和工作中必不可少的通信交流,而应用软件开发人员为了能够拥有更多的APP用户,通常会采用多种方法来提高用户的APP使用体验,例如在APP中集成更多的功能、调整APP网页布局等。然而,在APP中集成多个功能会直接导致APP占用更多的终端内存,且增加的APP功能适应性有限,并不一定适用所有的用户,而调整APP网页布局提高用户使用体验的效果有限。
发明内容
为解决上述技术问题,本发明公开了一种用户APP行为的预测方法,包括:步骤S1,获取待预测的用户APP行为数据N=[N1,N2,…,Nm]T,其中Ni为第i个用户APP行为特征的数据,1≤i≤m,m为所述数据N中包括的数据个数;步骤S2,基于所述行为数据N获取用户APP行为预测概率P;步骤S3,根据所述用户APP行为预测概率P,预测用户APP行为。
附图说明
图1是本发明用户APP行为的预测方法的流程图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,将结合附图对本发明作进一步地详细描述。这种描述是通过示例而非限制的方式介绍了与本发明的原理相一致的具体实施方式,这些实施方式的描述是足够详细的,以使得本领域技术人员能够实践本发明,在不脱离本发明的范围和精神的情况下可以使用其他实施方式并且可以改变和/或替换各要素的结构。因此,不应当从限制性意义上来理解以下的详细描述。
图1是本发明用户APP行为的预测方法流程图,该方法用于在获取到待预测的用户APP行为数据之后进行实时行为预测。如图1所示,该方法包括:
步骤S1,获取待预测的用户APP行为数据N=[N1,N2,…,Nm]T,其中Ni为第i个用户APP行为特征的数据,1≤i≤m,m为所述数据N中包括的数据个数。在该步骤中,首先采集用于用户APP行为预测的相关APP行为数据N,所述行为数据N中包括分别与m个用户APP行为特征相对应的数据。优选地,m的取值范围为[350,600],更优选地为500。
步骤S2,基于所述行为数据N获取用户APP行为预测概率P。在该步骤中,θi为Ni的权重,权重向量θ=[θ0,θ1,...,θm],所述函数H为用户APP行为预测函数,即将所述行为数据N带入所述用户APP行为预测函数H中可得到所述用户APP行为预测概率P。
优选地,所述用户APP行为包括:用户卸载行为、或用户阅读行为等多种类型的APP行为。在本发明中,可设置不同的用户APP行为预测函数以分别测试不同类型的用户APP行为,例如设置专用于预测用户阅读行为的用户APP行为预测函数H1,设置专用于预测用户卸载行为的用户APP行为预测函数H2。
步骤S3,根据所述用户APP行为预测概率P,预测用户APP行为。具体地,在该步骤中,如果所述用户APP行为预测概率P大于等于第一判断阈值,则判断所述用户APP行为属性为1,即用户具有某种APP行为;如果所述用户APP行为预测概率P小于第一判断阈值,则判断所述用户APP行为属性为0,即用户不具有某种APP行为,其中所述“1”和所述“0”表示用户APP行为预测属性类别,其定义和为构建所述用户APP行为预测函数H而设置的“1”和“0”定义相同。优选地,所述第一判断阈值为[0.55,0.8]。经过多次试验可知,将所述第一判断阈值设置在[0.55,0.8]而非以0.5作为判断标准,可显著提高所述用户APP行为预测函数的预测准确度。
优选地,步骤S3之后还可以包括步骤S4:根据用户APP行为的预测结果向用户推送信息。例如根据用户APP行为的预测结果向用户提供推荐信息,以便快速引导用户进行位置跳转,节约用户时间。
由上述内容可知,本发明将采集到的待预测的用户APP行为数据输入到用户APP行为预测函数中,可实现实时预测效果,计算量小;其次通过设置合理地判断标准,可进一步提高用户APP行为预测的准确性,提高了用户APP行为预测函数的适应能力。
进一步,基于用户APP行为训练前数据集合T=[T1,T2,…,Tp]及其相应的用户APP行为属性集合L=[L1,L2,…,Lp]获取用户APP行为预测函数H中的权重向量θ,Tr=[Tr1,Tr2,…,Trm]T为第r个用户的APP行为数据,p为T包括的用户数据数量,1≤r≤p,Tri为所述第r个用户的第i个用户APP行为特征的数据,m为Tr中包括的行为特征数据个数;Lr=0或者1,其中1表示第r个用户具有APP行为,0表示第r个用户不具有APP行为。
根据本发明,所述p和所述m可自定义设置,优选地,所述p≥10万,更优选地,所述p=20万;优选地,所述m的取值范围为[350,600],更优选地,所述m=500。
更进一步地,所述p≤min(P1,P2),其中P1为设备硬件运行能力限定的用户数据数量,P2为实际采集到的用户数据数量。为了能够快速获取有效的用户APP行为预测函数,所述训练前数据集合T中的用户数据数量p应尽可能的大,但其数值受到设备硬件运行能力的限制。当所述训练前数据集合T中的用户数据数量p过大而超过硬件设备的运行能力,会使得获取用户APP行为预测函数的时间过长而导致时间效率低下。
根据本发明,所述用户APP行为包括:用户软件卸载行为、或用户阅读行为等多种类型的APP行为。例如,当所述用户APP行为为购买奶粉的用户是否还购买尿不湿的用户购买行为时,可设置与用户的该APP行为相关的行为特征为:用户性别、用户年龄、家庭身份、收入、职业、浏览奶粉产品的时长、APP操作顺序等等,设置用户的APP行为属性“1”表示购买奶粉的用户还购买了尿不湿,“0”表示购买奶粉的用户没有购买尿不湿,此时,当获取购买了奶粉和尿不湿的一个用户APP行为数据时,可得到所述训练前数据集合T中的一个用户APP行为数据Tr=[男,30,爸爸,…,30分钟,奶粉至尿不湿]T,其对应的用户APP行为属性Lr=1。本领域技术人员可知,所述用户APP行为数据Tr需要首先处理为可数字处理的表示方式,例如其中所述的用户性别变量被处理为0和1的数字表达方式。
具体地,所述权重向量θ使得的取值最小。在本发明中,使用迭代算法获取所述权重向量θ。具体地,可以采用多种迭代方法来获取所述θ,包括牛顿迭代法、梯度下降法等等。优选地,本发明采用梯度下降方法来获取所述θ以得到计算更快、预测性能更好地用户APP行为预测函数。
从上述内容可知,本发明基于已知的大量用户APP行为数据,通过设置合理的目标函数,得到可用于准确预测用户APP行为的预测函数,使得用户APP行为实时预测更快捷、更准确。
优选地,所述步骤S3之后还可以包括步骤S5,输出所述θ,以便系统、服务器或者是软件生产厂家知悉所有用户APP行为特征对用户APP行为预测的影响程度。
优选地,在本发明的一个实施例中,由服务端来执行所述步骤S1-S3,以便于合理利用服务端的运算资源和存储资源优势。优选地,可由服务端来执行基于用户APP行为训练前数据集合T=[T1,T2,…,Tp]及其相应的用户APP行为属性集合L=[L1,L2,…,Lp]获取用户APP行为预测函数H中的权重向量θ;更优选地,可由服务端来分别获取用于测试不同类型的用户APP行为的用户APP行为预测函数。
进一步地,所述训练前数据集合T及其相应的用户APP行为属性集合L根据用户APP行为训练用数据集合Y=[Y1,Y2,…,Yp]及其相应的用户APP行为属性集合Q=[Q1,Q2,…,Qp]确定,其中Ys=[Ys1,Ys2,…,Ysn]T为第s个用户对所有n个用户APP行为特征的采样数据,1≤s≤p,p为所述训练用数据集合Y包括的用户数据数量,Ysh为第s个用户的第h个用户APP行为特征的数据,n为Ys中包括的数据个数;Qs=0或者1,其中1表示第s个用户具有APP行为,0表示第s个用户不具有APP行为,n>m。优选地,所述n的取值范围为[800,2500],更优选地为1000。
具体地,所述T=A*Y,A为m行n列的矩阵,其中,且CVh大小为前m个,CVh为第h个用户APP行为特征在用户APP行为训练用数据集合Y=[Y1,Y2,…,Ym]中的贡献值。Rh为根据Y中与第h个行为特征对应的所有采样数据Ysh的属性所划分的区间数量,例如对于行为特征“用户性别”来说,由于只有男性和女性之分,因此所述Ri可以设置为2,即将所述“用户性别”划分为两个区间;对于行为特征“用户年龄”来说,可设置为[0,20],(20,40],(40,50],(50,70],(70,无穷大)。为了确保行为特征的贡献值有效,在针对每个行为特征划分区间时,要确保每个区间内都包含“1”类型的用户行为数据和“0”类型的用户行为数据;所述pyhk是Rh中第k个区间中具有APP行为(即行为属性为1)的用户数据数量占所有用户数据数量中具有APP行为的用户数据数量的比例,pnhk是Rh中第k区间内不具有APP行为(即行为属性为0)的用户数据数量占所有用户数据数量中不具有APP行为的用户数据数量的比例,1≤k≤Ri。所述用户APP行为属性集合L中的元素Lr∈Q表示第r个用户的APP行为属性。
由上述内容可知,本发明可根据贡献值大小从训练用已知行为数据集合中选择指定的行为特征用于预测用户APP行为,一方面可以排除对用户APP行为预测作用小的行为特征,另一方面可以大幅度减少计算用户APP行为预测函数的计算量,使获取的用户APP行为预测函数更合理,能够显著提高用户APP行为预测的准确度。
更进一步地,可根据用户APP行为原始数据集合X=[X1,X2,…,Xq]来获取所述训练用数据集合Y,其中,Xk=[Xk1,Xk2,…,Xkn]T为第k个用户的APP行为数据,q表示所述原始数据集合X中包含的用户数据数量,Xkx为第k个用户的第x个用户APP行为特征的数据,n为Xk中包括的数据个数,1≤x≤n。优选地,使用集成在用户移动终端APP内的SDK来采集所述用户APP行为原始数据集合X或者所述训练用数据集合Y。
优选地,使用抽样算法从所述原始数据集合X中获取所述训练用数据集合Y,更优选的,所述抽样算法可以是随机抽样算法和/或分层抽样算法。使用抽样的方式来获取所述训练用数据集合Y,可以使得所述训练用数据集合Y中的采样分布更全面,有利于提高用户APP行为预测函数的合理性。
更进一步地,对所述原始数据集合X进行预处理。其中,所述预处理包括人工预处理和/或机器预处理。采用机器预处理的方式和/或人工预处理的方式修正或剔除因数据丢失、恶意修改等原因而形成的错误数据和不合理数据,以使得用于获取用户APP行为预测函数的数据真实接近实际情况,进而使得获取的用户APP行为预测函数更准确。
根据本发明,所述行为数据N根据待预测的用户APP行为原始数据N0=[N01,N02,…,N0n]T确定,其中,N0j为第j个用户APP行为特征的原始数据,n为所述原始数据N0中包括的数据个数,1≤j≤n,n>m。具体地,N=A*NO,A为m行n列的矩阵,其中,且CVh大小为前m个,CVh为第h个用户APP行为特征在用户APP行为训练用数据集合Y=[Y1,Y2,…,Yp]中的贡献值,Ys=[Ys1,Ys2,…,Ysn]T为第s个用户对所有n个用户APP行为特征的采样数据,1≤s≤p,n为Ys中包括的数据个数;其中,Rh为根据Y中与第h个行为特征对应的所有采样数据Ysh的属性所划分的区间数量;所述pyhk是Rh中第k个区间中具有APP行为的用户数据数量占所有用户数据数量中具有APP行为的用户数据数量的比例,pnhk是Rh中第k区间内不具有APP行为的用户数据数量占所有用户数据数量中不具有APP行为的用户数据数量的比例,1≤k≤Ri。
此外,根据公开的本发明的说明书,本发明的其他实现对于本领域的技术人员是明显的。实施方式和/或实施方式的各个方面可以单独或者以任何组合用于本发明的系统和方法中。说明书和其中的示例应该是仅仅看作示例性,本发明的实际范围和精神由所附权利要求书表示。
Claims (6)
1.一种用户APP行为的预测方法,其特征在于,包括:
步骤S1,获取待预测的用户APP行为数据N=[N1,N2,…,Nm]T,其中Ni为第i个用户APP行为特征的数据,1≤i≤m,m为所述数据N中包括的数据个数;
步骤S2,基于所述行为数据N获取用户APP行为预测概率P;
步骤S3,根据所述用户APP行为预测概率P,预测用户APP行为;
在S1步骤中,所述行为数据N根据待预测的用户APP行为原始数据N0=[N01,N02,…,N0n]T确定,其中,N0j为第j个用户APP行为特征的原始数据,n为所述原始数据N0中包括的数据个数,1≤j≤n,n>m,N=A*NO,A为m行n列的矩阵,其中,
CVh为第h个用户APP行为特征在用户APP行为训练用数据集合Y=[Y1,Y2,…,Yp]中的贡献值,Ys=[Ys1,Ys2,…,Ysn]T为第s个用户对所有n个用户APP行为特征的采样数据,1≤s≤p,n为Ys中包括的数据个数,p为Y中包括的用户数据数量;其中,Rh为根据Y中与第h个行为特征对应的所有采样数据Ysh的属性所划分的区间数量;所述pyhk是Rh中第k个区间中具有APP行为的用户数据数量占所有用户数据数量中具有APP行为的用户数据数量的比例,pnhk是Rh中第k区间内不具有APP行为的用户数据数量占所有用户数据数量中不具有APP行为的用户数据数量的比例,1≤k≤Ri;
其中,所述方法还包括如下步骤:基于用户APP行为训练前数据集合T=[T1,T2,…,Tp]及其相应的用户APP行为属性集L=[L1,L2,…,Lp]获取用户APP行为预测函数H中的权重向量θ,Tr=[Tr1,Tr2,…,Trm]T为第r个用户的APP行为数据,p为T包括的用户数据数量,1≤r≤p,Tri为所述第r个用户的第i个用户APP行为特征的数据,m为Tr中包括的行为特征数据个数;Lr=0或者1,其中1表示第r个用户具有APP行为,0表示第r个用户不具有APP行为,其中,10万≤所述p≤min(P1,P2),P1为设备硬件运行能力限定的用户数据数量,P2为实际采集到的用户数据数量;所述权重向量θ使得的取值最小。
2.根据权利要求1所述的预测方法,其特征在于,所述步骤S3具体包括:
如果所述用户APP行为预测概率P大于等于第一判断阈值,则判断所述用户APP行为属性为1;如果所述用户APP行为预测概率P小于第一判断阈值,则判断所述用户APP行为属性为0。
3.根据权利要求1和2任一项所述的预测方法,其特征在于,所述用户APP行为包括:用户卸载行为、或用户阅读行为。
4.根据权利要求1所述的预测方法,其特征在于,使用集成在用户终端APP内的SDK来获取所述原始数据N0。
5.根据权利要求1所述的预测方法,其特征在于,还包括步骤S4,根据用户APP行为的预测结果向用户推送信息。
6.根据权利要求1所述的预测方法,其特征在于,m的取值范围为[350,600]。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811406452.4A CN109522197B (zh) | 2018-11-23 | 2018-11-23 | 一种用户app行为的预测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811406452.4A CN109522197B (zh) | 2018-11-23 | 2018-11-23 | 一种用户app行为的预测方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN109522197A CN109522197A (zh) | 2019-03-26 |
CN109522197B true CN109522197B (zh) | 2022-09-27 |
Family
ID=65777470
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201811406452.4A Active CN109522197B (zh) | 2018-11-23 | 2018-11-23 | 一种用户app行为的预测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109522197B (zh) |
Family Cites Families (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103309984B (zh) * | 2013-06-17 | 2016-12-28 | 腾讯科技(深圳)有限公司 | 数据处理的方法和装置 |
CN105469263A (zh) * | 2014-09-24 | 2016-04-06 | 阿里巴巴集团控股有限公司 | 一种商品推荐方法及装置 |
CN105528374A (zh) * | 2014-10-21 | 2016-04-27 | 苏宁云商集团股份有限公司 | 一种电子商务中的商品推荐方法及其系统 |
CN105740280A (zh) * | 2014-12-10 | 2016-07-06 | 阿里巴巴集团控股有限公司 | 检测变量重要性的方法和装置 |
CN106485562B (zh) * | 2015-09-01 | 2020-12-04 | 苏宁云计算有限公司 | 一种基于用户历史行为的商品信息推荐方法及系统 |
CN106126597A (zh) * | 2016-06-20 | 2016-11-16 | 乐视控股(北京)有限公司 | 用户属性预测方法及装置 |
US20180101591A1 (en) * | 2016-10-06 | 2018-04-12 | Capital One Services, LLC. | Methods and Systems for Cluster-Based Historical Data |
CN107507068A (zh) * | 2017-09-02 | 2017-12-22 | 广东奡风科技股份有限公司 | 一种基于随机森林算法的金融产品实时推荐方法 |
CN107818344B (zh) * | 2017-10-31 | 2020-01-07 | 深圳壹账通智能科技有限公司 | 用户行为进行分类和预测的方法和系统 |
CN108052982B (zh) * | 2017-12-22 | 2021-09-03 | 深圳市云网拜特科技有限公司 | 一种基于贴图表情的情感检测方法以及系统 |
-
2018
- 2018-11-23 CN CN201811406452.4A patent/CN109522197B/zh active Active
Also Published As
Publication number | Publication date |
---|---|
CN109522197A (zh) | 2019-03-26 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110163300B (zh) | 一种图像分类方法、装置、电子设备及存储介质 | |
WO2019223379A1 (zh) | 一种产品推荐方法和装置 | |
CN108537289B (zh) | 数据识别模型的训练方法、装置及存储介质 | |
CN111459993B (zh) | 基于行为分析的配置更新方法、装置、设备及存储介质 | |
CN110008397B (zh) | 一种推荐模型训练方法及装置 | |
KR20180072793A (ko) | 푸시 정보 대략 선택 정렬 방법, 디바이스 및 컴퓨터 저장 매체 | |
CN111797312B (zh) | 模型训练的方法及装置 | |
CN107590460A (zh) | 人脸分类方法、装置及智能终端 | |
CN111797320A (zh) | 数据处理方法、装置、设备及存储介质 | |
CN109522197B (zh) | 一种用户app行为的预测方法 | |
CN110032498B (zh) | 一种用户app行为的预测方法 | |
CN113076487B (zh) | 一种用户兴趣表征及内容推荐方法、装置和设备 | |
CN113132762B (zh) | 留存行为因素分析方法、装置、电子设备和可读存储介质 | |
CN111309608B (zh) | 测试用例的选择方法、装置、电子设备和可读存储介质 | |
CN114154014A (zh) | 视频冷启动推荐方法和装置 | |
JP2011227720A (ja) | 推薦システム、推薦方法、及び推薦プログラム | |
CN112613379A (zh) | 年龄估计方法及装置、电子设备及计算机可读存储介质 | |
CN111309706A (zh) | 模型训练方法、装置、可读存储介质及电子设备 | |
CN117076962B (zh) | 应用于人工智能领域的数据分析方法、装置及设备 | |
CN114040013B (zh) | 书籍流量的分发方法、计算设备及计算机存储介质 | |
CN113420220B (zh) | 一种服务推荐方法、装置、服务器及终端 | |
CN117390295B (zh) | 基于掩码模块推荐对象的方法及装置 | |
CN116501993B (zh) | 房源数据推荐方法及装置 | |
CN111144937B (zh) | 广告素材确定方法、装置、设备及存储介质 | |
CN117687995A (zh) | 基于cnn神经网络的多终端北斗数据质量评估方法及系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
CB02 | Change of applicant information | ||
CB02 | Change of applicant information |
Address after: 310012 Room 418, West District, Building A, 525 Xixi Road, Xihu District, Hangzhou City, Zhejiang Province Applicant after: Daily interactive Co.,Ltd. Address before: 310012 Room 418, West District, Building A, 525 Xixi Road, Xihu District, Hangzhou City, Zhejiang Province Applicant before: ZHEJIANG MEIRI INTERDYNAMIC NETWORK TECHNOLOGY Co.,Ltd. |
|
GR01 | Patent grant | ||
GR01 | Patent grant |