CN115719244A - 用户行为预测方法及装置 - Google Patents

用户行为预测方法及装置 Download PDF

Info

Publication number
CN115719244A
CN115719244A CN202211521000.7A CN202211521000A CN115719244A CN 115719244 A CN115719244 A CN 115719244A CN 202211521000 A CN202211521000 A CN 202211521000A CN 115719244 A CN115719244 A CN 115719244A
Authority
CN
China
Prior art keywords
data set
data
behavior
user
optimized
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202211521000.7A
Other languages
English (en)
Inventor
槐正
徐冬冬
姜承祥
付迎鑫
崔明
徐锐
王健
魏丫丫
徐蕾
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China Telecom Corp Ltd
Original Assignee
China Telecom Corp Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China Telecom Corp Ltd filed Critical China Telecom Corp Ltd
Priority to CN202211521000.7A priority Critical patent/CN115719244A/zh
Publication of CN115719244A publication Critical patent/CN115719244A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明提供了一种用户行为预测方法及装置,涉及数据分析技术领域。方法包括:对第一数据集合以及第二数据集合进行聚类分析,以得到优化数据集合,其中,第一数据集合以及第二数据集合分别对应不同的用户行为,优化数据集合包括显性数据以及隐性数据;根据拟合阈值剔除优化数据集合中的过拟合数据,以得到第三数据集合,其中,拟合阈值是根据显性数据以及隐性数据确定的;通过预先训练完成的行为转化预测模型,根据第三数据集合确定目标用户的用户行为转化率,其中,目标用户为第二数据集合对应的至少一个用户。因此,本发明能够解决现有技术中的现有聚类分析以及分析算法,用户行为的分析结果准确率低,无法准确预测用户行为转化率的问题。

Description

用户行为预测方法及装置
技术领域
本发明涉及数据分析技术领域,尤其涉及一种用户行为预测方法及装置。
背景技术
近年来,随着大数据的兴起,消费者行为分析的研究方兴未艾,数据库与数据挖掘、信息系统与信息管理、图像处理与计算机视觉、社会网络分析、电子商务等很多领域的学者加人消费者行为研究的队伍。同时,消费者行为分析这一研究领域也受到了电子商务、社交网络等数字经济形态下的企业的高度关注,消费者行为分析被视为数字经济形态下企业了解其消费者并开展营销活动的有效手段之。
在聚类分析的实际应用中,针对分类结果的评估也有很多的维度和指标。但是,从数据化运营的实践经验来看,任何模型的数据评估,包括聚类分析的数据评估既要考虑统计学意义上的指标、维度,同时更要关注其实践效果上的价值及业务背景下的价值。尤具聚类项目来说,跟分类(预测)项目的一个显著不同之处在于,分类(预测)项目的评判有训练集、验证集、测试集的客观参照,而对于聚类结果的评判来说,一个对象分配到A类与分配到B类,中间并没有太明确、太客观的参照依据。
鉴于此,聚类结果的评判常常更加复杂和困难。
发明内容
本发明实施例提供一种用户行为预测方法及装置,以解决现有技术中的现有聚类分析以及分析算法,用户行为的分析结果准确率低,无法准确预测用户行为转化率的问题。
为了解决上述技术问题,本发明是这样实现的:
第一方面,本发明实施例提供了一种用户行为预测方法,所述方法包括:对第一数据集合以及第二数据集合进行聚类分析,以得到优化数据集合,其中,所述第一数据集合以及所述第二数据集合分别对应不同的用户行为,所述优化数据集合包括显性数据以及隐性数据;根据拟合阈值剔除所述优化数据集合中的过拟合数据,以得到第三数据集合,其中,所述拟合阈值是根据所述显性数据以及所述隐性数据确定的;通过预先训练完成的行为转化预测模型,根据所述第三数据集合确定目标用户的用户行为转化率,其中,所述目标用户为所述第二数据集合对应的至少一个用户。
进一步地,所述对第一数据集合以及第二数据集合进行聚类分析,以得到优化数据集合,包括:根据行为数据对所述第一数据集合以及所述第二数据集合进行聚类分析,以得到所述优化数据集合,所述行为数据包括至少一种网络行为特征。
进一步地,所述显性数据对应的网络行为包括以下之一:用户评论、用户评分;所述隐性数据对应的网络行为包括以下之一:点击行为、购买行为以及搜索行为。
进一步地,所述根据拟合阈值剔除所述优化数据集合中的过拟合数据,以得到第三数据集合,包括:通过预先训练完成的拟合值计算模型,根据所述显性数据以及所述隐性数据确定所述拟合阈值;根据所述拟合阈值确定所述过拟合数据;剔除所述优化数据集合中的所述过拟合数据,以得到所述第三数据集合。
进一步地,所述通过预先训练完成的行为转化预测模型,根据所述第三数据集合确定目标用户的用户行为转化率,包括:将所述第三数据集合输入至所述行为转化预测模型,其中,所述行为转化预测模型是根据贝叶斯算法构建的;根据所述第三数据集合中目标用户的行为数据,确定所述用户行为转化率。
进一步地,所述方法还包括:向用户行为转化率大于预设转化率阈值的意向用户的终端设备,发送预设推送信息。
第二方面,本发明实施例还提供了一种用户行为预测装置,所述装置包括:分析模块,用于对第一数据集合以及第二数据集合进行聚类分析,以得到优化数据集合,其中,所述第一数据集合以及所述第二数据集合分别对应不同的用户行为,所述优化数据集合包括显性数据以及隐性数据;处理模块,用于根据拟合阈值剔除所述优化数据集合中的过拟合数据,以得到第三数据集合,其中,所述拟合阈值是根据所述显性数据以及所述隐性数据确定的;确定模块,用于通过预先训练完成的行为转化预测模型,根据所述第三数据集合确定目标用户的用户行为转化率,其中,所述目标用户为所述第二数据集合对应的至少一个用户。
进一步地,所述分析模块包括:分析子模块,用于根据行为数据对所述第一数据集合以及所述第二数据集合进行聚类分析,以得到所述优化数据集合,所述行为数据包括至少一种网络行为特征。
进一步地,所述显性数据对应的网络行为包括以下之一:用户评论、用户评分;所述隐性数据对应的网络行为包括以下之一:点击行为、购买行为以及搜索行为。
进一步地,所述处理模块包括:第一确定子模块,用于通过预先训练完成的拟合值计算模型,根据所述显性数据以及所述隐性数据确定所述拟合阈值;第二确定子模块,用于根据所述拟合阈值确定所述过拟合数据;处理子模块,用于剔除所述优化数据集合中的所述过拟合数据,以得到所述第三数据集合。
进一步地,所述确定模块包括:输入子模块,用于将所述第三数据集合输入至所述行为转化预测模型,其中,所述行为转化预测模型是根据贝叶斯算法构建的;第三确定子模块,用于根据所述第三数据集合中目标用户的行为数据,确定所述用户行为转化率。
进一步地,所述装置还包括:发送模块,向用户行为转化率大于预设概率阈值的意向用户的终端设备,发送预设推送信息。
第三方面,本发明实施例另外提供了一种电子设备,包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述计算机程序被所述处理器执行时实现如前第一方面所述的用户行为预测方法的步骤。
第四方面,本发明实施例另外提供了一种可读存储介质,所述可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如前第一方面所述的用户行为预测方法的步骤。
在本发明实施例中,对第一数据集合以及第二数据集合进行聚类分析,以得到优化数据集合,其中,第一数据集合以及第二数据集合分别对应不同的用户行为,优化数据集合包括显性数据以及隐性数据;根据拟合阈值剔除优化数据集合中的过拟合数据,以得到第三数据集合,其中,拟合阈值是根据显性数据以及隐性数据确定的;通过预先训练完成的行为转化预测模型,根据第三数据集合确定目标用户的用户行为转化率,其中,目标用户为第二数据集合对应的至少一个用户。本实施例中对分别对应不同用户行为的第一数据集合以及第二数据集合进行聚类分析,以得到共同网络行为的优化数据集合,然后根据拟合阈值剔除优化数据集合中的过拟合数据,以降低显性数据与隐性数据的差异化,最后通过行为转化模型对第三数据集合进行预测,保证了预测得到用户行为转化率的准确性。本发明解决了现有技术中的现有聚类分析以及分析算法,用户行为的分析结果准确率低,无法准确预测用户行为转化率的问题。
上述说明仅是本发明技术方案的概述,为了能够更清楚了解本发明的技术手段,而可依照说明书的内容予以实施,并且为了让本发明的上述和其它目的、特征和优点能够更明显易懂,以下特举本发明的具体实施方式。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对本发明实施例的描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明实施例中的一种用户行为预测方法的流程示意图;
图2是本发明实施例中的一种用户行为预测装置的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
实施例一
根据本发明实施例,提供了一种用户行为预测方法,如图1所示,该方法具体可以包括以下步骤:
S102,对第一数据集合以及第二数据集合进行聚类分析,以得到优化数据集合,其中,第一数据集合以及第二数据集合分别对应不同的用户行为,优化数据集合包括显性数据以及隐性数据;
S104,根据拟合阈值剔除优化数据集合中的过拟合数据,以得到第三数据集合,其中,拟合阈值是根据显性数据以及隐性数据确定的;
S106,通过预先训练完成的行为转化预测模型,根据第三数据集合确定目标用户的用户行为转化率,其中,目标用户为第二数据集合对应的至少一个用户。
在本实施例中,用户行为包括但不限于用户基于线上平台对商品的购买行为,用户对虚拟服务的订阅服务。
例如,用户基于对手机彩铃业务的订阅行为;用户基于网购平台对商品的购买行为。
在本实施例中,由用户行为产生相应地数据,例如用户基于网购平台对商品的购买行为,包括基于网购平台的商品的多种网络行为,例如:搜索行为、浏览行为以及购买行为。此外,该用户行为对应的网络行为还包括但不限于对商品的评论、评分等行为。
此外,又例如用户订购虚拟服务对应的多种网络行为,例如:搜索行为、浏览行为以及订阅行为。此外,该用户行为对应的网络行为还包括但不限于对虚拟服务的评论、评分等行为。
根据用户行为对用户数据进行分类,例如已购买商品的第一数据集合以及未购买商品的第二数据集合;又例如订阅虚拟服务的第一数据集合以及未订阅虚拟服务的第二数据集合。
在一个示例中,从电商平台日志获取所有用户数据,并将所述用户行为数据分成付费用户数据集合和非付费用户数据集合。
在本实施例中,显性数据为能够直接反映用户对商品或虚拟服务的喜好程度的数据。例如用户对商品或虚拟服务的点评、打分、用户评论以及调查问卷等。隐性数据为间接反映用户对商品或虚拟服务的喜好程度的数据,例如用户对对商品或虚拟服务的浏览行为、搜索行为以及购买行为等。
本实施例中对第一数据集合以及第二数据集合进行聚类分析,针对用户行为对应的网络行为进行聚类分析,通过分析聚类分析指标结合付费用户和非付费用户数据集合之间的网络行为特征,获得共同网络行为特征的优化数据集合。
接下来,根据拟合阈值来调整优化数据集合中的过拟合数据,降低显性数据与隐性数据之间的差异化。
示例性地,通过预设模型计算得到优化数据集合中的数据的拟合值,若拟合值差值在10%以内则表示该数据未过拟合;若拟合值差值大于10%,则过拟合,将优化数据集合中的过拟合数据剔除,提高行为特征数据的准确度。
在本实施例中,目标用户为第二数据集合对应的至少一个用户,第二数据集合为未购买商品或未订阅虚拟服务的数据集合,由此目标用户为未购买商品或订阅虚拟服务的用户。
最后,通过预先训练完成的行为转化预测模型,根据优化过后的第三数据集合确定目标用户的用户行为转化率。本实施例中的用户转化率为未购买商品或订阅虚拟服务的用户,转化为购买商品或订阅虚拟服务的用户的概率,概率越高,则表示用户购买商品或订阅虚拟服务的可能性越大。
需要说明的是,通过本实施例,对第一数据集合以及第二数据集合进行聚类分析,以得到优化数据集合,其中,第一数据集合以及第二数据集合分别对应不同的用户行为,优化数据集合包括显性数据以及隐性数据;根据拟合阈值剔除优化数据集合中的过拟合数据,以得到第三数据集合,其中,拟合阈值是根据显性数据以及隐性数据确定的;通过预先训练完成的行为转化预测模型,根据第三数据集合确定目标用户的用户行为转化率,其中,目标用户为第二数据集合对应的至少一个用户。本实施例中对分别对应不同用户行为的第一数据集合以及第二数据集合进行聚类分析,以得到共同网络行为的优化数据集合,然后根据拟合阈值剔除优化数据集合中的过拟合数据,以降低显性数据与隐性数据的差异化,最后通过行为转化模型对第三数据集合进行预测,保证了预测得到用户行为转化率的准确性。本发明解决了现有技术中的现有聚类分析以及分析算法,用户行为的分析结果准确率低,无法准确预测用户行为转化率的问题。
可选地,在本实施例中,所述对第一数据集合以及第二数据集合进行聚类分析,以得到优化数据集合,包括但不限于:根据行为数据对所述第一数据集合以及所述第二数据集合进行聚类分析,以得到所述优化数据集合,所述行为数据包括至少一种网络行为特征。
在实际地应用场景中,从电商平台日志获取所有用户数据,并将所述用户行为数据分成付费用户数据集合和非付费用户数据集合。通过分析聚类分析指标结合付费用户和非付费用户数据集合之间的网络行为特征。获得共同网络行为特征的数据集合。
在本实施例中,将显性数据和隐性数据放入聚类分析指标进行运算,获得更加据有典型付费用户特征的优化数据集合。
具体描述如下:
首先,RMSSTD(Root-Mean-Square Standard Deviation)为群体中所有变量的综合标准差,RMSSTD越小表明群体内(簇内)个体对象的相似程度越高,聚类效果越好。计算
公式如下:
Figure BDA0003973781560000071
其中,Si代表第i个变量在各群内的标准差之和,p为变量数量。
然后,R-Square为聚类后群体间差异的大小,也就是聚类结果可以在多大比例上解释原数据的方差,R-Square越大表明群体间(簇间)的相异性越高,聚类效果就越好。计算公式如下:
Figure BDA0003973781560000081
其中,W代表聚类分组后的各组内部的差异程度,B代表聚类分组后各组之间的差异程度,T代表聚类分组后所有数据对象总的差异程度,并且T=W+B。
按照聚类的思想来看,一个好的聚类给果,应该是在R-Square E[0,11]的范围内,并且Sanare越接近1越好,这说明了各个群类之间的差异,即B越大,而同组内(群内)
各对象间的差异,即W越小,这正是聚类分析所希望达到的效果。计算公式如下:
Figure BDA0003973781560000082
其中,p代表有p个指标(变量),n代表有n个组员,
Figure BDA0003973781560000083
代表总体平均值。
进一步可选地,在本实施例中,显性数据对应的网络行为包括以下之一:用户评论、用户评分;隐性数据对应的网络行为包括以下之一:点击行为、购买行为以及搜索行为。
具体地,付费用户和非付费用户对应的显性数据包括但不限于用户评分、用户评论等数据。付费用户和非付费用户对应的隐性数据包括但不限于用户点击行为、购买行为和搜索行为等数据,这些隐性数据隐性的揭示了用户对商品喜好。
在实际的应用场景中,基于用户评分以及用户评论进行相应的数值转化,以得到量化后的显性数据,例如,根据用户评分生成对应的数值。对用户点击行为、购买行为以及搜索行为对应的频率以及时间进行相应的数值转化,以得到隐性数据
可选地,在本实施例中,根据拟合阈值剔除优化数据集合中的过拟合数据,以得到第三数据集合,包括但不限于:通过预先训练完成的拟合值计算模型,根据显性数据以及隐性数据确定拟合阈值;根据拟合阈值确定过拟合数据;剔除优化数据集合中的过拟合数据,以得到第三数据集合。
具体地,在本实施例中,构建拟合值计算模型并通过模型计算得到拟合值,降低显性数据和隐性数据的差异化。拟合值计算公式如下:
||Xθ-y||2+||Γθ||2
其中,X为模型输入;y为模型输出(预测结果);||为正则。
本实施例中,定义r=aI(客观的训练结果=拟合值),防止过拟合运算过程:
θ(a)=(XTX+aI)-1XTy
其中,Ⅰ是单位矩阵。
通过上述模型的输出结果为优化数据集合中显性数据和隐性数据对应的拟合值,
拟合值与拟合阈值的拟合值差值在10%以内说明差异化不大,反之过拟合。最后,将优化数据集合中过拟合数据剔除,提高行为特征数据的准确度。
可选地,在本实施例中,通过预先训练完成的行为转化预测模型,根据第三数据集合确定目标用户的用户行为转化率,包括但不限于:将第三数据集合输入至行为转化预测模型,其中,行为转化预测模型是根据贝叶斯算法构建的;根据第三数据集合中目标用户的行为数据,确定用户行为转化率。
具体地,以下对构建行为转化预测模型进行描述:
贝叶斯定理是朴素贝叶斯分类法(Naive Bayesian
Classifier)的基础,如果给定数据集里有M个分类类别,通过朴素贝叶斯分类法,可以预测给定观察值是否属于具有最高后验概率的特定类别,也就是说,朴素贝叶斯分类方法预测X属于类别C时,表示当且仅当:
P(Ci|X)>P(Cj|X)1≤j≤m,j≠i
此时如果最大化P(Ci|X),其P(Ci|X)最大的类Ci被称为最大后验假设,根据贝叶斯定理:
Figure BDA0003973781560000101
可知,由于P(X)对于所有的类别是均等的,因此只需要P(X|Ci)P(Ci)取最大即可。
为了预测一个未知样本X的类别,可对每个类别Ci估算相应的P(X|Ci)P(Ci)。
P(Ci|X)>P(Cj|X)1≤j≤m,j≠i
在一个具体地应用场景中,将拟合后的第三数据集合放入贝叶斯算法构建的转化预测模型中,预测潜在付费用户成为付费用户的概率。概率值越高,付费用户可能性越大。
可选地,在本实施例中,方法还包括:向用户行为转化率大于预设转化率阈值的意向用户的终端设备,发送预设推送信息。
在实际的应用场景,针对用户行为转化率高于预设转化率阈值的意向用户,进行相应的广告消息推送,以提高意向用户对商品的购买率或对虚拟服务的订阅率。
通过本发明实施例,对第一数据集合以及第二数据集合进行聚类分析,以得到优化数据集合,其中,第一数据集合以及第二数据集合分别对应不同的用户行为,优化数据集合包括显性数据以及隐性数据;根据拟合阈值剔除优化数据集合中的过拟合数据,以得到第三数据集合,其中,拟合阈值是根据显性数据以及隐性数据确定的;通过预先训练完成的行为转化预测模型,根据第三数据集合确定目标用户的用户行为转化率,其中,目标用户为第二数据集合对应的至少一个用户。本实施例中对分别对应不同用户行为的第一数据集合以及第二数据集合进行聚类分析,以得到共同网络行为的优化数据集合,然后根据拟合阈值剔除优化数据集合中的过拟合数据,以降低显性数据与隐性数据的差异化,最后通过行为转化模型对第三数据集合进行预测,保证了预测得到用户行为转化率的准确性。本发明解决了现有技术中的现有聚类分析以及分析算法,用户行为的分析结果准确率低,无法准确预测用户行为转化率的问题。
实施例二
详细介绍本发明实施例提供的一种用户行为预测装置。
参照图2,示出了本发明实施例中一种用户行为预测装置的结构示意图。
本发明实施例的用户行为预测装置包括:分析模块20,处理模块22以及确定模块24。
下面分别详细介绍各模块的功能以及各模块之间的交互关系。
分析模块20,用于对第一数据集合以及第二数据集合进行聚类分析,以得到优化数据集合,其中,所述第一数据集合以及所述第二数据集合分别对应不同的用户行为,所述优化数据集合包括显性数据以及隐性数据;
处理模块22,用于根据拟合阈值剔除所述优化数据集合中的过拟合数据,以得到第三数据集合,其中,所述拟合阈值是根据所述显性数据以及所述隐性数据确定的;
确定模块24,用于通过预先训练完成的行为转化预测模型,根据所述第三数据集合确定目标用户的用户行为转化率,其中,所述目标用户为所述第二数据集合对应的至少一个用户。
可选地,在本实施例中,所述分析模块20包括:
分析子模块,用于根据行为数据对所述第一数据集合以及所述第二数据集合进行聚类分析,以得到所述优化数据集合,所述行为数据包括至少一种网络行为特征。
可选地,在本实施例中,所述显性数据对应的网络行为包括以下之一:用户评论、用户评分;
所述隐性数据对应的网络行为包括以下之一:点击行为、购买行为以及搜索行为。
可选地,在本实施例中,所述处理模块22包括:
第一确定子模块,用于通过预先训练完成的拟合值计算模型,根据所述显性数据以及所述隐性数据确定所述拟合阈值;
第二确定子模块,用于根据所述拟合阈值确定所述过拟合数据;
处理子模块,用于剔除所述优化数据集合中的所述过拟合数据,以得到所述第三数据集合。
可选地,在本实施例中,所述确定模块24包括:
输入子模块,用于将所述第三数据集合输入至所述行为转化预测模型,其中,所述行为转化预测模型是根据贝叶斯算法构建的;
第三确定子模块,用于根据所述第三数据集合中目标用户的行为数据,确定所述用户行为转化率。
可选地,在本实施例中,所述装置还包括:
发送模块,向用户行为转化率大于预设转化率阈值的意向用户的终端设备,发送预设推送信息。
而且,在本发明实施例中,对第一数据集合以及第二数据集合进行聚类分析,以得到优化数据集合,其中,第一数据集合以及第二数据集合分别对应不同的用户行为,优化数据集合包括显性数据以及隐性数据;根据拟合阈值剔除优化数据集合中的过拟合数据,以得到第三数据集合,其中,拟合阈值是根据显性数据以及隐性数据确定的;通过预先训练完成的行为转化预测模型,根据第三数据集合确定目标用户的用户行为转化率,其中,目标用户为第二数据集合对应的至少一个用户。本实施例中对分别对应不同用户行为的第一数据集合以及第二数据集合进行聚类分析,以得到共同网络行为的优化数据集合,然后根据拟合阈值剔除优化数据集合中的过拟合数据,以降低显性数据与隐性数据的差异化,最后通过行为转化模型对第三数据集合进行预测,保证了预测得到用户行为转化率的准确性。本发明解决了现有技术中的现有聚类分析以及分析算法,用户行为的分析结果准确率低,无法准确预测用户行为转化率的问题。
实施例三
优选的,本发明实施例还提供了一种电子设备,包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述计算机程序被所述处理器执行时实现如上所述的用户行为预测方法的步骤。
可选地,在本实施例中,存储器被配置为存储用于执行以下步骤的程序代码:
S1,对第一数据集合以及第二数据集合进行聚类分析,以得到优化数据集合,其中,所述第一数据集合以及所述第二数据集合分别对应不同的用户行为,所述优化数据集合包括显性数据以及隐性数据;
S2,根据拟合阈值剔除所述优化数据集合中的过拟合数据,以得到第三数据集合,其中,所述拟合阈值是根据所述显性数据以及所述隐性数据确定的;
S3,通过预先训练完成的行为转化预测模型,根据所述第三数据集合确定目标用户的用户行为转化率,其中,所述目标用户为所述第二数据集合对应的至少一个用户。
可选地,本实施例中的具体示例可以参考上述实施例1中所描述的示例,本实施例在此不再赘述。
实施例五
本发明的实施例还提供了一种可读存储介质。可选地,在本实施例中,上述可读存储介质上存储程序或指令,所述程序或指令被处理器执行时实现如实施例1所述的用户行为预测方法的步骤。
可选地,在本实施例中,可读存储介质被配置为存储用于执行以下步骤的程序代码:
S1,对第一数据集合以及第二数据集合进行聚类分析,以得到优化数据集合,其中,所述第一数据集合以及所述第二数据集合分别对应不同的用户行为,所述优化数据集合包括显性数据以及隐性数据;
S2,根据拟合阈值剔除所述优化数据集合中的过拟合数据,以得到第三数据集合,其中,所述拟合阈值是根据所述显性数据以及所述隐性数据确定的;
S3,通过预先训练完成的行为转化预测模型,根据所述第三数据集合确定目标用户的用户行为转化率,其中,所述目标用户为所述第二数据集合对应的至少一个用户。
可选地,可读存储介质还被配置为存储用于执行上述实施例1中的方法中所包括的步骤的程序代码,本实施例中对此不再赘述。
可选地,在本实施例中,上述可读存储介质可以包括但不限于:U盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。
可选地,本实施例中的具体示例可以参考上述实施例1中所描述的示例,本实施例在此不再赘述。
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者装置不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者装置所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者装置中还存在另外的相同要素。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端(可以是手机,计算机,服务器,空调器,或者网络设备等)执行本发明各个实施例所述的方法。
上面结合附图对本发明的实施例进行了描述,但是本发明并不局限于上述的具体实施方式,上述的具体实施方式仅仅是示意性的,而不是限制性的,本领域的普通技术人员在本发明的启示下,在不脱离本发明宗旨和权利要求所保护的范围情况下,还可做出很多形式,均属于本发明的保护之内。
本领域普通技术人员可以意识到,结合本发明实施例中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统、装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在本申请所提供的实施例中,应该理解到,所揭露的装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。
所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、ROM、RAM、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以权利要求的保护范围为准。

Claims (12)

1.一种用户行为预测确定方法,其特征在于,所述方法包括:
对第一数据集合以及第二数据集合进行聚类分析,以得到优化数据集合,其中,所述第一数据集合以及所述第二数据集合分别对应不同的用户行为,所述优化数据集合包括显性数据以及隐性数据;
根据拟合阈值剔除所述优化数据集合中的过拟合数据,以得到第三数据集合,其中,所述拟合阈值是根据所述显性数据以及所述隐性数据确定的;
通过预先训练完成的行为转化预测模型,根据所述第三数据集合确定目标用户的用户行为转化率,其中,所述目标用户为所述第二数据集合对应的至少一个用户。
2.根据权利要求1所述的方法,其特征在于,所述对第一数据集合以及第二数据集合进行聚类分析,以得到优化数据集合,包括:
根据行为数据对所述第一数据集合以及所述第二数据集合进行聚类分析,以得到所述优化数据集合,所述行为数据包括至少一种网络行为特征。
3.根据权利要求2所述的方法,其特征在于,
所述显性数据对应的网络行为包括以下之一:用户评论、用户评分;
所述隐性数据对应的网络行为包括以下之一:点击行为、购买行为以及搜索行为。
4.根据权利要求1所述的方法,其特征在于,所述根据拟合阈值剔除所述优化数据集合中的过拟合数据,以得到第三数据集合,包括:
通过预先训练完成的拟合值计算模型,根据所述显性数据以及所述隐性数据确定所述拟合阈值;
根据所述拟合阈值确定所述过拟合数据;
剔除所述优化数据集合中的所述过拟合数据,以得到所述第三数据集合。
5.根据权利要求1所述的方法,其特征在于,所述通过预先训练完成的行为转化预测模型,根据所述第三数据集合确定目标用户的用户行为转化率,包括:
将所述第三数据集合输入至所述行为转化预测模型,其中,所述行为转化预测模型是根据贝叶斯算法构建的;
根据所述第三数据集合中目标用户的行为数据,确定所述用户行为转化率。
6.根据权利要求1所述的方法,其特征在于,所述方法还包括:
向用户行为转化率大于预设转化率阈值的意向用户的终端设备,发送预设推送信息。
7.一种用户行为预测装置,其特征在于,所述装置包括:
分析模块,用于对第一数据集合以及第二数据集合进行聚类分析,以得到优化数据集合,其中,所述第一数据集合以及所述第二数据集合分别对应不同的用户行为,所述优化数据集合包括显性数据以及隐性数据;
处理模块,用于根据拟合阈值剔除所述优化数据集合中的过拟合数据,以得到第三数据集合,其中,所述拟合阈值是根据所述显性数据以及所述隐性数据确定的;
确定模块,用于通过预先训练完成的行为转化预测模型,根据所述第三数据集合确定目标用户的用户行为转化率,其中,所述目标用户为所述第二数据集合对应的至少一个用户。
8.根据权利要求7所述的装置,其特征在于,所述分析模块包括:
分析子模块,用于根据行为数据对所述第一数据集合以及所述第二数据集合进行聚类分析,以得到所述优化数据集合,所述行为数据包括至少一种网络行为特征。
9.根据权利要求6所述的装置,其特征在于,所述处理模块包括:
第一确定子模块,用于通过预先训练完成的拟合值计算模型,根据所述显性数据以及所述隐性数据确定所述拟合阈值;
第二确定子模块,用于根据所述拟合阈值确定所述过拟合数据;
处理子模块,用于剔除所述优化数据集合中的所述过拟合数据,以得到所述第三数据集合。
10.根据权利要求7所述的装置,其特征在于,所述装置还包括:
发送模块,向用户行为转化率大于预设转化率阈值的意向用户的终端设备,发送预设推送信息。
11.一种电子设备,其特征在于,包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述计算机程序被所述处理器执行时实现如权利要求1至6中任一项所述的用户行为预测方法的步骤。
12.一种可读存储介质,其特征在于,所述可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如权利要求1至6中任一项所述的用户行为预测方法的步骤。
CN202211521000.7A 2022-11-30 2022-11-30 用户行为预测方法及装置 Pending CN115719244A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211521000.7A CN115719244A (zh) 2022-11-30 2022-11-30 用户行为预测方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211521000.7A CN115719244A (zh) 2022-11-30 2022-11-30 用户行为预测方法及装置

Publications (1)

Publication Number Publication Date
CN115719244A true CN115719244A (zh) 2023-02-28

Family

ID=85257096

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211521000.7A Pending CN115719244A (zh) 2022-11-30 2022-11-30 用户行为预测方法及装置

Country Status (1)

Country Link
CN (1) CN115719244A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116582316A (zh) * 2023-05-08 2023-08-11 海南方沽科技股份有限公司 一种基于大数据的计算机网络数字化监测预警系统及方法

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116582316A (zh) * 2023-05-08 2023-08-11 海南方沽科技股份有限公司 一种基于大数据的计算机网络数字化监测预警系统及方法
CN116582316B (zh) * 2023-05-08 2024-02-13 海南方沽科技股份有限公司 一种基于大数据的计算机网络数字化监测预警系统及方法

Similar Documents

Publication Publication Date Title
Thorleuchter et al. Analyzing existing customers’ websites to improve the customer acquisition process as well as the profitability prediction in B-to-B marketing
Junqué de Fortuny et al. Predictive modeling with big data: is bigger really better?
CN108427891B (zh) 基于差分隐私保护的邻域推荐方法
Iwanaga et al. Improving collaborative filtering recommendations by estimating user preferences from clickstream data
CN111966886A (zh) 对象推荐方法、对象推荐装置、电子设备及存储介质
CN116452261B (zh) 一种基于跨境电商服务平台的广告投放数据处理方法
CN110060167A (zh) 一种保险产品推荐方法、服务器及计算机可读介质
EP3140799A1 (en) An automatic statistical processing tool
CN111179051A (zh) 金融目标客户确定方法、装置及电子设备
CN115983900A (zh) 用户营销策略的构建方法、装置、设备、介质和程序产品
CN115719244A (zh) 用户行为预测方法及装置
CN106997371B (zh) 单用户智慧图谱的构建方法
Borges et al. A survey on recommender systems for news data
Keles et al. IBMMS decision support tool for management of bank telemarketing campaigns
CN113837843B (zh) 产品推荐方法、装置、介质及电子设备
CN111245815A (zh) 数据处理方法、装置、存储介质及电子设备
Hanif Applications of data mining techniques for churn prediction and cross-selling in the telecommunications industry
CN114463085A (zh) 自动化营销的通用沟通互动方法、装置、电子设备及存储介质
CN113094615B (zh) 消息推送方法、装置、设备和存储介质
CN112308419A (zh) 数据处理方法、装置、设备及计算机存储介质
CN113159213A (zh) 一种业务分配方法、装置及设备
CN112734463A (zh) 一种业务信息发送方法、装置、电子设备和存储介质
CN111400567A (zh) 一种基于ai的用户数据的处理方法、装置及系统
Granov Customer loyalty, return and churn prediction through machine learning methods: for a Swedish fashion and e-commerce company
US11935060B1 (en) Systems and methods based on anonymized data

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination