CN110069719B - 一种面向互联网环境的行为预测方法及其预测系统 - Google Patents

一种面向互联网环境的行为预测方法及其预测系统 Download PDF

Info

Publication number
CN110069719B
CN110069719B CN201910333755.6A CN201910333755A CN110069719B CN 110069719 B CN110069719 B CN 110069719B CN 201910333755 A CN201910333755 A CN 201910333755A CN 110069719 B CN110069719 B CN 110069719B
Authority
CN
China
Prior art keywords
behavior
prediction
sequence
user
similarity
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910333755.6A
Other languages
English (en)
Other versions
CN110069719A (zh
Inventor
高全力
王朝
高岭
郝亚玲
王泽天
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Xian Polytechnic University
Original Assignee
Xian Polytechnic University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Xian Polytechnic University filed Critical Xian Polytechnic University
Priority to CN201910333755.6A priority Critical patent/CN110069719B/zh
Publication of CN110069719A publication Critical patent/CN110069719A/zh
Application granted granted Critical
Publication of CN110069719B publication Critical patent/CN110069719B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9536Search customisation based on social or collaborative filtering

Abstract

一种面向互联网环境的行为预测方法及其预测系统,包括行为信息获取模块、行为信息生成模块、频繁行为构建模块、行为预测模块、最近邻用户集构建模块、预测修正模块;依据用户历史行为序列,构建频繁行为序列,通过行为预测算法获得行为概率分布,预测出用户行为;依据行为发生的场景信息构建最近邻用户集,修正行为概率分布,提高预测准确率。

Description

一种面向互联网环境的行为预测方法及其预测系统
技术领域
本发明属于网络应用中的行为预测技术领域,特别涉及一种面向互联网环境的行为预测方法及其预测系统。
背景技术
随着互联网的快速发展和4G无线网络的普及,网络用户和设备数量迅速增加,用户设备所产生的数据已达到泽字节(ZB)级别,有限的网络资源已经逐渐不能满足用户日益增长的网络需求。在互联网环境中每个用户持有多个移动端,这些设备可以随时随地接入网络,产生大量资源需求。以云计算模型为核心的集中式大数据处理时代,其关键技术已经逐渐难以高效处理用户设备所需求的数据。
在这种有限的网络资源背景下,如何提前预测用户行为,面向用户提供个性化服务,提高网络利用率,降低请求时延,成为互联网目前亟待解决的问题。在互联网环境中,用户行为具有时空特性,在相同时间地点场景中,不同用户产生行为具有相似性。利用相似用户,可以更好的预测目标用户的行为。
发明内容
为克服上述现有技术的不足,本发明的目的在于提供一种面向互联网环境的行为预测方法及其预测系统,依据用户历史行为序列,通过行为预测算法获得行为概率分布,预测出用户行为;依据行为发生的场景信息构建最近邻用户集,修正行为概率分布,提高预测准确率。面向用户提供个性化服务,提高网络利用率,降低请求时延。
为实现上述目的,本发明采用的技术方案是:
一种面向互联网环境的行为预测系统,包括信息获取子系统(11)、数据存储与管理中心子系统(12)、行为预测子系统(13)、预测修正子系统(14);
所述的信息获取子系统(11),用以采集用户历史行为及其行为发生的场景信息,并生成系统所需的数据源;
所述的数据存储与管理中心子系统(12),用以完成用户历史行为记录、行为发生的场景信息、行为概率分布数据的存储与管理。
所述的行为预测子系统(13),基于用户历史行为序列计算用户行为概率分布;
所述的预测修正子系统(14),基于最近邻用户集修正行为概率分布。
所述的信息获取子系统(11)包括:行为信息获取模块(111)、行为信息生成模块(112);
所述的行为信息获取模块(111),采集用户历史行为及其行为发生的场景信息;
所述的行为信息生成模块(112),将用户历史行为记录生成预测算法所需的数据源,同时将行为所发生的场景信息生成修正算法所需的数据源,并存入数据存储与管理中心子系统(12)。
所述的行为预测子系统(13)包括:频繁行为构建模块(131)、行为预测模块(132);
所述的频繁行为构建模块(131),根据行为属性在历史行为序列中的选择频繁行为,构建频繁行为序列;
所述的行为预测模块(132),根据频繁行为序列,计算出行为概率分布,并存入数据存储与管理中心子系统(12)。
所述的预测修正子系统(14)包括:最近邻用户集构建模块(141)、预测修正模块(142);
所述的最近邻用户集构建模块(141),依据行为发生的场景信息,计算多用户行为相似度,构建最近邻用户集;
所述的预测修正模块(142),根据最近邻用户修正行为概率分布。
一种面向互联网环境的行为预测方法,包括以下步骤:
步骤1,获取触发预测算法运行指令;
步骤2,信息获取子系统(11)采集用户历史行为及其行为发生的场景信息,并生成预测算法所需的数据源;
步骤3,行为预测子系统(13)从数据存储与管理中心子系统(12)获取用户历史行为序列,频繁行为构建模块(131)根据行为属性在历史行为序列中的选择频繁行为,构建频繁行为序列;行为预测模块(132)根据频繁行为序列,计算行为概率分布,并存入数据存储与管理中心子系统(12);
步骤4,预测修正子系统(14)从数据存储与管理中心子系统(12)获取行为场景信息和行为概率分布,最近邻用户集构建模块(141)依据行为发生的场景信息,计算多用户行为相似度,构建最近邻用户集;预测修正模块(142)根据最近邻用户修正行为概率分布。
步骤3所述的频繁行为构建模块(131),遍历用户历史行为序列,统计每个行为的行为属性,将所有行为属性同预设的阈值α比较,小于阈值α的行为去掉,大于或等于阈值α的行为组成频繁行为序列;设用户历史行为序列为T,频繁行为序列为T*,行为属性为f,T*中的行为形式化描述为:
S={S|S∈T,f≥α}。
步骤3所述的行为预测模块(132)根据频繁行为序列,计算行为概率分布,其方法具体为:
设前缀序列形式化表示为lk=(l1,l2,l,···,ln),
Figure BDA0002038512130000031
k∈[1,n],k表示前缀序列阶数,则在k阶前缀序列后发生行为Si的概率计算方式为式(1):
Figure BDA0002038512130000032
其中,sum(lkSi)表示在前缀序列lk后发生行为Si的次数,sum(lk)表示前缀序列lk出现的次数,
在N个行为序列样本集中,定义ek作为k阶(k=1,2,3,···,n)前缀序列对应的预测误差,计算方式为式(2):
Figure BDA0002038512130000033
其中,
Figure BDA0002038512130000034
为k阶前缀序列在第i样本的权值,i∈[1,N],通常情况下,当k=1时,全部设为1/N,/>
Figure BDA0002038512130000035
为k阶模型在第i个样本的预测结果,/>
Figure BDA0002038512130000036
计算方式为式(3):
Figure BDA0002038512130000037
定义λk为k阶前缀序列的权重系数,计算方式为式(4):
Figure BDA0002038512130000038
在得到k阶模型的权重系数后,根据
Figure BDA0002038512130000039
更新/>
Figure BDA00020385121300000310
的权值,在k阶模型中,对于预测错误的样本在k+1阶前缀序列中需要得到更大关注,所以在k+1阶前缀序列中提高预测错误样本的权值,降低预测正确样本的权值,/>
Figure BDA00020385121300000311
计算方式为式(5):
Figure BDA00020385121300000312
在得到每一阶前缀序列的权重系数后,定义δ(Si)为各阶前缀序列与其后发生行为Si的概率加权求和结果,计算方式为式(6),行为Si的概率计算方式为式(7):
Figure BDA0002038512130000041
Figure BDA0002038512130000042
P=(p(S1),p(S2),p(S3),···,p(Sn)) (8)
其中,p(Si)为发生行为Si的概率,用户行为发生概率分布为P,如式(8)所示,概率最大的为最有可能发生的行为,将行为概率分布P存储至数据存储与管理中心子系统(12)。
步骤4所述的最近邻用户集构建模块(141)依据行为发生的场景信息,计算多用户行为相似度,构建最近邻用户集,其方法为:
定义行为序列相似度为D,计算方式为式(9):
Figure BDA0002038512130000043
其中,
Figure BDA0002038512130000044
为序列/>
Figure BDA0002038512130000045
的长度,/>
Figure BDA0002038512130000046
为序列/>
Figure BDA0002038512130000047
的长度,/>
Figure BDA0002038512130000048
为序列/>
Figure BDA0002038512130000049
和序列/>
Figure BDA00020385121300000410
最长公共子序列长度;
基于时间依赖性行为序列相似度定义为在同一时间段内行为序列相似度,表示为Dt,计算方式为式(10):
Figure BDA00020385121300000411
其中,
Figure BDA00020385121300000412
表示行为流程相似度均值,/>
Figure BDA00020385121300000413
表示行为流程相似度方差,/>
Figure BDA00020385121300000414
值越大表示在同一时间段内行为序列相似度越高,
基于地点依赖性行为序列相似度定义为在同一地点内行为序列相似度,表示为Dd,计算方式为式(11):
Figure BDA00020385121300000415
其中,
Figure BDA00020385121300000416
表示行为流程相似度均值,/>
Figure BDA00020385121300000417
表示内行为流程相似度方差,/>
Figure BDA00020385121300000418
值越大表示在同一地点内行为序列相似度越高,
基于时间和地点依赖性定义用户r和用户m相似度为sim(r,m),计算方式为式(12):
Figure BDA0002038512130000051
其中,ε为权重因子,取决于时间和地点对于预测的重要程度,计算目标用户和所有用户相似度,选择相似度较高的前M个用户组成最近邻用户集。
所述预测修正模块(142)根据最近邻用户集修正行为概率分布,其方法为:
定义相似度权重γm为式(13):
Figure BDA0002038512130000052
其中,r为目标用户,m为最近邻用户,m∈[1,M],修正后结果为式(14):
Figure BDA0002038512130000053
p*r(Si)=(p*r(S1),p*r(S2),p*r(S3),···,p*r(Sn)),i∈[1,n] (15)
其中,pr(S)为目标用户行为发生概率,pm(S)为最近邻用户行为发生概率,m∈[1,M],p*r(Si)为修正后行为预测结果,如式(15)所示,数值最大的为最有可能发生的行为。
与现有技术相比,本发明的有益效果是:
本发明设计了从收集行为信息、计算行为概率分布到修正预测分布的一套可行方案。在计算行为概率分布中,解决传统行为预测模型不能高效利用用户历史行为信息的缺陷,改进传统简单预测模型,有效融合用户历史行为信息,提高行为预测准确率。同时传统模型没有考虑到群体用户的信息,本发明有效利用群体用户的信息,根据相似用户构建最近邻用户集,利用相似用户进一步提高行为预测准确率。本发明设计的行为预测系统,作为互联网环境中数据资源调度的基石,依据预测的行为关联与行为相关的数据资源,从而提前部署数据资源,降低网络负载和数据请求时延,提高资源利用率和用户服务质量。
附图说明
图1为本发明系统的原理框图。
具体实施方式
下面对本发明的实施方法作进一步说明:
本发明的核心思想是:通过建立一种面向互联网环境的行为预测算法模型,在用户历史行为序列中,去除异常行为记录,充分使用用户行为记录信息,计算出用户行为概率分布,并考虑多用户相似度,通过行为修正算法修正行为概率分布。
首先对本文相关定义说明:
所述的用户行为有游戏类、视频类、通讯类、购物类等行为,形式化表示为Si=(S1,S2,S3,···,Sn),i∈[1,n],Si为某一具体行为。
所述的行为属性为某一行为在行为序列中出现的频次。
所述的行为序列为一个多重集,在多重集中所有行为按行为发生时间排列。
所述的频繁行为为行为属性大于阈值α的行为。
所述的频繁行为序列为频繁行为组成的行为序列。
所述的前缀序列为频繁行为序列中最近一段没有重复行为的序列,序列长度为前缀序列阶数。
具体算法流程如下:
一种面向互联网环境的行为预测方法,包括以下步骤:
步骤1,获取触发预测算法运行指令;
步骤2,信息获取子系统11采集用户历史行为及其行为发生的场景信息,并生成预测算法所需的数据源;
行为信息获取模块111采集用户一段时间的历史行为和行为对应的场景信息,其中场景信息包括行为发生的时间和地点信息;
行为信息生成模块112将用户历史行为记录生成行为序列,同时将行为所发生的场景信息生成修正算法所需的数据源,并存入数据存储与管理中心子系统12;
步骤3,行为预测子系统13从数据存储与管理中心子系统12获取用户历史行为序列,频繁行为构建模块131根据行为属性在历史行为序列中的选择频繁行为,构建频繁行为序列;行为预测模块132根据频繁行为序列,计算行为概率分布,并存入数据存储与管理中心子系统12;
频繁行为序列构建模块131在数据存储与管理中心子系统12中获取用户历史行为序列,遍历用户历史行为序列,统计每个行为的行为属性,将所有行为属性同预设的阈值α比较,小于阈值α的行为去掉,大于或等于阈值α的行为组成频繁行为序列;设用户历史行为序列为T,频繁行为序列为T*,行为属性为f,T*中的行为形式化描述为:
S={S|S∈T,f≥α};
行为预测模块132根据频繁行为序列T*计算行为概率分布。设前缀序列形式化表示为lk=(l1,l2,l,···,ln),
Figure BDA0002038512130000071
k∈[1,n],k表示前缀序列阶数,则在k阶前缀序列后发生行为Si的概率计算方式为式(1):
Figure BDA0002038512130000072
其中,sum(lkSi)表示在前缀序列lk后发生行为Si的次数,sum(lk)表示前缀序列lk出现的次数;
在N个行为序列样本集中,定义ek作为k阶(k=1,2,3,···,n)前缀序列对应的预测误差,计算方式为式(2):
Figure BDA0002038512130000073
/>
其中,
Figure BDA0002038512130000074
为k阶前缀序列在第i样本的权值,i∈[1,N],通常情况下,当k=1时,全部设为1/N,/>
Figure BDA0002038512130000075
为k阶模型在第i个样本的预测结果,/>
Figure BDA0002038512130000076
计算方式为式(3):
Figure BDA0002038512130000077
定义λk为k阶前缀序列的权重系数,计算方式为式(4):
Figure BDA0002038512130000078
在得到k阶模型的权重系数后,根据
Figure BDA0002038512130000079
更新/>
Figure BDA00020385121300000710
的权值,在k阶模型中,对于预测错误的样本在k+1阶前缀序列中需要得到更大关注,所以在k+1阶前缀序列中提高预测错误样本的权值,降低预测正确样本的权值,/>
Figure BDA00020385121300000711
计算方式为式(5):
Figure BDA00020385121300000712
在得到每一阶前缀序列的权重系数后,定义δ(Si)为各阶前缀序列与其后发生行为Si的概率加权求和结果,计算方式为式(6),行为Si的概率计算方式为式(7):
Figure BDA00020385121300000713
Figure BDA0002038512130000081
P=(p(S1),p(S2),p(S3),···,p(Sn)) (8)
其中,p(Si)为发生行为Si的概率,用户行为发生概率分布为P,如式(8)所示,概率最大的为最有可能发生的行为,将行为概率分布P存储至数据存储与管理中心子系统12;
步骤4,预测修正子系统14从数据存储与管理中心子系统12获取行为场景信息和行为概率分布,最近邻用户集构建模块141依据行为发生的场景信息,计算多用户行为相似度,构建最近邻用户集;预测修正模块142根据最近邻用户修正行为概率分布;
最近邻用户集构建模块141在数据存储与管理中心子系统12中获取行为场景信息,构建最近邻用户集;定义行为序列相似度为D,计算方式为式(9):
Figure BDA0002038512130000082
其中,
Figure BDA0002038512130000083
为序列/>
Figure BDA0002038512130000084
的长度,/>
Figure BDA0002038512130000085
为序列/>
Figure BDA0002038512130000086
的长度,/>
Figure BDA0002038512130000087
为序列/>
Figure BDA0002038512130000088
和序列/>
Figure BDA0002038512130000089
最长公共子序列长度;
基于时间依赖性行为序列相似度定义为在同一时间段内行为序列相似度,表示为Dt,计算方式为式(10):
Figure BDA00020385121300000810
/>
其中,
Figure BDA00020385121300000811
表示行为流程相似度均值,/>
Figure BDA00020385121300000812
表示行为流程相似度方差,/>
Figure BDA00020385121300000813
值越大表示在同一时间段内行为序列相似度越高,
基于地点依赖性行为序列相似度定义为在同一地点内行为序列相似度,表示为Dd,计算方式为式(11):
Figure BDA00020385121300000814
其中,
Figure BDA00020385121300000815
表示行为流程相似度均值,/>
Figure BDA00020385121300000816
表示内行为流程相似度方差,/>
Figure BDA00020385121300000817
值越大表示在同一地点内行为序列相似度越高,
基于时间和地点依赖性定义用户r和用户m相似度为sim(r,m),计算方式为式(12):
Figure BDA0002038512130000091
其中,ε为权重因子,取决于时间和地点对于预测的重要程度,计算目标用户和所有用户相似度,选择相似度较高的前M个用户组成最近邻用户集;
预测修正模块142在数据存储与管理中心子系统12中获取目标用户和最近邻用户行为预测概率分布,根据最近邻用户集修正行为概率分布,定义相似度权重γm为式(13):
Figure BDA0002038512130000092
其中,r为目标用户,m为最近邻用户,m∈[1,M],修正后结果为式(14):
Figure BDA0002038512130000093
p*r(Si)=(p*r(S1),p*r(S2),p*r(S3),···,p*r(Sn)),i∈[1,n] (15)
其中,pr(S)为目标用户行为发生概率,pm(S)为最近邻用户行为发生概率,m∈[1,M],p*r(Si)为修正后行为预测结果,如式(15)所示,数值最大的为最有可能发生的行为。

Claims (7)

1.一种面向互联网环境的行为预测方法,其特征在于,包括以下步骤:
步骤1,获取触发预测算法运行指令;
步骤2,信息获取子系统(11)采集用户历史行为及其行为发生的场景信息,并生成预测算法所需的数据源;
步骤3,行为预测子系统(13)从数据存储与管理中心子系统(12)获取用户历史行为序列,频繁行为构建模块(131)根据行为属性在历史行为序列中的选择频繁行为,构建频繁行为序列;行为预测模块(132)根据频繁行为序列,计算行为概率分布,并存入数据存储与管理中心子系统(12);
步骤3所述的频繁行为构建模块(131),遍历用户历史行为序列,统计每个行为的行为属性,将所有行为属性同预设的阈值α比较,小于阈值α的行为去掉,大于或等于阈值α的行为组成频繁行为序列;设用户历史行为序列为T,频繁行为序列为T*,行为属性为f,T*中的行为形式化描述为:
S={S|S∈T,f≥α};
步骤3所述的行为预测模块(132)根据频繁行为序列,计算行为概率分布,其方法具体为:
设前缀序列形式化表示为lk=(l1,l2,l,···,ln),
Figure FDA0003921896120000011
k∈[1,n],n表示前序行为发生次数,k表示前缀序列阶数,则在k阶前缀序列后发生行为Si的概率计算方式为式(1):
Figure FDA0003921896120000012
其中,sum(lkSi)表示在前缀序列lk后发生行为Si的次数,sum(lk)表示前缀序列lk出现的次数,
在N个行为序列样本集中,定义ek作为k阶,k=1,2,3,···,n,前缀序列对应的预测误差,计算方式为式(2):
Figure FDA0003921896120000013
其中,
Figure FDA0003921896120000014
为k阶前缀序列在第i样本的权值,i∈[1,N],当k=1时,全部设为1/N,/>
Figure FDA0003921896120000015
为k阶模型在第i个样本的预测结果,/>
Figure FDA0003921896120000016
计算方式为式(3):
Figure FDA0003921896120000021
定义λk为k阶前缀序列的权重系数,计算方式为式(4):
Figure FDA0003921896120000022
在得到k阶模型的权重系数后,根据
Figure FDA0003921896120000023
更新/>
Figure FDA0003921896120000024
的权值,在k阶模型中,对于预测错误的样本在k+1阶前缀序列中需要得到更大关注,所以在k+1阶前缀序列中提高预测错误样本的权值,降低预测正确样本的权值,/>
Figure FDA0003921896120000025
计算方式为式(5):/>
Figure FDA0003921896120000026
在得到每一阶前缀序列的权重系数后,定义δ(Si)为各阶前缀序列与其后发生行为Si的概率加权求和结果,计算方式为式(6),行为Si的概率计算方式为式(7):
Figure FDA0003921896120000027
Figure FDA0003921896120000028
P=(p(S1),p(S2),p(S3),···,p(Sn)) (8)
其中,p(Si)为发生行为Si的概率,用户行为发生概率分布为P,如式(8)所示,概率最大的为最有可能发生的行为,将行为概率分布P存储至数据存储与管理中心子系统(12);
步骤4,预测修正子系统(14)从数据存储与管理中心子系统(12)获取行为场景信息和行为概率分布,最近邻用户集构建模块(141)依据行为发生的场景信息,计算多用户行为相似度,构建最近邻用户集;预测修正模块(142)根据最近邻用户修正行为概率分布。
2.根据权利要求1所述的一种面向互联网环境的行为预测方法,其特征在于,步骤4所述的最近邻用户集构建模块(141)依据行为发生的场景信息,计算多用户行为相似度,构建最近邻用户集,其方法为:
定义行为序列相似度为D,计算方式为式(9):
Figure FDA0003921896120000031
其中,|T1 *|为序列T1 *的长度,|T2 *|为序列T2 *的长度,|len(T1 *,T2 *)|为序列T1 *和序列T2 *最长公共子序列长度;
基于时间依赖性行为序列相似度定义为在同一时间段内行为序列相似度,表示为Dt,计算方式为式(10):
Figure FDA0003921896120000032
其中,mean(D(T1 *,T2 *))表示行为流程相似度均值,var(D(T1 *,T2 *))表示行为流程相似度方差,Dt(T1 *,T2 *)值越大表示在同一时间段内行为序列相似度越高,
基于地点依赖性行为序列相似度定义为在同一地点内行为序列相似度,表示为Dd,计算方式为式(11):
Figure FDA0003921896120000033
其中,mean(D(T1 *,T2 *))表示行为流程相似度均值,var(D(T1 *,T2 *))表示内行为流程相似度方差,Dd(T1 *,T2 *)值越大表示在同一地点内行为序列相似度越高,
基于时间和地点依赖性定义用户r和用户m相似度为sim(r,m),计算方式为式(12):
Figure FDA0003921896120000034
/>
其中,ε为权重因子,取决于时间和地点对于预测的重要程度,计算目标用户和所有用户相似度,选择相似度较高的前M个用户组成最近邻用户集。
3.根据权利要求2所述的一种面向互联网环境的行为预测方法,其特征在于,所述预测修正模块(142)根据最近邻用户集修正行为概率分布,其方法为:
定义相似度权重γm为式(13):
Figure FDA0003921896120000035
其中,r为目标用户,m为最近邻用户,m∈[1,M],修正后结果为式(14):
Figure FDA0003921896120000041
p*r(Si)=(p*r(S1),p*r(S2),p*r(S3),···,p*r(Sn)),i∈[1,n] (15)
其中,pr(S)为目标用户行为发生概率,pm(S)为最近邻用户行为发生概率,m∈[1,M],p*r(Si)为修正后行为预测结果,如式(15)所示,数值最大的为最有可能发生的行为。
4.实现权利要求1所述的一种面向互联网环境的行为预测方法的预测系统,其特征在于,包括信息获取子系统(11)、数据存储与管理中心子系统(12)、行为预测子系统(13)、预测修正子系统(14);
所述的信息获取子系统(11),用以采集用户历史行为及其行为发生的场景信息,并生成系统所需的数据源;
所述的数据存储与管理中心子系统(12),用以完成用户历史行为记录、行为发生的场景信息、行为概率分布数据的存储与管理;
所述的行为预测子系统(13),基于用户历史行为序列计算用户行为概率分布;
所述的预测修正子系统(14),基于最近邻用户集修正行为概率分布。
5.根据权利要求4所述的一种面向互联网环境的行为预测方法的预测系统,其特征在于,所述的信息获取子系统(11)包括:行为信息获取模块(111)、行为信息生成模块(112);
所述的行为信息获取模块(111),采集用户历史行为及其行为发生的场景信息;
所述的行为信息生成模块(112),将用户历史行为记录生成预测算法所需的数据源,同时将行为所发生的场景信息生成修正算法所需的数据源,并存入数据存储与管理中心子系统(12)。
6.根据权利要求4所述的一种面向互联网环境的行为预测方法的预测系统,其特征在于,所述的行为预测子系统(13)包括:频繁行为构建模块(131)、行为预测模块(132);
所述的频繁行为构建模块(131),根据行为属性在历史行为序列中的选择频繁行为,构建频繁行为序列;
所述的行为预测模块(132),根据频繁行为序列,计算出行为概率分布,并存入数据存储与管理中心子系统(12)。
7.根据权利要求4所述的一种面向互联网环境的行为预测方法的预测系统,其特征在于,所述的预测修正子系统(14)包括:最近邻用户集构建模块(141)、预测修正模块(142);
所述的最近邻用户集构建模块(141),依据行为发生的场景信息,计算多用户行为相似度,构建最近邻用户集;
所述的预测修正模块(142),根据最近邻用户修正行为概率分布。
CN201910333755.6A 2019-04-24 2019-04-24 一种面向互联网环境的行为预测方法及其预测系统 Active CN110069719B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910333755.6A CN110069719B (zh) 2019-04-24 2019-04-24 一种面向互联网环境的行为预测方法及其预测系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910333755.6A CN110069719B (zh) 2019-04-24 2019-04-24 一种面向互联网环境的行为预测方法及其预测系统

Publications (2)

Publication Number Publication Date
CN110069719A CN110069719A (zh) 2019-07-30
CN110069719B true CN110069719B (zh) 2023-03-31

Family

ID=67368605

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910333755.6A Active CN110069719B (zh) 2019-04-24 2019-04-24 一种面向互联网环境的行为预测方法及其预测系统

Country Status (1)

Country Link
CN (1) CN110069719B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112257933B (zh) * 2020-10-26 2023-07-07 西安工程大学 一种用于网络环境的用户行为预测系统及其方法

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102216941A (zh) * 2008-08-19 2011-10-12 数字标记公司 用于内容处理的方法和系统
CN104572886A (zh) * 2014-12-23 2015-04-29 浙江大学 基于k线图表示的金融时间序列相似性查询方法
CN104834967A (zh) * 2015-04-24 2015-08-12 南京邮电大学 泛在网络下基于用户相似度的业务行为预测方法
CN106595665A (zh) * 2016-11-30 2017-04-26 耿生玲 一种障碍空间中移动对象时空轨迹的预测方法
CN106991490A (zh) * 2017-02-16 2017-07-28 南京邮电大学 基于混合Markov模型的业务协同预测方法
CN107194176A (zh) * 2017-05-23 2017-09-22 复旦大学 一种残疾人智能操作的数据填补与行为预测的方法
CN109255477A (zh) * 2018-08-24 2019-01-22 国电联合动力技术有限公司 一种基于深度极限学习机的风速预测方法及其系统和机组

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20180025303A1 (en) * 2016-07-20 2018-01-25 Plenarium Inc. System and method for computerized predictive performance analysis of natural language

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102216941A (zh) * 2008-08-19 2011-10-12 数字标记公司 用于内容处理的方法和系统
CN104572886A (zh) * 2014-12-23 2015-04-29 浙江大学 基于k线图表示的金融时间序列相似性查询方法
CN104834967A (zh) * 2015-04-24 2015-08-12 南京邮电大学 泛在网络下基于用户相似度的业务行为预测方法
CN106595665A (zh) * 2016-11-30 2017-04-26 耿生玲 一种障碍空间中移动对象时空轨迹的预测方法
CN106991490A (zh) * 2017-02-16 2017-07-28 南京邮电大学 基于混合Markov模型的业务协同预测方法
CN107194176A (zh) * 2017-05-23 2017-09-22 复旦大学 一种残疾人智能操作的数据填补与行为预测的方法
CN109255477A (zh) * 2018-08-24 2019-01-22 国电联合动力技术有限公司 一种基于深度极限学习机的风速预测方法及其系统和机组

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
Reinforcement Learning Optimized Look-Ahead Energy Management of a Parallel Hybrid Electric Vehicle;Teng Liu等;《 IEEE/ASME Transactions on Mechatronics》;20170831;第22卷(第4期);1497-1507 *
基于马尔科夫随机场的微博用户转发行为预测;王宁 等;《中文信息学报》;20181231;第32卷(第6期);107-113 *
大数据环境下移动对象自适应轨迹预测模型;乔少杰 等;《软件学报》;20151231;第26卷(第11期);2869-2883 *
移动互联环境下基于改进 Markov融合模型的用户行为预测算法;张晖 等;《计算机应用研究》;20181031;第35卷(第10期);3029-3032 *

Also Published As

Publication number Publication date
CN110069719A (zh) 2019-07-30

Similar Documents

Publication Publication Date Title
He et al. QoE-driven content-centric caching with deep reinforcement learning in edge-enabled IoT
WO2023035564A1 (zh) 基于分位数梯度提升决策树的负荷区间预测方法及系统
CN110968426B (zh) 一种基于在线学习的边云协同k均值聚类的模型优化方法
WO2021129086A1 (zh) 流量预测方法、装置以及存储介质
CN112633316B (zh) 一种基于边界估值理论的负荷预测方法和装置
CN109413710B (zh) 基于遗传算法优化的无线传感器网络的分簇方法及装置
CN109116299B (zh) 一种指纹定位方法、终端、计算机可读存储介质
CN115633380B (zh) 一种考虑动态拓扑的多边缘服务缓存调度方法和系统
CN111125519A (zh) 用户行为预测方法、装置、电子设备以及存储介质
CN110069719B (zh) 一种面向互联网环境的行为预测方法及其预测系统
CN113807452B (zh) 一种基于注意力机制的业务过程异常检测方法
Jiang et al. Federated learning-based content popularity prediction in fog radio access networks
CN116756522B (zh) 概率预报方法、装置、存储介质及电子设备
Gao et al. A deep learning framework with spatial-temporal attention mechanism for cellular traffic prediction
Li et al. Temporal-spatial collaborative mobile edge caching with user satisfaction awareness
CN116485049A (zh) 一种基于人工智能的电能计量误差预测与优化系统
CN116794510A (zh) 故障预测方法、装置、计算机设备和存储介质
CN113342474B (zh) 客户流量的预测、模型训练的方法、设备及存储介质
CN115577797A (zh) 一种基于本地噪声感知的联邦学习优化方法及系统
Yang et al. Cloud-edge-end intelligence for fault-tolerant renewable energy accommodation in smart grid
Tian et al. Hierarchical federated learning with adaptive clustering on non-IID data
CN112532615A (zh) 一种智能电网蠕虫检测方法
CN116342077B (zh) 一种适用于数据缺失场站的新能源功率迁移学习预测方法
Ming et al. Ensemble learning based sleeping cell detection in cloud radio access networks
Lu et al. Anomaly Recognition Method for Massive Data of Power Internet of Things Based on Bayesian Belief Network

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
CB03 Change of inventor or designer information

Inventor after: Gao Quanli

Inventor after: Wang Chao

Inventor after: Gao Ling

Inventor after: Hao Yaling

Inventor after: Wang Zetian

Inventor before: Wang Chao

Inventor before: Gao Ling

Inventor before: Gao Quanli

Inventor before: Hao Yaling

Inventor before: Wang Zetian

CB03 Change of inventor or designer information
GR01 Patent grant
GR01 Patent grant