CN104537272B - 动态重复行为的预测方法 - Google Patents

动态重复行为的预测方法 Download PDF

Info

Publication number
CN104537272B
CN104537272B CN201510030482.XA CN201510030482A CN104537272B CN 104537272 B CN104537272 B CN 104537272B CN 201510030482 A CN201510030482 A CN 201510030482A CN 104537272 B CN104537272 B CN 104537272B
Authority
CN
China
Prior art keywords
behavior
user
article
song
dynamic
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201510030482.XA
Other languages
English (en)
Other versions
CN104537272A (zh
Inventor
王朝坤
陈俊
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tsinghua University
Original Assignee
Tsinghua University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tsinghua University filed Critical Tsinghua University
Priority to CN201510030482.XA priority Critical patent/CN104537272B/zh
Publication of CN104537272A publication Critical patent/CN104537272A/zh
Application granted granted Critical
Publication of CN104537272B publication Critical patent/CN104537272B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Abstract

本发明公开一种动态重复行为的预测方法,涉及计算机数据处理技术领域,包括:获取用户对物品的使用行为数据;提取用户和物品行为特征;依据所提取的行为特征生成训练数据集;通过线性拟合的方式,估算参数向量,使得训练数据集中每个向量与该参数向量的乘积分别接近各自对应的判定的标准值;给出判定结果,依据判定结果预测重复行为。本发明所要解决的技术问题是提供一种动态重复行为的预测方法,能够预测出每一位用户在给定的时间附近是否会执行一次重复行为。

Description

动态重复行为的预测方法
技术领域
本发明涉及计算机数据处理技术领域,特别是涉及一种动态重复行为的预测方法。
背景技术
重复性行为在人们的日常生活中十分的普遍,例如人们时常重复地听自己喜爱的音乐,到熟悉的餐馆吃饭,去同一个社交网站中浏览信息等等。对人们的重复性行为进行分析和预测有助于我们进一步了解用户的行为模式,进而为用户提供个性化的服务,同时,也能有利于资源的有效利用。例如,若一种方法能为餐馆或商场预测出其每一位顾客是否会在短期内再次前来就餐或购物,那么这些餐馆或商场就可以赠送给他们更多的优惠券,以促进消费。又例如,若一个音乐推荐系统能预测出其用户接下来是否会重听一首该用户不久前刚听过的歌曲,那么这个音乐推荐系统就能更有效的生成推荐结果,提升用户的满意度。
然而遗憾的是,目前尚未有公开的、已知的、能直接预测用户在某一给定的时刻下是否会执行一次重复行为的方法。现有的、已公开的关于用户的重复行为的研究工作基本上都局限在某一小领域中,例如分析餐馆食物的味道与用户再次品尝的关系等等。这类研究主要以分析为主,不能进行预测,同时,这些研究工作过于局限,不能用于更广泛的、普适的用户重复行为研究中,例如不能直接应用于用户重复听某些歌曲、重复访问某个网站等问题中。
因此,目前需要本领域技术人员迫切解决的一个技术问题就是:如何能够创新地提出一种有效方法,以满足实际应用中的更多需求,创造更多的应用价值。
发明内容
本发明所要解决的技术问题是提供一种动态重复行为的预测方法,能够预测出每一位用户在给定的时间附近是否会执行一次重复行为。
为了解决上述技术问题,本发明实施例公开了一种动态重复行为的预测方法,包括:
获取用户对物品的使用行为数据;
提取用户和物品行为特征;
依据所提取的行为特征生成训练数据集;
通过线性拟合的方式,估算参数向量,使得训练数据集中每个向量与该参数向量的乘积分别接近各自对应的判定的标准值;
给出判定结果,依据判定结果预测重复行为。
优选的,所述用户行为特征包括动态的窗口的特征和用户重用率。
优选的,所述物品行为特征包括物品重用率和物品流行度。
优选的,所述用户对物品的使用行为为重复听歌行为。
与现有技术相比,本发明具有以下优点:
本发明从用户近期对物品的使用行为历史记录中抽取出重要的行为特征,并根据这些行为特征预测该用户在下一个行为时刻是否会执行一次重复行为。本发明方法的实施不依赖于具体的应用场景和领域,具有较高的普适性,能帮助理解用户的行为模式,并进而为用户提供更加个性化的服务,实现资源的有效配置。
附图说明
图1是本发明的一种动态重复行为的预测方法实施例的流程示意图;
图2是具体实施方式中提到的方法实施的流程图;
图3是具体实施方式中提到的滑动窗口及其滑动的过程示意图;
图4是具体实施方式中提到的预测用户是否会在某一时刻再次听某首不久前刚听过的歌曲为例进行详细说明的示意图。
具体实施方式
为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本发明作进一步详细的说明。
参见图1,本方案所述的一种动态重复行为的预测方法的流程示意图,具体包括:
步骤S101,获取用户对物品的使用行为数据;
步骤S102,提取用户和物品行为特征;
步骤S103,依据所提取的行为特征生成训练数据集;
步骤S104,通过线性拟合的方式,估算参数向量,使得训练数据集中每个向量与该参数向量的乘积分别接近各自对应的判定的标准值;
步骤S105,给出判定结果,依据判定结果预测重复行为。
为使本发明的方案便于理解和实现对技术做更为具体的介绍,方案实现是基于对用户的动态重复行为的预测方法,包括以下具体的实施步骤:
(1)本发明通过抽取用户近期的行为特征,并结合由机器学习方法得到线性和二次判别函数,来预测用户在当前时刻是否会重复执行一次近期完成过的行为;
(2)参见图2为本发明方法实施包括5个主要的实施阶段示意图;
(3)阶段1,获取用户使用物品的行为数据,设获取到M位用户对N个物品的使用行为数据,记用户集合为U={u1,u2,…,u.},物品集合为V={v1,v2,…,vN},集合U和集合V中每一个元素分别表示唯一的一个用户和一个物品,记Hu={xu,1,xu,2,…}表示用户u的原始的使用行为数据按其发生的时间的升序排列的列表,其中的任一元素xu,i表示用户u的第i次使用行为,并且xu,i∈V,对任意的i<j,满足行为xu,i的发生时间早于行为xu,j的发生时间;
(4)定义滑动窗口大小W,该值表示在对用户行为进行分析时,每次将按时间顺序排列的连续的W次用户行为作为一个整体来分析,W取值自定义,如10、50、100等;
(5)阶段2中分别按步骤(6)和步骤(8)对V中的每个物品提取物品流行度和物品重用率两种特征,按步骤(10)对U中的每个用户分别提取用户重用率特征;
(6)分别遍历每个用户u的使用行为列表Hu,为每个物品v分别统计其被使用的次数,记为f(v),通过比较f(v)值大小,获取V中各物品出现次数的最大值,记为fmax,然后计算V中各物品的归一化的流行度,记v的物品流行度为:
(7)为V中每个物品v初始化其观测次数c(v)=0,重用次数r(v)=0,为U中的每个用户u初始化其观测次数c(u)=0,重用次数r(u)=0;
(8)抽取物品重用率特征包含以下子步骤:
a.将U中所有用户均标记为“未访问”状态,然后执行子步骤b);
b.创建一个大小为W的空的滑动窗口w,然后执行子步骤c);
c.若U中所有用户均标记为“已访问”状态,则执行子步骤f),否则,从U中选取一个标记为“未访问”状态的用户u,将u重新标记为“已访问”状态,按时间升序遍历u的使用行为列表Hu,将Hu的前W次用户行为添加入滑动窗口w中,然后执行子步骤d);
d.判断Hu中在w之后是否还有更新的用户行为,若没有,则执行子步骤b),若有,则记Hu中在w之后的第一次用户行为为x,行为x使用的物品为v,将物品v的观测次数加1,c(v)=c(v)+1,比较物品v与w中现有的各物品,若物品v存在于w中,则x是一次重复行为,并将物品v的重用次数加1,r(v)=r(v)+1,否则,x不是一次重复行为,不修改r(v)的值,在任意情况下,均执行子步骤e);
e.将行为x添加入滑动窗口w中,并将w中发生时间最早的一次行为从w中删除,即w按时间升序在Hu上向前“滑动”了一步,然后返回执行子步骤d);
f.计算V中各物品的重用率特征,物品v的物品重用率为:此处,也可以按来计算物品v的物品重用率特征,但在同一个数据集合中,必须使用同一种计算方式;
(9)附图3显示了在W=3的情况下,滑动窗口及其滑动的过程,例如在开始阶段,仅用户行为xu,1、xu,2、xu,3被添加入滑动窗口w中,考察行为xu,4使用的物品是否在行为xu,1、xu,2、xu,3中被使用过,判断是否为重用行为,并更新对应的c(v)和r(v)的值,而在连续地将w向前滑动4次之后,w中包含的行为为xu,5、xu,6、xu,7,此时,w后已无用户行为,则停止滑动w;
(10)抽取用户重用率特征包含以下子步骤:
a.将U中所有用户均标记为“未访问”状态,执行子步骤b);
b.创建一个大小为W的空的滑动窗口w,执行子步骤c);
c.若U中所有用户均标记为“已访问”状态,则结束循环,否则,从U中选取一个标记为“未访问”状态的用户u,将u重新标记为“已访问”状态,按时间升序遍历u的使用行为列表Hu,将Hu的前W次用户行为添加入滑动窗口w中,然后执行子步骤d);
d.判断Hu中在w之后是否还有更新的用户行为,若没有,则计算用户u的重用率特征,u的用户重用率为:然后返回执行子步骤b),若有,则记Hu上在w之后的第一次用户行为为x,行为x使用的物品为v,将用户u的观测次数加1,c(u)=c(u)+1,比较物品v与w中现有的各物品,若物品v存在于w中,则x是一次重复行为,将用户u的重用次数加1,r(u)=r(u)+1,否则,x不是一次重复行为,不修改r(u)的值,任意情况下,均执行子步骤e);
e.将行为x添加入滑动窗口w中,并将w中发生时间最早的一次行为删除,即w按时间升序在Hu上向前“滑动”一步,然后返回执行子步骤d);
(11)阶段3,生成训练数据集T包含以下子步骤:
a.创建空的训练集集合T={},执行子步骤b);
b.将U中所有用户均标记为“未访问”状态,执行子步骤c);
c.创建一个大小为W的空的滑动窗口w,执行子步骤d);
d.若U中所有用户均标记为“已访问”状态,则结束循环,否则,从U中选取一个标记为“未访问”状态的用户u,将u重新标记为“已访问”状态,按时间升序遍历u的使用行为列表Hu,将Hu的前W次用户行为添加入滑动窗口w中,然后执行子步骤e);
e.计算w中使用过的物品的平均物品流行度、平均物品重用率,分别记为计算滑动窗口w中重复行为的比例,记为其中DS(w)表示w中使用过的互不相同的物品集合,|DS(w)|表示该集合中元素的个数,然后生成特征向量F={pw,rvw,rw,ru(u)},再执行子步骤f);
f.判断Hu中在w之后是否还有更新的用户行为,若没有,然后返回执行子步骤3),若有,则记Hu上在w之后的第一次用户行为为x,行为x使用的物品为v,比较物品v与w中现有的各物品,若物品v存在于w中,则x是一次重复行为,将二元组<F,1>加入训练集合T中,否则,x不是一次重复行为,将二元组<F,0>加入训练集合T中,二元组中的数值1和0为训练样本的类别标签,然后执行子步骤g);
g.将行为x添加入滑动窗口w中,并将w中发生时间最早的一次行为删除,即w按时间升序在Hu上向前“滑动”一步,然后返回执行子步骤e);
(12)阶段4,定义代价函数:
上式中Z为待求解的向量,Zi为向量Z第i个维度的值,Z与F的维数相同,Z·F表示向量Z和向量F的内积,l为特征向量样本F对应的类别标签,为数值1或0,λ为正则项的参数,其值通常可设为0.01、0.001等,求解向量Z的方法是最小化代价函数G(Z),即
(13)学习参数向量Z的过程主要包含以下子步骤:
a.在满足∑iZi=1的条件下,随机初始化向量Z各维度的值,或者令(因为在本发明方法中向量Z一共有4个维度),并初始化迭代次数标记iter=0,然后执行子步骤b);
b.定义最大迭代次数Max_Iters,一般可取值为100,定义迭代中最小代价误差∈,∈的值一般设置为较小的数值,如0.1、0.01等,然后执行子步骤c);
c.计算目标函数G(Z)的值,记为C,然后执行子步骤d);
d.计算G(Z)对Zi的偏导数,记为然后计算更新的向量Z各维度的值,
上式中Δ表示学习步长,Δ值越大,收敛越快,但越可能收敛到局部最优,而非全局最优,Δ值越小,收敛越慢,但越可能收敛到全局最优,一般情况下Δ可取较小的值,如0.01或0.001等,然后执行子步骤e);
e.计算目标函数G(Z′)的值,记为C′,令迭代次数标记加1,即iter=iter+1,比较C′与C值的大小,得到以下结果:
i.若C′≥C,则直接结束循环;
ii.若C′<C且iter≥Max_Iters,则直接结束循环;
iii.若C′<C,iter<Max_Iters,且C-C′<∈,则令Z=Z′,然后再结束循环;
iv.若C′<C,iter<Max_Iters,且C-C′≥∈,则令C=
C′,Z=Z′,然后返回执行子步骤d),直至结束循环;
(14)阶段5,对待预测的用户u,获取u最近的W次使用行为,并将其添加入一个空的滑动窗口w中,按步骤(11)中的子步骤5)计算w的特征向量F,然后计算Z·F的值,其中向量Z由阶段4中的机器学习过程得到,若则本发明方法预测用户u下一时刻即将执行一次重复行为,且使用的物品在w中曾使用过,若 则本发明方法预测用户u下一时刻不会执行一次重复行为,即u下一时刻即将使用的物品不存在于w中;
(15)对步骤(13)中定义的目标函数G(Z)还可以替换为另一种表达式:
向量Z仍通过步骤(14)的方法学习得到,而对应在步骤(15)中则是判断
为使本领域技术人员更好地理解本发明,以下结合预测用户是否会在某一时刻再次听某首不久前刚听过的歌曲为例进行详细说明,如图4所示,为已获取到的三位用户听歌立式数据,用户集合U={u1,u2,u3},音乐歌曲集合V含有10首不同的歌曲,即V={v1,v2,v3,v4,v5,v6,v7,v8,v9,v10}。三位用户原有的听音乐的行为数据按其发生时间的升序排列的列表分别为Hu1,Hu2和Hu3。例如,用户u1最开始听了歌曲v1,接下来听了歌曲v2,再是v5、v6等等。为简化显示,图4中所有听音乐的行为均直接以其具体听的歌曲为代表,而未画出行为随机变量x。
在使用本发明时,首先需定义滑动窗口大小。在本例中,为了演示方便,使用的数据规模较小,因此,定义滑动窗口大小为W=4,但在实际应用中,W的数值一般会大一些,例如20、50、100等。
提取物品流行度特征。
首先,从图4中,统计每首歌曲被听过的总次数,得到如表1的统计结果。表中被听次数最多的为歌曲v2,被听了7次,即fmax=7。按本发明中物品流行度定义可分别计算出每首歌曲的物品流行度特征,例如对歌曲v1而言,在本例的物品流行度计算式中,对数log以2为底数,当然底数也可以用其它数值,如自然数e、整数10等,只要保证统一即可。表1歌曲的物品流行度特征统计表中第3行显示了本例中每首歌曲的物品流行度特征值。
歌曲 v1 v2 v3 v4 v5 v6 v7 v8 v9 v10
次数 5 7 4 3 4 4 5 5 3 2
p(v) 0.8617 1.0000 0.7740 0.6667 0.7740 0.7740 0.8617 0.8617 0.6667 0.5283
表1
提取物品重用率和用户重用率特征。
初始化每首歌曲的观测次数为0,c(v1)=c(v2)=c(v3)=c(v4)=c(v5)=c(v6)=c(v7)=c(v8)=c(v9)=c(v10)=0。初始化每首歌曲的重用次数为0,r(v1)=r(v2)=r(v3)=r(v4)=r(v5)=r(v6)=r(v7)=r(v8)=r(v9)=r(v10)=0。同时,初始化每个用户的观测次数为0,c(u1)=c(u2)=c(u3)=0。初始化每个用户的重用次数为0,r(u1)=r(u2)=r(u3)=0。
将3位用户均标记为“未访问”状态。
创建一个大小为W=4的空的滑动窗口w,从用户集合U中找到一个标记为“未访问”状态的用户,首先可找到用户u1
将用户u1标记为“已访问”状态,然后将u1的听歌历史行为记录Hu1中前W首歌曲(本例中,W=4)添加入w中,由图1可知,首先添加的4首歌曲为{v1,v2,v5,v6}。然后判断Hu1中在w之后的该用户听的第一首歌曲是否在w中出现过,从图1可知,w之后听的第一首歌是v2,而v2存在于w中。因此,w之后的这次听歌曲v2的行为是一次重复行为,于是,令v2的重用次数加1,r(v2)=r(v2)+1=1,同时,令用户u1的重用次数加1,r(u1)=r(u1)+1=1。但无论这次行为是否是重复行为,歌曲v2的观测次数都需要加1,c(v2)=c(v2)+1=1,同时,用户u1的观测次数都需要加1,c(u1)=c(u1)+1=1。
然后,将w之后听的第一首歌v2添加到w中,同时将w中最早听的那首歌曲v1从w中删除,以保持w的大小始终是W。此时,w中的歌曲包括{v2,v5,v6,v2}。再次判断Hu1中在w之后的该用户听的第一首歌曲是否在w中出现过,而w之后听的第一首歌是v5,而v5存在于w中。因此,w之后的这次听歌曲v5的行为也是一次重复行为,于是,令v5的重用次数加1,r(v5)=r(v5)+1=1,同时,令用户u1的重用次数加1,r(u1)=r(u1)+1=2。但无论这次行为是否是重复行为,歌曲v5的观测次数都需要加1,c(v5)=c(v5)+1=1,同时,用户u1的观测次数都需要加1,c(u1)=c(u1)+1=2。
类似的,将w之后听的第一首歌v5添加到w中,同时将w中最早听的那首歌曲v2从w中删除,以保持w的大小始终是W。此时,w中的歌曲包括{v5,v6,v2,v5}。再次判断Hu1中在w之后的该用户听的第一首歌曲是否在w中出现过,而w之后听的第一首歌是v7,但是v7不存在于w中。因此,w之后的这次听歌曲v7的行为不是一次重复行为,于是,不修改r(v7)和r(u1)的值。但仍需将v7的观测次数加1,c(v7)=v(v7)+1=1,同时,将用户u1的观测次数加1,c(u1)=c(u1)+1=3。
按以上方法每次将w在Hu1中向前“滑动”一步,并判断w后的下一步是否是重复行为,再依据判断结果,分别修改对应歌曲和物品的观测次数、重用次数。当滑动窗口w移至Hu1的最后一次听歌行为后,即w包含Hu1的最后W项听歌数据{v1,v3,v8,v8}时,由于Hu1中w之后已无用户u1更多的数据,于是,重新创建一个大小为W=4的空的滑动窗口w,从用户集合U中找到下一个标记为“未访问”状态的用户,此时,可找到用户u2,并按照以上遍历Hu1中数据的方法,来遍历Hu2的数据。在遍历完Hu2的数据之后,用同样的方法遍历Hu3的数据。至此,就以遍历完所有用户的听歌数据,并完成了每首歌曲和每个用户的观测次数、重用次数的计算。表2歌曲的物品重用率特征统计表中显示了本例中各首歌曲的物品重用率特征,其中第2行和第3行分别为歌曲的观测次数和重用次数,第4行和第5行分别为按计算的物品重用率特征,表2中log对数任意2为底数计算,但也依然可更换为别的底数。
表2
表3用户重用率特征统计表中显示了本例中各个用户的用户重用率特征,其中第2行和第3行分别为用户的观测次数和重用次数,第4行为按计算的用户重用率特征。
表3
生成训练数据集。
创建空的训练集集合T={},并将3位用户均标记为“未访问”状态。
创建一个大小为W=4的空的滑动窗口w,从用户集合U中找到一个标记为“未访问”状态的用户,首先可找到用户u1
将用户u1标记为“已访问”状态,然后将u1的听歌历史行为记录Hu1中前W首歌曲(本例中,W=4)添加入w中,由图1可知,首先添加的4首歌曲为{v1,v2,v5,v6}。计算当前w中物品的平均物品流行度 和平均物品重用率 然后计算滑动窗口中重复行为的比例由于用户u1的用户重用率为0.4,于是生成特征向量F={pw,rvw,rw,ru(u)}={0.852,0.609,0.0,0.4}。然后判断Hu1中在w之后的该用户听的第一首歌曲是否在w中出现过,从图1可知,w之后听的第一首歌是v2,而v2存在于w中。因此,w之后的这次听歌曲v2的行为是一次重复行为,于是,将二元组<{0.852,0.609,0.0,0.4},1>加入训练集合T中。
然后,将w之后听的第一首歌v2添加到w中,同时将w中最早听的那首歌曲v1从w中删除,以保持w的大小始终是W。此时,w中的歌曲包括{v2,v5,v6,v2}。计算当前w中物品的平均物品流行度 和平均物品重用率 然后计算滑动窗口中重复行为的比例 由于用户u1的用户重用率为0.4,于是生成特征向量F={pw,rvw,rw,ru(u)}={0.887,0.592,0.25,0.4}。再次判断Hu1中在w之后的该用户听的第一首歌曲是否在w中出现过,而w之后听的第一首歌是v5,而v5存在于w中。因此,w之后的这次听歌曲v5的行为也是一次重复行为,于是,将二元组<{0.887,0.592,0.25,0.4},1>加入训练集合T中。
类似的,将w之后听的第一首歌v5添加到w中,同时将w中最早听的那首歌曲v2从w中删除,以保持w的大小始终是W。此时,w中的歌曲包括{v5,v6,v2,v5}。计算当前w中物品的平均物品流行度 和平均物品重用率 然后计算滑动窗口中重复行为的比例 由于用户u1的用户重用率为0.4,于是生成特征向量F={pw,rvw,rw,ru(u)}={0.831,0.609,0.25,0.4}。再次判断Hu1中在w之后的该用户听的第一首歌曲是否在w中出现过,而w之后听的第一首歌是v7,但是v7不存在于w中。因此,w之后的这次听歌曲v7的行为不是一次重复行为,于是,将二元组<{0.831,0.609,0.25,0.4},0>加入训练集合T中。
按以上方法每次将w在Hu1中向前“滑动”一步,并判断w后的下一步是否是重复行为,再依据判断结果,修改对应歌曲的观测次数和重用次数。当滑动窗口w移至Hu1的最后一次听歌行为后,即w包含Hu1的最后W项听歌数据{v1,v3,v8,v8}时,由于Hu1中w之后已无用户u1更多的数据,于是,重新创建一个大小为W=4的空的滑动窗口w,从用户集合U中找到下一个标记为“未访问”状态的用户,此时,可找到用户u2,并按照以上遍历Hu1中数据的方法,来遍历Hu2的数据。在遍历完Hu2的数据之后,用同样的方法遍历Hu3的数据。至此,就以遍历完所有用户的听歌数据,并得到最终的训练集集合,如表3所示。
表3
估算参数向量Z。
初始化参数向量Z,在本例中,令同时,初始化迭代次数标记iter=0,最大迭代次数Max_Iters=100,迭代中最小代价误差∈=0.01。
令迭代次数标记加1,iter=iter+1=1,计算当前目标函数G(Z)的值,令本例中参数λ=0.01,
计算此时G(Z)对向量Z每个维度的偏导数的值。
例如,
同理可得,
设学习步长Δ=0.01,更新个性化参数:
计算目标函数G(Z′)的值,C′=7.4117。
因为,C′<C,iter<Max_Iters,且C-C′=0.0212≥∈,所以,不满足任何退出循环迭代的条件。于是,令C=C′,Z=Z′,然后重复上述循环。
为简化复杂的循环迭代过程,本例中假设循环迭代在5次后结束,可计算此时参数向量Z的值为:Z={0.2863,0.2467,0.1963,0.2522}。
分别预测用户u1,u2,u3的动态重复行为。
以用户u1为例,该用户在图1中最后W次听歌时,所听的歌曲依次为{v1,v3,v8,v8},而本发明可以预测该用户下次听歌时是否会从{v1,v3,v8,v8}中选一首听。按本发明方法,首先计算当前窗口中歌曲的平均流行度和平均重用率滑动窗口中重复行为的比例由于用户u1的用户重用率为ru(u)=0.4,生成特征向量F={pw,rvw,rw,ru(u)}={0.8398,0.5,0.25,0.4}。因此,可计算Z·F={0.2863,0.2467,0.1963,0.2522}·{0.8398,0.5,0.25,0.4}=0.5137。因为于是,本发明预测用户u1下次听歌行为是一次重复行为,即u1会从{v1,v3,v8,v8}中选择某一首歌来听。
使用本发明预测用户u2和用户u3下一次听歌是重复行为的概率分别为0.5367和0.6645,因此,这本发明也预测这两位用户下一次听歌均为重复行为。但是,本发明也认为,在三位用户u1,u2,u3之中,用户u3最有可能会在下一次听歌时执行一次重复行为。
以上对本发明所提供的一种动态重复行为的预测方法进行了详细介绍,本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。

Claims (4)

1.一种动态重复行为的预测方法,其特征在于,包括:
获取用户对物品的使用行为数据,物品的类型为歌曲,对应的物品的使用行为数据为播放歌曲;
提取用户和物品行为特征,包括物品流行度、物品重用率、用户重用率和窗口中重复行为的比例;
依据所提取的行为特征生成训练数据集,训练数据集包含行为特征向量和类别标签即重复行为或非重复行为;
通过线性或二次拟合的方式,即拟合目标为线性函数或二次函数,估算参数向量,使得训练数据集中每个向量与该参数向量的乘积分别接近各自对应的判定的标准值;
给出“是”或“否”为重复行为的判定结果,分别对应执行重复行为和非重复行为。
2.如权利要求1所述的动态重复行为的预测方法,其特征在于,所述用户行为特征包括动态的窗口的特征和用户重用率。
3.如权利要求1所述的动态重复行为的预测方法,其特征在于,所述物品行为特征包括物品重用率和物品流行度。
4.如权利要求1所述的动态重复行为的预测方法,其特征在于,所述用户对物品的使用行为为重复听歌行为。
CN201510030482.XA 2015-01-21 2015-01-21 动态重复行为的预测方法 Active CN104537272B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510030482.XA CN104537272B (zh) 2015-01-21 2015-01-21 动态重复行为的预测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510030482.XA CN104537272B (zh) 2015-01-21 2015-01-21 动态重复行为的预测方法

Publications (2)

Publication Number Publication Date
CN104537272A CN104537272A (zh) 2015-04-22
CN104537272B true CN104537272B (zh) 2018-07-06

Family

ID=52852798

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510030482.XA Active CN104537272B (zh) 2015-01-21 2015-01-21 动态重复行为的预测方法

Country Status (1)

Country Link
CN (1) CN104537272B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112381615B (zh) * 2020-11-27 2022-09-02 华中科技大学 基于用户重复行为模式挖掘的短序列推荐方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101996213A (zh) * 2009-08-27 2011-03-30 顾海松 一种实时客户购物行为分析系统及其方法
CN102667839A (zh) * 2009-12-15 2012-09-12 英特尔公司 在用户行为的趋势分析和简档建立以及基于模板的预测中使用概率技术以便提供推荐的系统、装置和方法
CN104063429A (zh) * 2014-06-11 2014-09-24 深圳德协保税电子商务有限公司 电子商务中用户行为的预测方法
CN104093044A (zh) * 2014-01-20 2014-10-08 腾讯科技(深圳)有限公司 在线媒体播放方法、服务器及系统

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101996213A (zh) * 2009-08-27 2011-03-30 顾海松 一种实时客户购物行为分析系统及其方法
CN102667839A (zh) * 2009-12-15 2012-09-12 英特尔公司 在用户行为的趋势分析和简档建立以及基于模板的预测中使用概率技术以便提供推荐的系统、装置和方法
CN104093044A (zh) * 2014-01-20 2014-10-08 腾讯科技(深圳)有限公司 在线媒体播放方法、服务器及系统
CN104063429A (zh) * 2014-06-11 2014-09-24 深圳德协保税电子商务有限公司 电子商务中用户行为的预测方法

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
"Inferring Continuous Dynamic Social Influence and Personal Preference for Temporal Behavior Prediction";Zhang J 等;《Proc. VLDB EndowK》;20140815;第8卷(第3期);第269-280页 *
"Learning Temporal Dynamics of Behavior Propagation in Social Networks";Zhang J 等;《Proceedings of the Twenty-Eighth AAAI Conference on Artificial Intelligence》;20141215;第229-236页 *
"基于社会化网络的个性化音乐推荐算法研究";李瑞敏;《中国优秀硕士学位论文全文数据库 信息科技辑》;20130915;第I138-499页 *

Also Published As

Publication number Publication date
CN104537272A (zh) 2015-04-22

Similar Documents

Publication Publication Date Title
CN108521439B (zh) 一种消息推送的方法和装置
CN104574192B (zh) 在多个社交网络中识别同一用户的方法及装置
CN103348342B (zh) 基于用户话题简档的个人内容流
CN105701191B (zh) 一种推送信息点击率估计方法和装置
Perelman et al. An adaptive heuristic cross-entropy algorithm for optimal design of water distribution systems
CN105095470B (zh) 用于应用程序的数据推荐方法及装置
CA2941700A1 (en) Clickstream purchase prediction using hidden markov models
US9489638B2 (en) Method and apparatus for propagating user preference information in a communications network
CN103295145A (zh) 一种基于用户消费特征向量的手机广告投放方法
CN103399858A (zh) 基于信任的社会化协同过滤推荐方法
CN106484777A (zh) 一种多媒体数据处理方法以及装置
CN106354818B (zh) 基于社交媒体的动态用户属性提取方法
CN104718547A (zh) 顾客数据解析系统
CN109711887A (zh) 商城推荐列表的生成方法、装置、电子设备及计算机介质
CN109961357A (zh) 用户数据处理方法、装置、电子设备及存储介质
CN103700018A (zh) 一种移动社会网络中的人群划分方法
CN107291755B (zh) 一种终端推送方法及装置
Kavinkumar et al. A hybrid approach for recommendation system with added feedback component
Ruseckaite et al. Bayesian D-optimal choice designs for mixtures
CN109891451A (zh) 用于将品牌创意内容并入消息传送服务的系统和方法
CN105653535A (zh) 一种媒体资源推荐方法
CN111680213B (zh) 信息推荐方法、数据处理方法及装置
CN104077288B (zh) 网页内容推荐方法和网页内容推荐设备
US20170140454A1 (en) Recommendation method and apparatus
CN104537272B (zh) 动态重复行为的预测方法

Legal Events

Date Code Title Description
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant