CN104616077A - 基于Markov链和关联规则的用户业务行为预测方法 - Google Patents
基于Markov链和关联规则的用户业务行为预测方法 Download PDFInfo
- Publication number
- CN104616077A CN104616077A CN201510051487.0A CN201510051487A CN104616077A CN 104616077 A CN104616077 A CN 104616077A CN 201510051487 A CN201510051487 A CN 201510051487A CN 104616077 A CN104616077 A CN 104616077A
- Authority
- CN
- China
- Prior art keywords
- business
- markov chain
- prediction
- user
- markov
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Human Resources & Organizations (AREA)
- Economics (AREA)
- Strategic Management (AREA)
- Marketing (AREA)
- Game Theory and Decision Science (AREA)
- Entrepreneurship & Innovation (AREA)
- Development Economics (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Tourism & Hospitality (AREA)
- Physics & Mathematics (AREA)
- General Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了一种基于Markov链和关联规则的用户业务行为预测方法,该方法针对预测算法的问题,首先用二阶Markov链生成预测候选集,再利用二项关联规则修正预测结果,能够有效地提高预测算法的准确性。该方法的用户业务行为预测算法具有很好的理论性能保证,预测准确度高。本发明只需要扫描一轮数据库即可,相比与传统的挖掘二项关联规则算法,该方法节省了大量的时间和空间,改进了Markov链的二阶转移矩阵的计算方法,用二阶Markov链生成预测候选集,在此基础之上利用二项关联规则修正预测结果。
Description
技术领域
本发明涉及一种在无线泛在环境下基于Markov链和关联规则的用户业务行为预测方法,属于通讯技术领域。
背景技术
进入21世纪以来,随着微电子、芯片及信息通信技术的不断发展,人类将逐步进入泛在网络时代,其中无线泛在网络,即:无线泛在环境使人置身于无所不在的网络之中,实现人在任何时间、地点,使用任何网络与任何人与物的信息交换,基于个人和社会的需求,利用现有网络技术和新的网络技术,为个人和社会提供泛在的,无所不含的信息服务和应用。伴随着互联网技术的快速发展,业务资源也随之呈现爆炸式增长的态势,如何从海量的业务资源中,快速高效地获取用户所需的业务,使得用户获得较高的用户体验,成为了关注的重点领域。无线泛在环境下,将以用户为中心,业务的产生直接来源于用户的需求,多模终端可以接入不同无线网络,如何实现不同无线接入网间的网络资源与终端能力的有效利用,改善信息传输服务质量,从不同角度、不同层次满足用户需求,提高用户体验质量以及为用户提供智能服务,因此,有必要对用户行为预测进行研究。
在未来无线泛在环境下,2G/3G/4G蜂窝移动通信网、IEEE 802.11无线局域网(WLAN)和IEEE 802.16无线城域网(WiMAX)将作为主流的无线接入方式并存,接入网络之间将通过有线骨干网或无线Mesh网等互联互通,用户终端之间亦将借助IEEE 802.11或IEEE802.15等系列技术实现Ad Hoc连接,从而为泛在的业务需求提供泛在的无线接入;另一方面,最近5年随着移动智能终端和移动操作系统快速发展,进一步增强了移动终端的用户体验。现有的有线互联网业务类型几乎都可以移植到移动互联网上来,为实现业务无线化提供了设备条件。
无线业务个性化已经成为当今业务发展的新热点,随着用户个性化特征的日趋明显,个性化推送甚至发展成为运营商、业务商新的营销理念和趋势。因此个性化推送技术应运而生,它能从大量用户行为历史信息中,通过各种的挖掘算法和预测模型,适时适度地向用户自动推送出符合其需求的业务,为用户提供个性化的业务定制服务及业务推荐,同时为业务商推出新业务提供决策依据。
目前国内外对用户行为的研究主要侧重于挖掘和分析用户行为特征和规律以及用户行为预测方面。相关研究采用的工具包括数据挖掘算法和Markov预测模型等。其中Markov模型是一种简单且有效的模型。由于Markov链的无后效性,目前大多采用Markov模型理论对用户行为进行预测。Markov模型以其大的信息保留量,从而保证了其预测准确的特点而成为这方面研究的一个典型模型。
然而K阶Markov链模型忽略了较早的历史知识,只是假设下一业务只与最新的K个业务有关系,简化了预测模型,减少了计算时间,但是预测准确度也会随之下降。针对这个问题。而本发明能够很好地解决上面的问题。
发明内容
本发明目的在于提出了一种基于Markov链和关联规则的用户业务行为预测方法,该方法针对预测算法的问题,首先用二阶Markov链生成预测候选集,再利用二项关联规则修正预测结果,能够有效地提高预测算法的准确性。该方法的用户业务行为预测方法具有很好的理论性能保证,预测准确度高。
本发明解决其技术问题所采取的技术方案是:一种基于Markov链和关联规则的用户业务行为预测方法,该方法首先改进了Markov链的二阶转移矩阵的计算方法,用二阶Markov链生成预测候选集,在此基础之上利用二项关联规则修正预测结果,该方法在保证预测准确率的同时,能在线性时间内完成在线预测。
方法流程:
步骤1:用Markov链预测模型返回下一步有可能会使用的业务集和这些业务对应的Markov预测概率;
步骤2:利用二项关联规则从两个角度来修正预测结果;
步骤3:分别计算v中所有业务与ri的可信度,如果所有的可信度都小于阀值min_rule,则无论mp(ri)的值多大,都从m中删除业务ri;如果存在业务pj∈v,且pj与ri的可信度conf(pj→ri)大于阀值max_rule,则ri的预测概率为:
本发明是用n维向量v(t)=(v1,v2,...,vn)表示用户t时刻状态,如果某用户t时刻的使用业务为xj,则让v(t)的第j维为1,其余维都为0。用n维向量x(t)=(x1,x2,...,xn)表示t时刻用户使用各个业务的概率,即x(t)=(p(X1=x1),p(X2=x2),...,p(Xn=xn))。假设某用户的t时刻的业务序列为(......,xi,xj),则当前状态v(t)=(v1=0,v2=0,...,vj=1,vj+1=0,...,vn=0),前一状态v(t-1)=(v1=0,v2=0,...,vi=1,vi+1=0,...,vn=0)。则下一时刻用户访问各个业务的概率x(t+1)为:x(t+1)=α1v(t)×p(1)+α2v(t-1)×p(2)。其中α1为一阶转移矩阵的权值,α2为二阶转移矩阵的权值,令α1+α2=1。从x(t+1)中选出概率最大的业务作为预测结果。
有益效果:
1、本发明能够将Markov链模型和关联规则相结合,有效地提高了预测算法的准确性。
2、本发明只需要扫描一轮数据库即可,相比与传统的挖掘二项关联规则算法,该方法节省了大量的时间和空间,改进了Markov链的二阶转移矩阵的计算方法,用二阶Markov链生成预测候选集,在此基础之上利用二项关联规则修正预测结果。
3、本发明在保证预测准确率的同时,能在线性时间内完成在线预测。
4、本发明操作非常简单,而且易于实现,具有很好的应用前景。
附图说明
图1为本发明的方法流程图
具体实施方式
下面结合说明书附图对发明创造作进一步的详细说明。
实施例1
本发明具体的实现实施过程包括如下:
a、假设用户业务的选择过程是一个特殊的随机过程──齐次离散Markov链。即设离散随机变量S的值域为用户使用的所有业务集合,则一个用户在无线泛在环境中的业务选择使用过程就构成一个随机变量S的取值序列,并且该序列满足Markov性。二阶Markov链预测模型可以表示为一个四元组{(xi,xj),p(1),p(2),x},其中(xi,xj)表示用户最近使用的两种业务,p(1)表示一阶概率转移矩阵,p(2)表示二阶转移矩阵,x表示预测页面。其中,根据以往定理,p(2)=p2(1)。pij(2)代表的是用户使用过业务xi之后,访问(*,xj)的概率,其中“*”代表任意业务。在以往的Markov预测模型中,K阶转移矩阵都是通过公式p(k)=pk(1)计算。但本方案认为,由于每个用户的业务选择情况差异很大,故K阶转移矩阵应该通过学习获得,而不应该完全遵循理论计算。
一阶概率转移模型p(1)的学习算法如下:
二阶概率转移模型p(2)的学习算法如下:
b、用n维向量v(t)=(v1,v2,...,vn)表示用户t时刻状态,如果某用户t时刻的使用业务为xj,则让v(t)的第j维为1,其余维都为0。用n维向量x(t)=(x1,x2,...,xn)表示t时刻用户使用各个业务的概率,即x(t)=(p(X1=x1),p(X2=x2),...,p(Xn=xn))。
假设某用户的t时刻的业务序列为(......,xi,xj),则当前状态v(t)=(v1=0,v2=0,...,vj=1,vj+1=0,...,vn=0),前一状态v(t-1)=(v1=0,v2=0,...,vi=1,vi+1=0,...,vn=0)。则下一时刻用户访问各个业务的概率x(t+1)为:x(t+1)=α1v(t)×p(1)+α2v(t-1)×p(2)。其中α1为一阶转移矩阵的权值,α2为二阶转移矩阵的权值,令α1+α2=1。从x(t+1)中选出概率最大的业务作为预测结果。
c、一般来说,本发明可以认为用户下一时刻的业务主要取决于历史业务序列中的某个业务,而不是整个序列,可以通过挖掘用户的历史业务序列从而找到业务的二项关联规则,关联度较大的业务可以认为它们之间存在关联的可能较大。本发明提出了基于矩阵的二项关联规则挖掘方法,该方法只要扫描一轮数据库即可。
基于矩阵的二项关联规则挖掘算法如下:
d、K阶Markov链预测模型忽略了较早的历史访问知识,假设下一个业务只与最近的K个业务有关系,简化了预测模型,减少了计算时间,但是预测准确度也随之下降。针对这个问题,本文提出了基于Markov链和关联规则的预测算法。首先用Markov链预测模型返回下一步有可能会访问的业务集m和这些业务对应的Markov预测概率;再利用二项关联规则来修正预测结果。假设当前用户的业务序列为v={p1,p2,...,ps},Markov预测的结果集m={r1,r2,...,rt},且对应的Markov预测模型概率mp={mp(r1),mp(r2),...,mp(rt)}。
对于任意的ri∈m,分别计算v中所有业务与ri的可信度,如果所有的可信度都小于阀值min_rule,则无论mp(ri)的值多大,都从m中删除业务ri;如果存在业务pj∈v,且pj与ri的可信度conf(pj→ri)大于阀值max_rule,则ri的预测概率为: 其中 λ1+λ2=1,λ1代表Markov的预测权值,λ2代表关联规则的预测权值,wj代表规则conf(pj→ri)的权值。
实施例2
本发明主要包括三个内容:一是二阶Markov链预测算法;二是二项关联规则挖掘算法;三是基于Markov链和关联规则的预测算法。
1.二阶Markov链预测算法
假设用户业务的选择过程是一个特殊的随机过程──齐次离散Markov链。即设离散随机变量S的值域为用户使用的所有业务集合,则一个用户在无线泛在环境中的业务选择使用过程就构成一个随机变量S的取值序列,并且该序列满足Markov性。二阶Markov链预测模型可以表示为一个四元组{(xi,xj),p(1),p(2),x},其中(xi,xj)表示用户最近使用的两种业务,p(1)表示一阶概率转移矩阵,p(2)表示二阶转移矩阵,x表示预测页面。其中,根据定理,p(2)=p2(1)。pij(2)代表的是用户使用过业务xi之后,访问(*,xj)的概率,其中“*”代表任意业务。在以往的Markov预测模型中,K阶转移矩阵都是通过公式p(k)=pk(1)计算。但本方案认为,由于每个用户的业务选择情况差异很大,故K阶转移矩阵应该通过学习获得,而不应该完全遵循理论计算。
一阶概率转移模型p(1)的学习算法如下:
二阶概率转移模型p(2)的学习算法如下:
用n维向量v(t)=(v1,v2,...,vn)表示用户t时刻状态,如果某用户t时刻的使用业务为xj,则让v(t)的第j维为1,其余维都为0。用n维向量x(t)=(x1,x2,...,xn)表示t时刻用户使用各个业务的概率,即x(t)=(p(X1=x1),p(X2=x2),...,p(Xn=xn))。
假设某用户的t时刻的业务序列为(......,xi,xj),则当前状态v(t)=(v1=0,v2=0,...,vj=1,vj+1=0,...,vn=0),前一状态v(t-1)=(v1=0,v2=0,...,vi=1,vi+1=0,...,vn=0)。则下一时刻用户访问各个业务的概率x(t+1)为:x(t+1)=α1v(t)×p(1)+α2v(t-1)×p(2)。其中α1为一阶转移矩阵的权值,α2为二阶转移矩阵的权值,令α1+α2=1。从x(t+1)中选出概率最大的业务作为预测结果。
二阶Markov链预测算法如下:
输入:用户的当前业务序列(......,xi,xj)
输出:预测业务或预测业务集
1、根据当前业务序列构造v(t)和v(t-1)
2、计算x(t+1)=α1v(t)×p(1)+α2v(t-1)×p(2)
3、返回向量x(t+1)中值最大的维对应的业务(或x(t+1)中值大于某阀值的维对应的业务集)
2.二项关联规则挖掘算法
基于矩阵的二项关联规则挖掘算法如下:
3.基于Markov链和关联规则的预测算法
K阶Markov链预测模型忽略了较早的历史访问知识,假设下一个业务只与最近的K个业务有关系,简化了预测模型,减少了计算时间,但是预测准确度也随之下降。针对这个问题,本文提出了基于Markov链和关联规则的预测算法。首先用Markov链预测模型返回下一步有可能会访问的业务集m和这些业务对应的Markov预测概率;再利用二项关联规则来修正预测结果。假设当前用户的业务序列为v={p1,p2,...,ps},Markov预测的结果集m={r1,r2,...,rt},且对应的Markov预测模型概率mp={mp(r1),mp(r2),...,mp(rt)}。
对于任意的ri∈m,分别计算v中所有业务与ri的可信度,如果所有的可信度都小于阀值min_rule,则无论mp(ri)的值多大,都从m中删除业务ri;如果存在业务pj∈v,且pj与ri的可信度conf(pj→ri)大于阀值max_rule,则ri的预测概率为: 其中 λ1+λ2=1,λ1代表Markov的预测权值,λ2代表关联规则的预测权值,wj代表规则conf(pj→ri)的权值。
基于Markov链和关联规则的预测算法如下:
返回predictProb中值最大的业务
综上所述,本发明基于Markov链和关联规则的用户业务行为预测方法,具体流程图如图1所示,实现过程包括如下:
第一步:用Markov链预测模型返回下一步有可能会使用的业务集和这些业务对应的Markov预测概率;
第二步:利用二项关联规则从两个角度来修正预测结果;
第三步:在步骤1中用Markov链预测模型返回下一步有可能会访问的业务集m和这些业务对应的Markov预测概率;再在步骤2中利用二项关联规则来修正预测结果。在此基础上分别计算用户的业务序列v中所有业务与预测结果ri的可信度,如果所有的可信度都小于阀值min_rule,则无论mp(ri)的值多大,都从m中删除业务ri;如果存在业务pj∈v,且pj与ri的可信度conf(pj→ri)大于阀值max_rule,则ri的预测概率为:
Claims (3)
1.一种基于Markov链和关联规则的用户业务行为预测方法,其特征在于:所述方法包括如下步骤:
步骤1:用Markov链预测模型返回下一步有可能会使用的业务集和这些业务对应的Markov预测概率;
步骤2:利用二项关联规则从两个角度来修正预测结果;
步骤3:在步骤1中用Markov链预测模型返回下一步有可能会访问的业务集m和这些业务对应的Markov预测概率;再在步骤2中利用二项关联规则来修正预测结果,在此基础上分别计算用户的业务序列v中所有业务与预测结果ri的可信度;如果所有的可信度都小于阀值min_rule,则无论mp(ri)的值多大,都从m中删除业务ri;如果存在业务pj∈v,且pj与ri的可信度conf(pj→ri)大于阀值max_rule,则ri的预测概率为:
2.根据权利要求1所述的一种基于Markov链和关联规则的用户业务行为预测方法,其特征在于:所述方法是用n维向量v(t)=(v1,v2,…,vn)表示用户t时刻状态,如果某用户t时刻的使用业务为xj,则让v(t)的第j维为1,其余维都为0,用n维向量x(t)=(x1,x2,…,xn)表示t时刻用户使用各个业务的概率,即x(t)=(p(X1=x1),p(X2=x2),…,p(Xn=xn));假设某用户的t时刻的业务序列为(……,xi,xj),则当前状态前一状态则下一时刻用户访问各个业务的概率x(t+1)为:x(t+1)=α1v(t)×p(1)+α2v(t-1)×p(2),其中α1为一阶转移矩阵的权值,α2为二阶转移矩阵的权值,令α1+α2=1;从x(t+1)中选出概率最大的业务作为预测结果。
3.根据权利要求1所述的一种基于Markov链和关联规则的用户业务行为预测方法,其特征在于:所述方法只需扫描一轮数据库即可。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510051487.0A CN104616077A (zh) | 2015-01-30 | 2015-01-30 | 基于Markov链和关联规则的用户业务行为预测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510051487.0A CN104616077A (zh) | 2015-01-30 | 2015-01-30 | 基于Markov链和关联规则的用户业务行为预测方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN104616077A true CN104616077A (zh) | 2015-05-13 |
Family
ID=53150513
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201510051487.0A Pending CN104616077A (zh) | 2015-01-30 | 2015-01-30 | 基于Markov链和关联规则的用户业务行为预测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN104616077A (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105281959A (zh) * | 2015-11-04 | 2016-01-27 | 东北大学 | 一种基于隐马尔可夫模型的移动通信用户流失预测方法 |
CN105303260A (zh) * | 2015-11-06 | 2016-02-03 | 华中科技大学 | 一种移动通信新业务冲击预测方法和系统 |
CN108305094A (zh) * | 2017-12-18 | 2018-07-20 | 北京三快在线科技有限公司 | 一种用户行为预测方法及装置,电子设备 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103559564A (zh) * | 2013-11-19 | 2014-02-05 | 天津工业大学 | 一种钢铁企业电力超短期负荷预测方法 |
KR20140146437A (ko) * | 2013-06-17 | 2014-12-26 | 고려대학교 산학협력단 | 특허정보를 이용한 기업성과 예측 장치 및 방법 |
-
2015
- 2015-01-30 CN CN201510051487.0A patent/CN104616077A/zh active Pending
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20140146437A (ko) * | 2013-06-17 | 2014-12-26 | 고려대학교 산학협력단 | 특허정보를 이용한 기업성과 예측 장치 및 방법 |
CN103559564A (zh) * | 2013-11-19 | 2014-02-05 | 天津工业大学 | 一种钢铁企业电力超短期负荷预测方法 |
Non-Patent Citations (1)
Title |
---|
陈希友: "基于web日志挖掘的用户访问预测研究", 《中国优秀硕士学位论文全文数据库 信息科技辑》 * |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105281959A (zh) * | 2015-11-04 | 2016-01-27 | 东北大学 | 一种基于隐马尔可夫模型的移动通信用户流失预测方法 |
CN105281959B (zh) * | 2015-11-04 | 2018-05-04 | 东北大学 | 一种基于隐马尔可夫模型的移动通信用户流失预测方法 |
CN105303260A (zh) * | 2015-11-06 | 2016-02-03 | 华中科技大学 | 一种移动通信新业务冲击预测方法和系统 |
CN108305094A (zh) * | 2017-12-18 | 2018-07-20 | 北京三快在线科技有限公司 | 一种用户行为预测方法及装置,电子设备 |
CN108305094B (zh) * | 2017-12-18 | 2021-07-23 | 北京三快在线科技有限公司 | 一种用户行为预测方法及装置,电子设备 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Hassan et al. | Differential privacy for renewable energy resources based smart metering | |
CN104834967A (zh) | 泛在网络下基于用户相似度的业务行为预测方法 | |
CN104158855A (zh) | 基于遗传算法的移动服务组合计算卸载方法 | |
Dengiz et al. | Design of reliable communication networks: A hybrid ant colony optimization algorithm | |
CN104616077A (zh) | 基于Markov链和关联规则的用户业务行为预测方法 | |
CN114492978A (zh) | 一种基于多层注意力机制的时空序列预测方法及设备 | |
Dai et al. | Deep reinforcement learning for edge computing and resource allocation in 5G beyond | |
Zhang et al. | Endogenous security-aware resource management for digital twin and 6G edge intelligence integrated smart park | |
CN103577899A (zh) | 一种基于可靠性预测与QoS相结合的服务组合方法 | |
Gao et al. | A deep learning framework with spatial-temporal attention mechanism for cellular traffic prediction | |
CN110167059A (zh) | 一种边缘计算场景下基站业务量预测方法 | |
CN103249050B (zh) | 基于业务需求的多尺度频谱接入方法 | |
CN105809364A (zh) | 一种基于Markov模型的用户行为预测方法 | |
Kumar et al. | Load forecasting of Andhra Pradesh grid using PSO, DE algorithms | |
Zhang et al. | A novel approach of tensor‐based data missing estimation for Internet of Vehicles | |
CN101155369A (zh) | 移动装置的省电系统与方法 | |
Bhatnagar et al. | Role of machine learning in sustainable engineering: a review | |
CN103455525B (zh) | 基于用户的搜索推广行为确定推广帐号状态的方法与设备 | |
Walker et al. | Using localized random walks to model delay-tolerant networks | |
Cui et al. | Resource-Efficient DNN Training and Inference for Heterogeneous Edge Intelligence in 6G | |
Zhang et al. | Dynamic spectrum access for Internet-of-Things with hierarchical federated deep reinforcement learning | |
CN104679992B (zh) | 基于用户业务使用时间的Markov模型的设计方法 | |
CN113840306B (zh) | 基于网络局部信息交互的分布式无线网络接入决策方法 | |
Tang et al. | Forecasting Network Traffic at Large Time Scales by Using Dual-Related Method | |
Rathnayake et al. | Network availability prediction with hidden context |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20150513 |