CN108093425A - 一种基于马尔科夫决策过程的移动数据分流方法 - Google Patents

一种基于马尔科夫决策过程的移动数据分流方法 Download PDF

Info

Publication number
CN108093425A
CN108093425A CN201711373579.6A CN201711373579A CN108093425A CN 108093425 A CN108093425 A CN 108093425A CN 201711373579 A CN201711373579 A CN 201711373579A CN 108093425 A CN108093425 A CN 108093425A
Authority
CN
China
Prior art keywords
data
time
network
user
algorithm
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201711373579.6A
Other languages
English (en)
Inventor
张�成
张险峰
陈庆武
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
University of Electronic Science and Technology of China Zhongshan Institute
Original Assignee
Zhongshan Ma Lai Robot Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhongshan Ma Lai Robot Technology Co Ltd filed Critical Zhongshan Ma Lai Robot Technology Co Ltd
Priority to CN201711373579.6A priority Critical patent/CN108093425A/zh
Publication of CN108093425A publication Critical patent/CN108093425A/zh
Pending legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W28/00Network traffic management; Network resource management
    • H04W28/02Traffic management, e.g. flow control or congestion control
    • H04W28/10Flow control between communication endpoints
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W24/00Supervisory, monitoring or testing arrangements
    • H04W24/06Testing, supervising or monitoring using simulated traffic

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Mobile Radio Communication Systems (AREA)

Abstract

本发明公开一种基于马尔科夫决策过程的移动数据分流方法,包括以下步骤(1)移动数据分流的马尔科夫模型;(2)一种动态优化决策算法;(3)一种低时间复杂度的启发式分流算法;本发明从移动用户角度出发,构建多个不同容忍度的流,考虑用户偏向能量消耗,移动性,等待容忍度等多个方面,能更加全面考虑到系统内移动用户的服务质量,基于马尔科夫决策的移动数据分流方法,成功实现了数据分流,并且对系统整体的开销较小。

Description

一种基于马尔科夫决策过程的移动数据分流方法
技术领域
本发明涉及移动数据分流领域技术,尤其是指一种基于马尔科夫决策过程的移动数据分流方法。
背景技术
目前文献中还未发现相关专利。以数据分流作为关键字,在中国专利文献数据库中能搜索到相关主题的专利一篇。“辅助移动数据分流的方法及通信装置以及移动装置”(公开号:CN101612735A,2012年12月公开),该专利提出一种辅助移动数据分流的方法和通信装置以及移动装置的实施。在移动通信模式下,通过一辅助通信装置对信号进行验证,构建第一通信连结,在第一通信上进行数据的分流。虽然此种方式能够实现分流,但是构建方式过于复杂,且耗能大。以Mobile Data Offloading作为关键字,能搜索到相关主题的专利多篇。“Method and Apparatus for Data Offloading”(公开号:US20110317571A,2011年12月公开),该专利通过设置多个设备对网络环境监听,对网络当中设备的数据使用进行比较,选择是否需要分流到其他网络。但是此方法对系统开销较大,并不具有实用性。“METHODAND SYSTEM FOR DATA OFFLOADING IN MOBILECOMMUNICATIONS”(公开号:US20120230191A,2012年9月公开),该专利通过一个基础设置与数据分流控制器构成数据分流系统,通过基础设备对数据交换的监听,来判断是否需要进行数据分流,从而对数据分流控制器发出信号进行控制。此方法并未考虑到能量消耗及效率,并且复杂度较高,并不具实用性。已有的专利大多是从网络运营商来考虑数据分流的,这些策略并为考虑到移动用户的服务质量(QoS)。而已有的从移动用户考虑的策略,对整体系统的能量消耗和网络成本需求较高,效率并不明显。
发明内容
有鉴于此,本发明针对现有技术存在之缺失,其主要目的是提供一种基于马尔科夫决策过程的移动数据分流方法,其能有效解决现有之数据分流对整体系统的能量消耗和网络成本需求较高并且效率不明显的问题。
为实现上述目的,本发明采用如下之技术方案:
一种基于马尔科夫决策过程的移动数据分流方法,包括以下步骤(1)移动数据分流的马尔科夫模型;(2)一种动态优化决策算法;(3)一种低时间复杂度的启发式分流算法,
步骤(1)移动数据分流的马尔科夫模型:
移动用户使用手机应用进行数据下载时,由于时间限制,当发生网络阻塞问题,为提升用户体验,用户将进行数据分流用以解决上述问题,会自主性选择网络,考虑到手机能量消耗以及网络成本;对此,进行基于移动数据分流的马尔可夫决策的建模;
(1.1)模型环境:
为便于建模,步骤(1.1)对模型的使用环境进行相关介绍:
1)MUs从远程服务器下载M个文件,并且每个文件形成数据流(Flow),则对应的数据流集定义为同时每个Flow都有相应的时间限制其中T=(T1,T2,...,TM)表示为对于MU的M个文件的时间限制向量集,为便于建模,认为T1≤T2≤…TM并定义时间系统t∈7={1,...,TM};
2)为便于分析,限制MU只能在L可能性的位置移动,对应的位置集当蜂窝网络在上述位置集中出现的概率相等,而无线局域网出现的概率依赖于其位置
(1.2)马尔科夫决策模型的建立:
当用户下载文件,发生网络阻塞时,用户将根据网络使用成本、能量消耗以及剩余时间进行网络选择,从而完成数据传输;
(1.2.1)系统状态st
st={lt,bt}
其中表示通过GPS获取的MUs在t时的位置指数,表示位置集;为M个文件在t时的文件下载剩余量的向量集,并且而Bj表示第j个数据流的总的文件下载剩余量,因此则表示对应的剩余数据的向量集;
(1.2.2)用户动作:
用户动作at表示t时决定在处于无线局域网覆盖时,是否使用,或者使用蜂窝网络,或者继续等待空闲以及如何对M数据流进行网络数据率的分配,其定义如下:
at=(at,c,at,ω)
1)其中,表示分配蜂窝网络的数据率的向量集,表示对于第j个数据使用蜂窝网络的分配数据率;则表示分配的无线局域网的数据率,而表示对于第j个数据使用无线局域网的分配的数据率;符号c和ω分别表示蜂窝网络和无线局域网;如果用户不在无线局域网覆盖的范围内时,可能为0;
2)所有数据流使用蜂窝网络和无线局域网的总的数据率分别定义
且at,c和at,ω需要满足以下条件:
其中,分别表示在位置l时蜂窝网络和无线局域网的最大数据率;
3)在t时有以下因素影响用户的决策
a)网络成本即用户使用网络服务的成本:网络服务以基于使用量的价格计算模式,并且定义移动网络操作的价格为pc,且认为无线局域网免费使用,则网络成本ct(st,at)的定义如下:
b)能量消耗:通过使用无线局域网或蜂窝网络传输数据产生的能量消耗,其定义为:
其中,表示在位置1处使用蜂窝网络的能量消耗率,表示在位置1处使用无线局域网的能量消耗率,且两者都随输出为变小,即传输同等的数据量,低传输速度消耗更多的能量;θt表示MU在t时关注能量消耗的权重,θt值越小,表明MU对于能量消耗的关注度越小;
d)惩罚因子:如果数据传输没能在时间限制内完成,对于MU的惩罚因子其定义如下:
上式中函数g(·)具有非负非减的特性,Tj+1表示在时间限制Tj之后计算惩罚因子;
(1.2.3)状态转移概率:
Pr(st+1|st,at)
上式表明如果在状态st时进行选择动作at后,状态st+1的概率,为便于分析,假定数据传输的剩余量和位置改变相互独立,故
其中
上式中[x]+=max{x,0}且认为用户从位置lt到位置lt+1的概率已知;
(1.2.4)策略π
上式中函数φt(lt,bt)将状态st=(lt,bt)映射到在t时的动作决策,策略π的集合定义为∏;如果策略π被选中,则状态表示为
(1.3)用户目标函数
其目的是最小化从时间t=1到t=TM的总成本,包括网络成本和能量消耗,且在t=TM+1时的惩罚因子具有最优的策略π*,如下式所示:
上式中rt(st,at)表示网络成本和能量消耗的总和,其计算公式如下:
rt(st,at)=ct(st,at)+ξt(st,at)
步骤(2)一种动态优化决策算法:
通过步骤(1)建立用户选择网络和数据分配的MDP模型,其目的是为了通过做出相应的动作从而降低用户成本,为此,步骤(2)采用一种动态方法解决MDP问题。
优选的,所述步骤(2)进一步包括:
(2.1)MDP问题的最优化函数:
定义vt(st)为用户在状态st处从t到TM+1的总成本的最小期望值,如下式所示:
基于上式,采用一种动态方法解决MDP问题;
(2.2)一种动态解决MDP问题的方法,其过程如下:
(2.2.1)最优策略计算阶段:
(2.2.2)通过等式7,建立用户在位置l,下载剩余量b时,时间TM+1的总成本最小期望值l属于位置集合
(2.2.3)定义时间TM等于t;
(2.2.4)当t大于等于1时
(2.2.5)对于在时间t位置属于集合的lt
(2.2.6)定义时间t下载剩余量集合的向量集bt等于0;
(2.2.7)对于时间t属于下载剩余量集合的向量集bt
(2.2.8)用公式14计算时间t时状态st,分配的蜂窝网络的数据率at时,总成本的期望值Qt(st,at);
(2.2.9)定义时间t时最小总成本期望值的变量值为
(2.2.10)定义时间t时最小总成本期望值vt(l,b)等于变量值与Qt的期望;
(2.2.11)定义M个文件在时间t时下载剩余量的向量集bt等于bt加上σ;
(2.2.12)结束循环;
(2.2.13)结束循环;
(2.2.14)定义时间t等于t-1;
(2.2.15)结束循环;
(2.2.16)最佳策略π*是为了接下来的分流数据传输策略生成的;
(2.2.17);
(2.2.18)分流数据传输策略;
(2.2.19)定义时间t=1,下载剩余量b等于文件下载剩余量集合
(2.2.20)当时间t小于等于时间TM并且bt大于0;
(2.2.21)lt由GPS确定;
(2.2.22)根据最佳策略π*,定义用户动作
(2.2.23)定义bt=[bt-at,c-at,ω]+
(2.2.24)结束循环;
(2.2.25)定义t=t+1;
(2.2.26)结束循环;
步骤(3)一种低时间复杂度的启发式分流算法:
步骤(2)成功实现了降低用户成本的功能;但是,其算法的时间复杂度很高;因此,步骤(2)仅作为最佳分流策略的离线算法;
针对上述问题,提出一种新的算法,实现两个目标:1.低时间复杂度;2.实时性计算;具体步骤:
(3.1.1)在时间间隙t;
(3.1.2)输入:截止时间矢量集合T,截止时间阈值Tth,通过GPS获取的Mus在t时的位置指数lt,M个文件在时间t时下载剩余量的向量集bt
(3.1.3)对于属于集合T的矢量Tj
(3.1.4)如果t<Tj
(3.1.5)将Tj-t添加到截止时间保留表R;
(3.1.6)定义权重等于
(3.1.7)否则;
(3.1.8)定义权重等于0;
(3.1.9)将权重添加到分配率权重列表Wt
(3.1.10)结束循环;
(3.1.11)结束循环;
(3.1.12)标准化Wt
(3.1.13)标准化bt
(3.1.14)如果在位置l无线LAN网接入点可用而且速率比γth高,γth是由MUs的能量偏好定义的参数;
(3.1.15)根据分配无线LAN网数据接入率到每一个流;
(3.1.16)无线LAN网数据接入率at,w确定;
(3.1.17)如果R的最小值小于Tth
(3.1.18)根据分配蜂窝网数据率到每一个流;
(3.1.19)蜂窝网数据接入率at,c确定;
(3.1.20)结束循环;
(3.1.21)根据at,c和at,w输出分配的蜂窝网络的数据率at
从上述算法的结果可以看出,时间复杂度远远低于算法1;并且,算法2可以作为在线算法实现实时计算。
本发明与现有技术相比具有明显的优点和有益效果,具体而言,由上述技术方案可知:
本发明从移动用户角度出发,构建多个不同容忍度的流,考虑用户偏向能量消耗,移动性,等待容忍度等多个方面,能更加全面考虑到系统内移动用户的服务质量,基于马尔科夫决策的移动数据分流方法,成功实现了数据分流,并且对系统整体的开销较小。
具体实施方式
本发明揭示了一种基于马尔科夫决策过程的移动数据分流方法,包括以下步骤(1)移动数据分流的马尔科夫模型;(2)一种动态优化决策算法;(3)一种低时间复杂度的启发式分流算法,
步骤(1)移动数据分流的马尔科夫模型:
移动用户(Mobile User,MU)使用手机应用进行数据下载时,由于时间限制,当发生网络阻塞问题,为提升用户体验,用户将进行数据分流用以解决上述问题,会自主性选择网络,考虑到手机能量消耗以及网络成本;对此,进行基于移动数据分流的马尔可夫决策的建模;
(1.1)模型环境:
为便于建模,步骤(1.1)对模型的使用环境进行相关介绍:
1)MUs从远程服务器下载M个文件(File),并且每个文件形成数据流(Flow),则对应的数据流集定义为同时每个Flow都有相应的时间限制(Deadline)其中T=(T1,T2,...,TM)表示为对于MU的M个文件的时间限制向量集,为便于建模,认为T1≤T2≤…TM并定义时间系统
2)为便于分析,限制MU只能在L可能性的位置移动,对应的位置集当蜂窝网络在上述位置集中出现的概率相等,而无线局域网(WirelessLAN Networks)出现的概率依赖于其位置
(1.2)马尔科夫决策模型的建立:
当用户下载文件,发生网络阻塞时,用户将根据网络使用成本、能量消耗以及剩余时间进行网络选择,从而完成数据传输;
(1.2.1)系统状态st
st={lt,bt}
其中表示通过GPS获取的MUs在t时的位置指数,表示位置集;为M个文件在t时的文件下载剩余量的向量集,并且而Bj表示第j个数据流的总的文件下载剩余量,因此则表示对应的剩余数据的向量集;
(1.2.2)用户动作(action):
用户动作(action)at表示t时决定在处于无线局域网覆盖时,是否使用,或者使用蜂窝网络,或者继续等待空闲以及如何对M数据流进行网络数据率的分配,其定义如下:
at=(at,c,at,ω)
1)其中,表示分配蜂窝网络的数据率的向量集,表示对于第j个数据使用蜂窝网络的分配数据率;则表示分配的无线局域网的数据率,而表示对于第j个数据使用无线局域网的分配的数据率;符号c和ω分别表示蜂窝网络和无线局域网;如果用户不在无线局域网覆盖的范围内时,可能为0;
2)所有数据流使用蜂窝网络和无线局域网的总的数据率分别定义
且at,c和at,ω需要满足以下条件:
其中,分别表示在位置l时蜂窝网络和无线局域网的最大数据率;
3)在t时有以下因素影响用户的决策
a)网络成本即用户使用网络服务的成本:网络服务以基于使用量的价格计算模式,并且定义移动网络操作(Mobile Networks Operators,MNOs)的价格为pc,且认为无线局域网免费使用,则网络成本ct(st,at)的定义如下:
b)能量消耗:通过使用无线局域网或蜂窝网络传输数据产生的能量消耗,其定义为:
其中,表示在位置l处使用蜂窝网络的能量消耗率,表示在位置l处使用无线局域网的能量消耗率,且两者都随输出为变小,即传输同等的数据量,低传输速度消耗更多的能量;θt表示MU在t时关注能量消耗的权重,θt值越小,表明MU对于能量消耗的关注度越小;
c)惩罚因子:如果数据传输没能在时间限制内完成,对于MU的惩罚因子其定义如下:
上式中函数g(·)具有非负非减的特性,Tj+1表示在时间限制Tj之后计算惩罚因子;
(1.2.3)状态转移概率:
Pr(st+1|st,at)
上式表明如果在状态st时进行选择动作at后,状态st+1的概率,为便于分析,假定数据传输的剩余量和位置改变相互独立,故
其中
上式中[x]+=max{x,0}且认为用户从位置lt到位置lt+1的概率已知;
(1.2.4)策略π
上式中函数φt(lt,bt)将状态st=(lt,bt)映射到在t时的动作决策,策略π的集合定义为Π;如果策略π被选中,则状态表示为
(1.3)用户目标函数
其目的是最小化从时间t=1到t=TM的总成本,包括网络成本和能量消耗,且在t=TM+1时的惩罚因子具有最优的策略π*,如下式所示:
上式中rt(st,at)表示网络成本和能量消耗的总和,其计算公式如下:
rt(st,Qt)=ct(st,Qt)+ξt(st,at)
步骤(2)一种动态优化决策算法:
通过步骤(1)建立用户选择网络和数据分配的MDP模型,其目的是为了通过做出相应的动作从而降低用户成本,为此,步骤(2)采用一种动态方法解决MDP问题。
所述步骤(2)进一步包括:
(2.1)MDP问题的最优化函数:
定义vt(st)为用户在状态st处从t到TM+1的总成本的最小期望值,如下式所示:
基于上式,采用一种动态方法解决MDP问题;
(2.2)一种动态解决MDP问题的方法,其过程如下:
(2.2.1)最优策略计算阶段:
(2.2.2)通过等式7,建立用户在位置l,下载剩余量b时,时间TM+1的总成本最小期望值l属于位置集合
(2.2.3)定义时间TM等于t;
(2.2.4)当t大于等于1时
(2.2.5)对于在时间t位置属于集合的lt
(2.2.6)定义时间t下载剩余量集合的向量集bt等于0;
(2.2.7)对于时间t属于下载剩余量集合的向量集bt
(2.2.8)用公式14计算时间t时状态st,分配的蜂窝网络的数据率at时,总成本的期望值Qt(st,at);
(2.2.9)定义时间t时最小总成本期望值的变量值为
(2.2.10)定义时间t时最小总成本期望值vt(l,b)等于变量值与Qt的期望;
(2.2.11)定义M个文件在时间t时下载剩余量的向量集bt等于bt加上σ;
(2.2.12)结束循环;
(2.2.13)结束循环;
(2.2.14)定义时间t等于t-1;
(2.2.15)结束循环;
(2.2.16)最佳策略π*是为了接下来的分流数据传输策略生成的;
(2.2.17);
(2.2.18)分流数据传输策略;
(2.2.19)定义时间t=1,下载剩余量b等于文件下载剩余量集合
(2.2.20)当时间t小于等于时间TM并且bt大于0;
(2.2.21)lt由GPS确定;
(2.2.22)根据最佳策略π*,定义用户动作
(2.2.23)定义bt=[bt-at,c-at,ω]+
(2.2.24)结束循环;
(2.2.25)定义t=t+1;
(2.2.26)结束循环;
步骤(3)一种低时间复杂度的启发式分流算法:
步骤(2)成功实现了降低用户成本的功能; 但是,其算法的时间复杂度很高; 因此,步骤(2)仅作为最佳分流策略的离线算法;
针对上述问题,提出一种新的算法,实现两个目标: 1.低时间复杂度;2.实时性计算;具体步骤:
(3.1.1)在时间间隙t;
(3.1.2)输入:截止时间矢量集合T,截止时间阈值Tth,通过GPS获取的Mus在t时的位置指数lt,M个文件在时间t时下载剩余量的向量集bt
(3.1.3)对于属于集合T的矢量Tj
(3.1.4)如果t<Tj
(3.1.5)将Tj-t添加到截止时间保留表R;
(3.1.6 ) 定义权重等于
(3.1.7)否则;
(3.1.8)定义权重等于0;
(3.1.9)将权重添加到分配率权重列表Wt
(3.1.10)结束循环;
(3.1.11)结束循环;
(3.1.12)标准化Wt
(3.1.13)标准化bt
(3.1.14)如果在位置l无线LAN网接入点可用而且速率比γth高,γth是由MUs的能量偏好定义的参数;
(3.1.15)根据分配无线LAN网数据接入率到每一个流;
(3.1.16)无线LAN网数据接入率at,w确定;
(3.1.17)如果R的最小值小于Tth
(3.1.18)根据分配蜂窝网数据率到每一个流;
(3.1.19)蜂窝网数据接入率at,c确定;
(3.1.20)结束循环;
(3.1.21)根据at,c和at,w输出分配的蜂窝网络的数据率at
从上述算法的结果可以看出,时间复杂度远远低于算法1;并且,算法2可以作为在线算法实现实时计算。
本发明的设计重点是:本发明从移动用户角度出发,构建多个不同容忍度的流,考虑用户偏向能量消耗,移动性,等待容忍度等多个方面,能更加全面考虑到系统内移动用户的服务质量,基于马尔科夫决策的移动数据分流方法,成功实现了数据分流,并且对系统整体的开销较小。
以上结合具体实施例描述了本发明的技术原理。这些描述只是为了解释本发明的原理,而不能以任何方式解释为对本发明保护范围的限制。基于此处的解释,本领域的技术人员不需要付出创造性的劳动即可联想到本发明的其它具体实施方式,这些方式都将落入本发明的保护范围之内。

Claims (2)

1.一种基于马尔科夫决策过程的移动数据分流方法,包括以下步骤(1)移动数据分流的马尔科夫模型;(2)一种动态优化决策算法;(3)一种低时间复杂度的启发式分流算法,其特征在于:
步骤(1)移动数据分流的马尔科夫模型:
移动用户使用手机应用进行数据下载时,由于时间限制,当发生网络阻塞问题,为提升用户体验,用户将进行数据分流用以解决上述问题,会自主性选择网络,考虑到手机能量消耗以及网络成本;对此,进行基于移动数据分流的马尔可夫决策的建模;
(1.1)模型环境:
为便于建模,步骤(1.1)对模型的使用环境进行相关介绍:
1)MUs从远程服务器下载M个文件,并且每个文件形成数据流(Flow),则对应的数据流集定义为同时每个Flow都有相应的时间限制其中T=(T1,T2,...,TM)表示为对于MU的M个文件的时间限制向量集,为便于建模,认为T1≤T2≤...TM并定义时间系统
2)为便于分析,限制MU只能在L可能性的位置移动,对应的位置集当蜂窝网络在上述位置集中出现的概率相等,而无线局域网出现的概率依赖于其位置
(1.2)马尔科夫决策模型的建立:
当用户下载文件,发生网络阻塞时,用户将根据网络使用成本、能量消耗以及剩余时间进行网络选择,从而完成数据传输;
(1.2.1)系统状态st
st={lt,bt}
其中表示通过GPS获取的MUs在t时的位置指数,表示位置集;为M个文件在t时的文件下载剩余量的向量集,并且而Bj表示第j个数据流的总的文件下载剩余量,因此则表示对应的剩余数据的向量集;
(1.2.2)用户动作:
用户动作at表示t时决定在处于无线局域网覆盖时,是否使用,或者使用蜂窝网络,或者继续等待空闲以及如何对M数据流进行网络数据率的分配,其定义如下:
at=(at,c,at,ω)
1)其中,表示分配蜂窝网络的数据率的向量集,表示对于第j个数据使用蜂窝网络的分配数据率;则表示分配的无线局域网的数据率,而表示对于第j个数据使用无线局域网的分配的数据率;符号c和ω分别表示蜂窝网络和无线局域网;如果用户不在无线局域网覆盖的范围内时,可能为0;
2)所有数据流使用蜂窝网络和无线局域网的总的数据率分别定义
且at,c和at,ω需要满足以下条件:
<mfenced open = "{" close = "}"> <mtable> <mtr> <mtd> <mrow> <msub> <mi>a</mi> <mrow> <mi>t</mi> <mo>,</mo> <mi>c</mi> </mrow> </msub> <mo>=</mo> <msubsup> <mi>&amp;gamma;</mi> <mi>c</mi> <mi>l</mi> </msubsup> </mrow> </mtd> </mtr> <mtr> <mtd> <mrow> <msub> <mi>a</mi> <mrow> <mi>t</mi> <mo>,</mo> <mi>&amp;omega;</mi> </mrow> </msub> <mo>=</mo> <msubsup> <mi>&amp;gamma;</mi> <mi>&amp;omega;</mi> <mi>l</mi> </msubsup> </mrow> </mtd> </mtr> </mtable> </mfenced>
其中,分别表示在位置l时蜂窝网络和无线局域网的最大数据率;
3)在t时有以下因素影响用户的决策
a)网络成本即用户使用网络服务的成本:网络服务以基于使用量的价格计算模式,并且定义移动网络操作的价格为pc,且认为无线局域网免费使用,则网络成本ct(st,at)的定义如下:
b)能量消耗:通过使用无线局域网或蜂窝网络传输数据产生的能量消耗,其定义为:
其中,表示在位置l处使用蜂窝网络的能量消耗率,表示在位置l处使用无线局域网的能量消耗率,且两者都随输出为变小,即传输同等的数据量,低传输速度消耗更多的能量;θt表示MU在t时关注能量消耗的权重,θt值越小,表明MU对于能量消耗的关注度越小;
c)惩罚因子:如果数据传输没能在时间限制内完成,对于MU的惩罚因子其定义如下:
<mrow> <msub> <mover> <mi>c</mi> <mo>^</mo> </mover> <mrow> <msup> <mi>T</mi> <mi>j</mi> </msup> <mo>+</mo> <mn>1</mn> </mrow> </msub> <mrow> <mo>(</mo> <msub> <mi>s</mi> <mrow> <msup> <mi>T</mi> <mi>j</mi> </msup> <mo>+</mo> <mn>1</mn> </mrow> </msub> <mo>)</mo> </mrow> <mo>=</mo> <msub> <mover> <mi>c</mi> <mo>^</mo> </mover> <mrow> <msup> <mi>T</mi> <mi>j</mi> </msup> <mo>+</mo> <mn>1</mn> </mrow> </msub> <mrow> <mo>(</mo> <msub> <mi>l</mi> <mrow> <msup> <mi>T</mi> <mi>j</mi> </msup> <mo>+</mo> <mn>1</mn> </mrow> </msub> <mo>,</mo> <msub> <mi>b</mi> <mrow> <msup> <mi>T</mi> <mi>j</mi> </msup> <mo>+</mo> <mn>1</mn> </mrow> </msub> <mo>)</mo> </mrow> <mo>=</mo> <mi>g</mi> <mrow> <mo>(</mo> <msub> <mi>b</mi> <mrow> <msup> <mi>T</mi> <mi>j</mi> </msup> <mo>+</mo> <mn>1</mn> </mrow> </msub> <mo>)</mo> </mrow> </mrow>
上式中函数g(·)具有非负非减的特性,Tj+1表示在时间限制Tj之后计算惩罚因子;
(1.2.3)状态转移概率:
Pr(st+1|st,at)
上式表明如果在状态st时进行选择动作at后,状态st+1的概率,为便于分析,假定数据传输的剩余量和位置改变相互独立,故
<mrow> <mi>Pr</mi> <mrow> <mo>(</mo> <msub> <mi>s</mi> <mrow> <mi>t</mi> <mo>+</mo> <mn>1</mn> </mrow> </msub> <mo>|</mo> <msub> <mi>s</mi> <mi>t</mi> </msub> <mo>,</mo> <msub> <mi>a</mi> <mi>t</mi> </msub> <mo>)</mo> </mrow> <mo>=</mo> <mi>Pr</mi> <mrow> <mo>(</mo> <mo>(</mo> <mrow> <msub> <mi>l</mi> <mrow> <mi>t</mi> <mo>+</mo> <mn>1</mn> </mrow> </msub> <mo>,</mo> <msub> <mi>b</mi> <mrow> <mi>t</mi> <mo>+</mo> <mn>1</mn> </mrow> </msub> </mrow> <mo>)</mo> <mo>|</mo> <mo>(</mo> <mrow> <msub> <mi>l</mi> <mi>t</mi> </msub> <mo>,</mo> <msub> <mi>b</mi> <mi>t</mi> </msub> </mrow> <mo>)</mo> <mo>,</mo> <msub> <mi>a</mi> <mi>t</mi> </msub> <mo>)</mo> </mrow> <mo>=</mo> <msub> <mi>p</mi> <mrow> <msub> <mi>l</mi> <mrow> <mi>t</mi> <mo>+</mo> <mn>1</mn> </mrow> </msub> <mo>,</mo> <msub> <mi>l</mi> <mi>t</mi> </msub> </mrow> </msub> <mi>Pr</mi> <mrow> <mo>(</mo> <msub> <mi>b</mi> <mrow> <mi>t</mi> <mo>+</mo> <mn>1</mn> </mrow> </msub> <mo>|</mo> <mo>(</mo> <mrow> <msub> <mi>l</mi> <mi>t</mi> </msub> <mo>,</mo> <msub> <mi>b</mi> <mi>t</mi> </msub> </mrow> <mo>)</mo> <mo>,</mo> <msub> <mi>a</mi> <mi>t</mi> </msub> <mo>)</mo> </mrow> </mrow>
其中
<mrow> <mi>Pr</mi> <mrow> <mo>(</mo> <msub> <mi>b</mi> <mrow> <mi>t</mi> <mo>+</mo> <mn>1</mn> </mrow> </msub> <mo>|</mo> <mo>(</mo> <mrow> <msub> <mi>l</mi> <mi>t</mi> </msub> <mo>,</mo> <msub> <mi>b</mi> <mi>t</mi> </msub> </mrow> <mo>)</mo> <mo>,</mo> <msub> <mi>a</mi> <mi>t</mi> </msub> <mo>)</mo> </mrow> <mo>=</mo> <mfenced open = "{" close = ""> <mtable> <mtr> <mtd> <mn>1</mn> </mtd> <mtd> <mtable> <mtr> <mtd> <mrow> <mi>i</mi> <mi>f</mi> </mrow> </mtd> <mtd> <mrow> <msub> <mi>b</mi> <mrow> <mi>t</mi> <mo>+</mo> <mn>1</mn> </mrow> </msub> <mo>=</mo> <msup> <mrow> <mo>&amp;lsqb;</mo> <msub> <mi>b</mi> <mi>t</mi> </msub> <mo>-</mo> <msub> <mi>a</mi> <mrow> <mi>t</mi> <mo>,</mo> <mi>c</mi> </mrow> </msub> <mo>-</mo> <msub> <mi>a</mi> <mrow> <mi>t</mi> <mo>,</mo> <mi>&amp;omega;</mi> </mrow> </msub> <mo>&amp;rsqb;</mo> </mrow> <mo>+</mo> </msup> </mrow> </mtd> </mtr> </mtable> </mtd> </mtr> <mtr> <mtd> <mn>0</mn> </mtd> <mtd> <mrow> <mi>o</mi> <mi>t</mi> <mi>h</mi> <mi>e</mi> <mi>r</mi> <mi>w</mi> <mi>i</mi> <mi>s</mi> <mi>e</mi> </mrow> </mtd> </mtr> </mtable> </mfenced> </mrow>
上式中[x]+=max{x,0}且认为用户从位置lt到位置lt+1的概率已知;
(1.2.4)策略π
上式中函数φt(lt,bt)将状态st=(lt,bt)映射到在t时的动作决策,策略π的集合定义为Π;如果策略π被选中,则状态表示为
(1.3)用户目标函数
其目的是最小化从时间t=1到t=TM的总成本,包括网络成本和能量消耗,且在t=TM+1时的惩罚因子具有最优的策略π*,如下式所示:
上式中rt(st,at)表示网络成本和能量消耗的总和,其计算公式如下:
rt(st,at)=ct(st,at)+ζt(st,at)
步骤(2)一种动态优化决策算法:
通过步骤(1)建立用户选择网络和数据分配的MDP模型,其目的是为了通过做出相应的动作从而降低用户成本,为此,步骤(2)采用一种动态方法解决MDP问题。
2.如权利要求1所述的一种基于马尔科夫决策过程的移动数据分流方法,其特征在于:所述步骤(2)进一步包括:
(2.1)MDP问题的最优化函数:
定义vt(st)为用户在状态st处从t到TM+1的总成本的最小期望值,如下式所示:
基于上式,采用一种动态方法解决MDP问题;
(2.2)一种动态解决MDP问题的方法,其过程如下:
(2.2.1)最优策略计算阶段:
(2.2.2)通过等式7,建立用户在位置l,下载剩余量b时,时间TM+1的总成本最小期望值l属于位置集合
(2.2.3)定义时间TM等于t;
(2.2.4)当t大于等于1时
(2.2.5)对于在时间t位置属于集合的lt
(2.2.6)定义时间t下载剩余量集合的向量集bt等于0;
(2.2.7)对于时间t属于下载剩余量集合的向量集bt
(2.2.8)用公式14计算时间t时状态st,分配的蜂窝网络的数据率at时,总成本的期望值Qt(st,at);
(2.2.9)定义时间t时最小总成本期望值的变量值为
(2.2.10)定义时间t时最小总成本期望值vt(l,b)等于变量值与Qt的期望;
(2.2.11)定义M个文件在时间t时下载剩余量的向量集bt等于bt加上σ;
(2.2.12)结束循环;
(2.2.13)结束循环;
(2.2.14)定义时间t等于t-1;
(2.2.15)结束循环;
(2.2.16)最佳策略π*是为了接下来的分流数据传输策略生成的;
(2.2.17);
(2.2.18)分流数据传输策略;
(2.2.19)定义时间t=1,下载剩余量b等于文件下载剩余量集合
(2.2.20)当时间t小于等于时间TM并且bt大于0;
(2.2.21)lt由GPS确定;
(2.2.22)根据最佳策略π*,定义用户动作
(2.2.23)定义bt=[bt-at,c-at,ω]+
(2.2.24)结束循环;
(2.2.25)定义t=t+1;
(2.2.26)结束循环;
步骤(3)一种低时间复杂度的启发式分流算法:
步骤(2)成功实现了降低用户成本的功能;但是,其算法的时间复杂度很高;因此,步骤(2)仅作为最佳分流策略的离线算法;
针对上述问题,提出一种新的算法,实现两个目标:1.低时间复杂度;2.实时性计算;具体步骤:
(3.1.1)在时间间隙t;
(3.1.2)输入:截止时间矢量集合T,截止时间阈值通过GPS获取的Mus在t时的位置指数lt,M个文件在时间t时下载剩余量的向量集bt
(3.1.3)对于属于集合T的矢量Tj
(3.1.4)如果t<Tj
(3.1.5)将Tj-t添加到截止时间保留表R;
(3.1.6)定义权重等于
(3.1.7)否则;
(3.1.8)定义权重等于0;
(3.1.9)将权重添加到分配率权重列表Wt
(3.1.10)结束循环;
(3.1.11)结束循环;
(3.1.12)标准化Wt
(3.1.13)标准化bt
(3.1.14)如果在位置l无线LAN网接入点可用而且速率比γth高,γth是由MUs的能量偏好定义的参数;
(3.1.15)根据分配无线LAN网数据接入率到每一个流;
(3.1.16)无线LAN网数据接入率at,w确定;
(3.1.17)如果R的最小值小于
(3.1.18)根据分配蜂窝网数据率到每一个流;
(3.1.19)蜂窝网数据接入率at,c确定;
(3.1.20)结束循环;
(3.1.21)根据at,c和at,w输出分配的蜂窝网络的数据率at
从上述算法的结果可以看出,时间复杂度远远低于算法1;并且,算法2可以作为在线算法实现实时计算。
CN201711373579.6A 2017-12-19 2017-12-19 一种基于马尔科夫决策过程的移动数据分流方法 Pending CN108093425A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201711373579.6A CN108093425A (zh) 2017-12-19 2017-12-19 一种基于马尔科夫决策过程的移动数据分流方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201711373579.6A CN108093425A (zh) 2017-12-19 2017-12-19 一种基于马尔科夫决策过程的移动数据分流方法

Publications (1)

Publication Number Publication Date
CN108093425A true CN108093425A (zh) 2018-05-29

Family

ID=62177113

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201711373579.6A Pending CN108093425A (zh) 2017-12-19 2017-12-19 一种基于马尔科夫决策过程的移动数据分流方法

Country Status (1)

Country Link
CN (1) CN108093425A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109412971A (zh) * 2018-06-22 2019-03-01 中山米来机器人科技有限公司 基于行动价值函数学习的数据分流方法、电子设备
CN115996403A (zh) * 2023-03-22 2023-04-21 北京邮电大学 5g工业时延敏感业务资源调度方法、装置、电子设备

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105072638A (zh) * 2015-07-28 2015-11-18 北京邮电大学 一种时延忍受异构无线移动网络的流量分载方法
CN107231224A (zh) * 2017-04-19 2017-10-03 南京邮电大学 一种最大传输时限下lte wlan网络动态聚合决策方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105072638A (zh) * 2015-07-28 2015-11-18 北京邮电大学 一种时延忍受异构无线移动网络的流量分载方法
CN107231224A (zh) * 2017-04-19 2017-10-03 南京邮电大学 一种最大传输时限下lte wlan网络动态聚合决策方法

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
CHENG ZHANG等: "A reinforcement learning approach for cost- and energy-aware mobile data offloading", 《2016 18TH ASIA-PACIFIC NETWORK OPERATIONS AND MANAGEMENT SYMPOSIUM(APNOMS)》 *
CHENG ZHANG等: "Cost- and energy-aware multi-flow mobile data offloading under time dependent pricing", 《2017 13TH INTERNATIONAL CONFERENCE ON NETWORK AND SERVICE MANAGEMENT(CNSM)》 *
CHENG ZHANG等: "Cost- and Energy-Aware Multi-Flow Mobile Data Offloading Using Markov Decision Process", 《IEICE TRANSACTIONS ON COMMUNICATIONS》 *

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109412971A (zh) * 2018-06-22 2019-03-01 中山米来机器人科技有限公司 基于行动价值函数学习的数据分流方法、电子设备
CN115996403A (zh) * 2023-03-22 2023-04-21 北京邮电大学 5g工业时延敏感业务资源调度方法、装置、电子设备
CN115996403B (zh) * 2023-03-22 2023-07-28 北京邮电大学 5g工业时延敏感业务资源调度方法、装置、电子设备

Similar Documents

Publication Publication Date Title
CN110351754B (zh) 基于Q-learning的工业互联网机器设备用户数据计算卸载决策方法
Zhang et al. Dynamic task offloading and resource allocation for mobile-edge computing in dense cloud RAN
CN112070240B (zh) 一种高效通信的分层联邦学习框架及其优化方法和系统
CN110035410A (zh) 一种软件定义车载边缘网络中联合资源分配和计算卸载的方法及系统
CN112954385B (zh) 一种基于控制论和数据驱动的自适应分流决策方法
CN107949025B (zh) 一种基于非合作博弈的网络选择方法
CN111866601B (zh) 一种基于合作博弈的移动边缘场景中的视频码率决策方法
CN110519849B (zh) 一种针对移动边缘计算的通信和计算资源联合分配方法
CN107708152B (zh) 异构蜂窝网络的任务卸载方法
Zhao et al. Task proactive caching based computation offloading and resource allocation in mobile-edge computing systems
CN105682231B (zh) 认知无线电网络协作通信的功率和时间联合分配方法
CN109819422B (zh) 一种基于Stackelberg博弈的异构车联网多模通信方法
TWI484850B (zh) 用於長期演進技術中省電資料排程系統及其方法
CN107948083A (zh) 一种基于增强学习的sdn数据中心拥塞控制方法
CN103796244A (zh) 一种均衡负载的无线异构多网接入选择方法
CN108093425A (zh) 一种基于马尔科夫决策过程的移动数据分流方法
CN106954232A (zh) 一种时延优化的资源分配方法
CN111526526B (zh) 基于服务混搭的移动边缘计算中的任务卸载方法
CN108990067B (zh) 一种应用于超密集异构网络的能效控制方法
CN104581918B (zh) 基于非合作博弈的卫星跨层联合优化功率分配方法
He et al. Strategy for task offloading of multi-user and multi-server based on cost optimization in mobile edge computing environment
Wang et al. Joint service caching, resource allocation and computation offloading in three-tier cooperative mobile edge computing system
CN114051252A (zh) 无线接入网中多用户智能发射功率控制方法
CN103023819B (zh) 一种粗粒度动态带宽分配方法
CN109376374B (zh) 一种基于多射频通信的多用户计算迁移方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
TA01 Transfer of patent application right
TA01 Transfer of patent application right

Effective date of registration: 20190418

Address after: 528400 No. 1 College Road, Shiqi District, Zhongshan City, Guangdong Province

Applicant after: Zhongshan College, Electronic Science &. Technology Univ.

Address before: 528400 Room 1613, No. 16 Digital Building, East Exhibition Road, Zhongshan Torch Development Zone, Guangdong Province

Applicant before: Zhongshan Ma Lai Robot Technology Co., Ltd.

RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20180529