CN102647773B - 基于q学习的异构网络接入控制优化选择方法 - Google Patents

基于q学习的异构网络接入控制优化选择方法 Download PDF

Info

Publication number
CN102647773B
CN102647773B CN201210132200.3A CN201210132200A CN102647773B CN 102647773 B CN102647773 B CN 102647773B CN 201210132200 A CN201210132200 A CN 201210132200A CN 102647773 B CN102647773 B CN 102647773B
Authority
CN
China
Prior art keywords
network
low
sub
access
state
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201210132200.3A
Other languages
English (en)
Other versions
CN102647773A (zh
Inventor
马琳
陈佳美
徐玉滨
邓志安
刘宁庆
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Harbin University of technology high tech Development Corporation
Original Assignee
Harbin Institute of Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Harbin Institute of Technology filed Critical Harbin Institute of Technology
Priority to CN201210132200.3A priority Critical patent/CN102647773B/zh
Publication of CN102647773A publication Critical patent/CN102647773A/zh
Application granted granted Critical
Publication of CN102647773B publication Critical patent/CN102647773B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Small-Scale Networks (AREA)
  • Mobile Radio Communication Systems (AREA)

Abstract

基于Q学习的异构网络接入控制优化选择方法,属于无线网络领域,本发明为解决针对WCDMA/WLAN融合异构网络系统,采用基于测量的接入方案选择网络类型不能实现全局最优,而采用基于模型的接入方案选择网络类型计算过于复杂,很难应用于实际系统的问题。本发明所述基于Q学习的异构网络接入控制优化选择方法包括以下步骤:步骤一、判断接入新用户时的异构网络状态;步骤二、查询Q值表,选择步骤一所述异构网络状态对应的Q值表中的最大Q值对应的子网络作为新用户的接入网络。本发明方法用于新用户接入时能根据当前的实际情况快速选择接入的网络类型。

Description

基于Q学习的异构网络接入控制优化选择方法
技术领域
本发明涉及基于Q学习的异构网络接入控制优化选择方法,属于无线网络领域。
背景技术
随着手机、笔记本、上网本等终端的丰富,多媒体等多种业务的兴起,单一网络已经越来越无法满足人们对带宽和业务质量的需求,同时,网络类型的繁多与彼此的不兼容也给用户带来了诸多不便,因此,多种无线接入网络的融合已经成为下一代无线网络一个新的趋势。在所有接入网络中,由于3G无线网络系统WCDMA和无线局域网WLAN优缺点存在互补性,引起了各界专家的关注。WLAN具有数据速率高、灵活、建网迅速、个人化等特点,但是覆盖范围小,而WCDMA的移动终端可广泛的配置,覆盖范围遍布全球,但是通信速率不高,适合语音传输。通过将WCDMA与WLAN这两种异构网络进行融合能够以较低的成本共享两者的优点。
无线网络融合首先遇到的挑战性问题就是接入控制。现在提出的接入控制方案主要是基于测量和基于模型的,基于测量的接入控制方案通常比较有效而且易于实现。然而,由于没有理论基础,这些方案很难达到全局最优。基于模型的接入控制方案有明确的数学根据,更能够全局优化,然而这些方案计算过于复杂,而且模型常常建立在一些与实际不符的假设上(例如信道传输无错,每个站点都是贪婪的),所以很难应用于实际的系统。马尔科夫决策的方法是解决接入控制问题的基于模型的经典方法,已经被应用到各个领域,但是这种方法的转移概率和回报函数都需要精确的定义,而且,在真正的实际环境中,模型的状态空间和计算复杂度会戏剧性的增大,这会使得马尔科夫决策的方法很难应用。
发明内容
本发明目的是为了解决针对WCDMA/WLAN融合异构网络系统,采用基于测量的接入方案选择网络类型不能实现全局最优,而采用基于模型的接入方案选择网络类型计算过于复杂,很难应用于实际系统的问题,提供了一种基于Q学习的异构网络接入控制优化选择方法。
本发明所述基于Q学习的异构网络接入控制优化选择方法,该方法包括以下步骤:
步骤一、判断接入新用户时的异构网络状态;
步骤二、查询Q值表,选择步骤一所述异构网络状态对应的Q值表中的最大Q值对应的子网络作为新用户的接入网络。
所述异构网络指的是WCDMA子网络和WLAN子网络采用松耦合的方式组成的融合异构网络,
所述异构网络状态是根据WCDMA子网络的基于干扰的四种网络状态和WLAN子网络的基于信道繁忙率的四种网络状态共同确定的,
WCDMA子网络的基于干扰的四种网络状态向量sc=[Ivery low,Ilow,Ihigh,Ivery high],WLAN子网络的基于信道繁忙率的四种网络状态向量sw=[Rb-very low,Rb-low,Rb-high,Rb-very high],
则所述WCDMA子网络和WLAN子网络构成的异构网络的网络状态向量s为:
s=[Rb-very lowIvery low,Rb-very lowIlow,Rb-very lowIhigh,Rb-very lowIvery high
Rb-lowIvery low,Rb-lowIlow,Rb-lowIhigh,Rb-lowIvery high
Rb-highIvery low,Rb-highIlow,Rb-highIhigh,Rb-highIvery high
Rb-very highIvery low,Rb-very highI low,Rb-very highIhigh,Rb-very highIvery high]。
确定WCDMA子网络的基于干扰的四种网络状态的规则为:
当0≤Itotal+ΔI<I1时,WCDMA子网络处于Ivery low状态;
当I1≤Itotal+ΔI<I2时,WCDMA子网络处于Ilow状态;
当I2≤Itotal+ΔI<I3时,WCDMA子网络的基于干扰的四种网络状态处于Ihigh状态;
当Itotal+ΔI≥I3时,WCDMA子网络处于Ivery high状态;
其中,I1=4~7,I2=8~9,I3=10~12,
Itotal为WCDMA子网络的基站的接入新用户前的N个用户时的总干扰,
ΔI为接入新用户增加的干扰,且按如下公式获取:
ΔI = I total 1 - η - ΔL · ΔL ,
式中:ΔL为新接入用户的负载因子,且按公式
ΔL = ( 1 + W v new R new ( E b / N 0 ) new ) - 1 获取;
其中:W为码片速率;
vnew为接入新用户的激活因子;
Rnew为接入新用户的比特速率;
(Eb/N0)new为接入新用户的信噪比;
η为基站中各条链路的负载因子之和,且按公式
η = ( 1 + f ) Σ i = 1 N 1 1 + W ( E b / N 0 ) i R i v i 获取,
其中:f为其他小区与本小区的干扰之比,且f=0.55;
vi为第i个用户的激活因子,i=1,2,…,N,N为WCDMA子网络的基站接入新用户前的用户数量;
Ri为第i个用户的比特速率;
(Eb/N0)i为第i个用户的信噪比。
确定WLAN子网络的基于信道繁忙率的四种网络状态的规则为:
当0≤Rb-max<Rb1时,WLAN子网络的基于信道繁忙率的四种网络状态处于Rb-very low状态;
当Rb1≤Rb-max<Rb2时,WLAN子网络处于Rb-low状态;
当Rb2≤Rb-max<Rb3时,WLAN子网络处于Rb-high状态;
当Rb-max≥Rb3时,WLAN子网络处于Rb-very high状态;
其中,Rb1=0.25,Rb2=0.5,Rb3=0.75,
Rb-max为最大吞吐量时的信息繁忙率,且Rb-max的获取过程为:
步骤1、根据公式求解最大吞吐量时的p值pr,p为在所观察的时隙内至少有一个传输的概率,
其中:Rs(p)=psTs/(piσ+psTs+pcTc)
式中:ps是数据成功传输概率,且ps=npt(1-pt)n-1,pt与p存在关系式p=1-(1-pt)n-1,n为WLAN子网络内的用户数;
pi是所观察的回退时隙内信道为空的概率,且pi=(1-pt)n
pc是同样的回退时隙内信道中至少有两个传输的碰撞概率,且pc=1-pi-ps
σ是空回馈时隙的长度;
Ts为数据包发送过程中发送数据包所需要的时间,
T s = T RTS + T CTS + T DATA ‾ + T ACK + 3 T SIFS + T DIFS ,
式中TRTS代表RTS信息,TCTS代表CTS信息,代表数据信息,TACK代表回答确认信息,TSIFS代表短帧间隔,TDIFS代表分布式帧间隔的平均传输时间;
Tc为数据包发送过程中碰撞过程所需要的时间,且Tc=TRTS+TCTS+TSIFS+TDIFS
步骤2、根据p*=MIN{pr,MAX(p)}获取p最优值p*,
式中:MAX(p)为WLAN子网络内的用户数为n时,在所观察的时隙内至少有一个传输的概率p的最大值;
步骤3、将步骤2获取的p最优值p*代入公式
Rb=1-piσ/(piσ+psTs+pcTc)中,
获取最大吞吐量时的信道繁忙率Rb-max,Rb为信道繁忙率。
步骤a、初始化Q值表,在[0,1]区间内随机赋值Q值表中的j=1,2,...16,
Q值表
步骤b、接入新用户,作出选择动作,记录立即回报函数rs(a),记录规则为:
当接入新用户为办理数据业务,作出的选择动作为选择WCDMA子网络即a=1时,记录rs(a)=1;
当接入新用户为办理数据业务,作出的选择动作为选择WLAN子网络即a=2时,记录rs(a)=2;
当接入新用户为办理语音业务,作出的选择动作为选择WCDMA子网络即a=1时,记录rs(a)=2;
当接入新用户为办理语音业务,作出的选择动作为选择WLAN子网络即a=2时,记录rs(a)=1;
当WCDMA子网络和WLAN子网络都没有足够资源,呼叫阻塞时,记录rs(a)=-5;
步骤c、根据公式
更新Q值表,
其中,α是学习强度,α=0.1~0.2,
γ为折扣因子,且0<γ<1,
Qs,t+1(a)为当前时刻、异构网络状态为s选择动作为a时Q值,
Qs,t(a)为前一时刻、异构网络状态为s选择动作为a时Q值,
步骤d、当满足收敛条件ΔQ(s,a)<ε,s∈S,a∈A,停止迭代,迭代门限ε=0.005,
ΔQ(s,a)为某个异构网络状态s选择动作为a的前后两次Q值的差值,ΔQ(s,a)=|Qs,t+1(a)-Qs,t(a)|,
重复执行步骤b至步骤d,直至将Q值表中所有Q值都更新完毕。
本发明的优点:本发明针对WCDMA/WLAN融合异构网络系统,提出一种非模型约束的强化学习的方法,有效解决优化网络接入控制的问题。该方案能够打破马尔科夫决策过程方法中的维度随系统状态增加而出现爆炸式增长的诅咒,获得系统回报最大化,有效提高系统资源利用率。
附图说明
图1是所建立的WCDMA/WLAN混合异构网络构架图;
图2是本发明所述基于Q学习的异构网络接入控制优化选择方法流程;
图3是更新Q值表获取过程的流程图。
具体实施方式
具体实施方式一:下面结合图1至图3说明本实施方式,本实施方式所述基于Q学习的异构网络接入控制优化选择方法,该方法包括以下步骤:
步骤一、判断接入新用户时的异构网络状态;
步骤二、查询Q值表,选择步骤一所述异构网络状态对应的Q值表中的最大Q值对应的子网络作为新用户的接入网络。
所述异构网络指的是WCDMA子网络和WLAN子网络采用松耦合的方式组成的融合异构网络,
所述异构网络状态是根据WCDMA子网络的基于干扰的四种网络状态和WLAN子网络的基于信道繁忙率的四种网络状态共同确定的,
WCDMA子网络的基于干扰的四种网络状态向量sc=[Ivery low,Ilow,Ihigh,Ivery high],WLAN子网络的基于信道繁忙率的四种网络状态向量sw=[Rb-very low,Rb-low,Rb-high,Rb-very high],
则所述WCDMA子网络和WLAN子网络构成的异构网络的网络状态向量s为:
s=[Rb-very lowIvery low,Rb-very lowIlow,Rb-very lowIhigh,Rb-very lowIvery high
Rb-lowIvery low,Rb-lowIlow,Rb-lowIhigh,Rb-lowIvery high
Rb-highIvery low,Rb-highIlow,Rb-highIhigh,Rb-highIvery high
Rb-very highIvery low,Rb-very highIlow,Rb-very highIhigh,Rb-very highIvery high]。
确定WCDMA子网络的基于干扰的四种网络状态的规则为:
当0≤Itotal+ΔI<I1时,WCDMA子网络处于Ivery low状态;
当I1≤Itotal+ΔI<I2时,WCDMA子网络处于Ilow状态;
当I2≤Itotal+ΔI<I3时,WCDMA子网络的基于干扰的四种网络状态处于Ihigh状态;
当Itotal+ΔI≥I3时,WCDMA子网络处于Ivery high状态;
其中,I1=4~7,I2=8~9,I3=10~12,
Itotal为WCDMA子网络的基站的接入新用户前的N个用户时的总干扰,
ΔI为接入新用户增加的干扰,且按如下公式获取:
ΔI = I total 1 - η - ΔL · ΔL ,
式中:ΔL为新接入用户的负载因子,且按公式
ΔL = ( 1 + W v new R new ( E b / N 0 ) new ) - 1
获取;
其中:W为码片速率;
vnew为接入新用户的激活因子;
Rnew为接入新用户的比特速率;
(Eb/N0)new为接入新用户的信噪比;
η为基站中各条链路的负载因子之和,且按公式
η = ( 1 + f ) Σ i = 1 N 1 1 + W ( E b / N 0 ) i R i v i
获取,
其中:f为其他小区与本小区的干扰之比,且f=0.55;
vi为第i个用户的激活因子,i=1,2,…,N,N为WCDMA子网络的基站接入新用户前的用户数量;
Ri为第i个用户的比特速率;
(Eb/N0)i为第i个用户的信噪比。
确定WLAN子网络的基于信道繁忙率的四种网络状态的规则为:
当0≤Rb-max<Rb1时,WLAN子网络的基于信道繁忙率的四种网络状态处于Rb-very low状态;
当Rb1≤Rb-max<Rb2时,WLAN子网络处于Rb-low状态;
当Rb2≤Rb-max<Rb3时,WLAN子网络处于Rb-high状态;
当Rb-max≥Rb3时,WLAN子网络处于Rb-very high状态;
其中,Rb1=0.25,Rb2=0.5,Rb3=0.75,
Rb-max为最大吞吐量时的信息繁忙率,且Rb-max的获取过程为:
步骤1、根据公式求解最大吞吐量时的p值pr,p为在所观察的时隙内至少有一个传输的概率,
其中:Rs(p)=psTs/(piσ+psTs+pcTc)
式中:ps是数据成功传输概率,且ps=npt(1-pt)n-1,pt与p存在关系式p=1-(1-pt)n-1,n为WLAN子网络内中的用户数;
pc是同样的回退时隙内信道中至少有两个传输的碰撞概率,且pc=1-pi-ps
pi是所观察的回退时隙内信道为空的概率,且pi=(1-pt)n
σ是空回馈时隙的长度;
Ts为数据包发送过程中发送数据包所需要的时间,
T s = T RTS + T CTS + T DATA ‾ + T ACK + 3 T SIFS + T DIFS ,
式中TRTS代表RTS信息,TCTS代表CTS信息,代表数据信息,TACK代表回答确认信息,TSIFS代表短帧间隔,TDIFS代表分布式帧间隔的平均传输时间;
Tc为数据包发送过程中碰撞过程所需要的时间,且Tc=TRTS+TCTS+TSIFS+TDIFS,ps、pc和pi这三个参量都是关于p的函数,一旦获得了Rs,则归一化吞吐量TH可以表示为:
TH = ( R s × T DATA ‾ ) / T s
注意到归一化吞吐量TH与Rs成正比,且信道繁忙率是递增函数。事实上,当p≤0.1,Rb与Rs几乎相同。这样,由于信道繁忙率Rb能够较准确地反应吞吐量,而且IEEE 802.11使用CSMA为基础的MAC层协议,使得信道繁忙率Rb很好获得。则使用Rb作为WLAN系统状态统计的参量。首先通过公式
d dp TH ( p ) = d dp R S ( p ) = 0
找到取得最大吞吐量时的p值pr
另外,对于用户数为固定值为n时,其p值有它的上界,即最大p值MAX(p)。假设p*碰撞概率的最优值,如下式所示:
p*=MIN{pr,MAX(p)}。
步骤2、根据p*=MIN{pr,MAX(p)}获取p最优值p*,
式中:MAX(p)为WLAN子网络内的用户数为n时,在所观察的时隙内至少有一个传输的概率p的最大值;
步骤3、将步骤2获取的p最优值p*代入公式
Rb=1-piσ/(piσ+psTs+pcTc)中,
获取最大吞吐量时的信道繁忙率Rb-max,Rb为信道繁忙率。
Q值表的获取过程为:
步骤a、初始化Q值表,在[0,1]区间内随机赋值Q值表中的j=1,2,...16,
Q值表
步骤b、新用户到达时,选择Q值大的子网络作为该新用户的接入网络,作出选择动作后记录立即回报函数rs(a),在用户到达的时刻记录此时状态st,在执行动作后,记录系统的新状态st+1,记录立即回报函数的规则为:
当接入新用户为办理数据业务,作出的选择动作为选择WCDMA子网络即a=1时,记录rs(a)=1;
当接入新用户为办理数据业务,作出的选择动作为选择WLAN子网络即a=2时,记录rs(a)=2;
当接入新用户为办理语音业务,作出的选择动作为选择WCDMA子网络即a=1时,记录rs(a)=2;
当接入新用户为办理语音业务,作出的选择动作为选择WLAN子网络即a=2时,记录rs(a)=1;
当WCDMA子网络和WLAN子网络都没有足够资源,呼叫阻塞时,记录rs(a)=-5;
控制者根据Q值表的每一行值,做出选择动作,选择的规则是接入Q值较大的子网络。动作作出之后,环境,即网络,会按照产生的影响给出控制者奖励或惩罚的回报。下面定义状态动作对(s,a)的回报函数。考虑到WCDMA更适合语音传输,而WLAN更适合数据业务传输。则若语音业务被接入到WCDMA中,立即回报为rs(a)=2,如果其被接入WLAN网络,立即回报为rs(a)=1。同理如果数据业务用户被接入WLAN网络,则rs(a)=2,如果其被接入WCDMA网络,rs(a)=1。如果两个网络中都没有足够的资源,则呼叫被阻塞立即回报设为rs(a)=-5。
步骤c、根据公式
更新Q值表,
其中,α是学习强度,α=0.1~0.2,
γ为折扣因子,且0<γ<1,
Qs,t+1(a)为当前时刻、异构网络状态为s选择动作为a时Q值,
Qs,t(a)为前一时刻、异构网络状态为s选择动作为a时Q值,
步骤d、当满足收敛条件ΔQ(s,a)<ε,a∈A,停止迭代,迭代门限ε=0.005,
S为异构网络的状态集合,A为所有动作的集合,可选择的动作有:
ΔQ(s,a)为某个异构网络状态s选择动作为a的前后两次Q值的差值,ΔQ(s,a)=|Qs,t+1(a)-Qs,t(a)|,
重复执行步骤b至步骤d,直至将Q值表中所有Q值都更新完毕。
通过这样的迭代逼近,最后找到Q的最优值:
Q s * ( a ) = r s ( a ) + γ [ max Q s * ( a ′ ) a ′ ∈ A ] .
下面给出一个具体的实施例:
初始化的Q值表如下:
按照上述过程对该Q值进行更新,所有Q值都满足收敛条件,更新后的Q值表为:
具体实施方式二:本实施方式对实施方式一作进一步说明,I1=4,I2=8,I3=12。
具体实施方式三:本实施方式对实施方式一作进一步说明,折扣因子γ=0.9。

Claims (4)

1.基于Q学习的异构网络接入控制优化选择方法,其特征在于,该方法包括以下步骤:
步骤一、判断接入新用户时的异构网络状态;
所述异构网络指的是WCDMA子网络和WLAN子网络采用松耦合的方式组成的融合异构网络,
所述异构网络状态是根据WCDMA子网络的基于干扰的四种网络状态和WLAN子网络的基于信道繁忙率的四种网络状态共同确定的,
WCDMA子网络的基于干扰的四种网络状态向量sc=[Ivery low,Ilow,Ihigh,Ivery high],WLAN子网络的基于信道繁忙率的四种网络状态向量sw=[Rb-very low,Rb-low,Rb-high,Rb-very high],
则所述WCDMA子网络和WLAN子网络构成的异构网络的网络状态向量s为:
s=[Rb-very lowIvery low,Rb-very lowIlow,Rb-very lowIhigh,Rb-very lowIvery high,
Rb-lowIvery low,Rb-lowIlow,Rb-lowIhigh,Rb-lowIvery high,
Rb-highIvery low,Rb-highIlow,Rb-highIhigh,Rb-highIvery high,;
Rb-very highIvery low,Rb-very highIlow,Rb-very highIhigh,Rb-very highIvery high]
确定WCDMA子网络的基于干扰的四种网络状态的规则为:
当0≤Itotal+△I<I1时,WCDMA子网络处于Ivery low状态;
当I1≤Itotal+△I<I2时,WCDMA子网络处于Ilow状态;
当I2≤Itotal+△I<I3时,WCDMA子网络处于Ihigh状态;
当Itotal+△I≥I3时,WCDMA子网络处于Ivery high状态;
其中,I1=4~7,I2=8~9,I3=10~12,
Itotal为WCDMA子网络的基站接入新用户前的N个用户的总干扰,
△I为接入新用户增加的干扰,且按如下公式获取:
式中:△L为新接入用户的负载因子,且按公式
获取;
其中:W为码片速率;
vnew为接入新用户的激活因子;
Rnew为接入新用户的比特速率;
(Eb/N0)new为接入新用户的信噪比;
η为基站中各条链路的负载因子之和,且按公式
获取,
其中:f为其他小区与本小区的干扰之比,且f=0.55;
vi为第i个用户的激活因子,i=1,2,…,N,N为WCDMA子网络的基站接入新用户前的用户数量;
Ri为第i个用户的比特速率;
(Eb/N0)i为第i个用户的信噪比;
步骤二、查询Q值表,选择步骤一所述异构网络状态对应的Q值表中的最大Q值对应的子网络作为新用户的接入网络;
Q值表的获取过程为:
步骤a、初始化Q值表,在[0,1]区间内随机赋值Q值表中的j=1,2,...16,
Q值表
步骤b、接入新用户,作出选择动作,记录立即回报函数rs(a),记录规则为:
当接入新用户为办理数据业务,作出的选择动作为选择WCDMA子网络即a=1时,记录rs(a)=1;
当接入新用户为办理数据业务,作出的选择动作为选择WLAN子网络即a=2时,记 录rs(a)=2;
当接入新用户为办理语音业务,作出的选择动作为选择WCDMA子网络即a=1时,记录rs(a)=2;
当接入新用户为办理语音业务,作出的选择动作为选择WLAN子网络即a=2时,记录rs(a)=1;
当WCDMA子网络和WLAN子网络都没有足够资源,呼叫阻塞时,记录rs(a)=-5;
步骤c、根据公式
更新Q值表,
其中,α是学习强度,α=0.1~0.2,
γ为折扣因子,且0<γ<1,
Qs,t+1(a)为当前时刻、异构网络状态为s选择动作为a时Q值,
Qs,t(a)为前一时刻、异构网络状态为s选择动作为a时Q值,
步骤d、当满足收敛条件△Q(s,a)<ε,a∈A,停止迭代,迭代门限ε=0.005,
△Q(s,a)为某个异构网络状态s选择动作为a的前后两次Q值的差值,△Q(s,a)=|Qs,t+1(a)-Qs,t(a)|,
S为异构网络的状态集合,A为所有动作的集合,
重复执行步骤b至步骤d,直至将Q值表中所有Q值都更新完毕。
2.根据权利要求1所述基于Q学习的异构网络接入控制优化选择方法,其特征在于,I1=4,I2=8,I3=12。
3.根据权利要求1所述基于Q学习的异构网络接入控制优化选择方法,其特征在于,确定WLAN子网络的基于信道繁忙率的四种网络状态的规则为:
当0≤Rb-max<Rb1时,WLAN子网络处于Rb-very low状态;
当Rb1≤Rb-max<Rb2时,WLAN子网络处于Rb-low状态;
当Rb2≤Rb-max<Rb3时,WLAN子网络处于Rb-high状态;
当Rb-max≥Rb3时,WLAN子网络处于Rb-very high状态;
其中,Rb1=0.25,Rb2=0.5,Rb3=0.75,
Rb-max为最大吞吐量时的信息繁忙率,且Rb-max的获取过程为:
步骤1、根据公式求解最大吞吐量时的p值pr,p为在所观察的时隙内至少有一个传输的概率,
其中:Rs(p)=psTs/(piσ+psTs+pcTc)
式中:ps是数据成功传输概率,且ps=npt(1-pt)n-1,pt与p存在关系式p=1-(1-pt)n-1,n为WLAN子网络内的用户数;
pi是所观察的回退时隙内信道为空的概率,且pi=(1-pt)n
pc是同样的回退时隙内信道中至少有两个传输的碰撞概率,且pc=1-pi-ps
σ是空回馈时隙的长度;
Ts为数据包发送过程中发送数据包所需要的时间,
式中TRTS代表RTS信息,TCTS代表CTS信息,代表数据信息,TACK代表回答确认信息,TSIFS代表短帧间隔,TDIFS代表分布式帧间隔的平均传输时间;
Tc为数据包发送过程中碰撞过程所需要的时间,且Tc=TRTS+TCTS+TSIFS+TDIFS
步骤2、根据p*=MIN{pr,MAX(p)}获取p最优值p*,
式中:MAX(p)为WLAN子网络内的用户数为n时,在所观察的时隙内至少有一个传输的概率p的最大值;
步骤3、将步骤2获取的p最优值p*代入公式
Rb=1-piσ/(piσ+psTs+pcTc)中,
获取最大吞吐量时的信道繁忙率Rb-max,Rb为信道繁忙率。
4.根据权利要求1所述基于Q学习的异构网络接入控制优化选择方法,其特征在于,折扣因子γ=0.9。
CN201210132200.3A 2012-05-02 2012-05-02 基于q学习的异构网络接入控制优化选择方法 Active CN102647773B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201210132200.3A CN102647773B (zh) 2012-05-02 2012-05-02 基于q学习的异构网络接入控制优化选择方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201210132200.3A CN102647773B (zh) 2012-05-02 2012-05-02 基于q学习的异构网络接入控制优化选择方法

Publications (2)

Publication Number Publication Date
CN102647773A CN102647773A (zh) 2012-08-22
CN102647773B true CN102647773B (zh) 2014-08-06

Family

ID=46660305

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201210132200.3A Active CN102647773B (zh) 2012-05-02 2012-05-02 基于q学习的异构网络接入控制优化选择方法

Country Status (1)

Country Link
CN (1) CN102647773B (zh)

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103109561A (zh) * 2012-10-08 2013-05-15 华为技术有限公司 Wcdma系统剩余容量的估算方法、装置和设备
CN104168087B (zh) * 2014-08-08 2017-05-24 浙江大学 无速率编码传输系统中基于q学习的传输帧长主动自适应调整方法
CN107690176B (zh) * 2017-09-30 2020-08-25 南京南瑞集团公司 一种基于q学习算法的网络选择方法
CN107889195B (zh) * 2017-11-16 2020-06-16 电子科技大学 一种区分业务的自学习异构无线网络接入选择方法
CN109492132A (zh) * 2018-10-26 2019-03-19 广州市香港科大霍英东研究院 异构信息网络嵌入的方法、系统、终端及存储介质
JP7270914B2 (ja) * 2020-03-02 2023-05-11 日本電信電話株式会社 無線通信制御方法、無線通信システム、無線端末、及び無線通信プログラム
CN112367683B (zh) * 2020-11-17 2022-07-01 重庆邮电大学 基于改进深度q学习的网络选择方法
CN114845359A (zh) * 2022-03-14 2022-08-02 中国人民解放军军事科学院战争研究院 一种基于Nash Q-Learning的多智能异构网络选择方法

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101835235A (zh) * 2010-04-23 2010-09-15 西安电子科技大学 基于认知的异构网络路由方法

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101835235A (zh) * 2010-04-23 2010-09-15 西安电子科技大学 基于认知的异构网络路由方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
基于Q学习的异构网络选择新算法;赵彦清等;《计算机应用》;20110630;第31卷(第6期);正文第1461-1464页 *
赵彦清等.基于Q学习的异构网络选择新算法.《计算机应用》.2011,第31卷(第6期),

Also Published As

Publication number Publication date
CN102647773A (zh) 2012-08-22

Similar Documents

Publication Publication Date Title
CN102647773B (zh) 基于q学习的异构网络接入控制优化选择方法
Ekici et al. IEEE 802.11 a throughput performance with hidden nodes
Sommer et al. On the feasibility of UMTS-based traffic information systems
Murray et al. Measuring the performance of IEEE 802.11 p using ns-2 simulator for vehicular networks
CN102638870B (zh) 无线异构网络接入选择方法
CN101582837A (zh) 一种业务接入控制方法、无线接入系统以及接入控制装置
Harigovindan et al. Proportional fair resource allocation in vehicle-to-infrastructure networks for drive-thru Internet applications
CN103945441B (zh) 自适应调整QoS参数的方法和装置
Balakrishnan et al. Deep reinforcement learning based traffic-and channel-aware OFDMA resource allocation
Xiong et al. Saturated throughput analysis of IEEE 802.11 e EDCA
Hu et al. A study of LTE network performance based on data analytics and statistical modeling
CN101640914B (zh) 一种实现网络选择的方法和装置
Saadat et al. Enhanced network sensitive access control scheme for LTE–LAA/WiFi coexistence: Modeling and performance analysis
US20070218916A1 (en) Method and system for resource allocation based on distributed scheduling in a wireless comunication system including heterogeneous mobile stations
Cheng et al. A new scheme to achieve weighted fairness for WLAN supporting multimedia services
CN200947609Y (zh) 传送信息包的网状网络及装置
CN105338650A (zh) 一种异构网络中的接入方法和装置
CN103648105B (zh) 一种无线局域网接入点部署方案的获得方法及系统
Yin et al. Performance evaluation of a unified IEEE 802.11 DCF model in ns-3
JP5151906B2 (ja) 通信品質評価プログラム、方法及び装置
CN105764121A (zh) 一种蜂窝流量卸载网络中基于动态排序的设备与基站连接方法
Abu-Khadrah et al. Enhance the performance of EDCA protocol by adapting contention window
Ma et al. Probability of coexistence of LTE-LAA and WLAN systems based on delay constraints
CN106851694B (zh) 一种用于异构网络的动态最优网络选择方法及装置
CN106937326A (zh) 基站间协调传输方法和第一基站

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
TR01 Transfer of patent right

Effective date of registration: 20200401

Address after: 150001 No. 118 West straight street, Nangang District, Heilongjiang, Harbin

Patentee after: Harbin University of technology high tech Development Corporation

Address before: 150001 Harbin, Nangang, West District, large straight street, No. 92

Patentee before: HARBIN INSTITUTE OF TECHNOLOGY

TR01 Transfer of patent right