CN103327556B - 异构无线网络中优化用户QoE的动态网络选择方法 - Google Patents

异构无线网络中优化用户QoE的动态网络选择方法 Download PDF

Info

Publication number
CN103327556B
CN103327556B CN201310280666.2A CN201310280666A CN103327556B CN 103327556 B CN103327556 B CN 103327556B CN 201310280666 A CN201310280666 A CN 201310280666A CN 103327556 B CN103327556 B CN 103327556B
Authority
CN
China
Prior art keywords
network
qoe
service
user
parameter
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201310280666.2A
Other languages
English (en)
Other versions
CN103327556A (zh
Inventor
吴启晖
王金龙
杜智勇
杨盘隆
郑学强
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
COMMUNICATION ENGINEERING COLLEGE SCIENCE & ENGINEEIRNG UNIV PLA
Original Assignee
COMMUNICATION ENGINEERING COLLEGE SCIENCE & ENGINEEIRNG UNIV PLA
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by COMMUNICATION ENGINEERING COLLEGE SCIENCE & ENGINEEIRNG UNIV PLA filed Critical COMMUNICATION ENGINEERING COLLEGE SCIENCE & ENGINEEIRNG UNIV PLA
Priority to CN201310280666.2A priority Critical patent/CN103327556B/zh
Publication of CN103327556A publication Critical patent/CN103327556A/zh
Application granted granted Critical
Publication of CN103327556B publication Critical patent/CN103327556B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Abstract

一种异构无线网络中优化用户QoE的动态网络选择方法,该方法结合传输的业务类型和当前用户接入的网络,周期的动态更新接入网络;该方法包括以下步骤:建立三种业务类型的用户QoE需求函数以及初始化Q学习中变量的步骤;采用Q学习方法进行网络选择决策及执行切换的步骤;和Q学习方法中变量更新的步骤。本发明从用户的角度出发,区分不同的业务特性,优化用户的QoE;本发明提供了一种动态的网络选择方法,能够高效的利用异构无线网络资源;本发明基于强化学习,不需要先验的网络状态信息,具有较强的灵活性,能够适应各种动态的网络环境。

Description

异构无线网络中优化用户QoE的动态网络选择方法
技术领域
本发明涉及通信网络中的无线接入网络领域,具体讲是在不依赖异构网络先验状态信息的条件下,基于强化学习,提出一种优化用户QoE的动态网络选择方法。
背景技术
随着无线通信技术的迅猛发展,全球无线通信数据业务快速增长。一方面,移动宽带数据业务已经超过语音业务并将持续增长(指数速度),预计2015年人均月消费1GB数据流量。另一方面,用户对于无线数据传输质量的期望越来越高。为了满足不断增长的无线数据传输需求,进一步提长无线通信系统的性能,异构无线网络架构是未来4G、B4G中一种有效的解决方案,它能够以较低的成本显著地提升网络容量和网络覆盖能力。异构无线网络可以认为是一种包含多种无线接入技术、协议类型、传输方式或者是不同发射功率基站的网络架构。与此同时,无线多模终端凭借其配备的多个空中接口,具有灵活接入多种不同类型无线网络的能力,能够高效地利用异构无线网络资源,从而极大的提升无线数据传输质量。无线多模终端的工作性能取决于合理、高效的网络接入选择和切换机制,目前已有大量的相关方面的研究成果。
现有异构无线网络选择/切换方面的研究主要围绕切换效用函数设计及切换算法设计两方面。切换效用函数是网络选择/切换中的关键性能评估指标,直接影响着最终的传输质量。在切换效用函数设计方面,最常用的效用为接收信号强度、接收信号的信干躁比、带宽、吞吐量、时延、网络负载等一个或多个与服务质量(qualityofservice,简称QoS)相关的指标。这些效用主要关注的是如何选择网络使得通信的性能得到提升。相比于以上的切换效用,近年来,以用户体验(qualityofexperience,简称QoE)作为网络选择/切换中的效用受到了研究人员的广泛关注。QoE表示用户对于其业务的服务质量感受,其应用于网络选择/切换的优势在于能够从更高的层次,更准确地反映用户的需求。QoE改变了传统效用与QoS的线性变化关系,以QoS指标的函数的形式反映用户的需求与系统性能的关系。目前将QoE引入网络选择/切换中的研究和应用还处于初级阶段,现有工作仅考虑用户具有一种特定的QoE需求,并没有完全考虑到在实际场景中,用户QoE的需求会随着应用的业务类型变化而变化的问题。因此如何根据用户动态变化的QoE需求做出合理的网络选择/切换是一个待解决的问题。
另一方面,在网络选择/切换算法设计相关的研究方面,通常是根据切换效用函数来确定的网络切换决策。常见的算法包括多属性决策算法、灰度相关算法和马尔可夫决策过程等。然而,现有算法往往假设终端对于网络状态信息是全部或部分先验已知的。这种假设在实际的场景中是比较苛刻的,主要原因在于现有的异构无线网络往往不是完全紧耦合的,而是由多个运营商(或服务提供商)所有的,所有权的不同导致不同的网络运营商间存在竞争关系,网络状态信息难以有效共享。此外,即使消除了竞争层面的问题,技术层面也有障碍:提供异构网络间信息共享并辅助资源共享决策的相关技术标准(如IEEE802.21协议)到目前并没有获得广泛的应用,现有的协议和技术限制了网络状态信息的有效共享。以上两个方面的问题直接导致网络状态信息不能共享,使得现有的算法在实际的场景中不能有效工作。
发明内容
本发明的目的是针对异构无线网络中动态变化的用户QoE需求以及网络状态先验信息未知的问题。以QoE回报为网络性能度量指标,利用强化学习,实现动态的无线网络选择/切换,最大化用户的累积期望净回报。这里的净回报是扣除网络切换开销的QoE回报
本发明的技术方案是:
一种异构无线网络中优化用户QoE的动态网络选择方法,该方法结合传输的业务类型和当前用户接入的网络,周期的动态更新接入网络。
本发明的方法包括以下步骤:建立三种业务类型的用户QoE需求函数以及初始化Q学习中变量的步骤;采用Q学习方法进行网络选择决策及执行切换的步骤;和Q学习方法中变量更新的步骤。
本发明的方法具体包括以下步骤:
步骤1.初始化,完成以下工作:
1.1建立三种业务类型的用户QoE需求函数,所述的三种业务类型包括视频业务、音频业务和弹性业务,QoE需求函数将网络服务质量性能参数映射成用户的QoE回报;前述QoE需求函数输入为QoS参数,输出为评分值,评分值的取值范围为1~5,评分越高,代表用户的体验好或满意度高,三种业务对应的QoE需求函数分别如下:
1)视频业务,记为svideo:视频业务的QoE取决于接收信号的峰值信躁比Psnr,其QoE需求函数Fvideo(Psnr)定义为
F video ( P snr ) = 4.5 - 3.5 1 + exp ( b 1 ( P snr - b 2 ) )
其中,参数b1确定QoE的增长速度;参数b2确定函数的中点位置,即QoE取中间值2.75时所需的峰值信躁比;调整b1和b2能够满足不同用户对视频业务的个性化要求情况;
2)音频业务,记为saudio:音频业务的QoE与数据包的丢包率e和时延d有关,丢包率和时延可以分别由下式计算
e=enetwork+(1-enetwork)eplayout
d=dcodec+dplayout+dnetwork
其中,enetwork为网络传输中引起的丢包率,eplayout为播放缓冲时的丢包率,dcodec为编码器产生的时延,dplayout为播放缓冲导致的时延,dnetwork为网络传输中产生的时延;上述的丢包和时延导致的音频业务的性能损失Ie和Id分别为
Ie12ln(1+γ3e)
Id=0.024d+0.11(d-177.3)I{d-177.3}
其中,参数γ1,γ2和γ3取决于采用的编解码器,时延d的单位为毫秒,177.3毫秒为常用的时延门限值,I{·}为指示函数,由Ie和Id导致的总体性能损失定义为Rf指数,
Rf=94.2-Ie-Id
由Rf指数,得到音频业务的QoE需求函数Faudio(Rf)
Faudio(Rf)=1+0.035Rf+7·10-6Rf(Rf-60)(100-Rf)
3)弹性业务,记为selastic:弹性业务的QoE与吞吐量θ有关,其QoE需求函数Felastic(θ)定义为
Felastic(θ)=b3log(b4θ)
给定用户的最小期望吞吐量θ1和最大期望吞吐量θ2,参数 b 3 = 1 log ( b 4 θ 1 ) ;
1.2初始化Q学习中的变量:记业务类型集为可用网络集为定义x=[s,n]∈X为用户的状态,x表示的状态是用户当前所在网络为n且新到达的业务对应的类型为s,为用户状态空间,为切换目标网络,即切换到的网络,初始化Q值为Q(x,n)=0,系统时隙长度为T,初始化网络切换开销矩阵其中cm,n≥0表示从网络m切换至网络n的切换开销,并且cn,n=0;这里的开销表征的是网络切换中产生的协议开销;
步骤2.采用Q学习方法进行网络选择决策及执行切换,完成以下工作:
2.1在第t个时隙的起始时刻,t时隙传输的业务类型为s(t);
2.2结合当前接入的网络n(t),得到x(t)=[s(t),n(t)],并按照下面的规则选择切换网络:以概率ε(t)随机选择一个网络接入;以概率1-ε(t)选择网络接入,ε(t)随着t会变小,始终大于0;
2.3执行网络切换,建立连接;
步骤3.Q学习方法中变量更新:
3.1建立连接后,进行业务传输;
3.2当第t个时隙的传输结束,根据所传输的业务类型,计算相应业务类型的QoE回报回报即Fs(t),然后,计算用户的净回报r(x(t),δ(t))
r(x(t),δ(t))=Fs(t)-ρcn(t),δ(t)
其中0≤ρ≤1为开销权重;
3.3在第t+1时隙的起始时刻,业务类型为s(t+1),系统状态转移到新状态x(t+1)=[s(t+1),δ(t)];
3.4按下式更新Q值
其中αt<1为Q学习中的控制参数,随t增大而减小,满足
3.5t=t+1,回到步骤2。
本发明的步骤1中,参数γ1,γ2和γ3取决于采用的编解码器,所述的编码器型号为G.729a或G.711,编码器型号为G.729a时,γ1=11,γ2=40,γ3=10;编码器型号为G.711时,γ1=0,γ2=30,γ3=15。
本发明的步骤2中, &epsiv; ( t ) = 3 5 + ln t , t &GreaterEqual; 1 .
本发明的有益效果:
本发明从用户的角度出发,区分不同的业务特性,优化用户的QoE;本发明提供了一种动态的网络选择方法,能够高效的利用异构无线网络资源;本发明基于强化学习,不需要先验的网络状态信息,具有较强的灵活性,能够适应各种动态的网络环境。
附图说明
图1本发明的系统工作机制示意图。
图2本发明所提方法的工作流程图。
图3本发明所提方法与四种网络选择机制在不同的开销权重下的性能比较图。
图4本发明所提方法与四种网络选择机制在三种不同的业务类型转移矩阵下的性能比较图。
具体实施方式
下面结合附图和实施例对本发明作进一步的说明。
本发明提出的动态网络选择工作机制图1所示,所提的优化用户QoE的动态网络选择方法如图2所示,具体实施方式如下:
本发明采用如图1所示的动态网络选择工作机制。用户可以接入多个可用的无线网络,在传输业务的过程中,动态的选择切换网络。系统以固定长度为T的时隙,周期地进行网络选择/切换,所提的算法在每个时隙的起始时刻进行网络选择决策,确定了切换目标网络之后执行切换动作,然后接入网络进行传输,直至该时隙传输完毕。最后,通过该时隙业务传输反馈的QoE回报和切换开销,对Q学习进行更新。所提出的动态网络选择方法不同于现有的算法,主要体现在三个方面:(1)以优化用户的QoE为目标,从用户的QoE需求出发,并且考虑了实际系统中QoE需求的动态变化问题;(2)联合考虑了网络切换开销与QoE的折衷;(3)动态的网络选择机制,能够适应复杂动态的异构无线网络环境。
本发明采用如图2所示的流程。该流程主要由三个基本部分组成:参数初始化、网络选择决策及执行切换和Q学习变量更新。具体流程如下:
步骤1.初始化,完成以下工作:
1.1建立三种业务类型的用户QoE需求函数,所述的三种业务类型包括视频业务、音频业务和弹性业务,QoE需求函数将网络服务质量性能参数映射成用户的QoE回报;前述QoE需求函数输入为QoS参数,输出为评分值,评分值的取值范围为1~5,评分越高,代表用户的体验好或满意度高,三种业务对应的QoE需求函数分别如下:
4)视频业务,记为svideo:视频业务的QoE取决于接收信号的峰值信躁比Psnr,其QoE需求函数Fvideo(Psnr)定义为
F video ( P snr ) = 4.5 - 3.5 1 + exp ( b 1 ( P snr - b 2 ) )
其中,参数b1确定QoE的增长速度;参数b2确定函数的中点位置,即QoE取中间值2.75时所需的峰值信躁比;调整b1和b2能够满足不同用户对视频业务的个性化要求情况;
5)音频业务,记为saudio:音频业务的QoE与数据包的丢包率e和时延d有关,丢包率和时延可以分别由下式计算
e=enetwork+(1-enetwork)eplayout
d=dcodec+dplayout+dnetwork
其中,enetwork为网络传输中引起的丢包率,eplayout为播放缓冲时的丢包率,dcodec为编码器产生的时延,dplayout为播放缓冲导致的时延,dnetwork为网络传输中产生的时延;上述的丢包和时延导致的音频业务的性能损失Ie和Id分别为
Ie12ln(1+γ3e)
Id=0.024d+0.11(d-177.3)I{d-177.3}
其中,参数γ1,γ2和γ3取决于采用的编解码器,时延d的单位为毫秒,177.3毫秒为常用的时延门限值,I{·}为指示函数,由Ie和Id导致的总体性能损失定义为Rf指数,
Rf=94.2-Ie-Id
由Rf指数,得到音频业务的QoE需求函数Faudio(Rf)
Faudio(Rf)=1+0.035Rf+7·10-6Rf(Rf-60)(100-Rf)
6)弹性业务,记为selastic:弹性业务的QoE与吞吐量θ有关,其QoE需求函数Felastic(θ)定义为
Felastic(θ)=b3log(b4θ)给定用户的最小期望吞吐量θ1和最大期望吞吐量θ2,参数 b 3 = 1 log ( b 4 &theta; 1 ) ;
1.2初始化Q学习中的变量:记业务类型集为可用网络集为定义x=[s,n]∈X为用户的状态,x表示的状态是用户当前所在网络为n且新到达的业务对应的类型为s,为用户状态空间,为切换目标网络,即切换到的网络,初始化Q值为Q(x,n)=0,系统时隙长度为T,初始化网络切换开销矩阵其中cm,n≥0表示从网络m切换至网络n的切换开销,并且cn,n=0;这里的开销表征的是网络切换中产生的协议开销;
步骤2.采用Q学习方法进行网络选择决策及执行切换,完成以下工作:
2.1在第t个时隙的起始时刻,t时隙传输的业务类型为s(t);
2.2结合当前接入的网络n(t),得到x(t)=[s(t),n(t)],并按照下面的规则选择切换网络:以概率ε(t)随机选择一个网络接入;以概率1-ε(t)选择网络接入,ε(t)随着t会变小,始终大于0;
2.3执行网络切换,建立连接;
步骤3.Q学习方法中变量更新:
3.1建立连接后,进行业务传输;
3.2当第t个时隙的传输结束,根据所传输的业务类型,计算相应业务类型的QoE回报回报即Fs(t),然后,计算用户的净回报r(x(t),δ(t))
r(x(t),δ(t))=Fs(t)-ρcn(t),δ(t)
其中0≤ρ≤1为开销权重;
3.3在第t+1时隙的起始时刻,业务类型为s(t+1),系统状态转移到新状态x(t+1)=[s(t+1),δ(t)];
3.4按下式更新Q值
其中αt<1为Q学习中的控制参数,随t增大而减小,满足
3.5t=t+1,回到步骤2。
实施例:
下面通过仿真实例来验证本发明的有效性。
首先简要介绍实施例的场景,假设由一个LTE网络和两个无线局域网络(WLAN,两个网络分别记为WLAN1和WLAN2)构成的异构无线网络,一个多模手机用户处于三个网络信号的覆盖区域,用户可以自由选择和切换接入任何一个网络。
网络参数模型:为了反映动态变化的网络状态,我们采用离散随机模型来建模各网络的QoS参数。由于峰值信躁比变化较慢,我们认为三个网络的峰值信躁比在仿真过程中保持不变。我们近似认为网络导致的丢包率enetwork、网络中的传输时延dnetwork和吞吐量θ三个QoS参数在一个时隙内保持不变,而在不同的时隙间是独立的离散随机变量。其中,丢包率enetwork有Ne个离散状态,
enetwork=emin+eunitne,ne=0,1,...,Ne-1
其中emin为最小丢包率,eunit为最小丢包率单位。类似的,传输时延dnetwork共有Nd个离散状态,
dnetwork=dmin+dunitnd,nd=0,1,...,Nd-1
其中dmin为最小时延,dunit为最小时延单位。吞吐量θ有共有Nθ个离散状态,
θ=θminunitnθ,nθ=0,1,...,Nθ-1
其中θmin为最小吞吐量,θunit为最小吞吐量单位。在我们的实施例中,三个网络的参数设置见表1。
表1网络参数设置
emin eunit Ne dmin dunit Nd θmin θunit Nθ Psnr
LTE 0.02 0.02 3 10ms 10ms 5 250kbps 50kbps 6 4dB
WLAN1 0.02 0.02 5 50ms 10ms 4 720kbps 60kbps 4 5dB
WLAN2 0.04 0.02 5 60ms 10ms 5 250kbps 50kbps 4 7dB
业务参数设置:前述的三种业务类型对应的QoE需求函数的参数设置为:在视频业务的QoE需求函数中,b1=1,b2=5。音频业务的QoE需求函数中,假设编解码采用的是G.711,则可知γ1=0,γ2=30,γ3=15。此外,播放缓冲导致的丢包率和时延分别为eplayout=0.05,dplayerout=60ms,编解码导致的时延dcodec=25ms。弹性业务中,假设最大期望吞吐量为2Mbps,最小期望吞吐量为100kpbs,则可得到b3=2.6949,b4=0.0235。
相邻两个时隙中业务类型的转移概率矩阵P为
P = s br s st s el s br 0.5 0.2 0.3 s st 0.2 0.6 0.2 s el 0.2 0.3 0.5
网络切换开销矩阵为
C = LTE WLAN 1 WLAN 2 LTE 0 2 2 WLAN 1 2 0 1 WLAN 2 2 1 0
参数设置:Q学习算法的参数设置如下,开发与利用折衷概率此外,β=0.3,切换开销权重ρ=0.5,系统时隙长度T=20s。
为了验证本发明所提方法的有效性,我们以每时隙的平均净回报为指标来表征网络选择的性能。由于前提条件是网络的先验状态信息是未知的,因此在这里采用的对比网络选择算法有四种:三种固定选择策略,即固定选择LTE、WLAN1或WLAN2,不存在网络切换。最后是一种是随机选择,即有每个时隙随机选择三个网络中的一个接入。考虑到切换开销权重ρ以及用户的业务类型转移概率矩阵P会影响到净回报,下面从这两个方面因素来仿真分析各种算法的性能。
(1)切换开销权重ρ的影响:设置切换开销权重ρ从0到1变化,对应的5种网络选择或切换算法的平均净回报如图3所示。由图中可以看出来,本发明所提的方法在不同的切换开销权重下,相比于其它的4种算法,有较明显的性能优势。尽管随着切换开销权重的增大,切换开销的负面影响会使所提方法的平均净回报降低,但是其净回报不低于其它算法。虽然三种固定网络选择算法不会产生切换开销,但是它们不能有效的利用三个网络的差异性,性能始终受限,均劣于所提的方法。随机切换算法具有盲目性,因此,尽管它可以灵活的切换网络,由于它没有考虑切换开销的负面影响也没有学习能力,其性能随着切换开销的增加以接近线性的速度降低。当切换开销权重接近0.4时,随机选择算法的性能最差。
此外,我们将所提方法在不同切换开销权重下的网络切换策略记录下来,得到如下结果:
a)当0≤ρ≤0.4时,最优网络切换策略为
其中,3*3的矩阵中的元素表示当前接入的网络为其所在列对应的网络,新到达的业务类型为其所在的行对应的业务类型时,最优的网络切换目标。例如,当MT当前接入的网络为LTE,如果新到达的业务为脆性业务时,最优的网络切换目标为WLAN1;如果新到达的业务为媒体流业务时,最优的网络切换目标为LTE,相当于保持当前的连接,不需要切换。
b)当0.4<ρ≤0.9时,最优网络切换策略为
c)当0.9<ρ≤1时,最优网络切换策略为
由上述的结果可以发现,当切换开销权重较小时,切换开销的影响较小,最优的网络切换目标仅与业务类型有关。随着切换开销权重的增大,切换开销的负面影响变大,使得最优的网络切换目标不仅与业务类型有关,还与当前接入的网络有关。这一现象也表明了所提方法能够有效的在性能和切换开销之间取得折衷。
(2)业务类型转移概率矩阵P的影响:我们选择了三种不同的业务类型转移概率矩阵,分别为
P 1 = s br s st s el s br 0.2 0.3 0.5 s st 0.5 0.2 0.3 s el 0.3 0.5 0.2 , P 2 = s br s st s el s br 0.33 0.34 0 . 33 s st 0.33 0 . 34 0.33 s el 0.33 0 . 34 0 . 33 , P 3 = s br s st s el s br 0.5 0.3 0 . 2 s st 0.2 0.6 0.2 s el 0.3 0 . 2 0 . 5
当切换开销权重ρ=0.3时,5种算法的性能对比如图4所示。我们可以发现,随机选择算法和固定选择网络的算法的性能随着转移概率矩阵的变化几乎保持不变,所提方法的性能有一定程度的降低。然而,我们所提的方法在三种转移概率中相对其它算法始终保持一定的优势,因此,本发明所提方法的性能优势对于转移概率矩阵的变化表现出相对的稳定性。
上述仿真证明了本发明所提的方法的有效性、合理性。
本发明未涉及部分均与现有技术相同或可采用现有技术加以实现。

Claims (3)

1.一种异构无线网络中优化用户QoE的动态网络选择方法,其特征是该方法结合传输的业务类型和当前用户接入的网络,周期的动态更新接入网络;该方法包括以下步骤:建立三种业务类型的用户QoE需求函数以及初始化Q学习中变量的步骤;采用Q学习方法进行网络选择决策及执行切换的步骤;和Q学习方法中变量更新的步骤;
具体包括以下步骤:
步骤1.初始化,完成以下工作:
1.1建立三种业务类型的用户QoE需求函数,所述的三种业务类型包括视频业务、音频业务和弹性业务,QoE需求函数将网络服务质量性能参数映射成用户的QoE回报;前述QoE需求函数输入为QoS参数,输出为评分值,评分值的取值范围为1~5,评分越高,代表用户的体验好或满意度高,三种业务对应的QoE需求函数分别如下:
1)视频业务,记为svideo:视频业务的QoE取决于接收信号的峰值信躁比Psnr,其QoE需求函数Fvideo(Psnr)定义为
其中,参数b1确定QoE的增长速度;参数b2确定函数的中点位置,即QoE取中间值2.75时所需的峰值信躁比;调整b1和b2能够满足不同用户对视频业务的个性化要求情况;
2)音频业务,记为saudio:音频业务的QoE与数据包的丢包率e和时延d有关,丢包率和时延可以分别由下式计算
e=enetwork+(1-enetwork)eplayout
d=dcodec+dplayout+dnetwork
其中,enetwork为网络传输中引起的丢包率,eplayout为播放缓冲时的丢包率,dcodec为编码器产生的时延,dplayout为播放缓冲导致的时延,dnetwork为网络传输中产生的时延;上述的丢包和时延导致的音频业务的性能损失Ie和Id分别为
Ie=γ12ln(1+γ3e)
Id=0.024d+0.11(d-177.3)I{d-177.3}
其中,参数γ1,γ2和γ3取决于采用的编解码器,时延d的单位为毫秒,177.3毫秒为常用的时延门限值,I{·}为指示函数,由Ie和Id导致的总体性能损失定义为Rf指数,
Rf=94.2-Ie-Id
由Rf指数,得到音频业务的QoE需求函数Faudio(Rf)
Faudio(Rf)=1+0.035Rf+7·10-6Rf(Rf-60)(100-Rf)
3)弹性业务,记为selastic:弹性业务的QoE与吞吐量θ有关,其QoE需求函数Felastic(θ)定义为
Felastic(θ)=b3log(b4θ)
给定用户的最小期望吞吐量θ1和最大期望吞吐量θ2,参数
1.2初始化Q学习中的变量:记业务类型集为S={svideo,saudio,selastic},可用网络集为定义x=[s,n]∈X为用户的状态,x表示的状态是用户当前所在网络为n且新到达的业务对应的类型为s,为用户状态空间,为切换目标网络,即切换到的网络,初始化Q值为Q(x,n)=0,系统时隙长度为T,初始化网络切换开销矩阵其中cm,n≥0表示从网络m切换至网络n的切换开销,并且cn,n=0;这里的开销表征的是网络切换中产生的协议开销;
步骤2.采用Q学习方法进行网络选择决策及执行切换,完成以下工作:
2.1在第t个时隙的起始时刻,t时隙传输的业务类型为s(t);
2.2结合当前接入的网络n(t),得到x(t)=[s(t),n(t)],并按照下面的规则选择切换网络:以概率ε(t)随机选择一个网络接入;以概率1-ε(t)选择网络接入,ε(t)随着t会变小,始终大于0;
2.3执行网络切换,建立连接;
步骤3.Q学习方法中变量更新:
3.1建立连接后,进行业务传输;
3.2当第t个时隙的传输结束,根据所传输的业务类型,计算相应业务类型的QoE回报即Fs(t),然后,计算用户的净回报r(x(t),δ(t))
r(x(t),δ(t))=Fs(t)-ρcn(t),δ(t)
其中0≤ρ≤1为开销权重;
3.3在第t+1时隙的起始时刻,业务类型为s(t+1),系统状态转移到新状态x(t+1)=[s(t+1),δ(t)];
3.4按下式更新Q值
其中αt<1为Q学习中的控制参数,随t增大而减小,满足
3.5t=t+1,回到步骤2。
2.根据权利要求1所述的异构无线网络中优化用户QoE的动态网络选择方法,其特征是步骤1中,参数γ1,γ2和γ3取决于采用的编解码器,所述的编码器型号为G.729a或G.711,编码器型号为G.729a时,γ1=11,γ2=40,γ3=10;编码器型号为G.711时,γ1=0,γ2=30,γ3=15。
3.根据权利要求1所述的异构无线网络中优化用户QoE的动态网络选择方法,其特征是步骤2中,
CN201310280666.2A 2013-07-04 2013-07-04 异构无线网络中优化用户QoE的动态网络选择方法 Active CN103327556B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201310280666.2A CN103327556B (zh) 2013-07-04 2013-07-04 异构无线网络中优化用户QoE的动态网络选择方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201310280666.2A CN103327556B (zh) 2013-07-04 2013-07-04 异构无线网络中优化用户QoE的动态网络选择方法

Publications (2)

Publication Number Publication Date
CN103327556A CN103327556A (zh) 2013-09-25
CN103327556B true CN103327556B (zh) 2016-05-11

Family

ID=49196024

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201310280666.2A Active CN103327556B (zh) 2013-07-04 2013-07-04 异构无线网络中优化用户QoE的动态网络选择方法

Country Status (1)

Country Link
CN (1) CN103327556B (zh)

Families Citing this family (24)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103841616B (zh) * 2013-12-16 2018-07-20 华为技术有限公司 一种应用数据包处理方法、装置及系统
CN103957559A (zh) * 2014-03-21 2014-07-30 南京邮电大学 一种基于用户体验的异构网络接入选择方法
CN104010315B (zh) * 2014-06-13 2016-08-17 北京理工大学 一种基于用户体验质量的小区选择方法
CN105636125B (zh) * 2014-11-04 2019-09-06 浙江大学 认知型异构无线网络中自适应协同中继传输方法
US10368284B2 (en) * 2014-11-12 2019-07-30 T-Mobile Usa, Inc. Quality of experience-based handover management
CN106851694B (zh) * 2017-03-21 2020-04-14 广东工业大学 一种用于异构网络的动态最优网络选择方法及装置
CN109392030B (zh) * 2017-08-02 2021-12-28 中国移动通信有限公司研究院 一种在基站之间进行切换的方法和无线网络
CN107690176B (zh) * 2017-09-30 2020-08-25 南京南瑞集团公司 一种基于q学习算法的网络选择方法
US11510136B2 (en) * 2018-01-12 2022-11-22 Telefonaktiebolaget Lm Ericsson (Publ) Methods and apparatus for roaming between wireless communications networks
CN108387866B (zh) * 2018-01-16 2021-08-31 南京航空航天大学 一种基于强化学习的无人机查找非法广播电台方法
CN108391143B (zh) * 2018-04-24 2020-10-27 南京邮电大学 一种基于q学习的无线网络视频传输自适应控制方法
CN110474796B (zh) * 2019-07-22 2022-06-28 中国人民解放军陆军工程大学 基于用户体验质量的异构网络选择方法
CN110996367B (zh) * 2019-12-20 2021-09-28 万申科技股份有限公司 基于物联网的智能终端网络切换方法及系统
CN111083767B (zh) * 2019-12-23 2021-07-27 哈尔滨工业大学 一种基于深度强化学习的异构网络选择方法
CN111182454B (zh) * 2020-02-24 2021-02-09 重庆邮电大学 异构无线网络中综合效益最大化的智能接入方法
CN112367683B (zh) * 2020-11-17 2022-07-01 重庆邮电大学 基于改进深度q学习的网络选择方法
CN114679757B (zh) * 2020-12-26 2023-11-03 中国航天科工飞航技术研究院(中国航天海鹰机电技术研究院) 一种超高速低真空管道飞行器越区切换方法及装置
CN112867033B (zh) * 2020-12-31 2023-05-02 中国人民解放军军事科学院国防科技创新研究院 基于在线学习的动态异构网络选择方法及装置
CN112862295B (zh) * 2021-02-02 2022-06-24 上海市城市建设设计研究总院(集团)有限公司 基于q学习的路桥隧养护自主决策方法
CN112949273B (zh) * 2021-03-04 2024-04-26 长沙市到家悠享网络科技有限公司 电子合同签约方法、装置、电子设备及计算机可读介质
CN113055229B (zh) * 2021-03-05 2023-10-27 北京工业大学 一种基于ddqn的无线网络自选择协议的方法
CN113038557B (zh) * 2021-03-22 2023-01-24 南京工程学院 一种异构泛在网络越区切换及其优化方法
CN114339924B (zh) * 2021-12-15 2023-05-30 中国船舶重工集团公司第七0九研究所 一种基于dqn的高低频混合组网的网络切换方法
CN114845359A (zh) * 2022-03-14 2022-08-02 中国人民解放军军事科学院战争研究院 一种基于Nash Q-Learning的多智能异构网络选择方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101132363A (zh) * 2007-08-10 2008-02-27 北京邮电大学 基于强化学习的自主联合无线资源管理系统和方法
CN101820665A (zh) * 2010-03-31 2010-09-01 北京邮电大学 异构无线网络环境下的接纳控制方法及系统
CN102238631A (zh) * 2011-08-17 2011-11-09 南京邮电大学 基于强化学习的异构网络资源管理方法
CN102802204A (zh) * 2012-08-03 2012-11-28 西安电子科技大学 基于用户体验QoE的网络选择方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5414619B2 (ja) * 2010-05-21 2014-02-12 株式会社日立製作所 複数無線システムの体感品質向上制御を行う無線通信システム,アクセスポイント,ゲートウェイ

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101132363A (zh) * 2007-08-10 2008-02-27 北京邮电大学 基于强化学习的自主联合无线资源管理系统和方法
CN101820665A (zh) * 2010-03-31 2010-09-01 北京邮电大学 异构无线网络环境下的接纳控制方法及系统
CN102238631A (zh) * 2011-08-17 2011-11-09 南京邮电大学 基于强化学习的异构网络资源管理方法
CN102802204A (zh) * 2012-08-03 2012-11-28 西安电子科技大学 基于用户体验QoE的网络选择方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
QoE-based Network Selection for Multimedia Users in IEEE 802.11 Wireless Networks;Kandaraj Piamrat ET AL.;《33rd IEEE Conference on Local Computer Networks, 2008. LCN 2008.》;20081017;第388-394页 *
异构无线网络融合场景下基于用户QoE的网络选择算法;张龙;《中国优秀硕士学位论文全文数据库 信息科技辑》;20130415(第4期);I136-498 *

Also Published As

Publication number Publication date
CN103327556A (zh) 2013-09-25

Similar Documents

Publication Publication Date Title
CN103327556B (zh) 异构无线网络中优化用户QoE的动态网络选择方法
CN110809306B (zh) 一种基于深度强化学习的终端接入选择方法
El Helou et al. A network-assisted approach for RAT selection in heterogeneous cellular networks
Iqbal et al. Double deep Q-network-based energy-efficient resource allocation in cloud radio access network
Si et al. Optimal network selection in heterogeneous wireless multimedia networks
CN102638870B (zh) 无线异构网络接入选择方法
CN103209419B (zh) 一种面向用户需求和提升网络性能的动态频谱接入的方法
Mehbodniya et al. A fuzzy extension of VIKOR for target network selection in heterogeneous wireless environments
CN110677861B (zh) 面向5g异构网络的网络选择方法
CN110753319A (zh) 异构车联网中面向异质业务的分布式资源分配方法及系统
Xu et al. Fuzzy Q-learning based vertical handoff control for vehicular heterogeneous wireless network
Cui et al. QoS guaranteed network slicing orchestration for Internet of Vehicles
CN113727420B (zh) 一种多模接入网络选择装置及方法
Quan et al. Cybertwin-driven DRL-based adaptive transmission scheduling for software defined vehicular networks
Yu et al. Reliable cybertwin-driven concurrent multipath transfer with deep reinforcement learning
CN101534535A (zh) 基于终端和网络信息融合的无线网络切换方法
CN114051252A (zh) 无线接入网中多用户智能发射功率控制方法
CN103249050B (zh) 基于业务需求的多尺度频谱接入方法
Gao et al. Freshness-aware age optimization for multipath TCP over software defined networks
Amali et al. Optimized network selection using aggregate utility function in heterogeneous wireless networks
Zhu et al. Exploiting mobility patterns for inter-technology handover in mobile environments
CN110324869B (zh) 一种用户接入方法和基站
Xu et al. Q-learning based network selection for WCDMA/WLAN heterogeneous wireless networks
Wang et al. A novel network selection approach in 5G heterogeneous networks using Q-learning
CN103209491B (zh) 一种分布式的垂直切换和资源分配方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant