CN109803338B - 一种基于后悔度的双连接基站选择方法 - Google Patents

一种基于后悔度的双连接基站选择方法 Download PDF

Info

Publication number
CN109803338B
CN109803338B CN201910111377.7A CN201910111377A CN109803338B CN 109803338 B CN109803338 B CN 109803338B CN 201910111377 A CN201910111377 A CN 201910111377A CN 109803338 B CN109803338 B CN 109803338B
Authority
CN
China
Prior art keywords
user
base station
lte
time
throughput
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910111377.7A
Other languages
English (en)
Other versions
CN109803338A (zh
Inventor
陈美娟
管铭锋
何爱龙
孙康
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nanjing University of Posts and Telecommunications
Original Assignee
Nanjing University of Posts and Telecommunications
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nanjing University of Posts and Telecommunications filed Critical Nanjing University of Posts and Telecommunications
Priority to CN201910111377.7A priority Critical patent/CN109803338B/zh
Publication of CN109803338A publication Critical patent/CN109803338A/zh
Application granted granted Critical
Publication of CN109803338B publication Critical patent/CN109803338B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Mobile Radio Communication Systems (AREA)

Abstract

本发明公开了一种基于后悔度的双连接基站选择方法,以后悔度为核心,将后悔度定义为当前时刻用户所连入基站处得到的吞吐量与之前时刻从其他基站得到的吞吐量的差值,即用户如果选择了其他的基站,是否能产生更大的吞吐量,若是,则产生后悔;而当前时刻计算出的后悔度的大小会决定下一时刻用户选择每个基站的概率,且后悔度越大,则此基站下一时刻被选中的率就越大,本发明可以减少用户的切换次数并提升用户得到的吞吐量。

Description

一种基于后悔度的双连接基站选择方法
技术领域
本发明涉及基站选择算法领域,特别是涉及一种5G双连接场景中的基站选择算法。
背景技术
在过去几年中,学术界和工业界一起参与并讨论了与下一代无线蜂窝网络相关的场景和要求,即第五代移动通信技术(5G)。这些讨论的协议现在开始成为第三代合作伙伴计划(3GPP:3rd generation partnership project)的标准,预计到2020年将商业化。在此背景下,国际电信联盟将设想的用例分为以下几组:增强的移动宽带、超可靠和低延迟通信、大规模机器类型通信。
为了支持广泛的业务,5G空中接口(NR:new radio)有望在异构场景中与不同技术互通,其中用户设备(UE:user equipment)将具有双连接能力。基于R12标准化的LTE双连接,与传统无线接入技术进行互通,已经作为5G运营要求在在3GPP中提出。
3GPP的R14中已经提出了一种5G双连接场景,如图1所示,即LTE作为宏基站,NR基站作为小基站分布于LTE小区内,用户可以同时连入两种基站,以实现双连接。
现有技术在基站选择问题上,仅是当前移动终端瞬时的接收信号的强度和已设定好阈值的比较下进行的基站选择。没有考虑历史的数据以及所选基站当前连入的用户数对性能的影响,这样可能导致的结果是用户的吞吐量的降低和频繁的切换。
发明内容
发明目的:为了克服现有技术中存在的不足,本发明提供一种5G双连接场景中,用户端的基站选择策略,用于解决现有算法无法应用于5G双连接场景的问题的基于后悔度的双连接基站选择方法。
技术方案:为实现上述目的,本发明采用的技术方案为:
一种基于后悔度的双连接基站选择方法,本发明是终端基于强化学习思想,以后悔度为核心进行基站选择,完成强化学习对5G双连接场景下用户侧的基站选择算法的映射:环境映射为LTE小区覆盖范围内所有终端的位置和连接基站的情况,行动映射为每个时刻使用本发明的用户的基站选择,回报映射为当前时刻使用本发明的用户所连入基站提供的吞吐量。以后悔度为核心,将后悔度定义为当前时刻用户所连入基站处得到的吞吐量与之前时刻从其他基站得到的吞吐量的差值,即用户如果选择了其他的基站,是否能产生更大的吞吐量,若是,则产生后悔;而当前时刻计算出的后悔度的大小会决定下一时刻用户选择每个基站的概率,且后悔度越大,则此基站下一时刻被选中的率就越大。
具体包括以下步骤:
步骤1:初始化用户本身的各种行动的概率;
步骤2:用户和其他用户在随机移动,导致了系统状态发生变化;
步骤3:在当前判决时刻,用户根据上一时刻学习到的概率选择基站;
步骤4:从基站处得到的吞吐量更新了本次基站选择的后悔度;
用户的后悔度为:
Figure BDA0001968283580000021
其中,
Figure BDA0001968283580000022
表示表示用户的后悔度,其值为过去一段时间内,在τ时刻两种行动的平均吞吐量的差值,
Figure BDA0001968283580000023
表示在τ时刻执行行动(u1,v1),其中u1∈{0,1},u1=0表示用户没有接入LTE,u1=1表示用户接入了LTE;v1∈{0,1,2,…,K},v1=k表示用户接入第k个NR基站,k=0表示用户未接入NR基站;
Figure BDA0001968283580000024
表示在τ时刻执行行动(u2,v2),具体同(u1,v1),其中u2∈{0,1},u2=0表示用户没有接入LTE,u2=1表示用户接入了LTE。t表示用户从进入当前LTE小区的时刻到当前判决时刻的总时长,1τ表示在时刻其他用户的行动,
Figure BDA0001968283580000025
表示用户在τ时刻执行动作(u1,v1)且其他用户行动为1τ时本用户获得的瞬时吞吐量,
Figure BDA0001968283580000026
表示用户在τ时刻执行动作(u2,v2)且其他用户行动为1τ时本用户获得的瞬时吞吐量;(2)式中的“用户的后悔度”需要由基于可用信息的计算估计来代替,通过:
Figure BDA0001968283580000027
这种近似的遗憾表示分别执行动作
Figure BDA0001968283580000028
后的平均收益差异;
其中,
Figure BDA0001968283580000029
表示过去一段时间内,在τ时刻两种行动的平均吞吐量的差值估计,
Figure BDA00019682835800000210
表示在τ时刻执行动作(u1,v1)的概率,
Figure BDA00019682835800000211
表示在τ时刻执行动作(u2,v2)的概率,
Figure BDA00019682835800000212
表示用户在τ时刻执行动作(u1,v1)且其他用户行动为1τ时本用户获得的平均吞吐量,
Figure BDA00019682835800000213
表示用户在τ时刻执行动作(u2,v2)且其他用户行动为1τ时本用户获得的平均吞吐量;
(2)(3)式中,平均吞吐量
Figure BDA0001968283580000031
定义为:
Figure BDA0001968283580000032
其中,带有上标的吞吐量
Figure BDA0001968283580000033
表示该吞吐量是过去一段时间内用户A从该基站处得到的平均吞吐量,用户连入LTE基站的平均吞吐量
Figure BDA0001968283580000034
和连入第v个NR基站的平均吞吐量
Figure BDA0001968283580000035
分别由(5)(6)式计算得出;
Figure BDA0001968283580000036
Figure BDA0001968283580000037
其中,
Figure BDA0001968283580000038
表示在τ时刻用户从LTE基站处得到的吞吐量,
Figure BDA0001968283580000039
表示在τ时刻用户从第v个NR基站处得到的吞吐量,num_LTE_t表示截止到t时刻为止,用户A连入LTE的次数;num_NR_v_t表示截止到t时刻为止,用户A连入第v个NR基站的次数,若某一判决时刻没有切换基站,当前用户A连入基站的累计次数仍加一;此处的平均吞吐量代替了某一时刻的回报,有效的减少切换次数,并提升决策的回报;
(5)(6)式中每个时刻的吞吐量分别由(7)(8)式得到
Figure BDA00019682835800000310
其中,u=0表示用户没有连入LTE,不为0则表示连入LTE,此时吞吐量为用户A的瞬时速率RA,t,LTE与当前LTE基站的用户数nt,LTE的比值;
Figure BDA00019682835800000311
其中,
Figure BDA00019682835800000312
表示所有连入到同NR基站的用户在此NR基站处得到相同的吞吐量,
Figure BDA00019682835800000313
表示用户从第v个NR基站处得到的速率,
Figure BDA00019682835800000314
表示当前连入第v个NR基站的用户数,
Figure BDA00019682835800000315
步骤5:本次行动的后悔度更新了下一判决时刻基站选择的概率;
用户在下个时刻用户选择每个行动的概率为:
Figure BDA0001968283580000041
其中,M表示终端所在LTE宏小区内,所有NR基站的数目,而(2M+1)表示所有可能行动的总数,max(|Bt|)表示所有行动的后悔度的绝对值的最大值,用来归一化分子
Figure BDA0001968283580000042
Figure BDA0001968283580000043
表示在t+1时刻用户选择每个行动
Figure BDA0001968283580000044
的概率,δt=δ/tγ,0<δ<1,
Figure BDA0001968283580000045
δ和γ是人为设定值,解决了强化学习的一个常见问题:“探索”还是“利用”;具体为:智能体(此处为用户)该如何处理探索多种行动并得到回报以改进算法,还是利用当前算法已学习到的知识来行动;δt应随着时间t的增加而减小,因为随着时间的推移,用户应渐渐趋向于选择后悔度最小项,即“利用”现有数据,而不是继续随机“探索”;其中f表示选择因子,其作用和δt类似,当其越大,则本算法更偏向于切换以获取更多行动下的回报,反之本算法更倾向于利用现有回报来进行基站选择;
步骤6:等待用户的下一个判决周期,继续从步骤2开始执行。
步骤1中每个行动的选择概率初始化为:
Figure BDA0001968283580000046
其中,行动
Figure BDA0001968283580000047
其中A是所有可能行动的集合,共有(2M+1)个元素;u∈{0,1},u=0表示用户没有接入LTE,u=1表示用户接入了LTE;v∈{0,1,2,…,K},v=k表示用户接入第k个NR基站,k=0表示用户未接入NR基站;
Figure BDA0001968283580000048
表示在τ时刻,用户执行动作
Figure BDA0001968283580000049
的概率;M表示终端所在LTE宏小区内,所有NR基站的数目,而(2M+1)表示所有可能行动的总数。
优选的:终端单独连入LTE基站或者任一NR基站,或者同时连入LTE基站和任一NR基站。
优选的:用户A从LTE基站处得到的速率RA,t,LTE定义为:
Figure BDA00019682835800000410
Figure BDA00019682835800000411
上式中BLTE为LTE基站的总带宽,transmit_power_LTE为LTE基站的发射功率,
Figure BDA00019682835800000412
为LTE基站的大尺度衰落,noise_LTE为LTE基站的噪声。
优选的:用户A从第v个NR基站处得到的速率RA,t,NR,v定义为:
Figure BDA00019682835800000413
Figure BDA00019682835800000414
BNR表示NR基站的总带宽,transmit_power_NR表示NR基站的发射功率,
Figure BDA0001968283580000051
表示NR基站的大尺度衰落,noise_NR表示NR基站的噪声。
优选的:步骤1中的初始概率为平均概率,即所有行动的概率一样。
优选的:步骤2中的回报更新会结合历史的回报,而不是当前的瞬时回报。
优选的:可以应用于具有快速时变性的场景,具体为在每个判决时刻进行基站的选择,此选择是依据概率的,用户会根据当前的回报改变下一时刻的基站选择概率。
本发明相比现有技术,具有以下有益效果:
本发明在5G双连接异构网络场景下,提出一种以用户为中心的基于强化学习思想的后悔度最小算法。强化学习算法作为机器学习算法的一个分支,对历史性的数据有很好的处理能力,在本发明中可以得到较优的基站选择算法,以提升用户所得到的吞吐量。本发明采用基于强化学习算法,将其应用于5G多连接网络中,相比典型算法,我们的算法具有更高的用户吞吐量和更少的切换次数;在5G双连接场景中,由于复杂而时变的系统状态,大多数强化学习的算法的收敛都是缓慢且任意的,而本发明可以在动态的小区环境中,在保证吞吐量的同时,保持较低的切换次数。
附图说明
图1为5G双连接场景图;
图2为算法流程图;
图3为不同算法的用户吞吐量对比图;
图4为不同算法的用户切换次数图;
图5为选择因子变化下的用户吞吐量对比图;
图6为选择因子变化下的切换次数对比图。
具体实施方式
下面结合附图和具体实施例,进一步阐明本发明,应理解这些实例仅用于说明本发明而不用于限制本发明的范围,在阅读了本发明之后,本领域技术人员对本发明的各种等价形式的修改均落于本申请所附权利要求所限定的范围。
一种基于后悔度的双连接基站选择方法,在未来的5G场景中,为了满足日益增长的数据业务需求,大量的5G小型基站将会被密集部署。由于5G演变的渐进性,将会出现5G和4G基站共存的场景,此时终端可以同时接入5G基站和4G基站,从而产生5G双连接场景,而当前主流的基站选择算法不能较好地运用于此场景,如图1所示,本发明的应用场景为5G双连接场景,用户可以同时连入LTE基站和NR基站。以用户为中心的基于强化学习思想的基站选择算法,该算法以后悔度为核心,将后悔度定义为当前时刻用户所连入基站处得到的吞吐量与之前时刻从其他基站得到的吞吐量的差值,即用户如果选择了其他的基站,是否能产生更大的吞吐量,若是,则产生后悔;而当前时刻计算出的后悔度的大小会决定下一时刻用户选择每个基站的概率,且后悔度越大,则此基站下一时刻被选中的率就越大。如图2所示,包括以下步骤:
步骤1:初始化用户本身的各种行动的概率。
每个行动的选择概率初始化为:
Figure BDA0001968283580000061
其中,行动
Figure BDA0001968283580000062
其中A是所有可能行动的集合,共有(2M+1)个元素;u∈{0,1},u=0表示用户没有接入LTE,u=1表示用户接入了LTE;v∈{0,1,2,…,K},v=k表示用户接入第k个NR基站,k=0表示用户未接入NR基站;
Figure BDA0001968283580000063
表示在τ时刻,用户执行动作
Figure BDA0001968283580000064
的概率;M表示终端所在LTE宏小区内,所有NR基站的数目,而(2M+1)表示所有可能行动的总数,即终端可以单独连入LTE基站或者任一NR基站,也可以同时连入LTE基站和任一NR基站,此处不考虑终端不连入任一基站的可能性。
步骤2:使用本发明算法的用户和其他用户在随机移动,导致了系统状态发生变化。
步骤3:在当前判决时刻,用户根据上一时刻学习到的概率选择基站。
步骤3中的概率结合了强化学习的思想,在“探索”和“采纳”之间找到一种平衡,使终端能自主学习到下一时刻的行动概率。
步骤4:从基站处得到的吞吐量更新了本次基站选择的后悔度。
用户的后悔度为:
Figure BDA0001968283580000065
其中,1τ表示在时刻其他用户的行动;
Figure BDA0001968283580000066
计算了过去一段时间内,在τ时刻两种行动的平均吞吐量的差值,但用户A只能够获得与实际行动对应的回报,无法计算第一项;因此,(2)中的“用户的后悔度”需要由基于可用信息的计算估计来代替。通过:
Figure BDA0001968283580000067
这种近似的遗憾表示分别执行动作
Figure BDA0001968283580000071
后的平均收益差异;
(2)(3)式中,吞吐量U的具体定义为:
Figure BDA0001968283580000072
其中,带有上标的吞吐量
Figure BDA0001968283580000073
表示该吞吐量是过去一段时间内用户A从该基站处得到的平均吞吐量,用户连入LTE基站的平均吞吐量
Figure BDA0001968283580000074
和连入第v个NR基站的平均吞吐量
Figure BDA0001968283580000075
分别由(5)(6)式计算得出;
Figure BDA0001968283580000076
Figure BDA0001968283580000077
其中,num_LTE_t表示截止到t时刻为止,用户A连入LTE的次数;num_NR_v_t示截止到t时刻为止,用户A连入第v个NR基站的次数,若某一判决时刻没有切换基站,当前用户A连入基站的累计次数仍加一;此处的平均吞吐量代替了某一时刻的回报,可以有效的减少切换次数,并提升决策的回报;
(5)(6)式中每个时刻的吞吐量分别由(7)(8)式得到
Figure BDA0001968283580000078
其中u=0表示用户没有连入LTE,不为0则表示连入LTE,此时吞吐量为用户A的瞬时速率RA,t,LTE与当前LTE基站的用户数nt,LTE的比值;(1)式中用户A从LTE基站处得到的速率定义为:
Figure BDA0001968283580000079
上式中BLTE为LTE基站的总带宽,transmit_power_LTE为LTE基站的发射功率,
Figure BDA00019682835800000710
为大尺度衰落,与距离的平方呈反比,并将小尺度衰落简化为1,noise_LTE为LTE基站的噪声;
Figure BDA00019682835800000711
其中,所有连入到同NR基站的用户在此NR基站处得到相同的吞吐量;用户A从第v个NR基站处得到的速率定义为:
Figure BDA00019682835800000712
Figure BDA00019682835800000713
上式中变量同LTE。
步骤5:本次行动的后悔度更新了下一判决时刻基站选择的概率。
用户在下个时刻用户选择每个行动的概率为
Figure BDA0001968283580000081
其中,δt=δ/tγ,0<δ<1,
Figure BDA0001968283580000082
此处的δt的构造解决了强化学习的一个常见问题:“探索”还是“利用”;具体为:智能体(此处为用户)该如何处理探索多种行动并得到回报以改进算法,还是利用当前算法已学习到的知识来行动;δt应随着时间t的增加而减小,因为随着时间的推移,用户应渐渐趋向于选择后悔度最小项,即“利用”现有数据,而不是继续随机“探索”;其中f为选择因子,其作用和δt类似,当其越大,则本算法更偏向于切换以获取更多行动下的回报,反之本算法更倾向于利用现有回报来进行基站选择。这种基于强化学习算法的基站选择算法可以使用户不断学习并选择当前后悔度最小的基站。
步骤6:等待用户的下一个判决周期,继续从步骤2开始执行。
实例:
假设宏基站位于坐标(0,0)处,在其小区范围内,均匀分布了4个NR基站,其坐标分别为(-200,-200)、(-200,200)、(200,-200)、(200,200)。使用本发明算法的用户和其他用户在LTE小区内服从泊松分布,其他用户在其自身所在小区内,随机连入LTE与NR基站。在每个判决周期,用户以1-5m/s的速度向任意方向移动,当用户移出LTE小区范围时,假设在(0.0)处有另一用户出现,继续移动并选择基站。
如图3和图4所示,在选择因子取值为8时,本发明与其他算法在用户接收到的吞吐量和切换次数方面的比较。仿真表明,与传统RSS算法以及其他基准算法相比,本发明算法具有更高的用户吞吐量和更低的切换次数。具体为:在吞吐量方面,本发明算法基于历史的数据,会促使终端选择吞吐量较大的基站,在一段时间内,使用本发明算法的用户的总吞吐量大于使用主流RSS算法的用户的总吞吐量;在切换次数方面,随着时间的推移和系统状态的变化,传统的RSS算法的切换次数满足线性的增长,而本发明算法的切换次数的增加会愈发缓慢,这是由于本发明算法获得的数据越多,则基站选择越趋于稳定。
如图5和图6所示,在选择因子factor取不同值时,本发明会得到不一样的结果,具体为当选择因子变大时,用户更倾向于切换基站;当选择因子变小时,用户更倾向于继续保持当前连接。
仿真结果表明,与传统RSS算法以及其他基准算法相比,本发明算法具有更高的用户吞吐量和更低的切换次数,且选择因子f的取值会对算法的性能造成影响,具体由环境和系统而定。因此本发明可以减少用户的切换次数并提升用户得到的吞吐量。
以上所述仅是本发明的优选实施方式,应当指出:对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。

Claims (7)

1.一种基于后悔度的双连接基站选择方法,其特征在于:以后悔度为核心,将后悔度定义为当前时刻用户所连入基站处得到的吞吐量与之前时刻从其他基站得到的吞吐量的差值,即用户如果选择了其他的基站,是否能产生更大的吞吐量,若是,则产生后悔;而当前时刻计算出的后悔度的大小会决定下一时刻用户选择每个基站的概率,且后悔度越大,则此基站下一时刻被选中的率就越大,包括以下步骤:
步骤1:初始化用户本身的各种行动的概率;
每个行动的选择概率初始化为:
Figure FDA0002890994840000011
其中,行动
Figure FDA0002890994840000012
其中A是所有可能行动的集合,共有(2M+1)个元素;u∈{0,1},u=0表示用户没有接入LTE,u=1表示用户接入了LTE;v∈{0,1,2,...,K},v=k表示用户接入第k个NR基站,k=0表示用户未接入NR基站;
Figure FDA0002890994840000013
表示在τ时刻,用户执行动作
Figure FDA0002890994840000014
的概率;
步骤2:用户和其他用户在随机移动,导致了系统状态发生变化;
步骤3:在当前判决时刻,用户根据上一时刻学习到的概率选择基站;
步骤4:从基站处得到的吞吐量更新了本次基站选择的后悔度;
用户的后悔度为:
Figure FDA0002890994840000015
其中,
Figure FDA0002890994840000016
表示用户的后悔度,其值为过去一段时间内,在τ时刻两种行动的平均吞吐量的差值,
Figure FDA0002890994840000017
表示在τ时刻执行行动(u1,v1),其中u1∈{0,1},u1=0表示用户没有接入LTE,u1=1表示用户接入了LTE;v1∈{0,1,2,...,K},v1=k表示用户接入第k个NR基站,k=0表示用户未接入NR基站;
Figure FDA0002890994840000018
表示在τ时刻执行行动(u2,v2),其中u2∈{0,1},u2=0表示用户没有接入LTE,u2=1表示用户接入了LTE,t表示用户从进入当前LTE小区的时刻到当前判决时刻的总时长,1τ表示在时刻其他用户的行动,
Figure FDA0002890994840000019
表示用户在τ时刻执行动作(u1,v1)且其他用户行动为1τ时本用户获得的瞬时吞吐量,
Figure FDA00028909948400000110
表示用户在τ时刻执行动作(u2,v2)且其他用户行动为1τ时本用户获得的瞬时吞吐量;
(2)式中的“用户的后悔度”由基于可用信息的计算估计来代替,通过:
Figure FDA0002890994840000021
其中,
Figure FDA0002890994840000022
表示过去一段时间内,在τ时刻两种行动的平均吞吐量的差值估计,
Figure FDA0002890994840000023
表示在τ时刻执行动作(u1,v1)的概率,
Figure FDA0002890994840000024
表示在τ时刻执行动作(u2,v2)的概率,
Figure FDA0002890994840000025
表示用户在τ时刻执行动作(u1,v1)且其他用户行动为1τ时本用户获得的平均吞吐量,
Figure FDA0002890994840000026
表示用户在τ时刻执行动作(u2,v2)且其他用户行动为1τ时本用户获得的平均吞吐量;
(2)式、(3)式中,平均吞吐量
Figure FDA0002890994840000027
定义为:
Figure FDA0002890994840000028
其中,带有上标的吞吐量
Figure FDA0002890994840000029
表示该吞吐量是过去一段时间内用户A从该基站处得到的平均吞吐量,代替了(2)式中的瞬时吞吐量,用户连入LTE基站的平均吞吐量
Figure FDA00028909948400000210
和连入第v个NR基站的平均吞吐量
Figure FDA00028909948400000211
分别由(5)式、(6)式计算得出;
Figure FDA00028909948400000212
Figure FDA00028909948400000213
其中,
Figure FDA00028909948400000214
表示在τ时刻用户从LTE基站处得到的吞吐量,
Figure FDA00028909948400000215
表示在τ时刻用户从第v个NR基站处得到的吞吐量,num_LTE_t表示截止到t时刻为止,用户A连入LTE的次数;num_NR_v_t表示截止到t时刻为止,用户A连入第v个NR基站的次数,若某一判决时刻没有切换基站,当前用户A连入基站的累计次数仍加一;此处的平均吞吐量代替了某一时刻的回报,有效的减少切换次数,并提升决策的回报;
(5)式、(6)式中每个时刻的吞吐量分别由(7)式、(8)式得到
Figure FDA0002890994840000031
其中,u=0表示用户没有连入LTE,不为0则表示连入LTE,此时吞吐量为用户A的瞬时速率RA,t,LTE与当前LTE基站的用户数nt,LTE的比值;
Figure FDA0002890994840000032
其中,
Figure FDA0002890994840000033
表示所有连入到同NR基站的用户在此NR基站处得到相同的吞吐量,
Figure FDA0002890994840000034
表示用户从第v个NR基站处得到的速率,
Figure FDA0002890994840000035
表示当前连入第v个NR基站的用户数,
Figure FDA0002890994840000036
步骤5:本次行动的后悔度更新了下一判决时刻基站选择的概率;
用户在下个时刻用户选择每个行动的概率为:
Figure FDA0002890994840000037
其中,M表示终端所在LTE宏小区内所有NR基站的数目,而(2M+1)表示所有可能行动的总数,max(|Bt|)表示所有行动的后悔度的绝对值的最大值,用来归一化分子
Figure FDA0002890994840000038
表示在t+1时刻用户选择每个行动
Figure FDA0002890994840000039
的概率,δt=δ/tγ,0<δ<1,
Figure FDA00028909948400000310
δ和γ表示设定值;
步骤6:等待用户的下一个判决周期,继续从步骤2开始执行。
2.根据权利要求1所述基于后悔度的双连接基站选择方法,其特征在于:终端单独连入LTE基站或者任一NR基站,或者同时连入LTE基站和任一NR基站。
3.根据权利要求2所述基于后悔度的双连接基站选择方法,其特征在于:用户A从LTE基站处得到的速率RA,t,LTE定义为:
Figure FDA00028909948400000311
Figure FDA00028909948400000312
上式中BLTE为LTE基站的总带宽,transmit_power_LTE为LTE基站的发射功率,
Figure FDA00028909948400000313
为LTE基站的大尺度衰落,noise_LTE为LTE基站的噪声。
4.根据权利要求3所述基于后悔度的双连接基站选择方法,其特征在于:用户A从第v个NR基站处得到的速率RA,t,NR,v定义为:
Figure FDA00028909948400000314
Figure FDA0002890994840000041
BNR表示NR基站的总带宽,transmit_power_NR表示NR基站的发射功率,
Figure FDA0002890994840000042
表示NR基站的大尺度衰落,noise_NR表示NR基站的噪声。
5.根据权利要求4所述基于后悔度的双连接基站选择方法,其特征在于:步骤1中的初始概率为平均概率,即所有行动的概率一样。
6.根据权利要求5所述基于后悔度的双连接基站选择方法,其特征在于:步骤2中的回报更新会结合历史的回报,而不是当前的瞬时回报。
7.根据权利要求6所述基于后悔度的双连接基站选择方法,其特征在于:应用于具有快速时变性的场景,在每个判决时刻进行基站的选择,此选择是依据基站选择的概率,用户会根据当前的回报改变下一时刻的基站选择概率。
CN201910111377.7A 2019-02-12 2019-02-12 一种基于后悔度的双连接基站选择方法 Active CN109803338B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910111377.7A CN109803338B (zh) 2019-02-12 2019-02-12 一种基于后悔度的双连接基站选择方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910111377.7A CN109803338B (zh) 2019-02-12 2019-02-12 一种基于后悔度的双连接基站选择方法

Publications (2)

Publication Number Publication Date
CN109803338A CN109803338A (zh) 2019-05-24
CN109803338B true CN109803338B (zh) 2021-03-12

Family

ID=66562148

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910111377.7A Active CN109803338B (zh) 2019-02-12 2019-02-12 一种基于后悔度的双连接基站选择方法

Country Status (1)

Country Link
CN (1) CN109803338B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110461040B (zh) * 2019-08-05 2021-11-19 北京邮电大学 一种信道接入策略的确定方法及装置
CN113573103B (zh) * 2021-09-26 2022-01-28 深圳飞骧科技股份有限公司 分布式移动网络视频缓存放置方法、系统及相关设备

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102711115A (zh) * 2012-05-24 2012-10-03 上海交通大学 认知无线网络中机会频谱资源的多用户分布式接入方法
CN102918887A (zh) * 2010-06-04 2013-02-06 微软公司 动态的信道和传输速率选择
CN106131943A (zh) * 2016-08-14 2016-11-16 辛建芳 一种基于能效最优的协作通信系统资源分配方法
CN107426772A (zh) * 2017-07-04 2017-12-01 北京邮电大学 一种基于q学习的动态竞争窗口调整方法、装置及设备
CN109195135A (zh) * 2018-08-06 2019-01-11 同济大学 Lte-v中基于深度强化学习的基站选择方法
CN109274598A (zh) * 2018-09-30 2019-01-25 中南大学 一种物联网中基于行为经济学的节点参与数据卸载的激励方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102892143B (zh) * 2011-07-20 2015-11-25 华为技术有限公司 数据分流的方法以及用户设备

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102918887A (zh) * 2010-06-04 2013-02-06 微软公司 动态的信道和传输速率选择
CN102711115A (zh) * 2012-05-24 2012-10-03 上海交通大学 认知无线网络中机会频谱资源的多用户分布式接入方法
CN106131943A (zh) * 2016-08-14 2016-11-16 辛建芳 一种基于能效最优的协作通信系统资源分配方法
CN107426772A (zh) * 2017-07-04 2017-12-01 北京邮电大学 一种基于q学习的动态竞争窗口调整方法、装置及设备
CN109195135A (zh) * 2018-08-06 2019-01-11 同济大学 Lte-v中基于深度强化学习的基站选择方法
CN109274598A (zh) * 2018-09-30 2019-01-25 中南大学 一种物联网中基于行为经济学的节点参与数据卸载的激励方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
Regret-Minimizing Exploration in HetNets with mmWave;Michael Wang等;《IEEE》;20161230;全文 *

Also Published As

Publication number Publication date
CN109803338A (zh) 2019-05-24

Similar Documents

Publication Publication Date Title
WO2022022334A1 (zh) 基于人工智能的通信方法和通信装置
CN110809306B (zh) 一种基于深度强化学习的终端接入选择方法
Yan et al. A traveling distance prediction based method to minimize unnecessary handovers from cellular networks to WLANs
Alhammadi et al. Advanced handover self-optimization approach for 4G/5G HetNets using weighted fuzzy logic control
Tabrizi et al. A learning-based network selection method in heterogeneous wireless systems
Zhang et al. Improving network throughput in 60GHz WLANs via multi-AP diversity
CN110636523B (zh) 一种基于q学习的毫米波移动回程链路能量效率稳定方案
CN112492656B (zh) 一种基于强化学习的无线网络接入点切换方法
CN114867030B (zh) 双时间尺度智能无线接入网切片方法
CN109803338B (zh) 一种基于后悔度的双连接基站选择方法
Huang et al. Self-adapting handover parameters optimization for SDN-enabled UDN
CN107466045B (zh) 一种5g超密集网络虚拟小区构建方法
Mehbodniya et al. A fuzzy extension of VIKOR for target network selection in heterogeneous wireless environments
CN111095972A (zh) 用于链路关联的全局优化过程
Padmapriya et al. Handoff decision for multi-user multi-class traffic in MIMO-LTE-A networks
CN104735730A (zh) 一种适用于异构网络中目标基站的切换优化方法
Zhou et al. Hierarchical reinforcement learning for RIS-assisted energy-efficient RAN
Tashan et al. Voronoi-based handover self-optimization technique for handover ping-pong reduction in 5G networks
Ceken et al. An adaptive fuzzy logic based vertical handoff decision algorithm for wireless heterogeneous networks
CN111935777B (zh) 基于深度强化学习的5g移动负载均衡方法
CN110324869B (zh) 一种用户接入方法和基站
CN115119278B (zh) 面向用户需求考虑移动性的虚拟小区传输节点更新方法
De Domenico et al. Backhaul-aware small cell DTX based on fuzzy Q-Learning in heterogeneous cellular networks
Mehbodniya et al. A Location-Aware Vertical Handoff Algorithm for Hybrid Networks.
CN113873525A (zh) 一种超密集边缘计算网络的任务卸载方法及终端

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant