CN109803338B - 一种基于后悔度的双连接基站选择方法 - Google Patents
一种基于后悔度的双连接基站选择方法 Download PDFInfo
- Publication number
- CN109803338B CN109803338B CN201910111377.7A CN201910111377A CN109803338B CN 109803338 B CN109803338 B CN 109803338B CN 201910111377 A CN201910111377 A CN 201910111377A CN 109803338 B CN109803338 B CN 109803338B
- Authority
- CN
- China
- Prior art keywords
- user
- base station
- lte
- time
- throughput
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000010187 selection method Methods 0.000 title claims abstract description 13
- 238000000034 method Methods 0.000 claims description 10
- 238000005562 fading Methods 0.000 claims description 6
- 230000014509 gene expression Effects 0.000 claims description 6
- 230000005540 biological transmission Effects 0.000 claims description 5
- 230000001186 cumulative effect Effects 0.000 claims description 3
- 238000004422 calculation algorithm Methods 0.000 description 44
- 230000002787 reinforcement Effects 0.000 description 7
- 230000009977 dual effect Effects 0.000 description 5
- 238000005516 engineering process Methods 0.000 description 3
- 238000004364 calculation method Methods 0.000 description 2
- 238000004891 communication Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000004088 simulation Methods 0.000 description 2
- 230000006978 adaptation Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- GVVPGTZRZFNKDS-JXMROGBWSA-N geranyl diphosphate Chemical compound CC(C)=CCC\C(C)=C\CO[P@](O)(=O)OP(O)(O)=O GVVPGTZRZFNKDS-JXMROGBWSA-N 0.000 description 1
- 239000007788 liquid Substances 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 230000000750 progressive effect Effects 0.000 description 1
Images
Landscapes
- Mobile Radio Communication Systems (AREA)
Abstract
本发明公开了一种基于后悔度的双连接基站选择方法,以后悔度为核心,将后悔度定义为当前时刻用户所连入基站处得到的吞吐量与之前时刻从其他基站得到的吞吐量的差值,即用户如果选择了其他的基站,是否能产生更大的吞吐量,若是,则产生后悔;而当前时刻计算出的后悔度的大小会决定下一时刻用户选择每个基站的概率,且后悔度越大,则此基站下一时刻被选中的率就越大,本发明可以减少用户的切换次数并提升用户得到的吞吐量。
Description
技术领域
本发明涉及基站选择算法领域,特别是涉及一种5G双连接场景中的基站选择算法。
背景技术
在过去几年中,学术界和工业界一起参与并讨论了与下一代无线蜂窝网络相关的场景和要求,即第五代移动通信技术(5G)。这些讨论的协议现在开始成为第三代合作伙伴计划(3GPP:3rd generation partnership project)的标准,预计到2020年将商业化。在此背景下,国际电信联盟将设想的用例分为以下几组:增强的移动宽带、超可靠和低延迟通信、大规模机器类型通信。
为了支持广泛的业务,5G空中接口(NR:new radio)有望在异构场景中与不同技术互通,其中用户设备(UE:user equipment)将具有双连接能力。基于R12标准化的LTE双连接,与传统无线接入技术进行互通,已经作为5G运营要求在在3GPP中提出。
3GPP的R14中已经提出了一种5G双连接场景,如图1所示,即LTE作为宏基站,NR基站作为小基站分布于LTE小区内,用户可以同时连入两种基站,以实现双连接。
现有技术在基站选择问题上,仅是当前移动终端瞬时的接收信号的强度和已设定好阈值的比较下进行的基站选择。没有考虑历史的数据以及所选基站当前连入的用户数对性能的影响,这样可能导致的结果是用户的吞吐量的降低和频繁的切换。
发明内容
发明目的:为了克服现有技术中存在的不足,本发明提供一种5G双连接场景中,用户端的基站选择策略,用于解决现有算法无法应用于5G双连接场景的问题的基于后悔度的双连接基站选择方法。
技术方案:为实现上述目的,本发明采用的技术方案为:
一种基于后悔度的双连接基站选择方法,本发明是终端基于强化学习思想,以后悔度为核心进行基站选择,完成强化学习对5G双连接场景下用户侧的基站选择算法的映射:环境映射为LTE小区覆盖范围内所有终端的位置和连接基站的情况,行动映射为每个时刻使用本发明的用户的基站选择,回报映射为当前时刻使用本发明的用户所连入基站提供的吞吐量。以后悔度为核心,将后悔度定义为当前时刻用户所连入基站处得到的吞吐量与之前时刻从其他基站得到的吞吐量的差值,即用户如果选择了其他的基站,是否能产生更大的吞吐量,若是,则产生后悔;而当前时刻计算出的后悔度的大小会决定下一时刻用户选择每个基站的概率,且后悔度越大,则此基站下一时刻被选中的率就越大。
具体包括以下步骤:
步骤1:初始化用户本身的各种行动的概率;
步骤2:用户和其他用户在随机移动,导致了系统状态发生变化;
步骤3:在当前判决时刻,用户根据上一时刻学习到的概率选择基站;
步骤4:从基站处得到的吞吐量更新了本次基站选择的后悔度;
用户的后悔度为:
其中,表示表示用户的后悔度,其值为过去一段时间内,在τ时刻两种行动的平均吞吐量的差值,表示在τ时刻执行行动(u1,v1),其中u1∈{0,1},u1=0表示用户没有接入LTE,u1=1表示用户接入了LTE;v1∈{0,1,2,…,K},v1=k表示用户接入第k个NR基站,k=0表示用户未接入NR基站;表示在τ时刻执行行动(u2,v2),具体同(u1,v1),其中u2∈{0,1},u2=0表示用户没有接入LTE,u2=1表示用户接入了LTE。t表示用户从进入当前LTE小区的时刻到当前判决时刻的总时长,1τ表示在时刻其他用户的行动,表示用户在τ时刻执行动作(u1,v1)且其他用户行动为1τ时本用户获得的瞬时吞吐量,表示用户在τ时刻执行动作(u2,v2)且其他用户行动为1τ时本用户获得的瞬时吞吐量;(2)式中的“用户的后悔度”需要由基于可用信息的计算估计来代替,通过:
其中,表示过去一段时间内,在τ时刻两种行动的平均吞吐量的差值估计,表示在τ时刻执行动作(u1,v1)的概率,表示在τ时刻执行动作(u2,v2)的概率,表示用户在τ时刻执行动作(u1,v1)且其他用户行动为1τ时本用户获得的平均吞吐量,表示用户在τ时刻执行动作(u2,v2)且其他用户行动为1τ时本用户获得的平均吞吐量;
其中,表示在τ时刻用户从LTE基站处得到的吞吐量,表示在τ时刻用户从第v个NR基站处得到的吞吐量,num_LTE_t表示截止到t时刻为止,用户A连入LTE的次数;num_NR_v_t表示截止到t时刻为止,用户A连入第v个NR基站的次数,若某一判决时刻没有切换基站,当前用户A连入基站的累计次数仍加一;此处的平均吞吐量代替了某一时刻的回报,有效的减少切换次数,并提升决策的回报;
(5)(6)式中每个时刻的吞吐量分别由(7)(8)式得到
其中,u=0表示用户没有连入LTE,不为0则表示连入LTE,此时吞吐量为用户A的瞬时速率RA,t,LTE与当前LTE基站的用户数nt,LTE的比值;
步骤5:本次行动的后悔度更新了下一判决时刻基站选择的概率;
用户在下个时刻用户选择每个行动的概率为:
其中,M表示终端所在LTE宏小区内,所有NR基站的数目,而(2M+1)表示所有可能行动的总数,max(|Bt|)表示所有行动的后悔度的绝对值的最大值,用来归一化分子 表示在t+1时刻用户选择每个行动的概率,δt=δ/tγ,0<δ<1,δ和γ是人为设定值,解决了强化学习的一个常见问题:“探索”还是“利用”;具体为:智能体(此处为用户)该如何处理探索多种行动并得到回报以改进算法,还是利用当前算法已学习到的知识来行动;δt应随着时间t的增加而减小,因为随着时间的推移,用户应渐渐趋向于选择后悔度最小项,即“利用”现有数据,而不是继续随机“探索”;其中f表示选择因子,其作用和δt类似,当其越大,则本算法更偏向于切换以获取更多行动下的回报,反之本算法更倾向于利用现有回报来进行基站选择;
步骤6:等待用户的下一个判决周期,继续从步骤2开始执行。
步骤1中每个行动的选择概率初始化为:
其中,行动其中A是所有可能行动的集合,共有(2M+1)个元素;u∈{0,1},u=0表示用户没有接入LTE,u=1表示用户接入了LTE;v∈{0,1,2,…,K},v=k表示用户接入第k个NR基站,k=0表示用户未接入NR基站;表示在τ时刻,用户执行动作的概率;M表示终端所在LTE宏小区内,所有NR基站的数目,而(2M+1)表示所有可能行动的总数。
优选的:终端单独连入LTE基站或者任一NR基站,或者同时连入LTE基站和任一NR基站。
优选的:用户A从LTE基站处得到的速率RA,t,LTE定义为: 上式中BLTE为LTE基站的总带宽,transmit_power_LTE为LTE基站的发射功率,为LTE基站的大尺度衰落,noise_LTE为LTE基站的噪声。
优选的:用户A从第v个NR基站处得到的速率RA,t,NR,v定义为: BNR表示NR基站的总带宽,transmit_power_NR表示NR基站的发射功率,表示NR基站的大尺度衰落,noise_NR表示NR基站的噪声。
优选的:步骤1中的初始概率为平均概率,即所有行动的概率一样。
优选的:步骤2中的回报更新会结合历史的回报,而不是当前的瞬时回报。
优选的:可以应用于具有快速时变性的场景,具体为在每个判决时刻进行基站的选择,此选择是依据概率的,用户会根据当前的回报改变下一时刻的基站选择概率。
本发明相比现有技术,具有以下有益效果:
本发明在5G双连接异构网络场景下,提出一种以用户为中心的基于强化学习思想的后悔度最小算法。强化学习算法作为机器学习算法的一个分支,对历史性的数据有很好的处理能力,在本发明中可以得到较优的基站选择算法,以提升用户所得到的吞吐量。本发明采用基于强化学习算法,将其应用于5G多连接网络中,相比典型算法,我们的算法具有更高的用户吞吐量和更少的切换次数;在5G双连接场景中,由于复杂而时变的系统状态,大多数强化学习的算法的收敛都是缓慢且任意的,而本发明可以在动态的小区环境中,在保证吞吐量的同时,保持较低的切换次数。
附图说明
图1为5G双连接场景图;
图2为算法流程图;
图3为不同算法的用户吞吐量对比图;
图4为不同算法的用户切换次数图;
图5为选择因子变化下的用户吞吐量对比图;
图6为选择因子变化下的切换次数对比图。
具体实施方式
下面结合附图和具体实施例,进一步阐明本发明,应理解这些实例仅用于说明本发明而不用于限制本发明的范围,在阅读了本发明之后,本领域技术人员对本发明的各种等价形式的修改均落于本申请所附权利要求所限定的范围。
一种基于后悔度的双连接基站选择方法,在未来的5G场景中,为了满足日益增长的数据业务需求,大量的5G小型基站将会被密集部署。由于5G演变的渐进性,将会出现5G和4G基站共存的场景,此时终端可以同时接入5G基站和4G基站,从而产生5G双连接场景,而当前主流的基站选择算法不能较好地运用于此场景,如图1所示,本发明的应用场景为5G双连接场景,用户可以同时连入LTE基站和NR基站。以用户为中心的基于强化学习思想的基站选择算法,该算法以后悔度为核心,将后悔度定义为当前时刻用户所连入基站处得到的吞吐量与之前时刻从其他基站得到的吞吐量的差值,即用户如果选择了其他的基站,是否能产生更大的吞吐量,若是,则产生后悔;而当前时刻计算出的后悔度的大小会决定下一时刻用户选择每个基站的概率,且后悔度越大,则此基站下一时刻被选中的率就越大。如图2所示,包括以下步骤:
步骤1:初始化用户本身的各种行动的概率。
每个行动的选择概率初始化为:
其中,行动其中A是所有可能行动的集合,共有(2M+1)个元素;u∈{0,1},u=0表示用户没有接入LTE,u=1表示用户接入了LTE;v∈{0,1,2,…,K},v=k表示用户接入第k个NR基站,k=0表示用户未接入NR基站;表示在τ时刻,用户执行动作的概率;M表示终端所在LTE宏小区内,所有NR基站的数目,而(2M+1)表示所有可能行动的总数,即终端可以单独连入LTE基站或者任一NR基站,也可以同时连入LTE基站和任一NR基站,此处不考虑终端不连入任一基站的可能性。
步骤2:使用本发明算法的用户和其他用户在随机移动,导致了系统状态发生变化。
步骤3:在当前判决时刻,用户根据上一时刻学习到的概率选择基站。
步骤3中的概率结合了强化学习的思想,在“探索”和“采纳”之间找到一种平衡,使终端能自主学习到下一时刻的行动概率。
步骤4:从基站处得到的吞吐量更新了本次基站选择的后悔度。
用户的后悔度为:
其中,1τ表示在时刻其他用户的行动;计算了过去一段时间内,在τ时刻两种行动的平均吞吐量的差值,但用户A只能够获得与实际行动对应的回报,无法计算第一项;因此,(2)中的“用户的后悔度”需要由基于可用信息的计算估计来代替。通过:
(2)(3)式中,吞吐量U的具体定义为:
其中,num_LTE_t表示截止到t时刻为止,用户A连入LTE的次数;num_NR_v_t示截止到t时刻为止,用户A连入第v个NR基站的次数,若某一判决时刻没有切换基站,当前用户A连入基站的累计次数仍加一;此处的平均吞吐量代替了某一时刻的回报,可以有效的减少切换次数,并提升决策的回报;
(5)(6)式中每个时刻的吞吐量分别由(7)(8)式得到
其中u=0表示用户没有连入LTE,不为0则表示连入LTE,此时吞吐量为用户A的瞬时速率RA,t,LTE与当前LTE基站的用户数nt,LTE的比值;(1)式中用户A从LTE基站处得到的速率定义为:上式中BLTE为LTE基站的总带宽,transmit_power_LTE为LTE基站的发射功率,为大尺度衰落,与距离的平方呈反比,并将小尺度衰落简化为1,noise_LTE为LTE基站的噪声;
步骤5:本次行动的后悔度更新了下一判决时刻基站选择的概率。
用户在下个时刻用户选择每个行动的概率为
其中,δt=δ/tγ,0<δ<1,此处的δt的构造解决了强化学习的一个常见问题:“探索”还是“利用”;具体为:智能体(此处为用户)该如何处理探索多种行动并得到回报以改进算法,还是利用当前算法已学习到的知识来行动;δt应随着时间t的增加而减小,因为随着时间的推移,用户应渐渐趋向于选择后悔度最小项,即“利用”现有数据,而不是继续随机“探索”;其中f为选择因子,其作用和δt类似,当其越大,则本算法更偏向于切换以获取更多行动下的回报,反之本算法更倾向于利用现有回报来进行基站选择。这种基于强化学习算法的基站选择算法可以使用户不断学习并选择当前后悔度最小的基站。
步骤6:等待用户的下一个判决周期,继续从步骤2开始执行。
实例:
假设宏基站位于坐标(0,0)处,在其小区范围内,均匀分布了4个NR基站,其坐标分别为(-200,-200)、(-200,200)、(200,-200)、(200,200)。使用本发明算法的用户和其他用户在LTE小区内服从泊松分布,其他用户在其自身所在小区内,随机连入LTE与NR基站。在每个判决周期,用户以1-5m/s的速度向任意方向移动,当用户移出LTE小区范围时,假设在(0.0)处有另一用户出现,继续移动并选择基站。
如图3和图4所示,在选择因子取值为8时,本发明与其他算法在用户接收到的吞吐量和切换次数方面的比较。仿真表明,与传统RSS算法以及其他基准算法相比,本发明算法具有更高的用户吞吐量和更低的切换次数。具体为:在吞吐量方面,本发明算法基于历史的数据,会促使终端选择吞吐量较大的基站,在一段时间内,使用本发明算法的用户的总吞吐量大于使用主流RSS算法的用户的总吞吐量;在切换次数方面,随着时间的推移和系统状态的变化,传统的RSS算法的切换次数满足线性的增长,而本发明算法的切换次数的增加会愈发缓慢,这是由于本发明算法获得的数据越多,则基站选择越趋于稳定。
如图5和图6所示,在选择因子factor取不同值时,本发明会得到不一样的结果,具体为当选择因子变大时,用户更倾向于切换基站;当选择因子变小时,用户更倾向于继续保持当前连接。
仿真结果表明,与传统RSS算法以及其他基准算法相比,本发明算法具有更高的用户吞吐量和更低的切换次数,且选择因子f的取值会对算法的性能造成影响,具体由环境和系统而定。因此本发明可以减少用户的切换次数并提升用户得到的吞吐量。
以上所述仅是本发明的优选实施方式,应当指出:对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。
Claims (7)
1.一种基于后悔度的双连接基站选择方法,其特征在于:以后悔度为核心,将后悔度定义为当前时刻用户所连入基站处得到的吞吐量与之前时刻从其他基站得到的吞吐量的差值,即用户如果选择了其他的基站,是否能产生更大的吞吐量,若是,则产生后悔;而当前时刻计算出的后悔度的大小会决定下一时刻用户选择每个基站的概率,且后悔度越大,则此基站下一时刻被选中的率就越大,包括以下步骤:
步骤1:初始化用户本身的各种行动的概率;
每个行动的选择概率初始化为:
其中,行动其中A是所有可能行动的集合,共有(2M+1)个元素;u∈{0,1},u=0表示用户没有接入LTE,u=1表示用户接入了LTE;v∈{0,1,2,...,K},v=k表示用户接入第k个NR基站,k=0表示用户未接入NR基站;表示在τ时刻,用户执行动作的概率;
步骤2:用户和其他用户在随机移动,导致了系统状态发生变化;
步骤3:在当前判决时刻,用户根据上一时刻学习到的概率选择基站;
步骤4:从基站处得到的吞吐量更新了本次基站选择的后悔度;
用户的后悔度为:
其中,表示用户的后悔度,其值为过去一段时间内,在τ时刻两种行动的平均吞吐量的差值,表示在τ时刻执行行动(u1,v1),其中u1∈{0,1},u1=0表示用户没有接入LTE,u1=1表示用户接入了LTE;v1∈{0,1,2,...,K},v1=k表示用户接入第k个NR基站,k=0表示用户未接入NR基站;表示在τ时刻执行行动(u2,v2),其中u2∈{0,1},u2=0表示用户没有接入LTE,u2=1表示用户接入了LTE,t表示用户从进入当前LTE小区的时刻到当前判决时刻的总时长,1τ表示在时刻其他用户的行动,表示用户在τ时刻执行动作(u1,v1)且其他用户行动为1τ时本用户获得的瞬时吞吐量,表示用户在τ时刻执行动作(u2,v2)且其他用户行动为1τ时本用户获得的瞬时吞吐量;
(2)式中的“用户的后悔度”由基于可用信息的计算估计来代替,通过:
其中,表示过去一段时间内,在τ时刻两种行动的平均吞吐量的差值估计,表示在τ时刻执行动作(u1,v1)的概率,表示在τ时刻执行动作(u2,v2)的概率,表示用户在τ时刻执行动作(u1,v1)且其他用户行动为1τ时本用户获得的平均吞吐量,表示用户在τ时刻执行动作(u2,v2)且其他用户行动为1τ时本用户获得的平均吞吐量;
其中,带有上标的吞吐量表示该吞吐量是过去一段时间内用户A从该基站处得到的平均吞吐量,代替了(2)式中的瞬时吞吐量,用户连入LTE基站的平均吞吐量和连入第v个NR基站的平均吞吐量分别由(5)式、(6)式计算得出;
其中,表示在τ时刻用户从LTE基站处得到的吞吐量,表示在τ时刻用户从第v个NR基站处得到的吞吐量,num_LTE_t表示截止到t时刻为止,用户A连入LTE的次数;num_NR_v_t表示截止到t时刻为止,用户A连入第v个NR基站的次数,若某一判决时刻没有切换基站,当前用户A连入基站的累计次数仍加一;此处的平均吞吐量代替了某一时刻的回报,有效的减少切换次数,并提升决策的回报;
(5)式、(6)式中每个时刻的吞吐量分别由(7)式、(8)式得到
其中,u=0表示用户没有连入LTE,不为0则表示连入LTE,此时吞吐量为用户A的瞬时速率RA,t,LTE与当前LTE基站的用户数nt,LTE的比值;
步骤5:本次行动的后悔度更新了下一判决时刻基站选择的概率;
用户在下个时刻用户选择每个行动的概率为:
其中,M表示终端所在LTE宏小区内所有NR基站的数目,而(2M+1)表示所有可能行动的总数,max(|Bt|)表示所有行动的后悔度的绝对值的最大值,用来归一化分子表示在t+1时刻用户选择每个行动的概率,δt=δ/tγ,0<δ<1,δ和γ表示设定值;
步骤6:等待用户的下一个判决周期,继续从步骤2开始执行。
2.根据权利要求1所述基于后悔度的双连接基站选择方法,其特征在于:终端单独连入LTE基站或者任一NR基站,或者同时连入LTE基站和任一NR基站。
5.根据权利要求4所述基于后悔度的双连接基站选择方法,其特征在于:步骤1中的初始概率为平均概率,即所有行动的概率一样。
6.根据权利要求5所述基于后悔度的双连接基站选择方法,其特征在于:步骤2中的回报更新会结合历史的回报,而不是当前的瞬时回报。
7.根据权利要求6所述基于后悔度的双连接基站选择方法,其特征在于:应用于具有快速时变性的场景,在每个判决时刻进行基站的选择,此选择是依据基站选择的概率,用户会根据当前的回报改变下一时刻的基站选择概率。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910111377.7A CN109803338B (zh) | 2019-02-12 | 2019-02-12 | 一种基于后悔度的双连接基站选择方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910111377.7A CN109803338B (zh) | 2019-02-12 | 2019-02-12 | 一种基于后悔度的双连接基站选择方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN109803338A CN109803338A (zh) | 2019-05-24 |
CN109803338B true CN109803338B (zh) | 2021-03-12 |
Family
ID=66562148
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910111377.7A Active CN109803338B (zh) | 2019-02-12 | 2019-02-12 | 一种基于后悔度的双连接基站选择方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109803338B (zh) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110461040B (zh) * | 2019-08-05 | 2021-11-19 | 北京邮电大学 | 一种信道接入策略的确定方法及装置 |
CN113573103B (zh) * | 2021-09-26 | 2022-01-28 | 深圳飞骧科技股份有限公司 | 分布式移动网络视频缓存放置方法、系统及相关设备 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102711115A (zh) * | 2012-05-24 | 2012-10-03 | 上海交通大学 | 认知无线网络中机会频谱资源的多用户分布式接入方法 |
CN102918887A (zh) * | 2010-06-04 | 2013-02-06 | 微软公司 | 动态的信道和传输速率选择 |
CN106131943A (zh) * | 2016-08-14 | 2016-11-16 | 辛建芳 | 一种基于能效最优的协作通信系统资源分配方法 |
CN107426772A (zh) * | 2017-07-04 | 2017-12-01 | 北京邮电大学 | 一种基于q学习的动态竞争窗口调整方法、装置及设备 |
CN109195135A (zh) * | 2018-08-06 | 2019-01-11 | 同济大学 | Lte-v中基于深度强化学习的基站选择方法 |
CN109274598A (zh) * | 2018-09-30 | 2019-01-25 | 中南大学 | 一种物联网中基于行为经济学的节点参与数据卸载的激励方法 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102892143B (zh) * | 2011-07-20 | 2015-11-25 | 华为技术有限公司 | 数据分流的方法以及用户设备 |
-
2019
- 2019-02-12 CN CN201910111377.7A patent/CN109803338B/zh active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102918887A (zh) * | 2010-06-04 | 2013-02-06 | 微软公司 | 动态的信道和传输速率选择 |
CN102711115A (zh) * | 2012-05-24 | 2012-10-03 | 上海交通大学 | 认知无线网络中机会频谱资源的多用户分布式接入方法 |
CN106131943A (zh) * | 2016-08-14 | 2016-11-16 | 辛建芳 | 一种基于能效最优的协作通信系统资源分配方法 |
CN107426772A (zh) * | 2017-07-04 | 2017-12-01 | 北京邮电大学 | 一种基于q学习的动态竞争窗口调整方法、装置及设备 |
CN109195135A (zh) * | 2018-08-06 | 2019-01-11 | 同济大学 | Lte-v中基于深度强化学习的基站选择方法 |
CN109274598A (zh) * | 2018-09-30 | 2019-01-25 | 中南大学 | 一种物联网中基于行为经济学的节点参与数据卸载的激励方法 |
Non-Patent Citations (1)
Title |
---|
Regret-Minimizing Exploration in HetNets with mmWave;Michael Wang等;《IEEE》;20161230;全文 * |
Also Published As
Publication number | Publication date |
---|---|
CN109803338A (zh) | 2019-05-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
WO2022022334A1 (zh) | 基于人工智能的通信方法和通信装置 | |
CN110809306B (zh) | 一种基于深度强化学习的终端接入选择方法 | |
Yan et al. | A traveling distance prediction based method to minimize unnecessary handovers from cellular networks to WLANs | |
Alhammadi et al. | Advanced handover self-optimization approach for 4G/5G HetNets using weighted fuzzy logic control | |
Tabrizi et al. | A learning-based network selection method in heterogeneous wireless systems | |
Zhang et al. | Improving network throughput in 60GHz WLANs via multi-AP diversity | |
CN110636523B (zh) | 一种基于q学习的毫米波移动回程链路能量效率稳定方案 | |
CN112492656B (zh) | 一种基于强化学习的无线网络接入点切换方法 | |
CN114867030B (zh) | 双时间尺度智能无线接入网切片方法 | |
CN109803338B (zh) | 一种基于后悔度的双连接基站选择方法 | |
Huang et al. | Self-adapting handover parameters optimization for SDN-enabled UDN | |
CN107466045B (zh) | 一种5g超密集网络虚拟小区构建方法 | |
Mehbodniya et al. | A fuzzy extension of VIKOR for target network selection in heterogeneous wireless environments | |
CN111095972A (zh) | 用于链路关联的全局优化过程 | |
Padmapriya et al. | Handoff decision for multi-user multi-class traffic in MIMO-LTE-A networks | |
CN104735730A (zh) | 一种适用于异构网络中目标基站的切换优化方法 | |
Zhou et al. | Hierarchical reinforcement learning for RIS-assisted energy-efficient RAN | |
Tashan et al. | Voronoi-based handover self-optimization technique for handover ping-pong reduction in 5G networks | |
Ceken et al. | An adaptive fuzzy logic based vertical handoff decision algorithm for wireless heterogeneous networks | |
CN111935777B (zh) | 基于深度强化学习的5g移动负载均衡方法 | |
CN110324869B (zh) | 一种用户接入方法和基站 | |
CN115119278B (zh) | 面向用户需求考虑移动性的虚拟小区传输节点更新方法 | |
De Domenico et al. | Backhaul-aware small cell DTX based on fuzzy Q-Learning in heterogeneous cellular networks | |
Mehbodniya et al. | A Location-Aware Vertical Handoff Algorithm for Hybrid Networks. | |
CN113873525A (zh) | 一种超密集边缘计算网络的任务卸载方法及终端 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |