CN113727420B - 一种多模接入网络选择装置及方法 - Google Patents

一种多模接入网络选择装置及方法 Download PDF

Info

Publication number
CN113727420B
CN113727420B CN202111033667.8A CN202111033667A CN113727420B CN 113727420 B CN113727420 B CN 113727420B CN 202111033667 A CN202111033667 A CN 202111033667A CN 113727420 B CN113727420 B CN 113727420B
Authority
CN
China
Prior art keywords
module
access network
service
network
information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202111033667.8A
Other languages
English (en)
Other versions
CN113727420A (zh
Inventor
柴蓉
桂康安
李轩
陈前斌
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Chongqing University of Post and Telecommunications
Original Assignee
Chongqing University of Post and Telecommunications
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Chongqing University of Post and Telecommunications filed Critical Chongqing University of Post and Telecommunications
Priority to CN202111033667.8A priority Critical patent/CN113727420B/zh
Publication of CN113727420A publication Critical patent/CN113727420A/zh
Application granted granted Critical
Publication of CN113727420B publication Critical patent/CN113727420B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W48/00Access restriction; Network selection; Access point selection
    • H04W48/18Selecting a network or a communication service
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W24/00Supervisory, monitoring or testing arrangements
    • H04W24/06Testing, supervising or monitoring using simulated traffic
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W48/00Access restriction; Network selection; Access point selection
    • H04W48/02Access restriction performed under specific conditions
    • H04W48/06Access restriction performed under specific conditions based on traffic conditions
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D30/00Reducing energy consumption in communication networks
    • Y02D30/70Reducing energy consumption in communication networks in wireless communication networks

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Computer Security & Cryptography (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

本发明涉及多模接入网络选择装置及方法,属于异构融合网络场景多模终端接入网络选择领域,终端信息感知模块实时感知终端状态,并将感知信息发送至接入网络选择模块;业务特性感知模块实时感知当前业务特性,并将业务特性数据发送至信息处理模块;网络信息收集模块实时收集网络状态信息、并将数据发送至信息处理模块;信息处理模块对数据进行处理发送至接入网络选择判决模块;接入网络选择判决模块基于DQN模型确定最优网络接入策略。本发明可以综合考虑终端特性、业务特性、网络特性,在动态系统中考虑长期的收益,选择合适的网络,保障业务的长期服务质量。

Description

一种多模接入网络选择装置及方法
技术领域
本发明属于异构融合网络场景多模终端接入网络选择领域,涉及一种多模接入网络选择装置及方法。
背景技术
第五代移动通信(5th Generation Mobile Communications,5G)技术将实现新空口、长期演进(Long Term Evolution,LTE)、Wi-Fi及其它多种无线接入技术的异构融合,并将支持增强型移动带宽、大规模机器通信以及超可靠低时延通信等多类业务传输。随着通信芯片、封装集成以及终端技术的快速发展,支持多模通信的5G智能终端得到广泛应用。在如图1所示的5G多模异构融合网络场景中,多模终端如何实现接入网络的优化选择成为影响网络性能及用户体验的重要问题。现有研究已有考虑5G多网融合场景的接入网络选择问题,但较少考虑基于网络长期性能优化实现接入网络选择。此外,现有工作较多基于接收信号强度或数据传输速率确定接入网络选择策略,较少综合考虑多类网络业务指标以及用户业务不同偏好优化确定接入网络选择策略。
发明内容
有鉴于此,本发明的目的在于面向5G异构融合网络多类业务需求,提供一种终端自主决策的多模组接入网络选择装置及方法,支持多模组协同,实时获取业务特性、终端状态特性以及网络特性,基于深度Q网络(deep Q network,DQN)模型确定接入网络选择策略,实现业务的长期服务质量(Quality of Service,QoS)保障。本发明应用于复杂的融合网络场景、面向终端以及5G新型业务,具有很强的实用性。
为达到上述目的,本发明提供如下技术方案:
一方面,本发明提供一种多模接入网络选择装置,包括:
终端信息感知模块:用于在每个时隙开始阶段,感知终端自身的状态信息,通过对微处理器缓存内容的分析,获取终端时隙t的可用费用Ft,并将信息提供给接入网络选择判决模块;
业务特性感知模块:用于周期性地对业务数据流和协议进行分析解析,感知各业务性能参数,包括传输带宽、时延、时延抖动和丢包率的阈值,同时根据业务对各性能参数的敏感程度确定参数敏感系数,并将感知的参数阈值以及参数的敏感系数分别发送至信息处理模块、接入网络选择判决模块;
网络信息收集模块:通过不同网络端口周期性的获取网络状态信息,包括可用带宽、连接时延信息,并将收集的网络状态信息发送至信息处理模块,将网络接入费用信息发送至接入网络选择判决模块;
信息处理模块:用于将业务性能参数划分为收益类和成本类,并对参数进行归一化处理,得到各参数归一化值,并发送至接入网络选择判决模块,所述收益类包括带宽和信号强度,所述成本类包括时延和丢包参数;
接入网络选择判决模块:用于在数据预处理模块对数据进行预处理,在DQN训练模块定义系统状态、动作和即时奖励,建模长期优化目标;还用于训练DQN模型,基于DQN模型确定接入网络选择策略。
另一方面,本发明提供一种多模接入网络选择方法,包括以下步骤:
S1:终端信息感知模块实时感知收集终端信息,并将终端特性发送至接入网络选择判决模块;
S2:业务特性感知模块对用户业务特性进行实时感知,并发送至信息处理模块以及接入网络选择判决模块;
S3:网络信息接收模块实时接收可用网络状态信息,并发送至信息处理模块及接入网络选择判决模块;
S4:信息处理模块对终端特性、业务特性以及网络状态信息进行处理,将处理结果发送至接入网络选择判决模块;
S5:接入网络选择判决模块接收各模块发送的信息,执行接入选择方法,确定最优接入网络选择策略,并发送至相应的网络接口。
进一步,在所述步骤S1中,终端信息感知模块获取终端时隙t的可用费用Ft,并将信息发送至接入网络选择判决模块。
进一步,在所述步骤S2中,定义bt为时隙t任务到达标识,bt=1表示时隙t有任务到达,bt=0表示时隙t无任务到达;业务特性感知模块对业务进行识别,感知各业务性能参数,包括传输带宽、时延、时延抖动和丢包率的阈值,定义
Figure BDA0003246302340000021
分别表示时隙t用户业务对第j个业务性能参数需求阈值上限及下限,1≤t≤T,1≤j≤J,其中,T为最大时隙数,J为业务性能参数数量;同时根据业务对各性能参数的敏感程度确定参数敏感系数,令ωj,t表示时隙t业务对第j个业务性能参数的敏感系数,1≤t≤T,1≤j≤J。
进一步,在所述步骤S3中,网络信息收集模块通过接入网络端口获得接入网络参数,令pi,j,t表示时隙t接入网络i对应的第j个性能参数指标,1≤i≤M,1≤j≤J,1≤t≤T,其中,M为接入网络数量。
进一步,在所述步骤S4中,信息处理模块接收业务特性及网络状态信息,将业务性能参数划分为收益类及成本类参数,并对参数进行归一化处理,令Vi,j,t表示pi,j,t归一化值,有
Figure BDA0003246302340000031
进一步,在所述步骤S5中,接入网络选择判决模块根据终端特性、用户业务特性及网络状态信息,采用基于深度Q网络(deep Q network,DQN)的接入网络选择方法,具体为:定义系统状态、动作和即时奖励,设立系统长期优化目标,基于DQN模型确定接入网络选择策略。
进一步,所述定义系统状态、动作和即时奖励,设立系统长期优化目标,具体为:
确定状态集合S,st∈S,st为时隙t的状态,定义为:
Figure BDA0003246302340000032
其中i表示时隙t终端接入网络i,1≤i≤M,Vi,t=[Vi,1,t,…,Vi,j,t,…,Vi,J,t]表示时隙t第i个网络参数的归一化值集合,ωt={ω1,t,...,ωj,t,...,ωJ,t}表示时隙t终端业务对第j个性能参数的敏感程度集合;
Figure BDA0003246302340000033
表示时隙t终端业务队列需传输的业务量,建模为:
Figure BDA0003246302340000034
其中,
Figure BDA0003246302340000035
为指示函数,若ωt+1≠ωt为真,则/>
Figure BDA0003246302340000036
否则为0,/>
Figure BDA0003246302340000037
表示终端业务队列的最大长度;确定动作集合A,at∈A,at为时隙t的动作,定义at=i表示在时隙t选择接入网络i;
定义状态为st时接入网络i对应的即时奖励为:
Figure BDA0003246302340000038
其中,
Figure BDA0003246302340000041
表示终端在时隙t接入网络i所获得的服务质量(Quality of Service,QoS),Tj,t表示终端用户时隙t对第j个性能参数可容忍的参数偏移度,/>
Figure BDA0003246302340000042
表示在时隙t切换到网络i的费用,ωfag表示各项权重;
建模长期收益为:
Figure BDA0003246302340000043
其中γ为折扣因子且γ∈[0,1];
建模优化问题
Figure BDA0003246302340000044
进一步,设立系统长期优化目标,基于DQN模型确定接入网络选择策略,具体包括:
S51:设置DQN训练过程中所需的参数,包括学习率、折扣率;
S52:初始化DQN模型中主Q网络的参数θ和目标Q网络的参数θ';
S53:获取经验<st,at,rt,st+1>,并存储在经验回放池中;
S54:从经验回放池D中随机选取转移样本<sτ,aτ,rτ,sτ+1>,输入至神经网络;
S55:计算主Q网络和目标Q网络的损失函数,更新参数θ和θ'。
进一步,步骤S52中主Q网络和目标Q网络均采用卷积神经网络,分别对两个网络的参数θ、θ'进行初始化。
进一步,步骤S53将当前状态st输入至主Q网络,获取所有动作对应的Q(st,at;θ),根据贪婪策略选取动作at,获取即时奖励rt,状态转移到st+1,获取转移数据<st,at,rt,st+1>。
进一步,步骤S55所述神经网络输出Q(sτ,aτ;θ)及
Figure BDA0003246302340000045
计算损耗函数/>
Figure BDA0003246302340000046
利用后向传播法,梯度更新θ,周期地令θ'=θ,完成网络参数更新。
进一步,训练DQN模型,基于DQN模型确定接入网络选择策略。
本发明的有益效果在于:本发明可以综合考虑终端特性、业务特性、网络特性,在动态系统中考虑长期的收益,选择合适的网络,保障业务的长期服务质量(Quality ofService,QoS)。
本发明的其他优点、目标和特征在某种程度上将在随后的说明书中进行阐述,并且在某种程度上,基于对下文的考察研究对本领域技术人员而言将是显而易见的,或者可以从本发明的实践中得到教导。本发明的目标和其他优点可以通过下面的说明书来实现和获得。
附图说明
为了使本发明的目的、技术方案和优点更加清楚,下面将结合附图对本发明作优选的详细描述,其中:
图1为能够用于实现本发明的一个异构融合网络通信系统的拓扑图;
图2为本发明所述DQN模型训练流程示意图;
图3为多模接入网络选择装置示意图。
具体实施方式
以下通过特定的具体实例说明本发明的实施方式,本领域技术人员可由本说明书所揭露的内容轻易地了解本发明的其他优点与功效。本发明还可以通过另外不同的具体实施方式加以实施或应用,本说明书中的各项细节也可以基于不同观点与应用,在没有背离本发明的精神下进行各种修饰或改变。需要说明的是,以下实施例中所提供的图示仅以示意方式说明本发明的基本构想,在不冲突的情况下,以下实施例及实施例中的特征可以相互组合。
其中,附图仅用于示例性说明,表示的仅是示意图,而非实物图,不能理解为对本发明的限制;为了更好地说明本发明的实施例,附图某些部件会有省略、放大或缩小,并不代表实际产品的尺寸;对本领域技术人员来说,附图中某些公知结构及其说明可能省略是可以理解的。
本发明实施例的附图中相同或相似的标号对应相同或相似的部件;在本发明的描述中,需要理解的是,若有术语“上”、“下”、“左”、“右”、“前”、“后”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本发明和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此附图中描述位置关系的用语仅用于示例性说明,不能理解为对本发明的限制,对于本领域的普通技术人员而言,可以根据具体情况理解上述术语的具体含义。
请参阅图1~图3,本发明所述的一种多模接入网络选择方法,考虑根据终端特性、业务特性、网络特性,基于DQN得到最优网络接入选择策略。
如图2所示,本发明所述方法具体包括以下步骤:
步骤一:终端信息感知模块实时感知收集终端时隙t的可用费用Ft,并将终端特性发送至接入网络选择判决模块
步骤二:业务特性感知模块对用户业务特性进行实时感知,并发送至信息处理模块以及接入网络选择判决模块
所述业务特性感知模块对业务进行识别,感知各业务性能参数,如传输带宽、时延、时延抖动和丢包率等的阈值,定义
Figure BDA0003246302340000061
分别表示时隙t用户业务对第j个业务性能参数需求阈值上限及下限,1≤t≤T,1≤j≤J,其中,T为最大时隙数,J为业务性能参数数量;同时根据业务对各性能参数的敏感程度确定参数敏感系数,令ωj,t表示时隙t业务对第j个业务性能参数的敏感系数,1≤t≤T,1≤j≤J。
步骤三:网络信息接收模块实时接收可用网络状态信息,并发送至信息处理模块及接入网络选择判决模块
所述网络信息收集模块通过接入网络端口获得不同网络参数,令pi,j,t表示时隙t接入网络i对应的第j个性能参数指标,1≤i≤M,1≤j≤J,1≤t≤T,其中,M为接入网络数量。
步骤四:信息处理模块对终端特性、业务特性、以及网络状态信息进行处理,将处理结果发送至接入网络选择判决模块
所述信息处理模块接收业务特性及网络状态信息,将业务性能参数划分为收益类及成本类参数,并对参数进行归一化处理,令Vi,j,t表示pi,j,t归一化值,有
Figure BDA0003246302340000062
步骤五:接入网络选择判决模块接收各模块发送的信息,执行接入选择方法,确定最优接入网络选择策略,并发送至相应的网络接口
所述接入网络选择判决模块根据终端特性、用户业务特性及网络状态信息,采用基于深度Q网络(deep Q network,DQN)的接入网络选择方法,具体为首先定义系统状态、动作和即时奖励,其次建模长期优化目标,基于深度Q网络(deep Q network,DQN)模型确定接入网络选择策略。确定状态集合S,st∈S,st为时隙t的状态,定义为
Figure BDA0003246302340000063
其中i表示时隙t终端接入网络i,1≤i≤M,Vi,t=[Vi,1,t,…,Vi,j,t,…,Vi,J,t]表示时隙t第i个网络参数的归一化值集合,其中,ωt={ω1,t,...,ωj,t,...,ωJ,t}表示时隙t终端业务对第j个性能参数的敏感程度集合,/>
Figure BDA0003246302340000071
表示时隙t终端业务队列需传输的业务量,建模为
Figure BDA0003246302340000072
表示时隙t的业务队列,其中,/>
Figure BDA0003246302340000073
为指示函数,若ωt+1≠ωt为真,则/>
Figure BDA0003246302340000074
否则为0,/>
Figure BDA0003246302340000075
表示终端业务队列的最大长度;确定动作集合A,at∈A,at为时隙t的动作,定义at=i表示在时隙t选择接入网络i;定义状态为st时接入网络i对应的即时奖励为/>
Figure BDA0003246302340000076
其中,/>
Figure BDA0003246302340000077
表示终端在时隙t接入网络i所获得的QoS,Tj,t表示终端用户时隙t对第j个性能参数可容忍的参数偏移度,/>
Figure BDA0003246302340000078
表示在时隙t切换到网络i的费用,ωfag,表示各项权重。建模长期收益为/>
Figure BDA0003246302340000079
γ为折扣因子且γ∈[0,1],建模如下优化问题/>
Figure BDA00032463023400000710
所述的基于深度Q网络(deep Q network,DQN)模型确定接入网络选择策略如图2有以下步骤:
步骤一:设置DQN训练过程中所需的参数,例如学习率、折扣率等
步骤二:初始化DQN模型中初始化DQN模型中主Q网络的参数θ和目标Q网络的参数θ'
步骤三:获取经验<st,at,rt,st+1>,并存储在经验回放池中
将当前状态st输入至所述主Q网络,获取所有动作对应的Q(st,at;θ),根据贪婪策略选取动作at,获取即时奖励rt,状态转移到st+1,获取转移数据<st,at,rt,st+1>
步骤四:从经验回放池D中随机选取转移样本<sτ,aτ,rτ,sτ+1>,输入至神经网络
步骤五:计算两个神经网络的损失函数,更新参数θ和θ'。
所述神经网络分别输出Q(sτ,aτ;θ)及
Figure BDA00032463023400000711
计算损耗函数
Figure BDA0003246302340000081
利用后向传播法,梯度更新θ,周期地令θ'=θ,完成网络参数更新。
如图3所示,本发明所述装置包括以下模块:
终端信息感知模块
在每个时隙开始阶段,感知终端自身的状态信息,通过对微处理器缓存内容的分析,获取终端时隙t的可用费用Ft,并将信息提供给接入网络选择判决模块;
业务特性感知模块
该模块周期性的对业务数据流和协议进行分析解析,感知各业务性能参数,如传输带宽、时延、时延抖动和丢包率等的阈值,同时根据业务对各性能参数的敏感程度确定参数敏感系数,并将感知的参数阈值以及参数的敏感系数分别发送至信息处理模块、接入网络选择判决模块;
网络信息收集模块
通过不同网络端口周期性的获取网络相关信息,如可用带宽、连接时延等信息,并将收集的网络状态信息发送至信息处理模块,将网络接入费用信息发送至接入网络选择判决模块;
信息处理模块
将业务性能参数划分为收益类,如带宽、信号强度等及成本类,如时延、丢包等参数,并对参数进行归一化处理,得到各参数归一化值,并发送至接入网络选择判决模块;
接入网络选择判决模块
在数据预处理模块对数据进行预处理,在DQN训练模块定义系统状态、动作和即时奖励,建模长期优化目标;进一步,训练DQN模型,基于DQN模型确定接入网络选择策略。
最后说明的是,以上实施例仅用以说明本发明的技术方案而非限制,尽管参照较佳实施例对本发明进行了详细说明,本领域的普通技术人员应当理解,可以对本发明的技术方案进行修改或者等同替换,而不脱离本技术方案的宗旨和范围,其均应涵盖在本发明的权利要求范围当中。

Claims (3)

1.一种多模接入网络选择方法,其特征在于:包括以下步骤:
S1:终端信息感知模块实时感知收集终端信息,并将终端特性发送至接入网络选择判决模块;
S2:业务特性感知模块对用户业务特性进行实时感知,并发送至信息处理模块以及接入网络选择判决模块;
S3:网络信息接收模块实时接收可用网络状态信息,并发送至信息处理模块及接入网络选择判决模块;
S4:信息处理模块对终端特性、业务特性以及网络状态信息进行处理,将处理结果发送至接入网络选择判决模块;
S5:接入网络选择判决模块接收各模块发送的信息,执行接入选择方法,确定最优接入网络选择策略,并发送至相应的网络接口;
在所述步骤S1中,终端信息感知模块获取终端时隙t的可用费用Ft,并将信息发送至接入网络选择判决模块;
在所述步骤S2中,定义bt为时隙t任务到达标识,bt=1表示时隙t有任务到达,bt=0表示时隙t无任务到达;业务特性感知模块对业务进行识别,感知各业务性能参数,包括传输带宽、时延、时延抖动和丢包率的阈值,定义
Figure FDA0004186343850000011
分别表示时隙t用户业务对第j个业务性能参数需求阈值上限及下限,1≤t≤T,1≤j≤J,其中,T为最大时隙数,J为业务性能参数数量;同时根据业务对各性能参数的敏感程度确定参数敏感系数,令ωj,t表示时隙t业务对第j个业务性能参数的敏感系数,1≤t≤T,1≤j≤J;
在所述步骤S3中,网络信息收集模块通过接入网络端口获得接入网络参数,令pi,j,t表示时隙t接入网络i对应的第j个性能参数指标,1≤i≤M,1≤j≤J,1≤t≤T,其中,M为接入网络数量;
在所述步骤S4中,信息处理模块接收业务特性及网络状态信息,将业务性能参数划分为收益类及成本类参数,并对参数进行归一化处理,令Vi,j,t表示pi,j,t归一化值,有
Figure FDA0004186343850000012
在所述步骤S5中,接入网络选择判决模块根据终端特性、用户业务特性及网络状态信息,采用基于深度Q网络(deep Qnetwork,DQN)的接入网络选择方法,具体为:定义系统状态、动作和即时奖励,设立系统长期优化目标,基于DQN模型确定接入网络选择策略;
所述定义系统状态、动作和即时奖励,设立系统长期优化目标,具体为:
确定状态集合S,st∈S,st为时隙t的状态,定义为:
Figure FDA0004186343850000021
其中i表示时隙t终端接入网络i,1≤i≤M,Vi,t=[Vi,1,t,…,Vi,j,t,…,Vi,J,t]表示时隙t第i个网络参数的归一化值集合,ωt={ω1,t,...,ωj,t,...,ωJ,t}表示时隙t终端业务对第j个性能参数的敏感程度集合;
Figure FDA0004186343850000022
表示时隙t终端业务队列需传输的业务量,建模为:
Figure FDA0004186343850000023
其中,
Figure FDA0004186343850000024
为指示函数,若ωt+1≠ωt为真,则/>
Figure FDA0004186343850000025
否则为0,/>
Figure FDA0004186343850000026
表示终端业务队列的最大长度;确定动作集合A,at∈A,at为时隙t的动作,定义at=i表示在时隙t选择接入网络i;
定义状态为st时接入网络i对应的即时奖励为:
Figure FDA0004186343850000027
其中,
Figure FDA0004186343850000028
表示终端在时隙t接入网络i所获得的服务质量(QualityofService,QoS),Tj,t表示终端用户时隙t对第j个性能参数可容忍的参数偏移度,/>
Figure FDA0004186343850000029
表示在时隙t切换到网络i的费用,ωfag表示各项权重;
建模长期收益为:
Figure FDA00041863438500000210
其中γ为折扣因子且γ∈[0,1];
建模优化问题
Figure FDA00041863438500000211
设立系统长期优化目标,基于DQN模型确定接入网络选择策略,具体包括:
S51:设置DQN训练过程中所需的参数,包括学习率、折扣率;
S52:初始化DQN模型中主Q网络的参数θ和目标Q网络的参数θ';
S53:获取经验<st,at,rt,st+1>,并存储在经验回放池中;
S54:从经验回放池D中随机选取转移样本<sτ,aτ,rτ,sτ+1>,输入至神经网络;
S55:计算主Q网络和目标Q网络的损失函数,更新参数θ和θ'。
2.根据权利要求1所述的多模接入网络选择方法,其特征在于:步骤S53将当前状态st输入至主Q网络,获取所有动作对应的Q(st,at;θ),根据贪婪策略选取动作at,获取即时奖励rt,状态转移到st+1,获取转移数据<st,at,rt,st+1>;
步骤S55所述神经网络输出Q(sτ,aτ;θ)及
Figure FDA0004186343850000031
计算损耗函数
Figure FDA0004186343850000032
利用后向传播法,梯度更新θ,周期地令θ'=θ,完成网络参数更新。
3.一种用于实现如权利要求1-2任一所述方法的多模接入网络选择装置,其特征在于:包括:
终端信息感知模块:用于在每个时隙开始阶段,感知终端自身的状态信息,通过对微处理器缓存内容的分析,获取终端时隙t的可用费用Ft,并将信息提供给接入网络选择判决模块;
业务特性感知模块:用于周期性地对业务数据流和协议进行分析解析,感知各业务性能参数,包括传输带宽、时延、时延抖动和丢包率的阈值,同时根据业务对各性能参数的敏感程度确定参数敏感系数,并将感知的参数阈值以及参数的敏感系数分别发送至信息处理模块、接入网络选择判决模块;
网络信息收集模块:通过不同网络端口周期性的获取网络状态信息,包括可用带宽、连接时延信息,并将收集的网络状态信息发送至信息处理模块,将网络接入费用信息发送至接入网络选择判决模块;
信息处理模块:用于将业务性能参数划分为收益类和成本类,并对参数进行归一化处理,得到各参数归一化值,并发送至接入网络选择判决模块,所述收益类包括带宽和信号强度,所述成本类包括时延和丢包参数;
接入网络选择判决模块:用于在数据预处理模块对数据进行预处理,在DQN训练模块定义系统状态、动作和即时奖励,建模长期优化目标;还用于训练DQN模型,基于DQN模型确定接入网络选择策略。
CN202111033667.8A 2021-09-03 2021-09-03 一种多模接入网络选择装置及方法 Active CN113727420B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111033667.8A CN113727420B (zh) 2021-09-03 2021-09-03 一种多模接入网络选择装置及方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111033667.8A CN113727420B (zh) 2021-09-03 2021-09-03 一种多模接入网络选择装置及方法

Publications (2)

Publication Number Publication Date
CN113727420A CN113727420A (zh) 2021-11-30
CN113727420B true CN113727420B (zh) 2023-05-23

Family

ID=78681643

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111033667.8A Active CN113727420B (zh) 2021-09-03 2021-09-03 一种多模接入网络选择装置及方法

Country Status (1)

Country Link
CN (1) CN113727420B (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117094377A (zh) * 2022-05-10 2023-11-21 华为技术有限公司 测量方法及装置
CN115052325B (zh) * 2022-06-07 2023-05-19 华北电力大学(保定) 适用于变电站业务的多频异构无线通信网络接入选择方法
CN116056043B (zh) * 2022-12-20 2024-02-23 中国铁道科学研究院集团有限公司 融合多移动网络的安全可信接入平台和接入系统

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102256266A (zh) * 2011-07-04 2011-11-23 重庆邮电大学 一种面向用户应用的自适应接入网络选择实现装置及方法
CN108021028A (zh) * 2017-12-22 2018-05-11 重庆邮电大学 一种基于相关冗余变换与增强学习的多维度协同控制方法
CN110602719A (zh) * 2019-10-10 2019-12-20 重庆邮电大学 一种机器间通信网关自适应接入网络选择实现装置
CN110809306A (zh) * 2019-11-04 2020-02-18 电子科技大学 一种基于深度强化学习的终端接入选择方法

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2008046303A1 (fr) * 2006-10-12 2008-04-24 Huawei Technologies Co., Ltd. Procédé pour fournir une sélection de mode d'accès à un terminal multimode, et système et procédé correspondants
US11844100B2 (en) * 2019-03-12 2023-12-12 Nec Corporation Virtual radio access network control

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102256266A (zh) * 2011-07-04 2011-11-23 重庆邮电大学 一种面向用户应用的自适应接入网络选择实现装置及方法
CN108021028A (zh) * 2017-12-22 2018-05-11 重庆邮电大学 一种基于相关冗余变换与增强学习的多维度协同控制方法
CN110602719A (zh) * 2019-10-10 2019-12-20 重庆邮电大学 一种机器间通信网关自适应接入网络选择实现装置
CN110809306A (zh) * 2019-11-04 2020-02-18 电子科技大学 一种基于深度强化学习的终端接入选择方法

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
A New Distributed Dynamic Spectrum Access Model Based on DQN;Xiao Gao;2020 15th IEEE International Conference on Signal Processing (ICSP);全文 *
基于博弈论的异构融合网络接入选择方法研究;陈前斌;周伟光;柴蓉;唐伦;;计算机学报(第09期);全文 *
异构云无线接入网架构下面向混合能源供应的动态资源分配及能源管理算法;陈前斌;电子与信息学报;全文 *
通信网络中的接入控制研究;李颖;;通信电源技术(第08期);全文 *

Also Published As

Publication number Publication date
CN113727420A (zh) 2021-11-30

Similar Documents

Publication Publication Date Title
CN113727420B (zh) 一种多模接入网络选择装置及方法
CN112202672B (zh) 一种基于业务服务质量需求的网络路由转发方法和系统
CN111585816B (zh) 一种基于自适应遗传算法的任务卸载决策方法
CN110365503B (zh) 一种指标确定方法及其相关设备
CN110809306A (zh) 一种基于深度强化学习的终端接入选择方法
CN114269007A (zh) 基站节能策略确定方法、装置以及方法存储介质
CN111510879A (zh) 基于多约束效用函数的异构车联网网络选择方法及系统
CN108901058A (zh) 一种物联网节点接入通道优化选择方法
CN110968426A (zh) 一种基于在线学习的边云协同k均值聚类的模型优化方法
CN107889195B (zh) 一种区分业务的自学习异构无线网络接入选择方法
Yu et al. Deep reinforcement learning-based RAN slicing for UL/DL decoupled cellular V2X
CN110234155A (zh) 一种基于改进topsis的超密集网络接入选择方法
CN112819054A (zh) 一种切片模板配置方法及装置
CN112601240A (zh) 物联网资源边缘智能调度方法
Lv et al. Edge computing task offloading for environmental perception of autonomous vehicles in 6G networks
CN116367223B (zh) 基于强化学习的xr服务优化方法、装置、电子设备和存储介质
CN111404815B (zh) 一种基于深度学习的有约束路由选择方法
CN110933691B (zh) 一种用于专用融合网络中基于相对熵和理想解的垂直切换方法
CN112492591A (zh) 一种电力物联网终端接入网络的方法及装置
CN106535226A (zh) 一种基于协同学理论的多网络协同选择和聚合方法
CN113490248B (zh) 一种多模终端切换方法及装置
CN109286458A (zh) 基于模糊支持向量机的合作频谱感知方法
Wang et al. The Network Selection Strategy for Connected Vehicles Based on Mobile Edge Computing
Han et al. Band Steering Technology Based on QoE-Oriented Optimization in Wireless Network
CN107147694A (zh) 一种信息处理方法和装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant