CN113286314A - 一种基于q学习算法的无人机基站部署及用户关联方法 - Google Patents
一种基于q学习算法的无人机基站部署及用户关联方法 Download PDFInfo
- Publication number
- CN113286314A CN113286314A CN202110572664.5A CN202110572664A CN113286314A CN 113286314 A CN113286314 A CN 113286314A CN 202110572664 A CN202110572664 A CN 202110572664A CN 113286314 A CN113286314 A CN 113286314A
- Authority
- CN
- China
- Prior art keywords
- user
- modeling
- base station
- unmanned aerial
- aerial vehicle
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04W—WIRELESS COMMUNICATION NETWORKS
- H04W16/00—Network planning, e.g. coverage or traffic planning tools; Network deployment, e.g. resource partitioning or cells structures
- H04W16/22—Traffic simulation tools or models
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F30/00—Computer-aided design [CAD]
- G06F30/10—Geometric CAD
- G06F30/18—Network design, e.g. design based on topological or interconnect aspects of utility systems, piping, heating ventilation air conditioning [HVAC] or cabling
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F30/00—Computer-aided design [CAD]
- G06F30/20—Design optimisation, verification or simulation
- G06F30/27—Design optimisation, verification or simulation using machine learning, e.g. artificial intelligence, neural networks, support vector machines [SVM] or training a model
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04W—WIRELESS COMMUNICATION NETWORKS
- H04W24/00—Supervisory, monitoring or testing arrangements
- H04W24/02—Arrangements for optimising operational condition
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2111/00—Details relating to CAD techniques
- G06F2111/10—Numerical modelling
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Evolutionary Computation (AREA)
- Geometry (AREA)
- Software Systems (AREA)
- General Engineering & Computer Science (AREA)
- Computer Networks & Wireless Communication (AREA)
- Medical Informatics (AREA)
- Signal Processing (AREA)
- Computer Hardware Design (AREA)
- Artificial Intelligence (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Computational Mathematics (AREA)
- Mathematical Physics (AREA)
- Mathematical Analysis (AREA)
- Mathematical Optimization (AREA)
- Pure & Applied Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Computing Systems (AREA)
- Mobile Radio Communication Systems (AREA)
Abstract
本发明涉及一种基于Q学习算法的无人机基站部署及用户关联方法,属于无线通信技术领域。该方法包括:S1:建模用户关联标识;S2:建模用户及基站位置;S3:建模用户移动模型;S4:建模用户传输速率;S5:建模系统回报函数;S6:建模用户关联及传输速率限制条件;S7:建模满足限制条件的系统长期回报函数优化问题;S8:基于Q学习算法确定优化策略。本发明可以有效保证用户数据速率要求前提下,实现无人机部署及用户关联策略的优化设计。
Description
技术领域
本发明属于无线通信技术领域,涉及一种基于Q学习算法的无人机基站部署及用户关联方法。
背景技术
近年来,由于无人机制造技术的发展和成本的降低,无人机已广泛应用于民用和商业领域。在无线通信系统中使用无人机基站已经受到越来越多的关注,与传统地面通信系统相比,通过对无人机基站的灵活高效部署可以有效提升通信系统性能以及用户业务体验。相关研究表明,无人机基站的部署位置将对系统性能产生显著的影响。
目前已有文献针对无人机基站部署问题进行研究,如提出了一种基于覆盖用户数量最大化的无人机部署策略;但现有研究较少考虑动态环境中蜂窝网络联合无人机基站部署及用户关联问题;此外,现有研究较少考虑无人机基站位置部署的长期优化,以实现系统长期性能优化。
发明内容
有鉴于此,本发明的目的在于提供一种基于Q学习算法的无人机基站部署及用户关联方法,针对包含多个基站(Base Station,BS)、一个无人机基站以及多个用户(UserEquipment,UE)的蜂窝移动通信系统,建模系统长期回报函数为优化目标,实现无人机基站部署及用户关联策略。
为达到上述目的,本发明提供如下技术方案:
一种基于Q学习算法的无人机基站部署及用户关联方法,包括以下步骤:
S1:建模用户关联标识;
S2:建模用户及基站位置;
S3:建模用户移动模型;
S4:建模用户传输速率;
S5:建模系统回报函数;
S6:建模用户关联及传输速率限制条件;
S7:建模满足限制条件的系统长期回报函数优化问题;
S8:基于Q学习算法确定优化策略。
进一步,步骤S1中,建模用户关联标识,具体包括:令Ω={UE1,...,UEm,...,UEM}表示用户集合,其中UEm表示第m个用户,1≤m≤M,M为用户数目;令Γ={BS1,…,BSn,…,BSN}表示蜂窝基站集合,其中BSn表示第n个蜂窝基站,1≤n≤N,N为蜂窝基站数目;令βmn∈{0,1}表示用户关联蜂窝基站标识,βmn=1表示用户UEm关联蜂窝基站BSn进行数据传输,否则βmn=0;令表示用户关联无人机基站标识,表示用户UEm关联无人机基站进行数据传输,否则
进一步,步骤S2中,建模用户及基站位置,具体包括:将系统空间进行三维离散化处理,令xmax、ymax、hmax分别为三维网格中行、列、高的最大点数,用户与蜂窝基站的高度均为0,故可用二维网格点描述,令(xm,ym)表示用户UEm的二维空间位置,0≤xm≤xmax,0≤ym≤ymax;令表示蜂窝基站BSn的位置, 建模无人机基站位置为(xu,yu,hu),0≤xu≤xmax,0≤yu≤ymax,hmin≤hu≤hmax,hmin为无人机允许的最低高度。
进一步,步骤S3中,建模用户移动模型为随机移动模型,令vm,t表示时隙t用户UEm的移动速率,θm,t表示时隙t用户UEm的移动方向,vm与θm均为均匀分布随机变量,vm取值范围为[0,vmax],θm取值范围为[0,2π]。
进一步,步骤S4中,建模用户传输速率,具体包括:
1)建模时隙t用户UEm与蜂窝基站BSn之间链路的传输速率为Rm,n,t=B log2(1+SINRm,n,t),其中B为蜂窝基站BSn分配给用户UEm的信道带宽,SINRm,n,t表示t时刻用户UEm与蜂窝基站BSn之间链路的信干噪比,定义为其中Pm表示用户UEm的发送功率,σ2表示噪声功率,hm,n,t表示时隙t用户UEm与基站BSn之间的信道增益,定义为hm,n,t=c(dm,n,t)-2,c为常数,Im,n,t表示基站间的同频干扰,建模为
2)建模时隙t用户UEm与无人机基站之间的传输速率为其中表示t时刻用户UEm与无人机基站之间链路的信干噪比,表示t时刻用户UEm与无人机基站之间的信道增益,定义为c为常数,为无人机基站处的干扰,建模为
进一步,步骤S8中,确定优化策略,具体包括:基于Q学习算法求解满足限制条件的系统长期平均回报函数最大化问题,建模系统动态变化为马尔可夫决策过程(MarkovDecision Process,MDP)模型;定义状态空间为时隙t各用户的位置,定义动作空间为其中,若βmn=1,zm=n;若zm=N+1,1≤m≤M;定义Q函数为Q(st,at)=α[Rt+1+γmaxQ(st+1,a)-Q(st,at)],其中st为t时刻系统状态,at为t时刻采取的动作,a为系统采取的动作,α∈(0,1)为学习速率,γ∈(0,1)为折扣因子,各时刻对Q函数迭代更新,可确定对应长期平均回报函数优化的无人机基站部署及用户关联策略,即
本发明的有益效果在于:本发明可以有效保证每个请求用户最小数据速率要求前提下,无人机部署及用户关联策略最优,实现系统长期平均回报函数最大化。
本发明的其他优点、目标和特征在某种程度上将在随后的说明书中进行阐述,并且在某种程度上,基于对下文的考察研究对本领域技术人员而言将是显而易见的,或者可以从本发明的实践中得到教导。本发明的目标和其他优点可以通过下面的说明书来实现和获得。
附图说明
为了使本发明的目的、技术方案和优点更加清楚,下面将结合附图对本发明作优选的详细描述,其中:
图1为具有无人机基站的蜂窝网络场景示意图;
图2为本发明基于Q学习算法的无人机基站部署及用户关联方法的流程示意图。
具体实施方式
以下通过特定的具体实例说明本发明的实施方式,本领域技术人员可由本说明书所揭露的内容轻易地了解本发明的其他优点与功效。本发明还可以通过另外不同的具体实施方式加以实施或应用,本说明书中的各项细节也可以基于不同观点与应用,在没有背离本发明的精神下进行各种修饰或改变。需要说明的是,以下实施例中所提供的图示仅以示意方式说明本发明的基本构想,在不冲突的情况下,以下实施例及实施例中的特征可以相互组合。
请参阅图1~图2,图1为具有无人机基站的蜂窝移动网络场景示意图,如图1所示,本实施网络中存在多个基站,多个请求用户,一个无人机基站,网络中请求用户可以根据信道条件和服务质量等灵活选择关联策略,同时,无人机基站根据系统长期平均回报函数最大化选择最优位置。
图2为本发明基于Q学习算法的无人机基站部署及用户关联方法的流程示意图,如图2所示,该方法具体包括以下步骤:
1)建模用户关联标识
建模用户关联标识,令Ω={UE1,...,UEM}表示用户集合,其中UEm表示第m个用户,1≤m≤M,M为用户数目;令Γ={BS1,...,BSN}表示蜂窝基站集合,其中BSn表示第n个蜂窝基站,1≤n≤N,N为蜂窝基站数目;令βmn∈{0,1}表示用户关联蜂窝基站标识,βmn=1表示用户UEm关联蜂窝基站BSn进行数据传输,否则βmn=0;令表示用户关联无人机基站标识,表示用户UEm关联无人机基站进行数据传输,否则
2)建模用户及基站位置
建模用户及基站位置,将系统空间进行三维离散化处理,令xmax、ymax、hmax分别为三维网格中行、列、高的最大点数,用户与蜂窝基站的高度均为0,故可用二维网格点描述,令(xm,ym)表示用户UEm的二维空间位置,0≤xm≤xmax,0≤ym≤ymax;令表示蜂窝基站BSn的位置, 建模无人机基站位置为(xu,yu,hu),0≤xu≤xmax,0≤yu≤ymax,hmin≤hu≤hmax,hmin为无人机允许的最低高度。
3)建模用户移动模型
建模用户移动模型为随机移动模型,令vm,t表示时隙t用户UEm的移动速率,θm,t表示时隙t用户UEm的移动方向,vm与θm均为均匀分布随机变量,vm取值范围为[0,vmax],θm取值范围为[0,2π]。
4)建模用户传输速率
建模用户传输速率,时隙t用户UEm与蜂窝基站BSn之间链路的传输速率为Rm,n,t=Blog2(1+SINRm,n,t),其中B为蜂窝基站BSn分配给用户UEm的信道带宽,SINRm,n,t表示t时刻用户UEm与蜂窝基站BSn之间链路的信干噪比,定义为其中Pm表示用户UEm的发送功率,hm,n,t表示t时刻用户UEm与基站BSn之间的信道增益,定义为hm,n,t=c(dm,n,t)-2,c为常数,σ2表示噪声功率,Im,n,t表示基站间的同频干扰,建模为
5)建模系统回报函数
6)建模用户关联及传输速率限制条件
7)建模满足限制条件的系统长期回报函数优化问题
8)基于Q学习算法确定优化策略
基于Q学习确定满足限制条件的系统长期平均回报函数最大化策略,建模系统动态变化为马尔可夫决策过程(Markov Decision Process,MDP)模型;定义状态空间为时隙t各用户的位置,定义动作空间为其中,若βmn=1,zm=n;若zm=N+1,1≤m≤M;定义Q函数为其中st为t时刻系统状态,at为t时刻采取的动作,a为系统采取的动作,α∈(0,1)为学习速率,γ∈(0,1)为折扣因子,各时刻对Q函数迭代更新,可确定对应长期回报函数优化的无人机基站部署及用户关联策略,即
最后说明的是,以上实施例仅用以说明本发明的技术方案而非限制,尽管参照较佳实施例对本发明进行了详细说明,本领域的普通技术人员应当理解,可以对本发明的技术方案进行修改或者等同替换,而不脱离本技术方案的宗旨和范围,其均应涵盖在本发明的权利要求范围当中。
Claims (9)
1.一种基于Q学习算法的无人机基站部署及用户关联方法,其特征在于,该方法包括以下步骤:
S1:建模用户关联标识;
S2:建模用户及基站位置;
S3:建模用户移动模型;
S4:建模用户传输速率;
S5:建模系统回报函数;
S6:建模用户关联及传输速率限制条件;
S7:建模满足限制条件的系统长期回报函数优化问题;
S8:基于Q学习算法确定优化策略。
4.根据权利要求3所述的无人机基站部署及用户关联方法,其特征在于,步骤S3中,建模用户移动模型为随机移动模型,令vm,t表示时隙t用户UEm的移动速率,θm,t表示时隙t用户UEm的移动方向,vm与θm均为均匀分布随机变量,vm取值范围为[0,vmax],θm取值范围为[0,2π]。
5.根据权利要求4所述的无人机基站部署及用户关联方法,其特征在于,步骤S4中,建模用户传输速率,具体包括:
1)建模时隙t用户UEm与蜂窝基站BSn之间链路的传输速率为Rm,n,t=B log2(1+SINRm,n,t),其中B为蜂窝基站BSn分配给用户UEm的信道带宽,SINRm,n,t表示t时刻用户UEm与蜂窝基站BSn之间链路的信干噪比,定义为其中Pm表示用户UEm的发送功率,σ2表示噪声功率,hm,n,t表示时隙t用户UEm与基站BSn之间的信道增益,定义为hm,n,t=c(dm,n,t)-2,c为常数,Im,n,t表示基站间的同频干扰,建模为
9.根据权利要求8所述的无人机基站部署及用户关联方法,其特征在于,步骤S8中,确定优化策略,具体包括:基于Q学习算法求解满足限制条件的系统长期平均回报函数最大化问题,建模系统动态变化为马尔可夫决策过程模型;定义状态空间为时隙t各用户的位置,定义动作空间为(xu,yu,hu)},其中,若βmn=1,zm=n;若zm=N+1,1≤m≤M;定义Q函数为Q(st,at)=α[Rt+1+γmax Q(st+1,a)-Q(st,at)],其中st为t时刻系统状态,at为t时刻采取的动作,a为系统采取的动作,α∈(0,1)为学习速率,γ∈(0,1)为折扣因子,各时刻对Q函数迭代更新,确定对应长期平均回报函数优化的无人机基站部署及用户关联策略,即
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110572664.5A CN113286314B (zh) | 2021-05-25 | 2021-05-25 | 一种基于q学习算法的无人机基站部署及用户关联方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110572664.5A CN113286314B (zh) | 2021-05-25 | 2021-05-25 | 一种基于q学习算法的无人机基站部署及用户关联方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113286314A true CN113286314A (zh) | 2021-08-20 |
CN113286314B CN113286314B (zh) | 2022-03-08 |
Family
ID=77281504
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110572664.5A Active CN113286314B (zh) | 2021-05-25 | 2021-05-25 | 一种基于q学习算法的无人机基站部署及用户关联方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113286314B (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114268397A (zh) * | 2021-12-09 | 2022-04-01 | 重庆邮电大学 | 一种基于山地地形的无人机空对空信道建模方法 |
CN114374951A (zh) * | 2022-01-12 | 2022-04-19 | 重庆邮电大学 | 一种多无人机动态预部署方法 |
US11961409B1 (en) | 2023-07-05 | 2024-04-16 | Nanjing University Of Aeronautics And Astronautics | Air-ground joint trajectory planning and offloading scheduling method and system for distributed multiple objectives |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104135436A (zh) * | 2014-08-20 | 2014-11-05 | 重庆邮电大学 | 一种车辆自组织网络路由选择方法 |
CN108040353A (zh) * | 2017-12-18 | 2018-05-15 | 北京工业大学 | 一种q学习的无人机集群智能地理路由方法 |
CN110809274A (zh) * | 2019-10-28 | 2020-02-18 | 南京邮电大学 | 一种面向窄带物联网的无人机基站增强网络优化方法 |
CN111666149A (zh) * | 2020-05-06 | 2020-09-15 | 西北工业大学 | 基于深度强化学习的超密边缘计算网络移动性管理方法 |
CN111683375A (zh) * | 2020-05-08 | 2020-09-18 | 北京科技大学 | 一种针对无人机辅助无线蜂窝网络的无人机部署优化方法 |
CN111786713A (zh) * | 2020-06-04 | 2020-10-16 | 大连理工大学 | 一种基于多智能体深度强化学习的无人机网络悬停位置优化方法 |
CN112118556A (zh) * | 2020-03-02 | 2020-12-22 | 湖北工业大学 | 基于深度强化学习的无人机轨迹及功率联合优化方法 |
US20210144517A1 (en) * | 2019-04-30 | 2021-05-13 | Intel Corporation | Multi-entity resource, security, and service management in edge computing deployments |
-
2021
- 2021-05-25 CN CN202110572664.5A patent/CN113286314B/zh active Active
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104135436A (zh) * | 2014-08-20 | 2014-11-05 | 重庆邮电大学 | 一种车辆自组织网络路由选择方法 |
CN108040353A (zh) * | 2017-12-18 | 2018-05-15 | 北京工业大学 | 一种q学习的无人机集群智能地理路由方法 |
US20210144517A1 (en) * | 2019-04-30 | 2021-05-13 | Intel Corporation | Multi-entity resource, security, and service management in edge computing deployments |
CN110809274A (zh) * | 2019-10-28 | 2020-02-18 | 南京邮电大学 | 一种面向窄带物联网的无人机基站增强网络优化方法 |
CN112118556A (zh) * | 2020-03-02 | 2020-12-22 | 湖北工业大学 | 基于深度强化学习的无人机轨迹及功率联合优化方法 |
CN111666149A (zh) * | 2020-05-06 | 2020-09-15 | 西北工业大学 | 基于深度强化学习的超密边缘计算网络移动性管理方法 |
CN111683375A (zh) * | 2020-05-08 | 2020-09-18 | 北京科技大学 | 一种针对无人机辅助无线蜂窝网络的无人机部署优化方法 |
CN111786713A (zh) * | 2020-06-04 | 2020-10-16 | 大连理工大学 | 一种基于多智能体深度强化学习的无人机网络悬停位置优化方法 |
Non-Patent Citations (1)
Title |
---|
谭俊杰: "面向智能通信的深度强化学习方法", 《电子科技大学学报》 * |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114268397A (zh) * | 2021-12-09 | 2022-04-01 | 重庆邮电大学 | 一种基于山地地形的无人机空对空信道建模方法 |
CN114268397B (zh) * | 2021-12-09 | 2023-06-20 | 重庆邮电大学 | 一种基于山地地形的无人机空对空信道建模方法 |
CN114374951A (zh) * | 2022-01-12 | 2022-04-19 | 重庆邮电大学 | 一种多无人机动态预部署方法 |
CN114374951B (zh) * | 2022-01-12 | 2024-04-30 | 重庆邮电大学 | 一种多无人机动态预部署方法 |
US11961409B1 (en) | 2023-07-05 | 2024-04-16 | Nanjing University Of Aeronautics And Astronautics | Air-ground joint trajectory planning and offloading scheduling method and system for distributed multiple objectives |
Also Published As
Publication number | Publication date |
---|---|
CN113286314B (zh) | 2022-03-08 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN113286314B (zh) | 一种基于q学习算法的无人机基站部署及用户关联方法 | |
CN108616302B (zh) | 一种功率控制下的无人机多重覆盖模型及部署方法 | |
CN114827191B (zh) | 一种车路协同系统中融合noma的动态任务卸载方法 | |
CN112217678B (zh) | 基于量子帝王蝶优化机制的双层异构网络频谱分配方法 | |
CN111586703B (zh) | 一种无人机基站部署及内容缓存方法 | |
CN104378772B (zh) | 一种蜂窝网络中面向小区无定形覆盖的小基站部署方法 | |
CN110798851B (zh) | 无线异构网络的能量效率和负载均衡的联合优化方法 | |
US11646778B2 (en) | Method and apparatus for controlling beam adaptively in wireless communication system | |
CN111479226A (zh) | 无人机通信系统及基于用户轨迹的无人机通信优化方法 | |
CN113825143A (zh) | 基于协同异构空中网络的位置优化和资源分配方法及系统 | |
CN115103368B (zh) | 一种基于内容感知的移动基站轨迹规划方法 | |
CN115103409A (zh) | 一种多波束无人机协作通信的资源分配方法 | |
CN113784366A (zh) | 一种基于无人机群覆盖优化的智能集群方法 | |
CN106358300A (zh) | 一种微蜂窝网络中的分布式资源分配方法 | |
CN116113025A (zh) | 一种无人机协能通信网络中轨迹设计和功率分配方法 | |
CN114158010B (zh) | 无人机通信系统及基于神经网络的资源分配策略预测方法 | |
CN104853425A (zh) | 一种用于异构网络上行链路的功率控制方法 | |
Huang et al. | A method for deploying the minimal number of UAV base stations in cellular networks | |
CN111954275B (zh) | 一种面向无人机基站网络的用户多连接配置方法 | |
Chen et al. | Deployment for NOMA-UAV base stations based on hybrid sparrow search algorithm | |
Yahya et al. | Joint coverage and resource allocation for federated learning in UAV-enabled networks | |
EP3550898B1 (en) | Communication method and device used for joint optimisation of transmission power and transmission rate | |
Wang et al. | An efficient and robust UAVs’ path planning approach for timely data collection in wireless sensor networks | |
CN114158103A (zh) | 一种协同异构空中网络设计及部署优化方法及系统 | |
Handouf et al. | Energy-throughput tradeoffs in ubiquitous flying radio access network for IoT |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |