CN109495952B - 一种蜂窝和无人机一体化网络的选择方法及装置 - Google Patents
一种蜂窝和无人机一体化网络的选择方法及装置 Download PDFInfo
- Publication number
- CN109495952B CN109495952B CN201811353219.4A CN201811353219A CN109495952B CN 109495952 B CN109495952 B CN 109495952B CN 201811353219 A CN201811353219 A CN 201811353219A CN 109495952 B CN109495952 B CN 109495952B
- Authority
- CN
- China
- Prior art keywords
- time slot
- constraint
- network
- user
- vector
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 230000001413 cellular effect Effects 0.000 title claims abstract description 53
- 238000010187 selection method Methods 0.000 title abstract description 37
- 239000013598 vector Substances 0.000 claims abstract description 166
- 230000008901 benefit Effects 0.000 claims abstract description 122
- 230000009471 action Effects 0.000 claims abstract description 99
- 238000000034 method Methods 0.000 claims abstract description 79
- 230000033001 locomotion Effects 0.000 claims abstract description 53
- 230000005540 biological transmission Effects 0.000 claims abstract description 30
- 239000011159 matrix material Substances 0.000 claims description 23
- 239000000126 substance Substances 0.000 claims description 15
- 238000013507 mapping Methods 0.000 claims description 6
- 238000012545 processing Methods 0.000 claims description 4
- 230000006870 function Effects 0.000 description 39
- 238000010586 diagram Methods 0.000 description 11
- 230000008569 process Effects 0.000 description 10
- 238000013459 approach Methods 0.000 description 7
- 238000005457 optimization Methods 0.000 description 6
- 238000004088 simulation Methods 0.000 description 5
- 230000007423 decrease Effects 0.000 description 4
- 230000003993 interaction Effects 0.000 description 4
- 230000008859 change Effects 0.000 description 3
- 230000007246 mechanism Effects 0.000 description 3
- 230000007704 transition Effects 0.000 description 3
- 238000012935 Averaging Methods 0.000 description 2
- 230000001133 acceleration Effects 0.000 description 2
- 238000004422 calculation algorithm Methods 0.000 description 2
- 238000012886 linear function Methods 0.000 description 2
- 230000000750 progressive effect Effects 0.000 description 2
- 230000006641 stabilisation Effects 0.000 description 2
- 238000011105 stabilization Methods 0.000 description 2
- 108010014172 Factor V Proteins 0.000 description 1
- 241000764238 Isis Species 0.000 description 1
- 230000002776 aggregation Effects 0.000 description 1
- 238000004220 aggregation Methods 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000002068 genetic effect Effects 0.000 description 1
- 239000002184 metal Substances 0.000 description 1
- 229910052751 metal Inorganic materials 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000002040 relaxant effect Effects 0.000 description 1
- 230000003252 repetitive effect Effects 0.000 description 1
- 238000013468 resource allocation Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04B—TRANSMISSION
- H04B7/00—Radio transmission systems, i.e. using radiation field
- H04B7/14—Relay systems
- H04B7/15—Active relay systems
- H04B7/185—Space-based or airborne stations; Stations for satellite systems
- H04B7/18502—Airborne stations
- H04B7/18506—Communications with or from aircraft, i.e. aeronautical mobile service
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04W—WIRELESS COMMUNICATION NETWORKS
- H04W48/00—Access restriction; Network selection; Access point selection
- H04W48/18—Selecting a network or a communication service
-
- B—PERFORMING OPERATIONS; TRANSPORTING
- B64—AIRCRAFT; AVIATION; COSMONAUTICS
- B64C—AEROPLANES; HELICOPTERS
- B64C39/00—Aircraft not otherwise provided for
- B64C39/02—Aircraft not otherwise provided for characterised by special use
- B64C39/024—Aircraft not otherwise provided for characterised by special use of the remote controlled vehicle type, i.e. RPV
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04B—TRANSMISSION
- H04B7/00—Radio transmission systems, i.e. using radiation field
- H04B7/14—Relay systems
- H04B7/15—Active relay systems
- H04B7/185—Space-based or airborne stations; Stations for satellite systems
- H04B7/18502—Airborne stations
- H04B7/18504—Aircraft used as relay or high altitude atmospheric platform
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L47/00—Traffic control in data switching networks
- H04L47/10—Flow control; Congestion control
- H04L47/12—Avoiding congestion; Recovering from congestion
- H04L47/122—Avoiding congestion; Recovering from congestion by diverting traffic away from congested entities
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04W—WIRELESS COMMUNICATION NETWORKS
- H04W24/00—Supervisory, monitoring or testing arrangements
- H04W24/02—Arrangements for optimising operational condition
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04W—WIRELESS COMMUNICATION NETWORKS
- H04W4/00—Services specially adapted for wireless communication networks; Facilities therefor
- H04W4/02—Services making use of location information
- H04W4/021—Services related to particular areas, e.g. point of interest [POI] services, venue services or geofences
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04W—WIRELESS COMMUNICATION NETWORKS
- H04W48/00—Access restriction; Network selection; Access point selection
- H04W48/20—Selecting an access point
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04W—WIRELESS COMMUNICATION NETWORKS
- H04W84/00—Network topologies
- H04W84/02—Hierarchically pre-organised networks, e.g. paging networks, cellular networks, WLAN [Wireless Local Area Network] or WLL [Wireless Local Loop]
- H04W84/04—Large scale networks; Deep hierarchical networks
- H04W84/06—Airborne or Satellite Networks
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04W—WIRELESS COMMUNICATION NETWORKS
- H04W88/00—Devices specially adapted for wireless communication networks, e.g. terminals, base stations or access point devices
- H04W88/08—Access point devices
- H04W88/085—Access point devices with remote components
-
- B—PERFORMING OPERATIONS; TRANSPORTING
- B64—AIRCRAFT; AVIATION; COSMONAUTICS
- B64U—UNMANNED AERIAL VEHICLES [UAV]; EQUIPMENT THEREFOR
- B64U2101/00—UAVs specially adapted for particular uses or applications
- B64U2101/20—UAVs specially adapted for particular uses or applications for use as communications relays, e.g. high-altitude platforms
-
- B—PERFORMING OPERATIONS; TRANSPORTING
- B64—AIRCRAFT; AVIATION; COSMONAUTICS
- B64U—UNMANNED AERIAL VEHICLES [UAV]; EQUIPMENT THEREFOR
- B64U2101/00—UAVs specially adapted for particular uses or applications
- B64U2101/20—UAVs specially adapted for particular uses or applications for use as communications relays, e.g. high-altitude platforms
- B64U2101/23—UAVs specially adapted for particular uses or applications for use as communications relays, e.g. high-altitude platforms for providing telephone services
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L41/00—Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
- H04L41/14—Network analysis or design
- H04L41/145—Network analysis or design involving simulating, designing, planning or modelling of a network
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L47/00—Traffic control in data switching networks
- H04L47/10—Flow control; Congestion control
- H04L47/12—Avoiding congestion; Recovering from congestion
- H04L47/127—Avoiding congestion; Recovering from congestion by using congestion prediction
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L67/00—Network arrangements or protocols for supporting network services or applications
- H04L67/01—Protocols
- H04L67/12—Protocols specially adapted for proprietary or special-purpose networking environments, e.g. medical networks, sensor networks, networks in vehicles or remote metering networks
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04W—WIRELESS COMMUNICATION NETWORKS
- H04W24/00—Supervisory, monitoring or testing arrangements
- H04W24/06—Testing, supervising or monitoring using simulated traffic
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04W—WIRELESS COMMUNICATION NETWORKS
- H04W40/00—Communication routing or communication path finding
- H04W40/02—Communication route or path selection, e.g. power-based or shortest path routing
- H04W40/18—Communication route or path selection, e.g. power-based or shortest path routing based on predicted events
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04W—WIRELESS COMMUNICATION NETWORKS
- H04W88/00—Devices specially adapted for wireless communication networks, e.g. terminals, base stations or access point devices
- H04W88/08—Access point devices
Abstract
本发明提供了一种蜂窝和无人机一体化网络的选择方法及装置,方法包括:获取动态网络模型和动态用户模型;其中,动态网络模型至少包括:无人机网络的位置模型、蜂窝网络的容量模型以及无人机网络的容量模型,动态用户模型至少包括:用户的位置模型、传输速率模型;根据无人机网络的位置模型和用户的位置模型生成用户可接入网络集合;根据蜂窝网络的容量模型、无人机网络的容量模型、用户可接入网络集合以及传输速率模型生成随机事件向量;根据随机事件向量生成动作向量;根据动作向量和随机事件向量获得每个用户的个体效益;构建第一选择模型;根据第一选择模型获得动作概率的数值,以根据动作概率的数值确定用户选择接入的网络。
Description
技术领域
本发明属于网络选择技术领域,更具体地,涉及一种蜂窝和无人机一体化网络的选择方法及装置。
背景技术
为了提供更好的网络数据服务,避免蜂窝网络出现拥塞现象,可以采用借助配备了收发机的低空无人机来卸载拥塞的蜂窝网络上的业务的方案。针对蜂窝和无人机一体化网络,为了充分地利用无人机资源,一个重要的挑战是如何进行高效公平的网络选择。
一种解决网络选择问题的方法是基于博弈论的方法。在基于博弈论的方法中,首先将网络选择问题构建为一个博弈,然后通过集中式/分布式的方法实现均衡。例如,Man等人在用户移动信息不完整的条件下,将网络选择问题构建为一个贝叶斯博弈。然后他们提出了一种具有良好收敛性的分布式方法来实现贝叶斯纳什均衡。
现有的基于博弈论的方法考虑了用户间的相互影响和竞争,然而,他们中绝大多数是在准静态或可预测的网络状态条件下研究网络选择问题。而蜂窝和无人机一体化网络具有高动态性并且网络状态难以预测,导致现有的基于博弈论的方法无法解决蜂窝和无人机一体化网络的选择问题。
发明内容
本发明提供一种蜂窝和无人机一体化网络的选择方法及装置,旨在解决由于蜂窝和无人机一体化网络具有高动态性并且网络状态难以预测,导致现有的基于博弈论的方法无法解决蜂窝和无人机一体化网络的选择问题。
第一方面,本发明提供一种蜂窝和无人机一体化网络的选择方法,包括:获取动态网络模型和动态用户模型;其中,动态网络模型至少包括:无人机网络的位置模型、蜂窝网络的容量模型以及无人机网络的容量模型,动态用户模型至少包括:用户的位置模型、传输速率模型;根据无人机网络的位置模型和用户的位置模型生成用户可接入网络集合;根据蜂窝网络的容量模型、无人机网络的容量模型、用户可接入网络集合以及传输速率模型生成随机事件向量,其中,用户可接入网络集合包括无人机网络和/或蜂窝网络;根据随机事件向量生成动作向量,动作向量用于表示用户选择接入无人机网络和/或蜂窝网络;根据动作向量和随机事件向量获得每个用户的个体效益;构建第一选择模型;其中,第一选择模型包括:第一目标函数和第一约束,第一目标函数为以个体效益的时间平均值为自变量的比例公平函数,第一约束至少包括:第一粗相关均衡约束、第一最小个体时间平均效益约束以及第一动作概率约束,第一粗相关均衡约束用于对个体效益的时间平均值和第一辅助变量进行约束,第一最小个体时间平均效益约束用于对个体效益的时间平均值进行约束,第一动作概率约束用于对在随机事件向量的条件下的动作概率进行约束;个体效益的时间平均值根据个体效益、随机事件概率和在随机事件向量的条件下的动作概率获得,在随机事件向量的条件下的动作概率为用户在随机事件向量发生的条件下执行动作向量的概率;随机事件的概率为随机事件发生的概率;根据第一选择模型获得动作概率的数值,以根据动作概率的数值确定用户选择接入的网络。
在本发明提供的网络选择方法中,获取动态网络模型和动态用户模型,基于获取动态网络模型和动态用户模型生成随机事件向量,根据随机事件向量和动作向量构建第一选择模型,根据第一选择模型获得动作概率的数值,以根据动作概率的数值确定用户选择接入的网络。解决了由于蜂窝和无人机一体化网络具有高动态性并且网络状态难以预测,导致现有的基于博弈论的方法无法解决蜂窝和无人机一体化网络的选择问题。
第二方面,本发明提供一种蜂窝和无人机一体化网络的选择装置,包括:收发机,用于获取无人机网络的容量信息、蜂窝网络的容量信息、用户可接入网络集合信息以及传输速率信息,以及向用户发送动作向量信息,以使用户根据动作向量信息确定接入网络;处理器,根据无人机网络的容量信息、蜂窝网络的容量信息、用户可接入网络集合信息、传输速率信息以及第四选择模型生成动作向量信息;其中,第四选择模型为总违反量的漂移与收益的差值小于等于惩罚上界量;总违反量的漂移根据总违反量的当前时隙的数值和总违反量的后一时隙的数值获得;总违反量的当前时隙的数值根据当前时隙第一虚拟量、当前时隙第二虚拟量以及当前时隙第三虚拟量获得;第一虚拟队列中当前时隙第一虚拟量根据第二粗相关均衡约束的前一时隙违反量和第一虚拟队列中前一时隙第一虚拟量生成,第二虚拟队列的当前时隙第二虚拟量根据第三辅助变量约束的前一时隙违反量和第二虚拟队列中前一时隙第二虚拟量生成,第三虚拟队列的当前时隙第三虚拟量根据第二最小个体时间平均效益约束的前一时隙违反量和第三虚拟队列中前一时隙第三虚拟量生成,其中,初始时隙第一虚拟量、初始时隙第二虚拟量以及初始时隙第三虚拟量均为零;其中,第三选择模型包括第三目标函数和第三约束,第三目标函数为以第三辅助变量为自变量的比例公平函数的时间平均期望,第三约束至少包括第二粗相关均衡约束、第二最小个体时间平均效益约束、第二辅助变量约束以及第三辅助变量约束,第二粗相关均衡约束用于对个体效益的时间平均期望和第二辅助变量的时间平均期望进行约束,第二最小个体时间平均效益约束用于对个体效益的时间平均期望进行约束,第二辅助变量约束用于对第二辅助变量进行约束,第三辅助变量约束用于对第三辅助变量的时间平均期望与个体效益的时间平均期望进行约束;其中,第一选择模型包括:第一目标函数和第一约束,第一目标函数为以个体效益的时间平均值为自变量的比例公平函数,第一约束至少包括:第一粗相关均衡约束、第一最小个体时间平均效益约束以及第一动作概率约束,第一粗相关均衡约束用于对个体效益的时间平均值和第一辅助变量进行约束,第一最小个体时间平均效益约束用于对个体效益的时间平均值进行约束,第一动作概率约束对约束用于对在随机事件向量的条件下的动作概率进行约束;个体效益的时间平均值根据个体效益、随机事件概率和在随机事件向量的条件下的动作概率动获得,在随机事件向量的条件下的动作概率为用户在随机事件向量发生的条件下执行动作向量的概率;每个用户的个体效益根据动作向量和随机事件向量获得;动作向量根据随机事件向量生成,随机事件向量根据蜂窝网络的容量模型、无人机网络的容量模型、用户可接入网络集合以及传输速率模型生成,用户可接入网络集合根据无人机网络的位置模型和用户的位置模型生成。
本发明提供的网络选择方法及装置,网络选择方法获取动态网络模型和动态用户模型,基于获取动态网络模型和动态用户模型生成随机事件向量,根据随机事件向量和动作向量构建第一选择模型,根据第一选择模型获得动作概率的数值,以根据动作概率的数值确定用户选择接入的网络。本发明构建了动态网络模型和动态用户模型,仿真了无人机和用户连接的高动态性,网络容量的波动性,和用户业务的时变性等特性。将网络选择问题构建为一个重复随机博弈问题,很好地仿真了用户间的相互竞争与相互影响。这种方法可以最大化总的用户效益,同时保证用户间的公平性。解决了由于蜂窝和无人机一体化网络具有高动态性并且网络状态难以预测,导致现有的基于博弈论的方法无法解决蜂窝和无人机一体化网络的选择问题的问题。
附图说明
图1为本发明提供的网络选择方法所基于网络的场景图;
图2为本发明根据一示例性实施例示出的网络选择方法的流程图;
图3为根据图2所示实施例示出的网络选择方法所服从的重复随机博弈结构的示意图;
图4为本发明根据一示例性实施例示出的蜂窝和无人机一体化网络的选择装置的结构示意图;
图5为本发明图4所示实施例示出的蜂窝和无人机一体化网络的选择装置中处理器所执行方法的流程图;
图6是用户数N=50,无人机的架数Md=6时,采用本发明提供的网络选择方法时稳定变量随时间的变化情况的示意图;
图7是无人机的架数Md=6时,用户数N对本发明提出的网络选择方法运行时间的影响的示意图;
图8是用户数N=50时,无人机的架数Md对本发明提出的网络选择方法运行时间的影响的示意图;
图9是无人机的架数Md=6时,用户数N对本发明提出的网络选择方法及对比方法获得总的用户效益的影响的示意图;
图10是用户数N=50时,无人机的架数Md对本发明提出的网络选择方法及对比方法获得总的用户效益的影响的示意图;
图11是无人机的架数Md=6时,用户数N对本发明提出的网络选择方法及对比方法获得简氏公平性指标的影响的示意图;
图12是用户数N=50时,无人机的架数Md对本发明提出的网络选择方法及对比方法获得简氏公平性指标的影响的示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
图1为本发明提供的网络选择方法所基于网络的场景图。如图1所示,本发明考虑一个蜂窝和无人机一体化网络的网络选择场景,在一个给定的面积为L×W m2的区域内,一组用户在无限的时隙序列t={0,1,2,...}上随机独立地移动,一个蜂窝网络103用于给这些用户提供无线接入,同时,一组无人机101被部署用于缓解蜂窝网络的拥塞情况。同时,本发明假设每架无人机都与地面站直接连接,独立地移动,并部署在相同固定的高度h。令表示网络的集合,其中,j=1表示蜂窝网络;表示第j个无人机网络;j=0表示空网络,代表用户没有接入任何网络。在每个时隙t,用户可以从可接入的网络集合中选择一个网络接入。同时,本发明不考虑当用户改变其接入状态时的切换代价。
图2为本发明根据一示例性实施例示出的网络选择方法的流程图。如图2所示,本发明提供的网络选择方法包括:
S101、获取动态网络模型和动态用户模型。
更具体地,动态网络模型至少包括:无人机网络的位置模型、蜂窝网络的容量模型以及无人机网络的容量模型,动态用户模型至少包括:用户的位置模型、传输速率模型。
针对网络覆盖特性,本实施例假设蜂窝网络可以覆盖整个给定区域,而一个无人机网络只能覆盖一个小的区域。具体地,每个无人机网络具有相同并有限的覆盖半径,记为Rd。令rij代表第i个用户和第j架无人机间的水平距离。若rij≤Rd,则第i个用户可以接入第j个无人机网络;否则,不能接入。
针对无人机网络的位置模型,本实施例引入一个具有反射边界的平滑转向移动模型。在此模型中,每架无人机以平滑、随机的轨迹飞行。具体地,假设无人机以恒定的前向速度Vd(单位:米每秒)飞行,并且随机地改变其向心加速度。无人机保持当前向心加速度的持续时间(单位:秒)服从均值为1/λd的指数分布。同时,无人机转弯半径(单位:米)的倒数服从均值为0,方差为的高斯分布。
针对网络容量模型,本实施例假设蜂窝网络在时隙t的网络容量,记为C1(t),服从限制在区间[μb-2σb,μb+2σb]上的截断高斯分布其中2σb<μb。同时本实施例假设,对于每个无人机网络其时隙t的网络容量Cj(t)是独立同分布,并且服从限制在区间[μc-2σc,μc+2σc]上的截断高斯分布其中2σc<μc。
针对用户的位置模型,本实施例基于高斯-马尔科夫移动模型设计了一个有界高斯-马尔科夫移动模型。具体地,在高斯-马尔科夫移动模型的基础上,本实施例考虑用户在一个矩形区域内移动,并在边界处反射。从而,在有界高斯-马尔科夫移动模型中,用户的位置lu(t)=((xu(t),yu(t))和用户的速度满足如下的更新公式:
lu(t+1)=(-1)k⊙(lu(t)+vu(t)-k⊙(L,W)) (1)
其中,⊙表示哈达马积(Hadamard product),表示向下取整运算,αu=(αux,αuy)为二维记忆级别向量,σu=(σux,σuy)为速度的二维渐进标准差向量,二维记忆级别向量和速度的二维渐进标准差向量均为常量,表示一个二维不相关高斯过程,并且和相互独立,均为零均值和单位方差。
针对用户的传输速率模型,本实施例假设在时隙t,每个用户的所需数据传输速率记为Ri(t)满足独立同分布,并且服从限制在区间[μR(t)-2σR(t),μR(t)+2σR(t)]上的截断高斯分布其中σR(t)=ρRμR(t),此外,μR(t)是一个在有限集合上取值的马尔科夫过程,并且本实施例定义它的一步转移概率矩阵为其中为给定其当前值为下一个时隙将转移到值的概率。
S102、根据无人机网络的位置模型和用户的位置模型生成用户可接入网络集合;根据蜂窝网络的容量模型、无人机网络的容量模型、用户可接入网络集合以及传输速率模型生成随机事件向量。
更具体地,假设本实施例提出的网络选择为一个重复随机博弈问题,图3为根据图2所示实施例示出的网络选择方法所服从的重复随机博弈结构的示意图。如图3所示,重复随机博弈结构包括环境201,博弈管理者202和若干博弈者203。本实施例中将N个用户视为博弈者203,将用户采取的网络选择策略视为动作。在每个时隙t∈{0,1,2,...},每个博弈者可以从环境201中观察到一个随机事件ωi(t)∈Ωi,而博弈管理者202可以从环境201中观察到全部的随机事件向量ω(t)=(ω0(t),ω1(t),...,ωN(t))∈Ω,其中,ω0(t)∈Ω0表示仅博弈管理者202知道的随机事件,Ω=Ω0×Ω1×…×ΩN。具体地,在本实施例中,仅博弈管理者202知道的随机事件ω0(t)包括蜂窝网络的容量和无人机网络的容量,即ω0(t)=(C1(t),C2(t),...,CM(t)),并对于所有的令其中,表示博弈者203-i可接入的非空网络的集合,即
S103、根据随机事件向量生成动作向量。
更具体地,动作向量用于表示用户选择接入无人机网络和/或蜂窝网络。当博弈管理者202在时隙t观察到随机事件向量ω(t)后,它向每个博弈者203-i发送一个建议其中,表示博弈者203-i可采用的动作的有限集合。例如,si(t)=j表示博弈管理者202建议博弈者203-i选择网络j。此外,为了方便表述,本实施例将简化为
对于每个博弈者它将基于建议si(t)选择动作例如,αi(t)=j表示博弈者203-i选择接入网络j。本实施例令s(t)=(s1(t),s2(t),...,sN(t))和α(t)=(α1(t),α2(t),...,αN(t))分别表示建议向量和动作向量,并定义
S104、根据动作向量和随机事件向量获得每个用户个体效益。
在时隙t,随机事件向量ω(t)和动作向量α(t)确定了每个博弈者203-i的个体效益ui(t)。形式上,个体效益ui(t)的表达式如下:
更明确地,本实施例采用如下表达式定义ui(t)。
其中,f(x)为有效传输比例函数,定义为:
S105、构建第一选择模型。
更具体地,随机事件向量ω(t)的概率密度函数,记为π(ω),定义如下:
由Pr[α|ω]的定义,本实施例定义变量表示个体效益ui(t)的时间平均值。由大数定理,若在每个时隙t,动作向量α(t)是根据相同的条件概率密度函数Pr[α|ω]独立地选择的,则可以保证,对于所有的 可以以概率1地(with probability 1,w.p.1)表达为如下形式:
此外,考虑到博弈管理者202的目标是制定Pr[α|ω]以最大化总的用户效益,同时保证用户间的公平性,本实施例为博弈管理者202设计了一个递增的,上凸的比例公平函数作为第一选择模型的第一目标函数。明确地,本实施例假设比例公平函数为对数函数的和:
参与:若博弈者203-i在每个时隙t∈{0,1,2,...}总是选择接受建议si(t),则称其为参与。也就是说,对于所有的t∈{0,1,2,...},αi(t)=si(t)。
不参与:若博弈者203-i在每个时隙t∈{0,1,2,...}通过其观察到的随机事件ωi(t)选择动作αi(t),则称其为不参与。
本实施例假设不参与的博弈者203不会收到建议si(t)。
为了激励所有博弈者203参与,博弈管理者202制定的Pr[α|ω]需要是一个粗相关均衡,其定义如下:
其中,表示动作向量α中除了αi的所有元素,为不参与的博弈者203-i预设的特定动作,υi∈Ωi为不参与的博弈者203-i预设的特定事件。直观地,表示不参与的博弈者203-i当观察到ωi=υi时,可以得到的最大条件期望效益。
由定义2,粗相关均衡约束(13)和(14)的总个数为是关于集合Ωi和大小的线性函数,其中|·|表示集合中元素数量。然而,在本实施例的系统模型中,的值过大,意味着粗相关均衡约束的计算复杂度很高。本实施例接下来讨论如何减少的值。
首先,本实施例简化预设事件υi的取值空间Ωi。根据本实施例中网络模型的描述,所有的无人机都是同质的。因此,针对预设事件υi,本实施例仅考虑用户可接入无人机网络的数量而不是它们索引的不同。并且,用户i被超过两架无人机同时覆盖的可能性较小,从而,的集合可以被简化为{0,1,2+},其中“0”,“1”和“2+”分别表示覆盖用户i的数量为0,1和不小于2。此外,针对预设事件υi,本实施例将区间分为KR段。若其中,ik=1,2,...,KR,则称Ri(t)属于第ik段。综上所述,本实施例将预设事件υi的取值空间Ωi简化为注:ωi的取值空间仍为Ωi,对于所有的ωi∈Ωi和约束(14)中的ωi=υi表示ωi为υi简化前的形式,约束(13)中的其中υi=ωi表示υi为ωi简化后的形式。
然后,本实施例简化预设动作βi的取值空间由于无人机的同质性,针对预设动作βi,本实施例不区分用户i选择接入的无人机网络的索引。同时由于当用户i在时隙t接入空网络时,由定义1,其个体效益ui(t)=0,因此本实施例不考虑接入空网络的预设动作,即βi≠0。从而,本实施例可以将预设动作βi的取值空间简化为其中“蜂窝”和“无人机”分别代表用户i选择接入蜂窝网络和无人机网络。此外,当用户i选择接入无人机网络时,其等概率地接入一个可接入的无人机网络。注:αi的取值空间仍为
从而,的值被减少为同时,当用户i没有可接入的无人机网络时,预设动作βi=无人机不可行。因此,本实施例忽略如下的预设事件-预设动作匹配:通过这种方式,的值被进一步减少为6KR-KR=5KR。最终,粗相关均衡(13)和(14)的总个数被减少为
在实际场景中,某些用户存在最小个体时间平均效益需求,本实施例将这些用户的集合记为Su。因此,博弈管理者202必须保证这些用户的效益满足最小时间平均效益约束:
基于上述分析,所构建的第一选择模型包括:第一目标函数和第一约束。第一约束包括:第一粗相关均衡约束、第一最小个体时间平均效益约束以及第一动作概率约束,第一选择模型具体如下:
S106、根据第一选择模型获得动作概率的数值,以根据动作概率的数值确定用户选择接入的网络。
博弈管理者202的目的是求解第一选择模型得到动作概率Pr[α|ω],并根据Pr[α|ω]选择建议向量s(t)=α(t),依据建议向量确定用户选择接入的网络。
在本实施例提供的网络选择方法中,获取动态网络模型和动态用户模型,基于获取动态网络模型和动态用户模型生成随机事件向量,根据随机事件向量和动作向量构建第一选择模型,根据第一选择模型获得动作概率的数值,以根据动作概率的数值确定用户选择接入的网络。解决了由于蜂窝和无人机一体化网络具有高动态性并且网络状态难以预测,导致现有的基于博弈论的方法无法解决蜂窝和无人机一体化网络的选择问题的问题。
尽管上述问题(16)是一个凸优化问题,但由于以下两个原因,其求解仍非常具有挑战性:1)π[ω]对于求解问题(16)是必不可少的,然而,由于π[ω]受网络容量,无人机和用户的移动,用户业务等各种因素的影响,其可能无法得到。2)变量Pr[α|ω]的规模为其随着用户数呈指数增长。为了解决这些问题,本实施例将这个具有挑战性的问题转换为一个新问题,新问题的规模大大降低,并且不需要知道π[ω]。
本实施例根据另一示例性实施例示出的网络选择方法,其与图2所示实施例存在的区别在于:在S104之后包括:
S1051、构建第二选择模型。
更具体地,对于一个时隙t∈{0,1,2,...}上的实值随机过程u(t),本实施例定义其前t时隙的时间平均期望为:
利用随机过程理论,本实施例将第一选择模型(16)等价转换为第二选择模型,其中,第二选择模型包括第二目标函数和第二约束,第二目标函数为以个体效益的时间平均期望为自变量的比例公平函数,第二约束至少包括第二粗相关均衡约束、第二最小个体时间平均效益约束以及第二辅助变量约束,第二粗相关均衡约束用于对个体效益的时间平均期望和第二辅助变量的时间平均期望进行约束,第二最小个体时间平均效益约束用于对个体效益的时间平均期望进行约束,第二辅助变量约束用于对第二辅助变量进行约束。在每个时隙t∈{0,1,2,...},博弈管理者202观察到随机事件向量ω(t)∈Ω,并对动作向量和变量求解,其中,表示在时隙t的第二辅助变量。
S106、根据第二选择模型获得动作向量的数值,以根据动作向量的数值确定用户选择接入的网络。
在本实施例提供的网络选择方法中,构建的第二选择模型基于个体效益的时间平均期望,可以在随机事件向量概率未知的情况下获得动作向量,以根据动作向量的数值确定用户选择接入的网络。
本实施例根据又一示例性实施例示出的网络选择方法,其与上一实施例存在的区别在于:在S1051之后,还包括:
S1052、构建第三选择模型;
更具体地,上述问题(19)的目标是最大化一个关于时间平均的非线性函数,为将其等价转换为最大化一个关于非线性函数的时间平均,本实施例引入第三辅助向量γ(t)=(γ1(t),...,γN(t)),其中,对于所有的并定义g(t)=φ(γ1(t),...,γN(t))。由琴生不等式,可以得到:
利用琴生不等式,本实施例将第二选择模型(19)等价转换为第三选择模型(21)。其中,第三选择模型包括第三目标函数和第三约束,第三目标函数(22.1)为以第三辅助变量为自变量的比例公平函数的时间平均期望,第三约束至少包括第二粗相关均衡约束(21.4)和(21.5)、第二最小个体时间平均效益约束(21.7)、第二辅助变量约束(21.6)以及第三辅助变量约束(21.2)和(21.3)。在每个时隙t∈{0,1,2,...},博弈管理者202观察到随机事件向量ω(t)∈Ω,并对动作向量变量和辅助向量γ(t)求解:
满足如下约束:
其中,第二粗相关均衡约束(21.4)和(21.5)对个体效益的时间平均期望和第二辅助变量的时间平均期望进行约束,第二最小个体时间平均效益约束(21.7)用于对个体效益的时间平均期望进行约束,第二辅助变量约束(21.6)用于对第二辅助变量进行约束,第三辅助变量约束(21.2)和(21.3)用于对第三辅助变量的时间平均期望与个体效益的时间平均期望进行约束;
S106、根据第三选择模型获得动作向量的数值,以根据动作向量的数值确定用户选择接入的网络。
在本实施例提供的网络选择方法中,以第三辅助变量为自变量的比例公平函数的时间平均期望作为第三目标函数,可以简化目标函数,便于根据第三选择模型获得动作向量。
本实施例根据另一示例性实施例示出的网络选择方法,其与上一实施例存在的区别在于:在S1052之后包括:
S1053、利用漂移加惩罚技术将第三选择模型转化为第四选择模型。
若以下平均速率稳定条件成立,则约束(21.1)满足:
其中,非负运算[x]+=max{x,0}。
Zi(t+1)=Zi(t)+γi(t)-ui(t) (25)
若以下平均速率稳定条件成立,则约束(21.5),(21.2)和(21.7)满足:
为了简单起见,本实施例假设所有虚拟队列均初始化为0。
由公式(22),(24),(25)和(26)可知,第一虚拟队列中当前时隙第一虚拟量根据第二粗相关均衡约束的前一时隙违反量和第一虚拟队列中前一时隙第一虚拟量生成。第二虚拟队列的当前时隙第二虚拟量根据第三辅助变量约束的前一时隙违反量和第二虚拟队列中前一时隙第二虚拟量生成,第三虚拟队列的当前时隙第三虚拟量根据第二最小个体时间平均效益约束的前一时隙违反量和第三虚拟队列中前一时隙第三虚拟量生成。
此外,本实施例定义漂移加惩罚表达式为Δ(t)-Vg(t),其中,Δ(t)=L(t+1)-L(t)表示李雅普诺夫漂移,即总违反量的漂移量,-g(t)代表“惩罚”,g(t)表示以第三辅助变量为自变量的比例公平函数,V为非负惩罚系数,其影响约束违反和最优性之间的权衡。漂移加惩罚表达式满足如下条件:最小化约束违反,最大化目标。因此,构建如下第四选择模型:
S106、根据第四选择模型获得动作向量的数值,以根据动作向量的数值确定用户选择接入的网络。
在本实施例提供的网络选择方法中,第四选择模型为不等式形式,模型简单,便于根据第四选择模型获得动作向量。
本实施例根据再又一示例性实施例示出的网络选择方法,其与上一实施例存在的区别在于:S106、根据第四选择模型获得动作向量的数值,以根据动作向量的数值确定用户选择接入的网络,具体包括如下步骤:
S1061、在每个时隙t,博弈管理者202观察到第一虚拟队列中当前时隙第一虚拟量第一项Qi(t),第一虚拟队列中当前时隙第一虚拟量第二项第二虚拟队列中当前时隙第二虚拟量Zi(t),第三虚拟队列中当前时隙第三虚拟量Hi(t)和随机事件向量ω(t)∈Ω。
本实施例通过在每个时隙t贪婪地最小化Δ(t)-Vg(t)的上界求解问题(21.1)。同时,Δ(t)-Vg(t)的上界可以分解为四个独立的项。在每个时隙t,第一项是常数,第二项关于第三辅助向量γ(t)的函数,第三项是关于第二辅助变量的函数,第四项是关于个体效益ui(t)和的函数。
S1064、根据当前时隙的随机事件向量、当前时隙第一虚拟量、当前时隙第二虚拟量、当前时隙第三虚拟量以及第三惩罚上界项选择求解动作向量α(t)的数值:
S1065、向每个博弈者203-i发送αi(t),以使博弈者203-i根据动作αi(t)确定选择接入的网络。
问题(36)是一个非线性整数规划问题,其中,ui(t)和是关于α(t)的复杂的非线性函数。求解问题(36)的遍历算法的复杂度是其随着用户数呈指数增长。尽管可以利用启发式算法(如遗传算法)近似求解该问题,但由于启发式算法收敛速度慢,可能需要较长的时间。为了加速优化过程,本实施例针对问题(36),设计了一种线性近似机制。
对于每个参与的博弈者若αi(t)=0,则由定义1,ui(t)=0。若αi(t)≠0,则由约束(37)和定义1,ui(t)=Ri(t)。因此,两种情况下的效益函数ui(t)可以通过如下方式计算,进而形成参与的博弈者的个体效益与传输速率之间映射表:
ui(t)=1{αi(t)≠0}Ri(t) (38)
对于每个不参与的博弈者每个和(βi≠0),本实施例考虑的定义(18)。若υi≠ωi(t),则若υi=ωi(t),则此时本实施例根据以下两种不同的情况估计进而形成不参与的博弈者的个体效益与传输速率之间映射表。
接下来,本实施例讨论如何通过引入一组辅助变量aij,其中,{aij}为建议矩阵,进而将问题(36)转换为一个整数线性规划问题。对于所有的和定义建议矩阵与动作向量的映射关系为:其中aij=1表示博弈管理者202建议博弈者203-i接入网络j,aij=0表示博弈管理者202建议博弈者203-i不接入网络j。由aij的定义和约束可以得到建议矩阵约束:
然后,利用变量aij代替(37)中的α(t),可以得到第二动作向量约束:
然后,利用变量aij代替(38)中的α(t),可以得到参与的博弈者的个体效益为:
根据(41)-(46),本实施例将问题(36)转换为如下整数线性规划问题:
其中,cij被定义为:
在初始时隙(t=0),由于所有的虚拟队列被初始化为零,因此所有权重cij将为零。为了解决这一问题,本实施例定义在时隙t=0的权重cij为:
问题(47)是一种关于辅助变量aij的整数线性规划问题,其可以利用MOSEK数学优化软件包(Mosek Optimization Tools)求解。此外,在MOSEK中,其利用分支定界法松弛整数变量,从而将整数线性优化问题松弛为可解的线性优化问题。
本实施例利用李雅普诺夫优化方法和线性近似机制对构建的问题进行转换,不需要预先知道网络和用户的状态概率π(ω),并极大地降低了问题的计算复杂度。
在求解问题(21.1)的主要框架的基础上,结合问题(32),(34)和(36)的求解方法,本发明提出了一种基于图4所示的高效公平的网络选择(Efficient and Fair NetworkSelection,EFNS)方法的蜂窝和无人机一体化网络的选择装置。
图4为本发明根据一示例性实施例示出的蜂窝和无人机一体化网络的选择装置的结构示意图。如图4所示,网络选择装置300包括收发机311和存储器312,收发机311用于收集无人机网络容量信息Cj(t),蜂窝网络容量信息C1(t)、用户可接入网络集合信息以及传输速率信息Ri(t),以形成随机事件向量ω(t)。此外,收发机311负责将博弈管理者202制定的建议动作信息发送到每个用户设备330。存储器312可以是任意形式的计算机可读入介质,用于存储参数,状态数据,动作数据和虚拟队列数据等信息。网络选择装置300还包括处理器313,处理器313可以是任意形式的中央处理单元,用于处理EFNS方法中的数据。具体地,处理器313根据无人机网络的容量信息、蜂窝网络的容量信息、用户可接入网络集合信息、数据传输速率信息以及第四选择模型获得动作向量。每个用户设备330中包含网络接入系统331,该系统用于根据接收到的动作向量,控制用户设备330选择网络接入。其中,第四选择模型已经在上述实施例中详细描述,在此不再赘述。
继续参考图4,本实施例提供的网络选择装置,还包括:人机交互模块314,人机交互模块314包括显示器和操作员输入接口,显示器可以向计算机操作员340显示结果,操作员输入接口可以从一个或多个输入设备(如键盘和鼠标等)获取计算机操作员340的输入信息。
继续参考图4,本实施例提供网络装置还包括:网络320。图5为本发明图4所示实施例示出的网络选择装置中处理器313所执行EFNS方法的流程图,如图5所示,处理器313执行如下动作:
接收当前时隙t的状态信息ω(t)和虚拟队列信息Qi(t),Zi(t),Hi(t),输出信息为当前时隙t博弈管理者202的建议动作向量α(t)和下一时隙t+1的虚拟队列信息Qi(t+1),Zi(t+1),Hi(t+1)。
更具体地,将其存储于存储器312中,这些参数可以预先给定默认值,并且计算机操作员340可以通过人机交互模块314修改这些参数。初始化虚拟队列Qi(0)=0,Zi(0)=0和Hi(0)=0,存储于存储器312。
在每个时隙t=0,1,...,T-1,重复步骤2-7,其中,T为总时隙数。
S202、收集网络和用户的状态信息以形成随机事件向量。
更具体地,处理器313通过收发机311收集网络和用户的状态信息ω(t)∈Ω。
具体地,ω(t)将暂时存储于存储器312直到步骤6结束。
S203、根据当前时隙第二虚拟量以及第一惩罚上界项获取第三辅助变量γi(t)。
S204、根据当前时隙的随机事件向量、当前时隙第一虚拟量以及第二惩罚上界项选择获取第二辅助变量。
S205、根据第四惩罚上界项、第二动作向量约束以及建议矩阵约束获取建议矩阵,根据建议矩阵获取动作向量。
更具体地,处理器313通过求解问题(47)得到建议矩阵{aij},根据建议矩阵{aij}获得动作向量α(t),然后收发机311将建议动作αi(t)发送给每个用户设备330-i的网络接入系统331,建议动作向量α(t)将暂时存储于存储器312直到步骤6结束。
S206、计算个体效益和第一虚拟队列至第三虚拟队列。
更具体地,处理器313分别根据公式(4)和(18)计算ui(t)和并分别根据公式(22),(24),(25)和(26)计算Qi(t+1),Zi(t+1)和Hi(t+1),更新存储器312中的虚拟队列。
S207、判断时隙t是否达到预设时隙值,若否,转入S208,否则,停止循环。
S208、更新时隙t,并转入步骤S201。
下面是利用本实施例提供的EFNS方法,实现针对蜂窝和无人机一体化网络的网络选择的一个仿真。
为了验证网络选择方法的有效性,本实施例设计了三个基准对比方法,只接入蜂窝(cellular-only,CO)方法,随机接入(random access,RA)方法与即时卸载(on-the-spotoffloading,OTSO)方法。对于CO方法,在每个时隙,每个用户总是选择接入蜂窝网络。对于RA方法,在每个时隙,每个用户总是等概率地随机接入可接入的网络。对于OTSO方法,在每个时隙,每个用户检查是否可以接入无人机网络,如果可以,则其等概率地随机接入一个可接入的无人机网络;否则,接入蜂窝网络。
仿真中的参数设置如下:所考虑的几何区域的大小为500×500m2,即,L=500m,W=500m。重复随机博弈持续1000秒,每个时隙的持续时间为1秒,因此,仿真运行1000个循环,即,T=1000。在无人机网络的位置模型中,无人机的初始位置独立均匀地分布在所考虑区域,初始方向独立均匀地分布在[0,2π)上,参数在网络容量模型中,蜂窝网络的容量(Mb/s)服从一个截断的高斯分布Ntru(200,202,±40),每个无人机网络的容量独立并服从一个截断的高斯分布Ntru(30,32,±6)。此外,无人机的覆盖半径Rd=100m。
在用户的位置模型中,用户的初始位置独立均匀地分布在所考虑区域,初始速度独立并服从二维高斯分布N(0,0;22,22,0),参数αu=(0.73,0.73),σu=(2,2)。在用户的传输速率模型中,参数ρR=0.2,过程μR(t)(Mb/s)从集合{μ1,μ2,...,μ5}={2.5,5,7.5,10,12.5}中取值,μR(t)的一步转移概率矩阵P如表1所示:
表1 μR(t)的一步转移概率矩阵P
0.8 | 0.2 | 0 | 0 | 0 |
0.2 | 0.6 | 0.2 | 0 | 0 |
0 | 0.2 | 0.6 | 0.2 | 0 |
0 | 0 | 0.2 | 0.6 | 0.2 |
0 | 0 | 0 | 0.2 | 0.8 |
同时,本实施例采用如下四个指标评价所提出方法的性能,包括:
运行时间:执行EFNS方法T=1000次循环的总时间。
在仿真中,本实施例在随机生成的100组数据集上测试所有的比较方法。对于每个比较方法,本实施例可以得到100个结果,并且最终结果是它们的平均值。
图6给出了用户数N=50,无人机的架数Md=6时,采用本发明提供的网络选择方法时稳定变量随时间的变化情况,由图6可知:
随着时隙t的增长,所有的稳定变量的值迅速降低,经过一段很长的时间,所有的稳定变量趋于0。这一结果说明EFNS方法可以保证所有队列平均速率稳定,从而约束(21.2)、(21.4)、(21.5)和(21.7)得以满足。
图7给出了无人机的架数Md=6时,用户数N对本发明提出的网络选择方法运行时间的影响;图8给出了用户数N=50时,无人机的架数Md对本发明提出的网络选择方法运行时间的影响。由图7和图8可知:
EFNS方法的平均运行时间随着N或Md的增加而增加。这是因为当N或Md增加时,问题的规模变大。EFNS方法可以实现在线的网络选择。
图9给出了无人机的架数Md=6时,用户数N对本发明提出的网络选择方法及对比方法获得总效益的影响;图10给出了用户数N=50时,无人机的架数Md对本发明提出的网络选择方法及对比方法获得总效益的影响。由图9和图10可知:
EFNS方法总可以实现最高的总效益。这是因为EFNS方法在避免网络拥塞的同时充分利用了网络资源。
EFNS方法的总效益随着N的增加而增长,但因为当N较大时,网络容量限制总效益的增长,因此其增长速率下降。其他三种方法的总效益随着N的增加很快开始下降,这是因为这三种方法没有避免网络拥塞的机制而大量的用户将会导致网络拥塞。
除了CO方法,所有方法的总效益随着Md的增加单调增加,这是因为用户可以将业务卸载到无人机网络上。
图11给出了无人机的架数Md=6时,用户数N对本发明提出的网络选择方法及对比方法获得简氏公平性指标的影响;图12给出了用户数N=50时,无人机的架数Md对本发明提出的网络选择方法及对比方法获得简氏公平性指标的影响。由图11和图12可知:
EFNS方法可以实现高的公平性。具体地,因为在比例公平函数(12)中考虑了网络资源的公平分配,EFNS方法的公平性指标接近1。然而,随着N的增加或Md的减少,EFNS方法的公平性指标逐渐下降,这是因为较大的N或较小的Md会激活最小时间平均效益约束。
尽管RA和OTSO方法没有考虑公平性,这两种方法依然可以实现高的公平性。这是因为在本实施例的模型中,用户具有同质性,因此在一段很长的时间后,用户的平均效益接近。
CO方法可以实现最高的公平性。这是因为在每个时隙,所有的用户总是具有相同的有效传输比例。然而,CO方法的总效益最低。
最后应说明的是:以上各实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述各实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的范围。
Claims (9)
1.一种蜂窝和无人机一体化网络的选择方法,其特征在于,包括:
获取动态网络模型和动态用户模型;其中,所述动态网络模型至少包括:无人机网络的位置模型、蜂窝网络的容量模型以及无人机网络的容量模型,所述动态用户模型至少包括:用户的位置模型、传输速率模型;
根据所述无人机网络的位置模型和所述用户的位置模型生成用户可接入网络集合;根据所述蜂窝网络的容量模型、所述无人机网络的容量模型、所述用户可接入网络集合以及所述传输速率模型生成随机事件向量;其中,所述用户可接入网络集合包括所述无人机网络和/或所述蜂窝网络;
根据所述随机事件向量生成动作向量;其中,所述动作向量用于表示所述用户选择接入所述无人机网络和/或所述蜂窝网络;
根据所述动作向量和所述随机事件向量获得每个用户的个体效益;
构建第一选择模型;其中,所述第一选择模型包括:第一目标函数和第一约束,所述第一目标函数为以所述个体效益的时间平均值为自变量的比例公平函数,所述第一约束至少包括:第一粗相关均衡约束、第一最小个体时间平均效益约束以及第一动作概率约束,所述第一粗相关均衡约束用于对所述个体效益的时间平均值和第一辅助变量进行约束,所述第一最小个体时间平均效益约束用于对所述个体效益的时间平均值进行约束,所述第一动作概率约束用于对在随机事件向量的条件下的动作概率进行约束;所述个体效益的时间平均值根据所述个体效益、随机事件概率和在随机事件向量的条件下的动作概率获得,所述在随机事件向量的条件下的动作概率为所述用户在随机事件向量发生的条件下执行所述动作向量的概率;所述随机事件概率为随机事件向量发生的概率;
根据所述第一选择模型获得所述动作概率的数值,以根据所述动作概率的数值确定用户选择接入的网络;
所述第一粗相关均衡约束具体包括:
其中,ω表示所述随机事件向量,α表示所述动作向量,π[ω]表示所述随机事件向量概率,Pr[α|ω]表示所述在随机事件向量的条件下的动作概率,表示第i个用户的个体效益,和均表示第一辅助变量,αi表示第i个用户选择接入网络j=αi,ωi表示随机事件向量中第i个元素,υi表示第i个用户的预设事件,βi表示第i个用户的预设动作,表示动作向量的可选集,Ω表示随机事件向量的可选集,表示第i个用户的预设动作的简化后可选集,表示第i个用户的预设事件的简化后可选集;
所述第一动作概率约束具体包括:
2.根据权利要求1所述的方法,其特征在于,在所述根据所述动作向量和所述随机事件向量获得每个用户的个体效益之后,还包括:
构建第二选择模型,其中,所述第二选择模型包括第二目标函数和第二约束,所述第二目标函数为以所述个体效益的时间平均期望为自变量的比例公平函数,所述第二约束至少包括第二粗相关均衡约束、第二最小个体时间平均效益约束以及第二辅助变量约束,所述第二粗相关均衡约束用于对所述个体效益的时间平均期望和所述第二辅助变量的时间平均期望进行约束,所述第二最小个体时间平均效益约束对所述个体效益的时间平均期望进行约束,所述第二辅助变量约束用于对所述第二辅助变量进行约束;
根据所述第二选择模型获得所述动作向量的数值,以根据所述动作向量的数值确定用户选择接入的网络。
3.根据权利要求2所述的方法,其特征在于,在所述根据所述动作向量和所述随机事件向量获得每个用户的个体效益之后,还包括:
根据第二选择模型构建第三选择模型;其中,所述第三选择模型包括第三目标函数和第三约束,所述第三目标函数为以第三辅助变量为自变量的比例公平函数的时间平均期望,所述第三约束至少包括第二粗相关均衡约束、第二最小个体时间平均效益约束、第二辅助变量约束以及第三辅助变量约束,所述第二辅助变量约束用于对所述第二辅助变量进行约束,所述第三辅助变量约束用于对所述第三辅助变量的时间平均期望与所述个体效益的时间平均期望进行约束;
根据所述第三选择模型获得所述动作向量的数值,以根据所述动作向量的数值确定用户选择接入的网络。
4.根据权利要求3所述的方法,其特征在于,在所述构建第三选择模型之后,还包括:
构建第四选择模型;
根据所述第四选择模型获得所述动作向量的数值,以根据所述动作向量的数值确定用户选择接入的网络;
其中,所述第四选择模型为总违反量的漂移与收益的差值小于等于惩罚上界量;
所述总违反量的漂移根据所述总违反量的当前时隙的数值和所述总违反量的后一时隙的数值获得;所述总违反量的当前时隙的数值根据当前时隙第一虚拟量、当前时隙第二虚拟量以及当前时隙第三虚拟量获得;所述第一虚拟队列中当前时隙第一虚拟量根据所述第二粗相关均衡约束的前一时隙违反量和第一虚拟队列中前一时隙第一虚拟量生成,所述第二虚拟队列的当前时隙第二虚拟量根据所述第三辅助变量约束的前一时隙违反量和第二虚拟队列中前一时隙第二虚拟量生成,所述第三虚拟队列的当前时隙第三虚拟量根据所述第二最小个体时间平均效益约束的前一时隙违反量和第三虚拟队列中前一时隙第三虚拟量生成,其中,初始时隙第一虚拟量、初始时隙第二虚拟量以及初始时隙第三虚拟量均为零;
所述收益包括:以第三辅助变量为自变量的比例公平函数和惩罚系数;
所述惩罚上界量包括:常数项、第一惩罚上界项、第二惩罚上界项以及第三惩罚上界项,所述第一惩罚上界项包括所述第三辅助变量和所述第二虚拟量,所述第二惩罚上界项包括所述第二辅助变量和所述第一虚拟量,第三惩罚上界项包括所述个体效益、所述第一虚拟量、所述第二虚拟量以及所述第三虚拟量。
5.根据权利要求4所述的方法,其特征在于,所述根据所述第四选择模型获得所述动作向量的数值,以根据所述动作向量的数值确定用户选择接入的网络,具体包括:
获取所述当前时隙第一虚拟量、所述当前时隙第二虚拟量、所述当前时隙第三虚拟量以及所述当前时隙的随机事件向量;
根据所述当前时隙第二虚拟量以及所述第一惩罚上界项获得所述第三辅助变量的数值;
根据所述当前时隙的随机事件向量、所述当前时隙第一虚拟量以及所述第二惩罚上界项获得所述第二辅助变量的数值;
根据所述当前时隙的随机事件向量、所述当前时隙第一虚拟量、所述当前时隙第二虚拟量、所述当前时隙第三虚拟量以及所述第三惩罚上界项获得所述动作向量的数值,以根据所述动作向量的数值确定用户选择接入的网络;
所述根据所述当前时隙的随机事件向量、所述当前时隙第一虚拟量、所述当前时隙第二虚拟量、所述当前时隙第三虚拟量以及所述第三惩罚上界项获得所述动作向量的数值,具体包括:
构建建议矩阵约束和第一动作向量约束,其中,所述建议矩阵表示建议用户接入所述无人机网络和/或所述蜂窝网络,所述建议矩阵约束用于对所述建议矩阵进行约束;
利用所述个体效益与所述传输速率之间映射表和所述建议矩阵与所述动作向量的映射关系对所述第三惩罚上界项进行处理,生成第四惩罚上界项;
利用所述建议矩阵与所述动作向量的映射关系对所述第一动作向量约束进行处理,获得第二动作向量约束;
根据所述第四惩罚上界项、所述建议矩阵约束以及所述第二动作向量约束获得所述建议矩阵的数值,根据所述建议矩阵的数值确定用户选择接入的网络。
6.根据权利要求3所述的方法,其特征在于,
所述第二粗相关均衡约束具体包括:
所述第二最小个体时间平均效益约束具体包括:
所述第二辅助变量约束具体包括:
所述第二粗相关均衡约束具体包括:
所述第二最小个体时间平均效益约束具体包括:
所述第二辅助变量约束具体包括:
所述第三辅助变量约束具体包括:
9.一种蜂窝和无人机一体化网络的选择装置,其特征在于,包括:
收发机,用于获取无人机网络的容量信息、蜂窝网络的容量信息、用户可接入网络集合信息以及传输速率信息,以及向用户发送动作向量信息,以使用户根据动作向量信息确定接入网络;
处理器,根据所述无人机网络的容量信息、所述蜂窝网络的容量信息、所述用户可接入网络集合信息、所述传输速率信息以及第四选择模型生成所述动作向量信息;
其中,所述第四选择模型为总违反量的漂移与收益的差值小于等于惩罚上界量;所述总违反量的漂移根据所述总违反量的当前时隙的数值和所述总违反量的后一时隙的数值获得;所述总违反量的当前时隙的数值根据当前时隙第一虚拟量、当前时隙第二虚拟量以及当前时隙第三虚拟量获得;所述第一虚拟队列中当前时隙第一虚拟量根据第二粗相关均衡约束的前一时隙违反量和第一虚拟队列中前一时隙第一虚拟量生成,所述第二虚拟队列的当前时隙第二虚拟量根据第三辅助变量约束的前一时隙违反量和第二虚拟队列中前一时隙第二虚拟量生成,所述第三虚拟队列的当前时隙第三虚拟量根据第二最小个体时间平均效益约束的前一时隙违反量和第三虚拟队列中前一时隙第三虚拟量生成,其中,初始时隙第一虚拟量、初始时隙第二虚拟量以及初始时隙第三虚拟量均为零;
第三选择模型包括第三目标函数和第三约束,所述第三目标函数为以第三辅助变量为自变量的比例公平函数的时间平均期望,所述第三约束至少包括第二粗相关均衡约束、第二最小个体时间平均效益约束、第二辅助变量约束以及第三辅助变量约束,所述第二粗相关均衡约束用于对所述个体效益的时间平均期望和所述第二辅助变量的时间平均期望进行约束,所述第二最小个体时间平均效益约束用于对所述个体效益的时间平均期望进行约束,所述第二辅助变量约束用于对所述第二辅助变量进行约束,所述第三辅助变量约束用于对所述第三辅助变量的时间平均期望与所述个体效益的时间平均期望进行约束;
第一选择模型包括:第一目标函数和第一约束,所述第一目标函数为以个体效益的时间平均值为自变量的比例公平函数,所述第一约束至少包括:第一粗相关均衡约束、第一最小个体时间平均效益约束以及第一动作概率约束,所述第一粗相关均衡约束用于对所述个体效益的时间平均值和第一辅助变量进行约束,所述第一最小个体时间平均效益约束用于对所述个体效益的时间平均值进行约束,所述第一动作概率约束用于对在随机事件向量的条件下的动作概率进行约束;所述个体效益的时间平均值根据所述个体效益、随机事件概率和在随机事件向量的条件下的动作概率获得,所述在随机事件向量的条件下的动作概率为所述用户在随机事件向量发生的条件下执行所述动作向量的概率;每个用户的个体效益根据动作向量和随机事件向量获得;所述动作向量根据所述随机事件向量生成,随机事件向量根据所述蜂窝网络的容量模型、所述无人机网络的容量模型、所述用户可接入网络集合以及所述传输速率模型生成,所述用户可接入网络集合根据所述无人机网络的位置模型和所述用户的位置模型生成;
所述第一粗相关均衡约束具体包括:
其中,ω表示所述随机事件向量,α表示所述动作向量,π[ω]表示所述随机事件向量概率,Pr[α|ω]表示所述在随机事件向量的条件下的动作概率,表示第i个用户的个体效益,和均表示第一辅助变量,αi表示第i个用户选择接入网络j=αi,ωi表示随机事件向量中第i个元素,υi表示第i个用户的预设事件,βi表示第i个用户的预设动作,表示动作向量的可选集,Ω表示随机事件向量的可选集,表示第i个用户的预设动作的简化后可选集,表示第i个用户的预设事件的简化后可选集;
所述第一动作概率约束具体包括:
所述第四选择模型具体包括:
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811353219.4A CN109495952B (zh) | 2018-11-14 | 2018-11-14 | 一种蜂窝和无人机一体化网络的选择方法及装置 |
US16/675,060 US11102717B2 (en) | 2018-11-14 | 2019-11-05 | Network selection method and apparatus for integrated cellular and drone-cell networks |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811353219.4A CN109495952B (zh) | 2018-11-14 | 2018-11-14 | 一种蜂窝和无人机一体化网络的选择方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN109495952A CN109495952A (zh) | 2019-03-19 |
CN109495952B true CN109495952B (zh) | 2020-04-24 |
Family
ID=65696069
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201811353219.4A Expired - Fee Related CN109495952B (zh) | 2018-11-14 | 2018-11-14 | 一种蜂窝和无人机一体化网络的选择方法及装置 |
Country Status (2)
Country | Link |
---|---|
US (1) | US11102717B2 (zh) |
CN (1) | CN109495952B (zh) |
Families Citing this family (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110677917B (zh) * | 2019-09-30 | 2021-07-13 | 北京信成未来科技有限公司 | 一种基于cs-aloha的无人机测控蜂窝通信方法 |
JP7187423B2 (ja) * | 2019-11-07 | 2022-12-12 | Hapsモバイル株式会社 | 制御装置、プログラム、及び制御方法 |
CN111935303B (zh) * | 2020-08-21 | 2023-05-26 | 华北电力大学 | 空地一体化车联网中基于意图感知的任务卸载方法 |
CN112865855B (zh) * | 2021-01-04 | 2022-04-08 | 福州大学 | 基于无人机中继的高效无线隐蔽传输方法 |
CN112996117B (zh) * | 2021-02-02 | 2023-02-07 | 清华大学 | 卫星无人机协同覆盖网络中的安全通信方法及装置 |
CN113676917B (zh) * | 2021-08-25 | 2022-05-10 | 南京航空航天大学 | 基于博弈论的无人机分层移动边缘计算网络的能耗优化方法 |
CN114501307B (zh) * | 2021-12-31 | 2024-03-29 | 杭州电子科技大学 | 基于改进纳什均衡策略的无人机回程传输控制方法 |
CN114630397B (zh) * | 2022-03-01 | 2023-10-27 | 深圳拓扑视通科技有限公司 | 一种基于时隙划分的无人机接入选择方法 |
CN114501551B (zh) * | 2022-04-02 | 2022-07-01 | 中国人民解放军军事科学院国防科技创新研究院 | 基于有序势博弈的多用户分布式异构网络选择策略方法 |
CN114745666B (zh) * | 2022-06-09 | 2022-08-30 | 南京信息工程大学 | 一种用于拥挤场馆中无人机辅助边缘计算方法 |
CN115426635B (zh) * | 2022-11-01 | 2023-03-03 | 北京航空航天大学 | 一种不可靠传输场景下无人机通信网络推断方法及系统 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103332290A (zh) * | 2013-05-28 | 2013-10-02 | 北京航空航天大学 | 一种机翼结构-太阳能电池一体化模块及其研制方法 |
CN106054928A (zh) * | 2016-05-18 | 2016-10-26 | 中国计量大学 | 一种基于无人机网络的全地域火灾发生测定方法 |
CN106604205A (zh) * | 2016-11-18 | 2017-04-26 | 重庆零度智控智能科技有限公司 | 终端通讯方法、无人机通讯方法及装置 |
Family Cites Families (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10207590B2 (en) * | 2015-10-15 | 2019-02-19 | T-Mobile Usa, Inc. | Dynamic wireless communications network with a plurality of aerial drones |
US10789853B2 (en) * | 2016-06-10 | 2020-09-29 | ETAK Systems, LLC | Drone collision avoidance via air traffic control over wireless networks |
US11768125B2 (en) * | 2016-06-10 | 2023-09-26 | Metal Raptor, Llc | Drone package load balancing with weights |
US11263909B2 (en) * | 2016-06-10 | 2022-03-01 | Metal Raptor, Llc | Air traffic control of passenger drones concurrently using a plurality of wireless networks |
US10720066B2 (en) * | 2016-06-10 | 2020-07-21 | ETAK Systems, LLC | Flying lane management with lateral separations between drones |
US20180007518A1 (en) * | 2016-07-01 | 2018-01-04 | David T. O'Berry | Drone Assisted Mesh Network For First Responders |
US10020872B2 (en) * | 2016-10-11 | 2018-07-10 | T-Mobile Usa, Inc. | UAV for cellular communication |
US9866313B1 (en) * | 2016-12-14 | 2018-01-09 | T-Mobile Usa, Inc. | UAV cellular communication service delivery |
US10862917B2 (en) * | 2017-04-21 | 2020-12-08 | Cisco Technology, Inc. | Network resource implementation prioritization |
CN107483715B (zh) * | 2017-07-04 | 2021-03-02 | 上海小蚁科技有限公司 | 终端与设备通信的方法和系统、终端、存储介质 |
CN107517158B (zh) * | 2017-08-29 | 2019-05-17 | 北京航空航天大学 | 无人机通信网络联合路由协议的设计方法 |
WO2019203884A1 (en) * | 2018-04-18 | 2019-10-24 | Battelle Energy Alliance, Llc | Systems, devices and methods for communicating data with unmanned aerial vehicles using an underlay broadcast channel |
US20200202284A1 (en) * | 2018-12-21 | 2020-06-25 | Ford Global Technologies, Llc | Systems, methods, and devices for item delivery using unmanned aerial vehicles |
US11370539B2 (en) * | 2019-01-14 | 2022-06-28 | Ford Global Technologies, Llc | Systems, methods, and devices for unmanned aerial vehicle recovery |
US10939408B2 (en) * | 2019-02-12 | 2021-03-02 | Samsung Electronics Co., Ltd. | Method and system for positioning low altitude platform station (LAPS) drone cells |
US10932123B2 (en) * | 2019-03-26 | 2021-02-23 | Verizon Patent And Licensing Inc. | Systems and methods for temporary wireless data service |
-
2018
- 2018-11-14 CN CN201811353219.4A patent/CN109495952B/zh not_active Expired - Fee Related
-
2019
- 2019-11-05 US US16/675,060 patent/US11102717B2/en active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103332290A (zh) * | 2013-05-28 | 2013-10-02 | 北京航空航天大学 | 一种机翼结构-太阳能电池一体化模块及其研制方法 |
CN106054928A (zh) * | 2016-05-18 | 2016-10-26 | 中国计量大学 | 一种基于无人机网络的全地域火灾发生测定方法 |
CN106604205A (zh) * | 2016-11-18 | 2017-04-26 | 重庆零度智控智能科技有限公司 | 终端通讯方法、无人机通讯方法及装置 |
Also Published As
Publication number | Publication date |
---|---|
US11102717B2 (en) | 2021-08-24 |
CN109495952A (zh) | 2019-03-19 |
US20200154349A1 (en) | 2020-05-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109495952B (zh) | 一种蜂窝和无人机一体化网络的选择方法及装置 | |
Ghobaei-Arani et al. | An autonomous resource provisioning framework for massively multiplayer online games in cloud environment | |
CN108009016B (zh) | 一种资源负载均衡控制方法及集群调度器 | |
CN111400001B (zh) | 一种面向边缘计算环境的在线计算任务卸载调度方法 | |
CN107239336B (zh) | 一种实现任务调度的方法及装置 | |
Delasay et al. | Modeling load and overwork effects in queueing systems with adaptive service rates | |
CN106446959A (zh) | 一种云计算资源动态匹配方法及装置 | |
CN110147274A (zh) | 多目标云任务均衡调度方法、服务器及存储介质 | |
Li et al. | Minimax-optimal multi-agent RL in Markov games with a generative model | |
Scalas et al. | Statistical equilibrium in simple exchange games I: Methods of solution and application to the Bennati-Dragulescu-Yakovenko (BDY) game | |
Guo et al. | Average optimality for continuous-time Markov decision processes in Polish spaces | |
CN114676892A (zh) | 一种基于智能匹配的服务派单方法、系统及设备 | |
CN112494935A (zh) | 一种云游戏平台池化方法、电子设备及存储介质 | |
CN116880968A (zh) | 一种作业调度方法及调度系统 | |
CN116700984A (zh) | 一种基于云游戏服务的动态防入侵的资源调度系统 | |
CN106506229A (zh) | 一种sbs云应用自适应资源优化调整系统及方法 | |
Bhattacharyya et al. | QFlow: A learning approach to high QoE video streaming at the wireless edge | |
CN116501483A (zh) | 基于多智能体强化学习的车辆边缘计算任务调度方法 | |
CN110286854A (zh) | 群成员管理和群消息处理的方法、装置、设备及存储介质 | |
Weng et al. | Dynamic resource allocation for MMOGs in cloud computing environments | |
CN110475295B (zh) | 一种超密集组网的信息传输速率控制方法及装置 | |
CN114927237A (zh) | 一种带容量限制的疾病预防控制疾控设施配置方法 | |
CN114693141A (zh) | 一种基于端边协同的变电站巡检方法 | |
CN116360929A (zh) | 针对交互式应用的服务质量感知的多渲染任务调度方法 | |
Khojasteh et al. | Prioritization of overflow tasks to improve performance of mobile cloud |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20200424 Termination date: 20201114 |