CN108718463A - 一种h-cran下基于多时间尺度协同优化的资源分配方法 - Google Patents
一种h-cran下基于多时间尺度协同优化的资源分配方法 Download PDFInfo
- Publication number
- CN108718463A CN108718463A CN201810437109.XA CN201810437109A CN108718463A CN 108718463 A CN108718463 A CN 108718463A CN 201810437109 A CN201810437109 A CN 201810437109A CN 108718463 A CN108718463 A CN 108718463A
- Authority
- CN
- China
- Prior art keywords
- time scale
- resource block
- resource allocation
- interference
- network
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000013468 resource allocation Methods 0.000 title claims abstract description 54
- 238000005457 optimization Methods 0.000 title claims abstract description 32
- 238000000034 method Methods 0.000 title claims abstract description 25
- 230000033001 locomotion Effects 0.000 claims abstract description 19
- 230000006854 communication Effects 0.000 claims description 46
- 238000004891 communication Methods 0.000 claims description 37
- 238000013528 artificial neural network Methods 0.000 claims description 36
- 230000009471 action Effects 0.000 claims description 12
- 238000012545 processing Methods 0.000 claims description 12
- 241001093501 Rutaceae Species 0.000 claims description 9
- 230000002787 reinforcement Effects 0.000 claims description 8
- 230000006870 function Effects 0.000 claims description 6
- 230000009191 jumping Effects 0.000 claims description 6
- 210000002569 neuron Anatomy 0.000 claims description 6
- 238000013507 mapping Methods 0.000 claims description 3
- 230000011664 signaling Effects 0.000 claims description 3
- 238000004364 calculation method Methods 0.000 claims description 2
- 230000007774 longterm Effects 0.000 abstract description 2
- 230000000007 visual effect Effects 0.000 abstract 1
- 238000010586 diagram Methods 0.000 description 5
- 230000005540 biological transmission Effects 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 4
- 238000011160 research Methods 0.000 description 3
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
- 230000003595 spectral effect Effects 0.000 description 1
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04W—WIRELESS COMMUNICATION NETWORKS
- H04W72/00—Local resource management
- H04W72/04—Wireless resource allocation
- H04W72/044—Wireless resource allocation based on the type of the allocated resource
- H04W72/0453—Resources in frequency domain, e.g. a carrier in FDMA
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04W—WIRELESS COMMUNICATION NETWORKS
- H04W72/00—Local resource management
- H04W72/04—Wireless resource allocation
- H04W72/044—Wireless resource allocation based on the type of the allocated resource
- H04W72/0473—Wireless resource allocation based on the type of the allocated resource the resource being transmission power
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04W—WIRELESS COMMUNICATION NETWORKS
- H04W72/00—Local resource management
- H04W72/50—Allocation or scheduling criteria for wireless resources
- H04W72/53—Allocation or scheduling criteria for wireless resources based on regulatory allocation policies
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04W—WIRELESS COMMUNICATION NETWORKS
- H04W72/00—Local resource management
- H04W72/50—Allocation or scheduling criteria for wireless resources
- H04W72/54—Allocation or scheduling criteria for wireless resources based on quality criteria
- H04W72/541—Allocation or scheduling criteria for wireless resources based on quality criteria using the level of interference
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04W—WIRELESS COMMUNICATION NETWORKS
- H04W72/00—Local resource management
- H04W72/50—Allocation or scheduling criteria for wireless resources
- H04W72/54—Allocation or scheduling criteria for wireless resources based on quality criteria
- H04W72/542—Allocation or scheduling criteria for wireless resources based on quality criteria using measured or perceived quality
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04W—WIRELESS COMMUNICATION NETWORKS
- H04W72/00—Local resource management
- H04W72/50—Allocation or scheduling criteria for wireless resources
- H04W72/54—Allocation or scheduling criteria for wireless resources based on quality criteria
- H04W72/543—Allocation or scheduling criteria for wireless resources based on quality criteria based on requested quality, e.g. QoS
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D30/00—Reducing energy consumption in communication networks
- Y02D30/70—Reducing energy consumption in communication networks in wireless communication networks
Landscapes
- Engineering & Computer Science (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- Quality & Reliability (AREA)
- Mobile Radio Communication Systems (AREA)
Abstract
本发明公开了一种H‑CRAN下基于多时间尺度协同优化的资源分配方法,将资源分配视为大时间尺度—小时间尺度的双层模型:从大时间尺度角度,根据用户移动轨迹等长期平均信息,通过查询和匹配专家系统的先验知识,建立基于专家系统的大时间尺度资源分配模型;从小时间尺度角度,根据信道质量等短期瞬时信息,利用深度强化学习的自学习和自优化特性,建立基于深度强化学习的小时间尺度资源分配模型;从协同优化角度,基于主从博弈的视角,建立以大时间尺度为主、小时间尺度为从的协同优化资源分配模型,实现异构云无线接入网络的资源分配。
Description
技术领域
本发明涉及一种H-CRAN下基于多时间尺度协同优化的资源分配方法,属于网络资源分配技术领域。
背景技术
移动互联网不断地在改变人类生活的方方面面,智能终端几乎成为人类生活的必需品,移动端流量以惊人的速度增长,人类对于高速率应用的需求日益提高,如超高清视频、无人驾驶等,于是5G应运而生。相比于4G系统,5G旨在实现峰值速率至少100倍的增长,频谱效率和能源效率至少10倍的增长,覆盖容量至少25倍的增长。为了真正实现上述目标,网络架构是首先需要考虑的问题,网络架构在一定程度上主导着技术的研究和实施,对网络性能起着至关重要的作用。
异构云无线接入网络(Heterogeneous cloud radio access network,H-CRAN),借鉴异构网络(Heterogeneous network,HetNet)中通过宏基站实现控制和业务分离以及云无线接入网络(Cloud radio access network,C-RAN)中射频拉远头(Remote RadioHead,RRH)高效支撑局部业务的特征,联合HetNet和C-RAN各自优点,充分利用大规模实时云计算处理能力,进一步提升了网络整体性能,成为5G的候选网络架构。但是由于宏基站的引入,宏基站与RRH间的干扰成为限制网络性能提升的主要因素。与此同时,传统的正交多址接入技术中一个正交资源只允许分配一个用户,这也严重限制了网络吞吐量和用户连接数。
发明内容
为解决现有技术的不足,本发明的目的在于提供一种H-CRAN下基于多时间尺度协同优化的资源分配方法,以新型的非正交多址接入技术为基础,综合考虑宏基站与RRH间的干扰,建立异构云无线接入网络下基于多时间尺度协同优化的资源分配模型,实现异构云无线接入网络资源的均衡分配。
为了实现上述目标,本发明采用如下的技术方案:
一种H-CRAN下基于多时间尺度协同优化的资源分配方法,其特征是,包括如下步骤:
1)大时间尺度资源分配,用于频点和带宽的均衡分配:大数据处理得到用户移动轨迹Γ和网络流量Φ,得到最优的频点Nf和带宽B;
2)小时间尺度资源分配,用于资源块和发射功率的均衡分配,大数据处理得到信道质量H,利用H计算得到信干噪比γ;
3)结合步骤1)和2)进行协同优化,用于多时间尺度的协同优化;
前述的一种H-CRAN下基于多时间尺度协同优化的资源分配方法,其特征是,所述步骤1)的具体步骤为:
步骤11)分析用户移动轨迹Γ、网络流量Φ与频点Nf及带宽B之间的映射关系,并作为先验知识建立专家系统,用于频点Nf及带宽B的分配;
步骤12)测量并记录网络参数,大数据处理得到用户移动轨迹Γ和网络流量Φ;
步骤13)在专家系统中匹配实际的用户移动轨迹Γ和网络流量Φ,得到最相关的先验知识,进而得到频点Nf和带宽B。
前述的一种H-CRAN下基于多时间尺度协同优化的资源分配方法,其特征是,所述步骤2)的具体内容为:
大数据处理得到信道质量H,利用H计算得到信干噪比γ,将其作为深度强化学习的状态Xt;
根据Q值表选择状态Xt下最大Q值对应的动作Yt执行,动作Yt定义为资源块K和发射功率P的联合分配;
通过神经网络模拟Q值更新公式得到Qt(Xt,Yt);
根据奖赏函数R(X,Y)计算得到状态Xt下执行动作Yt的奖赏Rt((Xt,Yt),同时进入下个状态Xt+1进行新一轮的学习;
每轮学习结束后将<Xt,Yt,Rt,Xt+1>四元组作为一条记录保存在记忆单元中,当记忆单元的记录数达到阈值ξ后,每隔L轮学习从记忆单元中随机抽取A条记录学习得到目标神经网络,A<ξ,通过最小化原神经网络与目标神经网络的差值来确保神经网络的有效性和可靠性,当Q值表逐渐趋于稳定,即可得到每个状态X下最优的动作Y。
前述的一种H-CRAN下基于多时间尺度协同优化的资源分配方法,其特征是,所述步骤2)的具体步骤为:
步骤21)按用户连接的基站类型将用户分为与宏基站相连的用户和与RRH相连的用户,记为HUE和RUE;按业务QoS要求将资源块K分为两个集合,记为Ω1(高QoS要求的RUE专用)和Ω2(低QoS要求的RUE和低QoS要求的HUE共享),这里选择用户期望的传输速率作为QoS要求的评价指标,期望的传输速率大于2Mbps定义为高QoS要求,反之为低QoS要求;
步骤22)测量并记录网络参数,大数据处理得到信道质量H;
步骤23)计算用户通信过程中的信干噪比γ:
231)计算用户通信过程中的干扰I:RRHr覆盖范围内的RUEn在资源块k上通信受到的干扰表示为其中,N是占用资源块集合Ω1的用户数,记为{1,2,...,N},q是占用资源块集合Ω2的用户数,记为{N+1,N+2,...,N+q},是RUE的接入指示因子,表示RRHr覆盖范围内的RUEi接入资源块k,是RRHr为RUEi在资源块k上分配的发射功率,是RRH r覆盖范围内的RUE i在资源块k上通信的信道增益,表示RRHr覆盖范围内占用资源块k的其他RUE对RUEn产生的干扰功率,N0表示噪声功率;表示RRHr覆盖范围内占用资源块k的其他RUE对RUEn产生的干扰功率,是HUE的接入指示因子,表示宏基站H覆盖范围内的HUEj接入资源块k,是宏基站H为HUEj在资源块k上分配的发射功率,是宏基站H覆盖范围内的HUEj在资源块k上通信的信道增益,表示宏基站H覆盖范围内占用资源块k的HUE对RUEn产生的干扰功率;
宏基站H覆盖范围内的HUE m在资源块k上通信受到的干扰表示为其中,表示宏基站H覆盖范围内占用资源块k的其他HUE对HUE m产生的干扰功率,表示所有RRH覆盖范围内占用资源块k的RUE对HUEm产生的干扰功率;
232)计算用户通信过程中的信干噪比γ:RRHr覆盖范围内的RUEn在资源块k上通信的信干噪比γ表示为宏基站H覆盖范围内的HUE m在资源块k上通信的信干噪比γ表示为
步骤24)根据香农公式计算网络覆盖范围内的通信速率C:
步骤25)计算网络的能源效率EE:
步骤26)建立深度强化学习模型,进行资源块K和发射功率P的均衡分配。
步骤24)根据香农公式计算网络覆盖范围内的通信速率C:
步骤25)计算网络的能源效率EE:
步骤26)建立深度强化学习模型,进行资源块K和发射功率P的均衡分配。
前述的一种H-CRAN下基于多时间尺度协同优化的资源分配方法,其特征是,所述步骤24)的具体内容为:
241)计算单个用户的通信速率:
RRHr覆盖范围内RUEn的通信速率表示为:
宏基站H覆盖范围内HUEm的通信速率表示为:
242)计算网络覆盖范围内的通信速率C:
RRHr覆盖范围内所有RUE的通信速率表示为
宏基站H覆盖范围内所有HUE的通信速率表示为
前述的一种H-CRAN下基于多时间尺度协同优化的资源分配方法,其特征是,所述步骤25)的具体步骤为:
251)计算网络的功率消耗P:
RRH的功率消耗包含收发机的电路功耗Pct、前传链路功耗Pf、信令交换功耗Pe和自身发射功耗,表示为宏基站H的功率消耗记为PH;
252)计算网络的能源效率EE:
H-CRAN包含1个宏基站和R个RRH,其能源效率EE表示为由于R>>1,简化为
前述的一种H-CRAN下基于多时间尺度协同优化的资源分配方法,其特征是,所述步骤26)的具体步骤为:
261)初始化RUE的状态
262)初始化神经网络的层数、每层包含的神经元个数以及各个神经元间的权重W;状态Xt作为神经网络的输入,状态Xt下执行各动作的Q值作为神经网络的输出;
263)选择状态Xt下最大Q值对应的动作Yt执行;
264)取能源效率EE作为奖赏函数R(X,Y),计算得到状态Xt下执行动作Yt的奖赏Rt(Xt,Yt),同时进入下个状态Xt+1;
265)记录<Xt,Yt,Rt,Xt+1>四元组并存入记忆单元,若记忆单元的记录数小于阈值ξ则直接跳转263)继续学习,否则在跳转263)的同时每隔L轮学习从记忆单元中随机抽取A条记录学习得到目标神经网络,以最小化原神经网络与目标神经网络的差值为目标来优化权重W,确保神经网络的有效性和可靠性;
当Q值的变化幅度小于±ζ时,Q值表趋于稳定,得到每个状态X下最优的动作Y。
前述的一种H-CRAN下基于多时间尺度协同优化的资源分配方法,其特征是,所述步骤3)的具体内容为:
步骤31)进行大时间尺度资源分配,得到频点Nf和带宽B的均衡分配;
步骤32)基于大时间尺度资源分配的带宽B得到可用的资源块数K;
步骤33)进行小时间尺度资源分配,得到资源块K和发射功率P的均衡分配;
步骤34)若可用的资源块全部分配完,但小时间尺度资源分配仍然不能满足网络覆盖范围内所有业务的QoS要求,则跳转步骤31)重新进行大时间尺度资源分配。
本发明所达到的有益效果:本发明以非正交多址接入技术为基础,以资源分配模型研究为主线,以主从博弈和深度强化学习为主要研究工具,结合业务QoS保证,综合考虑长期平均信息和短期瞬时信息等多时间尺度信息,建立异构云无线接入网络下基于多时间尺度协同优化的资源分配模型,实现异构云无线接入网络中的资源分配。
附图说明
图1是大时间尺度资源分配流程框图;
图2是小时间尺度资源分配模型框图;
图3是小时间尺度资源分配流程框图;
图4是多时间尺度协同优化流程框图;
图5是异构云无线接入网络下基于多时间尺度协同优化的资源分配模型框图。
具体实施方式
下面结合附图对本发明作进一步描述。以下实施例仅用于更加清楚地说明本发明的技术方案,而不能以此来限制本发明的保护范围。
本发明涉及的一种H-CRAN下基于多时间尺度协同优化的资源分配方法,包括如下步骤:
1)大时间尺度资源分配,用于频点和带宽的均衡分配:大数据处理得到用户移动轨迹Γ和网络流量Φ,得到最优的频点Nf和带宽B:
步骤11)分析用户移动轨迹Γ、网络流量Φ与频点Nf及带宽B之间的映射关系,并作为先验知识建立专家系统,用于频点Nf及带宽B的分配;
步骤12)测量并记录网络参数,大数据处理得到用户移动轨迹Γ和网络流量Φ;
步骤13)在专家系统中匹配实际的用户移动轨迹Γ和网络流量Φ,得到最相关的先验知识,进而得到频点Nf和带宽B。
2)小时间尺度资源分配,用于资源块和发射功率的均衡分配:大数据处理得到信道质量H,利用H计算得到信干噪比γ,将其作为深度强化学习的状态Xt;
根据Q值表选择状态Xt下最大Q值对应的动作Yt执行,动作Yt定义为资源块K和发射功率P的联合分配;
通过神经网络模拟Q值更新公式得到Qt(Xt,Yt);
根据奖赏函数R(X,Y)计算得到状态Xt下执行动作Yt的奖赏Rt((Xt,Yt),同时进入下个状态Xt+1进行新一轮的学习;
每轮学习结束后将<Xt,Yt,Rt,Xt+1>四元组作为一条记录保存在记忆单元中,当记忆单元的记录数达到阈值ξ后,每隔L轮学习从记忆单元中随机抽取A条记录学习得到目标神经网络,A<ξ,通过最小化原神经网络与目标神经网络的差值来确保神经网络的有效性和可靠性,当Q值表逐渐趋于稳定,即可得到每个状态X下最优的动作Y。
具体步骤为:
步骤21)按用户连接的基站类型将用户分为与宏基站相连的用户和与RRH相连的用户,记为HUE和RUE;按业务QoS要求将资源块K分为两个集合,记为Ω1和Ω2;
步骤22)测量并记录网络参数,大数据处理得到信道质量H;
步骤23)计算用户通信过程中的信干噪比γ:
231)计算用户通信过程中的干扰I:RRHr覆盖范围内的RUEn在资源块k上通信受到的干扰表示为其中,N是占用资源块集合Ω1的用户数,记为{1,2,...,N},q是占用资源块集合Ω2的用户数,记为{N+1,N+2,...,N+q},是RUE的接入指示因子,表示RRH r覆盖范围内的RUEi接入资源块k,是RRH r为RUE i在资源块k上分配的发射功率,是RRH r覆盖范围内的RUE i在资源块k上通信的信道增益,表示RRH r覆盖范围内占用资源块k的其他RUE对RUE n产生的干扰功率,N0表示噪声功率;表示RRH r覆盖范围内占用资源块k的其他RUE对RUE n产生的干扰功率,是HUE的接入指示因子,表示宏基站H覆盖范围内的HUE j接入资源块k,是宏基站H为HUE j在资源块k上分配的发射功率,是宏基站H覆盖范围内的HUE j在资源块k上通信的信道增益,表示宏基站H覆盖范围内占用资源块k的HUE对RUE n产生的干扰功率;
宏基站H覆盖范围内的HUE m在资源块k上通信受到的干扰表示为其中,表示宏基站H覆盖范围内占用资源块k的其他HUE对HUE m产生的干扰功率,表示所有RRH覆盖范围内占用资源块k的RUE对HUE m产生的干扰功率;
232)计算用户通信过程中的信干噪比γ:RRH r覆盖范围内的RUE n在资源块k上通信的信干噪比γ表示为宏基站H覆盖范围内的HUE m在资源块k上通信的信干噪比γ表示为
步骤24)根据香农公式计算网络覆盖范围内的通信速率C:
241)计算单个用户的通信速率:
RRHr覆盖范围内RUE n的通信速率表示为:
宏基站H覆盖范围内HUE m的通信速率表示为:
242)计算网络覆盖范围内的通信速率C:
RRH r覆盖范围内所有RUE的通信速率表示为
宏基站H覆盖范围内所有HUE的通信速率表示为
步骤25)计算网络的能源效率EE:
251)计算网络的功率消耗P:
RRH的功率消耗包含收发机的电路功耗Pct、前传链路功耗Pf、信令交换功耗Pe和自身发射功耗,表示为宏基站H的功率消耗记为PH;
252)计算网络的能源效率EE:
H-CRAN包含1个宏基站和R个RRH,其能源效率EE表示为由于R>>1,简化为
步骤26)建立深度强化学习模型,进行资源块K和发射功率P的均衡分配:
261)初始化RUE的状态
262)初始化神经网络的层数、每层包含的神经元个数以及各个神经元间的权重W;状态Xt作为神经网络的输入,状态Xt下执行各动作的Q值作为神经网络的输出;
263)选择状态Xt下最大Q值对应的动作Yt执行;
264)取能源效率EE作为奖赏函数R(X,Y),计算得到状态Xt下执行动作Yt的奖赏Rt(Xt,Yt),同时进入下个状态Xt+1;
265)记录<Xt,Yt,Rt,Xt+1>四元组并存入记忆单元,若记忆单元的记录数小于阈值ξ则直接跳转263)继续学习,否则在跳转263)的同时每隔L轮学习从记忆单元中随机抽取A条记录学习得到目标神经网络,以最小化原神经网络与目标神经网络的差值为目标来优化权重W,确保神经网络的有效性和可靠性;
当Q值的变化幅度小于±ζ时,Q值表趋于稳定,得到每个状态X下最优的动作Y。
3)结合步骤1)和2)进行协同优化,用于多时间尺度的协同优化:
步骤31)进行大时间尺度资源分配,得到频点Nf和带宽B的均衡分配;
步骤32)基于大时间尺度资源分配的带宽B得到可用的资源块数K;
步骤33)进行小时间尺度资源分配,得到资源块K和发射功率P的均衡分配;
步骤34)若可用的资源块全部分配完,但小时间尺度资源分配仍然不能满足网络覆盖范围内所有业务的QoS要求,则跳转步骤31)重新进行大时间尺度资源分配。
以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明技术原理的前提下,还可以做出若干改进和变形,这些改进和变形也应视为本发明的保护范围。
Claims (8)
1.一种H-CRAN下基于多时间尺度协同优化的资源分配方法,其特征是,包括如下步骤:
1)大时间尺度资源分配,用于频点和带宽的均衡分配:大数据处理得到用户移动轨迹Γ和网络流量Φ,得到最优的频点Nf和带宽B;
2)小时间尺度资源分配,用于资源块和发射功率的均衡分配,大数据处理得到信道质量H,利用H计算得到信干噪比γ;
3)结合步骤1)和2)进行协同优化,用于多时间尺度的协同优化。
2.根据权利要求1所述的一种H-CRAN下基于多时间尺度协同优化的资源分配方法,其特征是,所述步骤1)的具体步骤为:
步骤11)分析用户移动轨迹Γ、网络流量Φ与频点Nf及带宽B之间的映射关系,并作为先验知识建立专家系统,用于频点Nf及带宽B的分配;
步骤12)测量并记录网络参数,大数据处理得到用户移动轨迹Γ和网络流量Φ;
步骤13)在专家系统中匹配实际的用户移动轨迹Γ和网络流量Φ,得到最相关的先验知识,进而得到频点Nf和带宽B。
3.根据权利要求1所述的一种H-CRAN下基于多时间尺度协同优化的资源分配方法,其特征是,所述步骤2)的具体内容为:
大数据处理得到信道质量H,利用H计算得到信干噪比γ,将其作为深度强化学习的状态Xt;
根据Q值表选择状态Xt下最大Q值对应的动作Yt执行,动作Yt定义为资源块K和发射功率P的联合分配;
通过神经网络模拟Q值更新公式得到Qt(Xt,Yt);
根据奖赏函数R(X,Y)计算得到状态Xt下执行动作Yt的奖赏Rt(Xt,Yt),同时进入下个状态Xt+1进行新一轮的学习;
每轮学习结束后将<Xt,Yt,Rt,Xt+1>四元组作为一条记录保存在记忆单元中,当记忆单元的记录数达到阈值ξ后,每隔L轮学习从记忆单元中随机抽取A条记录学习得到目标神经网络,A<ξ,通过最小化原神经网络与目标神经网络的差值来确保神经网络的有效性和可靠性,当Q值表逐渐趋于稳定,即可得到每个状态X下最优的动作Y。
4.根据权利要求3所述的一种H-CRAN下基于多时间尺度协同优化的资源分配方法,其特征是,所述步骤2)的具体步骤为:
步骤21)按用户连接的基站类型将用户分为与宏基站相连的用户和与RRH相连的用户,记为HUE和RUE;按业务QoS要求将资源块K分为两个集合,记为Ω1和Ω2;
步骤22)测量并记录网络参数,大数据处理得到信道质量H;
步骤23)计算用户通信过程中的信干噪比γ:
231)计算用户通信过程中的干扰I:RRHr覆盖范围内的RUEn在资源块k上通信受到的干扰表示为其中,N是占用资源块集合Ω1的用户数,记为{1,2,...,N},q是占用资源块集合Ω2的用户数,记为{N+1,N+2,...,N+q},是RUE的接入指示因子,表示RRHr覆盖范围内的RUEi接入资源块k,是RRHr为RUEi在资源块k上分配的发射功率,是RRHr覆盖范围内的RUEi在资源块k上通信的信道增益,表示RRHr覆盖范围内占用资源块k的其他RUE对RUEn产生的干扰功率,N0表示噪声功率;表示RRHr覆盖范围内占用资源块k的其他RUE对RUEn产生的干扰功率,是HUE的接入指示因子,表示宏基站H覆盖范围内的HUEj接入资源块k,是宏基站H为HUEj在资源块k上分配的发射功率,是宏基站H覆盖范围内的HUEj在资源块k上通信的信道增益,表示宏基站H覆盖范围内占用资源块k的HUE对RUEn产生的干扰功率;
宏基站H覆盖范围内的HUEm在资源块k上通信受到的干扰表示为
其中,表示宏基站H覆盖范围内占用资源块k的其他HUE对HUEm产生的干扰功率,表示所有RRH覆盖范围内占用资源块k的RUE对HUEm产生的干扰功率;
232)计算用户通信过程中的信干噪比γ:RRHr覆盖范围内的RUEn在资源块k上通信的信干噪比γ表示为宏基站H覆盖范围内的HUEm在资源块k上通信的信干噪比γ表示为
步骤24)根据香农公式计算网络覆盖范围内的通信速率C:
步骤25)计算网络的能源效率EE:
步骤26)建立深度强化学习模型,进行资源块K和发射功率P的均衡分配。
5.根据权利要求4所述的一种H-CRAN下基于多时间尺度协同优化的资源分配方法,其特征是,所述步骤24)的具体内容为:
241)计算单个用户的通信速率:
RRHr覆盖范围内RUEn的通信速率表示为
宏基站H覆盖范围内HUEm的通信速率表示为
242)计算网络覆盖范围内的通信速率C:
RRHr覆盖范围内所有RUE的通信速率表示为
宏基站H覆盖范围内所有HUE的通信速率表示为
6.根据权利要求5所述的一种H-CRAN下基于多时间尺度协同优化的资源分配方法,其特征是,所述步骤25)的具体步骤为:
251)计算网络的功率消耗P:
RRH的功率消耗包含收发机的电路功耗Pct、前传链路功耗Pf、信令交换功耗Pe和自身发射功耗,表示为宏基站H的功率消耗记为PH;
252)计算网络的能源效率EE:
H-CRAN包含1个宏基站和R个RRH,其能源效率EE表示为由于R>>1,简化为。
7.根据权利要求6所述的一种H-CRAN下基于多时间尺度协同优化的资源分配方法,其特征是,所述步骤26)的具体步骤为:
261)初始化RUE的状态
262)初始化神经网络的层数、每层包含的神经元个数以及各个神经元间的权重W;状态Xt作为神经网络的输入,状态Xt下执行各动作的Q值作为神经网络的输出;
263)选择状态Xt下最大Q值对应的动作Yt执行;
264)取能源效率EE作为奖赏函数R(X,Y),计算得到状态Xt下执行动作Yt的奖赏Rt(Xt,Yt),同时进入下个状态Xt+1;
265)记录<Xt,Yt,Rt,Xt+1>四元组并存入记忆单元,若记忆单元的记录数小于阈值ξ则直接跳转步骤263)继续学习,否则在跳转步骤263)的同时每隔L轮学习从记忆单元中随机抽取A条记录学习得到目标神经网络,以最小化原神经网络与目标神经网络的差值为目标来优化权重W,确保神经网络的有效性和可靠性;
当Q值的变化幅度小于±ξ时,Q值表趋于稳定,得到每个状态X下最优的动作Y。
8.根据权利要求1所述的一种H-CRAN下基于多时间尺度协同优化的资源分配方法,其特征是,所述步骤3)的具体内容为:
步骤31)进行大时间尺度资源分配,得到频点Nf和带宽B的均衡分配;
步骤32)基于大时间尺度资源分配的带宽B得到可用的资源块数K;
步骤33)进行小时间尺度资源分配,得到资源块K和发射功率P的均衡分配;
步骤34)若可用的资源块全部分配完,但小时间尺度资源分配仍然不能满足网络覆盖范围内所有业务的QoS要求,则跳转步骤31)重新进行大时间尺度资源分配。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810437109.XA CN108718463B (zh) | 2018-05-09 | 2018-05-09 | 一种h-cran下基于多时间尺度协同优化的资源分配方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810437109.XA CN108718463B (zh) | 2018-05-09 | 2018-05-09 | 一种h-cran下基于多时间尺度协同优化的资源分配方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN108718463A true CN108718463A (zh) | 2018-10-30 |
CN108718463B CN108718463B (zh) | 2022-07-05 |
Family
ID=63899572
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810437109.XA Active CN108718463B (zh) | 2018-05-09 | 2018-05-09 | 一种h-cran下基于多时间尺度协同优化的资源分配方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN108718463B (zh) |
Cited By (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109819522A (zh) * | 2019-03-15 | 2019-05-28 | 电子科技大学 | 一种平衡能耗与用户服务质量的用户带宽资源分配方法 |
CN109831808A (zh) * | 2019-02-25 | 2019-05-31 | 重庆邮电大学 | 一种基于机器学习的混合供电c-ran的资源分配方法 |
CN109874154A (zh) * | 2019-01-23 | 2019-06-11 | 南京邮电大学 | 一种基于深度强化学习的c-ran用户关联和计算资源分配方法 |
CN110035478A (zh) * | 2019-04-18 | 2019-07-19 | 北京邮电大学 | 一种高速移动场景下的动态多信道接入方法 |
CN110493826A (zh) * | 2019-08-28 | 2019-11-22 | 重庆邮电大学 | 一种基于深度强化学习的异构云无线接入网资源分配方法 |
CN110519095A (zh) * | 2019-08-28 | 2019-11-29 | 重庆邮电大学 | 一种面向混合能源供应的h-cran网络架构下资源分配及能源管理方法 |
CN110798842A (zh) * | 2019-01-31 | 2020-02-14 | 湖北工业大学 | 一种基于多用户深度强化学习的异构蜂窝网络流量卸载方法 |
CN110809261A (zh) * | 2019-10-31 | 2020-02-18 | 重庆邮电大学 | H-cran网络下联合拥塞控制和资源分配的网络切片动态资源调度方法 |
CN111147270A (zh) * | 2018-11-02 | 2020-05-12 | 中国移动通信有限公司研究院 | 一种数据驱动的网元的构建方法、网元及计算机可读存储介质 |
CN111491312A (zh) * | 2019-01-28 | 2020-08-04 | 中国移动通信有限公司研究院 | 无线资源预测分配、获取、训练神经网络的方法及设备 |
CN112129292A (zh) * | 2020-09-02 | 2020-12-25 | 北京航空航天大学 | 考虑攻击时间和攻击角度约束的异构飞行器协同制导方法 |
CN112887995A (zh) * | 2021-01-21 | 2021-06-01 | 哈尔滨工业大学 | 在虚拟化多租户CF-mMIMO系统中的资源分配方法 |
CN113824116A (zh) * | 2021-11-25 | 2021-12-21 | 国网江西省电力有限公司电力科学研究院 | 一种基于混合时间尺度drl的综合能源在线调度方法 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20120307745A1 (en) * | 2011-06-06 | 2012-12-06 | Alcatel-Lucent Usa Inc. | Method And Apparatus Of Fractional Power Control In Wireless Communication Networks |
WO2016082557A1 (zh) * | 2014-11-26 | 2016-06-02 | 北京邮电大学 | 基于用户公平性的异构网络时域干扰协调方法及系统 |
CN106358308A (zh) * | 2015-07-14 | 2017-01-25 | 北京化工大学 | 一种超密集网络中的强化学习的资源分配方法 |
-
2018
- 2018-05-09 CN CN201810437109.XA patent/CN108718463B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20120307745A1 (en) * | 2011-06-06 | 2012-12-06 | Alcatel-Lucent Usa Inc. | Method And Apparatus Of Fractional Power Control In Wireless Communication Networks |
WO2016082557A1 (zh) * | 2014-11-26 | 2016-06-02 | 北京邮电大学 | 基于用户公平性的异构网络时域干扰协调方法及系统 |
CN106358308A (zh) * | 2015-07-14 | 2017-01-25 | 北京化工大学 | 一种超密集网络中的强化学习的资源分配方法 |
Cited By (22)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111147270A (zh) * | 2018-11-02 | 2020-05-12 | 中国移动通信有限公司研究院 | 一种数据驱动的网元的构建方法、网元及计算机可读存储介质 |
CN111147270B (zh) * | 2018-11-02 | 2022-11-01 | 中国移动通信有限公司研究院 | 一种数据驱动的网元的构建方法、网元及计算机可读存储介质 |
CN109874154A (zh) * | 2019-01-23 | 2019-06-11 | 南京邮电大学 | 一种基于深度强化学习的c-ran用户关联和计算资源分配方法 |
CN111491312A (zh) * | 2019-01-28 | 2020-08-04 | 中国移动通信有限公司研究院 | 无线资源预测分配、获取、训练神经网络的方法及设备 |
CN110798842B (zh) * | 2019-01-31 | 2022-06-28 | 湖北工业大学 | 一种基于多用户深度强化学习的异构蜂窝网络流量卸载方法 |
CN110798842A (zh) * | 2019-01-31 | 2020-02-14 | 湖北工业大学 | 一种基于多用户深度强化学习的异构蜂窝网络流量卸载方法 |
CN109831808A (zh) * | 2019-02-25 | 2019-05-31 | 重庆邮电大学 | 一种基于机器学习的混合供电c-ran的资源分配方法 |
CN109831808B (zh) * | 2019-02-25 | 2022-05-06 | 重庆邮电大学 | 一种基于机器学习的混合供电c-ran的资源分配方法 |
CN109819522A (zh) * | 2019-03-15 | 2019-05-28 | 电子科技大学 | 一种平衡能耗与用户服务质量的用户带宽资源分配方法 |
CN109819522B (zh) * | 2019-03-15 | 2021-08-24 | 电子科技大学 | 一种平衡能耗与用户服务质量的用户带宽资源分配方法 |
CN110035478A (zh) * | 2019-04-18 | 2019-07-19 | 北京邮电大学 | 一种高速移动场景下的动态多信道接入方法 |
CN110519095A (zh) * | 2019-08-28 | 2019-11-29 | 重庆邮电大学 | 一种面向混合能源供应的h-cran网络架构下资源分配及能源管理方法 |
CN110493826A (zh) * | 2019-08-28 | 2019-11-22 | 重庆邮电大学 | 一种基于深度强化学习的异构云无线接入网资源分配方法 |
CN110493826B (zh) * | 2019-08-28 | 2022-04-12 | 重庆邮电大学 | 一种基于深度强化学习的异构云无线接入网资源分配方法 |
CN110809261A (zh) * | 2019-10-31 | 2020-02-18 | 重庆邮电大学 | H-cran网络下联合拥塞控制和资源分配的网络切片动态资源调度方法 |
CN110809261B (zh) * | 2019-10-31 | 2022-04-12 | 重庆邮电大学 | H-cran网络下联合拥塞控制和资源分配的网络切片动态资源调度方法 |
CN112129292A (zh) * | 2020-09-02 | 2020-12-25 | 北京航空航天大学 | 考虑攻击时间和攻击角度约束的异构飞行器协同制导方法 |
CN112129292B (zh) * | 2020-09-02 | 2021-06-04 | 北京航空航天大学 | 考虑攻击时间和攻击角度约束的异构飞行器协同制导方法 |
CN112887995B (zh) * | 2021-01-21 | 2021-09-03 | 哈尔滨工业大学 | 在虚拟化多租户CF-mMIMO系统中的资源分配方法 |
CN112887995A (zh) * | 2021-01-21 | 2021-06-01 | 哈尔滨工业大学 | 在虚拟化多租户CF-mMIMO系统中的资源分配方法 |
CN113824116B (zh) * | 2021-11-25 | 2022-03-11 | 国网江西省电力有限公司电力科学研究院 | 一种基于混合时间尺度drl的综合能源在线调度方法 |
CN113824116A (zh) * | 2021-11-25 | 2021-12-21 | 国网江西省电力有限公司电力科学研究院 | 一种基于混合时间尺度drl的综合能源在线调度方法 |
Also Published As
Publication number | Publication date |
---|---|
CN108718463B (zh) | 2022-07-05 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108718463B (zh) | 一种h-cran下基于多时间尺度协同优化的资源分配方法 | |
CN109947545B (zh) | 一种基于用户移动性的任务卸载及迁移的决策方法 | |
CN109729528B (zh) | 一种基于多智能体深度强化学习的d2d资源分配方法 | |
Zhou et al. | When collaboration hugs intelligence: Content delivery over ultra-dense networks | |
CN109474980B (zh) | 一种基于深度增强学习的无线网络资源分配方法 | |
CN110493826B (zh) | 一种基于深度强化学习的异构云无线接入网资源分配方法 | |
CN111372314A (zh) | 基于移动边缘计算场景下的任务卸载方法及任务卸载装置 | |
Sheng et al. | Energy efficiency and delay tradeoff in device-to-device communications underlaying cellular networks | |
Dao et al. | Adaptive resource balancing for serviceability maximization in fog radio access networks | |
CN110213776B (zh) | 一种基于Q学习和多属性决策的WiFi卸载方法 | |
CN108901075A (zh) | 一种基于gs算法的资源分配方法 | |
Elsayed et al. | Deep reinforcement learning for reducing latency in mission critical services | |
CN113038616A (zh) | 一种基于联邦学习的频谱资源管理分配方法 | |
Wu et al. | 3D aerial base station position planning based on deep Q-network for capacity enhancement | |
CN108848535B (zh) | 一种面向共享模式的雾计算环境资源分配方法 | |
Lopez-Perez et al. | A survey on 5g energy efficiency: Massive mimo, lean carrier design, sleep modes, and machine learning | |
CN115665227A (zh) | 一种普适的异构融合算网资源智慧适配网络架构及方法 | |
CN114219354A (zh) | 一种基于联邦学习资源分配优化方法及系统 | |
Zhang et al. | Toward intelligent resource allocation on task-oriented semantic communication | |
Zhu et al. | Video semantics based resource allocation algorithm for spectrum multiplexing scenarios in vehicular networks | |
Llerena et al. | Social-aware spectrum sharing for D2D communication by artificial bee colony optimization | |
CN109272167B (zh) | 一种基于uudn和q神经网络的绿色能量合作方法 | |
CN114423070A (zh) | 一种基于d2d的异构无线网络功率分配方法及系统 | |
Ismail et al. | Towards 6G Technology: Insights into Resource Management for Cloud RAN Deployment | |
Xiaoshuai et al. | Joint power control and proportional fair scheduling for D2D communication underlaying cellular networks |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |