CN114980156A - 一种无蜂窝毫米波大规模mimo系统的ap开关切换方法 - Google Patents

一种无蜂窝毫米波大规模mimo系统的ap开关切换方法 Download PDF

Info

Publication number
CN114980156A
CN114980156A CN202210369904.6A CN202210369904A CN114980156A CN 114980156 A CN114980156 A CN 114980156A CN 202210369904 A CN202210369904 A CN 202210369904A CN 114980156 A CN114980156 A CN 114980156A
Authority
CN
China
Prior art keywords
state
energy efficiency
utility function
user
total energy
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202210369904.6A
Other languages
English (en)
Other versions
CN114980156B (zh
Inventor
何云
申敏
周渝陇
毛翔宇
李春霖
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Chongqing University of Post and Telecommunications
Original Assignee
Chongqing University of Post and Telecommunications
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Chongqing University of Post and Telecommunications filed Critical Chongqing University of Post and Telecommunications
Priority to CN202210369904.6A priority Critical patent/CN114980156B/zh
Publication of CN114980156A publication Critical patent/CN114980156A/zh
Application granted granted Critical
Publication of CN114980156B publication Critical patent/CN114980156B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W24/00Supervisory, monitoring or testing arrangements
    • H04W24/02Arrangements for optimising operational condition
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04BTRANSMISSION
    • H04B17/00Monitoring; Testing
    • H04B17/30Monitoring; Testing of propagation channels
    • H04B17/309Measuring or estimating channel quality parameters
    • H04B17/336Signal-to-interference ratio [SIR] or carrier-to-interference ratio [CIR]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04BTRANSMISSION
    • H04B7/00Radio transmission systems, i.e. using radiation field
    • H04B7/02Diversity systems; Multi-antenna system, i.e. transmission or reception using multiple antennas
    • H04B7/04Diversity systems; Multi-antenna system, i.e. transmission or reception using multiple antennas using two or more spaced independent antennas
    • H04B7/0413MIMO systems
    • H04B7/0452Multi-user MIMO systems
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W24/00Supervisory, monitoring or testing arrangements
    • H04W24/06Testing, supervising or monitoring using simulated traffic
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D30/00Reducing energy consumption in communication networks
    • Y02D30/70Reducing energy consumption in communication networks in wireless communication networks

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Quality & Reliability (AREA)
  • Physics & Mathematics (AREA)
  • Electromagnetism (AREA)
  • Mobile Radio Communication Systems (AREA)

Abstract

本发明涉及一种无蜂窝毫米波大规模MIMO系统的AP开关切换方法,属于无线通信领域。该方法包括:S1:构建无蜂窝毫米波大规模MIMO系统基于总能效的优化问题模型;S2:采用SINR感知技术构建效用函数,以实现QoS约束下总能效最大化为优化目标;S3:构建强化学习模型,包括以下步骤:S31:构建状态空间分级算法:首先对效用函数离散化分级处理,将状态空间划分为多个状态子空间;然后采用哈希检索法对状态进行哈希编码;最后根据状态空间分级算法更新状态;S32:深度决斗算法:使用步骤S31更新的状态信息在深度决斗DQN框架下学习,更新网络参数。本发明实现了满足QoS要求和最大化系统总能效要求。

Description

一种无蜂窝毫米波大规模MIMO系统的AP开关切换方法
技术领域
本发明属于无线通信领域,涉及一种无蜂窝毫米波大规模MIMO系统的AP开关切换方法。
背景技术
研究无蜂窝毫米波大规模MIMO网络接入点(Access Point,AP)开关策略,旨在提供最大能效的AP激活集合。然而,这是一个NP难问题,它需要评估所有M个AP的各种可能组合。AP组合的选择应适应用户位置变化或阴影衰落地理分布变化等原因引起的场景变化,而在大多数现实环境中,这些变化发生得太快以至于无法实施相应的策略。强化学习技术起源于大数据分析,是一种非常有前途的数据驱动资源管理方案,可用于在未知动态变化的网络条件下(例如:可变的信道状态信息和QoS要求)为每个状态和交互做出最佳决策。
基于深度强化学习模型,人们提出了一些新的有效节能资源管理策略。系统总能效最大化只有在满足QoS要求时才有意义,否则会降低用户体验。QoS的目标是以更有效的方式将当前流量负载映射到可用传输资源上。QoS保证的增益是以增加AP的功耗为代价的。因此系统除了需要满足每个用户的QoS要求外,还必须考虑ASO策略来控制活动AP的发射功率和硬件功耗。传统的研究采用的效用函数主要用来表征可达速率和总能效之间的权衡,但在时变环境中很难识别两者的权重边界,传统的基于强化学习框架解决能效优化问题的效用函数往往具有一组松散的QoS约束,而非严格的QoS约束。因此AP开关切换策略需要关注两者的权重设计,且需要以更严格的方式满足QoS约束。同时,由于样本是从无线网络的不同时期收集到的,在学习过程中会出现样本偏差。
因此,亟需一种能够提升无蜂窝毫米波大规模MIMO系统总能效的时变信道环境中的AP睡眠节能机制。
发明内容
有鉴于此,本发明的目的在于提供一种无蜂窝毫米波大规模MIMO系统的AP开关切换方法,以满足QoS要求和最大化系统总能效要求。
为达到上述目的,本发明提供如下技术方案:
一种无蜂窝毫米波大规模MIMO系统的AP开关切换方法,具体包括以下步骤:
S1:构建无蜂窝毫米波大规模MIMO系统基于总能效的优化问题模型;
S2:采用SINR感知技术构建效用函数,以实现QoS约束下总能效最大化为优化目标;
S3:构建强化学习模型,包括以下步骤:
S31:构建状态空间分级算法:首先对效用函数离散化分级处理,将状态空间划分为多个状态子空间;然后采用哈希检索法对状态进行哈希编码;最后根据状态空间分级算法更新状态;
S32:深度决斗算法:使用步骤S31更新的状态信息在深度决斗DQN框架下有效地学习,更新网络参数。
进一步,步骤S1中,无蜂窝毫米波大规模MIMO系统中,许多AP协同为用户服务,AP通过前传链路连接到CPU。假设系统配置有M个AP和K个用户,每个AP有Nt根天线和
Figure BDA0003587819620000021
个射频链;每个用户有Nr,k根天线,数据流数为Ns,k;每个用户的带宽为B0,假设系统工作在TDD模式,根据信道互易性,仅需通过上行训练实现信道估计;在无蜂窝毫米波大规模MIMO系统中,以用户为中心的方法能够降低系统前传链路的功耗,该方法允许每个用户由特定的AP集群提供最好的服务;定义
Figure BDA0003587819620000022
为第m个AP提供服务的用户集群,集群中的最大用户数为NUE,max
Figure BDA0003587819620000023
表示为第k个用户提供服务的AP集群,集群中的最大AP数为NAP,max;第k个用户和第m个AP之间的信道为
Figure BDA0003587819620000024
该信道采用基于簇的大规模MIMO信道;
构建无蜂窝毫米波大规模MIMO系统基于总能效的优化问题模型,具体包括:针对无蜂窝毫米波大规模MIMO系统基于总能效的AP开关切换策略,定义M个AP的开关映射关系为状态s=[o1,...,om,...,oM],om=1表示第m个AP打开,om=0表示第m个AP关闭,AP激活集合为
Figure BDA0003587819620000025
以状态s为目标变量,第k个用户的干扰协方差矩阵加上有效噪声为Rk,则第k个用户的下行可达速率
Figure BDA0003587819620000026
总能效
Figure BDA0003587819620000027
分别表示为:
Figure BDA0003587819620000028
Figure BDA0003587819620000029
Figure BDA00035878196200000210
Figure BDA00035878196200000211
其中,I表示单位矩阵,PT(s)表示总功率,Lk表示第k个用户的合并器,k表示第k个用户,l表示第l个用户,
Figure BDA00035878196200000212
为噪声功率,pm,k为第m个AP分配给第k个用户的功率,Hm,k表示第m个AP和第k个用户之间的信道矩阵,Fm,l表示第m个AP对第l个用户的预编码矩阵。
以状态s作为目标变量的优化问题表示为:
Figure BDA0003587819620000031
其中,Pmax表示每个AP的传输功率限制,Rmin表示每个用户的最小频谱效率限制。
进一步,步骤S2中,构建效用函数具体包括:定义效用函数
Figure BDA0003587819620000032
为:
Figure BDA0003587819620000033
其中,
Figure BDA0003587819620000034
表示对下行可达速率的满意度,
Figure BDA0003587819620000035
表示对系统总能效的满意度;μ为加权系数,取值在0和1之间,最优μ值的选择需要基于最小化
Figure BDA0003587819620000036
和Rmin间的差值来最大化系统总能效,即解决
Figure BDA0003587819620000037
其中,εr表示误差容忍度。
传统的效用函数很难确定最优加权系数μ,为了使效用函数能更紧地满足QoS要求,采用性质1设计效用函数的参数变量;假设
Figure BDA0003587819620000038
为在无QoS约束下的最大总能效;Rmax为系统最大可达速率,对应的总能效为
Figure BDA0003587819620000039
定义可达速率满意函数
Figure BDA00035878196200000310
能效满意函数
Figure BDA00035878196200000311
和加权系数μ分别为:
Figure BDA00035878196200000312
Figure BDA00035878196200000313
Figure BDA00035878196200000314
其中,
Figure BDA00035878196200000315
表示总能效,ω表示满意度加权系数。
性质1:式(8)、式(9)和式(10)定义的参数变量能最大化效用函数
Figure BDA00035878196200000316
即满足式(7)。
进一步,步骤S2中,SINR感知技术具体包括:第k个用户的信干噪比为
Figure BDA00035878196200000317
其中,gk(s)为有用信号功率,Ik(s)为信道干扰功率,σ2为噪声功率,则下行可达速率可表示为:
Figure BDA0003587819620000041
在AP与CPU代理的交互过程中,假设在时刻t-ΔT与时刻t之间,所有AP的激活状态s(t)保持不变,CPU代理通过多次与环境交互收集所有用户的干扰功率和有用信号功率,该时间间隔内用户k的干扰功率和有用信号功率样本集合分别为Ik={Ik,nΔt},gk={gk,nΔt},Δt=ΔT/Mt,n=1,...,Mt,则用户k在ΔT间隔内Mt个样本的平均干扰功率为
Figure BDA0003587819620000042
和平均有用信号功率为
Figure BDA0003587819620000043
在时刻t,用户k的平均信干噪比和平均可达速率分别为:
Figure BDA0003587819620000044
Figure BDA0003587819620000045
在时刻t,平均总能效和效用函数分别为:
Figure BDA0003587819620000046
Figure BDA0003587819620000047
进一步,步骤S31中,构建状态空间分级算法具体包括:将权衡后的效用函数进行离散化分级,将连续的效用函数
Figure BDA00035878196200000425
从小到大划分为P个不同等级的离散效用函数值
Figure BDA0003587819620000048
则离散效用函数值序列为
Figure BDA0003587819620000049
Figure BDA00035878196200000410
其中,
Figure BDA00035878196200000411
Figure BDA00035878196200000412
为最小效用函数值,
Figure BDA00035878196200000413
为最大效用函数值;基于效用函数的离散化,状态空间被划分为多个状态子空间;假设状态s对应的效用函数值为
Figure BDA00035878196200000414
状态s对应的离散效用函数等级p为:
Figure BDA00035878196200000415
假设第t次马尔科夫过程收集到Mt个样本,根据式(14)得到平均可达速率
Figure BDA00035878196200000416
根据式(15)得到平均总能效
Figure BDA00035878196200000417
再根据式(16)计算得到
Figure BDA00035878196200000418
则时刻t的样本为
Figure BDA00035878196200000419
马尔科夫链样本集为
Figure BDA00035878196200000420
由于样本
Figure BDA00035878196200000421
是从无线网络中的不同时期收集到的,因此在学习过程中会出现样本偏差。即,对于相同的s=s(t)=s(t'),
Figure BDA00035878196200000422
如果
Figure BDA00035878196200000423
则存在样本偏差,该样本偏差导致学习过程不易收敛。为了解决该问题,将不同时刻的样本
Figure BDA00035878196200000424
存储到缓存空间,如果出现样本偏差的情况,则使用历史状态对应的样本;为了避免
Figure BDA0003587819620000051
长期使用历史信息而无法实时适应环境变化,以T为周期初始化样本集
Figure BDA0003587819620000052
的缓存空间;状态空间的大小为2M,当M取值很大时,样本集的索引维度非常大,为了加快缓存空间的检索速度,本发明采用哈希检索方法,对状态s(t)进行哈希编码hb(s(t)),根据哈希码索引存取信息
Figure BDA0003587819620000053
通过式(18)能找到与
Figure BDA0003587819620000054
对应的等级p和分级效用函数
Figure BDA0003587819620000055
接下来将确定
Figure BDA0003587819620000056
对应的分级状态
Figure BDA0003587819620000057
定义
Figure BDA0003587819620000058
为效用函数
Figure BDA0003587819620000059
的邻近状态集合:
Figure BDA00035878196200000510
Figure BDA00035878196200000511
中,最大总能效对应的状态定义为分级状态
Figure BDA00035878196200000512
其中t满足
Figure BDA00035878196200000513
值得注意的是,
Figure BDA00035878196200000514
不能靠提前离线训练获取,而是CPU代理在与环境交互过程中实时更新;在确定
Figure BDA00035878196200000515
对应的等级p及其分级样本
Figure BDA00035878196200000516
之后,p个等级的分级样本集更新为:
Figure BDA00035878196200000517
以上操作将实时样本
Figure BDA00035878196200000518
映射到分级样本
Figure BDA00035878196200000519
该分级操作能避免依靠单一评价准则带来的弊端,基于性能权衡的等级划分能更合理的反映状态子空间的性能差异。在实现过程中,
Figure BDA00035878196200000520
需要与
Figure BDA00035878196200000521
内最优状态进行比较更新,从而避免传统分类算法离线训练的非实时不准确性。
进一步,步骤S32具体包括:在深度决斗训练阶段通过使用SINR感知技术、哈希检索法和状态空间分级算法获取经验信息(s(t),a(t),r(t),s(t+1)),然后在深度决斗DQN框架下有效地学习。
本发明的有益效果在于:本发明将AP开关切换策略看作一个马尔可夫决策过程,使用深度强化学习算法框架解决AP激活问题,提升了无蜂窝毫米波大规模MIMO系统总能效。本发明引入SINR感知技术和局部敏感哈希方法来减少代理与复杂环境间的交互以及样本偏差。本发明构造了一个新的效用函数,使其在严格满足QoS要求下实现可达速率和总能效间的性能权衡。通过对效用函数的离散化处理,将状态空间划分为一些较小的状态子空间,以加快深度决斗Q网络的收敛速度。本发明具有良好的稳定性和收敛性,且能实现可达速率和总能效性能的权衡。
本发明的其他优点、目标和特征在某种程度上将在随后的说明书中进行阐述,并且在某种程度上,基于对下文的考察研究对本领域技术人员而言将是显而易见的,或者可以从本发明的实践中得到教导。本发明的目标和其他优点可以通过下面的说明书来实现和获得。
附图说明
为了使本发明的目的、技术方案和优点更加清楚,下面将结合附图对本发明作优选的详细描述,其中:
图1为本发明无蜂窝毫米波大规模MIMO系统的AP开关切换策略示意图;
图2为本发明无蜂窝毫米波大规模MIMO系统的AP开关切换方法流程图;
图3为非强化学习与强化学习算法性能对比图。
具体实施方式
以下通过特定的具体实例说明本发明的实施方式,本领域技术人员可由本说明书所揭露的内容轻易地了解本发明的其他优点与功效。本发明还可以通过另外不同的具体实施方式加以实施或应用,本说明书中的各项细节也可以基于不同观点与应用,在没有背离本发明的精神下进行各种修饰或改变。需要说明的是,以下实施例中所提供的图示仅以示意方式说明本发明的基本构想,在不冲突的情况下,以下实施例及实施例中的特征可以相互组合。
请参阅图1~图3,如图1所示,在无蜂窝毫米波大规模MIMO系统中,许多AP协同为用户服务,AP通过前传链路连接到CPU。假设系统配置有M个AP和K个用户,每个AP有Nt根天线和
Figure BDA0003587819620000061
个射频链;每个用户有Nr,k根天线,数据流数为Ns,k。每个用户的带宽为B0,假设系统工作在TDD模式,根据信道互易性,仅需通过上行训练实现信道估计。在无蜂窝毫米波大规模MIMO系统中,以用户为中心的方法能够降低系统前传链路的功耗,该方法允许每个用户由特定的AP集群提供最好的服务。定义
Figure BDA0003587819620000062
为第m个AP提供服务的用户集群,集群中的最大用户数为NUE,max
Figure BDA0003587819620000063
表示为第k个用户提供服务的AP集群,集群中的最大AP数为NAP,max;第k个用户和第m个AP之间的信道为
Figure BDA0003587819620000064
该信道采用基于簇的大规模MIMO信道。
1、问题模型
针对无蜂窝毫米波大规模MIMO系统基于总能效的AP开关切换策略,定义M个AP的开关映射关系为状态s=[o1,...,om,...,oM],om=1表示第m个AP打开,om=0表示第m个AP关闭,AP激活集合为
Figure BDA0003587819620000065
以状态s为目标变量,第k个用户的干扰协方差矩阵加上有效噪声为Rk,则第k个用户的下行可达速率
Figure BDA0003587819620000066
总能效
Figure BDA0003587819620000067
分别表示为:
Figure BDA0003587819620000068
Figure BDA0003587819620000071
Figure BDA0003587819620000072
Figure BDA0003587819620000073
其中,I表示单位矩阵,PT(s)表示总功率,Lk表示第k个用户的合并器,k表示第k个用户,l表示第l个用户,
Figure BDA0003587819620000074
为噪声功率,pm,k为第m个AP分配给第k个用户的功率,Hm,k表示第m个AP和第k个用户之间的信道矩阵,Fm,l表示第m个AP对第l个用户的预编码矩阵。
以状态s作为目标变量的优化问题表示为:
Figure BDA0003587819620000075
其中,Pmax表示每个AP的传输功率限制,Rmin表示每个用户的最小频谱效率限制。
2、效应函数
由于系统总能效的提升是以降低用户的QoS需求为代价的,本发明旨在设计一种能实现总能效和QoS要求权衡的效用函数来实现AP开关策略。该效用函数以实现QoS约束下总能效最大化为优化目标,因此它以总能效为基础,在给定状态s(t)下执行动作a(t)之后,如果用户的可达速率不满足QoS要求,则给与效用函数以负值作为惩罚。定义效用函数
Figure BDA0003587819620000076
为:
Figure BDA0003587819620000077
其中,
Figure BDA0003587819620000078
表示对下行可达速率的满意度,
Figure BDA0003587819620000079
表示对系统总能效的满意度。μ为加权系数,取值在0和1之间,最优μ值的选择需要基于最小化
Figure BDA00035878196200000710
和Rmin间的差值来最大化系统总能效,即解决
Figure BDA00035878196200000711
其中,εr表示误差容忍度。
传统的效用函数很难确定最优加权系数μ,为了使效用函数能更紧地满足QoS要求,采用性质1设计效用函数的参数变量。假设
Figure BDA00035878196200000712
为在无QoS约束下的最大总能效;Rmax为系统最大可达速率,对应的总能效为
Figure BDA00035878196200000713
定义可达速率满意函数
Figure BDA00035878196200000714
能效满意函数
Figure BDA00035878196200000715
和加权系数μ分别为:
Figure BDA0003587819620000081
Figure BDA0003587819620000082
Figure BDA0003587819620000083
其中,
Figure BDA0003587819620000084
表示总能效,ω表示满意度加权系数。
性质1:式(8)、式(9)和式(10)定义的参数变量能最大化效用函数
Figure BDA0003587819620000085
即满足式(7)。
证明:性质1的考虑两种极限情况:
(a)在无QoS约束能够达到的最大总能效定义为
Figure BDA0003587819620000086
该情况的效用函数
Figure BDA0003587819620000087
为:
Figure BDA0003587819620000088
(b)系统的最大可达速率表示为Rmax,对应的总能效定义为
Figure BDA0003587819620000089
则效用函数
Figure BDA00035878196200000810
为:
Figure BDA00035878196200000811
在满足QoS约束时,最优总能效表示为
Figure BDA00035878196200000812
对应的效用函数为
Figure BDA00035878196200000813
Figure BDA00035878196200000814
为了找到最接近Rmin时最大总能效,即找到最优μ使得满足式(7),则需要满足
Figure BDA00035878196200000815
Figure BDA00035878196200000816
Figure BDA00035878196200000817
即需要满足
Figure BDA00035878196200000818
因为
Figure BDA00035878196200000819
是凸函数,则式(15)很自然能够满足。为了保证最优能效点附近的效用函数连续,则效用函数也需要满足
Figure BDA00035878196200000820
Figure BDA00035878196200000821
取两个边界的中值,即
Figure BDA00035878196200000822
μ可通过式(10)获取。
证毕。
3、SINR感知技术
为了减少高维度CSI信息的交互对前传链路的压力,本发明引入SINR感知技术,使得由CPU实现的DRL代理从对系统一无所知,通过学习用户反馈的测量SINR值,最终得到AP的最优激活状态。第k个用户的信干噪比为
Figure BDA0003587819620000091
其中,Ak,k的定义参见式(4),gk(s)为有用信号功率,Ik(s)为信道干扰功率,σ2为噪声功率,则下行可达速率可表示为:
Figure BDA0003587819620000092
在AP与CPU代理的交互过程中,假设在时刻t-ΔT与时刻t之间,所有AP的激活状态s(t)保持不变,CPU代理通过多次与环境交互收集所有用户的干扰功率和有用信号功率,该时间间隔内用户k的干扰功率和有用信号功率样本集合分别为Ik={Ik,nΔt},gk={gk,nΔt},Δt=ΔT/Mt,n=1,...,Mt,则用户k在ΔT间隔内Mt个样本的平均干扰功率为
Figure BDA0003587819620000093
和平均有用信号功率为
Figure BDA0003587819620000094
在时刻t,用户k的平均信干噪比和平均可达速率分别为:
Figure BDA0003587819620000095
Figure BDA0003587819620000096
在时刻t,平均总能效和效用函数分别为:
Figure BDA0003587819620000097
Figure BDA0003587819620000098
4、算法设计
深度决斗算法采用强化学习的框架,其实现要素的设计如下:
(1)动作:动作a(t)取值为0~M,0表示维持当前状态不变,其它取值表示第a(t)个AP采取与之前状态相反的动作。例如,假设在时刻t第i个AP处于开启状态,a(t)=i表示第i个AP在下一时刻将关闭。
(2)奖励:基于效用函数设计奖励机制,效用函数
Figure BDA0003587819620000099
能权衡用户在强化学习过程中的总能效和QoS需求,强化学习的奖励机制是在特定状态下执行动作后从环境收到的反馈,用于反映
Figure BDA00035878196200000911
学习算法的目的,即最大化效用函数
Figure BDA00035878196200000910
因此,奖励函数定义为两个时间间隔内效用函数的增量,即
Figure BDA0003587819620000101
(3)状态空间
强化学习中的状态空间可以表示为离散变量或连续变量。在离散状态空间中,当状态空间很小时,强化学习算法可以很快收敛到最佳策略。在本案例中,状态空间的大小为2M。随着无线网络密度增加,AP个数M增加,状态空间的大小呈指数递增,这使得算法收敛缓慢。为了解决这个问题,传统的优化方法算法通常通过聚类的方式将整个状态空间划分为更小的子空间,但是不论是按照总能效最大划分还是按照可达速率最大划分,都不能准确地反馈系统性能的权衡,而且这些方法需要提前收集大量样本进行离线训练。为了解决该问题,本发明将权衡后的效用函数进行离散化分级,将连续的效用函数
Figure BDA0003587819620000102
从小到大划分为P个不同等级的离散效用函数值
Figure BDA0003587819620000103
则离散效用函数值序列为
Figure BDA0003587819620000104
Figure BDA0003587819620000105
其中,
Figure BDA0003587819620000106
Figure BDA0003587819620000107
为最小效用函数值,
Figure BDA0003587819620000108
为最大效用函数值。基于效用函数的离散化,状态空间被划分为多个状态子空间。假设状态s对应的效用函数值为
Figure BDA0003587819620000109
状态s对应的离散效用函数等级p为:
Figure BDA00035878196200001010
假设第t次马尔科夫过程收集到Mt个样本,根据式(20)得到平均可达速率
Figure BDA00035878196200001011
根据式(21)得到平均总能效
Figure BDA00035878196200001012
再根据式(22)计算得到
Figure BDA00035878196200001013
则时刻t的样本为
Figure BDA00035878196200001014
马尔科夫链样本集为
Figure BDA00035878196200001015
由于样本
Figure BDA00035878196200001016
是从无线网络中的不同时期收集到的,因此在学习过程中会出现样本偏差。即,对于相同的s=s(t)=s(t'),
Figure BDA00035878196200001017
如果
Figure BDA00035878196200001018
则存在样本偏差,该样本偏差导致学习过程不易收敛。为了解决该问题,将不同时刻的样本
Figure BDA00035878196200001019
存储到缓存空间,如果出现样本偏差的情况,则使用历史状态对应的样本。为了避免
Figure BDA00035878196200001020
长期使用历史信息而无法实时适应环境变化,以T为周期初始化样本集
Figure BDA00035878196200001021
的缓存空间。状态空间的大小为2M,当M取值很大时,样本集的索引维度非常大,为了加快缓存空间的检索速度,本发明采用前述的哈希函数检索方法。对状态s(t)进行哈希编码hb(s(t)),根据哈希码索引存取信息
Figure BDA00035878196200001022
通过式(25)能找到与
Figure BDA00035878196200001023
对应的等级p和分级效用函数
Figure BDA00035878196200001024
接下来将确定
Figure BDA00035878196200001025
对应的分级状态
Figure BDA00035878196200001026
定义
Figure BDA00035878196200001027
为效用函数
Figure BDA00035878196200001028
的邻近状态集合:
Figure BDA00035878196200001029
Figure BDA0003587819620000111
中,最大总能效对应的状态定义为分级状态
Figure BDA0003587819620000112
其中t满足
Figure BDA0003587819620000113
值得注意的是,
Figure BDA0003587819620000114
不能靠提前离线训练获取,而是CPU代理在与环境交互过程中实时更新。在确定
Figure BDA0003587819620000115
对应的等级p及其分级样本
Figure BDA0003587819620000116
之后,p个等级的分级样本集更新为:
Figure BDA0003587819620000117
以上操作将实时样本
Figure BDA0003587819620000118
映射到分级样本
Figure BDA0003587819620000119
该分级操作能避免依靠单一评价准则带来的弊端,基于性能权衡的等级划分能更合理的反映状态子空间的性能差异。在实现过程中,
Figure BDA00035878196200001110
需要与
Figure BDA00035878196200001111
内最优状态进行比较更新,从而避免传统分类算法离线训练的非实时不准确性。
状态空间分级算法实现流程如算法1所示,首先从样本
Figure BDA00035878196200001112
中取出s(t)的效用函数
Figure BDA00035878196200001113
然后基于效用函数的离散处理得到分级样本集
Figure BDA00035878196200001114
最后利用以上信息在第8行输出(s(t),a(t),r(t),s(t+1))。
Figure BDA00035878196200001115
深度决斗算法如算法2所示,在数据收集阶段获得投影基向量集,如第9行所示;在深度决斗训练阶段通过使用SINR感知技术、哈希检索法和状态空间分级算法1获取经验信息(s(t),a(t),r(t),s(t+1)),然后在深度决斗DQN框架下有效地学习。相对于其他深度强化学习算法,算法2具有以下优点:首先SINR感知技术可以避免通过前传链路传递高维度毫米波信道CSI信息;其次将状态空间的大小从2M降低到P,提高了算法收敛性;最后,当状态s(t)对应的样本集
Figure BDA0003587819620000121
已存储于缓存空间时,无需重复地与环境交互来获取该样本集。该方法既能降低由于时变环境变化带来的样本偏差,又能减少与复杂环境不必要的交互对前传链路带来的压力,因此适合于无蜂窝毫米波大规模MIMO系统。
Figure BDA0003587819620000122
鉴于无线通信是不断与变化的外界环境交互的过程,本发明利用无线通信领域知识和优化模型,为无蜂窝毫米波大规模MIM0系统设计以总能效最大化为优化目标的智能AP开关模型,主要包括两个模块,即通信模块和强化学习模块。通信模块充分利用现有的通信协议收集数据,强化学习模块用于提取AP激活信息,这两个模块通过CPU代理交互工作。实现框图如图1所示,流程图如图2所示。在通信模块中,CPU代理在前传链路上传递SINR测量信息,而非高维CSI信息。基于大规模MIMO天线阵列结构,CSI的获取需要复杂的矩阵运算,因而基于SINR感知的方法能够减轻前传链路的负担。基于用户测量的SINR值,通信模块引入了哈希函数算法来快速检索缓存空间中的样本以避免样本偏差,并通过对效用函数的分级处理为强化学习模块提供分级状态输入。
深度神经网络需要较高的计算资源,适合解决在大规模通信系统的优化问题。最初的深度决斗网络是为视频游戏开发的,因此这种架构包含了卷积层来处理输入层的图像。本发明旨在解决移动通信系统中的资源优化问题,因此强化学习模块中,使用的深度决斗神经网络结构更简单,它只包含两个全连接结构的隐藏层,以捕获本发明当前工作的特定状态。其中值函数和优势函数都由有两个具有800和800个神经元的隐藏层全连接网络构成。该网络实现了两个隐藏层H1和H2,一个值函数输出层Lv,一个优势函数输出层La来分别估计值函数
Figure BDA0003587819620000131
和优势函数
Figure BDA0003587819620000132
得到深度决斗网络的输出
Figure BDA0003587819620000133
假设|Hi|表示网络层的神经元的个数,则深度决斗神经网络的复杂度为|H1||H2|+|H2||Lv|+|H2||La|,内存池大小为|D|=2000,少量样本大小为64。
在图3中,分别仿真比较了基于SINR的深度决斗算法2(Dueling-DQN-SINR算法)、基于CSI的深度决斗算法(Dueling-DQN-CSI算法)、贪婪算法和随机算法的总能效和平均频谱效率。其中,Dueling-DQN-CSI算法未采用分级操作,且仅需学习三种动作:打开、关闭或者不变。AP的选择不是通过学习获取的,而是在已知CSI信息的情况下选择打开或者关闭能最大化总能效的AP。贪婪算法是一种基于Gauss-Seidel的迭代算法,其算法收敛性与算法初值选取有很大关系,因此是一种次优算法。而随机算法则在每次迭代中随机选择打开或者关闭的AP。
图3(a)显示由于没有能效优化策略,随机算法的总能效最差。同样基于提前获知CSI信息和贪婪策略,Dueling-DQN-CSI算法和Dueling-DQN-SINR算法比贪婪算法能获得更高和更稳定的总能效性能,这也证明了强化学习算法的优势。虽然Dueling-DQN-SINR算法的总能效性能略低于Dueling-DQN-CSI算法,但是由于CPU很难提前获知下一时刻的CSI,而Dueling-DQN-SINR能不依靠提前获取的CSI信息,仅通过SINR感知技术,并采用学习的方式选择AP,因此是一种更实用的方法。图3(b)显示在5000次仿真之后,这四种算法都满足QoS要求,即Rmin=1bit/s/Hz。其中Dueling-DQN-SINR的频谱效率性能更接近QoS要求,这也证明了其效用函数能更紧地满足QoS约束。
最后说明的是,以上实施例仅用以说明本发明的技术方案而非限制,尽管参照较佳实施例对本发明进行了详细说明,本领域的普通技术人员应当理解,可以对本发明的技术方案进行修改或者等同替换,而不脱离本技术方案的宗旨和范围,其均应涵盖在本发明的权利要求范围当中。

Claims (6)

1.一种无蜂窝毫米波大规模MIMO系统的AP开关切换方法,其特征在于,该方法具体包括以下步骤:
S1:构建无蜂窝毫米波大规模MIMO系统基于总能效的优化问题模型;
S2:采用SINR感知技术构建效用函数,以实现QoS约束下总能效最大化为优化目标;
S3:构建强化学习模型,包括以下步骤:
S31:构建状态空间分级算法:首先对效用函数离散化分级处理,将状态空间划分为多个状态子空间;然后采用哈希检索法对状态进行哈希编码;最后根据状态空间分级算法更新状态;
S32:深度决斗算法:使用步骤S31更新的状态信息在深度决斗DQN框架下学习,更新网络参数。
2.根据权利要求1所述的AP开关切换方法,其特征在于,步骤S1中,无蜂窝毫米波大规模MIMO系统中,假设系统配置有M个AP和K个用户,每个AP有Nt根天线和
Figure FDA0003587819610000011
个射频链;每个用户有Nr,k根天线,数据流数为Ns,k;每个用户的带宽为B0,假设系统工作在TDD模式,通过上行训练实现信道估计;每个用户由特定的AP集群提供最好的服务;定义
Figure FDA0003587819610000012
为第m个AP提供服务的用户集群,集群中的最大用户数为NUE,max
Figure FDA0003587819610000013
表示为第k个用户提供服务的AP集群,集群中的最大AP数为NAP,max;第k个用户和第m个AP之间的信道为
Figure FDA0003587819610000014
该信道采用基于簇的大规模MIMO信道;
构建无蜂窝毫米波大规模MIMO系统基于总能效的优化问题模型,具体包括:针对无蜂窝毫米波大规模MIMO系统基于总能效的AP开关切换策略,定义M个AP的开关映射关系为状态s=[o1,...,om,...,oM],om=1表示第m个AP打开,om=0表示第m个AP关闭,AP激活集合为
Figure FDA0003587819610000015
以状态s为目标变量,第k个用户的干扰协方差矩阵加上有效噪声为Rk,则第k个用户的下行可达速率
Figure FDA0003587819610000016
总能效
Figure FDA0003587819610000017
分别表示为:
Figure FDA0003587819610000018
Figure FDA0003587819610000019
Figure FDA00035878196100000110
Figure FDA00035878196100000111
其中,I表示单位矩阵,PT(s)表示总功率,Lk表示第k个用户的合并器,k表示第k个用户,l表示第l个用户,
Figure FDA0003587819610000021
为噪声功率,pm,k为第m个AP分配给第k个用户的功率,Hm,k表示第m个AP和第k个用户之间的信道矩阵,Fm,l表示第m个AP对第l个用户的预编码矩阵;
以状态s作为目标变量的优化问题表示为:
Figure FDA0003587819610000022
其中,Pmax表示每个AP的传输功率限制,Rmin表示每个用户的最小频谱效率限制。
3.根据权利要求2所述的AP开关切换方法,其特征在于,步骤S2中,构建效用函数具体包括:定义效用函数
Figure FDA0003587819610000023
为:
Figure FDA0003587819610000024
其中,
Figure FDA0003587819610000025
表示对下行可达速率的满意度,
Figure FDA0003587819610000026
表示对系统总能效的满意度;μ为加权系数,取值在0和1之间,最优μ值的选择需要基于最小化
Figure FDA0003587819610000027
和Rmin间的差值来最大化系统总能效,即解决
Figure FDA0003587819610000028
其中,εr表示误差容忍度;
确定最优加权系数μ:假设
Figure FDA0003587819610000029
为在无QoS约束下的最大总能效;Rmax为系统最大可达速率,对应的总能效为
Figure FDA00035878196100000210
定义可达速率满意函数
Figure FDA00035878196100000211
能效满意函数
Figure FDA00035878196100000212
和加权系数μ分别为:
Figure FDA00035878196100000213
Figure FDA00035878196100000214
Figure FDA00035878196100000215
其中,
Figure FDA00035878196100000216
表示总能效,ω表示满意度加权系数。
4.根据权利要求3所述的AP开关切换方法,其特征在于,步骤S2中,SINR感知技术具体包括:第k个用户的信干噪比为
Figure FDA00035878196100000217
其中,gk(s)为有用信号功率,Ik(s)为信道干扰功率,σ2为噪声功率,则下行可达速率可表示为:
Figure FDA0003587819610000031
在AP与CPU代理的交互过程中,假设在时刻t-ΔT与时刻t之间,所有AP的激活状态s(t)保持不变,CPU代理通过多次与环境交互收集所有用户的干扰功率和有用信号功率,该时间间隔内用户k的干扰功率和有用信号功率样本集合分别为Ik={Ik,nΔt},gk={gk,nΔt},Δt=ΔT/Mt,n=1,...,Mt,则用户k在ΔT间隔内Mt个样本的平均干扰功率为
Figure FDA0003587819610000032
和平均有用信号功率为
Figure FDA0003587819610000033
在时刻t,用户k的平均信干噪比和平均可达速率分别为:
Figure FDA0003587819610000034
Figure FDA0003587819610000035
在时刻t,平均总能效和效用函数分别为:
Figure FDA0003587819610000036
Figure FDA0003587819610000037
5.根据权利要求4所述的AP开关切换方法,其特征在于,步骤S31中,构建状态空间分级算法具体包括:将权衡后的效用函数进行离散化分级,将连续的效用函数
Figure FDA00035878196100000323
从小到大划分为P个不同等级的离散效用函数值
Figure FDA0003587819610000038
则离散效用函数值序列为
Figure FDA0003587819610000039
Figure FDA00035878196100000310
其中,
Figure FDA00035878196100000311
Figure FDA00035878196100000312
为最小效用函数值,
Figure FDA00035878196100000313
为最大效用函数值;基于效用函数的离散化,状态空间被划分为多个状态子空间;假设状态s对应的效用函数值为
Figure FDA00035878196100000314
状态s对应的离散效用函数等级p为:
Figure FDA00035878196100000315
假设第t次马尔科夫过程收集到Mt个样本,根据式(14)得到平均可达速率
Figure FDA00035878196100000316
根据式(15)得到平均总能效
Figure FDA00035878196100000317
再根据式(16)计算得到
Figure FDA00035878196100000318
则时刻t的样本为
Figure FDA00035878196100000319
马尔科夫链样本集为
Figure FDA00035878196100000320
将不同时刻的样本
Figure FDA00035878196100000321
存储到缓存空间,如果出现样本偏差的情况,则使用历史状态对应的样本;为了避免
Figure FDA00035878196100000322
长期使用历史信息而无法实时适应环境变化,以T为周期初始化样本集
Figure FDA0003587819610000041
的缓存空间;状态空间的大小为2M,当M取值很大时,采用哈希检索方法,对状态s(t)进行哈希编码hb(s(t)),根据哈希码索引存取信息
Figure FDA0003587819610000042
通过式(18)能找到与
Figure FDA0003587819610000043
对应的等级p和分级效用函数
Figure FDA0003587819610000044
接下来将确定
Figure FDA0003587819610000045
对应的分级状态
Figure FDA0003587819610000046
定义
Figure FDA0003587819610000047
为效用函数
Figure FDA0003587819610000048
的邻近状态集合:
Figure FDA0003587819610000049
Figure FDA00035878196100000410
中,最大总能效对应的状态定义为分级状态
Figure FDA00035878196100000411
其中t满足
Figure FDA00035878196100000412
值得注意的是,
Figure FDA00035878196100000413
不能靠提前离线训练获取,而是CPU代理在与环境交互过程中实时更新;在确定
Figure FDA00035878196100000414
对应的等级p及其分级样本
Figure FDA00035878196100000415
之后,p个等级的分级样本集更新为:
Figure FDA00035878196100000416
在实现过程中,
Figure FDA00035878196100000417
需要与
Figure FDA00035878196100000418
内最优状态进行比较更新。
6.根据权利要求5所述的AP开关切换方法,其特征在于,步骤S32具体包括:在深度决斗训练阶段通过使用SINR感知技术、哈希检索法和状态空间分级算法获取经验信息(s(t),a(t),r(t),s(t+1)),然后在深度决斗DQN框架下有效地学习。
CN202210369904.6A 2022-04-08 2022-04-08 一种无蜂窝毫米波大规模mimo系统的ap开关切换方法 Active CN114980156B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210369904.6A CN114980156B (zh) 2022-04-08 2022-04-08 一种无蜂窝毫米波大规模mimo系统的ap开关切换方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210369904.6A CN114980156B (zh) 2022-04-08 2022-04-08 一种无蜂窝毫米波大规模mimo系统的ap开关切换方法

Publications (2)

Publication Number Publication Date
CN114980156A true CN114980156A (zh) 2022-08-30
CN114980156B CN114980156B (zh) 2024-04-19

Family

ID=82976580

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210369904.6A Active CN114980156B (zh) 2022-04-08 2022-04-08 一种无蜂窝毫米波大规模mimo系统的ap开关切换方法

Country Status (1)

Country Link
CN (1) CN114980156B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116827392A (zh) * 2023-06-30 2023-09-29 南京邮电大学 含毫米波接入点的无蜂窝大规模mimo部署方法及系统

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101466111A (zh) * 2009-01-13 2009-06-24 中国人民解放军理工大学通信工程学院 基于政策规划约束q学习的动态频谱接入方法
CN102090115A (zh) * 2008-07-11 2011-06-08 马维尔国际贸易有限公司 用于接入点的功率节省模式
WO2015044343A2 (en) * 2013-09-27 2015-04-02 Thomson Licensing Method for testing a wireless link of a wi-fi node, and circuit performing the method
US20180220372A1 (en) * 2017-02-01 2018-08-02 Qualcomm Incorporated Adaptive power save with reinforcement learning
CN108664614A (zh) * 2017-05-12 2018-10-16 华中师范大学 基于教育大数据的学习者模型动态构建方法
CN109660995A (zh) * 2018-12-07 2019-04-19 上海交通大学 基于机器学习算法的WiFi系统中AP智能节能控制方法及设备
CN111095990A (zh) * 2017-09-08 2020-05-01 交互数字Ce专利控股公司 选择性改变无线接入点的激活状态

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102090115A (zh) * 2008-07-11 2011-06-08 马维尔国际贸易有限公司 用于接入点的功率节省模式
CN101466111A (zh) * 2009-01-13 2009-06-24 中国人民解放军理工大学通信工程学院 基于政策规划约束q学习的动态频谱接入方法
WO2015044343A2 (en) * 2013-09-27 2015-04-02 Thomson Licensing Method for testing a wireless link of a wi-fi node, and circuit performing the method
US20180220372A1 (en) * 2017-02-01 2018-08-02 Qualcomm Incorporated Adaptive power save with reinforcement learning
CN108664614A (zh) * 2017-05-12 2018-10-16 华中师范大学 基于教育大数据的学习者模型动态构建方法
CN111095990A (zh) * 2017-09-08 2020-05-01 交互数字Ce专利控股公司 选择性改变无线接入点的激活状态
CN109660995A (zh) * 2018-12-07 2019-04-19 上海交通大学 基于机器学习算法的WiFi系统中AP智能节能控制方法及设备

Non-Patent Citations (5)

* Cited by examiner, † Cited by third party
Title
GUILLEM FEMENIAS: "Access Point Switch ON/OFF Strategies for Green Cell-Free Massive MIMO Networking", 《IEEE ACCESS 》, 28 January 2020 (2020-01-28) *
JAN GARCÍA-MORALES: "Energy-Efficient Access-Point Sleep-Mode Techniques for Cell-Free mmWave Massive MIMO Networks With Non-Uniform Spatial Traffic Density", 《IEEE ACCESS》, 27 June 2020 (2020-06-27) *
SOOJUNG JUNG等: "Performance analysis of Access Point Switch ON/OFF schemes for Cell-free mmWave massive MIMO UDN systems", 《2021 INTERNATIONAL CONFERENCE ON INFORMATION AND COMMUNICATION TECHNOLOGY CONVERGENCE (ICTC)》, 7 December 2021 (2021-12-07) *
李怡静: "面向5G超密集网络的动态自主节能方法", 《CNKI硕士电子期刊》, 15 January 2022 (2022-01-15) *
章嘉懿;: "去蜂窝大规模MIMO系统研究进展与发展趋势", 重庆邮电大学学报(自然科学版), no. 03, 15 June 2019 (2019-06-15) *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116827392A (zh) * 2023-06-30 2023-09-29 南京邮电大学 含毫米波接入点的无蜂窝大规模mimo部署方法及系统
CN116827392B (zh) * 2023-06-30 2024-05-24 南京邮电大学 含毫米波接入点的无蜂窝大规模mimo部署方法及系统

Also Published As

Publication number Publication date
CN114980156B (zh) 2024-04-19

Similar Documents

Publication Publication Date Title
CN111666149A (zh) 基于深度强化学习的超密边缘计算网络移动性管理方法
CN112383922A (zh) 一种基于优先经验重放的深度强化学习频谱共享方法
Wang et al. Distributed reinforcement learning for age of information minimization in real-time IoT systems
CN109831808B (zh) 一种基于机器学习的混合供电c-ran的资源分配方法
CN112492691A (zh) 一种深度确定性策略梯度的下行noma功率分配方法
CN111526592A (zh) 一种用于无线干扰信道中的非协作多智能体功率控制方法
Lei et al. Joint beam training and data transmission control for mmWave delay-sensitive communications: A parallel reinforcement learning approach
Mao et al. AI based service management for 6G green communications
Ye et al. Learning-based computing task offloading for autonomous driving: A load balancing perspective
CN114980156B (zh) 一种无蜂窝毫米波大规模mimo系统的ap开关切换方法
CN114615730A (zh) 回程受限密集无线网络面向内容覆盖的功率分配方法
CN113473580B (zh) 异构网络中基于深度学习的用户关联联合功率分配方法
Mendoza et al. Deep reinforcement learning for dynamic access point activation in cell-free MIMO networks
Luo et al. Communication-aware path design for indoor robots exploiting federated deep reinforcement learning
Shi et al. Active RIS-aided EH-NOMA Networks: A Deep Reinforcement Learning Approach
CN111065121B (zh) 一种考虑小区差异的密集网络能耗及能效联合优化方法
Mei et al. Semi-decentralized network slicing for reliable V2V service provisioning: A model-free deep reinforcement learning approach
Shui et al. Cell-free networking for integrated data and energy transfer: Digital twin based double parameterized DQN for energy sustainability
Nguyen et al. Utility optimization for blockchain empowered edge computing with deep reinforcement learning
Cui et al. Hierarchical learning approach for age-of-information minimization in wireless sensor networks
Huang et al. Joint AMC and resource allocation for mobile wireless networks based on distributed MARL
CN115633402A (zh) 一种面向混合业务吞吐量优化的资源调度方法
CN113595609B (zh) 一种基于强化学习的蜂窝移动通信系统协作式信号发送方法
Zhang et al. Intelligent cloud-edge collaborations assisted energy-efficient power control in heterogeneous networks
CN114844538A (zh) 一种基于宽学习的毫米波mimo用户增量协作波束选择方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant