CN111446999A - 基于多臂强盗的位置辅助波束对准方法及其系统 - Google Patents

基于多臂强盗的位置辅助波束对准方法及其系统 Download PDF

Info

Publication number
CN111446999A
CN111446999A CN202010222939.8A CN202010222939A CN111446999A CN 111446999 A CN111446999 A CN 111446999A CN 202010222939 A CN202010222939 A CN 202010222939A CN 111446999 A CN111446999 A CN 111446999A
Authority
CN
China
Prior art keywords
beams
subset
beam alignment
ucb
alignment method
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
CN202010222939.8A
Other languages
English (en)
Inventor
王鑫琦
易辉跃
张武雄
许晖
裴俊
于巧玲
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai Institute of Microsystem and Information Technology of CAS
Shanghai Research Center for Wireless Communications
Original Assignee
Shanghai Institute of Microsystem and Information Technology of CAS
Shanghai Research Center for Wireless Communications
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai Institute of Microsystem and Information Technology of CAS, Shanghai Research Center for Wireless Communications filed Critical Shanghai Institute of Microsystem and Information Technology of CAS
Priority to CN202010222939.8A priority Critical patent/CN111446999A/zh
Publication of CN111446999A publication Critical patent/CN111446999A/zh
Withdrawn legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04BTRANSMISSION
    • H04B7/00Radio transmission systems, i.e. using radiation field
    • H04B7/02Diversity systems; Multi-antenna system, i.e. transmission or reception using multiple antennas
    • H04B7/04Diversity systems; Multi-antenna system, i.e. transmission or reception using multiple antennas using two or more spaced independent antennas
    • H04B7/08Diversity systems; Multi-antenna system, i.e. transmission or reception using multiple antennas using two or more spaced independent antennas at the receiving station
    • H04B7/0868Hybrid systems, i.e. switching and combining
    • H04B7/088Hybrid systems, i.e. switching and combining using beam selection
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04BTRANSMISSION
    • H04B7/00Radio transmission systems, i.e. using radiation field
    • H04B7/02Diversity systems; Multi-antenna system, i.e. transmission or reception using multiple antennas
    • H04B7/04Diversity systems; Multi-antenna system, i.e. transmission or reception using multiple antennas using two or more spaced independent antennas
    • H04B7/06Diversity systems; Multi-antenna system, i.e. transmission or reception using multiple antennas using two or more spaced independent antennas at the transmitting station
    • H04B7/0686Hybrid systems, i.e. switching and simultaneous transmission
    • H04B7/0695Hybrid systems, i.e. switching and simultaneous transmission using beam selection
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W16/00Network planning, e.g. coverage or traffic planning tools; Network deployment, e.g. resource partitioning or cells structures
    • H04W16/24Cell structures
    • H04W16/28Cell structures using beam steering

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Mobile Radio Communication Systems (AREA)

Abstract

本发明公开了一种基于多臂强盗的位置辅助波束对准方法及其系统。该方法包括如下步骤:获取接收器的位置信息;根据位置信息选择LOS路径的多个LOS波束,形成LOS子集;从剩余的波束中选择多个拥有最大UCB值的NLOS路径的多个NLOS波束,形成NLOS子集;在波束对准期间,根据LOS子集和NLOS子集中的所有路径的信道状态,选择具有最大路径增益的多个波束;在数据传输期间,通过选择的波束并行传输数据流,并获得波束的UCB奖励值;基于UCB奖励值,更新波束的平均回报。本发明增大了波束对准概率,实现了减小计算复杂度、提高频谱效率的目的。

Description

基于多臂强盗的位置辅助波束对准方法及其系统
技术领域
本发明涉及一种波束对准方法,尤其涉及一种用在毫米波通信系统中、基于多臂强盗的位置辅助波束对准方法,同时也涉及相应的波束对准系统,属于毫米波通信技术领域。
背景技术
目前,第五代移动通信网络(5G)已经开始进入商用化阶段。5G所使用的频段包括两个部分:一个是sub-6GHz频段,一个是毫米波频段。其中,毫米波频段不存在严重的互干扰,加上能够提供更大的信号带宽,被普遍认为是5G中最有潜力的技术方向。
在毫米波通信系统中,由于毫米波信道的稀疏性,传播路径通常通过搜索每个路径的波束来估计。在高速移动场景中,毫米波信道快速变化,并且每个传输时间间隔的周期太短,无法为准确的波束对准分配足够的时间。而且,每个传输时间间隔(TTI)的测量次数受到限制,在波束对准过程中选择要测量的路径就变得非常重要。现有的毫米波通信系统采用大型天线阵列,波束宽度很窄,使得信道条件变化很快,波束对准周期长、计算复杂度较高,因此不适用于高速移动场景。
现有技术中的波束对准算法大致可以分为四类:1)通过波束扫描(也称波束搜索)实现波束对准;2)通过估计到达角(AoAs)和离开角(AoDs)估计信道,从而实现波束对准;3)将波束训练的过程看作一个黑盒优化问题求解,从而实现波束对准;4)利用边信息辅助实现波束对准。但是,上述算法各自都存在一定的局限性。例如,波束扫描算法的时间复杂度比较高,搜索效率很低。AoA/AoD信道估计算法、波束训练优化算法和边信息辅助算法的实施过程非常复杂,而且应用范围比较受限。
多臂强盗(multi-armed bandit,简写为MAB)是一种前沿的机器学习算法。它的实质是如何以最佳方式分配资源。一种策略是先探索可用选项,然后把所有剩余资源分配给表现最佳的选项。这个策略叫作A/B测试。另一种策略是给表现最佳的选项逐渐分配更多的资源。这个策略叫作epsilon递减策略。在申请号为201910581217.9的中国专利申请中,公开了一种基于双层多臂强盗统计模型的频谱机会接入方法。该方法包括如下步骤:首先使用双层多臂强盗统计学模型,建模信道感知与接入过程;然后分析次用户运行场景,如果属于单主用户站下的认知网络,则采用同构信道感知接入方法进行频谱机会接入;如果属于多主用户站下的认知网络,则采用异构信道感知接入方法进行频谱机会接入。
发明内容
本发明所解决的首要技术问题在于提供一种基于多臂强盗的位置辅助波束对准方法。
本发明所解决的另一技术问题在于提供一种用于实施上述方法的位置辅助波束对准系统。
为实现上述发明目的,本发明采用下述的技术方案:
根据本发明实施例的第一方面,提供一种基于多臂强盗的位置辅助波束对准方法,包括如下步骤:
步骤1:获取接收器的位置信息;
步骤2:根据所述位置信息选择LOS路径的多个LOS波束,形成LOS子集;
步骤3:从剩余的波束中选择多个拥有最大UCB值的NLOS路径的多个NLOS波束,形成NLOS子集;
步骤4:在波束对准期间,根据所述LOS子集和所述NLOS子集中的所有路径的信道状态,选择具有最大路径增益的多个波束;
步骤5:在数据传输期间,通过在步骤4中选择的所述波束并行传输数据流,并获得所述波束的UCB奖励值;
步骤6:基于所述UCB奖励值,更新所述步骤4中选择的所述波束的平均回报。
其中较优地,在更新各路径的平均回报时,对所述步骤4中选择的所述波束,基于所述步骤4中获得的所述波束的UCB奖励值进行更新;对其他波束,令UCB奖励值为0进行更新。
其中较优地,所述步骤3中,所述最大UCB索引值是基于UCB法的平均回报与置信空间之和。
其中较优地,所述步骤4中,所述最大路径增益是指在波束对准期间,发射器在所述LOS子集和所述NLOS子集中的所有路径发出导频信号,接收器接收到所述导频信号,并计算平均接收导频信号功率,将所述平均接收导频信号功率进行排序,选择最大的特定数量的所述平均接收导频信号功率对应的波束。
其中较优地,所述多个LOS波束是所述LOS路径所在位置的附近的多个波束。
其中较优地,所述多个LOS波束或所述多个NLOS波束的数量,均大于或等于所述步骤5中并行传输数据流的波束的数量。
其中较优地,所述UCB奖励值是每个波束的传输速率或信号功率。
其中较优地,所述步骤3中,最大UCB值N(i)是根据下式计算的:
Figure BDA0002426697940000031
式中,μi是已观测到的所述NLOS子集中的波束i的平均回报值,t为时隙数,ni为所述NLOS子集中的波束i当前累积被选中的次数,c是预先设定的常数。
根据本发明实施例的第二方面,提供一种基于多臂强盗的位置辅助波束对准系统,包括发射器和接收器,所述发射器和所述接收器均具有线性阵列天线,所述位置辅助波束对准系统执行上述的方法。
与现有技术相比较,本发明创造性地将高速移动场景下的波束对准问题表述为MAB问题,并将MAB问题求解与位置辅助有机相结合,使用位置辅助有效地减少了需要测量的波束对数量,缩短了波束对准时长。同时,利用位置信息直接计算LOS路径子集,避免了现有上置信界算法陷入局部最优而选择次优路径的情况,从而增大了波束对准概率,实现了减小计算复杂度、提高频谱效率的目的。
附图说明
图1为本发明中,第一实施例的系统模型示意图;
图2为本发明中,第一实施例的流程示意图;
图3为本发明中,第二实施例的系统模型示意图;
图4为本发明中,第二实施例的流程示意图;
图5为本发明提供的位置辅助波束对准方法与常规方法在频谱效率上的累积损耗对比图;
图6为本发明提供的位置辅助波束对准方法与常规方法在频谱效率上的CDF对比图;
图7为本发明中,基于极坐标的位置信息示例图。
具体实施方式
下面结合附图和具体实施例对本发明的技术内容进行详细具体的说明。
<第一实施例>
本实施例介绍将本发明提供的位置辅助波束对准方法应用于无线通信的具体场景。
图1显示了用于实施该位置辅助波束对准方法的大规模毫米波MIMO系统。在本发明的一个实施例中,选择均匀线性阵列(Uniform Linear Array,简写为ULA)。其中,作为发射机Tx的基站1(简写为BS)的均匀线性阵列是具有Mt个阵元且具有半波长天线间隔的MTt×1维的第一均匀线性阵列;作为接收机Rx的用户设备(简写为UE)的均匀线性阵列是具有Mr个阵元且具有半波长天线间隔的MrR×1维的第二均匀线性阵列。如图1所示,基站1端具有Nt条射频链路和Nt×Mt根天线组成的第一均匀线性阵列。它们基于正交多址接入技术,同时服务于Nr个用户设备。每个基站可以同时服务的用户设备数受限于其射频链路数,即Nr≤Nt,其中Nr、Nt均为正整数。
基站1将数据矢量Ns(即发送信号,代表Ns×1路数据)通过数字预编码器FBB处理得到数字预编码矩阵,通过Nt路射频链路1(这里,收发单元TXRU起到射频链路的功能),输入到由Nt×Mt个相移器构成的模拟预编码单元,处理为Nt×Mt矩阵矢量,经Nt×Mt天线阵列发出射频发送信号。基站1中每一路收发单元TXRU1与Mt个相移器连接,每一个相移器连接一根天线,因此Nt路收发单元TXRU连接Nt×Mt根天线组成的第一的均匀线性阵列。用户设备2中有Nr×Mr根天线组成的第二均匀线性阵列,分别与Nr个相移器连接,再连接到Nr路第二收发单元TXRU2。每一路第二收发单元TXRU2与Mr根第二相移器连接。Nr路第二收发单元TXRU均连接到第二数字预编码器WBB。这是3GPP标准中规定的自适应天线系统AAS的结构,在此不再赘述。
基站1(发射机(Tx))的第一均匀线性阵列可以在用户设备的方位域上生成Nt个波束,用户设备(接收机(Rx))可以在基站的方向上生成Nr个波束。因此,发射机(Tx)具有Nt个天线单元;接收机(Rx)具有Nr个天线单元。定义第i个基站(1≤i≤Nt)发送的波束赋形(beamforming,BF)矢量为
Figure BDA0002426697940000051
第j个用户设备(1≤j≤Nr)接收到的波束赋形矢量为
Figure BDA0002426697940000052
则接收信号可以表示为:
Figure BDA0002426697940000053
其中,
Figure BDA0002426697940000054
是信道矩阵,发送的导频信号x使得E[|x|2]=P,其中P是波束对准期间的发射功率;
Figure BDA0002426697940000055
是高斯噪声矢量。
在毫米波通信系统中,当两个基站之间或者是用户设备与基站之间没有遮挡的时候,所使用的信道为LOS(Line of Sight)信道,使用LOS信道的波束构成当前波束的LOS子集;当发射端与接收器之间有建筑、植物遮挡的时候,除了衰减,信号还有反射、衍射和穿透损耗,所使用的信道为NLOS(Non Line of Sight)信道,使用NLOS信道的波束构成当前波束的NLOS子集。在NLOS信道中,多径效应明显。因为LOS信道衰减少,所以跟NLOS信道相比,LOS信道模型的信号质量更好,吞吐量越大。
前已述及,现有的波束对准算法难以满足高速移动场景下毫米波通信系统的要求。为此,本发明所提供的位置辅助波束对准方法分两步实现快速且有效的波束对准。其中,第一步是利用位置信息直接获得部分训练子集;从余下波束中选出另一部分子集,将两部分子集合并为一个完整的子集;第二步利用所得子集进行导频传输,选择其中最佳的波束用于进一步的数据传输。这样可以减少迭代次数,从而降低算法复杂度,大大减少计算时间。下面对此展开详细具体的说明。
研究表明,毫米波高速移动场景下的波束搜索和波束对准问题可以表示为MAB(multi-armed bandit,多臂老虎机或多臂强盗)问题,以MAB模型来解决。根据强盗(bandit)术语,将一组波束对命名为一个臂(arm),各组波束对应不同的臂。定义两种强盗信息:第一个是在时隙t(一个时隙对应于一个TTI周期),臂i被选择到的次数,表示为ni,第二个是臂i获得的历史奖励的平均值μi。将上述两种强盗信息初始化为零。
图1所示的系统模型中波束对数量为NrNt,即有NrNt个臂(arm),也就是基站的收发单元数量(Nt)与用户设备的收发单元数量(Nr)之积。基于图1的模型,在每个时隙t∈{1,2,...}中,先从NrNt个臂中选择由m1个LOS臂组成的子集M1,然后从剩余的(NrNt-m1)个臂中选择拥有最大UCB(the-upper-confidence-bound,上置信界)值的m2个NLOS臂组成的子集M2,然后合并NLOS子集M2与LOS子集M1,得到训练子集M(M=M1+M2)(M的大小为m′=m1+m2)用于波束对准。利用所得训练子集进行导频信号传输。考虑到毫米波高速移动通信的限制,训练子集M的大小远小于NrNt。m1和m2均为预设的常数,满足m1+m2>D,D为移动通信系统并行传输所需的波束数量。
在波束对准之后,选择具有D个最大路径增益的D(D<M)个臂,即最佳的波束(arm),用于数据传输。每个被选择的波束(arm)i∈{1,...,NtNr}在第t个时隙贡献的特定的传输速率,称为奖励xi(t)。根据接收的信号计算奖励xi(t),并且反馈该信息以更新波束搜索的信息。然后返回检测循环,等待下一个波束对准请求。
由于在毫米波通信系统中,MIMO通信的空间散射受限且天线相关性严重,本发明实施例中优选采用几何Saleh-Valenzuela信道模型,可以准确地捕捉到毫米波信道中存在的数学结构。鉴于毫米波信道的稀疏性,本发明实施例中使用具有L个散射体的几何信道模型,其中每个散射体贡献单个传播路径。在该模型下,信道矩阵H可以表示为:
Figure BDA0002426697940000071
其中,ρ表示取决于载波频率、接收器与发射器之间的距离,以及信道传播环境的平均路径损耗;
Figure BDA0002426697940000072
l∈{1,2,...,L}是假设为高斯分布的复合路径增益;
Figure BDA0002426697940000073
是平均功率增益;vl是第l条路径的多普勒频移。对于每条路径,出发和到达的方位角(AoAs/AoDs)由φl和θl表示。矢量ar(θ)和at(φ)分别表示接收器和发射器的阵列响应矢量。采用均匀线性阵列(ULA)时,ar(θ)和at(φ)可定义为:
Figure BDA0002426697940000074
在基站1(发射器),反复运行本发明提供的位置辅助波束对准方法进行自学习。在每次迭代中,它都会根据ar(θ)和at(φ)(位置信息)推荐波束对。并且,在接收到这些波束对的传输速率测量值后,基站1更新其数据库中记录的学习参数。
考虑到毫米波通信系统在高速移动场景下的限制,可以假设训练子集M值远小于NrNt值。将每个选中的臂
Figure BDA0002426697940000075
贡献的特定的传输速率,称为奖励xi(t)。根据接收的信号计算奖励xi(t),并且反馈该信息以更新波束对准的信息。
下面结合图2详细说明本发明提供的位置辅助波束对准方法。
假设图1的信道H中的每个路径(波束)都为一个臂,共有NrNt个臂,Nr为接收器的天线数量;Nt为发射器的天线数量。第i组波束(臂i)的UCB奖励值xi初始值为0(根据应用场景的实际需要,也可以是其他预设值),平均回报值μi的初始值为0,第i组波束被选择的次数ni初始值为0。在本实施例中以发射器为基站,接收器为用户设备为例进行说明。
步骤1:发射器端获取接收器的位置信息。
结合图2和图7所示,极坐标中的原点设置在发射器(基站或BS)的中心。每个接收端和发送端的位置都由相对于接收器(用户设备或RX)到原点的距离φ,以及相对于发射器的方向与x轴之间的夹角(即极角)θ来表示。因此接收器的位置被编码为(φ,θ)。
在每个时隙t∈{1,2,...}开始时,发射器(基站1)计算其接收到的用户设备2的位置信息。将位置信息用接收器和发射器的阵列响应矢量ar(θ)和at(φ)表示。
步骤2:根据位置信息选择LOS路径的m1个波束,形成LOS子集。
通过极坐标给发送器和接收器进行建模,得到收发端的极坐标模型图,如图7所示。对此,可以参阅如下论文:T.Kim and D.J.Love,"Virtual AoA and AoD estimationfor sparse millimeter wave MIMO channels"2015IEEE 16th International Workshopon Signal Processing Advances in Wireless Communications(SPAWC),Stockholm,2015,pp.146-150。
根据每对波束的位置信息,基站1可以定位出:从发射器到接收器(基站1到用户设备2)的LOS路径所在的位置,为NrNt个波束中的第j个波束(LOS路径波束)。将第j个波束放入LOS子集M1
由于这一步中定位的LOS路径并不一定准确,所以需要将第j个波束位置附近的多个波束作为备选波束,也放入LOS子集M1
这样,基站1从NrNt个波束中选择m1(m1>D)个LOS路径的波束,组成LOS子集M1
Figure BDA0002426697940000081
其中,m为预设常数,m1=2m+1。式(4)表示在LOS路径波束(第j个波束)附近对称选择多个波束。根据应用场景的Qos或者其他需求,基于仿真结果来确定m1的取值。
步骤3:从剩余的(NrNt-m1)个波束中选择m2个拥有最大UCB索引值的NLOS路径的波束,形成NLOS子集M2
针对不在LOS子集M1内的臂,即在(NrNt-m1)个波束中的臂,按照式5计算各波束的UCB索引值。从这(NrNt-m1)个NLOS波束中,根据UCB索引值N(i),选择m2个拥有最大UCB索引值N(i)的波束,组成NLOS子集M2。根据应用场景的Qos或者其他需求,基于仿真结果来确定m2的取值。在本实施例中m2>D,但是只要满足m1+m2>D,并不要求m1和m2均大于D。
尽管可以利用历史信息来缩短波束搜索,但是高速移动通信的实际传播环境不是静态的。换句话说,相关臂的预期奖励随时间缓慢变化。因此,总是需要进行探索不同的臂。本发明提供的位置辅助波束对准方法是从剩余的子集中选择部分波束,形成NLOS路径子集,作为候选波束。因为本发明提供的位置辅助波束对准方法搜索了所有可用路径,包括LOS路径和NLOS路径,可以选择最优路径以最大化传输速率。
对于(NrNt-m1)个波束中的臂(波束)i,计算臂i的UCB值N(i):
Figure BDA0002426697940000091
式(5)中,μi是已观测到的臂i的平均回报值,t为时隙数(也是累积选择的次数),ni为臂i当前累积被选中的次数,c是一个常数。c决定了控制探索程度的置信度的宽度。所谓置信度,是UCB算法中定义的参数,是表示对于μi的估计的确信程度。可以简单地理解为不确定性的程度,区间越宽,越不确定。每个臂的平均回报μi都有个置信区间,随着试验次数增加,回报μi的置信区间会变窄(逐渐确定了到底回报是丰厚还是可怜)。如果置信区间很宽(表示被选次数很少,还不确定该臂的回报的大小),那么该臂会倾向于被多次选择;如果置信区间很窄(被选次数已很多,比较确定该臂的回报的大小),那么平均回报μi大的臂倾向于被多次选择。
在每次选择前,都需要根据已知结果重新估计每个臂的平均回报值μi及置信空间
Figure BDA0002426697940000101
根据式(6)可以选出具有最大UCB索引值N(i)的m2个波束:
Figure BDA0002426697940000102
即,对LOS集合M1之外的臂,计算各臂的UCB索引值,并按照从大到小进行排序,取前m2个最大的UCB索引值对应的臂(波束)。在选择m2个臂后,可以获得臂的NLOS集合M2
Figure BDA0002426697940000103
合并LOS子集M1和NLOS子集M2,得到训练子集(参见式8)。训练子集中包括m1+m2个波束。
GM=M1∪M2 (8)
步骤4:在波束对准期间,根据训练子集中所有路径的信道状态,选择具有最大路径增益的多个路径。
为了测量毫米波信道状态,发射器向接收器广播一系列波束成形的导频信号,接收器根据其接收到的导频信号功率,反馈给发射器。D的取值是根据发射器与接收器之间进行数据流并行传输的需要来确定的。
对于训练子集中的任意臂i,相关路径的信道状态是H信道矩阵的第(q(i),p(i))个元素。因此,发射器(基站端)和接收器使用,第p(i)个发送和第q(j)个接收波束对的波束成形矢量,发射和接收导频信号,以测量臂i的相关路径的信道状态。
接收器接收到的信号为:
Figure BDA0002426697940000104
发射器发送的导频信号s使得E[|s|2]=P,其中P是波束对准(BA)期间的发射功率。因此,接收器获得的平均接收导频信号功率是:
Figure BDA0002426697940000111
式(10)中,NP是导频序列的长度。
基站1获得来自用户设备2的平均导频信号功率,然后选择出具有最大导频信号功率的D条路径。所选择的D条路径的相关臂k1,k2,...,kD取自GM;且在GM中各臂的平均接收导频信号功率排序中,这D个臂的平均接收导频信号功率为最大的D个,即满足:
Figure BDA0002426697940000112
为了便于以下描述,令
Figure BDA0002426697940000113
为用于数据传输的路径集。
步骤5:在数据传输期间,通过所选择的D条路径并行传输数据流,获得UCB奖励xi
在步骤5中已经选择了D条路径,发射器在数据传输期间,通过所选择的D路径传输并行D条数据流。同时,接收器将测量每条路径上的传输速率。然后,将测量到的传输速率反馈给发射器以计算相关臂的UCB奖励xi。被选择的臂的奖励xi被定义为其测量速率的效用。
步骤6:更新所有路径的平均回报μi
接收器从这D个路径接收到信号。接收器将其测量到的这D个路径的信号传输速率反馈给发射器。
发射器将接收到的D条路径的信号传输速率,作为UCB奖励xi,更新平均回报值μi。信号传输速率越大,则UCB奖励值xi越大。
发射器更新当前各个波束i的强盗信息:
Figure BDA0002426697940000114
其中,ni表示为一直到时隙t时第i组波束被选择的次数,第i组获得的历史回报平均值为μi,每个臂i∈{1,…,NtNr}贡献特定的传输速率,为UCB奖励值xi
未被选中的臂,即除这D条路径之外的波束,令UCB奖励值xi为0,更新平均回报值μi
返回步骤1,进入下一个循环,对所有路径进行判断。
前面介绍基于多臂强盗的位置辅助波束对准方法的具体步骤。可以理解,以上步骤顺序并不构成对本发明的限制。以上实施例中,以传输速率为奖励值xi是为了适应高速移动的应用场景,也可以接收器接收到的信号功率作为奖励值xi。换言之,选择什么参数作为奖励值,是可以根据应用场景的需要来变化的,上述实施例中选用传输速率作为奖励值并不构成对本发明的限制。
与现有技术相比较,本发明创造性地将高速移动场景下的波束对准问题表述为MAB问题,并将MAB问题求解与位置辅助有机相结合,使用位置辅助有效地减少了需要测量的波束对数量,缩短了波束对准时长。同时,利用位置信息直接计算LOS路径子集,避免了现有上置信界算法陷入局部最优而选择次优路径的情况,从而增大了波束对准概率,实现减小计算复杂度、提高频谱效率的目的。
<第二实施例>
如图3所示,本发明提供的位置辅助波束对准方法可以应用于车联网。其中,发射器Tx安装在第一车辆上,接收器Rx安装在另一车辆上。发射器包括DAC(数模转换)模块,射频链路,以及线性天线阵列;接收器包括ADC(模数转换)模块、射频链路以及线性天线阵列。
如图4所示,获取车辆位置信息,根据车辆位置信息从所有波束集合中选择对应的视距路径及其相邻路径的集合;计算余下所有路径的UCB,并选择其中UCB最大的多条路径组成非视距路径;测量获得的视距路径以及非视距路径的信道状态,选择信道状态最好的D条路径进行数据传输;反馈所选D条路径的传输速率作为相关臂的奖励并进行更新。
具体步骤如下:
系统初始化:令t=0,ni=0,μi=0,
Figure BDA0002426697940000121
1.获取车辆位置信息φ和θ。
参考图7,车辆(图中为RX)的极坐标位置信息φ和θ,根据φ和θ从NtNr波束集中找出对应的LOS路径及其相邻路径的集合M1={Aj-m,...,Aj-1,Aj,Aj+1,...,Aj+m},
Figure BDA0002426697940000131
m为一常数,m1=2m+1。
2.选择NLOS路径集合M2。使用式(5)计算余下所有臂的UCB,并选择其中UCB最大的m2=2m+1项;更新M2以获得式(7)所述NLOS子集M2。在本实施例中m1=m2
3.获得集合GM=M1∪M2,m1+m2远小于NtNr
4.测量GM中全部路径的信道状态信息。
5.发射器使用式(11)选择D条路径进行数据传输。
6.反馈所选D路径的传输速率作为相关臂的奖励。
7.发射器使用式(12)更新bandit信息(强盗信息)。
本实施例中,仿真所用的关键参数如表1所示。
表1仿真关键参数表
Figure BDA0002426697940000132
基于上述仿真参数,得到的仿真结果如图5和图6所示。图5为本发明提供的位置辅助波束对准方法与常规方法在频谱效率上的累积损耗对比图。从图5上可以看到,本发明提供的位置辅助波束对准方法(PA-UCB法)的累积损耗明显低于常规方法(UCB法和exhaustive法)。图6为频谱效率的CDF对比图,可以看到本发明(简称为PA-UCB法)的频谱效率CDF(累积分布函数)曲线表现优于传统的UCB法和传统波束对准(BA)法。
本发明提供的位置辅助波束对准方法将MAB法与位置辅助有机地相结合,使用位置辅助方法有效地减少了需要测量的波束对数量,从而提高了频谱效率。利用位置信息直接计算LOS路径子集,避免了现有上置信界算法(UCB)陷入局部最优而选择次优路径的情况,从而增大了对准概率,提高了频谱效率。
本发明使用两步位置辅助的UCB算法,减小算法复杂度,大大减少计算时间。基于UCB准则的位置辅助波束搜索与对齐算法是一个两步的波束对准方案。首先从剩余的非LOS路径中选择UCB较高的NLOS路径子集,然后合并NLOS子集与LOS子集,第二步利用所得子集进行导频传输,选择其中最佳的波束用于进一步的数据传输。这样可以减少迭代次数,从而降低了算法的复杂度,减少了计算时间。
上面对本发明所提供的基于多臂强盗的位置辅助波束对准方法及其系统进行了详细的说明。对本领域的一般技术人员而言,在不背离本发明实质内容的前提下对它所做的任何显而易见的改动,都将构成对本发明专利权的侵犯,将承担相应的法律责任。

Claims (9)

1.一种基于多臂强盗的位置辅助波束对准方法,其特征在于包括如下步骤:
步骤1:获取接收器的位置信息;
步骤2:根据所述位置信息选择LOS路径的多个LOS波束,形成LOS子集;
步骤3:从剩余的波束中选择多个拥有最大UCB值的NLOS路径的多个NLOS波束,形成NLOS子集;
步骤4:在波束对准期间,根据所述LOS子集和所述NLOS子集中的所有路径的信道状态,选择具有最大路径增益的多个波束;
步骤5:在数据传输期间,通过在步骤5中选择的所述波束并行传输数据流,并获得所述波束的UCB奖励值;
步骤6:基于所述UCB奖励值,更新所述步骤4中选择的所述波束的平均回报。
2.如权利要求1所述的位置辅助波束对准方法,其特征在于:
在更新各路径的平均回报时,对所述步骤4中选择的所述波束,基于所述步骤5中获得的所述波束的UCB奖励值进行更新;对其他波束,令UCB奖励值为0进行更新。
3.如权利要求2所述的位置辅助波束对准方法,其特征在于:
所述步骤3中,所述最大UCB索引值是基于UCB法的平均回报与置信空间之和。
4.如权利要求3所述的位置辅助波束对准方法,其特征在于:
所述步骤4中,所述最大路径增益是指在波束对准期间,发射器在所述LOS子集和所述NLOS子集中的所有路径发出导频信号,接收器接收到所述导频信号,并计算平均接收导频信号功率,将所述平均接收导频信号功率进行排序,选择最大的特定数量的所述平均接收导频信号功率对应的波束。
5.如权利要求4所述的位置辅助波束对准方法,其特征在于:
所述多个LOS波束是所述LOS路径所在位置的附近的多个波束。
6.如权利要求4或5所述的位置辅助波束对准方法,其特征在于:
所述多个LOS波束或所述多个NLOS波束的数量,均大于或等于所述步骤5中并行传输数据流的波束的数量。
7.如权利要求2所述的位置辅助波束对准方法,其特征在于:
所述UCB奖励值是每个波束的传输速率或信号功率。
8.如权利要求1~5中任意一项所述的位置辅助波束对准方法,其特征在于:
所述步骤3中,最大UCB值N(i)是根据下式计算的:
Figure FDA0002426697930000021
式中,μi是已观测到的所述NLOS子集中的波束i的平均回报值,t为时隙数,ni为所述NLOS子集中的波束i当前累积被选中的次数,c是预先设定的常数。
9.一种基于多臂强盗的位置辅助波束对准系统,包括发射器和接收器,所述发射器和所述接收器均具有线性阵列天线,其特征在于:
所述位置辅助波束对准系统执行权利要求1~8中任意一项所述的位置辅助波束对准方法。
CN202010222939.8A 2020-03-26 2020-03-26 基于多臂强盗的位置辅助波束对准方法及其系统 Withdrawn CN111446999A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010222939.8A CN111446999A (zh) 2020-03-26 2020-03-26 基于多臂强盗的位置辅助波束对准方法及其系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010222939.8A CN111446999A (zh) 2020-03-26 2020-03-26 基于多臂强盗的位置辅助波束对准方法及其系统

Publications (1)

Publication Number Publication Date
CN111446999A true CN111446999A (zh) 2020-07-24

Family

ID=71657430

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010222939.8A Withdrawn CN111446999A (zh) 2020-03-26 2020-03-26 基于多臂强盗的位置辅助波束对准方法及其系统

Country Status (1)

Country Link
CN (1) CN111446999A (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112543044A (zh) * 2020-11-24 2021-03-23 电子科技大学 一种基于稀疏编码的毫米波波束对准方法
CN113543017A (zh) * 2021-06-02 2021-10-22 北京邮电大学 毫米波车联网的波束切换方法及相关设备
CN113852972A (zh) * 2021-09-13 2021-12-28 金华航大北斗应用技术有限公司 一种基于波束共享的高速移动终端波束调度方法
CN115865155A (zh) * 2023-02-20 2023-03-28 南京邮电大学 一种多散射簇信道下基于mab的两阶段预编码方法

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20130095774A1 (en) * 2011-09-08 2013-04-18 Drexel University Method for selecting state of a reconfigurable antenna in a communication system via machine learning
US20180098330A1 (en) * 2016-09-30 2018-04-05 Drexel University Adaptive Pursuit Learning Method To Mitigate Small-Cell Interference Through Directionality
CN109831236A (zh) * 2018-11-13 2019-05-31 电子科技大学 一种基于蒙特卡洛树搜索辅助的波束选择方法
US20190173537A1 (en) * 2017-12-04 2019-06-06 University Of Notre Dame Du Lac Mitigating beam squint in millimeter wave wireless communication systems
CN110086553A (zh) * 2019-04-21 2019-08-02 上海无线通信研究中心 用于毫米波通信系统的波束对齐测试方法及其系统
EP3553966A1 (en) * 2018-04-11 2019-10-16 Technische Universität Darmstadt Beam pattern selection for vehicular communication using machine learning
CN110365375A (zh) * 2019-06-26 2019-10-22 东南大学 一种毫米波通信系统中波束对准和跟踪方法及计算机设备
US20190372644A1 (en) * 2018-06-01 2019-12-05 Samsung Electronics Co., Ltd. Method and apparatus for machine learning based wide beam optimization in cellular network
WO2020005296A1 (en) * 2018-06-29 2020-01-02 Brent Elliott Millimeter wave beam tracking and beam sweeping

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20130095774A1 (en) * 2011-09-08 2013-04-18 Drexel University Method for selecting state of a reconfigurable antenna in a communication system via machine learning
US20180098330A1 (en) * 2016-09-30 2018-04-05 Drexel University Adaptive Pursuit Learning Method To Mitigate Small-Cell Interference Through Directionality
US20190173537A1 (en) * 2017-12-04 2019-06-06 University Of Notre Dame Du Lac Mitigating beam squint in millimeter wave wireless communication systems
EP3553966A1 (en) * 2018-04-11 2019-10-16 Technische Universität Darmstadt Beam pattern selection for vehicular communication using machine learning
US20190372644A1 (en) * 2018-06-01 2019-12-05 Samsung Electronics Co., Ltd. Method and apparatus for machine learning based wide beam optimization in cellular network
WO2020005296A1 (en) * 2018-06-29 2020-01-02 Brent Elliott Millimeter wave beam tracking and beam sweeping
CN109831236A (zh) * 2018-11-13 2019-05-31 电子科技大学 一种基于蒙特卡洛树搜索辅助的波束选择方法
CN110086553A (zh) * 2019-04-21 2019-08-02 上海无线通信研究中心 用于毫米波通信系统的波束对齐测试方法及其系统
CN110365375A (zh) * 2019-06-26 2019-10-22 东南大学 一种毫米波通信系统中波束对准和跟踪方法及计算机设备

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112543044A (zh) * 2020-11-24 2021-03-23 电子科技大学 一种基于稀疏编码的毫米波波束对准方法
CN113543017A (zh) * 2021-06-02 2021-10-22 北京邮电大学 毫米波车联网的波束切换方法及相关设备
CN113543017B (zh) * 2021-06-02 2022-07-29 北京邮电大学 毫米波车联网的波束切换方法及相关设备
CN113852972A (zh) * 2021-09-13 2021-12-28 金华航大北斗应用技术有限公司 一种基于波束共享的高速移动终端波束调度方法
CN113852972B (zh) * 2021-09-13 2023-10-10 金华航大北斗应用技术有限公司 一种基于波束共享的高速移动终端波束调度方法
CN115865155A (zh) * 2023-02-20 2023-03-28 南京邮电大学 一种多散射簇信道下基于mab的两阶段预编码方法
CN115865155B (zh) * 2023-02-20 2023-05-23 南京邮电大学 一种多散射簇信道下基于mab的两阶段预编码方法

Similar Documents

Publication Publication Date Title
CN111446999A (zh) 基于多臂强盗的位置辅助波束对准方法及其系统
CN110839204B (zh) 一种irs辅助通信系统的通信优化方法及装置
US7406336B2 (en) Method for determining transmit weights
CN101356745B (zh) 使用过期信道状态信息的天线构造选择
US8553797B2 (en) Channel information prediction system and channel information prediction method
US20110019573A1 (en) Low complexity user selection for sdma
CN110048749A (zh) 多输入多输出训练方法及无线装置
CN110401476A (zh) 一种基于码本的毫米波通信多用户并行波束训练方法
CN103560985A (zh) 一种空时相关信道大尺度mimo传输方法
CN110417444A (zh) 一种基于深度学习的毫米波信道波束训练方法
CN104393964B (zh) 基于信道信息协方差的预编码方法和协作通信方法
CN107743043B (zh) 多用户毫米波系统中基于带外空间信息的用户分组方法
CN109379122A (zh) 一种毫米波通信多径信道动态波束训练方法
CN115486035A (zh) 用于信道估计的nn参数的类别
US20110090980A1 (en) Channel information prediction system and channel information prediction method
CN115021843A (zh) 一种毫米波通信多用户系统合作感知方法
US6734822B2 (en) Transmission system and method on a forward link
Ebrahiem et al. A deep learning approach for channel estimation in 5G wireless communications
CN107070818B (zh) 基于毫米波mimo系统的多普勒频偏估计方法及装置
CN115622596B (zh) 一种基于多任务学习的快速波束对齐方法
CN102223168B (zh) 基于阵列天线和mimo联合传输波束成形方法
CN102801454B (zh) 波束赋形方法及装置
EP3726739B1 (en) Memory-assisted radio frequency beam training for mimo channels
CN111418163B (zh) 无线装置以及无线通信控制方法
CN107888261B (zh) 一种信道矩阵确定方法及相关设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WW01 Invention patent application withdrawn after publication

Application publication date: 20200724

WW01 Invention patent application withdrawn after publication