CN116383656A - 用于大规模mimo定位的半监督表征对比学习方法 - Google Patents

用于大规模mimo定位的半监督表征对比学习方法 Download PDF

Info

Publication number
CN116383656A
CN116383656A CN202310376215.2A CN202310376215A CN116383656A CN 116383656 A CN116383656 A CN 116383656A CN 202310376215 A CN202310376215 A CN 202310376215A CN 116383656 A CN116383656 A CN 116383656A
Authority
CN
China
Prior art keywords
encoder
matrix
positioning
positive
semi
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202310376215.2A
Other languages
English (en)
Inventor
高西奇
巩鑫瑞
刘晓峰
伏啸
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Southeast University
Original Assignee
Southeast University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Southeast University filed Critical Southeast University
Priority to CN202310376215.2A priority Critical patent/CN116383656A/zh
Publication of CN116383656A publication Critical patent/CN116383656A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G01MEASURING; TESTING
    • G01SRADIO DIRECTION-FINDING; RADIO NAVIGATION; DETERMINING DISTANCE OR VELOCITY BY USE OF RADIO WAVES; LOCATING OR PRESENCE-DETECTING BY USE OF THE REFLECTION OR RERADIATION OF RADIO WAVES; ANALOGOUS ARRANGEMENTS USING OTHER WAVES
    • G01S5/00Position-fixing by co-ordinating two or more direction or position line determinations; Position-fixing by co-ordinating two or more distance determinations
    • G01S5/02Position-fixing by co-ordinating two or more direction or position line determinations; Position-fixing by co-ordinating two or more distance determinations using radio waves
    • G01S5/0252Radio frequency fingerprinting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/16Matrix or vector computation, e.g. matrix-matrix or matrix-vector multiplication, matrix factorization
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/0464Convolutional networks [CNN, ConvNet]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/0895Weakly supervised learning, e.g. semi-supervised or self-supervised learning
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D30/00Reducing energy consumption in communication networks
    • Y02D30/70Reducing energy consumption in communication networks in wireless communication networks

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Mathematical Physics (AREA)
  • General Engineering & Computer Science (AREA)
  • Evolutionary Computation (AREA)
  • Software Systems (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Computing Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Molecular Biology (AREA)
  • Computational Mathematics (AREA)
  • General Health & Medical Sciences (AREA)
  • Mathematical Analysis (AREA)
  • Mathematical Optimization (AREA)
  • Computational Linguistics (AREA)
  • Pure & Applied Mathematics (AREA)
  • Biophysics (AREA)
  • Databases & Information Systems (AREA)
  • Remote Sensing (AREA)
  • Radar, Positioning & Navigation (AREA)
  • Evolutionary Biology (AREA)
  • Algebra (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Position Fixing By Use Of Radio Waves (AREA)
  • Radar Systems Or Details Thereof (AREA)

Abstract

本发明公开了用于大规模MIMO定位的半监督表征对比学习方法。本发明针对现有的大规模MIMO指纹定位方法面临的挑战,包括需要利用准确的信道估计和需要逐一标记的数据集。本发明提出半监督的表示对比学习定位方法,基于一个部分标记的接收导频信号数据集,并从基站获得该数据集,训练数据集通过数据增强管道增强为大量的正负样本对。编码器通过对比损失函数进行无标签的自监督预训练,使正样本的编码接近于锚点的编码,而远离表示空间中的负样本的编码,编码器和回归网络通过标记的子数据集进行微调,以实现下游的定位任务。与现有方法相比,本发明所提出的自监督预训练的编码器能够显著提高定位精度。

Description

用于大规模MIMO定位的半监督表征对比学习方法
技术领域
本发明属于无线通信技术领域,涉及大规模MIMO系统的无线定位方法。
背景技术
近几十年来,准确的定位作为许多基于位置的服务(如导航、智能机器人和物联网)的重要推动因素,已经得到越来越多的关注。大规模多输入多输出(massive multiple-input multiple-output,MIMO)技术在5G及以后的无线网络中被广泛使用,它为系统提供了更强的传感和定位能力。现有的大规模MIMO定位方法大多以信道状态信息(channelstate information,CSI)为切入点。近年来的研究主要是在深度神经网络(deep neuralnetworks,DNN)的帮助下完成了CSI到用户终端位置(UT)的映射。这些方法需要在离线模式下对DNN进行监督训练,以便在在线模式下,预测UT的相关位置坐标。
现存的大规模MIMO指纹定位方法需要一个特殊的训练数据集,其中包含大量用地面真实位置标注的CSI样本。然而,首先,CSI样本需要准确的信道估计结果,其次,虽然标注的成本与数据集的大小成线性关系(标注每个例子需要一个恒定的时间),但模型的性能只与之成亚线性关系。这意味着,标注更多的样本会变得不那么合算。第三,由于CSI的不断变化,数据库需要不断更新,这进一步增加了逐一标记的成本。以上原因都可能是现有方法的性能限制因素。
发明内容
技术问题:为了解决上述问题,本发明的目标是给出一种用于大规模MIMO定位的半监督表征对比学习方法,仅使用上行链路接收信号的位置估计方法,这种信号在基站(BS)是现成的,不需要精确的信道估计和大量的地面真实位置标签,可以使数据库更容易和更快地更新。该方法可以获得优异的性能,避免了精确的信道估计,实现了标注效率,值得推广应用。
技术方案:本发明的用于大规模MIMO定位的半监督表征对比学习方法包括以下步骤:
步骤1,根据大规模MIMO系统配置,给出波束域信道表示,得到接收信号表示形式;
步骤2,为了在预训练阶段能够预训练编码器,首先根据不同位置的参考点RP(Reference Point)的可用接收信号
Figure BDA0004170459510000011
创建正负样本;
步骤3,使用编码器F(·)将正负样本转换到特征表示空间;
步骤4,使用对比损失函数和优化器更新编码器权值;
步骤5,在编码器的顶部附加一个随机初始化的全连接回归层f(·)来完成下游的定位任务。
其中,
步骤1所述的大规模MIMO系统配置包括一个基站、K个用户;基站配置大规模均匀线阵天线,天线间隔为半波长;用户配置单天线;基站侧天线数量为Nr;正交频分复用OFDM调制被用来将频率选择性衰减信道转化为多个平行信道;大规模MIMO-OFDM系统中的子载波数量为Nc,Np个导频子载波用于上行链路导频信号传输;循环前缀的长度表示为Ng,采样间隔表示为Ts;子载波间距为
Figure BDA0004170459510000021
设Θi,τj为采样的方向余弦和延迟,Na和Nd被称为空间域和频率域的采样数,a(Θi),b(τj)分别被称为空间域和频率域的采样舵矢量;为了保证量化的准确性,Na≥Nr,Nd≥Ng,/>
Figure BDA0004170459510000022
是(-1,1]之间的均匀分布,/>
Figure BDA0004170459510000023
Figure BDA0004170459510000024
是(0,NgTs]之间的均匀分布;Nr是天线数目,此外,定义矩阵A和B为
Figure BDA0004170459510000025
Figure BDA0004170459510000026
通过使用基于精细化的双波束信道模型,在第t个OFDM符号中,第k个用户和基站之间的空间-频域信道矩阵可以被建模为信道模型:
Hk,t=A(Ξk⊙Vk,t)BT (1)
其中
Figure BDA0004170459510000027
是一个复数高斯随机矩阵,每一个元素独立同分布(i.i.d.)具有零均值和单位方差,非负矩阵/>
Figure BDA0004170459510000028
在不同OFDM符号中保持不变;定义Gk,t=Ξk⊙Vk,t被称为基于精细化的双波束信道矩阵,第k个用户的信道功率矩阵定义为Ωk=Ξk⊙Ξk,这是一个稀疏矩阵,因为大部分信道功率分布在有限的可分辨空间方向和时间延迟中;上标T是转置;
在基站的第t个OFDM符号的信号
Figure BDA0004170459510000029
由以下接收信号模型给出
Yt=Hk,tXk+Zt
其中Zt是由均值为零、方差为
Figure BDA00041704595100000210
的i.i.d.元素组成的复高斯噪声矩阵;Xk是用户上行导频信号,将信道模型(1)代入上述接收信号模型中,可以改写为
Yt=AGk,tBTXk+Zt=AGk,tP+Zt
通过将Yt左乘以采样矩阵AH,AH是在公式(1)上由舵矢量构成的采样矩阵,上标H代表共轭转置。右乘以采样矩阵PH,P=BrXk,得到精细化波束域上的接收导频信号为
PH,P=BTXk
AHYtPH=AHAGk,tPPH+AHZtPH
令Φ表示精细化波束域上的接收功率矩阵的期望值如下所述,其中E{.}表示期望操作,上标*代表共轭操作⊙表示矩阵的哈达玛乘积
Φ=E{(AHYtPH)⊙(AHYtPH)*}
得到信道功率矩阵Ωk的接收模型为
Φk=TaΩkTd+N
其中Ta、Td和N是确定矩阵,定义为
Ta=(AHA)⊙(AHA)*
Td=(PHP)⊙(PHP)*
Figure BDA0004170459510000031
为了从接收信号Φk估计第k个用户的二维平面上的位置坐标向量
Figure BDA0004170459510000032
其中/>
Figure BDA0004170459510000033
分别代表x轴和y轴的坐标;使用自监督模型来获得一个精确的解决方案。
步骤2所述创建正负样本,在预训练阶段,基站获得所有参考点的接收信号
Figure BDA0004170459510000034
Figure BDA0004170459510000035
下标代表参考点的序号,对于一小批次的参考点接收信号/>
Figure BDA0004170459510000036
假设第i个参考点的接收信号为/>
Figure BDA0004170459510000037
它被视为“锚点”,它的正样本记为数据增强后的/>
Figure BDA0004170459510000038
在经过不同的数据增强后,小批次/>
Figure BDA0004170459510000039
中的其他参考点的接收信号都是第i个参考点的负样本,并组成一个集合,记为/>
Figure BDA00041704595100000310
步骤3所述的使用编码器F(·)将正负样本转换到特征表示空间,编码器块F(·)
Figure BDA00041704595100000311
Figure BDA00041704595100000312
由四个二维卷积层和一个全连接特征输出层组成,每个层后面都有一个激活层,其中d是输出的维度,R是实数空间,编码器的作用是将正负样本,从Na×Nd维度的实数空间中转化到d维度的实数空间;对所有激活层使用ReLU函数,在中间加入批量归一化BN层,以尽量减少过度拟合和梯度的消失或爆裂,在预训练阶段,一个非线性投影头g(·)被连接到编码器的顶部,以提高编码器的表示质量,在下游任务中放弃了非线性投影头g(·),只使用训练好的编码器。
步骤4所述的使用对比损失函数和优化器更新编码器权值,用对比性损失函数对编码器进行预训练,使用来自不同参考点的无标签接收信号数据
Figure BDA00041704595100000313
考虑一个经过编码的锚q=F(Φi)∈Rd×1是一个维度为d的实数向量,和一批编码的负样本{k0=F(Φ0),k1=F(Φ1),k2=F(Φ2),...}来自集合/>
Figure BDA00041704595100000315
设有一个编码的正样本k+=F(A(Φi))与q匹配,q是一个维度为d的实数向量,他是锚点进过编码器后的输出,对比性损失是一个函数,当q与k+相似而与所有其他{k0,k1,k2,...}不相似时,其值为低;用点积来衡量相似性,考虑了一种对比性损失函数的形式,称为信息噪声对比性损失:
Figure BDA00041704595100000314
其中τ是一个温度超参数,计算结果是在一个正样本和K个负样本上,这个损失是基于(K+1)-分类softmax的分类器的对数损失,该分类器试图将q分类为k+
步骤5所述的在编码器的顶部附加一个随机初始化的全连接回归层f(·)来完成下游的定位任务,将一个随机初始化的全连接回归层f(·)Rd→R2连接到编码器的顶部,以完成下游的定位任务;对于所有参考点中的5%,将这部分参考点的接收信号
Figure BDA0004170459510000041
用地面真实位置坐标矢量/>
Figure BDA0004170459510000042
进行标记,/>
Figure BDA0004170459510000043
利用这个部分标记的数据集,对已经训练好的编码器F(·)和回归模块f(·)进行微调,损失函数如下:
使用均方误差MSE损失函数计算预测的
Figure BDA0004170459510000048
是回归网络的输出值,是一个2维实数向量,代表网络对用户的位置预测和实际位置坐标向量pi之间的距离,带有L2正则化的损失函数说明如下
Figure BDA0004170459510000044
其中Ntrain是训练数据的数量,w是DNN的所有可训练参数的向量,γ是超参数。
有益效果:在本发明中,为大规模MIMO系统研究了一种基于对比学习的半监督定位方法。使用大量的基站容易获得的未标记的接收信号来预训练编码器。通过对比性损失函数,编码器可以区分表示空间中的正负样本。仿真结果显示,与有监督训练的基线方法相比,整个网络在微调后能很好地完成下游定位任务。与其他现有方法相比,该方法可以获得优异的性能,避免了精确的信道估计,实现了标注效率,值得推广应用。
附图说明
图1为本发明的实施例中大规模MIMO系统定位场景平面示意图。
图2为本发明的实施例中本发明与其他算法的定位估计性能对比图。
具体实施方式
以下将结合具体实施例对本发明提供的技术方案进行详细说明,应理解下述具体实施方式仅用于说明本发明而不用于限制本发明的范围。
如图1所示,本发明实施例公开的一种用于大规模MIMO定位的半监督表征对比学习方法,使用基于几何的二维传播模型来模拟无线传输环境。图1包含一个二维平面示意图布局来解释模拟设置;该平面的坐标(X,Y)对应于X轴和Y轴。假设基站位于(0,0)m坐标原点,其配备的均匀线阵平行于Y轴,有128天线和256波束。考虑的区域是一个正方形,中心为(500,0)m,边长为50m。每平方公里有50个散射体。一个路径是连接用户和基站之间的任何不受其他散射体的阻碍传输。考虑基于几何学的单次反弹(GBSB)传播,它被用来简化模型而不失去一般性。上行OFDM信道的带宽为20MHz,有1024个子载波。
待定位的区域被平均划分为多个参考点。基站收集10,000个接收导频信号
Figure BDA0004170459510000045
的样本作为训练数据集,并将其中5%用真实位置/>
Figure BDA0004170459510000046
际记作为标签子集进行微调。500个用户终端随机分布在定位区域内,基站收集/>
Figure BDA0004170459510000047
作为微调阶段的验证数据集。重新生成500个随机分布的用户终端,并收集它们的/>
Figure BDA0004170459510000051
用于在线模式下的位置预测。编码器由四个相同的CNN层和一个投影层组成,CNN由16个3×3内核组成。编码器的特征表示尺寸为d=1024,投影头g(·)为128。对于给定的方法,使用MATLAB 2020a来计算接收信号和坐标。该网络使用TensorFlow 2.6进行训练和测试。模拟是在一台装有英特尔酷睿i7-8700k CPU和Geforce GTX 3080 10GB GPU的计算机上进行的。
下面是对最重要的超参数的说明:批量大小32:由于目标可以被解释为对一批Φi的分类(宽泛地说),所以批的大小实际上是一个比通常更重要的超参数。越高越好。温度0.1:温度定义了用于交叉熵损失的softmax分布的″柔软度″,是一个重要的超参数。较低的值通常会导致较高的对比精度。优化器:使用了Adam,因为它在0.0005学习率和其他默认参数下提供了良好的性能。
预训练过程:
除了上述的InfoNCE损失函数,以下指标也被用于监测预训练的性能:对比精度(c_acc):自监督指标,即一个参考点数据的编码表示与它的不同增强版本的表示比与当前批次中的任何其他参考点的表示更相似的情况的比率。即使在没有标记样本的情况下,对比精度可用于超参数调整。线性探测精度(p_acc):线性探测是评估自监督模型的一个流行指标。它被计算为在编码器表示之上训练的逻辑分类器的准确性。在案例中,这是通过在冻结的编码器上面训练一个单一的全连接来完成的。已经将5%标记的参考点分为25个类别,在预训练期间对其进行了训练。这样,可以在训练过程中监测它的值,这有助于实验和调试。
本发明的用于大规模MIMO定位的半监督表征对比学习方法包括以下步骤:
步骤1,根据大规模MIMO系统配置,给出波束域信道表示,得到接收信号表示形式;
步骤2,为了在预训练阶段能够预训练编码器,首先根据不同位置的参考点RP(Reference Point)的可用接收信号
Figure BDA0004170459510000052
创建正负样本;
步骤3,使用编码器F(·)将正负样本转换到特征表示空间;
步骤4,使用对比损失函数和优化器更新编码器权值;
步骤5,在编码器的顶部附加一个随机初始化的全连接回归层f(·)来完成下游的定位任务。
其中,
步骤1所述的大规模MIMO系统配置包括一个基站、K个用户;基站配置大规模均匀线阵天线,天线间隔为半波长;用户配置单天线;基站侧天线数量为Nr;正交频分复用OFDM调制被用来将频率选择性衰减信道转化为多个平行信道;大规模MIMO-OFDM系统中的子载波数量为Nc,Np个导频子载波用于上行链路导频信号传输;循环前缀的长度表示为Ng,采样间隔表示为Ts;子载波间距为
Figure BDA0004170459510000053
设/>
Figure BDA0004170459510000054
为采样的方向余弦和延迟,Na和Nd被称为空间域和频率域的采样数,a(Θi),b(τj)分别被称为空间域和频率域的采样舵矢量;为了保证量化的准确性,Na≥Nr,Nd≥Ng,/>
Figure BDA0004170459510000061
是(-1,1]之间的均匀分布,/>
Figure BDA0004170459510000062
Figure BDA0004170459510000063
是(0,NgTs]之间的均匀分布;Nr是天线数目,此外,定义矩阵A和B为
Figure BDA0004170459510000064
Figure BDA0004170459510000065
通过使用基于精细化的双波束信道模型,在第t个OFDM符号中,第k个用户和基站之间的空间-频域信道矩阵可以被建模为信道模型:
Hk,t=A(Ξk⊙Vk,t)BT (1)
其中
Figure BDA0004170459510000066
是一个复数高斯随机矩阵,每一个元素独立同分布(i.i.d.)具有零均值和单位方差,非负矩阵/>
Figure BDA0004170459510000067
在不同OFDM符号中保持不变;定义/>
Figure BDA0004170459510000068
被称为基于精细化的双波束信道矩阵,第k个用户的信道功率矩阵定义为Ωk=Ξk⊙Ξk,这是一个稀疏矩阵,因为大部分信道功率分布在有限的可分辨空间方向和时间延迟中;上标T是转置;
在基站的第t个OFDM符号的信号
Figure BDA0004170459510000069
由以下接收信号模型给出
Yt=Hk,tXk+Zt
其中Zt是由均值为零、方差为
Figure BDA00041704595100000610
的i.i.d.元素组成的复高斯噪声矩阵;Xk是用户上行导频信号,将信道模型(1)代入上述接收信号模型中,可以改写为
Yt=AGk,tBTXk+Zt=AGk,tP+Zt
通过将Yt左乘以采样矩阵AH,AH是在公式(1)上由舵矢量构成的采样矩阵,上标H代表共轭转置。右乘以采样矩阵PH,P=BTXk,得到精细化波束域上的接收导频信号为
PH,P=BTXk
AHYtPH=AHAGk,tPPH+AHZtPH
令Φ表示精细化波束域上的接收功率矩阵的期望值如下所述,其中E{.}表示期望操作,上标*代表共轭操作⊙表示矩阵的哈达玛乘积
Φ=E{(AHYtPH)⊙(AHYtPH)*}
得到信道功率矩阵Ωk的接收模型为
Φk=TaΩkTd+N
其中Ta、Td和N是确定矩阵,定义为
Ta=(AHA)⊙(AHA)*
Td=(PHP)⊙(PHP)*
Figure BDA00041704595100000611
为了从接收信号Φk估计第k个用户的二维平面上的位置坐标向量
Figure BDA0004170459510000071
其中/>
Figure BDA0004170459510000072
分别代表x轴和y轴的坐标;使用自监督模型来获得一个精确的解决方案。
步骤2所述创建正负样本,在预训练阶段,基站获得所有参考点的接收信号
Figure BDA0004170459510000073
Figure BDA0004170459510000074
下标代表参考点的序号,对于一小批次的参考点接收信号/>
Figure BDA0004170459510000075
假设第i个参考点的接收信号为/>
Figure BDA0004170459510000076
它被视为“锚点”,它的正样本记为数据增强后的/>
Figure BDA0004170459510000077
在经过不同的数据增强后,小批次/>
Figure BDA0004170459510000078
中的其他参考点的接收信号都是第i个参考点的负样本,并组成一个集合,记为/>
Figure BDA0004170459510000079
下面对原理进行解释:对比学习被认为是建立一个字典式的查询问题;在对比学习中,每个输入神经网络的样本可以被看作是一个查询(query),而数据集中的其他样本可以被看作是字典(dictionary)中的条目。通常“查询”点(query),也被称作“锚”点(anchor),来与其他样本进行比较。对比学习的目标是将查询样本投影到特征空间中,并将其与字典中的条目进行比较,以找到与查询样本最相似的字典条目。通过这种方式,对比学习可以学习到有效的特征表示,并在许多机器学习任务中取得良好的性能。
“锚”可以看作是重点关注的对象,用于将字典中其他样本分成两类:与锚点相似的正样本(positive)和与锚点不相似的负样本(negative)。通常情况下,锚点会和正样本共同组成一组样本对,与负样本组成另一组样本对,然后通过对比性损失函数比较这两组样本对中的相似度来进行模型的训练。在本发明中,若参考点1接收的信号
Figure BDA00041704595100000710
为“锚”,“正”样本是“锚”/>
Figure BDA00041704595100000711
的数据增强,用/>
Figure BDA00041704595100000712
表示,“锚”/>
Figure BDA00041704595100000713
和“正”样本是彼此的正样本对;“负”样本是从其他参考点的接收信号中随机选择的小批数据/>
Figure BDA00041704595100000714
自监督学习可以训练编码器执行字典查询的代理任务:经过神经网络编码器编码的“锚”应与其匹配的“正”样本的编码输出相似,与其他样本不相似;学习过程被表述为最小化对比性损失函数;自监督学习的主要目的是预训练输出特征表征的编码器,然后通过微调将该编码器迁移到下游任务中,对比学习通过数据增强获得正负样本,其中两个最重要的数据增强方法A(·)如下:
裁剪:随机裁剪同一参考点
Figure BDA00041704595100000715
的不同部分,迫使模型对同一参考点/>
Figure BDA00041704595100000716
的不同部分进行编码;
抖动:一种有原则的实现方式是对参考点的
Figure BDA00041704595100000717
进行仿射变换;
此外,在数据增强中添加使用随机水平翻转。以上三种操作共同构成我们的数据增强方法,使用超参数来控制数据增强的强度;强的数据增强适用于对比学习,弱的数据增强适用于监督回归,以避免在少数标记的例子上过度拟合;
对正负样本作出以下总结:假设第1个参考点的接收的信号
Figure BDA00041704595100000718
为“锚”,其正样本为/>
Figure BDA0004170459510000081
其他参考点的接收信号在经过不一样的数据增强之后都是第一个参考点的负样本,并组成集合,记为集合/>
Figure BDA0004170459510000082
步骤3所述的使用编码器F(·)将正负样本转换到特征表示空间,编码器块
Figure BDA0004170459510000083
Figure BDA0004170459510000084
由四个二维卷积层和一个全连接特征输出层组成,每个层后面都有一个激活层,其中d是输出的维度,R是实数空间,编码器的作用是将正负样本,从Na×Nd维度的实数空间中转化到d维度的实数空间;对所有激活层使用ReLU函数,在中间加入批量归一化BN层,以尽量减少过度拟合和梯度的消失或爆裂,在预训练阶段,一个非线性投影头g(·)被连接到编码器的顶部,以提高编码器的表示质量,在下游任务中放弃了非线性投影头g(·),只使用训练好的编码器。
步骤4所述的使用对比损失函数和优化器更新编码器权值,用对比性损失函数对编码器进行预训练,使用来自不同参考点的无标签接收信号数据
Figure BDA0004170459510000085
考虑一个经过编码的锚q=F(Φi)∈Rd×1是一个维度为d的实数向量,和一批编码的负样本{k0=F(Φ0),k1=F(Φ1),k2=F(Φ2),...}来自集合/>
Figure BDA00041704595100000812
设有一个编码的正样本k+=F(A(Φi))与q匹配,q是一个维度为d的实数向量,他是锚点进过编码器后的输出,对比性损失是一个函数,当q与k+相似而与所有其他{k0,k1,k2,...}不相似时,其值为低;用点积来衡量相似性,考虑了一种对比性损失函数的形式,称为信息噪声对比性损失:
Figure BDA0004170459510000086
其中τ是一个温度超参数,计算结果是在一个正样本和K个负样本上,这个损失是基于(K+1)-分类softmax的分类器的对数损失,该分类器试图将q分类为k+
步骤5所述的在编码器的顶部附加一个随机初始化的全连接回归层f(·)来完成下游的定位任务,将一个随机初始化的全连接回归层f(·):Rd→R2连接到编码器的顶部,以完成下游的定位任务;对于所有参考点中的5%,将这部分参考点的接收信号
Figure BDA0004170459510000087
用地面真实位置坐标矢量/>
Figure BDA0004170459510000088
进行标记,/>
Figure BDA0004170459510000089
利用这个部分标记的数据集,对已经训练好的编码器F(·)和回归模块f(·)进行微调,损失函数如下:
使用均方误差MSE损失函数计算预测的
Figure BDA00041704595100000810
是回归网络的输出值,是一个2维实数向量,代表网络对用户的位置预测和实际位置坐标向量pi之间的距离,带有L2正则化的损失函数说明如下
Figure BDA00041704595100000811
其中Ntrain是训练数据的数量,w是DNN的所有可训练参数的向量,γ是超参数。
实施效果
为了使本技术领域的人员更好地理解本发明方案,下面给出具体系统配置下的本实施例中一种用于大规模MIMO定位的半监督表征对比学习方法与现有定位方法性能结果比较。
使用5%的标记数据集
Figure BDA0004170459510000091
对已经训练好的编码器F(·)和回归模块f(·)进行微调。一个基线监督模型使用随机初始化,采用相同的编码器架构和相同的标记数据集/>
Figure BDA0004170459510000092
进行训练。在图2中绘制了在线位置预测误差/>
Figure BDA0004170459510000093
的累积分布函数(CDF)。从图2来看,将预训练的编码器+回归网络的位置回归性能与基线和现存的基于指纹的方法进行了比较。仿真结果显示,仅使用少量的标记数据,编码器在下游定位任务中可以达到1.3373的RMSE,优于基线方法RMSE 1.7066和1.6524。
在本申请所提供的实施例中,应该理解到,所揭露的方法,在没有超过本申请的精神和范围内,可以通过其他的方式实现。当前的实施例只是一种示范性的例子,不应该作为限制,所给出的具体内容不应该限制本申请的目的。例如,一些特征可以忽略,或不执行。
本发明方案所公开的技术手段不仅限于上述实施方式所公开的技术手段,还包括由以上技术特征任意组合所组成的技术方案。应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也视为本发明的保护范围。

Claims (6)

1.一种用于大规模MIMO定位的半监督表征对比学习方法,其特征在于,所述方法包括以下步骤:
步骤1,根据大规模MIMO系统配置,给出波束域信道表示,得到接收信号表示形式;
步骤2,为了在预训练阶段能够预训练编码器,首先根据不同位置参考点RP的可用接收信号
Figure FDA0004170459500000011
创建正负样本;
步骤3,使用编码器F(·)将正负样本转换到特征表示空间;
步骤4,使用对比损失函数和优化器更新编码器权值;
步骤5,在编码器的顶部附加一个随机初始化的全连接回归层f(·)来完成下游的定位任务。
2.根据权利要求1所述的用于大规模MIMO定位的半监督表征对比学习方法,其特征在于:步骤1所述的大规模MIMO系统配置包括一个基站、K个用户;基站配置大规模均匀线阵天线,天线间隔为半波长;用户配置单天线;基站侧天线数量为Nr;正交频分复用OFDM调制被用来将频率选择性衰减信道转化为多个平行信道;大规模MIMO-OFDM系统中的子载波数量为Nc,Np个导频子载波用于上行链路导频信号传输;循环前缀的长度表示为Ng,采样间隔表示为Ts;子载波间距为
Figure FDA0004170459500000012
设Θi,τj为采样的方向余弦和延迟,Na和Nd被称为空间域和频率域的采样数,a(Θi),b(τj)分别被称为空间域和频率域的采样舵矢量;为了保证量化的准确性,Na≥Nr,Nd≥Ng,/>
Figure FDA0004170459500000013
i=1,2,…,Na是(-1,1]之间的均匀分布,/>
Figure FDA0004170459500000014
Figure FDA0004170459500000015
j=1,2,…,Nd是(0,NgTs]之间的均匀分布;Nr是天线数目,定义矩阵A和B为
Figure FDA0004170459500000016
Figure FDA0004170459500000017
通过使用基于精细化的双波束信道模型,在第t个OFDM符号中,第k个用户和基站之间的空间-频域信道矩阵Hk,t可以被建模为信道模型:
Hk,t=A(Ξk⊙Vk,t)BT (1)
其中
Figure FDA0004170459500000018
是一个复数高斯随机矩阵,每一个元素独立同分布(i.i.d.)具有零均值和单位方差,非负矩阵/>
Figure FDA0004170459500000019
在不同OFDM符号中保持不变;定义Gk,t=Ξk⊙Vk,t被称为基于精细化的双波束域信道矩阵,第k个用户的信道功率矩阵定义为Ωk=Ξk⊙Ξk,这是一个稀疏矩阵,因为大部分信道功率分布在有限的可分辨空间方向和时间延迟中;其中上标T是转置,⊙表示矩阵的哈达玛乘积;
在基站的第t个上行OFDM符号的接收信号
Figure FDA00041704595000000110
由以下接收信号模型给出
Yt=Hk,tXk+Zt
其中Zt是由均值为零、方差为
Figure FDA00041704595000000111
的i.i.d.元素组成的复高斯噪声矩阵;Xk是用户上行导频信号,将信道模型(1)代入上述接收信号模型中,可以改写为
Yt=AGk,tBTXk+Zt=AGk,tP+Zt
通过将Yt左乘以采样矩阵AH,其中AH是在公式(1)上由舵矢量构成的采样矩阵,上标H代表共轭转置。右乘以采样矩阵PH,P=BTXk,得到精细化波束域上的接收导频信号为
PH,P=BTXk
AHYtPH=AHAGk,tPPH+AHZtPH
令Φk表示精细化波束域上的接收功率矩阵的期望值如下所述,其中E{.}表示期望操作,上标*代表共轭操作⊙表示矩阵的哈达玛乘积
Φk=E{(AHYtPH)⊙(AHYtPH)*}
得到信道功率矩阵Ωk的接收模型为
Φk=TaΩkTd+N
其中Ta、Td和N是确定矩阵,定义为
Ta=(AHA)⊙(AHA)*
Td=(PHP)⊙(PHP)*
Figure FDA0004170459500000021
为了从第k个用户的接收信号Φk估计第k个用户的二维平面上的位置坐标向量
Figure FDA0004170459500000022
Figure FDA0004170459500000023
其中/>
Figure FDA0004170459500000024
分别代表x轴和y轴的坐标;使用自监督模型来获得一个精确的解决方案。
3.根据权利要求1所述的用于大规模MIMO定位的半监督表征对比学习方法,其特征在于:步骤2所述创建正负样本,在预训练阶段,基站获得所有参考点的接收信号
Figure FDA0004170459500000025
下标代表参考点的序号,对于一小批次(批次大小为NRP)参考点接收信号/>
Figure FDA0004170459500000026
假设第i个参考点的接收信号为/>
Figure FDA0004170459500000027
它被视为“锚点”,它的正样本记为数据增强后的/>
Figure FDA0004170459500000028
在经过不同的数据增强后,小批次/>
Figure FDA0004170459500000029
中的其他参考点的接收信号都是第i个参考点的负样本,并组成一个集合,记为/>
Figure FDA00041704595000000210
其中Ai(·)泛指某种数据增强方法。
4.根据权利要求1所述的用于大规模MIMO定位的半监督表征对比学习方法,其特征在于:步骤3所述的使用编码器F(·)将正负样本转换到特征表示空间,编码器块F(·):
Figure FDA00041704595000000211
由四个二维卷积层和一个全连接特征输出层组成,每个层后面都有一个激活层,其中d是输出的维度,R是实数空间,编码器的作用是将正负样本,从Na×Nd维度的实数空间中转化到d维度的实数空间;对所有激活层使用ReLU函数,在中间加入批量归一化BN层,以尽量减少过度拟合和梯度的消失或爆裂,在预训练阶段,一个非线性投影头g(·)被连接到编码器的顶部,以提高编码器的表示质量,在下游任务中放弃了非线性投影头g(·),只使用训练好的编码器。
5.根据权利要求1所述的用于大规模MIMO定位的半监督表征对比学习方法,其特征在于:步骤4所述的使用对比损失函数和优化器更新编码器权值,用对比性损失函数对编码器进行预训练,使用来自不同参考点的无标签接收信号数据
Figure FDA0004170459500000031
考虑一个经过编码的锚/>
Figure FDA0004170459500000032
Figure FDA0004170459500000033
是一个维度为d的实数向量,和一批编码的负样本/>
Figure FDA0004170459500000034
Figure FDA0004170459500000035
来自集合/>
Figure FDA0004170459500000036
设有一个编码的正样本k+=F(Aii))与q匹配,q是一个维度为d的实数向量,他是锚点进过编码器后的输出,对比性损失是一个函数,当q与k+相似而与所有其他{k1,k2,k3,...}不相似时,其值为低;用点积来衡量相似性,考虑了一种对比性损失函数的形式,称为信息噪声对比性损失:
Figure FDA0004170459500000037
其中τ是一个温度超参数,计算结果是在一个正样本和K个负样本上,这个损失是基于(K+1)-分类softmax的分类器的对数损失,该分类器试图将q分类为k+
6.根据权利要求1所述的用于大规模MIMO定位的半监督表征对比学习方法,其特征在于:步骤5所述的在编码器的顶部附加一个随机初始化的全连接回归层f(·)来完成下游的定位任务,将一个随机初始化的全连接回归层f(·)Rd→R2连接到编码器的顶部,以完成下游的定位任务;对于所有参考点中的5%,将这部分参考点的接收信号
Figure FDA0004170459500000038
用地面真实位置坐标矢量/>
Figure FDA0004170459500000039
进行标记,/>
Figure FDA00041704595000000310
利用这个部分标记的数据集,对已经训练好的编码器F(·)和回归模块f(·)进行微调,损失函数如下:
使用均方误差MSE损失函数计算预测的
Figure FDA00041704595000000311
是回归网络的输出值,是一个2维实数向量,代表网络对用户的位置预测和实际位置坐标向量/>
Figure FDA00041704595000000312
之间的距离,带有L2正则化的损失函数说明如下
Figure FDA00041704595000000313
其中Ntrain是训练数据的数量,w是DNN的所有可训练参数的向量,γ是超参数。
CN202310376215.2A 2023-04-11 2023-04-11 用于大规模mimo定位的半监督表征对比学习方法 Pending CN116383656A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310376215.2A CN116383656A (zh) 2023-04-11 2023-04-11 用于大规模mimo定位的半监督表征对比学习方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310376215.2A CN116383656A (zh) 2023-04-11 2023-04-11 用于大规模mimo定位的半监督表征对比学习方法

Publications (1)

Publication Number Publication Date
CN116383656A true CN116383656A (zh) 2023-07-04

Family

ID=86963081

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310376215.2A Pending CN116383656A (zh) 2023-04-11 2023-04-11 用于大规模mimo定位的半监督表征对比学习方法

Country Status (1)

Country Link
CN (1) CN116383656A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116994073A (zh) * 2023-09-27 2023-11-03 江西师范大学 一种自适应正负样本生成的图对比学习方法和装置

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116994073A (zh) * 2023-09-27 2023-11-03 江西师范大学 一种自适应正负样本生成的图对比学习方法和装置
CN116994073B (zh) * 2023-09-27 2024-01-26 江西师范大学 一种自适应正负样本生成的图对比学习方法和装置

Similar Documents

Publication Publication Date Title
Zhang et al. Automatic modulation classification using CNN-LSTM based dual-stream structure
Liu et al. Modulation recognition with graph convolutional network
Wang et al. Multi-task learning for generalized automatic modulation classification under non-Gaussian noise with varying SNR conditions
Huang et al. Deep learning for physical-layer 5G wireless techniques: Opportunities, challenges and solutions
Zhang et al. NAS-AMR: Neural architecture search-based automatic modulation recognition for integrated sensing and communication systems
Wu et al. Learning to localize: A 3D CNN approach to user positioning in massive MIMO-OFDM systems
Kim et al. Towards deep learning-aided wireless channel estimation and channel state information feedback for 6G
Zheng et al. Online deep neural networks for mmWave massive MIMO channel estimation with arbitrary array geometry
Chen et al. On physical-layer authentication via online transfer learning
CN116383656A (zh) 用于大规模mimo定位的半监督表征对比学习方法
Wang et al. A graph neural network learning approach to optimize RIS-assisted federated learning
Li et al. A novel CSI feedback approach for massive MIMO using LSTM-attention CNN
Chen et al. Viewing channel as sequence rather than image: A 2-D Seq2Seq approach for efficient MIMO-OFDM CSI feedback
Hou et al. DASECount: Domain-agnostic sample-efficient wireless indoor crowd counting via few-shot learning
CN114745233B (zh) 一种基于导频设计的联合信道估计方法及装置
Yang et al. MobileNet and knowledge distillation-based automatic scenario recognition method in vehicle-to-vehicle systems
Zhang et al. Modulation classification of active attacks in Internet of Things: Lightweight MCBLDN with spatial transformer network
Hu et al. A learnable optimization and regularization approach to massive MIMO CSI feedback
Tian et al. A privacy-preserved split learning solution for deep learning-based mmwave beam selection
Deng et al. Supervised contrastive CSI representation learning for massive MIMO positioning
Li et al. Multi-task learning-based CSI feedback design in multiple scenarios
Su et al. Channel estimation in massive MIMO systems using a modified Bayes-GMM method
Pan et al. Specific radar emitter identification using 1D-CBAM-ResNet
Zhang et al. Deep learning‐based digital signal modulation identification under different multipath channels
Wei et al. A multi-resolution channel structure learning estimation method of geometry-based stochastic model with multi-scene

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination