CN112561033B - 基于三角卷积的天线阵列波达角估计方法、系统及应用 - Google Patents
基于三角卷积的天线阵列波达角估计方法、系统及应用 Download PDFInfo
- Publication number
- CN112561033B CN112561033B CN202011403551.4A CN202011403551A CN112561033B CN 112561033 B CN112561033 B CN 112561033B CN 202011403551 A CN202011403551 A CN 202011403551A CN 112561033 B CN112561033 B CN 112561033B
- Authority
- CN
- China
- Prior art keywords
- model
- angle
- tdcd
- convolution
- layer
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 101
- 238000005192 partition Methods 0.000 claims abstract description 76
- 239000011159 matrix material Substances 0.000 claims abstract description 46
- 238000012549 training Methods 0.000 claims abstract description 46
- 238000004422 calculation algorithm Methods 0.000 claims abstract description 16
- 238000011478 gradient descent method Methods 0.000 claims abstract description 12
- 230000006870 function Effects 0.000 claims description 73
- 239000013598 vector Substances 0.000 claims description 19
- 238000010276 construction Methods 0.000 claims description 12
- 210000002569 neuron Anatomy 0.000 claims description 12
- 238000004364 calculation method Methods 0.000 claims description 11
- 230000004913 activation Effects 0.000 claims description 9
- 210000004205 output neuron Anatomy 0.000 claims description 8
- 238000010606 normalization Methods 0.000 claims description 5
- 230000001373 regressive effect Effects 0.000 claims description 5
- 238000004590 computer program Methods 0.000 claims description 4
- 238000004891 communication Methods 0.000 claims description 3
- 230000010354 integration Effects 0.000 claims description 3
- 230000000873 masking effect Effects 0.000 claims description 3
- 238000012545 processing Methods 0.000 claims description 3
- 230000002441 reversible effect Effects 0.000 claims description 2
- 230000008569 process Effects 0.000 description 6
- 238000012360 testing method Methods 0.000 description 4
- 238000003491 array Methods 0.000 description 3
- 238000013135 deep learning Methods 0.000 description 3
- 230000007547 defect Effects 0.000 description 3
- 238000013461 design Methods 0.000 description 3
- 238000013459 approach Methods 0.000 description 2
- 238000002474 experimental method Methods 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 238000004088 simulation Methods 0.000 description 2
- 238000007476 Maximum Likelihood Methods 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000008092 positive effect Effects 0.000 description 1
- 230000002829 reductive effect Effects 0.000 description 1
- 230000011218 segmentation Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01S—RADIO DIRECTION-FINDING; RADIO NAVIGATION; DETERMINING DISTANCE OR VELOCITY BY USE OF RADIO WAVES; LOCATING OR PRESENCE-DETECTING BY USE OF THE REFLECTION OR RERADIATION OF RADIO WAVES; ANALOGOUS ARRANGEMENTS USING OTHER WAVES
- G01S3/00—Direction-finders for determining the direction from which infrasonic, sonic, ultrasonic, or electromagnetic waves, or particle emission, not having a directional significance, are being received
- G01S3/02—Direction-finders for determining the direction from which infrasonic, sonic, ultrasonic, or electromagnetic waves, or particle emission, not having a directional significance, are being received using radio waves
- G01S3/14—Systems for determining direction or deviation from predetermined direction
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
Abstract
本发明属于电子信息技术领域,公开了一种基于三角卷积的天线阵列波达角估计方法、系统及应用,波达角估计模型初始化,包括构建TDCD模型、初始化模型的数据样本集、初始化模型可训练参数;根据基于多分区中央差分算法的损失函数,对每一个输入进模型的协方差上三角矩阵样本,计算损失函数值;根据损失函数值使用梯度下降法训练TDCD模型;将待估计信号的协方差上三角矩阵作为输入,通过TCCLNet模型得到输出模型前向运算输出节点的值;计算得到模型所估计的波达角。本发明将模型估角的均方误差相较于CNN算法降低约28.6%,同时基于多分区中央差分算法的损失函数使模型不需要分阶段训练,提高鲁棒性的同时,加速模型的收敛。
Description
技术领域
本发明属于电子信息技术领域,尤其涉及一种基于三角卷积的天线阵列波达角估计方法、系统及应用。
背景技术
波达角(DOA)估计是一个有吸引力的研究领域,其应用包括无线通信,天文观测,雷达和声纳等等。目前,针对DOA估计提出的算法已经有很多,并且其中也有很多已有算法的改进型,总体而言,该领域已取得长期发展。经典的传统方法都是所谓的模型驱动方法,这一类方法首先制定从波达方向到阵列输出的正向参数模型,然后将阵列信号的一些特征和正向参数模型进行匹配,进而估计方向。常见的模型驱动方法有基于波束成形器的方法、基于子空间的方法和极大似然估计方法等等。这些方法的区别往往体现在他们在进行数据特征匹配时的方法不同。模型驱动方法的可解释性很高,因为他们大都有着严格的数学证明以确保稳定可用。这些模型驱动方法也有着明显的缺点,例如他们的性能在很大程度上取决于预先制定的模型的准确性,而且,大多数模型驱动方法有着严格的使用条件,此外,他们往往有着相当高的计算复杂度并且涉及一些复杂运算符以至于难以在便携性或者低功耗设备上快速运行。
为了解决这个问题,使用数据驱动的波达角估计方法在近些年逐渐兴起。这些方法可以直接从训练数据中学习阵列输出和信号方向之间的非线性关系进而进行波达角的估计。这些方法甚至不需要知道阵列的几何形状、阵列信号校准与否以及阵列的瑕疵,因而大大拓宽了这类算法的应用场景。正是因为这些优点,基于数据驱动的波达角估计方法在非理想阵列的情况下获得了强大的性能。近年来,最为典型的数据驱动的波达角估计方法是各种基于深度学习的波达角估计技术,在这其中,基于DNN或者CNN的算法是公认的主流方法。简易的DNN方法虽然容易实现,但是其估角精度比传统的模型驱动方法差,并且计算量也没有得到有效的抑制,因此目前已经很少有更多的学术或工业研究注重DNN的使用。而基于CNN的方法虽然取得了比传统模型驱动方法更高的估角精度,但是没有精心设计的CNN模型方法的计算量仍然很大,这主要由过于冗杂的卷积运算引起。此外,为了追求均方误差更低的估角精度,近期的CNN方法大多使用two-stage方法进行模型构造和训练,即整个模型可以分为两个部分,其一用于提取阵列信号的特征,其二用于使用特征进行估角。通过分阶段设计模型的方法,基于CNN的模型往往在估角精度上更胜一筹,但是带来的问题是这些方法的训练也需要分段,这导致这类模型训练困难,并难以保证收敛性。
通过上述分析,现有技术存在的问题是及缺陷为:
(1)由于模型驱动的方法缺少更为准确的方法设计预先指定的模型,导致模型驱动方法的估角精度受到限制,并且使用条件较为苛刻。
(2)由于基于CNN的方法由于冗杂的卷积核设计,没有充分利用阵列信号的背景,因此计算量过于庞大。
(3)基于CNN深度学习的方法为了追求更高的估角精度,往往设计难以训练和难以收敛的模型。
(4)目前没有针对波达角估计问题专门设计适用的CNN卷积方法,同时,也没有针对波达角估计问题设计的模型损失函数能够在不影响甚至加速模型收敛的同时,解决two-state方法需要分阶段训练和难以收敛的问题。
解决以上问题及缺陷的难度为:需要设计新的利用阵列信号协方差对称性的深度学习网络层进行特征提取才能在不影响模型性能的情况下减小模型的计算量以尽可能减少模型的估角时间,同时该新的网络层要易于训练和收敛;只有针对阵列信号波达角估计场景设计CNN模型的损失函数,才能在避免分阶段训练模型的同时,加速模型的收敛。
解决以上问题及缺陷的意义为:本发明以变形三角卷积和基于多分区中央差分的损失函数为基础,利用了阵列信号协方差三角矩阵的对称性和协方差矩阵元素之间的位置与阵列信号相位的关系,在不影响模型收敛性的前提下,提高了模型的性能并压缩了模型估角的计算量,提高了模型计算波达角的速度。同时,改进的模型损失函数能够避免对模型进行分阶段的训练过程,减少了人工在模型训练过程中的干预,而且不影响模型的收敛速度。
发明内容
针对现有技术存在的问题,本发明提供了一种基于三角卷积的天线阵列波达角估计方法、系统及应用。
本发明是这样实现的,一种基于三角卷积的天线阵列波达角估计方法,所述基于三角卷积的天线阵列波达角估计方法包括:
波达角估计模型初始化,包括构建TDCD模型、初始化模型的训练样本集、初始化模型可训练参数;
根据基于多分区中央差分算法的误差函数,对每一个输入进模型的协方差上三角矩阵样本,计算损失函数值;
根据损失函数值使用梯度下降法训练TDCD模型;
将待估计信号的协方差上三角矩阵作为输入,通过TDCD模型得到输出模型前向运算输出节点的值;
计算得到模型所估计的波达角。
进一步,通过TDCD模型得到输出模型前向运算输出节点的两个向量VC和VR;根据以及/>得到模型所估计的波达角。
进一步,所述基于三角卷积的天线阵列波达角估计方法具体包括以下步骤:
步骤一,使用多层变形三角卷积层、批归一化层、激活层和全连接层构建TDCD模型,其中包括特征提取器、多分区分类器和角度回归器;
步骤二,使用R=E{XXH}计算阵列信号矩阵X的协方差上三角矩阵,用N个信号样本的协方差矩阵组成协方差样本集Ω={ω1,ω2,...ωN},将协方差样本集和对应的信号角度Θ={θ1,θ2,...θN}一一配对,组成模型训练集S={(ω1,θ1),(ω2,θ2),…(ωN,θN)};
步骤三,轮流将训练集中的样本(ωn,θn)作为TDCD的输入,使用TDCD模型对输入样本进行前向传播运算,并产生多分区分类器的输出向量VC以及角度回归器的输出向量VR;
步骤四,根据VC、VR和基于多分区中央差分算法的损失函数计算TDCD模型的损失函数值L;
步骤五,根据所述损失函数值L进行反向计算得到TDCD模型可训练参数的梯度G;
步骤六,根据所述梯度G使用梯度下降法更新TDCD模型的可训练参数;
步骤七,重复步骤三至步骤六完成TDCD模型的训练;
步骤八,将待估计的阵列信号的协方差上三角矩阵为模型输入,使用训练完的TDCD模型,计算模型前向运算的/>和/>
步骤九,使用和/>计算阵列信号的波达角θ。
进一步,所述基于变形三角卷积和多分区中央差分损失函数的天线阵列波达角估计方法的TDCD模型构造方法包括:
步骤一,使用特征提取器构造方法和多层变形三角卷积层构造特征提取器,所述特征提取器接收协方差上三角矩阵作为输入值;
步骤二,将待估角度范围[θs,θe]平均分为B个分区;
步骤三,使用全连接层构造多分区分类器,所述多分区分类器有一个输出神经元节点,对于每个输入样本,多分区分类器的输出神经元产生一个向量VC∈RB×1;
步骤四,使用全连接层构造角度回归器,所述角度回归器有一个输出神经元节点,对于每个输入样本,角度回归器的输出神经元产生一个向量VR∈R2B×1;
所述基于变形三角卷积和多分区中央差分损失函数的天线阵列波达角估计方法的TDCD模型特征提取器的构造方法包括:
步骤一,构造并初始化C个变形三角卷积层T1,T2,...,TC,C个批归一化层BN1,BN2,...BNC以及C-1个激活层RE1,RE2,...,REC-1;
步骤二,设置变形三角卷积层T1为特征提取器中的第一层网络,T1负责接收协方差上三角矩阵;
步骤三,将变形三角卷积层、批归一化层和激活层按照{T1,BN1,RE1,T2,BN2,RE2,...TC,BNC}的顺序依次连接,前一层网络的输出作为后一层网络的输入;
步骤四,将特征提取器中BNC层的输出作为整个特征提取器的输出;
所述基于变形三角卷积和多分区中央差分损失函数的天线阵列波达角估计方法的TDCD模型多分区分类器的构造方法包括:
步骤一,构造并初始化M个全连接层LI1,LI2,...LIM和M-1个激活层RE1,RE2,...REM-1;
步骤二,设置全连接层LI1为多分区分类器的第一层网络,LI1负责接收特征提取器的输出;
步骤三,将全连接层、激活层按照{LI1,RE1,LI2,RE2,...LIM}的顺序依次连接,前一层网络的输出作为后一层网络的输入;
步骤四,将多分区分类器中LIM层的输出VC作为整个多分区分类器的输出;
所述基于变形三角卷积和多分区中央差分损失函数的天线阵列波达角估计方法的TDCD模型角度估计器的构造方法包括:
步骤一,构造并初始化N个全连接层LI1,LI2,...LIN和N-1个激活层RE1,RE2,...REN-1;
步骤二,设置全连接层LI1为角度估计器的第一层网络,LI1负责接收特征提取器的输出;
步骤三,将全连接层、激活层按照{LI1,RE1,LI2,RE2,...LIN}的顺序依次连接,前一层网络的输出作为后一层网络的输入;
步骤四,将角度估计器中LIN层的输出VR作为整个角度估计器的输出;
进一步,所述基于变形三角卷积和多分区中央差分损失函数的天线阵列波达角估计方法的变形三角卷积层构造和初始化方法包括:
步骤一,使用六个控制变量TI,TO,TK,TS,TP,Dp控制变形三角卷积层的生成,分别表示输入通道数量、输出通道数量、卷积核长宽量、卷积步长量、卷积填充量和可变形拓展区间集合量;其中Dp={(0,1),(1,0),(1,1)};
步骤二,将(TK+1)*TK/2个神经元按照行列数相等的矩阵的上三角形状进行排布,形成标准三角卷积核;
步骤三,从DP中选取一对偏置项,对标准三角卷积核每个通道中相同位置的每个神经元进行位置偏置,进而得到偏置后的卷积核通道;
步骤四,堆叠TI*TO个通道形成一个变形三角卷积层的卷积核;
步骤五,使用一维正态分布的随机数初始化卷积核中所有的神经元参数。
进一步,所述基于变形三角卷积和多分区中央差分损失函数的天线阵列波达角估计方法的基于多分区中央差分损失函数的计算方法包括:
步骤一,取B个角度分区中各个分区的中心角度θ1,θ2,...θB;
步骤二,根据模型输入所对应的角度θg计算该角度所属的分区索引为b;
步骤三,根据得到模型预测的分区索引n,使用交叉熵计算分区损失为Lc;
步骤四,使用TDCD模型估计模型输入信号的波达角度θ,并计算θ和θ1,θ2,...θB的差分为θ1′,θ2′,...θB′;
步骤五,将VC归一化为独热码向量并作为θ1′,θ2′,...θB′的掩码;取没有被掩码覆盖的角度误差θ′m1,θ′m2,...,θ′mn,并使用RMSE损失函数计算上述中央差分角度损失为LR;
步骤六,使用L=LC+αLR计算TDCD模型的损失函数值;其中α为一个常量参数。
本发明的另一目的在于提供一种计算机设备,所述计算机设备包括存储器和处理器,所述存储器存储有计算机程序,所述计算机程序被所述处理器执行时,使得所述处理器执行如下步骤:
波达角估计模型初始化,包括构建TDCD模型、初始化模型的训练样本集、初始化模型可训练参数;
根据基于多分区中央差分损失函数,对每一个输入进模型的协方差上三角矩阵样本,计算损失函数值;
根据损失函数值使用梯度下降法训练TDCD模型;
将待估计信号的协方差上三角矩阵作为输入,通过TDCD模型得到输出模型前向运算输出节点的值;
计算得到模型所估计的波达角。
本发明的另一目的在于提供一种计算机可读存储介质,存储有计算机程序,所述计算机程序被处理器执行时,使得所述处理器执行如下步骤:
波达角估计模型初始化,包括构建TDCD模型、初始化模型的训练样本集、初始化模型可训练参数;
根据基于多分区中央差分损失函数,对每一个输入进模型的协方差上三角矩阵样本,计算损失函数值;
根据损失函数值使用梯度下降法训练TDCD模型;
将待估计信号的协方差上三角矩阵作为输入,通过TDCD模型得到输出模型前向运算输出节点的值;
计算得到模型所估计的波达角。
本发明的另一目的在于提供一种信息数据处理终端,所述信息数据处理终端用于实现所述的基于三角卷积的天线阵列波达角估计方法,所述信息数据处理终端包括:无线通信终端、天文观测终端、声呐终端。
本发明的另一目的在于提供一种实施所述基于三角卷积的天线阵列波达角估计方法的基于三角卷积的天线阵列波达角估计系统,所述基于三角卷积的天线阵列波达角估计系统包括:
初始化模块,用于波达角估计模型初始化,包括构建TDCD模型、初始化模型的训练样本集、初始化模型可训练参数;
损失函数值计算模块,用于根据基于多分区中央差分损失函数,对每一个输入进模型的协方差上三角矩阵样本,计算损失函数值;
TDCD模型训练模块,用于根据损失函数值使用梯度下降法训练TDCD模型;
输出模型前向运算输出节点值计算模块,用于将待估计信号的协方差上三角矩阵作为输入,通过TDCD模型得到输出模型前向运算输出节点的值;
波达角计算模块,用于计算得到模型所估计的波达角。
本发明使用3GPP SCME信道模型生成的仿真数据以及使用空时域信道探测器获得的实测数据对TDCD和CNN算法进行测试,其中TDCD模型的角度估计均方误差随训练过程的曲线图如图7所示,实验结果表明TDCD的模型收敛速度明显快于CNN算法,并且TDCD模型收敛完毕后估角的均方误差比CNN算法更小。结合上述的所有技术方案,本发明所具备的优点及积极效果为:本发明以基于变形三角卷积的TDCD和基于多分区中央差分的损失函数为基础,利用阵列信号协方差三角矩阵的对称性和协方差矩阵元素之间的位置与阵列信号相位的关系,在使用协方差上三角的情况下进行波达角估计,将模型计算量减少约50%,同时基于多分区中央差分的损失函数能够将原本需要分阶段训练的模型变成端到端训练(从输入到输出一次性训练),加速模型的收敛。本发明在同等条件下(阵列规模,信号信噪比等)的均方误差比基于CNN的方法低约28.6%。
附图说明
为了更清楚地说明本申请实施例的技术方案,下面将对本申请实施例中所需要使用的附图做简单的介绍,显而易见地,下面所描述的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下还可以根据这些附图获得其他的附图。
图1是本发明实施例提供的基于变形三角卷积和多分区中央差分损失函数的天线阵列波达角估计方法流程图。
图2是本发明实施例提供的基于变形三角卷积和多分区中央差分损失函数的天线阵列波达角估计方法的TDCD构造方法流程图。
图3是本发明实施例提供的基于变形三角卷积和多分区中央差分损失函数的天线阵列波达角估计方法的变形三角卷积层构造方法流程图。
图4是本发明实施例提供的基于变形三角卷积和多分区中央差分损失函数的天线阵列波达角估计方法的变形三角卷积核一个通道内的神经元偏置示意图。
图5是本发明实施例提供的基于变形三角卷积和多分区中央差分损失函数的天线阵列波达角估计方法的多分区中央误差算法的损失函数的计算方法流程图。
图6是本发明实施例提供的基于变形三角卷积和多分区中央差分损失函数的天线阵列波达角估计方法的TDCD模型在训练过程中的损失函数值的下降过程。
图7是本发明实施例提供的基于变形三角卷积和多分区中央差分损失函数的天线阵列波达角估计方法的TDCD模型在训练过程中在测试数据集中的性能表现。
图8是本发明实施例提供的基于变形三角卷积和多分区中央差分损失函数的天线阵列波达角估计方法的TDCD模型在实际生活场景中所估计的角度和信号真实角度的误差。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
针对现有技术存在的问题,本发明提供了一种基于三角卷积的天线阵列波达角估计方法、系统及应用,下面结合附图对本发明作详细的描述。
如图1所示,本发明提供的基于三角卷积的天线阵列波达角估计方法包括以下步骤:
S101:波达角估计模型初始化,包括构建TDCD模型、初始化模型的训练样本集、初始化模型可训练参数;
S102:根据基于多分区中央差分算法的误差函数,对每一个输入进模型的协方差上三角矩阵样本,计算损失函数值;
S103:根据损失函数值使用梯度下降法训练TDCD模型;
S104:将待估计信号的协方差上三角矩阵作为输入,通过TDCD模型得到输出模型前向运算输出节点的两个向量VC和VR;
S105:计算得到模型所估计的波达角。
根据以及/>得到模型所估计的波达角。
本发明提供的基于三角卷积的天线阵列波达角估计方法业内的普通技术人员还可以采用其他的步骤实施,图1的本发明提供的基于三角卷积的天线阵列波达角估计方法仅仅是一个具体实施例而已。
如图2所示,本发明提供的基于三角卷积的天线阵列波达角估计系统包括:
初始化模块1,用于波达角估计模型初始化,包括构建TDCD模型、初始化模型的训练样本集、初始化模型可训练参数;
损失函数值计算模块2,用于根据基于多分区中央差分损失函数,对每一个输入进模型的协方差上三角矩阵样本,计算损失函数值;
TDCD模型训练模块3,用于根据损失函数值使用梯度下降法训练TDCD模型;
输出模型前向运算输出节点值计算模块4,用于将待估计信号的协方差上三角矩阵作为输入,通过TDCD模型得到输出模型前向运算输出节点的值;
波达角计算模块5,用于计算得到模型所估计的波达角。
下面结合附图对本发明的技术方案作进一步描述。
本发明提供的基于三角卷积的天线阵列波达角估计方法具体包括以下步骤:
步骤一,用C个变形三角卷积层、C-1个激活层和C个批归一化层构建TDCD模型的特征提取器,所述特征提取器有一个输入节点和一个输出节点;
步骤二,用M个全连接层构建TDCD模型的多分区分类器,用N个全连接层构建TDCD模型的角度回归器,所述多分区分类器和角度回归器都有一个输入节点和一个输出节点;
步骤三,使用服从正态分布且值范围为[-1,1]的随机数初始化TDCD模型中所有的神经元参数W;
步骤四,使用R=E{XXH}计算阵列信号矩阵X的协方差上三角矩阵,用Q个信号样本的协方差矩阵组成协方差样本集Ω={ω1,ω2,...ωq},将协方差样本集和对应的信号角度Θ={θ1,θ2,...θq}一一配对,组成模型训练集S={(ω1,θ1),(ω2,θ2),...(ωq,θq)};
步骤五,将训练集S中的样本-标签对分为B个批次,每个批次包含b个样本;
步骤六,轮流将训练集中的批次样本Sn作为TDCD的输入,使用TDCD模型对批次样本进行前向传播运算,对同一批次中的任意样本sn,得到多分区分类器的输出向量和角度回归器的输出向量/>
步骤七,根据向量向量/>和θn计算基于多分区中央差分的损失函数L,再根据L的值计算模型所有可训练参数的梯度G,使用梯度G和梯度下降法更新TDCD模型的参数W;
步骤八,重复步骤五至步骤七完成TDCD模型的训练;
步骤九,将待估计的阵列信号的协方差上三角矩阵为模型输入,使用训练完的TDCD模型,计算模型前向运算的/>和/>再根据/>以及/>得到模型所估计的波达角。
所述基于变形三角卷积和多分区中央差分损失函数的天线阵列波达角估计方法的模型前向运算流程包括:
步骤一,构造特征提取器Fe,Fe接收协方差上三角矩阵作为输入值并产生输出其中/>是一个高维张量;
步骤二,构造多分区分类器Fc,Fc接收作为输入,产生向量Vc;
步骤三,构造角度回归器Fr,Fr接收作为输入,产生向量Vr;
步骤四,TDCD模型将Vc和Vr作为模型输出。
如图3所示,本发明实施例提供的变形三角卷积层构造方法包括以下步骤:
步骤一,定义TI,TO,TK,TS,TP,Dp分别表示输入通道数量、输出通道数量、卷积核长宽量、卷积步长量、卷积填充量和可变形拓展区间集合量;其中Dp={(0,1),(1,0),(1,1)};
步骤二,将(TK+1)*TK/2个神经元按照行列数相等的矩阵的上三角形状进行排布,形成标准三角卷积核;
步骤三,从DP中选取一对偏置项,对标准三角卷积核每个通道中相同位置的每个神经元进行位置偏置,进而得到偏置后的卷积核通道;图4展示了某个神经元位置的偏置过程;
步骤四,堆叠TI*TO个通道形成一个变形三角卷积层的卷积核;
步骤五,将待卷积的协方差上三角矩阵的长宽使用TP个值为0的元素拓宽,并让卷积核以步长TS进行二维卷积;
步骤六,对于具有Cin个通道的输入I,变形三角卷积层使用计算输出,其中w为卷积核神经元参数,b为三角卷积层的偏置,*表示二维卷积,j表示通道索引值。
如图5所示,本发明实施例提供的基于多分区中央差分的损失函数的计算方法包括以下步骤:
步骤一,将待估角度范围平均分成B个分区,其中[θB0,θB1)表示第一个分区,以此类推,根据θi=(θBi-1+θBi)/2计算各个分区的中央角度;
步骤二,根据模型输入所对应的参考角度θg和θBb-1≤θg<θBb计算θg所属的分区索引b;
步骤三,根据得到模型预测的分区索引n,使用交叉熵计算分区损失为Lc;
步骤四,根据模型前向运算的结果计算TDCD模型所估计的波达角θ,计算θ和θ1,θ2,...θB的中央差分为θ1′,θ2′,...θB′;
步骤五,将VC归一化为独热码二值01向量作为θ1′,θ2′,...θB′的掩码并将中央差分角度和掩码相乘得到没有被掩码覆盖的角度误差θ′m1,θ′m2,...,θ′mn,其中n是没有被掩码掩盖的中央差分角度的个数;
步骤六,使用计算中央差分的角度损失;
步骤七,使用L=LC+αLR计算TDCD模型的损失函数值;其中α为一个常量参数。
至此本发明提出的阵列信号波达角度估计方法以及系统框架完成,系统框架包括:
基于变形三角卷积和多分区中央误差损失函数的阵列信号波达角估计模块:用于使用阵列信号的协方差矩阵进行信号波达角估计;
基于TDCD的波达角估计模型构造模块:用于构造并初始化可训练、可进行波达角估计的模型;
基于变形三角卷积的变形三角卷积模块:用于TDCD模型特征提取器中提取协方差矩阵的特征;
基于多分区中央差分的损失函数模块:用于计算TDCD在训练中的损失函数值并以此更新模型参数。
下面结合具体实施例对本发明的技术效果作详尽的描述。
实施例1:
使用由3GPP标准SCME仿真模型生成的3000个阵列信号作为原始数据,计算阵列信号的协方差矩阵,并和对应的信号波达角度配对构成模型训练样本集。TDCD模型以0.1的初始学习率进行模型的参数更新,以遍历训练样本集中所有样本为一轮训练,TDCD在经过80轮训练后收敛。使用TDCD对测试样本集中所有的阵列信号估计波达角并计算与真实角度的均方误差,实验表明TDCD的均方误差达到0.20度,而普通的基于CNN的方法的均方误差约为0.28度,TDCD的均方误差性能比基于CNN的方法高约28.6%。图6展示了TDCD在训练过程中的损失函数值的下降过程,图7展示了TDCD在训练的每一轮结束后,在测试数据集中的性能表现,其中均方误差越小表示性能越好。
实施例2:
在一个市区街道高楼场景中,使用空时域信道探测器进行信道测量,其中信号发射端位于高约32米的商品房楼顶,接收端放置在距离街道地面1.5米的移动小车上。取原始数据中直射径的角度(使用GPS定位设备对收发端进行定位,并在三维坐标系中计算收发端相对角度)作为真实的参考角度。计算参考角度相对应的阵列信号的协方差上三角矩阵并作为TDCD的输入,使用100组数据计算TDCD估角和真实角度的均方误差。TDCD估角和真实角度的误差如图8所示。实验表明,本发明能够在实际场景中准确估角。
应当注意,本发明的实施方式可以通过硬件、软件或者软件和硬件的结合来实现。硬件部分可以利用专用逻辑来实现;软件部分可以存储在存储器中,由适当的指令执行系统,例如微处理器或者专用设计硬件来执行。本领域的普通技术人员可以理解上述的设备和方法可以使用计算机可执行指令和/或包含在处理器控制代码中来实现,例如在诸如磁盘、CD或DVD-ROM的载体介质、诸如只读存储器(固件)的可编程的存储器或者诸如光学或电子信号载体的数据载体上提供了这样的代码。本发明的设备及其模块可以由诸如超大规模集成电路或门阵列、诸如逻辑芯片、晶体管等的半导体、或者诸如现场可编程门阵列、可编程逻辑设备等的可编程硬件设备的硬件电路实现,也可以用由各种类型的处理器执行的软件实现,也可以由上述硬件电路和软件的结合例如固件来实现。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,都应涵盖在本发明的保护范围之内。
Claims (5)
1.一种基于三角卷积的天线阵列波达角估计方法,其特征在于,所述基于三角卷积的天线阵列波达角估计方法包括:
波达角估计模型初始化,包括构建TDCD模型、初始化模型的训练样本集、初始化模型可训练参数;
根据基于多分区中央差分算法的误差函数,对每一个输入进模型的协方差上三角矩阵样本,计算损失函数值;
根据损失函数值使用梯度下降法训练TDCD模型;
将待估计信号的协方差上三角矩阵作为输入,通过TDCD模型得到输出模型前向运算输出节点的值;
计算得到模型所估计的波达角;
通过TDCD模型得到输出模型前向运算输出节点的两个向量VC和VR;根据以及/>得到模型所估计的波达角;
所述基于三角卷积的天线阵列波达角估计方法具体包括以下步骤:
步骤一,使用多层变形三角卷积层、批归一化层、激活层和全连接层构建TDCD模型,其中包括特征提取器、多分区分类器和角度回归器;
步骤二,使用R=E{XXH}计算阵列信号矩阵X的协方差上三角矩阵,用Q个信号样本的协方差矩阵组成协方差样本集Ω={ω1,ω2,...,ωQ},将协方差样本集和对应的信号角度Θ={θ1,θ2,...θQ}一一配对,组成模型训练集S={(ω1,θ1),(ω2,θ2),...(ωQ,θQ)};
步骤三,轮流将训练集中的样本(ωq,θq)作为TDCD的输入,使用TDCD模型对输入样本进行前向传播运算,并产生多分区分类器的输出向量VC以及角度回归器的输出向量VR;
步骤四,根据VC、VR和基于多分区中央差分算法的损失函数计算TDCD模型的损失函数值L;
步骤五,根据所述损失函数值L进行反向计算得到TDCD模型可训练参数的梯度G;
步骤六,根据所述梯度G使用梯度下降法更新TDCD模型的可训练参数;
步骤七,重复步骤三至步骤六完成TDCD模型的训练;
步骤八,将待估计的阵列信号的协方差上三角矩阵为模型输入,使用训练完的TDCD模型,计算模型前向运算的/>和/>
步骤九,使用和/>计算阵列信号的波达角θ;
基于变形三角卷积和多分区中央差分损失函数的天线阵列波达角估计方法的TDCD模型构造方法包括:
步骤一,使用特征提取器构造方法和多层变形三角卷积层构造特征提取器,所述特征提取器接收协方差上三角矩阵作为输入值;
步骤二,将待估角度范围[θs,θe]平均分为B个分区;
步骤三,使用全连接层构造多分区分类器,所述多分区分类器有一个输出神经元节点,对于每个输入样本,多分区分类器的输出神经元产生一个向量VC∈RB×1;
步骤四,使用全连接层构造角度回归器,所述角度回归器有一个输出神经元节点,对于每个输入样本,角度回归器的输出神经元产生一个向量VR∈R2B×1;
基于变形三角卷积和多分区中央差分损失函数的天线阵列波达角估计方法的TDCD模型特征提取器的构造方法包括:
步骤一,构造并初始化C个变形三角卷积层T1,T2,...,TC,C个批归一化层BN1,BN2,...BNC以及C-1个激活层RE1,RE2,...,REC-1;
步骤二,设置变形三角卷积层T1为特征提取器中的第一层网络,T1负责接收协方差上三角矩阵;
步骤三,将变形三角卷积层、批归一化层和激活层按照{T1,BN1,RE1,T2,BN2,RE2,...TC,BNC}的顺序依次连接,前一层网络的输出作为后一层网络的输入;
步骤四,将特征提取器中BNC层的输出作为整个特征提取器的输出;
基于变形三角卷积和多分区中央差分损失函数的天线阵列波达角估计方法的TDCD模型多分区分类器的构造方法包括:
步骤一,构造并初始化M个全连接层LI1,LI2,...LIM和M-1个激活层RE1,RE2,...REM-1;
步骤二,设置全连接层LI1为多分区分类器的第一层网络,LI1负责接收特征提取器的输出;
步骤三,将全连接层、激活层按照{LI1,RE1,LI2,RE2,...LIM}的顺序依次连接,前一层网络的输出作为后一层网络的输入;
步骤四,将多分区分类器中LIM层的输出VC作为整个多分区分类器的输出;
基于变形三角卷积和多分区中央差分损失函数的天线阵列波达角估计方法的TDCD模型角度估计器的构造方法包括:
步骤一,构造并初始化N个全连接层LI1,LI2,...LIN和N-1个激活层RE1,RE2,...REN-1;
步骤二,设置全连接层LI1为角度估计器的第一层网络,LI1负责接收特征提取器的输出;
步骤三,将全连接层、激活层按照{LI1,RE1,LI2,RE2,...LIN}的顺序依次连接,前一层网络的输出作为后一层网络的输入;
步骤四,将角度估计器中LIN层的输出VR作为整个角度估计器的输出;
基于变形三角卷积和多分区中央差分损失函数的天线阵列波达角估计方法的变形三角卷积层构造和初始化方法包括:
步骤一,使用六个控制变量TI,TO,TK,TS,TP,Dp控制变形三角卷积层的生成,分别表示输入通道数量、输出通道数量、卷积核长宽量、卷积步长量、卷积填充量和可变形拓展区间集合量;其中Dp={(0,1),(1,0),(1,1)};
步骤二,将(Tk+1)*TK/2个神经元按照行列数相等的矩阵的上三角形状进行排布,形成标准三角卷积核;
步骤三,从DP中选取一对偏置项,对标准三角卷积核每个通道中相同位置的每个神经元进行位置偏置,进而得到偏置后的卷积核通道;
步骤四,堆叠TI*TO个通道形成一个变形三角卷积层的卷积核;
步骤五,使用一维正态分布的随机数初始化卷积核中所有的神经元参数;
所述基于变形三角卷积和多分区中央差分损失函数的天线阵列波达角估计方法的基于多分区中央差分损失函数的计算方法包括:
步骤一,取B个角度分区中各个分区的中心角度θ1,θ2,...θB;
步骤二,根据模型输入所对应的角度θg计算该角度所属的分区索引为b;
步骤三,根据得到模型预测的分区索引n,使用交叉熵计算分区损失为Lc;
步骤四,计算TDCD模型所估计的角度θ,并计算θ和θ1,θ2,...θB的差分为θ1′,θ2′,...θB′;
步骤五,将VC归一化为独热码向量并作为θ1′,θ2′,...θB′的掩码;取没有被掩码覆盖的角度误差θ′m1,θ′m2,...,,θ′mn,并使用RMSE损失函数计算中央差分角度损失为LR;
步骤六,使用L=LC+αLR计算TDCD模型的损失函数值;其中α为一个常量参数。
2.一种计算机设备,其特征在于,所述计算机设备包括存储器和处理器,所述存储器存储有计算机程序,所述计算机程序被所述处理器执行时,使得所述处理器执行如权利要求1所述方法的步骤。
3.一种计算机可读存储介质,存储有计算机程序,所述计算机程序被处理器执行时,使得所述处理器执行如权利要求1所述方法的步骤。
4.一种信息数据处理终端,其特征在于,所述信息数据处理终端用于实现权利要求1所述的基于三角卷积的天线阵列波达角估计方法,所述信息数据处理终端包括:无线通信终端、天文观测终端、声呐终端。
5.一种实施权利要求1所述基于三角卷积的天线阵列波达角估计方法的基于三角卷积的天线阵列波达角估计系统,其特征在于,所述基于三角卷积的天线阵列波达角估计系统包括:
初始化模块,用于波达角估计模型初始化,包括构建TDCD模型、初始化模型的训练样本集、初始化模型可训练参数;
损失函数值计算模块,用于根据基于多分区中央差分损失函数,对每一个输入进模型的协方差上三角矩阵样本,计算损失函数值;
TDCD模型训练模块,用于根据损失函数值使用梯度下降法训练TDCD模型;
输出模型前向运算输出节点值计算模块,用于将待估计信号的协方差上三角矩阵作为输入,通过TDCD模型得到输出模型前向运算输出节点的值;
波达角计算模块,用于计算得到模型所估计的波达角。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011403551.4A CN112561033B (zh) | 2020-12-04 | 2020-12-04 | 基于三角卷积的天线阵列波达角估计方法、系统及应用 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011403551.4A CN112561033B (zh) | 2020-12-04 | 2020-12-04 | 基于三角卷积的天线阵列波达角估计方法、系统及应用 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112561033A CN112561033A (zh) | 2021-03-26 |
CN112561033B true CN112561033B (zh) | 2024-01-16 |
Family
ID=75048419
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011403551.4A Active CN112561033B (zh) | 2020-12-04 | 2020-12-04 | 基于三角卷积的天线阵列波达角估计方法、系统及应用 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112561033B (zh) |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110967665A (zh) * | 2019-10-07 | 2020-04-07 | 西安电子科技大学 | 一种多个外辐射源下运动目标回波的doa估计方法 |
WO2020216431A1 (en) * | 2019-04-23 | 2020-10-29 | Telefonaktiebolaget Lm Ericsson (Publ) | Network configuration optimization using a reinforcement learning agent |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108932480B (zh) * | 2018-06-08 | 2022-03-15 | 电子科技大学 | 基于1d-cnn的分布式光纤传感信号特征学习与分类方法 |
-
2020
- 2020-12-04 CN CN202011403551.4A patent/CN112561033B/zh active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2020216431A1 (en) * | 2019-04-23 | 2020-10-29 | Telefonaktiebolaget Lm Ericsson (Publ) | Network configuration optimization using a reinforcement learning agent |
CN110967665A (zh) * | 2019-10-07 | 2020-04-07 | 西安电子科技大学 | 一种多个外辐射源下运动目标回波的doa估计方法 |
Non-Patent Citations (3)
Title |
---|
"Regularized Training Framework for Combining Pruning and Quantization to Compress Neural Networks";Qimin Ding et al.;《2019 11th International Conference on Wireless Communications and Signal Processing (WCSP)》;全文 * |
"多入多出超宽带信道建模与仿真";左晓亚等;系统仿真学报;第24卷(第8期);全文 * |
协方差矩阵输入的DOA估计方法;陶业荣;安新宇;张义军;李鹏飞;;无线电工程(第02期);全文 * |
Also Published As
Publication number | Publication date |
---|---|
CN112561033A (zh) | 2021-03-26 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR102243036B1 (ko) | 가산기를 이용한 다차원 텐서의 데이터 액세스 | |
Shao et al. | Ssn: Learning sparse switchable normalization via sparsestmax | |
US11409438B2 (en) | Peripheral circuit and system supporting RRAM-based neural network training | |
US10108538B1 (en) | Accessing prologue and epilogue data | |
US20180005110A1 (en) | Resistive processing units and neural network training methods | |
CN110849369A (zh) | 机器人跟踪方法、装置、设备及计算机可读存储介质 | |
US11455374B2 (en) | System and method for combining differentiable partial differential equation solvers and graph neural networks for fluid flow prediction | |
CN107610146A (zh) | 图像场景分割方法、装置、计算设备及计算机存储介质 | |
CN111881840B (zh) | 一种基于图网络的多目标跟踪方法 | |
CN111983927A (zh) | 一种新型的最大协熵椭球集员滤波方法 | |
CN107832789B (zh) | 基于平均影响值数据变换的特征加权k近邻故障诊断方法 | |
CN111401565A (zh) | 一种基于机器学习算法XGBoost的DOA估计方法 | |
CN111257845B (zh) | 一种基于近似消息传递的不在网格目标角度估计方法 | |
CN112884837A (zh) | 道路定位方法、装置、设备及存储介质 | |
CN112710982B (zh) | 一种天线阵列波达角估计方法、系统、介质、设备及应用 | |
CN112561033B (zh) | 基于三角卷积的天线阵列波达角估计方法、系统及应用 | |
CN112949944B (zh) | 一种基于时空特征的地下水位智能预测方法及系统 | |
CN116958809A (zh) | 一种特征库迁移的遥感小样本目标检测方法 | |
CN115731382A (zh) | 点云目标检测方法、装置、计算机设备和存储介质 | |
CN112633299B (zh) | 一种目标检测方法、网络、装置、终端设备及存储介质 | |
CN110856252B (zh) | 一种考虑测量误差的二维平面传感器定位方法及系统 | |
CN114648560A (zh) | 分布式图像配准方法、系统、介质、计算机设备及终端 | |
GB2567038B (en) | Accessing prologue and epilogue data | |
CN113536567A (zh) | 一种用于多目标矢量拟合的方法 | |
Tsai et al. | Ivs-caffe—hardware-oriented neural network model development |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |