CN113935402A - 时差定位模型的训练方法、装置及电子设备 - Google Patents

时差定位模型的训练方法、装置及电子设备 Download PDF

Info

Publication number
CN113935402A
CN113935402A CN202111105897.0A CN202111105897A CN113935402A CN 113935402 A CN113935402 A CN 113935402A CN 202111105897 A CN202111105897 A CN 202111105897A CN 113935402 A CN113935402 A CN 113935402A
Authority
CN
China
Prior art keywords
time difference
loss function
training
positioning model
training sample
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202111105897.0A
Other languages
English (en)
Inventor
尤明懿
陆安南
叶云霞
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
CETC 36 Research Institute
Original Assignee
CETC 36 Research Institute
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by CETC 36 Research Institute filed Critical CETC 36 Research Institute
Priority to CN202111105897.0A priority Critical patent/CN113935402A/zh
Publication of CN113935402A publication Critical patent/CN113935402A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01SRADIO DIRECTION-FINDING; RADIO NAVIGATION; DETERMINING DISTANCE OR VELOCITY BY USE OF RADIO WAVES; LOCATING OR PRESENCE-DETECTING BY USE OF THE REFLECTION OR RERADIATION OF RADIO WAVES; ANALOGOUS ARRANGEMENTS USING OTHER WAVES
    • G01S5/00Position-fixing by co-ordinating two or more direction or position line determinations; Position-fixing by co-ordinating two or more distance determinations
    • G01S5/02Position-fixing by co-ordinating two or more direction or position line determinations; Position-fixing by co-ordinating two or more distance determinations using radio waves
    • G01S5/06Position of source determined by co-ordinating a plurality of position lines defined by path-difference measurements
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/16Matrix or vector computation, e.g. matrix-matrix or matrix-vector multiplication, matrix factorization
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/18Complex mathematical operations for evaluating statistical data, e.g. average values, frequency distributions, probability functions, regression analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Mathematical Physics (AREA)
  • Pure & Applied Mathematics (AREA)
  • Mathematical Optimization (AREA)
  • General Engineering & Computer Science (AREA)
  • Computational Mathematics (AREA)
  • Mathematical Analysis (AREA)
  • Evolutionary Biology (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Software Systems (AREA)
  • Artificial Intelligence (AREA)
  • Algebra (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Databases & Information Systems (AREA)
  • Evolutionary Computation (AREA)
  • Operations Research (AREA)
  • Probability & Statistics with Applications (AREA)
  • Radar, Positioning & Navigation (AREA)
  • Remote Sensing (AREA)
  • Computing Systems (AREA)
  • Radar Systems Or Details Thereof (AREA)

Abstract

本申请公开了一种时差定位模型的训练方法、装置及电子设备。该方法包括:基于训练样本构建时差定位模型的输入;构建时差定位模型的损失函数,时差定位模型的损失函数基于优化后的加权均方根误差损失函数得到,优化后的加权均方根误差损失函数包括训练样本平衡策略;基于训练样本平衡策略对训练样本进行再平衡处理,得到再平衡处理后的训练样本;根据时差定位模型的输入、再平衡处理后的训练样本和时差定位模型的损失函数对视差定位模型进行训练,得到训练后的时差定位模型。本申请采用伴有训练样本再平衡策略的传统MSE损失函数作为时差定位模型的损失函数,无需采集更多的训练样本,提升了时差定位模型的训练效率,且能够提高模型精度。

Description

时差定位模型的训练方法、装置及电子设备
技术领域
本申请涉及时差定位技术领域,具体涉及一种时差定位模型的训练方法、装置及电子设备。
背景技术
无源定位技术已广泛应用于雷达、声呐、5G/6G无线网络等领域。常用的定位方法包括测向定位、测频定位、时差(Time Difference of Arrival,简称TDOA)定位、时差频差定位、混合定位、直接定位等。目前,给定信号参数或信号,已发展出很多定位算法。通常而言,逼近克拉美罗下界(Cramer-Rao Lower Bound,简称CRLB)的算法的计算复杂度是很高的。
无源定位的另一个实际问题是定位精度对非理想因素十分敏感,非理想因素包括时频不同步、观测站位置不确定、固定测向偏离以及复杂信号传输信道等等。尽管目前已提出许多应对非理想因素的校正方法,但这些方法成功应用的前提是确切知晓当前定位系统存在哪一种非理想因素。此外,绝大多数校正方法仅适用于单一非理想因素的场景。
近年来,深度学习技术展现出强大的建模能力及建模之后的快速推理能力。许多研究人员致力于采用深度学习技术解决复杂的定位问题,其中大部分均为室内定位问题。然而由于墙壁的阻隔,基于GPS信号的室内定位精度并不理想。另一方面,对于物联网及机器人等应用场景而言,室内高精度定位能力又很重要。因此,采用深度学习技术解决具有高动态、多反射等复杂因素的室内定位问题就显得十分迫切而有价值。相对而言,室外定位方面的相应成果就少得多。
基于深度学习的方法通常将定位问题建模成分类问题或回归问题,而采用交叉熵和均方根误差(Mean Squared Error,简称MSE)损失函数时并不考虑目标处于不同位置时的理论定位精度是不一样的。采用等权重的损失函数通常会导致定位精度平衡的现象,例如进一步牺牲低精度区域的定位精度以获得整个感兴趣区域的更低的MSE。然而,这显然将导致目标位置的有偏估计,且在一些场景下效果并不理想。
发明内容
有鉴于此,本申请的主要目的在于提供了一种时差定位模型的训练方法、装置及电子设备,用于解决现有的定位模型定位效果不好的技术问题。
依据本申请的第一方面,提供了一种时差定位模型的训练方法,包括:
基于训练样本构建时差定位模型的输入;
构建时差定位模型的损失函数,其中所述时差定位模型的损失函数基于优化后的加权均方根误差损失函数得到,所述优化后的加权均方根误差损失函数包括训练样本平衡策略;
基于所述训练样本平衡策略对所述训练样本进行再平衡处理,得到再平衡处理后的训练样本;
根据所述时差定位模型的输入、所述再平衡处理后的训练样本和所述时差定位模型的损失函数对所述视差定位模型进行训练,得到训练后的时差定位模型,以根据所述时差定位模型进行辐射源的定位。
可选地,所述基于训练样本构建时差定位模型的输入包括:
确定参考观测站;
确定所述参考观测站与各非参考观测站之间的到达时间差;
根据所述参考观测站与各非参考观测站之间的到达时间差确定所述参考观测站与各非参考观测站之间的距离差真值矢量及对应的含噪距离差矢量;
根据所述参考观测站与各非参考观测站之间的到达时间差、距离差真值矢量和含噪距离差矢量构建加性噪声模型;
在各观测站处于时间同步的情况下,直接将所述加性噪声模型中定义的含噪距离差矢量作为所述视差定位模型的输入;
在各观测站处于时间不同步的情况下,对所述加性噪声模型进行修正,并将修正后的加性噪声模型中定义的含噪距离差矢量作为所述视差定位模型的输入。
可选地,所述对所述加性噪声模型进行修正包括:
确定所述参考观测站与各非参考观测站之间的时延;
根据所述参考观测站与各非参考观测站之间的时延,确定所述参考观测站与各非参考观测站之间的距离延迟矢量;
根据所述距离延迟矢量对所述加性噪声模型进行修正。
可选地,所述构建时差定位模型的损失函数包括:
确定参考观测站与各非参考观测站之间的距离差测量误差的协方差矩阵;
基于所述距离差测量误差的协方差矩阵,利用基于辐射源位置的CRLB克拉美罗下界确定训练样本的标记值对应的协方差矩阵;
根据所述训练样本的标记值对应的协方差矩阵和均方根误差损失函数构建加权均方根误差损失函数;
对所述加权均方根误差损失函数进行优化,并将优化后的加权均方根误差损失函数作为所述时差定位模型的损失函数。
可选地,所述对所述加权均方根误差损失函数进行优化包括:
在辐射源各个维度的预测误差独立且有类似预测误差方差的情况下,对所述加权均方根误差损失函数进行近似处理;
将近似处理后的加权均方根误差损失函数作为所述时差定位模型的损失函数。
可选地,所述训练样本平衡策略基于训练样本的标记值对应的协方差矩阵的迹得到,所述基于所述训练样本平衡策略对所述训练样本进行再平衡处理包括:
根据所述训练样本的标记值对应的协方差矩阵的迹确定对各个类别的训练样本的扩充数量;
根据各个类别的训练样本的扩充数量对各个类别的训练样本进行扩充。
依据本申请的第二方面,提供了一种时差定位模型的训练装置,包括:
第一构建单元,用于基于训练样本构建时差定位模型的输入;
第二构建单元,用于构建时差定位模型的损失函数,其中所述时差定位模型的损失函数基于优化后的加权均方根误差损失函数得到,所述优化后的加权均方根误差损失函数包括训练样本平衡策略;
再平衡处理单元,用于获取用于训练时差定位模型的训练样本,并基于所述训练样本平衡策略对所述训练样本进行再平衡处理,得到再平衡处理后的训练样本;
训练单元,用于根据所述时差定位模型的输入、所述再平衡处理后的训练样本和所述时差定位模型的损失函数对所述视差定位模型进行训练,得到训练后的时差定位模型,以根据所述时差定位模型进行辐射源的定位。
可选地,所述第二构建单元具体用于:
确定观测站之间的距离差测量误差的协方差矩阵;
基于观测站之间的距离差测量误差的协方差矩阵,利用基于辐射源位置的CRLB克拉美罗下界确定训练样本的标记值对应的协方差矩阵;
根据所述训练样本的标记值对应的协方差矩阵和均方根误差损失函数构建加权均方根误差损失函数;
对所述加权均方根误差损失函数进行优化,并将优化后的加权均方根误差损失函数作为所述时差定位模型的损失函数。
可选地,所述训练样本平衡策略基于训练样本的标记值对应的协方差矩阵的迹得到,所述再平衡处理单元具体用于:
根据所述训练样本的标记值对应的协方差矩阵的迹确定对各个类别的训练样本的扩充数量;
根据各个类别的训练样本的扩充数量对各个类别的训练样本进行扩充。
依据本申请的第三方面,提供了一种电子设备,包括:处理器,存储计算机可执行指令的存储器,
所述可执行指令在被所述处理器执行时,实现前述时差定位模型的训练方法。
依据本申请的第四方面,提供了一种计算机可读存储介质,所述计算机可读存储介质存储一个或多个程序,所述一个或多个程序当被处理器执行时,实现前述的时差定位模型的训练方法。
本申请的有益效果是:本申请实施例的时差定位模型的训练方法,先基于训练样本构建时差定位模型的输入;然后构建时差定位模型的损失函数,其中时差定位模型的损失函数基于优化后的加权均方根误差损失函数得到,优化后的加权均方根误差损失函数包括训练样本平衡策略;之后基于训练样本平衡策略对训练样本进行再平衡处理,得到再平衡处理后的训练样本;最后根据时差定位模型的输入、再平衡处理后的训练样本和时差定位模型的损失函数对视差定位模型进行训练,得到训练后的时差定位模型,以根据时差定位模型进行辐射源的定位。本申请实施例构建的时差定位模型的损失函数是基于不同辐射源位置的CRLB确定的,能够提高模型精度,同时采用伴有训练样本再平衡策略的传统MSE损失函数作为时差定位模型的损失函数,无需采集更多的训练样本,提升了时差定位模型的训练效率。
附图说明
通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本申请的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中:
图1为本申请一个实施例的时差定位模型的训练方法的流程图;
图2为本申请一个实施例的深度神经网络的架构示意图;
图3为本申请一个实施例的时差定位模型的定位精度几何因子示意图;
图4为本申请一个实施例的时差定位模型的训练方法与基于均匀采样训练样本的深度神经网络的CDF对比示意图;
图5(a)为基于均匀采样训练样本的深度神经网络的定位误差方差等高线;
图5(b)为本申请一个实施例的时差定位模型的训练方法的定位误差方差等高线;
图6为本申请一个实施例的时差定位模型的训练方法、基于均匀采样训练样本的深度神经网络以及基于MLE方法的CDF对比示意图;
图7为本申请另一个实施例的时差定位模型的训练方法的定位误差方差等高线;
图8为本申请一个实施例的时差定位模型的训练装置的框图;
图9为本申请一个实施例中电子设备的结构示意图。
具体实施方式
下面将参照附图更详细地描述本申请的示例性实施例。提供这些实施例是为了能够更透彻地理解本申请,并且能够将本申请的范围完整的传达给本领域的技术人员。虽然附图中显示了本申请的示例性实施例,然而应当理解,可以以各种形式实现本申请而不应被这里阐述的实施例所限制。
图1示出了根据本申请一个实施例的时差定位模型的训练方法的流程示意图,参见图1,本申请实施例的时差定位模型的训练方法包括如下步骤S110至步骤S140:
步骤S110,基于训练样本构建时差定位模型的输入;
步骤S120,构建时差定位模型的损失函数,其中时差定位模型的损失函数基于优化后的加权均方根误差损失函数得到,优化后的加权均方根误差损失函数包括训练样本平衡策略;
步骤S130,基于训练样本平衡策略对训练样本进行再平衡处理,得到再平衡处理后的训练样本;
步骤S140,根据时差定位模型的输入、再平衡处理后的训练样本和时差定位模型的损失函数对视差定位模型进行训练,得到训练后的时差定位模型,以根据时差定位模型进行辐射源的定位。
本申请实施例构建的时差定位模型的损失函数是基于不同辐射源位置的CRLB确定的,能够提高模型精度,同时采用伴有训练样本再平衡策略的传统MSE损失函数作为时差定位模型的损失函数,无需采集更多的训练样本,提升了时差定位模型的训练效率。
在本申请的一个实施例中,基于训练样本构建时差定位模型的输入包括:确定参考观测站;确定参考观测站与各非参考观测站之间的到达时间差;根据参考观测站与各非参考观测站之间的到达时间差确定参考观测站与各非参考观测站之间的距离差真值矢量及对应的含噪距离差矢量;根据参考观测站与各非参考观测站之间的到达时间差、距离差真值矢量和含噪距离差矢量构建加性噪声模型;在各观测站处于时间同步的情况下,直接将加性噪声模型中定义的含噪距离差矢量作为视差定位模型的输入;在各观测站处于时间不同步的情况下,对加性噪声模型进行修正,并将修正后的加性噪声模型中定义的含噪距离差矢量作为视差定位模型的输入。
在本申请的一个实施例中,对加性噪声模型进行修正包括:确定参考观测站与各非参考观测站之间的时延;根据参考观测站与各非参考观测站之间的时延,确定参考观测站与各非参考观测站之间的距离延迟矢量;根据距离延迟矢量对加性噪声模型进行修正。
本申请实施例的时差定位模型主要用于定位辐射源的位置,可以采用深度神经网络的架构进行训练。在训练时差定位模型时,可以先根据采集的训练样本构建时差定位模型的输入,即定义训练样本以何种特征形式输入到时差定位模型中进行训练。
具体地,考虑一个三维定位场景,其中采用M个观测站根据TDOA测量值确定一固定辐射源的位置u=[x,y,z]T。辐射源与观测站i的距离可以表示为:
Figure BDA0003272334910000081
其中,c代表光速,ti代表辐射源到观测站i的信号传播时间,si=[xi,yi,zi]T为观测站i的位置。
通常,在非合作场景下很难根据接收到的信号直接估计ti,因为信号的发射时刻是往往是未知的。相对地,测量两个观测站之间的TDOA要容易得多,因此可以有:
ri1=ri-r1=c(ti-t1)=cti1 (2)
其中,ti1是观测站1和i之间的TDOA。令
Figure BDA0003272334910000082
为距离差真值矢量,令
Figure BDA0003272334910000091
为测量所得的含噪距离差矢量。通常假设TDOA测量值可描述成加性噪声模型,即:
Figure BDA0003272334910000092
其中,Δr=[Δr21,…,ΔrM1]T=c[Δt21,…,ΔtM1]T为TDOA噪声矢量。通常,Δr是零均值的,且有协方差矩阵:
Figure BDA0003272334910000093
其中,
Figure BDA0003272334910000094
为元素[i,i]为
Figure BDA0003272334910000095
其余元素为0的对角阵,i=1,…,M-1。1(M-1)×(M-1)代表尺寸为(M-1)×(M-1)的全1矩阵,
Figure BDA0003272334910000096
代表观测站i的测距误差。Q的非对角形式是由将观测站1作为共同参考站引起的。当然,也可以将全部观测站中的任一观测站作为参考站。
对于观测站不同步的场景,则需要对上式(3)中的
Figure BDA0003272334910000097
进行修正,具体可以采用如下方式:
Figure BDA0003272334910000098
其中,rd=ctd=c[td12,…,td1M]为观测站之间的延迟矢量,而td1i为观测站1和观测站i之间的时延,i=2,…,M。
时差定位算法即基于式(3)或式(5)给定的
Figure BDA0003272334910000099
估计目标位置,本申请实施例也即以式(3)或式(5)中定义的
Figure BDA00032723349100000910
作为时差定位模型的输入。
在本申请的一个实施例中,时差定位模型包括依次连接的一个输入层、一个卷积层、一个批归一化层、一个线性整流单元、一个卷积层、一个批归一化层、一个线性整流单元、一个全连接层、一个线性整流单元和一个输出层。
本申请实施例的时差定位模型可以基于模型输入构建适于定位的深度神经网络。鉴于卷积神经网络强大的建模能力,本申请实施例具体设计了一种卷积神经网络以进行辐射源定位,如图2所示,提供了本申请一个实施例的深度神经网络的架构示意图,其中I为模型输入,O为模型输出。
从图2中可以看出,一个卷积块包含一组顺序连接的卷积层、批归一化层和线性整流单元(Rectified Linear Unit,简称RELU)等。本申请实施例中可以定义卷积块数量Ncn=2。此外,定义网络的输出为辐射源位置矢量,即:O=u。
本申请实施例的卷积神经网络的整体架构可表示为由输入到输出的一组非线性映射∑i(I):R(M-1)×1×1→R3
具体可写作:
Figure BDA0003272334910000101
其中,
Figure BDA0003272334910000102
为深度神经网络的第i个函数,
Figure BDA0003272334910000103
对应输入层,
Figure BDA0003272334910000104
对应输出层,
Figure BDA0003272334910000105
Figure BDA0003272334910000106
对应全连接层,
Figure BDA0003272334910000107
Figure BDA0003272334910000108
对应卷积层,
Figure BDA0003272334910000109
Figure BDA00032723349100001010
对应批归一化层,
Figure BDA00032723349100001011
Figure BDA00032723349100001012
对应RELU层。
在本申请的一个实施例中,构建时差定位模型的损失函数包括:确定参考观测站与各非参考观测站之间的距离差测量误差的协方差矩阵;基于距离差测量误差的协方差矩阵,利用基于辐射源位置的CRLB克拉美罗下界确定训练样本的标记值对应的协方差矩阵;根据训练样本的标记值对应的协方差矩阵和均方根误差损失函数构建加权均方根误差损失函数;对加权均方根误差损失函数进行优化,并将优化后的加权均方根误差损失函数作为时差定位模型的损失函数。
本申请实施例还事先定义了时差定位模型的损失函数,基于不同辐射源位置的理论定位精度(CRLB)改进传统的等权重MSE损失函数,提出了WMSE(Weight Mean SquaredError,加权均方根误差)损失函数,并为提升模型训练效率,进一步提出了训练样本再平衡策略。
传统的MSE损失函数未考虑训练样本中,不同目标位置的目标理论上有不同的定位精度。这种处理方式的潜在不足,是即使在没有非理想因素的情况下也无法逼近CRLB。直观上,这样的模型将对全部感兴趣区域内的各处的定位精度进行再平衡。为了改进智能定位模型的表现,需要一种考虑不同辐射源位置模型预测误差协方差矩阵的WMSE损失。给定训练样本是独立采集的,则优化后的深度神经网络模型参数应为:
Figure BDA0003272334910000111
其中,P为深度神经网络模型的参数,而P*为其最优实现,N为训练样本数,Oi为训练样本i的标记值,而
Figure BDA0003272334910000112
为其预测值,QOi为Oi的协方差矩阵,通常可基于定位精度的CRLB获得。例如,基于式(3)的测量值
Figure BDA0003272334910000113
u的CRLB可以表示为:
Figure BDA0003272334910000114
由上式(8)可见,u的CRLB取决于辐射源的具体位置,因此WMSE与Oi相关。然而,采用式(7)中的WMSE损失函数进行模型训练是困难的,因为对于这样的损失函数求取梯度较传统的MSE损失函数要复杂得多,因此训练效率会受到影响,因此本申请实施例可以对式(7)中的WMSE损失函数进行优化,并将优化后的WMSE损失函数作为最终时差定位模型的损失函数。
在本申请的一个实施例中,对加权均方根误差损失函数进行优化包括:在辐射源各个维度的预测误差独立且有类似预测误差方差的情况下,对加权均方根误差损失函数进行近似处理;将近似处理后的加权均方根误差损失函数作为时差定位模型的损失函数。
为了使得训练过程更加高效,本申请实施例在对WMSE损失函数进行优化处理时,可以对式(7)中的WMSE损失函数进行如下的近似处理:
Figure BDA0003272334910000121
其中,Nd为u的维数,trace(A)为
Figure BDA0003272334910000122
的迹,当辐射源各个维度的预测误差独立且有类似预测误差方差时上式(9)成立,实际应用时该条件成立的场景是比较较多的。基于式(9),可以进一步进行如下推导:
Figure BDA0003272334910000123
其中,[A]为对A向下取整,n为满足
Figure BDA0003272334910000124
的实数。
基于上式(10),每个训练样本被重复
Figure BDA0003272334910000125
次,但无需采集更多新的训练样本。此外,上式(10)中WMSE损失函数经过近似处理后变成了传统的MSE损失函数,因此训练过程将更为高效。基于式(10)中的损失函数对深度学习模型进行训练,能够获得时差定位模型的最优参数P*,因此后续当获得新的未标记的观测值时,将其代入训练好的时差定位模型,即可获得模型输出即辐射源的位置。
在本申请的一个实施例中,训练样本平衡策略基于训练样本的标记值对应的协方差矩阵的迹得到,基于训练样本平衡策略对训练样本进行再平衡处理包括:根据训练样本的标记值对应的协方差矩阵的迹确定对各个类别的训练样本的扩充数量;根据各个类别的训练样本的扩充数量对各个类别的训练样本进行扩充。
基于上式(10)中的训练样本再平衡策略
Figure BDA0003272334910000131
每个训练样本会被重复
Figure BDA0003272334910000132
次,从而实现对训练样本的扩充,无需采集更多新的训练样本,解决了训练样本数量较少时的模型训练效果不佳的问题,提高了模型训练精度。
为了便于对本申请各实施例的理解,提供了本申请一种典型应用示例以演示本申请各实施例所述的时差定位模型的训练方法的应用场景及应用效果。
考虑一个五站二维定位场景,观测站的位置分别为:s1=[0,3.33,0]T,s2=[-16.67,0,0]T,s3=[-8.33,3.33,0]T,s4=[16.67,-5,0]T及s5=[25,3.33,0]T,单位:公里。感兴趣区域X轴范围为-50~50,Y轴范围为100~200。在每个位置(xz,yz)均采集5个训练样本,其中:
Figure BDA0003272334910000134
上述均匀采集的样本总数为51005个。基于CRLB辅助的训练样本再平衡策略,在不额外采集样本的条件下,将训练样本数扩充为242015个,此外,定义每个观测站
Figure BDA0003272334910000133
基于上述设置,提供了本申请一个实施例的时差定位模型的定位精度几何因子(Geometric Dilution Precision,简称GDOP)示意图,如图3所示。
另一方面,在感兴趣的定位区域内以5公里为步进采集测试样本,每个位置采集100个样本,最终采集到44100个样本。
首先考虑没有非理想因素的场景,此时可用式(3)刻画时差定位模型的输入,对图2所示的深度神经网络训练1000个周期。作为比较,基于未采用训练样本再平衡策略的原51005个样本训练一个结构同图2的深度神经网络,例如可看作是基于均匀采样训练样本的深度神经网络。
图4给出了本申请一个实施例的时差定位模型的训练方法与基于均匀采样训练样本的深度神经网络的定位误差累积分布函数(CDF,Cumulative Distribution Function)对比示意图。此外,图4还给出了基于极大似然法(Maximum Likelihood Estimate,简称MLE)的定位误差CDF。
图5(a)提供了基于均匀采样训练样本的深度神经网络的定位误差方差等高线,图5(b)提供了本申请一个实施例的时差定位模型的训练方法的定位误差方差等高线。尽管图5(a)与图3中的结果相去甚远,图5(a)与图3中的结果比较相似。图4与图5中的结果证明了本申请的时差定位模型的训练方法的有效性,其不仅从整体上提升了定位精度,而且使得定位误差的分布逼近CRLB。
之后考虑存在时间不同步情况的场景,此时基于式(5)定义rd=[1,1,2,2]T公里,训练样本与测试样本的产生方式同上个场景。图6给出了本申请一个实施例的时差定位模型的训练方法、基于均匀采样训练样本的深度神经网络以及基于MLE方法的CDF对比示意图。
图6中的结果显示,传统的MLE方法的性能受时间不同步的影响极大,而基于深度神经网络模型的CDF与图4中的结果较为接近。此外,本申请的时差定位模型的训练方法表现最佳。存在时间不同步因素的场景下,如图7所示,提供了本申请另一个实施例的时差定位模型的训练方法的定位误差方差等高线,这再次证明了深度神经网络模型在缓解非理想因素影响方面的能力。
与前述时差定位模型的训练方法同属于一个技术构思,本申请实施例还提供了时差定位模型的训练装置。图8示出了本申请一个实施例的时差定位模型的训练装置的框图,参见图8,时差定位模型的训练装置800包括:第一构建单元810、第二构建单元820、再平衡处理单元830以及训练单元840。其中,
第一构建单元810,用于基于训练样本构建时差定位模型的输入;
第二构建单元820,用于构建时差定位模型的损失函数,其中时差定位模型的损失函数基于优化后的加权均方根误差损失函数得到,优化后的加权均方根误差损失函数包括训练样本平衡策略;
再平衡处理单元830,用于获取用于训练时差定位模型的训练样本,并基于训练样本平衡策略对训练样本进行再平衡处理,得到再平衡处理后的训练样本;
训练单元840,用于根据时差定位模型的输入、再平衡处理后的训练样本和时差定位模型的损失函数对视差定位模型进行训练,得到训练后的时差定位模型,以根据时差定位模型进行辐射源的定位。
在本申请的一个实施例中,第一构建单元810具体用于:确定参考观测站;确定参考观测站与各非参考观测站之间的到达时间差;根据参考观测站与各非参考观测站之间的到达时间差确定参考观测站与各非参考观测站之间的距离差真值矢量及对应的含噪距离差矢量;根据参考观测站与各非参考观测站之间的到达时间差、距离差真值矢量和含噪距离差矢量构建加性噪声模型;在各观测站处于时间同步的情况下,直接将加性噪声模型中定义的含噪距离差矢量作为视差定位模型的输入;在各观测站处于时间不同步的情况下,对加性噪声模型进行修正,并将修正后的加性噪声模型中定义的含噪距离差矢量作为视差定位模型的输入。
在本申请的一个实施例中,第一构建单元810具体用于:确定参考观测站与各非参考观测站之间的时延;根据参考观测站与各非参考观测站之间的时延,确定参考观测站与各非参考观测站之间的距离延迟矢量;根据距离延迟矢量对加性噪声模型进行修正。
在本申请的一个实施例中,第二构建单元820具体用于:确定观测站之间的距离差测量误差的协方差矩阵;基于观测站之间的距离差测量误差的协方差矩阵,利用基于辐射源位置的CRLB克拉美罗下界确定训练样本的标记值对应的协方差矩阵;根据训练样本的标记值对应的协方差矩阵和均方根误差损失函数构建加权均方根误差损失函数;对加权均方根误差损失函数进行优化,并将优化后的加权均方根误差损失函数作为时差定位模型的损失函数。
在本申请的一个实施例中,第二构建单元820具体用于:在辐射源各个维度的预测误差独立且有类似预测误差方差的情况下,对加权均方根误差损失函数进行近似处理;将近似处理后的加权均方根误差损失函数作为时差定位模型的损失函数。
在本申请的一个实施例中,训练样本平衡策略基于训练样本的标记值对应的协方差矩阵的迹得到,再平衡处理单元830具体用于:根据训练样本的标记值对应的协方差矩阵的迹确定对各个类别的训练样本的扩充数量;根据各个类别的训练样本的扩充数量对各个类别的训练样本进行扩充。
需要说明的是:
图9示意了电子设备的结构示意图。请参考图9,在硬件层面,该电子设备包括存储器和处理器,可选地还包括接口模块、通信模块等。存储器可能包含内存,例如高速随机存取存储器(Random-Access Memory,RAM),也可能还包括非易失性存储器(non-volatilememory),例如至少一个磁盘存储器等。当然,该电子设备还可能包括其他业务所需要的硬件。
处理器、接口模块、通信模块和存储器可以通过内部总线相互连接,该内部总线可以是ISA(Industry Standard Architecture,工业标准体系结构)总线、PCI(PeripheralComponent Interconnect,外设部件互连标准)总线或EISA(Extended Industry StandardArchitecture,扩展工业标准结构)总线等。总线可以分为地址总线、数据总线、控制总线等。为便于表示,图9中仅用一个双向箭头表示,但并不表示仅有一根总线或一种类型的总线。
存储器,用于存放计算机可执行指令。存储器通过内部总线向处理器提供计算机可执行指令。
处理器,执行存储器所存放的计算机可执行指令,并具体用于实现以下操作:
基于训练样本构建时差定位模型的输入;
构建时差定位模型的损失函数,其中时差定位模型的损失函数基于优化后的加权均方根误差损失函数得到,优化后的加权均方根误差损失函数包括训练样本平衡策略;
基于训练样本平衡策略对训练样本进行再平衡处理,得到再平衡处理后的训练样本;
根据时差定位模型的输入、再平衡处理后的训练样本和时差定位模型的损失函数对视差定位模型进行训练,得到训练后的时差定位模型,以根据时差定位模型进行辐射源的定位。
上述如本申请图8所示实施例揭示的时差定位模型的训练装置执行的功能可以应用于处理器中,或者由处理器实现。处理器可能是一种集成电路芯片,具有信号的处理能力。在实现过程中,上述方法的各步骤可以通过处理器中的硬件的集成逻辑电路或者软件形式的指令完成。上述的处理器可以是通用处理器,包括中央处理器(Central ProcessingUnit,CPU)、网络处理器(Network Processor,NP)等;还可以是数字信号处理器(DigitalSignal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。可以实现或者执行本申请实施例中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。结合本申请实施例所公开的方法的步骤可以直接体现为硬件译码处理器执行完成,或者用译码处理器中的硬件及软件模块组合执行完成。软件模块可以位于随机存储器,闪存、只读存储器,可编程只读存储器或者电可擦写可编程存储器、寄存器等本领域成熟的存储介质中。该存储介质位于存储器,处理器读取存储器中的信息,结合其硬件完成上述方法的步骤。
该电子设备还可执行图1中时差定位模型的训练方法执行的步骤,并实现时差定位模型的训练方法在图1所示实施例的功能,本申请实施例在此不再赘述。
本申请实施例还提出了一种计算机可读存储介质,该计算机可读存储介质存储一个或多个程序,该一个或多个程序当被处理器执行时,实现前述的时差定位模型的训练方法,并具体用于执行:
基于训练样本构建时差定位模型的输入;
构建时差定位模型的损失函数,其中时差定位模型的损失函数基于优化后的加权均方根误差损失函数得到,优化后的加权均方根误差损失函数包括训练样本平衡策略;
基于训练样本平衡策略对训练样本进行再平衡处理,得到再平衡处理后的训练样本;
根据时差定位模型的输入、再平衡处理后的训练样本和时差定位模型的损失函数对视差定位模型进行训练,得到训练后的时差定位模型,以根据时差定位模型进行辐射源的定位。
本领域内的技术人员应明白,本申请的实施例可提供为方法、系统、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本申请是根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
在一个典型的配置中,计算设备包括一个或多个处理器(CPU)、输入/输出接口、网络接口和内存。
内存可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM)。内存是计算机可读介质的示例。
计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括暂存电脑可读媒体(transitory media),如调制的数据信号和载波。
还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括要素的过程、方法、商品或者设备中还存在另外的相同要素。
本领域技术人员应明白,本申请的实施例可提供为方法、系统或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其特征在于包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
以上仅为本申请的实施例而已,并不用于限制本申请。对于本领域技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本申请的权利要求范围之内。

Claims (10)

1.一种时差定位模型的训练方法,其特征在于,包括:
基于训练样本构建时差定位模型的输入;
构建时差定位模型的损失函数,其中所述时差定位模型的损失函数基于优化后的加权均方根误差损失函数得到,所述优化后的加权均方根误差损失函数包括训练样本平衡策略;
基于所述训练样本平衡策略对所述训练样本进行再平衡处理,得到再平衡处理后的训练样本;
根据所述时差定位模型的输入、所述再平衡处理后的训练样本和所述时差定位模型的损失函数对所述视差定位模型进行训练,得到训练后的时差定位模型,以根据所述时差定位模型进行辐射源的定位。
2.根据权利要求1所述的方法,其特征在于,所述基于训练样本构建时差定位模型的输入包括:
确定参考观测站;
确定所述参考观测站与各非参考观测站之间的到达时间差;
根据所述参考观测站与各非参考观测站之间的到达时间差确定所述参考观测站与各非参考观测站之间的距离差真值矢量及对应的含噪距离差矢量;
根据所述参考观测站与各非参考观测站之间的到达时间差、距离差真值矢量和含噪距离差矢量构建加性噪声模型;
在各观测站处于时间同步的情况下,直接将所述加性噪声模型中定义的含噪距离差矢量作为所述视差定位模型的输入;
在各观测站处于时间不同步的情况下,对所述加性噪声模型进行修正,并将修正后的加性噪声模型中定义的含噪距离差矢量作为所述视差定位模型的输入。
3.根据权利要求2所述的方法,其特征在于,所述对所述加性噪声模型进行修正包括:
确定所述参考观测站与各非参考观测站之间的时延;
根据所述参考观测站与各非参考观测站之间的时延,确定所述参考观测站与各非参考观测站之间的距离延迟矢量;
根据所述距离延迟矢量对所述加性噪声模型进行修正。
4.根据权利要求1所述的方法,其特征在于,所述构建时差定位模型的损失函数包括:
确定参考观测站与各非参考观测站之间的距离差测量误差的协方差矩阵;
基于所述距离差测量误差的协方差矩阵,利用基于辐射源位置的CRLB克拉美罗下界确定训练样本的标记值对应的协方差矩阵;
根据所述训练样本的标记值对应的协方差矩阵和均方根误差损失函数构建加权均方根误差损失函数;
对所述加权均方根误差损失函数进行优化,并将优化后的加权均方根误差损失函数作为所述时差定位模型的损失函数。
5.根据权利要求4所述的方法,其特征在于,所述对所述加权均方根误差损失函数进行优化包括:
在辐射源各个维度的预测误差独立且有类似预测误差方差的情况下,对所述加权均方根误差损失函数进行近似处理;
将近似处理后的加权均方根误差损失函数作为所述时差定位模型的损失函数。
6.根据权利要求1所述的方法,其特征在于,所述训练样本平衡策略基于训练样本的标记值对应的协方差矩阵的迹得到,所述基于所述训练样本平衡策略对所述训练样本进行再平衡处理包括:
根据所述训练样本的标记值对应的协方差矩阵的迹确定对各个类别的训练样本的扩充数量;
根据各个类别的训练样本的扩充数量对各个类别的训练样本进行扩充。
7.一种时差定位模型的训练装置,其特征在于,包括:
第一构建单元,用于基于训练样本构建时差定位模型的输入;
第二构建单元,用于构建时差定位模型的损失函数,其中所述时差定位模型的损失函数基于优化后的加权均方根误差损失函数得到,所述优化后的加权均方根误差损失函数包括训练样本平衡策略;
再平衡处理单元,用于获取用于训练时差定位模型的训练样本,并基于所述训练样本平衡策略对所述训练样本进行再平衡处理,得到再平衡处理后的训练样本;
训练单元,用于根据所述时差定位模型的输入、所述再平衡处理后的训练样本和所述时差定位模型的损失函数对所述视差定位模型进行训练,得到训练后的时差定位模型,以根据所述时差定位模型进行辐射源的定位。
8.根据权利要求7所述的装置,其特征在于,所述第二构建单元具体用于:
确定观测站之间的距离差测量误差的协方差矩阵;
基于观测站之间的距离差测量误差的协方差矩阵,利用基于辐射源位置的CRLB克拉美罗下界确定训练样本的标记值对应的协方差矩阵;
根据所述训练样本的标记值对应的协方差矩阵和均方根误差损失函数构建加权均方根误差损失函数;
对所述加权均方根误差损失函数进行优化,并将优化后的加权均方根误差损失函数作为所述时差定位模型的损失函数。
9.根据权利要求7所述的装置,其特征在于,所述训练样本平衡策略基于训练样本的标记值对应的协方差矩阵的迹得到,所述再平衡处理单元具体用于:
根据所述训练样本的标记值对应的协方差矩阵的迹确定对各个类别的训练样本的扩充数量;
根据各个类别的训练样本的扩充数量对各个类别的训练样本进行扩充。
10.一种电子设备,其特征在于,包括:处理器,存储计算机可执行指令的存储器,
所述可执行指令在被所述处理器执行时,实现所述权利要求1至6之任一所述时差定位模型的训练方法。
CN202111105897.0A 2021-09-22 2021-09-22 时差定位模型的训练方法、装置及电子设备 Pending CN113935402A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111105897.0A CN113935402A (zh) 2021-09-22 2021-09-22 时差定位模型的训练方法、装置及电子设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111105897.0A CN113935402A (zh) 2021-09-22 2021-09-22 时差定位模型的训练方法、装置及电子设备

Publications (1)

Publication Number Publication Date
CN113935402A true CN113935402A (zh) 2022-01-14

Family

ID=79276186

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111105897.0A Pending CN113935402A (zh) 2021-09-22 2021-09-22 时差定位模型的训练方法、装置及电子设备

Country Status (1)

Country Link
CN (1) CN113935402A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115524662A (zh) * 2022-10-27 2022-12-27 中国电子科技集团公司信息科学研究院 测向时差联合定位方法、系统、电子设备及存储介质
CN115598592A (zh) * 2022-10-27 2023-01-13 中国电子科技集团公司信息科学研究院(Cn) 时频差联合定位方法、系统、电子设备及存储介质

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115524662A (zh) * 2022-10-27 2022-12-27 中国电子科技集团公司信息科学研究院 测向时差联合定位方法、系统、电子设备及存储介质
CN115598592A (zh) * 2022-10-27 2023-01-13 中国电子科技集团公司信息科学研究院(Cn) 时频差联合定位方法、系统、电子设备及存储介质
CN115524662B (zh) * 2022-10-27 2023-09-19 中国电子科技集团公司信息科学研究院 测向时差联合定位方法、系统、电子设备及存储介质
CN115598592B (zh) * 2022-10-27 2023-09-19 中国电子科技集团公司信息科学研究院 时频差联合定位方法、系统、电子设备及存储介质

Similar Documents

Publication Publication Date Title
JP7344389B2 (ja) 協調測位方法、装置、機器及び記憶媒体
CN107255795B (zh) 基于ekf/efir混合滤波的室内移动机器人定位方法和装置
US10375171B2 (en) Iterative learning for reliable sensor sourcing systems
US20160094951A1 (en) Wi-fi fingerprint location database creation and update from crowd sourced data
US8824325B2 (en) Positioning technique for wireless communication system
CN113935402A (zh) 时差定位模型的训练方法、装置及电子设备
CN108668358B (zh) 一种应用于无线传感网络的基于到达时间的协作定位方法
CN113514821B (zh) 基于时变时差的定位方法、装置和系统
EP2769233A1 (en) Time of arrival based wireless positioning system
CN109379711B (zh) 一种定位方法
CN109581281B (zh) 基于到达时间差和到达频率差的移动目标定位方法
CN109195110B (zh) 基于层次聚类技术和在线极限学习机的室内定位方法
CN109507706B (zh) 一种gps信号丢失的预测定位方法
CN108566677B (zh) 一种指纹定位方法及装置
CN113189541B (zh) 一种定位方法、装置及设备
CN112965076A (zh) 一种用于机器人的多雷达定位系统及方法
Huang et al. CRLBs for WSNs localization in NLOS environment
CN104635206B (zh) 一种无线定位的方法及装置
CN113203424B (zh) 多传感器的数据融合方法、装置及相关设备
CN113253196B (zh) 一种多信号测向方法、装置和电子设备
CN115060289A (zh) 定位轨迹精度评估方法、装置及电子设备、存储介质
CN109115219B (zh) 一种基于场景系数的室内三维定位方法
CN115696572B (zh) 一种定位数据的生成方法、装置及相关设备
CN116736327B (zh) 定位数据优化方法、装置、电子设备和可读存储介质
CN113341373B (zh) 一种定位方法、装置和电子设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination