CN114818853A

CN114818853A - 基于双向门控循环单元和条件随机场的意图识别方法

Info

Publication number: CN114818853A
Application number: CN202210234671.9A
Authority: CN
Inventors: 付强; 王思远; 王刚; 范成礼
Original assignee: Air Force Engineering University of PLA
Current assignee: Air Force Engineering University of PLA
Priority date: 2022-03-10
Filing date: 2022-03-10
Publication date: 2022-07-29
Anticipated expiration: 2042-03-10
Also published as: CN114818853B

Abstract

提供一种基于双向门控循环单元和条件随机场的意图识别方法，包括下列步骤：目标意图空间编码；目标意图识别输入特征输入；双向门控循环单元BiGRU设计；注意力机制设计；条件随机场CRF设计。针对传统的空中目标意图识别方法仅仅考虑单一时刻的目标状态信息，且最终得到意图识别结果不具有前后依赖性的问题，相较于其他先进的意图识别方法，本发明的方法在空中意图识别领域具有整体上的优势。

Description

基于双向门控循环单元和条件随机场的意图识别方法

技术领域

本发明涉及深度学习领域技术，具体涉及一种基于双向门控循环单元和条件随机场的意图识别方法。

背景技术

战场态势瞬息万变，快速准确地识别敌方目标的战术意图是获得决策优势的重要条件。针对传统的目标意图识别方法仅仅考虑了单一时刻的目标状态信息，且最终得到意图识别结果不具有前后依赖性的问题。

赵捍东的《舰艇对空中来袭目标意图的预判方法》(中国舰船研究，2018， 13(01)：133-139.)等人利用统计学习的方法进行模板匹配，提出应用异质集成学习器解决目标意图的模糊不确定性分类问题。何艳的《基于历史航迹特征的飞行意图识别》(现代计算机，2019(29)：29-34.)等利用均值及曲线拟合的思想，从历史航迹数据中总结航迹特征，并提出一种基于航迹形状约束的半监督K-means 聚类改进算法对历史航迹进行聚类。Wang的《Tactical intention recognition of aerial target based on XGBoost decisiontree》(Journal of Measurement Science and Instrumentation，2018，9(2)：148-152.)给出一种基于XGBoost决策树的方法对空中目标进行意图识别。专家系统利用规则来描述知识，其需要构建知识库和推理机，如果条件与已知的事实相匹配，则输出意图识别结果。陈优敏的《基于知识图谱的目标战术意图识别仿真》(计算机仿真，2019，36(08)：1-4.)提出基于知识图谱的目标战术意图识别方法，构建战场目标的本体模型，分析战场目标本体模型中的二元关系，根据分析结果构建知识图谱。

近年来，由于数据获取能力和计算能力的不断增强，使得以数据为驱动的意图识别算法变为可能。魏蔚的《基于径向基神经网络的侦察目标意图识别研究》(舰船电子工程，2018，38(10)：37-40)针对无人机空中侦查目标，提出一种基于径向基神经网络的目标意图识别模型，其仍属于浅层学习范畴。周旺旺的《基于深度神经网络的空中目标作战意图识别》(航空学报，2018，39(11)： 200-208.)针对BP算法的收敛速度慢以及容易陷入局部最优的情况，引入ReLU 激活函数和Adam优化算法构建意图识别模型，获得了更高的识别准确率。欧微的《战场对敌目标战术意图智能识别模型研究》(计算机仿真，2017，34(09)：10-14)针对传统模型在知识表达和网络训练方面的困难，提出基于长短时记忆网络(LSTM)的智能意图识别模型，通过设计相应的特征编码、标签封装和意图解析等方式对意图进行识别。Xue的《Panoramic Convolutional Long Short-Term Memory Networks for CombatIntention Recognition of Aerial Targets》(IEEE Access 2020，8，183312-183323.)设计出一种全景卷积长短期记忆神经网络 (PCLSTM)来提高意图识别能力，并通过时间序列池化层来减少神经网络的参数。对于空中目标的意图识别问题，其输出应该具有前后依赖性，即目标在连续时刻的意图识别结果前后关联。前述方法均没有同时考虑这两方面的性质。

发明内容

针对现有技术存在的问题，本发明提供一种基于双向门控循环单元和条件随机场的意图识别方法，具体包括下列步骤：

Step1.目标意图空间编码

建立目标战术意图空间集合为{攻击、侦察、监视、掩护、干扰、撤退}；

假定每个目标在某一时刻只有一个主要战术意图，采用目标的主要战术意图对样本数据进行标注和识别；针对上述6种战术意图进行标签化处理，每一种意图用一个数字编码；对样本数据的标注采用仿真推演系统事后分析得到，系统采用上帝视角，对每一组样本数据进行复推，根据环境属性、实体状态、执行任务等信息归纳出目标的作战意图，并赋予意图标签，之后再由专家对加注的标签进行校验和修订；

Step2.目标意图识别输入特征输入

选取的目标意图识别输入特征共有W维，包括数值型特征和非数值型特征两种；

定义矩阵U^(t)和矩阵V^(t)，分别描述t时刻目标意图识别输入特征中的数值型和非数值型特征；对目标意图识别输入特征进行归一化处理能够消除数据量纲影响，同时能够提高网络收敛效率；对于高度、速度、加速度等数值型特征，采用最大-最小标准化方法进行归一化处理，将其映射到区间[0，1]，计算过程如下：

其中，u′为初始输入数值，u为归一化后的结果，min为该维度下的最小值，max 为该维度下的最大值，c为极小的常数；

每一时刻的目标状态输入采用矩阵形式；目标意图识别输入特征中的数值型特征表示为

其中，元素

表示在t时刻的输入中，目标在第j帧的第i种数值型特征状态值； m为目标的数值型特征总维度；M为每个时刻的采样帧数，采样帧数是可变的，在训练过程中通过测试得到最佳采样帧数；

非数值型特征均为分类数据，神经网络无法直接处理分类数据，因此需要对其进行数值化处理，将其转化为在区间[0，1]的结果，过程如下：

其中，K为该维度下的总分类数目，则原始输入v′对应的该维度下第k类映射到区间[0，1]的结果为v；目标意图特征输入中的非数值型特征表示为

其中，元素

表示在t时刻的输入中，目标在第j帧的第i种非数值型特征状态值，数值及非数值特征均用i表示；n为目标的非数值型特征总维度；M为每个时刻的采样帧数；

根据以上归一化及数值化处理方式，得到t时刻目标意图识别输入特征初始输入总特征I_t＝{U_t，V_t}；在此基础上，对其进行整合及统一编码，得到标准特征输入矩阵X_t，表示为

其中，元素

表示在t时刻的输入中，目标在第j帧的第i种特征值；N为目标意图识别输入特征总维度；M为每个时刻的采样帧数；

Step3.双向门控循环单元BiGRU设计

给定t时刻的输入X_t和上一时刻隐藏状态H_t-1，H_t-1在上一时刻求解得到，经过激活函数sigmoid函数的全连接层的计算，得到重置门R_t、更新门Z_t的输出：

R_t＝σ(X_tW_xr+H_t-1W_hr+b_r) (6)

Z_t＝σ(X_tW_xz+H_t-1W_hz+b_z) (7)

其中，W_xr、W_hr和W_xz、W_hz分别为第一、第二、第三、第四权重参数，b_r、b_z分别为第一、第二偏差参数；重置门和更新门中每个元素的值域都是[0，1]；σ为归一化系数；

t时刻的候选隐藏状态

和隐藏状态H_t的计算如下：

其中，W_xh和W_hh分别为第五、第六权重参数，b_h是第三偏差参数，·是按元素乘法；重置门R_t的功能是决定前一时刻隐藏状态需要重置的信息有多少，当R_t元素值接近0时，代表重置对应隐藏状态元素为0，即前一时刻的隐藏状态全部重置为当前时刻的输入；更新门Z_t的功能是决定前一时刻的信息是否被丢弃，其值越小，代表前一时刻隐藏节点所包含的信息被丢弃得越多；GRU网络模型复杂度较低的原因是忽略了某些没用的信息，而其中的重置门能够捕捉时间序列里短期的依赖关系，更新门则能够捕捉时间序列里长期的依赖关系；

在对意图识别模型进行训练过程中，会发现当前时刻不仅仅由之前的时刻序列决定，有时候也可能由后面时刻的序列决定；BiGRU由前向的GRU网络与后向的GRU网络组成，在GRU的基础上增加从后往前传递信息的隐藏层，从而解决上述问题；

BiGRU在时刻t的隐藏状态H_t由正向隐藏状态

和反向隐藏状态

两部分共同求得，正向隐藏状态

由当前时刻的输入X_t和前一时刻的正向隐藏状态

决定，反向隐藏状态

由当前时刻的输入X_t和后一时刻的反向隐藏状态

决定，

同样由前一及后一时刻确定，循环迭代，H₀初始化值设置为0；计算公式为

其中，W₁、W₂、W₃、W₄分别为单元之间的第一、第二、第三、第四权重，f为 GRU单元隐藏层状态计算方法，如公式(6)至(9)所示；BiGRU中通过连结正向隐藏状态

和反向隐藏状态

得到最终的隐藏状态H_t，计算公式为

其中，W₅和W₆分别为正向隐藏状态

和反向隐藏状态

的权重，b_t为t时刻隐藏层状态对应的偏置；

Step4.注意力机制设计

注意力机制输入为经过BiGRU神经网络层输出的隐藏状态H_t，通过注意力机制可以对隐藏状态加权表征，以挖掘连续时刻特征输入间的关联关系，最终得到新的状态序列作为输出；

对于t时刻，注意力机制的计算公式为：

e_t＝v_ttanh(W_tH_t+b_t) (13)

其中，v_t和W_t分别为t时刻的第一和第二权重系数矩阵，b_t为t时刻相应的偏移量，e_t为隐藏层状态H_t在t时刻得到的能量值；a_t为每一时刻的影响权重，S_t为最终得到的各个时刻输出的加权和，即下一步全连接层的输入，T为总时间；

Step5.条件随机场CRF设计

空中目标的战术意图之间是具有前后依赖性质的，即各个时刻的意图并非完全独立，而是依赖于前一个时刻的意图；

若给定目标输入标准特征集序列X＝(X₁，X₂，...，X_t)，X₁，X₂，…，X_t分别为1到t时刻输入的特征向量，意图输出标签序列Y＝(Y₁，Y₂，...，Y_t)，Y₁，Y₂，...，Y_t分别为1到t时刻输出的意图标签，Y＝(Y₁，Y₂，...，Y_t)由条件随机场CRF输出，将每对X和Y的评估分数定义为F＝(X，Y)；F＝(X，Y)包含两部分：第一部分是每个时刻t，经过BiGRU 层、注意力层、全连接层输出的意图得分之和；将全连接层的输出序列 O＝(O₁，O₂，...，O_t)看作分数矩阵，矩阵大小为t×l，其中l为战术意图数量，O_i为i时刻6种意图分别的得分，i∈[1，t]，其反映的是第i个时刻属于各种战术意图的可能性，O_i，j表示第i个时刻第j个战术意图对应的得分，j∈[1，l]，O_i，j∈O_i，O_i∈O；第二部分是t时刻意图转移的得分之和；F＝(X，Y)的计算公式为

通过归一化所有标注序列，得到关于意图输出标签序列Y的概率分布，公式为

式中，Y(X)表示目标输入标准特征集序列X对应的所有可能的状态序列，Y′为Y 中的每一项，即Y′包含Y₁...Y_t；

在模型训练过程中，将有关正确状态序列的对数概率最大化，公式为

在进行意图识别时，在新的输入标准特征集序列X＝(X₁，X₂，...，X_t)上找到总得分F＝(X，Y)最高的状态序列，即

其中Y＝{Y₁，Y₂，...，Y_t}，则时刻t的目标意图识别结果为Y_t。

在本发明的一个具体实施例中，在Step2中，选取的目标意图识别输入特征共有12维，分别是：高度、速度、加速度、航向角、方位角、距离、航路捷径、一维距离像、雷达反射截面积、空对空雷达状态、空对地雷达状态、电子干扰状态，其中前9种为数值型特征，后3种为非数值型特征。

在本发明的另一个具体实施例中，在Step2中，取c＝10^-5。

在本发明的又一个具体实施例中，在Step5中：在进行意图识别时，采用动态规划算法Viterbi在新的输入标准特征集序列X＝(X₁，X₂，...，X_t)上找到总得分 F＝(X，Y)最高的状态序列。

本发明提出一种空中目标意图识别方法。首先，将战场环境、目标属性，以及目标在连续多个时刻的状态信息进行统一编码，作为输入信号，描述其时序变化特征；其次，构建双向门控循环单元及条件随机场(BiGRU-CRF)网络，同时对输入的时序性和输出的前后依赖性进行建模，解决连续时刻意图的关联问题；再次，为了进一步提高空中目标意图识别性能，还引入了注意力机制，能够对门控循环单元(GRU)网络各个时刻输出的编码信息进行有效利用；最后，通过实验仿真验证所建立的模型具有较好的空中目标意图识别效果。

附图说明

图1给出意图空间编码；

图2给出目标意图识别特征；

图3给出BiGRU结构；

图4给出意图识别准确率结果；

图5给出意图识别损失值结果；

图6给出BiGRU-Attention-CRF的混淆矩阵；

图7给出注意力机制可视化结果；

图8给出了意图识别准确率消融实验结果；

图9给出了意图识别损失值消融实验结果。

具体实施方式

本发明提出一种空中目标意图识别方法。首先，将战场环境、目标属性，以及目标在连续多个时刻的状态信息进行统一编码，作为输入信号，描述其时序变化特征；其次，构建BiGRU-CRF网络，同时对输入的时序性和输出的前后依赖性进行建模，解决连续时刻意图的关联问题；再次，为进一步提高空中目标意图识别性能，引入注意力机制，能够对门控循环单元(GRU)网络各个时刻输出的编码信息进行有效利用；最后，通过实验仿真验证所建立的模型具有较好的空中目标意图识别效果。

Step1.目标意图空间编码

为了准确识别空中来袭目标的战术意图，首先要给出合理的敌方目标战术意图空间(以下简称为“意图空间”)，这也是对仿真数据集进行样本标注的前提。针对不同的想定背景、不同的作战场景和不同的目标实体，意图空间往往存在较大差异。因此，需要根据相应的作战背景、作战经验以及敌方目标的基本属性和可能担负的作战任务，来定义目标的意图空间。本发明的仿真数据集和实时时序特征集依靠战场模拟系统得到，该模拟系统主要针对敌方进攻、我方防守的情景进行仿真模拟。因此，综合作战背景与敌方目标的属性及任务，建立目标战术意图空间集合为{攻击、侦察、监视、掩护、干扰、撤退}。

随着当前装备的发展，在作战任务中，一个目标可能同时具备着多种战术意图，随着时间及态势的变化，其战术意图可能发生转变。与此同时，一个目标由于类型等属性固定，且其状态变化具有固定的变化范围，其战术意图数量通常有限。本发明后续的研究假定每个目标在某一时刻只有一个主要战术意图，采用目标的主要战术意图对样本数据进行标注和识别。

意图识别问题本质上是一个多分类问题，因此在训练过程中需要进行有监督的学习。将GRU网络应用于意图识别问题，其中的一个关键问题就是如何将人设定的意图空间抽象为计算机可以识别的模式标签。在这一过程中，指挥员从战场态势数据中提取目标的关键特征信息，并结合已有的规则及自身具备的经验，识别出目标的真实战术意图，因此将意图空间封装为模型训练标签的过程也是体现模型具有知识驱动能力的过程。针对上述设定的意图空间中的6种战术意图，采用如图1所示方式进行标签化处理，每一种意图用一个数字编码，方便模型进行训练与识别。

本发明对样本数据的标注采用仿真推演系统事后分析得到，系统采用上帝视角，可以对每一组样本数据进行复推，复推指专家可以在仿真推演之后依据推演过程中收集到的数据归纳出目标的作战意图，也就是根据环境属性、实体状态、执行任务等信息归纳出目标的作战意图，并赋予意图标签，之后再由领域专家对加注的标签进行校验和修订。

Step2.目标意图识别输入特征输入

目标的意图通过目标的行动和状态体现，进行意图识别需要对传感器获得的信息进行融合与分析，因此选择合适的特征信息作为模型的输入至关重要。目标在作战过程中，除去一些目标固有属性例如目标类型、目标体积等基本保持不变外，由于其需要通过一系列的战术动作实现其意图，因此目标实时状态具有一定的时序变化特征。除此之外，在识别目标意图的过程中，还应该考虑到战场环境信息，具体包括地形、天候、风向等因素，但由于这一类环境因素在一定时间范围内不会产生剧烈变化，因此本文暂时不考虑环境信息。

确定了意图空间之后，就可以根据目标意图识别输入特征与意图之间的关系确定需要输入的特征信息。例如，具有侦察意图的侦察机为了躲避雷达探测，一般采用低空或超高空侦察，其飞行高度为100～1000m或15000m以上，且飞机上的空对地雷达在侦察过程中保持开启。歼击机在空战格斗时通常采用大速度接敌，飞行速度一般为700～1500km/h，而轰炸机飞行速度一般为 600～900km/h，且只有在准备攻击和攻击阶段保持雷达开启。具有监视和干扰意图的飞机为了自身安全不需要飞临保卫要地上空，因此其航路捷径较大，相比之下具有攻击意图的飞机的航路捷径较小。考虑敌我双方的敌对关系及一些技术限制，对于一些无法直接获得的目标意图识别输入特征，可以采用其他特征进行代替，例如目标类型和目标体积一般无法直接得到，可以利用雷达一维距离像和雷达反射截面积进行体现。

综合以上分析，本文选取的目标意图识别输入特征共有12维，分别是：高度、速度、加速度、航向角、方位角、距离、航路捷径、一维距离像、雷达反射截面积、空对空雷达状态、空对地雷达状态、电子干扰状态，其中前9种为数值型特征，后3种为非数值型特征。如图2所示为意图识别输入特征分类。

定义矩阵U^(t)和矩阵V^(t)，分别描述t时刻目标意图识别输入特征中的数值型和非数值型特征。对目标意图识别输入特征进行归一化处理能够消除数据量纲影响，同时能够提高网络收敛效率。对于高度、速度、加速度等数值型特征，采用最大-最小标准化方法进行归一化处理，将其映射到区间[0，1]，计算过程如下：

其中，u′为初始输入数值，u为归一化后的结果，min为该维度下的最小值，max 为该维度下的最大值，c为极小的常数，防止max＝min时分母为0，取c＝10^-5。

目标状态在目标作战过程中不断发生变化，连续变化的目标状态往往可以体现出目标的意图，因此每一时刻的目标状态输入采用矩阵形式。目标意图识别输入特征中的数值型特征可以表示为

其中，元素

表示在t时刻的输入中，目标在第j帧的第i种数值型特征状态值。 m为目标的数值型特征总维度，本文中m＝9。M为每个时刻的采样帧数，采样帧数是可变的，在训练过程中可以通过测试得到最佳采样帧数。

目标雷达状态、电子干扰状态等非数值型特征均为分类数据，神经网络无法直接处理分类数据，因此需要对其进行数值化处理，将其转化为在区间[0，1]的结果，过程如下：

其中，K为该维度下的总分类数目，则原始输入v′对应的该维度下第k类映射到区间[0，1]的结果为v。例如目标的空对地雷达状态，共有开、关、未知三种状态，按照威胁度从小到大进行排序，其状态分别为[关，未知，开]，数值化处理后结果为[0，1/3，2/3]。目标意图特征输入中的非数值型特征可以表示为

其中，元素

表示在t时刻的输入中，目标在第j帧的第i种非数值型特征状态值，数值及非数值特征均用i表示。n为目标的非数值型特征总维度，本文中n＝3。M 为每个时刻的采样帧数。

根据以上归一化及数值化处理方式，可以得到t时刻目标意图识别输入特征初始输入总特征I_t＝{U_t，V_t}。在此基础上，对其进行整合及统一编码，得到标准特征输入矩阵X_t，可以表示为

其中，元素

表示在t时刻的输入中，目标在第j帧的第i种特征值。N为目标意图识别输入特征总维度，本文中N＝12。M为每个时刻的采样帧数。

Step3.双向门控循环单元(BiGRU)设计

给定t时刻的输入X_t和上一时刻隐藏状态H_t-1，H_t-1在上一时刻求解得到(初始值H₀设为0，通过下面的公式9计算下一时刻隐藏状态)，经过激活函数 sigmoid函数的全连接层的计算，可以得到重置门R_t、更新门Z_t的输出：

R_t＝σ(X_tW_xr+H_t-1W_hr+b_r) (6)

Z_t＝σ(X_tW_xz+H_t-1W_hz+b_z) (7)

其中，W_xr、W_hr和W_xz、W_hz分别为第一、第二、第三、第四权重参数，b_r、b_z分别为第一、第二偏差参数。sigmoid函数是一种常用的激活函数，可以将元素的值变换到0和1之间，因此重置门和更新门中每个元素的值域都是[0，1]。σ为归一化系数。

t时刻的候选隐藏状态

和隐藏状态H_t的计算如下：

其中，W_xh和W_hh分别为第五、第六权重参数，b_h是第三偏差参数，·是按元素乘法。重置门R_t的功能是决定前一时刻隐藏状态需要重置的信息有多少，当R_t元素值接近0时，代表重置对应隐藏状态元素为0，即前一时刻的隐藏状态全部重置为当前时刻的输入；更新门Z_t的功能是决定前一时刻的信息是否被丢弃，其值越小，代表前一时刻隐藏节点所包含的信息被丢弃得越多。GRU网络模型复杂度较低的原因是忽略了某些没用的信息，而其中的重置门可以捕捉时间序列里短期的依赖关系，更新门则可以捕捉时间序列里长期的依赖关系。

在对意图识别模型进行训练过程中，会发现当前时刻不仅仅由之前的时刻序列决定，有时候也可能由后面时刻的序列决定。BiGRU由前向的GRU网络与后向的GRU网络组成，在GRU的基础上增加从后往前传递信息的隐藏层，从而解决上述问题。BiGRU的结构如图3所示。

BiGRU在时刻t的隐藏状态H_t由正向隐藏状态

和反向隐藏状态

两部分共同求得，正向隐藏状态

由当前时刻的输入X_t和前一时刻的正向隐藏状态

决定，反向隐藏状态

由当前时刻的输入X_t和后一时刻的反向隐藏状态

决定，

同样由前一及后一时刻确定，循环迭代，H₀初始化值设置为0。计算公式为

其中，W₁、W₂、W₃、W₄分别为单元之间的第一、第二、第三、第四权重，f为 GRU单元隐藏层状态计算方法，如公式(6)至(9)所示。BiGRU中通过连结正向隐藏状态

和反向隐藏状态

得到最终的隐藏状态H_t，计算公式为

其中，W₅和W₆分别为正向隐藏状态

和反向隐藏状态

的权重，b_t为t时刻隐藏层状态对应的偏置。

Step4.注意力机制设计

注意力机制通常被应用于语言翻译领域，可以用来学习词之间的依赖关系。在目标意图识别过程中，意图由具有时序关系的一系列行动和状态所表征，不同时刻的目标意图识别输入特征之间的联系可以提升目标意图识别效果，且每一时刻的特征输入对于最终意图识别的影响也是不同的。常规的门控循环神经网络输出仅仅考虑了GRU层在时刻t的输出H_t，而引入注意力机制后，神经网络最终输出取决于GRU层所有时刻的输出。注意力机制输入为经过BiGRU神经网络层输出的隐藏状态H_t，通过注意力机制可以对隐藏状态加权表征，以挖掘连续时刻特征输入间的关联关系，最终得到新的状态序列作为输出。

对于t时刻，注意力机制的计算公式为：

e_t＝v_ttanh(W_tH_t+b_t) (13)

其中，v_t和W_t分别为t时刻的第一和第二权重系数矩阵，b_t为t时刻相应的偏移量，e_t为隐藏层状态H_t在t时刻得到的能量值。a_t为每一时刻的影响权重，S_t为最终得到的各个时刻输出的加权和，即下一步全连接层的输入，T为总时间。

Step5.条件随机场(CRF)设计

将注意力层得到的各个时刻输出的加权和S_t输入到全连接层，可以通过 softmax函数(softmax函数为常用的归一化函数)直接将其转化为各种意图的概率，得到意图识别结果(上述步骤只是传统的归一化得到概率的方法，不再累述)。这种方法在针对简单分类问题时具有较好效果，但当需要输出的结果之间存在前后依赖关系时，该方法无法表征出前后识别结果之间的转化关系，只能独立地对各时间点进行分类，使识别结果准确性降低。

针对目标意图识别问题，随着战场中目标自身能力及战术战法的不断提升，同一目标在时间序列上的不同时刻可能具有不同战术意图。目标在前后时刻的战术意图之间存在依赖关系，即目标在当前时刻的战术意图一定程度上依赖于前一时刻的战术意图。如表1所示为基于推演统计得到的空中目标意图转移概率矩阵A，其中元素A_a，b＝P(Y_t＝b|Y_t-1＝a)表示时刻t-1的意图为a的情况下，时刻t的意图转变为b的概率，P表示转移概率。由表可知，各个意图转变到其他意图的概率并不是相等的。例如，当时刻t-1的意图为攻击时，在t时刻将有0.8921的概率仍然保持攻击意图，有0.0512的概率转变为掩护，且几乎不可能转变为干扰。因此，空中目标的战术意图之间是具有前后依赖性质的，即各个时刻的意图并非完全独立，而是依赖于前一个时刻的意图。

表1战术意图转移矩阵

若给定目标输入标准特征集序列X＝(X₁，X₂，...，X_t)，X₁，X₂，…，X_t分别为1到t时刻输入的特征向量，意图输出标签序列Y＝(Y₁，Y₂，...，Y_t)，Y₁，Y₂，...，Y_t分别为1到t时刻输出的意图标签，Y＝(Y₁，Y₂，...，Y_t)由条件随机场(CRF)输出，将每对X和Y的评估分数定义为F＝(X，Y)。F＝(X，Y)包含两部分：第一部分是每个时刻t，经过BiGRU 层、注意力层、全连接层输出的意图得分之和(注意力层输出的是S，注意力后面又接了全连接层，输出序列O)。将全连接层的输出序列O＝(O₁，O₂，...，O_t)看作分数矩阵，矩阵大小为t×l，其中l为战术意图数量(本发明l＝6，即共有六种目标战术意图)，O_i为i时刻6种意图分别的得分，i∈[1，t]，其反映的是第i个时刻属于各种战术意图的可能性，O_t，j表示第i个时刻第j个战术意图对应的得分， j∈[1，l]，O_i，j∈O_i，O_i∈O。第二部分是t时刻意图转移的得分之和。F＝(X，Y)的计算公式为

通过归一化所有标注序列，可以得到关于意图输出标签序列Y的概率分布，公式为

式中，Y(X)表示目标输入标准特征集序列X对应的所有可能的状态序列，Y′为Y 中的每一项，即Y′包含Y₁...Y_t。

在进行意图识别时，可以采用动态规划算法Viterbi(最大似然译码算法，由维特比于1967年提出)在新的输入标准特征集序列X＝(X₁，X₂，...，X_t)上找到总得分F＝(X，Y)最高的状态序列，即

其中Y＝{Y₁，Y₂，...，Y_t}，则时刻t的目标意图识别结果为Y_t(Y_t是t时刻输出的识别结果，每个时刻都会输出意图)。

具体实施例

数据标签由进攻方初始设定及空战领域专家后期修订得到。去除无法使用的数据，随机抽取20000个样本作为本实验的样本集，包括6种空中目标战术意图，各意图占比分别为攻击意图26.7％、侦察意图20.3％、监视意图17.4％、掩护意图18.1％、干扰意图9.6％、撤退意图7.9％。将样本集的80％作为训练样本集，20％作为测试样本集。每一个样本输入层需要输入的时间帧数由后续测试确定，输入的特征维度为12维特征。设置的采样点间隔为3s，优化器的学习率为0.001，一阶矩衰减系数和二阶矩衰减系数分别设置为0.9和0.999，代数、批大小和分别设置为100和256。

根据以上分析设计实验，基于BiGRU-Attention-CRF的空中目标意图识别模型的实验结果如图4及图5所示。

准确率曲线和损失值曲线可以看出，模型的收敛时间在30个代数左右，30 个代数之后的准确率与损失值无明显变化。模型训练完成后，训练集的准确率在97％左右，损失值在0.13左右；测试集的准确率在95％左右，最高为95.7％，损失值在0.15左右，最低为0.146。

由于集合中每一种意图标签下的样本数量不同，需要进一步分析每一种识别意图下的准确率。生成测试集的混淆矩阵，如图6所示，其中每一个色块代表相应条件下的样本数，对角线代表正确识别的样本。

由混淆矩阵可知，本发明提出的BiGRU-Attention-CRF模型对6种目标战术意图的识别精确率都较高。进一步分析可以发现，6种意图中撤退意图的精确率最高，可以达到98.1％，结合实际战场情况分析，这主要是因为具有撤退意图的目标的机动状态比较特殊，例如其距离、航路捷径将会不断增加。攻击意图与掩护意图之间的互认错误率较高，这是因为执行掩护意图的目标往往会采用佯攻等战术行为迷惑敌人，其在状态特征等方面与攻击类似，从而导致被误判为攻击意图。从指挥员认知的角度来讲，这种情况符合正常认知，识别精度有一定下降，但在可接受范围。

模型中引入的注意力机制(Attention)可以通过前馈神经网络的方法更新时间序列中每一个时刻点的权重，从而提高模型的正确识别率。为了验证注意力机制的有效性，将注意力层分配给时间序列不同时刻的权重进行可视化操作，如图7所示。其中，横轴上为10个时刻点，对应10帧，纵轴上为6种意图，色块颜色的深浅代表该意图下时间权重的分配结果。

由图可知，大部分意图对于稍近时刻的关注度较多，但并不总是对于最近时刻的关注度最高。从图中可以发现，攻击意图对于多个时刻前状态的关注度较高，这是因为攻击意图通常由一系列的机动动作体现，往往存在一个较为明显的攻击开始行为，例如一些飞机在进入攻击状态时会先爬高搜索目标，进而俯冲进行攻击，因此攻击意图会较多的关注多个时刻前的攻击开始行为。

除此之外，可以发现攻击意图与掩护意图的注意力矩阵关注点分布基本相同，这是因为进行掩护的飞行器往往会采用佯攻的战术，与攻击具有类似的行为动作，这一点也与上一节中对于混淆矩阵的分析相互印证。另外，侦察、监视、干扰三种意图对于时间序列的关注点分布较为均匀，这与三者均为长时间的持续行为动作有关。撤退意图对于时间序列的关注点以后半部分为主，与其远离、关机等行为动作有关。注意力机制的可视化结果符合战场实际，说明引入注意力机制既可以一定程度上提高意图识别模型的准确性，又可以使模型具有一定的可解释功能，效果较好。

采用其他文献中的意图识别方法，在本发明的同一数据集上进行对比实验。采用的方法有DBP、SVM、PCLSTM、LSTM-Attention、GRU-Attention。在采样帧数、意图空间等条件相同的情况下，对上述相关模型进行训练，计算其性能指标，对比实验结果如表2所示。

表2不同意图识别模型的比较

由结果可以发现，本发明提出的BiGRU-Attention-CRF模型识别准确率和损失值远远优于其他几种意图识别模型。BiGRU-Attention-CRF模型对空中目标意图识别的综合准确率、调和分数分别为95.7％和0.864，对比其他模型均有较大提升。通过计算测试集的交叉熵损失，本发明提出的模型对应的损失值明显低于对比模型，说明能够较好地识别出测试集中目标的战术意图。

对比发现，以LSTM或GRU网络为基础的识别模型作为由RNN改进得到的的时序特征网络模型可以捕捉到时序数据中的隐藏特征，较其它模型更加适用空中目标战术意图识别。对比LSTM-Attention和GRU-Attention模型的实验结果，可以发现二者的识别准确率、损失值和调和平均分数均相近，但是 LSTM-Attention识别单个样本的时间明显较长，这是因为LSTM与GRU的细胞单元结构不同，前者由遗忘门、输入们和输出门组成，后者由重置门和更新门组成，且GRU网络的参数要远小于LSTM网络。这也正是本发明选择使用BiGRU对时序信息进行处理的原因，因为在战场环境中，指挥信息系统进行意图识别的时间也是一个需要重点考虑的因素，在准确率近似的情况下，可以考虑采用处理时间较短的方法。

为了进一步验证BiGRU-Attention-CRF模型进行意图识别的效果，在同一数据集上进行消融实验。实验模型结构设置及实验结果如表3所示，模型的准确率和损失值的变化曲线如图8及图9所示。

表3消融实验结果

从表中可以看出，BiGRU-Attention-CRF的准确率、损失值和调和平均分数均是最优的。通过对双向网络层、Attention层和CRF层进行消融实验，三者对准确率的贡献分别为0.022，0.036和0.024，说明引入双向网络结构、注意力机制和CRF都能一定程度上提高战术意图识别性能。从消融实验准确率与损失值变化情况分析，五种模型随训练轮次的增加总体上准确率不断提高，损失值不断降低，其中BiGRU-Attention-CRF模型始终优于其余四种模型。加入双向网络结构后在最初训练不久后模型准确率和损失值就明显优于基础GRU模型，说明双向传播机制能有效提高训练效果，使神经网络模型在相同批量大小、学习率、训练轮次的情况下能更快的学习。由于测试集中每一种意图所包含的样本数目不相同，因此使用召回率和调和平均分数来体现5种模型对于每一种意图的识别准确度，结果如表4所示。

表4每种意图评价指标结果。I、II、III、IV、V分别表示上述5种模型，①、②、③、④、⑤、⑥分别表示攻击、侦察、监视、掩护、干扰、撤退6种意图。

分析上表可以发现，对于每一种意图均是BiGRU-Attention-CRF模型具有最高的召回率和调和平均分数。通过模型II和III的比较，可以发现在基于BiGRU 的模型中，仅引入Attention机制的作用要略大于仅引入CRF层的作用，而二者同时引入相结合，则可以使模型的识别效果更好。对比6种战术意图，一般情况下掩护意图的召回率和调和平均分数最低，这是因为掩护意图具有最多种类的机动及战术动作，目标在识别过程中可能会被误认为具有其他种类的意图。撤退意图的准确率和调和平均分数最高，是因为撤退意图的输入特征比较明显，模型可以较快较好的学习到其特点。

本发明提出一种基于双向门控循环单元和条件随机场的深度学习方法，以提高对于空中目标战术意图识别的准确性。首先，构建目标意图识别特征集和目标意图空间，并对其进行统一编码；其次，构建双向门控循环单元(BiGRU) 网络，引入注意力机制(Attention)，对输入信息的时序特征进行捕捉，并对网络各个时刻输出的编码信息进行有效利用；再次，采用条件随机场(CRF)对输出意图的前后依赖性进行建模，解决连续时刻意图的关联问题；最后，通过实验表明，相较于其他先进的意图识别方法，本发明提出的方法在空中意图识别中具有整体上的优势。

Claims

1.基于双向门控循环单元和条件随机场的意图识别方法，其特征在于，具体包括下列步骤：

Step1.目标意图空间编码

Step2.目标意图识别输入特征输入

其中，u′为初始输入数值，u为归一化后的结果，min为该维度下的最小值，max为该维度下的最大值，c为极小的常数；

其中，元素

表示在t时刻的输入中，目标在第j帧的第i种数值型特征状态值；m为目标的数值型特征总维度；M为每个时刻的采样帧数，采样帧数是可变的，在训练过程中通过测试得到最佳采样帧数；

其中，元素

其中，元素

Step3.双向门控循环单元BiGRU设计

R_t＝σ(X_tW_xr+H_t-1W_hr+b_r) (6)

Z_t＝σ(X_tW_xz+H_t-1W_hz+b_z) (7)

t时刻的候选隐藏状态

和隐藏状态H_t的计算如下：

BiGRU在时刻t的隐藏状态H_t由正向隐藏状态

和反向隐藏状态

两部分共同求得，正向隐藏状态

由当前时刻的输入X_t和前一时刻的正向隐藏状态

决定，反向隐藏状态

由当前时刻的输入X_t和后一时刻的反向隐藏状态

决定，

其中，W₁、W₂、W₃、W₄分别为单元之间的第一、第二、第三、第四权重，f为GRU单元隐藏层状态计算方法，如公式(6)至(9)所示；BiGRU中通过连结正向隐藏状态

和反向隐藏状态

得到最终的隐藏状态H_t，计算公式为

其中，W₅和W₆分别为正向隐藏状态

和反向隐藏状态

的权重，b_t为t时刻隐藏层状态对应的偏置；

Step4.注意力机制设计

对于t时刻，注意力机制的计算公式为：

e_t＝v_ttanh(W_tH_t+b_t) (13)

Step5.条件随机场CRF设计

若给定目标输入标准特征集序列X＝(X₁，X₂，...，X_t)，X₁，X₂，…，X_t分别为1到t时刻输入的特征向量，意图输出标签序列Y＝(Y₁，Y₂，...，Y_t)，Y₁，Y₂，...，Y_t分别为1到t时刻输出的意图标签，Y＝(Y₁，Y₂，...，Y_t)由条件随机场CRF输出，将每对X和Y的评估分数定义为F＝(X，Y)；F＝(X，Y)包含两部分：第一部分是每个时刻t，经过BiGRU层、注意力层、全连接层输出的意图得分之和；将全连接层的输出序列O＝(O₁，O₂，...，O_t)看作分数矩阵，矩阵大小为t×l，其中l为战术意图数量，O_i为i时刻6种意图分别的得分，i∈[1，t]，其反映的是第i个时刻属于各种战术意图的可能性，O_i，j表示第i个时刻第j个战术意图对应的得分，j∈[1，l]，O_i，j∈O_i，O_i∈O；第二部分是t时刻意图转移的得分之和；F＝(X，Y)的计算公式为

式中，Y(X)表示目标输入标准特征集序列X对应的所有可能的状态序列，Y′为Y中的每一项，即Y′包含Y₁...Y_t；

2.如权利要求1所述的基于双向门控循环单元和条件随机场的意图识别方法，其特征在于，在Step2中，选取的目标意图识别输入特征共有12维，分别是：高度、速度、加速度、航向角、方位角、距离、航路捷径、一维距离像、雷达反射截面积、空对空雷达状态、空对地雷达状态、电子干扰状态，其中前9种为数值型特征，后3种为非数值型特征。

3.如权利要求1所述的基于双向门控循环单元和条件随机场的意图识别方法，其特征在于，在Step2中，取c＝10^-5。

4.如权利要求1所述的基于双向门控循环单元和条件随机场的意图识别方法，其特征在于，在Step5中：在进行意图识别时，采用动态规划算法Viterbi在新的输入标准特征集序列X＝(X₁，X₂，...，X_t)上找到总得分F＝(X，Y)最高的状态序列。