CN116227952B - 一种关键信息缺失下的来袭目标防御策略选择方法及装置 - Google Patents
一种关键信息缺失下的来袭目标防御策略选择方法及装置 Download PDFInfo
- Publication number
- CN116227952B CN116227952B CN202310512754.4A CN202310512754A CN116227952B CN 116227952 B CN116227952 B CN 116227952B CN 202310512754 A CN202310512754 A CN 202310512754A CN 116227952 B CN116227952 B CN 116227952B
- Authority
- CN
- China
- Prior art keywords
- information
- time sequence
- time
- trend
- relation
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 47
- 230000007123 defense Effects 0.000 title claims abstract description 26
- 230000007812 deficiency Effects 0.000 title claims description 7
- 239000002245 particle Substances 0.000 claims abstract description 54
- 238000012512 characterization method Methods 0.000 claims description 22
- 238000000605 extraction Methods 0.000 claims description 20
- 238000012549 training Methods 0.000 claims description 19
- 230000015654 memory Effects 0.000 claims description 10
- 239000011159 matrix material Substances 0.000 claims description 9
- 238000005457 optimization Methods 0.000 claims description 9
- 230000006870 function Effects 0.000 claims description 8
- 230000003068 static effect Effects 0.000 claims description 8
- 239000008187 granular material Substances 0.000 claims description 7
- 238000010187 selection method Methods 0.000 claims description 5
- 238000012935 Averaging Methods 0.000 claims description 4
- 230000004913 activation Effects 0.000 claims description 4
- 238000010606 normalization Methods 0.000 claims description 4
- 238000011176 pooling Methods 0.000 claims description 4
- 230000011218 segmentation Effects 0.000 claims description 4
- 238000013528 artificial neural network Methods 0.000 claims description 3
- 125000004122 cyclic group Chemical group 0.000 claims description 3
- 238000002474 experimental method Methods 0.000 abstract description 6
- 238000012217 deletion Methods 0.000 description 7
- 230000037430 deletion Effects 0.000 description 7
- 238000004458 analytical method Methods 0.000 description 4
- 238000004088 simulation Methods 0.000 description 4
- 230000005855 radiation Effects 0.000 description 3
- 238000012360 testing method Methods 0.000 description 3
- 241000251729 Elasmobranchii Species 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 238000001914 filtration Methods 0.000 description 2
- 230000006872 improvement Effects 0.000 description 2
- 230000007787 long-term memory Effects 0.000 description 2
- 238000005065 mining Methods 0.000 description 2
- 210000002569 neuron Anatomy 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 230000000007 visual effect Effects 0.000 description 2
- 230000002159 abnormal effect Effects 0.000 description 1
- 230000003044 adaptive effect Effects 0.000 description 1
- 238000012076 audiometry Methods 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 210000004027 cell Anatomy 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000013145 classification model Methods 0.000 description 1
- 230000000052 comparative effect Effects 0.000 description 1
- 150000001875 compounds Chemical class 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000000354 decomposition reaction Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 230000002349 favourable effect Effects 0.000 description 1
- 238000005469 granulation Methods 0.000 description 1
- 230000003179 granulation Effects 0.000 description 1
- 238000012417 linear regression Methods 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000002688 persistence Effects 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 230000000630 rising effect Effects 0.000 description 1
- 238000012216 screening Methods 0.000 description 1
- 230000006403 short-term memory Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 230000002123 temporal effect Effects 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0637—Strategic management or analysis, e.g. setting a goal or target of an organisation; Planning actions based on goals; Analysis or evaluation of effectiveness of goals
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/049—Temporal neural networks, e.g. delay elements, oscillating neurons or pulsed inputs
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
- G06Q50/26—Government or public services
- G06Q50/265—Personal security, identity or safety
Landscapes
- Business, Economics & Management (AREA)
- Engineering & Computer Science (AREA)
- Human Resources & Organizations (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Strategic Management (AREA)
- Educational Administration (AREA)
- Economics (AREA)
- Tourism & Hospitality (AREA)
- General Physics & Mathematics (AREA)
- Entrepreneurship & Innovation (AREA)
- Marketing (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Development Economics (AREA)
- General Business, Economics & Management (AREA)
- Primary Health Care (AREA)
- Computational Linguistics (AREA)
- Quality & Reliability (AREA)
- Operations Research (AREA)
- Game Theory and Decision Science (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Computer Security & Cryptography (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Devices For Executing Special Programs (AREA)
Abstract
本发明提供了一种关键信息缺失下的来袭目标防御策略选择方法及装置,属于决策领域,通过将一个时间段的观测信息与经验相结合,使用高斯模糊信息粒的参数做出位置趋势预测,由预测出的趋势特征来进行来袭目标位置预测,规避关键信息缺失造成的策略选择不准确性;并构建关系卷积网络,提取观测信息的多变量时序关系特征,从而规避来袭目标在观测信息中的高噪声所造成的干扰和不确定性,有效解决高噪声数指信息带来的误差和错误,将趋势预测结果与关系特征进行拼接,通过联合推理得到分类结果。最后通过实验验证了本发明方法的有效性,其与人类策略选择的符合度高达93%,说明本发明的方法在决策精度上的有效性。
Description
技术领域
本发明属于决策领域,尤其是涉及一种关键信息缺失下的来袭目标防御策略选择方法及装置。
背景技术
潜艇选择防御鱼雷策略时,所获取的观测信息具有高噪声和关键信息缺失的问题。关键信息缺失包括由于被动声呐听测造成的目标位置非随机缺失,或者是目标属性不明等。一方面,传统策略选择方法以经验总结、规则推理为主,缺少对于经验知识和规则的模型描述;另一方面,战术决策时指挥员仅依赖于一个或少数几个信息来源,对多变量时序信息的挖掘利用并不充分,从而造成在决策时造成的决策失误。
发明内容
本发明所要解决的技术问题是怎样在关键信息缺失及多变量观测信息存在高噪声的情况下,使潜艇做出正确的策略选择,提出了一种关键信息缺失下的来袭目标防御策略选择方法及装置。
为解决上述技术问题,本发明所采用的技术方案是:
一种关键信息缺失下的来袭目标防御策略选择方法,包括以下步骤:
步骤1:获取潜艇在一个时间段对来袭目标的时序观测信息,所述时序观测信息在每个时间步节点上包含有来袭目标多个动态和静态属性特征;
步骤2:对所述时序观测信息进行多变量时序关系特征提取,同时基于该时序观测信息构建信息粒表征,并进行下一时间步的趋势特征预测;
步骤3:将提取的多变量时序关系特征与预测的趋势特征进行拼接,输入交替训练分类器得到基于时序观测信息的潜艇策略选择标签。
进一步地,步骤2中进行趋势特征预测的方法是:将时序观测信息通过划分论域的方式构建并优化高斯线性时序信息粒,分别对高斯线性时序信息粒的每个参数构建基于LSTM 的趋势预测模型,对高斯线性时序信息粒的每个参数预测下一时间步的趋势参数。
进一步地,将时序观测信息通过划分论域的方式构建高斯线性时序信息粒的具体方法是:
步骤2.1:将一个时间段的时序观测信息作为时间序列,划分为个子序列/>,;
步骤2.2:对每一个子序列使用高斯线性时序信息粒/>进行描述,则时序观测信息构成一个时间粒度模型/>,/>,/>分别表示线性趋势表征线的斜率和截距,/>表示数据观测点与线性趋势表征线的偏离程度,/>表示第/>个时序信息粒的时间长度;
步骤2.3:将高斯线性时序信息粒划分为等间隔信息粒;
步骤2.4:将等间隔信息粒的每个参数输入由LSTM层构成的趋势预测层,得到各参数下一个时间步的信息粒趋势特征预测。
进一步地,在步骤2.2中还包括:对高斯线性时序信息粒进行优化;优化的方法是:
对于时间粒度模型中的每个信息粒/>,计算时间粒度模型LG的趋势不匹配得分:
表示第/>个信息粒的起始时间,/>表示时序观测信息/>中的第/>个元素;
最小化趋势不匹配得分函数,使高斯线性时序信息粒得到优化。
进一步地,步骤2中多变量时序关系特征提取的方法是:
将所述时序观测信息序列化成时序特征矩阵,输入基于关系卷积的关系模型,得到多变量时序关系矩阵。
进一步地,所述基于关系卷积的关系模型包括面向关系特征提取的全卷积块和面向时序信息关系提取的LSTM块。
进一步地,所述全卷积块由三个叠加的时间卷积块组成,每个时间卷积块包括由一个全卷积层、一个批归一化层和一个ReLU激活函数层,在卷积计算时,时间的输出只与时间/>和前一层中更早的元素进行卷积,在最后一个卷积块后进行全局平均池化来减少模型中的参数数量。
进一步地,面向时序信息关系提取的LSTM块是循环神经网络结构,以LSTM为基本记忆单元。
进一步地,步骤3中的交替训练分类器包括一个全连接层和一个softmax层。
进一步地,等间隔信息粒的方法是:
步骤2.3.1:基于最大公约数准则求得高斯线性时序信息粒的最小分割粒度,即:,/>表示最小分割粒度;
步骤2.3.2:对 LG 优化后的子序列进行基于时间间隔的切分;计算拆分数量,则高斯线性时序信息粒参数转化为/>个三元组/>,/>,符号/>表示向上取整。
步骤2.3.3:将个三元组高斯线性时序信息粒作为 LSTM 趋势预测的输入样本参数/>,分别对每个参数进行下一个时间步长度的信息粒参数预测。本发明还提供了一种关键信息缺失下的来袭目标防御策略选择装置,包括以下模块:
输入模块:用于获取潜艇在一个时间段对来袭目标的时序观测信息,所述时序观测信息在每个时间步节点上包含有来袭目标多个动态和静态属性特征;
特征提取模块:用于对所述时序观测信息进行多变量时序关系特征提取,同时基于该时序观测信息构建信息粒表征,并进行下一时间步的趋势特征预测;
预测模块:用于将提取的关系特征与预测的趋势特征进行拼接,输入交替训练分类器得到基于时序观测信息的潜艇策略选择标签。
本发明提供的一种关键信息缺失下的来袭目标防御策略选择方法及装置,通过将一个时间段的观测信息划分成多个时间步构成的子序列,进而将各子序列使用信息粒进行描述,使用高斯模糊信息粒的参数做出位置趋势预测,由预测出的趋势特征来表征来袭目标位置趋势,规避关键信息缺失造成的防御策略选择不准确性;并构建关系卷积网络,提取观测信息的多变量时序关系特征,由于提取来袭目标在一段时间内各时间点上的多个属性即从不同角度提取来袭目标的多维特征,通过提取多维特征之间的相互关系降低来袭目标在观测信息中的高噪声所造成的干扰和不确定性,有效解决高噪声数值信息带来的误差和错误,将趋势预测结果与关系特征进行拼接,通过预测层得到防御策略分类结果。最后通过实验验证了本发明方法的有效性,其与人类策略选择的符合度高达93%,说明本发明的方法在决策精度上的有效性。
附图说明
图1为本发明系统流程图;
图2为本发明网络模型结构。
具体实施方式
下面将结合附图对本发明的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
图1和图2示出了本发明一种关键信息缺失下的来袭目标防御策略选择方法,包括以下步骤:
步骤1:获取潜艇在一个时间段对来袭目标的时序观测信息,所述时序观测信息在每个时间步节点上包含有来袭目标多个动态和静态属性特征。本实施例中,通过对来袭目标多角度的观测,如速度、方位、转向半径等动态属性以及来袭目标长度、宽度等静态属性,通过对一个时间段上时序观测信息的分析,来综合多种因素构成的特征关系,实现更全面的防御策略选择。
步骤2:对所述时序观测信息进行多变量时序关系特征提取,同时基于该时序观测信息构建信息粒表征,并进行下一时间步的趋势特征预测。
如图2所示,本实施例中的网络模型总体架构包括关系提取模块、趋势表征模块和联合决策推理模块三个部分,多变量时序关系特征提取的方法使用图2中的关系提取模块,将所述时序观测信息序列化成时序特征矩阵,输入基于关系卷积的关系模型,得到多变量时序之间的特征关系和时序信息。所述基于关系卷积的关系模型包括面向关系特征提取的全卷积块和面向时序信息关系提取的长短期记忆层LSTM(long-shortterm memory)。所述全卷积块由三个叠加的时间卷积块组成,每个时间卷积块包括由一个全卷积层、一个批归一化和一个 ReLU激活函数,在卷积计算时,时间的输出只与时间/>和前一层中更早的元素进行卷积,在最后一个卷积块后进行全局平均池化来减少模型中的参数数量。面向时序信息关系提取的 LSTM 块是循环神经网络结构,以LSTM 为基本记忆单元。
本实施例中,为了充分描述高动态特征变量的趋势关系,使用图2的趋势表征模块,提高模型决策时对目标趋势发展的把握,在高噪声和缺失数据条件下构建高斯线性时序信息粒,如图2所示,趋势表征包括四个步骤: 首先,获取原始时间序列,然后,构建高斯线性信息粒,采用高斯线性模糊信息粒GLIG(GuassianLinear Fuzzy InformationGranular) 来描述时间序列的粒度区间,表征大致的时序趋势,并对数据进行去噪和异常处理。并结合一个粒度评价指标来衡量粒度模型的有效性。其次,优化高斯线性信息粒,采用面向趋势的模糊时序论域粒度优化方法,对粒度划分进行进一步优化,提高粒度模型对于趋势描述的精确度。为了便于与关系特征进行交替训练,再对优化后的粒度模型进行等间隔切分,形成等间隔时序信息粒。最后,基于粒化长短期记忆层的趋势预测,将等间隔信息粒的三个参数分别作为三个长短期记忆层的输入,利用长短期记忆层LSTM来分别预测下一个间隔T的时序信息粒趋势表征。
时序信息可以描述一个时间窗内,观测变量的线性趋势,通过对于历史时序观测信息的趋势描述,当不存在外部变量的情况下,这个趋势理论上也反映了未来的趋势变化。这种趋势变化难以用传统的粒度模型进行表征,本申请采用线性模糊信息粒LFIG(LinearFuzzy Information Granule) 的思想,首先给出关于高斯线性模糊信息粒 GLIG 的定义:
定义:一个高斯线性时序信息粒(GLIG) 可以用参数组
描述,有:
对于输入,在给定时间/>中,属于GLIG 的值/>的隶属度函数/>为一个服从均值/>随时间变化,方差为/>的正态分布,其中/>为高斯线性时序信息粒随时间变化的均值中心线,/>分别表示高斯线性时序信息粒均值中心线的斜率和截距,斜率/>反映了线性信息粒内随时间变化的趋势,如上升或下降的趋势,截距反映了线性信息粒内随时间变化的趋势初始水平,/>则描述了线性信息粒内数据观测点与均值中心线的偏离程度,/>表示线性信息粒的时间长度,反映了线性信息粒内随时间变化趋势的持续性。在构建高斯线性时序信息粒GLIG时,本实施例采用/>这四个参数描述一个线性信息粒。
用线性模糊信息粒GLIGs能够建模经验和观测时序相结合的不确定性,对于给定的时间窗,通常采用线性回归建立线性图,有助于更容易、更透明地解释时间窗口中的数据。将观测时间序列分解为一个线性趋势估计序列/>和一个残差序列/>,衡量趋势滤波有效性的两个基本条件是:a) 残差尽量小;b)趋势分量尽可能平滑。即最小化目标函数:/>,其中,, 对于多变量时序输入,上式可以写成矩阵形式为:/>,上式中的/>和/>分别代表/>范式和/>范式,其中/>为二阶差分矩阵,对于λ的选择,首先,计算参数最大可能值/>,该值是无法通过遍历法确定的,因此,。时间序列的趋势越明显,/>越大,从而捕捉到平滑的趋势。考虑到预测精度更多地依赖于细节的提取,因此/>的值相对较小,以求得时间序列的局部变化。
基于上述原则,本实施例中进行趋势特征预测的方法是:步骤2.1:将一个时间段的时序观测信息作为时间序列,划分为个子序列/>,/>。
本实施例中,针对时间序列, 采用L−1 趋势滤波,提取/>个关键点,即, 根据得到的关键点,将时间序列/>划分为/>个子序列,分别为:
其中第个子序列/>的时间跨度为/>。
步骤2.2:对每一个子序列使用高斯线性时序信息粒/>进行描述,则时序观测信息构成一个时间粒度模型/>,/>,/>分别表示线性趋势表征线的斜率和截距,/>表示数据观测点与线性趋势表征线的偏离程度,/>表示第/>个时序信息粒的时间长度。因为是提取的/>个关键点对观测时序/>进行的切割,所以不同的颗粒有不同的时间跨度,时间粒度模型/>是一个不等长的时间粒度模型。
本实施例中,还需对对高斯线性时序信息粒进行优化;优化的方法是:
对于时间粒度模型中的每个信息粒/>,计算时间粒度模型LG的趋势不匹配得分:
表示第/>个信息粒的起始时间,/>表示时序观测信息/>中的第/>个元素;
最小化趋势不匹配得分函数,使高斯线性时序信息粒得到优化。
因为对于每个粒度时序,通过来描述高斯线性时序信息粒随时间变化的均值中心线,所以,/>的值偏离均值中心线越远,则粒度时间子序列就越不可能精确拟合时间序列的变化模式,/>用于描述距离均值中心线的偏离程度,当/>值越大,说明该时序粒度越不能明显捕捉到详细的趋势。通过最小化/>函数,可以提高粒度时间序列对于趋势反应的准确度。
步骤2.3:将高斯线性时序信息粒划分为等间隔信息粒。本实施例中,通过对高斯线性时序信息粒的优化,可以确保每个信息粒能够最大程度的反应变量的趋势,剔除异常点;然而,每个粒度变长度会导致无法构建统一的纵横交替框架,因此,再对进行优化后的时序信息粒进行分割,按照等间隔窗口原则,确保高斯线性时序信息粒描述的信息具有相同的间隔,可以为多变量关系提取特征提供统一间隔的趋势分析;则将高斯线性时序信息粒进行进一步划分的方法为等间隔信息粒,每个粒度变长度会导致无法构建统一的纵横交替框架,因此对对进行优化后的时序信息粒进行分割,按照等间隔窗口原则,确保高斯线性信息粒描述的信息/>具有相同的间隔,可以为纵向关系提取特征提供统一间隔的趋势分析。
本实施例中,等间隔信息粒的方法是:
步骤2.3.1:基于最大公约数准则求得高斯线性时序信息粒的最小分割粒度,即:,/>表示最小分割粒度;
步骤2.3.2:对LG优化后的子序列进行基于时间间隔的切分;计算拆分数量,则高斯线性时序信息粒参数转化为/>个三元组/>,/>,符号/>表示向上取整。
对一个子信息粒LG i ,其在等间隔前对应的参数为,/>,则等间隔划分后因为/>都相等,参数转化为/>个三元组/>,/>。
步骤2.3.3:将个三元组高斯线性时序信息粒/>中的三个参数作为LSTM趋势预测的输入样本参数,分别对每个参数进行下一个时间步长度的信息粒参数预测。
本实施例中,LSTM 层的每个细胞单元,都是以前一时刻的隐层状态 H、输出和当前时刻的带权重输入/>一起作为下一个状态的输入,如图2所示。一方面,通过共享参数机制持续记忆和运用前序时间数据,另一方面,基于自适应窗口的数据填充输入作为当前/>时刻的输入,目标是持续预测当前时刻的输出分类值,每次输入的时间序列窗口长度记为L。将观测时序信息/>经过由长短期记忆LSTM 层构成的趋势预测层,得到下一个时间步长度为/>的趋势表征三元组/>,作为趋势模型对于未来/>时刻的趋势表征。
本实施例中,关系特征提取的方法是:
将所述时序观测信息序列化成时序特征矩阵,输入基于关系卷积的关系模型,得到多变量时序之间的特征关系和时序信息。所述基于关系卷积的关系模型包括括面向关系特征提取的全卷积块和面向时序信息关系提取的 LSTM 块。
由于指挥员在紧急情况下很难全面考虑多观测信息的相互关系,由1-D 时间全卷积网络和 LSTM 时序网络构成的趋势表征网络,目的是挖掘观测多变量时序之间的特征关系和时序信息。
所述全卷积块由三个叠加的时间卷积块组成,每个时间卷积块包括由一个全卷积层、一个批归一化层(动量为 0.99,为0.001)和一个ReLU激活函数,在卷积计算时,时间/>的输出只与时间/>和前一层中更早的元素进行卷积,在最后一个卷积块后进行全局平均池化来减少模型中的参数数量。时间卷积已被证明是时间序列分类问题的一种有效学习模型,通常被用作特征提取器。时间卷积网络的输入是多变量时间序列,设/>,代表输入是一个时间步长为/>,每个时刻输入/>个特征的输入特征向量,每个时刻的输出标签其中/>代表分类的量。
步骤3:如图2的下半部分联合决策推理模块所示,将提取的关系特征与预测的趋势特征进行拼接,输入交替训练分类器得到基于时序观测信息的潜艇策略选择标签。本实施例中的交替训练分类器包括一个全连接层和一个softmax层。本实施例将智能决策问题变成一个多分类问题,损失函数的交叉熵函数可以写为:
交替训练模型将同时对信息粒的3个趋势参数预测对应的 LSTM层和关系全卷积网络进行参数更新和训练。
实验验证
基于水下防御鱼雷策略数据集展开完全信息和红方视角信息条件下的分类性能分析和应用性分析。首先分析了水下防御策略数据集的实体特征、策略标签分布和红方视角样本的不完全信息水平。对于完全信息和距离缺失、极端缺失两种不完全信息,以及不同时间步长的防御策略选择,分别设定四种对比算法,综合分析所提模型的分类性能、不完全信息抗干扰能力。
完全信息样本与不完全信息样本共用指挥员在完全信息条件下的高质量决策标签。针对潜艇防御鱼雷数据样本,筛选得到7种防御策略,如转向机动、使用声诱饵、干扰器和多枚声诱饵、干扰器的组合策略等。样本处理时将收集到的防御复盘数据裁剪为固定长度,以鱼雷报警为起点,推进240个离散仿真步,对所有抗实体 (潜艇、鱼雷、声诱饵、干扰器) 进行记录。其中,仿真系统内的推演仿真步长为1s,240个离散时间步记录时长为4分钟的推演对抗过程。选择了2个实体,每个实体选择10个最具代表性的特征,如表1所示。
表1 实体特征描述
实验中的不完全信息样本,来源于仿真系统通过模拟海洋环境、潜艇和鱼雷辐射噪声、声传播损失等,得到的红方视角(潜艇视角)下的不完全信息样本。噪声样本,观测噪声来自很多影响因素,不同雷型的辐射噪声、不同潜艇的辐射噪声、不同海洋区域的传播损失、目标反射强度、干扰声级和海洋混响等,都会对潜艇防御决策的信息依据产生影响。本实验中,红方视角样本集与完全信息样本集的特征一一对比,样本数据近似服从的正态分布。信息缺失样本,在红方视角,由于被动声呐测距导致目标距离/>存在缺失,已知目标的位置坐标/>计算方法为:
代表潜艇观测鱼雷的方位角。由于距离/>特征不存在导致鱼雷的位置坐标缺失,红方视角样本数据相比于完全信息数据平均缺失率为 20.6%,通过掩码向量标记缺失位。
实验条件:
基于高斯线性分布的粒化长短期记忆与全卷积联合推理模型GLFCU(GuassianLinearDistribution–basedGranulation–LSTM and Fully Convolution Union Model)模型是本发明所提的策略选择模型,首先基于高斯线性分布实现了对位置经验信息的信息粒构建与优化,再通过粒度 LSTM 预测参数,并与全卷积联合推理模型 FCU(FullyConvolution Union Model)融合推理分类结果。其中粒化LSTM的隐层个数为 64,关系卷积网络层中神经元个数分别是16,64,16。样本集中,潜艇和鱼雷对抗实体的24078条时序样本按照70%,30% 划分训练集和测试集。
长短期记忆模型LSTM作为对比模型,是经典的时间序列分类模型,其输入特征不包含经验信息粒,该模型采用1个LSTM层,隐层个数为64。
全卷积网络FCN(FullyConvolution Network)模型作为对比模型,是经典的像素级关系提取模型,其输入特征不包含经验信息粒,该模型神经元分别是16,64,16。
八重卷积OctConv(OctaveConvolution)模型作为对比模型,是处理多变量关系的模型,该模型设置其滤波器(filter)的大小分别为16 和 16-64-16,核尺寸为3和7-5-3。
通过训练集对模型的训练,所提模型GLFCU在决策精确度优于对比现有模型,且训练趋势上反映了其收敛速度上具有优势。在完全信息条件下,机器学习的三个模型长短期记忆模型 LSTM、全卷积网络FCN 和八重卷积模型 OctConv 的分类精度与所提模型仅相差4%–8%,而在关键信息缺失条件下,本申请所提GLFCU模型在完全信息和距离缺失条件下,分类精度几乎不变,且训练趋势也较为稳定。这也再次说明即使是构造简单的信息粒,其表达也能够帮助模型对抗非随机缺失的情况。通过对训练收敛性的对比发现,GLFCU模型依然快速稳定收敛;而三个机器学习的模型在位置信息缺失的情况下,其决策的收敛变慢。这也从实验上印证了将经验知识引入防御策略选择,可以有效缓解由于非完全信息缺失导致的问题分布改变,从而提高策略选择的稳定性。
在一些极端场景,潜艇发现鱼雷时不光无法判断目标的位置,还面临着未知类型装备(即鱼雷属性特征不完全)。但是依然需要潜艇快速选择防御策略,为规避潜艇争取战机。为了验证目标距离、类型、速度、航向、坐标、装备参数这些特征全部无法获知条件下,所提模型选择防御策略的极限能力,在这种极端条件下,所提模型的决策能力有了整体上的下降,在训练集和测试集上只达到了70% 和 68%,相比于仅距离存在缺失的红方视角样本,决策精度分别下降了24%和26%。这也印证了为什么战场上有云,知己知彼方可百战百胜,不掌握来袭鱼雷的性能属性等情况,会对防御策略选择的精确性和稳定性造成较大影响。
本发明将经验表征与关系特征联合推理,有助于模型学习到稳定的策略知识结构,提高策略选择的精确性和稳定性。本发明所提模型GLFCU能够有效应对距离信息缺失条件下的分类问题,且在红方视角(距离缺失)样本可以得到与完全信息条件下几乎一样的分类性能。说明本发明通过合理的经验表征,弥补了距离信息缺失带来的不确定性。
实验表明在完全信息条件下,所提模型可以起到8%–10% 的决策精度提升。在距离信息缺失条件下,所提模型可以达到 17%–20%的决策精度提升,且仍能够在测试集上达到94% 的决策精度,说明所提模型能够很好地通过位置趋势预测提高决策精度。而在极端信息缺失条件下,由于目标不明、解要素不明会极大影响决策精确度,所提模型能够达到 68%的决策精度,但是仍能够达到 17%–24% 的决策精度提升。
最后应说明的是:以上各实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述各实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的范围。
Claims (5)
1.一种关键信息缺失下的来袭目标防御策略选择方法,所述关键信息缺失包括由于被动声呐听测造成的目标位置非随机缺失,或者是目标属性不明造成的信息缺失,其特征在于,包括以下步骤:
步骤1:获取潜艇在一个时间段对来袭目标的时序观测信息,所述时序观测信息在每个时间步节点上包含有来袭目标多个动态和静态属性特征,所述动态属性包括速度、方位,所述静态属性包括来袭目标的转向半径、长度、宽度;
步骤2:对所述时序观测信息进行多变量时序关系特征提取,同时基于该时序观测信息构建信息粒表征,并进行下一时间步的趋势特征预测;
步骤3:将提取的多变量时序关系特征与预测的趋势特征进行拼接为一个特征向量,输入交替训练分类器得到基于时序观测信息的标签,所述标签作为选择的潜艇决策策略,所述交替训练分类器包括一个全连接层和一个softmax层;
步骤2中进行趋势特征预测的方法是:将时序观测信息通过划分论域的方式构建并优化高斯线性时序信息粒,分别对高斯线性时序信息粒的每个参数构建基于 LSTM 的趋势预测模型,对高斯线性时序信息粒的每个参数预测下一时间步的趋势参数;
步骤2中多变量时序关系特征提取的方法是:
将所述时序观测信息序列化成时序特征矩阵,输入基于关系卷积的关系模型,得到多变量时序关系矩阵;所述基于关系卷积的关系模型包括面向关系特征提取的全卷积块和面向时序信息关系提取的LSTM块;
将时序观测信息通过划分论域的方式构建并优化高斯线性时序信息粒的具体方法是:
步骤2.1:将一个时间段的时序观测信息作为时间序列,划分为m个子序列,;
步骤2.2:对每一个子序列使用高斯线性时序信息粒/>进行描述,则时序观测信息构成一个时间粒度模型/>,/>,/>分别表示线性趋势表征线的斜率和截距,/>表示数据观测点与线性趋势表征线的偏离程度,/>表示第/>个时序信息粒的时间长度;
步骤2.3:将高斯线性时序信息粒划分为等间隔信息粒;
步骤2.4:将等间隔信息粒的每个参数输入由LSTM层构成的趋势预测层,得到各参数下一个时间步的信息粒趋势特征预测;
在步骤2.2中还包括:对高斯线性时序信息粒进行优化;优化的方法是:
对于时间粒度模型中的每个信息粒/>,
记算时间粒度模型LG的趋势不匹配得分:
表示第/>个信息粒的起始时间,/>表示时序观测信息/>中的第/>个元素;
最小化趋势不匹配得分函数,使高斯线性时序信息粒得到优化。
2.根据权利要求1所述的一种关键信息缺失下的来袭目标防御策略选择方法,其特征在于,所述全卷积块由三个叠加的时间卷积块组成,每个时间卷积块包括由一个全卷积层、一个批归一化层和一个ReLU激活函数层,在卷积计算时,时间的输出只与时间/>和前一层中更早的元素进行卷积,在最后一个卷积块后进行全局平均池化来减少模型中的参数数量。
3.根据权利要求2所述的一种关键信息缺失下的来袭目标防御策略选择方法,其特征在于,面向时序信息关系提取的LSTM块是循环神经网络结构,以LSTM为基本记忆单元。
4.根据权利要求1所述的一种关键信息缺失下的来袭目标防御策略选择方法,其特征在于,等间隔信息粒的方法是:
步骤2.3.1:基于最大公约数准则求得高斯线性时序信息粒的最小分割粒度,即:,/>表示最小分割粒度;
步骤2.3.2:对 LG 优化后的子序列进行基于时间间隔的切分;计算拆分数量,则高斯线性时序信息粒参数转化为/>个三元组/>,/>,符号/>表示向上取整;
步骤2.3.3:将个三元组高斯线性时序信息粒作为 LSTM 趋势预测的输入样本参数,分别对每个参数进行下一个时间步长度的信息粒参数预测。
5.一种关键信息缺失下的来袭目标防御策略选择装置,所述关键信息缺失包括由于被动声呐听测造成的目标位置非随机缺失,或者是目标属性不明造成的信息缺失,其特征在于,包括以下模块:
输入模块:用于获取潜艇在一个时间段对来袭目标的时序观测信息,所述时序观测信息在每个时间步节点上包含有来袭目标多个动态和静态属性特征,所述动态属性包括速度、方位,所述静态属性包括来袭目标的转向半径、长度、宽度;
特征提取模块:用于对所述时序观测信息进行多变量时序关系特征提取,同时基于该时序观测信息构建信息粒表征,并进行下一时间步的趋势特征预测;
预测模块:用于将提取的关系特征与预测的趋势特征进行拼接成一个特征向量,输入交替训练分类器得到基于时序观测信息的标签,所述标签作为选择的潜艇决策策略,所述交替训练分类器包括一个全连接层和一个softmax层;
特征提取模块中进行趋势特征预测的方法是:将时序观测信息通过划分论域的方式构建并优化高斯线性时序信息粒,分别对高斯线性时序信息粒的每个参数构建基于 LSTM 的趋势预测模型,对高斯线性时序信息粒的每个参数预测下一时间步的趋势参数;
特征提取模块中多变量时序关系特征提取的方法是:
将所述时序观测信息序列化成时序特征矩阵,输入基于关系卷积的关系模型,得到多变量时序关系矩阵,所述基于关系卷积的关系模型包括面向关系特征提取的全卷积块和面向时序信息关系提取的LSTM块;
将时序观测信息通过划分论域的方式构建并优化高斯线性时序信息粒的具体方法是的具体方法是:
将一个时间段的时序观测信息作为时间序列,划分为m个子序列,/>;
对每一个子序列使用高斯线性时序信息粒/>进行描述,则时序观测信息构成一个时间粒度模型/>,/>,/>分别表示线性趋势表征线的斜率和截距,/>表示数据观测点与线性趋势表征线的偏离程度,/>表示第/>个时序信息粒的时间长度;
将高斯线性时序信息粒划分为等间隔信息粒;
将等间隔信息粒的每个参数输入由LSTM层构成的趋势预测层,得到各参数下一个时间步的信息粒趋势特征预测;
对高斯线性时序信息粒进行优化,优化的方法是:
对于时间粒度模型中的每个信息粒/>,
记算时间粒度模型LG的趋势不匹配得分:
表示第/>个信息粒的起始时间,/>表示时序观测信息/>中的第/>个元素;
最小化趋势不匹配得分函数,使高斯线性时序信息粒得到优化。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310512754.4A CN116227952B (zh) | 2023-05-09 | 2023-05-09 | 一种关键信息缺失下的来袭目标防御策略选择方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310512754.4A CN116227952B (zh) | 2023-05-09 | 2023-05-09 | 一种关键信息缺失下的来袭目标防御策略选择方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN116227952A CN116227952A (zh) | 2023-06-06 |
CN116227952B true CN116227952B (zh) | 2023-07-25 |
Family
ID=86569943
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310512754.4A Active CN116227952B (zh) | 2023-05-09 | 2023-05-09 | 一种关键信息缺失下的来袭目标防御策略选择方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116227952B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117473242B (zh) * | 2023-12-28 | 2024-03-19 | 成都四方伟业软件股份有限公司 | 一种时序数据故障检测方法、系统、设备及介质 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113221450A (zh) * | 2021-04-27 | 2021-08-06 | 中国科学院国家空间科学中心 | 一种针对稀疏不均匀时序数据的航位预测方法及系统 |
CN113743509A (zh) * | 2021-09-07 | 2021-12-03 | 中国人民解放军国防科技大学 | 一种基于不完全信息的在线作战意图识别方法及装置 |
CN115480582A (zh) * | 2022-08-17 | 2022-12-16 | 西安电子科技大学 | 基于lstm的目标的机动预测方法、电子设备和存储介质 |
Family Cites Families (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4185059B2 (ja) * | 2005-02-18 | 2008-11-19 | 大日本印刷株式会社 | トレンド予測装置およびトレンド予測方法 |
US8311874B2 (en) * | 2005-03-31 | 2012-11-13 | Oracle Financial Services Software Limited | Systems and methods for customer relationship evaluation and resource allocation |
CN112651178A (zh) * | 2020-12-30 | 2021-04-13 | 中国计量大学 | 一种基于无规则缺失数据融合模型的丁烷含量预测方法 |
CN115033615A (zh) * | 2022-05-18 | 2022-09-09 | 山东中烟工业有限责任公司 | 一种基于时序数据的烟草设备故障预测系统及预测方法 |
CN115327503A (zh) * | 2022-06-29 | 2022-11-11 | 深圳大学 | 基于高斯粒子滤波的固定单站无源定位方法和相关装置 |
CN115310702A (zh) * | 2022-08-10 | 2022-11-08 | 深圳达实智能股份有限公司 | 一种传感器关键信息缺失情形下的冷负荷预测方法及系统 |
CN115456090A (zh) * | 2022-09-20 | 2022-12-09 | 沈阳飞机设计研究所扬州协同创新研究院有限公司 | 一种基于知识推理机的战斗机多层次复合意图预测方法 |
-
2023
- 2023-05-09 CN CN202310512754.4A patent/CN116227952B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113221450A (zh) * | 2021-04-27 | 2021-08-06 | 中国科学院国家空间科学中心 | 一种针对稀疏不均匀时序数据的航位预测方法及系统 |
CN113743509A (zh) * | 2021-09-07 | 2021-12-03 | 中国人民解放军国防科技大学 | 一种基于不完全信息的在线作战意图识别方法及装置 |
CN115480582A (zh) * | 2022-08-17 | 2022-12-16 | 西安电子科技大学 | 基于lstm的目标的机动预测方法、电子设备和存储介质 |
Non-Patent Citations (2)
Title |
---|
基于不确定时间序列的来袭目标解算方法;杨静等;《系统仿真学报》;第2页第1段至第13页第1栏第1段 * |
基于交替循环神经网络的水下防御态势预测方法;杨静等;《计算机工程》;第2页第1段至第12页第1栏第1段 * |
Also Published As
Publication number | Publication date |
---|---|
CN116227952A (zh) | 2023-06-06 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Zhu et al. | Deep and confident prediction for time series at uber | |
CN111222549B (zh) | 一种基于深度神经网络的无人机故障预测方法 | |
Nikiforov et al. | Neural network method as means of processing experimental data on grain crop yields | |
CN116227952B (zh) | 一种关键信息缺失下的来袭目标防御策略选择方法及装置 | |
CN110708318A (zh) | 基于改进的径向基神经网络算法的网络异常流量预测方法 | |
Sabzevari et al. | A comparison between statistical and data mining methods for credit scoring in case of limited available data | |
Putra et al. | Estimation of parameters in the SIR epidemic model using particle swarm optimization | |
CN110880031A (zh) | 基于融合随机黑洞策略的灰狼优化算法的特征选择方法 | |
CN118214502B (zh) | 一种数字广播信号质量实时监控方法及系统 | |
Hafiz et al. | Structure selection of polynomial NARX models using two dimensional (2D) particle swarms | |
Dash et al. | A comparative study of radial basis function network with different basis functions for stock trend prediction | |
CN113259379A (zh) | 基于增量学习的异常告警识别方法、装置、服务器和存储介质 | |
CN114578087B (zh) | 基于非支配排序和随机模拟算法的风速不确定性度量方法 | |
CN116739135A (zh) | 一种模拟成焦机理的焦炭质量串行预测方法及装置 | |
Kanumalli et al. | A scalable network intrusion detection system using bi-lstm and cnn | |
Viswambari et al. | Data mining techniques to predict weather: a survey | |
US11557372B2 (en) | Prediction device, gene estimation device, prediction method, and non-transitory recording medium | |
CN113762078A (zh) | 基于vmd-cssa-lstm-mlr组合模型的湖泊tn预测方法 | |
CN115907178B (zh) | 一种净生态系统co2交换量的预测方法 | |
CN115145903A (zh) | 一种基于生产过程的数据插补方法 | |
Yuan et al. | Prediction of fishing ground based on RBF neural network | |
Lazebnik et al. | SubStrat: A Subset-Based Strategy for Faster AutoML | |
Mondal et al. | Multivariate Time Series Forecasting to Forecast Weight Dynamics | |
Ma et al. | Intelligent cybersecurity situational awareness model based on deep neural network | |
CN113162914B (zh) | 一种基于Taylor神经网络的入侵检测方法及系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |