CN116227952A - 一种关键信息缺失下的来袭目标防御策略选择方法及装置 - Google Patents

一种关键信息缺失下的来袭目标防御策略选择方法及装置 Download PDF

Info

Publication number
CN116227952A
CN116227952A CN202310512754.4A CN202310512754A CN116227952A CN 116227952 A CN116227952 A CN 116227952A CN 202310512754 A CN202310512754 A CN 202310512754A CN 116227952 A CN116227952 A CN 116227952A
Authority
CN
China
Prior art keywords
information
time sequence
time
trend
attack target
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202310512754.4A
Other languages
English (en)
Other versions
CN116227952B (zh
Inventor
杨静
陆铭华
吴金平
周佳玉
周航程
张会
崔轶群
田立业
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
PLA Navy Submarine College
Original Assignee
PLA Navy Submarine College
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by PLA Navy Submarine College filed Critical PLA Navy Submarine College
Priority to CN202310512754.4A priority Critical patent/CN116227952B/zh
Publication of CN116227952A publication Critical patent/CN116227952A/zh
Application granted granted Critical
Publication of CN116227952B publication Critical patent/CN116227952B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0637Strategic management or analysis, e.g. setting a goal or target of an organisation; Planning actions based on goals; Analysis or evaluation of effectiveness of goals
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/049Temporal neural networks, e.g. delay elements, oscillating neurons or pulsed inputs
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • G06Q50/26Government or public services
    • G06Q50/265Personal security, identity or safety

Landscapes

  • Business, Economics & Management (AREA)
  • Engineering & Computer Science (AREA)
  • Human Resources & Organizations (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Strategic Management (AREA)
  • Educational Administration (AREA)
  • Economics (AREA)
  • Tourism & Hospitality (AREA)
  • General Physics & Mathematics (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Marketing (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Development Economics (AREA)
  • General Business, Economics & Management (AREA)
  • Primary Health Care (AREA)
  • Computational Linguistics (AREA)
  • Quality & Reliability (AREA)
  • Operations Research (AREA)
  • Game Theory and Decision Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Computer Security & Cryptography (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Devices For Executing Special Programs (AREA)

Abstract

本发明提供了一种关键信息缺失下的来袭目标防御策略选择方法及装置,属于决策领域,通过将一个时间段的观测信息与经验相结合,使用高斯模糊信息粒的参数做出位置趋势预测,由预测出的趋势特征来进行来袭目标位置预测,规避关键信息缺失造成的策略选择不准确性;并构建关系卷积网络,提取观测信息的多变量时序关系特征,从而规避来袭目标在观测信息中的高噪声所造成的干扰和不确定性,有效解决高噪声数指信息带来的误差和错误,将趋势预测结果与关系特征进行拼接,通过联合推理得到分类结果。最后通过实验验证了本发明方法的有效性,其与人类策略选择的符合度高达93%,说明本发明的方法在决策精度上的有效性。

Description

一种关键信息缺失下的来袭目标防御策略选择方法及装置
技术领域
本发明属于决策领域,尤其是涉及一种关键信息缺失下的来袭目标防御策略选择方法及装置。
背景技术
潜艇选择防御鱼雷策略时,所获取的观测信息具有高噪声和关键信息缺失的问题。关键信息缺失包括由于被动声呐听测造成的目标位置非随机缺失,或者是目标属性不明等。一方面,传统策略选择方法以经验总结、规则推理为主,缺少对于经验知识和规则的模型描述;另一方面,战术决策时指挥员仅依赖于一个或少数几个信息来源,对多变量时序信息的挖掘利用并不充分,从而造成在决策时造成的决策失误。
发明内容
本发明所要解决的技术问题是怎样在关键信息缺失及多变量观测信息存在高噪声的情况下,使潜艇做出正确的策略选择,提出了一种关键信息缺失下的来袭目标防御策略选择方法及装置。
为解决上述技术问题,本发明所采用的技术方案是:
一种关键信息缺失下的来袭目标防御策略选择方法,包括以下步骤:
步骤1:获取潜艇在一个时间段对来袭目标的时序观测信息,所述时序观测信息在每个时间步节点上包含有来袭目标多个动态和静态属性特征;
步骤2:对所述时序观测信息进行多变量时序关系特征提取,同时基于该时序观测信息构建信息粒表征,并进行下一时间步的趋势特征预测;
步骤3:将提取的多变量时序关系特征与预测的趋势特征进行拼接,输入交替训练分类器得到基于时序观测信息的潜艇策略选择标签。
进一步地,步骤2中进行趋势特征预测的方法是:将时序观测信息通过划分论域的方式构建并优化高斯线性时序信息粒,分别对高斯线性时序信息粒的每个参数构建基于LSTM 的趋势预测模型,对高斯线性时序信息粒的每个参数预测下一时间步的趋势参数。
进一步地,将时序观测信息通过划分论域的方式构建高斯线性时序信息粒的具体方法是:
步骤2.1:将一个时间段的时序观测信息作为时间序列,划分为
Figure SMS_1
个子序列/>
Figure SMS_2
Figure SMS_3
步骤2.2:对每一个子序列
Figure SMS_5
使用高斯线性时序信息粒/>
Figure SMS_8
进行描述,则时序观测信息构成一个时间粒度模型/>
Figure SMS_10
,/>
Figure SMS_6
,/>
Figure SMS_7
分别表示线性趋势表征线的斜率和截距,/>
Figure SMS_9
表示数据观测点与线性趋势表征线的偏离程度,
Figure SMS_11
表示第/>
Figure SMS_4
个时序信息粒的时间长度;
步骤2.3:将高斯线性时序信息粒划分为等间隔信息粒;
步骤2.4:将等间隔信息粒的每个参数输入由LSTM层构成的趋势预测层,得到各参数下一个时间步的信息粒趋势特征预测。
进一步地,在步骤2.2中还包括:对高斯线性时序信息粒进行优化;优化的方法是:
对于时间粒度模型
Figure SMS_12
中的每个信息粒
Figure SMS_13
,计算时间粒度模型LG的趋势不匹配得分:
Figure SMS_14
Figure SMS_15
表示第/>
Figure SMS_16
个信息粒的起始时间,/>
Figure SMS_17
表示时序观测信息/>
Figure SMS_18
中的第/>
Figure SMS_19
个元素;
最小化趋势不匹配得分函数
Figure SMS_20
,使高斯线性时序信息粒得到优化。
进一步地,步骤2中多变量时序关系特征提取的方法是:
将所述时序观测信息序列化成时序特征矩阵,输入基于关系卷积的关系模型,得到多变量时序关系矩阵。
进一步地,所述基于关系卷积的关系模型包括面向关系特征提取的全卷积块和面向时序信息关系提取的LSTM块。
进一步地,所述全卷积块由三个叠加的时间卷积块组成,每个时间卷积块包括由一个全卷积层、一个批归一化层和一个ReLU激活函数层,在卷积计算时,时间
Figure SMS_21
的输出只与时间/>
Figure SMS_22
和前一层中更早的元素进行卷积,在最后一个卷积块后进行全局平均池化来减少模型中的参数数量。
进一步地,面向时序信息关系提取的LSTM块是循环神经网络结构,以LSTM为基本记忆单元。
进一步地,步骤3中的交替训练分类器包括一个全连接层和一个softmax层。
进一步地,等间隔信息粒的方法是:
步骤2.3.1:基于最大公约数准则求得高斯线性时序信息粒的最小分割粒度,即:
Figure SMS_23
,/>
Figure SMS_24
表示最小分割粒度;
步骤2.3.2:对 LG 优化后的子序列进行基于时间间隔
Figure SMS_25
的切分;计算拆分数量
Figure SMS_26
,则高斯线性时序信息粒参数转化为/>
Figure SMS_27
个三元组/>
Figure SMS_28
,/>
Figure SMS_29
,符号/>
Figure SMS_30
表示向上取整。
步骤2.3.3:将
Figure SMS_31
个三元组高斯线性时序信息粒作为 LSTM 趋势预测的输入样本参数/>
Figure SMS_32
,分别对每个参数进行下一个时间步长度的信息粒参数预测。本发明还提供了一种关键信息缺失下的来袭目标防御策略选择装置,包括以下模块:
输入模块:用于获取潜艇在一个时间段对来袭目标的时序观测信息,所述时序观测信息在每个时间步节点上包含有来袭目标多个动态和静态属性特征;
特征提取模块:用于对所述时序观测信息进行多变量时序关系特征提取,同时基于该时序观测信息构建信息粒表征,并进行下一时间步的趋势特征预测;
预测模块:用于将提取的关系特征与预测的趋势特征进行拼接,输入交替训练分类器得到基于时序观测信息的潜艇策略选择标签。
本发明提供的一种关键信息缺失下的来袭目标防御策略选择方法及装置,通过将一个时间段的观测信息划分成多个时间步构成的子序列,进而将各子序列使用信息粒进行描述,使用高斯模糊信息粒的参数做出位置趋势预测,由预测出的趋势特征来表征来袭目标位置趋势,规避关键信息缺失造成的防御策略选择不准确性;并构建关系卷积网络,提取观测信息的多变量时序关系特征,由于提取来袭目标在一段时间内各时间点上的多个属性即从不同角度提取来袭目标的多维特征,通过提取多维特征之间的相互关系降低来袭目标在观测信息中的高噪声所造成的干扰和不确定性,有效解决高噪声数值信息带来的误差和错误,将趋势预测结果与关系特征进行拼接,通过预测层得到防御策略分类结果。最后通过实验验证了本发明方法的有效性,其与人类策略选择的符合度高达93%,说明本发明的方法在决策精度上的有效性。
附图说明
图1为本发明系统流程图;
图2为本发明网络模型结构。
具体实施方式
下面将结合附图对本发明的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
图1和图2示出了本发明一种关键信息缺失下的来袭目标防御策略选择方法,包括以下步骤:
步骤1:获取潜艇在一个时间段对来袭目标的时序观测信息,所述时序观测信息在每个时间步节点上包含有来袭目标多个动态和静态属性特征。本实施例中,通过对来袭目标多角度的观测,如速度、方位、转向半径等动态属性以及来袭目标长度、宽度等静态属性,通过对一个时间段上时序观测信息的分析,来综合多种因素构成的特征关系,实现更全面的防御策略选择。
步骤2:对所述时序观测信息进行多变量时序关系特征提取,同时基于该时序观测信息构建信息粒表征,并进行下一时间步的趋势特征预测。
如图2所示,本实施例中的网络模型总体架构包括关系提取模块、趋势表征模块和联合决策推理模块三个部分,多变量时序关系特征提取的方法使用图2中的关系提取模块,将所述时序观测信息序列化成时序特征矩阵,输入基于关系卷积的关系模型,得到多变量时序之间的特征关系和时序信息。所述基于关系卷积的关系模型包括面向关系特征提取的全卷积块和面向时序信息关系提取的长短期记忆层LSTM(long-shortterm memory)。所述全卷积块由三个叠加的时间卷积块组成,每个时间卷积块包括由一个全卷积层、一个批归一化和一个 ReLU激活函数,在卷积计算时,时间
Figure SMS_33
的输出只与时间/>
Figure SMS_34
和前一层中更早的元素进行卷积,在最后一个卷积块后进行全局平均池化来减少模型中的参数数量。面向时序信息关系提取的 LSTM 块是循环神经网络结构,以LSTM 为基本记忆单元。
本实施例中,为了充分描述高动态特征变量的趋势关系,使用图2的趋势表征模块,提高模型决策时对目标趋势发展的把握,在高噪声和缺失数据条件下构建高斯线性时序信息粒,如图2所示,趋势表征包括四个步骤: 首先,获取原始时间序列,然后,构建高斯线性信息粒,采用高斯线性模糊信息粒GLIG(GuassianLinear Fuzzy InformationGranular) 来描述时间序列的粒度区间,表征大致的时序趋势,并对数据进行去噪和异常处理。并结合一个粒度评价指标来衡量粒度模型的有效性。其次,优化高斯线性信息粒,采用面向趋势的模糊时序论域粒度优化方法,对粒度划分进行进一步优化,提高粒度模型对于趋势描述的精确度。为了便于与关系特征进行交替训练,再对优化后的粒度模型进行等间隔切分,形成等间隔时序信息粒。最后,基于粒化长短期记忆层的趋势预测,将等间隔信息粒的三个参数分别作为三个长短期记忆层的输入,利用长短期记忆层LSTM来分别预测下一个间隔T的时序信息粒趋势表征
Figure SMS_35
时序信息可以描述一个时间窗内,观测变量的线性趋势,通过对于历史时序观测信息的趋势描述,当不存在外部变量的情况下,这个趋势理论上也反映了未来的趋势变化。这种趋势变化难以用传统的粒度模型进行表征,本申请采用线性模糊信息粒LFIG(LinearFuzzy Information Granule) 的思想,首先给出关于高斯线性模糊信息粒 GLIG 的定义:
定义:一个高斯线性时序信息粒(GLIG) 可以用参数组
Figure SMS_36
描述,有:
Figure SMS_37
对于输入
Figure SMS_39
,在给定时间/>
Figure SMS_43
中,属于GLIG 的值/>
Figure SMS_46
的隶属度函数
Figure SMS_41
为一个服从均值/>
Figure SMS_44
随时间变化,方差为/>
Figure SMS_47
的正态分布,其中/>
Figure SMS_49
为高斯线性时序信息粒随时间变化的均值中心线,/>
Figure SMS_38
分别表示高斯线性时序信息粒均值中心线的斜率和截距,斜率/>
Figure SMS_42
反映了线性信息粒内随时间变化的趋势,如上升或下降的趋势,截距反映了线性信息粒内随时间变化的趋势初始水平,/>
Figure SMS_45
则描述了线性信息粒内数据观测点与均值中心线的偏离程度,/>
Figure SMS_48
表示线性信息粒的时间长度,反映了线性信息粒内随时间变化趋势的持续性。在构建高斯线性时序信息粒GLIG时,本实施例采用/>
Figure SMS_40
这四个参数描述一个线性信息粒。
用线性模糊信息粒GLIGs能够建模经验和观测时序相结合的不确定性,对于给定的时间窗,通常采用线性回归建立线性图,有助于更容易、更透明地解释时间窗口中的数据。将观测时间序列
Figure SMS_51
分解为一个线性趋势估计序列
Figure SMS_57
和一个残差序列/>
Figure SMS_61
,衡量趋势滤波有效性的两个基本条件是:a) 残差尽量小;b) 趋势分量尽可能平滑。即最小化目标函数:
Figure SMS_53
,其中,/>
Figure SMS_55
, 对于多变量时序输入,上式可以写成矩阵形式为:/>
Figure SMS_60
,上式中的/>
Figure SMS_62
和/>
Figure SMS_50
分别代表/>
Figure SMS_54
范式和/>
Figure SMS_58
范式,其中/>
Figure SMS_64
为二阶差分矩阵,对于λ的选择,首先,计算参数最大可能值/>
Figure SMS_52
,该值是无法通过遍历法确定的,因此,/>
Figure SMS_56
。时间序列的趋势越明显,/>
Figure SMS_59
越大,从而捕捉到平滑的趋势。考虑到预测精度更多地依赖于细节的提取,因此/>
Figure SMS_63
的值相对较小,以求得时间序列的局部变化。
基于上述原则,本实施例中进行趋势特征预测的方法是:步骤2.1:将一个时间段的时序观测信息作为时间序列,划分为
Figure SMS_65
个子序列/>
Figure SMS_66
,/>
Figure SMS_67
本实施例中,针对时间序列
Figure SMS_68
, 采用L−1 趋势滤波,提取/>
Figure SMS_69
个关键点,即
Figure SMS_70
, 根据得到的关键点,将时间序列/>
Figure SMS_71
划分为/>
Figure SMS_72
个子序列,分别为:
Figure SMS_73
其中第
Figure SMS_74
个子序列/>
Figure SMS_75
的时间跨度为/>
Figure SMS_76
步骤2.2:对每一个子序列
Figure SMS_79
使用高斯线性时序信息粒
Figure SMS_82
进行描述,则时序观测信息构成一个时间粒度模型
Figure SMS_84
,/>
Figure SMS_78
,/>
Figure SMS_81
分别表示线性趋势表征线的斜率和截距,/>
Figure SMS_85
表示数据观测点与线性趋势表征线的偏离程度,/>
Figure SMS_86
表示第/>
Figure SMS_77
个时序信息粒的时间长度。因为是提取的/>
Figure SMS_80
个关键点对观测时序/>
Figure SMS_83
进行的切割,所以不同的颗粒有不同的时间跨度,时间粒度模型/>
Figure SMS_87
是一个不等长的时间粒度模型。
本实施例中,还需对对高斯线性时序信息粒进行优化;优化的方法是:
对于时间粒度模型
Figure SMS_88
中的每个信息粒
Figure SMS_89
,计算时间粒度模型LG的趋势不匹配得分:
Figure SMS_90
Figure SMS_91
表示第/>
Figure SMS_92
个信息粒的起始时间,/>
Figure SMS_93
表示时序观测信息/>
Figure SMS_94
中的第/>
Figure SMS_95
个元素;
最小化趋势不匹配得分函数
Figure SMS_96
,使高斯线性时序信息粒得到优化。
因为对于每个粒度时序,通过
Figure SMS_97
来描述高斯线性时序信息粒随时间变化的均值中心线,所以,/>
Figure SMS_98
的值偏离均值中心线越远,则粒度时间子序列就越不可能精确拟合时间序列的变化模式,/>
Figure SMS_99
用于描述距离均值中心线的偏离程度,当/>
Figure SMS_100
值越大,说明该时序粒度越不能明显捕捉到详细的趋势。通过最小化/>
Figure SMS_101
函数,可以提高粒度时间序列对于趋势反应的准确度。
步骤2.3:将高斯线性时序信息粒划分为等间隔信息粒。本实施例中,通过对高斯线性时序信息粒的优化,可以确保每个信息粒能够最大程度的反应变量的趋势,剔除异常点;然而,每个粒度变长度会导致无法构建统一的纵横交替框架,因此,再对进行优化后的时序信息粒进行分割,按照等间隔窗口原则,确保高斯线性时序信息粒描述的信息
Figure SMS_102
具有相同的间隔,可以为多变量关系提取特征提供统一间隔的趋势分析;则将高斯线性时序信息粒进行进一步划分的方法为等间隔信息粒,每个粒度变长度会导致无法构建统一的纵横交替框架,因此对对进行优化后的时序信息粒进行分割,按照等间隔窗口原则,确保高斯线性信息粒描述的信息/>
Figure SMS_103
具有相同的间隔,可以为纵向关系提取特征提供统一间隔的趋势分析。
本实施例中,等间隔信息粒的方法是:
步骤2.3.1:基于最大公约数准则求得高斯线性时序信息粒的最小分割粒度,即:
Figure SMS_104
,/>
Figure SMS_105
表示最小分割粒度;
步骤2.3.2:对LG优化后的子序列进行基于时间间隔
Figure SMS_106
的切分;计算拆分数量
Figure SMS_107
,则高斯线性时序信息粒参数转化为/>
Figure SMS_108
个三元组/>
Figure SMS_109
,/>
Figure SMS_110
,符号
Figure SMS_111
表示向上取整。
对一个子信息粒LG i ,其在等间隔前对应的参数为
Figure SMS_112
,/>
Figure SMS_113
,则等间隔划分后因为/>
Figure SMS_114
都相等,参数转化为/>
Figure SMS_115
个三元组/>
Figure SMS_116
,/>
Figure SMS_117
步骤2.3.3:将
Figure SMS_118
个三元组高斯线性时序信息粒/>
Figure SMS_119
中的三个参数作为LSTM趋势预测的输入样本参数,分别对每个参数进行下一个时间步长度的信息粒参数预测。
本实施例中,LSTM 层的每个细胞单元,都是以前一时刻的隐层状态 H、输出
Figure SMS_120
和当前时刻的带权重输入/>
Figure SMS_121
一起作为下一个状态的输入,如图2所示。一方面,通过共享参数机制持续记忆和运用前序时间数据,另一方面,基于自适应窗口的数据填充输入作为当前/>
Figure SMS_122
时刻的输入,目标是持续预测当前时刻的输出分类值,每次输入的时间序列窗口长度记为L。将观测时序信息/>
Figure SMS_123
经过由长短期记忆LSTM 层构成的趋势预测层,得到下一个时间步长度为/>
Figure SMS_124
的趋势表征三元组/>
Figure SMS_125
,作为趋势模型对于未来
Figure SMS_126
时刻的趋势表征。
本实施例中,关系特征提取的方法是:
将所述时序观测信息序列化成时序特征矩阵,输入基于关系卷积的关系模型,得到多变量时序之间的特征关系和时序信息。所述基于关系卷积的关系模型包括括面向关系特征提取的全卷积块和面向时序信息关系提取的 LSTM 块。
由于指挥员在紧急情况下很难全面考虑多观测信息的相互关系,由1-D 时间全卷积网络和 LSTM 时序网络构成的趋势表征网络,目的是挖掘观测多变量时序之间的特征关系和时序信息。
所述全卷积块由三个叠加的时间卷积块组成,每个时间卷积块包括由一个全卷积层、一个批归一化层(动量为 0.99,
Figure SMS_127
为0.001)和一个ReLU激活函数,在卷积计算时,时间/>
Figure SMS_131
的输出只与时间/>
Figure SMS_133
和前一层中更早的元素进行卷积,在最后一个卷积块后进行全局平均池化来减少模型中的参数数量。时间卷积已被证明是时间序列分类问题的一种有效学习模型,通常被用作特征提取器。时间卷积网络的输入是多变量时间序列,设/>
Figure SMS_128
,代表输入是一个时间步长为/>
Figure SMS_130
,每个时刻输入/>
Figure SMS_132
个特征的输入特征向量,每个时刻的输出标签/>
Figure SMS_134
其中/>
Figure SMS_129
代表分类的量。
步骤3:如图2的下半部分联合决策推理模块所示,将提取的关系特征与预测的趋势特征进行拼接,输入交替训练分类器得到基于时序观测信息的潜艇策略选择标签。本实施例中的交替训练分类器包括一个全连接层和一个softmax层。本实施例将智能决策问题变成一个多分类问题,损失函数的交叉熵函数可以写为:
Figure SMS_135
交替训练模型将同时对信息粒的3个趋势参数预测对应的 LSTM层和关系全卷积网络进行参数更新和训练。
实验验证
基于水下防御鱼雷策略数据集展开完全信息和红方视角信息条件下的分类性能分析和应用性分析。首先分析了水下防御策略数据集的实体特征、策略标签分布和红方视角样本的不完全信息水平。对于完全信息和距离缺失、极端缺失两种不完全信息,以及不同时间步长的防御策略选择,分别设定四种对比算法,综合分析所提模型的分类性能、不完全信息抗干扰能力。
完全信息样本与不完全信息样本共用指挥员在完全信息条件下的高质量决策标签。针对潜艇防御鱼雷数据样本,筛选得到7种防御策略,如转向机动、使用声诱饵、干扰器和多枚声诱饵、干扰器的组合策略等。样本处理时将收集到的防御复盘数据裁剪为固定长度,以鱼雷报警为起点,推进240个离散仿真步,对所有抗实体 (潜艇、鱼雷、声诱饵、干扰器) 进行记录。其中,仿真系统内的推演仿真步长为1s,240个离散时间步记录时长为4分钟的推演对抗过程。选择了2个实体,每个实体选择10个最具代表性的特征,如表1所示。
表1 实体特征描述
Figure SMS_136
实验中的不完全信息样本,来源于仿真系统通过模拟海洋环境、潜艇和鱼雷辐射噪声、声传播损失等,得到的红方视角(潜艇视角)下的不完全信息样本。噪声样本,观测噪声来自很多影响因素,不同雷型的辐射噪声、不同潜艇的辐射噪声、不同海洋区域的传播损失、目标反射强度、干扰声级和海洋混响等,都会对潜艇防御决策的信息依据产生影响。本实验中,红方视角样本集与完全信息样本集的特征一一对比,样本数据近似服从
Figure SMS_137
的正态分布。信息缺失样本,在红方视角,由于被动声呐测距导致目标距离
Figure SMS_138
存在缺失,已知目标的位置坐标/>
Figure SMS_139
计算方法为:
Figure SMS_140
Figure SMS_141
代表潜艇观测鱼雷的方位角。由于距离/>
Figure SMS_142
特征不存在导致鱼雷的位置坐标
Figure SMS_143
缺失,红方视角样本数据相比于完全信息数据平均缺失率为 20.6%,通过掩码向量标记缺失位。
实验条件:
基于高斯线性分布的粒化长短期记忆与全卷积联合推理模型GLFCU(GuassianLinearDistribution–basedGranulation–LSTM and Fully Convolution Union Model)模型是本发明所提的策略选择模型,首先基于高斯线性分布实现了对位置经验信息的信息粒构建与优化,再通过粒度 LSTM 预测
Figure SMS_144
参数,并与全卷积联合推理模型 FCU(FullyConvolution Union Model)融合推理分类结果。其中粒化LSTM的隐层个数为 64,关系卷积网络层中神经元个数分别是16,64,16。样本集中,潜艇和鱼雷对抗实体的24078条时序样本按照70%,30% 划分训练集和测试集。
长短期记忆模型LSTM作为对比模型,是经典的时间序列分类模型,其输入特征不包含经验信息粒,该模型采用1个LSTM层,隐层个数为64。
全卷积网络FCN(FullyConvolution Network)模型作为对比模型,是经典的像素级关系提取模型,其输入特征不包含经验信息粒,该模型神经元分别是16,64,16。
八重卷积OctConv(OctaveConvolution)模型作为对比模型,是处理多变量关系的模型,该模型设置其滤波器(filter)的大小分别为16 和 16-64-16,核尺寸为3和7-5-3。
通过训练集对模型的训练,所提模型GLFCU在决策精确度优于对比现有模型,且训练趋势上反映了其收敛速度上具有优势。在完全信息条件下,机器学习的三个模型长短期记忆模型 LSTM、全卷积网络FCN 和八重卷积模型 OctConv 的分类精度与所提模型仅相差4%–8%,而在关键信息缺失条件下,本申请所提GLFCU模型在完全信息和距离缺失条件下,分类精度几乎不变,且训练趋势也较为稳定。这也再次说明即使是构造简单的信息粒,其表达也能够帮助模型对抗非随机缺失的情况。通过对训练收敛性的对比发现,GLFCU模型依然快速稳定收敛;而三个机器学习的模型在位置信息缺失的情况下,其决策的收敛变慢。这也从实验上印证了将经验知识引入防御策略选择,可以有效缓解由于非完全信息缺失导致的问题分布改变,从而提高策略选择的稳定性。
在一些极端场景,潜艇发现鱼雷时不光无法判断目标的位置,还面临着未知类型装备(即鱼雷属性特征不完全)。但是依然需要潜艇快速选择防御策略,为规避潜艇争取战机。为了验证目标距离、类型、速度、航向、坐标、装备参数这些特征全部无法获知条件下,所提模型选择防御策略的极限能力,在这种极端条件下,所提模型的决策能力有了整体上的下降,在训练集和测试集上只达到了70% 和 68%,相比于仅距离存在缺失的红方视角样本,决策精度分别下降了24%和26%。这也印证了为什么战场上有云,知己知彼方可百战百胜,不掌握来袭鱼雷的性能属性等情况,会对防御策略选择的精确性和稳定性造成较大影响。
本发明将经验表征与关系特征联合推理,有助于模型学习到稳定的策略知识结构,提高策略选择的精确性和稳定性。本发明所提模型GLFCU能够有效应对距离信息缺失条件下的分类问题,且在红方视角(距离缺失)样本可以得到与完全信息条件下几乎一样的分类性能。说明本发明通过合理的经验表征,弥补了距离信息缺失带来的不确定性。
实验表明在完全信息条件下,所提模型可以起到8%–10% 的决策精度提升。在距离信息缺失条件下,所提模型可以达到 17%–20%的决策精度提升,且仍能够在测试集上达到94% 的决策精度,说明所提模型能够很好地通过位置趋势预测提高决策精度。而在极端信息缺失条件下,由于目标不明、解要素不明会极大影响决策精确度,所提模型能够达到 68%的决策精度,但是仍能够达到 17%–24% 的决策精度提升。
最后应说明的是:以上各实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述各实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的范围。

Claims (11)

1.一种关键信息缺失下的来袭目标防御策略选择方法,其特征在于,包括以下步骤:
步骤1:获取潜艇在一个时间段对来袭目标的时序观测信息,所述时序观测信息在每个时间步节点上包含有来袭目标多个动态和静态属性特征;
步骤2:对所述时序观测信息进行多变量时序关系特征提取,同时基于该时序观测信息构建信息粒表征,并进行下一时间步的趋势特征预测;
步骤3:将提取的多变量时序关系特征与预测的趋势特征进行拼接,输入交替训练分类器得到基于时序观测信息的潜艇策略选择标签。
2.根据权利要求1所述的一种关键信息缺失下的来袭目标防御策略选择方法,其特征在于,步骤2中进行趋势特征预测的方法是:将时序观测信息通过划分论域的方式构建并优化高斯线性时序信息粒,分别对高斯线性时序信息粒的每个参数构建基于 LSTM 的趋势预测模型,对高斯线性时序信息粒的每个参数预测下一时间步的趋势参数。
3.根据权利要求2所述的一种关键信息缺失下的来袭目标防御策略选择方法,其特征在于,将时序观测信息通过划分论域的方式构建高斯线性时序信息粒的具体方法是:
步骤2.1:将一个时间段的时序观测信息作为时间序列,划分为m个子序列
Figure QLYQS_1
Figure QLYQS_2
步骤2.2:对每一个子序列
Figure QLYQS_4
使用高斯线性时序信息粒/>
Figure QLYQS_7
进行描述,则时序观测信息构成一个时间粒度模型/>
Figure QLYQS_8
,/>
Figure QLYQS_5
,/>
Figure QLYQS_6
分别表示线性趋势表征线的斜率和截距,/>
Figure QLYQS_9
表示数据观测点与线性趋势表征线的偏离程度,/>
Figure QLYQS_10
表示第/>
Figure QLYQS_3
个时序信息粒的时间长度;
步骤2.3:将高斯线性时序信息粒划分为等间隔信息粒;
步骤2.4:将等间隔信息粒的每个参数输入由LSTM层构成的趋势预测层,得到各参数下一个时间步的信息粒趋势特征预测。
4.根据权利要求3所述的一种关键信息缺失下的来袭目标防御策略选择方法,其特征在于,在步骤2.2中还包括:对高斯线性时序信息粒进行优化;优化的方法是:
对于时间粒度模型
Figure QLYQS_11
中的每个信息粒
Figure QLYQS_12
记算时间粒度模型LG的趋势不匹配得分:
Figure QLYQS_13
Figure QLYQS_14
表示第/>
Figure QLYQS_15
个信息粒的起始时间,/>
Figure QLYQS_16
表示时序观测信息/>
Figure QLYQS_17
中的第/>
Figure QLYQS_18
个元素;
最小化趋势不匹配得分函数
Figure QLYQS_19
,使高斯线性时序信息粒得到优化。
5.根据权利要求1所述的一种关键信息缺失下的来袭目标防御策略选择方法,其特征在于,步骤2中多变量时序关系特征提取的方法是:
将所述时序观测信息序列化成时序特征矩阵,输入基于关系卷积的关系模型,得到多变量时序关系矩阵。
6.根据权利要求5所述的一种关键信息缺失下的来袭目标防御策略选择方法,其特征在于,所述基于关系卷积的关系模型包括面向关系特征提取的全卷积块和面向时序信息关系提取的LSTM块。
7.根据权利要求6所述的一种关键信息缺失下的来袭目标防御策略选择方法,其特征在于,所述全卷积块由三个叠加的时间卷积块组成,每个时间卷积块包括由一个全卷积层、一个批归一化层和一个ReLU激活函数层,在卷积计算时,时间
Figure QLYQS_20
的输出只与时间/>
Figure QLYQS_21
和前一层中更早的元素进行卷积,在最后一个卷积块后进行全局平均池化来减少模型中的参数数量。
8.根据权利要求6所述的一种关键信息缺失下的来袭目标防御策略选择方法,其特征在于,面向时序信息关系提取的LSTM块是循环神经网络结构,以LSTM为基本记忆单元。
9.根据权利要求1所述的一种关键信息缺失下的来袭目标防御策略选择方法,其特征在于,步骤3中的交替训练分类器包括一个全连接层和一个softmax层。
10.根据权利要求4所述的一种关键信息缺失下的来袭目标防御策略选择方法,其特征在于,等间隔信息粒的方法是:
步骤2.3.1:基于最大公约数准则求得高斯线性时序信息粒的最小分割粒度,即:
Figure QLYQS_22
,/>
Figure QLYQS_23
表示最小分割粒度;
步骤2.3.2:对 LG 优化后的子序列进行基于时间间隔
Figure QLYQS_24
的切分;计算拆分数量
Figure QLYQS_25
,则高斯线性时序信息粒参数转化为/>
Figure QLYQS_26
个三元组/>
Figure QLYQS_27
,/>
Figure QLYQS_28
,符号
Figure QLYQS_29
表示向上取整;
步骤2.3.3:将
Figure QLYQS_30
个三元组高斯线性时序信息粒作为 LSTM 趋势预测的输入样本参数
Figure QLYQS_31
,分别对每个参数进行下一个时间步长度的信息粒参数预测。
11.一种关键信息缺失下的来袭目标防御策略选择装置,其特征在于,包括以下模块:
输入模块:用于获取潜艇在一个时间段对来袭目标的时序观测信息,所述时序观测信息在每个时间步节点上包含有来袭目标多个动态和静态属性特征;
特征提取模块:用于对所述时序观测信息进行多变量时序关系特征提取,同时基于该时序观测信息构建信息粒表征,并进行下一时间步的趋势特征预测;
预测模块:用于将提取的关系特征与预测的趋势特征进行拼接,输入交替训练分类器得到基于时序观测信息的潜艇策略选择标签。
CN202310512754.4A 2023-05-09 2023-05-09 一种关键信息缺失下的来袭目标防御策略选择方法及装置 Active CN116227952B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310512754.4A CN116227952B (zh) 2023-05-09 2023-05-09 一种关键信息缺失下的来袭目标防御策略选择方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310512754.4A CN116227952B (zh) 2023-05-09 2023-05-09 一种关键信息缺失下的来袭目标防御策略选择方法及装置

Publications (2)

Publication Number Publication Date
CN116227952A true CN116227952A (zh) 2023-06-06
CN116227952B CN116227952B (zh) 2023-07-25

Family

ID=86569943

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310512754.4A Active CN116227952B (zh) 2023-05-09 2023-05-09 一种关键信息缺失下的来袭目标防御策略选择方法及装置

Country Status (1)

Country Link
CN (1) CN116227952B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117473242A (zh) * 2023-12-28 2024-01-30 成都四方伟业软件股份有限公司 一种时序数据故障检测方法、系统、设备及介质

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006227965A (ja) * 2005-02-18 2006-08-31 Dainippon Printing Co Ltd トレンド予測装置およびトレンド予測方法
US20060224437A1 (en) * 2005-03-31 2006-10-05 Gupta Atul K Systems and methods for customer relationship evaluation and resource allocation
CN112651178A (zh) * 2020-12-30 2021-04-13 中国计量大学 一种基于无规则缺失数据融合模型的丁烷含量预测方法
CN113221450A (zh) * 2021-04-27 2021-08-06 中国科学院国家空间科学中心 一种针对稀疏不均匀时序数据的航位预测方法及系统
CN113743509A (zh) * 2021-09-07 2021-12-03 中国人民解放军国防科技大学 一种基于不完全信息的在线作战意图识别方法及装置
CN115033615A (zh) * 2022-05-18 2022-09-09 山东中烟工业有限责任公司 一种基于时序数据的烟草设备故障预测系统及预测方法
CN115310702A (zh) * 2022-08-10 2022-11-08 深圳达实智能股份有限公司 一种传感器关键信息缺失情形下的冷负荷预测方法及系统
CN115327503A (zh) * 2022-06-29 2022-11-11 深圳大学 基于高斯粒子滤波的固定单站无源定位方法和相关装置
CN115456090A (zh) * 2022-09-20 2022-12-09 沈阳飞机设计研究所扬州协同创新研究院有限公司 一种基于知识推理机的战斗机多层次复合意图预测方法
CN115480582A (zh) * 2022-08-17 2022-12-16 西安电子科技大学 基于lstm的目标的机动预测方法、电子设备和存储介质

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006227965A (ja) * 2005-02-18 2006-08-31 Dainippon Printing Co Ltd トレンド予測装置およびトレンド予測方法
US20060224437A1 (en) * 2005-03-31 2006-10-05 Gupta Atul K Systems and methods for customer relationship evaluation and resource allocation
CN112651178A (zh) * 2020-12-30 2021-04-13 中国计量大学 一种基于无规则缺失数据融合模型的丁烷含量预测方法
CN113221450A (zh) * 2021-04-27 2021-08-06 中国科学院国家空间科学中心 一种针对稀疏不均匀时序数据的航位预测方法及系统
CN113743509A (zh) * 2021-09-07 2021-12-03 中国人民解放军国防科技大学 一种基于不完全信息的在线作战意图识别方法及装置
CN115033615A (zh) * 2022-05-18 2022-09-09 山东中烟工业有限责任公司 一种基于时序数据的烟草设备故障预测系统及预测方法
CN115327503A (zh) * 2022-06-29 2022-11-11 深圳大学 基于高斯粒子滤波的固定单站无源定位方法和相关装置
CN115310702A (zh) * 2022-08-10 2022-11-08 深圳达实智能股份有限公司 一种传感器关键信息缺失情形下的冷负荷预测方法及系统
CN115480582A (zh) * 2022-08-17 2022-12-16 西安电子科技大学 基于lstm的目标的机动预测方法、电子设备和存储介质
CN115456090A (zh) * 2022-09-20 2022-12-09 沈阳飞机设计研究所扬州协同创新研究院有限公司 一种基于知识推理机的战斗机多层次复合意图预测方法

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
杨静等: "基于不确定时间序列的来袭目标解算方法", 《系统仿真学报》, pages 2 *
杨静等: "基于交替循环神经网络的水下防御态势预测方法", 《计算机工程》, pages 2 *
范学满;张会;: "基于AdaBoost的潜射防鱼雷诱饵干扰效果预测研究", 指挥控制与仿真, no. 03 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117473242A (zh) * 2023-12-28 2024-01-30 成都四方伟业软件股份有限公司 一种时序数据故障检测方法、系统、设备及介质
CN117473242B (zh) * 2023-12-28 2024-03-19 成都四方伟业软件股份有限公司 一种时序数据故障检测方法、系统、设备及介质

Also Published As

Publication number Publication date
CN116227952B (zh) 2023-07-25

Similar Documents

Publication Publication Date Title
Zhu et al. Deep and confident prediction for time series at uber
Kommenda et al. Parameter identification for symbolic regression using nonlinear least squares
Nikiforov et al. Neural network method as means of processing experimental data on grain crop yields
CN116227952B (zh) 一种关键信息缺失下的来袭目标防御策略选择方法及装置
CN110708318A (zh) 基于改进的径向基神经网络算法的网络异常流量预测方法
Imani et al. Point-based methodology to monitor and control gene regulatory networks via noisy measurements
Gu et al. Particle swarm optimized autonomous learning fuzzy system
MEHR et al. Wavelet packet-genetic programming: A new model for meteorological drought hindcasting
Dash et al. A comparative study of radial basis function network with different basis functions for stock trend prediction
Deng et al. A hybrid model of dynamic time wrapping and hidden Markov model for forecasting and trading in crude oil market
Hafiz et al. Structure selection of polynomial NARX models using two dimensional (2D) particle swarms
CN115766125A (zh) 一种基于lstm和生成对抗网络的网络流量预测方法
Kanumalli et al. A scalable network intrusion detection system using bi-lstm and cnn
US20210142865A1 (en) Prediction device, gene estimation device, prediction method, and non-transitory recording medium
CN116993548A (zh) 基于增量学习的LightGBM-SVM的教育培训机构信用评估方法及系统
CN116346475A (zh) 一种隐匿高危行为操作异常评分方法和系统
CN110880031A (zh) 基于融合随机黑洞策略的灰狼优化算法的特征选择方法
CN115694985A (zh) 基于tmb的混合网络流量攻击预测方法
CN115145903A (zh) 一种基于生产过程的数据插补方法
Olson et al. Decision making with uncertainty and data mining
CN113162914B (zh) 一种基于Taylor神经网络的入侵检测方法及系统
Alberg An interval tree approach to predict forest fires using meteorological data
CN117332923B (zh) 一种网状指标体系的赋权方法及系统
Markovich Analysis of clusters in network graphs for personalized web search
Oliveira et al. A History-based Framework for Online Continuous Action Ensembles in Deep Reinforcement Learning.

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant