CN114997306A - 一种基于动态贝叶斯网络的目标意图识别方法 - Google Patents

一种基于动态贝叶斯网络的目标意图识别方法 Download PDF

Info

Publication number
CN114997306A
CN114997306A CN202210606262.7A CN202210606262A CN114997306A CN 114997306 A CN114997306 A CN 114997306A CN 202210606262 A CN202210606262 A CN 202210606262A CN 114997306 A CN114997306 A CN 114997306A
Authority
CN
China
Prior art keywords
network
individuals
node
score
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210606262.7A
Other languages
English (en)
Inventor
张可
刘施彤
郑植
贾宇明
黄乐天
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
University of Electronic Science and Technology of China
Yangtze River Delta Research Institute of UESTC Huzhou
Original Assignee
University of Electronic Science and Technology of China
Yangtze River Delta Research Institute of UESTC Huzhou
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by University of Electronic Science and Technology of China, Yangtze River Delta Research Institute of UESTC Huzhou filed Critical University of Electronic Science and Technology of China
Priority to CN202210606262.7A priority Critical patent/CN114997306A/zh
Publication of CN114997306A publication Critical patent/CN114997306A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/12Computing arrangements based on biological models using genetic models
    • G06N3/126Evolutionary algorithms, e.g. genetic algorithms or genetic programming
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02PCLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
    • Y02P90/00Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
    • Y02P90/30Computing systems specially adapted for manufacturing

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Biophysics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Theoretical Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Molecular Biology (AREA)
  • Biomedical Technology (AREA)
  • Genetics & Genomics (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • General Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Physiology (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

本发明公开了一种基于动态贝叶斯网络的目标意图识别方法,属于目标意图识别技术领域。本发明使用原始数据和评分搜索算法构建动态贝叶斯网络,在评分的过程中使用贝叶斯评分准则BIC和自适应的遗传算法,在反馈策略中使用了集成学习的思想完成边方向的修正。本发明能处理从复杂态势中获取的时序信息和不确定信息,同时引入反馈策略解决了在使用原始数据构建动态贝叶斯网络的过程中出现的会影响识别准确率的反边问题。本发明可用于对空中目标的意图识别处理,则对应的原始数据为目标的飞行状态数据。

Description

一种基于动态贝叶斯网络的目标意图识别方法
技术领域
本发明属于目标意图识别技术领域,具体涉及一种基于动态贝叶斯网络的目标意图识别方法。
背景技术
贝叶斯网络是一种概率图模型,它的模型结构能够用于表述随机变量见的依赖关系,以有向无环图(Directed Acyclic Graph,DAG)结构表示变量间的联合概率分布,其中图中的节点代表各个随机变量,并且为图中给定父节点的变量定义了条件概率分布。贝叶斯网络的结构学习主要解决的问题就是找到每个节点对其父节点集合的概率依赖程度并且得到相应的条件概率分布函数,现有研究已经能够证明从数据中获得这种网络的结构是NP-hard的,仍然有许多问题需要解决。在贝叶斯网络的基础上引入节点之间的时序关系,就可以构建出动态贝叶斯网络。将网络的结构与时间信息结合,使贝叶斯网络具有处理时序数据的能力,更适用于生活中的各种场景。
发明内容
本发明提供了一种基于动态贝叶斯网络的目标意图识别方法,可用于提升对目标的意图识别的处理速度和准确性。
本发明采用的技术方案为:
一种基于动态贝叶斯网络的目标意图识别方法,该方法包括下列步骤:
步骤一、采集目标的属性数据,确定目标的真实意图属性,其中,目标的属性数据包括但不限于:目标的移动状态信息、位置信息和设备信息;
步骤二、对采集目标的属性数据中的数值类型数据进行离散化处理;
步骤三、对采集的目标的属性数据进行采样,获取与动态贝叶斯网络的输入相匹配的输入数据,基于多个输入数据得到训练数据集;
步骤四、基于设置的学习策略对动态贝叶斯网络进行训练学习,以训练目标的属性数据与待识别的意图属性之间的结构图,得到训练好的动态贝叶斯网络;
其中,基于设置的学习策略对动态贝叶斯网络进行训练学习具体为:
1)将训练数据集分为多个数据分组,每个数据分组定义为Dn,n表示数据集分组的编号;
2)基于节点间的互信息和时间互信息构建初始的先验网络B0和初始的转移网络B,并对初始的先验网络B0和初始的转移网络B进行编码;
3)基于每个数据分组Dn,通过自适应的遗传算法对当前的先验网络Bk,n和转移网络Bk→n进行结构学习,其中,下标k表示学习次数;
所述自适应的遗传算法中,每一代的交叉概率Pc与变异概率Pm的更新公式设置为:
Figure BDA0003670562570000021
Figure BDA0003670562570000022
其中,Pc1、Pc2表示进行交叉的两个个体的各个个体的交叉概率,Pm1、Pm2表示进行变异的两个个体的各个个体的变异概率,fmax表示种群中最大的适应度值;favg表示每代群体所有种群的平均适应度值;f′表示需要交叉或变异的两个个体中较大的适应度值;
4)计算当前的先验网络Bk,n和转移网络Bk→n的BIC评分(贝叶斯评分准则的评分),记为score(Bk,n+Bk→n);
遍历所有数据分组的评分score(Bk,n+Bk→n),所每个数据分组的评分score(Bk,n+Bk→n)均满足score(Bk,n+Bk→n,D)<score0,则执行步骤5);否则,继续执行步骤3);
5)遍历最近两次得到的所有分组的评分score(Bk,n+Bk→n)、score(Bk-1,n+Bk-1→n),对任意一组同一数据分组编号的评分,若均满足score(Bk,n+Bk→n)<score(Bk-1,n+Bk-1→n),则将最近得到的先验网络Bk,n和转移网络Bk→n得到训练好的动态贝叶斯网络;否则,基于当前的网络结构中边的得分继续执行步骤2);
步骤五、对待识别的属性数据进行采样,再将采样数据输入到步骤四训练好的动态贝叶斯网络中,基于其输出得到目标的意图识别结果。
进一步的,步骤四中,对初始的先验网络B0和初始的转移网络B进行编码具体为:
对先验网络B0的编码规则为:定义节点标志位为1,按照节点序号升序排列节点,且对于同一节点序号,t时刻节点在前,t-1时刻节点在后,若节点所在标志位是当前节点的父节点,则当前节点的代码为1,反之为0;
对转移网络B的编码规则为:定义节点标志位为1,按照节点序号升序排列节点,且对于同一节点序号,t时刻节点在前,t-1时刻节点在后,若节点所在标志位是当前父节点,则的当前节点的代码为1,反之为0。
进一步的,步骤四中,基于每个数据分组Dn,通过自适应的遗传算法对当前的先验网络Bk,n和转移网络Bk→n进行结构学习时,执行交叉处理时包括:若当前待交叉位置出现在先验网络中,则在非时序边编码内执行设置的交叉策略;若当前待交叉位置出现在转移网络中,则在时序边编码内执行设置的交叉策略。
进一步的,步骤四中,通过自适应的遗传算法对当前的先验网络Bk,n和转移网络Bk→n进行结构学习具体包括:
以网络的BIC评分作为种群适应度,计算当前代的种群适应度;
(1)计算当前代的种群的适应度;
(2)保留适应度最大的个体和最近更新的个体;
(3)从保留的个体中选择父母个体进行演化单点交叉策略,计算交叉概率Pc
其中,父母个体为保留的个体中,当前最大的两个适应度所对应的个体,且每次选中的个体与历史选择个体不重复;
(4)计算变异概率Pm,并得到变异体;
(5)若新生个体的数量大于指定值,则执行步骤(6),否则,返回步骤(3);其中,新生个体包括交叉和变异得到的新的个体;
(6)若最大适应度超过指定的迭代次数θe不存在数值变化,则执行两点交叉策略后,继续执行步骤(7);否则,直接执行步骤(7);
(7)基于新生个体的数量K,选取适应度最小的前K个个体,并替换为新生个体,继续执行步骤(8);
(8)判断是否满足结束条件,若是,则结束学习,否则,重复执行步骤(1)至(7);
其中,结束条件为:最大的适应度的取值收敛,或者学习次数达到预置的最大迭代次数。
进一步的,步骤四中,网络结构中边的得分具体为:
Figure BDA0003670562570000041
其中,W表示网络结构中边的得分,N′表示数据集的组数,Nkn表示第n组训练数据在第k次训练学习后,得到的网络结构中的非时序边的边数,Mkn表示第n组训练数据在第k次训练学习后,得到的网络结构的矩阵表示,D表示训练数据集的总样本量,⊙为哈达玛积。
进一步的,所述目标为空中目标。
本发明提供的技术方案至少带来如下有益效果:
本发明使用原始数据和评分搜索算法构建动态贝叶斯网络,在评分的过程中使用贝叶斯评分准则(Bayesian Information Criterion,BIC)和自适应的遗传算法,在反馈策略中使用了集成学习的思想完成边方向的修正。本发明能处理从复杂态势中获取的时序信息和不确定信息,同时引入反馈策略解决了在使用原始数据构建动态贝叶斯网络的过程中出现的会影响识别准确率的反边问题。本发明可用于对空中目标的意图识别处理,则对应的原始数据为目标的飞行状态数据。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它的附图。
图1是本发明实施例中,候选父节点执行分解示意图,图1中,(a)表示从所有候选边选边的情况,(b)表示仅从时序边选边的情况,(c)表示仅从非时序边选边的情况;
图2是本发明实施例中,节点转移网络示意图;
图3是本发明实施例中,采用的IAGAFB-DBN算法的交叉算子执行流程示意图;
图4是本发明实施例中,IAGAFB-DBN算法使用的两种变异算子示意图,图4中,(a)表示单点变异,(b)表示多点变异;
图5是本发明实施例中,自适应遗传算法的处理过程示意图。
图6是本发明实施例中,IAGAFB-DBN算法的处理过程示意图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面将结合附图对本发明实施方式作进一步地详细描述。
针对空中目标意图识别过程中出现的目标的行为特性与物理特性的不确定性、飞行规则的不确定性和行动能力的不确定性,本发明实施例提供了一种基于动态贝叶斯网络的目标意图识别方法,用于处理从复杂态势中获取的时序信息和不确定信息。同时引入反馈策略解决了在使用原始数据构建动态贝叶斯网络的过程中出现的会影响识别准确率的反边问题。本发明实施例使用原始数据和评分搜索算法构建动态贝叶斯网络,在评分的过程中使用贝叶斯评分准则(Bayesian Information Criterion,BIC)和自适应的遗传算法,在反馈策略中使用了集成学习的思想完成边方向的修正。
本发明实施例主要以两步走策略和自适应的遗传算法为基础,提出带反馈策略的基于自适应遗传算法的动态贝叶斯网络结构学习算法(Improved Adaptive GeneticAlgorithm with Feedback-Dynamic Bayesian Network,IAGAFB-DBN)。
动态贝叶斯网络的结构学习在满足平稳性和马尔可夫性的条件下能够转化为先验网和转移网的学习,在完备数据集的条件下,可以将贝叶斯网络的评分函数分解为关于变量和其所有父节点的独立因式。如果某一个节点的父子结构关系发生变化,也不会影响其他节点的评分结果,因此,在计算评分函数时,只需要计算出每一个节点相关的局部结构的充分统计因子即可。基于此思路,可以针对转移网络的时序边和非时序边的两种特征,执行两步走的策略,图1展示了分解与执行的策略。其中,图1的(a)所示的情况是现有的策略,图1的(b)和(c)所示为本发明实施例所采用的分解与执行的策略,将边分解为时序边和非时序边后,可以减小搜索的空间,降低算法运行的时间复杂度,以此为基础,使用自适应的遗传算法与BIC评分函数进行最佳动态网络结构模型的学习。
本发明实施例中,用于学习网络结构的算法主要步骤有:
1、使用互信息和时间互信息构建初始先验网络和初始转移网络。
在满足马尔可夫性假设的条件下,t时刻节点的状态只与t-1时刻的节点状态有关。
设Yij(t-1)={Xk(t-1),k≠i,j},Xi(t-1)和Xj(t)在Yij(t-1)条件下的条件互信息公式为:
Figure BDA0003670562570000051
其中,Yij(t-1)表示t-1时刻的条件集合,下标i和j表示两个不同节点的节点编号,对应当前计算互信息的两个节点,Xk(t-1)表示t-1时刻节点k的节点状态,同理,Xi(t-1)表示t-1时刻节点i的节点状态,Xj(t)表示t时刻节点j的节点状态,H(X)是离散随机变量X的熵,设定阈值ε>0,如果存在
Figure BDA0003670562570000052
则表示节点i和节点j相互独立,以此为基础得到各个节点的初始父节点集合构建遗传算法的初始转移网络种群进行迭代演化。
初始先验网络可以使用互信息来进行构建,变量X,Y之间的互信息定义为:
Figure BDA0003670562570000061
其中,pXY(x,y)表示变量X,Y的联合概率密度,pX(x),pY(y)分别代表变量X和变量Y的边缘概率密度函数,互信息越大说明变量X和变量Y之间的相关性越大。使用这种互信息表示方法在模拟现实环境获得的数据中会出现联合密度估计困难并且准确度低的情况,可以使用Copula熵进行变量X和变量Y之间的相关性计算,可以避免对联合概率密度函数的估计,同时可以降低在构建初始化网络时的时间复杂度。基于Copula熵的互信息计算方法可以写为
Figure BDA0003670562570000062
其中,N表示节点数量,ω(x,y)表示条件概率函数
Figure BDA0003670562570000063
设定阈值ε>0,如果变量X和Y之间的互信息值超过阈值,则认为节点X与节点Y之间有边,但此时不能确定边的方向,可以利用使原有网络不包含有向环的标准添加边的方向。
2、BIC评分分析。
BIC是一种评分和选择模型的方法,适用于在最大似然估计框架下拟合的模型。BIC评分公式为:
Figure BDA0003670562570000064
其中,BIC评分FBIC(G,D)的第一项为似然函数项,mijk表示第i个X变量(节点)在其父节点集的取值组合中第j种取值下Xi=k的实例个数,qi表示X变量父节点组合的取值个数,ri表示X变量的取值个数,m表示样本总数,N表示是属性个数(即节点总数量),G表示待评分的网络,D表示数据集的总样本量。在模型训练的过程中,参数数量的增加会导致似然函数的增大,从而使模型更加拟合训练的数据,然而过多的参数同时会增大网络模型的复杂度,使学习到的网络结构几乎收敛于一个完全图,因此需要第二项作为模型参数的惩罚项,防止模型中参数过多而引起的过拟合。
3、先验网和转移网编码。
为了使网络更好的适应遗传算法的迭代和交叉,变异,需要将网络结构进行编码。编码阶段分为先验网的编码和转移网的编码,因此相应网络的编码可写为C=C0+C,具体的编码规则如图2所示。
C0的编码(先验网编码):在先验网的编码中,只需要考虑节点内部之间的关系,以t时间片的节点的编码情况为例。编码规则为:节点标志位为1;节点序号小的在前,节点序号大的在后,t时刻节点在前,t-1时刻节点在后;节点所在标志位是当前节点父节点的代码为1,反之为0。则图2的C0编码为0000|1000|0100|1000。
C的编码(转移网编码):t-1的时刻所有节点均没有父节点,故只考虑t时间片的节点的编码情况。设定编码规则:节点标志位为1;节点序号小的在前,节点序号大的在后;t时刻节点在前,t-1时刻节点在后;节点所在标志位是当前父节点的代码为1,反之为0。如图2的C编码为:1000|1100|0010|0101。
4、自适应的遗传算法。
遗传算法中两个重要的参数是交叉概率(Pc)与变异概率(Pm),其中Pc决定着种群的丰富度,Pm决定了遗传算法能否从局部最优值中跳出。如何决定这两个参数成为了众多使用遗传算法的研究人员的主要研究方向,过大的Pc会使得优良的基因被破环,过大的Pm会使遗传算法退化为随机搜索算法。
M.Srinivas提出当种群适应度比较集中时,使交叉概率增大;当群体适应比较分散时,使交叉概率减小。种群适应度分散与否通过最大、最小和平均适应度来衡量。但是当个体适应度接近或等于最大适应度时,交叉率和变异率接近或等于零,对遗传算法中的进化阶段是不利的,会使得演化初期种群内的精英个体基本不会改变,从而导致整个算法陷入局部最优解中。基于上述理论,已有的交叉概率(Pc)与变异概率(Pm)的计算公式为。
Figure BDA0003670562570000071
Figure BDA0003670562570000072
其中,fmax是种群中最大的适应度值;favg是每代群体所有种群的平均适应度值;f′是需要交叉的两个个体中较大的适应度值;Pc1、Pm1表示两个个体中的其中一个个体的交叉概率和变异概率,Pc2、Pm2表示两个个体中的另外一个个体的交叉概率和变异概率,f′是将要变异的个体的适应度值。通过这种动态改变交叉概率和变异概率的方式,能够保证种群的个体适应度达到最大时,交叉率和变异率不会变为0,其最佳个体依然有着概率进化的能力,保证算法能够跳出局部最优解。
从公式中能够得到,在个体的适应度比平均适应度低的时候变异概率和遗传概率是一个不变的值,如果Pc1,Pm1较大会导致适应度低的个体中携带的优质基因被淘汰,增加了算法陷入局部最优解的可能性,本发明实施例在此基础上对Pc和Pm的更新策略进行改进,具体的更新公式为:
Figure BDA0003670562570000081
Figure BDA0003670562570000082
使用
Figure BDA0003670562570000083
作为判断可以起到非线性适应的目的,如果favg增加,
Figure BDA0003670562570000084
增加的比线性增长的更快,因此能够更清晰的描述出种群适应度的集中或者分散。
在遗传算法迭代的过程中使用精英保留策略,如果在遗传操作后新一代种群中最高适应值小于遗传操作前种群的最高适应值,则将前一代种群中具有最大适应值的个体加入新一代。精英保留策略能够避免在实际使用的过程中计算出来的交叉概率会突然增大而使优质基因被破坏,同时也保证了算法的收敛能力。
5、计算交叉算子与变异算子。
IAGAFB-DBN算法使用的是联赛选择机制,即从当前迭代种群中选择较优个体作为父母执行交叉和变异操作。此外使用两点交叉算子保证种群的多样性,具体实现步骤如图3所示。
变异算子共有两种,在演化初期种群内的个体适应度较为分散时,采用单点变异算子,在变异的个体中随机选择一个位点进行取反操作。随着迭代演化的进行,群体适应度比较集中,种群内几乎都是精英个体时,采取多点变异算子,进行变异的个体会在所有位点随机赋值0或1,使得最佳个体依然能够进化,保证算法能够跳出局部最优解。具体的两种变异操作如图4所示,图4中,(a)表示单点变异,(b)表示多点变异。
IAGAFB-DBN算法在遗传算法中加入了非线性的变异概率和交叉概率自适应函数,能够更准确的描述出种群适应度分散和集中时,交叉概率和变异概率的变化情况,同时避免了在使用线性自适应函数演化的过程中,当个体适应度大于等于或者接近群体最大适应度时,交叉率或者变异率会趋近于零的问题。保证了算法的进化过程。IAGAFB-DBN在构建初始化网络时使用了基于Copula熵的互信息,避免了在一些实际问题中,边缘联合概率难计算的问题,加快了初始网络构建的速度。
IAGAFB-BDN算法中使用的遗传算法流程如图5所示。
(1)输入数据集分组Di,以及输入种群规模θpn、指定迭代次数θe(也称为保留参数)、最大迭代次数θmax、变异概率Pm,和交叉概率Pc
优选的,参数θe的取值范围可以设置为
Figure BDA0003670562570000091
(2)基于Copula的互信息构建初始先验网B0,基于时间互信息构建初始转移网B,并进行编码;
(3)计算种群适应度FBIC(G,Di);
(4)精英保留策略保留最优个体:αbest_fitness andαelite,其中,αbest_fitness表示适应度FBIC(G,Di)最大的个体,αelite表示最近更新的个体;
(5)从优选择父母个体进行演化单点交叉策略,计算交叉概率Pc
其中,父母个体为当前最大的两个适应度所对应的个体,且每次选中的对象与已选择过的对象不重复;
(6)更新Pm得到变异体;
即基于变异概率Pm确定变异与否,然后对编码的某个或某些位置进行变异,生成新的个体。
(7)若新生个体(交叉和变异得到的新的个体)数量大于M(指定值),则执行步骤(8),否则,返回步骤(5);
(8)判断是否进行入迭代末期,若是,则执行步骤(9),否则执行步骤(10);
本步骤中,当最佳适应度超过指定迭代次数θe均没有变化,即认为进入迭代末期。
(9)执行两点交叉策略,执行完毕后,继续执行步骤(10);
(10)用新生个体替换较差个体(即适应度最小的前M个个体),替换完毕后,执行步骤(11);
(11)判定是否结束迭代:αbest_fitness收敛或者迭代次数达到θmax,若是,则结束;否则返回执行步骤(3)。
6、反馈策略。
由于在构建初始网络时,使用互信息只能够判断出两个节点之间存在边而不能指明边的方向(在一些实际问题中边的方向有着明确的含义),同时在使用BIC评分函数进行遗传算法搜索的时候也没有对边的方向进行判断,因此需要使用反馈策略对边的方向进行修正,以提高学习到的网络结构与数据的拟合程度。
本发明实施例中,具体的反馈策略为:将在模拟场景下生成的数据集按照时间序列分组,定义N′表示数据的组数,对每一组训练数据集使用自适应的遗传算法和BIC评分搜索进行结构学习,得到新的网络结构,并基于得到的网络结构中边的得分情况W,用于指明结构学习中得到的边的可靠程度,其中W的计算公式为:
Figure BDA0003670562570000101
其中,N′表示数据集的组数,Nki表示第i组训练数据通过提出的IAGAFB-BDN算法学习到的网络中非时序边的边数,Mki表示第i组训练数据通过提出的IAGAFB-DBN算法学习到的网络结构的矩阵表示,D表示数据集的总样本量,⊙为哈达玛积。
设定阈值θ,用于对得到的W,进行计算,对于第k次计算得到的矩阵Wk(k表示迭代次数),其任意元素Wk[q,p]若小于θ,则令该元素Wk[q,p]=0;否则,Wk[q,p]=1。最后用得到的经过归一化后的Wk矩阵进行网络图的构建,最终得到一个新的贝叶斯网络记为BNk
计算通过数据集分组得到的贝叶斯网络的评分score(BNk,D)和通过互信息得到的初始网络的评分score0做比较,若有score(BNk,D)>score0则对初始构建出的网络进行更新,具体的更新策略为:首先将得到的W矩阵转置,得到WT,判断初始网络B0和WT中的每一个元素,若有B0[q,p]=WT[q.p],则令B0[p,q]=1,B0[q,p]=0,完成初始网络B0的更新,迭代直至得到score(BNk,D)<score0。得到最终的网络。
如图6所示,IAGAFB-DBN策略的具体过程包括,输入数据集的各个分组,每个分组分别执行下列处理:
(1)基于输入的数据集分组,得到初始网络,包括先验网B0和转移网B
(2)基于IAGAFB-DBN策略(也可称为BIC+自适应的遗传算法)进行结构学习,得到第n次学习(迭代)的网络:先验网Bk,n和转移网Bk→n,其中下标k表示学习次数(迭代次数),n表示数据集分组的编号,n=1,2,…,N′;
(3)判断是否满足score(Bk,n+Bk→n,D)<score0,若否,则继续执行步骤(2);若是,则,执行步骤(4);
(4)判断是否满足score(Bk,n+Bk→n,D)<score(Bk-1,n+Bk-1→n,D),若是,则执行步骤(5),否则,依照当前计算得到的W对初始网络(B0、B)进行网络更新。
改进后的贝叶斯网络结构学习算法解决了在结构学习过程中无法判断边方向而导致的反向边出现的次数多的问题,在原有算法的基础上改进了初始网络构建的策略使初始网络构建的速度更快,同时在结构学习完成后,增加了反馈策略,通过计算边得分函数W完成对边的修正和更新,从而得到最优的网络结构。
将本发明实施例提供的基于动态贝叶斯网络的目标意图识别方法用于空中目标的处理过程具体包括:
步骤1:模拟从传感器中获得空中目标的各种属性数据,包括经度(Longitude)、纬度(Latitude)、与观测点的距离(Distance)、飞行的高度(Height)、飞行速度(Velocity)、携带的雷达型号(Radar Model,RM)、雷达的状态(Radar Status,RS)、通信系统的状态(Communication System Status,CSS)、飞行时的方位角(Azimuth)、飞行时的航向角(Heading Angle,HA)、飞行时是否有加速度(Acceleration),其中经度、纬度、与观测点的距离、飞行的高度、飞行速度、飞行时的方位角和飞行时的航向角为数值类型;携带的雷达型号、雷达的状态、通信系统的状态、是否有加速度为枚举类型。具体的数据说明如表1和表2所示。
表1一组数值类型数据
属性 单位 数值
Longitude ° 102°54′
Latitude ° 30°05′
Distance km 310.0
Height km 15.8
Velocity m/s 220.0
Azimuth mil 2230.0
Heading Angle ° 12.0
表2一组非数值类型数据
Figure BDA0003670562570000121
步骤2:将数值类型数据离散化。
一种离散化的方式为:Height(0:低空;1:中空;2:高空),Velocity(0:低速;1:中速;2:高速),Radar Model(0:预警控制雷达;1:地形跟踪雷达;2:火控雷达;3:其他),RadarStatus(0:关机;1:制导;2:跟踪;3:搜索;4:未知),Communication System Status(0:关机状态;1:开机状态),Distance(0:近;1:中;2:远),Acceleration(0:匀速;1:加速),除此之外可以通过空中目标飞行时的方位角、航向角以及经纬度坐标模拟出空中目标的机动方式(Maneuver)可以离散化为(0:平飞;1:转弯;2:俯冲;3:上升;4:S型;5:O型;6:左迂回;7:右迂回;8:筋斗;9:上升转弯),在经过离散化处理后,数据属性一共有9维,包括8维空中目标的属性(表1中的最后两项未采用)和1维意图属性(Intention)。
本发明实例中,将Intention设置为:0:巡逻;1:预警探测/指挥;2:电子侦察;3:电子干扰;4:攻击;5:打击。当然,当应用在其它场景时,可以根据实际需求进行具体的设置,本发明对此不做限定。
步骤3:对数据进行采样,确保能够符合模型的输入格式。
步骤4:按照IAGAFB-DBN算法进行学习,训练得到空中目标属性与空中目标意图之间的结构图。
步骤5:使用得到的结构图完成推理,得到空中目标的意图。
最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。
以上所述的仅是本发明的一些实施方式。对于本领域的普通技术人员来说,在不脱离本发明创造构思的前提下,还可以做出若干变形和改进,这些都属于本发明的保护范围。

Claims (6)

1.一种基于动态贝叶斯网络的目标意图识别方法,其特征在于,包括下列步骤:
步骤一、采集目标的属性数据,确定目标的真实意图属性,其中,目标的属性数据包括但不限于:目标的移动状态信息、位置信息和设备信息;
步骤二、对采集目标的属性数据中的数值类型数据进行离散化处理;
步骤三、对采集的目标的属性数据进行采样,获取与动态贝叶斯网络的输入相匹配的输入数据,基于多个输入数据得到训练数据集;
步骤四、基于设置的学习策略对动态贝叶斯网络进行训练学习,以训练目标的属性数据与待识别的意图属性之间的结构图,得到训练好的动态贝叶斯网络;
其中,基于设置的学习策略对动态贝叶斯网络进行训练学习具体为:
1)将训练数据集分为多个数据分组,每个数据分组定义为Dn,n表示数据集分组的编号;
2)基于节点间的互信息和时间互信息构建初始的先验网络B0和初始的转移网络B,并对初始的先验网络B0和初始的转移网络B进行编码;
3)基于每个数据分组Dn,通过自适应的遗传算法对当前的先验网络Bk,n和转移网络Bk→n进行结构学习,其中,下标k表示学习次数;
所述自适应的遗传算法中,每一代的交叉概率Pc与变异概率Pm的更新公式设置为:
Figure FDA0003670562560000011
Figure FDA0003670562560000012
其中,Pc1、Pc2表示进行交叉的两个个体的各个个体的交叉概率,Pm1、Pm2表示进行变异的两个个体的各个个体的变异概率,fmax表示种群中最大的适应度值;favg表示每代群体所有种群的平均适应度值;f′表示需要交叉或变异的两个个体中较大的适应度值;
4)计算当前的先验网络Bk,n和转移网络Bk→n的BIC评分,记为score(Bk,n+Bk→n);
遍历所有数据分组的评分score(Bk,n+Bk→n),所每个数据分组的评分score(Bk,n+Bk→n)均满足score(Bk,n+Bk→n,D)<score0,则执行步骤5);否则,继续执行步骤3);
5)遍历最近两次得到的所有分组的评分score(Bk,n+Bk→n)、score(Bk-1,n+Bk-1→n),对任意一组同一数据分组编号的评分,若均满足score(Bk,n+Bk→n)<score(Bk-1,n+Bk-1→n),则将最近得到的先验网络Bk,n和转移网络Bk→n得到训练好的动态贝叶斯网络;否则,基于当前的网络结构中边的得分继续执行步骤2);
步骤五、对待识别的属性数据进行采样,再将采样数据输入到步骤四训练好的动态贝叶斯网络中,基于其输出得到目标的意图识别结果。
2.如权利要求1所述的方法,其特征在于,步骤四中,对初始的先验网络B0和初始的转移网络B进行编码具体为:
对先验网络B0的编码规则为:定义节点标志位为1,按照节点序号升序排列节点,且对于同一节点序号,t时刻节点在前,t-1时刻节点在后,若节点所在标志位是当前节点的父节点,则当前节点的代码为1,反之为0;
对转移网络B的编码规则为:定义节点标志位为1,按照节点序号升序排列节点,且对于同一节点序号,t时刻节点在前,t-1时刻节点在后,若节点所在标志位是当前父节点,则的当前节点的代码为1,反之为0。
3.如权利要求1或2所述的方法,其特征在于,步骤四中,基于每个数据分组Dn,通过自适应的遗传算法对当前的先验网络Bk,n和转移网络Bk→n进行结构学习时,执行交叉处理时包括:若当前待交叉位置出现在先验网络中,则在非时序边编码内执行设置的交叉策略;若当前待交叉位置出现在转移网络中,则在时序边编码内执行设置的交叉策略。
4.如权利要求3所述的方法,其特征在于,步骤四中,通过自适应的遗传算法对当前的先验网络Bk,n和转移网络Bk→n进行结构学习具体包括:
以网络的BIC评分作为种群适应度,计算当前代的种群适应度;
(1)计算当前代的种群的适应度;
(2)保留适应度最大的个体和最近更新的个体;
(3)从保留的个体中选择父母个体进行演化单点交叉策略,计算交叉概率Pc
其中,父母个体为保留的个体中,当前最大的两个适应度所对应的个体,且每次选中的个体与历史选择个体不重复;
(4)计算变异概率Pm,并得到变异体;
(5)若新生个体的数量大于指定值,则执行步骤(6),否则,返回步骤(3);其中,新生个体包括交叉和变异得到的新的个体;
(6)若最大适应度超过指定的迭代次数θe不存在数值变化,则执行两点交叉策略后,继续执行步骤(7);否则,直接执行步骤(7);
(7)基于新生个体的数量K,选取适应度最小的前K个个体,并替换为新生个体,继续执行步骤(8);
(8)判断是否满足结束条件,若是,则结束学习,否则,重复执行步骤(1)至(7);
其中,结束条件为:最大的适应度的取值收敛,或者学习次数达到预置的最大迭代次数。
5.如权利要求4所述的方法,特征在于,将迭代次数θe的取值范围设置为:
Figure FDA0003670562560000031
其中,θmax表示最大迭代次数。
6.如权利要求1所述的方法,特征在于,步骤四中,网络结构中边的得分具体为:
Figure FDA0003670562560000032
其中,W表示网络结构中边的得分,N′表示数据集的组数,Nkn表示第n组训练数据在第k次训练学习后,得到的网络结构中的非时序边的边数,Mkn表示第n组训练数据在第k次训练学习后,得到的网络结构的矩阵表示,D表示训练数据集的总样本量,⊙表示哈达玛积。
CN202210606262.7A 2022-05-31 2022-05-31 一种基于动态贝叶斯网络的目标意图识别方法 Pending CN114997306A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210606262.7A CN114997306A (zh) 2022-05-31 2022-05-31 一种基于动态贝叶斯网络的目标意图识别方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210606262.7A CN114997306A (zh) 2022-05-31 2022-05-31 一种基于动态贝叶斯网络的目标意图识别方法

Publications (1)

Publication Number Publication Date
CN114997306A true CN114997306A (zh) 2022-09-02

Family

ID=83030389

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210606262.7A Pending CN114997306A (zh) 2022-05-31 2022-05-31 一种基于动态贝叶斯网络的目标意图识别方法

Country Status (1)

Country Link
CN (1) CN114997306A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116029379A (zh) * 2022-12-31 2023-04-28 中国电子科技集团公司信息科学研究院 空中目标意图识别模型构建方法

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116029379A (zh) * 2022-12-31 2023-04-28 中国电子科技集团公司信息科学研究院 空中目标意图识别模型构建方法
CN116029379B (zh) * 2022-12-31 2024-01-02 中国电子科技集团公司信息科学研究院 空中目标意图识别模型构建方法

Similar Documents

Publication Publication Date Title
CN110514206B (zh) 一种基于深度学习的无人机飞行路径预测方法
CN111047182B (zh) 一种基于深度无监督学习的空域复杂度评估方法
CN110470301B (zh) 多动态任务目标点下的无人机路径规划方法
Wang et al. A cluster-based competitive particle swarm optimizer with a sparse truncation operator for multi-objective optimization
Obayashi et al. Multi-objective design exploration for aerodynamic configurations
CN113110592A (zh) 一种无人机避障与路径规划方法
CN111310915A (zh) 一种面向强化学习的数据异常检测防御方法
CN111488946B (zh) 基于信息融合的雷达伺服系统故障诊断方法
CN110336768B (zh) 一种基于联合隐马尔可夫模型与遗传算法的态势预测方法
CN108052968B (zh) 一种qsfla-svm的感知入侵检测方法
CN110926477A (zh) 一种无人机航路规划及避障方法
CN114997306A (zh) 一种基于动态贝叶斯网络的目标意图识别方法
Kareem et al. Falcon optimization algorithm for bayesian network structure learning
CN110779526B (zh) 一种路径规划方法、装置及存储介质
CN110109005B (zh) 一种基于序贯测试的模拟电路故障测试方法
CN116933948A (zh) 基于改进海鸥算法与反向传播神经网络的预测方法和系统
CN116029379B (zh) 空中目标意图识别模型构建方法
CN115630566B (zh) 一种基于深度学习和动力约束的资料同化方法和系统
CN113962013B (zh) 飞行器对抗决策方法及装置
CN115202357A (zh) 一种基于脉冲神经网络的自主建图方法
Wang et al. Structure identification of recursive TSK particle filtering via type-2 intuitionistic fuzzy decision
Davarynejad et al. Accelerating convergence towards the optimal pareto front
Waldock et al. Fuzzy Q-learning with an adaptive representation
CN111476321A (zh) 基于特征加权贝叶斯优化算法的空中飞行物识别方法
Ren et al. Research on multimodal algorithms for multi-routes planning based on niche technique

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination