CN116467950A - 一种基于不确定表征的无人机飞行数据异常检测方法 - Google Patents

一种基于不确定表征的无人机飞行数据异常检测方法 Download PDF

Info

Publication number
CN116467950A
CN116467950A CN202310447012.8A CN202310447012A CN116467950A CN 116467950 A CN116467950 A CN 116467950A CN 202310447012 A CN202310447012 A CN 202310447012A CN 116467950 A CN116467950 A CN 116467950A
Authority
CN
China
Prior art keywords
data
model
flight data
characterization
uncertain
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202310447012.8A
Other languages
English (en)
Inventor
王本宽
谷瑾瑜
刘大同
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Harbin Institute of Technology
Original Assignee
Harbin Institute of Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Harbin Institute of Technology filed Critical Harbin Institute of Technology
Priority to CN202310447012.8A priority Critical patent/CN116467950A/zh
Publication of CN116467950A publication Critical patent/CN116467950A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F30/00Computer-aided design [CAD]
    • G06F30/20Design optimisation, verification or simulation
    • G06F30/27Design optimisation, verification or simulation using machine learning, e.g. artificial intelligence, neural networks, support vector machines [SVM] or training a model
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F30/00Computer-aided design [CAD]
    • G06F30/10Geometric CAD
    • G06F30/15Vehicle, aircraft or watercraft design
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • G06N20/20Ensemble learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/044Recurrent networks, e.g. Hopfield networks
    • G06N3/0442Recurrent networks, e.g. Hopfield networks characterised by memory or gating, e.g. long short-term memory [LSTM] or gated recurrent units [GRU]
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02TCLIMATE CHANGE MITIGATION TECHNOLOGIES RELATED TO TRANSPORTATION
    • Y02T10/00Road transport of goods or passengers
    • Y02T10/10Internal combustion engine [ICE] based vehicles
    • Y02T10/40Engine management systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Evolutionary Computation (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Software Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Geometry (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Medical Informatics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Mathematical Physics (AREA)
  • Computing Systems (AREA)
  • Computer Hardware Design (AREA)
  • Mathematical Optimization (AREA)
  • Pure & Applied Mathematics (AREA)
  • Mathematical Analysis (AREA)
  • Computational Mathematics (AREA)
  • Aviation & Aerospace Engineering (AREA)
  • Health & Medical Sciences (AREA)
  • Automation & Control Theory (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明是一种基于不确定表征的无人机飞行数据异常检测方法。本发明涉及无人机状态监测技术领域,本发明主要通过对数据不确定性进行量化进行建模,采用贝叶斯理论与集成学习相结合的方式为预测模型引入不确定表征能力。同时,由于飞行数据为多元时间序列,数据间同时具备时间与空间关联性,为更好地捕捉数据间相关关系,本发明基于长短期记忆网络(longshort‑termmemory,LSTM)建立预测模型,融合基于贝叶斯理论中的MonteCarloDropout和集成学习中的平均思想,为上述预测模型建立不确定表征能力,提高模型的异常检测能力,降低虚警率。

Description

一种基于不确定表征的无人机飞行数据异常检测方法
技术领域
本发明涉及无人机状态监测技术领域,是一种基于不确定表征的无人机飞行数据异常检测方法。
背景技术
近年来,无人机被广泛应用于军事和民用领域,并展现了广阔的发展前景。但是由于无人机系统复杂度增加、研制成本控制、以及缺少人在回路实时控制,较之有人机,其事故率更高,因此,无人机的状态监测受到了广泛关注。数据驱动的状态监测方法通过对飞行数据进行处理和分析,可以实现无人机运行状态的评估,并及时发现潜在异常或故障,具有较好的方法基础且易于实现,得到了诸多研究人员的关注。其中,基于预测的方法对无人机各异常模式体现出较好的检测效果,因此,实践中常基于预测算法建立基线模型来捕捉无人机的正常运行规律以及各参数之间的关联关系,并基于所建模型对正常运行状态下各参数进行持续预测,通过对比预测值与观测值来判断无人机状态是否正常。但是,目前常用的方法所建模型普遍为确定性的预测模型,而无人机飞行数据涉及多个运行工况,不同工况的飞行数据变化存在一定的不确定性,且基线模型的建立往往基于已有历史飞行数据实现,由于环境和系统状态等因素影响,应用场景中历史数据与实时飞行数据间也体现了不确定性,上述数据间的不确定性导致模型的泛化能力受限,异常检测过程中虚警率偏高。
发明内容
本发明为解决数据不确定性导致现有基于预测的异常检测技术高虚警率的问题,设计提出了一种基于不确定表征的无人机飞行数据异常检测方法。本发明主要通过对数据不确定性进行量化,构建一种基于不确定表征的无人机飞行数据异常检测方法,目前常用的不确定表征方法有基于贝叶斯理论和基于集成学习的两大类,基于贝叶斯理论的方法只需要训练一个模型,时间开销低,但是对于模型自身的预测效果要求较高,可以用于单架次飞行数据的不确定性表征,基于集成学习的方法对于单个模型的容错性较好,但建模耗时长,可以用于多架次飞行数据的不确定性表征,为集合两类思想的优点,本发明提出的方法将采用贝叶斯理论与集成学习相结合的方式为预测模型引入不确定表征能力。同时,由于飞行数据为多元时间序列,数据间同时具备时间与空间关联性,为更好地捕捉数据之间的相关关系,本发明基于长短期记忆网络(long short-termmemory,LSTM)建立预测模型,融合基于贝叶斯理论的MonteCarlo Dropout和集成学习中的平均思想,为上述预测模型建立不确定表征能力,提高模型的异常检测能力,降低虚警率。
需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。
本发明提供了一种基于不确定表征的无人机飞行数据异常检测方法,本发明提供了以下技术方案:
一种基于不确定表征的无人机飞行数据异常检测方法,包括以下步骤:
步骤1:对无人机飞行数据进行处理,包括数据标准化、数据重构和数据集划分;
步骤2:根据处理后的数据,建立不确定表征预测模型;
步骤3:基于建立的不确定表征预测模型,确定异常检测的阈值,根据阈值对无人机飞行数据进行异常检测。
优选地,所述步骤1具体为:
记输入飞行数据为Xmultiple=[X1,X2,...,Xp],其中,p是架次数量,Xi为单个架次的飞行数据,Xi=[x1,x2,···,xn],xi∈R,被监测参数为Ymultiple=[Y1,Y2,...,Yp],其中Yi=[y1,y2,···,yn],yi∈R,其中n为样本总长度;
对无人机飞行数据进行标准化处理,将多架次数据进行统一标准化,方法如下:
其中,μmultiple是输入数据Xmultiple的均值,σmultiple是输入数据Xmultiple的标准差;
对数据进行重构处理,为避免不同架次的飞行数据信息混杂,对各个架次的飞行数据进行分开重构;记重构的窗口长度为l,步长为1,当第t时刻的某个架次输入数据为Xt=[xt-l+1,xt-l+2,···,xt],则重构后的数据为:
其中,m为输入飞行数据的参数维度。
优选地,于不确定表征进行异常检测的过程中,采用基于贝叶斯理论的MonteCarlo Dropout和集成学习相结合的方式引入模型的不确定表征能力;其中,集成学习模型由多个基预测模型构成,通过引入Bagging的思想为模型引入多架次飞行数据的不确定表征能力;
为使各个基预测模型真正独立,在学习的过程中以架次为单位进行数据集采样,使得各基预测模型的训练数据各不相同,由此降低模型之间的关联性;
由于飞行数据架次数量有限,为保证充分利用飞行数据,对各个架次的数据进行两两组合,从m个架次的飞行数据集中采样,每次采样选出两个架次的飞行数据,即可得到多次有放回采样后去掉重复采样结果的所有数据集,共K个,其中,将采样好的训练集记为{(Ytra-1,Xtra-1),(Ytra-2,Xtra-2),...,(Ytra-K,Xtra-K)},其中,训练集的各组数据集中均包含两个架次的飞行数据。
优选地,采样后的数据集按照架次5:1划分为训练集和测试集,对应测试集记为{Ytest,Xtest}。
优选地,所述步骤2具体为:
步骤2.1:基于LSTM建立预测模型,融合Monte Carlo Dropout和集成学习的思想,为模型引入不确定表征能力,将数据处理过程中所划分好的多个数据集分别输入多个不同的LSTM模型进行训练,每组建立一个引入Monte Carlo Dropout的LSTM预测模型;
步骤2.2:基于Monte Carlo Dropout将LSTM模型的各权重参数设置为伯努利分布,在训练的过程中,通过对训练集飞行数据对相应MC LSTM网络中的参数不断进行蒙特卡洛采样,优化模型中的各个参数,获取其后验分布,所得分布即为训练结果,如模型中的参数最终训练所得结果如下式所示:
q(wk)=P(wk,(Ytra-k|Xtra-k)) (1)
其中,wk为第k个MC LSTM中的参数,(Ytra-k|Xtra-k)为第k组训练集数据;
步骤2.3:将由各组数据训练好的MCLSTM模型作为集成学习中的基学习器,通过各个基学习器的预测结果结合获取不确定表征结果;具体选择平均法进行模型的结合,即为各个模型赋予相同的权重;将Xtest输入各个MCLSTM模型中,各个基学习器先进行多次蒙特卡洛采样,并将各个模型每次采样所得的预测结果赋予相同的权重,将所有模型多次采样所得的结果进行统计,得到最终的结果集,记为其中K是集成学习中模型数量,/>是第k个模型多次蒙特卡洛采样所得预测结果集合,记为/>其中,T是蒙特卡洛采样次数,/>是第t次采样所得的预测结果通过下式表示:
其中,wk为第k个MCLSTM中的参数。
优选地,所述步骤3具体为:
将Xtest输入训练完成的一组MCLSTM预测模型中,并基于蒙特卡洛思想对各模型进行多次蒙特卡洛采样,基于平均法思想对于各模型预测结果赋予相同的权值,进而对结果进行统计,获取最终所得的预测结果的后验分布,分布的参数通过下式表示:
其中,K是集成学习中模型数量,T是蒙特卡洛采样次数,是第k个模型第t次采样所得的预测结果。
优选地,根据MCLSTM模型预测所得分布,在异常检测过程中基于拉伊达准则确定μ±3*σ以内为正常运行状态下各个参数的分布范围,在高斯分布中,99.6%的正常点都在位于该范围中,将μ±3*σ作为异常检测的阈值,通过对比实际观测点与该阈值的对比结果检测异常值,将超出范围的点定义为异常值,否则记为正常结果,由此实现异常检测。
一种基于不确定表征的无人机飞行数据异常检测系统,包括:
数据处理模块,所述数据处理模块对无人机飞行数据进行处理,包括数据标准化、数据重构和数据集划分;
模型建立模块,所述模型建立模块根据处理后的数据,建立不确定表征预测模型;
异常检测模块,所述异常检测模块基于建立的不确定表征预测模型,确定异常检测的阈值,根据阈值对无人机飞行数据进行异常检测。
一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行,以用于实现一种基于不确定表征的无人机飞行数据异常检测方法。
一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现一种基于不确定表征的无人机飞行数据异常检测方法。
本发明具有以下有益效果:
本发明与现有技术相比:
本发明结合了基于贝叶斯理论进行不确定表征运行时间短和基于集成学习进行不确定表征对于单个模型容错性好的优点,能够较好的对不同运行工况以及不同架次的飞行数据间的不确定性进行表征,并基于不确定表征的结果设置异常检测阈值,将数据间的不确定性纳入异常检测阈值设定的计算范围,充分考虑到数据间不确定性对预测结果的影响,因此,该方法具有较好的泛化能力,可以有效提高异常检测过程中的准确率,降低检测过程中的虚警率,异常检测的可信度较高。
附图说明
为了更清楚地说明本发明具体实施方式或现有技术中的技术方案,下面将对具体实施方式或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施方式,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是基于不确定表征的无人机飞行数据异常检测框图;
图2是横滚角状态监测效果图;
图3是横滚角异常检测效果图。
具体实施方式
下面将结合附图对本发明的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
在本发明的描述中,需要说明的是,术语“中心”、“上”、“下”、“左”、“右”、“竖直”、“水平”、“内”、“外”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本发明和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本发明的限制。此外,术语“第一”、“第二”、“第三”仅用于描述目的,而不能理解为指示或暗示相对重要性。
在本发明的描述中,需要说明的是,除非另有明确的规定和限定,术语“安装”、“相连”、“连接”应做广义理解,例如,可以是固定连接,也可以是可拆卸连接,或一体地连接;可以是机械连接,也可以是电连接;可以是直接相连,也可以通过中间媒介间接相连,可以是两个元件内部的连通。对于本领域的普通技术人员而言,可以具体情况理解上述术语在本发明中的具体含义。
此外,下面所描述的本发明不同实施方式中所涉及的技术特征只要彼此之间未构成冲突就可以相互结合。
以下结合具体实施例,对本发明进行了详细说明。
具体实施例一:
根据图1至图3所示,本发明为解决上述技术问题采取的具体优化技术方案是:本发明涉及一种基于不确定表征的无人机飞行数据异常检测方法。
本发明提供一种基于不确定表征的无人机飞行数据异常检测方法,包括以下步骤:
步骤1:对无人机飞行数据进行处理,包括数据标准化、数据重构和数据集划分;
步骤2:根据处理后的数据,建立不确定表征预测模型;
步骤3:基于建立的不确定表征预测模型,确定异常检测的阈值,根据阈值对无人机飞行数据进行异常检测。
具体实施例二:
本申请实施例二与实施例一的区别仅在于:
所述步骤1具体为:
记输入飞行数据为Xmultiple=[X1,X2,...,Xp],其中,p是架次数量,Xi为单个架次的飞行数据,Xi=[x1,x2,···,xn],xi∈R,被监测参数为Ymultiple=[Y1,Y2,...,Yp],其中Yi=[y1,y2,···,yn],yi∈R,其中n为样本总长度;
对无人机飞行数据进行标准化处理,将多架次数据进行统一标准化,方法如下:
其中,μmultiple是输入数据Xmultiple的均值,σmultiple是输入数据Xmultiple的标准差;
对数据进行重构处理,为避免不同架次的飞行数据信息混杂,对各个架次的飞行数据进行分开重构;记重构的窗口长度为l,步长为1,当第t时刻的某个架次输入数据为Xt=[xt-l+1,xt-l+2,···,xt],则重构后的数据为:
其中,m为输入飞行数据的参数维度。
具体实施例三:
本申请实施例三与实施例二的区别仅在于:
采用基于贝叶斯理论的Monte Carlo Dropout和集成学习相结合的方式引入模型的不确定表征能力;其中,集成学习模型由多个基预测模型构成,通过引入Bagging的思想为模型引入多架次飞行数据不确定表征能力;
为使各个基预测模型真正独立,在学习的过程中以架次为单位进行数据集采样,使得各基预测模型的训练数据各不相同,由此降低模型之间的关联性;
由于飞行数据架次数量有限,为保证充分利用飞行数据,对各个架次的数据进行两两组合,从m个架次的飞行数据集中采样,每次采样选出两个架次的飞行数据,即可得到多次有放回采样后去掉重复采样结果的所有数据集,共K个,其中,将采样好的训练集记为{(Ytra-1,Xtra-1),(Ytra-2,Xtra-2),...,(Ytra-K,Xtra-K)},其中训练集的各组数据集中均包含两个架次的飞行数据。
具体实施例四:
本申请实施例四与实施例三的区别仅在于:
采样后的数据集按照架次5:1划分为训练集和测试集,对应测试集记为{Ytest,Xtest}。
具体实施例五:
本申请实施例五与实施例四的区别仅在于:
所述步骤2具体为:
步骤2.1:基于LSTM建立预测模型,融合Monte Carlo Dropout和集成学习的思想,为模型引入不确定表征能力,将数据处理过程中所划分好的多个数据集分别输入多个不同的LSTM模型进行训练,每组建立一个引入Monte Carlo Dropout的LSTM预测模型;
步骤2.2:基于Monte Carlo Dropout将LSTM模型的各权重参数设置为伯努利分布,在训练的过程中,通过对训练集飞行数据对相应MC LSTM网络中的参数不断进行蒙特卡洛采样,优化模型中的各个参数,获取其后验分布,所得分布即为训练结果,如模型中的参数最终训练所得结果如下式所示:
q(wk)=P(wk,(Ytra-k|Xtra-k)) (1)
其中,wk为第k个MCLSTM中的参数,(Ytra-k|Xtra-k)为第k组训练集数据;
步骤2.3:将由各组数据训练好的MCLSTM模型作为集成学习中的基学习器,通过各个基学习器的预测结果结合获取不确定表征结果;具体选择平均法进行模型的结合,即为各个模型赋予相同的权重;将Xtest输入各个MC LSTM模型中,各个基学习器先进行多次蒙特卡洛采样,并将各个模型每次采样所得的预测结果赋予相同的权重,将所有模型多次采样所得的结果进行统计,得到最终的结果集,记为其中K是集成学习中模型数量,/>是第k个模型多次蒙特卡洛采样所得预测结果集合,记为/>其中,T是蒙特卡洛采样次数,/>是第t次采样所得的预测结果通过下式表示:
其中,wk为第k个MCLSTM中的参数。
具体实施例六:
本申请实施例六与实施例五的区别仅在于:
所述步骤3具体为:
将Xtest输入训练完成的一组MCLSTM预测模型中,并基于蒙特卡洛思想对各模型进行多次蒙特卡洛采样,基于平均法思想对于各模型预测结果赋予相同的权值,进而对结果进行统计,获取最终所得的预测结果的后验分布,分布的参数通过下式表示:
其中,K是集成学习中模型数量,T是蒙特卡洛采样次数,是第k个模型第t次采样所得的预测结果。
具体实施例七:
本申请实施例七与实施例六的区别仅在于:
根据MC LSTM模型预测所得分布,在异常检测过程中基于拉伊达准则确定μ±3*σ以内为正常运行状态下各个参数的分布范围,在高斯分布中,99.6%的正常点都在位于该范围中,将μ±3*σ作为异常检测的阈值,通过对比实际观测点与该阈值的对比结果检测异常值,将超出范围的点定义为异常值,否则记为正常结果,由此实现异常检测。
具体实施例八:
本申请实施例八与实施例七的区别仅在于:
本发明提供一种基于不确定表征的无人机飞行数据异常检测系统,包括:
数据处理模块,所述数据处理模块对无人机飞行数据进行处理,包括数据标准化、数据重构和数据集划分;
模型建立模块,所述模型建立模块根据处理后的数据,建立不确定表征预测模型;
异常检测模块,所述异常检测模块基于建立的不确定表征预测模型,确定异常检测的阈值,根据阈值对无人机飞行数据进行异常检测。
本发明为解决数据不确定性导致现有基于预测的异常检测技术高虚警率的问题,设计提出了一种基于不确定表征的无人机飞行数据异常检测方法。本发明主要通过对数据不确定性进行量化,构建一种基于不确定表征的无人机飞行数据异常检测方法,目前常用的不确定表征方法有基于贝叶斯理论和基于集成学习的两大类,基于贝叶斯理论的方法只需要训练一个模型,时间开销低,但是对于模型自身的预测效果要求较高,可以用于单架次飞行数据的不确定性表征,基于集成学习的方法对于单个模型的容错性较好,但建模耗时长,可以用于多架次飞行数据的不确定性表征,为集合两类思想的优点,本发明提出的方法将采用贝叶斯理论与集成学习相结合的方式为预测模型引入不确定表征能力。同时,由于飞行数据为多元时间序列,数据间同时具备时间与空间关联性,为更好地捕捉数据之间的相关关系,本发明基于长短期记忆网络(long short-termmemory,LSTM)建立预测模型,融合基于贝叶斯理论的MonteCarlo Dropout和集成学习中的平均思想,为上述预测模型建立不确定表征能力,提高模型的异常检测能力,降低虚警率。
具体实施例九:
本申请实施例九与实施例八的区别仅在于:
本发明提供一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行,以用于实现如一种基于不确定表征的无人机飞行数据异常检测方法。
本发明为解决数据不确定性导致现有基于预测的异常检测技术高虚警率的问题,设计提出了一种基于不确定表征的无人机飞行数据异常检测方法。本发明主要通过对数据不确定性进行量化,构建一种基于不确定表征的无人机飞行数据异常检测方法,目前常用的不确定表征方法有基于贝叶斯理论和基于集成学习的两大类,基于贝叶斯理论的方法只需要训练一个模型,时间开销低,但是对于模型自身的预测效果要求较高,可以用于单架次飞行数据的不确定性表征,基于集成学习的方法对于单个模型的容错性较好,但建模耗时长,可以用于多架次飞行数据的不确定性表征,为集合两类思想的优点,本发明提出的方法将采用贝叶斯理论与集成学习相结合的方式为预测模型引入不确定表征能力。同时,由于飞行数据为多元时间序列,数据间同时具备时间与空间关联性,为更好地捕捉数据之间的相关关系,本发明基于长短期记忆网络(long short-term memory,LSTM)建立预测模型,融合基于贝叶斯理论的Monte Carlo Dropout和集成学习中的平均思想,为上述预测模型建立不确定表征能力,提高模型的异常检测能力,降低虚警率。
具体实施例十:
本申请实施例十与实施例九的区别仅在于:
本发明提供一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其所述处理器执行所述计算机程序时实现一种基于不确定表征的无人机飞行数据异常检测方法。
所述方法包括
预测模型基于多架次历史飞行数据建立,主要包括数据处理、不确定表征预测建模、阈值确定和异常检测等多个步骤,具体流程如下:
步骤1:数据处理:
数据处理主要包括数据标准化、数据重构和数据集划分。假设输入飞行数据为Xmultiple=[X1,X2,...,Xp],其中p是架次数量,Xi为单个架次的飞行数据,Xi=[x1,x2,···,xn],xi∈R,被监测参数为Ymultiple=[Y1,Y2,...,Yp],其中Yi=[y1,y2,···,yn],yi∈R,其中n为样本总长度,由于输入数据涉及诸多参数,不同参数之间量纲不同使模型不易收敛,为了加快模型收敛速度,本发明首先对无人机飞行数据进行标准化处理,为避免不同架次飞行数据之间数值分布差异对结果造成影响,将多架次数据进行统一标准化,方法如下:
其中,μmultiple是输入数据Xmultiple的均值,σmultiple是输入数据Xmultiple的标准差。
为更全面的获取数据的时空关联信息,本文将对数据进行重构处理,同时,为避免不同架次的飞行数据信息混杂,对各个架次的飞行数据进行分开重构。假设重构的窗口长度为l,步长为1,若第t时刻的某个架次输入数据为Xt=[xt-l+1,xt-l+2,···,xt],则重构后的数据为:
其中,m为输入飞行数据的参数维度。
本发明在基于不确定表征进行异常检测的过程中,采用基于贝叶斯理论的MonteCarlo Dropout和集成学习相结合的方式引入模型的不确定表征能力。其中,集成学习模型由多个基预测模型构成,通过引入Bagging的思想为模型引入多架次飞行数据不确定表征能力。为使各个基预测模型真正独立,在学习的过程中以架次为单位进行数据集采样,使得各基预测模型的训练数据各不相同,由此降低模型之间的关联性。以架次为单位进行数据集的划分的原因主要是可以在一定程度上提高模型的泛化能力,并尽可能节约训练时间。由于飞行数据架次数量有限,为保证充分利用飞行数据,对各个架次的数据进行两两组合。假设从m个架次的飞行数据集中采样,每次采样选出两个架次的飞行数据,即可得到多次有放回采样后去掉重复采样结果的所有数据集,共K个,其中将采样好的训练集记为{(Ytra-1,Xtra-1),(Ytra-2,Xtra-2),...,(Ytra-K,Xtra-K)},其中训练集的各组数据集中均包含两个架次的飞行数据。在本发明中采样后的数据集按照架次5:1划分为训练集和测试集,对应测试集记为{Ytest,Xtest}。
步骤2:不确定表征预测建模:
基于LSTM建立预测模型,融合Monte Carlo Dropout和集成学习的思想,为模型引入不确定表征能力。将数据处理过程中所划分好的多个数据集分别输入多个不同的LSTM模型进行训练,每组建立一个引入Monte Carlo Dropout的LSTM(MC LSTM)预测模型。
基于Monte Carlo Dropout将LSTM模型的各权重参数设置为伯努利分布,在训练的过程中,通过对训练集飞行数据对相应MC LSTM网络中的参数不断进行蒙特卡洛采样,优化模型中的各个参数,获取其后验分布,所得分布即为训练结果,如模型中的参数最终训练所得结果如下式所示。
q(wk)=P(wk,(Ytra-k|Xtra-k)) (1)
其中wk为第k个MCLSTM中的参数,(Ytra-k|Xtra-k)为第k组训练集数据。
将由各组数据训练好的MCLSTM模型作为集成学习中的基学习器,通过各个基学习器的预测结果结合获取不确定表征结果。具体选择平均法进行模型的结合,即为各个模型赋予相同的权重。将Xtest输入各个MCLSTM模型中,此时,各个基学习器先进行多次蒙特卡洛采样,并将各个模型每次采样所得的预测结果赋予相同的权重,将所有模型多次采样所得的结果进行统计,得到最终的结果集,记为其中K是集成学习中模型数量,是第k个模型多次蒙特卡洛采样所得预测结果集合,记为/>其中T是蒙特卡洛采样次数,/>是第t次采样所得的预测结果:
其中wk为第k个MCLSTM中的参数。
步骤3:确定异常检测的阈值:
将Xtest输入上述训练完成的一组MCLSTM预测模型中,并基于蒙特卡洛思想对各模型进行多次蒙特卡洛采样,基于平均法思想对于各模型预测结果赋予相同的权值,进而对结果进行统计,获取最终所得的预测结果的后验分布,该分布的参数如下式所示。
其中K是集成学习中模型数量,T是蒙特卡洛采样次数,是第k个模型第t次采样所得的预测结果。
由上式可得这组MCLSTM模型预测所得分布,在异常检测过程中基于拉伊达准则确定μ±3*σ以内为正常运行状态下各个参数的分布范围,由统计学知识可知,在高斯分布中,99.6%的正常点都在位于该范围中,因此将μ±3*σ作为异常检测的阈值,通过对比实际观测点与该阈值的对比结果检测异常值,将超出范围的点定义为异常值,否则记为正常结果,由此实现异常检测。
本发明主要通过对数据不确定性进行量化,构建一种基于不确定表征的无人机飞行数据异常检测方法,目前常用的不确定表征方法有基于贝叶斯理论和基于集成学习两大类,基于贝叶斯理论的方法只需要训练一个模型,时间开销低,但是对于模型自身的预测效果要求较高,可以用于单架次飞行数据的不确定性表征,基于集成学习的方法对于单个模型的容错性较好,但建模耗时长,可以用于多架次飞行数据的不确定性表征,,为集合两类思想的优点,本发明提出的方法将采用贝叶斯理论与集成学习相结合的方式为预测模型引入不确定表征能力。同时,由于飞行数据为多元时间序列,数据间同时具备时间与空间关联性,为更好地捕捉数据间相关关系,本发明基于长短期记忆网络(long short-termmemory,LSTM)建立预测模型,融合基于贝叶斯理论中的MonteCarlo Dropout和集成学习中的平均思想,为上述预测模型建立不确定表征能力,提高模型的异常检测能力,降低虚警率。
具体实施例十一:
本申请实施例十一与实施例十的区别仅在于:
(1)实验数据
实验中所用数据参数如下表所示。
表1无人机飞行数据列表及各参数单位
本案例的实验数据为无人机的6个架次真实飞行数据,数据涉及直飞、左转、右转三个飞行阶段,选择前5个架次为训练集数据,并组合可得10组测试数据集,建立10个带有不确定表征能力的基线模型,训练集与测试集中各架次飞行数据均为10000个样本点。
(2)评价指标
本方法对参数表征进行预测,再根据预测结果与实际观测结果对比确定异常点,因此评价指标应包含预测效果和异常检测效果两部分,将所得预测分布的均值作为预测结果,采用确定系数(R-square,R2)作为预测效果的评价指标,R2是预测数据和原始数据均值残差的平方和与原始数据和原始数据均值残差的平方和的比值,表示原始数据的波动可以被拟合数据的波动所表征的可能性,因此可以用于衡量预测结果对于实际理想观测点预测的可信程度。为测试数据注入数值为测试集整体数据的0.15倍极差的异常,并将异常数据标记为正样本,未注入异常数据标记为负样本,检测为异常的点为正,反之为负。计算公式如下式所示。
确定系数:
准确率:
式中,yreal为真实值;为相应的预测值;/>为真值的平均值。TruePos为真实值为正预测值也为正;TruNeg为真实值为负且预测值也为负;FalsePos为真实值为负预测值为正;FalseNeg为真实值为正,预测值为负。
(3)实验结果
实验中以横滚角作为待监测测试,其余作为输入参数,状态监测与异常监测的结果分别如下图2和图3所示。在未注入异常的测试集上,发明的方法对于横滚角的状态监测确定系数为0.99,表现出较好的预测性能。在注入异常的测试集上,对正常状态的预测结果在上下限阈值区间内部,而实际测量值由于存在异常,则超出了上下限阈值区间,本发明中基于不确定表征的异常检测方法对于横滚角的异常检测准确率为0.98,虚警率为0.003,表现出了较好的异常检测性能。
上述结果看出,本文所提出的基于不确定表征的无人机飞行数据异常方法可以较好的对于无人机飞行数据中各个参数的表现进行较好的预测,并准确可靠的判读出异常数据,从而判断出无人机的运行状态。
在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不必须针对的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任一个或N个实施例或示例中以合适的方式结合。此外,在不相互矛盾的情况下,本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。此外,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。在本发明的描述中,“N个”的含义是至少两个,例如两个,三个等,除非另有明确具体的限定。流程图中或在此以其他方式描述的任何过程或方法描述可以被理解为,表示包括一个或更N个用于实现定制逻辑功能或过程的步骤的可执行指令的代码的模块、片段或部分,并且本发明的优选实施方式的范围包括另外的实现,其中可以不按所示出或讨论的顺序,包括根据所涉及的功能按基本同时的方式或按相反的顺序,来执行功能,这应被本发明的实施例所属技术领域的技术人员所理解。在流程图中表示或在此以其他方式描述的逻辑和/或步骤,例如,可以被认为是用于实现逻辑功能的可执行指令的定序列表,可以具体实现在任何计算机可读介质中,以供指令执行系统、装置或设备(如基于计算机的系统、包括处理器的系统或其他可以从指令执行系统、装置或设备取指令并执行指令的系统)使用,或结合这些指令执行系统、装置或设备而使用。就本说明书而言,"计算机可读介质"可以是任何可以包含、存储、通信、传播或传输程序以供指令执行系统、装置或设备或结合这些指令执行系统、装置或设备而使用的装置。计算机可读介质的更具体的示例(非穷尽性列表)包括以下:具有一个或N个布线的电连接部(电子装置),便携式计算机盘盒(磁装置),随机存取存储器(RAM),只读存储器(ROM),可擦除可编辑只读存储器(EPROM或闪速存储器),光纤装置,以及便携式光盘只读存储器(CDROM)。另外,计算机可读介质甚至可以是可在其上打印所述程序的纸或其他合适的介质,因为可以例如通过对纸或其他介质进行光学扫描,接着进行编辑、解译或必要时以其他合适方式进行处理来以电子方式获得所述程序,然后将其存储在计算机存储器中。应当理解,本发明的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式中,N个步骤或方法可以用存储在存储器中且由合适的指令执行系统执行的软件或固件来实现。如,如果用硬件来实现和在另一实施方式中一样,可用本领域公知的下列技术中的任一项或他们的组合来实现:具有用于对数据信号实现逻辑功能的逻辑门电路的离散逻辑电路,具有合适的组合逻辑门电路的专用集成电路,可编程门阵列(PGA),现场可编程门阵列(FPGA)等。
以上所述仅是一种基于不确定表征的无人机飞行数据异常检测方法的优选实施方式,一种基于不确定表征的无人机飞行数据异常检测方法的保护范围并不仅局限于上述实施例,凡属于该思路下的技术方案均属于本发明的保护范围。应当指出,对于本领域的技术人员来说,在不脱离本发明原理前提下的若干改进和变化,这些改进和变化也应视为本发明的保护范围。

Claims (10)

1.一种基于不确定表征的无人机飞行数据异常检测方法,其特征是:包括以下步骤:
步骤1:对无人机飞行数据进行处理,包括数据标准化、数据重构和数据集划分;
步骤2:根据处理后的数据,建立不确定表征预测模型;
步骤3:基于建立的不确定表征预测模型,确定异常检测的阈值,根据阈值对无人机飞行数据进行异常检测。
2.根据权利要求1所述的方法,其特征是:所述步骤1具体为:
记输入飞行数据为Xmultiple=[X1,X2,...,Xp],其中,p是架次数量,Xi为单个架次的飞行数据,Xi=[x1,x2,···,xn],xi∈R,被监测参数为Ymultiple=[Y1,Y2,...,Yp],其中Yi=[y1,y2,···,yn],yi∈R,其中n为样本总长度;
对无人机飞行数据进行标准化处理,将多架次数据进行统一标准化,方法如下:
其中,μmultiple是输入数据Xmultiple的均值,σmultiple是输入数据Xmultiple的标准差;
对数据进行重构处理,为避免不同架次的飞行数据信息混杂,对各个架次的飞行数据进行分开重构;令重构的窗口长度为l,步长为1,当第t时刻的某个架次输入数据为Xt=[xt-l+1,xt-l+2,···,xt],则重构后的数据为:
其中,m为输入飞行数据的参数维度。
3.根据权利要求2所述的方法,其特征是:基于不确定表征进行异常检测的过程中,采用基于贝叶斯理论的MonteCarloDropout和集成学习相结合的方式引入模型的不确定表征能力;其中,集成学习模型由多个基预测模型构成,通过引入Bagging的思想为模型引入多架次飞行数据不确定表征能力;
为使各个基预测模型真正独立,在学习的过程中以架次为单位进行数据集采样,使得各基预测模型的训练数据各不相同,由此降低模型之间的关联性;
由于飞行数据架次数量有限,为保证充分利用飞行数据,对各个架次的数据进行两两组合,从m个架次的飞行数据集中采样,每次采样选出两个架次的飞行数据,即可得到多次有放回采样后去掉重复采样结果的所有数据集,共K个,其中,将采样好的训练集记为{(Ytra-1,Xtra-1),(Ytra-2,Xtra-2),...,(Ytra-K,Xtra-K)},其中训练集的各组数据集中均包含两个架次的飞行数据。
4.根据权利要求3所述的方法,其特征是:采样后的数据集按照架次5:1划分为训练集和测试集,对应测试集记为{Ytest,Xtest}。
5.根据权利要求4所述的方法,其特征是:所述步骤2具体为:
步骤2.1:基于LSTM建立预测模型,融合Monte Carlo Dropout和集成学习的思想,为模型引入不确定表征能力,将数据处理过程中所划分好的多个数据集分别输入多个不同的LSTM模型进行训练,每组建立一个引入Monte Carlo Dropout的LSTM预测模型;
步骤2.2:基于Monte Carlo Dropout将LSTM模型的各权重参数设置为伯努利分布,在训练的过程中,通过对训练集飞行数据对相应MCLSTM网络中的参数不断进行蒙特卡洛采样,优化模型中的各个参数,获取其后验分布,所得分布即为训练结果,如模型中的参数最终训练所得结果如下式所示:
q(wk)=P(wk,(Ytra-k|Xtra-k)) (1)
其中,wk为第k个MCLSTM中的参数,(Ytra-k|Xtra-k)为第k组训练集数据;
步骤2.3:将由各组数据训练好的MCLSTM模型作为集成学习中的基学习器,通过各个基学习器的预测结果结合获取不确定表征结果;具体选择平均法进行模型的结合,即为各个模型赋予相同的权重;将Xtest输入各个MCLSTM模型中,各个基学习器先进行多次蒙特卡洛采样,并将各个模型每次采样所得的预测结果赋予相同的权重,将所有模型多次采样所得的结果进行统计,得到最终的结果集,记为其中K是集成学习中模型数量,是第k个模型多次蒙特卡洛采样所得预测结果集合,记为/>其中,T是蒙特卡洛采样次数,/>是第t次采样所得的预测结果通过下式表示:
其中,wk为第k个MCLSTM中的参数。
6.根据权利要求5所述的方法,其特征是:所述步骤3具体为:
将Xtest输入训练完成的一组MCLSTM预测模型中,并基于蒙特卡洛思想对各模型进行多次蒙特卡洛采样,基于平均法思想对于各模型预测结果赋予相同的权值,进而对结果进行统计,获取最终所得的预测结果的后验分布,分布的参数通过下式表示:
其中,K是集成学习中模型数量,T是蒙特卡洛采样次数,是第k个模型第t次采样所得的预测结果。
7.根据权利要求6所述的方法,其特征是:根据MCLSTM模型预测所得分布,在异常检测过程中基于拉伊达准则确定μ±3*σ以内为正常运行状态下各个参数的分布范围,在高斯分布中,99.6%的正常点都在位于该范围中,将μ±3*σ作为异常检测的阈值,通过对比实际观测点与该阈值的对比结果检测异常值,将超出范围的点定义为异常值,否则记为正常结果,由此实现异常检测。
8.一种基于不确定表征的无人机飞行数据异常检测系统,其特征是:包括:
数据处理模块,所述数据处理模块对无人机飞行数据进行处理,包括数据标准化、数据重构和数据集划分;
模型建立模块,所述模型建立模块根据处理后的数据,建立不确定表征预测模型;
异常检测模块,所述异常检测模块基于建立的不确定表征预测模型,确定异常检测的阈值,根据阈值对无人机飞行数据进行异常检测。
9.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行,以用于实现如权利要求1-7的方法。
10.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征是:所述处理器执行所述计算机程序时实现权利要求1-7的方法。
CN202310447012.8A 2023-04-24 2023-04-24 一种基于不确定表征的无人机飞行数据异常检测方法 Pending CN116467950A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310447012.8A CN116467950A (zh) 2023-04-24 2023-04-24 一种基于不确定表征的无人机飞行数据异常检测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310447012.8A CN116467950A (zh) 2023-04-24 2023-04-24 一种基于不确定表征的无人机飞行数据异常检测方法

Publications (1)

Publication Number Publication Date
CN116467950A true CN116467950A (zh) 2023-07-21

Family

ID=87184052

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310447012.8A Pending CN116467950A (zh) 2023-04-24 2023-04-24 一种基于不确定表征的无人机飞行数据异常检测方法

Country Status (1)

Country Link
CN (1) CN116467950A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116993010A (zh) * 2023-07-28 2023-11-03 南通大学 一种基于贝叶斯神经网络的固定翼无人机态势预测方法
CN117596598A (zh) * 2024-01-19 2024-02-23 国网冀北电力有限公司 一种无人机通讯协议数据异常检测方法

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116993010A (zh) * 2023-07-28 2023-11-03 南通大学 一种基于贝叶斯神经网络的固定翼无人机态势预测方法
CN116993010B (zh) * 2023-07-28 2024-02-06 南通大学 一种基于贝叶斯神经网络的固定翼无人机态势预测方法
CN117596598A (zh) * 2024-01-19 2024-02-23 国网冀北电力有限公司 一种无人机通讯协议数据异常检测方法
CN117596598B (zh) * 2024-01-19 2024-03-29 国网冀北电力有限公司 一种无人机通讯协议数据异常检测方法

Similar Documents

Publication Publication Date Title
CN116467950A (zh) 一种基于不确定表征的无人机飞行数据异常检测方法
CN113344134B (zh) 一种低压配电监控终端数据采集异常检测方法及系统
Jouin et al. Prognostics of PEM fuel cell in a particle filtering framework
Coble et al. Applying the general path model to estimation of remaining useful life
CN109816031B (zh) 一种基于数据不均衡度量的变压器状态评估聚类分析方法
CN113702895B (zh) 一种电压互感器误差状态在线定量评估方法
CN107329088A (zh) 电池的健康状态诊断装置和方法
CN108199891B (zh) 一种基于人工神经网络多角度综合决策的cps网络攻击辨识方法
CN111028939A (zh) 一种基于深度学习的多组学智能诊断系统
CN113884961A (zh) Soc校准方法、建模方法、建模装置、计算机设备及介质
CN111126489A (zh) 一种基于集成学习的输电设备状态评价方法
CN108051364A (zh) 一种epr核能电缆剩余寿命评估方法与预测epr核能电缆剩余使用寿命方法
CN115983084A (zh) 一种燃料电池剩余使用寿命预测方法、系统、设备及终端
CN116610998A (zh) 一种基于多模态数据融合的开关柜故障诊断方法和系统
CN104317778A (zh) 基于海量监测数据的变电设备故障诊断方法
Stepančič et al. Fault detection of fuel cell systems based on statistical assessment of impedance data
CN117491813A (zh) 新能源汽车动力电池系统绝缘异常检测方法
CN106054859B (zh) 基于修正型独立元分析的双层集成式工业过程故障检测方法
CN111260823B (zh) 基于i/o测点故障依赖矩阵的故障诊断方法
CN117036103A (zh) 基于lstm循环神经网络的电力系统运行态势预测方法
CN116520068A (zh) 一种电力数据的诊断方法、装置、设备及存储介质
CN116702005A (zh) 一种基于神经网络的数据异常诊断方法和电子设备
CN114487643A (zh) 一种特高压gil设备现场交接验收综合测试平台
CN115130505A (zh) 基于改进残差收缩网络的focs故障诊断方法
CN106125643A (zh) 一种基于机器学习技术的工控安防方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination