CN112381965A - 一种基于数据挖掘的航空发动机健康状态识别系统及方法 - Google Patents

一种基于数据挖掘的航空发动机健康状态识别系统及方法 Download PDF

Info

Publication number
CN112381965A
CN112381965A CN202011211044.0A CN202011211044A CN112381965A CN 112381965 A CN112381965 A CN 112381965A CN 202011211044 A CN202011211044 A CN 202011211044A CN 112381965 A CN112381965 A CN 112381965A
Authority
CN
China
Prior art keywords
state
engine
data
aircraft engine
characteristic
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202011211044.0A
Other languages
English (en)
Inventor
万安平
陈挺
颜孙挺
王文晖
杨洁
常庆
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhejiang University City College ZUCC
Original Assignee
Zhejiang University City College ZUCC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhejiang University City College ZUCC filed Critical Zhejiang University City College ZUCC
Priority to CN202011211044.0A priority Critical patent/CN112381965A/zh
Publication of CN112381965A publication Critical patent/CN112381965A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G07CHECKING-DEVICES
    • G07CTIME OR ATTENDANCE REGISTERS; REGISTERING OR INDICATING THE WORKING OF MACHINES; GENERATING RANDOM NUMBERS; VOTING OR LOTTERY APPARATUS; ARRANGEMENTS, SYSTEMS OR APPARATUS FOR CHECKING NOT PROVIDED FOR ELSEWHERE
    • G07C5/00Registering or indicating the working of vehicles
    • G07C5/08Registering or indicating performance data other than driving, working, idle, or waiting time, with or without registering driving, working, idle or waiting time
    • G07C5/0808Diagnosing performance data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/21Design, administration or maintenance of databases
    • G06F16/215Improving data quality; Data cleansing, e.g. de-duplication, removing invalid entries or correcting typographical errors
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2458Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
    • G06F16/2465Query processing support for facilitating data mining operations in structured databases
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • G06F18/232Non-hierarchical techniques
    • G06F18/2321Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
    • G06F18/23213Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/044Recurrent networks, e.g. Hopfield networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/048Activation functions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Software Systems (AREA)
  • Mathematical Physics (AREA)
  • Computational Linguistics (AREA)
  • Evolutionary Computation (AREA)
  • Computing Systems (AREA)
  • Databases & Information Systems (AREA)
  • General Health & Medical Sciences (AREA)
  • Biophysics (AREA)
  • Biomedical Technology (AREA)
  • Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Probability & Statistics with Applications (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Fuzzy Systems (AREA)
  • Quality & Reliability (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种基于数据挖掘的航空发动机健康状态识别系统及方法,利用一种综合的特征筛选方法对工况数据进行挖掘分析,得到影响航空发动机稳定的关键参数,作为航空发动机健康状态评估的指标;基于确定的航空发动机健康状态评估的指标,对工况状态进行聚类挖掘分析,得到的各个工况簇的特点,获得历史工况中的状态分布情况,定义历史工况中的运行状态类别;然后利用深度学习算法对航空发动机状态评估指标特征获取模块中确定的特征值训练模型,对参数的变化趋势进行预测,用预测值辅助状态识别。本发明具有较高的识别精度和泛化能力,性能好,适用于航空发动机的健康状态识别和诊断。

Description

一种基于数据挖掘的航空发动机健康状态识别系统及方法
技术领域
本发明涉及航空发动机的健康状态识别和诊断,特别涉及一种基于数据挖掘的航空发动机健康状态识别系统与方法。
背景技术
航空发动机作为飞机的心脏,是飞机中最重要的部件之一,其安全性和可靠性对飞机的运行影响重大。而且航空发动机一般在高温、高压、高转速、高负荷等严苛条件下长时间反复工作,因此其可靠性受到严峻考验。航空发动机维修工作面广、工种复杂、专业性强、安全责任重大,是一种与现代多数高新技术紧密相关的新型技术领域,人们对其的关注也日渐加深。根据统计,我国某10年的飞行事故中,25%是由于机械与机务原因,其中的60%则由发动机故障引起。发动机振动监控问题却是一个非常复杂的问题,长期以来一直受到发动机设计部门、生产厂商和用户的重视。对航空发动机振动故障的监控与故障诊断主要用于识别发动机结构系统,特别是转子系统的机械状态和故障。通常认为,振动信息所包含的结构系统的机械状态信息最为丰富,能最全面地反映结构系统的状态。航空发动机的故障可能导致灾难性后果,因此其要求非常高的可靠性与安全性。
发明内容
为了更好的实现航空发动机健康状态识别和诊断,本发明提供一种基于数据挖掘的航空发动机健康状态识别系统与方法。具体技术方案如下:
一种基于数据挖掘的航空发动机健康状态识别系统,包括:数据预处理模块、航空发动机健康状态评估指标挖掘模块、航空发动机健康状态聚类分析模块、航空发动机状态评估指标特征获取模块、航空发动机实时特征参数预测模块,其中:
数据预处理模块,对航空发动机采集的数据进行异常值处理、空值处理、离散化处理和归一化处理,为数据的挖掘分析做好了准备;
航空发动机健康状态评估指标挖掘模块,利用由随机lasso、岭回归、随机森林、稳定性选择和递归特征消除这五种方法综合组成的特征筛选方法,对工况数据进行挖掘分析,得到影响航空发动机稳定的关键参数,确定振动、料层厚度、发动机压差、发动机出口温度4个参数共同作为航空发动机健康状态评估的指标;
航空发动机健康状态聚类分析模块,基于确定的航空发动机健康状态评估的指标,对工况状态进行聚类挖掘分析,得到稳定模式工况库;
航空发动机状态评估指标特征获取模块,分析航空发动机运行状态下采集的实时数据的特点,确定进行实时状态判断的特征值;
航空发动机实时特征参数预测模块,利用深度学习算法对航空发动机状态评估指标特征获取模块中确定的特征值进行模型训练,预测参数的变化趋势,用预测值辅助状态识别。
进一步地,所述的数据预处理模块中,数据异常值处理、空值处理,通过数据筛选和数据清洗实现。离散化处理和归一化处理,由特征简约和数据变换实现。
进一步地,所述的航空发动机健康状态评估指标挖掘模块中,综合的筛选算法是通过求解输入变量和输出变量之间的关系,分别使用五种方法对每个特征的重要性予以打分,对五种得分情况进行处理,按照处理后的得分结果对特征的重要度进行评估,确定待选特征集中的关键特征。
进一步地,进行航空发动机运行关键特征筛选的具体步骤如下:
1)以振动作为输出y,以其他特征为输入x,分别使用五种方法对待选特征集进行筛选,计算每个特征的得分;
2)不同的方法特征筛选的机制不一样,为消除筛选机制的不同造成的分数差异,对每种方法的得分结果都利用最大最小值的规范化方法进行处理,把得分限制在[0,1]之间,然后求每个参数特征的平均得分,把平均值作为特征重要性排序的依据,进行特征值选择。
3)对参数的综合得分进行分析,结合参数的可控性和实际含义确定影响振动的关键参数。从得分情况看,喂料量、微粉比表、发动机进口压力、主排风机转速、循环风阀开度发动机进口温度的平均值比较低,排除这些得分偏低的特征参数。得分最高的几个参数,按照从高到低的顺序依次为:料层厚度、发动机压差、发动机出口温度、循环风阀开度。
4)根据步骤2)和步骤3)中的分析,评估特征参数的筛选结果。四个得分较高的参数中,发动机压差、料层厚度、航空发动机出口温度三个参数都属于结果变量,参数的取值是在其他可控变量的综合影响下得到的结果。而循环风阀开度是调控变量不适合作为工况状态的判断指标。
进一步地,所述的航空发动机健康状态聚类分析模块,基于确定的航空发动机健康状态评估的指标,结合实际生产经验和工况库中的数据分布,确定了四个稳定判断指标会导致运行异常的临界值,在多个临界值的限定范围内对预处理后的数据进行进一步筛选,求满足所有限制条件的数据,得到的筛选结果作为聚类的输入数据。聚类分析采用的是K-均值(k-means)来发现数据集中的K个工况簇。这里的K是用户指定的,算法的目的是找到数据集中的K个簇的质心,把数据集中的点分配给距离该点最近的质心,并将该点分配给该质心对应的类别。按照对聚类分群中数据状态的定义,完成对已有的运行工况记录的类别标注,把非稳定工况类别标签设置为0,稳定工况标签设置为1和2,并从中提取稳定工况,建立稳定模式工况库。
进一步地,k-means聚类分析选取k=3,得到的类别0定义为非稳定状态,类别1和2中的记录定义为稳定状态。类别0特点:料层厚度的取值范围在125~135mm之间,发动机出口温度在100~108℃,发动机压差在2800~3200Pa,振动值集中在7、8、9三个值附近。类别1特点:料层厚度的取值范围在125~144mm之间,发动机出口温度在95~103℃,发动机压差在2800~3200Pa,振动值集中在6、7、8三个值附近。类别2特点:料层厚度的取值范围在140~150mm之间,发动机出口温度在102~108℃,发动机压差在3200~3500Pa,振动值集中在6、7、8三个值附近。
进一步地,所述的航空发动机状态评估指标特征获取模块,以振动、料层厚度、发动机压差、发动机出口温度这4个状态评估指标的实时数据为基础,计算每个参数在取数窗口时间内的均值、方差和异常值出现次数,把得到的结果作为稳定工况判断的特征变量。
进一步地,所述的航空发动机实时特征参数预测模块,采用长短时记忆循环神经网络(LSTM)对运行状态进行预测,并用得到的预测值辅助状态判断。需要预测的参数包括振动、料层厚度、发动机出口温度、发动机压差、异常值次数,对这五个参数分别训练长短时记忆循环神经网络模型。得到的模型可以检测一段序列是否是平稳序列,给出参数的数值预测,用预测值辅助状态识别。
根据航空发动机工况的特点,由于环境等外部因素和其他参数对振动的联合影响,导致工况序列属于非平稳序列,采用长短时记忆循环神经网络深度学习算法建模,对航空发动机状态评估指标特征获取模块中确定的特征值进行模型训练。输入结构由输入控制门与输入激活层共同组成,根据上一个单元的输出yt-1和本单元的输入xt,选择在新状态中需要记忆的现在的某些信息,计算公式为:
it=σ(Wi·[yt-1,xt]+bi)
Ct′=f(WC·[yt-1,xt]+bC)
其中,it表示输入控制门选择的需要更新的信息,Ct′表示可用于更新的候选值,σ是控制门的激活函数,f是输入和单元状态激活函数,(W,b)分别表示上一个单元的输出yt-1和本单元的输入xt的权重矩阵系数和偏置项。
进一步地,所述的控制门的激活函数为sigmoid函数,输入和单元状态激活函数为tanh函数。
sigmoid函数:
Figure BDA0002758737640000051
tanh函数:
Figure BDA0002758737640000052
一种基于数据挖掘的航空发动机健康状态识别方法,包括如下步骤:
1)利用综合的特征筛选方法对工况数据进行分析,确定影响稳定的关键参数,作为稳定状态的判断指标。分析历史数据中关键参数的取值范围,根据其分布区间,确定触发稳定调控的临界值;
2)以步骤1)中确定的稳定判断指标为特征,对工况状态进行聚类分析,使用基于K-均值的聚类算法对数据进行挖掘,分析聚类挖掘得到的各个工况簇的特点,获得历史工况中的状态分布情况;
3)根据聚类分析的挖掘结果,定义历史工况中的运行状态类别,对工况所属的状态进行类别标注和筛选,得到稳定模式工况库;
4)对航空发动机运行状态下采集的实时数据的特点进行分析,确定进行实时状态判断的特征值;
5)利用深度学习算法对步骤4)中确定的特征值进行模型训练,对参数的变化趋势进行预测,用预测值辅助状态判断。
进一步地,所述的综合的特征筛选方法,包括随机lasso、岭回归、随机森林、稳定性选择和递归特征消除这五种方法。通过求解输入变量和输出变量之间的关系,分别使用五种方法对每个特征的重要性予以打分,对五种得分情况进行处理,按照处理后的得分结果对特征的重要度进行评估,确定待选特征集中的关键特征。
本发明的有益效果主要表现在可以基于一个准确的模型来实时监测航空发动机的健康运行状态,在对设备系统的健康状态进行综合评价,获取了表征健康状态性能参数的基础上,分析性能参数的时间序列,将其变化趋势外扩得到未来一段时间内航空发动机的健康状态变化规律,增加航空发动机的安全可靠性,有利于防止事故发生。本发明具有较高的识别精度和泛化能力,预测误差较低,预测效果良好。
附图说明
图1为基于数据挖掘的航空发动机健康状态识别系统结构示意图。
图2为航空发动机数据的预处理过程图。
图3为航空发动机健康状态评估指标挖掘过程图。
图4为航空发动机健康状态K-means聚类分析流程图。
图5为k=3时,聚类分析分群的参数分布概率密度图,(a)为类别0,(b)为类别1,(c)为类别2。
图6为航空发动机状态评估指标特征获取流程图。
图7为航空发动机实时特征参数预测的时间序列建模过程图。
图8为振动一段时间内的原始序列图。
图9为振动一段时间内的原始序列一阶差分后的偏自相关图。
图10为系统的预测值和实际值的关系图。
具体实施方式
参考附图能更加全面地描述本发明,图上显示本发明的某些实施例,但是并非所有的实施例。实际上,本发明可以以很多不同的形式被体现,不应该把它看作仅限于这里所阐述的实施例,而应该把本发明的实施例看作是为了使本发明公开的内容满足可应用的合法要求而提供的。下面结合说明书附图和具体实现方式对本发明内容作详细说明说明。
图1列出了基于数据挖掘的航空发动机健康状态识别系统各模块的功能以及各模块之间的逻辑关系。
数据预处理模块,对航空发动机采集的数据进行异常值处理、空值处理、离散化处理和归一化处理,为数据的挖掘分析做好了准备;
航空发动机健康状态评估指标挖掘模块,利用一种综合的特征筛选方法对工况数据进行挖掘分析,得到影响航空发动机稳定的关键参数,作为航空发动机健康状态评估的指标;
航空发动机健康状态聚类分析模块,基于确定的航空发动机健康状态评估的指标,对工况状态进行聚类挖掘分析,得到稳定模式工况库;
航空发动机状态评估指标特征获取模块,分析航空发动机运行状态下采集的实时数据的特点,确定进行实时状态判断的特征值;
航空发动机实时特征参数预测模块,利用深度学习算法对航空发动机状态评估指标特征获取模块中确定的特征值进行模型训练,预测参数的变化趋势,用预测值辅助状态识别。
如图2所示为航空发动机数据的预处理过程图。数据质量对数据挖掘的分析结果有很大影响。获取的航空发动机原始数据中包含了大量属性,存在错误值和异常值,需要对数据进行初步筛选,去除错误值和异常值,确保数据的准确性,并去除与挖掘无关的属性,而且要保证样本数据的多样性和特征信息的完备性。此外,还需要根据算法需求对数据进行处理,使数据满足算法的输入要求。
所述的数据预处理模块中,数据异常值处理、空值处理,通过数据筛选和数据清洗实现:已有数据中包含了航空发动机供料、研磨、供风设备、粉尘分离设备、液压站、热风炉、仓库等部分的65个测点获得的参数属性。经过属性筛选后从65个属性得到包含航空发动机的30个主要工艺和性能参数的属性子集,包括航空发动机的振动、喂料量、电流、研磨压力、料层厚度,供风系统冷热风阀的开度、循环风阀的开度,选粉机转速、各主要电流等。在航空发动机启动、停机以及故障发生前后,由于工况非常不稳定,参数会剧烈波动。而且航空发动机数据中存在记录缺失、异常和记录错误的情况。有的记录缺失某些参数值,有的是人工录入错误或传感器故障等因素导致的数据偏差、缺失或异常。为了排除这些因素对数据的干扰,必须对这些缺失记录和错误值进行处理,确保数据的正确、可信,这样才能保证挖掘结果的可靠和有效性。
所述的数据预处理模块中,离散化处理和归一化处理,由特征简约和数据变换实现:综合考虑航空发动机数据的特征分布、企业对参数的人为设置,以及实际运行中参数的可控性等情况,对数据进行简约,以降低数据的维度,节约数据处理时间。在经过特征简约的剩余14特征参数中,包含了发动机主机电流、选粉机电流、主排风机电流三个主要电流参数。由于在降低能耗时更关心的是整体生产能耗的减少,而非单个部分的能耗变化,因此构造一个新的属性用来表征耗电的大小,命名为总电流。总电流的值等于发动机主机电流、选粉机电流、主排风机电流的代数和。这样待选特征集简化到12个特征。
如图3所示为航空发动机健康状态评估指标挖掘过程图,具体挖掘步骤如下:
1)以振动作为输出y,以其他特征为输入x,分别使用五种方法对待选特征集进行筛选,计算每个特征的得分;
2)不同的方法特征筛选的机制不一样,为消除筛选机制的不同造成的分数差异,对每种算法的得分结果都利用最大最小值的规范化方法进行了处理,把得分限制在了[0,1]之间,然后求每个参数特征的平均得分,把平均值作为特征重要性排序的依据,进行特征值选择。在航空发动机数据上应用,算法处理后得到结果如下表1所示。
表1不同的特征选择方法待选特征的得分情况
方法特征 随机LASSO 岭回归 随机森林 稳定性选择 递归特征消除 平均得分
喂料量 0.1 0 0.03 0.08 0.18 0.08
微粉比表 0.31 0.39 0.07 0.0 0.09 0.17
料层厚度 0.6 1.0 1.0 0.8 0.71 0.82
发动机出口温度 0.21 0.45 0.32 0.66 0.42 0.41
发动机进口温度 0.0 0.0 0.23 0.0 0.14 0.07
发动机进口压力 0.11 0.0 0.43 0.24 0.13 0.18
选粉机转速 0.06 0.0 0.27 0.0 0.59 0.18
发动机压差 0.5 0.79 0.67 0.95 0.95 0.77
冷风阀开度 0.29 0.0 0.0 0.0 0.09 0.08
热风阀开度 0.21 0.0 0.01 0.12 0.0 0.07
循环风阀开度 0.6 0.21 0.14 0.24 0.33 0.3
主排风机转速 0.01 0.1 0.01 0.0 0.0 0.02
3)对参数的综合得分进行分析,结合参数的可控性和实际含义确定对影响振动的关键参数。从得分情况看,喂料量、微粉比表、发动机进口压力、主排风机转速、循环风阀开度发动机进口温度的平均值比较低,排除这些得分偏低的特征参数。得分最高的几个参数,按照从高到低的顺序依次为:料层厚度、发动机压差、发动机出口温度、循环风阀开度。
4)根据步骤2)和步骤3)中的分析,评估特征参数的筛选结果。四个得分较高的参数中,发动机压差、料层厚度、航空发动机出口温度三个参数都属于结果变量,参数的取值是在其他可控变量的综合影响下得到的结果。而循环风阀开度是调控变量不适合作为工况状态的判断指标。
综合以上分析,最终确定振动、料层厚度、发动机压差、发动机出口温度4个参数一起作为稳定状态判断的指标。
如图4所示为航空发动机健康状态K-means聚类分析流程图。结合实际生产经验和工况库中的数据分布,确定了四个稳定判断指标会导致运行异常的临界值,在多个临界值的限定范围内对预处理后的数据进行进一步筛选,求满足所有限制条件的数据,得到的筛选结果作为聚类的输入数据。聚类分析采用的是K-均值(k-means)来发现数据集中的K个工况簇。这里的K是用户指定的,算法的目的是找到数据集中的K个簇的质心,把数据集中的点分配给距离该点最近的质心,并将该点分配给该质心对应的类别。
选取K=3时,聚类结果如下,聚类中心及每个簇中的数据点个数如表2所示,分群的参数分布概率密度图如图5所示。
表2k=3,分群聚类中心表
类别 料层厚度 发动机出口温度 发动机压差 发动机壳体振动 类别数目
0 -0.464651 0.564229 -0.110864 0.520456 2276
1 -0.182965 -0.963877 -0.437062 -0.448334 2178
2 1.551188 0.872879 1.284423 -0.219220 937
从图5中可以看出:
类别0特点:料层厚度的取值范围在125~135mm之间,发动机出口温度在100~108℃,发动机压差在2800~3200Pa,振动值集中在7、8、9三个值附近。
类别1特点:料层厚度的取值范围在125~144mm之间,发动机出口温度在95~103℃,发动机压差在2800~3200Pa,振动值集中在6、7、8三个值附近。
类别2特点:料层厚度的取值范围在140~150mm之间,发动机出口温度在102~108℃,发动机压差在3200~3500Pa,振动值集中在6、7、8三个值附近。
选取K=3时,振动的重叠性较大,其他三个参数的距离间隔比较合理,结合数据来源航空发动机的设计生产建议,取三个聚簇中心时得到的类别0定义为非稳定状态,类别1和2中的记录定义为稳定状态。
如图6所示为航空发动机状态评估指标特征获取流程图,具体获取过程如下:
1)采集T时刻的实时工况数据,对采集到的数据进行空值和异常值检测,如果读取的过程中出现空值,舍弃数据或者用历史均值填补空值。处理完毕,按照设定的稳定指标数据采样间隔△t,继续读取下个采集时刻的数据,进行数据检测,重复这个过程直至获得n条记录;
2)在采集n条记录的过程中,如果有异常值出现,累计每个参数的异常值出现的次数。异常值的判断依据参照从稳定工况模式库中得到的各个参数取值范围,当采集到的参数超出正常范围,则认为该时刻的数据为异常值。
3)计算n条记录中各个参数的均值和标准差。最后得到每个参数在取数周期内得到的均值、方差和异常值次数三个维度共12个数值作为工况判断的特征值,用以稳定状态的判断。
如图7所示为航空发动机实时特征参数预测的时间序列建模过程图。根据航空发动机工况的特点,由于环境等外部因素和其他参数对振动的联合影响,导致工况序列属于非平稳序列,采用深度学习模型进行时间序列的建模。
平稳序列:对与一个序列{X(t)},如果数值在某一有限范围内波动,序列有常数的均值和常数方差,并且延迟k期的序列变量的自协方差和自相关系数是相等的,则该序列是平稳序列。
差分运算:假定两个序列的时间间隔为T,差分运算就是把相隔为k个T的序列的对应值做减法运算,k=1时,称为一阶差分运算。
深度学习模型的实质是采用下式的长短时记忆循环神经网络(LSTM)深度学习算法对航空发动机状态评估指标特征获取模块中确定的特征值进行模型训练。输入结构由输入控制门与输入激活层共同组成,根据上一个单元的输出yt-1和本单元的输入xt,选择在新状态中需要记忆的现在的某些信息,计算公式为:
it=σ(Wi·[yt-1,xt]+bi)
Ct′=f(WC·[yt-1,xt]+bC)
其中,it表示输入控制门选择的需要更新的信息,Ct′表示可用于更新的候选值,σ是控制门的激活函数,f是输入和单元状态激活函数,(W,b)分别表示上一个单元的输出yt-1和本单元的输入xt的权重矩阵系数和偏置项。
所述的控制门的激活函数为sigmoid函数,输入和单元状态激活函数为tanh函数。
sigmoid函数:
Figure BDA0002758737640000121
tanh函数:
Figure BDA0002758737640000122
以振动值为例说明采用时间序列进行建模的过程。首先对一段连续时间内采集到的振动值进行平稳性检测,取数间隔为5秒,连续35个振动取值的数据如下图8所示,可以看出该序列有上升趋势,属于非平稳序列。对序列求取自相关系数,相关系数的绝对值长期大于零,表明该序列具有长期的相关性。对这个序列进行一阶差分后得到的偏自相关图如图9所示。可以看出一阶差分后序列的时序图在均值附近波动,且波动范围不大,所以一阶差分后的序列是平稳序列。
接着对一阶差分后的序列进行白噪声检测,得到的P值小于0.05,所以一阶差分后的序列属于平稳非白噪声序列,可以用LSTM模型进行拟合。接下来对LSTM模型进行定阶,也就是求模型中的参数,根据p、q的所有组合得到的BIC信息量的大小来确定,选择令BIC信息量达到最小的p、q组合。模型定阶后就可以利用建立的深度学习模型进行预测。
预测模型可以给出连续5分钟的预测值、标准误差和置信区间,预测值和实际值的关系如图10所示。从图中可以看出预测误差较低,预测值基本能够反映数值的变化趋势,模型的预测效果良好。
以上所述仅是本发明的优选实施方式,虽然本发明已以较佳实施例披露如上,然而并非用以限定本发明。任何熟悉本领域的技术人员,在不脱离本发明技术方案范围情况下,都可利用上述揭示的方法和技术内容对本发明技术方案做出许多可能的变动和修饰,或修改为等同变化的等效实施例。因此,凡是未脱离本发明技术方案的内容,依据本发明的技术实质对以上实施例所做的任何的简单修改、等同变化及修饰,均仍属于本发明技术方案保护的范围内。

Claims (10)

1.一种基于数据挖掘的航空发动机健康状态识别系统,该系统包括:数据预处理模块、航空发动机健康状态评估指标挖掘模块、航空发动机健康状态聚类分析模块、航空发动机状态评估指标特征获取模块、航空发动机实时特征参数预测模块,其中:
数据预处理模块,对航空发动机采集的数据进行异常值处理、空值处理、离散化处理和归一化处理;
航空发动机健康状态评估指标挖掘模块,利用由随机lasso、岭回归、随机森林、稳定性选择和递归特征消除这五种方法综合组成的特征筛选方法,对工况数据进行挖掘分析,得到影响航空发动机稳定的关键参数,确定振动、料层厚度、发动机压差、发动机出口温度四个参数共同作为航空发动机健康状态评估的指标;
航空发动机健康状态聚类分析模块,基于确定的航空发动机健康状态评估的指标,对工况状态进行聚类挖掘分析,得到稳定模式工况库;
航空发动机状态评估指标特征获取模块,分析航空发动机运行状态下采集的实时数据的特点,确定进行实时状态判断的特征值;
航空发动机实时特征参数预测模块,利用深度学习算法对航空发动机状态评估指标特征获取模块中确定的特征值进行模型训练,预测参数的变化趋势,用预测值辅助状态识别。
2.如权利要求1所述的系统,其特征在于,所述的数据预处理模块中,数据异常值处理、空值处理,通过数据筛选和数据清洗实现。离散化处理和归一化处理,由特征简约和数据变换实现。
3.如权利要求1所述的系统,其特征在于,综合的特征筛选方法,通过求解输入变量和输出变量之间的关系,对每种方法的得分结果均利用最大最小值的规范化方法进行处理,把得分限制在[0,1]之间,然后求每个参数特征的平均得分,把平均值作为特征重要性排序的依据,按照处理后的得分结果对特征的重要度进行评估,进行特征值选择。
4.如权利要求1所述的系统,其特征在于,所述的航空发动机健康状态聚类分析模块,基于确定的航空发动机健康状态评估的指标,对工况状态进行聚类挖掘分析,得到各个工况簇的特点,获得历史工况中的状态分布情况,定义历史工况中的运行状态类别,对工况所属的状态进行类别标注和筛选,得到稳定模式工况库。
5.如权利要求4所述的系统,其特征在于,所述的聚类挖掘分析为k-means聚类分析,选取k=3,得到的类别0定义为非稳定状态,类别1和2中的记录定义为稳定状态。类别0特点:料层厚度的取值范围在125~135mm之间,发动机出口温度在100~108℃,发动机压差在2800~3200Pa,振动值集中在7、8、9三个值附近。类别1特点:料层厚度的取值范围在125~144mm之间,发动机出口温度在95~103℃,发动机压差在2800~3200Pa,振动值集中在6、7、8三个值附近。类别2特点:料层厚度的取值范围在140~150mm之间,发动机出口温度在102~108℃,发动机压差在3200~3500Pa,振动值集中在6、7、8三个值附近。
6.如权利要求1所述的系统,其特征在于,所述的航空发动机状态评估指标特征获取模块,以振动、料层厚度、发动机压差、发动机出口温度这4个状态评估指标的实时数据为基础,计算每个参数在取数窗口时间内的均值、方差和异常值出现次数,把得到的结果作为稳定工况判断的特征变量。
7.如权利要求1所述的系统,其特征在于,所述的航空发动机实时特征参数预测模块,采用长短时记忆循环神经网络(LSTM)对航空发动机状态评估指标特征获取模块中确定的特征值进行模型训练。输入结构由输入控制门与输入激活层共同组成,根据上一个单元的输出yt-1和本单元的输入xt,选择在新状态中需要记忆的现在的某些信息,计算公式为:
it=σ(Wi·[yt-1,xt]+bi)
C′t=f(WC·[yt-1,xt]+bC)
其中,it表示输入控制门选择的需要更新的信息,Ct′表示可用于更新的候选值,σ是控制门的激活函数,f是输入和单元状态激活函数,(W,b)分别表示上一个单元的输出yt-1和本单元的输入xt的权重矩阵系数和偏置项。
8.如权利要求7所述的系统,其特征在于,所述的控制门的激活函数为sigmoid函数,输入和单元状态激活函数为tanh函数。
sigmoid函数:
Figure FDA0002758737630000031
tanh函数:
Figure FDA0002758737630000032
9.一种基于数据挖掘的航空发动机健康状态识别方法,其特征在于,包括如下步骤:
1)利用综合的特征筛选方法对工况数据进行分析,确定影响稳定的关键参数,作为稳定状态的判断指标。分析历史数据中关键参数的取值范围,根据其分布区间,确定触发稳定调控的临界值;
2)以步骤1)中确定的稳定判断指标为特征,对工况状态进行聚类分析,使用聚类算法对数据进行挖掘,分析聚类挖掘得到的各个工况簇的特点,获得历史工况中的状态分布情况;
3)根据聚类分析的挖掘结果,定义历史工况中的运行状态类别,对工况所属的状态进行类别标注和筛选,得到稳定模式工况库;
4)对航空发动机运行状态下采集的实时数据的特点进行分析,确定进行实时状态判断的特征值;
5)利用深度学习算法对步骤4)中确定的特征值进行模型训练,对参数的变化趋势进行预测,用预测值辅助状态判断。
10.如权利要求9所述的方法,其特征在于,所述的综合的特征筛选方法,包括随机lasso、岭回归、随机森林、稳定性选择和递归特征消除这五种方法。通过求解输入变量和输出变量之间的关系,分别使用五种方法对每个特征的重要性予以打分,对五种得分情况进行处理,按照处理后的得分结果对特征的重要度进行评估,确定待选特征集中的关键特征。
CN202011211044.0A 2020-11-03 2020-11-03 一种基于数据挖掘的航空发动机健康状态识别系统及方法 Pending CN112381965A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011211044.0A CN112381965A (zh) 2020-11-03 2020-11-03 一种基于数据挖掘的航空发动机健康状态识别系统及方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011211044.0A CN112381965A (zh) 2020-11-03 2020-11-03 一种基于数据挖掘的航空发动机健康状态识别系统及方法

Publications (1)

Publication Number Publication Date
CN112381965A true CN112381965A (zh) 2021-02-19

Family

ID=74579823

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011211044.0A Pending CN112381965A (zh) 2020-11-03 2020-11-03 一种基于数据挖掘的航空发动机健康状态识别系统及方法

Country Status (1)

Country Link
CN (1) CN112381965A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113032458A (zh) * 2021-03-23 2021-06-25 中国人民解放军63920部队 航天器的异常确定方法及装置
CN113157728A (zh) * 2021-02-23 2021-07-23 北京科技大学 一种地下柴油铲运机循环工况的识别方法
CN115583350A (zh) * 2022-09-19 2023-01-10 成都飞机工业(集团)有限责任公司 一种飞机液压系统性能异常识别方法、装置、设备及介质

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106990763A (zh) * 2017-04-20 2017-07-28 浙江大学 一种基于数据挖掘的立磨运行调控系统及方法
CN107146004A (zh) * 2017-04-20 2017-09-08 浙江大学 一种基于数据挖掘的矿渣粉磨系统健康状态识别系统及方法
CN107239066A (zh) * 2017-06-09 2017-10-10 浙江大学 一种基于数据挖掘的立磨运行闭环控制装置及方法
CN108926338A (zh) * 2018-05-31 2018-12-04 中南民族大学 基于深度学习的心率预测方法及装置
CN109101876A (zh) * 2018-06-28 2018-12-28 东北电力大学 基于长短时记忆网络的人体行为识别方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106990763A (zh) * 2017-04-20 2017-07-28 浙江大学 一种基于数据挖掘的立磨运行调控系统及方法
CN107146004A (zh) * 2017-04-20 2017-09-08 浙江大学 一种基于数据挖掘的矿渣粉磨系统健康状态识别系统及方法
CN107239066A (zh) * 2017-06-09 2017-10-10 浙江大学 一种基于数据挖掘的立磨运行闭环控制装置及方法
CN108926338A (zh) * 2018-05-31 2018-12-04 中南民族大学 基于深度学习的心率预测方法及装置
CN109101876A (zh) * 2018-06-28 2018-12-28 东北电力大学 基于长短时记忆网络的人体行为识别方法

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113157728A (zh) * 2021-02-23 2021-07-23 北京科技大学 一种地下柴油铲运机循环工况的识别方法
CN113157728B (zh) * 2021-02-23 2024-03-19 北京科技大学 一种地下柴油铲运机循环工况的识别方法
CN113032458A (zh) * 2021-03-23 2021-06-25 中国人民解放军63920部队 航天器的异常确定方法及装置
CN115583350A (zh) * 2022-09-19 2023-01-10 成都飞机工业(集团)有限责任公司 一种飞机液压系统性能异常识别方法、装置、设备及介质
CN115583350B (zh) * 2022-09-19 2024-05-14 成都飞机工业(集团)有限责任公司 一种飞机液压系统性能异常识别方法、装置、设备及介质

Similar Documents

Publication Publication Date Title
CN107146004B (zh) 一种基于数据挖掘的矿渣粉磨系统健康状态识别系统及方法
CN112381965A (zh) 一种基于数据挖掘的航空发动机健康状态识别系统及方法
KR101316486B1 (ko) 이상 검지 방법 및 시스템
CN111222549A (zh) 一种基于深度神经网络的无人机故障预测方法
CN112345261B (zh) 基于改进dbscan算法的航空发动机泵调系统异常检测方法
CN114282579A (zh) 基于变分模态分解和残差网络的航空轴承故障诊断方法
CN113053171B (zh) 一种民机系统风险预警方法及系统
Li et al. Domain adaptation remaining useful life prediction method based on AdaBN-DCNN
Shi et al. Health index synthetization and remaining useful life estimation for turbofan engines based on run-to-failure datasets
CN115375026A (zh) 一种多故障模式下的航空发动机寿命预测方法
CN110503133A (zh) 一种基于深度学习的离心式压缩机故障预测方法
CN116235148A (zh) 干泵宕机的预警方法、装置、电子设备、存储介质及程序
Baek et al. Fault prediction via symptom pattern extraction using the discretized state vectors of multisensor signals
Li et al. Remaining useful life prediction of aero-engine based on PCA-LSTM
JP2014056598A (ja) 異常検知方法及びそのシステム
CN117076869B (zh) 旋转机械时频域融合故障诊断方法及系统
CN110956331A (zh) 数字工厂运营状态预测方法、系统、装置
CN114088389A (zh) 一种齿轮变速箱的数据处理方法和相关装置
CN110826600B (zh) 基于自适应共振网络在线增量学习的发动机喘振预测方法
Dui et al. Reliability Evaluation and Prediction Method with Small Samples.
Ma et al. State-of-Health assessment for aero-engine based on density-distance clustering and fuzzy Bayesian risk
Lee et al. Anomaly detection of aircraft engine in FDR (flight data recorder) data
CN116028865A (zh) 基于特征扩增的航空发动机故障诊断方法
Wang et al. A novel scheme for intelligent fault diagnosis of marine diesel engine using the multi-information fusion technology
Baruah et al. An autonomous diagnostics and prognostics framework for condition-based maintenance

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20210219

RJ01 Rejection of invention patent application after publication