CN115186735A

CN115186735A - 一种数据阈值挖掘方法、装置、设备及介质

Info

Publication number: CN115186735A
Application number: CN202210695623.XA
Authority: CN
Inventors: 张泉; 罗川; 谭凤云; 周宇; 张妍; 阮亮; 艾俊淇
Original assignee: Chengdu Aircraft Industrial Group Co Ltd
Current assignee: Chengdu Aircraft Industrial Group Co Ltd
Priority date: 2022-06-20
Filing date: 2022-06-20
Publication date: 2022-10-14
Anticipated expiration: 2042-06-20
Also published as: CN115186735B

Abstract

本申请公开了一种数据阈值挖掘方法、装置、设备及介质，涉及数据阈值挖掘技术领域，该方法包括获得历史数据集，所述历史数据集包括由操纵接口单元的不同通道产生的历史数据的集合；将所述历史数据集基于聚类进行故障模型训练，以获得模型文件；所述模型文件包括各个数据簇的上边界、下边界、上扩充边界和下扩充边界，所述数据簇包括基于所述故障模型训练所生成的数据群；基于所述模型文件、所述历史数据集中各维数据的最大值和最小值，获得多维参数阈值列表。本申请通过上述技术方案获得的阈值列表中的数据阈值灵敏度和准确性更高，从而能准确的测试出飞机系统各组件的数据是否异常，进而能准确的测试出飞机系统组件是否出现故障。

Description

一种数据阈值挖掘方法、装置、设备及介质

技术领域

本申请涉及数据阈值挖掘技术领域，尤其涉及数据阈值挖掘方法、装置、设备及介质。

背景技术

随着信息技术的不断发展和航空航天技术的不断突破，飞机系统的集成度、结构的复杂度及其运行环境的复杂性也在不断提升，影响着飞机的可靠性，使其发生运行异常和系统故障问题的概率增加。因此，实时监测飞机系统各组件的状态，及时测试飞机系统各组件的数据显得至关重要。

现有技术中，监测飞机系统各组件时所使用的数据阈值由专家根据经验给定，其灵敏度较低，从而不能准确的测试出飞机系统各组件的数据是否异常，进而不能准确的测试出飞机系统组件是否出现故障。

发明内容

本申请的主要目的在于提供数据阈值挖掘方法、装置、设备及介质，旨在解决现有技术中由专家根据经验给定的数据阈值的灵敏度较低，从而不能准确的测试出飞机系统各组件的数据是否异常，进而不能准确的测试出飞机系统组件是否出现故障的技术问题。

为实现上述目的，本申请第一方面提供了一种数据阈值挖掘方法，所述方法包括：

获得历史数据集，所述历史数据集包括由操纵接口单元的不同通道产生的历史数据的集合；

将所述历史数据集基于聚类进行故障模型训练，以获得模型文件；所述模型文件包括各个数据簇的上边界、下边界、上扩充边界和下扩充边界，所述数据簇包括基于所述故障模型训练所生成的数据群；

基于所述模型文件、所述历史数据集中各维数据的最大值和最小值，获得多维参数阈值列表。

可选地，所述获得历史数据集，包括：

获得所述操纵接口单元的不同通道产生的数据；

将所述操纵接口单元的不同通道产生的数据进行合并整合后，获得历史数据集。

可选地，在所述将所述历史数据集基于聚类进行故障模型训练，以获得模型文件的步骤之前，还包括：

对所述历史数据集进行标准化处理；

所述将所述历史数据集基于聚类进行故障模型训练，以获得模型文件的步骤，包括；

将标准化处理后的所述历史数据集基于聚类进行故障模型训练，以获得模型文件。

可选地，所述对所述历史数据集进行标准化处理，包括：

提取所述历史数据集中的各维数据；

判断各维数据是否满足接收到的标准化判断指令；其中，所述标准化判断指令包括判断某一维所述数据是否为单一常值的指令；

若某一维所述数据满足标准化判断指令，则调整该维所有所述数据为0.5；

若某一个维所述数据不满足标准化判断指令，则对该维所述数据进行更新。

可选地，根据如下关系式，对该维所述数据进行更新：

x₀＝(x-min)/(max-min)

其中，x₀表示更新后的数据，x表示更新前的数据，min表示该维数据中的最小数据，max表示该维数据中的最大数据。

可选地，所述将所述历史数据集基于聚类进行故障模型训练，以获得模型文件，包括：

提取所述历史数据集中的第一帧数据作为创建的第一个数据簇的第一个元素；

基于所述第一个元素初始化所述第一个数据簇的上边界、所述第一个数据簇的下边界、所述第一个数据簇的上扩充边界和所述第一个数据簇的下扩充边界；

基于接收到的第一判断指令和第二判断指令，判断所述历史数据集中的第n帧数据，以获得模型文件；所述第一判断指令包括判断第n帧数据是否包含在第一个数据簇的上边界和第一个数据簇的下边界内，所述第二判断指令包括判断第n帧数据是否包含在第一个数据簇的上扩充边界和第一个数据簇的下扩充边界内；其中，n表示大于1的自然数。

可选地，根据如下关系式，初始化第一个数据簇的上边界：

B_u(1)＝V_c(1)(1)+T_id

其中，B_u(1)表示第一个数据簇的上边界，V_c(1)(1)第一个数据簇的第一个元素，T_id表示数据簇的初始距离阈值；

根据如下关系式，初始化第一个数据簇的下边界：

B_l(1)＝V_c(1)(1)-T_id

其中，B_l(1)表示第一个数据簇的下边界；

根据如下关系式，初始化第一个数据簇的上扩充边界：

B_ue(1)＝V_c(1)(1)+T_icd

其中，B_ue(1)表示第一个数据簇的上扩充边界，T_icd表示数据簇合并距离阈值；

根据如下关系式，初始化第一个数据簇的下扩充边界：

B_le(1)＝V_c(1)(1)-T_icd

其中，B_le(1)表示第一个数据簇的下扩充边界。

可选地，所述基于接收到的第一判断指令和第二判断指令，判断所述历史数据集中的第n帧数据，以获得模型文件，包括：

若所述第n帧数据满足第一判断指令，则将所述第n帧数据传输至所述第一个数据簇内；

若所述第n帧数据不满足所述第一判断指令，且满足所述第二判断指令，则将所述第n帧数据传输至所述第一个数据簇内，并对所述第一个数据簇的下边界、第一个数据簇的上边界、所述第一个数据簇的下扩充边界和所述第一个数据簇的上扩充边界进行更新；

若所述第n帧数据不满足所述第一判断指令，且不满足所述第二判断指令，则将所述第n帧数据生成第i个数据簇；并获得所述第i个数据簇的初始上边界，所述第i个数据簇的初始下边界、所述第i个数据簇的初始上扩充边界和所述第i个数据簇的初始下扩充边界；其中，i表示大于1的自然数；

将所述第一个数据簇包含的元素、第i个数据簇包含的元素、第一个数据簇的上边界、第一个数据簇的下边界、第一个数据簇的上扩充边界、第一个数据簇的下扩充边界、第i个数据簇的初始上边界，第i个数据簇的初始下边界、第i个数据簇的初始上扩充边界和第i个数据簇的初始下扩充边界存储为可读写的模型文件。

可选地，根据如下关系式，更新第一个数据簇的下边界：

B’_l(1)＝V_c(1)min+(V_c(1)Smin-V_c(1)min)*R_e

其中，B′_l(1)表示第一个数据簇更新后的下边界，V_c(1)min表示第一个数据簇对应的每一维数据的最小值依次排列为的数据簇最小值向量，V_c(1)Smin表示对第一个数据簇的所有帧数据中与对应维数据最小值相等的数据值换为该维数据的最大值数据，形成的临时数据簇所对应的每一维数据的最小值依次排列为的数据簇次最小值向量，R_e表示数据簇的扩展率；

根据如下关系式，更新第一个数据簇的上边界：

B’_u(1)＝V_c(1)max+(V_c(1)max-V_c(1)Smax)*R_e

其中，B’_u(1)表示第一个数据簇更新后的上边界，V_c(1)max表示第一个数据簇对应的每一维的最大值依次排列为的数据簇最大值向量，V_c(1)smax对第一个数据簇的所有帧数据中与对应维最大值相等的数据值换为该维最小值数据，形成的临时数据簇所对应的每一维数据的最大值依次排列为的数据簇次最大值向量；

根据如下关系式，更新第一个数据簇的上扩充边界：

B′_ue(1)＝B_ue(1)+(B_u(1)-B_l(1))*R_e

其中，B′_ue(1)表示第一个数据簇更新后的上扩充边界；

根据如下关系式，更新第一个数据簇的下扩充边界：

B′_le(1)＝B_le(1)-(B_u(1)-B_l(1))*R_e

其中，B′_le(1)表示第一个数据簇更新后下扩充边界。

可选地，将所述第n帧数据生成第i个数据簇，包括如下步：

提取所述第n帧数据，并将所述第n帧数据作为创建的第i个数据簇的第一个元素；

基于所述第i个数据簇的第一个元素初始化所述第i个数据簇的上边界、第i个数据簇的下边界、第i个数据簇的上扩充边界和第i个数据簇的下扩充边界。

可选地，根据如下关系式，初始化第i个数据簇的上边界：

B_u(i)＝V_c(i)(1)+T_id

其中，B_u(i)表示第i个数据簇的上边界，V_c(i)(1)第i个数据簇的第一个元素；

根据如下关系式，初始化第i个数据簇的下边界：

B_l(i)＝V_c(i)(1)-T_id

其中，B_l(i)表示第i个数据簇的下边界；

根据如下关系式，初始化第i个数据簇的上扩充边界：

B_ue(i)＝B_u(i)

其中，B_ue(i)表示第i个数据簇的上扩充边界；

根据如下关系式，初始化第i个数据簇的下扩充边界：

B_le(i)＝B_l(i)

其中，B_le(i)表示第i个数据簇的下扩充边界。

可选地，所述基于所述模型文件、所述历史数据集中各维数据的最大值和最小值，获得多维参数阈值列表的步骤之前，还包括：

对所述模型文件进行增量训练；增量训练后的所述模型文件包括各个所述数据簇更新后的上扩充边界和更新后的下扩充边界；

所述基于所述模型文件、所述历史数据集中各维数据的最大值和最小值，获得多维参数阈值列表的步骤，包括：

基于增量训练后的所述模型文件、所述历史数据集中各维数据的最大值和最小值，获得多维参数阈值列表。

可选地，所述基于所述模型文件，对读入的所述历史数据集中的数据进行增量训练，包括：

读入增量数据集，所述增量数据集包括由操纵接口单元的不同通道产生的实时数据的集合；

依次判断所述增量数据集中的数据是否在各个所述数据簇的上边界、下边界、上扩充边界和下扩充边界内，以对所述模型文件进行增量训练。

可选地，所述基于所述模型文件、所述历史数据集中各维数据的最大值和最小值，获得多维参数阈值列表，包括：

将所述上扩充边界和所述下扩充边界进行反归一化处理；

提取所述历史数据集中各维数据的最大值和最小值；

基于反归一化处理后的所述上扩充边界、反归一化处理后的所述下扩充边界、所述历史数据集中各维数据的最大值和最小值，获得多维参数阈值列表。

第二方面，本申请提供了一种数据阈值挖掘装置，所述装置包括：

第一获得模块，用于获得历史数据集，所述历史数据集包括由操纵接口单元的不同通道产生的历史数据的集合；

训练模块，用于将所述历史数据集基于聚类进行故障模型训练，以获得模型文件；所述模型文件包括各个数据簇的上边界、下边界、上扩充边界和下扩充边界，所述数据簇包括基于所述故障模型训练所生成的数据群；

第二获得模块，用于基于所述模型文件、所述历史数据集中各维数据的最大值和最小值，获得多维参数阈值列表。

第三方面，本申请提供了一种计算机设备，该计算机设备包括存储器和处理器，所述存储器中存储有计算机程序，所述处理器执行所述计算机程序，实现实施例中所述的方法。

第四方面，本申请提供了一种计算机可读存储介质，所述计算机可读存储介质上存储有计算机程序，处理器执行所述计算机程序，实现实施例中所述的方法。

通过上述技术方案，本申请至少具有如下有益效果：

本申请实施例提出的数据阈值挖掘方法、装置、设备及介质，该方法通过先获得历史数据集，然后将历史数据集基于聚类进行故障模型训练，以获得模型文件，最后基于模型文件、历史数据集中各维数据的最大值和最小值，获得多维参数阈值列表，由于模型文件包括各个数据簇的上边界、下边界、上扩充边界和下扩充边界，能从大量正常的历史数据集中获取更多有用信息，挖掘出各数据的正常阈值范围，并细化了阈值，因此获得的阈值列表中的数据阈值灵敏度和准确性更高，从而能准确的测试出飞机系统各组件的数据是否异常，进而能准确的测试出飞机系统组件是否出现故障。

附图说明

图1为本申请实施例涉及的硬件运行环境的计算机设备结构示意图；

图2为本申请实施例的数据阈值挖掘方法的流程示意图；

图3为本申请实施例中步骤S10的具体流程示意图；

图4为本申请实施例中步骤S11的具体的流程示意图；

图5为本申请实施例中步骤S12的具体的流程示意图；

图6为本申请实施例的数据阈值挖掘装置的结构示意图。

本申请目的的实现、功能特点及优点将结合实施例，参照附图做进一步说明。

具体实施方式

应当理解，此处所描述的具体实施例仅仅用以解释本申请，并不用于限定本申请。

飞机作为民用生活和军事活动不可或缺的重要物体之一，在航空领域中发挥着重要的作用。然而，随着信息技术的不断发展和航空航天技术的不断突破，飞机系统的集成度、结构的复杂度及其运行环境的复杂性也在不断提升，影响着飞机的可靠性，使其发生运行异常和系统故障问题的概率增加。而一旦未能及时准确地从测试数据中发现其异常、故障并诊断恢复，就极有可能会带来隐患，产生严重损失。由此可见，飞机系统能否得到更及时、更精确的故障诊断极为重要。

因此，在理想状态下，我们希望实时监测飞机系统各组件的状态，及时从测试的数据中发现微小异常，以预防故障的发生。利用飞管/飞控系统的二级控制器PIU，可以对飞机系统关键组件参数进行测试，它通过提供与驾驶杆、速率陀螺组件、加速度计组件等组件成品的接口，采集电信号数据，并会将该数据转换为数字信号后传送至PIU子系统(飞行员操纵接口单元子系统)中的对应计算机，最终形成完整测试数据，以待观测与进一步处理。

在目前测试中，对某一组件参数属否正常的判定多使用专家阈值的方法，即给定一个正常值范围，判断测试数据是否在范围内，但同厂家同批次组件运行时测试数据的波动范围远小于相应专家阈值，且飞机运行时工况复杂多变，而此方法仅基于各类固定的阈值区间进行各参数的异常判定，可见它存在着灵敏度较低、对于时变参数的适应性和有效性较差，从而不能准确的测试出飞机系统各组件的数据是否异常，进而不能准确的测试出飞机系统组件是否出现故障等问题。

为了解决上述技术问题，本申请提供了一种数据阈值挖掘方法、装置、设备及介质，在介绍本申请的具体技术方案之前，先介绍下本申请实施例方案涉及的硬件运行环境。

参照图1，图1为本申请实施例方案涉及的硬件运行环境的计算机设备结构示意图。

如图1所示，该计算机设备可以包括：处理器1001，例如中央处理器(CentralProcessing Unit，CPU)，通信总线1002、用户接口1003，网络接口1004，存储器1005。其中，通信总线1002用于实现这些组件之间的连接通信。用户接口1003可以包括显示屏(Display)、输入单元比如键盘(Keyboard)，可选用户接口1003还可以包括标准的有线接口、无线接口。网络接口1004可选的可以包括标准的有线接口、无线接口(如无线保真(WIreless-FIdelity，WI-FI)接口)。存储器1005可以是高速的随机存取存储器(RandomAccess Memory，RAM)存储器，也可以是稳定的非易失性存储器(Non-Volatile Memory，NVM)，例如磁盘存储器。存储器1005可选的还可以是独立于前述处理器1001的存储装置。

本领域技术人员可以理解，图1中示出的结构并不构成对计算机设备的限定，可以包括比图示更多或更少的部件，或者组合某些部件，或者不同的部件布置。

如图1所示，作为一种存储介质的存储器1005中可以包括操作系统、数据存储模块、网络通信模块、用户接口模块以及电子程序。

在图1所示的计算机设备中，网络接口1004主要用于与网络服务器进行数据通信；用户接口1003主要用于与用户进行数据交互；本发明计算机设备中的处理器1001、存储器1005可以设置在计算机设备中，所述计算机设备通过处理器1001调用存储器1005中存储的数据阈值挖掘装置，并执行本申请实施例提供的数据阈值挖掘方法。

参照图2，基于前述实施例的硬件环境，本申请的实施例提供了一种数据阈值挖掘方法，该方法包括：

S10：获得历史数据集，历史数据集包括由操纵接口单元的不同通道产生的历史数据的集合。

本实施例所使用的数据为PIU(飞行员操纵接口单元)子系统的总线正常数据，总线数据由PIU不同通道产生，每次算法执行所使用的数据取自某部件单次试验所产生的PIU多通道总线数据，取其中的与试验相关的参数对应的数据中的某一工况数据作为算法输入，由于训练故障模型需要数据量较大，故需整合各通道数据，一次训练多通道数据，增加训练数据量。

S11：将历史数据集基于聚类进行故障模型训练，以获得模型文件；其中，模型文件包括各个数据簇的上边界、下边界、上扩充边界和下扩充边界，数据簇包括基于故障模型训练所生成的数据群。

在具体实施过程中，基于聚类的模型训练所生成的数据群可以称为簇，生成的簇的数量与范围大小可以由簇的初始距离阈值，簇的合并距离阈值，以及簇的扩张率这三个参数确定，训练过程中簇的初始距离阈值用于调整新创建的簇的边界大小判断是否将数据纳入簇但不扩充簇边界，簇合并距离阈值用于判断是否将数据纳入簇并扩充簇的边界，而簇的扩展率决定了每次扩充边界的程度，这三个参数的数值如果越大，会导致整个训练过程产生的簇的数量越少，而簇的大小即簇中的元素数目会变多，可通过调整参数来确定簇的数目以及单个簇的大小以此来适应计算资源限制以及相关具体检测精度的要求，由于通过聚类的方法将历史数据集中的数据可以分为不同的数据簇，并进行故障模型训练，因此获得的模型文件中包括各个数据簇的上边界、下边界、上扩充边界和下扩充边界。

S12：基于模型文件、历史数据集中各维数据的最大值和最小值，获得多维参数阈值列表。

由于模型文件中包括各个数据簇的上边界、下边界、上扩充边界和下扩充边界，因此基于各个数据簇的上边界、下边界、上扩充边界和下扩充边界，以及历史数据集中各维数据的最大值和最小值，获得多维参数阈值列表，所挖掘出的阈值由多种阈值构成，因此多维参数阈值列表中具有多种阈值，从而可以更精确地体现出正常数据的特征。

本实施例中，由于模型文件包括各个数据簇的上边界、下边界、上扩充边界和下扩充边界，能从大量正常的历史数据集中获取更多有用信息，挖掘出各数据的正常阈值范围，并细化了阈值，因此获得的阈值列表中的数据阈值灵敏度和准确性更高，从而能准确的测试出飞机系统各组件的数据是否异常，进而能准确的测试出飞机系统组件是否出现故障。

在一些实施例中，如图3所示，获得历史数据集包括如下步骤：

S101：获得操纵接口单元的不同通道产生的数据。

S102：将操纵接口单元的不同通道产生的数据进行合并整合后，获得历史数据集。由于对不同通道产生的数据进行合并整合，因此将历史数据集的数据结构化处理，通过对数据的结构化处理，实现数据的批量读取和处理，从而可以增加用于故障模型训练的数据量，并能更好的利用好历史数据集。

在一些实施例中，在将历史数据集基于聚类进行故障模型训练，以获得模型文件的步骤之前还包括：

对历史数据集进行标准化处理；

将历史数据集基于聚类进行故障模型训练，以获得模型文件的步骤包括；

将标准化处理后的所述历史数据集基于聚类进行故障模型训练，以获得模型文件，具体的包括：

提取历史数据集中的各维数据；判断各维数据是否满足接收到的标准化判断指令；其中，标准化判断指令包括判断某一维数据是否为单一常值的指令；若某一维所述数据满足标准化判断指令，则调整该维所有所述数据为0.5；若某一个维数据不满足标准化判断指令，则对该维数据进行更新。

具体的，根据如下关系式对该维数据进行更新：

x₀＝(x-min)/(max-min)

本实施例中，将提取历史数据集中的各维数据，从而便于历史数据集的聚类；并对各维数据进行标准化处理，从而更便于对历史数据进行故障模型训练。

在一些实施例中，如图4所示，将历史数据集基于聚类进行故障模型训练，以获得模型文件包括如下步骤：

S111：提取历史数据集中的第一帧数据作为创建的第一个数据簇的第一个元素。

具体训练过程为，取已经最小最大标准化处理后的数据作为训练数据。

S112：基于第一个元素初始化第一个数据簇的上边界、第一个数据簇的下边界、第一个数据簇的上扩充边界和第一个数据簇的下扩充边界。

具体的，根据如下关系式，初始化第一个数据簇的上边界：

B_u(1)＝V_C(1)(1)+T_id

根据如下关系式，初始化第一个数据簇的下边界：

B_l(1)＝V_c(1)(1)-T_id

其中，B_l(1)表示第一个数据簇的下边界；

根据如下关系式，初始化第一个数据簇的上扩充边界：

B_ue(1)＝V_c(1)(1)+T_icd

根据如下关系式，初始化第一个数据簇的下扩充边界：

B_le(1)＝V_c(1)(1)-T_icd

其中，B_le(1)表示第一个数据簇的下扩充边界。

S113：基于接收到的第一判断指令和第二判断指令，判断历史数据集中的第n帧数据，以获得模型文件；第一判断指令包括判断第n帧数据是否包含在第一个数据簇的上边界和第一个数据簇的下边界内，所述第二判断指令包括判断第n帧数据是否包含在第一个数据簇的上扩充边界和第一个数据簇的下扩充边界内；其中，n表示大于1的自然数。

本实施例中，向量与常数运算为向量中的每一个元素与该常数运算再将运算的结果按原先向量中元素的顺序返回生成一个新向量，新向量作为运算结果，而向量与向量的运算为向量中的每一个元素与另一个向量的对应位置的元素依次运算再将运算的结果按原先向量中元素的顺序返回生成一个新向量，基于第一个元素初始化第一个数据簇的上边界、第一个数据簇的下边界、第一个数据簇的上扩充边界和第一个数据簇的下扩充边界，可以为后续历史数据集中的数据进入故障模型中作出准备，后续历史数据集中的数据进入故障模型后，再分别对第一个数据簇的上边界、第一个数据簇的下边界、第一个数据簇的上扩充边界和第一个数据簇的下扩充边界进行比较，以便更新上边界、下边界、上扩充边界和下扩充边界。

在一些实施例中，获得第一判断指令和第二判断指令，判断历史数据集中的第n帧数据后，获得模型文件包括以下步骤：

步骤1131：若第n帧数据满足第一判断指令，则将所述第n帧数据传输至第一个数据簇内。

若第n帧数据中的所有元素与第一个数据簇的上边界的差都大于0，且第n帧数据中的所有元素与第一个数据簇的下边界的差都小于0，则该帧数据包含在该簇的上边界和下边界中，则该帧数据可以添加为第一个簇的一个元素，且第一个簇的上边界和下边界，以及上扩充边界(向量)和下扩充边界(向量)保持不变，不做调整。

步骤1132：若第n帧数据不满足第一判断指令，且满足第二判断指令，则将第n帧数据传输至所述第一个数据簇内，并对第一个数据簇的下边界、第一个数据簇的上边界、第一个数据簇的下扩充边界和第一个数据簇的上扩充边界进行更新。

若数据不包含在生成的第一个簇的上边界和下边界内，则继续判断数据是否包含在生成的第一个簇的上扩充边界和下扩充边界内，若第n帧数据中所有元素与第一个数据簇的下扩充边界所有对应位置元素的差都大于0，且第n帧数据中所有元素与第一个数据簇的上扩充边界的差都小于0，则该帧数据包含在该簇的上扩充边界和下扩充边界中，则该帧数据可以添加为第一个簇的一个元素，与此同时第一个簇的上边界和下边界，以及上扩充边界和下扩充边界向量需要做一定的调整以适应新元素的加入，具体调整方式如下：

具体的，根据如下关系式，更新第一个数据簇的下边界：

B’_l(1)＝V_c(1)min+(V_c(1)Smin-V_c(1)min)*R_e

根据如下关系式，更新第一个数据簇的上边界：

B’_u(1)＝V_c(1)max+(V_c(1)max-V_c(1)smax)*R_e

根据如下关系式，更新第一个数据簇的上扩充边界：

B′_ue(1)＝B_ue(1)+(B_u(1)-B_l(1))*R_e

其中，B′_ue(1)表示第一个数据簇更新后的上扩充边界；

根据如下关系式，更新第一个数据簇的下扩充边界：

B′_le(1)＝B_le(1)-(B_u(1)-B_l(1))*R_e

其中，B′_le(1)表示第一个数据簇更新后下扩充边界。

步骤1133：若所述第n帧数据不满足所述第一判断指令，且不满足所述第二判断指令，则将第n帧数据生成第i个数据簇；并获得所述第i个数据簇的初始上边界，所述第i个数据簇的初始下边界、所述第i个数据簇的初始上扩充边界和所述第i个数据簇的初始下扩充边界；其中，i表示大于1的自然数。

具体的，将第n帧数据生成第i个数据簇包括如下步骤：

先提取第n帧数据，并将第n帧数据作为创建的第i个数据簇的第一个元素，具体方法与提取第一个数据簇的第一个元素相同。

然后，基于第i个数据簇的第一个元素初始化第i个数据簇的上边界、第i个数据簇的下边界、第i个数据簇的上扩充边界和第i个数据簇的下扩充边界。

具体的，根据如下关系式，初始化第i个数据簇的上边界：

B_u(i)＝V_c(i)(1)+T_id

根据如下关系式，初始化第i个数据簇的下边界：

B_l(i)＝V_c(i)(1)-T_id

其中，B_l(i)表示第i个数据簇的下边界；

根据如下关系式，初始化第i个数据簇的上扩充边界：

B_ue(U)＝B_u(i)

其中，B_ue(i)表示第i个数据簇的上扩充边界；

根据如下关系式，初始化第i个数据簇的下扩充边界：

B_le(i)＝B_l(i)

其中，B_le(i)表示第i个数据簇的下扩充边界。

步骤1134：将第一个数据簇包含的元素、第i个数据簇包含的元素、第一个数据簇的上边界、第一个数据簇的下边界、第一个数据簇的上扩充边界、第一个数据簇的下扩充边界、第i个数据簇的初始上边界，第i个数据簇的初始下边界、第i个数据簇的初始上扩充边界和第i个数据簇的初始下扩充边界存储为可读写的模型文件。

在生成了除第一个簇的新簇后，对接下来待处理的数据首先依次判断是否在第一个簇的上边界和下边界，以及上扩充边界和下扩充边界中，并做相应的处理；若不能并入第一个簇中，则与其他簇的上边界和下边界作比较，若在某一簇的上边界和下边界内，则并入该簇且簇的上边界和下边界不变；若不能并入已知的所有簇中，则以该数据为基础生成新簇，生成新簇的方法与第i个簇生成的方式相同，当以上述流程处理完所有帧数据后，训练过程结束。

在一些实施例中，基于所述模型文件、历史数据集中各维数据的最大值和最小值，获得多维参数阈值列表的步骤之前，还包括：

对模型文件进行增量训练；增量后的模型文件包括各个所述数据簇更新后的上扩充边界和更新后的下扩充边界；

因此，最终基于增量训练后的模型文件、历史数据集中各维数据的最大值和最小值，获得多维参数阈值列表。具体的，对模型文件进行增量训练包括如下步骤：

首先，读入增量数据集，增量数据集包括由操纵接口单元的不同通道产生的实时数据的集合。然后，依次判断增量数据集中的数据是否在模型文件中各个所述数据簇的上边界、下边界、上扩充边界和下扩充边界内，以对模型文件进行增量训练。

本实施例中，在故障模型训练完成后，将训练所生成的各个簇所包含的元素以及各个簇所对应的上边界，下边界，上扩充边界，下扩充边界存储为可读写的模型文件。在实际操作中，可将故障模型训练系列算法作为一个可面对对象编程的类(class)中的类方法，而簇列表以及各个簇所对应的上边界列表、下边界列表、上扩充边界列表和下扩充边界列表作为类的属性。在需要增量训练时，读取原先模型文件，并将读取的内容转换为算法可以使用的数据类型，并给相应的类属性赋值，使算法类处于模型训练的训练中间过程状态。在算法类处于中间状态后，对增量训练中所需处理的各帧数据首先依次判断是否在第一个簇的上边界、下边界以及上扩充边界、下扩充边界中，并做相应的处理，处理方式与上述“判断第n帧数据是否包含在第一个数据簇的上边界和第一个数据簇的下边界内，判断第n帧数据是否包含在第一个数据簇的上扩充边界和第一个数据簇的下扩充边界内”相同，在此不做赘述；若不能并入第一个簇中，则与其他簇的上边界、下边界作比较，若在某一簇的上边界和下边界内，则并入该簇且簇的上边界、下边界不变；若不能并入已知的所有簇中，则以该数据为基础生成新簇，生成新簇的方式与上述生成新簇的方式相同，在此不做赘述，所有增量训练数据依照此方法处理完成后，增量训练结束。通过对标准化历史数据集进行故障模型训练后，得到各个数据簇的上边界、下边界、上扩充边界和下扩充边界，然后再以此为基础，读入更多的数据进行增量训练，对原来各个数据簇的上边界、下边界、上扩充边界和下扩充边界进行更新，这样可以得到范围更加合适的更新后的各个数据簇的更新后上扩充边界和更新后下扩充边界，再将各个数据簇的更新后上扩充边界和更新后下扩充边界，以及历史数据集中各维数据的最大值和最小值排列起来，即可得到多维参数阈值列表，由于通过对历史数据集进行了故障模型训练和增量训练，能从大量正常的历史数据集中获取更多有用信息，挖掘出各数据的正常阈值范围，并细化了阈值，因此获得的阈值列表中的数据阈值灵敏度和准确性进一步得到高，从而能进一步准确的测试出飞机系统各组件的数据是否异常，进而能进一步准确的测试出飞机系统组件是否出现故障，同时通过数据的二次开发建立一个模型文件作为对象，便于用于后续数据读取与增量训练；同时，对象模型的“深度学习”，通过深度学习实现数据的增量利用，将实际生产中不停产生的数据进行训练，不断调整模型文件中簇所对应的上边界和下边界，增强上边界和下边界可靠性，可以将后期实时的工作数据再次的输入故障模型中，这样可以进一步增加用于故障模型的数据，从而可以进一步的提高数据阈值灵敏度和准确性，使得数据阈值能适应更多的数据。

在一些实施例中，如图5所示，基于所述模型文件、历史数据集中各维数据的最大值和最小值，获得多维参数阈值列表包括以下步骤：

S121：将上扩充边界和所述下扩充边界进行反归一化处理。

训练出的故障模型中的每个簇的上扩充边界和下扩充边界进行反归一化后，可以当作阈值，阈值依照参数多少可为单维阈值或多维阈值，有多少组簇即有多少组阈值，实现了现实数据对理论数据的反向补充，通过对现场数据的处理计算出各维参数的阈值范围，以其范围作为故障诊断的一个参考工具；设扩充边界某一维数据为x，初始数据中该维对应的参数数据最大值设为max，最小值设为min。则数据可反归一化处理为：

X₁＝x*(max-min)-min

其中，x₁为反归一化处理后的数据。

S122：提取历史数据集中各维数据的最大值和最小值。

历史数据集中各维数据的最大值和最小值可作为正常数据的特征信息供故障诊断过程参考，因此引入历史数据集中各维数据的最大值和最小值可以进一步提高数据阈值的准确性。

S123：基于反归一化处理后的所述上扩充边界、反归一化处理后的所述下扩充边界、所述历史数据集中各维数据的最大值和最小值，获得多维参数阈值列表。

当数据满足阈值序列中的至少一个阈值时，数据为正常，由于多维参数阈值列表中的数据阈值种类更多，因此更能准确的判断出数据是否正常。

第二方面，如图6所示，本申请提供了一种数据阈值挖掘装置，所述装置包括：

需要说明的是，本实施例中数据阈值挖掘装置中各模块是与前述实施例中的数据阈值挖掘方法中的各步骤一一对应，因此，本实施例的具体实施方式和达到的技术效果可参照前述数据阈值挖掘方法的实施方式，这里不再赘述。

此外，在一种实施例中，本申请还提供一种计算机设备，所述计算机设备包括处理器，存储器以及存储在所述存储器中的计算机程序，所述计算机程序被处理器运行时实现前述实施例中方法。

此外，在一种实施例中，本申请还提供一种计算机存储介质，所述计算机存储介质上存储有计算机程序，所述计算机程序被处理器运行时实现前述实施例中方法。

在一些实施例中，计算机可读存储介质可以是FRAM、ROM、PROM、EPROM、EEPROM、闪存、磁表面存储器、光盘、或CD-ROM等存储器；也可以是包括上述存储器之一或任意组合的各种设备。计算机可以是包括智能终端和服务器在内的各种计算设备。

在一些实施例中，可执行指令可以采用程序、软件、软件模块、脚本或代码的形式，按任意形式的编程语言(包括编译或解释语言，或者声明性或过程性语言)来编写，并且其可按任意形式部署，包括被部署为独立的程序或者被部署为模块、组件、子例程或者适合在计算环境中使用的其它单元。

作为示例，可执行指令可以但不一定对应于文件系统中的文件，可以可被存储在保存其它程序或数据的文件的一部分，例如，存储在超文本标记语言(HTML，Hyper TextMarkup Language)文档中的一个或多个脚本中，存储在专用于所讨论的程序的单个文件中，或者，存储在多个协同文件(例如，存储一个或多个模块、子程序或代码部分的文件)中。

作为示例，可执行指令可被部署为在一个计算设备上执行，或者在位于一个地点的多个计算设备上执行，又或者，在分布在多个地点且通过通信网络互连的多个计算设备上执行。

需要说明的是，在本文中，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者系统不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者系统所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括该要素的过程、方法、物品或者系统中还存在另外的相同要素。

上述本申请实施例序号仅仅为了描述，不代表实施例的优劣。

通过以上的实施方式的描述，本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现，当然也可以通过硬件，但很多情况下前者是更佳的实施方式。基于这样的理解，本申请的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质(如只读存储器/随机存取存储器、磁碟、光盘)中，包括若干指令用以使得一台多媒体终端设备(可以是手机，计算机，电视接收机，或者网络设备等)执行本申请各个实施例所述的方法。

以上仅为本申请的优选实施例，并非因此限制本申请的专利范围，凡是利用本申请说明书及附图内容所作的等效结构或等效流程变换，或直接或间接运用在其他相关的技术领域，均同理包括在本申请的专利保护范围内。

Claims

1.一种数据阈值挖掘方法，其特征在于，所述方法包括：

2.如权利要求1所述的数据阈值挖掘方法，其特征在于，所述获得历史数据集，包括：

获得所述操纵接口单元的不同通道产生的数据；

3.如权利要求1所述的数据阈值挖掘方法，其特征在于，在所述将所述历史数据集基于聚类进行故障模型训练，以获得模型文件的步骤之前，还包括：

对所述历史数据集进行标准化处理；

4.如权利要求3所述的数据阈值挖掘方法，其特征在于，所述对所述历史数据集进行标准化处理，包括：

提取所述历史数据集中的各维数据；

5.如权利要求4所述的数据阈值挖掘方法，其特征在于，根据如下关系式，对该维所述数据进行更新：

x₀＝(x-min)/(max-min)

6.如权利要求1所述的数据阈值挖掘方法，其特征在于，所述将所述历史数据集基于聚类进行故障模型训练，以获得模型文件，包括：

基于所述第一个元素，初始化所述第一个数据簇的上边界、所述第一个数据簇的下边界、所述第一个数据簇的上扩充边界和所述第一个数据簇的下扩充边界；

7.如权利要求6所述的数据阈值挖掘方法，其特征在于，根据如下关系式，初始化第一个数据簇的上边界：

B_u(1)＝V_c(1)(1)+T_id

根据如下关系式，初始化第一个数据簇的下边界：

B_l(1)＝V_c(1)(1)-T_id

其中，B_l(1)表示第一个数据簇的下边界；

根据如下关系式，初始化第一个数据簇的上扩充边界：

B_ue(1)＝V_c(1)(1)+T_icd

根据如下关系式，初始化第一个数据簇的下扩充边界：

B_le(1)＝V_c(1)(1)-T_icd

其中，B_le(1)表示第一个数据簇的下扩充边界。

8.如权利要求6所述的数据阈值挖掘方法，其特征在于，所述基于接收到的第一判断指令和第二判断指令，判断所述历史数据集中的第n帧数据，以获得模型文件，包括：

若所述第n帧数据不满足所述第一判断指令，且不满足所述第二判断指令，则将所述第n帧数据生成第i个数据簇；并获得所述第i个数据簇的初始上边界、所述第i个数据簇的初始下边界、所述第i个数据簇的初始上扩充边界和所述第i个数据簇的初始下扩充边界；其中，i表示大于1的自然数；

9.如权利要求8所述的数据阈值挖掘方法，其特征在于，根据如下关系式，更新第一个数据簇的下边界：

B′_l(1)＝V_c(1)mim+(V_c(1)Smin-V_c(1)min)*R_e

其中，B′_l(1)表示第一个数据簇更新后的下边界，V_c(1)min表示第一个数据簇对应的每一维数据的最小值依次排列为的数据簇最小值向量，V_c(1)smin表示数据簇次最小值向量，R_e表示数据簇的扩展率；

根据如下关系式，更新第一个数据簇的上边界：

B′_u(1)＝V_c(1)max+(V_c(1)max-V_c(1)Smax)*R_e

其中，B′_u(1)表示第一个数据簇更新后的上边界，V_c(1)max表示第一个数据簇对应的每一维的最大值依次排列为的数据簇最大值向量，V_c(1)Smax表示数据簇次最大值向量；

根据如下关系式，更新第一个数据簇的上扩充边界：

B′_ue(1)＝B_ue(1)+(B_u(1)-B_l(1))*R_e

其中，B′_ue(1)表示第一个数据簇更新后的上扩充边界；

根据如下关系式，更新第一个数据簇的下扩充边界：

B′_le(1)＝B_le(1)-(B_u(1)-B_l(1))*R_e

其中，B′_le(1)表示第一个数据簇更新后下扩充边界。

10.如权利要求8所述的数据阈值挖掘方法，其特征在于，所述将所述第n帧数据生成第i个数据簇，包括如下步：

11.如权利要求10所述的数据阈值挖掘方法，其特征在于，根据如下关系式，初始化第i个数据簇的上边界：

B_u(i)＝V_c(i)(1)+T_id

根据如下关系式，初始化第i个数据簇的下边界：

B_l(i)＝V_c(i)(1)-T_id

其中，B_l(i)表示第i个数据簇的下边界；

根据如下关系式，初始化第i个数据簇的上扩充边界：

B_ue(i)＝B_u(i)

其中，B_ue(i)表示第i个数据簇的上扩充边界；

根据如下关系式，初始化第i个数据簇的下扩充边界：

B_le(i)＝B_l(i)

其中，B_le(i)表示第i个数据簇的下扩充边界。

12.如权利要求1-11任一项所述的数据阈值挖掘方法，其特征在于，所述基于所述模型文件、所述历史数据集中各维数据的最大值和最小值，获得多维参数阈值列表的步骤之前，还包括：

13.如权利要求12所述的数据阈值挖掘方法，其特征在于，所述对所述模型文件进行增量训练，包括：

依次判断所述增量数据集中的数据是否在所述模型文件中各个所述数据簇的上边界、下边界、上扩充边界和下扩充边界内，以对所述模型文件进行增量训练。

14.如权利要求1所述的数据阈值挖掘方法，其特征在于，所述基于所述模型文件、所述历史数据集中各维数据的最大值和最小值，获得多维参数阈值列表，包括：

将所述上扩充边界和所述下扩充边界进行反归一化处理；

提取所述历史数据集中各维数据的最大值和最小值；

15.一种数据阈值挖掘装置，其特征在于，所述装置包括：

16.一种计算机设备，其特征在于，该计算机设备包括存储器和处理器，所述存储器中存储有计算机程序，所述处理器执行所述计算机程序，实现如权利要求1-14中任一项所述的方法。

17.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质上存储有计算机程序，处理器执行所述计算机程序，实现如权利要求1-14中任一项所述的方法。