CN112949733A - 故障因子数据的获取方法、装置、电子装置及存储介质 - Google Patents

故障因子数据的获取方法、装置、电子装置及存储介质 Download PDF

Info

Publication number
CN112949733A
CN112949733A CN202110271569.1A CN202110271569A CN112949733A CN 112949733 A CN112949733 A CN 112949733A CN 202110271569 A CN202110271569 A CN 202110271569A CN 112949733 A CN112949733 A CN 112949733A
Authority
CN
China
Prior art keywords
fault
data
factor data
fault factor
factor
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202110271569.1A
Other languages
English (en)
Other versions
CN112949733B (zh
Inventor
郭洪飞
李嘉明
周杰怡
黄志涛
何智慧
朝宝
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Inner Mongolia North Hauler JSCL
Original Assignee
Jinan University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Jinan University filed Critical Jinan University
Priority to CN202110271569.1A priority Critical patent/CN112949733B/zh
Publication of CN112949733A publication Critical patent/CN112949733A/zh
Application granted granted Critical
Publication of CN112949733B publication Critical patent/CN112949733B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/243Classification techniques relating to the number of classes
    • G06F18/24323Tree-organised classifiers
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B23/00Testing or monitoring of control systems or parts thereof
    • G05B23/02Electric testing or monitoring
    • G05B23/0205Electric testing or monitoring by means of a monitoring system capable of detecting and responding to faults
    • G05B23/0218Electric testing or monitoring by means of a monitoring system capable of detecting and responding to faults characterised by the fault detection method dealing with either existing or incipient faults
    • G05B23/0224Process history based detection method, e.g. whereby history implies the availability of large amounts of data
    • G05B23/0227Qualitative history assessment, whereby the type of data acted upon, e.g. waveforms, images or patterns, is not relevant, e.g. rule based assessment; if-then decisions
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02PCLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
    • Y02P90/00Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
    • Y02P90/80Management or planning

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • General Engineering & Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Automation & Control Theory (AREA)
  • Debugging And Monitoring (AREA)

Abstract

本申请涉及故障因子数据的获取方法、装置、电子装置及存储介质,该获取方法包括获取目标设备的运行参数数据;根据故障信息确定设备故障特征,在设备参数数据中检测设备故障特征对应的第一参数数据;利用预设回归模型对第一参数数据进行处理,得到第一故障因子数据,第一故障因子数据包括多个协同影响设备产生故障的单因素故障因子数据;分别确定每个单因素故障因子数据与第一故障因子数据的相关度,根据相关度在第一故障因子数据中筛选候选故障因子数据;利用特征训练模型对候选故障因子数据进行处理,得到第一特征值,并按第一特征值自大到小选取候选故障因子作为目标故障因子数据,通过本申请,解决了相关技术中难以从参数数据中挖掘出故障因子的问题。

Description

故障因子数据的获取方法、装置、电子装置及存储介质
技术领域
本申请涉及设备故障分析技术领域,特别是涉及一种故障因子数据的获取方法、装置、电子装置及存储介质。
背景技术
在工业领域,工业生产过程中由于设备故障造成停工,会产生大量的经济损失,伴随着工业4.0的深入推进和物联网技术的不断发展,重要工业设备的检测与维护数据被不断收集存储,这些检测与维护数据中包含了大量的故障信息,而这些故障信息,为后续进行故障检测和故障的因子分析提供了数据准备;但同时,这些检测与维护数据因数据量大,数据冗余、数据嘈杂等问题,使得后续进行故障检测的时间长、成本高,难以从检测与维护数据中充分挖掘出故障因子,因此,在设备故障检测中挖掘故障因子尤为重要,不仅可以指导工业设备科学的使用与维护,而且可以根据故障因子调整检修方案来减少事故发生。
针对相关技术中监测数据的数据量大、数据冗余、数据嘈杂,使得进行故障检测的时间长、成本高,难以从监测数据中挖掘出故障因子的问题,目前还没有提出有效的解决方案。
发明内容
在本实施例中提供了一种故障因子数据的获取方法、装置、电子装置及存储介质,以至少解决相关技术中监测数据的数据量大、数据冗余、数据嘈杂,使得进行故障检测的时间长、成本高,难以从监测数据中挖掘出故障因子的问题。
第一方面,本申请实施例中提供了一种故障因子数据的获取方法,包括:获取目标设备的运行参数数据,其中,所述运行参数数据包括故障信息和设备参数数据;根据所述故障信息确定所述目标设备的设备故障特征,并在所述设备参数数据中检测所述设备故障特征对应的第一参数数据,其中,所述第一参数数据表征所述目标设备产生故障的因素;利用预设回归模型对所述第一参数数据进行处理,筛选得到第一故障因子数据,其中,所述第一故障因子数据包括多个协同影响所述目标设备产生故障的单因素故障因子数据,所述单因素故障因子数据表征所述目标设备产生故障的直接因素;分别确定每个所述单因素故障因子数据与所述第一故障因子数据的相关度,并根据所述相关度在所述第一故障因子数据中筛选候选故障因子数据;利用已训练的特征训练模型对所述候选故障因子数据进行处理,得到所述候选故障因子数据的第一特征值,并按第一特征值自大到小选取至少一个所述候选故障因子作为目标故障因子数据,其中,所述已训练的特征训练模型被训练为用于根据故障因子数据得到与该故障因子数据对应的特征值,所述特征值用于表征该故障因子数据影响所述目标设备产生故障的重要度。
在其中的一些实施例中,利用预设回归模型对所述第一参数数据进行处理,筛选得到第一故障因子数据包括:获取所述第一参数数据,并利用第一回归模型对所述第一参数数据进行处理,得到单因素故障因子数据,其中,所述第一回归模型包括Logistic回归模型,所述单因素故障因子表征所述目标设备产生故障的直接因素;利用第二回归模型对所述单因素故障因子数据进行筛选,得到所述第一故障因子数据,其中,所述第二回归模型包括Adaptive-lasso Logistic回归模型。
在其中的一些实施例中,获取所述第一参数数据,并利用第一回归模型对所述第一参数数据进行处理,得到单因素故障因子数据包括:获取所述第一参数数据经所述第一回归模型处理后的第一回归系数,并判断所述第一回归系数是否大于预设阈值;在判断到所述第一回归系数大于所述预设阈值的情况下,确定所述单因素故障因子数据包括大于所述预设阈值的所述第一回归系数对应的所述第一参数数据。
在其中的一些实施例中,利用第二回归模型对所述单因素故障因子数据进行筛选,得到所述第一故障因子数据包括:获取所述单因素故障因子数据经所述第二回归模型处理后的第二回归系数;按第二回归系数自大到小选取预设数目的所述单因素故障因子数据,得到多个第二故障因子数据;确定所述第一故障因子数据包括多个所述第二故障因子数据。
在其中的一些实施例中,所述相关度包括相关系数,分别确定每个所述单因素故障因子数据与所述第一故障因子数据的相关度,并根据所述相关度在所述第一故障因子数据中筛选候选故障因子数据包括:利用预设相关系数算法分别计算每个所述单因素故障因子数据与所述第一故障因子数据的相关系数,其中,所述预设相关系数算法包括Pearson相关系数算法,所述相关系数用于表征所述单因素故障因子数据相互间的相关性;获取每个所述单因素故障因子数据的所述相关系数,并判断所述相关系数是否大于预设阈值;当判断到所述相关系数大于预设阈值的情况下,获取所述相关系数大于预设阈值的多个所述单因素故障因子数据,并将多个所述单因素故障因子数据其中一个作为所述候选故障因子数据。
在其中的一些实施例中,当判断到所述相关系数小于预设阈值的情况下,将所述相关系数小于预设阈值的多个所述单因素故障因子数据作为所述候选故障因子数据。
在其中的一些实施例中,利用随机森林模型训对所述候选故障因子数据进行处理,得到所述候选故障因子数据的第一特征值。
第二个方面,本申请实施例提供了一种故障因子数据的获取装置,包括:
获取模块,用于获取目标设备的运行参数数据,其中,所述运行参数数据包括故障信息和设备参数数据;
处理模块,用于根据所述故障信息确定所述目标设备的设备故障特征,并在所述设备参数数据中检测所述设备故障特征对应的第一参数数据,其中,所述第一参数数据表征所述目标设备产生故障的因素;
因子筛选模块,与获取模块耦合连接,用于利用预设回归模型对所述第一参数数据进行处理,筛选得到第一故障因子数据,其中,所述第一故障因子数据包括多个协同影响所述目标设备产生故障的单因素故障因子数据,所述单因素故障因子数据表征所述目标设备产生故障的直接因素;
相关度筛选模块,与因子筛选模块耦合连接,用于分别确定每个所述单因素故障因子数据与所述第一故障因子数据的相关度,并根据所述相关度在所述第一故障因子数据中筛选候选故障因子数据;
特征训练筛选模块,与相关度筛选模块耦合连接,用于利用已训练的特征训练模型对所述候选故障因子数据进行处理,得到所述候选故障因子数据的第一特征值,并按第一特征值自大到小选取至少一个所述候选故障因子作为目标故障因子数据,其中,所述已训练的特征训练模型被训练为用于根据故障因子数据得到与该故障因子数据对应的特征值,所述特征值用于表征该故障因子数据影响所述目标设备产生故障的重要度。第三个方面,在本申请实施例中提供了一种电子装置,包括存储器和处理器,存储器中存储有计算机程序,处理器被设置为运行计算机程序以执行时实现如第一个方面的所述的故障因子数据的获取方法。
第四个方面,在本申请实施例中提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现第一个方面的所述的故障因子数据的获取方法。
相比于相关技术,在本实施例中提供的故障因子数据的获取方法、装置、设备及存储介质,通过首先获取设备故障信息和设备参数数据;其次对获取的设备参数数据进行Logistic回归的单因子第一轮筛选,以及进行Adaptive-lasso Logistic回归的多因子第二轮筛选,然后对筛选出的第一故障因子数据进行相关性分析,剔除冗余因子,最后对候选故障因子数据进行随机森林分析得出目标故障因子数据,解决了相关技术中监测数据的数据量大、数据冗余、数据嘈杂,使得进行故障检测的时间长、成本高,难以从监测数据中挖掘出故障因子的问题,实现了极大地简便了筛选故障因子的工作量,提高筛选故障因子效率和评估准确率。
本申请的一个或多个实施例的细节在以下附图和描述中提出,以使本申请的其他特征、目的和优点更加简明易懂。
附图说明
此处所说明的附图用来提供对本申请的进一步理解,构成本申请的一部分,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:
图1是根据本申请实施例的故障因子数据的获取方法的终端的硬件结构框图;
图2是根据本申请实施例故障因子数据的获取方法的流程图;
图3是根据本申请优选实施例的第一故障因子数据筛选的流程图;
图4是根据本申请优选实施例的候选故障因子数据筛选的流程图;
图5是根据本申请实施例的故障因子数据的获取装置的结构框图。
具体实施方式
为更清楚地理解本申请的目的、技术方案和优点,下面结合附图和实施例,对本申请进行了描述和说明。
除另作定义外,本申请所涉及的技术术语或者科学术语应具有本申请所属技术领域具备一般技能的人所理解的一般含义。在本申请中的“一”、“一个”、“一种”、“该”、“这些”等类似的词并不表示数量上的限制,它们可以是单数或者复数。在本申请中所涉及的术语“包括”、“包含”、“具有”及其任何变体,其目的是涵盖不排他的包含;例如,包含一系列步骤或模块(单元)的过程、方法和系统、产品或设备并未限定于列出的步骤或模块(单元),而可包括未列出的步骤或模块(单元),或者可包括这些过程、方法、产品或设备固有的其他步骤或模块(单元)。在本申请中所涉及的“连接”、“相连”、“耦接”等类似的词语并不限定于物理的或机械连接,而可以包括电气连接,无论是直接连接还是间接连接。在本申请中所涉及的“多个”是指两个或两个以上。“和/或”描述关联对象的关联关系,表示可以存在三种关系,例如,“A和/或B”可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。通常情况下,字符“/”表示前后关联的对象是一种“或”的关系。在本申请中所涉及的术语“第一”、“第二”、“第三”等,只是对相似对象进行区分,并不代表针对对象的特定排序。
在本实施例中提供的方法实施例可以在终端、计算机或者类似的运算装置中执行。比如在终端上运行,图1是根据本申请实施例的故障因子数据的获取方法的终端的硬件结构框图,如图1所示,终端可以包括一个或多个(图1中仅示出一个)处理器102和用于存储数据的存储器104,其中,处理器102可以包括但不限于微处理器MCU或可编程逻辑器件FPGA等的处理装置。上述终端还可以包括用于通信功能的传输设备106以及输入输出设备108。本领域普通技术人员可以理解,图1所示的结构仅为示意,其并不对上述终端的结构造成限制。例如,终端还可包括比图1中所示更多或者更少的组件,或者具有与图1所示出的不同配置。
存储器104可用于存储计算机程序,例如,应用软件的软件程序以及模块,如在本实施例中的一种故障因子数据的获取方法对应的计算机程序,处理器102通过运行存储在存储器104内的计算机程序,从而执行各种功能应用以及数据处理,即实现上述的方法。存储器104可包括高速随机存储器,还可包括非易失性存储器,如一个或者多个磁性存储装置、闪存、或者其他非易失性固态存储器。在一些实例中,存储器104可进一步包括相对于处理器102远程设置的存储器,这些远程存储器可以通过网络连接至终端。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
传输设备106用于经由一个网络接收或者发送数据。上述的网络包括终端的通信供应商提供的无线网络。在一个实例中,传输设备106包括一个网络适配器(NetworkInterface Controller,简称为NIC),其可通过基站与其他网络设备相连从而可与互联网进行通讯。在一个实例中,传输设备106可以为射频(Radio Frequency,简称为RF)模块,其用于通过无线方式与互联网进行通讯。
本实施例提供了一种运行于上述终端的故障因子数据的获取方法,图2是根据本申请实施例故障因子数据的获取方法的流程图,如图2所示,该流程包括如下步骤:
步骤S201,获取目标设备的运行参数数据,其中,运行参数数据包括故障信息和设备参数数据。
步骤S202,根据故障信息确定目标设备的设备故障特征,并在设备参数数据中检测设备故障特征对应的第一参数数据,其中,第一参数数据表征目标设备产生故障的因素。
步骤S203,利用预设回归模型对第一参数数据进行处理,筛选得到第一故障因子数据,其中,第一故障因子数据包括多个协同影响目标设备产生故障的单因素故障因子数据,单因素故障因子数据表征目标设备产生故障的直接因素。
步骤S204,分别确定每个单因素故障因子数据与第一故障因子数据的相关度,并根据相关度在第一故障因子数据中筛选候选故障因子数据。
步骤S205,利用已训练的特征训练模型对候选故障因子数据进行处理,得到候选故障因子数据的第一特征值,并按第一特征值自大到小选取至少一个候选故障因子作为目标故障因子数据,其中,已训练的特征训练模型被训练为用于根据故障因子数据得到与该故障因子数据对应的特征值,特征值用于表征该故障因子数据影响目标设备产生故障的重要度。
通过上述步骤S201至步骤S205,通过获取目标设备的运行参数数据;根据故障信息确定目标设备的设备故障特征,并在设备参数数据中检测设备故障特征对应的第一参数数据;利用预设回归模型对第一参数数据进行处理,筛选得到第一故障因子数据;分别确定每个单因素故障因子数据与第一故障因子数据的相关度,并根据相关度在第一故障因子数据中筛选候选故障因子数据;利用已训练的特征训练模型对候选故障因子数据进行处理,得到候选故障因子数据的第一特征值,并按第一特征值自大到小选取至少一个候选故障因子作为目标故障因子数据,解决了在监测数据的数据量大、数据冗余、数据嘈杂,使得进行故障检测的时间长、成本高,难以从监测数据中挖掘出故障因子的问题,并通过首先获取设备故障信息和设备参数数据;其次对获取的设备参数数据进行预设回归模型的筛选,然后对筛选出的第一故障因子数据进行相关性分析,剔除冗余因子,最后对候选故障因子数据进行已训练的特征训练模型分析得出目标故障因子数据,极大地简便了筛选故障因子的工作量,提高筛选故障因子效率和评估准确率。
在其中的一些实施例中,第一参数数据为设备监控数据,设备故障特征为设备故障情况;设备故障情况至少包括两种情况,有故障和无故障;设备监控数据包括设备各种各样的监控数据等,其中不同设备所采集的监控数据类型一致,其中前述的设备均为同一批次同一型号设备,同一设备可以采集不同时刻的监控数据和故障情况。
图3是根据本申请优选实施例的第一故障因子数据筛选的流程图,在其中的一些实施例中,如图3所示,利用预设回归模型对第一参数数据进行处理,筛选得到第一故障因子数据包括如下步骤:
步骤S301,获取第一参数数据,并利用第一回归模型对第一参数数据进行处理,得到单因素故障因子数据,其中,第一回归模型包括Logistic回归模型,单因素故障因子表征目标设备产生故障的直接因素。
具体为:获取第一参数数据经第一回归模型处理后的第一回归系数,并判断第一回归系数是否大于预设阈值;在判断到第一回归系数大于预设阈值的情况下,确定单因素故障因子数据包括大于预设阈值的第一回归系数对应的第一参数数据。
步骤S302,利用第二回归模型对单因素故障因子数据进行筛选,得到第一故障因子数据,其中,第二回归模型包括Adaptive-lasso Logistic回归模型。
具体为:获取单因素故障因子数据经第二回归模型处理后的第二回归系数;按第二回归系数自大到小选取预设数目的单因素故障因子数据,得到多个第二故障因子数据;确定第一故障因子数据包括多个第二故障因子数据。
通过上述步骤中的获取第一参数数据,并利用第一回归模型对第一参数数据进行处理,得到单因素故障因子数据,利用第二回归模型对单因素故障因子数据进行筛选,得到第一故障因子数据,实现了筛选出直接影响设备故障的单因素故障因子数据。
需要说明的是,在本实施例中,由于某些设备监控数据可以影响设备的故障,即设备故障可以反映在某些设备监控数据中,因此,首先需要筛选出这部分与设备故障有直接联系的设备监控数据作为单因素故障因子数据。
需要进一步说明的是,在本实施例中,在进行Logistic回归后可以发现每一种设备监控数据与设备故障是否存在直接联系,用回归系数代表直接联系程度,设定某个阈值,剔除与设备故障回归系数低的设备监控数据,得到单因素故障因子数据;在本实施例中,单因素故障因子数据中的每一种设备监控数据,都与设备故障有直接联系,即该设备监控数据变化时,会引起设备故障程度变化。其中,与设备故障的直接联系指的是,当某种设备监控数据变化时,对设备故障的影响,即对设备故障程度变化的影响。具体而言,除去意外情况外,设备故障并非突然发生,而是一个变化过程,可用设备故障程度变化表示。在本实施例中,由于上述筛选出的单因素故障因子数据仅考虑了每一种设备监控数据与设备故障的直接联系,而现实中常常是多个因素(部分第一故障因子数据)共同影响设备的故障,因此,需要进行进一步处理(对应步骤S302)处理以得到单因素故障因子数据据对设备故障的共同直接影响大小,用多因子回归系数代表共同直接影响大小,选取多因子回归系数大的前N种单因素故障因子数据得到第一故障因子数据,其中N可以根据实际需求设置。
本实施例中,某一种第一故障因子数据对设备故障的共同直接影响大小指的是,在多种设备监控数据中,当该设备监控数据变化时,该设备监控数据对设备故障的直接影响大小;具体而言,是在与设备故障有关的第一故障因子数据中进一步进行筛选,筛选出影响更大的第二故障因子数据,得到第一故障因子数据。
图4是根据本申请优选实施例的候选故障因子数据筛选的流程图,如图4所示,相关度包括相关系数,分别确定每个单因素故障因子数据与第一故障因子数据的相关度,并根据相关度在第一故障因子数据中筛选候选故障因子数据包括如下步骤:
步骤S401,利用预设相关系数算法分别计算每个单因素故障因子数据与第一故障因子数据的相关系数,其中,预设相关系数算法包括Pearson相关系数算法,相关系数用于表征单因素故障因子数据相互间的相关性。
步骤S402,获取每个单因素故障因子数据的相关系数,并判断相关系数是否大于预设阈值。
步骤S403,当判断到相关系数大于预设阈值的情况下,获取相关系数大于预设阈值的多个单因素故障因子数据,并将多个单因素故障因子数据其中一个作为候选故障因子数据。
通过上述步骤中的利用预设相关系数算法分别计算每个单因素故障因子数据与第一故障因子数据的相关系数;获取每个单因素故障因子数据的相关系数,并判断相关系数是否大于预设阈值;当判断到相关系数大于预设阈值的情况下,获取相关系数大于预设阈值的多个单因素故障因子数据,并将多个单因素故障因子数据其中一个作为候选故障因子数据,实现了对候选故障因子数据的筛选。
需要说明的是,在本实施例中,尽管经过了Logistic回归、Adaptive-lassoLogistic回归的层层筛选,但不同的因子可能由相同的内在因素驱动,为了尽可能减少故障因子之间的多重共线性,进一步对故障因子间的相关关系作深入的挖掘,剔除冗余因子。
需要说明的是,在本实施例中,由于第一故障因子数据中的不同设备监控数据可能存在相关,具体而言,若某种设备监控数据A与另一种设备数据B的变化越相似,则两种设备监控数据相关性越强,当相关度达到1时,则表示设备监控数据A和设备数据B变化完全相同,此时A或B其中之一则成为了冗余数据。实际上,完全相似的两种设备监控数据可能并不存在,因而设定一个阈值,当大于该阈值时,可将其中一种设备监控数据剔除,以降低数据的冗余度,得到候选故障因子数据。
同时,由于第一故障因子数据中的不同设备监控数据可能存在相关,具体而言,若某种设备监控数据A与另一种设备数据B的变化越相似,则两种设备监控数据相关性越强,当相关度达到1时,则表示设备监控数据A和设备数据B变化完全相同,此时A或B其中之一则成为了冗余数据,实际上,完全相似的两种设备监控数据可能并不存在,因而设定一个阈值,当大于该阈值时,可将其中一种设备监控数据剔除,以降低数据的冗余度,得到候选故障因子数据。
在本实施例中,相关性分析采用Pearson相关系数进行计算分析,对于上述的第一故障因子数据的每一个故障因子,计算其与其他因子的相关系数,计算公式如下:
Figure BDA0002974745570000091
其中,r表示相关系数,N表示样本个数,xi和yi表示两个不同的故障因子的所有样本数据。
一般来说,相关系数取绝对值后,可定义:0-0.09为无相关性,0.1-0.3为弱相关,0.3-0.7为中等相关,0.7-1.0为强相关。假如选择0.7为相关性阈值,相关系数>0.7则认为两个故障因子存在高度相似的信息,可删去其中之一;当其余大部分故障因子对之间的相关性<0.5,说明筛选出来的故障因子几乎都含有相对独立的信息,如此,最大程度上消除了冗余信息,有助于减少评估工作量。
在其中的一些实施例中,还实施如下步骤:当判断到相关系数小于预设阈值的情况下,将相关系数小于预设阈值的多个单因素故障因子数据作为候选故障因子数据。
在其中的一些实施例中,已训练的特征训练模型为随机森林模型,利用随机森林模型训对候选故障因子数据进行处理,得到候选故障因子数据的第一特征值。
需要说明的是,由于对第一故障因子数据、根据相关度筛选候选故障因子数据仅进行了直接影响或关系的筛选,而并没有对采用非直接方式对目标设备的运行参数数据进行重要性的评估和筛选,因而,采用随机森林对候选故障因子数据中进行因子分析筛选,从候选故障因子数据中,筛选出重要性高的故障因子作为第一特征值。
需要说明的是,随机森林模型的训练包括:以候选故障因子数据作为特征,设备故障情况作为目标,建立随机森林模型,筛选步骤如下:首先使用随机森林对特征X进行筛选,根据随机森林重要性分数对所有特征进行排序,然后迭代地选择重要性分数最大的前n个故障因子作为预测特征训练随机森林模型,最后根据随机森林的分类精度在多个特征子集中选择最优特征子集,其中n可以根据实际需要设定。
其中,特征X的重要性分数计算具体步骤如下:
步骤1、对随机森林每一棵决策树,选择相应的袋外数据(out of bag,OOB)计算袋外数据误差,记为errOOB1。
在本实施例中,所谓袋外数据是指:随机森林模型每次建立决策树时,通过重复抽样得到一个数据用于训练决策树,其中,大约1/3的数据没有被利用,没有参与决策树的建立,没有被利用的部分数据即为袋外数据,袋外数据可以用于对决策树的性能进行评估,计算随机森林模型的预测错误率,该预测错误率称为袋外数据误差。
步骤2、随机对袋外数据OOB所有样本的特征X加入噪声干扰(可以随机改变样本在特征X处的值),再次计算袋外数据误差,记为errOOB2。
3)假设随机森林中有N棵树,则特征X的重要性=∑(errOOB2-errOOB1)/N。需要说明的是,这个数值之所以能够说明特征X的重要性的原因在于:如果加入随机噪声后,袋外数据准确率大幅度下降(即errOOB2上升),说明这个特征X对于样本的预测结果有很大影响,进而说明重要程度比较高。
需要说明的是,在上述流程中或者附图的流程图中示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
在本实施例中还提供了一种故障因子数据的获取装置,该装置用于实现上述实施例及优选实施方式,已经进行过说明的不再赘述。以下所使用的术语“模块”、“单元”、“子单元”等可以实现预定功能的软件和/或硬件的组合。尽管在以下实施例中所描述的装置较佳地以软件来实现,但是硬件,或者软件和硬件的组合的实现也是可能并被构想的。
图5是根据本申请实施例的故障因子数据的获取装置的结构框图,如图5所示,本申请实施例提供的一种故障因子数据的获取装置,包括:
获取模块51,用于获取目标设备的运行参数数据,其中,运行参数数据包括故障信息和设备参数数据.
处理模块52,与获取模块51耦合连接,用于根据故障信息确定目标设备的设备故障特征,并在设备参数数据中检测设备故障特征对应的第一参数数据,其中,第一参数数据表征目标设备产生故障的因素;
因子筛选模块53,与获取模块52耦合连接,用于利用预设回归模型对第一参数数据进行处理,筛选得到第一故障因子数据,其中,第一故障因子数据包括多个协同影响目标设备产生故障的单因素故障因子数据,单因素故障因子数据表征目标设备产生故障的直接因素;
相关度筛选模块54,与因子筛选模块52耦合连接,用于分别确定每个单因素故障因子数据与第一故障因子数据的相关度,并根据相关度在第一故障因子数据中筛选候选故障因子数据;
特征训练筛选模块55,与相关度筛选模块54耦合连接,用于利用已训练的特征训练模型对候选故障因子数据进行处理,得到候选故障因子数据的第一特征值,并按第一特征值自大到小选取至少一个候选故障因子作为目标故障因子数据,其中,已训练的特征训练模型被训练为用于根据故障因子数据得到与该故障因子数据对应的特征值,特征值用于表征该故障因子数据影响目标设备产生故障的重要度。
在其中一些实施例中,因子筛选模块53用于获取第一参数数据,并利用第一回归模型对第一参数数据进行处理,得到单因素故障因子数据,其中,第一回归模型包括Logistic回归模型,单因素故障因子表征目标设备产生故障的直接因素;利用第二回归模型对单因素故障因子数据进行筛选,得到第一故障因子数据,其中,第二回归模型包括Adaptive-lasso Logistic回归模型。
在其中的一些实施例中,因子筛选模块53还用于获取第一参数数据经第一回归模型处理后的第一回归系数,并判断第一回归系数是否大于预设阈值;在判断到第一回归系数大于预设阈值的情况下,确定单因素故障因子数据包括大于预设阈值的第一回归系数对应的第一参数数据。
在其中的一些实施例中,因子筛选模块53还用于获取单因素故障因子数据经第二回归模型处理后的第二回归系数;按第二回归系数自大到小选取预设数目的单因素故障因子数据,得到多个第二故障因子数据;确定第一故障因子数据包括多个第二故障因子数据。
在其中的一些实施例中,相关度包括相关系数,相关度筛选模块54用于利用预设相关系数算法分别计算每个单因素故障因子数据与第一故障因子数据的相关系数,其中,预设相关系数算法包括Pearson相关系数算法,相关系数用于表征单因素故障因子数据相互间的相关性;获取每个单因素故障因子数据的相关系数,并判断相关系数是否大于预设阈值;当判断到相关系数大于预设阈值的情况下,获取相关系数大于预设阈值的多个单因素故障因子数据,并将多个单因素故障因子数据其中一个作为候选故障因子数据。
在其中的一些实施例中,相关度筛选模块54还用于当判断到相关系数小于预设阈值的情况下,将相关系数小于预设阈值的多个单因素故障因子数据作为候选故障因子数据。
在其中的一些实施例中,特征训练筛选模块还用于利用随机森林模型训对候选故障因子数据进行处理,得到候选故障因子数据的第一特征值。
需要说明的是,上述各个模块可以是功能模块也可以是程序模块,既可以通过软件来实现,也可以通过硬件来实现。对于通过硬件来实现的模块而言,上述各个模块可以位于同一处理器中;或者上述各个模块还可以按照任意组合的形式分别位于不同的处理器中。
在本实施例中还提供了一种电子装置,包括存储器和处理器,该存储器中存储有计算机程序,该处理器被设置为运行计算机程序以执行上述任一项方法实施例中的步骤。
可选地,上述电子装置还可以包括传输设备以及输入输出设备,其中,该传输设备和上述处理器连接,该输入输出设备和上述处理器连接。
可选地,在本实施例中,上述处理器可以被设置为通过计算机程序执行以下步骤:
S1,获取目标设备的运行参数数据,其中,运行参数数据包括故障信息和设备参数数据。
S2,根据故障信息确定目标设备的设备故障特征,并在设备参数数据中检测设备故障特征对应的第一参数数据,其中,第一参数数据表征目标设备产生故障的因素。
S3,利用预设回归模型对第一参数数据进行处理,筛选得到第一故障因子数据,其中,第一故障因子数据包括多个协同影响目标设备产生故障的单因素故障因子数据,单因素故障因子数据表征目标设备产生故障的直接因素。
S4,分别确定每个单因素故障因子数据与第一故障因子数据的相关度,并根据相关度在第一故障因子数据中筛选候选故障因子数据。
S5,利用已训练的特征训练模型对候选故障因子数据进行处理,得到候选故障因子数据的第一特征值,并按第一特征值自大到小选取至少一个候选故障因子作为目标故障因子数据,其中,已训练的特征训练模型被训练为用于根据故障因子数据得到与该故障因子数据对应的特征值,特征值用于表征该故障因子数据影响目标设备产生故障的重要度。
需要说明的是,在本实施例中的具体示例可以参考上述实施例中所描述的示例,在本实施例中不再赘述。
此外,结合上述实施例中提供的故障因子数据的获取方法,在本实施例中还可以提供一种存储介质来实现。该存储介质上存储有计算机程序;该计算机程序被处理器执行时实现上述实施例中的任意一种故障因子数据的获取方法。
应该明白的是,这里描述的具体实施例只是用来解释这个应用,而不是用来对它进行限定。根据本申请提供的实施例,本领域普通技术人员在不进行创造性劳动的情况下得到的所有其它实施例,均属本申请保护范围。
显然,附图只是本申请的一些例子或实施例,对本领域的普通技术人员来说,也可以根据这些附图将本申请适用于其他类似情况,但无需付出创造性劳动。另外,可以理解的是,尽管在此开发过程中所做的工作可能是复杂和漫长的,但是,对于本领域的普通技术人员来说,根据本申请披露的技术内容进行的某些设计、制造或生产等更改仅是常规的技术手段,不应被视为本申请公开的内容不足。
“实施例”一词在本申请中指的是结合实施例描述的具体特征、结构或特性可以包括在本申请的至少一个实施例中。该短语出现在说明书中的各个位置并不一定意味着相同的实施例,也不意味着与其它实施例相互排斥而具有独立性或可供选择。本领域的普通技术人员能够清楚或隐含地理解的是,本申请中描述的实施例在没有冲突的情况下,可以与其它实施例结合。
以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对专利保护范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请的保护范围应以所附权利要求为准。

Claims (10)

1.一种故障因子数据的获取方法,其特征在于,包括:
获取目标设备的运行参数数据,其中,所述运行参数数据包括故障信息和设备参数数据;
根据所述故障信息确定所述目标设备的设备故障特征,并在所述设备参数数据中检测所述设备故障特征对应的第一参数数据,其中,所述第一参数数据表征所述目标设备产生故障的因素;
利用预设回归模型对所述第一参数数据进行处理,筛选得到第一故障因子数据,其中,所述第一故障因子数据包括多个协同影响所述目标设备产生故障的单因素故障因子数据,所述单因素故障因子数据表征所述目标设备产生故障的直接因素;
分别确定每个所述单因素故障因子数据与所述第一故障因子数据的相关度,并根据所述相关度在所述第一故障因子数据中筛选候选故障因子数据;
利用已训练的特征训练模型对所述候选故障因子数据进行处理,得到所述候选故障因子数据的第一特征值,并按第一特征值自大到小选取至少一个所述候选故障因子作为目标故障因子数据,其中,所述已训练的特征训练模型被训练为用于根据故障因子数据得到与该故障因子数据对应的特征值,所述特征值用于表征该故障因子数据影响所述目标设备产生故障的重要度。
2.根据权利要求1所述的故障因子数据的获取方法,其特征在于,利用预设回归模型对所述第一参数数据进行处理,筛选得到第一故障因子数据包括:
获取所述第一参数数据,并利用第一回归模型对所述第一参数数据进行处理,得到单因素故障因子数据,其中,所述第一回归模型包括Logistic回归模型,所述单因素故障因子表征所述目标设备产生故障的直接因素;
利用第二回归模型对所述单因素故障因子数据进行筛选,得到所述第一故障因子数据,其中,所述第二回归模型包括Adaptive-lasso Logistic回归模型。
3.根据权利要求2所述的故障因子数据的获取方法,其特征在于,获取所述第一参数数据,并利用第一回归模型对所述第一参数数据进行处理,得到单因素故障因子数据包括:
获取所述第一参数数据经所述第一回归模型处理后的第一回归系数,并判断所述第一回归系数是否大于预设阈值;
在判断到所述第一回归系数大于所述预设阈值的情况下,确定所述单因素故障因子数据包括大于所述预设阈值的所述第一回归系数对应的所述第一参数数据。
4.根据权利要求2所述的故障因子数据的获取方法,其特征在于,利用第二回归模型对所述单因素故障因子数据进行筛选,得到所述第一故障因子数据包括:
获取所述单因素故障因子数据经所述第二回归模型处理后的第二回归系数;
按第二回归系数自大到小选取预设数目的所述单因素故障因子数据,得到多个第二故障因子数据;
确定所述第一故障因子数据包括多个所述第二故障因子数据。
5.根据权利要求1所述的故障因子数据的获取方法,其特征在于,所述相关度包括相关系数,分别确定每个所述单因素故障因子数据与所述第一故障因子数据的相关度,并根据所述相关度在所述第一故障因子数据中筛选候选故障因子数据包括:
利用预设相关系数算法分别计算每个所述单因素故障因子数据与所述第一故障因子数据的相关系数,其中,所述预设相关系数算法包括Pearson相关系数算法,所述相关系数用于表征所述单因素故障因子数据相互间的相关性;
获取每个所述单因素故障因子数据的所述相关系数,并判断所述相关系数是否大于预设阈值;
当判断到所述相关系数大于预设阈值的情况下,获取所述相关系数大于预设阈值的多个所述单因素故障因子数据,并将多个所述单因素故障因子数据其中一个作为所述候选故障因子数据。
6.根据权利要求5所述的故障因子数据的获取方法,其特征在于,所述方法还包括:
当判断到所述相关系数小于预设阈值的情况下,将所述相关系数小于预设阈值的多个所述单因素故障因子数据作为所述候选故障因子数据。
7.根据权利要求1所述的故障因子数据的获取方法,其特征在于,利用随机森林模型训对所述候选故障因子数据进行处理,得到所述候选故障因子数据的第一特征值。
8.一种故障因子数据的获取装置,其特征在于,包括:
获取模块,用于获取目标设备的运行参数数据,其中,所述运行参数数据包括故障信息和设备参数数据;
处理模块,用于根据所述故障信息确定所述目标设备的设备故障特征,并在所述设备参数数据中检测所述设备故障特征对应的第一参数数据,其中,所述第一参数数据表征所述目标设备产生故障的因素;
因子筛选模块,与获取模块耦合连接,用于利用预设回归模型对所述第一参数数据进行处理,筛选得到第一故障因子数据,其中,所述第一故障因子数据包括多个协同影响所述目标设备产生故障的单因素故障因子数据,所述单因素故障因子数据表征所述目标设备产生故障的直接因素;
相关度筛选模块,与因子筛选模块耦合连接,用于分别确定每个所述单因素故障因子数据与所述第一故障因子数据的相关度,并根据所述相关度在所述第一故障因子数据中筛选候选故障因子数据;
特征训练筛选模块,与相关度筛选模块耦合连接,用于利用已训练的特征训练模型对所述候选故障因子数据进行处理,得到所述候选故障因子数据的第一特征值,并按第一特征值自大到小选取至少一个所述候选故障因子作为目标故障因子数据,其中,所述已训练的特征训练模型被训练为用于根据故障因子数据得到与该故障因子数据对应的特征值,所述特征值用于表征该故障因子数据影响所述目标设备产生故障的重要度。
9.一种电子装置,包括存储器和处理器,其特征在于,所述存储器中存储有计算机程序,所述处理器被设置为运行所述计算机程序以执行权利要求1-7任一所述的一种故障因子数据的获取方法。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1-7任一所述的一种故障因子数据的获取方法。
CN202110271569.1A 2021-03-12 2021-03-12 故障因子数据的获取方法、装置、电子装置及存储介质 Active CN112949733B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110271569.1A CN112949733B (zh) 2021-03-12 2021-03-12 故障因子数据的获取方法、装置、电子装置及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110271569.1A CN112949733B (zh) 2021-03-12 2021-03-12 故障因子数据的获取方法、装置、电子装置及存储介质

Publications (2)

Publication Number Publication Date
CN112949733A true CN112949733A (zh) 2021-06-11
CN112949733B CN112949733B (zh) 2022-06-07

Family

ID=76229689

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110271569.1A Active CN112949733B (zh) 2021-03-12 2021-03-12 故障因子数据的获取方法、装置、电子装置及存储介质

Country Status (1)

Country Link
CN (1) CN112949733B (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113469061A (zh) * 2021-07-03 2021-10-01 刘汉有 一种基于主成分分析法的燃气轮机故障检测方法
CN113723634A (zh) * 2021-08-30 2021-11-30 上海电气风电集团股份有限公司 故障变量确定方法、系统和可读存储介质
CN114779747A (zh) * 2022-05-11 2022-07-22 中国第一汽车股份有限公司 车辆故障原因确定系统及方法
CN115061222A (zh) * 2022-06-07 2022-09-16 安徽省气候中心 一种气候预测方法、计算机设备及存储介质
CN115134294A (zh) * 2022-06-30 2022-09-30 中国电信股份有限公司 备用路由确定方法、装置及计算机可读存储介质

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107918358A (zh) * 2017-11-17 2018-04-17 山东师范大学 数控装备故障分析方法和装置
US20190050460A1 (en) * 2017-08-10 2019-02-14 Kabushiki Kaisha Toshiba Factor analysis apparatus, factor analysis method, and non-transitory storage medium
CN110598797A (zh) * 2019-09-18 2019-12-20 北京明略软件系统有限公司 故障的检测方法及装置、存储介质和电子装置
CN111610779A (zh) * 2020-07-02 2020-09-01 青岛科技大学 一种数据驱动的非线性系统执行器故障因子的辨识技术
CN112346893A (zh) * 2020-11-10 2021-02-09 深圳市康必达控制技术有限公司 故障预测方法、装置、终端及存储介质

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20190050460A1 (en) * 2017-08-10 2019-02-14 Kabushiki Kaisha Toshiba Factor analysis apparatus, factor analysis method, and non-transitory storage medium
CN107918358A (zh) * 2017-11-17 2018-04-17 山东师范大学 数控装备故障分析方法和装置
CN110598797A (zh) * 2019-09-18 2019-12-20 北京明略软件系统有限公司 故障的检测方法及装置、存储介质和电子装置
CN111610779A (zh) * 2020-07-02 2020-09-01 青岛科技大学 一种数据驱动的非线性系统执行器故障因子的辨识技术
CN112346893A (zh) * 2020-11-10 2021-02-09 深圳市康必达控制技术有限公司 故障预测方法、装置、终端及存储介质

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
尹永娟: ""共模故障的预防以及故障因子的估计"", 《石油化工自动化》, 30 June 2015 (2015-06-30), pages 5 - 7 *
屈挺 等: ""物联网环境下面向高动态性生产系统优态运行的联动决策与控制方法"", 《机械工程学报》, 31 August 2018 (2018-08-31), pages 24 - 33 *

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113469061A (zh) * 2021-07-03 2021-10-01 刘汉有 一种基于主成分分析法的燃气轮机故障检测方法
CN113723634A (zh) * 2021-08-30 2021-11-30 上海电气风电集团股份有限公司 故障变量确定方法、系统和可读存储介质
CN114779747A (zh) * 2022-05-11 2022-07-22 中国第一汽车股份有限公司 车辆故障原因确定系统及方法
CN115061222A (zh) * 2022-06-07 2022-09-16 安徽省气候中心 一种气候预测方法、计算机设备及存储介质
CN115134294A (zh) * 2022-06-30 2022-09-30 中国电信股份有限公司 备用路由确定方法、装置及计算机可读存储介质
CN115134294B (zh) * 2022-06-30 2023-08-22 中国电信股份有限公司 备用路由确定方法、装置及计算机可读存储介质

Also Published As

Publication number Publication date
CN112949733B (zh) 2022-06-07

Similar Documents

Publication Publication Date Title
CN112949733B (zh) 故障因子数据的获取方法、装置、电子装置及存储介质
CN111309479B (zh) 一种任务并行处理的实现方法、装置、设备和介质
CN111177095B (zh) 日志分析方法、装置、计算机设备及存储介质
CN106940679B (zh) 数据处理方法及装置
CN110826648B (zh) 一种利用时序聚类算法实现故障检测的方法
CN109144813B (zh) 一种云计算系统服务器节点故障监控系统及方法
CN112153000A (zh) 网络流量异常的检测方法、装置、电子装置和存储介质
CN110134571A (zh) 旋转型机械设备健康状态监测方法及装置
CN112000502B (zh) 海量错误日志的处理方法、装置、电子装置及存储介质
CN112131907A (zh) 一种训练分类模型的方法及装置
CN111104242A (zh) 基于深度学习的操作系统的异常日志的处理方法及装置
CN111859047A (zh) 一种故障解决方法及装置
CN107491374A (zh) 一种设备停机状态的判断方法及计算设备
CN115687674A (zh) 服务于智慧云服务平台的大数据需求分析方法及系统
CN109408309A (zh) 多终端的测试方法及装置
CN114151293B (zh) 风机变桨系统的故障预警方法、系统、设备及存储介质
CN105099804A (zh) 机组故障的检测方法、服务器及终端
CN111901174B (zh) 一种服务状态通知的方法、相关装置及存储介质
CN108362957B (zh) 设备故障诊断方法、装置、储存介质和电子设备
CN115080397A (zh) 系统可靠性测试方法、装置、设备和存储介质
CN102999590B (zh) 识别官方网站的方法和系统
CN114510409A (zh) 一种应用程序代码检测方法和计算机可读存储介质
CN111428224A (zh) 基于人脸识别的电脑账户登录的方法
CN105391602A (zh) 一种数据采集测试方法和装置
CN109086207A (zh) 页面响应故障分析方法、计算机可读存储介质及终端设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
TR01 Transfer of patent right

Effective date of registration: 20231106

Address after: 014000 Baotou rare earth high tech Industrial Development Zone, Inner Mongolia Autonomous Region

Patentee after: INNER MONGOLIA NORTH HAULER JOINT STOCK Co.,Ltd.

Address before: No.206 Qianshan Road, Xiangzhou District, Zhuhai, Guangdong 519000

Patentee before: Jinan University

TR01 Transfer of patent right