CN114742234A - 故障诊断模型训练方法、故障诊断方法及相关装置 - Google Patents

故障诊断模型训练方法、故障诊断方法及相关装置 Download PDF

Info

Publication number
CN114742234A
CN114742234A CN202210380983.0A CN202210380983A CN114742234A CN 114742234 A CN114742234 A CN 114742234A CN 202210380983 A CN202210380983 A CN 202210380983A CN 114742234 A CN114742234 A CN 114742234A
Authority
CN
China
Prior art keywords
fault diagnosis
training
original
features
model
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210380983.0A
Other languages
English (en)
Inventor
刘智
秦昊
张昱
凌翔
黎丽
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Institute of Intelligent Manufacturing of Guangdong Academy of Sciences
Original Assignee
Institute of Intelligent Manufacturing of Guangdong Academy of Sciences
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Institute of Intelligent Manufacturing of Guangdong Academy of Sciences filed Critical Institute of Intelligent Manufacturing of Guangdong Academy of Sciences
Priority to CN202210380983.0A priority Critical patent/CN114742234A/zh
Publication of CN114742234A publication Critical patent/CN114742234A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01RMEASURING ELECTRIC VARIABLES; MEASURING MAGNETIC VARIABLES
    • G01R31/00Arrangements for testing electric properties; Arrangements for locating electric faults; Arrangements for electrical testing characterised by what is being tested not provided for elsewhere
    • G01R31/34Testing dynamo-electric machines
    • G01R31/343Testing dynamo-electric machines in operation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/211Selection of the most significant subset of features
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/01Dynamic search techniques; Heuristics; Dynamic trees; Branch-and-bound

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Evolutionary Computation (AREA)
  • General Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Software Systems (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Mathematical Physics (AREA)
  • Computing Systems (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Computational Linguistics (AREA)
  • Medical Informatics (AREA)
  • Testing And Monitoring For Control Systems (AREA)

Abstract

本申请提供的故障诊断模型训练方法、故障诊断方法及相关装置中,模型训练设备获取多种原始特征的重要性得分,并根据各原始特征的重要性得分筛选出待检测特征;最后,基于该待检测特征的训练数据集对机器学习模型进行训练,获得故障诊断模型。由于每个原始特征的重要性得分用于衡量对应原始特征与异步电机所产生故障之间的关联程度,因此,相较于直接使用原始特征的训练数据集对机器学习模型进行训练,提升了机器学习模型的训练效率以及所训练故障诊模型的泛化能力。

Description

故障诊断模型训练方法、故障诊断方法及相关装置
技术领域
本申请涉及故障诊断领域,具体而言,涉及一种故障诊断模型训练方法、故障诊断方法及相关装置。
背景技术
异步电机具有供电简单、价格便宜和维护方便等有点,因此,在各行各业广泛采用,是各类电动机中采用数量最大,应该最广泛、最普及的一类电机。随着工业生产系统越来越复杂,异步电机设备的一些故障信息难以直观检测,常常造成设备性能下降,故障频发,严重影响工业生产的正常进行。
因此,相关技术中提出了利用故障诊断模型对异步电机的多种待检测特征进行识别,以检测异步电机的电机状态。然而,相关技术中的多种待检测特征几乎涵盖了异步电机所有的特征信息,不仅会增大模型训练期间的样本量以及内存量,而且还会降低模型的训练速度以及所训练模型的泛化能力。
发明内容
为了克服现有技术中的至少一个不足,本实施例提供一种故障诊断模型训练方法、故障诊断方法及相关装置,包括:
第一方面,本实施例提供一种故障诊断模型训练方法,应用于模型训练设备,所述方法,包括:
获取异步电机多种原始特征的训练数据集;
根据每种所述原始特征的重要性得分,从所述多种原始特征中筛选出待检测特征;其中,每种所述原始特征的重要性得分通过对所述多种原始特征的训练数据集进行计算获得,用于衡量对应原始特征与所述异步电机所发生故障之间的关联程度;
通过所述待检测特征的训练数据集对机器学习模型进行训练,获得所述异步电机的故障诊断模型。
第二方面,本实施例提供一种故障诊断方法,应用于故障诊断设备,所述故障诊断设备配置有故诊断模型训练方法所述训练的故障诊断模型,所述方法包括:
获取待检测电机与所述待检测特征相对应的待检测数据;
将所述待检测数据输入到所述故障诊断模型,获得所述故障诊断模型对所述待检测数据的打分;
若所述打分大于故障阈值,则确定所述待检测电机发生故障。
第三发面,本实施例提供一种故障诊断模型训练装置,应用于模型训练设备,所述故障诊断模型训练装置,包括:
数据预处理模块,用于获取异步电机多种原始特征的训练数据集;
根据每种所述原始特征的重要性得分,从所述多种原始特征中筛选出待检测特征;其中,每种所述原始特征的重要性得分通过对所述多种原始特征的训练数据集进行计算获得,用于衡量对应原始特征与所述异步电机所发生故障之间的关联程度;
模型训练模块,用于通过所述待检测特征的训练数据集对机器学习模型进行训练,获得所述异步电机的故障诊断模型。
第四方面,本实施例提供一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时,实现所述的故障诊断模型训练方法或者所述的故障诊断方法。
第五方面,本实施例提供一种电子设备,所述电子设备包括处理器以及存储器,所述存储器存储有计算机程序,所述计算机程序被所述处理器执行时,实现所述的故障诊断模型训练方法或者所述的故障诊断方法。
相对于现有技术而言,本申请具有以下有益效果:
本实施提供的故障诊断模型训练方法、故障诊断方法及相关装置中,模型训练设备获取多种原始特征的重要性得分,并根据各原始特征的重要性得分筛选出待检测特征;最后,基于该待检测特征的训练数据集对机器学习模型进行训练,获得故障诊断模型。由于每个原始特征的重要性得分用于衡量对应原始特征与异步电机所产生故障之间的关联程度,因此,相较于直接使用原始特征的训练数据集对机器学习模型进行训练,提升了机器学习模型的训练效率以及所训练故障诊模型的泛化能力。
附图说明
为了更清楚地说明本申请实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本申请的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
图1为本申请实施例提供的电子设备结构示意图;
图2为本申请实施例提供的故障诊断模型训练方法的流程示意图;
图3为本申请实施例提供的原始特征示意图;
图4为本申请实施例提供的故障诊断模型训练装置的结构示意图。
图标:120-存储器;130-处理器;140-通信单元;201-数据预处理模块;202-模型训练模块。
具体实施方式
为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本申请实施例的组件可以以各种不同的配置来布置和设计。
因此,以下对在附图中提供的本申请的实施例的详细描述并非旨在限制要求保护的本申请的范围,而是仅仅表示本申请的选定实施例。基于本申请中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释。
在本申请的描述中,需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
研究发现,利用故障诊断模型对异步电机的多种待检测特征进行识别,以检测异步电机的电机状态的相关技术中,几乎涵盖了异步电机所有的特征信息。然而,该方式不仅会增大模型训练期间的样本量以及内存量,而且还会降低模型的训练速度以及所训练模型的泛化能力。研究还进一步发现,并非所有的特征信息均能反映出电机是否发生故障,以及部分特征之间存在冗余。
鉴于此,本实施例提供一种应用于模型训练设备的故障诊断模型训练方法。该方法中,模型训练设备从异步电机多种原始特征中筛选出待检测特征,并使用待检测特征的训练数据集对机器学习模型进行训练,从而提升对机器学习模型的训练效率以及所训练故障诊模型的泛化能力。并且,将训练出的故障诊断模型部署到故障诊断设备。采集待检测电机在工作期间与待检测特征相对应的待检测数据,该故障诊断设备将待检测数据输入到故障诊断模型,以诊断该待检测电机是否发生故障。
其中,在一些实施方式中,该模型训练设备与故障诊断设备可以是同一电子设备;在其他实施方式中,该模型训练设备与故障诊断设备还可以是不同的电子设备。例如,当为同一电子设备时,该模型训练设备与故障诊断设备可以是服务器。该服务器可以是单个服务器,也可以是服务器组。服务器组可以是集中式的,也可以是分布式的(例如,服务器可以是分布式系统)。在一些实施例中,服务器相对于用户终端,可以是本地的、也可以是远程的。在一些实施例中,服务器可以在云平台上实现;仅作为示例,云平台可以包括私有云、公有云、混合云、社区云(Community Cloud)、分布式云、跨云(Inter-Cloud)、多云(Multi-Cloud)等,或者它们的任意组合。在一些实施例中,服务器可以在具有一个或多个组件的电子设备上实现。
当不是同一设备时,该模型训练设备可以是服务器,而该故障诊断设备则可以是与服务器相对应的用户终端。该用户终端可以是,但不限于,移动终端、平板计算机、膝上型计算机等,或其任意组合。
为使本申请实施例的目的、技术方案和优点更加清楚,本实施例还提供一种电子设备的结构示意图。如图1所示,该电子设备可以包括存储器120、处理器130、通信单元140。其中,存储器120、处理器130以及通信单元140各元件相互之间直接或间接地电性连接,以实现数据的传输或交互。例如,这些元件相互之间可通过一条或多条通讯总线或信号线实现电性连接。
该存储器120可以是基于任何电子、磁性、光学或其它物理原理的信息记录装置,用于记录执行指令、数据等。在一些实施方式中,该存储器120可以是,但不限于,易失存储器、非易失性存储器、存储驱动器等。
在一些实施方式中,该易失存储器可以是随机存取存储器(Random AccessMemory,RAM);在一些实施方式中,该非易失性存储器可以是只读存储器(Read OnlyMemory,ROM)、可编程只读存储器(Programmable Read-Only Memory,PROM)、可擦除只读存储器(Erasable Programmable Read-Only Memory,EPROM)、电可擦除只读存储器(Electric Erasable Programmable Read-Only Memory,EEPROM)、闪存等;在一些实施方式中,该存储驱动器可以是磁盘驱动器、固态硬盘、任何类型的存储盘(如光盘、DVD等),或者类似的存储介质,或者它们的组合等。
该通信单元140用于通过网络收发数据。在一些实施方式中,该网络可以包括有线网络、无线网络、光纤网络、远程通信网络、内联网、因特网、局域网(Local Area Network,LAN)、广域网(Wide Area Network,WAN)、无线局域网(Wireless Local Area Networks,WLAN)、城域网(Metropolitan Area Network,MAN)、广域网(Wide Area Network,WAN)、公共电话交换网(Public Switched Telephone Network,PSTN)、蓝牙网络、ZigBee网络、或近场通信(Near Field Communication,NFC)网络等,或其任意组合。在一些实施例中,网络可以包括一个或多个网络接入点。例如,网络可以包括有线或无线网络接入点,例如基站和/或网络交换节点,服务请求处理系统的一个或多个组件可以通过该接入点连接到网络以交换数据和/或信息。
该处理器130可能是一种集成电路芯片,具有信号的处理能力,并且,该处理器可以包括一个或多个处理核(例如,单核处理器或多核处理器)。仅作为举例,上述处理器可以包括中央处理单元(Central Processing Unit,CPU)、专用集成电路(ApplicationSpecific Integrated Circuit,ASIC)、专用指令集处理器(Application SpecificInstruction-set Processor,ASIP)、图形处理单元(Graphics Processing Unit,GPU)、物理处理单元(Physics Processing Unit,PPU)、数字信号处理器(Digital SignalProcessor,DSP)、现场可编程门阵列(Field Programmable Gate Array,FPGA)、可编程逻辑器件(Programmable Logic Device,PLD)、控制器、微控制器单元、简化指令集计算机(Reduced Instruction Set Computing,RISC)、或微处理器等,或其任意组合。
基于以上相关介绍,下面结合图2对故障诊断模型训练方法的各个步骤进行详细阐述。应该理解,流程图的操作可以不按顺序实现,没有逻辑的上下文关系的步骤可以反转顺序或者同时实施。此外,本领域技术人员在本申请内容的指引下,可以向流程图添加一个或多个其他操作,也可以从流程图中移除一个或多个操作。如图2所示,该方法包括:
S101,获取异步电机多种原始特征的训练数据集。
如图3所示,该异步电机的多种原始特征可以包括静态特征以及动态特征,而静态特征包括设计参数、生产参数以及测试参数。所谓设计参数。其中,设计参数表示电机在开发设计过程中的设定相关数据,例如,包括额定电压,电流、功率,转速等;生产参数表示电机生产过程中产生的各项数据,例如,包括生产时间、原材料相关数据等;测试参数表示电机生产完成之后对电机测试运行的各项数据。
动态特征包括异步电机的电压、电流、频率、有功功率、无功功率、视在功率、基波有功功率、基波无功功率、谐波有功功率、谐波无功功率、电机转速、电机温度、电机震动、环境温度、环境湿度。
对于以上原始特征的训练数据集合,可以通过以下实施方式获得:
静态数据通过编写脚本直接从标准的数据表格中提取。而动态数据中的异步电机的电压数据可以通过安装在异步电机输入线路的电压传感器进行实时采集获得。
异步电机的电压数据电流数据通过安装在异步电机输入线路的电流传感器进行实时采集获得。异步电机的电压数据的频率、有功功率、无功功率、视在功率、基波有功功率、基波无功功率、谐波有功功率、谐波无功功率数据则可以通过实时采集的电压、电流进行计算获得。
异步电机的电机转速数据则可以通过安装在异步电机输出轴的增量式旋转编码器进行采集获得。
异步电机的电机温度则可以通过安装在异步电机定子壳体上的温度传感器进行采集获得;而异步电机电机震动可以通过安装在异步电机的定子壳体上的三轴加速度传感器进行测量,将异步电机在X,Y,Z轴方向的加速度作为震动信号。
该异步电机所处环境的环境温度可以通过安装在异步电机定子附近的温度传感器进行采集获得;环境湿度则可以通过安装在异步电机定子附近的湿度传感器进行采集获得。
另外,值得注意的是,以上原始特征的训练数据集是通过对采集的原始数据进行预处理的结果。其中,在进行预处理时,使用fillna()函数计算每项原始特征对应原始数据的均值,然后,使用计算出的均值去填充缺失数据。对于填充之后的数据,通过人工的方式对数据进行标签,用以区分故障数据和正常数据。
并且,还采用BalanceCascade算法以有Boosting的方式对打标签后的数据进行欠采样,以减少数据集欠采样过程中的数据丢失;最后,对经过数据不平衡处理的数据进行标准化处理,使得不同量纲的数据具有相同的尺度。其中,标准化处理的方式可以是Z-Score方法。
继续参见图2,在步骤S101之后,该故障诊断模型训练方法还包括:
S102,根据每种原始特征的重要性得分,从多种原始特征中筛选出待检测特征。
其中,每种原始特征的重要性得分通过对多种原始特征的训练数据集进行计算获得,用于衡量对应原始特征与异步电机所发生故障之间的关联程度。
示例性的,以环境湿度为例,对于一些在设计之初就考虑了环境湿度的异步电机而言,环境湿度的变化通常不会导致异步电机发生故障;而与之相对应的,当异步电机发生故障之后,异步电机的电压、电流等则会发生明显的变化;因此,环境湿度的重要新得分低于电压、电流的重要性得分。
因此,本实施例需要基于各原始特征的重要性得分,从多种原始特征中筛选出与异步电机故障密切相关的待检测特征,并基于筛选出的待检测特征训练出更为优异的故障诊断模型。
S103,通过待检测特征的训练数据集对机器学习模型进行训练,获得异步电机的故障诊断模型。
如此,本实施中的模型训练设备获取多种原始特征的重要性得分,并根据各原始特征的重要性得分筛选出待检测特征;最后,基于该待检测特征的训练数据集对机器学习模型进行训练,获得故障诊断模型。由于每个原始特征的重要性得分用于衡量对应原始特征与异步电机所产生故障之间的关联程度,因此,相较于直接使用原始特征的训练数据集对机器学习模型进行训练,提升了机器学习模型的训练效率以及所训练故障诊模型的泛化能力。
正如以上实施例所介绍的,每种原始特征的重要性得分通过对多种原始特征的训练数据集进行计算获得。作为一种可选地实施方式,步骤S102可以通过以下步骤对原始特征进行筛选:
S102-1,根据多种原始特征的训练数据集,通过随机森林算法构建多棵决策树。
S102-2,根据多棵决策树,获取多种原始特征的重要性得分。
其中,随机森林算法具备两层含义,第一层是随机有放回采样等量数据作为训练集,第二层是在所有特征中随机选择部分特征建立决策树。通过这种样本随机、特征随机的特点使建立的决策树各不相同,从而可以提高模型的准确性。而每个原始特征的重要性得分,则表示该原始特征在各决策树中的得分之和的平均值。
在一些实施方式中,每棵决策树可以是CART树,也即是说,本实施例使用CART决策树作为基学习器的集成算法。所谓CART树,是在给定输入随机变量X的条件下输出随机变量Y的条件概率分布,而CART假设决策树全部是二叉树,因此,决策树的每个结点只有两种选择(“是”和“否”),通过不断的划分,将特征空间划分为有限个单元,并在这些单元上确定预测的概率分布。对于CART树而言,原始特征在各决策树中的得分则表示该原始特征对应的基尼系数。
S102-3,根据多种原始特征的重要性得分,按照预设比例从多种原始特征中确定出待确认特征。
可选地,模型训练设备可以将多种原始特征按照各自重要性得分的大小进行排序,获得多种原始特征的特征序列;然后,根据重要性得分从大到小的顺序,从特征序列中截取预设比例的特征序列;最后,将截取的特征序列,作为待确认特征。
S102-4,获取待确认特征的特征数量。
S102-5,若特征数量大于数量阈值,则将待确认特征作为新的原始特征,返回执行根据多种原始特征的训练数据集,通过随机森林算法构建多棵决策树的步骤。
S102-6,若特征数量小于或者等于数量阈值,则将待确认特征作为待检测特征。
示例性,假定多种原始特征的数量为19,数量阈值为10,预设比例为80%。根据19原始特征的训练数据集进行有放回的采样,获得多个训练集;然后,基于多个训练集构建分别构建对应的决策树;进一步地,根据构建的决策树获得这19种原始特征的重要性得分;并将10种原始特征按照重要性得分的从大到小的顺序进行排序获得特征序列;最后,按照从大到小的顺序截取前80%的特征序列,从而筛选出15种待确认特征。由于大于数量阈值10,因此,将15种待确认特征作为新的原始特征,重复执行以上步骤,直到所筛选的待确认特征的数量小于10。
对于筛选出的待检测特征,可以将多种机器学习模型训练成故障诊断模型。本实施例中的机器学习模型为XGBoost算法模型,因此,该模型训练设备通过待检测特征的训练数据集对XGBoost算法模型进行训练,获得异步电机的故障诊断模型。
应理解的是,XGBoost算法模型是一个优化的分布式梯度增强库,具有高效,灵活和便携的有点。其中,XGBoost算法模型的基本原理如下:
XGBoost算法模型采用加法模型与前向分步算法,加法模型的数学表达式为:
Figure BDA0003591834260000111
式中,M表示决策树的数量,T(x,θm)表示其中第m个决策树,θm表示第m个决策树的参数。XGBoost算法模型中,采用前向分布算法,假设f0(x)=0,则在第m个模型时的决策结果表示为:
fm(x)=fm-1(x)+T(x,θm)
整个算法模型的目的在于求解θm以最小化相应的损失函数,相应的表达式为:
Figure BDA0003591834260000112
基于以上构思,下面给出构造决策树的计算公式以及衡量所构造决策树好坏的计算公式:
假设给定训练数据集具有n个样本、m个特征,则待检测特征的训练数据集可以表示为D={xi,yi},其中xi∈Rm,yi∈R。由于XGBoost算法模型本质由K个决策树模型组成的加法模型,因此,通过对K个决策树模型的预测值进行累加来拟合模型,相应的表达式为:
Figure BDA0003591834260000113
Γ={f(x)=wq(x)}(q:Rm→T,w∈RT)
也即是说,XGBoost算法模型是由所有的决策树模型(例如,CART树)构建的函数空间。其中,每棵决策树呈具有多个节点的树状结构,每个节点对应一个待检测特征,且具有对应的分支条件。因此,式中的q(x)表示将特征向量x映射为决策树叶子节点的索引函数;T表示一棵决策树对应叶子节点数量;w表示决策树中叶子节点对应的权重向量。因此,每一棵具有T个叶子节点的决策树,都对应一个树结构特征向量q和叶子节点对应的权重向量w。
XGBoost算法模型的损失函数可以表示为式:
Figure BDA0003591834260000121
式中,
Figure BDA0003591834260000122
表示XGBoost算法模型输出的预测结果与真实之间的差值,该差值的通常可以表示为一个可微分的凸函数,例如平方损失(又名均方误差)。
Figure BDA0003591834260000123
表示损失函数中的正则项,是关于叶子节点数量与叶子节点对应值向量的L2范数,用于约束决策树模型的复杂度。
由于XGBoost算法基于已有决策树模型的基础上,构建新的决策树模型,使得在新的决策树模型的作用下,逐步提升整个模型d的性能。因此,假设前面已经有了t-1棵决策树,基于以上表达式可以将第t棵树的预测结果用以下表达式进行表示:
Figure BDA0003591834260000124
由第t棵决策树的预测结果的表达式,可以将第t棵决策树的损失函数修改为:
Figure BDA0003591834260000125
对上述公式中的
Figure BDA0003591834260000126
进行泰勒二阶展开,在去掉展开式子中的常数项之后,则第t棵决策树的损失函数可以简化为:
Figure BDA0003591834260000131
式中,
Figure BDA0003591834260000132
分别表示第t棵决策树对应损失函数的一阶导数与二阶导数。
然后,将所有属于第j个叶子结点的样本xi,划分为一个叶子结点的样本集,表达式为:
Ii={i|q(xi)=j}
结合正则项的Ω(ft),则第t棵决策树的损失函数可以进一步调整为:
Figure BDA0003591834260000133
式中,
Figure BDA0003591834260000134
Gj表示叶子结点j所包含样本的一阶偏导数累加之和,为一个常量;Hj表示叶子结点j所包含样本的二阶偏导数累加之和,为一个常量。
由Gj和Hj的定义可以看出,相对于第t棵决策树而言,其对应的结果是可以计算出来的。因此,整个损失函数就是一个只包含一个变量的一元二次函数,而该变量是叶子结点的权重wj。因此,基于一元二次函数的最值公式,可以获得最优的叶子权重
Figure BDA0003591834260000135
相应的表达式:
Figure BDA0003591834260000136
将最优化的叶子节点值代入损失函数,从而形成给定了某决策树后,对应的最小损失值:
Figure BDA0003591834260000137
而该最小损失值可以用于作为衡量决策树结构好坏的指标,一般是越小越好。
以上表达式仅仅是用于衡量一棵决策树的好坏,其前提是需要有先构建一棵决策树。本实施例在实际训练过程中,采用贪心法进行树结点的分裂以构建第t棵决策树:
从树深为0(根节点)时开始,对树中的每个叶子结点尝试进行分裂;每次分裂后,原来的一个叶子结点继续分裂为左右两个子叶子结点,原叶子结点中的样本集将根据该结点的判断规则分散到左右两个叶子结点中;新分裂一个结点后,需要检测这次分裂是否会给损失函数带来增益,增益的定义如下:
Figure BDA0003591834260000141
本实施例还提供一种故障诊断方法,应用于故障诊断设备,故障诊断设备配置有通过以上实施例所提供故诊断模型训练方法训练的故障诊断模型。在故障诊断方法中,故障诊断设备获取待检测电机与待检测特征相对应的待检测数据;将待检测数据输入到故障诊断模型,获得故障诊断模型对待检测数据的打分;若打分大于故障阈值,则确定待检测电机发生故障。
由故障诊断模型的训练方式可以看出,该故障诊断模型包括多个决策树,对于输入的待检测数据,每个决策树都会给出相应的参考得分,综合各个决策树的参考得分,可以获得待检测数据最终的打分。
基于与故障诊断模型训练方法相同的发明构思,本实施例还提供一种故障诊断模型训练装置。故障诊断模型训练装置包括至少一个可以软件形式存储于存储器120或固化在模型训练设备的操作系统(Operating System,简称OS)中的软件功能模块。其中,模型训练设备中的处理器130用于执行存储器120中存储的可执行模块,例如,故障诊断模型训练装置所包括的软件功能模块及计算机程序等。因此,如图4所示,从功能上划分,故障诊断模型训练装置可以包括:
数据预处理模块201,用于获取异步电机多种原始特征的训练数据集。
数据预处理模块201,还用于根据每种原始特征的重要性得分,从多种原始特征中筛选出待检测特征;其中,每种原始特征的重要性得分通过对多种原始特征的训练数据集进行计算获得,用于衡量对应原始特征与异步电机所发生故障之间的关联程度。
本实例中,该数据预处理模块201用于实现图2中的步骤S101-S102,关于该数据预处理模块201的详细描述可以参见步骤S101-S102的详细描述。
模型训练模块202,用于通过待检测特征的训练数据集对机器学习模型进行训练,获得异步电机的故障诊断模型。
本实例中,该模型训练模块202用于实现图2中的步骤S103,关于该数据预处理模块201的详细描述可以参见步骤S103的详细描述。
另外,在本申请各个实施例中的各功能模块可以集成在一起形成一个独立的部分,也可以是各个模块单独存在,也可以两个或两个以上模块集成形成一个独立的部分。
还应理解的是,以上实施方式如果以软件功能模块的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。
因此,本实施例还提供一种计算机可读存储介质,该计算机可读存储介质存储有计算机程序,该计算机程序被处理器执行时,实现本实施例提供的故障诊断模型训练方法或者故障诊断方法。其中,该计算机可读存储介质可以是U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
本实施例提供的一种电子设备,包括处理器130及存储器120。处理器130与存储器120可经由系统总线通信。并且,存储器120存储有计算机程序,处理器通过读取并执行存储器120中与以上实施方式对应的计算机程序,实现本实施例所提供的故障诊断模型训练方法或者故障诊断法方法。
应该理解到的是,在上述实施方式中所揭露的装置和方法,也可以通过其它的方式实现。以上所描述的装置实施例仅仅是示意性的,例如,附图中的流程图和框图显示了根据本申请的多个实施例的装置、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段或代码的一部分,所述模块、程序段或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现方式中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个连续的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或动作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
以上所述,仅为本申请的各种实施方式,但本申请的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应所述以权利要求的保护范围为准。

Claims (10)

1.一种故障诊断模型训练方法,其特征在于,应用于模型训练设备,所述方法,包括:
获取异步电机多种原始特征的训练数据集;
根据每种所述原始特征的重要性得分,从所述多种原始特征中筛选出待检测特征;其中,每种所述原始特征的重要性得分通过对所述多种原始特征的训练数据集进行计算获得,用于衡量对应原始特征与所述异步电机所发生故障之间的关联程度;
通过所述待检测特征的训练数据集对机器学习模型进行训练,获得所述异步电机的故障诊断模型。
2.根据权利要求1所述的故障诊断模型训练方法,其特征在于,所述根据每种所述原始特征的重要性得分,从所述多种原始特征中筛选出待检测特征,包括:
根据所述多种原始特征的训练数据集,通过随机森林算法构建多棵决策树;
根据所述多棵决策树,获取所述多种原始特征的重要性得分;
根据所述多种原始特征的重要性得分,按照预设比例从所述多种原始特征中确定出待确认特征;
获取所述待确认特征的特征数量;
若所述特征数量大于数量阈值,则将所述待确认特征作为新的原始特征,返回执行所述根据所述多种原始特征的训练数据集,通过随机森林算法构建多棵决策树的步骤;
若所述特征数量小于或者等于所述数量阈值,则将所述待确认特征作为所述待检测特征。
3.根据权利要求2所述的故障诊断模型训练方法,其特征在于,所述根据所述多种原始特征的重要性得分,按照预设比例从所述多种原始特征中确定出待确认特征,包括:
将所述多种原始特征按照各自重要性得分的大小进行排序,获得所述多种原始特征的特征序列;
根据所述重要性得分从大到小的顺序,从所述特征序列中截取预设比例的特征序列;
将截取的特征序列,作为所述待确认特征。
4.根据权利要求2所述的故障诊断模型训练方法,其特征在于,每棵所述决策树为CART树。
5.根据权利要求1所述的故障诊断模型训练方法,其特征在于,所述多种原始特征包括静态特征以及动态特征;
所述静态特征包括设计参数、生产参数、测试参数;
所述动态特征包括所述异步电机的电压、电流、频率、有功功率、无功功率、视在功率、基波有功功率、基波无功功率、谐波有功功率、谐波无功功率、电机转速、电机温度、电机震动、环境温度、环境湿度。
6.根据权利要求1所述的故障诊断模型训练方法,其特征在于,所述机器学习模型为XGBoost算法模型,所述通过所述待检测特征的训练数据集对机器学习模型进行训练,获得所述异步电机的故障诊断模型,包括:
通过所述待检测特征的训练数据集对所述XGBoost算法模型进行训练,获得所述异步电机的故障诊断模型。
7.一种故障诊断方法,其特征在于,应用于故障诊断设备,所述故障诊断设备配置有权利要求1-6任意一项所述的故诊断模型训练方法所述训练的故障诊断模型,所述方法包括:
获取待检测电机与所述待检测特征相对应的待检测数据;
将所述待检测数据输入到所述故障诊断模型,获得所述故障诊断模型对所述待检测数据的打分;
若所述打分大于故障阈值,则确定所述待检测电机发生故障。
8.一种故障诊断模型训练装置,其特征在于,应用于模型训练设备,所述故障诊断模型训练装置,包括:
数据预处理模块,用于获取异步电机多种原始特征的训练数据集;
数据预处理模块,还用于根据每种所述原始特征的重要性得分,从所述多种原始特征中筛选出待检测特征;其中,每种所述原始特征的重要性得分通过对所述多种原始特征的训练数据集进行计算获得,用于衡量对应原始特征与所述异步电机所发生故障之间的关联程度;
模型训练模块,用于通过所述待检测特征的训练数据集对机器学习模型进行训练,获得所述异步电机的故障诊断模型。
9.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时,实现权利要求1-6任意一项所述的故障诊断模型训练方法或者权利要求7所述的故障诊断方法。
10.一种电子设备,其特征在于,所述电子设备包括处理器以及存储器,所述存储器存储有计算机程序,所述计算机程序被所述处理器执行时,实现权利要求1-6任意一项所述的故障诊断模型训练方法或者权利要求7所述的故障诊断方法。
CN202210380983.0A 2022-04-12 2022-04-12 故障诊断模型训练方法、故障诊断方法及相关装置 Pending CN114742234A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210380983.0A CN114742234A (zh) 2022-04-12 2022-04-12 故障诊断模型训练方法、故障诊断方法及相关装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210380983.0A CN114742234A (zh) 2022-04-12 2022-04-12 故障诊断模型训练方法、故障诊断方法及相关装置

Publications (1)

Publication Number Publication Date
CN114742234A true CN114742234A (zh) 2022-07-12

Family

ID=82282388

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210380983.0A Pending CN114742234A (zh) 2022-04-12 2022-04-12 故障诊断模型训练方法、故障诊断方法及相关装置

Country Status (1)

Country Link
CN (1) CN114742234A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115437886A (zh) * 2022-09-09 2022-12-06 中国电信股份有限公司 基于存算一体芯片的故障预警方法、装置、设备及存储
CN117648612A (zh) * 2024-01-30 2024-03-05 上海移视网络科技有限公司 并联电池组故障检测方法、装置、电子设备和存储介质

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115437886A (zh) * 2022-09-09 2022-12-06 中国电信股份有限公司 基于存算一体芯片的故障预警方法、装置、设备及存储
CN117648612A (zh) * 2024-01-30 2024-03-05 上海移视网络科技有限公司 并联电池组故障检测方法、装置、电子设备和存储介质
CN117648612B (zh) * 2024-01-30 2024-04-12 上海移视网络科技有限公司 并联电池组故障检测方法、装置、电子设备和存储介质

Similar Documents

Publication Publication Date Title
CN114742234A (zh) 故障诊断模型训练方法、故障诊断方法及相关装置
CN114323644B (zh) 一种齿轮箱故障诊断、信号采集方法、装置和电子设备
CN104102804A (zh) 一种预测设备器件寿命的方法及装置
CN118173121A (zh) 设备运行状态评估方法、装置、计算机设备和存储介质
CN113127469A (zh) 一种三相不平衡数据的缺失值的填补方法及系统
CN117556958A (zh) 基于神经网络的光伏发电短期预测方法及系统
CN115577573B (zh) 同步发电机输出电流的预测方法、装置、设备和存储介质
CN109100165B (zh) 桥梁运营模态分析方法、装置、终端与计算机可读存储介质
CN115713032A (zh) 一种电网预防控制方法、装置、设备及介质
JPH11175503A (ja) 時系列データ予測装置
CN114997271A (zh) 一种水电机组故障的智能诊断方法及系统
CN115146822A (zh) 光伏发电预测方法、装置及终端设备
CN115423159A (zh) 光伏发电预测方法、装置及终端设备
CN114065430A (zh) 一种行星级齿轮箱的状态数据处理方法及系统
CN113191477A (zh) 碱式电解槽的温度传感器故障诊断方法与装置
CN111859115A (zh) 用户分配方法和系统、数据处理设备及用户分配设备
CN115658371B (zh) 基于案例学习与可诊断性分析的诊断算法量化推荐方法
Megala et al. Fault Detection and Prediction of Failure Using Vibration Analysis
CN115267883B (zh) 地震响应预测模型训练及预测方法、系统、设备及介质
Wu et al. Multi-Channel vibration signals fusion based on rolling bearings and MRST-Transformer fault diagnosis model
CN118332318B (zh) 一种风机齿轮箱轴承故障定位方法、装置、介质及设备
CN114548845B (zh) 一种配网管理方法、装置及系统
Cerrada et al. Exploratory Data Analysis on the Poincaré Features of the Electrical Torque Oriented to the Severity Diagnosis of a Gearbox Tooth Breakage
CN112882822B (zh) 生成负载预测模型的方法、装置、设备和存储介质
CN113902228A (zh) 基于逐步回归与深度学习的风电功率预测方法及相关设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination