CN113761979A - 用于优化模型的方法、设备和存储介质 - Google Patents
用于优化模型的方法、设备和存储介质 Download PDFInfo
- Publication number
- CN113761979A CN113761979A CN202010500899.9A CN202010500899A CN113761979A CN 113761979 A CN113761979 A CN 113761979A CN 202010500899 A CN202010500899 A CN 202010500899A CN 113761979 A CN113761979 A CN 113761979A
- Authority
- CN
- China
- Prior art keywords
- data
- model
- physical model
- output
- abnormal
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 64
- 238000003860 storage Methods 0.000 title claims abstract description 15
- 238000001514 detection method Methods 0.000 claims abstract description 163
- 230000002159 abnormal effect Effects 0.000 claims abstract description 88
- 230000005856 abnormality Effects 0.000 claims abstract description 74
- 238000012549 training Methods 0.000 claims abstract description 57
- 238000013527 convolutional neural network Methods 0.000 claims abstract description 18
- 230000003190 augmentative effect Effects 0.000 claims description 8
- 230000002547 anomalous effect Effects 0.000 claims description 3
- 230000003247 decreasing effect Effects 0.000 claims description 2
- 238000004458 analytical method Methods 0.000 description 15
- 230000008569 process Effects 0.000 description 13
- 238000012360 testing method Methods 0.000 description 8
- 238000007405 data analysis Methods 0.000 description 6
- 238000003745 diagnosis Methods 0.000 description 6
- 238000012545 processing Methods 0.000 description 6
- 238000013528 artificial neural network Methods 0.000 description 5
- 238000004590 computer program Methods 0.000 description 5
- 238000013135 deep learning Methods 0.000 description 5
- 238000010586 diagram Methods 0.000 description 5
- 238000010801 machine learning Methods 0.000 description 5
- 238000004519 manufacturing process Methods 0.000 description 5
- 238000005070 sampling Methods 0.000 description 5
- 230000015654 memory Effects 0.000 description 4
- 230000002441 reversible effect Effects 0.000 description 4
- 238000013473 artificial intelligence Methods 0.000 description 3
- 230000008901 benefit Effects 0.000 description 3
- 238000004891 communication Methods 0.000 description 3
- 238000011161 development Methods 0.000 description 3
- 238000010606 normalization Methods 0.000 description 3
- 230000003287 optical effect Effects 0.000 description 3
- 230000004044 response Effects 0.000 description 3
- 210000004556 brain Anatomy 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 2
- 238000013145 classification model Methods 0.000 description 2
- 238000010219 correlation analysis Methods 0.000 description 2
- 230000002950 deficient Effects 0.000 description 2
- 238000000605 extraction Methods 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 230000007774 longterm Effects 0.000 description 2
- 238000012552 review Methods 0.000 description 2
- 239000004065 semiconductor Substances 0.000 description 2
- 230000006403 short-term memory Effects 0.000 description 2
- 239000013598 vector Substances 0.000 description 2
- 238000004422 calculation algorithm Methods 0.000 description 1
- 230000000295 complement effect Effects 0.000 description 1
- 239000000470 constituent Substances 0.000 description 1
- 238000005520 cutting process Methods 0.000 description 1
- 238000013480 data collection Methods 0.000 description 1
- 238000013136 deep learning model Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000007689 inspection Methods 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 238000002372 labelling Methods 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 230000007257 malfunction Effects 0.000 description 1
- 238000010297 mechanical methods and process Methods 0.000 description 1
- 230000005226 mechanical processes and functions Effects 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000008450 motivation Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000001228 spectrum Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2218/00—Aspects of pattern recognition specially adapted for signal processing
- G06F2218/08—Feature extraction
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01M—TESTING STATIC OR DYNAMIC BALANCE OF MACHINES OR STRUCTURES; TESTING OF STRUCTURES OR APPARATUS, NOT OTHERWISE PROVIDED FOR
- G01M13/00—Testing of machine parts
- G01M13/02—Gearings; Transmission mechanisms
- G01M13/021—Gearings
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01M—TESTING STATIC OR DYNAMIC BALANCE OF MACHINES OR STRUCTURES; TESTING OF STRUCTURES OR APPARATUS, NOT OTHERWISE PROVIDED FOR
- G01M13/00—Testing of machine parts
- G01M13/02—Gearings; Transmission mechanisms
- G01M13/028—Acoustic or vibration analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2218/00—Aspects of pattern recognition specially adapted for signal processing
- G06F2218/02—Preprocessing
- G06F2218/04—Denoising
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2218/00—Aspects of pattern recognition specially adapted for signal processing
- G06F2218/12—Classification; Matching
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- General Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Life Sciences & Earth Sciences (AREA)
- Evolutionary Computation (AREA)
- Computing Systems (AREA)
- Biomedical Technology (AREA)
- General Health & Medical Sciences (AREA)
- Computational Linguistics (AREA)
- Biophysics (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Molecular Biology (AREA)
- Health & Medical Sciences (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Evolutionary Biology (AREA)
- Signal Processing (AREA)
- Acoustics & Sound (AREA)
- Testing Of Devices, Machine Parts, Or Other Structures Thereof (AREA)
Abstract
公开了一种用于优化模型的方法和设备以及计算机可读存储介质。该方法包括:将标记为正常或异常的数据的时域版本输入基于卷积神经网络的异常检测模型并且将所述数据的频域版本输入物理模型;如果所述异常检测模型的输出与所述数据的标记相同而所述物理模型的输出与所述数据的标记不同,则调整所述物理模型的阈值;和如果所述异常检测模型的输出与所述数据的标记不同而所述物理模型的输出与所述数据的标记相同,则训练所述异常检测模型,其中,训练所述异常检测模型包括:调整所述物理模型的阈值,从使用调整后的阈值的所述物理模型得到其标记相对于阈值调整前反转的数据以及利用该标记反转的数据、以其反转前的标记来训练所述异常检测模型。
Description
技术领域
本公开内容涉及异常检测的领域,并且具体地涉及优化用于检测齿轮箱的异常或故障的检测模型。
背景技术
齿轮箱的自动故障检测对于降低制造企业的生产成本和提高产品质量而言具有十分重要的意义。目前,齿轮箱制造企业普遍采用人工方式来检测产品是否存在瑕疵。检测的成功率严重依赖于工人的经验和状态,无法确保检验的品质。
还已知一种基于震动信号分析的方法。然而,该方法需要质检员人工检查频谱是否有异常的频率响应,并且该方法需要采集30-60分钟的数据,效率低下,并且只能进行抽检,无法对每台齿轮箱进行检查。
发明内容
在下文中给出了关于本公开内容的简要概述,以便提供关于本公开内容的某些方面的基本理解。应当理解,这个概述并不是关于本公开内容的穷举性概述。它并不是意图确定本公开内容的关键或重要部分,也不是意图限定本公开内容的范围。其目的仅仅是以简化的形式给出某些概念,以此作为稍后论述的更详细描述的前序。
根据本发明的一个方面,提供了一种用于优化模型的方法,包括:将标记为正常或异常的数据的时域版本输入基于卷积神经网络的异常检测模型并且将所述数据的频域版本输入物理模型;如果所述异常检测模型的输出与所述数据的标记相同而所述物理模型的输出与所述数据的标记不同,则调整所述物理模型的阈值;和如果所述异常检测模型的输出与所述数据的标记不同而所述物理模型的输出与所述数据的标记相同,则训练所述异常检测模型,其中,训练所述异常检测模型包括:调整所述物理模型的阈值,从使用调整后的阈值的所述物理模型得到其标记相对于阈值调整前反转的数据以及利用该标记反转的数据、以其反转前的标记来训练所述异常检测模型。
根据本发明的另一个方面,提供了一种用于优化模型的设备,包括:数据输入装置,其被配置成将标记为正常或异常的数据的时域版本输入基于卷积神经网络的异常检测模型并且将所述数据的频域版本输入物理模型;阈值调整装置,其被配置成如果所述异常检测模型的输出与所述数据的标记相同而所述物理模型的输出与所述数据的标记不同,则调整所述物理模型的阈值;和模型训练装置,其被配置成如果所述异常检测模型的输出与所述数据的标记不同而所述物理模型的输出与所述数据的标记相同,则训练所述异常检测模型,其中,训练所述异常检测模型包括:调整所述物理模型的阈值,从使用调整后的阈值的所述物理模型得到其标记相对于阈值调整前反转的数据以及利用该标记反转的数据、以其反转前的标记来训练所述异常检测模型。
根据本发明的其它方面,还提供了相应的计算机程序代码、计算机可读存储介质和计算机程序产品。
通过本发明的用于优化模型的方法和设备,使得能够提高检测速度和检测稳定性和可靠性,并且能够在提高效率的同时减少人力成本的同时提高设备的成品率。
通过以下结合附图对本发明的优选实施方式的详细说明,本发明的这些以及其他优点将更加明显。
附图说明
为了进一步阐述本公开内容的以上和其它优点和特征,下面结合附图对本公开内容的具体实施方式作进一步详细的说明。所述附图连同下面的详细说明一起包含在本说明书中并且形成本说明书的一部分。具有相同的功能和结构的元件用相同的参考标号表示。应当理解,这些附图仅描述本公开内容的典型示例,而不应看作是对本公开内容的范围的限定。在附图中:
图1示出了传感器安装示例;
图2示意性地示出了数据分析和故障诊断系统中的建模过程和检测过程;
图3示出了基于频域分析的故障检测流程;
图4示意性地示出了基于卷积神经网络的故障检测模型;
图5A是基于频域分析的故障检测示意图;
图5B是示意性地示出了与异常知识库的交互;
图6是根据本发明的一个实施方式的用于优化模型的方法的流程图;
图7是根据本发明的一个实施方式的用于优化模型的设备的框图;和
图8是其中可以实现根据本发明的实施方式的方法和/或设备的通用个人计算机的示例性结构的框图。
具体实施方式
在下文中将结合附图对本公开的示范性实施方式进行描述。为了清楚和简明起见,在说明书中并未描述实际实施方式的所有特征。然而,应该了解,在开发任何这种实际实施方式的过程中必须做出很多特定于实施方式的决定,以便实现开发人员的具体目标,例如,符合与系统及业务相关的那些限制条件,并且这些限制条件可能会随着实施方式的不同而有所改变。此外,还应该了解,虽然开发工作有可能是非常复杂和费时的,但对得益于本公开内容的本领域技术人员来说,这种开发工作仅仅是例行的任务。
在此,还需要说明的一点是,为了避免因不必要的细节而模糊了本公开,在附图中仅仅示出了与根据本公开的方案密切相关的设备结构和/或处理步骤,而省略了与本公开关系不大的其他细节。
为了满足齿轮箱制造企业日益增长的对品质检验的需求,开发了一种用于自动检测齿轮箱故障的方案。该方案由试验台,震动信号采集设备和数据分析与故障诊断系统三个模块组成、能够方便灵活地对齿轮箱进行数据采集和故障检测并且对瑕疵产品实现自动报警。与之前基于人工的方法相比,该方案具有检测速度快,检测品质稳定可靠等特点,并且能够在提高效率的同时减少人力成本的同时提高设备的成品率。对于企业的可持续发展具有重要的意义。
已知地,用于自动检测齿轮箱故障的系统包括试验台,震动型号采集设备和数据分析与故障诊断系统三部分组成。在试验台上对齿轮箱的特定位置通过磁吸式震动传感器采集声音/震动信号,然后将数据传输到服务器上,最后通过数据分析和故障诊断系统对采集的数据进行实时分析和统计,判断设备是否出现异常。这种用于自动检测齿轮箱故障的系统的特点在于:
磁吸式传感器安装拆卸方便,检测效率高;
无需传感器阵列,只需要在若干特定位置放置传感器就可实现稳定的信号提取;和
适应性广,适合各种齿轮箱,马达,鼓风机等设备的质量检测。
传感器是自动故障检测系统的重要硬件设备。传感器信号的高准确率对于故障检测至关重要。磁吸式震动传感器具有快插接口,便于更换。图1示出了传感器安装示例。如图1所示,齿轮箱加载试验台震动采样两个采样点并且在XYZ三个方向上采样。磁吸式传感器吸附在如图1所示的六个点X1、X2、Y1、Y2、Z1和Z2上。
数据分析和故障诊断系统是本发明的方案的核心部分。图2示意性地示出了建模过程和检测过程的实施方式。如图2所示,在建模过程中,通过对预先采集的齿轮箱的正常震动信号210和异常震动信号220进行建模得到分类模型200。在检测过程中,对采集到的齿轮箱的震动信号230利用分类模型200自动判断是否有故障发生。数据分析和故障诊断系统由基于频域分析的故障检测模块和基于时域分析的故障检测模块两个部分组成。
为了便于本发明的理解,下面简要介绍基于频域分析的故障检测原理。
图3示出了基于频域分析的故障检测流程。如图3所示,首先,对通过震动传感器300采集到的时域震动信号310进行时域幅值归一化301,然后进行傅里叶变换302得到频域信号。接着,对得到的频域信号进行频域幅值最大值提取303、频域幅值归一化304、正反转幅值高点匹配305和幅值高点匹配点相似度计算306,以进行相关性分析。最后,通过对正、反转机器正常异常进行判断307并且对判断正常异常进行投票308,来最终判断齿轮箱是否存在瑕疵。
另外,为了使最终的判断结果更稳定,还可以在对震动信号310进行时域幅值归一化301之后,对数据进行分割311,例如将60秒数据分割为20秒。之后,对分割后的数据进行频域处理312。该频域处理312例如可以是上文描述的从傅里叶变换302到正、反转机器正常异常判断307的处理流程。
应指出,图3所示的故障检测流程是现有技术中已知的。因此,为了避免繁冗,在此不再对图3的各步骤的细节进行描述。
应理解,由于齿轮箱的轴承和齿轮的物理学原理,正常的齿轮箱正转和反转的频率响应是类似的。如果一个方向出故障或者双方向出故障,则顺时针(CW)方向和逆时针(CCW)方向的频率响应是不同的。利用这个现象,可以设计一种算法以用于自动判断齿轮箱是否有故障。如果齿轮箱中某些位置有瑕疵,那么这样的齿轮箱的轴和齿轮在正、反转时会产生边带,甚至变频窄波,并且频域的幅值极值点会有很大的差异。通过对正、反转的频域极值点的选取和相关性分析,如果幅值对应点出现相关度异常,那么判断该幅值异常极值点即为齿轮箱中的异常点。
齿轮箱震动信号的频域信号含有大量的噪音,并且可以通过例如加汉宁窗等方法来去除噪音。由于机械工艺的原因,齿轮箱正、反转时产生的频域信号的频域极值点无法严格的对应,因此在频域幅值极值点匹配过程中,需要利用窗口来对频域幅值极值点进行匹配。
图5A示意性地示出了基于频域分析的故障检测。如图5A所示,可以对每一个采样点的XYZ方向分别做如下操作:
1.对CW和CCW的时域数据做FFT变换;
2.在FFT频域数据上求CW幅值最大的N个极值点的位置;
3.根据CW幅值最大的N个极值点的位置分别求CCW上对应区域附近的幅值极值点;
4.根据计算的向量(x1,y1)和(x2,y2),计算两个向量的角相似度;
5.对CCW方向的最高幅值的N个点也采取1-4的相同操作;
6.最后产生2*N个角相似度,并且可以利用预先设定的阈值来判断齿轮箱是否发生故障;以及
7.对60秒采样数据进行分割(划窗采样可获得M组数据),进行以上2-6的操作,然后根据计算的M组结果进行投票,以增加计算的稳定性和鲁棒性。
同样地,为了便于本发明的理解,下面简要介绍基于时域分析的故障检测原理。
基于时域分析的故障检测模块利用深度学习技术来对时域信号进行直接建模。
深度学习是机器学习研究中的一个新的领域,其动机在于建立、模拟人脑进行分析学习的神经网络。它模仿人脑的机制来解释数据,例如图像,声音和文本。深度学习的概念源于人工神经网络的研究。含多隐层的多层感知器就是一种深度学习结构。
深度学习通过组合低层特征形成更加抽象的高层表示属性类别或特征,以发现数据的分布式特征表示。与机器学习方法一样,深度机器学习方法也有监督学习与无监督学习之分。不同的学习框架下建立的学习模型十分难不同。例如,卷积神经网络(Convolutional neural networks,简称CNN)就是一种深度的监督学习下的机器学习模型,而深度置信网络(Deep Belief Nets,简称DBNs)就是一种无监督学习下的机器学习模型。
由于齿轮箱故障检测的输出有正常和故障两类,因此这个问题属于有监督学习问题。因此,可以采用卷积神经网络来进行建模,其网络结构如图4所示。图4示出了LSTM-FCN(长期、短期记忆全卷积神经网络)结构。LSTM-FCN是一种深度学习模型,它是用长期、短期记忆网络(LSTM)扩充而成的FCN模块,并且在对时间序列信号进行分类的任务中表现出了最先进的性能。
在对如图4所示的网络结构进行训练的过程中,训练数据是从测试齿轮箱每个采样点的每个方向(XYZ)中随机截取一个固定长度的序列而形成的。网络的输出是故障和正常两类。模型训练完毕后,在测试阶段对测试齿轮箱截取同样长度的序列输入神经网络进行分类得到结果。
应理解,图4所示的卷积神经网络结构只是一个示例,并且本发明不限于此。
在试验中,训练数据集和测试数据集可以从不同的机器获取。训练数据集随机取长度为5000到40000不等的时域信号,一共3000条数据对神经网络进行训练;而测试数据集随机截取同样长度的500条数据。实验结果如下表1所示。从表1中可以发现,基于神经网络的方法只需要采样较短的时间(10秒)就能够得到97%的正确率。因此,故障检测的效率能够得到大幅的提升。
表1
下面结合图6描述根据本发明的一个实施方式的用于优化模型的方法600。
首先,在步骤601中,将标记为正常或异常的数据的时域版本输入基于卷积神经网络的异常检测模型并且将该数据的频域版本输入物理模型。
具体地,在本实施方式中,标记为正常或异常的数据是已知的,并且可以例如从齿轮制造厂获得。数据的时域版本例如可以被输入如图4所示的基于卷积神经网络的故障检测模型,而数据的频域版本例如可以被输入如图3所示的基于频域分析的故障检测模型,即物理模型。
应指出,在本实施方式中,数据的时域版本是指与齿轮箱的检测点相对应的震动信号,而数据的频域版本是指该震动信号通过时域-频域变换(例如傅里叶变换)而被转换成的频域信号。
接着,在步骤602中,如果异常检测模型的输出与数据的标记相同而物理模型的输出与数据的标记不同,则调整物理模型的阈值。
具体地,在本实施方式中,如果数据的标记为正常并且异常检测模型的输出为正常而物理模型的输出为异常,则这说明物理模型的阈值过高,因此需要减小物理模型的阈值。如果数据的标记为异常并且异常检测模型的输出为异常而物理模型的输出为正常,则这说明物理模型的阈值过低,因此需要增加物理模型的阈值。
最后,在步骤603中,如果异常检测模型的输出与数据的标记不同而物理模型的输出与数据的标记相同,则训练所述异常检测模型,其中,训练所述异常检测模型包括:调整所述物理模型的阈值,从使用调整后的阈值的所述物理模型得到其标记相对于阈值调整前反转的数据以及利用该标记反转的数据、以其反转前的标记来训练所述异常检测模型。
具体地,在本实施方式中,如果数据的标记为正常并且异常检测模型的输出为异常而物理模型的输出为正常,则这说明异常检测模型的输出有误,需要对其进行进一步的训练。在数据的标记为正常的情况下,对异常检测模型的训练包括:增加物理模型的阈值,从阈值增加的物理模型获得最初标记为正常而在增加阈值后变为异常的数据,以及利用这部分数据、以其正常标记来训练异常检测模型,从而进一步提高异常检测模型的准确度。
如果数据的标记为异常并且异常检测模型的输出为正常而物理模型的输出为异常,则对异常检测模型的训练包括:减小物理模型的阈值,从阈值减小的物理模型获得最初标记为异常而在减小阈值后变为正常的数据,以及利用这部分数据、以其异常标记来训练异常检测模型,从而进一步提高异常检测模型的准确度。
应理解,以上步骤602和603也可以以不同的顺序来执行,或者并行执行。
优选地,方法600还包括基于异常检测模型的输出和物理模型的输出来扩充异常知识库的步骤604。
具体地,在本实施方式中,在数据的标记为异常的情况下,如果异常检测模型和物理模型的输出均为异常,则基于该标记为异常的数据来扩充异常知识库。
应理解,在本实施方式中,异常知识库是指针对齿轮箱异常建立的数据库。该异常知识库例如包括:齿轮箱异常类型、异常频域图、齿轮箱结构、设计人员对此类结构的经验、意见等等。利用该知识库,设计人员可以设计出更好的齿轮箱结构,以避免齿轮箱异常。
虽然以上就齿轮箱异常进行了描述,但是本领域技术人员应理解,本发明不限于此,而是可以以适当的方式应用于任何其他机器。
下面的表2对基于频域分析的故障检测结果(物理模型)和基于时域分析的故障检测结果(人工智能模型)进行了比较。可以看出,这两种方法可以相互补充。因此,结合了频域分析和时域分析两者的方法600既能提高检测效率又能达到准确检测和故障定位的效果。
表2
从表2中可以看出,人工智能模型有助于确定物理模型的预测结果。在异常检测中以物理模型为主来输出可靠解释。
通过本发明的方案,如图5B示意性示出的,通过将黑盒510(人工智能模型)的故障检测结果与白盒520(物理模型)的故障检测结果进行比较得到的齿轮箱异常判断结果及齿轮箱的结构等知识530与异常知识库540交互,使得实现了与异常知识库540交互的两种方式:如果知识库540中已经存在检测到的异常类型,则可以从知识库查询相关知识;以及,如果知识库540中没有检测到的异常类型,则可以将该异常条目添加到知识库540中,并且针对这种异常类型添加频域图、齿轮箱结构等信息。
以上所讨论的方法可以完全由计算机可执行的程序来实现,也可以部分地或完全地使用硬件和/或固件来实现。当其用硬件和/或固件实现时,或者将计算机可执行的程序载入可运行程序的硬件设备时,则实现了下文将要描述的用于优化模型的设备。下文中,在不重复上文中已经讨论的一些细节的情况下给出这些设备的概要,但是应当注意,虽然这些设备可以执行前文所描述的方法,但是所述方法不一定采用所描述的设备的那些部件或不一定由那些部件执行。
图7示出了根据一个实施方式的用于优化模型的设备700,其包括数据输入装置701、阈值调整装置702和模型训练装置703。数据输入装置701用于将标记为正常或异常的数据的时域版本输入基于卷积神经网络的异常检测模型并且将所述数据的频域版本输入物理模型。阈值调整装置702用于如果所述异常检测模型的输出与所述数据的标记相同而所述物理模型的输出与所述数据的标记不同,则调整所述物理模型的阈值。模型训练装置703用于如果所述异常检测模型的输出与所述数据的标记不同而所述物理模型的输出与所述数据的标记相同,则训练所述异常检测模型,其中,训练所述异常检测模型包括:调整所述物理模型的阈值,从使用调整后的阈值的所述物理模型得到其标记相对于阈值调整前反转的数据以及利用该标记反转的数据、以其反转前的标记来训练所述异常检测模型。
优选地,设备700还包括知识库扩充装置704。知识库扩充装置704用于基于异常检测模型的输出和物理模型的输出来扩充异常知识库。
图7所示的用于优化模型的设备700对应于图6所示的用于优化模型的方法600。因此,用于优化模型的设备700中的各装置的相关细节已经在对图6的用于优化模型的方法600的描述中详细给出,在此不再赘述。
上述装置中各个组成模块、单元可通过软件、固件、硬件或其组合的方式进行配置。配置可使用的具体手段或方式为本领域技术人员所熟知,在此不再赘述。在通过软件或固件实现的情况下,从存储介质或网络向具有专用硬件结构的计算机(例如图8所示的通用计算机800)安装构成该软件的程序,该计算机在安装有各种程序时,能够执行各种功能等。
图8是其中可以实现根据本发明的实施方式的方法和/或设备的通用个人计算机的示例性结构的框图。如图8所示,中央处理单元(CPU)801根据只读存储器(ROM)802中存储的程序或从存储部分808加载到随机存取存储器(RAM)803的程序执行各种处理。在RAM 803中,也根据需要存储当CPU 801执行各种处理等等时所需的数据。CPU 801、ROM 802和RAM803经由总线804彼此连接。输入/输出接口805也连接到总线804。
下述部件连接到输入/输出接口805:输入部分806(包括键盘、鼠标等等)、输出部分807(包括显示器,比如阴极射线管(CRT)、液晶显示器(LCD)等,和扬声器等)、存储部分808(包括硬盘等)、通信部分809(包括网络接口卡比如LAN卡、调制解调器等)。通信部分809经由网络比如因特网执行通信处理。根据需要,驱动器810也可连接到输入/输出接口805。可移除介质811比如磁盘、光盘、磁光盘、半导体存储器等等根据需要被安装在驱动器810上,使得从中读出的计算机程序根据需要被安装到存储部分808中。
在通过软件实现上述系列处理的情况下,从网络比如因特网或存储介质比如可移除介质811安装构成软件的程序。
本领域的技术人员应当理解,这种存储介质不局限于图8所示的其中存储有程序、与设备相分离地分发以向用户提供程序的可移除介质811。可移除介质811的例子包含磁盘(包含软盘(注册商标))、光盘(包含光盘只读存储器(CD-ROM)和数字通用盘(DVD))、磁光盘(包含迷你盘(MD)(注册商标))和半导体存储器。或者,存储介质可以是ROM 802、存储部分808中包含的硬盘等等,其中存有程序,并且与包含它们的设备一起被分发给用户。
本发明还提出了相应的计算机程序代码、一种存储有机器可读取的指令代码的计算机程序产品。所述指令代码由机器读取并执行时,可执行上述根据本发明实施方式的方法。
相应地,被配置为承载上述存储有机器可读取的指令代码的程序产品的存储介质也包括在本发明的公开中。所述存储介质包括但不限于软盘、光盘、磁光盘、存储卡、存储棒等等。
通过以上描述,本公开的实施方式提供了以下的技术方案,但不限于此。
附记1.一种优化模型的方法,包括:
将标记为正常或异常的数据的时域版本输入基于卷积神经网络的异常检测模型并且将所述数据的频域版本输入物理模型;
如果所述异常检测模型的输出与所述数据的标记相同而所述物理模型的输出与所述数据的标记不同,则调整所述物理模型的阈值;
如果所述异常检测模型的输出与所述数据的标记不同而所述物理模型的输出与所述数据的标记相同,则训练所述异常检测模型,其中,训练所述异常检测模型包括:调整所述物理模型的阈值,从使用调整后的阈值的所述物理模型得到其标记相对于阈值调整前反转的数据以及利用该标记反转的数据、以其反转前的标记来训练所述异常检测模型。
附记2.根据附记1的方法,其中,如果所述数据的标记为正常并且所述异常检测模型的输出为正常而所述物理模型的输出为异常,则减小所述物理模型的阈值;以及
如果所述数据的标记为异常并且所述异常检测模型的输出为异常而所述物理模型的输出为正常,则增加所述物理模型的阈值。
附记3.根据附记1的方法,其中,训练所述异常检测模型包括:
如果所述数据的标记为正常并且所述异常检测模型的输出为异常而所述物理模型的输出为正常,则增加所述物理模型的阈值,从使用增加的阈值的所述物理模型得到其标记从正常变为异常的数据,并且利用该数据、以其正常标记来训练所述异常检测模型;以及
如果所述数据的标记为异常并且所述异常检测模型的输出为正常而所述物理模型的输出为异常,则减小所述物理模型的阈值,从使用减小的阈值的所述物理模型得到其标记从异常变为正常的数据,并且利用该数据、以其异常标记来训练所述异常检测模型。
附记4.根据附记2的方法,其中,训练所述异常检测模型包括:
如果所述数据的标记为正常并且所述异常检测模型的输出为异常而所述物理模型的输出为正常,则增加所述物理模型的阈值,从使用增加的阈值的所述物理模型得到其标记从正常变为异常的数据,并且利用该数据、以其正常标记来训练所述异常检测模型;以及
如果所述数据的标记为异常并且所述异常检测模型的输出为正常而所述物理模型的输出为异常,则减小所述物理模型的阈值,从使用减小的阈值的所述物理模型得到其标记从异常变为正常的数据,并且利用该数据、以其异常标记来训练所述异常检测模型。
附记5.根据附记1至4中任一项的方法,其中,所述数据的时域版本是与齿轮箱的检测点相对应的震动信号,并且所述数据的频域版本是所述震动信号通过时域-频域变换而被转换的频域信号。
附记6.根据附记5的方法,其中,标记为异常的数据指示所述齿轮箱的异常或故障。
附记7.根据附记6的方法,还包括基于所述物理模型的输出来扩充异常知识库。
附记8.根据附记7的方法,其中,基于所述物理模型的输出来扩充异常知识库包括:
在所述数据的标记为异常的情况下,如果所述物理模型的输出也为异常则基于该标记为异常的数据来扩充所述异常知识库。
附记9.根据附记8的方法,其中,所述异常知识库包括:齿轮箱异常类型、异常频域图表、齿轮箱构造以及设计人员对齿轮箱构造类型的经验和评述。
附记10.根据附记9的方法,其中,基于所述异常知识库来设计齿轮箱构造以避免出现齿轮箱异常。
附记11.根据附记6的方法,还包括联合使用优化后的物理模型和优化后的异常检测模型来检测齿轮箱的异常。
附记12.一种用于优化模型的设备,包括:
数据输入装置,其被配置成将标记为正常或异常的数据的时域版本输入基于卷积神经网络的异常检测模型并且将所述数据的频域版本输入物理模型;
阈值调整装置,其被配置成如果所述异常检测模型的输出与所述数据的标记相同而所述物理模型的输出与所述数据的标记不同,则调整所述物理模型的阈值;和
模型训练装置,其被配置成如果所述异常检测模型的输出与所述数据的标记不同而所述物理模型的输出与所述数据的标记相同,则训练所述异常检测模型,其中,训练所述异常检测模型包括:调整所述物理模型的阈值,从使用调整后的阈值的所述物理模型得到其标记相对于阈值调整前反转的数据以及利用该标记反转的数据、以其反转前的标记来训练所述异常检测模型。
附记13.根据附记12的设备,其中,所述阈值调整装置还被配置成:
如果所述数据的标记为正常并且所述异常检测模型的输出为正常而所述物理模型的输出为异常,则减小所述物理模型的阈值;以及
如果所述数据的标记为异常并且所述异常检测模型的输出为异常而所述物理模型的输出为正常,则增加所述物理模型的阈值。
附记14.根据附记12的设备,其中,所述模型训练装置还被配置成:
如果所述数据的标记为正常并且所述异常检测模型的输出为异常而所述物理模型的输出为正常,则增加所述物理模型的阈值,从使用增加的阈值的所述物理模型得到其标记从正常变为异常的数据,并且利用该数据、以其正常标记来训练所述异常检测模型;以及
如果所述数据的标记为异常并且所述异常检测模型的输出为正常而所述物理模型的输出为异常,则减小所述物理模型的阈值,从使用减小的阈值的所述物理模型得到其标记从异常变为正常的数据,并且利用该数据、以其异常标记来训练所述异常检测模型。
附记15.根据附记13的设备,其中,所述模型训练装置还被配置成:
如果所述数据的标记为正常并且所述异常检测模型的输出为异常而所述物理模型的输出为正常,则增加所述物理模型的阈值,从使用增加的阈值的所述物理模型得到其标记从正常变为异常的数据,并且利用该数据、以其正常标记来训练所述异常检测模型;以及
如果所述数据的标记为异常并且所述异常检测模型的输出为正常而所述物理模型的输出为异常,则减小所述物理模型的阈值,从使用减小的阈值的所述物理模型得到其标记从异常变为正常的数据,并且利用该数据、以其异常标记来训练所述异常检测模型。
附记16.根据附记12至15中任一项的设备,其中,所述数据的时域版本是与齿轮箱的检测点相对应的震动信号,并且所述数据的频域版本是所述震动信号通过时域-频域变换而被转换的频域信号。
附记17.根据附记16的设备,其中,标记为异常的数据指示所述齿轮箱的异常或故障。
附记18.根据附记17的设备,还包括知识库扩充装置,其被配置成基于所述物理模型的输出来扩充异常知识库,其中,扩充异常知识库包括:
在所述数据的标记为异常的情况下,如果所述物理模型的输出也为异常则基于该标记为异常的数据来扩充所述异常知识库。
附记19.根据附记18的设备,其中,所述异常知识库包括:齿轮箱异常类型、异常频域图表、齿轮箱构造以及设计人员对齿轮箱构造类型的经验和评述。
附记20.一种计算机可读存储介质,所述计算机可读存储介质存储有能够由处理器运行来执行以下操作的程序:
将标记为正常或异常的数据的时域版本输入基于卷积神经网络的异常检测模型并且将所述数据的频域版本输入物理模型;
如果所述异常检测模型的输出与所述数据的标记相同而所述物理模型的输出与所述数据的标记不同,则调整所述物理模型的阈值;和
如果所述异常检测模型的输出与所述数据的标记不同而所述物理模型的输出与所述数据的标记相同,则训练所述异常检测模型,其中,训练所述异常检测模型包括:调整所述物理模型的阈值,从使用调整后的阈值的所述物理模型得到其标记相对于阈值调整前反转的数据以及利用该标记反转的数据、以其反转前的标记来训练所述异常检测模型。
最后,还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。此外,在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
以上虽然结合附图详细描述了本发明的实施方式,但是应当明白,上面所描述的实施方式只是被配置为说明本发明,而并不构成对本发明的限制。对于本领域的技术人员来说,可以对上述实施方式作出各种修改和变更而没有背离本发明的实质和范围。因此,本发明的范围仅由所附的权利要求及其等效含义来限定。
Claims (10)
1.一种用于优化模型的方法,包括:
将标记为正常或异常的数据的时域版本输入基于卷积神经网络的异常检测模型并且将所述数据的频域版本输入物理模型;
如果所述异常检测模型的输出与所述数据的标记相同而所述物理模型的输出与所述数据的标记不同,则调整所述物理模型的阈值;和
如果所述异常检测模型的输出与所述数据的标记不同而所述物理模型的输出与所述数据的标记相同,则训练所述异常检测模型,其中,训练所述异常检测模型包括:调整所述物理模型的阈值,从使用调整后的阈值的所述物理模型得到其标记相对于阈值调整前反转的数据以及利用该标记反转的数据、以其反转前的标记来训练所述异常检测模型。
2.根据权利要求1所述的方法,其中,如果所述数据的标记为正常并且所述异常检测模型的输出为正常而所述物理模型的输出为异常,则减小所述物理模型的阈值;以及
如果所述数据的标记为异常并且所述异常检测模型的输出为异常而所述物理模型的输出为正常,则增加所述物理模型的阈值。
3.根据权利要求1所述的方法,其中,训练所述异常检测模型包括:
如果所述数据的标记为正常并且所述异常检测模型的输出为异常而所述物理模型的输出为正常,则增加所述物理模型的阈值,从使用增加的阈值的所述物理模型得到其标记从正常变为异常的数据,并且利用该数据、以其正常标记来训练所述异常检测模型;以及
如果所述数据的标记为异常并且所述异常检测模型的输出为正常而所述物理模型的输出为异常,则减小所述物理模型的阈值,从使用减小的阈值的所述物理模型得到其标记从异常变为正常的数据,并且利用该数据、以其异常标记来训练所述异常检测模型。
4.根据权利要求2所述的方法,其中,训练所述异常检测模型包括:
如果所述数据的标记为正常并且所述异常检测模型的输出为异常而所述物理模型的输出为正常,则增加所述物理模型的阈值,从使用增加的阈值的所述物理模型得到其标记从正常变为异常的数据,并且利用该数据、以其正常标记来训练所述异常检测模型;以及
如果所述数据的标记为异常并且所述异常检测模型的输出为正常而所述物理模型的输出为异常,则减小所述物理模型的阈值,从使用减小的阈值的所述物理模型得到其标记从异常变为正常的数据,并且利用该数据、以其异常标记来训练所述异常检测模型。
5.根据权利要求1至4中任一项所述的方法,其中,所述数据的时域版本是与齿轮箱的检测点相对应的震动信号,并且所述数据的频域版本是所述震动信号通过时域-频域变换而被转换的频域信号。
6.根据权利要求5所述的方法,其中,标记为异常的数据指示所述齿轮箱的异常或故障。
7.根据权利要求6所述的方法,还包括基于所述异常检测模型和所述物理模型的输出来扩充异常知识库,其包括:
在所述数据的标记为异常的情况下,如果所述异常检测模型和所述物理模型的输出均为异常则基于该标记为异常的数据来扩充所述异常知识库。
8.根据权利要求6所述的方法,还包括联合使用优化后的物理模型和优化后的异常检测模型来检测齿轮箱的异常。
9.一种用于优化模型的设备,包括:
数据输入装置,其被配置成将标记为正常或异常的数据的时域版本输入基于卷积神经网络的异常检测模型并且将所述数据的频域版本输入物理模型;
阈值调整装置,其被配置成如果所述异常检测模型的输出与所述数据的标记相同而所述物理模型的输出与所述数据的标记不同,则调整所述物理模型的阈值;和
模型训练装置,其被配置成如果所述异常检测模型的输出与所述数据的标记不同而所述物理模型的输出与所述数据的标记相同,则训练所述异常检测模型,其中,训练所述异常检测模型包括:调整所述物理模型的阈值,从使用调整后的阈值的所述物理模型得到其标记相对于阈值调整前反转的数据以及利用该标记反转的数据、以其反转前的标记来训练所述异常检测模型。
10.一种计算机可读存储介质,所述计算机可读存储介质存储有能够由处理器运行来执行以下操作的程序:
将标记为正常或异常的数据的时域版本输入基于卷积神经网络的异常检测模型并且将所述数据的频域版本输入物理模型;
如果所述异常检测模型的输出与所述数据的标记相同而所述物理模型的输出与所述数据的标记不同,则调整所述物理模型的阈值;和
如果所述异常检测模型的输出与所述数据的标记不同而所述物理模型的输出与所述数据的标记相同,则训练所述异常检测模型,其中,训练所述异常检测模型包括:调整所述物理模型的阈值,从使用调整后的阈值的所述物理模型得到其标记相对于阈值调整前反转的数据以及利用该标记反转的数据、以其反转前的标记来训练所述异常检测模型。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010500899.9A CN113761979B (zh) | 2020-06-04 | 2020-06-04 | 用于优化模型的方法、设备和存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010500899.9A CN113761979B (zh) | 2020-06-04 | 2020-06-04 | 用于优化模型的方法、设备和存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113761979A true CN113761979A (zh) | 2021-12-07 |
CN113761979B CN113761979B (zh) | 2023-11-14 |
Family
ID=78783675
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010500899.9A Active CN113761979B (zh) | 2020-06-04 | 2020-06-04 | 用于优化模型的方法、设备和存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113761979B (zh) |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2017210455A1 (en) * | 2016-06-01 | 2017-12-07 | Kla-Tencor Corporation | Systems and methods incorporating a neural network and a forward physical model for semiconductor applications |
US20190064389A1 (en) * | 2017-08-25 | 2019-02-28 | Huseyin Denli | Geophysical Inversion with Convolutional Neural Networks |
CN109857079A (zh) * | 2018-12-05 | 2019-06-07 | 上海交通大学 | 加工中心主轴系统工作状态异常的智能诊断方法及装置 |
CN110192192A (zh) * | 2017-01-17 | 2019-08-30 | 赛灵思公司 | 用于电路设计的基于神经网络的物理综合 |
CN110705456A (zh) * | 2019-09-29 | 2020-01-17 | 华南理工大学 | 一种基于迁移学习的微型电机异常检测方法 |
-
2020
- 2020-06-04 CN CN202010500899.9A patent/CN113761979B/zh active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2017210455A1 (en) * | 2016-06-01 | 2017-12-07 | Kla-Tencor Corporation | Systems and methods incorporating a neural network and a forward physical model for semiconductor applications |
CN109313724A (zh) * | 2016-06-01 | 2019-02-05 | 科磊股份有限公司 | 针对半导体应用并入神经网络及前向物理模型的系统及方法 |
CN110192192A (zh) * | 2017-01-17 | 2019-08-30 | 赛灵思公司 | 用于电路设计的基于神经网络的物理综合 |
US20190064389A1 (en) * | 2017-08-25 | 2019-02-28 | Huseyin Denli | Geophysical Inversion with Convolutional Neural Networks |
CN109857079A (zh) * | 2018-12-05 | 2019-06-07 | 上海交通大学 | 加工中心主轴系统工作状态异常的智能诊断方法及装置 |
CN110705456A (zh) * | 2019-09-29 | 2020-01-17 | 华南理工大学 | 一种基于迁移学习的微型电机异常检测方法 |
Non-Patent Citations (3)
Title |
---|
M. A RODRÍGUEZ-BLANCO等: "Fault Detection Methodology for the IGBT Based on Measurement of Collector Transient Current", 《2018 14TH INTERNATIONAL CONFERENCE ON POWER ELECTRONICS (CIEP)》, pages 44 - 48 * |
李宇: "基于数据驱动的风机核心部件健康监测方法研究及应用", 《中国优秀硕士学位论文全文数据库 工程科技Ⅱ辑》, no. 01, pages 042 - 530 * |
贾海琪: "空调系统空气处理机故障检测方法的研究", 《空调系统空气处理机故障检测方法的研究》, no. 05, pages 038 - 523 * |
Also Published As
Publication number | Publication date |
---|---|
CN113761979B (zh) | 2023-11-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Principi et al. | Unsupervised electric motor fault detection by using deep autoencoders | |
Yang et al. | Bearing fault automatic classification based on deep learning | |
CN112183581A (zh) | 基于自适应迁移神经网络的半监督机械故障诊断方法 | |
CN112508105B (zh) | 一种采油机故障检测与检索方法 | |
Pan et al. | A deep learning network via shunt-wound restricted Boltzmann machines using raw data for fault detection | |
Sun et al. | A non-probabilistic metric derived from condition information for operational reliability assessment of aero-engines | |
CN111914883A (zh) | 一种基于深度融合网络的主轴轴承状态评估方法及装置 | |
CN105659064A (zh) | 用于对机器进行声学分析的方法、系统及计算机程序 | |
US11853047B2 (en) | Sensor-agnostic mechanical machine fault identification | |
CN111964909A (zh) | 滚动轴承运行状态检测方法、故障诊断方法及系统 | |
Dai et al. | Group-sparsity learning approach for bearing fault diagnosis | |
Bhakta et al. | Fault diagnosis of induction motor bearing using cepstrum-based preprocessing and ensemble learning algorithm | |
Patil et al. | Support vector machine for misalignment fault classification under different loading conditions using vibro-acoustic sensor data fusion | |
CN116012681A (zh) | 基于声振信号融合的管道机器人电机故障诊断方法及系统 | |
CN116124398A (zh) | 旋转机械故障检测方法及装置、设备、存储介质 | |
Cannarile et al. | Elastic net multinomial logistic regression for fault diagnostics of on-board aeronautical systems | |
Regan et al. | Wind turbine blade damage detection using various machine learning algorithms | |
Huang et al. | Research on fan vibration fault diagnosis based on image recognition | |
Cabrera et al. | Adversarial Fault Detector Guided by One-Class Learning for a Multistage Centrifugal Pump | |
Martins et al. | Hybrid data augmentation method for combined failure recognition in rotating machines | |
CN113792597A (zh) | 一种基于自监督特征提取的机械设备异常声音检测方法 | |
Jamil et al. | Influence of one-way ANOVA and Kruskal–Wallis based feature ranking on the performance of ML classifiers for bearing fault diagnosis | |
CN113761979B (zh) | 用于优化模型的方法、设备和存储介质 | |
Tong et al. | Online bearing fault diagnosis based on a novel multiple data streams transmission scheme | |
Decker et al. | Does your model think like an engineer? explainable ai for bearing fault detection with deep learning |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |