CN116644278A - 基于样本筛选和特征提取的双模型轴承异常检测算法 - Google Patents
基于样本筛选和特征提取的双模型轴承异常检测算法 Download PDFInfo
- Publication number
- CN116644278A CN116644278A CN202310612971.0A CN202310612971A CN116644278A CN 116644278 A CN116644278 A CN 116644278A CN 202310612971 A CN202310612971 A CN 202310612971A CN 116644278 A CN116644278 A CN 116644278A
- Authority
- CN
- China
- Prior art keywords
- model
- feature extraction
- sample
- samples
- screening
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000605 extraction Methods 0.000 title claims abstract description 97
- 238000001514 detection method Methods 0.000 title claims abstract description 62
- 238000012216 screening Methods 0.000 title claims abstract description 62
- 238000004422 calculation algorithm Methods 0.000 title claims abstract description 39
- 238000012549 training Methods 0.000 claims abstract description 34
- 238000012360 testing method Methods 0.000 claims abstract description 28
- 238000000034 method Methods 0.000 claims abstract description 18
- 238000013145 classification model Methods 0.000 claims abstract description 13
- 230000001133 acceleration Effects 0.000 claims abstract description 8
- 238000007781 pre-processing Methods 0.000 claims abstract description 7
- 230000002159 abnormal effect Effects 0.000 claims description 16
- 238000005096 rolling process Methods 0.000 claims description 15
- 230000000694 effects Effects 0.000 claims description 8
- 239000011159 matrix material Substances 0.000 claims description 8
- 230000008569 process Effects 0.000 claims description 8
- 238000005070 sampling Methods 0.000 claims description 4
- 238000004458 analytical method Methods 0.000 claims description 3
- 230000005856 abnormality Effects 0.000 abstract description 16
- 238000011897 real-time detection Methods 0.000 abstract description 5
- 239000000523 sample Substances 0.000 description 101
- 238000010586 diagram Methods 0.000 description 13
- 238000004364 calculation method Methods 0.000 description 6
- 230000003044 adaptive effect Effects 0.000 description 5
- 230000007774 longterm Effects 0.000 description 4
- 238000012545 processing Methods 0.000 description 4
- 238000013527 convolutional neural network Methods 0.000 description 3
- 238000007405 data analysis Methods 0.000 description 3
- 238000012821 model calculation Methods 0.000 description 2
- 230000000737 periodic effect Effects 0.000 description 2
- 230000009467 reduction Effects 0.000 description 2
- 239000013074 reference sample Substances 0.000 description 2
- 238000000638 solvent extraction Methods 0.000 description 2
- ORILYTVJVMAKLC-UHFFFAOYSA-N Adamantane Natural products C1C(C2)CC3CC1CC2C3 ORILYTVJVMAKLC-UHFFFAOYSA-N 0.000 description 1
- 206010039203 Road traffic accident Diseases 0.000 description 1
- 238000005299 abrasion Methods 0.000 description 1
- 230000009471 action Effects 0.000 description 1
- 230000004913 activation Effects 0.000 description 1
- 238000013528 artificial neural network Methods 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000007621 cluster analysis Methods 0.000 description 1
- 230000007797 corrosion Effects 0.000 description 1
- 238000005260 corrosion Methods 0.000 description 1
- 238000013480 data collection Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000003745 diagnosis Methods 0.000 description 1
- 230000004069 differentiation Effects 0.000 description 1
- 238000007689 inspection Methods 0.000 description 1
- 238000009434 installation Methods 0.000 description 1
- 238000007477 logistic regression Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000003062 neural network model Methods 0.000 description 1
- 238000011176 pooling Methods 0.000 description 1
- 230000035945 sensitivity Effects 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
- 238000001228 spectrum Methods 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/10—Pre-processing; Data cleansing
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01J—MEASUREMENT OF INTENSITY, VELOCITY, SPECTRAL CONTENT, POLARISATION, PHASE OR PULSE CHARACTERISTICS OF INFRARED, VISIBLE OR ULTRAVIOLET LIGHT; COLORIMETRY; RADIATION PYROMETRY
- G01J5/00—Radiation pyrometry, e.g. infrared or optical thermometry
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01M—TESTING STATIC OR DYNAMIC BALANCE OF MACHINES OR STRUCTURES; TESTING OF STRUCTURES OR APPARATUS, NOT OTHERWISE PROVIDED FOR
- G01M13/00—Testing of machine parts
- G01M13/04—Bearings
- G01M13/045—Acoustic or vibration analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/213—Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/0464—Convolutional networks [CNN, ConvNet]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/048—Activation functions
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02T—CLIMATE CHANGE MITIGATION TECHNOLOGIES RELATED TO TRANSPORTATION
- Y02T90/00—Enabling technologies or technologies with a potential or indirect contribution to GHG emissions mitigation
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Physics & Mathematics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Evolutionary Computation (AREA)
- General Engineering & Computer Science (AREA)
- Artificial Intelligence (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Biomedical Technology (AREA)
- Health & Medical Sciences (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Acoustics & Sound (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Testing Of Devices, Machine Parts, Or Other Structures Thereof (AREA)
Abstract
本发明涉及异常检测技术领域,公开了一种基于样本筛选和特征提取的双模型轴承异常检测算法,包括以下步骤:步骤1:采集初始数据并进行预处理;所述初始数据为轮对的传递振动加速度信号;步骤2:将预处理后的初始数据按比例划分为训练集和测试集;步骤3:建立样本筛分模型;并采用样本筛分模型筛选出可用于特征提取的正样本和负样本;步骤4:建立特征提取模型;所述特征提取模型包括三元组特征提取网络;步骤5:建立特征分类模型,并对提取后的正样本和负样本进行特征分类,并通过训练分类边界来进行陌生样本的识别任务。本发明能够准确、高效地识别轴承异常,识别精度较高;具有线上线下实时检测效能。
Description
技术领域
本发明涉及异常检测技术领域,具体涉及一种基于样本筛选和特征提取的双模型轴承异常检测算法。
背景技术
铁路货车在运行中,由于运行速度的不断提高,载重量的不断增大,一些零部件会发生磨耗、松动、变形、腐蚀、裂纹、折断等故障。这些故障有的会直接危及货车的运行安全,在车辆技术检查作业中若不能及时发现和处理,则存在重大的铁路交通事故隐患。轴承作为铁路货车走行部中的关键组成部分之一,其异常状态的及时诊断对于保证货车运行安全十分重要。
但是,现有的轴承异常检测方案均存在一定缺陷,且大多缺乏针对铁路行业的针对性,缺乏对铁路货车轴承的特殊运行场景的实际考量,检测精度不高;并且由于普通传感器难以在铁路货车轴承(例如滚动轴承)中持续正常工作,缺乏实时检测能力。并且,现有的轴承异常检测方案,例如通过采集轴承温度数据,利用DiPCA算法,对轴承的故障进行检测的方法,以及通过聚类分析,对轴承故障进行判断的方法,虽然都能够一定程度上监测出轴承故障,但是,前者方案中的数据采集具有一定的滞后性,检测不及时;而后者方案中数据分析受数据集影响较大,异常检测准确度并不稳定且同样不具备及时性。
发明内容
本发明意在提供一种基于样本筛选和特征提取的双模型轴承异常检测算法,能够准确、高效地识别轴承异常,识别精度较高;具有实时检测效能。
本发明提供的基础方案为:基于样本筛选和特征提取的双模型轴承异常检测算法,包括以下步骤:
步骤1:采集初始数据并进行预处理;所述初始数据为轮对的传递振动加速度信号;
步骤2:将预处理后的初始数据按比例划分为训练集和测试集;
步骤3:建立样本筛分模型;并采用样本筛分模型筛选出可用于特征提取的正样本和负样本;
步骤4:建立特征提取模型;所述特征提取模型包括三元组特征提取网络;且三元组特征提取网络的输入向量设立有anchor、正样本和负样本三种样本;其中,anchor通过在正样本中随机抽取获得;并采用特征提取模型输出经三元组特征提取网络提取后的正样本和负样本;
步骤5:建立特征分类模型,并对提取后的正样本和负样本进行特征分类,并通过训练分类边界来进行陌生样本的识别任务。
本发明的工作原理及优点在于:
首先,本方案设置了样本筛选模型对样本数据进行初级筛选。相对独立的样本筛选模型能够实时地对待检测的轴承数据进行在线处理,并能够快速完成轴承数据的初步筛分确定,能够实时确定轴承是否可能存在异常,进而能够实现针对轴承的长期高频检测,具备一定的检测实时性,这是常规的异常检测方案所无法达到的。
其次,本方案设置了三元组特征提取网络进行特征提取,且在三元组特征提取网络对应的数据输入中,相较于常规的提取网络结构,增加了参考样本anchor,可使得网络收敛速度更快,有助于达到较高的特征提取效率。并且,三元组特征提取网络能够使得在模型训练过程中,与anchor属性相同的样本不断聚拢在一起,不同属性样本尽可能远离,更大程度上地扩大了正常和故障样本特征间距离,缩小了正常和正常样本特征间距离,从而能够实现更准确的识别划分,有助于达到较高的特征检测精度。
特别的是,本方案提出了基于样本筛选和特征提取的双模型检测方案,突破了常规异常检测中基础的“提取—分类”检测路线,而是设计了“筛选—提取—分类”的检测路线,具备线上线下实时检测效能。既可通过样本筛选模型完成对正负样本,即正常样本与异常样本的初步判定,进而完成轴承异常的初步确定,也可进一步通过特征提取模型和特征分类模型,进行充分的数据分析,完成对整体样本数据的统一检测。本方案可以用于日常服役列车的车轴检测,且可实现长期高频检测,有效地避免了经验检测可能带来的漏检,能够有效提升列车运行时的安全性。
附图说明
图1为本发明基于样本筛选和特征提取的双模型轴承异常检测算法实施例的算法流程示意图;
图2为本发明基于样本筛选和特征提取的双模型轴承异常检测算法实施例的双轮对滚动试验平台结构示意图;
图3为本发明基于样本筛选和特征提取的双模型轴承异常检测算法实施例的双轮对滚动试验平台结构示意框图;
图4本发明基于样本筛选和特征提取的双模型轴承异常检测算法实施例的磨合振动测台结构示意图;
图5本发明基于样本筛选和特征提取的双模型轴承异常检测算法实施例的磨合振动测台的接触部结构示意图;
图6为本发明基于样本筛选和特征提取的双模型轴承异常检测算法实施例的含有异常值的初始数据;
图7为本发明基于样本筛选和特征提取的双模型轴承异常检测算法实施例的剔除异常值之后的初始数据;
图8为本发明基于样本筛选和特征提取的双模型轴承异常检测算法实施例的异常值处理及窗口划分示意图;
图9为本发明基于样本筛选和特征提取的双模型轴承异常检测算法实施例的训练集和测试集划分示意图;
图10为本发明基于样本筛选和特征提取的双模型轴承异常检测算法实施例的适应性SVDD模型结构示意图;
图11为本发明基于样本筛选和特征提取的双模型轴承异常检测算法实施例的SVDD模型筛选得到的正样本和舍弃样本示意图;
图12为本发明基于样本筛选和特征提取的双模型轴承异常检测算法实施例的SVDD模型筛选得到的负样本示意图;
图13为本发明基于样本筛选和特征提取的双模型轴承异常检测算法实施例的三元组特征提取网络的特征提取原理示意图;
图14为本发明基于样本筛选和特征提取的双模型轴承异常检测算法实施例的一维卷积神经网络原理图;
图15为本发明基于样本筛选和特征提取的双模型轴承异常检测算法实施例的特征提取层结构示意图;
图16为本发明基于样本筛选和特征提取的双模型轴承异常检测算法实施例的特征提取效果图;
图17为本发明基于样本筛选和特征提取的双模型轴承异常检测算法实施例的特征分类效果图。
具体实施方式
下面通过具体实施方式进一步详细的说明:
说明书附图中的附图标记包括:支承部1、限位槽11、夹持部2、夹爪21、接触部22、接触片221、传感器件222、缓冲弹簧223。
实施例基本如附图1所示:基于样本筛选和特征提取的双模型轴承异常检测算法,包括以下步骤:
步骤1:采集初始数据并进行预处理;所述初始数据为轮对的传递振动加速度信号。
采集初始数据时,通过在货车卡钳平台布置与货车滚动轴承竖向一致的传感器,以收集货车轮对的传递振动加速度信号;所述货车为轨道货车。具体地,本实施例中,使用改造后的如附图2和图3所示的双轮对滚动试验平台进行数据采集,双轮对滚动试验平台同时具有前后两个轮对滚动位置,通过添加传感器采集装置可以高效实现数据采集。具体地,双轮对滚动试验平台包括前后设置的磨合振动测台组和红外测温探针。单个磨合振动测台组对应提供一个轮对安装位置,单个磨合振动测台组包括一左一右设置的两个磨合振动测台。如附图4和图5所示,所述磨合振动测台包括用来承载轮对轴承的支承部1、用来夹持轮对轴承的夹持部2和用来传递轮对轴承的动态物理信号(如轴承振动信号)的接触部22。所述支承部1上开设有向下凹陷的限位槽11,以便于与轮对轴承外圈配合并相对限位住轮对轴承。所述夹持部2包括铰接在支承部1顶面的夹爪21;所述接触部22设置在夹爪21端部,用于与轮对轴承外圈相接触。且所述接触部22包括依次连接的接触片221、传感器件222和缓冲弹簧223。
双轮对设置在货车卡钳平台处,且双轮对的轴承外圈位于磨合振动测台的支承部1上;此处轮对为滚动轴承轮对,具体对应设置的轴承为锥形滚子轴承;红外测温探针设有四个,分别与双轮对两端相对,用于实时探测滚动轴承温度。所述货车卡钳平台归属于双轮对滚动试验平台(本实施例中,磨合振动测台的支承部1即为货车卡钳平台),在货车卡钳平台上布置的传感器即为磨合振动测台的接触部22中的传感器件222。且在货车卡钳平台上布置的传感器类型为灵敏度为10g的三轴50G加速度传感器。传感器用于采集轮对轴承的竖向振动数据,具体置于限位槽11的中间位置,与经夹持部2夹持后的轮对径向一致。
并且,在数据采集时,以轮对为整体并使轮对处于正常运行时速下货车速度环境中,以进行数据采集;即采用上述的双轮对滚动试验平台进行数据采集,通过固定轴承外圈,使货车轮对整体转动即可模拟得到轨道货车运行时的状态,具体地,整体转动转速设为300rpm,相当于列车时速约35KM/h,并且,在时间域上,以3-5分钟为间隔,在双轮对滚动试验平台上对每个轮对进行持续采集,数据采集时采样频率设置为10240Hz,并取5000Hz以内的频率作为分析频率。这样设置,数据采集场景贴近于实际的货车轴承作用场景,采集到的数据可参考度更高。
在数据采集完毕后,对采集得到的初始数据进行预处理。具体地,由于数据采集过程中,红外测温探针会周期性探出,传感器会受到红外测温探针的激励,表现为加速度信号出现周期性异常值,如附图6和图7所示。因此,在预处理阶段对红外测温探针引起的周期性异常值进行剔除,有助于提高数据有效性。
如附图8所示,在预处理基础数据时,还采用移动窗口分隔方法对基础数据进行分割,以便于获得完整的振动周期数据的同时,还可增加数据总量。具体地,以两转为一个样本,根据数据采集过程中的采样频率以及车轮转速确定获取的样本容量。并按照式(1)计算出本实施例中的单个样本长度为4096。
本实施例中按照移动窗口分隔方法总共划分出6035个样本。如使用不同的车轮转速与采样频率,则得到的样本长度不同。
步骤2:将预处理后的初始数据按比例划分为训练集和测试集。
具体地,如附图9所示,在划分训练集和测试集时的划分比例为,训练集:测试集=2:1;且训练集和测试集中的正常数据样本与异常数据样本的比例相同,训练集和测试集中的数据划分比例为,正常数据样本:异常数据样本=2:1。
本步骤中还将训练集和测试集中的时域数据均转换为频域数据。
具体地,采用快速傅里叶变换,将训练集和测试集中的原始时域数据(4096点样本)转换为频域数据。并取转换结果的单边谱作为后续的输入数据,单个样本长度由4096变为2048。
步骤3:建立样本筛分模型;并采用样本筛分模型筛选出可用于特征提取的正样本(即正常数据样本)和负样本(即异常数据样本)。所述样本筛分模型采用SVDD模型。
本实施例中,首先在未知数据样本标签的前提下,建立一个初始的SVDD模型,并对其进行适应性变体以对初始样本集进行筛分。此处的初始样本集中的数据即为预处理后的初始数据。具体地,变体得到的适应性SVDD模型如附图10所示,其初始正则化约束参数C取0.9,核函数采用rbf高斯核函数,核函数等级设置为3,设置舍弃样本区间宽度c=0.02。
将初始样本集输入到训练后的SVDD模型进行样本筛选,进而确定出要保留的正负样本。具体地,通过计算可以得到每个样本距离初始值(即初始正则化约束参数C)的距离d,再以SVDD模型计算所得R值(R值为SVDD模型计算得到的最小化超球体半径)为参考,将其上下c宽度(即舍弃样本区间宽度c)范围设定为阈值界限,去除劣质样本,进而筛选出可用于特征提取的正负样本。如附图11和图12所示,图中红色线为训练得到的SVDD模型的阈值R,并选取对阈值线上下c(此处c=0.02)宽度范围内样本进行舍弃。
步骤4:建立特征提取模型;所述特征提取模型包括三元组特征提取网络。且三元组特征提取网络的输入向量设立有anchor、正样本和负样本三种样本;即输入向量形式为(anchor,正样本,负样本);其中,anchor为三元组特征提取的铆钉参考中心,通过在正样本中随机抽取获得;正样本则为与anchor属于同一种类的样本,负样本则为与anchor不同类的样本;并采用特征提取模型输出经三元组特征提取网络提取后的正样本和负样本。三元组特征提取网络对轴承的特征提取原理如附图13所示,其可扩大差异样本间距并缩小同类样本间距,更便于后续分类。
并且在本实施例中,采用训练集训练模型并采用测试集进行验证。对于训练集,随机在其正样本中选取anchor后,分别从正样本和负样本中各选一个组成输入向量(anchor,正样本,负样本)。对于测试集,则以固定模式确定三元组。按照测试集样本顺序,三元组的第一个值为当前样本值,第二个值为当前样本的同类样本值,第三个值为与当前样本的异类样本值,以此方式完成三元组输入向量定义。
建立特征提取模型时,还定义特征计算网络。本实施例中,所述特征计算网络为一维卷积神经网络,较为适用于一维序列数据。该网络包含有输入层、隐含层和输出层等结构,如附图14所示。其中,隐含层由多个卷积层和池化层相交组成,负责对输入数据进行特征提取和降维,输出层与全连接层结合组成分类器,如:Softmax、SVM和逻辑回归等。
具体地,本实施例中,定义一个四层卷积神经网络作为特征计算网络的特征提取核心,而后通过全连接层进行降维,将特征映射到二维空间。其中激活函数为PReLU,优化器使用Adam分类器。建立孪生网络特征提取模型的特征提取层结构如附图15所示。
建立特征提取模型时,还定义三元组网络损失函数Loss约束特征提取模型迭代训练过程;且Loss=max{d(a,p)-d(a,n)+margin,0}。
其中,d表示距离函数,a、p和n分别表示三元组输入向量中的anchor,正样本,负样本。margin为预设阈值,用以增强模型对不同样本的区分度。
经过以上过程,特征提取模型会输出经三元组特征提取网络特征提取后的正负样本特征,此时特征由于经过相似性处理和距离缩放,特征间差异会更明显。因此,将其作为下一步特征分类模型的输入。本实施例中基于特征提取模型的可视化提取结果如附图16所示。
步骤5:建立特征分类模型,并对提取后的正样本和负样本进行特征分类,并通过训练分类边界来进行陌生样本的识别任务。
所述特征分类模型采用LOF算法进行分类。其中,LOF指Local Outlier Factor,为基于相似性特点的局部异常因子算法。LOF算法通过计算一个数值来反映样本的异常程度。该值定义为每个点o和其邻域点的局部可达密度比。比值越大,点o的密度越低于邻域点,越可能被认定是异常点。局部可达密度以点与点间的距离来计算,距离越远,密度越低。
具体地,依据LOF算法计算出决策边界,当陌生样本输入时,判断决策边界外为异常样本,决策边界内为正常样本。本实施例中,分类得到的特征分类效果如附图17所示,在图形右下方处的画圈区域代表正常样本范围,该范围之外的区域代表异常范围,距离画圈区域中心越远说明其异常特征越明显。
步骤6:采用训练集训练特征提取模型及特征分类模型,采用测试集验证训练效果并计算特征提取模型及特征分类模型对应的混淆矩阵及混淆矩阵指标,并在混淆矩阵指标达到预设指标时判定为模型有效;否则,重新进行模型训练。
本实施例中,在模型训练结束后计算混淆矩阵指标,若计算得到的混淆矩阵中,对正常样本和异常样本的预测准确率和误判率的预设值分别在0.9以上和0.1以下(即所述预设指标为预测准确率大于0.9和误判率小于0.1),则认为模型有效;否则,重新进行模型训练。
本实施例中,基于测试集进行混淆矩阵及其指标计算,指标包括Precision(精确率)、Recall(召回率)、F1-score(F1分数)、Accuracy(准确率),以用于判断模型的准确性。当混淆矩阵的四个指标均达到较高水平时,训练完毕。训练完毕的模型表现更优,能够达到更高的异常检测分类精度。
本实施例提供的一种基于样本筛选和特征提取的双模型轴承异常检测算法,在样本筛分的基础上进行特征提取分类,极大地提升了模型识别精度。通过样本筛选模型对样本数据进行初级筛选,相对独立的样本筛选模型能够实时地对待检测的轴承数据进行在线处理,并能够快速完成轴承数据的初步筛分确定,能够实时确定轴承是否可能存在异常,进而能够实现针对轴承的长期高频检测,具备一定的检测实时性。特别的是,本方案提出的基于样本筛选和特征提取的双模型检测方案,既可通过样本筛选模型完成对轴承异常的初步实时确定,也可进一步通过特征提取模型和特征分类模型,进行充分的数据分析,完成对整体样本数据的统一检测。本方案可以用于日常服役列车的车轴检测,且可实现长期高频检测,有效地避免了经验检测可能带来的漏检,能够有效提升列车运行时的安全性。
而且,本方案中设置的双轮对滚动试验平台相对还原了轮对的实际运作场景,构建了贴近于真实运转环境的数据采集环境,保留了轴承在整体结构下的特征表达,后续输入模型的数据均具备较高的真实度,有助于后续模型分析得到最贴近实际轴承状态的识别结果,且数据采集过程中,传感器在轮对运行中持续性采集振动数据,数据采集具备实时性,为实时检测提供了基础检测条件。
并且,样本筛选模型采用适应性SVDD模型,能够在样本筛选的同时,去除掉数据中的劣质样本。在实际的数据采集过程中,对于神经网络模型来说,特征提取的效果受数据集影响较大,并且在数据采集阶段,数据采集受采集设备影响,其样本间通常存在波动性,且存在噪声数据(劣质数据),使得基于神经网络的特征提取模型难以准确学习数据特征,而本方案则能够通过适应性SVDD模型有效减少数据中劣质样本的存在对后续特征提取模型训练效果的影响,有助于达到更高的提取精准度。
此外,常规检测方案往往是从完全陌生的数据集中进行正常特征和故障特征的区分,虽然步骤设置简单,但这种方案存在先验性问题,不同属性样本提取后的特征区分度低,难以保证每次都完全分割开来,以致于其对于特征的识别准确度较低,易于误判。而本方案则特别设置了三元组特征提取网络,并在数据输入中添加了参考样本anchor,模型收敛的速度会更快,配合以特设的损失函数Loss,可进一步更大程度上地扩大了正常和故障样本特征间距离,缩小正常和正常样本特征间距离,从而实现更准确的识别划分,有助于达到较高的特征检测精度,轴承异常识别精准度较高。
以上所述的仅是本发明的实施例,方案中公知的具体结构及特性等常识在此未作过多描述,所属领域普通技术人员知晓申请日或者优先权日之前发明所属技术领域所有的普通技术知识,能够获知该领域中所有的现有技术,并且具有应用该日期之前常规实验手段的能力,所属领域普通技术人员可以在本申请给出的启示下,结合自身能力完善并实施本方案,一些典型的公知结构或者公知方法不应当成为所属领域普通技术人员实施本申请的障碍。应当指出,对于本领域的技术人员来说,在不脱离本发明结构的前提下,还可以作出若干变形和改进,这些也应该视为本发明的保护范围,这些都不会影响本发明实施的效果和专利的实用性。
Claims (9)
1.基于样本筛选和特征提取的双模型轴承异常检测算法,其特征在于,包括以下步骤:
步骤1:采集初始数据并进行预处理;所述初始数据为轮对的传递振动加速度信号;
步骤2:将预处理后的初始数据按比例划分为训练集和测试集;
步骤3:建立样本筛分模型;并采用样本筛分模型筛选出可用于特征提取的正样本和负样本;
步骤4:建立特征提取模型;所述特征提取模型包括三元组特征提取网络;且三元组特征提取网络的输入向量设立有anchor、正样本和负样本三种样本;其中,anchor通过在正样本中随机抽取获得;并采用特征提取模型输出经三元组特征提取网络提取后的正样本和负样本;
步骤5:建立特征分类模型,并对提取后的正样本和负样本进行特征分类,并通过训练分类边界来进行陌生样本的识别任务。
2.根据权利要求1所述的基于样本筛选和特征提取的双模型轴承异常检测算法,其特征在于,还包括步骤6:采用训练集训练特征提取模型及特征分类模型,采用测试集验证训练效果并计算特征提取模型及特征分类模型对应的混淆矩阵及混淆矩阵指标,并在混淆矩阵指标达到预设指标时判定为模型有效;否则,重新进行模型训练。
3.根据权利要求1所述的基于样本筛选和特征提取的双模型轴承异常检测算法,其特征在于,采集初始数据时,通过在货车卡钳平台布置与货车滚动轴承竖向一致的传感器,以收集货车轮对的传递振动加速度信号。
4.根据权利要求1所述的基于样本筛选和特征提取的双模型轴承异常检测算法,其特征在于,所述样本筛分模型采用SVDD模型。
5.根据权利要求1所述的基于样本筛选和特征提取的双模型轴承异常检测算法,其特征在于,所述特征分类模型采用LOF算法进行分类。
6.根据权利要求1所述的基于样本筛选和特征提取的双模型轴承异常检测算法,其特征在于,在步骤4中,建立特征提取模型时,定义三元组网络损失函数Loss约束特征提取模型迭代训练过程;且Loss=max{d(a,p)-d(a,n)+margin,0}。
7.根据权利要求5所述的基于样本筛选和特征提取的双模型轴承异常检测算法,其特征在于,在步骤5中,依据LOF算法计算出决策边界,当陌生样本输入时,判断决策边界外为异常样本,决策边界内为正常样本。
8.根据权利要求1所述的基于样本筛选和特征提取的双模型轴承异常检测算法,其特征在于,在步骤2中,还将训练集和测试集中的时域数据均转换为频域数据。
9.根据权利要求8所述的基于样本筛选和特征提取的双模型轴承异常检测算法,其特征在于,在步骤1中,以轮对为整体并使轮对处于正常运行时速下货车速度环境中,以进行数据采集;数据采集时采样频率设置为10240Hz,并取5000Hz以内的频率作为分析频率。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310612971.0A CN116644278A (zh) | 2023-05-26 | 2023-05-26 | 基于样本筛选和特征提取的双模型轴承异常检测算法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310612971.0A CN116644278A (zh) | 2023-05-26 | 2023-05-26 | 基于样本筛选和特征提取的双模型轴承异常检测算法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116644278A true CN116644278A (zh) | 2023-08-25 |
Family
ID=87642992
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310612971.0A Pending CN116644278A (zh) | 2023-05-26 | 2023-05-26 | 基于样本筛选和特征提取的双模型轴承异常检测算法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116644278A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117349640A (zh) * | 2023-12-04 | 2024-01-05 | 成都盛锴科技有限公司 | 一种车载振动加速度数据分析方法及系统 |
-
2023
- 2023-05-26 CN CN202310612971.0A patent/CN116644278A/zh active Pending
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117349640A (zh) * | 2023-12-04 | 2024-01-05 | 成都盛锴科技有限公司 | 一种车载振动加速度数据分析方法及系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111637964B (zh) | 钢轨波磨识别方法 | |
CN111623868B (zh) | 用于钢轨波磨识别的卷积神经网络构建方法 | |
CN111353482B (zh) | 一种基于lstm的疲劳因子隐性异常检测及故障诊断方法 | |
CN111207938B (zh) | 一种铁道车辆故障检测方法 | |
CN111539152B (zh) | 一种基于两级孪生卷积神经网络的滚动轴承故障自学习方法 | |
CN111562108A (zh) | 一种基于cnn和fcmc的滚动轴承智能故障诊断方法 | |
CN108267312B (zh) | 一种基于快速搜索算法的地铁列车轴承智能诊断方法 | |
CN109406147B (zh) | 一种变速工况下的列车轴承轨边声学诊断方法 | |
CN116644278A (zh) | 基于样本筛选和特征提取的双模型轴承异常检测算法 | |
CN110232415B (zh) | 一种基于生物信息特征的列车转向架故障识别方法 | |
CN114755017B (zh) | 一种跨域数据驱动无监督领域共享网络的变转速轴承故障诊断方法 | |
CN112364706A (zh) | 一种基于类不平衡的小样本轴承故障诊断方法 | |
CN115758289B (zh) | 一种基于多任务学习神经网络的钢轨波磨识别方法 | |
CN114861741B (zh) | 一种基于轮对横移量的蛇行状态识别方法 | |
CN116793682A (zh) | 基于iCORAL-MMD和对抗迁移学习的轴承故障诊断方法 | |
CN111461183A (zh) | 改进人工鱼群算法优化bp神经网络的平轮故障检测方法 | |
CN116644304A (zh) | 基于相似性的货车轴承异常特征提取与分类方法 | |
Sun et al. | Railway joint detection using deep convolutional neural networks | |
Ghiasi et al. | An unsupervised anomaly detection framework for onboard monitoring of railway track geometrical defects using one-class support vector machine | |
CN110160781B (zh) | 一种旋转机械故障分类的测试集重构和预测方法 | |
CN117475191A (zh) | 一种特征对齐域对抗神经网络的轴承故障诊断方法 | |
CN115356133A (zh) | 一种转向架运行工况在线监测、实时分类与识别算法 | |
CN115575508A (zh) | 一种基于列车振声复合特征的轨道交通钢轨波磨识别方法 | |
CN113807431A (zh) | 一种基于多源信息融合的智能主轴状态评估方法和系统 | |
CN114997218B (zh) | 一种针对轨道车辆车轮多边形磨耗的识别检测方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |