CN113468210A - 基于特征工程的机器人故障诊断方法及系统 - Google Patents
基于特征工程的机器人故障诊断方法及系统 Download PDFInfo
- Publication number
- CN113468210A CN113468210A CN202110635002.8A CN202110635002A CN113468210A CN 113468210 A CN113468210 A CN 113468210A CN 202110635002 A CN202110635002 A CN 202110635002A CN 113468210 A CN113468210 A CN 113468210A
- Authority
- CN
- China
- Prior art keywords
- data
- feature
- fault diagnosis
- robot
- characteristic
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 84
- 238000003745 diagnosis Methods 0.000 title claims abstract description 46
- 238000004140 cleaning Methods 0.000 claims abstract description 20
- 230000004927 fusion Effects 0.000 claims abstract description 13
- 230000009467 reduction Effects 0.000 claims abstract description 10
- 238000000605 extraction Methods 0.000 claims description 18
- 238000004422 calculation algorithm Methods 0.000 claims description 17
- 238000001914 filtration Methods 0.000 claims description 16
- 239000011159 matrix material Substances 0.000 claims description 13
- 230000009466 transformation Effects 0.000 claims description 10
- 230000003595 spectral effect Effects 0.000 claims description 9
- 238000000354 decomposition reaction Methods 0.000 claims description 7
- 230000001133 acceleration Effects 0.000 claims description 6
- 238000011156 evaluation Methods 0.000 claims description 5
- 230000005484 gravity Effects 0.000 claims description 3
- 239000000126 substance Substances 0.000 claims description 3
- 230000002159 abnormal effect Effects 0.000 claims description 2
- 230000001360 synchronised effect Effects 0.000 claims description 2
- 238000005406 washing Methods 0.000 claims description 2
- 230000000694 effects Effects 0.000 abstract description 16
- 230000008901 benefit Effects 0.000 abstract description 4
- 238000007418 data mining Methods 0.000 abstract description 3
- 238000013499 data model Methods 0.000 abstract description 2
- 238000009826 distribution Methods 0.000 description 14
- 230000006870 function Effects 0.000 description 14
- 230000002829 reductive effect Effects 0.000 description 13
- 238000001228 spectrum Methods 0.000 description 7
- 238000010586 diagram Methods 0.000 description 6
- 230000003412 degenerative effect Effects 0.000 description 5
- 238000010606 normalization Methods 0.000 description 5
- 230000008569 process Effects 0.000 description 5
- 239000013598 vector Substances 0.000 description 5
- 238000004458 analytical method Methods 0.000 description 4
- 238000012544 monitoring process Methods 0.000 description 4
- 238000012545 processing Methods 0.000 description 4
- 230000011218 segmentation Effects 0.000 description 4
- 238000013528 artificial neural network Methods 0.000 description 3
- 230000008878 coupling Effects 0.000 description 3
- 238000010168 coupling process Methods 0.000 description 3
- 238000005859 coupling reaction Methods 0.000 description 3
- 230000007547 defect Effects 0.000 description 3
- 238000003860 storage Methods 0.000 description 3
- 238000012549 training Methods 0.000 description 3
- 238000005299 abrasion Methods 0.000 description 2
- 238000009825 accumulation Methods 0.000 description 2
- 238000004891 communication Methods 0.000 description 2
- 230000000875 corresponding effect Effects 0.000 description 2
- 230000006378 damage Effects 0.000 description 2
- 230000007850 degeneration Effects 0.000 description 2
- 238000001514 detection method Methods 0.000 description 2
- 230000002401 inhibitory effect Effects 0.000 description 2
- 238000009434 installation Methods 0.000 description 2
- 238000013178 mathematical model Methods 0.000 description 2
- 230000001629 suppression Effects 0.000 description 2
- DMJXRYSGXCLCFP-LBPRGKRZSA-N (3s)-n-tert-butyl-1,2,3,4-tetrahydroisoquinoline-3-carboxamide Chemical compound C1=CC=C2CN[C@H](C(=O)NC(C)(C)C)CC2=C1 DMJXRYSGXCLCFP-LBPRGKRZSA-N 0.000 description 1
- 238000007476 Maximum Likelihood Methods 0.000 description 1
- 230000006978 adaptation Effects 0.000 description 1
- 230000032683 aging Effects 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 238000013398 bayesian method Methods 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 230000001364 causal effect Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 230000002596 correlated effect Effects 0.000 description 1
- 230000007797 corrosion Effects 0.000 description 1
- 238000005260 corrosion Methods 0.000 description 1
- 238000005520 cutting process Methods 0.000 description 1
- 238000007405 data analysis Methods 0.000 description 1
- 238000013501 data transformation Methods 0.000 description 1
- 238000003066 decision tree Methods 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000007499 fusion processing Methods 0.000 description 1
- 238000009776 industrial production Methods 0.000 description 1
- 230000000670 limiting effect Effects 0.000 description 1
- 238000012423 maintenance Methods 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 238000011089 mechanical engineering Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000036961 partial effect Effects 0.000 description 1
- 238000007637 random forest analysis Methods 0.000 description 1
- 230000003014 reinforcing effect Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 208000024891 symptom Diseases 0.000 description 1
- 238000012800 visualization Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/21—Design, administration or maintenance of databases
- G06F16/215—Improving data quality; Data cleansing, e.g. de-duplication, removing invalid entries or correcting typographical errors
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/28—Databases characterised by their database models, e.g. relational or object models
- G06F16/284—Relational databases
- G06F16/285—Clustering or classification
Abstract
本发明公开了一种基于特征工程的机器人故障诊断方法及系统,该方法包括:获取机器人的正常运作时以及预设类型故障下运作时的运行数据;以运行数据为样本数据,提取时域与频域的原始数据特征;对原始数据特征进行清洗,得到整合后的数据特征;根据数据特征的重要性,对整合后的数据特征进行选择,选取有效特征;将有效特征进行降维,采用特征降维方法,提取数据的主要特征分量;采用分类器对主要特征分量进行分类学习,实现故障诊断。通过本发明,具有数据挖掘不依赖于精确数据模型、特征选择效果较算力性价比高、自适应多尺度特征融合、分类效果较优等优点。
Description
技术领域
本发明涉及机器人状态监测技术领域,特别涉及一种基于特征工程的机器人故障诊断方法及系统。
背景技术
工业机器人在工业自动化生产中有广泛的应用,由于机器人长时间运转导致的磨损及松动或突发事件导致的故障,都将导致机器人工作失灵,从而降低工业生产效率,影响企业收益。因而,对机器人进行精准有效的故障检测具有重要意义。
工业机器人的故障多种多样,大致可以分为突发性故障和退化性故障。其中,突发性故障往往是一些没有征兆、瞬时发生且具有一定破坏性的突发事件导致,例如碰撞、堵转等;退化性故障往往是由于设备的老化,发生磨损、腐蚀、蠕变等,导致性能偏离预期,例如螺丝松动、传送带松紧等。
根据人的观察,很难直接识别出退化性故障,致使退化性故障不断积累而导致巨大损失。常见的工业机器人的故障诊断,一般针对的是突发性故障,对于退化性故障而言,相应的诊断系统较少且误报率和漏报率很高。
突发性故障来势汹汹,后果严重,需要及时诊断并且及时通知维护人员。常见的针对突发性故障的故障诊断,往往存在漏报率或虚警率过高的情况,整体准确度较低。
现有技术中,任芸丹,林杰.基于神经网络球形机器人在线监测系统研究[J].机械工程与自动化,2019,215(4):171-173.,提出了利用人工神经网络分析全方位球形机器人振动信号特征参数以进行在线故障监测。但是其缺少特征提取与融合过程,直接使用神经网络分析时域信号,容易出现过拟合现象,泛化效果很差。
陈如意.移动机器人多传感器冗余系统设计与故障诊断研究[D].南京航空航天大学,2017.,提出了基于六个传感器的冗余配置系统,采用PCA-ICA以及马氏距离的故障检测算法。但是其采用的PCA算法,对于非线性系统效果较差,且依赖具体故障特征,缺乏自适应能力。
王秀青,侯增广,曾慧,等.基于多传感器信息融合的机器人故障诊断[J].上海交通大学学报,2015,49(6):93-798.,提出了基于多传感器信息融合以及SVM的故障诊断方法,以诊断机械手受阻、前方碰撞、除前方外其他方向碰撞3种故障形式。但是其诊断的错误类型较少且SVM算法对于多分类问题泛化效果较差。
公开号为CN110231156A的中国发明专利,公开提供了一种基于时序特征的服务机器人运动系统故障诊断方法及装置。其采用多而随机森林模型和多个梯度提升术模型进行加权融合,使用GRU神经网络分类。该方案模型复杂,训练难度大,因而识别耗时长,且识别准确率无明显优势。
公开号为CN105095918B的中国发明专利,公开提供了多机器人系统故障诊断方法。其采用小波包变换和隐马尔科夫模型求取实时似然概率并与状态阈值对比,以获取多机器人系统当前所处的隐性状态,获取故障诊断结果。该方案基于的隐马尔科夫模型对于复杂机器人系统这种并不完全满足马尔卡夫性的系统,泛化效果一般。
公开号为CN110110803A的中国发明专利审中,公开提供了一种机器人故障诊断方法。其通过补偿距离评估技术从原始特征集中选取了敏感特征,然后通过逆协方差矩阵的聚类方法(简称TICC)实现聚类,聚类结果加速、减速、转向、平稳运行、基本静止等状态。该方案的聚类方式较为粗糙,且特征选取方式较为随意,整体自适应性较差。
发明内容
本发明针对上述现有技术中存在的问题,提出一种基于特征工程的机器人故障诊断方法及系统,具有数据挖掘不依赖于精确数据模型、特征选择效果较算力性价比高、自适应多尺度特征融合、分类效果较优等优点。
为解决上述技术问题,本发明是通过如下技术方案实现的:
本发明提供一种基于特征工程的机器人故障诊断方法,其包括:
S11:获取机器人的正常运作时以及预设类型故障下运作时的运行数据;
S12:以所述S11获取的运行数据为样本数据,提取时域与频域的原始数据特征;
S13:对所述S12获得的原始数据特征进行清洗,得到整合后的数据特征;
S14:根据数据特征的重要性,对所述S13整合后的数据特征进行选择,选取有效特征;
S15:将所述S14得到的有效特征进行降维,采用特征降维方法,提取数据的主要特征分量;
S16:采用分类器对所述S15得到的主要特征分量进行分类学习,实现故障诊断。
较佳地,所述S11中的运行数据包括:机器人关节处的电流数据、机器人末端位姿以及机器人末端的加速度数据。
较佳地,所述预设类型故障包括底座螺钉松动、底座法兰松动、电机法兰螺钉松动、电机法兰位置异常导致的同步带过松或过紧中的任意一种或多种。
较佳地,所述S12中的时域包括:绝对平均值、均方根值、标准差、短时能量、波形指标、峭度指标、裕度指标以及歪度指标;
所述S12中的频域包括:重心频率、均方频率、频率标准差、最大功率谱密度、功率谱熵、频谱峰值以及倒频谱峰值。
较佳地,所述S13中的清洗包括:首先进行过采样和欠采样,然后进行归一化,然后进行数据变换,然后再次进行归一化。由于数据采集问题,数据集存在类别分布不均衡,并且,由于不同特征往往特征尺度不同,并且每个特征本身的数据分布也可能由于处理而偏离高斯分布,因此通过上述数据清洗方法,可以提高数据集质量。
较佳地,所述S14中的选择包括:采用过滤式方法以及嵌入式方法进行选取。通过上述方法可以有效去除无效特征、无关特征与冗余特征,祛除了一部分重要性很低的特征,保留重要性高的特征,从而提高了特征质量,减少了特征数量,在保持足够的精度的情况下,降低了学习任务的难度,并避免了过拟合;并且通过嵌入式方法,融合了分离器与学习器的有话过程,可以控制开销并且能获得较优的效果。
较佳地,所述过滤式方法包括:缺失比率滤波、方差滤波以及相关性滤波。
较佳地,所述嵌入式方法包括:依据该特征在XGBoost算法重要性评估下的分数,判断是否保留或删去这一特征。
较佳地,所述S15中的降维包括:通过相似性矩阵,局部PCA变换,正交treelet分解,最佳聚类层估计,得到自适应的多尺度特征融合结果。
本发明还提供一种基于特征工程的机器人故障诊断系统,其包括:运行数据获取单元、原始数据特征提取单元、数据清洗单元、有效特征选取单元、主要特征分量提取单元以及分类学习单元;其中,
所述运行数据获取单元用于获取机器人的正常运作时以及预设类型故障下运作时的运行数据;
所述原始数据特征提取单元用于以所述运行数据获取单元获取的运行数据为样本数据,提取时域与频域的原始数据特征;
所述数据清洗单元用于对所述原始数据特征提取单元获得的原始数据特征进行清洗,得到清洗后的数据特征;
所述有效特征选取单元用于对所述数据清洗单元清洗后的数据特征进行选择,选取有效特征;
所述主要特征分量提取单元用于将所述有效特征选取单元得到的有效特征进行降维,采用特征降维方法,提取数据的主要特征分量;
所述分类学习单元用于采用分类器对所述主要特征分量提取单元得到的主要特征分量进行分类学习,实现故障诊断。
相较于现有技术,本发明实施例具有以下至少一种优点:
(1)本发明提供的基于特征工程的机器人诊断方法及系统,通过数据挖掘,不需要依赖于精确数学模型,解决了现有机器人故障诊断高度依赖于精确的数学模型、特征选择效果不佳且算力消耗大、特征融合线性限制且因果关系不明显、故障诊断效果差的问题;
(2)本发明提供的基于特征工程的机器人诊断方法及系统,通过采用过滤式方法以及嵌入式方法选择有效特征,在可控的开销前提下,获得较优的特征选择效果;解决了现有技术在进行特征选择时难以权衡算力开销和最终效果的难题,降低了技术适配的时间开销,加快了项目落地速度;
(3)本发明提供的基于特征工程的机器人诊断方法及系统,通过相似性矩阵,局部PCA变换,正交treelet分解,最佳聚类层估计进行特征融合,在可控的开销前提下,获得较优的特征融合效果;解决了现有技术对于数据的线性要求以及难以解释融合后特征与原特征之间的联系的问题,改善了特征融合效果;
(4)本发明提供的基于特征工程的机器人诊断方法及系统,通过分类器进行分类学习,在可控的开销前提下,获得较优的分类效果;解决了现有技术对对大规模训练样本难以实施,并且解决多分类问题存在困难,或者算力成本过大的问题。
附图说明
下面结合附图对本发明的实施方式作进一步说明:
图1为本发明一实施例的基于特征工程的机器人故障诊断方法的流程图;
图2为本发明一较佳实施例的机器人与传感器安装位置示意图;
图3为本发明一较佳实施例的数据清洗的工作流程图;
图4a为本发明一较佳实施例的Box-Cox变化前的分布图;
图4b为本发明一较佳实施例的Box-Cox变化后的分布图;
图4c为本发明一较佳实施例的Box-Cox变化前的概率图;
图4d为本发明一较佳实施例的Box-Cox变化后的概率图;
图5为本发明一较佳实施例的数据特征选择的工作流程图;
图6为本发明一较佳实施例的特征选择化示意图;
图7为本发明一实施例的基于特征工程的机器人故障诊断系统的示意图。
标号说明:1-运行数据获取单元,2-原始数据特征提取单元,3-数据清洗单元,4-有效特征选取单元,5-主要特征分量提取单元,6-分类学习单元。
具体实施方式
下面对本发明的实施例作详细说明,本实施例在以本发明技术方案为前提下进行实施,给出了详细的实施方式和具体的操作过程,但本发明的保护范围不限于下述的实施例。
如图1所示为本发明一实施例的基于特征工程的机器人故障诊断方法的流程图。
请参考图1,本实施例的基于特征工程的机器人故障诊断方法包括:
S11:采集机器人正常运作和预设类型故障下的运行数据;
S12:以S11得到的运行数据为样本数据,提取数据特征;
S13:对于数据特征进行清洗,得到整合后的数据特征;
S14:根据数据特征的重要性,从提取得到的数据特征中选取有效特征;
S15:有效特征构成高维向量,提取数据的主要特征分量,将所有效特征进行降维,以实现故障数据采集的多传感器信息融合;
S16:采用分类器对于融合后的特征进行分类学习,实现故障诊断。
一较佳实施例中,S11中的运行数据包括:机器人关节处的电流数据、机器人末端位姿以及机器人末端的加速度数据。运行数据通过传感器获取,一实施例中,传感器包括:四个位于机器人关节处的电流传感器,提供电流数据;四个位于机器人关节处的位置传感器,提供关节角度数据;一个位于机器人末端的外置六轴姿态角度传感器,用于提供机器人关节位姿以及加速度数据,传感器安装位置示意图如图2所示。
一较佳实施例中,S11中的预设类型故障包括:底座螺钉松动、底座法兰松动、电机法兰螺钉松动、电机法兰位置异常导致的同步带过松或过紧、突发性碰撞故障中的任意一种或多种的组合。上述的故障是工业机器人常见的故障,包括难以直接识别的退化性故障与破坏性较强的突发性故障,前者往往存在误报率和漏报率很高的问题,后者往往存在虚警率过高和即时性较差的问题。
一实施例中,对于电流传感器获得的电流数据,其工作最大范围在-2A至2A之内,正常工况在-1A至1A之内,传感器误差在10mA之内;
对于位置传感器获得的位置数据,其工作最大范围在-180°至180°之内,正常工况在-90°至90°之内,传感器误差在0.01°之内;
对于加速度传感器获得的加速度数据,其工作最大范围在-2g至2g之内,正常工况在-1g至1g之内,传感器误差在0.001g之内。
一较佳实施例中,S12中的数据特征包括:时域与频域的数据特征。时域特征计算简单、便于提取,反应了信号随时间的变化,通过提取一定的时域特征,可以实时地监测和评价机器人的工作状态;频域特征反应了信号的频率分布特性,可以反映系统的动态特性,通过提取一定的时域特征,可以更直观地获取机器人系统的固有模态信息。
时域指标包括:绝对平均值,用以体现信号的平均特性;均方根值,用以体现信号的有效值;标准差,用以体现信号的波动程度;短时能量,用以体现信号的强弱程度;波形指标,用来监测信号的形状与平稳度;峭度指标,反映信号的冲击特征,较大说明机械运动存在冲击性真的,可能发生间隙过大、滑动副表面破损等情况;裕度指标,用于监测机械设备的磨损情况;歪度指标,反映振动信号的非对称性,如果某方向存在摩擦或碰撞,该指标增大。
频域指标包括:重心频率,用以衡量频谱的有效值;均方频率,用以体现频谱的平方特性;频率标准差,用于衡量频谱的波动程度;最大功率谱密度,用以体现功率贡献最大的频率;功率谱熵,用以体现信号的信息量,从而衡量信号发生的概率,谱熵越小,信息量越少,概率越小;频谱峰值,用以体现系统的固有模态;倒频谱峰值,通过倒频谱,将原来频谱上成族的边频带谱线简化为单根谱线,方便提取、分析。
一较佳实施例中,S13中的数据清洗方法流程图如图3所示,具体为:
对于数据特征的清洗是采用多层清洗方式,其中包括,首先采用过采样和欠采样方法以缓解类别不均匀,然后进行归一化,然后进行数据变换,然后再次归一化。具体包括:
S131:进行过采样和欠采样,采用SMOTE+ENN算法,对于多数类欠采样,对于少数类过采样,实现不同类别样本数平衡;通过上述方法,能够解决模式识别过程中存在的数据的代表性不足或类别分布存在严重偏差的问题,避免由于类别不平衡比率过大,对分类器性能造成严重危害,并导致准确率作为评估方法将会失去意义。
S132:首次归一化,采用min-max缩放,将所有特征压缩到[0,1]的尺度范围内;通过上述方法,能够解决每个特征的量纲与数值范围不同,彼此之间无法直接相互比对的问题,将不同特征的数据调整至同一量纲,便于后续分析处理。
S133:采用Box-Cox变化,其通过极大似然法和贝叶斯方法,改变变量的分布,使得方差不再依赖于均值。采用如下的公式,通过合适的λ取值,得到一个变换后的分布,使其趋近于正态分布,残差可以更好的满足正态性、独立性等假设前提,降低了伪回归的概率。此处的λ的取值,采用最大Pearson相关系数的方法进行迭代获得。结果如图4a-4d所示。通过上述方法,能够解决特征提取结果由于本身存在一定的非线性成分,导致分布畸变的问题,使得数据分布趋于正态分布,便于后续分析处理。
S134:再次归一化,采用min-max缩放,将所有特征压缩到[0,1]的尺度范围内。
一较佳实施例中,S14中的选择包括:采用过滤式方法以及嵌入式方法进行选取,其流程图如图5所示。
其中,过滤式方法进一步包括:
S141:通过缺失比率滤波,删除一些缺失值在数据集中的占比过高的缺陷特征;通过上述方法,能够除去本身数据质量不佳的无效特征,降低数据集维度,提高数据集质量。
S142:通过方差滤波,将携带的信息量很少的低方差变量删除。对于归一化之后的特征,每一个特征都计算其方差,统计所有特征的方差之后,删除小于阈值的特征。这里的阈值,优选取值为方差小于所有特征方差平均数的0.4倍,即去除约20%的低信息量数据;通过上述方法,能够除去对于模型提升没有贡献的无关特征,降低数据集维度,提高数据集质量。
S143:通过高相关性滤波,删除彼此高度相关的冗余特征。对于归一化之后的特征,计算每两个特征之间的特征相关性矩阵,并且计算每个特征与分类标签的相关度,对于两两之间相关性过高的特征,根据这两个特征与分类标签的相关度,删除相关度较小的特征。这里的阈值,优选取值为相关度高于0.95。通过上述方法,能够除去已经存在更加优秀的可替代特征的冗余特征,降低数据集维度,提高数据集质量。
嵌入式方法进一步为:通过XGBoost嵌入式特征选择去除重要性低的特征,进而得到有效特征。通过上述方法,能够除去对于模型贡献不大却耗费了计算资源的次要特征,保留对于模型有着主要贡献的主要特征,降低数据集维度,提高数据集质量。
通过上述S14的方法,通过合适的操作,在尽可能避免有效信息的丢失的情况下,除去无意义的噪声,从而降低数据集维度,以避免由于维度灾难导致的过拟合,并且降低学习任务的难度,节省算力成本的同时改善系统实时性。
较佳实施例中,S16中分类学习的分类器是基于XGBoost算法的。通过上述方法,能够得到较优的准确度、稳定度、实时性,极大提高故障诊断系统的性能。
S14和S16中,特征选择和分类器使用的XGBoost算法的具体过程为:
XGBoost是用梯度下降架构增强弱学习器的集成树方法,对于GBDT算法进行改进,损失函数泰勒展开到二阶促进更快更准的梯度下降,损失函数中加入了正则项以控制复杂度。
对于一个样本数为n的数据集,XGBoost算法由k个基模型ft组成,每个基模型对于第i个样本的估计值线性叠加得到预测值并且采用预测值和真实值yi得到损失函数L,并且设置抑制模型复杂度的正则项Ω,彼此叠加得到目标函数Obj:
Boosting模型是一个前向加法的模型,因此可以采用t-1步的模型来估计第t步的模型。对于损失函数进行二阶泰勒展开得到一阶导数gi与二阶导数hi,并且预设如下正则项Ω(ft),在采用平方损失函数的前提下,均带入可得如下结果:
采用遍历叶子节点的方式,而非遍历样本的方式求损失函数,化简得到最终结果,并采用Gi与Hi代表每个叶子节点的所有样本的梯度总和:
通过目标函数对于最后一个叶子节点wj求偏导得到使得目标函数最小的wj:
考虑到叶子节点的切割对于性能的影响非常重要,通过如下的增益比较分割前后的性能增加与否,从而判断分割是否保留:
其中,GL、GR、HL、HR分别表示分割后得到的两个树的叶子节点的一阶梯度与二阶梯度。
为了衡量某一特征的重要程度,有常见的三个指标:分裂次数(weight),衡量根据该特征分类的叶子节点;特征增益(gain),衡量该特征每个叶子节点分割时产生的增益、样本覆盖率(cover),分析落到每一个节点的样本个数。
一较佳实施例,S14中,对于基于XGBoost算法的嵌入式特征选择的应用为:
XGBoost算法得到树模型之后,为了衡量某一特征的重要程度,采用常见的三个指标:分裂次数(weight),衡量根据该特征分类的叶子节点;特征增益(gain),衡量该特征每个叶子节点分割时产生的增益;样本覆盖率(cover),分析落到每一个节点的样本个数。依据特征在重要性评估下的分数,判断是否保留或删去这一特征,结果如图6所示。
一较佳实施例中,S15中,特征降维的具体过程为:
采用Treelet算法,这是一种将PCA、小波分析和层次聚类结合在一起的自适应的多尺度的数据分析方法,通过相似性矩阵,局部PCA变换,正交treelet分解,最佳聚类层估计,可以得到自适应的多尺度特征融合结果。通过上述方法,在特征选择算法选取原本特征集合的较优子集,以减少维度,并且提高有效数据的浓度之后,进一步降维,通过线性组合或者非线性映射的方式,强制张为更为优质的坐标维度,实现维度降至三维乃至二维,从而实现特征空间可视化,并且大幅加速分类器训练速度。
S151:数据初始化。
首先对于l=0层,设置初始化参数x(0)=(s0,1,…s0,p)T,s0,k=xk,相应地可以得到坐标基,B0=[φ0,1,…φ0,p],并初始化累加系数为S={1,…p};
S152:计算相似性矩阵。
对于两个变量si,sj而言,有如下的相关系数定义。计算数据集中任意两条数据的协方差与相似度,可以获得协方差与相似性矩阵:
S153:局部PCA变换。
在第l层,通过以下公式可以找出两个最相似的特征:
在特征对(xα,xβ)上进行局部PCA变换,可以得到一个雅可比旋转矩阵:
其中,c=cos(θl),s=sin(θl),θl是旋转角.θl满足上述限制条件;
由此,可以得到基矩阵的变换以及从而得出新的坐标:
S154:更新参数。
S155:正交treelet分解。
由此可以得到如下的第l层的正交treelet分解:
S156:最佳聚类层估计。
根据Treelet变换的算法,层次聚类树可以构建到最后一层,即p-1层。在实际应用中,一般不需要把层次聚类树构建到最后一层。为了获得需要的基矩阵,可以设置一个停止条件来判断在哪一层中断计算。在第l层,计算标准化的尺度向量ε(Ωl,i):
一较佳实施例中,S16中,对于XGBoost算法的分类器的应用为:
基于XGBoost算法,采用预测值和真实值得到损失函数,并且设置抑制模型复杂度的正则项彼此叠加得到目标函数;通过对于损失函数进行二阶泰勒展开,并求偏导得到使得目标函数最小;通过叶子节点的切割前后的性能增加与否,从而判断分割是否保留。最终得到一个完整的决策树。
在本发明另一实施例中,还提供一种基于特征工程的机器人故障诊断系统,其示意图如图7所示,其用于实现如上述任一实施例的基于特征工程的机器人故障诊断方法,其包括:运行数据获取单元1、原始数据特征提取单元2、数据清洗单元3、有效特征选取单元4、主要特征分量提取单元5以及分类学习单元6。其中,运行数据获取单元1用于获取机器人的正常运作时以及预设类型故障下运作时的运行数据;原始数据特征提取单元2用于以所述运行数据获取单元获取的运行数据为样本数据,提取时域与频域的原始数据特征;数据清洗单元3用于对所述原始数据特征提取单元获得的原始数据特征进行清洗,得到清洗后的数据特征;有效特征选取单元4用于对所述数据清洗单元清洗后的数据特征进行选择,选取有效特征;主要特征分量提取单元5用于将所述有效特征选取单元得到的有效特征进行降维,采用特征降维方法,提取数据的主要特征分量;分类学习单元6用于采用分类器对所述主要特征分量提取单元得到的主要特征分量进行分类学习,实现故障诊断。
在本发明的上述实施例中,对各个实施例的描述各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。
在本发明所提供的几个实施例中,应该理解到,所揭露的技术内容,可通过其它的方式实现。其中,以上所描述的系统实施例仅仅是示意性的,例如所述单元的划分,可以为一种逻辑功能划分,实际实现时可以有另外的划分形式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行、另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,单元或模块的间接耦合或通信连接,可以是电性或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个单元上。可以根据实际的需要选择其中的部分或全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
所述集成的单元如果以软件功能的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可为个人计算机、服务器或网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。二前述的存储介质包括:U盘、只读存储器、随机存储器、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。
此处公开的仅为本发明的优选实施例,本说明书选取并具体描述这些实施例,是为了更好地解释本发明的原理和实际应用,并不是对本发明的限定。任何本领域技术人员在说明书范围内所做的修改和变化,均应落在本发明所保护的范围内。
Claims (10)
1.一种基于特征工程的机器故障诊断方法,其特征在于,包括:
S11:获取机器人的正常运作时以及预设类型故障下运作时的运行数据;
S12:以所述S11获取的运行数据为样本数据,提取时域与频域的原始数据特征;
S13:对所述S12获得的原始数据特征进行清洗,得到整合后的数据特征;
S14:根据数据特征的重要性,对所述S13整合后的数据特征进行选择,选取有效特征;
S15:将所述S14得到的有效特征进行降维,采用特征降维方法,提取数据的主要特征分量;
S16:采用分类器对所述S15得到的主要特征分量进行分类学习,实现故障诊断。
2.根据权利要求1所述的基于特征工程的机器故障诊断方法,其特征在于,所述S11中的运行数据包括:机器人关节处的电流数据、机器人末端位姿以及机器人末端的加速度数据。
3.根据权利要求1所述的基于特征工程的机器故障诊断方法,其特征在于,所述预设类型故障包括底座螺钉松动、底座法兰松动、电机法兰螺钉松动、电机法兰位置异常导致的同步带过松或过紧中的任意一种或多种。
4.根据权利要求1所述的基于特征工程的机器故障诊断方法,其特征在于,所述S12中的时域包括:绝对平均值、均方根值、标准差、短时能量、波形指标、峭度指标、裕度指标以及歪度指标;
所述S12中的频域包括:重心频率、均方频率、频率标准差、最大功率谱密度、功率谱熵、频谱峰值以及倒频谱峰值。
5.根据权利要求1所述的基于特征工程的机器故障诊断方法,其特征在于,所述S13中的清洗包括:首先进行过采样和欠采样,然后进行归一化,然后进行数据变换,然后再次进行归一化。
6.根据权利要求1所述的基于特征工程的机器故障诊断方法,其特征在于,所述S14中的选择包括:采用过滤式方法以及嵌入式方法进行选取。
7.根据权利要求6所述的基于特征工程的机器故障诊断方法,其特征在于,所述过滤式方法包括:缺失比率滤波、方差滤波以及相关性滤波。
8.根据权利要求6或7所述的基于特征工程的机器故障诊断方法,其特征在于,所述嵌入式方法包括:依据该特征在XGBoost算法重要性评估下的分数,判断是否保留或删去这一特征。
9.根据权利要求1所述的基于特征工程的机器故障诊断方法,其特征在于,所述S15中的降维包括:通过相似性矩阵,局部PCA变换,正交treelet分解,最佳聚类层估计,得到自适应的多尺度特征融合结果。
10.一种基于特征工程的机器人故障诊断系统,其特征在于,包括:运行数据获取单元、原始数据特征提取单元、数据清洗单元、有效特征选取单元、主要特征分量提取单元以及分类学习单元;其中,
所述运行数据获取单元用于获取机器人的正常运作时以及预设类型故障下运作时的运行数据;
所述原始数据特征提取单元用于以所述运行数据获取单元获取的运行数据为样本数据,提取时域与频域的原始数据特征;
所述数据清洗单元用于对所述原始数据特征提取单元获得的原始数据特征进行清洗,得到清洗后的数据特征;
所述有效特征选取单元用于对所述数据清洗单元清洗后的数据特征进行选择,选取有效特征;
所述主要特征分量提取单元用于将所述有效特征选取单元得到的有效特征进行降维,采用特征降维方法,提取数据的主要特征分量;
所述分类学习单元用于采用分类器对所述主要特征分量提取单元得到的主要特征分量进行分类学习,实现故障诊断。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110635002.8A CN113468210A (zh) | 2021-06-08 | 2021-06-08 | 基于特征工程的机器人故障诊断方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110635002.8A CN113468210A (zh) | 2021-06-08 | 2021-06-08 | 基于特征工程的机器人故障诊断方法及系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN113468210A true CN113468210A (zh) | 2021-10-01 |
Family
ID=77868701
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110635002.8A Pending CN113468210A (zh) | 2021-06-08 | 2021-06-08 | 基于特征工程的机器人故障诊断方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113468210A (zh) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114004052A (zh) * | 2022-01-04 | 2022-02-01 | 南京信息工程大学 | 一种面向网络管理系统的故障检测方法及装置 |
CN114013501A (zh) * | 2021-11-25 | 2022-02-08 | 南京航空航天大学 | 一种电-液转向容错控制方法及终端 |
CN115107022A (zh) * | 2022-06-16 | 2022-09-27 | 华中科技大学 | 一种基于gbdt算法的工业机器人位置误差补偿方法和系统 |
CN117312807A (zh) * | 2023-11-29 | 2023-12-29 | 浙江万胜智能科技股份有限公司 | 一种断路器的控制状态分析方法及系统 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110231156A (zh) * | 2019-06-26 | 2019-09-13 | 山东大学 | 基于时序特征的服务机器人运动系统故障诊断方法及装置 |
CN110815224A (zh) * | 2019-11-14 | 2020-02-21 | 华南智能机器人创新研究院 | 一种机器人的远程故障诊断推送方法及装置 |
CN111199257A (zh) * | 2020-01-10 | 2020-05-26 | 中国铁道科学研究院集团有限公司电子计算技术研究所 | 高铁行车设备故障诊断方法及装置 |
CN112171721A (zh) * | 2020-11-30 | 2021-01-05 | 北京科技大学 | 一种机器人关节传感器和执行器故障诊断方法及系统 |
KR20210006832A (ko) * | 2019-07-09 | 2021-01-19 | 한국전자통신연구원 | 기계고장 진단 방법 및 장치 |
-
2021
- 2021-06-08 CN CN202110635002.8A patent/CN113468210A/zh active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110231156A (zh) * | 2019-06-26 | 2019-09-13 | 山东大学 | 基于时序特征的服务机器人运动系统故障诊断方法及装置 |
KR20210006832A (ko) * | 2019-07-09 | 2021-01-19 | 한국전자통신연구원 | 기계고장 진단 방법 및 장치 |
CN110815224A (zh) * | 2019-11-14 | 2020-02-21 | 华南智能机器人创新研究院 | 一种机器人的远程故障诊断推送方法及装置 |
CN111199257A (zh) * | 2020-01-10 | 2020-05-26 | 中国铁道科学研究院集团有限公司电子计算技术研究所 | 高铁行车设备故障诊断方法及装置 |
CN112171721A (zh) * | 2020-11-30 | 2021-01-05 | 北京科技大学 | 一种机器人关节传感器和执行器故障诊断方法及系统 |
Non-Patent Citations (6)
Title |
---|
DBY_FREEDOM: "CTR 预测理论(十三):树模型特征重要性原理总结", 《CSDN HTTPS://BLOG.CSDN.NET/DBY_FREEDOM/ARTICLE/DETAILS/89040856?》 * |
MR.看海: "时域特征值提取的MATLAB代码实现(均方根、峰值因子、脉冲因子、裕度因子、峭度因子、波形因子和偏度等)", 《CSDN HTTPS://BLOG.CSDN.NET/FENGZHUQIAOQIU/ARTICLE/DETAILS/101153320?》 * |
TAI_PARK: "matlab时域频域信号特征提取资料整合", 《CSDN HTTPS://BLOG.CSDN.NET/QQ_36329973/ARTICLE/DETAILS/101618677?》 * |
YKUKEY_CSDN: "机器学习知识点整理(按实践流程排序)", 《CSDN HTTPS://BLOG.CSDN.NET/YKUKEY_CSDN/ARTICLE/DETAILS/103510524?》 * |
YOU WU等: "Fault diagnosis for industrial robots based on a combined approach of manifold learning_treelet transform and Naive Bayes", 《REVIEW OF SCIENTIFIC INSTRUMENTS》 * |
万义萍: "基于Treelet变换的遥感图像变化检测方法", 《中国优秀硕士学位论文全文数据库 信息科技辑》 * |
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114013501A (zh) * | 2021-11-25 | 2022-02-08 | 南京航空航天大学 | 一种电-液转向容错控制方法及终端 |
CN114013501B (zh) * | 2021-11-25 | 2022-09-30 | 南京航空航天大学 | 一种电-液转向容错控制方法及终端 |
CN114004052A (zh) * | 2022-01-04 | 2022-02-01 | 南京信息工程大学 | 一种面向网络管理系统的故障检测方法及装置 |
CN114004052B (zh) * | 2022-01-04 | 2022-04-01 | 南京信息工程大学 | 一种面向网络管理系统的故障检测方法及装置 |
CN115107022A (zh) * | 2022-06-16 | 2022-09-27 | 华中科技大学 | 一种基于gbdt算法的工业机器人位置误差补偿方法和系统 |
CN115107022B (zh) * | 2022-06-16 | 2024-04-19 | 华中科技大学 | 一种基于gbdt算法的工业机器人位置误差补偿方法和系统 |
CN117312807A (zh) * | 2023-11-29 | 2023-12-29 | 浙江万胜智能科技股份有限公司 | 一种断路器的控制状态分析方法及系统 |
CN117312807B (zh) * | 2023-11-29 | 2024-02-06 | 浙江万胜智能科技股份有限公司 | 一种断路器的控制状态分析方法及系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN113468210A (zh) | 基于特征工程的机器人故障诊断方法及系统 | |
JP4850857B2 (ja) | 予測状態監視における変化状態の適応モデリング | |
US7496798B2 (en) | Data-centric monitoring method | |
US6859739B2 (en) | Global state change indicator for empirical modeling in condition based monitoring | |
US8630962B2 (en) | Error detection method and its system for early detection of errors in a planar or facilities | |
Maurya et al. | Condition monitoring of machines using fused features from EMD-based local energy with DNN | |
US11669080B2 (en) | Abnormality detection device, abnormality detection method, and program | |
Vallachira et al. | Data-driven gearbox failure detection in industrial robots | |
Khalastchi et al. | Online anomaly detection in unmanned vehicles | |
JP2004531815A (ja) | 予測的状態監視のための診断システムおよび方法 | |
CN111538311B (zh) | 一种基于数据挖掘的机械设备柔性多状态自适应预警方法及装置 | |
CN113762329A (zh) | 一种大型轧机状态预测模型的构建方法及构建系统 | |
CN113111591B (zh) | 基于模块化配电终端内部故障自动诊断方法、装置及设备 | |
CN113869379A (zh) | 一种基于数据驱动的航空器能量异常识别方法 | |
CN115112372A (zh) | 轴承故障诊断方法、装置、电子设备及存储介质 | |
CN116992226A (zh) | 一种水泵电机故障检测方法、系统 | |
Lei et al. | Fault diagnosis of rotating machinery based on a new hybrid clustering algorithm | |
CN108827671A (zh) | 一种机械设备故障诊断方法 | |
CN117076869A (zh) | 旋转机械时频域融合故障诊断方法及系统 | |
CN117269742A (zh) | 一种高海拔环境下断路器健康状态评估方法、装置及介质 | |
Harkat et al. | Nonlinear PCA combining principal curves and RBF-networks for process monitoring | |
CN114137915A (zh) | 一种工业设备的故障诊断方法 | |
CN112836570A (zh) | 一种利用高斯噪声的设备异常检测方法 | |
CN114637793B (zh) | 一种基于大数据分析的装备故障频发区域定位方法 | |
Eklund | Using synthetic data to train an accurate real-world fault detection system |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20211001 |
|
RJ01 | Rejection of invention patent application after publication |