CN110927243A - 一种基于PCA-Kmeans算法的冷轧带钢故障诊断优化方法 - Google Patents

一种基于PCA-Kmeans算法的冷轧带钢故障诊断优化方法 Download PDF

Info

Publication number
CN110927243A
CN110927243A CN201911248188.0A CN201911248188A CN110927243A CN 110927243 A CN110927243 A CN 110927243A CN 201911248188 A CN201911248188 A CN 201911248188A CN 110927243 A CN110927243 A CN 110927243A
Authority
CN
China
Prior art keywords
data
algorithm
pca
cold
strip steel
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201911248188.0A
Other languages
English (en)
Inventor
王庆燕
周志云
王昊宇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Jinling Institute of Technology
Original Assignee
Jinling Institute of Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Jinling Institute of Technology filed Critical Jinling Institute of Technology
Priority to CN201911248188.0A priority Critical patent/CN110927243A/zh
Publication of CN110927243A publication Critical patent/CN110927243A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N27/00Investigating or analysing materials by the use of electric, electrochemical, or magnetic means
    • G01N27/72Investigating or analysing materials by the use of electric, electrochemical, or magnetic means by investigating magnetic variables
    • G01N27/82Investigating or analysing materials by the use of electric, electrochemical, or magnetic means by investigating magnetic variables for investigating the presence of flaws
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/213Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods
    • G06F18/2135Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods based on approximation criteria, e.g. principal component analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • G06F18/232Non-hierarchical techniques
    • G06F18/2321Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
    • G06F18/23213Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering

Landscapes

  • Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • General Physics & Mathematics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Chemical & Material Sciences (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • General Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Electrochemistry (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Probability & Statistics with Applications (AREA)
  • Health & Medical Sciences (AREA)
  • Analytical Chemistry (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Immunology (AREA)
  • Pathology (AREA)
  • Testing And Monitoring For Control Systems (AREA)
  • Investigating And Analyzing Materials By Characteristic Methods (AREA)

Abstract

一种基于PCA‑Kmeans算法的冷轧带钢故障诊断优化方法,提出一种PCA降维算法结合K‑means聚类算法来优化数学模型,利用PCA算法优化巴克豪森信号特征数据,然后结合K‑means无监督学习算法处理优化后的低维数据,完成对冷轧带钢故障的预测诊断。其数学模型通过PCA得到优化,预测精度能够达到95%以上。

Description

一种基于PCA-Kmeans算法的冷轧带钢故障诊断优化方法
技术领域
本发明涉及改进聚类算法,利用PCA优化后的数据特征建立预测模型,完成冷轧带钢故障诊断预测,特别是涉及一种基于PCA-Kmeans算法的冷轧带钢故障诊断优化方法。
背景技术
随着我国工业的不断强大,铁路运输、航空航天、船舶、汽车、能源、建筑等产业得到了快速的发展,铁磁性材料是种功用性材料,在工业领域中其已成为关键性的工业原料。钢铁等铁磁性材料是使用最为广泛的材料之一,成为了工业繁荣、经济建设的重要基础。因此严格把控钢铁等铁磁性材料的质量成为了重要的任务,对于检测冷轧带钢等铁磁性材料有着广阔的应用前景。
传统的检测方法具有破坏性并且检测准确度不够高,本发明采用巴克豪森法无损检测方法检测冷轧带钢是否存在故障,巴克豪森法属于无损检测方法,该方法不需要破坏材料本身就能准确的检测出带钢是否存在缺陷故障。通过分析巴克豪森信号的特性,提取出巴克豪森信号的特征,建立特征数据库,利用聚类等数学模型即可实现对冷轧带钢的故障检测。
巴克豪森信号特征较多,较多的特征虽然拥有抗干扰能力和丰富的信息,包含着多重的特征信息,但是高维度特征向量的问题往往容易陷入维度灾难。随着数据集维度的增加,算法学习需要的样本数量呈指数级增加,这样对数据建模是非常不利的。另外,随着维度的增加,数据的稀疏性会越来越高。在高维向量空间中探索同样的数据集比在同样稀疏的数据集中探索更加困难。
多维度特征数据无疑会为冷轧带钢故障预测诊断模型提供丰富的信息,但是也在一定程度上影响了数据处理和模型预测准确性。如果分别对每个指标进行分析,分析往往是孤立的,不能完全利用数据中的信息,因此盲目减少指标会损失很多有用的信息,从而产生错误的结论。PCA降维算法可以将具有相关性的原始高维度数据进行线性无关的映射至低维空间,从而实现在尽可能保留数据信息的情况下降维数据,接着使用K-means聚类算法,通过无监督学习的方式来完成冷轧带钢故障的预测诊断。
发明内容
为了解决以上问题,本发明的技术方案为一种基于PCA-Kmeans算法的冷轧带钢故障诊断优化方法,通过将巴克豪森信号进行特征提取,然后利用PCA(Principal ComponentAnalysis)降维算法优化数据,将信号特征压缩降维至二维。K-means聚类算法对于处理二维或者三维数据效果较佳,将优化后的数据送入K-means算法模型中,通过无监督学习来完成冷轧带钢的故障诊断。本发明的PCA-Kmeans算法模型优化了故障诊断模型,提高模型鲁棒性和预测准确性,为达此目的,本发明提供一种基于PCA-Kmeans算法的冷轧带钢故障诊断优化方法,其特征在于,包括如下步骤:
步骤1:首先对传感器采集到的巴克豪森信号进行特征提取,选取常用特征均方根、均值、峰值、峰值时间、半高宽、振岭数六个时域特征和功率谱一个频域特征;
步骤2:将获取的数据进行转化整合,巴克豪森信号特征多且数据结构复杂,在进行数据处理之前需要先进行数据的转化整合处理,将数据进行归一化处理,让每个特征处于0到1区间范围内;
步骤3:建立特征数据库,每个样本有7类特征;
步骤4:将数据库中的原始数据划分一部分数据为测试数据,用于测试优化算法后的模型有效性,剩余的数据作为建立模型的训练数据;
步骤5:采用PCA降维算法将原始七维特征降到二维特征数据,在贡献率保证的情况下完成数据聚类之前的预处理;
步骤6:构建K-means非监督学习算法,输入为经过PCA优化之后的特征数据,输出为两类结果,即有故障的冷轧带钢和无故障的冷轧带钢,并且设置初始的K-means中距离测度、初始质心位置、聚类重复次数相关参数;
所述K-means核心算法公式如下:
Figure BDA0002308278290000021
其中SSE参数计算的内容为当前迭代得到的中心位置到各自中心点簇的欧式距离总和,这个值越小表示当前的分类效果越好,p表示点位置(x,y),mi为中心点的位置;
步骤7:通过不断调整K-means参数达到最佳的分类效果,最后参数设置定为距离测度参数为sqEuclidean,初始质心位置参数为sample,聚类重复相应次数;
步骤8:利用测试数据测试算法模型的有效性能。
作为本发明进一步改进,所述步骤3中7类特征分别包括均方根、均值、峰值、峰值时间、半高宽、振岭数和功率谱。
作为本发明进一步改进,步骤7聚类重复次数为5。
本发明一种基于PCA-Kmeans算法的冷轧带钢故障诊断优化方法,有如下有益效果:
1、本发明提出的基于PCA算法可以很好的优化数据特征,在保证数据信息量和稳定性的同时有效的压缩了数据维度,降低了数据的存贮和运算需求,避免了维度灾难。尽可能完备相关且低维度的数据有利于后续聚类算法的处理。
2、本发明采用的K-means聚类算法属于非监督学习,可以在节约人力、物力、财力的情况下自动的完成数据模型的建立。
3、该方法基于PCA-Kmeans算法使得预测模型性能更加优越,预测冷轧带钢故障准确度较高,能够达到95%以上,并且相比于传统预测方法,优化后的大数据预测模型鲁棒性更好、速度更快。
4、该方法属于无损检测方法,相比于传统的检测方法更的科学环保并且精度较高。
附图说明
图1是本发明中创建的K-means算法原理流程;
图2是冷轧带钢故障诊断预测聚类效果图;
图3是本发明PCA-Kmeans整体算法原理流程图。
具体实施方式
下面结合附图与具体实施方式对本发明作进一步详细描述:
本发明的技术方案为一种基于PCA-Kmeans算法的冷轧带钢故障诊断优化方法,通过将巴克豪森信号进行特征提取,然后利用PCA(Principal Component Analysis)降维算法优化数据,将信号特征压缩降维至二维。K-means聚类算法对于处理二维或者三维数据效果较佳,将优化后的数据送入K-means算法模型中,通过无监督学习来完成冷轧带钢的故障诊断。本发明的PCA-Kmeans算法模型优化了故障诊断模型,提高模型鲁棒性和预测准确性。
本申请首先利用巴克豪森电磁传感器检测冷轧带钢,从中获取巴克豪森原始信号。然后依次从巴克豪森信号中提取出特征,包括均方根、均值、峰值、峰值时间、半高宽、振岭数六个时域特征和功率谱一个频域特征。由于每个特征指标的数值分布不同,并且巴克豪森信号特征多且数据结构复杂,在进行数据处理之前需要先进行数据的转化整合处理,归一化处理数据,这样使得处理后的数据更加有利于处理计算,并且不容易产生不稳定的干扰影响,提高了数据的鲁棒性,减少了计算的复杂性。
对整合转化后的数据建立数据集,其中选取一部分数据作为测试样本数据,剩余的数据均送入后续的算法流程中进行处理。
巴克豪森信号特征虽然信息量丰富且鲁棒性强,但是由于数据量巨大、维度较高,这样会导致维度灾难,并且维度的增加,数据的稀疏性会越来越高。在一定程度上影响了数据处理和模型预测准确性。利用PCA降维算法可以将具有相关性的原始高维度数据进行线性无关的映射至低维空间,从而实现在尽可能保留数据信息的情况下降维数据。这样避免了由于单独对指标分析的孤立,不能完全利用数据中的信息,盲目损失很多有用信息。将原始的七维度数据信息映射至低维度空间,转换至两维。对于K-means聚类算法而言,处理二维数据聚类效果较佳。
构建K-means非监督学习算法,输入为经过PCA优化之后的特征数据,输出为两类结果,即冷轧带钢存在故障与否。并且设置初始的K-means中距离测度、初始质心位置、聚类重复次数等参数。距离测度即K-means算法按照什么样的距离来计算数据点之间的距离测度,针对本发明采用sqEuclidean距离测度效果最佳;初始质心位置选择sample方式,聚类重复次数设置为5次。算法流程如图1所示。不断调整K-means算法参数使得模型性能最佳即完成模型的建立,聚类分类效果如图2所示。
所述K-means核心算法公式如下:
Figure BDA0002308278290000041
其中SSE参数计算的内容为当前迭代得到的中心位置到各自中心点簇的欧式距离总和,这个值越小表示当前的分类效果越好,p表示点位置(x,y),mi为中心点的位置;
最后利用测试数据测试数学建模的算法有效性能,即基于PCA-Kmeans算法的冷轧带钢故障诊断优化模型在诊断冷轧带钢故障有无的准确度,准确度达到98.91%。
本发明PCA-Kmeans算法整体流程如图3所示。该发明利用数据降维算法对数据特征进行优化处理,并利用K-means聚类算法自动完成无监督学习,从巴克豪森信号特征数据中自动挖掘处有价值的信息,实现了基于PCA-Kmeans算法的冷轧带钢故障诊断优化方法。
以上所述,仅是本发明的较佳实施例而已,并非是对本发明作任何其他形式的限制,而依据本发明的技术实质所作的任何修改或等同变化,仍属于本发明所要求保护的范围。

Claims (3)

1.一种基于PCA-Kmeans算法的冷轧带钢故障诊断优化方法,其特征在于,包括如下步骤:
步骤1:首先对传感器采集到的巴克豪森信号进行特征提取,选取常用特征均方根、均值、峰值、峰值时间、半高宽、振岭数六个时域特征和功率谱一个频域特征;
步骤2:将获取的数据进行转化整合,巴克豪森信号特征多且数据结构复杂,在进行数据处理之前需要先进行数据的转化整合处理,将数据进行归一化处理,让每个特征处于0到1区间范围内;
步骤3:建立特征数据库,每个样本有7类特征;
步骤4:将数据库中的原始数据划分一部分数据为测试数据,用于测试优化算法后的模型有效性,剩余的数据作为建立模型的训练数据;
步骤5:采用PCA降维算法将原始七维特征降到二维特征数据,在贡献率保证的情况下完成数据聚类之前的预处理;
步骤6:构建K-means非监督学习算法,输入为经过PCA优化之后的特征数据,输出为两类结果,即有故障的冷轧带钢和无故障的冷轧带钢,并且设置初始的K-means中距离测度、初始质心位置、聚类重复次数相关参数;
所述K-means核心算法公式如下:
Figure FDA0002308278280000011
其中SSE参数计算的内容为当前迭代得到的中心位置到各自中心点簇的欧式距离总和,这个值越小表示当前的分类效果越好,p表示点位置(x,y),mi为中心点的位置;
步骤7:通过不断调整K-means参数达到最佳的分类效果,最后参数设置定为距离测度参数为sqEuclidean,初始质心位置参数为sample,聚类重复相应次数;
步骤8:利用测试数据测试算法模型的有效性能。
2.根据权利要求1所述的一种基于PCA-Kmeans算法的冷轧带钢故障诊断优化方法,其特征在于:所述步骤3中7类特征分别包括均方根、均值、峰值、峰值时间、半高宽、振岭数和功率谱。
3.根据权利要求1所述的一种基于PCA-Kmeans算法的冷轧带钢故障诊断优化方法,其特征在于:步骤7聚类重复次数为5。
CN201911248188.0A 2019-12-09 2019-12-09 一种基于PCA-Kmeans算法的冷轧带钢故障诊断优化方法 Pending CN110927243A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911248188.0A CN110927243A (zh) 2019-12-09 2019-12-09 一种基于PCA-Kmeans算法的冷轧带钢故障诊断优化方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911248188.0A CN110927243A (zh) 2019-12-09 2019-12-09 一种基于PCA-Kmeans算法的冷轧带钢故障诊断优化方法

Publications (1)

Publication Number Publication Date
CN110927243A true CN110927243A (zh) 2020-03-27

Family

ID=69857485

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911248188.0A Pending CN110927243A (zh) 2019-12-09 2019-12-09 一种基于PCA-Kmeans算法的冷轧带钢故障诊断优化方法

Country Status (1)

Country Link
CN (1) CN110927243A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112070030A (zh) * 2020-09-09 2020-12-11 电子科技大学 一种巴克豪森信号随机性度量及转换方法

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB201117025D0 (en) * 2011-10-04 2011-11-16 Morozov Maxim Method and apparatus for non-destructive evaluation of thickness of surface hardened layers of steels
CN107590506A (zh) * 2017-08-17 2018-01-16 北京航空航天大学 一种基于特征处理的复杂设备故障诊断方法
CN108073158A (zh) * 2017-12-05 2018-05-25 上海电机学院 基于pca和knn密度算法风电机组轴承故障诊断方法
CN108846173A (zh) * 2018-05-29 2018-11-20 南京航空航天大学 一种基于慢特征分析的巴克豪森信号应力估计方法
CN109284672A (zh) * 2018-08-03 2019-01-29 金陵科技学院 一种基于PSO-Kmeans算法的高压断路器机械故障诊断方法
CN109871956A (zh) * 2019-02-26 2019-06-11 北京工业大学 快速预测烧伤齿轮中显微组织变化的方法

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB201117025D0 (en) * 2011-10-04 2011-11-16 Morozov Maxim Method and apparatus for non-destructive evaluation of thickness of surface hardened layers of steels
CN107590506A (zh) * 2017-08-17 2018-01-16 北京航空航天大学 一种基于特征处理的复杂设备故障诊断方法
CN108073158A (zh) * 2017-12-05 2018-05-25 上海电机学院 基于pca和knn密度算法风电机组轴承故障诊断方法
CN108846173A (zh) * 2018-05-29 2018-11-20 南京航空航天大学 一种基于慢特征分析的巴克豪森信号应力估计方法
CN109284672A (zh) * 2018-08-03 2019-01-29 金陵科技学院 一种基于PSO-Kmeans算法的高压断路器机械故障诊断方法
CN109871956A (zh) * 2019-02-26 2019-06-11 北京工业大学 快速预测烧伤齿轮中显微组织变化的方法

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
SONG DING, ET AL.: "Non-destructive hardness prediction for 18CrNiMo7-6 steel based on feature selection and fusion of Magnetic Barkhausen Noise", 《NDT & E INTERNATIONAL》 *
尚前明 等: "多信息融合技术在船舶柴油机故障诊断中的应用", 《中国航海》 *
徐金梧 等: "《冶金生产过程质量监控理论与方法》", 31 May 2015, 冶金工业出版社 *
王冲: "《现代信息检索技术基本原理教程》", 30 November 2013, 西安电子科技大学出版社 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112070030A (zh) * 2020-09-09 2020-12-11 电子科技大学 一种巴克豪森信号随机性度量及转换方法
CN112070030B (zh) * 2020-09-09 2022-06-10 电子科技大学 一种巴克豪森信号随机性度量及转换方法

Similar Documents

Publication Publication Date Title
CN112152201B (zh) 基于卷积长短时记忆神经网络的用电负荷预测方法及系统
CN109902953B (zh) 一种基于自适应粒子群聚类的电力用户分类方法
CN110569901A (zh) 一种基于通道选择的对抗消除弱监督目标检测方法
CN111562108A (zh) 一种基于cnn和fcmc的滚动轴承智能故障诊断方法
CN111949012B (zh) 一种基于双权重多邻域保持嵌入算法的间歇过程故障检测方法
CN103648106A (zh) 一种基于类别匹配的半监督流形学习的WiFi室内定位方法
CN105678343A (zh) 基于自适应加权组稀疏表达的水电机组噪声异常诊断方法
CN108520310B (zh) G-L混合噪声特性v-支持向量回归机的风速预报方法
CN110096810A (zh) 一种基于逐层数据扩充深度学习的工业过程软测量方法
CN109784383A (zh) 一种基于图域特征和ds证据理论融合的钢轨裂纹识别方法
CN108919067A (zh) 一种用于gis局部放电模式的识别方法
CN111723876A (zh) 一种考虑双尺度相似性的负荷曲线集成谱聚类算法
CN115014789B (zh) 一种基于cnn-gcn的双传感器航空发动机机匣故障源声发射定位方法
CN106405683B (zh) 基于g-l混合噪声特性核岭回归技术的风速预报方法及装置
CN115221973A (zh) 一种基于增强加权异质集成学习的航空轴承故障诊断方法
Tang et al. Kernel latent features adaptive extraction and selection method for multi-component non-stationary signal of industrial mechanical device
CN110927243A (zh) 一种基于PCA-Kmeans算法的冷轧带钢故障诊断优化方法
CN114677362A (zh) 基于改进YOLOv5的表面缺陷检测方法
Li et al. Scale-invariant wave kernel signature for non-rigid 3d shape retrieval
CN111090679B (zh) 基于时序影响和图嵌入的时序数据表示学习方法
CN116644593A (zh) 一种不确定噪声的非高斯性检测判别方法及装置
CN111428772A (zh) 基于k-近邻自适应投票的光伏系统深度异常检测方法
CN115308705A (zh) 一种基于生成对抗网络的多姿态极窄脉冲回波生成方法
Min Application of data mining technology in management accounting from data flow perspective
Yang et al. Ensemble learning based housing price prediction model

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20200327

RJ01 Rejection of invention patent application after publication