CN114579542A - 一种基于pca-svm的盾构机故障数据清洗方法及装置 - Google Patents

一种基于pca-svm的盾构机故障数据清洗方法及装置 Download PDF

Info

Publication number
CN114579542A
CN114579542A CN202210254946.5A CN202210254946A CN114579542A CN 114579542 A CN114579542 A CN 114579542A CN 202210254946 A CN202210254946 A CN 202210254946A CN 114579542 A CN114579542 A CN 114579542A
Authority
CN
China
Prior art keywords
data
state parameter
fault
pca
svm
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210254946.5A
Other languages
English (en)
Inventor
徐恒吉
杨民强
陈建福
陈鹏
周胜利
郭建豪
刘辉
刁目松
谢旭
孙小玉
高永军
张超
杨帆
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China Railway 14th Bureau Group Shield Engineering Co Ltd
Original Assignee
China Railway 14th Bureau Group Shield Engineering Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China Railway 14th Bureau Group Shield Engineering Co Ltd filed Critical China Railway 14th Bureau Group Shield Engineering Co Ltd
Priority to CN202210254946.5A priority Critical patent/CN114579542A/zh
Publication of CN114579542A publication Critical patent/CN114579542A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/21Design, administration or maintenance of databases
    • G06F16/215Improving data quality; Data cleansing, e.g. de-duplication, removing invalid entries or correcting typographical errors

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Quality & Reliability (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Testing And Monitoring For Control Systems (AREA)

Abstract

本发明公开了一种基于PCA‑SVM的盾构机故障数据清洗方法及装置,该方法包括:获取待诊断盾构机运行过程中的各状态参量数据集:利用PCA算法对各状态参量数据集进行降维处理;利用SVM算法对PCA算法降维后的状态参量中的故障数据进行二次清洗。该方法首先利用主成分分析PCA算法,降低盾构机运行过程中状态参量数据集的维度,减小数据集的繁杂度。之后利用SVM算法原理,利用分类得出的超平面方程,找出故障类型分类边界处不同故障类型的故障数据,将其剔除。经过以上两次数据清洗,找出了能正确盾构机运行过程中反应故障的状态参量,并剔除故障类型分类边界处的数据,消除了过拟合现象,提高了后续盾构机故障诊断的精度。

Description

一种基于PCA-SVM的盾构机故障数据清洗方法及装置
技术领域
本发明涉及盾构机的数据处理领域,特别涉及一种基于PCA-SVM的盾构机故障数据清洗方法及装置。
背景技术
目前,随着社会的不断发展,人们对铁路、水利等复杂工程的需求不断地增加,对工程的安全性要求也不断地提升。盾构机是一种大型的高科技综合施工设备,它专门用来挖掘隧道,进行地下施工,具有开挖快、优质、安全、经济等优点。因此盾构机在隧道、水利工程等领域具有很大的应用潜力。而做好盾构机的故障诊断对于工程安全、进度和成本具有重要意义。
一般来说,在盾构机的工作过程中,其一般的故障种类包括液压系统故障、电器元件损坏、电机无法启动、变频调速系统故障、PLC故障、变压器故障、刀盘磨损等故障类型。而对上述故障类型的判断模型的建立一般是由盾构机运行过程中的各种掘进参数来确定的,这些掘进参数包括刀盘扭矩、掘进速度、总推力、注浆量、注浆压力、贯入度等。在进行故障诊断模型的建立时,主要利用以上状态参量。上述状态参量总数多且繁杂,且所使用数据一般存在过拟合现象,从而导致诊断器泛化能力低且诊断精度不高。
发明内容
鉴于上述问题,提出了本发明提供一种基于PCA-SVM的盾构机故障数据清洗方法及装置,可解决目前的盾构机故障诊断模型泛化能力低、诊断精度不高的问题。
第一方面,本发明实施例提供一种基于PCA-SVM的盾构机故障数据清洗方法,包括:
S10、获取待诊断盾构机运行过程中的各状态参量数据集:
S20、利用PCA算法对所述各状态参量数据集进行降维处理,完成一次数据清洗;
S30、利用SVM算法对PCA算法降维后的状态参量中的故障数据进行二次清洗。
在一个实施例中,S20步骤包括:
S201、根据所述各状态参量数据集,构造状态参量矩阵;所述状态参量矩阵中的每个状态参量均包括多个数据样本;
S202、对每个所述状态参量中的每个数据样本进行标准化处理,得到标准化处理之后的状态参量数据集;
S203、计算并获得所述标准化处理之后的状态参量数据集的相关系数矩阵;
S204、根据所述相关系数矩阵,获得所述相关系数矩阵的特征值和特征向量;
S205、根据所述特征值和特征向量,求取贡献率并得到降维后的状态参量矩阵,完成一次数据清洗。
在一个实施例中,S201步骤中,构造状态参量矩阵如下:
X={R1,R2,R3…Rm},R表示状态参量,m表示状态参量总数;
其中,每个状态参量共包含数据样本数为n个,即:
Figure BDA0003548160000000021
r表示数据样本。
在一个实施例中,S202步骤中,对每个所述状态参量中的每个数据样本进行标准化处理:
Figure BDA0003548160000000022
其中,μ=E(Rj),表示Rj状态参量数据的均值;σ=D(Rj)表示Rj状态参量数据的方差;i∈[1,2,3,…n];j∈[1,2,3,…m];
经过上式(1)处理得到标准化处理之后的状态参量数据:
Figure BDA0003548160000000023
其中,
Figure BDA0003548160000000024
表示X集合中第j个状态参量标准化处理之后的状态参量;则所有状态参量的标准化处理之后的状态参量数据集:
Figure BDA0003548160000000025
数据集
Figure BDA0003548160000000026
中,每一个子集的均值均为0。
在一个实施例中,S203步骤包括:
计算数据集
Figure BDA0003548160000000027
的相关系数矩阵P:
得到P为:
Figure BDA0003548160000000031
其中,
Figure BDA0003548160000000032
pi,j表示矩阵P中第i行、第j列的元素;i、j分别表示矩阵P中的行和列,取值范围为[1,m];
Figure BDA0003548160000000033
分别表示标准化数据集
Figure BDA0003548160000000034
中第i列和第j列数据;cov表示协方差;
Figure BDA0003548160000000035
表示求
Figure BDA0003548160000000036
方差;
Figure BDA0003548160000000037
表示求
Figure BDA0003548160000000038
方差;
Figure BDA0003548160000000039
表示求
Figure BDA00035481600000000310
的均值;E(Xj)表示求Xj的均值。
在一个实施例中,S204包括:
根据下式计算相关系数矩阵P的特征值和特征向量:
|λI-P|=0
其中,λ表示待求特征值;I表示单位矩阵。
在一个实施例中,S205步骤包括:
求取贡献率并得到降维后的矩阵;定义贡献率如下:
Figure BDA00035481600000000311
λk表示第k个特征值;k的取值为[1,2,…m];i表示序号,取值为[1,2,…m];Qcount(k)表示第k个主元的贡献率;定义累计贡献率如下:
Figure BDA00035481600000000312
保留累计贡献率达到预设比例以上的前l个主元,得到新的相关系数矩阵Pnew;由此得到降维后的状态参量矩阵:Xnew=X·Pnew
Pnew表示相关系数矩阵;X表示状态参量矩阵;Xnew表示降维后的状态参量矩阵。
在一个实施例中,S30步骤包括:
S301、确定盾构机运行过程中的故障类型及故障发生时对应的状态参量数据,并根据不同故障类型对数据进行打标签;
S302、使用SVM算法对两种故障数据进行二分类,求出两种故障数据的分类超平面;
S303、计算所述两种故障数据点到所述超平面之间的距离;
S304、当所述距离小于预设阈值时,剔除对应的数据点,完成二次数据清洗。
第二方面,本发明实施例还提供一种基于PCA-SVM的盾构机故障数据清洗装置,包括:
获取模块,用于获取待诊断盾构机运行过程中的各状态参量数据集:
降维处理模块,利用PCA算法对所述各状态参量数据集进行降维处理,完成一次数据清洗;
二次清洗模块,利用SVM算法对PCA算法降维后的状态参量中的故障数据进行二次清洗。
本发明实施例提供的上述技术方案的有益效果至少包括:
本发明实施例提供的一种基于PCA-SVM的盾构机故障数据清洗方法,首先利用主成分分析(PCA)算法,降低盾构机运行过程中状态参量数据集的维度,减小数据集的繁杂度。之后利用SVM算法原理,利用分类得出的超平面方程,找出故障类型分类边界处不同故障类型的故障数据,将其剔除。经过以上两次数据清洗,找出了能正确盾构机运行过程中反应故障的状态参量,并剔除故障类型分类边界处的数据,消除了过拟合现象,提高了后续盾构机故障诊断的精度。
本发明的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本发明而了解。本发明的目的和其他优点可通过在所写的说明书、权利要求书、以及附图中所特别指出的结构来实现和获得。
下面通过附图和实施例,对本发明的技术方案做进一步的详细描述。
附图说明
附图用来提供对本发明的进一步理解,并且构成说明书的一部分,与本发明的实施例一起用于解释本发明,并不构成对本发明的限制。在附图中:
图1为本发明实施例提供的基于PCA-SVM的盾构机故障数据清洗方法流程图;
图2为本发明实施例提供的基于PCA-SVM的盾构机故障数据清洗原理图;
图3为本发明实施例提供的基于PCA-SVM的盾构机故障数据清洗装置框图。
具体实施方式
下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例,然而应当理解,可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本公开,并且能够将本公开的范围完整的传达给本领域的技术人员。
参照图1所示,本发明实施例提供一种基于PCA-SVM的盾构机故障数据清洗方法,包括:
S10、获取待诊断盾构机运行过程中的各状态参量数据集:
S20、利用PCA算法对所述各状态参量数据集进行降维处理,完成一次数据清洗;
S30、利用SVM算法对PCA算法降维后的状态参量中的故障数据进行二次清洗。
本实施例中,通过获取需要诊断盾构机运行过程中的各状态参量数据集,首先利用主成分分析(PCA)算法,降低状态参量数据集的维度,减小数据集的繁杂度。之后利用SVM算法原理,利用分类得出的超平面方程,找出故障类型分类边界处不同故障类型的故障数据,将其剔除。经过以上两次数据清洗,找出能正确反应故障的状态参量,并提出故障类型分类边界处的数据,消除了过拟合现象,提高了后续故障诊断的精度。
从两个方面进行说明:1、利用PCA算法完成一次数据清洗;2、利用SVM算法进行二次清洗。
1、利用主成分分析(PCA)算法,降低状态参量数据集的维度,减小数据集的繁杂度。上述S20步骤包括:
S201、根据所述各状态参量数据集,构造状态参量矩阵;所述状态参量矩阵中的每个状态参量均包括多个数据样本;
S202、对每个所述状态参量中的每个数据样本进行标准化处理,得到标准化处理之后的状态参量数据集;
S203、计算并获得所述标准化处理之后的状态参量数据集的相关系数矩阵;
S204、根据所述相关系数矩阵,获得所述相关系数矩阵的特征值和特征向量;
S205、根据所述特征值和特征向量,求取贡献率并得到降维后的状态参量矩阵,完成一次数据清洗。
其中,在S201步骤中,构造状态参量矩阵如下:
X={R1,R2,R3…Rm},R表示状态参量,m表示状态参量总数;
其中,每个状态参量共包含数据样本数为n个,即:
Figure BDA0003548160000000051
r表示数据样本。
下面分别对上述各个子步骤进行说明:
在S202步骤中,对每个所述状态参量中的每个数据样本进行标准化处理:
Figure BDA0003548160000000052
(1)式中,μ=E(Rj),表示Rj状态参量数据的均值;σ=D(Rj)表示Rj状态参量数据的方差;i∈[1,2,3,…n];j∈[1,2,3,…m];
经过上式(1)处理得到标准化处理之后的状态参量数据:
Figure BDA0003548160000000061
(2)式中,
Figure BDA0003548160000000062
表示X集合中第j个状态参量标准化处理之后的状态参量;则所有状态参量的标准化处理之后的状态参量数据集:
Figure BDA0003548160000000063
数据集
Figure BDA0003548160000000064
中,每一个子集的均值均为0。
在S203步骤中,计算数据集
Figure BDA0003548160000000065
的相关系数矩阵P:
得到P为:
Figure BDA0003548160000000066
其中,
Figure BDA0003548160000000067
pi,j表示矩阵P中第i行、第j列的元素;i、j分别表示矩阵P中的行和列,取值范围为[1,m];
Figure BDA0003548160000000068
分别表示标准化数据集
Figure BDA0003548160000000069
中第i列和第j列数据;cov表示协方差;
Figure BDA00035481600000000610
表示求
Figure BDA00035481600000000611
方差;
Figure BDA00035481600000000612
表示求
Figure BDA00035481600000000613
方差;
Figure BDA00035481600000000614
表示求
Figure BDA00035481600000000615
的均值;E(Xj)表示求Xj的均值。
上述S204步骤包括:
根据下式计算相关系数矩阵P的特征值和特征向量:
|λI-P|=0
其中,λ表示待求特征值;I表示单位矩阵。
上述S205步骤包括:
求取贡献率并得到降维后的矩阵;定义贡献率如下:
Figure BDA00035481600000000616
λk表示第k个特征值;k的取值为[1,2,…m];i表示序号,取值为[1,2,…m];Qcount(k)表示第k个主元的贡献率;定义累计贡献率如下:
Figure BDA0003548160000000071
保留累计贡献率达到预设比例以上的前l个主元,得到新的相关系数矩阵Pnew;由此得到降维后的状态参量矩阵:Xnew=X·Pnew
Pnew表示相关系数矩阵;X表示状态参量矩阵;Xnew表示降维后的状态参量矩阵。
2、在利用主成分分析(PCA)算法完成一次数据清洗之后,再利用SVM算法原理,利用分类得出的超平面方程,找出故障类型分类边界处不同故障类型的故障数据,将其剔除。上述S30步骤包括:
S301、确定盾构机运行过程中的故障类型及故障发生时对应的状态参量数据,并根据不同故障类型对数据进行打标签;
S302、使用SVM算法对两种故障数据进行二分类,求出两种故障数据的分类超平面;
S303、计算所述两种故障数据点到所述超平面之间的距离;
S304、当所述距离小于预设阈值时,剔除对应的数据点,完成二次数据清洗。
经过以上两次数据清洗,找出能正确反应故障的状态参量,并提出故障类型分类边界处的数据,消除了过拟合现象,提高了后续故障诊断的精度。
下面再以举例方式清楚的描述本发明实施例的技术方案。
参照图2所示,包括4个大步骤:
步骤一:列写所使用盾构机的各状态参量及其符号:以表1的25种状态参量为例进行后续的说明。
表1 盾构机各状态参量名称及其代表符号
Figure BDA0003548160000000072
步骤二:构造状态参量矩阵如下所示:
X={R1,R2,R3,...,R25}
其中每个状态参量共包含数据样本数为n个,即:
Figure BDA0003548160000000073
Figure BDA0003548160000000081
步骤三:利用PCA算法对状态参量数据集进行降维。其过程如下:
(1)标准化处理。为了使数据集具有统一的量纲,需对数据进行标准化处理,标准化过程如下:
对于状态参量R1,
Figure BDA0003548160000000082
其标准化处理过程为:
Figure BDA0003548160000000083
(1)式中,μ=E(R1),表示R1状态参量数据的均值;σ=D(R1)表示R1状态参量数据的方差。
经过上式处理得到标准化处理之后的状态参量数据:
Figure BDA0003548160000000084
其他状态参量也按照R1的标准化处理方式进行处理。由此得到标准化处理之后的状态参量数据集:
Figure BDA0003548160000000085
此时每一列数据的均值均为0。
(2)求
Figure BDA0003548160000000086
的相关系数矩阵P。
得到P为:
Figure BDA0003548160000000087
其中,
Figure BDA0003548160000000088
pi,j表示矩阵P中第i行、第j列的元素;i、j分别表示矩阵P中的行和列,取值范围为[1,m];
Figure BDA0003548160000000089
分别表示标准化数据集
Figure BDA00035481600000000810
中第i列和第j列数据;cov表示协方差;
Figure BDA00035481600000000811
表示求
Figure BDA00035481600000000812
方差;
Figure BDA00035481600000000813
表示求
Figure BDA00035481600000000814
方差;
Figure BDA00035481600000000815
表示求
Figure BDA00035481600000000816
的均值;E(Xj)表示求Xj的均值。此时,其中i=1,2,;化数据集j=1,2,..,25。例如,当i=1,j=2时,
Figure BDA00035481600000000817
即求
Figure BDA00035481600000000818
的协方差。i,j任意组合,一共得到625组协方差,与矩阵P中的元素一一对应。
(3)求P的特征值和特征向量。
根据下式计算相关系数矩阵P的特征值和特征向量:计算得到特征值后,可以根据线性代数中的计算对应特征值的特征向量方法计算对应的特征向量;公式为Px=λx,其中x为特征向量。
|λI-P|=0,其中,λ表示待求特征值;I表示单位矩阵。
(4)求取贡献率并得到降维后的矩阵
定义贡献率如下:
Figure BDA0003548160000000091
P是一个25个献率的矩阵,一共能求得25个特征值,λk表示第k个特征值,k得取值为1,值为,共。其中,如无特殊说明,i和j只是表示一个计数的作用,用来表征矩阵的第几列和其对应的特征值。Qcount(k)表示第k个主元的贡献率;定义累计贡献率如下:
Figure BDA0003548160000000092
保留累计贡献率达到95%以上的前l个主元,得到新的相关系数矩阵Pnew;由此得到降维后的状态参量矩阵:Xnew=X·Pnew
X表示步骤二中构造的状态参量矩阵,Pnew表示保留前l个主元之后的相关系数矩阵,Xnew表示经过PCA降维之后的状态参量矩阵。
步骤四:利用SVM算法对PCA算法降维之后的状态参量中的故障数据进行第二次清洗。其清洗步骤如下:
(1)确定故障类型及故障发生时对应的状态参量数据,并根据不同故障类型对数据进行打标签。
(2)将故障数据进行两两组合,设故障类型共T种,则两两分类的组合共有(T(T-1))/2种。设其中两种故障数据为:{X1 X2}。使用SVM算法对两类故障数据进行二分类。求出两种故障数据的分类超平面为:
wTx+b=0
w为权值向量,即所求超平面的法向量。b为偏置。x为输入的样本值,即选取的两种故障数据{X1 X2}所组成的样本值。wT表示w的转置,同时将故障数据X1的标签记为1,故障数据X2的标签记为0。得到样本值x所对应的标签y,将选取的两种故障数据全部作为训练集利用MATLAB中的fitsvm函数,输入样本值x和标签y。由于故障数据之间存在耦合,会导致其线性不可分,故选用高斯核函数进行非线性分类。最终训练得到SVM的分类模型,并得到参数w和b。
(3)计算两种故障数据点到超平面之间的距离d。
Figure BDA0003548160000000101
Figure BDA0003548160000000102
Figure BDA0003548160000000103
其中,n为样本数量,i=1,2,3…n,i表示n个样本中的任一样本序号;j表示两种故障数据。
(4)完成数据剔除。设支持向量到超平面之间的距离为d0。若di<1.5d0;则认为该数据点可能会造成过拟合现象,将其剔除。本实施例中,以使用1.5d0作为区分正常数据和异常数据的阈值,这样能有效把两种数据进行分类同时也不会损失过多的有用数据。
(5)对其他两两组合的故障数据也进行上述同样的操作,删除位于超平面附近的数据点,完成第二次数据清洗。整体的数据清洗流程图如图2所示。
通过两次数据清洗,找出了能正确反应故障的状态参量,精简了总体的数据量,提高了诊断器的泛化能力,并提出故障类型分类边界处的数据,消除了过拟合现象,提高了后续故障诊断的精度。相比现有的一次数据清洗如直接剔除异常值、替换异常值等方法,提出的两次数据清洗方法很好的解决了后续诊断器泛化能力低,诊断精度不高的问题。
本发明主要用在盾构机利用掘进参数来建立故障诊断模型之时。为提高所建立故障诊断模型的诊断精度,需对掘进参数进行清洗处理。PCA算法能将原来的变量重新组合成一组互相无关的几个综合变量,并能根据自己的需要从中选取几个较少的总和变量,且选取的这些变量能尽可能多的反映原来的变量。该方法可以去除数据中的异常和冗余数据。因此首先利用PCA算法对所使用的状态参量进行降维处理。降低所使用的掘进参数维度,同时使相似的特征进行合并,减小了过拟合现象,同时维度的降低也提高了算法的运算速度,以上是完成了第一次数据清洗。SVM算法能在不同的数据类型之间找出一个最优的分类超平面,使不同类型的数据位于超平面的不同侧。因此可利用SVM算法对PCA算法降维之后的数据进行第二次清洗。首先根据故障类型对相对应的降维后的状态参量进行打标签,之后利用SVM算法对故障数据进行分类,并求出分类超平面,删除超平面附近的故障数据,这样使分类边界处的数据进行剔除,使不同故障所对应的特征更为明显,提高后续故障诊断的精度。
基于同一发明构思,本发明实施例还提供一种基于PCA-SVM的盾构机故障数据清洗装置,该装置的具体实施可参照上述基于PCA-SVM的盾构机故障数据清洗方法的实施,具体不在赘述。参照图3所示,该装置包括:
获取模块,用于获取待诊断盾构机运行过程中的各状态参量数据集:
降维处理模块,利用PCA算法对所述各状态参量数据集进行降维处理,完成一次数据清洗;
二次清洗模块,利用SVM算法对PCA算法降维后的状态参量中的故障数据进行二次清洗。
显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。

Claims (9)

1.一种基于PCA-SVM的盾构机故障数据清洗方法,其特征在于,包括:
S10、获取待诊断盾构机运行过程中的各状态参量数据集:
S20、利用PCA算法对所述各状态参量数据集进行降维处理,完成一次数据清洗;
S30、利用SVM算法对PCA算法降维后的状态参量中的故障数据进行二次清洗。
2.如权利要求1所述的一种基于PCA-SVM的盾构机故障数据清洗方法,其特征在于,S20步骤包括:
S201、根据所述各状态参量数据集,构造状态参量矩阵;所述状态参量矩阵中的每个状态参量均包括多个数据样本;
S202、对每个所述状态参量中的每个数据样本进行标准化处理,得到标准化处理之后的状态参量数据集;
S203、计算并获得所述标准化处理之后的状态参量数据集的相关系数矩阵;
S204、根据所述相关系数矩阵,获得所述相关系数矩阵的特征值和特征向量;
S205、根据所述特征值和特征向量,求取贡献率并得到降维后的状态参量矩阵,完成一次数据清洗。
3.如权利要求2所述的一种基于PCA-SVM的盾构机故障数据清洗方法,其特征在于,S201步骤中,构造状态参量矩阵如下:
X={R1,R2,R3…Rm},R表示状态参量,m表示状态参量总数;
其中,每个状态参量共包含数据样本数为n个,即:
Figure FDA0003548159990000011
r表示数据样本。
4.如权利要求3所述的一种基于PCA-SVM的盾构机故障数据清洗方法,其特征在于,S202步骤中,对每个所述状态参量中的每个数据样本进行标准化处理:
Figure FDA0003548159990000012
其中,μ=E(Rj),表示Rj状态参量数据的均值;σ=D(Rj)表示Rj状态参量数据的方差;i∈[1,2,3,…n];j∈[1,2,3,…m];
经过上式(1)处理得到标准化处理之后的状态参量数据:
Figure FDA0003548159990000021
其中,
Figure FDA0003548159990000022
表示X集合中第j个状态参量标准化处理之后的状态参量;则所有状态参量的标准化处理之后的状态参量数据集:
Figure FDA0003548159990000023
数据集
Figure FDA0003548159990000024
中,每一个子集的均值均为0。
5.如权利要求4所述的一种基于PCA-SVM的盾构机故障数据清洗方法,其特征在于,S203步骤包括:
计算数据集
Figure FDA0003548159990000025
的相关系数矩阵P:
得到P为:
Figure FDA0003548159990000026
其中,
Figure FDA0003548159990000027
pi,j表示矩阵P中第i行、第j列的元素;i、j分别表示矩阵P中的行和列,取值范围为[1,m];
Figure FDA0003548159990000028
分别表示标准化数据集
Figure FDA0003548159990000029
中第i列和第j列数据;cov表示协方差;
Figure FDA00035481599900000210
表示求
Figure FDA00035481599900000211
方差;
Figure FDA00035481599900000212
表示求
Figure FDA00035481599900000213
方差;
Figure FDA00035481599900000214
表示求
Figure FDA00035481599900000215
的均值;E(Xj)表示求Xj的均值。
6.如权利要求5所述的一种基于PCA-SVM的盾构机故障数据清洗方法,其特征在于,S204包括:
根据下式计算相关系数矩阵P的特征值和特征向量:
|λI-P|=0
其中,λ表示待求特征值;I表示单位矩阵。
7.如权利要求6所述的一种基于PCA-SVM的盾构机故障数据清洗方法,其特征在于,S205步骤包括:
求取贡献率并得到降维后的矩阵;定义贡献率如下:
Figure FDA00035481599900000216
λk表示第k个特征值;k的取值为[1,2,…m];i表示序号,取值为[1,2,…m];Qcount(k)表示第k个主元的贡献率;定义累计贡献率如下:
Figure FDA0003548159990000031
保留累计贡献率达到预设比例以上的前l个主元,得到新的相关系数矩阵Pnew;由此得到降维后的状态参量矩阵:Xnew=X·Pnew
Pnew表示相关系数矩阵;X表示状态参量矩阵;Xnew表示降维后的状态参量矩阵。
8.如权利要求1-7所述的一种基于PCA-SVM的盾构机故障数据清洗方法,其特征在于,S30步骤包括:
S301、确定盾构机运行过程中的故障类型及故障发生时对应的状态参量数据,并根据不同故障类型对数据进行打标签;
S302、使用SVM算法对两种故障数据进行二分类,求出两种故障数据的分类超平面;
S303、计算所述两种故障数据点到所述超平面之间的距离;
S304、当所述距离小于预设阈值时,剔除对应的数据点,完成二次数据清洗。
9.一种基于PCA-SVM的盾构机故障数据清洗装置,其特征在于,包括:
获取模块,用于获取待诊断盾构机运行过程中的各状态参量数据集:
降维处理模块,利用PCA算法对所述各状态参量数据集进行降维处理,完成一次数据清洗;
二次清洗模块,利用SVM算法对PCA算法降维后的状态参量中的故障数据进行二次清洗。
CN202210254946.5A 2022-03-15 2022-03-15 一种基于pca-svm的盾构机故障数据清洗方法及装置 Pending CN114579542A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210254946.5A CN114579542A (zh) 2022-03-15 2022-03-15 一种基于pca-svm的盾构机故障数据清洗方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210254946.5A CN114579542A (zh) 2022-03-15 2022-03-15 一种基于pca-svm的盾构机故障数据清洗方法及装置

Publications (1)

Publication Number Publication Date
CN114579542A true CN114579542A (zh) 2022-06-03

Family

ID=81780883

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210254946.5A Pending CN114579542A (zh) 2022-03-15 2022-03-15 一种基于pca-svm的盾构机故障数据清洗方法及装置

Country Status (1)

Country Link
CN (1) CN114579542A (zh)

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20080188972A1 (en) * 2006-10-11 2008-08-07 Fisher-Rosemount Systems, Inc. Method and System for Detecting Faults in a Process Plant
US20150219530A1 (en) * 2013-12-23 2015-08-06 Exxonmobil Research And Engineering Company Systems and methods for event detection and diagnosis
CN109740859A (zh) * 2018-12-11 2019-05-10 国网山东省电力公司淄博供电公司 基于主成分分析法和支持向量机的变压器状态评估方法及系统
CN112952830A (zh) * 2021-04-16 2021-06-11 山东科技大学 一种故障后电力系统暂态稳定预测方法
WO2021135630A1 (zh) * 2019-12-31 2021-07-08 福州大学 基于grcmse与流形学习的滚动轴承故障诊断方法
WO2021213142A1 (zh) * 2020-04-23 2021-10-28 中车株洲电力机车研究所有限公司 一种牵引电机故障诊断方法及装置

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20080188972A1 (en) * 2006-10-11 2008-08-07 Fisher-Rosemount Systems, Inc. Method and System for Detecting Faults in a Process Plant
US20150219530A1 (en) * 2013-12-23 2015-08-06 Exxonmobil Research And Engineering Company Systems and methods for event detection and diagnosis
CN109740859A (zh) * 2018-12-11 2019-05-10 国网山东省电力公司淄博供电公司 基于主成分分析法和支持向量机的变压器状态评估方法及系统
WO2021135630A1 (zh) * 2019-12-31 2021-07-08 福州大学 基于grcmse与流形学习的滚动轴承故障诊断方法
WO2021213142A1 (zh) * 2020-04-23 2021-10-28 中车株洲电力机车研究所有限公司 一种牵引电机故障诊断方法及装置
CN112952830A (zh) * 2021-04-16 2021-06-11 山东科技大学 一种故障后电力系统暂态稳定预测方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
李薇: "流域概率水文预报方法研究", 31 July 2020, 黄河水利出版社, pages: 71 - 73 *

Similar Documents

Publication Publication Date Title
CN111562108A (zh) 一种基于cnn和fcmc的滚动轴承智能故障诊断方法
CN109297689B (zh) 一种引入权重因子的大型水力机械智能诊断方法
CN108664010A (zh) 发电机组故障数据预测方法、装置和计算机设备
CN112270312B (zh) 风机轴承故障诊断方法、系统、计算机设备和存储介质
CN110647911A (zh) 一种基于主成分分析和深度信念网络的轴承故障诊断方法
CN113554621B (zh) 基于小波尺度图和深度迁移学习的刀具磨损状态识别系统及识别方法
CN112518425B (zh) 基于多源样本迁移强化学习的智能加工刀具磨损预测方法
CN113850161B (zh) 基于lstm深度降噪自编码器的飞轮故障识别方法
CN114354184B (zh) 一种基于深度学习的大型回转装备主轴健康预警模型建立方法和装置
CN114429152A (zh) 基于动态指数对抗性自适应的滚动轴承故障诊断方法
CN112395382A (zh) 基于变分自编码器的船舶异常航迹数据检测方法和装置
CN106600605A (zh) 一种无监督的快速图像分割算法
CN115358337A (zh) 一种小样本故障诊断方法、装置及存储介质
CN106907927A (zh) 一种核灵活流形嵌入电熔镁炉故障监测方法
CN115358259A (zh) 一种基于自学习的无监督跨工况轴承故障诊断方法
CN111291918B (zh) 平稳子空间外源矢量自回归的旋转机械退化趋势预测方法
CN106959397A (zh) 一种用于高铁逆变器的微小故障诊断系统的设计方法
CN116398418A (zh) 核电循环水泵在线异常监测及辨识方法
CN114579542A (zh) 一种基于pca-svm的盾构机故障数据清洗方法及装置
Zhang et al. Automated fault detection using convolutional auto encoder and k nearest neighbor rule for semiconductor manufacturing processes
CN116611003A (zh) 一种变压器故障诊断方法、装置、介质
CN105759787B (zh) 一种基于切换有监督线性动态系统模型的故障诊断方法
Xie et al. Fault diagnosis of large-scale industrial processes using the multi-block probabilistic kernel partial least squares method
CN116702580A (zh) 一种基于注意力卷积自编码器的发酵过程故障监测方法
CN117631021A (zh) 一种储层识别方法、装置、设备及可读存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination