CN113392517A - 基于遗传算法和支持向量数据描述的自相关多项式轮廓监控设计方法 - Google Patents

基于遗传算法和支持向量数据描述的自相关多项式轮廓监控设计方法 Download PDF

Info

Publication number
CN113392517A
CN113392517A CN202110650355.5A CN202110650355A CN113392517A CN 113392517 A CN113392517 A CN 113392517A CN 202110650355 A CN202110650355 A CN 202110650355A CN 113392517 A CN113392517 A CN 113392517A
Authority
CN
China
Prior art keywords
data
monitoring
support vector
polynomial
genetic algorithm
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
CN202110650355.5A
Other languages
English (en)
Inventor
薛丽
贾元忠
周昊飞
邹妍
张诗青
曹逗逗
郑含笑
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhengzhou University of Aeronautics
Original Assignee
Zhengzhou University of Aeronautics
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhengzhou University of Aeronautics filed Critical Zhengzhou University of Aeronautics
Priority to CN202110650355.5A priority Critical patent/CN113392517A/zh
Publication of CN113392517A publication Critical patent/CN113392517A/zh
Withdrawn legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F30/00Computer-aided design [CAD]
    • G06F30/20Design optimisation, verification or simulation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/12Computing arrangements based on biological models using genetic models
    • G06N3/126Evolutionary algorithms, e.g. genetic algorithms or genetic programming

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Biophysics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • General Physics & Mathematics (AREA)
  • Evolutionary Biology (AREA)
  • General Engineering & Computer Science (AREA)
  • Evolutionary Computation (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Genetics & Genomics (AREA)
  • Data Mining & Analysis (AREA)
  • Physiology (AREA)
  • Geometry (AREA)
  • Artificial Intelligence (AREA)
  • Biomedical Technology (AREA)
  • Computational Linguistics (AREA)
  • Computer Hardware Design (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Complex Calculations (AREA)

Abstract

本发明涉及一种基于遗传算法和支持向量数据描述的自相关多项式轮廓监控设计方法,本发明针对现生产过程中都是基于构造统计量建立控制图对具有自相关性多项式轮廓进行监控,此类方法需要对原始数据进行处理,过程较为复杂且难以理解及应用,本发明基于遗传算法和支持向量数据描述提出了一种易于实现的监控方法,并给出详细的实现流程,仿真时应用GA算法对参数进行优化;仿真结果表明本方法在监控截距、一次项系数、二次项系数以及在弱自相关系数、标准差发生偏移时,监控效果优于其他控制图,同时便于及时发现异常波动。

Description

基于遗传算法和支持向量数据描述的自相关多项式轮廓监控 设计方法
技术领域
本发明涉及统计过程控制的技术领域,具体为基于遗传算法和支持向量数 据描述的自相关多项式轮廓监控设计方法。
背景技术
统计过程控制(Statistical Process Control,SPC)应用中,通常运用 传统控制图监控一元或者多元质量特性值。如果一个产品的质量可以用多个响 应变量与多个解释变量之间的函数关系表示,可以采用轮廓控制图监控,此时 这种函数关系称为轮廓(Profile)。传统的控制图方法的前提条件是质量数据 观测值是独立的,一些学者提出了多元SLRT,T2,P值等控制图对多项式轮廓进 行监控,但随着工业信息技术的发展,数据采集方法的改进,采集到的轮廓数 据内通常存在自相关关系。对于不满足独立性假设的轮廓数据,一些学者研究 时忽略相关关系,结果发现即使轮廓内数据的相关关系不强,也会影响传统控 制图的监控效果,导致虚发警报增多,进而影响生产过程。一些学者提出了消 除轮廓间相关性的方法,之后采用多元
Figure BDA0003110980640000011
T2、GLT/R等方法进行参数监 控。
由于控制图可以看成区分受控过程和失控过程的分类器,使用机器学习方 法监控生产过程,不需要对数据进行复杂的处理,亦能达到较好的效果。一些 学者讨论了二分类支持向量机在监控线性轮廓中的应用。由于二分类的方法需 要大量受控和失控样本训练分类器,在一定程度上限制了二分类方法的应用范 围。一些学者分别提出了基于支持向量数据描述的线性轮廓与非线性轮廓控制 图。但一分类SVDD方法在存在相关性的多项式轮廓中,还没有应用。故本发明 提出了一种基于SVDD监控多项式轮廓内存在自相关关系的方法,及时发现异常 波动。
且消除相关性和构造统计量建立控制图监控生产过程,需要进行复杂的数 据处理。对于没有较深数学功底的质量监测人员,难以理解及应用。因此,本 发明提供一种基于SVDD的自相关多项式轮廓监控设计方法,发现异常波动。SVDD 作为机器学习的一种方法,应用时仅需要正常轮廓数据便可完成训练,进而监 控生产过程,便于理解,且对输入数据的类型没有限制。
发明内容
针对上述情况,为克服现有技术缺陷,本发明的目的是提供一种基于遗传 算法和支持向量数据描述的自相关多项式轮廓监控设计方法便于及时发现异常 波动。
本发明解决其技术问题所采用的技术方案是:基于遗传算法和支持向量数 据描述的自相关多项式轮廓监控设计方法,其特征在于,包括以下几个步骤:
步骤一:数据采集设备采集工业生产线中各监测传感器产生的正常轮廓数 据yij(i=1,2,...,n;j=1,2,...,d),代表收集的第i个样本第j个位置的轮廓质量特性。
步骤二:数据预处理:将S1采集的正常样本值转化到[0,1]的区间内,转 化后的数据为{z|zi∈Rd,i=1,2,...,n}。
步骤三:设训练样本{z|zi∈Rd,i=1,2,...,n},在映射的高维空间里可求出中心为a,半径为R的最小超球体;转化为下列的二次规划问题:
Figure RE-GDA0003188633350000021
式中C为惩罚系数,ξi为松弛变量,φ是将未去除相关性数据映射到高维 特征空间中的非线性映射。利用拉格朗日方法求解后转化为对偶问题:
Figure BDA0003110980640000031
式中αi为拉格朗日乘子,用高斯核函数K(zi,zj)=exp(-r||zi-zj||2),(r为核函数参数)训练。用核函数K(zi·zi)代替(φ(zi)·φ(zi))运算得:
Figure BDA0003110980640000032
对式(3)进行求解可得α=(α12,...,αn),αi不为0对应的zi为支持向量,记 支持向量的集合为SV。超球体球心a和半径R可由式(4)、式(5)分别计算求 出:
Figure BDA0003110980640000033
Figure BDA0003110980640000034
其中zk∈SV。对于新的测试样本点o可通过式(6)计算该点到超球体中心 的距离:
Figure BDA0003110980640000035
通过比较D(o)和R的大小关系判断样本点的受控情况;
应用GA调整核函数参数r为和惩罚系数C,使训练数据zi的训练准确率达到 最高,此时的训练模型为最优模型,适应度函数为min f=|accuracy-(1-α)|,accuracy 是SVDD在参数C和r条件下训练出的准确率。
步骤四:在线监控:对后续设备采集工业生产线中的多项式轮廓数据进行 监控;若D(o)≤R,样本点o为受控数据,若D(o)>R样本点o为异常数据。
优选的,在步骤三中调整核函数参数r为和惩罚系数C时,误警率α=0,若 f≤0.0001则接受参数C和r值,进行下一步骤,否则返回步骤一。
本发明的技术构思为:本发明针对现生产过程中都是基于构造统计量建立 控制图对具有自相关性多项式轮廓进行监控,此类方法需要对原始数据进行处 理,过程较为复杂且难以理解及应用,本发明基于SVDD提出了一种易于实现 的监控方法,并给出详细的实现流程,仿真时应用GA算法对参数进行优化; 仿真结果表明本方法在监控截距、一次项系数、二次项系数以及在弱自相关系 数ρ=0.1、标准差发生偏移时,监控效果优于其他控制图,同时便于及时发现异 常波动。
附图说明
图1是本发明的步骤流程框体。
具体实施方式
结合附图,对本发明的具体实施方式作进一步详细说明。
本发明针对多项式轮廓内存在自相关的数据基于SVDD提出了一种监控方 法,基于遗传算法和支持向量数据描述的自相关多项式轮廓监控设计方法,具 体包括以下步骤:
S1:数据采集设备采集工业生产线中各监测传感器产生的正常轮廓数据 yij(i=1,2,...,n;j=1,2,...,d),代表收集的第i个样本第j个位置的轮廓质量特性。
S2:数据预处理。将S1采集的正常样本值转化到[0,1]的区间内,转化后 的数据为{z|zi∈Rd,i=1,2,...,n}。
S3:创建模型。
设训练样本{z|zi∈Rd,i=1,2,...,n},在映射的高维空间里可求出中心为a,半径为R的最小超球体。转化为下列的二次规划问题:
Figure BDA0003110980640000051
式中C为惩罚系数,ξi为松弛变量,φ是将未去除相关性数据映射到高维 特征空间中的非线性映射。利用拉格朗日方法求解后转化为对偶问题:
Figure BDA0003110980640000052
式中αi为拉格朗日乘子,用高斯核函数K(zi,zj)=exp(-r||zi-zj||2),(r为核函数参数)训练。用核函数K(zi·zi)代替(φ(zi)·φ(zi))运算得:
Figure BDA0003110980640000053
对式(3)进行求解可得α=(α12,...,αn),αi不为0对应的zi为支持向量,记 支持向量的集合为SV。超球体球心a和半径R可由式(4)、式(5)分别计算求 出:
Figure BDA0003110980640000054
Figure BDA0003110980640000055
其中zk∈SV。对于新的测试样本点o可通过式(6)计算该点到超球体中心 的距离:
Figure BDA0003110980640000056
通过比较D(o)和R的大小关系判断样本点的受控情况。
应用GA调整核函数参数r为和惩罚系数C,使训练数据zi的训练准确率达 到最高,此时的训练模型为最优模型。
S4:在线监控。对后续设备采集工业生产线中的多项式轮廓数据进行监控。 若D(o)≤R,样本点o为受控数据,若D(o)>R样本点o为异常数据。
仿真模型:
仿真时假定每个轮廓的截距A0=3,一次项系数A1=2,二次项系数A2=1回 归方程为:
Figure BDA0003110980640000061
aij是独立同分布的标准正态随机变量
Figure BDA0003110980640000062
x=(1,2,3,4,5,6,7,8,9,10)。ρ 为自相关系数。仿真时讨论ρ=0.1(弱相关)和ρ=0.9(强相关)的监控效果。
仿真条件设置:
常用的SVDD参数寻优方法有网格搜索法、遗传算法等。网格搜索法要遍 历参数的取值,通常耗时较长,而GA在全局寻优能力上优于网格搜索法,且 易于实现,故采用GA对SVDD进行参数优化。设置惩罚系数C和高斯核函数 参数r在[2-10,210]范围内应用GA寻优,对受控数据采用10折交叉验证的方式, 使训练数据的误警率α为0.005,即受控运行长度ARL0=200。适应度函数为 min f=|accuracy-(1-α)|,accuracy是SVDD在参数C和r条件下训练出的准确率。 在MATLAB 2019a环境下采用林智仁教授提出的Libsvm工具包进行仿真模拟,随机产生3000组受控样本。遗传算法采用默认设置,种群规模为50,交叉率 为0.8,最高迭代次数为200。
考虑截距偏移至A0+λσ,一次项系数偏移至A1+βσ,二次项系数偏移至A2+δσ, 标准差偏移至γσ四种异常类型,λσ、βσ、δσ、γσ分别为截距、一次项系数、二次 项系数、标准差的变化量,λ=(0.1,0.2,0.3,0.4,0.5,0.6,0.7,0.8, 0.9,1),β=(0.025,0.05,0.075,0.1,0.125,0.15,0.175,0.2,0.225,0.25),δ=(0.01,0.02,0.03,0.04,0.05,0.06,0.07,0.08,0.09,0.1), γ=(1.1,1.2,1.3,1.4,1.5,1.6,1.7,1.8,1.9,2)。其中。根据平均运行长度评估控制图的性能,保证受控平均运行长度ARL0=200,比较不同方法失 控平均运行长度ARL1的大小。ARL1越小,监控性能越好。
仿真步骤:
步骤1:生成M个样本类别为+1正常的训练样本。
步骤2:数据归一化。将训练样本转化到[0,1]区间内。
步骤3:参数寻优。若f≤0.0001则接受参数C和r值,进行下一步骤,否则 返回步骤1。
步骤4:创建模型。由GA得到的最优参数对训练样本训练,得到SVDD 监控模型。
步骤5:生成异常数据。每种异常生成1000批数据集,每批数据集含有1000 个对应的异常数据。
步骤6:数据监控。SVDD监控模型对异常数据进行监控,迭代1000次之 后得到的均值即为每种异常对应的ARL1
步骤7:结果分析。对比分析SVDD控制图与传统的控制图的监控性能。
仿真结果:
SVDD同
Figure BDA0003110980640000071
T2、GLT/R三种方法的对比见表1-表4。
表1截距A0偏移至A0+λ时SVDD控制图同传统控制图ARL1比较
Figure BDA0003110980640000081
表2一次项系数A1偏移至A1+β时SVDD控制图同传统控制图ARL1比较
Figure BDA0003110980640000082
表3二次项系数A2偏移至A2+δ时SVDD控制图同传统控制图ARL1比较
Figure BDA0003110980640000083
表4标准差σ偏移至γσ时SVDD控制图同传统控制图ARL1比较
Figure BDA0003110980640000091
效果:
从表1-表4可以看出,保证SVDD控制图同传统控制图受控运行长度相同,得 到的结论如下:(1)在监控截距A0发生偏移时,SVDD的监控效果最优。(2) 监控一次项系数A1发生偏移时,SVDD的监控效果最优。(3)监控二次项系数A2发生偏移时,SVDD的监控效果最优。(4)在强自相关系数ρ=0.1、标准差发生 偏移时,SVDD的监控效果最优;在强自相关系数ρ=0.9、标准差发生偏移时,
Figure BDA0003110980640000092
控制图监控性最优。

Claims (2)

1.基于遗传算法和支持向量数据描述的自相关多项式轮廓监控设计方法,其特征在于,包括以下几个步骤:
步骤一:数据采集设备采集工业生产线中各监测传感器产生的正常轮廓数据yij(i=1,2,...,n;j=1,2,...,d),代表收集的第i个样本第j个位置的轮廓质量特性。
步骤二:数据预处理:将S1采集的正常样本值转化到[0,1]的区间内,转化后的数据为{z|zi∈Rd,i=1,2,...,n}。
步骤三:创建模型:
设训练样本{z|zi∈Rd,i=1,2,...,n},在映射的高维空间里可求出中心为a,半径为R的最小超球体;转化为下列的二次规划问题:
Figure RE-FDA0003188633340000011
s.t.||φ(zi)-a||2≤R2i,
ξi≥0. (1)
式中C为惩罚系数,ξi为松弛变量,φ是将未去除相关性数据映射到高维特征空间中的非线性映射。利用拉格朗日方法求解后转化为对偶问题:
Figure RE-FDA0003188633340000012
Figure RE-FDA0003188633340000013
式中αi为拉格朗日乘子,用高斯核函数K(zi,zj)=exp(-r||zi-zj||2),(r为核函数参数)训练。用核函数K(zi·zi)代替(φ(zi)·φ(zi))运算得:
Figure RE-FDA0003188633340000021
Figure RE-FDA0003188633340000022
对式(3)进行求解可得α=(α12,...,αn),αi不为0对应的zi为支持向量,记支持向量的集合为SV。超球体球心a和半径R可由式(4)、式(5)分别计算求出:
Figure RE-FDA0003188633340000023
Figure RE-FDA0003188633340000024
其中zk∈SV。对于新的测试样本点o可通过式(6)计算该点到超球体中心的距离:
Figure RE-FDA0003188633340000025
通过比较D(o)和R的大小关系判断样本点的受控情况;
应用GA调整核函数参数r为和惩罚系数C,使训练数据zi的训练准确率达到最高,此时的训练模型为最优模型,适应度函数为minf=|accuracy-(1-α)|,accuracy是SVDD在参数C和r条件下训练出的准确率。
步骤四:在线监控:对后续设备采集工业生产线中的多项式轮廓数据进行监控;若D(o)≤R,样本点o为受控数据,若D(o)>R样本点o为异常数据。
2.根据权利要求1所述的基于遗传算法和支持向量数据描述的自相关多项式轮廓监控设计方法,其特征在于,在步骤三中调整核函数参数r为和惩罚系数C时,误警率α=0,若f≤0.0001则接受参数C和r值,进行下一步骤,否则返回步骤一。
CN202110650355.5A 2021-06-10 2021-06-10 基于遗传算法和支持向量数据描述的自相关多项式轮廓监控设计方法 Withdrawn CN113392517A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110650355.5A CN113392517A (zh) 2021-06-10 2021-06-10 基于遗传算法和支持向量数据描述的自相关多项式轮廓监控设计方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110650355.5A CN113392517A (zh) 2021-06-10 2021-06-10 基于遗传算法和支持向量数据描述的自相关多项式轮廓监控设计方法

Publications (1)

Publication Number Publication Date
CN113392517A true CN113392517A (zh) 2021-09-14

Family

ID=77620408

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110650355.5A Withdrawn CN113392517A (zh) 2021-06-10 2021-06-10 基于遗传算法和支持向量数据描述的自相关多项式轮廓监控设计方法

Country Status (1)

Country Link
CN (1) CN113392517A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114493235A (zh) * 2022-01-21 2022-05-13 南京工业大学 一种基于SVDD和Agent的精馏过程质量监控业务自适应演化方法

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114493235A (zh) * 2022-01-21 2022-05-13 南京工业大学 一种基于SVDD和Agent的精馏过程质量监控业务自适应演化方法

Similar Documents

Publication Publication Date Title
Chai et al. Enhanced random forest with concurrent analysis of static and dynamic nodes for industrial fault classification
Gajjar et al. A data-driven multidimensional visualization technique for process fault detection and diagnosis
Huang et al. Dynamic process fault detection and diagnosis based on dynamic principal component analysis, dynamic independent component analysis and Bayesian inference
Ge et al. Improved kernel PCA-based monitoring approach for nonlinear processes
CN108062565B (zh) 基于化工te过程的双主元-动态核主元分析故障诊断方法
Nor et al. Fault diagnosis and classification framework using multi-scale classification based on kernel Fisher discriminant analysis for chemical process system
Sheng et al. Comprehensive monitoring of nonlinear processes based on concurrent kernel projection to latent structures
Tian et al. A data-based approach for multivariate model predictive control performance monitoring
Dhibi et al. A hybrid approach for process monitoring: Improving data-driven methodologies with dataset size reduction and interval-valued representation
Deng et al. Multimode process fault detection using local neighborhood similarity analysis
Zhong et al. Multimode non‐Gaussian process monitoring based on local entropy independent component analysis
US20220317672A1 (en) A Visualization Method for Process Monitoring Based on Bi-kernel T-distributed Stochastic Neighbor Embedding
He et al. Variable-weighted Fisher discriminant analysis for process fault diagnosis
Lv et al. Batch process monitoring based on multiple-phase online sorting principal component analysis
Banko et al. Dynamic principal component analysis in multivariate time-series segmentation
CN113392517A (zh) 基于遗传算法和支持向量数据描述的自相关多项式轮廓监控设计方法
Lv et al. Interpretable fault detection using projections of mutual information matrix
Wang et al. Orthogonal stationary component analysis for nonstationary process monitoring
Li et al. Performance-driven ensemble ICA chemical process monitoring based on fault-relevant models
CN113253682B (zh) 非线性化工过程故障检测方法
Zou et al. Step-wise segment partition based stationary subspace analysis and Gaussian mixture model for nonstationary process performance assessment
Deng et al. Fault relevant variable selection for fault diagnosis
CN113326628A (zh) 基于一分类支持向量机的自相关线性轮廓监控设计方法
Wu et al. A sequential bayesian partitioning approach for online steady-state detection of multivariate systems
Zheng et al. Extracting dissimilarity of slow feature analysis between normal and different faults for monitoring process status and fault diagnosis

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WW01 Invention patent application withdrawn after publication

Application publication date: 20210914

WW01 Invention patent application withdrawn after publication