CN113392517A - 基于遗传算法和支持向量数据描述的自相关多项式轮廓监控设计方法 - Google Patents
基于遗传算法和支持向量数据描述的自相关多项式轮廓监控设计方法 Download PDFInfo
- Publication number
- CN113392517A CN113392517A CN202110650355.5A CN202110650355A CN113392517A CN 113392517 A CN113392517 A CN 113392517A CN 202110650355 A CN202110650355 A CN 202110650355A CN 113392517 A CN113392517 A CN 113392517A
- Authority
- CN
- China
- Prior art keywords
- data
- monitoring
- support vector
- polynomial
- genetic algorithm
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
- 238000012544 monitoring process Methods 0.000 title claims abstract description 44
- 238000000034 method Methods 0.000 title claims abstract description 43
- 239000013598 vector Substances 0.000 title claims abstract description 17
- 230000002068 genetic effect Effects 0.000 title claims abstract description 12
- 238000013461 design Methods 0.000 title claims abstract description 9
- 230000002159 abnormal effect Effects 0.000 claims abstract description 9
- 238000012549 training Methods 0.000 claims description 18
- 238000009776 industrial production Methods 0.000 claims description 6
- 238000013507 mapping Methods 0.000 claims description 4
- 230000009977 dual effect Effects 0.000 claims description 3
- 238000007781 pre-processing Methods 0.000 claims description 3
- 238000012360 testing method Methods 0.000 claims description 3
- 230000000694 effects Effects 0.000 abstract description 10
- 238000004088 simulation Methods 0.000 abstract description 10
- 238000004519 manufacturing process Methods 0.000 abstract description 6
- 230000008569 process Effects 0.000 abstract description 6
- 238000010276 construction Methods 0.000 abstract description 2
- 230000006870 function Effects 0.000 description 14
- 238000005457 optimization Methods 0.000 description 4
- 238000003070 Statistical process control Methods 0.000 description 3
- 238000010586 diagram Methods 0.000 description 2
- 238000010801 machine learning Methods 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 230000008859 change Effects 0.000 description 1
- 238000002790 cross-validation Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 238000012706 support-vector machine Methods 0.000 description 1
- 238000013518 transcription Methods 0.000 description 1
- 230000035897 transcription Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F30/00—Computer-aided design [CAD]
- G06F30/20—Design optimisation, verification or simulation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/12—Computing arrangements based on biological models using genetic models
- G06N3/126—Evolutionary algorithms, e.g. genetic algorithms or genetic programming
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Biophysics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- General Physics & Mathematics (AREA)
- Evolutionary Biology (AREA)
- General Engineering & Computer Science (AREA)
- Evolutionary Computation (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Genetics & Genomics (AREA)
- Data Mining & Analysis (AREA)
- Physiology (AREA)
- Geometry (AREA)
- Artificial Intelligence (AREA)
- Biomedical Technology (AREA)
- Computational Linguistics (AREA)
- Computer Hardware Design (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Complex Calculations (AREA)
Abstract
本发明涉及一种基于遗传算法和支持向量数据描述的自相关多项式轮廓监控设计方法,本发明针对现生产过程中都是基于构造统计量建立控制图对具有自相关性多项式轮廓进行监控,此类方法需要对原始数据进行处理,过程较为复杂且难以理解及应用,本发明基于遗传算法和支持向量数据描述提出了一种易于实现的监控方法,并给出详细的实现流程,仿真时应用GA算法对参数进行优化;仿真结果表明本方法在监控截距、一次项系数、二次项系数以及在弱自相关系数、标准差发生偏移时,监控效果优于其他控制图,同时便于及时发现异常波动。
Description
技术领域
本发明涉及统计过程控制的技术领域,具体为基于遗传算法和支持向量数 据描述的自相关多项式轮廓监控设计方法。
背景技术
统计过程控制(Statistical Process Control,SPC)应用中,通常运用 传统控制图监控一元或者多元质量特性值。如果一个产品的质量可以用多个响 应变量与多个解释变量之间的函数关系表示,可以采用轮廓控制图监控,此时 这种函数关系称为轮廓(Profile)。传统的控制图方法的前提条件是质量数据 观测值是独立的,一些学者提出了多元SLRT,T2,P值等控制图对多项式轮廓进 行监控,但随着工业信息技术的发展,数据采集方法的改进,采集到的轮廓数 据内通常存在自相关关系。对于不满足独立性假设的轮廓数据,一些学者研究 时忽略相关关系,结果发现即使轮廓内数据的相关关系不强,也会影响传统控 制图的监控效果,导致虚发警报增多,进而影响生产过程。一些学者提出了消 除轮廓间相关性的方法,之后采用多元T2、GLT/R等方法进行参数监 控。
由于控制图可以看成区分受控过程和失控过程的分类器,使用机器学习方 法监控生产过程,不需要对数据进行复杂的处理,亦能达到较好的效果。一些 学者讨论了二分类支持向量机在监控线性轮廓中的应用。由于二分类的方法需 要大量受控和失控样本训练分类器,在一定程度上限制了二分类方法的应用范 围。一些学者分别提出了基于支持向量数据描述的线性轮廓与非线性轮廓控制 图。但一分类SVDD方法在存在相关性的多项式轮廓中,还没有应用。故本发明 提出了一种基于SVDD监控多项式轮廓内存在自相关关系的方法,及时发现异常 波动。
且消除相关性和构造统计量建立控制图监控生产过程,需要进行复杂的数 据处理。对于没有较深数学功底的质量监测人员,难以理解及应用。因此,本 发明提供一种基于SVDD的自相关多项式轮廓监控设计方法,发现异常波动。SVDD 作为机器学习的一种方法,应用时仅需要正常轮廓数据便可完成训练,进而监 控生产过程,便于理解,且对输入数据的类型没有限制。
发明内容
针对上述情况,为克服现有技术缺陷,本发明的目的是提供一种基于遗传 算法和支持向量数据描述的自相关多项式轮廓监控设计方法便于及时发现异常 波动。
本发明解决其技术问题所采用的技术方案是:基于遗传算法和支持向量数 据描述的自相关多项式轮廓监控设计方法,其特征在于,包括以下几个步骤:
步骤一:数据采集设备采集工业生产线中各监测传感器产生的正常轮廓数 据yij(i=1,2,...,n;j=1,2,...,d),代表收集的第i个样本第j个位置的轮廓质量特性。
步骤二:数据预处理:将S1采集的正常样本值转化到[0,1]的区间内,转 化后的数据为{z|zi∈Rd,i=1,2,...,n}。
步骤三:设训练样本{z|zi∈Rd,i=1,2,...,n},在映射的高维空间里可求出中心为a,半径为R的最小超球体;转化为下列的二次规划问题:
式中C为惩罚系数,ξi为松弛变量,φ是将未去除相关性数据映射到高维 特征空间中的非线性映射。利用拉格朗日方法求解后转化为对偶问题:
式中αi为拉格朗日乘子,用高斯核函数K(zi,zj)=exp(-r||zi-zj||2),(r为核函数参数)训练。用核函数K(zi·zi)代替(φ(zi)·φ(zi))运算得:
对式(3)进行求解可得α=(α1,α2,...,αn),αi不为0对应的zi为支持向量,记 支持向量的集合为SV。超球体球心a和半径R可由式(4)、式(5)分别计算求 出:
其中zk∈SV。对于新的测试样本点o可通过式(6)计算该点到超球体中心 的距离:
通过比较D(o)和R的大小关系判断样本点的受控情况;
应用GA调整核函数参数r为和惩罚系数C,使训练数据zi的训练准确率达到 最高,此时的训练模型为最优模型,适应度函数为min f=|accuracy-(1-α)|,accuracy 是SVDD在参数C和r条件下训练出的准确率。
步骤四:在线监控:对后续设备采集工业生产线中的多项式轮廓数据进行 监控;若D(o)≤R,样本点o为受控数据,若D(o)>R样本点o为异常数据。
优选的,在步骤三中调整核函数参数r为和惩罚系数C时,误警率α=0,若 f≤0.0001则接受参数C和r值,进行下一步骤,否则返回步骤一。
本发明的技术构思为:本发明针对现生产过程中都是基于构造统计量建立 控制图对具有自相关性多项式轮廓进行监控,此类方法需要对原始数据进行处 理,过程较为复杂且难以理解及应用,本发明基于SVDD提出了一种易于实现 的监控方法,并给出详细的实现流程,仿真时应用GA算法对参数进行优化; 仿真结果表明本方法在监控截距、一次项系数、二次项系数以及在弱自相关系 数ρ=0.1、标准差发生偏移时,监控效果优于其他控制图,同时便于及时发现异 常波动。
附图说明
图1是本发明的步骤流程框体。
具体实施方式
结合附图,对本发明的具体实施方式作进一步详细说明。
本发明针对多项式轮廓内存在自相关的数据基于SVDD提出了一种监控方 法,基于遗传算法和支持向量数据描述的自相关多项式轮廓监控设计方法,具 体包括以下步骤:
S1:数据采集设备采集工业生产线中各监测传感器产生的正常轮廓数据 yij(i=1,2,...,n;j=1,2,...,d),代表收集的第i个样本第j个位置的轮廓质量特性。
S2:数据预处理。将S1采集的正常样本值转化到[0,1]的区间内,转化后 的数据为{z|zi∈Rd,i=1,2,...,n}。
S3:创建模型。
设训练样本{z|zi∈Rd,i=1,2,...,n},在映射的高维空间里可求出中心为a,半径为R的最小超球体。转化为下列的二次规划问题:
式中C为惩罚系数,ξi为松弛变量,φ是将未去除相关性数据映射到高维 特征空间中的非线性映射。利用拉格朗日方法求解后转化为对偶问题:
式中αi为拉格朗日乘子,用高斯核函数K(zi,zj)=exp(-r||zi-zj||2),(r为核函数参数)训练。用核函数K(zi·zi)代替(φ(zi)·φ(zi))运算得:
对式(3)进行求解可得α=(α1,α2,...,αn),αi不为0对应的zi为支持向量,记 支持向量的集合为SV。超球体球心a和半径R可由式(4)、式(5)分别计算求 出:
其中zk∈SV。对于新的测试样本点o可通过式(6)计算该点到超球体中心 的距离:
通过比较D(o)和R的大小关系判断样本点的受控情况。
应用GA调整核函数参数r为和惩罚系数C,使训练数据zi的训练准确率达 到最高,此时的训练模型为最优模型。
S4:在线监控。对后续设备采集工业生产线中的多项式轮廓数据进行监控。 若D(o)≤R,样本点o为受控数据,若D(o)>R样本点o为异常数据。
仿真模型:
仿真时假定每个轮廓的截距A0=3,一次项系数A1=2,二次项系数A2=1回 归方程为:
仿真条件设置:
常用的SVDD参数寻优方法有网格搜索法、遗传算法等。网格搜索法要遍 历参数的取值,通常耗时较长,而GA在全局寻优能力上优于网格搜索法,且 易于实现,故采用GA对SVDD进行参数优化。设置惩罚系数C和高斯核函数 参数r在[2-10,210]范围内应用GA寻优,对受控数据采用10折交叉验证的方式, 使训练数据的误警率α为0.005,即受控运行长度ARL0=200。适应度函数为 min f=|accuracy-(1-α)|,accuracy是SVDD在参数C和r条件下训练出的准确率。 在MATLAB 2019a环境下采用林智仁教授提出的Libsvm工具包进行仿真模拟,随机产生3000组受控样本。遗传算法采用默认设置,种群规模为50,交叉率 为0.8,最高迭代次数为200。
考虑截距偏移至A0+λσ,一次项系数偏移至A1+βσ,二次项系数偏移至A2+δσ, 标准差偏移至γσ四种异常类型,λσ、βσ、δσ、γσ分别为截距、一次项系数、二次 项系数、标准差的变化量,λ=(0.1,0.2,0.3,0.4,0.5,0.6,0.7,0.8, 0.9,1),β=(0.025,0.05,0.075,0.1,0.125,0.15,0.175,0.2,0.225,0.25),δ=(0.01,0.02,0.03,0.04,0.05,0.06,0.07,0.08,0.09,0.1), γ=(1.1,1.2,1.3,1.4,1.5,1.6,1.7,1.8,1.9,2)。其中。根据平均运行长度评估控制图的性能,保证受控平均运行长度ARL0=200,比较不同方法失 控平均运行长度ARL1的大小。ARL1越小,监控性能越好。
仿真步骤:
步骤1:生成M个样本类别为+1正常的训练样本。
步骤2:数据归一化。将训练样本转化到[0,1]区间内。
步骤3:参数寻优。若f≤0.0001则接受参数C和r值,进行下一步骤,否则 返回步骤1。
步骤4:创建模型。由GA得到的最优参数对训练样本训练,得到SVDD 监控模型。
步骤5:生成异常数据。每种异常生成1000批数据集,每批数据集含有1000 个对应的异常数据。
步骤6:数据监控。SVDD监控模型对异常数据进行监控,迭代1000次之 后得到的均值即为每种异常对应的ARL1。
步骤7:结果分析。对比分析SVDD控制图与传统的控制图的监控性能。
仿真结果:
表1截距A0偏移至A0+λ时SVDD控制图同传统控制图ARL1比较
表2一次项系数A1偏移至A1+β时SVDD控制图同传统控制图ARL1比较
表3二次项系数A2偏移至A2+δ时SVDD控制图同传统控制图ARL1比较
表4标准差σ偏移至γσ时SVDD控制图同传统控制图ARL1比较
效果:
Claims (2)
1.基于遗传算法和支持向量数据描述的自相关多项式轮廓监控设计方法,其特征在于,包括以下几个步骤:
步骤一:数据采集设备采集工业生产线中各监测传感器产生的正常轮廓数据yij(i=1,2,...,n;j=1,2,...,d),代表收集的第i个样本第j个位置的轮廓质量特性。
步骤二:数据预处理:将S1采集的正常样本值转化到[0,1]的区间内,转化后的数据为{z|zi∈Rd,i=1,2,...,n}。
步骤三:创建模型:
设训练样本{z|zi∈Rd,i=1,2,...,n},在映射的高维空间里可求出中心为a,半径为R的最小超球体;转化为下列的二次规划问题:
s.t.||φ(zi)-a||2≤R2+ξi,
ξi≥0. (1)
式中C为惩罚系数,ξi为松弛变量,φ是将未去除相关性数据映射到高维特征空间中的非线性映射。利用拉格朗日方法求解后转化为对偶问题:
式中αi为拉格朗日乘子,用高斯核函数K(zi,zj)=exp(-r||zi-zj||2),(r为核函数参数)训练。用核函数K(zi·zi)代替(φ(zi)·φ(zi))运算得:
对式(3)进行求解可得α=(α1,α2,...,αn),αi不为0对应的zi为支持向量,记支持向量的集合为SV。超球体球心a和半径R可由式(4)、式(5)分别计算求出:
其中zk∈SV。对于新的测试样本点o可通过式(6)计算该点到超球体中心的距离:
通过比较D(o)和R的大小关系判断样本点的受控情况;
应用GA调整核函数参数r为和惩罚系数C,使训练数据zi的训练准确率达到最高,此时的训练模型为最优模型,适应度函数为minf=|accuracy-(1-α)|,accuracy是SVDD在参数C和r条件下训练出的准确率。
步骤四:在线监控:对后续设备采集工业生产线中的多项式轮廓数据进行监控;若D(o)≤R,样本点o为受控数据,若D(o)>R样本点o为异常数据。
2.根据权利要求1所述的基于遗传算法和支持向量数据描述的自相关多项式轮廓监控设计方法,其特征在于,在步骤三中调整核函数参数r为和惩罚系数C时,误警率α=0,若f≤0.0001则接受参数C和r值,进行下一步骤,否则返回步骤一。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110650355.5A CN113392517A (zh) | 2021-06-10 | 2021-06-10 | 基于遗传算法和支持向量数据描述的自相关多项式轮廓监控设计方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110650355.5A CN113392517A (zh) | 2021-06-10 | 2021-06-10 | 基于遗传算法和支持向量数据描述的自相关多项式轮廓监控设计方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN113392517A true CN113392517A (zh) | 2021-09-14 |
Family
ID=77620408
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110650355.5A Withdrawn CN113392517A (zh) | 2021-06-10 | 2021-06-10 | 基于遗传算法和支持向量数据描述的自相关多项式轮廓监控设计方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113392517A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114493235A (zh) * | 2022-01-21 | 2022-05-13 | 南京工业大学 | 一种基于SVDD和Agent的精馏过程质量监控业务自适应演化方法 |
-
2021
- 2021-06-10 CN CN202110650355.5A patent/CN113392517A/zh not_active Withdrawn
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114493235A (zh) * | 2022-01-21 | 2022-05-13 | 南京工业大学 | 一种基于SVDD和Agent的精馏过程质量监控业务自适应演化方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Chai et al. | Enhanced random forest with concurrent analysis of static and dynamic nodes for industrial fault classification | |
Gajjar et al. | A data-driven multidimensional visualization technique for process fault detection and diagnosis | |
Huang et al. | Dynamic process fault detection and diagnosis based on dynamic principal component analysis, dynamic independent component analysis and Bayesian inference | |
Ge et al. | Improved kernel PCA-based monitoring approach for nonlinear processes | |
CN108062565B (zh) | 基于化工te过程的双主元-动态核主元分析故障诊断方法 | |
Nor et al. | Fault diagnosis and classification framework using multi-scale classification based on kernel Fisher discriminant analysis for chemical process system | |
Sheng et al. | Comprehensive monitoring of nonlinear processes based on concurrent kernel projection to latent structures | |
Tian et al. | A data-based approach for multivariate model predictive control performance monitoring | |
Dhibi et al. | A hybrid approach for process monitoring: Improving data-driven methodologies with dataset size reduction and interval-valued representation | |
Deng et al. | Multimode process fault detection using local neighborhood similarity analysis | |
Zhong et al. | Multimode non‐Gaussian process monitoring based on local entropy independent component analysis | |
US20220317672A1 (en) | A Visualization Method for Process Monitoring Based on Bi-kernel T-distributed Stochastic Neighbor Embedding | |
He et al. | Variable-weighted Fisher discriminant analysis for process fault diagnosis | |
Lv et al. | Batch process monitoring based on multiple-phase online sorting principal component analysis | |
Banko et al. | Dynamic principal component analysis in multivariate time-series segmentation | |
CN113392517A (zh) | 基于遗传算法和支持向量数据描述的自相关多项式轮廓监控设计方法 | |
Lv et al. | Interpretable fault detection using projections of mutual information matrix | |
Wang et al. | Orthogonal stationary component analysis for nonstationary process monitoring | |
Li et al. | Performance-driven ensemble ICA chemical process monitoring based on fault-relevant models | |
CN113253682B (zh) | 非线性化工过程故障检测方法 | |
Zou et al. | Step-wise segment partition based stationary subspace analysis and Gaussian mixture model for nonstationary process performance assessment | |
Deng et al. | Fault relevant variable selection for fault diagnosis | |
CN113326628A (zh) | 基于一分类支持向量机的自相关线性轮廓监控设计方法 | |
Wu et al. | A sequential bayesian partitioning approach for online steady-state detection of multivariate systems | |
Zheng et al. | Extracting dissimilarity of slow feature analysis between normal and different faults for monitoring process status and fault diagnosis |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
WW01 | Invention patent application withdrawn after publication |
Application publication date: 20210914 |
|
WW01 | Invention patent application withdrawn after publication |