CN113392517A

CN113392517A - 基于遗传算法和支持向量数据描述的自相关多项式轮廓监控设计方法

Info

Publication number: CN113392517A
Application number: CN202110650355.5A
Authority: CN
Inventors: 薛丽; 贾元忠; 周昊飞; 邹妍; 张诗青; 曹逗逗; 郑含笑
Original assignee: Zhengzhou University of Aeronautics
Current assignee: Zhengzhou University of Aeronautics
Priority date: 2021-06-10
Filing date: 2021-06-10
Publication date: 2021-09-14

Abstract

本发明涉及一种基于遗传算法和支持向量数据描述的自相关多项式轮廓监控设计方法，本发明针对现生产过程中都是基于构造统计量建立控制图对具有自相关性多项式轮廓进行监控，此类方法需要对原始数据进行处理，过程较为复杂且难以理解及应用，本发明基于遗传算法和支持向量数据描述提出了一种易于实现的监控方法，并给出详细的实现流程，仿真时应用GA算法对参数进行优化；仿真结果表明本方法在监控截距、一次项系数、二次项系数以及在弱自相关系数、标准差发生偏移时，监控效果优于其他控制图，同时便于及时发现异常波动。

Description

基于遗传算法和支持向量数据描述的自相关多项式轮廓监控设计方法

技术领域

本发明涉及统计过程控制的技术领域，具体为基于遗传算法和支持向量数据描述的自相关多项式轮廓监控设计方法。

背景技术

统计过程控制(Statistical Process Control，SPC)应用中，通常运用传统控制图监控一元或者多元质量特性值。如果一个产品的质量可以用多个响应变量与多个解释变量之间的函数关系表示，可以采用轮廓控制图监控，此时这种函数关系称为轮廓(Profile)。传统的控制图方法的前提条件是质量数据观测值是独立的，一些学者提出了多元SLRT,T²，P值等控制图对多项式轮廓进行监控，但随着工业信息技术的发展，数据采集方法的改进，采集到的轮廓数据内通常存在自相关关系。对于不满足独立性假设的轮廓数据，一些学者研究时忽略相关关系，结果发现即使轮廓内数据的相关关系不强，也会影响传统控制图的监控效果，导致虚发警报增多，进而影响生产过程。一些学者提出了消除轮廓间相关性的方法，之后采用多元

T²、GLT/R等方法进行参数监控。

由于控制图可以看成区分受控过程和失控过程的分类器，使用机器学习方法监控生产过程，不需要对数据进行复杂的处理，亦能达到较好的效果。一些学者讨论了二分类支持向量机在监控线性轮廓中的应用。由于二分类的方法需要大量受控和失控样本训练分类器，在一定程度上限制了二分类方法的应用范围。一些学者分别提出了基于支持向量数据描述的线性轮廓与非线性轮廓控制图。但一分类SVDD方法在存在相关性的多项式轮廓中，还没有应用。故本发明提出了一种基于SVDD监控多项式轮廓内存在自相关关系的方法，及时发现异常波动。

且消除相关性和构造统计量建立控制图监控生产过程，需要进行复杂的数据处理。对于没有较深数学功底的质量监测人员，难以理解及应用。因此，本发明提供一种基于SVDD的自相关多项式轮廓监控设计方法，发现异常波动。SVDD 作为机器学习的一种方法，应用时仅需要正常轮廓数据便可完成训练，进而监控生产过程，便于理解，且对输入数据的类型没有限制。

发明内容

针对上述情况，为克服现有技术缺陷，本发明的目的是提供一种基于遗传算法和支持向量数据描述的自相关多项式轮廓监控设计方法便于及时发现异常波动。

本发明解决其技术问题所采用的技术方案是：基于遗传算法和支持向量数据描述的自相关多项式轮廓监控设计方法，其特征在于，包括以下几个步骤：

步骤一：数据采集设备采集工业生产线中各监测传感器产生的正常轮廓数据y_ij(i＝1,2,...,n；j＝1，2,...,d)，代表收集的第i个样本第j个位置的轮廓质量特性。

步骤二：数据预处理：将S1采集的正常样本值转化到[0,1]的区间内，转化后的数据为{z|z_i∈R^d,i＝1,2,...,n}。

步骤三：设训练样本{z|z_i∈R^d,i＝1,2,...,n},在映射的高维空间里可求出中心为a，半径为R的最小超球体；转化为下列的二次规划问题：

式中C为惩罚系数，ξ_i为松弛变量，φ是将未去除相关性数据映射到高维特征空间中的非线性映射。利用拉格朗日方法求解后转化为对偶问题：

式中α_i为拉格朗日乘子，用高斯核函数K(z_i,z_j)＝exp(-r||z_i-z_j||²)，(r为核函数参数)训练。用核函数K(z_i·z_i)代替(φ(z_i)·φ(z_i))运算得：

对式(3)进行求解可得α＝(α₁,α₂,...,α_n)，α_i不为0对应的z_i为支持向量，记支持向量的集合为SV。超球体球心a和半径R可由式(4)、式(5)分别计算求出：

其中z_k∈SV。对于新的测试样本点o可通过式(6)计算该点到超球体中心的距离：

通过比较D(o)和R的大小关系判断样本点的受控情况；

应用GA调整核函数参数r为和惩罚系数C，使训练数据z_i的训练准确率达到最高，此时的训练模型为最优模型，适应度函数为min f＝|accuracy-(1-α)|，accuracy 是SVDD在参数C和r条件下训练出的准确率。

步骤四：在线监控：对后续设备采集工业生产线中的多项式轮廓数据进行监控；若D(o)≤R，样本点o为受控数据，若D(o)＞R样本点o为异常数据。

优选的，在步骤三中调整核函数参数r为和惩罚系数C时，误警率α＝0，若 f≤0.0001则接受参数C和r值，进行下一步骤，否则返回步骤一。

本发明的技术构思为：本发明针对现生产过程中都是基于构造统计量建立控制图对具有自相关性多项式轮廓进行监控，此类方法需要对原始数据进行处理，过程较为复杂且难以理解及应用，本发明基于SVDD提出了一种易于实现的监控方法，并给出详细的实现流程，仿真时应用GA算法对参数进行优化；仿真结果表明本方法在监控截距、一次项系数、二次项系数以及在弱自相关系数ρ＝0.1、标准差发生偏移时，监控效果优于其他控制图，同时便于及时发现异常波动。

附图说明

图1是本发明的步骤流程框体。

具体实施方式

结合附图，对本发明的具体实施方式作进一步详细说明。

本发明针对多项式轮廓内存在自相关的数据基于SVDD提出了一种监控方法，基于遗传算法和支持向量数据描述的自相关多项式轮廓监控设计方法，具体包括以下步骤：

S1：数据采集设备采集工业生产线中各监测传感器产生的正常轮廓数据 y_ij(i＝1,2,...,n；j＝1，2,...,d)，代表收集的第i个样本第j个位置的轮廓质量特性。

S2:数据预处理。将S1采集的正常样本值转化到[0,1]的区间内，转化后的数据为{z|z_i∈R^d,i＝1,2,...,n}。

S3:创建模型。

设训练样本{z|z_i∈R^d,i＝1,2,...,n},在映射的高维空间里可求出中心为a，半径为R的最小超球体。转化为下列的二次规划问题：

通过比较D(o)和R的大小关系判断样本点的受控情况。

应用GA调整核函数参数r为和惩罚系数C，使训练数据z_i的训练准确率达到最高，此时的训练模型为最优模型。

S4:在线监控。对后续设备采集工业生产线中的多项式轮廓数据进行监控。若D(o)≤R，样本点o为受控数据，若D(o)＞R样本点o为异常数据。

仿真模型：

仿真时假定每个轮廓的截距A₀＝3，一次项系数A₁＝2，二次项系数A₂＝1回归方程为：

a_ij是独立同分布的标准正态随机变量

x＝(1，2，3，4，5，6，7，8，9，10)。ρ 为自相关系数。仿真时讨论ρ＝0.1(弱相关)和ρ＝0.9(强相关)的监控效果。

仿真条件设置：

常用的SVDD参数寻优方法有网格搜索法、遗传算法等。网格搜索法要遍历参数的取值，通常耗时较长，而GA在全局寻优能力上优于网格搜索法，且易于实现，故采用GA对SVDD进行参数优化。设置惩罚系数C和高斯核函数参数r在[2^-10,2¹⁰]范围内应用GA寻优，对受控数据采用10折交叉验证的方式，使训练数据的误警率α为0.005，即受控运行长度ARL₀＝200。适应度函数为 min f＝|accuracy-(1-α)|，accuracy是SVDD在参数C和r条件下训练出的准确率。在MATLAB 2019a环境下采用林智仁教授提出的Libsvm工具包进行仿真模拟，随机产生3000组受控样本。遗传算法采用默认设置，种群规模为50，交叉率为0.8，最高迭代次数为200。

考虑截距偏移至A₀+λσ,一次项系数偏移至A₁+βσ,二次项系数偏移至A₂+δσ, 标准差偏移至γσ四种异常类型，λσ、βσ、δσ、γσ分别为截距、一次项系数、二次项系数、标准差的变化量，λ＝(0.1，0.2，0.3，0.4，0.5，0.6，0.7，0.8， 0.9，1)，β＝(0.025，0.05，0.075，0.1，0.125，0.15，0.175，0.2，0.225，0.25)，δ＝(0.01，0.02，0.03，0.04，0.05，0.06，0.07，0.08，0.09，0.1)， γ＝(1.1，1.2，1.3，1.4，1.5，1.6，1.7，1.8，1.9，2)。其中。根据平均运行长度评估控制图的性能，保证受控平均运行长度ARL₀＝200，比较不同方法失控平均运行长度ARL₁的大小。ARL₁越小，监控性能越好。

仿真步骤:

步骤1：生成M个样本类别为+1正常的训练样本。

步骤2：数据归一化。将训练样本转化到[0,1]区间内。

步骤3：参数寻优。若f≤0.0001则接受参数C和r值，进行下一步骤，否则返回步骤1。

步骤4：创建模型。由GA得到的最优参数对训练样本训练，得到SVDD 监控模型。

步骤5：生成异常数据。每种异常生成1000批数据集，每批数据集含有1000 个对应的异常数据。

步骤6：数据监控。SVDD监控模型对异常数据进行监控，迭代1000次之后得到的均值即为每种异常对应的ARL₁。

步骤7：结果分析。对比分析SVDD控制图与传统的控制图的监控性能。

仿真结果：

SVDD同

T²、GLT/R三种方法的对比见表1-表4。

表1截距A₀偏移至A₀+λ时SVDD控制图同传统控制图ARL₁比较

表2一次项系数A₁偏移至A₁+β时SVDD控制图同传统控制图ARL₁比较

表3二次项系数A₂偏移至A₂+δ时SVDD控制图同传统控制图ARL₁比较

表4标准差σ偏移至γσ时SVDD控制图同传统控制图ARL₁比较

效果：

从表1-表4可以看出，保证SVDD控制图同传统控制图受控运行长度相同，得到的结论如下：(1)在监控截距A₀发生偏移时，SVDD的监控效果最优。(2) 监控一次项系数A₁发生偏移时，SVDD的监控效果最优。(3)监控二次项系数A₂发生偏移时，SVDD的监控效果最优。(4)在强自相关系数ρ＝0.1、标准差发生偏移时，SVDD的监控效果最优；在强自相关系数ρ＝0.9、标准差发生偏移时，

控制图监控性最优。