CN107402559B - 一种基于动态超球结构变化的间歇过程测量数据异常检测方法 - Google Patents

一种基于动态超球结构变化的间歇过程测量数据异常检测方法 Download PDF

Info

Publication number
CN107402559B
CN107402559B CN201710717362.6A CN201710717362A CN107402559B CN 107402559 B CN107402559 B CN 107402559B CN 201710717362 A CN201710717362 A CN 201710717362A CN 107402559 B CN107402559 B CN 107402559B
Authority
CN
China
Prior art keywords
data
suprasphere
measurement data
dynamic
process measurement
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201710717362.6A
Other languages
English (en)
Other versions
CN107402559A (zh
Inventor
王建林
刘伟旻
邱科鹏
韩锐
赵利强
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing University of Chemical Technology
Original Assignee
Beijing University of Chemical Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing University of Chemical Technology filed Critical Beijing University of Chemical Technology
Priority to CN201710717362.6A priority Critical patent/CN107402559B/zh
Publication of CN107402559A publication Critical patent/CN107402559A/zh
Application granted granted Critical
Publication of CN107402559B publication Critical patent/CN107402559B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02PCLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
    • Y02P90/00Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
    • Y02P90/02Total factory control, e.g. smart factories, flexible manufacturing systems [FMS] or integrated manufacturing systems [IMS]

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Mathematical Physics (AREA)
  • Mathematical Optimization (AREA)
  • Theoretical Computer Science (AREA)
  • Computational Mathematics (AREA)
  • Mathematical Analysis (AREA)
  • Pure & Applied Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Algebra (AREA)
  • Software Systems (AREA)
  • Databases & Information Systems (AREA)
  • Manufacturing & Machinery (AREA)
  • Testing And Monitoring For Control Systems (AREA)
  • Quality & Reliability (AREA)
  • Testing Or Calibration Of Command Recording Devices (AREA)
  • Computing Systems (AREA)
  • Automation & Control Theory (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Operations Research (AREA)
  • Probability & Statistics with Applications (AREA)
  • Other Investigation Or Analysis Of Materials By Electrical Means (AREA)

Abstract

本发明公开一种基于动态超球结构变化的间歇过程测量数据异常检测方法,属于间歇过程监测技术领域。首先将间歇过程历史数据沿变量方向展开为二维数据并标准化数据;然后利用标准化的数据建立静态超球体,引入重要结构调节因子,求得静态超球体结构的拉格朗日乘子集;最后逐个读入待检测过程测量数据,使用标准化的历史数据与待检测过程测量数据建立动态超球体,求得动态超球体结构的拉格朗日乘子集,通过比较静态和动态超球体的结构变化,判断待检测过程测量数据是否异常。本方法充分考虑高维超球体的不规则性,避免SVDD方法中均值控制限导致的过程测量数据误检与漏检,根据超球体结构的动态变化实现过程测量数据异常检测,提高了检测准确率。

Description

一种基于动态超球结构变化的间歇过程测量数据异常检测 方法
技术领域
本发明属于间歇过程监测技术领域,尤其涉及一种基于动态超球结构变化的间歇过程测量数据异常检测的方法。
背景技术
间歇过程是精细化工、生物制药、食品、微电子等行业的主要生产方式,其配备的在线检测系统,为基于数据驱动过程在线监测和优化控制提供大量的过程测量数据。然而,由于受到现场检测仪表及系统的性能衰减、故障、外界干扰等影响,使得间歇过程测量数据出现异常,严重影响着数据驱动的过程建模的准确性。因此,实现间歇过程测量数据异常检测,能够有效地促进过程在线监测、优化控制等方法和技术的工业应用。
现有的整体检验法、约束检验法、组合检验法、广义似然比法等过程测量数据异常检测方法均建立在过程模型基础上,主要应用于连续过程测量数据异常检测;由于间歇过程难以建立准确的过程机理模型,缺乏明确的非线性约束方程,难以应用上述方法实现间歇过程测量数据异常检测。支持向量数据描述方法(support vector data description,SVDD)能够将间歇过程测量数据异常检测描述为分类问题,通过对间歇过程正常和异常测量数据的划分,实现间歇过程测量数据异常检测。然而,现有的SVDD方法忽略了高维超球体的不规则性,使用超球体表面的支持向量到球心距的均值作为检测控制限,由于训练数据往往不能完全表征间歇过程的所有特性,无法保证所得检测控制限用于过程测量数据异常检测时的准确性;同时该方法使用固定的检测控制限作为过程测量数据异常检测控制限,导致过程测量数据异常检测出现误检和漏检。
因此,本发明充分考虑高维超球体的不规则性,能够根据超球体结构的动态变化实现过程测量数据异常检测,提高过程测量数据异常检测的准确率。
发明内容
本发明的目的在于针对间歇过程的批次数据,在过程测量数据异常检测离线训练阶段,建立基于间歇过程历史训练数据的静态超球体,引入重要结构调节因子,获得静态超球体结构的拉格朗日乘子;过程测量数据异常在线检测阶段,将当前时刻的待检测过程测量数据与历史训练数据组成动态数据集,并建立基于动态数据集的动态超球体,进而获得动态超球体结构的拉格朗日乘子,通过比较动态超球体的重要结构相对于静态超球体的重要结构是否发生变化,判断待检测过程测量数据是否为异常数据。
本方法充分考虑了高维超球体的不规则性,避免现有的SVDD方法中由于均值检测控制限带来的过程测量数据异常检测的误检与漏检,根据在线待检测过程测量数据与训练数据的相似度,设定动态的待检测过程测量数据异常判定条件,实现间歇过程测量数据异常在线检测,提高间歇过程测量数据异常检测的准确率。
为实现上述目的,本发明采用的技术方案为一种基于动态超球结构变化的间歇过程测量数据异常检测方法,包括以下步骤:
步骤一:将间歇过程历史数据按照变量方向展开为二维矩阵Xv(IKsum×J),其中I为批次编号,J为变量个数,Ki为第i个历史批次的总采样时间,Ksum为I个历史训练批次的总采样时间,并对展开数据Xv进行变量方向上的标准化得到并记录历史训练数据的均值mean(Xv)与标准差std(Xv),为后续步骤提供数据基础。
步骤二:基于动态超球结构变化的间歇过程测量数据异常检测方法离线训练。
(1)利用步骤一所得的标准化后的训练数据集建立静态超球体,可得表征静态超球体结构的拉格朗日乘子集i为数据编号,n=Ksum为数据集总长度。
(2)将集合a中各个元素降序排列获得根据设定的重要结构调节因子θ,获得静态超球体的重要结构的拉格朗日乘子集为其中w为重要的结构个数。
步骤三:基于动态超球结构变化的间歇过程测量数据异常检测方法的在线训练。
(1)读入待检测过程测量数据xtest,利用步骤一所得历史训练数据的均值mean(Xv)与标准差std(Xv),标准化待检测过程测量数据得构建动态训练数据集建立动态超球体,计算拉格朗日乘子集
(2)将集合atest中各个元素降序排列获得根据设定的重要结构调节因子θ,获得静态超球体的重要结构的拉格朗日乘子集为其中为重要结构个数。
步骤四:基于动态超球结构变化的间歇过程测量数据异常检测方法的在线异常检测。
通过比较静态超球体重要结构的拉格朗日乘子集与动态超球体重要结构的拉格朗日乘子集之间的差异,从而判断待检测过程测量数据是否为异常测量数据。
步骤一,具体包括:
将间歇过程历史数据三维矩阵按照变量方向展开为二维矩阵Xv(IKsum×J),并对展开数据Xv进行变量方向上的标准化。
其中,mean(·)为数据集按照变量方向上的均值,std(·)为数据集按照变量方向上的标准差,标准化后的数据集为后续步骤提供数据基础。
步骤二,具体包括:
(1)基于标准化后的数据集的静态超球体的构造。
利用标准化后的数据集基于非线性函数φ(·)构造的超球体满足以下约束
式中,i为数据编号,n=Ksum为数据集总长度,εi为松弛因子;a与R分别为超球体的球心和半径。惩罚系数C的计算如下
式中,D为显著性水平。为解决式(1-3)的约束问题,引入拉格朗日乘子集将式(1-3)转化为对偶形式
式中,j为数据编号,K(x,x)为核函数,定义如下
K(xi,xj)=exp(-||xi-xj||2/2σ2) (1-6)式中,σ为高斯核函数宽度参数。利用二次规划求解式(1-5),得拉格朗日乘子集即为基于数据集训练所得的超球体结构的拉格朗日乘子集。
(2)将集合a中各个元素降序排列获得索引指标由变为 为降序排列后的拉格朗日乘子集,为a经降序排列后新的索引指标。设定集合的前θ%个元素作为静态超球体重要结构的拉格朗日乘子集,重要结构的个数w计算如下
其中为向下取整符号,θ为重要结构调节因子。的前θ%重要结构的索引指标为且重要结构的拉格朗日乘子集为
所述步骤三,具体包括:
(1)标准化待检测过程测量数据
(2)构建动态训练数据集的动态超球体。
利用标准化后的数据集Xtest,构造过程如式(1-3)和(1-5)所示,得基于动态训练数据集的动态超球体结构的拉格朗日乘子集
(3)将集合atest中各个元素降序排列获得索引指标由变为设定集合的前θ%个元素作为动态超球体重要结构的拉格朗日乘子集,重要结构的个数计算如下
其中为向下取整符号。的前θ%重要结构的索引指标为且重要结构的拉格朗日乘子集为
所述步骤四,具体包括:
通过比较静态超球体重要结构的拉格朗日乘子集与动态超球体重要结构的拉格朗日乘子集之间的差异,即判断xtest对应的是否存在于从而判断待检测过程测量数据是否为异常测量数据。
与现有技术相比较,本发明具有如下优点:该方法能够充分考虑过程测量数据与训练数据之间的关系,建立动态超球体并获得其重要超球结构的拉格朗日乘子集;能够充分考虑高维超球体的不规则性,根据超球结构的变化程度,实现过程测量数据的异常检测,提高了间歇过程测量数据异常检测的准确率。
附图说明
图1是本发明所述的一种基于动态超球结构变化的间歇过程测量数据异常检测方法的流程图;
图2和图3是本发明所述步骤二和三中,在显著性水平D、高斯核函数宽度参数σ和重要结构调节因子θ情况下,间歇过程测量数据异常检测的平均准确率。
具体实施方式
下面结合实例及附图对本发明作进一步的描述,需要说明的是,实施例并不限定本发明要求保护的范围。
实施例
金属蚀刻过程是典型的间歇过程,利用Lam9600TCP金属蚀刻机,生产129个金属蚀刻间歇过程批次,其中含有107个批次的正常批次,20个异常批次,以及2个数据缺失批次,用于过程测量数据异常检测的变量如表1所示,20个异常批次的异常情况如表2所示。
表1金属蚀刻间歇过程关键变量
表2过程测量数据异常批次描述
随机选择107个正常批次中的30批次作为历史训练数据其中批次个数I=30,变量个数J=19,第i个批次的采样时间为Ki,每批次的采样时间均不一样;随机选择107个训练正常批次中的20个批次和随机选择20个异常批次中的10个异常批次作为测试数据。
设定显著性水平D的变化范围为[0.01,0.05,0.1,0.2,0.5],高斯核函数宽度参数σ的变化范围为{s/8,s/4,s/2,s,2s,4s,8s},重要结构调节因子θ的变化范围为[0.01,0.05,0.1,0.2,0.3,0.5]。图2和图3分别为参数寻优结果图,表3为不同θ下,具有最高过程测量数据异常检测率的参数D和σ。
表3参数寻优结果
根据最优的参数结果D=0.01,σ=8s,θ=0.3,随机选择107个训练正常批次中的20个批次和20个异常批次作为测试数据。表4为每个批次过程测量数据的正确检测率。
表4 40个批次的异常检测结果

Claims (5)

1.一种基于动态超球结构变化的间歇过程测量数据异常检测方法,其特征在于:该方法包括以下步骤,
步骤一:将间歇过程历史数据按照变量方向展开为二维矩阵Xv(IKsum×J),其中I为批次编号,J为变量个数,Ki为第i个历史批次的总采样时间,Ksum为I个历史训练批次的总采样时间,并对展开数据Xv进行变量方向上的标准化得到并记录历史训练数据的均值mean(Xv)与标准差std(Xv),为后续步骤提供数据基础;
步骤二:基于动态超球结构变化的间歇过程测量数据异常检测方法离线训练;
(1)利用步骤一所得的标准化后的训练数据集建立静态超球体,可得表征静态超球体结构的拉格朗日乘子集i为数据编号,n=Ksum为数据集总长度;
(2)将集合a中各个元素降序排列获得根据设定的重要结构调节因子θ,获得静态超球体的重要结构的拉格朗日乘子集为其中w为重要的结构个数;
步骤三:基于动态超球结构变化的间歇过程测量数据异常检测方法的在线训练;
(1)读入待检测过程测量数据xtest,利用步骤一所得历史训练数据的均值mean(Xv)与标准差std(Xv),标准化待检测过程测量数据得构建动态训练数据集建立动态超球体,计算拉格朗日乘子集
(2)将集合atest中各个元素降序排列获得根据设定的重要结构调节因子θ,获得动态超球体的重要结构的拉格朗日乘子集为其中为重要结构个数;
步骤四:基于动态超球结构变化的间歇过程测量数据异常检测方法的在线异常检测;
通过比较静态超球体重要结构的拉格朗日乘子集与动态超球体重要结构的拉格朗日乘子集之间的差异,从而判断待检测过程测量数据是否为异常测量数据。
2.根据权利要求1所述的一种基于动态超球结构变化的间歇过程测量数据异常检测方法,其特征在于:所述步骤一,具体包括:
将间歇过程历史数据三维矩阵按照变量方向展开为二维矩阵Xv(IKsum×J),并对展开数据Xv进行变量方向上的标准化;
其中,mean(·)为数据集按照变量方向上的均值,std(·)为数据集按照变量方向上的标准差,标准化后的数据集为后续步骤提供数据基础。
3.根据权利要求1所述的一种基于动态超球结构变化的间歇过程测量数据异常检测方法,其特征在于:所述步骤二,具体包括:
(1)基于标准化后的数据集的静态超球体的构造;
利用标准化后的数据集基于非线性函数φ(·)构造的超球体满足以下约束
式中,i为数据编号,n=Ksum为数据集总长度,εi为松弛因子;a与R分别为超球体的球心和半径;惩罚系数C的计算如下
式中,D为显著性水平;为解决式(1-3)的约束问题,引入拉格朗日乘子集将式(1-3)转化为对偶形式
式中,j为数据编号,K(x,x)为核函数,定义如下
K(xi,xj)=exp(-||xi-xj||2/2σ2) (1-6)
式中,σ为高斯核函数宽度参数;利用二次规划求解式(1-5),得拉格朗日乘子集即为基于数据集训练所得的超球体结构的拉格朗日乘子集;
(2)将集合a中各个元素降序排列获得索引指标由变为 为降序排列后的拉格朗日乘子集,为a经降序排列后新的索引指标;设定集合的前θ%个元素作为静态超球体重要结构的拉格朗日乘子集,重要结构的个数w计算如下
其中为向下取整符号,θ为重要结构调节因子;的前θ%重要结构的索引指标为且重要结构的拉格朗日乘子集为
4.根据权利要求1所述的一种基于动态超球结构变化的间歇过程测量数据异常检测方法,其特征在于:所述步骤三,具体包括:
(1)标准化待检测过程测量数据
(2)构建动态训练数据集的动态超球体;
利用标准化后的数据集Xtest,构造过程如式(1-3)和(1-5)所示,得基于动态训练数据集的动态超球体结构的拉格朗日乘子集
(3)将集合atest中各个元素降序排列获得索引指标由变为设定集合的前θ%个元素作为动态超球体重要结构的拉格朗日乘子集,重要结构的个数计算如下
其中为向下取整符号;的前θ%重要结构的索引指标为且重要结构的拉格朗日乘子集为
5.根据权利要求1所述的一种基于动态超球结构变化的间歇过程测量数据异常检测方法,其特征在于:所述步骤四,具体包括:
通过比较静态超球体重要结构的拉格朗日乘子集与动态超球体重要结构的拉格朗日乘子集之间的差异,即判断xtest对应的是否存在于从而判断待检测过程测量数据是否为异常测量数据。
CN201710717362.6A 2017-08-21 2017-08-21 一种基于动态超球结构变化的间歇过程测量数据异常检测方法 Active CN107402559B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710717362.6A CN107402559B (zh) 2017-08-21 2017-08-21 一种基于动态超球结构变化的间歇过程测量数据异常检测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710717362.6A CN107402559B (zh) 2017-08-21 2017-08-21 一种基于动态超球结构变化的间歇过程测量数据异常检测方法

Publications (2)

Publication Number Publication Date
CN107402559A CN107402559A (zh) 2017-11-28
CN107402559B true CN107402559B (zh) 2019-05-24

Family

ID=60397551

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710717362.6A Active CN107402559B (zh) 2017-08-21 2017-08-21 一种基于动态超球结构变化的间歇过程测量数据异常检测方法

Country Status (1)

Country Link
CN (1) CN107402559B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113158183A (zh) * 2021-01-13 2021-07-23 青岛大学 移动终端恶意行为检测方法、系统、介质、设备及应用

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101907088A (zh) * 2010-05-27 2010-12-08 中国人民解放军国防科学技术大学 基于单类支持向量机的故障诊断方法
CN103376795A (zh) * 2013-07-15 2013-10-30 浙江大学 一种基于集成学习建模技术的半导体过程监测方法
CN103488091A (zh) * 2013-09-27 2014-01-01 上海交通大学 一种数据驱动的基于动态成分分析的控制过程监控方法
CN105955241A (zh) * 2016-06-03 2016-09-21 北京科技大学 一种基于联合数据驱动生产过程的质量故障定位方法
CN106886213A (zh) * 2017-03-13 2017-06-23 北京化工大学 一种基于核相似度支持向量数据描述的间歇过程故障检测方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101907088A (zh) * 2010-05-27 2010-12-08 中国人民解放军国防科学技术大学 基于单类支持向量机的故障诊断方法
CN103376795A (zh) * 2013-07-15 2013-10-30 浙江大学 一种基于集成学习建模技术的半导体过程监测方法
CN103488091A (zh) * 2013-09-27 2014-01-01 上海交通大学 一种数据驱动的基于动态成分分析的控制过程监控方法
CN105955241A (zh) * 2016-06-03 2016-09-21 北京科技大学 一种基于联合数据驱动生产过程的质量故障定位方法
CN106886213A (zh) * 2017-03-13 2017-06-23 北京化工大学 一种基于核相似度支持向量数据描述的间歇过程故障检测方法

Also Published As

Publication number Publication date
CN107402559A (zh) 2017-11-28

Similar Documents

Publication Publication Date Title
US11624731B2 (en) Method for predicting remaining life of numerical control machine tool
CN100489870C (zh) 用于过程统计控制的方法和多维系统
CN104952753B (zh) 测量抽样方法
US20160369777A1 (en) System and method for detecting anomaly conditions of sensor attached devices
Zhang et al. Correntropy based data reconciliation and gross error detection and identification for nonlinear dynamic processes
CN104035431B (zh) 用于非线性过程监控的核函数参数的获取方法和系统
CN104331591A (zh) 基于支持向量回归的粮仓储粮数量检测方法
CN111695452B (zh) 基于rbf神经网络的并联电抗器内部老化程度评估方法
CN111914889B (zh) 一种基于简略核主元分析的精馏塔异常状态识别方法
CN112766301B (zh) 一种采油机示功图相似性判断方法
CN102445174A (zh) 一种基于支持向量回归的多测点平面度评定方法
Botelho et al. Perspectives and challenges in performance assessment of model predictive control
CN107402559B (zh) 一种基于动态超球结构变化的间歇过程测量数据异常检测方法
CN115824993A (zh) 水体化学需氧量的确定方法、装置、计算机设备及介质
Shintani et al. Wafer-level variation modeling for multi-site RF IC testing via hierarchical Gaussian process
Li et al. Liquid pipeline leakage detection based on moving windows LS-SVM algorithm
CN111639715B (zh) 基于ls-svm的汽车仪表组装质量预测方法与系统
CN113313406A (zh) 一种电动汽车运行大数据的动力电池安全风险评估方法
Wu et al. Generalized inference for measuring process yield with the contamination of measurement errors—Quality control for silicon wafer manufacturing processes in the semiconductor industry
CN102207474A (zh) 一种基于xrf光谱仪合金牌号鉴定的智能方法
Chan et al. Melt index prediction with a mixture of Gaussian process regression with embedded clustering and variable selections
CN111474476A (zh) 一种电机故障预测方法
CN111985826B (zh) 一种多指标工业产品的可视化质量分级方法和系统
CN114184211B (zh) 一种惯导可靠性试验中性能变化机理一致性判定方法
CN104036834A (zh) 一种次临界系统次临界度的测量方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant