CN113468479B - 一种基于数据驱动的冷连轧工业过程监测与异常检测方法 - Google Patents
一种基于数据驱动的冷连轧工业过程监测与异常检测方法 Download PDFInfo
- Publication number
- CN113468479B CN113468479B CN202110668761.4A CN202110668761A CN113468479B CN 113468479 B CN113468479 B CN 113468479B CN 202110668761 A CN202110668761 A CN 202110668761A CN 113468479 B CN113468479 B CN 113468479B
- Authority
- CN
- China
- Prior art keywords
- kpls
- new
- matrix
- statistics
- sample
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000012544 monitoring process Methods 0.000 title claims abstract description 32
- 230000005856 abnormality Effects 0.000 title claims abstract description 28
- 238000004519 manufacturing process Methods 0.000 title claims abstract description 24
- 238000005096 rolling process Methods 0.000 title claims abstract description 20
- 238000001514 detection method Methods 0.000 title description 10
- 238000000034 method Methods 0.000 claims abstract description 75
- 230000008569 process Effects 0.000 claims abstract description 34
- 238000012545 processing Methods 0.000 claims abstract description 18
- 230000002159 abnormal effect Effects 0.000 claims abstract description 14
- 238000003745 diagnosis Methods 0.000 claims abstract description 7
- 239000011159 matrix material Substances 0.000 claims description 39
- 229910000831 Steel Inorganic materials 0.000 claims description 24
- 239000010959 steel Substances 0.000 claims description 24
- 238000004422 calculation algorithm Methods 0.000 claims description 21
- 238000004364 calculation method Methods 0.000 claims description 12
- 238000010606 normalization Methods 0.000 claims description 9
- 238000012549 training Methods 0.000 claims description 8
- 238000013507 mapping Methods 0.000 claims description 6
- 230000009286 beneficial effect Effects 0.000 claims description 4
- 230000000694 effects Effects 0.000 claims description 4
- 230000006872 improvement Effects 0.000 claims description 4
- 238000005259 measurement Methods 0.000 claims description 4
- 241000540325 Prays epsilon Species 0.000 claims description 3
- 238000002790 cross-validation Methods 0.000 claims description 3
- 239000013307 optical fiber Substances 0.000 claims description 3
- 238000004378 air conditioning Methods 0.000 claims description 2
- 238000009776 industrial production Methods 0.000 abstract description 3
- 230000006870 function Effects 0.000 description 10
- 230000007246 mechanism Effects 0.000 description 7
- 238000004458 analytical method Methods 0.000 description 4
- 102000008297 Nuclear Matrix-Associated Proteins Human genes 0.000 description 3
- 108010035916 Nuclear Matrix-Associated Proteins Proteins 0.000 description 3
- 210000000299 nuclear matrix Anatomy 0.000 description 3
- 230000008901 benefit Effects 0.000 description 2
- 239000002131 composite material Substances 0.000 description 2
- 238000009826 distribution Methods 0.000 description 2
- 238000005452 bending Methods 0.000 description 1
- 238000012937 correction Methods 0.000 description 1
- 238000007418 data mining Methods 0.000 description 1
- 238000000354 decomposition reaction Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 238000013178 mathematical model Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000006911 nucleation Effects 0.000 description 1
- 238000010899 nucleation Methods 0.000 description 1
- 238000003909 pattern recognition Methods 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000013000 roll bending Methods 0.000 description 1
- 230000037303 wrinkles Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F17/00—Digital computing or data processing equipment or methods, specially adapted for specific functions
- G06F17/10—Complex mathematical operations
- G06F17/18—Complex mathematical operations for evaluating statistical data, e.g. average values, frequency distributions, probability functions, regression analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0639—Performance analysis of employees; Performance analysis of enterprise or organisation operations
- G06Q10/06395—Quality analysis or management
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/04—Manufacturing
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02P—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
- Y02P90/00—Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
- Y02P90/02—Total factory control, e.g. smart factories, flexible manufacturing systems [FMS] or integrated manufacturing systems [IMS]
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02P—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
- Y02P90/00—Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
- Y02P90/30—Computing systems specially adapted for manufacturing
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Physics & Mathematics (AREA)
- Human Resources & Organizations (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Strategic Management (AREA)
- Economics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Mathematical Optimization (AREA)
- Entrepreneurship & Innovation (AREA)
- Development Economics (AREA)
- Mathematical Physics (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Pure & Applied Mathematics (AREA)
- Evolutionary Biology (AREA)
- Operations Research (AREA)
- General Engineering & Computer Science (AREA)
- Marketing (AREA)
- Educational Administration (AREA)
- Bioinformatics & Computational Biology (AREA)
- Tourism & Hospitality (AREA)
- General Business, Economics & Management (AREA)
- Computational Mathematics (AREA)
- Mathematical Analysis (AREA)
- Primary Health Care (AREA)
- General Health & Medical Sciences (AREA)
- Probability & Statistics with Applications (AREA)
- Health & Medical Sciences (AREA)
- Algebra (AREA)
- Manufacturing & Machinery (AREA)
- Databases & Information Systems (AREA)
- Software Systems (AREA)
- Evolutionary Computation (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Artificial Intelligence (AREA)
- Game Theory and Decision Science (AREA)
- Quality & Reliability (AREA)
- Testing And Monitoring For Control Systems (AREA)
Abstract
本发明公开了一种基于数据驱动的冷连轧工业过程监测与异常检测方法,包括:建立由历史数据构成的数据集,并对数据集中样本进行零均值处理;确定隐变量个数;确定核参数;建立KPLS过程监测模型,得到各统计量的阈值,将计算得到的统计量与对应的阈值进行比较,判断是否发生异常;建立KPLS异常诊断模型,确定异常变量。本发明能够对冷连轧工业生产过程中出现的故障进行监测,并进行故障的溯源和原因分析,以提早发现并及时处理问题,保障正常的生产过程及产品质量。
Description
技术领域
本发明涉及冷轧带钢技术领域,特别涉及一种基于数据驱动的冷连轧工业过程监测与异常检测方法。
背景技术
冷连轧带钢生产已经实现了高度的自动化,虽然提高了产品的产量以及凸度的精度,但是随着用户要求的提高,更薄规格与更高强度的带钢出现了各种板形问题,严重影响企业的生产效益。
板形指的是轧后带钢内部残余应力沿带宽方向的分布情况,取一定长度的带钢自然地放到一个平面上,常常可以观察到带钢的翘曲。翘曲有各种形式,大多数是波浪形,薄的带钢经常产生皱纹或局部凹凸。翘曲有时可以遍布整个带宽,有时只限于局部。这种翘曲和带钢的变形不均与内应力分布不均密切相关。目前冷连轧线上的带钢最常见的板形缺陷主要有八种:左边浪、右边浪、中间浪、双边浪、左三分浪、右三分浪、四分浪和边中复合浪。
将带钢裁成若干纵条并铺平成若干纵条,取横向上不同点的轧后长度一般使用带钢长度方向上各个纵条的相对长度差来表示板形,相对长度差也称为板形指数ε,其中ε=ΔL/L。由于ε是一个很小的数值,因此在实际生产中常用I单位来表示板形,I单位与板形指数的关系如式所示:
式中,ΔL是带钢长度方向上纵条长度与基准长度之间的差值;L是带钢基准长度,一般取各纵条长度的平均值。
在实际的应用中,很多复杂系统的内部机理是不为人们所了解,或者研究对象的时变性比较强,几乎不能用机理模型来进行描述。在这种情况下,完全根据机理来了解对象中各变量之间的关系就变得更加困难。针对这样的问题,数据挖掘、机器学习和模式识别等数据驱动方法用来分析和建模有很好的应用效果。同时,随着测量仪器和传感器不断发展,获取系统的输入输出数据变得越来越容易。基于此,利用测量仪器或传感器获取样本数据或测量数据来分析研究对象中变量之间的相互依赖关系,从而利用获取到的数据来建立对象的数学模型,即数据驱动的建模方法。该方法是将系统看作黑箱,不分析其内部机理,而只根据研究对象中的输入输出数据之间的相互关系直接建模,模型的在线校正能力强,并能适用于高度非线性和严重不确定的系统,从而为解决复杂系统的建模问题提供了有效途径。
但是,基于数据的非机理建模也会由于数据的噪声污染等问题导致建立的模型泛化能力差,与此同时大多数模型是“黑箱”结构的模型,不能反映系统的真实特性,进而影响对系统的研究。因此,将基于数据驱动的非机理建模与工艺知识和经验相结合,利用先验知识为基于数据驱动的模型节省训练样本,同时利用基于数据驱动的模型补偿原先模型无法解释的特性,这样做大大提高了模型的可解释性和应用范围。
发明内容
本发明的目的在于提供一种基于数据驱动的冷连轧工业过程监测与异常检测方法,对冷连轧工业生产过程中出现的故障进行监测,然后建立基于数据驱动的异常诊断模型,进行故障的溯源和原因分析,以提早发现并及时处理问题,避免干扰正常生产过程及产品质量。
为解决上述技术问题,本发明的实施例提供如下方案:
一种基于数据驱动的冷连轧工业过程监测与异常检测方法,包括以下步骤:
步骤一、建立由历史数据构成的数据集,并对所述数据集中的样本进行零均值处理;
步骤二、确定隐变量个数;
步骤三、确定核参数;
步骤四、建立KPLS过程监测模型,得到各统计量的阈值,将计算得到的统计量与对应的阈值进行比较,判断是否发生异常;
步骤五、建立KPLS异常诊断模型,确定异常变量。
优选地,所述步骤一具体包括:
选取若干故障率高于预设值的钢种的历史数据建立所述数据集,并对所述数据集中的样本进行零均值处理。
优选地,在所述步骤二中,采用交叉验证法确定隐变量个数,具体包括:
假定排除第i个样本之外的样本对第i个样本的拟合值为对每个样本重复上述拟合,则yj的预测误差平方和为PRESShj,计算如下:
相应的yj的预测误差平方和SShj计算如下:
设Y的预测误差平方和为PRESSh,有
相应Y的误差平方和为SSh,有
在实际计算中,当(PRESSh/SSh-1)≤0.952时,增加该隐变量是有益的,反之则认为无明显的改善。
优选地,所述步骤三具体包括:
在核矩阵中核参数fker的选取满足Mercer定理,包括以下三种:
多项式核:
fker(x,y)=<x,y>d
Sigmoid核:
fker(x,y)=tanh(β0<x,y>+β1)
高斯核:
式中参数d,β0,β1,c根据先验知识确定。
优选地,所述步骤四具体包括:
基于核偏最小二乘法将原始数据Φ分解为主元空间和残差空间,在主元空间和残差空间分别使用T2统计量和SPE统计量进行监控;
对新样本xnew映射为φ(xnew)并进行零均值处理后为则
式中,tnew∈Rγ为样本的得分,因此,KPLS主元空间的T2统计量为:
对应阈值为:
KPLS残差空间的SPE统计量为:
对应阈值为:
式中,参数g和h通过训练样本根据如下式计算:
式中,kn∈RN为核矩阵K的第n行的转置;kn,j表示kn的第j个元素;为零均值处理后的核矩阵/>的第n行的转置;tn∈Rγ为得分矩阵T的第n行的转置;
根据计算得到的统计量与对应的阈值相比较来判断是否发生异常,判定逻辑如下:
优选地,KPLS算法步骤如下:
假设在生产过程中进行n次采样,得到过程变量矩阵X∈RN×m和质量变量矩阵Y∈RN ×p,其中m为过程变量个数,p为质量变量个数,KPLS算法将过程变量X和Y投影到一个由少量潜变量(t1,t2,···,tγ)构成的低维空间中,γ是KPLS潜变量个数,其模型为:
式中,γ为潜变量个数,T∈RN×γ称为得分矩阵,P∈RM×γ是的负载矩阵,Q∈Rl×γ是Y的负载矩阵,/>和Yr分别是/>和Y的残差矩阵,KPLS模型的求解算法如下:
步骤1、令i=1,Y1=Y,
步骤2、选取ui为Yi的第一列,
步骤3、ti=ti/||ti||;
步骤4、ci=Yi Tti,ui=Yici;
步骤5、ui=ui/||ui||;
步骤6、重复步骤2至步骤5直到ti收敛;
步骤7、平减和Yi,/>
步骤8、收集参数T=[T ti],U=[U ui];
步骤9、令i=i+1,重复步骤2至步骤8,直到i>γ;
KPLS算法将过程变量矩阵X核化处理后变为在KPLS算法中,将/>和Y通过特征空间中隐变量的关系进行关联:
U=TB B=diag{b1,b2,...,bγ}
KPLS算法中存在如下关系:
TTT=Iγ
令
则
另外,和Y之间的回归系数矩阵ΨΦ为:
对于每个在线测量样本xnew同样需要映射到特征空间F,即:
xnew∈Rm→φ(xnew)∈RM
对φ(xnew)进行零均值处理:
则零均值处理后的在线核样本为:
式中,
knew∈RN为没有经过零均值处理之前的在线核样本,其元素knew,j,j=1,2,...,N为:
knew,j=<φ(xnew),φ(xj)>=fker(xnew,xj)
则在线测量样本xnew的KPLS预测值为:
以上即为KPLS算法模型建立方法。
优选地,所述步骤五具体包括:
在核函数中,构造一个包含所有变量的归一化因子,分别用核函数对每个因子求偏导;令v为归一化因子,则有:
式中,v=[v1,v2,···,vm]T为归一化因子,vi=1,i=1,2,···,m;那么核函数对归一化因子v中第i个变量vi的偏导数表示为:
式中,Xj,i表示第j个样本中的第i个变量,该偏导数的绝对值就表示第i个变量对核函数影响作用的大小;
在KPLS的监测模型中,T2统计量的计算公式如式所示,令
由和/>
对T2求偏导,得到贡献率大小为:
根据上式,对SPE求偏导,得到贡献率大小为:
在上中,
对求得的贡献率统计量进行标准化处理,即对每一个样本,要求满足和其中,前者用于检测异常偏离期望情况,后者检测噪声及干扰情况。
本发明实施例提供的技术方案带来的有益效果至少包括:
本发明实施例提供的方法包括数据训练和过程监测与异常检测两部分,在数据训练部分,建立由历史数据构成的数据集,确定隐变量个数,确定核参数,建立KPLS模型,得到各统计量的阈值;在过程监测与异常检测部分,针对在线核样本,将计算得到的统计量与阈值进行比较,若超出阈值则发生异常,若未超过阈值则未发生异常,并在发生异常后进行异常诊断确定异常变量。这样,能够对冷连轧工业生产过程中出现的故障进行监测,并进行故障的溯源和原因分析,以提早发现并及时处理问题,保障正常的生产过程及产品质量。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明实施例提供的基于数据驱动的冷连轧工业过程监测与异常检测方法的流程图;
图2a-图2b是本发明实施例中训练集数据统计量监测图;
图3是本发明实施例中KPLS对左边浪的异常诊断统计T2的变量贡献结果图;
图4是本发明实施例中KPLS对左边浪的异常诊断统计SPE的变量贡献结果图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面将结合附图对本发明实施方式作进一步地详细描述。
本发明的实施例提供了一种基于数据驱动的冷连轧工业过程监测与异常检测方法,如图1所示,所述方法包括以下步骤:
步骤一、建立由历史数据构成的数据集,并对数据集中的样本进行零均值处理。
本步骤中,选取若干故障率高于预设值的钢种的历史数据建立数据集,并对数据集中的样本进行零均值处理。
步骤二、确定隐变量个数。
在偏最小二乘法建模中,由于隐变量对模型的预测精度起决定性作用,因此隐变量个数的选取至关重要。本步骤中,采用交叉验证法确定隐变量个数,具体包括:
假定排除第i个样本之外的样本对第i个样本的拟合值为对每个样本重复上述拟合,则yj的预测误差平方和为PRESShj,计算如下:
相应的yj的预测误差平方和SShj计算如下:
设Y的预测误差平方和为PRESSh,有
相应Y的误差平方和为SSh,有
在实际计算中,当(PRESSh/SSh-1)≤0.952时,增加该隐变量是有益的,反之则认为无明显的改善。
步骤三、确定核参数。
KPLS模型中有一个非常重要的参数,即核参数fker。在核矩阵中fker的选取至关重要。核函数选取的必要条件是满足Mercer定理,主要包括以下几种:
多项式核:
fker(x,y)=<x,y>d
Sigmoid核:
fker(x,y)=tanh(β0<x,y>+β1)
高斯核:
式中参数d,β0,β1,c根据先验知识确定。不同的核参数对异常检测结果有着非常大的影响。
步骤四、建立KPLS过程监测模型,得到各统计量的阈值,将计算得到的统计量与对应的阈值进行比较,判断是否发生异常。
本步骤具体包括:
基于核偏最小二乘法将原始数据Φ分解为主元空间和残差空间,在主元空间和残差空间分别使用T2统计量和SPE统计量进行监控;
对新样本xnew映射为φ(xnew)并进行零均值处理后为则
式中,tnew∈Rγ为样本的得分,因此,KPLS主元空间的T2统计量为:
对应阈值为:
KPLS残差空间的SPE统计量为:
对应阈值为:
式中,参数g和h通过训练样本根据如下式计算:
式中,kn∈RN为核矩阵K的第n行的转置;kn,j表示kn的第j个元素;为零均值处理后的核矩阵/>的第n行的转置;tn∈Rγ为得分矩阵T的第n行的转置;
根据计算得到的统计量与对应的阈值相比较来判断是否发生异常,判定逻辑如下:
其中,KPLS算法步骤如下:
假设在生产过程中进行n次采样,得到过程变量矩阵X∈RN×m和质量变量矩阵Y∈RN ×p,其中m为过程变量个数,p为质量变量个数,KPLS算法将过程变量X和Y投影到一个由少量潜变量(t1,t2,···,tγ)构成的低维空间中,γ是KPLS潜变量个数,其模型为:
式中,γ为潜变量个数,T∈RN×γ称为得分矩阵,P∈RM×γ是的负载矩阵,Q∈Rl×γ是Y的负载矩阵,/>和Yr分别是/>和Y的残差矩阵,KPLS模型的求解算法如下:
步骤1、令i=1,Y1=Y,
步骤2、选取ui为Yi的第一列,
步骤3、ti=ti/||ti||;
步骤4、ci=Yi Tti,ui=Yici;
步骤5、ui=ui/||ui||;
步骤6、重复步骤2至步骤5直到ti收敛;
步骤7、平减和Yi,/>
步骤8、收集参数T=[T ti],U=[U ui];
步骤9、令i=i+1,重复步骤2至步骤8,直到i>γ;
KPLS算法将过程变量矩阵X核化处理后变为在KPLS算法中,将/>和Y通过特征空间中隐变量的关系进行关联:
U=TB B=diag{b1,b2,...,bγ}
KPLS算法中存在如下关系:
TTT=Iγ
令
则
另外,和Y之间的回归系数矩阵ΨΦ为:
对于每个在线测量样本xnew同样需要映射到特征空间F,即:
xnew∈Rm→φ(xnew)∈RM
对φ(xnew)进行零均值处理:
则零均值处理后的在线核样本为:
式中,
knew∈RN为没有经过零均值处理之前的在线核样本,其元素knew,j,j=1,2,...,N为:
knew,j=<φ(xnew),φ(xj)>=fker(xnew,xj)
则在线测量样本xnew的KPLS预测值为:
以上即为KPLS算法模型建立方法。
步骤五、建立KPLS异常诊断模型,确定异常变量。
本步骤具体包括:
在核函数中,构造一个包含所有变量的归一化因子,分别用核函数对每个因子求偏导;令v为归一化因子,则有:
式中,v=[v1,v2,···,vm]T为归一化因子,vi=1,i=1,2,···,m;那么核函数对归一化因子v中第i个变量vi的偏导数表示为:
式中,Xj,i表示第j个样本中的第i个变量,该偏导数的绝对值就表示第i个变量对核函数影响作用的大小;
在KPLS的监测模型中,T2统计量的计算公式如式所示,令
由和/>式
对T2求偏导,得到贡献率大小为:
根据上式,对SPE求偏导,得到贡献率大小为:
在上式中,
对求得的贡献率统计量进行标准化处理,即对每一个样本,要求满足和其中,前者用于检测异常偏离期望情况,后者检测噪声及干扰情况。
将本发明提供方法实施于某薄板冷连轧机工业过程监测与异常检测,具体流程如下。
步骤一:选取故障率较高的几个钢种建立数据集样本,并对样本进行零均值处理。
采用KPLS方法对实际生产数据进行过程监测,根据已有的机理知识和筛选出部分参数,得到如表1所示的23个参数,这些参数中包含了带钢宽度、长度、板形偏差以及机架前张应力、机架前后张应力差、单位轧制力、单位轧制力偏差、机架倾斜值、机架弯辊值、机架窜辊值、带钢速度、前滑因子等。
表1待建模变量表
步骤二:确定隐变量个数。
根据所提到的基于KPLS的过程监测流程,将上述数据中心化和标准化预处理后提取变量含义为“板形偏差”的作为质量变量Y,剩下的数据作为过程变量X,确定核矩阵参数c=10,在进行核化处理得到核矩阵K,然后对核矩阵K进行零均值处理得到确定隐变量个数为10。
步骤三:确定核参数。
根据数据集及专家经验选择核参数为高斯核。
步骤四:建立KPLS过程监测模型。
设定板形偏差高于2.5IU为异常数据,选择置信度α=0.05,计算T2统计量的阈值计算SPE统计量的阈值/>结果如表2所示。数据训练过程T2、SPE统计量以及各自阈值如图2a-图2b所示。
表2 KPLS统计量阈值表
对样本库中所有数据利用KPLS方法进行过程监测,监测结果如表3所示,统计了各类带钢过程监测中的异常检测率和误报率情况。其中样本的异常检测率平均为93.96%,误报率平均为3.12%。
表3 KPLS方法钢卷过程监测统计表
步骤五:建立KPLS异常诊断模型。
对于KPLS监测模型成功检测到的异常样本点,根据这些样本点进行模式分解后得到的系数将异常样本分类为标签:无明显浪、左边浪、右边浪、中浪、双边浪、左三分浪、右三分浪、四分浪和边中复合浪,以下以左边浪为例。
如图3、图4及表4所示,可以看到对左边浪影响较多的参数为:5机架单位轧制力、45机架间和5机架前后张应力差、4机架前DSOS张应力差、5机架DSOS单位轧制力差、1机架入口厚度、5机架后带钢速度,此外,5机架倾斜值以及5机架工作辊弯辊值亦有较小的影响,对于后面两者分析认为是由于带钢的板形发生了异常,两者的调控值对应发生变化来调节板形。
表4 KPLS对左边浪的异常统计结果
与现有技术相比,本发明提供的基于数据驱动的冷连轧工业过程监测与异常检测模型可以实现对现有生产过程中的异常进行准确定位以及对异常原因进行溯源,有效保证了正常的生产过程及产品质量。
以上所述仅为本发明的较佳实施例,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (2)
1.一种基于数据驱动的冷连轧工业过程监测与异常检测方法,其特征在于,包括以下步骤:
步骤一、建立由历史数据构成的数据集,并对所述数据集中的样本进行零均值处理;
所述步骤一具体包括:
选取若干故障率高于预设值的钢种的历史数据建立所述数据集,并对所述数据集中的样本进行零均值处理;
步骤二、确定隐变量个数;
在所述步骤二中,采用交叉验证法确定隐变量个数,具体包括:
假定排除第i个样本之外的样本对第i个样本的拟合值为对每个样本重复上述拟合,则yj的预测误差平方和为PRESShj,计算如下:
相应的yj的预测误差平方和SShj计算如下:
设Y的预测误差平方和为PRESSh,有
相应Y的误差平方和为SSh,有
在实际计算中,当(PRESSh/SSh-1)≤0.952时,增加该隐变量是有益的,反之则认为无明显的改善;
步骤三、确定核参数;
所述步骤三具体包括:
在核矩阵中核参数fker的选取满足Mercer定理,包括以下三种:
多项式核:
fker(x,y)=<x,y>d
Sigmoid核:
fker(x,y)=tanh(β0<x,y>+β1)
高斯核:
式中参数d,β0,β1,c根据先验知识确定;
步骤四、建立KPLS过程监测模型,得到各统计量的阈值,将计算得到的统计量与对应的阈值进行比较,判断是否发生异常;
所述步骤四具体包括:
基于核偏最小二乘法将原始数据Φ分解为主元空间和残差空间,在主元空间和残差空间分别使用T2统计量和SPE统计量进行监控;
对新样本xnew映射为φ(xnew)并进行零均值处理后为则
式中,tnew∈Rγ为样本的得分,因此,KPLS主元空间的T2统计量为:
对应阈值为:
KPLS残差空间的SPE统计量为:
对应阈值为:
式中,参数g和h通过训练样本根据如下式计算:
式中,kn∈RN为核矩阵K的第n行的转置;kn,j表示kn的第j个元素;为零均值处理后的核矩阵/>的第n行的转置;tn∈Rγ为得分矩阵T的第n行的转置;
根据计算得到的统计量与对应的阈值相比较来判断是否发生异常,判定逻辑如下:
步骤五、建立KPLS异常诊断模型,确定异常变量;
所述步骤五具体包括:
在核函数中,构造一个包含所有变量的归一化因子,分别用核函数对每个因子求偏导;令v为归一化因子,则有:
式中,v=[v1,v2,···,vm]T为归一化因子,vi=1,i=1,2,···,m;那么核函数对归一化因子v中第i个变量vi的偏导数表示为:
式中,Xj,i表示第j个样本中的第i个变量,该偏导数的绝对值就表示第i个变量对核函数影响作用的大小;
在KPLS的监测模型中,T2统计量的计算公式如式所示,令/>
由和/>式
对T2求偏导,得到贡献率大小为:
根据上式,对SPE求偏导,得到贡献率大小为:
在上式中,
对求得的贡献率统计量进行标准化处理,即对每一个样本,要求满足和其中,前者用于检测异常偏离期望情况,后者检测噪声及干扰情况。
2.根据权利要求1所述的基于数据驱动的冷连轧工业过程监测与异常检测方法,其特征在于,KPLS算法步骤如下:
假设在生产过程中进行n次采样,得到过程变量矩阵X∈RN×m和质量变量矩阵Y∈RN×p,其中m为过程变量个数,p为质量变量个数,KPLS算法将过程变量X和Y投影到一个由少量潜变量(t1,t2,···,tγ)构成的低维空间中,γ是KPLS潜变量个数,其模型为:
式中,γ为潜变量个数,T∈RN×γ称为得分矩阵,P∈RM×γ是的负载矩阵,Q∈Rl×γ是Y的负载矩阵,/>和Yr分别是/>和Y的残差矩阵,KPLS模型的求解算法如下:
步骤1、令i=1,Y1=Y,
步骤2、选取ui为Yi的第一列,
步骤3、ti=ti/||ti||;
步骤4、ci=Yi Tti,ui=Yici;
步骤5、ui=ui/||ui||;
步骤6、重复步骤2至步骤5直到ti收敛;
步骤7、平减和Yi,/>
步骤8、收集参数T=[T ti],U=[U ui];
步骤9、令i=i+1,重复步骤2至步骤8,直到i>γ;
KPLS算法将过程变量矩阵X核化处理后变为在KPLS算法中,将/>和Y通过特征空间中隐变量的关系进行关联:
U=TB B=diag{b1,b2,...,bγ}
KPLS算法中存在如下关系:
TTT=Iγ
令
则
另外,和Y之间的回归系数矩阵ΨΦ为:
对于每个在线测量样本xnew同样需要映射到特征空间F,即:
xnew∈Rm→φ(xnew)∈RM
对φ(xnew)进行零均值处理:
则零均值处理后的在线核样本为:
式中,
knew∈RN为没有经过零均值处理之前的在线核样本,其元素knew,j,j=1,2,...,N为:
knew,j=<φ(xnew),φ(xj)>=fker(xnew,xj)
则在线测量样本xnew的KPLS预测值为:
以上即为KPLS算法模型建立方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110668761.4A CN113468479B (zh) | 2021-06-16 | 2021-06-16 | 一种基于数据驱动的冷连轧工业过程监测与异常检测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110668761.4A CN113468479B (zh) | 2021-06-16 | 2021-06-16 | 一种基于数据驱动的冷连轧工业过程监测与异常检测方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113468479A CN113468479A (zh) | 2021-10-01 |
CN113468479B true CN113468479B (zh) | 2023-08-08 |
Family
ID=77870061
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110668761.4A Active CN113468479B (zh) | 2021-06-16 | 2021-06-16 | 一种基于数据驱动的冷连轧工业过程监测与异常检测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113468479B (zh) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116560277A (zh) * | 2023-05-17 | 2023-08-08 | 北京科技大学顺德创新学院 | 一种基于图神经网络的冷轧工业过程监测方法 |
CN117019889A (zh) * | 2023-07-18 | 2023-11-10 | 常州润来科技有限公司 | 一种三辊旋轧设备智能检测故障的方法及系统 |
CN116944446B (zh) * | 2023-07-27 | 2024-02-09 | 常州润来科技有限公司 | 一种水平连铸铜管坯工艺参数异常监测方法 |
CN117831659B (zh) * | 2024-03-04 | 2024-05-03 | 山东钢铁股份有限公司 | 宽厚板质量在线检测的方法、装置、电子设备及存储介质 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2014137564A1 (en) * | 2013-03-07 | 2014-09-12 | Siemens Aktiengesellschaft | Systems and methods for boosting coal quality measurement statement of related cases |
CN107463093A (zh) * | 2017-07-13 | 2017-12-12 | 东北大学 | 一种基于kpls鲁棒重构误差的高炉铁水质量监测方法 |
CN110232256A (zh) * | 2019-06-28 | 2019-09-13 | 东北大学 | 一种基于kpls和rwfcm的污水处理过程监测方法 |
-
2021
- 2021-06-16 CN CN202110668761.4A patent/CN113468479B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2014137564A1 (en) * | 2013-03-07 | 2014-09-12 | Siemens Aktiengesellschaft | Systems and methods for boosting coal quality measurement statement of related cases |
CN107463093A (zh) * | 2017-07-13 | 2017-12-12 | 东北大学 | 一种基于kpls鲁棒重构误差的高炉铁水质量监测方法 |
CN110232256A (zh) * | 2019-06-28 | 2019-09-13 | 东北大学 | 一种基于kpls和rwfcm的污水处理过程监测方法 |
Non-Patent Citations (1)
Title |
---|
Process Fault Detection Using Directional Kernel Partial Least Squares;Yingwei Zhang等;《industrial&engineering chemistry research》(第54期);第2509−2518页 * |
Also Published As
Publication number | Publication date |
---|---|
CN113468479A (zh) | 2021-10-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN113468479B (zh) | 一种基于数据驱动的冷连轧工业过程监测与异常检测方法 | |
Kano et al. | Data-based process monitoring, process control, and quality improvement: Recent developments and applications in steel industry | |
JP4394286B2 (ja) | 統計的プロセス管理のための多次元的方法及びシステム | |
Li et al. | A novel diagnostic and prognostic framework for incipient fault detection and remaining service life prediction with application to industrial rotating machines | |
CN112287550B (zh) | 基于主成分分析控制器的带钢头部厚差过程参数优化方法 | |
WO2021241580A1 (ja) | 異常変調原因特定装置、異常変調原因特定方法及び異常変調原因特定プログラム | |
CN111368428A (zh) | 一种基于监控二阶统计量的传感器精度下降故障检测方法 | |
CN111563686A (zh) | 一种基于全流程数据的冷轧硅钢质量判定方法 | |
CN112101439A (zh) | 基于分布式贝叶斯网络的高速线材质量缺陷诊断与溯源方法 | |
CN114896735A (zh) | 改进偏最小二乘的热轧带钢头部浪形缺陷原因识别方法 | |
CN117193222A (zh) | 一种基于工业物联网和大数据的智能质量控制系统及其控制方法 | |
CN115409066A (zh) | 时间序列数据的异常检测方法、装置及计算机存储介质 | |
CN113806964B (zh) | 一种考虑多因素耦合作用的腐蚀与结垢速率预测方法 | |
CN109719138B (zh) | 一种基于数据挖掘的变形抗力唯象模型计算方法 | |
CN116203903A (zh) | 一种热连轧过程质量异常的时空根源诊断方法 | |
CN113780852B (zh) | 一种板带轧制过程质量缺陷的诊断方法 | |
CN115985411A (zh) | 基于高斯过程回归模型的高分子熔融指数软测量方法 | |
CN113253682B (zh) | 非线性化工过程故障检测方法 | |
Chang et al. | Real-time detection of wave profile changes | |
CN115081798A (zh) | 基于pls算法的板带热精轧过程分机架联合监控与诊断方法 | |
Celano et al. | On‐line monitoring of extreme values of geometric profiles in finite horizon processes | |
Xue et al. | Economic design of residuals MEWMA control chart with variable sampling intervals and sample size | |
KR101840419B1 (ko) | 조질압연기 및 형상교정기 설비장애 예지 정비 시스템 및 방법 | |
CN116429170B (zh) | 一种板坯质量检测方法 | |
CN116028783B (zh) | 基于过程数据的带钢热连轧微小故障实时检测方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |