CN106933211A - 一种识别工业过程动态调整区间的方法和装置 - Google Patents
一种识别工业过程动态调整区间的方法和装置 Download PDFInfo
- Publication number
- CN106933211A CN106933211A CN201710255414.2A CN201710255414A CN106933211A CN 106933211 A CN106933211 A CN 106933211A CN 201710255414 A CN201710255414 A CN 201710255414A CN 106933211 A CN106933211 A CN 106933211A
- Authority
- CN
- China
- Prior art keywords
- principal components
- point
- data
- interval
- operational factor
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 64
- 238000004519 manufacturing process Methods 0.000 title claims abstract description 31
- 230000008569 process Effects 0.000 claims abstract description 27
- 238000012545 processing Methods 0.000 claims abstract description 17
- 239000011159 matrix material Substances 0.000 claims description 31
- 238000010586 diagram Methods 0.000 claims description 13
- 238000001914 filtration Methods 0.000 claims description 11
- 230000001186 cumulative effect Effects 0.000 claims description 7
- 239000000203 mixture Substances 0.000 claims description 3
- 238000000513 principal component analysis Methods 0.000 abstract description 14
- 238000005259 measurement Methods 0.000 abstract description 5
- 230000008859 change Effects 0.000 description 18
- 238000004458 analytical method Methods 0.000 description 7
- 238000005070 sampling Methods 0.000 description 7
- 238000000540 analysis of variance Methods 0.000 description 6
- 238000004517 catalytic hydrocracking Methods 0.000 description 4
- 238000006243 chemical reaction Methods 0.000 description 4
- 230000007704 transition Effects 0.000 description 4
- 241000208340 Araliaceae Species 0.000 description 3
- 235000005035 Panax pseudoginseng ssp. pseudoginseng Nutrition 0.000 description 3
- 235000003140 Panax quinquefolius Nutrition 0.000 description 3
- 150000001875 compounds Chemical class 0.000 description 3
- 230000008878 coupling Effects 0.000 description 3
- 238000010168 coupling process Methods 0.000 description 3
- 238000005859 coupling reaction Methods 0.000 description 3
- 239000000284 extract Substances 0.000 description 3
- 235000008434 ginseng Nutrition 0.000 description 3
- 238000003064 k means clustering Methods 0.000 description 3
- 238000011160 research Methods 0.000 description 3
- 238000007621 cluster analysis Methods 0.000 description 2
- 238000001514 detection method Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 230000014509 gene expression Effects 0.000 description 2
- 230000007246 mechanism Effects 0.000 description 2
- 241000196324 Embryophyta Species 0.000 description 1
- UFHFLCQGNIYNRP-UHFFFAOYSA-N Hydrogen Chemical compound [H][H] UFHFLCQGNIYNRP-UHFFFAOYSA-N 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 210000004556 brain Anatomy 0.000 description 1
- 238000013524 data verification Methods 0.000 description 1
- 238000000354 decomposition reaction Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000009795 derivation Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000006477 desulfuration reaction Methods 0.000 description 1
- 230000023556 desulfurization Effects 0.000 description 1
- 239000002283 diesel fuel Substances 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000008030 elimination Effects 0.000 description 1
- 238000003379 elimination reaction Methods 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 230000002068 genetic effect Effects 0.000 description 1
- 210000004209 hair Anatomy 0.000 description 1
- 229910052739 hydrogen Inorganic materials 0.000 description 1
- 239000001257 hydrogen Substances 0.000 description 1
- 238000009776 industrial production Methods 0.000 description 1
- 239000003350 kerosene Substances 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 239000003208 petroleum Substances 0.000 description 1
- 230000000750 progressive effect Effects 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 238000007430 reference method Methods 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
- 239000000126 substance Substances 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 230000001052 transient effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G05—CONTROLLING; REGULATING
- G05B—CONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
- G05B19/00—Programme-control systems
- G05B19/02—Programme-control systems electric
- G05B19/418—Total factory control, i.e. centrally controlling a plurality of machines, e.g. direct or distributed numerical control [DNC], flexible manufacturing systems [FMS], integrated manufacturing systems [IMS] or computer integrated manufacturing [CIM]
- G05B19/41885—Total factory control, i.e. centrally controlling a plurality of machines, e.g. direct or distributed numerical control [DNC], flexible manufacturing systems [FMS], integrated manufacturing systems [IMS] or computer integrated manufacturing [CIM] characterised by modeling, simulation of the manufacturing system
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
- G06F18/232—Non-hierarchical techniques
- G06F18/2321—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
- G06F18/23213—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
-
- G—PHYSICS
- G05—CONTROLLING; REGULATING
- G05B—CONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
- G05B2219/00—Program-control systems
- G05B2219/30—Nc systems
- G05B2219/32—Operator till task planning
- G05B2219/32339—Object oriented modeling, design, analysis, implementation, simulation language
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02P—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
- Y02P90/00—Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
- Y02P90/02—Total factory control, e.g. smart factories, flexible manufacturing systems [FMS] or integrated manufacturing systems [IMS]
Landscapes
- Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Manufacturing & Machinery (AREA)
- General Engineering & Computer Science (AREA)
- Automation & Control Theory (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Quality & Reliability (AREA)
- Probability & Statistics with Applications (AREA)
- Artificial Intelligence (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Life Sciences & Earth Sciences (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明提供了一种识别工业过程动态调整区间的方法和装置,该方法包括:S1,根据一段时间内的运行参数的采样点,通过主成分分析法获取所述运行参数的主成分数据;S2,对所述主成分数据进行滤波和拟合处理,获取拟合曲线;S3,根据所述拟合曲线,通过聚类处理获取对应非零导数的时间点所组成的动态调整区间。通过主成分分析和聚类处理可实现具有较多运行参数的复杂工业过程动态调整区间获取,避免单个或几个运行参数测量误差的影响,准确、有效地识别动态调整区间,不依赖先验知识,具有工业适用性。
Description
技术领域
本发明涉及工业生产领域,具体涉及一种识别工业过程动态调整区间的方法和装置。
背景技术
随着DCS控制系统(集散控制系统)和信息化系统的广泛应用,越来越多的过程数据被记录和储存下来。目前,工业过程系统已经累积和存储了大量的运行历史数据,通过对工业调整过程的分析,可以对工业系统调整过程进行识别,提取其历史动态调整操作序列,建立工业过程动态调整案例库。通过对案例库中每个动态调整区间进行综合评价,得到当入口条件或出口产品的需求发生变化时的历史最优调节操作序列,从而建立最优动态调整的智能决策支持系统,来指导生产。
历史最优动态调整操作序列的提取首先需要对动态调整区间进行识别。动态调整区间是系统从一种稳定运行模式向另一种稳定运行模式渐进式量变的动态过程,该过程会有很多变量发生变化,且变量的变化随时间方向呈现动态的渐变趋势。工业系统动态调整区间的识别,就是从历史运行数据中,判别出过渡区间的过程。类似于流程工业的稳态判别,过渡模态的识别是识别工业过程从一种稳定运行模式向另一种稳定运行模式渐进式量变的动态过程,因此在工业系统调整过程识别的问题上,可以借鉴稳定运行状态的识别方法。
针对稳态检测的研究,现有技术主要有基于机理分析、基于统计理论和基于趋势提取的三类稳态检测方法。例如,通常根据当前窗口中数据拟合方程的一次项系数和拟合偏差的标准差,判断是否稳态;还有以相邻一段时间内的均值和一次拟合系数作为稳态判别准则。
但这些研究往往都是针对单一变量的稳定性分析的,对于多变量的情况,上述方法仅仅是通过单变量的稳态检测结果来合成多变量的稳态结果。但是许多工业过程比较复杂,运行参数较多,各参数之间耦合严重,若是选择关键变量来进行过渡过程的识别,则需要较为详细的机理知识,而且由于关键变量数目也较多,一一进行分析会给计算带来很大负担。因此,上述方法只适应于单变量或者变量相对较少的工业过程,不能很好地解决工业过程中监测变量众多且耦合性强的问题同时,并且实际过程数据中过渡模态前后数据特征不明显,容易被错误识别到稳定模态,会对后续的分析研究造成较大影响。
发明内容
针对现有技术中存在的难以对多变量的工业过程下的动态调整区间进行识别以及识别区间不准确的缺陷,本发明提供一种识别工业过程动态调整区间的方法和装置。
本发明的一方面提供一种识别工业过程动态调整区间的方法,包括:S1,根据一段时间内的运行参数的采样点,通过主成分分析法获取所述运行参数的主成分数据;S2,对所述主成分数据进行滤波和拟合处理,获取拟合曲线;S3,根据所述拟合曲线,通过聚类处理获取对应非零导数的时间点所组成的动态调整区间。
其中,所述步骤S1进一步包括:根据经过标准化处理的所述运行参数获取数据矩阵,根据所述数据矩阵利用累积方差贡献率获取所述主成分数据的个数;根据所述主成分数据的个数和所述数据矩阵获取所述主成分数据。
其中,所述步骤S2包括:通过带滑动窗口的中值滤波对所述主成分数据进行滤波处理,获取去噪后的主成分数据;通过多项式最小二乘法对所述去噪后的主成分数据进行拟合,获取所述拟合曲线。
其中,所述步骤S3中的通过聚类处理获取对应非零导数的时间点包括:根据所述拟合曲线获取所述采样点对应的一阶导数以及以所述一阶导数为样本点的样本矩阵;根据所述样本矩阵,设定零类和非零类,通过基于密度峰值的K-means算法获取初始聚类中心;根据所述初始聚类中心,通过计算所述样本点至聚类中心的距离进行分类,获取属于非零类的一阶导数对应的时间点。
其中,所述通过基于密度峰值的K-means算法获取初始聚类中心包括:根据所述样本矩阵和预设距离,获取局部密度和高密度距离;根据所述局部密度和所述高密度距离获取决策图,并根据所述决策图获取所述初始聚类中心。
其中,所述局部密度ρ为所述预设距离内数据点的个数,具体为:
ρ=∑jχ(dij-dc);
其中,dc为所述预设距离,dij为数据点i和数据点j之间的距离;当x<0时,χ(x)=1,当x≥0时,χ(x)=0;所述高密度距离δ为数据点与密度比所述数据点高的最近数据点的距离,数据点i的高密度距离具体为:
本发明的另一方面提供一种识别工业过程动态调整区间的装置,包括:第一获取模块,用于根据一段时间内的运行参数的采样点,通过主成分分析法获取所述运行参数的主成分数据;第二获取模块,用于对所述主成分数据进行滤波和拟合处理,获取拟合曲线;第三获取模块,用于根据所述拟合曲线,通过聚类处理获取对应非零导数的时间点所组成的动态调整区间。
本发明提供的识别工业过程动态调整区间的方法和装置,通过主成分分析和聚类处理可实现具有较多运行参数的复杂工业过程动态调整区间获取,避免单个或几个运行参数测量误差的影响,准确、有效地识别动态调整区间,不依赖先验知识,具有工业适用性。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例提供的识别工业过程动态调整区间的方法的流程示意图;
图2为本发明另一实施例提供的识别工业过程动态调整区间的方法的流程示意图;
图3为本发明实施例提供的预处理后的运行参数的变化曲线图;
图4为本发明实施例提供的三个主成分数据拟合前和拟合后的变化曲线图;
图5为本发明实施例提供的基于密度峰值的K-means聚类算法的流程图;
图6为本发明实施例提供的基于密度峰值的K-means聚类算法获取初始聚类中心的决策图;
图7为本发明实施例提供的加氢裂化反应的动态调整区间的示意图;
图8为本发明实施例提供的识别工业过程动态调整区间的装置的结构示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
许多工业系统流程长、操作变量多且耦合严重、加工方案多变、数据存在大量噪声,依靠人工识别或借鉴稳态检测的方法来识别工业系统调整过程不仅工作量较大,且容易对一些调整过程初期和末期进行误判。因此针对工业系统动态调整过程的识别问题,本发明实施例提供了一种识别工业过程动态调整区间的方法和装置。
图1为本发明实施例提供的识别工业过程动态调整区间的方法的流程示意图,如图1所示,该方法包括:S1,根据一段时间内的运行参数的采样点,通过主成分分析法获取所述运行参数的主成分数据;S2,对所述主成分数据进行滤波和拟合处理,获取拟合曲线;S3,根据所述拟合曲线,通过聚类处理获取对应非零导数的时间点所组成的动态调整区间。
在步骤S1中,主成分分析也称主分量分析,旨在利用降维的思想,把多指标转化为少数几个综合指标(即主成分),其中每个主成分都能够反映原始变量的大部分信息,且所含信息互不重复。具体地,在本步骤中,首先对工业工程的多个运行参数进行采集,然后使用主成分分析方法对多个运行参数进行处理,得到数量与运行参数相比减少的主成分数据。
在步骤S2中,滤波是指由于工业控制对象的环境较为恶劣,干扰源较多,如强电磁干扰、环境温度变化较大等,因此为了减少对采样值的干扰,提高系统的性能,通常在进行数据处理之前对采样值进行滤波处理;拟合是指已知某函数的若干离散函数值{f1,f2,…,fn},通过调整该函数中若干待定系数f(λ1,λ2,…,λn),使得该函数与已知点集的差别最小,通过拟合可以将平面上一系列的点用一条光滑的回归曲线连接起来。
通过将滤波、拟合后得到的对应回归值代替原采集数据,能够消除原始数据采集过程中的随机误差,并保持主成分数据变化的趋势不发生变化。
在步骤S3中,拟合曲线的横坐标为时间点,纵坐标为主成分数据,该曲线能够反映主成分数据随时间变化的趋势;每个时间点的导数则反映拟合曲线上该时间点的主成分数据变化信息;聚类是指按照某个特定标准(如距离准则)把一个数据集分割成不同的类或簇,使得同一个簇内的数据对象的相似性尽可能大,同时不在同一个簇中的数据对象的差异性也尽可能地大。即聚类后同一类的数据尽可能聚集到一起,不同数据尽量分离。
具体地,在本步骤中,根据步骤S2获取的拟合曲线,对该曲线上各时间点的导数进行聚类处理,获得属于非零类导数所对应的时间点,该时间点组成的区间为动态调整区间。
本发明实施例提供的识别工业过程动态调整区间的方法,通过主成分分析和聚类处理可实现具有较多运行参数的复杂工业过程中动态调整区间获取,能够避免单个或几个运行参数误差的影响,准确、有效地识别动态调整区间,不依赖先验知识,具有工业适用性。
基于上述实施例,所述步骤S1进一步包括:根据经过标准化处理的所述运行参数获取数据矩阵,根据所述数据矩阵利用累积方差贡献率获取所述主成分数据的个数;根据所述主成分数据的个数和所述数据矩阵获取所述主成分数据。其中,在获取到运行参数在一段时间内的采样点后,可以对运行参数进行标准化的预处理。例如,j=1,2,…,J,其中为第j个运行参数的采样值,J为获取的运行参数的总数;n=1,2…,N,为第j个变量的第n个采样值,N为对应不同时间点的采样值的总数。标准化处理的具体方式如下:
其中
其中
通过对每个运行参数进行标准化处理,得到处理后的运行参数矩阵,能够消除不同量纲对数据的影响。
通过主成分分析获取主成分数据的步骤具体为:首先根据运行参数获取数据矩阵X,再获取数据矩阵X的方差矩阵S,具体如下:
对所述方差S奇异值分解,获取复合矩阵P和特征值矩阵D。再设定累积方差贡献率Pe%,累积方差贡献率表示主成分数据对原运行参数变化情况的反映率。例如,对m个运行参数进行处理,得到n个主成分数据,即这n个主成分数据能在Pe%程度上反应原m个运行参数的变化情况。Pe%通常取值80%-95%,即一般选取包含原数据80%-95%的信息的主成分数据即可。选定累积方差贡献率后,设定的特征值λ满足下式:
通过累积方差贡献率能够获取到特征值的个数m,即为相应主成分数据的个数。最后取复合矩阵P的前m列Pm,则获取的主成分数据矩阵具体为:Qm=XPm。因此通过主成分分析能够获取m个主成分数据。
基于上述实施例,所述步骤S2包括:通过带滑动窗口的中值滤波对所述主成分数据进行滤波处理,获取去噪后的主成分数据;通过多项式最小二乘法对所述去噪后的主成分数据进行拟合,获取所述拟合曲线。
为了减小噪声对主成分数据的影响,可以采用滑动窗口为L的中值滤波消除影响。对于某个主要变量在采样区间的序列x(j)进行滤波处理时,首先定义一个长度为奇数的L窗口,L=2N+1,其中N为正整数。
设在某一时刻窗口内的信号样本为:
x(j-N),…,x(j),…,…x(j+N) (5)
x(j-N),…,x(j),…,…x(j+N)
其中x(j)为位于窗口中心的该主成分数据样本值。对L个该主成分数据样本值按从小到大的顺序排列后,其中排序在j处的样本便定义为中值滤波的输出值,具体为:
y(j)=Med[x(j-N),…,x(j),…x(j+N)] (6)
其中,Med为中值滤波函数,采用滑动窗口法即可得到该主成分数据在采样区间的中值滤波序列,即为去噪后的主成分数据。
多项式最小二乘拟合的具体步骤如下:对某段包含过渡态的采样区间的序列x(j)进行多项式最小二乘法拟合时,首先定义一个长度为奇数的H窗口,H=2h+1,其中h为正整数。
设在某一时刻,窗口内的信号样本为:
x(j-h),…,x(j),…x(j+h) (7)
其中x(j)为位于窗口中心的主成分数据实时值。
令窗口内的信号样本为:
x′(1),…,x′(h+1),…x′(2h+1) (8)
其中x′(h+1)为位于窗口中心的主成分数据实时值,对应的采样时间点t分别为1,2,…,2h+1,则窗口内的拟合信号可以表示为时间t的函数,具体如下:
其中,a=[a0,a1,…,an]T,n<2h=1为多项式最小二乘法拟合模型参数向量,r(t)=[1,t,t2,…,tn]T为回归变量。
应用最小二乘法就可以得到参数a的最优估计:
其中:
则经过多项式最小二乘法拟合后的拟合信号为:
则主成分数据在各个时间点x(j)的回归值为:
使用回归值代替原测量值,采用滑动窗口方法即可得到该主成分数据在采样区间的多项式最小二乘法拟合回归值序列。通过各时间点对应的主成分数据能够得到各主成分数据的拟合曲线。
基于上述实施例,所述步骤S3中的通过聚类处理获取对应非零导数的时间点包括:根据所述拟合曲线获取所述采样点对应的一阶导数以及以所述一阶导数为样本点的样本矩阵;根据所述样本矩阵,设定零类和非零类,通过基于密度峰值的K-means算法获取初始聚类中心;根据所述初始聚类中心,通过计算所述样本点至聚类中心的距离进行分类,获取属于非零类的一阶导数对应的时间点。
其中,K-means算法为接受输入量K;然后将n个数据对象划分为K个聚类以便使得所获得的聚类满足:同一聚类中的对象相似度较高;而不同聚类中的对象相似度较小。聚类相似度是利用各聚类中对象的均值所获得一个“中心对象”(引力中心)来进行计算的。
具体地,首先对拟合曲线进行求导,获得各时间点在各主成分数据的拟合曲线的一阶导数;然后以主成分数据的一阶导数作为样本点的样本矩阵Xn×m,该矩阵中:n表示样本数,m表示主成分数据。
对于样本矩阵,可以通过利用导数为零或非零这一特征进行聚类分析,因此聚类数设为K=2,包括一阶导数为零和非零两类。通过K-means算法获取初始聚类中心,计算各样本点到初始聚类中心的距离,将各点划分到与其距离最近的类中,形成初始分类。
在获取到初始分类后,通过计算各样本点均值作为新的聚类中心,并根据新的聚类中心重新分类;反复计算聚类中心以及根据聚类中心分类,直到聚类中心都不再改变或者小于一定的误差范围时,判定聚类处理完成,此时的非零类一阶导数所对应的时间点组成动态调整区间。
基于上述实施例,所述通过基于密度峰值的K-means算法获取初始聚类中心包括:根据所述样本矩阵和预设距离,获取局部密度和高密度距离;根据所述局部密度和所述高密度距离获取决策图,并根据所述决策图获取所述初始聚类中心。
基于上述实施例,所述局部密度ρ为所述预设距离内数据点的个数,具体为:
ρ=∑jχ(dij-dc) (13)
其中,dc为所述预设距离,dij为数据点i和数据点j之间的距离;当x<0时,χ(x)=1,当x≥0时,χ(x)=0;
所述高密度距离δ为数据点与密度比所述数据点高的最近数据点的距离,数据点i的高密度距离具体为:
具体地,根据样本矩阵和预设距离dc,计算每个数据点的局部密度ρ。其中dc是预先设定的一个距离,局部密度ρ为一定距离内数据点的数量,对于数据点i,其局部密度具体通过式(13)获取。高密度距离δ指该数据点与密度比它高的最近数据点的距离,对于数据点i,其高密度距离通过式(14)获取。
决策图的横坐标为局部密度ρ,纵坐标为高密度距离δ,由于不同的类总是被稀疏的区域分隔开,若将一个类中密度最高的点视为类中心,类中心则会具有较高的局部密度值以及较高的高密度距离,因此可从决策图中选取具有较高的局部密度ρ和较高的高密度距离δ的点作为初始聚类中心。
为了说明上述实施例,图2为本发明另一实施例提供的识别动态调整区间的方法的流程示意图。本实例选择国内某炼油厂240万吨/年加氢裂化反应系统为研究对象,通过在加氢裂化流程现场提取了162个位号的数据,结合专家经验与基于遗传算法的粗糙集属性约简后,得到表征加氢裂化流程动态调整过程的21个运行参数,包括:加氢裂化流程入口流量、加氢精制反应器与加氢裂化反应器各床层温度、冷低分油流量、热低分油流量、脱硫化氢汽提塔和分馏塔的塔顶温度与塔顶压力、分馏塔的中段回流量以及轻石脑油、重石脑油、航空煤油、柴油和尾油的抽出量。
在数据采集过程中,该加氢裂化流程正好进行了一次负荷调整,为此选取此次调整的数据作为分析的数据样本。数据采集的时间为2016年2月12日至2016年2月13号,每5分钟采集一个样本,共采集到288组对应于不同时间点的数据。如图2所示,该方法包括以下步骤:
步骤1,对加氢裂化流程的运行参数数据预处理
根据上述式(1)和(2),其中J=21,共21组数据,得到经预处理后的运行参数的数据矩阵X。图3为本发明实施例提供的预处理后的运行参数的变化曲线图,上述21个运行参数变化如图3所示。
步骤2,对预处理后的数据矩阵X进行主成分分析(PCA)
首先根据上述步骤1获取的数据矩阵X,再设定Pe%=95%,根据上式(3)和(4),经过计算得到选取的特征值的个数m=9,所选取的特征值如下表1所示。
表1主成分对应的特征值
最后取复合矩阵P的前9列Pm,则获取的主成分数据矩阵具体为:Qm=XPm。因此通过主成分分析能够获取9个主成分数据。
步骤3,采用中值滤波对主成分数据进行滤波去噪
具体地,采用滑动窗口为L=36的中值滤波对主成分数据进行滤波去噪,从而消除加氢裂化流程仪表检测时,数据在传输过程中受到的干扰。具体计算过程参考式(5)和(6),得到主成分数据在采样区间的中值滤波序列。
步骤4,对去噪后的主成分数据进行拟合
具体地,根据式(7)至(12),采用多项式最小二乘法进行拟合。图4为本发明实施例提供的三个主成分数据拟合前和拟合后的变化曲线图,如图4所示,经过拟合后的主成分数据变化的曲线较为光滑,消除了原始数据测量中的随机误差,保持了主成分数据变化趋势的走向。
在获取了拟合曲线后,对拟合曲线中各时间点对应的回归值求取一阶导数。
步骤5,对一阶导数数据进行聚类处理
具体地,基于各采样点的一阶导数作为聚类特征,利用基于密度峰值的K-means聚类算法进行聚类。图5为本发明实施例提供的基于密度峰值的K-means聚类算法的流程图,如图5所示,具体步骤如下:
首先设定聚类数K=2,将导数分为零类和非零类;设定预设距离dc,计算每个数据点的局部密度ρ和高密度距离δ,其中,局部密度和高密度距离的计算参考上式(13)和(14);根据局部密度和高密度距离获取决策图,图6为本发明实施例提供的基于密度峰值的K-means聚类算法获取初始聚类中心的决策图,如图6所示,选择具有较高局部密度值以及较高的高密度距离的样本点作为初始聚类中心;分别计算样本点到聚类中心的距离,对样本进行分类后更新聚类中心,判断聚类中心是否收敛,若收敛则聚类完成;否则重复计算样本点到聚类中心的距离以及更新聚类中心,直到聚类中心收敛。
图7为本发明实施例提供的加氢裂化反应的动态调整区间的示意图。如图7所示,其横坐标为样本序列,纵坐标为聚类结果,其中纵坐标为1表示稳态过程,纵坐标为2表示动态调整过程,不同的样本序列对应不同的时间点,因此,通过上述步骤1~5能够对加氢裂化反应的动态调整区间进行有效的识别。
图8为本发明实施例提供的识别工业过程动态调整区间的装置的结构示意图,如图8所示,包括:第一获取模块801,用于根据一段时间内的运行参数的采样点,通过主成分分析法获取所述运行参数的主成分数据;第二获取模块802,用于对所述主成分数据进行滤波和拟合处理,获取拟合曲线;第三获取模块803,用于根据所述拟合曲线,通过聚类处理获取对应非零导数的时间点所组成的动态调整区间。
具体地,第一获取模块801可以首先对工业工程的多个运行参数进行采集,然后使用主成分分析方法对多个运行参数进行处理,得到数量与运行参数相比减少的主成分数据。
具体地,第二获取模块802可以对第一获取模块801获取的主成分数据进行滤波和拟合处理,获取拟合曲线。通过将滤波、拟合后得到的对应回归值代替原采集数据,能够消除原始数据采集过程中的随机误差,并保持主成分数据变化的趋势不发生变化。
具体地,第三获取模块803根据第二获取模块802获取的拟合曲线;第三获取模块803对该曲线上各时间点的导数进行聚类处理,获得属于非零类导数所对应的时间点,该时间点组成的区间为动态调整区间。
本发明实施例提供的识别工业过程动态调整区间的装置,通过主成分分析和聚类处理可实现具有较多运行参数的复杂工业过程动态调整区间获取,避免单个或几个运行参数测量误差的影响,准确、有效地识别动态调整区间,不依赖先验知识,具有工业适用性。
本发明实施例提供的识别工业过程动态调整区间的方法和装置,针对工业系统内部变量维度高、耦合强的特点采用主成分分析方法提取工业系统关键操作参数的主成分数据,消除系统中冗余变量及各变量间随机噪声的影响;再基于带滑动窗口的多项式拟合方法拟合主成分数据,接着提取拟合数据的一阶导数作为聚类特征,设计基于密度峰值确定聚类初始点的K-means算法,进行聚类分析,从而识别出工业系统动态调整区间。通过我国某石化企业实际生产数据验证表明,本发明实施例提供的方法和装置可以避免单个或几个运行变量测量误差的影响,有效识别动态调整过程,且采用聚类方法不依赖先验知识,具有工业适用性。
最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。
Claims (7)
1.一种识别工业过程动态调整区间的方法,其特征在于,包括:
S1,根据一段时间内的运行参数的采样点,通过主成分分析法获取所述运行参数的主成分数据;
S2,对所述主成分数据进行滤波和拟合处理,获取拟合曲线;
S3,根据所述拟合曲线,通过聚类处理获取对应非零导数的时间点所组成的动态调整区间。
2.根据权利要求1所述的方法,其特征在于,所述步骤S1进一步包括:
根据经过标准化处理的所述运行参数获取数据矩阵,根据所述数据矩阵利用累积方差贡献率获取所述主成分数据的个数;
根据所述主成分数据的个数和所述数据矩阵获取所述主成分数据。
3.根据权利要求1所述的方法,其特征在于,所述步骤S2包括:
通过带滑动窗口的中值滤波对所述主成分数据进行滤波处理,获取去噪后的主成分数据;
通过多项式最小二乘法对所述去噪后的主成分数据进行拟合,获取所述拟合曲线。
4.根据权利要求1所述的方法,其特征在于,所述步骤S3中的通过聚类处理获取对应非零导数的时间点包括:
根据所述拟合曲线获取所述采样点对应的一阶导数以及以所述一阶导数为样本点的样本矩阵;
根据所述样本矩阵,设定零类和非零类,通过基于密度峰值的K-means算法获取初始聚类中心;
根据所述初始聚类中心,通过计算所述样本点至聚类中心的距离进行分类,获取属于非零类的一阶导数对应的时间点。
5.根据权利要求4所述的方法,其特征在于,所述通过基于密度峰值的K-means算法获取初始聚类中心包括:
根据所述样本矩阵和预设距离,获取局部密度和高密度距离;
根据所述局部密度和所述高密度距离获取决策图,并根据所述决策图获取所述初始聚类中心。
6.根据权利要求5所述的方法,其特征在于,所述局部密度ρ为所述预设距离内数据点的个数,具体为:
ρ=Σjχ(dij-dc);
其中,dc为所述预设距离,dij为数据点i和数据点j之间的距离;当x<0时,χ(x)=1,当x≥0时,χ(x)=0;
所述高密度距离δ为数据点与密度比所述数据点高的最近数据点的距离,数据点i的高密度距离具体为:
7.一种识别工业过程动态调整区间的装置,其特征在于,包括:
第一获取模块,用于根据一段时间内的运行参数的采样点,通过主成分分析法获取所述运行参数的主成分数据;
第二获取模块,用于对所述主成分数据进行滤波和拟合处理,获取拟合曲线;
第三获取模块,用于根据所述拟合曲线,通过聚类处理获取对应非零导数的时间点所组成的动态调整区间。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710255414.2A CN106933211B (zh) | 2017-04-18 | 2017-04-18 | 一种识别工业过程动态调整区间的方法和装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710255414.2A CN106933211B (zh) | 2017-04-18 | 2017-04-18 | 一种识别工业过程动态调整区间的方法和装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN106933211A true CN106933211A (zh) | 2017-07-07 |
CN106933211B CN106933211B (zh) | 2019-04-09 |
Family
ID=59436839
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201710255414.2A Active CN106933211B (zh) | 2017-04-18 | 2017-04-18 | 一种识别工业过程动态调整区间的方法和装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN106933211B (zh) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108664000A (zh) * | 2018-03-26 | 2018-10-16 | 中南大学 | 一种氧化铝生产蒸发过程稳态检测方法及系统 |
CN108776831A (zh) * | 2018-05-15 | 2018-11-09 | 中南大学 | 一种基于动态卷积神经网络的复杂工业过程数据建模方法 |
CN108983058A (zh) * | 2018-08-29 | 2018-12-11 | 三峡大学 | 基于改进的变分模态和奇异值分解的变压器局部放电特高频信号去噪方法 |
CN110889431A (zh) * | 2019-10-28 | 2020-03-17 | 杭州电子科技大学 | 基于K-Means算法改进的高频职业技能生命曲线聚类方法 |
CN115170820A (zh) * | 2022-05-13 | 2022-10-11 | 中铁西北科学研究院有限公司 | 一种应用于数据曲线过渡阶段的特征提取及界限识别方法 |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20080177513A1 (en) * | 2007-01-04 | 2008-07-24 | Fisher-Rosemount Systems, Inc. | Method and System for Modeling Behavior in a Process Plant |
CN104751253A (zh) * | 2015-04-23 | 2015-07-01 | 国家电网公司 | 基于b-样条基底展开曲线聚类的配电网潮流预测方法 |
CN105389648A (zh) * | 2015-10-21 | 2016-03-09 | 南京富岛信息工程有限公司 | 一种常减压装置稳态工况的判别方法 |
CN105492982A (zh) * | 2013-06-07 | 2016-04-13 | 科学设计公司 | 用于监控工艺的系统及方法 |
US20160246185A1 (en) * | 2013-10-02 | 2016-08-25 | Asml Netherlands B.V. | Methods and apparatus for obtaining diagnostic information relating to an industrial process |
CN105975756A (zh) * | 2016-04-28 | 2016-09-28 | 彩虹无线(北京)新技术有限公司 | 一种基于车辆行驶数据的急转弯行为识别方法 |
CN106089328A (zh) * | 2016-08-10 | 2016-11-09 | 西安热工研究院有限公司 | 基于dcs数据挖掘的汽轮机调门流量特性曲线辨识方法 |
CN106127594A (zh) * | 2016-06-30 | 2016-11-16 | 武汉斗鱼网络科技有限公司 | 基于主成分分析的用户房间兴趣度计算方法及系统 |
-
2017
- 2017-04-18 CN CN201710255414.2A patent/CN106933211B/zh active Active
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20080177513A1 (en) * | 2007-01-04 | 2008-07-24 | Fisher-Rosemount Systems, Inc. | Method and System for Modeling Behavior in a Process Plant |
CN105492982A (zh) * | 2013-06-07 | 2016-04-13 | 科学设计公司 | 用于监控工艺的系统及方法 |
US20160246185A1 (en) * | 2013-10-02 | 2016-08-25 | Asml Netherlands B.V. | Methods and apparatus for obtaining diagnostic information relating to an industrial process |
CN104751253A (zh) * | 2015-04-23 | 2015-07-01 | 国家电网公司 | 基于b-样条基底展开曲线聚类的配电网潮流预测方法 |
CN105389648A (zh) * | 2015-10-21 | 2016-03-09 | 南京富岛信息工程有限公司 | 一种常减压装置稳态工况的判别方法 |
CN105975756A (zh) * | 2016-04-28 | 2016-09-28 | 彩虹无线(北京)新技术有限公司 | 一种基于车辆行驶数据的急转弯行为识别方法 |
CN106127594A (zh) * | 2016-06-30 | 2016-11-16 | 武汉斗鱼网络科技有限公司 | 基于主成分分析的用户房间兴趣度计算方法及系统 |
CN106089328A (zh) * | 2016-08-10 | 2016-11-09 | 西安热工研究院有限公司 | 基于dcs数据挖掘的汽轮机调门流量特性曲线辨识方法 |
Non-Patent Citations (1)
Title |
---|
季一丁: "多变量复杂系统的稳态检测和提取方法研究", 《中国优秀硕士学位论文全文数据库工程科技I辑》 * |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108664000A (zh) * | 2018-03-26 | 2018-10-16 | 中南大学 | 一种氧化铝生产蒸发过程稳态检测方法及系统 |
CN108776831A (zh) * | 2018-05-15 | 2018-11-09 | 中南大学 | 一种基于动态卷积神经网络的复杂工业过程数据建模方法 |
CN108983058A (zh) * | 2018-08-29 | 2018-12-11 | 三峡大学 | 基于改进的变分模态和奇异值分解的变压器局部放电特高频信号去噪方法 |
CN108983058B (zh) * | 2018-08-29 | 2021-03-23 | 三峡大学 | 基于改进的变分模态和奇异值分解的变压器局部放电特高频信号去噪方法 |
CN110889431A (zh) * | 2019-10-28 | 2020-03-17 | 杭州电子科技大学 | 基于K-Means算法改进的高频职业技能生命曲线聚类方法 |
CN115170820A (zh) * | 2022-05-13 | 2022-10-11 | 中铁西北科学研究院有限公司 | 一种应用于数据曲线过渡阶段的特征提取及界限识别方法 |
Also Published As
Publication number | Publication date |
---|---|
CN106933211B (zh) | 2019-04-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN106933211A (zh) | 一种识别工业过程动态调整区间的方法和装置 | |
Yu et al. | MoniNet with concurrent analytics of temporal and spatial information for fault detection in industrial processes | |
CN111695626B (zh) | 基于混合采样与特征选择的高维度不平衡数据分类方法 | |
Odelson et al. | The autocovariance least-squares method for estimating covariances: application to model-based control of chemical reactors | |
CN109597968B (zh) | 基于smt大数据的锡膏印刷性能影响因素分析方法 | |
CN108762228A (zh) | 一种基于分布式pca的多工况故障监测方法 | |
CN111046341A (zh) | 一种基于主成分分析的非常规天然气压裂效果评价及产能预测方法 | |
CN106845796A (zh) | 一种加氢裂化流程产品质量在线预测方法 | |
CN105334185B (zh) | 基于光谱投影判别的近红外模型维护方法 | |
CN110765587A (zh) | 基于动态正则化判别局部保留投影的复杂石化过程故障诊断方法 | |
CN112749849A (zh) | 连续催化重整工艺过程关键参数的集成学习在线预测方法 | |
CN105955214A (zh) | 基于样本时序和近邻相似性信息的间歇过程故障检测方法 | |
CN105809203B (zh) | 一种基于层次聚类的系统稳态检测算法 | |
Liu et al. | Unsupervised flight phase recognition with flight data clustering based on GMM | |
CN108537249B (zh) | 一种密度峰值聚类的工业过程数据聚类方法 | |
CN109408498B (zh) | 基于特征矩阵决策树的时间序列特征识别与分解方法 | |
Feremans et al. | A framework for pattern mining and anomaly detection in multi-dimensional time series and event logs | |
CN114861800A (zh) | 模型训练方法、概率确定方法、装置、设备、介质及产品 | |
Ng et al. | Economic and economic-statistical designs of multivariate coefficient of variation chart | |
Cai et al. | Process fault detection method based on time structure independent component analysis and one-class support vector machine | |
Yuan et al. | Fuzzy C-means cluster based on local weighted principal component regression for soft sensor of an industrial hydrocracking process | |
Zhang et al. | An OPTICS clustering-based anomalous data filtering algorithm for condition monitoring of power equipment | |
Ji et al. | Dynamic Process Monitoring Based on Integrated Statistic of Principal Component Analysis and Slow Feature Analysis | |
CN117556202B (zh) | 基于概率相关慢特征分析的工业过程微小故障检测方法 | |
CN110377003B (zh) | 一种基于稀疏化变量贡献的多回路性能诊断方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |