CN108563913A - 一种多晶硅还原炉还原过程能耗预测方法、系统 - Google Patents
一种多晶硅还原炉还原过程能耗预测方法、系统 Download PDFInfo
- Publication number
- CN108563913A CN108563913A CN201810529750.6A CN201810529750A CN108563913A CN 108563913 A CN108563913 A CN 108563913A CN 201810529750 A CN201810529750 A CN 201810529750A CN 108563913 A CN108563913 A CN 108563913A
- Authority
- CN
- China
- Prior art keywords
- energy consumption
- period
- predicted
- polycrystalline silicon
- evidence
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F30/00—Computer-aided design [CAD]
- G06F30/20—Design optimisation, verification or simulation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2411—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on the proximity to a decision surface, e.g. support vector machines
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Physics & Mathematics (AREA)
- Evolutionary Computation (AREA)
- General Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Economics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Artificial Intelligence (AREA)
- Strategic Management (AREA)
- Life Sciences & Earth Sciences (AREA)
- Human Resources & Organizations (AREA)
- Geometry (AREA)
- Game Theory and Decision Science (AREA)
- Development Economics (AREA)
- Computer Hardware Design (AREA)
- Entrepreneurship & Innovation (AREA)
- Marketing (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Tourism & Hospitality (AREA)
- General Business, Economics & Management (AREA)
- Silicon Compounds (AREA)
Abstract
本发明公开了一种多晶硅还原炉还原过程能耗预测方法、系统,步骤一,由相似时段的能耗历史数据构建成训练样本和测试样本,步骤二,建立LS‑SVM算法的目标函数;步骤三,训练出能耗预测模型;步骤四,进行还原过程能耗预测。基于D‑S融合LS‑SVM算法即综合了D‑S和LS‑SVM的优点又避免了二者的一些不足。一方面,用选出的相似时段能耗数据作为LS‑SVM的训练样本,克服了LS‑SVM算法的噪音干扰。另一方面,利用LS‑SVM的原理,可以很好的实现复杂的映射,获得能耗曲线的规律。
Description
技术领域
本发明涉及多晶硅还原建模领域,尤其涉及一种多晶硅还原炉还原过程能耗预测方法、系统。
背景技术
多晶硅还原炉是多晶硅制备最耗能的设备,多晶硅沉积过程中每天都要消耗大量的电能,多晶硅还原炉的还原沉积生产过程是封闭的,不确定性的。在改良西门子法制备多晶硅工艺中,还原炉电源系统为硅棒自身电阻性发热提供能量,维持炉内发热表面温度于1100℃附近,SiHCl3和H2在硅杆表面发生持续性的气相沉积反应不断地沉积成晶体硅。晶体硅在生产过程中,硅棒直径从细变粗,电阻逐渐变小,所以要调节电源系统所供给的功率以满足还原炉中硅棒表面的热量需求。因此,还原沉积过程其能耗是随直径的变化而动态变化的,其整个生产过程的能耗曲线受还原炉结构型式、工艺运行参数等多重因素影响,其能耗每时每刻都在变化,在生产过程中很难确定下一时刻的能耗情况,这种复杂的生产过程给工艺人员的可控管理带来了极大的困难。
发明内容
本发明的目的在于提出一种避免LS-SVM算法的噪音干扰,预测精度高的多晶硅还原炉还原过程能耗预测方法、系统。
为达此目的,本发明采用以下技术方案:
一种多晶硅还原炉还原过程能耗预测方法,包括以下步骤:
步骤一,采集多晶硅还原炉的能耗历史数据,然后上位机通过D-S理论证据筛选出与待预测时段差异度最小的相似时段,由相似时段的能耗历史数据构建成训练样本和测试样本;步骤二,根据多晶硅还原炉的生产经验,确定LS-SVM算法的可调参数C和标准化参数σ,建立LS-SVM算法的目标函数;步骤三,上位机利用LS-SVM算法,通过训练样本和测试样本训练出能耗预测模型;步骤四,上位机通过能耗预测模型对生产中的多晶硅还原炉的待预测时段进行还原过程能耗预测。
优选地,定义多晶硅还原炉的生产周期为120小时,所述待预测时段为生产中的多晶硅还原炉的第二天,所述相似时段为在历史生产周期中与待预测时段所处位置相同的时间段,所述待预测时段的位置为待预测时段在当前生产周期内的位置;所述D-S理论证据筛选出与待预测时段差异度最小的相似时段为:
首先,选取炉内温度和炉内压力设置相同的能耗历史数据,并以该能耗历史数据中的三个因子:生产数据时间间隔、三氯氢硅消耗量和氢气消耗量构造出两个证据;然后,计算各个证据的识别框架中的基本信度;最后,根据D-S理论证据合成规则筛选出与待预测时段差异度最小的相似时段;其中,参与选取的能耗历史数据评判为好、中、差三个等级,依次用A、B、C表示,并把{A,B,C}称为识别框架的焦元。
优选地,所述计算各个证据的识别框架中的基本信度为:
首先,将生产数据时间间隔作为第一证据,则第一证据的信度分配m1如下:
t1为参与选取的能耗历史数据所在的历史时间段与待预测时段的月份间隔值;然后,对三氯氢硅消耗量和氢气消耗量进行量化处理:若待预测时段处在的第i天的三氯氢硅消耗量为Si,第i天三氯氢硅消耗量范围为Simax到Simin,则三氯氢硅消耗量可量化为从而把待预测时段三氯氢硅消耗量化到[0,1];若待预测时段处在的第i天的氢气消耗量为Hi,第i天氢气消耗量范围为Him a到Himin,则氢气消耗量可量化为从而把待预测时段氢气消耗量化到[0,1];接着,计算出每一个因子在不同的历史时间段与待预测时间段之间的差值t2,将所述差值t2作为第二证据,则所述第二证据的信度分配m2如下:
当t2>0.9时,m2(A)=0.05,m2(B)=0.13,m2(C)=0.82;当t2<0.1时,m2(A)=0.82,m2(B)=0.13,m2(C)=0.05;当0.1≤t2≤0.9时,
优选地,所述D-S理论证据合成规则为:定义Bel1、Bel2为某识别框架上基于两个互不相干的信度函数,设焦元分别为A1,A2,...,Ak和B1,B2,...,Bk,设则:
其中,系数是规范因子,第一证据和第二证据可合成的前提是满足不等式K<ε,ε=7。
优选地,所述建立LS-SVM算法的目标函数为:利用LS-SVM算法,将能耗预测模型的映射表示为:y=f(x)=w·φ(x)+b,其中w为权向量,b是偏向项,φ(x)是将相似时段的能耗历史数据映射到高维空间的核空间映射函数;优化目标:s.t.y=wTφ(xi)+b+ei,i=1,2,…,N,其中,C是可调参数,ei是残差,e∈Rl×1是训练误差;然后,构造拉格朗日函数:
αi为拉格朗日乘子,从而得到α和b;则确定所述可调参数C和标准化参数σ后,所述目标函数为:其中,(xi,xj)=φ(xi)Tφ(xj),k(xi,xj)=exp(-||xi-xj||2/2σ2)。
优选地,还包括步骤五:通过相对误差γ对能耗预测模型进行性能评价,
为第i个样本的预测值,yi为第i个样本的实际值;当γ趋于零的极限时,能耗预测模型的性能符合要求;当能耗预测模型的性能不符合要求时,重新筛选出相似时段,并重新训练能耗预测模型。
优选地,一种多晶硅还原炉还原过程能耗预测系统,包括多晶硅还原炉、上位机和数据采集器,所述数据采集器用于采集多晶硅还原炉的能耗历史数据并发送至上位机,所述上位机包括:
时段筛选模块,用于通过D-S理论证据筛选出与待预测时段差异度最小的相似时段,由相似时段的能耗历史数据构建成训练样本和测试样本;目标函数构建模块,用于根据多晶硅还原炉的生产经验,确定LS-SVM算法的可调参数C和标准化参数σ,建立LS-SVM算法的目标函数;模型生成模块,用于利用LS-SVM算法,通过训练样本和测试样本训练出能耗预测模型;预测模块,用于通过能耗预测模型对生产中的多晶硅还原炉的待预测时段进行还原过程能耗预测。
优选地,定义多晶硅还原炉的生产周期为120小时,所述待预测时段为生产中的多晶硅还原炉的第二天,所述相似时段为在历史生产周期中与待预测时段所处位置相同的时间段,所述待预测时段的位置为待预测时段在当前生产周期内的位置;所述时段筛选模块具体用于:首先,选取炉内温度和炉内压力设置相同的能耗历史数据,并以该能耗历史数据中的三个因子:生产数据时间间隔、三氯氢硅消耗量和氢气消耗量构造出两个证据;然后,计算各个证据的识别框架中的基本信度;最后,根据D-S理论证据合成规则筛选出与待预测时段差异度最小的相似时段,由相似时段的能耗历史数据构建成训练样本和测试样本;其中,参与选取的能耗历史数据评判为好、中、差三个等级,依次用A、B、C表示,并把{A,B,C}称为识别框架的焦元。
优选地,所述时段筛选模块计算各个证据的识别框架中的基本信度为:
首先,将生产数据时间间隔作为第一证据,则第一证据的信度分配m1如下:
t1为参与选取的能耗历史数据所在的历史时间段与待预测时段的月份间隔值;然后,对三氯氢硅消耗量和氢气消耗量进行量化处理:若待预测时段处在的第i天的三氯氢硅消耗量为Si,第i天三氯氢硅消耗量范围为Simax到Simin,则三氯氢硅消耗量可量化为从而把待预测时段三氯氢硅消耗量化到[0,1];若待预测时段处在的第i天的氢气消耗量为Hi,第i天氢气消耗量范围为Him a到Himin,则氢气消耗量可量化为从而把待预测时段氢气消耗量化到[0,1];接着,计算出每一个因子在不同的历史时间段与待预测时间段之间的差值t2,将所述差值t2作为第二证据,则所述第二证据的信度分配m2如下:
当t2>0.9时,m2(A)=0.05,m2(B)=0.13,m2(C)=0.82;当t2<0.1时,m2(A)=0.82,m2(B)=0.13,m2(C)=0.05;当0.1≤t2≤0.9时,
所述D-S理论证据合成规则为:
定义Bel1、Bel2为某识别框架上基于两个互不相干的信度函数,设焦元分别为A1,A2,...,Ak和B1,B2,...,Bk,设则:
其中,系数是规范因子,第一证据和第二证据可合成的前提是满足不等式K<ε,ε=7。
优选地,所述目标函数构建模块具体为:利用LS-SVM算法,将能耗预测模型的映射表示为:y=f(x)=w·φ(x)+b,其中w为权向量,b是偏向项,φ(x)是将相似时段的能耗历史数据映射到高维空间的核空间映射函数;优化目标:s.t.y=wTφ(xi)+b+ei,i=1,2,…,N,其中,C是可调参数,ei是残差,e∈Rl×1是训练误差;然后,构造拉格朗日函数:
αi为拉格朗日乘子,从而得到α和b;则确定所述可调参数C和标准化参数σ后,所述目标函数为:其中,(xi,xj)=φ(xi)Tφ(xj),k(xi,xj)=exp(-||xi-xj||2/2σ2);
还包括性能评价模块,用于通过相对误差γ对能耗预测模型进行性能评价:
为第i个样本的预测值,yi为第i个样本的实际值;
当γ趋于零的极限时,能耗预测模型的性能符合要求;当能耗预测模型的性能不符合要求时,重新筛选出相似时段,并重新训练能耗预测模型。
所述多晶硅还原炉还原过程能耗预测方法,基于D-S融合LS-SVM算法即综合了D-S和LS-SVM的优点又避免了二者的一些不足。一方面,用选出的相似时段能耗数据作为LS-SVM的训练样本,克服了LS-SVM算法的噪音干扰。另一方面,利用LS-SVM的原理,可以很好的实现复杂的映射,获得能耗曲线的规律。
附图说明
附图对本发明做进一步说明,但附图中的内容不构成对本发明的任何限制。
图1是本发明其中一个实施例的系统结构示意图;
图2是本发明其中一个实施例的A信度分配图;
图3是本发明其中一个实施例的B信度分配图;
图4(a)是本发明其中一个实施例的24对棒多晶硅还原炉立体结构图;
图4(b)是本发明其中一个实施例的24对棒多晶硅还原炉俯视图;
图5是本发明其中一个实施例的训练集能耗预测效果图;
图6是本发明其中一个实施例的测试集能耗预测效果图;
图7是本发明其中一个实施例的能耗预测对比图。
其中:多晶硅还原炉1;上位机2;数据采集器3。
具体实施方式
下面结合附图并通过具体实施方式来进一步说明本发明的技术方案。
实施例一
本实施例的多晶硅还原炉还原过程能耗预测方法,包括以下步骤:
步骤一,如图1所示,采集多晶硅还原炉1的能耗历史数据,然后上位机2通过D-S理论证据筛选出与待预测时段差异度最小的相似时段,由相似时段的能耗历史数据构建成训练样本和测试样本;
步骤二,根据多晶硅还原炉1的生产经验,确定LS-SVM算法的可调参数C和标准化参数σ,建立LS-SVM算法的目标函数;
步骤三,上位机2利用LS-SVM算法,通过训练样本和测试样本训练出能耗预测模型;
步骤四,上位机2通过能耗预测模型对生产中的多晶硅还原炉1的待预测时段进行还原过程能耗预测。
所述多晶硅还原炉还原过程能耗预测方法,基于D-S融合LS-SVM算法即综合了D-S和LS-SVM的优点又避免了二者的一些不足。一方面,用选出的相似时段能耗数据作为LS-SVM的训练样本,克服了LS-SVM算法的噪音干扰。另一方面,利用LS-SVM的原理,可以很好的实现复杂的映射,获得能耗曲线的规律。
还原炉内的热量损失主要是辐射散热和气体换热,化学反应热只占极少一部分。三氯氢硅和氢气的进料量对沉积过程的换热量影响较大,其进料曲线影响沉积过程的能耗。通过所述能耗预测模型把运行中的多晶硅还原炉1待预测时段的电耗情况预测出来,使生产管理人员能够提前得知多晶硅还原炉1的能耗情况,实现对能耗情况的跟踪。不但可以验证工艺员在还原沉积时的操作是否规范,而且有助于保障还原生产的稳定性和可靠性。
多晶硅还原炉1的沉积生产过程是连续性过程,每炉次的生产周期为生产周期为120小时,因此,多晶硅还原炉1的能耗具备周期相似性,因此可以找出与待预测时段相似的能耗历史数据,以提高预测的可靠性。使用D-S理论证据选取与待预测时段相似的能耗历史数据,把选出的与待预测时段相似的能耗历史数据时间段定义为相似时段。再用LS-SVM算法即最小二乘支持向量机训练相似时段的数据,构建基于D-S和LS-SVM的能耗预测模型。在此基础上对多晶硅还原炉1待预测时段的能耗曲线进行预测,从而提前预知生产中的多晶硅还原炉1待预测时段的能耗情况。
优选地,定义多晶硅还原炉1的生产周期为120小时,所述待预测时段为生产中的多晶硅还原炉1的第二天,所述相似时段为在历史生产周期中与待预测时段所处位置相同的时间段,所述待预测时段的位置为待预测时段在当前生产周期内的位置;
所述D-S理论证据筛选出与待预测时段差异度最小的相似时段为:
首先,选取炉内温度和炉内压力设置相同的能耗历史数据,并以该能耗历史数据中的三个因子:生产数据时间间隔、三氯氢硅消耗量和氢气消耗量构造出两个证据;
然后,计算各个证据的识别框架中的基本信度;
最后,根据D-S理论证据合成规则筛选出与待预测时段差异度最小的相似时段;
其中,参与选取的能耗历史数据评判为好、中、差三个等级,依次用A、B、C表示,并把{A,B,C}称为识别框架的焦元。
由于多种能耗影响因素的不同而导致的待预测时间段(通常为一个生产周期某整天的24h)和历史生产周期中的同一时间段(相对于120h左右的周期来说,与预测时间段所处的位置相近)的差异程度。通过计算相似度,得到差异小的能耗历史数据。所述待预测时段为生产中的多晶硅还原炉1的第二天,所述相似时段为从历史数据中选出的与待预测时段24小时相似的24小时时间段,而不是称为相似日。这是因为还原炉的每个生产周期的开始时间不一定相同。例如多晶硅还原炉1在7月份的第1炉次是7月2日8点开始的,而第2炉次是7月8日12点开始的。对于7月9日全天的24小时而言,若从上一炉次找相同位置时间段,其相同位置的时间段并不是7月3日的24小时,而是7月2日20点至7月3日20点这24小时。这是从还原生产周期来看的,与日期无关。
使用D-S理论证据对与多晶硅还原炉1能耗相关的各个因子进行融合,综合各个因子对能耗的影响,通过计算相似度,得到差异最小的能耗历史数据。所述生产数据时间间隔为待预测时段所在的生产周期与历史生产周期的时间间隔,时间间隔以月为最低度量;多晶硅还原炉1的使用时间过长对设备性能差异化也有一定影响,继而影响多晶硅还原炉1沉积过程的能耗,时间相隔越近的炉次,多晶硅还原炉1设备使用性能的差异越小。多晶硅还原炉1在生产时的操作参数对能耗有影响,即工艺参数也是能耗影响因素,尤其对动态沉积过程而言,主要用到的工艺参数因素为三氯氢硅消耗量和氢气消耗量。
在D-S理论证据中,(1)识别框架为针对要进行判决的命题,用集合U表示认识到的所有情况,集合U就是所谓的识别框架。用框架里的最小焦元组成的信团表示所研究的问题。当识别框架中最小焦元存为n个,则存在2n种信度。
(2)基本信度分配m:如果集函数m:2n→[0,1](是所定义的U的幂)存在:m(φ)=0和时,则把m称为识别框架U上基本信度分配。
(3)对于识别框架U,m:2n→[0,1]是其基本概率赋值,定义U上的信任函数Bel:2U→[0,1];表示A的所有子元的可能性度量的综合,表示对A的总信度,且有:Bel(φ)=0,Bel(U)=1。
(4)存在A是U的子集,具有m(A)>0,则把A叫作信任函数Bel的焦元,全部焦元的并称为核。
优选地,所述计算各个证据的识别框架中的基本信度为:
首先,将生产数据时间间隔作为第一证据,则第一证据的信度分配m1如下:
t1为参与选取的能耗历史数据所在的历史时间段与待预测时段的月份间隔值;依据以上信度分配公式,对能耗历史数据与待预测时段之间的月份间隔,其信度分配结果如下表1所示:
表1
然后,对三氯氢硅消耗量和氢气消耗量进行量化处理:若待预测时段处在的第i天的三氯氢硅消耗量为Si,第i天三氯氢硅消耗量范围为Simax到Simin,则三氯氢硅消耗量可量化为从而把待预测时段三氯氢硅消耗量化到[0,1];
若待预测时段处在的第i天的氢气消耗量为Hi,第i天氢气消耗量范围为Himax到Himin,则氢气消耗量可量化为从而把待预测时段氢气消耗量化到[0,1];
接着,计算出每一个因子在不同的历史时间段与待预测时间段之间的差值t2,将所述差值t2作为第二证据,则所述第二证据的信度分配m2如下:
当t2>0.9时,m2(A)=0.05,m2(B)=0.13,m2(C)=0.82;
当t2<0.1时,m2(A)=0.82,m2(B)=0.13,m2(C)=0.05;
当0.1≤t2≤0.9时,
工艺参数也是能耗影响因素,尤其是对于还原炉动态沉积过程,需考虑生产过程中动态变化的工艺参数,主要工艺参数因素为三氯氢硅消耗量、氢气消耗量和硅棒直径,前两个因素需要进行量化处理。
将不同历史时间段与待预测时间段之间的因数求差,信度分配如表2所示:
表2
优选地,所述D-S理论证据合成规则为:
定义Bel1、Bel2为某识别框架上基于两个互不相干的信度函数,设焦元分别为A1,A2,...,Ak和B1,B2,...,Bk,设则:
其中,系数是规范因子,第一证据和第二证据可合成的前提是满足不等式K<ε,ε=7。
证据的协同作用能通过D-S理论证据合成规则体现出来,对于某一框架上基于相异证据的信度函数可通过D-S理论证据合成规则得到。D-S理论证据合成规则给出了合成两个证据的方法。设m1和m2是2U上的两个独立的信度分配:如图2、图3所示,[0,1]中的任意—段代表由各自的基本信度分配m决定的某一焦元上的基本信度值。给定若有Ai∩Bj=A,那么m1(Ai)m2(Bj)就是分配到A上的一部分基本信度值,分配到A上的总信度值为:需在每一基本信度值上乘一因子K,以使总的基本信度值为1,称为归一法。其中K是归一化常数:
冲突值体现出不同证据之间的矛盾;若K1≠1,则m确定一个信度分配;若K1=1,则m1和m2冲突,不能组合。当多个证据的组合时,可通过以上定义对它们进行一一组合。这里设定一个常量ε用来评判各个证据能否合成,体现了各个证据之间的矛盾大小。规范因子其值大于1,用来避免在合成时错误地将非空的概率赋值给空集,而损失一些信度造成总的基本信度值不为1的情况发生。
优选地,所述建立LS-SVM算法的目标函数为:利用LS-SVM算法,将能耗预测模型的映射表示为:y=f(x)=w·φ(x)+b,其中w为权向量,b是偏向项,φ(x)是将相似时段的能耗历史数据映射到高维空间的核空间映射函数;
优化目标:
s.t.y=wTφ(xi)+b+ei,i=1,2,…,N,
其中,C是可调参数,ei是残差,e∈Rl×1是训练误差;
然后,构造拉格朗日函数:
αi为拉格朗日乘子,由卡罗需-库恩-塔克条件对该拉格朗日函数求偏导可得:
将w,e消掉,则有:其中,EN=[1 1 1 … 1]T,从而得到α和b;则确定所述可调参数C和标准化参数σ后,所述目标函数为:
其中,(xi,xj)=φ(xi)Tφ(xj),k(xi,xj)=exp(-||xi-xj||2/2σ2)。
最小二乘支持向量机即LS-SVM是支持向量机(SVM)的改良版,SVM是基于求解一组二次规划问题的;而LS-SVM是基于使用线性规划方法求解一组线性方程,从而进一步提高了LS-SVM方法的可靠性和效率。
优选地,还包括步骤五:通过相对误差γ对能耗预测模型进行性能评价,
为第i个样本的预测值,yi为第i个样本的实际值;当γ趋于零的极限时,能耗预测模型的性能符合要求;当能耗预测模型的性能不符合要求时,重新筛选出相似时段,并重新训练能耗预测模型。
实施例二
本实施例选取24对棒多晶硅还原炉2017年4月至7月期间的生产能耗数据作为样本数据,测试数据是8月份的第一炉生产过程中第二天的能耗数据。利用D-S理论证据从预测当天之前的能耗历史数据中选出相似度最高的一个相似时段。然后将这个相似时段共24h每个小时段的三氯氢硅进料量、氢气进料量、硅棒初始直径和能耗值作为训练样本,预测出2017年8月份第一个生产周期第二天24h的能耗情况,也就是预测还原炉沉积过程中某一整天的能耗曲线。
24对棒多晶硅还原炉,电极孔排布按3层同心排列,由内到外,电极孔对数分别为4、8和12,如图4(a)、图4(b)所示,每层电极孔中心距为230mm,还原炉硅棒表面温需要维持在1100℃(1373K)左右,还原炉内壁温度一般要保持在100℃(373K)。24对棒多晶硅还原炉每次生产时,其第二天24h的SiHCl3进料量和H2进料量已经根据经验结合已生产炉次的情况而提前确定。其第二天的硅棒直径可根据前一天的沉积速率确定,根据开炉实际,炉内硅棒的直径增长速度为1.2mm/h。从而根据前一天的炉内直径沉积情况结合沉积速率来确定第二天24h的炉内直径大小。根据24对棒多晶硅还原炉2017年8月份第一炉次在第二天的工艺参数,利用证据理论从近几个月的能耗历史数据中找相似时段,找出的相似时段的能耗与工艺参数部分样本数据如表3所示:
表3
将从近几个月的能耗历史数据通过D-S证据理论选取的相似度最高相似时段的能耗历史数据作为训练数据,依据经验选择σ=0.3,C=10。使用LS-SVM训练后,通过相对误差γ对能耗预测模型进行性能评价,结果如图5、6所示,能耗预测结果如下表4所示:
表4
由表4可知,所述多晶硅还原炉还原过程能耗预测方法的预测精度比较高,其相对误差基本在1%左右,平均只有0.925%。最小误差为0.27%,最大误差为2.37%,全部的误差都低于3%,充分表明可靠性。
对比实施例
本对比实施例选取实施例二中测试数据对应的上一生产周期同一时段位置的数据作为训练样本,然后用LS-SVM训练出预测模型对能耗进行预测,结果如图7所示,详细数据如下表5所示:
表5
由表5可知,LS-SVM最大误差为4.11%,最小误差为1.01%,LS-SVM的最小误差比D-S融合LS-SVM的平均误差还要大。所以加入D-S后的LS-SVM预测精度更高。
实施例三
本实施例的多晶硅还原炉还原过程能耗预测系统,包括多晶硅还原炉1、上位机2和数据采集器3,所述数据采集器3用于采集多晶硅还原炉1的能耗历史数据并发送至上位机2,如图1所示,所述上位机2包括:
时段筛选模块,用于通过D-S理论证据筛选出与待预测时段差异度最小的相似时段,由相似时段的能耗历史数据构建成训练样本和测试样本;
目标函数构建模块,用于根据多晶硅还原炉1的生产经验,确定LS-SVM算法的可调参数C和标准化参数σ,建立LS-SVM算法的目标函数;
模型生成模块,用于利用LS-SVM算法,通过训练样本和测试样本训练出能耗预测模型;
预测模块,用于通过能耗预测模型对生产中的多晶硅还原炉1的待预测时段进行还原过程能耗预测。
优选地,定义多晶硅还原炉1的生产周期为120小时,所述待预测时段为生产中的多晶硅还原炉1的第二天,所述相似时段为在历史生产周期中与待预测时段所处位置相同的时间段,所述待预测时段的位置为待预测时段在当前生产周期内的位置;
所述时段筛选模块具体用于:
首先,选取炉内温度和炉内压力设置相同的能耗历史数据,并以该能耗历史数据中的三个因子:生产数据时间间隔、三氯氢硅消耗量和氢气消耗量构造出两个证据;
然后,计算各个证据的识别框架中的基本信度;
最后,根据D-S理论证据合成规则筛选出与待预测时段差异度最小的相似时段,由相似时段的能耗历史数据构建成训练样本和测试样本;
其中,参与选取的能耗历史数据评判为好、中、差三个等级,依次用A、B、C表示,并把{A,B,C}称为识别框架的焦元。
优选地,,所述时段筛选模块计算各个证据的识别框架中的基本信度为:
首先,将生产数据时间间隔作为第一证据,则第一证据的信度分配m1如下:
t1为参与选取的能耗历史数据所在的历史时间段与待预测时段的月份间隔值;
然后,对三氯氢硅消耗量和氢气消耗量进行量化处理:
若待预测时段处在的第i天的三氯氢硅消耗量为Si,第i天三氯氢硅消耗量范围为Simax到Simin,则三氯氢硅消耗量可量化为从而把待预测时段三氯氢硅消耗量化到[0,1];
若待预测时段处在的第i天的氢气消耗量为Hi,第i天氢气消耗量范围为Himax到Himin,则氢气消耗量可量化为从而把待预测时段氢气消耗量化到[0,1];
接着,计算出每一个因子在不同的历史时间段与待预测时间段之间的差值t2,将所述差值t2作为第二证据,则所述第二证据的信度分配m2如下:
当t2>0.9时,m2(A)=0.05,m2(B)=0.13,m2(C)=0.82;
当t2<0.1时,m2(A)=0.82,m2(B)=0.13,m2(C)=0.05;
当0.1≤t2≤0.9时,
所述D-S理论证据合成规则为:
定义Bel1、Bel2为某识别框架上基于两个互不相干的信度函数,设焦元分别为A1,A2,...,Ak和B1,B2,...,Bk,设则:
其中,系数是规范因子,第一证据和第二证据可合成的前提是满足不等式K<ε,ε=7。
优选地,所述目标函数构建模块具体为:
利用LS-SVM算法,将能耗预测模型的映射表示为:y=f(x)=w·φ(x)+b,
其中w为权向量,b是偏向项,φ(x)是将相似时段的能耗历史数据映射到高维空间的核空间映射函数;
优化目标:
s.t.y=wTφ(xi)+b+ei,i=1,2,…,N,
其中,C是可调参数,ei是残差,e∈Rl×1是训练误差;
然后,构造拉格朗日函数:
αi为拉格朗日乘子,从而得到α和b;则确定所述可调参数C和标准化参数σ后,所述目标函数为:
其中,(xi,xj)=φ(xi)Tφ(xj),k(xi,xj)=exp(-||xi-xj||2/2σ2);
还包括性能评价模块,用于通过相对误差γ对能耗预测模型进行性能评价:
为第i个样本的预测值,yi为第i个样本的实际值;
当γ趋于零的极限时,能耗预测模型的性能符合要求;
当能耗预测模型的性能不符合要求时,重新筛选出相似时段,并重新训练能耗预测模型。
以上结合具体实施例描述了本发明的技术原理。这些描述只是为了解释本发明的原理,而不能以任何方式解释为对本发明保护范围的限制。基于此处的解释,本领域的技术人员不需要付出创造性的劳动即可联想到本发明的其它具体实施方式,这些方式都将落入本发明的保护范围之内。
Claims (10)
1.一种多晶硅还原炉还原过程能耗预测方法,其特征在于,包括以下步骤:
步骤一,采集多晶硅还原炉的能耗历史数据,然后上位机通过D-S理论证据筛选出与待预测时段差异度最小的相似时段,由相似时段的能耗历史数据构建成训练样本和测试样本;
步骤二,根据多晶硅还原炉的生产经验,确定LS-SVM算法的可调参数C和标准化参数σ,建立LS-SVM算法的目标函数;
步骤三,上位机利用LS-SVM算法,通过训练样本和测试样本训练出能耗预测模型;
步骤四,上位机通过能耗预测模型对生产中的多晶硅还原炉的待预测时段进行还原过程能耗预测。
2.根据权利要求1所述的多晶硅还原炉还原过程能耗预测方法,其特征在于:定义多晶硅还原炉的生产周期为120小时,所述待预测时段为生产中的多晶硅还原炉的第二天,所述相似时段为在历史生产周期中与待预测时段所处位置相同的时间段,所述待预测时段的位置为待预测时段在当前生产周期内的位置;
所述D-S理论证据筛选出与待预测时段差异度最小的相似时段为:
首先,选取炉内温度和炉内压力设置相同的能耗历史数据,并以该能耗历史数据中的三个因子:生产数据时间间隔、三氯氢硅消耗量和氢气消耗量构造出两个证据;
然后,计算各个证据的识别框架中的基本信度;
最后,根据D-S理论证据合成规则筛选出与待预测时段差异度最小的相似时段;
其中,参与选取的能耗历史数据评判为好、中、差三个等级,依次用A、B、C表示,并把{A,B,C}称为识别框架的焦元。
3.根据权利要求2所述的多晶硅还原炉还原过程能耗预测方法,其特征在于,所述计算各个证据的识别框架中的基本信度为:
首先,将生产数据时间间隔作为第一证据,则第一证据的信度分配m1如下:
t1为参与选取的能耗历史数据所在的历史时间段与待预测时段的月份间隔值;
然后,对三氯氢硅消耗量和氢气消耗量进行量化处理:
若待预测时段处在的第i天的三氯氢硅消耗量为Si,第i天三氯氢硅消耗量范围为Simax到Simin,则三氯氢硅消耗量可量化为从而把待预测时段三氯氢硅消耗量化到[0,1];
若待预测时段处在的第i天的氢气消耗量为Hi,第i天氢气消耗量范围为Himax到Himin,则氢气消耗量可量化为从而把待预测时段氢气消耗量化到[0,1];
接着,计算出每一个因子在不同的历史时间段与待预测时间段之间的差值t2,将所述差值t2作为第二证据,则所述第二证据的信度分配m2如下:
当t2>0.9时,m2(A)=0.05,m2(B)=0.13,m2(C)=0.82;
当t2<0.1时,m2(A)=0.82,m2(B)=0.13,m2(C)=0.05;
当0.1≤t2≤0.9时,
4.根据权利要求3所述的多晶硅还原炉还原过程能耗预测方法,其特征在于,所述D-S理论证据合成规则为:
定义Bel1、Bel2为某识别框架上基于两个互不相干的信度函数,设焦元分别为A1,A2,...,Ak和B1,B2,...,Bk,设则:
其中,系数是规范因子,第一证据和第二证据可合成的前提是满足不等式K<ε,ε=7。
5.根据权利要求1所述的多晶硅还原炉还原过程能耗预测方法,其特征在于,所述建立LS-SVM算法的目标函数为:
利用LS-SVM算法,将能耗预测模型的映射表示为:y=f(x)=w·φ(x)+b,
其中w为权向量,b是偏向项,φ(x)是将相似时段的能耗历史数据映射到高维空间的核空间映射函数;
优化目标:
s.t.y=wTφ(xi)+b+ei,i=1,2,…,N,
其中,C是可调参数,ei是残差,e∈Rl×1是训练误差;
然后,构造拉格朗日函数:
αi为拉格朗日乘子,从而得到α和b;则确定所述可调参数C和标准化参数σ后,所述目标函数为:
其中,(xi,xj)=φ(xi)Tφ(xj),k(xi,xj)=exp(-||xi-xj||2/2σ2)。
6.根据权利要求1所述的多晶硅还原炉还原过程能耗预测方法,其特征在于,还包括步骤五:通过相对误差γ对能耗预测模型进行性能评价,
为第i个样本的预测值,yi为第i个样本的实际值;
当γ趋于零的极限时,能耗预测模型的性能符合要求;
当能耗预测模型的性能不符合要求时,重新筛选出相似时段,并重新训练能耗预测模型。
7.一种多晶硅还原炉还原过程能耗预测系统,其特征在于:包括多晶硅还原炉、上位机和数据采集器,所述数据采集器用于采集多晶硅还原炉的能耗历史数据并发送至上位机,所述上位机包括:
时段筛选模块,用于通过D-S理论证据筛选出与待预测时段差异度最小的相似时段,由相似时段的能耗历史数据构建成训练样本和测试样本;
目标函数构建模块,用于根据多晶硅还原炉的生产经验,确定LS-SVM算法的可调参数C和标准化参数σ,建立LS-SVM算法的目标函数;
模型生成模块,用于利用LS-SVM算法,通过训练样本和测试样本训练出能耗预测模型;
预测模块,用于通过能耗预测模型对生产中的多晶硅还原炉的待预测时段进行还原过程能耗预测。
8.根据权利要求7所述的多晶硅还原炉还原过程能耗预测系统,其特征在于:定义多晶硅还原炉的生产周期为120小时,所述待预测时段为生产中的多晶硅还原炉的第二天,所述相似时段为在历史生产周期中与待预测时段所处位置相同的时间段,所述待预测时段的位置为待预测时段在当前生产周期内的位置;
所述时段筛选模块具体用于:
首先,选取炉内温度和炉内压力设置相同的能耗历史数据,并以该能耗历史数据中的三个因子:生产数据时间间隔、三氯氢硅消耗量和氢气消耗量构造出两个证据;
然后,计算各个证据的识别框架中的基本信度;
最后,根据D-S理论证据合成规则筛选出与待预测时段差异度最小的相似时段,由相似时段的能耗历史数据构建成训练样本和测试样本;
其中,参与选取的能耗历史数据评判为好、中、差三个等级,依次用A、B、C表示,并把{A,B,C}称为识别框架的焦元。
9.根据权利要求8所述的多晶硅还原炉还原过程能耗预测系统,其特征在于,所述时段筛选模块计算各个证据的识别框架中的基本信度为:
首先,将生产数据时间间隔作为第一证据,则第一证据的信度分配m1如下:
t1为参与选取的能耗历史数据所在的历史时间段与待预测时段的月份间隔值;
然后,对三氯氢硅消耗量和氢气消耗量进行量化处理:
若待预测时段处在的第i天的三氯氢硅消耗量为Si,第i天三氯氢硅消耗量范围为Simax到Simin,则三氯氢硅消耗量可量化为从而把待预测时段三氯氢硅消耗量化到[0,1];
若待预测时段处在的第i天的氢气消耗量为Hi,第i天氢气消耗量范围为Himax到Himin,则氢气消耗量可量化为从而把待预测时段氢气消耗量化到[0,1];
接着,计算出每一个因子在不同的历史时间段与待预测时间段之间的差值t2,将所述差值t2作为第二证据,则所述第二证据的信度分配m2如下:
当t2>0.9时,m2(A)=0.05,m2(B)=0.13,m2(C)=0.82;
当t2<0.1时,m2(A)=0.82,m2(B)=0.13,m2(C)=0.05;
当0.1≤t2≤0.9时,
所述D-S理论证据合成规则为:
定义Bel1、Bel2为某识别框架上基于两个互不相干的信度函数,设焦元分别为A1,A2,...,Ak和B1,B2,...,Bk,设则:
其中,系数是规范因子,第一证据和第二证据可合成的前提是满足不等式K<ε,ε=7。
10.根据权利要求7所述的多晶硅还原炉还原过程能耗预测系统,其特征在于:所述目标函数构建模块具体为:
利用LS-SVM算法,将能耗预测模型的映射表示为:y=f(x)=w·φ(x)+b,
其中w为权向量,b是偏向项,φ(x)是将相似时段的能耗历史数据映射到高维空间的核空间映射函数;
优化目标:
s.t.y=wTφ(xi)+b+ei,i=1,2,…,N,
其中,C是可调参数,ei是残差,e∈Rl×1是训练误差;
然后,构造拉格朗日函数:
αi为拉格朗日乘子,从而得到α和b;则确定所述可调参数C和标准化参数σ后,所述目标函数为:
其中,(xi,xj)=φ(xi)Tφ(xj),k(xi,xj)=exp(-||xi-xj||2/2σ2);
还包括性能评价模块,用于通过相对误差γ对能耗预测模型进行性能评价:
为第i个样本的预测值,yi为第i个样本的实际值;
当γ趋于零的极限时,能耗预测模型的性能符合要求;
当能耗预测模型的性能不符合要求时,重新筛选出相似时段,并重新训练能耗预测模型。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810529750.6A CN108563913B (zh) | 2018-05-29 | 2018-05-29 | 一种多晶硅还原炉还原过程能耗预测方法、系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810529750.6A CN108563913B (zh) | 2018-05-29 | 2018-05-29 | 一种多晶硅还原炉还原过程能耗预测方法、系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN108563913A true CN108563913A (zh) | 2018-09-21 |
CN108563913B CN108563913B (zh) | 2022-04-12 |
Family
ID=63540353
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810529750.6A Active CN108563913B (zh) | 2018-05-29 | 2018-05-29 | 一种多晶硅还原炉还原过程能耗预测方法、系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN108563913B (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109978287A (zh) * | 2019-05-17 | 2019-07-05 | 亚洲硅业(青海)有限公司 | 多晶硅智能生产方法及系统 |
CN112645334A (zh) * | 2020-12-21 | 2021-04-13 | 亚洲硅业(青海)股份有限公司 | 多晶硅还原炉的启炉预测方法、系统、存储介质及终端 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103544544A (zh) * | 2013-10-29 | 2014-01-29 | 广东工业大学 | 一种能源消耗预测方法及装置 |
CN103592374A (zh) * | 2013-11-18 | 2014-02-19 | 国家电网公司 | 一种基于d-s证据理论的变压器油色谱数据预测方法 |
-
2018
- 2018-05-29 CN CN201810529750.6A patent/CN108563913B/zh active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103544544A (zh) * | 2013-10-29 | 2014-01-29 | 广东工业大学 | 一种能源消耗预测方法及装置 |
CN103592374A (zh) * | 2013-11-18 | 2014-02-19 | 国家电网公司 | 一种基于d-s证据理论的变压器油色谱数据预测方法 |
Non-Patent Citations (4)
Title |
---|
伍雪冬: "《非线性时间序列在线预测建模与仿真》", 30 November 2015 * |
侯英伟: "考虑历史数据影响因素的电力系统短期电量预测研究", 《中国优秀硕士学位论文全文数据库工程科技Ⅱ辑》 * |
姜谙男: "《地下工程智能反馈分析方法与应用》", 30 September 2011 * |
李鑫滨等: "基于D-S证据理论的相似日支持向量机短期负荷预测", 《电网技术》 * |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109978287A (zh) * | 2019-05-17 | 2019-07-05 | 亚洲硅业(青海)有限公司 | 多晶硅智能生产方法及系统 |
CN109978287B (zh) * | 2019-05-17 | 2020-04-21 | 亚洲硅业(青海)股份有限公司 | 多晶硅智能生产方法及系统 |
CN112645334A (zh) * | 2020-12-21 | 2021-04-13 | 亚洲硅业(青海)股份有限公司 | 多晶硅还原炉的启炉预测方法、系统、存储介质及终端 |
Also Published As
Publication number | Publication date |
---|---|
CN108563913B (zh) | 2022-04-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112186743B (zh) | 一种基于深度强化学习的动态电力系统经济调度方法 | |
CN108875992B (zh) | 一种考虑需求响应的虚拟电厂日前优化调度方法 | |
CN107730044A (zh) | 一种可再生能源发电和负荷的混合预测方法 | |
CN107070704A (zh) | 一种基于QoS的可信Web服务组合优化方法 | |
CN107918368B (zh) | 钢铁企业煤气产生量与消耗量的动态预测方法及设备 | |
CN105787583A (zh) | 一种冶金煤气综合动态平衡调度系统及方法 | |
CN108563913A (zh) | 一种多晶硅还原炉还原过程能耗预测方法、系统 | |
CN113128124B (zh) | 基于改进神经网络的多牌号C-Mn钢力学性能预测方法 | |
CN110222910A (zh) | 一种有源配电网态势预测方法及预测系统 | |
CN112966444B (zh) | 一种建筑多能源系统智慧能量优化方法及装置 | |
CN106712050A (zh) | 一种基于改进蛙跳算法的电网无功优化方法及装置 | |
CN104698838B (zh) | 基于论域动态划分和学习的模糊调度规则挖掘方法 | |
CN116993205A (zh) | 一种面向城市综合能源系统日内运行的调节能力评估方法 | |
CN108321801A (zh) | 一种能源基地系统日前发电计划制定方法和系统 | |
CN111242210A (zh) | 基于改进Shapley值模型的短期负荷预测方法 | |
CN109101683B (zh) | 燃煤分质利用与清洁预处理系统热解釜的模型更新方法 | |
CN110874672A (zh) | 基于量子遗传算法的farima模型电力负荷预测方法 | |
CN116167524A (zh) | 一种考虑电-氢-热耦合的多元负荷协同预测方法及系统 | |
JP3771858B2 (ja) | 装置の最適設計支援方法、装置の最適設計支援システムおよびコンピュータプログラム | |
CN114971071A (zh) | 计及风光接入和电热混合储能的园区综合能源系统时序规划方法 | |
CN108075467B (zh) | 一种基于多源证据融合的配电网低电压预测方法 | |
CN112801115A (zh) | 基于微电网源荷综合特性图像的电源波动控制方法及应用 | |
Li et al. | The harmony search algorithm in combination with particle swarm optimization and its application in the slope stability analysis | |
CN111047108A (zh) | 一种基于最优组合模型的终端能源消费中电能占比预测方法 | |
CN112825159B (zh) | 气化工艺参数区间确定装置及方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |