CN108763759A - 一种基于isomap的固化热过程时空建模方法 - Google Patents
一种基于isomap的固化热过程时空建模方法 Download PDFInfo
- Publication number
- CN108763759A CN108763759A CN201810532161.3A CN201810532161A CN108763759A CN 108763759 A CN108763759 A CN 108763759A CN 201810532161 A CN201810532161 A CN 201810532161A CN 108763759 A CN108763759 A CN 108763759A
- Authority
- CN
- China
- Prior art keywords
- space
- time
- data
- model
- low
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 92
- 230000008569 process Effects 0.000 title claims abstract description 43
- 238000007711 solidification Methods 0.000 title claims abstract description 6
- 230000008023 solidification Effects 0.000 title claims abstract description 6
- 230000006870 function Effects 0.000 claims abstract description 52
- 238000004422 calculation algorithm Methods 0.000 claims abstract description 40
- 238000013507 mapping Methods 0.000 claims abstract description 32
- 238000009826 distribution Methods 0.000 claims abstract description 20
- 238000000926 separation method Methods 0.000 claims abstract description 17
- 239000011159 matrix material Substances 0.000 claims description 48
- 238000004088 simulation Methods 0.000 claims description 20
- 238000012549 training Methods 0.000 claims description 13
- 238000005457 optimization Methods 0.000 claims description 10
- 230000002123 temporal effect Effects 0.000 claims description 10
- 238000012360 testing method Methods 0.000 claims description 9
- 238000012886 linear function Methods 0.000 claims description 6
- 238000003062 neural network model Methods 0.000 claims description 6
- 230000004913 activation Effects 0.000 claims description 4
- WHXSMMKQMYFTQS-UHFFFAOYSA-N Lithium Chemical compound [Li] WHXSMMKQMYFTQS-UHFFFAOYSA-N 0.000 claims description 3
- 230000015572 biosynthetic process Effects 0.000 claims description 3
- 230000008859 change Effects 0.000 claims description 3
- 230000010354 integration Effects 0.000 claims description 3
- 229910052744 lithium Inorganic materials 0.000 claims description 3
- 210000002569 neuron Anatomy 0.000 claims description 3
- 238000005070 sampling Methods 0.000 claims description 3
- 238000003786 synthesis reaction Methods 0.000 claims description 3
- 238000006243 chemical reaction Methods 0.000 claims description 2
- 238000001723 curing Methods 0.000 claims 13
- 238000001029 thermal curing Methods 0.000 claims 2
- 238000012544 monitoring process Methods 0.000 abstract description 2
- 238000000513 principal component analysis Methods 0.000 description 11
- 230000009467 reduction Effects 0.000 description 8
- 238000000354 decomposition reaction Methods 0.000 description 4
- 238000010586 diagram Methods 0.000 description 4
- 238000013528 artificial neural network Methods 0.000 description 3
- 238000011946 reduction process Methods 0.000 description 3
- 238000004364 calculation method Methods 0.000 description 2
- 238000010606 normalization Methods 0.000 description 2
- 238000012546 transfer Methods 0.000 description 2
- 241000764238 Isis Species 0.000 description 1
- 238000001816 cooling Methods 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 238000010438 heat treatment Methods 0.000 description 1
- 230000010365 information processing Effects 0.000 description 1
- 230000001537 neural effect Effects 0.000 description 1
- 230000009022 nonlinear effect Effects 0.000 description 1
- 238000012858 packaging process Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000003860 storage Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F30/00—Computer-aided design [CAD]
- G06F30/20—Design optimisation, verification or simulation
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Computer Hardware Design (AREA)
- Evolutionary Computation (AREA)
- Geometry (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了一种基于ISOMAP的固化热过程时空建模方法,步骤一,搭建芯片固化炉温度控制平台,步骤二,得到芯片固化炉在固化工作状态下的温度分布随时间变化的时空数据,步骤三,使用ISOMAP算法对步骤二采集到的时空数据中学习一个表征空间非线性特征的正交映射函数;步骤四,使用ISOMAP算法,通过所述正交映射函数对高维的所述时空数据进行时空变量分离。建立芯片固化热过程模型,实现芯片固化炉在线温度监测和温度分布的在线估计,并且建模精度高。
Description
技术领域
本发明涉及固化热过程建模领域,尤其涉及一种基于ISOMAP的固化热过程时空建模方法。
背景技术
在芯片封装过程中,固化过程是其中最重要的一个过程之一。芯片固化质量的好坏,直接影响最终成品的质量以及使用寿命。而固化过程所使用的设备即为芯片固化炉。固化炉的内部有一个拱形的加热模块,它的作用是使得炉腔内的温度场保持一致。炉腔下端有一个冷却装置,它的作用是使得炉腔内的温度在上下方向上形成一个温度梯度,这样可以满足芯片在不同固化阶段所需的不同温度的要求。由于固化过程的边界条件非常复杂以及内部未知扰动的影响,固化过程的精确偏微分方程描述很难获得。固化炉属于分布式参数系统(DPS),虽然根据热传递规律,可以大致获得固化炉的偏微分方程结构,但是仍有许多模型参数无法获得。由于芯片固化质量对温度的分布要求非常高,因此基于数据的时空分布模型对于固化过程的温度管理具有非常重要的意义。
发明内容
本发明的目的在于提出一种基于ISOMAP的固化热过程时空建模方法,建立芯片固化热过程模型,实现芯片固化炉在线温度监测和温度分布的在线估计,并且建模精度高。
为达此目的,本发明采用以下技术方案:
一种基于ISOMAP的固化热过程时空建模方法,其特征在于:
步骤一,搭建芯片固化炉温度控制平台,在芯片固化炉的炉腔底部安装引线框架,在引线框架的上表面均匀布置多个热电偶传感器,并由dSPACE实时仿真平台采集所有热电偶传感器的温度数据,还在引线框架的上方均匀布置多个加热器,每个加热器由一个脉宽调制信号和一个功率放大器提供输入信号使芯片固化炉进行固化工作;
步骤二,dSPACE实时仿真平台统计所有热电偶传感器的温度数据,得到芯片固化炉在固化工作状态下的温度分布随时间变化的时空数据,并将所述时空数据定义为:{T(S,tk)|S∈Ω,S=1,...,nS;k=1,...,nt},其中,nS表示时空数据在空间方向的数据点个数,nt表示时空数据在时间方向的数据点个数;
步骤三,dSPACE实时仿真平台使用ISOMAP算法对步骤二采集到的时空数据中学习一个表征空间非线性特征的正交映射函数;步骤四,dSPACE实时仿真平台使用ISOMAP算法,通过所述正交映射函数对高维的所述时空数据进行时空变量分离,从而得出与所述正交映射函数对应的低维时序数据,实现所述时空数据的时空分离和模型递减;步骤五,dSPACE实时仿真平台通过神经网络模型来逼近低维时序数据的动态特性,从而生成低维时序动态模型,并且通过极限学习机(Extreme Learning Machine,ELM)来训练低维时序动态模型,以辨识低维时序动态模型的参数;步骤六,dSPACE实时仿真平台通过整合所述正交映射函数和所述低维时序动态模型,时空合成获得芯片固化炉在固化工作状态下的温度时空分布模型。
优选地,所述步骤三具体为:根据傅里叶变换,时空数据T(S,tk)表示成以下时空分离形式:其中,为正交映射函数, ai(tk)为低阶时序系数;从而正交映射函数表示为时空数据T(S,tk)的线性结合形式:其中,定义所述时空数据所在空间为高维空间,则γik为所述高维空间的低维嵌入空间。
优选地,所述步骤四的时空变量分离具体为:首先,使用ISOMAP算法对每个高维的时空数据点构造其邻域图,每个时空数据点的邻域图由其最近的K个时空数据点点组成,以显示采集到的时空数据的固有局部拓扑结构;定义在p时刻采集的温度数据集合为:T(:,tp)={T(S,tp)|S∈Ω,S=1,...,nS},
若T(:,tq)是T(:,tp)的K个近邻点或者|T(:,tp)-T(:,tq)|<ε,ε是一个正值,则T(:,tq)与T(:,tp)直接相连,定义为dx(p,q),否则不连接;
然后,计算两两数据点之间的最短路径,定义dG(p,q)为T(:,tq)与 T(:,tp)之间的测地线距离:
若T(:,tq)与T(:,tp)直接相连,则dG(p,q)=dx(p,q);若T(:,tq)与 T(:,tp)不连接,则dG(p,q)=∞;从而对于任一值k=1,...,nt,其最短路径dG(p,q)表示为:
求解上式获得矩阵DG={dG(p,q)},矩阵DG={dG(p,q)}为高维空间两两数据点的最短测地线距离;接着,设置ISOMAP算法的优化目标为:
定义DN为低维嵌入空间两两数据点的最短路径距离矩阵,然后,ISOMAP 算法的优化目标转化为以下最小化优化问题:
其中,τ(DG)=-HAH/2,A表示为H是中心化矩阵, H=I-1/nteeT,I是单位矩阵,e=[1,...,1]T;是L2矩阵范数:从而低维嵌入空间γik通过对所得到的最短路径距离矩阵应用多维缩放来确定:
令λi为矩阵τ(DG)的第i个特征值,λi按降序排列,是第i个特征向量的第p个分量,从而低维嵌入空间γik通过下式计算得到:由此计算得到然后对用施密特正交化进行正交化处理。
优选地,所述步骤四的模型递减具体为:令矩阵τ(DG)的所有特征值按照降序排列:低维模型的阶数n通过下式来确定:
选取η≥0.99对应的n值作为低阶模型的阶数,将时空分离形式的时空数据转化为有限维模型
优选地,所述步骤五低维时序动态模型生成过程为:首先,获取时间系数 ai(tk):其中为和T(S,tk)之间的内积;时间模型的离散形式为:其中,和Δt是间隔取样,从而低维模型的结构为a(k)=K1a(k-1)+K2q(k-1),T(S,tk)=C(S)a(k),
其中,a(k)=[a1(k),a2(k),...,aN(k)]T,K1,K2为模型的参数矩阵,q(k)=[q1(k),q2(k),...,qN(k)]T,使用径向基函数神经网络模型来逼近未知的非线性函数q(k-1):q(k-1)=βG(a(k-1),u(k-1)),
其中,β=[β1,...,βL]为输出层权重,L为隐藏层神经元个数,隐藏层激活函数G为高斯核函数,u(k-1)为锂电池1的输入信号;从而生成低维时序动态模型a(k):a(k)=K1a(k-1)+K2βG(a(k-1),u(k-1))。
优选地,所述步骤五通过极限学习机来训练低维时序动态模型过程为:
首先,定义z(k)=[aT(k),uT(k)]T,从而低维时序动态模型为 a(k)=HT(k)θ,其中:
H(k)=[a(k-1),G(W1z(k-1)+η1),...,G(WLz(k-1)+ηL)]T,
θ=[K1,K2β1,K2β2,...,K2βL]T,
Wi,(i=1,...,L)为连接输入层与第i个隐藏层结点的输入权重,
ηi∈R,i=1,...,L表示第i个隐藏层结点的阈值;使用极限学习机来训练低维时序动态模型,Wi和ηi随机生成并在学习过程中得到修复,从而计算出矩阵H(k);并将低维时序动态模型a(k)=K1a(k-1)+K2βG(a(k-1),u(k-1))的训练转化为线性系统a(k)=HT(k)θ的最小二乘解,从而,a(k)=HT(k)θ的参数矩阵通过寻找最小二乘解获得:其中Φ=HT,是矩阵Φ的伪逆。
优选地,所述步骤六整合后获得的温度时空分布模型为:
其中,
优选地,还包括:步骤七,使用Rademacher复杂度来度量所述温度时空分布模型的期望误差的上界,若满足损失函数那么对于任意的δ∈(0,1),都存在至少1-δ的概率使得所有的都满足:其中为的期望误差,为的经验误差,m为测试样本的数量;
若为参数矩阵,并且 ||W(S)||≤P,从而模型函数集合H的Rademacher复杂度为:Rm(H)<P·(Q+1)。
所述基于ISOMAP的固化热过程时空建模方法,用于在线预测和控制芯片固化炉。通过构造全局线性映射函数来学习低维表示。对于动态建模,首先设计适当的模型结构以匹配原始过程。然后用神经网络逼近模型结构中的未知函数,并将极限学习机(ELM)算法用于参数估计。ISOMAP方法可以利用高维数据的局部几何结构来揭示其内部的非线性流形结构,并保留原始数据在低维空间的拓扑结构,模型预测精度高。
附图说明
附图对本发明做进一步说明,但附图中的内容不构成对本发明的任何限制。
图1是本发明其中一个实施例的芯片固化炉结构示意图;
图2是本发明其中一个实施例的热电偶传感器分布图;
图3是本发明其中一个实施例的基于ISOMAP的建模流程图;
图4是本发明其中一个实施例的基于ISOMAP的测地线距离图;
图5是本发明其中一个实施例的第二个加热器h2的控制输入信号图;
图6是本发明其中一个实施例的从ISOMAP方法获得的第一个正交映射函数示意图;
图7是本发明其中一个实施例的从ISOMAP方法获得的第二个正交映射函数示意图;
图8是本发明其中一个实施例的ISOMAP建模方法在热电偶传感器s6处的性能图;
图9是本发明其中一个实施例的ISOMAP建模方法在热电偶传感器s11处的性能图;
图10是本发明其中一个实施例的预测的最后采样时刻的温度分布图;
图11是本发明其中一个实施例的热电偶传感器s6处的ARE比较图;
图12是本发明其中一个实施例的热电偶传感器s11处的ARE比较图。
其中:芯片固化炉1;引线框架2;热电偶传感器3、s1、s2、s3、s4、s5、 s6、s7、s8、s9、s10、s11、s12、s13、s14、s15、s16;加热器4、h1、h2、 h3、h4。
具体实施方式
下面结合附图并通过具体实施方式来进一步说明本发明的技术方案。
实施例一
本实施例的基于ISOMAP的固化热过程时空建模方法:
步骤一,搭建芯片固化炉温度控制平台,如图1、图2所示,在芯片固化炉 1的炉腔底部安装引线框架2,在引线框架2的上表面均匀布置多个热电偶传感器3,并由dSPACE实时仿真平台采集所有热电偶传感器3的温度数据,还在引线框架2的上方均匀布置多个加热器4,每个加热器4由一个脉宽调制信号和一个功率放大器提供输入信号使芯片固化炉1进行固化工作;
步骤二,dSPACE实时仿真平台统计所有热电偶传感器3的温度数据,得到芯片固化炉1在固化工作状态下的温度分布随时间变化的时空数据,并将所述时空数据定义为:
{T(S,tk)|S∈Ω,S=1,...,nS;k=1,...,nt}
其中,nS表示时空数据在空间方向的数据点个数,nt表示时空数据在时间方向的数据点个数,Ω表示空间域;
步骤三,dSPACE实时仿真平台使用ISOMAP算法对步骤二采集到的时空数据中学习一个表征空间非线性特征的正交映射函数;
步骤四,dSPACE实时仿真平台使用ISOMAP算法,通过所述正交映射函数对高维的所述时空数据进行时空变量分离,从而得出与所述正交映射函数对应的低维时序数据,实现所述时空数据的时空分离和模型递减;
步骤五,dSPACE实时仿真平台通过神经网络模型来逼近低维时序数据的动态特性,从而生成低维时序动态模型,并且通过极限学习机(Extreme Learning Machine,ELM)来训练低维时序动态模型,以辨识低维时序动态模型的参数;
步骤六,dSPACE实时仿真平台通过整合所述正交映射函数和所述低维时序动态模型,时空合成获得芯片固化炉1在固化工作状态下的温度时空分布模型。
根据芯片固化炉1的传热规律,芯片固化炉1的热过程一般表达式可以描述为:
其中S’=(x,y,z)是空间坐标,T=T(S,tk)表示在时间t和位置 S=(x,y,Z)处的温度(单位℃),(x,y,z)、x∈[0,x0]、y∈[0,y0]和z∈[0,z0] 为空间坐标,c为比热系数(单位J/kg℃),fc(T)和fr(T)分别为未知的对流和辐射非线性效应。Q=Q(x,y,z,t)是热源,ρ和k分别是密度(单位kg/m3) 和热导率(单位W/m℃)。
热导率k和密度ρ的取决于温度,并且可以表示为:
其中,k0和ρ0是工作点周围的标称值,和是T(S,tk)的函数。
因此,可以转为以下形式:
其中,是拉普拉斯算子,k1=k0/ρoc是常数;
是关于T的未知非线性函数。很明显,有两个非线性函数F(·)和Q(·),其中Q(·)是关于u(t)的非线性函数。芯片固化炉1的热过程描述的偏微分方程具有无线维的特征,所以不能够直接用于在线预测和控制。因此为了实际应用,建立一个有限维的常微分方程描述的模型非常重要。
为了解决上述问题,引入了基于非线性模型的时空建模方法。建模过程包括以下三个阶段,如下所示:
1)第一阶段是时间/空间分离和模型缩减,其中高维时空数据在ISOMAP约束下被转换为低维时间数据。
2)第二阶段是动态建模,传统的建模方法将应用于低维空间中的未知动态。
3)第三阶段用于模型重建,其中基于数据的时空模型被重建以描述芯片固化炉1的热动态。
显然,所提出的非线性时空建模方法的关键问题是如何实现时空分离、模型简化和动态建模。对于时间/空间分离和模型缩减,ISOMAP算法应用于此,通过构造全局线性映射函数来学习低维表示。对于动态建模,首先设计适当的模型结构以匹配原始过程。然后用神经网络逼近模型结构中的未知函数,并将极限学习机(ELM)算法用于参数估计。所提出的时空建模方法的配置如图3所示。
ISOMAP算法即等距特征映射算法,是一种降维算法,一种非迭代的全局优化算法。降维的目的是找出隐藏在高维数据中的低维结构,可以降低计算的复杂性。ISOMAP是一种非线性的降维算法。从ISOMAP的名字上看,它是一种等距映射算法,也就是说降维后的点,两两之间距离不变,这个距离是测地距离。解释一下测地距离,例如在地球上,要从南极到北极,欧式距离就是两点之间直线最短,测地距离则是曲线的长度,更符合实际情况。对于测地距离的计算,离得很近的点可以用欧氏距离来代替,离的较远的点,使用图论中的最短路径来逼近。
与PCA算法(即主成分分析算法)类似,ISOMAP也是一种用于学习原始空间的低维表示的特征分解方法。但是,这两种方法本质上完全不同。主要差异可概括如下:
1)PCA分解是一种全局线性方法,只能有效地保留全局欧几里德结构。因此,它可能无法发现高维数据的固有非线性流形结构。
2)ISOMAP方法是一种全局非线性技术,可以利用高维数据的局部几何结构来揭示其内部的非线性流形结构,并保留原始数据在低维空间的拓扑结构。
从固有配置来看,ISOMAP将比PCA方法更有效地减小非线性DPS的模型。
优选地,所述步骤三具体为:
根据傅里叶变换,时空数据T(S,tk)表示成以下时空分离形式:
其中,为正交映射函数,ai(tk)为低阶时序系数;
从而正交映射函数表示为时空数据T(S,tk)的线性结合形式:
其中,定义所述时空数据所在空间为高维空间,则γik为所述高维空间的低维嵌入空间。首先应用ISOMAP方法来找到一组正交映射函数时间/空间分离的正交映射函数
优选地,所述步骤四的时空变量分离具体为:
所提出的基于ISOMAP的方法是在模型递减过程中,使得低维嵌入的数据能够保留原始高维空间的拓朴结构;
首先,使用ISOMAP算法对每个高维的时空数据点构造其邻域图,每个时空数据点的邻域图由其最近的K个时空数据点点组成,以显示采集到的时空数据的固有局部拓扑结构;
定义在p时刻采集的温度数据集合为:
T(:,tp)={T(S,tp)|S∈Ω,S=1,...,nS},可以通过连接数据 T(:,tp)和T(:,tq),如dx(p,q)测量来实现:
若T(:,tq)是T(:,tp)的K个近邻点或者|T(:,tp)-T(:,tq)|<ε,ε是一个预定义的正值,则T(:,tq)与T(:,tp)直接相连,定义为dx(p,q),否则不连接;
然后,计算两两数据点之间的最短路径,如图4所示,对于高维空间中的任意两点T(:,tq)与T(:,tp),它们之间的测地线距离可以使用图4中实线或者虚线来代表。很显然实线所代表的测地线距离要比虚线短。假设实线为这两点之前的最短测地线距离,则它可以用来代表这两点之间的最短路径。ISOMAP 算法是使得低维嵌入空间的两两之间的最短路径与高维空间所对应的最短路径一致。
定义dG(p,q)为T(:,tq)与T(:,tp)之间的测地线距离:
若T(:,tq)与T(:,tp)直接相连,则dG(p,q)=dx(p,q);
若T(:,tq)与T(:,tp)不连接,则dG(p,q)=∞;
从而对于任一值k=1,...,nt,其最短路径dG(p,q)表示为:
求解上式获得矩阵DG={dG(p,q)},矩阵DG={dG(p,q)}为高维空间两两数据点的最短测地线距离;对于图4所示的两个数据点,其测地线距离可以表示成dG(p,q)=a+b+c+...+e;
接着,设置ISOMAP算法的优化目标为:
fopt=argmin∑p,q(dN(γ(tp),γ(tq))-dG(T(:,tp),T(:,tq)))2,
定义DN为低维嵌入空间两两数据点的最短路径距离矩阵,然后,ISOMAP 算法的优化目标转化为以下最小化优化问题:
其中,τ(DG)=-HAH/2,A表示为H是中心化矩阵, H=I-1/nt eeT,I是单位矩阵,e=[1,...,1]T,e表示一个所有元素为1的列向量;
是L2矩阵范数:B是自定义的一个变量,用来解释是如何计算的,B可以用A、C等来替换,L2表示定义的一种矩阵范数;从而低维嵌入空间γik通过对所得到的最短路径距离矩阵应用多维缩放来确定:
令λi为矩阵τ(DG)的第i个特征值,λi按降序排列,Vi p是第i个特征向量的第p个分量,从而低维嵌入空间γik通过下式计算得到:
由此计算得到为满足单位正交化的需求,然后对用施密特正交化进行正交化处理。
优选地,所述步骤四的模型递减具体为:
令矩阵τ(DG)的所有特征值按照降序排列:类似于PCA分解,低维模型的阶数n通过下式来确定:
一般选取η≥0.99对应的n值作为低阶模型的阶数,因此将时空分离形式的时空数据转化为有限维模型:
由上可知,本实施例运用ISOMAP算法进行模型递减,与现有运用LLE算法 (局部线性嵌入算法)进行模型递相比:
1.两者的第一步相同,都是对每个数据点寻找其K个近邻点,并构造邻域图。对于LLE算法,每个数据点可以由其K个近邻点的线性加权重构得到,而对于ISOMAP算法,构造邻域图是为了寻找两两数据点在全局的测地线距离。因此这两种方法构造邻域图的目的不同,因此也会造成它们近邻点个数的选择以及运算时间的不同。
2.第二步两者完全不同,LLE着眼于局部线性特征,而ISOMAP着眼于全局非线性特征。因此ISOMAP的降维效果比LLE方法更好,但是由于LLE算法保留了线性系统的一些特点,也使得LLE方法的运算速度比ISOMAP更快。
优选地,所述步骤五低维时序动态模型生成过程为:
首先,获取时间系数ai(tk):其中为和T(S,tk)之间的内积;当正交映射函数获得以后,下一步则是确定低维时序动态模型。模型的输入信号为u(k-1)。由于正交映射函数是单位正交化的,因此输出时间系数数据可以通过上式获得;
由于低维模型的结构未知,时间模型的数学描述可以写成如下形式:
其中,是关于输入信号u(k-1)和ai(tk)的非线性函数;
对于实际应用,通常使用时间模型的离散形式:
其中,和Δt是间隔取样,从而低维模型的结构为
a(k)=K1a(k-1)+K2q(k-1),T(S,tk)=C(S)a(k),
其中,a(k)=[a1(k),a2(k),...,aN(k)]T,K1,K2为模型的参数矩阵,q(k)=[q1(k),q2(k),...,qN(k)]T,使用径向基函数神经网络模型来逼近未知的非线性函数q(k-1):
q(k-1)=βG(a(k-1),u(k-1)),
其中,β=[β1,...,βL]为输出层权重,L为隐藏层神经元个数,隐藏层激活函数G为高斯核函数,u(k-1)为锂电池1的输入信号;
从而生成低维时序动态模型a(k):
a(k)=K1a(k-1)+K2βG(a(k-1),u(k-1))。
优选地,所述步骤五通过极限学习机来训练低维时序动态模型过程为:
首先,定义z(k)=[aT(k),uT(k)]T,从而低维时序动态模型为 a(k)=HT(k)θ,其中:
H(k)=[a(k-1),G(W1z(k-1)+η1),...,G(WLz(k-1)+ηL)]T,
θ=[K1,K2β1,K2β2,...,K2βL]T,
Wi,(i=1,...,L)为连接输入层与第i个隐藏层结点的输入权重,
ηi∈R,i=1,...,L表示第i个隐藏层结点的阈值,R是实数域;
使用极限学习机来训练低维时序动态模型,Wi和ηi随机生成并在学习过程中得到修复,从而计算出矩阵H(k);
并将低维时序动态模型a(k)=K1a(k-1)+K2βG(a(k-1),u(k-1))的训练转化为线性系统a(k)=HT(k)θ的最小二乘解,从而,a(k)=HT(k)θ的参数矩阵通过寻找最小二乘解获得:
其中Φ=HT,是矩阵Φ的伪逆。
因为极限学习机(ELM)简单和快速的学习速度,所以使用极限学习机来训练低维时序动态模型。另外,ELM方法可以扩展到在线顺序计算时变系统,这使得所提出的温度时间模型更适合在线应用。使用ELM方法,Wi和ηi的值与训练数据无关,它们相互之间独立随机获得,并且一旦它们获得以后,在之后的训练过程中将固定不变。当激活函数选定以后,矩阵H(k)便可以直接计算得到。低维时序动态模型a(k)的训练问题可以转化为线性系统a(k)=HT(k)θ的最小二乘求解问题。
优选地,所述步骤六整合后获得的温度时空分布模型为:
其中,
优选地,还包括:
步骤七,使用Rademacher复杂度来度量所述温度时空分布模型的期望误差的上界,
若满足损失函数那么对于任意的δ∈(0,1),都存在至少1-δ的概率使得所有的都满足:
其中为的期望误差,的经验误差,m为测试样本的数量;
若W(S)=[C(S)K1,C(S)K2β]为参数矩阵,并且 ||W(S)||≤P,从而模型函数集合H的Rademacher复杂度为:Rm(H)<P·(Q+1);表示期望的最大值小于或等于Q,||W(S)||≤P表示W(S)模的最大值小于或等于P。
Rademacher(拉德马赫)复杂度用于衡量一类实值函数的丰富性,并根据观察到的训练样本误差限制学习者的期望误差。与只能用于二元函数的 Vapnik-Chervonenkis维度不同,Rademacher的复杂度也可用于分析其他学习算法,如基于内核的算法。
步骤七的具体过程为:
通过使用Rademacher复杂度的概念,可以导出以下定理:
定理1、若满足损失函数那么对于任意的δ∈(0,1),都存在至少1-δ的概率使得所有的都满足:
其中为的期望误差,的经验误差,m为测试样本的数量;
从定理1可以看出,该模型的泛化边界与估计模型的复杂性和测试样本的个数有关。为了证明定理1,定理2和引理1必须引入如下:
定理2、若W(S)=[C(S)K1,C(S)K2β]为参数矩阵,并且||W(S)||≤P,从而模型函数集合H的Rademacher复杂度为: Rm(H)<P·(Q+1)。
证明:假设是独立的均匀Rademacher随机变量,取值为{-1,+1}。H相对于样本的经验性Rademacher复杂度定义为:
假设是有界的,和的期望值是Q,因为0<G(z(k-1))<1。然后,
引理1、假设满足损失函数对于任意的δ∈(0,1),至少有概率1-δ,超过测试长度的样本,对于所有的满足H:
损失函数的集合相关H和l;
关于Rademacher的复杂性。引理1的证明在现有技术S.M.Kakade,K.Sridharan,A.Tewari,“On the complexity of linear prediction: Riskbounds,margin bounds,and regularization,”Advances in neural informationprocessing systems,pp.793-800,2009.中给出。
证明定理1:平方损失函数l是具有常数的Lipschitz函数D=2(A+T∞),如果Rademacher损失函数集的复杂性可以表示如下:
根据引理1,对于任意的δ∈(0,1),在长度为m的样本上至少有1的概率,对于所有的满足H:
从而得出:
右边的最后两项是函数f(·),一旦建立了测试样本的模型和数量,f(·)就等于一个常数。
实施例二
本实施例通过进行实时实验来验证所提出的建模方法。首先,搭建芯片固化炉温度控制平台,如图1所示,在芯片固化炉1的炉腔底部安装引线框架2,在引线框架2的上表面均匀布置16个相同规格的热电偶传感器3,热电偶传感器3的详细布置位置如图2所示。在引线框架2的上方均匀布置四个相同规格的加热器4,每个加热器4的功率为700w,热电偶传感器3均匀的布置在加热器4下方5mm的同一水平面上。每个加热器4由一个脉宽调制信号和一个功率放大器提供输入信号使芯片固化炉1进行固化工作;其中第二个加热器h2的控制输入信号如图5所示。由dSPACE实时仿真平台采集所有热电偶传感器3的温度数据。采样间隔为Δt=10s,每个热电偶传感器3都采集了2100组温度数据。其中热电偶传感器s1-s5,s7-s10,s12-s16的温度数据用来确定模型,热电偶传感器s6和s11的温度数据用来测试该模型在未训练位置处的性能表现。dSPACE实时仿真平台由美国麻省理工学院图书馆(MIT Libraries)和美国惠普公司实验室(Hewlett-Packard Labs)合作,经过两年多的努力,于2002年10月开始投入使用。该系统是以内容管理发布为设计目标,遵循BSD协议的开放源代码数字存储系统。系统可以收集、存储、索引、保存和重新发布任何数字格式、层次结构的永久标识符研究数据。
然后,将基于ISOMAP的学习算法应用于这些温度数据,并使用ISOMAP算法构建3个正交映射函数。其中低维嵌入空间γik中相应特征值大小的第一和第二正交映射函数如图7、8所示。图8和图9显示了选定位置(s6和s11)的性能比较,其中估计性能(实数)非常接近实际系统(虚线)。显然,所提出的模型可以用来模拟炉腔中未经训练的位置的动态变化。对于空间域的性能,最后一个样本(第2100个)的比较如图10所示,其中开发的模型在空间和时间域都具有良好的模型性能。
为了与现有基于PCA(主成分分析算法)的建模方法进行比较,在基于PCA 的建模中,PCA分解用于空间函数学习,并且与基于ISOMAP的建模中使用相同的神经网络用于时间建模。为了便于比较两种方法的模型性能,以下标准用于评估:
①空间归一化绝对误差(SNAE)
②时间归一化绝对误差(TNAE)
③均方根误差(RMSE)
测试的性能指标TNAE(X)如表1所示。
表1
为了进一步揭示本实施例ISOMAP模型的优越性,所选位置(s6和s11)的比较指数ARE如图11、图12所示,其R-square如表2所示。
表2
对于所提出的基于ISOMAP的建模方法,由于其在降维过程中,使用两两测地线距离来表征全局非线性特征,着眼于全局,因此对于非线性流形结构复杂的系统,模型精度应该比基于PCA的建模方法的模型精度更高。但是基于ISOMAP 的建模方法为了能够更好的描述高维数据的非线性结构,使得降维过程过于复杂,这大大的增长了运算速度。基于PCA的建模方法虽然具有快的运算速度,但是对于强非线性系统,这种线性降维方法在降维过程中很容易遗失原系统的一些非线性特征,导致模型精度差。
以上结合具体实施例描述了本发明的技术原理。这些描述只是为了解释本发明的原理,而不能以任何方式解释为对本发明保护范围的限制。基于此处的解释,本领域的技术人员不需要付出创造性的劳动即可联想到本发明的其它具体实施方式,这些方式都将落入本发明的保护范围之内。
Claims (8)
1.一种基于ISOMAP的固化热过程时空建模方法,其特征在于:
步骤一,搭建芯片固化炉温度控制平台,在芯片固化炉的炉腔底部安装引线框架,在引线框架的上表面均匀布置多个热电偶传感器,并由dSPACE实时仿真平台采集所有热电偶传感器的温度数据,还在引线框架的上方均匀布置多个加热器,每个加热器由一个脉宽调制信号和一个功率放大器提供输入信号使芯片固化炉进行固化工作;
步骤二,dSPACE实时仿真平台统计所有热电偶传感器的温度数据,得到芯片固化炉在固化工作状态下的温度分布随时间变化的时空数据,并将所述时空数据定义为:
{T(S,tk)|S∈Ω,S=1,...,nS;k=1,...,nt}
其中,nS表示时空数据在空间方向的数据点个数,nt表示时空数据在时间方向的数据点个数;
步骤三,dSPACE实时仿真平台使用ISOMAP算法对步骤二采集到的时空数据中学习一个表征空间非线性特征的正交映射函数;
步骤四,dSPACE实时仿真平台使用ISOMAP算法,通过所述正交映射函数对高维的所述时空数据进行时空变量分离,从而得出与所述正交映射函数对应的低维时序数据,实现所述时空数据的时空分离和模型递减;
步骤五,dSPACE实时仿真平台通过神经网络模型来逼近低维时序数据的动态特性,从而生成低维时序动态模型,并且通过极限学习机(Extreme Learning Machine,ELM)来训练低维时序动态模型,以辨识低维时序动态模型的参数;
步骤六,dSPACE实时仿真平台通过整合所述正交映射函数和所述低维时序动态模型,时空合成获得芯片固化炉在固化工作状态下的温度时空分布模型。
2.根据权利要求1所述的基于ISOMAP的固化热过程时空建模方法,其特征在于,所述步骤三具体为:
根据傅里叶变换,时空数据T(S,tk)表示成以下时空分离形式:
其中,为正交映射函数,ai(tk)为低阶时序系数;
从而正交映射函数表示为时空数据T(S,tk)的线性结合形式:
其中,定义所述时空数据所在空间为高维空间,则γik为所述高维空间的低维嵌入空间。
3.根据权利要求2所述的基于ISOMAP的固化热过程时空建模方法,其特征在于,所述步骤四的时空变量分离具体为:
首先,使用ISOMAP算法对每个高维的时空数据点构造其邻域图,每个时空数据点的邻域图由其最近的K个时空数据点点组成,以显示采集到的时空数据的固有局部拓扑结构;
定义在p时刻采集的温度数据集合为:
T(:,tp)={T(S,tp)|S∈Ω,S=1,...,nS},
若T(:,tq)是T(:,tp)的K个近邻点或者|T(:,tp)-T(:,tq)|<ε,ε是一个正值,则T(:,tq)与T(:,tp)直接相连,定义为dx(p,q),否则不连接;
然后,计算两两数据点之间的最短路径,定义dG(p,q)为T(:,tq)与T(:,tp)之间的测地线距离:
若T(:,tq)与T(:,tp)直接相连,则dG(p,q)=dx(p,q);
若T(:,tq)与T(:,tp)不连接,则dG(p,q)=∞;
从而对于任一值k=1,...,nt,其最短路径dG(p,q)表示为:
min(T(:,tp),...,T(:,tq))(||T(:,tp)-T(:,tp1)||+...+||T(:,tpk-1)-T(:,tq)||),
求解上式获得矩阵DG={dG(p,q)},矩阵DG={dG(p,q)}为高维空间两两数据点的最短测地线距离;
接着,设置ISOMAP算法的优化目标为:
fopt=argmin∑p,q(dN(γ(tp),γ(tq))-dG(T(:,tp),T(:,tq)))2,
定义DN为低维嵌入空间两两数据点的最短路径距离矩阵,然后,ISOMAP算法的优化目标转化为以下最小化优化问题:
其中,τ(DG)=-HAH/2,A表示为H是中心化矩阵,H=I-1/nteeT,I是单位矩阵,e=[1,...,1]T;
是L2矩阵范数:从而低维嵌入空间γik通过对所得到的最短路径距离矩阵应用多维缩放来确定:
令λi为矩阵τ(DG)的第i个特征值,λi按降序排列,Vi p是第i个特征向量的第p个分量,从而低维嵌入空间γik通过下式计算得到:
由此计算得到然后对用施密特正交化进行正交化处理。
4.根据权利要求3所述的基于ISOMAP的固化热过程时空建模方法,其特征在于,所述步骤四的模型递减具体为:
令矩阵τ(DG)的所有特征值按照降序排列:低维模型的阶数n通过下式来确定:
选取η≥0.99对应的n值作为低阶模型的阶数,将时空分离形式的时空数据转化为有限维模型
5.根据权利要求4所述的基于ISOMAP的固化热过程时空建模方法,其特征在于,所述步骤五低维时序动态模型生成过程为:
首先,获取时间系数ai(tk):其中为和T(S,tk)之间的内积;
时间模型的离散形式为:
其中,和Δt是间隔取样,从而低维模型的结构为
a(k)=K1a(k-1)+K2q(k-1),T(S,tk)=C(S)a(k),
其中,a(k)=[a1(k),a2(k),...,aN(k)]T,K1,K2为模型的参数矩阵,q(k)=[q1(k),q2(k),...,qN(k)]T,使用径向基函数神经网络模型来逼近未知的非线性函数q(k-1):
q(k-1)=βG(a(k-1),u(k-1)),
其中,β=[β1,...,βL]为输出层权重,L为隐藏层神经元个数,隐藏层激活函数G为高斯核函数,u(k-1)为锂电池1的输入信号;
从而生成低维时序动态模型a(k):
a(k)=K1a(k-1)+K2βG(a(k-1),u(k-1))。
6.根据权利要求5所述的基于ISOMAP的固化热过程时空建模方法,其特征在于,所述步骤五通过极限学习机来训练低维时序动态模型过程为:
首先,定义z(k)=[aT(k),uT(k)]T,从而低维时序动态模型为a(k)=HT(k)θ,其中:
H(k)=[a(k-1),G(W1z(k-1)+η1),...,G(WLz(k-1)+ηL)]T,
θ=[K1,K2β1,K2β2,...,K2βL]T,
Wi,(i=1,...,L)为连接输入层与第i个隐藏层结点的输入权重,
ηi∈R,i=1,...,L表示第i个隐藏层结点的阈值;
使用极限学习机来训练低维时序动态模型,Wi和ηi随机生成并在学习过程中得到修复,从而计算出矩阵H(k);
并将低维时序动态模型a(k)=K1a(k-1)+K2βG(a(k-1),u(k-1))的训练转化为线性系统a(k)=HT(k)θ的最小二乘解,从而,a(k)=HT(k)θ的参数矩阵通过寻找最小二乘解获得:
其中Φ=HT,是矩阵Φ的伪逆。
7.根据权利要求6所述的基于ISOMAP的固化热过程时空建模方法,其特征在于,所述步骤六整合后获得的温度时空分布模型为:
其中,
8.根据权利要求7所述的基于ISOMAP的固化热过程时空建模方法,其特征在于,还包括:
步骤七,使用Rademacher复杂度来度量所述温度时空分布模型的期望误差的上界,
若满足损失函数那么对于任意的δ∈(0,1),都存在至少1-δ的概率使得所有的都满足:
其中为的期望误差,为的经验误差,m为测试样本的数量;
若W(S)=[C(S)K1,C(S)K2β]为参数矩阵,并且||W(S)||≤P,从而模型函数集合H的Rademacher复杂度为:Rm(H)<P·(Q+1)。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810532161.3A CN108763759A (zh) | 2018-05-29 | 2018-05-29 | 一种基于isomap的固化热过程时空建模方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810532161.3A CN108763759A (zh) | 2018-05-29 | 2018-05-29 | 一种基于isomap的固化热过程时空建模方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN108763759A true CN108763759A (zh) | 2018-11-06 |
Family
ID=64003637
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810532161.3A Pending CN108763759A (zh) | 2018-05-29 | 2018-05-29 | 一种基于isomap的固化热过程时空建模方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN108763759A (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110045606A (zh) * | 2019-03-25 | 2019-07-23 | 中南大学 | 一种用于分布式参数系统在线建模的增量时空学习方法 |
CN110427639A (zh) * | 2019-06-10 | 2019-11-08 | 广东工业大学 | 基于双尺度流形学习的锂离子电池热过程时空建模方法 |
CN111625995A (zh) * | 2020-05-25 | 2020-09-04 | 广东工业大学 | 一种集成遗忘机制和双超限学习机的在线时空建模方法 |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102184349A (zh) * | 2011-04-29 | 2011-09-14 | 河海大学 | 基于流形学习的基因表达数据的聚类系统及方法 |
-
2018
- 2018-05-29 CN CN201810532161.3A patent/CN108763759A/zh active Pending
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102184349A (zh) * | 2011-04-29 | 2011-09-14 | 河海大学 | 基于流形学习的基因表达数据的聚类系统及方法 |
Non-Patent Citations (2)
Title |
---|
KANG-KANG XU: ""Dual least squares support vector machines based spatiotemporal modeling for nonlinear distributed thermal processes"", 《JOURNAL OF PROCESS CONTROL》 * |
KANG-KANG XU: "ISOMAP-Based Spatiotemporal Modeling for Lithium-Ion Battery Thermal Process", 《IEEE TRANSACTIONS ON INDUSTRIAL INFORMATICS》 * |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110045606A (zh) * | 2019-03-25 | 2019-07-23 | 中南大学 | 一种用于分布式参数系统在线建模的增量时空学习方法 |
CN110427639A (zh) * | 2019-06-10 | 2019-11-08 | 广东工业大学 | 基于双尺度流形学习的锂离子电池热过程时空建模方法 |
CN110427639B (zh) * | 2019-06-10 | 2022-09-13 | 广东工业大学 | 基于双尺度流形学习的锂离子电池热过程时空建模方法 |
CN111625995A (zh) * | 2020-05-25 | 2020-09-04 | 广东工业大学 | 一种集成遗忘机制和双超限学习机的在线时空建模方法 |
CN111625995B (zh) * | 2020-05-25 | 2022-06-24 | 广东工业大学 | 一种集成遗忘机制和双超限学习机的在线时空建模方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Li et al. | Self-attention ConvLSTM and its application in RUL prediction of rolling bearings | |
CN113722877B (zh) | 一种对锂电池放电时温度场分布变化进行在线预测的方法 | |
Franz et al. | Interpolation-based reduced-order modelling for steady transonic flows via manifold learning | |
CN114548368B (zh) | 一种基于多层核超限学习机的锂电池温度场预测模型的建模方法以及预测方法 | |
CN108763759A (zh) | 一种基于isomap的固化热过程时空建模方法 | |
Xu et al. | Kernel-based random vector functional-link network for fast learning of spatiotemporal dynamic processes | |
Luo et al. | A laguerre neural network-based ADP learning scheme with its application to tracking control in the Internet of Things | |
CN108710767A (zh) | 一种基于isomap的锂电池热工艺时空建模方法 | |
CN110377942B (zh) | 一种基于有限高斯混合模型的多模型时空建模方法 | |
CN110895820B (zh) | 一种基于kcf的尺度自适应目标跟踪方法 | |
CN108717505A (zh) | 一种基于k-rvfl的固化热过程时空建模方法 | |
Zhou et al. | Network traffic prediction method based on improved echo state network | |
CN112800675A (zh) | 一种基于kpca和elm的时空分离分布参数系统建模方法 | |
CN112508244B (zh) | 一种用户级综合能源系统多元负荷预测方法 | |
CN109145346A (zh) | 基于双重最小二乘支持向量机的固化热过程时空建模方法 | |
CN114692501A (zh) | 基于多精度深度神经网络的气动数据融合方法及设备 | |
Uy et al. | Operator inference of non-Markovian terms for learning reduced models from partially observed state trajectories | |
Wei et al. | Two-dimensional spatial construction for online modeling of distributed parameter systems | |
Zhou et al. | Data-driven real-time prediction of pouch cell temperature field under minimal sensing | |
CN115080795A (zh) | 一种多充电站协同负荷预测方法及装置 | |
Wang et al. | Dissimilarity analysis-based multimode modeling for complex distributed parameter systems | |
CN107977730A (zh) | 一种多传感器数据融合技术的风速测量方法 | |
CN107742029A (zh) | 基于支持向量机的增识度超回归负荷建模多曲线拟合模型 | |
Chen et al. | Adaptive multi-head self-attention based supervised VAE for industrial soft sensing with missing data | |
Wang et al. | Dynamically weighted directed network link prediction using tensor ring decomposition |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20181106 |