CN110009094B

CN110009094B - 一种直拉硅单晶提拉速度-晶体直径辨识模型建模方法

Info

Publication number: CN110009094B
Application number: CN201910026707.2A
Authority: CN
Inventors: 刘丁; 张晶
Original assignee: Xian University of Technology
Current assignee: Xian University of Technology
Priority date: 2019-01-11
Filing date: 2019-01-11
Publication date: 2022-09-16
Anticipated expiration: 2039-01-11
Also published as: CN110009094A

Abstract

本发明一种直拉硅单晶提拉速度‑晶体直径辨识模型建模方法，具体按照如下步骤进行：步骤1、多次采样，记录直拉硅单晶在不同采样时刻k下的提拉速度和晶体直径，形成不同采样时刻k下的多组数据对；步骤2、确定得到具体的关于直拉硅单晶的提拉速度和晶体直径的离散时间非线性系统模型表达式；步骤3、对DBN网络进行训练；步骤4、将训练好的DBN网络作为直拉硅单晶提拉速度‑晶体直径辨识模型。本发明一种直拉硅单晶提拉速度‑晶体直径辨识模型建模方法解决了现有技术采用DBN网络进行训练存在的不足。

Description

一种直拉硅单晶提拉速度-晶体直径辨识模型建模方法

技术领域

本发明属于硅单晶生长辨识方法技术领域，具体涉及一种直拉硅单晶提拉速度-晶体直径辨识模型建模方法。

背景技术

硅单晶作为半导体行业基础材料之一，对集成电路产业发展起着重要作用。随着极大规模集成电路发展，对硅单晶提出了大尺寸、高品质等要求。目前制备硅单晶最为重要的方法是基于传统控制结构的直拉法。在传统控制结构中，晶体提拉速度依赖人工经验且控制器参数常通过反复实验获得。除此之外，晶体生长过程中晶体直径与晶体提拉速度之间的关系为非线性关系。为避免拉速曲线和控制器参数设置不合理，最有效策略是建立晶体提拉速度-晶体直径非线性模型，并采用基于模型的控制策略实现晶体直径控制，从而达到提高晶体品质的目的。

目前用于晶体生长过程建模的方法主要有集总参数模型、浅层结构算法，如BP神经网络等。集总参数模型法仅适应于能够写出数学表达式的系统，并且需要选取大量的参数，对参数选取精度要求高，而晶体生长过程机理过于复杂，因此在描写系统的数学表达式时对某些因素进行了忽略，导致得到的模型不够精确，也就难以满足精确控制的要求。浅层结构算法的局限性在于有限样本和计算单元下对复杂函数的表示能力有限，针对复杂分类和回归问题泛化能力受到一定制约。而深度学习可以通过学习一种深层非线性网络结构，实现复杂的函数逼近，因此本发明采用深度学习算法中的深度信念网络(DeepBelief Network，DBN)对直拉法单晶硅晶体生长过程中晶体直径-晶体提拉速度之间的关系进行建模。同时，由于训练DBN采用基于梯度的全局优化算法，容易陷入局部最优，并且训练时间长，因此本发明采用极限学习机来对网络参数进行求解，极限学习机具有学习速度快、泛化性能好等优点，运用到DBN训练中，不用进行反向调节参数而提高了DBN网络的性能。

发明内容

本发明的目的在于提供一种直拉硅单晶提拉速度-晶体直径辨识模型建模方法，解决了现有技术采用DBN网络进行训练存在的不足。

本发明所采用的技术方案是，一种直拉硅单晶提拉速度-晶体直径辨识模型建模方法，具体按照以下步骤实施：

步骤1、多次采样，记录直拉硅单晶在不同采样时刻k下的提拉速度和晶体直径，将直拉硅单晶在同一采样时刻下的提拉速度和晶体直径作为一组数据对，形成不同采样时刻k下的多组数据对： [x(1),y(1),...,x(k),y(k)]，k＝(1,2,3,...,n)；

步骤2、建立关于直拉硅单晶的提拉速度和晶体直径的离散时间非线性系统，利用经步骤1采样得到的多组数据对构建利普希茨商，再通过利普希茨商确定该离散时间非线性系统的输入和输出阶次，确定得到具体的关于直拉硅单晶的提拉速度和晶体直径的离散时间非线性系统模型表达式；

步骤3、利用经步骤2得到的关于直拉硅单晶的提拉速度和晶体直径的离散时间非线性系统模型表达式对DBN网络进行训练；

步骤4、将训练好的DBN网络作为直拉硅单晶提拉速度-晶体直径辨识模型，即训练好的DBN网络的权值和阈值作为关于直拉硅单晶的提拉速度和晶体直径的离散时间非线性系统模型的模型参数。

本发明的特点还在于：

步骤2具体按照以下步骤实施：

步骤2.1、利用NARMA模型建立关于直拉硅单晶的提拉速度和晶体直径的离散时间非线性系统模型如式(1)所示：

y(k)＝f[X(k)] (1)

式中，X(k)＝[y(k-1),...,y(k-n_y),x(k),...,x(k-n_u)]；x(k),...,x(k-n_u)为直拉硅单晶在不同采样时刻下的提拉速度；y(k-1),...,y(k-n_y)为直拉硅单晶在不同时刻下的晶体直径；k表示采样时刻；n_u、n_y分别表示该离散时间非线性系统的输入和输出阶次；

步骤2.2、描述直拉硅单晶提拉速度和晶体直径之间的非线性关系如式(2)所示：

y＝f(x)＝f(x₁,x₂,L,x_n) (2)

式中，x₁,x₂,L,x_n为经步骤1得到的直拉硅单晶在不同采样时刻k 下的提拉速度，y为直拉硅单晶晶体直径，f(x)是其定义域内的连续函数并满足：

式中，M是一个正数；

步骤2.3、构建关于直拉硅单晶的提拉速度和晶体直径的离散时间非线性系统的利普希茨商表达式如式(4)所示，将经步骤1得到的多组数据对：[x(1),y(1),...,x(k),y(k)]代入式(4)中得到利普希茨商q_ij：

式中，y_i和y_j表示不相同采样时刻下的晶体直径，|y_i-y_j|代表点 y_i和y_j在空间中的距离，x_i和x_j表示不相同采样时刻下的提拉速度， |x_i-x_j|代表点x_i和x_j在空间中的距离；

步骤2.4、基于式(2)对直拉硅单晶的提拉速度和晶体直径进行敏感性分析得：

δy＝f₁δx₁+f₂δx₂+L+f_nδx_n (5)

式中，δy＝y_n-y_n-1，f₁,f₂,f₃,...,f_n是函数f(x)关于x的偏导数，

结合式(4)和式(5)可得：

将式(5)代入式(6)得：

结合式(3)和式(7)可得：

式中，

表示输入变量x(k)，k＝n时，也即是输入变量x(k)个数为n时该非线性系统的利普希茨商；

步骤2.5、通过式(9)得到关于直拉硅单晶的提拉速度和晶体直径的离散时间非线性系统不同输入和输出阶次下的利普希茨商

式中，q_ij ⁽ⁿ⁾(k)由式(8)求得，k＝1,2,3,...,p，p为正整数，取值范围为：0.01～0.02n，n_u＝n_y＝(1,2,...,8)；

步骤2.6、根据式(9)得到的利普希茨商

观察n_u分别取值 1～8时，n_y增大，利普希茨商

基本不变，则确定此时利普希茨商

对应的n_y为最优n_y，将该最优n_y作为关于直拉硅单晶的提拉速度和晶体直径的离散时间非线性系统的输出阶次；

步骤2.7、根据式(9)得到的利普希茨商

在步骤2.6确定最优的n_y的基础上，固定n_y，观察n_u分别取值1～8时，取

计算

的值，并判断是否接近1，当比值接近1时，此时 n_u为最优n_u，将此最优n_u作为关于直拉硅单晶的提拉速度和晶体直径的离散时间非线性系统的输入阶次，其中

为和

输出阶次相同，输入阶次比

大一阶次的利普希茨商；

步骤2.8、将经步骤2.6、步骤2.7确定得到的关于直拉硅单晶的提拉速度和晶体直径的离散时间非线性系统的输入阶次n_u、输出阶次 n_y和经步骤1得到的[x(1),y(1),...,x(k),y(k)]代入式(1)中，确定得到具体的关于直拉硅单晶的提拉速度和晶体直径的离散时间非线性系统模型表达式。

步骤3具体按照以下步骤实施：

步骤3.1、确定DBN网络的训练周期，学习率η以及样本数量n，样本数量n为经步骤1获得的多组数据对的个数；

步骤3.2、初始化DBN网络层数N、权重w_ij、偏置量a,b，隐含层节点数，确定DBN网络层数的第N层为输出层，N＝4；

步骤3.3、使用连续受限玻尔兹曼机模型作为DBN网络的第一层，将经步骤2得到的关于直拉硅单晶的提拉速度和晶体直径的离散时间非线性系统模型表达式中的X(k)作为连续受限玻尔兹曼机模型的可视层状态向量，并记作v；

步骤3.4、将经步骤3.2初始化得到的权重w_ij作为连续受限玻尔兹曼机模型可视层和隐层之间的连接权重，利用式(10)计算得到连续受限玻尔兹曼机模型的隐层特征向量h¹，式(10)为：

式中，h¹＝(h₁,h₂,...,h_j)，v表示连续受限玻尔兹曼机模型的可视层状态向量，v＝(v₁,v₂,...,v_i)，i表示连续受限玻尔兹曼机模型可视层中包含的神经元个数，b_j为隐层的偏置，sigmoid为隐层的激活函数，j表示连续受限玻尔兹曼机模型隐层中包含的神经元个数；

步骤3.5、将经步骤3.2初始化得到的权重w_ij作为连续受限玻尔兹曼机模型可视层和隐层之间的连接权重，利用经步骤3.4得到的隐层特征h¹结合式(11)重构DBN网络第一层得到连续受限玻尔兹曼机模型可视层的状态向量v'，式(11)为：

式中，i表示连续受限玻尔兹曼机模型可视层中包含的神经元个数，j表示连续受限玻尔兹曼机模型隐层中包含的神经元个数，a_i为可视层的偏置，sigmoid为第一层的激活函数；

步骤3.6、利用式(12)-(14)更新连续受限玻尔兹曼机模型权重w_ij以及偏置量a，b，式(12)-(14)为：

a＝a_i+(v_i-v'_i) (13)

b＝b_j+[p(h_j|v)-p(h_j|v')] (14)

步骤3.7、将经步骤3.4的隐层特征h¹看作为DBN网络的第二层连续受限玻尔兹曼机模型的可视层向量，重复步骤3.4至3.6，得到 DBN网络的第二层连续受限玻尔兹曼机模型的隐层特征h²并且完成网络权值和偏置的更新；

步骤3.8、将经步骤3.7得到的隐层特征h²看作DBN网络的第三层连续受限玻尔兹曼机模型的可视层向量，重复步骤3.4至3.6，得到DBN网络的第三层连续受限玻尔兹曼机模型的隐层特征h³并且完成网络权值和偏置的更新，将h³看作为DBN网络的第四层连续受限玻尔兹曼机模型的可视层向量；

步骤3.9、对DBN网络的第N-2层到第N层采用ELM算法，已知DBN网络的第N-2层到第N层的网络模型为式(15)，式(15) 如下：

其中，β_i是DBN网络第N-1层和第N层之间的连接权重，w_ij是连续受限玻尔兹曼机模型可视层和隐层之间的连接权重也是第N-2 层和第N-1层之间的连接权重，h¹是上述步骤3.4中得到的连续受限玻尔兹曼机模型的隐层特征向量，c_i为第N-1层的偏置，t_j为目标输出，g是激活函数；

将式(15)矩阵化表示为：

Hβ＝T (16)

其中，H是DBN网络的第N-1层隐层节点输出矩阵，T为期望输出，β是DBN网络的第N-1层和第N层之间的连接权重，

利用式(16)的极小二范数的最小二乘解位移确定权重矩阵

式中，H⁺是H的Moore-Penrose广义逆矩阵；

步骤3.10、利用步骤3.9计算得到的

与H矩阵相乘，得到DBN 网络的最终输出o_j；

步骤3.11、利用式(18)判断DBN网络的最终输出误差e(k)是否达到设定阈值δ，式(18)为：

若达到设定阈值δ则停止训练，若没有则继续增加DBN网络的网络层数，重复步骤3.3至步骤3.11直至DBN网络的最终输出误差达到设定阈值δ。

本发明的有益效果是：本发明一种直拉硅单晶提拉速度-晶体直径辨识模型建模方法通过使用采样获得的数据对构建利普希茨商，通过利普希茨商确定系统的输入输出阶次，然后通过DBN网络建立辨识模型，在DBN网络第一层引入连续受限玻尔兹曼机模型，使其能够处理直接从系统中采集的输入输出数据，而非传统DBN网络输入必须为0和1，同时采用ELM算法对网络进行权值更新，并且简化了深度信念网络的反向训练过程，有效的解决了现有硅单晶晶体直径 -晶体提拉速度模型辨识方法精度不高的问题。

附图说明

图1是本发明一种直拉硅单晶提拉速度-晶体直径辨识模型建模方法辨识流程图；

图2是对直拉硅单晶晶体提拉速度进行采样得到的数据图；

图3是对直拉硅单晶晶体直径进行采样得到的数据图；

图4是系统输入阶次和输出阶次折线图；

图5是本发明一种直拉硅单晶提拉速度-晶体直径辨识模型建模方法运用的DBN网络结构图；

图6是DBN网络辨识直拉硅单晶直径输出与实际直径输出对比图；

图7是DBN网络辨识直拉硅单晶直径输出与实际直径输出误差图。

具体实施方式

下面结合附图和具体实施方式对本发明进行详细说明。

本发明一种直拉硅单晶提拉速度-晶体直径辨识模型建模方法，其辨识流程如图1所示，图中x(k)表示采样获得的为直拉硅单晶的提拉速度，y(k)表示为采样获得的直拉硅单晶的晶体直径，k表示采样时刻，e(k)表示DBN网络的输出误差，具体步骤如下：

本发明的特点还在于：

步骤2具体按照以下步骤实施：

y(k)＝f[X(k)] (1)

y＝f(x)＝f(x₁,x₂,L,x_n) (2)

式中，M是一个正数；

δy＝f₁δx₁+f₂δx₂+L+f_nδx_n (5)

结合式(4)和式(5)可得：

将式(5)代入式(6)得：

结合式(3)和式(7)可得：

式中，

步骤2.6、根据式(9)得到的利普希茨商

观察n_u分别取值 1～8时，n_y增大，利普希茨商

基本不变，则确定此时利普希茨商

步骤2.7、根据式(9)得到的利普希茨商

计算

为和

输出阶次相同，输入阶次比

大一阶次的利普希茨商；

步骤3具体按照以下步骤实施：

步骤3.3、使用连续受限玻尔兹曼机模型作为DBN网络的第一层，将经步骤2得到的关于直拉硅单晶的提拉速度和晶体直径的离散时间非线性系统模型表达式X(k)中的作为连续受限玻尔兹曼机模型的可视层状态向量，并记作v；

a＝a_i+(v_i-v'_i) (13)

b＝b_j+[p(h_j|v)-p(h_j|'v)] (14)

将式(15)矩阵化表示为：

Hβ＝T (16)

利用式(16)的极小二范数的最小二乘解位移确定权重矩阵

式中，H⁺是H的Moore-Penrose广义逆矩阵；

步骤3.10、利用步骤3.9计算得到的

与H矩阵相乘，得到DBN 网络的最终输出o_j；

实施例

首先，为提高计算速度，对直拉硅单晶在不同时刻下的提拉速度、晶体直径的每5个数据进行一次采样，采样时间2s，采样获得的提拉速度和晶体直径数据如图2、图3所示，将每次采样的提拉速度和晶体直径的数据记录成多组数据对，由于晶体提升速度和直径数据的数量级不同，将数据都归一化到[0，1]范围内，作为深度信念网络即DBN 网络的输入，选取其中700组作为训练数据，300组作为测试数据。

建立关于直拉硅单晶的提拉速度和晶体直径的离散时间非线性系统之后，将700组数据对输入至系统，如图4所示在输入阶次固定的情况下，输出阶次到4基本不变。固定输出阶次，可以看到输入阶次在3的时候，可以看出

的值接近1。因此可以确定本系统的输入阶次为3，输出阶次为4。

当确定了系统输入输出阶次，网络输入项也就确定，再对DBN网络进行辨识训练，训练之后的DBN网络如图5所示，网络结构为 6-100-100-1共四层，初始迭代次数为1000次，学习率为0.1，隐藏层激活函数使用sigmoid函数，输出层使用ReLU函数，将300组作为测试数据输入至训练之后的DBN网络进行辨识，输出结果如图6 和图7所示，分别表示直拉硅单晶直径输出辨识结果和直拉硅单晶直径输出辨识误差。从图6和图7可以看出，通过本发明一种直拉硅单晶提拉速度-晶体直径辨识模型建模方法得到的晶体提升速度-直径辨识模型，网络输出与实际输出数据基本重合，误差e(k)基本维持在 ±0.01之间，均方误差达到了1.4789e-10，辨识精度高。