CN112862332B

CN112862332B - 一种半导体制造系统投料控制方法及系统

Info

Publication number: CN112862332B
Application number: CN202110192363.XA
Authority: CN
Inventors: 李莉; 林国义
Original assignee: Tongji University
Current assignee: Tongji University
Priority date: 2021-02-20
Filing date: 2021-02-20
Publication date: 2022-05-03
Anticipated expiration: 2041-02-20
Also published as: CN112862332A

Abstract

本发明公开了一种半导体制造系统投料控制方法及系统，属于制造加工控制技术领域，方法包括如下步骤：基于训练好的极限学习机模型建立输入多个实时状态并输出动态阈值的WRELM投料策略模型；基于训练好的极限学习机模型和利用订单信息与工件投料优先级确定的多元线性回归方程，构建RPELM投料顺序模型；利用所述WRELM投料策略模型确定半导体制造系统的投料时刻，利用所述RPELM投料顺序模型确定半导体制造系统的投料顺序。本发明提供的方法及系统基于极限学习机能够对投料策略中阈值随实时状态变动进行动态调整，提升了投料控制策略效率。

Description

一种半导体制造系统投料控制方法及系统

技术领域

本发明涉及制造加工控制技术领域，尤其涉及一种半导体制造系统投料控制方法及系统。

背景技术

投料控制是半导体制造系统调度的重要组成部分，处于半导体制造系统调度体系的前端，在整个半导体制造过程调度中占据重要地位，投料控制影响着其他类型的调度，对提高半导体制造系统的整体性能具有重要意义。

在常用投料控制策略中，静态投料控制策略往往没有考虑生产线上的实时状态信息，而动态投料控制策略虽然考虑了实时状态信息，但是往往只考虑到实时状态信息中的一个方面，如CONWIP(Constant WIP，CONWIP)只考虑了生产线在制品数量，WR只考虑了瓶颈设备上的工作负荷。此外，动态投料控制策略中的阈值往往是根据试凑法确定，没有根据实时状态信息做出动态调整，所以常用投料控制策略中的静态投料方法和动态投料方法均没有完全考虑到生产线上的实时状态，具有一定的片面性。

改进投料控制策略是在常用投料控制策略上，综合了各种投料控制策略优点，但是效果与实用性相互矛盾，即投料策略的效果与实用性往往成负相关性。这种投料方式的效果可能显著，但是其复杂的决策机制往往需要大量的计算时间，影响投料决策的效率。

发明内容

本发明的目的在于克服现有技术中的不足，提供一种半导体制造系统投料控制方法及系统，基于极限学习机能够对投料策略中阈值随实时状态变动进行动态调整，提升了投料控制策略策略效率。

为达到上述目的，本发明是采用下述技术方案实现的：

一方面，本发明提供了一种半导体制造系统投料控制方法，包括如下步骤：

基于训练好的极限学习机模型，建立输入多个实时状态并输出动态阈值的WRELM投料策略模型；

利用所述WRELM投料策略模型确定半导体制造系统的投料时刻进行投料控制。

进一步的，极限学习机模型的训练方法包括如下步骤：

获取训练集和测试集；

初始化极限学习机模型的输入层权值矩阵和隐含层阈值矩阵；

将训练集输入所述极限学习机模型中求得极限学习机模型的输出层权值矩阵；

利用测试集对获得输出层权值矩阵的极限学习机模型进行验证，获得通过验证的极限学习机模型。

进一步的，建立输入多个实时状态并输出动态阈值的WRELM投料策略模型的方法包括如下步骤：

选取不同固定阈值的WR方法来进行仿真模拟获取样本；

将获取的样本输入训练好的极限学习机模型进行训练学习获得所述WRELM投料策略模型。

进一步的，训练学习获得所述WRELM投料策略模型的方法包括如下步骤：

根据仿真模拟的短期性能指标选取样本；

选取所述样本中所述短期性能指标对应的实时状态作为极限学习机模型的输入，选取所述短期性能指标对应的WR阈值作为极限学习机模型的输出；

根据所述样本、所述输入和所述输出模拟计算获得所述极限学习机模型的参数，所述参数包括输入层权值矩阵、隐含层阈值矩阵和输出层权值矩阵；

利用测试集对获得参数的极限学习机模型进行精度验证，获得所述WRELM投料策略模型。

进一步的，所述极限学习机模型的输出层权值矩阵β_(l×m)采用公式表示为：

β_l×m＝H⁺T

式中，H⁺是隐含层输出矩阵的Moore-Penrose广义逆，Hβ＝T，H为极限学习机的隐含层输出矩阵，β为输出层权值。

进一步的，所述极限学习机模型的输入层权值矩阵ω_(n×l)采用公式表示为：

式中，ω_n×l为第n输入层的输入层权值。

进一步的，所述极限学习机模型的隐含层阈值矩阵b_(l×1)采用公式表示为：

b_l×1＝[b₁ b₂…b_l]′

式中，b_l为第l隐含层的隐含层阈值。

构建RPELM投料顺序模型的方法包括如下步骤：

进一步的，构建工件的订单信息与投料优先级之间关系的多元线性回归方程，所述订单信息包括净加工时间、订单平均加工时间、加工步数和是否为紧急工件，所述投料优先级包括普通工件和紧急工件；

基于训练好的极限学习机模型和所述多元线性回归方程训练获得所述RPELM投料顺序模型。

进一步的，对于普通工件，工件的投料优先级和订单信息之间关系采用如下公式表示：

Y＝α₁x₁+α₂x₂+…+α_mx_m

式中，α₁，α₂，...，α_m表示偏回归系数，x₁，…，x_m表示订单信息。

对于紧急工件，工件的投料优先级和订单信息之间关系采用如下公式表示：

式中，P_i、CT_i、T_i和Steps_i分别表示工件优先级，订单给定的平均加工周期，订单给定的净加工时间和工件Lot_i的加工步数；IsHotLot(i)的值根据则工件Lot_i是否为紧急工件来确定，若工件为紧急工件，则值为1，否则值为0；a,b和c分别代表的是工件Lot_i的CT_i，T_i和Steps_i对确定优先级的权重。

另一方面，本发明提供了一种半导体制造系统投料控制系统，包括如下模块：

策略模型构建模块，用于基于训练好的极限学习机模型建立输入多个实时状态并输出动态阈值的WRELM投料策略模型；

顺序模型构建模块，用于基于训练好的极限学习机模型和利用订单信息与工件投料优先级确定的多元线性回归方程，构建RPELM投料顺序模型；

控制模块，用于利用所述WRELM投料策略模型确定半导体制造系统的投料时刻，利用所述RPELM投料顺序模型确定半导体制造系统的投料顺序。

与现有技术相比，本发明所达到的有益效果：

本发明提供的方法及系统基于极限学习机，并构建考虑到实时状态阈值的WR方法获得WRELM投料策略模型，能够对投料策略中阈值随实时状态变动进行动态调整，并基于订单信息和投料优先级确定投料顺序模型，结合投料策略模型确定的投料时刻和投料顺序模型确定的投料顺序进行投料控制，提升了投料控制效率。

附图说明

图1是本发明实施例提供的一种半导体制造系统投料控制方法的流程图；、

图2是本发明实施例提供的一种极限学习机模型的训练流程图；

图3是本发明实施例提供的一种极限学习机模型的结构示意图；

图4是本发明实施例提供的一种获得WRELM投料策略模型的流程图；

图5是本发明实施例提供的一种不同投料方法对TH性能影响的对比图；

图6是本发明实施例提供的一种不同投料方法对CT性能影响的对比图；

图7是本发明实施例提供的一种半导体制造系统投料控制系统的框图；

图8是本发明实施例提供的一种FIFO,EDD和RPELM下TH的比较图；

图9是本发明实施例提供的一种FIFO,EDD和RPELM下CT的比较图；

图10是本发明实施例提供的一种FIFO,EDD和RPELM下ODR的比较图；

图11是本发明实施例提供的一种FIFO,EDD和RPELM下HLODR的比较图；

图12是本发明实施例提供的一种获得RPELM投料策略模型的流程图。

具体实施方式

下面结合附图对本发明作进一步描述。以下实施例仅用于更加清楚地说明本发明的技术方案，而不能以此来限制本发明的保护范围。

在本发明的描述中，需要理解的是，术语“中心”、“纵向”、“横向”、“上”、“下”、“前”、“后”、“左”、“右”、“竖直”、“水平”、“顶”、“底”、“内”、“外”等指示的方位或位置关系为基于附图所示的方位或位置关系，仅是为了便于描述本发明和简化描述，而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作，因此不能理解为对本发明的限制。此外，术语“第一”、“第二”等仅用于描述目的，而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此，限定有“第一”、“第二”等的特征可以明示或者隐含地包括一个或者更多个该特征。在本发明的描述中，除非另有说明，“多个”的含义是两个或两个以上。

在本发明的描述中，需要说明的是，除非另有明确的规定和限定，术语“安装”、“相连”、“连接”应做广义理解，例如，可以是固定连接，也可以是可拆卸连接，或一体地连接；可以是机械连接，也可以是电连接；可以是直接相连，也可以通过中间媒介间接相连，可以是两个元件内部的连通。对于本领域的普通技术人员而言，可以通过具体情况理解上述术语在本发明中的具体含义。

如图1所示，本发明实施例提供了一种半导体制造系统投料控制方法，包括如下步骤：

利用所述WRELM(Workload Regulation With Extreme Learning Machine,WRELM)投料策略模型确定半导体制造系统的投料时刻进行投料控制。

在本实施例中，如图3所示，极限学习机模型包括多个输入层节点，多个隐含层节点和多个输出层节点；

每一个所述输入层节点分别连接所有所述隐含层节点，每一个所述隐含层节点分别连接所有输出层节点。

如图2所示，极限学习机模型(Extreme Learning Machine,ELM)的训练方法包括如下步骤：

获取训练集和测试集；

具体地，在本实施例中，极限学习机模型由n个输入层节点，l个隐含层节点和m个输出层节点组成。

极限学习机模型(Extreme Learning Machine,ELM)的训练方法如下所述，其中，输入层权值ω_ij表示输入节点i和隐含层节点j之间的增益，如下公式(1)所示：

在如下公式(2)中，输出层权值β_jk表示第j个隐含层神经元与第k个输出之间的增益。

式中，b_l×1表示隐含层的阈值，如公式(3)所示:

b_l×1＝[b₁ b₂ … b_l]′ (3)

在本实施例中，ELM算法无需迭代训练和学习数据，随机初始化输入层权值矩阵ω_n×l和隐含层阈值矩阵b_l×1。设训练集有Q个样本，输入矩阵为X，输出矩阵为Y，分别可以如下公式(4)和公式(5)表示：

在本实施例中，设隐含层的激活函数为g(x)，一般取Sigmoid函数，则可知该网络的输出如公式(6)和公式(7)所示。

T_m×Q＝[t₁，t₂，...，t_Q] (6)

为了得到β_jk，公式(6)和公式(7)可以简化为公式(8)，其中，H为极限学习机的隐含层输出矩阵，具体形式如公式(9)。这样，β_jk就可以通过公式(10)得到，其中，H⁺是隐含层输出矩阵的Moore-Penrose广义逆。

Hβ＝T (8)

β_l×m＝H+T (10)

最后，通过建立起来的ELM模型，输入测试集就可以得到相应的输出。

在本实施例中，建立输入多个实时状态并输出动态阈值的WRELM投料策略模型的方法包括如下步骤：

选取不同固定阈值的WR方法来进行仿真模拟获取样本；

具体地，训练学习获得所述WRELM投料策略模型的方法包括如下步骤：

根据仿真模拟的短期性能指标选取样本；

在本实施例中，如图4所示，获得所述WRELM投料策略模型的方法具体包括如下步骤：

步骤1：样本采集。

首先，选取不同固定阈值的WR方法来进行仿真。其目的是为了尽可能覆盖不同实时状态下的最优WR阈值。即最后生成的模型WRELM中的阈值会根据不同的实时状态动态改变，可以促使生产线性能达到最优。

其次，对于每一个阈值选取含有不同产品比例的不同订单。不同产品比例的不同订单投入到生产线中会使实时状态尽可能多样化，最终的模型中的学习机制便可以适用于不断变化的实时状态以达到最后性能指标最优化。

最后，记录实时状态信息和短期性能指标。实时状态信息包括不同种类在制品的数量和不同加工阶段在制品的数量。短期性能指标包括每天的加工步数(日MOV)和瓶颈设备的利用率。短期性能会影响最终的性能指标TH和CT，这些数据记录将作为训练集。

步骤2：学习过程

选择建立ELM的输入和输出数据。这里，我们选取实时状态作为输入，WR的阈值作为输出，但并不是选取所有的实时状态和WR阈值作为输入和输出。首先会根据短期性能指标的优劣选取优异的样本，然后选取了与优良短期性能指标对应的实时状态和WR阈值作为ELM的输入和输出。

然后在MATLAB软件中实现ELM代码，并将优良样本数据添加到MATLAB代码中，通过MATLAB仿真记录ELM的ω_n×l,β_l×m和b_l×1。其中，ω_n×l和b_l×1是随机产生的，而β_l×m可以根据公式10得出。

通过上面步骤，ELM学习机制中的参数都已经确定，最后只要通过测试样本来判断ELM学习机的精度是否达到了要求。

步骤3:模型应用

确定ELM参数后，便可以在调度仿真系统中实现学习机制，包括ELM参数的记录和算术表达式代码的实现。实现了考虑ELM的优化仿真系统后，在实际仿真中，极限学习机的输出，也就是WR的阈值将会根据多个实时状态和学习机制动态改变，克服了普通动态投料控制策略中的不足之处。

在本实施例中，确定投料时刻的简单控制策略包括FIFO，EDD，CONWIP，SA，WIPCTRL和WR，本实施例在实际半导体生产线BL模型上进行仿真并比较这些策略的优劣，选取出片量和平均加工周期作为性能指标来评价这些策略性能。模型运行90天，其中前30天作为预热期，仿真结果如表1所示，其中TH_CMP和CT_CMP表示各策略与FIFO在TH和CT性能指标上的比较。

表1简单投料策略的比较

Strategy	TH(lot)	TH_CMP	CT(hour)	CT_CMP
					FIFO	371	0.00％	991	0.00％
EDD	371	0.00％	989	0.20％
					CONWIP	381	2.70％	988	0.30％
SA	383	3.20％	955	3.63％
					WIPCTRL	382	2.96％	981	1.01％
WR	385	3.77％	954	3.73％

由表1可知，静态投料控制策略FIFO和EDD的出片量相等，但EDD策略的平均加工周期比FIFO稍微优越，降低了0.20％。CONWIP、SA、WIPCTRL和WR策略较FIFO策略在出片量和平均加工周期性能上都有所提高，它们在出片量上分别提高了2.70％、3.20％、2.96％和3.77％，在平均加工周期上分别提高了0.30％、3.63％、1.01％和3.73％。

综上所述，动态投料控制策略的性能远优于静态投料控制策略，这是因为动态投料控制策略考虑了生产线实时状态，能够根据实时状态做出投料调整，而在所有的动态投料控制策略中，本实施例采用WR策略。

在本实施例中，仿真是在BL模型上进行的。在实验中选取了五种不同的工件，每类工件在瓶颈设备上都有不同的加工时间，这样可以保证不同比例工件的订单在瓶颈设备上可以产生不同的实时状态，如表2所示。

根据预先的仿真，瓶颈设备上的负荷值在0分和900分之间，性能结果较好，所以这里选择从0分到900分范围内间隔100的10数值作为WR方法中不同固定阈值。其中，当阈值为0分时，订单不会根据瓶颈设备上的工作负荷进行投料，只会依据事先排好顺序的订单进行投料，此时的投料规则就是FIFO。同时，在每个阈值下，选择22种具有不同比例工件的订单来进行22次仿真，每个订单仿真1次，共220次仿真。

表2不同工件在瓶颈设备上的加工次数

工件名	瓶颈设备加工次数(次)
		UF100300	5
V16N50	9
		1117F6	12
8563	15
		YTD0325	22

本实施例中，每次仿真进行90天，其中前30天为预热期，目的是使生产线上的各个加工区达到平衡状态。从第31天开始记录实时状态信息和短期性能指标信息，共采集13200(＝60*220)组样本数据。这些样本中，一般的日加工步骤是3400步，利用率是60％，选取560组高日加工步骤数和高利用率的样本作为训练集，其中阈值为200分的一部分优良样本见表3。

表3训练集示例

将不同工件在制品的数量和不同加工阶段在制品的数量作为ELM的输入，其对应的阈值被选作输出，然后通过MATLAB仿真建立ELM机制，经过测试集测试验证已建立的ELM机制的精确性。同时，矩阵ω_n×l,b_l×1,β_l×m在MATLAB仿真建立ELM学习机后将被记录到BL仿真系统中。

建立起极限学习机后，通过仿真来比较WRELM与其他简单投料规则的优劣，因为已经知道简单投料规则中的WR投料策略性能最优，所以只与WR投料策略做比较。同样在BL模型上仿真90天，前30天作为预热期。在具有不同阈值的多个WR策略中选取了代表一般性能和最优性能的两个仿真结果作为比较。Orderi(1≤i≤5)表示工件比例不同的5个订单。仿真结果如表4，仿真结果比较如表5所示。为了便于表述仿真的比较，仿真结果以柱状图显示，如图5和图6所示。其中，WR1，WR2分别表示性能最好的仿真和平均性能的仿真结果，TH_IMP_WR1和CT_IMP_WR1分别表示WRELM相对于WR1结果TH和CT的提高百分比，TH_IMP_WR2和CT_IMP_WR2分别表示WRELM相对于WR2结果TH和CT的提高百分比。

表4 WR和WRELM的仿真结果比较

表5 WR和WRELM仿真结果比较

由表4、表5、图5和图6可以得到以下几点结论：

(1)对于order1和order2中，图5中显示WRELM的TH和WR1的TH相等，图6显示WRELM的CT要稍低于WR1的CT，WRELM性能在CT性能指标上的有所提高。在订单order3，order4，order5中，WRELM的TH和CT都要优于WR1的TH和CT，但优势也并不非常明显，这是由于WR1的阈值取值是在WR策略中最好的，性能本身就很优异。

(2)相对于WR2，WRELM策略的仿真性能有明显的改善。在几次仿真中，WRELM相对于WR2在TH上最大改善幅度为5.94％，最小为3.04％；在CT上最大值为20.75％，最小值也有6.61％。

(3)总体来说，WRELM的性能和性能最佳的WR1差不多，但相对于一般性能的WR2在TH和CT上平均分别能提高4.03％和15.40％。

在本实施例中，基于训练好的极限学习机模型和利用订单信息与工件投料优先级确定的多元线性回归方程，构建RPELM投料顺序模型。

具体地，投料策略主要用来确定何时投入多少数量的何种工件到生产线上。上述WRELM投料策略模型主要控制的是投料时刻，而RPELM投料顺序模型是一种考虑极限学习机控制投料顺序的投料策略(Release Plan With ELM,RPELM)。

当某种工件在生产线上加工阻塞时，我们需要延迟投入这种工件到生产线中，并且先投入那些加工流畅的工件，否则继续投入会使生产线变得更加阻塞，从而使出片量、准时交货量等性能指标变差。考虑投料顺序的普通投料策略主要有FIFO和EDD，但是仅考虑到了订单信息，忽略了生产线上的实时状态信息。RPELM则同时考虑到了订单信息和生产线上的实时状态信息来决定投料顺序。

在本实施例中，对影响投料的订单信息进行分析。

具体地，对不同工件来说，工件的固有属性主要包括加工步数、净加工时间、订单给定的平均加工周期以及是否为紧急工件。

工件的加工步数表明工件流程的长短，加工步数越多说明其被派工次数越多，会更大概率增加工件在加工区上的等待时间，影响工件的平均加工周期。净加工时间表示工件在无阻塞的情况下完成加工所需的时间，净加工时间越小说明在生产线流畅情况下工件在生产线上的滞留时间越少，平均加工周期越少。平均加工周期表示在一类工件从投入生产线开始加工到完成加工的时间间隔平均值，平均加工周期越小说明其流动性越快，设备的利用率更高，生产线产能越高。一个工件如果是紧急工件则应当优先投入到生产线上进行加工以优化紧急工件的准时交货率(HLODR)和平均加工周期(CT)。

综上，我们选取影响投料的订单信息有4个因素：净加工时间、订单平均加工周期、加工步数和是否为紧急工件。

在本实施例中，考虑紧急工件的派工规则。

由于考虑了紧急工件，所以首先需要在仿真模型中区分紧急工件和普通工件。一般来说，紧急工件是由于交货期紧张而需要优先投入到生产线中的工件，所以设定紧急工件的交货期小于普通工件。这里定义普通工件交货期为投入时间加上工件的平均加工周期，紧急工件交货期为投入时间加上工件平均加工周期与一个系数的乘积，该系数为0.8到1之间的一个随机数。普通工件和紧急工件交货期如公式11和12所示。

DueDate(i)＝ReleaseTime(i)+CT(i) (11)

HotLotDueDate(i)＝ReleaseTime(i)+CT(i)*random(0.8，1) (12)

式中，DueDate(i)为工件i的交货期，HotLotDueDate(i)为紧急工件i的交货期，ReleaseTime(i)为工件i的投料时刻，CT(i)为工件i的给定加工时间，random(0.8，1)为大小范围在0.8到1之间的一个随机数。

一般情况下，我们在做投料控制策略时不考虑复杂的派工规则，只是简单采用FIFO，也就说先进入加工区的工件优先进行加工，而不考虑工件的紧急程度。但现在生产线上加入了紧急工件，所以派工规则必须考虑到紧急工件并有所改动。这里我们改进FIFO派工规则，使派工规则首先观察加工区上是否有紧急工件，如果有紧急工件，按照FIFO规则从这些紧急工件中选出最早到加工区的工件进行加工；如果没有紧急工件则按照FIFO规则选出工件进行加工。

同样情况的还有批加工规则，一般情况在批加工设备所处的加工区中，会首先按照FIFO挑选出一类工件进行组批加工。但在有紧急工件的情况下，批加工规则首先会按照FIFO将一类紧急工件纳入组批范围，如果紧急工件数量少于组批工件数量，则按照FIFO选取同类普通工件与紧急工件一起组批；若没有紧急工件，则简单地按照FIFO挑选一类工件进行组批。

为了比较考虑紧急工件后改进的派工规则与改进前的派工规则，我们在紧急工件比例为10％，在制品数量为2500情况下在MIMAC仿真模型上进行仿真并做了比较。仿真中的投料控制策略分别为FIFO、EDD和RPELM，RPELM将会在下文做详细介绍，仿真的目的主要为了观察派工规则改变前后的仿真性能变化。仿真共进行90天，其中前30天为预热期，仿真结果如表6所示，仿真结果性能改变比例见表7所示。

表6改进派工规则前后仿真比较

表6派工规则改变前后仿真性能改变比例

	FIFO	EDD	RPELM
				TH(lot)	0.00％	-1.02％	-0.68％
CT(hour)	-1.43％	-1.72％	-1.15％
				ODR	2.01％	1.33％	1.74％
HLODR	53.20％	42.50％	48.50％

从表6中，我们可以看出派工规则改变前后，TH性能指标稍微变差但不明显。CT性能指标变差较明显，投料规则为FIFO，EDD，RPELM情况下分别降低-1.43％，-1.72％和-1.15％。但是ODR和HLODR性能都有所改善，尤其是HLODR性能呈现大幅度提升。在投料规则为FIFO，EDD，RPELM下，ODR分别改善2.01％，1.33％和1.74％；而HLODR则分别改善了53.20％，42.50％和48.50％。可见改进的派工规则对于紧急工件交货率的提升能起到明显作用，并且对整体的性能指标而言利远大于弊，所以在MIMAC仿真中，涉及紧急工件的情况下，将会采用改进的派工规则。

在本实施例中，利用多元线性回归方程确定投料优先级。

影响投料的订单因素有净加工时间、订单平均加工时间、加工步数和是否为紧急工件。为了确定这四个因素与投料顺序的关系，可以采用多元线性回归方程来确定工件的投料优先级。

线性回归是一种经过深入研究并在实际应用中广泛使用的表达式，这是因为线性依赖于其未知参数的模型比非线性依赖于其位置参数的模型更容易拟合，而且产生的统计特性也更容易确定。

线性回归的一般数学表达式为：

Y＝α₁x₁+α₂x₂+…+α_mx_m (13)

式13中，α₁，α₂，...，α_m表示偏回归系数，x₁，…，x_m表示订单信息。

对于普通工件，可以利用式13来表述工件的投料优先级和订单信息表之间的关系，

对于紧急工件则需要额外增加一个参数来进一步提高紧急工件的投料优先级，如式14所示。

其中，P_i、CT_i、T_i和Steps_i分别表示工件优先级，订单给定的平均加工周期，订单给定的净加工时间和工件Lot_i的加工步数。式14中IsHotLot(i)的值根据则工件Lot_i是否为紧急工件来确定，若工件为紧急工件，则值为1，否则值为0。a,b和c分别代表的是工件Lot_i的CT_i，T_i和Steps_i对确定优先级的权重，这些权重是以实时状态信息作为输入，通过ELM学习机制推导出来的，所以RPELM同时考虑到了订单信息和实时状态信息。

在本实施例中，最终基于极限学习机确定投料顺序。

上述已经得出了订单信息与工件投料优先级的多元线性回归方程，同时提出为了从实时状态中推出工件信息权重，需要建立极限学习机。为了建立ELM学习机，首先需要获得足够多的样本，并从中选取优异样本作为训练集。训练集是未建立ELM的输入和输出数据。

基于ELM和多元线性回归方程确定投料顺序的仿真模型构建流程如图12所示，主要步骤如下。

步骤1：样本采集

首先，随机选取a,b和c。将随机生成的a,b和c应用到多元线性回归方程中，得到工件投料优先级，然后便根据工件投料优先级进行仿真产生样本。

然后，需要记录样本。样本数据是指实时状态信息和短期性能指标。实时状态信息包括不同种类工件在生产加工阶段的前段，中段和后段的数量。短期性能指标包括瓶颈设备的利用率，每天的加工步数(MovPerDay)，每天的出片量(THPerDay)和每月的准时交货率(ODRPerDay)。这些短期性能指标能够反映长期性能指标，也就是最终的性能指标，包括TH,CT和ODR，HLODR等。

步骤2：学习过程

首先，选择ELM的训练集。选取对应于优良短期性能指标的实时状态和订单信息比重值的统计结果分别作为ELM的输入和输出。然后在MATLAB上编程，仿真运行建立极限学习机制。

其次，采用测试样本集对建立起来的学习机制进行测试检查ELM学习机制的精度是否达到要求。

步骤3：模型应用

在调度仿真系统中实现学习机制。包括ELM参数的记录和算术表达式代码的实现。完成以上步骤后，订单中工件在优化的仿真系统中，其优先级便会根据订单信息，实时状态信息和ELM机制实时改变。

最后根据对优化的仿真系统运行仿真得到仿真性能指标，并与其他的投料策略进行比较。

为了比较RPELM和FIFO，EDD投料策略的优劣，在MIMAC模型上分别对采用FIFO、EDD和RPELM不同策略进行仿真，并比较仿真结果。每次仿真进行90天，其中前30天为预热期，派工规则为改进的FIFO。

MIMAC模型有9种工件，选择它们在加工前段，中段和后段的数量作为实时状态，共有27个实时状态信息。同时，选取了TH，CT，ODR和HLODR作为性能评价指标。

为了使结果更具有说服力，分别在生产线在制品数量固定为2500片、3500片、4500片和5500片的情况下进行仿真，仿真结果如表7，仿真结果比较见表8。为了方便观察结果，同时将仿真结果以柱状图显示，如图8、图9、图10和图11所示。

表7不同在制品数量下的FIFO,EDD和RPELM投料策略仿真结果

表8不同在制品数量下的FIFO,EDD和RPELM投料策略仿真结果比较

由表10、表11、图8、图9、图10和图11可以得到如下结论：

⑴从图8中，可以看出各种策略在同一在制品数量限制下的TH几乎没有改变，策略之间最大的变动幅度是在5500片时RPELM较EDD改进的1％，这是由于在制品数量限制了生产线的加工能力，也就限制了生产线出片量。同时，也能看出TH随着在制品数量的提高大致呈现上升趋势，这是因为生产线固定在制品数量的提高意味着生产线加工能力变强，产能提高，但也能发现固定在制品数为4500片时的出片量却比固定在制品数为3500片的时候低，这可能是由于在制品数量的提高会导致生产线上工件阻塞加剧从而影响出片量。从这里可以看出生产线出片量是受到生产线加工能力以及生产线阻塞情况共同影响。

⑵从图9中可以看出，RPELM的CT较FIFO和EDD的CT有所改进，但很不明显。同时也能发现，随着固定在制品数量的上升，各种投料策略下的CT性能一致下降，这是由于生产线固定在制品数量上升会加剧生产线上工件加工的阻塞，工件在加工区等候加工时间整体延长，导致CT性能指标下降。

⑶图10表明ODR可以通过使用RPELM投料控制策略改进很多。在固定在制品数量为2500片、3500片、4500片和5500片下，RPELM相对于FIFO分别能够提高3.64％，3.32％，3.72％和2.17％，相对于EDD分别能够提高3.65％，3.94％，3.77％和1.78％。这说明RPELM通过考虑实时状态信息后能够实时做出策略调整来提高ODR。但与此同时我们也能发现ODR性能随着固定在制品数量的上升而下降，这同样是由于生产线阻塞加剧所致。

⑷图11表明当生产线负载是轻载的时候，紧急工件交货期能够通过RPELM明显提高，在固定在制品数量为2500片、3500片、4500片的情况下，RPELM相对于FIFO在HLODR性能上分别提高了9.30％，3.57％，1.91％；在固定在制品数量为3500片和4500片的情况下，RPELM相对于EDD分别提高了7.14％和1.91％。同时，们也可以发现HLODR的性能改善会随着生产线在制品数量的提高而减弱。究其原因，同样是由于生产线阻塞加剧，从而使紧急工件的交货期整体下降。

整体上讲，RPELM比FIFO和EDD两种投料策略能取得更好的最终性能指标。尤其是当生产线为轻载时，RPELM能够有效改善工件的准时交货率和紧急工件的准时交货率。很明显，这是由于RPELM考虑到了生产线的实时状态做出实时调整所取得的成果。

另一方面，本发明实施例还提供了一种半导体制造系统投料控制系统，包括如下模块：

在本实施例中，所述极限学习机模型包括多个输入层节点，多个隐含层节点和多个输出层节点；

与现有技术相比，本发明提供的方法及系统基于极限学习机，并构建考虑到实时状态阈值的WR方法获得WRELM投料策略模型，能够对投料策略中阈值随实时状态变动进行动态调整，提升了投料控制策略效率。

以上所述仅是本发明的优选实施方式，应当指出，对于本技术领域的普通技术人员来说，在不脱离本发明技术原理的前提下，还可以做出若干改进和变形，这些改进和变形也应视为本发明的保护范围。

Claims

1.一种半导体制造系统投料控制方法，其特征在于，包括如下步骤：

基于训练好的极限学习机模型建立输入多个实时状态并输出动态阈值的WRELM投料策略模型；

基于训练好的极限学习机模型和利用订单信息与工件投料优先级确定的多元线性回归方程，构建RPELM投料顺序模型；

利用所述WRELM投料策略模型确定半导体制造系统的投料时刻，利用所述RPELM投料顺序模型确定半导体制造系统的投料顺序。

2.根据权利要求1所述的半导体制造系统投料控制方法，其特征在于，极限学习机模型的训练方法包括如下步骤：

获取训练集和测试集；

3.根据权利要求2所述的半导体制造系统投料控制方法，其特征在于，建立输入多个实时状态并输出动态阈值的WRELM投料策略模型的方法包括如下步骤：

选取不同固定阈值的WR方法来进行仿真模拟获取样本；

4.根据权利要求3所述的半导体制造系统投料控制方法，其特征在于，训练学习获得所述WRELM投料策略模型的方法包括如下步骤：

根据仿真模拟的短期性能指标选取样本；

5.根据权利要求4所述的半导体制造系统投料控制方法，其特征在于，所述极限学习机模型的输出层权值矩阵β_(l×m)采用公式表示为：

β_l×m＝H⁺T

6.根据权利要求5所述的半导体制造系统投料控制方法，其特征在于，所述极限学习机模型的输入层权值矩阵ω_(n×l)采用公式表示为：

式中，ω_n×l为第n输入层的输入层权值。

7.根据权利要求6所述的半导体制造系统投料控制方法，其特征在于，所述极限学习机模型的隐含层阈值矩阵b_(l×1)采用公式表示为：

b_l×1＝[b₁ b₂…b_l]′

式中，b_l为第l隐含层的隐含层阈值。

8.根据权利要求1所述的半导体制造系统投料控制方法，其特征在于，构建RPELM投料顺序模型的方法包括如下步骤：

构建工件的订单信息与投料优先级之间关系的多元线性回归方程，所述订单信息包括净加工时间、订单平均加工时间、加工步数和是否为紧急工件，所述投料优先级包括普通工件和紧急工件；

9.根据权利要求2所述的半导体制造系统投料控制方法，其特征在于，对于普通工件，工件的投料优先级和订单信息之间关系采用如下公式表示：

Y＝α₁x₁+α₂x₂+…+α_mx_m

式中，α₁，α₂，...，α_m表示偏回归系数，x₁，…，x_m表示订单信息；

10.一种半导体制造系统投料控制系统，其特征在于，包括如下模块：