一种半导体制造设备和工艺的智能控制系统
技术领域
本发明涉及半导体制造设备和工艺控制技术领域,具体涉及一种半导体制造设备和工艺的智能控制系统。
背景技术
在半导体制造和生产过程中,半导体器件的质量异常问题很难与半导体制造设备和工艺的行为直接建立联系,现有技术中,通常只能在半导体器件的质量出现异常后由技术人员检查与判断后制定下一步的处理措施,每一次检查与判断半导体器件的异常都是一个推测、验证的迭代过程,并且技术人员仅仅在半导体器件的质量发生异常时才查阅有关的半导体制造设备和工艺测量数据,找出问题原因,这种模式造成以下问题:
(1)人为因素影响大:在上述模式下,导体制造设备和工艺的检测数据的使用方法和效果由技术人员本身熟知的经验及判断而决定的,因此造成异常事件发生后的工艺结果差异非常大,且不同的工程师彼此亦存在不同的差异,特别是经验较浅与经验较深的工程师之间的工艺结果差异非常大;
(2)缺乏连贯学习机制:每一次异常事件的处理也是一个学习机会,可以为未来处理相关事件提供帮助,但是由于缺乏系统支持,每一次异常事件处理的历史数据,包括异常事件现象分析、处理意见和执行效果分散在不同的空间,不能形成持续学习的机制;
(3)手动处理数据耗费时间长:技术人员在一适当控制参数的决定上可能要花费数小时的时间,严重降低产能;
(4)没有异常行为预测功能:只有当半导体材料和器件出现问题和偏离时才启动问题检测模式,不能在问题出现的初期,采取预防,从而避免产品质量问题。
发明内容
针对上述问题,本发明提供一种半导体制造设备和工艺的智能控制系统。
本发明的目的采用以下技术方案来实现:
提供了一种半导体制造设备和工艺的智能控制系统,包括数据预处理单元、离群点检测单元、支持向量机训练单元、智能监控单元和持续学习单元;
数据预处理单元包括预处理模块和聚类处理模块,预处理模块用于对半导体制造设备和工艺采集的数据采集的数据进行预处理,聚类处理模块通过全局K-均值聚类算法对预处理模块预处理后的数据进行聚类处理;
离群点检测单元对聚类处理后的数据进行离群点检测,得到离群点集;
支持向量机训练单元将离群点集划分为训练样本集和测试样本集,并利用训练样本集对支持向量机进行训练,并通过查看测试样本集对支持向量机验证的结果来完成支持向量机的训练与测试验证;若验证结果不符合要求,则调整支持向量机参数,再通过迭代计算,直到验证结果符合要求,输出最终数据训练参数给智能监控单元;
所述智能监控单元用于利用支持向量机训练单元输出的最终数据训练参数监测和控制半导体制造设备和工艺;
所述持续学习单元用于当智能监控单元监测到半导体制造设备和工艺发生异常行为时,将新发现的异常行为数据及其前后相邻的正常数据组成新训练样本数据集并进行标注,利用新样本数据集对支持向量机进行训练,输出新训练参数给智能监控单元,对智能监控单元进行参数更新。
优选地,所述半导体制造设备和工艺采集的数据包括在半导体材料和器件制造过程中半导体制造设备检测和控制的宏观参数和微观参数。
优选地,所述宏观参数包括温度、压力、流量、化学成分参数,所述微观参数包括物理过程与化学过程的参数。
本发明的有益效果为:本发明对半导体制造设备和工艺采集的海量数据进行挖掘,充分利用所述数据资源实现对半导体设备和工艺进行智能控制,保证了半导体材料和器件生产质量,当半导体材料和器件的质量发生异常时能够更高效率的找到异常发生的原因,并具有持续学习的机制,解决了现有技术中因技术人员自身经验限制造成的工艺结果差异;并且利用所述智能控制系统的持续学习功能,还解决了现有技术中因缺乏连贯学习机制造成的异常事件处理经验的丢失;还提高了异常事件处理效率,提高产能。
附图说明
利用附图对本发明作进一步说明,但附图中的实施例不构成对本发明的任何限制,对于本领域的普通技术人员,在不付出创造性劳动的前提下,还可以根据以下附图获得其它的附图。
图1是本发明一个示例性实施例的系统结构示意框图;
图2是本发明一个示例性实施例的数据预处理单元的结构示意框图。
附图标记:
数据预处理单元10、离群点检测单元20、支持向量机训练单元30、智能监控单元40、持续学习单元50、预处理模块100、聚类处理模块200。
具体实施方式
结合以下实施例对本发明作进一步描述。
参见图1、图2,本实施例提供的一种半导体制造设备和工艺的智能控制系统,包括数据预处理单元10、离群点检测单元20、支持向量机训练单元30、智能监控单元40和持续学习单元50;
数据预处理单元10包括预处理模块100和聚类处理模块200,预处理模块100用于对半导体制造设备和工艺采集的数据采集的数据进行预处理,聚类处理模块200通过全局K-均值聚类算法对预处理模块100预处理后的数据进行聚类处理;
离群点检测单元20对聚类处理后的数据进行离群点检测,得到离群点集;
支持向量机训练单元30将离群点集划分为训练样本集和测试样本集,并利用训练样本集对支持向量机进行训练,并通过查看测试样本集对支持向量机验证的结果来完成支持向量机的训练与测试验证;若验证结果不符合要求,则调整支持向量机参数,再通过迭代计算,直到验证结果符合要求,输出最终数据训练参数给智能监控单元40;
所述智能监控单元40用于利用支持向量机训练单元30输出的最终数据训练参数监测和控制半导体制造设备和工艺;
所述持续学习单元50用于当智能监控单元40监测到半导体制造设备和工艺发生异常行为时,将新发现的异常行为数据及其前后相邻的正常数据组成新训练样本数据集并进行标注,利用新样本数据集对支持向量机进行训练,输出新训练参数给智能监控单元40,对智能监控单元40进行参数更新。
优选地,所述半导体制造设备和工艺采集的数据包括在半导体材料和器件制造过程中,半导体制造设备检测和控制的宏观参数和微观参数。
优选地,所述宏观参数包括温度、压力、流量、化学成分参数,所述微观参数包括物理过程与化学过程的参数。
本发明上述实施例对半导体制造设备和工艺采集的海量数据进行挖掘,充分利用所述数据资源实现对半导体设备和工艺进行智能控制,保证了半导体材料和器件生产质量,当半导体材料和器件的质量发生异常时能够更高效率的找到异常发生的原因,并具有持续学习的机制,解决了现有技术中因技术人员自身经验限制造成的工艺结果差异;并且利用所述智能控制系统的持续学习功能,还解决了现有技术中因缺乏连贯学习机制造成的异常事件处理经验的丢失;还提高了异常事件处理效率,提高产能。
在一个实施例中,所述对半导体制造设备和工艺采集的数据进行预处理,具体为:对半导体制造设备和工艺采集的数据依采集时间顺序进行检测,将数据ya与其前一数据ya-1进行比较,计算数据ya是否满足数据合并条件,若数据ya满足下列数据合并条件,则将数据ya剔除,继续对下一个数据进行检测:
式中,θ为设定的变化率阈值。
本实施例对半导体制造设备和工艺采集的数据进行预处理,将变化率较小的数据进行剔除,能够在保障数据本身精度的前提下减少数据处理的数量,有益于节约半导体制造设备和工艺的智能控制系统的存储空间,降低数据聚类处理单元的计算量,提高数据聚类处理的效率。
在一个实施例中,所述的全局K-均值聚类算法为改进的全局K-均值聚类算法,该改进的全局K-均值聚类算法具体包括:
(1)提取预处理后的设定时间段的数据作为一个数据集,设为Y;
(2)将数据集Y中的数据按照从小到大进行排序,选取其中的中位数作为数据集Y的聚类中心且令λ=1;
(3)令λ=λ+1,若λ>M,M为设定的迭代次数阈值,则算法终止;
(4)取前λ-1次的初始聚类中心Q1,Q2,…,Qλ-1,并取数据集中的数据yi作为第λ个初始聚类中心,yi∈Y,i=1,…,N,N为数据集Y具有的数据量,按照下列公式计算Hi,选择使得Hi取值最大的一组聚类中心作为最优初始聚类中心:
式中,yj∈Y,Hi用于测量在yi处加入一个聚类中心后聚类误差减少的量,表示yj到在Q1,Q2,…,Qλ-1中距离最近的初始聚类中心的距离平方;
(5)对最优初始聚类中心应用K-均值算法进行聚类,并保存聚类结果,记它们的初始聚类中心为Z1,Z2,…,Zλ;
(6)若得到的聚类结果有只包含一个数据的簇,则令此簇对应的Hi为0,转到(4);否则转到(7);
(7)令Qk=Zk,k=1,…,λ,转步骤(3)。
其中,所述的K-均值算法为现有的算法,该算法通过使聚类误差最小进行簇的划分。
本实施例通过改进的全局K-均值聚类算法对数据预处理单元10预处理后的数据进行聚类处理,并创新性地提出了改进的全局K-均值聚类算法,该算法能够避免出现单独一个数据作为一个簇的情形,且利用Hi来测量在yi处加入一个聚类中心后聚类误差减少的量,优化了聚类问题的求解效率,从而使得本实施例提出的改进的全局K-均值聚类算法,相对于现有的全局K-均值聚类算法具有更优的聚类效果,并且能够适用于较大的数据集。
在一个实施例中,所述对聚类处理后的数据进行离群点检测,具体包括:
(1)对同一个簇的数据按照从小到大的顺序进行排序,获取其中的中位数ymed;
(2)若数据yi满足离群条件,则将该数据yi视为离群点,归入离群点集;
其中,所述的离群条件为:
式中,yT1为区间[y1,ymed]的中位数,yT2为区间[ymed,yn]的中位数,yi∈{y1,y2,…,yn},n为yi所在簇的数据数量,为数据yi到其簇的聚类中心的距离,LT为设定的距离阈值;
为设定的判断取值函数,当时,当时,
在一个可选的方式中,将所述LT设定为yi所在簇内数据到聚类中心的距离的平均值。
本实施例对聚类处理后的数据进行离群点检测,从中创新性地提出了用于检测数据是否为离群点的离群条件,该离群条件根据数据与聚类中心的距离以及数据与所在簇数据集合的大小关系来判断该数据是否为离群点,由于利用中位数来判断数据与所在簇数据集合的大小关系,能够使得检测不受到簇内数据分布的限制,具备一定的鲁棒性,检测方式简单有效。
最后应当说明的是,以上实施例仅用以说明本发明的技术方案,而非对本发明保护范围的限制,尽管参照较佳实施例对本发明作了详细地说明,本领域的普通技术人员应当理解,可以对本发明的技术方案进行修改或者等同替换,而不脱离本发明技术方案的实质和范围。