CN110705807B - 基于现场数据的半导体生产质量预测方法及系统 - Google Patents
基于现场数据的半导体生产质量预测方法及系统 Download PDFInfo
- Publication number
- CN110705807B CN110705807B CN201911013685.2A CN201911013685A CN110705807B CN 110705807 B CN110705807 B CN 110705807B CN 201911013685 A CN201911013685 A CN 201911013685A CN 110705807 B CN110705807 B CN 110705807B
- Authority
- CN
- China
- Prior art keywords
- data
- value
- quality
- missing
- time
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 64
- 238000004519 manufacturing process Methods 0.000 title claims abstract description 61
- 239000004065 semiconductor Substances 0.000 title claims abstract description 30
- 238000012360 testing method Methods 0.000 claims abstract description 45
- 238000012545 processing Methods 0.000 claims abstract description 22
- 238000004422 calculation algorithm Methods 0.000 claims abstract description 12
- 238000007689 inspection Methods 0.000 claims abstract description 9
- 238000012549 training Methods 0.000 claims description 50
- 230000009467 reduction Effects 0.000 claims description 16
- 238000012163 sequencing technique Methods 0.000 claims description 12
- 238000007781 pre-processing Methods 0.000 claims description 11
- 230000008569 process Effects 0.000 claims description 10
- 238000006243 chemical reaction Methods 0.000 claims description 6
- 238000010606 normalization Methods 0.000 claims description 6
- 238000001514 detection method Methods 0.000 abstract description 5
- 235000019504 cigarettes Nutrition 0.000 description 7
- 239000000126 substance Substances 0.000 description 5
- 230000002159 abnormal effect Effects 0.000 description 4
- 230000004927 fusion Effects 0.000 description 3
- 238000013528 artificial neural network Methods 0.000 description 2
- 238000004140 cleaning Methods 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 238000003066 decision tree Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 230000002950 deficient Effects 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 239000007788 liquid Substances 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000007500 overflow downdraw method Methods 0.000 description 1
- 238000007637 random forest analysis Methods 0.000 description 1
- 238000007619 statistical method Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 239000010409 thin film Substances 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0639—Performance analysis of employees; Performance analysis of enterprise or organisation operations
- G06Q10/06395—Quality analysis or management
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/04—Manufacturing
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02P—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
- Y02P90/00—Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
- Y02P90/30—Computing systems specially adapted for manufacturing
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Human Resources & Organizations (AREA)
- Economics (AREA)
- Strategic Management (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Physics & Mathematics (AREA)
- Marketing (AREA)
- Tourism & Hospitality (AREA)
- General Business, Economics & Management (AREA)
- Development Economics (AREA)
- Entrepreneurship & Innovation (AREA)
- Data Mining & Analysis (AREA)
- Operations Research (AREA)
- Educational Administration (AREA)
- Quality & Reliability (AREA)
- Game Theory and Decision Science (AREA)
- Primary Health Care (AREA)
- Bioinformatics & Computational Biology (AREA)
- Health & Medical Sciences (AREA)
- Manufacturing & Machinery (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- Bioinformatics & Cheminformatics (AREA)
- General Health & Medical Sciences (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- General Engineering & Computer Science (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- General Factory Administration (AREA)
Abstract
本发明提供基于现场数据的半导体生产质量预测方法及系统,包括以下步骤:S100、获取半导体生产设备生产过程中的现场数据,并存储;数据至少包括机台字段、时间字符串值、多种工况参数及产品质量数据;S200、对获取的现场数据进行处理;S300、回归建模,使用不同算法建立两个模型,然后对两个模型进行融合;使用融合后的模型对测试集预测质量,利用预测结果与实际质检结果的偏差,反馈优化回归模型,直至得到目标模型;S400、预测质量,利用目标模型预测实时生产数据的质量。与现有技术相比,该方法能适应半导体生产工艺复杂的特点;利用生产过程中数据对产品质量进行预测,预测结果较准确,能快速发现不良问题,协助调整生产工艺,并有效节约检测资源。
Description
技术领域
本发明涉及半导体的生产与质检技术领域,具体来说是一种基于现场数据的半导体生产质量预测方法及系统。
背景技术
半导体生产过程复杂,包含上千道工序,每道工序都有可能对产品品质产生影响。传统的质检方式是:生产完成后,对产品质量做非全面的抽测,这样有两个缺点:1、存在漏检风险;2、不能及时得知质量好坏,当发现残次品时,修正工艺参数为时已晚。因此,基于生产过程参数,建立质量预测模型,可以快速发现不良问题,协助调整生产工艺,并有效节约检测资源。
现有技术中并没有针对半导体的生产质量预测的相关技术。经过检索,关于“生产质量预测”的专利公开文件有:
申请号为:CN201610373992.1的专利(有权),基于现场数据的产品工艺质量预测模型的建立方法及系统,公开了基于现场数据的产品工艺质量预测模型的建立方法及系统,包括以下步骤:获取卷烟设备的现场数据并将获取的数据存储至数据库中;对卷烟设备的现场数据进行处理,卷烟设备的现场数据包括卷烟机停机数据、剔除数据、产量数据及产品质量数据;建立产品工艺质量神经网络预测模型;建立设备故障树;输入卷烟设备实时数据至产品工艺质量神经网络预测模型得到预测产品质量数据,结合设备故障树对卷烟设备进行控制。该本发明能够避免数据统计分析方法的单一性,将卷烟设备数据有效结合,建立数据综合分析模型,预测下一时间段内的产品质量情况,防止问题产品的产出,做到以产品质量为导向指导设备管理。
申请号为:CN201811418409.X的专利(审中),基于随机森林的化工产品的质量预测方法及系统,公开了一种基于随机森林的化工产品的质量预测方法及系统,该方法包括:目标化工产品反应过程中,每间隔预设的时长获取与所述目标化工产品质量存在关联的各个影响因子的生产数据;依据各个生产数据,确定所述目标化工厂品从开始反应到当前时刻的目标有效数据;将所述目标有效数据传递给采用预设的训练方法训练得到的目标质量预测模型中,得到所述目标化工产品的目标质量预测结果。上述的方法,可以在生产过程中获取生产数据,依据生产数据直接对当前时刻产品的质量进行预测,避免了由于无法实时预测当前生产过程的产品质量,会造成良率不高等负面影响的问题。
但是由于半导体生产工艺复杂,工序达上千道,基于现有技术难以适用。
发明内容
本发明要解决的技术问题是利用半导体生产过程数据,预测产品质量。
本发明通过以下技术方案来解决上述技术问题:
基于现场数据的半导体生产质量预测方法,包括以下步骤:
S100、获取半导体生产设备生产过程中的现场数据,并存储;数据至少包括机台字段、时间字符串值、多种工况参数及产品质量数据;
S200、对获取的现场数据进行处理,具体包括:先将数据分为测试集和训练集;
201)参数异常值处理:
当测试集和训练集中的工况参数为缺失值0值时,对测试集和训练集该工况参数分别进行排序,排序后最小值为min,最大值为mix,若min≤0≤max,认为此0值正常,否则,认为其为缺失值,用缺失值NaN替换,等待下一步填充;
当同一道工序中,测试集出现了训练集未出现的机台字段,将未出现的机台字段替换为NaN,等待下一步填充;
202)降维:删除单值列、重复列,删除NaN值超过设定量的行或列;
203)字符属性处理:
类别值编码:对机台字段编码;
时间字符串转换为时间戳:匹配测试集和训练集中的时间字符串格式,将其转化为时间戳,相邻工序的时间戳相减,得到该工序所用时间;
204)缺失值填充:
对缺失的机台字段:将该机台的工况参数作为特征,机台字段作为类别,用训练集建模,预测并填充测试数据的机台字段;
对缺失的工况参数:对该缺失的工况参数,先按相同机台字段分组,计算各组扣除缺失值的中位数,然后用此中位数填充训练集与预测集的缺失值。
205)数据规范化处理:对训练集与预测集的所有数据列缩放到0、1区间;
S300、回归建模,使用不同算法建立两个模型,然后对两个模型进行融合;使用融合后的模型对测试集预测质量,利用预测结果与实际质检结果的偏差,反馈优化回归模型,直至得到目标模型;
S400、预测质量,利用目标模型预测实时生产数据的质量。
优选的,所述步骤S200中,数据预处理的顺序为:参数异常处理、降维、时间字符串转化为时间戳、缺失值填充、相邻工序的时间戳相减、机台字段编码、降维、数据规范化。
优选的,所述步骤203)中,采用独热编码对机台字段编码。
优选的,所述步骤S300中,使用Lasso回归和GBDT两种算法分别建模。
本发明还提供一种基于现场数据的半导体生产质量预测系统,包括
数据获取模块,获取半导体生产设备生产过程中的现场数据,并存储;数据至少包括机台字段、时间字符串值、多种工况参数及产品质量数据;
数据预处理模块,对获取的现场数据进行处理,具体包括:先将数据分为测试集和训练集;
201)参数异常值处理:
当测试集和训练集中的工况参数为缺失值0值时,对测试集和训练集该工况参数分别进行排序,排序后最小值为min,最大值为mix,若min≤0≤max,认为此0值正常,否则,认为其为缺失值,用缺失值NaN替换,等待下一步填充;
当同一道工序中,测试集出现了训练集未出现的机台字段,将未出现的机台字段替换为NaN,等待下一步填充;
202)降维:删除单值列、重复列,删除NaN值超过设定量的行或列;
203)字符属性处理:
类别值编码:对机台字段编码;
时间字符串转换为时间戳:匹配测试集和训练集中的时间字符串格式,将其转化为时间戳,相邻工序的时间戳相减,得到该工序所用时间;
204)缺失值填充:
对缺失的机台字段:将该机台的工况参数作为特征,机台字段作为类别,用训练集建模,预测并填充测试数据的机台字段;
对缺失的工况参数:对该缺失的工况参数,先按相同机台字段分组,计算各组扣除缺失值的中位数,然后用此中位数填充训练集与预测集的缺失值。
205)数据规范化处理:对训练集与预测集的所有数据列缩放到0、1区间;
回归建模模块,使用不同算法建立两个模型,然后对两个模型进行融合;使用融合后的模型对测试集预测质量,利用预测结果与实际质检结果的偏差,反馈优化回归模型,直至得到目标模型;
预测质量模块,利用目标模型预测实时生产数据的质量。
优选的,所述数据预处理模块中,数据预处理的顺序为:参数异常处理、降维、时间字符串转化为时间戳、缺失值填充、相邻工序的时间戳相减、机台字段编码、降维、数据规范化。
优选的,所述;203)中,采用独热编码对机台字段编码。
优选的,所述回归建模模块中,使用Lasso回归和GBDT两种算法分别建模。
本发明的优点在于:
该方法能适应半导体生产工艺复杂的特点;利用生产过程中数据对产品质量进行预测,预测结果较准确,能快速发现不良问题,协助调整生产工艺,并有效节约检测资源。
附图说明
图1为本发明实施例中一种基于现场数据的半导体生产质量预测方法的流程框图。
具体实施方式
为使对本发明的结构特征及所达成的功效有更进一步的了解与认识,用以较佳的实施例及附图配合详细的说明,说明如下:
如图1所示,一种基于现场数据的半导体生产质量预测方法,包括以下步骤:
步骤1、获取半导体生产设备生产过程中的现场数据,包括生产过程工艺参数(表1)及质量检测数据(表2),并存储;数据至少包括机台字段、时间字符串值、温度、气体流量、液体流量、功率等;典型的生产过程工艺参数数据格式如表1:
表1
表2质量检测结果
步骤2、数据预处理
半导体生产过程数据常见以下特点:
1、维数高,以TFT-LCD(薄膜晶体管液晶显示器)为例,其生产过程参数可能超过5000个,其中存在单一值列、重复列;
2、仪表波动、设备工况漂移导致的参数异常;
3、存在缺失值;
4、机台和制成时间用字符(串)表示,不便计算;
5、各参数量纲不同。
所以,要对获取的现场数据进行预处理,具体包括:先将数据分为测试集和训练集;
201)参数异常值处理:
当测试集和训练集中的工况参数为缺失值0值时,对测试集和训练集该工况参数分别进行排序,排序后最小值为min,最大值为mix,若min≤0≤max,认为此0值正常,否则,认为其为缺失值,用缺失值NaN替换,等待下一步填充;
当同一道工序中,测试集出现了训练集未出现的机台字段,将未出现的机台字段替换为NaN,等待下一步填充;
202)降维:删除单值列、重复列,删除NaN值超过设定量的行或列;
203)字符属性处理:
类别值编码:使用独热编码OneHotEncoder对机台字段编码;
时间字符串转换为时间戳:匹配测试集和训练集中的时间字符串格式,将其转化为时间戳,相邻工序的时间戳相减,得到该工序所用时间;
204)缺失值填充:
对缺失的机台字段:对缺失的机台字段,根据其工况参数,用最接近的机台替换。具体做法是:将该机台的工况参数作为特征,机台字段作为类别,用训练集建模KNN或RandomForestClassifier,预测并填充测试数据的机台字段;
对缺失的工况参数:对该缺失的工况参数,使用该参数在相同机台下的中位数替换(中位数较均值对异常数据更加鲁棒),即对该参数,先按机台分组,计算各组扣除缺失值的中位数然后用此中位数填充训练集与预测集的缺失值。
205)数据规范化处理:为了消除参数之间的量纲和取值范围差异的影响,对训练集与预测集的所有数据列缩放到0、1区间;
以上预处理步骤之间存在交叉,例如:最先进行清洗,以减小数据规模,最后再进行一次清洗,消除预处理过程中新产生的单值列、重复列等。又如将时间字符串转化为时间戳后,应先填充缺失值,然后相邻工序时间戳相减。
推荐的顺序如下:
参数异常处理(识别异常值,替换为缺失值)、降维(减小数据规模,提高计算速度)、时间字符串转化为时间戳、缺失值填充、相邻工序的时间戳相减、机台字段编码、降维、数据规范化。
步骤3、回归建模,对于特征高达上千维的回归问题,需要选出有意义的特征进行训练,因为冗余特征会影响阻碍模型找寻数据潜在的规律,且去除不相关的特征会降低学习任务的难度。本实施例使用Lasso回归和GBDT两种算法分别筛选特征和建模,然后对两个模型平均相加实现模型融合,使用融合后的模型对测试集预测质量,如表2,利用预测结果与实际质检结果的偏差,反馈优化回归模型,直至得到目标模型。
Lasso和GBDT都是成熟的回归模型,Lasso通过在回归函数中增加L1正则项,产生稀疏系数实现特征选择;GBDT属于决策树的集成算法,通过计算各特征在单棵树中重要度的平均值,比较特征重要性实现特征选择。模型融合方法是先产生一组个体学习器,通过某种策略将其结合起来,提高模型的鲁棒性和准确率。个体学习器准确性越高、多样性越大,则融合越好。模型融合的结合策略有平均法、投票法、学习法等,这里采取回归模型常用的平均法。
步骤4、预测质量,利用目标模型预测实时生产数据的质量。
本实施例还提供基于现场数据的半导体生产质量预测系统,包括
数据获取模块,获取半导体生产设备生产过程中的现场数据,并存储;数据至少包括机台字段、时间字符串值、多种工况参数及产品质量数据;
数据预处理模块,对获取的现场数据进行处理,具体包括:先将数据分为测试集和训练集;
201)参数异常值处理:
当测试集和训练集中的工况参数为缺失值0值时,对测试集和训练集该工况参数分别进行排序,排序后最小值为min,最大值为mix,若min≤0≤max,认为此0值正常,否则,认为其为缺失值,用缺失值NaN替换,等待下一步填充;
当同一道工序中,测试集出现了训练集未出现的机台字段,将未出现的机台字段替换为NaN,等待下一步填充;
202)降维:删除单值列、重复列,删除NaN值超过设定量的行或列;
203)字符属性处理:
类别值编码:对机台字段编码;
时间字符串转换为时间戳:匹配测试集和训练集中的时间字符串格式,将其转化为时间戳,相邻工序的时间戳相减,得到该工序所用时间;
204)缺失值填充:
对缺失的机台字段:将该机台的工况参数作为特征,机台字段作为类别,用训练集建模KNN或RandomForestClassifier,预测并填充测试数据的机台字段;
对缺失的工况参数:对该缺失的工况参数,先按相同机台字段分组,计算各组扣除缺失值的中位数,然后用此中位数填充训练集与预测集的缺失值;
205)数据规范化处理:对训练集与预测集的所有数据列缩放到0、1区间;
回归建模模块,使用不同算法建立两个模型,然后对两个模型进行融合;使用融合后的模型对测试集预测质量,利用预测结果与实际质检结果的偏差,反馈优化回归模型,直至得到目标模型;
预测质量模块,利用目标模型预测实时生产数据的质量。
以上显示和描述了本发明的基本原理、主要特征和本发明的优点。本行业的技术人员应该了解,本发明不受上述实施例的限制,上述实施例和说明书中描述的只是本发明的原理,在不脱离本发明精神和范围的前提下本发明还会有各种变化和改进,这些变化和改进都落入要求保护的本发明的范围内。本发明要求的保护范围由所附的权利要求书及其等同物界定。
Claims (6)
1.基于现场数据的半导体生产质量预测方法,其特征在于,包括以下步骤:
S100、获取半导体生产设备生产过程中的现场数据,并存储;数据至少包括机台字段、时间字符串值、多种工况参数、及产品质量数据;
S200、对获取的现场数据进行处理,具体包括:先将数据分为测试集和训练集;
201)参数异常值处理:
当测试集和训练集中的工况参数为缺失值0值时,对测试集和训练集该工况参数分别进行排序,排序后最小值为min,最大值为mix,若min≤0≤max,认为此0值正常,否则,认为其为缺失值,用缺失值NaN替换,等待下一步填充;
当同一道工序中,测试集出现了训练集未出现的机台字段,将未出现的机台字段替换为NaN,等待下一步填充;
202)降维:删除单值列、重复列,删除NaN值超过设定量的行或列;
203)字符属性处理:
类别值编码:对机台字段编码;
时间字符串转换为时间戳:匹配测试集和训练集中的时间字符串格式,将其转化为时间戳,相邻工序的时间戳相减,得到该工序所用时间;
204)缺失值填充:
对缺失的机台字段:将该机台的工况参数作为特征,机台字段作为类别,用训练集建模,预测并填充测试数据的机台字段;
对缺失的工况参数:对该缺失的工况参数,先按相同机台字段分组,计算各组扣除缺失值的中位数,然后用此中位数填充训练集与预测集的缺失值;
205)数据规范化处理:对训练集与预测集的所有数据列缩放到0、1区间;
S300、回归建模,使用不同算法建立两个模型,然后对两个模型进行融合;使用融合后的模型对测试集预测质量,利用预测结果与实际质检结果的偏差,反馈优化回归模型,直至得到目标模型;
所述步骤S300中,使用Lasso回归和GBDT两种算法分别建模;
S400、预测质量,利用目标模型预测实时生产数据的质量。
2.根据权利要求1所述的基于现场数据的半导体生产质量预测方法,其特征在于,所述步骤S200中,数据预处理的顺序为:参数异常处理、降维、时间字符串转化为时间戳、缺失值填充、相邻工序的时间戳相减、机台字段编码、降维、数据规范化。
3.根据权利要求1所述的基于现场数据的半导体生产质量预测方法,其特征在于,所述步骤203)中,采用独热编码对机台字段编码。
4.基于现场数据的半导体生产质量预测系统,其特征在于,包括
数据获取模块,获取半导体生产设备生产过程中的现场数据,并存储;数据至少包括机台字段、时间字符串值、多种工况参数及产品质量数据;
数据预处理模块,对获取的现场数据进行处理,具体包括:先将数据分为测试集和训练集;
201)参数异常值处理:
当测试集和训练集中的工况参数为缺失值0值时,对测试集和训练集该工况参数分别进行排序,排序后最小值为min,最大值为mix,若min≤0≤max,认为此0值正常,否则,认为其为缺失值,用缺失值NaN替换,等待下一步填充;
当同一道工序中,测试集出现了训练集未出现的机台字段,将未出现的机台字段替换为NaN,等待下一步填充;
202)降维:删除单值列、重复列,删除NaN值超过设定量的行或列;
203)字符属性处理:
类别值编码:对机台字段编码;
时间字符串转换为时间戳:匹配测试集和训练集中的时间字符串格式,将其转化为时间戳,相邻工序的时间戳相减,得到该工序所用时间;
204)缺失值填充:
对缺失的机台字段:将该机台的工况参数作为特征,机台字段作为类别,用训练集建模,预测并填充测试数据的机台字段;
对缺失的工况参数:对该缺失的工况参数,先按相同机台字段分组,计算各组扣除缺失值的中位数,然后用此中位数填充训练集与预测集的缺失值;
205)数据规范化处理:对训练集与预测集的所有数据列缩放到0、1区间;
回归建模模块,使用不同算法建立两个模型,然后对两个模型进行融合;使用融合后的模型对测试集预测质量,利用预测结果与实际质检结果的偏差,反馈优化回归模型,直至得到目标模型;
所述回归建模模块中,使用Lasso回归和GBDT两种算法分别建模;
预测质量模块,利用目标模型预测实时生产数据的质量。
5.根据权利要求4所述的基于现场数据的半导体生产质量预测系统,其特征在于,所述数据预处理模块中,数据预处理的顺序为:参数异常处理、降维、时间字符串转化为时间戳、缺失值填充、相邻工序的时间戳相减、机台字段编码、降维、数据规范化。
6.根据权利要求4所述的基于现场数据的半导体生产质量预测系统,其特征在于,所述;203)中,采用独热编码对机台字段编码。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911013685.2A CN110705807B (zh) | 2019-10-23 | 2019-10-23 | 基于现场数据的半导体生产质量预测方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911013685.2A CN110705807B (zh) | 2019-10-23 | 2019-10-23 | 基于现场数据的半导体生产质量预测方法及系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110705807A CN110705807A (zh) | 2020-01-17 |
CN110705807B true CN110705807B (zh) | 2023-11-03 |
Family
ID=69201378
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201911013685.2A Active CN110705807B (zh) | 2019-10-23 | 2019-10-23 | 基于现场数据的半导体生产质量预测方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110705807B (zh) |
Families Citing this family (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112766059B (zh) * | 2020-12-30 | 2024-05-03 | 富联裕展科技(深圳)有限公司 | 产品加工品质的检测方法、检测装置 |
CN112801366A (zh) * | 2021-01-27 | 2021-05-14 | 上海微亿智造科技有限公司 | 工业质量数据指标智能预测方法、系统及介质 |
CN112859790A (zh) * | 2021-02-01 | 2021-05-28 | 刘金涛 | 基于kepls的生产过程质量预测与控制方法 |
CN113138963A (zh) * | 2021-04-28 | 2021-07-20 | 东北大学 | 铝/铜板带材工业大数据平台人机交互系统 |
CN113421264B (zh) * | 2021-08-24 | 2021-11-30 | 深圳市信润富联数字科技有限公司 | 轮毂质量检测方法、设备、介质及计算机程序产品 |
CN113510234B (zh) * | 2021-09-14 | 2022-01-07 | 深圳市信润富联数字科技有限公司 | 轮毂低压铸造的质量监控方法、装置及电子设备 |
CN114841378B (zh) * | 2022-07-04 | 2022-10-11 | 埃克斯工业(广东)有限公司 | 晶圆特征参数预测方法、装置、电子设备及可读存储介质 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103488135A (zh) * | 2013-08-14 | 2014-01-01 | 沈阳中科博微自动化技术有限公司 | 一种用于半导体生产加工过程监控的统计过程控制方法 |
CN109117864A (zh) * | 2018-07-13 | 2019-01-01 | 华南理工大学 | 基于异构特征融合的冠心病风险预测方法、模型及系统 |
CN109523086A (zh) * | 2018-11-26 | 2019-03-26 | 浙江蓝卓工业互联网信息技术有限公司 | 基于随机森林的化工产品的质量预测方法及系统 |
CN109933834A (zh) * | 2018-12-26 | 2019-06-25 | 阿里巴巴集团控股有限公司 | 一种时序数据预测的模型创建方法及装置 |
CN110264079A (zh) * | 2019-06-20 | 2019-09-20 | 东北大学 | 基于CNN算法和Lasso回归模型的热轧产品质量预测方法 |
-
2019
- 2019-10-23 CN CN201911013685.2A patent/CN110705807B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103488135A (zh) * | 2013-08-14 | 2014-01-01 | 沈阳中科博微自动化技术有限公司 | 一种用于半导体生产加工过程监控的统计过程控制方法 |
CN109117864A (zh) * | 2018-07-13 | 2019-01-01 | 华南理工大学 | 基于异构特征融合的冠心病风险预测方法、模型及系统 |
CN109523086A (zh) * | 2018-11-26 | 2019-03-26 | 浙江蓝卓工业互联网信息技术有限公司 | 基于随机森林的化工产品的质量预测方法及系统 |
CN109933834A (zh) * | 2018-12-26 | 2019-06-25 | 阿里巴巴集团控股有限公司 | 一种时序数据预测的模型创建方法及装置 |
CN110264079A (zh) * | 2019-06-20 | 2019-09-20 | 东北大学 | 基于CNN算法和Lasso回归模型的热轧产品质量预测方法 |
Non-Patent Citations (1)
Title |
---|
XGBoost算法在制造业质量预测中的应用;蒋晋文等;《智能计算机与应用》;20171231;第7卷(第06期);第1-3节 * |
Also Published As
Publication number | Publication date |
---|---|
CN110705807A (zh) | 2020-01-17 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110705807B (zh) | 基于现场数据的半导体生产质量预测方法及系统 | |
CN112052992B (zh) | 一种基于深度学习的建筑工程项目进度预测系统及方法 | |
CN109597968B (zh) | 基于smt大数据的锡膏印刷性能影响因素分析方法 | |
KR100915339B1 (ko) | 이중 단계 가상 계측 방법 | |
CN107220734A (zh) | 基于决策树的数控车床车削过程能耗预测系统 | |
CN105225979A (zh) | 一种半导体器件制程预测系统和方法 | |
CN112070279A (zh) | 一种基于数字孪生技术的产品加工控制方法 | |
CN111428201B (zh) | 基于经验模态分解和前馈神经网络对时序数据的预测方法 | |
CN111126658A (zh) | 一种基于深度学习的煤矿瓦斯预测方法 | |
CN112508261B (zh) | 一种基于神经网络的配电变压器负荷分层预测方法及装置 | |
CN110852496A (zh) | 一种基于lstm循环神经网络的天然气负荷预测方法 | |
CN111258984A (zh) | 工业大数据环境下的产品质量端-边-云协同预报方法 | |
CN114155072A (zh) | 基于大数据分析的财务预测模型构建方法及系统 | |
CN117131449A (zh) | 面向数据治理的具有传播学习能力的异常识别方法及系统 | |
CN113723541B (zh) | 一种基于混合智能算法的边坡位移预测方法 | |
CN114548494A (zh) | 一种可视化造价数据预测智能分析系统 | |
CN112053019A (zh) | 一种基于大数据模型预测控制框架的光纤预制棒沉积工序智能化方法 | |
CN108171435B (zh) | 一种考虑预防性维护的生产计划决策方法 | |
CN115169426B (zh) | 一种基于相似性学习融合模型的异常检测方法及系统 | |
CN115544157A (zh) | 一种基于自然语言理解的工业数据可视化分析方法 | |
CN113111588B (zh) | 一种燃气轮机nox排放浓度预测方法及装置 | |
CN108268730A (zh) | 一种面向产品可靠性退化的tbe控制图系统优化设计方法 | |
CN109767816A (zh) | 一种基于深度神经网络的化学工艺危险自动化分析的方法 | |
CN117690601B (zh) | 基于大数据分析的结核病流行趋势预测系统 | |
CN113569951B (zh) | 一种基于生成对抗网络的近红外定量分析模型构建方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |