CN117474387A - 基于厂务数据的晶圆良率控制方法、装置、设备及介质 - Google Patents

基于厂务数据的晶圆良率控制方法、装置、设备及介质 Download PDF

Info

Publication number
CN117474387A
CN117474387A CN202311414825.3A CN202311414825A CN117474387A CN 117474387 A CN117474387 A CN 117474387A CN 202311414825 A CN202311414825 A CN 202311414825A CN 117474387 A CN117474387 A CN 117474387A
Authority
CN
China
Prior art keywords
data
wafer
yield
factory
key
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202311414825.3A
Other languages
English (en)
Inventor
蒋越
张强
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai Pengxi Semiconductor Co ltd
Original Assignee
Shanghai Pengxi Semiconductor Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai Pengxi Semiconductor Co ltd filed Critical Shanghai Pengxi Semiconductor Co ltd
Priority to CN202311414825.3A priority Critical patent/CN117474387A/zh
Publication of CN117474387A publication Critical patent/CN117474387A/zh
Pending legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H01ELECTRIC ELEMENTS
    • H01LSEMICONDUCTOR DEVICES NOT COVERED BY CLASS H10
    • H01L22/00Testing or measuring during manufacture or treatment; Reliability measurements, i.e. testing of parts without further processing to modify the parts as such; Structural arrangements therefor
    • H01L22/10Measuring as part of the manufacturing process
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2458Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
    • G06F16/2465Query processing support for facilitating data mining operations in structured databases
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/27Regression, e.g. linear or logistic regression
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • G06N20/20Ensemble learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/01Dynamic search techniques; Heuristics; Dynamic trees; Branch-and-bound
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0639Performance analysis of employees; Performance analysis of enterprise or organisation operations
    • G06Q10/06395Quality analysis or management
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/04Manufacturing
    • HELECTRICITY
    • H01ELECTRIC ELEMENTS
    • H01LSEMICONDUCTOR DEVICES NOT COVERED BY CLASS H10
    • H01L21/00Processes or apparatus adapted for the manufacture or treatment of semiconductor or solid state devices or of parts thereof
    • H01L21/67Apparatus specially adapted for handling semiconductor or electric solid state devices during manufacture or treatment thereof; Apparatus specially adapted for handling wafers during manufacture or treatment of semiconductor or electric solid state devices or components ; Apparatus not specifically provided for elsewhere
    • H01L21/67005Apparatus not specifically provided for elsewhere
    • H01L21/67242Apparatus for monitoring, sorting or marking
    • H01L21/67253Process monitoring, e.g. flow or thickness monitoring
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2216/00Indexing scheme relating to additional aspects of information retrieval not explicitly covered by G06F16/00 and subgroups
    • G06F2216/03Data mining

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Human Resources & Organizations (AREA)
  • Economics (AREA)
  • Data Mining & Analysis (AREA)
  • Strategic Management (AREA)
  • Manufacturing & Machinery (AREA)
  • General Engineering & Computer Science (AREA)
  • Software Systems (AREA)
  • General Business, Economics & Management (AREA)
  • Mathematical Physics (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • Marketing (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Development Economics (AREA)
  • Tourism & Hospitality (AREA)
  • Computational Linguistics (AREA)
  • Power Engineering (AREA)
  • Quality & Reliability (AREA)
  • Microelectronics & Electronic Packaging (AREA)
  • Computing Systems (AREA)
  • Databases & Information Systems (AREA)
  • Game Theory and Decision Science (AREA)
  • Operations Research (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Computer Hardware Design (AREA)
  • Educational Administration (AREA)
  • General Factory Administration (AREA)
  • Condensed Matter Physics & Semiconductors (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Probability & Statistics with Applications (AREA)
  • Evolutionary Biology (AREA)
  • Fuzzy Systems (AREA)

Abstract

本申请提供了一种基于厂务数据的晶圆良率控制方法、装置、设备及介质。该方法包括:获取当前制造的晶圆的基础厂务数据;其中,所述基础厂务数据包括晶圆制造过程中的水课参数、电课参数以及气化课参数中的至少一种;基于预先构建的机器学习模型从基础厂务数据中确定与晶圆良率相关联的关键厂务数据;所述关键厂务数据输入至所述机器学习模型,确定当前制造的晶圆预估良率是否达到预设阈值;若未达到预设阈值,则生成对所述关键厂务数据进行调整的指令。本技术方案,对于厂务数据的控制,提升晶圆良率,避免产生晶圆制造存在良率较低,且无法分析影响晶圆良率的成因的问题。

Description

基于厂务数据的晶圆良率控制方法、装置、设备及介质
技术领域
本申请涉及半导体制造技术领域,尤其涉及一种基于厂务数据的晶圆良率控制方法、装置、设备及介质。
背景技术
近年来,随着科技水平的迅速发展,半导体制造业也在飞速发展。晶圆作为制作硅半导体芯片的基础材料,其制造技术已经成为制约半导体发展的基础和核心竞争力之一。
晶圆的制造过程非常繁杂,包括薄膜沉积、光刻胶涂敷、光刻显影、刻蚀、量测、清洗以及离子注入等诸多过程。晶圆制造厂商为晶圆制造提供良好的生产环境及水、电、气化的供应。其主要包括无尘室系统、冷冻水系统、工艺冷却水系统、空压系统、真空系统、大宗气体系统、特气系统、热水系统、纯水系统、废水系统、废气系统、化学品系统以及电力监控系统等等。
但是目前,尚无对于厂务数据对良率的影响分析。比如某机台生产设备不同的气体参数可能导致的晶圆良率就会不同,因此需要找到一种智能方法,去挖掘厂务数据对良率的归因,是本领域技术人员亟待解决的技术问题。
发明内容
本申请的目的是提供一种基于厂务数据的晶圆良率控制方法、装置、设备及介质,至少用以解决分析厂务数据对于晶圆良率是否存在影响的问题。本申请的目的在于:提供了一种新的基于厂务数据的晶圆良率控制方法。该方法采用预先训练好的机器学习模型,能够从常规的厂务数据中挖掘出与晶圆良率有关的关键厂务数据,并基于关键厂务数据对于当前制造的晶圆良率是否符合标准进行预测,以实现对于厂务数据的控制,提升晶圆良率,避免产生晶圆制造存在良率较低,且无法分析影响晶圆良率的成因的问题。
为实现上述目的,本申请的一些实施例提供了以下几个方面:
第一方面,本申请的一些实施例还提供了一种基于厂务数据的晶圆良率控制方法,所述方法包括:
获取当前制造的晶圆的基础厂务数据;其中,所述基础厂务数据包括晶圆制造过程中的水课参数、电课参数以及气化课参数中的至少一种;
基于预先构建的机器学习模型从基础厂务数据中确定与晶圆良率相关联的关键厂务数据;
将所述关键厂务数据输入至所述机器学习模型,确定当前制造的晶圆预估良率是否达到预设阈值;
若未达到预设阈值,则生成对所述关键厂务数据进行调整的指令。
第二方面,本申请的一些实施例还提供了一种基于厂务数据的晶圆良率控制装置,所述装置包括:
基础厂务数据获取模块,用于获取当前制造的晶圆的基础厂务数据;其中,所述基础厂务数据包括晶圆制造过程中的水课参数、电课参数以及气化课参数中的至少一种;
关键厂务数据确定模块,用于基于预先构建的机器学习模型从基础厂务数据中确定与晶圆良率相关联的关键厂务数据;
晶圆良率预测模块,用于将所述关键厂务数据输入至所述机器学习模型,确定当前制造的晶圆预估良率是否达到预设阈值;
厂务数据调整模块,用于若未达到预设阈值,则生成对所述关键厂务数据进行调整的指令。
第三方面,本申请的一些实施例还提供了一种计算机设备,所述设备包括:
一个或多个处理器;以及
存储有计算机程序指令的存储器,所述计算机程序指令在被执行时使所述处理器执行如上所述的基于厂务数据的晶圆良率控制方法。
第四方面,本申请的一些实施例还提供了一种计算机可读介质,其上存储有计算机程序指令,所述计算机程序指令可被处理器执行以实现如上所述的基于厂务数据的晶圆良率控制方法。
相较于现有技术,本申请实施例提供的方案中,通过获取当前制造的晶圆的基础厂务数据;其中,所述基础厂务数据包括晶圆制造过程中的水课参数、电课参数以及气化课参数中的至少一种;基于预先构建的机器学习模型从基础厂务数据中确定与晶圆良率相关联的关键厂务数据;将所述关键厂务数据输入至所述机器学习模型,确定当前制造的晶圆预估良率是否达到预设阈值;若未达到预设阈值,则生成对所述关键厂务数据进行调整的指令。本方案通过对于厂务数据的控制,提升晶圆良率,避免产生晶圆制造存在良率较低,且无法分析影响晶圆良率的成因的问题。
附图说明
图1是本申请实施例一提供的基于厂务数据的晶圆良率控制方法的流程示意图;
图2是本申请实施例二提供的机器学习模型的训练过程的流程示意图;
图3是本申请实施例三提供的基于厂务数据的晶圆良率控制方法的流程示意图;
图4是本申请实施例四提供的基于厂务数据的晶圆良率控制装置的结构示意图;
图5是本申请实施例五提供的计算机设备的结构示意图。
具体实施方式
为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
下面结合附图,通过具体的实施例及其应用场景对本申请实施例提供的技术方案进行详细地说明。
实施例一
图1是本申请实施例一提供的基于厂务数据的晶圆良率控制方法的流程示意图。如图1所示,具体包括如下步骤:该流程包括:
步骤S101,获取当前制造的晶圆的基础厂务数据;其中,所述基础厂务数据包括晶圆制造过程中的水课参数、电课参数以及气化课参数中的至少一种。
晶圆是指制作硅半导体电路所用的硅晶片,其原始材料是硅。高纯度的多晶硅溶解后掺入硅晶体晶种,然后慢慢拉出,形成圆柱形的单晶硅。硅晶棒在经过研磨,抛光,切片后,形成硅晶圆片,也就是晶圆。目前市面上的晶圆生产线以8英寸和12英寸为主。晶圆的主要加工方式为片加工和批加工,即同时加工一片或多片晶圆。
在晶圆的制造过程中,会涉及到各种基础厂务数据,并对每一种基础厂务数据进行调控,以确保每道制造工序的质量,好的机台参数数据有利于控制生产出优良的晶圆产品。
本方案中,基础厂务数据包括晶圆制造过程中的水课参数、电课参数以及气化课参数中的至少一种。其中,水课参数可以包括化学药剂、废化学品、污泥委外处理结果、水质检测、水平衡、化学药品消耗分析、用水量分析、水质指标分析、水系统电能及气能消耗分析等。电课参数可以包括各种系统或者设备的用电情况,例如工作电压、工作电流、功率、单位周期内的耗电量等数据。气化课参数可以包括气体余量监测分析、气瓶更换监测维护、气体消耗量监测统计、气体侦测器更换保养、化学酸桶更换保养分析、化学品消耗量统计分析、化学过滤器更换保养、气化系统电能消耗统计分析以及气化系统水的消耗统计和分析等。
步骤S102,基于预先构建的机器学习模型从基础厂务数据中确定与晶圆良率相关联的关键厂务数据。
在本方案中,采用预先训练好的机器学习模型对基础厂务数据进行筛选,以得到关键厂务数据。
可以理解的,利用机器学习模型可以更好的挖掘出各种基础厂务数据对于产品良率的影响。例如,比如某机台生产设备不同的气体参数可能导致的晶圆良率就会不同,故需要找到一种智能方法,去挖掘厂务层数据对良率的归因。
其中,机器学习模拟包括但是不限于回归树模型。机器学习模拟可以是基于历史采集到的各种基础厂务数据和晶圆良率的关联数据,并对各组关联数据进行学习得到的模型。该模型可以在输入当前制造晶圆的基础厂务数据后,得到当前制造的晶圆良率。本方案中,可以基于该机器学习模中的一部分算法用来从基础厂务数据中筛选出关键厂务数据。其中,关键厂务数据是对晶圆良率有直接影响的基础厂务数据。
本方案中,可以使用LightGBM模型。LightGBM(Light Gradient BoostingMachine)是微软的开源分布式高性能Gradient Boosting框架,使用决策树的学习算法,下面介绍以下这个框架的优化:
速度、内存方面的优化:
许多提升工具使用基于预排序的算法(近似直方图算法)(例如XGBoost中的默认算法)来进行决策树学习。这是一个比较简单的解决方案,但不容易优化。LightGBM使用基于直方图的算法,它将连续特征值存储到离散区间。这可以加快训练速度并减少了内存使用量。
针对稀疏特征优化:
对于稀疏的特征只需要O(2*非零值的样本个数)的时间复杂度来构造直方图。
优化树的生长策略来提高准确率。
网络通信的优化:
在LightGBM的并行学习中,它只需要使用一些聚合通信算法,如“All reduce”,“All gather”和“Reduce scatter”。LightGBM实现了最先进的state-of-art算法。这些聚合通信算法可以提供比点对点通信更好的性能。
并行学习中的优化:
LightGBM提供以下并行学习算法的优化:特征并行、数据并行、投票并行。
步骤S103,将所述关键厂务数据输入至所述机器学习模型,确定当前制造的晶圆预估良率是否达到预设阈值。
其中,在确定关键厂务数据之后,可以当前制造的晶圆的关键厂务数据的取值输入所述机器学习模型,以根据所述机器学习模型的输出结果,确定当前制造的晶圆预估良率。可以理解的,此处的晶圆预估良率是基于当前输入的关键厂务数据所预估得到的。一方面晶圆生产的过程中,都是采用流水线的作业形式,一般其他数据在连续的多个晶圆制造过程是不会发生变更的,所以基于关键厂务数据进行预估,会具有相当高的准确性。
本方案中,预设阈值可以是根据需求来制定的数值,例如良率需要在95%以上,当前批次的晶圆的制造才能够满足生产需求。则此处的预设阈值可以设置为95%。
在得到当前制造的晶圆预估良率之后,可以识别所得到的预估良率是否达到或者大于95%,例如,预估良率达到97%,大于95%,则可以确定达到了预设阈值。
步骤S104,若未达到预设阈值,则生成对所述关键厂务数据进行调整的指令。
此处,若机器学习模型输出的当前制造的晶圆预估良率未达到预设阈值,例如当前制造的晶圆预估良率为92%,小于预设阈值95%,则可以生成对所述关键厂务数据进行调整的指令。
例如基于当前制造晶圆的关键厂务数据得到的晶圆预估良率低于预设阈值,则可以对当前的关键厂务数据进行调整。此处的调整的指令可以是针对其中的一个关键厂务数据,也可以是针对多个关键厂务数据,具体可以由原来的取值调整至目标取值。例如,将氮气流量由原来的流量值提升至原来的二倍。
本技术方案,提供了一种新的基于厂务数据的晶圆良率控制方法。该方法采用预先训练好的机器学习模型,能够从常规的厂务数据中挖掘出与晶圆良率有关的关键厂务数据,并基于关键厂务数据对于当前制造的晶圆良率是否符合标准进行预测,以实现对于厂务数据的控制,提升晶圆良率,避免产生晶圆制造存在良率较低,且无法分析影响晶圆良率的成因的问题。
在另一个实施例中,在若未达到预设阈值,则生成对所述关键厂务数据进行调整的指令之后,所述方法还包括:
在对所述关键厂务数据进行调整之后,将调整后的更新厂务数据输入至所述机器学习模型;
识别所述机器学习模型的输出的预测良率是否达到预设阈值;
若所述预测良率未达到预设阈值,则生成告警信息。
可以理解的,在生成调整指令之后,可以对关键厂务数据进行调整,得到更新后的厂务数据。并将更新后的厂务数据再次输入至机器学习模型。此时,如果得到的预测良率仍未达到预设阈值,则生成告警信息。一般的,可能当前的晶圆制造的良率已经受到其他因素的影响,而无论如何调整关键厂务数据,都无法达到预设阈值。
本技术方案这样设置,可以提高制造晶圆的良率。并且在提高良率的过程中,如果发现仍无法满足预设阈值的情况下,可以生成告警信息,以通过人工介入的方式,确保当前制造晶圆的良率问题。另外,也可以基于告警来告知用户进行了哪些关键厂务数据的调整,以供工作人员来查看上述调整是否存在合理性。例如工作人员取消了某一个关键厂务数据的调整,则说明该关键厂务数据的调整存在一定的不合理性,需要基于此来对机器学习模型进行更新,以确保机器学习模型输出结果的准确性。
在另一个实施例中,在将所述关键厂务数据输入至所述机器学习模型,确定当前制造的晶圆预估良率是否达到预设阈值之后,所述方法还包括:
若达到预设阈值,则按照当前的关键厂务数据进行晶圆的制造,并统计当前制造的晶圆良率,作为更新样本数据;
根据所述更新样本数据对所述机器学习模型进行迭代更新。
在一种情况下,当前制造的晶圆预估良率达到预设阈值,则可以按照当前的厂务数据继续进行晶圆的制造,并统计本批次晶圆良率。将本批次的晶圆良率与当前的关键厂务数据再作为更新样本数据,进一步的进行机器学习模型的迭代更新,可以使得机器学习模型的输出结果更加准确。
本方案通过这样的设置,可以随着时间的推进,逐渐的对机器学习模型进行迭代更新,不仅所采用的样本数据无需人工制作,准确度更高,而且更加能够体现当前设备的晶圆制造情况,而且迭代后会使得机器学习模型输出的预估结果的准确性更高,符合实际生产需求。
在另一个实施例中,所述机器学习模型为LightGBM回归预测模型。
其中,LightGBM(LGB)可以称为xgboost的优化加强版,通过对树生长策略、直方图算法、GOSS、并行计算等的优化,逐渐占据了各类机器学习建模大赛的神器,并且在实际工程项目中,其对类别型特征的处理、单样本加权的处理非常适合一些金融数据建模场景。
数据集前期经过了数据清洗和预处理,包括缺失值处理、异常值处理、标准化处理、相关性分析等步骤。
LGB核心超参数的设定:
task,指定任务,可选train,predict等。
boosting_type,提升方法,可选gbdt、rf等。
objective,目标(函数),如果是回归任务,可l2、l1、huber、quantile等;如果是分类任务,可选binary、multiclass等。
max_depth,树的最大深度,控制过拟合的有效手段。
num_leaves,树的最大叶子节点数。
feature_fraction,特征的随机采样率,指
bagging_fraction,样本的随机采样率
bagging_freq,是否启用bagging并设置迭代轮次,如启用,上述的特征与样本的的随机采样需要设置。
learning_rate,学习率;
lambda_l1,L1正则化;
lambda_l2,L2正则化;
一般回归模型使用MSE、MAE、MAPE、MedianAE等误差指标来评估模型效果。
目标函数(objective)与评估函数(metrics)在GBM模型中至关重要,目标函数影响模型的学习,而callback中的early_stopping受评估函数的控制。根据数据的分布情况以及最终的目标选择合适的目标函数与评估函数的组合,对模型效果有较大的影响。
其他重要的核心超参数,均通过俩俩网格搜索(Grid Search)的方法进行调参,选择最优参数组合。
本方案通过使用LightGBM回归预测模型,可以更加准确的基于厂务数据对晶圆良率进行预测,提高晶圆制造过程中对厂务数据的控制精度。
实施例二
图2是本申请实施例二提供的机器学习模型的训练过程的流程示意图。如图2所示,具体包括如下步骤:
步骤S201,获取历史制造的晶圆的历史厂务数据,以及晶圆制造的历史良率。
其中,历史厂务数据,可以是以往的晶圆制造过程中采集到的厂务数据。晶圆制造的历史良率,可以历史制造过程中每一批晶圆的良率数据。可以知道的,良率数据可以是合格的晶圆数量与当前批次生产的所有晶圆数量的比值。
步骤S202,对所述历史厂务数据进行数据预处理以及特征工程处理,得到样本数据;并将所述历史良率再作为样本数据的标签。
其中,数据预处理用于提高样本数据的质量,使样本数据更适合分析和模型训练。常见的数据预处理方式有数据清洗、数据转换、数据集成、数据规约等等。例如,可以对样本数据中的重复数据、异常数据、缺失数据进行处理,以对样本数据进行数据清洗。
特征工程处理用于通过数据挖掘技术从样本数据中提取特征,常见的特征工程处理方式有标准化处理、区间缩放处理、归一化处理、定量特征二值化处理、定性特征哑编码处理、缺失值处理和数据转化处理等等。
本技术方案这样设置的好处是提高样本数据的规范性,加快模型训练的收敛速度,提高训练效率,使得模型的训练效果更加快速和准确。
步骤S203,将带有标签的样本数据输入至初始模型,对所述初始模型进行训练,得到机器学习模型。
其中,训练方式可以采用有监督训练,也可以采用无监督进行训练。
具体的,可将带有标签的样本数据按照时间节点的顺序进行排列输入至初始模型,对初始模型进行训练,在每次训练回合中对初始模型的参数进行调整,直至训练结束得到机器学习模型。
在训练过程中,训练结束条件可以是机器学习模型的预测精度足够高,例如,预测精度超过80%。训练结束条件也可以是训练次数达到预设次数。例如,预设次数为20000次。本领域技术人员可根据实际情况设定预设阈值或预设次数,以使机器学习模型在学习到厂务数据对晶圆良率的影响因素的同时,又不会过拟合。
本技术方案的好处在于通过提供机器学习模型的训练过程,能够得到准确的机器学习模型,对于样本的数量以及真实度的控制,可以提高机器学习模型的训练速度和精度。
实施例三
图3是本申请实施例三提供的基于厂务数据的晶圆良率控制方法的流程示意图。如图3所示,具体包括如下步骤:
步骤S301,获取当前制造的晶圆的基础厂务数据;其中,所述基础厂务数据包括晶圆制造过程中的水课参数、电课参数以及气化课参数中的至少一种;
步骤S302,基于机器学习模型中包括的第一算法确定各基础厂务数据与所述晶圆良率的重要性指标;
本方案中,机器学习模型可以包括一部分算法,用于从基础厂务数据中筛选出与晶圆良率有关的重要性指标。可以理解的,重要性指标可以用于表征该厂务数据对晶圆良率的影响的重要性。
步骤S303,基于机器学习模型中包括的第二算法确定各基础厂务数据与所述晶圆良率的相关性指标;
本方案中,机器学习模型可以包括另一部分算法,用于从基础厂务数据中筛选出与晶圆良率有关的相关性指标。可以理解的,相关性指标可以用于表征该厂务数据对晶圆良率的影响的相关性。例如数值的增大或者减小,会与晶圆良率产生正相关或者负相关。
步骤S304,根据所述重要性指标和/或所述相关性指标,从基础厂务数据中确定关键厂务数据。
本方案中,可以基于重要性指标和/或相关性指标,来确定基础厂务数据是否为关键厂务数据。例如重要性指标足够高,则可以确定为关键厂务数据,或者,相关性指标呈现出正相关或者负相关,则可以确定为关键厂务数据,或者,同时满足重要性指标足够高,且相关性指标呈现出正相关,可以确定为关键厂务数据。
步骤S305,将所述关键厂务数据输入至所述机器学习模型,确定当前制造的晶圆预估良率是否达到预设阈值;
步骤S306,若未达到预设阈值,则生成对所述关键厂务数据进行调整的指令。
本技术方案在上述技术方案的基础上,提供了一种基于机器学习模型从基础厂务数据中筛选出关键厂务数据的具体方式,通过这样的设置,可以避免对于晶圆良率影响较小甚至没有影响的厂务数据的干扰,通过关键厂务数据,可以更好的为晶圆良率的预估和厂务数据的调整提供准确数据。
在一个实施例中,根据所述重要性指标和/或所述相关性指标,从基础厂务数据中确定关键厂务数据,包括:
若当前基础厂务数据所述重要性指标超过重要性阈值,则确定当前基础厂务数据为关键厂务数据;
或者,
若当前基础厂务数据所述相关性指标超过正的相关性阈值,则确定当前基础厂务数据为关键厂务数据,且为正相关;若当前基础厂务数据所述相关性指标小于负的相关性阈值,则确定当前基础厂务数据为关键厂务数据,且为负相关;
或者,
若当前基础厂务数据所述重要性指标超过重要性阈值,且当前基础厂务数据所述相关性指标超过正的相关性阈值,则确定当前基础厂务数据为关键厂务数据;或,若当前基础厂务数据所述重要性指标超过重要性阈值,且当前基础厂务数据所述相关性指标小于负的相关性阈值,则确定当前基础厂务数据为关键厂务数据。
其中,相关性可以包括大于正的相关性阈值或者小于负的相关性阈值,两者均可以体现当前的厂务数据与晶圆良率的相关程度。
此处,重要性的取值范围可以是0到1,比如重要性阈值可以取0.8,相关性可以是有正有负的,取值范围可以是-1到1,其中,-1到0是负相关,0到1是正相关。两者可以相互结合找出关键厂务数据。两个指标基于一个模型就能够输出,例如,相关性指标一般可以在数据处理和特征工程阶段用一个小的算法就能够输出出来,重要性指标一般在模型训练阶段输出出来。
本方案这样设置,可以更好的为厂务数据对晶圆良率的影响进行体现,并且可以更加精准的确定关键厂务数据,为后续的晶圆良率的预测和厂务数据的调整提供精准的控制范围。
本方案还提供了一种优选的实施方案,具体如下:
第一步,采集数据:
特征数据:
包含厂务各个设备的水电气等数据,其属性数据是各自的参数值等。历史的目标数据:可以是不良品数或良率数据。
水课相关举例:化学药剂/废化学品、污泥委外处理、水质检测、水平衡、化学药品消耗分析、用水量分析、水质指标分析、水系统电能及气能消耗分析等;
气化课相关举例:气体余量监测分析、气瓶更换监测维护、气体消耗量监测统计、气体侦测器更换保养、化学酸桶更换保养分析、化学品消耗量统计分析、化学过滤器更换保养、气化系统电能消耗统计分析、气化系统水的消耗统计和分析等。
第二步,对收集到的数据进行特征工程,将原始数据转换为机器学习算法可用的特征表示,并进行挖掘提取和特征工程,如文本数据编码,特征归一化或标准化操作等特征工程。对采集的历史晶圆良率数据进行阈值设置,超过阈值范围进行报警。
第三步,构建回归算法树模型如lightgbm,对超参数进行贝叶斯优化调参,找到最优的模型超参数进行训练,以及对训练好的模型进行保存。
第四步,基于树模型,输出厂务特征与良率的重要性排序,通过相关性分析,输出厂务特征与良率的相关系数排序,根据重要性指标和相关性指标进行归因分析,将特定的厂务因素与良率之间的关联性进行解释,确定哪些厂务因素对于良率的提高或降低起关键作用,找出影响良率的关键厂务因素。
第五步,针对待预测生产中的晶圆,基于上一步输出的良率关键因素,如果预测当前晶圆的良率低于前面得到的阈值,则对厂务因素进行调整,同理处理相关的厂务数据特征,调用训练好的模型,输出晶圆良率回归预测值。
第六步,基于调整之后,输出的晶圆良率,进行良率阈值判断,如果低于阈值,通知机台工程师人员。
第七步,基于新增的历史任务数据,定期对模型进行迭代和优化,不断提升模型的效果。
本技术方案,通过机器学习模型输出厂务层特征重要性指数和相关性指数,这可以帮助确定哪些厂务因素对于良率有较大影响。结合良率分析的机台和时间窗口的确定,交叉分析厂务和良率相关因子,并归因定义可能的相关因素进行异常处理,积累异常数据特征。通过预测模型,根据不同的厂务数据,可以模拟未来的晶圆良率情形,提前进行预判和干预调整。通过预测模型,对于实时的晶圆生产,结合当前的厂务数据,可以进行良率阈值判断及时报警。将厂务层数据与生产设备及厂务预测模型系统紧密同步,可在提高生产效率和良率发挥重要作用。
实施例四
图4是本申请实施例四提供的基于厂务数据的晶圆良率控制装置的结构示意图。如图4所示,具体包括如下:
基础厂务数据获取模块410,用于获取当前制造的晶圆的基础厂务数据;其中,所述基础厂务数据包括晶圆制造过程中的水课参数、电课参数以及气化课参数中的至少一种;
关键厂务数据确定模块420,用于基于预先构建的机器学习模型从基础厂务数据中确定与晶圆良率相关联的关键厂务数据;
晶圆良率预测模块430,用于将所述关键厂务数据输入至所述机器学习模型,确定当前制造的晶圆预估良率是否达到预设阈值;
厂务数据调整模块440,用于若未达到预设阈值,则生成对所述关键厂务数据进行调整的指令。
本申请实施例中的基于厂务数据的晶圆良率控制装置可以是装置,也可以是终端中的部件、集成电路、或芯片。该装置可以是移动电子设备,也可以为非移动电子设备。示例性的,移动电子设备可以为手机、平板电脑、笔记本电脑、掌上电脑、车载电子设备、可穿戴设备、超级移动个人计算机(ultra-mobile personal computer,UMPC)、上网本或者个人数字助理(personal digital assistant,PDA)等,非移动电子设备可以为服务器、网络附属存储器(Network Attached Storage,NAS)、个人计算机(personal computer,PC)、电视机(television,TV)、柜员机或者自助机等,本申请实施例不作具体限定。
本申请实施例中的基于厂务数据的晶圆良率控制装置可以为具有操作系统的装置。该操作系统可以为安卓(Android)操作系统,可以为iOS操作系统,还可以为其他可能的操作系统,本申请实施例不作具体限定。
本申请实施例提供的基于厂务数据的晶圆良率控制装置能够实现上述方法实施例实现的各个过程,为避免重复,这里不再赘述。
实施例五
此外,本申请实施例还提供了一种计算机设备,图5是本申请实施例五提供的计算机设备的结构示意图。该设备的结构如图5所示,所述设备包括用于存储计算机可读指令的存储器51和用于执行计算机可读指令的处理器52,其中,当该计算机可读指令被该处理器执行时,触发所述处理器执行所述的方法。
本申请实施例中的方法和/或实施例可以被实现为计算机软件程序。例如,本公开的实施例包括一种计算机程序产品,其包括承载在计算机可读介质上的计算机程序,该计算机程序包含用于执行流程图所示的方法的程序代码。在该计算机程序被处理单元执行时,执行本申请的方法中限定的上述功能。
需要说明的是,本申请所述的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本申请中,计算机可读介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。
而在本申请中,计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:无线、电线、光缆、RF等等,或者上述的任意合适的组合。
可以以一种或多种程序设计语言或其组合来编写用于执行本申请的操作的计算机程序代码,所述程序设计语言包括面向对象的程序设计语言—诸如Java、Smalltalk、C++,还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络——包括局域网(LAN)或广域网(WAN)—连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。
附图中的流程图或框图示出了按照本申请各种实施例的设备、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,该模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或操作的专用的针对硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
作为另一方面,本申请实施例还提供了一种计算机可读介质,该计算机可读介质可以是上述实施例中描述的设备中所包含的;也可以是单独存在,而未装配入该设备中。上述计算机可读介质承载有一个或者多个计算机可读指令,所述计算机可读指令可被处理器执行以实现前述本申请的多个实施例的方法和/或技术方案的步骤。
在本申请一个典型的配置中,终端、服务网络的设备均包括一个或多个处理器(CPU)、输入/输出接口、网络接口和内存。
内存可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM)。内存是计算机可读介质的示例。
计算机可读介质包括永久性和非永久性、可移动和非可移动媒体,可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类别的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。
此外,本申请实施例还提供了一种计算机程序,所述计算机程序存储于计算机设备,使得计算机设备执行所述控制代码执行的方法。
需要注意的是,本申请可在软件和/或软件与硬件的组合体中被实施,例如,可采用专用集成电路(ASIC)、通用目的计算机或任何其他类似硬件设备来实现。在一些实施例中,本申请的软件程序可以通过处理器执行以实现上文步骤或功能。同样地,本申请的软件程序(包括相关的数据结构)可以被存储到计算机可读记录介质中,例如,RAM存储器,磁或光驱动器或软磁盘及类似设备。另外,本申请的一些步骤或功能可采用硬件来实现,例如,作为与处理器配合从而执行各个步骤或功能的电路。
对于本领域技术人员而言,显然本申请不限于上述示范性实施例的细节,而且在不背离本申请的精神或基本特征的情况下,能够以其他的具体形式实现本申请。因此,无论从哪一点来看,均应将实施例看作是示范性的,而且是非限制性的,本申请的范围由所附权利要求而不是上述说明限定,因此旨在将落在权利要求的等同要件的含义和范围内的所有变化涵括在本申请内。不应将权利要求中的任何附图标记视为限制所涉及的权利要求。此外,显然“包括”一词不排除其他单元或步骤,单数不排除复数。装置权利要求中陈述的多个单元或装置也可以由一个单元或装置通过软件或者硬件来实现。第一,第二等词语用来表示名称,而并不表示任何特定的顺序。

Claims (10)

1.一种基于厂务数据的晶圆良率控制方法,其特征在于,所述方法包括:
获取当前制造的晶圆的基础厂务数据;其中,所述基础厂务数据包括晶圆制造过程中的水课参数、电课参数以及气化课参数中的至少一种;
基于预先构建的机器学习模型从基础厂务数据中确定与晶圆良率相关联的关键厂务数据;
将所述关键厂务数据输入至所述机器学习模型,确定当前制造的晶圆预估良率是否达到预设阈值;
若未达到预设阈值,则生成对所述关键厂务数据进行调整的指令。
2.根据权利要求1所述的方法,其特征在于,所述机器学习模型的训练过程,包括:
获取历史制造的晶圆的历史厂务数据,以及晶圆制造的历史良率;
对所述历史厂务数据进行数据预处理以及特征工程处理,得到样本数据;并将所述历史良率再作为样本数据的标签;
将带有标签的样本数据输入至初始模型,对所述初始模型进行训练,得到机器学习模型。
3.根据权利要求1所述的方法,其特征在于,基于预先构建的机器学习模型从基础厂务数据中确定与晶圆良率相关联的关键厂务数据,包括:
基于机器学习模型中包括的第一算法确定各基础厂务数据与所述晶圆良率的重要性指标;
基于机器学习模型中包括的第二算法确定各基础厂务数据与所述晶圆良率的相关性指标;
根据所述重要性指标和/或所述相关性指标,从基础厂务数据中确定关键厂务数据。
4.根据权利要求3所述的方法,其特征在于,根据所述重要性指标和/或所述相关性指标,从基础厂务数据中确定关键厂务数据,包括:
若当前基础厂务数据所述重要性指标超过重要性阈值,则确定当前基础厂务数据为关键厂务数据;
或者,
若当前基础厂务数据所述相关性指标超过正的相关性阈值,则确定当前基础厂务数据为关键厂务数据,且为正相关;若当前基础厂务数据所述相关性指标小于负的相关性阈值,则确定当前基础厂务数据为关键厂务数据,且为负相关;
或者,
若当前基础厂务数据所述重要性指标超过重要性阈值,且当前基础厂务数据所述相关性指标超过正的相关性阈值,则确定当前基础厂务数据为关键厂务数据;或,若当前基础厂务数据所述重要性指标超过重要性阈值,且当前基础厂务数据所述相关性指标小于负的相关性阈值,则确定当前基础厂务数据为关键厂务数据。
5.根据权利要求1所述的方法,其特征在于,在若未达到预设阈值,则生成对所述关键厂务数据进行调整的指令之后,所述方法还包括:
在对所述关键厂务数据进行调整之后,将调整后的更新厂务数据输入至所述机器学习模型;
识别所述机器学习模型的输出的预测良率是否达到预设阈值;
若所述预测良率未达到预设阈值,则生成告警信息。
6.根据权利要求1所述的方法,其特征在于,在将所述关键厂务数据输入至所述机器学习模型,确定当前制造的晶圆预估良率是否达到预设阈值之后,所述方法还包括:
若达到预设阈值,则按照当前的关键厂务数据进行晶圆的制造,并统计当前制造的晶圆良率,作为更新样本数据;
根据所述更新样本数据对所述机器学习模型进行迭代更新。
7.根据权利要求1-6中任一项所述的方法,其特征在于,所述机器学习模型为LightGBM回归预测模型。
8.一种基于厂务数据的晶圆良率控制装置,其特征在于,所述装置包括:
基础厂务数据获取模块,用于获取当前制造的晶圆的基础厂务数据;其中,所述基础厂务数据包括晶圆制造过程中的水课参数、电课参数以及气化课参数中的至少一种;
关键厂务数据确定模块,用于基于预先构建的机器学习模型从基础厂务数据中确定与晶圆良率相关联的关键厂务数据;
晶圆良率预测模块,用于将所述关键厂务数据输入至所述机器学习模型,确定当前制造的晶圆预估良率是否达到预设阈值;
厂务数据调整模块,用于若未达到预设阈值,则生成对所述关键厂务数据进行调整的指令。
9.一种计算机设备,其特征在于,所述设备包括:
一个或多个处理器;以及存储有计算机程序指令的存储器,所述计算机程序指令在被执行时使所述处理器执行如权利要求1-7中任意一项所述的基于厂务数据的晶圆良率控制方法。
10.一种计算机可读介质,其特征在于,其上存储有计算机程序指令,所述计算机程序指令可被处理器执行以实现如权利要求1-7中任意一项所述的基于厂务数据的晶圆良率控制方法。
CN202311414825.3A 2023-10-27 2023-10-27 基于厂务数据的晶圆良率控制方法、装置、设备及介质 Pending CN117474387A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202311414825.3A CN117474387A (zh) 2023-10-27 2023-10-27 基于厂务数据的晶圆良率控制方法、装置、设备及介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202311414825.3A CN117474387A (zh) 2023-10-27 2023-10-27 基于厂务数据的晶圆良率控制方法、装置、设备及介质

Publications (1)

Publication Number Publication Date
CN117474387A true CN117474387A (zh) 2024-01-30

Family

ID=89634108

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202311414825.3A Pending CN117474387A (zh) 2023-10-27 2023-10-27 基于厂务数据的晶圆良率控制方法、装置、设备及介质

Country Status (1)

Country Link
CN (1) CN117474387A (zh)

Similar Documents

Publication Publication Date Title
CN112285807B (zh) 一种气象信息预测方法及装置
Chen et al. Multi‐model ensemble for short‐term traffic flow prediction under normal and abnormal conditions
US20200034716A1 (en) Global optimal particle filtering method and global optimal particle filter
CN109800898A (zh) 一种智能短期负荷预测方法及系统
CN111738520A (zh) 一种融合孤立森林与长短期记忆网络的系统负载预测方法
WO2024046137A1 (zh) 一种多能源联合发电系统的功率预测模型构建及预测方法
CN116031888B (zh) 基于动态负荷预测的潮流优化方法、系统及存储介质
Zhang et al. Wind speed prediction research considering wind speed ramp and residual distribution
CN116307291B (zh) 一种基于小波分解的分布式光伏发电预测方法及预测终端
CN114330934A (zh) 一种模型参数自适应的gru新能源短期发电功率预测方法
CN116628220A (zh) 基于关系图卷积神经网络的电力工作票生成方法及系统
CN115542429A (zh) 一种基于XGBoost的臭氧质量预测方法及系统
CN115660233A (zh) 光伏功率预测方法、装置、电子设备及存储介质
CN116629416A (zh) 光伏电站功率预测方法及装置
CN116108385A (zh) 一种电力设备故障类型诊断方法及系统、终端、存储介质
AU2021106200A4 (en) Wind power probability prediction method based on quantile regression
CN117390370A (zh) 基于健康指数的机台预警方法、装置、设备及可读介质
CN116502774B (zh) 一种基于时间序列分解和勒让德投影的时间序列预测方法
CN117474387A (zh) 基于厂务数据的晶圆良率控制方法、装置、设备及介质
CN111428344B (zh) 一种高速公路机电设备退化分析模型的构建方法
CN116128211A (zh) 基于风光不确定性预报场景的风光水联合短期优化调度方法
Xiong et al. Forecasting ultra‐short‐term wind power by multiview gated recurrent unit neural network
CN114372615A (zh) 一种考虑空间相关性的短期光伏功率预测方法及系统
CN112732777A (zh) 基于时间序列的头寸预测方法、装置、设备和介质
CN117672910A (zh) 基于零部件数据的晶圆良率控制方法、装置、设备及介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination