CN115293282A

CN115293282A - 制程问题分析方法、设备及存储介质

Info

Publication number: CN115293282A
Application number: CN202210990891.4A
Authority: CN
Inventors: 李安东
Original assignee: Ai Empowerment Tech Inc
Current assignee: Ai Empowerment Tech Inc
Priority date: 2022-08-18
Filing date: 2022-08-18
Publication date: 2022-11-04
Anticipated expiration: 2042-08-18
Also published as: CN115293282B

Abstract

本申请涉及一种制程问题分析方法、设备及存储介质，属于半导体制造技术领域，该方法包括：获取问题分析需求和待分析资料的标签；确定每个数值型变数与制程问题的相关性；建立分类模型得到分类模型的训练分数；对于每个数值型变数与制程问题的组合，使用组合的样本总数、标签分类为好标签的第一样本数量、标签分类为坏标签的第二样本数量、相关性和/或训练分数计算数值型变数的关联分值；确定类别型资料每个类别型变数的样本总数、p‑value和坏标签的时间紧密度、坏标签对应的类别型变数的总数量、以及每个类别型变数的样本中坏标签的占比；使用类别型变数的各个参数计算类别型变数的关联分值；使用关联分值排序得到分析结果。

Description

制程问题分析方法、设备及存储介质

【技术领域】

本申请涉及一种制程问题分析方法、设备及存储介质，属于半导体制造技术领域。

【背景技术】

目前在制造领域中，以半导体制程为例，在晶圆生产过程中所收集的资料可以简单区分为类别型资料(比如：机台编号)与数值型资料(比如：线上量测参数)。晶圆厂每天关注的问题包括哪些因子与制程问题相关。比如：哪些因子与低良率有关。锁定制程问题相关的因子后，需要确认真因采用报废晶圆进行电性故障分析或物性故障分析。

传统的确定制程问题相关的因子的方式包括：第一种：使用皮尔森相关系数(pearson)分析数值型资料与良率的关联；第二种：使用方差分析(Analysis of Variance，ANOVA)法找出类别型变数是否存在对良率的差异。

半导体制程动辄几百道，收集的参数加起来有上千个，再包涵多种不同的资料源做类分析，参数的组合有几万种，是无法通过人工的方式一个一个确认的。基于此，对于第一种分析方式，通常是工程师主观筛选，决定相关系数绝对值多少以上是有关联，相关系数绝对值多少以下是有影响。或者是按照相关系数对参数进行排序。然而，相关系数只能衡量线性程度，可能会导致分析结果不准确的问题。

对于第二种分析方式，ANOVA有独立常态同一分配的假设，而制程问题的相关资料可能不符合这样的假设，即便使用无母数版本，统计检定的结果也只能得到有差异(拒绝虚无假设)和无差异(无法拒绝虚无假设)的结果。如果做了事后两两检定，得到的结果会像是:AB有差异、AC无差异、BC有差异，但这样的结果会让工程师无法判读，导致分析结果无法判断的问题。

【发明内容】

本申请提供了一种制程问题分析方法、设备及存储介质，可以解决工程师要花费太多时间检视结果、无法判读分析结果、高度依赖过往经验或是以主观筛选为主的问题。本申请提供一种快速、准确分析制程问题的排序方法，加速工程师快速锁定低良率问题的潜在原因，以解决前述问题。

本申请提供如下技术方案：

第一方面，提供一种制程问题分析方法，所述方法包括：

获取问题分析需求，所述问题分析需求包括待分析的制程问题和所述制程问题的分析方向；

获取待分析资料的标签，所述标签包括好标签和坏标签；所述待分析资料为用于分析所述制程问题的相关资料，所述待分析资料包括数值型资料和类别型资料；

对于所述数值型资料，确定所述数值型资料中每个数值型变数与所述制程问题的相关性；使用所述数值型变数与所述数值型变数对应的标签建立分类模型，得到所述分类模型的训练分数；对于每个数值型变数与所述制程问题的组合，使用所述组合的样本总数、标签分类为好标签的第一样本数量、标签分类为坏标签的第二样本数量、所述相关性和/或所述训练分数，计算所述数值型变数的关联分值；

对于所述类别型资料，确定所述类别型资料中每个类别型变数的样本总数；计算每个类别型变数的p-value；使用每个类别型变数对应的坏标签确定所述每个类别型变数的时间紧密度；获取所述坏标签对应的类别型变数的总数量、以及每个类别型变数的样本中坏标签的占比；使用所述类别型变数的样本总数、所述p-value、所述时间紧密度、所述总数量和/或所述占比，计算所述类别型变数的关联分值；

按照所述分析方向和所述关联分值对所述数值型变数或所述类别型变数进行排序，得到所述制程问题的分析结果。

可选地，所述获取待分析资料的标签，包括：

获取所述制程问题对应的划分阈值；使用所述划分阈值对所述待分析资料进行划分，得到所述待分析资料的标签；

或者，

使用聚类算法对所述待分析资料分群，得到所述待分析资料的标签。

可选地，所述确定所述数值型资料中每个数值型变数与所述制程问题的相关性，包括：

计算所述数值型变数与所述制程问题之间的斯皮尔曼spearman相关系数，得到所述相关性。

可选地，所述计算每个类别型变数的p-value，包括：

使用统计检定法计算所述p-value，所述统计检定法为比例Proportion检验法或者为二项分布binomial exact检验法。

可选地，所述对于每个数值型变数与所述制程问题的组合，使用所述组合的样本总数、标签分类为好标签的第一样本数量、标签分类为坏标签的第二样本数量、所述相关性和/或所述训练分数，计算所述数值型变数的关联分值，包括：

获取所述组合的样本总数对应的第一总数阈值、所述第一样本数量对应的第一样本阈值、以及所述第二样本数量对应的第二样本阈值；

确定所述组合的样本总数与所述第一总数阈值之间的第一比较结果、所述第一样本数量与所述第一样本阈值之间的第二比较结果、和/或所述第二样本数量与所述第二样本阈值之间的第三比较结果；

获取各个第一因素对应的第一加权参数，所述第一因素包括所述第一比较结果、所述第二比较结果、所述第三比较结果、所述相关性和/或所述训练分数；

确定每个第一因素与对应的第一加权参数之间的加权和，得到所述数值型变数的关联分值。

可选地，所述使用所述类别型变数的样本总数、所述p-value、所述时间紧密度、所述总数量和/或所述占比，计算所述类别型变数的关联分值，包括：

获取所述类别型变数的样本总数对应的第二总数阈值、以及所述总数量对应的总数量阈值；

确定所述类别型变数的样本总数与所述第二总数阈值之间的第四比较结果、和/或所述总数量与所述总数量阈值之间的第五比较结果；

确定所述占比的最大值；

获取各个第二因素对应的第二加权参数，所述第二因素包括所述第四比较结果、所述第五比较结果、所述p-value、所述时间紧密度和/或所述占比的最大值；

确定每个第二因素与对应的第二加权参数之间的加权和，得到所述类别型变数的关联分值。

可选地，所述按照所述分析方向和所述关联分值对所述数值型变数或所述类别型变数进行排序，得到所述制程问题的分析结果，包括：

在所述分析方向为望大的情况下，按照所述关联分值由大至小的顺序对所述数值型变数或所述类别型变数进行排序，得到所述分析结果；

或者，

在所述分析方向为望小的情况下，按照所述关联分值由小至大的顺序对所述数值型变数或所述类别型变数进行排序，得到所述分析结果；

或者，

在所述分析方向为望目的情况下，按照所述关联分值与目标分值之间的差值由小至大的顺序，对所述数值型变数或所述类别型变数进行排序，得到所述分析结果。

可选地，所述按照所述分析方向和所述关联分值对所述数值型变数或所述类别型变数进行排序，得到所述制程问题的分析结果之后，还包括：

使用图表展示所述分析结果。

第二方面，提供一种电子设备，所述设备包括处理器和存储器；所述存储器中存储有程序，所述程序由所述处理器加载并执行以实现第一方面提供的制程问题分析方法。

第三方面，提供一种计算机可读存储介质，所述存储介质中存储有程序，所述程序被处理器执行时用于实现第一方面提供的制程问题分析方法。

本申请的有益效果至少包括：通过获取问题分析需求；获取待分析资料的标签，标签包括好标签和坏标签；对于数值型资料，确定数值型资料中每个数值型变数与制程问题的相关性；使用数值型变数与数值型变数对应的标签建立分类模型，得到分类模型的训练分数；对于每个数值型变数与制程问题的组合，使用组合的样本总数、标签分类为好标签的第一样本数量、标签分类为坏标签的第二样本数量、相关性和/或训练分数，计算数值型变数的关联分值；对于类别型资料，确定类别型资料中每个类别型变数的样本总数；计算每个类别型变数的p-value；使用每个类别型变数对应的坏标签确定每个类别型变数的时间紧密度；获取坏标签对应的类别型变数的总数量、以及每个类别型变数的样本中坏标签的占比；使用类别型变数的样本总数、p-value、时间紧密度、总数量和/或占比，计算类别型变数的关联分值；按照分析方向和关联分值对数值型变数或类别型变数进行排序，得到制程问题的分析结果；可以解决仅使用相关系数分析数值型资料时得到的分析结果不准确的问题；通过结合多种指标(如统计、机器学习与专家经验等)综合分析制程问题的影响因素，可以提高分析结果的准确性。同时，可以解决分析结果无法判读的问题；由于使用者只需要关注最终的排序结果，即可确定出制程问题的影响因素，因此，可以增加分析结果的可读性。

另外，通过统一的指标排序，可以使用同一指标进行制程问题的判断，可以提高判断的客观性。

另外，指标计算过程简单，几十秒到分钟等级即可得到排序结果，可以提高分析效率。

上述说明仅是本申请技术方案的概述，为了能够更清楚了解本申请的技术手段，并可依照说明书的内容予以实施，以下以本申请的较佳实施例并配合附图详细说明如后。

【附图说明】

图1和图2是本申请一个实施例提供的数值型变数与良率之间的相关性的示意图；

图3是本申请一个实施例提供的制程问题分析方法的流程图；

图4是本申请一个实施例提供的制程问题的分析结果的示意图；

图5是本申请一个实施例提供的分析结果通过图标展示的示意图；

图6是本申请一个实施例提供的制程问题分析装置的框图；

图7是本申请一个实施例提供的电子设备的框图。

【具体实施方式】

下面结合附图和实施例，对本申请的具体实施方式做进一步详细描述。以下实施例用于说明本申请，但不用来限制本申请的范围。

首先，对本申请涉及的若干名词进行介绍。

皮尔森(pearson)相关系数：公式定义为两个连续变量(X,Y)的pearson相关性系数(Px,y)等于它们之间的协方差cov(X,Y)除以它们各自标准差的乘积(σX,σY)。系数的取值总是在-1.0到1.0之间，接近0的变量被成为无相关性，接近1或者-1被称为具有强相关性。

针对数值型变数，常见的方式是透过散布图矩阵来观察变数间的相关性。但在变数量一多的时候这样的图就不是很适用，变成需要看相关矩阵结果。只参考相关矩阵结果会导致结论会有偏误，故需要再使用绘图功能把挑选出的变数的散布图画出来。但如果资料分布是有特征在，只是线性关系程度低就容易被忽略。比如：晶圆厂在看参数与制程问题的相关性的时候，除了参考线性相关之外，亦会考量资料分布的状态是否合理。举例来说，假如分析的制程问题是良率，如图1与图2，两张图的相关系数是一样的，图1工程师会判读为没兴趣，图2才是他们有兴趣的。因此，单靠相关系数来排序或筛选，存在很多类似的状况，会浪费工程师许多时间去排除这些不合理的信息。此外，皮尔森相关系数容易受到离群值的影响，即便使用无母数的版本，也只是让指标具有较强的抗噪性。

另外，由于传统的相关系数一般都是使用皮尔森相关系数，但因半导体制程很容易有异常值出现，会对相关系数的计算造成巨大影响，如依据皮尔森相关系数进行分析、排序，很容易找到错误的关联。

斯皮尔曼(spearman)相关系数：或者说斯皮尔曼相关性系数，通常也叫斯皮尔曼秩相关系数。“秩”，可以理解成就是一种顺序或者排序，那么它就是根据原始数据的排序位置进行求解。适用于两列变量，而且具有等级变量性质具有线性关系的资料。

斯皮尔曼相关系数对异常值不敏感，也不要求常态分布，因此，在半导体制程场景中，可以提高确定相关性的准确度。

比例(Proportion)检验：用于检验抽样对象比例与目标比例的差距。

二项分布(binomial exact)检验：是指根据收集到的样本数据，推断总体分布是否服从某个指定的二项分布。其零假设是H0：样本来自的总体与所指定的某个二项分布不存在显著的差异。

p-value的作用：p-value就是用来判断H0假设是否成立的依据。因为期望值是基于H0假设得出的，如果观测值与期望值越一致，则说明检验现象与零假设越接近，则越没有理由拒绝零假设。如果观测值与期望值越偏离，说明零假设越站不住脚，则越有理由拒绝零假设，从而推出对立假设的成立。

下面，对本申请提供的制程问题分析方法进行介绍。

可选地，本申请以各个实施例提供的制程问题分析方法用于电子设备中为例进行说明，该电子设备为终端或服务器，终端可以为手机、计算机、平板电脑、扫描仪、电子眼、监控摄像头等，本实施例不对电子设备的类型作限定。

图3是本申请一个实施例提供的制程问题分析方法的流程图，该方法至少包括以下几个步骤：

步骤301，获取问题分析需求，问题分析需求包括待分析的制程问题和制程问题的分析方向。

示意性地，电子设备通过显示页面显示可选择的制程问题和分析方向，以供使用者选择；在通过显示页面接收到作用于待分析的制程问题和制程问题的分析方向的触发操作后，电子设备得到问题分析需求。

可选地，制程问题包括但不限于：良率、缺陷数和/或电性等，本实施例不对制程问题的具体设置方式作限定。

一般地，良率对应的分析方向为望大，即，良率越大越好，良率越小越差。缺陷数对应的分析方向为望小，即，缺陷数越大越差，缺陷越小越好。电性对应的分析方向为望目，此时，电性较大或较小都不是用户期望的，此时，需要预先设置目标分值，即，分析结果越靠近目标分值越好、与目标分值差异越大越差。

示意性地，使用者选择制程问题后，电子设备可以直接显示该制程问题对应的分析方向以供使用者确认，而无需使用者主动选择，而电子设备显示的分析方向为使用者期望的概率较大，因此，可以提高使用者选择问题分析需求的效率。

步骤302，获取待分析资料的标签，标签包括好标签和坏标签；待分析资料为用于分析制程问题的相关资料，待分析资料包括数值型资料和类别型资料。

数值型资料包括至少一个数值型变数，比如：数值型资料包括线上量测参数。类别型资料包括至少一种类别型变数，比如：类别型资料包括机台编号。

在一个示例中，获取待分析资料的标签，包括：接收用户对待分析资料设置的标签。

在另一个示例中，获取待分析资料的标签，包括：获取制程问题对应的划分阈值；使用划分阈值对待分析资料进行划分，得到待分析资料的标签。

以制程问题为良率为例，假设划分阈值包括良率排序为前20％的待分析资料为好标签、良率排序为后20％的待分析资料为坏标签，则可以将制程问题对应的待分析资料按照良率进行排序，将前20％的待分析资料设置为好标签，将后20％的待分析资料设置为坏标签。此时，电子设备中存储有待分析资料与良率之间的对应关系。

或者，使用聚类算法对待分析资料分群，得到待分析资料的标签。换言之，将各个待分析资料之间的相似性进行比较，将相似度较高的待分析资料放到一个群(或者说簇)中。其中，聚类算法包括但不限于K-means算法、或K-中心点算法、或基于随机选择的聚类算法，本实施例不对聚类算法的类型作限定。

步骤303，对于数值型资料，确定数值型资料中每个数值型变数与制程问题的相关性；使用数值型变数与数值型变数对应的标签建立分类模型，得到分类模型的训练分数；对于每个数值型变数与制程问题的组合，使用组合的样本总数、标签分类为好标签的第一样本数量、标签分类为坏标签的第二样本数量、相关性和/或训练分数，计算数值型变数的关联分值。

可选地，步骤303和步骤302不存在严格的先后执行顺序，根据分析需求，电子设备可以选择其一执行。

在一个示例中，确定数值型资料中每个数值型变数与制程问题的相关性，包括：计算数值型变数与制程问题之间的spearman相关系数，得到相关性。

本实施例中，通过使用spearman相关系数计算相关性，可以避免使用皮尔森相关系数进行分析时，由于皮尔森相关系数对异常值敏感，而半导体制程容易出现异常值，从而导致的分析结果不准确的问题，因此，可以提高相关性分析的准确性。

可选地，分类模型用于确定是否能够使用单一的一个数值型变数将好标签和坏标签的待分析资料分开。若使用单一的一个数值型变数能够将待分析资料分开，则说明该数值型变数对制程问题的影响较大，该数值型变数需要重点分析。

具体地，分类模型的输入为单一的一个数值型变数，输出为该数值型变数的标签。分类模型包括但不限于：分布式梯度增强库(XGboost)、分类树、或者随机森林等，本实施例不对分类模型的实现方式作限定。

分类模型的训练分数用于指示分类模型的分类性能，训练分数可以为分类模型的F1分数，即，训练分数是分类模型的精度与召回率的谐波平均值。在其它实施例中，训练分数也可以是其它指标，本实施例不对训练分数的实现方式作限定。

其中，对于每个数值型变数与制程问题的组合，使用组合的样本总数、标签分类为好标签的第一样本数量、标签分类为坏标签的第二样本数量、相关性和/或训练分数，计算数值型变数的关联分值，包括：获取组合的样本总数对应的第一总数阈值、第一样本数量对应的第一样本阈值、以及第二样本数量对应的第二样本阈值；确定组合的样本总数与第一总数阈值之间的第一比较结果、第一样本数量与第一样本阈值之间的第二比较结果、和/或第二样本数量与第二样本阈值之间的第三比较结果；获取各个第一因素对应的第一加权参数，第一因素包括第一比较结果、第二比较结果、第三比较结果、相关性和/或训练分数；确定每个第一因素与对应的第一加权参数之间的加权和，得到数值型变数的关联分值。

以第一因素包括第一比较结果、第二比较结果、第三比较结果、相关性和训练分数为例，数值型变数的关联分值Score1可以通过下式表示：

Score1＝w1*s+w2*f+w3*I(n>_n_)+w4*I(n1>_n1_)+w5*I(n2>_n2_)。

其中，n表示组合的样本总数，_n_表示第一总数阈值，n1表示第一样本数量，_n1_表示第一样本阈值，n2表示第二样本数量、_n2_表示第二样本阈值，w1～w5表示各个第一因素对应的第一加权参数，I表示指示(Indicator)函数，即表示括号内的条件满足时为1、不满足则为0。

需要补充说明的是，上述公式仅是示意性地，在实际实现时，关联分值的加权方式也可以改变，本实施例不对关联分值的计算公式作限定。

步骤304，对于类别型资料，确定类别型资料中每个类别型变数的样本总数；计算每个类别型变数的p-value；使用每个类别型变数对应的坏标签确定每个类别型变数的时间紧密度；获取坏标签对应的类别型变数的总数量、以及每个类别型变数的样本中坏标签的占比；使用类别型变数的样本总数、p-value、时间紧密度、总数量和/或占比，计算类别型变数的关联分值。

示意性地，计算每个类别型变数的p-value，包括：使用统计检定法计算p-value，统计检定法为Proportion检验法或者为binomial exact检验法。

由于Proportion检验法和binomial exact检验法目的是取得一个客观的衡量比例的指标(即p-value)。比如：一个比例是0.6、一个比例是0.65，本实施例提供的统计检定法可以衡量两个比例超过0.5的客观值是多少，p-value可以代依据数据上所得的结果，有证据力的展示，而不是单纯计算0.6-0.5，0.65-0.5得到的值。使用统计检定法得到的p-value更具一般性说服力。

使用每个类别型变数对应的坏标签确定每个类别型变数的时间紧密度，包括：统计类别型变数的坏标签在时间轴上的群聚程度，基于该群聚程度确定时间紧密度。可选地，坏标签的群聚程度越高，时间紧密度越大或是越小。

使用类别型变数的样本总数、p-value、时间紧密度、总数量和/或占比，计算类别型变数的关联分值，包括：获取类别型变数的样本总数对应的第二总数阈值、以及总数量对应的总数量阈值；确定类别型变数的样本总数与第二总数阈值之间的第四比较结果、和/或总数量与总数量阈值之间的第五比较结果；确定占比的最大值；获取各个第二因素对应的第二加权参数，第二因素包括第四比较结果、第五比较结果、p-value、时间紧密度和/或占比的最大值；确定每个第二因素与对应的第二加权参数之间的加权和，得到类别型变数的关联分值。

以第二因素包括第四比较结果、第五比较结果、p-value、时间紧密度和占比的最大值为例，类别型变数的关联分值Score2可以通过下式表示：

Score2＝w1*I(n>＝_n_)+w2*p+w3*ti+w4*I(1<m<＝_m_)+w5*max(r)。

其中，n为类别型变数的样本总数，_n_为第二总数阈值，p为p-value，ti为时间紧密度，m为总数量，_m_为总数量阈值，max(r)为占比的最大值，w1～w5表示各个第二因素对应的第一加权参数，I表示指示(Indicator)函数，即表示括号内的条件满足时为1、不满足则为0。

步骤305，按照分析方向和关联分值对数值型变数或类别型变数进行排序，得到制程问题的分析结果。

具体地，按照分析方向和关联分值对数值型变数或类别型变数进行排序，得到制程问题的分析结果，包括：在分析方向为望大的情况下，按照关联分值由大至小的顺序对数值型变数或类别型变数进行排序，得到分析结果；或者，在分析方向为望小的情况下，按照关联分值由小至大的顺序对数值型变数或类别型变数进行排序，得到分析结果；或者，在分析方向为望目的情况下，按照关联分值与目标分值之间的差值由小至大的顺序，对数值型变数或类别型变数进行排序，得到分析结果。

可选地，按照分析方向和关联分值对数值型变数或类别型变数进行排序，得到制程问题的分析结果之后，还包括：使用图表展示分析结果。

比如：对待分析资料进行分析之后，得到的分析结果参考图4所示，其中，ranking列表示各个数值型变数的排序情况。之后，以数值型变数x_param对应的划分阈值为wat：parameter$0075对wat@step001的待分析资料进行分析，得到待分析资料的散点图参考图5(1)。按照该划分阈值对该待分析资料设置标签，得到的箱型图参考图5(2)，其中，B表示坏标签、G表示好标签。各个待分析资料的累积频率分布与理论的正态分布的累积概率分布之间的关系，参考图5(3)所示的概率图(P-P plot)。图5中的图表显示方式仅是示意性地，在实际实现时，也可以是其它的图表方式，本实施例在此不再一一列举。

在实际进行制程问题的分析时，按照上述内容可以至少包括以下三个阶段：

1.资料准备阶段。即，将待分析资料汇入资料库，系统从资料库中依据使用者要分析的制程问题抓取资料。

2.选择数值型资料或是类别型资料的排序结果。

3.搭配图形审视排序结果，此时可再参考工程师的过往经验与制程知识判断是可能造成制程问题的原因还是资料上的巧合。

综上所述，本实施例提供的制程问题分析方法，通过获取问题分析需求；获取待分析资料的标签，标签包括好标签和坏标签；对于数值型资料，确定数值型资料中每个数值型变数与制程问题的相关性；使用数值型变数与数值型变数对应的标签建立分类模型，得到分类模型的训练分数；对于每个数值型变数与制程问题的组合，使用组合的样本总数、标签分类为好标签的第一样本数量、标签分类为坏标签的第二样本数量、相关性和/或训练分数，计算数值型变数的关联分值；对于类别型资料，确定类别型资料中每个类别型变数的样本总数；计算每个类别型变数的p-value；使用每个类别型变数对应的坏标签确定每个类别型变数的时间紧密度；获取坏标签对应的类别型变数的总数量、以及每个类别型变数的样本中坏标签的占比；使用类别型变数的样本总数、p-value、时间紧密度、总数量和/或占比，计算类别型变数的关联分值；按照分析方向和关联分值对数值型变数或类别型变数进行排序，得到制程问题的分析结果；可以解决仅使用相关系数分析数值型资料时得到的分析结果不准确的问题；通过结合多种指标(如统计、机器学习与专家经验等)综合分析制程问题的影响因素，可以提高分析结果的准确性。同时，可以解决分析结果无法判读的问题；由于使用者只需要关注最终的排序结果，即可确定出制程问题的影响因素，因此，可以增加分析结果的可读性。

图6是本申请一个实施例提供的制程问题分析装置的框图。该装置至少包括以下几个模块：需求获取模块610、标签获取模块620、第一计算模块630、第二计算模块640和结果排序模块650。

需求获取模块610，用于获取问题分析需求，所述问题分析需求包括待分析的制程问题和所述制程问题的分析方向；

标签获取模块620，用于获取待分析资料的标签，所述标签包括好标签和坏标签；所述待分析资料为用于分析所述制程问题的相关资料，所述待分析资料包括数值型资料和类别型资料；

第一计算模块630，用于对于所述数值型资料，确定所述数值型资料中每个数值型变数与所述制程问题的相关性；使用所述数值型变数与所述数值型变数对应的标签建立分类模型，得到所述分类模型的训练分数；对于每个数值型变数与所述制程问题的组合，使用所述组合的样本总数、标签分类为好标签的第一样本数量、标签分类为坏标签的第二样本数量、所述相关性和/或所述训练分数，计算所述数值型变数的关联分值；

第二计算模块640，用于对于所述类别型资料，确定所述类别型资料中每个类别型变数的样本总数；计算每个类别型变数的p-value；使用每个类别型变数对应的坏标签确定所述每个类别型变数的时间紧密度；获取所述坏标签对应的类别型变数的总数量、以及每个类别型变数的样本中坏标签的占比；使用所述类别型变数的样本总数、所述p-value、所述时间紧密度、所述总数量和/或所述占比，计算所述类别型变数的关联分值；

结果排序模块650，用于按照所述分析方向和所述关联分值对所述数值型变数或所述类别型变数进行排序，得到所述制程问题的分析结果。

相关细节参考上述方法实施例。

需要说明的是：上述实施例中提供的制程问题分析装置在进行制程问题分析时，仅以上述各功能模块的划分进行举例说明，实际应用中，可以根据需要而将上述功能分配由不同的功能模块完成，即将制程问题分析装置的内部结构划分成不同的功能模块，以完成以上描述的全部或者部分功能。另外，上述实施例提供的制程问题分析装置与制程问题分析方法实施例属于同一构思，其具体实现过程详见方法实施例，这里不再赘述。

图7是本申请一个实施例提供的电子设备的框图。该设备至少包括处理器701和存储器702。

处理器701可以包括一个或多个处理核心，比如：4核心处理器、8核心处理器等。处理器701可以采用DSP(Digital Signal Processing，数字信号处理)、FPGA(Field－Programmable Gate Array，现场可编程门阵列)、PLA(Programmable Logic Array，可编程逻辑阵列)中的至少一种硬件形式来实现。处理器701也可以包括主处理器和协处理器，主处理器是用于对在唤醒状态下的数据进行处理的处理器，也称CPU(Central ProcessingUnit，中央处理器)；协处理器是用于对在待机状态下的数据进行处理的低功耗处理器。在一些实施例中，处理器701可以在集成有GPU(Graphics Processing Unit，图像处理器)，GPU用于负责显示屏所需要显示的内容的渲染和绘制。一些实施例中，处理器701还可以包括AI(Artificial Intelligence，人工智能)处理器，该AI处理器用于处理有关机器学习的计算操作。

存储器702可以包括一个或多个计算机可读存储介质，该计算机可读存储介质可以是非暂态的。存储器702还可包括高速随机存取存储器，以及非易失性存储器，比如一个或多个磁盘存储设备、闪存存储设备。在一些实施例中，存储器702中的非暂态的计算机可读存储介质用于存储至少一个指令，该至少一个指令用于被处理器701所执行以实现本申请中方法实施例提供的制程问题分析方法。

在一些实施例中，电子设备还可选包括有：外围设备接口和至少一个外围设备。处理器701、存储器702和外围设备接口之间可以通过总线或信号线相连。各个外围设备可以通过总线、信号线或电路板与外围设备接口相连。示意性地，外围设备包括但不限于：射频电路、触摸显示屏、音频电路、和电源等。

当然，电子设备还可以包括更少或更多的组件，本实施例对此不作限定。

可选地，本申请还提供有一种计算机可读存储介质，所述计算机可读存储介质中存储有程序，所述程序由处理器加载并执行以实现上述方法实施例的制程问题分析方法。

可选地，本申请还提供有一种计算机产品，该计算机产品包括计算机可读存储介质，所述计算机可读存储介质中存储有程序，所述程序由处理器加载并执行以实现上述方法实施例的制程问题分析方法。

以上所述实施例的各技术特征可以进行任意的组合，为使描述简洁，未对上述实施例中的各个技术特征所有可能的组合都进行描述，然而，只要这些技术特征的组合不存在矛盾，都应当认为是本说明书记载的范围。

以上所述实施例仅表达了本申请的几种实施方式，其描述较为具体和详细，但并不能因此而理解为对发明专利范围的限制。应当指出的是，对于本领域的普通技术人员来说，在不脱离本申请构思的前提下，还可以做出若干变形和改进，这些都属于本申请的保护范围。因此，本申请专利的保护范围应以所附权利要求为准。

Claims

1.一种制程问题分析方法，其特征在于，所述方法包括：

2.根据权利要求1所述的方法，其特征在于，所述获取待分析资料的标签，包括：

或者，

3.根据权利要求1所述的方法，其特征在于，所述确定所述数值型资料中每个数值型变数与所述制程问题的相关性，包括：

4.根据权利要求1所述的方法，其特征在于，所述计算每个类别型变数的p-value，包括：

使用统计检定法计算所述p-value，所述统计检定法为比例Proportion检验法或者为二项分布binomialexact检验法。

5.根据权利要求1所述的方法，其特征在于，所述对于每个数值型变数与所述制程问题的组合，使用所述组合的样本总数、标签分类为好标签的第一样本数量、标签分类为坏标签的第二样本数量、所述相关性和/或所述训练分数，计算所述数值型变数的关联分值，包括：

6.根据权利要求1所述的方法，其特征在于，所述使用所述类别型变数的样本总数、所述p-value、所述时间紧密度、所述总数量和/或所述占比，计算所述类别型变数的关联分值，包括：

确定所述占比的最大值；

7.根据权利要求1至6任一所述的方法，其特征在于，所述按照所述分析方向和所述关联分值对所述数值型变数或所述类别型变数进行排序，得到所述制程问题的分析结果，包括：

或者，

8.根据权利要求1至6任一所述的方法，其特征在于，所述按照所述分析方向和所述关联分值对所述数值型变数或所述类别型变数进行排序，得到所述制程问题的分析结果之后，还包括：

使用图表展示所述分析结果。

9.一种电子设备，其特征在于，所述设备包括处理器和存储器；所述存储器中存储有程序，所述程序由所述处理器加载并执行以实现如权利要求1至8任一项所述的制程问题分析方法。

10.一种计算机可读存储介质，其特征在于，所述存储介质中存储有程序，所述程序被处理器执行时用于实现如权利要求1至8任一项所述的制程问题分析方法。