CN117076856A - 一种缺陷根因定位方法、系统、设备及存储介质 - Google Patents
一种缺陷根因定位方法、系统、设备及存储介质 Download PDFInfo
- Publication number
- CN117076856A CN117076856A CN202311031622.6A CN202311031622A CN117076856A CN 117076856 A CN117076856 A CN 117076856A CN 202311031622 A CN202311031622 A CN 202311031622A CN 117076856 A CN117076856 A CN 117076856A
- Authority
- CN
- China
- Prior art keywords
- node
- suspicious
- nodes
- product
- data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 208
- 230000007547 defect Effects 0.000 title claims abstract description 75
- 238000003860 storage Methods 0.000 title claims abstract description 15
- 230000008569 process Effects 0.000 claims abstract description 159
- 238000012545 processing Methods 0.000 claims abstract description 71
- 238000004458 analytical method Methods 0.000 claims abstract description 43
- 230000002159 abnormal effect Effects 0.000 claims abstract description 26
- 238000005259 measurement Methods 0.000 claims abstract description 19
- 238000001514 detection method Methods 0.000 claims abstract description 17
- 238000004140 cleaning Methods 0.000 claims abstract description 16
- 238000007781 pre-processing Methods 0.000 claims abstract description 16
- 238000009826 distribution Methods 0.000 claims description 26
- 238000004590 computer program Methods 0.000 claims description 15
- 238000005315 distribution function Methods 0.000 claims description 10
- 230000004807 localization Effects 0.000 claims description 7
- 238000010219 correlation analysis Methods 0.000 claims description 2
- 238000004519 manufacturing process Methods 0.000 description 34
- 239000011521 glass Substances 0.000 description 15
- 238000004364 calculation method Methods 0.000 description 12
- 238000010586 diagram Methods 0.000 description 10
- 230000002950 deficient Effects 0.000 description 6
- 238000012986 modification Methods 0.000 description 5
- 230000004048 modification Effects 0.000 description 5
- 238000007619 statistical method Methods 0.000 description 5
- 230000006870 function Effects 0.000 description 4
- 238000007405 data analysis Methods 0.000 description 3
- 230000006872 improvement Effects 0.000 description 3
- 230000003993 interaction Effects 0.000 description 3
- 230000001186 cumulative effect Effects 0.000 description 2
- 238000012217 deletion Methods 0.000 description 2
- 230000037430 deletion Effects 0.000 description 2
- 238000002372 labelling Methods 0.000 description 2
- 239000000463 material Substances 0.000 description 2
- 238000004801 process automation Methods 0.000 description 2
- 238000005070 sampling Methods 0.000 description 2
- 230000000007 visual effect Effects 0.000 description 2
- 230000005856 abnormality Effects 0.000 description 1
- 230000006978 adaptation Effects 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000003749 cleanliness Effects 0.000 description 1
- 230000019771 cognition Effects 0.000 description 1
- 238000013079 data visualisation Methods 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 238000003745 diagnosis Methods 0.000 description 1
- 238000007689 inspection Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 239000002243 precursor Substances 0.000 description 1
- 238000012216 screening Methods 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/10—Pre-processing; Data cleansing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F17/00—Digital computing or data processing equipment or methods, specially adapted for specific functions
- G06F17/10—Complex mathematical operations
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/243—Classification techniques relating to the number of classes
- G06F18/2433—Single-class perspective, e.g. one-against-all classification; Novelty detection; Outlier detection
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02P—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
- Y02P90/00—Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
- Y02P90/30—Computing systems specially adapted for manufacturing
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Computation (AREA)
- Life Sciences & Earth Sciences (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Biology (AREA)
- Mathematical Physics (AREA)
- Algebra (AREA)
- Mathematical Analysis (AREA)
- Mathematical Optimization (AREA)
- Computational Mathematics (AREA)
- Pure & Applied Mathematics (AREA)
- Databases & Information Systems (AREA)
- Software Systems (AREA)
- General Factory Administration (AREA)
Abstract
本发明提供一种缺陷根因定位方法、系统、设备及存储介质,涉及工业自动化领域,所述方法流程为:对产品的质量检测数据和加工履历数据进行清洗、预处理,以形成工艺流程数据;基于工艺流程数据构建可疑程度度量模型;基于可疑程度度量模型进行节点重要性分析,并且基于节点重要性分析结果初次确定可疑节点;度量可疑节点的工艺参数在正常品和异常品的取值差异,并且基于取值差异再次确定可疑节点;输出导致产品质量缺陷的可疑节点集合以及相关的工艺参数。本发明通过复杂网络来刻画工艺流程中不同节点之间的关系,充分考虑节点之间的时序顺序和关联性,结合重要性分析的方式来确定可疑节点,能够更加准确的识别和定位缺陷根因。
Description
技术领域
本发明涉及工业自动化领域,具体而言,涉及一种缺陷根因定位方法、系统、设备及存储介质。
背景技术
在工业制造过程中,定位缺陷产生的根因对于提高生产效率和产品质量至关重要。现有的缺陷根因定位方法主要包括传统的统计分析方法和人工经验判断方法。
现有的缺陷根因定位方法存在一些限制和不足,具体表现在:(1)传统的统计分析方法在缺陷根因定位中需要大量的数据处理和复杂的计算过程,导致分析和定位耗时长,效率低;此外,传统的统计分析方法往往需要满足特定的数据分布和假设条件,限制了其适用范围和灵活性;(2)人工经验判断方法容易受到个体主观意见和经验的影响,导致结果缺乏客观性和一致性,此外,人工经验判断方法往往由于人工经验受限于个体的认知和经验水平,而造成缺陷的因素众多、关联复杂,在分析缺陷根因时存在一定的局限性。
发明内容
本发明提供一种缺陷根因定位方法、系统、设备及存储介质,解决现有技术在缺陷根因定位时由于工艺参数众多、工艺参数间高度相关、产品工艺流程复杂,难以准确定位工业产品缺陷根因的问题。
在第一方面,本发明实施例中提供一种缺陷根因定位方法,所述方法包括以下步骤:
对产品的质量检测数据和加工履历数据进行清洗、预处理,以形成工艺流程数据;
基于工艺流程数据构建可疑程度度量模型;
基于可疑程度度量模型进行节点重要性分析,并且基于节点重要性分析结果初次确定可疑节点;
度量可疑节点的工艺参数在正常品和异常品的取值差异,并且基于取值差异再次确定可疑节点;
输出导致产品质量缺陷的可疑节点集合以及相关的工艺参数。
于上述实施例中,通过复杂网络来刻画工艺流程中不同节点之间的关系,充分考虑节点之间的时序顺序和关联性,结合重要性分析的方式来确定可疑节点,能够更加准确的识别和定位缺陷根因。
作为本申请一些可选实施方式,对产品的质量检测数据和加工履历数据进行预处理的流程如下:
对数值型的工艺参数进行相关性分析处理,以剔除相关性系数超过数值阈值的工艺参数;
对非数值型的工艺参数进行编码处理,以转化工艺参数的参数类型。
于上述实施例中,通过对数据进行预处理可以避免出现严重的共线性问题以及类型选择参数不能直接用于后续分析的问题,提高了数据分析的准确性和效率。
作为本申请一些可选实施方式,所述工艺流程数据包括产品的工艺环节、流转关系以及工艺参数。
作为本申请一些可选实施方式,基于工艺流程数据构建可疑程度度量模型的流程如下:
将产品的工艺环节作为复杂网络的节点,将产品的流转关系作为复杂网络的边;
根据节点的关联关系构建可疑程度度量模型,其中,节点的关联关系基于节点的时序顺序或相关系数确定。
于上述实施例中,采用复杂网络来刻画工艺流程中的不同节点之间的关系,充分考虑工艺流程中节点之间的时序关系,以此来确定节点之间的连接关系;将工艺流程映射为复杂网络,可以更准确捕捉缺陷的传播路径以及不同工艺环节对整体生产质量的影响程度,使得工艺流程更直观、易于分析。
作为本申请一些可选实施方式,基于可疑程度度量模型进行节点重要性分析,并且基于节点重要性分析结果确定可疑节点的流程如下:
计算可疑程度度量模型所有节点的重要性指数;
根据所有节点的重要性指数选取若干节点作为可疑节点。
于上述实施例中,从度量节点重要性的角度出发分析可疑程度度量模型,挖掘可疑工艺流程环节,可以定量地评估节点在整个加工工艺流程中的重要性并进而确定导致缺陷的可疑节点,更好地考虑节点之间的关联性和时序顺序,从而更准确地识别出潜在的工艺缺陷根因。
作为本申请一些可选实施方式,所述重要性指数的计算公式如下:
其中,Si表示节点i的重要性指数,Kout表示节点出入度,PVi表示该节点不同分支上产品数量分布的熵值,N表示产品总数,N'表示进入该节点的产品数量。
作为本申请一些可选实施方式,所述熵值的计算公式如下:
其中,PVi表示节点i不同分支上产品数量分布的熵值,j表示节点i的分支,w表示节点i所有分支上的产品总数,wj表示从节点i出发流向分支j的产品数量。
作为本申请一些可选实施方式,度量可疑节点的工艺参数在正常品和异常品的取值差异,并且基于取值差异确定可疑节点的流程如下:
分别获取可疑节点的工艺参数在正常品和异常品的取值,并且根据取值构建两个概率分布函数;
计算两个概率分布函数的散度,如果散度超过散度阈值,则继续追溯可疑节点的前序节点,反之,则再次判定为可疑节点。
于上述实施例中,在输出可疑节点集合的同时给出这些可疑节点之间的连接关系、路径信息、工艺参数等数据,以便更好地理解工艺流程中各节点之间的相互作用和影响。
作为本申请一些可选实施方式,所述散度为KL散度或JS散度。
在第二方面,本发明提供一种缺陷根因定位系统,所述系统包括:
数据处理单元,所述数据处理单元用于对产品的质量检测数据和加工履历数据进行清洗、预处理,以形成工艺流程数据;
模型构建单元,所述模型构建单元基于工艺流程数据构建可疑程度度量模型;
重要性分析单元,所述重要性分析单元基于可疑程度度量模型进行节点重要性分析,并且基于节点重要性分析结果初次确定可疑节点;
可疑节点定位单元,所述可疑节点定位单元用于度量可疑节点的工艺参数在正常品和异常品的取值差异,并且基于取值差异再次确定可疑节点;
数据输出单元,所述数据输出单元用于输出导致产品质量缺陷的可疑节点集合以及相关的工艺参数。
在第三方面,本发明提供一种计算机设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行计算机程序时实现所述一种缺陷根因定位方法。
在第四方面,本发明提供一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现所述一种缺陷根因定位方法。
本发明的有益效果如下:
1.本发明采用复杂网络来刻画工艺流程中的不同节点之间的关系,充分考虑工艺流程中节点之间的时序关系,以此来确定节点之间的连接关系,将工艺流程映射为复杂网络,可以更准确地捕捉缺陷的传播路径以及不同工艺环节对整体生产质量的影响程度,使得工艺流程更直观、易于分析。
2.本发明从度量节点重要性的角度出发分析可疑程度度量模型,挖掘可疑工艺流程环节,该模型可以定量地评估节点在整个加工工艺流程中的重要性并进而确定导致缺陷的可疑节点,能够更好地考虑节点之间的关联性和时序顺序,从而更准确地识别出潜在的工艺缺陷根因。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本发明的某些实施例,因此不应被看作是对范围的限定,对于本邻域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
图1是本发明的实施例所述缺陷根因定位方法的流程图;
图2是本发明的实施例所述通过KS散度确定可疑节点的流程图;
图3是本发明的实施例所述玻璃面板生产工艺流程网络图;
图4是本发明的实施例所述115600节点生产工艺流程图;
图5是本发明的实施例所述115600参数取值分布图;
图6是本发明的实施例所述115400参数取值分布图;
图7是本发明的实施例所述115402参数取值分布图;
图8是本发明的实施例所述缺陷根因定位系统的结构框图。
具体实施方式
为了更好的理解上述技术方案,下面通过附图以及具体实施例对本发明技术方案做详细的说明,应当理解本发明实施例和实施例中的具体特征是对本发明技术方案的详细的说明,而不是对本发明技术方案的限定,在不冲突的情况下,本发明实施例和实施例中的技术特征可以相互组合。
同样应当理解的是,为了简化本发明揭示的表述,从而帮助对至少一个发明实施例的理解,前文对本发明实施例的描述中,有时会将多种特征归并至一个实施例、附图或对其的描述中。但是,这种披露方法并不意味着本发明对象所需要的特征比权利要求中提及的特征多。实际上,实施例的特征要少于上述披露的单个实施例的全部特征。
在工业制造过程中,常常会遇到工艺参数众多、参数间高度相关、产品工艺流程复杂等技术难题,难以准确定位工业产品缺陷根因。因此,本发明提供了一种缺陷根因定位方法,旨在有效解决以上技术问题,帮助工业制造企业快速准确地定位和解决缺陷产品问题。
实施例1
本发明提供一种缺陷根因定位方法,请参阅图1,图1为所述方法的流程图,所述方法流程如下:
(1)对产品的质量检测数据和加工履历数据进行清洗、预处理,以形成完整的工艺流程数据。
于本发明实施例中,加工履历数据包括但不限于以下方面:生产过程中各个工艺环节的流转关系和工艺参数,工艺参数主要包括生产控制设备监测的工艺状态参数,例如生产过程中的温度、湿度、压力、电流等;抽检过程中监测的产品中间状态参数,例如面板生产过程中玻璃的厚度和表面清洁度、电子元器件加工过程中引脚好坏等;生产过程中的用料、用时数据,例如不同用料的比例、某个环节加工时长等。
于本发明实施例中,为了确保大规模质量检测数据和加工履历数据的可行性和准确性,需要对收集到的产品的质量检测数据和加工履历数据进行数据清洗,具体的,数据清洗的流程如下:
(1.1)基于产品的质量检测数据将产品标注为不同的质量等级,以得到标注数据和对应的加工履历数据;
(1.2)分析加工履历数据中同一产品加工记录的重复次数,删除完全相同的加工记录数据;
(1.3)将所有产品的加工记录数据按照产品编号和时间排序,整合同一产品不同时间的加工记录数据;
(1.4)剔除缺少值较多的工艺参数、取值固定不变的工艺参数、缺失值严重的加工记录数据。
于本发明实施例中,在进行数据清洗时,还可以运用特定领域的附加条件(例如工艺流程编码等)协助筛查异常数据,以实现数据清洗,本发明实施例对此不做限制。
于本发明实施例中,为了确保大规模工艺参数分析的可行性和准确性,需要清洗后的工艺参数进行数据预处理,具体的,数据预处理的流程如下:
(1.5)为了避免出现严重的共线性问题,提高数据分析的准确性和效率,采用皮尔逊相关系数计算所有数值型的工艺参数之间的相关性,剔除相关性系数超过数值阈值的工艺参数;
(1.6)为了解决类型选择参数不能直接用于后续分析的问题,提高数据分析的可行性和准确性,对非数值型的工艺参数进行编码处理,以转化工艺参数的参数类型,即使用One-Hot编码方式将单个类型选择参数,转换为多个相互独立的类型选择变量。
于本发明实施例中,在进行数据预处理时,针对工业制造过程中工艺参数的数据特点,实际处理时可以根据数据质量和特点增加或减少其他预处理步骤;例如,针对并行加工过程的信息,可以将平行设备的编号等信息作为工艺参数进行处理,本发明实施例对此不做限制。
(2)基于完整的工艺流程数据构建可疑程度度量模型,其中,预处理后的工艺流程数据包括但不限于工艺环节、流转关系以及工艺参数。
于本发明实施例中,对完整的工艺流程数据进行建模,即是借助复杂网络,根据所有产品的加工流程路径将每个产品在生产过程中经历的加工步骤按顺序串联起来;在该复杂网络中,将产品的工艺环节作为复杂网络的节点,将产品的流转关系作为复杂网络的边,根据节点的关联关系构建最终的可疑程度度量模型。
具体的,不同节点的关联关系是基于节点之间的时序顺序确定,即产品在不同节点上的生产顺序来刻画的。需要说明的是,这里还可以采用其他因素,例如采样皮尔逊相关系数等来刻画节点之间的相关关系,从而确定节点之间的连接关系,以确保可疑程度度量模型的准确性和可靠性。
(3)基于可疑程度度量模型进行节点重要性分析,并且基于节点重要性分析结果确定可疑节点;即通过计算节点重要性指数,筛选出与缺陷高度相关的节点,将这些节点选为网络的核心节点(可疑节点),这些核心节点对于产品的质量缺陷有更大的影响作用,因此在进行产品质量缺陷的根因分析时,应给予更大的重要性程度和更多的关注。
于本发明实施例中,节点重要性分析的流程如下:
(3.1)计算所有节点的重要性指数;其中,所述重要性指数的计算公式如下:
其中,Si表示节点i的重要性指数,Kout表示节点出入度,PVi表示该节点不同分支上产品数量分布的熵值,N表示产品总数,N′表示进入该节点的产品数量。即通过计算每个节点的节点入度、节点出入度和熵值来评估该节点(即该生产加工的工艺环节)在生产工艺流程中的重要性。
具体的,进入该节点的产品数量N′可以反映节点的位置信息,即节点在网络模型中的层次结构位置,进入该节点的产品数量越多,表示该节点在网络模型中的位置越重要,即说明该工艺环节是重要的加工环节,大量产品都必须经过该工艺环节。
具体的,节点出入度Kout可以反映节点的连接情况,即节点i与其它节点之间的连接数量,节点出入度越大,表示该节点在网络模型中的连接越多,即说明该工艺环节也就越重要。
具体的,节点的PVi值可以反映节点在不同分支上产品数量分布的熵值,根据熵值定义和计算方式,可知熵值越大,说明在该节点上流向不同后续加工分支的产品数量越均匀,也即在该节点大量的产品流向了更多分支,产品在该工艺环节的后续加工流向差异很大,也就说明该工艺环节的生产工艺控制不好,该工艺环节就更有可能是导致产品缺陷的重要环节。
具体的,所述熵值的计算公式如下:
其中,j表示节点i的分支,w表示节点i所有分支上的产品总数,wj表示从节点i出发流向分支j的产品数量。
(3.2)根据所有节点的重要性指数选取若干节点作为可疑节点,一般来说,由于重要性指数Si结合了节点出入度和不同工艺路径上产品的数量分布等多个因素的综合计算值,它反映了该节点在整个全流程工艺加工网络中的重要性,所以重要性指数Si较大的节点往往与生产过程中的关键环节或异常情况相关。因此,根据重要性指数Si的大小就可以确定各个节点在生产工艺流程中的重要性,进而确定出导致产品缺陷的可疑加工环节。
于本发明实施例中,选取重要性指数Si排列前k的节点作为可疑节点,并在后续步骤中对其进行进一步的分析和诊断,以便及时发现和解决潜在的产品缺陷根因问题;其中,k值可以根据业务需求自行设定,本发明对此不做限制。
具体的,构建全工艺流程复杂网络的工作,可以基于数据可视化的方式实现,即借助相关工具(包括但不限于Tableau、PowerBI等)自动化实现,通过借助复杂网络将全工艺加工流程呈现出来,配合本发明实施例构建的可疑程度度量模型,可以进一步帮助用户理解和分析生产工艺流程中的关键节点和异常情况。
(4)度量可疑节点的工艺参数在正常品和异常品的取值差异,并且基于取值差异再次确定可疑节点;
具体的,基于取值差异再次确定可疑节点的流程如下:
(4.1)分别获取可疑节点的工艺参数在正常品和异常品的取值,并且根据取值构建两个概率分布函数;
(4.2)计算两个概率分布函数的散度,如果散度超过散度阈值,则继续追溯可疑节点的前序节点,反之,则再次判定为可疑节点;
于本发明的实施中,采用KS散度作为量化可疑节点的工艺参数在正常品和异常品之间取值差异的统计指标。
于本发明的实施中,针对每个可疑节点,通过在正常品和异常品之间比较其工艺参数的取值,构建两个概率分布函数,分别反映正常品和异常品在每个可疑节点的工艺参数取值情况。
具体的,KS散度计算公式如下:
D=max|F1x-F2x|
其中,D表示KS散度,F1(x)和F2(x)分别表示某个工艺参数在正常品和异常品上的累积分布函数,x表示工艺参数取值;通过比较两组数据的累积分布函数,KS散度可以捕捉到它们之间的最大偏差,并提供一种有效的方式来评估可疑节点上正常品和异常品在工艺参数上的差异大小。
特别地,KS散度计算方式,不仅适用于单一工艺环节的差异分析,还可以扩展到多个工艺环节的联合差异分析,通过将多个工艺环节的工艺参数取值构建成联合概率分布函数,从而可以度量多个工艺环节的工艺参数在正常品和异常品之间的取值差异,以评估多个工艺环节的工艺参数在产品质量缺陷中的综合影响。
进一步地,如果结合业务特点假设某个工艺环节的工艺参数在所有产品上的取值应该是正态分布(即该工艺参数的“理论分布”),还可以利用KS散度计算该工艺参数在所有产品上取值的分布与该“理论分布”间的差异。本发明实施例不做限制,该部分不是本发明的重点,不再赘述。
需要强调,本发明使用KS散度来度量可疑节点的工艺参数在正常品和异常品间取值分布的差异,还可以选取其他数学指标来度量正常品和异常品工艺参数取值分布的差异,包括但不限于:KL散度,JS散度,本发明实施例对此不做限制,优选地,本发明选择使用KS散度。
若KS散度大于某个预设的散度阈值d,则认为该可疑节点中工艺参数在正常品和异常品上差异较大。请参阅图2,图2为通过KS散度确定可疑节点的流程图,确定可疑节点的流程如下:
①如果可疑节点M1上正常品和异常品的工艺参数取值分布的差异超过散度阈值d,则表明该可疑节点可能对产品质量缺陷产生重要影响,需要进行进一步分析和处理。
②如果该可疑节点M1的工艺参数在正常品和异常品之间的取值分布差异小于散度阈值d,则将追溯该可疑节点的前序节点Mn,以确定是否存在其他前序工艺流程环节对产品质量缺陷产生影响的可能性。这样可以从整个工艺流程的角度来分析问题,找出潜在的问题源头,并采取相应的措施进行纠正;于本发明实施过程中,一直追溯至其前序节点存在KS散度超过预设的散度阈值为止。
进一步地,再对导致问题的工艺环节中每个参数的KS散度进行排序,从而根据KS散度的排序确定出这些工艺环节中具有显著分布差异的可疑节点集合,这些可疑节点以及对应的工艺参数可能对产品质量缺陷产生较大影响。
(5)输出导致产品质量缺陷的可疑节点集合以及相关的工艺参数。即根据以上步骤(3)和(4)可以确定哪些可疑节点对产品质量缺陷产生了较大的影响,并找到可能导致问题的工艺流程环节。
即在输出可疑节点集合时,同时给出这些可疑节点之间的连接关系、路径信息、工艺参数,以便更好地理解工艺流程中各节点之间的相互作用和影响。
为了更清楚地展现本发明的目的、技术方案和优点,下面以玻璃面板生产制造中的缺陷产品的不良根因定位问题为例,结合附图和具体实施例对本发明进行详细阐述。
应当理解,此处所描述的具体实施例仅用于解释本发明,并不用于限定本发明。
玻璃面板生产制造过程中,制程设备加工参数值的波动会导致不良玻璃的产出。玻璃面板的加工参数存在两个突出特点:(1)流程自动化程度高,工艺流程会按照工程师提前设定,加工过程自动化流程度高;(2)数据量大,因每个制程设备都会产生大量的加工参数,故一整套工艺流程会产生海量数据。
传统的统计分析和人工经验判断方法显然无法满足该场景下不良根因的有效定位。为了解决这些问题,本发明基于上述缺陷根因定位方法进行缺陷根因定位。
下面针对某型号玻璃面板生产中出现某种不良的产品数据进行分析,详细流程如下:
S1.对产品的质量检测数据和加工履历数据进行清洗、预处理,以形成完整的工艺流程数据。
具体的,数据清洗流程如下:
S11.标注数据:根据质量检测数据,将产品划分为“良品”和“不良品”两类,得到标注数据;
S12.数据初步清洗:将同一产品加工记录中的重复数据剔除,保留不重复的加工记录;
S13.构建参数大宽表:将产品加工记录按产品编号和时间排序,将同一产品不同阶段、不同节点的加工记录中的参数进行整合,形成以产品编号为索引的产品参数的大宽表;此步骤能够区分相同参数名的工艺参数,如通过添加节点编号或工艺流程阶段名进行区分;
S14.数据深度清洗:
①剔除缺失严重的工艺参数:统计每项工艺参数的产品覆盖率,剔除覆盖率低于预设值的工艺参数。
②剔除取值固定的工艺参数:剔除所有产品取值相同的工艺参数,以减少冗余信息。
③剔除缺失严重的产品加工记录:统计每条产品加工记录中工艺参数的覆盖率,剔除覆盖率低于预设值的产品加工记录。
具体的,数据预处理流程如下:
S15.删除高度互相关的工艺参数:针对全部的数值型工艺参数,计算每个数值型工艺参数与其他所有数值型工艺参数之间的皮尔逊相关系数。如果任意两个数值型工艺参数的相关系数超过预设值,其中一个参数将被选择性地删除,这样可以降低参数间的共线性,提高后续模型分析计算的速度。
S16.特征编码:对于存在多个平行节点、设备、腔室等情况,采用多个独立的类型选择变量替代单个类型选择参数,即使用One-Hot编码生成类型变量。
S2.基于完整的工艺流程数据构建可疑程度度量模型,并且基于重要性分析选取重要性排列前十的节点作为可疑节点;
S21.基于工艺生产节点顺序构建复杂网络;
对于步骤S1处理得到的标注数据和工艺流程数据,将其中的每一片玻璃面板的加工过程,都基于生产时间排序,将每个生产加工过程中的节点(含加工节点和检测节点)表示为网络中的一个节点,并且根据工艺流程中节点(工艺环节)之间的流转关系构建网络的边,形成该片玻璃面板的生产全流程路径,由于不同玻璃面板在加工过程中,经历的加工工序会有所差异,因此有的加工路径会重合,有的不会重合,最终所有面板的加工工艺流程将会构成网络。
请参阅图3,图3为玻璃面板生产工艺流程网络图,展现了某种类型的玻璃面板的整个工艺流程;图中A类节点表示制程节点,B类节点表示检测节点,C类节点表示由于数据记录不全导致的站点类型信息缺失的节点,流程为制程主流程;结合图3可知从“开始节点”(所有产品都要经历的第一个工艺环节)到“结束节点”(除了报废产品外几乎所有产品都会到达的最后一个工艺环节),不仅单片面板加工流程长,而且不同面板之间的加工路径存在差异(在网络中有多个分叉),通过该网络图充分、形象、直观展现玻璃面板这类产品在生产加工过程中的复杂性。
S22.根据每个节点出入度、熵值进行计算,可以得出每个节点的重要性指数。
例如,如表1所示,展现了针对玻璃面板的工艺流程计算的每个节点的重要性指数,(这里只展示前五的节点数据)。
根据计算得到的结果,初步怀疑115600节点为最可能导致生产出现缺陷的节点,11B600为可能导致生产出现缺陷的节点,其可疑度排第二,以此类推,得到前十的可疑节点。
表1
S3.度量可疑节点的工艺参数在正常品和异常品的取值差异,并且基于取值差异确定可疑节点;
S31.根据确定的可疑节点进行逐个分析:例如,针对该实施例中的数据,根据确定的可疑节点,首先选取可疑程度排名第一的115600节点进行分析,请参阅图4,图4为该节点在整个工艺流程复杂网络图中的局部加工过程图,可以看出,对于115600节点存在以下问题:该节点后续步骤中有大量的检测节点,说明该节点很重要;而且该节点处分支非常繁杂,需要重点关注。
S32.通过计算115600节点上的加工参数在良品和不良品上的KS散度,度量在115600节点上的加工参数在良品和不良品上的取值差异。
请参阅图5,图5为115600参数取值分布图,代表在115600节点上A号参数在良品和不良品的取值分布。可以明显看出在115600节点的A号参数上,良品和不良品的取值分布差异不大。
进一步地,计算得到其KS散度值为0.1,小于预设阈值(在该实施例中预设阈值设为0.2),依次遍历该节点所有参数的KS散度,发现均小于预设阈值,则追溯其上一节点115400节点。
S33.计算115400节点上各个参数的KS散度,请参阅图6,图6为115400参数取值分布图,代表115400节点上B号参数在良品和不良品的取值分布,经过计算,其KS散度为0.19,小于预设阈值(在该实施例中预设阈值设为0.2),依次遍历该节点所有参数的KS散度,发现均小于预设阈值,则追溯其上一节点115402节点。
S34.计算115402节点上各个参数的KS散度,请参阅图7,图7为115402参数取值分布图,代表115402节点上C1参数在良品和不良品的取值分布。
经过计算,其KS散度大于阈值(在该实施例中预设阈值设为0.2),说明115402节点参数取值分布差异非常大,异常可能性最大。
那么,115600重要性较大的原因可能是因为115402节点的异常造成了其参数异常。至此,从初始的115600可疑节点,定位得到了其前序步骤中的可疑节点115402节点。所以,在表1中用115402替换115600节点。
S4.输出导致产品质量缺陷的可疑节点集合以及相关的工艺参数。
根据以上节点的的分析结果,直接输出导致产品质量缺陷最重要的工艺流程的节点集合,并根据节点上不同加工参数其KS散度的排序,确定出节点上相关的关键影响参数,在输出节点集合时,同时给出这些关键节点之间的连接关系和路径信息、关键影响参数集合,以便更好地理解工艺流程中各节点之间的相互作用和影响。
例如,如表2最终结果表所示,展示了对该批面板工艺缺陷进行根因分析的最终结果,表中展现了导致产品缺陷的可疑站点以及该站点上可疑的加工参数,并展现了该可疑站点的局部加工路径,以便进一步辅助相关工作人员结合具体业务进一步分析。
表2
综上,本发明通过通过复杂网络来刻画工艺流程中不同节点之间的关系,充分考虑节点之间的是时序顺序和关联性,并且结合重要性分析的方式,从节点出入度、熵值来评估节点重要性,因此能够更加准确的识别和定位缺陷根因,解决了现有技术在缺陷根因定位时由于工艺参数众多、部分参数间高度相关、产品工艺流程复杂,难以准确定位工业产品缺陷根因的问题。
实施例2
本发明提供一种缺陷根因定位系统,请参阅图8,图8为所述系统的结构框图,所述系统与实施例1的所述方法一一对应,所述系统包括:
数据处理单元,所述数据处理单元用于对产品的质量检测数据和加工履历数据进行清洗、预处理,以形成工艺流程数据;
模型构建单元,所述模型构建单元基于工艺流程数据构建可疑程度度量模型;
重要性分析单元,所述重要性分析单元基于可疑程度度量模型进行节点重要性分析,并且基于节点重要性分析结果初步确定可疑节点;
可疑节点定位单元,所述可疑节点定位单元用于度量可疑节点的工艺参数在正常品和异常品的取值差异,并且基于取值差异再次确定可疑节点;
数据输出单元,所述数据输出单元用于输出导致产品质量缺陷的可疑节点集合以及相关的工艺参数。
实施例3
本发明提供了一种计算机设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行计算机程序时实现实施例1所述一种缺陷根因定位方法。
本实施例提供的计算机设备可以实现执行实施例1所述的方法,为避免重复,在此不再赘述。
实施例4
本发明提供了一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,述计算机程序被处理器执行时实现实施例1所述一种缺陷根因定位方法。
本实施例提供的计算机可读存储介质可以实现执行实施例1所述的方法,为避免重复,在此不再赘述。
所述处理器可以是中央处理器(CPU,Central Processing Unit),还可以是其他通用处理器、数字信号处理器(digital signal processor)、专用集成电路(ApplicationSpecific Integrated Circuit)、现成可编程门阵列(Field programmablegatearray)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
所述存储器可用于存储所述计算机程序和/或模块,所述处理器通过运行或执行存储在所述存储器内的数据,实现发明中缺陷根因定位系统的各种功能。所述存储器可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序(比如声音播放功能、图像播放功能等)等。此外,存储器可以包括高速随机存取存储器、还可以包括非易失性存储器,例如硬盘、内存、插接式硬盘,智能存储卡,安全数字卡,闪存卡、至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。
缺陷根因定位系统如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解本发明实现上述实施例方法中的全部或部分流程,也可以通过计算机程序可存储于一计算机可读存介质中,该计算机程序在被处理器执行时,可实现上述各个方法实施例的步骤。其中,所述计算机程序包括计算机程序代码、对象代码形式、可执行文件或某些中间形式等。所述计算机可读取介质可以包括:能够携带所述计算机程序代码的任何实体或装置、记录介质、U盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器、随机存储器、点载波信号、电信信号以及软件分发介质等。需要说明的是,所述计算机可读介质包含的内容可以根据司法管辖区内立法和专利实践的要求进行适当的增减。
本发明已对基本概念做了描述,显然,对于本邻域技术人员来说,上述详细披露仅仅作为示例,而并不构成对本说明书的限定。虽然此处并没有明确说明,本邻域技术人员可能会对本说明书进行各种修改、改进和修正。该类修改、改进和修正在本说明书中被建议,所以该类修改、改进、修正仍属于本说明书示范实施例的精神和范围。
Claims (12)
1.一种缺陷根因定位方法,其特征在于,所述方法包括以下流程:
对产品的质量检测数据和加工履历数据进行清洗、预处理,以形成工艺流程数据;
基于工艺流程数据构建可疑程度度量模型;
基于可疑程度度量模型进行节点重要性分析,并且基于节点重要性分析结果初次确定可疑节点;
度量可疑节点的工艺参数在正常品和异常品的取值差异,并且基于取值差异再次确定可疑节点;
输出导致产品质量缺陷的可疑节点集合以及相关的工艺参数。
2.根据权利要求1所述的一种缺陷根因定位方法,其特征在于,对产品的质量检测数据和加工履历数据进行预处理的流程如下:
对数值型的工艺参数进行相关性分析处理,以剔除相关性系数超过数值阈值的工艺参数;
对非数值型的工艺参数进行编码处理,以转化工艺参数的参数类型。
3.根据权利要求1所述的一种缺陷根因定位方法,其特征在于,所述工艺流程数据包括产品的工艺环节、流转关系以及工艺参数。
4.根据权利要求1所述的一种缺陷根因定位方法,其特征在于,基于工艺流程数据构建可疑程度度量模型的流程如下:
将产品的工艺环节作为复杂网络的节点,将产品的流转关系作为复杂网络的边;
根据节点的关联关系构建可疑程度度量模型,其中,节点的关联关系基于节点的时序顺序或相关系数确定。
5.根据权利要求1所述的一种缺陷根因定位方法,其特征在于,基于可疑程度度量模型进行节点重要性分析,并且基于节点重要性分析结果初次确定可疑节点的流程如下:
计算可疑程度度量模型所有节点的重要性指数;
根据所有节点的重要性指数选取若干节点作为可疑节点。
6.根据权利要求5所述的一种缺陷根因定位方法,其特征在于,所述重要性指数的计算公式如下:
其中,Si表示节点i的重要性指数,Kout表示节点出入度,PVi表示该节点不同分支上产品数量分布的熵值,N表示产品总数,N'表示进入该节点的产品数量。
7.根据权利要求6所述的一种缺陷根因定位方法,其特征在于,所述熵值的计算公式如下:
其中,PVi表示节点i不同分支上产品数量分布的熵值,j表示节点i的分支,w表示节点i所有分支上的产品总数,wj表示从节点i出发流向分支j的产品数量。
8.根据权利要求1所述的一种缺陷根因定位方法,其特征在于,度量可疑节点的工艺参数在正常品和异常品的取值差异,并且基于取值差异再次确定可疑节点的流程如下:
分别获取可疑节点的工艺参数在正常品和异常品的取值,并且根据取值构建两个概率分布函数;
计算两个概率分布函数的散度,如果散度超过散度阈值,则继续追溯可疑节点的前序节点,反之,则再次判定为可疑节点。
9.根据权利要求8所述的一种缺陷根因定位方法,其特征在于,所述散度为KL散度或JS散度。
10.一种缺陷根因定位系统,其特征在于,所述系统包括:
数据处理单元,所述数据处理单元用于对产品的质量检测数据和加工履历数据进行清洗、预处理,以形成工艺流程数据;
模型构建单元,所述模型构建单元基于工艺流程数据构建可疑程度度量模型;
重要性分析单元,所述重要性分析单元基于可疑程度度量模型进行节点重要性分析,并且基于节点重要性分析结果初次确定可疑节点;
可疑节点定位单元,所述可疑节点定位单元用于度量可疑节点的工艺参数在正常品和异常品的取值差异,并且基于取值差异再次确定可疑节点;
数据输出单元,所述数据输出单元用于输出导致产品质量缺陷的可疑节点集合以及相关的工艺参数。
11.一种计算机设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,其特征在于:所述处理器执行计算机程序时实现权利要求1-9中任一项所述一种缺陷根因定位方法。
12.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现权利要求1-9中任一项所述一种缺陷根因定位方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311031622.6A CN117076856A (zh) | 2023-08-16 | 2023-08-16 | 一种缺陷根因定位方法、系统、设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311031622.6A CN117076856A (zh) | 2023-08-16 | 2023-08-16 | 一种缺陷根因定位方法、系统、设备及存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN117076856A true CN117076856A (zh) | 2023-11-17 |
Family
ID=88703593
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311031622.6A Pending CN117076856A (zh) | 2023-08-16 | 2023-08-16 | 一种缺陷根因定位方法、系统、设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117076856A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN118133048A (zh) * | 2024-05-07 | 2024-06-04 | 临沂大学 | 一种高校学生体质测试数据采集方法及系统 |
-
2023
- 2023-08-16 CN CN202311031622.6A patent/CN117076856A/zh active Pending
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN118133048A (zh) * | 2024-05-07 | 2024-06-04 | 临沂大学 | 一种高校学生体质测试数据采集方法及系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Chien et al. | Analysing semiconductor manufacturing big data for root cause detection of excursion for yield enhancement | |
JP6613329B2 (ja) | コンピュータ実装方法、コンピュータシステム及びコンピュータ装置 | |
JP4239932B2 (ja) | 生産管理システム | |
CN111459700B (zh) | 设备故障的诊断方法、诊断装置、诊断设备及存储介质 | |
US9514033B2 (en) | Systems and methods for processing software application metadata associated with a software application | |
CN109784758B (zh) | 基于bim模型的工程质量监管预警系统和方法 | |
CN107168995B (zh) | 一种数据处理方法及服务器 | |
CN117076856A (zh) | 一种缺陷根因定位方法、系统、设备及存储介质 | |
CN110503288A (zh) | 考虑机台交互作用的辨识良率损失原因的系统与方法 | |
CN116450399A (zh) | 微服务系统故障诊断及根因定位方法 | |
CN111859047A (zh) | 一种故障解决方法及装置 | |
CN116167749B (zh) | 一种基于深度学习的永磁同步电机故障诊断方法 | |
Maeyens et al. | Process mining on machine event logs for profiling abnormal behaviour and root cause analysis | |
CN107122907B (zh) | 一种机电产品符号化质量特性的分析与故障原因追溯方法 | |
CN116860562A (zh) | 一种用于数据中台数据质量的监控方法及系统 | |
JP2015072644A (ja) | 対話型設備不良予測方法 | |
Wang et al. | Multi-perspective visualization to assist code change review | |
US9665795B2 (en) | Method and apparatus for identifying root cause of defect using composite defect map | |
CN112506903A (zh) | 采用标本线的数据质量表示方法 | |
CN114416988B (zh) | 基于自然语言处理的缺陷自动评级及处置建议推送方法 | |
Seifi et al. | Designing different sampling plans based on process capability index | |
CN113762665B (zh) | 一种实时指标的相关实时数据回溯方法及系统 | |
JP7289749B2 (ja) | データシステム | |
CN117636065A (zh) | 考虑裂缝影响的混凝土坝位移深度学习预测方法及系统 | |
CN114781670A (zh) | 实验设备维修管理方法、装置、设备及介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |