CN111401420A - 晶圆测试的异常数据聚类方法、装置、电子设备与介质 - Google Patents

晶圆测试的异常数据聚类方法、装置、电子设备与介质 Download PDF

Info

Publication number
CN111401420A
CN111401420A CN202010151036.5A CN202010151036A CN111401420A CN 111401420 A CN111401420 A CN 111401420A CN 202010151036 A CN202010151036 A CN 202010151036A CN 111401420 A CN111401420 A CN 111401420A
Authority
CN
China
Prior art keywords
parameter
abnormal data
clustering
sample
samples
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202010151036.5A
Other languages
English (en)
Other versions
CN111401420B (zh
Inventor
毛宏坤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Pudifei Semiconductor Technology Shanghai Co ltd
Original Assignee
Pudifei Semiconductor Technology Shanghai Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Pudifei Semiconductor Technology Shanghai Co ltd filed Critical Pudifei Semiconductor Technology Shanghai Co ltd
Priority to CN202010151036.5A priority Critical patent/CN111401420B/zh
Publication of CN111401420A publication Critical patent/CN111401420A/zh
Application granted granted Critical
Publication of CN111401420B publication Critical patent/CN111401420B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • G06F18/232Non-hierarchical techniques
    • G06F18/2321Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02PCLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
    • Y02P90/00Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
    • Y02P90/30Computing systems specially adapted for manufacturing

Landscapes

  • Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Probability & Statistics with Applications (AREA)
  • Testing Or Measuring Of Semiconductors Or The Like (AREA)

Abstract

本发明提供了一种晶圆测试的异常数据聚类方法、装置、电子设备与介质,其中的异常数据聚类方法,包括:获取待聚类异常数据;所述待聚类异常数据包括多个样本,每个样本包括多个参数,每个参数包括多个电流数据,其中,不同样本对应于不同的待测实体,同一样本中的不同参数对应于所实施的不同种类的测试,同一参数中的不同电流数据对应于实施测试时所施加的不同电压;针对于每个参数,对所述多个样本中该参数的电流数据进行一次聚类,得到每个样本中每个参数的参数标签;根据各样本中的参数标签,对所述多个样本进行二次聚类,得到每个样本的样本标签。

Description

晶圆测试的异常数据聚类方法、装置、电子设备与介质
技术领域
本发明涉及集成电路领域,尤其涉及一种晶圆测试的异常数据聚类方法、装置、电子设备与介质。
背景技术
在晶圆测试时,可对晶圆或其裸芯片施加电压,测到对应的电流值,进而,可得到呈对的电流值与电压值,所得到的测试数据中,部分为异常数据,进而,可对异常数据进行分类,确定异常的种类。
现有的相关技术中,为了对异常数据进行分类,传统的方法是基于电压值与电流值绘制相应的曲线,再基于曲线进行人为标定,实现异常数据的分类。可见,该方案中人工标定的工作量大,处理过程效率较低。
发明内容
本发明提供一种晶圆测试的异常数据聚类方法、装置、电子设备与介质,以解决工作量大,处理过程效率较低的问题。
根据本发明的第一方面,提供了一种晶圆测试的异常数据聚类方法,包括:
获取待聚类异常数据;所述待聚类异常数据包括多个样本,每个样本包括多个参数,每个参数包括多个电流数据,其中,不同样本对应于不同的待测实体,同一样本中的不同参数对应于所实施的不同种类的测试,同一参数中的不同电流数据对应于实施测试时所施加的不同电压;
针对于每个参数,对所述多个样本中该参数的电流数据进行一次聚类,得到每个样本中每个参数的参数标签;
根据各样本中的参数标签,对所述多个样本进行二次聚类,得到每个样本的样本标签。
可选的,针对于每个参数,对所述多个样本中该类参数的电流数据进行一次聚类,得到每个样本中每个参数的参数标签,包括:
针对于每个参数,根据不同样本间该参数中电流数据的欧式距离进行所述一次聚类,得到所述参数标签。
可选的,所述参数标签是利用字符表征的,每个样本中参数标签的字符能够形成字符串;
根据各样本中的参数标签,对所述多个样本进行二次聚类,得到每个样本的样本标签,包括:
根据不同样本的字符串之间的汉明距离,对所述多个样本进行聚类,得到所述样本标签。
可选的,所述一次聚类与所述二次聚类均采用DBSCAN。
可选的,获取待聚类异常数据,包括:
获取晶圆测试得到的原始异常数据;
根据所述原始异常数据,确定所述待聚类异常数据,所述待聚类异常数据的数据量小于所述原始异常数据。
可选的,根据所述原始异常数据,确定所述待聚类异常数据,包括:
对所述原始异常数据进行取对数,得到取对数的异常数据;
对所述取对数的异常数据进行降维处理,得到所述待聚类异常数据。
可选的,若所述参数中的电流数据随电压值的递增而递增,则:对应的降维处理为PAA降维处理。
根据本发明的第二方面,提供了一种晶圆测试的异常数据聚类装置,包括:
获取模块,用于获取待聚类异常数据;所述待聚类异常数据包括多个样本,每个样本包括多个参数,每个参数包括多个电流数据,其中,不同样本对应于不同的待测实体,同一样本中的不同参数对应于所实施的不同种类的测试,同一参数中的不同电流数据对应于实施测试时所施加的不同电压;
一次聚类模块,用于针对于每个参数,对所述多个样本中该参数的电流数据进行一次聚类,得到每个样本中每个参数的参数标签;
二次聚类模块,用于根据各样本中的参数标签,对所述多个样本进行二次聚类,得到每个样本的样本标签。
根据本发明的第三方面,提供了一种电子设备,包括处理器与存储器,所述存储器,用于存储代码和相关数据;
所述处理器,用于执行所述存储器中的代码用以实现第一方面及其可选方案涉及的晶圆测试的异常数据聚类方法。
根据本发明的第四方面,提供了一种存储介质,其上存储有计算机程序,该程序被处理器执行时实现第一方面及其可选方案涉及的晶圆测试的异常数据聚类方法。
本发明提供的晶圆测试的异常数据聚类方法、装置、电子设备与介质中,能够针对于所收集到的异常数据自动实现聚类,从而自动将相同或相似的样本归在同一类,该过程可自动实现,无需人工标注的介入,有效减少了人工的工作量,提高了处理效率。
同时,本发明通过两次聚类,一方面便于以较少的处理量实现聚类,另一方面,一次聚类的参数标签可反应出不同样本中同一参数的数据的相似性与差异性,二次聚类的样本标签可进一步反应出不同样本中参数类别的相似性与差异性,进而,两次聚类后的聚类结果可以准确地反应出不同样本的相似性与差异性。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1是本发明一实施例中晶圆测试的异常数据聚类方法的流程示意图一;
图2是本发明一实施例中步骤S11的流程示意图;
图3是本发明一实施例中部分原始异常数据的示意图;
图4是本发明一实施例中步骤S112的流程示意图;
图5是本发明一实施例中降维处理的曲线示意图;
图6是本发明一实施例中晶圆测试的异常数据聚类方法的流程示意图二;
图7是本发明一实施例中一次聚类的结果示意图一;
图8是本发明一实施例中一次聚类的结果示意图二;
图9是本发明一实施例中晶圆测试的异常数据聚类装置的程序模块示意图;
图10是本发明一实施例中电子设备的构造示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”、“第三”“第四”等(如果存在)是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本发明的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
下面以具体地实施例对本发明的技术方案进行详细说明。下面这几个具体的实施例可以相互结合,对于相同或相似的概念或过程可能在某些实施例不再赘述。
图1是本发明一实施例中晶圆测试的异常数据聚类方法的流程示意图一。
请参考图1,晶圆测试的异常数据聚类方法,包括:
S11:获取待聚类异常数据;
S12:针对于每个参数,对所述多个样本中该参数的电流数据进行一次聚类,得到每个样本中每个参数的参数标签;
S13:根据各样本中的参数标签,对所述多个样本进行二次聚类,得到每个样本的样本标签。
其中的待聚类异常数据包括多个样本(例如100个样本、1000个样本),每个样本包括多个参数(例如5个参数、8个参数),每个参数包括多个电流数据(例如37个电流数据),该电流数据可以是测得的原始的电流值本身,也可以是电流值经一定处理后而产生的数据,例如可以是经后文所涉及的步骤S112处理后得到的。
其中:
不同样本对应于不同的待测实体,其中的待测实体,可例如是晶圆和/或其裸芯片,进而,不同的待测实体可以指不同的晶圆,也可以指不同的裸芯片;
同一样本中的不同参数对应于所实施的不同种类的测试,其中的不同种类,可以指两个测试在测试手段、测试位置、测试目标等至少之一发生了不同;
同一参数中的不同电流数据对应于实施测试时所施加的不同电压。
进而,针对于每一个样本,其可例如形成一行数据,该行数据的每一列对应于不同的电压值,其中的部分列可以是对应于一种参数的,部分列可以是对应于另一种参数的,例如:若参数的数量为5,每个参数的电流数据的数量为37个,则该行数据(即该样本)中具有185列,分别记录5个参数总共185个电流数据,针对于每一个参数,各列的电压值可以是随列号的递增依次递增的。可见,假定一个样本(即一行数据)有x个电流数据(即x列电流数据),样本数量为y,则待聚类异常数据的数量为x×y个。
其中,呈对的电流数据与电压值可形成曲线形状。
以上方案中,通过两次聚类,可便于以较少的处理量实现聚类,例如,第一次聚类中,若每个参数具有37个电流数据,则针对于每个参数仅需实现37个维度数据的聚类,第二次聚类中,若参数数量为5个,则仅需实现5个维度数据的聚类,相较于直接实施单次185维数据的聚类,本实施例只需实现较少维度的数据的聚类。
以上方案中,一次聚类的参数标签可反应出不同样本中同一参数的数据的相似性与差异性,由于不同参数表征了不同种类的测试,所以,一次聚类的参数标签可反映出不同样本的同种类测试的数据的相似性与差异性。同时,二次聚类的样本标签可进一步反应出不同样本中参数类别的相似性与差异性,进而,两次聚类后的聚类结果可以准确地反应出不同样本的相似性与差异性。
图2是本发明一实施例中步骤S11的流程示意图;图3是本发明一实施例中部分原始异常数据的示意图。
请参考图2,步骤S11可以包括:
S111:获取晶圆测试得到的原始异常数据;
S112:根据所述原始异常数据,确定所述待聚类异常数据。
其中的原始异常数据,可例如图3所示。
以上实施方式中,所述待聚类异常数据的数据量小于所述原始异常数据,进而,通过以上步骤的处理,可便于降低数据的处理量,进一步提高聚类的处理效率。
同时,在以上方案中,待聚类异常数据是以原始异常数据为依据形成的,其可反映出真实测得的原始异常数据的特征,进而,在后续步骤中的聚类结果能够准确反映出真实测得的原始异常数据的特征。
图4是本发明一实施例中步骤S112的流程示意图;图5是本发明一实施例中降维处理的曲线示意图。
其中一种实施方式中,步骤S112可以包括:
S1121:对所述原始异常数据进行取对数,得到取对数的异常数据;
S1122:对所述取对数的异常数据进行降维处理,得到所述待聚类异常数据。
通过步骤S1121中取对数的处理,可以使得数据处于一个合适的数值范围内,从而更便于进行后续聚类的处理,具体举例中,取对数时可以取10为底,例如采用log10()的函数实施取对数的处理。
其中一种实施方式中,若所述参数中的电流数据随电压值的递增而递增,则:对应的降维处理为PAA降维处理。
其中的PAA,具体为partition-based approximate aggregation,其可理解为分段聚合近似算法。
以图5为例,其中左上角的图中所示的Raw data可理解为原始异常数据或取对数的异常数据,在PAA算法中,若取分段数量n为7,则可得到右上角的曲线,若取分段数量n为8,则可得到左下角的曲线,若取分段数量n为9,则可得到右下角的曲线,该些曲线可表征出降维处理后的待聚类异常数据,其中,横坐标可以是电压值,纵坐标可以是取对数的异常数据。可见,根据需求,可任意变化所需的分段数量。
以上方案中,通过步骤S1122中的降维处理,可以有效降低所需处理的数据量,实现数据的降维,有效提高处理效率,还可便于提高聚类的准确性。
在其他可选方案中,若参数中的电流数据并非随电压值的递增而递增的,则,降维处理也可采用PCA算法、LDA算法、SVD算法中至少之一。
其中:
PCA,具体为Principal Component Analysis,其可理解为主成分分析算法;
LDA,具体为Linear Discriminant Analysis,其可理解为线性判别分析算法;
SVD,具体为Singular Value Decompositionm,其可理解为奇异值分解算法。
图6是本发明一实施例中晶圆测试的异常数据聚类方法的流程示意图二;图7是本发明一实施例中一次聚类的结果示意图一;图8是本发明一实施例中一次聚类的结果示意图二。
请参考图6,步骤S12可以包括:
S121:针对于每个参数,根据不同样本间该参数中电流数据的欧式距离进行所述一次聚类,得到所述参数标签。
其中的欧式距离,具体为也称欧几里得距离,可用于描述多维空间中两个点之间的距离,以电流数据所形成的曲线为例,针对于同一参数的不同样本中的电流数据,可计算不同曲线之间数据点的欧式距离,为两个曲线之间的相似性比对提供依据。基于该依据,可实现以上所涉及的一次聚类。
具体实施过程中,所述一次聚类可以是采用DBSCAN实现的,同时,本实施例也不排除采用其他算法实现聚类的手段。
其中的DBSCAN,具体为Density-Based Spatial Clustering of Applicationswith Noise,其为基于密度的一种聚类算法。
其他可选方案中,一次聚类也可采用k-means算法或层次聚类算法。
具体实施过程中,以图7为例,样本的数量可例如为100,其中的1即为参数标签的一种举例,进而,可产生100个1,具体为某参数的所有样本的参数标签。在其他举例中,在100个参数标签中,若聚类产生两个类别,则可对应可产生两个参数标签,例如1与2两个参数标签,部分样本的该参数的参数标签为1,部分样本的该参数的参数标签为2,若聚类产生三个或三个以上类别,对应可产生三个或三个以上参数标签,其可参照1与2的参数标签理解。
以图8为例,其中每个样本中参数的数量可例如为5个,进而,原本5*37=185维度的数据可在一次聚类后变为5维的数据。
以上举例中,参数标签利用数字来表征,可以利用连续的数字作为不同类别的参数标签,也可利用非连续的数字来作为不同类别的参数标签,其他举例中,还可利用字母、符号,又或者数字、字母、符号中至少之二的组合来表征,可见,所述参数标签可以是利用字符表征的。
此外,本实施例也不排除参数标签利用文字、或其他任意形式来表征的方式。
若所述参数标签可以是利用字符表征的,则每个样本中参数标签的字符能够形成字符串。故而,其中一种实施方式中,请参考图7,步骤S13可以包括:
S131:根据不同样本的字符串之间的汉明距离,对所述多个样本进行聚类,得到所述样本标签。
其中的汉明距离,也可表征为Hamming Distance,其可理解为:两个等长字符串之间的汉明距离与两个字符串对应位置的不同字符的个数相关联,例如:1011101与1001001之间的汉明距离可以被视作2。
比对于图8所示可知,在具体举例中,二次聚类之前,可具有5维的数据,在二次聚类之后,5维的数据可转变为1维的数据,该数据即为前文所涉及的样本标签。
具体举例中,在二次聚类后,可将各参数标签相似或相近的样本归为一个类别,进而打上相应的样本标签,例如:若一个样本具有5个参数,一次聚类后每个样本可具有5个参数标签,进一步以一个简单的举例为例:若一个样本的5个参数标签为12312,另一个样本的五个参数标签为12312,则两者的参数标签是相同的,可归为同一类,打上同一个样本标签,在引入汉明距离的情况下,可以此为依据,通过聚类算法将参数标签相同或相近的样本归为通一类,打上相同的样本标签,从而通过不同的样本标签区分不同的异常样本类别。
该样本标签可利用例如数字、字母的字符来表征,也可利用文字或其他任意形式来表征。
具体实施过程中,所述二次聚类可以是采用DBSCAN实现的,同时,本实施例也不排除采用其他算法实现聚类的手段,其他可选方案中,二次聚类也可采用k-means算法或层次聚类算法。
综上,本实施例提供的晶圆测试的异常数据聚类方法中,能够针对于所收集到的异常数据自动实现聚类,从而自动将相同或相似的样本归在同一类,该过程可自动实现,无需人工标注的介入,有效减少了人工的工作量,提高了处理效率。
同时,本实施例通过两次聚类,一方面便于以较少的处理量实现聚类,另一方面,一次聚类的参数标签可反应出不同样本中同一参数的数据的相似性与差异性,二次聚类的样本标签可进一步反应出不同样本中参数类别的相似性与差异性,进而,两次聚类后的聚类结果可以准确地反应出不同样本的相似性与差异性。
图9是本发明一实施例中晶圆测试的异常数据聚类装置的程序模块示意图。
请参考图9,晶圆测试的异常数据聚类装置200,包括:
获取模块201,用于获取待聚类异常数据;所述待聚类异常数据包括多个样本,每个样本包括多个参数,每个参数包括多个电流数据,其中,不同样本对应于不同的待测实体,同一样本中的不同参数对应于所实施的不同种类的测试,同一参数中的不同电流数据对应于实施测试时所施加的不同电压;
一次聚类模块202,用于针对于每个参数,对所述多个样本中该参数的电流数据进行一次聚类,得到每个样本中每个参数的参数标签;
二次聚类模块203,用于根据各样本中的参数标签,对所述多个样本进行二次聚类,得到每个样本的样本标签。
可选的,所述一次聚类模块202,具体用于:
针对于每个参数,根据不同样本间该参数中电流数据的欧式距离进行所述一次聚类,得到所述参数标签。
可选的,所述参数标签是利用字符表征的,每个样本中参数标签的字符能够形成字符串;
所述二次聚类模块203,具体用于:
根据不同样本的字符串之间的汉明距离,对所述多个样本进行聚类,得到所述样本标签。
可选的,所述一次聚类与所述二次聚类均采用DBSCAN。
可选的,所述获取模块201,具体用于:
获取晶圆测试得到的原始异常数据;
根据所述原始异常数据,确定所述待聚类异常数据,所述待聚类异常数据的数据量小于所述原始异常数据。
可选的,所述获取模块201,具体用于:
对所述原始异常数据进行取对数,得到取对数的异常数据;
对所述取对数的异常数据进行降维处理,得到所述待聚类异常数据。
可选的,若所述参数中的电流数据随电压值的递增而递增,则:对应的降维处理为PAA降维处理。
综上,本实施例提供的晶圆测试的异常数据聚类装置中,能够针对于所收集到的异常数据自动实现聚类,从而自动将相同或相似的样本归在同一类,该过程可自动实现,无需人工标注的介入,有效减少了人工的工作量,提高了处理效率。
同时,本实施例通过两次聚类,一方面便于以较少的处理量实现聚类,另一方面,一次聚类的参数标签可反应出不同样本中同一参数的数据的相似性与差异性,二次聚类的样本标签可进一步反应出不同样本中参数类别的相似性与差异性,进而,两次聚类后的聚类结果可以准确地反应出不同样本的相似性与差异性。
图10是本发明一实施例中电子设备的构造示意图。
请参考图10,提供了一种电子设备30,包括:
处理器31;以及,
存储器32,用于存储所述处理器的可执行指令;
其中,所述处理器31配置为经由执行所述可执行指令来执行以上所涉及的方法。
处理器31能够通过总线33与存储器32通讯。
本实施例还提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现以上所涉及的方法。
本领域普通技术人员可以理解:实现上述各方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成。前述的程序可以存储于一计算机可读取存储介质中。该程序在执行时,执行包括上述各方法实施例的步骤;而前述的存储介质包括:ROM、RAM、磁碟或者光盘等各种可以存储程序代码的介质。
最后应说明的是:以上各实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述各实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的范围。

Claims (10)

1.一种晶圆测试的异常数据聚类方法,其特征在于,包括:
获取待聚类异常数据;所述待聚类异常数据包括多个样本,每个样本包括多个参数,每个参数包括多个电流数据,其中,不同样本对应于不同的待测实体,同一样本中的不同参数对应于所实施的不同种类的测试,同一参数中的不同电流数据对应于实施测试时所施加的不同电压;
针对于每个参数,对所述多个样本中该参数的电流数据进行一次聚类,得到每个样本中每个参数的参数标签;
根据各样本中的参数标签,对所述多个样本进行二次聚类,得到每个样本的样本标签。
2.根据权利要求1所述的晶圆测试的异常数据聚类方法,其特征在于,针对于每个参数,对所述多个样本中该参数的电流数据进行一次聚类,得到每个样本中每个参数的参数标签,包括:
针对于每个参数,根据不同样本间该参数中电流数据的欧式距离进行所述一次聚类,得到所述参数标签。
3.根据权利要求1所述的晶圆测试的异常数据聚类方法,其特征在于,所述参数标签是利用字符表征的,每个样本中参数标签的字符能够形成字符串;
根据各样本中的参数标签,对所述多个样本进行二次聚类,得到每个样本的样本标签,包括:
根据不同样本的字符串之间的汉明距离,对所述多个样本进行聚类,得到所述样本标签。
4.根据权利要求1至3任一项所述的晶圆测试的异常数据聚类方法,其特征在于,所述一次聚类与所述二次聚类均采用DBSCAN。
5.根据权利要求1至3任一项所述的晶圆测试的异常数据聚类方法,其特征在于,获取待聚类异常数据,包括:
获取晶圆测试得到的原始异常数据;
根据所述原始异常数据,确定所述待聚类异常数据,所述待聚类异常数据的数据量小于所述原始异常数据。
6.根据权利要求5所述的晶圆测试的异常数据聚类方法,其特征在于,根据所述原始异常数据,确定所述待聚类异常数据,包括:
对所述原始异常数据进行取对数,得到取对数的异常数据;
对所述取对数的异常数据进行降维处理,得到所述待聚类异常数据。
7.根据权利要求1至3任一项所述的晶圆测试的异常数据聚类方法,其特征在于,若所述参数中的电流数据随电压值的递增而递增,则:对应的降维处理为PAA降维处理。
8.一种晶圆测试的异常数据聚类装置,其特征在于,包括:
获取模块,用于获取待聚类异常数据;所述待聚类异常数据包括多个样本,每个样本包括多个参数,每个参数包括多个电流数据,其中,不同样本对应于不同的待测实体,同一样本中的不同参数对应于所实施的不同种类的测试,同一参数中的不同电流数据对应于实施测试时所施加的不同电压;
一次聚类模块,用于针对于每个参数,对所述多个样本中该参数的电流数据进行一次聚类,得到每个样本中每个参数的参数标签;
二次聚类模块,用于根据各样本中的参数标签,对所述多个样本进行二次聚类,得到每个样本的样本标签。
9.一种电子设备,其特征在于,包括处理器与存储器,
所述存储器,用于存储代码和相关数据;
所述处理器,用于执行所述存储器中的代码用以实现权利要求1至7任一项所述的晶圆测试的异常数据聚类方法。
10.一种存储介质,其上存储有计算机程序,该程序被处理器执行时实现权利要求1至7任一项所述的晶圆测试的异常数据聚类方法。
CN202010151036.5A 2020-03-06 2020-03-06 晶圆测试的异常数据聚类方法、装置、电子设备与介质 Active CN111401420B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010151036.5A CN111401420B (zh) 2020-03-06 2020-03-06 晶圆测试的异常数据聚类方法、装置、电子设备与介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010151036.5A CN111401420B (zh) 2020-03-06 2020-03-06 晶圆测试的异常数据聚类方法、装置、电子设备与介质

Publications (2)

Publication Number Publication Date
CN111401420A true CN111401420A (zh) 2020-07-10
CN111401420B CN111401420B (zh) 2023-04-18

Family

ID=71428592

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010151036.5A Active CN111401420B (zh) 2020-03-06 2020-03-06 晶圆测试的异常数据聚类方法、装置、电子设备与介质

Country Status (1)

Country Link
CN (1) CN111401420B (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112964988A (zh) * 2021-03-24 2021-06-15 河南中烟工业有限责任公司 电机工况的切分方法及系统
CN113516162A (zh) * 2021-04-26 2021-10-19 湖南大学 一种基于OCSVM和K-means算法的工控系统流量异常检测方法与系统
CN116384393A (zh) * 2023-04-27 2023-07-04 圣麦克思智能科技(江苏)有限公司 一种基于自然语言处理的运维数据处理系统及方法

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106575649A (zh) * 2014-06-12 2017-04-19 普迪飞半导体技术有限公司 以其他方式用于填充单元、抽头单元、解耦电容器单元、刻线和/或虚设填充的区域中的ic测试结构和/或e‑波束目标焊盘的伺机放置,以及包含相同结构的产品ic芯片
CN107158707A (zh) * 2017-04-27 2017-09-15 浙江大学 一种针对MMORPGs游戏的异常检测方法及装置
CN107451597A (zh) * 2016-06-01 2017-12-08 腾讯科技(深圳)有限公司 一种样本类别标签纠正方法及装置
CN107924430A (zh) * 2015-08-17 2018-04-17 皇家飞利浦有限公司 生物数据模式识别的多级体系构架
CN109000940A (zh) * 2018-05-04 2018-12-14 中车青岛四方机车车辆股份有限公司 一种机车车辆异常轴温诊断方法及系统
CN109492048A (zh) * 2019-01-21 2019-03-19 国网河北省电力有限公司经济技术研究院 一种电力用户用电特性的提取方法、系统及终端设备
CN110135740A (zh) * 2019-05-20 2019-08-16 济南大学 面向燃煤锅炉流程对象的实时知识发现方法及系统
CN110634080A (zh) * 2018-06-25 2019-12-31 中兴通讯股份有限公司 异常用电检测方法、装置、设备及计算机可读存储介质

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106575649A (zh) * 2014-06-12 2017-04-19 普迪飞半导体技术有限公司 以其他方式用于填充单元、抽头单元、解耦电容器单元、刻线和/或虚设填充的区域中的ic测试结构和/或e‑波束目标焊盘的伺机放置,以及包含相同结构的产品ic芯片
CN107924430A (zh) * 2015-08-17 2018-04-17 皇家飞利浦有限公司 生物数据模式识别的多级体系构架
CN107451597A (zh) * 2016-06-01 2017-12-08 腾讯科技(深圳)有限公司 一种样本类别标签纠正方法及装置
CN107158707A (zh) * 2017-04-27 2017-09-15 浙江大学 一种针对MMORPGs游戏的异常检测方法及装置
CN109000940A (zh) * 2018-05-04 2018-12-14 中车青岛四方机车车辆股份有限公司 一种机车车辆异常轴温诊断方法及系统
CN110634080A (zh) * 2018-06-25 2019-12-31 中兴通讯股份有限公司 异常用电检测方法、装置、设备及计算机可读存储介质
CN109492048A (zh) * 2019-01-21 2019-03-19 国网河北省电力有限公司经济技术研究院 一种电力用户用电特性的提取方法、系统及终端设备
CN110135740A (zh) * 2019-05-20 2019-08-16 济南大学 面向燃煤锅炉流程对象的实时知识发现方法及系统

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
凌霄汉;吉根林;: "一种基于聚类集成的无监督特征选择方法" *
贾培灵;樊建聪;彭延军;: "一种基于簇边界的密度峰值点快速搜索聚类算法" *

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112964988A (zh) * 2021-03-24 2021-06-15 河南中烟工业有限责任公司 电机工况的切分方法及系统
CN113516162A (zh) * 2021-04-26 2021-10-19 湖南大学 一种基于OCSVM和K-means算法的工控系统流量异常检测方法与系统
CN116384393A (zh) * 2023-04-27 2023-07-04 圣麦克思智能科技(江苏)有限公司 一种基于自然语言处理的运维数据处理系统及方法
CN116384393B (zh) * 2023-04-27 2023-11-21 圣麦克思智能科技(江苏)有限公司 一种基于自然语言处理的运维数据处理系统及方法

Also Published As

Publication number Publication date
CN111401420B (zh) 2023-04-18

Similar Documents

Publication Publication Date Title
CN111401420B (zh) 晶圆测试的异常数据聚类方法、装置、电子设备与介质
CN115455089B (zh) 一种无源组件的性能评估方法、系统及存储介质
US20090222390A1 (en) Method, program and apparatus for generating two-class classification/prediction model
WO2017088537A1 (zh) 一种元件分类方法及装置
CN112269818B (zh) 一种设备参数根因定位方法及系统、装置、介质
CN109635864B (zh) 一种基于数据的容错控制方法及装置
CN116167010B (zh) 具有智能迁移学习能力的电力系统异常事件快速识别方法
CN114398891B (zh) 基于日志关键词生成kpi曲线并标记波段特征的方法
CN114584497A (zh) 一种被动式工业控制系统资产识别方法及装置
CN114154029A (zh) 一种基于人工智能和色谱分析的样品查询方法及服务器
CN114398898A (zh) 基于日志事件关系生成kpi曲线并标记波段特征的方法
CN112836731A (zh) 基于决策树准确率和相关性度量的信号随机森林分类方法、系统及装置
CN107067034B (zh) 一种快速识别红外光谱数据分类的方法及系统
CN116578700A (zh) 日志分类方法、日志分类装置、设备及介质
CN111368928B (zh) 晶圆的模式匹配方法、装置、电子设备与存储介质
CN111539576B (zh) 一种风险识别模型的优化方法及装置
CN114970490A (zh) 一种文本标注数据的质检方法、装置、电子设备以及存储介质
US11386340B2 (en) Method and apparatus for performing block retrieval on block to be processed of urine sediment image
CN114694771A (zh) 样品分类方法、分类器的训练方法、设备和介质
CN113030726A (zh) 基于数据驱动的电机状态监测方法及系统
CN114088400B (zh) 一种基于包络排列熵的滚动轴承故障诊断方法
CN116068111B (zh) 色谱数据分析方法、装置、设备和计算机介质
CN113239236B (zh) 视频处理方法、装置、电子设备及存储介质
CN107066103B (zh) 利用脑电波识别生物的方法及装置
CN117077598B (zh) 一种基于Mini-batch梯度下降法的3D寄生参数的优化方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant