CN112883056B - 一种半导体测试数据处理方法及装置 - Google Patents

一种半导体测试数据处理方法及装置 Download PDF

Info

Publication number
CN112883056B
CN112883056B CN202110264915.3A CN202110264915A CN112883056B CN 112883056 B CN112883056 B CN 112883056B CN 202110264915 A CN202110264915 A CN 202110264915A CN 112883056 B CN112883056 B CN 112883056B
Authority
CN
China
Prior art keywords
test data
data
value
grouping
quantile
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202110264915.3A
Other languages
English (en)
Other versions
CN112883056A (zh
Inventor
陈小川
邵康鹏
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hangzhou Guangli Microelectronics Co ltd
Original Assignee
Hangzhou Guangli Microelectronics Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hangzhou Guangli Microelectronics Co ltd filed Critical Hangzhou Guangli Microelectronics Co ltd
Priority to CN202110264915.3A priority Critical patent/CN112883056B/zh
Publication of CN112883056A publication Critical patent/CN112883056A/zh
Application granted granted Critical
Publication of CN112883056B publication Critical patent/CN112883056B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2455Query execution
    • G06F16/24553Query execution of query operations
    • G06F16/24554Unary operations; Data partitioning operations
    • G06F16/24556Aggregation; Duplicate elimination
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2455Query execution
    • G06F16/24568Data stream processing; Continuous queries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2458Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
    • G06F16/2462Approximate or statistical queries
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02PCLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
    • Y02P90/00Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
    • Y02P90/30Computing systems specially adapted for manufacturing

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Computational Linguistics (AREA)
  • Probability & Statistics with Applications (AREA)
  • Fuzzy Systems (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Testing Or Measuring Of Semiconductors Or The Like (AREA)

Abstract

本发明提供了一种半导体测试数据处理方法,包括:从数据库中,分批读取不同晶圆或晶粒下器件名称相同的测试数据,确定器件名称所对应的测试数据;根据用户需求确定选定器件名称,提取所述选定器件名称对应的测试数据并预处理;对提取的测试数据进行分组处理,基于特定分位值确定分组编号,基于相邻分组编号对应分组的所述最小值及其对应的分位值获得所述特定分位值对应的分位数。能够在有限的资源配置下有效的分位数计算和数据统计,简化分析复杂度,效率高。本发明还提供了一种半导体数据处理装置,能实现本发明的数据处理方法而具有相应优势,能够更好的实现分位数的准确计算,利于生产效率的提高。

Description

一种半导体测试数据处理方法及装置
技术领域
本发明属于数据处理分析技术领域,具体涉及一种针对半导体测试中涉及的数据处理方法及数据处理装置。
背景技术
随着半导体工艺技术不断的提升,以及测试能力的提升,不管是设计公司还是生产代工厂都有大量的涉及半导体测试的数据需要进行处理与分析,其中最突出的是晶圆测试过程中进行测试数量越来越多,产生的需要分析和处理测试数据越来越庞大。当大量的测试数据涌入数据仓库时,数据分析人员面对如此巨大的测试数据,如何进行快速并且有效的处理与分析特别是对分组后的数据如何进行有效的分位数计算和数据统计,变的日益迫切。例如,半导体数据分析工程师在得到多片晶圆片的测试数据后,会对测试数据进行多维度的多个统计手段的分析,如统计每个晶粒die中几十个器件对应数据的分位数、中位数及平均数等,面对如此巨量的测试数据,传统的方法是将数据存入分布式数据库,并在分布式数据库之上搭建一个分布式数据计算平台。例如《计算机集成制造系统》2016年12期的论文《面向半导体制造的大数据分析平台》中指出“半导体制造大数据的出现,对当前半导体制造企业的数据存储和处理系统提出了挑战。”该论文介绍了分布式数据计算平台搭建和在半导体测试大数据处理方面的应用。数据分析平台的建设流程基本上可以从数据分析流程来理解,比如数据采集、数据整合、数据加工、数据可视化等等。常见的数据库和分布式数据计算平台有:MySQL、Redis、HybridDB for MySQL、Hbase(100亿)、MongoDB(10亿)、MemcacheDB;Spark、Hadoop、Hive、kafka、Flume、zookeper、MyBatis。Hadoop/MapReduce和Spark最适合的都是做离线型的数据分析,但Hadoop特别适合是单次分析的数据量“很大”的情景,而Spark则适用于数据量不是很大的情景。数据量是相对于整个集群中的内存容量而言的,因为Spark是需要将数据HOLD在内存。由此可知搭建一套数据分析平台本身就是一项复杂的工作,在这过程中需要考虑的因素有很多,比如:稳定性,可以通过多台机器做数据和程序运行的备份,但服务器的质量和预算成本相应的会限制平台的稳定性;可扩展性:大数据平台部署在多台机器上,如何在其基础上扩充新的机器是实际应用中经常会遇到的问题;安全性:保障数据安全是大数据平台不可忽视的问题,由安全性又引出一个关键的私密性,半导体测试企业的数据往往对企业的发展至关重要,有些甚至能够体现其核心技术。因此,即使搭建一套行之有效的分布式计算平台,想要快速得到计算结果,也需要大量的服务器来搭建平台数据分析平台,平台搭建过程复杂且数据处理时需要多次遍历数据,耗费时间长从而影响计算效率,另外出于安全和数据保密也不能完全依靠搭建数据分析平台处理半导体测试涉及的数据。现有技术中半导体制造涉及的数据处理方法需要进一步优化,以适应半导体测试企业的需求,推动半导体制造的进一步发展。
发明内容
本发明是基于上述现有技术的部分和/或全部问题而进行的,目的在于提供一种半导体测试数据处理方法,主要针对半导体制造中产生的测试数据特别是晶圆测试数据,可在有限的资源配置下,进行半导体测试数据的分位数计算,以及数据处理和统计,能够应用于流式数据分析系统。
本发明一方面提供的一种半导体测试数据处理方法,包括:步骤S1.从数据库中,读取晶圆或晶粒下全部或部分器件名称下的全部或部分测试数据,确定器件名称所对应的测试数据;步骤S2.根据用户需求确定选定器件名称,提取选定器件名称对应的测试数据;对提取的所述选定器件名称下的测试数据进行数据预处理。步骤S3.对提取的测试数据进行分组处理,确定特定分位值对应的分位数;包括:自定义分组规则,将所述测试数据分成若干组;根据所述特定分位值确定其所在分组的分组编号、所在分组的下一分组编号;根据所述所在分组的分组编号和所述下一分组编号各自对应的分组中数据最小值和所述数据最小值对应的分位值计算特定分位值对应的分位数。能够依次得到多个晶圆不同批次晶圆或晶粒下具有选定器件名称的半导体测试数据的特定分位值对应的分位数,用于支持对半导体测试数据的大数据分析,简化大数据分析的复杂度,提高分析效率。
所述预处理包括先将所述提取的测试数据定义为A,将A进行数据预处理后得到的数据记为B,处理公式是B=| (log A)×100 |。
步骤S1中确定器件名称所对应的测试数据后,还包括将读取到的所述测试数据进行统计。所述步骤S2中提取所述选定器件名称对应的测试数据后,还包括针对所述选定器件名称对应的测试数据进行统计。所述统计的结果包括:测试数据总和记为sum、测试数据总量记为count。
所述步骤S3中,还根据数据值的大小对所有分组中的测试数据分别进行排序。
所述测试数据分成若干组后,还包括记录分组数及每组中测试数据的最小值,根据分组数、每个分组中数据最小值和所述总量得出每个分组所述数据最小值对应的分位值。将所述特定分位值所在分组中测试数据的最小值记为Y1,将分组编号相邻的下一分组中测试数据的最小值记为Y2,并将其对应的分位值分别记为X1和X2,特定分位值记为X;通过公式:,确定所述特定分位值对应的分位数,其中基于得到的所述Y确定其在数据预处理前对应的数值Y’,Y’则为特定分位值对应的分位数。基于半导体大数据库中,电压、电流等电性测试数据的数据量巨大且数据值分布较集中的数据特征,基于所述公式能够准确的计算出所述特定分位值对应的分位数。所述特定分位值是已知的百分比值,其值范围为0-1。
所述步骤S3中,基于步骤S2统计的结果确定所述提取的测试数据的统计值,包括:通过所述提取的测试数据对应的sum和count相除得到所述提取的测试数据平均值,记为mean;到所述提取的测试数据平方总和记为sum2;基于所述提取的测试数据平方总和sum2,通过公式:sum2–2×mean2得到所述提取的测试数据的方差值。
所述步骤S3中,根据测试数据总量和数据值的密集程度数据特征来确定所述自定义分组规则。
在对提取的测试数据进行分组处理之前,将提取的测试数据进行了预处理,基于预处理后的数据进行后续操作,所述步骤S3获得所述特定分位值对应的分位数的过程中还针对所述预处理逆向推导,例如处理公式是B=| (log A)×100 |,通过公式:,得到Y后再将Y逆向推导得到Y’,作为最终实际的结果。基于半导体领域数据的数据特征,数值较小且相对密集,例如半导体电流数据的数值范围在1E-10~1E-5次方级别,因此在进行分组处理前先对数据进行预处理,能够简化后续操作,直观快速的通过反向处理获取最终的实际结果。
本发明另一方面还提供一种半导体测试数据处理装置,包括:相互通信连接的数据库、服务器和电子设备;所述数据库存储有晶圆测试数据;用户通过所述电子设备控制数据处理过程,并对数据处理结果进行操作;所述服务器包括存储器和处理器;所述存储器存储有计算程序,当所述计算机程序被运行时,所述处理器执行本发明一方面提供的所述半导体测试数据处理方法。
所述处理器设置有数据获取单元、统计单元、选择单元、预处理单元和分组操作单元;所述数据获取单元用于从所述数据库中,读取晶圆或晶粒下全部或部分器件名称下的全部或部分测试数据;所述统计单元用于对所述测试数据进行统计,包括确定器件名称所对应的器件的测试数据,获得所述器件的测试数据的统计值;所述选择单元用于根据用户需求确定选定器件名称,提取所述选定器件名称对应的器件的测试数据及其统计值;所述预处理单元用于对提取的测试数据进行数据预处理;包括:对提取的测试数据进行数据预处理得到提取的测试数据的数据集合;所述分组操作单元用于对提取的测试数据进行分组处理,获得特定分位值对应的分位数。具体是所述分组操作单元是基于所述数据集合进行处理。
所述预处理单元将所述选定器件名称下的测试数据定义为A,将A经过数据预处理得到的测试数据定义为B,处理公式是:B=| (log A)×100 |。
所述分组操作单元包括:分组统计模块、分组处理模块及分位数运算模块;所述分组统计模块按自定义分组规则将所述提取的测试数据分成若干组,记录分组数及每组中测试数据的最小值及测试数据的总量;所述分组处理模块还根据数据值得大小对所有分组中的测试数据分别进行排序,并根据分组数、每组中测试数据的最小值及测试数据的总量所述最小值对应的分位值,基于特定分位值确定其所在分组的分组编号及下一分组编号;分位数运算模块,将所在分组中测试数据的最小值记为Y1,将分组编号相邻的下一分组中测试数据的最小值记为Y2,并将对应的分位值分别记为X1和X2;基于公式:计算所述特定分位值对应的分位数。
所述分组运算模块还根据所述数据预处理进行逆向推导,得到所述特定分位值对应的分位数。即得到Y后再将Y逆向推导得到Y’,作为最终实际的结果。
本发明具有如下有益效果:
(1)根据本发明所涉及的一种半导体测试数据处理方法,分批读取不同晶圆或晶粒下器件名称相同的测试数据,能够基于半导体器件名称对不同的晶圆(wafer)或不同晶粒(die)下的测试数据进行分类数据处理;根据统计结果用户需求确定选定器件名称,提取所述选定器件名称对应的测试数据,对其进行分组处理,在有限的资源配置中也能够完成分位数计算,以及数据处理和统计,数据处理结果利于进行大数据统计分析,并可应用于流式数据分析系统。进行分组处理前先对数据进行预处理,能够简化后续操作,提高处理效率。
(2)根据本发明另一方面还提供一种半导体测试数据处理装置,对资源配置的要求低,基于本发明的数据处理方法,能够更好的针对晶圆(wafer)测试数据的数据特征,在数据处理前分批次读取不同wafer或不同die下器件名称相同的半导体器件对应的测试数据,实现晶圆测试数据分位数的准确计算,数据处理和分组操作结果更符合晶圆测试数据的数据特征,可在有限的资源配置下快速确定半导体测试数据任意百分比的分位数,并进行快速的数据处理和统计,能够进一步支持后台基于晶圆测试大数据进行数据统计分析,并可应用于流式数据分析系统,为企业分析大数据提供了更完善的支持,有利于提高生产效率,优化设计及晶圆测试工艺。
附图说明
图1是本发明的实施例一中半导体测试数据处理方法的过程示意图。
图2是本发明的实施例一中获取特定分位值对应的分位数的原理示意图。
图3是本发明的实施例一中半导体测试数据处理装置的示意图。
具体实施方式
本发明的上述和/或附加的方面和优点从结合下面附图对实施例的描述中将变得明显和容易理解。附图中,相同结构或功能的部分利用相同的附图标记来标记,出于显示清楚的原因必要时并不是所有示出的部分在全部附图中用所属的附图标记来标记。
在下述实施例中采用特定次序描绘了实施例的操作,这些次序的描述是为了更好的理解实施例中的细节以全面了解本发明,但这些次序的描述并不一定与本发明的半导体测试数据处理方法一一对应,也不能以此限定本发明的范围。
需要说明的是,附图中的流程图和框图,图示出按照本发明实施例的方法可能实现的操作过程。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以并不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以穿插的执行,依所涉及的步骤要实现的目的而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与人工操作结合来实现。
实施例一
如图1所示,结合参考图2,本发明实施例一中,半导体测试数据处理方法,具体包括下述步骤:步骤S1.从数据库中,读取晶圆或晶粒下全部或部分器件名称下的全部或部分测试数据,确定器件名称所对应的测试数据;步骤S2.根据用户需求确定选定器件名称,提取选定器件名称对应的测试数据;步骤S3.对提取的测试数据进行分组处理,确定特定分位值对应的分位数;包括:自定义分组规则,将所述测试数据分成若干组。根据所述特定分位值确定其所在分组的分组编号、所在分组的下一分组编号;根据所述所在分组的分组编号和所述下一分组编号各自对应的分组中数据最小值和所述数据最小值对应的分位值计算特定分位值对应的分位数。
记录分组数及每组中测试数据的最小值,统计每组中的测试数据总量,根据分组数、所述最小值和所述总量得所述最小值对应的分位值。例如100万个数值在1到1000范围内的数据,数据1-10范围内的数据标记为分组1,11-20的数据标记为分组2,依次类推。实际情况中数据可能非常复杂,上述示例只是以一个简单情况为例,为了便于说明和理解本实施例。
基于特定分位值确定分组编号,基于相邻分组编号对应分组的所述最小值及其对应的分位值获得所述特定分位值对应的分位数。
本实施例中,对所述步骤S1中确定器件名称所对应的测试数据进行统计。所述步骤S2中提取所述选定器件名称对应的测试数据后,还包括针对所述选定器件名称对应的测试数据进行统计。获所述统计的结果包括:测试数据总和记为sum、测试数据总量记为count。所述步骤S3中,基于步骤S2统计的结果确定所述提取的测试数据的统计值,包括:通过所述提取的测试数据对应的sum和count相除得到所述提取的测试数据平均值,记为mean;所述提取的测试数据平方总和记为sum2;基于所述提取的测试数据平方总和sum2,通过公式:sum2–2×mean2得到所述提取的测试数据的方差值。在其它一些实施例中也可以没有对测试数据进行统计,并不限定。
通过统计依次得到多个晶圆不同批次裸片下具有特定器件名称的半导体测试数据的平均值、方差等特定统计值。
本实施例中,所述步骤S3中,根据测试数据总量和数据值的密集程度等数据特征来具体确定所述自定义分组规则。所述自定义分组规则也可以根据实际数据情况进行定义,并不限定。本实施例中在步骤S3中还根据数据值得大小对所有分组中的测试数据分别进行排序。排序后直观的获得每个分组中的最小值,并根据分组数据的总量、分组数和每个分组中的最小值进行运算得到每个分组最小值对应的分位值。例如100万个数值在1到1000范围内的数据,1-10(分组编号为1)的数据有1万个且最小值为1.5,11- 20(分组编号为2)的数据有1万个且最小值为10.5,则1.5的分位值为0%,10.5的分位值1%。实际情况中数据可能非常复杂,上述示例只是以一个简单情况为例,为了便于说明和理解本实施例。
本实施例中,将所述特定分位值所在分组中测试数据的最小值记为Y1,将分组编号相邻的下一分组中测试数据的最小值记为Y2,并将其对应的分位值分别记为X1和X2,特定分位值记为X;通过公式:,确定所述特定分位值对应的分位数,其中基于得到的所述Y确定其在数据预处理前对应的数值Y’,Y’则为特定分位值对应的分位数。基于半导体大数据库中,电压、电流等电性测试数据的数据量巨大且数据值分布较集中的数据特征,且X2和X1之间的值相距很小,其原理如图2所示,基于所述公式能够准确的计算出所述特定分位值对应的分位数。
本实施例中所述特定分位值是一个任意的百分比值,其值范围为0-1。比如要计算特定分位值为50%的分位数是多少,则50%对应的分组的编号是500,其下一个编号是501。
如图3所示,本实施例中还提供了一种半导体测试数据处理装置,能够依据本实施例的半导体测试数据处理方法进行有效的分位数计算和数据统计。具体来说,由于一片wafer下某个die下可包含多个半导体器件,例如一个die可包含几十万个半导体器件,但多数半导体器件的结构相同(器件对应的名称相同),本实施例的半导体测试数据处理装置可基于半导体器件名称对不同wafer或不同die下晶圆测试数据进行分类处理和统计,然后再根据用户需求和统计结果针对选定的某个器件名称下的测试数据进行数据处理和统计,进而得到选定器件名称下测试数据的分位数和相关统计值。本实施例的半导体测试数据处理装置包括:相互通信连接的数据库1、服务器2和电子设备3。电子设备3例如可以是工作站、个人电脑或者笔记本等。图3只是为了便于理解的一个示意图。实际应用中数据库1、服务器2和电子设备3分别可以只有一台或者分别是多台,可以布置在同一生产现场也可以分散布置在不同的生产现场,可以分别与外网连接或者连接于同一个局域网并不限定。
本实施例中数据库1存储有晶圆测试数据;用户通过电子设备3控制数据处理过程,并对数据处理结果进行操作,如记录和分析或者导入流式数据分析系统,在后台基于晶圆测试大数据进行数据统计分析。服务器2包括存储器21和处理器22。实际应用中,存储器21和处理器22通信连接,分别可以只有一个或者分别是多个,可以设置在同一服务器2中也可以分散布置在不同的服务器2中,并不限定。存储器21存储有计算程序,当所述计算机程序被运行时,处理器22执行本实施例的所述半导体测试数据处理方法。
处理器22设置有数据获取单元、统计单元、选择单元和分组操作单元,可以设置在同一个处理器中也可以分散设置在不同的几个处理器中,并不限定。所述数据获取单元用于从数据库1中,读取晶圆或晶粒下全部器件名称下的全部器件的测试数据。根据实际应用需要的不同,也可以只读取部分器件名下部分器件的测试数据,并不限定。所述统计单元用于所述测试数据进行统计,包括确定器件名称所对应的器件的测试数据,获得所述器件的测试数据的统计值;所述选择单元用于根据用户需求确定选定器件名称,提取所述选定器件名称对应的器件的测试数据及其统计值;所述分组操作单元用于对提取的测试数据进行分组处理,获得特定分位值对应的分位数。处理器22设置有数据获取单元、统计单元、选择单元和分组操作单元是本实施例的一个具体做法,实际应用中处理器22也可以设置有其它单元或者通过其它单元执行本实施例的所述半导体测试数据处理方法,并不限定。
本实施例的半导体测试数据处理方法中还包括,对提取的所述选定器件名称下的测试数据进行数据预处理。基于预处理后的数据进行后续操作,所述步骤S3获得所述特定分位值对应的分位数的过程中还针对所述预处理进行逆向推导。基于半导体领域数据的数据特征,数值较小且相对密集,例如半导体电流数据的数值范围在1E-10~1E-5次方级别,因此在进行数据处理前先对数据预处理有利于简化后续计算,降低资源配置的需求。本实施例中指先将所述提取的测试数据定义为A,将A进行数据预处理后得到的数据记为B,处理公式是B=| (log A)×100 |。再对B进行所述分组操作。在实际数据处理中,也可根据晶圆测试数据的真实数据特征对数据预处理或处理公式进行调整,并不仅限于本实施例中的具体数据预处理。
本实施例中相应的半导体测试数据处理装置中,处理器中还设置有预处理单元;所述预处理单元用于对提取的测试数据进行数据预处理。所述预处理单元对提取的测试数据进行数据预处理得到提取的测试数据的数据集合;所述分组操作单元基于所述数据集合进行处理。本实施例中基于公式:得到Y,再基于得到的Y进行所述预处理的逆向推导,确定其在数据预处理前对应的数值Y’则为最终实际结果中所要得到的分位数。依次得到多个晶圆不同批次die下具有特定器件名称的半导体数据的特定分位值对应的分位数Y’和数据均值、方差等特定统计值,以用于后台对晶圆测试数据进行大数据分析。
本实施例中,所述分组操作单元包括:分组统计模块、分组处理模块及分位数运算模块;所述分组统计模块按自定义分组规则将所述提取的测试数据分成若干组,记录分组数及每组中测试数据的最小值及测试数据的总量;所述分组处理模块还根据数据值得大小对所有分组中的测试数据分别进行排序,并根据分组数、每组中测试数据的最小值及测试数据的总量所述最小值对应的分位值,基于特定分位值确定其所在分组的分组编号及下一分组编号;分位数运算模块,将所在分组中测试数据的最小值记为Y1,将分组编号相邻的下一分组中测试数据的最小值记为Y2,并将对应的分位值分别记为X1和X2,特定分位值记为X;基于公式:计算所述特定分位值对应的分位数。本实施例中特定分位值是一个特定的百分比值,可以指定任意的百分比值,其值范围为0-1,(例如50%或75%等百分比值)。在实际应用中所述分组操作单元也可以包括其它特定功能模块或者通过其它功能模块实现分组操作过程,并不限定。
上述实施方式为本发明的优选案例,并不用来限制本发明的保护范围。也应了解到,这些实施中的细节不应用以限制本发明。
各个实施例之间的技术方案可以相互结合,但是必须是以本领域普通技术人员能够实现为基础,当技术方案的结合出现相互矛盾或无法实现时应当认为这种技术方案的结合不存在,也不在本发明要求的保护范围之内。

Claims (7)

1.一种半导体测试数据处理方法,其特征在于,包括:
步骤S1.从数据库中,读取晶圆或晶粒下全部或部分器件名称下的全部或部分测试数据,确定器件名称所对应的测试数据;
步骤S2.根据用户需求确定选定器件名称,提取选定器件名称对应的测试数据;对提取的所述选定器件名称下的测试数据进行数据预处理;所述预处理包括先将提取的测试数据定义为A,将A进行数据预处理后得到的数据记为B,处理公式是B=|(log A)×100|;
步骤S3.对提取的测试数据进行分组处理,确定特定分位值对应的分位数;包括:
自定义分组规则,将所述测试数据分成若干组;根据测试数据总量和数据值的密集程度数据特征来确定所述自定义分组规则;
根据所述特定分位值确定其所在分组的分组编号、所在分组的下一分组编号;根据所述所在分组的分组编号和所述下一分组编号各自对应的分组中数据最小值和所述数据最小值对应的分位值计算特定分位值对应的分位数;
步骤S1中确定器件名称所对应的测试数据后,还包括将读取到的所述测试数据进行统计;所述步骤S2中提取所述选定器件名称对应的测试数据后,还包括针对所述选定器件名称对应的测试数据进行统计;
所述统计的结果包括:测试数据总和记为sum、测试数据总量记为count;
所述步骤S3中,所述测试数据分成若干组后,还根据数据值的大小对所有分组中的测试数据分别进行排序,记录分组数及每组中测试数据的最小值,根据分组数、每个分组中数据最小值和所述测试数据总量得出每个分组所述数据最小值对应的分位值。
2.根据权利要求1所述的半导体测试数据处理方法,其特征在于,
将所述特定分位值所在分组中测试数据的最小值记为Y1,将分组编号相邻的下一分组中测试数据的最小值记为Y2,并将其对应的分位值分别记为X1和X2,特定分位值记为X;
通过公式:确定所述特定分位值对应的分位数。
3.根据权利要求2所述的半导体测试数据处理方法,其特征在于,所述步骤S3中,基于步骤S2统计的结果确定所述提取的测试数据的统计值,包括:通过所述提取的测试数据对应的sum和count相除得到所述提取的测试数据平均值,记为mean;所述提取的测试数据平方总和记为sum2;基于所述提取的测试数据平方总和sum2,通过公式:sum2–2×mean2得到所述提取的测试数据的方差值。
4.一种半导体测试数据处理装置,其特征在于,包括相互通信连接的数据库、服务器和电子设备;
所述数据库存储有晶圆测试数据;
用户通过所述电子设备控制数据处理过程,并对数据处理结果进行操作;
所述服务器包括存储器和处理器;所述存储器存储有计算程序,当所述计算程序被运行时,所述处理器执行权利要求1-3任意一项所述的半导体测试数据处理方法。
5.根据权利要求4所述的半导体测试数据处理装置,其特征在于,所述处理器设置有数据获取单元、统计单元、选择单元、预处理单元和分组操作单元;
所述数据获取单元用于从所述数据库中,读取晶圆或晶粒下全部或部分器件名称下的全部或部分测试数据;
所述统计单元用于对所述测试数据进行统计,包括确定器件名称所对应的器件的测试数据,获得所述器件的测试数据的统计值;
所述选择单元用于根据用户需求确定选定器件名称,提取所述选定器件名称对应的器件的测试数据及其统计值;
所述预处理单元用于对提取的测试数据进行数据预处理;包括:对提取的测试数据进行数据预处理得到提取的测试数据的数据集合;
所述分组操作单元用于对提取的测试数据进行分组处理,获得特定分位值对应的分位数。
6.根据权利要求5所述的半导体测试数据处理装置,其特征在于,所述预处理单元将所述选定器件名称下的测试数据定义为A,将A经过数据预处理得到的测试数据定义为B,处理公式是:B=|(log A)×100|。
7.根据权利要求5或6所述的半导体测试数据处理装置,其特征在于,所述分组操作单元包括:分组统计模块、分组处理模块及分位数运算模块;
所述分组统计模块按自定义分组规则将所述提取的测试数据分成若干组,记录分组数及每组中测试数据的最小值及测试数据的总量;
所述分组处理模块还根据数据值的大小对所有分组中的测试数据分别进行排序,并根据分组数、每组中测试数据的最小值及测试数据的总量所述最小值对应的分位值,基于特定分位值确定其所在分组的分组编号及下一分组编号;
将所在分组中测试数据的最小值记为Y1,将分组编号相邻的下一分组中测试数据的最小值记为Y2,并将对应的分位值分别记为X1和X2,特定分位值记为X;所述分位数运算模块基于公式:计算所述特定分位值对应的分位数,其中基于得到的所述Y确定其在数据预处理前对应的数值Y’。
CN202110264915.3A 2021-03-11 2021-03-11 一种半导体测试数据处理方法及装置 Active CN112883056B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110264915.3A CN112883056B (zh) 2021-03-11 2021-03-11 一种半导体测试数据处理方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110264915.3A CN112883056B (zh) 2021-03-11 2021-03-11 一种半导体测试数据处理方法及装置

Publications (2)

Publication Number Publication Date
CN112883056A CN112883056A (zh) 2021-06-01
CN112883056B true CN112883056B (zh) 2023-08-11

Family

ID=76040842

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110264915.3A Active CN112883056B (zh) 2021-03-11 2021-03-11 一种半导体测试数据处理方法及装置

Country Status (1)

Country Link
CN (1) CN112883056B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114397985B (zh) * 2022-03-25 2022-07-12 杭州广立微电子股份有限公司 一种晶圆良率数据的处理方法及装置

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103808492A (zh) * 2014-02-13 2014-05-21 上海温光自动化技术有限公司 一种otdr采集数据的曲线显示方法
CN104520857A (zh) * 2012-06-05 2015-04-15 德克斯康公司 用于处理分析物数据并产生报告的系统和方法
CN109359699A (zh) * 2018-11-02 2019-02-19 广东工业大学 一种基于Alpha稳定分布的工业机组故障诊断方法
CN109726234A (zh) * 2018-09-14 2019-05-07 上海华岭集成电路技术股份有限公司 基于工业互联网的集成电路测试信息化管理系统
JP6559850B1 (ja) * 2018-07-27 2019-08-14 Karydo TherapeutiX株式会社 ヒトにおける被験物質の作用を予測するための人工知能モデル
US10489383B1 (en) * 2017-06-30 2019-11-26 Quantcast Corporation Identifying variance in distributed systems
CN111125222A (zh) * 2019-12-19 2020-05-08 北京顺丰同城科技有限公司 一种数据测试方法及装置
CN111220889A (zh) * 2020-01-02 2020-06-02 长江存储科技有限责任公司 晶圆测试数据处理方法及设备
CN112285653A (zh) * 2020-10-14 2021-01-29 广州极飞科技有限公司 信号去干扰方法、装置、毫米波雷达模块、设备及介质

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7480593B2 (en) * 2005-08-03 2009-01-20 Suresh Gopalan Methods and systems for high confidence utilization of datasets
US10002186B2 (en) * 2014-08-29 2018-06-19 Software Ag System and method for precise quantile determination
GB2581861B (en) * 2018-09-14 2022-10-05 Sino Ic Tech Co Ltd IC Test Information Management System Based on Industrial Internet
US11157346B2 (en) * 2018-09-26 2021-10-26 Palo Alto Rsearch Center Incorporated System and method for binned inter-quartile range analysis in anomaly detection of a data series
US10990598B2 (en) * 2019-01-31 2021-04-27 Microsoft Technology Licensing, Llc Aggregating quantile metrics in multidimensional data sets

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104520857A (zh) * 2012-06-05 2015-04-15 德克斯康公司 用于处理分析物数据并产生报告的系统和方法
CN103808492A (zh) * 2014-02-13 2014-05-21 上海温光自动化技术有限公司 一种otdr采集数据的曲线显示方法
US10489383B1 (en) * 2017-06-30 2019-11-26 Quantcast Corporation Identifying variance in distributed systems
JP6559850B1 (ja) * 2018-07-27 2019-08-14 Karydo TherapeutiX株式会社 ヒトにおける被験物質の作用を予測するための人工知能モデル
CN109726234A (zh) * 2018-09-14 2019-05-07 上海华岭集成电路技术股份有限公司 基于工业互联网的集成电路测试信息化管理系统
CN109359699A (zh) * 2018-11-02 2019-02-19 广东工业大学 一种基于Alpha稳定分布的工业机组故障诊断方法
CN111125222A (zh) * 2019-12-19 2020-05-08 北京顺丰同城科技有限公司 一种数据测试方法及装置
CN111220889A (zh) * 2020-01-02 2020-06-02 长江存储科技有限责任公司 晶圆测试数据处理方法及设备
CN112285653A (zh) * 2020-10-14 2021-01-29 广州极飞科技有限公司 信号去干扰方法、装置、毫米波雷达模块、设备及介质

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
张维朋等.《数据挖掘在医学中的应用》.中国原子能出版社,2018,第48-50页. *

Also Published As

Publication number Publication date
CN112883056A (zh) 2021-06-01

Similar Documents

Publication Publication Date Title
CN100394421C (zh) 产品良率分析系统及方法
US20090185493A1 (en) Hierarchical and Incremental Multivariate Analysis for Process Control
US20140189436A1 (en) Fault detection and localization in data centers
US20120185818A1 (en) Method for smart defect screen and sample
CN105518654B (zh) 对工具处理数据提供多变量分析的基于k最近邻法与系统
CN107979602A (zh) 一种蜂窝网络中基于半监督统计的异常检测方法
CN112953738B (zh) 根因告警的定位系统、方法、装置、计算机设备
CN112883056B (zh) 一种半导体测试数据处理方法及装置
CN113254255B (zh) 一种云平台日志的分析方法、系统、设备及介质
CN114429256A (zh) 数据监测方法、装置、电子设备及存储介质
CN106570104A (zh) 一种流数据的多分区聚类预处理方法
CN116467266A (zh) 一种批量文件智能联机处理方法、装置及可存储介质
CN106951360B (zh) 数据统计完整度计算方法和系统
CN110968984A (zh) 集成电路工艺分析系统及分析方法
US20120316803A1 (en) Semiconductor test data analysis system
CN116319255A (zh) 一种基于kpi的根因定位方法、装置、设备及存储介质
CN115794744A (zh) 一种日志展示方法、装置、设备和存储介质
WO2022088806A1 (zh) 计算集群错误预测方法及相关设备
CN113360313B (zh) 一种基于海量系统日志的行为分析方法
CN111414582B (zh) 一种光伏理论功率计算方法、装置、设备和存储介质
CN115543671A (zh) 数据分析方法、装置、设备、存储介质及程序产品
CN115269315A (zh) 一种异常检测方法、装置、设备、介质
CN108712303B (zh) 一种云平台的尾延迟测评系统和方法
CN114386468A (zh) 网络异常流量检测方法、装置、电子设备及存储介质
Jerome et al. Anomaly detection and classification using a metric for determining the significance of failures: Case study: mobile network management data from LTE network

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant