CN116502714A - 一种端到端的知识图谱生成方法 - Google Patents
一种端到端的知识图谱生成方法 Download PDFInfo
- Publication number
- CN116502714A CN116502714A CN202310054900.3A CN202310054900A CN116502714A CN 116502714 A CN116502714 A CN 116502714A CN 202310054900 A CN202310054900 A CN 202310054900A CN 116502714 A CN116502714 A CN 116502714A
- Authority
- CN
- China
- Prior art keywords
- target
- data
- defect
- knowledge
- item
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 48
- 238000004519 manufacturing process Methods 0.000 claims abstract description 57
- 239000004065 semiconductor Substances 0.000 claims abstract description 36
- 238000001514 detection method Methods 0.000 claims abstract description 25
- 230000005856 abnormality Effects 0.000 claims abstract description 19
- 239000011159 matrix material Substances 0.000 claims abstract description 10
- 230000007547 defect Effects 0.000 claims description 75
- 230000002159 abnormal effect Effects 0.000 claims description 22
- 238000003070 Statistical process control Methods 0.000 claims description 18
- 238000005259 measurement Methods 0.000 claims description 16
- 238000013145 classification model Methods 0.000 claims description 8
- 238000000605 extraction Methods 0.000 claims description 5
- 235000012431 wafers Nutrition 0.000 description 29
- 230000008569 process Effects 0.000 description 10
- XUIMIQQOPSSXEZ-UHFFFAOYSA-N Silicon Chemical compound [Si] XUIMIQQOPSSXEZ-UHFFFAOYSA-N 0.000 description 6
- 229910052710 silicon Inorganic materials 0.000 description 6
- 239000010703 silicon Substances 0.000 description 6
- 238000013527 convolutional neural network Methods 0.000 description 4
- 238000012545 processing Methods 0.000 description 4
- 230000009471 action Effects 0.000 description 3
- 238000012360 testing method Methods 0.000 description 3
- 238000010586 diagram Methods 0.000 description 2
- 238000003709 image segmentation Methods 0.000 description 2
- 238000003058 natural language processing Methods 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 1
- 238000013528 artificial neural network Methods 0.000 description 1
- 230000000903 blocking effect Effects 0.000 description 1
- 230000001364 causal effect Effects 0.000 description 1
- 239000013078 crystal Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 229910021421 monocrystalline silicon Inorganic materials 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 229910021420 polycrystalline silicon Inorganic materials 0.000 description 1
- 238000004886 process control Methods 0.000 description 1
- 230000000306 recurrent effect Effects 0.000 description 1
- 239000007858 starting material Substances 0.000 description 1
- 238000007619 statistical method Methods 0.000 description 1
- 230000009897 systematic effect Effects 0.000 description 1
- 230000002123 temporal effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N5/00—Computing arrangements using knowledge-based models
- G06N5/02—Knowledge representation; Symbolic representation
- G06N5/022—Knowledge engineering; Knowledge acquisition
- G06N5/025—Extracting rules from data
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N5/00—Computing arrangements using knowledge-based models
- G06N5/02—Knowledge representation; Symbolic representation
- G06N5/027—Frames
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02P—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
- Y02P90/00—Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
- Y02P90/30—Computing systems specially adapted for manufacturing
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- General Engineering & Computer Science (AREA)
- Software Systems (AREA)
- General Physics & Mathematics (AREA)
- Evolutionary Computation (AREA)
- Physics & Mathematics (AREA)
- Computing Systems (AREA)
- Data Mining & Analysis (AREA)
- Mathematical Physics (AREA)
- Artificial Intelligence (AREA)
- Computational Linguistics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Medical Informatics (AREA)
- Testing Or Measuring Of Semiconductors Or The Like (AREA)
- General Factory Administration (AREA)
Abstract
本发明涉及一种端到端的知识图谱生成方法,包括:获取半导体制造中产出的非文本形式的至少一项目标数据,各项目标数据包括数值序列或数值矩阵;根据各项目标数据各自的类型,使用对应的异常检测模型确定目标知识点,所述目标知识点包括对应目标数据中包含的、与半导体制造相关的异常类型;根据所述目标知识点,生成半导体制造领域的知识图谱。
Description
技术领域
本发明涉及半导体制造领域,尤其涉及一种端到端的知识图谱生成方法。
背景技术
在半导体制造过程中产生了各种数据,从数据来源主要分为两大类,一类是来自各种设备的数据,例如设备运行状态、设备参数、设备手册、运行日志等;另一类是来自生产的芯片的测试数据,例如芯片的电器特性、芯片缺陷等。在目前的生产过程中,往往只对一小部分数据进行了分析以用于指导生产,大部分数据并没有被充分利用。
在知识图谱的生成方式中,常规的方式为通过开放域的文本文档,通过自然语言处理NLP的方式提取出节点以及节点之间的因果/顺承等关系来构建知识点,随后生成相应的知识图谱。但是,由于半导体制造中存在大量的结构化数据,如果采用常规的知识图谱的生成方式,就需要首先通过语言生成模型将数据生成为事件描述文本,之后再将事件描述文本中的知识点抽取出来,以此构建知识图谱。对于数据的处理存在语言生成以及解构的过程,较为繁琐与低效。
发明内容
本说明书一个或多个实施例描述了一种端到端的知识图谱生成方法,旨在使用端到端的方法,对半导体制造领域的各种数据进行处理,生成知识图谱,然后可以基于知识图谱指导整个半导体的生产过程。同时,本发明以知识点为核心,不将数据生成为事件描述文本,而是直接从数据生成知识点,然后基于知识点生成知识图谱,以此简化整个半导体制造过程中生成知识图谱的流程。
第一方面,提供了一种端到端的知识图谱生成方法,包括:
获取半导体制造中产出的非文本形式的至少一项目标数据,各项目标数据包括数值序列或数值矩阵;
根据各项目标数据各自的类型,使用对应的异常检测模型确定目标知识点,所述目标知识点包括对应目标数据中包含的、与半导体制造相关的异常类型;
根据所述目标知识点,生成半导体制造领域的知识图谱。
在一种可能的实施方式中,所述至少一项目标数据包括:统计过程控制SPC数据、晶圆图数据和故障检测与分类FDC数据。
在一种可能的实施方式中,所述根据各项目标数据各自的类型,使用对应的异常检测模型确定目标知识点,包括:
根据各项目标数据各自的类型,使用对应的编码方式对所述目标数据进行编码,得到编码数据;
将所述编码数据输入对应的异常检测模型,输出得到所述目标知识点。
在一种可能的实施方式中,所述目标知识点为三元组的形式,所述三元组包括所述异常类型作为一个元素。
在一种可能的实施方式中,所述至少一项目标数据包括统计过程控制SPC数据,其形成数值序列;所述根据各项目标数据各自的类型,使用对应的异常检测模型确定目标知识点,包括:
对所述数值序列的序列片段进行特征提取与位置嵌入,得到特征向量序列;
将所述特征向量序列输入到Transformer模型中,得到异常类型和异常相对位置;
根据所述序列片段在所述数值序列中的位置,确定异常开始位置和异常结束位置;
将所述异常类型、异常开始位置和异常结束位置的三元组,作为对应的目标知识点。
在一种可能的实施方式中,所述至少一项目标数据包括晶圆图数据;所述根据各项目标数据各自的类型,使用对应的异常检测模型确定目标知识点,包括:
根据所述晶圆图对应的像素矩阵,对所述晶圆图进行分割,得到若干包含单个晶圆缺陷的缺陷子图;
将所述若干缺陷子图中的目标缺陷子图输入到缺陷分类模型中,得到对应的缺陷类型;
将所述缺陷类型作为异常类型,结合所述目标缺陷子图确定对应的目标知识点。
在一种可能的实施方式中,在将所述若干缺陷子图中的目标缺陷子图输入到缺陷分类模型中之前,还包括:
对任意缺陷子图进行特征提取,得到子图特征;
通过在预定特征集中进行检索和比对,确定所述缺陷子图是否属于已知缺陷类型;所述预定特征集由已知缺陷类型的图特征构成;
在属于已知缺陷类型的情况下,将该缺陷子图确定为所述目标缺陷子图。
在一种可能的实施方式中,所述至少一项目标数据包括,目标传感器的测量数据序列;所述根据各项目标数据各自的类型,使用对应的异常检测模型确定目标知识点,包括:
将所述测量数据序列中排序在前的目标子序列使用变分自编码器VAE的编码器进行编码,得到隐空间变量;使用门控循环单元GRU模型提取所述目标子序列的时间信息;将所述隐空间变量和所述时间信息输入到变分自编码器VAE的解码器进行解码,得到预测数据;
根据所述预测数据与所述测量数据序列中接续所述目标子序列的测量数据,确定与所述目标传感器相关的异常类型;
生成目标知识点,其中包括,所述异常类型,所述测量数据序列所针对的生产设备编号和生产设备正在加工的晶圆的编号。
在一种可能的实施方式中,在所述根据所述目标知识点,生成知识图谱之前,所述方法还包括:
对各项目标数据生成的知识点进行去重操作,去除其中重复的知识点。
在一种可能的实施方式中,根据所述目标知识点,生成半导体制造领域的知识图谱,包括:
将所述目标知识点中的异常类型作为实体节点,添加到知识图谱中。
第二方面,提供了一种端到端的知识图谱生成装置,包括:
数据获取单元,配置为,获取半导体制造中产出的非文本形式的至少一项目标数据,各项目标数据包括数值序列或数值矩阵;知识点确定单元,配置为,根据各项目标数据各自的类型,使用对应的异常检测模型确定目标知识点,所述目标知识点包括对应目标数据中包含的、与半导体制造相关的异常类型;图谱生成单元,配置为,根据所述目标知识点,生成半导体制造领域的知识图谱。
在一种可能的实施方式中,所述装置还包括:
去重单元,配置为,对各项目标数据生成的知识点进行去重操作,去除其中重复的知识点。
本发明提出的一种端到端的知识图谱生成方法,使用端到端的方法,对半导体制造领域的各种数据进行处理,生成知识图谱,以知识点为核心,不将数据生成为事件描述文本,而是直接从数据生成知识点,然后基于知识点生成知识图谱,以此简化整个半导体制造过程中生成知识图谱的流程。
附图说明
为了更清楚地说明本说明书披露的多个实施例的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本说明书披露的多个实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它的附图。
图1为本发明实施例公开的一种端到端的知识图谱生成方法的流程图;
图2为本发明实施例公开的一种基于SPC数据生成知识点的方法的流程图;
图3为本发明实施例公开的一种基于晶圆图数据生成知识点的方法的流程图;
图4为本发明实施例公开的一种基于单变量时序数据生成知识点的方法的流程图;
图5为本发明实施例公开的一种端到端的知识图谱生成装置的示意性框图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
在对本申请实施例进行详细介绍之前,首先对本申请实施例涉及的名词和符号进行解释。
SPC:Statistical Process Control,统计过程控制,是一种借助数理统计方法的过程控制工具。可对生产过程进行分析和预控制,使过程维持在仅受随机性因素影响的受控状态,以达到控制质量、提升质量、持续改善的目的。
晶圆:英文名称为Wafer,是指制作硅半导体电路所用的硅晶片,其原始材料是硅。高纯度的多晶硅溶解后掺入硅晶体晶种,然后慢慢拉出,形成圆柱形的单晶硅。硅晶棒在经过研磨,抛光,切片后,形成硅晶圆片,也就是晶圆。
FDC:Fault Detection and Classification,故障检测与分类,以系统化的方式取代人员监控机台制程中的状态,进行及时拦阻,避免造成大量报废,并于异常发生时进行差异分析,以供使用者进行快速异常排除。
为便于对本发明实施例的理解,下面将结合附图以具体实施例做进一步的解释说明,实施例并不构成对本发明实施例的限定。
图1为本发明实施例公开的一种端到端的知识图谱生成方法的流程图。如图1所示,所述方法至少包括:步骤101,获取半导体制造中产出的非文本形式的至少一项目标数据,各项目标数据包括数值序列或数值矩阵;步骤102,根据各项目标数据各自的类型,使用对应的异常检测模型确定目标知识点,所述目标知识点包括对应目标数据中包含的、与半导体制造相关的异常类型;步骤104,根据所述目标知识点,生成半导体制造领域的知识图谱。
在步骤101,获取半导体制造中产出的非文本形式的至少一项目标数据,各项目标数据包括数值序列或数值矩阵。
在半导体制造过程中产生了各种数据,从数据来源主要分为两大类,一类是来自各种设备的数据,包括设备运行状态、设备参数、设备手册、运行日志等;另一类是来自生产的芯片的测试数据,包括芯片的电器特性、芯片缺陷等。这些数据从数据类型上又可以分为:结构化数据、半结构化数据和非结构化数据。结构化数据指的是芯片的数据、设备运行状态数据等;半结构化数据指的是日志数据、工单数据等;非结构化数据指的是设备文档等。本发明所述方法主要是将半导体制造中产出的非文本形式的数据直接生成知识点。
步骤101中,所述至少一项目标数据包括:统计过程控制SPC数据、晶圆图数据和故障检测与分类FDC数据。
在步骤102,根据各项目标数据各自的类型,使用对应的异常检测模型确定目标知识点,所述目标知识点包括对应目标数据中包含的、与半导体制造相关的异常类型。在一些可能的实施方式中,所述目标知识点为三元组的形式,所述三元组包括所述异常类型作为一个元素。
具体地,根据各项目标数据各自的类型,使用对应的编码方式对所述目标数据进行编码,得到编码数据;将所述编码数据输入对应的异常检测模型,输出得到所述目标知识点。
在一个实施例中,根据所述目标数据的类型,使用对应的编码方式对所述目标数据进行编码,得到编码数据,然后使用教师-学生模型对所述编码数据进行检测,确定异常类型。在对数据进行编码得到编码数据之后,将编码数据输入到教师-学生模型中,对所述编码数据进行检测,确定异常类型。教师模型的输入是不带掩码的完整输入,相当于参考答案,利用掩码区域教师模型输出的特征作为软标签来训练学生模型。教师模型的结构和学生模型是完全相同的,只是参数有差别。
在另一个实施例中,所述至少一项目标数据包括统计过程控制SPC数据,其形成数值序列。SPC数据为晶圆制造相关的数值序列,晶圆制造相关的数值序列可以包括晶圆制造设备相关的数值序列,例如,晶圆制造设备(也可称之为机台)在生产中通过传感器取得的包含设备的状态的数据,例如包括但不限于:温度,湿度,压力,电压,电流等;以及晶圆制造设备的使用率等;和/或,晶圆相关的数据,例如,晶圆在生产流程中通过缺陷检测得到的数据(例如晶圆缺陷数据);晶圆在生产流程中通过电学测试得到的数据(例如晶圆的失效类型数据,包括CPU区间失效、GPU区间失效、存储区间失效等);晶圆的良率数据等纯数值型数据。
在本实施例中,步骤102的实现方法如图2所示。
在步骤201,对所述数值序列的序列片段进行特征提取与位置嵌入,得到特征向量序列。所述特征提取可以使用卷积神经网络CNN或循环神经网络RNN实现。
在步骤202,将所述特征向量序列输入到Transformer模型中,得到异常类型和异常相对位置。
在步骤203,根据所述序列片段在所述数值序列中的位置,确定异常开始位置和异常结束位置。
在步骤204,将所述异常类型、异常开始位置和异常结束位置的三元组,作为对应的目标知识点。例如,所述三元组的形式可以为(异常类型,异常开始位置,异常结束位置)。
在又一个实施例中,所述至少一项目标数据包括晶圆图数据。
在本实施例中,步骤102的实现方法如图3所示。所述方法至少包括:
在步骤301,根据所述晶圆图对应的像素矩阵,对所述晶圆图进行分割,得到若干包含单个晶圆缺陷的缺陷子图。所述图像分割可以使用U-Net图像分割算法实现。
在步骤305,将所述若干缺陷子图中的目标缺陷子图输入到缺陷分类模型中,得到对应的缺陷类型。所述缺陷分类模型可以是Detection Transformer模型。
在步骤306,将所述缺陷类型作为异常类型,结合所述目标缺陷子图确定对应的目标知识点。可以将知识点构造为三元组的形式,具体地,三元组的形式为(缺陷类型,[x1,x2,y1,y2],缺陷面积)。其中,(x1,y1)为缺陷分类模型输出的缺陷范围的左上角的坐标,(x2,y2)为缺陷分类模型输出的缺陷范围的右下角的坐标。
在一个更具体的实施例中,在步骤305之前,所述方法还包括:
步骤302,对任意缺陷子图进行特征提取,得到子图特征。具体地,可以使用卷积神经网络CNN或ResNet模型对缺陷子图进行特征提取。
步骤303,通过在预定特征集中进行检索和比对,确定所述缺陷子图是否属于已知缺陷类型;所述预定特征集由已知缺陷类型的图特征构成。
步骤304,在属于已知缺陷类型的情况下,将该缺陷子图确定为所述目标缺陷子图。
步骤302至步骤304用于对缺陷子图进行预分类,将缺陷子图的缺陷类型分类为已知缺陷类型和未知缺陷类型。对于缺陷类型为已知缺陷类型的缺陷子图,确定为目标缺陷子图并进入步骤305,对于缺陷类型为未知缺陷类型的缺陷子图,则直接输出交由工程师进行人工处理,不在执行后续步骤。缺陷类型为未知缺陷类型的缺陷子图在经过人工处理之后,可以对所述预定特征集中的图特征进行更新。
在又一个实施例中,所述至少一项目标数据包括,目标传感器的测量数据序列。具体地,所述测量数据序列为半导体制造过程中设备的传感器产生的原始数据,经由FDC系统处理之后得到的数据序列。一个半导体生产机台安装有很多个传感器,每个传感器监控机台上的一种参数,如温度、湿度、电压、电流、压强等,传感器输出的任意一种参数的值经由FDC系统处理之后,都会得到一组数据序列。
在本实施例中,步骤102的实现方法如图4所示。
在步骤401,将所述测量数据序列中排序在前的目标子序列使用变分自编码器VAE的编码器进行编码,得到隐空间变量。
在步骤402,使用门控循环单元GRU模型提取所述目标子序列的时间信息。
在步骤403,将所述隐空间变量和所述时间信息输入到变分自编码器VAE的解码器进行解码,得到预测数据。
在步骤404,根据所述预测数据与所述测量数据序列中接续所述目标子序列的测量数据,确定与所述目标传感器相关的异常类型。
在步骤405,生成目标知识点,其中包括,所述异常类型,所述测量数据序列所针对的生产设备编号和生产设备正在加工的晶圆的编号。所述目标知识点可以为三元组形式,具体地,三元组的形式为(异常类型,设备编号,晶圆编号)。
然后回到图1,在步骤104,根据所述目标知识点,生成半导体制造领域的知识图谱。
具体地,将所述目标知识点中的异常类型作为实体节点,添加到知识图谱中。若不存在现有知识图谱,则根据知识点集合中的知识点新建一个知识图谱。若已存在现有的知识图谱,则使用知识点集合中的知识点对现有的知识图谱进行更新。可以理解,在对现有的知识图谱进行更新的过程中,如果某一个知识点所对应的知识图谱的节点-关系边组合在知识图谱中已经存在,则不再将此知识点添加到知识图谱中,以避免不必要的重复。
为了从知识点生成知识图谱,首先在知识图谱中定义两种实体,一种为事件类实体(Entity),另一种为对象类实体(Event),以及两种关系边,对象类实体与事件类实体之间的关系边(Entity-Event,En-Ev),以及对象类实体与对象类实体之间的关系边(Entity-Entity,En-En)。
构建知识图谱的过程为,从知识图谱数据库中获取已有知识图谱,若没有则新建知识图谱。对于任意一个知识点,首先使用知识点在原始生产数据的字典序列中获取其对应的生产过程中的信息,例如生产步骤step、生产设备tool_entity、生产时间time,所在晶圆的编号wafer_id等,然后根据这些信息在图谱中搜索对应的SPC事件SPCEvent节点(如果没有则新建一个),然后根据tool_entity在图谱中搜索对应的设备实体ToolEntity节点(如果没有则新建一个),在SPCEvent节点和ToolEntity节点构建En-Ev关系边,然后在En-Ev关系边的属性信息中填入其他生产信息,例如step、time、wafer_id等。自此完成将一个知识点添加到知识图谱中的流程。
在一些可能的实施方式中,在步骤104之前,所述方法还包括:步骤103,对各项目标数据生成的知识点进行去重操作,去除其中重复的知识点。
图5为本发明实施例公开的一种端到端的知识图谱生成装置的示意性框图。所述装置500至少包括:数据获取单元501,配置为,获取半导体制造中产出的非文本形式的至少一项目标数据,各项目标数据包括数值序列或数值矩阵;知识点确定单元502,配置为,根据各项目标数据各自的类型,使用对应的异常检测模型确定目标知识点,所述目标知识点包括对应目标数据中包含的、与半导体制造相关的异常类型;图谱生成单元504,配置为,根据所述目标知识点,生成半导体制造领域的知识图谱。
在一种可能的实施方式中,所述装置还包括:去重单元503,配置为,对各项目标数据生成的知识点进行去重操作,去除其中重复的知识点。
需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者装置不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者装置所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括要素的过程、方法、物品或者装置中还存在另外的相同要素。
本领域普通技术人员可以理解实现上述实施例的全部或部分步骤可以通过硬件来完成,也可以通过程序来指令相关的硬件完成,程序可以存储于一种计算机可读存储介质中,上述提到的存储介质可以是只读存储器,磁盘或光盘等。
以上所述的具体实施方式,对本发明的目的、技术方案和有益效果进行了进一步详细说明,所应理解的是,以上所述仅为本发明的具体实施方式而已,并不用于限定本发明的保护范围,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (10)
1.一种端到端的知识图谱生成方法,包括:
获取半导体制造中产出的非文本形式的至少一项目标数据,各项目标数据包括数值序列或数值矩阵;
根据各项目标数据各自的类型,使用对应的异常检测模型确定目标知识点,所述目标知识点包括对应目标数据中包含的、与半导体制造相关的异常类型;
根据所述目标知识点,生成半导体制造领域的知识图谱。
2.根据权利要求1所述的方法,其特征在于,所述至少一项目标数据包括:统计过程控制SPC数据、晶圆图数据和故障检测与分类FDC数据。
3.根据权利要求2所述的方法,其特征在于,所述根据各项目标数据各自的类型,使用对应的异常检测模型确定目标知识点,包括:
根据各项目标数据各自的类型,使用对应的编码方式对所述目标数据进行编码,得到编码数据;
将所述编码数据输入对应的异常检测模型,输出得到所述目标知识点。
4.根据权利要求1所述的方法,其特征在于,所述目标知识点为三元组的形式,所述三元组包括所述异常类型作为一个元素。
5.根据权利要求1所述的方法,其特征在于,所述至少一项目标数据包括统计过程控制SPC数据,其形成数值序列;所述根据各项目标数据各自的类型,使用对应的异常检测模型确定目标知识点,包括:
对所述数值序列的序列片段进行特征提取与位置嵌入,得到特征向量序列;
将所述特征向量序列输入到Transformer模型中,得到异常类型和异常相对位置;
根据所述序列片段在所述数值序列中的位置,确定异常开始位置和异常结束位置;
将所述异常类型、异常开始位置和异常结束位置的三元组,作为对应的目标知识点。
6.根据权利要求1所述的方法,其特征在于,所述至少一项目标数据包括晶圆图数据;所述根据各项目标数据各自的类型,使用对应的异常检测模型确定目标知识点,包括:
根据所述晶圆图对应的像素矩阵,对所述晶圆图进行分割,得到若干包含单个晶圆缺陷的缺陷子图;
将所述若干缺陷子图中的目标缺陷子图输入到缺陷分类模型中,得到对应的缺陷类型;
将所述缺陷类型作为异常类型,结合所述目标缺陷子图确定对应的目标知识点。
7.根据权利要求6所述的方法,其特征在于,在将所述若干缺陷子图中的目标缺陷子图输入到缺陷分类模型中之前,还包括:
对任意缺陷子图进行特征提取,得到子图特征;
通过在预定特征集中进行检索和比对,确定所述缺陷子图是否属于已知缺陷类型;所述预定特征集由已知缺陷类型的图特征构成;
在属于已知缺陷类型的情况下,将该缺陷子图确定为所述目标缺陷子图。
8.根据权利要求1所述的方法,其特征在于,所述至少一项目标数据包括,目标传感器的测量数据序列;所述根据各项目标数据各自的类型,使用对应的异常检测模型确定目标知识点,包括:
将所述测量数据序列中排序在前的目标子序列使用变分自编码器VAE的编码器进行编码,得到隐空间变量;使用门控循环单元GRU模型提取所述目标子序列的时间信息;将所述隐空间变量和所述时间信息输入到变分自编码器VAE的解码器进行解码,得到预测数据;
根据所述预测数据与所述测量数据序列中接续所述目标子序列的测量数据,确定与所述目标传感器相关的异常类型;
生成目标知识点,其中包括,所述异常类型,所述测量数据序列所针对的生产设备编号和生产设备正在加工的晶圆的编号。
9.根据权利要求1所述的方法,其特征在于,在所述根据所述目标知识点,生成知识图谱之前,所述方法还包括:
对各项目标数据生成的知识点进行去重操作,去除其中重复的知识点。
10.根据权利要求1所述的方法,其特征在于,根据所述目标知识点,生成半导体制造领域的知识图谱,包括:
将所述目标知识点中的异常类型作为实体节点,添加到知识图谱中。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310054900.3A CN116502714A (zh) | 2023-02-03 | 2023-02-03 | 一种端到端的知识图谱生成方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310054900.3A CN116502714A (zh) | 2023-02-03 | 2023-02-03 | 一种端到端的知识图谱生成方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116502714A true CN116502714A (zh) | 2023-07-28 |
Family
ID=87327244
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310054900.3A Pending CN116502714A (zh) | 2023-02-03 | 2023-02-03 | 一种端到端的知识图谱生成方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116502714A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117435980A (zh) * | 2023-12-21 | 2024-01-23 | 国网浙江省电力有限公司 | 基于小样本学习的海岛光伏智能运维状态分析方法 |
-
2023
- 2023-02-03 CN CN202310054900.3A patent/CN116502714A/zh active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117435980A (zh) * | 2023-12-21 | 2024-01-23 | 国网浙江省电力有限公司 | 基于小样本学习的海岛光伏智能运维状态分析方法 |
CN117435980B (zh) * | 2023-12-21 | 2024-04-12 | 国网浙江省电力有限公司 | 基于小样本学习的海岛光伏智能运维状态分析方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11301759B2 (en) | Detective method and system for activity-or-behavior model construction and automatic detection of the abnormal activities or behaviors of a subject system without requiring prior domain knowledge | |
Colombo et al. | Learning high-dimensional directed acyclic graphs with latent and selection variables | |
CN111435366A (zh) | 设备故障诊断方法、装置和电子设备 | |
CN106164795B (zh) | 用于分类报警的优化方法 | |
CN113255333A (zh) | 用于神经语言行为识别系统的感知联想记忆 | |
CN116090558A (zh) | 一种基于spc数值序列数据生成知识点的方法 | |
CN116010485B (zh) | 一种动态周期时序的无监督异常检测方法 | |
CN110968692B (zh) | 一种文本分类方法及系统 | |
CN116247824B (zh) | 电力设备的控制方法及其系统 | |
CN116502714A (zh) | 一种端到端的知识图谱生成方法 | |
CN112966088B (zh) | 未知意图的识别方法、装置、设备及存储介质 | |
CN110889260B (zh) | 用于侦测工艺参数的方法及装置、电子设备和计算机可读介质 | |
US20230221684A1 (en) | Explaining Machine Learning Output in Industrial Applications | |
CN116361147A (zh) | 测试用例根因定位方法及其装置、设备、介质、产品 | |
CN116910592B (zh) | 日志检测方法、装置、电子设备及存储介质 | |
CN117909864A (zh) | 一种电力故障预测系统及方法 | |
CN113313134A (zh) | 集群故障修复方法及其模型训练方法、装置及服务器 | |
CN116720079A (zh) | 基于多特征融合的风力发电机故障模式识别方法及系统 | |
CN114494711A (zh) | 一种图像特征的提取方法、装置、设备及存储介质 | |
CN116635843A (zh) | 分析工业工厂的日志文件的设备、计算平台和方法 | |
CN115185920A (zh) | 一种日志类型的检测方法、装置及设备 | |
CN111680572B (zh) | 一种电网运行场景动态判定方法及系统 | |
CN116451786A (zh) | 一种基于单变量时序数据生成知识点的方法 | |
Villena Toro et al. | Automated and customized cad drawings by utilizing machine learning algorithms: A case study | |
CN117439800B (zh) | 一种网络安全态势预测方法、系统及设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |