CN113674235A - 一种基于主动熵采样和模型校准的低代价光刻热点检测方法 - Google Patents

一种基于主动熵采样和模型校准的低代价光刻热点检测方法 Download PDF

Info

Publication number
CN113674235A
CN113674235A CN202110934335.0A CN202110934335A CN113674235A CN 113674235 A CN113674235 A CN 113674235A CN 202110934335 A CN202110934335 A CN 202110934335A CN 113674235 A CN113674235 A CN 113674235A
Authority
CN
China
Prior art keywords
model
uncertainty
calculating
entropy
diversity
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202110934335.0A
Other languages
English (en)
Other versions
CN113674235B (zh
Inventor
罗立轩
宿淼迪
丁鸿志
翁绍鸿
陈忆鹭
邹长忠
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai Lixin Software Technology Co ltd
Original Assignee
Shanghai Lixin Software Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai Lixin Software Technology Co ltd filed Critical Shanghai Lixin Software Technology Co ltd
Priority to CN202110934335.0A priority Critical patent/CN113674235B/zh
Publication of CN113674235A publication Critical patent/CN113674235A/zh
Application granted granted Critical
Publication of CN113674235B publication Critical patent/CN113674235B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/0002Inspection of images, e.g. flaw detection
    • G06T7/0004Industrial image inspection
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/06Physical realisation, i.e. hardware implementation of neural networks, neurons or parts of neurons
    • G06N3/061Physical realisation, i.e. hardware implementation of neural networks, neurons or parts of neurons using biological neurons, e.g. biological neurons connected to an integrated circuit
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/30Subject of image; Context of image processing
    • G06T2207/30108Industrial image inspection
    • G06T2207/30141Printed circuit board [PCB]
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02PCLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
    • Y02P90/00Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
    • Y02P90/30Computing systems specially adapted for manufacturing

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Data Mining & Analysis (AREA)
  • Biomedical Technology (AREA)
  • Health & Medical Sciences (AREA)
  • General Physics & Mathematics (AREA)
  • Biophysics (AREA)
  • Molecular Biology (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • General Engineering & Computer Science (AREA)
  • Mathematical Physics (AREA)
  • General Health & Medical Sciences (AREA)
  • Computing Systems (AREA)
  • Computational Linguistics (AREA)
  • Software Systems (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Neurology (AREA)
  • Quality & Reliability (AREA)
  • Microelectronics & Electronic Packaging (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Complex Calculations (AREA)

Abstract

本发明涉及一种基于主动熵采样和模型校准的低代价光刻热点检测方法,设计了一种新颖的不确定度评估方式,能够选择具有较高不确定性的热点样本加入扩展训练集,从而有效提高模型检测的精度。在采样过程中应用了高效的多样性衡量方式,避免求解复杂的凸优化方程,与已有方法相比具有更低的计算开销和错误率。提出了一种基于熵的权重分配策略,根据信息量动态对指标进行加权,能够综合评估不确定度和多样性的因素。本发明能够实现了较好的检测精度,并有效降低了平刻模拟开销。

Description

一种基于主动熵采样和模型校准的低代价光刻热点检测方法
技术领域
本发明涉及VLSI物理设计自动化技术领域,特别是一种基于主动熵采样和模型校准的低代价光刻热点检测方法。
背景技术
随着晶体管尺寸的快速发展,日益增长的复杂性和制造问题给大规模集成电路(VLSI)产业带来了巨大的挑战。在芯片设计领域,虽然配备了分辨增强技术,但物理设计仍然苦于由于工业变化带来的制造缺陷。这些缺陷也被称为热点,在芯片设计的早期阶段需要高准确度的检测。目前最先进的热点估计器主要基于模式匹配和机器学习技术。一方面,基于模式匹配的方法很依赖模式库中已有的热点模式来识别匹配新的设计。该方法可以对相似或相同的模式进行采样,对已知的模式具有较高的检测精度,但无法检测没有见过的模式。另一方面,基于机器学习的方法优势在于强大的学习能力和对没见过模式的检测能力,但该方法需要处理误报错的问题。而目前已有将二者结合的方法也存在不能准确考虑模型的不确定性或迭代过程多样性丢失的问题。
目前卷积神经网络(CNN)在热点检测中起到越来越重要的作用,但是在芯片设计制造过程中标签数据获取的代价是比较高的。为了减轻该问题,本发明采用主动学习框架减轻对标签的需求。主动学习的一个重要步骤是筛选采样出最有用的信息到训练集,这个过程也带来了训练标签的制作成本。以往对数据采样的研究主要针对两个问题,分别是数据的不确定性和数据的多样性。
随着物理设计尺寸大小和复杂度的增加,热点检测已经成为大规模集成电路(VLSI)产业的一个重大挑战。虽然传统的模式匹配和机器学习方法已经取得了显著的进展。但是传统方法严重依靠参考布局库,导致了较高的平刻模拟成本。
发明内容
有鉴于此,本发明的目的是提供一种基于主动熵采样和模型校准的低代价光刻热点检测方法,结合主动学习框架,减轻对标签的需求。主要设计了一种新的经过校准后的不确定度衡量指标和一种多样性衡量指标,并设计了基于熵的动态加权方法,平衡两个指标的影响以达到更好的表现。
本发明采用以下方案实现:一种基于主动熵采样和模型校准的低代价光刻热点检测方法,包括以下步骤:
步骤S1:使用高斯混合模型计算样本的后验概率P,并将训练模型所用样本数据集X分为三个集合:包含20%为标记数据的原始训练集L、70%为未标记数据集U和10%为验证集V;
步骤S2:采用卷积神经网络模型,并利用N(0,0.0001)正态分布随机初始化热点检测模型神经元连接权重,并基于训练集L训练热点检测模型;
步骤S3:利用验证集V计算温度参数T,用于校准热点检测模型对未标记数据集U的检测结果,并基于校准结果选取检测结果最高的90个样例构建查询数据集Ω;
步骤S4:计算查询数据集Ω样本的不确定度和多样性指标;
步骤S5:利用基于熵的算法考虑不确定度和多样性计算最终指标,并根据指标从查询数据Ω选取指标最高的30个样本加入训练集L;
步骤S6:利用更新后的训练集L重新训练热点检测模型;
步骤S7:判断加入训练集L的样本数是否达到未标记数据集U的1/3,若满足返回训练好的热点检测模型,若不满足回到步骤S3;
步骤S8:将待检测设计方案划分成若干样例,依次输入训练好的热点检测模型进行光刻热点检测,模型检测结果超过0.5为热点。
进一步地,步骤S3中所述的计算温度参数T具体内容为:
对模型的检测结果即样本为热点的概率,进行基于温度指标T校准,计算方法如式(1)所示,其中
Figure BDA0003212140920000031
为模型对样本xi的检测结果;T为温度指标,通过计算模型在验证集V上的交叉熵损失值得到,如式(2)所示:
Figure BDA0003212140920000032
Figure BDA0003212140920000033
进一步地,步骤S4中所述不确定度指标计算如下所述:
利用参数h进行不确定度的计算,h是介于0和1之间的决策边界;优先使用热点实例和不确定的样本,热点的不确定得分要高于非热点,同时可能性接近h的点会获得更高的得分,其中σ(zi)为校准后的检测结果;不确定度计算如式(3)所示;
Figure BDA0003212140920000041
进一步地,步骤S4中所述多样性指标计算如式(4)所示:
其中xi为热点检测模型中全连接层提取的特征信息;dist为距离函数,通过距离矩阵D获得;Ω为步骤S3中构造的查询数据集;di为最终多样性指标计算得分;
Figure BDA0003212140920000042
使用特征的归一化内积表示两个样本的相似性,进而通过公式(5)表示两个样本之间的距离,构建距离矩阵D;
Figure BDA0003212140920000043
进一步地,S5中所述基于熵评估不确定度和多样性的指标如下所述:
提出一种综合评估不确定度和多样性的指标计算方法,如式(6)所示,其中w是权重,满足0<w<1且w1+w2=1;不确定度和多样性得分需要在数据集中进行归一化,表示为ui和di
si=w1×ui+w2×di(6)
式(6)中两个指标不确定度ui和多样性di的分布随着查询过程不断变化,带来不同的信息,在每次迭代中具有不同的贡献度;采用熵加权方法,根据每次迭代中指标的分散程度动态确定两个分数的权重,权重确定步骤如下所述:
步骤1:采用最大最小归一化,将步骤S4得到的不确定度矩阵与多样性矩阵的数值转换到[0,1]范围,如式(7)所示:
Figure BDA0003212140920000051
步骤2:计算得分占总分数的比例,如式(8)所示;
Figure BDA0003212140920000052
步骤3:计算熵值,如式(9)所示;
Figure BDA0003212140920000053
步骤4:计算分数对应的权重,如式(10)所示
Figure BDA0003212140920000054
步骤5:利用式(6)计算查询数据Ω每个样本的指标,选取指标最高的30个样本加入训练集L。
与现有技术相比,本发明具有以下有益效果:
(1)本发明通过计算指标熵值评估包含信息量,根据包含信息量协调不确定性和多样性对采样结果的影响以获得更好的模型。
(2)本发明开销小,收敛速度快。本发明提出的多样性衡量指标与目前已有方法相比简单许多,同时也更加充分地考虑到主动学习特性,具有更低的时间开销。
(3)本发明检测准确度高,本发明基于熵的采样方法,能够根据指标的信息量动态改变权重,充分利用不确定度和多样性指标,具有更好的检测精度。
(4)本发明能够实现了较好的检测精度,并有效降低了平刻模拟开销
附图说明
图1为本发明实施例的基于熵的采样算法流程图。
图2为本发明实施例的方法总体流程图。
具体实施方式
下面结合附图及实施例对本发明做进一步说明。
应该指出,以下详细说明都是例示性的,旨在对本申请提供进一步的说明。除非另有指明,本文使用的所有技术和科学术语具有与本申请所属技术领域的普通技术人员通常理解的相同含义。
需要注意的是,这里所使用的术语仅是为了描述具体实施方式,而非意图限制根据本申请的示例性实施方式。如在这里所使用的,除非上下文另外明确指出,否则单数形式也意图包括复数形式,此外,还应当理解的是,当在本说明书中使用术语“包含”和/或“包括”时,其指明存在特征、步骤、操作、器件、组件和/或它们的组合。
本实施例提供一种基于主动熵采样和模型校准的低代价光刻热点检测方法,包括以下步骤:
步骤S1:使用高斯混合模型计算样本的后验概率P,并将训练模型所用样本数据集X分为三个集合:包含20%为标记数据的原始训练集L、70%为未标记数据集U和10%为验证集V;本实施例提到的样本来自iccad竞赛数据集iccad2016;
步骤S2:采用卷积神经网络模型,并利用N(0,0.0001)正态分布随机初始化热点检测模型神经元连接权重,并基于训练集L训练热点检测模型;
步骤S3:利用验证集V计算温度参数T,用于校准热点检测模型对未标记数据集U的检测结果,并基于校准结果选取检测结果最高的90个样例构建查询数据集Ω;
步骤S4:计算查询数据集Ω样本的不确定度和多样性指标;
步骤S5:利用基于熵的算法考虑不确定度和多样性计算最终指标,并根据指标从查询数据Ω选取指标最高的30个样本加入训练集L;
步骤S6:利用更新后的训练集L重新训练热点检测模型;
步骤S7:判断加入训练集L的样本数是否达到未标记数据集U的1/3,若满足返回训练好的热点检测模型,若不满足回到步骤S3;
步骤S8:将待检测设计方案划分成若干样例,依次输入训练好的热点检测模型进行光刻热点检测,模型检测结果超过0.5为热点。
在本实施例中,步骤S3中所述的计算温度参数T具体内容为:
对模型的检测结果即样本为热点的概率,进行基于温度指标T校准,计算方法如式(1)所示,其中
Figure BDA0003212140920000071
为模型对样本xi的检测结果;T为温度指标,通过计算模型在验证集V上的交叉熵损失值得到,如式(2)所示:
Figure BDA0003212140920000081
Figure BDA0003212140920000082
在本实施例中,步骤S4中所述不确定度指标计算如下所述:
利用参数h进行不确定度的计算,h是介于0和1之间的决策边界;优先使用热点实例和不确定的样本,热点的不确定得分要高于非热点,同时可能性接近h的点会获得更高的得分,其中σ(zi)为校准后的检测结果;不确定度计算如式(3)所示;
Figure BDA0003212140920000083
在本实施例中,步骤S4中所述多样性指标计算如式(4)所示:
不同于目前许多复杂的多样性计算方法,本实施例提出了一种简单的多样性指标计算方法,如式(4)所示。其中xi为热点检测模型中全连接层提取的特征信息;dist为距离函数,通过距离矩阵D获得;Ω为步骤S3中构造的查询数据集;di为最终多样性指标计算得分;
Figure BDA0003212140920000084
一般方法会采用高斯核函数计算两个样本的距离,但是在本发明中,特征是通过深度神经网络自动学习的,而深度神经网络比高斯核函数有更强大的表达能力。因此在此基础上,本实施例直接使用特征的归一化内积表示两个样本的相似性,进而通过公式(5)表示两个样本之间的距离,构建距离矩阵D;相较于目前的主流方法,本发明提出的多样性计算方法更加简单有效,在降低计算成本开销的同时也具有更小的误差。
Figure BDA0003212140920000091
在本实施例中,S5中所述基于熵评估不确定度和多样性的指标如下所述:
提出一种综合评估不确定度和多样性的指标计算方法,如式(6)所示,其中w是权重,满足0<w<1且w1+w2=1;不确定度和多样性得分需要在数据集中进行归一化,表示为ui和di
si=w1×ui+w2×di (6)
式(6)中两个指标不确定度ui和多样性di的分布随着查询过程不断变化,带来不同的信息,在每次迭代中具有不同的贡献度;因此为了减少冗余信息,有效地利用两个指标,本实施例采用熵加权方法,根据每次迭代中指标的分散程度动态确定两个分数的权重,权重确定步骤如下所述:
步骤1:采用最大最小归一化,将步骤S4得到的不确定度矩阵与多样性矩阵的数值转换到[0,1]范围,如式(7)所示:
Figure BDA0003212140920000092
步骤2:计算得分占总分数的比例,如式(8)所示;
Figure BDA0003212140920000093
步骤3:计算熵值,如式(9)所示;
Figure BDA0003212140920000101
步骤4:计算分数对应的权重,如式(10)所示
Figure BDA0003212140920000102
步骤5:利用式(6)计算查询数据Ω每个样本的指标,选取指标最高的30个样本加入训练集L。
本实施例采用上述基于熵的动态加权方法,在迭代过程中根据指标分布的变化确定权重,可以避免信息丢失。例如当一个指标在查询数据集中分布较为均匀,熵值会更高。在这种情况无论为该指标分配多少权重都不会对采样有影响,因此应当分配较少的权重,由另一个指标影响采样结果。基于上述考虑,本发明设计的基于熵的动态加权方法相较于固定权重方法有明显优势,有效避免了信息的丢失。
(1)本实施例在计算指标进行采样前,设计并使用了温度参数T实现对模型输出的校准,采用以下方案实现:
首先基于高斯混合模型计算样本的后验概率P,并将训练模型所用数据集X分为三个集合:包含标记数据的原始训练集L、未标记数据集U、验证集V;并基于原始训练集L训练获得初始光刻检测模型。
对热点检测模型的输出结果进行校准方法如式(1)所示,其中
Figure BDA0003212140920000103
为模型对样本xi的检测结果;T为步骤1计算得到的温度指标,通过在验证集V上通过交叉熵损失值计算得到,如式(2)所示。
Figure BDA0003212140920000111
Figure BDA0003212140920000112
若直接使用较差的模型检测结果用于不确定度指标的计算,会导致指标的不准确,不能很好的为后期采样起到指导作用。因此本实施例在计算指标前对模型输出进行了校准操作。实际效果表明,经过本实施例校准后的检测结果会更加准确。同时,考虑到采样数据集中包含有限的热点实例,因此在采样时应更倾向采样热点。本实施例为模型校准函数引入温度参数,帮助进行热点感知。需要注意的是,模型校准只是改变判断实例是否是热点的概率,而不影响模型的输出。
(2)本实施例设计使用的不确定度指标采用以下方案实现:
不确定度指标利用参数h进行计算,h是介于0和1之间的决策边界;优先使用热点实例和不确定的样本,热点的不确定得分要高于非热点,同时可能性接近h的点会获得更高的得分,其中σ(zi)为校准后的检测结果。不确定度计算如式(3)所示;
Figure BDA0003212140920000113
在本实施例中参数h选取0.4,与传统指标计算方法相比,本实施例设计使用的不确定度计算方法在采样阶段更加倾向于选取不确定的和类似热点的样本,同时由于前期经过了校准,使得模型在热点检测任务中更具准确性和适应性。
(3)本实施例设计使用的多样性指标采用以下方案实现:
不同于目前许多复杂的多样性计算方法,本实施例提出了一种简单的多样性指标计算方法,如式(4)所示。其中xi为热点检测模型中全连接层提取的特征信息;dist为距离函数,通过距离矩阵D获得;Ω为步骤S3中构造的查询数据集;di为最终多样性指标计算得分。
Figure BDA0003212140920000121
一般方法会采用高斯核函数计算两个样本的距离,但是在本实施例中,特征是通过深度神经网络自动学习的,而深度神经网络比高斯核函数有更强大的表达能力。因此在此基础上,本实施例直接使用特征的归一化内积表示两个样本的相似性,进而通过公式(5)表示两个样本之间的距离,构建距离矩阵D。
Figure BDA0003212140920000122
若仅考虑不确定度因素,由于不确定度指标较高的样本可能位于邻近的数据空间,则会导致采样样本冗余度较高,缺乏多样性,从而导致模型性能下降。因此本实施例在计算不确定指标的同时,也引入了多样性指标,
(4)基于熵综合评估不确定度和多样性的指标采用以下方案实现:
本实施例提出一种综合评估不确定度和多样性的指标计算方法,如式(6)所示,其中w是权重,满足0<w<1且w1+w2=1;不确定度和多样性得分需要在数据集中进行归一化,表示为ui和di
si=w1×ui+w2×di (6)
式(6)中两个指标不确定度ui和多样性di的分布随着查询过程不断变化,带来不同的信息,在每次迭代中具有不同的贡献度。因此为了减少冗余信息,有效地利用两个指标,本实施例采用熵加权方法,根据每次迭代中指标的分散程度动态确定两个分数的权重,权重确定步骤如下所述:
步骤1:采用最大最小归一化,将步骤S4得到的不确定度矩阵与多样性矩阵的数值转换到[0,1]范围,如式(7)所示
Figure BDA0003212140920000131
步骤2:计算得分占总分数的比例,如式(8)所示
Figure BDA0003212140920000132
步骤3:计算熵值,如式(9)所示
Figure BDA0003212140920000133
步骤4:计算分数对应的权重,如式(10)所示
Figure BDA0003212140920000134
步骤5:利用式(6)计算查询数据Ω每个样本的指标,选取指标最高的30个样本加入训练集L。
本实施例采用上述基于熵的动态加权方法,在迭代过程中根据指标分布的变化确定权重,可以避免信息丢失。例如当一个指标在查询数据集中分布较为均匀,熵值会更高。在这种情况无论为该指标分配多少权重都不会对采样有影响,因此应当分配较少的权重,由另一个指标影响采样结果。基于上述考虑,本发明设计的基于熵的动态加权方法相较于固定权重方法有明显优势,有效避免了信息的丢失。
如图1所示,为本实施例提出的基于熵的采样算法流程,该算法是本实施例的核心步骤,是保证热点检测模型性能的关键所在。算法首先通过特别设计的不确定度指标和多样性指标计算方法获得对应指标,并利用基于熵的加权方法动态的为两个指标分配权重,平衡不同指标的影响获得更好的表现。算法的步骤说明详见说明书发明内容部分。
如图2所示为本实施例总体采样流程,描述了本实施例的整体流程。其展示了从对数据集的划分,模型的初始化和迭代学习过程。由于芯片设计制造过程中标签数据的获取的代价是比较高的,因此本实施例采用主动学习框架以减轻对标签的需求。在主动学习中,通过扩展训练集可以对模型不断地进行微调。其中第9步便是调用基于熵的采样算法对训练集进行扩展,不断让模型学习到有用的信息。算法步骤详细说明见说明书发明内容部分。
较佳的,在本实施例中,设计了一种新颖的不确定度评估方式,能够选择具有较高不确定性的热点样本加入扩展训练集,从而有效提高模型检测的精度。
在采样过程中应用了高效的多样性衡量方式,避免求解复杂的凸优化方程,与已有方法相比具有更低的计算开销和错误率。
提出了一种基于熵的权重分配策略,根据信息量动态对指标进行加权,能够综合评估不确定度和多样性的因素。
本实施例能够实现了较好的检测精度,并有效降低了平刻模拟开销,具有较高的实际意义和应用价值。
以上所述仅为本发明的较佳实施例,凡依本发明申请专利范围所做的均等变化与修饰,皆应属本发明的涵盖范围。

Claims (5)

1.一种基于主动熵采样和模型校准的低代价光刻热点检测方法,其特征在于:包括以下步骤:
步骤S1:使用高斯混合模型计算样本的后验概率P,并将训练模型所用样本数据集X分为三个集合:包含20%为标记数据的原始训练集L、70%为未标记数据集U和10%为验证集V;
步骤S2:采用卷积神经网络模型,并利用N(0,0.0001)正态分布随机初始化热点检测模型神经元连接权重,并基于训练集L训练热点检测模型;
步骤S3:利用验证集V计算温度参数T,用于校准热点检测模型对未标记数据集U的检测结果,并基于校准结果选取检测结果最高的90个样例构建查询数据集Ω;
步骤S4:计算查询数据集Ω样本的不确定度和多样性指标;
步骤S5:利用基于熵的算法考虑不确定度和多样性计算最终指标,并根据指标从查询数据Ω选取指标最高的30个样本加入训练集L;
步骤S6:利用更新后的训练集L重新训练热点检测模型;
步骤S7:判断加入训练集L的样本数是否达到未标记数据集U的1/3,若满足返回训练好的热点检测模型,若不满足回到步骤S3;
步骤S8:将待检测设计方案划分成若干样例,依次输入训练好的热点检测模型进行光刻热点检测,模型检测结果超过0.5为热点。
2.根据权利要求1所述的一种基于主动熵采样和模型校准的低代价光刻热点检测方法,其特征在于:步骤S3中所述基于温度T对热点检测模型进行校准的具体内容为:
对模型的检测结果即样本为热点的概率,进行基于温度指标T校准,计算方法如式(1)所示,其中
Figure FDA0003212140910000021
为模型对样本xi的检测结果;T为温度指标,通过计算模型在验证集V上的交叉熵损失值得到,如式(2)所示:
Figure FDA0003212140910000022
Figure FDA0003212140910000023
3.根据权利要求1所述的一种基于主动熵采样和模型校准的低代价光刻热点检测方法,其特征在于:步骤S4中所述不确定度指标计算如下所述:
利用参数h进行不确定度的计算,h是介于0和1之间的决策边界;优先使用热点实例和不确定的样本,热点的不确定得分要高于非热点,同时可能性接近h的点会获得更高的得分,其中σ(zi)为校准后的检测结果;不确定度计算如式(3)所示;
Figure FDA0003212140910000024
4.根据权利要求1所述的一种基于主动熵采样和模型校准的低代价光刻热点检测方法,其特征在于:步骤S4中所述多样性指标计算如式(4)所示:
其中xi为热点检测模型中全连接层提取的特征信息;dist为距离函数,通过距离矩阵D获得;Ω为步骤S3中构造的查询数据集;di为最终多样性指标计算得分;
Figure FDA0003212140910000031
使用特征的归一化内积表示两个样本的相似性,进而通过公式(5)表示两个样本之间的距离,构建距离矩阵D;
Figure FDA0003212140910000032
5.根据权利要求1所述的一种基于主动熵采样和模型校准的低代价光刻热点检测方法,其特征在于:S5中所述基于熵评估不确定度和多样性的指标如下所述:
提出一种综合评估不确定度和多样性的指标计算方法,如式(6)所示,其中w是权重,满足0<w<1且w1+w2=1;不确定度和多样性得分需要在数据集中进行归一化,表示为ui和di
si=w1×ui+w2×di (6)
式(6)中两个指标不确定度ui和多样性di的分布随着查询过程不断变化,带来不同的信息,在每次迭代中具有不同的贡献度;采用熵加权方法,根据每次迭代中指标的分散程度动态确定两个分数的权重,权重确定步骤如下所述:
步骤1:采用最大最小归一化,将步骤S4得到的不确定度矩阵与多样性矩阵的数值转换到[0,1]范围,如式(7)所示:
Figure FDA0003212140910000033
步骤2:计算得分占总分数的比例,如式(8)所示;
Figure FDA0003212140910000041
步骤3:计算熵值,如式(9)所示;
Figure FDA0003212140910000042
步骤4:计算分数对应的权重,如式(10)所示
Figure FDA0003212140910000043
步骤5:利用式(6)计算查询数据Ω每个样本的指标,选取指标最高的30个样本加入训练集L。
CN202110934335.0A 2021-08-15 2021-08-15 一种基于主动熵采样和模型校准的低代价光刻热点检测方法 Active CN113674235B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110934335.0A CN113674235B (zh) 2021-08-15 2021-08-15 一种基于主动熵采样和模型校准的低代价光刻热点检测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110934335.0A CN113674235B (zh) 2021-08-15 2021-08-15 一种基于主动熵采样和模型校准的低代价光刻热点检测方法

Publications (2)

Publication Number Publication Date
CN113674235A true CN113674235A (zh) 2021-11-19
CN113674235B CN113674235B (zh) 2023-10-10

Family

ID=78542881

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110934335.0A Active CN113674235B (zh) 2021-08-15 2021-08-15 一种基于主动熵采样和模型校准的低代价光刻热点检测方法

Country Status (1)

Country Link
CN (1) CN113674235B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117232317A (zh) * 2023-11-16 2023-12-15 山东众诚风凯科技有限公司 换热机组远程控制方法和远程控制系统

Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20130031518A1 (en) * 2011-07-26 2013-01-31 Juan Andres Torres Robles Hybrid Hotspot Detection
US8464194B1 (en) * 2011-12-16 2013-06-11 International Business Machines Corporation Machine learning approach to correct lithographic hot-spots
CN103885285A (zh) * 2014-03-20 2014-06-25 上海华力微电子有限公司 一种针对光刻版图接触孔热点的检查方法
US20160327605A1 (en) * 2015-05-08 2016-11-10 Kla-Tencor Corporation Model-Based Hot Spot Monitoring
CN109242108A (zh) * 2013-05-30 2019-01-18 美商新思科技有限公司 使用多机器学习核的光刻热点检测
CN110475505A (zh) * 2017-01-27 2019-11-19 阿特瑞斯公司 利用全卷积网络的自动分割
CN111310407A (zh) * 2020-02-10 2020-06-19 上海集成电路研发中心有限公司 基于机器学习进行逆向光刻最优特征向量设计的方法
CN111428355A (zh) * 2020-03-18 2020-07-17 东南大学 一种电力负荷数字统计智能综合的建模方法
CN112434809A (zh) * 2021-01-26 2021-03-02 成都点泽智能科技有限公司 基于主动学习的模型训练方法、装置及服务器
CN112561031A (zh) * 2020-11-17 2021-03-26 中国科学院信息工程研究所 基于人工智能的模型搜索方法、装置及电子设备
CN113222031A (zh) * 2021-05-19 2021-08-06 浙江大学 基于联邦个性化学习的光刻热区检测方法

Patent Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20130031518A1 (en) * 2011-07-26 2013-01-31 Juan Andres Torres Robles Hybrid Hotspot Detection
US8464194B1 (en) * 2011-12-16 2013-06-11 International Business Machines Corporation Machine learning approach to correct lithographic hot-spots
CN109242108A (zh) * 2013-05-30 2019-01-18 美商新思科技有限公司 使用多机器学习核的光刻热点检测
CN103885285A (zh) * 2014-03-20 2014-06-25 上海华力微电子有限公司 一种针对光刻版图接触孔热点的检查方法
US20160327605A1 (en) * 2015-05-08 2016-11-10 Kla-Tencor Corporation Model-Based Hot Spot Monitoring
CN110475505A (zh) * 2017-01-27 2019-11-19 阿特瑞斯公司 利用全卷积网络的自动分割
CN111310407A (zh) * 2020-02-10 2020-06-19 上海集成电路研发中心有限公司 基于机器学习进行逆向光刻最优特征向量设计的方法
CN111428355A (zh) * 2020-03-18 2020-07-17 东南大学 一种电力负荷数字统计智能综合的建模方法
CN112561031A (zh) * 2020-11-17 2021-03-26 中国科学院信息工程研究所 基于人工智能的模型搜索方法、装置及电子设备
CN112434809A (zh) * 2021-01-26 2021-03-02 成都点泽智能科技有限公司 基于主动学习的模型训练方法、装置及服务器
CN113222031A (zh) * 2021-05-19 2021-08-06 浙江大学 基于联邦个性化学习的光刻热区检测方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
YOUNG HAM等: "Accurate Mask Model Approaches for Wafer Hot Spot Prepdition and Verificaition", 《2020 CHINA SEMICONDUCTOR TECHNOLOGY INTERNATIONAL CONFERENCE (CSTIC)》 *
施伟杰;王向朝;张冬青;王帆;: "基于人工神经网络权值优化的投影光刻机像质校正灵敏矩阵的计算方法", 中国激光, no. 04 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117232317A (zh) * 2023-11-16 2023-12-15 山东众诚风凯科技有限公司 换热机组远程控制方法和远程控制系统
CN117232317B (zh) * 2023-11-16 2024-02-13 山东众诚风凯科技有限公司 换热机组远程控制方法和远程控制系统

Also Published As

Publication number Publication date
CN113674235B (zh) 2023-10-10

Similar Documents

Publication Publication Date Title
CN112784881B (zh) 网络异常流量检测方法、模型及系统
CN109299462B (zh) 基于多维卷积特征的短文本相似度计算方法
CN109617909A (zh) 一种基于smote和bi-lstm网络的恶意域名检测方法
TWI240216B (en) Pattern recognition method by reducing classification error
CN114841257B (zh) 一种基于自监督对比约束下的小样本目标检测方法
CN111126482A (zh) 一种基于多分类器级联模型的遥感影像自动分类方法
CN110110754B (zh) 基于代价局部泛化误差的不平衡问题的分类方法
CN108877947B (zh) 基于迭代均值聚类的深度样本学习方法
CN114169442B (zh) 基于双原型网络的遥感图像小样本场景分类方法
CN110225030A (zh) 基于rcnn-spp网络的恶意域名检测方法及系统
CN106203483A (zh) 一种基于语义相关多模态映射方法的零样本图像分类方法
CN110363230A (zh) 基于加权基分类器的stacking集成污水处理故障诊断方法
CN108879732A (zh) 电力系统暂态稳定评估方法及装置
CN110210625A (zh) 基于迁移学习的建模方法、装置、计算机设备和存储介质
CN111833310A (zh) 一种基于神经网络架构搜索的表面缺陷分类方法
CN111815582B (zh) 改进背景先验和前景先验的二维码区域检测方法
CN114491082A (zh) 基于网络安全应急响应知识图谱特征提取的预案匹配方法
CN113674235B (zh) 一种基于主动熵采样和模型校准的低代价光刻热点检测方法
CN111339258B (zh) 基于知识图谱的大学计算机基础习题推荐方法
CN116720519B (zh) 一种苗医药命名实体识别方法
CN112465016A (zh) 基于最优劣距的部分多标记学习方法
CN111860591A (zh) 基于间隔自适应特征选择融合的宫颈细胞图像分类方法
CN111489792A (zh) 一种基于半监督学习框架的t细胞受体序列分类方法
CN116934470A (zh) 一种基于聚类采样和元集成的金融交易风险评估方法
CN112784587B (zh) 一种基于多模型融合的文本相似性度量方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant