CN113312964A - 杂质检测模型的训练方法、检测方法、设备和介质 - Google Patents
杂质检测模型的训练方法、检测方法、设备和介质 Download PDFInfo
- Publication number
- CN113312964A CN113312964A CN202110405271.5A CN202110405271A CN113312964A CN 113312964 A CN113312964 A CN 113312964A CN 202110405271 A CN202110405271 A CN 202110405271A CN 113312964 A CN113312964 A CN 113312964A
- Authority
- CN
- China
- Prior art keywords
- impurity
- impurities
- training
- neural network
- predicted
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 239000012535 impurity Substances 0.000 title claims abstract description 198
- 238000012549 training Methods 0.000 title claims abstract description 99
- 238000001514 detection method Methods 0.000 title claims abstract description 61
- 238000000034 method Methods 0.000 title claims abstract description 57
- 230000003287 optical effect Effects 0.000 claims abstract description 78
- 238000013528 artificial neural network Methods 0.000 claims abstract description 71
- 230000006870 function Effects 0.000 claims description 26
- 238000012360 testing method Methods 0.000 claims description 24
- 238000013135 deep learning Methods 0.000 claims description 19
- 238000012544 monitoring process Methods 0.000 claims description 13
- 230000008569 process Effects 0.000 claims description 13
- 239000000356 contaminant Substances 0.000 claims description 10
- 238000013527 convolutional neural network Methods 0.000 description 12
- 238000010586 diagram Methods 0.000 description 12
- 230000005540 biological transmission Effects 0.000 description 7
- 210000002569 neuron Anatomy 0.000 description 6
- 230000004913 activation Effects 0.000 description 5
- 238000004364 calculation method Methods 0.000 description 4
- 230000008901 benefit Effects 0.000 description 3
- 238000004891 communication Methods 0.000 description 3
- 230000008878 coupling Effects 0.000 description 3
- 238000010168 coupling process Methods 0.000 description 3
- 238000005859 coupling reaction Methods 0.000 description 3
- 230000007423 decrease Effects 0.000 description 3
- 230000010355 oscillation Effects 0.000 description 3
- 238000012545 processing Methods 0.000 description 3
- 230000007547 defect Effects 0.000 description 2
- 238000005315 distribution function Methods 0.000 description 2
- 230000005684 electric field Effects 0.000 description 2
- 238000002474 experimental method Methods 0.000 description 2
- 238000011176 pooling Methods 0.000 description 2
- 238000013519 translation Methods 0.000 description 2
- 239000013598 vector Substances 0.000 description 2
- 230000000052 comparative effect Effects 0.000 description 1
- 238000011109 contamination Methods 0.000 description 1
- 239000013078 crystal Substances 0.000 description 1
- 239000006185 dispersion Substances 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 239000012788 optical film Substances 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000004088 simulation Methods 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 230000003595 spectral effect Effects 0.000 description 1
- 238000004611 spectroscopical analysis Methods 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- 238000000844 transformation Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2218/00—Aspects of pattern recognition specially adapted for signal processing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2415—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on parametric or probabilistic models, e.g. based on likelihood ratio or false acceptance rate versus a false rejection rate
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2218/00—Aspects of pattern recognition specially adapted for signal processing
- G06F2218/12—Classification; Matching
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Artificial Intelligence (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Life Sciences & Earth Sciences (AREA)
- Evolutionary Computation (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Computing Systems (AREA)
- Biomedical Technology (AREA)
- General Health & Medical Sciences (AREA)
- Computational Linguistics (AREA)
- Biophysics (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Molecular Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Health & Medical Sciences (AREA)
- Evolutionary Biology (AREA)
- Signal Processing (AREA)
- Probability & Statistics with Applications (AREA)
- Investigating Or Analysing Materials By Optical Means (AREA)
Abstract
本申请涉及杂质检测模型的训练方法、检测方法、设备和介质,训练方法包括:将含有杂质的训练样本输入待训练的神经网络,得到训练样本的杂质位置的输出结果,其中训练样本包括杂质的已知位置信息和已知光学信号,输出结果包含训练样本的杂质的预测位置和预测光学信号;将预测光学信号和预测位置进行分类,得到第一概率分布;将杂质的已知位置信息和已知光学信号进行分类,形成已知杂质的已知分类数据,并将已知分类数据进行one‑hot编码,得到第二概率分布;利用第一概率分布和第二概率分布,计算损失函数;调整神经网络的网格参数以缩小损失函数。神经网络稳定性强,准确性强。
Description
技术领域
本申请涉及检测技术领域,特别是涉及杂质检测模型的训练方法、检测方法、 设备和介质。
背景技术
精密的光学元器件是现代光学实验和激光应用中不可或缺的组成部分,例如光学晶体、分光镜、光学玻片等广泛应用于量子光学以及基于光子的量子计算、量子 通讯实验中;在日常生活中,小到手机镜头、液晶屏幕,大到卫星导航,激光定位 都离不开光学薄膜等光学器件的身影。然而,精密光学器件的表面往往是最重要但 又最容易受到损伤的地方。已有大量的研究表明,光学表面的杂质和缺陷不但会大 大影响光学器件的工作性能,更进一步,在大功率的激光应用中,具有杂质和缺陷 的光学表面更加容易受到激光损伤,从而极大地减小光学器件的使用寿命。因而, 对光学表面的杂质检测是一个重要的研究课题。
发明内容
本申请提供了杂质检测模型的训练方法、检测方法、设备和介质,能够提高检 测光在表面杂质的精度和准确性。
为解决上述技术问题,本申请提供了一种深度学习光学表面杂质检测模型的训练方法,包括:
将含有杂质的训练样本输入待训练的神经网络,得到训练样本的杂质位置的输出结果,其中训练样本包括杂质的已知位置信息和已知光学信号,输出结果包含训 练样本的杂质的预测位置和预测光学信号;
将预测光学信号和预测位置进行分类,得到第一概率分布;
将杂质的已知位置信息和已知光学信号进行分类,形成已知杂质的已知分类数据,并将已知分类数据进行one-hot编码,得到第二概率分布;
利用第一概率分布和第二概率分布,计算损失函数;
调整神经网络的网格参数以缩小损失函数。
本申请还包括第二种技术方案,一种神经网络的检测方法,包括:
将含有杂质的检测样本输入神经网络,得到检测样本的杂质位置的检测信息, 其中,检测样本包括检测样本的杂质位置的已知信息;
比较杂质位置检测信息和检测样本的杂质位置的已知信息,获得杂质位置的准确率;
确定杂质位置准确率大于预设值,则确定神经网络具有泛化能力。
本申请还包括第三种技术方案,一种深度学习光学表面杂质检测方法,包括:
将介质输入神经网络,其中,神经网络是利用权利要求1-5中任一项的方法训 练得到的;
判断介质表面是否含有杂质;
若是,确定介质表面的杂质所在位置。
本申请还包括第四种技术方案,一种电子设备,包括相互耦接的存储器和处理器,处理器用于执行存储器存储的计算机指令以实现上述的方法。
本申请还包括第五种技术方案,一种存储介质,存储有指令,指令被执行时实 现如上述的方法。
有益效果:
本申请实施例的训练方法,通过将预测光学信号和预测位置进行分类,以及杂 质的已知位置信息和已知光学信号进行分类,使得将坐标z0的回归问题转化为了一 个离散坐标zc的分类问题,使得神经网络的训练稳定性更强,准确性更强。
附图说明
图1a是本申请深度学习光学表面杂质检测理论模型一实施例的示意图;
图1b本申请实施例的探测信号强度经过光学表面一个小杂质后的光强度分布图;
图2是本申请实施例的卷积神经网络示意图;
图3a是本申请深度学习光学表面杂质检测模型的训练过程中损失函数随epoch的变化一实施例的示意图;
图3b是本申请深度学习光学表面杂质检测模型的训练过程中精确度随epoch 的变化一实施例的示意图;
图3c是本申请实施例反射信号训练出的网络的预测概率分布图;
图3d本申请实施例透射信号训练出的网络的预测概率分布图;
图4a本申请实施例神经网络的检测方法中杂质大小泛化的泛化准确率图;
图4b本申请实施例神经网络的检测方法中杂质大小泛化的典型数据下的预测 概率图;
图4c本申请实施例神经网络的检测方法中杂质折射率泛化的泛化准确率图;
图4d本申请实施例神经网络的检测方法中杂质折射率泛化的典型数据下的预 测概率图;
图4e本申请实施例神经网络的检测方法中杂质形状泛化的泛化准确率图;
图4f本申请实施例神经网络的检测方法中杂质形状泛化的典型数据下的预测 概率图;
图5是全连接神经网络示意图;
图6a是本申请两种神经网络的反射信号训练下网络杂质大小的泛化准确率图;
图6b是本申请两种神经网络的透射信号训练下网络杂质大小的泛化准确率图;
图6c是本申请两种神经网络的反射信号训练下网络杂质折射率的泛化准确率图;
图6d是本申请两种神经网络的透射信号训练下网络杂质折射率的泛化准确率图;
图6e是本申请两种神经网络的反射信号训练下网络杂质形状的泛化准确率图;
图6f是本申请两种神经网络的透射信号训练下网络杂质形状的泛化准确率图;
图7a是本申请实施例中凹杂质深度学习光学表面杂质检测模型的训练过程中 损失函数随epoch的变化一实施例的示意图;
图7b是,本申请实施例中凹杂质的杂质大小的泛化准确率图;
图8是本申请深度学习光学表面杂质检测模型的训练方法一实施例的流程示意图;
图9是本申请深度学习光学表面杂质检测模型的训练方法另一实施例的流程示意图
图10是本申请神经网络的检测方法一实施例的流程示意图;
图11是本申请深度学习光学表面杂质检测方法一实施例的流程示意图;
图12是本申请电子设备一实施例的结构示意图;
图13是申请存储介质一实施例的结构示意图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、 完整地描述,显然,所描述的实施例仅是本申请的一部分实施例,而不是全部的实 施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下 所获得的所有其他实施例,都属于本申请保护的范围。
本申请中的术语“第一”、“第二”、“第三”仅用于描述目的,而不能理解为指 示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、 “第二”、“第三”的特征可以明示或者隐含地包括至少一个该特征。本申请的描述 中,“多个”的含义是至少两个,例如两个,三个等,除非另有明确具体的限定。本 申请实施例中所有方向性指示(诸如上、下、左、右、前、后……)仅用于解释在某 一特定姿态(如附图所示)下各部件之间的相对位置关系、运动情况等,如果该特定 姿态发生改变时,则该方向性指示也相应地随之改变。此外,术语“包括”和“具 有”以及它们任何变形,意图在于覆盖不排他的包含。例如包含了一系列步骤或单 元的过程、方法、系统、产品或设备没有限定于已列出的步骤或单元,而是可选地 还包括没有列出的步骤或单元,或可选地还包括对于这些过程、方法、产品或设备 固有的其它步骤或单元。
在本文中提及“实施例”意味着,结合实施例描述的特定特征、结构或特性可 以包含在本申请的至少一个实施例中。在说明书中的各个位置出现该短语并不一定 均是指相同的实施例,也不是与其它实施例互斥的独立的或备选的实施例。本领域 技术人员显式地和隐式地理解的是,在不冲突的情况下,本文所描述的实施例可以 与其它实施例相结合。
本申请实施例中,深度学习光学表面杂质检测理论模型的建立具体如下:
一束沿z方向极化的脉冲激光,沿x方向垂直照射某光学介质,介质的厚度为L, 如图1a所示。介质表面某处有一凸起的杂质,杂质的尺寸为l。脉冲激光的电场强 度E(r,t)满足波动方程:
其中,r为空间坐标,c为光速,ε(r)为相对介电常数,其在介质内外的分布为
ε(r)与光学折射率n的关系为为简化理论计算,本申请实施例约束杂质仅在z方向移动,并考虑场强E(r,t)在y方向为均匀分布,由此可将方程(1.1)约化为 {x,z}的二维波动方程。接下来,本申请实施例利用欧拉-傅里叶谱法对方程(1.1) 进行数值求解,演化方程的初始条件为
其中初始电场E(x,z,t=0)为一系列沿x方向波矢为km的平面波的线性叠加,其在z 方向上为高斯分布,σ为高斯波包宽度。对于方程(1.1)所描述的光学系统有以下的 长度尺度关系:σLλl,即高斯波包的宽度σ和介质的厚度L要远大于电磁 波波长λ和杂质尺寸l,而空间差分离散的最小单元长度Δ又要小于以上的所有长度 尺度,使得本申请实施例数值计算量巨大。在实际计算过程中,本申请实施例选取 Δ=80nm为长度单位,并取σ=2L=100Δ,杂质边长l可在Δ到5Δ之间变化,即杂质 尺寸在55 275nm之间变化。系统总的求解空间为x∈[-256Δ,256Δ], z∈[-512Δ,512Δ]。为方便计算本申请实施例选择入射光为若干个波矢为km的平面 波的叠加,这里km=2πm/512Δ,其中m∈[40,60]为整数。由此可知入射光的波长 范围在可见光范围λ≈470 700nm,而光脉冲宽度由1/ωSD表示,其中表示N=21个频率模式谱分布的标准差,在所取模式下可 知脉冲宽度约为0.5×10-15s,即0.5飞秒。如此选择波包的另一个好处是可以在系统 演化时间内将信号不失真地从源端传送到接收端。以上系统参数的选择可以将计算 量控制在合理的范围之内。
当探测脉冲经过介质反射和透射后,本申请实施例中,在介质前和后分别收集 反射光(R)和透射光(T)的强度信号∝|E(x,z,t)|2,并对其在x方向进行积分从而得到 沿z方向的分布IR,T(z)。图1b展示了探测信号强度(实线)经过光学表面一个小杂 质l=Δ衍射后IR,T(z)的分布,其中,图1b中实线表示入射光信号,虚线和点划线 分别表示反射光IR和透射光IT。从图1b中可以看出,初始脉冲分布I为一个标准 的高斯分布,而反射和透射信号经过杂质衍射后强度信号会形成空间振荡。其中包 含了杂质信息,对其解码可以获得杂质的位置信息。但是,很显然,通过简单观察 振荡曲线不足以来对杂质位置进行准确定位。本申请实施例是利用神经网络来学习 杂质位置与经过该杂质衍射后的光强分布之间的函数关系,从而让网络学到从强度 信号IR,T中提取杂质位置信息的能力。
本申请一实施例中,如图8所示,提供一种深度学习光学表面杂质检测模型的 训练方法,包括:
S110:将含有杂质的训练样本输入待训练的神经网络,得到训练样本的杂质位 置的输出结果,其中训练样本包括杂质的已知位置信息和已知光学信号,输出结果 包含训练样本的杂质的预测位置和预测光学信号。
本申请实施例中,通过上述数值求解波动方程的方法,首先生成训练数据集训练数据选用的杂质参数为边长l=4Δ的方形杂 质,杂质折射率为G中不同的数据是通过改变杂质位置得到的, 其中每一组数据包含光学脉冲信号IR,T(z)和相应的杂质位置zc。本申请实施例的训 练数据集包含了含有有杂质的训练样本已知位置信息和已知光学信号。
本申请实施例中,训练数据集Gtrain训练数据集的大小为Ntrain=800,本申请实 施例中,神经网络为卷积神经网络(CNN)。如图2所示,神经网络由输入层11(Input layer)、卷积层12(Convolutional layers)、Flatten层13(Flatten layer)、全 连接层14(Denselayer)以及输出层15(Output layer)构成,其中卷积层12共三层, 深度分别为10、20和50,卷积核尺寸为20,选取"Relu"为激活函数,每一层卷积 层12之后添加一层平均池化层用以缩小神经元的个数,池化尺寸为2;全连接层神 经元个数为48,激活函数同样为"Relu"函数;输出层神经元个数为32,激活函数 为"softmax"函数从而将输出转为概率分布P(zc|I)。神经网络内部总的可训练参数 约为5.7×105个。
S120:将预测光学信号和预测位置进行分类,得到第一概率分布。
本申请实施例中,将预测位置信息依据预设数量的类别转化为预测位置的类 号,并将预测光学信号对应预测位置的类号所对应的光学强度信号,得到第一概率 分布。
本申请实施例中,约束杂质的质心z0在探测光信号强度较大的范围内 z0∈[-64Δ,64Δ],然后将z0的坐标范围进一步划分为了32个类,每个类对应一个整 数的类号zc∈[1,32],其与杂质的真实坐标z0之间的关系为zc=int[z0/4Δ]+17,其 中int表示取整,而数据集G正是由强度信号与杂质类号所构成的数据对以上仅为举例,在其他实施例中,z0的坐标范围进划分为了其他数量 个类。
本申请实施例中,神经网络的输入为IR,T(z),而输出为一个定义在类号zc上的 概率分布PR,T(zc|I),其反映了网络对指定的输入信号I进行分析后所作出的分类预 测概率分布。
S130:将杂质的已知位置信息和已知光学信号进行分类,形成已知杂质的已知 分类数据,并将已知分类数据进行one-hot编码,得到第二概率分布。
本申请实施例中,约束杂质在神经网络的探测光信号强度范围内,并将杂质的 位置范围划分为预设数量的类别。
将已知位置信息依据预设数量的类别转化为已知位置的类号,并将已知光学信号对应已知位置的类号所对应的光学强度信号,获得已知杂质的已知分类数据,分 类数据包括已知位置的类号和对应的光学强度。
杂质已知分类数据中杂质真实类号zc进行one-hot编码得到第二概率分布,其中,Qi(zc|I)是第二概率分布函数。
S140:利用第一概率分布和第二概率分布,计算损失函数。
本申请实施例选用的损失函数为交叉熵
其中Qi(zc|I)是杂质已知分类数据中杂质真实类号zc的one-hot编码第二概率分布 函数。交叉熵本质反映了网络预测第一概率分布P与真实第二概率分布Q之间的相 对距离,交叉熵越小,网络的预测越接近真实值。
此外,在训练过程中本申请实施例通过监视平均精确度(VA)来衡量网络训练是否有效。VA的定义为
其中
从定义上可以看出来,ai表示对于给定的测试数据i,其P(zc|I)中概率最大的类与杂质真实类是否一致,如果一致则贡献1,否则没有贡献。VA是ai对所有测试数据 的平均。因此对于训练而言,损失函数L下降的同时伴随着监视平均精确度VA的提 升。
S150:调整神经网络的网格参数以缩小损失函数。
本申请实施例中,如图3a所示,呈现了训练过程中损失函数L随训练epoch(时 期)数的变化曲线,其中epoch被定义为所有训练数据整体流过神经网络的次数。图 3a中,实线和虚线分别为独立利用反射信号IR和透射信号IT作为网络输入的训练 曲线。结果表明,网络可以从IR或IT中学习提取杂质位置信息的能力,并且在约为40个epoch时得以收敛,具体表现为损失函数L下降至零附近,网络收敛标志着训 练完成。
本申请实施例的训练方法,通过将预测光学信号和预测位置进行分类,以及杂 质的已知位置信息和已知光学信号进行分类,使得将坐标z0的回归问题转化为了一 个离散坐标zc的分类问题,使得神经网络的训练稳定性更强,准确性更强。
在本申请另一实施例中,如图9所示,一种深度学习光学表面杂质检测模型的 训练方法,包括:
S110:将含有杂质的训练样本输入待训练的神经网络,得到训练样本的杂质位 置的输出结果,其中训练样本包括杂质的已知位置信息和已知光学信号,输出结果 包含训练样本的杂质的预测位置和预测光学信号。
同上述实施例,在此不再赘述。
S120:将预测光学信号和预测位置进行分类,得到第一概率分布。
同上述实施例,在此不再赘述。
S130:将杂质的已知位置信息和已知光学信号进行分类,形成已知杂质的已知 分类数据,并将已知分类数据进行one-hot编码,得到第二概率分布。
S140:利用第一概率分布和第二概率分布,计算损失函数。
同上述实施例,在此不再赘述。
S150:调整神经网络的网格参数以缩小损失函数。
同上述实施例,在此不再赘述。
S160:监督训练过程,获得监督测试数据。
本申请实施例中,监督训练过程,获得监视精确度。
本申请实施例中,如图3b所示,呈现了训练过程中监视精确度VA随训练epoch 数的变化曲线,其中epoch被定义为所有训练数据整体流过神经网络的次数。图3b 中,实线和虚线分别为独立利用反射信号IR和透射信号IT作为网络输入的训练曲 线。
S170:确定监督测试数据达到预设值,停止训练。
本申请实施例中,确定监视精确度达到百分之百,停止训练,如图3b所示, 在约为40个epoch时VA达到约100%,神经网络收敛,标志着训练完成。在其他 实施例中,也可以是确定监视精确度达到90%时,认为神经网络收敛,标志着训练 完成,停止训练。
在本申请一实施例中,如图10所示,一种神经网络的检测方法,包括:
S210:将含有杂质的检测样本输入神经网络,得到检测样本的杂质位置的检测 信息,其中,检测样本包括检测样本的杂质位置的已知信息。
本申请实施例中,“含有杂质的检测样本”包括:杂质的边的数量为不同的奇数 和偶数的杂质训练样本、多种形状的杂质训练样本、多种折射率的杂质训练样本、 杂质位于介质的表面的凸起和杂质位于介质的表面的凹坑中的任意一种或多种的组 合。
本申请实施例对训练好的网络进行以下三个方面的泛化能力测试:杂质大小l的泛化、杂质折射率n的泛化、以及杂质形状(geometry)的泛化,这三种泛化测试的 结果分别呈现于图4a、4c和4e中,其中图4a固定杂质折射率为和形状为方 形而改变杂质边长、图4c固定杂质边长为l=4Δ且形状为方形而改变杂质折射率、 图4d固定边长为l=4Δ以及折射率为而改变杂质形状。图4a、4c和4d表示 利用反射/透射信号训练后的网络的预测精确度,图4b、4d和4f呈现了在一组典型 数据下反射信号训练出网络的预测概率分布PR(zc|I)。泛化测试所有用到的测试集 大小都为200,它们的生成方法与上述训练数据集生成方法一致,差别在于生成泛 化集需要改变如图4a-4f所示的杂质的相关属性。
S220:比较杂质位置检测信息和检测样本的杂质位置的已知信息,获得杂质位 置的准确率。
本申请实施例中包括以下三个方面,杂质大小l的泛化测试、杂质折射率n的泛 化测试和杂质形状(geometry)的泛化测试,本申请实施例中,在训练参数下(l=4Δ、位形为方形杂质)表现出最高的预测精度。具体如下:
1)杂质大小l的泛化测试中,神经网络对不同大小杂质的预测呈现出了一些振荡,但总体准确率不低于75%(如图4a所示),并且预测精确度呈现振荡的原因与 杂质边长l的奇偶性相关。这一现象与杂质类号的定义中的取整int有关。当杂质边 长l为偶数倍Δ的杂质,则杂质质心位置z0=nΔ总可以被定义在Δ的整数倍处,但 是对于奇数倍Δ的杂质的质心总是被定义在Δ的半整数倍处z0=(2n+1)Δ/2。结果 表明,这部分差异也被神经网络所捕捉到。图4b呈现了一组典型数据下反射信号训 练处的神经网络预测概率分布PR(zc|I),可以看出网络的预测概率分布集中度较高, 表明网络对杂质位置的判断具有很高的置信度。
本申请实施例同样测试了训练数据集为l=3Δ情况下网络的泛化能力,结果表现为在奇数Δ的杂质泛化测试集上准确率较高,而在偶数倍Δ测试集上准确率较低。 这种奇偶差异会随着Δ→0而逐渐消失,但Δ的减小对应于空间的无限精细离散化, 这在数值模拟上带来了巨大的计算开销。
2)杂质折射率n的泛化测试中,如图4c所示,在本申请实施例的神经网络对 反射信号相较透射信号在折射率泛化上表现更为优异,但两者的预测准确率都会随 着折射率n减小至1而逐渐衰减至零。这是合理的,因为n=1对应杂质消失,因而 无论是反射还是透射信号内都不会携带任何杂质的信息。图4d呈现了一组典型数据 下反射信号训练处的神经网络预测概率分布PR(zc|I),可以看出网络的预测概率分 布集中度较高,表明网络对杂质位置的判断具有很高的置信度。
3)杂质形状(geometry)的泛化测试中,如图4e所示,表明利用方形杂质训练后 的网络,在其他几何形状的杂质上也有较高的预测准确率,并且预测准确率也与杂 质的反射对称性有一定的关系。因为本申请实施例的神经网络是在具有左右反射对 称性的方形杂质上训练出来的,因而在图如图4c所示中,同样具有反射对称性的条 形和楔形杂质上体现出较高的泛化能力,而在反射对称性缺失的"L"型上泛化能力较 弱。图4f呈现了一组典型数据下反射信号训练处的神经网络预测概率分布PR(zc|I), 可以看出网络的预测概率分布集中度较高,表明网络对杂质位置的判断具有很高的 置信度。
4)本申请实施例同样测试了神经网络对凹杂质位置的学习能力,并将典型的结果呈现于图7a和7b之中,其中图7a和7b分别表示凹杂质学习的训练损失曲线以 及训练后网络对杂质大小l的泛化测试。结果表明,神经网络对凹杂质也体现出很强 的学习能力。
S230:确定杂质位置准确率大于预设值,则确定神经网络具有泛化能力。
本申请实施例中,例如,确定准确率大于75%,则确定神经网络具有较强的泛 化能力,在其他实施例中,也可以使准确率大于60%、70%、80%或90%时,确定神经 网络具有较好的泛化能力。
申请实施例采用的神经网络为卷积神经网络(CNN)。本申请实施例还将卷积神 经网络(CNN)与纯全连接神经网络(FCNN)的学习能力做个一比较。为保证比较的公 平性,本申请实施例控制FCNN网络的层数以及总参数个数与之前的CNN网络接近。
如图5所示,本申请实施例具体展示FCNN网络的架构和参数,其中输入层 21(Input Layer)神经元个数为512;隐含层22(Hidden Layer)神经元个数依次为 256、310、448、310、237,与之对应的激活函数为"Relu"函数;输出层23(Output Layer)神经元个数为32,激活函数为"softmax"函数。图6a-6f比较了CNN和FCNN 两种网络在杂质大小、杂质折射率和杂质形状,其中图6a、6c、图6d和图6e分别 对应反射信号训练的结果,而图6b、6d、图6d和图6f分别对应透射信号训练的结 果。可以看出两种不同网络在泛化集上都有较好的表现,但是两者相较而言,CNN 的表现更为优异。单个杂质衍射具有空间平移不变性的,这里的平移不变指的是杂 质衍射后对反射/透射信号所产生的局部特征并不依赖于杂质所处的位置。在针对具 有平移不变特征的提取问题上,CNN具有更大的优势因为其卷积核可以被重复利用。 若要使全连接神经网络达到与卷积神经网络一样的效果,则需要引入更多的参数。
本申请实施例,如图11所示,还包括第三种技术方案:一种深度学习光学表 面杂质检测方法,包括:
S310:将介质输入神经网络,其中,神经网络是利用上述方法训练得到的。
S320:判断介质表面是否含有杂质。
本申请实施例,通过获取神经网络的反射信号和透射信号,以获得光学脉冲信,根据光学脉冲信号判断是否具有杂质。例如,可以判断介质各个位置的光学脉冲信 号是否相同,若相同,则介质表面无杂质,若,不相同,则介质表面含有杂质。
若是,则S330:确定介质表面的杂质所在位置。
本申请实施例中,若介质表面具有杂质,则根据光学脉冲信号及对应的杂质的 位置确定出杂质的位置。若表面无杂质,则说明介质表面光滑。
请参阅图12,图12是本申请电子设备一实施例的结构示意图。如图12所示, 该电子设备400包括相互耦接的存储器410与处理器420,其中,存储器410存储 有用于实现上述任一实施例的方法的指令;处理器420用于执行存储器410存储的 指令以实现上述任一实施例的方法。其中,处理器420还可以称为CPU(Central Processing Unit,中央处理单元)。处理器420可能是一种集成电路芯片,具有信 号的处理能力。处理器420还可以是通用处理器、数字信号处理器(DSP)、专用集成 电路(ASIC)、现场可编程门阵列(FPGA)或者其他可编程逻辑器件、分立门或者晶体 管逻辑器件、分立硬件组件。通用处理器可以是微处理器或者该处理器也可以是任 何常规的处理器等。
参阅图13,图13是申请存储介质一实施例的结构示意图。本申请实施例的存 储介质500存储有指令,该指令被执行时实现上述方法。其中,该指令可以形成程 序文件以软件产品的形式存储在上述存储介质中,以使得一台计算机设备(可以是个 人计算机,服务器,或者网络设备等)或处理器(processor)执行本申请各个实施方 式方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器 (ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟 或者光盘等各种可以存储程序代码的介质,或者是计算机、服务器、手机、平板等 终端设备。
在本申请所提供的几个实施例中,应该理解到,所揭露的系统,装置和方法, 可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如, 单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如 多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不 执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过 一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可 以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述 集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。以 上仅为本申请的实施方式,并非因此限制本申请的专利范围,凡是利用本申请说明 书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技 术领域,均同理包括在本申请的专利保护范围内。
Claims (10)
1.一种深度学习光学表面杂质检测模型的训练方法,其特征在于,包括:
将含有杂质的训练样本输入待训练的神经网络,得到所述训练样本的杂质位置的输出结果,其中所述训练样本包括所述杂质的已知位置信息和已知光学信号,所述输出结果包含所述训练样本的杂质的预测位置和预测光学信号;
将所述预测光学信号和所述预测位置进行分类,得到第一概率分布;
将所述杂质的已知位置信息和已知光学信号进行分类,形成已知杂质的已知分类数据,并将所述已知分类数据进行one-hot编码,得到第二概率分布;
利用所述第一概率分布和所述第二概率分布,计算损失函数;
调整所述神经网络的网格参数以缩小所述损失函数。
2.根据权利要求1所述的深度学习光学表面杂质检测模型的训练方法,其特征在于,所述“调整所述神经网络的网格参数以缩小所述损失函数”之后,还包括:
监督训练过程,获得监督测试数据;
确定所述监督测试数据达到预设值,停止训练。
3.根据权利要求2所述的深度学习光学表面杂质检测模型的训练方法,其特征在于,所述“监督训练过程,获得监督测试数据”包括:
监督训练过程,获得监视精确度;
所述“确定所述监督测试数据达到预设值,停止训练”,包括:
确定所述监视精确度达到百分之百,停止训练。
4.根据权利要求1所述的深度学习光学表面杂质检测模型的训练方法,其特征在于,所述“将所述杂质的已知位置信息和已知光学信号进行分类,形成已知杂质的已知分类数据”,包括:
约束所述杂质在所述神经网络的探测光信号强度范围内,并将所述杂质的位置范围划分为预设数量的类别;
将所述已知位置信息依据所述预设数量的类别转化为已知位置的类号,并将所述已知光学信号对应所述已知位置的类号所对应的光学强度信号,获得已知杂质的已知分类数据,所述分类数据包括已知位置的类号和对应的光学强度;
所述“将所述预测光学信号和所述预测位置进行分类,得到第一概率分布”包括:
将所述预测位置信息依据所述预设数量的类别转化为预测位置的类号,并将所述预测光学信号对应所述预测位置的类号所对应的光学强度信号,获得预测杂质的第一概率分布。
5.根据权利要求1所述的深度学习光学表面杂质检测模型的训练方法,其特征在于,
所述“含有杂质的训练样本”包括:杂质沿着预设方向移动至不同位置的杂质训练样本。
6.一种神经网络的检测方法,其特征在于,包括:
将含有杂质的检测样本输入神经网络,得到检测样本的杂质位置的检测信息,其中,所述检测样本包括所述检测样本的杂质位置的已知信息;
比较所述杂质位置检测信息和所述检测样本的杂质位置的已知信息,获得杂质位置的准确率;
确定所述杂质位置准确率大于预设值,则确定神经网络具有泛化能力。
7.根据权利要求6所述的神经网络的检测方法,其特征在于,还包括:
所述“含有杂质的检测样本”包括:杂质的边的数量为不同的奇数和偶数的杂质训练样本、多种形状的杂质训练样本、多种折射率的杂质训练样本、杂质位于介质的表面的凸起和杂质位于介质的表面的凹坑中的任意一种或多种的组合。
8.一种深度学习光学表面杂质检测方法,其特征在于,包括:
将介质输入神经网络,其中,所述神经网络是利用权利要求1-5中任一项所述的方法训练得到的;
判断介质表面是否含有杂质;
若是,确定介质表面的杂质所在位置。
9.一种电子设备,其特征在于,包括相互耦接的存储器和处理器,
所述处理器用于执行所述存储器存储的计算机指令以实现如权利要求1-8中任一项所述的方法。
10.一种存储介质,存储有指令,其特征在于,所述指令被执行时实现如权利要求1-8中任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110405271.5A CN113312964A (zh) | 2021-04-15 | 2021-04-15 | 杂质检测模型的训练方法、检测方法、设备和介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110405271.5A CN113312964A (zh) | 2021-04-15 | 2021-04-15 | 杂质检测模型的训练方法、检测方法、设备和介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN113312964A true CN113312964A (zh) | 2021-08-27 |
Family
ID=77372242
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110405271.5A Pending CN113312964A (zh) | 2021-04-15 | 2021-04-15 | 杂质检测模型的训练方法、检测方法、设备和介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113312964A (zh) |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20190072833A1 (en) * | 2017-09-07 | 2019-03-07 | The George Washington University | All optical fast fourier transform on chip with heating tunability design, simulation, fabrication, and performance analysis |
CN109658396A (zh) * | 2018-12-06 | 2019-04-19 | 华中科技大学 | 一种基于选择性搜索与cnn的铸件x光图像缺陷识别方法 |
CN110672626A (zh) * | 2019-11-14 | 2020-01-10 | 上海感图网络科技有限公司 | 一种手机壳体中框表面颗粒缺陷的检测方法 |
CN111007035A (zh) * | 2019-12-12 | 2020-04-14 | 重庆科技学院 | 基于卷积神经网络的二燃室高温气体浓度检测方法、系统、装置及存储介质 |
US20200394789A1 (en) * | 2019-06-12 | 2020-12-17 | Carl Zeiss Meditec Inc | Oct-based retinal artery/vein classification |
CN112504996A (zh) * | 2019-09-16 | 2021-03-16 | 福特全球技术公司 | 光学表面劣化检测和补救 |
-
2021
- 2021-04-15 CN CN202110405271.5A patent/CN113312964A/zh active Pending
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20190072833A1 (en) * | 2017-09-07 | 2019-03-07 | The George Washington University | All optical fast fourier transform on chip with heating tunability design, simulation, fabrication, and performance analysis |
CN109658396A (zh) * | 2018-12-06 | 2019-04-19 | 华中科技大学 | 一种基于选择性搜索与cnn的铸件x光图像缺陷识别方法 |
US20200394789A1 (en) * | 2019-06-12 | 2020-12-17 | Carl Zeiss Meditec Inc | Oct-based retinal artery/vein classification |
CN112504996A (zh) * | 2019-09-16 | 2021-03-16 | 福特全球技术公司 | 光学表面劣化检测和补救 |
CN110672626A (zh) * | 2019-11-14 | 2020-01-10 | 上海感图网络科技有限公司 | 一种手机壳体中框表面颗粒缺陷的检测方法 |
CN111007035A (zh) * | 2019-12-12 | 2020-04-14 | 重庆科技学院 | 基于卷积神经网络的二燃室高温气体浓度检测方法、系统、装置及存储介质 |
Non-Patent Citations (2)
Title |
---|
JINHAO DU ET AL.: "A CNN-based cost-effective modulation format identification scheme by low-bandwidth direct detecting and low rate sampling for elastic optical networks", 《OPTICS COMMUNICATIONS》 * |
陈珂骏: "激光诱导熔石英损伤的光声频谱分析研究", 《中国优秀硕士学位论文全文数据库 基础科学辑》 * |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Buchner | Collaborative nested sampling: Big data versus complex physical models | |
Ruff et al. | Deep semi-supervised anomaly detection | |
Chen et al. | Deep learning in label-free cell classification | |
US20210390396A1 (en) | Systems and Methods for Generative Models for Design | |
Zhang et al. | Rkformer: Runge-kutta transformer with random-connection attention for infrared small target detection | |
CN111222538B (zh) | 一种涡旋光束模态识别方法、智能终端及存储介质 | |
CN110826457B (zh) | 一种复杂场景下的车辆检测方法及装置 | |
CN113065614A (zh) | 分类模型的训练方法和对目标对象进行分类的方法 | |
CN114677655A (zh) | 多传感器目标检测方法、装置、电子设备以及存储介质 | |
CN111950612A (zh) | 基于fpn的融合因子的弱小目标检测方法 | |
Ehler et al. | A randomized multivariate matrix pencil method for superresolution microscopy | |
Na et al. | Adaptive demodulation by deep-learning-based identification of fractional orbital angular momentum modes with structural distortion due to atmospheric turbulence | |
Bakır et al. | Deep learning-based approach for detection of turbulence-induced distortions in free-space optical communication links | |
Passalis et al. | Deep supervised hashing using quadratic spherical mutual information for efficient image retrieval | |
CN114169425B (zh) | 训练目标跟踪模型和目标跟踪的方法和装置 | |
Sun et al. | Machine learning-based fast integer and fractional vortex modes recognition of partially occluded vortex beams | |
CN113312964A (zh) | 杂质检测模型的训练方法、检测方法、设备和介质 | |
Micheletti | A new paradigm for artificial intelligence based on group equivariant non-expansive operators | |
Bendich et al. | Improving homology estimates with random walks | |
CN116843832A (zh) | 一种单视角三维物体重建方法、装置、设备及存储介质 | |
CN115294405A (zh) | 农作物病害分类模型的构建方法、装置、设备及介质 | |
CN113869369A (zh) | 一种自适应脑机信息融合分类方法及系统 | |
Zheng et al. | Lightweight network research based on deep learning | |
Mao et al. | Surface defect detection of smartphone glass based on deep learning | |
Guo et al. | CT-block: a novel local and global features extractor for point cloud |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |