CN113312964A

CN113312964A - 杂质检测模型的训练方法、检测方法、设备和介质

Info

Publication number: CN113312964A
Application number: CN202110405271.5A
Authority: CN
Inventors: 张云波
Original assignee: Zhejiang University of Technology ZJUT
Current assignee: Zhejiang University of Technology ZJUT
Priority date: 2021-04-15
Filing date: 2021-04-15
Publication date: 2021-08-27

Abstract

本申请涉及杂质检测模型的训练方法、检测方法、设备和介质，训练方法包括：将含有杂质的训练样本输入待训练的神经网络，得到训练样本的杂质位置的输出结果，其中训练样本包括杂质的已知位置信息和已知光学信号，输出结果包含训练样本的杂质的预测位置和预测光学信号；将预测光学信号和预测位置进行分类，得到第一概率分布；将杂质的已知位置信息和已知光学信号进行分类，形成已知杂质的已知分类数据，并将已知分类数据进行one‑hot编码，得到第二概率分布；利用第一概率分布和第二概率分布，计算损失函数；调整神经网络的网格参数以缩小损失函数。神经网络稳定性强，准确性强。

Description

杂质检测模型的训练方法、检测方法、设备和介质

技术领域

本申请涉及检测技术领域，特别是涉及杂质检测模型的训练方法、检测方法、设备和介质。

背景技术

精密的光学元器件是现代光学实验和激光应用中不可或缺的组成部分，例如光学晶体、分光镜、光学玻片等广泛应用于量子光学以及基于光子的量子计算、量子通讯实验中；在日常生活中，小到手机镜头、液晶屏幕，大到卫星导航，激光定位都离不开光学薄膜等光学器件的身影。然而，精密光学器件的表面往往是最重要但又最容易受到损伤的地方。已有大量的研究表明，光学表面的杂质和缺陷不但会大大影响光学器件的工作性能，更进一步，在大功率的激光应用中，具有杂质和缺陷的光学表面更加容易受到激光损伤，从而极大地减小光学器件的使用寿命。因而，对光学表面的杂质检测是一个重要的研究课题。

发明内容

本申请提供了杂质检测模型的训练方法、检测方法、设备和介质，能够提高检测光在表面杂质的精度和准确性。

为解决上述技术问题，本申请提供了一种深度学习光学表面杂质检测模型的训练方法，包括：

将含有杂质的训练样本输入待训练的神经网络，得到训练样本的杂质位置的输出结果，其中训练样本包括杂质的已知位置信息和已知光学信号，输出结果包含训练样本的杂质的预测位置和预测光学信号；

将预测光学信号和预测位置进行分类，得到第一概率分布；

将杂质的已知位置信息和已知光学信号进行分类，形成已知杂质的已知分类数据，并将已知分类数据进行one-hot编码，得到第二概率分布；

利用第一概率分布和第二概率分布，计算损失函数；

调整神经网络的网格参数以缩小损失函数。

本申请还包括第二种技术方案，一种神经网络的检测方法，包括：

将含有杂质的检测样本输入神经网络，得到检测样本的杂质位置的检测信息，其中，检测样本包括检测样本的杂质位置的已知信息；

比较杂质位置检测信息和检测样本的杂质位置的已知信息，获得杂质位置的准确率；

确定杂质位置准确率大于预设值，则确定神经网络具有泛化能力。

本申请还包括第三种技术方案，一种深度学习光学表面杂质检测方法，包括：

将介质输入神经网络，其中，神经网络是利用权利要求1-5中任一项的方法训练得到的；

判断介质表面是否含有杂质；

若是，确定介质表面的杂质所在位置。

本申请还包括第四种技术方案，一种电子设备，包括相互耦接的存储器和处理器，处理器用于执行存储器存储的计算机指令以实现上述的方法。

本申请还包括第五种技术方案，一种存储介质，存储有指令，指令被执行时实现如上述的方法。

有益效果：

本申请实施例的训练方法，通过将预测光学信号和预测位置进行分类，以及杂质的已知位置信息和已知光学信号进行分类，使得将坐标z⁰的回归问题转化为了一个离散坐标z^c的分类问题，使得神经网络的训练稳定性更强，准确性更强。

附图说明

图1a是本申请深度学习光学表面杂质检测理论模型一实施例的示意图；

图1b本申请实施例的探测信号强度经过光学表面一个小杂质后的光强度分布图；

图2是本申请实施例的卷积神经网络示意图；

图3a是本申请深度学习光学表面杂质检测模型的训练过程中损失函数随epoch的变化一实施例的示意图；

图3b是本申请深度学习光学表面杂质检测模型的训练过程中精确度随epoch 的变化一实施例的示意图；

图3c是本申请实施例反射信号训练出的网络的预测概率分布图；

图3d本申请实施例透射信号训练出的网络的预测概率分布图；

图4a本申请实施例神经网络的检测方法中杂质大小泛化的泛化准确率图；

图4b本申请实施例神经网络的检测方法中杂质大小泛化的典型数据下的预测概率图；

图4c本申请实施例神经网络的检测方法中杂质折射率泛化的泛化准确率图；

图4d本申请实施例神经网络的检测方法中杂质折射率泛化的典型数据下的预测概率图；

图4e本申请实施例神经网络的检测方法中杂质形状泛化的泛化准确率图；

图4f本申请实施例神经网络的检测方法中杂质形状泛化的典型数据下的预测概率图；

图5是全连接神经网络示意图；

图6a是本申请两种神经网络的反射信号训练下网络杂质大小的泛化准确率图；

图6b是本申请两种神经网络的透射信号训练下网络杂质大小的泛化准确率图；

图6c是本申请两种神经网络的反射信号训练下网络杂质折射率的泛化准确率图；

图6d是本申请两种神经网络的透射信号训练下网络杂质折射率的泛化准确率图；

图6e是本申请两种神经网络的反射信号训练下网络杂质形状的泛化准确率图；

图6f是本申请两种神经网络的透射信号训练下网络杂质形状的泛化准确率图；

图7a是本申请实施例中凹杂质深度学习光学表面杂质检测模型的训练过程中损失函数随epoch的变化一实施例的示意图；

图7b是，本申请实施例中凹杂质的杂质大小的泛化准确率图；

图8是本申请深度学习光学表面杂质检测模型的训练方法一实施例的流程示意图；

图9是本申请深度学习光学表面杂质检测模型的训练方法另一实施例的流程示意图

图10是本申请神经网络的检测方法一实施例的流程示意图；

图11是本申请深度学习光学表面杂质检测方法一实施例的流程示意图；

图12是本申请电子设备一实施例的结构示意图；

图13是申请存储介质一实施例的结构示意图。

具体实施方式

下面将结合本申请实施例中的附图，对本申请实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅是本申请的一部分实施例，而不是全部的实施例。基于本申请中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本申请保护的范围。

本申请中的术语“第一”、“第二”、“第三”仅用于描述目的，而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此，限定有“第一”、 “第二”、“第三”的特征可以明示或者隐含地包括至少一个该特征。本申请的描述中，“多个”的含义是至少两个，例如两个，三个等，除非另有明确具体的限定。本申请实施例中所有方向性指示(诸如上、下、左、右、前、后……)仅用于解释在某一特定姿态(如附图所示)下各部件之间的相对位置关系、运动情况等，如果该特定姿态发生改变时，则该方向性指示也相应地随之改变。此外，术语“包括”和“具有”以及它们任何变形，意图在于覆盖不排他的包含。例如包含了一系列步骤或单元的过程、方法、系统、产品或设备没有限定于已列出的步骤或单元，而是可选地还包括没有列出的步骤或单元，或可选地还包括对于这些过程、方法、产品或设备固有的其它步骤或单元。

在本文中提及“实施例”意味着，结合实施例描述的特定特征、结构或特性可以包含在本申请的至少一个实施例中。在说明书中的各个位置出现该短语并不一定均是指相同的实施例，也不是与其它实施例互斥的独立的或备选的实施例。本领域技术人员显式地和隐式地理解的是，在不冲突的情况下，本文所描述的实施例可以与其它实施例相结合。

本申请实施例中，深度学习光学表面杂质检测理论模型的建立具体如下：

一束沿z方向极化的脉冲激光，沿x方向垂直照射某光学介质，介质的厚度为L，如图1a所示。介质表面某处有一凸起的杂质，杂质的尺寸为l。脉冲激光的电场强度E(r,t)满足波动方程：

其中，r为空间坐标，c为光速，ε(r)为相对介电常数，其在介质内外的分布为

ε(r)与光学折射率n的关系为

为简化理论计算，本申请实施例约束杂质仅在z方向移动，并考虑场强E(r,t)在y方向为均匀分布，由此可将方程(1.1)约化为 {x,z}的二维波动方程。接下来，本申请实施例利用欧拉-傅里叶谱法对方程(1.1) 进行数值求解，演化方程的初始条件为

其中初始电场E(x,z,t＝0)为一系列沿x方向波矢为k_m的平面波的线性叠加，其在z 方向上为高斯分布，σ为高斯波包宽度。对于方程(1.1)所描述的光学系统有以下的长度尺度关系：σLλl，即高斯波包的宽度σ和介质的厚度L要远大于电磁波波长λ和杂质尺寸l，而空间差分离散的最小单元长度Δ又要小于以上的所有长度尺度，使得本申请实施例数值计算量巨大。在实际计算过程中，本申请实施例选取 Δ＝80nm为长度单位，并取σ＝2L＝100Δ，杂质边长l可在Δ到5Δ之间变化，即杂质尺寸在55 275nm之间变化。系统总的求解空间为x∈[-256Δ,256Δ]， z∈[-512Δ,512Δ]。为方便计算本申请实施例选择入射光为若干个波矢为k_m的平面波的叠加，这里k_m＝2πm/512Δ，其中m∈[40,60]为整数。由此可知入射光的波长范围在可见光范围λ≈470 700nm，而光脉冲宽度由1/ω_SD表示，其中

表示N＝21个频率模式谱分布的标准差，在所取模式下可知脉冲宽度约为0.5×10^-15s，即0.5飞秒。如此选择波包的另一个好处是可以在系统演化时间内将信号不失真地从源端传送到接收端。以上系统参数的选择可以将计算量控制在合理的范围之内。

当探测脉冲经过介质反射和透射后，本申请实施例中，在介质前和后分别收集反射光(R)和透射光(T)的强度信号∝|E(x,z,t)|²，并对其在x方向进行积分从而得到沿z方向的分布I^R,T(z)。图1b展示了探测信号强度(实线)经过光学表面一个小杂质l＝Δ衍射后I^R,T(z)的分布，其中，图1b中实线表示入射光信号，虚线和点划线分别表示反射光I^R和透射光I^T。从图1b中可以看出，初始脉冲分布I为一个标准的高斯分布，而反射和透射信号经过杂质衍射后强度信号会形成空间振荡。其中包含了杂质信息，对其解码可以获得杂质的位置信息。但是，很显然，通过简单观察振荡曲线不足以来对杂质位置进行准确定位。本申请实施例是利用神经网络来学习杂质位置与经过该杂质衍射后的光强分布之间的函数关系，从而让网络学到从强度信号I^R,T中提取杂质位置信息的能力。

本申请一实施例中，如图8所示，提供一种深度学习光学表面杂质检测模型的训练方法，包括：

S110:将含有杂质的训练样本输入待训练的神经网络，得到训练样本的杂质位置的输出结果，其中训练样本包括杂质的已知位置信息和已知光学信号，输出结果包含训练样本的杂质的预测位置和预测光学信号。

本申请实施例中，通过上述数值求解波动方程的方法，首先生成训练数据集

训练数据选用的杂质参数为边长l＝4Δ的方形杂质，杂质折射率为

G中不同的数据是通过改变杂质位置得到的，其中每一组数据包含光学脉冲信号I^R,T(z)和相应的杂质位置z^c。本申请实施例的训练数据集包含了含有有杂质的训练样本已知位置信息和已知光学信号。

本申请实施例中，训练数据集G^train训练数据集的大小为N_train＝800，本申请实施例中，神经网络为卷积神经网络(CNN)。如图2所示，神经网络由输入层11(Input layer)、卷积层12(Convolutional layers)、Flatten层13(Flatten layer)、全连接层14(Denselayer)以及输出层15(Output layer)构成，其中卷积层12共三层，深度分别为10、20和50，卷积核尺寸为20，选取"Relu"为激活函数，每一层卷积层12之后添加一层平均池化层用以缩小神经元的个数，池化尺寸为2；全连接层神经元个数为48，激活函数同样为"Relu"函数；输出层神经元个数为32，激活函数为"softmax"函数从而将输出转为概率分布P(z^c|I)。神经网络内部总的可训练参数约为5.7×10⁵个。

S120:将预测光学信号和预测位置进行分类，得到第一概率分布。

本申请实施例中，将预测位置信息依据预设数量的类别转化为预测位置的类号，并将预测光学信号对应预测位置的类号所对应的光学强度信号，得到第一概率分布。

本申请实施例中，约束杂质的质心z⁰在探测光信号强度较大的范围内 z⁰∈[-64Δ,64Δ]，然后将z⁰的坐标范围进一步划分为了32个类，每个类对应一个整数的类号z^c∈[1,32]，其与杂质的真实坐标z⁰之间的关系为z^c＝int[z⁰/4Δ]+17，其中int表示取整，而数据集G正是由强度信号与杂质类号所构成的数据对

以上仅为举例，在其他实施例中，z⁰的坐标范围进划分为了其他数量个类。

本申请实施例中，神经网络的输入为I^R,T(z)，而输出为一个定义在类号z^c上的概率分布P^R,T(z^c|I)，其反映了网络对指定的输入信号I进行分析后所作出的分类预测概率分布。

S130:将杂质的已知位置信息和已知光学信号进行分类，形成已知杂质的已知分类数据，并将已知分类数据进行one-hot编码，得到第二概率分布。

本申请实施例中，约束杂质在神经网络的探测光信号强度范围内，并将杂质的位置范围划分为预设数量的类别。

将已知位置信息依据预设数量的类别转化为已知位置的类号，并将已知光学信号对应已知位置的类号所对应的光学强度信号，获得已知杂质的已知分类数据，分类数据包括已知位置的类号和对应的光学强度。

杂质已知分类数据中杂质真实类号z^c进行one-hot编码得到第二概率分布，其中，Q_i(z^c|I)是第二概率分布函数。

S140:利用第一概率分布和第二概率分布，计算损失函数。

本申请实施例选用的损失函数为交叉熵

其中Q_i(z^c|I)是杂质已知分类数据中杂质真实类号z^c的one-hot编码第二概率分布函数。交叉熵本质反映了网络预测第一概率分布P与真实第二概率分布Q之间的相对距离，交叉熵越小，网络的预测越接近真实值。

此外，在训练过程中本申请实施例通过监视平均精确度(VA)来衡量网络训练是否有效。VA的定义为

其中

从定义上可以看出来，a_i表示对于给定的测试数据i，其P(z^c|I)中概率最大的类与杂质真实类是否一致，如果一致则贡献1，否则没有贡献。VA是a_i对所有测试数据的平均。因此对于训练而言，损失函数L下降的同时伴随着监视平均精确度VA的提升。

S150:调整神经网络的网格参数以缩小损失函数。

本申请实施例中，如图3a所示，呈现了训练过程中损失函数L随训练epoch(时期)数的变化曲线，其中epoch被定义为所有训练数据整体流过神经网络的次数。图 3a中，实线和虚线分别为独立利用反射信号I^R和透射信号I^T作为网络输入的训练曲线。结果表明，网络可以从I^R或I^T中学习提取杂质位置信息的能力，并且在约为40个epoch时得以收敛，具体表现为损失函数L下降至零附近，网络收敛标志着训练完成。

训练完成后，本申请实施例选取任意一组测试数据，并绘出预测第一概率分布

如图3c和3d所示，可以看出网络的第一预测概率分布高度集中，表明网络对杂质位置的判断具有很高的置信度。

在本申请另一实施例中，如图9所示，一种深度学习光学表面杂质检测模型的训练方法，包括：

同上述实施例，在此不再赘述。

S140:利用第一概率分布和第二概率分布，计算损失函数。

同上述实施例，在此不再赘述。

S150:调整神经网络的网格参数以缩小损失函数。

同上述实施例，在此不再赘述。

S160:监督训练过程，获得监督测试数据。

本申请实施例中，监督训练过程，获得监视精确度。

本申请实施例中，如图3b所示，呈现了训练过程中监视精确度VA随训练epoch 数的变化曲线，其中epoch被定义为所有训练数据整体流过神经网络的次数。图3b 中，实线和虚线分别为独立利用反射信号I^R和透射信号I^T作为网络输入的训练曲线。

S170:确定监督测试数据达到预设值，停止训练。

本申请实施例中，确定监视精确度达到百分之百，停止训练，如图3b所示，在约为40个epoch时VA达到约100％，神经网络收敛，标志着训练完成。在其他实施例中，也可以是确定监视精确度达到90％时，认为神经网络收敛，标志着训练完成，停止训练。

在本申请一实施例中，如图10所示，一种神经网络的检测方法，包括：

S210：将含有杂质的检测样本输入神经网络，得到检测样本的杂质位置的检测信息，其中，检测样本包括检测样本的杂质位置的已知信息。

本申请实施例中，“含有杂质的检测样本”包括：杂质的边的数量为不同的奇数和偶数的杂质训练样本、多种形状的杂质训练样本、多种折射率的杂质训练样本、杂质位于介质的表面的凸起和杂质位于介质的表面的凹坑中的任意一种或多种的组合。

本申请实施例对训练好的网络进行以下三个方面的泛化能力测试：杂质大小l的泛化、杂质折射率n的泛化、以及杂质形状(geometry)的泛化，这三种泛化测试的结果分别呈现于图4a、4c和4e中，其中图4a固定杂质折射率为

和形状为方形而改变杂质边长、图4c固定杂质边长为l＝4Δ且形状为方形而改变杂质折射率、图4d固定边长为l＝4Δ以及折射率为

而改变杂质形状。图4a、4c和4d表示利用反射/透射信号训练后的网络的预测精确度，图4b、4d和4f呈现了在一组典型数据下反射信号训练出网络的预测概率分布P^R(z^c|I)。泛化测试所有用到的测试集大小都为200，它们的生成方法与上述训练数据集生成方法一致，差别在于生成泛化集需要改变如图4a-4f所示的杂质的相关属性。

S220：比较杂质位置检测信息和检测样本的杂质位置的已知信息，获得杂质位置的准确率。

本申请实施例中包括以下三个方面，杂质大小l的泛化测试、杂质折射率n的泛化测试和杂质形状(geometry)的泛化测试，本申请实施例中，在训练参数下(l＝4Δ、

位形为方形杂质)表现出最高的预测精度。具体如下：

1)杂质大小l的泛化测试中，神经网络对不同大小杂质的预测呈现出了一些振荡，但总体准确率不低于75％(如图4a所示)，并且预测精确度呈现振荡的原因与杂质边长l的奇偶性相关。这一现象与杂质类号的定义中的取整int有关。当杂质边长l为偶数倍Δ的杂质，则杂质质心位置z⁰＝nΔ总可以被定义在Δ的整数倍处，但是对于奇数倍Δ的杂质的质心总是被定义在Δ的半整数倍处z⁰＝(2n+1)Δ/2。结果表明，这部分差异也被神经网络所捕捉到。图4b呈现了一组典型数据下反射信号训练处的神经网络预测概率分布P^R(z^c|I)，可以看出网络的预测概率分布集中度较高，表明网络对杂质位置的判断具有很高的置信度。

本申请实施例同样测试了训练数据集为l＝3Δ情况下网络的泛化能力，结果表现为在奇数Δ的杂质泛化测试集上准确率较高，而在偶数倍Δ测试集上准确率较低。这种奇偶差异会随着Δ→0而逐渐消失，但Δ的减小对应于空间的无限精细离散化，这在数值模拟上带来了巨大的计算开销。

2)杂质折射率n的泛化测试中，如图4c所示，在本申请实施例的神经网络对反射信号相较透射信号在折射率泛化上表现更为优异，但两者的预测准确率都会随着折射率n减小至1而逐渐衰减至零。这是合理的，因为n＝1对应杂质消失，因而无论是反射还是透射信号内都不会携带任何杂质的信息。图4d呈现了一组典型数据下反射信号训练处的神经网络预测概率分布P^R(z^c|I)，可以看出网络的预测概率分布集中度较高，表明网络对杂质位置的判断具有很高的置信度。

3)杂质形状(geometry)的泛化测试中，如图4e所示，表明利用方形杂质训练后的网络，在其他几何形状的杂质上也有较高的预测准确率，并且预测准确率也与杂质的反射对称性有一定的关系。因为本申请实施例的神经网络是在具有左右反射对称性的方形杂质上训练出来的，因而在图如图4c所示中，同样具有反射对称性的条形和楔形杂质上体现出较高的泛化能力，而在反射对称性缺失的"L"型上泛化能力较弱。图4f呈现了一组典型数据下反射信号训练处的神经网络预测概率分布P^R(z^c|I)，可以看出网络的预测概率分布集中度较高，表明网络对杂质位置的判断具有很高的置信度。

4)本申请实施例同样测试了神经网络对凹杂质位置的学习能力，并将典型的结果呈现于图7a和7b之中，其中图7a和7b分别表示凹杂质学习的训练损失曲线以及训练后网络对杂质大小l的泛化测试。结果表明，神经网络对凹杂质也体现出很强的学习能力。

S230：确定杂质位置准确率大于预设值，则确定神经网络具有泛化能力。

本申请实施例中，例如，确定准确率大于75％，则确定神经网络具有较强的泛化能力，在其他实施例中，也可以使准确率大于60％、70％、80％或90％时，确定神经网络具有较好的泛化能力。

申请实施例采用的神经网络为卷积神经网络(CNN)。本申请实施例还将卷积神经网络(CNN)与纯全连接神经网络(FCNN)的学习能力做个一比较。为保证比较的公平性，本申请实施例控制FCNN网络的层数以及总参数个数与之前的CNN网络接近。

如图5所示，本申请实施例具体展示FCNN网络的架构和参数，其中输入层 21(Input Layer)神经元个数为512；隐含层22(Hidden Layer)神经元个数依次为 256、310、448、310、237，与之对应的激活函数为"Relu"函数；输出层23(Output Layer)神经元个数为32，激活函数为"softmax"函数。图6a-6f比较了CNN和FCNN 两种网络在杂质大小、杂质折射率和杂质形状，其中图6a、6c、图6d和图6e分别对应反射信号训练的结果，而图6b、6d、图6d和图6f分别对应透射信号训练的结果。可以看出两种不同网络在泛化集上都有较好的表现，但是两者相较而言，CNN 的表现更为优异。单个杂质衍射具有空间平移不变性的，这里的平移不变指的是杂质衍射后对反射/透射信号所产生的局部特征并不依赖于杂质所处的位置。在针对具有平移不变特征的提取问题上，CNN具有更大的优势因为其卷积核可以被重复利用。若要使全连接神经网络达到与卷积神经网络一样的效果，则需要引入更多的参数。

本申请实施例，如图11所示，还包括第三种技术方案：一种深度学习光学表面杂质检测方法，包括：

S310：将介质输入神经网络，其中，神经网络是利用上述方法训练得到的。

S320：判断介质表面是否含有杂质。

本申请实施例，通过获取神经网络的反射信号和透射信号，以获得光学脉冲信，根据光学脉冲信号判断是否具有杂质。例如，可以判断介质各个位置的光学脉冲信号是否相同，若相同，则介质表面无杂质，若，不相同，则介质表面含有杂质。

若是，则S330：确定介质表面的杂质所在位置。

本申请实施例中，若介质表面具有杂质，则根据光学脉冲信号及对应的杂质的位置确定出杂质的位置。若表面无杂质，则说明介质表面光滑。

请参阅图12，图12是本申请电子设备一实施例的结构示意图。如图12所示，该电子设备400包括相互耦接的存储器410与处理器420，其中，存储器410存储有用于实现上述任一实施例的方法的指令；处理器420用于执行存储器410存储的指令以实现上述任一实施例的方法。其中，处理器420还可以称为CPU(Central Processing Unit，中央处理单元)。处理器420可能是一种集成电路芯片，具有信号的处理能力。处理器420还可以是通用处理器、数字信号处理器(DSP)、专用集成电路(ASIC)、现场可编程门阵列(FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。

参阅图13，图13是申请存储介质一实施例的结构示意图。本申请实施例的存储介质500存储有指令，该指令被执行时实现上述方法。其中，该指令可以形成程序文件以软件产品的形式存储在上述存储介质中，以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)或处理器(processor)执行本申请各个实施方式方法的全部或部分步骤。而前述的存储介质包括：U盘、移动硬盘、只读存储器 (ROM，Read-Only Memory)、随机存取存储器(RAM，Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质，或者是计算机、服务器、手机、平板等终端设备。

在本申请所提供的几个实施例中，应该理解到，所揭露的系统，装置和方法，可以通过其它的方式实现。例如，以上所描述的装置实施例仅仅是示意性的，例如，单元的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，例如多个单元或组件可以结合或者可以集成到另一个系统，或一些特征可以忽略，或不执行。另一点，所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口，装置或单元的间接耦合或通信连接，可以是电性，机械或其它的形式。

另外，在本申请各个实施例中的各功能单元可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现，也可以采用软件功能单元的形式实现。以上仅为本申请的实施方式，并非因此限制本申请的专利范围，凡是利用本申请说明书及附图内容所作的等效结构或等效流程变换，或直接或间接运用在其他相关的技术领域，均同理包括在本申请的专利保护范围内。

Claims

1.一种深度学习光学表面杂质检测模型的训练方法，其特征在于，包括：

将含有杂质的训练样本输入待训练的神经网络，得到所述训练样本的杂质位置的输出结果，其中所述训练样本包括所述杂质的已知位置信息和已知光学信号，所述输出结果包含所述训练样本的杂质的预测位置和预测光学信号；

将所述预测光学信号和所述预测位置进行分类，得到第一概率分布；

将所述杂质的已知位置信息和已知光学信号进行分类，形成已知杂质的已知分类数据，并将所述已知分类数据进行one-hot编码，得到第二概率分布；

利用所述第一概率分布和所述第二概率分布，计算损失函数；

调整所述神经网络的网格参数以缩小所述损失函数。

2.根据权利要求1所述的深度学习光学表面杂质检测模型的训练方法，其特征在于，所述“调整所述神经网络的网格参数以缩小所述损失函数”之后，还包括：

监督训练过程，获得监督测试数据；

确定所述监督测试数据达到预设值，停止训练。

3.根据权利要求2所述的深度学习光学表面杂质检测模型的训练方法，其特征在于，所述“监督训练过程，获得监督测试数据”包括：

监督训练过程，获得监视精确度；

所述“确定所述监督测试数据达到预设值，停止训练”，包括：

确定所述监视精确度达到百分之百，停止训练。

4.根据权利要求1所述的深度学习光学表面杂质检测模型的训练方法，其特征在于，所述“将所述杂质的已知位置信息和已知光学信号进行分类，形成已知杂质的已知分类数据”，包括：

约束所述杂质在所述神经网络的探测光信号强度范围内，并将所述杂质的位置范围划分为预设数量的类别；

将所述已知位置信息依据所述预设数量的类别转化为已知位置的类号，并将所述已知光学信号对应所述已知位置的类号所对应的光学强度信号，获得已知杂质的已知分类数据，所述分类数据包括已知位置的类号和对应的光学强度；

所述“将所述预测光学信号和所述预测位置进行分类，得到第一概率分布”包括：

将所述预测位置信息依据所述预设数量的类别转化为预测位置的类号，并将所述预测光学信号对应所述预测位置的类号所对应的光学强度信号，获得预测杂质的第一概率分布。

5.根据权利要求1所述的深度学习光学表面杂质检测模型的训练方法，其特征在于，

所述“含有杂质的训练样本”包括：杂质沿着预设方向移动至不同位置的杂质训练样本。

6.一种神经网络的检测方法，其特征在于，包括：

将含有杂质的检测样本输入神经网络，得到检测样本的杂质位置的检测信息，其中，所述检测样本包括所述检测样本的杂质位置的已知信息；

比较所述杂质位置检测信息和所述检测样本的杂质位置的已知信息，获得杂质位置的准确率；

确定所述杂质位置准确率大于预设值，则确定神经网络具有泛化能力。

7.根据权利要求6所述的神经网络的检测方法，其特征在于，还包括：

所述“含有杂质的检测样本”包括：杂质的边的数量为不同的奇数和偶数的杂质训练样本、多种形状的杂质训练样本、多种折射率的杂质训练样本、杂质位于介质的表面的凸起和杂质位于介质的表面的凹坑中的任意一种或多种的组合。

8.一种深度学习光学表面杂质检测方法，其特征在于，包括：

将介质输入神经网络，其中，所述神经网络是利用权利要求1-5中任一项所述的方法训练得到的；

判断介质表面是否含有杂质；

若是，确定介质表面的杂质所在位置。

9.一种电子设备，其特征在于，包括相互耦接的存储器和处理器，

所述处理器用于执行所述存储器存储的计算机指令以实现如权利要求1-8中任一项所述的方法。

10.一种存储介质，存储有指令，其特征在于，所述指令被执行时实现如权利要求1-8中任一项所述的方法。