CN114329900A - 一种基于神经网络的器件参数获取方法、系统及相关组件 - Google Patents
一种基于神经网络的器件参数获取方法、系统及相关组件 Download PDFInfo
- Publication number
- CN114329900A CN114329900A CN202111450077.5A CN202111450077A CN114329900A CN 114329900 A CN114329900 A CN 114329900A CN 202111450077 A CN202111450077 A CN 202111450077A CN 114329900 A CN114329900 A CN 114329900A
- Authority
- CN
- China
- Prior art keywords
- network
- inverse
- target
- parameters
- parameter
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 69
- 238000013528 artificial neural network Methods 0.000 title claims abstract description 60
- 230000004044 response Effects 0.000 claims abstract description 128
- 238000001228 spectrum Methods 0.000 claims abstract description 110
- 238000012549 training Methods 0.000 claims abstract description 56
- 238000003860 storage Methods 0.000 claims abstract description 19
- 230000006870 function Effects 0.000 claims description 29
- 230000008569 process Effects 0.000 claims description 27
- 230000003595 spectral effect Effects 0.000 claims description 17
- 238000004590 computer program Methods 0.000 claims description 15
- 238000000605 extraction Methods 0.000 claims description 10
- 238000012545 processing Methods 0.000 claims description 8
- 239000000463 material Substances 0.000 claims description 6
- 239000013598 vector Substances 0.000 claims description 5
- 239000002184 metal Substances 0.000 description 13
- 230000003287 optical effect Effects 0.000 description 12
- 238000013461 design Methods 0.000 description 9
- 238000010586 diagram Methods 0.000 description 9
- 238000004891 communication Methods 0.000 description 8
- 238000005516 engineering process Methods 0.000 description 7
- 238000004364 calculation method Methods 0.000 description 4
- 238000005070 sampling Methods 0.000 description 4
- 230000009471 action Effects 0.000 description 3
- 239000011159 matrix material Substances 0.000 description 3
- 239000000758 substrate Substances 0.000 description 3
- 230000003042 antagnostic effect Effects 0.000 description 2
- 238000009826 distribution Methods 0.000 description 2
- 238000004519 manufacturing process Methods 0.000 description 2
- 238000004088 simulation Methods 0.000 description 2
- 238000003491 array Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000008033 biological extinction Effects 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 239000006185 dispersion Substances 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 229910052732 germanium Inorganic materials 0.000 description 1
- GNPVGFCGXDBREM-UHFFFAOYSA-N germanium atom Chemical compound [Ge] GNPVGFCGXDBREM-UHFFFAOYSA-N 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 210000002569 neuron Anatomy 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 230000000737 periodic effect Effects 0.000 description 1
- 230000035699 permeability Effects 0.000 description 1
- 230000010287 polarization Effects 0.000 description 1
- 238000002310 reflectometry Methods 0.000 description 1
- 238000000411 transmission spectrum Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F30/00—Computer-aided design [CAD]
- G06F30/20—Design optimisation, verification or simulation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Evolutionary Computation (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Data Mining & Analysis (AREA)
- Biophysics (AREA)
- Biomedical Technology (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Computational Linguistics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Health & Medical Sciences (AREA)
- Computer Hardware Design (AREA)
- Geometry (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Image Analysis (AREA)
Abstract
本申请公开了一种基于神经网络的器件参数获取方法、系统、装置及计算机可读存储介质,该基于神经网络的器件参数获取方法通过逆网络、判别网络和前向预测网络构成的神经网络为目标电磁光谱响应优化出对应的器件参数,本申请中将逆网络和判别网络结合对抗训练,优化生成的器件参数,使其接近真实参数,同时生成对抗网络所需训练数据集小,节省了硬件资源,提高了神经网络的鲁棒性,再将逆网络生成的满足真实条件的器件参数输入前向预测网络,实现逆网络和前向预测网络结合训练,当实际电磁光谱响应和目标电磁光谱响应匹配时,再输出逆网络生成的器件参数,优化生成的器件性能,在输入为期望的目标电磁光谱响应下,输出性能较高的器件参数。
Description
技术领域
本申请涉及器件设计领域,特别涉及一种基于神经网络的器件参数获取方法、系统及相关组件。
背景技术
在纳米光子学中,由亚波长周期性或非周期性几何阵列组成的光学器件,因其具有改变介电常数和磁导率的特殊性能而引起了广泛的关注。亚波长光学器件的设计包括两方面,一方面是正问题,即给定器件尺寸结构,计算其电磁光谱响应,另一方面是逆问题,即给定理想的电磁光谱响应,计算对应的器件尺寸结构。
在求解逆问题上,由于亚波长光学器件涉及光学、物理学和材料学等多个交叉学科,在设计器件时需要掌握复杂的底层原理,这在很大程度上依赖于纳米光子学研究人员的丰富经验。除此之外,由于解空间是非凸的,也就是说存在许多局部最优解,因此多数情况下解不能直接求出,其求解过程非常具有挑战性,大大限制了光学器件设计的推广。神经网络具有模拟非线性物理关系的能力,因此为解决光子系统几何及其电磁光谱响应之间的关系,提供了解决思路。虽然神经网络在亚波长光学器件设计上已有应用,但因为一般的神经网络需要上万的数据集去训练,在实际应用中需要花费很多资源。除此之外,已有神经网络没有将器件结构和电磁光谱响应同时考虑,鲁棒性较差。
因此,如何提供一种解决上述技术问题的方案是本领域技术人员目前需要解决的问题。
发明内容
本申请的目的是提供一种基于神经网络的器件参数获取方法、系统、装置及计算机可读存储介质,能够优化生成的器件参数,使其接近真实参数,同时生成对抗网络所需训练数据集小,节省了硬件资源,提高了神经网络的鲁棒性,同时还能够优化生成的器件性能,在输入为期望的目标电磁光谱响应下,输出性能较高的器件参数。
为解决上述技术问题,本申请提供了一种基于神经网络的器件参数获取方法,神经网络包括逆网络、判别网络和前向预测网络,该器件参数获取方法包括:
利用所述逆网络根据目标需求生成器件参数,所述目标需求包括目标电磁光谱响应;
将所述器件参数和真实样本输入所述判别网络,并使所述判别网络使用所述器件参数和所述真实样本进行对抗训练得到第一调整参数,基于所述第一调整参数对所述逆网络和所述判别网络进行第一参数更新操作,直至利用所述逆网络根据所述目标电磁光谱响应生成的所述器件参数满足真实条件;
将满足所述真实条件的所述器件参数输入所述前向预测网络得到实际电磁光谱响应,当所述实际电磁光谱响应和所述目标电磁光谱响应匹配时,输出所述逆网络生成的所述器件参数。
可选的,所述目标需求为包括所述目标电磁光谱响应、目标入射角、目标器件材料折射率及模拟随机噪声的一维向量。
可选的,所述利用所述逆网络根据目标需求生成器件参数的过程包括:
将所述目标需求输入所述逆网络,使所述逆网络基于所述目标需求得到重构参数,对所述重构参数进行特征提取生成器件参数。
可选的,所述逆网络包括转置卷积层和编码解码模块;
所述将所述目标需求输入所述逆网络,使所述逆网络基于所述目标需求得到重构参数,对所述重构参数进行特征提取生成器件参数的过程包括:
将所述目标需求输入所述逆网络;
通过所述转置卷积层基于所述目标需求进行上采样得到重构参数;
通过所述编码解码模块从所述重构参数中提取特征参数,利用所述特征参数生成器件参数。
可选的,所述使所述判别网络使用所述器件参数和所述真实样本进行对抗训练得到第一调整参数,基于所述第一调整参数对所述逆网络和所述判别网络进行第一参数更新操作的过程包括:
使所述判别网络使用所述器件参数和所述真实样本进行对抗训练,得到所述器件参数为真实参数的概率;
判断所述概率是否为目标值;
若否,获取第一调整参数,并基于所述第一调整参数对所述逆网络和所述判别网络进行第一参数更新操作;
若是,判定利用所述逆网络根据所述目标电磁光谱响应生成的所述器件参数满足真实条件。
可选的,所述将满足所述真实条件的所述器件参数输入所述前向预测网络得到实际电磁光谱响应之后,该器件参数获取方法还包括:
获取所述实际电磁光谱响应和目标电磁光谱响应之间的损失函数;
当所述损失函数收敛,判定所述实际电磁光谱响应和所述目标电磁光谱响应匹配。
可选的,所述获取所述实际电磁光谱响应和目标电磁光谱响应之间的损失函数之后,该器件参数获取方法还包括:
当所述损失函数未收敛,获取第二调整参数;
基于所述第二调整参数对所述逆网络和所述前向预测网络进行第二参数更新操作,直至所述实际电磁光谱响应和所述目标电磁光谱响应匹配。
可选的,所述前向预测网络和所述判别网络均包括BN层。
为解决上述技术问题,本申请还提供了一种基于神经网络的器件参数获取系统,神经网络包括逆网络、判别网络和前向预测网络,该器件参数获取系统包括:
第一处理模块,用于利用所述逆网络根据目标需求生成器件参数,所述目标需求包括目标电磁光谱响应;
调整模块,用于将所述器件参数和真实样本输入所述判别网络,并使所述判别网络使用所述器件参数和所述真实样本进行对抗训练得到第一调整参数,基于所述第一调整参数对所述逆网络和所述判别网络进行第一参数更新操作,直至利用所述逆网络根据所述目标电磁光谱响应生成的所述器件参数满足真实条件;
第二处理模块,用于将满足所述真实条件的所述器件参数输入所述前向预测网络得到实际电磁光谱响应,当所述实际电磁光谱响应和所述目标电磁光谱响应匹配时,输出所述逆网络生成的所述器件参数。
为解决上述技术问题,本申请还提供了一种基于神经网络的器件参数获取装置,包括:
存储器,用于存储计算机程序;
处理器,用于执行所述计算机程序时实现如上文任意一项所述的基于神经网络的器件参数获取方法的步骤。
为解决上述技术问题,本申请还提供了一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如上文任意一项所述的基于神经网络的器件参数获取方法的步骤。
本申请提供了一种基于神经网络的器件参数获取方法,通过逆网络、判别网络和前向预测网络构成的神经网络为目标电磁光谱响应优化出对应的器件参数,本申请中将逆网络和判别网络结合对抗训练,优化生成的器件参数,使其接近真实参数,同时生成对抗网络所需训练数据集小,节省了硬件资源,提高了神经网络的鲁棒性,再将逆网络生成的满足真实条件的器件参数输入前向预测网络,实现逆网络和前向预测网络结合训练,当实际电磁光谱响应和目标电磁光谱响应匹配时,再输出逆网络生成的器件参数,优化生成的器件性能,在输入为期望的目标电磁光谱响应下,输出性能较高的器件参数。本申请还提供了一种基于神经网络的器件参数获取系统、装置及计算机可读存储介质,具有和上述器件参数获取方法相同的有益效果。
附图说明
为了更清楚地说明本申请实施例,下面将对实施例中所需要使用的附图做简单的介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本申请所提供的一种基于神经网络的器件参数获取方法的步骤流程图;
图2为本申请所提供的一种神经网络的结构示意图;
图3为本申请所提供的一种编码解码过程的示意图;
图4为本申请所提供的一种判别网络训练流程图;
图5为本申请所提供的一种联合网络训练流程图;
图6为本申请所提供的一种数据集建立流程图;
图7为本申请所提供的一种亚波长金属线栅截面图;
图8为本申请所提供的六种参考亚波长金属线栅样式示意图;
图9为本申请所提供的一种前向预测网络预训练流程图;
图10为本申请所提供的一种基于神经网络的器件参数获取结构的结构示意图;
图11为本申请所提供的一种基于神经网络的器件参数获取装置的结构示意图;
图12为本申请所提供的另一种基于神经网络的器件参数获取装置的结构示意图。
具体实施方式
本申请的核心是提供一种基于神经网络的器件参数获取方法、系统、装置及计算机可读存储介质,能够优化生成的器件参数,使其接近真实参数,同时生成对抗网络所需训练数据集小,节省了硬件资源,提高了神经网络的鲁棒性,同时还能够优化生成的器件性能,在输入为期望的目标电磁光谱响应下,输出性能较高的器件参数。
为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
请参照图1,图1为本申请所提供的一种基于神经网络的器件参数获取方法的步骤流程图,首先对本申请所提供的神经网络进行介绍,该神经网络包括逆网络、判别网络及前向预测网络,本申请中的器件参数具体可以指光学器件参数,该基于神经网络的器件参数获取方法包括:
S101:利用逆网络根据目标需求生成器件参数,目标需求包括目标电磁光谱响应;
作为一种可选的实施例,利用逆网络根据目标需求生成器件参数的过程包括:将目标需求输入逆网络,使逆网络基于目标需求得到重构参数,对重构参数进行特征提取生成器件参数。
具体的,参照图2所示,逆网络包括输入层、全连接层、转置卷积层、编码解码模块,编码解码模块中包括编码器和解码器,逆网络还包括输出层。其中,逆网络的输入层用于接收目标需求,目标需求包括但不限于由目标电磁光谱响应、目标入射角、目标器件材料折射率及模拟随机噪声组成的一维向量,该一维向量可以采用matlab软件生成。可以理解的是,在逆网络中加入模拟随机噪声生成全尺寸图像,可以模拟实际制作过程中,器件受工艺条件和环境扰动等因素造成的制造误差,这样使得网络输出的器件鲁棒性更强。逆网络的全连接层的层数和器件的复杂度相关,如果设计的器件结构越复杂,则需要越多的参数去拟合,对应的全连接层数也相应增加,一般为1~4层。输入层经过全连接层后,连接转置卷积层,其中转置卷积的卷积核数为1,表示输出为灰度图片,具体的,转置卷积层基于输入层的目标需求进行上采样得到重构参数,编码解码模块从重构参数中提取特征参数,利用特征参数生成器件参数,将器件结构的高维离散数据转换为低维数据,从而使得网络在训练过程中学习到器件的大规模拓扑特征,可以理解的是,通过编码解码模块不但从整体上提高了网络训练过程的准确性,还以较低的空间分辨率进行训练从而大幅降低计算成本,输出层用于输出基于该目标需求生成的器件参数,器件参数具体可以包括器件结构图像。
具体的,编码解码模块包括编码器和解码器,其中,编码器是一个神经网络,其输入和输出分别是数据点x和隐藏表示z,如图3所示,每个x由N个特征描述,是N维的,每个z由K个特征描述,并且是K维的,其中K<N。解码器是另一个神经网络,其输入和输出分别是潜在表示z和重构编码解码模块通过多次训练迭代优化过程将原始x和重构之间的差异最小化,因此,编码解码模块为数据x创建了瓶颈,确保只有信息的主要结构化部分可以被编码器通过并被解码器重构,从而实现对重构参数的特征提取得到特征参数,接着由输出层输出器件的最终结构图像。
具体的,逆网络能在几秒钟内生成数千个器件,因此可以在较低的计算成本下,使用训练好的逆网络制作大型数据集,以生成不同器件参数。
S102:将器件参数和真实样本输入判别网络,并使判别网络使用器件参数和真实样本进行对抗训练得到第一调整参数,基于第一调整参数对逆网络和判别网络进行第一参数更新操作,直至利用逆网络根据目标电磁光谱响应生成的器件参数满足真实条件;
具体的,同样参照图2,判别网络具体包括一个卷积层、一个BN层、两个全连接层以及输出层,最后一个全连接层的神经元个数为1,输出一个二分类结果。判别网络使用真实样本和逆网络生成的器件参数作为假样本共同进行训练,在训练过程中尽量使真实样本的输出结果为1,逆网络生成的假样本的输出结果为0。经过多轮训练后,最终生成分布和真实分布重合,从而使判别模型无法区分真实图像和逆网络生成的器件图像,进而使逆网络生成的器件参数更加接近真实器件结构,提升器件结构的性能。
作为一种可选的实施例,使判别网络使用器件参数和真实样本进行对抗训练得到第一调整参数,基于第一调整参数对逆网络和判别网络进行第一参数更新操作的过程包括:使判别网络使用器件参数和真实样本进行对抗训练,得到器件参数为真实参数的概率;判断概率是否为目标值;若否,获取第一调整参数,并基于第一调整参数对逆网络和判别网络进行第一参数更新操作;若是,判定利用逆网络根据目标电磁光谱响应生成的器件参数满足真实条件。
具体的,请参照图4,图4为使用器件参数和真实样本对判别网络进行对抗训练的流程图,包括:将器件参数作为假样本和真实样本输入判别网络进行训练,由判别网络判断输入的是真实样本还是假样本,判断输入为真实样本的概率是否为目标值0.5,若否,得到第一调整参数进行反向传播梯度更新,对逆网络和判别网络的权重值进行调整,直至逆网络生成的器件参数满足真实条件,即判别网络判定输入为真实样本的概率为0.5,此时判定逆网络输出的器件参数接近器件真实结构。
S103:将满足真实条件的器件参数输入前向预测网络得到实际电磁光谱响应,当实际电磁光谱响应和目标电磁光谱响应匹配时,输出逆网络生成的器件参数。
作为一种可选的实施例,将满足真实条件的器件参数输入前向预测网络得到实际电磁光谱响应之后,该器件参数获取方法还包括:获取实际电磁光谱响应和目标电磁光谱响应之间的损失函数;当损失函数收敛,判定实际电磁光谱响应和目标电磁光谱响应匹配;当损失函数未收敛,获取第二调整参数;基于第二调整参数对逆网络和前向预测网络进行第二参数更新操作,直至实际电磁光谱响应和目标电磁光谱响应匹配。
具体的,当逆网络生成的器件结构足够真实之后,然后优化生成器件的光谱性能,采用逆网络和前向预测网络进行联合训练,参照图2所示,前向预测网络包括输入层、全连接层、BN层和输出层,前向预测网络中加入BN层可以加速收敛,与逆网络结合可以解决逆问题的一对多问题。逆网络和前向预测网络的联合训练流程如图5所示,将逆网络的输出层作为前向网络的输入层,考虑到光学器件设计的逆运算存在一对多问题,因此通过求解前向预测网络输出的实际电磁光谱响应和输入逆网络的目标电磁光谱响应之间的损失函数来完成反向传播更新梯度,经过多次迭代后,逆网络得到的器件结构其光谱响应会得到较大提升,并且解决一对多问题,其中,损失函数可以采用交叉熵损失函数。
参照上文所述,在对判别网络和前向预测网络进行训练时,需要用到真实样本,基于此,本申请还包括预先构建数据集以提供判别网络和前向预测网络需要的真实样本的操作。
具体的,可以采用COMSOL软件构建数据集,用以训练前向预测网络和判别网络,采用COMSOL软件构建数据集的过程参照图6所示,首先确定器件结构参数及各器件结构参数的取值范围,在取值范围内,分别设定各个参数,根据具体参数,利用MATLAB构建二维矩阵,绘制二值图像表征器件结构,再通过COMSOL仿真软件对各表征器件结构的二值图像进行仿真得到对应的电磁光谱响应。
以器件为亚波长金属线栅为例,器件结构包括基底和金属线栅,如图7所示,图8为六种参考亚波长金属线栅样式,COMSOL仿真软件需要输入的必要器件结构参数包括但不限于金属线栅曲率、旋转角、占空比、厚度和周期等参数,其中还需设置包括基底、金属线栅以及空气等介质的材料折射率等额外参数,输出参数为对应波段的电磁响应,例如反射率谱、透过率谱或者偏振消光比曲线等光学响应。关于输入的器件结构参数:金属线栅的曲率r∈(0,180°],增量为5°,一共36个变量;金属线栅旋转角R∈(0,180°],增量为5°,一共36个变量;金属线栅占空比f∈(0,1),增量为0.1,一共8个变量;金属线栅厚度h根据工艺条件等一般在[20,200nm],增量为20nm,一共10个变量;周期需要亚波长条件为d<(λ/5)。根据上面的r,R,f,h或d等参数,使用MATLAB构建120×120二维矩阵表征金属线栅图案,矩阵元素为0或1,代表有无金属。
然后将器件基底选择锗,工作波长λ∈[3,12μm],增量为0.5μm,入射角θ∈[-65°,65°],增量5°。再根据每个波长和角度对,使用不同的结构参数构建器件,生成一系列对应的电磁光谱响应。最后根据需求设定响应阈值,高于阈值为优质器件,低于阈值的器件则舍弃。
最终采用COMSOL生成的高质量的训练集,该训练集由3000张图像组成,用于前向预测网络和判别网络的训练,这个初始训练集比传统机器视觉应用中使用的训练集要小几个数量级。
请参照图9所示,图9为前向预测网络的预训练流程,该预训练过程为正常的神经网络训练过程,包括采用pytorch或者tensorflow构建网络结构,包括全连接层、BN层、全连接层和输出层。可以理解的是,加入BN层可以加快网络迭代速率,从根本上讲,BN层是对不同样本的同一特征做归一化。设输入为B={x1…m},学习的超参数为γ和β,输出为yi=BNγ,β(xi),其具体计算过程为:
输出层代表生成的电磁光谱响应,输出层的节点个数代表将给定波段光谱图离散后的点个数,若输入波段为3~12μm,以0.5μm间隔离散化,则输出层节点个数为19。
网络构建完毕后设定超参数,采用mini batch训练法,batch size设定为32。其中利用前向预测网络输出的实际光谱响应和COMSOL仿真得到的光谱响应之间的损失函数完成反向传播更新梯度,其中损失函数可以采用交叉熵损失函数(cross-entropy lossfunction),具体计算公式为:
综上所述,本申请所提出的一种基于改进的神经网络的器件参数获取方法,改进的神经网络包括逆网络、判别网络和前向预测网络,可以为特定电磁光谱响应优化出对应的器件结构,通过将逆网络和判别网络结合,可快速生成较大训练集,可优化生成的器件图像,使其结构更接近真实图像,提升器件的可靠性和鲁棒性,同时在逆网络中加入编码解码模块,获取器件的大规模拓扑特征,从整体上提高了网络训练过程的准确性,并且以较低的空间分辨率进行训练可以大幅降低计算成本。采用加入BN层的判别网络和前向预测网络,加快网络收敛速度,再将训练后的逆网络与前向预测网络结合,在提升网络输出器件性能的基础上,解决逆运算的一对多问题。最终所发明的神经网络可以在输入为期望的电磁光谱响应下,输出性能较高的器件参数。采用本申请的方案有利于解决亚波长光学器件设计逆问题的推广,并且在训练好的深度学习网络的基础上进行微调,执行光学器件设计的推断任务,可以大大提升亚波长器件的设计效率。除此之外,本发明提出的方法对其它亚波长器件,例如二维超表面结构、体光栅、抗反结构等器件的设计都具有通用性。
请参照图10,图10为本申请所提供的一种基于神经网络的器件参数获取系统的结构示意图,神经网络包括逆网络、判别网络和前向预测网络,该器件参数获取系统包括:
第一处理模块11,用于利用逆网络根据目标需求生成器件参数,目标需求包括目标电磁光谱响应;
调整模块12,用于将器件参数和真实样本输入判别网络,并使判别网络使用器件参数和真实样本进行对抗训练得到第一调整参数,基于第一调整参数对逆网络和判别网络进行第一参数更新操作,直至利用逆网络根据目标电磁光谱响应生成的器件参数满足真实条件;
第二处理模块13,用于将满足真实条件的器件参数输入前向预测网络得到实际电磁光谱响应,当实际电磁光谱响应和目标电磁光谱响应匹配时,输出逆网络生成的器件参数。
可见,本实施例中,通过逆网络、判别网络和前向预测网络构成的神经网络为目标电磁光谱响应优化出对应的器件参数,本申请中将逆网络和判别网络结合对抗训练,优化生成的器件参数,使其接近真实参数,同时生成对抗网络所需训练数据集小,节省了硬件资源,提高了神经网络的鲁棒性,再将逆网络生成的满足真实条件的器件参数输入前向预测网络,实现逆网络和前向预测网络结合训练,当实际电磁光谱响应和目标电磁光谱响应匹配时,再输出逆网络生成的器件参数,优化生成的器件性能,在输入为期望的目标电磁光谱响应下,输出性能较高的器件参数。
作为一种可选的实施例,目标需求为包括目标电磁光谱响应、目标入射角、目标器件材料折射率及模拟随机噪声的一维向量。
作为一种可选的实施例,利用逆网络根据目标需求生成器件参数的过程包括:
将目标需求输入逆网络,使逆网络基于目标需求得到重构参数,对重构参数进行特征提取生成器件参数。
作为一种可选的实施例,逆网络包括转置卷积层和编码解码模块;
将目标需求输入逆网络,使逆网络基于目标需求得到重构参数,对重构参数进行特征提取生成器件参数的过程包括:
将目标需求输入逆网络;
通过转置卷积层基于目标需求进行上采样得到重构参数;
通过编码解码模块从重构参数中提取特征参数,利用特征参数生成器件参数。
作为一种可选的实施例,使判别网络使用器件参数和真实样本进行对抗训练得到第一调整参数,基于第一调整参数对逆网络和判别网络进行第一参数更新操作的过程包括:
使判别网络使用器件参数和真实样本进行对抗训练,得到器件参数为真实参数的概率;
判断概率是否为目标值;
若否,获取第一调整参数,并基于第一调整参数对逆网络和判别网络进行第一参数更新操作;
若是,判定利用逆网络根据目标电磁光谱响应生成的器件参数满足真实条件。
作为一种可选的实施例,将满足真实条件的器件参数输入前向预测网络得到实际电磁光谱响应之后,该器件参数获取系统还包括:
获取模块,用于获取实际电磁光谱响应和目标电磁光谱响应之间的损失函数;
第二处理模块13,还用于当损失函数收敛,判定实际电磁光谱响应和目标电磁光谱响应匹配。
作为一种可选的实施例,第二处理模块13还用于:
获取实际电磁光谱响应和目标电磁光谱响应之间的损失函数之后,若损失函数未收敛,获取第二调整参数;基于第二调整参数对逆网络和前向预测网络进行第二参数更新操作,直至实际电磁光谱响应和目标电磁光谱响应匹配。
作为一种可选的实施例,前向预测网络和判别网络均包括BN层。
请参照图11,图11为本申请所提供的一种基于神经网络的器件参数获取装置的结构示意图,该器件参数获取装置包括:
存储器21,用于存储计算机程序;
处理器22,用于执行计算机程序时实现如上文任意一个实施例所描述的基于神经网络的器件参数获取方法的步骤。
具体的,存储器21包括非易失性存储介质、内存储器21。该非易失性存储介质存储有操作系统和计算机可读指令,该内存储器21为非易失性存储介质中的操作系统和计算机可读指令的运行提供环境。处理器22执行存储器21中保存的计算机程序时,可以实现以下步骤:利用逆网络根据目标需求生成器件参数,目标需求包括目标电磁光谱响应;将器件参数和真实样本输入判别网络,并使判别网络使用器件参数和真实样本进行对抗训练得到第一调整参数,基于第一调整参数对逆网络和判别网络进行第一参数更新操作,直至利用逆网络根据目标电磁光谱响应生成的器件参数满足真实条件;将满足真实条件的器件参数输入前向预测网络得到实际电磁光谱响应,当实际电磁光谱响应和目标电磁光谱响应匹配时,输出逆网络生成的器件参数。
可见,本实施例中,通过逆网络、判别网络和前向预测网络构成的神经网络为目标电磁光谱响应优化出对应的器件参数,本申请中将逆网络和判别网络结合对抗训练,优化生成的器件参数,使其接近真实参数,同时生成对抗网络所需训练数据集小,节省了硬件资源,提高了神经网络的鲁棒性,再将逆网络生成的满足真实条件的器件参数输入前向预测网络,实现逆网络和前向预测网络结合训练,当实际电磁光谱响应和目标电磁光谱响应匹配时,再输出逆网络生成的器件参数,优化生成的器件性能,在输入为期望的目标电磁光谱响应下,输出性能较高的器件参数。
作为一种可选的实施例,处理器22执行存储器21中保存的计算机子程序时,可以实现以下步骤:将目标需求输入逆网络,使逆网络基于目标需求得到重构参数,对重构参数进行特征提取生成器件参数。
作为一种可选的实施例,处理器22执行存储器21中保存的计算机子程序时,可以实现以下步骤:将目标需求输入逆网络;通过转置卷积层基于目标需求进行上采样得到重构参数;通过编码解码模块从重构参数中提取特征参数,利用特征参数生成器件参数。
作为一种可选的实施例,处理器22执行存储器21中保存的计算机子程序时,可以实现以下步骤:使判别网络使用器件参数和真实样本进行对抗训练,得到器件参数为真实参数的概率;判断概率是否为目标值;若否,获取第一调整参数,并基于第一调整参数对逆网络和判别网络进行第一参数更新操作;若是,判定利用逆网络根据目标电磁光谱响应生成的器件参数满足真实条件。
作为一种可选的实施例,处理器22执行存储器21中保存的计算机子程序时,可以实现以下步骤:获取实际电磁光谱响应和目标电磁光谱响应之间的损失函数;当损失函数收敛,判定实际电磁光谱响应和目标电磁光谱响应匹配。
作为一种可选的实施例,处理器22执行存储器21中保存的计算机子程序时,可以实现以下步骤:当损失函数未收敛,获取第二调整参数;基于第二调整参数对逆网络和前向预测网络进行第二参数更新操作,直至实际电磁光谱响应和目标电磁光谱响应匹配。
在上述实施例的基础上,作为优选实施方式,参见图12,图12为本申请实施例提供的另一种基于神经网络的器件参数获取装置的结构示意图,该基于神经网络的器件参数获取装置还包括:
输入接口23,与处理器22相连,用于获取外部导入的计算机程序、参数和指令,经处理器22控制保存至存储器21中。该输入接口23可以与输入装置相连,接收用户手动输入的参数或指令。该输入装置可以是显示屏上覆盖的触摸层,也可以是终端外壳上设置的按键、轨迹球或触控板。
显示单元24,与处理器22相连,用于显示处理器22发送的数据。该显示单元24可以为液晶显示屏或者电子墨水显示屏等。
网络端口25,与处理器22相连,用于与外部各终端设备进行通信连接。该通信连接所采用的通信技术可以为有线通信技术或无线通信技术,如移动高清链接技术(MHL)、通用串行总线(USB)、高清多媒体接口(HDMI)、无线保真技术(WiFi)、蓝牙通信技术、低功耗蓝牙通信技术、基于IEEE802.11s的通信技术等。
另一方面,本申请还提供了一种计算机可读存储介质,计算机可读存储介质上存储有计算机程序,计算机程序被处理器执行时实现如上文任意一个实施例所描述的基于神经网络的器件参数获取方法的步骤。
具体的,本申请还提供了一种计算机可读存储介质,该计算机可读存储介质可以包括:U盘、移动硬盘、只读存储器(Read-Only Memory,ROM)、随机存取存储器(RandomAccess Memory,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。该存储介质上存储有计算机程序,计算机程序被处理器执行时实现以下步骤:利用逆网络根据目标需求生成器件参数,目标需求包括目标电磁光谱响应;将器件参数和真实样本输入判别网络,并使判别网络使用器件参数和真实样本进行对抗训练得到第一调整参数,基于第一调整参数对逆网络和判别网络进行第一参数更新操作,直至利用逆网络根据目标电磁光谱响应生成的器件参数满足真实条件;将满足真实条件的器件参数输入前向预测网络得到实际电磁光谱响应,当实际电磁光谱响应和目标电磁光谱响应匹配时,输出逆网络生成的器件参数。
可见,本实施例中,通过逆网络、判别网络和前向预测网络构成的神经网络为目标电磁光谱响应优化出对应的器件参数,本申请中将逆网络和判别网络结合对抗训练,优化生成的器件参数,使其接近真实参数,同时生成对抗网络所需训练数据集小,节省了硬件资源,提高了神经网络的鲁棒性,再将逆网络生成的满足真实条件的器件参数输入前向预测网络,实现逆网络和前向预测网络结合训练,当实际电磁光谱响应和目标电磁光谱响应匹配时,再输出逆网络生成的器件参数,优化生成的器件性能,在输入为期望的目标电磁光谱响应下,输出性能较高的器件参数。
作为一种可选的实施例,计算机可读存储介质中存储的计算机子程序被处理器执行时,具体可以实现以下步骤:将目标需求输入逆网络,使逆网络基于目标需求得到重构参数,对重构参数进行特征提取生成器件参数。
作为一种可选的实施例,计算机可读存储介质中存储的计算机子程序被处理器执行时,具体可以实现以下步骤:将目标需求输入逆网络;通过转置卷积层基于目标需求进行上采样得到重构参数;通过编码解码模块从重构参数中提取特征参数,利用特征参数生成器件参数。
作为一种可选的实施例,计算机可读存储介质中存储的计算机子程序被处理器执行时,具体可以实现以下步骤:使判别网络使用器件参数和真实样本进行对抗训练,得到器件参数为真实参数的概率;判断概率是否为目标值;若否,获取第一调整参数,并基于第一调整参数对逆网络和判别网络进行第一参数更新操作;若是,判定利用逆网络根据目标电磁光谱响应生成的器件参数满足真实条件。
作为一种可选的实施例,计算机可读存储介质中存储的计算机子程序被处理器执行时,具体可以实现以下步骤:获取实际电磁光谱响应和目标电磁光谱响应之间的损失函数;当损失函数收敛,判定实际电磁光谱响应和目标电磁光谱响应匹配。
作为一种可选的实施例,计算机可读存储介质中存储的计算机子程序被处理器执行时,具体可以实现以下步骤:当损失函数未收敛,获取第二调整参数;基于第二调整参数对逆网络和前向预测网络进行第二参数更新操作,直至实际电磁光谱响应和目标电磁光谱响应匹配。
还需要说明的是,在本说明书中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的状况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本申请。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本申请的精神或范围的情况下,在其他实施例中实现。因此,本申请将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。
Claims (11)
1.一种基于神经网络的器件参数获取方法,其特征在于,神经网络包括逆网络、判别网络和前向预测网络,该器件参数获取方法包括:
利用所述逆网络根据目标需求生成器件参数,所述目标需求包括目标电磁光谱响应;
将所述器件参数和真实样本输入所述判别网络,并使所述判别网络使用所述器件参数和所述真实样本进行对抗训练得到第一调整参数,基于所述第一调整参数对所述逆网络和所述判别网络进行第一参数更新操作,直至利用所述逆网络根据所述目标电磁光谱响应生成的所述器件参数满足真实条件;
将满足所述真实条件的所述器件参数输入所述前向预测网络得到实际电磁光谱响应,当所述实际电磁光谱响应和所述目标电磁光谱响应匹配时,输出所述逆网络生成的所述器件参数。
2.根据权利要求1所述的器件参数获取方法,其特征在于,所述目标需求为包括所述目标电磁光谱响应、目标入射角、目标器件材料折射率及模拟随机噪声的一维向量。
3.根据权利要求1所述的器件参数获取方法,其特征在于,所述利用所述逆网络根据目标需求生成器件参数的过程包括:
将所述目标需求输入所述逆网络,使所述逆网络基于所述目标需求得到重构参数,对所述重构参数进行特征提取生成器件参数。
4.根据权利要求3所述的器件参数获取方法,其特征在于,所述逆网络包括转置卷积层和编码解码模块;
所述将所述目标需求输入所述逆网络,使所述逆网络基于所述目标需求得到重构参数,对所述重构参数进行特征提取生成器件参数的过程包括:
将所述目标需求输入所述逆网络;
通过所述转置卷积层基于所述目标需求进行上采样得到重构参数;
通过所述编码解码模块从所述重构参数中提取特征参数,利用所述特征参数生成器件参数。
5.根据权利要求1所述的器件参数获取方法,其特征在于,所述使所述判别网络使用所述器件参数和所述真实样本进行对抗训练得到第一调整参数,基于所述第一调整参数对所述逆网络和所述判别网络进行第一参数更新操作的过程包括:
使所述判别网络使用所述器件参数和所述真实样本进行对抗训练,得到所述器件参数为真实参数的概率;
判断所述概率是否为目标值;
若否,获取第一调整参数,并基于所述第一调整参数对所述逆网络和所述判别网络进行第一参数更新操作;
若是,判定利用所述逆网络根据所述目标电磁光谱响应生成的所述器件参数满足真实条件。
6.根据权利要求1所述的器件参数获取方法,其特征在于,所述将满足所述真实条件的所述器件参数输入所述前向预测网络得到实际电磁光谱响应之后,该器件参数获取方法还包括:
获取所述实际电磁光谱响应和目标电磁光谱响应之间的损失函数;
当所述损失函数收敛,判定所述实际电磁光谱响应和所述目标电磁光谱响应匹配。
7.根据权利要求6所述的器件参数获取方法,其特征在于,所述获取所述实际电磁光谱响应和目标电磁光谱响应之间的损失函数之后,该器件参数获取方法还包括:
当所述损失函数未收敛,获取第二调整参数;
基于所述第二调整参数对所述逆网络和所述前向预测网络进行第二参数更新操作,直至所述实际电磁光谱响应和所述目标电磁光谱响应匹配。
8.根据权利要求1-7任意一项所述的器件参数获取方法,其特征在于,所述前向预测网络和所述判别网络均包括BN层。
9.一种基于神经网络的器件参数获取系统,其特征在于,神经网络包括逆网络、判别网络和前向预测网络,该器件参数获取系统包括:
第一处理模块,用于利用所述逆网络根据目标需求生成器件参数,所述目标需求包括目标电磁光谱响应;
调整模块,用于将所述器件参数和真实样本输入所述判别网络,并使所述判别网络使用所述器件参数和所述真实样本进行对抗训练得到第一调整参数,基于所述第一调整参数对所述逆网络和所述判别网络进行第一参数更新操作,直至利用所述逆网络根据所述目标电磁光谱响应生成的所述器件参数满足真实条件;
第二处理模块,用于将满足所述真实条件的所述器件参数输入所述前向预测网络得到实际电磁光谱响应,当所述实际电磁光谱响应和所述目标电磁光谱响应匹配时,输出所述逆网络生成的所述器件参数。
10.一种基于神经网络的器件参数获取装置,其特征在于,包括:
存储器,用于存储计算机程序;
处理器,用于执行所述计算机程序时实现如权利要求1-8任意一项所述的基于神经网络的器件参数获取方法的步骤。
11.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如权利要求1-8任意一项所述的基于神经网络的器件参数获取方法的步骤。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111450077.5A CN114329900A (zh) | 2021-11-30 | 2021-11-30 | 一种基于神经网络的器件参数获取方法、系统及相关组件 |
PCT/CN2022/101937 WO2023098053A1 (zh) | 2021-11-30 | 2022-06-28 | 一种基于神经网络的器件参数获取方法、系统及相关组件 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111450077.5A CN114329900A (zh) | 2021-11-30 | 2021-11-30 | 一种基于神经网络的器件参数获取方法、系统及相关组件 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN114329900A true CN114329900A (zh) | 2022-04-12 |
Family
ID=81049020
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111450077.5A Pending CN114329900A (zh) | 2021-11-30 | 2021-11-30 | 一种基于神经网络的器件参数获取方法、系统及相关组件 |
Country Status (2)
Country | Link |
---|---|
CN (1) | CN114329900A (zh) |
WO (1) | WO2023098053A1 (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2023098053A1 (zh) * | 2021-11-30 | 2023-06-08 | 浪潮电子信息产业股份有限公司 | 一种基于神经网络的器件参数获取方法、系统及相关组件 |
CN116911349A (zh) * | 2023-09-13 | 2023-10-20 | 华南师范大学 | 光学纳米天线结构预测网络训练方法、预测方法及装置 |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11537898B2 (en) * | 2019-10-02 | 2022-12-27 | Samsung Electronics Co., Ltd. | Generative structure-property inverse computational co-design of materials |
US11251896B2 (en) * | 2020-03-03 | 2022-02-15 | Mitsubishi Electric Research Laboratories, Inc. | Generative model for inverse design of materials, devices, and structures |
CN111551252B (zh) * | 2020-04-24 | 2021-08-17 | 浙江大学 | 一种基于神经网络的光谱响应设计方法 |
CN112733387A (zh) * | 2021-01-26 | 2021-04-30 | 苏州大学 | 纳米材料的参数获取的方法和系统 |
CN114329900A (zh) * | 2021-11-30 | 2022-04-12 | 浪潮电子信息产业股份有限公司 | 一种基于神经网络的器件参数获取方法、系统及相关组件 |
-
2021
- 2021-11-30 CN CN202111450077.5A patent/CN114329900A/zh active Pending
-
2022
- 2022-06-28 WO PCT/CN2022/101937 patent/WO2023098053A1/zh unknown
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2023098053A1 (zh) * | 2021-11-30 | 2023-06-08 | 浪潮电子信息产业股份有限公司 | 一种基于神经网络的器件参数获取方法、系统及相关组件 |
CN116911349A (zh) * | 2023-09-13 | 2023-10-20 | 华南师范大学 | 光学纳米天线结构预测网络训练方法、预测方法及装置 |
CN116911349B (zh) * | 2023-09-13 | 2024-01-09 | 华南师范大学 | 光学纳米天线结构预测网络训练方法、预测方法及装置 |
Also Published As
Publication number | Publication date |
---|---|
WO2023098053A1 (zh) | 2023-06-08 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Gong et al. | A multiobjective sparse feature learning model for deep neural networks | |
Cheng et al. | Rethinking Bayesian learning for data analysis: The art of prior and inference in sparsity-aware modeling | |
CN110059878B (zh) | 基于cnn lstm光伏发电功率预测模型及其构建方法 | |
Ma et al. | DeePr-ESN: A deep projection-encoding echo-state network | |
Chen et al. | MO-PaDGAN: Reparameterizing Engineering Designs for augmented multi-objective optimization | |
WO2023098053A1 (zh) | 一种基于神经网络的器件参数获取方法、系统及相关组件 | |
Azizzadenesheli et al. | Neural operators for accelerating scientific simulations and design | |
CN112699215B (zh) | 基于胶囊网络与交互注意力机制的评级预测方法及系统 | |
Tan et al. | Knowledge transfer in evolutionary multi-task optimization: A survey | |
Li et al. | Automatic densenet sparsification | |
CN116188941A (zh) | 一种基于松弛标注的流形正则化宽度学习方法及系统 | |
Ward et al. | A practical tutorial on graph neural networks | |
CN114334013A (zh) | 一种单细胞聚类方法、装置、设备及可读存储介质 | |
Hanyu et al. | Fuzzy relational matrix factorization and its granular characterization in data description | |
CN116956993A (zh) | 一种构建图集成模型的方法、装置及存储介质 | |
CN116522232A (zh) | 文档分类方法、装置、设备及存储介质 | |
Dai et al. | Multimodal deep learning water level forecasting model for multiscale drought alert in Feiyun River basin | |
CN111523647B (zh) | 网络模型训练方法及装置、特征选择模型、方法及装置 | |
Zhang et al. | Low‐rank constrained weighted discriminative regression for multi‐view feature learning | |
Xia et al. | VI-DGP: A variational inference method with deep generative prior for solving high-dimensional inverse problems | |
Wang et al. | Neural Network | |
Li et al. | Overview of deep convolutional neural network pruning | |
Zhai et al. | Quadratic Matrix Factorization With Applications to Manifold Learning | |
Yu et al. | Dual-drive collaboration surrogate-assisted evolutionary algorithm by coupling feature reduction and reconstruction | |
Bu | Achieving More with Less: Learning Generalizable Neural Networks With Less Labeled Data and Computational Overheads |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |