CN113569469A - 一种用于设计高性能闪耀光栅结构的预测网络的构建方法 - Google Patents
一种用于设计高性能闪耀光栅结构的预测网络的构建方法 Download PDFInfo
- Publication number
- CN113569469A CN113569469A CN202110796807.0A CN202110796807A CN113569469A CN 113569469 A CN113569469 A CN 113569469A CN 202110796807 A CN202110796807 A CN 202110796807A CN 113569469 A CN113569469 A CN 113569469A
- Authority
- CN
- China
- Prior art keywords
- vector
- layer
- neural network
- blazed grating
- grating structure
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F30/00—Computer-aided design [CAD]
- G06F30/20—Design optimisation, verification or simulation
- G06F30/27—Design optimisation, verification or simulation using machine learning, e.g. artificial intelligence, neural networks, support vector machines [SVM] or training a model
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F30/00—Computer-aided design [CAD]
- G06F30/30—Circuit design
- G06F30/36—Circuit design at the analogue level
- G06F30/367—Design verification, e.g. using simulation, simulation program with integrated circuit emphasis [SPICE], direct methods or relaxation methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Evolutionary Computation (AREA)
- Computer Hardware Design (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- Software Systems (AREA)
- Data Mining & Analysis (AREA)
- Biophysics (AREA)
- Mathematical Physics (AREA)
- Computing Systems (AREA)
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Biomedical Technology (AREA)
- Geometry (AREA)
- Computational Linguistics (AREA)
- Molecular Biology (AREA)
- General Health & Medical Sciences (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Microelectronics & Electronic Packaging (AREA)
- Medical Informatics (AREA)
- Diffracting Gratings Or Hologram Optical Elements (AREA)
- Image Analysis (AREA)
Abstract
本案涉及一种用于设计高性能闪耀光栅结构的预测网络的构建方法,其步骤为:利用时域有限差分法计算出目标闪耀光栅远场模式,在模式的中间切割一定像素作为训练数据,并放入一个由编码器和解码器两部分组成的自动编码器,经过数次迭代训练后,获得训练完成的隐向量和解码器;再将光栅结构参数和隐向量放入一个前馈神经网络中,经过数次迭代训练,训练完成后将之前得到的解码器接在该神经网络之后,即可作为最终的预测网络使用。本发明提出的预测网络模型在实际测试中有95%以上的精度,同时将闪耀光栅耦合器仿真速度缩小到毫秒量级,相比传统计算方法提高了数万倍,可以极大地提高相关设计的效率,因而具有广泛的应用价值和应用前景。
Description
技术领域
本发明属于计算机辅助设计领域,具体涉及一种用于设计高性能闪耀光栅结构的神经网络。
背景技术
光栅耦合器是目前最受关注的耦合器件类型之一,已广泛应用于微电子电路,光网络和光电器件等领域。传统周期性光栅结构虽然已广泛应用于光子学设计中,在实际应用中依然存在较大的限制,例如在多缝衍射过程中,周期性光栅光强主要集中在零级,而多数情况下零级方向的衍射光并不能满足导模传输条件。闪耀光栅耦合器由两个或多个周期性非刻蚀部分模拟了阶梯状闪耀光栅,可以有效的克服传统周期性光栅结构遇到的诸多问题,具备在多个角度获得大光强的潜力。然而闪耀光栅耦合器设计需要经过困难的建模和电磁仿真过程,预测其远场结果时间消耗巨大。
针对闪耀光栅耦合器设计上的各种不足已经提出多种解决办法,例如利用时域有限差分法进行计算,利用机器学习方法等;然而很少有人注意到利用自动编码器训练神经网络也是提高光栅耦合器设计效率的重要途径。
发明内容
本发明的目的在于提供一种利用神经网络预测远场光谱、合成远场模式,并有效地预测与远场模式相对应的参数值,将电弧光栅耦合器的电磁模拟速度降低到毫秒数量级的预测网络。
为实现上述目的,本发明提供如下技术方案:
一种用于设计高性能闪耀光栅结构的预测网络的构建方法,包括如下步骤:
1)利用时域有限差分法计算出768个不同刻蚀参数的闪耀光栅远场模式;
2)在所述闪耀光栅远场模式的中间切割51×200像素,展开为10200维的原始数据;
4)将光栅的结构参数α、l、d、w0、w1、w2、w3以及入射光波长λ共8个参数作为输入向量放入一个前馈神经网络中,以3)中得到对应相同远场模式的最终隐向量z作为目标,进行1000次迭代训练,使输出向量y无限接近最终隐向量z,获得训练后的神经网络;
5)将3)中训练后的解码器连接到4)中训练后的神经网络之后,形成的新的神经网络即为最终的预测网络。
在上述技术方案中,所述自动编码器由编码器(Encoder)和初始解码器(Decoder)两部分组成;所述编码器用于对输入向量yi进行编码得到100维的隐向量z,所述初始解码器用于对隐向量z重构成输出向量使输出向量无限接近输入向量yi即得最终隐向量z。在上述技术方案中,所述自动编码器中训练过程中的损失函数表达式为:
其中,m表示向量维度,上述公式中的MSE无限接近0。
在上述技术方案中,所述自动编码器和前馈神经网络中均固定有一个输入层、一个输出层和数个隐藏层;每一层均由最小单位神经元组成。所述神经元的参数为:输入向量x={x1,x2,...,xn},权重向量a={a1,a2,...,an},偏置量b,输出值y,激活函数σ(y),激活函数表达式如下:
其中e为自然常数。
在上述技术方案中,所述自动编码器的输入层的神经元数量为10200;输出层的神经元数量为10200;隐藏层的数量为5层,每一层的神经元数量分别为2000,2000,1000,2000,2000。
在上述技术方案中,所述前馈神经网络的输入层的神经元数量为8;输出层的神经元数量为1000;隐藏层数量为3层,每一层的神经元数量分别为100,100,100。
在上述技术方案中,所述前馈神经网络训练过程中使用梯度下降算法,依据损失函数L的梯度更新每一层的参数θ,损失函数及参数θ的公式为:
其中,上角标n表示前馈神经网络的最后一层,即第n层,上角标i表示前馈神经网络的第i层,学习速率η的值为0.01。
与现有技术相比,本发明的有益效果是:
与传统的电磁仿真过程相比,本发明中的用于预测远场模式的神经网络在实际测试中有95%以上的精度,同时将闪耀光栅耦合器仿真速度缩小到毫秒量级,相比传统计算方法提高了数万倍,可以极大地提高相关逆向设计的效率,因而具有广泛的应用价值和应用前景。
附图说明
图1为本发明实施例1的闪耀光栅结构设计图。
图2为本发明实施例1的优化前后光栅的远场强度对比图。
图3为本发明实施例1的自动编码器示意图。
图4为本发明实施例1的预测网络的构建示意图。
图5为本发明实施例1的预测网络与实际结果的预测对比图。
具体实施方式
下面将结合附图对本发明的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
此外,下面所描述的本发明不同实施方式中所涉及的技术特征只要彼此之间未构成冲突就可以相互结合。
实施例1:
步骤1、使用Lumerical公司的FDTD软件计算出图1中闪耀光栅的远场模式,并通过改变光波长λ以及w0、w1、w2、w3四项结构参数收集训练数据,其中:
λ=[1.50,1.55,1.60]微米
w0=[0.2,0.3,0.4,0.5]微米
w1=[0.5,0.6,0.7,0.8]微米
w2=[0.2,0.3,0.4,0.5]微米
w3=[0.5,0.6,0.7,0.8]微米。
图1中incident代表入射光,λ代表光的波长,α代表扇角,l代表光栅在刻槽前的长度,d代表刻蚀深度,w0、w1、w2、w3代表刻槽宽度。
步骤2、在所述闪耀光栅远场模式的中间切割51x200像素,展开为10200维的原始数据;如图3所示,将原始数据作为输入向量yi放入一个自动编码器中,经过1000次迭代训练,使得输出向量无限接近输入向量yi,获得最终隐向量z(Latent vector)和训练后的解码器。
所述自动编码器由编码器(Encoder)和初始解码器(Decoder)两部分组成,原始数据(输入向量yi)在通过编码器后被编码为100维的隐向量z,隐向量z再通过初始解码器重构成训练数据(输出向量);使训练数据(输出向量)无限接近原始数据(输入向量yi)即得最终隐向量z。自动编码器训练过程中的损失函数表达式为:
其中,m表示向量维度,上述公式中的MSE无限接近0。
步骤3、将光栅的结构参数α、l、d、w0、w1、w2、w3以及入射光波长λ共8个参数作为输入向量放入一个前馈神经网络中,以步骤2中得到的相同远场模式的最终隐向量z作为目标,进行1000次迭代训练,使输出向量y无限接近最终隐向量z,获得训练后的神经网络;前馈神经网络训练过程中使用梯度下降算法,依据损失函数L的梯度更新每一层的参数θ,损失函数及参数θ的公式为:
其中,上角标n表示前馈神经网络的最后一层,即第n层,上角标i表示前馈神经网络的第i层,学习速率η的值为0.01。
在上述实施例中,所述自动编码器和前馈神经网络中均固定有一个输入层、一个输出层和数个隐藏层;每一层均由最小单位神经元组成;神经元的参数为:输入向量x={x1,x2,...,xn},权重向量a={a1,a2,...,an},偏置量b,输出值y,激活函数σ(y),激活函数表达式如下:
其中e为自然常数。
所述自动编码器的输入层的神经元数量为10200;输出层的神经元数量为10200;隐藏层的数量为5层,每一层的神经元数量分别为2000,2000,1000,2000,2000。
所述前馈神经网络的输入层的神经元数量为8;输出层的神经元数量为1000;隐藏层数量为3层,每一层的神经元数量分别为100,100,100。
步骤4、将步骤2)中训练后的解码器连接到步骤3)中训练后的神经网络之后,形成的新的神经网络即为最终的预测网络(图4)。
本发明的原理是:利用神经网络通过训练样本迭代参数进行学习的特性,以及自动编码器将输入向量编码为低维的隐向量,再通过解码器将隐向量重构回输入向量的特点。通过对该自动编码器进行迭代训练,将训练后的解码器部分作为预测网络使用,设计出了一种新型方案用于快速得到光栅远场模式的算法,大大的降低了单次计算所需的时间。
图2为优化前的光栅(a~c)和优化后光栅(d~f)远场强度对比图,可以看出在1500nm、1550nm、1600nm三种波长下,优化后光栅的远场强度比优化前的光栅大约20倍。
图5为本发明所述的实施例1的神经网络预测与FDTD计算的实际结果的对比图,从图中可以看到,与实际结果相比,预测结果达到了很高的精度(95%以上),成功构建的预测网络可以将单次计算提升至毫秒级。
Claims (7)
1.一种用于设计高性能闪耀光栅结构的预测网络的构建方法,其特征在于,包括如下步骤:
1)利用时域有限差分法计算出768个不同刻蚀参数的闪耀光栅远场模式;
2)在所述闪耀光栅远场模式的中间切割51×200像素,展开为10200维的原始数据;
4)将光栅的结构参数α、l、d、w0、w1、w2、w3以及入射光波长λ共8个参数作为输入向量放入一个前馈神经网络中,以3)中得到对应相同远场模式的最终隐向量z作为目标,进行1000次迭代训练,使输出向量y无限接近最终隐向量z,获得训练后的神经网络;
5)将3)中训练后的解码器连接到4)中训练后的神经网络之后,形成的新的神经网络即为最终的预测网络。
5.如权利要求4所述的用于设计高性能闪耀光栅结构的预测网络的构建方法,其特征在于,所述自动编码器的输入层的神经元数量为10200;输出层的神经元数量为10200;隐藏层的数量为5层,每一层的神经元数量分别为2000,2000,1000,2000,2000。
6.如权利要求4所述的用于设计高性能闪耀光栅结构的预测网络的构建方法,其特征在于,所述前馈神经网络的输入层的神经元数量为8;输出层的神经元数量为1000;隐藏层数量为3层,每一层的神经元数量分别为100,100,100。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110796807.0A CN113569469B (zh) | 2021-07-14 | 2021-07-14 | 一种用于设计高性能闪耀光栅结构的预测网络的构建方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110796807.0A CN113569469B (zh) | 2021-07-14 | 2021-07-14 | 一种用于设计高性能闪耀光栅结构的预测网络的构建方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113569469A true CN113569469A (zh) | 2021-10-29 |
CN113569469B CN113569469B (zh) | 2023-10-03 |
Family
ID=78164722
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110796807.0A Active CN113569469B (zh) | 2021-07-14 | 2021-07-14 | 一种用于设计高性能闪耀光栅结构的预测网络的构建方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113569469B (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2024113512A1 (zh) * | 2022-12-02 | 2024-06-06 | 苏州苏大维格科技集团股份有限公司 | 基于深度学习神经网络的衍射元件的设计方法及系统 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109670580A (zh) * | 2018-12-21 | 2019-04-23 | 浙江工业大学 | 一种基于时间序列的数据修复方法 |
US20200111501A1 (en) * | 2018-10-05 | 2020-04-09 | Electronics And Telecommunications Research Institute | Audio signal encoding method and device, and audio signal decoding method and device |
CN111241287A (zh) * | 2020-01-16 | 2020-06-05 | 支付宝(杭州)信息技术有限公司 | 用于生成对抗文本的生成模型的训练方法及装置 |
KR20210070944A (ko) * | 2019-12-05 | 2021-06-15 | 한국전자통신연구원 | 픽셀-공간 예측을 이용하는 종단 간 압축을 위한 방법, 장치 및 기록 매체 |
-
2021
- 2021-07-14 CN CN202110796807.0A patent/CN113569469B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20200111501A1 (en) * | 2018-10-05 | 2020-04-09 | Electronics And Telecommunications Research Institute | Audio signal encoding method and device, and audio signal decoding method and device |
CN109670580A (zh) * | 2018-12-21 | 2019-04-23 | 浙江工业大学 | 一种基于时间序列的数据修复方法 |
KR20210070944A (ko) * | 2019-12-05 | 2021-06-15 | 한국전자통신연구원 | 픽셀-공간 예측을 이용하는 종단 간 압축을 위한 방법, 장치 및 기록 매체 |
CN111241287A (zh) * | 2020-01-16 | 2020-06-05 | 支付宝(杭州)信息技术有限公司 | 用于生成对抗文本的生成模型的训练方法及装置 |
Non-Patent Citations (2)
Title |
---|
刘灿;赖楚凡;蒋瑞珂;李彦达;杨昌和;林志贤;魏大同;袁晓如;: "深度学习驱动的可视化", 计算机辅助设计与图形学学报, no. 10 * |
陈子建;戴庆达;王文博;陈宇;朱红;李伙全;曾祥华;: "无线汽车轮胎防爆系统", 物联网技术, no. 09 * |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2024113512A1 (zh) * | 2022-12-02 | 2024-06-06 | 苏州苏大维格科技集团股份有限公司 | 基于深度学习神经网络的衍射元件的设计方法及系统 |
Also Published As
Publication number | Publication date |
---|---|
CN113569469B (zh) | 2023-10-03 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Park et al. | Free-form optimization of nanophotonic devices: from classical methods to deep learning | |
Li et al. | A hybrid short-term building electrical load forecasting model combining the periodic pattern, fuzzy system, and wavelet transform | |
Tu et al. | Analysis of deep neural network models for inverse design of silicon photonic grating coupler | |
da Silva Ferreira et al. | Towards an integrated evolutionary strategy and artificial neural network computational tool for designing photonic coupler devices | |
Lininger et al. | General inverse design of layered thin-film materials with convolutional neural networks | |
Liu et al. | Improved transformer model for enhanced monthly streamflow predictions of the Yangtze River | |
EP2572304A2 (en) | Computation efficiency by iterative spatial harmonics order truncation | |
Deng et al. | Hybrid inverse design of photonic structures by combining optimization methods with neural networks | |
CN111582468B (zh) | 光电混合智能数据生成计算系统及方法 | |
CN113569469B (zh) | 一种用于设计高性能闪耀光栅结构的预测网络的构建方法 | |
Paulsen et al. | Simulation methods for multiperiodic and aperiodic nanostructured dielectric waveguides | |
Sridevi et al. | Deep learning based data augmentation and behavior prediction of photonic crystal fiber temperature sensor | |
Deng et al. | Benchmarking data-driven surrogate simulators for artificial electromagnetic materials | |
Gao et al. | Inverse design in flat optics | |
Vijayan et al. | A deep learning regression model for photonic crystal fiber sensor with xai feature selection and analysis | |
Mao et al. | Inverse design of high-dimensional nanostructured 2× 2 optical processors based on deep convolutional neural networks | |
Qu et al. | Forwardformer: Efficient transformer with multi-scale forward self-attention for day-ahead load forecasting | |
Li et al. | A position weighted information based word embedding model for machine translation | |
Rahman et al. | A 1.55 μm wideband 1× 2 photonic power splitter with arbitrary ratio: characterization and forward modeling | |
Kojima et al. | Machine learning for design and optimization of photonic devices | |
Yeung et al. | Three-dimensional mask transmission simulation using a single integral equation method | |
Alagappan et al. | Meshless optical mode solving using scalable deep deconvolutional neural network | |
CN116913436B (zh) | 一种基于ldm-pnn和粒子群算法的超原子逆向设计方法 | |
da Silva Ferreira et al. | Predicting complete band-gaps of 2D photonic crystals by using artificial neural networks | |
Kudo et al. | A study on optimal design of optical devices utilizing coupled mode theory and machine learning |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |