CN110969615B - 一种分析硅基多模波导模式的方法 - Google Patents

一种分析硅基多模波导模式的方法 Download PDF

Info

Publication number
CN110969615B
CN110969615B CN201911263023.0A CN201911263023A CN110969615B CN 110969615 B CN110969615 B CN 110969615B CN 201911263023 A CN201911263023 A CN 201911263023A CN 110969615 B CN110969615 B CN 110969615B
Authority
CN
China
Prior art keywords
mode
waveguide
distribution
neural network
silicon
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201911263023.0A
Other languages
English (en)
Other versions
CN110969615A (zh
Inventor
刘晓平
王旭辉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
ShanghaiTech University
Original Assignee
ShanghaiTech University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ShanghaiTech University filed Critical ShanghaiTech University
Priority to CN201911263023.0A priority Critical patent/CN110969615B/zh
Publication of CN110969615A publication Critical patent/CN110969615A/zh
Application granted granted Critical
Publication of CN110969615B publication Critical patent/CN110969615B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/0002Inspection of images, e.g. flaw detection
    • G06T7/0004Industrial image inspection
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20081Training; Learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20084Artificial neural networks [ANN]

Landscapes

  • Engineering & Computer Science (AREA)
  • Quality & Reliability (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Image Analysis (AREA)

Abstract

本发明提供了一种分析硅基多模波导模式的方法,根据绝缘体上硅耦合波导的光学模式特征,求出硅基波导内所含本征模模式的电场分布,通过每个模式的复振幅和其在波导截面上电场分布求出模式能量分布和叠加场的远场分布,进而求出远场光强分布。通过特定探测器件收集远场光强图像,将图像数据处理后,输入到特定的人工神经网络中,由远场图像得到的模式能量和光强分布分别作为神经网络训练集中的样本标签和特征。在卷积神经网络的训练阶段,将输出与样本的标签进行比较,通过梯度下降相关算法优化神经网络,以得到最优的预测准确度。这种利用神经网络分析多模波导模式的方法,不仅可以消除器件层面的负担,而且可以更高效准确地分析出来。

Description

一种分析硅基多模波导模式的方法
技术领域
本发明涉及到硅基多模波导技术领域,具体涉及一种利用人工神经网络分析硅基多模波导中光学模式成分的方法。
背景技术
集成多模波导和光纤是两种较为典型的光互连平台,为了提高数据传输速率,发展出了空分(模分)复用技术。当需要检测硅基多模波导中的不同模式所携带的光学信息时,对模式成分的准确分析就变得十分关键。
而目前分析不同模式的成分信息时,主要使用的方法几乎都是基于器件层面的空间模式排序技术,这种方法只分析了耦合后的物理特征以希望提取有用的模式信息,但其只利用了某一小部分信息,对信息利用不完整、正确率不够高。
在多输入多输出的光学系统中,光会互相耦合,输出结果相对复杂。从这个角度来看,利用人工神经网络就可以解决这样的难题,神经网络可以从一个完整的图像着手,进行图像处理和数据分析,而光学系统中输出结果可以由采集为图像,利用神经网络进而分析,以提取所需光学信息。
基于神经网络的分析方法分析结果不但更准确,而且这种方法不像现有的技术,并非基于器件层面的空间模式排序,而是一种新型模式成分分析方法,消除器件层面的复杂性,将大部分任务转移到数据处理层面上来。显然,复杂的多输入多输出光学系统问题利用神经网络分析,便可以得到有效地解决。
发明内容
本发明的目的是提供一种利用人工神经网络分析硅基波导光学模式成分的方法。
为了达到上述目的,本发明的技术方案是提供了一种分析硅基多模波导模式的方法,其特征在于,包括以下步骤:
步骤1、根据绝缘体上硅(Silicon on insulator,SOI)耦合波导的光学模式特征,获得硅基波导内所含多个本征模光学模式(例如:准TE本征模)的电场分布;
步骤2、通过每个光学模式的复振幅和每个光学模式在波导截面上电场分布求出模式能量分布和叠加场的远场分布,进而求出远场光强分布;
步骤3、根据远场光强分布,由探测器件(例如:电荷耦合器件(Charge CoupledDevice,CCD))采集图像信息,从而收集得到远场光强图像样本;
步骤4、构建卷积神经网络,由远场光强图像样本得到的模式能量和光强分布分别作为神经网络训练集中的样本标签和特征对卷积神经网络进行训练,在训练阶段,将卷积神经网络的输出与样本的标签进行比较,通过梯度下降相关算法优化卷积神经网络,以得到最优的预测准确度。
优选地,步骤1包括以下步骤:
步骤101、根据FDTD等软件设计有效的绝缘体上硅波导耦合装置,使若干个单模光耦合后产生高阶模,耦合后的宽波导包含多个所述本征模光学模式;
步骤102、根据有限差分本征模求解器计算通过步骤101获得的宽波导内光学模式的电场分布。
优选地,步骤2包括以下步骤:
步骤201、根据光学模式的正交性,硅基波导出口处的叠加电场
Figure BDA0002312088870000021
为波导内各光学模式的线性组合,即
Figure BDA0002312088870000022
式中,am表示第m个光学模式的复振幅,
Figure BDA0002312088870000023
表示通过步骤1获得的第m个光学模式在波导截面上的电场分布;
步骤202、根据复振幅和电场分布求出每一个光学模式的能量分布和叠加电场
Figure BDA0002312088870000024
的远场分布
Figure BDA0002312088870000025
设第m个光学模式的能量分布为
Figure BDA0002312088870000026
则有:
Figure BDA0002312088870000027
步骤203、根据远场光强分布和叠加场的远场分布
Figure BDA0002312088870000028
之间的关系:
Figure BDA0002312088870000029
求出远场光强分布,式中,(x1,y1)表示远场某点的坐标,I(x1,y1)表示其对应的光强分布,a表示远场某点处的振幅,
Figure BDA00023120888700000210
表示其对应的电场分布,λ表示光源的波长,z表示近场某点的位置信息。
优选地,在步骤3中,对所述探测器件采集图像信息进行处理,以尽量减少远场光强图像阵列的维度,从而降低卷积神经网络的复杂度,将处理后的远场光强图像以最简的形式输入卷积神经网络中训练。
优选地,步骤4中,构建所述卷积神经网络时,设置不同层数和形状的卷积层和全连接层,经过所有的卷积层后,特征输出为一维形式,然后输入到后续的全连接层,每一层卷积层设置特定形状、步长的滤波器以及遍历的填充方式,选用特定形状的最大池化层以及激活函数,其中,设置池化参数递减,使特征数量越来越少;设置卷积核的数量倍增,使通道数量倍增;根据全连接层神经层的逐级传递,设置最后一层神经元的个数减小到和所需预测模式能量分布的数量相同。
优选地,最后一层的所述全连接层设置Softmax为非线性激活函数,输出的值分别对应着给定的几种远场强度模式的预测模式能量分布。
优选地,步骤4中,将卷积神经网络的输出与样本的标签进行比较时,根据比较值得均方误差,通过均方误差体现所搭建卷积神经网络的预测精确度。
本发明具有如下优点和积极效果:
首先,本发明办法不依靠以往常用的空间模式排序技术,而是通过所有模式的远场衍射图像作为整体进行分析,利用模式能量分布和远场光强分布之间的关联性,搭建神经网络,从而得到模式能量分布预测精确度。这样做不仅降低了器件层面的复杂度,而且将这种任务成功地转移到了数据处理层面,这将是很容易解决的问题,因此这种方法不失为一种人工智能和传统光学结合的新方法。
其次,这种基于神经网络分析多模波导中的模式能量分布的新方法在相关领域具有较为广阔的应用前景。在一些应用场景中,比如空分复用、结构光领域和多模光纤体系中,大部分不需要在空间上分离不同的光学模式,而只是为了获取模式能量分布,这种方法将会是一种非常合适的方式,因此,基于神经网络分析光学模式成分的方法对未来的光学系统将具有很高的潜在应用价值。
附图说明
图1为本发明分析方法及步骤流程图;
图2为本发明方法实施例中波导有效折射率随波导宽度增加变化曲线;
图3为本发明实施例采用的波导耦合装置示意图,不同的耦合输出波导可以产生若干种不同光学模式;
图4A至图4E为本发明方法基于图3得到的耦合波导三阶模,在光源波长为1500-1600nm之间扫描得到的五张电场分布图,图4A的光源波长λ=1500nm,图4B的光源波长λ=1525nm,图4C的光源波长λ=1550nm,图4D的光源波长λ=1575nm,图4E的光源波长λ=1600nm;
图5为本发明方法实施例中采用的远场强度图案预处理方法流程图;
图6为本发明方法实施例中采用的六层卷积神经网络示意图。
具体实施方式
下面结合具体实施例,进一步阐述本发明。应理解,这些实施例仅用于说明本发明而不用于限制本发明的范围。此外应理解,在阅读了本发明讲授的内容之后,本领域技术人员可以对本发明作各种改动或修改,这些等价形式同样落于本申请所附权利要求书所限定的范围。
本实施例以SOI波导中含有三个光学模式为例:
图1为本发明分析方法及步骤流程图。其中三条单模波导耦合产生三种不同光学模式的混合光,其由宽SOI波导输出,近场到远场的传播过程可以等效为傅里叶变换过程,再由CCD进行探测并收集远场图像,预处理后将数据输入到神经网络中进行分析和比较。
如图2所示,随着波导宽度的增加,波导的等效折射率发生变化,进而波导内可以支持高阶模的存在。本发明选择耦合后的宽SOI波导的宽度和高度分别为w=1.6um和h=0.22um,这样该宽SOI波导在光源波长为1.55um下只支持三个准TE光学模式,即准TE00模,准TE10模和准TE20模。
针对此实施例中的波导耦合装置,本发明采用如图3所示的方法。经过硅基单模微环耦合后,输出波导由宽度分别为450nm、930nm、1410nm的三个波导和两个长梯形波导连接,其中宽度为450nm的硅基波导只可产生单模光,耦合方式采用宽度同为450nm的硅基单模微环进行耦合,每个阶段分别可以产生不同的光学模式,右端宽SOI波导便可输出含有三种光学模式(TE00、TE10和TE20)的混合光。同样,如图4A至图4E所示,本发明采用微环耦合波导可以在光源波长为1500-1600nm之间产生电场强度分布不同的三阶模。同时,单模光的电场分布变化也将产生不同电场强度分布的高阶模。因此采用在合适波长下,调节单模光的电场强度分布,可以得到具有许多含有三种不同模式成分的混合光输出。由CCD进行探测并收集远场图像后,经过预处理将数据输入到神经网络中进行分析和预测。
针对此实例中,如图5所示流程图,在得到宽SOI波导出口处叠加场的远场光强分布后,宽SOI波导输出的远场光强图案被像素化为[32,64,1]的三维矩阵,然后将远场光强分布沿垂直方向压缩,远场图像变成沿水平方向尺寸为[1,64,1]的一维阵列,有效地降低了神经网络中的复杂度。最后,再对该矩阵中的64个强度值进一步能量归一化、取对数和相反数,将此最终数据输入神经网络。
常用的人工卷积网络由多层卷积层、汇聚层和全连接层组成。此实例中,如图6所示,宽SOI多模波导的专用卷积神经网络由3个卷积层和3个全连接层组成,记作Conv1、Conv2、Conv3、FC3、FC4和FC5。三个卷积层都使用形状为[1,3],步长为[1,1]的滤波器,采用same padding遍历填充方式。卷积层使用ReLU作为激活函数,并使用形状为[1,2],步长为[1,2]的最大池化层。Conv1和Conv2、Conv3的核函数数量分别为16、32和64,用于FC3,FC4和FC5的神经元数量分别为128,64和3。FC3和FC4的非线性激活函数是ReLU,而FC5的非线性激活函数是Softmax,这种如下式所示的归一化函数,输出结果对应于三种远场强度模式的预测模式能量分布。
Figure BDA0002312088870000051
其中,i=1,2,…,L,
Figure BDA0002312088870000052
L表示总类数,(此实施例中,L=3),zi表示某一类别的分数。
在训练阶段,以样本的均方误差σ(Mean square error,MSE)量化预测结果:
Figure BDA0002312088870000053
其中y(j) p[k]和y(j) l[k]分别指第j个样本的TE(k-1)0模式能量占比的预测值和标签值。在本实施例中,采用梯度下降算法Adam优化来更新权重,优化神经网络。
在本实施例中,90%的数据集样本作为训练集,10%的样本分为交叉验证集。每次迭代选择32个训练集样本输入到神经网络,依次迭代至遍历整个训练集。然后将训练集的样本顺序打乱,进行下一次迭代,重复此迭代过程10000次后,得到训练集的MSE最终为2.02e-5,而交叉验证集的MSE为7.65e-5。训练集和交叉验证集的MSE都非常小,两者之间的差异也很小,这说明了利用神经网络预测的结果偏差和方差都很小,即预测准确率较高且普适性较好。通过这一实例的结果说明了卷积神经网络来预测模式能量分布的方法的准确性和可靠性。

Claims (7)

1.一种分析硅基多模波导模式的方法,其特征在于,包括以下步骤:
步骤1、根据绝缘体上硅耦合波导的光学模式特征,获得硅基波导内所含多个本征模光学模式的电场分布;
步骤2、通过每个光学模式的复振幅和每个光学模式在波导截面上电场分布求出模式能量分布和叠加场的远场分布,进而求出远场光强分布;
步骤3、根据远场光强分布,由探测器件采集图像信息,从而收集得到远场光强图像样本;
步骤4、构建卷积神经网络,由远场光强图像样本得到的模式能量和光强分布分别作为神经网络训练集中的样本标签和特征对卷积神经网络进行训练,在训练阶段,将卷积神经网络的输出与样本的标签进行比较,通过梯度下降相关算法优化卷积神经网络,以得到最优的预测准确度。
2.如权利要求1所述的一种分析硅基多模波导模式的方法,其特征在于,步骤1包括以下步骤:
步骤101、设计有效的绝缘体上硅波导耦合装置,使若干个单模光耦合后产生高阶模,耦合后的宽波导包含多个所述本征模光学模式;
步骤102、根据有限差分本征模求解器计算通过步骤101获得的宽波导内光学模式的电场分布。
3.如权利要求1所述的一种分析硅基多模波导模式的方法,其特征在于,步骤2包括以下步骤:
步骤201、根据光学模式的正交性,硅基波导出口处的叠加电场
Figure FDA0002312088860000011
为波导内各光学模式的线性组合,即
Figure FDA0002312088860000012
式中,am表示第m个光学模式的复振幅,
Figure FDA0002312088860000013
表示通过步骤1获得的第m个光学模式在波导截面上的电场分布;
步骤202、根据复振幅和电场分布求出每一个光学模式的能量分布和叠加电场
Figure FDA0002312088860000014
的远场分布
Figure FDA0002312088860000015
设第m个光学模式的能量分布为
Figure FDA0002312088860000016
则有:
Figure FDA0002312088860000017
步骤203、根据远场光强分布和叠加场的远场分布
Figure FDA0002312088860000018
之间的关系:
Figure FDA0002312088860000021
求出远场光强分布,式中,(x1,y1)表示远场某点的坐标,I(x1,y1)表示其对应的光强分布,a表示远场某点处的振幅,
Figure FDA0002312088860000022
表示其对应的电场分布,λ表示光源的波长,z表示近场某点的位置信息。
4.如权利要求1所述的一种分析硅基多模波导模式的方法,其特征在于,在步骤3中,对所述探测器件采集图像信息进行处理,以尽量减少远场光强图像阵列的维度。
5.如权利要求1所述的一种分析硅基多模波导模式的方法,其特征在于,步骤4中,构建所述卷积神经网络时,设置不同层数和形状的卷积层和全连接层,经过所有的卷积层后,特征输出为一维形式,然后输入到后续的全连接层,每一层卷积层设置特定形状、步长的滤波器以及遍历的填充方式,选用特定形状的最大池化层以及激活函数,其中,设置池化参数递减,使特征数量越来越少;设置卷积核的数量倍增,使通道数量倍增;根据全连接层神经层的逐级传递,设置最后一层神经元的个数减小到和所需预测模式能量分布的数量相同。
6.如权利要求5所述的一种分析硅基多模波导模式的方法,其特征在于,最后一层的所述全连接层设置Softmax为非线性激活函数,输出的值分别对应着给定的几种远场强度模式的预测模式能量分布。
7.如权利要求1所述的一种分析硅基多模波导模式的方法,其特征在于,步骤4中,将卷积神经网络的输出与样本的标签进行比较时,根据比较值得均方误差,通过均方误差体现所搭建卷积神经网络的预测精确度。
CN201911263023.0A 2019-12-11 2019-12-11 一种分析硅基多模波导模式的方法 Active CN110969615B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911263023.0A CN110969615B (zh) 2019-12-11 2019-12-11 一种分析硅基多模波导模式的方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911263023.0A CN110969615B (zh) 2019-12-11 2019-12-11 一种分析硅基多模波导模式的方法

Publications (2)

Publication Number Publication Date
CN110969615A CN110969615A (zh) 2020-04-07
CN110969615B true CN110969615B (zh) 2023-04-21

Family

ID=70033696

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911263023.0A Active CN110969615B (zh) 2019-12-11 2019-12-11 一种分析硅基多模波导模式的方法

Country Status (1)

Country Link
CN (1) CN110969615B (zh)

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO1993016406A1 (en) * 1992-02-07 1993-08-19 Baxter International Inc. Improved optical mode mixer using fiber optic bundle
CN109191445A (zh) * 2018-08-29 2019-01-11 极创智能(北京)健康科技有限公司 基于人工智能的骨骼形变分析方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108932480B (zh) * 2018-06-08 2022-03-15 电子科技大学 基于1d-cnn的分布式光纤传感信号特征学习与分类方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO1993016406A1 (en) * 1992-02-07 1993-08-19 Baxter International Inc. Improved optical mode mixer using fiber optic bundle
CN109191445A (zh) * 2018-08-29 2019-01-11 极创智能(北京)健康科技有限公司 基于人工智能的骨骼形变分析方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
基于FTVGG16卷积神经网络的鱼类识别方法;陈英义等;《农业机械学报》;20190228(第05期);全文 *

Also Published As

Publication number Publication date
CN110969615A (zh) 2020-04-07

Similar Documents

Publication Publication Date Title
Chugh et al. Machine learning regression approach to the nanophotonic waveguide analyses
CN110443882B (zh) 基于深度学习算法的光场显微三维重建方法及装置
Jin et al. Auto-keras: Efficient neural architecture search with network morphism
CN111160621B (zh) 一种融合多源信息的短期风电功率预测方法
Gostimirovic et al. An open-source artificial neural network model for polarization-insensitive silicon-on-insulator subwavelength grating couplers
US20120330870A1 (en) Method and apparatus for a local competitive learning rule that leads to sparse connectivity
Tu et al. Analysis of deep neural network models for inverse design of silicon photonic grating coupler
da Silva Ferreira et al. Towards an integrated evolutionary strategy and artificial neural network computational tool for designing photonic coupler devices
Tartaglione et al. Loss-based sensitivity regularization: towards deep sparse neural networks
CN112926157B (zh) 一种基于神经网络的光栅滤光片结构优化方法
CN113780292A (zh) 一种基于证据推理的语义分割网络模型不确定性量化方法
CN111898316A (zh) 一种超表面结构设计模型的构建方法及其应用
CN115542433B (zh) 基于自注意力的深度神经网络编码光子晶体的方法
CN111582468B (zh) 光电混合智能数据生成计算系统及方法
Scheidegger et al. Constrained deep neural network architecture search for IoT devices accounting for hardware calibration
You et al. Analyzing convergence in quantum neural networks: Deviations from neural tangent kernels
CN110969615B (zh) 一种分析硅基多模波导模式的方法
Jakaria et al. Comparison of classification of birds using lightweight deep convolutional neural networks
Green et al. RAPDARTS: resource-aware progressive differentiable architecture search
Gostimirovic et al. Automating photonic design with machine learning
CN117495422A (zh) 基于电力通信网建设的造价管理系统及其方法
Lefevre et al. Perturbation of Fiedler vector: interest for graph measures and shape analysis
CN116579408A (zh) 一种基于模型结构冗余度的模型剪枝方法及系统
Chen et al. Transmittance prediction and inverse design of microring resonator channel dropping filters with deep learning
Sajedian et al. Predicting resonant properties of plasmonic structures by deep learning

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant