CN110969615B

CN110969615B - 一种分析硅基多模波导模式的方法

Info

Publication number: CN110969615B
Application number: CN201911263023.0A
Authority: CN
Inventors: 刘晓平; 王旭辉
Original assignee: ShanghaiTech University
Current assignee: ShanghaiTech University
Priority date: 2019-12-11
Filing date: 2019-12-11
Publication date: 2023-04-21
Anticipated expiration: 2039-12-11
Also published as: CN110969615A

Abstract

本发明提供了一种分析硅基多模波导模式的方法，根据绝缘体上硅耦合波导的光学模式特征，求出硅基波导内所含本征模模式的电场分布，通过每个模式的复振幅和其在波导截面上电场分布求出模式能量分布和叠加场的远场分布，进而求出远场光强分布。通过特定探测器件收集远场光强图像，将图像数据处理后，输入到特定的人工神经网络中，由远场图像得到的模式能量和光强分布分别作为神经网络训练集中的样本标签和特征。在卷积神经网络的训练阶段，将输出与样本的标签进行比较，通过梯度下降相关算法优化神经网络，以得到最优的预测准确度。这种利用神经网络分析多模波导模式的方法，不仅可以消除器件层面的负担，而且可以更高效准确地分析出来。

Description

一种分析硅基多模波导模式的方法

技术领域

本发明涉及到硅基多模波导技术领域，具体涉及一种利用人工神经网络分析硅基多模波导中光学模式成分的方法。

背景技术

集成多模波导和光纤是两种较为典型的光互连平台，为了提高数据传输速率，发展出了空分(模分)复用技术。当需要检测硅基多模波导中的不同模式所携带的光学信息时，对模式成分的准确分析就变得十分关键。

而目前分析不同模式的成分信息时，主要使用的方法几乎都是基于器件层面的空间模式排序技术，这种方法只分析了耦合后的物理特征以希望提取有用的模式信息，但其只利用了某一小部分信息，对信息利用不完整、正确率不够高。

在多输入多输出的光学系统中，光会互相耦合，输出结果相对复杂。从这个角度来看，利用人工神经网络就可以解决这样的难题，神经网络可以从一个完整的图像着手，进行图像处理和数据分析，而光学系统中输出结果可以由采集为图像，利用神经网络进而分析，以提取所需光学信息。

基于神经网络的分析方法分析结果不但更准确，而且这种方法不像现有的技术，并非基于器件层面的空间模式排序，而是一种新型模式成分分析方法，消除器件层面的复杂性，将大部分任务转移到数据处理层面上来。显然，复杂的多输入多输出光学系统问题利用神经网络分析，便可以得到有效地解决。

发明内容

本发明的目的是提供一种利用人工神经网络分析硅基波导光学模式成分的方法。

为了达到上述目的，本发明的技术方案是提供了一种分析硅基多模波导模式的方法，其特征在于，包括以下步骤：

步骤1、根据绝缘体上硅(Silicon on insulator，SOI)耦合波导的光学模式特征，获得硅基波导内所含多个本征模光学模式(例如：准TE本征模)的电场分布；

步骤2、通过每个光学模式的复振幅和每个光学模式在波导截面上电场分布求出模式能量分布和叠加场的远场分布，进而求出远场光强分布；

步骤3、根据远场光强分布，由探测器件(例如：电荷耦合器件(Charge CoupledDevice，CCD))采集图像信息，从而收集得到远场光强图像样本；

步骤4、构建卷积神经网络，由远场光强图像样本得到的模式能量和光强分布分别作为神经网络训练集中的样本标签和特征对卷积神经网络进行训练，在训练阶段，将卷积神经网络的输出与样本的标签进行比较，通过梯度下降相关算法优化卷积神经网络，以得到最优的预测准确度。

优选地，步骤1包括以下步骤：

步骤101、根据FDTD等软件设计有效的绝缘体上硅波导耦合装置，使若干个单模光耦合后产生高阶模，耦合后的宽波导包含多个所述本征模光学模式；

步骤102、根据有限差分本征模求解器计算通过步骤101获得的宽波导内光学模式的电场分布。

优选地，步骤2包括以下步骤：

步骤201、根据光学模式的正交性，硅基波导出口处的叠加电场

为波导内各光学模式的线性组合，即

式中，a_m表示第m个光学模式的复振幅，

表示通过步骤1获得的第m个光学模式在波导截面上的电场分布；

步骤202、根据复振幅和电场分布求出每一个光学模式的能量分布和叠加电场

的远场分布

设第m个光学模式的能量分布为

则有：

步骤203、根据远场光强分布和叠加场的远场分布

之间的关系：

求出远场光强分布，式中，(x₁,y₁)表示远场某点的坐标，I(x₁,y₁)表示其对应的光强分布，a表示远场某点处的振幅，

表示其对应的电场分布，λ表示光源的波长，z表示近场某点的位置信息。

优选地，在步骤3中，对所述探测器件采集图像信息进行处理，以尽量减少远场光强图像阵列的维度，从而降低卷积神经网络的复杂度，将处理后的远场光强图像以最简的形式输入卷积神经网络中训练。

优选地，步骤4中，构建所述卷积神经网络时，设置不同层数和形状的卷积层和全连接层，经过所有的卷积层后，特征输出为一维形式，然后输入到后续的全连接层，每一层卷积层设置特定形状、步长的滤波器以及遍历的填充方式，选用特定形状的最大池化层以及激活函数，其中，设置池化参数递减，使特征数量越来越少；设置卷积核的数量倍增，使通道数量倍增；根据全连接层神经层的逐级传递，设置最后一层神经元的个数减小到和所需预测模式能量分布的数量相同。

优选地，最后一层的所述全连接层设置Softmax为非线性激活函数，输出的值分别对应着给定的几种远场强度模式的预测模式能量分布。

优选地，步骤4中，将卷积神经网络的输出与样本的标签进行比较时，根据比较值得均方误差，通过均方误差体现所搭建卷积神经网络的预测精确度。

本发明具有如下优点和积极效果：

首先，本发明办法不依靠以往常用的空间模式排序技术，而是通过所有模式的远场衍射图像作为整体进行分析，利用模式能量分布和远场光强分布之间的关联性，搭建神经网络，从而得到模式能量分布预测精确度。这样做不仅降低了器件层面的复杂度，而且将这种任务成功地转移到了数据处理层面，这将是很容易解决的问题，因此这种方法不失为一种人工智能和传统光学结合的新方法。

其次，这种基于神经网络分析多模波导中的模式能量分布的新方法在相关领域具有较为广阔的应用前景。在一些应用场景中，比如空分复用、结构光领域和多模光纤体系中，大部分不需要在空间上分离不同的光学模式，而只是为了获取模式能量分布，这种方法将会是一种非常合适的方式，因此，基于神经网络分析光学模式成分的方法对未来的光学系统将具有很高的潜在应用价值。

附图说明

图1为本发明分析方法及步骤流程图；

图2为本发明方法实施例中波导有效折射率随波导宽度增加变化曲线；

图3为本发明实施例采用的波导耦合装置示意图，不同的耦合输出波导可以产生若干种不同光学模式；

图4A至图4E为本发明方法基于图3得到的耦合波导三阶模，在光源波长为1500-1600nm之间扫描得到的五张电场分布图，图4A的光源波长λ＝1500nm，图4B的光源波长λ＝1525nm，图4C的光源波长λ＝1550nm，图4D的光源波长λ＝1575nm，图4E的光源波长λ＝1600nm；

图5为本发明方法实施例中采用的远场强度图案预处理方法流程图；

图6为本发明方法实施例中采用的六层卷积神经网络示意图。

具体实施方式

下面结合具体实施例，进一步阐述本发明。应理解，这些实施例仅用于说明本发明而不用于限制本发明的范围。此外应理解，在阅读了本发明讲授的内容之后，本领域技术人员可以对本发明作各种改动或修改，这些等价形式同样落于本申请所附权利要求书所限定的范围。

本实施例以SOI波导中含有三个光学模式为例：

图1为本发明分析方法及步骤流程图。其中三条单模波导耦合产生三种不同光学模式的混合光，其由宽SOI波导输出，近场到远场的传播过程可以等效为傅里叶变换过程，再由CCD进行探测并收集远场图像，预处理后将数据输入到神经网络中进行分析和比较。

如图2所示，随着波导宽度的增加，波导的等效折射率发生变化，进而波导内可以支持高阶模的存在。本发明选择耦合后的宽SOI波导的宽度和高度分别为w＝1.6um和h＝0.22um，这样该宽SOI波导在光源波长为1.55um下只支持三个准TE光学模式，即准TE₀₀模，准TE₁₀模和准TE₂₀模。

针对此实施例中的波导耦合装置，本发明采用如图3所示的方法。经过硅基单模微环耦合后，输出波导由宽度分别为450nm、930nm、1410nm的三个波导和两个长梯形波导连接，其中宽度为450nm的硅基波导只可产生单模光，耦合方式采用宽度同为450nm的硅基单模微环进行耦合，每个阶段分别可以产生不同的光学模式，右端宽SOI波导便可输出含有三种光学模式(TE₀₀、TE₁₀和TE₂₀)的混合光。同样，如图4A至图4E所示，本发明采用微环耦合波导可以在光源波长为1500-1600nm之间产生电场强度分布不同的三阶模。同时，单模光的电场分布变化也将产生不同电场强度分布的高阶模。因此采用在合适波长下，调节单模光的电场强度分布，可以得到具有许多含有三种不同模式成分的混合光输出。由CCD进行探测并收集远场图像后，经过预处理将数据输入到神经网络中进行分析和预测。

针对此实例中，如图5所示流程图，在得到宽SOI波导出口处叠加场的远场光强分布后，宽SOI波导输出的远场光强图案被像素化为[32,64,1]的三维矩阵，然后将远场光强分布沿垂直方向压缩，远场图像变成沿水平方向尺寸为[1,64,1]的一维阵列，有效地降低了神经网络中的复杂度。最后，再对该矩阵中的64个强度值进一步能量归一化、取对数和相反数，将此最终数据输入神经网络。

常用的人工卷积网络由多层卷积层、汇聚层和全连接层组成。此实例中，如图6所示，宽SOI多模波导的专用卷积神经网络由3个卷积层和3个全连接层组成，记作Conv1、Conv2、Conv3、FC3、FC4和FC5。三个卷积层都使用形状为[1,3]，步长为[1,1]的滤波器，采用same padding遍历填充方式。卷积层使用ReLU作为激活函数，并使用形状为[1,2]，步长为[1,2]的最大池化层。Conv1和Conv2、Conv3的核函数数量分别为16、32和64，用于FC3，FC4和FC5的神经元数量分别为128，64和3。FC3和FC4的非线性激活函数是ReLU，而FC5的非线性激活函数是Softmax，这种如下式所示的归一化函数，输出结果对应于三种远场强度模式的预测模式能量分布。

其中，i＝1,2,…,L，

L表示总类数，(此实施例中，L＝3)，z_i表示某一类别的分数。

在训练阶段，以样本的均方误差σ(Mean square error，MSE)量化预测结果：

其中y^(j) _p[k]和y^(j) _l[k]分别指第j个样本的TE_(k-1)0模式能量占比的预测值和标签值。在本实施例中，采用梯度下降算法Adam优化来更新权重，优化神经网络。

在本实施例中，90％的数据集样本作为训练集，10％的样本分为交叉验证集。每次迭代选择32个训练集样本输入到神经网络，依次迭代至遍历整个训练集。然后将训练集的样本顺序打乱，进行下一次迭代，重复此迭代过程10000次后，得到训练集的MSE最终为2.02e-5，而交叉验证集的MSE为7.65e-5。训练集和交叉验证集的MSE都非常小，两者之间的差异也很小，这说明了利用神经网络预测的结果偏差和方差都很小，即预测准确率较高且普适性较好。通过这一实例的结果说明了卷积神经网络来预测模式能量分布的方法的准确性和可靠性。

Claims

1.一种分析硅基多模波导模式的方法，其特征在于，包括以下步骤：

步骤1、根据绝缘体上硅耦合波导的光学模式特征，获得硅基波导内所含多个本征模光学模式的电场分布；

步骤3、根据远场光强分布，由探测器件采集图像信息，从而收集得到远场光强图像样本；

2.如权利要求1所述的一种分析硅基多模波导模式的方法，其特征在于，步骤1包括以下步骤：

步骤101、设计有效的绝缘体上硅波导耦合装置，使若干个单模光耦合后产生高阶模，耦合后的宽波导包含多个所述本征模光学模式；

3.如权利要求1所述的一种分析硅基多模波导模式的方法，其特征在于，步骤2包括以下步骤：

为波导内各光学模式的线性组合，即

式中，a_m表示第m个光学模式的复振幅，

的远场分布

设第m个光学模式的能量分布为

则有：

步骤203、根据远场光强分布和叠加场的远场分布

之间的关系：

4.如权利要求1所述的一种分析硅基多模波导模式的方法，其特征在于，在步骤3中，对所述探测器件采集图像信息进行处理，以尽量减少远场光强图像阵列的维度。

5.如权利要求1所述的一种分析硅基多模波导模式的方法，其特征在于，步骤4中，构建所述卷积神经网络时，设置不同层数和形状的卷积层和全连接层，经过所有的卷积层后，特征输出为一维形式，然后输入到后续的全连接层，每一层卷积层设置特定形状、步长的滤波器以及遍历的填充方式，选用特定形状的最大池化层以及激活函数，其中，设置池化参数递减，使特征数量越来越少；设置卷积核的数量倍增，使通道数量倍增；根据全连接层神经层的逐级传递，设置最后一层神经元的个数减小到和所需预测模式能量分布的数量相同。

6.如权利要求5所述的一种分析硅基多模波导模式的方法，其特征在于，最后一层的所述全连接层设置Softmax为非线性激活函数，输出的值分别对应着给定的几种远场强度模式的预测模式能量分布。

7.如权利要求1所述的一种分析硅基多模波导模式的方法，其特征在于，步骤4中，将卷积神经网络的输出与样本的标签进行比较时，根据比较值得均方误差，通过均方误差体现所搭建卷积神经网络的预测精确度。