CN110703385B - 基于光散射的图案化的多模干涉耦合器、设计方法和应用 - Google Patents

基于光散射的图案化的多模干涉耦合器、设计方法和应用 Download PDF

Info

Publication number
CN110703385B
CN110703385B CN201911092358.0A CN201911092358A CN110703385B CN 110703385 B CN110703385 B CN 110703385B CN 201911092358 A CN201911092358 A CN 201911092358A CN 110703385 B CN110703385 B CN 110703385B
Authority
CN
China
Prior art keywords
scattering
optical
patterned
coupler
waveguide
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201911092358.0A
Other languages
English (en)
Other versions
CN110703385A (zh
Inventor
曲俞睿
朱桓正
仇旻
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Westlake University
Original Assignee
Westlake University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Westlake University filed Critical Westlake University
Priority to CN201911092358.0A priority Critical patent/CN110703385B/zh
Publication of CN110703385A publication Critical patent/CN110703385A/zh
Application granted granted Critical
Publication of CN110703385B publication Critical patent/CN110703385B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G02OPTICS
    • G02BOPTICAL ELEMENTS, SYSTEMS OR APPARATUS
    • G02B6/00Light guides; Structural details of arrangements comprising light guides and other optical elements, e.g. couplings
    • G02B6/24Coupling light guides
    • G02B6/26Optical coupling means
    • G02B6/28Optical coupling means having data bus means, i.e. plural waveguides interconnected and providing an inherently bidirectional system by mixing and splitting signals
    • G02B6/2804Optical coupling means having data bus means, i.e. plural waveguides interconnected and providing an inherently bidirectional system by mixing and splitting signals forming multipart couplers without wavelength selective elements, e.g. "T" couplers, star couplers
    • G02B6/2808Optical coupling means having data bus means, i.e. plural waveguides interconnected and providing an inherently bidirectional system by mixing and splitting signals forming multipart couplers without wavelength selective elements, e.g. "T" couplers, star couplers using a mixing element which evenly distributes an input signal over a number of outputs
    • G02B6/2813Optical coupling means having data bus means, i.e. plural waveguides interconnected and providing an inherently bidirectional system by mixing and splitting signals forming multipart couplers without wavelength selective elements, e.g. "T" couplers, star couplers using a mixing element which evenly distributes an input signal over a number of outputs based on multimode interference effect, i.e. self-imaging

Abstract

本发明公开了一种基于光散射的图案化的多模干涉耦合器、设计方法及应用,包括耦合器本体,以及分别连接在耦合器本体输入端和输出端的多个输入波导和多个输出波导,所述耦合器本体包括:支撑衬底;设置在支撑衬底上的波导基体,在所述波导基体上设有多个沿波导基体高度方向延伸的散射空隙,该散射间隙依照设定折射率分布要求布置。本发明的基于光散射的图案化的MMI耦合器,该耦合器通过构建图案化的耦合器结构,能够仅使用一个MMI耦合器来实现矩阵乘法,可以替代传统的多个耦合器和相移器叠加的的结构,进一步减少了光学计算单元的尺寸,进而大大简化了光学网络神经系统的结构。

Description

基于光散射的图案化的多模干涉耦合器、设计方法和应用
技术领域
本发明涉及光学人工智能芯片的硬件实现,具体涉及一种基于光散射的图案化的MMI耦合器、设计方法和应用。
背景技术
近年来深度学习在图像分类,语音识别和决策等领域取得了巨大进展,此外深度学习也已渗透到科学领域,例如药物设计,遗传学,材料科学和物理学。面对复杂的问题和高精度,人们需要庞大的神经网络,而这又需要大量的计算资源。为此人们开发了许多高速和低能耗的电子芯片,例如图形处理单元(GPU),现场可编程门阵列(FPGA)和专用集成电路(ASIC),包括Google TPU。此外,还演示了诸如神经形态计算和量子机器学习之类的新计算架构,它们具有快速计算和低功耗的潜力。
光学神经网络计算是一种有希望替代电子芯片的方法。这其中,集成光路具有几个明显的优势。一是深度学习的计算在很大程度上依赖于矩阵乘法。矩阵乘法可以以光速执行,并可以在集成光子电路中以超过100GHz18的速率进行检测。二是一旦经过训练,光学神经网络便是被动的,并且可以以最小的功耗实现计算。三是与笨重的光学组件(例如透镜)相比,集成光路可以提供CMOS兼容的可扩展方法,以实现光学矩阵乘法和深度学习任务。例如公开号为CN 110197277 A的专利文献公开了一种实现数字识别的光学神经网络,光学神经网络由光学干涉模块、光学非线性模块和探测器阵列构成。所述光学干涉模块包括马赫曾德干涉仪阵列与可变光衰减器,可实现任意矩阵乘法运算。但是,此种片上集成光路的尺寸仍然很大,从数百微米到毫米。
此外,大多数光学神经网络架构都是基于相干光。例如公开号为CN 109871871 A的专利文献公开了一种基于光学神经网络结构的图像识别方法、装置及电子设备,其中光学神经网络结构由X层神经网络所构成;当i等于1时,所述获取第i层神经网络的输入向量,包括:获取单一相干光源;将单一相干光源等分为N路光信号;将所述N路光信号分别通过光学衰减器进行编码,并基于编码后的N路光信号的振幅构建第1层神经网络的输入向量,其中,所述编码后的N路光信号分别与所述待识别图像的各个像素点相关联,所述N基于所述待识别图像的像素点的个数而设定。
目前对于非相干光子架构的研究还不够,实际上,由于不需要操纵光的相位,基于非相干光子的系统和设备可以比基于相干光的系统和设备简单得多。迄今为止,实现片上小尺寸的非相干光学神经网络架构的目标仍未实现。
另外,现有的耦合器多为基于MZI结构实现干涉的耦合器,该类结构的耦合器具有如下缺陷:一是对温度较为敏感,大大降了其在温度变化较大场合的应用,二是带宽较窄,三是体积较为庞大,增加了装置整体的复杂性,基于MMI耦合器的结构可以解决上述问题。
发明内容
本发明提供了一种基于光散射的图案化的多模干涉(MMI)耦合器,该耦合器通过构建图案化的耦合器结构,能够仅使用一个MMI耦合器来实现矩阵乘法,避免传统的多个耦合器+相移器的结构,可以进一步减少光学计算单元的尺寸,进而大大简化了光学网络神经系统的结构。
一种基于光散射的图案化的MMI耦合器,包括耦合器本体,以及分别连接在耦合器本体输入端和输出端的多个输入波导和多个输出波导,所述耦合器本体包括:
支撑衬底;
设置在支撑衬底上的波导基体,在所述波导基体上设有多个沿波导基体高度方向延伸的散射空隙,该散射间隙依照设定折射率分布要求布置。
作为优选,所述波导基体可以采用任意可以光传导的材料,比如硅材料制成的硅基体,或者其他可以实现光传导的高分子聚合物材料制成的基体。
作为优选,所述散射空隙横穿所述波导基体;或者所述散射空隙为位于波导基体底面或者顶面的凹槽结构。可以选择以上各种结构,或者上述结构的组合,只要满足设定折射率要求即可。为了简化加工难度,作为优选,所述散射空隙横穿所述波导基体。
所述散射空隙为不规则结构,由设计时最佳折射率分布决定。一般来讲波导基体(硅基体)的长度方向为输入波导或者输出波导所在的方向,如果假设输入波导和输出波导均在水平面方向传播(假设为x轴方向),那么波导基体的宽度方向为在水平面内垂直于其长度方向的方向(为y轴方向),波导基体的高度方向为垂直于水平面的方向(即为z轴方向)。针对本发明的方案,从z轴方向进行观察,所述支撑衬底位于底层,所述波导基体设置在支撑衬底顶面,其中的散射空隙相当于在波导基体形成的图案结构。
作为优选,所述散射空隙在沿波导基体高度方向上的投影尺寸不变。也就是说,当利用若干平行于水平面的平面去切割所述波导基体时,其得到的图案结构相同。
作为优选,所述波导基体被所述散射空隙分割为多个不规则的硅阵列。多个不规则的硅阵列可以是相连的连续结构,也可以是孤立的阵列结构,当然也可以是部分孤立、部分连续的阵列结构。
一种上述任一项所述的基于光散射的图案化的MMI耦合器的制作或者设计方法,首先使用两个全场模拟,采用逆向设计方法来搜索耦合器本体区域的整个折射率空间,计算目标函数相对于折射率的梯度,通过反复迭代运算,最终得到波导基体的最佳折射率分布,根据折射率分布,以及参考材料本身的性质,进而得到波导基体中散射空隙分布信息以及散射空隙尺寸信息;完成对所述基于光散射的图案化的MMI耦合器的设计;然后可以利用该分布信息制作得到所述的基于光散射的图案化的MMI耦合器。
本发明上述基于光散射的图案化的MMI耦合器在设计或者制作过程中,其宽度和长度一般由波导端口(一般均匀布置)的数量以及端口间距确定,即一般为波导端口数量以与端口间距的乘积或者稍微大于该乘积所确定的宽度。高度一般为波导端口的宽度或者稍大于波导端口的宽度。
本发明的基于光散射的图案化的MMI耦合器,可以进一步减少光学计算单元的尺寸。使用经典的逆向设计方法来搜索耦合器区域的设计空间,能够仅使用一个MMI耦合器来实现矩阵乘法。逆向设计方法可以计算目标函数相对于材料空间的梯度。基于超材料的图案化耦合器区域(即散射空隙)允许光来回散射,从而为矩阵计算的优化提供了大量的自由度。在这里,我们假设来自不同输入端口的光波具有相同的频率和相干性。如果来自输入和输出端口的光强度遵守能量守恒定律,则光散射单元原则上可以实现任意酉矩阵乘法。实施奇异值分解(SVD)方案,可以对输入光学信号实现任意的线性变换。
相比于传统的仅能用于相干光的耦合器结构,本发明的基于光散射的图案化的MMI耦合器也可以同时应用于非相干光的神经网络架构中,可以实现线性变换和深度学习任务。非相干光架构的优势在于,可以基于光强度而非电场来实现矩阵乘法。对于光调制或检测,由于相位控制的复杂要求,光强度调控比电场更容易。非相干神经网络单元可以通过引入不同波长的光信号来实现矩阵乘法。图案化的耦合器区域可被视为“光束分离器”,它将一个光束分成多个输出光束。在每个输出波导处,由于它们的非相干特性,可以直接将不同波长的光强度相加。
一种光学神经网络处理器,包括若干光学神经网络层,每层光学神经网络层包括用于实现矩阵乘法的光学矩阵乘法单元和光学非线性单元,其中所述光学矩阵乘法单元为上述任一项技术方案所述的基于光散射的图案化的MMI耦合器。
本发明的光学神经网络处理器可以是基于相干光或者也可以是基于非相干光的光学神经网络处理器。
本发明同时提供了一种上述任一项技术方案所述的基于光散射的图案化的MMI耦合器在基于非相干光的神经网络架构中的应用。
本发明同时提供了一种上述任一项技术方案所述的基于光散射的图案化的MMI耦合器在基于相干光的神经网络架构中的应用。
一种基于多层多模干涉耦合器的光学神经网络架构,包括多个多模干涉耦合器以及设置在相邻两个耦合器之间的相移器,所述多模干涉耦合器包括耦合器本体,以及设置在耦合器本体输入端和输出端的若干输入波导和若干输出波导,所述耦合器本体为由波导材料构成的整体结构。
本发明还提供了一种基于多层多模干涉(MMI)耦合器的光学神经网络架构。该MMI耦合器包含多个输入和输出波导,和中间的多模耦合器。输入波导的电磁场可以在输出波导处再现,输入和输出波导具有相等的电场幅度和不同的相位。第一阵列的MMI耦合器和第二阵列的MMI耦合器中间插入多个相移器,通过相移器调控相位从而调控输出波导的分光比。通过探测输出光强,实现光学矩阵乘法器。将多个此类的光学计算单元结合,中间采用光学非线性单元(如饱和吸收),即可实现深度学习功能。
采用本发明的整体波导材料结构的耦合器,一方面避免了多道MZI的加工工序,同时可根据需要确定耦合器的长宽高尺寸。比如可以根据输入波导或者输出波导的数量和尺寸,确定耦合器本体的宽度,然后结合材料的折射率等,计算出耦合器本体的长度等,然后随机随机设置相移器初始相位,经过一次前向计算得到预测值,根据预测值和目标值的差距计算相移器的相位梯度,然后通过反向传播(Backpropagation)方法来优化每一层的相位器的相位,反复迭代得到最优的相位设置。
本发明的上述多模耦合器比MZI耦合器的优势在于,一是对温度变化不敏感,可以应用于温度变化较大的场合;二是带宽较宽,设计时更加灵活,适用性更强;三是对加工误差不敏感,使得加工更加简单。
与现有技术相比,本发明的优势在于:
本发明的基于光散射的图案化的MMI耦合器,该耦合器通过构建图案化的耦合器结构,能够仅使用一个MMI耦合器来实现矩阵乘法,可以替代传统的多个耦合器和相移器叠加的的结构,进一步减少了光学计算单元的尺寸,进而大大简化了光学网络神经系统的结构。
本发明的基于光散射的图案化的MMI耦合器在设计时,可以直接采用经典的逆向设计方法来搜索耦合器区域的设计空间,同时仅使用两个全场模拟既可以实现目标函数相对于折射率的梯度的结算,通过快速的迭代即可得到目标所需的MMI耦合器设计参数,设计方便。
附图说明
图1A示出了现有的人工神经网络(ANN)的体系结构。ANN由输入层,几个隐藏层和输出层组成。
图1B示出了现有的多层光学神经网络(ONN)架构,每个ONN层均由矩阵乘法单元和非线性单元组成。
图2A示出了光学卷积神经网络体系结构,由两组卷积层和最大池化层组成,然后是全连接层。
图2B示出了卷积运算示意图,即图像与一组卷积核进行卷积。
图2C示出了图像和卷积核进行矢量化的示意图。卷积操作等效于一维图像矢量乘以“卷积核矩阵”。
图3A示出了基于多层MMI耦合器的光学神经网络计算单元。两层MMI耦合器中间插入多个相移器。
图3B示出了不同迭代次数的训练和测试的准确度。
图3C示出了数据集MNIST的5000张测试图像的混淆矩阵。
图4A示出了相干光散射单元和光学矩阵计算。光学矩阵计算可通过图案化的耦合器区域实现。
图4B示出了不同迭代次数的均方误差(MSE)。
图5A示出了非相干光散射单元和光学矩阵计算。非相干散射单元不同端口的输入光具有不同波长。这样的光散射单元可以实现光随机矩阵乘法。
图5B示出了一个作为优化目标的4×4随机矩阵。
图5C示出了以图5B为优化目标时的不同迭代次数的均方误差(MSE)。
图5D示出了光学散射单元的最佳折射率分布。
图5E示出了四个波长的电场分布。每个子图代表目标随机矩阵的其中一列。
图5F示出了64位计算机和光学神经网络在MNIST训练集上的准确性和混淆矩阵。
具体实施方式
下面结合附图对本发明的具体实施方式做详细说明:本实施方式案例以本发明提出的光学神经网络芯片架构及其计算方法为前提,但本发明的保护范围并不限于下述实施方式与案例。
人工神经网络(ANN)的示意图如图1A所示。每个神经元都连接到下一层的其他神经元(以矩阵乘法WX的形式),然后是非线性激活函数f()。输入数据被输入到ANN中,并且可以计算输出(正向传播)。之后,可以使用反向传播优化参数(权重)。
光学神经网络(ONN)框架在图1B中示出。输入数据被预处理为高维向量,该向量以电场或光强度的幅度编码。前向传播是由多层ONN实现的,每个ONN由矩阵乘法单元和非线性单元组成。原则上,多层ONN体系结构可以在光域中实现任意的深度学习功能。
卷积神经网络(CNN)是一类用于对象识别和分类任务的ANN模型。我们提出了一种可以用光学方法实现的CNN算法的光学神经网络。这里假定输入图像是经典视觉分类数据集MNIST。CNN包含两组交替的3×3卷积层和2×2最大池化层,后面是一个全连接层(图2A)。运算量最大的运算是将图像与一组卷积核进行卷积,我们可以在光学计算单元中以最快的速度和较低的功耗执行它们。采用“内核矩阵”在光学神经网络中执行光学卷积运算(光学卷积神经网络(optical convolutional neural networks),该运算实现了从卷积运算到光学矩阵乘法的转换。图像被分割为与卷积核尺寸相同的一组“区块”。这些区块与卷积核进行卷积,输出是一组矩阵,其元素为卷积核与区块点积(图2B)。为了在光学计算单元中实现卷积运算,将图像块矢量化,然后按顺序发送到ONN单元中(图2C)。通过矢量化和堆叠每个卷积核,将卷积核转换为“卷积核矩阵”。一维图像块可以有效地乘以“卷积核矩阵”,这相当于执行卷积运算。
实施例1
图3A示出了一种基于多层MMI耦合器的光学神经网络架构。包括N×NMMI耦合器包含N个输入波导和N个输出波导,加上中间一个多模耦合器。本实施例中,多模耦合器直接采用波导材料的整体结构。为了给光学神经网络提供N×N可训练参数,将m个MMI耦合器(m=N+1)依次级联在一起,并在两个MMI耦合器之间插入N个移相器,如图3A所示。计算单元的传输矩阵Mn可以通过组合交替耦合器和移相器来实现,为Mn=(Mcoupler·Mshift)m-1·Mcoupler。这里m表示MMI耦合器的数量。Mcoupler是一个固定不变的矩阵,其中的每一项代表输入和输出波导之间的相对相位。Mshift是可以训练的对角矩阵,Mshift对角线的每一项代表相应移相器的相移。随着MMI耦合器和移相器数量的增加,光学计算矩阵中的自由度和可训练参数更多,从而可以提高这种光学神经网络的性能。当训练了光学神经网络后,原则上可以以最小的功耗实现N×N矩阵乘法。
设计时,MMI耦合器的长度可以设定为定值,由材料的宽度和材料类型决定。宽度一般认为波导端口间距(比如1um)与波导端口数量(比如9)的乘积,本实施例中,我们的MMI耦合器具有用9个端口,宽度9微米,然后根据折射率就可以算出长度。
训练时,最开始先随机设置相移器初始相位,经过一次前向计算得到预测值,根据预测值和目标值的差距计算相移器的相位梯度,然后通过反向传播(Backpropagation)方法来优化每一层的相位器的相位,反复迭代得到最优的相位设置。
我们使用经典的图像分类数据集MNIST来训练和测试(其中55000张进行训练,5000张进行测试)基于多层MMI耦合器的光学神经网络的性能(每个波导尺寸:宽度200nm,长度4μm,高度220nm。每层MMI耦合器尺寸,宽度9μm,长度196μm,高度220nm。波导材料为硅(Si),衬底材料为氧化硅(SiO2))。光学计算单元由五层MMI耦合器(m=5)组成,每层中有9个移相器(一个光学计算单元中总共有4×9=36个移相器)。计算采用光学CNN算法。第一和第二卷积层由3×3卷积核组成,分别具有1个输入通道和4个输出通道,以及4个输入通道和8个输出通道。所有的卷积核可以转换为四个单独的9×9光学“卷积核矩阵”。训练后,使用来自MNIST测试数据集中的5000张图像对基于多层MMI耦合器的ONN体系进行了测试,并达到了98.6%的准确度(图3B)。混淆矩阵的效果如图3C所示。
实施例2
图4A示出了一种基于光散射的纳米图案化的MMI耦合器,可以替换多层光学干涉计算单元实现光学线性变换,进一步减少光学计算单元的尺寸。
从结构上讲,本发明的基于光散射的纳米图案化的MMI耦合器,包括耦合器本体,以及分别连接在耦合器本体输入端和输出端的多个输入波导和多个输出波导,所述耦合器本体包括:支撑衬底;设置在支撑衬底上的硅基体,在所述硅基体上设有多个沿硅基体高度方向延伸的不规则散射空隙,这些空隙的分布信息和尺寸信息由预先设计时得到的最佳折射率分布结果确定。为了加工方便,我们可以设定所述散射空隙在沿硅基体高度方向上的投影尺寸不变,且横穿整个硅基体。所述硅基体被所述散射空隙分割为多个不规则的硅阵列。当然,根据设计需要,完全可以采用横穿部分硅基体的空隙结构,比如可以设置在硅基体顶面或者底面的凹槽结构,甚至可以是包裹在硅基体中的空隙结构,本实施例仅仅是一个特定实施例。在满足折射率分布的目的下,可以选择各种结构的空隙结构。
设计时,我们可以仅使用两个全场模拟,同时采用经典的逆向设计方法来搜索耦合器区域(硅基体以及散射空隙)的整个折射率空间,计算目标函数相对于折射率的梯度,经过多次迭代,当目标函数满足要求时,最终得出设计区域的折射率分布。这种基于超材料的图案化耦合器,在散射空隙区域允许光来回散射,从而为优化提供了大量的自由度。不同输入端口的光波可以是同一频率也可以是不同频率。这里我们先讨论不同输入端口的光波具有相同的频率,具有相干性。如果来自输入和输出端口的光强度遵守能量守恒定律,则光散射单元原则上可以实现任意酉矩阵乘法。任意的实值矩阵M可以是通过奇异值分解(SVD)分解为M=UΣV*。Σ是对角矩阵,可以使用Mach Zehnder干涉仪实现。U,V*是酉矩阵,可以使用光学散射单元实现。
酉矩阵是在电场上实现的,而不是光强度。我们使用均方误差(MSE)来评估精确输出与预测之间的差异。采用某个特殊酉矩阵的500个输出作为训练集,图4B示出了MSE随着训练时间而逐渐减少,这表明光散射单元真正学习了酉矩阵的特征。
实施例3
基于光散射单元我们提出一种非相干光神经网络架构,包括若干光学神经网络层,每层光学神经网络层包括用于光学矩阵乘法单元和光学非线性单元,其中所述光学矩阵乘法单元为实施例2中所公开的的基于光散射的图案化的MMI耦合器。利用上述非相干光神经网络架构,可以实现矩阵乘法和图像分类等深度学习任务。非相干光子架构的优势在于,可以基于光强度而非电场来实现矩阵乘法。对于光调制或光探测,由于相位控制的复杂要求,光强度比电场更容易控制。非相干光散射单元可以通过不同波导输入不同波长的光信号来实现矩阵乘法,如图5A所示。在此,图案化的耦合器区域可被视为“光束分离器”,它将一个光束分离成多个光束至各自的输出波导。在每个输出波导处,由于不同波长的光的非相干特性,可以直接将不同波长的光强度相加。基于能量守恒定律,我们可以利用随机矩阵(也称为概率矩阵,马尔可夫矩阵等)来描述这种非相干光散射单元中输入和输出光强度之间的关系。这里我假设左随机矩阵,即矩阵的每一列求和为1。我们假设每个波长的输入强度等于也为1,随机矩阵的每一列求和代表所有输出波导中的某一个特定波长的强度求和,根据能量守恒和为1。
我们从一个特殊的4×4随机矩阵开始,如图5B所示,作为我们的优化目标。矩阵的第一列要求将来自输入端口1的光分成相同强度的四份至各自的输出波导。矩阵的第二列要求将来自输入端口2的光分成具有相同强度的三份至输出波导2',3'和4',依此类推。通过MMI耦合器区域的逆向设计,光散射单元的功能可以逐渐接近目标随机矩阵乘法。随着训练迭代次数增加到200,MSE降低10-4,这表明光散射单元可以实现误差可忽略不计的目标随机矩阵(图5C)。光散射单元的最优折射率分布如图5D所示。优化的耦合器区域的尺寸为4×4μm2。耦合器区域离散化为80×80像素,每个像素的尺寸为50×50nm2。每个像素的折射率限制在1(空气)和3.47(1.55μm处的硅)之间。在图5E中绘出了不同波长处的电场分布。我们使用有限差分频域(FDFD)模拟该电场分布,可以看出电场分布和目标的随机矩阵吻合的很好。
我们提出了基于此光散射单元的非相干光学神经网络架构,并在经典数据集MNIST执行图像分类任务测试。使用相同的55000张图像训练,并使用另外5000张图像进行测试,对64位计算机上的传统CNN和基于光散射单元的非相干光学神经网络架构进行性能比较。传统的CNN算法具有与图2A所示相同的架构。我们将具有1个输入通道和4个输出通道的3×3卷积核,以及具有4个输入通道和8个输出通道的3×3卷积核分别应用于第一和第二卷积层。这些卷积运算是CNN中计算量最大的部分,可以由光散射单元来实现进行加速。光学卷积部分,第一和第二卷积运算可以分别由一层和三层9×9光学“卷积核矩阵”实现。9×9光学“卷积核矩阵”可以通过九端口的光散射单元实现。最大值池化操作可以视为非线性函数,因为它采用选定区域的最大值并生成与输入矩阵非线性相关的新输出矩阵。非相干光学神经网络架构可以实现97.1%的分类准确度,与64位电脑上的97.3%的分类准确度相当。图5F示出了在相同的5000张测试图像上的64位计算机和非相干ONN架构的混淆矩阵。结果清楚地表明非相干ONN架构在手写数字分类任务上可以做到和传统计算机一样好。

Claims (6)

1.一种基于光散射的图案化的多模干涉耦合器,包括耦合器本体,以及分别连接在耦合器本体输入端和输出端的多个输入波导和多个输出波导,其特征在于,所述耦合器本体包括:
支撑衬底;
设置在支撑衬底上的波导基体,在所述波导基体上设有多个沿波导基体高度方向延伸的散射空隙,该散射空隙依照设定折射率分布要求布置;
所述散射空隙横穿所述波导基体;或者所述散射空隙为位于波导基体底面或者顶面的凹槽结构;所述散射空隙为不规则结构,所述散射空隙在沿波导基体高度方向上的投影尺寸不变;所述波导基体被所述散射空隙分割为多个不规则的波导阵列;
所述基于光散射的图案化的多模干涉耦合器由下述方案设计得到:
使用两个全场模拟,采用逆向设计方法来搜索耦合器本体区域的整个折射率空间,计算目标函数相对于折射率的梯度,通过反复迭代运算,最终得到波导基体的最佳折射率分布,进而得到波导基体中散射空隙分布信息和尺寸信息,完成对所述基于光散射的图案化的多模干涉耦合器的设计。
2.一种如权利要求1所述的基于光散射的图案化的多模干涉耦合器的设计方法。
3.一种光学神经网络处理器,包括若干光学神经网络层,其特征在于,每层光学神经网络层包括用于光学矩阵乘法单元和光学非线性单元,其中所述光学矩阵乘法单元为权利要求1所述的基于光散射的图案化的多模干涉耦合器。
4.根据权利要求3所述的光学神经网络处理器,其特征在于,其基于相干光或者非相干光。
5.一种如权利要求1所述的基于光散射的图案化的多模干涉耦合器在基于非相干光的神经网络架构中的应用。
6.一种如权利要求1所述的基于光散射的图案化的多模干涉耦合器在基于相干光的神经网络架构中的应用。
CN201911092358.0A 2019-11-11 2019-11-11 基于光散射的图案化的多模干涉耦合器、设计方法和应用 Active CN110703385B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911092358.0A CN110703385B (zh) 2019-11-11 2019-11-11 基于光散射的图案化的多模干涉耦合器、设计方法和应用

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911092358.0A CN110703385B (zh) 2019-11-11 2019-11-11 基于光散射的图案化的多模干涉耦合器、设计方法和应用

Publications (2)

Publication Number Publication Date
CN110703385A CN110703385A (zh) 2020-01-17
CN110703385B true CN110703385B (zh) 2021-04-02

Family

ID=69204791

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911092358.0A Active CN110703385B (zh) 2019-11-11 2019-11-11 基于光散射的图案化的多模干涉耦合器、设计方法和应用

Country Status (1)

Country Link
CN (1) CN110703385B (zh)

Families Citing this family (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111487790A (zh) * 2020-04-21 2020-08-04 西湖大学 一种动态可调控的多模干涉耦合器、设计方法和应用
CN111879791B (zh) * 2020-07-30 2023-06-20 西湖大学 一种图案表面凸起特征增强的机器视觉系统及方法
CN112180592B (zh) * 2020-10-14 2023-03-21 兰州大学 一种用于光学逆向设计的快速优化方法
US11846574B2 (en) 2020-10-29 2023-12-19 Hand Held Products, Inc. Apparatuses, systems, and methods for sample capture and extraction
US11251876B2 (en) 2020-11-17 2022-02-15 Intel Corporation Optical analog matrix multiplier for optical neural networks
US11474298B2 (en) * 2020-11-17 2022-10-18 Intel Corporation 2×2 optical unitary matrix multiplier
CN113051523B (zh) * 2021-03-16 2023-02-24 深圳前海黑顿科技有限公司 一种用于快速计算矩阵乘法的光学装置
CN113222135B (zh) * 2021-05-07 2024-02-09 中国科学院半导体研究所 一种基于多模干涉效应的片上光神经网络结构
CN113674370A (zh) * 2021-08-02 2021-11-19 南京理工大学 基于卷积神经网络的单帧干涉图解调方法
CN116593989B (zh) * 2023-06-15 2023-11-21 宁波麦思捷科技有限公司武汉分公司 一种基于雷达海杂波的对流层波导反演方法及系统
CN117494533B (zh) * 2024-01-02 2024-03-12 电子科技大学 一种涉及磁边界的四分量波导端口特性求解方法

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110378473A (zh) * 2019-07-26 2019-10-25 清华大学 基于深度学习和随机图案的相位层析方法及装置

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6047096A (en) * 1997-03-07 2000-04-04 Telefonaktiebolaget Lm Ericsson Optical device
US6788863B2 (en) * 1997-05-16 2004-09-07 Mesophotonics Limited Optical delay device
CN100538413C (zh) * 2007-03-13 2009-09-09 浙江大学 基于光子晶体和多模干涉耦合器混合型的偏振分束器
WO2017210550A1 (en) * 2016-06-02 2017-12-07 Massachusetts Institute Of Technology Apparatus and methods for optical neural network
CN106094199B (zh) * 2016-08-10 2019-05-17 哈尔滨工业大学深圳研究生院 一种片上光功率分束器的设计方法
CN106405730B (zh) * 2016-11-28 2019-09-24 华中科技大学 一种硅基粗波分器件

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110378473A (zh) * 2019-07-26 2019-10-25 清华大学 基于深度学习和随机图案的相位层析方法及装置

Also Published As

Publication number Publication date
CN110703385A (zh) 2020-01-17

Similar Documents

Publication Publication Date Title
CN110703385B (zh) 基于光散射的图案化的多模干涉耦合器、设计方法和应用
Zhu et al. Space-efficient optical computing with an integrated chip diffractive neural network
Liu et al. Holylight: A nanophotonic accelerator for deep learning in data centers
KR102589616B1 (ko) 광전자 컴퓨팅 시스템
Zhang et al. An optical neural chip for implementing complex-valued neural network
Fu et al. Photonic machine learning with on-chip diffractive optics
TWI741533B (zh) 計算系統、計算裝置及計算系統的操作方法
WO2019236251A1 (en) Convolutional layers for neural networks using programmable nanophotonics
Zhou et al. Chip-scale optical matrix computation for PageRank algorithm
CN113496281A (zh) 光电计算系统
CN112823359A (zh) 光电计算系统
US11843182B2 (en) Computation with adjustable resonant optical metamaterials
Kirtas et al. Quantization-aware training for low precision photonic neural networks
Banerjee et al. Characterizing coherent integrated photonic neural networks under imperfections
Dabos et al. End-to-end deep learning with neuromorphic photonics
Shokraneh et al. High-performance programmable MZI-based optical processors
US20230351167A1 (en) Frequency multiplexed photonic neural networks
EP3933469A1 (en) Integrated photonic mixing devices and optical computing systems including such devices
WO2021201773A1 (en) Apparatus and method for implementing a complex-valued neural network
Zhang et al. A photonic chip-based machine learning approach for the prediction of molecular properties
Wei et al. Spatially varying nanophotonic neural networks
Sharma SILICON PHOTONICS BUILDING BLOCKS FOR AI ACCELERATORS–AN INTEGRATED APPROACH
Orlandin Analysis of silicon photonics neuromorphic networks
Wang Diffractive integrated photonics for analog computing and machine learning
Jahannia et al. Low-latency full precision optical convolutional neural network accelerator

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant