CN110709866A - 多模储层 - Google Patents
多模储层 Download PDFInfo
- Publication number
- CN110709866A CN110709866A CN201880035939.8A CN201880035939A CN110709866A CN 110709866 A CN110709866 A CN 110709866A CN 201880035939 A CN201880035939 A CN 201880035939A CN 110709866 A CN110709866 A CN 110709866A
- Authority
- CN
- China
- Prior art keywords
- multimode
- passive
- junction
- reservoir
- computing system
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 230000003287 optical effect Effects 0.000 claims abstract description 41
- 238000012549 training Methods 0.000 claims abstract description 27
- 230000001902 propagating effect Effects 0.000 claims abstract description 5
- 230000005855 radiation Effects 0.000 claims description 23
- XUIMIQQOPSSXEZ-UHFFFAOYSA-N Silicon Chemical compound [Si] XUIMIQQOPSSXEZ-UHFFFAOYSA-N 0.000 claims description 9
- 229910052710 silicon Inorganic materials 0.000 claims description 9
- 239000010703 silicon Substances 0.000 claims description 9
- 230000002441 reversible effect Effects 0.000 claims description 7
- 230000008901 benefit Effects 0.000 description 37
- 230000005540 biological transmission Effects 0.000 description 36
- 238000013461 design Methods 0.000 description 30
- 238000000034 method Methods 0.000 description 30
- 238000004088 simulation Methods 0.000 description 23
- 238000002834 transmittance Methods 0.000 description 21
- 230000005284 excitation Effects 0.000 description 16
- 230000006872 improvement Effects 0.000 description 12
- 230000000875 corresponding effect Effects 0.000 description 10
- 238000005457 optimization Methods 0.000 description 10
- 238000006243 chemical reaction Methods 0.000 description 8
- 238000009413 insulation Methods 0.000 description 8
- 239000000463 material Substances 0.000 description 8
- VYPSYNLAJGMNEJ-UHFFFAOYSA-N Silicium dioxide Chemical compound O=[Si]=O VYPSYNLAJGMNEJ-UHFFFAOYSA-N 0.000 description 7
- 238000010586 diagram Methods 0.000 description 7
- 230000000694 effects Effects 0.000 description 7
- 238000005253 cladding Methods 0.000 description 6
- 230000010363 phase shift Effects 0.000 description 6
- 230000006870 function Effects 0.000 description 5
- 238000004519 manufacturing process Methods 0.000 description 5
- 230000002829 reductive effect Effects 0.000 description 5
- 238000013528 artificial neural network Methods 0.000 description 4
- 230000009286 beneficial effect Effects 0.000 description 4
- 238000004422 calculation algorithm Methods 0.000 description 4
- 230000001427 coherent effect Effects 0.000 description 4
- 238000002474 experimental method Methods 0.000 description 4
- 238000010801 machine learning Methods 0.000 description 4
- 238000005259 measurement Methods 0.000 description 4
- 230000007246 mechanism Effects 0.000 description 4
- 210000002569 neuron Anatomy 0.000 description 4
- 230000009467 reduction Effects 0.000 description 4
- 239000000377 silicon dioxide Substances 0.000 description 4
- 238000012360 testing method Methods 0.000 description 4
- 238000013459 approach Methods 0.000 description 3
- 230000006399 behavior Effects 0.000 description 3
- 230000001419 dependent effect Effects 0.000 description 3
- 239000000203 mixture Substances 0.000 description 3
- 230000008569 process Effects 0.000 description 3
- 238000012545 processing Methods 0.000 description 3
- 238000012935 Averaging Methods 0.000 description 2
- 230000003213 activating effect Effects 0.000 description 2
- 210000004556 brain Anatomy 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 2
- 238000004891 communication Methods 0.000 description 2
- 238000012937 correction Methods 0.000 description 2
- 230000002596 correlated effect Effects 0.000 description 2
- 230000008878 coupling Effects 0.000 description 2
- 238000010168 coupling process Methods 0.000 description 2
- 238000005859 coupling reaction Methods 0.000 description 2
- 238000002790 cross-validation Methods 0.000 description 2
- 238000000354 decomposition reaction Methods 0.000 description 2
- 230000001934 delay Effects 0.000 description 2
- 239000006185 dispersion Substances 0.000 description 2
- 238000009826 distribution Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000011156 evaluation Methods 0.000 description 2
- 230000010365 information processing Effects 0.000 description 2
- 230000003993 interaction Effects 0.000 description 2
- 230000000670 limiting effect Effects 0.000 description 2
- 238000003672 processing method Methods 0.000 description 2
- 230000004044 response Effects 0.000 description 2
- 238000012546 transfer Methods 0.000 description 2
- 108010076504 Protein Sorting Signals Proteins 0.000 description 1
- 238000009825 accumulation Methods 0.000 description 1
- 230000009471 action Effects 0.000 description 1
- 230000002238 attenuated effect Effects 0.000 description 1
- 230000033590 base-excision repair Effects 0.000 description 1
- 238000005452 bending Methods 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000012512 characterization method Methods 0.000 description 1
- 230000003111 delayed effect Effects 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 230000001627 detrimental effect Effects 0.000 description 1
- 239000003989 dielectric material Substances 0.000 description 1
- 230000009977 dual effect Effects 0.000 description 1
- 230000005684 electric field Effects 0.000 description 1
- 230000005672 electromagnetic field Effects 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 239000000835 fiber Substances 0.000 description 1
- 239000011521 glass Substances 0.000 description 1
- 230000005283 ground state Effects 0.000 description 1
- 230000001976 improved effect Effects 0.000 description 1
- 230000001788 irregular Effects 0.000 description 1
- 230000005693 optoelectronics Effects 0.000 description 1
- 238000003909 pattern recognition Methods 0.000 description 1
- 230000010287 polarization Effects 0.000 description 1
- 229920000642 polymer Polymers 0.000 description 1
- 230000008092 positive effect Effects 0.000 description 1
- 230000000306 recurrent effect Effects 0.000 description 1
- 238000002310 reflectometry Methods 0.000 description 1
- 230000003252 repetitive effect Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 230000000638 stimulation Effects 0.000 description 1
- 238000003860 storage Methods 0.000 description 1
- 239000000758 substrate Substances 0.000 description 1
- 238000010408 sweeping Methods 0.000 description 1
- 230000036962 time dependent Effects 0.000 description 1
- 230000002463 transducing effect Effects 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- 230000001960 triggered effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G02—OPTICS
- G02F—OPTICAL DEVICES OR ARRANGEMENTS FOR THE CONTROL OF LIGHT BY MODIFICATION OF THE OPTICAL PROPERTIES OF THE MEDIA OF THE ELEMENTS INVOLVED THEREIN; NON-LINEAR OPTICS; FREQUENCY-CHANGING OF LIGHT; OPTICAL LOGIC ELEMENTS; OPTICAL ANALOGUE/DIGITAL CONVERTERS
- G02F3/00—Optical logic elements; Optical bistable devices
- G02F3/02—Optical bistable devices
- G02F3/028—Optical bistable devices based on self electro-optic effect devices [SEED]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/06—Physical realisation, i.e. hardware implementation of neural networks, neurons or parts of neurons
- G06N3/067—Physical realisation, i.e. hardware implementation of neural networks, neurons or parts of neurons using optical means
- G06N3/0675—Physical realisation, i.e. hardware implementation of neural networks, neurons or parts of neurons using optical means using electro-optical, acousto-optical or opto-electronic means
-
- G—PHYSICS
- G02—OPTICS
- G02B—OPTICAL ELEMENTS, SYSTEMS OR APPARATUS
- G02B6/00—Light guides; Structural details of arrangements comprising light guides and other optical elements, e.g. couplings
- G02B6/10—Light guides; Structural details of arrangements comprising light guides and other optical elements, e.g. couplings of the optical waveguide type
- G02B6/12—Light guides; Structural details of arrangements comprising light guides and other optical elements, e.g. couplings of the optical waveguide type of the integrated circuit kind
- G02B6/122—Basic optical elements, e.g. light-guiding paths
- G02B6/1228—Tapered waveguides, e.g. integrated spot-size transformers
-
- G—PHYSICS
- G02—OPTICS
- G02B—OPTICAL ELEMENTS, SYSTEMS OR APPARATUS
- G02B6/00—Light guides; Structural details of arrangements comprising light guides and other optical elements, e.g. couplings
- G02B6/10—Light guides; Structural details of arrangements comprising light guides and other optical elements, e.g. couplings of the optical waveguide type
- G02B6/12—Light guides; Structural details of arrangements comprising light guides and other optical elements, e.g. couplings of the optical waveguide type of the integrated circuit kind
- G02B6/122—Basic optical elements, e.g. light-guiding paths
- G02B6/125—Bends, branchings or intersections
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/044—Recurrent networks, e.g. Hopfield networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N5/00—Computing arrangements using knowledge-based models
- G06N5/04—Inference or reasoning models
Abstract
一种无源光子储层计算系统,该系统包括基于光学波导的结构,该基于光学波导的结构包括多个离散节点以及在各节点之间的多个无源波导互连件以供在各节点之间传播至少一个光子信号,其中每个离散节点被适配用于在连接到的无源波导互连件上无源地中继该至少一个光子波,其中该基于光学波导的结构包括至少一个多模Y结,该至少一个多模Y结被配置用于使用锥形部分连接三个波导,其中该锥形部分不是完全绝热的。本发明还涉及一种用于训练无源光子计算系统的训练方案。
Description
发明领域
本发明涉及光学储层计算的领域。更具体而言,本发明涉及具有低损耗的用于光学储层计算的方法和系统。
发明背景
机器学习领域旨在教导计算机系统如何对先前未见的数据执行复杂的任务,而无需对其进行明确编程。此类任务的示例是分类、回归或模式识别。可用机器学习技术的库是全面的。
对于每种应用必须选择最恰适的技术,这取决于该应用的特定要求。一类重要的技术是所谓的人工神经网络,它由互连神经元的网络组成。该理念基于人脑结构以及人脑如何处理信息。神经网络的一个子类(被称为递归神经网络(RNN))通过在神经元之间创建定向互连循环而将存储的概念引入网络。由于训练这些网络相当困难,因此提出了储层计算(RC)作为简化RNN训练的方法。然而,最近RC已作为解决各种复杂问题的计算范例而获得普及。已表明,RC在例如语音识别和时间序列预测上表现非常良好。
RC实现通常是基于软件的并依赖串行算法来对整个网络的信号传播和操纵进行仿真。该工作流的串行特征限制了速度和功率效率:对大型储层或大量输入序列进行仿真既是时间密集的又非常消耗功率。利用储层的固有并行性质的想法触发了对可行硬件实现技术的兴趣。迄今已提出了硬件中各种各样的RC实现。一种有趣的候选技术必然是光子领域,其导致光子储层计算(PRC)的概念。光作为信息载体的最重要优点在于光学信号非常高的载波频率、其固有并行性以及能够以低损耗在介电材料上携带光学信号的事实。使用光学信号因此实现更快(并且强并行的)信息处理并且有希望比电子实现的功耗要低。为了节省功率,K.Vandoorne等人在自然通信(Nature Communications)5(2014)3541中给出了无源PRC实现,该无源PRC实现利用光栅耦合器、MMI和延迟。可惜的是,这些组件在储层中引入了严重损耗,这限制了储层的大小(即,神经元数目)。更具体而言,由于涉及Y划分器/组合器的网络结构,每次两条路径在节点中汇聚,就因基础物理学而损耗平均50%的光,这些光被辐射出去并且因此损耗,如图2中所示。网络越大,就遇到越多这些组合器,这意味着信息快速衰减并且不能到达网络的另一端。例如,在如由Vandoorne等人在Nat.Commun.(自然通信)5(2014)3541中描述的系统中,即使网络包含20个节点,也仅能够测量这些节点中的12个节点,因为对于其他节点,功率已下降超过本底噪声。
由于储层可以执行的任务的复杂度取决于组成该储层的神经元数目,这些损耗也限制了可以执行的任务的复杂度,并且因此仍有改进的空间。
发明概述
本发明的各实施例的目的是提供显示出低损耗的高效无源光子储层计算方法和系统。
本发明的各实施例的优点在于系统允许升级到大量的节点,这是因为可以限制系统中发生的损耗。
本发明的各实施例的优点在于可以获得更高的效率。此外要注意,小的效率增加得到总体大的增益,这是由于波的组合和划分发生多次,即,在根据本发明的各实施例的无源光学计算储层中通常使用一系列划分器和或组合器。
本发明的各实施例的优点在于,通过使用更宽的波导,支持多种引导模式。
本发明的各实施例的优点在于,如果单独地读出多种模,则产生系统中更多的可观察项,这可以通过动态性增强的丰富性来改善储层性能。
根据本发明的各实施例的优点在于,可以利用不需要确切知晓系统状态、而是能够通过使用特定的训练样本多次以高效方式重构系统状态的训练方法。
本发明的各实施例的优点在于提供了使用极少功率的读出结构,从而得到高效系统。
本发明的各实施例的优点在于pn结仅使用非常小的功率,即,对应于漏泄电流的功率。
本发明的各实施例的优点在于,所需要的光电二极管数目可以较小或者甚至限制于一个,从而得到包括有限数目组件的系统。
根据本发明的各实施例的优点在于可以利用公知的硅光子技术,从而得到用于制造系统的公知处理方法。
本发明涉及一种无源光子储层计算系统,该系统包括基于光学多模波导的结构,该基于光学多模波导的结构包括多个离散节点以及在各节点之间的多个无源多模波导互连件,这些无源多模波导互连件用于在各节点之间传播至少一个光子信号,其中每个离散节点被适配用于在连接到的无源多模波导互连件上无源地中继该至少一个光子波,其中该基于光学波导的结构包括至少一个多模结,其被配置用于使用锥形部分连接至少三个多模波导,其中该锥形部分不是完全绝热的。
在连接有三个波导的情形中,多模结可被称为多模Y结。本发明的各实施例的优点在于,由于所涉及波导的多模态,因此在波导结构中以较高阶模式转换的一部分辐射仍然在该波导结构中被引导并且因此未丢失。本发明的各实施例的优点在于,获取具有更大自由度(例如是否个体地读出每种模式)的更丰富系统。这可以得到更好的分类性能。本发明的各实施例的优点在于,如果锥形部分提供朝向输出波导的不太平滑的演化,则并非所有功率将保留在相同模式内,而是可以将功率散射到所支持的(引导)模式。以此方式,辐射以及对应功率未被散射出该结构。
本发明的各实施例的优点在于提供紧凑的解决方案。
本发明的各实施例的优点在于提供显示出大的拓扑自由度以及良好速度的系统。
本发明的各实施例的优点在于提供可以大规模实现的高效系统。
当在本发明的各实施例中提及多个节点时,指的是至少2个节点,有利地至少3个节点,更有利地至少5个节点。
节点可被配置用于:经由多模结在无源光子储层计算系统中执行多次划分和/或组合,这些多模结被配置用于使用非完全绝热的锥形部分连接至少三个多模波导。
本发明的各实施例的优点在于可以获取更高的效率。此外要注意,小的效率增加得到总体大的增益,这是由于波的组合和划分发生多次,即,在根据本发明的各实施例的无源光学计算储层中通常使用一系列划分器和或组合器。
多模结可以是用于连接三个多模波导的多模Y结。
波导可具有例如至少500nm的宽度,有利地至少1000nm。波导的宽度可因变于所使用的波长来选择,以使得这些波导支持引导多种模式。本发明的各实施例的优点在于,通过使用更宽的波导,支持多种引导模式。
锥形长度可在2μm至2.5μm之间。锥形长度可因变于所使用的波长来选择,以使得这些波导支持引导多种模式。
可以调谐绝热性的其他参数例如是锥形宽度以及在划分器的情形中传出波导之间的角度或在组合器的情形中传入波导之间的角度。
基于光学波导的结构可被配置用于在光学域中对所得辐射信号执行加权,并且其中,该系统被配置用于使用多模Y结来组合经加权信号,这些多模Y结被配置用于使用锥形部分连接三个波导,其中该锥形部分不是完全绝热的。本发明的各实施例的优点在于提供了使用极少功率的读出结构,从而得到高效系统。
该系统可包括用于对所得辐射信号进行加权的反向偏置的pn结。本发明的各实施例的优点在于反向偏置的pn结仅使用非常小的功率,即,对应于漏泄电流的功率。
经加权信号可在大面积光电二极管中被组合,该大面积光电二极管被配置用于对经加权所得辐射信号执行非线性操作。本发明的各实施例的优点在于,所需要的光电二极管数目可以较小或者甚至限制于一个,从而得到包括有限数目组件的系统。
执行非线性操作可包括:在对经加权所得辐射信号进行求和之前取该经加权所得辐射信号的幂。
该系统可包括训练模块,该训练模块用于确定系统中不同通道的功率以及系统中不同通道之间的相位差。
通道可被定义为光子信号在系统中可以遵循的不同路径。
训练模块可被配置用于获取训练数据,其中加权系数通过相继进行以下操作来选择:将一个加权系数选择为等于1、同时将所有其他加权系数设置为0,以及将两个加权系数选择为等于1、同时将所有其他加权系数设置为0。最后步骤可被重复以解除π相移的简并性(degeneracy)。在另一示例中,可以为较小信号提供较大权重以得到更好的分辨率。在一些示例中,还可使用一组2个非零权重以解除π相移歧义性。
要注意,训练模块和加权系统以及对应方法不限于光子储层计算系统,而是可以被更宽泛地应用于诸如基于光子波的计算系统之类的光子计算系统。
替换地,连续相位调谐也可以用于训练模块中以提取加权系数。
该系统可包括无源硅光子储层。根据本发明的各实施例的优点在于可以利用公知的硅光子技术,从而得到用于制造系统的公知处理方法。在所附独立和从属权利要求中阐述了本发明的特定和优选方面。来自从属权利要求的特征可以与独立权利要求的特征以及其他从属权利要求的特征恰适地组合,而不仅仅是如在权利要求中明确阐述的。
参考下文描述的(诸)实施例,本发明的这些和其他方面将变得显而易见并得以阐明。
附图简述
图1解说了如在根据本发明的各实施例中可以使用的无源储层计算系统和用于训练输出的附连模块。
图2是用作划分器和组合器的不同Y结的示意图,从而解说了现有技术以及根据本发明的各实施例的特征。
图3解说了根据本发明的实施例的无源储层计算系统效率的波长依赖性。
图4解说了根据本发明的实施例的针对不同节点的多模与单模相比减少的损耗。
图5解说了用于处理设计数字光学信号的任务的光子储层计算设置的示意图,如用于解说根据本发明的各实施例的特征。
图6示出了在本发明的示例性实施例中使用的针对TE极化和1300nm的中心波长的220nm SOI波导的散布图,其中neff是模式的复有效折射率。
图7示出了关于本发明的示例性实施例的Y结的草图,该草图指示了对该Y结的性能至关重要的部分。
图8解说了关于本发明的示例性实施例的针对不同锥形长度的Y结组合器的总透射率。
图9解说了关于本发明的示例性实施例的波长对多模Y结的透射率的影响。
图10和11解说了针对单模储层或多模储层的误差率与互连延迟,从而解说了本发明的示例性实施例的特征。
图12针对输入SNR的不同值解说了单模储层或多模储层的误差率,从而解说了本发明的示例性实施例的特征。
图13和14针对输入到节点0示出了16节点或36节点单模和多模储层每节点平均功率的比较,从而解说了本发明的示例性实施例的特征。
权利要求中的任何附图标记不应被解释为限制范围。
在不同的附图中,相同的附图标记指代相同或相似的元件。
解说性实施例的详细描述
将关于特定实施例并且参照某些附图来描述本发明,但是本发明不限于此,而仅由权利要求书来限定。所描述的附图仅是示意性且非限制性的。在附图中,出于解说性目的,可将要素中的一些尺寸放大且不按比例绘制。尺寸和相对尺寸不对应于对本发明实践的实际缩减。
此外,说明书中和权利要求中的术语第一、第二等等用于在类似的要素之间进行区分,并且不一定用于在时间上、空间上、以排名或任何其他方式来描述顺序。应当理解,如此使用的术语在适当的情况下是可互换的并且本文中所描述的本发明的实施例与本文中所描述或图示的相比能够以其他顺序来进行操作。
另外,说明书和权利要求书中的术语顶部、下方等等被用于描述性目的而不一定用于描述相对位置。应当理解,如此使用的术语在合适情况下是互换的,并且本文中所描述的本发明的实施例能够以除了本文描述或图示的取向的之外的其他取向来操作。
应当注意,权利要求中使用的术语“包括”不应被解释为限定于其后列出的装置;它并不排除其他要素或步骤。因此,该术语应被解释为指定如所提到的所陈述的特征、整数、步骤或组件的存在,但不排除一个或多个其他特征、整数、步骤或组件、或其群组的存在或添加。因此,表述“一种包括装置A和B的设备”的范围不应当被限制于仅由组件A和B构成的设备。这意味着对于本发明,该设备的仅有的相关组件是A和B。
贯穿本说明书对“一个实施例”或“实施例”的引用意指结合该实施例描述的特定的特征、结构或特性被包括在本发明的至少一个实施例中。因此,短语“在一个实施例中”或“在实施例中”贯穿本说明书在各个地方的出现并不一定全部指代同一实施例,而是可以指代同一实施例。此外,在一个或多个实施例中,如从本公开中对本领域普通技术人员将是显而易见的,特定的特征、结构或特性可以用任何合适的方式进行组合。
类似地,应当领会,在本发明的示例性实施例的描述中,出于精简本公开和辅助对各个发明性方面中的一个或多个的理解的目的,本发明的各个特征有时被一起编组在单个实施例、附图或其描述中。然而,这种公开的方法不应被解释为反映所要求保护的本发明需要比每项权利要求中所明确记载的更多特征的意图。相反,如所附权利要求反映的,各发明性方面存在比单个前述公开的实施例的全部特征更少的特征。因此,详细描述所附的权利要求由此被明确并入本详细描述中,其中每一项权利要求本身代表本发明的单独的实施例。
此外,如将由本领域技术人员所理解的,尽管本文中所描述的一些实施例包括其他实施例中所包括的一些特征但不包括其他实施例中所包括的其他特征,但是不同实施例的特征的组合旨在落在本发明的范围内,并且形成不同实施例。例如,在所附的权利要求书中,所要求保护的实施例中的任何实施例均可以任何组合来使用。
在本文中所提供的描述中,阐述了众多具体细节。然而要理解,可以在没有这些具体细节的情况下实践本发明的实施例。在其他实例中,未详细示出公知的方法、结构和技术,以免混淆对本描述的理解。
当在本发明的各实施例中提及Y结时,指的是三端口器件,该三端口器件被设计成:将第一端口(输入端口)的导波对称地或非对称地划分成其他两个端口(输出端口)的导波,或者将两个端口(输入端口)的导波组合成第三端口(输出端口)的导波。此外,单模Y结被称为上述Y结,其中输入和输出端口由仅引导包括一个单模的波的波导制成。相比之下,多模Y结被称为上述Y结,其中至少一个端口包含支持包括不仅一种模式的导波的波导。
当在本发明的各实施例中提及非完全绝热平滑锥形或锥形部分时,指的是在长度尺度上改变其形状的与绝热理论不兼容的平滑锥形结构。这意味着,波导模式被显著混合,例如,被限定在接地状态(基模)的大量能量被转换成较高阶模式的激励,反之亦然。该过程可包括辐射损耗并且通常具有比绝热锥形部分低的转换效率,从而产生接近100%(例如,大于98%)的单模转换效率。非完全锥形因此可具有小于98%(例如,小于95%)的转换效率。
在第一方面,本发明涉及一种无源光子储层计算系统,该系统包括基于光学多模波导的结构,该基于光学多模波导的结构包括多个离散节点以及在各节点之间的多个无源多模波导互连件以供在各节点之间传播至少一个光子信号。多个节点可以指至少2个节点,例如,至少3个节点。每个离散节点被适配用于:在连接到的无源波导互连件上无源地中继该至少一个光子信号。根据本发明,基于光学波导的结构包括至少一个多模结,其被配置用于使用锥形部分连接至少三个波导,其中该锥形部分不是完全绝热的。在三个波导之间的连接的情形中,结可以是Y结。更一般而言,结可被称为N×M耦合器,其中N和M彼此不同。取决于是输入数目还是输出数目更大,耦合器可被称为组合器或划分器。
通过解说的方式,本发明的各实施例不限于此,将参照图1和图2进一步描述标准和可任选特征,图1示出了无源储层计算系统1的示意图,图2示出了如用于在无源储层1内部的节点12位置处划分和组合光信号的Y结31、32、33的通用形状。虽然在本描述中将使用Y结来解释本发明的各实施例的特征和优点,但本发明不限于此,由此还可使用更通用的N×M耦合器,如上面还指示的。
图1展示了由输入信号携带的信息如何由无源储层系统1处理,以及储层系统1的读出机制21作为训练模块2的一部分用于推导出输出信号22。
图1中所示示例的无源储层计算系统1被构想为经由多模波导13互连的一组无源节点12。多模波导13可以按任何合适的方式来制造。在当前示例中,多模波导13被实现在硅芯片上并且通常宽度可大于500nm,理想情况下,如果这些多模波导13在1300nm左右的波长下操作,则它们的宽度大于或等于1000nm。波导的宽度通常可以是确定波导的多模行为的因素之一。要注意,多模波导可在任何适当的材料平台中被实现为诸如例如半导体波导(诸如Si、SiN)、聚合物波导(如SU8)、玻璃基板等等。
无源储层计算系统的节点12可被布置在规则网格上,如图1中所示,但各实施例不限于此,并且还可使用不规则网格。无源储层系统1包含的节点12越多,该无源储层系统1记住过去信号的容量以及因此其计算和预测能力就越好。在多模波导13内部作为定界的引导模式穿过无源储层计算系统1的光学信号遇到多个节点12,这些节点12重复地重新组合、划分光学信号并且因此将它们重定向到新的方向。现有技术系统中重复的组合动作的缺点在于信号在跨越若干个节点12之后经受的固有损耗,从而快速降至本底噪声水平,在该处由信号携带的所有信息丢失。在输入功率不完全同相的情况下,当单模50/50划分器31用单模321中的相干光反向操作以用作信号组合器32时,该损耗是该单模50/50划分器31的固有特性。图2的上方两幅图中解说了单模划分器和单模组合器的示例。在现有技术系统中平均50%的信号功率在这种通路中损耗,因为一部分经组合信号在输出端构成较高模322,这是未引导的并且因此辐射掉了。本发明的各实施例通过引入多模结33作为位于无源储层系统1的节点12处的划分器和/或组合器以使得发生的损耗减少来改善总体无源储层系统性能。后者将在下文参照图2进一步描述。
在图2中,下方的图解说了多模组合器的示例,其中示出了多模信号的组合。结33不是完全绝热的,并且输入和输出波导也是多模的。这些除了基本波导模式331、334之外还支持一个或多个更高阶模332、333。
再次参照图1,无源储层计算系统1接收一个或多个辐射输入信号11(也被称为至少一个光子信号11),这些信号11随时间变化并将经编码信息传达到器件外部。辐射输入信号11可以是经调制的自由空间耦合光波或经调制的光纤耦合光学模。所有辐射输入信号11被注入到一个或多个储层节点12中,例如通过多个平面外光栅耦合器元件或单个平面外光栅耦合元件继以划分传入辐射信号11的一系列Y结33。输入信号在高维特征空间中表示,该高维特征空间被给出为在一个或多个储层节点12处存在并提取的场的集合14。当无源储层计算系统1的状态随时间演化时,原始输入信号11在整个无源储层系统1上扩展,从而经历多次组合和划分事件。鉴于在这些事件中的每次事件之后保留在无源储层1内部的总光学信号功率量增加,结合多模波导使用多模Y结33是有利的。本发明的各实施例的优点在于,即使无源储层1中的远程节点121也可以变得可测量,而它们在先前储层系统中由于沿这些路径行进的辐射信号经历的过强损耗而不可测量。经提取的光学信号14被路由到训练模块2中并被训练模块2修改。
在读出级21处的复加权方案可完全在光学域中实现,但不限于此,因为可以构想等效的光电或完全电子版本。这具有降低假如读出机制21是完全电子的情况下该读出机制21将招致的复杂度和成本的优点。
经提取的光学信号14中的一个或多个光学信号通过例如首先衰减或放大信号幅度来乘以复权重。在一个特定示例中,衰减信号幅度是通过解谐微环腔211的降低的透射率并通过随后在线性移相器区域212中施加相移来获取的。在两种情形中,多模波导的有效折射率可以根据由反向偏置的pn结内部的场诱发的折射率变化来改变。反向偏置的pn结具有相对于基于加热器的相移解决方案低得多的静态功耗的优点。加热器连续汲取电流,而反向偏置的pn结仅经受微小的漏泄电流。有利地,所有经加权读出信号213被组合成单个输出信号22。类似于在无源储层系统1中使用多模Y结33,该组合步骤可以通过例如多模Y结33或锥形部分的级联214发生以减少由于辐射模式引起的损耗。如果读出级21的加权方案是完全电子的,则组合步骤214也可以是完全电子的(例如,电子扇入),但其他实现可以是优选的。在问题的期望输出需要在电子域中表示的情形中,输出信号22应当被转换到电子域中。这可以通过大面积光电二极管来实现,该大面积光电二极管覆盖组合级214末端的最后的宽多模波导。同时,光电二极管将实现将电磁场强度映射为功率值的非线性信号变换。对于储层计算系统的某些应用而言需要非线性行为。
传统的储层计算训练办法假定从无源储层系统1提取的所有光学信号14是可观察且已知的。本发明避免了该附加要求,从而得到仅具有一个需要观察的输出信号22的简化训练模块2。这是通过间接确定经提取储层状态14来实现的,在训练序列11被多次呈现给无源储层系统1的情况下这是可能的。每次重复训练样本11,复权重可以如下所述地改变,从而解说应用权重的有利示例,各实施例不限于此。更新可以是例如在相同输入信号被呈现几次(例如,3次)之后进行的更新。
通过使所有幅度控制权重211尽可能接近零来关闭这些权重。随后激活单个幅度控制权重211(例如,第一个),并使其尽可能接近1。输出信号22随后与对应的读出辐射信号14直接相关,该关系是光检测器的非线性平方范数运算,该光检测器将电场强度转换成其对应的功率值(如果必要的话,可以通过校准考虑检测器的非理想传递特性)。随后在除了第二加权元素之外的所有加权元素被关闭的情况下重复该规程,依此类推。
在第二步骤中,所有经提取的光学储层输出信号14之间的相对相位差通过一次选择这些信号中的两个信号并使其打开、而使其余信号处于关闭或零状态来确定。由光检测器输出22给出的功率值被记录。连同对经提取储层信号14的幅度值的先前提取,该第二测量步骤允许提取两个有源储层输出信号14之间的相对相位差。最后,为了能够求解π相移,执行在相同两个输入通道中具有两个不同非零输入信号的第三测量。用第二对权重重复这三次测量的步骤,依此类推。
确定储层输出状态14的该规程具有比许多暴力黑盒优化技术更快的优点。替代数百或数千的迭代步骤,前述方法仅需要O(3n)次重复,其中n是经提取储层状态14的数目。
如上面提到的,该规程经过主表征步骤,该步骤对光检测器的非线性响应量以及pn结的电压相移曲线进行量化。
通过解说的方式,将进一步讨论多模Y结的优化的示例,从而示出根据本发明的各实施例的系统的标准和可任选特征和优点,但各实施例不限于此。在本示例中,对于标准设计套件Y结(Ipkiss),多模Y结的优化基于以输入光学功率的百分比损耗来测量的性能结果,该损耗是波导宽度和锥形长度的函数。这是通过使用Lumerical MODE solutions软件进行值仿真以在Y结器件用作划分器或组合器时对该Y结器件响应进行仿真来实现的。为此,选择varFDTD方法,选取5级精度的自动非均匀网格划分策略,并应用共形变体1网格精化。在该示例中,波长被设置为1300nm,并使用围绕220nm高硅波导结构的折射率为1.4469的氧化硅包层,该包层具有根据Lumerical材料数据库中的Palik模型的材料参数,但设置和材料不限于当前选择。对结构进行仿真并发现多模系统的小增益,即减少的损耗。尽管效率增益看似适中,但它受益于无源储层系统1内部的多个节点传递,因此呈指数放大。结果,本发明实现具有更多节点的更大无源储层系统、设计拓扑中的极大自由度、以及更好的计算性能。
通过改变所使用波导和结的宽度,研究了划分器以及组合器的多模引导效果。通过增加所使用波导和结的宽度,将引导更多模。在600nm宽度下,前两种模(即,基模和一阶模)被强引导。存在第三种模式,但被不太强地引导。前三种模在800nm的宽度下被很好地引导,但现在第四种模(即,具有1.46的有效折射率和1.4469的包层折射率的三阶模式)被较弱地引导。1000nm宽的波导的情况已进一步朝向四个良好引导的模以及具有有效折射率1.4495的几乎未被引导的第五模(即,四阶模)演化。具有1200nm的宽度的最后设计更好地引导该四阶模,并且尚不支持五阶模。
由此针对具有不同宽度(600nm至1200nm)的波导和结的不同结构对损耗进行仿真。所获取的结果表明,对于较宽的波导和结,损耗显著小于较小的波导和结。后者解说了使用多种模式的积极效果,因为这些较宽的设计支持多种模式。基于这些积极结果,执行进一步的优化。
还研究了锥形设计对功率损耗的影响。在本例中,使用1μm宽度的波导设计来优化锥形长度。针对锥形长度为0.1μm、1μm、2μm和2.5μm的组合器执行了仿真。
在下表中示出了针对组合器的结果。SE由此是指单激励,而DE是指双激励。
锥形长度 | 透射率SE | 损耗SE | 透射率DE | 损耗DE |
0.1μm | 53% | 47% | 58% | 42% |
1μm | 56% | 44% | 60% | 40% |
2μm | 61% | 39% | 63% | 37% |
2.5μm | 55% | 45% | 61% | 39% |
组合器的相关模的非相干组合
(基本、一阶、二阶、三阶TE模)
表1
锥形长度 | 透射率SE | 损耗SE | 透射率DE | 损耗DE |
0.1μm | 49% | 51% | 68% | 32% |
1μm | 57% | 43% | 63% | 37% |
2μm | 82% | 18% | 89% | 11% |
2.5μm | 77% | 23% | 81% | 19% |
组合器的相关模的相干组合
(基本、一阶、二阶、三阶TE模)
表2
如所预期的,优化已得到较低的损耗。通过将原始的0.1_m锥形长度与其他锥形长度进行比较可以看出这一点。损耗的降低在2.0μm至2.5μm之间饱和。此后,损耗再次略有增加。这可以解释如下。通过使锥形更长,向锥形部分中的模提供更多时间以平滑地向输出模式收敛,而不会使锥形更加绝热并且由此破坏多模方案中不太绝热Y结的有益效果。因此,在锥形长度2.0到2.5μm之间达到最佳:锥形足够长以在最大程度上减少不希望的损耗,而不会损耗太多绝热性。在除此之外的一侧,损耗仍因锥形设计而被减小,但绝热性开始提高太多,从而导致有益效果降低,并且由此导致更多辐射损耗和散射出的光。在除此平衡点之外的另一侧,获取绝热性非常弱的锥形,以至于它不会抵消损耗,而是甚至对损耗有贡献。换言之,尽管可以执行进一步的优化,但仿真结果已经示出组合器(均在非相干组合模式源的情形中)的仅为39%(单激励)和37%(双激励)的平均损耗,这比当前储层中的MMI(50%的损耗)能提供的损耗要好得多。要注意,这些值和操作模式专用于此处研究的特定设计,并且对于其他设计可以不同。
还评估了所使用的波长对无源储层系统效率的依赖性。对于经建模的简化Y结,利用S参数来评估波长对结构行为的影响。图3解说了因变于波长的Y结的(复)S参数的绝对值平方,其中使用1μm宽的波导并且锥形长度为2μm。使用基模作为输入。从1280nm到1320nm(这是在中心频率1300nm附近的区间)对波长进行扫掠。这些绝对值平方是对应于每个S参数的功率流的度量。可以看出,测量结果与基本平坦的曲线相对应(几乎水平取向),从而解说了波长对无源储层系统的性能没有重要影响。本发明的各实施例的优点在于所使用波长的变化不会引起系统性能的很大变化。这与使用例如波长相关性大得多的定向耦合器的其它办法形成对比。
在另一实验中,对基于单模结和波导的储层与基于多模结和波导的储层之间的总损耗进行了比较。由此要注意,求解任务的性能没有显著不同,但发生的损耗显著不同。在图4中,指示了十六个节点无源储层的功率水平,由此比较了单模和多模储层。针对1比特延迟的XOR(异或)任务示出了将多模储层中每个节点的功率除以单模储层中相同节点的功率的功率比。由于第一节点被用作输入,因此它的功率未改变,并且它的功率比等于1。除了节点1和2之外,所有节点显然具有高于水平线的功率比,该水平线指示比率等于1之处。这意味着在多模储层的所有那些节点中测得更多的功率。
在第二方面,本发明涉及一种无源光子储层计算方法。该方法包括后文描述的以下步骤。在无源储层系统的至少一个节点接收一个或多个输入信号。通过在时间上变化的光波中直接耦合或采用换能元件根据一个或多个输入信号来调制光子波,可以接收输入信号。在无源储层系统内部传播该一个或多个输入信号的经延迟和重新加权版本,其中一个或多个多模Y结在无源储层节点位置充当划分器或组合器,这些多模Y结以功率高效的方式中继沿多模波导行进的传入和传出光学储层信号。可以包括进一步的可任选步骤,如从下文指示的示例性方法中可见。
该方法进一步可任选地可包括:在无源储层系统的节点位置探测该无源储层系统的一个或多个特定激励状态,并将它们路由到训练模块。该方法还可包括:在训练模块的读出部分中对一个或多个探测的储层输出信号应用线性加权方案。加权方案能够改变相应一个或多个光学信号14的幅度211和相位212。将读出级213的该一个或多个经修改光学信号组合成单个输出信号22,例如,通过多模Y结33的级联214或通过锥形多模波导的合并部分214,但不限于此。以非线性方式映射输出信号22,例如,通过光检测器元件将复值光学信号转换成实值电功率水平的动作。以受监督方式训练读出权重211、212,以使输出信号22与针对特定任务的期望教导信号相匹配。将该一个或多个探测到的储层状态14重构为至学习算法的必需输入。该重构是通过进行以下操作来实现的:同时观察输出信号22并多次呈现该一个或多个输入信号11,一次激活单个权重211并将其驱动为打开状态“1”,使其余权重保留在关闭状态“0”,以及通过激活权重对,将它们驱动为打开状态“1”,或更一般地非零状态,同时使所有其他权重保留在关闭状态“0”。该最后步骤发生两次,以解除π的简并性(degeneracy)。
进一步通过解说的方式,本发明不限于此,讨论了对基于多模Y结的无源集成光子储层计算平台的进一步数值研究。根据本发明的实施例,Y结被设计成具有绝热水平,该绝热水平被仔细定制成捕获较高阶模中的辐射损耗,同时提供增加储层动力学丰富性的附加模混合。与单模情形的标准50%相比获取61%的总体平均组合效率,并且已证明多得多的功率能够到达储层的远处节点,从而引起增加的缩放前景。使用报头识别任务的示例来确认这种储层可以被用于比特级处理任务。该设计本身是CMOS兼容的,并且可以通过已知的标准制造规程来制造。
本示例基于如图5中所解说的储层计算系统。图5示出了用于处理涉及数字光学信号的任务的光子储层计算设置的示意图。输入是非归零开关键控(NRZ-OOK)数字光学信号。储层由以涡流拓扑布置的16个节点组成,并且通过光检测器从每个节点读取输出。从此处开始,节点(较大的实心圆)将通过图示中的对应标签来引用。在此处使用的涡流架构中,节点是其状态被恰适地组合和划分并充当输入和检测点(由较小的实心圆指示)的位置。为了使用储层来解决特定任务,使用机器学习算法以使用一组已知的被标记示例数据来训练一组权重(读出),以使得在每个节点处记录的光学信号的线性组合尽可能接近地近似期望输出。这些权重随后被用于为任何未看到的后续注入的输入信号序列生成输出信号。RC系统训练迅速并快速收敛到全局最佳。它们在时间相关数据上的一系列复杂任务(诸如语音识别、非线性通道均衡、机器人控制、时间序列预测、财务预测、手写识别等等)上已显示出最先进性能。关键的发现在于,储层计算平台为实现基于硬件的学习系统提供了自然框架,对于此类学习系统可能仅具有有限的能力来有粒度地影响动态系统(储层)的内部状态。展示了在机械系统、忆阻系统、原子开关网络、布尔逻辑元件和光子系统中的RC实现的示例。此外,集成光子储层可以进一步提高数字信息处理的计算速度。集成光子储层特别引人注目,特别是在CMOS平台中实现时,因为它们可以利用其相关联的益处进行技术重用和大规模生产。
硅光子储层由节点组成,这些节点以平面拓扑互连在一起,如图1中所示。由于节点之间的互连是由几厘米的螺旋组成的,因此材料损耗(对于单模220nm Si波导而言约等于2dB/cm)非常重要。同样重要的信号损耗源是在组合器位置的损耗。实际上,基于超模理论,仅当两个输入完全同相时,在Y结中组合单模波导才具有100%的透射率。对于反相输入,透射率为0%。因此,在所有可能相位差上取平均,对于所遍历的每个组合器仅有50%的透射率。表达相同事实的替换方式是,如果仅激励组合器的单个输入,则将具有50%的透射率(稍后将使用这种单侧激励作为对不同相位差的平均透射率进行建模的较快方式)。对于具有大量组合器的大型储层,50%的损耗可以很快达到显著值。使用定向耦合器而非Y结理论上将解决这些问题,但是它们遭受严格的制造容差要求和窄带宽。这种组合损耗和传播损耗两者都制约了储层的大小,并且因此限制了它们可以解决的任务的复杂性。
通过使用根据本发明的各实施例的结,该系统允许在设计中升级节点数目,这是因为损耗累积可以被限制。即使跨节点传输的相对适中的改进也产生显著的总体增益,这是因为在信号被读出之前信号的划分和组合发生多次。这种改进取决于使用更宽的波导,从而支持多种模。
利用储层中的多种模的一种方式是通过使用这些模来减少损耗。该设计中的关键组件是根据本发明的各实施例的多模Y结结构,该多模Y结结构在组合器/划分器位置处使用。结使用有意设计成不完全绝热的锥形部分,最终得到能量效率益处。注意,多模态光子通常不会被考虑用于其他应用,因为它导致若干复杂情况(模态色散、更复杂的设计、难以在整个电路中选择性地激励和维持选定数目的模式等等)。然而,在RC计算范式的上下文中,这些都不重要。
使用多模Y结的关键优点源自以下事实:先前被散射到单模结构的辐射模式中的一部分光现在可以被捕获到较高阶的引导模式中。实际上,如先前提到的,在例如光仅被发送到单模Y组合器的两个输入臂之一的情形中,在进入输出波导时50%的光辐射出去。然而,如果组合器的输出波导支持多种模,则对于完全绝热的锥形,该透射率增加到100%。尽管如此,由于该组合光的一部分现在由较高阶模承载而不是由基模承载,因此仍然存在以下事实:该较高阶光将在下一组合器处辐射出去。这是该设计的下一部分起作用之处:通过有意将Y结设计成在一定程度上非绝热,可以有望得到从这些较高阶模返回到较低阶模(其可以不受阻碍地传播)的一定程度的转换。尽管如此,该有益过程与从较低阶模到较高阶模的转换的有害逆过程竞争。因此,事先并不明显的是,将存在提供在输入激励的不同模态组成上平均的大于50%透射率的设计。
首先,将讨论根据本发明的实施例的具有低组合器损耗的多模Y结的设计。首先确定不同模的截止条件。这是以数值方式完成的,因为成熟的封闭形式1D解决方案不能容易地扩展到实际2D情形。 Mode Solutions(一种商用的模求解器套件)被用于确定波导的模。基于影片模式匹配法(Film Mode Matching Method)的中的全向量FFM求解器被用于检查结果的一致性。
在本示例中,采用在SOI材料平台上在1300nm处的氧化包层220nm硅。仅关注类TE模,但类似的自变量适用于类TM模(两个模组之间存在可忽略的相互作用)。从模仿真获取每种模的截止点,并且因此可以选择要使用的宽度,以使波导支持给定数目的模(图6)。
如图7中可见,用于仿真的Y结设计由三个部分组成,图7解说了Y结的草图,该草图指示对该Y结的性能至关重要的部分。宽度为w1的输入波导(部分1)之后是长度为t的线性锥形(部分2),从而形成具有宽度w2的更宽波导。第三部分在锥形之后立即开始,并终止于划分成两个输出波导。输出波导(也被称为臂)具有与部分1的输入波导完全相同的宽度w1。是两个输出波导之间的角度,并由输出波导的弯曲半径确定。弯曲半径越小,的值越大,反之亦然。
在输入位于图7左侧的部分1中的情况下,参考划分器配置。
对于组合器配置,结以相反方式操作。与使单模Y结的绝热性最大化的单一客观准则形成对比,设计低损耗多模Y结组合器是更加复杂的规程,这是因为各模通过结的相互作用和演化驱动对最佳几何参数的选择。由于扫掠所有几何参数将非常耗时,因此如下进行仿真。对于考虑的所有设计,w2=2w1,并且两个臂的弯曲半径被设置为5μm。随后,锥形长度t被固定,并且输入和输出波导的宽度w1在600nm–1200nm范围中被扫描。随后,优化锥形长度t以实现具有所选宽度的Y结的最大透射率。
第一相关参数是Y结的输入和输出波导宽度w1,针对该宽度比较了由图6的散布图中的不同方案启发的四个值。在600nm的宽度下,前两种模(即,基模和一阶模)被强引导。存在第三种模,但被不太强地引导。在800nm的宽度下,前三种模被良好引导,但现在第四种模(即,具有有效折射率1.46以及包层折射率1.4469的三阶模)被较弱地引导。1000nm宽波导的情况已进一步朝向四个良好引导的模以及具有有效折射率1.4495的几乎未被引导的第五模(即,四阶模)演化。具有1200nm的宽度的最后设计可以更好地引导该四阶模,并且尚不支持五阶模。随后通过传播仿真对这些Y结设计的透射进行仿真。为此,使用FDTD solutions(一种商用的FDTD软件包)。
如果考虑针对具有如表3中给出的组合器配置(仅输入到上臂)的仿真的透射结果,则移动到较宽波导的增益是明显的。与单模完全绝热组合器相比,已经存在发生在1000nm-1200nm波导宽度区域中的从50%到至少53.18%的透射率的小改进。
表3在输入是特定模态激励的情况下具有不同输入和输出波导宽度w1的Y结组合器的透射率。此处的结果对应于仅对上臂的激励的情形。缺失值指示该特定模针对该波导宽度未被引导。
表中的每一列表示针对具有给定输入模的仅对单臂的激励的透射率值。最后一列是针对引导模在所有先前列上的平均透射率。注意,在实际储层中,输入端的模态组成将采用许多不同形式,并且因此该平均透射率被用作推导出设备近似但相关的单个品质因数的直接方式,而不必处理整个RC网络的完全相干多模态仿真。从结果显而易见,由于功率最终在较高阶的引导模中而不是被辐射出去,因此对于较宽的波导和结,损耗显著小于较小的波导和结。如前面提到的,对于考虑的波导宽度,在1000nm-1200nm范围中获取最高透射率。可以认为,最大透射率发生在该区域中是因为它构成了从较高阶模到较低阶模的功率转换对于给定锥形长度t=0.1μm(此处t被临时选择)最高效的宽度。然而,为了针对波导宽度w1和锥形长度t两者都达到最大透射率,要探测锥形长度t对透射率的影响。
表4针对来自上臂的单激励的具有1μm宽的波导和0.1μm长的锥形的Y结组合器的模态分解
在优化锥形长度t之前,首先检查多模Y结相对于特定模的输入激励的输出模态功率组成。关注具有0.1μm锥形的1μm宽的Y结的情形。表4表示组合器配置中从上臂到输入的透射率,而表5示出了划分器配置中从输入到上臂的透射率。首先,观察到确实有若干种模参与通过结引导功率,并且在不同模上的功率分布对于不同的输入配置是非常不同的。还可以看出,正在发生从处于较高阶模的输入到处于较低阶、较好引导模的输出的某种模态转换。其次,结果允许验证设备的互易性(在仿真容差内)。例如,在表4中的组合器配置中从基模到一阶模的透射率为41.94%,而在表5中在划分器配置中从一阶模到基模的透射率为41.90%。
表5具有1μm宽的波导和0.1μm长的锥形的Y结划分器的模态分解
上面已证明,通过采用多模可以获取Y结组合器的透射率的小改进。然而,为了继续提升多模Y结的透射率,特别是在许多可能的输入模态激励上取平均的情况下,通过对几何形状作出恰适改变来进一步调整所设置输入模的演化的绝热性。这是通过更改构成该设计的部分2的锥形来完成的。以0.1μm的锥形长度t来完成对波导宽度的选择的仿真,其中选择w1=1.0μm,该w1被发现处于仿真第一阶段中的最高透射率的区域中。跟踪针对锥形长度t=0.1μm、1μm、2μm和2.5μm的透射率。针对仅有上臂中的激励的情形,相对于锥形长度t在图8中标绘了所得到的多模Y结组合器的透射率值。示出了针对输入到由基本、一阶、二阶和三阶模组成的结的上臂的结果。每条实线对应于所标示的输入模,并且在输出端跨所有输出模的透射率之和被标绘为总透射率。还指示了针对绝热单模Y结的50%的基线透射率。还标绘了每个锥形长度t跨所有输入模的平均透射率,并且这是与表3中的最后一列中所使用的相同品质因数。如所预期的,优化已得到较高的透射率值,如通过比较t=0.1μm情形(其在先前部分中用于确定多模Y结的最佳波导宽度)与较长锥形长度的结果可见。
有两个冲突的趋势在起作用,它们导致在约2.0μm的锥形长度处出现最佳平均透射率。一方面,增加锥形长度增加了绝热性,这降低了引导超模的散射损耗并增加了非引导超模的辐射损耗。(注意,同样对于这种多模结,在完全绝热锥形的限制内,预期50%的平均透射率:针对模0和1的100%透射率,针对模2和3(其将耦合到非引导超模)的0%透射率)。另一方面,如前所示,具有一定程度的非绝热性有益于将某些较高阶模转换成更好引导的较低阶模。
这是允许获取高于50%的平均透射率的机制。当查看例如模2和3的因变于锥形长度的透射率时,没有明显的趋势,从而指示正在发生复杂的模态混合和转换。
尽管仍然可以执行对设计的进一步优化,但是仿真结果已经示出了针对组合器的61%的平均透射率,这比单模结中的标准50%平均损耗要好得多。由于在本示例中这是将被用于储层中的设计,因此执行进一步的仿真,以检查其在划分器配置中操作时的性能,并获取每个输出臂42%的平均透射率。虽然划分器中的损耗高于完全绝热单模情形的50%,但组合器透射率的改进产生了储层功率效率的净增益。
还评估了操作波长可能会对使用这种多模Y结设计的无源储层系统性能产生的影响。图9在目标波长1300nm附近的40nm带宽中,针对各种波长跟踪了从具有基模的输入激励到输出Y结组合器的基模的透射率。此处给出了针对具有被设置为1μm的宽度w1和被设置为2μm的锥形长度t的Y结的结果。可以看出,曲线基本上是平坦的,并且因此可以得出结论,波长的变化不会影响储层的性能。对于其他输入输出模对获取了类似的平坦曲线。
数值仿真关注16节点无源集成光子储层的模型,其中节点以涡流拓扑布置(参见图5)。该架构遵守CMOS Silicon Photonics(CMOS硅光子)平台的平面性约束,同时允许输入信号的充分混合。如提到的,在当前示例的多模Y结设计中,使用跨具有不同模的所有考虑的激励的平均透射率作为品质因数。因此,以与该场景相匹配的方式来设置仿真。具体而言,在需要组合器的所有位置,使用61%的透射率,并且类似地,对于所有划分位置,使用具有42%效率的划分器。另外,当取得跨所有模的平均功率时,储层仿真将不一致,而是将计算输入信号强度的时间演化。储层的任务是解决3比特报头识别任务。任务编码的具体细节在Vandoorne等人在关于神经网络的IEEE汇刊22(2011)1469–1481中已讨论。
评估并比较了针对单模和多模储层的多种数据率的3比特报头识别任务上的储层误差率。输入数据流是NRZ OOK调制信号,其具有24的过采样因子,并且最大考虑的数据率为32Gbps。
使用100mW的总输入功率,并且对于每个数据率,针对输入比特流和输入权重的10种不同的随机初始化获取误差。
图10和11针对输入到节点0的情形,分别示出了针对单模储层(图10)和多模储层(图11)的误差率与储层互连延迟(数据率与2个相邻节点之间的互连延迟的归一化)实验的结果。在从单模储层行进到多模储层时,对于大多数部分没有显著的性能差异,这意味着不存在与移动到多模Y结相关联的性能影响。在这两种情形中,存在低于软判决前向纠错(SD-FEC)限制(对应于2×10-2的BER)的性能区域,这意味着可以通过应用FEC码来达到无误差的性能。然而,为了观察该项工作的实际益处,需要研究能量效率。
已表明,通过用多模版本替代单模储层可以实现能量效率益处。首先,相对于输入信噪比来跟踪3比特报头识别任务上的16节点单模储层和16节点多模储层的误差率,如图12中所标绘的。观察到,多模储层的误差总是低于单模情形的误差。对于较高的信噪比,趋势也倾向于示出较高的发散度。虽然在软判决前向纠错SD-FEC限制(对应于2×10-2的误差率)水平处差异似乎很小,但应当注意,当针对甚至更低的BER进行表征时这种发散趋势将持续存在。
接着,比较单模储层的总损耗与多模储层的总损耗。图13针对输入到节点0的情况指示了针对多模与单模情形的16节点无源储层的每节点功率比。通过将多模储层中每个节点的状态的平均功率除以单模储层中相同节点的功率来获取该功率比,并针对3比特报头识别被示为考虑用于性能评估。由于在两种情形中节点0都被用作输入,因此它的功率未改变,并且因此它的功率比等于1。所有其他节点具有高于水平红线的功率比,该水平红线指示比率等于1的位置。这意味着在多模储层中的所有那些节点处测得更多的功率。观察到,在诸如4、8和12之类的节点(这些节点在光路长度方面也恰好离输入节点最远)中可以获取多达20%的更多功率。
执行另一项实验,以进一步研究在移动到较大储层时组件能量效率的改进如何影响储层中的功率分布。对3比特报头识别任务进行重新仿真,但这次使用6×6(36个节点)涡流储层。如图14中所示,比较针对输入节点0的每节点储层平均功率,现在得到其功率水平现在具有大于30%的改进的节点(例如,参见节点6、12等等)。可以预期,随着移动到更大的网络,增益将进一步增加。为多模储层获取的附加功率提升可以是低于或高于本底噪声的差异,并且因此可能会对现实世界光子储层计算设置的性能和可缩放性具有显著影响。
上述数值仿真已表明,通过用多模版本代替典型的单模组件和波导,可以改进硅光子集成电路储层的总体能量效率。这些FDTD电磁仿真表明,可以设计一种低损耗多模Y结,其具有从500nm开始往上的宽度范围,但优选具有1000nm的宽度,以抑制电路尺寸,同时保持在这种结处模式演化的有利方面。已表明,本示例中的最佳设计可以在最佳绝热水平下用约2.0μm的锥形长度来实现。本示例中的最佳设计产生具有61%的平均透射率的组合器,这与最佳情形单模结组合器的50%平均透射率相对。作为划分器来操作的同一器件提供42%的透射率,低于单模情形的50%,然而,当该器件用于储层中时,组合器透射率的改进弥补了划分器性能的这种下降。可以使用进一步的参数优化来获取更好的损耗改善。上述示例还表明,当使用输入信号的强度进行计算时,基于示例性实施例的Y结组合器/划分器设计的平均透射率特性构造储层产生相同的任务性能,但在能量效率方面有增益。对于至储层的单节点输入,在36节点储层的情形中,在某些节点处的能量可以提高最多达30%。这突出了单个组件设计的小改进如何产生随储层尺寸缩放的益处。这种改进为构建具有比当前可能的节点数目更多的节点数目并且因此可以解决更复杂任务的储层作铺垫。
为了完整起见,给出与用于评估的方法有关的以下细节。为了计算波导的本征模,使用 Mode Solutions(一种商用的模求解器套件)。中基于影片模式匹配法的求解器被用于对结果进行双重检查。对于为Y结的传播仿真和参数优化选择的 varFDTD方法,选取5级精度的自动非均匀网格划分策略,并应用共形变体1网格精化。中心波长被设置为1300nm,并使用围绕220nm高硅波导结构的具有反射率1.4469的氧化硅包层,该高硅波导结构具有根据Lumerical材料数据库中的Palik模型的材料参数。结构的几何形状是用Luceda Photo Design Environment来设计的,被导出为GDSII格式,并且随后导入选择varFDTD方法是因为对于具有全向平面内传播的器件(诸如MMI)而言它实现具有接近3D-FDTD仿真的精度的快速仿真(2D FDTD仿真速度)。
基于Caphe软件和scikit-learn库使用定制的时域电路仿真脚本进行机器学习。除非另有说明,否则使用4×4(16个节点)储层架构来生成状态。选择此数目的节点是因为该设计既在使用多项目晶片运行来生产时成本高效,又在数个任务上具有良好性能。在所有情形中,储层之间的互连长度转换为62.5ps的传播时间,这与当前实验可用芯片的电流生成相匹配。
一旦获取状态并使用恰适的光检测器模型在考虑各种噪声贡献和带宽限制的情况下进行了变换,就可以使用scikit-learn库对读出进行训练。对于训练,将10,000个随机选择的比特馈送到储层中,并将所得到的状态用于以5倍交叉验证进行训练,以优化模型超参数,并使用另外10,000个比特进行测试。
使用正则化岭回归算法来训练线性读出。测试是在交叉验证产生的最佳情形下进行的。所有报告的误差率均与测试数据相关。在10,000比特用于测试的情况下,报告的误差率约为90%的置信度水平。
Claims (13)
1.一种无源光子储层计算系统(1),所述系统(1)包括基于光学多模波导的结构,所述基于光学多模波导的结构包括多个离散节点(12)以及在各节点(12)之间的多个无源多模波导互连件(13)以供在各节点(12)之间传播至少一个光子信号(11),其中每个离散节点(12)被适配用于在连接到的无源多模波导互连件(13)上无源地中继所述至少一个光子信号(11),
其中,所述基于光学多模波导的结构包括至少一个多模结(33),所述至少一个多模结(33)被配置用于使用锥形部分(15)连接至少三个多模波导互连件(13),其中所述锥形部分(15)不是完全绝热的。
2.如权利要求1所述的无源光子储层计算系统(1),其特征在于,所述节点(12)被配置用于经由多模结(33)来执行所述无源光子储层计算系统(1)中的多次划分和/或组合,所述多模结(13)被配置用于使用非完全绝热的锥形部分连接至少三个多模波导互连件(13)。
3.如前述权利要求中任一项所述的无源光子储层计算系统(1),其特征在于,所述多模结是用于连接三个多模波导互连件(13)的多模Y结。
4.如权利要求3所述的无源光子储层计算系统(1),其特征在于,所述波导具有至少500nm的宽度,有利地至少1000nm的宽度。
5.如前述权利要求中任一项所述的无源光子储层计算系统(1),其特征在于,所述锥形长度在2μm至2.5μm之间。
6.如前述权利要求中任一项所述的无源光子储层计算系统(1),其特征在于,所述基于光学波导的结构被配置用于在光学域中对所得辐射信号执行加权,并且其中所述系统(1)被配置用于使用多模Y结来组合经加权信号,所述多模Y结被配置用于使用锥形部分(15)连接三个波导互连件(13),其中所述锥形部分(15)不是完全绝热的。
7.如权利要求6所述的无源光子储层计算系统(1),其特征在于,所述系统(1)包括用于对所得辐射信号进行加权的加权元件。
8.如权利要求6或7中任一项所述的无源光子储层计算系统(1),其特征在于,所述经加权信号在大面积光电二极管中被组合,所述大面积光电二极管被配置用于对所述经加权所得辐射信号执行非线性操作。
9.如权利要求6或7中任一项所述的无源光子储层计算系统(1),其特征在于,所述系统包括用于对所得辐射信号进行加权的反向偏置的pn结。
10.如权利要求9所述的无源光子储层计算系统(1),其特征在于,执行非线性操作包括:在对所述经加权所得辐射信号进行求和之前取所述经加权所得辐射信号的幂。
11.如权利要求9至10中任一项所述的无源光子储层计算系统(1),其特征在于,所述系统(1)包括训练模块,所述训练模块用于确定所述系统中不同通道的功率以及所述系统中不同通道之间的相位差。
12.如权利要求10所述的无源光子储层计算系统(1),其特征在于,所述训练模块被配置用于获取训练数据,其中加权系数是通过相继进行以下操作来选择的:将一个加权系数选择为等于1(任意单位)、同时将所有其它加权系数设置为0,以及将两个加权系数选择为非零、同时将所有其它加权系数设置为0。
13.如前述权利要求中任一项所述的无源光子储层计算系统(1),其特征在于,所述系统包括无源硅光子储层。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EP17173169.8 | 2017-05-29 | ||
EP17173169 | 2017-05-29 | ||
PCT/EP2018/063856 WO2018219838A1 (en) | 2017-05-29 | 2018-05-26 | Multimode reservoir |
Publications (1)
Publication Number | Publication Date |
---|---|
CN110709866A true CN110709866A (zh) | 2020-01-17 |
Family
ID=59070404
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201880036058.8A Pending CN110892422A (zh) | 2017-05-29 | 2018-05-26 | 对光子储层计算系统的训练 |
CN201880035939.8A Pending CN110709866A (zh) | 2017-05-29 | 2018-05-26 | 多模储层 |
Family Applications Before (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201880036058.8A Pending CN110892422A (zh) | 2017-05-29 | 2018-05-26 | 对光子储层计算系统的训练 |
Country Status (5)
Country | Link |
---|---|
US (2) | US11650479B2 (zh) |
EP (2) | EP3631694B1 (zh) |
JP (1) | JP7115691B2 (zh) |
CN (2) | CN110892422A (zh) |
WO (2) | WO2018219838A1 (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113343814A (zh) * | 2021-05-31 | 2021-09-03 | 太原理工大学 | 一种基于单节点光子储备池计算的手写数字图像识别方法 |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109214543B (zh) * | 2017-06-30 | 2021-03-30 | 华为技术有限公司 | 数据处理方法及装置 |
CN110247299B (zh) * | 2019-05-22 | 2021-02-23 | 上海大学 | 一种并行双光反馈半导体激光器储备池计算系统 |
US11681908B2 (en) | 2019-09-13 | 2023-06-20 | International Business Machines Corporation | Quantum state classifier using reservoir computing |
WO2023285636A1 (en) | 2021-07-15 | 2023-01-19 | Universiteit Gent | Photonic integrated signal processing device |
EP4304110A1 (en) | 2022-07-07 | 2024-01-10 | Universiteit Gent | Photonic machine learning based signal recovery in self-coherent detectors |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5180911A (en) * | 1991-09-03 | 1993-01-19 | Harbor Branch Oceanographic Institution, Inc. | Parameter measurement systems and methods having a neural network comprising parameter output means |
WO2002101435A1 (en) * | 2001-06-11 | 2002-12-19 | Avanex Uk Limited | Arrayed waveguide grating with reduced chromatic dispersion |
US20030137706A1 (en) * | 2000-02-07 | 2003-07-24 | P.S. Rmanujam | Method and system for recording of information on a holographic medium |
CN102203692A (zh) * | 2008-10-31 | 2011-09-28 | 惠普开发有限公司 | 优先化的光学仲裁系统和方法 |
EP2821942A2 (en) * | 2013-07-05 | 2015-01-07 | Universiteit Gent | Reservoir computing using passive optical systems |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2015006494A1 (en) * | 2013-07-09 | 2015-01-15 | Board Of Trustees Of The Leland Stanford Junior University | Computation using a network of optical parametric oscillators |
US9354039B2 (en) * | 2014-06-06 | 2016-05-31 | Massachusetts Institute Of Technology | Methods, systems, and apparatus for programmable quantum photonic processing |
US10395168B2 (en) * | 2015-10-26 | 2019-08-27 | International Business Machines Corporation | Tunable optical neuromorphic network |
WO2017210550A1 (en) * | 2016-06-02 | 2017-12-07 | Massachusetts Institute Of Technology | Apparatus and methods for optical neural network |
US10031287B1 (en) * | 2017-02-02 | 2018-07-24 | International Business Machines Corporation | Waveguide architecture for photonic neural component with multiplexed optical signals on inter-node waveguides |
-
2018
- 2018-05-26 WO PCT/EP2018/063856 patent/WO2018219838A1/en active Application Filing
- 2018-05-26 JP JP2019565370A patent/JP7115691B2/ja active Active
- 2018-05-26 EP EP18725556.7A patent/EP3631694B1/en active Active
- 2018-05-26 EP EP18725557.5A patent/EP3631695A1/en active Pending
- 2018-05-26 US US16/617,265 patent/US11650479B2/en active Active
- 2018-05-26 US US16/617,187 patent/US11681201B2/en active Active
- 2018-05-26 CN CN201880036058.8A patent/CN110892422A/zh active Pending
- 2018-05-26 CN CN201880035939.8A patent/CN110709866A/zh active Pending
- 2018-05-26 WO PCT/EP2018/063857 patent/WO2018219839A1/en active Application Filing
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5180911A (en) * | 1991-09-03 | 1993-01-19 | Harbor Branch Oceanographic Institution, Inc. | Parameter measurement systems and methods having a neural network comprising parameter output means |
US20030137706A1 (en) * | 2000-02-07 | 2003-07-24 | P.S. Rmanujam | Method and system for recording of information on a holographic medium |
WO2002101435A1 (en) * | 2001-06-11 | 2002-12-19 | Avanex Uk Limited | Arrayed waveguide grating with reduced chromatic dispersion |
CN102203692A (zh) * | 2008-10-31 | 2011-09-28 | 惠普开发有限公司 | 优先化的光学仲裁系统和方法 |
EP2821942A2 (en) * | 2013-07-05 | 2015-01-07 | Universiteit Gent | Reservoir computing using passive optical systems |
US20150009548A1 (en) * | 2013-07-05 | 2015-01-08 | Universiteit Gent | Reservoir Computing Using Passive Optical Systems |
Non-Patent Citations (3)
Title |
---|
GUY VAN DER SANDE ET AL.: "Advances in photonic reservoir computing" * |
HONG ZHANG ET AL.: "Integrated photonic reservoir computing based on hierarchical time-multiplexing structure" * |
YANPING XU ET AL.: "Recent Developments in Micro-Structured Fiber Optic Sensors" * |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113343814A (zh) * | 2021-05-31 | 2021-09-03 | 太原理工大学 | 一种基于单节点光子储备池计算的手写数字图像识别方法 |
CN113343814B (zh) * | 2021-05-31 | 2022-06-14 | 太原理工大学 | 一种基于单节点光子储备池计算的手写数字图像识别方法 |
Also Published As
Publication number | Publication date |
---|---|
WO2018219838A1 (en) | 2018-12-06 |
JP2020524835A (ja) | 2020-08-20 |
JP7115691B2 (ja) | 2022-08-09 |
EP3631695A1 (en) | 2020-04-08 |
US20200249543A1 (en) | 2020-08-06 |
CN110892422A (zh) | 2020-03-17 |
EP3631694B1 (en) | 2023-11-29 |
US11681201B2 (en) | 2023-06-20 |
EP3631694A1 (en) | 2020-04-08 |
US20200410370A1 (en) | 2020-12-31 |
WO2018219839A1 (en) | 2018-12-06 |
US11650479B2 (en) | 2023-05-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110709866A (zh) | 多模储层 | |
JP7362727B2 (ja) | フォトニック処理デバイス及び方法 | |
Pérez et al. | Principles, fundamentals, and applications of programmable integrated photonics | |
US9477136B2 (en) | Reservoir computing using passive optical systems | |
Katumba et al. | Low-loss photonic reservoir computing with multimode photonic integrated circuits | |
CN113853563B (zh) | 用于高斯玻色子采样的装置和方法 | |
CN113496281A (zh) | 光电计算系统 | |
Ma et al. | On-chip interaction-free measurements via the quantum Zeno effect | |
Zhou et al. | Tunable on-chip mode converter enabled by inverse design | |
Bœuf et al. | Silicon photonics research and manufacturing using a 300-mm wafer platform | |
Cohen | Synchronization and prediction of chaotic dynamics on networks of optoelectronic oscillators | |
JP2022549544A (ja) | 導波路デバイス | |
Teng et al. | A high-stability all-optical nonlinear activator for optical computing | |
Richard et al. | N× N coupler uniformity in a CWDM passive star home network based on multimode fiber: A time-effective calculation method | |
Adcock | Generating optical graph states | |
Bazzanella | Microring Based Neuromorphic Photonics | |
Wang | Silicon Photonics: Overview, Building Block Modeling, Chip Design and Its Driving Integrated Circuits Co-design | |
Wu et al. | Programmable integrated photonic coherent matrix: Principle, configuring, and applications | |
Nandigam | Automated Design of Photonic Links | |
Sturm et al. | Scalable Coherent Optical Crossbar Architecture using PCM for AI Acceleration | |
Rossetto | Programmable Integrated Photonic Circuits: automatic testing and calibration techniques | |
Filipovich | Training Deep Neural Networks and Solving Differential Equations using Neuromorphic Photonics | |
Rizzo | Highly Parallel Silicon Photonic Links with Integrated Kerr Frequency Combs | |
You et al. | Inverse Design Ultra-Compact Dual-Mode Interferometer Based on Topology Optimization | |
Ou et al. | Hypermultiplexed Integrated Tensor Optical Processor |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
WD01 | Invention patent application deemed withdrawn after publication |
Application publication date: 20200117 |
|
WD01 | Invention patent application deemed withdrawn after publication |