CN111683304A - 在光波导和/或光芯片上实现的全光衍射神经网络及系统 - Google Patents
在光波导和/或光芯片上实现的全光衍射神经网络及系统 Download PDFInfo
- Publication number
- CN111683304A CN111683304A CN202010402683.9A CN202010402683A CN111683304A CN 111683304 A CN111683304 A CN 111683304A CN 202010402683 A CN202010402683 A CN 202010402683A CN 111683304 A CN111683304 A CN 111683304A
- Authority
- CN
- China
- Prior art keywords
- optical
- layer
- waveguide
- network
- input
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 230000003287 optical effect Effects 0.000 title claims abstract description 155
- 238000013528 artificial neural network Methods 0.000 title claims abstract description 69
- 230000005540 biological transmission Effects 0.000 claims abstract description 86
- 238000004364 calculation method Methods 0.000 claims abstract description 18
- 239000011159 matrix material Substances 0.000 claims description 12
- 238000010521 absorption reaction Methods 0.000 claims description 3
- 239000000463 material Substances 0.000 claims description 3
- 210000002569 neuron Anatomy 0.000 abstract description 12
- 239000010410 layer Substances 0.000 description 323
- 230000006870 function Effects 0.000 description 18
- 238000010586 diagram Methods 0.000 description 16
- 238000006243 chemical reaction Methods 0.000 description 10
- 238000000034 method Methods 0.000 description 8
- 230000008901 benefit Effects 0.000 description 6
- 238000012545 processing Methods 0.000 description 6
- 238000009826 distribution Methods 0.000 description 4
- 238000005265 energy consumption Methods 0.000 description 3
- 238000003384 imaging method Methods 0.000 description 3
- 230000008569 process Effects 0.000 description 3
- 230000009466 transformation Effects 0.000 description 3
- 238000013473 artificial intelligence Methods 0.000 description 2
- 230000001427 coherent effect Effects 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000001914 filtration Methods 0.000 description 2
- 239000002356 single layer Substances 0.000 description 2
- 238000009825 accumulation Methods 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 210000003169 central nervous system Anatomy 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000005253 cladding Methods 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000012937 correction Methods 0.000 description 1
- 238000005520 cutting process Methods 0.000 description 1
- 238000007405 data analysis Methods 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000005315 distribution function Methods 0.000 description 1
- 230000004927 fusion Effects 0.000 description 1
- 238000011478 gradient descent method Methods 0.000 description 1
- 230000010365 information processing Effects 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 210000005036 nerve Anatomy 0.000 description 1
- 238000012634 optical imaging Methods 0.000 description 1
- 230000005693 optoelectronics Effects 0.000 description 1
- 230000008447 perception Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 238000000844 transformation Methods 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04Q—SELECTING
- H04Q11/00—Selecting arrangements for multiplex systems
- H04Q11/0001—Selecting arrangements for multiplex systems using optical switching
- H04Q11/0062—Network aspects
-
- G—PHYSICS
- G02—OPTICS
- G02B—OPTICAL ELEMENTS, SYSTEMS OR APPARATUS
- G02B6/00—Light guides; Structural details of arrangements comprising light guides and other optical elements, e.g. couplings
- G02B6/10—Light guides; Structural details of arrangements comprising light guides and other optical elements, e.g. couplings of the optical waveguide type
- G02B6/12—Light guides; Structural details of arrangements comprising light guides and other optical elements, e.g. couplings of the optical waveguide type of the integrated circuit kind
-
- G—PHYSICS
- G02—OPTICS
- G02B—OPTICAL ELEMENTS, SYSTEMS OR APPARATUS
- G02B6/00—Light guides; Structural details of arrangements comprising light guides and other optical elements, e.g. couplings
- G02B6/24—Coupling light guides
- G02B6/26—Optical coupling means
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04Q—SELECTING
- H04Q11/00—Selecting arrangements for multiplex systems
- H04Q11/0001—Selecting arrangements for multiplex systems using optical switching
- H04Q11/0062—Network aspects
- H04Q11/0071—Provisions for the electrical-optical layer interface
Landscapes
- Physics & Mathematics (AREA)
- Engineering & Computer Science (AREA)
- Computer Networks & Wireless Communication (AREA)
- General Physics & Mathematics (AREA)
- Optics & Photonics (AREA)
- Microelectronics & Electronic Packaging (AREA)
- Optical Modulation, Optical Deflection, Nonlinear Optics, Optical Demodulation, Optical Logic Elements (AREA)
Abstract
为解决光电混合系统计算速率与损耗仍然受限于电时钟的速率和欧姆损耗,以及现有利用分立光学元件实现全光神经网络系统成本高、尺寸大、扩展性有限、级联时误差会被放大的技术问题,本发明提供了一种在光波导和/或光芯片上实现的全光衍射神经网络及系统。本发明通过光波导和/或芯片上的衍射自由传输区实现全光连接,在相同尺寸下,可实现更多的波导神经元连接,因而可有效解决神经元连接数少,系统扩展弱的问题;而更多的神经元连接容错率会更好,所以本发明识别精度更高。
Description
背景技术
随着大数据、云计算、物联网的发展,具有感知、学习与决策的人工智能计算机的开发与推进,未来数据的体量将会爆发式增长。基于冯诺依曼结构的现代计算机在计算、感知、通信、学习以及决策等方面具有广泛应用,然而相比于其对应的生物结构——中枢神经系统来说功耗大、算力弱。未来在大数据、云计算、物联网、人工智能领域,低功耗、快速而又有效的分析数据成为人们越来越关注的重点。例如在特定领域的图像实时处理、从手机上传的语音信息在云端在线识别响应等方面的应用会越来越多。着力于冯诺依曼计算结构在人工神经网络方面存在的问题,一部分学者将更多的工作主要聚焦在开发定制化的电学结构芯片(例如ASIC和FPGA)来解决人工神经网络的计算速度、高功耗问题。另一部分学者将目光转向了光学结构进行研究。这主要是因为光路结构与电路结构相比其功耗小,计算速度快。然而光电混合系统通常需要频繁的光电转换,使计算速率与功耗仍然受限于电时钟的速率和欧姆损耗。
为解决光电混合系统存在的问题,在计算领域的一部分学者将目光转向了全光神经网络。目前来看,全光神经网络有潜在替代基于微电-光电混合方案的神经网络。全光神经网络优势在于其线性转换以及一定程度的非线性转换可以以光速实现,且光网络功耗很小,探测速度可以高至100GHz。众所周知,通过光学棱镜实现的傅里叶变换以及部分矩阵的光学变换不需要任何的能耗。应用棱镜的光学傅里叶变换进行计算滤波常见在光学成像方面。成像系统需要诸多的分立光学元件来实现相应的矩阵变换。通过该类系统完成的计算、变换、滤波速度快,几乎没有能量损耗。然而该类系统有一定缺陷,例如成本高,尺寸大,稳定性差等;MIT在文章“Deep Learning with Coherent Nanophotonic Circuits”中提出了一种全光神经网络方案,该方案优势在于光网络集成在光芯片内,尺寸小。然而该方案神经元连接数少,系统扩展性有限,级联时误差会被放大。
发明内容
为解决光电混合系统计算速率与损耗仍然受限于电时钟的速率和欧姆损耗,以及现有利用分立光学元件实现全光神经网络系统成本高、尺寸大、扩展性有限、级联时误差会被放大的技术问题,本发明提供了一种在光波导和/或光芯片上实现的全光衍射神经网络及系统。
本发明的技术方案是:
在光波导和/或光芯片上实现的全光衍射神经网络,其特殊之处在于:包括输入层、网络层和输出层;
输入层用于将未载有信息的光分束、将待识别信息由电信号转换成光信号并对该光信号编码后加载至网络层;
网络层用于对接收到的光信号进行光信息全连接交换和权重调整;所述光信息全连接交换通过光衍射自由传输区实现;
输出层用于将网络层识别后的光信号进行合并和分发。
进一步地,所述输入层包括依次连接的输入层输入波导、光分路器、输入层阵列波导、输入层阵列幅相调制器和输入层阵列输出波导;所述输入层输入波导为单个输入波导或者阵列输入波导。
进一步地,所述光分路器有多个,且并行设置。
进一步地,所述光分路器为多级级联的1×2MMI、Y分路器、1×2定向耦合器、N×MMMI和光衍射自由传输区中的一种或多种结构级联构成。
进一步地,所述网络层由单个子网络层构成,或者由N个子网络层级联构成,前一个子网络层的输出连接下一个子网络层的输入;N≥2;
每个子网络层包括通过阵列波导相连接的网络层光衍射自由传输区和网络层阵列幅相调制器;
网络层光衍射自由传输区用于实现全光网络信息交换,包括依次连接的衍射区阵列输入波导、自由传输区域和衍射区输出阵列波导,阵列输入波导与自由传输区域的连接处形成阵列波导光栅结构;
网络层阵列幅相调制器用于实现信息交换后光信息的权重调整。
进一步地,至少一个子网络层中的网络层光衍射自由传输区由多个子自由传输区构成,这多个子自由传输区通过阵列波导实现串行级联、并行设置或者串并混合设置。
进一步地,第n个子网络层中的网络层光衍射自由传输区的部分输出端连接第n+m个子网络层中的网络层光衍射自由传输区的部分输入端;1≤n≤N;1≤m≤N-n。
进一步地,输出层包括依次连接的输出层阵列输入波导、输出层光衍射自由传输区和输出层阵列输出波导。
进一步地,输出层光衍射自由传输区有多个,且并行设置。
进一步地,所述输入层阵列幅相调制器通过有源调制器件或无源结构实现;所述网络层阵列幅相调制器通过有源调制器件或无源结构实现。
进一步地,所述有源调制器件为电光调制器、热光调制器、磁光调制器和/或电吸收调制器;所述无源结构在实现幅相调制时,实现方式有改变波导结构的长度、宽度、厚度和/或材料折射率,在实现幅值调制时,实现方式有偏移波导和/或截断波导。
进一步地,输入层与网络层之间的阵列波导中相邻两根波导之间具有长度差,各子网络层之间的阵列波导中相邻两根波导之间具有长度差;网络层与输出层之间的阵列波导中相邻两根波导之间具有长度差;所述长度差大于等于0,具体根据光衍射自由传输区的矩阵表达式并结合计算迭代收敛确定。
本发明同时提供了一种在光波导和/或光芯片上实现的全光衍射神经网络系统,其特殊之处在于:由上述的全光衍射神经网络任意组合构成。
本发明的优点:
1.现有的全光神经网络,由于基于MZI等结构的器件神经网络连接数相对较小,所以扩展性有限;并且现有的全光神经网络需要频繁的光电转换,误差积累会被放大。而本发明提出一种在光芯片上实现的全光衍射神经网络的方案,通过光波导和/或芯片上的衍射自由传输区实现全光连接,在相同尺寸下,可实现更多的波导神经元连接,因而可有效解决神经元连接数少,系统扩展弱的问题;而更多的神经元连接容错率会更好,所以本发明识别精度更高。
下表1是以图11所示的全光衍射神经网络为例,通过梯度下降法计算得出不同神经元数(对应本发明的阵列波导数)对识别率的影响。从表1可以得知,提高神经元数目是提高识别率与容错率的关键因素,本发明中的全光衍射神经网络是提高神经元数的有效方法,本发明能够有效提高识别率和容错率。
表1
2.在应用方面,基于本发明的无源光芯片,其光学神经元结构扩展性强,易于做大规模的光神经网络结构,且在器件能耗和计算速度方面更有优势;而基于本发明的有源芯片,其神经网络结构具有可编程功能,能实现自适应神经元纠错与识别目标自定义功能。3.本发明中输入层与网络层之间的阵列波导、各子网络层之间的阵列波导,以及网络层与输出层之间阵列波导中相邻两波导具有长度差,使得光衍射传输具有方向性,从而可以控制输出通道端口,提高了传输的可控性。
附图说明
图1是全光衍射神经网络结构示意图一。
图2是全光衍射神经网络输入层的结构示意图。
图3A方框内的光分路结构可以是MMI分路结构,或定向耦合器结构,或Y分支器结构;
图3B方框内的光分路结构可以是MMI分路结构或自由传输区结构;
图3C是Y分路器结构示意图。
图3D是定向耦合器结构示意图。
图3E是多模自映像干涉器结构示意图。
图4是全光衍射神经网络网络层结构示意图。
图5A是光神经网络的光衍射自由传输区结构示意图。
图5B是光神经网络光衍射自由传输区网络结构示意图。
图5C是光神经网络光衍射自由传输区的矩阵表达式;
图5D是光神经网络子隐藏层的矩阵表达式。
图6是全光衍射神经网络输出层的结构示意图。
图7是全光衍射神经网络的结构示意图二。
图8是全光衍射神经网络的结构示意图三。
图9是全光衍射神经网络的结构示意图四。
图10是全光衍射神经网络的结构示意图五。
图11是光神经网络结构一。
图12是光神经网络结构二。
附图标记:
1-输入层;11-输入层阵列输入波导;12-光分路器;13-输入层阵列波导;14-输入层阵列幅相调制器;15-输入层阵列输出波导;
2-网络层;21-子网络层;211-网络层光衍射自由传输区;212-网络层阵列幅相调制器;213-网络层阵列输入波导;214-网络层阵列输出波导;215-衍射区输出阵列波导;216-自由传输区域;217-衍射区阵列输入波导;218-阵列波导光栅结构;
3-输出层;31-输出层阵列输入波导;32-输出层光衍射自由传输区;33-输出层阵列输出波导。
具体实施方式
以下结合附图对本发明作进一步说明。
本发明的全光衍射神经网络在光波导和/或光芯片上实现,图1是本发明全光衍射神经网络其中一种基础网络结构,图1中示出了其关键组成部分,包括输入层1、网络层2(在有些光计算结构里也称为隐藏层)和输出层3。
如图1、2所示,输入层1包括依次连接的输入层阵列输入波导11或单个输入波导、光分路器12、输入层阵列波导13、输入层阵列幅相调制器14和输入层阵列输出波导15;多路光从输入层1的输入层阵列输入波导11端进入,经过光分路器12分光后将未载有信息的光耦合到输入层阵列波导13上,接着通过输入层阵列波导13将光传输到输入层阵列幅相调制器14,进入待调制状态,最后通过输入层阵列幅相调制器14将待识别信息由电信号加载(或称转换)成光信号,输出至输入层阵列输出波导15端。其中,输入层阵列幅相调制器14可通过调幅来加载光信号,也可通过调相来加载光信号,或同时进行幅相调制。图1中输入层阵列幅相调制器14间的省略号代表重复并行排列的幅相调制器。
如图1、4所示,输入层1的输入层阵列输出波导15连通网络层2(或称隐藏层)的输入端。网络层2由单个子网络层21构成,或由N个子网络层21级联而成,N≥2;每个子网络层21包括通过阵列波导相连接的网络层光衍射自由传输区211和网络层阵列幅相调制器212,前一层子网络层21的输出连接下一层子网络层21的输入。光信号在N个级联的子网络层21依次通过网络层光衍射自由传输区211和网络层阵列幅相调制器212,分别完成光信息交换和光信号的权重调整。在网络层2的信息光完成最后一层子网络层21的识别后,识别信号会从最后一层子网络层21的网络层阵列输出波导214端输出。图1中网络层阵列幅相调制器212间的省略号代表重复并行排列的幅相调制器,子网络层输出波导与输入波导间的省略号代表重复串行排列的子网络层结构。
如图1、6所示,光从网络层2的网络层阵列输出波导214端输出后传输进入到输出层3的输入端。网络层2的网络层阵列输出波导214端的每根波导会一一对应的连接输出层3的输出层阵列输入波导31。光从输出层3的输入端进入后,传输至输出层光衍射自由传输区32的输入端口并发生衍射完成最后一次信息交换,接着交换的光信息通过输出层光衍射自由传输区32的阵列输出端口收集光信号,最后传输至输出层3的输出层阵列输出波导33端,接着利用光探测器(是本发明之外的结构,非本发明的一部分)收集光信号并完成光电转换。
通过上述描述可以看出,在整个全光衍射神经网络进行信息计算识别时是不发生光电转换的,整个识别过程只在初始加载信号和最终输出信号会进行光电转换,这样系统将避免频繁的光电转换,大大提升计算效率。
下面依次详细描述输入层1、网络层2和输出层3的功能。
如图2所示,输入层1的一个功能是将输入层阵列输入波导11的光信号进行分发传输到输入层阵列幅相调制器14上。有很多种类型的波导单元可实现光分路器12的功能。例如通过阵列1×2分路器的串行级联可完成1分N路的输出,如图3A所示。同样的,通过2×2的分路器可将N路输入层阵列输入波导11的N路信号分成M路输出。另外可能的结构,例如通过级联的MMI(多模自映像干涉器)结构将N路输入光转为M路输出光,以及通过光衍射自由传输区将N路输入光分为M路输出光,如图3B所示。输入层1的第二个功能是将光分路器12输出的光通过输入层阵列幅相调制器14完成待识别光信号编码。编码后,在输入层1输出端的待识别光信号将会在网络层2中进行识别处理。
如图4所示,当网络层2由N个子网络层21级联构成时,这N个子网络层21依次记为第1子网络层、…、第N子网络层;单个子网络层21包括通过阵列波导相连的网络层光衍射自由传输区211和网络层阵列幅相调制器212。每一个子网络层21会通过网络层光衍射自由传输区211完成光信号的全连接和交换。网络层光衍射自由传输区211的光学结构示意图如图5A中所示,包括依次连接的衍射区阵列输入波导217、自由传输区域216和衍射区输出阵列波导215,衍射区阵列输入波导217与自由传输区域216的连接处形成阵列波导光栅结构218,光从衍射区阵列输入波导217进入并传输到阵列波导光栅结构218时会发生衍射,衍射光在自由传输区域216传输后全连接输出到衍射区输出阵列波导215,这样便完成了光信息的全连接交换;输入层1最终输出的信号传输至网络层2的输入端口后,变成了网络层2的输入部分。网络层的输入波导我们称为网络层阵列输入波导213。在网络层2,光输入网络层阵列输入波导213耦合至网络层光衍射自由传输区211的衍射区阵列输入波导217,而在网络层光衍射自由传输区211的输出部分由一组衍射区输出阵列波导215来接收输入端衍射过来的光。网络层光衍射自由传输区211输入端的光信号通过衍射传输并耦合到自由衍射区输出部分的每个衍射区输出阵列波导215。光从网络层光衍射自由传输区211的输入端通过衍射全部连接输出到网络层光衍射自由传输区211的输出端口,我们称为光信号在网络层光衍射自由传输区211的全连接和交换。网络层光衍射自由传输区211的全连接和交换的网络示意图如图5B所示,阵列波导光栅结构和自由传输区域为光信号从每个输入端口到每个输出端口提供一个全光连接和交换,每个波导输入都会通过衍射完成一个全光连接,将信号输出至全部的波导输出端。网络层光衍射自由传输区211的全光连接和交换可通过图5C的矩阵矢量运算(矢量矩阵相乘)来表示。图5C中的式子中,An表示衍射区阵列输入波导217中第N个输入波导端口的复数值,该值包含有第N个输入波导端口的幅值和相位信息;Bnm表示从衍射区阵列输入波导217中第N个输入波导端口衍射传输到衍射区输出阵列波导215中第M个输出波导端口的复数值,该值包含第N个输入波导端口衍射传输到衍射区第M个输出波导端口的幅值和相位信息;Cn表示第衍射区输出阵列波导215中第N个输出波导端的光信号复数值,该复数值包含有第N个输出波导的幅值信息和相位信息。在神经网络的网络层,神经网络的传输函数由网络层光衍射自由传输区211和输入端的子波干涉决定,而子波复数值是由前一层网络(即输入层1或前一层的子网络层21)的幅相调制器决定的;每一个子网络层21的另一个功能是通过网络层阵列幅相调制器212提供信号的权重。每个在网络层光衍射自由传输区211处理过的光信号接着被网络层阵列幅相调制器212进行调制。我们称网络层阵列幅相调制器212的信号处理为权重。最后,在网络层阵列幅相调制器212处理完信号后,最后一层子网络层的网络层阵列幅相调制器212输出端的网络层阵列输出波导214变为整个网络层2的输出端;单个子网络层的整体结构提供一个矩阵乘加和的功能,矩阵计算公式如图5D所示,Mn表示网络层阵列幅相调制器212中第N个子网络层的网络层幅相调制器的复数值,包含第N个子网络层的网络层幅相调制器的幅值和相位调制信息;A′n表示子网络层的输出,同样也是下一子网络层的输入。
如图6所示,输出层3提供一个在网络层2识别信号的合并和分发功能。有多种波导结构单元可以实现这一功能。例如并行排列的阵列2×1MMI结构可将N个输入波导的N路信号分配成N/2路信号。其他可能的分布结构,例如将N路阵列波导的N路信号分配成M路信号,或者通过MMI耦合器,亦或者通过并行的光衍射自由传输区。在输出层3的输出波导的信号通过上述结构分配完信号后,随即传输到芯片外并通过光电探测器把光信号转换为电信号。
对于输入层1中的光分路器12,有四种结构或者这四种结构的任意组合可以实现,这四种结构分别为Y分路器、定向耦合器、MMI结构、以及光衍射自由传输区,相应的示意图如图3C、3D、3E、5A所示。在这些结构中,Y分路器,1×2MMI结构,1×2定向耦合器可将在1路波导上的1路输入信号分为2路输出,产生一个一分二的分路功能。一组串行级联的1×2分路器可将1个输入波导的1路光信号分到N路输出波导上。对于光衍射自由传输区结构的光分路器,在N路输入波导上的N路信号可以通过光衍射自由传输区的输入端衍射并在光衍射自由传输区传输扩散,接着在光衍射自由传输区的输出端的M个阵列波导上进行接收,这一传输过程提供一个N×M的光信号分配。
对于输入层1中的输入层阵列幅相调制器14和网络层2中的网络层阵列幅相调制器212结构相同,但是作用不同;输入层阵列幅相调制器14通过调幅调相表达待识别信息,网络层阵列幅相调制器212通过调幅调相表达光信号权重调整。输入层阵列幅相调制器14和网络层阵列幅相调制器212,均可通过有源或无源的结构实现。在无源结构的幅相调制上,相位的调制可通过改变阵列波导的宽度、厚度、长度和/或材料折射率来完成,幅值的调制可通过波导的偏移、截断等方式完成,或者上述任意方法的组合可完成幅相调制。例如,网络层2的一部分网络层阵列输出波导214可以根据计算参数将波导的宽度和长度按照某种程度进行变化,这样便可完成无源的相位调制,实现权重的一个表达。同样的,在一部分输入层1的输入层阵列输出波导15上,选择性的截断波导可以实现一组输入图像的二元编码功能。在有源调制器件方面,幅相信息的调制可以通过电光效应、热光效应、磁光效应或电吸收的方式实现。例如,在波导周围分布的热调制器可以同时提供幅值和相位的调制。
对于网络层2中的网络层光衍射自由传输区211和输出层3中的输出层光衍射自由传输区32,其结构可以为矩形或弧形。光衍射自由传输区的输入和输出两边端口以及衍射区域提供一个全光网络的信息传输和交换功能。输入输出端口的宽度,以及衍射区域的尺寸和形貌决定了网络传输的网络矩阵参数。
图1中,输入层1、网络层2和输出层3是串行级联的,输入层1只有一个级联的光分路区域,每个单独的子网络层21只有一个光衍射区域。图1的网络结构可以理解为,待分类识别信息从进入光芯片到识别完成后输出至光芯片外的整个过程,是通过待识别信息的输入(输入层1),计算与识别(网络层2)、输出结果的分类(输出层3)逐层计算处理完成的。输入层1待识别信息的输入,网络层2的计算识别方法和输出层3的结果输出是没有进行分类输入、计算和输出的。
图7为本发明全光衍射神经网络的第二种基础结构,该结构中网络层2和输出层3的网络结构与图1是一致的。也就是说针对识别信号,网络层2的计算识别方法和输出层3的结果输出是不分类的。与图1相比,图7的区别在于,输入层1的光分路器12是多层并行分布的,也可以看成是输入层1由多个并行设置的子输入层构成。图7中并行的光分路器可以理解为,不同类型或不同种类的待识别信息同时从输入层的输入端口进入,并从输出端口输出进入到网络层2处理。
图8为本发明全光衍射神经网络的第三种基础结构,该结构中输入层1和网络层2的网络结构与图1相比是相同的。也就是说,在网络结构中输入层1的待识别信息输入与网络层2的计算识别方法是没有进行分类输入和分类计算的。与图1相比,图8的区别在于,输出层3的输出层光衍射自由传输区32是一个多层并联结构,输出波导数可根据需求进行相应的增加、减少或不变。这一并联结构可以理解为识别结果是多种类型的,不同种类或不同类型的输出结果同时从全光神经衍射网络芯片的输出端口输出,并进行光电转换。
图9为本发明全光衍射神经网络的第四种基础结构,该结构中输入层1和输出层3的网络结构与图1相比是相同的。也就是说,输入层1的信息输入与输出层3的识别结果输出是没有进行分类的。与图1相比,图9的区别在于,网络层2的网络层光衍射自由传输区211是多层并行结构。并行的网络层光衍射自由传输区可以理解为单层网络层通过子衍射结构具有了多种信息处理的功能,或可以理解为单层识别结果为多信息识别或多处理方式融合的结果。
图10为本发明全光衍射神经网络的第五种基础结构,该结构中输入层1和输出层3的网络结构与图9相比是相同的,区别在于,图10中网络层2的第n个子网络层中的网络层光衍射自由传输区的部分输出端连接第n+m个子网络层中的网络层光衍射自由传输区的部分输入端;1≤n≤N;1≤m≤N-n;N为网络层2中子网络层的总层数。这可以理解为一部分信号不需要在某一个或者某几个子网络层中进行具体的计算,而直接进入到下一子网络层或者下下一个子网络层甚至最后一个子网络层进行处理。
除了上述图1、图7-10所示的五个基础网络结构,更为复杂功能的网络可以通过上述五种基础网络结构的任意组合实现。
为了更好的理解本发明,以下给出两个示例。
示例1:
如图11所示,本示例所提供的全光衍射神经网络具有图像分类识别的功能,网络结构包括一层输入层1、由两层子网络层21构成的网络层2和一层输出层3。这一光网络结构是基于无源集成光波导实现的。本示例的输入层1是由一个输入层输入波导11、一个光分路器12(本示例由光衍射自由传输区实现)、一组输入层阵列幅相调制器14(本示例为无源幅值调制器,通过截断波导实现)和一组输入层阵列输出波导15组成的。相干光从输入层1的输入端口进入到全光衍射神经网络中,并且通过光衍射自由传输区将1路光分为128路光输出至光衍射自由传输区的输出端。紧接着根据自定义的编码方式将128路光通过无源幅值调制器将相应的幅值信息通过光载入到输入层阵列输出波导15内。紧接着,输入层1部分的输出端成为网络层2部分的输入端。在本示例中,需要注意的是在不考虑无源幅值调制器带来的相位误差的情况下,网络层2与输入层1之间连接的阵列波导的相位误差为0,也就是说在相同工艺条件下,连接输入层1与网络层2的阵列波导长度、宽度和厚度是相同的;本示例的网络层2中,每个子网络层21都由一组网络层阵列输入波导213、一个网络层光衍射自由传输区211、一组网络层阵列幅相调制器212和一组网络层阵列输出波导214组成。在网络层2,载有图像信息的光通过网络层阵列输入波导213端输入后,信息的交换和识别分别通过网络层光衍射自由传输区211和网络层阵列幅相调制器212完成。在本示例中,128通道的信息可以瞬间在网络层光衍射自由传输区211交换完成,接着在网络层阵列幅相调制器212部分通过改变阵列波导的宽度和长度产生相位差达到相位调制的要求。在完成网络层2的识别后,载有图像识别结果的光在输出层3的输出层光衍射自由传输区内32完成最后一次信息交换与分配后将从输出层3的输出层阵列输出波导33输出。本示例的无源全光衍射神经网络示例的优势是光计算网络的能量消耗几乎为0,并且大规模光神经元的光神经网络易于通过本方案实现。
示例2:
如图12所示,本示例所提供的全光衍射神经网络具有元音分类识别的功能,网络结构包括一层输入层1、由四层子网络层级联构成的网络层2和一层输出层3。这一光网络是基于有源集成光波导实现的。在本示例中,连接输入层1与网络层2、各子网络层的阵列波导的长度差有两种,为0μm和11.2μm。其中,输入层1与第1子网络层之间的阵列波导中相邻两根波导的长度差、第1子网络层和第2子网络层之间的阵列波导中相邻两根波导的长度差、第3子网络层和第4子网络层之间的阵列波导中相邻两根波导的长度差、第4子网络层和输出层3之间的阵列波导中相邻两根波导之间的长度差均为11.2μm。第2子网络层和第3子网络层之间的阵列波导中相邻两根波导之间的长度差为0μm;波导之间的长度差可以通过图5C的矩阵表达式并结合计算迭代收敛即可确定。该网络结构的输入层1是由输入波导、6级串行级联的光分路器12(MMI结构)、1组64路的输入层阵列幅相调制器14(本示例的输入层阵列幅相调制器14是通过热光调制器阵列实现的)、以及1组64通道的输入层阵列输出波导15组成。1路光从6级串行级联的光分路器12经过后,分成了等幅值的64路光,接着光从光分路器12输出连接到一组64路的输入层阵列幅相调制器14上,电元音信号是通过这一组64路输入层阵列幅相调制器14将电信号转为载有元音信息的光信号,并输出至64通道的输入层阵列输出波导15。从输入层1输出的光紧接着进入到网络层2的输入端。每一单个子网络层21由一组64路网络层阵列输入波导213、一个网络层光衍射自由传输区211,一组64路的网络层阵列幅相调制器212和一组64路的网络层阵列输出波导214组成。携带有元音信息的光通过四层子网络层的网络层光衍射自由传输区211和网络层阵列幅相调制器212分别完成了信息交换和信息权重计算,在第4子网络层21的输出端输出后,识别后的光信息进入到了输出层3。光信息在输出层3的输出层光衍射自由传输区内32完成最后一次信息交换与分配后输出至输出层3的输出层阵列输出波导33。最后,识别后的元音光信息通过光电转换器转换成电信号。相比于示例1,本示例的优势在于上位机控制器可以实时的基于在线结果进行分析反馈。上位机控制器可以根据测试结果,调整网络层的网络层阵列幅相调制器212来提高识别率。除此之外,上位机控制器可以根据待识别种类的需求,通过改变网络层阵列幅相调制器212的调制信息,使全光衍射神经网络芯片具有识别内容定制化的功能。
Claims (13)
1.在光波导和/或光芯片上实现的全光衍射神经网络,其特征在于:包括输入层(1)、网络层(2)和输出层(3);
输入层(1)用于将未载有信息的光分束、将待识别信息由电信号转换成光信号并对该光信号编码后加载至网络层(2);
网络层(2)用于对接收到的光信号进行光信息全连接交换和权重调整;所述光信息全连接交换通过光衍射自由传输区实现;
输出层(3)用于将网络层(2)识别后的光信号进行合并和分发。
2.根据权利要求1所述的在光波导和/或光芯片上实现的全光衍射神经网络,其特征在于:所述输入层(1)包括依次连接的输入层输入波导、光分路器(12)、输入层阵列波导(13)、输入层阵列幅相调制器(14)和输入层阵列输出波导(15);所述输入层输入波导为单个输入波导或者阵列输入波导。
3.根据权利要求2所述的在光波导和/或光芯片上实现的全光衍射神经网络,其特征在于:所述光分路器(12)有多个,且并行设置。
4.根据权利要求2所述的在光波导和/或光芯片上实现的全光衍射神经网络,其特征在于:所述光分路器(12)为多级级联的1×2MMI、Y分路器、1×2定向耦合器、N×M MMI和光衍射自由传输区中的一种或多种结构级联构成。
5.根据权利要求1所述的在光波导和/或光芯片上实现的全光衍射神经网络,其特征在于:所述网络层(2)由单个子网络层(21)构成,或者由N个子网络层(21)级联构成,前一个子网络层(21)的输出连接下一个子网络层(21)的输入;N≥2;
每个子网络层(21)包括通过阵列波导相连接的网络层光衍射自由传输区(211)和网络层阵列幅相调制器(212);
网络层光衍射自由传输区(211)用于实现全光网络信息交换,包括依次连接的衍射区阵列输入波导(217)、自由传输区域(216)和衍射区输出阵列波导(215),阵列输入波导(217)与自由传输区域(216)的连接处形成阵列波导光栅结构(218);
网络层阵列幅相调制器(212)用于实现信息交换后光信息的权重调整。
6.根据权利要求5所述的在光波导和/或光芯片上实现的全光衍射神经网络,其特征在于:至少一个子网络层(21)中的网络层光衍射自由传输区(211)由多个子自由传输区构成,这多个子自由传输区通过阵列波导实现串行级联、并行设置或者串并混合设置。
7.根据权利要求6所述的在光波导和/或光芯片上实现的全光衍射神经网络,其特征在于:第n个子网络层中的网络层光衍射自由传输区的部分输出端连接第n+m个子网络层中的网络层光衍射自由传输区的部分输入端;1≤n≤N;1≤m≤N-n。
8.根据权利要求1、2、3、4、5、6或7所述的全光衍射神经网络,其特征在于:输出层(3)包括依次连接的输出层阵列输入波导(31)、输出层光衍射自由传输区(32)和输出层阵列输出波导(33)。
9.根据权利要求8所述的全光衍射神经网络,其特征在于:输出层光衍射自由传输区(32)有多个,且并行设置。
10.根据权利要求9所述的全光衍射神经网络,其特征在于:所述输入层阵列幅相调制器(14)通过有源调制器件或无源结构实现;所述网络层阵列幅相调制器(212)通过有源调制器件或无源结构实现。
11.根据权利要求10所述的全光衍射神经网络,其特征在于:所述有源调制器件为电光调制器、热光调制器、磁光调制器和/或电吸收调制器;所述无源结构在实现幅相调制时,实现方式有改变波导结构的长度、宽度、厚度和/或材料折射率,在实现幅值调制时,实现方式有偏移波导和/或截断波导。
12.根据权利要求5、6或7所述的全光衍射神经网络,其特征在于:输入层(1)与网络层(2)之间的阵列波导中相邻两根波导之间具有长度差,各子网络层之间的阵列波导中相邻两根波导之间具有长度差;网络层(2)与输出层(3)之间的阵列波导中相邻两根波导之间具有长度差;所述长度差大于等于0,具体根据光衍射自由传输区的矩阵表达式并结合计算迭代收敛确定。
13.在光波导和/或光芯片上实现的全光衍射神经网络系统,其特征在于:由权利要求1-12任一所述的全光衍射神经网络任意组合构成。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010402683.9A CN111683304B (zh) | 2020-05-13 | 2020-05-13 | 在光波导和/或光芯片上实现的全光衍射神经网络及系统 |
PCT/CN2021/087526 WO2021227767A1 (zh) | 2020-05-13 | 2021-04-15 | 在光波导和/或光芯片上实现的全光衍射神经网络及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010402683.9A CN111683304B (zh) | 2020-05-13 | 2020-05-13 | 在光波导和/或光芯片上实现的全光衍射神经网络及系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111683304A true CN111683304A (zh) | 2020-09-18 |
CN111683304B CN111683304B (zh) | 2021-12-14 |
Family
ID=72433739
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010402683.9A Active CN111683304B (zh) | 2020-05-13 | 2020-05-13 | 在光波导和/或光芯片上实现的全光衍射神经网络及系统 |
Country Status (2)
Country | Link |
---|---|
CN (1) | CN111683304B (zh) |
WO (1) | WO2021227767A1 (zh) |
Cited By (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112817891A (zh) * | 2021-02-04 | 2021-05-18 | 联合微电子中心有限责任公司 | 可编程的光芯片、终端 |
WO2021227767A1 (zh) * | 2020-05-13 | 2021-11-18 | 中国科学院西安光学精密机械研究所 | 在光波导和/或光芯片上实现的全光衍射神经网络及系统 |
CN113721321A (zh) * | 2021-09-14 | 2021-11-30 | 希烽光电科技(南京)有限公司 | 一种光子计算芯片 |
CN113839715A (zh) * | 2021-09-18 | 2021-12-24 | 苏州浪潮智能科技有限公司 | 一种光学神经网络及芯片 |
CN114037069A (zh) * | 2021-11-18 | 2022-02-11 | 中国科学院长春光学精密机械与物理研究所 | 基于衍射光学的神经网络计算单元 |
CN115018041A (zh) * | 2022-04-19 | 2022-09-06 | 华中科技大学 | 一种可重构非易失性的集成三维光学衍射神经网络芯片 |
CN115508958A (zh) * | 2022-10-08 | 2022-12-23 | 深圳中科天鹰科技有限公司 | 一种基于光学神经网络的光子芯片 |
WO2023061456A1 (zh) * | 2021-10-13 | 2023-04-20 | 清华大学 | 用于消息散列算法的消息扩展的光电集成电路 |
CN116107037A (zh) * | 2023-04-13 | 2023-05-12 | 中国科学院长春光学精密机械与物理研究所 | 密集波导阵列的片上光学器件光计算网络结构 |
US20230400627A1 (en) * | 2022-06-09 | 2023-12-14 | Taiwan Semiconductor Manufacturing Co., Ltd. | Photonic device, system and method of making same |
CN118368023A (zh) * | 2024-05-09 | 2024-07-19 | 重庆邮电大学 | 基于波分复用的全光可重构硅基光子神经网络芯片 |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116859510B (zh) * | 2023-08-31 | 2024-01-09 | 之江实验室 | 波导阵列结构及其光场调控方法 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109376855A (zh) * | 2018-12-14 | 2019-02-22 | 中国科学院计算技术研究所 | 一种光神经元结构和包含该结构的神经网络处理系统 |
CN109784486A (zh) * | 2018-12-26 | 2019-05-21 | 中国科学院计算技术研究所 | 一种光学神经网络处理器及其训练方法 |
CN110291433A (zh) * | 2017-02-02 | 2019-09-27 | 国际商业机器公司 | 用于光子神经元件的波导结构 |
CN110334804A (zh) * | 2019-06-20 | 2019-10-15 | 清华大学 | 基于空间部分相干光的全光深度衍射神经网络系统及方法 |
CN110929864A (zh) * | 2019-12-05 | 2020-03-27 | 北京超放信息技术有限公司 | 光学衍射神经网络在线训练方法及系统 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111683304B (zh) * | 2020-05-13 | 2021-12-14 | 中国科学院西安光学精密机械研究所 | 在光波导和/或光芯片上实现的全光衍射神经网络及系统 |
-
2020
- 2020-05-13 CN CN202010402683.9A patent/CN111683304B/zh active Active
-
2021
- 2021-04-15 WO PCT/CN2021/087526 patent/WO2021227767A1/zh active Application Filing
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110291433A (zh) * | 2017-02-02 | 2019-09-27 | 国际商业机器公司 | 用于光子神经元件的波导结构 |
CN109376855A (zh) * | 2018-12-14 | 2019-02-22 | 中国科学院计算技术研究所 | 一种光神经元结构和包含该结构的神经网络处理系统 |
CN109784486A (zh) * | 2018-12-26 | 2019-05-21 | 中国科学院计算技术研究所 | 一种光学神经网络处理器及其训练方法 |
CN110334804A (zh) * | 2019-06-20 | 2019-10-15 | 清华大学 | 基于空间部分相干光的全光深度衍射神经网络系统及方法 |
CN110929864A (zh) * | 2019-12-05 | 2020-03-27 | 北京超放信息技术有限公司 | 光学衍射神经网络在线训练方法及系统 |
Non-Patent Citations (1)
Title |
---|
YICHEN SHEN: "Deep Learning with Coherent Nanophotonic Circuits", 《NATURE PHOTONICS》 * |
Cited By (19)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2021227767A1 (zh) * | 2020-05-13 | 2021-11-18 | 中国科学院西安光学精密机械研究所 | 在光波导和/或光芯片上实现的全光衍射神经网络及系统 |
CN112817891A (zh) * | 2021-02-04 | 2021-05-18 | 联合微电子中心有限责任公司 | 可编程的光芯片、终端 |
CN112817891B (zh) * | 2021-02-04 | 2022-10-18 | 联合微电子中心有限责任公司 | 可编程的光芯片、终端 |
CN113721321A (zh) * | 2021-09-14 | 2021-11-30 | 希烽光电科技(南京)有限公司 | 一种光子计算芯片 |
CN113721321B (zh) * | 2021-09-14 | 2024-04-16 | 希烽光电科技(南京)有限公司 | 一种光子计算芯片 |
CN113839715A (zh) * | 2021-09-18 | 2021-12-24 | 苏州浪潮智能科技有限公司 | 一种光学神经网络及芯片 |
CN113839715B (zh) * | 2021-09-18 | 2023-08-04 | 苏州浪潮智能科技有限公司 | 一种光学神经网络及芯片 |
WO2023061456A1 (zh) * | 2021-10-13 | 2023-04-20 | 清华大学 | 用于消息散列算法的消息扩展的光电集成电路 |
CN114037069A (zh) * | 2021-11-18 | 2022-02-11 | 中国科学院长春光学精密机械与物理研究所 | 基于衍射光学的神经网络计算单元 |
CN114037069B (zh) * | 2021-11-18 | 2024-04-05 | 中国科学院长春光学精密机械与物理研究所 | 基于衍射光学的神经网络计算单元 |
CN115018041A (zh) * | 2022-04-19 | 2022-09-06 | 华中科技大学 | 一种可重构非易失性的集成三维光学衍射神经网络芯片 |
CN115018041B (zh) * | 2022-04-19 | 2024-09-06 | 华中科技大学 | 一种可重构非易失性的集成三维光学衍射神经网络芯片 |
US20230400627A1 (en) * | 2022-06-09 | 2023-12-14 | Taiwan Semiconductor Manufacturing Co., Ltd. | Photonic device, system and method of making same |
US11899240B2 (en) * | 2022-06-09 | 2024-02-13 | Taiwan Semiconductor Manufacturing Co., Ltd. | Photonic device, system and method of making same |
CN115508958A (zh) * | 2022-10-08 | 2022-12-23 | 深圳中科天鹰科技有限公司 | 一种基于光学神经网络的光子芯片 |
CN115508958B (zh) * | 2022-10-08 | 2024-05-24 | 深圳中科天鹰科技有限公司 | 一种基于光学神经网络的光子芯片 |
CN116107037A (zh) * | 2023-04-13 | 2023-05-12 | 中国科学院长春光学精密机械与物理研究所 | 密集波导阵列的片上光学器件光计算网络结构 |
CN116107037B (zh) * | 2023-04-13 | 2023-07-07 | 中国科学院长春光学精密机械与物理研究所 | 密集波导阵列的片上光学器件光计算网络结构 |
CN118368023A (zh) * | 2024-05-09 | 2024-07-19 | 重庆邮电大学 | 基于波分复用的全光可重构硅基光子神经网络芯片 |
Also Published As
Publication number | Publication date |
---|---|
CN111683304B (zh) | 2021-12-14 |
WO2021227767A1 (zh) | 2021-11-18 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111683304B (zh) | 在光波导和/或光芯片上实现的全光衍射神经网络及系统 | |
CN116348886B (zh) | 相干光子计算架构 | |
Bai et al. | Photonic multiplexing techniques for neuromorphic computing | |
CN109639359A (zh) | 基于微环谐振器的光子神经网络卷积层芯片 | |
CN110908428B (zh) | 一种高效实现大规模矩阵运算的并行光计算系统 | |
CN113961035A (zh) | 面向深度学习的高效能可重构全光神经网络计算芯片架构 | |
CN112101540B (zh) | 光学神经网络芯片及其计算方法 | |
Totovic et al. | WDM equipped universal linear optics for programmable neuromorphic photonic processors | |
US20220012582A1 (en) | Neuromorphic photonics with coherent linear neurons | |
CN114503000B (zh) | 光学神经元单元及其网络 | |
CN115905792A (zh) | 一种用于光学实数矩阵计算的马赫曾德尔干涉仪网络 | |
US20230351167A1 (en) | Frequency multiplexed photonic neural networks | |
CN114706161A (zh) | 一种基于频率编码的片上集成光学矩阵矢量处理器 | |
US20240013041A1 (en) | Single ended eam with electrical combining | |
CN112232487B (zh) | 光学神经网络芯片及其计算方法 | |
CN113222135B (zh) | 一种基于多模干涉效应的片上光神经网络结构 | |
Zhang et al. | Time-stretch optical neural network with time-division multiplexing | |
Pan et al. | Complex-valued Optical Neural Networks Enabled by Multimode Interferometers and Phase Shifters | |
CN118368023A (zh) | 基于波分复用的全光可重构硅基光子神经网络芯片 | |
US20230306253A1 (en) | 3D Photonic Neural Network | |
Liao et al. | All-optical reconfigurable optical neural network chip based on wavelength division multiplexing | |
KR20230122539A (ko) | 광학 인공신경망 시스템 | |
Nakajima | Parallel neuromorphic computing on space and wavelength division multiplexed photonic processor | |
Kazanskiy et al. | Optical Computing: Key Problems, Achievements, and Perspectives | |
WO2023218442A2 (en) | Fiber-based artificial neuron unit |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |