CN115085854B - 一种支持存算一体及波长-模式混合复用的光学矩阵乘法器 - Google Patents

一种支持存算一体及波长-模式混合复用的光学矩阵乘法器 Download PDF

Info

Publication number
CN115085854B
CN115085854B CN202210663150.5A CN202210663150A CN115085854B CN 115085854 B CN115085854 B CN 115085854B CN 202210663150 A CN202210663150 A CN 202210663150A CN 115085854 B CN115085854 B CN 115085854B
Authority
CN
China
Prior art keywords
optical
waveguide
mode
wavelength
multiplexing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202210663150.5A
Other languages
English (en)
Other versions
CN115085854A (zh
Inventor
郭鹏星
周牛杰
孙巍
侯维刚
郭磊
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Chongqing University of Post and Telecommunications
Original Assignee
Chongqing University of Post and Telecommunications
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Chongqing University of Post and Telecommunications filed Critical Chongqing University of Post and Telecommunications
Priority to CN202210663150.5A priority Critical patent/CN115085854B/zh
Publication of CN115085854A publication Critical patent/CN115085854A/zh
Application granted granted Critical
Publication of CN115085854B publication Critical patent/CN115085854B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04JMULTIPLEX COMMUNICATION
    • H04J14/00Optical multiplex systems
    • H04J14/02Wavelength-division multiplex systems
    • H04J14/0201Add-and-drop multiplexing
    • H04J14/0202Arrangements therefor
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04BTRANSMISSION
    • H04B10/00Transmission systems employing electromagnetic waves other than radio-waves, e.g. infrared, visible or ultraviolet light, or employing corpuscular radiation, e.g. quantum communication
    • H04B10/50Transmitters
    • H04B10/501Structural aspects
    • H04B10/503Laser transmitters
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04JMULTIPLEX COMMUNICATION
    • H04J14/00Optical multiplex systems
    • H04J14/04Mode multiplex systems
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • General Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Electromagnetism (AREA)
  • Evolutionary Computation (AREA)
  • Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Optics & Photonics (AREA)
  • Optical Integrated Circuits (AREA)
  • Optical Modulation, Optical Deflection, Nonlinear Optics, Optical Demodulation, Optical Logic Elements (AREA)

Abstract

本发明请求保护一种支持存算一体及波长‑模式混合复用的光学矩阵乘法器结构,来解决神经网络加速器中矩阵运算的功耗较大及运算吞吐量受限的问题。首先,采用非易失相变材料GST与无源MR组成存算一体光学点积计算引擎。其中微环谐振器用于实现对不同波长光信号的引导,权重存储在集成与光波导上的GST中,使得光在传输的过程中完成数据的读取与计算,从而提高计算速率、降低能耗。此外,搭建支持波长和模式混合复用的矩阵乘法器,通过将不同波长和模式的数据作为独立的信号载体同时输入到矩阵中进行乘加运算,从而提高并行计算规模。本发明有望实现大规模、低功耗的光学矩阵乘法器,以满足数据量爆发式增长的驱动下对高性能计算硬件的需求。

Description

一种支持存算一体及波长-模式混合复用的光学矩阵乘法器
技术领域
本发明属于光信号处理领域,具体涉及一种支持存算一体及波长-模式混合复用的光学矩阵乘法器。
背景技术
由于信息技术的飞速发展,各种各样数字应用场景早已出现在人们的生活之中,如自动驾驶、语音助手等,这些应用的出现,在给人类带来便利的同时,也给各种数据处理硬件带来不少的压力,特别是数据运算中对于高性能矩阵乘加运算(MultiplyAccumulate,MAC)的需求。例如,在神经网络中,无论是训练阶段还是推理阶段,都会进行大量且密集的矩阵乘加运算,通常MAC操作的运算量占据整个神经网络运算量的80%以上。为了减少因大量MAC操作而产生数据传输和计算开销,同时为了突破冯诺依曼架构的限制,研究人员提出了各种优秀的以矩阵乘法为主的神经网络加速器结构。然而,受电学性质的限制和摩尔定律的滞后性,基于电学的矩阵乘法器难以进一步提高功耗效率和计算速度。为了突破电子瓶颈,基于光学矩阵乘法运算的光子神经网络加速器成为可以提供高性能、低功耗的优秀解决方案。
目前,各种基于马赫曾德干涉仪(Mach-Zehnder interferometer,MZI)和微环谐振器(Micro-ring Resonator,MR)的光子矩阵乘法器已被提出。大部分在执行光学矩阵乘法操作时都需要将每个乘法的权重值从内存中读取出来,之后映射到MR或MZI单元的偏置电压上实现对光器件状态的控制,从而产生大量的能耗。但在大多数以矩阵乘法操作为主的神经网络中,训练阶段一旦完成,在推理阶段中就不需要频繁更新已经训练好的权重矩阵,因此,将权值存储在非易失性相变材料(Phase Change Material,PCM)中并直接进行计算,实现光学存算一体功能可以大大减少数据传输所带来的效率降低和能量损失。
此外,大规模并行计算是实现高性能光学矩阵乘法器的关键。然而,目前的光学矩阵乘法器通常采用波长复用(Wavelength Division Multiplexing,WDM)的方式来实现并行计算,增加并行计算的规模需要增加相应的波长数,对应的激光器数量以及控制复杂度也将增加,使得该方案的可扩展性受到了波长数量的限制。
发明内容
本发明旨在解决以矩阵乘法运算为主的神经网络加速器中功耗较大及运算吞吐量受限的问题,提出了一种支持存算一体及波长-模式混合复用的光学矩阵乘法器结构。通过结合光的多维性,设计出支持光学多维资源复用的矩阵乘法器结构,来进一步提升光学矩阵乘法器的并行计算能力;首先,采用非易失相变材料Ge2Sb2Te5(GST)与无源的MR组成具有存算一体功能的光学点积计算引擎,通过将权重存储在非易失的GST中,使得光在波导传输的过程中完成数据的读取与计算,实现传输、权重读取和计算的融合,从而提高计算速率、降低能耗;此外,以基于GST和MR的点积计算引擎为基本单元搭建支持波长和模式混合复用的矩阵乘法器,通过将不同波长和模式的数据作为独立的信号载体同时输入到矩阵中进行乘加运算,从而提高矩阵乘法器的并行计算规模。本发明有望实现集成化的大规模、低功耗的光学矩阵乘法器,以满足数据量爆发式增长的驱动下,神经网络发展对高性能矩阵乘法器的需求。
为了实现上述目的,本发明的技术方案如下:
一种支持存算一体及波长-模式混合复用的光学矩阵乘法器结构,所述光学矩阵乘法器中包括依次相连接的输入模块、运算模块以及输出模块;
所述输入模块包括激光器阵列、波分复用器和第一分光器,所述激光器阵列用于产生多个不同波长的连续光信号,所述波分复用器用于对多个不同波长的连续光信号复用,所述第一分光器用于对所述波分复用器复用后的光信号分光;
所述运算模块包括多个第二分光器和多层光学运算层,所述每个第二分光器用于对第一分光器分光后的光信号再次进行分光,每个第二分光器对应一个光学运算层,每一光学运算层包含一个点积计算单元阵列,每一列的点积计算单元工作在不同的波长上,用于对第二分光器分光后的相应束光信号的运算;其中,每个点积计算单元包括第一MR、第二MR和一段含GST材料的波导;
所述输出模块包括多个模式转换器组成的模式复用器,所述模式复用器用于复用不同光学运算层运算后的光信号。
进一步的,所述输入模块中,激光器阵列包括多个连续波激光产生器,不同激光产生器产生同一模式下的不同波长的连续光信号,经过调制后分别输入到对应的多个波导中,将多个波导中的调制信号通过波分复用器复用到同一波导中,将同一波导的复用信号通过第一分光器产生多路分光信号。
进一步的,所述运算模块中,所述每个第二分光器对第一分光器分光后的其中一束光信号进行分光,在每一光学运算层中,通过每一列的点积计算单元的第一MR分别对第二分光器的每一束光信号进行波长选择,用GST材料对选择出的特定波长的光信号进行加权,每一个加权后的光信号通过第二MR,被耦合到同一波导之中。
进一步的,所述点积计算单元包括上、中和下排列的三个直波导以及两个环形波导;第一环形波导置于第一直波导与第二直波导之间构成第一MR,第二环形波导置于第二直波导与第三直波导之间构成第二MR;在第二直波导上包含一段GST材料的波导;其中,所述第一环形波导和所述第二环形波导具有相同的物理参数。
进一步的,利用第一MR进行波长选择的过程包括所述第一直波导用于传输具有多个波长的光信号,当第一环形波导与其中某个波长的光信号满足谐振条件时,该某个波长的光信号被耦合到第一环形波导中。
进一步的,所述输出模块中,通过楔形波导连接不同的模式转换器,从而形成多路模式复用器;该多路模式复用器将运算模块中的每一光学运算层的输出进行不同的模式转换,并复用到一个波导上,进行混合复用输出。
进一步的,每个模式转换器均包括两个并排波导,其中,并排的第一波导支持第一模式,并排的第K+1波导支持第一模式到第K+1模式,K表示当前模式转换器在多路模式复用器所处的顺序,K≥1。
本发明的优点及有益效果如下:
本发明提出了一种支持存算一体及波长-模式混合复用的光学矩阵乘法器结构,首先,通过利用波长-模式混合复用技术实现了高计算吞吐量,在不增加激光器数量的情况下,有效提高了吞吐量,同时;其次,通过集成非易失相变材料GST和MR,可以实现具有存算一体且零功耗的光学乘加运算。与传统的基于PCM-MR的光学矩阵乘法器结构不同,本发明无需将相变材料集成到MR中,避免了不同权重配置下MR之间的干扰,从而提高了推理精度和可扩展性。因此,本发明有望实现集成化的大规模、低功耗的光学矩阵乘法器,以应对智能医疗和自动驾驶等数据密集型神经网络应用带来的挑战。
附图说明
图1为本发明实施例的一种支持存算一体及波长-模式混合复用的光学矩阵乘法器结构示意图;
图2为本发明实施例的点积计算引擎及MR的传输曲线示意图,图2(a)表示点积计算引擎的结构示意图,图2(b)表示MR的传输曲线示意图;
图3为本发明实施例的点积计算引擎中的基于GST的忆阻器结构截面及其透射率仿真示意图,图3(a)表示点积计算引擎中的基于GST的忆阻器结构截面,图3(b)表示点积计算引擎中的基于GST的忆阻器结构的透射率仿真示意图;
图4为本发明实施例的光学矩阵乘法器中的模式转换器和模式复用器示意图,图4(a)表示光学矩阵乘法器中的模式转换器示意图,图4(b)表示光学矩阵乘法器中的模式复用器示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
图1为本发明所提的一种支持存算一体及波长-模式混合复用的光学矩阵乘法器结构示意图。如图1所示,所述光学矩阵乘法器中包括依次相连接的输入模块、运算模块以及输出模块;
所述输入模块包括激光器阵列、波分复用器和第一分光器;
在本发明实施例中,所述激光器阵列的大小为N,也即包含着由N个连续波激光产生器组成的激光器阵列,其中不同的激光器分别产生同一种模式(基模)的不同波长的连续光信号,因此,所述激光器阵列可以产生N不同波长的连续光信号,依次表示为λ12,…,λN;产生的N个不同波长的连续光信号经过由MR组成的调制器后分别输入到N个波导之中,表示N×1的输入向量;与所述激光器阵列的大小对应,所述波分复用器可以对N个不同波长的连续光信号进行波分复用,所以被调制后的N个光信号经过一个N×1的波长复用器将N种不同波长的光信号复用到同一波导中,实现波分复用;此外,通过一个1×P的第一分光器将波分复用后的光信号分为P路光信号,每一路光信号连接到运算模块中不同的光学运算层,使光信号可以在每一光学运算层中进行不同权重的M×N矩阵加权,这比传统波分复用模式的并行计算方法提升了P倍的吞吐量。
可以理解的是,这里的M、N和P的大小可以人为设置,满足正整数的要求即可,本领域技术人员可以根据实际情况确定对应的大小,本发明对此不作具体的限制。
在本发明实施例中,所述运算模块包括P个第二分光器和P层光学运算层,相当于每个光学运算层对应一个第二分光器,且每个第二分光器对应第一分光器P路信号中的每一路分光信号,就可以让第一分光器的每一路光信号连接到运算模块中不同的光学运算层,而第二分光器的大小为1×M,此时由输入模块产生的波分复用后光信号会被第二分光器分成M路信号,这样就可以使第一分光器的每一路光信号在每一光学运算层中对应进行不同权重的M×N矩阵加权,而每一光学运算层包含一个M行、N列大小的点积计算引擎阵列,其中的每一个点积计算引擎可以作为一个点积计算单元用于存储计算,每一列的点积计算引擎工作在不同的波长上,用于对第二分光器分光后的相应束光信号的运算;因此P层运算单元可以同时执行M×N×P规模的矩阵乘法运算;此光学矩阵乘法器支持N种波长和P种模式的光学矩阵计算,通过将不同波长和模式的数据作为独立的信号载体同时在波导中传输,提升了运算吞吐量。
所述M×N光学运算层由M×N个基于非易失相变材料GST和MR的点积计算引擎组成,其所述点积计算引擎由上、中和下三个直波导以及两个环形波导组成;第二直波导上包含一段非易失相变材料GST,可由一段入射激光脉冲改变其晶化程度,从而该变该波导的透射率实现权重存储,最终,光信号经过该段波导后实现光信号的加权操作;第一环形波导置于第一直波导与第二直波导之间,共同构成第一MR,用于对第一直波导中的WDM光信号进行波长选择,到达第二直波导后进行加权;第二环形波导置于第二直波导与第三直波导之间,共同构成第二MR,用于将加权后的单波光信号耦合至下直波导,最后实现WDM光信号输出。
基于上述分析,可以得出,所述点积计算单元中,每个点积计算单元包括第一MR、第二MR和一段含GST材料的波导;所述第一MR主要用于对M个波导中的WDM光信号进行波长选择,所述含GST材料的波导主要用于对选择出的特定波长的光信号进行加权,实现对光信号加权操作;所述第二MR主要是为了让每一个单波长光信号被加权后会通过,由此被耦合到同一波导之中,实现光学加法运算;最终,实现M×N的光学矩阵乘加运算;其中,第一MR、第二MR以及GST材料都是无源的,因此对应的点乘运算过程可以不消耗任何能量;本发明直接在第二直波导上集成GST材料,而无需将GST材料集成到第一MR或第二MR中,可以避免不同权重配置下MR之间的干扰,从而提高了推理精度和可扩展性。
图2为本发明所提光学矩阵乘法器中的点积计算引擎及上下话路型MR仿真示意图。如图2(a)所示,其点积计算引擎由上、中和下三个直波导以及两个环形波导组成,第一环形波导置于第一直波导与第二直波导之间构成第一MR,第二环形波导置于第二直波导与第三直波导之间构成第二MR;在第二直波导上包含一段GST材料的波导;其中,所述第一环形波导和所述第二环形波导具有相同的物理参数。
其中,第一直波导用于传输N个波长的WDM光信号,当第一环型波导与其中某波长的WDM光信号满足谐振条件时,该波长的光信号会耦合致第一环形波导中,如图2(b)所示,其中实线代表上下话路型MR下输出端口(drop端)的透射率,虚线代表上输出端口(through端)的透射率,当第一MR的输入光信号的波长为第一MR的谐振波长时,光信号几乎会全部耦合至第一环形波导中,直至从drop端输出,而不满足谐振波长条件的光信号会从through端输出。基于此原理可利用第一MR实现对WDM信号的波长选择,同样的,第二MR亦可利用相同原理对加权过后的光信号耦合至第三波导中
其中,微环谐振器的谐振条件为:
其中,m取任意正整数,λ为信号波长,neff为波导的有效折射率,R为MR的半径。
如上所述的使用非易失相变材料GST进行权重存储的具体原理为:GST是一种相变材料,其在晶态和非晶态之间有很高的对比度;当GST在晶态时,其具有强吸收效应,在波导中的光全部被吸收到GST里,此时波导的透射率为0;当GST处于非晶态时,其对光信号吸收较弱,光几乎能够全部从波导中输出,此时波导的透射率为1;当GST介于晶态和非晶态之间时,其透射率处于0到1之间,故能实现范围在0-1之间的权重存储;基于此原理,假设波导中输入功率为A,GST的权重为B,则光经过GST后输出的功率就是C=A×B;此外,由于不需要从外界存储器中读取数据,直接在GST中以光的传输速率实现乘法运算。
图3(a)展示的是集成了GST的波导横截面示意图,可以看出GST是可以集成在第二直波导之上,且与第二直波导波导等宽,故不会增加额外的面积。
GST晶化度影响输出端口投射率的具体过程:
GST作为一种新型相变材料,其在晶态与非晶态之间具有高对比度。当GST处于晶态时,其具有高吸收性,传输在波导中的光全部被GST吸收,此时波导的投射率为0;当GST处于非晶态时,其对光的吸收几乎为0,波导中的光几乎完全透过,此时波导的透射率为1。
图3(b)展示了不同长度的GST以及GST不同晶化程度对波导透射率的影响,其中在固定长度下展示了不同的晶化等级,分别可对应0-1中不同的权重值,故可通过改变GST的晶化率来实现范围在0-1之间的加权操作。
在计算过程中,可以将权重值映射为GST段波导的透射率,通过对GST状态的控制就可以实现权重的读、写、擦除、非易失存储的功能。在本案例中,具体实施方案为:
(1)写操作:在输入端注入一个大功率的输入信号,利用波导中的光与GST之间的倏逝波耦合作用,可以将输入信号吸收到GST中,从而使GST表面的温度增加。当温度大于晶态阈值时,GST的状态开始发生改变(即非晶化过程),影响波导的透射率,从而实现将透射率(权重)值的写入。
(2)存储操作:在GST透射率的值写入之后,将GST迅速冷却到室温,就可以将GST里原子的状态结构固定,实现权重的存储。在常温下这种状态可以保持几十年不变,因此具有非易失性。
(3)读操作:在权重值(假设为B)写入并存储之后,在输入端输入一个大小为A的小功率信号,其能量不足以达到GST的晶态阈值,因此其不会改变GST的状态,且信号会通过GST传输到输出端。输出端接收到的信号的功率C为输入信号功率A和GST权重B的乘积,实现权重的读取。
(4)擦除操作:通过一个大功率的输入脉冲信号,使GST实现从非晶态到晶态的转变,从而实现对权重数据的擦除。
所述输出模块包括多个模式转换器组成的模式复用器,所述模式复用器用于复用不同光学运算层运算后的光信号。
所述输出模块中,通过楔形波导连接不同的模式转换器,从而形成多路模式复用器;该多路模式复用器将运算模块中的每一光学运算层的输出进行不同的模式转换,并复用到一个波导上,进行混合复用输出。
每个模式转换器均包括两个并排波导,其中,并排的第一波导支持第一模式,并排的第K+1波导支持第一模式到第K+1模式,K表示当前模式转换器在多路模式复用器所处的顺序,K≥1;其波导可支持的模式数随着波导宽度增加而增加,假设K=2,也就是多路模式复用器中一共有2个模式转换器,第1个模式转换器中包括并排的第一波导和第二波导,第2个模式转换器中包括并排的第一波导和第三波导,而第一波导1可支持第一模式1,第二波导2可支持第一模式1和第二模式2,第三波导3可支持第一模式1、第二模式2和第三模式3,当第一波导1中的第一模式1的光信号通过耦合区域时,一旦达到具有相同的有效折射率的相位匹配条件,就可以激发第二波导2或第三波导3中的第二模式2或第三模式3信号,从而实现相应的模式转换。
可以理解的是,在本发明实施例中,所述的输出模块中包含M个P×1的模式复用器,其原理在于:在一个波导中传输的模式的数量随着波导宽度的增加而增加,例如,当波导宽度大于一定值时,波导可以支持两种及多种模式同时传输;由此原理,通过楔形波导连接不同的模式转换器,从而形成模式多路复用器;此模式复用器可将运算模块中的每一光学运算层的输出进行不同的模式转换并复用到一个波导上,最终实现N种波长和P种模式的混合复用输出。图4为本发明实施例中光学矩阵乘法器中的模式转换器和模式复用器示意图。通常情况下,激光器只能工作在单模态,因此对于模式复用,需要使用模式转换器。图4(a)和图4(b)分别表示了模式变换器和模式复用器的工作原理。每个转换器由两个宽度不同的并排波导组成。如果波导宽度增加,波导中支持的模式数就会增加。假设波导1、2和3分别支持模1(M1)、模1和模2(M1和M2)和模1、模2和模3(M1、M2和M3)。当波导1中的M1信号通过耦合区域且一旦达到相位匹配条件(具有相同的有效折射率)时,就可以激发波导2(3)中的M2(M3)信号,从而实现模式转换。如图4(b)所示,通过楔形波导连接不同的模式转换器从而形成模式复用器。在波长-模式混合复用计算系统中,假设第i个波长信号和第j个模式信号的输入功率分别为Pwi,Pmj,其中i∈(1,2,3,…,W),j∈(1,2,3,…,P),则可以在一个周期内完成以下加法操作:
在图1所示的输入模块中,包含着由N个连续波激光产生器组成的激光器阵列,其中不同的激光器分别产生同一种模式的不同波长的连续光信号,分别输入到N个波导之中,代表一个1×N向量的输入信号,该信号会被一个N×1的波长复用器复用到同一波导中,实现波分复用信号传输,此外,通过一个1×P的分光器将已经波分复用的光信号分为P路信号,最终,该P路信号会被传输到运算模块中,每一路对应到一个光学运算层,由此,可实现P个矩阵同时进行运算。
如上所述,在图1所示的运算模块中,包含P层光学运算层,当WDM光信号分别到达每一层光学运算层后,会被一个1×M的分光器分成M路信号,由此组成一个M×N的输入矩阵;随后通过上下话路型MR对波导中的WDM光信号进行波长选择,当特定波长的光信号通过MR的输出端口输出后,再用非易失相变材料对该信号进行加权,实现光学矩阵点乘运算,由于MR和GST都是无源的,因此点乘运算过程不消耗任何能量;另一方面,本结构采用多组无源的MR实现对不同波长信号的选择及复用,由于不同的权重值由GST来调节,因此相邻MR的波长间隔会始终保持不变,从而避免了传统的通过对MR调节来改变权重的乘法器方案中由于波长偏移导致的额外的串扰噪声,提高了计算准确度。此外,每一路加权之后的光信号再通过上下话路型MR被耦合到同一波导之中,实现光学加法运算,至此完成了一M×N矩阵相乘操作。
如上所述,经过每一运算层的光信号会到达由图1中所示的输出模块,在该模块中包含若M个P×1的模式复用器。由图3所示,模式复用器是用楔形波导连接P-1个模式复用器组成的,故可将原来的基模信号转换成P-1个不同于基模的模式信号,将每一运算层的每一行(共M行)输出进行模式复用,实现N×P规模的信号输出,通过M个模式复用器将所有运算层的M行进行模式复用输出,最终实现M×N×P规模的矩阵乘法运算。在同一时序内,相比只用波分复用进行光子并行计算的方式,在该案例中所采用的波长-模式复用并行计算吞吐能力提高了P倍。
上述实例阐明的系统、装置、模块或单元,具体可以由计算机芯片或实体实现,或者由具有某种功能的产品来实现。一种典型的实现设备为计算机。具体的,计算机例如可以为个人计算机、膝上型计算机、蜂窝电话、相机电话、智能电话、个人数字助理、媒体播放器、导航设备、电子邮件设备、游戏控制台、平板计算机、可穿戴设备或者这些设备中的任何设备的组合。
还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、商品或者设备中还存在另外的相同要素。
在本发明的描述中,需要理解的是,术语“同轴”、“底部”、“一端”、“顶部”、“中部”、“另一端”、“上”、“一侧”、“顶部”、“内”、“外”、“前部”、“中央”、“两端”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本发明和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本发明的限制。
在本发明中,除非另有明确的规定和限定,术语“安装”、“设置”、“连接”、“固定”、“旋转”等术语应做广义理解,例如,可以是固定连接,也可以是可拆卸连接,或成一体;可以是机械连接,也可以是电连接;可以是直接相连,也可以通过中间媒介间接相连,可以是两个元件内部的连通或两个元件的相互作用关系,除非另有明确的限定,对于本领域的普通技术人员而言,可以根据具体情况理解上述术语在本发明中的具体含义。
尽管已经示出和描述了本发明的实施例,对于本领域的普通技术人员而言,可以理解在不脱离本发明的原理和精神的情况下可以对这些实施例进行多种变化、修改、替换和变型,本发明的范围由所附权利要求及其等同物限定。

Claims (6)

1.一种支持存算一体及波长-模式混合复用的光学矩阵乘法器,包括依次相连接的输入模块、运算模块以及输出模块;其特征在于,
所述输入模块包括激光器阵列、波分复用器和第一分光器,所述激光器阵列用于产生多个不同波长的连续光信号,所述波分复用器用于对多个不同波长的连续光信号复用,所述第一分光器用于对所述波分复用器复用后的光信号分光;
所述运算模块包括多个第二分光器和多层光学运算层,所述每个第二分光器用于对第一分光器分光后的光信号再次进行分光,每个第二分光器对应一个光学运算层,每一光学运算层包含一个点积计算单元阵列,每一列的点积计算单元工作在不同的波长上,用于对第二分光器分光后的相应束光信号进行运算;其中,每个点积计算单元包括第一MR、第二MR和一段含GST材料的波导;所述点积计算单元包括上、中和下排列的三个直波导以及两个环形波导;第一环形波导置于第一直波导与第二直波导之间构成第一MR,第二环形波导置于第二直波导与第三直波导之间构成第二MR;在第二直波导上包含一段GST材料的波导;其中,所述第一环形波导和所述第二环形波导具有相同的物理参数;
所述输出模块包括多个模式转换器组成的模式复用器,所述模式复用器用于复用不同光学运算层运算后的光信号。
2.根据权利要求1所述的一种支持存算一体及波长-模式混合复用的光学矩阵乘法器,其特征在于,所述输入模块中,激光器阵列包括多个连续波激光产生器,不同激光产生器产生同一模式下的不同波长的连续光信号,经过调制后分别输入到对应的多个波导中,将多个波导中的调制信号通过波分复用器复用到同一波导中,将同一波导的复用信号通过第一分光器产生多路分光信号。
3.根据权利要求1所述的一种支持存算一体及波长-模式混合复用的光学矩阵乘法器,其特征在于,所述运算模块中,所述每个第二分光器对第一分光器分光后的其中一束光信号进行分光,在每一光学运算层中,通过每一列的点积计算单元的第一MR分别对第二分光器的每一束光信号进行波长选择,用GST材料对选择出的特定波长的光信号进行加权,每一个加权后的光信号通过第二MR,被耦合到同一波导之中。
4.根据权利要求1所述的一种支持存算一体及波长-模式混合复用的光学矩阵乘法器,其特征在于,利用第一MR进行波长选择的过程包括所述第一直波导用于传输具有多个波长的光信号,当第一环形波导与其中某个波长的光信号满足谐振条件时,该某个波长的光信号被耦合到第一环形波导中。
5.根据权利要求1所述的一种支持存算一体及波长-模式混合复用的光学矩阵乘法器,其特征在于,所述输出模块中,通过楔形波导连接不同的模式转换器,从而形成多路模式复用器;该多路模式复用器将运算模块中的每一光学运算层的输出进行不同的模式转换,并复用到一个波导上,进行混合复用输出。
6.根据权利要求5所述的一种支持存算一体及波长-模式混合复用的光学矩阵乘法器,其特征在于,每个模式转换器均包括两个并排波导,其中,并排的第一波导支持第一模式,并排的第K+1波导支持第一模式到第K+1模式,K表示当前模式转换器在多路模式复用器所处的顺序,K≥1。
CN202210663150.5A 2022-06-13 2022-06-13 一种支持存算一体及波长-模式混合复用的光学矩阵乘法器 Active CN115085854B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210663150.5A CN115085854B (zh) 2022-06-13 2022-06-13 一种支持存算一体及波长-模式混合复用的光学矩阵乘法器

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210663150.5A CN115085854B (zh) 2022-06-13 2022-06-13 一种支持存算一体及波长-模式混合复用的光学矩阵乘法器

Publications (2)

Publication Number Publication Date
CN115085854A CN115085854A (zh) 2022-09-20
CN115085854B true CN115085854B (zh) 2023-08-29

Family

ID=83250633

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210663150.5A Active CN115085854B (zh) 2022-06-13 2022-06-13 一种支持存算一体及波长-模式混合复用的光学矩阵乘法器

Country Status (1)

Country Link
CN (1) CN115085854B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116955898B (zh) * 2023-05-05 2024-05-17 重庆邮电大学空间通信研究院 一种基于微盘谐振器的常系数可调全光微分方程求解器

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8027587B1 (en) * 2007-08-21 2011-09-27 Sandia Corporation Integrated optic vector-matrix multiplier
CN111561953A (zh) * 2020-05-14 2020-08-21 上海科技大学 基于波分复用与平衡探测的片上集成光学矩阵矢量乘法器
CN113657580A (zh) * 2021-08-17 2021-11-16 重庆邮电大学 基于微环谐振器和非易失性相变材料的光子卷积神经网络加速器

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8705972B2 (en) * 2010-05-11 2014-04-22 Hewlett-Packard Development Company, L.P. Energy-efficient and fault-tolerant resonator-based modulation and wavelength division multiplexing systems

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8027587B1 (en) * 2007-08-21 2011-09-27 Sandia Corporation Integrated optic vector-matrix multiplier
CN111561953A (zh) * 2020-05-14 2020-08-21 上海科技大学 基于波分复用与平衡探测的片上集成光学矩阵矢量乘法器
CN113657580A (zh) * 2021-08-17 2021-11-16 重庆邮电大学 基于微环谐振器和非易失性相变材料的光子卷积神经网络加速器

Also Published As

Publication number Publication date
CN115085854A (zh) 2022-09-20

Similar Documents

Publication Publication Date Title
Miscuglio et al. Photonic tensor cores for machine learning
CN113657580B (zh) 基于微环谐振器和非易失性相变材料的光子卷积神经网络加速器
Shastri et al. Photonics for artificial intelligence and neuromorphic computing
WO2023201970A1 (zh) 一种计算芯片、系统及数据处理方法
Peserico et al. Integrated photonic tensor processing unit for a matrix multiply: a review
US12039433B2 (en) Optical multiply and accumulate unit
CN112180653B (zh) 一种基于光学模式的异或和同或逻辑运算单元
CN115085854B (zh) 一种支持存算一体及波长-模式混合复用的光学矩阵乘法器
CN110908428B (zh) 一种高效实现大规模矩阵运算的并行光计算系统
Guo et al. StarLight: a photonic neural network accelerator featuring a hybrid mode-wavelength division multiplexing and photonic nonvolatile memory
Sunny et al. Machine learning accelerators in 2.5 D chiplet platforms with silicon photonics
Pappas et al. 16-bit (4× 4) optical random access memory (RAM) bank
Xiao et al. Wavelength-parallel photonic tensor core based on multi-FSR microring resonator crossbar array
Hang et al. Compact, highly efficient, and controllable simultaneous 2× 2 three-mode silicon photonic switch in the continuum band
CN113839715A (zh) 一种光学神经网络及芯片
CN116822601A (zh) 一种结合波分复用和mzi级联网络的矩阵运算加速器
CN116088245A (zh) 基于相变材料Sb2Se3的非易失性可重构紧凑型全光逻辑门
CN113630207A (zh) 一种光子神经网络芯片
CN118821862A (zh) 一种基于双功能微环谐振器的紧凑高效光子卷积神经网络加速器
Liu et al. An energy-efficient non-volatile silicon photonic accelerator for convolutional neural networks (NVSP-CNNs)
CN117744729A (zh) 一种双微环非易失光子卷积加速器
CN117764130A (zh) 一种非易失性光子卷积加速器
CN117709423B (zh) 一种深度神经网络光子加速芯片及其运算系统
Afifi et al. Accelerating Neural Networks for Large Language Models and Graph Processing with Silicon Photonics
CN118192010B (zh) 用于光学神经网络原位训练的硅基光控微环谐振器

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant