CN114861734B

CN114861734B - 一种基于光散射的矩阵运算立体结构单元

Info

Publication number: CN114861734B
Application number: CN202210589380.1A
Authority: CN
Inventors: 刘旭; 欧瀚文; 王百航; 张嘉龙; 曹一凡; 吴奕征; 梅奇勋; 从哲; 刘仁韬; 王春清
Original assignee: Southeast University
Current assignee: Southeast University
Priority date: 2022-05-26
Filing date: 2022-05-26
Publication date: 2024-04-16
Anticipated expiration: 2042-05-26
Also published as: CN114861734A

Abstract

本发明公开了一种基于光散射的矩阵运算立体结构单元，包括依次连接的电光调制单元、光学矩阵计算单元和光电检测器；所述电光调制单元用于将输入的电信号转换为各自不同频率的N维光信号并输出到该立体结构单元，该立体结构将计算该矩阵与列向量的叉乘结果并输出到光电检测器转化为电信号，得到最终的输出。本发明的电光混合的矩阵乘法，具备高带宽、低损耗、所需空间小等优势。

Description

一种基于光散射的矩阵运算立体结构单元

技术领域

本发明涉及了一种基于反向优化的立体结构光子矩阵乘法单元，从而实现电光混合的片上矩阵运算。

背景技术

近年来，随着机器学习技术的发展，深度神经网络在各种新兴应用中表现出革命性的性能提升。特别是深度卷积神经网络(CNN)在计算机视觉、图像处理、语音处理、医疗诊断、游戏、信号处理等领域产生了深远的影响，成为现代人工智能的基石。深度神经网络虽然具有先进的性能，但其复杂的结构和大量的参数在训练和推理过程中消耗了大量的计算资源。因此，对高速、低功耗的神经网络加速器有着迫切的需求。

光学方法是下一代神经网络加速器的潜在方法，因为光学元件和技术具有超宽频带和低功耗的特点。利用空间光衍射、片上相干干涉、波分复用等光学技术论证了光学神经网络(ONN)的可行性。从数值和实验结果可以很好地推断出它的高速和低功耗性能。在这些关于光学神经网络的先驱工作中，主要考虑了全连接神经网络，因此这些架构被设计成矢量矩阵乘法器。当涉及到卷积神经网络(CNN)时，这些架构可能会面临巨大的挑战，因为将卷积层转换为向量-矩阵乘法需要一个巨大的光学电路。如果输入图像的大小为N×N，则该光电路的内嵌参数个数为N⁴。克服这一障碍的一种可行方法是通过复用光学硬件将卷积层转换为矩阵-矩阵乘法。因此，嵌入参数的数量显著减少，大约几十个，完整的计算在N²时间周期内完成。

发明内容

根据硬件复用的概念，本发明提出了一种光学矩阵计算单元立体结构，该结构可以在一个单元中执行任意复杂CNN中的所有卷积。由于一个矩阵乘法可以通过多个点积运算等价地实现，因此该架构可以重复使用以实现矩阵乘法器的相同功能，从而减轻了控制难度。

为了克服集成电子电路巨大的能耗和显著的信号延迟，利用光子器件高带宽、低功耗、所需空间小的优势，本发明提出了一种基于光散射的矩阵运算立体结构，可以高速低能耗地进行N维矩阵运算。

一种基于光散射的矩阵运算立体结构单元，包括依次连接的电光调制单元、光学矩阵计算单元和光电检测器。所述电光调制单元用于将输入的N维列向量电信号转换为各自不同频率的N维光信号并输出到光学矩阵计算单元，光学矩阵计算单元中实现矩阵P与N维列向量的叉乘结果并输出到光电检测器转化为电信号，得到最终的输出。

所述矩阵P表述形式：

设输入光学矩阵计算单元的N维光信号为光学矩阵计算单元实现矩阵P与N维列向量的叉乘结果后，输出N维光信号为/>其中：

通过以光信号的功率来表征所传递的电信号和矩阵元素，方便了光电之间的读数和转换。借助规定N维光信号的频率各不相同，从而使得将光信号在后端只需简单线性相加而无需讨论相位匹配问题，并且便于使用到后续光学神经网络的训练。

进一步的，所述光学矩阵计算单元包括N层前端光散射单元和N层后端光散射单元，且二者之间通过波导连接，前端光散射单元和后端光散射单元的个数和矩阵P的维度相同；

N层前端光散射单元由N个前端光散射单元堆叠而成，N层后端光散射单元由N个后端光散射单元堆叠而成，N层前端光散射单元和N层一端光散射单元的堆叠方向呈垂直关系，每层前端光散射单元均通过N个波导分别与N个后端光散射单元连接；

N维光信号到达光学矩阵计算单元时，N个光信号分别输入到N个前端光散射单元，在每层前端光散射单元中对输入的光信号进行线性运算分配光功率后，每层前端光散射单元输出N维光信号，分别到达N层后端光散射单元，每层后端光散射单元再对输入的光信号进行线性叠加运算分配光功率，最后将运算结果输出光电检测器。

进一步的，每层的前端光散射单元和后端光散射单元均通过基于python的angler库编程实现，利用片上梯度算法对各层分光结构进行优化设计，在三维坐标上设计各光散射单元结构和排版，与传统芯片设计不对芯片厚度做具体要求且只考虑其二维坐标上排版不同。

进一步的，在每层前端光散射单元中对输入的光信号进行线性运算分配光功率，具体为：

设输入前端光散射单元的N维光信号为前端光散射单元输出N维光信号为/>其中：

进一步的，每层后端光散射单元对输入的光信号进行线性叠加运算分配光功率，具体为：

设输入后端光散射单元的N维光信号为输出的N维光信号为/>其中：

由于输入的N维光信号互为非相干光，线性叠加过程无需做相位上的调整。

采用上述技术方案带来的有益效果：

(1)利用梯度算法训练得到本发明的光学矩阵计算单元，可以代替传统电路，从而实现电光混合的片上矩阵乘法运算，具备高带宽、低损耗、所需空间小等优势。

(2)本发明提出的对输入电信号进行的光信号转换方法易于实现，且可以极大地方便神经网络的训练过程。

(3)本发明使用的光学矩阵计算单元前端结构对光信号进行线性分光运算，功耗低且运算速度远高于纯电路运算速度。

附图说明

图1是本发明的实现矩阵计算的架构示意图；

图2是N层前端光散射单元(左)和N层后端光散射单元(右)的示意图；

图3是光学矩阵计算单元的连接结构示意图；

图4是各层前端光散射单元版图；

图5是各层后端光散射单元版图；

图6是光学矩阵计算单元对光功率的传播效率与迭代次数的关系示意图。

具体实施方式

以下将结合附图，对本发明的技术方案进行详细说明。

如图1所示，本发明的一种基于光散射的矩阵运算立体结构，包括依次连接的电光调制单元、光学矩阵计算单元和光电检测器，所述光学矩阵计算单元包括N层前端光散射单元和N层后端光散射单元，本实施例中的矩阵P为4*4矩阵，所以实施例中的光学矩阵计算单元包括四层前端光散射单元和四层后端光散射单元。

数字电信号作为本发明光学矩阵计算单元的输入，所述电光调制单元用于将输入的电信号转换为四维光信号并分别输出到四层前端光散射单元，用于对接收到的四维光信号进行线性分光运算，将每一维光信号按照所定义矩阵中的对应列元素分光后，每层前端光散射单元输出光信号分别至四层后端光散射单元，再由后端结构对各列光叠加输出至光电检测器得到最终的矩阵计算结果并将其转换回电信号。

四维光信号经过四层前端光散射单元时，每层前端光散射单元作为线性光子元件先对输入的光信号进行线性运算并输出至后端光散射单元，每层后端光散射单元再对信号进行线性叠加运算，再将运算结果从后端光散射单元输出。

四层前端光散射单元，在每层光散射单元中对输入的光信号进行线性运算分配光功率，具体为：

设输入四层前端光散射单元的四维光信号为四层前端光散射单元分别输出为/>其中：

并且可以通过设计前端结构的各层光学芯片单元的结构实现不同的矩阵。

如图2、3所示，四层前端光散射单元与四层后端光散射单元的叠层方向呈垂直关系，两者的结构特点使得连接可用直波导减少信号干扰。

四层后端光散射单元，在每层后端光散射单元中对输入的光信号进行线性叠加运算分配光功率，具体为：

设输入的的光信号为输出四维光信号为/> 其中：

综上，则该光学矩阵计算单元实现了如下矩阵：

对于各层光学芯片单元，可以利用梯度算法对其进行优化设计所得GDS版图如图4、5所示，得到输入响应准确度较高的光学矩阵计算单元。

本发明的光学矩阵计算单元基于L-BFGS算法被优化设计以使得光功率线性误差最小化，其功率传输精确度随着训练次数的增加而增加。如本发明中光学矩阵计算单元实现了4*4的矩阵，则经过400次的迭代优化，光功率的传播效率达到99.87％，其传播效率与迭代次数的关系如图6所示。可以认为该光学矩阵计算单元是可以实现四输入的矩阵运算的。

Claims

1.一种基于光散射的矩阵运算立体结构单元，其特征在于，包括依次连接的电光调制单元、光学矩阵计算单元和光电检测器；

所述电光调制单元用于将输入的N维列向量电信号转换为各自不同频率的N维光信号并输出到光学矩阵计算单元，光学矩阵计算单元中实现矩阵P与N维列向量的叉乘结果并输出到光电检测器转化为电信号，得到最终的输出；

所述矩阵P表述形式：

所述光学矩阵计算单元包括N层前端光散射单元和N层后端光散射单元，且二者之间通过波导连接；

N层前端光散射单元由N个前端光散射单元堆叠而成，N层后端光散射单元由N个后端光散射单元堆叠而成，N层前端光散射单元和N层后端光散射单元的堆叠方向呈垂直关系，每层前端光散射单元均通过N个波导分别与N个后端光散射单元连接；

2.根据权利要求1所述一种基于光散射的矩阵运算立体结构单元，其特征在于，每层的前端光散射单元和后端光散射单元均通过基于python的angler库编程实现，在三维坐标上设计各光散射单元结构和排版。

3.根据权利要求2所述一种基于光散射的矩阵运算立体结构单元，其特征在于，

利用片上梯度算法对各层光散射单元进行优化设计。

4.根据权利要求1所述一种基于光散射的矩阵运算立体结构单元，其特征在于，在每层前端光散射单元中对输入的光信号进行线性运算分配光功率，具体为：

5.根据权利要求1所述一种基于光散射的矩阵运算立体结构单元，其特征在于，每层后端光散射单元对输入的光信号进行线性叠加运算分配光功率，具体为：

设输入后端光散射单元的N维光信号为输出的N维光信号为其中：