CN110276047B

CN110276047B - 一种利用光电计算阵列进行矩阵向量乘运算的方法

Info

Publication number: CN110276047B
Application number: CN201910415830.3A
Authority: CN
Inventors: 王瑶; 陈轩; 王宇宣
Original assignee: Nanjing Weixin Photoelectric System Co ltd
Current assignee: Nanjing Jixiang Sensing Imaging Technology Research Institute Co ltd
Priority date: 2019-05-18
Filing date: 2019-05-18
Publication date: 2023-01-17
Anticipated expiration: 2039-05-18
Also published as: CN110276047A

Abstract

本发明公开了一种利用光电计算阵列进行矩阵向量乘运算的方法。该方法利用不含AD转换器的光电计算阵列，先将功能函数按照比特位指数加权，再将权值矩阵映射到光电计算阵列中；然后将原有的输入向量按照比特位展开，向量中的每一个元素仅包含1比特位，向量长度位原有的向量长度乘上数据位宽；将调整过的输入向量输入光电计算阵列中，与权值矩阵进行矩阵向量乘运算，每一列的输出结果经过比较器之后仅包含1比特位，获得中间结果向量；最后将中间结果向量根据结果向量的数据位宽，合并成最终的结果向量。本发明的矩阵向量乘运算方法，通过避免使用AD转换器，而是用比较器进行替代，从而减小了大量的功耗和面积。

Description

一种利用光电计算阵列进行矩阵向量乘运算的方法

技术领域

本发明涉及一种利用光电计算阵列进行矩阵向量乘运算的方法，属于计算领域和光电探测领域。

背景技术

传统的计算机大多采取冯诺依曼架构，然而，因为冯诺依曼架构存储单元和运算单元的分立，导致了在数据传输上产生了极大的能量消耗，并且影响运算速度。光电计算单元为一种可以独立运算或者与目前电子计算技术相结合来进行运算的计算器件，其特点为：单器件即可实现“存-算一体功能”、集成度好、能效比高、兼容性强，因此非常适合加速以神经网络算法、CT算法为代表的一系列需要大量运算矩阵向量乘法的算法。

模数转换器(AD)是将模拟信号转换为多位数字信号不可或缺的模块，然而其功耗和面积与所需转换的数字信号位宽呈指数关系，往往在计算系统中的占比过半。如果能够想办法减少模数转换器的数目，会有效地减小系统的功耗和面积。现有的优化思路是采用时分复用的方法，即多路模拟信号在不同时刻依次被模数转换器转换为数字信号，但这样会大大降低整个系统的运算速度。

比较器的功能与1位的模数转换器相同，对于同样的位宽n，使用n个比较器进行模数转换，比使用1个n位的模数转换器，功耗和面积要小得多。

发明内容

为了克服以上现有技术中存在的缺陷，本发明提供一种利用光电计算阵列进行矩阵向量乘运算的方法，该方法无需使用AD转换器。

本发明采用的技术方案如下：

一种利用光电计算阵列进行矩阵向量乘运算的方法，其光电计算阵列由多个光电计算单元周期性排列组成，每个光电计算单元包括发光单元和计算单元，发光单元发出的光入射到计算单元中；每个计算单元包括载流子控制区、耦合区、以及光生载流子收集区和读出区；所述方法的具体步骤如下：

(1)将光电计算单元排列成m行和n列的阵列，其中，m为待乘矩阵的行数，n为待乘矩阵的列数；阵列中，每一列计算单元的光生载流子收集区和读出区中的读出区依次相连，每一行计算单元的载流子控制区依次相连；其中，待乘矩阵是由经过比特位指数加权的功能函数训练得到的权值矩阵；

(2)所述发光单元发出被设置为所述待乘矩阵中数据的光信号，并入射到对应的计算单元的光生载流子收集区和读出区，为矩阵数据的输入端；每一行计算单元的载流子控制区输入被设置为代表向量中各个元素的载流子，为向量数据的输入端；其中，所述向量中各个元素的数据被转化为二进制后，按照比特位展开并且并行地将代表二值化后数据的载流子输入到各个行的载流子控制区；

(3)计算单元的光生载流子收集区和读出区中的读出区输出端输出受矩阵数据和向量数据共同作用后的载流子，并在固定电压的驱动下以电流的形式输出，电流信号按列汇聚后经过比较器得到0/1的值，形成中间结果向量；

(4)对于得到的中间结果向量，从第一列开始，每个固定个数的数字信号代表一个实际数值，固定个数等于最终结果向量数据位宽，将所述固定个数的数据经过整合后即得到最终结果向量。

优选地，所述光电计算单元的数量大于等于四个。

本发明基于光电计算阵列提出了一种矩阵向量乘的运算优化方法，通过避免使用AD转换器，而是用比较器进行替代，从而减小了大量的功耗和面积。

附图说明

图1是计算单元的多功能区框图。

图2是光电计算阵列的结构示意图，其中：1-发光阵列，2-计算阵列。

图3是实施例1计算单元结构的(a)截面图和(b)立体图。

图4是实施例2计算单元结构的(a)截面图和(b)立体图。

图5是实施例3计算单元的(a)结构示意图和(b)多功能区示意图。

图6是实施例4无AD光电计算阵列的框图。

图7是实施例4无AD法处理中间结果向量的计算示意图。

具体实施方式

本发明光电计算单元中的计算单元为包括三大功能区的多功能区结构，如图1所示，三大功能区为：载流子控制区、耦合区、光生载流子收集区和读出区，具体功能分别如下：

载流子控制区：负责控制并调制光电计算单元内的载流子，并且作为计算单元的电输入端口，输入其中一个运算量作为电输入量；或者只控制并调制计算单元内的载流子，通过其他区域输入电输入量。

耦合区：负责连接光生载流子收集区和读出区，使得光子入射产生的光生载流子作用于光电计算单元内的载流子，形成运算关系。

光生载流子收集区和读出区：其中收集区负责吸收入射的光子并收集产生的光生载流子，并且作为计算单元的光输入端口，输入其中一个运算量作为光输入量；读出区可以作为计算单元的电输入端口，输入其中一个运算量作为电输入量，并且作为计算单元的输出端口，输出被光输入量和电输入量作用后的载流子作为单元输出量；或者通过其他区域输入电输入量，读出区只作为计算单元的输出端口，输出被光输入量和电输入量作用后的载流子，作为单元输出量。

发光单元发出的光作为入射计算单元光生载流子收集和读出区的光子，参与运算。光电计算阵列包括发光阵列1和计算阵列2，结构如图2所示。发光阵列1由多个发光单元周期性排列组成，计算阵列2由多个计算单元周期性排列组成。

实施例1

如图3所示，本实施例的计算单元包括：作为载流子控制区的控制栅极、作为耦合区的电荷耦合层，以及作为光生载流子收集区和读出区的P型衬底，P型衬底中分为左侧收集区和右侧读出区，其中右侧读出区中包括浅槽隔离、通过离子注入形成的N型源端和N型漏端。浅槽隔离位于半导体衬底中部、收集区和读出区的中间，浅槽隔离通过刻蚀并填充入二氧化硅来形成，以用于隔离收集区和读出区的电信号。N型源端位于读出区内靠近底层介质层的一侧，通过离子注入法掺杂而形成。N型漏端位于半导体衬底中靠近底层介质层与N型源端相对的另一侧，同样通过离子注入法进行掺杂法形成。应理解，本文中提及的左侧、右侧、上方以及下方只代表在通过图中所示视角观察下的相对位置随观察视角变化而变化，并不理解为对具体结构的限制。

在收集区的衬底上施加一个电压范围为负压的脉冲，或在控制栅上施加一个电压范围为正压的脉冲，使得收集区衬底中产生用于光电子收集的耗尽层，并通过右侧读出区读出收集的光电子数量，作为光输入端的输入量。读出时，在控制栅极上施加一正电压，使N型源端和收集区N型漏端间形成导电沟道，再通过在N型源端和N型漏端间施加一个偏置脉冲电压，使得导电沟道内的电子加速形成源漏之间的电流。源漏之间沟道内形成电流的载流子，受到控制栅电压、源漏间电压和收集区收集的光电子数量共同作用，作为被光输入量和电输入量共同作用后的电子，以电流的形式进行输出，其中控制栅电压、源漏间电压可以作为器件的电输入量，光电子数量则为器件的光输入量。

耦合区的电荷耦合层用于连接收集区和读出区，使收集区衬底内耗尽区开始收集光电子以后，收集区衬底表面势就会受到收集的光电子数量影响；通过电荷耦合层的连接，使得读出区半导体衬底表面势受到收集区半导体衬底表面势影响，进而影响读出区源漏间电流大小，从而通过判断读出区源漏间电流来读出收集区收集的光电子数量；

载流子控制区的控制栅，用以在其上施加一个脉冲电压，使得在P型半导体衬底读出区中产生用于激发光电子的耗尽区，同时也可以作为电输入端，输入其中一位运算量。

此外，P型半导体衬底和电荷耦合层之间存在用于隔离的底层介质层；电荷耦合层和控制栅之间亦存在用于隔离的顶层介质层。

实施例2

如图4所示，本实施例的计算单元包括：作为载流子控制区的控制栅极、作为耦合区的电荷耦合层，以及作为光生载流子收集区和读出区的P型半导体衬底，其中P型衬底中包含通过离子注入形成的N型源端和漏端。P型半导体衬底可以同时承担感光和读出的工作。N型源端位于读出区内靠近底层介质层的一侧，通过离子注入法掺杂而形成。N型漏端位于半导体衬底中靠近底层介质层与所述N型源端相对的另一侧，同样通过离子注入法进行掺杂法形成。

感光时，在P型半导体衬底上施加一个电压范围为负压的脉冲，同时在作为载流子控制区的控制栅极上施加一个电压范围为正压的脉冲，使得P型衬底中产生用于光电子收集的耗尽层，产生在耗尽区内的电子在控制栅极和P型衬底两端之间的电场作用下被加速，并在到达获得足够高的能量，穿过P型衬底和电荷耦合层之间的底层介质层势垒，进入电荷耦合层并储存于此，电荷耦合层中的电荷数量，会影响器件开启时的阈值，进而影响读出时的源漏间电流大小；读出时，在控制栅极上施加一脉冲电压，使N型源端和N型漏端间形成导电沟道，再通过在N型源端和N型漏端间施加一个脉冲电压，使得导电沟道内的电子加速形成源漏之间的电流。源漏之间的电流受到控制栅脉冲电压、源漏间电压和电荷耦合层中存储的电子数量共同作用，作为被光输入量和电输入量共同作用后的电子，以电流的形式进行输出，其中控制栅电压、源漏间电压可以作为器件的电输入量，电荷耦合层中存储的光电子数量则为器件的光输入量。

耦合区的电荷耦合层用于储存进入其中的光电子，并改变读出时器件阈值大小，进而影响读出区源漏间电流，从而通过判断读出区源漏间电流来读出感光时产生并且进入电荷耦合层中的光电子数量。

此外，P型半导体衬底和电荷耦合层之间存在一层用于隔离的底层介质层；电荷耦合层和控制栅之间亦存在一层用于隔离的顶层介质层。

实施例3

如图5所示，本实施例的计算单元包括：作为光生载流子收集和读出区的光电二极管和读出管，其中，光电二极管通过离子掺杂形成，负责感光。光电二极管的N区通过作为耦合区的光电子耦合引线连接到读出管的控制栅和复位管的源端上，读出管的漏端施加一正电压脉冲，作为读出电流的驱动电压；曝光前，复位管打开，复位管漏端电压施加到光电二极管上，使作为收集区的光电二极管处于反偏状态，产生耗尽层；曝光时，复位管关断，光电二极管被电学上隔离，光子入射光电二极管耗尽区后产生光电子，并在二极管中积累，二极管的N区和在电学上通过作为耦合区的光电子耦合引线和N区连接的读出管控制栅电势开始下降，进而影响读出管沟道内的电子浓度。读出管负责读出，其漏端施加一正脉冲电压，源端和选址管漏端连接，读出时，打开选址管，读出管中产生电流电流,电流大小受到复位管漏端电压、读出管漏端电压和入射光子数共同影响，读出管沟道内的电子，作为被光输入量和电输入量共同作用后的电子，以电流的形式输出，其中复位管漏端电压、读出管漏端电压可以作为器件的电输入量，电入射光子数则为器件的光输入量。

耦合区的光电子耦合引线用于连接作为光生载流子收集和读出区中收集区的光电二极管和作为读出区的读出管，将光电二极管N区电势施加到读出管控制栅上。

作为载流子控制区的复位管，通过其漏端输入一个正电压作用于光电二极管，当复位管打开时，正电压即会作用在光电二极管上，使光电二极管产生耗尽区并感光，同时也可以作为电输入端，输入其中一位运算量。

此外，选址管用于控制整个运算器件作为输出量的输出电流的输出，可以在光电计算单元组成阵列时行列选址使用。

实施例4

本实施例使用多个发光单元和实施例1的计算单元组成无AD光电计算阵列，以矩阵向量乘的形式来实现某种特定函数运算。

以计算某种特定函数Y(X)为例，令O＝Y(A)，其中A为1*n向量，数据位宽为k，O为1*m向量，数据位宽为l。先训练大小为kn*lm的权值矩阵W，相比于常规的训练方法，需要将原来的功能函数按照比特位指数加权，即高比特位的权重比低比特位的权重高。

再将1*n的向量A按照式(1)变为1*kn的向量A^c：

其中

为A_i按照二进制比特位展开的结果，如(2)所示。

之后计算向量A^c和矩阵W的乘法运算A^c*W，其中A为1*kn向量，W为kn*lm矩阵，如式(3)，计算示意图如图6所示，图中标有V字符的方框单元即代表采用第一种实施方案的计算单元，其中向量A^c中的元素通过电输入端输入，矩阵W中的元素通过光输入端输入。

将计算单元按照如图6所示的形式排列成阵列，其中阵列的行数为kn，列数为lm，并且将阵列的所有同一行的计算单元的作为载流子控制区的控制栅极都相连，输入同样的电输入数据；将阵列的所有同一列的计算单元的作为载流子收集和读出区的P型衬底的输出端都相连，使得输出的电流汇聚相加。

输入时，将矩阵中的kn*lm个数据，通过发光单元依次输入到kn*lm个计算单元中；将向量中的元素从同行单元相连的控制栅极上输入。由于向量中每个元素只有1个比特位，所以不存在串行并行的问题。

电流汇聚前，kn*lm的计算单元阵列，每一个单元的计算结果分别为：

再经每一列的输出端都相连的输出电流电路，即等于进行了按列相加运算，结果(4)经汇聚相加后，最下方的矩阵向量乘法输出端输出为：

[(A₁₁W₁₁+…+A_1kW_k1+…+A_n1W_(nk-k+1)1+…+A_nkW_(nk)1)…(A₁₁W_1l+…+A_1kW_kl+…+A_n1W_(nk-k+1)l+…+A_nkW_(nk)l)…(A₁₁W_1(ml-l+1)+…+A_1kW_k(ml-l+1)+…+A_n1W_{(nk-k+1)(ml-l+1)}+…+A_nkW_(nk)(ml-l+1))…(A₁₁W_1(ml)+…+A_1kW_k(ml)+…+A_n1W_(nk-k+1)(ml)+…+A_nkW_(nk)(ml))] (5)

将计算结果(5)经过0/1比较器后输入控制系统，即得到中间的矩阵向量运算结果，该中间结果向量的每个数据为1比特位，数据个数为lm。

之后在控制系统中，如图7所示，将所得1*lm中间矩阵向量运算结果，每l个数据合并为一个位宽为l的新数据，得到最终的1*m矩阵向量运算结果，即：

控制系统可以采用数字电路，也可以采用计算机、单片机、FPGA等多种逻辑控制单元。

Claims

1.一种利用光电计算阵列进行矩阵向量乘运算的方法，其特征在于，光电计算阵列由多个光电计算单元周期性排列组成，每个光电计算单元包括发光单元和计算单元，发光单元发出的光入射到计算单元中；每个计算单元包括载流子控制区、耦合区、以及光生载流子收集区和读出区；所述方法的具体步骤如下：

2.根据权利要求1所述的一种利用光电计算阵列进行矩阵向量乘运算的方法，其特征在于，所述光电计算单元的数量大于等于四个。