WO2020052342A1

WO2020052342A1 - 一种基于非易失存储器的卷积神经网络片上学习系统

Info

Publication number: WO2020052342A1
Application number: PCT/CN2019/095680
Authority: WO
Inventors: 缪向水; 李祎; 潘文谦
Original assignee: 华中科技大学
Priority date: 2018-09-11
Filing date: 2019-07-12
Publication date: 2020-03-19
Also published as: CN109460817B; CN109460817A; US11861489B2; US20200342301A1

Abstract

本发明公开一种基于非易失存储器的卷积神经网络片上学习系统，包括：输入模块、卷积神经网络模块、输出模块以及权重更新模块。卷积神经网络模块的片上学习利用忆阻器电导随着施加脉冲进行改变的特性实现突触功能，卷积核值或突触权重值储存在忆阻单元中；输入模块将输入信号转换成卷积神经网络模块所需的电压信号；卷积神经网络模块将输入电压信号经过逐层计算转换，并将结果传入输出模块得到网络的输出；权重更新模块根据输出模块的结果调整卷积神经网络模块中忆阻器的电导值，实现网络卷积核值或突触权重值的更新。本发明旨在实现卷积神经网络的片上学习，实现了数据的在线处理，基于网络的高度并行性实现了速度快功耗低，硬件成本低的需求。

Description

一种基于非易失存储器的卷积神经网络片上学习系统

[技术领域]

本发明涉及人工神经网络技术领域，更具体地，涉及一种基于非易失存储器的卷积神经网络片上学习系统。

[背景技术]

人工神经网络是一种应用类似于大脑神经突触联接的结构，它是一种模仿动物神经网络行为特征，进行信息处理的数学模型进行分布式并行信息处理的算法数学模型。在众多机器学习的算法中，神经网络的适用性广，鲁棒性强。这种网络依靠系统的复杂程度，通过调整内部大量节点之间相互连接的关系，从而达到处理信息的目的。

作为深度学习最重要的算法之一，卷积神经网络在大型图像识别中有很大的优越性。由多个卷积层和池化层组成的卷积神经网络(Convolutional Neural Network，CNN)体系结构可以提取有用的特征信息，而不需要大量的手动输入数据，这使得其在各种模式识别应用中的有很高的准确性，将其实现硬件化是一项很有前景的工作。现有的很多工作大多是基于CPU和GPU开展的，这样会导致很大的能耗，即遭遇所说的冯诺依曼瓶颈，所以急需寻找一种新型存储器件能模拟人脑，同时实现对信息的存储和处理。CNN利用输入图像的空间结构，比其他神经网络结构如完全连接的神经网络更适合于视觉任务。到目前为止，最大的挑战是将CNN集成到嵌入式系统中。要实现硬件化，突触是神经网络中最多的处理元件，在突触器件方面，已有很多器件被报道如磁性存储器，相变存储器和忆阻器等。这其中，由于忆阻器非易失，易集成，低功耗以及可实现多位存储，是非常有前途的候选者。忆阻器的模拟记忆功能类似于生物突触，其电导可以通过施加相对较大的电压偏置而连续改变，但在施加较小的偏压或无偏压时保持不变。忆阻器可以通过crossbar结构进行集成，使用这种结构可以实现接近或大于脑组织的突触密度。基于忆阻器的CNN可以使用易于实现的神经电路和辅助电路，同时可以降低能耗，以更高的速度进行计算并在物理上实现并行性。

[发明内容]

针对现有技术的缺陷，本发明的目的在于解决现有计算机实现卷积神经网络所遭遇的冯诺依曼瓶颈，其计算和存储的分离相当耗时低速，并且会导致巨大的硬件成本，同时利用计算机实现的片外学习只能实现预先训练的特定功能，不能实时灵活地解决问题的技术问题。

为实现上述目的，本发明提供一种基于非易失存储器的卷积神经网络片上学习系统，包括：输入模块、卷积神经网络模块、输出模块以及权重更新模块；

所述输入模块将输入信号转换成卷积神经网络模块所需的输入电压脉冲信号后传入所述卷积神经网络模块；

所述卷积神经网络模块对输入信号对应的输入电压脉冲信号经过逐层计算转换以完成片上学习得到输出信号，其利用忆阻器件的电导随着施加脉冲进行改变的电导调制特性实现突触功能，片上学习过程中用到的网络卷积核值或突触权重值储存在忆阻器件中；

所述输出模块将所述卷积神经网络模块产生的输出信号转换并发送给所述权重更新模块；

所述权重更新模块根据输出模块的结果来计算误差信号和调整忆阻器件的电导值，实现网络卷积核值或突触权重值的更新。

可选地，所述输入模块将外界输入信号转换成所述卷积神经网络所需的输入电压脉冲信号，输入信号与输入电压脉冲信号的脉冲宽度或脉冲幅度遵循正比例关系，且所述输入电压脉冲信号应小于忆阻器的擦写电压。

可选地，所述卷积神经网络模块采用忆阻器件来模拟网络卷积核值和突触权重值，所述忆阻器件的电阻随着施加电信号进行改变；

所述卷积神经网络模块包括：由忆阻器阵列作为卷积核构成的卷积层电路单元和池化层电路单元，以及由忆阻器阵列作为突触构成的全连接层电路单元；

所述卷积层电路单元接收输入模块输出的输入电压脉冲信号，输入电压脉冲信号经过所述卷积层电路单元、池化层电路单元，以及全连接层电路单元逐层计算转换，并将计算结果作为输出信号发送至所述输出模块。

可选地，所述卷积层电路单元由忆阻阵列构成的卷积运算电路和激活函数部分组成；

所述卷积运算电路采用两行忆阻阵列作为一个卷积核来实现正负卷积核值，初始卷积核值与忆阻电导值对应时，卷积核值被映射成可以与整个输入信号进行矩阵乘法运算的矩阵，卷积核被扩展为两个大型稀疏矩阵K+和K-，分别为神经元节点对应的正负卷积核值，相应地利用忆阻器件可以施加正负读取电压脉冲的特性将输入信号转换为正输入X和负输入-X两个一维矩阵；

所述卷积运算电路将输入电压脉冲信号与存储在忆阻器单元中的卷积核值进行卷积运算，收集同一列的电流即得到卷积运算结果，卷积运算过程为

其中，y为卷积运算结果，

为卷积运算符号，X为神经元节点的前端突触输入电压信号，K+和K-别为神经元节点对应的正负卷积核值，b为卷积层网络对应的偏置项，f(.)为激活函数；

所述卷积层电路单元将卷积运算结果传入池化层电路单元；

所述激活函数将卷积运算结果进行激活并得到y和-y两个相反输出值，同时将y和-y两个相反输出值转换成电压脉冲信号以便作为池化层电路单元的输入。

可选地，所述池化层电路单元分为平均池化操作和最大池化操作，由忆阻阵列构成的池化操作电路和电压转换子单元组成；

池化操作电路对应的忆阻阵列存储的网络卷积核值在训练过程中保持不变，其电路结构和卷积核的映射分布和卷积层电路单元一样，只是存储的卷积核值改变；

所述电压转换子单元将池化操作电路的结果转换成h和-h两个相反电压脉冲信号以便作为全连接层电路单元的输入。

可选地，所述全连接层电路单元实现分类的功能，由忆阻阵列构成的全连接层电路和softmax函数部分组成，全连接层电路单元与卷积层电路单元的权重映射方法不同；

所述全连接层电路用于存储与计算权重矩阵，只完成一系列乘法加法运算，没有权重矩阵的平移，利用两个忆阻器件作为一个突触实现正负权重值，所述忆阻器件的一端连接池化层电路单元，另一端连接softmax函数，收集同一列的电流即该层的输出结果，输出结果

公式中，h _k为第k个神经元节点的前端突触输入电压脉冲信号，

和

分别为忆阻器存储的第l个神经元节点的第k个输入的正负突触权重值，则突触的有效权重值为

即可实现正负突触权重值，b _k为第k个神经元节点对应的偏置项，m _l表示经过全连接层电路操作输出的第l个元素，

为所有输出信号元素的指数和，z _l为信号m _l经过softmax函数后对应的概率输出值；

所述softmax函数实现

即将全连接层输出的值归一化为概率值的功能，然后将结果传入所述输出模块即得到整个卷积神经网络的输出，并将结果发送给所述权重更新模块。

可选地，所述权重更新模块包括结果比较单元、计算单元和驱动单元；

所述结果比较单元分别连接所述输出模块与所述计算单元，所述结果比较单元将当前卷积神经网络模块的输出结果与预设理想结果进行比较，并将比较结果发送到所述计算单元；

所述计算单元分别连接所述结果比较单元与所述驱动单元，所述计算单元接受所述结果比较单元发送的误差信号δ，根据设定的神经网络反向传播算法计算网络卷积核值或权重值的调整量，并将结果发送至驱动单元；所述驱动单元包括脉冲发生器和读写电路，驱动单元接收所述计算单元发送的卷积核值或权重值的调整量，对卷积层电路单元和全连接层电路单元的忆阻器件电导进行调整，脉冲发生器用于产生调整忆阻器件的电导调制信号；所述读写电路完成对基于忆阻器件的卷积神经网络模块的网络卷积核值或突触权重值的读写操作。

总体而言，通过本发明所构思的以上技术方案与现有技术相比，具有以下有益效果：

本发明提供的基于非易失存储器的卷积神经网络片上学习系统，输入模块接受外部信息并转换成电压脉冲信号，该信号经过卷积神经网络模块中的卷积层，池化层以及全连接层逐层运算后传入输出模块，并发送给权重更新模块，权重更新模块根据输出模块的结果来计算和调整忆阻器件的电导值，实现网络卷积核值或突触权重值的更新。在卷积神经网络模块采用忆阻器件的电导值随着施加电信号进行改变的多阶电导调控特性来模拟卷积核值和突触权重值的连续调节，在卷积层和池化层采用两行忆阻阵列作为一个卷积核来实现正负卷积核功能，在全连接层利用两个忆阻器件作为一个突触实现正负权重值。在卷积神经网络中卷积运算是最耗时的计算部分，本发明采用忆阻器件实现卷积神经网络运算，采用其高度并行性可以很大程度使整个系统的运算速度与密度有很大提高，运行能耗则大幅降低，可以实现信息存储和计算的融合，同时实现卷积神经网络的片上学习，有望实现对大脑规模神经网络的实时与低能耗模拟，解决传统冯诺依曼体系架构的大脑计算结构的缺点。

[附图说明]

图1为本发明实施例提供的基于非易失存储器的卷积神经网络片上学习系统结构示意图；

图2为本发明实施例提供的矩阵卷积运算原理示意图；

图3为本发明实施例提供的忆阻器件单元示意图；

图4为本发明实施例提供的由忆阻器件阵列作为卷积核构成的卷积层电路模块结构示意图；

图5为本发明实施例提供的卷积核矩阵和输入矩阵的映射公式示意图，图5(a)为卷积核矩阵K如何转换成矩阵K+和K-映射公式示意图；图5(b)为输入矩阵X如何转换为两个一维矩阵X和-X映射公式示意图；

图6为本发明实施例提供的由忆阻器件阵列作为卷积核构成的池化层电路模块结构示意图；

图7为本发明实施例提供的由忆阻器件作为突触构成的全连接层电路模块结构示意图；

图8为本发明实施例提供的权重矩阵映射公式示意图；

图9为本发明实施例提供的权重更新模块示意图；

图10为本发明实施例提供的权重更新阶段卷积层电路模块忆阻阵列操作的电路原理图示意图。

[具体实施方式]

为了使本发明的目的、技术方案及优点更加清楚明白，以下结合附图及实施例，对本发明进行进一步详细说明。应当理解，此处所描述的具体实施例仅仅用以解释本发明，并不用于限定本发明。此外，下面所描述的本发明各个实施方式中所涉及到的技术特征只要彼此之间未构成冲突就可以相互组合。

卷积神经网络的片上学习不仅可以克服设备可变性的影响，而且更符合生物学上的学习特征，还可以根据所要执行的任务进行权重修改，具有很好的灵活性。所以实现卷积神经网络的硬件化、存储和计算的融合以及片上学习很有必要。

本发明提供一种基于非易失存储器的卷积神经网络片上学习系统，包括：输入模块、卷积神经网络模块、输出模块以及权重更新模块，所述卷积神经网络模块的片上学习利用忆阻器件的电导随着施加脉冲进行改变的模拟电导调制特性实现突触功能，卷积核值或突触权重值储存在忆阻器件单元中。

所述输入模块将输入信号转换成卷积神经网络所需的输入电压脉冲信号，并将结果传入所述卷积神经网络模块；所述卷积神经网络模块将输入信号对应的输入电压脉冲信号经过逐层计算转换，并将结果传入输出模块得到整个网络的输出；所述输出模块分别连接所述卷积神经网络模块与所述权重更新模块，用于将所述卷积神经网络模块产生的输出信号转换并发送给所述权重更新模块；所述权重更新模块根据输出模块的结果来计算和调整忆阻器件的电导值，实现网络卷积核值或突触权重值的更新。

可选地，所述输入模块将外界输入信号转换成所述卷积神经网络所需的电压信号，输入信号与电压脉冲信号的脉冲宽度或脉冲幅度遵循正比例关系，输入信号值越大，所对应电压脉冲信号的脉冲宽度(或脉冲幅度)就越宽(越大)，反之，所对应电压信号就越窄(越小)，且应小于忆阻器的擦写电压。

可选地，所述卷积神经网络模块采用忆阻器件来模拟卷积核值和突触权重值，所述忆阻器件的电阻随着施加电信号进行改变。所述卷积神经网络模块包括：由忆阻器件阵列作为卷积核构成的卷积层电路模块和池化层电路模块，以及由忆阻器件作为突触构成的全连接层电路模块；所述卷积层电路模块接收输入模块输出的输入电压脉冲信号，输入电压脉冲信号经过所述卷积层电路模块、池化层电路模块，以及全连接层电路模块逐层计算转换，并将计算结果发送至所述输出模块。

可选地，所述由忆阻器件阵列作为卷积核构成的卷积层电路模块，由忆阻阵列构成的卷积运算电路和激活函数部分组成。由于在生物神经系统中权重值有正有负，所以电路采用两行忆阻阵列作为一个卷积核来实现正负卷积核值。同时，为了能一步得到全部卷积运算结果而不需要中间复杂的存储层，初始卷积核值与忆阻电导值对应时，卷积核值被映射成可以与整个输入信号进行矩阵乘法运算的矩阵，卷积核被扩展为两个大型稀疏矩阵K+和K-，相应地利用忆阻器件可以施加正负读取电压脉冲的特性将输入信号转换为正输入X和负输入-X两个一维矩阵。所述卷积运算电路将输入电压脉冲信号与存储在忆阻器单元中的卷积核值进行卷积运算，收集同一列的电流即得到卷积运算结果。卷积运算过程为

其中，

为卷积运算符号，X为神经元节点的前端突触输入电压信号，k+和K-别为神经元节点对应的正负卷积核值，则有效的卷积核值为(K+)-(K-)，即可实现正值和负值的卷积核值，b为卷积层网络对应的偏置项，f(.)为激活函数。然后，将输出结果传入池化层模块。所述激活函数f(.)主要有：sigmoid函数、tanh函数、ReLU函数、ELU函数以及PReLU函数，激活函数将卷积运算结果进行激活并得到y和-y两个相反输出值，同时将y和-y两个相反输出值转换成电压脉冲信号以便作为池化层的输入。

可选地，所述由忆阻器件阵列作为卷积核构成的池化层电路模块主要分为平均池化操作和最大池化操作，由忆阻阵列构成的池化操作电路和电压转换模块组成。池化操作是一个更简单的卷积操作，其忆阻阵列存储的卷积核值在训练过程中保持不变，其电路结构和卷积核的映射的分布和卷积层电路模块一样，只是存储的卷积核值的改变。同一行的忆阻器件一端连接在一起连接卷积层电路模块的输出，同一列的忆阻器件另一端连接在一起连接电压转换模块，所述电压转换模块将池化操作电路的结果转换成h和-h两个相反电压脉冲信号以便作为全连接层电路模块的输入。

可选地，所述由忆阻器阵列作为突触构成的全连接层电路模块实现分类的功能，由忆阻阵列构成的全连接层电路和softmax函数部分组成，由于全连接层中神经元与池化层中的神经元为全连接状态，所以全连接层电路模块其与卷积层电路模块的权重映射方法不同，所述全连接层电路用于存储与计算权重矩阵，只完成一系列乘法加法运算，没有权重矩阵的平移；利用两个忆阻器件作为一个突触实现正负权重值，所述忆阻器件一端连接池化层电路模块，另一端连接softmax函数，收集同一列的电流即的该层的输出结果，输出结果

和

为所有输出信号元素的指数和，z _l为信号m _l经过softmax函数后对应的概率输出值。所述softmax函数实现

即将全连接层输出的值归一化为概率值的功能，然后将结果传入所述输出模块即得到整个网络的输出，并将结果发送给所述权重更新模块。

可选地，所述权重更新模块包括结果比较模块、计算模块和驱动模块。所述结果比较模块分别连接所述输出模块与所述计算模块，所述结果比较模块将当前卷积神经网络模块的输出结果与理想结果进行比较，并将比较结果发送到所述计算模块；所述计算模块分别连接所述结果比较模块与所述驱动电路，所述计算模块接受所述结果比较模块发送的误差信号δ，根据设定的神经网络反向传播算法计算网络卷积核值或权重值的调整量，并将结果发送至驱动单元；所述驱动单元包括脉冲发生器和读写电路，驱动单元接收所述计算单元发送的卷积核值或权重值的调整量，对卷积层电路单元和全连接层电路单元的忆阻器件电导进行调整。脉冲发生器用于产生调整忆阻器件的电导调制信号。所述读写电路用于完成对基于忆阻器件的卷积神经网络模块的卷积核值或突触权重值的读写操作。

图1是本发明实施例提供的基于非易失存储器的卷积神经网络片上学习系统结构示意图。如图1所示，该系统包括：输入模块、卷积神经网络模块、输出模块以及权重更新模块。

输入模块将外界输入信号转换成所述卷积神经网络所需的电压信号，输入信号与电压脉冲信号的脉冲宽度或脉冲幅度遵循正比例关系，输入信号值越大，所对应电压脉冲信号的脉冲宽度(或脉冲幅度)就越宽(越大)，反之，所对应电压信号就越窄(越小)，并将电压信号传入卷积神经网络模块。

卷积神经网络模块将输入信号对应的输入电压脉冲信号经过逐层计算转换，并将结果传入输出模块得到整个网络的输出。

输出模块分别连接所述卷积神经网络模块与所述权重更新模块，用于将所述卷积神经网络模块产生的输出信号转换并发送给所述权重更新模块。

权重更新模块根据输出模块的结果来计算和调整忆阻器件的电导值，实现网络卷积核值或突触权重值的更新。

需要说明的是，卷积神经网络中卷积运算是最重要以及计算量最大的部分，作为一种广义的积分概念，卷积运算在图像识别以及数字信号处理方面有很重要的应用。卷积运算是指从输入矩阵的左上角开始，开一个与模板(即卷积核)同样大小的活动窗口，卷积核通常是一个四方形的网格结构，该区域上每个方格都有一个权重值。首先将卷积核进行180°反转，窗口矩阵与卷积核元素对应起来相乘再相加，并用计算结果代替窗口中心的元素。然后，活动窗口向右移动一列，并作同样的运算。以此类推，从左到右、从上到下，直到矩阵被卷积核全部重叠过即可卷积后的新矩阵。当输入矩阵为m×m，卷积核矩阵大小为n×n时，相应的输出矩阵大小为(m-n+1)×(m-n+1)。图2演示了一个3×3的输入矩阵和一个2×2的卷积核进行卷积运算后得到2×2的输出矩阵的卷积计算过程。

图3是本发明实施例提供的忆阻器件单元示意图。作为非易失性器件，忆阻器件的读写速度、器件密度、编程电压等各项指标都可以与当今领先的存储技术媲美，能耗相当低。忆阻器件的模拟记忆功能类似于生物突触，其电导可以通过施加相对较大的电压偏置而连续改变，但在施加较小的偏压或无偏压时保持不变。通过利用忆阻器件的不同电导值来区分不同的存储状态，忆阻器件这一脉冲作用下电导渐变特性用于模拟生物突触权重的变化过程，即模拟神经网络自适应学习的功能。忆阻器件的类型可以为两端、三端忆阻器件或其他常见的类型。并且可以施加正负读取电压脉冲，这一特性可以在实现正负权重值时避免额外的减法电路的引入，在一定程度上减小了电路规模。

图4是本发明提供的由忆阻器件阵列作为卷积核构成的卷积层电路模块结构示意图，由忆阻阵列构成的卷积运算电路和激活函数部分组成。图中示出了采用

大小输入信号矩阵，卷积核大小为n×n，输出矩阵大小为

的卷积运算电路。同一行的忆阻器件一端连接在一起连接输入模块，同一列的忆阻器件另一端连接在一起连接激活函数f(.)，由于在生物神经系统中权重值有正有负，所以电路采用两行忆阻阵列作为一个卷积核来实现正负卷积核值，同时，在卷积层中卷积核是共享的，需要利用同一个卷积核不断对输入矩阵进行扫描，直到输入矩阵中的元素全被卷积核矩阵覆盖过，得到一系列卷积运算结果，为了能一步得到全部卷积运算结果而不需要中间复杂的存储层，初始卷积核值与忆阻电导值对应时，卷积核值被映射成可以与整个输入信号进行矩阵乘法运算的矩阵，卷积核被扩展为两个大型稀疏矩阵K+和K-，相应地利用忆阻器件可以施加正负读取电压脉冲的特性将输入信号转换为正输入X和负输入-X两个一维矩阵。所以我们需要的忆阻阵列大小为(2×i+1)×j。卷积运算电路将输入电压脉冲信号与存储在忆阻器单元中的卷积核值进行卷积运算，收集同一列的电流即得到卷积运算结果。卷积运算过程为

其中，y为卷积运算结果，

为卷积运算符号，X为神经元节点的前端突触输入电压信号，K+和K-别为神经元节点对应的正负卷积核值，则有效的卷积核值为(K+)-(K-)，即可实现正值和负值的卷积核值，b为卷积层网络对应的偏置项，f(.)为激活函数。其中，图4中X _i表示输入电压信号，X _b表示偏置项的输入电压信号。

然后，将输出结果传入池化层模块。激活函数f(.)主要有：sigmoid函数、tanh函数、ReLU函数、ELU函数以及PReLU函数，激活函数将卷积运算结果进行激活并得到y和-y两个相反输出值，同时将y和-y两个相反输出值转换成电压脉冲信号以便作为池化层的输入。以下我们以2×2卷积核矩阵K和3×3的输入信号矩阵X为实施例来演示如何将卷积核扩展为大型稀疏矩阵K+和K-以及输入矩阵如何转换成正输入X和负输入-X两个一维矩阵。

图5(a)显示了使用所提出的方法基于忆阻阵列的卷积核矩阵K如何转换成矩阵K+和K-。卷积核首先旋转180°然后被转换为两个矩阵，对应矩阵元素为0的忆阻器为未forming状态，在学习过程中始终保持高阻状态，因此忆阻阵列可以很容易地解释具有正值和负值的卷积核。由于输入信号矩阵X有9个元素，每个卷积核矩阵K+和K-必须有9行。

图5(b)显示了输入矩阵X如何转换为两个一维矩阵X和-X，分别乘以K+和K-。由于K的尺寸为2×2，X的尺寸为3×3，所以输出特征的尺寸为2×2。因此，卷积核矩阵必须4列，每个输出值对应一列。

图6是本发明实施例提供的由忆阻器件阵列作为卷积核构成的池化层电路模块结构示意图，主要分为平均池化操作和最大池化操作。整个输入矩阵被不重叠的分割成若干个同样大小的小块，每个小块内只取最大值或平均值，再舍弃其他节点后，保持原有的平面结构得到输出。池化操作可以非常有效地缩小矩阵尺寸，从而减少最后全连接层中的参数，同时，使用池化层既可以加快计算速度也有防止过拟合问题的作用。池化层电路模块分别连接卷积层电路模块和全连接层电路模块，池化操作是一个更简单的卷积操作，其忆阻阵列存储的卷积核值在训练过程中保持不变，其电路结构和卷积核的映射的分布和卷积层电路模块一样，只是存储的卷积核值的改变。同一行的忆阻器件一端连接在一起连接卷积层电路模块的输出，同一列的忆阻器件另一端连接在一起连接电压转换模块，电压转换模块输出端连接到全连接层电路模块。同一列上的电流汇集在一起实现加法计算，收集电压转换器输出端的结果即得到池化操作的结果。电压转换模块将池化操作电路的结果转换成h和-h两个相反电压脉冲信号以便作为全连接层电路模块的输入。本实施例中使用2×2矩阵大小的池化操作，由于卷积层电路模块的输出矩阵为

则输出矩阵为

所以池化层电路模块忆阻阵列大小为(2×j+1)×k。池化操作处理后将结果传入全连接层电路模块，其中，图6中h _k表示池化操作结果，y _j表示卷积层单元的输出结果。

图7是本发明实施例提供的由忆阻器件作为突触构成的全连接层电路模块结构示意图，分别连接池化层电路模块和输出模块，全连接层电路模块将最后的输出映射到线性可分的空间，即实现分类的功能，由忆阻阵列构成的全连接层电路和softmax函数部分组成，由于全连接层完成在感知器网络中简单的一系列乘法加法运算，其神经元与池化层中的神经元为全连接状态，所以全连接层电路模块其与卷积层电路模块的权重映射方法不同，全连接层电路用于存储与计算权重矩阵，卷积运算电路用于存储与计算一组卷积核数组。同样，利用两个忆阻器件作为一个突触实现正负权重值，同一行的忆阻器件一端连接在一起连接池化层电路模块的输出，同一列的忆阻器件另一端连接在一起连接softmax函数，收集同一列的电流即的该层的输出结果，输出结果

和

即将全连接层输出的值归一化为概率值的功能。由于池化层输出矩阵大小为

如果最后的分类类别有l类，则本实施例中全连接层电路忆阻阵列大小为(2×k+1)×l。然后将结果传入所述输出模块即得到整个网络的输出，并将结果发送给所述权重更新模块。其中，图7中h _b表示偏置项对应的输入信号。以下我们以3×3的权重矩阵为实施例来演示如何将权重矩阵映射成两个矩阵W+和W-。

图8显示了使用所提出的方法基于忆阻阵列3×3的权重矩阵W如何转换成两个一维矩阵W+和W-，两个矩阵中对应矩阵元素为0的忆阻器为未forming状态，在学习过程中始终保持高阻状态，因此忆阻阵列可以很容易地解释具有正值和负值的权重值。

图9为本发明实施例提供的权重更新模块示意图，分别连接输出模块和卷积神经网络模块，包括：结果比较单元、计算单元和驱动单元。结果比较单元分别连接输出单元与计算单元，结果比较单元将当前卷积神经网络模块的输出结果与理想结果进行比较，并将比较结果δ发送到计算单元；计算单元分别连接结果比较单元与驱动单元，计算单元接受所述结果比较单元发送的误差信号δ，根据设定的神经网络反向传播算法计算网络卷积核值或权重值的调整量Δ，并将结果发送至驱动单元；所述驱动单元包括脉冲发生器和读写电路，驱动单元接收所述计算单元发送的卷积核值或权重值的调整量，对卷积层电路单元和全连接层电路单元的忆阻器件电导进行调整。脉冲发生器用于产生调整忆阻器件的电导调制信号。读写电路用于完成对基于忆阻器件的卷积神经网络模块的卷积核值或连接权重的读写操作。以下我们以卷积层电路模块的操作为实施例来演示忆阻阵列作为卷积核其卷积核值在学习过程如何进行更新。

图10为本发明实施例提供的权重更新阶段卷积层电路模块忆阻阵列操作的电路原理图示意图，首先选择阵列中的某一列对忆阻器电导值进行调整，该列忆阻器的列线接地，行线分别施加不同的电导调整电压脉冲信号，所施加的电压脉冲信号幅值一定，脉冲个数正比于卷积核值或突触权重值的调整量Δ，从而实现卷积核值或突触权重值的更新。以此类推到其他列，实现对整个阵列的忆阻器电导的调整。全连接层电路模块中的权重更新与此类似。

本领域的技术人员容易理解，以上所述仅为本发明的较佳实施例而已，并不用以限制本发明，凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等，均应包含在本发明的保护范围之内。

Claims

一种基于非易失存储器的卷积神经网络片上学习系统，其特征在于，包括：输入模块、卷积神经网络模块、输出模块以及权重更新模块；

所述输入模块将输入信号转换成卷积神经网络模块所需的输入电压脉冲信号后传入所述卷积神经网络模块；

所述卷积神经网络模块对输入信号对应的输入电压脉冲信号经过逐层计算转换以完成片上学习得到输出信号，其利用忆阻器件的电导随着施加脉冲进行改变的电导调制特性实现突触功能，片上学习过程中用到的网络卷积核值或突触权重值储存在忆阻器件中；

所述输出模块将所述卷积神经网络模块产生的输出信号转换并发送给所述权重更新模块；

所述权重更新模块根据输出模块的结果来计算误差信号和调整忆阻器件的电导值，实现网络卷积核值或突触权重值的更新。
根据权利要求1所述的基于非易失存储器的卷积神经网络片上学习系统，其特征在于，所述输入模块将外界输入信号转换成所述卷积神经网络所需的输入电压脉冲信号，输入信号与输入电压脉冲信号的脉冲宽度或脉冲幅度遵循正比例关系，且所述输入电压脉冲信号应小于忆阻器的擦写电压。
根据权利要求1所述的基于非易失存储器的卷积神经网络片上学习系统，其特征在于，所述卷积神经网络模块采用忆阻器件来模拟网络卷积核值和突触权重值，所述忆阻器件的电阻随着施加电信号进行改变；

所述卷积神经网络模块包括：由忆阻器阵列作为卷积核构成的卷积层电路单元和池化层电路单元，以及由忆阻器阵列作为突触构成的全连接层电路单元；

所述卷积层电路单元接收输入模块输出的输入电压脉冲信号，输入电压脉冲信号经过所述卷积层电路单元、池化层电路单元，以及全连接层电路单元逐层计算转换，并将计算结果作为输出信号发送至所述输出模块。
根据权利要求3所述的基于非易失存储器的卷积神经网络片上学习系统，其特征在于，所述卷积层电路单元由忆阻阵列构成的卷积运算电路和激活函数部分组成；

所述卷积运算电路采用两行忆阻阵列作为一个卷积核来实现正负卷积核值，初始卷积核值与忆阻电导值对应时，卷积核值被映射成可以与整个输入信号进行矩阵乘法运算的矩阵，卷积核被扩展为两个大型稀疏矩阵K+和K-，分别为神经元节点对应的正负卷积核值，相应地利用忆阻器件可以施加正负读取电压脉冲的特性将输入信号转换为正输入X和负输入-X两个一维矩阵；

所述卷积运算电路将输入电压脉冲信号与存储在忆阻器单元中的卷积核值进行卷积运算，收集同一列的电流即得到卷积运算结果，卷积运算过程为
其中，y为卷积运算结果，
为卷积运算符号，X为神经元节点的前端突触输入电压信号，K+和K-别为神经元节点对应的正负卷积核值，b为卷积层网络对应的偏置项，f(.)为激活函数；

所述卷积层电路单元将卷积运算结果传入池化层电路单元；

所述激活函数将卷积运算结果进行激活并得到y和-y两个相反输出值，同时将y和-y两个相反输出值转换成电压脉冲信号以便作为池化层电路单元的输入。
根据权利要求3所述的基于非易失存储器的卷积神经网络片上学习系统，其特征在于，所述池化层电路单元分为平均池化操作和最大池化操作，由忆阻阵列构成的池化操作电路和电压转换子单元组成；

池化操作电路对应的忆阻阵列存储的网络卷积核值在训练过程中保持不变，其电路结构和卷积核的映射分布和卷积层电路单元一样，只是存储的卷积核值改变；

所述电压转换子单元将池化操作电路的结果转换成h和-h两个相反电压脉冲信号以便作为全连接层电路单元的输入。
根据权利要求4所述的基于非易失存储器的卷积神经网络片上学习系统，其特征在于，所述全连接层电路单元实现分类的功能，由忆阻阵列构成的全连接层电路和softmax函数部分组成，全连接层电路单元与卷积层电路单元的权重映射方法不同；

所述全连接层电路用于存储与计算权重矩阵，只完成一系列乘法加法运算，没有权重矩阵的平移，利用两个忆阻器件作为一个突触实现正负权重值，所述忆阻器件的一端连接池化层电路单元，另一端连接softmax函数，收集同一列的电流即该层的输出结果，输出结果

公式中，h _k为第k个神经元节点的前端突触输入电压脉冲信号，
和
分别为忆阻器存储的第l个神经元节点的第k个输入的正负突触权重值，则突触的有效权重值为
即可实现正负突触权重值，b _k为第k个神经元节点对应的偏置项，m _l表示经过全连接层电路操作输出的第l个元素，
为所有输出信号元素的指数和，z _l为信号m _l经过softmax函数后对应的概率输出值；

所述softmax函数实现
即将全连接层输出的值归一化为概率值的功能，然后将结果传入所述输出模块即得到整个卷积神经网络的输出，并将结果发送给所述权重更新模块。
根据权利要求1所述的基于非易失存储器的卷积神经网络片上学习系统，其特征在于，所述权重更新模块包括结果比较单元、计算单元和驱动单元；

所述结果比较单元分别连接所述输出模块与所述计算单元，所述结果比较单元将当前卷积神经网络模块的输出结果与预设理想结果进行比较，并将比较结果发送到所述计算单元；

所述计算单元分别连接所述结果比较单元与所述驱动单元，所述计算单元接受所述结果比较单元发送的误差信号δ，根据设定的神经网络反向传播算法计算网络卷积核值或权重值的调整量，并将结果发送至驱动单元；所述驱动单元包括脉冲发生器和读写电路，驱动单元接收所述计算单元发送的卷积核值或权重值的调整量，对卷积层电路单元和全连接层电路单元的忆阻器件电导进行调整，脉冲发生器用于产生调整忆阻器件的电导调制信号；所述读写电路完成对基于忆阻器件的卷积神经网络模块的网络卷积核值或突触权重值的读写操作。