CN104376362A - 用于人工神经网络的突触器件和人工神经网络 - Google Patents
用于人工神经网络的突触器件和人工神经网络 Download PDFInfo
- Publication number
- CN104376362A CN104376362A CN201410673774.0A CN201410673774A CN104376362A CN 104376362 A CN104376362 A CN 104376362A CN 201410673774 A CN201410673774 A CN 201410673774A CN 104376362 A CN104376362 A CN 104376362A
- Authority
- CN
- China
- Prior art keywords
- cynapse
- diode
- neural network
- cynapse device
- artificial neural
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Landscapes
- Semiconductor Memories (AREA)
- Logic Circuits (AREA)
Abstract
本发明提供了一种用于人工神经网络的突触器件,所述人工神经网络包括多个神经元,所述多个神经元之间通过突触器件阵列相互连接,所述突触器件阵列包括多个突触器件,所述突触器件包括:两个、三个或更多个并联连接的突触单元。本发明还提供了一种包括这种突触器件的人工神经网络。
Description
技术领域
本发明涉及用于人工神经网络的突触器件和人工神经网络。
背景技术
人工神经网络是一种模仿生物神经网络的装置,其应用机器学习算法,可以用于完成对各类信息如图像、声音的识别、分类等任务。一般而言,一个人工神经网络可以包括多个神经元和用于将神经元彼此互连的突触器件的阵列。作为示例,图1示意性示出了神经元1和与之相连的两个突触(synapse)器件W1和W2。分别经由突触器件W1和W2与神经元1相连的另外两个神经元(未示出)对神经元1的激励信号用X1和X2表示。神经元1例如可以用传统的CMOS电路实现。突触器件W1和W2例如可以由阻变器件(RRAM)实现。更具体地,突触器件W1和W2例如可以由基于金属氧化物的阻变器件(TMO-RRAM)实现。
在人工神经网络完成某个特定任务之前,需要进行训练,即通过重置(RESET)操作改变与一个神经元相连的突触器件的RRAM的电阻值,使得它对某个特定类型的输入敏感。图2示意性示出了对与神经元1相连的一个突触器件Wi进行训练的电路示意图。如图所示,重置电压V被施加到突触器件Wi,以改变突触器件Wi的RRAM的电阻值。然而,在低功耗工作区中,RRAM的电参数(例如电阻值)具有相当大的涨落。即使对于处于同一状态的RRAM,在施加相同的重置电压后,它们的电参数的变化也可能具有很大差异。这会影响人工神经网络训练的可靠性,从而降低人工神经网络在工作时的正确率。
发明内容
为解决现有技术中的至少一个问题而提出本发明。
本发明的一个方面提供了一种用于人工神经网络的突触器件,所述人工神经网络包括多个神经元,所述多个神经元之间通过突触器件阵列相互连接,所述突触器件阵列包括多个突触器件,所述突触器件包括:两个、三个或更多个并联连接的突触单元。
可选地,每个突触单元由阻变器件构成。
可选地,每个突触单元包括串联连接的阻变器件和整流器件。
可选地,所述整流器件是二极管;并且/或者所述阻变器件是基于金属氧化物的阻变器件TMO-RRAM。
可选地,当整流器件是二极管时:所述二极管的参数是基于所述突触器件的重置电压V确定的;或者所述突触器件的重置电压V是根据所述二极管的参数确定的,其中:所述二极管的参数包括二极管的反向饱和电流Is、阈值电压VT和理想因子η;并且在人工神经网络的训练期间,通过在所述突触器件上施加所述重置电压来使得所述突触器件对特定类型的输入敏感。
可选地,所述突触器件的重置电压是根据该突触器件中的二极管的平均参数值确定的。
可选地,该突触器件满足以下关系式:
其中,y=W(x)是乘积对数函数,即方程x=yey的解,I是流过所述二极管和与所述二极管串联的阻变器件的电流,R是与所述二极管串联的阻变器件的电阻值。
可选地,所述突触器件的重置电压V、所述二极管的反向饱和电流Is、阈值电压VT和理想因子η被确定为使得电流I与电阻值R的对数logR成近似线性关系。
可选地,当电流I与电阻值R的对数logR成近似线性关系时,电流I与电阻值R的对数logR的线性拟合的相关系数尽可能接近1。
本发明的另一方面提供了一种人工神经网络,包括多个神经元,所述多个神经元之间通过突触器件阵列相互连接,所述突触器件阵列包括多个如上所述的突触器件。
附图说明
参考附图并结合以下详细说明,可以更加清楚本发明的上述和其他优点。附图意在说明而非限制本发明。在附图中,相同或相似的部件由相同或相似的附图标记表示。
图1示意性示出了人工神经网络中的一个神经元和与之相连的两个突触器件;
图2示意性示出了对与神经元相连的一个突触器件进行训练的电路示意图;
图3示意性示出了根据本发明实施例的突触器件及对其进行训练时的电路连接示意图;
图4示意性示出了通过选择二极管参数和重置电压,来实现流过二极管的电流和与其串联的RRAM器件的电阻对数值之间的近似线性关系;
图5示意性示出了根据本发明另一实施例的突触器件及对其进行训练时的电路连接示意图;以及
图6示意性示出了包括根据本发明实施例的突触器件的人工神经网络的系统仿真结果。
具体实施方式
以下参考附图描述本发明的优选实施方式。应当理解,以下实施方式是示例性而非穷举性的,其仅用于说明本发明的原理,而并非意在限制本发明的范围。
图3示意性示出了根据本发明实施例的突触器件Wi’及对其进行训练时的电路连接示意图。该突触器件Wi’的一端连接到重置电压V,另一端连接到神经元1。如图3所示,该突触器件Wi’包括并联连接的两个突触单元U1和U2。突触单元U1包括串联连接的第一RRAM阻变器件R1和第一整流器件D1,突触单元U2包括串联连接的第二RRAM阻变器件R2和第二整流器件D2。该RRAM阻变器件例如可以利用基于金属氧化物的阻变器件TMO-RRAM来实现。电路中的整流器件可以由二极管实现。
在该实施例中,为了抑制RRAM器件的电参数(例如电阻值)涨落对突触器件的不利影响,利用两个RRAM器件共同实现一个突触器件,以起到取平均的效果。
作为图3所示实施例的替代实施方式,可以将单个RRAM器件改成并联的两个RRAM器件,而省略图中所示的整流器件,则该并联的两个RRAM器件的电导值是这两个RRAM器件电导值的算术平均值。
但是,由于RRAM器件阻值的变化幅度呈指数依赖关系,通过将二极管与RRAM器件串联来对RRAM器件的电导值进行几何平均,则可以更有效抑制单个RRAM器件的电参数涨落的影响,极大地提高人工神经网络工作的正确率。
通过适当地选择二极管参数或重置电压V可以实现良好的几何平均效果。以突触单元U1为例,记二极管D1的反向饱和电流为Is,阈值电压为VT,理想因子为η。当RRAM器件R1的阻值为R时,如果在突触器件Wi’的两端加上一个固定的重置电压V,则流过RRAM器件R1和二极管D1的电流I满足方程:
从上面的方程中可以解得
其中,y=W(x)是乘积对数函数,即方程x=yey的解。
基于上式,当重置电压V一定时,可以通过选择适当的二极管参数,即反向饱和电流Is、阈值电压VT和理想因子η,来保证电流I与电阻值的对数logR成近似的线性关系,例如,当对电流I和电阻值的对数logR进行线性拟合时,使相关系数尽可能接近1。例如,如图4所示,如果重置电压V固定为0.23V,则可以通过选取二极管D1的参数为Is=10-9A,VT=26mV,η=0.8,来实现这种近似的线性关系。以类似的方式选择二极管D2的参数。这样,二极管D1将和它串联的RRAM器件R1的阻值以电流的形式近似地转换成其对数,并且二极管D2将和它串联的RRAM器件R2的阻值以电流的形式近似地转换成其对数。以此方式,各并联的突触单元U1和U2中的电流同时流入神经元1,相当于实现了对突触器件Wi’中的RRAM器件R1和R2的电导值进行几何平均的作用,从而有效地抑制突触器件的电参数涨落对人工神经网络性能的不利影响。
可替换地,当二极管D1和D2的参数,即反向饱和电流Is、阈值电压VT和理想因子η一定时,可以通过选择适当的重置电压V,来保证电流I与电阻值的对数logR成近似的线性关系,例如,当对电流I和电阻值的对数logR进行线性拟合时,使相关系数尽可能接近1。例如,如图4所示,如果二极管D1和/或D2的参数为Is=10-9A,VT=26mV,η=0.8,则只要选取重置电压V为0.23V,即可实现这种近似的线性关系。对于其他可能的二极管参数,只要通过计算上式就可以找到最优的重置电压。由于突触器件Wi’中的两个二极管D1和D2的参数可能有所不同,可以使用二极管D1和D2的平均参数值来计算重置电压V。这样,二极管D1将和它串联的RRAM器件R1的阻值以电流的形式近似地转换成其对数,并且二极管D2将和它串联的RRAM器件R2的阻值以电流的形式近似地转换成其对数。以此方式,各并联的突触单元U1和U2中的电流同时流入神经元1,相当于实现了对突触器件Wi’中的RRAM器件R1和R2的电导值进行几伺平均的作用,从而有效地抑制突触器件的电参数涨落对人工神经网络性能的不利影响。
图5示意性示出了根据本发明另一实施例的突触器件Wi”及对其进行训练时的电路连接示意图。该突触器件Wi”的一端连接到重置电压V,另一端连接到神经元1。如图5所示,该突触器件Wi”包括并联连接的n(n≥3)个突触单元U1、U2、……Un。突触单元Ui(1≤i≤n)包括串联连接的第i阻变器件Ri和第i整流器件Di。该阻变器件例如可以利用基于金属氧化物的阻变器件TMO-RRAM来实现。电路中的整流器件可以由二极管实现。
与参考图3描述的实施例类似地,通过适当地选择二极管参数或重置电压V来实现良好的几何平均效果。以突触单元Ui为例,记第i二极管Di的反向饱和电流为Is,阈值电压为VT,理想因子为η。当第i个RRAM器件Ri的阻值为R时,如果在突触器件Wi”的两端加上一个固定的重置电压V,则流过RRAM器件Ri和二极管Di的电流I满足方程:
从上面的方程中可以解得
其中,y=W(x)是乘积对数函数,即方程x=yey的解。
基于上式,当重置电压V一定时,可以通过选择适当的二极管参数,即反向饱和电流Is、阈值电压VT和理想因子η,来保证电流I与电阻值的对数logR成近似的线性关系,例如,当对电流I和电阻值的对数logR进行线性拟合时,使相关系数尽可能接近1。这样,二极管Di将和它串联的RRAM器件Ri的阻值以电流的形式近似地转换成其对数。以此方式,各并联的突触单元Ui中的电流同时流入神经元1,相当于实现了对突触器件Wi”中的RRAM器件Ri的电导值进行几何平均的作用,从而有效地抑制突触器件的电参数涨落对人工神经网络性能的不利影响。
可替换地,当二极管Di的参数,即反向饱和电流Is、阈值电压VT和理想因子η一定时,可以通过选择适当的重置电压V,来保证电流I与RRAM器件Ri的电阻值的对数logR成近似的线性关系,例如,当对电流I和电阻值的对数logR进行线性拟合时,使相关系数尽可能接近1。由于不同二极管的参数可能有所不同,可以使用突触器件Wi”中的二极管Di的平均参数值来计算重置电压V。这样,二极管Di将和它串联的RRAM器件Ri的阻值以电流的形式近似地转换成其对数。以此方式,各并联的突触单元Ui中的电流同时流入神经元1,相当于实现了对突触器件Wi’中的RRAM器件Ri的电导值进行几何平均的作用,从而有效地抑制突触器件的电参数涨落对人工神经网络性能的不利影响。
作为图5所示实施例的替代实施方式,可以将单个RRAM器件改成并联的n(n≥3)个RRAM器件,而省略图中所示的整流器件,则该并联的n个RRAM器件的电导值是这n个RRAM器件电导值的算术平均值。
图6示意性示出了包括根据本发明实施例的突触器件的人工神经网络在用于图像识别时的系统仿真结果,其中突触器件包括三个并联的突触单元。在图6中,横轴代表了单个RRAM器件的电参数涨落的大小,纵轴代表了识别的正确率,正确率若为1代表完全识别,若为0.5则代表几乎无法识别。从图6的对比可以看到,如果RRAM器件的电参数涨落接近20%,则现有技术的人工神经网络几乎无法实现正确识别,而根据本发明的人工神经网络则即使在器件的电参数涨落很大的条件下,识别正确率受到的影响也很小。本发明利用二极管的非线性特性对RRAM器件的电参数涨落进行抑制,显著改善了神经网络电路的可靠性。本发明中的改进只需要增加很少的器件,从而很好地保持了低功耗、高密度等优势,同时又解决原先由单一RRAM形成突触器件的可靠性问题,满足了高性能人工神经网络对突触器件的要求。
以上参考具体实施例描述了本发明的原理。本领域技术人员可以理解,以上列举的各个细节仅用于说明而非限制本发明。本发明的保护范围由所附权利要求及其等同物限定。
Claims (10)
1.一种用于人工神经网络的突触器件,所述人工神经网络包括多个神经元,所述多个神经元之间通过突触器件阵列相互连接,所述突触器件阵列包括多个突触器件,所述突触器件包括:
两个、三个或更多个并联连接的突触单元。
2.根据权利要求1所述的突触器件,其中每个突触单元由阻变器件构成。
3.根据权利要求1所述的突触器件,其中每个突触单元包括串联连接的阻变器件和整流器件。
4.根据权利要求3所述的突触器件,其中:
所述整流器件是二极管;并且/或者
所述阻变器件是基于金属氧化物的阻变器件TMO-RRAM。
5.根据权利要求4所述的突触器件,其中,当整流器件是二极管时:
所述二极管的参数是基于所述突触器件的重置电压V确定的;或者
所述突触器件的重置电压V是根据所述二极管的参数确定的,
其中:
所述二极管的参数包括二极管的反向饱和电流Is、阈值电压VT和理想因子η;并且
在人工神经网络的训练期间,通过在所述突触器件上施加所述重置电压来使得所述突触器件对特定类型的输入敏感。
6.根据权利要求5所述的突触器件,其中所述突触器件的重置电压是根据该突触器件中的二极管的平均参数值确定的。
7.根据权利要求5或6所述的突触器件,其中满足以下关系式:
其中,y=W(x)是乘积对数函数,即方程x=yey的解,I是流过所述二极管和与所述二极管串联的阻变器件的电流,R是与所述二极管串联的阻变器件的电阻值。
8.根据权利要求7所述的突触器件,其中所述突触器件的重置电压V、所述二极管的反向饱和电流Is、阈值电压VT和理想因子η被确定为使得电流I与电阻值R的对数logR成近似线性关系。
9.根据权利要求8所述的突触器件,其中当电流I与电阻值R的对数logR成近似线性关系时,电流I与电阻值R的对数logR的线性拟合的相关系数尽可能接近1。
10.一种人工神经网络,包括多个神经元,所述多个神经元之间通过突触器件阵列相互连接,所述突触器件阵列包括多个根据权利要求1-6中任一项所述的突触器件。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201410673774.0A CN104376362B (zh) | 2014-11-21 | 2014-11-21 | 用于人工神经网络的突触器件和人工神经网络 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201410673774.0A CN104376362B (zh) | 2014-11-21 | 2014-11-21 | 用于人工神经网络的突触器件和人工神经网络 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN104376362A true CN104376362A (zh) | 2015-02-25 |
CN104376362B CN104376362B (zh) | 2017-10-03 |
Family
ID=52555258
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201410673774.0A Active CN104376362B (zh) | 2014-11-21 | 2014-11-21 | 用于人工神经网络的突触器件和人工神经网络 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN104376362B (zh) |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2018205533A1 (zh) * | 2017-05-09 | 2018-11-15 | 清华大学 | 电路结构及其驱动方法、神经网络 |
WO2018228424A1 (zh) * | 2017-06-16 | 2018-12-20 | 华为技术有限公司 | 一种神经网络训练方法和装置 |
CN109146070A (zh) * | 2017-06-16 | 2019-01-04 | 华为技术有限公司 | 一种支撑基于rram的神经网路训练的外围电路及系统 |
CN110111234A (zh) * | 2019-04-11 | 2019-08-09 | 上海集成电路研发中心有限公司 | 一种基于神经网络的图像处理系统架构 |
CN112543022A (zh) * | 2021-01-26 | 2021-03-23 | 兰州大学 | 一种基本逻辑运算单元电路 |
US11210581B2 (en) * | 2017-04-17 | 2021-12-28 | SK Hynix Inc. | Synapse and a synapse array |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5422982A (en) * | 1991-05-02 | 1995-06-06 | Dow Corning Corporation | Neural networks containing variable resistors as synapses |
CN102569334A (zh) * | 2010-12-22 | 2012-07-11 | 中国科学院微电子研究所 | 阻变随机存储装置及系统 |
CN103201610A (zh) * | 2010-10-29 | 2013-07-10 | 国际商业机器公司 | 带有使用模拟学习的突触权重的神经形态-突触器脉冲神经网络 |
CN103778468A (zh) * | 2014-01-16 | 2014-05-07 | 北京大学 | 一种基于rram的新型神经网络电路 |
-
2014
- 2014-11-21 CN CN201410673774.0A patent/CN104376362B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5422982A (en) * | 1991-05-02 | 1995-06-06 | Dow Corning Corporation | Neural networks containing variable resistors as synapses |
CN103201610A (zh) * | 2010-10-29 | 2013-07-10 | 国际商业机器公司 | 带有使用模拟学习的突触权重的神经形态-突触器脉冲神经网络 |
CN102569334A (zh) * | 2010-12-22 | 2012-07-11 | 中国科学院微电子研究所 | 阻变随机存储装置及系统 |
CN103778468A (zh) * | 2014-01-16 | 2014-05-07 | 北京大学 | 一种基于rram的新型神经网络电路 |
Cited By (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11210581B2 (en) * | 2017-04-17 | 2021-12-28 | SK Hynix Inc. | Synapse and a synapse array |
WO2018205533A1 (zh) * | 2017-05-09 | 2018-11-15 | 清华大学 | 电路结构及其驱动方法、神经网络 |
US11468300B2 (en) | 2017-05-09 | 2022-10-11 | Tsinghua University | Circuit structure and driving method thereof, neural network |
CN109146070B (zh) * | 2017-06-16 | 2021-10-22 | 华为技术有限公司 | 一种支撑基于rram的神经网络训练的外围电路及系统 |
CN109146073A (zh) * | 2017-06-16 | 2019-01-04 | 华为技术有限公司 | 一种神经网络训练方法和装置 |
CN109146070A (zh) * | 2017-06-16 | 2019-01-04 | 华为技术有限公司 | 一种支撑基于rram的神经网路训练的外围电路及系统 |
CN109146073B (zh) * | 2017-06-16 | 2022-05-24 | 华为技术有限公司 | 一种神经网络训练方法和装置 |
US11409438B2 (en) | 2017-06-16 | 2022-08-09 | Huawei Technologies Co., Ltd. | Peripheral circuit and system supporting RRAM-based neural network training |
WO2018228424A1 (zh) * | 2017-06-16 | 2018-12-20 | 华为技术有限公司 | 一种神经网络训练方法和装置 |
US11475300B2 (en) | 2017-06-16 | 2022-10-18 | Huawei Technologies Co., Ltd. | Neural network training method and apparatus |
CN110111234A (zh) * | 2019-04-11 | 2019-08-09 | 上海集成电路研发中心有限公司 | 一种基于神经网络的图像处理系统架构 |
CN110111234B (zh) * | 2019-04-11 | 2023-12-15 | 上海集成电路研发中心有限公司 | 一种基于神经网络的图像处理系统架构 |
CN112543022A (zh) * | 2021-01-26 | 2021-03-23 | 兰州大学 | 一种基本逻辑运算单元电路 |
Also Published As
Publication number | Publication date |
---|---|
CN104376362B (zh) | 2017-10-03 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN104376362A (zh) | 用于人工神经网络的突触器件和人工神经网络 | |
CN103778468B (zh) | 一种基于rram的新型神经网络电路 | |
Garbin et al. | Variability-tolerant convolutional neural network for pattern recognition applications based on OxRAM synapses | |
US10664727B2 (en) | Image pattern recognition device and recording medium | |
EP3121767A1 (en) | Methods and systems for implementing deep spiking neural networks | |
CN107564025A (zh) | 一种基于深度神经网络的电力设备红外图像语义分割方法 | |
WO2015065686A2 (en) | Methods and apparatus for tagging classes using supervised learning | |
Stewart et al. | A biologically realistic cleanup memory: Autoassociation in spiking neurons | |
CN103995237A (zh) | 一种卫星电源系统在线故障诊断方法 | |
Vazquez et al. | Integrate and fire neurons and their application in pattern recognition | |
Vazquez | Izhikevich neuron model and its application in pattern recognition | |
Tang et al. | Fully memristive spiking-neuron learning framework and its applications on pattern recognition and edge detection | |
Wilfred et al. | System identification using artificial neural network | |
KR20200000686A (ko) | 웨이트 행렬 입력 회로 및 웨이트 행렬 회로 | |
Jahidin et al. | Classification of intelligence quotient using EEG sub-band power ratio and ANN during mental task | |
Khond | Effect of data normalization on accuracy and error of fault classification for an electrical distribution system | |
Zhang et al. | The framework and memristive circuit design for multisensory mutual associative memory networks | |
Tokuyama et al. | The effect of using attribute information in network traffic prediction with deep learning | |
Erkaymaz et al. | Performance analysis of a feed-forward artifical neural network with small-world topology | |
Wang et al. | Incremental neural network construction for text classification | |
Roy et al. | Hardware efficient, neuromorphic dendritically enhanced readout for liquid state machines | |
CN112115908A (zh) | 一种社交能力评估方法及其装置 | |
CN116701880A (zh) | 时间序列数据预测方法、系统、设备及介质 | |
WO2008152908A1 (ja) | 抵抗素子、ニューロン素子、及びニューラルネットワーク情報処理装置 | |
Hsu | Existence and asymptotic behaviour of solutions of the very fast diffusion equation |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |