CN110674928A - 一种融合人工神经网络和神经形态计算的在线学习方法 - Google Patents
一种融合人工神经网络和神经形态计算的在线学习方法 Download PDFInfo
- Publication number
- CN110674928A CN110674928A CN201910880288.9A CN201910880288A CN110674928A CN 110674928 A CN110674928 A CN 110674928A CN 201910880288 A CN201910880288 A CN 201910880288A CN 110674928 A CN110674928 A CN 110674928A
- Authority
- CN
- China
- Prior art keywords
- snn
- neural network
- weight
- module
- learning
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000013528 artificial neural network Methods 0.000 title claims abstract description 102
- 238000000034 method Methods 0.000 title claims abstract description 14
- 238000004364 calculation method Methods 0.000 title claims abstract description 9
- 230000001537 neural effect Effects 0.000 title abstract description 5
- 230000000877 morphologic effect Effects 0.000 title description 3
- 238000012549 training Methods 0.000 claims description 26
- 238000012545 processing Methods 0.000 claims description 13
- 238000012937 correction Methods 0.000 claims description 12
- 230000004044 response Effects 0.000 claims description 8
- 238000010801 machine learning Methods 0.000 abstract description 3
- 210000002569 neuron Anatomy 0.000 description 8
- 239000011159 matrix material Substances 0.000 description 5
- 210000004556 brain Anatomy 0.000 description 4
- 230000008859 change Effects 0.000 description 3
- 230000015654 memory Effects 0.000 description 3
- 238000010586 diagram Methods 0.000 description 2
- 230000007246 mechanism Effects 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 238000012421 spiking Methods 0.000 description 2
- 230000007547 defect Effects 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/049—Temporal neural networks, e.g. delay elements, oscillating neurons or pulsed inputs
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/088—Non-supervised learning, e.g. competitive learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N5/00—Computing arrangements using knowledge-based models
- G06N5/04—Inference or reasoning models
- G06N5/046—Forward inferencing; Production systems
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Engineering & Computer Science (AREA)
- Software Systems (AREA)
- Mathematical Physics (AREA)
- Computational Linguistics (AREA)
- General Physics & Mathematics (AREA)
- Evolutionary Computation (AREA)
- Artificial Intelligence (AREA)
- Computing Systems (AREA)
- Molecular Biology (AREA)
- General Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Biophysics (AREA)
- Biomedical Technology (AREA)
- Health & Medical Sciences (AREA)
- Image Analysis (AREA)
Abstract
本发明公开了一种融合人工神经网络和神经形态计算的在线学习方法,属于机器学习领域,特别是涉及神经网络的学习领域。解决神经网络面对特征变化或者未知数据时正确率下降的问题,需要对神经网络进行在线学习。脉冲神经网络通常采用无监督学习,比起有监督学习,准确率较低,容易在学习错误之后一直向着错误的方向前进。人工神经网络通常采用有监督学习,准确率较高,但是推理和学习功耗较大。因此本专利中提出一种新的方案,使用人工神经网络辅助脉冲神经网络进行在线学习,由于大多数时间采用脉冲神经网络推理和无监督学习,因此功耗较低,同时隔一段时间通过人工神经网络和有监督学习对权值进行修正,因此可以保证较高的准确率。
Description
技术领域
本发明属于机器学习领域,特别是涉及神经网络的学习领域。
技术背景
神经网络是一种抽象人类大脑神经工作机理用于完成数据分类识别的机器学习算法。其中,人工神经网络和脉冲神经网络是两种不同抽象层次所生成的抽象模型。
人工神经网络(Artificial Neural Network简称ANN)将人脑神经元之间的运算抽象为矩阵乘法,抽象层次较高。以图像识别为例,人工神经网络将输入的图片像素矩阵与神经网络的权值矩阵进行一系列矩阵乘法运算,最后得到用一个数值向量表示的分类输出,该过程称为推理或正向传播。为了得到准确的分类结果,需要对神经网络进行预先学习(或称训练),使用大量有标签的训练数据,通过反向传播算法调整权值参数,从而找到最佳权值参数。人工神经网络的推理和学习所需功耗较高,因为每个时钟周期都要对所有的神经元进行计算。
脉冲神经网络(Spiking Neural Network简称SNN)不对人脑作抽象,更类似于直接照搬人脑工作机理。仍以图像识别为例,脉冲神经网络将图片像素矩阵编码为脉冲序列,当有脉冲到达时,神经元响应,计算单元进行运算。当神经元不激活时,也就没有脉冲释放,后面的神经元不响应。也就不会参与运算,因此,脉冲神经网络具有较低的推理功耗。同时,和人工神经网络相比,脉冲神经网络多采用无监督学习,无监督学习的计算复杂度比有监督学习低,所以学习功耗较低。但是,由于缺乏监督,无监督学习获得的识别正确率比较低。
同时,基于预先学习的ANN和SNN都具有一个共同的缺点,即在数据特征变化和数据特征未知情况下准确率较低,而实际应用中存在大量数据特征变化或未知的情况。
预先学习是通过训练数据寻找可以达到最佳分类准确率的权值参数,对数据特征变化和数据特征未知的情况,训练数据和测试数据特征存在差别,因此准确率会下降。人工神经网络每一次前向推理都需要对全部神经元进行计算,所以计算功耗较高,而脉冲神经网络的神经元只在接受到脉冲时才进行计算,而且神经元只在接收到足够脉冲时才向后产生脉冲,因此计算功耗较低。脉冲神经网络的在线学习多采用无监督学习,跟自学类似,没有监督者纠正,如果一开始的方向错了,那么就会一直向着错误的方向前进,因此准确率较低。
发明内容
本发明解决现有人工神经网络和脉冲神经网络技术存在的问题在降低推理和学习功耗的同时,达到较高的识别准确率,包括数据特征变化和未知情况下的准确率。
本专利提出人工神经网络和脉冲神经网络融合推理和在线学习方案。在推理方面,使用人工神经网络进行预学习,并将学习后的人工神经网络转化为脉冲神经网络进行推理,从而实现较低的推理功耗。在预先学习的神经网络基础上进行在线学习,从而解决数据特征变化和未知情况下准确率下降的问题。在学习方面,主要采用无监督学习进行在线学习,从而降低学习功耗。同时,隔一段时间采用人工神经网络和有监督学习对权值进行修正,从而提高识别准确率。由于大部分时间还是采用脉冲神经网络和无监督学习,人工神经网络和有监督学习只是隔一段时间激活一次对权值进行修正,因此整体功耗也会得到控制。
在实际工作中,本发明有两种情况,其数据通路不同。
本发明技术方案为一种融合人工神经网络和神经形态计算的推理和在线学习方法,该方法中包括:步骤A:采用脉冲神经网络SNN处理数据和步骤B:采用脉冲神经网络SNN联合人工神经网络ANN处理数据,步骤A和步骤B交替对获取数据进行处理;
所述步骤A采用脉冲神经网络SNN处理数据的具体方法为:
步骤A1:SNN推理模块和SNN在线训练模块从输入端获取数据输入;同时,SNN推理模块和SNN在线训练模块从SNN权值储存模块中获取权值,并进行对应的计算,SNN推理模块生成用于输出的响应,SNN在线训练模块应当产生经过在线训练后的新权重。
步骤A2:SNN推理模块输出响应,SNN在线训练模块写回更新后的权重,由于本步骤中权值已经更新,因此下一次接受输入时,会使用更新后的权重。
所述步骤B采用脉冲神经网络SNN联合人工神经网络ANN处理数据的具体方法为:
步骤B1:SNN推理模块,SNN在线训练模块和ANN在线训练模块从输入端获取输入。同时SNN推理模块,SNN在线学习模块从SNN权值储存模块获取SNN的最新权值。ANN在线训练模块从ANN权值储存模块获取当前ANN的最新权值。获取权值之后,SNN推理模块进行计算,生成对输入的响应;SNN在线训练模块进行计算,生成SNN的权值更新;ANN在线训练模块进行计算,生成ANN的权值更新。
步骤B2:SNN推理模块输出对输入的响应;SNN/ANN在线训练模块分别向对应的权值存储模块写回最新的权值。
步骤B3:SNN在线学习矫正模块从SNN/ANN权值储存模块中获取当前最新权值,进行对比,计算当前权值是否合理。
步骤B4:如果步骤B4中判断当前SNN权值不合理,则进行一定程度的矫正。
解决神经网络面对特征变化或者未知数据时正确率下降的问题,需要对神经网络进行在线学习。脉冲神经网络通常采用无监督学习,比起有监督学习,准确率较低,容易在学习错误之后一直向着错误的方向前进。人工神经网络通常采用有监督学习,准确率较高,但是推理和学习功耗较大。因此本专利中提出一种新的方案,使用人工神经网络辅助脉冲神经网络进行在线学习,由于大多数时间采用脉冲神经网络推理和无监督学习,因此功耗较低,同时隔一段时间通过人工神经网络和有监督学习对权值进行修正,因此可以保证较高的准确率。
1.功耗低。对应技术方案是:在绝大多数时间,采用脉冲神经网络推理和无监督学习,因此推理和学习功耗较低。
2.准确率高。对应技术方案是:隔一段时间通过人工神经网络和有监督学习对权值进行修正,因此可以保证较高的准确率。
附图说明
图1为脉冲神经网络SNN的计算流程示意图;
图2为脉冲神经网络SNN联合人工神经网络ANN计算流程示意图。
具体实施方式
本模块顶层输入输出数据线主要有三条,SNN权值输入,ANN权值输入,SNN权值输出。
主要功能是SNN在线学习矫正模块从SNN/ANN权值储存模块中获取当前最新权值,进行对比,计算当前权值是否合理。用于矫正的方式有很多种,比如基于梯度方向的矫正、基于数值的矫正等。下面描述一种可能的矫正方法:
步骤1:当前模块获取SNN权值和ANN权值输入,将其置于两个新权值存储器中,控制模块控制存储器的规律性搬移,下面我们假设学习周期为100次数据输入,即,每输入100张图片使用人工神经网络进行一次校准。如果距离上一次矫正计数达到99,则跳转步骤2,如果距离上一次矫正计数达到100,则跳转步骤3;若两种情况都不是,则模块结束。
步骤2:将当前SNN和ANN的权值送入旧权值存储器中。模块运行结束。
步骤3:对SNN的新旧权值进行比对,得出SNN权值梯度方向;同样,对ANN新旧权值进行比对,得出ANN权值梯度方向。跳转步骤4.
步骤4:判断,以ANN梯度方向为基准,对于梯度方向相反的权值点,进行反向矫正,例如,加一个常数使得梯度方向与ANN一致。跳转步骤5.
步骤5:输出矫正结果。
本处理架构可以支持不同的网络模型,而不同的网络模型则可以用于不同的用途,例如语音识别/图片识别等,下面举一种可能的例子,但实际用途不仅限于下面举例。
在对目标的跟踪中,经常会遇到目标跟丢的问题,比如,对犯罪嫌疑人的跟踪,如果没有在线学习,那么嫌疑人的某些特征改变很可能会导致目标跟丢(比如换衣服),加入在线学习,通过实时获取矫正数据的方式,可以显著改善这一缺点。但是同样也带来了功耗过大的问题,因此,本处理架构结合目前功耗较低的脉冲神经网络来实现低功耗的在线学习。
同时,为了避免非监督学习带来的准确率损失问题,使用人工神经网络来进行辅助运算。这样,本处理架构就可以实现低功耗的高准确率在线学习。
Claims (1)
1.一种融合人工神经网络和神经形态计算的在线学习方法,该方法中包括:步骤A:采用脉冲神经网络SNN处理数据和步骤B:采用脉冲神经网络SNN联合人工神经网络ANN处理数据,步骤A和步骤B交替对获取数据进行处理;
所述步骤A采用脉冲神经网络SNN处理数据的具体方法为:
步骤A1:SNN推理模块和SNN在线训练模块从输入端获取数据输入;同时,SNN推理模块和SNN在线训练模块从SNN权值储存模块中获取权值,并进行对应的计算,SNN推理模块生成用于输出的响应,SNN在线训练模块应当产生经过在线训练后的新权重。
步骤A2:SNN推理模块输出响应,SNN在线训练模块写回更新后的权重,由于本步骤中权值已经更新,因此下一次接受输入时,会使用更新后的权重。
所述步骤B采用脉冲神经网络SNN联合人工神经网络ANN处理数据的具体方法为:
步骤B1:SNN推理模块,SNN在线训练模块和ANN在线训练模块从输入端获取输入。同时SNN推理模块,SNN在线学习模块从SNN权值储存模块获取SNN的最新权值。ANN在线训练模块从ANN权值储存模块获取当前ANN的最新权值。获取权值之后,SNN推理模块进行计算,生成对输入的响应;SNN在线训练模块进行计算,生成SNN的权值更新;ANN在线训练模块进行计算,生成ANN的权值更新。
步骤B2:SNN推理模块输出对输入的响应;SNN/ANN在线训练模块分别向对应的权值存储模块写回最新的权值。
步骤B3:SNN在线学习矫正模块从SNN/ANN权值储存模块中获取当前最新权值,进行对比,计算当前权值是否合理。
步骤B4:如果步骤B4中判断当前SNN权值不合理,则进行一定程度的矫正。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910880288.9A CN110674928B (zh) | 2019-09-18 | 2019-09-18 | 一种融合人工神经网络和神经形态计算的在线学习方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910880288.9A CN110674928B (zh) | 2019-09-18 | 2019-09-18 | 一种融合人工神经网络和神经形态计算的在线学习方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110674928A true CN110674928A (zh) | 2020-01-10 |
CN110674928B CN110674928B (zh) | 2023-10-27 |
Family
ID=69078153
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910880288.9A Active CN110674928B (zh) | 2019-09-18 | 2019-09-18 | 一种融合人工神经网络和神经形态计算的在线学习方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110674928B (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111314257A (zh) * | 2020-03-13 | 2020-06-19 | 电子科技大学 | 一种基于复值神经网络的调制方式识别方法 |
CN111582445A (zh) * | 2020-04-24 | 2020-08-25 | 浙江大学 | 一种基于脉冲神经网络的高效学习系统及学习方法 |
CN114781633A (zh) * | 2022-06-17 | 2022-07-22 | 电子科技大学 | 一种融合人工神经网络与脉冲神经网络的处理器 |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102496062A (zh) * | 2011-12-08 | 2012-06-13 | 山东建筑大学 | 一种基于Spiking神经网络的人员信息融合方法 |
CN104050506A (zh) * | 2014-06-24 | 2014-09-17 | 电子科技大学 | 一种基于Spiking神经网络的飞机冲突检测方法 |
CN106779056A (zh) * | 2016-12-21 | 2017-05-31 | 天津大学 | 用于aer前馈分类系统的脉冲神经元硬件架构 |
CN107092959A (zh) * | 2017-04-07 | 2017-08-25 | 武汉大学 | 基于stdp非监督学习算法的硬件友好型脉冲神经网络模型 |
US20180225562A1 (en) * | 2017-02-08 | 2018-08-09 | Brainchip Inc. | System and Method for Spontaneous Machine Learning and Feature Extraction |
CN108846349A (zh) * | 2018-06-08 | 2018-11-20 | 电子科技大学 | 一种基于动态Spiking神经网络的人脸识别方法 |
US20190057301A1 (en) * | 2017-08-17 | 2019-02-21 | International Business Machines Corporation | Neuromorphic processing apparatus |
US20190122110A1 (en) * | 2017-10-23 | 2019-04-25 | Samsung Electronics Co., Ltd. | Neural network apparatus and method |
-
2019
- 2019-09-18 CN CN201910880288.9A patent/CN110674928B/zh active Active
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102496062A (zh) * | 2011-12-08 | 2012-06-13 | 山东建筑大学 | 一种基于Spiking神经网络的人员信息融合方法 |
CN104050506A (zh) * | 2014-06-24 | 2014-09-17 | 电子科技大学 | 一种基于Spiking神经网络的飞机冲突检测方法 |
CN106779056A (zh) * | 2016-12-21 | 2017-05-31 | 天津大学 | 用于aer前馈分类系统的脉冲神经元硬件架构 |
US20180225562A1 (en) * | 2017-02-08 | 2018-08-09 | Brainchip Inc. | System and Method for Spontaneous Machine Learning and Feature Extraction |
CN107092959A (zh) * | 2017-04-07 | 2017-08-25 | 武汉大学 | 基于stdp非监督学习算法的硬件友好型脉冲神经网络模型 |
US20190057301A1 (en) * | 2017-08-17 | 2019-02-21 | International Business Machines Corporation | Neuromorphic processing apparatus |
US20190122110A1 (en) * | 2017-10-23 | 2019-04-25 | Samsung Electronics Co., Ltd. | Neural network apparatus and method |
CN108846349A (zh) * | 2018-06-08 | 2018-11-20 | 电子科技大学 | 一种基于动态Spiking神经网络的人脸识别方法 |
Non-Patent Citations (1)
Title |
---|
蔺想红;王向文;党小超;: "基于脉冲序列核的脉冲神经元监督学习算法", 电子学报, no. 12 * |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111314257A (zh) * | 2020-03-13 | 2020-06-19 | 电子科技大学 | 一种基于复值神经网络的调制方式识别方法 |
CN111582445A (zh) * | 2020-04-24 | 2020-08-25 | 浙江大学 | 一种基于脉冲神经网络的高效学习系统及学习方法 |
CN111582445B (zh) * | 2020-04-24 | 2023-05-26 | 浙江大学 | 一种基于脉冲神经网络的高效学习系统及学习方法 |
CN114781633A (zh) * | 2022-06-17 | 2022-07-22 | 电子科技大学 | 一种融合人工神经网络与脉冲神经网络的处理器 |
Also Published As
Publication number | Publication date |
---|---|
CN110674928B (zh) | 2023-10-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10929744B2 (en) | Fixed-point training method for deep neural networks based on dynamic fixed-point conversion scheme | |
Pan et al. | A comparison of neural network backpropagation algorithms for electricity load forecasting | |
CN110674928A (zh) | 一种融合人工神经网络和神经形态计算的在线学习方法 | |
Han et al. | Adaptive computation algorithm for RBF neural network | |
Bohnstingl et al. | Online spatio-temporal learning in deep neural networks | |
Pogodin et al. | Kernelized information bottleneck leads to biologically plausible 3-factor hebbian learning in deep networks | |
US11676026B2 (en) | Using back propagation computation as data | |
JP4546157B2 (ja) | 情報処理方法、情報処理装置、撮像装置 | |
Huang et al. | Orthogonal least squares algorithm for training cascade neural networks | |
Cordone et al. | Learning from event cameras with sparse spiking convolutional neural networks | |
CN112084911B (zh) | 一种基于全局注意力的人脸特征点定位方法及系统 | |
US11977972B2 (en) | Residual semi-recurrent neural networks | |
CN113205048A (zh) | 一种手势识别方法及识别系统 | |
CN111950633A (zh) | 神经网络的训练、目标检测方法及装置和存储介质 | |
CN112651519A (zh) | 一种基于深度学习理论的二次设备故障定位方法及系统 | |
CN115409870A (zh) | 基于脉冲编码可学习snn的目标跟踪方法及电子设备 | |
CN116052254A (zh) | 基于扩展卡尔曼滤波神经网络的视觉连续情感识别方法 | |
Wang et al. | Reliable label correction is a good booster when learning with extremely noisy labels | |
Henderson et al. | Spike event based learning in neural networks | |
US11948079B2 (en) | Multi-agent coordination method and apparatus | |
Lin et al. | Hybrid water quality prediction with graph attention and spatio-temporal fusion | |
CN113298231A (zh) | 用于脉冲神经网络的图表示时空反向传播算法 | |
Kaur | Implementation of backpropagation algorithm: A neural net-work approach for pattern recognition | |
Ghazali et al. | Dynamic ridge polynomial neural networks in exchange rates time series forecasting | |
CN112232484B (zh) | 一种基于类脑神经网络的空间碎片识别捕获方法及系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |