CN108304856B - 基于皮层丘脑计算模型的图像分类方法 - Google Patents
基于皮层丘脑计算模型的图像分类方法 Download PDFInfo
- Publication number
- CN108304856B CN108304856B CN201711332985.8A CN201711332985A CN108304856B CN 108304856 B CN108304856 B CN 108304856B CN 201711332985 A CN201711332985 A CN 201711332985A CN 108304856 B CN108304856 B CN 108304856B
- Authority
- CN
- China
- Prior art keywords
- neural network
- thalamus
- fusing
- regulation
- profile
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 210000001103 thalamus Anatomy 0.000 title claims abstract description 75
- 238000000034 method Methods 0.000 title claims abstract description 42
- 230000001054 cortical effect Effects 0.000 title claims abstract description 34
- 238000004364 calculation method Methods 0.000 title claims abstract description 17
- 238000013528 artificial neural network Methods 0.000 claims abstract description 135
- 238000012549 training Methods 0.000 claims abstract description 74
- 210000002569 neuron Anatomy 0.000 claims description 35
- 230000000542 thalamic effect Effects 0.000 claims description 25
- 230000008859 change Effects 0.000 claims description 18
- 230000006870 function Effects 0.000 claims description 16
- 238000004422 calculation algorithm Methods 0.000 claims description 8
- 238000005457 optimization Methods 0.000 claims description 7
- 238000011478 gradient descent method Methods 0.000 claims description 6
- 238000005065 mining Methods 0.000 claims description 4
- 238000012360 testing method Methods 0.000 abstract description 16
- 230000008569 process Effects 0.000 abstract description 9
- 238000005094 computer simulation Methods 0.000 abstract description 8
- 238000013473 artificial intelligence Methods 0.000 abstract description 2
- 210000003710 cerebral cortex Anatomy 0.000 description 20
- 230000000007 visual effect Effects 0.000 description 13
- 238000010586 diagram Methods 0.000 description 11
- 230000000694 effects Effects 0.000 description 11
- 238000012546 transfer Methods 0.000 description 11
- 210000003127 knee Anatomy 0.000 description 6
- 210000000857 visual cortex Anatomy 0.000 description 6
- 230000037361 pathway Effects 0.000 description 5
- 241000282414 Homo sapiens Species 0.000 description 4
- 238000011160 research Methods 0.000 description 4
- 230000003461 thalamocortical effect Effects 0.000 description 4
- 238000002474 experimental method Methods 0.000 description 3
- 230000001105 regulatory effect Effects 0.000 description 3
- 230000004044 response Effects 0.000 description 3
- 230000009901 attention process Effects 0.000 description 2
- 230000002457 bidirectional effect Effects 0.000 description 2
- 230000005540 biological transmission Effects 0.000 description 2
- 230000001276 controlling effect Effects 0.000 description 2
- 230000010367 cortical information processing Effects 0.000 description 2
- 239000000835 fiber Substances 0.000 description 2
- 230000004927 fusion Effects 0.000 description 2
- 230000007246 mechanism Effects 0.000 description 2
- 210000001995 reticulocyte Anatomy 0.000 description 2
- 230000001953 sensory effect Effects 0.000 description 2
- 210000000697 sensory organ Anatomy 0.000 description 2
- 238000006467 substitution reaction Methods 0.000 description 2
- 206010001497 Agitation Diseases 0.000 description 1
- 241000282412 Homo Species 0.000 description 1
- 241000288906 Primates Species 0.000 description 1
- 230000002159 abnormal effect Effects 0.000 description 1
- 210000004556 brain Anatomy 0.000 description 1
- 210000003618 cortical neuron Anatomy 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000008906 neuronal response Effects 0.000 description 1
- 230000010355 oscillation Effects 0.000 description 1
- 210000003735 pulvinar Anatomy 0.000 description 1
- 210000003660 reticulum Anatomy 0.000 description 1
- 229920006395 saturated elastomer Polymers 0.000 description 1
- 230000008786 sensory perception of smell Effects 0.000 description 1
- 230000003945 visual behavior Effects 0.000 description 1
- 239000002699 waste material Substances 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/25—Fusion techniques
- G06F18/254—Fusion techniques of classification results, e.g. of results related to same input data
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/084—Backpropagation, e.g. using gradient descent
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Computing Systems (AREA)
- Software Systems (AREA)
- Molecular Biology (AREA)
- Computational Linguistics (AREA)
- Biophysics (AREA)
- Biomedical Technology (AREA)
- Mathematical Physics (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Image Analysis (AREA)
- Image Processing (AREA)
Abstract
本发明涉及类脑智能和人工智能领域,具体涉及一种基于皮层丘脑计算模型的图像分类方法。旨在解决传统人工神经网络中浪费训练数据和训练神经网络过程中所需计算量较大的问题。本发明基于轮廓先验神经网络N1、融合丘脑调控作用的神经网络N2,分别对输入图像进行分类标记的预测,并按照预设的权值对两个预测结果进行融合得到所述输入图像的分类。本发明在小样本数据训练情况下利用MNIST数据集和FashionMNIST数据集进行图像分类测试,测试结果表明基于皮层丘脑计算模型的图像分类方法其性能均比传统的人工神经网络优异。
Description
技术领域
本发明涉及类脑智能和人工智能领域,具体涉及一种基于皮层丘脑计算模型的图像分类方法。
背景技术
在灵长类动物中,丘脑接收除嗅觉外来自全身的各种感觉信息,并将其投射到大脑皮层。丘脑除了起到感觉信息转换站的作用,还在皮层信息传递过程中起到调控作用。丘脑主要由外膝体(LGN)、丘脑网状核(TRN)以及丘脑枕(Pulvinar)构成。外膝体连接感觉器官与大脑皮层,起到信息中转的作用;丘脑网状核调控大脑皮层与丘脑之间的信息传递;丘脑枕作为丘脑中最大的核团,占整个丘脑的近三分之一。神经科学的实验研究表明丘脑枕与视觉皮层具有双向性的纤维投射以及功能投射功能,丘脑枕损伤会导致人类视觉行为异常。丘脑向大脑皮层的投射分为两大通路:特异性通路和非特异性通路。特异性通路主要学习自底向上的特征,完成与自顶向下的特征匹配学习自顶向下的特征期望指导,对于自底向上以及自顶向下的特征匹配以及通过皮层的反馈连接学习。非特异性通路主要用于调节皮层的兴奋性以及调节调控特异性通路中对于特征的提取选择。两个通路的融合可以通过判断底层输入信息与高层期望上层信息是否匹配来决定皮层神经元放电频率的高低,或者不匹配形成高频率或者低频率震荡,从而对于不同区域进行调节,实现一个全局的优化。
视觉注意作为人类的一项重要能力,使我们能够有效地处理对于自身最重要的事情。视觉注意一直以来是神经科学、心理学、计算机科学等领域的研究热点。目前,尤其是计算机建模领域的研究成果,可以看出学者们更多的关注皮层在视觉注意中的作用,然而神经科学的实验发现在选择性视觉注意过程中,丘脑一方面能够增强对目标物体的表征,抑制对非目标物体的编码,即丘脑在视觉注意过程中起到门控作用;另一方面,丘脑能够同步不同视觉皮层的响应,通过调整皮层之间的连接来实现对视觉注意的调控作用。
受皮层信息处理机制启发的传统的人工神经网络,在图像识别,语音识别等领域取得了很大的成功,在人脸识别等任务中的识别准确率甚至超越了人类。然而,相对于人类大脑皮层,传统人工神经网络还存在一些问题:(1)当网络训练稳定后会有大量神经元的响应没有区分能力。例如,在MNIST分类任务中,当训练数据从200张图片增加到60000张时,我们的实验发现始终有158个神经元的响应很大。图1表示响应较大的158个神经元示意图,这158个神经元中有大量的神经元对于分类任务没有起到作用,浪费了大量的数据。(2)神经网络训练需要大量的样本,计算量较大。例如,如图2所示为三层全连接神经网络的隐层到输出层权重变化分布图,横坐标表示隐层到输出层权重变化间隔,纵坐标表示隐层到输出层权重变化所占比例,该神经网络中三层神经元个数分别为[784,100,10],当正确率从20%提升到60%的时候,可以看到权重变化在[0,0.05]之间的占43.35%,权重变化大于0.05的占56.65%。而输入层到隐层的权重变化,如图3所示。图3的横坐标为输入层到隐层权重变化间隔,纵坐标为输入层到隐层权重变化所占比例,可以看到权重变化在[0,0.05]之间的占86.54%,权重变化大于0.05的占13.46%。通过图2和图3的对比结果可以看出,当传统的神经网络有了较大提升时,神经元之间的权值改变并没有发生多少。当只依靠皮层对于信息的传递,误差从高级皮层往低级皮层回传的时候,越往底层走,残差越来越小,导致低级皮层只有极少数的权值改动。
发明内容
为了解决现有技术中的上述问题,即为了解决传统人工神经网络中浪费训练数据和训练神经网络过程中所需计算量较大的问题,本发明提出了一种基于皮层丘脑计算模型的图像分类方法,所述方法是基于轮廓先验神经网络N1、融合丘脑调控作用的神经网络N2,分别对输入图像进行分类标记的预测,并按照预设的权值对两个预测结果进行融合得到所述输入图像的分类。
所述基于轮廓先验神经网络N1为通过轮廓先验知识训练集训练后的全连接神经网络。
所述融合丘脑调控作用的神经网络N2为通过轮廓先验知识训练集、以及所述基于轮廓先验神经网络N1对所述轮廓先验知识训练集的分类结果训练和基于微分-赫布学习法则训练后的全连接神经网络。
进一步地,所述基于轮廓先验神经网络N1,其训练方法为:
步骤S11,利用canny算子提取图片的轮廓,并构建所述轮廓先验知识训练集;
步骤S12,利用所述轮廓先验知识训练集,基于第一网络损失函数训练所述基于轮廓先验神经网络N1。
所述第一网络的损失函数为:
其中,xm为所述基于轮廓先验神经网络N1的输出,Ym为所述轮廓先验知识训练集中各图像的真实分类。
进一步地,所述融合丘脑调控作用的神经网络N2,其基于轮廓先验神经网络N1对所述轮廓先验知识训练集的分类结果训练方法为:
步骤S22,利用所述轮廓先验知识训练集,通过所述融合丘脑调控作用的神经网络N2获得输出ym,并基于第二网络的损失函数训练所述融合丘脑调控作用的神经网络N2。
所述第二网络的损失函数为:
λ2为轮廓先验神经网络N1对融合丘脑调控作用的神经网络N2的指导系数;Ym为第二类别标签;
其中,
所述第一类别标签为轮廓先验神经网络N1输出的先验指导类别标签;
所述第二类别标签Ym为图片真实类别标签。
进一步地,所述融合丘脑调控作用的神经网络N2,其基于微分-赫布学习法则训练方法为:
步骤S31:融合丘脑调控作用的神经网络N2记住第一次迭代时每个神经元的值及相应权重;
步骤S32:采用基于微分-赫布学习法则的迭代方法进行下一次迭代,获取每个神经元的值,以及相应的权重改变;
步骤S33:重复步骤S32,直至达到最大迭代次数。
进一步地,所述轮廓先验神经网络N1采用反向传播算法、或批量梯度下降法进行参数优化。
进一步地,所述融合丘脑调控作用的神经网络N2采用反向传播算法、或批量梯度下降法进行参数优化。
进一步地,所述轮廓先验神经网络N1为两层的全连接神经网络,输入层神经元个数为28*28,输出层神经元个数为10。
进一步地,所述融合丘脑调控作用的神经网络N2为三层全连接神经网络,网络的输入层神经元个数为784,隐藏层神经元个数为500,输出层神经元个数为10。
进一步地,所述分类计算公式为:
y=λ2*xm+(1-λ2)*ym
其中λ2为轮廓先验神经网络N1对融合丘脑调控作用的神经网络N2的指导系数;xm为轮廓先验神经网络N1的输出;ym为融合丘脑调控作用的神经网络N2的输出。
进一步地,所述图片可以为MNIST数据集和/或FashionMNIST数据集中的图片。
进一步地,所述训练集可以为MNIST数据集中的训练集和/或FashionMNIST数据集中的训练集。
本发明受丘脑在视觉注意中的门控作用以及在皮层间信息传递的调控作用的启发,分别建立了轮廓先验神经网络N1模型和融合丘脑调控作用的神经网络N2模型,通过轮廓先验神经网络N1、融合丘脑调控作用的神经网络N2,分别对输入图像进行分类标记的预测,并按照预设的权值对两个预测结果进行融合得到所述输入图像的分类。本发明只需要较小数据集的训练即可得到较高的准确率,更符合人脑学习的方式;对进一步理解皮层间的信息传递提供了指导。
附图说明
图1为神经元响应示意图;
图2为三层神经网络隐藏层到输出层权重变化分布示意图;
图3为三层神经网络输入层到隐藏层权重变化分布示意图;
图4为丘脑皮层间信息传递的计算模型示意图;
图5为皮层丘脑计算模型的图像分类方法示意图;
图6为基于丘脑在视觉注意中的门控作用的计算模示意图;
图7为利用MNIST数据集测试的正确率对比图;
图8为利用FashionMNIST数据集测试的正确率对比图;
图9为皮层丘脑模型与皮层模型在100次迭代后的正确率对比图;
图10为皮层丘脑模型与皮层模型在不同迭代次数下的正确率曲线图;
图11为MNIST数据集示意图;
图12为FashionMNIST数据集示意图。
具体实施方式
下面结合本发明实施例中的附图,对发明实施例中的技术方案进行清楚、完整地描述,显然,所述的实施例仅仅是本发明一部分实施例,而不是全部实施例。基于本发明的实施例,本领域普通技术人员在没有创造性劳动前提下获得的所有其它实施例,都属于本发明保护范围。
丘脑是由外膝体、丘脑网状核丘脑枕组成,外膝体作为信息中转站连接感觉器官与大脑皮层;丘脑网状核调控大脑皮层与丘脑之间的信息传递;丘脑枕是丘脑中最大的核团,丘脑枕与视觉皮层具有双向性的纤维投射以及功能投射功能。图4为丘脑皮层间信息传递的计算模型示意图,包括外膝体、丘脑枕、皮层区域1、皮层区域2、皮层区域3、皮层区域4。外膝体与皮层区域1相连接,皮层区域1、皮层区域2、皮层区域3、皮层区域4顺次连接,丘脑枕与皮层区域1、皮层区域2、皮层区域3、皮层区域4分别连接。
神经科学的实验发现在选择性视觉注意过程中,丘脑一方面能够增强对目标物体的表征,抑制对非目标物体的编码,即丘脑在视觉注意过程中起到门控作用;另一方面,丘脑能够同步不同视觉皮层的响应,通过调整皮层之间的连接来实现对视觉注意的调控作用。本发明受丘脑在视觉注意中的调控作用以及在皮层间信息传递的调控作用的启发提出了一种基于皮层丘脑计算模型的图像分类方法。图5为皮层丘脑计算模型的图像分类方法示意图。丘脑注意模型为两层的轮廓先验神经网络,丘脑调控模型模拟丘脑枕调控作用的三层全连接的神经网络,两个神经网络分别对输入图像进行分类标记的预测,并按照预设的权值对两个预测结果进行融合得到所述输入图像的分类。
传统的人工神经网络都是拿整张图片进行训练的,神经网络在识别过程中只会更多的关注图片的纹理信息,而忽略了图片的轮廓信息。通常我们只需要对于图片的几个像素进行修改就可以对神经网络进行欺骗,将本来是A类的物体认为是B类。所以本发明提出了一种基于丘脑在视觉注意中的门控作用的计算模型,如图6所示。基于轮廓先验知识网络训练一个两层的轮廓先验神经网络,利用轮廓先验神经网络的输出标签指导新的网络学习,新的网络为一个三层全连接的模拟丘脑调控作用的神经网络。图像的实际类别标签用以计算神经网络的损失函数。
本发明中一种基于皮层丘脑计算模型的图像分类方法,具体包括:
基于轮廓先验神经网络N1、融合丘脑调控作用的神经网络N2,分别对输入图像进行分类标记的预测,并按照预设的权值对两个预测结果进行融合得到所述输入图像的分类;
其中,
所述基于轮廓先验神经网络N1为通过轮廓先验知识训练集训练后的全连接神经网络;
所述融合丘脑调控作用的神经网络N2为通过轮廓先验知识训练集、以及所述基于轮廓先验神经网络N1对所述轮廓先验知识训练集的分类结果训练和基于微分-赫布学习法则训练后的全连接神经网络。
本实施例中轮廓先验神经网络N1是一个两层的全连接神经网络,其输入层大小为28*28,输出层大小为10,无隐藏层;轮廓先验神经网络N1是经过轮廓先验知识进行训练,其训练步骤如下:
步骤S11,利用canny算子提取图片的轮廓,并构建所述轮廓先验知识训练集;
步骤S12,利用所述轮廓先验知识训练集,基于第一网络损失函数训练所述基于轮廓先验神经网络N1;
所述第一网络的损失函数如公式(1)所示:
其中,xm为所述基于轮廓先验神经网络N1的输出,Ym为所述轮廓先验知识训练集中各图像的真实分类。
本实施例中图片的像素是28*28与轮廓先验神经网络N1输入层大小相匹配,本发明使用的图片来自MNIST数据集中的训练集和FashionMNIST数据集中的训练集。
受皮层信息处理机制启发的传统的人工神经网络,在图像识别、语音识别等领域取得了很大的成功,在人脸识别等任务中的识别准确率甚至超越了人类。所以本发明采用微分-赫布学习法则训练融合丘脑调控作用的神经网络N2模拟丘脑在皮层间信息传递的调控作用提高神经网络在图像识别过程中的正确率,其训练步骤如下:
步骤S21:融合丘脑调控作用的神经网络N2记住第一次迭代时每个神经元的值及相应权重;
步骤S22:基于微分-赫布学习法则进行下一次迭代,获取每个神经元的值,以及相应的权重改变;
步骤S23:重复步骤S22,直至达到最大迭代次数。
所述微分-赫布学习法则如公式(2)所示:
ΔWij=Wij-αΔWij
bi=bi-αΔbi
其中,
Wij表示神经元中上层神经元i以及下层神经元j之间的权重;
ΔWij是神经元i和神经元j之间的权重改变量;
bi是神经元i的偏置;
Δbi是神经元i的偏置改变量;
α表示的是权重Wij以及偏置bi的学习速率;
θ表示的是学习参数的统称:Wij以及bi。
所述上层神经元i与下层神经元j表示相邻两层的神经元,而非具体的上下位置关系。
本实施例中融合丘脑调控作用的神经网络N2为三层全连接神经网络,其输入层神经元个数为784,隐藏层神经元个数为500,输出层神经元个数为10。
基于轮廓先验神经网络N1对所述轮廓先验知识训练集的分类结果再对融合丘脑调控作用的神经网络N2进行训练,具体训练方法为:
步骤S32,利用所述轮廓先验知识训练集,通过所述融合丘脑调控作用的神经网络N2获得输出ym,并基于第二网络的损失函数训练所述融合丘脑调控作用的神经网络N2。
所述第二网络的损失函数如公式(3)所示:
其中,λ2为轮廓先验神经网络N1对融合丘脑调控作用的神经网络N2的指导系数,λ2在训练过程中可以进行优化更改,使神经网络达到最佳状态;Ym为第二类别标签;
其中,
所述第一类别标签为轮廓先验神经网络N1输出的先验指导类别标签;
所述第二类别标签Ym为图片真实类别标签。
采用反向传播算法、或批量梯度下降法对轮廓先验神经网络N1进行参数优化;
采用反向传播算法、或批量梯度下降法对融合丘脑调控作用的神经网络N2进行参数优化;
将训练好的轮廓先验神经网络N1和融合丘脑调控作用的神经网络N2对输入的图片按如下公式进行分类:
y=λ2*xm+(1-λ2)*ym (4)
λ2为轮廓先验神经网络N1对融合丘脑调控作用的神经网络N2的指导系数,λ2在训练过程中可以进行优化,使神经网络达到最佳状态;xm为轮廓先验神经网络N1的输出;ym为融合丘脑调控作用的神经网络N2的输出。
为了更好的显示基于皮层丘脑计算模型的图像分类方法的分类效果,选取轮廓先验神经网络N1即先验模型、没有经过轮廓先验知识训练的神经网络N′2即皮层模型、和融合丘脑调控作用的神经网络N2即皮层丘脑模型,其中,神经网络N′2除了没有经过轮廓先验神经网络N1指导训练外,其他方面与融合丘脑调控作用的神经网络N2一致。采用MNIST数据集和FashionMNIST数据集分别测试模型的分类效果,测试结果如图7和图8所示。横坐标从左到右分别为先验模型、皮层模型、皮层丘脑模型;纵坐标表示的是图片识别的正确率,纵坐标单位为0.01。图7为采用MNIST数据集测试的正确率对比图,图8为采用FashionMNIST数据集测试的正确率对比图。可以看出皮层丘脑模型在小样本测试时,无论在MNIST数据集和FashionMNIST数据集中均优于先验模型和皮层模型。本实施例中,采用MNIST数据集测试时λ2=0.85;采用FashionMNIST数据集测试时λ2=0.7;λ2为经过反向传播算法优化后的最佳值;训练时选取图片样本为100张,测试时选取图片样本为10000张。
将皮层丘脑计算模型与一个模拟皮层模型的三层全连接神经网络在100次迭代后的准确率进行对比,如图9所示。横坐标从左到右依次标示皮层丘脑模型、皮层模型,纵坐标表示的是图片识别的正确率,纵坐标单位为1。本实施例中皮层丘脑模型、皮层模型分别是经过200个数据训练,100个数据测试后得到的数据,可以看出与皮层模型相比,皮层丘脑计算模型的准确率高出大约十个百分点。
将皮层丘脑模型与皮层模型在不同迭代次数下的准确率曲线进行对比,如图10所示。横坐标为迭代次数,在0-1000范围内分别选取了10个样本数据,纵坐标表示图片识别的正确率,纵坐标单位为1。皮层模型为一个四层的两个隐藏层个数均为500的全连接神经网络。可以看出皮层模型在较少迭代次数的时候就已经饱和,而皮层丘脑模型可以继续学习,从而达到较高的准确率。
本实施例的训练集和测试集选用的是在MNIST数据集和FashionMNIST数据集。
本实施例的图片样本选自MNIST数据集和FashionMNIST数据集。
MNIST数据集是来自美国国家标准与技术研究所的手写数字的图片数据库,如图11所示。每一张图片分别为手写的0到9数字中的一个。其训练集来自250个人手写的数字,这250个人中一半是高中学生,一半来自人口普查局的工作人员。其测试集也是同样比例的手写数字数据。MNIST数据集总共有60000张训练图片,10000张测试图片,每张图片的像素为28*28,是国际上对于分类任务较为通用的一个数据集。
如图12所示,FashionMNIST数据集是一个替代MNIST手写数字集的图像数据库。因为MNIST数据集十分简单,大多数机器学习算法在测试集上的正确率较高,所以Zalando公司旗下的研究部门提供了FashionMNIST数据集,希望可以取代MNIST。FashionMNIST每一张图片为来自10种类别的不同商品的正面图片。图片的大小以及训练集测试集的数目与MNIST数据集完全类似。
本领域技术人员应该能够意识到,结合本文中所公开的实施例描述的各示例的模块、单元及方法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明电子硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以电子硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。本领域技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
术语“第一”、“第二”等是用于区别类似的对象,而不是用于描述或表示特定的顺序或先后次序。
至此,已经结合附图所示的优选实施方式描述了本发明的技术方案,但是,本领域技术人员容易理解的是,本发明的保护范围显然不局限于这些具体实施方式。在不偏离本发明的原理的前提下,本领域技术人员可以对相关技术特征作出等同的更改或替换,这些更改或替换之后的技术方案都将落入本发明的保护范围之内。
Claims (7)
1.一种基于皮层丘脑计算模型的图像分类方法,其特征在于,包括:
基于轮廓先验神经网络N1、融合丘脑调控作用的神经网络N2,分别对输入图像进行分类标记的预测,并按照预设的权值对两个预测结果进行融合得到所述输入图像的分类;
其中,
所述基于轮廓先验神经网络N1为通过轮廓先验知识训练集训练后的全连接神经网络;
所述融合丘脑调控作用的神经网络N2为通过轮廓先验知识训练集、以及所述基于轮廓先验神经网络N1对所述轮廓先验知识训练集的分类结果训练和基于微分-赫布学习法则训练后的全连接神经网络,具体地:
所述基于轮廓先验神经网络N1,其训练方法为:
步骤S11,利用canny算子提取图片的轮廓,并构建所述轮廓先验知识训练集;
步骤S12,利用所述轮廓先验知识训练集,基于第一网络损失函数训练所述基于轮廓先验神经网络N1;
所述第一网络的损失函数为:
其中,xm为所述基于轮廓先验神经网络N1的输出,Ym为所述轮廓先验知识训练集中各图像的真实分类;
所述融合丘脑调控作用的神经网络N2,其基于轮廓先验神经网络N1对所述轮廓先验知识训练集的分类结果训练方法为:
步骤S22,利用所述轮廓先验知识训练集,通过所述融合丘脑调控作用的神经网络N2获得输出ym,并基于第二网络的损失函数训练所述融合丘脑调控作用的神经网络N2;
所述第二网络的损失函数为:
λ2为轮廓先验神经网络N1对融合丘脑调控作用的神经网络N2的指导系数;Ym为第二类别标签;
其中,
所述第一类别标签为轮廓先验神经网络N1输出的先验指导类别标签;
所述第二类别标签Ym为图片真实类别标签,ym为所述融合丘脑调控作用的神经网络N2的输出;
所述融合丘脑调控作用的神经网络N2,其基于微分-赫布学习法则训练方法为:
步骤S31:融合丘脑调控作用的神经网络N2记住第一次迭代时每个神经元的值及相应权重;
步骤S32:采用基于微分-赫布学习法则的迭代方法进行下一次迭代,获取每个神经元的值,以及相应的权重改变;
步骤S33:重复步骤S32,直至达到最大迭代次数。
2.根据权利要求1所述图像分类方法,其特征在于,所述轮廓先验神经网络N1采用反向传播算法、或批量梯度下降法进行参数优化;
所述融合丘脑调控作用的神经网络N2采用反向传播算法、或批量梯度下降法进行参数优化。
3.根据权利要求2所述图像分类方法,其特征在于,所述轮廓先验神经网络N1为两层的全连接神经网络,输入层神经元个数为28*28,输出层神经元个数为10。
4.根据权利要求2所述图像分类方法,其特征在于,所述融合丘脑调控作用的神经网络N2为三层全连接神经网络,网络的输入层神经元个数为784,隐藏层神经元个数为500,输出层神经元个数为10。
5.根据权利要求1所述图像分类方法,其特征在于,所述分类计算公式为:
y=λ2*xm+(1-λ2)*ym。
6.根据权利要求1或2所述图像分类方法,其特征在于,所述图片可以为MNIST数据集和/或FashionMNIST数据集中的图片。
7.根据权利要求1或2所述图像分类方法,其特征在于,所述训练集可以为MNIST数据集中的训练集和/或FashionMNIST数据集中的训练集。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201711332985.8A CN108304856B (zh) | 2017-12-13 | 2017-12-13 | 基于皮层丘脑计算模型的图像分类方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201711332985.8A CN108304856B (zh) | 2017-12-13 | 2017-12-13 | 基于皮层丘脑计算模型的图像分类方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN108304856A CN108304856A (zh) | 2018-07-20 |
CN108304856B true CN108304856B (zh) | 2020-02-28 |
Family
ID=62869900
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201711332985.8A Active CN108304856B (zh) | 2017-12-13 | 2017-12-13 | 基于皮层丘脑计算模型的图像分类方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN108304856B (zh) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109190708A (zh) * | 2018-09-12 | 2019-01-11 | 重庆大学 | 基于视觉皮层处理机制的概念机神经网络图像分类方法 |
CN109711004B (zh) * | 2018-12-11 | 2023-03-28 | 重庆邮电大学 | 一种光纤折射率大数据预测方法 |
CN110188791B (zh) * | 2019-04-18 | 2023-07-07 | 南开大学 | 基于自动估计的视觉情感标签分布预测方法 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2001001328A2 (en) * | 1999-06-29 | 2001-01-04 | Koninklijke Philips Electronics N.V. | Image classification using evolved parameters |
CN104145281A (zh) * | 2012-02-03 | 2014-11-12 | 安秉益 | 神经网络计算装置和系统及其方法 |
CN105719292A (zh) * | 2016-01-20 | 2016-06-29 | 华东师范大学 | 利用两层级联的Boosting分类算法实现视频目标跟踪的方法 |
CN106688011A (zh) * | 2014-09-10 | 2017-05-17 | 北京市商汤科技开发有限公司 | 用于多类别物体检测的方法和系统 |
CN107330362A (zh) * | 2017-05-25 | 2017-11-07 | 北京大学 | 一种基于时空注意力的视频分类方法 |
-
2017
- 2017-12-13 CN CN201711332985.8A patent/CN108304856B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2001001328A2 (en) * | 1999-06-29 | 2001-01-04 | Koninklijke Philips Electronics N.V. | Image classification using evolved parameters |
CN104145281A (zh) * | 2012-02-03 | 2014-11-12 | 安秉益 | 神经网络计算装置和系统及其方法 |
CN106688011A (zh) * | 2014-09-10 | 2017-05-17 | 北京市商汤科技开发有限公司 | 用于多类别物体检测的方法和系统 |
CN105719292A (zh) * | 2016-01-20 | 2016-06-29 | 华东师范大学 | 利用两层级联的Boosting分类算法实现视频目标跟踪的方法 |
CN107330362A (zh) * | 2017-05-25 | 2017-11-07 | 北京大学 | 一种基于时空注意力的视频分类方法 |
Non-Patent Citations (2)
Title |
---|
融入先验知识的贝叶斯神经网络分类器;唐云 等;《物探化探计算技术》;20030228;第25卷(第1期);第83-87页 * |
视觉注意建模及其在图像分析中的应用;方芳;《中国博士学位论文全文数据库信息科技辑》;20140115(第1期);I138-59 * |
Also Published As
Publication number | Publication date |
---|---|
CN108304856A (zh) | 2018-07-20 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Goldstone et al. | Categorical perception of novel dimensions | |
Inazumi et al. | Artificial intelligence system for supporting soil classification | |
CN105825511B (zh) | 一种基于深度学习的图片背景清晰度检测方法 | |
CN108171256A (zh) | 人脸图像质评模型构建、筛选、识别方法及设备和介质 | |
CN108647583A (zh) | 一种基于多目标学习的人脸识别算法训练方法 | |
CN107844784A (zh) | 人脸识别方法、装置、计算机设备和可读存储介质 | |
CN108304856B (zh) | 基于皮层丘脑计算模型的图像分类方法 | |
Sinha et al. | Epoch determination for neural network by self-organized map (SOM) | |
CN108154236A (zh) | 用于评估群组层面的认知状态的技术 | |
CN106570522B (zh) | 物体识别模型的建立方法及物体识别方法 | |
CN107145857A (zh) | 人脸属性识别方法、装置和模型建立方法 | |
CN106485227A (zh) | 一种基于视频面部表情的客户满意度分析方法 | |
CN110826453A (zh) | 一种通过提取人体关节点坐标的行为识别方法 | |
Aditya et al. | Batik classification using neural network with gray level co-occurence matrix and statistical color feature extraction | |
KR102285665B1 (ko) | 학습 커리큘럼 제공 방법, 시스템 및 장치 | |
CN104915658B (zh) | 一种基于情感分布学习的情感成分分析方法及其系统 | |
CN108446676A (zh) | 基于有序编码及多层随机投影的人脸图像年龄判别方法 | |
CN110210380A (zh) | 基于表情识别与心理学测试生成性格的分析方法 | |
CN108154133A (zh) | 基于非对称联合学习的人脸画像-照片识别方法 | |
Shih et al. | Development of deep learning framework for mathematical morphology | |
CN107633527A (zh) | 基于全卷积神经网络的目标追踪方法及装置 | |
WO2018076130A1 (zh) | 物体识别模型的建立方法及物体识别方法 | |
US11289175B1 (en) | Method of modeling functions of orientation and adaptation on visual cortex | |
Dong | Educational behaviour analysis using convolutional neural network and particle swarm optimization algorithm | |
Kung et al. | A Study on Image Quality Assessment using Neural Networks and Structure Similarty. |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |