CN112686323B - 一种基于卷积的极限学习机的图像识别方法 - Google Patents
一种基于卷积的极限学习机的图像识别方法 Download PDFInfo
- Publication number
- CN112686323B CN112686323B CN202011642980.7A CN202011642980A CN112686323B CN 112686323 B CN112686323 B CN 112686323B CN 202011642980 A CN202011642980 A CN 202011642980A CN 112686323 B CN112686323 B CN 112686323B
- Authority
- CN
- China
- Prior art keywords
- image
- matrix
- convolution
- training
- learning machine
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Landscapes
- Image Analysis (AREA)
Abstract
本发明公开了一种基于卷积的极限学习机的图像识别方法,通过采用随机卷积运算提取图像的图像特征向量完成对图像的预处理,采用图像特征向量及标签构建的训练样本集训练极限学习机图像识别模型,由于随机卷积运算中卷积核为随机生成且无需调整,能够很大程度上解决计算负担过重的问题,有效提高了计算效率,在一定程度上能够满足图像识别的需要,同时为更准确地进行图像识别提供了新思路和新途径。
Description
技术领域
本发明涉及基于深度学习的图像识别技术领域,具体涉及一种基于卷积的极限学习机的图像识别方法。
背景技术
图像识别是信息时代的关键技术之一,利用图像识别技术能够完成传统传感器技术无法实现的任务,同时借助图像识别与多源信息的融合,能够让监测效果更佳精确。随着计算机技术的不断发展,计算机计算能力进一步提升,对信息的处理能力获得了极大的改善。依托于智能图像识别算法,可以获得识别准确率的提升,也能够降低识别所需的时间,在未来人工智能领域将发挥重要的作用。在过去几年中,卷积神经网络已成为图像识别领域中用于各种任务的主流机器学习方法。然而,传统的卷积神经网络采用基于梯度下降的反向传播方法进行训练,伴随卷积神经网络参数数目的增大,网络训练时间变长。因此,如何在保证图像识别准确率的情况下缩短神经网络的训练时间具有十分重要的意义。
发明内容
有鉴于此,本发明提供了一种基于卷积的极限学习机的图像识别方法,利用卷积运算随机提取图像特征,构建基于卷积的极限学习机的图像识别模型,在此基础上利用基于自适应衰减率的梯度下降算法求取隐含层节点的输出权值矩阵,实现对极限学习机模型的训练,从而缩短神经网络的训练时间,提高计算效率和图像识别准确率。
本发明提供的一种基于卷积的极限学习机的图像识别方法,包括以下步骤:
步骤1、采集图像形成图像数据集,对所述图像进行基于卷积运算的预处理得到图像特征向量,由所述图像特征向量与所述图像特征向量相应的标记形成训练样本;由所有所述图像对应的所述训练样本形成训练样本集;
步骤2、采用极限学习机理论,建立基于卷积的极限学习机图像识别模型,如公式(1)所示:
U1×N=β1×k·Jk×N (1)
其中,U1×N∈R1×N表示图像识别模型的输出矩阵,N表示样本个数,k表示隐含层节点的个数,Jk×N表示隐含层节点输出矩阵,S(p-n-m+1+q-b-s+1)×N∈R(p-n-m+1+q-b-s+1)×N表示极限学习机模型的输入数据,(p-n-m+1+q-b-s+1)表示每个输入样本向量的特征维数,αk×(p-n-m+1+q-b-s+1)表示输入到隐含层节点之间的输入权值矩阵,λk×N表示隐含层节点的偏置矩阵;为可选择的非线性激活函数;αk×(p-n-m+1+q-b-s+1)和λk×N均为随机生成,且生成后保持不变;
步骤3、采用所述步骤1形成的所述训练样本集,完成所述基于卷积的极限学习机图像识别模型的训练;
步骤4、采用所述步骤1中的所述基于卷积运算的预处理提取待识别图像的待识别图像特征向量,将所述待识别图像特征向量输入训练得到所述基于卷积的极限学习机图像识别模型,得到所述待识别图像的类型。
进一步地,所述步骤1中的对所述图像进行基于卷积运算的预处理得到图像特征向量的过程为:随机生成卷积核,且所述卷积核不变,采用所述卷积核与所述图像进行卷积运算得到所述图像特征向量。
进一步地,所述步骤1中的所述图像数据集为{Xi,Xi∈Rp×q×3,i=1,2,...,N},其中,Xi为所述图像,p为所述图像的高度,q为所述图像的宽度,3为所述图像的RGB三个颜色通道,N为所述图像的总数,i为所述图像的编号;所述图像Xi为三元数组,表示为:Xi=[X1i,X2i,X3i],X1i表示图像Xi的R通道的分量,X2i表示图像Xi的G通道的分量,X3i表示图像Xi的B通道的分量。
进一步地,所述步骤1中对所述图像数据进行基于卷积运算的预处理得到图像特征向量,包括以下步骤:
其中,Fi (p-n+1)×(q-b+1)∈R(p-n+1)×(q-b+1)为卷积层的输出矩阵,Wn×b为二维卷积核,n、b分别为Wn×b的尺寸,*表示卷积运算;Wn×b为随机生成,且生成后保持不变;
采用公式(4)对所述卷积层的输出矩阵进行非线性映射:
Hi (p-n+1)×(q-b+1)=φ(Fi (p-n+1)×(q-b+1)) (4);
其中,Hi (p-n+1)×(q-b+1)为输出特征映射矩阵,φ为非线性激活函数;
采用公式(5)对所述输出特征映射矩阵进行池化操作:
进一步地,所述步骤4.2中采用的非线性激活函数包括Sigmoid函数。
进一步地,所述步骤3中采用所述步骤1形成的所述训练样本完成所述基于卷积的极限学习机图像识别模型的训练,为采用基于自适应衰减率的梯度下降算法求取隐含层节点的输出权值矩阵的方式,包括以下步骤:
步骤6.2、采用公式(6)计算所述第l次迭代训练的梯度矩阵:
其中,Y1×N为所述极限学习机模型的理想输出矩阵;
步骤6.3、采用公式(7)计算第l次迭代训练的衰减率:
步骤6.4、采用公式(8)计算所述第l次迭代训练的一阶矩估计矩阵:
步骤6.5、采用公式(9)计算所述隐含层节点输出权值矩阵:
有益效果:
1、本发明采用随机卷积运算提取图像的图像特征向量完成对图像的预处理,采用图像特征向量及标签构建的训练样本集训练极限学习机图像识别模型,由于随机卷积运算中卷积核为随机生成且无需调整,能够很大程度上解决计算负担过重的问题,有效提高了计算效率,在一定程度上能够满足图像识别的需要,同时为更准确地进行图像识别提供了新思路和新途径。
2、本发明通过在的极限学习机图像识别模型的训练过程中,采用基于自适应衰减率的梯度下降算法求取隐含层节点的输出权值矩阵,使模型较易收敛,从而提高了极限学习机模型的学习速度、缩短了模型的训练时间,同时有效提高了算法的泛化性能。
具体实施方式
下面列举实施例,对本发明进行详细描述。
本发明提供了一种基于卷积的极限学习机的图像识别方法,其基本思想是:获取图像数据集,利用卷积运算对图像数据集进行预处理获得图像特征向量,由图像特征向量及其所对应的图像类型形成训练样本,采用训练样本训练建立的基于卷积的极限学习机的图像识别模型,在此基础上,利用基于自适应衰减率的梯度下降算法求取隐含层节点的输出权值矩阵,从而完成对极限学习机模型的训练。
本发明提供的一种基于卷积的极限学习机的图像识别方法,具体步骤如下:
步骤1、采集图像数据,对图像数据进行预处理提取图像特征向量,由图像特征向量与相应标记形成训练样本。
步骤1.1、采集图像数据。
采集图像Xi,形成图像数据集合{Xi,Xi∈Rp×q×3,i=1,2,...,N},其中,p是图像的高度,q是图像的宽度,3是RGB图像的三个颜色通道,N是图像的总数,i是图像的编号。图像Xi为三元数组,表示为:Xi=[X1i,X2i,X3i],X1i表示图像Xi的R通道的分量,X2i表示图像Xi的G通道的分量,X3i表示图像Xi的B通道的分量。
Hi (p-n+1)×(q-b+1)=φ(Fi (p-n+1)×(q-b+1)) (3)
其中,Fi (p-n+1)×(q-b+1)∈R(p-n+1)×(q-b+1)表示卷积层的输出矩阵,Wn×b表示二维卷积核,n、b表示卷积核的尺寸,Wn×b为随机生成,且生成后保持不变,*表示卷积运算,表示卷积层的输入数据;Hi (p-n+1)×(q-b+1)表示输出特征映射矩阵,φ为可选择的非线性激活函数;表示池化层的输出矩阵,Pm×s表示二维卷积核,m、s表示卷积核的尺寸,卷积核中所有元素均为1,且满足p>n>m,p-n-m>0,q>b>s,q-b-s>0。
步骤1.4、遍历{Xi,Xi∈Rp×q×3,i=1,2,...,N}中的所有输入Xi,重复执行步骤1.2和步骤1.3,形成包含N个图像的特征向量的图像特征矩阵:
由图像的图像特征矩阵及图像对应的标记构成模型的训练样本集,训练样本集为如下公式所示:
{Si (p-n-m+1+q-b-s+1)×1,Yi|Si∈R(p-n-m+1+q-b-s+1)×1,Yi∈R,i=1,2,...,N}
其中,Si (p-n-m+1+q-b-s+1)×1是模型的输入,表示第i张图像Xi的特征向量;Yi表示第i张图像Xi对应的标记。
步骤2、建立基于卷积的极限学习机的图像识别模型,如公式(5)所示:
U1×N=β1×k·Jk×N (5)
其中,U1×N∈R1×N表示图像识别模型的输出矩阵,N表示样本个数,k表示隐含层节点的个数,Jk×N表示隐含层节点输出矩阵,S(p-n-m+1+q-b-s+1)×N∈R(p-n-m+1+q-b-s+1)×N表示极限学习机模型的输入数据,(p-n-m+1+q-b-s+1)表示每个输入样本向量的特征维数,αk×(p-n-m+1+q-b-s+1)表示输入到隐含层节点之间的输入权值矩阵,λk×N表示隐含层节点的偏置矩阵;为可选择的非线性激活函数;αk×(p-n-m+1+q-b-s+1)和λk×N均为随机生成,且生成后保持不变。
步骤3、采用步骤1生成的训练样本集对基于卷积的极限学习机的图像识别模型进行训练,本发明采用基于自适应衰减率的梯度下降算法求解隐含层节点的输出权值矩阵,完成基于卷积的极限学习机的图像识别模型的训练。
训练样本分为两个部分,一部分用于训练,另一部分用于测试;当极限学习机模型的训练完成后,利用测试样本进行测试。
步骤4、使用中,采用本发明提出的图像预处理方法对待识别图像进行处理,得到待识别图像的图像特征向量,将图像特征向量输入训练完成的基于卷积的极限学习机的图像识别模型,得到待识别图像的类型。
本发明的步骤3中使用的基于自适应衰减率的梯度下降算法求解隐含层节点的输出权值矩阵,具体包括如下步骤:
定义,Y1×N为所述极限学习机模型的理想输出矩阵;
步骤3.2、采用公式(6)计算第l次迭代训练的梯度矩阵;
步骤3.3、采用公式(7)计算第l次迭代训练的衰减率;
步骤3.4、采用公式(8)计算第l次迭代训练的一阶矩估计矩阵;
步骤3.5、采用公式(9)计算隐含层节点的输出权值矩阵;
上述过程中,采用基于自适应衰减率的梯度下降算法求解隐含层节点的输出权值矩阵,使模型较易收敛,从而提高了极限学习机模型的学习速度、缩短了模型的训练时间。
综上所述,以上仅为本发明的较佳实施例而已,并非用于限定本发明的保护范围。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (3)
1.一种基于卷积的极限学习机的图像识别方法,其特征在于,包括以下步骤:
步骤1、采集图像形成图像数据集,对所述图像进行基于卷积运算的预处理得到图像特征向量,由所述图像特征向量与所述图像特征向量相应的标记形成训练样本;由所有所述图像对应的所述训练样本形成训练样本集;
其中,所述图像数据集为{Xi,Xi∈Rp×q×3,i=1,2,...,N},其中,Xi为所述图像,p为所述图像的高度,q为所述图像的宽度,3为所述图像的RGB三个颜色通道,N为所述图像的总数,i为所述图像的编号;所述图像Xi为三元数组,表示为:Xi=[X1i,X2i,X3i],X1i表示图像Xi的R通道的分量,X2i表示图像Xi的G通道的分量,X3i表示图像Xi的B通道的分量;
对所述图像数据进行基于卷积运算的预处理得到图像特征向量,包括以下步骤:
其中,Fi (p-n+1)×(q-b+1)∈R(p-n+1)×(q-b+1)为卷积层的输出矩阵,Wn×b为二维卷积核,n、b分别为Wn×b的尺寸,*表示卷积运算;Wn×b为随机生成,且生成后保持不变;
采用公式(4)对所述卷积层的输出矩阵进行非线性映射:
Hi (p-n+1)×(q-b+1)=φ(Fi (p-n+1)×(q-b+1)) (4);
其中,Hi (p-n+1)×(q-b+1)为输出特征映射矩阵,φ为非线性激活函数;
采用公式(5)对所述输出特征映射矩阵进行池化操作:
步骤2、采用极限学习机理论,建立基于卷积的极限学习机图像识别模型,如公式(1)所示:
U1×N=β1×k·Jk×N (1)
其中,U1×N∈R1×N表示图像识别模型的输出矩阵,N表示样本个数,k表示隐含层节点的个数,Jk×N表示隐含层节点输出矩阵,S(p-n-m+1+q-b-s+1)×N∈R(p-n-m+1+q-b-s+1)×N表示极限学习机模型的输入数据,(p-n-m+1+q-b-s+1)表示每个输入样本向量的特征维数,αk×(p-n-m+1+q-b-s+1)表示输入到隐含层节点之间的输入权值矩阵,λk×N表示隐含层节点的偏置矩阵;为可选择的非线性激活函数;αk×(p-n-m+1+q-b-s+1)和λk×N均为随机生成,且生成后保持不变;
步骤3、采用所述步骤1形成的所述训练样本集,完成所述基于卷积的极限学习机图像识别模型的训练;
所述基于卷积的极限学习机图像识别模型的训练,为采用基于自适应衰减率的梯度下降算法求取隐含层节点的输出权值矩阵的方式,包括以下步骤:
步骤3.2、采用公式(6)计算所述第l次迭代训练的梯度矩阵:
其中,Y1×N为所述极限学习机模型的理想输出矩阵;
步骤3.3、采用公式(7)计算第l次迭代训练的衰减率:
步骤3.4、采用公式(8)计算所述第l次迭代训练的一阶矩估计矩阵:
步骤3.5、采用公式(9)计算所述隐含层节点输出权值矩阵:
步骤4、采用所述步骤1中的所述基于卷积运算的预处理提取待识别图像的待识别图像特征向量,将所述待识别图像特征向量输入训练得到所述基于卷积的极限学习机图像识别模型,得到所述待识别图像的类型。
2.根据权利要求1所述的图像识别方法,其特征在于,所述步骤1中的对所述图像进行基于卷积运算的预处理得到图像特征向量的过程为:随机生成卷积核,且所述卷积核不变,采用所述卷积核与所述图像进行卷积运算得到所述图像特征向量。
3.根据权利要求1所述的图像识别方法,其特征在于,所述步骤1.2中采用的非线性激活函数包括Sigmoid函数。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011642980.7A CN112686323B (zh) | 2020-12-30 | 2020-12-30 | 一种基于卷积的极限学习机的图像识别方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011642980.7A CN112686323B (zh) | 2020-12-30 | 2020-12-30 | 一种基于卷积的极限学习机的图像识别方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112686323A CN112686323A (zh) | 2021-04-20 |
CN112686323B true CN112686323B (zh) | 2022-09-30 |
Family
ID=75456870
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011642980.7A Active CN112686323B (zh) | 2020-12-30 | 2020-12-30 | 一种基于卷积的极限学习机的图像识别方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112686323B (zh) |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104700078A (zh) * | 2015-02-13 | 2015-06-10 | 武汉工程大学 | 一种基于尺度不变特征极限学习机的机器人场景识别方法 |
CN106779090A (zh) * | 2016-12-15 | 2017-05-31 | 南开大学 | 一种基于自适应Dropout非负矩阵分解的特征学习模型 |
CN107103338A (zh) * | 2017-05-19 | 2017-08-29 | 杭州电子科技大学 | 融合卷积特征和集成超限学习机的sar目标识别方法 |
CN107133562A (zh) * | 2017-03-17 | 2017-09-05 | 华南理工大学 | 一种基于极限学习机的手势识别方法 |
CN109117951A (zh) * | 2018-01-15 | 2019-01-01 | 重庆大学 | 基于bp神经网络的概率潮流在线计算方法 |
CN110751005A (zh) * | 2018-07-23 | 2020-02-04 | 合肥工业大学 | 融合深度感知特征和核极限学习机的行人检测方法 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20190042952A1 (en) * | 2017-08-03 | 2019-02-07 | Beijing University Of Technology | Multi-task Semi-Supervised Online Sequential Extreme Learning Method for Emotion Judgment of User |
-
2020
- 2020-12-30 CN CN202011642980.7A patent/CN112686323B/zh active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104700078A (zh) * | 2015-02-13 | 2015-06-10 | 武汉工程大学 | 一种基于尺度不变特征极限学习机的机器人场景识别方法 |
CN106779090A (zh) * | 2016-12-15 | 2017-05-31 | 南开大学 | 一种基于自适应Dropout非负矩阵分解的特征学习模型 |
CN107133562A (zh) * | 2017-03-17 | 2017-09-05 | 华南理工大学 | 一种基于极限学习机的手势识别方法 |
CN107103338A (zh) * | 2017-05-19 | 2017-08-29 | 杭州电子科技大学 | 融合卷积特征和集成超限学习机的sar目标识别方法 |
CN109117951A (zh) * | 2018-01-15 | 2019-01-01 | 重庆大学 | 基于bp神经网络的概率潮流在线计算方法 |
CN110751005A (zh) * | 2018-07-23 | 2020-02-04 | 合肥工业大学 | 融合深度感知特征和核极限学习机的行人检测方法 |
Non-Patent Citations (3)
Title |
---|
Fault Diagnosis of Tennessee-Eastman Process Using Orthogonal Incremental Extreme Learning Machine Based on Driving Amount;Zou Weidong 等;《IEEE Transactions on Cybernetics》;IEEE;20180521;全文 * |
基于混合卷积自编码极限学习机的RGB-D物体识别;殷云华等;《红外与激光工程》;20180225(第02期);全文 * |
极限学习机综述;陆思源等;《测控技术》;20181018(第10期);全文 * |
Also Published As
Publication number | Publication date |
---|---|
CN112686323A (zh) | 2021-04-20 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110532900B (zh) | 基于U-Net和LS-CNN的人脸表情识别方法 | |
CN108108677A (zh) | 一种基于改进的cnn人脸表情识别方法 | |
CN112766386B (zh) | 一种基于多输入多输出融合网络的广义零样本学习方法 | |
CN108021947B (zh) | 一种基于视觉的分层极限学习机目标识别方法 | |
CN107358293A (zh) | 一种神经网络训练方法及装置 | |
CN110046671A (zh) | 一种基于胶囊网络的文本分类方法 | |
CN107609638A (zh) | 一种基于线性解码器和插值采样优化卷积神经网络的方法 | |
CN108427921A (zh) | 一种基于卷积神经网络的人脸识别方法 | |
Yu et al. | Multi-target unsupervised domain adaptation without exactly shared categories | |
CN109344759A (zh) | 一种基于角度损失神经网络的亲属识别方法 | |
CN103942749B (zh) | 一种基于修正聚类假设和半监督极速学习机的高光谱地物分类方法 | |
CN111639719A (zh) | 基于时空运动和特征融合的足迹图像检索方法 | |
CN111028319A (zh) | 一种基于面部运动单元的三维非真实感表情生成方法 | |
Sun et al. | Deep tensor capsule network | |
CN104036242B (zh) | 基于Centering Trick卷积限制玻尔兹曼机的物体识别方法 | |
CN111126464A (zh) | 一种基于无监督域对抗领域适应的图像分类方法 | |
CN113011243A (zh) | 基于胶囊网络的面部表情分析方法 | |
CN114612660A (zh) | 一种基于多特征融合点云分割的三维建模方法 | |
CN113743474A (zh) | 基于协同半监督卷积神经网络的数字图片分类方法与系统 | |
CN112733602A (zh) | 关系引导的行人属性识别方法 | |
CN116188941A (zh) | 一种基于松弛标注的流形正则化宽度学习方法及系统 | |
CN117079098A (zh) | 一种基于位置编码的空间小目标检测方法 | |
Ning et al. | BDARS_CapsNet: Bi-directional attention routing sausage capsule network | |
CN114781503A (zh) | 一种基于深度特征融合的点击率预估方法 | |
CN114170657A (zh) | 融合注意力机制与高阶特征表示的面部情感识别方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |