CN110188692B - 一种有效目标快速识别的强化循环级联方法 - Google Patents
一种有效目标快速识别的强化循环级联方法 Download PDFInfo
- Publication number
- CN110188692B CN110188692B CN201910464159.1A CN201910464159A CN110188692B CN 110188692 B CN110188692 B CN 110188692B CN 201910464159 A CN201910464159 A CN 201910464159A CN 110188692 B CN110188692 B CN 110188692B
- Authority
- CN
- China
- Prior art keywords
- layer
- formula
- target
- nonlinear
- sample
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 48
- 125000004122 cyclic group Chemical group 0.000 title claims abstract description 22
- 230000006870 function Effects 0.000 claims abstract description 20
- 239000011159 matrix material Substances 0.000 claims abstract description 18
- 238000013507 mapping Methods 0.000 claims abstract description 15
- 238000005457 optimization Methods 0.000 claims abstract description 13
- 238000000605 extraction Methods 0.000 claims description 17
- 230000004913 activation Effects 0.000 claims description 6
- 230000008602 contraction Effects 0.000 claims description 3
- 230000001186 cumulative effect Effects 0.000 claims description 3
- 238000012545 processing Methods 0.000 claims description 3
- 238000010606 normalization Methods 0.000 claims description 2
- 238000012549 training Methods 0.000 abstract description 4
- 230000007246 mechanism Effects 0.000 abstract description 3
- 238000004364 calculation method Methods 0.000 abstract 1
- 238000005728 strengthening Methods 0.000 abstract 1
- 239000010410 layer Substances 0.000 description 29
- 230000008569 process Effects 0.000 description 5
- 230000002708 enhancing effect Effects 0.000 description 4
- 238000003062 neural network model Methods 0.000 description 4
- 230000000007 visual effect Effects 0.000 description 4
- 230000000694 effects Effects 0.000 description 3
- 238000013528 artificial neural network Methods 0.000 description 2
- 238000013527 convolutional neural network Methods 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 230000001965 increasing effect Effects 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 239000013598 vector Substances 0.000 description 2
- 230000000052 comparative effect Effects 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 238000003909 pattern recognition Methods 0.000 description 1
- 230000001737 promoting effect Effects 0.000 description 1
- 230000000306 recurrent effect Effects 0.000 description 1
- 238000004088 simulation Methods 0.000 description 1
- 239000002356 single layer Substances 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
- G06F18/2148—Generating training patterns; Bootstrap methods, e.g. bagging or boosting characterised by the process organisation or structure, e.g. boosting cascade
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V2201/00—Indexing scheme relating to image or video recognition or understanding
- G06V2201/07—Target detection
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02T—CLIMATE CHANGE MITIGATION TECHNOLOGIES RELATED TO TRANSPORTATION
- Y02T10/00—Road transport of goods or passengers
- Y02T10/10—Internal combustion engine [ICE] based vehicles
- Y02T10/40—Engine management systems
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Bioinformatics & Computational Biology (AREA)
- General Engineering & Computer Science (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Multimedia (AREA)
- Image Analysis (AREA)
Abstract
一种有效目标快速识别的强化循环级联方法。本发明提出了一种强化循环级联方法用于快速有效的目标识别任务,该方法包含循环级联模型,非线性映射操作以及分类识别模块。级联模型能够提取样本的多样化特征,其中低层特征能够逐层转换为高层特征,循环机制在强化样本特征的同时,还能轻量化网络模型;非线性映射操作增强了样本特征的非线性关系;建立损失函数,采用导数求逆矩阵的方式,直接计算网络权重,避免迭代优化算法的耗时问题,同时完成快速有效的目标识别任务。本发明通过利用目标区域定位和深度特征学习相结合的方法,解决了传统目标识别方法训练耗时,识别精度低的问题;避免了传统算法中复杂的模型建立,减小计算成本;具有训练时间短,识别精度高特点。
Description
技术领域
本发明属于计算机视觉技术领域,尤其涉及一种有效目标快速识别的强化循环级联方法。
背景技术
近年来,随着计算机视觉研究的飞速发展,许多神经网络模型被陆续提出,并应用在各个领域。深度网络模型因其优越的特征提取能力成为推动该项研究的主要动力。常见的深度网络模型如2014年推出的VGGNet(K.Simonyan and A.Zisserman,“Very deepconvolutional networks for large-scale image recognition”,arXiv preprintarXiv:1409.1556,2014)以及2015年推出的GoogLeNet(C.Szegedy,W.Liu,Y.-Q.Jia,etal,“Going deeper with convolutions”.In IEEE Conference on Computer Vision andPattern Recognition,pp.1-9,Boston,MA,USA,June2015.IEEE)。上述深度神经网络模型通过纵向增加网络层数和卷积核数量用于更好的提取样本特征。这种方式会导致网络模型超参数众多,需要消耗大量时间训练网络模型以此达到较好的收敛效果,且容易产生过拟合现象。宽度学习系统(Broad Learning System,BLS)作为深度网络模型的另一种选择(C.L.P.Chen,Z.Liu,“Broad learning system:an effective and efficientincremental learning system without the need for deep architecture”.IEEETransactions on Neural Networks and Learning Systems,29(1):10-24,2018),因其具有网络参数少,学习速度快等特点,许多基于BLS的网络模型被广泛的应用于多个领域,如用于图像识别的GBLS(J.W.Jin,Z.L.Liu,C.L.P.Chen,“Discriminative graphregularized broad learning system for image recognition”.Science ChinaInformation Sciences,61(11):112209,2018),以及用于时间序列预测的RBLS(M.Xu,M.Han,C.L.P.Chen,et al.“Recurrent Broad Learning Systems for Time SeriesPrediction”.IEEE Transactions on Cybernetics.doi:10.1109/TCYB.2018.2863020)。与深度神经网络模型不同的是,BLS可视为单层神经网络,通过横向的增加特征提取模块提升网络性能。BLS相比于深度神经网络模型,虽然其网络优化速度快,简单的特征提取模块,使得BLS的特征提取能力不足。综上,两类方法各有特点,前者的特征表达能力较好,但网络训练耗时;后者学习速度快,但网络的特征提取能力不足。
发明内容
本发明目的在于克服现有技术的不足,建立用于提取样本特征的循环级联模型;采用非线性映射操作增强样本特征之间的非线性关系;利用导数求逆矩阵的方式直接计算网络权重,实现快速有效的目标识别任务,具体由以下技术方案实现:
所述有效目标快速识别的强化循环级联方法,包括如下步骤:
步骤1)进行样本归一化处理;
步骤2)特征提取:针对目标识别对象,建立循环级联模型,并提取输入图像的样本特征;
步骤3)特征映射:将所提取的样本特征映射到的非线性空间,得到非线性特征;
步骤4)分类识别:建立损失函数,优化网络权重,实现目标识别。
所述有效目标快速识别的强化循环级联方法的进一步设计在于,所述步骤2)具体包括如下步骤:
步骤2-1)搭建循环级联模型:假设循环迭代次数为K,级联模型中包含L个隐含层用于特征提取,其中第l隐含层包含nl个特征图;
步骤2-2)对于任意第k次循环过程,Xk为模型输入,根据式(1)进行特征提取:
式(1)中,分别为第l层的第i个特征图以及所对应的权重;/>为激活函数;Zl为第l层的输出,同时也是第(l+1)层的输入;当l=1时,Z0=Xk;当l=L时进入第(k+1)次迭代,此时根据式(2)对模型输入进行更新;
步骤2-3)在第K次循环结束后得到每一层的输出并定义Z≡[Z1,...,ZL]。
步骤2-2-1)建立优化目标,根据式(3)通过L1范数约束目标函数获得稀疏化权重;
所述有效目标快速识别的强化循环级联方法的进一步设计在于,所述步骤3)具体为将步骤2)中提取的样本特征根据式(6)进行非线性映射,
式(6)中,Wh是随机生成的正交矩阵,s是收缩因子,H,ξ分别对应为非线性特征和非线性激活函数,Z为步骤2)中提取的样本特征。
所述有效目标快速识别的强化循环级联方法的进一步设计在于,所述步骤4)包括如下步骤:
步骤4-1)经过特征提取和非线性映射后,得到特征矩阵[Z|H],根据式(6)通过建立带有L2范数的损失函数优化网络权重,
2[Z|H]T(Y-[Z|H]W)-2λ1W=0 (8)
步骤4-3)得到最终的网络权重W;
W=([Z|H]T[Z|H]+λ1I)-1[Z|H]TY (9)
式(9)中,λ1是惩罚因子,I是单位矩阵。
本发明的优点如下:
本发明的有效目标快速识别的强化循环级联方法采用循环级联模型提取样本特征,级联模型能够提取样本的多样化特征,低级特征能够逐层转换为高层特征,循环机制在强化特征的同时更能简化网络模型;采用非线性映射操作增强样本特征之间的非线性关系;利用导数求逆矩阵的方式直接计算网络权重,实现快速有效的目标识别任务。
附图说明
图1为本发明方法的流程示意图。
图2为本发明方法的可行性分析图。
图3(a)为本发明方法的识别精度示意图。
图3(b)为本发明方法的识别精度示意图。
具体实施方式
下面结合附图对本发明的技术方案进一步说明。
如图1,本实施例的快速有效目标识别的强化循环级联方法,针对目标对象,设计循环级联模型提取样本特征,然后将所提特征进行非线性映射,最后建立损失函数,利用导数求逆的方式直接计算网络权重,实现快速有效的目标识别,具体实现包括以下步骤:
步骤1):将原始样本的像素值归一化到[-1,+1],处理方式如下:
其中ymax,ymin分别表示+1,-1;xmax,xmin分别表示原始样本向量中的像素最大值和最小值;x,y分别表示原始样本中的任意像素值和归一化后的数值。
步骤2):搭建循环级联模型提取样本特征。假设循环迭代次数为K,级联模型中包含L个隐含层用于特征提取,其中第l隐含层包含nl个特征图;对于任意第k次循环过程,Xk为模型输入,其特征提取过程如下:
其中X1=X∈RN×M为原始样本输入,N,M分别表示样本数量和维度。前一次循环过程中,级联结构所提取的特征会被下一次循环强化,当级联结构确定后,只需要调整循环次数就可以实现深度级联的效果,但不会增加网络参数,实现轻量化网络的效果。第K次循环结束后得到每一层的输出并定义Z≡[Z1,...,ZL]。任意权重的优化方式具体为:首先建立优化目标,为了获得稀疏化权重,利用L1范数约束目标函数。
步骤3):样本特征的非线性映射。正交矩阵的向量之间相互独立,因此随机生成正交矩阵并将步骤2)所提取的样本特征Z进行非线性映射为H,具体映射过程如下:
其中Wh是随机生成的正交矩阵,s是收缩因子,H,ξ分别为非线性特征和非线性激活函数。
步骤4):经过特征提取和非线性映射后,得到特征矩阵[Z|H],为了更好的实现目标识别,建立带有L2范数的损失函数,用于优化网络权重。过程如下:
2[Z|H]T(Y-[Z|H]W)-2λ1W=0 (9)
可以得到最终的网络权重W
W=([Z|H]T[Z|H]+λ1I)-1[Z|H]TY (10)
其中λ1是惩罚因子,I是单位矩阵。
对本发明方法的可行性进行分析,实验结果参见图2,通过与其他算法的可视图对比发现,本发明方法通过采用循环级联模型更能提取样本的关键性特征,直观可视图优于其他算法。另外,本发明方法的第3层可视图相比前两层更加丰富,说明多层级联能够逐层强化样本特征。不仅能够提取样本的主要特征还能提取样本的细节信息,有效的提取样本的通过对比不同层的可视化图,
对本发明方法的多层级联性能表现展开了讨论,实验结果如图3(a)和图3(b)。从图3(a)可知,任意数据集上,识别精度随着级联层数的增加而上升,当达到最大值后识别精度趋于平稳,甚至开始下降,主要因为级联层数的增加导致网络复杂度增加,产生过拟合。另外图3(b),表明级联层数的增加会合理地消耗更多的时间用于特征提取。
对比了本发明方法和其他算法在多个分类数据集上的性能表现进行了实验仿真,实验结果表1所示。
表1对比性算法的识别率及训练时间
由表1中可知,实验选取了卷积神经网络(CNN),深度置信网络(DBN),堆栈式稀疏编码(SAE)以及BLS作为对比算法,分别在人脸数据集ORL,EYaleB,UMIST车型数据集BIT以及MNIST,NORB,F-mnist等7个数据集上实验仿真。实验结果表明,在任意数据集上,本发明方法的识别精度均高于其他方法,在模型的训练时间方面,本发明方法在部分数据集上的时间消耗最小,个别数据集上的时间消耗高于BLS方法,但仍然远远低于其他3种方法。综上由实验数据可知,本发明所提出的强化循环级联方法对目标识别任务具有识别精度高,识别速度快特点。实验设备配置为,操作系统和版本Windows 10,3.20Ghz主频四核Corei7CPU,8GRAM,运行环境为Matlab2016b 64-bit。
本实施例针对目标对象,建立循环级联模型用于提取样本特征,其中多层级联的网络模型能够将低级特征逐层转换为高层特征;循环机制不仅能够降低网络复杂度,而且在每次循环过程中还能强化所提取的特征;非线性映射处理增强了样本特征的非线性;建立损失函数,采用导数求逆矩阵的方式,直接计算网络权重,避免迭代优化算法的耗时问题,同时完成快速有效的目标识别任务。
以上所述,仅为本发明较佳的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到的变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应该以权利要求的保护范围为准。
Claims (4)
1.一种有效目标快速识别的强化循环级联方法,其特征在于包括如下步骤:
步骤1)进行样本归一化处理;
步骤2)特征提取:针对目标识别对象,建立循环级联模型,并提取输入图像的样本特征;
步骤3)特征映射:将所提取的样本特征映射到的非线性空间,得到非线性特征;
步骤4)分类识别:建立损失函数,优化网络权重,实现目标识别;
所述步骤2)具体包括如下步骤:
步骤2-1)搭建循环级联模型:假设循环迭代次数为K,级联模型中包含L个隐含层用于特征提取,其中第l隐含层包含nl个特征图;
步骤2-2)对于任意第k次循环过程,Xk为模型输入,根据式(1)进行特征提取:
式(1)中,分别为第l层的第i个特征图以及所对应的权重;/>为激活函数;Zl为第l层的输出,同时也是第l+1层的输入;当l=1时,Z0=Xk;当l=L时进入第k+1次迭代,此时根据式(2)对模型输入进行更新;
步骤2-3)在第K次循环结束后得到每一层的输出并定义Z≡[Z1,...,ZL]。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910464159.1A CN110188692B (zh) | 2019-05-30 | 2019-05-30 | 一种有效目标快速识别的强化循环级联方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910464159.1A CN110188692B (zh) | 2019-05-30 | 2019-05-30 | 一种有效目标快速识别的强化循环级联方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110188692A CN110188692A (zh) | 2019-08-30 |
CN110188692B true CN110188692B (zh) | 2023-06-06 |
Family
ID=67719057
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910464159.1A Active CN110188692B (zh) | 2019-05-30 | 2019-05-30 | 一种有效目标快速识别的强化循环级联方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110188692B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113283530B (zh) * | 2021-06-08 | 2022-11-15 | 重庆大学 | 基于级联特征块的图像分类系统 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108510012A (zh) * | 2018-05-04 | 2018-09-07 | 四川大学 | 一种基于多尺度特征图的目标快速检测方法 |
CN108805167A (zh) * | 2018-05-04 | 2018-11-13 | 江南大学 | 一种基于Laplace函数约束的稀疏深度置信网络图像分类方法 |
CN108846323A (zh) * | 2018-05-28 | 2018-11-20 | 哈尔滨工程大学 | 一种面向水下目标识别的卷积神经网络优化方法 |
CN109214441A (zh) * | 2018-08-23 | 2019-01-15 | 桂林电子科技大学 | 一种细粒度车型识别系统及方法 |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105389598A (zh) * | 2015-12-28 | 2016-03-09 | 中国石油大学(华东) | 面向软件缺陷数据的特征选择及分类方法 |
CN106897737B (zh) * | 2017-01-24 | 2019-10-11 | 北京理工大学 | 一种基于超限学习机的高光谱遥感图像地物分类方法 |
CN107480777A (zh) * | 2017-08-28 | 2017-12-15 | 北京师范大学 | 基于伪逆学习的稀疏自编码器快速训练方法 |
CN108564029B (zh) * | 2018-04-12 | 2020-12-01 | 厦门大学 | 基于级联多任务学习深度神经网络的人脸属性识别方法 |
CN109492556B (zh) * | 2018-10-28 | 2022-09-20 | 北京化工大学 | 面向小样本残差学习的合成孔径雷达目标识别方法 |
-
2019
- 2019-05-30 CN CN201910464159.1A patent/CN110188692B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108510012A (zh) * | 2018-05-04 | 2018-09-07 | 四川大学 | 一种基于多尺度特征图的目标快速检测方法 |
CN108805167A (zh) * | 2018-05-04 | 2018-11-13 | 江南大学 | 一种基于Laplace函数约束的稀疏深度置信网络图像分类方法 |
CN108846323A (zh) * | 2018-05-28 | 2018-11-20 | 哈尔滨工程大学 | 一种面向水下目标识别的卷积神经网络优化方法 |
CN109214441A (zh) * | 2018-08-23 | 2019-01-15 | 桂林电子科技大学 | 一种细粒度车型识别系统及方法 |
Also Published As
Publication number | Publication date |
---|---|
CN110188692A (zh) | 2019-08-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108133188B (zh) | 一种基于运动历史图像与卷积神经网络的行为识别方法 | |
CN110020682B (zh) | 一种基于小样本学习的注意力机制关系对比网络模型方法 | |
US20190228268A1 (en) | Method and system for cell image segmentation using multi-stage convolutional neural networks | |
CN111695469A (zh) | 轻量化深度可分离卷积特征融合网的高光谱图像分类方法 | |
CN110135460B (zh) | 基于vlad卷积模块的图像信息强化方法 | |
Chang et al. | Automatic channel pruning via clustering and swarm intelligence optimization for CNN | |
WO2021042857A1 (zh) | 图像分割模型的处理方法和处理装置 | |
CN111353534B (zh) | 一种基于自适应分数阶梯度的图数据类别预测方法 | |
CN110598746A (zh) | 一种基于ode求解器自适应的场景分类方法 | |
CN114091650A (zh) | 一种深度卷积神经网络架构的搜索方法和应用 | |
CN110188692B (zh) | 一种有效目标快速识别的强化循环级联方法 | |
CN114882278A (zh) | 一种基于注意力机制和迁移学习的轮胎花纹分类方法和装置 | |
CN114463340A (zh) | 一种边缘信息引导的敏捷型遥感图像语义分割方法 | |
CN114581789A (zh) | 一种高光谱图像分类方法及系统 | |
CN111882028B (zh) | 用于卷积神经网络的卷积运算装置 | |
Wang et al. | psoResNet: An improved PSO-based residual network search algorithm | |
CN116883746A (zh) | 一种基于分区池化超图神经网络的图节点分类方法 | |
Xu et al. | An efficient channel-level pruning for CNNs without fine-tuning | |
CN116433980A (zh) | 脉冲神经网络结构的图像分类方法、装置、设备及介质 | |
Hao et al. | Architecture self-attention mechanism: Nonlinear optimization for neural architecture search | |
CN115170898A (zh) | 一种高效的遥感图像自监督学习训练方法 | |
CN111401155B (zh) | 基于隐式欧拉跳跃连接的残差神经网络的图像识别方法 | |
Sun et al. | Efficient search of comprehensively robust neural architectures via multi-fidelity evaluation | |
TWI763975B (zh) | 降低類神經網路之運算複雜度的系統與方法 | |
WO2021055364A1 (en) | Efficient inferencing with fast pointwise convolution |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |