CN109102010A - 一种基于双向神经网络结构的图像分类方法 - Google Patents

一种基于双向神经网络结构的图像分类方法 Download PDF

Info

Publication number
CN109102010A
CN109102010A CN201810845116.3A CN201810845116A CN109102010A CN 109102010 A CN109102010 A CN 109102010A CN 201810845116 A CN201810845116 A CN 201810845116A CN 109102010 A CN109102010 A CN 109102010A
Authority
CN
China
Prior art keywords
layer
layers
way blocks
matrix
network
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201810845116.3A
Other languages
English (en)
Other versions
CN109102010B (zh
Inventor
武传营
李凡平
石柱国
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
ISSA Technology Co Ltd
Original Assignee
Qingdao Isa Data Technology Co Ltd
Beijing Yisa Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Qingdao Isa Data Technology Co Ltd, Beijing Yisa Technology Co Ltd filed Critical Qingdao Isa Data Technology Co Ltd
Priority to CN201810845116.3A priority Critical patent/CN109102010B/zh
Publication of CN109102010A publication Critical patent/CN109102010A/zh
Application granted granted Critical
Publication of CN109102010B publication Critical patent/CN109102010B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2413Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on distances to training or reference patterns
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/084Backpropagation, e.g. using gradient descent

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Evolutionary Computation (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Software Systems (AREA)
  • Mathematical Physics (AREA)
  • Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Computing Systems (AREA)
  • Molecular Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Image Analysis (AREA)

Abstract

本发明公开了一种基于双向神经网络结构的图像分类方法,包括以下步骤:1.以Two‑Directional层替代传统卷积网络中的全连阶层,搭建基于双向神经的图像分类模型,2.网络前向传播,通过新增的变换矩阵L和R保持最后一层卷积的矩形结构,3.网络反向传播,更新网络的权重以及响应的变换矩阵L和R4,重复步骤2、3,微调双向神经网络,直到分类网络收敛,5.在训练得到的模型上通过前向传播得到图像的类别编号。本发明利用一种双向神经网络结构,在保证网络深度和宽度不变的前提下,通过设计变换矩阵对特征进行维度变换处理,保证卷积的矩阵形式,有效地保留了图像原始特征空间的结构信息,避免了全连接层中矩阵拉成向量过程中的空间结构信息损失。

Description

一种基于双向神经网络结构的图像分类方法
技术领域
本发明属于深度学习与人工智能领域,特别是指一种图像分类算法,用于大规模图像标注、属性分类问题。
背景技术
图像分类是人工智能研究的重要方向之一,在实际生活中有着众多的应用,例如,智能交通监控中车辆有无遮挡、悬挂车牌,农业卫星的农业与非农业地域的判定,以及百度推出的百度识图、谷歌的花卉识别等,如果图片的属性预测分类工作完全依靠人工,则需要投入大量的人力物力财力,使用基于深度学习的图像分类技术,可以快速、准确的进行图像分类。
当前,随着大数据时代的来临,如何通过海量样本提升模型的分类准确率成为当前的重要挑战和难点,图像分类算法在近些年得到了长足的进步,有些算法认为可通过增加网络的宽度可以提升特征的提取能力,进一步提升分类准确率,目前的算法都是依靠增加网络的宽度或者深度来提升模型的性能,如果想进一步提升算法性能,需要反复设计调整网络、训练微调模型,会耗费大量的人力物力,且并不能保证最终的分类效果得到提升。
发明内容
鉴于上述技术背景,本发明的目的在于:提供一种基于双向神经网络的图像分类方法,不需要重新设计新的网络模型,直接使用Two-Directional layer替换全连接层,避免了模型的繁杂训练过程,在现有模型的基础上就可以大幅提升模型的分类准确度。
为解决上述技术问题,本发明提供了一种基于双向神经网络的图像分类算法,包括以下步骤:
步骤S1,对于全连接层,第l层的输出可表述为下式;
Xl=f(Ul)
=f(Wl*Xl-1+bl)
其中,W表示该层的权重,b表示该层的偏置,f表示的激活函数。
步骤S2,假设第l层为双向神经网络层,前一层为l-1层,后一层为l+1层,这种层的定义可表述为以下式:
其中,m<a,n<b,L和R是变换矩阵,Tmn l是原始特征经过双向神经网络降维变换后的新特征。
步骤S3,因此在双向神经网络层中,第l层的输出可表述成以下式:
其中f(·)表示激活操作,采用RELU激活函数f(x)=max(0,x),解决训练过程中的梯度消失问题;其中Wl为第l层的权重,bl为第l层的偏置,RT L就相当于原先完全连接层中的权重矩阵Wl
步骤S4,对于原来的完全连接层,只需要计算权重矩阵W在每一次迭代时的更新。而对于双向神经网络,需要每次迭代对变换矩阵L和R的参数进行更新:
Lt+1=Lt+ΔL
Rt+1=Rt+ΔR
其中t为迭代次数。定义当前层的损失为E,需要分别计算
步骤S5,定义变换矩阵L和R:
那么中间矩阵W为:
因此W的维度为nm*ba,根据链式法则可以计算出误差对变换矩阵L和R的偏导数:
步骤S6,定义输出层的误差为:
其中c为样本总类别个数,tk为样本的目标输出,yk为网络的输出。那么输出层的敏感度为:
进而能够计算Two-Directional层和其前一层的误差:
那么可以计算出误差对整个权重矩阵W的偏导数:
这样就可以算出每次迭代的ΔL和ΔR:
步骤S7,由此可得双向神经网络反向传播中变换矩阵L和R在每次迭代的参数更新:
4.权利要求2所述的方法,其特征在于:在训练过程中采用一种end-to-end的训练方式,使用原始图片作为输入,训练包含Two-Directional的分类模型,通过前向传播计算误差,反向传播更显模型权重。模型训练完毕后,通过卷积层提取不同尺度特征,经过迟化层特征融合,然后通过Two-Directional层投影,进行特征的空间结构信息保存,通过1x1卷积操作拉成1列,通过SoftMax预测标签属性。
与现有技术相比,本发明是采用含有两个变换矩阵L和R的Two-Directionallayer替换传统的全连阶层来训练分类模型。其中,变换矩阵将原始高维特征信息投影到低维空间,去除了信息的冗余,同时保持特征的矩形结构,较好解决了传统网络架构采用全连阶层,将特征拉成列向量时空间结构信息的损失。并添加1x1卷积,融合Two-Directionallayer输出的特征和降低维度,进而完成图像的分类任务。本发明中通过使用新设计的Two-Directional layer,不需要对现有网络架构的重新设计,通过finetune就可以较大幅度提升模型的分类准确率,在大规模分类图像库上效果极为明显。
附图说明
图1是本发明的总流程示意图。
具体实施方式
下面结合附图对本发明作进一步描述,以下实施例仅用于更加清楚地说明本发明的技术方案,而不能以此来限制本发明的保护范围。
实施例1
包括以下步骤:
步骤S1,使用包含两个变换矩阵的Two-Directional层替换CaffeNet的全连接层;
步骤S2,假设第l层为双向神经网络层,前一层为l-1层,后一层为l+1层,这种层的定义可表述为以下式:
其中,m<a,n<b,L和R是变换矩阵,Tmn l是原始特征经过双向神经网络降维变换后的新特征。
步骤S3,因此在双向神经网络层中,第l层的输出可表述成以下式:
其中f(·)表示激活操作,采用RELU激活函数f(x)=max(0,x),解决训练过程中的梯度消失问题;其中Wl为第l层的权重,bl为第l层的偏置,就相当于原先完全连接层中的权重矩阵Wl
步骤S4,对于原来的完全连接层,只需要计算权重矩阵W在每一次迭代时的更新。而对于双向神经网络,需要每次迭代对变换矩阵L和R的参数进行更新:
Lt+1=Lt+ΔL
Rt+1=Rt+ΔR
其中t为迭代次数。定义当前层的损失为E,需要分别计算
步骤S5,定义变换矩阵L和R:
那么中间矩阵W为:
因此W的维度为nm*ba,根据链式法则可以计算出误差对变换矩阵L和R的偏导数:
步骤S6,定义输出层的误差为:
其中c为样本总类别个数,tk为样本的目标输出,yk为网络的输出。那么输出层的敏感度为:
进而能够计算Two-Directional层和其前一层的误差:
那么可以计算出误差对整个权重矩阵W的偏导数:
这样就可以算出每次迭代的ΔL和ΔR:
步骤S7,由此可得双向神经网络反向传播中变换矩阵L和R在每次迭代的参数更新:
步骤S8,在训练过程中采用一种end-to-end的训练方式,使用原始图片作为输入,训练包含Two-Directional的分类模型,通过前向传播计算误差,反向传播更显模型权重。模型训练完毕后,通过卷积层提取不同尺度特征,经过迟化层特征融合,然后通过Two-Directional层投影,进行特征的空间结构信息保存,通过1x1卷积操作拉成1列,通过SoftMax预测标签属性。
实施例2
在VGGNet上实现Two-Direction图像分类算法,采用如图1所示的流程,包括以下步骤:
步骤S1,使用包含两个变换矩阵的Two-Directional层替换VGGNet的全连接层;
步骤S2~步骤S8同实施例1。
实施例3
在Caltech-256数据集上分别实施例1、例2,并比较添加Two-Direction层前后的分类性能。
表1 Caltech-256数据集实验结果
实施例4
在Oxford Flower-102数据集上分别实施例1、例2,并比较添加Two-Direction层前后的分类性能。
表2 Oxford Flower-102数据集实验结果
本发明方法与传统的使用全连接层的图像分类模型的对比实验中,本算法在Caltech-256、Oxford Flower-102数据集上分类精度提升了1~3.5个百分点。证明了本发明算法可以避免重新设计网络,去除了漫长的模型训练过程,仅需要简单的微调就可以使得现有分类网络框架分类精度大大提高。
以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明技术原理的前提下,还可以做出若干改进和变型,这些改进和变型也应视为本发明的保护范围。

Claims (4)

1.一种基于双向神经网络结构的图像分类方法,其特征在于包括:所述模型通过在CaffeNet、VGG-16网络模型基础上使用Two-Directional layer替换传统的全连接层的方式构建;
所述网络模型包括用于底层视觉特征、高层语义信息提取的卷积层;用于特征融合、降低维度的迟化层;用于保持空间结构信、特征维度映射的Two-Directional layer;所述的输入包括原始图像;所述的输出包括测试图片对应的分类标签的概率分布。
2.根据权利要求1所述的一种基于双向神经网络的图像分类算法,其特征是,将高维的模式样本投影到最佳判别的低维矢量空间,达到抽取分类信息与压缩特征空间维度的效果,通过变换矩阵矩阵L和R对当前层的特征进行维度变换,并送入SoftMax输出层进行分类。
3.根据权利要求2所述的一种基于双向神经网络的图像分类算法,所述的前向传播包括以下步骤:
步骤S1,对于全连接层,第l层的输出可表述为下式;
Xl=f(Ul)
=f(Wl*Xl-1+bl)
其中,W表示该层的权重,b表示该层的偏置,f表示的激活函数。
步骤S2,假设第l层为双向神经网络层,前一层为l-1层,后一层为l+1层,这种层的定义可表述为以下式:
其中,m<a,n<b,L和R是变换矩阵,Tmn l是原始特征经过双向神经网络降维变换后的新特征。
步骤S3,因此在双向神经网络层中,第l层的输出可表述成以下式:
其中f(·)表示激活操作,采用RELU激活函数f(x)=max(0,x),解决训练过程中的梯度消失问题;其中Wl为第l层的权重,bl为第l层的偏置,就相当于原先完全连接层中的权重矩阵Wl
步骤S4,对于原来的完全连接层,只需要计算权重矩阵W在每一次迭代时的更新。而对于双向神经网络,需要每次迭代对变换矩阵L和R的参数进行更新:
Lt+1=Lt+ΔL
Rt+1=Rt+ΔR
其中t为迭代次数。定义当前层的损失为E,需要分别计算
步骤S5,定义变换矩阵L和R:
那么中间矩阵W为:
因此W的维度为nm*ba,根据链式法则可以计算出误差对变换矩阵L和R的偏导数:
步骤S6,定义输出层的误差为:
其中c为样本总类别个数,tk为样本的目标输出,yk为网络的输出。那么输出层的敏感度为:
进而能够计算Two-Directional层和其前一层的误差:
那么可以计算出误差对整个权重矩阵W的偏导数:
这样就可以算出每次迭代的ΔL和ΔR:
步骤S7,由此可得双向神经网络反向传播中变换矩阵L和R在每次迭代的参数更新:
4.权利要求2所述的方法,其特征在于:在训练过程中采用一种end-to-end的训练方式,使用原始图片作为输入,训练包含Two-Directional的分类模型,通过前向传播计算误差,反向传播更显模型权重。模型训练完毕后,通过卷积层提取不同尺度特征,经过迟化层特征融合,然后通过Two-Directional层投影,进行特征的空间结构信息保存,通过1x1卷积操作拉成1列,通过SoftMax预测标签属性。
CN201810845116.3A 2018-07-27 2018-07-27 一种基于双向神经网络结构的图像分类方法 Active CN109102010B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810845116.3A CN109102010B (zh) 2018-07-27 2018-07-27 一种基于双向神经网络结构的图像分类方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810845116.3A CN109102010B (zh) 2018-07-27 2018-07-27 一种基于双向神经网络结构的图像分类方法

Publications (2)

Publication Number Publication Date
CN109102010A true CN109102010A (zh) 2018-12-28
CN109102010B CN109102010B (zh) 2021-06-04

Family

ID=64847784

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810845116.3A Active CN109102010B (zh) 2018-07-27 2018-07-27 一种基于双向神经网络结构的图像分类方法

Country Status (1)

Country Link
CN (1) CN109102010B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110119760A (zh) * 2019-04-11 2019-08-13 华南理工大学 一种基于层次化多尺度循环神经网络的序列分类方法

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2009014323A1 (en) * 2007-07-24 2009-01-29 Samsung Electronics Co., Ltd. System and method of saving digital content classified by person-based clustering
CN104112138A (zh) * 2013-12-17 2014-10-22 深圳市华尊科技有限公司 物体颜色分类方法及装置
KR20160037423A (ko) * 2014-09-29 2016-04-06 동명대학교산학협력단 동적보상퍼지신경네트워크(dcfnn)를 기반으로 한 얼굴인식 알고리즘
CN105631466A (zh) * 2015-12-21 2016-06-01 中国科学院深圳先进技术研究院 图像分类的方法及装置
CN105956560A (zh) * 2016-05-06 2016-09-21 电子科技大学 一种基于池化多尺度深度卷积特征的车型识别方法
CN106250911A (zh) * 2016-07-20 2016-12-21 南京邮电大学 一种基于卷积神经网络的图片分类方法
CN107463965A (zh) * 2017-08-16 2017-12-12 湖州易有科技有限公司 基于深度学习的面料属性图片采集和识别方法及识别系统
CN107844795A (zh) * 2017-11-18 2018-03-27 中国人民解放军陆军工程大学 基于主成分分析的卷积神经网络特征提取方法

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2009014323A1 (en) * 2007-07-24 2009-01-29 Samsung Electronics Co., Ltd. System and method of saving digital content classified by person-based clustering
CN104112138A (zh) * 2013-12-17 2014-10-22 深圳市华尊科技有限公司 物体颜色分类方法及装置
KR20160037423A (ko) * 2014-09-29 2016-04-06 동명대학교산학협력단 동적보상퍼지신경네트워크(dcfnn)를 기반으로 한 얼굴인식 알고리즘
CN105631466A (zh) * 2015-12-21 2016-06-01 中国科学院深圳先进技术研究院 图像分类的方法及装置
CN105956560A (zh) * 2016-05-06 2016-09-21 电子科技大学 一种基于池化多尺度深度卷积特征的车型识别方法
CN106250911A (zh) * 2016-07-20 2016-12-21 南京邮电大学 一种基于卷积神经网络的图片分类方法
CN107463965A (zh) * 2017-08-16 2017-12-12 湖州易有科技有限公司 基于深度学习的面料属性图片采集和识别方法及识别系统
CN107844795A (zh) * 2017-11-18 2018-03-27 中国人民解放军陆军工程大学 基于主成分分析的卷积神经网络特征提取方法

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
RASMUS ROTHE 等: "DLDR: Deep Linear Discriminative Retrieval for cultural event classification from a single image", 《2015 IEEE INTERNATIONAL CONFERENCE ON COMPUTER VISION WORKSHOPS》 *
TING RUI 等: "Convolutional neural network feature maps selection based on LDA", 《MULTIMEDIA TOOLS AND APPLICATION》 *
卢官明 等: "一种用于人脸表情识别的卷积神经网络", 《南京邮电大学学报(自然科学版)》 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110119760A (zh) * 2019-04-11 2019-08-13 华南理工大学 一种基于层次化多尺度循环神经网络的序列分类方法
CN110119760B (zh) * 2019-04-11 2021-08-10 华南理工大学 一种基于层次化多尺度循环神经网络的序列分类方法

Also Published As

Publication number Publication date
CN109102010B (zh) 2021-06-04

Similar Documents

Publication Publication Date Title
CN103984959B (zh) 一种基于数据与任务驱动的图像分类方法
CN108647742B (zh) 基于轻量级神经网络的快速目标检测方法
CN109886286A (zh) 基于级联检测器的目标检测方法、目标检测模型及系统
CN110427875B (zh) 基于深度迁移学习和极限学习机的红外图像目标检测方法
CN105701507A (zh) 基于动态随机池化卷积神经网络的图像分类方法
CN107909564A (zh) 一种基于深度学习的全卷积网络图像裂纹检测方法
CN110580496A (zh) 一种基于熵最小化的深度迁移学习系统及方法
CN102930539B (zh) 基于动态图匹配的目标跟踪方法
CN107134144A (zh) 一种用于交通监控的车辆检测方法
CN110533024B (zh) 基于多尺度roi特征的双二次池化细粒度图像分类方法
CN109740686A (zh) 一种基于区域池化和特征融合的深度学习图像多标记分类方法
CN103605984B (zh) 基于超图学习的室内场景分类方法
CN107977456B (zh) 一种基于多任务深度网络的多源大数据分析方法
CN103258214A (zh) 基于图像块主动学习的遥感图像分类方法
NL2029214B1 (en) Target re-indentification method and system based on non-supervised pyramid similarity learning
CN107330355A (zh) 一种基于正样本平衡约束的深度行人再标识方法
CN111985325B (zh) 特高压环境评价中的航拍小目标快速识别方法
Zhang et al. Lightweight fruit-detection algorithm for edge computing applications
CN113128620A (zh) 一种基于层次关系的半监督领域自适应图片分类方法
CN106203628A (zh) 一种增强深度学习算法鲁棒性的优化方法和系统
CN105718959A (zh) 一种基于自编码的物体识别方法
CN110889360A (zh) 一种基于切换卷积网络的人群计数方法及系统
CN113159292A (zh) 一种基于神经网络最小化熵的因果网络发现方法及系统
CN113963333B (zh) 一种基于改进yolof模型的交通标志牌检测方法
CN109102010A (zh) 一种基于双向神经网络结构的图像分类方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CP01 Change in the name or title of a patent holder

Address after: 266400 No. 77, Lingyan Road, LINGSHANWEI sub district office, Huangdao District, Qingdao City, Shandong Province

Patentee after: Issa Technology Co.,Ltd.

Patentee after: QINGDAO YISA DATA TECHNOLOGY Co.,Ltd.

Address before: 266400 No. 77, Lingyan Road, LINGSHANWEI sub district office, Huangdao District, Qingdao City, Shandong Province

Patentee before: Qingdao Issa Technology Co.,Ltd.

Patentee before: QINGDAO YISA DATA TECHNOLOGY Co.,Ltd.

CP01 Change in the name or title of a patent holder
CP03 Change of name, title or address

Address after: 266400 No. 77, Lingyan Road, LINGSHANWEI sub district office, Huangdao District, Qingdao City, Shandong Province

Patentee after: Qingdao Issa Technology Co.,Ltd.

Patentee after: QINGDAO YISA DATA TECHNOLOGY Co.,Ltd.

Address before: 108, 102 / F, building 17, yard 6, Jingshun East Street, Chaoyang District, Beijing

Patentee before: BEIJING YISA TECHNOLOGY Co.,Ltd.

Patentee before: QINGDAO YISA DATA TECHNOLOGY Co.,Ltd.

CP03 Change of name, title or address