CN112132100A - 图像识别方法及系统 - Google Patents
图像识别方法及系统 Download PDFInfo
- Publication number
- CN112132100A CN112132100A CN202011065888.9A CN202011065888A CN112132100A CN 112132100 A CN112132100 A CN 112132100A CN 202011065888 A CN202011065888 A CN 202011065888A CN 112132100 A CN112132100 A CN 112132100A
- Authority
- CN
- China
- Prior art keywords
- convolution
- image
- module
- formula
- image information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 30
- 238000007781 pre-processing Methods 0.000 claims abstract description 35
- 210000005036 nerve Anatomy 0.000 claims abstract description 9
- 238000004364 calculation method Methods 0.000 claims description 53
- 238000006243 chemical reaction Methods 0.000 claims description 7
- 238000013527 convolutional neural network Methods 0.000 claims description 7
- 238000000605 extraction Methods 0.000 claims description 7
- 239000000284 extract Substances 0.000 claims description 4
- 230000006870 function Effects 0.000 description 21
- 238000012545 processing Methods 0.000 description 10
- 230000004438 eyesight Effects 0.000 description 6
- 238000013138 pruning Methods 0.000 description 5
- 230000000694 effects Effects 0.000 description 3
- 238000013528 artificial neural network Methods 0.000 description 2
- 238000000354 decomposition reaction Methods 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 230000001537 neural effect Effects 0.000 description 2
- 210000002569 neuron Anatomy 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 238000013473 artificial intelligence Methods 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 210000004556 brain Anatomy 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 230000008034 disappearance Effects 0.000 description 1
- 239000006185 dispersion Substances 0.000 description 1
- 238000004880 explosion Methods 0.000 description 1
- 238000009776 industrial production Methods 0.000 description 1
- 230000010365 information processing Effects 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 239000011664 nicotinic acid Substances 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 230000008447 perception Effects 0.000 description 1
- 238000013139 quantization Methods 0.000 description 1
- 238000004088 simulation Methods 0.000 description 1
- 238000012549 training Methods 0.000 description 1
- 230000004382 visual function Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
Abstract
Description
技术领域
本发明涉及计算机视觉领域,具体地涉及一种图像识别方法及系统。
背景技术
计算机视觉是使用计算机以及其他的相关设备对生物视觉的一种模拟,是人工智能领域的一个重要部分。计算机视觉技术本质上是在研究机器视觉感知的问题,使得计算机拥有对目标进行分割、分类、识别、跟踪、判别以及决策的功能。图像识别作为计算机视觉中的重要分支,其是以图像的主要特征为基础,对不同模式的目标进行读取处理。图像识别技术中主要利用卷积神经网络参与计算,卷积神经网络是在多层神经网络的基础上发展起来的针对图像分类和识别而特别设计的一种深度学习方法。而现有的卷积神经网络结构复杂、运算量大,难以移植到嵌入式设备中。这一现状对图像识别领域中采用的网络结构提出了轻量化设计的需求。为了解决上述问题,现有的对卷积神经进行轻量化涉及的方法主要为网络剪枝和低秩近似。其中,网络剪枝通过识别网络结构中的各个网络通道中的冗余连接并移除冗余结构中的冗余信息来降低网络结构的计算量,但是网络剪枝在移除网络结构中的冗余信息的同时也向网络结构提出了额外的功能需求,网络结构需要经过一定量的训练之后才能够实现网络剪枝的工作,网络剪枝的过程消耗的资源量大。低秩近似方法是运用线性代数中矩阵的低秩分解的原理对输入卷积神经网络中的图像数据进行分解运算进而降低神经卷积网络的整体计算量来达到轻量化的目的,但是低秩近似的方法目前仍处于理论研究阶段,并不能够达到工业生产的需求。
因此,现有的方法无法有效地实现图像识别中的轻量化,无法克服将图像识别中的卷积神经网络结构部署在移动端所存在的问题。
发明内容
本发明的目的是提供一种图像识别方法,其能够解决现有的图像识别应用中的缺陷,具体地,一种图像识别方法,其利用卷积神经对图像信息进行识别,其特征在于,包括以下步骤:S1.将图像信息通过输入模块输入图像预处理模块中;S2.所述图像预处理模块对所述图像进行处理;S3.将经过所述图像预处理模块处理后的所述图像数据输入所述卷积模块中;以及S4.所述卷积模块通过公式1对所述图像数据进行卷积运算;所述公式1具体为:
根据本发明的实施例,所述S2步骤具体为:S201.所述图像预处理模块使用预处理函数对所述所述图像信息进行特征值提取;以及S202.所述图像预处理模块将所述特征值转换为所述卷积模块能够识别的数据格式。
根据本发明的实施例,所述卷积模块包括多层卷积计算单元;所述S4步骤具体为:S401.所述卷积计算单元对所述图像数据使用所述公式1进行计算并将输出结果传递至下一层所述卷积计算单元中;
S402.下一层所述卷积计算单元将所述卷积模块的输出结果作为输入带入所述公式1中进行计算;以及S403.所有所述卷积计算单元依次进行计算后输出最终结果。
根据本发明的实施例,所述卷积计算单元对所述图像数据赋予权重系数以及偏差系数。
根据本发明的实施例,S5.所述输出模块输出所述最终结果。
本发明还公开了一种图像识别系统,其利用卷积神经对图像信息进行识别,包括:输入模块,所述输入模块用于输入所述图像信息;图像预处理模块,所述图像预处理模块对所述图像信息进行预处理;以及卷积模块,所述卷积模块对经过预处理的所述图像信息进行计算;所述卷积模块的计算公式为:
根据本发明的实施例,所述图像预处理模块包括:提取单元,所述提取单元提取所述图像信息中的特征值;以及转换单元,所述转换单元对所述提取单元提取的所述特征值进行数据格式转换。
根据本发明的实施例,所述卷积模块包括多个卷积计算单元,所述多个卷积计算单元使用所述公式1进行迭代运算,所述图像数据经过所述多个卷积计算单元的计算后输出最终结果。
根据本发明的实施例,所述卷积计算单元对所述图像数据赋予权重系数以及偏差系数。
根据本发明的实施例,输出模块,所述输出模块接收所述卷积模块的计算出的所述最终结果并将所述最终结果输出。
通过采用上述技术方案,本发明主要有如下几点技术效果:
1.本发明通过基于int8量化的方法,实现了图像识别中的轻量化的设计,有利于图像识别在移动端的应用。
2.本发明中通过将ReLU函数改进为ReLU8函数,ReLU8函数的取值范围涵盖了(-128,127)的整数区间,提高了图像识别方法以及系统的运行精度。
3.本发明通过在卷积模块采用权值共享,减少了系统的参数量,提高了图像识别系统的运行效率。
附图说明
图1为根据本发明的实施例的图像识别方法的示意图;
图2为根据本发明的实施例的图像识别系统的示意图。
具体实施方式
下面结合说明书附图来说明本发明的具体实施方式。
本发明的实施例公开了一种图像识别方法,从而提高了计算机视觉应用中的图像识别过程的处理精度和运行速度。
本发明公开的图像识别方法主要包括以下五个步骤:
S1.将图像信息通过输入模块输入图像预处理模块中;
S2.图像预处理模块对所述图像进行处理;
S3.将经过图像预处理模块处理后的所述图像数据输入卷积模块中;以及
S4.卷积模块通过公式1对图像数据进行卷积运算;
所述公式1具体为:
S5.所述输出模块输出所述最终结果。
本实施例中的S1步骤中公开的图像信息可以为不包含深度信息的彩色图像信息,当然,本实施例中的S1步骤中公开的图像信息也可以为包含深度信息的彩色图像信息,彩色图像信息包括了图像的二维像素点和像素点的RGB通道值。
具体地,上述S2步骤包括:
S201.图像预处理模块使用预处理函数对图像信息进行特征值提取;以及
S202.图像预处理模块将特征值转换为卷积模块能够识别的数据格式。
其中,在S201中,为了使输入模块输入的图像数据标准化,从而提升卷积模块的学习效率和表现,本实施例中设置了图像预处理模块。在图像预处理模块中,将提取到的特征值标准化,并使用线性参数将标准化的特征值进行放大处理,再作为新的输入数据传递给卷积模块进行卷积运算。具体地,在将输入数据输入卷积模块前,需要在通道或时间维上对输入的图像信息进行归一化,若输入数据为像素,也可将分布于[0,255]的原始像素值归一化值[0,1]区间。
具体地,上述S4步骤包括:
S401.所述卷积计算单元对所述图像数据使用所述公式1进行计算并将输出结果传递至下一个所述卷积计算单元中;
S402.下一个所述卷积计算单元将所述卷积模块的输出结果作为输入带入所述公式1中进行计算;以及
S403.所有所述卷积计算单元依次进行计算后输出最终结果。
本实施例中的S4步骤中,为了提高图像识别中复杂分类问题的处理效率,为了进一步有效解决图像识别过程中线性不可分的问题,本实施例中经过图像预处理模块后的数据首先需要经过特定函数处理,将经过特定函数处理后的函数输出值输入到卷积计算单元中的下一模块中。为了使得特定函数有效解决图像线性不可分的问题,提高整个模块的信息处理能力和表现能力,本实施例中可采用ReLU函数,tanh函数,sigmoid函数。为了提高本实施例描述的方法可应用于足式机器人的视觉功能的实现,使得足式机器人更为符合生物大脑中神经元的信息编码的分散稀疏的规律,本实施例中采用线性整流函数ReLU作为卷积模块处理图像数据的应用函数。本实施例中采用线性整流函数ReLU还能够对仿生研究下的足式机器人的神经网络中的神经元的活跃度进行有效地调试,并且通过更有效率的梯度下降以及反向传播,避免了卷积模块中梯度爆炸和梯度消失的问题。线性整流函数ReLU的活跃度的分散性大大降低了整个方法的计算成本。为了使得线性整流函数ReLU的取值范围能够涵盖int8所包括的(-128,127)这个整数区间,本实施例对传统的ReLU函数进行了改进,为提高图像识别的精度,本实施例中将公式1设计为如下形式:
S401中,卷积计算单元中对图像信息将会赋予权重系数和偏差系数。本实施例中,为了简化卷积计算单元中权重参数的内存占用,同时有效利用图像空间中的局部相关性,本实施例中采用权值共享的卷积操作。无论图像的尺寸大小,本实施例均可以选择固定尺寸的卷积核。本实施例的卷积计算单元中,通过卷积操作使得了图像信息的每一个像素均有一个权重系数,图像的每一个像素的权重系数被整个图像共享,从而大大减少了卷积计算单元的参数量。
为了提高卷积计算单元的计算速度,同时为了提高整个卷积神经计算单元的精度,本实施例中在卷积计算单元中对权重系数做了限制。具体地,本实施例中,通过获取到卷积计算单元中的每个卷积核的权重系数,从而确定每个权重系数的绝对值的最大值,再通过除以所确定出的权重系数的绝对值的最大值,完成对整个卷积神经计算网络的权重归一化到(-1,1)这个区间内。为了将卷积计算单元的所有权重系数均归一化(-127,127)这一区间内,本实施例中将归一化后的权重均与127相乘,从而完成了将卷积计算单元中的权重系数统一到(-127,127)这一区间内。
S403中,整个卷积模块包括多层卷积计算单元,其中第一层卷积计算单元接收经过图像预处理模块的数据信息作为输入数据,经过第一层卷积计算单元中包括本实施例中的特定函数公式一等操作处理后,输出第一层的输入数据,第一层卷积计算单元的输出数据作为第二层卷积计算单元的输入数据传递到第二层卷积计算单元,再进行类似第一层卷积计算单元中的操作,逐层迭代向下传递,直至数据经过所有层级的卷积计算单元的处理,最终通过输出模块向外输出。
本实施例还公开了一种图像识别系统,该系统包括输入模块、图像预处理模块、卷积模块以及输出模块,其中图像预处理模块包括提取单元和转换单元,卷积模块包括多个卷积计算单元。输入模块用于将采集的图像信息输入到图像识别系统,输入的图像信息经由图像预处理模块中的提取单元进行特征值的提取,再通过转换单元将提取的特征值进行数据格式的转换,格式统一的数据经过卷积模块的多个卷积计算单元中包括特定函数公式一等操作处理,上一层卷积单元的输出值作为下一次卷积单元的输入值,逐层向下迭代传递,最终通过输出模块将流经整个卷积模块处理后的输出值向外输出。
输入模块的输入数据经过图形预处理模块规则化处理图像数据,传递给卷积模块,卷积模块中的每一层的每个卷积神经单元将前一层的一组小的局部近邻的卷积神经单元的输出作为输入,利用局部感受野和权值共享,每层卷积神经单元抽取一些基本的特征参数,比如边缘、角点等,这些特征参数在后续的处理中会被更深层的的卷积神经神经单元所使用。
以上实施方式仅用于说明本发明,而并非对本发明的限制,有关技术领域的普通技术人员,在不脱离本发明的精神和范围的情况下,还可以做出各种变化和变型,因此所有等同的技术方案也属于本发明的范畴,本发明的专利保护范围应由权利要求限定。
Claims (10)
2.根据权利要求1所述的识别方法,其特征在于:
所述S2步骤具体为:
S201.所述图像预处理模块使用预处理函数对所述所述图像信息进行特征值提取;以及
S202.所述图像预处理模块将所述特征值转换为所述卷积模块能够识别的数据格式。
3.根据权利要求1所述的识别方法,其特征在于:
所述卷积模块包括多层卷积计算单元;
所述S4步骤具体为:
S401.所述卷积计算单元对所述图像数据使用所述公式1进行计算并将输出结果传递至下一层所述卷积计算单元中;
S402.下一层所述卷积计算单元将所述卷积模块的输出结果作为输入带入所述公式1中进行计算;以及
S403.所有所述卷积计算单元依次进行计算后输出最终结果。
4.根据权利要求3所述的识别方法,其特征在于:
所述卷积计算单元对所述图像数据赋予权重系数以及偏差系数。
5.根据权利要求3所述的识别方法,其特征在于,还包括:
S5.所述输出模块输出所述最终结果。
7.根据权利要求6所述的识别系统,其特征在于:
所述图像预处理模块包括:
提取单元,所述提取单元提取所述图像信息中的特征值;以及
转换单元,所述转换单元对所述提取单元提取的所述特征值进行数据格式转换。
8.根据权利要求6所述的识别系统,其特征在于:
所述卷积模块包括多个卷积计算单元,所述多个卷积计算单元使用所述公式1进行迭代运算,所述图像数据经过所述多个卷积计算单元的计算后输出最终结果。
9.根据权利要求8所述的识别系统,其特征在于:
所述卷积计算单元对所述图像数据赋予权重系数以及偏差系数。
10.根据权利要求8所述的识别系统,其特征在于,还包括:
输出模块,所述输出模块接收所述卷积模块的计算出的所述最终结果并将所述最终结果输出。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011065888.9A CN112132100A (zh) | 2020-09-30 | 2020-09-30 | 图像识别方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011065888.9A CN112132100A (zh) | 2020-09-30 | 2020-09-30 | 图像识别方法及系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN112132100A true CN112132100A (zh) | 2020-12-25 |
Family
ID=73843662
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011065888.9A Pending CN112132100A (zh) | 2020-09-30 | 2020-09-30 | 图像识别方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112132100A (zh) |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110197115A (zh) * | 2019-04-09 | 2019-09-03 | 广州中科凯泽科技有限公司 | 一种农贸产品种类的图像识别方法 |
-
2020
- 2020-09-30 CN CN202011065888.9A patent/CN112132100A/zh active Pending
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110197115A (zh) * | 2019-04-09 | 2019-09-03 | 广州中科凯泽科技有限公司 | 一种农贸产品种类的图像识别方法 |
Non-Patent Citations (3)
Title |
---|
OSC_RLZM0F6H: ""基于Distiller的模型压缩工具简介"", pages 1 - 15, Retrieved from the Internet <URL:http://my.oschina.net/u/4413446/blog/3532595> * |
渠慧帆: ""基于深度学习的焊缝缺陷自动检测研究与实现"", 《中国优秀硕士学位论文全文数据库 信息科技辑》 * |
贺智龙 等: ""轻量级车牌识别卷积网络"", 《齐鲁工业大学学报》, vol. 34, no. 4 * |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111950649B (zh) | 基于注意力机制与胶囊网络的低照度图像分类方法 | |
CN112991354B (zh) | 一种基于深度学习的高分辨率遥感影像语义分割方法 | |
CN107451565B (zh) | 一种半监督小样本深度学习图像模式分类识别方法 | |
CN112837344B (zh) | 一种基于条件对抗生成孪生网络的目标跟踪方法 | |
CN113627376B (zh) | 基于多尺度密集连接深度可分离网络的人脸表情识别方法 | |
CN109740539B (zh) | 基于超限学习机和融合卷积网络的3d物体识别方法 | |
CN112419333B (zh) | 一种遥感影像自适应特征选择分割方法及系统 | |
US20230334829A1 (en) | Hyperspectral image classification method based on context-rich networks | |
CN115631369A (zh) | 一种基于卷积神经网络的细粒度图像分类方法 | |
CN113011386B (zh) | 一种基于等分特征图的表情识别方法及系统 | |
CN111401156A (zh) | 基于Gabor卷积神经网络的图像识别方法 | |
CN113628201A (zh) | 基于深度学习的病理切片分析方法、电子设备及可读存储介质 | |
CN108345835B (zh) | 一种基于仿复眼感知的目标识别方法 | |
CN115294563A (zh) | 一种基于Transformer的增强了局部语义学习能力的3D点云分析方法及装置 | |
CN116012653A (zh) | 一种注意力残差单元神经网络高光谱图像分类方法及系统 | |
CN110188646B (zh) | 基于梯度方向直方图与局部二值模式融合的人耳识别方法 | |
CN113807497B (zh) | 一种增强纹理细节的非配对图像翻译方法 | |
CN112800979A (zh) | 一种基于表征流嵌入网络的动态表情识别方法及系统 | |
CN115423982B (zh) | 基于图像和深度的桌面冰壶三维检测方法 | |
CN112132100A (zh) | 图像识别方法及系统 | |
CN113269235B (zh) | 一种基于无监督学习的装配体变化检测方法及设备 | |
CN112070009B (zh) | 基于改进的lbp算子的卷积神经网络表情识别方法 | |
CN113239829A (zh) | 基于空间占用概率特征的跨维度遥感数据目标识别方法 | |
Kang et al. | Two Dimensional Spectral Representation | |
CN115641511B (zh) | 一种基于感受野提升网络的遥感图像野外建筑分割方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |