CN111079837A - 一种用于二维灰度图像检测识别分类的方法 - Google Patents
一种用于二维灰度图像检测识别分类的方法 Download PDFInfo
- Publication number
- CN111079837A CN111079837A CN201911296248.6A CN201911296248A CN111079837A CN 111079837 A CN111079837 A CN 111079837A CN 201911296248 A CN201911296248 A CN 201911296248A CN 111079837 A CN111079837 A CN 111079837A
- Authority
- CN
- China
- Prior art keywords
- dimensional
- representing
- layer
- formula
- long
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/044—Recurrent networks, e.g. Hopfield networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
Abstract
本发明公开了一种用于二维灰度图像检测识别分类的方法,其特征在于,包括如下步骤:1)获得二维灰度图像;2)构建二维卷积块;3)特征提取;4)获得特征图;5)提取时间信息;6)保留和遗弃;7)选择性屏蔽节点;8)得到最终分类结果。这种方法基于二维卷积神经网络和长短期记忆网络结合的模型来对图像检测识别分类,能提高分类的准确率。
Description
技术领域
本发明涉及人工智能深度学习领域,特别涉及基于二维卷积神经网络和长短期记忆网络相结合的模型用于二维灰度图像检测识别分类的方法,具体是一种用于二维灰度图像检测识别分类的方法。
背景技术
人工智能是一门专门研究计算机如何模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能的学科。对于图像信息的检测识别分类一直是其中研究的热门与重点。在许多领域中,传统的人工分类既费时又费力,有时可能在耗费大量成本后也没有能够得到理想的分类结果。使用基于深度学习的方法实现图像的自动化分类能够在很大程度上节省人力物力并得到很高的分类准确率。二维卷积神经网络和长短期记忆网络结合的模型,其输入数据是二维的灰度图像,能够对使用的二维灰度图像最大程度的保留原始数据信息,并且,因为长短期记忆网络模型的输入不仅受此时刻输入的影响,还受到上一时刻输出的影响,在时间序列上对不同时刻节点关联,保存了网络前后的状态信息并避免了长期依赖性的问题。这些优势都使得二维卷积神经网络和长短期记忆网络结合的模型在分类的性能的得到了大大的提高,能够获得比较高的分类准确率。
发明内容
本发明的目的是针对现有技术的不足,而提供一种用于二维灰度图像检测识别分类的方法。这种方法基于二维卷积神经网络和长短期记忆网络结合的模型来对图像检测识别分类,能提高分类的准确率。
实现本发明目的的技术方案是:
一种用于二维灰度图像检测识别分类的方法,与现有技术不同处在于,包括如下步骤:
1)获得二维灰度图像:获取二维灰度图像;
2)构建二维卷积块:在每两层二维卷积神经网络后加入ELU激活函数和批量标准化层,两次迭代之后加入二维最大池化层,组成二维卷积块;
3)特征提取:将步骤1)得到的二维灰度图像输入到二维卷积块中进行初步的特征提取;
4)获得特征图:二维最大池化层在卷积层之后进行特征映射,提取并获得特征图;
5)提取时间信息:将步骤4)得到的特征图进行重塑并分解为顺序时间分量输送到长短期记忆网络层提取时间信息;
6)保留和遗弃:由长短期记忆网络的门控状态来控制内部数据信息的传输状态,在对步骤5)中长短期记忆网络层提取的重要时间信息做留存并向后传播的同时选择性遗弃长短期记忆网络层中所提取的不相关信息;
7)选择性屏蔽节点:长短期记忆网络层之后的稠密层将步骤6)中所有长短期记忆网络层提取的相关特征的节点连接,再由稠密层之后的Dropout层选择性屏蔽节点以避免过拟合现象;
8)得到最终分类结果。
步骤2)中所述的二维卷积块构建过程为:每一个二维卷积神经网络采用高度和宽度为(3,3)的二维卷积窗口,高度和宽度为(2,2)的卷积步幅,用以为所有空间尺寸指定相同的值,二维卷积神经网络的初始化值为Glorot正态分布初始化器,卷积层的表达如公式(1)所示:
ELU激活函数的表达如公式(2)所示:
公式(2)中ELU(x)表示ELU激活函数,x表示自变量,α表示一个可调整的参数,它控制负值部分在什么时刻达到饱和,ex表示一个指数函数,批量标准化层的公式表达如下:
式中x(i)是标准化输出,μ和σ分别表示同一批次的均值和方差,∈是一个常数。
步骤3)中所述的特征提取和步骤4)中所述的获得特征图的过程为:
二维最大池化层的表示如下所示:
式中,Hout和Wout表示高度和宽度的输出,f()表示最大池化运算,Hin和Win表示高度和宽度的输入,p[0]和p[1]表示输入的每一条边补充0或1的层数,d[]表示一个控制窗口中元素步幅的参数,k[]表示最大池化层的窗口大小,s[]表示最大池化层的窗口移动的步长。
步骤5)中所述的提取时间信息和步骤6)中所述的保留和遗弃过程为:
采用重塑操作,将提取的特征信息重塑为长短期记忆网络输入时所需要的顺序时间分量的大小,进而在长短期记忆网络的内部门控单元中进行数据信息传播,长短期记忆网络内部包含有三个门控单元,分别是输入门、遗忘门和输出门,通过这些门控单元来进行保留和遗忘信息,具体公式如下:
It=σ(Wi[ht-1,xt]+bi) (8),
Ft=σ(Wf[ht-1,xt]+bf) (9),
Ot=σ(Wo[ht-1,xt]+bo) (12),
式中It表示输入门的运算;Ft和表示遗忘门的运算;Ct表示要输出的保存历史信息的循环单元的运算;Ot表示输出门的运算;Wi、Wf、WC和Wo均表示权重矩阵;ht-1表示前一时刻隐层状态;xt表示当前时刻输入;bi、bf、bC和bo均表示偏置参数。
步骤7)中所述的选择性屏蔽节点过程为:
通过长短期记忆网络层之后,所有学习的特征由长短期记忆网络层后的稠密层的每一个节点相连接,进而完成后续的分类任务,而紧接着的Dropout层则是为了将稠密层中全部相连的节点选择性的屏蔽一部分,进行随机性的连接学习,这样能够使得模型在学习的过程中避免过拟合情况的出现,Dropout层计算公式为公式(13)所示:
步骤8)中所述的得到最终分类结果的过程为:
在最后的长短期记忆网络层之后的稠密层中,采用softmax函数作为激活函数,进行最后的分类,分类的类别数量由最开始输入的数据参数所决定,在softmax用于多分类的过程中,将多个神经元的输出映射到(0,1)区间内,通过映射的概率大小来确定分类的最终结果,如公式(14)所示:
式中,ei表示将实数输出映射到零到正无穷,∑j ej表示将所有结果相加,进行归一化。
本技术方案中:
1.针对模型所需的输入数据要求,采用二维灰度图像作为输入数据;
2.针对高准确率的分类模型要求,采用二维卷积神经网络和长短期记忆网络相结合的方法来构成深度学习分类模型;
3.针对最后分类的结果,采用Dropout层来避免过拟合的问题,并使用softmax激活函数得到最终的分类结果。
本技术方案带来的有益效果是:基于二维卷积神经网络和长短期记忆网络相结合的模型用于二维灰度图像分类的方法能够最大程度的保留原始数据的全部信息,通过自动化的检测识别分类减轻人工分类的工作量,能够大大的降低人力和物力。
这种方法基于二维卷积神经网络和长短期记忆网络结合的模型来对图像检测识别分类,能提高分类的准确率。
附图说明
图1为实施例的方法流程示意图;
图2为实施例中二维卷积神经网络和长短期记忆网络结合的模型框架示意图;
图3为实施例中二维卷积神经网络和长短期记忆网络结合的模型训练后的模型准确率对比示意图。
具体实施方式
下面结合附图和实施例对本发明的内容作进一步的阐述,但不是对本发明的限定。
实施例:
参照图1、图2,一种用于二维灰度图像检测识别分类的方法,包括如下步骤:
1)获得二维灰度图像:获取二维灰度图像;
2)构建二维卷积块:在每两层二维卷积神经网络后加入ELU激活函数和批量标准化层,两次迭代之后加入二维最大池化层,组成二维卷积块;
3)特征提取:将步骤1)得到的二维灰度图像输入到二维卷积块中进行初步的特征提取;
4)获得特征图:二维最大池化层在卷积层之后进行特征映射,提取并获得特征图;
5)提取时间信息:将步骤4)得到的特征图进行重塑并分解为顺序时间分量输送到长短期记忆网络层提取时间信息;
6)保留和遗弃:由长短期记忆网络的门控状态来控制内部数据信息的传输状态,在对步骤5)中长短期记忆网络层提取的重要时间信息做留存并向后传播的同时选择性遗弃长短期记忆网络层中所提取的不相关信息;
7)选择性屏蔽节点:长短期记忆网络层之后的稠密层将步骤6)中所有长短期记忆网络层提取的相关特征的节点连接,再由稠密层之后的Dropout层选择性屏蔽节点以避免过拟合现象;
8)得到最终分类结果。
步骤2)中所述的二维卷积块构建过程为:每一个二维卷积神经网络采用高度和宽度为(3,3)的二维卷积窗口,高度和宽度为(2,2)的卷积步幅,用以为所有空间尺寸指定相同的值,二维卷积神经网络的初始化值为Glorot正态分布初始化器,卷积层的表达如公式(1)所示:
ELU激活函数的表达如公式(2)所示:
公式(2)中ELU(x)表示ELU激活函数,x表示自变量,α表示一个可调整的参数,它控制负值部分在什么时刻达到饱和,ex表示一个指数函数,批量标准化层的公式表达如下:
式中x(i)是标准化输出,μ和σ分别表示同一批次的均值和方差,∈是一个常数。
步骤3)中所述的特征提取和步骤4)中所述的获得特征图的过程为:
二维最大池化层的表示如下所示:
式中,Hout和Wout表示高度和宽度的输出,f()表示最大池化运算,Hin和Win表示高度和宽度的输入,p[0]和p[1]表示输入的每一条边补充0或1的层数,d[]表示一个控制窗口中元素步幅的参数,k[]表示最大池化层的窗口大小,s[]表示最大池化层的窗口移动的步长。
步骤5)中所述的提取时间信息和步骤6)中所述的保留和遗弃过程为:
采用重塑操作,将提取的特征信息重塑为长短期记忆网络输入时所需要的顺序时间分量的大小,进而在长短期记忆网络的内部门控单元中进行数据信息传播,长短期记忆网络内部包含有三个门控单元,分别是输入门、遗忘门和输出门,通过这些门控单元来进行保留和遗忘信息,具体公式如下:
It=σ(Wi[ht-1,xt]+bi) (8),
Ft=σ(Wf[ht-1,xt]+bf) (9),
Ot=σ(Wo[ht-1,xt]+bo) (12),
式中It表示输入门的运算;Ft和表示遗忘门的运算;Ct表示要输出的保存历史信息的循环单元的运算;Ot表示输出门的运算;Wi、Wf、WC和Wo均表示权重矩阵;ht-1表示前一时刻隐层状态;xt表示当前时刻输入;bi、bf、bC和bo均表示偏置参数。
步骤7)中所述的选择性屏蔽节点过程为:
通过长短期记忆网络层之后,所有学习的特征由长短期记忆网络层之后的稠密层的每一个节点相连接,进而完成后续的分类任务,而紧接着的Dropout层则是为了将稠密层中全部相连的节点选择性的屏蔽一部分,进行随机性的连接学习,这样能够使得模型在学习的过程中避免过拟合情况的出现,Dropout层计算公式为公式(13)所示:
步骤8)中所述的得到最终分类结果的过程为:
在最后的长短期记忆网络层之后的稠密层中,采用softmax函数作为激活函数,进行最后的分类,分类的类别数量由最开始输入的数据参数所决定,在softmax用于多分类的过程中,将多个神经元的输出映射到(0,1)区间内,通过映射的概率大小来确定分类的最终结果,如公式(14)所示:
式中,ei表示将实数输出映射到零到正无穷,∑j ej表示将所有结果相加,进行归一化。
通过实验验证,如图3所示,本例方法进行分类的准确率有明显的提升,能够得到较好的二维灰度图像分类的准确率。
Claims (6)
1.一种用于二维灰度图像检测识别分类的方法,其特征在于,包括如下步骤:
1)获得二维灰度图像:获取二维灰度图像;
2)构建二维卷积块:在每两层二维卷积神经网络后加入ELU激活函数和批量标准化层,两次迭代之后加入二维最大池化层,组成二维卷积块;
3)特征提取:将步骤1)得到的二维灰度图像输入到二维卷积块中进行初步的特征提取;
4)获得特征图:二维最大池化层在卷积层之后进行特征映射,提取并获得特征图;
5)提取时间信息:将步骤4)得到的特征图进行重塑并分解为顺序时间分量输送到长短期记忆网络层提取时间信息;
6)保留和遗弃:由长短期记忆网络的门控状态来控制内部数据信息的传输状态,在对步骤5)中长短期记忆网络层提取的重要时间信息做留存并向后传播的同时选择性遗弃长短期记忆网络层中所提取的不相关信息;
7)选择性屏蔽节点:长短期记忆网络层之后的稠密层将步骤6)中所有长短期记忆网络层提取的相关特征的节点连接,再由稠密层之后的Dropout层选择性屏蔽节点以避免过拟合现象;
8)得到最终分类结果。
2.根据权利要求1所述的用于二维灰度图像检测识别分类的方法,其特征在于,步骤2)中所述的二维卷积块构建过程为:每一个二维卷积神经网络采用高度和宽度为(3,3)的二维卷积窗口,高度和宽度为(2,2)的卷积步幅,用以为所有空间尺寸指定相同的值,二维卷积神经网络的初始化值为Glorot正态分布初始化器,卷积层的表达如公式(1)所示:
ELU激活函数的表达如公式(2)所示:
公式(2)中ELU(x)表示ELU激活函数,x表示自变量,α表示一个可调整的参数,它控制负值部分在什么时刻达到饱和,ex表示一个指数函数,批量标准化层的公式表达如下:
式中x(i)是标准化输出,μ和σ分别表示同一批次的均值和方差,∈是一个常数。
4.根据权利要求1所述的用于二维灰度图像检测识别分类的方法,其特征在于,步骤5)中所述的提取时间信息和步骤6)中所述的保留和遗弃过程为:
采用重塑操作,将提取的特征信息重塑为长短期记忆网络输入时所需要的顺序时间分量的大小,进而在长短期记忆网络的内部门控单元中进行数据信息传播,长短期记忆网络内部包含有三个门控单元,分别是输入门、遗忘门和输出门,通过这些门控单元来进行保留和遗忘信息,具体公式如下:
It=σ(Wi[ht-1,xt]+bi)(8),
Ft=σ(Wf[ht-1,xt]+bf)(9),
Ot=σ(Wo[ht-1,xt]+bo)(12),
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911296248.6A CN111079837B (zh) | 2019-12-16 | 2019-12-16 | 一种用于二维灰度图像检测识别分类的方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911296248.6A CN111079837B (zh) | 2019-12-16 | 2019-12-16 | 一种用于二维灰度图像检测识别分类的方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111079837A true CN111079837A (zh) | 2020-04-28 |
CN111079837B CN111079837B (zh) | 2022-06-28 |
Family
ID=70315192
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201911296248.6A Active CN111079837B (zh) | 2019-12-16 | 2019-12-16 | 一种用于二维灰度图像检测识别分类的方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111079837B (zh) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111493836A (zh) * | 2020-05-31 | 2020-08-07 | 天津大学 | 基于脑机接口和深度学习的术后急性疼痛预测系统及应用 |
CN111616681A (zh) * | 2020-05-31 | 2020-09-04 | 天津大学 | 基于便携式脑电采集设备和深度学习的麻醉状态监测系统 |
CN112149736A (zh) * | 2020-09-22 | 2020-12-29 | 腾讯科技(深圳)有限公司 | 一种数据处理方法、装置、服务器及介质 |
CN112785525A (zh) * | 2021-01-26 | 2021-05-11 | 桂林电子科技大学 | 基于深度学习去除刀具刃口图像中的附着物的方法和系统 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106446421A (zh) * | 2016-09-28 | 2017-02-22 | 桂林电子科技大学 | 一种基于图像识别的快速有限元建模和求解分析方法 |
CN108710829A (zh) * | 2018-04-19 | 2018-10-26 | 北京红云智胜科技有限公司 | 一种基于深度学习的表情分类及微表情检测的方法 |
CN109002771A (zh) * | 2018-06-26 | 2018-12-14 | 中国科学院遥感与数字地球研究所 | 一种基于递归神经网络的遥感图像分类方法 |
DE102019200407A1 (de) * | 2018-01-15 | 2019-07-18 | Otis Elevator Company | Teileerkennung und schadencharakterisierung durch deep-learning |
CN110322009A (zh) * | 2019-07-19 | 2019-10-11 | 南京梅花软件系统股份有限公司 | 基于多层卷积长短时记忆神经网络的图像预测方法 |
CN110348271A (zh) * | 2018-04-04 | 2019-10-18 | 山东大学 | 一种基于长短时记忆网络的微表情识别方法 |
-
2019
- 2019-12-16 CN CN201911296248.6A patent/CN111079837B/zh active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106446421A (zh) * | 2016-09-28 | 2017-02-22 | 桂林电子科技大学 | 一种基于图像识别的快速有限元建模和求解分析方法 |
DE102019200407A1 (de) * | 2018-01-15 | 2019-07-18 | Otis Elevator Company | Teileerkennung und schadencharakterisierung durch deep-learning |
CN110348271A (zh) * | 2018-04-04 | 2019-10-18 | 山东大学 | 一种基于长短时记忆网络的微表情识别方法 |
CN108710829A (zh) * | 2018-04-19 | 2018-10-26 | 北京红云智胜科技有限公司 | 一种基于深度学习的表情分类及微表情检测的方法 |
CN109002771A (zh) * | 2018-06-26 | 2018-12-14 | 中国科学院遥感与数字地球研究所 | 一种基于递归神经网络的遥感图像分类方法 |
CN110322009A (zh) * | 2019-07-19 | 2019-10-11 | 南京梅花软件系统股份有限公司 | 基于多层卷积长短时记忆神经网络的图像预测方法 |
Non-Patent Citations (3)
Title |
---|
IRAM SHAHZADI等: "CNN-LSTM: Cascaded Framework For Brain Tumour Classification", 《2018 IEEE-EMBS CONFERENCE ON BIOMEDICAL ENGINEERING AND SCIENCES (IECBES)》 * |
樊承柱: "基于深度神经网络的心电图自动分类方法研究与实现", 《CNKI优秀硕士学位论文全文库 信息科技辑》 * |
汤华东: "基于LSTM融合多CNN的事件图像分类研究", 《CNKI优秀硕士学位论文全文库 信息科技辑》 * |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111493836A (zh) * | 2020-05-31 | 2020-08-07 | 天津大学 | 基于脑机接口和深度学习的术后急性疼痛预测系统及应用 |
CN111616681A (zh) * | 2020-05-31 | 2020-09-04 | 天津大学 | 基于便携式脑电采集设备和深度学习的麻醉状态监测系统 |
CN112149736A (zh) * | 2020-09-22 | 2020-12-29 | 腾讯科技(深圳)有限公司 | 一种数据处理方法、装置、服务器及介质 |
CN112149736B (zh) * | 2020-09-22 | 2024-02-09 | 腾讯科技(深圳)有限公司 | 一种数据处理方法、装置、服务器及介质 |
CN112785525A (zh) * | 2021-01-26 | 2021-05-11 | 桂林电子科技大学 | 基于深度学习去除刀具刃口图像中的附着物的方法和系统 |
Also Published As
Publication number | Publication date |
---|---|
CN111079837B (zh) | 2022-06-28 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111079837B (zh) | 一种用于二维灰度图像检测识别分类的方法 | |
CN108133188B (zh) | 一种基于运动历史图像与卷积神经网络的行为识别方法 | |
KR102641116B1 (ko) | 데이터 증강에 기초한 인식 모델 트레이닝 방법 및 장치, 이미지 인식 방법 및 장치 | |
CN108664924B (zh) | 一种基于卷积神经网络的多标签物体识别方法 | |
CN109376242B (zh) | 基于循环神经网络变体和卷积神经网络的文本分类方法 | |
CN109002766B (zh) | 一种表情识别方法及装置 | |
US8379994B2 (en) | Digital image analysis utilizing multiple human labels | |
CN110750665A (zh) | 基于熵最小化的开集域适应方法及系统 | |
CN109740012B (zh) | 基于深度神经网络对图像语义进行理解和问答的方法 | |
CN112364974B (zh) | 一种基于激活函数改进的YOLOv3算法 | |
CN114283345A (zh) | 基于元学习和注意力的小样本城市遥感影像信息提取方法 | |
CN114842343A (zh) | 一种基于ViT的航空图像识别方法 | |
CN111695640A (zh) | 地基云图识别模型训练方法及地基云图识别方法 | |
CN112883931A (zh) | 基于长短期记忆网络的实时真假运动判断方法 | |
CN114091594A (zh) | 模型训练方法及装置、设备、存储介质 | |
CN114742224A (zh) | 行人重识别方法、装置、计算机设备及存储介质 | |
CN115358305A (zh) | 一种基于边界样本迭代生成的增量学习鲁棒性提升方法 | |
CN111126155B (zh) | 一种基于语义约束生成对抗网络的行人再识别方法 | |
CN113449548A (zh) | 更新物体识别模型的方法和装置 | |
CN114882278A (zh) | 一种基于注意力机制和迁移学习的轮胎花纹分类方法和装置 | |
CN111783688B (zh) | 一种基于卷积神经网络的遥感图像场景分类方法 | |
CN112749737A (zh) | 图像分类方法及装置、电子设备、存储介质 | |
CN115457366A (zh) | 基于图卷积神经网络的中草药多标签识别模型 | |
CN114067155A (zh) | 基于元学习的图像分类方法、装置、产品及存储介质 | |
CN110414515B (zh) | 基于信息融合处理的汉字图像识别方法、装置及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |