CN112329857A - 一种基于改进残差网络的图像分类方法 - Google Patents
一种基于改进残差网络的图像分类方法 Download PDFInfo
- Publication number
- CN112329857A CN112329857A CN202011231956.4A CN202011231956A CN112329857A CN 112329857 A CN112329857 A CN 112329857A CN 202011231956 A CN202011231956 A CN 202011231956A CN 112329857 A CN112329857 A CN 112329857A
- Authority
- CN
- China
- Prior art keywords
- model
- image
- data
- residual error
- error network
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Software Systems (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Biophysics (AREA)
- Biomedical Technology (AREA)
- Mathematical Physics (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Image Analysis (AREA)
Abstract
本发明属于图像分类技术领域,具体涉及一种基于改进残差网络的图像分类方法,包括以下步骤:S1、获取公共数据集,完成模型训练所需数据集的构建;S2、对数据集统一尺度大小,同时进行归一化,数据划分,去噪等图像增强方法,并进行随机裁剪、随机擦除用于数据扩充,提高模型识别准确率;S3、使用层次分割模块和注意力机制用于改进残差网络模型用于提高模型识别性能,加快运行时间;S4、当模型的损失函数不再下降,评价指标达到最优且趋于稳定之后,保存模型。该方法解决了现有的网络模型对图像识别效果不佳,运行时间长的问题,通过使用层次分割模块和注意力机制改进ResNet50模型用于图像识别促进网络学习更强的特征,提高模型识别准确率和资源利用率。
Description
技术领域
本发明属于图像分类技术领域,具体涉及一种基于改进残差网络的图像分类方法。
背景技术
图像分类,顾名思义,就是为输入图像打上固定类别的标签。这是计算机视觉领域的核心问题之一,尽管听起来很简单,但图像分类有大量不同的实际应用。图像分类是人工智能领域的基本研究主题之一。
在图像识别中,模型的运算速度和计算机资源消耗越来越受到关注,但由于目前大多数卷积神经网络通过设计更深和更宽的网络模型来提高识别准确率,导致超参数增加,体系结构越来越复杂,使得模型运行所需时间极长且识别效果不佳。
目前,现有技术基于深度学习的大多数网络模型对图像识别效果不佳,而识别准确率较高的模型需更多的计算机资源,且运行时间更长。现有的ResNet50深度学习模型通过使用残差网络增加网络层数,导致计算复杂度提高,训练周期增长。
因此,有必要对上述问题做出改进。
发明内容
为了克服现有技术中存在的不足,本发明提供一种基于改进残差网络的图像分类方法,该方法可以解决现有的网络模型对图像识别效果不佳,运行时间更长,且现有的ResNet50深度学习模型计算复杂度高,训练周期长的问题。
本发明采用的技术方案为:
一种基于改进残差网络的图像分类方法,包括以下步骤:
S1、数据下载:获取公共数据集,完成模型训练所需数据集的构建;
S2、数据预处理:对获取到的数据集统一尺度大小,同时进行图像增强、数据扩充,提高模型识别准确率;
S3、识别模型:使用层次分割模块和注意力机制用于改进残差网络模型,进行模型识别性能的提高,加快运行时间;
S4、模型保存:当模型的损失函数不再下降、评价指标达到最优且趋于稳定之后,保存模型。
所述步骤S2中,所述图像增强的具体方法有归一化、数据划分和图像去噪,所述数据扩充的方法有随机裁剪、随机擦除。
所述归一化的具体方法为:对数据进行0均值归一化μ为原始数据的均值,σ为原始数据的标准差;所述数据划分的具体步骤为:使用5折交叉验证,将数据集随机划分为5组,同时随机选取其中1组作为测试集,剩余的4组作为训练集,重复进行5次,将 5次实验结果获得的评价指标取平均值作为模型识别性能指标;所述图像去噪的具体方法为:使用高斯低通滤波对图像进行去噪处理。
所述数据扩充的具体步骤为:将获取的图像数据集裁剪为不同尺度大小的图片或者在原图中随机选择一个矩形区域,将该区域的像素替换为随机值,获得不同程度遮挡的图片,实现数据集的扩充。
所述步骤S3中包括模型构建,具体步骤为:融合层次分割模块和注意力机制模块的 ResNet50模型,其中ResNet50模型使用残差连接实现网络深度的增加,同时解决梯度消失的问题,其具体公式为F(x)=H(x)-x,其中H(x)为残差网络的输出,F(x)为经过卷积操作的输出。
所述层次分割模块将ResNet50模型中的一部分卷积操作进行替换,将一个普通的特征图分为s组,每组为w个通道,其中只有第一组过滤器可以直接连接到下一层,而第二组特征图经过卷积操作后,将特征图按通道维度分为两组,其中一组直接连接到下一层,而另一组在通道维度上连接到下一组输入特征图,将该过程重复多次,直到处理完其余的输入特征图,最后,将每组直接输出的特征图进行特征融合,实现特征的重建过程。
所述注意力机制模块具体运行流程为:通过提取不同通道特征对关键信息的重要程度,优化特征分类效果,高层特征的通道图视为对不同语义特征的响应,并且相互联系,通道注意力挖掘通道图之间的依赖关系,获得每个特征通道的重要程度,并依照重要程度有选择性的去关注权重值大的信息,提高判别性语义的特征表示,从而提高模型对图像的识别能力,其中所需要用到的关系式其中Al和Fl分别代表第l层注意力映射和第l层特征映射,GAP为全局平均池化操作。
本发明与现有技术相比所具有的有益效果为:
本发明通过使用层次分割模块和注意力机制改进ResNet50模型用于图像识别,在不增加参数量和计算量的前提下,促进网络学习更强的特征,保持良好的性能和运算速度,而注意力的提出用于衡量特征的重要程度,帮助模型获得更关键和重要的信息,使模型做出更加准确的判断,提高模型识别准确率和资源利用率。同时本文模型的提出可用于多种类型的图像识别。
附图说明
图1为本发明的流程示意图;
图2为本发明的运行逻辑框架示意图。
具体实施方式
下面对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
如图1、图2所示,一种基于改进残差网络的图像分类方法,通过使用ImageNet-1K数据集用于图像识别,该数据集包含1000个类别的图像。对获得的各类图像按一定规则缩放为一定尺寸,之后对数据进行预处理。将预处理的数据集输入到构建好的图像识别模型中,进行多次训练用于提高模型准确率,通过损失函数和评价指标获得最优的识别模型,完成模型的构建。包括以下步骤:
S1、数据下载:获取公共数据集,完成模型训练所需数据集的构建;为了验证模型识别性能,使用公共数据集ImageNet-1K用于图像识别评估,该数据集包含128万张训练图像和来自1000个类的5万张图像用于验证,同时所使用的公共数据集已进行图像标注,所包含的图像被标注划分分为1000个类别。
S2、数据预处理:由于获取的图像尺寸大小不一,对获取到的数据集统一尺度大小,同时进行图像增强、数据扩充,提高模型识别准确率;
S3、识别模型:使用层次分割模块和注意力机制用于改进残差网络模型,进行模型识别性能的提高,加快运行时间;
S4、模型保存:当模型的损失函数不再下降、评价指标达到最优且趋于稳定之后,保存模型。
所述步骤S2中,所述图像增强的具体方法有归一化、数据划分和图像去噪,所述数据扩充的方法有随机裁剪、随机擦除。
所述归一化的具体方法为:对数据进行0均值归一化μ为原始数据的均值,σ为原始数据的标准差;所述数据划分的具体步骤为:为了提升模型识别准确度使用5折交叉验证,将数据集随机划分为5组,同时随机选取其中1组作为测试集,剩余的4组作为训练集,重复进行5次,将5次实验结果获得的评价指标取平均值作为模型识别性能指标;所述图像去噪的具体方法为:使用高斯低通滤波对图像进行去噪处理,δ为标准差。
所述数据扩充的具体步骤为:将获取的图像数据集裁剪为不同尺度大小的图片或者在原图中随机选择一个矩形区域,将该区域的像素替换为随机值,获得不同程度遮挡的图片,实现数据集的扩充,用于实现数据集的扩充,防止过拟合,提高模型鲁棒性,提高模型识别准确率。
所述步骤S3中包括模型构建,具体步骤为:融合层次分割模块和注意力机制模块的 ResNet50模型,其中ResNet50模型使用残差连接实现网络深度的增加,同时解决梯度消失的问题,其具体公式为F(x)=H(x)-x,其中H(x)为残差网络的输出,F(x)为经过卷积操作的输出。
所述层次分割模块将ResNet50模型中的一部分卷积操作进行替换,将一个普通的特征图分为s组,每组为w个通道,其中只有第一组过滤器可以直接连接到下一层,而第二组特征图经过卷积操作后,将特征图按通道维度分为两组,其中一组直接连接到下一层,而另一组在通道维度上连接到下一组输入特征图,将该过程重复多次,直到处理完其余的输入特征图,最后,将每组直接输出的特征图进行特征融合,实现特征的重建过程。
所述注意力机制模块具体运行流程为:通过提取不同通道特征对关键信息的重要程度,优化特征分类效果,高层特征的通道图视为对不同语义特征的响应,并且相互联系,通道注意力挖掘通道图之间的依赖关系,获得每个特征通道的重要程度,并依照重要程度有选择性的去关注权重值大的信息,提高判别性语义的特征表示,从而提高模型对图像的识别能力,其中所需要用到的关系式其中Al和Fl分别代表第l层注意力映射和第l层特征映射,GAP为全局平均池化操作。
上述模块、单元或组件的划分仅仅是一种逻辑功能的划分,在实际实现时可以有其他的划分方式,例如多个模块和/或单元可以结合或集成于另一个系统中。作为分离部件说明的模块、单元、组件在物理上可以是分开的,也可以是不分开的。作为单元显示的部件可以是物理单元,也可以不是物理单元,即可以位于一个具体地方,也可以分布到网格单元中。因此可以根据实际需要选择其中的部分或全部的单元来实现实施例的方案。
本领域内的技术人员应明白,本申请的实施例可提供为方法、系统、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质,包括但不限于磁盘存储器、CD-ROM、光学存储器等,上实施的计算机程序产品的形式。
上面仅对本发明的较佳实施例作了详细说明,但是本发明并不限于上述实施例,在本领域普通技术人员所具备的知识范围内,还可以在不脱离本发明宗旨的前提下作出各种变化,各种变化均应包含在本发明的保护范围之内。
Claims (8)
1.一种基于改进残差网络的图像分类方法,其特征在于:包括以下步骤:
S1、数据下载:获取公共数据集,完成模型训练所需数据集的构建;
S2、数据预处理:对获取到的数据集统一尺度大小,同时进行图像增强、数据扩充,提高模型识别准确率;
S3、识别模型:使用层次分割模块和注意力机制用于改进残差网络模型,进行模型识别性能的提高,加快运行时间;
S4、模型保存:当模型的损失函数不再下降、评价指标达到最优且趋于稳定之后,保存模型。
2.根据权利要求1所述的一种基于改进残差网络的图像分类方法,其特征在于:所述步骤S2中,所述图像增强的具体方法有归一化、数据划分和图像去噪,所述数据扩充的方法有随机裁剪、随机擦除。
4.根据权利要求2所述的一种基于改进残差网络的图像分类方法,其特征在于:所述数据扩充的具体步骤为:将获取的图像数据集裁剪为不同尺度大小的图片或者在原图中随机选择一个矩形区域,将该区域的像素替换为随机值,获得不同程度遮挡的图片,实现数据集的扩充。
5.根据权利要求1所述的一种基于改进残差网络的图像分类方法,其特征在于:所述步骤S3中包括模型构建,具体步骤为:融合层次分割模块和注意力机制模块的ResNet50模型,其中ResNet50模型使用残差连接实现网络深度的增加,其具体公式为F(x)=H(x)-x,其中H(x)为残差网络的输出,F(x)为经过卷积操作的输出。
6.根据权利要求5所述的一种基于改进残差网络的图像分类方法,其特征在于:所述层次分割模块将ResNet50模型中的一部分卷积操作进行替换,将一个普通的特征图分为s组,每组为w个通道,其中只有第一组过滤器可以直接连接到下一层,而第二组特征图经过卷积操作后,将特征图按通道维度分为两组,其中一组直接连接到下一层,而另一组在通道维度上连接到下一组输入特征图,将该过程重复多次,直到处理完其余的输入特征图,最后,将每组直接输出的特征图进行特征融合,实现特征的重建过程。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011231956.4A CN112329857A (zh) | 2020-11-06 | 2020-11-06 | 一种基于改进残差网络的图像分类方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011231956.4A CN112329857A (zh) | 2020-11-06 | 2020-11-06 | 一种基于改进残差网络的图像分类方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN112329857A true CN112329857A (zh) | 2021-02-05 |
Family
ID=74316697
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011231956.4A Pending CN112329857A (zh) | 2020-11-06 | 2020-11-06 | 一种基于改进残差网络的图像分类方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112329857A (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113033802A (zh) * | 2021-03-22 | 2021-06-25 | 山西三友和智慧信息技术股份有限公司 | 一种基于donna的提取最优神经网络的方法 |
CN113052228A (zh) * | 2021-03-22 | 2021-06-29 | 山西三友和智慧信息技术股份有限公司 | 一种基于SE-Inception的肝癌病理切片分类方法 |
CN113592812A (zh) * | 2021-07-29 | 2021-11-02 | 华南师范大学 | 一种素描图片评价方法及装置 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105303571A (zh) * | 2015-10-23 | 2016-02-03 | 苏州大学 | 用于视频处理的时空显著性检测方法 |
CN111259982A (zh) * | 2020-02-13 | 2020-06-09 | 苏州大学 | 一种基于注意力机制的早产儿视网膜图像分类方法和装置 |
-
2020
- 2020-11-06 CN CN202011231956.4A patent/CN112329857A/zh active Pending
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105303571A (zh) * | 2015-10-23 | 2016-02-03 | 苏州大学 | 用于视频处理的时空显著性检测方法 |
CN111259982A (zh) * | 2020-02-13 | 2020-06-09 | 苏州大学 | 一种基于注意力机制的早产儿视网膜图像分类方法和装置 |
Non-Patent Citations (2)
Title |
---|
PENGCHENG YUAN: "HS-ResNet: Hierarchical-Split Block on Convolutional Neural Network", 《HTTPS://ARXIV.ORG/PDF/2010.07621.PDF》 * |
许文慧等: ""基于注意力机制与迁移学习的乳腺钼靶肿块分类", 《激光与光电子学进展》 * |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113033802A (zh) * | 2021-03-22 | 2021-06-25 | 山西三友和智慧信息技术股份有限公司 | 一种基于donna的提取最优神经网络的方法 |
CN113052228A (zh) * | 2021-03-22 | 2021-06-29 | 山西三友和智慧信息技术股份有限公司 | 一种基于SE-Inception的肝癌病理切片分类方法 |
CN113592812A (zh) * | 2021-07-29 | 2021-11-02 | 华南师范大学 | 一种素描图片评价方法及装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112329857A (zh) | 一种基于改进残差网络的图像分类方法 | |
CN109615014B (zh) | 一种基于kl散度优化的3d物体数据分类系统与方法 | |
CN104866578B (zh) | 一种不完整物联网数据混合填充方法 | |
CN106384282A (zh) | 构建决策模型的方法和装置 | |
CN107423820B (zh) | 结合实体层次类别的知识图谱表示学习方法 | |
CN109684476B (zh) | 一种文本分类方法、文本分类装置及终端设备 | |
CN114003791B (zh) | 基于深度图匹配的医疗数据元自动化分类方法及系统 | |
CN110321805B (zh) | 一种基于时序关系推理的动态表情识别方法 | |
CN111475622A (zh) | 一种文本分类方法、装置、终端及存储介质 | |
CN113393370A (zh) | 中国书法文字图像风格迁移的方法、系统、智能终端 | |
CN113763371B (zh) | 病理图像的细胞核分割方法及装置 | |
CN113763385A (zh) | 视频目标分割方法、装置、设备及介质 | |
CN116311462A (zh) | 一种结合上下文信息和vgg19的人脸图像修复识别方法 | |
CN116362243A (zh) | 一种融入句子间关联关系的文本关键短语提取方法、存储介质及装置 | |
CN114491289A (zh) | 一种双向门控卷积网络的社交内容抑郁检测方法 | |
CN113192087A (zh) | 一种基于卷积神经网络的图像分割方法 | |
CN109344309A (zh) | 基于卷积神经网络堆叠泛化的文档图像分类方法和系统 | |
CN106815320B (zh) | 基于拓展三维直方图的调研大数据可视化建模方法及系统 | |
CN113743079A (zh) | 一种基于共现实体交互图的文本相似度计算方法及装置 | |
CN111259975B (zh) | 分类器的生成方法及装置、文本的分类方法及装置 | |
CN108229565A (zh) | 一种基于认知的图像理解方法 | |
CN112784017A (zh) | 基于主亲和性表示的档案跨模态数据特征融合方法 | |
CN116778164A (zh) | 一种基于多尺度结构改进DeeplabV3+网络的语义分割方法 | |
CN116089142A (zh) | 一种新型的服务故障根因分析方法 | |
CN113610080B (zh) | 基于跨模态感知的敏感图像识别方法、装置、设备及介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20210205 |