CN112686823A - 一种基于光照变换网络的图像自动增强方法 - Google Patents
一种基于光照变换网络的图像自动增强方法 Download PDFInfo
- Publication number
- CN112686823A CN112686823A CN202011624087.1A CN202011624087A CN112686823A CN 112686823 A CN112686823 A CN 112686823A CN 202011624087 A CN202011624087 A CN 202011624087A CN 112686823 A CN112686823 A CN 112686823A
- Authority
- CN
- China
- Prior art keywords
- image
- transformation network
- illumination
- illumination transformation
- module
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Image Analysis (AREA)
Abstract
本发明公开一种基于光照变换网络的图像自动增强方法,包括以下步骤:(1)数据集制作:收集大量图像分类数据,并将图像分类数据按0.8:0.1:0.1的比例随机划分为训练集、验证集与测试集;(2)构建一种光照变换网络:所述光照变换网络由图像自动增强模块与ResNet50模块组成;所述光照变换网络用于对输入的原始图像进行自动增强;(3)模型训练:指定步骤(1)中的训练集与验证集,使用SGD优化器,将训练集输入至步骤(2)的光照变换网络,进行模型训练;(4)模型推理。本发明根据输入图像进行自动增强,可有效提升深度学习模型的光照一致性。
Description
技术领域
本发明涉及图像识别技术领域,更具体地,涉及一种基于光照变换网络的图像自动增强方法。
背景技术
基于深度学习的图像识别技术在实际场景中应用时,光照是非常重要的影响因素,同一识别对象在不同的光照条件下,识别结果可能存在差异。如何提高深度学习模型的光照一致性,成为业界的研究热点,也是人工智能实际落地需要解决的关键问题之一。
目前,提高深度学习模型的光照一致性,目前的主要做法是对图像进行增强,随机设置图像亮度、对比度等参数,这种方法在数据量较少时有一定作用,但数据量较大时,训练时长大大增加,且可能出现过度变换,改变识别对象的语义,从而影响模型效果。
发明内容
本发明针对背景技术存在的不足,本发明提供了一种基于光照变换网络的图像自动增强方法,在深度学习模型中植入光照变换模块,该模块根据输入图像进行自动增强,可有效提升深度学习模型的光照一致性。
为解决上述问题,提供一种基于光照变换网络的图像自动增强方法,包括以下步骤:
(1)数据集制作:收集大量图像分类数据,并将图像分类数据按0.8:0.1:0.1的比例随机划分为训练集、验证集与测试集;
(2)构建一种光照变换网络:所述光照变换网络由图像自动增强模块与ResNet50模块组成;所述光照变换网络用于对输入的原始图像进行自动增强;
(3)模型训练:指定步骤(1)中的训练集与验证集,使用SGD优化器,将训练集输入至步骤(2)的光照变换网络,进行模型训练;
(4)模型推理:步骤(3)模型训练完成后,将步骤(1)中的测试集内的数据输入到步骤(2)的光照变换网络中进行推理。
特别的,所述对原始输入的原始图像进行自动增强包括以下步骤:输入原始图像;通过图像自动增强模块进行图像增强;通过ResNet50模块进行特征提取;最后输出图像分类结果。
特别的,所述图像自动增强模块包含一个光照变换模块;所述光照变换模块由2层卷积层和2层全连接层的CNN网络组成。
特别的,所述CNN网络设置有增强参数α和增强参数β,通过公式(1)输出图像分类结果:
特别的,所述SGD优化器的学习率设置为0.001。
本发明的有益效果:
本发明构建了一种光照变换网络,在深度学习网络中对图像进行自动增强,与现有图像增强做法相比,无需预先对图像进行增强,训练时长无明显增加,根据输入图像进行自动增强,可有效提升深度学习模型的光照一致性,同时,可应用于深度学习多种目标的识别,如图像分类、目标检测、图像分割等,提升图像识别效果。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例的实施流程图;
图2为本发明实施例的对输入的原始图像进行自动增强的流程图。
具体实施方式
下面结合附图对本发明的优选实施例进行详细阐述,以使本发明的优点和特征能更易于被本领域技术人员理解,从而对本发明的保护范围做出更为清楚明确的界定。
如图1所示,本实施例的一种基于光照变换网络的图像自动增强方法,包括以下步骤:
(1)数据集制作:收集大量图像分类数据,并将图像分类数据按0.8:0.1:0.1的比例随机划分为训练集、验证集与测试集。
(2)构建一种光照变换网络:光照变换网络由图像自动增强模块与ResNet50模块组成。光照变换网络用于对输入的原始图像进行自动增强,能够实现端到端的增强训练。光照变换模块由2层卷积层和2层全连接层的CNN网络组成。设2层全连接层的输出维度为2,即设计图像线性变换的增强参数α和增强参数β两个增强参数。如图2所示,对原始输入的原始图像进行自动增强包括以下步骤:输入原始图像;通过图像自动增强模块进行图像增强;通过ResNet50模块进行特征提取;最后输出图像分类结果。图像自动增强模块包含一个光照变换模块。将增强参数α和增强参数β这两个参数应用于原始图像,对原始图像的RGB 3个通道分别进行增强操作,如公式(1)所示,其中,I(x,y)表示原始图像当前通道的位于(x,y)的像素点灰度值,表示增强后的图像对应的像素点灰度值,将得到的增强图像输入至ResNet50模块进行特征提取,最后输出图像分类结果;
(3)模型训练:指定步骤(1)中的训练集与验证集,使用SGD优化器,学习率设置为0.001,将训练集输入至步骤(2)的光照变换网络,进行模型训练。
(4)模型推理:步骤(3)模型训练完成后,将步骤(1)中的测试集内的数据输入到步骤(2)的光照变换网络中进行推理。
虽然结合附图描述了本发明的实施方式,但是专利所有者可以在所附权利要求的范围之内做出各种变形或修改,只要不超过本发明的权利要求所描述的保护范围,都应当在本发明的保护范围之内。
Claims (5)
1.一种基于光照变换网络的图像自动增强方法,其特征在于,包括以下步骤:
(1)数据集制作:收集大量图像分类数据,并将图像分类数据按0.8:0.1:0.1的比例随机划分为训练集、验证集与测试集;
(2)构建一种光照变换网络:所述光照变换网络由图像自动增强模块与ResNet50模块组成;所述光照变换网络用于对输入的原始图像进行自动增强;
(3)模型训练:指定步骤(1)中的训练集与验证集,使用SGD优化器,将训练集输入至步骤(2)的光照变换网络,进行模型训练;
(4)模型推理:步骤(3)模型训练完成后,将步骤(1)中的测试集内的数据输入到步骤(2)的光照变换网络中进行推理。
2.根据权利要求1所述的一种基于光照变换网络的图像自动增强方法,其特征在于:所述对原始输入的原始图像进行自动增强包括以下步骤:输入原始图像;通过图像自动增强模块进行图像增强;通过ResNet50模块进行特征提取;最后输出图像分类结果。
3.根据权利要求1所述的一种基于光照变换网络的图像自动增强方法,其特征在于:所述图像自动增强模块包含一个光照变换模块;所述光照变换模块由2层卷积层和2层全连接层的CNN网络组成。
5.根据权利要求1所述的一种基于光照变换网络的图像自动增强方法,其特征在于:所述SGD优化器的学习率设置为0.001。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011624087.1A CN112686823A (zh) | 2020-12-31 | 2020-12-31 | 一种基于光照变换网络的图像自动增强方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011624087.1A CN112686823A (zh) | 2020-12-31 | 2020-12-31 | 一种基于光照变换网络的图像自动增强方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN112686823A true CN112686823A (zh) | 2021-04-20 |
Family
ID=75453957
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011624087.1A Pending CN112686823A (zh) | 2020-12-31 | 2020-12-31 | 一种基于光照变换网络的图像自动增强方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112686823A (zh) |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107590786A (zh) * | 2017-09-08 | 2018-01-16 | 深圳市唯特视科技有限公司 | 一种基于对抗学习网络的图像增强方法 |
CN108447036A (zh) * | 2018-03-23 | 2018-08-24 | 北京大学 | 一种基于卷积神经网络的低光照图像增强方法 |
CN109544482A (zh) * | 2018-11-29 | 2019-03-29 | 厦门美图之家科技有限公司 | 一种卷积神经网络模型生成方法及图像增强方法 |
WO2019232830A1 (zh) * | 2018-06-06 | 2019-12-12 | 平安科技(深圳)有限公司 | 机场异物检测方法、装置、计算机设备及存储介质 |
CN110991402A (zh) * | 2019-12-19 | 2020-04-10 | 湘潭大学 | 一种基于深度学习的皮肤病分类装置及分类方法 |
CN111222478A (zh) * | 2020-01-11 | 2020-06-02 | 深圳奥腾光通系统有限公司 | 一种工地安全防护检测方法和系统 |
-
2020
- 2020-12-31 CN CN202011624087.1A patent/CN112686823A/zh active Pending
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107590786A (zh) * | 2017-09-08 | 2018-01-16 | 深圳市唯特视科技有限公司 | 一种基于对抗学习网络的图像增强方法 |
CN108447036A (zh) * | 2018-03-23 | 2018-08-24 | 北京大学 | 一种基于卷积神经网络的低光照图像增强方法 |
WO2019232830A1 (zh) * | 2018-06-06 | 2019-12-12 | 平安科技(深圳)有限公司 | 机场异物检测方法、装置、计算机设备及存储介质 |
CN109544482A (zh) * | 2018-11-29 | 2019-03-29 | 厦门美图之家科技有限公司 | 一种卷积神经网络模型生成方法及图像增强方法 |
CN110991402A (zh) * | 2019-12-19 | 2020-04-10 | 湘潭大学 | 一种基于深度学习的皮肤病分类装置及分类方法 |
CN111222478A (zh) * | 2020-01-11 | 2020-06-02 | 深圳奥腾光通系统有限公司 | 一种工地安全防护检测方法和系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109241982B (zh) | 基于深浅层卷积神经网络的目标检测方法 | |
CN107945185B (zh) | 基于宽残差金字塔池化网络的图像分割方法及系统 | |
CN110889813A (zh) | 基于红外信息的低光图像增强方法 | |
CN112750129B (zh) | 一种基于特征增强位置注意力机制的图像语义分割模型 | |
CN111612722B (zh) | 基于简化Unet全卷积神经网络的低照度图像处理方法 | |
CN110717921B (zh) | 改进型编码解码结构的全卷积神经网络语义分割方法 | |
CN112164065B (zh) | 一种基于轻量化卷积神经网络的实时图像语义分割方法 | |
CN114693929A (zh) | 一种rgb-d双模态特征融合的语义分割方法 | |
CN108764287B (zh) | 基于深度学习和分组卷积的目标检测方法及系统 | |
CN109859222A (zh) | 基于级联神经网络的边缘提取方法及系统 | |
CN114639002A (zh) | 一种基于多模式特征的红外与可见光图像融合方法 | |
CN116363149A (zh) | 一种基于U-Net改进的医学图像分割方法 | |
CN116363358A (zh) | 基于改进U-Net的道路场景图像实时语义分割方法 | |
CN117152438A (zh) | 一种基于改进DeepLabV3+网络的轻量级街景图像语义分割方法 | |
CN112991236B (zh) | 一种基于模板的图像增强方法及装置 | |
CN112686823A (zh) | 一种基于光照变换网络的图像自动增强方法 | |
CN112070686A (zh) | 一种基于深度学习的逆光图像协同增强方法 | |
CN107766838B (zh) | 一种视频场景切换检测方法 | |
CN114463192A (zh) | 一种基于深度学习的红外视频畸变校正的方法 | |
CN112288753A (zh) | 一种基于颜色先验的图像色彩软分割方法及系统 | |
CN116433508B (zh) | 一种基于Swin-Unet的灰度图像着色校正方法 | |
CN113269139B (zh) | 一种针对复杂场景的自学习大规模警员图像分类模型 | |
CN112907469B (zh) | 基于Lab域增强、分类及对比度提升的水下图像识别方法 | |
CN117994155B (zh) | 一种基于Retinex理论的双分支低照度图像增强方法 | |
CN110163927B (zh) | 一种基于神经网络的单个图像重新着色方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |