CN111598184B - 一种基于DenseNet的图像噪声识别方法和装置 - Google Patents
一种基于DenseNet的图像噪声识别方法和装置 Download PDFInfo
- Publication number
- CN111598184B CN111598184B CN202010449396.3A CN202010449396A CN111598184B CN 111598184 B CN111598184 B CN 111598184B CN 202010449396 A CN202010449396 A CN 202010449396A CN 111598184 B CN111598184 B CN 111598184B
- Authority
- CN
- China
- Prior art keywords
- noise
- image
- densenet
- network model
- statistical characteristic
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 38
- 238000012549 training Methods 0.000 claims abstract description 57
- 230000000007 visual effect Effects 0.000 claims abstract description 41
- 238000009826 distribution Methods 0.000 claims abstract description 34
- 238000007781 pre-processing Methods 0.000 claims description 28
- 230000006870 function Effects 0.000 claims description 13
- 238000004364 calculation method Methods 0.000 claims description 12
- 239000006002 Pepper Substances 0.000 claims description 10
- 150000003839 salts Chemical class 0.000 claims description 10
- 235000002566 Capsicum Nutrition 0.000 claims description 9
- 235000016761 Piper aduncum Nutrition 0.000 claims description 9
- 235000017804 Piper guineense Nutrition 0.000 claims description 9
- 235000008184 Piper nigrum Nutrition 0.000 claims description 9
- 238000005457 optimization Methods 0.000 claims description 9
- 238000011156 evaluation Methods 0.000 claims description 6
- 244000203593 Piper nigrum Species 0.000 claims 1
- 238000005516 engineering process Methods 0.000 abstract description 6
- 241000722363 Piper Species 0.000 description 8
- 230000008569 process Effects 0.000 description 8
- 238000010586 diagram Methods 0.000 description 7
- 238000010276 construction Methods 0.000 description 3
- 238000013527 convolutional neural network Methods 0.000 description 3
- 238000012545 processing Methods 0.000 description 3
- 230000009286 beneficial effect Effects 0.000 description 2
- 230000005540 biological transmission Effects 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000010606 normalization Methods 0.000 description 2
- 238000012360 testing method Methods 0.000 description 2
- 241000872198 Serjania polyphylla Species 0.000 description 1
- 238000003759 clinical diagnosis Methods 0.000 description 1
- 230000008034 disappearance Effects 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 238000003384 imaging method Methods 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000008520 organization Effects 0.000 description 1
- 230000010355 oscillation Effects 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
- 238000012800 visualization Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2415—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on parametric or probabilistic models, e.g. based on likelihood ratio or false acceptance rate versus a false rejection rate
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02T—CLIMATE CHANGE MITIGATION TECHNOLOGIES RELATED TO TRANSPORTATION
- Y02T90/00—Enabling technologies or technologies with a potential or indirect contribution to GHG emissions mitigation
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Computing Systems (AREA)
- Software Systems (AREA)
- Molecular Biology (AREA)
- Computational Linguistics (AREA)
- Biophysics (AREA)
- Biomedical Technology (AREA)
- Mathematical Physics (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Probability & Statistics with Applications (AREA)
- Image Analysis (AREA)
Abstract
本发明涉及一种基于DenseNet的图像噪声识别方法和装置。本发明的基于DenseNet的图像噪声识别方法包括:获取无噪声图像,在无噪声图像中添加多个设定类型和设定强度的噪声,得到噪声图像训练集;提取噪声图像的灰度概率分布曲线,得到第一可视化统计特征图像;将第一可视化统计特征图像作为训练样本输入至图像噪声识别网络模型;提取待测噪声图像的灰度曲线,得到第二可视化统计特征图像;将第二可视化统计特征图像输入至训练好的图像噪声识别网络模型,得到待测噪声图像的噪声类型与强度估计值。本发明的方法解决了现有的图像噪声识别技术对低强度混合噪声的识别准确率低的问题,可以很好地对图像中存在的低强度混合噪声进行噪声类型与噪声强度的识别。
Description
技术领域
本发明涉及图像噪声识别技术领域,特别是涉及一种基于DenseNet的图像噪声识别方法和装置。
背景技术
图像噪声是指存在于图像数据中的不必要的或多余的干扰信息。噪声的存在严重影响了图像的质量,因此在图像增强处理和分类处理之前,必须予以纠正。
图像噪声的识别在图像处理的领域内起着至关重要的作用,会直接影响到后续图像的处理。图像信号的获取要经过采集,传输,存储,预处理,显示等步骤,过程繁琐而且每个步骤间彼此独立,因此难以对图像中噪声进行准确分析。
在实际的应用中,例如在医学背景下,CT图像在成像、采集、传输、储存,显示等过程中无法避免地会被各种类型的噪声影响。被噪声污染CT图像的图像纹理或者图像病灶区域会受到不同程度的影响,不仅降低了图像清晰度,也会对后续的临床诊断产生极大影响。
但传统技术中的噪声识别算法都是基于图像中只存在单一类型高强度噪声的假设,这些算法无法识别常见的低强度混合噪声。
发明内容
基于此,本发明的目的在于,提供一种基于DenseNet的图像噪声识别方法和装置,解决了现有的图像噪声识别技术对低强度混合噪声的识别准确率低的问题,可以很好地对图像中存在的低强度混合噪声进行噪声类型与噪声强度的识别。
第一方面,本申请实施例提供了一种基于DenseNet的图像噪声识别方法,包括如下步骤:
获取无噪声图像,在所述无噪声图像中添加多个设定类型和设定强度的噪声,得到噪声图像训练集;
对所述噪声图像训练集中的噪声图像进行预处理,提取所述噪声图像的灰度概率分布曲线,得到第一可视化统计特征图像;
将所述第一可视化统计特征图像作为训练样本输入至图像噪声识别网络模型,以训练所述图像噪声识别网络模型的网络参数,其中,所述图像噪声识别网络模型为DenseNet模型;
对待测噪声图像进行预处理,提取所述待测噪声图像的灰度概率分布曲线,得到第二可视化统计特征图像;
将所述第二可视化统计特征图像输入至训练好的所述图像噪声识别网络模型,得到所述待测噪声图像的噪声类型与强度估计值。
可选的,在所述无噪声图像中添加多个设定类型和设定强度的噪声,包括:
在所述无噪声图像中添加不同强度的高斯噪声,椒盐噪声或混合噪声。
可选的,所对所述噪声图像训练集中的噪声图像进行预处理,提取所述噪声图像的灰度概率分布曲线,得到第一可视化统计特征图像,包括:
绘制所述噪声图像训练集中的噪声图像的灰度直方图;
对所述灰度直方图进行拟合,得到灰度曲线图像;
对所述灰度曲线图像的灰度值频数进行归一化处理;
去除所述灰度曲线图像的坐标轴及坐标轴刻度;
将所述灰度曲线图像的尺寸修改为设定大小,得到所述第一可视化统计特征图像。
可选的,所述图像噪声识别网络模型的构建过程包括:
获取在ImageNet上预训练的DenseNet-201模型;
替换所述DenseNet-201模型的最后3层,将可识别1000类目录的全连接层替换为可识别所述多个噪声类型的第一全连接层;
在所述第一全连接层前添加第二全连接层和ReLU层,得到所述图像噪声识别网络模型。
可选的,训练所述图像噪声识别网络模型的网络参数,包括:
通过小批量带动量的随机梯度下降优化算法以及采用交叉熵作为损失函数训练所述图像噪声识别网络模型的网络参数。
可选的,所述小批量带动量的随机梯度下降优化算法表达式如下:
θi+1=θi-ηi+1ΔL(θi)+M*ηiΔL(θi-1)
其中,其中θ表示参数,η表示学习率,L(θ)表示最小化损失函数,△L(θ)表示负梯度,M表示动量;
所述交叉熵的定义如下:
其中,所述p表示真实分布,所述q表示非真实分布。
可选的,所述网络参数包括:
动量值、初始学习率、学习率衰减值、训练epoch和批尺寸。
可选的,训练所述图像噪声识别网络模型的网络参数,包括:
通过准确率,宏精确率,宏召回率与宏F1分数作为评价指标对所述图像噪声识别网络模型进行评价,其中,所述准确率为预测正确的图像数量与图像总数量之比;
其中,所述宏精确率的计算公式为:
所述宏召回率的计算公式为:
所述宏F1分数的计算公式为:
其中,所述P表示精确率,所述R表示召回率,所述n表示图像数量。
第二方面,本申请实施例提供了一种基于DenseNet的图像噪声识别装置,所述装置包括:
噪声图像训练集获取模块,用于获取无噪声图像,在所述无噪声图像中添加多个设定类型和设定强度的噪声,得到噪声图像训练集;
第一预处理模块,用于对所述噪声图像训练集中的噪声图像进行预处理,提取所述噪声图像的灰度概率分布曲线,得到第一可视化统计特征图像;
训练模块,用于将所述第一可视化统计特征图像作为训练样本输入至图像噪声识别网络模型,以训练所述图像噪声识别网络模型的网络参数,其中,所述图像噪声识别网络模型为DenseNet模型;
第二预处理模块,用于对待测噪声图像进行预处理,提取所述待测噪声图像的灰度概率分布曲线,得到第二可视化统计特征图像;
噪声识别模块,用于将所述第二可视化统计特征图像输入至训练好的所述图像噪声识别网络模型,得到所述待测噪声图像的噪声类型与强度估计值。
第三方面,本申请实施例提供了一种电子设备,包括:
存储器以及处理器;
所述存储器,用于存储一个或多个程序;
当所述一个或多个程序被所述处理器执行,使得所述处理器实现如本申请实施例第一方面所述的基于DenseNet的图像噪声识别方法。
在本申请实施例中,通过图像预处理提取图像灰度的概率分布曲线,得到第一可视化统计特征图像,并根据该第一可视化统计特征图像训练基于DenseNet卷积神经网络的图像噪声识别网络模型,进而可以使用该图像噪声识别网络模型识别待测噪声图像的噪声类型与噪声强度,解决了现有的图像噪声识别技术对低强度混合噪声的识别准确率低的问题,可以很好地对图像中存在的低强度混合噪声进行噪声类型与噪声强度的识别。
为了更好地理解和实施,下面结合附图详细说明本发明。
附图说明
图1为本申请一个实施例中的一种基于DenseNet的图像噪声识别方法流程图;
图2为本申请一个实施例中的对噪声图像进行预处理的步骤流程图;
图3为本申请一个实施例中的对噪声图像进行预处理的步骤示意图;
图4为本申请一个实施例中的一种基于DenseNet的图像噪声识别装置的结构示意图;
图5为本申请一个实施例中的电子设备的结构示意图。
具体实施方式
这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本说明书相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本说明书的一些方面相一致的装置和方法的例子。
在本说明书使用的术语是仅仅出于描述特定实施例的目的,而非旨在限制本说明书。在本说明书和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式,除非上下文清楚地表示其他含义。还应当理解,本文中使用的术语“和/或”是指并包含一个或多个相关联的列出项目的任何或所有可能组合。
接下来对本说明书实施例进行详细说明。
针对传统技术中的噪声识别算法都是基于图像中只存在单一类型高强度噪声的假设,无法识别常见的低强度混合噪声的技术问题,本申请实施例提供了一种基于DenseNet的图像噪声识别方法,如图1所示,在一个实施例中,所述方法包括如下步骤:
S101:获取无噪声图像,在所述无噪声图像中添加多个设定类型和设定强度的噪声,得到噪声图像训练集。
在一个例子中,所述无噪声图像可以是CT图像。
所述噪声的类型可以是高斯噪声,椒盐噪声或混合噪声等常见的图像噪声种类。在本申请实施例中,根据选择的精度不同,构建图像噪声数据集,在图像中添加不同强度的高斯噪声,椒盐噪声或混合噪声。针对相同或不同的噪声类型,其强度也可能不同。
本申请实施例中,添加的多个噪声其可能是具有不同类型,也可能具有不同的强度。在一个具体的例子中,噪声的数量为8个,分别是:参数为0.5%(密度)椒盐噪声;1%椒盐噪声;μ=0.005(均值),σ=0.1(标准差)高斯噪声;μ=0.01,σ=0.1高斯噪声;μ=0.01,σ=0.1高斯噪声&(混合)0.5%椒盐噪声;μ=0.01,σ=0.1高斯噪声&1%椒盐噪声;μ=0.005,σ=0.1高斯噪声&0.5%椒盐噪声;μ=0.005,σ=0.1高斯噪声&1%椒盐噪声这8类噪声,将这8类噪声分别加入目标无噪声图像中,便可构建噪声图像训练集。
在其他例子中,也可以是其他数量的噪声,或其他类型与强度的噪声组合。
S102:对所述噪声图像训练集中的噪声图像进行预处理,提取所述噪声图像的灰度概率分布曲线,得到第一可视化统计特征图像。
所述灰度曲线为体现所述噪声图像灰度的概率分布曲线,实验表明,不同种类以及不同强度的噪声,对图像的灰度曲线往往会造成不同的影响,因此,本申请实施例将噪声图像的灰度概率分布曲线作为图像噪声识别网络模型的输入参数。
灰度使用黑色调表示物体,即用黑色为基准色,不同的饱和度的黑色来显示图像,每个灰度对象都具有从0%(白色)到灰度条100%(黑色)的亮度值,灰度分布是指一幅灰度图像的灰度值的分布情况,一般通过灰度直方图来表示,因此,在一些例子中,本申请实施例中的灰度概率分布曲线可以是通过该图像的灰度直方图来获取。
在一些例子中,将得到的所述第一可视化统计特征图像按照预设比例6:2:2划分为训练集,验证集和测试集,用于分别对所述图像噪声识别网络模型进行训练、验证和测试。
S103:将所述第一可视化统计特征图像作为训练样本输入至图像噪声识别网络模型,以训练所述图像噪声识别网络模型的网络参数,其中,所述图像噪声识别网络模型为DenseNet模型。
DenseNet(Dense Convolutional Network,稠密卷积网络)在前馈时将每一层都与其他的任一层进行了连接。每一层都将之前的所有层的特征图作为输入,而它自己的特征图是之后所有层的输入。DenseNet的优点在于:有助于解决梯度消失问题,有利于特征传播,鼓励特征的重复利用,还可以减少参数量,而且使用更少的计算量就可以获得更好的性能。
S104:对待测噪声图像进行预处理,提取所述待测噪声图像的灰度概率分布曲线,得到第二可视化统计特征图像。
所述待测噪声图像可以是带噪声的CT图像。
在本申请实施例中,对待测噪声图像所进行的预处理与对所述噪声图像训练集中的噪声图像进行的预处理相同。
S105:将所述第二可视化统计特征图像输入至训练好的所述图像噪声识别网络模型,得到所述待测噪声图像的噪声类型与强度估计值。
在本申请实施例中,通过图像预处理提取图像灰度的概率分布曲线,得到第一可视化统计特征图像,并根据该第一可视化统计特征图像训练基于DenseNet卷积神经网络的图像噪声识别网络模型,进而可以使用该图像噪声识别网络模型识别待测噪声图像的噪声类型与噪声强度,解决了现有的图像噪声识别技术对低强度混合噪声的识别准确率低的问题,可以很好地对图像中存在的低强度混合噪声进行噪声类型与噪声强度的识别。
在一个示例性的实施例中,如图2和图3所示,对所述噪声图像训练集中的噪声图像进行预处理,提取所述噪声图像的灰度概率分布曲线,得到第一可视化统计特征图像,包括:
S201:绘制所述噪声图像训练集中的噪声图像的灰度直方图;
S202:对所述灰度直方图进行拟合,得到灰度曲线图像;
S203:对所述灰度曲线图像的灰度值频数进行归一化处理;
S204:去除所述灰度曲线图像的坐标轴及坐标轴刻度;
S205:将所述灰度曲线图像的尺寸修改为设定大小,得到所述第一可视化统计特征图像。
在一个实施例中,对所述噪声图像训练集中的噪声图像按如下步骤进行预处理:绘制输入图像灰度直方图;将灰度直方图拟合成曲线;优化灰度值频数(y轴)区间;去除坐标轴及坐标轴刻度;修改图像尺寸为224*224*3。
灰度直方图是关于灰度级分布的函数,是对图像中灰度级分布的统计。灰度直方图是将数字图像中的所有像素,按照灰度值的大小,统计其出现的频率。灰度直方图是灰度级的函数,它表示图像中具有某种灰度级的像素的个数,反映了图像中某种灰度出现的频率。
在具体的例子中,可通过将灰度直方图曲线中的灰度值频数(y轴坐标)除以图像像素值个数总和223*224*3,归一化y轴区间为0-1,然后再优化y轴区间为0-0.1。
在一个示例性的实施例中,所述图像噪声识别网络模型的构建过程包括:
获取在ImageNet上预训练的DenseNet-201模型;
替换所述DenseNet-201模型的最后3层,将可识别1000类目录的全连接层替换为可识别所述多个噪声类型的第一全连接层;
在所述第一全连接层前添加第二全连接层和ReLU层,得到所述图像噪声识别网络模型。
在本申请实施例中,通过和获取在ImageNet上预训练的DenseNet-201模型的网络结构,并对其进行微调,得到本申请的图像噪声识别网络模型。
ImageNet项目是一个用于视觉对象识别软件研究的大型可视化数据库。DenseNet-201模型是基于ResNet的网络组织形式,针对于ImageNet物体识别任务分别设计了DesNet-121(k=32)、DesNet-169(k=32)、DesNet-201(k=32)和DesNet-161(k=48)四种网络结构,DenseNet-201模型可识别1000类目录。
由于DesNet-201模型的最后一层包括可识别1000类目录的全连接层,而本申请实施例中需要识别的图像噪声类型的数量通常只有数个,例如前述实施例中的8个,因此,在一个实施例中,替换DesNet-201模型的最后三层:全连接层,Softmax层,输出分类层,将可识别1000类目录的全连接层替换为可识别8种噪声类型的全连接层;并且在全连接层前添加一个大小为64*64的全连接层与一个ReLU层。
在一个示例性的实施例中,训练所述图像噪声识别网络模型的网络参数,包括:
通过小批量带动量的随机梯度下降优化算法以及采用交叉熵作为损失函数训练所述图像噪声识别网络模型的网络参数。
在一个具体的例子中,小批量带动量的随机梯度下降优化算法通过最小化损失函数L(θ),也即在损失函数的负梯度△L(θ)方向上以学习率η作为步长更新参数,以期达到降低损失函数的目的,算法每次选取小于总样本数的一定量样本进行迭代,如此可以在保证相对的准确率的同时,也可以保证较快的运算速度,为了加速收敛并且提高精度,减少收敛过程中的震荡,算法中加上一个介于0到1之间的动量M,所述小批量带动量的随机梯度下降优化算法表达式如下:
θi+1=θi-ηi+1ΔL(θi)+M*ηiΔL(θi-1)
其中,其中θ表示参数,η表示学习率,L(θ)表示最小化损失函数,△L(θ)表示负梯度,M表示动量。
交叉熵可以用来表达两个概率之间存在的距离,是分类问题中常用的评判方式之一,最小化交叉熵等价于最小化实际输出与期望输出的相对熵,即两者概率分布的KL散度。对于两个离散的概率分布p和q,在一个实施例中,所述交叉熵的定义如下:
其中,所述p表示真实分布,所述q表示非真实分布。
在一个例子中,所述步骤S3中网络参数包括动量值,初始学习率,学习率衰减值,训练epoch,批尺寸。
在一个具体的例子中,设置动量值为0.9,所述图像噪声识别网络模型以1e-3的初始学习率开始训练,每10个epoch学习率衰减90%,因为数据集规模小,并且网络经过充分预训练,低层权重不需要太多的更新,所以设置训练最大epoch为20,每次迭代的批尺寸大小为32。
在一实施例中,训练所述图像噪声识别网络模型的网络参数,包括:
通过准确率,宏精确率,宏召回率与宏F1分数作为评价指标对所述图像噪声识别网络模型进行评价。
其中,所述准确率为预测正确的图像数量与图像总数量之比;
所述宏精确率的计算公式为:
所述宏召回率的计算公式为:
所述宏F1分数的计算公式为:
其中,所述P表示精确率,所述R表示召回率,所述n表示图像数量。
由于上述准确率,宏精确率,宏召回率与宏F1分数指标反应了正向准确程度,因此其值越大,说明预测的精确度越高。
本申请实施例的基于DenseNet的图像噪声识别方法与传统方法的效果比较结果如下表所示:
本申请实施例的基于DenseNet的图像噪声识别方法在传统的基于灰度直方图的噪声识别算法上进行优化,通过图像预处理提取可视化统计特征图并结合卷积神经网络解决了低强度混合噪声的识别准确率低的问题。可以很好地对图像中存在的低强度混合噪声进行噪声类型与噪声强度的识别。
对比三种算法的识别效果可以发现,对低强度混合噪声的识别准确率高,比其他两种算法具有更高的识别精度。
与前述基于DenseNet的图像噪声识别方法相对应,本申请实施例还提供一种基于DenseNet的图像噪声识别装置,应用于电子设备。
图4为本申请实施例提供的一种基于DenseNet的图像噪声识别装置的结构示意图,如图4所示,所述基于DenseNet的图像噪声识别装置40包括:
噪声图像训练集获取模块41,用于获取无噪声图像,在所述无噪声图像中添加多个设定类型和设定强度的噪声,得到噪声图像训练集;
第一预处理模块42,用于对所述噪声图像训练集中的噪声图像进行预处理,提取所述噪声图像的灰度概率分布曲线,得到第一可视化统计特征图像;
训练模块43,用于将所述第一可视化统计特征图像作为训练样本输入至图像噪声识别网络模型,以训练所述图像噪声识别网络模型的网络参数,其中,所述图像噪声识别网络模型为DenseNet模型;
第二预处理模块44,用于对待测噪声图像进行预处理,提取所述待测噪声图像的灰度概率分布曲线,得到第二可视化统计特征图像;
噪声识别模块45,用于将所述第二可视化统计特征图像输入至训练好的所述图像噪声识别网络模型,得到所述待测噪声图像的噪声类型与强度估计值。
在一个示例性的实施例中,所述噪声图像训练集获取模块41包括:
噪声添加单元,用于在所述无噪声图像中添加不同强度的高斯噪声,椒盐噪声或混合噪声。
在一个示例性的实施例中,第一预处理模块42包括:
直方图绘制单元,用于绘制所述噪声图像训练集中的噪声图像的灰度直方图;
拟合单元,用于对所述灰度直方图进行拟合,得到灰度曲线图像;
归一化单元,用于对所述灰度曲线图像的灰度值频数进行归一化处理;
去除单元,用于去除所述灰度曲线图像的坐标轴及坐标轴刻度;
图像尺寸修改单元,用于将所述灰度曲线图像的尺寸修改为设定大小,得到所述第一可视化统计特征图像。
在一个示例性的实施例中,所述基于DenseNet的图像噪声识别装置40还包括模型构建模块,所述模型构建模块包括:
DenseNet-201模型获取单元,用于获取在ImageNet上预训练的DenseNet-201模型;
替换单元,用于替换所述DenseNet-201模型的最后3层,将可识别1000类目录的全连接层替换为可识别所述多个噪声类型的第一全连接层;
添加单元,用于在所述第一全连接层前添加第二全连接层和ReLU层,得到所述图像噪声识别网络模型。
在一个示例性的实施例中,所述训练模块43包括:
训练单元,用于通过小批量带动量的随机梯度下降优化算法以及采用交叉熵作为损失函数训练所述图像噪声识别网络模型的网络参数。
在一个示例性的实施例中,所述小批量带动量的随机梯度下降优化算法表达式如下:
θi+1=θi-ηi+1ΔL(θi)+M*ηiΔL(θi-1)
其中,其中θ表示参数,η表示学习率,L(θ)表示最小化损失函数,△L(θ)表示负梯度,M表示动量;
所述交叉熵的定义如下:
其中,所述p表示真实分布,所述q表示非真实分布。
在一个示例性的实施例中,所述网络参数包括:
动量值、初始学习率、学习率衰减值、训练epoch和批尺寸。
在一个示例性的实施例中,所述训练模块43还包括:
评价单元,用于通过准确率,宏精确率,宏召回率与宏F1分数作为评价指标对所述图像噪声识别网络模型进行评价,其中,所述准确率为预测正确的图像数量与图像总数量之比;
其中,所述宏精确率的计算公式为:
所述宏召回率的计算公式为:
所述宏F1分数的计算公式为:
其中,所述P表示精确率,所述R表示召回率,所述n表示图像数量。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统,装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
图5为本申请实施例一种电子设备50的结构示意图,该电子设备50包括通过系统总线51连接的处理器52、存储器53(例如为非易失性存储介质)、显示屏54和输入装置55。其中,电子设备50的存储器53存储有操作系统和计算机可读指令。该计算机可读指令可被处理器52执行,以实现本申请实施例中的一种基于DenseNet的图像噪声识别方法。该处理器52用于提供计算和控制能力,支撑整个电子设备50的运行。电子设备50的显示屏54可以是液晶显示屏或者电子墨水显示屏等,输入装置55可以是显示屏54上覆盖的触摸层,也可以是电子设备50外壳上设置的按键、轨迹球或触控板,也可以是外接的键盘、触控板或鼠标等。该电子设备50可以是计算机、笔记本电脑、服务器等。本领域技术人员可以理解,图5中示出的结构,仅仅是与本申请方案相关的部分结构的示意图,并不构成对本申请方案所应用于其上的电子设备50的限定,具体的电子设备50可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
以上所述实施例仅表达了本发明的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形和改进,这些都属于本发明的保护范围。
Claims (10)
1.一种基于DenseNet的图像噪声识别方法,其特征在于,包括如下步骤:
获取无噪声图像,在所述无噪声图像中添加多个设定类型和设定强度的噪声,得到噪声图像训练集;
对所述噪声图像训练集中的噪声图像进行预处理,提取所述噪声图像的灰度概率分布曲线,得到第一可视化统计特征图像;
将所述第一可视化统计特征图像作为训练样本输入至图像噪声识别网络模型,以训练所述图像噪声识别网络模型的网络参数,其中,所述图像噪声识别网络模型为DenseNet模型;
对待测噪声图像进行预处理,提取所述待测噪声图像的灰度概率分布曲线,得到第二可视化统计特征图像;
将所述第二可视化统计特征图像输入至训练好的所述图像噪声识别网络模型,得到所述待测噪声图像的噪声类型与强度估计值。
2.根据权利要求1所述的一种基于DenseNet的图像噪声识别方法,其特征在于,在所述无噪声图像中添加多个设定类型和设定强度的噪声,包括:
在所述无噪声图像中添加不同强度的高斯噪声,不同强度的椒盐噪声或不同强度的混合噪声。
3.根据权利要求1所述的一种基于DenseNet的图像噪声识别方法,其特征在于,对所述噪声图像训练集中的噪声图像进行预处理,提取所述噪声图像的灰度概率分布曲线,得到第一可视化统计特征图像,包括:
绘制所述噪声图像训练集中的噪声图像的灰度直方图;
对所述灰度直方图进行拟合,得到灰度曲线图像;
对所述灰度曲线图像的灰度值频数进行归一化处理;
去除所述灰度曲线图像的坐标轴及坐标轴刻度;
将所述灰度曲线图像的尺寸修改为设定大小,得到所述第一可视化统计特征图像。
4.根据权利要求1所述的一种基于DenseNet的图像噪声识别方法,其特征在于,所述图像噪声识别网络模型的构建过程包括:
获取在ImageNet上预训练的DenseNet-201模型;
替换所述DenseNet-201模型的最后3层,将可识别1000类目录的全连接层替换为可识别所述多个噪声类型的第一全连接层;
在所述第一全连接层前添加第二全连接层和ReLU层,得到所述图像噪声识别网络模型。
5.根据权利要求4所述的一种基于DenseNet的图像噪声识别方法,其特征在于,训练所述图像噪声识别网络模型的网络参数,包括:
通过小批量带动量的随机梯度下降优化算法以及采用交叉熵作为损失函数训练所述图像噪声识别网络模型的网络参数。
7.根据权利要求6所述的一种基于DenseNet的图像噪声识别方法,其特征在于,所述网络参数包括:
动量值、初始学习率、学习率衰减值、训练epoch和批尺寸。
9.一种基于DenseNet的图像噪声识别装置,其特征在于,包括:
噪声图像训练集获取模块,用于获取无噪声图像,在所述无噪声图像中添加多个设定类型和设定强度的噪声,得到噪声图像训练集;
第一预处理模块,用于对所述噪声图像训练集中的噪声图像进行预处理,提取所述噪声图像的灰度概率分布曲线,得到第一可视化统计特征图像;
训练模块,用于将所述第一可视化统计特征图像作为训练样本输入至图像噪声识别网络模型,以训练所述图像噪声识别网络模型的网络参数,其中,所述图像噪声识别网络模型为DenseNet模型;
第二预处理模块,用于对待测噪声图像进行预处理,提取所述待测噪声图像的灰度概率分布曲线,得到第二可视化统计特征图像;
噪声识别模块,用于将所述第二可视化统计特征图像输入至训练好的所述图像噪声识别网络模型,得到所述待测噪声图像的噪声类型与强度估计值。
10.一种电子设备,其特征在于,包括:
存储器以及处理器;
所述存储器,用于存储个或多个程序;
当所述一个或多个程序被所述处理器执行,使得所述处理器实现如权利要求1-8中任一所述的基于DenseNet的图像噪声识别方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010449396.3A CN111598184B (zh) | 2020-05-25 | 2020-05-25 | 一种基于DenseNet的图像噪声识别方法和装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010449396.3A CN111598184B (zh) | 2020-05-25 | 2020-05-25 | 一种基于DenseNet的图像噪声识别方法和装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111598184A CN111598184A (zh) | 2020-08-28 |
CN111598184B true CN111598184B (zh) | 2023-04-18 |
Family
ID=72191658
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010449396.3A Active CN111598184B (zh) | 2020-05-25 | 2020-05-25 | 一种基于DenseNet的图像噪声识别方法和装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111598184B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113658070A (zh) * | 2021-08-13 | 2021-11-16 | Oppo广东移动通信有限公司 | 图像处理方法、图像处理装置、存储介质与电子设备 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107563350A (zh) * | 2017-09-21 | 2018-01-09 | 深圳市唯特视科技有限公司 | 一种基于尺度建议网络的人脸检测方法 |
CN110390650A (zh) * | 2019-07-23 | 2019-10-29 | 中南大学 | 基于密集连接和生成对抗网络的oct图像去噪方法 |
CN110599409A (zh) * | 2019-08-01 | 2019-12-20 | 西安理工大学 | 基于多尺度卷积组与并行的卷积神经网络图像去噪方法 |
CN111161207A (zh) * | 2019-11-14 | 2020-05-15 | 西安工程大学 | 一种集成的卷积神经网络织物疵点分类方法 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10409393B2 (en) * | 2015-03-10 | 2019-09-10 | Pixart Imaging Inc. | Image processing method capable of detecting noise and related navigation device |
-
2020
- 2020-05-25 CN CN202010449396.3A patent/CN111598184B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107563350A (zh) * | 2017-09-21 | 2018-01-09 | 深圳市唯特视科技有限公司 | 一种基于尺度建议网络的人脸检测方法 |
CN110390650A (zh) * | 2019-07-23 | 2019-10-29 | 中南大学 | 基于密集连接和生成对抗网络的oct图像去噪方法 |
CN110599409A (zh) * | 2019-08-01 | 2019-12-20 | 西安理工大学 | 基于多尺度卷积组与并行的卷积神经网络图像去噪方法 |
CN111161207A (zh) * | 2019-11-14 | 2020-05-15 | 西安工程大学 | 一种集成的卷积神经网络织物疵点分类方法 |
Non-Patent Citations (3)
Title |
---|
Removal of Impulse Noise from Gray Images using Fuzzy SVM Based Histogram Fuzzy Filter;Amarjit Roy;《Journal of Circuits, Systems, and Computers》;第27卷(第9期);正文1-23 * |
基于灰度直方图的单一图像噪声类型识别研究;王连利;《软件导刊》;第17卷(第4期);197-200 * |
基于直方图信息灰色关联的图像;丁生荣;《陕西师范大学学报(自然科学版)》;第39卷(第1期);24-28 * |
Also Published As
Publication number | Publication date |
---|---|
CN111598184A (zh) | 2020-08-28 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN113689428B (zh) | 基于图像处理的机械零件应力腐蚀检测方法及系统 | |
CN109145921B (zh) | 一种基于改进的直觉模糊c均值聚类的图像分割方法 | |
CN109993221B (zh) | 一种图像分类方法及装置 | |
CN111524137A (zh) | 基于图像识别的细胞识别计数方法、装置和计算机设备 | |
US11281895B2 (en) | Expression recognition method, computer device, and computer-readable storage medium | |
CN110969200B (zh) | 基于一致性负样本的图像目标检测模型训练方法及装置 | |
CN110766657B (zh) | 一种激光干扰图像质量评价方法 | |
CN115994907B (zh) | 用于食品检测机构综合信息的智能处理系统及方法 | |
CN113065593A (zh) | 模型训练方法、装置、计算机设备和存储介质 | |
CN116894985B (zh) | 半监督图像分类方法及半监督图像分类系统 | |
CN118279304B (zh) | 基于图像处理的异型金属件异常识别方法、装置及介质 | |
CN113140309A (zh) | 中医面色诊断方法及装置 | |
CN114155397A (zh) | 一种小样本图像分类方法及系统 | |
CN111598184B (zh) | 一种基于DenseNet的图像噪声识别方法和装置 | |
CN116934747A (zh) | 眼底图像分割模型训练方法、设备和青光眼辅助诊断系统 | |
CN116704208B (zh) | 基于特征关系的局部可解释方法 | |
CN112270404A (zh) | 一种基于ResNet64网络的紧固件产品鼓包缺陷的检测结构及其方法 | |
US11448634B2 (en) | Analysis apparatus, stratum age estimation apparatus, analysis method, stratum age estimation method, and program | |
CN111079715B (zh) | 一种基于双字典学习的遮挡鲁棒性人脸对齐方法 | |
CN111242047A (zh) | 图像处理方法和装置、电子设备及计算机可读存储介质 | |
CN111597934A (zh) | 用于为统计应用处理训练数据的系统和方法 | |
Shi et al. | BreastNet: entropy-regularized transferable multi-task learning for classification with limited breast data | |
CN110458024A (zh) | 活体检测方法及装置和电子设备 | |
Zenkov | Machine Learning. Correlational Convolution Method for Image Classification | |
CN113139936B (zh) | 一种图像分割处理方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |