CN112819017B - 基于直方图的高精度色偏图像识别方法 - Google Patents
基于直方图的高精度色偏图像识别方法 Download PDFInfo
- Publication number
- CN112819017B CN112819017B CN202110257073.9A CN202110257073A CN112819017B CN 112819017 B CN112819017 B CN 112819017B CN 202110257073 A CN202110257073 A CN 202110257073A CN 112819017 B CN112819017 B CN 112819017B
- Authority
- CN
- China
- Prior art keywords
- histogram
- image
- object image
- gray scale
- color
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 40
- 238000012545 processing Methods 0.000 claims abstract description 11
- 238000004458 analytical method Methods 0.000 claims abstract description 8
- 238000012549 training Methods 0.000 claims description 83
- 238000012795 verification Methods 0.000 claims description 26
- 238000012360 testing method Methods 0.000 claims description 21
- 238000010801 machine learning Methods 0.000 claims description 12
- 241001270131 Agaricus moelleri Species 0.000 claims description 11
- 238000013135 deep learning Methods 0.000 claims description 7
- 238000003491 array Methods 0.000 claims description 6
- 238000003062 neural network model Methods 0.000 claims description 5
- 238000010200 validation analysis Methods 0.000 claims description 3
- 230000008859 change Effects 0.000 description 9
- 239000003086 colorant Substances 0.000 description 9
- 230000006870 function Effects 0.000 description 9
- 230000000694 effects Effects 0.000 description 7
- 230000008569 process Effects 0.000 description 7
- 230000009286 beneficial effect Effects 0.000 description 3
- 238000013527 convolutional neural network Methods 0.000 description 3
- 238000010586 diagram Methods 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 230000002349 favourable effect Effects 0.000 description 3
- 238000005286 illumination Methods 0.000 description 3
- 238000013519 translation Methods 0.000 description 3
- 238000010276 construction Methods 0.000 description 2
- 238000003384 imaging method Methods 0.000 description 2
- 238000006386 neutralization reaction Methods 0.000 description 2
- 229920001621 AMOLED Polymers 0.000 description 1
- 230000002238 attenuated effect Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 238000012937 correction Methods 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000001537 neural effect Effects 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 238000009877 rendering Methods 0.000 description 1
- 238000013526 transfer learning Methods 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
- 239000012855 volatile organic compound Substances 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
- G06V10/56—Extraction of image or video features relating to colour
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
- G06V10/50—Extraction of image or video features by performing operations within image blocks; by using histograms, e.g. histogram of oriented gradients [HoG]; by summing image-intensity values; Projection analysis
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Physics & Mathematics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- General Engineering & Computer Science (AREA)
- Evolutionary Computation (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Multimedia (AREA)
- Computational Linguistics (AREA)
- Biophysics (AREA)
- Biomedical Technology (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Health & Medical Sciences (AREA)
- Image Analysis (AREA)
- Facsimile Image Signal Circuits (AREA)
Abstract
本发明公开一种基于直方图的高精度色偏图像识别方法,属于图像智能处理技术领域,提出以下方案:基于直方图的高精度色偏图像识别方法,包括:获取任一实物图像,生成实物图像对应的直方图;将生成的直方图输入二分类器进行分析;根据二分类器的分析,判断实物图像是否具有色偏,当实物图像为色偏图像,则通过白平衡算法处理后输出,当实物图像为正常图像,则直接输出。本发明方案提升了色偏图像识别的精确性。
Description
技术领域
本发明涉及图像智能处理技术领域,具体涉及一种基于直方图的高精度色偏图像识别方法。
背景技术
在带有摄像头的电子产品中,图像在拍摄的过程中容易受到环境光的污染,使得拍出的图像带有色偏,这种现象被称为色彩失真。虽然灰度世界算法、直方图匹配算法、直方图平移算法等传统方法优化了直方图重叠面积、欧几里德距离等指标,提升了色彩还原的效果。但是这类方法对输入图像进行无区分性的处理,业界使用深度学习网络模型,导入大量图像集进行训练,获取大量数据集中包含的特征和规律,达到精确分类的目的。目前的深度学习图像数据集多采用实物图像作为基本构成单元,如在以图像中具体物体为识别目标的相关应用中。然而,色偏图像的识别问题具有其特殊性,包括不再以图像中的具体物体作为识别目标,而是以图像的整体颜色作为识别目标;不再关注图像的纹理和位置等特征,而是关注图像的整体颜色特征。因此,传统上以实物图像作为基本单元构建图像集的方法已经不适合于色偏图像的分类问题,需要寻找新的图像集构建方法。
发明内容
本发明所解决的技术问题在于提供一种基于直方图的高精度色偏图像识别方法,旨在提升色偏图像识别的精确性。
本发明提供的基础方案:
一种基于直方图的高精度色偏图像识别方法,包括:
获取任一实物图像,生成所述实物图像对应的直方图;
将生成的所述直方图输入二分类器进行分析;
根据所述二分类器的分析,判断实物图像是否具有色偏,当实物图像为色偏图像,则通过白平衡算法处理后输出,当实物图像为正常图像,则直接输出。
本发明基础方案的原理为:
本方案中,基于直方图的高精度色偏图像识别方法中,直方图是描述实物图像中各个灰阶出现次数的统计图,直方图的横坐标是各个灰阶,取值范围是[0,255]。直方图的纵坐标是某个灰阶对应的像素个数,取值范围是[0,N],其中N为实物图像的总像素个数。直方图可以非常直观地表达图像的色偏程度,红、绿、蓝三基色直方图的交叠部分面积越大,说明三种颜色的相互中和效果越强,色偏越弱。反之,交叠部分的面积越小,说明三个通道之间的偏离越大,更加容易引起颜色的失衡,色偏越强。鉴于直方图可以直观地表达图像的颜色特征和色偏程度,本发明以实物图像的直方图为基本单元取代实物图像,将生成的实物图像对应的直方图输入二分类器进行分析,以判断实物图像是否具有色偏。
基础方案的有益效果为:
(1)本方案中,以实物图像对应的直方图构建图像集,实现更加精确的色偏图像分类,促进智能白平衡技术的进步。
(2)本方案中,直方图可以更加直观地表达彩色实物图像的颜色特征和色偏程度,更加有利于实现精确高效的对实物图像颜色区分。
(3)本方案中,当实物图像为色偏图像,通过对色偏图像进行白平衡算法处理,提升了实物图像的处理效率和图片质量。
(4)本方案中,直方图集训练损失函数可以达到更低,收敛更快。
进一步,所述获取任一实物图像,生成所述实物图像对应的直方图的步骤包括:
获取任一实物图像;
根据所述实物图像获取红色通道灰阶、绿色通道灰阶和蓝色通道灰阶,分别放在三个数组;
分别统计所述红色通道灰阶、所述绿色通道灰阶和所述蓝色通道灰阶在所述实物图像出现的次数;
以各级灰阶作为横坐标,三通道灰阶在所述实物图像出现的次数作为纵坐标绘制出所述实物图对应的直方图。
实物图像中每一像素均具有红、绿、蓝三个灰阶,实物图像的灰阶由8bit存储单元存放,最小值为0,最大值为255,一共256个灰阶等级。本方案中,通过将红、绿、蓝三通道灰阶分别作为横坐标,三通道灰阶在实物图像出现的次数作为纵坐标绘制出实物图对应的直方图,适于机器训练的单张图像直方图,使得直方图更加有利于实现精确高效的对实物图像颜色区分。
进一步,根据所述实物图像获取红色通道灰阶、绿色通道灰阶和蓝色通道灰阶,分别放在三个数组的步骤包括:
获取的所述实物图像中每一像素均具有红、绿、蓝三个灰阶,每一所述数组中元素的个数为所述实物图像中像素的个数。
本方案中,通过实物图像的每一像素均具有红、绿、蓝(R、G、B)三个灰阶,每一数组中元素的个数为实物图像中像素个数N,即N=W*H,其中W为横向分辨率,H为纵向分辨率。更加便于通过直方图对实物图像色偏的精确判断。
进一步,所述以各级灰阶作为横坐标,三通道灰阶在所述实物图像出现的次数作为纵坐标绘制出所述实物图对应的直方图的步骤包括:
以黑色作为所述直方图的背景色,以红色、绿色、蓝色作为三基色直方图的填充色,以白色作为三基色直方图交叠部分的填充色。
本方案中,以黑色作为所述直方图的背景色,由于黑色对应的灰阶为0,可以大大减小在训练过程中的计算量。以红色、绿色、蓝色作为三基色直方图的填充色,以白色作为三基色直方图交叠部分的填充色,白色填充部分的面积可以直观地反应色偏的强弱程度,有助于实现高效训练。
进一步,基于直方图的高精度色偏图像识别方法还包括:
从公开图像中获取全部图像或者部分图像构建正常图像集,并生成适于机器学习的正常直方图集;
对所述正常图像集中的每一图像进行色偏处理,以生成色偏图像集,并生成适于机器学习的色偏直方图集;
根据所述正常直方图集和所述色偏直方图集,构建色偏图像训练集、验证集和测试集。
本方案中,通过精确分类、识别等,获取到正常图像集和色偏图像集,并以此构建色偏图像训练集、验证集和测试集。不同于传统方法中采用实物图片作为图片集的基本单元,而是以实物图片对应的直方图构建图片集。相比于实物图片,其对应的直方图直观地表征了三基色在全部灰阶范围内的分布情况,更加清楚反应图片的颜色特征,因而更加有利于实现精确高效的颜色区分。
进一步,根据所述正常直方图集和所述色偏直方图集,构建色偏图像训练集、验证集和测试集,用于训练神经网络模型。
本方案中,由于根据生成的正常直方图集和色偏直方图集,使得用于训练神经网络模型而构建的色偏图像训练集、验证集和测试集,提升了实物图像中色偏图像的准确性。
进一步,基于直方图的高精度色偏图像识别方法还包括:
基于所述直方图的训练集、验证集作为实物图像,根据开源机器训练模型在深度学习计算机上进行训练;
根据所述深度学习计算机的训练反馈调节所述开源训练模型的参数,以产生二分类器。
基于直方图的训练集、验证集作为实物图像,结合开源机器训练模型在深度学习计算机上训练,并根据训练反馈调节开源训练模型的参数,使得产生的二分类器更好地对实物图像对应的直方图进行分析,以识别出实物图像中的正常图像和色偏图像。
附图说明
图1是本发明基于直方图的高精度色偏图像识别方法一实施例的流程示意图;
图2为本发明基于直方图的高精度色偏图像识别方法一实施例的流程模块示意图;
图3为本发明基于直方图的高精度色偏图像识别方法中绘制直方图一实施例的流程示意图;
图4为本发明基于直方图的高精度色偏图像识别方法中生成直方图集的模块图;
图5为本发明基于直方图的高精度色偏图像识别方法中构建直方图训练集、验证集和测试集的流程示意图;
图6为本发明基于直方图的高精度色偏图像识别方法的训练过程中准确度和损失函数对比示意图。
具体实施方式
下面通过具体实施方式进一步详细说明:
在一实施例中,参照如图1所示,基于直方图的高精度色偏图像识别方法,包括:
步骤S10,获取任一实物图像,生成所述实物图像对应的直方图;
步骤S20,将生成的所述直方图输入二分类器进行分析;
步骤S30,根据所述二分类器的分析,判断实物图像是否具有色偏,当实物图像为色偏图像,则通过白平衡算法处理后输出,当实物图像为正常图像,则直接输出。
本实施例中,基于传统技术中灰度世界算法、直方图匹配算法、直方图平移算法等方法优化了直方图重叠面积、欧几里德距离等指标,提升了色彩还原的效果。进一步通过实物图像对应的直方图,结合二分类器对实物图像是否色偏进行判断,提升了实物图像识别的准确性。需要说明的是,灰度世界算法以灰度世界假设为基础,该假设认为:对于一幅有着大量色彩变化的图像,其R,G,B三个色彩分量的平均值趋于同一灰度值K。从物理意义上讲,灰度世界算法假设自然界景物对于光线的平均反射的均值在总体上是个定值,这个定值近似地为“灰色”。颜色平衡算法将这一假设强制应用于待处理图像,可以从图像中消除环境光的影响,获得原始场景图像。人的视觉系统具有颜色恒常性,能从变化的光照环境和成像条件下获取物体表面颜色的不变特性,但成像设备不具有这样的调节功能,不同的光照环境会导致采集的图像颜色与真实颜色存在一定程度的偏差,需要选择合适的颜色平衡(校正)算法,消除光照环境对颜色显现的影响,灰度世界算法即是最常用平衡算法。关于直方图匹配算法可参照文献“A Low Power and Low Complexity Automatic White BalanceAlgorithm for AMOLED Driving using Histogram Matching”,关于直方图平移算法可参照文献:“黄成强,李天华,贺娟.直方图平移的色彩还原算法研究[J].液晶与显示,2016,31(10):983-988.”
具体地,直方图是数字图像处理的重要工具和手段,例如,业界通过直方图判断图像的亮暗程度,采用直方图均衡实现对比度的提升,采用直方图匹配实现白平衡等。对于彩色的实物图像,其直方图是红、绿、蓝三基色直方图的组合图。直方图可以非常直观地表达彩色实物图像的颜色特征。例如,如果高灰阶部分红色通道的直方图较其它两个通道的直方图强烈,则实物图像的颜色总体偏红。实物图像的颜色主要受到高灰阶部分的影响,如果某个通道高灰阶部分的直方图信号压过其它两个通道,则实物图像将呈现出高灰阶部分的颜色。
本实施例中,参照如图2所示,采用实物图像对应的直方图构建了分类图像训练集、验证集和测试集。不同于传统方法中采用实物图像作为图像集的基本单元,相比于实物图像,其对应的直方图直观地表征了三基色在全部灰阶范围内的分布情况,更加能够反应图像的颜色特征,因而更加有利于实现精确高效的颜色区分。进一步地,提出了一种生成适合于分类训练直方图的方法,以黑色作为直方图的背景色,由于黑色对应的灰阶为0,可以较大减小在训练过程中的计算量。红、绿、蓝三通道的直方图分别用红、绿、蓝三色填充,三个通道直方图交叠部分用白色填充,白色填充部分的面积可以直观地反应色偏的强弱程度,有助于实现高效训练,使得直方图集训练损失函数可以达到更低,收敛更快。
进一步地,直方图是描述实物图像中各个灰阶出现次数的统计图,直方图的横坐标是各个灰阶,取值范围是[0,255]。直方图的纵坐标是某个灰阶对应的像素个数,取值范围是[0,N],其中N为实物图像的总像素个数。直方图可以非常直观地表达图像的色偏程度,红、绿、蓝三基色直方图的交叠部分面积越大,说明三种颜色的相互中和效果越强,色偏越弱。反之,交叠部分的面积越小,说明三个通道之间的偏离越大,更加容易引起颜色的失衡,色偏越强。鉴于直方图可以直观地表达图像的颜色特征和色偏程度,本发明以实物图像的直方图为基本单元取代实物图像,将生成的实物图像对应的直方图输入二分类器进行分析,以判断实物图像是否具有色偏。使得本方案可以更加直观地表达彩色实物图像的颜色特征和色偏程度,更加有利于实现精确高效的对实物图像颜色区分;更加精确的对色偏图像分类,促进智能白平衡技术的进步,提升了实物图像的处理效率和图片质量。
在一实施例中,参照如图3所示,通过步骤S11,获取任一实物图像;步骤S12,根据所述实物图像获取红色通道灰阶、绿色通道灰阶和蓝色通道灰阶,分别放在三个数组;步骤S13,分别统计所述红色通道灰阶、所述绿色通道灰阶和所述蓝色通道灰阶在所述实物图像出现的次数;步骤S14,以各级灰阶作为横坐标,三通道灰阶在所述实物图像出现的次数作为纵坐标绘制出所述实物图对应的直方图。以此生成适用于机器训练的实物图像对应的直方图。具体地,对于一张输入实物图像,先取出红绿蓝三通道的灰阶,分别放在三个数组里面。实物图像的每个像素都有R、G、B三个灰阶,数组元素的个数为图片像素个数N=W*H,其中W为横向分辨率,H为纵向分辨率。随后,统计各个灰阶在实物图像中出现的次数。实物图像的灰阶由8bit存储单元存放,最小值为0,最大值为255,一共256个灰阶等级。分别统计三个通道各级灰阶在实物图像中出现的次数。最后,以各级灰阶为横坐标,以三通道的灰阶在实物图像中出现次数为纵坐标绘图,得到直方图。
实物图像的直方图并非一成不变的,直方图的背景颜色、各通道直方图的填充颜色以及交叠部分的颜色都具备多样性。此外,是否需要坐标轴也是需要考虑的问题。为了提升机器学习的效率和质量,本方案提出了适用于色偏图片机器训练的实物图像直方图预处理方法,具体为:
(1)采用黑色作为直方图的背景色
机器训练过程中,将输入实物图像的灰阶取出到训练模型中进行卷积神经算法等复杂的数学计算,由于黑色对应的灰阶为0,以黑色作为背景色将使得输入实物图像中大部分区域灰阶为0,数据0参与卷积伸进算法运算,将较大减轻训练模型的运算负荷。
(2)以红、绿、蓝作为三基色直方图的填充色
一张彩色实物图像的直方图包含三基色通道的直方图,三基色直方图的位置关系决定了图片的颜色。分别以红、绿、蓝作为R、G、B三基色通道的填充色,可以直观地表示颜色信息,便于训练模型快速提取实物图像的颜色特征。
(3)用白色作为三基色直方图交叠部分的填充色
一张彩色实物图像的直方图包含三基色通道直方图,三个直方图交叠部分的面积为直方图重叠面积。直方图重叠面积越大,说明三种色彩总体分布越平衡,则色彩越正常。反之,如果直方图重叠面积越小,则说明一个或两个通道偏离了另外的通道,则色偏越强。用白色标注直方图重叠部分有利于机器训练过程中提取直方图重叠面积,判断色偏的强弱。
(4)不保留直方图的横纵坐标轴
正常的直方图是有坐标的,横坐标表示灰阶,变化范围是[0,255],纵坐标表示某个灰阶在实物图像全部像素中出现的次数。为了将机器学习的干扰因素降至最低,去掉直方图的坐标轴。
在一实施例中,参照如图4和如图5所示,用直方图构建色偏图片训练集、验证集和测试集,在如图4中,从公开图像中获取全部图像或者部分图像构建正常图像集,并生成适于机器学习的正常直方图集;对正常图像集中的每一图像进行色偏处理,以生成色偏图像集,并生成适于机器学习的色偏直方图集;根据正常直方图集和色偏直方图集,构建色偏图像训练集、验证集和测试集。可以理解的是,现有的公开图像集包括Pascal VOC2012、imageNet数据库等。
在一实施例中,参照如图6所示,为本发明基于直方图的高精度色偏图像识别方法的训练过程中准确度和损失函数对比示意图。需要说明的是,本方案生成的直方图训练集、验证集和测试集,通过优化诸如Vgg16、Inception等现有的机器学习模型,对生成的图像集进行二分类训练,最终得到一个高精度的二分类器。其中的关键在于直方图集,包括直方图训练集、验证集和测试集的构建。参照如图5所示,先收集正常图像集,训练集可以是100000张,验证集达5000张、测试集10000张。将正常图像集进行人为的色偏处理,得到对应的色偏图片集。接着,生成正常图像集和色偏图像集对应的直方图,并作预处理,使其适合于机器学习。最后,进行机器训练生成二分类器。
采用神经网络模型对实物图像是否色偏图像进行识别,训练神经网络模型所用训练集采用正常图像集和在该正常图像集基础上生成的色偏图像集构建。色偏图像集采用在正常图像集基础上,由随机数选择颜色通道,然后对所选颜色通道进行随机偏移得到。随机数范围为1~6,其中1~3代表选取单一颜色通道,4~6代表选取两个颜色组合通道。
上述实施例中,对于基于直方图的高精度色偏图像识别方法,具体地,第一步:构建正常图像和色偏图像训练集、验证集和测试集。
(1)拷贝正常图像集
目前公开的图像集较多,本方案中,分别从imageNet数据库的训练集、验证集和测试集中取出部分图像,作为正常图像集。imageNet数据库的训练集包括1000种类,从每类取出十分之一构建训练集的正常图像集,存放在训练集的文件夹0中。例如,从imageNet数据库的验证集取出5000张作为测试集的正常图像集,存放在验证集的文件夹0中。从imageNet数据库的测试集中取出10000张作为测试集的正常图像集,存放在测试集的文件夹0中。
(2)生成色偏图像集
将文件夹0中的所有图像逐一取出,将一张正常无色偏的图像,经过下述①-③步骤进行处理,生成对应的色偏图像,并将处理所得图像存放到文件夹1,文件夹1将生成的色偏图像,与文件夹0对应,共同构成色偏图像训练集。取其中的部分图像作为验证集,可以从每类中取500张左右。
①设置起点和步长
对于任意一张正常的输入图像,设置灰阶改变起点为start=16,步长step=1。
②产生通道选择随机数和偏移随机数
产生通道选择随机整数n1,n1的范围为1-6,产生灰阶偏移随机整数n2、n3,其n2、n3的范围分别为0-200。其中,n1决定选取哪个通道进行色偏处理,在本方案中可以设置6种通道选取模式。
③根据通道选择随机数和偏移随机数产生色偏图像
将根据通道选择随机数确定进行色偏污染的通道,n1为1-6,分别对应的是R通道、G通道、B通道、RG组合通道、RB组合通道和GB组合通道。
根据偏移随机数确定灰阶改变量,具体公式如下:
其中,r、g、b分别代表原灰阶通道,r_、g_、b_分别代表处理后的灰阶通道。n1为1时,只改变R通道;n1为2时,只改变G通道;n1为3时,只改变B通道;n1为4时,改变R通道和G通道;n1为5时,改变R通道和B通道;n1为6时,改变G通道和B通道。灰阶改变量根据上述公式由随机数n2和n3决定。因此,通道的选择随机,改变量的值随机。
第二步:构建正常图像和色偏图像的直方图训练集、直方图验证集和直方图测试集
按照本方案中生成适合于机器学习直方图的方式,分别生成正常图像训练集、验证集、和测试集的直方图,分别生成色偏图像训练集、验证集、和测试集的直方图。单张图像的直方图生成流程包括取出三通道灰阶、统计各个灰阶出现的次数、绘图。本发明以python编程作为实施例:
(1)读入图像并取出三基色通道灰阶
将路径path的图像读入内存,命名为src;
分裂原图的三基色通道灰阶,分别存放在r、g、b;
将红色通道的二维数组拉成一维数组,命名为ar;
将绿色通道的二维数组拉成一维数组,命名为ag;
将蓝色通道的二维数组拉成一维数组,命名为ab。
(2)统计三基色各个灰阶出现的次数
设置r通道直方图数据初值为0;
设置g通道直方图数据初值为0;
设置b通道直方图数据初值为0;
设置三通道直方图交叠数据初值为0;
获得总像素个数;
通过for循环统计各级灰阶在图像中出现的次数。
(3)绘制直方图
绘制r通道直方图轮廓;
用红色填充r通道直方图;
绘制g通道直方图轮廓;
用绿色填充g通道直方图;
绘制b通道直方图轮廓;
用蓝色填充b通道直方图;
绘制三通道交叠部分直方图轮廓;
用白色填充三通道交叠部分直方图。
第三步:深度卷积神经网络模型训练
通过深度卷积神经网络模型对图像训练集和验证集进行训练,优化各层的参数,得到一个高精度的分类器,实现正常图像和色偏图像的准确区分。本发明基于开源的vgg16模型进行搭建,导入开源的xxx.h5权重文件进行迁移学习,添加Dropout层,设置学习率分段衰减,训练100个周期即可得到分类器。具体步骤如下:
(1)去掉Dropout层
Dropout层的作用是按照一定的比例丢弃掉部分参数,使得参数和样本匹配,防止过拟合现象。由于本次训练提供的图像数据量较大,与模型参数的复杂度对等,不需要丢弃部分参数。因此,本实施例的训练去掉Dropout层。
(2)设置分段学习率衰减
在原vgg16模型的基础上,设置了学习率分段衰减,根据各次机器学习实验,总结得到各个节点学习率的值。本次训练100个周期,每10个周期更新学习率,具体公式如下:
其中,LR代表学习率,epoch代表训练周期。
采用上述具体实施方式的流程,导入训练集和验证集,启动设置好的vgg16卷积神经网络模型,训练100个周期,得到分类器xxx.h5文件。采用相同的模型和参数,分别采用实物图集和直方图集进行训练。参照如图6所示,(a1)为基于实物图像集的损失函数变化曲线;(b1)为基于实物图像集的准确度变化曲线;(a2)为基于直方图集的损失函数变化曲线;(b2)为基于直方图集的准确度变化曲线。从图中可以看出,无论是损失函数变化曲线和准确度变化曲线,基于直方图集的训练效果均优于基于实物图像的训练效果。具体表现对比图6中的(a1)和a(2),直方图集训练损失函数可以达到更低,而且训练集与验证集上的表现更加具备一致性。对比图6中的(b1)和(b2),训练初期直方图集训练准确度变化曲线更陡,说明其收敛速度更快,而且训练集与验证集上的表现更加具备一致性。从(b1)可以看出,基于实物图像集的训练中训练集和验证集变化曲线差异性较大,使得训练效果不理想。也即本方案中,基于直方图集的训练效率更高。
以上的仅是本发明的实施例,方案中公知的具体结构及特性等常识在此未作过多描述,所属领域普通技术人员知晓申请日或者优先权日之前发明所属技术领域所有的普通技术知识,能够获知该领域中所有的现有技术,并且具有应用该日期之前常规实验手段的能力,所属领域普通技术人员可以在本申请给出的启示下,结合自身能力完善并实施本方案,一些典型的公知结构或者公知方法不应当成为所属领域普通技术人员实施本申请的障碍。应当指出,对于本领域的技术人员来说,在不脱离本发明结构的前提下,还可以作出若干变形和改进,这些也应该视为本发明的保护范围,这些都不会影响本发明实施的效果和专利的实用性。本申请要求的保护范围应当以其权利要求的内容为准,说明书中的具体实施方式等记载可以用于解释权利要求的内容。
Claims (4)
1.一种基于直方图的高精度色偏图像识别方法,其特征在于,包括:
获取任一实物图像,根据所述实物图像获取红色通道灰阶、绿色通道灰阶和蓝色通道灰阶,分别放在三个数组;分别统计所述红色通道灰阶、所述绿色通道灰阶和所述蓝色通道灰阶在所述实物图像出现的次数;以各级灰阶作为横坐标,三通道灰阶在所述实物图像出现的次数作为纵坐标绘制出所述实物图对应的直方图;
将生成的所述直方图输入二分类器进行分析;
根据所述二分类器的分析,判断实物图像是否具有色偏,当实物图像为色偏图像,则通过白平衡算法处理后输出,当实物图像为正常图像,则直接输出;
从公开图像中获取全部图像或者部分图像构建正常图像集,并生成适于机器学习的正常直方图集;
对所述正常图像集中的每一图像进行色偏处理,以生成色偏图像集,并生成适于机器学习的色偏直方图集;
根据所述正常直方图集和所述色偏直方图集,构建色偏图像训练集、验证集和测试集;
基于所述直方图的训练集、验证集作为实物图像,根据开源机器训练模型在深度学习计算机上进行训练;
根据所述深度学习计算机的训练反馈调节所述开源机器训练模型的参数,以产生二分类器。
2.根据权利要求1所述的基于直方图的高精度色偏图像识别方法,其特征在于,根据所述实物图像获取红色通道灰阶、绿色通道灰阶和蓝色通道灰阶,分别放在三个数组的步骤包括:
获取的所述实物图像中每一像素均具有红、绿、蓝三个灰阶,每一所述数组中元素的个数为所述实物图像中像素的个数。
3.根据权利要求2所述的基于直方图的高精度色偏图像识别方法,其特征在于,所述以各级灰阶作为横坐标,三通道灰阶在所述实物图像出现的次数作为纵坐标绘制出所述实物图对应的直方图的步骤包括:
以黑色作为所述直方图的背景色,以红色、绿色、蓝色作为三基色直方图的填充色,以白色作为三基色直方图交叠部分的填充色。
4.根据权利要求1所述的基于直方图的高精度色偏图像识别方法,其特征在于,根据所述正常直方图集和所述色偏直方图集,构建色偏图像训练集、验证集和测试集,用于训练神经网络模型。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110257073.9A CN112819017B (zh) | 2021-03-09 | 2021-03-09 | 基于直方图的高精度色偏图像识别方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110257073.9A CN112819017B (zh) | 2021-03-09 | 2021-03-09 | 基于直方图的高精度色偏图像识别方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112819017A CN112819017A (zh) | 2021-05-18 |
CN112819017B true CN112819017B (zh) | 2022-08-16 |
Family
ID=75863261
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110257073.9A Active CN112819017B (zh) | 2021-03-09 | 2021-03-09 | 基于直方图的高精度色偏图像识别方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112819017B (zh) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114390266B (zh) * | 2021-12-28 | 2024-05-21 | 杭州涂鸦信息技术有限公司 | 一种图像白平衡处理方法、设备及计算机可读存储介质 |
JP7440044B2 (ja) * | 2022-02-08 | 2024-02-28 | ユーシーシー上島珈琲株式会社 | コーヒー豆類の良品識別機能を備える良品検査システムおよび良品検査方法 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101288103A (zh) * | 2005-08-18 | 2008-10-15 | 高通股份有限公司 | 用于图像处理、用于色彩分类及用于皮肤色彩检测的系统、方法及设备 |
CN103514456A (zh) * | 2013-06-30 | 2014-01-15 | 安科智慧城市技术(中国)有限公司 | 基于压缩感知多核学习的图像分类方法及其装置 |
Family Cites Families (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
GB201119206D0 (en) * | 2011-11-07 | 2011-12-21 | Canon Kk | Method and device for providing compensation offsets for a set of reconstructed samples of an image |
CN104202596B (zh) * | 2014-09-17 | 2016-04-06 | 西安电子科技大学 | 一种应用于智能终端的图像色偏检测方法及系统 |
US20170213080A1 (en) * | 2015-11-19 | 2017-07-27 | Intelli-Vision | Methods and systems for automatically and accurately detecting human bodies in videos and/or images |
JP7200139B2 (ja) * | 2017-07-13 | 2023-01-06 | 株式会社 資生堂 | 仮想顔化粧の除去、高速顔検出およびランドマーク追跡 |
CN109241963B (zh) * | 2018-08-06 | 2021-02-02 | 浙江大学 | 基于Adaboost机器学习的胶囊胃镜图像中出血点智能识别方法 |
CN111860277B (zh) * | 2020-07-14 | 2024-03-19 | 南京航空航天大学 | 基于颜色直方图特征的民航飞机空速管套安全警示方法 |
CN112102192A (zh) * | 2020-09-15 | 2020-12-18 | 遵义师范学院 | 一种图像白平衡方法 |
-
2021
- 2021-03-09 CN CN202110257073.9A patent/CN112819017B/zh active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101288103A (zh) * | 2005-08-18 | 2008-10-15 | 高通股份有限公司 | 用于图像处理、用于色彩分类及用于皮肤色彩检测的系统、方法及设备 |
CN103514456A (zh) * | 2013-06-30 | 2014-01-15 | 安科智慧城市技术(中国)有限公司 | 基于压缩感知多核学习的图像分类方法及其装置 |
Also Published As
Publication number | Publication date |
---|---|
CN112819017A (zh) | 2021-05-18 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109614996B (zh) | 基于生成对抗网络的弱可见光与红外图像融合的识别方法 | |
JP5458905B2 (ja) | 画像におけるシャドーの検知装置および検知方法 | |
US20180241929A1 (en) | Exposure-Related Intensity Transformation | |
CN108717524B (zh) | 一种基于双摄手机和人工智能系统的手势识别系统 | |
US7528991B2 (en) | Method of generating a mask image of membership of single pixels to certain chromaticity classes and of adaptive improvement of a color image | |
CN106951869B (zh) | 一种活体验证方法及设备 | |
CN112819017B (zh) | 基于直方图的高精度色偏图像识别方法 | |
JP2004357277A (ja) | デジタル画像処理方法 | |
CN107172418A (zh) | 一种基于曝光情况分析的色阶映射图像质量评价方法 | |
JP2005310123A (ja) | 特定シーンの画像を選別する装置、プログラムおよびプログラムを記録した記録媒体 | |
CN110691226B (zh) | 图像处理方法、装置、终端及计算机可读存储介质 | |
CN101983507A (zh) | 自动红眼检测 | |
CN108710893A (zh) | 一种基于特征融合的数字图像相机源模型分类方法 | |
Li et al. | Identifying photorealistic computer graphics using second-order difference statistics | |
CN112561813A (zh) | 人脸图像增强方法、装置、电子设备及存储介质 | |
CN111291778B (zh) | 深度分类模型的训练方法、曝光异常检测方法以及装置 | |
CN110751225A (zh) | 图像分类方法、装置及存储介质 | |
CN109961015A (zh) | 图像识别方法、装置、设备以及存储介质 | |
Rana et al. | Learning-based adaptive tone mapping for keypoint detection | |
CN113609944A (zh) | 一种静默活体检测方法 | |
CN110619060B (zh) | 一种条烟图像数据库构建方法及条烟防伪查询方法 | |
CN114187380B (zh) | 基于视觉显著性和通道注意力机制的色彩传递方法 | |
CN115546141A (zh) | 一种基于多维度度量的小样本Mini LED缺陷检测方法及系统 | |
Yuan et al. | Color image quality assessment with multi deep convolutional networks | |
CN113065407B (zh) | 基于注意力机制和生成对抗网络的财务票据印章擦除方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
TR01 | Transfer of patent right |
Effective date of registration: 20240612 Address after: 230000 b-1018, Woye Garden commercial office building, 81 Ganquan Road, Shushan District, Hefei City, Anhui Province Patentee after: HEFEI WISDOM DRAGON MACHINERY DESIGN Co.,Ltd. Country or region after: China Address before: 563006 middle section of Ping'an Avenue, Xinpu New District, Zunyi City, Guizhou Province Patentee before: ZUNYI NORMAL College Country or region before: China |