CN109993806A - 一种颜色识别方法、装置及电子设备 - Google Patents

一种颜色识别方法、装置及电子设备 Download PDF

Info

Publication number
CN109993806A
CN109993806A CN201910288040.3A CN201910288040A CN109993806A CN 109993806 A CN109993806 A CN 109993806A CN 201910288040 A CN201910288040 A CN 201910288040A CN 109993806 A CN109993806 A CN 109993806A
Authority
CN
China
Prior art keywords
color
channel
group
feature
recognized
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201910288040.3A
Other languages
English (en)
Inventor
蓝明洪
何进
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhejiang Li Yuan Communication Technology Inc Co
Original Assignee
Zhejiang Li Yuan Communication Technology Inc Co
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhejiang Li Yuan Communication Technology Inc Co filed Critical Zhejiang Li Yuan Communication Technology Inc Co
Priority to CN201910288040.3A priority Critical patent/CN109993806A/zh
Publication of CN109993806A publication Critical patent/CN109993806A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING; COUNTING
    • G06KGRAPHICAL DATA READING; PRESENTATION OF DATA; RECORD CARRIERS; HANDLING RECORD CARRIERS
    • G06K9/00Methods or arrangements for recognising patterns
    • G06K9/62Methods or arrangements for pattern recognition using electronic means
    • G06K9/6267Classification techniques
    • G06K9/6268Classification techniques relating to the classification paradigm, e.g. parametric or non-parametric approaches
    • GPHYSICS
    • G06COMPUTING; CALCULATING; COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/90Determination of colour characteristics
    • GPHYSICS
    • G06COMPUTING; CALCULATING; COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/10Image acquisition modality
    • G06T2207/10024Color image
    • GPHYSICS
    • G06COMPUTING; CALCULATING; COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20081Training; Learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING; COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20084Artificial neural networks [ANN]
    • GPHYSICS
    • G06COMPUTING; CALCULATING; COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V2201/00Indexing scheme relating to image or video recognition or understanding
    • G06V2201/08Detecting or categorising vehicles

Abstract

本申请实施例提供一种颜色识别方法、装置及电子设备。该方法包括:获取待识别图像,所述待识别图像包括目标对象;利用颜色识别模型的颜色通道转换单元将所述待识别图像的颜色通道进行通道转换,获得多个颜色亚通道组;利用颜色识别模型的识别单元对所述颜色亚通道组进行颜色识别,获得所述目标对象的颜色。装置用于执行上述方法。本申请实施例通过对待识别图像的颜色通道进行通道转换,获得更多的颜色亚通道组,然后再利用识别单元对颜色亚通道组进行识别,最终获得目标对象的颜色,通过获取更多的颜色亚通道组,能够尽可能的挖掘颜色更丰富的特征,从而提取更有用的特征,较大程度的排除冗余信息的干扰,提高对目标对象的颜色进行识别的准确率。

Description

一种颜色识别方法、装置及电子设备
技术领域
本申请涉及图像处理技术领域,具体而言,涉及一种颜色识别方法、装置及电子设备。
背景技术
智能交通监控系统作为“城市大脑”不可或缺的部分,为创建智慧城市奠定了坚实的基础,其涉及的领域非常广泛。随着城市的发展和车辆数量的不断增长,在新形势下,智能交通车辆识别技术显得尤为重要。颜色作为车辆的重要外观特性,弥补了车牌识别、车型识别、车标识别的一些不足,丰富了车辆识别的特征信息,对打击车辆套牌、一车多牌、一牌多车等严重妨碍交通秩序的违法行为具有重要意义。
现有的车辆颜色识别方法,一般是先定位车身局部区域,选择车身上的一块或者多块作为参考识别区域进行识别,主要用到的识别方法有两类:一种是基于颜色空间量化范围,一种是基于特征分类器。主要存在的问题是,在定位局部区域时容易受车灯、栅格散热片、反光镜、车窗玻璃等的影响,无法精准分割且容易引入颜色干扰;基于特征分类器的方法对于特征的提取、模型的构建都有很大的依赖性;再加上车辆由于部分遮挡、图片模糊、视角变换、光照条件、天气等等一些干扰因素的影响,识别系统的准确率较低且泛化能力较差。
发明内容
有鉴于此,本申请实施例的目的在于提供一种颜色识别方法、装置及电子设备,以解决上述识别准确率比较低的技术问题。
第一方面,本申请实施例提供了一种颜色识别方法包括:获取待识别图像,所述待识别图像包括目标对象;利用颜色识别模型的颜色通道转换单元将所述待识别图像的颜色通道进行通道转换,获得多个颜色亚通道组;利用颜色识别模型的识别单元对所述颜色亚通道组进行颜色识别,获得所述目标对象的颜色。
本申请实施例通过对待识别图像的颜色通道进行通道转换,获得更多的颜色亚通道组,然后再利用识别单元对颜色亚通道组进行识别,最终获得目标对象的颜色,能够尽可能的挖掘颜色更丰富的特征,从而提取更有用的特征,较大程度的排除冗余信息的干扰,提高对目标对象的颜色进行识别的准确率。
进一步地,所述利用颜色识别模型的颜色通道转换单元将所述待识别图像的颜色通道进行通道转换,获得多个颜色亚通道组,包括:利用所述颜色通道转换单元中的颜色通道转换层对所述待识别图像的颜色通道进行通道转换,获得多个颜色亚通道;利用所述颜色通道转换单元中的通道分组层对所述多个颜色亚通道进行通道分组,获得多个颜色亚通道组。本申请实施例通过在对目标对象进行识别时,先对待识别图像中的颜色通道进行转换,获得更多的颜色亚通道,从而提取更丰富的底层特征,获取更多的有用特征,较大程度的排除冗余信息的干扰,提高颜色识别的准确率。
进一步地,所述利用颜色识别模型的识别单元对所述颜色亚通道组进行颜色识别,获得所述目标对象的颜色,包括:将所述多个颜色亚通道组分别输入到对应的第一卷积模块组中进行特征提取,获得每个颜色亚通道组对应的第一特征图;利用特征连接层将所有的颜色亚通道组对应的第一特征图进行特征组合,并利用第二卷积模块组对组合后的特征进行特征提取,获得第二特征图;对所述第二特征图进行低秩双线性汇合操作,获得第三特征图;利用分类模块对所述第三特征图进行分类计算,获得所述目标对象对应的颜色。本申请实施例通过先对颜色亚通道组进行特征提取,再对组合后的特征进行进一步的特征计算,可以提取到深层次的特征,对于分类任务具有更强更抽象的表达能力,从而提高了颜色识别的准确率。
进一步地,所述颜色通道转换单元包括一个颜色通道转换层和一个通道分组层,所述颜色通道转换层的卷积核大小为1×1,卷积核个数为预设个数。本申请实施例通过颜色通道转换单元获取了更丰富的底层颜色特征,有效的提高了颜色识别的准确率。
进一步地,所述识别单元包括与颜色亚通道组数量相当的第一卷积模块组,以及特征连接层、第二卷积模块组、低秩双线性汇合模块和分类模块;所述第一卷积模块组包括至少一个第一卷积模块,所述第二卷积模块组包括至少一个第二卷积模块。
进一步地,所述第一卷积模块包括两个卷积层、两个批归一化层、两个ReLU激活层和一个池化层;所述第二卷积模块包括一个卷积层、一个批归一化层、一个ReLU激活层和一个池化层。
进一步地,所述识别单元还包括深度卷积网络参数共享,所述深度卷积网络参数共享设置于第一卷积模块组之间。通过颜色亚通道组之间的参数共享,建立了颜色亚通道组之间的信息互通。
进一步地,在利用颜色识别模型对所述待识别图像进行识别之前,所述方法,还包括:获取训练图像数据集以及对应的标签;利用所述训练图像数据集和对应的标签对深度卷积神经网络进行训练,获得所述颜色识别模型。本申请实施例通过利用丰富的训练图像数据集对深度卷积神经网络进行训练,使得训练获得的颜色识别模型有较高的识别精度和泛化能力。
进一步地,所述获取训练图像数据集,包括:获取原始训练图像数据集,对原始训练图像数据集进行扩充,获得所述训练图像数据集;其中,数据集扩充方法包括:运动模糊、高斯模糊、图像旋转中的任意一种或其组合。通过数据集扩充,可以进一步的提高模型的泛化能力,增强模型的鲁棒性。
第二方面,本申请实施例提供了一种颜色识别装置,包括:图像获取模块,用于获取待识别图像,所述待识别图像包括目标对象;通道转换模块,用于利用颜色识别模型的颜色通道转换单元将所述待识别图像的颜色通道进行通道转换,获得多个颜色亚通道组;图像识别模块,用于利用颜色识别模型的识别单元对所述颜色亚通道组进行颜色识别,获得所述目标对象的颜色。
进一步地,所述通道转换模块,具体用于:利用所述颜色通道转换单元中的颜色通道转换层对所述待识别图像的颜色通道进行通道转换,获得多个颜色亚通道;利用所述颜色通道转换单元中的通道分组层对所述多个颜色亚通道进行通道分组,获得多个颜色亚通道组。
进一步地,所述图像识别模块,具体用于:将所述多个颜色亚通道组分别输入到对应的第一卷积模块组中进行特征提取,获得每个颜色亚通道组对应的第一特征图;将所有的颜色亚通道组对应的第一特征图进行特征组合,并利用第二卷积模块组对组合后的特征进行特征提取,获得第二特征图;对所述第二特征图进行低秩双线性汇合,获得第三特征图;利用分类模块对所述第三特征图进行分类计算,获得所述目标对象对应的颜色。
进一步地,所述颜色通道转换单元包括一个颜色通道转换层和一个通道分组层,所述第一卷积层的卷积核大小为1×1,卷积核个数为预设个数。
进一步地,所述识别单元包括与颜色亚通道组数量相当的第一卷积模块组,以及特征连接层、第二卷积模块组、低秩双线性汇合模块和分类模块;所述第一卷积模块组包括至少一个第一卷积模块,所述第二卷积模块组包括至少一个第二卷积模块。
进一步地,所述第一卷积模块包括两个卷积层、两个批归一化层、两个ReLU激活层和一个池化层;所述第二卷积模块包括一个卷积层、一个批归一化层、一个ReLU激活层和一个池化层。
进一步地,所述识别单元还包括深度卷积神经网络的参数共享,所述深度卷积神经网络的参数共享设置于第一卷积模块组之间。
第三方面,本申请实施例提供一种电子设备,包括:处理器、存储器和总线,其中,
所述处理器和所述存储器通过所述总线完成相互间的通信;
所述存储器存储有可被所述处理器执行的程序指令,所述处理器调用所述程序指令能够执行第一方面的方法步骤。
本申请的其他特征和优点将在随后的说明书阐述,并且,部分地从说明书中变得显而易见,或者通过实施本申请实施例了解。本申请的目的和其他优点可通过在所写的说明书、权利要求书、以及附图中所特别指出的结构来实现和获得。
附图说明
为了更清楚地说明本申请实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本申请的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
图1为本申请实施例提供的颜色识别模型训练方法流程示意图;
图2为本申请实施例提供的颜色识别模型结构示意图;
图3为本申请实施例提供的第一卷积模块内部结构示意图;
图4为本申请实施例提供的第二卷积模块内部结构示意图;
图5为本申请实施例提供的一种颜色识别方法流程示意图;
图6为本申请实施例提供的一种颜色识别装置结构示意图;
图7为本申请实施例提供的电子设备实体结构示意图。
具体实施方式
下面将结合本申请实施例中附图,对本申请实施例中的技术方案进行描述。
应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释。同时,在本申请的描述中,术语“第一”、“第二”等仅用于区分描述,而不能理解为指示或暗示相对重要性。
本申请实施例以识别车辆的颜色为例,主要分为两大部分:颜色识别模型的网络训练和待识别图像的颜色识别。下面将针对每一部分进行描述。应当说明的是,本申请实施例提供的颜色识别方法除了可以识别车辆颜色外,还可以用于对其他对象的识别,本申请实施例对此不做具体限定。
图1为本申请实施例提供的颜色识别模型训练方法流程示意图,如图1所示,该方法包括:
步骤101:获取训练图像数据集及对应的标签。
在具体的实施过程中,可以从视频监控平台的高清摄像机获取目标车辆图片,将获取到的目标车辆图片作为训练图像,其中,获取的目标车辆图片中可以包括晴天、雨雪天、雾天等各种天气下的车辆图片,同时也可以包含正面、侧面、背面等各种抓拍角度下的车辆图片,拍摄场景、环境、时间、角度都可以不同,得到的图像数据集可以很好的模拟实际场景。然后,按照以下常见颜色:黑色(black)、白色(white)、红色(red)、蓝色(blue)、绿色(green)、灰色(grey)、黄色(yellow)、金色(golden)、粉色(pink)、紫色(purple)、橘色(orange)进行分类与标注,获得训练图像对应的标签。应理解,本申请实施例在对训练图像进行标注时,也可以采用其他颜色分类体系对图像进行标注。
应当说明的是,获取目标车辆图片的来源可以有多种,例如,还可以通过网络搜索目标车辆图片,或者通过摄像机人工拍摄目标车辆图片等。
还应当说明的是,训练图像可以是由原始训练图像经过样本扩充后获得的。因为,在通过监控摄像机或其他方式采集到的原始训练图像,其数量可能不够多,或者样本的多样性不够,再或者有些颜色的车辆对应的图片较少,此时,为了能够获得更多形态、每种颜色对应的车辆图片数量均衡的样本集,可以对采集到的原始训练图像进行样本扩充。其中,样本扩充的方法包括运动模糊、高斯模糊、图像旋转中的任意一种或其组合。
步骤102:利用所述训练图像数据集和对应的标签对深度卷积神经网络进行训练,获得所述颜色识别模型。
在具体的实施过程中,首先对训练图像进行预处理,包括将输入图像缩放到同一尺寸,预处理还包括零均值化、随机裁剪等;训练开始前的每一层参数选用Xavier初始化或者MSRA初始化,初始学习率设置为0.01,使用随机梯度下降(SGD)方式进行训练,并以线性衰减的学习策略来更新学习率,即网络迭代次数每到达一定数值,例如50轮(epoch)时进行一次学习率的降低,损失函数可以选用Softmax Loss、Hinge Loss;开始训练深度卷积神经网络,得到模型中每一层的参数权值,并采用经典的反向传递算法来进行参数的更新,当训练次数达到预设次数或者损失函数的值达到预设要求后,可以停止训练,获得颜色识别模型。
图2为本申请实施例提供的基于深度卷积神经网络的颜色识别模型结构示意图,如图2所示。颜色识别模型包括颜色通道转换单元201和识别单元202,颜色通道转换单元201包括一个颜色通道转换层和通道分组层,其中,颜色通道转换层为一个卷积层,其卷积核大小为1×1,卷积核个数为NC,NC为预设个数。并且卷积核个数可以根据实际处理任务进行灵活选取,可以选择使用12个卷积核的卷积层。例如:输入到颜色通道转换层的三通道彩色图像(包括训练图像和待识别图像)的尺寸为:W×H×C,W为图像的宽,H为图像的高,C为图像的颜色通道数,经过颜色通道转换层之后的输出为:W×H×NC(NC=12),通过颜色通道转换层,将原始彩色图片颜色通道转换到更多的颜色亚通道,获取更多的底层颜色特征。
经过颜色通道转换层对输入的图像进行颜色通道转换后,获得了多个颜色亚通道,通过通道分组层对多个颜色亚通道进行重新划分与组合,获得多个颜色亚通道组。例如,颜色通道转换层输出图像尺寸为W×H×NC(NC=12),将颜色亚通道重新划分与组合后为m组颜色亚通道组,则每组颜色亚通道组均为W×H×(NC/m),在图2的网络结构中,经过颜色通道转换层之后的颜色亚通道数为12,划分4组,则可以得到4组颜色亚通道组S1、S2、S3和S4,每组颜色亚通道组的颜色通道数为3。
在获得多个颜色亚通道组之后,将颜色亚通道组输入识别单元202中,示例性的,识别单元202包括第一卷积模块组、特征连接层、第二卷积模块组、低秩双线性汇合模块和分类模块;第一卷积模块组的数量与颜色亚通道组的数量相同。第一卷积模块组包括至少一个第一卷积模块,第二卷积模块组包括至少一个第二卷积模块。其中,第一卷积模块包括两个卷积层、两个批归一化层、两个ReLU激活层和一个池化层,第二卷积模块包括一个卷积层、一个批归一化层、一个ReLU激活层和一个池化层。
每个颜色亚通道组输入到对应的第一卷积模块组中,利用第一卷积模块组分别对对应的颜色亚通道组进行特征提取。图3为本申请实施例提供的第一卷积模块内部结构示意图,如图3所示。第一卷积模块包括两个卷积层,其中,第一个卷积层的卷积核大小为3×3,第二个卷积层的卷积核大小为1×1。卷积核个数的选取遵循以下原则:卷积核个数太小,会造成提取的特征信息过少,导致网络模型的准确率不够,卷积核个数太大,会造成提取的特征包含过多冗余信息,且增加了网络参数和运算量,造成不必要的开销,所以要根据实际任务和平台进行选取,并经过大量实验与验证取最优组合。
在两个卷积层之后分别连接有一个批归一化层(BN,Batch Normalization),BN层有利于模型正则化的同时,加速网络训练,减少过拟合的发生。
在BN层之后接ReLU激活层,激活函数可以有多种选择,如Sigmoid,Leaky ReLU等,本申请实施例采用ReLU激活函数。
在两层卷积之后接池化(Pooling)层,采用最大值池化(max pooling),步长为2,实现该层输入特征尺寸的减小。网络由若干个这种同样结构的第一卷积模块重复组合在一起实现。网络使用这种结构,针对不同的数据集或者任务,可以叠加不同个数的类似第一卷积模块来实现。每组颜色亚通道组经过这样若干个第一卷积模块提取特征,具体的层数设置可根据实际任务进行选取,本申请实施例每组颜色亚通道上选取的第一卷积模块的数量为3个,同时通过网络参数的设置,进行颜色亚通道的参数共享(Shared Weights),这样做一方面可以减少网络参数,另一方面可以实现各个颜色亚通道的信息互通;从而获取更多有用的第一特征图,其中,每一颜色亚通道组对应一个第一特征图。
在获得每一颜色亚通道组分别对应的第一特征图之后,采用特征连接层进行特征组合,获得第二特征图。其中,特征组合的方式可以采用concat拼接方法。
在特征连接层之后连接有第二卷积模块组,其中,第二卷积模块组包括至少一个第二卷积模块。图4为本申请实施例提供的第二卷积模块内部结构示意图,如图4所示,每一第二卷积模块包括一个卷积层、一个批归一化层、一个ReLU激活层和一个池化层。第二卷积模块可以对第二特征图进行进一步的特征计算与提取,获得更深层次的特征。
由于输入的图片是车辆的整个车身区域,未标注关键位置信息,采用颜色亚通道进行特征提取,再进行特征组合的方法,可以有效的获取目标车辆中所关注的颜色子区域,实现更精准的定位并获得更深层次的特征。
在第二卷积模块之后连接有低秩双线性汇合模块,为了减少计算开支,采用的是两个相同的网络结构,也就是本申请只需要训练一个卷积神经网络,然后做相同位置的向量外积。由于外积导致特征的维度增大为原来的平方,所以可以通过低秩双线性汇合模块中的卷积核为1×1的卷积层进行降维。通过卷积层降维后得到的特征为:MBiPooling×MBiPooling×CBiPooling,输入低秩双线性汇合模块,经双线性池化(bilinear pooling)操作后得到的输出特征为:1×1×C2 BiPooling,其中MBiPooling为特征尺寸,CBiPooling为滤波器的通道个数。再采用平方根变换(sgnsqrt)和L2规范化实现归一化处理,获得第三特征图。这种采用双线性汇合计算的方法,可以充分考虑特征像素的相互作用关系,从而进一步提高模型的准确率。
在低秩双线性汇合模块之后连接有分类模块,其中,分类模块包括一层卷积层和分类层,用卷积层代替传统的全连接层,与分类层相结合对第三特征图进行分类,从而可以获得对应的识别结果。其中,分类层可以选用softmax分类算法,也可以选用支持向量机等,本申请对此不做具体限定。
例如:输入图像的大小:224×224×3,通过颜色通道转换模块的卷积层,卷积层的大小为1×1,卷积核个数为12,得到通道转换结果,且该通道转换结果的输出大小为:224×224×12,再通过颜色通道转换模块的通道分组层得到4组颜色亚通道组,每组输出大小都为224×224×3;接下来采用第一卷积模块组对颜色亚通道组进行特征计算,每个颜色亚通道组所对应的分支上先采用卷积大小为3×3,卷积核个数为32的卷积层,并经BN层和ReLU激活层后得到的特征图的大小为:224×224×32,再采用卷积核大小为1×1,卷积核个数为16的卷积层,并经BN层和ReLU激活层后得到的特征图的大小为:224×224×16,两层卷积之后再经过一个pooling层,大小为3×3,步长stride=2,将输入特征尺寸变为原来的1/2,得到的特征的大小为:112×112×16。每个分支叠加3个这样的3×3卷积层(包括BN层和ReLU激活层)、1×1卷积层(包括BN层和ReLU激活层)和pooling层组成的第一卷积模块进行处理后,每个分支上得到16个大小为原图1/8的第一特征图,且第一特征图的大小为:28×28×16。
通过特征连接层将4个分支的特征进行组合,得到组合后的特征,该组合后的特征图的大小为:28×28×64。
特征连接层后接第二卷积模块组进行特征提取,其中,第二卷积模块组包括至少一个第二卷积模块,每一个第二卷积模块包含一个卷积核个数为64,卷积核大小为3×3的卷积层和一个大小为3×3步长为2的pooling层,叠加2个上述第二卷积模块。可以理解的是,第二卷积模块还可以包括一个卷积核个数为96,卷积核大小为3×3的卷积层、一个卷积核个数为64,卷积核大小为1×1的卷积层和一个大小为3×3步长为2的pooling层,叠加2个上述第二卷积模块,得到大小为原图1/32的第二特征图,且第二特征图的大小为:7×7×64。
然后进行低秩双线性汇合操作,先采用1×1的卷积层进行降维,得到的特征图的大小为:7×7×32,再进行双线性池化操作,包括sgnsqrt层和L2层实现归一化处理,得到大小为1×1特征维数为32×32=1024的第三特征图,且第三特征图的大小为:1×1×1024。
将获得的第三特征图输入到分类模块中,先经过一个卷积核个数等于分类个数的1×1的卷积层,得到特征,其特征图的大小为:1×1×11,其中的11就是我们的颜色分类数,最后送入分类层得到识别结果。
应理解,根据需求以及应用场景的变化,图2示出的识别单元的结构可以有其他变形,例如,可以采用Resnet残差块和Inception模块替代网络中的卷积模块。并且,卷积层的大小和核个数可以根据实际情况设定,本申请实施例对此不作具体限定。
本申请实施例通过以整个车身图片作为输入,无需定位车身参考颜色区域,能够减少计算量且避免引入颜色干扰;通过获取实际复杂场景中的大量样本,并利用样本驱动的深度卷积神经网络的训练和自学习机制,所得到的模型具有较高准确率和鲁棒性。
图5为本申请实施例提供的一种颜色识别方法流程示意图,如图5所示,该方法包括:
步骤501:获取待识别图像,所述待识别图像包括目标对象。
在具体的实施过程中,识别装置获取待识别图像,其中,待识别图像中包括目标对象,以识别车辆颜色为例,从视频监控平台获取待识别图像,待识别图像中包括有车辆这一目标对象。
步骤502:利用颜色识别模型的颜色通道转换单元将所述待识别图像的颜色通道进行通道转换,获得多个颜色亚通道组。
在具体的实施过程中,将待识别图像输入到颜色识别模型中,颜色识别模型中的颜色通道转换单元将待识别图像的颜色通道进行通道转换,获得多个颜色亚通道组。可以理解的是,待识别图像根据不同的图像颜色模式有不同的数量的颜色通道,本申请实施例以RGB图像为例。
颜色通道转换单元首先将待识别图像的三个颜色通道进行通道转换,获得多个颜色亚通道,颜色亚通道的数量与颜色通道转换单元中卷积核的个数有关,即颜色亚通道的数量等于颜色通道转换单元中卷积核的个数。然后对多个颜色亚通道进行分组,获得多个颜色亚通道组。例如共有12个颜色亚通道,其通道编号分别为1-12,若要分为4个颜色亚通道组,则分组后将编号1-3的颜色亚通道为一组、编号4-6的颜色亚通道为一组、编号7-9的颜色亚通道为一组、编号10-12的颜色亚通道为一组。应当说明的是,还可以随机将三个颜色亚通道分为一组,本申请实施例对此不作具体限定。
步骤503:利用颜色识别模型的识别单元对所述颜色亚通道组进行颜色识别,获得所述目标对象的颜色。
在具体的实施过程中,在获得多个颜色亚通道组之后,利用颜色识别模型的识别单元对多个颜色亚通道组进行颜色识别,获得目标对象的颜色。
本申请实施例针对采集到的包含目标对象的待识别图像,采用深度卷积神经网络作为基础网络,先提升颜色通道获取更多的颜色亚通道,再进行深层次的特征提取与计算,能够挖掘颜色更丰富的特征,从而提取更有用的特征,较大程度的排除冗余信息的干扰,实现底层特征与深层特征,局部信息与全局信息的融合,获得的颜色识别模型具有较高的准确率和良好的泛化能力。
图6为本申请实施例提供的一种颜色识别装置结构示意图,如图6所示,该装置包括:图像获取模块601、通道转换模块602和图像识别模块603,其中:
图像获取模块601用于获取待识别图像,所述待识别图像包括目标对象;通道转换模块602用于利用颜色识别模型的颜色通道转换单元将所述待识别图像的颜色通道进行通道转换,获得多个颜色亚通道组;图像识别模块603用于利用颜色识别模型的识别单元对所述颜色亚通道组进行颜色识别,获得所述目标对象的颜色。
在上述实施例的基础上,所述通道转换模块,具体用于:利用所述颜色通道转换单元中的颜色通道转换层对所述待识别图像的颜色通道进行通道转换,获得多个颜色亚通道;利用所述颜色通道转换单元中的通道分组层对所述多个颜色亚通道进行通道分组,获得多个颜色亚通道组。
在上述实施例的基础上,所述图像识别模块,具体用于:将所述多个颜色亚通道组分别输入到对应的第一卷积模块组中进行特征提取,获得每个颜色亚通道组对应的第一特征图;将所有的颜色亚通道组对应的第一特征图进行特征组合,并利用第二卷积模块组对组合后的特征进行特征提取,获得第二特征图;对所述第二特征图进行低秩双线性汇合,获得第三特征图;利用分类模块对所述第三特征图进行分类计算,获得所述目标对象对应的颜色。
在上述实施例的基础上,所述颜色通道转换单元包括一个颜色通道转换层和一个通道分组层,所述颜色通道转换层的卷积核大小为1×1,卷积核个数为预设个数。
在上述实施例的基础上,所述识别单元包括与颜色亚通道组数量相当的第一卷积模块组,以及特征连接层、第二卷积模块组、低秩双线性汇合模块和分类模块;所述第一卷积模块组包括至少一个第一卷积模块,所述第二卷积模块组包括至少一个第二卷积模块。
在上述实施例的基础上,所述第一卷积模块包括两个卷积层、两个批归一化层、两个ReLU激活层和一个池化层;所述第二卷积模块包括一个卷积层、一个批归一化层、一个ReLU激活层和一个池化层。
在上述实施例的基础上,所述识别单元还包括深度卷积神经网络的参数共享,所述深度卷积神经网络的参数共享设置于第一卷积模块组之间。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的装置的具体工作过程,可以参考前述方法中的对应过程,在此不再过多赘述。
综上所述,本申请实施例通过对待识别图像的颜色通道进行通道转换,获得更多的颜色亚通道组,然后再利用识别单元对颜色亚通道组进行识别,最终获得目标对象的颜色,能够挖掘颜色更丰富的特征,从而提取更有用的特征,较大程度的排除冗余信息的干扰,实现底层特征与深层特征,局部信息与全局信息的融合,从而提高对目标对象的颜色进行识别的准确率。
图7为本申请实施例提供的电子设备实体结构示意图,如图7所示,所述电子设备,包括:处理器(processor)701、存储器(memory)702和总线703;其中,
所述处理器701和存储器702通过所述总线703完成相互间的通信;
所述处理器701用于调用所述存储器702中的程序指令,以执行上述各实施例所提供的方法,例如包括:获取待识别图像,所述待识别图像包括目标对象;利用颜色识别模型的颜色通道转换单元将所述待识别图像的颜色通道进行通道转换,获得多个颜色亚通道组;利用颜色识别模型的识别单元对所述颜色亚通道组进行颜色识别,获得所述目标对象的颜色。
本实施例公开一种计算机程序产品,所述计算机程序产品包括存储在非暂态计算机可读存储介质上的计算机程序,所述计算机程序包括程序指令,当所述程序指令被计算机执行时,计算机能够执行上述各实施例所提供的方法,例如包括:获取待识别图像,所述待识别图像包括目标对象;利用颜色识别模型的颜色通道转换单元将所述待识别图像的颜色通道进行通道转换,获得多个颜色亚通道组;利用颜色识别模型的识别单元对所述颜色亚通道组进行颜色识别,获得所述目标对象的颜色。
在本申请所提供的几个实施例中,应该理解到,所揭露的装置和方法,也可以通过其它的方式实现。以上所描述的装置实施例仅仅是示意性的,例如,附图中的流程图和框图显示了根据本申请的多个实施例的装置、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段或代码的一部分,所述模块、程序段或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现方式中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个连续的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或动作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
另外,在本申请各个实施例中的各功能模块可以集成在一起形成一个独立的部分,也可以是各个模块单独存在,也可以两个或两个以上模块集成形成一个独立的部分。
所述功能如果以软件功能模块的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述仅为本申请的优选实施例而已,并不用于限制本申请,对于本领域的技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本申请的保护范围之内。应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释。
以上所述,仅为本申请的具体实施方式,但本申请的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本申请的保护范围之内。
需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。

Claims (9)

1.一种颜色识别方法,其特征在于,包括:
获取待识别图像,所述待识别图像包括目标对象;
利用颜色识别模型的颜色通道转换单元将所述待识别图像的颜色通道进行通道转换,获得多个颜色亚通道组;
利用颜色识别模型的识别单元对所述颜色亚通道组进行颜色识别,获得所述目标对象的颜色。
2.根据权利要求1所述的方法,其特征在于,所述利用颜色识别模型的颜色通道转换单元将所述待识别图像的颜色通道进行通道转换,获得多个颜色亚通道组,包括:
利用所述颜色通道转换单元中的颜色通道转换层对所述待识别图像的颜色通道进行通道转换,获得多个颜色亚通道;
利用所述颜色通道转换单元中的通道分组层对所述多个颜色亚通道进行通道分组,获得多个颜色亚通道组。
3.根据权利要求1所述的方法,其特征在于,所述利用颜色识别模型的识别单元对所述颜色亚通道组进行颜色识别,获得所述目标对象的颜色,包括:
将所述多个颜色亚通道组分别输入到对应的第一卷积模块组中进行特征提取,获得每个颜色亚通道组对应的第一特征图;
将所有的颜色亚通道组对应的第一特征图进行特征组合,并利用第二卷积模块组对组合后的特征进行特征提取,获得第二特征图;
对所述第二特征图进行低秩双线性汇合,获得第三特征图;
利用分类模块对所述第三特征图进行分类计算,获得所述目标对象对应的颜色。
4.根据权利要求1所述的方法,其特征在于,所述颜色通道转换单元包括一个颜色通道转换层和一个通道分组层,所述颜色通道转换层的卷积核大小为1×1,卷积核个数为预设个数。
5.根据权利要求1所述的方法,其特征在于,所述识别单元包括与颜色亚通道组数量相当的第一卷积模块组,以及特征连接层、第二卷积模块组、低秩双线性汇合模块和分类模块;
所述第一卷积模块组包括至少一个第一卷积模块,所述第二卷积模块组包括至少一个第二卷积模块。
6.根据权利要求5所述的方法,其特征在于,所述第一卷积模块包括两个卷积层、两个批归一化层、两个ReLU激活层和一个池化层;
所述第二卷积模块包括一个卷积层、一个批归一化层、一个ReLU激活层和一个池化层。
7.根据权利要求5所述的方法,其特征在于,所述识别单元还包括深度卷积神经网络参数共享,所述深度卷积神经网络参数共享设置于第一卷积模块组之间。
8.一种颜色识别装置,其特征在于,包括:
图像获取模块,用于获取待识别图像,所述待识别图像包括目标对象;
通道转换模块,用于利用颜色识别模型的颜色通道转换单元将所述待识别图像的颜色通道进行通道转换,获得多个颜色亚通道组;
图像识别模块,用于利用颜色识别模型的识别单元对所述颜色亚通道组进行颜色识别,获得所述目标对象的颜色。
9.一种电子设备,其特征在于,包括:处理器、存储器和总线,其中,
所述处理器和所述存储器通过所述总线完成相互间的通信;
所述存储器存储有可被所述处理器执行的程序指令,所述处理器调用所述程序指令能够执行如权利要求1-7任一项所述的方法。
CN201910288040.3A 2019-04-11 2019-04-11 一种颜色识别方法、装置及电子设备 Pending CN109993806A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910288040.3A CN109993806A (zh) 2019-04-11 2019-04-11 一种颜色识别方法、装置及电子设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910288040.3A CN109993806A (zh) 2019-04-11 2019-04-11 一种颜色识别方法、装置及电子设备

Publications (1)

Publication Number Publication Date
CN109993806A true CN109993806A (zh) 2019-07-09

Family

ID=67133195

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910288040.3A Pending CN109993806A (zh) 2019-04-11 2019-04-11 一种颜色识别方法、装置及电子设备

Country Status (1)

Country Link
CN (1) CN109993806A (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110751053A (zh) * 2019-09-26 2020-02-04 高新兴科技集团股份有限公司 一种车辆颜色识别方法、装置、设备及存储介质
CN111054658A (zh) * 2019-11-15 2020-04-24 西安和光明宸科技有限公司 一种色彩分拣系统及分拣方法
CN111970790A (zh) * 2020-08-25 2020-11-20 豪尔赛科技集团股份有限公司 一种具有天气交互功能的景观照明系统
CN112507801A (zh) * 2020-11-14 2021-03-16 武汉中海庭数据技术有限公司 车道路面数字颜色识别方法、限速信息识别方法及系统

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107067011A (zh) * 2017-03-20 2017-08-18 北京邮电大学 一种基于深度学习的车辆颜色识别方法与装置

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107067011A (zh) * 2017-03-20 2017-08-18 北京邮电大学 一种基于深度学习的车辆颜色识别方法与装置

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
REZA FUAD RACHMADI等: "Vehicle Color Recognition using Convolutional Neural Network", 《ARXIV:COMPUTER VISION AND PATTERN RECOGNITION》 *
SHU KONG等: "Low-rank Bilinear Pooling for Fine-Grained Classification", 《CVF CONFERENCE ON COMPUTER VISION AND PATTERN RECOGNITION (CVPR)》 *
杨梓豪: "基于区域卷积神经网络的物体识别算法研究", 《中国优秀硕士学位论文全文数据库(电子期刊)信息科技辑》 *
蒋帅: "I138-175", 《中国优秀硕士学位论文全文数据库(电子期刊)信息科技辑》 *

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110751053A (zh) * 2019-09-26 2020-02-04 高新兴科技集团股份有限公司 一种车辆颜色识别方法、装置、设备及存储介质
CN110751053B (zh) * 2019-09-26 2022-02-22 高新兴科技集团股份有限公司 一种车辆颜色识别方法、装置、设备及存储介质
CN111054658A (zh) * 2019-11-15 2020-04-24 西安和光明宸科技有限公司 一种色彩分拣系统及分拣方法
CN111970790A (zh) * 2020-08-25 2020-11-20 豪尔赛科技集团股份有限公司 一种具有天气交互功能的景观照明系统
CN111970790B (zh) * 2020-08-25 2022-08-16 豪尔赛科技集团股份有限公司 一种具有天气交互功能的景观照明系统
CN112507801A (zh) * 2020-11-14 2021-03-16 武汉中海庭数据技术有限公司 车道路面数字颜色识别方法、限速信息识别方法及系统

Similar Documents

Publication Publication Date Title
CN106599869B (zh) 一种基于多任务卷积神经网络的车辆属性识别方法
CN109993806A (zh) 一种颜色识别方法、装置及电子设备
CN108596277B (zh) 一种车辆身份识别方法、装置和存储介质
CN109584248A (zh) 基于特征融合和稠密连接网络的红外面目标实例分割方法
CN108875600A (zh) 一种基于yolo的车辆信息检测和跟踪方法、装置及计算机存储介质
CN109816725A (zh) 一种基于深度学习的单目相机物体位姿估计方法及装置
CN108921822A (zh) 基于卷积神经网络的图像目标计数方法
CN108717524B (zh) 一种基于双摄手机和人工智能系统的手势识别系统
CN108229519A (zh) 图像分类的方法、装置及系统
CN106022363B (zh) 一种适用于自然场景下的中文文字识别方法
CN109255772A (zh) 基于风格迁移的车牌图像生成方法、装置、设备及介质
CN109543632A (zh) 一种基于浅层特征融合引导的深层网络行人检测方法
CN101694691A (zh) 一种人脸图像合成方法及装置
CN108154160A (zh) 车牌颜色识别方法及系统
CN110379020A (zh) 一种基于生成对抗网络的激光点云上色方法和装置
CN107862698A (zh) 基于k均值聚类的光场前景分割方法及装置
CN108416270A (zh) 一种基于多属性联合特征的交通标志识别方法
CN106295645B (zh) 一种车牌字符识别方法和装置
CN110348463A (zh) 用于识别车辆的方法和装置
CN110781882A (zh) 一种基于yolo模型的车牌定位和识别方法
CN107563290A (zh) 一种基于图像的行人检测方法及装置
CN109492601A (zh) 人脸比对方法及装置、计算机可读介质和电子设备
CN109886147A (zh) 一种基于单网络多任务学习的车辆多属性检测方法
CN109657715A (zh) 一种语义分割方法、装置、设备及介质
CN109522883A (zh) 一种人脸检测方法、系统、装置及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20190709