CN115578714A - 一种基于浅层特征信息增强的车辆颜色识别方法和系统 - Google Patents

一种基于浅层特征信息增强的车辆颜色识别方法和系统 Download PDF

Info

Publication number
CN115578714A
CN115578714A CN202211183158.8A CN202211183158A CN115578714A CN 115578714 A CN115578714 A CN 115578714A CN 202211183158 A CN202211183158 A CN 202211183158A CN 115578714 A CN115578714 A CN 115578714A
Authority
CN
China
Prior art keywords
shallow
features
block
information enhancement
feature
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202211183158.8A
Other languages
English (en)
Inventor
陈德意
吴俊毅
吴婷婷
黄裕锟
高志鹏
赵建强
杜新胜
金辉
韩名羲
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Xiamen Meiya Pico Information Co Ltd
Original Assignee
Xiamen Meiya Pico Information Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Xiamen Meiya Pico Information Co Ltd filed Critical Xiamen Meiya Pico Information Co Ltd
Priority to CN202211183158.8A priority Critical patent/CN115578714A/zh
Publication of CN115578714A publication Critical patent/CN115578714A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/50Context or environment of the image
    • G06V20/56Context or environment of the image exterior to a vehicle by using sensors mounted on the vehicle
    • G06V20/58Recognition of moving objects or obstacles, e.g. vehicles or pedestrians; Recognition of traffic objects, e.g. traffic signs, traffic lights or roads
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/084Backpropagation, e.g. using gradient descent
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/56Extraction of image or video features relating to colour
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/764Arrangements for image or video recognition or understanding using pattern recognition or machine learning using classification, e.g. of video objects
    • G06V10/765Arrangements for image or video recognition or understanding using pattern recognition or machine learning using classification, e.g. of video objects using rules for classification or partitioning the feature space
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/82Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V2201/00Indexing scheme relating to image or video recognition or understanding
    • G06V2201/08Detecting or categorising vehicles

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Evolutionary Computation (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Software Systems (AREA)
  • Computing Systems (AREA)
  • Databases & Information Systems (AREA)
  • Medical Informatics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Molecular Biology (AREA)
  • General Engineering & Computer Science (AREA)
  • Mathematical Physics (AREA)
  • Image Analysis (AREA)

Abstract

公开了一种基于浅层特征信息增强的车辆颜色识别方法和系统,包括在车辆颜色识别的卷积神经网络中嵌入浅层特征信息增强模块,卷积神经网络包括浅层卷积块、中层卷积块和高层卷积块,浅层特征信息增强模块嵌入浅层卷积块和中层卷积块之后;车辆图片作为浅层卷积块的输入依次进行特征提取,浅层特征信息增强模块接收特征输入,经过多个1*1卷积层获得不同维度的特征,对不同维度的特征进行矩阵相乘获得增强信息表达的特征,送入下一卷积块;将各卷积块的特征依次送入全局平均池化层、对应的分类层进行分类,并利用标签平滑正则化的交叉熵损失函数进行约束。浅层特征信息增强模块可灵活的插入卷积神经网络任意位置,增强特征信息,增加模型的泛化性。

Description

一种基于浅层特征信息增强的车辆颜色识别方法和系统
技术领域
本发明涉及图像识别的技术领域,尤其是一种基于浅层特征信息增强的车辆颜色识别方法和系统。
背景技术
随着视频结构化的发展,主要是对视频流中的车辆、行人进行结构化处理,例如对行人进行检测、识别、行为特征分析;对车辆的车牌号码、车型、颜色等信息进行识别。虽然目前车辆颜色识别算法取得较好的效果,但是车辆颜色算法依然受到较大的挑战。由于现实场景中光照变化,导致车辆颜色识别模型算法性能会受到较大的影响。可是目前的卷积神经网络由于卷积层过深,导致浅层获取的颜色特征信息无法在最后的约束起到决定性的作用,更多是由高层语义信息来决定网络的优化方向。
目前视频结构化已经应用到安防监控中,主要是对视频中的人员、车辆目标进行结构化处理,能够提取出人员的年龄、性别、衣服颜色、是否戴眼镜等属性信息,车辆的车牌号码、车型、车辆颜色、挂件等属性信息。基于提取的属性信息可以进行人员、车辆的进一步比对分析,确定违法犯罪人员和违法车辆。对于车辆的检测、车型识别、车辆颜色识别都受到了广泛的关注。然而,其中车辆颜色的识别依然存在着较大的挑战。早期使用传统的手工特征去分类车辆颜色,由于其特征不够鲁棒,导致在真实场景应用中受到光照影响,经常产生误判。目前的算法经常采用深度学习技术来获取车辆颜色特征,从而进行识别。相比传统手工特征,其性能和泛化性有较大的性能提升。然而,深度学习技术通常对颜色特征信息的提取是在浅层卷积层,随着卷积层的深入,其特征信息逐渐被转化为丰富语义信息,颜色信息有所丢失。若只采用较少的几个卷积层,网络在收敛和泛化性又会受到一定的负面影响。
现有的算法使用车辆图像作为输入,虽然在颜色标签约束进行训练,但是模型对车辆的车头灯和轮胎上关注度依然比较多,而对车辆颜色的识别应该更多关注在车身上。通过现有算法可以知道,卷积神经网络提取的特征分为浅层特征,高层特征,浅层特征更多是图像的外观信息、纹理信息、颜色信息等,随着前向传播的过程,这些浅层特征逐渐转为丰富的高层语义信息。与其他任务不同的是,车辆颜色识别分类更多需要的是浅层特征,需要的浅层能对反向传播起到决定性作用。若算法直接对模型进行剪枝,只留下最前面的特征提取层,会导致特征在低维空间无法分类开来,导致模型的性能受到一定的影响。因此,对于车辆颜色识别算法,应该对浅层信息进行特征信息增强,提升浅层特征信息对网络收敛的影响力。
发明内容
为了解决现有技术中存在的上述技术问题,本发明提出了一种基于浅层特征信息增强的车辆颜色识别方法和系统,以解决上述技术问题。
根据本发明的一个方面,提出了一种基于浅层特征信息增强的车辆颜色识别方法,包括:
S1:在车辆颜色识别的卷积神经网络中嵌入浅层特征信息增强模块,卷积神经网络包括浅层卷积块、中层卷积块和高层卷积块,浅层特征信息增强模块嵌入浅层卷积块和中层卷积块之后;
S2:车辆图片作为浅层卷积块的输入依次进行特征提取,浅层特征信息增强模块接收特征输入,经过多个1*1卷积层获得不同维度的特征,对不同维度的特征进行矩阵相乘获得增强信息表达的特征,送入下一卷积块;
S3:将各卷积块的特征依次送入全局平均池化层、对应的分类层进行分类,并利用标签平滑正则化的交叉熵损失函数进行约束。
在一些具体的实施例中,车辆颜色识别的卷积神经网络为ResNet50网络,ResNet50网络依次包括浅层卷积块1、浅层卷积块2、中层卷积块1、中层卷积块2和高层卷积块。
在一些具体的实施例中,浅层特征信息增强模块嵌入在浅层卷积块1、浅层卷积块2和中层卷积块1之后。
在一些具体的实施例中,S2具体包括:
浅层特征信息增强模块接收特征fB×C×H×W作为输入,经过3个1*1卷积层,分别获得维度为B*(H*W)*C1、B*C1*(H*W)和B*C*C1的特征,其中,B表示训练过程批处理大小,H和W分别表示图片的高和宽,C和C1表示通道;
将维度为B*(H*W)*C1和B*C1*(H*W)进行矩阵相乘,然后送入softmax函数计算出一个信息增强矩阵Aji
Figure BDA0003866092000000021
其中,Sij为第i个位置对第j个位置的贡献;
将信息增强矩阵Aji和特征维度为B*C*C1的特征进行对应矩阵相乘,然后与最初的特征进行对应元素相乘得到增强信息表达的特征,传入下一个卷积块。
在一些具体的实施例中,S3中的标签平滑正则化的交叉熵损失函数具体为
Figure BDA0003866092000000031
其中ε∈[0,1],K是车辆颜色的类别数,p(k)代表预测属于类别k的概率。
在一些具体的实施例中,整体框架的损失函数为L=0.5×l1+l2+1.5×l3+2×l4,其中,l1、l2、l3、l4分别用于约束四个分类层。
根据本发明的第二方面,提出了一种计算机可读存储介质,其上存储有一或多个计算机程序,该一或多个计算机程序被计算机处理器执行时实施上述任一项的方法。
根据本发明的第三方面,提出了一种基于浅层特征信息增强的车辆颜色识别系统,系统包括:
浅层特征信息增强模块嵌入单元,配置用于在车辆颜色识别的卷积神经网络中嵌入浅层特征信息增强模块,卷积神经网络包括浅层卷积块、中层卷积块和高层卷积块,浅层特征信息增强模块嵌入浅层卷积块和中层卷积块之后;
信息增强单元,配置用于车辆图片作为浅层卷积块的输入依次进行特征提取,浅层特征信息增强模块接收特征输入,经过多个1*1卷积层获得不同维度的特征,对不同维度的特征进行矩阵相乘获得增强信息表达的特征,送入下一卷积块;
约束单元:配置用于将个卷积块的特征依次送入全局平均池化层、对应的分类层进行分类,并利用标签平滑正则化的交叉熵损失函数进行约束。
在一些具体的实施例中,车辆颜色识别的卷积神经网络为ResNet50网络,ResNet50网络依次包括浅层卷积块1、浅层卷积块2、中层卷积块1、中层卷积块2和高层卷积块,浅层特征信息增强模块嵌入在浅层卷积块1、浅层卷积块2和中层卷积块1之后。
在一些具体的实施例中,信息增强单元中具体包括:
浅层特征信息增强模块接收特征fB×C×H×W作为输入,经过3个1*1卷积层,分别获得维度为B*(H*W)*C1、B*C1*(H*W)和B*C*C1的特征;
将维度为B*(H*W)*C1和B*C1*(H*W)进行矩阵相乘,然后送入softmax函数计算出一个信息增强矩阵Aji
Figure BDA0003866092000000032
其中,Sij为第i个位置对第j个位置的贡献;
将信息增强矩阵Aji和特征维度为B*C*C1的特征进行对应矩阵相乘,然后与最初的特征进行对应元素相乘得到增强信息表达的特征,传入下一个卷积块。
在一些具体的实施例中,标签平滑正则化的交叉熵损失函数具体为
Figure BDA0003866092000000041
其中ε∈[0,1],K是车辆颜色的类别数,p(k)代表预测属于类别k的概率。
在一些具体的实施例中,整体框架的损失函数为L=0.5×l1+l2+1.5×l3+2×l4,其中,l1、l2、l3、l4分别用于约束四个分类层。
本发明提出了一种基于浅层特征信息增强的车辆颜色识别方法和系统,通过引入浅层特征信息增强模块,用来增强浅层特征信息的表达,本发明提出的浅层特征信息增强模块具有较好的灵活性,可以灵活的插入卷积神经网络任意位置,起到对特征信息增强的作用,也可以增加模型的泛化性。
附图说明
包括附图以提供对实施例的进一步理解并且附图被并入本说明书中并且构成本说明书的一部分。附图图示了实施例并且与描述一起用于解释本发明的原理。将容易认识到其它实施例和实施例的很多预期优点,因为通过引用以下详细描述,它们变得被更好地理解。通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本申请的其它特征、目的和优点将会变得更明显:
图1是本申请的一个实施例的基于浅层特征信息增强的车辆颜色识别方法的流程图;
图2是本申请的一个具体的实施例的基于浅层特征信息增强的车辆颜色识别方法的算法框架图;
图3是本申请的一个实施例的基于浅层特征信息增强的车辆颜色识别系统的框架图;
图4是适于用来实现本申请实施例的电子设备的计算机系统的结构示意图。
具体实施方式
下面结合附图和实施例对本申请作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释相关发明,而非对该发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与有关发明相关的部分。
需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本申请。
根据本申请的一个实施例的基于浅层特征信息增强的车辆颜色识别方法,图1示出了根据本申请的实施例的基于浅层特征信息增强的车辆颜色识别方法的流程图。如图1所示,该方法包括:
S101:在车辆颜色识别的卷积神经网络中嵌入浅层特征信息增强模块,卷积神经网络包括浅层卷积块、中层卷积块和高层卷积块,浅层特征信息增强模块嵌入浅层卷积块和中层卷积块之后。
在具体的实施例中,车辆颜色识别的卷积神经网络为ResNet50网络,ResNet50网络依次包括浅层卷积块1、浅层卷积块2、中层卷积块1、中层卷积块2和高层卷积块。浅层特征信息增强模块嵌入在浅层卷积块1、浅层卷积块2和中层卷积块1之后。
S102:车辆图片作为浅层卷积块的输入依次进行特征提取,浅层特征信息增强模块接收特征输入,经过多个1*1卷积层获得不同维度的特征,对不同维度的特征进行矩阵相乘获得增强信息表达的特征,送入下一卷积块。
在具体的实施例中,浅层特征信息增强模块接收特征fB×C×H×W作为输入,经过3个1*1卷积层,分别获得维度为B*(H*W)*C1、B*C1*(H*W)和B*C*C1的特征,其中,B表示训练过程批处理大小,H和W分别表示图片的高和宽,C和C1表示通道;将维度为B*(H*W)*C1和B*C1*(H*W)进行矩阵相乘,然后送入softmax函数计算出一个信息增强矩阵Aji
Figure BDA0003866092000000051
其中,Sij为第i个位置对第j个位置的贡献;将信息增强矩阵Aji和特征维度为B*C*C1的特征进行对应矩阵相乘,然后与最初的特征进行对应元素相乘得到增强信息表达的特征,传入下一个卷积块。
S103:将各卷积块的特征依次送入全局平均池化层、对应的分类层进行分类,并利用标签平滑正则化的交叉熵损失函数进行约束。
在具体的实施例中,标签平滑正则化的交叉熵损失函数具体为
Figure BDA0003866092000000052
Figure BDA0003866092000000053
其中>∈[0,1],K是车辆颜色的类别数,p(k)代表预测属于类别k的概率。整体框架的损失函数为L=0.5×l1+l2+1.5×l3+2×l4,其中,l1、l2、l3、l4分别用于约束四个分类层。
图2示出了根据本发明的一个具体的实施例的基于浅层特征信息增强的车辆颜色识别方法的算法框架图,如图2所示,本发明提出一种浅层特征信息增强模块,增强特征信息在网络约束时起到的作用,可以灵活的嵌入到卷积神经网络中任意的位置,具体包括以下步骤:
步骤S1:将提出的浅层特征信息增强模块嵌入到卷积神经网络中,步骤发明以ResNet50为例子说明。ResNet50的Conv1和Stage1定义为浅层卷积块,Stage2和Stage3定义为中层卷积块,Stage4定义为高层卷积块。车辆图片作为浅层卷积块的输入,依次进行特征提取。
步骤S2:为了增强浅层特征信息表达,本发明将浅层特征信息增强模块嵌入在浅层卷积块1、浅层卷积块2和中层卷积块1之后。浅层特征信息增强模块接收特征fB×C×H×W作为输入,首先经过如图2所示的3个1*1卷积层,分别获得维度为B*(H*W)*C1、B*C1*(H*W)和B*C*C1的特征。
步骤S3:将步骤S2获取到的维度为B*(H*W)*C1和B*C1*(H*W)进行矩阵相乘,然后送入softmax函数计算出一个信息增强矩阵,计算如下所示:
Figure BDA0003866092000000061
其中,Sij为第i个位置对第j个位置的贡献,从而计算整个空间信息增强矩阵Aji
步骤S4:将步骤S3得到的整个空间信息增强矩阵Aji和步骤S2得到的特征维度为B*C*C1的特征进行对应矩阵相乘,然后与最初的特征进行对应元素相乘得到增强信息表达的特征,传入下一个卷积块。整个流程中分别对浅层卷积块1、浅层卷积块2和中层卷积块1进行特征信息增强,其增强过程均和步骤S2、S3、S4一样。
步骤S5:总共4个特征,分别来自浅层卷积块1,浅层卷积块2,中层卷积块1,高层卷积块1,均送入全局平均池化层,然后送入对应的分类层进行分类,均采用标签平滑正则化的交叉熵损失函数进行约束,表达式如下:
Figure BDA0003866092000000062
Figure BDA0003866092000000063
其中ε∈[0,1],K是车辆颜色的类别数,p(k)代表预测属于类别k的概率。整个框架的损失函数如下所示:L=0.5×l1+l2+1.5×l3+2×l4,其中l1、l2、l3、l4分别用于约束分类层1、分类层2、分类层3、分类层4。为了使得浅层卷积层在反向传播时能得到有效的参数更新,对浅层特征的分类层的损失给与更大的系数惩罚。
本发明提出了一种基于浅层特征信息增强的车辆颜色识别方法和系统,通过引入浅层特征信息增强模块,用来增强浅层特征信息的表达,本发明提出的浅层特征信息增强模块具有较好的灵活性,可以灵活的插入卷积神经网络任意位置,起到对特征信息增强的作用,也可以增加模型的泛化性。
继续参考图3,图3示出了根据本发明的实施例的基于浅层特征信息增强的车辆颜色识别系统的框架图。该系统具体包括浅层特征信息增强模块嵌入单元301、信息增强单元302和约束单元303。浅层特征信息增强模块嵌入单元301配置用于在车辆颜色识别的卷积神经网络中嵌入浅层特征信息增强模块,卷积神经网络包括浅层卷积块、中层卷积块和高层卷积块,浅层特征信息增强模块嵌入浅层卷积块和中层卷积块之后;信息增强单元302配置用于车辆图片作为浅层卷积块的输入依次进行特征提取,浅层特征信息增强模块接收特征输入,经过多个1*1卷积层获得不同维度的特征,对不同维度的特征进行矩阵相乘获得增强信息表达的特征,送入下一卷积块;约束单元303配置用于将各卷积块的特征依次送入全局平均池化层、对应的分类层进行分类,并利用标签平滑正则化的交叉熵损失函数进行约束。
下面参考图4,其示出了适于用来实现本申请实施例的电子设备的计算机系统的结构示意图。图4示出的电子设备仅仅是一个示例,不应对本申请实施例的功能和使用范围带来任何限制。
如图4所示,计算机系统包括中央处理单元(CPU)401,其可以根据存储在只读存储器(ROM)402中的程序或者从存储部分408加载到随机访问存储器(RAM)403中的程序而执行各种适当的动作和处理。在RAM 403中,还存储有系统400操作所需的各种程序和数据。CPU401、ROM 402以及RAM 403通过总线404彼此相连。输入/输出(I/O)接口405也连接至总线404。
以下部件连接至I/O接口405:包括键盘、鼠标等的输入部分406;包括诸如液晶显示器(LCD)等以及扬声器等的输出部分407;包括硬盘等的存储部分408;以及包括诸如LAN卡、调制解调器等的网络接口卡的通信部分409。通信部分409经由诸如因特网的网络执行通信处理。驱动器410也根据需要连接至I/O接口405。可拆卸介质411,诸如磁盘、光盘、磁光盘、半导体存储器等等,根据需要安装在驱动器410上,以便于从其上读出的计算机程序根据需要被安装入存储部分408。
特别地,根据本公开的实施例,上文参考流程图描述的过程可以被实现为计算机软件程序。例如,本公开的实施例包括一种计算机程序产品,其包括承载在计算机可读存储介质上的计算机程序,该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信部分409从网络上被下载和安装,和/或从可拆卸介质411被安装。在该计算机程序被中央处理单元(CPU)401执行时,执行本申请的方法中限定的上述功能。需要说明的是,本申请的计算机可读存储介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本申请中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本申请中,计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读存储介质,该计算机可读存储介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读存储介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:无线、电线、光缆、RF等等,或者上述的任意合适的组合。
可以以一种或多种程序设计语言或其组合来编写用于执行本申请的操作的计算机程序代码,程序设计语言包括面向对象的程序设计语言—诸如Java、Smalltalk、C++,还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络——包括局域网(LAN)或广域网(WAN)—连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。
附图中的流程图和框图,图示了按照本申请各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,该模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
描述于本申请实施例中所涉及到的模块可以通过软件的方式实现,也可以通过硬件的方式来实现。
作为另一方面,本申请还提供了一种计算机可读存储介质,该计算机可读存储介质可以是上述实施例中描述的电子设备中所包含的;也可以是单独存在,而未装配入该电子设备中。上述计算机可读存储介质承载有一个或者多个程序,当上述一个或者多个程序被该电子设备执行时,使得该电子设备:在车辆颜色识别的卷积神经网络中嵌入浅层特征信息增强模块,卷积神经网络包括浅层卷积块、中层卷积块和高层卷积块,浅层特征信息增强模块嵌入浅层卷积块和中层卷积块之后;车辆图片作为浅层卷积块的输入依次进行特征提取,浅层特征信息增强模块接收特征输入,经过多个1*1卷积层获得不同维度的特征,对不同维度的特征进行矩阵相乘获得增强信息表达的特征,送入下一卷积块;将各卷积块的特征依次送入全局平均池化层、对应的分类层进行分类,并利用标签平滑正则化的交叉熵损失函数进行约束。
以上描述仅为本申请的较佳实施例以及对所运用技术原理的说明。本领域技术人员应当理解,本申请中所涉及的发明范围,并不限于上述技术特征的特定组合而成的技术方案,同时也应涵盖在不脱离上述发明构思的情况下,由上述技术特征或其等同特征进行任意组合而形成的其它技术方案。例如上述特征与本申请中公开的(但不限于)具有类似功能的技术特征进行互相替换而形成的技术方案。

Claims (12)

1.一种基于浅层特征信息增强的车辆颜色识别方法,其特征在于,包括:
S1:在车辆颜色识别的卷积神经网络中嵌入浅层特征信息增强模块,所述卷积神经网络包括浅层卷积块、中层卷积块和高层卷积块,所述浅层特征信息增强模块嵌入所述浅层卷积块和所述中层卷积块之后;
S2:车辆图片作为浅层卷积块的输入依次进行特征提取,所述浅层特征信息增强模块接收特征输入,经过多个1*1卷积层获得不同维度的特征,对所述不同维度的特征进行矩阵相乘获得增强信息表达的特征,送入下一卷积块;
S3:将各卷积块的特征依次送入全局平均池化层、对应的分类层进行分类,并利用标签平滑正则化的交叉熵损失函数进行约束。
2.根据权利要求1所述的基于浅层特征信息增强的车辆颜色识别方法,其特征在于,所述车辆颜色识别的卷积神经网络为ResNet50网络,所述ResNet50网络依次包括浅层卷积块1、浅层卷积块2、中层卷积块1、中层卷积块2和高层卷积块。
3.根据权利要求2所述的基于浅层特征信息增强的车辆颜色识别方法,其特征在于,所述浅层特征信息增强模块嵌入在所述浅层卷积块1、浅层卷积块2和中层卷积块1之后。
4.根据权利要求3所述的基于浅层特征信息增强的车辆颜色识别方法,其特征在于,所述S2具体包括:
所述浅层特征信息增强模块接收特征fB×C×H×W作为输入,经过3个1*1卷积层,分别获得维度为B*(H*W)*C1、B*C1*(H*W)和B*C*C1的特征,其中,B表示训练过程批处理大小,H和W分别表示图片的高和宽,C和C1表示通道;
将维度为B*(H*W)*C1和B*C1*(H*W)进行矩阵相乘,然后送入softmax函数计算出一个信息增强矩阵Aji
Figure FDA0003866091990000011
其中,Sij为第i个位置对第j个位置的贡献;
将所述信息增强矩阵Aji和特征维度为B*C*C1的特征进行对应矩阵相乘,然后与最初的特征进行对应元素相乘得到增强信息表达的特征,传入下一个卷积块。
5.根据权利要求1所述的基于浅层特征信息增强的车辆颜色识别方法,其特征在于,所述S3中的所述标签平滑正则化的交叉熵损失函数具体为
Figure FDA0003866091990000012
Figure FDA0003866091990000013
其中ε∈[0,1],K是车辆颜色的类别数,p(k)代表预测属于类别k的概率。
6.根据权利要求5所述的基于浅层特征信息增强的车辆颜色识别方法,其特征在于,整体框架的损失函数为L=0.5×l1+l2+1.5×l3+2×l4,其中,l1、l2、l3、l4分别用于约束四个分类层。
7.一种计算机可读存储介质,其上存储有一或多个计算机程序,其特征在于,该一或多个计算机程序被计算机处理器执行时实施权利要求1至6任一项所述的方法。
8.一种基于浅层特征信息增强的车辆颜色识别系统,其特征在于,所述系统包括:
浅层特征信息增强模块嵌入单元,配置用于在车辆颜色识别的卷积神经网络中嵌入浅层特征信息增强模块,所述卷积神经网络包括浅层卷积块、中层卷积块和高层卷积块,所述浅层特征信息增强模块嵌入所述浅层卷积块和所述中层卷积块之后;
信息增强单元,配置用于车辆图片作为浅层卷积块的输入依次进行特征提取,所述浅层特征信息增强模块接收特征输入,经过多个1*1卷积层获得不同维度的特征,对所述不同维度的特征进行矩阵相乘获得增强信息表达的特征,送入下一卷积块;
约束单元:配置用于将各卷积块的特征依次送入全局平均池化层、对应的分类层进行分类,并利用标签平滑正则化的交叉熵损失函数进行约束。
9.根据权利要求8所述的基于浅层特征信息增强的车辆颜色识别系统,其特征在于,所述车辆颜色识别的卷积神经网络为ResNet50网络,所述ResNet50网络依次包括浅层卷积块1、浅层卷积块2、中层卷积块1、中层卷积块2和高层卷积块,所述浅层特征信息增强模块嵌入在所述浅层卷积块1、浅层卷积块2和中层卷积块1之后。
10.根据权利要求9所述的基于浅层特征信息增强的车辆颜色识别系统,其特征在于,所述信息增强单元中具体包括:
所述浅层特征信息增强模块接收特征fB×C×H×W作为输入,经过3个1*1卷积层,分别获得维度为B*(H*W)*C1、B*C1*(H*W)和B*C*C1的特征;
将维度为B*(H*W)*C1和B*C1*(H*W)进行矩阵相乘,然后送入softmax函数计算出一个信息增强矩阵Aji
Figure FDA0003866091990000021
其中,Sij为第i个位置对第j个位置的贡献;
将所述信息增强矩阵Aji和特征维度为B*C*C1的特征进行对应矩阵相乘,然后与最初的特征进行对应元素相乘得到增强信息表达的特征,传入下一个卷积块。
11.根据权利要求8所述的基于浅层特征信息增强的车辆颜色识别系统,其特征在于,所述标签平滑正则化的交叉熵损失函数具体为
Figure FDA0003866091990000031
Figure FDA0003866091990000032
其中ε∈[0,1],K是车辆颜色的类别数,p(k)代表预测属于类别k的概率。
12.根据权利要求11所述的基于浅层特征信息增强的车辆颜色识别系统,其特征在于,整体框架的损失函数为L=0.5×l1+l2+1.5×l3+2×l4,其中,l1、l2、l3、l4分别用于约束四个分类层。
CN202211183158.8A 2022-09-27 2022-09-27 一种基于浅层特征信息增强的车辆颜色识别方法和系统 Pending CN115578714A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211183158.8A CN115578714A (zh) 2022-09-27 2022-09-27 一种基于浅层特征信息增强的车辆颜色识别方法和系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211183158.8A CN115578714A (zh) 2022-09-27 2022-09-27 一种基于浅层特征信息增强的车辆颜色识别方法和系统

Publications (1)

Publication Number Publication Date
CN115578714A true CN115578714A (zh) 2023-01-06

Family

ID=84582315

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211183158.8A Pending CN115578714A (zh) 2022-09-27 2022-09-27 一种基于浅层特征信息增强的车辆颜色识别方法和系统

Country Status (1)

Country Link
CN (1) CN115578714A (zh)

Similar Documents

Publication Publication Date Title
CN108197326B (zh) 一种车辆检索方法及装置、电子设备、存储介质
CN111767882A (zh) 一种基于改进yolo模型的多模态行人检测方法
CN110689043A (zh) 一种基于多重注意力机制的车辆细粒度识别方法及装置
WO2020258077A1 (zh) 一种行人检测方法及装置
KR20210137213A (ko) 이미지 처리 방법 및 장치, 프로세서, 전자 기기, 저장 매체
CN113841161A (zh) 用于自动生成内容分发图像的可扩展体系架构
CN112434683A (zh) 基于注意力机制的行人属性识别方法、系统、装置
CN114549369A (zh) 数据修复方法、装置、计算机及可读存储介质
Li Image semantic segmentation method based on GAN network and ENet model
CN114596548A (zh) 目标检测方法、装置、计算机设备及计算机可读存储介质
Panda et al. Modified ResNet-152 network with hybrid pyramidal pooling for local change detection
CN113627241B (zh) 一种用于行人重识别的背景抑制方法与系统
CN115578714A (zh) 一种基于浅层特征信息增强的车辆颜色识别方法和系统
CN116958615A (zh) 图片识别方法、装置、设备和介质
Yuan et al. RM-IQA: A new no-reference image quality assessment framework based on range mapping method
CN114283087A (zh) 一种图像去噪方法及相关设备
Mahmood et al. Enhanced detection and recognition system for vehicles and drivers using multi-scale retinex guided filter and machine learning
Guo et al. A Markov random field model for the restoration of foggy images
CN111931680A (zh) 一种基于多尺度的车辆重识别方法及系统
Kang et al. Inception network-based weather image classification with pre-filtering process
CN115205805A (zh) 一种基于递进式特征学习技术的车型识别方法和系统
CN116311106B (zh) 一种遮挡图像识别模型的训练方法、装置、设备及介质
Jin et al. A Real‐Time Image Semantic Segmentation Method Based on Multilabel Classification
CN118015525B (zh) 图像中道路积水的识别方法、装置、终端和存储介质
CN112614116B (zh) 一种用于数字图像的篡改检测方法和系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination