CN111291715A - 基于多尺度卷积神经网络的车型识别方法、电子设备及存储介质 - Google Patents
基于多尺度卷积神经网络的车型识别方法、电子设备及存储介质 Download PDFInfo
- Publication number
- CN111291715A CN111291715A CN202010126447.9A CN202010126447A CN111291715A CN 111291715 A CN111291715 A CN 111291715A CN 202010126447 A CN202010126447 A CN 202010126447A CN 111291715 A CN111291715 A CN 111291715A
- Authority
- CN
- China
- Prior art keywords
- neural network
- scale
- layer
- convolutional neural
- convolution
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/50—Context or environment of the image
- G06V20/52—Surveillance or monitoring of activities, e.g. for recognising suspicious objects
- G06V20/54—Surveillance or monitoring of activities, e.g. for recognising suspicious objects of traffic, e.g. cars on the road, trains or boats
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/084—Backpropagation, e.g. using gradient descent
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V2201/00—Indexing scheme relating to image or video recognition or understanding
- G06V2201/08—Detecting or categorising vehicles
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02T—CLIMATE CHANGE MITIGATION TECHNOLOGIES RELATED TO TRANSPORTATION
- Y02T10/00—Road transport of goods or passengers
- Y02T10/10—Internal combustion engine [ICE] based vehicles
- Y02T10/40—Engine management systems
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Physics & Mathematics (AREA)
- Evolutionary Computation (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- General Engineering & Computer Science (AREA)
- Computing Systems (AREA)
- Software Systems (AREA)
- Molecular Biology (AREA)
- Computational Linguistics (AREA)
- Biophysics (AREA)
- Biomedical Technology (AREA)
- Mathematical Physics (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Multimedia (AREA)
- Image Analysis (AREA)
Abstract
本公开实施例中提供了基于多尺度卷积神经网络的车型识别方法、电子设备及存储介质,属于车辆识别技术领域,所述多尺度卷积神经网络包括:卷积层、池化层、全局平均池化层、SoftMax分类器;所述卷积层对输入的数据进行特征提取;所述池化层对卷积层计算得到的结果进行尺度缩小;所述SoftMax分类器用于根据全局平均池化层输出的结果对图像进行分类。通过本公开的方案,通过多尺度卷积可以快速提取特征,使得采用本方法进行车辆的车型识别具有较高的识别精度,同时具有较快的识别速度。并且基于本发明的多尺度卷积神经网络能够减少训练算法的参数量从而有效防止过拟合,提高了算法的泛化能力。
Description
技术领域
本公开涉及车辆识别技术领域,尤其涉及一种基于多尺度卷积神经网络的车型识别方法、电子设备及存储介质。
背景技术
随着国民经济的飞速发展和城市规模的不断扩大,在智慧城市中人们对高效交通系统的需求尤为迫切。对城市交通的智能感知是智慧城市交通系统的基础,在交通管理和规划中也起着基础性的作用。随着对城市交通的智能感知,越来越多的不同类型的检测器可用于城市道路,这可以为城市管理者和决策者更好地了解复杂的交通状况。到2019年,中国的汽车数量已达到3.4 亿辆,其中40个城市拥有超过100万辆。车辆是道路监控视频的主要部分,也是监控视频中的主要信息。车辆属性的识别和检测可以有效地改善智能交通领域中的车辆控制。但是目前,仅依靠车牌识别方法只能识别车牌,而不能识别其他特征信息。车辆的外观属性是车辆最明显的识别属性,也是识别车辆信息的最直观的属性。因此,有效识别车辆模型对于建设智能交通和安全城市具有重要意义。
传统的车辆属性识别方法一般基于人工提取图像特征,提取的特征用于训练和测试机器学习模型,最终实现车辆属性的识别,常用的传统机器学习方法主要有贝叶斯算法、支持向量机(SVM)算法、决策树算法。然而这些算法均需要人工提取和选择车辆属性特征,但由于人工提取特征的主观性和探索性,其性能严重影响了整体识别结果。例如:
贝叶斯算法是一种构建分类器的简单算法,该分类器模型会给问题实例分配用特征值表示的类标签,然后对每个特征属性计算所有划分的条件概率,以概率最大值作为分类的依据。
贝叶斯算法的缺陷:朴素贝叶斯模型与其他分类方法相比具有最小的误差率。但是实际上并非总是如此,这是因为朴素贝叶斯模型给定输出类别的情况下,假设属性之间相互独立,这个假设在实际应用中往往是不成立的,在属性个数比较多或者属性之间相关性较大时,分类效果不好;其次,贝叶斯算法需要知道先验概率,且先验概率很多时候取决于假设,假设的模型可以有很多种,因此在某些时候会由于假设的先验模型的原因导致预测效果不佳;再者由于贝叶斯算法是通过先验和数据来决定后验的概率从而决定分类,所以分类决策存在一定的错误率。
支持向量机是定义在特征空间上的间隔最大的线性分类器,支持向量机将向量映射到一个更高维的空间里,在这个空间里建立有一个最大间隔超平面。在分开数据的超平面的两边建有两个互相平行的超平面,分隔超平面使两个平行超平面的距离最大化以实现分类的目的。
支持向量机算法的缺陷:SVM算法对大规模训练样本难以实施,由于支持向量机是借助二次规划来求解支持向量,而求解二次规划将涉及m阶矩阵的计算(m为样本个数),当m数目很大时该矩阵的存储和计算耗费大量的机器内存和运算时间;此外,用SVM解决多分类问题存在困难,并且需要人为选择核函数及参数,所以会存在人工的主观性和随意性。
决策树(decision tree)是一个树结构分类器。其中每一个非叶子的节点表示一个特征属性上的测试,每个分支代表这个特征属性在某个值域上的输出,而每个叶节点存放一个类别。使用决策树进行决策的过程就是从根节点开始,测试待分类项中相应的特征属性,并按照其值选择输出分支,直到到达叶子节点,将叶子节点存放的类别作为决策结果
决策树算法的缺陷:在处理特征关联性比较强的数据时表现得不是太好,当类别太多时,错误可能就会增加的比较快。
可见,现有的基于机器学习方法对车辆属性识别的技术中还存在车辆整体识别不足和不全面的问题。
发明内容
有鉴于此,本公开实施例提供一种基于多尺度卷积神经网络的车型识别方法、电子设备及存储介质,至少部分解决现有技术中存在的问题。
第一方面,本公开实施例提供了一种基于多尺度卷积神经网络的车型识别方法,所述多尺度卷积神经网络包括:卷积层、池化层、全局平均池化层、 SoftMax分类器;
所述卷积层对输入的数据进行特征提取,所述卷积层为多尺度卷积层,包括多个不同大小的卷积块,多个不同大小的卷积块并行连接;
所述池化层对卷积层计算得到的结果进行尺度缩小;
所述全局平均池化层用于提取最后一个卷积层的特征图,并输出每个特征图的特征点,根据所有的特征点构建一个特征向量,然后根据分类任务对应的类别将特征向量输入到SoftMax分类器;
所述SoftMax分类器用于根据全局平均池化层输出的结果对图像进行分类;
所述基于多尺度卷积神经网络的车型识别方法的包括:
获取需要进行车型识别的车辆图像;
根据基于所述多尺度卷积神经网络建立的预设模型对所述车辆图像进行车型识别;
输出识别结果。
根据本公开实施例的一种具体实现方式,所述根据基于所述多尺度卷积神经网络建立的预设模型对所述车辆图像进行车型识别步骤中的预设模型的建立步骤包括:
获取输入的数据;
对权值进行初始化;
将输入的数据在多尺度卷积神经网络中进行前向传播;
判断前向传播得到的结果是否满足预设要求;
若前向传播得到的结果不满足预设要求,则将前向传播得到的结果回传至多尺度卷积神经网络进行反向传播;
判断反向传播得到的结果是否满足预设要求;
若反向传播得到的结果满足预设要求根据反向传播的结果对权值进行更新。
根据本公开实施例的一种具体实现方式,所述将输入的数据在多尺度卷积神经网络中进行前向传播的步骤,包括:
计算输入的数据在卷积层、池化层和全局平均池化层传输中的输出值;
计算目标值与输出值之间的第一误差值;
所述判断前向传播得到的结果是否满足预设要求的步骤,包括:
判断第一误差值是否大于预设标准值。
根据本公开实施例的一种具体实现方式,所述若前向传播得到的结果不满足预设要求,则将前向传播得到的结果回传至多尺度卷积神经网络进行反向传播的步骤,包括:
将第一误差值回传至多尺度卷积神经网络,依次计算全局平均池化层、池化层和卷积层的第二误差值;
所述判断反向传播得到的结果是否满足预设要求的步骤,包括:
判断第二误差值是否小于或者等于预设标准值。
根据本公开实施例的一种具体实现方式,所述多尺度卷积神经网络包括: 5个卷积层、4个池化层、3个多尺度卷积块、1个全局平均池化层和1个SoftMax 分类器。
第二方面,本公开实施例提供了一种基于多尺度卷积神经网络的车型识别方法的多尺度卷积神经网络,所述多尺度卷积神经网络包括:卷积层、池化层、全局平均池化层、SoftMax分类器;
所述卷积层对输入的数据进行特征提取,所述卷积层为多尺度卷积层,包括多个不同大小的卷积块,多个不同大小的卷积块并行连接;
所述池化层对卷积层计算得到的结果进行尺度缩小;
所述全局平均池化层用于提取最后一个卷积层的特征图,并输出每个特征图的特征点,根据所有的特征点构建一个特征向量,然后根据分类任务对应的类别将特征向量输入到SoftMax分类器;
所述SoftMax分类器用于根据全局平均池化层输出的结果对图像进行分类。
根据本公开实施例的一种具体实现方式,所述多尺度卷积神经网络包括: 5个卷积层、4个池化层、3个多尺度卷积块、1个全局平均池化层和1个SoftMax 分类器。
第三方面,本公开实施例还提供了一种电子设备,该电子设备包括:
至少一个处理器;以及,
与该至少一个处理器通信连接的存储器;其中,
该存储器存储有可被该至少一个处理器执行的指令,该指令被该至少一个处理器执行,以使该至少一个处理器能够执行前述第一方面或第一方面的任一实现方式中的基于多尺度卷积神经网络的车型识别方法。
第四方面,本公开实施例还提供了一种非暂态计算机可读存储介质,该非暂态计算机可读存储介质存储计算机指令,该计算机指令用于使该计算机执行前述第一方面或第一方面的任一实现方式中的基于多尺度卷积神经网络的车型识别方法。
第五方面,本公开实施例还提供了一种计算机程序产品,该计算机程序产品包括存储在非暂态计算机可读存储介质上的计算程序,该计算机程序包括程序指令,当该程序指令被计算机执行时,使该计算机执行前述第一方面或第一方面的任一实现方式中的基于多尺度卷积神经网络的车型识别方法。
本公开实施例中的基于多尺度卷积神经网络的车型识别方法,所述多尺度卷积神经网络包括:卷积层、池化层、全局平均池化层、SoftMax分类器;
所述卷积层对输入的数据进行特征提取,所述卷积层为多尺度卷积层,包括多个不同大小的卷积块,多个不同大小的卷积块并行连接;
所述池化层对卷积层计算得到的结果进行尺度缩小;
所述全局平均池化层用于提取最后一个卷积层的特征图,并输出每个特征图的特征点,根据所有的特征点构建一个特征向量,然后根据分类任务对应的类别将特征向量输入到SoftMax分类器;
所述SoftMax分类器用于根据全局平均池化层输出的结果对图像进行分类;
所述基于多尺度卷积神经网络的车型识别方法的包括:
获取需要进行车型识别的车辆图像;
根据基于所述多尺度卷积神经网络建立的预设模型对所述车辆图像进行车型识别;
输出识别结果。
本公开的方案,通过多尺度卷积可以快速提取特征,使得采用本方法进行车辆的车型识别具有较高的识别精度,同时具有较快的识别速度。并且基于本发明的多尺度卷积神经网络能够减少训练算法的参数量从而有效防止过拟合,提高了算法的泛化能力。
附图说明
为了更清楚地说明本公开实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本公开的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它的附图。
图1为本公开实施例提供的一种多尺度卷积神经网络的训练过程;
图2为本公开实施例提供的一种车型图像样本;
图3为本公开实施例提供的多尺度卷积神经网络示意图;
图4为本公开实施例提供的单个inception结构示意图;
图5为本公开实施例提供的一种车型识别过程示意图;
图6为本公开实施例提供的不同模型在测试机的准确性;
图7为本公开实施例提供的不同模型在测试集的损失;
图8为本公开实施例提供的车型识别的部分结果;
图9为本公开实施例提供的电子设备示意图。
具体实施方式
下面结合附图对本公开实施例进行详细描述。
以下通过特定的具体实例说明本公开的实施方式,本领域技术人员可由本说明书所揭露的内容轻易地了解本公开的其他优点与功效。显然,所描述的实施例仅仅是本公开一部分实施例,而不是全部的实施例。本公开还可以通过另外不同的具体实施方式加以实施或应用,本说明书中的各项细节也可以基于不同观点与应用,在没有背离本公开的精神下进行各种修饰或改变。需说明的是,在不冲突的情况下,以下实施例及实施例中的特征可以相互组合。基于本公开中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本公开保护的范围。
需要说明的是,下文描述在所附权利要求书的范围内的实施例的各种方面。应显而易见,本文中所描述的方面可体现于广泛多种形式中,且本文中所描述的任何特定结构及/或功能仅为说明性的。基于本公开,所属领域的技术人员应了解,本文中所描述的一个方面可与任何其它方面独立地实施,且可以各种方式组合这些方面中的两者或两者以上。举例来说,可使用本文中所阐述的任何数目个方面来实施设备及/或实践方法。另外,可使用除了本文中所阐述的方面中的一或多者之外的其它结构及/或功能性实施此设备及/或实践此方法。
还需要说明的是,以下实施例中所提供的图示仅以示意方式说明本公开的基本构想,图式中仅显示与本公开中有关的组件而非按照实际实施时的组件数目、形状及尺寸绘制,其实际实施时各组件的型态、数量及比例可为一种随意的改变,且其组件布局型态也可能更为复杂。
另外,在以下描述中,提供具体细节是为了便于透彻理解实例。然而,所属领域的技术人员将理解,可在没有这些特定细节的情况下实践所述方面。
本公开实施例提供一种基于多尺度卷积神经网络的车型识别方法。本实施例提供的基于多尺度卷积神经网络的车型识别方法可以由一计算装置来执行,该计算装置可以实现为软件,或者实现为软件和硬件的组合,该计算装置可以集成设置在服务器、终端设备等中。
参见图1~图5,本公开实施例提供的一种基于多尺度卷积神经网络的车型识别方法,所述多尺度卷积神经网络包括:卷积层、池化层、全局平均池化层、SoftMax分类器;
所述卷积层对输入的数据进行特征提取,所述卷积层为多尺度卷积层,包括多个不同大小的卷积块,多个不同大小的卷积块并行连接;
所述池化层对卷积层计算得到的结果进行尺度缩小;
所述全局平均池化层用于提取最后一个卷积层的特征图,并输出每个特征图的特征点,根据所有的特征点构建一个特征向量,然后根据分类任务对应的类别将特征向量输入到SoftMax分类器;
所述SoftMax分类器用于根据全局平均池化层输出的结果对图像进行分类;
所述基于多尺度卷积神经网络的车型识别方法的包括:
获取需要进行车型识别的车辆图像;
根据基于所述多尺度卷积神经网络建立的预设模型对所述车辆图像进行车型识别;
输出识别结果。
本公开实施例将多尺度卷积引入车型分类算法中,并使用全局平均池层取代全连接层,以提高特征提取能力,减少模型参数量。通过分析不同算法对图像分类领域的贡献度,以及各模型的拟合能力,设计一个具有较高识别精度的粗粒度车型识别网络。
其中多尺度卷积层的作用是使用不同大小的卷积块并行连接以增加特征映射能力,提高模型特征提取能力,其中的1*1的卷积层低成本进行跨通道的特征变换,在同一个空间位置但是在不同通道的卷积核的输出结果相关性极高,一个1*1的卷积就可以将这些空间位置相同但属于不同通道的特征连接在一起。四个分支最后通过一个聚合操作合并(在输出通道的维度上),相当于做了模型融合,提高了模型拟合能力。
根据本公开实施例的另一种具体实现方式,所述根据基于所述多尺度卷积神经网络建立的预设模型对所述车辆图像进行车型识别步骤中的预设模型的建立步骤包括:
获取输入的数据;
对权值进行初始化;
将输入的数据在多尺度卷积神经网络中进行前向传播;
判断前向传播得到的结果是否满足预设要求;
若前向传播得到的结果不满足预设要求,则将前向传播得到的结果回传至多尺度卷积神经网络进行反向传播;若前向传播得到的结果满足预设要求,则训练结束,固定权值和阈值。
判断反向传播得到的结果是否满足预设要求;
若反向传播得到的结果满足预设要求根据反向传播的结果对权值进行更新。
根据本公开实施例的另一种具体实现方式,所述将输入的数据在多尺度卷积神经网络中进行前向传播的步骤,包括:
计算输入的数据在卷积层、池化层和全局平均池化层传输中的输出值;
计算目标值与输出值之间的第一误差值;
所述判断前向传播得到的结果是否满足预设要求的步骤,包括:
判断第一误差值是否大于预设标准值。
根据本公开实施例的另一种具体实现方式,所述若前向传播得到的结果不满足预设要求,则将前向传播得到的结果回传至多尺度卷积神经网络进行反向传播的步骤,包括:
将第一误差值回传至多尺度卷积神经网络,依次计算全局平均池化层、池化层和卷积层的第二误差值;
所述判断反向传播得到的结果是否满足预设要求的步骤,包括:
判断第二误差值是否小于或者等于预设标准值。
具体来说,本发明实施例中的多尺度卷积神经网络的训练过程分为两个阶段。第一个阶段是数据由低层次向高层次传播的阶段,即前向传播阶段。另外一个阶段是,当前向传播得出的结果与预期不相符时,将误差从高层次向底层次进行传播训练的阶段,即反向传播阶段。训练过程如图1所示。训练过程为:
网络进行权值的初始化;
输入数据经过卷积层、池化层、全局平均池化层的向前传播得到输出值;
求出网络的输出值与目标值之间的误差;
当误差大于预设标准值时,将误差传回网络中,依次求得全局平均池化层,池化层,卷积层的误差。各层的误差可以理解为对于网络的总误差,网络应承担多少;当误差等于或小于预设标准值时,结束训练。
根据求得误差进行权值更新。
本发明实施例中,所述多尺度卷积神经网络包括:卷积层、池化层、全局平均池化层、SoftMax分类器;具体地,所述多尺度卷积神经网络包括:5 个卷积层、4个池化层、3个多尺度卷积块、1个全局平均池化层和1个SoftMax 分类器。
其中,本发明实施例的多尺度卷积神经网络按照如下约束进行运算:
a)卷积层
卷积层可实现对输入数据的特征提取功能。通过若干个卷积层重复作用于不同图像位置的感受野,将卷积所得到的结果组合得到特征图像。卷积层与输入接收区运算公式如下所示:
其中:x表示接收局域(M,N)的二维向量;w表示长和宽分别为j、i的卷积层;b为每个输出特征映射所加的偏置项,yconv为卷积结果;M为二维向量的长,N为二维向量的宽;f为激活函数。
b)池化层
池化层的主要作用是对卷积计算结果进行尺度缩小,以减少网络的参数量。经过池化层处理后的特征图的尺度会一定程度减小。尺寸为2,步长为2 的最大池化函数为:
fpool=Max(xm,n,xm+1,n,xm,n+1,xm+1,n+1),(0≤m≤M,0≤n≤N) (2)
其中:fpool为最大池化结果
c)全局平均池化层
卷积神经网络中的卷积层用来提取高级特征,然后将这些特征图输入到完全连接的层中以拉长特征向量,然后将其输入到Softmax分类器中。缺点是,全连接层的参数太多,降低了训练速度,容易导致过度拟合。如果使用全局平均池化层替代全连接层,那么在最后一个卷积层的每个提取的特征图都会生成一个特征点,所有的点构建为一个向量,然后针对分类任务的每个相应类别将向量直接输入到分类层。与完全连接的层相比,全局平均池化层的一个优点是,将提取的特征图和类别之间的对应关系。另一个优点是,全局平均池化层中没有要优化的参数,因此避免了该层的过度拟合。此外,全局平均池化层汇总了空间信息,因此构造的特征向量对于输入图像的空间平移更加鲁棒。假设最后一个卷积层中有10个特征图。全局平均池化将计算10个特征图的每一个的平均值,因此10个特征图将输出10个特征点。我们将这些数据点连接到1×10特征向量中,并将其输入到Softmax中进行图像分类。全局平均池化的公式如下所示。
d)SoftMax分类器
SoftMax分类层是解决多分类问题的分类器,是由Logistic回归模型应用到多分类问题上的演化结果。由于Logistic函数只能进行二分类任务,Logistic 分类器继承了Logistic函数的回归,并利用多项Logistic回归实现多分类问题。在SoftMax回归中的多分类标签y的取值范围为y>=2,训练样本集合中已经被标签的样本个数为n,构成为:
G={(x1,y1),(x2,y2),...,(xn,yn)} (4)
其中:xi表示样本集合,(y1,y2,...,yn)代表分类标签。如果用j表示不同的类别,同时对j估算概率值,则单个样本被判别为第n类的概率为:
P(y=j|x),(j=1,2,...,n) (5)
将该样本集合转化为n维度的概率向量,得到其概率函数为:
其中:l{yi=j}表示当yi=j,为1,否则为0。
损失表示通过模型的损失函数计算出的损失值。准确性是模型基于给定标签在数据集上得出的评估结果。简单地说,通过损失函数的计算来更新模型参数,并计算正确分类的样本与模型的总样本之比,以衡量模型的效果。本发明实施例对模型进行了100次训练,并记录了每次训练后的所有测试。如图6和图7所示,试验集的图像测试模型的损失和准确性表明改进后的模型具有较高的准确性和较低的损失。部分实验结果如图6和图7所示。
与上面的方法实施例相对应,参见图3和图4,本公开实施例还提供了一种基于多尺度卷积神经网络的车型识别方法的多尺度卷积神经网络,所述多尺度卷积神经网络包括:卷积层、池化层、全局平均池化层、SoftMax分类器;
所述卷积层对输入的数据进行特征提取,所述卷积层为多尺度卷积层,包括多个不同大小的卷积块,多个不同大小的卷积块并行连接;
所述池化层对卷积层计算得到的结果进行尺度缩小;
所述全局平均池化层用于提取最后一个卷积层的特征图,并输出每个特征图的特征点,根据所有的特征点构建一个特征向量,然后根据分类任务对应的类别将特征向量输入到SoftMax分类器;
所述SoftMax分类器用于根据全局平均池化层输出的结果对图像进行分类。
所述的多尺度卷积神经网络可以对应的执行上述方法实施例中的内容,本实施例未详细描述的部分,参照上述方法实施例中记载的内容,在此不再赘述。
参见图9,本公开实施例还提供了一种电子设备90,该电子设备包括:
至少一个处理器;以及,
与该至少一个处理器通信连接的存储器;其中,
该存储器存储有可被该至少一个处理器执行的指令,该指令被该至少一个处理器执行,以使该至少一个处理器能够执行前述方法实施例中的基于多尺度卷积神经网络的车型识别方法。
下面参考图9,其示出了适于用来实现本公开实施例的电子设备90的结构示意图。本公开实施例中的电子设备可以包括但不限于诸如移动电话、笔记本电脑、数字广播接收器、PDA(个人数字助理)、PAD(平板电脑)、PMP (便携式多媒体播放器)、车载终端(例如车载导航终端)等等的移动终端以及诸如数字TV、台式计算机等等的固定终端。图9示出的电子设备仅仅是一个示例,不应对本公开实施例的功能和使用范围带来任何限制。
如图9所示,电子设备90可以包括处理装置(例如中央处理器、图形处理器等)901,其可以根据存储在只读存储器(ROM)902中的程序或者从存储装置608加载到随机访问存储器(RAM)903中的程序而执行各种适当的动作和处理。在RAM 903中,还存储有电子设备90操作所需的各种程序和数据。处理装置901、ROM 902以及RAM 903通过总线904彼此相连。输入/输出(I/O) 接口905也连接至总线904。
通常,以下装置可以连接至I/O接口905:包括例如触摸屏、触摸板、键盘、鼠标、图像传感器、麦克风、加速度计、陀螺仪等的输入装置906;包括例如液晶显示器(LCD)、扬声器、振动器等的输出装置907;包括例如磁带、硬盘等的存储装置908;以及通信装置909。通信装置909可以允许电子设备 90与其他设备进行无线或有线通信以交换数据。虽然图中示出了具有各种装置的电子设备90,但是应理解的是,并不要求实施或具备所有示出的装置。可以替代地实施或具备更多或更少的装置。
特别地,根据本公开的实施例,上文参考流程图描述的过程可以被实现为计算机软件程序。例如,本公开的实施例包括一种计算机程序产品,其包括承载在计算机可读介质上的计算机程序,该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信装置909从网络上被下载和安装,或者从存储装置908被安装,或者从ROM 902被安装。在该计算机程序被处理装置901执行时,执行本公开实施例的方法中限定的上述功能。
需要说明的是,本公开上述的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本公开中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本公开中,计算机可读信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读信号介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:电线、光缆、RF(射频)等等,或者上述的任意合适的组合。
上述计算机可读介质可以是上述电子设备中所包含的;也可以是单独存在,而未装配入该电子设备中。
上述计算机可读介质承载有一个或者多个程序,当上述一个或者多个程序被该电子设备执行时,使得该电子设备:获取至少两个网际协议地址;向节点评价设备发送包括所述至少两个网际协议地址的节点评价请求,其中,所述节点评价设备从所述至少两个网际协议地址中,选取网际协议地址并返回;接收所述节点评价设备返回的网际协议地址;其中,所获取的网际协议地址指示内容分发网络中的边缘节点。
或者,上述计算机可读介质承载有一个或者多个程序,当上述一个或者多个程序被该电子设备执行时,使得该电子设备:接收包括至少两个网际协议地址的节点评价请求;从所述至少两个网际协议地址中,选取网际协议地址;返回选取出的网际协议地址;其中,接收到的网际协议地址指示内容分发网络中的边缘节点。
可以以一种或多种程序设计语言或其组合来编写用于执行本公开的操作的计算机程序代码,上述程序设计语言包括面向对象的程序设计语言—诸如 Java、Smalltalk、C++,还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络——包括局域网(LAN)或广域网(WAN)—连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。
附图中的流程图和框图,图示了按照本公开各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,该模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
描述于本公开实施例中所涉及到的单元可以通过软件的方式实现,也可以通过硬件的方式来实现。其中,单元的名称在某种情况下并不构成对该单元本身的限定,例如,第一获取单元还可以被描述为“获取至少两个网际协议地址的单元”。
应当理解,本公开的各部分可以用硬件、软件、固件或它们的组合来实现。
以上所述,仅为本公开的具体实施方式,但本公开的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本公开揭露的技术范围内,可轻易想到的变化或替换,都应涵盖在本公开的保护范围之内。因此,本公开的保护范围应以权利要求的保护范围为准。
Claims (9)
1.一种基于多尺度卷积神经网络的车型识别方法,其特征在于,所述多尺度卷积神经网络包括:卷积层、池化层、全局平均池化层、SoftMax分类器;
所述卷积层对输入的数据进行特征提取,所述卷积层为多尺度卷积层,包括多个不同大小的卷积块,多个不同大小的卷积块并行连接;
所述池化层对卷积层计算得到的结果进行尺度缩小;
所述全局平均池化层用于提取最后一个卷积层的特征图,并输出每个特征图的特征点,根据所有的特征点构建一个特征向量,然后根据分类任务对应的类别将特征向量输入到SoftMax分类器;
所述SoftMax分类器用于根据全局平均池化层输出的结果对图像进行分类;
所述基于多尺度卷积神经网络的车型识别方法包括:
获取需要进行车型识别的车辆图像;
根据基于所述多尺度卷积神经网络建立的预设模型对所述车辆图像进行车型识别;
输出识别结果。
2.根据权利要求1所述的基于多尺度卷积神经网络的车型识别方法,其特征在于,所述根据基于所述多尺度卷积神经网络建立的预设模型对所述车辆图像进行车型识别步骤中的预设模型的建立步骤包括:
获取输入的数据;
对权值进行初始化;
将输入的数据在多尺度卷积神经网络中进行前向传播;
判断前向传播得到的结果是否满足预设要求;
若前向传播得到的结果不满足预设要求,则将前向传播得到的结果回传至多尺度卷积神经网络进行反向传播;
判断反向传播得到的结果是否满足预设要求;
若反向传播得到的结果满足预设要求根据反向传播的结果对权值进行更新。
3.根据权利要求2所述的基于多尺度卷积神经网络的车型识别方法,其特征在于,所述将输入的数据在多尺度卷积神经网络中进行前向传播的步骤,包括:
计算输入的数据在卷积层、池化层和全局平均池化层传输中的输出值;
计算目标值与输出值之间的第一误差值;
所述判断前向传播得到的结果是否满足预设要求的步骤,包括:
判断第一误差值是否大于预设标准值。
4.根据权利要求3所述的基于多尺度卷积神经网络的车型识别方法,其特征在于,所述若前向传播得到的结果不满足预设要求,则将前向传播得到的结果回传至多尺度卷积神经网络进行反向传播的步骤,包括:
将第一误差值回传至多尺度卷积神经网络,依次计算全局平均池化层、池化层和卷积层的第二误差值;
所述判断反向传播得到的结果是否满足预设要求的步骤,包括:
判断第二误差值是否小于或者等于预设标准值。
5.根据权利要求1~4任一项所述的基于多尺度卷积神经网络的车型识别方法,其特征在于,所述多尺度卷积神经网络包括:5个卷积层、4个池化层、3个多尺度卷积块、1个全局平均池化层和1个SoftMax分类器。
6.一种应用于如权利要求1~5任一项所述的基于多尺度卷积神经网络的车型识别方法的多尺度卷积神经网络,其特征在于,所述多尺度卷积神经网络包括:卷积层、池化层、全局平均池化层、SoftMax分类器;
所述卷积层对输入的数据进行特征提取,所述卷积层为多尺度卷积层,包括多个不同大小的卷积块,多个不同大小的卷积块并行连接;
所述池化层对卷积层计算得到的结果进行尺度缩小;
所述全局平均池化层用于提取最后一个卷积层的特征图,并输出每个特征图的特征点,根据所有的特征点构建一个特征向量,然后根据分类任务对应的类别将特征向量输入到SoftMax分类器;
所述SoftMax分类器用于根据全局平均池化层输出的结果对图像进行分类。
7.根据权利要求6所述的多尺度卷积神经网络,其特征在于,所述多尺度卷积神经网络包括:5个卷积层、4个池化层、3个多尺度卷积块、1个全局平均池化层和1个SoftMax分类器。
8.一种电子设备,其特征在于,所述电子设备包括:
至少一个处理器;以及,
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行前述权利要求1-5中任一项所述的基于多尺度卷积神经网络的车型识别方法。
9.一种非暂态计算机可读存储介质,该非暂态计算机可读存储介质存储计算机指令,该计算机指令用于使该计算机执行前述权利要求1-5中任一项所述的基于多尺度卷积神经网络的车型识别方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010126447.9A CN111291715B (zh) | 2020-02-28 | 2020-02-28 | 基于多尺度卷积神经网络的车型识别方法、电子设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010126447.9A CN111291715B (zh) | 2020-02-28 | 2020-02-28 | 基于多尺度卷积神经网络的车型识别方法、电子设备及存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111291715A true CN111291715A (zh) | 2020-06-16 |
CN111291715B CN111291715B (zh) | 2023-03-10 |
Family
ID=71029516
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010126447.9A Active CN111291715B (zh) | 2020-02-28 | 2020-02-28 | 基于多尺度卷积神经网络的车型识别方法、电子设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111291715B (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112434662A (zh) * | 2020-12-09 | 2021-03-02 | 安徽大学 | 一种基于多尺度卷积神经网络的茶叶病斑自动识别算法 |
CN113269150A (zh) * | 2021-06-24 | 2021-08-17 | 浪潮云信息技术股份公司 | 基于深度学习的车辆多属性识别的系统及方法 |
CN115587337A (zh) * | 2022-12-14 | 2023-01-10 | 中国汽车技术研究中心有限公司 | 车门异响识别方法、设备和存储介质 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20180068198A1 (en) * | 2016-09-06 | 2018-03-08 | Carnegie Mellon University | Methods and Software for Detecting Objects in an Image Using Contextual Multiscale Fast Region-Based Convolutional Neural Network |
CN107832794A (zh) * | 2017-11-09 | 2018-03-23 | 车智互联(北京)科技有限公司 | 一种卷积神经网络生成方法、车系识别方法及计算设备 |
US20180096457A1 (en) * | 2016-09-08 | 2018-04-05 | Carnegie Mellon University | Methods and Software For Detecting Objects in Images Using a Multiscale Fast Region-Based Convolutional Neural Network |
CN107909016A (zh) * | 2017-11-03 | 2018-04-13 | 车智互联(北京)科技有限公司 | 一种卷积神经网络生成方法及车系识别方法 |
-
2020
- 2020-02-28 CN CN202010126447.9A patent/CN111291715B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20180068198A1 (en) * | 2016-09-06 | 2018-03-08 | Carnegie Mellon University | Methods and Software for Detecting Objects in an Image Using Contextual Multiscale Fast Region-Based Convolutional Neural Network |
US20180096457A1 (en) * | 2016-09-08 | 2018-04-05 | Carnegie Mellon University | Methods and Software For Detecting Objects in Images Using a Multiscale Fast Region-Based Convolutional Neural Network |
CN107909016A (zh) * | 2017-11-03 | 2018-04-13 | 车智互联(北京)科技有限公司 | 一种卷积神经网络生成方法及车系识别方法 |
CN107832794A (zh) * | 2017-11-09 | 2018-03-23 | 车智互联(北京)科技有限公司 | 一种卷积神经网络生成方法、车系识别方法及计算设备 |
Non-Patent Citations (1)
Title |
---|
李新叶等: "基于多尺度跃层卷积神经网络的精细车型识别", 《科学技术与工程》 * |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112434662A (zh) * | 2020-12-09 | 2021-03-02 | 安徽大学 | 一种基于多尺度卷积神经网络的茶叶病斑自动识别算法 |
CN113269150A (zh) * | 2021-06-24 | 2021-08-17 | 浪潮云信息技术股份公司 | 基于深度学习的车辆多属性识别的系统及方法 |
CN115587337A (zh) * | 2022-12-14 | 2023-01-10 | 中国汽车技术研究中心有限公司 | 车门异响识别方法、设备和存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN111291715B (zh) | 2023-03-10 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111291715B (zh) | 基于多尺度卷积神经网络的车型识别方法、电子设备及存储介质 | |
EP3637310A1 (en) | Method and apparatus for generating vehicle damage information | |
US11255678B2 (en) | Classifying entities in digital maps using discrete non-trace positioning data | |
JP2023545423A (ja) | 点群分割方法、装置、機器および記憶媒体 | |
CN110674349B (zh) | 视频poi识别方法、装置及电子设备 | |
CN111738316B (zh) | 零样本学习的图像分类方法、装置及电子设备 | |
CN112712036A (zh) | 交通标志识别方法、装置、电子设备及计算机存储介质 | |
CN110287817B (zh) | 目标识别及目标识别模型的训练方法、装置和电子设备 | |
CN111753114A (zh) | 图像预标注方法、装置及电子设备 | |
CN115238582A (zh) | 知识图谱三元组的可靠性评估方法、系统、设备及介质 | |
CN110069997B (zh) | 场景分类方法、装置及电子设备 | |
CN115146478A (zh) | 基于优化算法的行驶工况构建方法、装置及相关设备 | |
CN113140012B (zh) | 图像处理方法、装置、介质及电子设备 | |
CN113033707B (zh) | 视频分类方法、装置、可读介质及电子设备 | |
CN114168824A (zh) | 基于机器学习的冷热数据分离方法、系统、设备及介质 | |
CN116109907B (zh) | 目标检测方法、装置、电子设备及存储介质 | |
CN110852261B (zh) | 目标检测方法、装置、电子设备和可读存储介质 | |
CN115563522B (zh) | 交通数据的聚类方法、装置、设备及介质 | |
CN113723712B (zh) | 风电功率预测方法、系统、设备及介质 | |
CN111832354A (zh) | 目标对象年龄识别方法、装置及电子设备 | |
CN115827705A (zh) | 用于反事实解释的数据处理方法和装置 | |
CN114170233A (zh) | 图像分割标签的生成方法、装置、电子设备及存储介质 | |
CN111950572A (zh) | 训练分类器的方法、装置、电子设备和计算机可读存储介质 | |
CN117478434B (zh) | 边缘节点网络流量数据处理方法、装置、设备及介质 | |
CN110263852B (zh) | 数据处理方法、装置及电子设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |