CN113469249A - 图像分类模型训练方法、分类方法、路侧设备和云控平台 - Google Patents
图像分类模型训练方法、分类方法、路侧设备和云控平台 Download PDFInfo
- Publication number
- CN113469249A CN113469249A CN202110740219.5A CN202110740219A CN113469249A CN 113469249 A CN113469249 A CN 113469249A CN 202110740219 A CN202110740219 A CN 202110740219A CN 113469249 A CN113469249 A CN 113469249A
- Authority
- CN
- China
- Prior art keywords
- image
- weight parameter
- classification model
- image classification
- weight
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000013145 classification model Methods 0.000 title claims abstract description 94
- 238000000034 method Methods 0.000 title claims abstract description 73
- 238000012549 training Methods 0.000 title claims abstract description 43
- 239000011159 matrix material Substances 0.000 claims abstract description 117
- 238000004590 computer program Methods 0.000 claims abstract description 14
- 239000013598 vector Substances 0.000 claims description 57
- 230000004580 weight loss Effects 0.000 claims description 35
- 238000004364 calculation method Methods 0.000 claims description 19
- 238000012545 processing Methods 0.000 claims description 18
- 238000010606 normalization Methods 0.000 claims description 17
- 238000000605 extraction Methods 0.000 claims description 8
- 238000013473 artificial intelligence Methods 0.000 abstract description 4
- 238000013528 artificial neural network Methods 0.000 abstract description 3
- 238000010586 diagram Methods 0.000 description 16
- 230000006870 function Effects 0.000 description 14
- 238000004891 communication Methods 0.000 description 13
- 230000008569 process Effects 0.000 description 8
- 230000004048 modification Effects 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 230000003287 optical effect Effects 0.000 description 3
- 238000011176 pooling Methods 0.000 description 3
- 230000009467 reduction Effects 0.000 description 3
- 230000003993 interaction Effects 0.000 description 2
- 238000003062 neural network model Methods 0.000 description 2
- 238000005457 optimization Methods 0.000 description 2
- 238000003491 array Methods 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 239000000446 fuel Substances 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 239000013307 optical fiber Substances 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 230000001953 sensory effect Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
Landscapes
- Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Theoretical Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Image Analysis (AREA)
Abstract
本公开公开了一种图像分类模型的训练方法,涉及人工智能技术领域,尤其涉及智能交通和神经网络技术领域。具体实现方案为:提取图像样本的特征,上述图像样本具有表示类别的标签;根据上述图像样本的特征以及上述图像分类模型的权重参数矩阵,确定上述图像样本的类别,作为分类结果;根据上述标签、上述分类结果以及上述权重参数矩阵,计算上述图像分类模型的损失;以及根据上述损失调整上述图像分类模型的权重参数矩阵。本公开还公开了一种图像分类方法、一种图像分类模型的训练装置、一种图像分类装置、一种电子设备、一种存储有计算机指令的非瞬时计算机可读存储介质、一种计算机程序产品。
Description
技术领域
本公开涉及人工智能技术领域,尤其涉及智能交通和神经网络技术领域。更具体地,本公开提供了一种图像分类模型的训练方法、一种图像分类方法、一种图像分类模型的训练装置、一种图像分类装置、一种电子设备、一种存储有计算机指令的非瞬时计算机可读存储介质、一种计算机程序产品。
背景技术
主流的分类模型框架一般是对获取到的输入进行一系列的卷积和下采样操作,得到一个特征图,然后对特征图进行降维,最后通过一个全连接层输出类别个数。
发明内容
本公开提供了一种图像分类模型的训练方法、图像分类方法、装置、设备、存储介质以及计算机程序产品。
根据第一方面,提供了一种图像分类模型的训练方法,该方法包括:提取图像样本的特征,上述图像样本具有表示类别的标签;根据上述图像样本的特征以及上述图像分类模型的权重参数矩阵,确定上述图像样本的类别,作为分类结果;根据上述标签、上述分类结果以及上述权重参数矩阵,计算上述图像分类模型的损失;以及根据上述损失调整上述图像分类模型的权重参数矩阵
根据第二方面,提供了一种图像分类方法,该方法包括:获取待分类对象;使用图像分类模型对上述待分类对象进行分类,得到上述待分类对象的类别;其中,上述图像分类模型是利用根据本公开实施例提供的方法训练的。
根据第三方面,提供了一种图像分类模型的训练装置,该装置包括:提取模块,用于提取图像样本的特征,上述图像样本具有表示类别的标签;确定模块,用于根据上述图像样本的特征以及上述图像分类模型的权重参数矩阵,确定上述图像样本的类别,作为分类结果;计算模块,用于根据上述标签、上述分类结果以及上述权重参数矩阵,计算上述图像分类模型的损失;以及调整模块,用于根据上述损失调整上述图像分类模型的权重参数矩阵。
根据第四方面,提供了一种图像分类装置,该装置包括:获取模块,用于获取待分类对象;分类模块,用于使用图像分类模型对上述待分类对象进行分类,得到上述待分类对象的类别;其中,上述图像分类模型是利用根据本公开实施例提供的装置训练的。
根据第五方面,提供了一种电子设备,包括:至少一个处理器;以及与至少一个处理器通信连接的存储器;其中,存储器存储有可被至少一个处理器执行的指令,指令被至少一个处理器执行,以使至少一个处理器能够执行根据本公开实施例提供的方法。
根据第六方面,提供了一种存储有计算机指令的非瞬时计算机可读存储介质,该计算机指令用于使计算机执行根据本公开实施例提供的方法。
根据第七方面,提供了一种计算机程序产品,包括计算机程序,上述计算机程序在被处理器执行时实现根据本公开实施例提供的方法。
根据第八方面,提供了一种路侧设备,包括根据本公开实施例提供的电子设备。
根据第九方面,提供了一种云控平台,包括根据本公开实施例提供的电子设备。
应当理解,本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征,也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。
附图说明
附图用于更好地理解本方案,不构成对本公开的限定。其中:
图1是根据本公开一个实施例的可以应用图像分类模型的训练方法和/或图像分类方法的示例性系统架构示意图;
图2是根据本公开一个实施例的图像分类模型的训练方法的流程图;
图3是根据本公开另一个实施例的图像分类模型的训练方法的流程图;
图4是根据本公开另一个实施例的图像分类模型的原理图;
图5是根据本公开一个实施例的图像分类方法的流程图;
图6是根据本公开一个实施例的图像分类模型的训练装置的框图;
图7是根据本公开一个实施例的图像分类装置的框图;
图8示出了可以用来实施本公开的实施例的示例电子设备800的示意性框图。
具体实施方式
以下结合附图对本公开的示范性实施例做出说明,其中包括本公开实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本公开的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。
图像分类可以采用神经网络模型,例如可以采用ResNet(Residual NeuralNetwork,残差神经网络)模型、SeNet(Squeeze-and-Excitation Networks,压缩和激励网络)模型等。图像分类所用的分类模型可以将常见的神经网络模型作为Backbone(骨干)框架,并根据实际需要调整分类的数量。
主流的分类模型框架一般可以设定输入图像的尺寸,例如224pixel×224pixel(像素),然后对输入图像进行一系列的卷积和下采样操作,得到一个固定尺度的特征图;然后将该特征图输入全局平均池化层进行降维,再通过一个全连接层输出类别数量。这个输出结果同时受到了输入特征和全连接层权重的影响,而且影响因素不唯一,给目标优化带来了一定的难度。
同时,分类模型训练过程中需要用到损失函数,常见的损失函数包括交叉熵损失函数、权重交叉熵损失函数等。同样的,单一的交叉熵或者其变种损失函数都只要求了在预测的概率上将不同类别的预测值分开。利用上述损失函数优化分类模型并没有将学习到的特征尽可能的聚集。
图1是根据本公开一个实施例的可以应用图像分类模型的训练方法和/或图像分类方法的示例性系统架构示意图。需要注意的是,图1所示仅为可以应用本公开实施例的系统架构的示例,以帮助本领域技术人员理解本公开的技术内容,但并不意味着本公开实施例不可以用于其他设备、系统、环境或场景。
如图1所示,根据该实施例的系统架构100可以包括多个终端设备101、网络102和服务器103。网络102用以在各个计算设备101之间提供通信链路的介质。网络102可以包括各种连接类型,例如有线和/或无线通信链路等等。
本公开实施例所提供的图像分类模型的训练方法以及图像分类方法中的至少之一一般可以由服务器103执行。相应地,本公开实施例所提供的图像分类模型的训练装置以及图像分类装置中的至少之一一般可以设置于服务器103中。本公开实施例所提供的图像分类模型的训练方法以及图像分类方法也可以由不同于服务器103且能够与多个终端设备101和/或服务器103通信的服务器或服务器集群执行。相应地,本公开实施例所提供的图像分类模型的训练装置以及图像分类装置也可以设置于不同于服务器103且能够与多个终端设备101和/或服务器103通信的服务器或服务器集群中。
在本公开实施例中,图像分类模型可以确定输入的图像样本的分类类别。在训练该图像分类模型时,训练目标是该分类类别与输入的图像样本的标签之间的误差尽可能的小。在训练过程中,图像分类模型不断更新和优化,可以依据用户实际需求设置训练停止条件,从而在满足训练停止条件的情况下,得到满足用户要求的图像分类模型。
图2是根据本公开一个实施例的图像分类模型的训练方法的流程图。
如图2所示,该图像分类模型的训练方法200可以包括操作S210~操作S240。
在操作S210,提取图像样本的特征,上述图像样本具有表示类别的标签。
例如,图像样本可以为人工标注后的图像样本集。其中,图像可以是交通信号图像,例如红绿灯图像;图像也可以是不同用途的车辆图片,例如公交车、工程车、公务车等的图像。
根据本公开实施例,标签可以表示图像样本的类别。例如,图像样本为车辆图片集时,标签可以是图片中车辆的用途,例如公交车、工程车或公务车。例如,图像样本为公交车图片集时,标签可以包含图片中公交车的驱动方式,例如电动公交车、燃油公交车、混合动力公交车。
在操作S220,根据上述图像样本的特征以及上述图像分类模型的权重参数矩阵,确定上述图像样本的类别,作为分类结果。
根据本公开的实施例,图像样本的特征可以用特征向量表示,根据图像样本的特征向量与权重参数矩阵进行运算,可以得到图像样本的分类结果。
例如,一个图像样本的特征向量具有M个维度,权重参数矩阵是一个M×C(M行C列)的矩阵,其中C表示类别。将该图像样本的特征向量与权重参数矩阵相乘,得到一个1×C(1行C列)的矩阵,该矩阵中最大值对应的类别可以作为图像样本的分类结果。
例如,N个图像样本的特征向量可以表示成N×M(N行M列)的矩阵,该矩阵每行对应一个图像样本的特征向量,M表示特征向量的维度。权重参数矩阵是一个M×C(M行C列)的矩阵,其中C表示类别。将N个图像样本的特征向量与权重参数矩阵相乘,得到一个N×C(N行C列)的矩阵,该矩阵中每行的最大值对应的类别可以作为相应图像样本的类别。
在操作S230,根据上述标签、上述分类结果以及上述权重参数矩阵,计算上述图像分类模型的损失。
例如,根据上述标签和上述分类结果可以计算预测损失,根据权重参数矩阵可以计算权重损失。
在操作S240,根据上述损失调整上述图像分类模型的权重参数矩阵。
例如,可以根据上述预测损失和上述权重损失其中一个或两个调整权重参数矩阵。
例如,可以根据预测损失调整权重参数矩阵。例如,可以根据预测损失和权重损失共同调整权重参数矩阵。
根据本公开的实施例,在约束条件中增加了权重损失,可以促进权重矩阵向列满秩矩阵转化,进而能够更好地将预测结果分开。
图3是根据本公开另一个实施例的图像分类模型的训练方法的流程图。
如图3所示,本领域技术人员可以理解,可以在例如图2所示的操作S210之后执行图3所示图像分类模型的训练方法300,在操作S210中,提取图像样本的特征,上述图像样本具有表示类别的标签。
该图像分类模型的训练方法可以根据上述图像样本的特征以及上述图像分类模型的权重参数矩阵,确定上述图像样本的类别,作为分类结果。下面将参考下述操作S321~操作S323来对此进行详细说明。
在操作S321,对上述图像样本的特征进行归一化处理。
根据本公开的实施例,可以对表示图像样本的特征的特征向量进行归一化处理。
例如,图像样本的特征向量是一个M维向量,可以将特征向量中的每个元素映射为(0,1)之间的小数,映射后特征向量中M个元素的代数和为1或者平方和为1。
在操作S322,对上述图像分类模型的权重参数矩阵进行归一化处理。
根据本公开的实施例,可以将权重参数矩阵的列归一化,也可以将权重参数矩阵的列归一化。
例如,权重参数矩阵是一个M×C矩阵可以将权重参数矩阵的每一列中的每个元素映射为(0,1)之间的小数,映射后每列元素的代数和为1或者平方和为1。
在操作S323,根据归一化处理后的特征以及归一化处理后的权重参数矩阵,确定上述图像样本的类别。
根据本公开的实施例,图像样本的特征可以用归一化处理后的特征向量表示,根据图像样本归一化处理后的特征向量与归一化处理后的权重参数矩阵进行运算,可以得到图像样本的分类结果。
例如,一个图像样本的归一化处理后的特征向量具有M个维度,归一化处理后权重参数矩阵是一个M×C(M行C列)的矩阵,其中C表示类别。将该特征向量与该权重参数矩阵相乘,得到一个1×C(1行C列)的矩阵,该1×C的矩阵中最大值所在的列对应的类别可以作为图像样本的分类结果。
例如,N个图像样本的特征向量可以表示成N×M(N行M列)的矩阵,该矩阵每行对应一个图像样本的归一化处理后的特征向量,M表示特征向量的维度。归一化处理后的权重参数矩阵是一个M×C(M行C列)的矩阵。将上述N个图像样本的特征向量与该权重参数矩阵相乘,得到一个N×C(N行C列)的矩阵,该N×C矩阵中每行的最大值对应的类别可以作为相应图像样本的类别。
通过本公开实施例,图像样本特征和权重矩阵均归一化处理后,分类结果仅与图像样本特征和权重向量之间的夹角相关,减少了约束变量,简化了模型优化。
该图像分类模型的训练方法可以根据上述标签、上述分类结果以及上述权重参数矩阵,计算上述图像分类模型的损失。下面将参考下述操作S331~操作S332进行详细说明。
在操作S331,根据上述标签和上述分类结果,计算上述预测损失。
根据本公开的实施例,预测损失可以通过交叉熵损失函数lsoftmax计算。例如,可以通过下式计算预测损失。
其中,C为总的类别数,yc为图像样本真实的标签,yi为预测图像样本为类别i的概率。
例如,可以通过下式计算yi。
其中,zi为输入图像的特征向量x与权重参数向量wi的乘积,f(·)为映射函数,例如线性整流函数(Rectified Linear Unit,ReLU)。
例如,可以通过下式计算zi。
zi=wi*x (3)
其中,wi为权重参数矩阵中第i列权重参数向量。
在操作S332,根据上述归一化后的权重参数矩阵,计算上述权重损失。
根据本公开的实施例,上述权重参数矩阵包括多列权重参数向量,每列权重参数向量对应一个类别。
例如,权重参数矩阵可以为,
根据本公开实施例,上述计算上述权重损失包括:计算上述多列权重参数向量之间的相关性。
根据本公开实施例,上述计算上述权重损失还包括:根据归一化后的多列权重参数向量之间的相关性,确定上述权重损失。
其中,W为权重参数矩阵,WT为权重参数矩阵的转置矩阵,Wmask为预设的掩码矩阵。例如,上述Wmask为对角线元素全为0,且其他元素全为1的方阵。
本领域技术人员可以理解,可以在操作S332之后执行例如图2所示的操作S240。在操作S240中,根据上述损失调整上述图像分类模型的权重参数矩阵。
图4是根据本公开的另一个实施例的图像分类模型的原理图。
如图4所示,该图像分类模型400包括特征提取层401、池化层402、第一全连接层403和第二全连接层404。
该图像分类模型400以标注后的图像样本405作为训练样本,标注后的图像样本具有标签406。
特征提取层401获取输入的图像样本405,从图像样本405中提取特征,得到特征图Feature Map 407。特征提取层401,也称为骨干(backbone)网络,可以是ResNet、GoogleNet、SeNet、MobileNet、ShuffleNet等模型。特征提取层401获取的输入图像样本405可以是一个,也可以是多个。特征提取层401根据每个输入的图像样本405可以得到至少一个特征图Feature Map 407。
全局平均池化层402对图像样本405的特征图Feature Map 407进行降维,得到一个第一特征向量X’408。第一全连接层403根据第一特征向量X’408,可以得到第二特征向量X 409。第二特征向量X 409是一个M维的向量。一个第二特征向量X 409与一个图像样本405对应。如果输入的图像样本405为N个,则第一全连接层403根据N个图像样本405对应的第一特征向量X’408,可以得到一个N×M的矩阵。该矩阵的每个行向量与一个图像样本405对应,即该矩阵的每个行向量对应一个图像样本405的第二特征向量X 409。
第二全连接层404将第二特征向量X 409与权重参数矩阵进行乘法运算,得到输出结果。其中权重参数矩阵是一个M×C的矩阵,C表示类别。与一个第二特征向量X 409对应的输出结果是一个1×C的矩阵。该1×C矩阵中各元素的最大值所在列对应的类别即分类结果410。如果输入的图像样本为N个,即输入第二全连接层404的是一个N×M的矩阵,相应地第二全连接层404输出的是一个N×C的矩阵,该N×C的矩阵中每个行向量对应一个输入的图像样本405,每个行向量中各元素的最大值所在列对应的类别即相应输入的样本405的分类结果410。
根据图像分类模型400对图像样本405的分类结果410、图像样本405对应的标签406,可以得到预测损失,根据预测损失可以调整第二全连接层中权重参数矩阵中权重值。同时,根据权重参数矩阵的各个列向量线性相关性可以得到权重损失。可以通过权重损失调整权重参数矩阵,其目的是将权重参数矩阵向列满秩矩阵转化,以及权重参数矩阵的列向量的线性相关性向线性无关转化。根据预测损失和权重损失调整后权重参数矩阵后,得到新的权重参数矩阵,新的权重参数矩阵用于下一次训练。
图5是根据本公开一个实施例的图像分类方法的流程图。
如图5所示,该图像分类方法可以包括操作S510~操作S520。
在操作S510,获取待分类对象。
例如,分类对象可以是多张图像,也可以是一张图像。
在操作S520,使用图像分类模型对上述待分类对象进行分类,得到上述待分类对象的类别;其中,上述图像分类模型是利用根据本公开实施例提供的图像分类模型的训练方法训练的。
例如,使用上述训练方法得到的图像分类模型对待分类对象进行分类,可以得到相应地分类结果。
图6是根据本公开的一个实施例的图像分类模型的训练装置的框图。
如图6所示,该图像分类模型的训练装置600可以包括提取模块610、确定模块620、计算模块630和调整模块640。
提取模块610,用于提取图像样本的特征,上述图像样本具有表示类别的标签。
确定模块620,用于根据上述图像样本的特征以及上述图像分类模型的权重参数矩阵,确定上述图像样本的类别,作为分类结果;
计算模块630,用于根据上述标签、上述分类结果以及上述权重参数矩阵,计算上述图像分类模型的损失。
调整模块640,用于根据上述损失调整上述图像分类模型的权重参数矩阵。
作为一个可选实施例,上述确定模块包括:特征归一化子模块,用于对上述图像样本的特征进行归一化处理;权重归一化子模块,对上述图像分类模型的权重参数矩阵进行归一化处理;以及确定子模块,根据归一化处理后的特征以及归一化处理后的权重参数矩阵,确定上述图像样本的类别。
作为一个可选实施例,上述图像分类模型的损失包括预测损失和权重损失,上述计算模块包括:预测损失计算子模块,用于根据上述标签和上述分类结果,计算上述预测损失;权重损失计算子模块,用于根据上述归一化后的权重参数矩阵,计算上述权重损失。
作为一个可选实施例,上述权重参数矩阵包括多列权重参数向量,每列权重参数向量对应一个类别,上述权重损失计算子模块包括:相关性计算单元,用于计算上述多列权重参数向量之间的相关性;权重损失计算单元,根据归一化后的多列权重参数向量之间的相关性,确定上述权重损失。
作为一个可选实施例,上述确定上述权重损失包括:根据以下等式来确定上述权重损失:
作为一个可选实施例,上述Wmask为对角线元素全为0,且其他元素全为1的方阵。
图7是根据本公开一个实施例的图像分类装置的框图。
如图7所示,该图像分类装置700包括获取模块710和分类模块720。
获取模块710,用于获取待分类对象。
分类模块720,用于使用图像分类模型对上述待分类对象进行分类,得到上述待分类对象的类别;其中,上述图像分类模型是利用根据本公开实施例提供的方法训练的。
本公开的技术方案中,所涉及的用户个人信息的获取,存储和应用等,均符合相关法律法规的规定,且不违背公序良俗。
根据本公开的实施例,本公开还提供了一种电子设备、一种可读存储介质和一种计算机程序产品。
图8示出了可以用来实施本公开的实施例的示例电子设备800的示意性框图。电子设备旨在表示各种形式的数字计算机,诸如,膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备还可以表示各种形式的移动装置,诸如,个人数字处理、蜂窝电话、智能电话、可穿戴设备和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例,并且不意在限制本文中描述的和/或者要求的本公开的实现。
如图8所示,设备800包括计算单元801,其可以根据存储在只读存储器(ROM)802中的计算机程序或者从存储单元808加载到随机访问存储器(RAM)803中的计算机程序,来执行各种适当的动作和处理。在RAM 803中,还可存储设备800操作所需的各种程序和数据。计算单元801、ROM 802以及RAM 803通过总线804彼此相连。输入/输出(I/O)接口805也连接至总线804。
设备800中的多个部件连接至I/O接口805,包括:输入单元806,例如键盘、鼠标等;输出单元807,例如各种类型的显示器、扬声器等;存储单元808,例如磁盘、光盘等;以及通信单元809,例如网卡、调制解调器、无线通信收发机等。通信单元809允许设备800通过诸如因特网的计算机网络和/或各种电信网络与其他设备交换信息/数据。
计算单元801可以是各种具有处理和计算能力的通用和/或专用处理组件。计算单元801的一些示例包括但不限于中央处理单元(CPU)、图形处理单元(GPU)、各种专用的人工智能(AI)计算芯片、各种运行机器学习模型算法的计算单元、数字信号处理器(DSP)、以及任何适当的处理器、控制器、微控制器等。计算单元801执行上文所描述的各个方法和处理,例如图像分类模型的训练方法和/或图像分类方法。例如,在一些实施例中,图像分类模型的训练方法和/或图像分类方法可被实现为计算机软件程序,其被有形地包含于机器可读介质,例如存储单元808。在一些实施例中,计算机程序的部分或者全部可以经由ROM 802和/或通信单元809而被载入和/或安装到设备800上。当计算机程序加载到RAM 803并由计算单元801执行时,可以执行上文描述的图像分类模型的训练方法和/或图像分类方法的一个或多个步骤。备选地,在其他实施例中,计算单元801可以通过其他任何适当的方式(例如,借助于固件)而被配置为执行图像分类模型的训练方法和/或图像分类方法。
本文中以上描述的系统和技术的各种实施方式可以在数字电子电路系统、集成电路系统、场可编程门阵列(FPGA)、专用集成电路(ASIC)、专用标准产品(ASSP)、芯片上系统的系统(SOC)、负载可编程逻辑设备(CPLD)、计算机硬件、固件、软件、和/或它们的组合中实现。这些各种实施方式可以包括:实施在一个或者多个计算机程序中,该一个或者多个计算机程序可在包括至少一个可编程处理器的可编程系统上执行和/或解释,该可编程处理器可以是专用或者通用可编程处理器,可以从存储系统、至少一个输入装置、和至少一个输出装置接收数据和指令,并且将数据和指令传输至该存储系统、该至少一个输入装置、和该至少一个输出装置。
用于实施本公开的方法的程序代码可以采用一个或多个编程语言的任何组合来编写。这些程序代码可以提供给通用计算机、专用计算机或其他可编程数据处理装置的处理器或控制器,使得程序代码当由处理器或控制器执行时使流程图和/或框图中所规定的功能/操作被实施。程序代码可以完全在机器上执行、部分地在机器上执行,作为独立软件包部分地在机器上执行且部分地在远程机器上执行或完全在远程机器或服务器上执行。
在本公开的上下文中,机器可读介质可以是有形的介质,其可以包含或存储以供指令执行系统、装置或设备使用或与指令执行系统、装置或设备结合地使用的程序。机器可读介质可以是机器可读信号介质或机器可读储存介质。机器可读介质可以包括但不限于电子的、磁性的、光学的、电磁的、红外的、或半导体系统、装置或设备,或者上述内容的任何合适组合。机器可读存储介质的更具体示例会包括基于一个或多个线的电气连接、便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦除可编程只读存储器(EPROM或快闪存储器)、光纤、便捷式紧凑盘只读存储器(CD-ROM)、光学储存设备、磁储存设备、或上述内容的任何合适组合。
为了提供与用户的交互,可以在计算机上实施此处描述的系统和技术,该计算机具有:用于向用户显示信息的显示装置(例如,CRT(阴极射线管)或者LCD(液晶显示器)监视器);以及键盘和指向装置(例如,鼠标或者轨迹球),用户可以通过该键盘和该指向装置来将输入提供给计算机。其它种类的装置还可以用于提供与用户的交互;例如,提供给用户的反馈可以是任何形式的传感反馈(例如,视觉反馈、听觉反馈、或者触觉反馈);并且可以用任何形式(包括声输入、语音输入或者、触觉输入)来接收来自用户的输入。
可以将此处描述的系统和技术实施在包括后台部件的计算系统(例如,作为数据服务器)、或者包括中间件部件的计算系统(例如,应用服务器)、或者包括前端部件的计算系统(例如,具有图形用户界面或者网络浏览器的用户计算机,用户可以通过该图形用户界面或者该网络浏览器来与此处描述的系统和技术的实施方式交互)、或者包括这种后台部件、中间件部件、或者前端部件的任何组合的计算系统中。可以通过任何形式或者介质的数字数据通信(例如,通信网络)来将系统的部件相互连接。通信网络的示例包括:局域网(LAN)、广域网(WAN)和互联网。
计算机系统可以包括客户端和服务器。客户端和服务器一般远离彼此并且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端-服务器关系的计算机程序来产生客户端和服务器的关系。
根据本公开的实施例,本公开还提供了一种路侧设备,路侧设备可以包括本公开实施例提供的电子设备。
路侧设备除了包括电子设备,还可以包括通信部件等,电子设备可以和通信部件一体集成,也可以分体设置。电子设备可以获取感知设备(如路侧相机)的数据,例如图片和视频等,从而进行图像视频处理和数据计算。可选的,电子设备自身也可以具备感知数据获取功能和通信功能,例如是AI相机,电子设备可以直接基于获取的感知数据进行图像视频处理和数据计算。
根据本公开的实施例,本公开还提供了一种云控平台,云控平台可以包括本公开实施例提供的电子设备。
云控平台在云端执行处理,云控平台包括的电子设备可以获取感知设备(如路侧相机)的数据,例如图片和视频等,从而进行图像视频处理和数据计算;云控平台也可以称为车路协同管理平台、边缘计算平台、云计算平台、中心系统、云端服务器等。
应该理解,可以使用上面所示的各种形式的流程,重新排序、增加或删除步骤。例如,本发公开中记载的各步骤可以并行地执行也可以顺序地执行也可以不同的次序执行,只要能够实现本公开公开的技术方案所期望的结果,本文在此不进行限制。
上述具体实施方式,并不构成对本公开保护范围的限制。本领域技术人员应该明白的是,根据设计要求和其他因素,可以进行各种修改、组合、子组合和替代。任何在本公开的精神和原则之内所作的修改、等同替换和改进等,均应包含在本公开保护范围之内。
Claims (19)
1.一种图像分类模型的训练方法,包括:
提取图像样本的特征,所述图像样本具有表示类别的标签;
根据所述图像样本的特征以及所述图像分类模型的权重参数矩阵,确定所述图像样本的类别,作为分类结果;
根据所述标签、所述分类结果以及所述权重参数矩阵,计算所述图像分类模型的损失;以及
根据所述损失调整所述图像分类模型的权重参数矩阵。
2.根据权利要求1所述的方法,其中,所述根据所述图像样本的特征以及所述图像分类模型的权重参数矩阵,确定所述图像样本的类别包括:
对所述图像样本的特征进行归一化处理;
对所述图像分类模型的权重参数矩阵进行归一化处理;以及
根据归一化处理后的特征以及归一化处理后的权重参数矩阵,确定所述图像样本的类别。
3.根据权利要求2所述的方法,其中,所述图像分类模型的损失包括预测损失和权重损失,所述根据所述标签、所述分类结果以及所述权重参数矩阵,计算所述图像分类模型的损失包括:
根据所述标签和所述分类结果,计算所述预测损失;
根据所述归一化后的权重参数矩阵,计算所述权重损失。
4.根据权利要求3所述的方法,其中,所述权重参数矩阵包括多列权重参数向量,每列权重参数向量对应一个类别,所述计算所述权重损失包括:
计算所述多列权重参数向量之间的相关性;
根据归一化后的多列权重参数向量之间的相关性,确定所述权重损失。
6.根据权利要求5所述的方法,其中,所述Wmask为对角线元素全为0,且其他元素全为1的方阵。
7.一种图像分类方法,包括:
获取待分类对象;
使用图像分类模型对所述待分类对象进行分类,得到所述待分类对象的类别;
其中,所述图像分类模型是利用根据权利要求1至6中任一项所述的方法训练的。
8.一种图像分类模型的训练装置,包括:
提取模块,用于提取图像样本的特征,所述图像样本具有表示类别的标签;
确定模块,用于根据所述图像样本的特征以及所述图像分类模型的权重参数矩阵,确定所述图像样本的类别,作为分类结果;
计算模块,用于根据所述标签、所述分类结果以及所述权重参数矩阵,计算所述图像分类模型的损失;
调整模块,用于根据所述损失调整所述图像分类模型的权重参数矩阵。
9.根据权利要求8所述的装置,其中,所述确定模块包括:
特征归一化子模块,用于对所述图像样本的特征进行归一化处理;
权重归一化子模块,对所述图像分类模型的权重参数矩阵进行归一化处理;以及
确定子模块,根据归一化处理后的特征以及归一化处理后的权重参数矩阵,确定所述图像样本的类别。
10.根据权利要求9所述的装置,其中,所述图像分类模型的损失包括预测损失和权重损失,所述计算模块包括:
预测损失计算子模块,用于根据所述标签和所述分类结果,计算所述预测损失;
权重损失计算子模块,用于根据所述归一化后的权重参数矩阵,计算所述权重损失。
11.根据权利要求10所述的装置,其中,所述权重参数矩阵包括多列权重参数向量,每列权重参数向量对应一个类别,所述权重损失计算子模块包括:
相关性计算单元,用于计算所述多列权重参数向量之间的相关性;
权重损失计算单元,根据归一化后的多列权重参数向量之间的相关性,确定所述权重损失。
13.根据权利要求12所述的装置,其中,所述Wmask为对角线元素全为0,且其他元素全为1的方阵。
14.一种图像分类装置,包括:
获取模块,用于获取待分类对象。
分类模块,用于使用图像分类模型对所述待分类对象进行分类,得到所述待分类对象的类别;其中,所述图像分类模型是利用根据权利要求8至13任一项所述的图像分类模型的训练装置训练的。
15.一种电子设备,包括:
至少一个处理器;以及
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行权利要求1至7中任一项所述的方法。
16.一种存储有计算机指令的非瞬时计算机可读存储介质,其中,所述计算机指令用于使所述计算机执行根据权利要求1至7中任一项所述的方法。
17.一种计算机程序产品,包括计算机程序,所述计算机程序在被处理器执行时实现根据权利要求1至7中任一项所述的方法。
18.一种路侧设备,包括如权利要求15所述的电子设备。
19.一种云控平台,包括如权利要求15所述的电子设备。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110740219.5A CN113469249B (zh) | 2021-06-30 | 2021-06-30 | 图像分类模型训练方法、分类方法、路侧设备和云控平台 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110740219.5A CN113469249B (zh) | 2021-06-30 | 2021-06-30 | 图像分类模型训练方法、分类方法、路侧设备和云控平台 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113469249A true CN113469249A (zh) | 2021-10-01 |
CN113469249B CN113469249B (zh) | 2024-04-09 |
Family
ID=77876717
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110740219.5A Active CN113469249B (zh) | 2021-06-30 | 2021-06-30 | 图像分类模型训练方法、分类方法、路侧设备和云控平台 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113469249B (zh) |
Citations (18)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109447146A (zh) * | 2018-10-24 | 2019-03-08 | 厦门美图之家科技有限公司 | 分类优化方法及装置 |
WO2019100724A1 (zh) * | 2017-11-24 | 2019-05-31 | 华为技术有限公司 | 训练多标签分类模型的方法和装置 |
KR101953752B1 (ko) * | 2018-05-31 | 2019-06-17 | 주식회사 뷰노 | 심층 신경망을 이용하여 영상의 분류 및 국소화를 수행하는 방법 및 이를 이용한 장치 |
US20200143248A1 (en) * | 2017-07-12 | 2020-05-07 | Tencent Technology (Shenzhen) Company Limited | Machine learning model training method and device, and expression image classification method and device |
CN111242199A (zh) * | 2020-01-07 | 2020-06-05 | 中国科学院苏州纳米技术与纳米仿生研究所 | 图像分类模型的训练方法及分类方法 |
CN111353542A (zh) * | 2020-03-03 | 2020-06-30 | 腾讯科技(深圳)有限公司 | 图像分类模型的训练方法、装置、计算机设备和存储介质 |
US20200250491A1 (en) * | 2017-11-01 | 2020-08-06 | Tencent Technology (Shenzhen) Company Limited | Image classification method, computer device, and computer-readable storage medium |
WO2020221278A1 (zh) * | 2019-04-29 | 2020-11-05 | 北京金山云网络技术有限公司 | 视频分类方法及其模型的训练方法、装置和电子设备 |
US20200364502A1 (en) * | 2018-05-29 | 2020-11-19 | Tencent Technology (Shenzhen) Company Limited | Model training method, storage medium, and computer device |
JP2020533700A (ja) * | 2017-09-29 | 2020-11-19 | 日本電気株式会社 | 回帰装置、回帰方法、及びプログラム |
CN112149705A (zh) * | 2019-06-28 | 2020-12-29 | 京东数字科技控股有限公司 | 分类模型的训练方法、系统、计算机设备及存储介质 |
US20210012154A1 (en) * | 2019-01-15 | 2021-01-14 | Beijing Sensetime Technology Development Co., Ltd. | Network optimization method and apparatus, image processing method and apparatus, and storage medium |
CN112287993A (zh) * | 2020-10-26 | 2021-01-29 | 推想医疗科技股份有限公司 | 模型生成方法、图像分类方法、装置、电子设备及介质 |
CN112651468A (zh) * | 2021-01-18 | 2021-04-13 | 佛山职业技术学院 | 一种多尺度轻量化图像分类方法及其存储介质 |
CN112651453A (zh) * | 2020-12-30 | 2021-04-13 | 北京百度网讯科技有限公司 | 损失函数的自适应方法、装置、设备和存储介质 |
CN112733710A (zh) * | 2021-01-08 | 2021-04-30 | 徐州展皎信息技术服务有限公司 | 用于灌溉装置的灌溉水压控制的神经网络的训练方法 |
CN112801164A (zh) * | 2021-01-22 | 2021-05-14 | 北京百度网讯科技有限公司 | 目标检测模型的训练方法、装置、设备及存储介质 |
CN112906502A (zh) * | 2021-01-29 | 2021-06-04 | 北京百度网讯科技有限公司 | 目标检测模型的训练方法、装置、设备以及存储介质 |
-
2021
- 2021-06-30 CN CN202110740219.5A patent/CN113469249B/zh active Active
Patent Citations (18)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20200143248A1 (en) * | 2017-07-12 | 2020-05-07 | Tencent Technology (Shenzhen) Company Limited | Machine learning model training method and device, and expression image classification method and device |
JP2020533700A (ja) * | 2017-09-29 | 2020-11-19 | 日本電気株式会社 | 回帰装置、回帰方法、及びプログラム |
US20200250491A1 (en) * | 2017-11-01 | 2020-08-06 | Tencent Technology (Shenzhen) Company Limited | Image classification method, computer device, and computer-readable storage medium |
WO2019100724A1 (zh) * | 2017-11-24 | 2019-05-31 | 华为技术有限公司 | 训练多标签分类模型的方法和装置 |
US20200364502A1 (en) * | 2018-05-29 | 2020-11-19 | Tencent Technology (Shenzhen) Company Limited | Model training method, storage medium, and computer device |
KR101953752B1 (ko) * | 2018-05-31 | 2019-06-17 | 주식회사 뷰노 | 심층 신경망을 이용하여 영상의 분류 및 국소화를 수행하는 방법 및 이를 이용한 장치 |
CN109447146A (zh) * | 2018-10-24 | 2019-03-08 | 厦门美图之家科技有限公司 | 分类优化方法及装置 |
US20210012154A1 (en) * | 2019-01-15 | 2021-01-14 | Beijing Sensetime Technology Development Co., Ltd. | Network optimization method and apparatus, image processing method and apparatus, and storage medium |
WO2020221278A1 (zh) * | 2019-04-29 | 2020-11-05 | 北京金山云网络技术有限公司 | 视频分类方法及其模型的训练方法、装置和电子设备 |
CN112149705A (zh) * | 2019-06-28 | 2020-12-29 | 京东数字科技控股有限公司 | 分类模型的训练方法、系统、计算机设备及存储介质 |
CN111242199A (zh) * | 2020-01-07 | 2020-06-05 | 中国科学院苏州纳米技术与纳米仿生研究所 | 图像分类模型的训练方法及分类方法 |
CN111353542A (zh) * | 2020-03-03 | 2020-06-30 | 腾讯科技(深圳)有限公司 | 图像分类模型的训练方法、装置、计算机设备和存储介质 |
CN112287993A (zh) * | 2020-10-26 | 2021-01-29 | 推想医疗科技股份有限公司 | 模型生成方法、图像分类方法、装置、电子设备及介质 |
CN112651453A (zh) * | 2020-12-30 | 2021-04-13 | 北京百度网讯科技有限公司 | 损失函数的自适应方法、装置、设备和存储介质 |
CN112733710A (zh) * | 2021-01-08 | 2021-04-30 | 徐州展皎信息技术服务有限公司 | 用于灌溉装置的灌溉水压控制的神经网络的训练方法 |
CN112651468A (zh) * | 2021-01-18 | 2021-04-13 | 佛山职业技术学院 | 一种多尺度轻量化图像分类方法及其存储介质 |
CN112801164A (zh) * | 2021-01-22 | 2021-05-14 | 北京百度网讯科技有限公司 | 目标检测模型的训练方法、装置、设备及存储介质 |
CN112906502A (zh) * | 2021-01-29 | 2021-06-04 | 北京百度网讯科技有限公司 | 目标检测模型的训练方法、装置、设备以及存储介质 |
Non-Patent Citations (2)
Title |
---|
XIANGMO ZHAO 等: "Neural Network Training With Homomorphic Encryption", 《ARXIV:2012.13552V1 [CS.CR]》, pages 1 - 13 * |
王雨滢;赵庆生;梁定康;: "基于深度学习网络的电气设备图像分类", 科学技术与工程, no. 23, pages 242 - 247 * |
Also Published As
Publication number | Publication date |
---|---|
CN113469249B (zh) | 2024-04-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110084216B (zh) | 人脸识别模型训练和人脸识别方法、系统、设备及介质 | |
CN108304775B (zh) | 遥感图像识别方法、装置、存储介质以及电子设备 | |
EP3940591A1 (en) | Image generating method, neural network compression method, and related apparatus and device | |
CN113657390B (zh) | 文本检测模型的训练方法和检测文本方法、装置和设备 | |
CN113837308B (zh) | 基于知识蒸馏的模型训练方法、装置、电子设备 | |
CN113742483A (zh) | 文档分类的方法、装置、电子设备和存储介质 | |
CN111488985A (zh) | 深度神经网络模型压缩训练方法、装置、设备、介质 | |
CN112990219A (zh) | 用于图像语义分割的方法和装置 | |
CN114494784A (zh) | 深度学习模型的训练方法、图像处理方法和对象识别方法 | |
CN113902010A (zh) | 分类模型的训练方法和图像分类方法、装置、设备和介质 | |
CN113469025A (zh) | 应用于车路协同的目标检测方法、装置、路侧设备和车辆 | |
CN115393690A (zh) | 一种轻量化神经网络的空对地观测多目标识别方法 | |
EP4123595A2 (en) | Method and apparatus of rectifying text image, training method and apparatus, electronic device, and medium | |
EP4343616A1 (en) | Image classification method, model training method, device, storage medium, and computer program | |
CN114529750A (zh) | 图像分类方法、装置、设备及存储介质 | |
CN114913339A (zh) | 特征图提取模型的训练方法和装置 | |
CN113947700A (zh) | 模型确定方法、装置、电子设备和存储器 | |
CN115909336A (zh) | 文本识别方法、装置、计算机设备和计算机可读存储介质 | |
CN115273148B (zh) | 行人重识别模型训练方法、装置、电子设备及存储介质 | |
CN113642654B (zh) | 图像特征的融合方法、装置、电子设备和存储介质 | |
CN115841596A (zh) | 多标签图像分类方法及其模型的训练方法、装置 | |
CN113469249B (zh) | 图像分类模型训练方法、分类方法、路侧设备和云控平台 | |
CN114707638A (zh) | 模型训练、对象识别方法及装置、设备、介质和产品 | |
CN114821190A (zh) | 图像分类模型训练方法、图像分类方法、装置及设备 | |
CN114049684A (zh) | 一种人体坐姿识别方法、装置、电子设备和存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |