CN113420792A

CN113420792A - 图像模型的训练方法、电子设备、路侧设备及云控平台

Info

Publication number: CN113420792A
Application number: CN202110621450.2A
Authority: CN
Inventors: 夏春龙
Original assignee: Apollo Zhilian Beijing Technology Co Ltd
Current assignee: Apollo Zhilian Beijing Technology Co Ltd
Priority date: 2021-06-03
Filing date: 2021-06-03
Publication date: 2021-09-21

Abstract

本申请公开了一种图像模型的训练方法、装置和电子设备，涉及智能交通、深度学习等人工智能领域。具体实现方案为在图像模型每次训练开始前，获取每个类别的采样比例系数；基于采样比例系数，从每个类别的候选图像样本中采样出训练图像样本；基于每个类别采样的训练图像样本对图像模型进行训练，并获取每个类别的损失信息，其中损失信息用于下一次训练时获取采样比例系数；响应于训练出的图像模型收敛停止训练，生成目标图像模型。本申请实施例的训练方法，能够实现图像模型在训练的过程中可根据各类别的训练情况自适应的动态调整候选图像样本的采样比例，使得各类别可以较为均衡的得到训练，进而得到优质的图像模型。

Description

图像模型的训练方法、电子设备、路侧设备及云控平台

技术领域

本申请涉及人工智能领域，具体涉及智能交通领域、深度学习领域。

背景技术

深度学习是一种数据驱动的方法，而数据质量的好坏直接决定了深度学习方法的上限，目前，提升深度学习算法的性能有两种方式：一方面不断的收集和标注数据；另一方面不断优化图像模型。

类别不平衡是目前大多数深度学习任务所面临的一个问题，该问题会导致深度学习算法的性能往往会偏向于样本数量多的类别，而样本数量少的类别因为没有足够多的样本而得不到有效的学习。

发明内容

本申请提供了一种图像模型的训练方法、电子设备、路侧设备及云控平台。

根据本申请的一方面，提供了一种图像模型的训练方法，包括：

在图像模型每次训练开始前，获取每个类别的采样比例系数；

基于所述采样比例系数，从每个类别的候选图像样本中采样出训练图像样本；

基于每个类别采样的所述训练图像样本对所述图像模型进行训练，并获取每个类别的损失信息，其中所述损失信息用于下一次训练时获取所述采样比例系数；

响应于训练出的图像模型收敛停止训练，生成目标图像模型。

根据本申请的另一方面，提供了一种图像模型的训练装置，包括：

第一获取模块，用于在图像模型每次训练开始前，获取每个类别的采样比例系数；

采样模块，用于基于所述采样比例系数，从每个类别的候选图像样本中采样出训练图像样本；

第二获取模块，用于基于每个类别采样的所述训练图像样本对所述图像模型进行训练，并获取每个类别的损失信息，其中所述损失信息用于下一次训练时获取所述采样比例系数；

图像模型生成模块，用于响应于训练出的图像模型收敛停止训练，生成目标图像模型。

根据本申请的另一方面，提供了一种电子设备，包括：

至少一个处理器；以及

与所述至少一个处理器通信连接的存储器；其中，

所述存储器存储有可被所述至少一个处理器执行的指令，所述指令被所述至少一个处理器执行，以使所述至少一个处理器能够执行如上述一方面实施例所述的图像模型的训练方法。

根据本申请的另一方面，提供了一种存储有计算机指令的非瞬时计算机可读存储介质，其中，所述计算机指令用于使所述计算机执行如上述一方面实施例所述的图像模型的训练方法。

根据本申请的另一方面，提供了一种计算机程序产品，包括计算机程序，所述计算机程序在被处理器执行时实现如上述一方面实施例所述的图像模型的训练方法。

根据本申请的另一个方面，提供了一种路侧设备，包括上述一方面实施例所述的电子设备。

根据本申请的另一个方面，提供了一种云控平台，包括上述一方面实施例所诉的电子设备。

应当理解，本部分所描述的内容并非旨在标识本申请的实施例的关键或重要特征，也不用于限制本申请的范围。本申请的其它特征将通过以下的说明书而变得容易理解。

附图说明

附图用于更好地理解本方案，不构成对本申请的限定。其中：

图1是根据本申请实施例提供的一种图像模型训练的方法流程示意图；

图2是根据本申请实施例提供的另一种图像模型的训练方法方框示意图；

图3是根据本申请实施例提供的另一种图像模型训练的方法流程示意图；

图4是根据本申请实施例提供的另一种图像模型训练的方法流程示意图；

图5是根据本申请实施例提供的另一种图像模型训练的方法流程示意图；

图6是根据本申请实施例提供的另一种图像模型训练的方法流程示意图；

图7是根据本申请实施例提供的另一种图像模型训练的方法流程示意图；

图8是根据本申请实施例提供的另一种图像模型训练的方法流程示意图；

图9是根据本申请实施例提供的另一种图像模型的训练方法方框示意图；

图10是根据本申请实施例提供的另一种图像模型训练的方法流程示意图；

图11是根据本申请实施例提供的另一种图像模型训练的方法流程示意图；

图12是根据本申请实施例提供的一种图像模型的训练装置的结构示意图；以及

图13是根据本申请实施例的图像模型的训练方法的电子设备的框图。

具体实施方式

以下结合附图对本申请的示范性实施例做出说明，其中包括本申请实施例的各种细节以助于理解，应当将它们认为仅仅是示范性的。因此，本领域普通技术人员应当认识到，可以对这里描述的实施例做出各种改变和修改，而不会背离本申请的范围和精神。同样，为了清楚和简明，以下的描述中省略了对公知功能和结构的描述。

下面参考附图描述本申请实施例的图像模型训练方法、电子设备及存储介质、路侧设备及云控平台。人工智能(Artificial Intelligence，简称AI)，是研究使计算机来模拟人生的某些思维过程和智能行为(如学习、推理、思考、规划等)的学科，既有硬件层面的技术，也有软件层面的技术。人工智能硬件技术一般包括计算机视觉技术、语音识别技术、自然语言处理技术以及及其学习/深度学习、大数据处理技术、知识图谱技术等几大方面。

智能交通系统(Intelligent Traffic System，简称ITS)又称智能运输系统(Intelligent Transportation System)，是将先进的科学技术(信息技术、计算机技术、数据通信技术、传感器技术、电子控制技术、自动控制理论、运筹学、人工智能等)有效地综合运用于交通运输、服务控制和车辆制造，加强车辆、道路、使用者三者之间的联系，从而形成一种保障安全、提高效率、改善环境、节约能源的综合运输系统。

深度学习是机器学习领域中一个新的研究方向。深度学习是学习样本数据的内在规律和表示层次，这些学习过程中获得的信息对诸如文字，图像和声音等数据的解释有很大的帮助。它的最终目标是让机器能够像人一样具有分析学习能力，能够识别文字、图像和声音等数据。深度学习是一个复杂的机器学习算法，在语音和图像识别方面取得的效果，远远超过先前相关技术。

本申请实施例提供的图像模型的训练方法，可以由电子设备来执行，该电子设备可为PC(Personal Computer，个人计算机)电脑、平板电脑或掌上电脑等，此处不做任何限定。

在本申请实施例中，电子设备中可以设置有处理组件、存储组件和驱动组件。可选的，该驱动组件和处理组件可以集成设置，该存储组件可以存储操作系统、应用程序或其他程序模块，该处理组件通过执行存储组件中存储的应用程序来实现本申请实施例提供的图像模型的训练方法。

图1是根据本申请第一实施例提供的一种图像模型的训练方法的流程示意图。

本申请实施例的图像模型的训练方法，还可由本申请实施例提供的图像模型的训练装置执行，该装置可配置于电子设备中，以实现图像模型在训练的过程中可根据各类别的训练情况自适应的动态调整候选图像样本的采样比例，使得各类别可以较为均衡的得到训练，进而得到优质的图像模型。

作为一种可能的情况，本申请实施例的图像模型的训练方法还可以在服务器端执行，服务器可以为云服务器，可以在云服务器执行该图像模型的训练方法。

如图1所示，该图像模型的训练方法，可包括：

步骤101，在图像模型每次训练开始前，获取每个类别的采样比例系数。

在本申请实施例中，图像模型可为两分类图像模型或多分类图像模型，以多分类图像模型为例，每个类别都有各自对应的候选图像样本，例如，类别1对应候选图像样本A，类别2对应候选图像样本B，……，类别N对应候选图像样本N，其中，每个候选图像样本集中都有多个候选图像样本。

其中，参见图2，在深度学习的过程中图像模型需进行多次训练，并在每次训练前获取每个类别的采样比例系数w₁，w₂，……，w_N，用于对候选图像样本进行采样。

步骤102，基于采样比例系数，从每个类别的候选图像样本中采样出训练图像样本。

在本申请实施例中，图像模型在多次训练(迭代)过程中，采样比例系数动态调整，也就是说，图像模型任意两次训练所使用的采样比例系数可能会不同。图像模型每次训练可获取当次训练的每个类别的采样比例系数，进一步地基于每个类别的采样比例系数，从该类别的候选图像样本中采样到当次训练的该类别对应的训练图像样本。

举例而言，类别1的采样比例系数为w₁，类别2的采样比例系数为w₂，……，类别N的采样比例系数为w_N，候选图像样本可根据各自类别的采样比例系数进行采样，得到训练图像样本。

步骤103，基于每个类别采样的训练图像样本对所述图像模型进行训练，并获取每个类别的损失信息，其中所述损失信息用于下一次训练时获取所述采样比例系数。

在本申请实施例中，参见图2，在获取上述训练图像样本后将其输入至图像模型中进行训练，然后获取每个类别的损失信息。其中，当次图像模型训练所获取的每个类别的损失信息可用于下一次图像模型训练时获取采样比例系数，即，下一次图像模型训练时获取的采样比例系数可根据上一次图像模型训练的损失信息确定。

步骤104，响应于训练出的图像模型收敛停止训练，生成目标图像模型。

在本申请实施例中，采样比例系数由损失信息的变化动态调整，在图像模型进行多次训练后，即，在整个迭代的过程中，图像模型训练后输出的结果会逐渐稳定在一个设定值附近或者训练后的误差持续小于设定值，即，训练出的图像模型逐渐收敛，并在收敛后停止训练，生成目标图像模型，该目标图像模型为收敛后的图像模型。

在本申请实施例中，在图像模型每次训练开始前，获取每个类别的采样比例系数，并基于采样比例系数，从每个类别的候选图像样本中采样出训练图像样本，然后基于每个类别采样的训练图像样本对图像模型进行训练，并获取每个类别的损失信息，其中损失信息用于下一次训练时获取采样比例系数，最后响应于训练出的图像模型收敛停止训练，生成目标图像模型。由此，能够实现图像模型在训练的过程中可根据各类别的训练情况自适应的动态调整候选图像样本的采样比例，使得各类别可以较为均衡的得到训练，进而得到优质的图像模型。

在上述实施例的基础之前，在图像模型首次训练时，图像模型并未出现损失信息，因此每个类别的采样比例系数需要基于样本数量进行初始化，在本申请的一个实施例中，如图3所示，针对首次图像模型训练过程中，获取每个类别的采样比例系数，可包括：

步骤301，针对首次训练，获取每个类别的样本数量和总样本数量；

在本申请实施例中，在图像模型首次训练的过程中，可对每个类别的候选图像样本的样本数量进行统计，并基于统计到的每个类别的样本数量进行加和，得到图像模型对应的总样本数量。进一步地，将其数据存储于电子设备的存储空间中。

步骤302，基于样本数量和所述总样本数量，确定每个类别的初始采样比例系数。

在本申请的实施例中，可通过获取的每个类别的样本数量和总样本数量得到总样本数量与每个类别的样本数量的比值，并对该比值做归一化处理得到每个类别的初始采样比例系数。其中，该初始采样比例系数可作为图像模型进行首次训练的采样比例系数。由此，可为图像模型首次训练的候选图像样本提供采样比例参数数据。

需要说明的是，该实施例中所描述的归一化方法可包括最值归一化和均值方差归一化等方法，此处不做任何限定。

在本申请的一个实施例中，如图4所示，基于样本数量和总样本数量，确定每个类别的初始采样比例系数，可包括：

步骤401，确定总样本数量与每个类别的样本数量的第一比值。

在本申请实施例中，在统计得到总样本数量和每个类别的样本数量之后，可通过下述公式(1)计算得到总样本数量与每个类别的样本数量的第一比值。

其中，N为样本总个数，n_i为第i类样本的个数，p_i为总样本数与第i类样本数的比值。

步骤402，将所有类别的第一比值进行求和。

将每个类别的第一比值累加求和，得到所有类别的第一比值的和值。

步骤403，针对每个类别，获取类别的第一比值与第一比值的和值的第二比值，并将第二比值作为类别的初始采样比例系数。

在本申请实施例中，在得到第一比值和第一比值的和值后，可通过下述公式(2)计算得到第二比值，其中，第二比值可作为类别的初始采样比例系数。由此，可为图像模型首次训练的候选图像样本提供采样比例参数数据。

其中，w_i为第i类样本的初始采样比例系数，K为候选图像样本总的类别数。

在上述实施例的基础之前，在图像模型进行非首次训练时，图像模型出现了损失信息，因此每个类别的采样比例系数需要根据损失信息动态调整，在本申请的一个实施例中，如图5所示，获取每个类别的采样比例系数，还可包括：

步骤501，针对非首次训练，获取上一次训练时每个类别中每个训练图像样本的损失信息；

在本申请实施例中，图像模型首次训练的训练图像样本的采样比例系数可由每个类别的样本数量和总样本的数量的确定，而对于图像模型的非首次训练，训练图像样本的采样比例系数会在图像模型多次训练的过程中动态调整，为获取当次训练的采样比例系数，需获取上一次训练时每个类别中每个训练图像样本的损失信息。

步骤502，针对每个类别，根据所述训练图像样本的损失信息，确定类别的损失下降速率；

在本申请实施例中，可通过图像模型当次的训练图像样本的损失信息与图像模型上一次的训练图像样本的损失信息的比值得到类别的损失下降速率。

步骤503，根据每个类别的损失下降速率，确定当次训练时每个类别的采样比例系数。

在本申请实施例中，在图像模型多次训练的过程中，每次训练的训练图像样本的损失信息都会下降，即，损失下降速率减小，直至收敛。在整个迭代的过程中，可根据每个类别的损失下降速率，确定当次训练时每个类别的采样比例系数。

由此，可为图像模型的非首次训练的候选图像样本提供采样参数数据。

为了清楚说明上一实施例，在本申请的一个实施例中，如图6所示，根据类别的损失信息，确定类别的损失下降速率，可包括：

步骤601，根据类别中每个训练图像样本的损失信息，确定类别的平均损失信息；

在本申请实施例中，可将类别中每个训练图像样本的损失信息求平均值，以得到类别的平均损失信息，该类别的平均损失信息用于计算得到类别的损失下降速率。

步骤602，基于类别当次训练的每个平均损失信息和上一次训练的平均损失信息，确定类别的损失下降速率。

在本申请实施例中，在得到类别的平均损失信息后可通过下述公式(3)计算得到类别的损失下降速率，该类别的损失下降速率可表明图像模型多次训练的收敛情况。由此，可为采样比例系数的动态调整提供每次变化的参数信息。

其中，

为t时刻的第i类样本的损失下降速率，

为图像模型当次训练的平均损失信息，

为图像模型上一次训练的平均损失信息。

在本申请的一个实施例中，根据每个类别的损失下降速率，确定当次训练时每个类别的采样比例系数，可包括：

步骤701，基于当次训练的平均损失信息，确定第一参数；

步骤702，将所有类别的第一参数进行求和；

步骤703，针对每个类别，获取类别的第一参数与第一参数的和值的第三比值，并将第三比值作为类别的采样比例系数。

在本申请实施例中，根据每个类别的损失下降速率，可通过下述公式(4)计算得到当次训练时每个类别的采样比例系数。

其中，

为t时刻的第i类样本的采样比例系数，

为t时刻的第i类样本的损失下降速率，K为总的类别数，T为设定值，该设定值的作用为保证迭代初期时每个类别尽可能的以相似的概率进行采样。

具体地，在获取当次训练的平均损失信息后，确定第一参数，并将所有类别的第一参数进行求和，然后通过上述公式(4)计算得到第一参数与第一参数的和值的第三比值，并将第三比值作为每个类别的采样比例系数。

由此，图像模型在训练的过程中可根据损失下降速率动态调整不同类别的采样比例系数，平衡各个类别的采样数量，使得各个类别得到均衡的训练。

上述实施例中的训练图像样本可能会存在某个类别的样本数量(数据量)较少的情况，使得各类别得不到均衡的训练，从而影响图像模型的训练效果。因此，在训练图像样本输入图像模型之前需对其数据做数据增强处理，在本申请的一个实施例中，如图8所示，基于每个类别的提取的训练图像样本对图像模型进行之前，还可包括：

步骤801，从多个数据增强策略中选取目标数据增强策略；

在本申请实施例中，对于图像处理，数据增强策略包括尺度缩放、旋转和随机裁剪等，可从上述数据增强策略中选取相应的目标增强策略。

需要说明的是，该实施例中所描述的目标数据增强策略可为多个，此处不做任何限定。

步骤802，基于所述目标数据增强策略，对所述训练图像样本进行数据增强处理。

在本申请实施例中，参见图9，在训练图像样本输入图像模型之前可通过上述的目标数据增强策略对训练图像样本进行数据增强处理，使得样本数量较少的类别的有限数据产生等价于更多数据的价值。

举例而言，可将训练图像样本中的一张图片作随机剪裁、旋转操作得到9张图片，该9张图片加上原图便将数据扩充到原来的10倍。进一步地，假如输入网络的图片的分辨率大小为256×256，若采用随机裁剪成分辨率大小为224×224的方式，则一张图片最多可以产生32×32张不同的图片，数据量扩充将近1000倍。

为了清楚说明上一实施例，在本申请的一个实施例中，如图10所示，从多个数据增强策略中选取目标数据增强策略，可包括：

步骤1001，生成随机数，并基于随机数生成选取概率。

在本申请实施例中，电子设备可生成一个随机数(0到1之间)，并基于随机数生成一个选取概率，用于从多个数据增强策略中选取目标增强策略。

步骤1002，根据选取概率，从多个数据增强策略中选取目标增强策略。

在本申请实施例中，每种数据增强策略可设置一个概率区间预存在电子设备中，当电子设备生成的选取概率在某个数据增强策略的概率区间内时，选取该数据增强策略为目标数据增强策略。由此，能够为数据增强处理选取合适的增强策略。

举例而言，包括A、B、C三个数据增强策略，若A策略预设的概率区间为(0～0.3)，B策略的概率区间为(0.3～0.6)，C策略的概率区间为(0.6～1)则当电子设备生成的选取概率为0.35时，由于随机数落在(0.3～0.6)之间，则会选取B策略为目标数据增强策略。

进一步地，在本申请实施例中，参见图9，可将目标数据增强策略处理后的样本输入至图像模型中进行训练，由此使得各类别可以较为均衡的得到训练，而后生成较为优质的图像模型。

为了保证生成的目标图像模型为最优图像模型，可以通过测试样本，对训练过程中存储的中间图像模型和最后的目标图像模型进行测试，以便于选取出最优的图像模型。在本申请的一个实施例中，如图11所示，上述图像模型的训练方法还可包括：

步骤1101，将每次训练出的满足图像模型保存条件的候选图像模型进行保存。

在本申请实施例中，在图像模型进行多次训练的过程中，可等间隔的保存多个候选图像模型，也可保存最后一次的迭代候选图像模型，还可保存损失信息最小的迭代候选图像模型，其保存条件可根据实际需求选择，此处不做任何限定。

其中，可将保存的候选图像模型存储于电子设备的存储空间中，以便于后续对保存的图像模型进行测试时调取。

步骤1102，基于测试样本对候选图像模型和目标图像模型进行测试，从中选取测试结果最优的图像模型，作为最终的训练后图像模型。

在本申请实施例中，将测试样本依次输入至候选图像模型和目标图像模型中进行测试，得到测试结果，并根据测试结果从候选图像模型和目标图像模型中选取测试结果最优的图像模型，作为最终的训练后的图像模型。由此，图像模型可在进行多次训练后生成一个最优的图像模型。

其中，测试结果为对图像模型的预测结果，用于与图像模型的真值做比较，可将预测结果与图像模型的相似度(拟合度)作为判断图像模型优劣的标准。

举例而言，若图像模型1的拟合度为85％，图像模型2的拟合度为90％，则图像模型2要优于图像模型1。可通过对所有候选图像模型和目标图像模型的拟合度的比较选择出最优的图像模型，作为多次训练后的最终图像模型，即，最优图像模型。

需要说明的是，该实施例中所描述的图像模型优劣的判断标准可根据实际需要设定，此处不做任何限定。

图12是本申请实施例提供的一种图像模型的训练装置的方框示意图。

本申请实施例的图像模型的训练装置，可配置于电子设备中，以实现在图像模型每次训练开始前，获取每个类别的采样比例系数，并基于采样比例系数，从每个类别的候选图像样本中采样出训练图像样本，然后基于每个类别采样的训练图像样本对图像模型进行训练，并获取每个类别的损失信息，其中损失信息用于下一次训练时获取采样比例系数，最后响应于训练出的图像模型收敛停止训练，生成目标图像模型，从而实现图像模型在训练的过程中可根据各类别的训练情况自适应的动态调整候选图像样本的采样比例，使得各类别可以较为均衡的得到训练，进而得到优质的图像模型。

如图12所示，该图像模型的训练装置1200可包括：第一获取模块1210，采样模块1220，第二获取模块1230，图像模型生成模块1240。

其中，第一获取模块1210用于在图像模型每次训练开始前，获取每个类别的采样比例系数。

其中，参见图2，在深度学习的过程中图像模型需进行多次训练，并在每次训练前通过第一获取模块1210获取每个类别的采样比例系数w₁，w₂，……，w_N，用于对候选图像样本进行采样。

采样模块1220用于基于采样比例系数，从每个类别的候选图像样本中采样出训练图像样本。

在本申请实施例中，图像模型在多次训练(迭代)过程中，采样比例系数动态调整，也就是说，图像模型任意两次训练所使用的采样比例系数可能会不同。图像模型每次训练可通过采样模块1220获取当次训练的每个类别的采样比例系数，进一步地基于每个类别的采样比例系数，从该类别的候选图像样本中采样到当次训练的该类别对应的训练图像样本。

第二获取模块1230用于基于每个类别采样的训练图像样本对图像模型进行训练，并获取每个类别的损失信息，其中损失信息用于下一次训练时获取采样比例系数。

在本申请实施例中，参见图2，在获取上述训练图像样本后将其输入至图像模型中进行训练，然后通过第二获取模块1230获取每个类别的损失信息。其中，当次图像模型训练所获取的每个类别的损失信息可用于下一次图像模型训练时获取采样比例系数，即，下一次图像模型训练时获取的采样比例系数可根据上一次图像模型训练的损失信息确定。

图像模型生成模块1240用于响应于训练出的图像模型收敛停止训练，生成目标图像模型。

在本申请实施例中，采样比例系数由损失信息的变化动态调整，在图像模型进行多次训练后，即，在整个迭代的过程中，图像模型训练后输出的结果会逐渐稳定在一个设定值附近或者训练后的误差持续小于设定值，即，训练出的图像模型逐渐收敛，并在收敛后停止训练，然后通过图像模型生成模块1240生成目标图像模型，该目标图像模型为收敛后的图像模型。

在本申请实施例中，首先在图像模型每次训练开始前，通过第一获取模块获取每个类别的采样比例系数，并基于采样比例系数，通过采样模块从每个类别的候选图像样本中采样出训练图像样本，然后基于每个类别采样的训练图像样本对图像模型进行训练，并通过第二获取模块获取每个类别的损失信息，其中损失信息用于下一次训练时获取采样比例系数，最后图像模型生成模块响应于训练出的图像模型收敛停止训练，生成目标图像模型，从而实现图像模型在训练的过程中可根据各类别的训练情况自适应的动态调整候选图像样本的采样比例，使得各类别可以较为均衡的得到训练，进而得到优质的图像模型。

在本申请的一个实施例中，第一获取模块1210，进一步用于：

针对首次训练，获取每个类别的样本数量和总样本数量；

样本数量和总样本数量，确定每个类别的初始采样比例系数。

在本申请的一个实施例中，第一获取模块1210，进一步用于：

确定总样本数量与每个类别的样本数量的第一比值；

将所有类别的第一比值进行求和；

针对每个类别，获取类别的第一比值与第一比值的和值的第二比值，并将第二比值作为类别的初始采样比例系数。

在本申请的一个实施例中，第一获取模块1210，进一步用于：

针对非首次训练，获取上一次训练时每个类别中每个训练图像样本的损失信息；

针对每个类别，根据训练图像样本的损失信息，确定类别的损失下降速率；

根据每个类别的损失下降速率，确定当次训练时每个类别的采样比例系数。

在本申请的一个实施例中，第一获取模块1210，进一步用于：

根据类别中每个训练图像样本的损失信息，确定类别的平均损失信息；

基于类别当次训练的平均损失信息和上一次训练的平均损失信息，确定所述类别的损失下降速率。

在本申请的一个实施例中，第二获取模块1230，进一步用于：

基于当次训练的平均损失信息，确定第一参数；

将所有类别的第一参数进行求和；

针对每个类别，获取类别的第一参数与第一参数的和值的第三比值，并将第三比值作为类别的初始采样比例系数。

在申请的一个实施例中，图像模型的训练装置1210还包括：

数据增强模块1250，用于从多个数据增强策略中选取目标数据增强策略，并基于目标数据增强策略，对训练图像样本进行数据增强处理。

在本申请的一个实施例中，数据增强模块1250，进一步用于：

生成随机数，并基于所述随机数生成选取概率；

根据选取概率，从多个数据增强策略中选取目标数据增强策略。

在本申请的一个实施例中，图像模型的训练装置1210还包括：

保存模块1260，用于将每次训练出的满足图像模型保存条件的候选图像模型进行保存；

测试模块1270，基于测试样本对候选图像模型和所述目标图像模型进行测试，从中选取测试结果最优的图像模型，作为最终的训练后图像模型。

根据本申请的实施例，本申请还提供了一种电子设备、一种可读存储介质、一种路侧设备和一种云控平台。

图13示出了可以用来实施本申请的实施例的示例电子设备1300的示意性框图。电子设备旨在表示各种形式的数字计算机，诸如，膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备还可以表示各种形式的移动装置，诸如，个人数字处理、蜂窝电话、智能电话、可穿戴设备和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例，并且不意在限制本文中描述的和/或者要求的本申请的实现。

如图13所示，电子设备1300包括计算单元1301，其可以根据存储在只读存储器(Read-Only Memory，ROM)1302中的计算机程序或者从存储单元1308加载到随机访问存储器(Random Access Memory，RAM)1303中的计算机程序，来执行各种适当的动作和处理。在RAM 1303中，还可存储电子设备1300操作所需的各种程序和数据。计算单元1301、ROM 1302以及RAM1303通过总线1304彼此相连。输入/输出(Input/Output，I/O)接口1305也连接至总线1304。

电子设备1300中的多个部件连接至I/O接口1305，包括：输入单元1306，例如键盘、鼠标等；输出单元1307，例如各种类型的显示器、扬声器等；存储单元1308，例如磁盘、光盘等；以及通信单元1309，例如网卡、调制解调器、无线通信收发机等。通信单元1309允许电子设备1300通过诸如因特网的计算机网络和/或各种电信网络与其他设备交换信息/数据。

计算单元1301可以是各种具有处理和计算能力的通用和/或专用处理组件。计算单元1301的一些示例包括但不限于中央处理单元(Central Processing Unit，CPU)、图形处理单元(Graphic Processing Units，GPU)、各种专用的人工智能(ArtificialIntelligence，AI)计算芯片、各种运行机器学习图像模型算法的计算单元、数字信号处理器(Digital Signal Processor，DSP)、以及任何适当的处理器、控制器、微控制器等。计算单元1301执行上文所描述的各个方法和处理，例如图像模型的训练方法。例如，在一些实施例中，图像模型的训练方法可被实现为计算机软件程序，其被有形地包含于机器可读介质，例如存储单元1308。在一些实施例中，计算机程序的部分或者全部可以经由ROM 1202和/或通信单元1309而被载入和/或安装到电子设备1300上。当计算机程序加载到RAM1303并由计算单元1301执行时，可以执行上文描述的图像模型的训练方法的一个或多个步骤。备选地，在其他实施例中，计算单元1301可以通过其他任何适当的方式(例如，借助于固件)而被配置为执行图像模型的训练方法。

其中，路侧设备和云控平台包括上述的电子设备。

可选的，路侧设备除了包括电子设备，还可以包括通信部件等，电子设备可以和通信部件一体集成，也可以分体设置。电子设备可以获取感知设备(如路侧相机)的数据，例如图片和视频等，从而进行图像视频处理和数据计算。可选的，电子设备自身也可以具备感知数据获取功能和通信功能，例如是AI相机，电子设备可以直接基于获取的感知数据进行图像视频处理和数据计算。

可选的，云控平台在云端执行处理，云控平台包括的电子设备可以获取感知设备(如路侧相机)的数据，例如图片和视频等，从而进行图像视频处理和数据计算；云控平台也可以称为车路协同管理平台、边缘计算平台、云计算平台、中心系统、云端服务器等。

本文中以上描述的系统和技术的各种实施方式可以在数字电子电路系统、集成电路系统、现场可编程门阵列(Field Programmable Gate Array，FPGA)、专用集成电路(Application-Specific Integrated Circuit，ASIC)、专用标准产品(ApplicationSpecific Standard Product，ASSP)、芯片上系统的系统(System On Chip，SOC)、负载可编程逻辑设备(Complex Programmable Logic Device，CPLD)、计算机硬件、固件、软件、和/或它们的组合中实现。这些各种实施方式可以包括：实施在一个或者多个计算机程序中，该一个或者多个计算机程序可在包括至少一个可编程处理器的可编程系统上执行和/或解释，该可编程处理器可以是专用或者通用可编程处理器，可以从存储系统、至少一个输入装置、和至少一个输出装置接收数据和指令，并且将数据和指令传输至该存储系统、该至少一个输入装置、和该至少一个输出装置。

用于实施本申请的图像模型的训练方法的程序代码可以采用一个或多个编程语言的任何组合来编写。这些程序代码可以提供给通用计算机、专用计算机或其他可编程数据处理装置的处理器或控制器，使得程序代码当由处理器或控制器执行时使流程图和/或框图中所规定的功能/操作被实施。程序代码可以完全在机器上执行、部分地在机器上执行，作为独立软件包部分地在机器上执行且部分地在远程机器上执行或完全在远程机器或服务器上执行。

在本申请的上下文中，机器可读介质可以是有形的介质，其可以包含或存储以供指令执行系统、装置或设备使用或与指令执行系统、装置或设备结合地使用的程序。机器可读介质可以是机器可读信号介质或机器可读储存介质。机器可读介质可以包括但不限于电子的、磁性的、光学的、电磁的、红外的、或半导体系统、装置或设备，或者上述内容的任何合适组合。机器可读存储介质的更具体示例会包括基于一个或多个线的电气连接、便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦除可编程只读存储器(Electrically Programmable Read-Only-Memory，EPROM)或快闪存储器、光纤、便捷式紧凑盘只读存储器(Compact Disc Read-Only Memory，CD-ROM)、光学储存设备、磁储存设备、或上述内容的任何合适组合。

为了提供与用户的交互，可以在计算机上实施此处描述的系统和技术，该计算机具有：用于向用户显示信息的显示装置(例如，阴极射线管(Cathode-Ray Tube，CRT)或者液晶显示器(Liquid Crystal Display，LCD)监视器)；以及键盘和指向装置(例如，鼠标或者轨迹球)，用户可以通过该键盘和该指向装置来将输入提供给计算机。其它种类的装置还可以用于提供与用户的交互；例如，提供给用户的反馈可以是任何形式的传感反馈(例如，视觉反馈、听觉反馈、或者触觉反馈)；并且可以用任何形式(包括声输入、语音输入或者、触觉输入)来接收来自用户的输入。

可以将此处描述的系统和技术实施在包括后台部件的计算系统(例如，作为数据服务器)、或者包括中间件部件的计算系统(例如，应用服务器)、或者包括前端部件的计算系统(例如，具有图形用户界面或者网络浏览器的用户计算机，用户可以通过该图形用户界面或者该网络浏览器来与此处描述的系统和技术的实施方式交互)、或者包括这种后台部件、中间件部件、或者前端部件的任何组合的计算系统中。可以通过任何形式或者介质的数字数据通信(例如，通信网络)来将系统的部件相互连接。通信网络的示例包括：局域网(Local Area Network，LAN)、广域网(Wide Area Network，WAN)、互联网和区块链网络。

计算机系统可以包括客户端和服务器。客户端和服务器一般远离彼此并且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端-服务器关系的计算机程序来产生客户端和服务器的关系。服务器可以是云服务器，又称为云计算服务器或云主机，是云计算服务体系中的一项主机产品，以解决了传统物理主机与VPS服务(VirtualPrivate Server，虚拟专用服务器)中，存在的管理难度大，业务扩展性弱的缺陷。服务器也可以为分布式系统的服务器，或者是结合了区块链的服务器。

为了实现上述实施例，本申请还提供了一种计算机程序产品，包括计算机程序，所述计算机程序在被处理器执行时实现如前述实施例所述的图像模型的训练方法。

应该理解，可以使用上面所示的各种形式的流程，重新排序、增加或删除步骤。例如，本申请中记载的各步骤可以并行地执行也可以顺序地执行也可以不同的次序执行，只要能够实现本申请公开的技术方案所期望的结果，本文在此不进行限制。

上述具体实施方式，并不构成对本申请保护范围的限制。本领域技术人员应该明白的是，根据设计要求和其他因素，可以进行各种修改、组合、子组合和替代。任何在本申请的精神和原则之内所作的修改、等同替换和改进等，均应包含在本申请保护范围之内。

Claims

1.一种图像模型的训练方法，包括：

2.根据权利要求1所述的方法，其中，所述获取每个类别的采样比例系数，包括：

针对首次训练，获取每个类别的样本数量和总样本数量；

基于所述样本数量和所述总样本数量，确定每个类别的初始采样比例系数。

3.根据权利要求2所述的方法，其中，所述基于所述样本数量和所述总样本数量，确定每个类别的初始采样比例系数，包括：

确定所述总样本数量与每个类别的所述样本数量的第一比值；

将所有类别的所述第一比值进行求和；

针对每个类别，获取所述类别的所述第一比值与所述第一比值的和值的第二比值，并将所述第二比值作为所述类别的初始采样比例系数。

4.根据权利要求1-3任一项所述的方法，其中，所述获取每个类别的采样比例系数，包括：

针对非首次训练，获取上一次训练时每个类别中每个所述训练图像样本的损失信息；

针对每个类别，根据所述训练图像样本的损失信息，确定所述类别的损失下降速率；

根据每个类别的所述损失下降速率，确定当次训练时每个类别的所述采样比例系数。

5.根据权利要求4所述的方法，其中，所述根据所述损失信息，确定所述类别的损失下降速率，包括：

根据所述类别中每个所述训练图像样本的损失信息，确定所述类别的平均损失信息；

基于所述类别当次训练的所述平均损失信息和上一次训练的所述平均损失信息，确定所述类别的所述损失下降速率。

6.根据权利要求4所述的方法，其中，所述根据每个类别的所述损失下降速率，确定当次训练时每个类别的所述采样比例系数，包括：

基于当次训练的所述平均损失信息，确定第一参数；

将所有类别的所述第一参数进行求和；

针对每个类别，获取所述类别的所述第一参数与所述第一参数的和值的第三比值，并将所述第三比值作为所述类别的采样比例系数。

7.根据权利要求1所述的方法，其中，所述基于每个类别的提取的训练图像样本对所述图像模型进行训练之前，还包括：

从多个数据增强策略中选取目标数据增强策略；

基于所述目标数据增强策略，对所述训练图像样本进行数据增强处理。

8.根据权利要求7所述的方法，其中，所述从多个数据增强策略中选取目标数据增强策略，包括：

生成随机数，并基于所述随机数生成选取概率；

根据所述选取概率，从所述多个数据增强策略中选取所述目标数据增强策略。

9.根据权利要求1所述的方法，其中，还包括：

将每次训练出的满足图像模型保存条件的候选图像模型进行保存；

基于测试样本对所述候选图像模型和所述目标图像模型进行测试，从中选取测试结果最优的图像模型，作为最终的训练后图像模型。

10.一种图像模型的训练装置，包括：

11.根据权利要求10所述的装置，所述第一获取模块，进一步用于：

针对首次训练，获取每个类别的样本数量和总样本数量；

所述样本数量和所述总样本数量，确定每个类别的初始采样比例系数。

12.根据权利要求11所述的装置，其中，所述第一获取模块，进一步用于：

将所有类别的所述第一比值进行求和；

针对每个类别，获取所述类别的所述第一比值与所述第一比值的和值的第二比值，并将所述第二比值作为所述类别的采样比例系数。

13.根据权利要求10-12任一项所述的装置，其中，所述第一获取模块，进一步用于：

14.根据权利要求13所述的装置，其中，所述第一获取模块，进一步用于：

15.根据权利要求13所述的装置，其中，所述第一获取模块，进一步用于：

基于当次训练的所述平均损失信息，确定第一参数；

将所有类别的所述第一参数进行求和；

针对每个类别，获取所述类别的所述第一参数与所述第一参数的和值的第三比值，并将所述第三比值作为所述类别的初始采样比例系数。

16.根据权利要求10所述的装置，其中，所述装置还包括：

数据增强模块，用于从多个数据增强策略中选取目标数据增强策略，并基于所述目标数据增强策略，对所述训练图像样本进行数据增强处理。

17.根据权利要求16所述的装置，其中，所述数据增强模块，进一步用于：

生成随机数，并基于所述随机数生成选取概率；

18.根据权利要求10所述的装置，其中，所述装置还包括：

保存模块，用于将每次训练出的满足图像模型保存条件的候选图像模型进行保存；

测试模块，基于测试样本对所述候选图像模型和所述目标图像模型进行测试，从中选取测试结果最优的图像模型，作为最终的训练后图像模型。

19.一种电子设备，其特征在于，包括处理器和存储器；

其中，所述处理器通过读取所述存储器中存储的可执行程序代码来运行与所述可执行程序代码对应的程序，以用于实现如权利要求1-9中任一所述的方法。

20.一种计算机可读存储介质，其上存储有计算机程序，其特征在于，该程序被处理器执行时实现如权利要求1-9中任一所述的方法。

21.一种计算机程序产品，其特征在于，当所述计算机程序产品中的指令处理器执行时实现如权利要求1-9中任一所述的方法。

22.一种路侧设备，包括如权利要求19所述的电子设备。

23.一种云控平台，包括如权利要求19所述的电子设备。