CN117671385A

CN117671385A - 一种目标识别模型的训练方法、系统、装置及存储介质

Info

Publication number: CN117671385A
Application number: CN202311759749.XA
Authority: CN
Inventors: 严海旭; 兰晓松; 刘羿; 何贝
Original assignee: Beijing Sinian Zhijia Technology Co ltd
Current assignee: Beijing Sinian Zhijia Technology Co ltd
Priority date: 2023-12-20
Filing date: 2023-12-20
Publication date: 2024-03-08

Abstract

本说明书涉及一种目标识别模型的训练方法、系统、装置及存储介质，该方法包括获取多个训练样本，训练样本包括激光点云数据；基于多个训练样本和训练参数，执行多轮模型迭代，以完成对目标识别模型的训练，目标识别模型用于基于激光点云数据识别目标，其中，在每轮模型迭代中：基于该轮模型迭代对应的模型参数，计算初步梯度值；基于该轮模型迭代对应的模型参数和初步梯度值，执行多次参数迭代，确定多个候选模型参数；基于多个候选模型参数，确定目标模型参数，作为更新后的模型参数；对该轮模型迭代对应的目标识别模型进行评估，以确定是否完成模型训练过程。

Description

一种目标识别模型的训练方法、系统、装置及存储介质

技术领域

本说明书涉及信息技术领域，特别涉及一种目标识别模型的训练方法和系统。

背景技术

目标识别的任务是计算机视觉领域的核心问题之一，目标识别目的在于识别出图像中的感兴趣目标(物体)，在一些场景中，还可以进一步确定目标的位置、尺寸等信息。由于不同目标有不同的外观、形状、姿态等，加上成像时光照、遮挡、图像获取设备的不同等因素的干扰，目标识别属于计算机视觉领域难度较大的任务类型。

随着机器学习的发展，为了更好的完成目标识别任务，可以采用机器学习的方式，利用机器学习模型的强大处理能力实现感兴趣的目标识别。但机器学习模型的性能与其训练方法存在强相关性，因此，需要提供一种改进的目标识别模型的训练方法，提高目标识别模型的训练效果，进而提升目标识别模型的识别能力和识别效果。

发明内容

本说明书实施例之一提供一种目标识别模型的训练方法，其包括：获取多个训练样本，训练样本包括激光点云数据；基于多个训练样本和训练参数，执行多轮模型迭代，以完成对目标识别模型的训练，目标识别模型用于基于激光点云数据识别目标，其中，在每轮模型迭代中：基于该轮模型迭代对应的模型参数，计算初步梯度值；基于该轮模型迭代对应的模型参数和初步梯度值，执行多次参数迭代，确定多个候选模型参数；基于多个候选模型参数，确定目标模型参数，作为更新后的模型参数；对该轮模型迭代对应的目标识别模型进行评估，以确定是否完成模型训练过程。

本说明书实施例之一提供一种目标识别模型的训练系统，其包括：样本获取模块，用于获取多个训练样本，训练样本包括激光点云数据；模型训练模块，用于基于多个训练样本和训练参数，执行多轮模型迭代，以完成对目标识别模型的训练，在每轮模型迭代中，目标识别模型用于基于激光点云数据识别目标；模型训练模块还用于：基于该轮模型迭代对应的模型参数，计算初步梯度值；基于该轮模型迭代对应的模型参数和初步梯度值，执行多次参数迭代，确定多个候选模型参数；基于多个候选模型参数，确定目标模型参数，作为更新后的模型参数；对该轮模型迭代对应的目标识别模型进行评估，以确定是否完成模型训练过程。

本说明书实施例之一提供一种目标识别模型的训练装置，包括处理器，处理器用于执行目标识别模型的训练方法。

本说明书实施例之一提供一种计算机可读存储介质，存储介质存储计算机指令，当计算机读取存储介质中的计算机指令后，计算机执行目标识别模型的训练方法。

附图说明

本说明书将以示例性实施例的方式进一步说明，这些示例性实施例将通过附图进行详细描述。这些实施例并非限制性的，在这些实施例中，相同的编号表示相同的结构，其中：

图1是根据本说明书一些实施例所示的目标识别模型的示例性场景图；

图2是根据本说明书一些实施例所示的目标识别模型的训练过程中一轮迭代的示例性流程图；

图3是根据本说明书一些实施例所示的目标识别模型的训练过程中一轮模型迭代中一次参数迭代的示例性流程图；

图4是根据本说明书一些实施例所示的目标识别模型的训练系统的示例性模块图。

具体实施方式

为了更清楚地说明本说明书实施例的技术方案，下面将对实施例描述中所需要使用的附图作简单的介绍。显而易见地，下面描述中的附图仅仅是本说明书的一些示例或实施例，对于本领域的普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图将本说明书应用于其它类似情景。除非从语言环境中显而易见或另做说明，图中相同标号代表相同结构或操作。

应当理解，本文使用的“系统”、“装置”、“单元”和/或“模块”是用于区分不同级别的不同组件、元件、部件、部分或装配的一种方法。然而，如果其他词语可实现相同的目的，则可通过其他表达来替换词语。

如本说明书和权利要求书中所示，除非上下文明确提示例外情形，“一”、“一个”、“一种”和/或“该”等词并非特指单数，也可包括复数。一般说来，术语“包括”与“包含”仅提示包括已明确标识的步骤和元素，而这些步骤和元素不构成一个排它性的罗列，方法或者设备也可能包含其它的步骤或元素。

本说明书中使用了流程图用来说明根据本说明书的实施例的系统所执行的操作。应当理解的是，前面或后面操作不一定按照顺序来精确地执行。相反，可以按照倒序或同时处理各个步骤。同时，也可以将其他操作添加到这些过程中，或从这些过程移除某一步或数步操作。

在模型训练过程中，一般涉及模型本身内部配置的参数(可称之为“模型参数”)和用于模型训练的参数(可称之为“训练参数”或“超参数”)。目标识别模型的模型参数可以包括权重、偏置等，在目标识别模型的训练过程中，模型参数可以进行迭代调整，模型训练完成后的最终性能与模型参数相关。训练参数通常需要在模型训练前由用户基于经验预设，若训练参数选择不恰当，模型容易出现欠拟合或者过拟合的问题。

有鉴于此，本说明书一些实施例提供了一种目标识别模型的训练方法，可以在模型训练过程中的每轮迭代中尽可能选取更合适的参数，进而提高模型的训练效果。

图1是根据本说明书一些实施例所示的目标识别模型的示例性场景图。

参考图1，目标识别模型120用于基于激光点云数据检测目标。以自动驾驶场景为例，目标识别模型120可以用于基于车辆110-1上激光雷达110-2(LiDAR)获取的激光点云数据，识别车辆周围的障碍物或其他车辆等。在一些实施例中，激光雷达110-2可以被配置为在车辆110-1沿着轨迹移动时捕获数据。例如，激光雷达110-2的发射器可以被配置为扫描周围环境。激光雷达110-2通过用脉冲或连续波激光束照射目标并用接收器测量反射/散射脉冲来测量到目标的距离。用于激光雷达110-2的激光束可以是紫外线、可见光或近红外线。在一些实施例中，激光雷达110-2可以捕获包括周围环境中物体的深度信息的点云数据。

目标识别模型120可以是机器学习模型。在一些实施例中，目标识别模型120可以是利用多个训练样本130对初始模型122进行训练得到，并将训练完成的目标识别模型120存储于存储设备140。当车辆110-1运行时，将激光雷达110-2获取的激光点云数据输入至目标识别模型120，目标识别模型120可以输出识别结果150，以反映如障碍物的类型等信息。

在一些实施例中，目标识别模型120的训练方法可以包括获取多个训练样本130，训练样本130包括激光点云数据；基于多个训练样本130和训练参数，执行多轮模型迭代，以完成对目标识别模型120的训练。

在一些实施例中，可以通过历史获取的激光点云数据构造训练样本130，以对初始模型122进行训练。历史获取的激光点云数据可以是车辆(如车辆110-1)运行时，激光雷达(如激光雷达110-2)所获取的周围点云数据，并通过人工为点云数据中的对象添加对应的标签(如目标识别结果)，得到用于机器学习模型训练的训练样本130。

在一些实施例中，训练参数可以包括学习率和动量因子中的至少一种。

学习率可以表示模型训练过程中模型参数优化更新的步长，为了便于说明，后文中模型参数均以权重进行进一步解释，可以理解的，模型参数中的偏置等其他参数可以采用相同或相似方式进行调整。具体的，学习率可以控制每次(每轮)更新权重的幅度。如果学习率设置过大，训练可能会不稳定；如果学习率设置过小，训练可能会非常慢。为了更好的解释学习率，本说明书以随机梯度下降法进行解释，随机梯度下降法是机器学习中常用的用于减少损失函数值的优化算法，本说明书不展开说明。

随机梯度下降法的算法公式可以表示为：其中θ_t表示模型本轮迭代的权重，θ_t-1表示模型上一轮迭代的权重，η表示学习率，表示根据当前随机样本和代价函数J所计算的梯度(即模型参数优化更新的方向)，x_i表示某一随机样本，y_i表示该随机样本对应的真值。需要说明的是，学习率还可以用于随机梯度下降法外的其他优化算法中。

在随机梯度下降法中，其对模型的优化性能严重依赖于学习率η选择的是否合适，而选择一个合适的学习率通常需要研究员花费大量的时间和精力。

由于随机梯度下降法每次迭代仅使用一小部分样本，在面临噪声较大的数据集时，其收敛速度可能相对较慢，而另一种优化算法——动量法，在随机梯度下降法基础上引入了超参数动量因子，来平滑模型参数更新过程。动量因子是在训练机器学习模型时用于控制动量信息对整体梯度更新影响程度的超参数，通常被表示为一个值在0到1之间的数，用于控制历史梯度信息对当前梯度更新的贡献程度。动量法的算法公式可以表示为：θ_t＝θ_t-1-v_t；其中γ表示动量因子，v_t表示当前时刻的参数优化更新的方向。

与学习率相似，动量因子也需要手动选择合适的取值，不同的数值可能导致不同的训练效果。

由上述公式可以看出，学习率和动量因子在模型训练过程中作用类似，为了提高模型训练效果，同时调整好学习率和动量因子的难度进一步增加。

在本说明书一些实施例中，可以基于多个训练样本和训练参数，执行多轮模型迭代，以完成对目标识别模型的训练。在一些实施例中，在模型训练过程中的多轮模型迭代中的每轮迭代中，可以通过加入随机扰动，确定多个候选模型参数，以及结合候选模型参数，调整超参数，使得模型训练过程具备自适应调节能力，解决超参数调节困难的问题。

图2是根据本说明书一些实施例所示的目标识别模型的训练过程中一轮模型迭代的示例性流程图。如图2所示，流程200包括下述步骤。在一些实施例中，流程200中的一个或多个步骤可由模型训练模块420执行。

步骤210，基于该轮模型迭代对应的模型参数，计算初步梯度值。

初步梯度值表示当前模型参数下得到的本轮模型迭代中的模型参数调整方向。在一些实施例中，若当前模型迭代为首轮模型迭代，则当前模型参数为经过初始化的参数；若当前模型迭代不为首轮模型迭代，则当前模型参数为上一轮模型迭代确定的更新后的模型参数。

在一些实施例中，计算初步梯度值的方式可以包括：将训练样本输入模型进行前向传播得到模型对训练样本的预测结果，并基于预测结果与真实值之间的误差计算损失函数值，进一步的，基于得到损失函数值在模型进行反向传播，计算得到梯度值。损失函数表示训练样本的预测结果与真实值之间的误差。在一些实施例中，损失函数可以表示为其中y是训练样本对应的标签，/>是该目标识别模型对训练样本的预测结果。模型训练过程中，损失函数的选择会影响训练好的模型的性能，例如，对于多分类目标识别任务的目标识别模型，其损失函数可以是用于衡量模型对多目标类别的分类准确性的分类损失(如交叉熵损失函数)等。损失函数值表示当前轮损失函数的结果。

初步梯度值所反映的模型参数调整方向和调整幅度较为单一，而对初步梯度值随意进行调整则可能会导致模型性能的下降，因此，在本说明书实施例中，在一定的合适范围内调整初步梯度值，并至少基于调整后的梯度值通过执行多次参数迭代，确定参数修改方向(或更新后的模型参数)。

步骤220，基于该轮模型迭代对应的所述模型参数和所述初步梯度值，执行多次参数迭代，确定多个候选模型参数。

在一些实施例中，可以基于预设区间(如±10％区间内)调整初步梯度值，得到在预设区间内的多个随机梯度值，并基于多个随机梯度值进行迭代选取对应每个随机梯度值的候选模型参数。

图3是根据本说明书一些实施例所示的目标识别模型的训练过程中一轮模型迭代中一次参数迭代的示例性流程图。如图3所示，流程300包括下述步骤。

步骤310，确定该次参数迭代对应的目标梯度值。

目标梯度值为初步梯度值在一定程度上变化得到，在一些实施例中，目标梯度值可以通过在初步梯度值上添加噪声得到。

在一些实施例中，根据当前参数迭代是否为首次参数迭代，获取该次参数迭代对应的目标梯度值的方式不同。

在一些实施例中，若当前迭代为首次参数迭代，基于初步梯度值和噪声采样值，确定该次参数迭代对应的目标梯度值；若当前迭代不为首次参数迭代，基于上次参数迭代对应的目标梯度值和噪声采样值，确定该次参数迭代对应的目标梯度值。

在一些实施例中，噪声采样值从预设分布中采样得到。在一些实施例中，预设分布可以为高斯分布，需要说明的是，在一些实施例中，预设分布还可以是其他分布，如t分布、柯西分布等。

示例性的，假设共执行k次参数迭代，当前为第i次参数迭代，步骤210中，基于该轮模型迭代对应的模型参数(如权重θ_t)，计算得到的初步梯度值表示为g_t。则第i次参数迭代对应的目标梯度值为其中，/>表示上次参数迭代对应的目标梯度值，N(0,σ)表示服从期望为0、方差为σ的正态分布。在一些实施例中，若当前为首次参数迭代，则目标梯度值为g′_t＝g_t+N(0,σ)。

在一些实施例中，通过在初步梯度值中增加噪声扰动，使得得到的本次迭代的目标梯度值具备一定程度的随机性。在多轮参数迭代中，基于目标梯度值得到的模型参数可以具备不同的更新幅度和更新方向，进而在后续步骤中，可以基于多个不同的更新幅度和更新方向对应的模型参数确定损失函数，进而选取出更合适的模型参数，提高模型的性能。

步骤320，基于该次参数迭代对应的所述目标梯度值，通过优化器对该轮模型迭代对应的所述模型参数或上次参数迭代对应的候选模型参数进行更新，得到该次参数迭代对应的候选模型参数。

在一些实施例中，可以通过优化器基于该次参数迭代对应的目标梯度值对模型参数进行更新，得到该次参数迭代对应的候选模型参数(例如，更新后的权重/>)。具体的，若当前迭代为首次参数迭代，则通过优化器基于该次参数迭代对应的目标梯度值对该轮模型迭代对应的模型参数进行更新；若当前迭代不为首次参数迭代，则通过优化器基于该次参数迭代对应的目标梯度值对上次参数迭代对应的候选模型参数进行更新。继续前文中的示例，假设共执行k次参数迭代，则可以得到k个更新后的权重集即得到多个候选模型参数。

在一些实施例中，优化器可以选择Adam优化器、Momentum优化器、SGD优化器等。通过优化器对模型参数的更新为本领域常规技术，本说明书不再进一步说明。

在一些实施例中，优化器内嵌模型训练参数，模型训练参数可以包括如前文所述的学习率和动量中的至少一种。训练参数可以在多次参数迭代中保持固定，也可以基于优化器的算法或根据上一次迭代得到的模型参数(如)进行调整。因此，在一些实施例中，流程300还可以包括步骤330，以更新模型训练参数。

步骤330，基于该次参数迭代对应的候选模型参数，更新所述模型训练参数，供下一次参数迭代或下一轮模型迭代使用。

对于每一次参数迭代或每一轮模型迭代，均可以使用不同的训练参数，使得训练参数(如学习率和动量因子)在合理的变化范围内进行更多随机组合，以提高模型训练效果。在一些实施例中，还可以经过多次参数迭代后更新一次模型训练参数，如每5次参数迭代后更新一次模型训练参数。

通过结合候选模型参数，对模型训练参数进行调整，使得模型训练过程具备自适应调节能力，有效的解决训练参数(超参数)调节困难的问题。

步骤230，基于所述多个候选模型参数，确定目标模型参数，作为更新后的模型参数。

在一些实施例中，可以通过选择多个候选模型参数中满足预设条件的一个候选模型参数作为本轮模型迭代更新后的模型参数。例如，预设条件可以是选择相对于该轮模型迭代对应的模型参数变化(如差值)最大的候选模型参数作为本轮模型迭代中更新后的模型参数，以获取更大的调整幅度。

在一些实施例中，若候选模型参数的数量较多，执行步骤230时可能会耗费较多时长，且相邻次参数迭代得到的候选模型参数差异可能较小。因此，可以通过等差采样从多个候选模型参数中选取出一部分候选模型参数以进一步处理。

在一些实施例中，步骤230可以进一步包括：基于预设的采样步长，通过等差采样，从多个候选模型参数中确定采样集，采样集包括至少两个采样候选模型参数；计算至少两个采样候选模型参数分别对应的损失函数值；基于损失函数值，从至少两个采样候选模型参数中确定目标模型参数，作为更新后的模型参数。

在一些实施例中，采样步长可以是在模型训练前基于人工经验预设的数值，在一些实施例中，采样步长可以与参数迭代的次数相关，例如通过设置采样步长使得等差采样得到的采样集中采样候选模型参数数量固定(如10个、50个或100个等)。

继续前述示例，假设采样步长为s，采样集可以是更新后的(包含k个更新后的权重)权重集K中选取出的k/s个采样候选模型参数的采样候选权重集

在一些实施例中，可以通过模型的前向传播分别计算每个采样候选模型参数对应的损失函数值。例如，可以分别计算采样候选权重集R中每个采样候选模型参数对应的损失函数值。具体的，对于采样候选权重可以以其作为模型参数，利用训练样本输入至模型中得到模型对训练样本的预测结果，并通过计算预测结果与真实值之间的误差计算损失函数值L_t，以此循环，直至得到对应全部采样候选权重的采样损失函数集进一步的，可以利用采样损失函数集S，在采样候选权重集R中选取一个采样候选权重得到目标模型参数，作为更新后的模型参数。

在一些实施例中，基于损失函数值，从至少两个采样候选模型参数中确定目标模型参数，作为更新后的模型参数，可以进一步包括：选取损失函数值最小的采样候选模型参数为目标模型参数，作为更新后的模型参数。

继续前述示例，可以基于采样损失函数集S，在采样候选权重集R选取一个采样候选权重。在一些实施例中，可以在采样损失函数集S中选取损失函数值最小的采样候选权重(如)作为更新后的模型参数。

步骤240，对该轮模型迭代对应的目标识别模型进行评估，以确定是否完成模型训练过程。

在一些实施例中，每轮模型迭代结束时，可以对当前更新了的模型参数的目标识别模型进行评估，例如，采用验证集或交叉验证的方法对模型进行评估。当该模型的性能达到预设要求(如模型收敛等)或模型迭代次数达到预设的最大迭代次数时，可以确定完成模型的训练；若评估确定未完成模型训练，则进行下一轮模型迭代，即重新执行上述流程200，此时更新后的模型参数可以作为下一轮模型迭代的起始模型参数。

应当注意的是，上述有关流程200和流程300的描述仅仅是为了示例和说明，而不限定本说明书的适用范围。对于本领域技术人员来说，在本说明书的指导下可以对流程200和流程300进行各种修正和改变。然而，这些修正和改变仍在本说明书的范围之内。

通过在梯度中增加随机噪声扰动，确定多个候选模型参数并通过采样选取采样模型参数进而确定更优的模型参数，使得模型参数优化(模型训练)过程中，模型参数的更新幅度与更新方向能够进行动态调节，进而能够使采用本说明书提供的目标识别模型的训练方法训练得到的模型，具有更好的目标识别能力和识别效果。

参考图4，本说明书提供的目标识别模型的训练系统400包括样本获取模块410和模型训练模块420。

样本获取模块410可以用于获取多个训练样本，训练样本包括激光点云数据。关于训练样本的更多内容可以参见图1相关描述。

模型训练模块420可以用于基于多个训练样本和训练参数，执行多轮模型迭代，以完成对目标识别模型的训练，目标识别模型用于基于激光点云数据识别目标，其中，模型训练模块420还用于：基于该轮模型迭代对应的模型参数，计算初步梯度值；基于该轮模型迭代对应的模型参数和初步梯度值，执行多次参数迭代，确定多个候选模型参数；基于多个候选模型参数，确定目标模型参数，作为更新后的模型参数；对该轮模型迭代对应的目标识别模型进行评估，以确定是否完成模型训练过程。

关于模型训练模块420的更多内容可以参见流程200和流程300相关描述。

上文已对基本概念做了描述，显然，对于本领域技术人员来说，上述详细披露仅仅作为示例，而并不构成对本说明书的限定。虽然此处并没有明确说明，本领域技术人员可能会对本说明书进行各种修改、改进和修正。该类修改、改进和修正在本说明书中被建议，所以该类修改、改进、修正仍属于本说明书示范实施例的精神和范围。

同时，本说明书使用了特定词语来描述本说明书的实施例。如“一个实施例”、“一实施例”、和/或“一些实施例”意指与本说明书至少一个实施例相关的某一特征、结构或特点。因此，应强调并注意的是，本说明书中在不同位置两次或多次提及的“一实施例”或“一个实施例”或“一个替代性实施例”并不一定是指同一实施例。此外，本说明书的一个或多个实施例中的某些特征、结构或特点可以进行适当的组合。

此外，除非权利要求中明确说明，本说明书处理元素和序列的顺序、数字字母的使用、或其他名称的使用，并非用于限定本说明书流程和方法的顺序。尽管上述披露中通过各种示例讨论了一些目前认为有用的发明实施例，但应当理解的是，该类细节仅起到说明的目的，附加的权利要求并不仅限于披露的实施例，相反，权利要求旨在覆盖所有符合本说明书实施例实质和范围的修正和等价组合。例如，虽然以上所描述的系统组件可以通过硬件设备实现，但是也可以只通过软件的解决方案得以实现，如在现有的服务器或移动设备上安装所描述的系统。

同理，应当注意的是，为了简化本说明书披露的表述，从而帮助对一个或多个发明实施例的理解，前文对本说明书实施例的描述中，有时会将多种特征归并至一个实施例、附图或对其的描述中。但是，这种披露方法并不意味着本说明书对象所需要的特征比权利要求中提及的特征多。实际上，实施例的特征要少于上述披露的单个实施例的全部特征。

一些实施例中使用了描述成分、属性数量的数字，应当理解的是，此类用于实施例描述的数字，在一些示例中使用了修饰词“大约”、“近似”或“大体上”来修饰。除非另外说明，“大约”、“近似”或“大体上”表明数字允许有±20％的变化。相应地，在一些实施例中，说明书和权利要求中使用的数值参数均为近似值，该近似值根据个别实施例所需特点可以发生改变。在一些实施例中，数值参数应考虑规定的有效数位并采用一般位数保留的方法。尽管本说明书一些实施例中用于确认其范围广度的数值域和参数为近似值，在具体实施例中，此类数值的设定在可行范围内尽可能精确。

针对本说明书引用的每个专利、专利申请、专利申请公开物和其他材料，如文章、书籍、说明书、出版物、文档等，特此将其全部内容并入本说明书作为参考。与本说明书内容不一致或产生冲突的申请历史文件除外，对本说明书权利要求最广范围有限制的文件(当前或之后附加于本说明书中的)也除外。需要说明的是，如果本说明书附属材料中的描述、定义、和/或术语的使用与本说明书内容有不一致或冲突的地方，以本说明书的描述、定义和/或术语的使用为准。

最后，应当理解的是，本说明书中实施例仅用以说明本说明书实施例的原则。其他的变形也可能属于本说明书的范围。因此，作为示例而非限制，本说明书实施例的替代配置可视为与本说明书的教导一致。相应地，本说明书的实施例不仅限于本说明书明确介绍和描述的实施例。

Claims

1.一种目标识别模型的训练方法，其特征在于，所述方法包括：

获取多个训练样本，所述训练样本包括激光点云数据；

基于所述多个训练样本和训练参数，执行多轮模型迭代，以完成对目标识别模型的训练，所述目标识别模型用于基于激光点云数据识别目标，其中，在每轮模型迭代中：

基于该轮模型迭代对应的模型参数，计算初步梯度值；

基于该轮模型迭代对应的所述模型参数和所述初步梯度值，执行多次参数迭代，确定多个候选模型参数；

基于所述多个候选模型参数，确定目标模型参数，作为更新后的模型参数；

对该轮模型迭代对应的目标识别模型进行评估，以确定是否完成模型训练过程。

2.如权利要求1所述的方法，其特征在于，所述基于该轮模型迭代对应的所述模型参数和所述初步梯度值，执行多次参数迭代，确定多个候选模型参数中，所述多次参数迭代中的每次参数迭代包括：

确定该次参数迭代对应的目标梯度值；

基于该次参数迭代对应的所述目标梯度值，通过优化器对该轮模型迭代对应的所述模型参数或上次参数迭代对应的候选模型参数进行更新，得到该次参数迭代对应的候选模型参数。

3.如权利要求2所述的方法，其特征在于，所述确定该次参数迭代对应的目标梯度值，包括：

若当前迭代为首次参数迭代，基于所述初步梯度值和噪声采样值，确定该次参数迭代对应的所述目标梯度值；

若当前迭代不为首次参数迭代，基于上次参数迭代对应的目标梯度值和噪声采样值，确定该次参数迭代对应的所述目标梯度值。

4.如权利要求3所述的方法，其特征在于，所述噪声采样值从预设分布中采样得到，所述预设分布为正态分布。

5.如权利要求2所述的方法，其特征在于，所述优化器内嵌模型训练参数，所述模型训练参数包括学习率和动量中的至少一种；所述多次参数迭代中的每次参数迭代还包括：

基于该次参数迭代对应的候选模型参数，更新所述模型训练参数，供下一次参数迭代或下一轮模型迭代使用。

6.如权利要求1所述的方法，其特征在于，所述基于所述多个候选模型参数，确定目标模型参数，作为更新后的模型参数，包括：

基于预设的采样步长，通过等差采样，从所述多个候选模型参数中确定采样集，所述采样集包括至少两个采样候选模型参数；

计算所述至少两个采样候选模型参数分别对应的损失函数值；

基于所述损失函数值，从所述至少两个采样候选模型参数中确定所述目标模型参数，作为更新后的模型参数。

7.如权利要求6所述的方法，其特征在于，所述基于所述损失函数值，从所述至少两个采样候选模型参数中确定所述目标模型参数，作为更新后的模型参数，包括：

选取损失函数值最小的采样候选模型参数为所述目标模型参数，作为更新后的模型参数。

8.一种目标识别模型的训练系统，其特征在于，所述系统包括：

样本获取模块，用于获取多个训练样本，所述训练样本包括激光点云数据；

模型训练模块，用于基于所述多个训练样本和训练参数，执行多轮模型迭代，以完成对目标识别模型的训练，所述目标识别模型用于基于激光点云数据识别目标，其中，在每轮模型迭代中，所述模型训练模块用于：

基于该轮模型迭代对应的模型参数，计算初步梯度值；

9.一种目标识别模型的训练装置，包括处理器，其特征在于，所述处理器用于执行如权利要求1～7任一项所述的目标识别模型的训练方法。

10.一种计算机可读存储介质，所述存储介质存储计算机指令，当计算机读取存储介质中的计算机指令后，计算机执行如权利要求1～7任一项所述的目标识别模型的训练方法。