CN116311126A

CN116311126A - 模型训练方法、交通标线的识别方法、装置、设备及介质

Info

Publication number: CN116311126A
Application number: CN202310260551.0A
Authority: CN
Inventors: 李宁; 万如; 贾双成; 朱磊; 郭杏荣
Original assignee: Zhidao Network Technology Beijing Co Ltd
Current assignee: Zhidao Network Technology Beijing Co Ltd
Priority date: 2023-03-17
Filing date: 2023-03-17
Publication date: 2023-06-23

Abstract

本申请涉及数据识别领域，公开了一种模型训练方法、交通标线的识别方法、装置、设备及介质，方法包括：确定待训练模型中与输入的待识别图像相关的多个第一图像；确定对每一第一图像进行不同层级特征提取后各自对应的第二图像；分别确定每一第一图像的质心参数及每一第二图像的质心参数；确定质心损失值；至少基于质心损失值及待识别图像的识别结果对待训练模型进行训练。本申请提供的方案，由于质心损失值可表征待训练模型中不同层级下输入端与输出端之间图像的质心位置差异，可准确指导模型训练，提高了模型训练效率和模型识别精度，解决了传统方案模型训练效率低、识别精度低的问题。

Description

模型训练方法、交通标线的识别方法、装置、设备及介质

技术领域

本申请涉及数据识别技术领域，尤其涉及一种模型训练方法、交通标线的识别方法、装置、设备及介质。

背景技术

在数据识别领域，常利用机器学习模型进行目标识别，比如在智能驾驶场景中，可以通过训练好的机器学习模型识别道路图像中的交通标线。

相关技术中，训练模型用的模型损失仅依据待训练模型的网络损失确定，由于网络损失难以准确指导模型训练，导致模型训练过程效率低下，且模型识别精度较低。

发明内容

为解决或部分解决相关技术中存在的问题，本申请提供一种模型训练方法、交通标线的识别方法、装置、设备及介质，能够通过引入质心损失值加快模型训练过程，提高模型训练效率以及训练精度。

本申请第一方面提供一种模型训练方法，该方法包括：

确定待训练模型中与输入的待识别图像相关的多个第一图像；

确定对每一所述第一图像进行不同层级特征提取后各自对应的第二图像；

分别确定每一所述第一图像的质心参数以及每一所述第二图像的质心参数；

依据每一所述第一图像的质心参数以及每一所述第一图像各自对应的第二图像的质心参数，确定质心损失值；

至少基于所述质心损失值以及所述待识别图像的识别结果，对待训练模型进行训练。

根据本申请提供的模型训练方法，所述确定待训练模型中与输入的待识别图像相关的多个第一图像，包括：

对所述待识别图像进行多次第一预处理操作，确定每次第一预处理操作对应的第一图像，得到多个第一图像。

根据本申请提供的模型训练方法，所述待训练模型包括多层卷积层以及多层反卷积层，所述卷积层与所述反卷积层一一对应；

每层所述卷积层用于提取接收到的图像在当前层级对应的语义特征，输出包含所述语义特征的第一特征图至与当前卷积层相连接的下一卷积层以及与当前卷积层对应的反卷积层；

每层所述反卷积层用于将已接收的图像与当前层级对应的卷积层输出的第一特征图进行融合，得到第二特征图，并将所述第二特征图传递至与当前反卷积层相连接的下一反卷积层。

根据本申请提供的模型训练方法，所述确定对每一所述第一图像进行不同层级特征提取后各自对应的第二图像，包括：

将所述多个反卷积层中至少部分反卷积层输出的第二特征图，作为多个第二图像；

其中，所述至少部分反卷积层包括用于生成所述待识别图像的识别结果的反卷积层。

根据本申请提供的模型训练方法，确定每一所述第一图像的质心参数，包括：

分别将每一所述第一图像划分为多个图像块；

分别确定每一所述图像块的质心；

依据每一所述第一图像对应的所有图像块的质心，确定每一所述第一图像的质心参数。

根据本申请提供的模型训练方法，所述分别将每一所述第一图像划分为多个图像块，包括：

确定每一所述第一图像的图像中心点；

以过所述图像中心点的纵向直线为第一分割线，以过所述图像中心点的横向直线为第二分割线，确定第一分割线和第二分割线；

通过所述第一分割线和所述第二分割线对每一所述第一图像进行分割，得到每一所述第一图像对应的多个图像块。

根据本申请提供的模型训练方法，所述依据每一所述第一图像对应的所有图像块的质心，确定每一所述第一图像的质心参数，包括：

对每一所述第一图像对应的所有图像块的质心进行归一化处理，得到所有图像块的归一化质心；

将所有图像块的归一化质心进行加权求和，得到每一所述第一图像的质心参数。

根据本申请提供的模型训练方法，所述依据每一所述第一图像的质心参数以及每一所述第一图像各自对应的第二图像的质心参数，确定质心损失值，包括：

分别将每一所述第一图像的质心参数与每一所述第一图像各自对应的第二图像的质心参数作差，得到多个质心差值；

将所述多个质心差值进行加权求和，得到质心损失值。

本申请第二方面提供一种交通标线的识别方法，该方法包括：

获取包含交通标线的道路图像；

将所述道路图像输入识别模型，得到所述识别模型输出的结果图像；

其中，所述结果图像包括对所述道路图像中交通标线进行标记的识别结果；所述识别模型基于如上所述的模型训练方法训练得到。

本申请第三方面提供一种模型训练装置，该装置包括：

第一处理模块，用于确定待训练模型中与输入的待识别图像相关的多个第一图像；

第二处理模块，用于确定对每一所述第一图像进行不同层级特征提取后各自对应的第二图像；

第三处理模块，用于分别确定每一所述第一图像的质心参数以及每一所述第二图像的质心参数；

第四处理模块，用于依据每一所述第一图像的质心参数以及每一所述第一图像各自对应的第二图像的质心参数，确定质心损失值；

第五处理模块，用于至少基于所述质心损失值以及所述待识别图像的识别结果对待训练模型进行训练。

本申请第四方面提供一种交通标线的识别装置，该装置包括：

获取模块，用于获取包含交通标线的待识别图像；

识别模块，用于将所述待识别图像输入识别模型，得到所述识别模型输出的结果图像；

其中，所述结果图像包括对所述待识别图像中交通标线进行标记的识别结果；所述识别模型基于如上所述的模型训练方法训练得到。

本申请第五方面提供一种电子设备，包括：

处理器；以及

存储器，其上存储有可执行代码，当所述可执行代码被所述处理器执行时，使所述处理器执行如上所述的方法。

本申请第六方面提供一种计算机可读存储介质，其上存储有可执行代码，当所述可执行代码被电子设备的处理器执行时，使所述处理器执行如上所述的方法。

本申请提供的技术方案可以包括以下有益效果：

通过确定与输入的待识别图像相关的多个第一图像以及对第一图像进行不同层级特征提取后各自对应的第二图像，求取第一图像以及第二图像的质心参数，进而求得待训练模型的质心损失值，由于质心损失值可以表征待训练模型中不同层级下输入端与输出端之间图像的质心位置差异，引入该质心损失值后可以准确指导模型训练，提高了模型训练效率，且训练的得到的模型识别精度更高。

应当理解的是，以上的一般描述和后文的细节描述仅是示例性和解释性的，并不能限制本申请。

附图说明

通过结合附图对本申请示例性实施方式进行更详细地描述，本申请的上述以及其它目的、特征和优势将变得更加明显，其中，在本申请示例性实施方式中，相同的参考标号通常代表相同部件。

图1是本申请实施例示出的模型训练方法的流程示意图；

图2是本申请实施例中待训练模型的结构示意图；

图3是本申请实施例示出的交通标线的识别方法的流程示意图；

图4是本申请实施例中包含路面交通标线的道路图像示意图；

图5是本申请实施例中路面交通标线的识别标签示意图；

图6是本申请实施例中通过传统模型识别到的路面交通标线的识别结果示意图；

图7是本申请实施例中通过本实施例训练得到的识别模型识别到的路面交通标线的识别结果示意图；

图8是本申请实施例示出的模型训练装置的结构示意图；

图9是本申请实施例示出的交通标线的识别装置的结构示意图；

图10是本申请实施例示出的电子设备的结构示意图。

具体实施方式

下面将参照附图更详细地描述本申请的实施方式。虽然附图中显示了本申请的实施方式，然而应该理解，可以以各种形式实现本申请而不应被这里阐述的实施方式所限制。相反，提供这些实施方式是为了使本申请更加透彻和完整，并且能够将本申请的范围完整地传达给本领域的技术人员。

在本申请使用的术语是仅仅出于描述特定实施例的目的，而非旨在限制本申请。在本申请和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式，除非上下文清楚地表示其他含义。还应当理解，本文中使用的术语“和/或”是指并包含一个或多个相关联的列出项目的任何或所有可能组合。

应当理解，尽管在本申请可能采用术语“第一”、“第二”、“第三”等来描述各种信息，但这些信息不应限于这些术语。这些术语仅用来将同一类型的信息彼此区分开。例如，在不脱离本申请范围的情况下，第一信息也可以被称为第二信息，类似地，第二信息也可以被称为第一信息。由此，限定有“第一”、“第二”的特征可以明示或者隐含地包括一个或者更多个该特征。在本申请的描述中，“多个”的含义是两个或两个以上，除非另有明确具体的限定。

本实施例涉及数据识别领域，具体可以应用于目标识别场景，比如智能驾驶中对交通标线的识别场景，通过机器学习的形式进行目标识别。

相关技术中，由于机器学习模型在训练过程中仅依据网络损失指导模型参数调整，模型难以快速收敛，进而影响模型训练效率，导致模型训练过程效率低下。

针对上述问题，本申请实施例提供一种模型训练方法，能够通过优化模型训练环节，提高模型训练效率以及模型识别精度。

以下结合图1至图10详细描述本申请实施例提供的模型训练方法、交通标线的识别方法、装置、设备及介质的技术方案。

图1是本申请实施例示出的模型训练方法的流程示意图。

参见图1，本申请实施例提供的模型训练方法，具体包括：

步骤101：确定待训练模型中与输入的待识别图像相关的多个第一图像。

本实施例中，待训练模型可以是未经训练的深度学习网络搭建的机器学习模型，该待训练模型的输入为待识别图像，输出为标记有目标识别结果的结果图像。

待识别图像可以是包含待识别目标的图像，比如在智能驾驶场景中，待识别图像可以是包含交通标线的道路图像，待识别图像可以由图像采集设备获取得到，比如可以由安装在车辆上的摄像头或者布置于道路两侧的路测摄像头采集得到。

第一图像可以是待识别图像经尺寸调整后得到的图像，比如可以对待识别图像进行尺寸缩放操作，由此获得第一图像。

步骤102：确定对每一第一图像进行不同层级特征提取后各自对应的第二图像。

本实施例中，第二图像可以是包含不同层级语义特征的特征图，该特征图均可以通过对第一图像做不同层级的特征提取后得到，包含第一图像中不同层级的语义特征。

步骤103：分别确定每一第一图像的质心参数以及每一第二图像的质心参数。

本实施例中，质心参数主要用于表征图像中图像质心的位置，可以通过质心坐标的形式呈现，具体可以通过图像中至少部分关键像素点的像素值求解得到。

步骤104：依据每一第一图像的质心参数以及每一第一图像各自对应的第二图像的质心参数，确定质心损失值。

本实施例中，质心损失值主要用于表征待训练模型的输出端与输入端之间图像质心的差异信息，具体可以通过分析每一张第一图像与该第一图像对应的第二图像之间的质心位置差异确定。

步骤105：至少基于质心损失值以及待识别图像的识别结果，对待训练模型进行训练。

本实施例中，通过引入质心损失值，可以约束模型训练，在模型训练过程中，质心损失值以及依据待识别图像的识别结果得到的网络损失均参与模型损失的确定，使得模型损失可以更准确的指导模型训练，这样的话，待训练模型可以快速收敛，待训练模型的训练效率得到提升，且提高了模型识别精度。

在一些实施例中，确定待训练模型中与输入的待识别图像相关的多个第一图像，具体包括：

对待识别图像进行多次第一预处理操作，确定每次第一预处理操作对应的第一图像，得到多个第一图像。

本实施例中，第一预处理操作可以是图像尺寸缩小操作，具体地，可以对待识别图像做多次图像尺寸缩小操作，得到尺寸缩小后缩小至不同原图比例的第一图像。例如，可以将待识别图像的尺寸缩小四次，得到四张第一图像，四张第一图像的尺寸与待识别图像的尺寸比分别是1、1/2、1/4以及1/8。

在实际应用中，可以根据待识别图像的尺寸确定缩小比例，如果待识别图的尺寸较大，可以适当放大每次缩小的比例，如果待识别图像尺寸较小，可以适当减小每次缩小的比例。

第一预处理操作的次数可以根据待训练模型中基础层的层数确定，也就是第一预处理操作的次数可以根据特征提取的层级数确定，比如待训练模型包括四个基础层，则可以对待识别图像做四次第一预处理操作，由于待训练模型的输出端包含四层子基础层，如果以输出端的每层子基础层输出的特征图作为第二图像的话，最多可以确定得到四张第二图像，所以通过上述方式确定的第一预处理操作的次数可以是第一预处理操作的次数上限值。

通过对待识别图像做多次第一预处理操作的方式，可以获得与待识别图像相关的多个第一图像，第一图像的获取方式更加便捷，且能够为后续质心损失值确定环节提供更多的数据依据。

在一些实施例中，待训练模型具体包括多层卷积层以及多层反卷积层，卷积层与反卷积层一一对应；

每层卷积层用于提取接收到的图像在当前层级对应的语义特征，输出包含语义特征的第一特征图至与当前卷积层相连接的下一卷积层以及与当前卷积层对应的反卷积层；

每层反卷积层用于将已接收的图像与当前层级对应的卷积层输出的第一特征图进行融合，得到第二特征图，并将第二特征图传递至与当前反卷积层相连接的下一反卷积层。

本实施例提供了待训练模型的一种具体结构方案，本实施例中，待训练模型可以分为输入端和输出端两部分，输入端由多层卷积层构成，各层卷积层顺次连接，即任意一层卷积层的输入端与上一卷积层的输出端连接，任意一层卷积层的输出端与下一卷积层的输入端连接，从而可以将各层卷积层提取到的语义特征逐级传递，直至传递到最后一层卷积层，实现对待识别图像中多层级语义特征的获取功能；

输出端由多层反卷积层构成，各层反卷积层顺次连接，即任意一层反卷积层的输入端与上一反卷积层的输出端连接，任意一层反卷积层的输出端与下一反卷积层的输入端连接，且每层卷积层对应连接一层反卷积层，也就是说，输出端的每一子基础层与输入端的每一子基础层一一对应。

图2示例性的示出了待训练模型的一种具体结构，参见图2，该待训练模型具体包括编码器201以及解码器202，编码器201可以理解为待训练模型的输入端，解码器202可以理解为待训练模型的输出端；

其中，编码器201包括四层卷积层，四层卷积层分别是第一卷积层、第二卷积层、第三卷积层以及第四卷积层，第一卷积层、第二卷积层、第三卷积层以及第四卷积层顺次连接；

第一卷积层用于提取待识别图像在第一层级的语义特征，并将包含第一层级的语义特征的第一特征图分别输出至第二卷积层和解码器202；

第二卷积层用于基于第一层级的语义特征提取待识别图像在第二层级的语义特征，并将包含第二层级的语义特征的第一特征图分别输出至第三卷积层和解码器202；

第三卷积层用于基于第二层级的语义特征提取待识别图像在第三层级的语义特征，并将包含第三层级的语义特征的第一特征图分别输出至第四卷积层和解码器202；

第四卷积层用于基于第三层级的语义特征提取待识别图像在第四层级的语义特征，并将包含第四层级的语义特征的第一特征图输出至解码器202。

本实施例针对的是编码器201包含四层卷积层的情形，参见图2，整个待训练模型的网络架构可以大致划分为四个基础层，即图2中从上至下对应的四行层结构，四个基础层又可以划分为编码器201和解码器202这两部分，编码器201与解码器202可以通过拼接通道连接，图2所示目标识别模型的网络对应的kernel_size（内核尺寸）为3×3，padding（填充值）为1，stride（步长）为1。

如图2所示，编码器201的内部顺次连接有四层卷积层，各层卷积层按照数据传递方向定义，即第一卷积层、第二卷积层、第三卷积层以及第四卷积层依次对应图2中编码器201内从上至下的各行基础层，编码器201中各个卷积层输出的语义特征通过能够表征当前层级语义信息的第一特征图传递出去。

一方面，每层卷积层均将对输入的图像进行一次下采样操作，使输入图像的通道数增加一倍，图像的尺寸（具体是图像的长度和宽度）将减少为原来的一半，比如输入图像尺寸为480×800，进行一次下采样操作后图像的尺寸降为240×400；另一方面，每层卷积层将对输入的图像分别进行卷积操作、归一化操作以及激活操作，以提取输入的图像在当前层级的语义特征，通过多层卷积层实现多个层级的语义特征的提取。

参见图2，本实施例中解码器202与编码器201的层数相同，在图2所示的场景中，解码器202包含顺次连接的四层反卷积层，解码器202的四层反卷积层按照数据的流向依次定义，具体地，第一反卷积层、第二反卷积层、第三反卷积层以及第四反卷积层在图2中依次对应解码器202内由下至上的各行基础层。

在编码器201包括四层卷积层的情况下，解码器202包括第一反卷积层、第二反卷积层、第三反卷积层以及第四反卷积层，第一反卷积层、第二反卷积层、第三反卷积层以及第四反卷积层顺次连接；

第一反卷积层用于接收编码器内第四卷积层输出的包含第四层级的语义特征的第一特征图，将该第一特征图作为第一层级的第二特征图，得到的第二特征图将传递至第二反卷积层；

第二反卷积层用于将编码器内第三卷积层输出的包含第三层级的语义特征的第一特征图与第一反卷积层输出的第二特征图进行融合，并将得到第二层级的第二特征图传递至第三反卷积层；

第三反卷积层用于将编码器内第二卷积层输出的包含第二层级的语义特征的第一特征图与第二反卷积层输出的第二特征图进行融合，并将得到的第三层级的第二特征图传递至第四反卷积层；

第四反卷积层用于将编码器内第一卷积层输出的包含第一层级的语义特征的第一特征图与第三反卷积层输出的第二特征图进行融合，得到结果图像。

一方面，每层反卷积层均可以对输入的特征图进行一次上采样操作，上采样操作可以使输入的特征图的通道数降低一倍，且可以使特征图的尺寸（具体是图像的长度和宽度）增加原来的一倍，比如输入特征图的图像尺寸为480×800，进行一次上采样操作后图像的尺寸增加为960×1600；

另一方面，反卷积层可以将已接收的图像与编码器输出的当前层级的第一特征图进行融合，从而提取更详细的语义特征。

可以理解的是，本实施例中反卷积层已接收的图像，可以是与当前反卷积层连接的上一反卷积层传递的特征图，也可以是除当前层级对应的卷积层输出的第一特征图以外的其他特征图，比如可以是上一层级的卷积层输出的第一特征图。

在一些实施例中，确定对每一第一图像进行不同层级特征提取后各自对应的第二图像，具体包括：

将多个反卷积层中至少部分反卷积层输出的第二特征图，作为多个第二图像；

其中，至少部分反卷积层包括用于生成待识别图像的识别结果的反卷积层。

本实施例中，以待训练模型为图2所示结构的模块为例，可以将对第一图像进行不同层级特征提取后得到的特征图作为第二图像，比如通过一层卷积层对第一图像进行第一层级的特征提取后得到的第一特征图将输入与该层卷积层对应的反卷积层，经反卷积层做特征融合后可以得到第二特征图，该第二特征图即为一张第二图像，这样的话，可以将至少部分反卷积层输出的第二特征图作为第二图像。

由于待训练模型输出的待识别图像的识别结果，即结果图像是待训练模型输出端较为具有代表性的图像，所以多个第二图像中需要尽可能包含结果图像，也就是说，至少部分反卷积层包括用于生成待识别图像的识别结果的反卷积层。

在另一些实施例中，第二图像也可以通过对结果图像做多次第二预处理操作后得到，第二预处理操作可以是对结果图像进行尺寸放大操作，比如按一定比例将结果图像做多次尺寸放大操作，从而得到多张第二图像。

本实施例中，无论采用哪一种第二图像的确定方式，均需要保证第一图像与第二图像一一对应，该对应关系可以人为设定，也可以根据待训练模型的层级结构进行划定，具体可以根据实际应用需要合理设置，在此不做过多赘述。

在一些实施例中，确定每一第一图像的质心参数，具体包括：

分别将每一第一图像划分为多个图像块；

分别确定每一图像块的质心；

依据每一第一图像对应的所有图像块的质心，确定每一第一图像的质心参数。

本实施例中，每一图像块的质心可以通过图像质心的坐标求解方法求解得到，图像质心又称为图像重心，可以通过图像中每一图像点的像素值确定，对于二维图像，可以在x方向和y方向上分别独立地求解质心坐标，即对于x方向的质心，图像在质心左右两边像素和相等；对于y方向的质心，图像在质心上下两边像素和相等。

设图像中存在n个图像点，任一图像点在x方向上坐标为x_i，对应的像素值为p_i，质心在x方向上坐标为x，则存在如下关系：

（1）

根据上述公式（1）可以得到：

（2）

与上述计算方式类似地，可以求解得到质心在y方向上的坐标y，从而得到该二维图像的质心坐标。

通过将第一图像划分为多个图像块，求取各个图像块的质心，最后汇总求解第一图像的质心参数，该种质心参数确定方式相较于直接求解第一图像的质心来确定质心参数的方式，得到的质心参数更加精确，进而能够提高质心损失值的可靠性。

在实际应用中，对第一图像分块的方式有多种方案，多个图像块的划分合理性将直接影响质心参数的求解精确性，为此，本实施例提供了相对较为合理的图像块划分方案，具体详见下述实施例。

在一些实施例中，分别将每一第一图像划分为多个图像块，具体包括：

确定每一第一图像的图像中心点；

以过图像中心点的纵向直线为第一分割线，以过图像中心点的横向直线为第二分割线，确定第一分割线和第二分割线；

通过第一分割线和第二分割线对每一第一图像进行分割，得到每一第一图像对应的多个图像块。

本实施例中，采用对第一图像进行均匀分割的方式划分出多个图像块，具体地，首先可以确定第一图像的图像中心点，之后以过图像中心点的纵向直线和横向直线确定出第一分割线和第二分割线，依据第一分割线和第二分割线对第一图像进行分割，即可得到等分的四块图像块，该种情形下，可以将第一图像分割为“田”形，实现图像块的均匀分割。

在另一些实施例中，如果第一图像为矩形图像，也可以将第一图像的两条对角线作为第一分割线和第二分割线，对第一图像进行分割，该种分割方案也可以将第一图像分割为四块图像块，但划分得到的四块图像块均为三角形且具体形状略有差异，对于求解精度要求稍低的场景下可以采用该分块方案。

类似地，第二图像也可以采用上述任一种的图像块划分方案，在实际应用中，第一图像与第二图像的图像块划分方案需要尽量保持一致，这样便于后续的求解环节进行统一的求解计算和其他数据处理操作。

在一些实施例中，依据每一第一图像对应的所有图像块的质心，确定每一第一图像的质心参数，具体包括：

对每一第一图像对应的所有图像块的质心进行归一化处理，得到所有图像块的归一化质心；

将所有图像块的归一化质心进行加权求和，得到每一第一图像的质心参数。

本实施例中，为了便于对所有图像块的质心进行统一的求解计算，可以在求解前先对所有图像块的质心做统一的归一化处理，得到所有图像块的归一化质心，也就是将所有图像块的质心坐标均归一化至一个较小的数据范围内，然后再对归一化质心进行加权求和，具体可以将每一图像块的归一化质心对应的各坐标轴坐标相加，得到该图像块的子质心参数，然后对各个子质心参数进行加权求和，也就是每个图像块的子质心参数乘以该图像块对应的权重，得到第一图像的质心参数。

需要说明的，本实施例中将所有图像块的归一化质心进行加权求和的过程中，各个图像块的权重值可以是定值，也可以动态变化的值，本实施例中各个图像块的权重值采用动态变化的值，即动态权重值。

实际应用中，各个图像块对应的动态权重值的初始值一致，比如可以均取0.25，在待训练模型训练过程中，每一图像块均会对应生成一个损失值，在损失迭代的过程中会更新该动态权重值，使得每一第一图像的质心参数随着迭代过程不断更新，从而能够提高质心参数的可靠性。

类似地，第二图像的质心参数也可以采用与第一图像的质心参数计算方式一致的计算方法确定得到。

在一些实施例中，依据每一第一图像的质心参数以及每一第一图像各自对应的第二图像的质心参数，确定质心损失值，具体包括：

分别将每一第一图像的质心参数与每一第一图像各自对应的第二图像的质心参数作差，得到多个质心差值；

将多个质心差值进行加权求和，得到质心损失值。

本实施例中，质心差值可以表征第一图像与该第一图像对应的第二图像之间的质心位置差异，将多个质心差值进行加权求和后，质心损失值可以表征多个第一图像与各自对应的第二图像之间综合分析得到的质心位置差异。

可以理解的是，将多个质心差值进行加权求和的过程中，每个质心差值的权重值可以通过与该质心差值相关的多个权重值求平均值得到，具体地，与该质心差值相关的多个权重值可以包括该质心差值对应的第一图像中各个图像块的权重值，以及该质心差值对应的第二图像中各个图像块的权重值。

实际应用中，质心损失值可以通过多个质心求解模块与求和模块配合求解得到，参见图2，在第一图像和第二图像均为四张时，可以设置四个质心求解模块和一个求和模块，四个质心求解模块分别是第一质心求解模块203、第二质心求解模块204、第三质心求解模块205以及第四质心求解模块206；

其中，第一质心求解模块203的一端用于接收编码器201内待识别图像经第一次第一预处理操作后得到的第一层级的第一图像，第一质心求解模块203的另一端用于接收解码器202内第四反卷积层输出的特征图，即解码器202内第四层级的第二图像，第一质心求解模块203用于求解接收到的第一图像和第二图像的质心参数，求取第一图像与第二图像之间质心参数的差值，得到第一质心差值，并将第一质心差值传递至求和模块207内；

第二质心求解模块204的一端用于接收编码器201内待识别图像经第二次第一预处理操作后得到的第二层级的第一图像，第二质心求解模块204的另一端用于接收解码器202内第三反卷积层输出的特征图，即解码器202内第三层级的第二图像，第二质心求解模块204用于求解接收到的第一图像和第二图像的质心参数，求取第一图像与第二图像之间质心参数的差值，得到第二质心差值，并将第二质心差值传递至求和模块207内；

第三质心求解模块205的一端用于接收编码器201内待识别图像经第三次第一预处理操作后得到的第三层级的第一图像，第三质心求解模块205的另一端用于接收解码器202内第二反卷积层输出的特征图，即解码器202内第二层级的第二图像，第三质心求解模块205用于求解接收到的第一图像和第二图像的质心参数，求取第一图像与第二图像之间的质心参数的差值，得到第三质心差值，并将第三质心差值传递至求和模块207内；

第四质心求解模块206的一端用于接收编码器201内待识别图像经第四次第一预处理操作后得到的第四层级的第一图像，第四质心求解模块206的另一端用于接收解码器202内第一反卷积层输出的特征图，即解码器202内第一层级的第二图像，第四质心求解模块206用于求解接收到的第一图像和第二图像的质心参数，求取第一图像与第二图像之间的质心参数的差值，得到第四质心差值，并将第四质心差值传递至求和模块207内；

求和模块207主要用于接收第一质心差值、第二质心差值、第三质心差值以及第四质心差值，并将上述四个质心差值进行加权求和，得到质心损失值。

在一些实施例中，至少基于质心损失值以及待识别图像的识别结果，对待训练模型进行训练，具体包括：

基于待识别图像的识别结果与待识别图像的标签信息，确定待训练模型的网络损失值；

将质心损失值与网络损失值进行加权求和，得到模型损失值；

通过模型损失值指导待训练模型进行训练。

本实施例中，通过模型损失值可以指导待训练模型进行模型参数的调整，直至模型损失值达到预设阈值，模型收敛，确定最优模型参数，即可得到训练好的识别模型。

在一个具体的实施例中，待训练模型的训练过程还将涉及如下流程：

第一步，将得到的待识别图像样本和标签数据结合生成训练所需要的样本数据；

第二步，将样本数据中不符合规范的数据进行规范化处理，得到符合规范的样本数据，具体地，可以将样本数据中标签数据与待识别图像样本不对应的数据进行修改，使标签数据与待识别图像样本对应，从而实现样本数据的规范化处理，该步骤在训练精度要求不高的场景下也可以省去；

第三步，将样本数据通过随机分组的方式分成测试数据和训练数据，将测试数据和训练数据分别保存到预设的样本数据库中，比如可以保存至MBD（Model BasedDefinition，基于模型的定义）数据库中；

第四步，读取样本数据库中的训练数据，将读取到的训练数据进行解析，具体可以解析成矩阵的形式，比如可以解析成480×800×3的矩阵，将解析后的数据输入深度学习网络搭建的待训练模型中进行训练，得到训练好的识别模型；

第五步，使用测试数据对训练好的识别模型进行测试，将测试结果和真实的标签数据进行对比，在比对结果满足测试通过要求时，得到测试通过的识别模型。

需要说明的是，本申请实施例提供的识别模型的训练方法主要应用于上述第四步的训练环节，在模型训练过程中，通过引入本实施例中确定的质心损失值可以指导识别模型快速完成训练任务，从而提高了模型训练的效率以及准确性。

图3是本申请实施例示出的交通标线的识别方法的流程示意图。

参见图3，本申请实施例提供的交通标线的识别方法，具体包括：

步骤301：获取包含交通标线的道路图像；

步骤302：将道路图像输入识别模型，得到识别模型输出的结果图像；

其中，结果图像包括对道路图像中交通标线进行标记的识别结果；识别模型基于如上的模型训练方法训练得到。

本实施例中，通过上述实施例训练得到的识别模型主要应用于智能驾驶领域内的交通标线识别场景中，该场景中，待识别图像为包含交通标线的道路图像，交通标线是指在道路的路面上用线条、箭头、文字、立面标记、突起路标和轮廓标等向交通参与者传递引导、限制、警告等交通信息的标识。

实际应用中，目标物的识别方法的执行主体可以是处理器或者服务器，比如在自动驾驶场景中，目标物的识别方法的执行主体可以是部署于车辆上的处理器，或者部署于车辆以外的处理器或者服务器。

道路图像可以由安装于车辆上的图像采集设备采集得到，比如可以通过安装于车辆前端的摄像头采集车辆前方的道路图像，结果图像可以是在待识别图像中标记有交通标线轮廓的图像。

为了验证本实施例提供的交通标线的识别方法的识别精度提升效果，本实施例使用仅基于网络损失训练得到的传统模型以及本实施例提供的引入质心损失值训练得到的识别模型对同一待识别图像进行识别。

在对比验证中，待识别图像采用包含交通标线的道路图像，图4示例性的示出了该道路图像，该道路图像由安装于车辆前方的摄像头采集得到，该道路图像中包含道路上的车辆、道路两侧的路牌、信号灯、树木以及路面上的交通标线，本实施例的识别目标是从待识别的道路图像中识别出路面上交通标线的位置，具体地，该待识别图像中路面上可显现出4处交通标线，该待识别图像对应的路面交通标线的识别标签可以参见图5，通过传统模型对该待识别图像进行识别后，得到的路面交通标线的识别结果可以参见图6，通过本实施例训练得到的识别模型对该待识别图像进行识别后，得到的路面交通标线的识别结果可以参见图7。

将图6所示路面交通标线的识别结果、图7所示路面交通标线的识别结果分别与图5所示的路面交通标线的识别标签进行比对可以发现，图6所示路面交通标线的识别结果对较远处的路面上的交通标线存在一处漏识别的情况，识别效果较差，而图7所示路面交通标线的识别结果与图5所示的路面交通标线的识别标签更为接近，识别效果更优。

由此可知，经过本实施例提供的模型训练方法训练得到的识别模型，相较于未引入质心损失值训练得到的传统模型，由于训练后模型参数更优，识别模型对交通标线的识别精度有效提高，同时，模型训练效率也得到了提升。

与前述应用功能实现方法实施例相对应，本申请还提供了一种模型训练装置、交通标线的识别装置、电子设备及相应的实施例。

图8是本申请实施例示出的模型训练装置的结构示意图。

参见图8，本申请实施例提供的模型训练装置，具体包括：

第一处理模块401，用于确定待训练模型中与输入的待识别图像相关的多个第一图像；

第二处理模块402，用于确定对每一第一图像进行不同层级特征提取后各自对应的第二图像；

第三处理模块403，用于分别确定每一第一图像的质心参数以及每一第二图像的质心参数；

第四处理模块404，用于依据每一第一图像的质心参数以及每一第一图像各自对应的第二图像的质心参数，确定质心损失值；

第五处理模块405，用于至少基于质心损失值以及待识别图像的识别结果对待训练模型进行训练。

在一些实施例中，第一处理模块401具体可以用于：

在一些实施例中，待训练模型具体可以包括多层卷积层以及多层反卷积层，卷积层与反卷积层一一对应；

在示例性实施例中，第二处理模块402具体可以用于：

在一些实施例中，第四处理模块404具体可以通过如下过程实现确定每一第一图像的质心参数：

分别将每一第一图像划分为多个图像块；

分别确定每一图像块的质心；

在示例性实施例中，第四处理模块404具体可以通过如下过程实现分别将每一第一图像划分为多个图像块：

确定每一第一图像的图像中心点；

在示例性实施例中，第四处理模块404具体可以通过如下过程实现依据每一第一图像对应的所有图像块的质心，确定每一第一图像的质心参数：

在一些实施例中，第四处理模块404具体可以用于：

将多个质心差值进行加权求和，得到质心损失值。

综上所述，本实施例提供的模型训练装置，由于在模型训练环节引入质心损失值，质心损失值可以表征待训练模型中不同层级下输入端与输出端之间图像的质心位置差异，引入该质心损失值后可以准确指导模型训练，提高了模型训练效率，且训练的得到的模型识别精度更高。

图9是本申请实施例示出的交通标线的识别装置的结构示意图。

参见图9，本申请实施例提供的交通标线的识别装置，具体包括：

获取模块501，用于获取包含交通标线的待识别图像；

识别模块502，用于将待识别图像输入识别模型，得到识别模型输出的结果图像；

其中，结果图像包括对待识别图像中交通标线进行标记的识别结果；该识别模型基于如上的模型训练方法训练得到。

关于上述实施例中的装置，其中各个模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述，此处将不再做详细阐述说明。

图10是本申请实施例示出的电子设备的结构示意图。

参见图10，电子设备600包括存储器601和处理器602。

处理器602可以是中央处理单元（Central Processing Unit，CPU），还可以是其他通用处理器、数字信号处理器（Digital Signal Processor，DSP）、专用集成电路（Application Specific Integrated Circuit，ASIC）、现场可编程门阵列（Field-Programmable Gate Array，FPGA）或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。

存储器601可以包括各种类型的存储单元，例如系统内存、只读存储器（ROM）和永久存储装置。其中，ROM可以存储处理器602或者计算机的其他模块需要的静态数据或者指令。永久存储装置可以是可读写的存储装置。永久存储装置可以是即使计算机断电后也不会失去存储的指令和数据的非易失性存储设备。在一些实施方式中，永久性存储装置采用大容量存储装置（例如磁或光盘、闪存）作为永久存储装置。另外一些实施方式中，永久性存储装置可以是可移除的存储设备（例如软盘、光驱）。系统内存可以是可读写存储设备或者易失性可读写存储设备，例如动态随机访问内存。系统内存可以存储一些或者所有处理器在运行时需要的指令和数据。

此外，存储器601可以包括任意计算机可读存储媒介的组合，包括各种类型的半导体存储芯片（例如DRAM，SRAM，SDRAM，闪存，可编程只读存储器），磁盘和/或光盘也可以采用。在一些实施方式中，存储器601可以包括可读和/或写的可移除的存储设备，例如激光唱片（CD）、只读数字多功能光盘（例如DVD-ROM，双层DVD-ROM）、只读蓝光光盘、超密度光盘、闪存卡（例如SD卡、min SD卡、Micro-SD卡等）、磁性软盘等。计算机可读存储媒介不包含载波和通过无线或有线传输的瞬间电子信号。

存储器601上存储有可执行代码，当可执行代码被处理器602处理时，可以使处理器602执行上文述及的方法中的部分或全部。

此外，根据本申请的方法还可以实现为一种计算机程序或计算机程序产品，该计算机程序或计算机程序产品包括用于执行本申请的上述方法中部分或全部步骤的计算机程序代码指令。

或者，本申请还可以实施为一种计算机可读存储介质（或非暂时性机器可读存储介质或机器可读存储介质），其上存储有可执行代码（或计算机程序或计算机指令代码），当可执行代码（或计算机程序或计算机指令代码）被电子设备（或服务器等）的处理器执行时，使处理器执行根据本申请的上述方法的各个步骤的部分或全部。

以上已经描述了本申请的各实施例，上述说明是示例性的，并非穷尽性的，并且也不限于所披露的各实施例。在不偏离所说明的各实施例的范围和精神的情况下，对于本技术领域的普通技术人员来说许多修改和变更都是显而易见的。本文中所用术语的选择，旨在最好地解释各实施例的原理、实际应用或对市场中的技术的改进，或者使本技术领域的其他普通技术人员能理解本文披露的各实施例。

Claims

1.一种模型训练方法，其特征在于，包括：

2.根据权利要求1所述的模型训练方法，其特征在于，所述确定待训练模型中与输入的待识别图像相关的多个第一图像，包括：

3.根据权利要求1所述的模型训练方法，其特征在于，所述待训练模型包括多层卷积层以及多层反卷积层，所述卷积层与所述反卷积层一一对应；

4.根据权利要求3所述的模型训练方法，其特征在于，所述确定对每一所述第一图像进行不同层级特征提取后各自对应的第二图像，包括：

5.根据权利要求1所述的模型训练方法，其特征在于，确定每一所述第一图像的质心参数，包括：

分别将每一所述第一图像划分为多个图像块；

分别确定每一所述图像块的质心；

6.根据权利要求5所述的模型训练方法，其特征在于，所述分别将每一所述第一图像划分为多个图像块，包括：

确定每一所述第一图像的图像中心点；

7.根据权利要求5所述的模型训练方法，其特征在于，所述依据每一所述第一图像对应的所有图像块的质心，确定每一所述第一图像的质心参数，包括：

8.根据权利要求1所述的模型训练方法，其特征在于，所述依据每一所述第一图像的质心参数以及每一所述第一图像各自对应的第二图像的质心参数，确定质心损失值，包括：

将所述多个质心差值进行加权求和，得到质心损失值。

9.一种交通标线的识别方法，其特征在于，包括：

获取包含交通标线的道路图像；

其中，所述结果图像包括对所述道路图像中交通标线进行标记的识别结果；所述识别模型基于如权利要求1至8任一项所述的模型训练方法训练得到。

10.一种模型训练装置，其特征在于，包括：

11.一种交通标线的识别装置，其特征在于，包括：

获取模块，用于获取包含交通标线的待识别图像；

其中，所述结果图像包括对所述待识别图像中交通标线进行标记的识别结果；所述识别模型基于如权利要求1至8任一项所述的模型训练方法训练得到。

12.一种电子设备，其特征在于，包括：

处理器；以及

存储器，其上存储有可执行代码，当所述可执行代码被所述处理器执行时，使所述处理器执行如权利要求1-8中任一项所述的方法。

13.一种计算机可读存储介质，其特征在于，其上存储有可执行代码，当所述可执行代码被电子设备的处理器执行时，使所述处理器执行如权利要求1-8中任一项所述的方法。