CN111126493B

CN111126493B - 深度学习模型的训练方法、装置、电子设备及存储介质

Info

Publication number: CN111126493B
Application number: CN201911359712.1A
Authority: CN
Inventors: 苏英菲
Original assignee: Neusoft Reach Automotive Technology Shenyang Co Ltd
Current assignee: Neusoft Reach Automotive Technology Shenyang Co Ltd
Priority date: 2019-12-25
Filing date: 2019-12-25
Publication date: 2023-08-01
Anticipated expiration: 2039-12-25
Also published as: CN111126493A

Abstract

本发明公开了一种深度学习模型的训练方法、装置、电子设备及存储介质，所述方法包括：获取用于训练深度学习模型的原始图像；将所述原始图像转换至设定图像空间，得到设定图像空间下的转换图像；对所述原始图像和所述转换图像进行融合，得到融合图像信息；将所述融合图像信息输入至设定的深度学习模型进行训练。本发明可以在不增加采集的原始图像数量的情况下丰富用于训练深度学习模型的图像信息，由于训练深度学习模型的图像信息更丰富，因而可以更好的突显出原始图像信息的特征，更有利于基于该特征进行深度学习，进而可以训练出更准确的模型。

Description

深度学习模型的训练方法、装置、电子设备及存储介质

技术领域

本发明涉及人工智能技术领域，尤其涉及一种深度学习模型的训练方法、装置、电子设备及存储介质。

背景技术

深度学习模型训练的整体框架包括：获取样本图像，然后对样本图像进行预处理，进而将预处理后的图像输入已有模型(如，yolo模型等)中进行训练。

相关技术中，为了提高深度学习模型的精度，通常是采用增加样本图像数量以及延长模型训练时长等方式，然而这些方式会耗费较多的时间和算力，无法满足实际的应用需求。

发明内容

有鉴于此，本发明提出一种深度学习模型的训练方法、装置、电子设备及存储介质以解决上述技术问题。

为了达到上述目的，本发明所采用的技术方案为：

根据本发明实施例的第一方面，提出了一种深度学习模型的训练方法，包括：

获取用于训练深度学习模型的原始图像；

将所述原始图像转换至设定图像空间，得到设定图像空间下的转换图像；

对所述原始图像和所述转换图像进行融合，得到融合图像信息；

将所述融合图像信息输入至设定的深度学习模型进行训练。

在一实施例中，所述原始图像包括RGB原始图像；

所述将所述原始图像转换至设定图像空间，得到设定图像空间下的转换图像，包括：

将所述RGB原始图像转到频域空间，得到频域图像；和/或，

将所述RGB原始图像转到HSV颜色空间，得到HSV空间图像。

在一实施例中，所述对所述原始图像和所述转换图像进行融合，得到融合图像信息，包括：

对所述RGB原始图像，以及所述频域图像和/或所述HSV空间图像进行融合处理，得到融合图像信息。

在一实施例中，所述对所述原始图像，以及所述频域图像和/或所述HSV空间图像进行融合处理，得到融合图像信息，包括：

基于所述RGB原始图像中的边界框BoundingBox、所述HSV空间图像中的boundbox和/或所述RGB原始图像中的边界框BoundingBox的频域转换信息生成目标向量。

在一实施例中，所述获取用于训练深度学习模型的原始图像，包括：

基于车载摄像装置获取当前车辆的周围环境图像；

基于所述周围环境图像确定用于训练深度学习模型的原始图像。

根据本发明实施例的第二方面，提出了一种深度学习模型的训练装置，包括：

原始图像获取模块，用于获取用于训练深度学习模型的原始图像；

转换图像获取模块，用于将所述原始图像转换至设定图像空间，得到设定图像空间下的转换图像；

融合信息获取模块，用于对所述原始图像和所述转换图像进行融合，得到融合图像信息；

学习模型训练模块，用于将所述融合图像信息输入至设定的深度学习模型进行训练。

在一实施例中，所述原始图像包括RGB原始图像；

所述转换图像获取模块，包括：

频域图像获取单元，用于将所述RGB原始图像转到频域空间，得到频域图像；和/或，

HSV图像获取单元，用于将所述RGB原始图像转到HSV颜色空间，得到HSV空间图像。

在一实施例中，所述融合信息获取模块还用于对所述RGB原始图像，以及所述频域图像和/或所述HSV空间图像进行融合处理，得到融合图像信息。

在一实施例中，所述融合信息获取模块还用于基于所述RGB原始图像中的边界框BoundingBox、所述HSV空间图像中的boundbox和/或所述RGB原始图像中的边界框BoundingBox的频域转换信息生成目标向量。

在一实施例中，所述原始图像获取模块，包括：

环境图像获取单元，用于基于车载摄像装置获取当前车辆的周围环境图像；

原始图像确定单元，用于基于所述周围环境图像确定用于训练深度学习模型的原始图像。

根据本发明实施例的第三方面，提出了一种电子设备，所述电子设备包括：

处理器；

被配置为存储处理器可执行指令的存储器；

其中，所述处理器被配置为：

获取用于训练深度学习模型的原始图像；

将所述融合图像信息输入至设定的深度学习模型进行训练。

根据本发明实施例的第四方面，提出了一种计算机可读存储介质，其上存储有计算机程序，该程序被处理器处理时实现：

获取用于训练深度学习模型的原始图像；

将所述融合图像信息输入至设定的深度学习模型进行训练。

与现有技术相比较，本发明的深度学习模型的训练方法，通过获取用于训练深度学习模型的原始图像，并将所述原始图像转换至设定图像空间，得到设定图像空间下的转换图像，以及对所述原始图像和所述转换图像进行融合，得到融合图像信息，进而将所述融合图像信息输入至设定的深度学习模型进行训练，可以在不增加采集的原始图像数量的情况下丰富用于训练深度学习模型的图像信息，由于训练深度学习模型的图像信息更丰富，因而可以更好的突显出原始图像信息的特征，更有利于基于该特征进行深度学习，进而可以训练出更准确的模型。

附图说明

图1示出了根据本发明的一示例性实施例的深度学习模型的训练方法的流程图；

图2示出了根据本发明的又一示例性实施例的深度学习模型的训练方法的流程图；

图3示出了根据本发明的另一示例性实施例的深度学习模型的训练方法的流程图；

图4示出了根据本发明的一示例性实施例的深度学习模型的训练装置的结构框图；

图5示出了根据本发明的另一示例性实施例的深度学习模型的训练装置的结构框图；

图6示出了根据本发明的一示例性实施例的电子设备的结构框图。

具体实施方式

以下将结合附图所示的具体实施例对本发明进行详细描述。但这些实施例并不限制本发明，本领域的普通技术人员根据这些实施例所做出的结构、方法、或功能上的变换均包含在本发明的保护范围内。

在本发明使用的术语是仅仅出于描述特定实施例的目的，而非旨在限制本发明。在本发明和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式，除非上下文清楚地表示其他含义。还应当理解，本文中使用的术语“和/或”是指并包含一个或多个相关联的列出项目的任何或所有可能组合。

应当理解，尽管在本发明可能采用术语第一、第二等来描述各种结构，但这些结构不应限于这些术语。这些术语仅用来将同一类型的结构彼此区分开。

图1示出了根据本发明的一示例性实施例的深度学习模型的训练方法的流程图。本实施例的方法可以应用于服务端(如，一台服务器或多台服务器组成的服务器集群等)。如图1所示，该方法包括以下步骤S101-S104：

在步骤S101中，获取用于训练深度学习模型的原始图像。

本实施例中，服务端可以获取多幅用于训练深度学习模型的原始图像。

可以理解的是，上述原始图像与深度学习模型的用途相匹配。举例来说，若上述深度学习模型的用途是在自动驾驶领域实现车辆周围环境内的物体识别，则上述原始图像可以包括车辆周围环境的图像。

在一实施例中，上述用于训练深度学习模型的原始图像的类型可以由开发人员根据实际需要进行设置，本实施例对此不进行限定。

在另一实施例中，服务端获取上述原始图像的方式可以参见下述图3所示实施例，在此先不进行详述。

在步骤S102中，将所述原始图像转换至设定图像空间，得到设定图像空间下的转换图像。

在一实施例中，当获取用于训练深度学习模型的原始图像后，可以将该原始图像转换至一个或多个设定图像空间，得到相应设定图像空间下的转换图像。

举例来说，上述设定图像空间可以包括HSV图像空间和频域空间中的至少一种，本实施例对此不进行限定。

可以理解的是，由于将所述原始图像转换至设定图像空间，得到设定图像空间下的转换图像，可以更好的突显出原始图像信息的特征，可以实现增加后续用于训练深度学习模型的信息的丰富性。

在另一实施例中，上述将所述原始图像转换至设定图像空间，得到设定图像空间下的转换图像的方式还可以参见下述图2所示实施例，在此先不进行详述。

在步骤S103中，对所述原始图像和所述转换图像进行融合，得到融合图像信息。

本实施例中，当将原始图像转换至设定图像空间，得到设定图像空间下的转换图像后，可以对上述原始图像和得到的转换图像进行融合，得到融合图像信息。

举例来说，当将原始图像转换至设定图像空间，得到设定图像空间下的转换图像后，可以将上述原始图像对应的图像信息和转换图像对应的图像信息进行融合，得到融合后的图像信息，即上述的融合图像信息。其中，上述图像信息除包括原始图像的各个颜色通道的信息、灰度信息、目标物体的标注信息(如，边界框Bounding Box等)中的至少一种，本实施例对此不进行限定。

在一实施例中，上述融合图像信息的类型可以为向量Vector，本实施例对此不进行限定。

在另一实施例中，上述对所述原始图像和所述转换图像进行融合，得到融合图像信息的方式还可以参见下述图2所示实施例，在此先不进行详述。

在步骤S104中，将所述融合图像信息输入至设定的深度学习模型进行训练。

本实施例中，当对所述原始图像和所述转换图像进行融合，得到融合图像信息后，可以将所述融合图像信息输入至设定的深度学习模型进行训练。

举例来说，当得到融合图像信息后，可以将该融合图像信息中包含的各个维度信息，如图像信息和标注信息等，共同作为训练数据输入至设定的深度学习模型进行训练。

在一实施例中，上述设定的深度学习模型可以由开发人员根据实际业务需要进行设置，如设置为YOLO目标检测模型等，本实施例对此不进行限定。

由上述技术方案可知，本实施例的深度学习模型的训练方法，通过获取用于训练深度学习模型的原始图像，并将所述原始图像转换至设定图像空间，得到设定图像空间下的转换图像，以及对所述原始图像和所述转换图像进行融合，得到融合图像信息，进而将所述融合图像信息输入至设定的深度学习模型进行训练，可以在不增加采集的原始图像数量的情况下丰富用于训练深度学习模型的图像信息，由于训练深度学习模型的图像信息更丰富，因而可以更好的突显出原始图像信息的特征，更有利于基于该特征进行深度学习，进而可以训练出更准确的模型。

图2示出了根据本发明的又一示例性实施例的深度学习模型的训练方法的流程图；本实施例的方法可以应用于服务端(如，一台服务器或多台服务器组成的服务器集群等)。如图2所示，该方法包括以下步骤S201-S204：

在步骤S201中，获取用于训练深度学习模型的原始图像。

其中，上述用于训练深度学习模型的原始图像可以是RGB图像。

在步骤S202中，将所述RGB原始图像转到频域空间，得到频域图像；和/或，将所述RGB原始图像转到HSV颜色空间，得到HSV空间图像。

在一实施例中，当获取用于训练深度学习模型的原始图像后，可以将该原始图像转换至频域空间和HSV空间，进而可以得到这两个图像空间下的转换图像。

值得说明的是，上述将该原始图像转换至频域空间和HSV空间的方式可以参见相关技术中的解释和说明，本实施例对此不进行限定。

可以理解的是，由于将所述原始图像转换至频域空间和HSV空间，得到该设定图像空间下的转换图像，可以更好的突显出原始图像信息的特征，可以实现增加后续用于训练深度学习模型的信息的丰富性。

在步骤S203中，对所述RGB原始图像，以及所述频域图像和/或所述HSV空间图像进行融合处理，得到融合图像信息。

本实施例中，当将所述RGB原始图像转到频域空间，得到频域图像；和/或，将所述RGB原始图像转到HSV颜色空间，得到HSV空间图像后，可以对所述RGB原始图像，以及所述频域图像和/或所述HSV空间图像进行融合处理，得到融合图像信息。

在一实施例中，当将所述RGB原始图像转到频域空间，得到频域图像；和/或，将所述RGB原始图像转到HSV颜色空间，得到HSV空间图像后，可以将上述频域图像和/或所述HSV空间图像对应的图像信息进行融合，得到融合后的图像信息，即上述的融合图像信息。其中，上述图像信息除包括原始图像的各个颜色通道的信息、灰度信息、目标物体的标注信息(如，边界框Bounding Box等)中的至少一种，本实施例对此不进行限定。

举例来说，上述对所述原始图像，以及所述频域图像和/或所述HSV空间图像进行融合处理，得到融合图像信息的方式可以包括：基于上述RGB原始图像中的边界框BoundingBox、所述HSV空间图像中的boundbox和/或所述RGB原始图像中的边界框BoundingBox的频域转换信息(如，FFT信息等)生成目标向量Vector。

在步骤S204中，将所述融合图像信息输入至设定的深度学习模型进行训练。

本实施例中，当对所述RGB原始图像，以及所述频域图像和/或所述HSV空间图像进行融合处理，得到融合图像信息后，可以将所述融合图像信息输入至设定的深度学习模型进行训练。

由上述技术方案可知，本实施例的深度学习模型的训练方法，通过获取用于训练深度学习模型的原始图像，并将所述RGB原始图像转到频域空间，得到频域图像；和/或将所述RGB原始图像转到HSV颜色空间，得到HSV空间图像，以及对所述RGB原始图像，以及所述频域图像和/或所述HSV空间图像进行融合处理，得到融合图像信息，进而将所述融合图像信息输入至设定的深度学习模型进行训练，可以在不增加采集的原始图像数量的情况下丰富用于训练深度学习模型的图像信息，由于训练深度学习模型的图像信息更丰富，因而可以更好的突显出原始图像信息的特征，更有利于基于该特征进行深度学习，进而可以训练出更准确的模型。

图3示出了根据本发明的另一示例性实施例的深度学习模型的训练方法的流程图；本实施例的方法可以应用于服务端(如，一台服务器或多台服务器组成的服务器集群等)。如图3所示，该方法包括以下步骤S301-S305：

在步骤S301中，基于车载摄像装置获取当前车辆的周围环境图像。

本实施例中，当前车辆上安装有车载摄像装置(如，车载摄像头等)，在车辆行驶过程中，可以基于车辆摄像装置采集当前车辆的周围环境图像；在此基础上，服务端可以通过有线或无线的方式与该车载摄像装置进行通信，以获取车辆摄像装置采集的多幅周围环境图像。

在一实施例中，上述多幅周围环境图像可以是RGB图像。

在步骤S302中，基于所述周围环境图像确定用于训练深度学习模型的原始图像。

本实施例中，当基于车载摄像装置获取当前车辆的周围环境图像后，可以基于所述周围环境图像确定用于训练深度学习模型的原始图像。

举例来说，服务端可以基于设定需求，从获取的多幅周围环境图像中确定部分图像或全部图像作为后续用于训练深度学习模型的原始图像。

值得说明的是，上述设定需求可以由开发人员根据实际业务需要进行设置，如设置为图像内容、图像质量或图像数量等，本实施例对此不进行限定。

在步骤S303中，将所述原始图像转换至设定图像空间，得到设定图像空间下的转换图像。

其中，上述将所述原始图像转换至设定图像空间，得到设定图像空间下的转换图像的方式还可以参见上述实施例，在此先不进行赘述。

在步骤S304中，对所述原始图像和所述转换图像进行融合，得到融合图像信息。

在步骤S305中，将所述融合图像信息输入至设定的深度学习模型进行训练。

图4示出了根据本发明的一示例性实施例的深度学习模型的训练装置的结构框图；如图4所示，该装置包括：原始图像获取模块110、转换图像获取模块120、融合信息获取模块130以及学习模型训练模块140，其中：

原始图像获取模块110，用于获取用于训练深度学习模型的原始图像；

转换图像获取模块120，用于将所述原始图像转换至设定图像空间，得到设定图像空间下的转换图像；

融合信息获取模块130，用于对所述原始图像和所述转换图像进行融合，得到融合图像信息；

学习模型训练模块140，用于将所述融合图像信息输入至设定的深度学习模型进行训练。

由上述技术方案可知，本实施例的深度学习模型的训练装置，通过获取用于训练深度学习模型的原始图像，并将所述原始图像转换至设定图像空间，得到设定图像空间下的转换图像，以及对所述原始图像和所述转换图像进行融合，得到融合图像信息，进而将所述融合图像信息输入至设定的深度学习模型进行训练，可以在不增加采集的原始图像数量的情况下丰富用于训练深度学习模型的图像信息，由于训练深度学习模型的图像信息更丰富，因而可以更好的突显出原始图像信息的特征，更有利于基于该特征进行深度学习，进而可以训练出更准确的模型。

图5示出了根据本发明的另一示例性实施例的深度学习模型的训练装置的结构框图；其中，原始图像获取模块210、转换图像获取模块220、融合信息获取模块230以及学习模型训练模块240与前述图4所示实施例中的原始图像获取模块110、转换图像获取模块120、融合信息获取模块130以及学习模型训练模块140的功能相同，在此不进行赘述。如图5所示，该原始图像可以包括RGB原始图像；

转换图像获取模块220，可以包括：

在一实施例中，融合信息获取模块230还用于对所述RGB原始图像，以及所述频域图像和/或所述HSV空间图像进行融合处理，得到融合图像信息。

在一实施例中，融合信息获取模块230还用于基于所述RGB原始图像中的边界框BoundingBox、所述HSV空间图像中的boundbox和/或所述RGB原始图像中的边界框BoundingBox的频域转换信息生成目标向量。

在一实施例中，原始图像获取模块210，可以包括：

环境图像获取单元211，用于基于车载摄像装置获取当前车辆的周围环境图像；

原始图像确定单元212，用于基于所述周围环境图像确定用于训练深度学习模型的原始图像。

对于装置实施例而言，由于其基本对应于方法实施例，所以相关之处参见方法实施例的部分说明即可。以上所描述的装置实施例仅仅是示意性的，其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本发明方案的目的。本领域普通技术人员在不付出创造性劳动的情况下，即可以理解并实施。

本发明深度学习模型的训练装置的实施例可以应用在网络设备上。装置实施例可以通过软件实现，也可以通过硬件或者软硬件结合的方式实现。以软件实现为例，作为一个逻辑意义上的装置，是通过其所在设备的处理器将非易失性存储器中对应的计算机程序指令读取到内存中运行形成的。从硬件层面而言，如图6所示，为本发明的深度学习模型的训练装置所在电子设备的一种硬件结构图，除了图6所示的处理器、网络接口、内存以及非易失性存储器之外，实施例中装置所在的设备通常还可以包括其他硬件，如负责处理报文的转发芯片等等；从硬件结构上来讲该设备还可能是分布式的设备，可能包括多个接口卡，以便在硬件层面进行报文处理的扩展。

本发明实施例还提供了一种计算机可读存储介质，其上存储有计算机程序，该程序被处理器处理时实现以下任务处理方法：

获取用于训练深度学习模型的原始图像；

将所述融合图像信息输入至设定的深度学习模型进行训练。

本领域技术人员在考虑说明书及实践这里公开的发明后，将容易想到本发明的其它实施方案。本发明旨在涵盖本发明的任何变型、用途或者适应性变化，这些变型、用途或者适应性变化遵循本发明的一般性原理并包括本发明未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的，本发明的真正范围和精神由本发明的权利要求指出。

应当理解的是，本发明并不局限于上面已经描述并在附图中示出的精确结构，并且可以在不脱离其范围进行各种修改和改变。本发明的范围仅由所附的权利要求来限制。

Claims

1.一种深度学习模型的训练方法，其特征在于，包括：

获取用于训练深度学习模型的原始图像，所述原始图像包括RGB原始图像；

将所述融合图像信息输入至设定的深度学习模型进行训练；

将所述RGB原始图像转到频域空间，得到频域图像；和/或，

将所述RGB原始图像转到HSV颜色空间，得到HSV空间图像；

所述对所述原始图像和所述转换图像进行融合，得到融合图像信息，包括：

2.根据权利要求1所述的方法，其特征在于，所述获取用于训练深度学习模型的原始图像，包括：

基于车载摄像装置获取当前车辆的周围环境图像；

3.一种深度学习模型的训练装置，其特征在于，包括：

原始图像获取模块，用于获取用于训练深度学习模型的原始图像，所述原始图像包括RGB原始图像；

学习模型训练模块，用于将所述融合图像信息输入至设定的深度学习模型进行训练；

所述转换图像获取模块，包括：

HSV图像获取单元，用于将所述RGB原始图像转到HSV颜色空间，得到HSV空间图像；

所述融合信息获取模块还用于基于所述RGB原始图像中的边界框BoundingBox、所述HSV空间图像中的boundbox和/或所述RGB原始图像中的边界框BoundingBox的频域转换信息生成目标向量。

4.根据权利要求3所述的装置，其特征在于，所述原始图像获取模块，包括：

5.一种电子设备，其特征在于，所述电子设备包括：

处理器；

被配置为存储处理器可执行指令的存储器；

其中，所述处理器被配置为：

将所述融合图像信息输入至设定的深度学习模型进行训练；

将所述RGB原始图像转到频域空间，得到频域图像；和/或，

将所述RGB原始图像转到HSV颜色空间，得到HSV空间图像；

6.一种计算机可读存储介质，其上存储有计算机程序，其特征在于，该程序被处理器处理时实现：

将所述融合图像信息输入至设定的深度学习模型进行训练；

将所述RGB原始图像转到频域空间，得到频域图像；和/或，

将所述RGB原始图像转到HSV颜色空间，得到HSV空间图像；