CN111126493B - 深度学习模型的训练方法、装置、电子设备及存储介质 - Google Patents

深度学习模型的训练方法、装置、电子设备及存储介质 Download PDF

Info

Publication number
CN111126493B
CN111126493B CN201911359712.1A CN201911359712A CN111126493B CN 111126493 B CN111126493 B CN 111126493B CN 201911359712 A CN201911359712 A CN 201911359712A CN 111126493 B CN111126493 B CN 111126493B
Authority
CN
China
Prior art keywords
image
original image
space
learning model
deep learning
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201911359712.1A
Other languages
English (en)
Other versions
CN111126493A (zh
Inventor
苏英菲
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Neusoft Reach Automotive Technology Shenyang Co Ltd
Original Assignee
Neusoft Reach Automotive Technology Shenyang Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Neusoft Reach Automotive Technology Shenyang Co Ltd filed Critical Neusoft Reach Automotive Technology Shenyang Co Ltd
Priority to CN201911359712.1A priority Critical patent/CN111126493B/zh
Publication of CN111126493A publication Critical patent/CN111126493A/zh
Application granted granted Critical
Publication of CN111126493B publication Critical patent/CN111126493B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/25Fusion techniques
    • G06F18/251Fusion techniques of input or preprocessed data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02TCLIMATE CHANGE MITIGATION TECHNOLOGIES RELATED TO TRANSPORTATION
    • Y02T10/00Road transport of goods or passengers
    • Y02T10/10Internal combustion engine [ICE] based vehicles
    • Y02T10/40Engine management systems

Abstract

本发明公开了一种深度学习模型的训练方法、装置、电子设备及存储介质,所述方法包括:获取用于训练深度学习模型的原始图像;将所述原始图像转换至设定图像空间,得到设定图像空间下的转换图像;对所述原始图像和所述转换图像进行融合,得到融合图像信息;将所述融合图像信息输入至设定的深度学习模型进行训练。本发明可以在不增加采集的原始图像数量的情况下丰富用于训练深度学习模型的图像信息,由于训练深度学习模型的图像信息更丰富,因而可以更好的突显出原始图像信息的特征,更有利于基于该特征进行深度学习,进而可以训练出更准确的模型。

Description

深度学习模型的训练方法、装置、电子设备及存储介质
技术领域
本发明涉及人工智能技术领域,尤其涉及一种深度学习模型的训练方法、装置、电子设备及存储介质。
背景技术
深度学习模型训练的整体框架包括:获取样本图像,然后对样本图像进行预处理,进而将预处理后的图像输入已有模型(如,yolo模型等)中进行训练。
相关技术中,为了提高深度学习模型的精度,通常是采用增加样本图像数量以及延长模型训练时长等方式,然而这些方式会耗费较多的时间和算力,无法满足实际的应用需求。
发明内容
有鉴于此,本发明提出一种深度学习模型的训练方法、装置、电子设备及存储介质以解决上述技术问题。
为了达到上述目的,本发明所采用的技术方案为:
根据本发明实施例的第一方面,提出了一种深度学习模型的训练方法,包括:
获取用于训练深度学习模型的原始图像;
将所述原始图像转换至设定图像空间,得到设定图像空间下的转换图像;
对所述原始图像和所述转换图像进行融合,得到融合图像信息;
将所述融合图像信息输入至设定的深度学习模型进行训练。
在一实施例中,所述原始图像包括RGB原始图像;
所述将所述原始图像转换至设定图像空间,得到设定图像空间下的转换图像,包括:
将所述RGB原始图像转到频域空间,得到频域图像;和/或,
将所述RGB原始图像转到HSV颜色空间,得到HSV空间图像。
在一实施例中,所述对所述原始图像和所述转换图像进行融合,得到融合图像信息,包括:
对所述RGB原始图像,以及所述频域图像和/或所述HSV空间图像进行融合处理,得到融合图像信息。
在一实施例中,所述对所述原始图像,以及所述频域图像和/或所述HSV空间图像进行融合处理,得到融合图像信息,包括:
基于所述RGB原始图像中的边界框BoundingBox、所述HSV空间图像中的boundbox和/或所述RGB原始图像中的边界框BoundingBox的频域转换信息生成目标向量。
在一实施例中,所述获取用于训练深度学习模型的原始图像,包括:
基于车载摄像装置获取当前车辆的周围环境图像;
基于所述周围环境图像确定用于训练深度学习模型的原始图像。
根据本发明实施例的第二方面,提出了一种深度学习模型的训练装置,包括:
原始图像获取模块,用于获取用于训练深度学习模型的原始图像;
转换图像获取模块,用于将所述原始图像转换至设定图像空间,得到设定图像空间下的转换图像;
融合信息获取模块,用于对所述原始图像和所述转换图像进行融合,得到融合图像信息;
学习模型训练模块,用于将所述融合图像信息输入至设定的深度学习模型进行训练。
在一实施例中,所述原始图像包括RGB原始图像;
所述转换图像获取模块,包括:
频域图像获取单元,用于将所述RGB原始图像转到频域空间,得到频域图像;和/或,
HSV图像获取单元,用于将所述RGB原始图像转到HSV颜色空间,得到HSV空间图像。
在一实施例中,所述融合信息获取模块还用于对所述RGB原始图像,以及所述频域图像和/或所述HSV空间图像进行融合处理,得到融合图像信息。
在一实施例中,所述融合信息获取模块还用于基于所述RGB原始图像中的边界框BoundingBox、所述HSV空间图像中的boundbox和/或所述RGB原始图像中的边界框BoundingBox的频域转换信息生成目标向量。
在一实施例中,所述原始图像获取模块,包括:
环境图像获取单元,用于基于车载摄像装置获取当前车辆的周围环境图像;
原始图像确定单元,用于基于所述周围环境图像确定用于训练深度学习模型的原始图像。
根据本发明实施例的第三方面,提出了一种电子设备,所述电子设备包括:
处理器;
被配置为存储处理器可执行指令的存储器;
其中,所述处理器被配置为:
获取用于训练深度学习模型的原始图像;
将所述原始图像转换至设定图像空间,得到设定图像空间下的转换图像;
对所述原始图像和所述转换图像进行融合,得到融合图像信息;
将所述融合图像信息输入至设定的深度学习模型进行训练。
根据本发明实施例的第四方面,提出了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器处理时实现:
获取用于训练深度学习模型的原始图像;
将所述原始图像转换至设定图像空间,得到设定图像空间下的转换图像;
对所述原始图像和所述转换图像进行融合,得到融合图像信息;
将所述融合图像信息输入至设定的深度学习模型进行训练。
与现有技术相比较,本发明的深度学习模型的训练方法,通过获取用于训练深度学习模型的原始图像,并将所述原始图像转换至设定图像空间,得到设定图像空间下的转换图像,以及对所述原始图像和所述转换图像进行融合,得到融合图像信息,进而将所述融合图像信息输入至设定的深度学习模型进行训练,可以在不增加采集的原始图像数量的情况下丰富用于训练深度学习模型的图像信息,由于训练深度学习模型的图像信息更丰富,因而可以更好的突显出原始图像信息的特征,更有利于基于该特征进行深度学习,进而可以训练出更准确的模型。
附图说明
图1示出了根据本发明的一示例性实施例的深度学习模型的训练方法的流程图;
图2示出了根据本发明的又一示例性实施例的深度学习模型的训练方法的流程图;
图3示出了根据本发明的另一示例性实施例的深度学习模型的训练方法的流程图;
图4示出了根据本发明的一示例性实施例的深度学习模型的训练装置的结构框图;
图5示出了根据本发明的另一示例性实施例的深度学习模型的训练装置的结构框图;
图6示出了根据本发明的一示例性实施例的电子设备的结构框图。
具体实施方式
以下将结合附图所示的具体实施例对本发明进行详细描述。但这些实施例并不限制本发明,本领域的普通技术人员根据这些实施例所做出的结构、方法、或功能上的变换均包含在本发明的保护范围内。
在本发明使用的术语是仅仅出于描述特定实施例的目的,而非旨在限制本发明。在本发明和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式,除非上下文清楚地表示其他含义。还应当理解,本文中使用的术语“和/或”是指并包含一个或多个相关联的列出项目的任何或所有可能组合。
应当理解,尽管在本发明可能采用术语第一、第二等来描述各种结构,但这些结构不应限于这些术语。这些术语仅用来将同一类型的结构彼此区分开。
图1示出了根据本发明的一示例性实施例的深度学习模型的训练方法的流程图。本实施例的方法可以应用于服务端(如,一台服务器或多台服务器组成的服务器集群等)。如图1所示,该方法包括以下步骤S101-S104:
在步骤S101中,获取用于训练深度学习模型的原始图像。
本实施例中,服务端可以获取多幅用于训练深度学习模型的原始图像。
可以理解的是,上述原始图像与深度学习模型的用途相匹配。举例来说,若上述深度学习模型的用途是在自动驾驶领域实现车辆周围环境内的物体识别,则上述原始图像可以包括车辆周围环境的图像。
在一实施例中,上述用于训练深度学习模型的原始图像的类型可以由开发人员根据实际需要进行设置,本实施例对此不进行限定。
在另一实施例中,服务端获取上述原始图像的方式可以参见下述图3所示实施例,在此先不进行详述。
在步骤S102中,将所述原始图像转换至设定图像空间,得到设定图像空间下的转换图像。
在一实施例中,当获取用于训练深度学习模型的原始图像后,可以将该原始图像转换至一个或多个设定图像空间,得到相应设定图像空间下的转换图像。
举例来说,上述设定图像空间可以包括HSV图像空间和频域空间中的至少一种,本实施例对此不进行限定。
可以理解的是,由于将所述原始图像转换至设定图像空间,得到设定图像空间下的转换图像,可以更好的突显出原始图像信息的特征,可以实现增加后续用于训练深度学习模型的信息的丰富性。
在另一实施例中,上述将所述原始图像转换至设定图像空间,得到设定图像空间下的转换图像的方式还可以参见下述图2所示实施例,在此先不进行详述。
在步骤S103中,对所述原始图像和所述转换图像进行融合,得到融合图像信息。
本实施例中,当将原始图像转换至设定图像空间,得到设定图像空间下的转换图像后,可以对上述原始图像和得到的转换图像进行融合,得到融合图像信息。
举例来说,当将原始图像转换至设定图像空间,得到设定图像空间下的转换图像后,可以将上述原始图像对应的图像信息和转换图像对应的图像信息进行融合,得到融合后的图像信息,即上述的融合图像信息。其中,上述图像信息除包括原始图像的各个颜色通道的信息、灰度信息、目标物体的标注信息(如,边界框Bounding Box等)中的至少一种,本实施例对此不进行限定。
在一实施例中,上述融合图像信息的类型可以为向量Vector,本实施例对此不进行限定。
在另一实施例中,上述对所述原始图像和所述转换图像进行融合,得到融合图像信息的方式还可以参见下述图2所示实施例,在此先不进行详述。
在步骤S104中,将所述融合图像信息输入至设定的深度学习模型进行训练。
本实施例中,当对所述原始图像和所述转换图像进行融合,得到融合图像信息后,可以将所述融合图像信息输入至设定的深度学习模型进行训练。
举例来说,当得到融合图像信息后,可以将该融合图像信息中包含的各个维度信息,如图像信息和标注信息等,共同作为训练数据输入至设定的深度学习模型进行训练。
在一实施例中,上述设定的深度学习模型可以由开发人员根据实际业务需要进行设置,如设置为YOLO目标检测模型等,本实施例对此不进行限定。
由上述技术方案可知,本实施例的深度学习模型的训练方法,通过获取用于训练深度学习模型的原始图像,并将所述原始图像转换至设定图像空间,得到设定图像空间下的转换图像,以及对所述原始图像和所述转换图像进行融合,得到融合图像信息,进而将所述融合图像信息输入至设定的深度学习模型进行训练,可以在不增加采集的原始图像数量的情况下丰富用于训练深度学习模型的图像信息,由于训练深度学习模型的图像信息更丰富,因而可以更好的突显出原始图像信息的特征,更有利于基于该特征进行深度学习,进而可以训练出更准确的模型。
图2示出了根据本发明的又一示例性实施例的深度学习模型的训练方法的流程图;本实施例的方法可以应用于服务端(如,一台服务器或多台服务器组成的服务器集群等)。如图2所示,该方法包括以下步骤S201-S204:
在步骤S201中,获取用于训练深度学习模型的原始图像。
本实施例中,服务端可以获取多幅用于训练深度学习模型的原始图像。
其中,上述用于训练深度学习模型的原始图像可以是RGB图像。
可以理解的是,上述原始图像与深度学习模型的用途相匹配。举例来说,若上述深度学习模型的用途是在自动驾驶领域实现车辆周围环境内的物体识别,则上述原始图像可以包括车辆周围环境的图像。
在另一实施例中,服务端获取上述原始图像的方式可以参见下述图3所示实施例,在此先不进行详述。
在步骤S202中,将所述RGB原始图像转到频域空间,得到频域图像;和/或,将所述RGB原始图像转到HSV颜色空间,得到HSV空间图像。
在一实施例中,当获取用于训练深度学习模型的原始图像后,可以将该原始图像转换至频域空间和HSV空间,进而可以得到这两个图像空间下的转换图像。
值得说明的是,上述将该原始图像转换至频域空间和HSV空间的方式可以参见相关技术中的解释和说明,本实施例对此不进行限定。
可以理解的是,由于将所述原始图像转换至频域空间和HSV空间,得到该设定图像空间下的转换图像,可以更好的突显出原始图像信息的特征,可以实现增加后续用于训练深度学习模型的信息的丰富性。
在步骤S203中,对所述RGB原始图像,以及所述频域图像和/或所述HSV空间图像进行融合处理,得到融合图像信息。
本实施例中,当将所述RGB原始图像转到频域空间,得到频域图像;和/或,将所述RGB原始图像转到HSV颜色空间,得到HSV空间图像后,可以对所述RGB原始图像,以及所述频域图像和/或所述HSV空间图像进行融合处理,得到融合图像信息。
在一实施例中,当将所述RGB原始图像转到频域空间,得到频域图像;和/或,将所述RGB原始图像转到HSV颜色空间,得到HSV空间图像后,可以将上述频域图像和/或所述HSV空间图像对应的图像信息进行融合,得到融合后的图像信息,即上述的融合图像信息。其中,上述图像信息除包括原始图像的各个颜色通道的信息、灰度信息、目标物体的标注信息(如,边界框Bounding Box等)中的至少一种,本实施例对此不进行限定。
举例来说,上述对所述原始图像,以及所述频域图像和/或所述HSV空间图像进行融合处理,得到融合图像信息的方式可以包括:基于上述RGB原始图像中的边界框BoundingBox、所述HSV空间图像中的boundbox和/或所述RGB原始图像中的边界框BoundingBox的频域转换信息(如,FFT信息等)生成目标向量Vector。
在步骤S204中,将所述融合图像信息输入至设定的深度学习模型进行训练。
本实施例中,当对所述RGB原始图像,以及所述频域图像和/或所述HSV空间图像进行融合处理,得到融合图像信息后,可以将所述融合图像信息输入至设定的深度学习模型进行训练。
举例来说,当得到融合图像信息后,可以将该融合图像信息中包含的各个维度信息,如图像信息和标注信息等,共同作为训练数据输入至设定的深度学习模型进行训练。
在一实施例中,上述设定的深度学习模型可以由开发人员根据实际业务需要进行设置,如设置为YOLO目标检测模型等,本实施例对此不进行限定。
由上述技术方案可知,本实施例的深度学习模型的训练方法,通过获取用于训练深度学习模型的原始图像,并将所述RGB原始图像转到频域空间,得到频域图像;和/或将所述RGB原始图像转到HSV颜色空间,得到HSV空间图像,以及对所述RGB原始图像,以及所述频域图像和/或所述HSV空间图像进行融合处理,得到融合图像信息,进而将所述融合图像信息输入至设定的深度学习模型进行训练,可以在不增加采集的原始图像数量的情况下丰富用于训练深度学习模型的图像信息,由于训练深度学习模型的图像信息更丰富,因而可以更好的突显出原始图像信息的特征,更有利于基于该特征进行深度学习,进而可以训练出更准确的模型。
图3示出了根据本发明的另一示例性实施例的深度学习模型的训练方法的流程图;本实施例的方法可以应用于服务端(如,一台服务器或多台服务器组成的服务器集群等)。如图3所示,该方法包括以下步骤S301-S305:
在步骤S301中,基于车载摄像装置获取当前车辆的周围环境图像。
本实施例中,当前车辆上安装有车载摄像装置(如,车载摄像头等),在车辆行驶过程中,可以基于车辆摄像装置采集当前车辆的周围环境图像;在此基础上,服务端可以通过有线或无线的方式与该车载摄像装置进行通信,以获取车辆摄像装置采集的多幅周围环境图像。
在一实施例中,上述多幅周围环境图像可以是RGB图像。
在步骤S302中,基于所述周围环境图像确定用于训练深度学习模型的原始图像。
本实施例中,当基于车载摄像装置获取当前车辆的周围环境图像后,可以基于所述周围环境图像确定用于训练深度学习模型的原始图像。
举例来说,服务端可以基于设定需求,从获取的多幅周围环境图像中确定部分图像或全部图像作为后续用于训练深度学习模型的原始图像。
值得说明的是,上述设定需求可以由开发人员根据实际业务需要进行设置,如设置为图像内容、图像质量或图像数量等,本实施例对此不进行限定。
在步骤S303中,将所述原始图像转换至设定图像空间,得到设定图像空间下的转换图像。
在一实施例中,当获取用于训练深度学习模型的原始图像后,可以将该原始图像转换至一个或多个设定图像空间,得到相应设定图像空间下的转换图像。
举例来说,上述设定图像空间可以包括HSV图像空间和频域空间中的至少一种,本实施例对此不进行限定。
可以理解的是,由于将所述原始图像转换至设定图像空间,得到设定图像空间下的转换图像,可以更好的突显出原始图像信息的特征,可以实现增加后续用于训练深度学习模型的信息的丰富性。
其中,上述将所述原始图像转换至设定图像空间,得到设定图像空间下的转换图像的方式还可以参见上述实施例,在此先不进行赘述。
在步骤S304中,对所述原始图像和所述转换图像进行融合,得到融合图像信息。
本实施例中,当将原始图像转换至设定图像空间,得到设定图像空间下的转换图像后,可以对上述原始图像和得到的转换图像进行融合,得到融合图像信息。
举例来说,当将原始图像转换至设定图像空间,得到设定图像空间下的转换图像后,可以将上述原始图像对应的图像信息和转换图像对应的图像信息进行融合,得到融合后的图像信息,即上述的融合图像信息。其中,上述图像信息除包括原始图像的各个颜色通道的信息、灰度信息、目标物体的标注信息(如,边界框Bounding Box等)中的至少一种,本实施例对此不进行限定。
在一实施例中,上述融合图像信息的类型可以为向量Vector,本实施例对此不进行限定。
在另一实施例中,上述对所述原始图像和所述转换图像进行融合,得到融合图像信息的方式还可以参见下述图2所示实施例,在此先不进行详述。
在步骤S305中,将所述融合图像信息输入至设定的深度学习模型进行训练。
本实施例中,当对所述原始图像和所述转换图像进行融合,得到融合图像信息后,可以将所述融合图像信息输入至设定的深度学习模型进行训练。
举例来说,当得到融合图像信息后,可以将该融合图像信息中包含的各个维度信息,如图像信息和标注信息等,共同作为训练数据输入至设定的深度学习模型进行训练。
在一实施例中,上述设定的深度学习模型可以由开发人员根据实际业务需要进行设置,如设置为YOLO目标检测模型等,本实施例对此不进行限定。
由上述技术方案可知,本实施例的深度学习模型的训练方法,通过获取用于训练深度学习模型的原始图像,并将所述原始图像转换至设定图像空间,得到设定图像空间下的转换图像,以及对所述原始图像和所述转换图像进行融合,得到融合图像信息,进而将所述融合图像信息输入至设定的深度学习模型进行训练,可以在不增加采集的原始图像数量的情况下丰富用于训练深度学习模型的图像信息,由于训练深度学习模型的图像信息更丰富,因而可以更好的突显出原始图像信息的特征,更有利于基于该特征进行深度学习,进而可以训练出更准确的模型。
图4示出了根据本发明的一示例性实施例的深度学习模型的训练装置的结构框图;如图4所示,该装置包括:原始图像获取模块110、转换图像获取模块120、融合信息获取模块130以及学习模型训练模块140,其中:
原始图像获取模块110,用于获取用于训练深度学习模型的原始图像;
转换图像获取模块120,用于将所述原始图像转换至设定图像空间,得到设定图像空间下的转换图像;
融合信息获取模块130,用于对所述原始图像和所述转换图像进行融合,得到融合图像信息;
学习模型训练模块140,用于将所述融合图像信息输入至设定的深度学习模型进行训练。
由上述技术方案可知,本实施例的深度学习模型的训练装置,通过获取用于训练深度学习模型的原始图像,并将所述原始图像转换至设定图像空间,得到设定图像空间下的转换图像,以及对所述原始图像和所述转换图像进行融合,得到融合图像信息,进而将所述融合图像信息输入至设定的深度学习模型进行训练,可以在不增加采集的原始图像数量的情况下丰富用于训练深度学习模型的图像信息,由于训练深度学习模型的图像信息更丰富,因而可以更好的突显出原始图像信息的特征,更有利于基于该特征进行深度学习,进而可以训练出更准确的模型。
图5示出了根据本发明的另一示例性实施例的深度学习模型的训练装置的结构框图;其中,原始图像获取模块210、转换图像获取模块220、融合信息获取模块230以及学习模型训练模块240与前述图4所示实施例中的原始图像获取模块110、转换图像获取模块120、融合信息获取模块130以及学习模型训练模块140的功能相同,在此不进行赘述。如图5所示,该原始图像可以包括RGB原始图像;
转换图像获取模块220,可以包括:
频域图像获取单元,用于将所述RGB原始图像转到频域空间,得到频域图像;和/或,
HSV图像获取单元,用于将所述RGB原始图像转到HSV颜色空间,得到HSV空间图像。
在一实施例中,融合信息获取模块230还用于对所述RGB原始图像,以及所述频域图像和/或所述HSV空间图像进行融合处理,得到融合图像信息。
在一实施例中,融合信息获取模块230还用于基于所述RGB原始图像中的边界框BoundingBox、所述HSV空间图像中的boundbox和/或所述RGB原始图像中的边界框BoundingBox的频域转换信息生成目标向量。
在一实施例中,原始图像获取模块210,可以包括:
环境图像获取单元211,用于基于车载摄像装置获取当前车辆的周围环境图像;
原始图像确定单元212,用于基于所述周围环境图像确定用于训练深度学习模型的原始图像。
对于装置实施例而言,由于其基本对应于方法实施例,所以相关之处参见方法实施例的部分说明即可。以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本发明方案的目的。本领域普通技术人员在不付出创造性劳动的情况下,即可以理解并实施。
本发明深度学习模型的训练装置的实施例可以应用在网络设备上。装置实施例可以通过软件实现,也可以通过硬件或者软硬件结合的方式实现。以软件实现为例,作为一个逻辑意义上的装置,是通过其所在设备的处理器将非易失性存储器中对应的计算机程序指令读取到内存中运行形成的。从硬件层面而言,如图6所示,为本发明的深度学习模型的训练装置所在电子设备的一种硬件结构图,除了图6所示的处理器、网络接口、内存以及非易失性存储器之外,实施例中装置所在的设备通常还可以包括其他硬件,如负责处理报文的转发芯片等等;从硬件结构上来讲该设备还可能是分布式的设备,可能包括多个接口卡,以便在硬件层面进行报文处理的扩展。
本发明实施例还提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器处理时实现以下任务处理方法:
获取用于训练深度学习模型的原始图像;
将所述原始图像转换至设定图像空间,得到设定图像空间下的转换图像;
对所述原始图像和所述转换图像进行融合,得到融合图像信息;
将所述融合图像信息输入至设定的深度学习模型进行训练。
本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本发明的其它实施方案。本发明旨在涵盖本发明的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本发明的一般性原理并包括本发明未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本发明的真正范围和精神由本发明的权利要求指出。
应当理解的是,本发明并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本发明的范围仅由所附的权利要求来限制。

Claims (6)

1.一种深度学习模型的训练方法,其特征在于,包括:
获取用于训练深度学习模型的原始图像,所述原始图像包括RGB原始图像;
将所述原始图像转换至设定图像空间,得到设定图像空间下的转换图像;
对所述原始图像和所述转换图像进行融合,得到融合图像信息;
将所述融合图像信息输入至设定的深度学习模型进行训练;
所述将所述原始图像转换至设定图像空间,得到设定图像空间下的转换图像,包括:
将所述RGB原始图像转到频域空间,得到频域图像;和/或,
将所述RGB原始图像转到HSV颜色空间,得到HSV空间图像;
所述对所述原始图像和所述转换图像进行融合,得到融合图像信息,包括:
基于所述RGB原始图像中的边界框BoundingBox、所述HSV空间图像中的boundbox和/或所述RGB原始图像中的边界框BoundingBox的频域转换信息生成目标向量。
2.根据权利要求1所述的方法,其特征在于,所述获取用于训练深度学习模型的原始图像,包括:
基于车载摄像装置获取当前车辆的周围环境图像;
基于所述周围环境图像确定用于训练深度学习模型的原始图像。
3.一种深度学习模型的训练装置,其特征在于,包括:
原始图像获取模块,用于获取用于训练深度学习模型的原始图像,所述原始图像包括RGB原始图像;
转换图像获取模块,用于将所述原始图像转换至设定图像空间,得到设定图像空间下的转换图像;
融合信息获取模块,用于对所述原始图像和所述转换图像进行融合,得到融合图像信息;
学习模型训练模块,用于将所述融合图像信息输入至设定的深度学习模型进行训练;
所述转换图像获取模块,包括:
频域图像获取单元,用于将所述RGB原始图像转到频域空间,得到频域图像;和/或,
HSV图像获取单元,用于将所述RGB原始图像转到HSV颜色空间,得到HSV空间图像;
所述融合信息获取模块还用于基于所述RGB原始图像中的边界框BoundingBox、所述HSV空间图像中的boundbox和/或所述RGB原始图像中的边界框BoundingBox的频域转换信息生成目标向量。
4.根据权利要求3所述的装置,其特征在于,所述原始图像获取模块,包括:
环境图像获取单元,用于基于车载摄像装置获取当前车辆的周围环境图像;
原始图像确定单元,用于基于所述周围环境图像确定用于训练深度学习模型的原始图像。
5.一种电子设备,其特征在于,所述电子设备包括:
处理器;
被配置为存储处理器可执行指令的存储器;
其中,所述处理器被配置为:
获取用于训练深度学习模型的原始图像,所述原始图像包括RGB原始图像;
将所述原始图像转换至设定图像空间,得到设定图像空间下的转换图像;
对所述原始图像和所述转换图像进行融合,得到融合图像信息;
将所述融合图像信息输入至设定的深度学习模型进行训练;
所述将所述原始图像转换至设定图像空间,得到设定图像空间下的转换图像,包括:
将所述RGB原始图像转到频域空间,得到频域图像;和/或,
将所述RGB原始图像转到HSV颜色空间,得到HSV空间图像;
所述对所述原始图像和所述转换图像进行融合,得到融合图像信息,包括:
基于所述RGB原始图像中的边界框BoundingBox、所述HSV空间图像中的boundbox和/或所述RGB原始图像中的边界框BoundingBox的频域转换信息生成目标向量。
6.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器处理时实现:
获取用于训练深度学习模型的原始图像,所述原始图像包括RGB原始图像;
将所述原始图像转换至设定图像空间,得到设定图像空间下的转换图像;
对所述原始图像和所述转换图像进行融合,得到融合图像信息;
将所述融合图像信息输入至设定的深度学习模型进行训练;
所述将所述原始图像转换至设定图像空间,得到设定图像空间下的转换图像,包括:
将所述RGB原始图像转到频域空间,得到频域图像;和/或,
将所述RGB原始图像转到HSV颜色空间,得到HSV空间图像;
所述对所述原始图像和所述转换图像进行融合,得到融合图像信息,包括:
基于所述RGB原始图像中的边界框BoundingBox、所述HSV空间图像中的boundbox和/或所述RGB原始图像中的边界框BoundingBox的频域转换信息生成目标向量。
CN201911359712.1A 2019-12-25 2019-12-25 深度学习模型的训练方法、装置、电子设备及存储介质 Active CN111126493B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911359712.1A CN111126493B (zh) 2019-12-25 2019-12-25 深度学习模型的训练方法、装置、电子设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911359712.1A CN111126493B (zh) 2019-12-25 2019-12-25 深度学习模型的训练方法、装置、电子设备及存储介质

Publications (2)

Publication Number Publication Date
CN111126493A CN111126493A (zh) 2020-05-08
CN111126493B true CN111126493B (zh) 2023-08-01

Family

ID=70503980

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911359712.1A Active CN111126493B (zh) 2019-12-25 2019-12-25 深度学习模型的训练方法、装置、电子设备及存储介质

Country Status (1)

Country Link
CN (1) CN111126493B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112710969B (zh) * 2020-12-18 2021-11-09 武汉大学 一种单相半桥五电平逆变器开关管开路故障诊断方法
CN112801057B (zh) * 2021-04-02 2021-07-13 腾讯科技(深圳)有限公司 图像处理方法、装置、计算机设备和存储介质

Citations (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107358182A (zh) * 2017-06-29 2017-11-17 维拓智能科技(深圳)有限公司 行人检测方法及终端设备
CN107622229A (zh) * 2017-08-29 2018-01-23 中山大学 一种基于融合特征的视频车辆重识别方法与系统
CN107909044A (zh) * 2017-11-22 2018-04-13 天津大学 一种结合卷积神经网络和轨迹预测的人数统计方法
CN108052980A (zh) * 2017-12-21 2018-05-18 南京理工大学 基于图像的空气质量等级检测方法
CN108830823A (zh) * 2018-03-14 2018-11-16 西安理工大学 基于空域结合频域分析的全参考型图像质量评价方法
CN108875762A (zh) * 2017-05-16 2018-11-23 富士通株式会社 分类器训练方法、图像识别方法和图像识别设备
CN108960232A (zh) * 2018-06-08 2018-12-07 Oppo广东移动通信有限公司 模型训练方法、装置、电子设备和计算机可读存储介质
CN109165682A (zh) * 2018-08-10 2019-01-08 中国地质大学(武汉) 一种融合深度特征和显著性特征的遥感图像场景分类方法
CN109255340A (zh) * 2018-10-29 2019-01-22 东北大学 一种融合多种改进vgg网络的人脸识别方法
CN109740484A (zh) * 2018-12-27 2019-05-10 斑马网络技术有限公司 道路障碍物识别的方法、装置及系统
CN109829881A (zh) * 2018-12-17 2019-05-31 广东电网有限责任公司 基于深度学习的鸟巢检测方法及系统
CN109858309A (zh) * 2017-11-30 2019-06-07 东软集团股份有限公司 一种识别道路线的方法和装置
JP2019117559A (ja) * 2017-12-27 2019-07-18 日本放送協会 カラー情報推定モデル生成装置、動画像カラー化装置およびそれらのプログラム
CN110136071A (zh) * 2018-02-02 2019-08-16 杭州海康威视数字技术股份有限公司 一种图像处理方法、装置、电子设备及存储介质
CN110175551A (zh) * 2019-05-21 2019-08-27 青岛科技大学 一种手语识别方法
CN110414411A (zh) * 2019-07-24 2019-11-05 中国人民解放军战略支援部队航天工程大学 基于视觉显著性的海面船只候选区域检测方法

Patent Citations (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108875762A (zh) * 2017-05-16 2018-11-23 富士通株式会社 分类器训练方法、图像识别方法和图像识别设备
CN107358182A (zh) * 2017-06-29 2017-11-17 维拓智能科技(深圳)有限公司 行人检测方法及终端设备
CN107622229A (zh) * 2017-08-29 2018-01-23 中山大学 一种基于融合特征的视频车辆重识别方法与系统
CN107909044A (zh) * 2017-11-22 2018-04-13 天津大学 一种结合卷积神经网络和轨迹预测的人数统计方法
CN109858309A (zh) * 2017-11-30 2019-06-07 东软集团股份有限公司 一种识别道路线的方法和装置
CN108052980A (zh) * 2017-12-21 2018-05-18 南京理工大学 基于图像的空气质量等级检测方法
JP2019117559A (ja) * 2017-12-27 2019-07-18 日本放送協会 カラー情報推定モデル生成装置、動画像カラー化装置およびそれらのプログラム
CN110136071A (zh) * 2018-02-02 2019-08-16 杭州海康威视数字技术股份有限公司 一种图像处理方法、装置、电子设备及存储介质
CN108830823A (zh) * 2018-03-14 2018-11-16 西安理工大学 基于空域结合频域分析的全参考型图像质量评价方法
CN108960232A (zh) * 2018-06-08 2018-12-07 Oppo广东移动通信有限公司 模型训练方法、装置、电子设备和计算机可读存储介质
CN109165682A (zh) * 2018-08-10 2019-01-08 中国地质大学(武汉) 一种融合深度特征和显著性特征的遥感图像场景分类方法
CN109255340A (zh) * 2018-10-29 2019-01-22 东北大学 一种融合多种改进vgg网络的人脸识别方法
CN109829881A (zh) * 2018-12-17 2019-05-31 广东电网有限责任公司 基于深度学习的鸟巢检测方法及系统
CN109740484A (zh) * 2018-12-27 2019-05-10 斑马网络技术有限公司 道路障碍物识别的方法、装置及系统
CN110175551A (zh) * 2019-05-21 2019-08-27 青岛科技大学 一种手语识别方法
CN110414411A (zh) * 2019-07-24 2019-11-05 中国人民解放军战略支援部队航天工程大学 基于视觉显著性的海面船只候选区域检测方法

Non-Patent Citations (5)

* Cited by examiner, † Cited by third party
Title
Shruthi G.K等.Frequency Domain Image Fusion using Discrete Wavelet Transformation.《IJERT》.2017,第5卷(第6期),第1-4页. *
Wisarut Chantara等.All in Focused Image Combination in the Frequency Domain Using Light Field Images.《applied sciences》.2019,第9卷第1-17页. *
岳娟等.基于空-频域混合分析的RGB-D 数据视觉显著性检测方法.《机器人》.2017,第39卷(第5期),第652-660页. *
曾寰等.颜色空间转换耦合特征图的显著性检测算法.《计算机工程与设计》.2019,第40卷(第6期),第1665-1670页. *
王海文等.一种基于生成式对抗网络的图像数据扩充方法.《计算机技术与发展》.2019,第30卷(第3期),第51-56页. *

Also Published As

Publication number Publication date
CN111126493A (zh) 2020-05-08

Similar Documents

Publication Publication Date Title
US20200356818A1 (en) Logo detection
CN112232293B (zh) 图像处理模型训练、图像处理方法及相关设备
CN110705405B (zh) 目标标注的方法及装置
CN103649999B (zh) 用于确定光流的内容自适应系统、方法和设备
US20210124967A1 (en) Method and apparatus for sample labeling, and method and apparatus for identifying damage classification
KR20200145827A (ko) 얼굴 특징 추출 모델 학습 방법, 얼굴 특징 추출 방법, 장치, 디바이스 및 저장 매체
CN111126493B (zh) 深度学习模型的训练方法、装置、电子设备及存储介质
CN109377494B (zh) 一种用于图像的语义分割方法和装置
CN111553362A (zh) 一种视频处理方法、电子设备和计算机可读存储介质
CN110570435A (zh) 用于对车辆损伤图像进行损伤分割的方法及装置
US20200322655A1 (en) Method to insert ad content into a video scene
CN110996128B (zh) 在线教学视频推送管理系统
CN111985471A (zh) 一种车牌定位方法、装置及存储介质
CN114821513B (zh) 一种基于多层网络的图像处理方法及装置、电子设备
CN111428858A (zh) 样本数量的确定方法、装置、电子设备及存储介质
CN110569698A (zh) 一种图像目标检测及语义分割方法和装置
CN114973271A (zh) 一种文本信息提取方法、提取系统、电子设备及存储介质
CN110414845B (zh) 针对目标交易的风险评估方法及装置
CN111339367B (zh) 视频处理方法、装置、电子设备及计算机可读存储介质
CN114676705A (zh) 一种对话关系处理方法、计算机及可读存储介质
CN113505844A (zh) 标签生成方法、装置、设备、存储介质及程序产品
CN109040774B (zh) 一种节目信息提取方法、终端设备、服务器及存储介质
CN113065619A (zh) 数据处理方法、装置、计算机可读存储介质及设备
CN106446902B (zh) 非文字图像识别方法和装置
US20200184216A1 (en) Machine continuous learning method of neural network object classifier and related monitoring camera apparatus

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant