CN112884147B

CN112884147B - 神经网络训练方法、图像处理方法、装置及电子设备

Info

Publication number: CN112884147B
Application number: CN202110219356.4A
Authority: CN
Inventors: 周千寓; 程光亮; 石建萍; 马利庄
Original assignee: Shanghai Sensetime Intelligent Technology Co Ltd
Current assignee: Shanghai Sensetime Intelligent Technology Co Ltd
Priority date: 2021-02-26
Filing date: 2021-02-26
Publication date: 2023-11-28
Anticipated expiration: 2041-02-26
Also published as: CN112884147A

Abstract

本公开提供了一种神经网络训练方法、装置、电子设备及存储介质，该神经网络训练方法包括：基于生成的目标维度的域变量，对接收到的源域图像进行数据扩增，得到处理好的源域图像；将处理好的源域图像和目标域图像输入到域无关特征提取器进行特征提取，分别得到处理好的源域图像的域变量无关特征向量以及目标域图像的域无关特征向量；将域变量无关特征向量以及域无关特征向量输入至域辨别器以及神经网络中的目标任务网络；基于域辨别器输出的判别结果，对域辨别器以及域无关特征提取器进行参数调整，并基于目标任务网络输出的预测结果以及源域图像的标注结果对目标任务网络以及域无关特征提取器进行参数调整，得到训练好的神经网络。

Description

神经网络训练方法、图像处理方法、装置及电子设备

技术领域

本公开涉及计算机技术领域，具体而言，涉及一种神经网络训练方法、图像处理方法、智能设备控制方法、装置、电子设备和存储介质。

背景技术

基于机器学习的算法，通常是利用一个或多个特定领域(即，源领域)的训练样本进行学习，得到模型。然后，利用学习到的模型对目标领域中的测试样本进行测试，得到测试结果。通常情况下，不同领域的样本的分布不一，有着各自的特点。如果不进行领域自适应，直接将在源领域的样本集上训练得到的模型应用到目标领域的测试样本中，测试效果较差。

领域自适应的目的是为了解决由于训练数据和测试数据的分布不同导致机器学习性能下降而提出了一种迁移学习方法。领域自适应学习利用源领域的标注数据学习得到目标领域依然适用的模型。根据目标领域数据是否有标注信息，领域自适应学习可以分为有监督领域自适应学习、半监督领域自适应学习和无监督领域自适应学习。其中，无监督领域自适应学习由于完全不依赖目标领域数据标注信息而应用更加广泛。

无监督领域自适应的目标是为带有标记的源数据和未标记的目标数据的目标域训练通用模型。然而，如何减少源域和目标域之间的域偏移问题是业界一直追求的目标。

发明内容

本公开实施例至少提供一种神经网络训练方法、图像处理方法、智能设备控制方法、装置、电子设备及存储介质。

第一方面，本公开实施例提供了一种神经网络训练方法，包括：

生成目标维度的域变量，并基于所述域变量对接收到的源域图像进行数据扩增，得到所述处理好的源域图像；所述域变量用于指示所述目标维度的呈现程度；

将所述处理好的所述源域图像和目标域图像输入到神经网络中的域无关特征提取器进行特征提取，分别得到所述处理好的源域图像的域变量无关特征向量以及所述目标域图像的域无关特征向量；

将所述域变量无关特征向量以及所述域无关特征向量输入至域辨别器以及所述神经网络中的目标任务网络；基于所述域辨别器输出的判别结果，对所述域辨别器以及所述域无关特征提取器进行参数调整，并基于所述目标任务网络输出的预测结果以及所述源域图像的标注结果对所述目标任务网络以及所述域无关特征提取器进行参数调整，得到训练好的神经网络。

本公开实施例中，由于生成目标维度的域变量，并基于所述域变量对接收到的源域图像进行数据扩增，也即，对源域进行了多样化处理，使得所提取的域变量无关特征更加完整，也即能够针对特定的目标维度的域差异进行迁移学习，引入目标维度作为显示的先验知识，从而提高了学到的域无关的特征的完整度，提高了神经网络在目标域上的适用性。

根据第一方面，在一种可能的实施方式中，所述方法还包括：

基于所述域变量生成监督信号；

将所述处理好的源域图像输入至域相关特征提取器进行特征提取，得到所述处理好的源域图像的域变量相关特征向量；

将所述域变量相关特征向量输入至自对抗正则化器进行特征下采样处理，得第一预测概率向量；

基于所述监督信号以及所述第一预测概率向量，对所述自对抗正则化器以及所述域无关特征提取器进行参数调整，直至所述自对抗正则化器能够对不同的域变量进行辨别。

根据第一方面，在一种可能的实施方式中，所述基于所述监督信号以及所述第一预测概率向量，对所述自对抗正则化器以及所述域无关特征提取器进行参数调整，包括：

基于域相关损失函数、所述监督信号以及所述第一预测概率向量，对所述自对抗正则化器以及所述域无关特征提取器进行参数调整；其中，所述域相关损失函数为交叉熵损失函数。

将得到所述处理好的源域图像的域变量无关特征向量输入至所述自对抗正则化器进行特征下采样处理，得到第二预测概率向量；

基于参照信号以及所述第二预测概率向量对所述自对抗正则化器以及所述域无关特征提取器进行参数调整，直至所述自对抗正则化器能够最大化所述域变量相关特征向量与所述域变量无关特征向量之间的差异。

根据第一方面，在一种可能的实施方式中，所述参照信号为均匀分布向量。

根据第一方面，在一种可能的实施方式中，所述基于参照信号以及所述第二预测概率向量对所述自对抗正则化器以及所述域无关特征提取器进行参数调整，包括：

基于域无关损失函数、参照信号以及所述第二预测概率向量对所述自对抗正则化器以及所述域无关特征提取器进行参数调整；所述域无关损失函数为相对熵损失函数。

根据第一方面，在一种可能的实施方式中，所述目标维度包括：天气、季节、样式、年龄、风格或者视场角。

第二方面，本公开实施例提供了一种图像处理方法，包括：

获取待处理图像；

将获取的所述待处理图像输入至采用第一方面及第一方面中任一可能的实施方式中所述的神经网络训练方法训练完成的神经网络，得到语义分割结果或者目标检测结果。

第三方面，本公开实施例提供了一种智能设备控制方法，包括：

获取智能设备在行驶过程中采集的道路图像；

将获取的所述道路图像输入至采用权利要求第一方面及第一方面中任一可能的实施方式中所述的神经网络训练方法训练完成的神经网络，得到所述道路图像的语义分割结果或者目标检测结果。

第四方面，本公开实施例提供了一种神经网络训练装置，包括：

数据扩增模块，用于生成目标维度的域变量，并基于所述域变量对接收到的源域图像进行数据扩增，得到所述处理好的源域图像；所述域变量用于指示所述目标维度的呈现程度；

特征提取模块，用于将所述处理好的所述源域图像和目标域图像输入到神经网络中的域无关特征提取器进行特征提取，分别得到所述处理好的源域图像的域变量无关特征向量以及所述目标域图像的域无关特征向量；

参数调整模块，用于将所述域变量无关特征向量以及所述域无关特征向量输入至域辨别器以及所述神经网络中的目标任务网络；基于所述域辨别器输出的判别结果，对所述域辨别器以及所述域无关特征提取器进行参数调整，并基于所述目标任务网络输出的预测结果以及所述源域图像的标注结果对所述目标任务网络以及所述域无关特征提取器进行参数调整，得到训练好的神经网络。

第五方面，本公开实施例提供了一种图像处理装置，包括：

图像获取模块，用于获取待处理图像；

目标处理模块，用于将获取的所述待处理图像输入至采用第一方面中任一可能的实施方式中所述的神经网络训练方法训练完成的神经网络，得到语义分割结果或者目标检测结果。

第六方面，本公开实施例提供了一种智能设备控制装置，其特征在于，所述装置包括：

图像获取模块，用于获取智能设备在行驶过程中采集的道路图像；

目标处理模块，用于将获取的所述道路图像输入至采用第一方面中任一可能的实施方式中所述的神经网络训练方法训练完成的神经网络，得到所述道路图像的语义分割结果或者目标检测结果；

设备控制模块，用于基于所述道路图像的语义分割结果或者所述目标检测结果，控制所述智能设备行使。

第七方面，本公开实施例提供了一种电子设备，包括：处理器、存储器和总线，所述存储器存储有所述处理器可执行的机器可读指令，当电子设备运行时，所述处理器与所述存储器之间通过总线通信，所述机器可读指令被所述处理器执行时执行如第一方面所述的神经网络训练方法的步骤，或者如第二方面所述图像处理方法的步骤，或者如第三方面所述的智能设备控制方法的步骤。

第八方面，本公开实施例提供了一种计算机可读存储介质，该计算机可读存储介质上存储有计算机程序，该计算机程序被处理器运行时执行如第一方面所述的神经网络训练方法的步骤，或者如第二方面所述图像处理方法的步骤，或者如第三方面所述的智能设备控制方法的步骤。

为使本公开的上述目的、特征和优点能更明显易懂，下文特举较佳实施例，并配合所附附图，作详细说明如下。

附图说明

为了更清楚地说明本公开实施例的技术方案，下面将对实施例中所需要使用的附图作简单地介绍，此处的附图被并入说明书中并构成本说明书中的一部分，这些附图示出了符合本公开的实施例，并与说明书一起用于说明本公开的技术方案。应当理解，以下附图仅示出了本公开的某些实施例，因此不应被看作是对范围的限定，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他相关的附图。

图1示出了本公开实施例所提供的一种神经网络训练方法的流程图；

图2示出了本公开实施例所提供的一种神经网络模型的架构示意图；

图3示出了本公开实施例所提供的一种目标维度为雾的情况下的源域图像处理的示意图；

图4示出了本公开实施例所提供的一种目标维度为视场角的情况下的源域图像处理的示意图；

图5示出了本公开实施例所提供的另一种神经网络训练方法的流程图；

图6示出了本公开实施例所提供的一种自对抗正则化器的结构示意图；

图7示出了本公开实施例所提供的又一种神经网络训练方法的流程图；

图8示出了本公开实施例所提供的一种图像处理方法的流程图；

图9示出了本公开实施例所提供的一种智能设备控制方法的流程图；

图10示出了本公开实施例所提供的一种神经网络训练装置的结构示意图；

图11示出了本公开实施例所提供的另一种神经网络训练装置的结构示意图；

图12示出了本公开实施例所提供的一种图像处理装置的结构示意图；

图13示出了本公开实施例所提供的一种智能设备控制装置的结构示意图；

图14示出了本公开实施例所提供的一种电子设备的示意图。

具体实施方式

为使本公开实施例的目的、技术方案和优点更加清楚，下面将结合本公开实施例中附图，对本公开实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本公开一部分实施例，而不是全部的实施例。通常在此处附图中描述和示出的本公开实施例的组件可以以各种不同的配置来布置和设计。因此，以下对在附图中提供的本公开的实施例的详细描述并非旨在限制要求保护的本公开的范围，而是仅仅表示本公开的选定实施例。基于本公开的实施例，本领域技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例，都属于本公开保护的范围。

应注意到：相似的标号和字母在下面的附图中表示类似项，因此，一旦某一项在一个附图中被定义，则在随后的附图中不需要对其进行进一步定义和解释。

本文中术语“和/或”，仅仅是描述一种关联关系，表示可以存在三种关系，例如，A和/或B，可以表示：单独存在A，同时存在A和B，单独存在B这三种情况。另外，本文中术语“至少一种”表示多种中的任意一种或多种中的至少两种的任意组合，例如，包括A、B、C中的至少一种，可以表示包括从A、B和C构成的集合中选择的任意一个或多个元素。

近几年在图像识别领域出现一种称为无监督域适应的方法，主旨思想是进行源域和目标域的分布匹配，这一方法可以将训练好的模型迁移到其他领域，同时尽力维持较好的性能，有效地缓解了数据标注的压力。

然而，经研究发现，目前传统的域适应方法不能针对指定维度的域差异进行迁移学习，没有考虑引入显示的先验知识，从而不能完整得学到域无关的特征。

基于上述研究，本公开提供了一种神经网络训练方法，首先生成目标维度的域变量，并基于所述域变量对接收到的源域图像进行数据扩增，得到所述处理好的源域图像；其中，所述域变量用于指示所述目标维度的呈现程度；然后将所述处理好的所述源域图像和目标域图像输入到域无关特征提取器进行特征提取，分别得到所述处理好的源域图像的域变量无关特征向量以及所述目标域图像的域无关特征向量；再将所述域变量无关特征向量以及所述域无关特征向量输入至域辨别器以及所述神经网络中的目标任务网络；基于所述域辨别器输出的判别结果，对所述域辨别器以及所述域无关特征提取器进行参数调整，并基于所述目标任务网络输出的预测结果以及所述源域图像的标注结果对所述目标任务网络以及所述域无关特征提取器进行参数调整，得到训练好的神经网络。如此，能够针对目标维度的域差异进行迁移学习，引入目标维度作为显示的先验知识，从而提高了学到的域无关的特征的完整度，提高了神经网络在目标域的适用性。

为便于对本实施例进行理解，首先对本公开实施例所公开的一种神经网络训练方法进行详细介绍，本公开实施例所提供的神经网络训练方法的执行主体一般为具有一定计算能力的计算机设备，该计算机设备例如包括：终端设备或服务器或其它处理设备，终端设备可以为移动设备、用户终端、终端、手持设备、计算设备、车载设备、可穿戴设备等。在一些可能的实现方式中，该神经网络训练方法可以通过处理器调用存储器中存储的计算机可读指令的方式来实现。

下面以执行主体为服务器为例对本公开实施例提供的神经网络训练方法加以说明。

参见图1所示，为本公开实施例提供的一种神经网络训练方法的流程图，该神经网络训练方法包括以下S101～S104：

S101，生成目标维度的域变量，并基于所述域变量对接收到的源域图像进行数据扩增，得到所述处理好的源域图像；所述域变量用于指示所述目标维度的呈现程度。

示例性地，目标维度包括天气、季节、样式、年龄、风格或者视场角等，在此不做限定。其中，天气包括但不限于雾、雨、雪及沙尘等。

参见图2所示，为本公开实施例提供的一种神经网络模型的架构示意图。本实施方式中，域变量生成器10接收输入的源域图像，并随机生成目标维度的域变量，并基于所述域变量对接收到的源域图像(a)进行数据扩增，得到所述处理好的源域图像(b)。其中，在同一目标维度下，不同的域变量表示不同显示程度的目标维度，也即，域变量用于作为目标维度中一组域之间的度量。

具体地，以雾的厚度作为目标维度来进行说明，参见图3所示，对于同一源域图像x，在生成的域变量不同的情况下，处理后的源域图像的显示效果不同。比如，在生成域变量为0.01的厚度的雾的情况下，处理后的源域图像如y所示，而在生成域变量为0.02的厚度的雾的情况下，处理后的源域图像如z所示。从图3中可以看出，域变量的数值越大代表雾的厚度越厚，处理后的源域图像显示的越模糊。当域变量为0的情况下，说明源域图像没有发生变化。又例如，在目标维度为视场角的情况下，域变量用于表示视场角的大小，比如域变量40°表示视场角为40°。

下面结合图4，以目标维度为视场角为例，将基于域变量对源域图像进行处理的过程进行说明。如图4所示，O是相机的光学中心，F是焦点，OF表示焦距，MN和P Q分别代表转换前后的原始宽度和新宽度。在该处理过程中，源域图像的视场角从∠MFN减小到∠PF Q。

S102，将所述处理好的所述源域图像和目标域图像输入到神经网络中的域无关特征提取器进行特征提取，分别得到所述处理好的源域图像的域变量无关特征向量以及所述目标域图像的域无关特征向量。

示例地，参见图2所示，将所述处理好的所述源域图像(b)和目标域图像(c)输入到域无关特征提取器20进行特征提取，分别得到处理好的所述源域图像(b)的域变量无关特征向量和所述目标域图像(c)的域无关特征向量。其中，目标域和源域相对应，也即，将原本适用于源域的神经网络模型，通过域迁移的方法，使其适用于该目标域。

S103，将所述域变量无关特征向量以及所述域无关特征向量输入至域辨别器以及所述神经网络中的目标任务网络；基于所述域辨别器输出的判别结果，对所述域辨别器以及所述域无关特征提取器进行参数调整，并基于所述目标任务网络输出的预测结果以及所述源域图像的标注结果对所述目标任务网络以及所述域无关特征提取器进行参数调整，得到训练好的神经网络。

示例地，参见图2所示，将所述处理好的源域图像(b)的域变量无关特征向量以及所述目标域图像(c)的域无关特征向量输入至域辨别器30，得到判别结果，并基于所述判别结果，对所述域辨别器30以及所述域无关特征提取器20进行参数调整，以使得域无关特征提取器20提高特征提取能力，进而混淆域辨别器30，同时也可以提高域辨别器30的辨别能力，直至域辨别器30无法辨别出该域变量无关特征向量以及域无关特征向量。如此，可以在提高域无关特征提取器20的提取特征的精准度的同时，提高域辨别器30的辨别能力，进而提高了学习到的域变量无关特征的完整度。

其中，当域辨别器30输出的判别的结果概率为50％左右时，可以确定域辨别器30无法辨别出该域变量无关特征向量以及域无关特征向量。

示例性地，目标任务网络60可以是语义分割任务网络，也可以是目标检测任务网络，在此不做限定。

一些实施方式中，在域变量无关特征向量以及所述域无关特征向量输入至目标任务网络后，可以基于目标任务网络输出的预测结果以及所述源域图像的标注结果计算损失函数，并基于该损失函数的值对所述目标任务网络以及所述域无关特征提取器进行参数调整，直至该损失函数的值达到预设阈值。其中，该有损失函数可以是交叉熵损失，也可以是焦点损失(Focal loss)，也可以是其他损失，在此不做限定。

本公开实施例中，由于生成目标维度的域变量，并基于所述域变量对接收到的源域图像进行数据扩增，也即，对源域进行了多样化处理，使得所提取的域变量无关特征更加完整，也即能够针对特定的目标维度的域差异进行迁移学习，引入目标维度作为显示的先验知识，从而提高了学到的域无关的特征的完整度，提高了神经网络在目标维度的适用性。

参见图5所示，为本公开实施例提供的另一种神经网络训练方法的流程图，与图1中的神经网络训练方法不同的是，该神经网络训练方法在步骤S103之前还包括以下S201～S204：

S201，基于所述域变量生成监督信号。

参见图2所示，域变量生成器10在生成域变量的同时基于该域变量生成监督信号。其中，该监督信号用向量表示。

S202，将所述处理好的源域图像输入至域相关特征提取器进行特征提取，得到所述处理好的源域图像的域变量相关特征向量。

示例性地，参见图2所示，将所述处理好的源域图像(b)输入至域相关特征提取器40进行特征提取，得到所述处理好的源域图像的域变量相关特征向量。

其中，域相关特征提取器40和域无关特征提取器20的网络结构相同，权重不同，以使得在反向传播时的参数调整不同。

S203，将所述域变量相关特征向量输入至自对抗正则化器进行特征下采样处理，得第一预测概率向量。

示例性地，参见图2所示，将所述域变量相关特征向量输入至自对抗正则化器50进行特征下采样处理，得第一预测概率向量。

具体地，参见图6所示，在一些实施方式中，自对抗正则化器50包括感兴趣区域对齐层(ROI Align)51、展平层(flatten)52、全连接层53以及全连接层54。域变量无关特征向量或者域变量相关特征向量输入自对抗正则化器50后，经过ROI对齐和展平，再经过两个全连接层的激活后分别得到第一预测概率向量或者第二预测概率向量。

S203，基于所述监督信号以及所述第一预测概率向量，对所述自对抗正则化器以及所述域无关特征提取器进行参数调整，直至所述自对抗正则化器能够对不同的域变量进行辨别。

本公开实施例中，在监督信号的指导下，自对抗正则化器50需要提高其判别能力以及并拓宽视野，以更准确地对基于不同域变量处理后的源域图像进行辨别分类。

在一些实施例中，可以基于域相关损失函数、所述监督信号以及所述第一预测概率向量，对所述自对抗正则化器进行参数调整；其中，所述域相关损失函数为交叉熵损失函数。

在一些实施方式中，交叉熵损失函数的表达式如下：

其中，y_gt为监督信号，d_spf为第一预测概率向量。

本公开实施例中，在交叉熵损失函数的指导下，自对抗正则化器50可以学会更精准地辨别不同的域变量，如此可以更好的反向传播到域无关特征提取器20，进而调整域无关特征提取器20的参数。

参见图7所示，为本公开实施例提供的又一种神经网络训练方法的流程图，与图1或图2中的神经网络训练方法不同的是，该神经网络训练方法在步骤S103之前还包括以下S301～S302：

S301，将得到所述处理好的源域图像的域变量无关特征向量输入至所述自对抗正则化器进行特征下采样处理，得到第二预测概率向量。

示例性地，参见图2所示，得到所述处理好的源域图像的域变量无关特征向量输入至所述自对抗正则化器50进行特征下采样处理，得到第二预测概率向量。

S302，基于参照信号以及所述第二预测概率向量对所述自对抗正则化器以及所述域无关特征提取器进行参数调整，直至所述自对抗正则化器能够最大化所述域变量相关特征向量与所述域变量无关特征向量之间的差异。

在一些实施方式中，所述参照信号为均匀分布向量。如此，可以使得监督信号和所述参照信号之间的差异最大化，进而使得自对抗正则化器50最大化所述域变量相关特征向量与所述域变量无关特征向量之间的差异。

示例性地，可以基于域无关损失函数、参照信号以及所述第二预测概率向量对所述自对抗正则化器以及所述域无关特征提取器进行参数调整；所述域无关损失函数为相对熵损失函数。

在一些实施方式中，相对熵损失函数为第二预测概率向量与参照信号之间的KL散度。其中，相对熵损失函数/>的表达式如下：

其中，x是参照信号y_U的采样，p(x)是X的概率，q_S为第二预测概率向量的分布。

本公开实施例中，在相对熵损失函数的指导下，自对抗正则化器50可以捕捉域内的分布差异，从而更完全地学习到域变量无关的特征。

本公开实施例中，在监督信号的指导下，域相关特征提取器40、域无关特征提取器30以及自对抗正则化器50以自对抗的方式，将处理好的源域图像的潜在特征解耦为域变量相关特征和域变量无关特征，从而获得自我完善，以减小域内间隙。

需要说明的是，图2中所示的域变量生成器10、域相关特征提取器40、自对抗正则化器50以及域辨别器30仅仅是用于对神经网络进行训练，从而使神经网络适用于目标领域，而在测试推理阶段神经网络中并不包含这些模块，这些模块可以在添加于任何已有的域适应训练框架中，并在测试时不会引入额外的计算成本。

基于上述实施例所示的神经网络训练方法，本公开实施例还可以基于采用该方法训练好的神经网络对待处理图像进行语义分割或者目标检测。具体地，参见图8所示，为本公开实施例提供的一种图像处理方法的流程图，该图像处理方法包括以下S801～S802：

S801，获取待处理图像。

S802，将获取的所述待处理图像输入至采用上述的神经网络训练方法训练完成的神经网络，得到语义分割结果或者目标检测结果。

这里，可以首先将获取的待处理图像输入至上述训练完成的神经网络，得到神经网络输出的有关待处理图像中每个图像像素的语义类别信息，将该语义类别信息作为语义分割结果；或者，得到神经网络输出的有关待处理图像中的目标检测框，将该目标检测框作为目标检测结果。

基于上述实施例一所示的神经网络训练方法，本公开实施例还可以基于训练好的神经网络实现智能设备控制的方案。具体地，参见图9所示，为本公开实施例提供的一种智能设备控制方法的流程图，该智能设备控制方法包括以下S901～S903：

S901，获取智能设备在行驶过程中采集的道路图像。

S902，将获取的所述道路图像输入至采用上述的神经网络训练方法训练完成的神经网络，得到所述道路图像的语义分割结果或者目标检测结果。

S903，基于所述道路图像的语义分割结果或者所述目标检测结果，控制所述智能设备行使。

这里，针对智能设备所获取的道路图像，可以将该道路图像输入至上述训练好的神经网络，以得到道路图像的语义分割结果或者目标检测结果，这样，即可以基于该语义分割结果或者目标检测结果实现智能设备控制。

例如，在针对自动驾驶这一应用领域中，可以在确定出道路图像中的语义分割结果或者目标检测结果包含行人时，降低智能汽车速度以自动避让行人。

需要说明的是，本公开实施例提供的智能设备控制方法不仅可以适应于上述智能汽车的控制场景中，还可以应用于其它应用场景(比如视频监控领域)中，本公开实施例对此不做具体的限制。

通过采用本本公开实施例的神经网络训练方法所训练的神经网络，在应用于自动驾驶领域时，可以面对不同场景条件如天气、光照、视角等，进而可以有效地提高检测性能。

本领域技术人员可以理解，在具体实施方式的上述方法中，各步骤的撰写顺序并不意味着严格的执行顺序而对实施过程构成任何限定，各步骤的具体执行顺序应当以其功能和可能的内在逻辑确定。

基于同一技术构思，本公开实施例中还提供了与神经网络训练方法对应的神经网络训练装置，由于本公开实施例中的装置解决问题的原理与本公开实施例上述神经网络训练方法相似，因此装置的实施可以参见方法的实施，重复之处不再赘述。

参照图10所示，为本公开实施例提供的一种神经网络训练装置300的示意图，该神经网络训练装置300包括：

数据扩增模块301，用于生成目标维度的域变量，并基于所述域变量对接收到的源域图像进行数据扩增，得到所述处理好的源域图像；所述域变量用于指示所述目标维度的呈现程度；

特征提取模块302，用于将所述处理好的所述源域图像和目标域图像输入到神经网络中的域无关特征提取器进行特征提取，分别得到所述处理好的源域图像的域变量无关特征向量以及所述目标域图像的域无关特征向量；

参数调整模块303，用于将所述域变量无关特征向量以及所述域无关特征向量输入至域辨别器以及所述神经网络中的目标任务网络；基于所述域辨别器输出的判别结果，对所述域辨别器以及所述域无关特征提取器进行参数调整，并基于所述目标任务网络输出的预测结果以及所述源域图像的标注结果对所述目标任务网络以及所述域无关特征提取器进行参数调整，得到训练好的神经网络。

在一种可能的实施方式中，参见图11所示，所述种神经网络训练装置300还包括：

生成模块304，用于基于所述域变量生成监督信号；

特征提取模块302还用于：

特征下采样处理模块305，用于将所述域变量相关特征向量输入至自对抗正则化器进行特征下采样处理，得第一预测概率向量；

所述参数调整模块303还用于：

基于所述监督信号以及所述第一预测概率向量，对所述自对抗正则化器进行参数调整，直至所述自对抗正则化器能够对不同的域变量进行辨别。

在一种可能的实施方式中，所述参数调整模块303具体用于：

在一种可能的实施方式中，所述特征下采样处理模块305还用于：

所述参数调整模块303还用于：

在一种可能的实施方式中，所述参照信号为均匀分布向量

在一种可能的实施方式中，所述参数调整模块303具体用于：

在一种可能的实施方式中，所述目标维度包括：天气、季节、样式、年龄、风格或者视场角。

参照图12所示，为本公开实施例提供的一种图像处理装置500的示意图，该图像处理装置500包括：

图像获取模块501，用于获取待处理图像；

目标处理模块502，用于将获取的所述待处理图像输入至采用上述的神经网络训练方法训练完成的神经网络，得到语义分割结果或者目标检测结果。

参照图13所示，为本公开实施例提供的一种智能设备控制装置600的示意图，该智能设备控制装置600包括：

图像获取模块601，用于获取智能设备在行驶过程中采集的道路图像；

目标处理模块602，用于将获取的所述道路图像输入至采用上述的神经网络训练方法训练完成的神经网络，得到所述道路图像的语义分割结果或者目标检测结果；

设备控制模块603，用于基于所述道路图像的语义分割结果或者所述目标检测结果，控制所述智能设备行使。

关于装置中的各模块的处理流程、以及各模块之间的交互流程的描述可以参照上述方法实施例中的相关说明，这里不再详述。

基于同一技术构思，本公开实施例还提供了一种电子设备。参照图14所示，为本公开实施例提供的电子设备700的结构示意图，包括处理器701、存储器702、和总线703。其中，存储器702用于存储执行指令，包括内存7021和外部存储器7022；这里的内存7021也称内存储器，用于暂时存放处理器701中的运算数据，以及与硬盘等外部存储器7022交换的数据，处理器701通过内存7021与外部存储器7022进行数据交换。

本申请实施例中，存储器702具体用于存储执行本申请方案的应用程序代码，并由处理器701来控制执行。也即，当电子设备700运行时，处理器701与存储器702之间通过总线703通信，使得处理器701执行存储器702中存储的应用程序代码，进而执行前述任一实施例中所述的方法。

其中，存储器702可以是，但不限于，随机存取存储器(Random Access Memory，RAM)，只读存储器(Read Only Memory，ROM)，可编程只读存储器(Programmable Read－Only Memory，PROM)，可擦除只读存储器(Erasable Programmable Read－Only Memory，EPROM)，电可擦除只读存储器(Electric Erasable Programmable Read－Only Memory，EEPROM)等。

处理器701可能是一种集成电路芯片，具有信号的处理能力。上述的处理器可以是通用处理器，包括中央处理器(Central Processing Unit，CPU)、网络处理器(NetworkProcessor，NP)等；还可以是数字信号处理器(DSP)、专用集成电路(ASIC)、现场可编程门阵列(FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。可以实现或者执行本发明实施例中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。

可以理解的是，本申请实施例示意的结构并不构成对电子设备700的具体限定。在本申请另一些实施例中，电子设备700可以包括比图示更多或更少的部件，或者组合某些部件，或者拆分某些部件，或者不同的部件布置。图示的部件可以以硬件，软件或软件和硬件的组合实现。

本公开实施例还提供一种计算机可读存储介质，该计算机可读存储介质上存储有计算机程序，该计算机程序被处理器运行时执行上述方法实施例中的神经网络训练方法的步骤。其中，该存储介质可以是易失性或非易失的计算机可读取存储介质。

本公开实施例还提供一种计算机程序产品，该计算机程序产品承载有程序代码，所述程序代码包括的指令可用于执行上述方法实施例中的神经网络训练方法的步骤，具体可参见上述方法实施例，在此不再赘述。

其中，上述计算机程序产品可以具体通过硬件、软件或其结合的方式实现。在一个可选实施例中，所述计算机程序产品具体体现为计算机存储介质，在另一个可选实施例中，计算机程序产品具体体现为软件产品，例如软件开发包(Software Development Kit，SDK)等等。

所属领域的技术人员可以清楚地了解到，为描述的方便和简洁，上述描述的系统和装置的具体工作过程，可以参考前述方法实施例中的对应过程，在此不再赘述。在本公开所提供的几个实施例中，应该理解到，所揭露的系统、装置和方法，可以通过其它的方式实现。以上所描述的装置实施例仅仅是示意性的，例如，所述单元的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，又例如，多个单元或组件可以结合或者可以集成到另一个系统，或一些特征可以忽略，或不执行。另一点，所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些通信接口，装置或单元的间接耦合或通信连接，可以是电性，机械或其它的形式。

所述作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。

另外，在本公开各个实施例中的各功能单元可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个单元中。

所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个处理器可执行的非易失的计算机可读取存储介质中。基于这样的理解，本公开的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)执行本公开各个实施例所述方法的全部或部分步骤。而前述的存储介质包括：U盘、移动硬盘、只读存储器(Read-OnlyMemory，ROM)、随机存取存储器(Random Access Memory，RAM)、磁碟或者光盘等各种可以存储程序代码的介质。

最后应说明的是：以上所述实施例，仅为本公开的具体实施方式，用以说明本公开的技术方案，而非对其限制，本公开的保护范围并不局限于此，尽管参照前述实施例对本公开进行了详细的说明，本领域的普通技术人员应当理解：任何熟悉本技术领域的技术人员在本公开揭露的技术范围内，其依然可以对前述实施例所记载的技术方案进行修改或可轻易想到变化，或者对其中部分技术特征进行等同替换；而这些修改、变化或者替换，并不使相应技术方案的本质脱离本公开实施例技术方案的精神和范围，都应涵盖在本公开的保护范围之内。因此，本公开的保护范围应所述以权利要求的保护范围为准。

Claims

1.一种神经网络训练方法，其特征在于，包括：

将所述处理好的所述源域图像和目标域图像输入到所述神经网络中的域无关特征提取器进行特征提取，分别得到所述处理好的源域图像的域变量无关特征向量以及所述目标域图像的域无关特征向量；

将所述域变量无关特征向量以及所述域无关特征向量输入至域辨别器以及所述神经网络中的目标任务网络；基于所述域辨别器输出的判别结果对所述域辨别器以及所述域无关特征提取器进行参数调整，并基于所述目标任务网络输出的预测结果以及所述源域图像的标注结果对所述目标任务网络以及所述域无关特征提取器进行参数调整，得到训练好的神经网络。

2.根据权利要求1所述的方法，其特征在于，所述方法还包括：

基于所述域变量生成监督信号；

3.根据权利要求2所述的方法，其特征在于，所述基于所述监督信号以及所述第一预测概率向量，对所述自对抗正则化器以及所述域无关特征提取器进行参数调整，包括：

4.根据权利要求2或3所述的方法，其特征在于，所述方法还包括：

将所述域变量无关特征向量输入至所述自对抗正则化器进行特征下采样处理，得到第二预测概率向量；

5.根据权利要求4所述的方法，其特征在于，所述参照信号为均匀分布向量。

6.根据权利要求4或5所述的方法，其特征在于，所述基于参照信号以及所述第二预测概率向量对所述自对抗正则化器以及所述域无关特征提取器进行参数调整，包括：

7.根据权利要求1-6任一所述的方法，其特征在于，所述目标维度包括：天气、季节、样式、年龄、风格或者视场角。

8.一种图像处理方法，其特征在于，包括：

获取待处理图像；

将获取的所述待处理图像输入至采用权利要求1至7任一项所述的神经网络训练方法训练完成的神经网络，得到语义分割结果或者目标检测结果。

9.一种智能设备控制方法，其特征在于，包括：

获取智能设备在行驶过程中采集的道路图像；

将获取的所述道路图像输入至采用权利要求1至7任一项所述的神经网络训练方法训练完成的神经网络，得到所述道路图像的语义分割结果或者目标检测结果；

基于所述道路图像的语义分割结果或者所述目标检测结果，控制所述智能设备行使。

10.一种神经网络训练装置，其特征在于，所述装置包括：

参数调整模块，用于将所述域变量无关特征向量以及所述域无关特征向量输入至域辨别器以及所述神经网络中的目标任务网络；基于所述域辨别器输出的判别结果对所述域辨别器以及所述域无关特征提取器进行参数调整，并基于所述目标任务网络输出的预测结果以及所述源域图像的标注结果对所述目标任务网络以及所述域无关特征提取器进行参数调整，得到训练好的神经网络。

11.一种图像处理装置，其特征在于，所述装置包括：

图像获取模块，用于获取待处理图像；

目标处理模块，用于将获取的所述待处理图像输入至采用权利要求1至7任一项所述的神经网络训练方法训练完成的神经网络，得到语义分割结果或者目标检测结果。

12.一种智能设备控制装置，其特征在于，所述装置包括：

目标处理模块，用于将获取的所述道路图像输入至采用权利要求1至7任一项所述的神经网络训练方法训练完成的神经网络，得到所述道路图像的语义分割结果或者目标检测结果；

13.一种电子设备，其特征在于，包括：处理器、存储器和总线，所述存储器存储有所述处理器可执行的机器可读指令，当电子设备运行时，所述处理器与所述存储器之间通过总线通信，所述机器可读指令被所述处理器执行时执行如权利要求1-7任一所述的神经网络训练方法的步骤，或者如权利要求8所述图像处理方法的步骤，或者如权利要求9所述的智能设备控制方法的步骤。

14.一种计算机可读存储介质，其特征在于，该计算机可读存储介质上存储有计算机程序，该计算机程序被处理器运行时执行如权利要求1-7任一所述的神经网络训练方法的步骤，或者如权利要求8所述图像处理方法的步骤，或者如权利要求9所述的智能设备控制方法的步骤。