CN111126458A

CN111126458A - 基于小样本的数据增强及神经网络对抗训练方法

Info

Publication number: CN111126458A
Application number: CN201911240414.0A
Authority: CN
Inventors: 王础; 范国超; 郝创博; 王佳佳; 王东豪; 刘玉蓉
Original assignee: Beijing Jinghang Computing Communication Research Institute
Current assignee: Beijing Jinghang Computing Communication Research Institute
Priority date: 2019-12-06
Filing date: 2019-12-06
Publication date: 2020-05-08

Abstract

本发明属于车辆缺陷等级评估技术领域，具体涉及一种基于小样本的数据增强及神经网络对抗训练方法。本发明改进了基于生成模型数据增强的车辆损伤和缺陷等级神经网络评估模型小样本条件优化方法。基于传统生成模型数据增强方法与神经网络评估模型结构的相容性不足，因此增强数据对神经网络评估模型的性能优化作用有限。本发明提出结合神经网络评估模型结构特征的数据增强方法和神经网络评估模型基于增强数据的对抗训练方法，解决神经网络评估模型在小样本条件下模型结构性能退化的问题，提升了神经网络评估模型的性能。

Description

基于小样本的数据增强及神经网络对抗训练方法

技术领域

本发明属于车辆缺陷等级评估技术领域，具体涉及一种基于小样本的数据增强及神经网络对抗训练方法。

背景技术

车辆部件的性能与可靠性与温度、湿度、光照等环境因素密切相关。评估环境对车辆部件损伤和性能退化的影响对面向不同地区的车辆设计与制造参数的优化具有重要的指导作用。在给定环境因素中，评估车辆部件损伤和缺陷等级是评估环境对车辆影响的重要内容和环节。由于车辆部件损伤和缺陷是相关影响因素长期作用所形成的，因此试验采集的部件损伤和缺陷数据面临数据量少、成本高的问题。另一方面，基于神经网络的车辆部件损伤和缺陷等级评估模型具有高性能的前提是需要大量的损伤和缺陷数据进行训练。当车辆部件损伤和缺陷的数据量小(满足小样本条件)时，基于神经网络的部件损伤和缺陷评估模型的性能受到限制。

神经网络评估模型在小样本条件中的优化方法取得了飞速发展，通用神经网络评估模型在车辆部件损伤和缺陷等级评估领域取得了更加广泛和深入的应用。目前，神经网络评估模型在小样本条件中的优化方法以融合先验知识等学习为基本原理，主要基于数据增强、迁移学习、元学习、度量学习等优化策略。在元学习中，一些优化方法利用基于记忆的神经网络模型进行记忆增强，从而实现对已有知识的存储，利用知识记忆模型提升原有神经网络评估模型在小样本条件下的性能。在迁移学习中，一些评估方法将不同环境场景中采集的数据特征映射到公共空间，实现在单一场景采集少量数据的条件下训练神经网络评估模型。元学习基于已有的评估任务学习经验和信息，将已有的经验和信息融合到源评估模型中，从而在目标任务中通过源评估模型中存储的信息和知识，提升目标评估任务中的神经网络评估模型性能。度量学习通过构造数据特征空间和数据相似度的度量函数，利用特征相似的数据进行迁移训练，实现神经网络评估模型在小样本条件的性能。基于数据增强的神经网络评估模型优化方法利用数据增强方法和面向增强数据的模型训练方法，进一步提升评估模型的性能。

迄今为止，基于数据增强的神经网络评估模型优化方法在数据增强和模型训练准则的性能方面无法满足实际应用领域的需求。基于人工准则的数据增强方法虽然融合先验知识和数据结构信息，但是由于人工准则与神经网络评估模型结构的相容性具有不确定性，所以增强数据对神经网络评估模型性能优化效果受到限制。基于深度生成模型的数据增强方法利用变分自编码器(VAE)与对抗生成网络(GAN)等深度生成模型生成数据对车辆损伤和缺陷数据集进行数据增强。但是VAE和GAN模型缺乏可解释性，因此生成的车辆损伤和缺陷数据与神经网络评估模型缺乏关联，对神经网络评估模型的性能具有不确定性。

发明内容

(一)要解决的技术问题

本发明要解决的技术问题是如何提供一种基于小样本的数据增强及神经网络对抗训练方法。

(二)技术方案

为解决上述技术问题，本发明提供一种基于小样本的数据增强及神经网络对抗训练方法，所述方法包括：

步骤1：将数据集

平均分解成t份，具体形式如下：

步骤2：随机选取整数k∈[1...n_t]，训练第一生成器G₁(x,φ₁)、第二生成器G₂(x,φ₂)和第三生成器G₃(x,φ₃)中的参数{φ₁,φ₂,φ₃}，所述步骤2包括：步骤21、步骤22和步骤23；

步骤21：通过求解下面关于参数φ₁的优化问题来得到第一生成器G₁(x,φ₁)的最优参数φ₁：

步骤22：通过求解下面关于参数φ₂的优化问题来得到第二生成器G₂(x,φ₂)的最优参数φ₂：

步骤23：通过求解下面关于参数φ₃的优化问题来得到生成器G₃(x,φ₃)的最优参数φ₃：

步骤3：对i＝n_k-1...n_k，计算第一生成器G₁(x_i,φ₁)、第二生成器G₂(x_i,φ₂)和第三生成器G₃(x_i,φ₃)的重要性权值W_1i、W_2i、W_3i：

其中，Jl(f(x,θ),y)为交叉熵损失函数l(f(x,θ),y)关于θ的Jacobian矩阵；

Jl(f(G₁(x_i,φ₁),θ),y_i)表示Jl(f(x,θ),y)在x＝G₁(x_i,φ₁),y＝y_i处的取值；

Jl(f(G₂(x_i,φ₂),θ),y_i)表示Jl(f(x,θ),y)在x＝G₂(x_i,φ₂),y＝y_i处的取值；

步骤4：通过求解下面关于参数θ的优化问题，得到评估模型f(x,θ)的最优参数θ：

步骤5：如果迭代次数超过给定阈值ε，则终止；否则回到步骤2。

其中，所述α₁为给定的权值参数。

其中，所述Jl(f(x,θ),y)为交叉熵损失函数l(f(x,θ),y)关于θ的Jacobian矩阵。

其中，所述Jl(f(G₂(x_i,φ₂),θ),y_i)表示Jl(f(x,θ),y)在x＝G₂(x_i,φ₂),y＝y_i处的取值。

其中，所述α₂为给定的权值参数。

其中，Jl(f(G₃(x_i,φ₃),θ),y_i)表示Jl(f(x,θ),y)在x＝G₃(x_i,φ₃),y＝y_i处的取值。

其中，所述α₃为给定的权值参数。

其中，所述c是给定的权值系数。

(三)有益效果

本发明改进了基于生成模型数据增强的车辆损伤和缺陷等级神经网络评估模型小样本条件优化方法。基于传统生成模型数据增强方法与神经网络评估模型结构的相容性不足，因此增强数据对神经网络评估模型的性能优化作用有限。本发明提出结合神经网络评估模型结构特征的数据增强方法和神经网络评估模型基于增强数据的对抗训练方法，解决神经网络评估模型在小样本条件下模型结构性能退化的问题，提升了神经网络评估模型的性能。

与现有技术相比，本发明技术方案的主要关键点包含下面几点：

(1)本发明技术方案的框架具有创新性。本发明技术方案利用生成器生成增强数据，然后在步骤3对增强数据进行重要性评分，最后利用评分加权的增强数据对神经网络评估模型进行对抗训练。

(2)在步骤21中，本发明技术方案训练增强数据第一生成器，使得生成器在数据空间中与真实数据距离较大，但是在神经网络模型中间层f’的输出与真实数据距离较小的数据。

(3)在步骤22中，本发明技术方案训练增强数据第二生成器，使得生成器生成数据在原始空间中与真实数据距离较小的同时，关于神经网络评估模型的损失函数梯度较大。增强数据的生成方法旨在解决神经网络评估模型在小样本条件下结构光滑的退化问题和神经网络模型提取车辆损伤和缺陷数据冗余特征的缺点。

(4)在步骤3中，给定数据x，对第一生成器、第二生成器和第三生成器输出的数据根据对神经网络评估模型f的重要性进行加权，加权方式是创新点。

(5)步骤4中，利用增强数据对神经网络评估模型进行训练的目标函数是创新点，现有技术中没有相同的训练方式。

附图说明

图1为本发明技术方案原理示意图。

具体实施方式

为使本发明的目的、内容、和优点更加清楚，下面结合附图和实施例，对本发明的具体实施方式作进一步详细描述。

给定车辆损伤和缺陷数据

其中，n为数据个数，x_i为第i个数据的向量表示，y_i为表示第i个数据的类别。假设神经网络评估模型输出记作f(x,θ)，神经网络评估模型中间特征层的输出记作f'(x,θ)，其中，θ为神经网络的参数。神经网络评估模型的缺陷等级评估任务训练过程等价于求解下面的优化问题：

其中，l(f(x,θ),y)为神经网络评估模型关于缺陷等级评估任务的交叉熵损失函数。

本发明针对神经网络评估模型结构由于车辆损伤和缺陷数据数量不足的小样本条件而导致的缺陷等级评估任务性能退化问题，提出面向小样本条件的部件损伤和缺陷神经网络评估模型优化方法，设计针对神经网络评估模型结构缺陷的数据增强方法和模型训练方法，提升基于传统生成模型的数据增强方法对神经网络评估模型结构的性能，提升了评估模型的等级预测性能。

具体而言，本发明提供一种基于小样本的数据增强及神经网络对抗训练方法，如图1所示，所述方法包括：

步骤1：将数据集

平均分解成t份，具体形式如下：

步骤2：随机选取整数k∈[1...n_t]，训练第一生成器G₁(x,φ₁)、第二生成器G₂(x,φ₂)和第三生成器G₃(x,φ₃)中的参数{φ₁,φ₂,φ₃}，所述步骤2包括：步骤2.1、步骤2.2和步骤2.3；

步骤2.1：通过求解下面关于参数φ₁的优化问题来得到第一生成器G₁(x,φ₁)的最优参数φ₁：

其中，α₁为给定的权值参数；

步骤2.2：通过求解下面关于参数φ₂的优化问题来得到第二生成器G₂(x,φ₂)的最优参数φ₂：

Jl(f(G₂(x_i,φ₂),θ),y_i)表示Jl(f(x,θ),y)在x＝G₂(x_i,φ₂),y＝y_i处的取值，α₂为给定的权值参数；

步骤2.3：通过求解下面关于参数φ₃的优化问题来得到生成器G₃(x,φ₃)的最优参数φ₃：

Jl(f(G₃(x_i,φ₃),θ),y_i)表示Jl(f(x,θ),y)在x＝G₃(x_i,φ₃),y＝y_i处的取值，α₃为给定的权值参数；

其中，c是给定的权值系数；

以上所述仅是本发明的优选实施方式，应当指出，对于本技术领域的普通技术人员来说，在不脱离本发明技术原理的前提下，还可以做出若干改进和变形，这些改进和变形也应视为本发明的保护范围。