CN110909877B

CN110909877B - 神经网络模型结构搜索方法、装置、电子设备及存储介质

Info

Publication number: CN110909877B
Application number: CN201911202953.5A
Authority: CN
Inventors: 王洋; 刘焱; 郝新; 吴月升; 熊俊峰; 唐佳伟
Original assignee: Beijing Baidu Netcom Science and Technology Co Ltd
Current assignee: Beijing Baidu Netcom Science and Technology Co Ltd
Priority date: 2019-11-29
Filing date: 2019-11-29
Publication date: 2023-10-27
Anticipated expiration: 2039-11-29
Also published as: CN110909877A

Abstract

本申请公开了一种神经网络模型结构搜索方法、装置、电子设备及存储介质，涉及机器学习领域。具体实现方案为：基于预设的搜索策略和搜索空间，生成目标神经网络模型的各候选结构；利用预设的训练样本集、预设的测试样本集及预设的对抗样本集，对每个候选结构的目标神经网络模型进行训练、测试，确定每个候选结构的目标神经网络模型对应的性能函数值；若第一候选结构的目标神经网络模型对应的性能函数值满足阈值，则确定所述第一候选结构为所述目标神经网络模型的目标结构。本申请的方案能够使得最终确定的目标神经网络模型的目标结构的防御性具有通用性，解决现有技术中应对对抗样本攻击的防御方法，其防御效果有限的技术问题。

Description

神经网络模型结构搜索方法、装置、电子设备及存储介质

技术领域

本申请涉及人工智能和机器学习技术领域，尤其涉及一种神经网络模型结构搜索方法、装置、电子设备及存储介质。

背景技术

随着人工智能(Artificial Intelligence，AI)的发展，深度神经网络(DeepNeural Network，DNN)已广泛应用于计算机视觉、语音识别等领域。但对抗样本的出现，对AI模型的安全性提出了挑战。

对抗样本攻击是指在图像或语音上加入特定的且不易察觉的微量噪声，使模型对加噪之后得到的对抗样本做出错误判断。目前，应对对抗样本攻击的防御方法主要有对抗训练及去噪两种，这两种方法的防御效果有限，且不能持续地进行防御。

发明内容

本申请提出了一种神经网络模型结构搜索方法、装置、电子设备及存储介质，用于解决现有技术中应对对抗样本攻击的防御方法，其防御效果有限的技术问题。

本申请第一方面实施例提出了一种神经网络模型结构搜索方法，包括：

基于预设的搜索策略和搜索空间，生成目标神经网络模型的各候选结构；

利用预设的训练样本集，对每个候选结构的目标神经网络模型进行训练，确定每个候选结构的目标神经网络模型；

利用预设的测试样本集及预设的对抗样本集，对每个候选结构的目标神经网络模型进行测试，确定每个候选结构的目标神经网络模型对应的性能函数值；

若第一候选结构的目标神经网络模型对应的性能函数值满足阈值，则确定所述第一候选结构为所述目标神经网络模型的目标结构。

本申请实施例的神经网络模型结构搜索方法，通过基于预设的搜索策略和搜索空间，生成目标神经网络模型的各候选结构，利用预设的训练样本集，对每个候选结构的目标神经网络模型进行训练，确定每个候选结构的目标神经网络模型，利用预设的测试样本集及预设的对抗样本集，对每个候选结构的目标神经网络模型进行测试，确定每个候选结构的目标神经网络模型对应的性能函数值，若第一候选结构的目标神经网络模型对应的性能函数值满足阈值，则确定第一候选结构为目标神经网络模型的目标结构。由此，通过在模型结构生成阶段，利用对抗样本集和测试样本集来确定各候选结构的性能函数值，将性能函数值满足阈值的候选结构确定为目标结构，使得最终确定的目标神经网络模型的目标结构的防御性具有通用性，可靠性和安全性更强，在保持识别准确性的同时，保证了目标神经网络模型的鲁棒性。

在本申请实施例一种可能的实现方式中，所述利用预设的测试样本集及预设的对抗样本集，对每个参数集对应的目标神经网络模型进行测试之前，还包括：

利用N种攻击方法，对M种已知模型的训练样本集进行攻击，生成所述预设的对抗样本集，其中，所述N和M分别为大于1的整数。

由此，通过利用多种攻击方法对多种已知模型的训练样本集进行估计以生成对抗样本集，能够获得丰富多样的对抗样本，从而有利于使得最终确定的目标神经网络模型的目标结构能够对抗各种攻击，进一步增强目标神经网络模型的鲁棒性。

在本申请实施例一种可能的实现方式中，所述确定每个候选结构的目标神经网络模型对应的性能函数值之后，还包括：

若每个候选结构的目标神经网络模型对应的性能函数值均未满足所述阈值，则基于所述预设的搜索策略，从所述各候选结构中筛选多个参考结构；

基于所述预设的搜索策略，对每个参考结构进行更新，生成更新后的候选结构；

利用所述预设的训练样本集、预设的测试样本集及预设的对抗样本集，对每个更新后的候选结构进行训练、测试，以确定每个更新后的候选结构对应的性能函数值；

根据每个更新后的候选结构对应的性能函数值，确定所述目标神经网络模型的目标结构。

由此，通过在每个候选结构的目标神经网络模型对应的性能函数值均未满足阈值时，基于预设的搜索策略筛选、更新候选结构，并重新确定更新后的候选结构对应的性能函数值，以根据性能函数值确定目标神经网络模型的目标结构，保证了能够抵御对抗样本的目标神经网络模型的生成，有利于提高目标神经网络模型的安全性。

在本申请实施例一种可能的实现方式中，所述确定每个候选结构的目标神经网络模型对应的性能函数值，包括：

利用预设的测试样本集，对每个候选结构的目标神经网络模型进行测试，确定每个候选结构的目标神经网络模型的准确率；

利用预设的对抗样本集，对每个候选结构的目标神经网络模型进行测试，确定每个候选结构的目标神经网络模型成功识别的对抗样本量；

根据每个候选结构的目标神经网络模型的准确率、成功识别的对抗样本量及预设的权重比，确定每个候选结构的目标神经网络模型对应的性能函数值。

由此，通过利用预设的测试样本集测试各候选结构的目标神经网络模型的准确率，利用预设的对抗样本集确定各候选结构的目标神经网络模型成功识别的对抗样本量，进而根据准确率、成功识别的对抗样本量和预设的权重比确定各候选结构的目标神经网络模型的性能函数值，使得对于模型的性能评估不仅考虑了识别的准确率，还考虑了应对对抗样本攻击的能力，为找到兼顾识别能力和防御能力的目标神经网络模型的目标结构提供了条件。

在本申请实施例一种可能的实现方式中，所述确定每个候选结构的目标神经网络模型对应的性能函数值之前，还包括：

根据所述目标神经网络模型的类型，确定所述权重比。

由此，通过根据目标神经网络模型的类型确定权重比，能够实现权重比的灵活选择，提高方法的灵活性和适应性。

本申请第二方面实施例提出了一种神经网络模型结构搜索装置，包括：

生成模块，用于基于预设的搜索策略和搜索空间，生成目标神经网络模型的各候选结构；

训练模块，用于利用预设的训练样本集，对每个候选结构的目标神经网络模型进行训练，确定每个候选结构的目标神经网络模型；

测试模块，用于利用预设的测试样本集及预设的对抗样本集，对每个候选结构的目标神经网络模型进行测试，确定每个候选结构的目标神经网络模型对应的性能函数值；

确定模块，用于若第一候选结构的目标神经网络模型对应的性能函数值满足阈值，则确定所述第一候选结构为所述目标神经网络模型的目标结构。

本申请实施例的神经网络模型结构搜索装置，通过基于预设的搜索策略和搜索空间，生成目标神经网络模型的各候选结构，利用预设的训练样本集，对每个候选结构的目标神经网络模型进行训练，确定每个候选结构的目标神经网络模型，利用预设的测试样本集及预设的对抗样本集，对每个候选结构的目标神经网络模型进行测试，确定每个候选结构的目标神经网络模型对应的性能函数值，若第一候选结构的目标神经网络模型对应的性能函数值满足阈值，则确定第一候选结构为目标神经网络模型的目标结构。由此，通过在模型结构生成阶段，利用对抗样本集和测试样本集来确定各候选结构的性能函数值，将性能函数值满足阈值的候选结构确定为目标结构，使得最终确定的目标神经网络模型的目标结构的防御性具有通用性，可靠性和安全性更强，在保持识别准确性的同时，保证了目标神经网络模型的鲁棒性。

在本申请实施例一种可能的实现方式中，所述装置还包括：

样本生成模块，用于利用N种攻击方法，对M种已知模型的训练样本集进行攻击，生成预设的对抗样本集，其中，N和M分别为大于1的整数。

在本申请实施例一种可能的实现方式中，所述确定模块，还用于：

在本申请实施例一种可能的实现方式中，所述测试模块，包括：

第一测试单元，用于利用预设的测试样本集，对每个候选结构的目标神经网络模型进行测试，确定每个候选结构的目标神经网络模型的准确率；

第二测试单元，用于利用预设的对抗样本集，对每个候选结构的目标神经网络模型进行测试，确定每个候选结构的目标神经网络模型成功识别的对抗样本量；

确定单元，用于根据每个候选结构的目标神经网络模型的准确率、成功识别的对抗样本量及预设的权重比，确定每个候选结构的目标神经网络模型对应的性能函数值。

在本申请实施例一种可能的实现方式中，所述测试模块，还包括：

权重比确定单元，用于根据所述目标神经网络模型的类型，确定所述权重比。

本申请第三方面实施例提出了一种电子设备，包括：

至少一个处理器；以及

与所述至少一个处理器通信连接的存储器；其中，

所述存储器存储有可被所述至少一个处理器执行的指令，所述指令被所述至少一个处理器执行，以使所述至少一个处理器能够执行前述第一方面实施例所述的神经网络模型结构搜索方法。

本申请第四方面实施例提出了一种存储有计算机指令的非瞬时计算机可读存储介质，所述计算机指令用于使所述计算机执行前述第一方面实施例所述的神经网络模型结构搜索方法。

上述申请中的一个实施例具有如下优点或有益效果：

通过基于预设的搜索策略和搜索空间，生成目标神经网络模型的各候选结构，利用预设的训练样本集，对每个候选结构的目标神经网络模型进行训练，确定每个候选结构的目标神经网络模型，利用预设的测试样本集及预设的对抗样本集，对每个候选结构的目标神经网络模型进行测试，确定每个候选结构的目标神经网络模型对应的性能函数值，若第一候选结构的目标神经网络模型对应的性能函数值满足阈值，则确定第一候选结构为目标神经网络模型的目标结构。由此，通过在模型结构生成阶段，利用对抗样本集和测试样本集来确定各候选结构的性能函数值，将性能函数值满足阈值的候选结构确定为目标结构，使得最终确定的目标神经网络模型的目标结构的防御性具有通用性，可靠性和安全性更强，在保持识别准确性的同时，保证了目标神经网络模型的鲁棒性。因为采用利用预设的测试样本集及预设的对抗样本集，对每个候选结构的目标神经网络模型进行测试，确定每个候选结构的目标神经网络模型对应的性能函数值的技术手段，在模型结构生成阶段增加了对抗样本集对模型结构的性能进行评估，使得最终确定的目标神经网络模型的目标结构的防御性具有通用性，所以克服了现有技术中应对对抗样本攻击的防御方法，其防御效果有限的技术问题。

上述可选方式所具有的其他效果将在下文中结合具体实施例加以说明。

附图说明

附图用于更好地理解本方案，不构成对本申请的限定。其中：

图1是根据本申请第一实施例的神经网络模型结构搜索方法的流程示意图；

图2是根据本申请第二实施例的神经网络模型结构搜索方法的流程示意图；

图3是根据本申请第三实施例的神经网络模型结构搜索方法的流程示意图；

图4是根据本申请第四实施例的神经网络模型结构搜索装置的结构示意图；

图5是根据本申请第五实施例的神经网络模型结构搜索装置的结构示意图；

图6是根据本申请第六实施例的神经网络模型结构搜索装置的结构示意图；

图7是用来实现本申请实施例的神经网络模型结构搜索方法的电子设备的框图。

具体实施方式

以下结合附图对本申请的示范性实施例做出说明，其中包括本申请实施例的各种细节以助于理解，应当将它们认为仅仅是示范性的。因此，本领域普通技术人员应当认识到，可以对这里描述的实施例做出各种改变和修改，而不会背离本申请的范围和精神。同样，为了清楚和简明，以下的描述中省略了对公知功能和结构的描述。

下面参考附图描述本申请的神经网络模型结构搜索方法、装置、电子设备及存储介质。

对抗样本攻击是指在图像或语音上加入特定的且不易察觉的微量噪声，使模型对加噪之后得到的对抗样本做出错误判断。对抗样本攻击可能导致财产损失甚至生命受到威胁，例如，道路环境中设置对抗样本，影响自动驾驶的目标检测，导致交通事故的发生。

目前，应对对抗样本攻击的防御方法主要有两种方法，一种是对抗训练，另一种是去噪。其中，对抗训练方式是在模型参数训练过程中利用对抗样本来训练模型参数，但是这种方式训练得到的模型，其防御效果有限。采用去噪方式来防御对抗样本的效果也不佳。

针对上述问题，本申请提出了一种神经网络模型结构搜索方法，通过在模型结构生成阶段，利用对抗样本集和测试样本集来确定各候选结构的性能函数值，将性能函数值满足阈值的候选结构确定为目标结构，使得最终确定的目标神经网络模型的目标结构的防御性具有通用性，可靠性和安全性更强，在保持识别准确性的同时，保证了目标神经网络模型的鲁棒性。

具体而言，图1是根据本申请第一实施例的神经网络模型结构搜索方法的流程示意图，该方法可以由本申请提出的神经网络模型结构搜索装置执行，也可以由电子设备执行，其中，电子设备可以是服务器，也可以是台式电脑、笔记本电脑等终端设备，本申请对此不作限制。下面以本申请提出的神经网络模型结构搜索装置执行本申请的神经网络模型结构搜索方法作为示例来解释说明本申请。

如图1所示，该神经网络模型结构搜索方法，包括以下步骤：

步骤101，基于预设的搜索策略和搜索空间，生成目标神经网络模型的各候选结构。

近年来，深度学习的繁荣，尤其是神经网络的发展，颠覆了传统机器学习特征工程的时代，将人工智能的浪潮推到了历史最高点。然而，尽管各种神经网络模型层出不穷，但往往模型性能越高，对超参数的要求也越来越严格。而模型的网络结构作为一种特殊的超参数，在深度学习整个环节中扮演着举足轻重的角色。

随着科学技术的发展，神经网络结构的设计正从手工设计转型为机器自动设计。网络结构搜索(Neural Architecture Search，NAS)是一种自动设计神经网络的技术，可以通过算法根据样本集自动设计出高性能的网络结构，其原理是给定一个称为搜索空间的候选神经网络结构集合，用某种策略从中搜索出最优网络结构。

NAS的核心要素包括搜索空间、搜索策略和性能评估策略。其中，搜索空间定义了可以搜索的神经网络结构的集合，即解的空间，搜索空间的复杂程度决定了网络结构的潜力；搜索策略定义了如何在搜索空间中寻找最优网络结构；性能评估策略定义了如何评估搜索出的网络结构的性能。对这些要素的不同实现得到了各种不同的NAS算法。

本申请实施例中，可以基于预设的搜索策略和搜索空间，生成目标神经网络模型的各候选结构。其中，预设的搜索策略和搜索空间可以是实现NAS算法的相关算法和技术。比如，预设的搜索空间可以是全局搜索空间，也可以是基于细胞的搜索空间；预设的搜索策略可以是基于强化学习的方法、基于进化算法的方法、基于梯度的方法等。基于预设的搜索策略，可以从预设的搜索空间中搜索到目标神经网络模型的各候选结构，其中，各候选结构中每个节点的参数是未知的。

步骤102，利用预设的训练样本集，对每个候选结构的目标神经网络模型进行训练，确定每个候选结构的目标神经网络模型。

其中，预设的训练样本集可以根据目标神经网络模型的类型进行选择，比如，目标神经网络模型为图像识别模型，则可以选择大量的图片作为预设的训练样本集；又比如，目标神经网络模型为语音识别模型，则可以选择大量的语音数据作为预设的训练样本集。

本实施例中，对于生成的各候选结构，可以利用预设的训练样本集对各候选结构的目标神经网络模型进行训练，以确定各个候选结构中每个节点的参数，得到每个候选结构的目标神经网络。

步骤103，利用预设的测试样本集及预设的对抗样本集，对每个候选结构的目标神经网络模型进行测试，确定每个候选结构的目标神经网络模型对应的性能函数值。

其中，预设的测试样本集和预设的对抗样本集与目标神经网络模型的类型相关，比如，目标神经网络模型为图像识别模型，则预设的测试样本集和预设的对抗样本集中的样本均为图片；又比如，目标神经网络模型为语音识别模型，则预设的测试样本集和预设的对抗样本集中的样本均为语音数据。

依赖于对抗样本的迁移性，在本申请实施例一种可能的实现方式中，可以根据对其他模型的攻击获取对抗样本，组成预设的对抗样本集，用于对目标神经网络模型进行健壮性评估。具体地，可以利用N种攻击方法，对M种已知模型的训练样本集进行攻击，生成预设的对抗样本集，其中，N和M分别为大于1的整数。

本申请实施例中，可以对M种已知模型，比如VGG(Visual GeometryGroup)网络、ResNet、GoogLeNet等多种模型，利用N种攻击方法(如遗传算法、近端梯度下降算法等)对各模型的训练样本集进行攻击，生成预设的对抗样本集。此外，还可以利用参数(如迭代次数、扰动范式等)对各模型的训练样本集进行攻击。其中，选用的M种已知模型可以是受对抗样本的影响不同的模型。

通过利用多种攻击方法对多种已知模型的训练样本集进行估计以生成对抗样本集，能够获得丰富多样的对抗样本，从而有利于使得最终确定的目标神经网络模型的目标结构能够对抗各种攻击，进一步增强目标神经网络模型的鲁棒性。

本实施例中，确定了每个候选结构的目标神经网络模型之后，可以利用预设的测试样本集和预设的对抗样本集，对每个候选结构的目标神经网络模型进行测试，确定每个候选结构的目标神经网络模型对应的性能函数值。其中，性能函数值与目标神经网络模型对测试样本集中测试样本的识别准确率，以及目标神经网络模型对对抗样本集中对抗样本的识别成功率相关。

步骤104，若第一候选结构的目标神经网络模型对应的性能函数值满足阈值，则确定第一候选结构为目标神经网络模型的目标结构。

其中，阈值可以预先设定，比如将阈值设置为95％、98％等。

本实施例中，确定了每个候选结构的目标神经网络模型对应的性能函数值之后，可以将各性能函数值与阈值进行比较，若第一候选结构的目标神经网络模型对应的性能函数值满足阈值，即性能函数值不小于阈值，则确定第一候选结构为目标神经网络模型的目标结构。其中，第一候选结构可以是各候选结构中的任一结构。

进一步地，若性能函数值满足阈值的第一候选结构为多个，则可以进一步比较多个第一候选结构的目标神经网络模型对应的性能函数值，将最大性能函数值对应的第一候选结构确定为目标神经网络模型的目标结构。

本实施例的神经网络模型结构搜索方法，通过基于预设的搜索策略和搜索空间，生成目标神经网络模型的各候选结构，利用预设的训练样本集，对每个候选结构的目标神经网络模型进行训练，确定每个候选结构的目标神经网络模型，利用预设的测试样本集及预设的对抗样本集，对每个候选结构的目标神经网络模型进行测试，确定每个候选结构的目标神经网络模型对应的性能函数值，若第一候选结构的目标神经网络模型对应的性能函数值满足阈值，则确定第一候选结构为目标神经网络模型的目标结构。由此，通过在模型结构生成阶段，利用对抗样本集和测试样本集来确定各候选结构的性能函数值，将性能函数值满足阈值的候选结构确定为目标结构，使得最终确定的目标神经网络模型的目标结构的防御性具有通用性，可靠性和安全性更强，在保持识别准确性的同时，保证了目标神经网络模型的鲁棒性。

图2是根据本申请第二实施例的神经网络模型结构搜索方法的流程示意图。如图2所示，在如图1所示实施例的基础上，步骤103之后，还包括：

步骤201，若每个候选结构的目标神经网络模型对应的性能函数值均未满足阈值，则基于预设的搜索策略，从各候选结构中筛选多个参考结构。

本实施例中，确定了每个候选结构的目标神经网络模型对应的性能函数值之后，将各性能函数值与阈值比较，若比较获知每个候选结构的目标神经网络模型对应的性能函数值均未满足阈值，即各性能函数值均小于阈值，则基于预设的搜索策略，从各候选结构中筛选多个参考结构。

其中，预设的搜索策略比如可以是基于强化学习的方法、基于进化算法的方法、基于梯度的方法等。

步骤202，基于预设的搜索策略，对每个参考结构进行更新，生成更新后的候选结构。

搜索策略定义了如何找到最优的网络结构，通常是一个迭代优化过程，本实施例中，可以基于预设的搜索策略进行迭代优化，对每个参考结构进行更新，生成更新后的候选结构。

步骤203，利用预设的训练样本集、预设的测试样本集及预设的对抗样本集，对每个更新后的候选结构进行训练、测试，以确定每个更新后的候选结构对应的性能函数值。

本实施例中，生成更新后的候选结构之后，可以利用预设的训练样本集对每个更新后的候选结构的目标神经网络模型进行训练，确定每个更新后的候选结构的目标神经网络模型。接着，再利用预设的测试样本集和预设是对抗样本集，对每个更新后的候选结构的目标神经网络模型进行测试，确定每个更新后的候选结构的目标神经网络模型对应的性能函数值。

步骤204，根据每个更新后的候选结构对应的性能函数值，确定目标神经网络模型的目标结构。

本实施例中，确定了每个更新后的候选结构对应的性能函数值之后，可以根据每个更新后的候选结构对应的性能函数值，确定目标神经网络模型的目标结构。

作为一种示例，可以将每个更新后的候选结构对应的性能函数值与阈值比较，判断是否满足阈值。若至少一个更新后的候选结构对应的性能函数值满足阈值，则将最大性能函数值对应的更新后的候选结构确定为目标神经网络模型的目标结构；若每个更新后的候选结构对应的性能函数值均不满足阈值，则返回执行步骤201-步骤204，直至确定出目标神经网络模型的目标结构。

进一步地，为了避免反复执行步骤201-步骤204仍无法确定目标结构的情况发生，作为一种可能的实现方式，在重复执行步骤201-步骤204的次数达到预设次数后，若每个更新后的候选结构对应的性能函数值仍然均不满足阈值，则可以结束本次结构搜索流程，或者将性能函数值最大的更新后的候选结构确定为目标结构。

本实施例的神经网络模型结构搜索方法，通过在每个候选结构的目标神经网络模型对应的性能函数值均未满足阈值时，基于预设的搜索策略，从各候选结构中筛选多个参考结构，并基于预设的搜索策略，对每个参考结构进行更新，生成更新后的候选结构，利用预设的训练样本集、预设的测试样本集及预设的对抗样本集，对每个更新后的候选结构进行训练、测试，以确定每个更新后的候选结构对应的性能函数值，进而根据每个更新后的候选结构对应的性能函数值，确定目标神经网络模型的目标结构，保证了能够抵御对抗样本的目标神经网络模型的生成，有利于提高目标神经网络模型的安全性。

图3是根据本申请第三实施例的神经网络模型结构搜索方法的流程示意图。如图3所示，在前述实施例的基础上，步骤103，可以包括以下步骤：

步骤301，利用预设的测试样本集，对每个候选结构的目标神经网络模型进行测试，确定每个候选结构的目标神经网络模型的准确率。

其中，准确率反映的是各候选结构的目标神经网络模型对测试样本集中各测试样本的识别准确性，准确率越高，表明该候选结构的目标神经网络模型的识别能力越强。

步骤302，利用预设的对抗样本集，对每个候选结构的目标神经网络模型进行测试，确定每个候选结构的目标神经网络模型成功识别的对抗样本量。

其中，成功识别的对抗样本量，指的是预设的对抗样本集中，被候选结构的目标神经网络模型成功识别的对抗样本的数量。对于同一预设的对抗样本集，候选结构的目标神经网络模型成功识别的对抗样本量越多，表明该候选结构的目标神经网络模型应对对抗样本的能力越强，其抗干扰能力越强。

步骤303，根据每个候选结构的目标神经网络模型的准确率、成功识别的对抗样本量及预设的权重比，确定每个候选结构的目标神经网络模型对应的性能函数值。

其中，预设的权重比可以预先设定，比如设置准确率和成功识别的对抗样本量的权重比为1:1、4:6等。

在本申请实施例一种可能的实现方式中，可以根据目标神经网络模型的类型，确定预设的权重比。比如，某一类型的目标神经网络模型对识别准确率的要求更高一些，则可以设置准确率对应的权重较大，可以设置准确率和成功识别的对抗样本量的权重比为6:4、7:3等；又比如，某一类型的目标神经网络模型对于应对对抗样本攻击的能力的要求更高一些，则可以设置准确率对应的权重较小，可以设置准确率和成功识别的对抗样本量的权重比为4:6、3:7等。

通过根据目标神经网络模型的类型确定权重比，能够实现权重比的灵活选择，提高方法的灵活性和适应性。

本实施例中，根据每个候选结构的目标神经网络模型的准确率、成功识别的对抗样本量及预设的权重比，可以确定每个候选结构的目标神经网络模型对应的性能函数值。

作为一种示例，每个候选结构的目标神经网络模型对应的性能函数值，可以通过如下公式(1)计算得到。

其中，α与β的值根据预设的权重比确定，且α+β＝1。比如，若准确率和成功识别的对抗样本量的权重比为6：4，则可以确定α的值为0.4，β的值为0.6。

本实施例的神经网络模型结构搜索方法，通过利用预设的测试样本集测试各候选结构的目标神经网络模型的准确率，利用预设的对抗样本集确定各候选结构的目标神经网络模型成功识别的对抗样本量，进而根据准确率、成功识别的对抗样本量和预设的权重比确定各候选结构的目标神经网络模型的性能函数值，使得对于模型的性能评估不仅考虑了识别的准确率，还考虑了应对对抗样本攻击的能力，为找到兼顾识别能力和防御能力的目标神经网络模型的目标结构提供了条件。

根据本申请的实施例，本申请还提出一种神经网络模型结构搜索装置。

图4是根据本申请第四实施例的神经网络模型结构搜索装置的结构示意图。如图4所示，该神经网络模型结构搜索装置40包括：生成模块410、训练模块420、测试模块430，以及确定模块440。

其中，生成模块410，用于基于预设的搜索策略和搜索空间，生成目标神经网络模型的各候选结构。

训练模块420，用于利用预设的训练样本集，对每个候选结构的目标神经网络模型进行训练，确定每个候选结构的目标神经网络模型。

测试模块430，用于利用预设的测试样本集及预设的对抗样本集，对每个候选结构的目标神经网络模型进行测试，确定每个候选结构的目标神经网络模型对应的性能函数值。

确定模块440，用于若第一候选结构的目标神经网络模型对应的性能函数值满足阈值，则确定第一候选结构为目标神经网络模型的目标结构。

进一步地，在本申请实施例一种可能的实现方式中，确定模块440还用于：若每个候选结构的目标神经网络模型对应的性能函数值均未满足阈值，则基于预设的搜索策略，从各候选结构中筛选多个参考结构；基于预设的搜索策略，对每个参考结构进行更新，生成更新后的候选结构；利用预设的训练样本集、预设的测试样本集及预设的对抗样本集，对每个更新后的候选结构进行训练、测试，以确定每个更新后的候选结构对应的性能函数值；根据每个更新后的候选结构对应的性能函数值，确定目标神经网络模型的目标结构。

通过在每个候选结构的目标神经网络模型对应的性能函数值均未满足阈值时，基于预设的搜索策略筛选、更新候选结构，并重新确定更新后的候选结构对应的性能函数值，以根据性能函数值确定目标神经网络模型的目标结构，保证了能够抵御对抗样本的目标神经网络模型的生成，有利于提高目标神经网络模型的安全性。

在本申请实施例一种可能的实现方式中，如图5所示，在如图4所示实施例的基础上，该神经网络模型结构搜索装置40还包括：

样本生成模块400，用于利用N种攻击方法，对M种已知模型的训练样本集进行攻击，生成预设的对抗样本集，其中，N和M分别为大于1的整数。

在本申请实施例一种可能的实现方式中，如图6所示，在如图4所示实施例的基础上，测试模块430包括：

第一测试单元431，用于利用预设的测试样本集，对每个候选结构的目标神经网络模型进行测试，确定每个候选结构的目标神经网络模型的准确率。

第二测试单元432，用于利用预设的对抗样本集，对每个候选结构的目标神经网络模型进行测试，确定每个候选结构的目标神经网络模型成功识别的对抗样本量。

确定单元433，用于根据每个候选结构的目标神经网络模型的准确率、成功识别的对抗样本量及预设的权重比，确定每个候选结构的目标神经网络模型对应的性能函数值。

进一步地，如图6所示，测试模块430还包括：

权重比确定单元434，用于根据目标神经网络模型的类型，确定权重比。

通过利用预设的测试样本集测试各候选结构的目标神经网络模型的准确率，利用预设的对抗样本集确定各候选结构的目标神经网络模型成功识别的对抗样本量，进而根据准确率、成功识别的对抗样本量和预设的权重比确定各候选结构的目标神经网络模型的性能函数值，使得对于模型的性能评估不仅考虑了识别的准确率，还考虑了应对对抗样本攻击的能力，为找到兼顾识别能力和防御能力的目标神经网络模型的目标结构提供了条件。

需要说明的是，前述对神经网络模型结构搜索方法实施例的解释说明，也适用于本申请实施例的神经网络模型结构搜索装置，其实现原理类似，此处不再赘述。

根据本申请的实施例，本申请还提供了一种电子设备和一种可读存储介质。

如图7所示，是根据本申请实施例的神经网络模型结构搜索方法的电子设备的框图。电子设备旨在表示各种形式的数字计算机，诸如，膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备还可以表示各种形式的移动装置，诸如，个人数字处理、蜂窝电话、智能电话、可穿戴设备和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例，并且不意在限制本文中描述的和/或者要求的本申请的实现。

如图7所示，该电子设备包括：一个或多个处理器701、存储器702，以及用于连接各部件的接口，包括高速接口和低速接口。各个部件利用不同的总线互相连接，并且可以被安装在公共主板上或者根据需要以其它方式安装。处理器701可以对在电子设备内执行的指令进行处理，包括存储在存储器702中或者存储器上以在外部输入/输出装置(诸如，耦合至接口的显示设备)上显示GUI的图形信息的指令。在其它实施方式中，若需要，可以将多个处理器和/或多条总线与多个存储器和多个存储器一起使用。同样，可以连接多个电子设备，各个设备提供部分必要的操作(例如，作为服务器阵列、一组刀片式服务器、或者多处理器系统)。图7中以一个处理器701为例。

存储器702即为本申请所提供的非瞬时计算机可读存储介质。其中，所述存储器702存储有可由至少一个处理器执行的指令，以使所述至少一个处理器701执行本申请所提供的神经网络模型结构搜索方法。本申请的非瞬时计算机可读存储介质存储计算机指令，该计算机指令用于使计算机执行本申请所提供的神经网络模型结构搜索方法。

存储器702作为一种非瞬时计算机可读存储介质，可用于存储非瞬时软件程序、非瞬时计算机可执行程序以及模块，如本申请实施例中的神经网络模型结构搜索方法对应的程序指令/模块(例如，附图4所示的生成模块410、训练模块420、测试模块430和确定模块440)。处理器701通过运行存储在存储器702中的非瞬时软件程序、指令以及模块，从而执行服务器的各种功能应用以及数据处理，即实现上述方法实施例中的神经网络模型结构搜索方法。

存储器702可以包括存储程序区和存储数据区，其中，存储程序区可存储操作系统、至少一个功能所需要的应用程序；存储数据区可存储根据执行神经网络模型结构搜索方法的电子设备的使用所创建的数据等。此外，存储器702可以包括高速随机存取存储器，还可以包括非瞬时存储器，例如至少一个磁盘存储器件、闪存器件、或其他非瞬时固态存储器件。在一些实施例中，存储器702可选包括相对于处理器701远程设置的存储器，这些远程存储器可以通过网络连接至执行神经网络模型结构搜索方法的电子设备。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。

执行神经网络模型结构搜索方法的电子设备还可以包括：输入装置703和输出装置704。处理器701、存储器702、输入装置703和输出装置704可以通过总线或者其他方式连接，图7中以通过总线连接为例。

输入装置703可接收输入的数字或字符信息，以及产生与执行神经网络模型结构搜索方法的电子设备的用户设置以及功能控制有关的键信号输入，例如触摸屏、小键盘、鼠标、轨迹板、触摸板、指示杆、一个或者多个鼠标按钮、轨迹球、操纵杆等输入装置。输出装置704可以包括显示设备、辅助照明装置(例如，LED)和触觉反馈装置(例如，振动电机)等。该显示设备可以包括但不限于，液晶显示器(LCD)、发光二极管(LED)显示器和等离子体显示器。在一些实施方式中，显示设备可以是触摸屏。

此处描述的系统和技术的各种实施方式可以在数字电子电路系统、集成电路系统、专用ASIC(专用集成电路)、计算机硬件、固件、软件、和/或它们的组合中实现。这些各种实施方式可以包括：实施在一个或者多个计算机程序中，该一个或者多个计算机程序可在包括至少一个可编程处理器的可编程系统上执行和/或解释，该可编程处理器可以是专用或者通用可编程处理器，可以从存储系统、至少一个输入装置、和至少一个输出装置接收数据和指令，并且将数据和指令传输至该存储系统、该至少一个输入装置、和该至少一个输出装置。

这些计算程序(也称作程序、软件、软件应用、或者代码)包括可编程处理器的机器指令，并且可以利用高级过程和/或面向对象的编程语言、和/或汇编/机器语言来实施这些计算程序。如本文使用的，术语“机器可读介质”和“计算机可读介质”指的是用于将机器指令和/或数据提供给可编程处理器的任何计算机程序产品、设备、和/或装置(例如，磁盘、光盘、存储器、可编程逻辑装置(PLD))，包括，接收作为机器可读信号的机器指令的机器可读介质。术语“机器可读信号”指的是用于将机器指令和/或数据提供给可编程处理器的任何信号。

为了提供与用户的交互，可以在计算机上实施此处描述的系统和技术，该计算机具有：用于向用户显示信息的显示装置(例如，CRT(阴极射线管)或者LCD(液晶显示器)监视器)；以及键盘和指向装置(例如，鼠标或者轨迹球)，用户可以通过该键盘和该指向装置来将输入提供给计算机。其它种类的装置还可以用于提供与用户的交互；例如，提供给用户的反馈可以是任何形式的传感反馈(例如，视觉反馈、听觉反馈、或者触觉反馈)；并且可以用任何形式(包括声输入、语音输入或者、触觉输入)来接收来自用户的输入。

可以将此处描述的系统和技术实施在包括后台部件的计算系统(例如，作为数据服务器)、或者包括中间件部件的计算系统(例如，应用服务器)、或者包括前端部件的计算系统(例如，具有图形用户界面或者网络浏览器的用户计算机，用户可以通过该图形用户界面或者该网络浏览器来与此处描述的系统和技术的实施方式交互)、或者包括这种后台部件、中间件部件、或者前端部件的任何组合的计算系统中。可以通过任何形式或者介质的数字数据通信(例如，通信网络)来将系统的部件相互连接。通信网络的示例包括：局域网(LAN)、广域网(WAN)和互联网。

计算机系统可以包括客户端和服务器。客户端和服务器一般远离彼此并且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端-服务器关系的计算机程序来产生客户端和服务器的关系。

应该理解，可以使用上面所示的各种形式的流程，重新排序、增加或删除步骤。例如，本发申请中记载的各步骤可以并行地执行也可以顺序地执行也可以不同的次序执行，只要能够实现本申请公开的技术方案所期望的结果，本文在此不进行限制。

上述具体实施方式，并不构成对本申请保护范围的限制。本领域技术人员应该明白的是，根据设计要求和其他因素，可以进行各种修改、组合、子组合和替代。任何在本申请的精神和原则之内所作的修改、等同替换和改进等，均应包含在本申请保护范围之内。

Claims

1.一种语音识别模型结构搜索方法，其特征在于，包括：

基于预设的搜索策略和搜索空间，生成语音识别模型的各候选结构；

利用预设的语音训练样本集，对每个候选结构的语音识别模型进行训练，确定每个候选结构的语音识别模型，其中，所述预设的语音训练样本集是根据所述语音识别模型的类型进行选择得到的；

利用预设的语音测试样本集及预设的语音对抗样本集，对每个候选结构的语音识别模型进行测试，确定每个候选结构的语音识别模型对应的性能函数值；其中，所述预设的语音测试样本集和所述预设的语音对抗样本集与所述语音识别模型的类型相关；

若第一候选结构的语音识别模型对应的性能函数值满足阈值，则确定所述第一候选结构为所述语音识别模型的目标结构，以应对语音识别对抗样本攻击；

其中，所述确定每个候选结构的语音识别模型对应的性能函数值，包括：

利用预设的语音测试样本集，对每个候选结构的语音识别模型进行测试，确定每个候选结构的语音识别模型的准确率；

利用预设的语音对抗样本集，对每个候选结构的语音识别模型进行测试，确定每个候选结构的语音识别模型成功识别的对抗样本量；

根据每个候选结构的语音识别模型的准确率、成功识别的对抗样本量及预设的权重比，确定每个候选结构的语音识别模型对应的性能函数值。

2.如权利要求1所述的方法，其特征在于，所述利用预设的语音测试样本集及预设的语音对抗样本集，对每个参数集对应的语音识别模型进行测试之前，还包括：

利用N种攻击方法，对M种已知模型的语音训练样本集进行攻击，生成所述预设的语音对抗样本集，其中，所述N和M分别为大于1的整数。

3.如权利要求1所述的方法，其特征在于，所述确定每个候选结构的语音识别模型对应的性能函数值之后，还包括：

若每个候选结构的语音识别模型对应的性能函数值均未满足所述阈值，则基于所述预设的搜索策略，从所述各候选结构中筛选多个参考结构；

利用所述预设的语音训练样本集、预设的语音测试样本集及预设的语音对抗样本集，对每个更新后的候选结构进行训练、测试，以确定每个更新后的候选结构对应的性能函数值；

根据每个更新后的候选结构对应的性能函数值，确定所述语音识别模型的目标结构。

4.如权利要求1所述的方法，其特征在于，所述确定每个候选结构的语音识别模型对应的性能函数值之前，还包括：

根据所述语音识别模型的类型，确定所述权重比。

5.一种语音识别模型搜索装置，应用于语音识别，其特征在于，包括：

生成模块，用于基于预设的搜索策略和搜索空间，生成语音识别模型的各候选结构；

训练模块，用于利用预设的语音训练样本集，对每个候选结构的语音识别模型进行训练，确定每个候选结构的语音识别模型，其中，所述预设的语音训练样本集是根据所述语音识别模型的类型进行选择得到的；

测试模块，用于利用预设的语音测试样本集及预设的语音对抗样本集，对每个候选结构的语音识别模型进行测试，确定每个候选结构的语音识别模型对应的性能函数值；其中，所述预设的语音测试样本集和所述预设的语音对抗样本集与所述语音识别模型的类型相关；

确定模块，用于若第一候选结构的语音识别模型对应的性能函数值满足阈值，则确定所述第一候选结构为所述语音识别模型的目标结构，以应对语音识别对抗样本攻击；

其中，所述测试模块，包括：

第一测试单元，用于利用预设的语音测试样本集，对每个候选结构的语音识别模型进行测试，确定每个候选结构的语音识别模型的准确率；

第二测试单元，用于利用预设的语音对抗样本集，对每个候选结构的语音识别模型进行测试，确定每个候选结构的语音识别模型成功识别的对抗样本量；

确定单元，用于根据每个候选结构的语音识别模型的准确率、成功识别的对抗样本量及预设的权重比，确定每个候选结构的语音识别模型对应的性能函数值。

6.如权利要求5所述的装置，其特征在于，还包括：

样本生成模块，用于利用N种攻击方法，对M种已知模型的语音训练样本集进行攻击，生成所述预设的语音对抗样本集，其中，所述N和M分别为大于1的整数。

7.如权利要求5所述的装置，其特征在于，所述确定模块，还用于：

8.如权利要求5所述的装置，其特征在于，所述测试模块，还包括：

权重比确定单元，用于根据所述语音识别模型的类型，确定所述权重比。

9.一种电子设备，其特征在于，包括：

至少一个处理器；以及

与所述至少一个处理器通信连接的存储器；其中，

所述存储器存储有可被所述至少一个处理器执行的指令，所述指令被所述至少一个处理器执行，以使所述至少一个处理器能够执行权利要求1-4中任一所述的语音识别模型搜索方法。

10.一种存储有计算机指令的非瞬时计算机可读存储介质，其特征在于，所述计算机指令用于使所述计算机执行权利要求1-4中任一所述的语音识别模型搜索方法。