CN114118414A

CN114118414A - 一种基于稀疏响应面的深度学习算法超参数优化方法

Info

Publication number: CN114118414A
Application number: CN202111446965.XA
Authority: CN
Inventors: 林景亮
Original assignee: Guangdong Ocean University
Current assignee: Guangdong Ocean University
Priority date: 2021-11-30
Filing date: 2021-11-30
Publication date: 2022-03-01
Also published as: ZA202207913B; WO2022199719A1

Abstract

本发明针对现有技术的局限性，提出了一种基于稀疏响应面的深度学习算法超参数优化方法，该方法利用了高稀疏响应面来逼近深度学习算法超参数配置与深度神经网络识别精度的高维非线性映射关系；其总体优化效率更高，在构造超参数配置与深度神经网络识别精度的高维非线性映射关系响应面的过程中，需要评估的超参数配置的数量更少；在开发更有可能进一步提升深度神经网络识别精度的超参数配置过程中，兼顾了全局“勘探”和局部“开采”；对开发的超参数配置进一步筛选，减少了评估超参数配置性能过程中训练神经网络所需的迭代资源；在同样的迭代资源下，利用本发明优化选择的超参数配置所训练构造出的神经网络模型的识别精度更高。

Description

一种基于稀疏响应面的深度学习算法超参数优化方法

技术领域

本发明涉及深度学习技术领域，具体涉及深度学习算法超参数优化技术，更具体地，涉及一种基于稀疏响应面的深度学习算法超参数优化方法。

背景技术

深度学习是近年来被广泛关注的技术，其克服了深度神经网络难以有效训练的难题，使其能以足够深度和宽度的网络，以及大量训练数据，获取了准确表征数据中隐含的特征。目前，深度学习技术已经被广泛应用于图像识别、语音识别等领域，达到了与人脑媲美甚至某方面超越人脑的识别能力。然而，在训练神经网络之前，深度学习算法有很多超参数需预先设置，例如神经网络的隐藏层数量、隐藏层神经元数量、核大小、训练数据批量大小、训练图像分辨率、学习率、正则化因子、激活函数等。由于这些超参数的组合(即超参数配置)会影响神经网络最终的识别能力，而且人为调整选择合适的超参数配置比较耗时。因此，通过优化方法高效获取最优超参数配置至关重要。

如公开日为2020.08.25的中国发明申请：超参数搜索方法、装置、设备以及存储介质所示，利用搜索算法来获取超参数配置已经成为本领域的主流；而现有的深度学习算法超参数优化方法大致可分成三类：

第一类：直接搜索方法，如网格搜索、随机搜索和Hyperband等。此类方法是在给定搜索空间中选择超参数配置，然后按顺序验证每组超参数配置对应的深度神经网络的识别精度(即验证集上的识别精度)，最后根据精度选出其中最佳。直接搜索方法具有使用简单、直观性强的优点，但无法保证获得最优配置。对于网格搜索，其优化结果依赖于对搜索空间划分的精细程度，但由于深度学习算法的超参数通常较多，配置数量随划分指数倍增长，验证所有的配置显得不太可能，因此难以获取最优配置；对于随机搜索和Hyperband，其优化结果依赖于随机产生的配置中是否包含最优配置，因此也无法保证获取最优配置。

第二类：基于响应面的优化方法，如贝叶斯优化(BO)、序列模型方法等。此类方法首先随机产生少量超参数配置并计算其对应的识别精度，然后利用响应面逼近超参数配置与识别精度之间的映射关系，最后将响应面作为先验，进一步开发新的超参数配置来提升识别精度。与网格搜索、随机搜索相比，通常具有更高的优化效率，且理论上能够获得全局最优。但是，以贝叶斯优化为代表的响应面优化方法通常需要计算方差、协方差等复杂统计量，算法比较耗时，对于高维优化问题效率低，且优化过程中的结果往往不如Hyperband。

第三类：混合优化方法，例如BOHB，即贝叶斯优化(BO)和Hyperband的组合。该方法一般是将第一类方法和第二类方法结合，旨在充分利用两者的优点。BOHB方法综合了BO和Hyperband的优点，利用BO替代Hyperband中的随机搜索部分，提升了Hyperband获得最优配置的概率。但是，BO对于高维问题计算量大的缺点依然存在，导致BOHB的总体优化效率仍有待进一步提高。

发明内容

针对现有技术的局限，本发明提出一种基于稀疏响应面的深度学习算法超参数优化方法，本发明采用的技术方案是：

一种基于稀疏响应面的深度学习算法超参数优化方法，包括以下步骤：

S1，从预设的超参数搜索空间中采样待优化深度学习算法的超参数配置；分别根据步骤S1的采样结果对目标深度神经网络进行训练以及验证，得到对应的模型识别精度；将步骤S1的采样结果以及对应的模型识别精度作为响应面构造数据集；

S2，根据所述响应面构造数据集，构造出反映超参数配置与模型识别精度映射关系的高稀疏响应面；

S3，根据所述高稀疏响应面，重新从超参数搜索空间中采样待优化深度学习算法的超参数配置；

S4，对本轮迭代中所述步骤S3的采样结果进行筛选；分别根据本轮迭代中步骤S4的筛选结果对目标深度神经网络进行训练以及验证，得到对应的模型识别精度；

S5，判断预设的迭代资源是否已经耗尽：

若未耗尽，则将本轮迭代中步骤S4的筛选结果以及对应的模型识别精度合并到所述响应面构造数据集中，返回所述步骤S2进行下一轮迭代；

若已耗尽，则将当前已获得的模型识别精度最高的超参数配置作为待优化深度学习算法的超参数优化结果。

相较于现有技术，本发明利用了高稀疏响应面来逼近深度学习算法超参数配置与深度神经网络识别精度的高维非线性映射关系；其总体优化效率更高，在构造超参数配置与深度神经网络识别精度的高维非线性映射关系响应面的过程中，需要评估的超参数配置的数量更少；在开发更有可能进一步提升深度神经网络识别精度的超参数配置过程中，兼顾了全局“勘探”和局部“开采”；对开发的超参数配置进一步筛选，减少了评估超参数配置性能过程中训练神经网络所需的迭代资源；在同样的迭代资源下，利用本发明优化选择的超参数配置所训练构造出的神经网络模型的识别精度更高。

作为一种优选方案，所述步骤S2通过以下方式构造所述高稀疏响应面：

构建待求解的高稀疏响应面

其中，混合字典D为基函数

的矩阵形式，D＝[Φ,Ψ]，Φ为Legendre函数组成的子字典，Ψ为Gaussian函数组成的子字典；

x为n组超参数配置的向量表示，x＝[x⁽¹⁰,…,x⁽ⁿ⁾]^T；

f为模型识别精度的向量表示，f＝[f(x⁽¹⁾),…,f(x⁽ⁿ⁾)]^T；

θ是所述基函数

对应的系数{θ_i}_{i＝1,2,…Nb}的向量形式，θ＝[α；β]，α和β分别为Φ和Ψ的系数向量；

根据所述响应面构造数据集，按以下公式求解系数θ，完成稀疏响应面

的构造：

其中，

是

的共轭梯度解，

s₀为未知系数向量的初始值，ε为误差值；p＝1/2，ε＝1e^-3。

进一步的，所述步骤S2通过以下方式求解系数θ：

利用奇异值分解方法将所述混合字典D分解为U和Λ，计算

和

根据所述响应面构造数据集，将θ初始化为θ₀，将

初始化为

并令k＝0；

重复以下步骤直至θ收敛：计算

按以下公式更新θ后令k＝k+1：

更进一步的，在所述步骤S2求解系数θ的过程中，所述θ₀和

通过将所述响应面构造数据集划分为高稀疏响应面的训练集和验证集后利用K-Flod方法进行交叉验证获得。

作为一种优选方案，所述步骤S3中包括以下过程：

从所述超参数搜索空间中产生N个候选超参数配置，并计算各候选超参数配置在所述高稀疏响应面上的值

通过等式

将

转化为g(x)；

根据各候选超参数配置的g(x)值对所述候选超参数配置进行降序排列，划分为K个轮廓

其中，u＝N/K为整数，第一个轮廓

包含u个g(x)值最大的候选超参数配置，最后一个轮廓

包含u个g(x)值最小的候选配置；

按以下公式计算各轮廓

内g(x)的平均值

按以下公式计算

的累积分布

根据预设的权重因子r，按照

将

转化为

将

作为概率对

进行抽样，对被抽到的

内的u个候选超参数配置进行采样，作为所述步骤S3的采样结果。

进一步的，在所述步骤S1从预设的超参数搜索空间中采样待优化深度学习算法的超参数配置，在所述步骤S3从所述超参数搜索空间中产生N个候选超参数配置以及对被抽到的

内的u个候选超参数配置进行采样的过程，均采用均匀随机采样方法实现。

作为一种优选方案，在所述步骤S4对本轮迭代中所述步骤S3的采样结果进行筛选的过程采用Hyperband方法实现。

本发明还提供以下内容：

一种基于稀疏响应面的深度学习算法超参数优化系统，包括响应面构造数据集获取模块、高稀疏响应面构造模块、迭代采样模块、迭代筛选模块以及迭代判断模块；所述响应面构造数据集获取模块连接所述高稀疏响应面构造模块；所述高稀疏响应面构造模块连接所述迭代采样模块以及迭代判断模块；所述迭代采样模块连接所述迭代筛选模块；所述迭代筛选模块连接所述迭代判断模块；其中：

所述响应面构造数据集获取模块用于从预设的超参数搜索空间中采样待优化深度学习算法的超参数配置；分别根据所述响应面构造数据集获取模块的采样结果对目标深度神经网络进行训练以及验证，得到对应的模型识别精度；将所述响应面构造数据集获取模块的采样结果以及对应的模型识别精度作为响应面构造数据集；

所述高稀疏响应面构造模块用于根据所述响应面构造数据集，构造出反映超参数配置与模型识别精度映射关系的高稀疏响应面；

所述迭代采样模块用于根据所述高稀疏响应面，重新从超参数搜索空间中采样待优化深度学习算法的超参数配置；

所述迭代筛选模块用于对本轮迭代中所述迭代采样模块的采样结果进行筛选；分别根据本轮迭代中所述迭代筛选模块的筛选结果对目标深度神经网络进行训练以及验证，得到对应的模型识别精度；

所述迭代判断模块用于判断预设的迭代资源是否已经耗尽：

若未耗尽，则将本轮迭代中所述迭代筛选模块的筛选结果以及对应的模型识别精度合并到所述响应面构造数据集中，返回所述高稀疏响应面构造模块进行下一轮迭代；

一种介质，其上储存有计算机程序，所述计算机程序被处理器执行时实现前述的基于稀疏响应面的深度学习算法超参数优化方法的步骤。

一种计算机设备，包括介质、处理器以及储存在所述介质中并可被所述处理器执行的计算机程序，所述计算机程序被处理器执行时实现前述基于稀疏响应面的深度学习算法超参数优化方法的步骤。

附图说明

图1为本发明实施例1提供的基于稀疏响应面的深度学习算法超参数优化方法的步骤示意图；

图2为本发明实施例1中高稀疏响应面构造过程的原理示意图；

图3为本发明实施例1中基于稀疏响应面的随机离散蒙特卡洛采样的流程示意图；

图4为本发明实施例1中利用Hyperband筛选超参数配置的流程示意图；

图5本发明实施例2提供的基于稀疏响应面的深度学习算法超参数优化系统示意图。

具体实施方式

附图仅用于示例性说明，不能理解为对本专利的限制；

应当明确，所描述的实施例仅仅是本申请实施例一部分实施例，而不是全部的实施例。基于本申请实施例中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其它实施例，都属于本申请实施例保护的范围。

在本申请实施例使用的术语是仅仅出于描述特定实施例的目的，而非旨在限制本申请实施例。在本申请实施例和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式，除非上下文清楚地表示其他含义。还应当理解，本文中使用的术语“和/或”是指并包含一个或多个相关联的列出项目的任何或所有可能组合。

下面的描述涉及附图时，除非另有表示，不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本申请相一致的所有实施方式。相反，它们仅是如所附权利要求书中所详述的、本申请的一些方面相一致的装置和方法的例子。在本申请的描述中，需要理解的是，术语“第一”、“第二”、“第三”等仅用于区别类似的对象，而不必用于描述特定的顺序或先后次序，也不能理解为指示或暗示相对重要性。对于本领域的普通技术人员而言，可以根据具体情况理解上述术语在本申请中的具体含义。

此外，在本申请的描述中，除非另有说明，“多个”是指两个或两个以上。“和/或”，描述关联对象的关联关系，表示可以存在三种关系，例如，A和/或B，可以表示：单独存在A，同时存在A和B，单独存在B这三种情况。字符“/”一般表示前后关联对象是一种“或”的关系。以下结合附图和实施例对本发明做进一步的阐述。

为了解决现有技术的局限性，本实施例提供了一种技术方案，下面结合附图和实施例对本发明的技术方案做进一步的说明。

实施例1

请参考图1，一种基于稀疏响应面的深度学习算法超参数优化方法，包括以下步骤：

S5，判断预设的迭代资源是否已经耗尽：

具体的，在上述步骤开始前，可以预先设置迭代资源nT×R，其中R是训练目标深度神经网络收敛所需要的最大迭代次数，nT是一个正整数。

而对于超参数搜索空间Ω^m＝[x_L,x_U]^m，m是待优化深度学习算法超参数的维度，x_L是搜索空间的下限，x_U是搜索空间的上限；

在步骤S1中，可以采用均匀随机采样(UD)方法从超参数搜索空间Ω^m产生

组超参数配置x^(k)，k＝1,2,…,n：

x＝[x⁽¹⁾,…,x⁽ⁿ⁾]^T,

其中，x是n组超参数配置的向量表示；

在本实施例获取超参数配置对应的模型识别精度时，可以通过以下方式实现：初始化目标深度神经网络的参数(例如连接权重和偏置)，分配迭代资源R并利用梯度下降算法(例如Adam)训练目标深度神经网络，然后计算目标深度神经网络收敛时其验证集的识别精度f(x)。n组超参数配置对应的识别精度的向量表示为：

f＝[f(x⁽¹⁾),…,f(x⁽ⁿ⁾)]^T。

本实施例用验证损失f来代表模型识别精度，验证损失越小表示模型识别精度越高。

在一种优选实施例中，请参阅图2，所述步骤S2通过以下方式构造所述高稀疏响应面：

构建待求解的高稀疏响应面

其中，混合字典D为基函数

θ是所述基函数

对应的系数{θ_i}_i＝1,,…的向量形式，θ＝[α；β]，α和β分别为Φ和Ψ的系数向量；

的构造：

其中，

是

的共轭梯度解，

具体的，所述步骤S2中可以采用CG-FOCUSS算法来求解系数θ；包括以下内容：

利用奇异值分解方法将所述混合字典D分解为U和Λ，计算

和

根据所述响应面构造数据集，将θ初始化为θ₀，将

初始化为

并令k＝0；

重复以下步骤直至θ收敛：计算

按以下公式更新θ后令k＝k+1：

CG-FOCUSS是一种迭代算法，其最终得到的θ受随机产生的初值θ₀和

影响；因此，更具体的，为了提高响应面精度，在所述步骤S2求解系数θ的过程中，所述θ₀和

通过将所述响应面构造数据集划分为高稀疏响应面的训练集和验证集后利用K-Flod方法进行交叉验证获得。另外，为了提高计算效率，超参数的搜索空间、Legendre函数的系数、Gaussian函数的系数都被归一化到0和1之间。

作为一种优选实施例，请参阅图3，所述步骤S3采用随机离散蒙特卡洛采样算法进行，包括以下过程：

通过等式

将

转化为g(x)；

其中，u＝N/K为整数，第一个轮廓

包含u个g(x)值最大的候选超参数配置，最后一个轮廓

包含u个g(x)值最小的候选配置；

按以下公式计算各轮廓

内g(x)的平均值

按以下公式计算

的累积分布

根据预设的权重因子r，按照

将

转化为

将

作为概率对

进行抽样，对被抽到的

具体的，在所述步骤S1从预设的超参数搜索空间中采样待优化深度学习算法的超参数配置，在所述步骤S3从所述超参数搜索空间中产生N个候选超参数配置以及对被抽到的

特别的，在所述步骤S3从所述超参数搜索空间中产生N个候选超参数配置以及对被抽到的

内的u个候选超参数配置进行采样的过程，具体为：假设要从N个候选超参数配置中抽样M个配置，则首先随机产生M个数s_t，s_t∈[0,1]；当

则对应的第l个轮廓将被选中，然后在轮廓中随机选择一个配置；当某个轮廓被选中e_l＞0次，则将有e_l个配置从

中产生。

通过这种方式，候选超参数配置的g(x)值被转换为其所在轮廓被抽到的概率

同时，在这个轮廓内的点被抽到的概率为

由于g(x)值大的配置所在的轮廓的

值亦大，假设响应面对超参数配置和识别精度映射关系的表征是准确的，则识别精度高的配置有更大的概率被采样。因为每个候选超参数配置被采样的概率

大于零，使得超参数搜索空间中所有配置都有可能被采样，从而避免陷入局部最优。此外，可以通过权重因子r改变

的值来权衡全局采样和局部采样。

作为一种优选实施例，在所述步骤S4对本轮迭代中所述步骤S3的采样结果进行筛选的过程采用Hyperband方法实现。请参阅图4，具体过程如下：

给定筛选过程中超参数配置的最大迭代资源R和下采样系数η，通常设为3或者4；计算下采样框架数量

和框架内总的资源B＝(s_max+1)R；对于任意一个框架s∈{s_max,s_max-1,…,0}，执行：

Step1：计算所述步骤S3采样的超参数配置的数量

以及每个配置的初始迭代资源r＝Rη^-s；

Step2：利用所述步骤S3采样M个超参数配置(这里利用所述步骤S3替代了原始Hyperband中利用随机搜索获取M个配置的部分)，并将其有保存在

中；

Step3：对于任意i∈{0，...，s}，执行以下筛选过程：

(1)初始化M_i＝[Mη^-i]，以及迭代资源r_i＝rηⁱ；

(2)对于每组超参数配置

初始化目标深度神经网络参数，输入训练数据和验证数据，利用r_i迭代资源训练网络并计算其验证损失f(x)；

(3)对所有

中的配置获得的验证损失按升序排序，损失越小表示超参数配置越好；

(4)仅将最好的

个配置保留在

中。

然后将所有获得迭代资源为R的配置保存在

中作为所述步骤S4的筛选结果。

实施例2

一种基于稀疏响应面的深度学习算法超参数优化系统，请参阅图5，包括响应面构造数据集获取模块1、高稀疏响应面构造模块2、迭代采样模块3、迭代筛选模块4以及迭代判断模块5；所述响应面构造数据集获取模块1连接所述高稀疏响应面构造模块2；所述高稀疏响应面构造模块2连接所述迭代采样模块3以及迭代判断模块5；所述迭代采样模块3连接所述迭代筛选模块4；所述迭代筛选模块4连接所述迭代判断模块5；其中：

所述响应面构造数据集获取模块1用于从预设的超参数搜索空间中采样待优化深度学习算法的超参数配置；分别根据所述响应面构造数据集获取模块1的采样结果对目标深度神经网络进行训练以及验证，得到对应的模型识别精度；将所述响应面构造数据集获取模块1的采样结果以及对应的模型识别精度作为响应面构造数据集；

所述高稀疏响应面构造模块2用于根据所述响应面构造数据集，构造出反映超参数配置与模型识别精度映射关系的高稀疏响应面；

所述迭代采样模块3用于根据所述高稀疏响应面，重新从超参数搜索空间中采样待优化深度学习算法的超参数配置；

所述迭代筛选模块4用于对本轮迭代中所述迭代采样模块3的采样结果进行筛选；分别根据本轮迭代中所述迭代筛选模块4的筛选结果对目标深度神经网络进行训练以及验证，得到对应的模型识别精度；

所述迭代判断模块5用于判断预设的迭代资源是否已经耗尽：

若未耗尽，则将本轮迭代中所述迭代筛选模块4的筛选结果以及对应的模型识别精度合并到所述响应面构造数据集中，返回所述高稀疏响应面构造模块2进行下一轮迭代；

实施例3

一种介质，其上储存有计算机程序，所述计算机程序被处理器执行时实现实施例1中的基于稀疏响应面的深度学习算法超参数优化方法的步骤。

实施例4

一种计算机设备，包括介质、处理器以及储存在所述介质中并可被所述处理器执行的计算机程序，所述计算机程序被处理器执行时实现实施例1中的基于稀疏响应面的深度学习算法超参数优化方法的步骤。

显然，本发明的上述实施例仅仅是为清楚地说明本发明所作的举例，而并非是对本发明的实施方式的限定。对于所属领域的普通技术人员来说，在上述说明的基础上还可以做出其它不同形式的变化或变动。这里无需也无法对所有的实施方式予以穷举。凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等，均应包含在本发明权利要求的保护范围之内。

Claims

1.一种基于稀疏响应面的深度学习算法超参数优化方法，其特征在于，包括以下步骤：

S5，判断预设的迭代资源是否已经耗尽：

2.根据权利要求1所述的基于稀疏响应面的深度学习算法超参数优化方法，其特征在于，所述步骤S2通过以下方式构造所述高稀疏响应面：

构建待求解的高稀疏响应面

其中，混合字典D为基函数

的矩阵形式，D＝[Φ，Ψ]，Φ为Legendre函数组成的子字典，Ψ为Gaussian函数组成的子字典；

x为n组超参数配置的向量表示，x＝[x⁽¹⁾，…，x⁽ⁿ⁾]^T；

f为模型识别精度的向量表示，f＝[f(x⁽¹⁾)，…，f(x⁽ⁿ⁾)]^T；

θ是所述基函数

对应的系数{θ_i}_{i＝1，2，…Nb}的向量形式，θ＝[α；β]，α和β分别为Φ和Ψ的系数向量；

的构造：

其中，

是

的共轭梯度解，

Π(θ)＝diag(|θ₁|^p-2，...，|θ_n|^p-2)，s₀为未知系数向量的初始值，ε为误差值；p＝1/2，ε＝1e^-3。

3.根据权利要求2所述的基于稀疏响应面的深度学习算法超参数优化方法，其特征在于，所述步骤S2通过以下方式求解系数θ：

利用奇异值分解方法将所述混合字典D分解为U和A，计算

和

根据所述响应面构造数据集，将θ初始化为θ₀，将

初始化为

并令k＝0；

重复以下步骤直至θ收敛：计算

按以下公式更新θ后令k＝k+1：

4.根据权利要求3所述的基于稀疏响应面的深度学习算法超参数优化方法，其特征在于，在所述步骤S2求解系数θ的过程中，所述θ₀和

5.根据权利要求1所述的基于稀疏响应面的深度学习算法超参数优化方法，其特征在于，所述步骤S3中包括以下过程：

通过等式

将

转化为g(x)；

其中，u＝N/K为整数，第一个轮廓

包含u个g(x)值最大的候选超参数配置，最后一个轮廓

包含u个g(x)值最小的候选配置；

按以下公式计算各轮扇

内g(x)的平均值

按以下公式计算

的累积分布

根据预设的权重因子r，按照

将

转化为

将

作为概率对

进行抽样，对被抽到的

6.根据权利要求5所述的基于稀疏响应面的深度学习算法超参数优化方法，其特征在于，在所述步骤S1从预设的超参数搜索空间中采样待优化深度学习算法的超参数配置，在所述步骤S3从所述超参数搜索空间中产生N个候选超参数配置以及对被抽到的

7.根据权利要求1所述的基于稀疏响应面的深度学习算法超参数优化方法，其特征在于，在所述步骤S4对本轮迭代中所述步骤S3的采样结果进行筛选的过程采用Hyperband方法实现。

8.一种基于稀疏响应面的深度学习算法超参数优化系统，其特征在于，包括响应面构造数据集获取模块(1)、高稀疏响应面构造模块(2)、迭代采样模块(3)、迭代筛选模块(4)以及迭代判断模块(5)；所述响应面构造数据集获取模块(1)连接所述高稀疏响应面构造模块(2)；所述高稀疏响应面构造模块(2)连接所述迭代采样模块(3)以及迭代判断模块(5)；所述迭代采样模块(3)连接所述迭代筛选模块(4)；所述迭代筛选模块(4)连接所述迭代判断模块(5)；其中：

所述响应面构造数据集获取模块(1)用于从预设的超参数搜索空间中采样待优化深度学习算法的超参数配置；分别根据所述响应面构造数据集获取模块(1)的采样结果对目标深度神经网络进行训练以及验证，得到对应的模型识别精度；将所述响应面构造数据集获取模块(1)的采样结果以及对应的模型识别精度作为响应面构造数据集；

所述高稀疏响应面构造模块(2)用于根据所述响应面构造数据集，构造出反映超参数配置与模型识别精度映射关系的高稀疏响应面；

所述迭代采样模块(3)用于根据所述高稀疏响应面，重新从超参数搜索空间中采样待优化深度学习算法的超参数配置；

所述迭代筛选模块(4)用于对本轮迭代中所述迭代采样模块(3)的采样结果进行筛选；分别根据本轮迭代中所述迭代筛选模块(4)的筛选结果对目标深度神经网络进行训练以及验证，得到对应的模型识别精度；

所述迭代判断模块(5)用于判断预设的迭代资源是否已经耗尽：

若未耗尽，则将本轮迭代中所述迭代筛选模块(4)的筛选结果以及对应的模型识别精度合并到所述响应面构造数据集中，返回所述高稀疏响应面构造模块(2)进行下一轮迭代；

9.一种介质，其上储存有计算机程序，其特征在于：所述计算机程序被处理器执行时实现如权利要求1至7任一项所述的基于稀疏响应面的深度学习算法超参数优化方法的步骤。

10.一种计算机设备，其特征在于：包括介质、处理器以及储存在所述介质中并可被所述处理器执行的计算机程序，所述计算机程序被处理器执行时实现如权利要求1至7任一项所述的基于稀疏响应面的深度学习算法超参数优化方法的步骤。