CN116630398A

CN116630398A - 一种基于数据集凹凸性特征的优化器动量系数调控方法

Info

Publication number: CN116630398A
Application number: CN202310897392.5A
Authority: CN
Inventors: 吴慰; 姚碧圆; 时宁
Original assignee: Hainan Research Institute Of Zhejiang University
Current assignee: Hainan Research Institute Of Zhejiang University
Priority date: 2023-07-21
Filing date: 2023-07-21
Publication date: 2023-08-22
Anticipated expiration: 2043-07-21
Also published as: CN116630398B

Abstract

本发明提供一种基于数据集凹凸性特征的优化器动量系数调控方法，所述方法包括以下步骤：S1、获取原始的数字图像输入数据，随机选取样本个数比例为10%；S2、将选取的数据进行归一化，并且变换为数值矩阵的张量形式；S3、计算选取样本的一阶矩估计；S4、计算选取样本的一阶方差；S5、计算一阶方差和一阶矩估计的比例系数，通过比例系数调控动量。本发明相比较于依赖经验和随机选择的参数设定方案，通过分析原始数据集特征来调整优化方向，具备较强的可操作性和实用性。

Description

一种基于数据集凹凸性特征的优化器动量系数调控方法

技术领域

本发明涉及优化器动量系数技术领域，尤其涉及一种基于数据集凹凸性特征的优化器动量系数调控方法。

背景技术

优化器是深度学习模型训练的基础工具，是求解具体问题模型参数的必要环节，目前优化器的运用方法一般是手动设定学习速率、动量系数等参数，迭代调整模型的设计参数，以期实现网络从自由初始化状态向误差减小的稳定状态收敛。但是，由于手动设置参数高度依赖经验，缺乏必要的参数范围预选工具，制约了深度学习网络中优化器的科学应用，因此提出一种基于数据集凹凸性特征的优化器动量系数调控方法以解决上述问题。

发明内容

鉴以此，本发明的目的在于提供一种基于数据集凹凸性特征的优化器动量系数调控方法，以至少解决以上问题。

本发明采用的技术方案如下：

一种基于数据集凹凸性特征的优化器动量系数调控方法，所述方法包括以下步骤：

S1、获取原始的数字图像输入数据，随机选取样本个数比例为10%；

S2、将选取的数据进行归一化操作，并且变换为数值矩阵的张量形式；

S3、计算选取样本的一阶矩估计；

S4、计算选取样本的一阶方差；

S5、计算一阶方差和一阶矩估计的比例系数，通过比例系数调控动量。

进一步的，在步骤S2中，数据归一化操作约束在（0,1）范围内。

进一步的，在步骤S3中，计算选取样本的一阶矩估计具体为：

一阶矩估计计算公式如下：

其中，二维函数I(x,y)表示一幅数字图像随机变量，(x,y)是空间坐标，幅值I称为该点图像的灰度、亮度或强度，M、N为图像的像素规格，数字图像的数学期望为其灰度平均值，即所有像元灰度值的算数平均值。

进一步的，在步骤S4中，计算选取样本的一阶方差具体为：

一阶方差计算公式如下：

方差为随机变量离散程度的度量，二维数字图像灰度方差体现灰度值在像素点与整个图像的偏离程度，当数字图像对比度小，则方差也随之减小。

进一步的，其特征在于，在步骤S5中，计算一阶方差和一阶矩估计的比例系数，通过比例系数调控动量具体为：

比例系数计算公式如下：

并且初始化动量系数，当/>时，调整方向为增大动量系数，按0.1倍/>关系递增验证；当/>时，调整方向为减小动量系数，按0.1倍/>关系递减验证，调用基于动量的随机梯度下降优化器，初始化动量系数/>，

其中，是动量表达参数，其中，/>表示深度学习网络参数在第k 步时的状态，/>为当前步输出与目标输出之间的误差度量，r 是设定的参数，称为学习速率，

当时，调整方向为增大动量系数，按0.1倍/>关系，逐次代入/>

递增验证优化过程是否寻优；当时，调整方向为减小动量系数，按0.1倍/>关系，逐次代入

递减验证优化过程是否寻优，即

其中，n为评估优化次数，逐次增加，为第n次评估的动量系数。

与现有技术相比，本发明的有益效果是：

本发明提出一种基于数据集凹凸性特征的优化器动量系数调控方法，相比较于依赖经验和随机选择的参数设定方案，通过分析原始数据集特征来调整优化方向，具备较强的可操作性和实用性。

附图说明

为了更清楚地说明本发明实施例中的技术方案，下面将对实施例描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的优选实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1是本发明实施例提出的一种基于数据集凹凸性特征的优化器动量系数调控方法整体流程示意图。

具体实施方式

以下结合附图对本发明的原理和特征进行描述，所列举实施例只用于解释本发明，并非用于限定本发明的范围。

参照图1，本发明提供一种基于数据集凹凸性特征的优化器动量系数调控方法，可以针对计算机视觉中的图像分类问题，例如，MNIST，CIFAR-10，所述方法包括以下步骤：

S3、计算选取样本的一阶矩估计；

S4、计算选取样本的一阶方差；

在步骤S2中，数据归一化操作约束在（0,1）范围内。

在步骤S3中，计算选取样本的一阶矩估计具体为：

一阶矩估计计算公式如下：

在步骤S4中，计算选取样本的一阶方差具体为：

一阶方差计算公式如下：

其特征在于，在步骤S5中，计算一阶方差和一阶矩估计的比例系数，通过比例系数调控动量具体为：

比例系数计算公式如下：

当时，调整方向为增大动量系数，按0.1倍/>关系，逐次代入/>

递减验证优化过程是否寻优，即

以上所述仅为本发明的较佳实施例，并不用以限制本发明，凡在本发明的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本发明的保护范围之内。

Claims

1.一种基于数据集凹凸性特征的优化器动量系数调控方法，其特征在于，所述方法包括以下步骤：

S3、计算选取样本的一阶矩估计；

S4、计算选取样本的一阶方差；

2.根据权利要求1所述的一种基于数据集凹凸性特征的优化器动量系数调控方法，其特征在于，在步骤S2中，数据归一化操作约束在（0,1）范围内。

3.根据权利要求1所述的一种基于数据集凹凸性特征的优化器动量系数调控方法，其特征在于，在步骤S3中，计算选取样本的一阶矩估计具体为：

一阶矩估计计算公式如下：

其中，二维函数I(x, y)表示一幅数字图像随机变量，(x, y)是空间坐标，幅值I称为该点图像的灰度、亮度或强度，M、N为图像的像素规格，数字图像的数学期望为其灰度平均值，即所有像元灰度值的算数平均值。

4.根据权利要求3所述的一种基于数据集凹凸性特征的优化器动量系数调控方法，其特征在于，在步骤S4中，计算选取样本的一阶方差具体为：

一阶方差计算公式如下：

5.根据权利要求4所述的一种基于数据集凹凸性特征的优化器动量系数调控方法，其特征在于，在步骤S5中，计算一阶方差和一阶矩估计的比例系数，通过比例系数调控动量具体为：

比例系数计算公式如下：

其中，是动量表达参数，其中，/> 表示深度学习网络参数在第k 步时的状态，/> 为当前步输出与目标输出之间的误差度量，r 是设定的参数，称为学习速率，

当时，调整方向为增大动量系数，按0.1倍/>关系，逐次代入/>

递减验证优化过程是否寻优，即