CN112488772A - 基于改进Ranger的深度学习方法 - Google Patents

基于改进Ranger的深度学习方法 Download PDF

Info

Publication number
CN112488772A
CN112488772A CN202011506464.1A CN202011506464A CN112488772A CN 112488772 A CN112488772 A CN 112488772A CN 202011506464 A CN202011506464 A CN 202011506464A CN 112488772 A CN112488772 A CN 112488772A
Authority
CN
China
Prior art keywords
deep learning
data
model
improved range
algorithm
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202011506464.1A
Other languages
English (en)
Inventor
孙永强
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sichuan Changhong Electric Co Ltd
Original Assignee
Sichuan Changhong Electric Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sichuan Changhong Electric Co Ltd filed Critical Sichuan Changhong Electric Co Ltd
Priority to CN202011506464.1A priority Critical patent/CN112488772A/zh
Publication of CN112488772A publication Critical patent/CN112488772A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0201Market modelling; Market analysis; Collecting market data
    • G06Q30/0202Market predictions or forecasting for commercial activities
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/60Protecting data
    • G06F21/62Protecting access to data via a platform, e.g. using keys or access control rules
    • G06F21/6218Protecting access to data via a platform, e.g. using keys or access control rules to a system of files or objects, e.g. local or distributed file system or database
    • G06F21/6245Protecting personal data, e.g. for financial or medical purposes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Strategic Management (AREA)
  • Physics & Mathematics (AREA)
  • Software Systems (AREA)
  • Finance (AREA)
  • Development Economics (AREA)
  • Accounting & Taxation (AREA)
  • General Physics & Mathematics (AREA)
  • Bioethics (AREA)
  • General Engineering & Computer Science (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Medical Informatics (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Data Mining & Analysis (AREA)
  • Marketing (AREA)
  • Economics (AREA)
  • Databases & Information Systems (AREA)
  • Computer Hardware Design (AREA)
  • Computer Security & Cryptography (AREA)
  • General Business, Economics & Management (AREA)
  • Game Theory and Decision Science (AREA)
  • Artificial Intelligence (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Computation (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明涉及深度学习领域,特别涉及基于改进Ranger的深度学习方法,本发明基于改进Ranger的深度学习方法通过指数加权平均方法优化Radam算法获得的方差、反向反馈验证法改进Lookahead算法的K参数和后项拟合的方法改进学习率解决了深度学习在算法训练时精度低、运行时间长和消耗资源多的问题,本发明适用于基于Ranger的深度学习。

Description

基于改进Ranger的深度学习方法
技术领域
本发明涉及深度学习领域,特别涉及基于改进Ranger的深度学习方法。
背景技术
销售预测系统运用模型进行数据预测,从而为业务提供技术支持,模型分为机器学习、深度学习、时间序列等。其中深度学习算法是预测算法中的重中之重,随着人工智能的发展,深度学习算法被广泛应用于各个场景。
深度学习是机器学习研究中的一个新的领域,其动机在于建立、模拟人脑进行分析学习的神经网络,它模仿人脑的机制来解释数据,例如图像、声音和文本,深度学习是无监督学习的一种。深度学习的概念源于人工神经网络的研究,含多隐层的多层感知器就是一种深度学习结构。深度学习通过组合低层特征形成更加抽象的高层表示属性类别或特征,以发现数据的分布式特征表示,基于深信度网(DBN)提出非监督贪心逐层训练算法,为解决深层结构相关的优化难题带来希望,随后提出多层自动编码器深层结构。
Ranger便是深度学习算法中的一种,它结合了Radam算法和Lookahead算法。
Radam的先进之处在于,能根据方差分散度,动态地打开或关闭自适应学习率,提供了一种不需要可调参数学习率预热的方法,它兼具Adam和SGD两者的优点,既能保证收敛速度快,也不容易掉入局部最优解。
LookAhead受到深度神经网络损失表面方面进展的启发,能够稳定深度学习训练和收敛速度。LookAhead减少了需要调整的超参数的数量,能以最小的计算开销实现不同深度学习任务的更快收敛。
Radam算法和Lookahead算法从不同的角度着手,各自在深度学习优化上实现了新的突破,具有高度协同性,但是Ranger仍存在以下缺点:1、Radam算法计算方差的时候容易出现过拟合现象,导致运行结果精度低;2、Lookahead算法训练k参数和学习率的时候,计算负担大,内存消耗多。
发明内容
本发明所解决的技术问题:提供基于改进Ranger的深度学习方法解决深度学习在算法训练时精度低、运行时间长和消耗资源多的问题。
本发明解决上述技术问题采用的技术方案:基于改进Ranger的深度学习方法包括以下步骤:
S01、获取数据源;
S02、将数据进行预处理;
S03、将数据进行Radam算法优化,计算梯度,利用指数加权平均方法优化方差,获得方差;
S04、用反向反馈验证法改进K参数;利用后向拟合的方法改进学习率;将数据进行Lookahead算法优化;
S05、输出预测结果。
进一步的,步骤S01中,数据源是销售数据。
进一步的,步骤S02中,预处理包括脱敏处理、缺失值填充处理、字段类型转换处理、归一化处理和标准化处理中的一种或多种,所述缺失值填充采取就近原则进行填充;所述字段类型转换是将部分字段字符串类型转为浮点类型。
进一步的,步骤S03中,优化方差的公式是
Figure BDA0002845084350000021
其中S表示方差,β2是指数加权平均的超参,t表示步数,gi表示第i歩的梯度。
进一步的,步骤S04中,反向反馈验证法包括以下步骤:
S601、设置学习率a;
S602、针对数据按照S601设置的学习率进行迭代运算,获得权重,并备份;
S603、从现有权重出发,运行LookAhead算法得到k参数,并根据φt+1=a+(1-a)φt+k得到新权重;
S604、更新模型权重;
S605、查看模型收敛性;
S606、获得模型达到最佳收敛时的k。
进一步的,步骤S601中,设置初始学习率为一个或多个,步骤S602中,迭代处理是任意单次或多次。
进一步的,步骤S04中,后向拟合的方法,包括以下步骤:
S901、针对数据进行迭代处理;
S902、设置初始学习率a=0.5和k,k的值是反向反馈验证法计算出的k值;
S903、运行LookAhead算法,查看模型损失函数以及模型拟合情况,拟合优度
Figure BDA0002845084350000031
其中SSE表示误差平方和,SST表示回归平方和;
S904、改变步骤S902中的初始学习率,找到模型最佳拟合情况,即R2=1或则无限接近1;
S905、输出模型最佳拟合情况学习率设置值。
进一步的,步骤S901中,迭代处理是任意单次或多次。
进一步的,步骤S05中,输出预测结果是一个数据或多个数据。
本发明的有益效果:本发明基于改进Ranger的深度学习方法通过指数加权平均方法优化Radam算法获得方差、反向反馈验证法改进Lookahead算法的k参数和后项拟合的方法改进学习率解决了深度学习在算法训练时精度低、运行时间长和消耗资源多的问题,提高深度学习算法的学习速度和效果。
附图说明
图1是本发明基于改进Ranger的深度学习方法的计算过程流程图。
具体实施方式
本发明提供基于改进Ranger的深度学习方法解决了深度学习在算法训练时精度低、运行时间长和消耗资源多的问题,提高深度学习算法的学习速度和效果,包括以下步骤:
S01、获取数据源;
S02、将数据进行预处理;
S03、将数据进行Radam算法优化,计算梯度,利用指数加权平均方法优化方差,获得方差;
S04、用反向反馈验证法改进K参数;利用后向拟合的方法改进学习率;将数据进行Lookahead算法优化;
S05、输出预测结果。
进一步的,步骤S01中,数据源是销售数据。
进一步的,步骤S02中,预处理包括脱敏处理、缺失值填充处理、字段类型转换处理、归一化处理和标准化处理中的一种或多种,所述缺失值填充采取就近原则进行填充;所述字段类型转换是将部分字段字符串类型转为浮点类型。
进一步的,步骤S03中,优化方差的公式是
Figure BDA0002845084350000032
其中S表示方差,β2是指数加权平均的超参,t表示步数,gi表示第i歩的梯度。这里能够加速深度学习收敛速度,同时不会出现过拟合现象,能够使深度学习用最短的时间完成运算操作。
进一步的,步骤S04中,反向反馈验证法包括以下步骤:
S601、设置学习率a;
S602、针对数据按照S601设置的学习率进行迭代运算,获得权重,并备份;
S603、从现有权重出发,运行LookAhead算法得到k参数,并根据φt+1=a+(1-a)φt+k得到新权重;
S604、更新模型权重;
S605、查看模型收敛性;
S606、获得模型达到最佳收敛时的k。
进一步的,步骤S601中,设置初始学习率为一个或多个,步骤S602中,迭代处理是任意单次或多次。
进一步的,步骤S04中,后向拟合的方法,包括以下步骤:
S901、针对数据进行迭代处理;
S902、设置初始学习率a=0.5和k,k的值是反向反馈验证法计算出的k值;
S903、运行LookAhead算法,查看模型损失函数以及模型拟合情况,拟合优度
Figure BDA0002845084350000041
其中SSE表示误差平方和,SST表示回归平方和;
S904、改变步骤S902中的初始学习率,找到模型最佳拟合情况,即R2=1或则无限接近1;
S905、输出模型最佳拟合情况学习率设置值。
进一步的,步骤S901中,迭代处理是任意单次或多次。
进一步的,步骤S05中,输出预测结果是一个数据或多个数据。
具体的,如附图1所示,选取一组销售数据作为原始数据,如下表1:
表一:原始销售数据表
Figure BDA0002845084350000042
Figure BDA0002845084350000051
下一步,将原始销售数据做脱敏处理,得到的数据如下表2所示:
表2:脱敏数据表
日期(月) 脱敏数据
2019年11月 94081
2019年12月 51954
2020年1月 176394
2020年2月 153697
2020年3月 177447
2020年4月 106786
2020年5月 64316
2020年6月 47744
2020年7月 28153
2020年8月 16483
2020年9月 94081
下一步,将数据进行Radam算法优化,计算梯度,利用指数加权平均方法优化方差,获得方差,计算公式如下:gt=Δθftt-1),t表示步数,gt表示t歩的梯度,ftt-1)表示权重,Δθ表示参数更新量,
Figure BDA0002845084350000052
mt是一阶矩,vt是二阶矩,η是学习率,ct是偏差修正项,ε防止除零错误及控制更新量的最大比例,
Figure BDA0002845084350000061
vt表示二阶矩,β2表示二阶矩指数加权平均超参;mt=β1mt-1+(1-β1)gt,mt表示一阶矩,β1表示一阶矩指数加权平均超参;
Figure BDA0002845084350000062
表示计算偏差校正移动平均数,
Figure BDA0002845084350000063
表示第t次迭代过程中一阶矩指数加权平均超参;
Figure BDA0002845084350000064
ρt表示计算第t次迭代过程中的近似指数加权平均长度,ρ∞表示计算近似值的最大长度,
Figure BDA0002845084350000065
表示第t次迭代过程中一阶矩指数加权平均超参;RAdam算法在训练的初期方差vt会非常大。通过指数加权平均计算的梯度平方的方差大于使用简单平均计算的梯度平方的方差,推导过程如下:
设计一个S(vt)作为Radam算法的插值权重;S(vt)=rt,其中rt∈[0,1],选用的插值权重为
Figure BDA0002845084350000066
rt描述了当前的vt的方差离最小的方差有多远,方差计算推到公式如下:
Figure BDA00028450843500000611
Figure BDA0002845084350000067
其中gi服从正态分布
Figure BDA0002845084350000068
Figure BDA0002845084350000069
Figure BDA00028450843500000610
其中S表示方差,其中0.8是固定值,这里采取人工调参的方式确认的。获得数据如下表3:
表3:Radam算法获得方差
Figure BDA0002845084350000071
下一步,用反向反馈验证法改进K参数,利用后向拟合的方法改进学习率,进行Lookahead算法优化,LookAhead拥有两套权重,即FastWeights和SlowWeights,Lookahead首先使用内部循环中的SGD等标准优化器,更新k次FastWeights,然后以最后一个FastWeights的方向更新Slow Weights;第一套权重Fast Weights其更新规则:θt,i+1=θt,i+A(L,θt,i-1,d),其中A为优化器,L为目标函数,d为样本数据,θt,i+1表示内循环优化器更新规则,但这里会将该轮循环的k次权重,用序列都保存下来;第二套权重SlowWeights其计算公式:
φt+1=φt+a(θt,kt)
=a[θt,k+(1-a)θt-1,k+...+(1-a)t-1θ0,k]
+(1-a)tφ0
这里的a是SlowWeights的学习率。具体的,用反向反馈验证法改进K参数包括以下步骤:
S601、设置学习率分别为0.1,0.01,0.5;
S602、针对数据分别按照S601设置的学习率分别进行迭代5,10,15,20,25和30次运算,获得权重,并备份;
S603、从现有权重出发,运行LookAhead算法得到k参数,并根据φt+1=a+(1-a)φt+k得到新权重;
S604、更新模型权重;
S605、查看模型收敛性;
S606、获得模型达到最佳收敛时的k,k=0.7;
利用后向拟合的方法改进学习率包括以下步骤:
S901、针对数据分别进行迭代5,10,15,20,25,30次;
S902、设置初始学习率a=0.5和k,K的值是反向反馈验证法计算出的k值;
S903、运行LookAhead算法,查看模型损失函数以及模型拟合情况,拟合优度
Figure BDA0002845084350000081
其中SSE表示误差平方和,SST表示回归平方和;
S904、改变步骤S902中的初始学习率,找到模型最佳拟合情况,即R2=1或则无限接近1;
S905、输出模型最佳拟合情况学习率设置值a=0.8。
下一步,输出预测结果,预测结果为2020年10月,销售数据为95926,本发明基于改进Ranger的深度学习方法计算过程用时如下表4。
表4:本发明基于改进Ranger的深度学习方法用时
Figure BDA0002845084350000082

Claims (9)

1.基于改进Ranger的深度学习方法,其特征在于,包括以下步骤:
S01、获取数据源;
S02、将数据进行预处理;
S03、将数据进行Radam算法优化,计算梯度,利用指数加权平均方法优化方差,获得方差;
S04、用反向反馈验证法改进K参数;利用后向拟合的方法改进学习率;将数据进行Lookahead算法优化;
S05、输出预测结果。
2.根据权利要求1所述的基于改进Ranger的深度学习方法,其特征在于,步骤S01中,所述的数据源是销售数据。
3.根据权利要求1或2所述的基于改进Ranger的深度学习方法,其特征在于,预处理包括脱敏处理、缺失值填充处理、字段类型转换处理、归一化处理和标准化处理中的一种或多种,所述缺失值填充采取就近原则进行填充;所述字段类型转换是将部分字段字符串类型转为浮点类型。
4.根据权利要求1或2所述的基于改进Ranger深度学习方法,其特征在于,步骤S03中,优化方差的公式是
Figure FDA0002845084340000011
其中S表示方差,β2是指数加权平均的超参,t表示步数,gi表示第i歩的梯度。
5.根据权利要求1或2所述的基于改进Ranger深度学习方法,其特征在于,步骤S04中,所述反向反馈验证法包括以下步骤:
S601、设置学习率a;
S602、针对数据按照S601设置的学习率进行迭代运算,获得权重,并备份;
S603、从现有权重出发,运行LookAhead算法得到k参数,并根据φt+1=a+(1-a)φt+k得到新权重;
S604、更新模型权重;
S605、查看模型收敛性;
S606、获得模型达到最佳收敛时的k。
6.根据权利要求5所述的基于改进Ranger深度学习方法,其特征在于,步骤S601中,设置初始学习率为一个或多个,步骤S602中,迭代处理是任意单次或多次。
7.根据权利要求5所述的基于改进Ranger深度学习方法,其特征在于,步骤S04中,后向拟合的方法,包括以下步骤:
S901、针对数据进行迭代处理;
S902、设置初始学习率a=0.5和k,k的值是反向反馈验证法计算出的k值;
S903、运行LookAhead算法,查看模型损失函数以及模型拟合情况,拟合优度
Figure FDA0002845084340000021
R2∈[0,1],其中SSE表示误差平方和,SST表示回归平方和;
S904、改变步骤S902中的初始学习率,找到模型最佳拟合情况,即R2=1或则无限接近1;
S905、输出模型最佳拟合情况学习率设置值。
8.根据权利要求7所述的基于改进Ranger深度学习方法,其特征在于,步骤S901中,迭代处理是任意单次或多次。
9.根据权利要求1或2所述的基于改进Ranger深度学习方法,其特征在于,步骤S05中,输出预测结果是一个数据或多个数据。
CN202011506464.1A 2020-12-18 2020-12-18 基于改进Ranger的深度学习方法 Pending CN112488772A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011506464.1A CN112488772A (zh) 2020-12-18 2020-12-18 基于改进Ranger的深度学习方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011506464.1A CN112488772A (zh) 2020-12-18 2020-12-18 基于改进Ranger的深度学习方法

Publications (1)

Publication Number Publication Date
CN112488772A true CN112488772A (zh) 2021-03-12

Family

ID=74914701

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011506464.1A Pending CN112488772A (zh) 2020-12-18 2020-12-18 基于改进Ranger的深度学习方法

Country Status (1)

Country Link
CN (1) CN112488772A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114720956A (zh) * 2022-06-07 2022-07-08 成都信息工程大学 针对双偏振天气雷达的水凝物粒子分类识别方法及装置

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114720956A (zh) * 2022-06-07 2022-07-08 成都信息工程大学 针对双偏振天气雷达的水凝物粒子分类识别方法及装置

Similar Documents

Publication Publication Date Title
US11593663B2 (en) Data discriminator training method, data discriminator training apparatus, non-transitory computer readable medium, and training method
WO2022116441A1 (zh) 基于卷积神经网络的bert模型的微调方法及装置
US11887004B2 (en) Batch renormalization layers
US20210034973A1 (en) Training neural networks using learned adaptive learning rates
CN108701253A (zh) 使用规范化的目标输出训练神经网络
US20210271980A1 (en) Deterministic decoder variational autoencoder
CN103778482A (zh) 基于多尺度分析的水产养殖溶解氧短期预测方法
CN114299349B (zh) 一种基于多专家系统和知识蒸馏的众包图像学习方法
CN113688949A (zh) 一种基于双网络联合标签修正的网络图像数据集去噪方法
CN112488772A (zh) 基于改进Ranger的深度学习方法
CN116992779B (zh) 基于数字孪生模型的光伏储能系统仿真方法及系统
CN113743474A (zh) 基于协同半监督卷积神经网络的数字图片分类方法与系统
CN116227578A (zh) 一种无源域数据的无监督领域适应方法
CN112215412A (zh) 溶解氧预测方法及装置
Dwivedi et al. Fundamental optimization methods for machine learning
CN116415177A (zh) 一种基于极限学习机的分类器参数辨识方法
CN112884160B (zh) 一种元学习方法及相关装置
US20240086678A1 (en) Method and information processing apparatus for performing transfer learning while suppressing occurrence of catastrophic forgetting
CN118036757B (zh) 大语言模型训练方法及装置
Zhang et al. Online kernel classification with adjustable bandwidth using control-based learning approach
CN115330346B (zh) 基于能力评价的滑坡众包标注结果评估及任务分配方法
US20220398506A1 (en) Systems and Methods for Implicit Rate-Constrained Optimization of Non-Decomposable Objectives
Dehghani et al. Learning to rank from samples of variable quality
CN117874829A (zh) 基于自适应差分隐私的联邦学习方法
CN114676839A (zh) 基于随机敏感度的知识迁移方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination