CN112488772A - 基于改进Ranger的深度学习方法 - Google Patents
基于改进Ranger的深度学习方法 Download PDFInfo
- Publication number
- CN112488772A CN112488772A CN202011506464.1A CN202011506464A CN112488772A CN 112488772 A CN112488772 A CN 112488772A CN 202011506464 A CN202011506464 A CN 202011506464A CN 112488772 A CN112488772 A CN 112488772A
- Authority
- CN
- China
- Prior art keywords
- deep learning
- data
- model
- improved range
- algorithm
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0201—Market modelling; Market analysis; Collecting market data
- G06Q30/0202—Market predictions or forecasting for commercial activities
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F21/00—Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
- G06F21/60—Protecting data
- G06F21/62—Protecting access to data via a platform, e.g. using keys or access control rules
- G06F21/6218—Protecting access to data via a platform, e.g. using keys or access control rules to a system of files or objects, e.g. local or distributed file system or database
- G06F21/6245—Protecting personal data, e.g. for financial or medical purposes
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Business, Economics & Management (AREA)
- Strategic Management (AREA)
- Physics & Mathematics (AREA)
- Software Systems (AREA)
- Finance (AREA)
- Development Economics (AREA)
- Accounting & Taxation (AREA)
- General Physics & Mathematics (AREA)
- Bioethics (AREA)
- General Engineering & Computer Science (AREA)
- Entrepreneurship & Innovation (AREA)
- Medical Informatics (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Data Mining & Analysis (AREA)
- Marketing (AREA)
- Economics (AREA)
- Databases & Information Systems (AREA)
- Computer Hardware Design (AREA)
- Computer Security & Cryptography (AREA)
- General Business, Economics & Management (AREA)
- Game Theory and Decision Science (AREA)
- Artificial Intelligence (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Computation (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明涉及深度学习领域,特别涉及基于改进Ranger的深度学习方法,本发明基于改进Ranger的深度学习方法通过指数加权平均方法优化Radam算法获得的方差、反向反馈验证法改进Lookahead算法的K参数和后项拟合的方法改进学习率解决了深度学习在算法训练时精度低、运行时间长和消耗资源多的问题,本发明适用于基于Ranger的深度学习。
Description
技术领域
本发明涉及深度学习领域,特别涉及基于改进Ranger的深度学习方法。
背景技术
销售预测系统运用模型进行数据预测,从而为业务提供技术支持,模型分为机器学习、深度学习、时间序列等。其中深度学习算法是预测算法中的重中之重,随着人工智能的发展,深度学习算法被广泛应用于各个场景。
深度学习是机器学习研究中的一个新的领域,其动机在于建立、模拟人脑进行分析学习的神经网络,它模仿人脑的机制来解释数据,例如图像、声音和文本,深度学习是无监督学习的一种。深度学习的概念源于人工神经网络的研究,含多隐层的多层感知器就是一种深度学习结构。深度学习通过组合低层特征形成更加抽象的高层表示属性类别或特征,以发现数据的分布式特征表示,基于深信度网(DBN)提出非监督贪心逐层训练算法,为解决深层结构相关的优化难题带来希望,随后提出多层自动编码器深层结构。
Ranger便是深度学习算法中的一种,它结合了Radam算法和Lookahead算法。
Radam的先进之处在于,能根据方差分散度,动态地打开或关闭自适应学习率,提供了一种不需要可调参数学习率预热的方法,它兼具Adam和SGD两者的优点,既能保证收敛速度快,也不容易掉入局部最优解。
LookAhead受到深度神经网络损失表面方面进展的启发,能够稳定深度学习训练和收敛速度。LookAhead减少了需要调整的超参数的数量,能以最小的计算开销实现不同深度学习任务的更快收敛。
Radam算法和Lookahead算法从不同的角度着手,各自在深度学习优化上实现了新的突破,具有高度协同性,但是Ranger仍存在以下缺点:1、Radam算法计算方差的时候容易出现过拟合现象,导致运行结果精度低;2、Lookahead算法训练k参数和学习率的时候,计算负担大,内存消耗多。
发明内容
本发明所解决的技术问题:提供基于改进Ranger的深度学习方法解决深度学习在算法训练时精度低、运行时间长和消耗资源多的问题。
本发明解决上述技术问题采用的技术方案:基于改进Ranger的深度学习方法包括以下步骤:
S01、获取数据源;
S02、将数据进行预处理;
S03、将数据进行Radam算法优化,计算梯度,利用指数加权平均方法优化方差,获得方差;
S04、用反向反馈验证法改进K参数;利用后向拟合的方法改进学习率;将数据进行Lookahead算法优化;
S05、输出预测结果。
进一步的,步骤S01中,数据源是销售数据。
进一步的,步骤S02中,预处理包括脱敏处理、缺失值填充处理、字段类型转换处理、归一化处理和标准化处理中的一种或多种,所述缺失值填充采取就近原则进行填充;所述字段类型转换是将部分字段字符串类型转为浮点类型。
进一步的,步骤S04中,反向反馈验证法包括以下步骤:
S601、设置学习率a;
S602、针对数据按照S601设置的学习率进行迭代运算,获得权重,并备份;
S603、从现有权重出发,运行LookAhead算法得到k参数,并根据φt+1=a+(1-a)φt+k得到新权重;
S604、更新模型权重;
S605、查看模型收敛性;
S606、获得模型达到最佳收敛时的k。
进一步的,步骤S601中,设置初始学习率为一个或多个,步骤S602中,迭代处理是任意单次或多次。
进一步的,步骤S04中,后向拟合的方法,包括以下步骤:
S901、针对数据进行迭代处理;
S902、设置初始学习率a=0.5和k,k的值是反向反馈验证法计算出的k值;
S904、改变步骤S902中的初始学习率,找到模型最佳拟合情况,即R2=1或则无限接近1;
S905、输出模型最佳拟合情况学习率设置值。
进一步的,步骤S901中,迭代处理是任意单次或多次。
进一步的,步骤S05中,输出预测结果是一个数据或多个数据。
本发明的有益效果:本发明基于改进Ranger的深度学习方法通过指数加权平均方法优化Radam算法获得方差、反向反馈验证法改进Lookahead算法的k参数和后项拟合的方法改进学习率解决了深度学习在算法训练时精度低、运行时间长和消耗资源多的问题,提高深度学习算法的学习速度和效果。
附图说明
图1是本发明基于改进Ranger的深度学习方法的计算过程流程图。
具体实施方式
本发明提供基于改进Ranger的深度学习方法解决了深度学习在算法训练时精度低、运行时间长和消耗资源多的问题,提高深度学习算法的学习速度和效果,包括以下步骤:
S01、获取数据源;
S02、将数据进行预处理;
S03、将数据进行Radam算法优化,计算梯度,利用指数加权平均方法优化方差,获得方差;
S04、用反向反馈验证法改进K参数;利用后向拟合的方法改进学习率;将数据进行Lookahead算法优化;
S05、输出预测结果。
进一步的,步骤S01中,数据源是销售数据。
进一步的,步骤S02中,预处理包括脱敏处理、缺失值填充处理、字段类型转换处理、归一化处理和标准化处理中的一种或多种,所述缺失值填充采取就近原则进行填充;所述字段类型转换是将部分字段字符串类型转为浮点类型。
进一步的,步骤S03中,优化方差的公式是其中S表示方差,β2是指数加权平均的超参,t表示步数,gi表示第i歩的梯度。这里能够加速深度学习收敛速度,同时不会出现过拟合现象,能够使深度学习用最短的时间完成运算操作。
进一步的,步骤S04中,反向反馈验证法包括以下步骤:
S601、设置学习率a;
S602、针对数据按照S601设置的学习率进行迭代运算,获得权重,并备份;
S603、从现有权重出发,运行LookAhead算法得到k参数,并根据φt+1=a+(1-a)φt+k得到新权重;
S604、更新模型权重;
S605、查看模型收敛性;
S606、获得模型达到最佳收敛时的k。
进一步的,步骤S601中,设置初始学习率为一个或多个,步骤S602中,迭代处理是任意单次或多次。
进一步的,步骤S04中,后向拟合的方法,包括以下步骤:
S901、针对数据进行迭代处理;
S902、设置初始学习率a=0.5和k,k的值是反向反馈验证法计算出的k值;
S904、改变步骤S902中的初始学习率,找到模型最佳拟合情况,即R2=1或则无限接近1;
S905、输出模型最佳拟合情况学习率设置值。
进一步的,步骤S901中,迭代处理是任意单次或多次。
进一步的,步骤S05中,输出预测结果是一个数据或多个数据。
具体的,如附图1所示,选取一组销售数据作为原始数据,如下表1:
表一:原始销售数据表
下一步,将原始销售数据做脱敏处理,得到的数据如下表2所示:
表2:脱敏数据表
日期(月) | 脱敏数据 |
2019年11月 | 94081 |
2019年12月 | 51954 |
2020年1月 | 176394 |
2020年2月 | 153697 |
2020年3月 | 177447 |
2020年4月 | 106786 |
2020年5月 | 64316 |
2020年6月 | 47744 |
2020年7月 | 28153 |
2020年8月 | 16483 |
2020年9月 | 94081 |
下一步,将数据进行Radam算法优化,计算梯度,利用指数加权平均方法优化方差,获得方差,计算公式如下:gt=Δθft(θt-1),t表示步数,gt表示t歩的梯度,ft(θt-1)表示权重,Δθ表示参数更新量,mt是一阶矩,vt是二阶矩,η是学习率,ct是偏差修正项,ε防止除零错误及控制更新量的最大比例,vt表示二阶矩,β2表示二阶矩指数加权平均超参;mt=β1mt-1+(1-β1)gt,mt表示一阶矩,β1表示一阶矩指数加权平均超参;表示计算偏差校正移动平均数,表示第t次迭代过程中一阶矩指数加权平均超参;ρt表示计算第t次迭代过程中的近似指数加权平均长度,ρ∞表示计算近似值的最大长度,表示第t次迭代过程中一阶矩指数加权平均超参;RAdam算法在训练的初期方差vt会非常大。通过指数加权平均计算的梯度平方的方差大于使用简单平均计算的梯度平方的方差,推导过程如下:
其中S表示方差,其中0.8是固定值,这里采取人工调参的方式确认的。获得数据如下表3:
表3:Radam算法获得方差
下一步,用反向反馈验证法改进K参数,利用后向拟合的方法改进学习率,进行Lookahead算法优化,LookAhead拥有两套权重,即FastWeights和SlowWeights,Lookahead首先使用内部循环中的SGD等标准优化器,更新k次FastWeights,然后以最后一个FastWeights的方向更新Slow Weights;第一套权重Fast Weights其更新规则:θt,i+1=θt,i+A(L,θt,i-1,d),其中A为优化器,L为目标函数,d为样本数据,θt,i+1表示内循环优化器更新规则,但这里会将该轮循环的k次权重,用序列都保存下来;第二套权重SlowWeights其计算公式:
φt+1=φt+a(θt,k-φt)
=a[θt,k+(1-a)θt-1,k+...+(1-a)t-1θ0,k]
+(1-a)tφ0
这里的a是SlowWeights的学习率。具体的,用反向反馈验证法改进K参数包括以下步骤:
S601、设置学习率分别为0.1,0.01,0.5;
S602、针对数据分别按照S601设置的学习率分别进行迭代5,10,15,20,25和30次运算,获得权重,并备份;
S603、从现有权重出发,运行LookAhead算法得到k参数,并根据φt+1=a+(1-a)φt+k得到新权重;
S604、更新模型权重;
S605、查看模型收敛性;
S606、获得模型达到最佳收敛时的k,k=0.7;
利用后向拟合的方法改进学习率包括以下步骤:
S901、针对数据分别进行迭代5,10,15,20,25,30次;
S902、设置初始学习率a=0.5和k,K的值是反向反馈验证法计算出的k值;
S904、改变步骤S902中的初始学习率,找到模型最佳拟合情况,即R2=1或则无限接近1;
S905、输出模型最佳拟合情况学习率设置值a=0.8。
下一步,输出预测结果,预测结果为2020年10月,销售数据为95926,本发明基于改进Ranger的深度学习方法计算过程用时如下表4。
表4:本发明基于改进Ranger的深度学习方法用时
Claims (9)
1.基于改进Ranger的深度学习方法,其特征在于,包括以下步骤:
S01、获取数据源;
S02、将数据进行预处理;
S03、将数据进行Radam算法优化,计算梯度,利用指数加权平均方法优化方差,获得方差;
S04、用反向反馈验证法改进K参数;利用后向拟合的方法改进学习率;将数据进行Lookahead算法优化;
S05、输出预测结果。
2.根据权利要求1所述的基于改进Ranger的深度学习方法,其特征在于,步骤S01中,所述的数据源是销售数据。
3.根据权利要求1或2所述的基于改进Ranger的深度学习方法,其特征在于,预处理包括脱敏处理、缺失值填充处理、字段类型转换处理、归一化处理和标准化处理中的一种或多种,所述缺失值填充采取就近原则进行填充;所述字段类型转换是将部分字段字符串类型转为浮点类型。
5.根据权利要求1或2所述的基于改进Ranger深度学习方法,其特征在于,步骤S04中,所述反向反馈验证法包括以下步骤:
S601、设置学习率a;
S602、针对数据按照S601设置的学习率进行迭代运算,获得权重,并备份;
S603、从现有权重出发,运行LookAhead算法得到k参数,并根据φt+1=a+(1-a)φt+k得到新权重;
S604、更新模型权重;
S605、查看模型收敛性;
S606、获得模型达到最佳收敛时的k。
6.根据权利要求5所述的基于改进Ranger深度学习方法,其特征在于,步骤S601中,设置初始学习率为一个或多个,步骤S602中,迭代处理是任意单次或多次。
8.根据权利要求7所述的基于改进Ranger深度学习方法,其特征在于,步骤S901中,迭代处理是任意单次或多次。
9.根据权利要求1或2所述的基于改进Ranger深度学习方法,其特征在于,步骤S05中,输出预测结果是一个数据或多个数据。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011506464.1A CN112488772A (zh) | 2020-12-18 | 2020-12-18 | 基于改进Ranger的深度学习方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011506464.1A CN112488772A (zh) | 2020-12-18 | 2020-12-18 | 基于改进Ranger的深度学习方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN112488772A true CN112488772A (zh) | 2021-03-12 |
Family
ID=74914701
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011506464.1A Pending CN112488772A (zh) | 2020-12-18 | 2020-12-18 | 基于改进Ranger的深度学习方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112488772A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114720956A (zh) * | 2022-06-07 | 2022-07-08 | 成都信息工程大学 | 针对双偏振天气雷达的水凝物粒子分类识别方法及装置 |
-
2020
- 2020-12-18 CN CN202011506464.1A patent/CN112488772A/zh active Pending
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114720956A (zh) * | 2022-06-07 | 2022-07-08 | 成都信息工程大学 | 针对双偏振天气雷达的水凝物粒子分类识别方法及装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11593663B2 (en) | Data discriminator training method, data discriminator training apparatus, non-transitory computer readable medium, and training method | |
WO2022116441A1 (zh) | 基于卷积神经网络的bert模型的微调方法及装置 | |
US11887004B2 (en) | Batch renormalization layers | |
US20210034973A1 (en) | Training neural networks using learned adaptive learning rates | |
CN108701253A (zh) | 使用规范化的目标输出训练神经网络 | |
US20210271980A1 (en) | Deterministic decoder variational autoencoder | |
CN103778482A (zh) | 基于多尺度分析的水产养殖溶解氧短期预测方法 | |
CN114299349B (zh) | 一种基于多专家系统和知识蒸馏的众包图像学习方法 | |
CN113688949A (zh) | 一种基于双网络联合标签修正的网络图像数据集去噪方法 | |
CN112488772A (zh) | 基于改进Ranger的深度学习方法 | |
CN116992779B (zh) | 基于数字孪生模型的光伏储能系统仿真方法及系统 | |
CN113743474A (zh) | 基于协同半监督卷积神经网络的数字图片分类方法与系统 | |
CN116227578A (zh) | 一种无源域数据的无监督领域适应方法 | |
CN112215412A (zh) | 溶解氧预测方法及装置 | |
Dwivedi et al. | Fundamental optimization methods for machine learning | |
CN116415177A (zh) | 一种基于极限学习机的分类器参数辨识方法 | |
CN112884160B (zh) | 一种元学习方法及相关装置 | |
US20240086678A1 (en) | Method and information processing apparatus for performing transfer learning while suppressing occurrence of catastrophic forgetting | |
CN118036757B (zh) | 大语言模型训练方法及装置 | |
Zhang et al. | Online kernel classification with adjustable bandwidth using control-based learning approach | |
CN115330346B (zh) | 基于能力评价的滑坡众包标注结果评估及任务分配方法 | |
US20220398506A1 (en) | Systems and Methods for Implicit Rate-Constrained Optimization of Non-Decomposable Objectives | |
Dehghani et al. | Learning to rank from samples of variable quality | |
CN117874829A (zh) | 基于自适应差分隐私的联邦学习方法 | |
CN114676839A (zh) | 基于随机敏感度的知识迁移方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |