CN111680846A - 一种基于l1和l2范数的简化宽度学习系统 - Google Patents
一种基于l1和l2范数的简化宽度学习系统 Download PDFInfo
- Publication number
- CN111680846A CN111680846A CN202010547848.1A CN202010547848A CN111680846A CN 111680846 A CN111680846 A CN 111680846A CN 202010547848 A CN202010547848 A CN 202010547848A CN 111680846 A CN111680846 A CN 111680846A
- Authority
- CN
- China
- Prior art keywords
- learning system
- formula
- objective function
- width learning
- simplified
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0639—Performance analysis of employees; Performance analysis of enterprise or organisation operations
- G06Q10/06393—Score-carding, benchmarking or key performance indicator [KPI] analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Systems or methods specially adapted for specific business sectors, e.g. utilities or tourism
- G06Q50/04—Manufacturing
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02P—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
- Y02P90/00—Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
- Y02P90/30—Computing systems specially adapted for manufacturing
Abstract
一种基于L1和L2范数的简化宽度学习系统,具体方法如下:步骤1:获取训练输入数据与训练输出数据获取测试输入数据与测试输出数据其中,N1、N2分别为训练测试数据样本数目,T1、T2分别为输入和输出数据的维度;步骤2:构建宽度模型;步骤3:替换标准宽度学习系统目标函数中的正则项以此作为新的目标函数,其中步骤4:对于新的目标函数,采用增广拉格朗日乘子法迭代求解输出权重W;步骤5:根据公式得到简化的宽度学习系统的输出Y;其中,Wm为连接特征节点层与增强节点层到输出层的权值整体,由W连接所得。该系统能有效简化宽度学习系统的网络结构,可有效去除与结果相关性低的节点,能适应复杂工业过程中相关指标的预测需求。
Description
技术领域
本发明属于工业过程建模技术领域,具体涉及一种基于L1和L2范数的简化宽度学习 系统。
背景技术
人工神经网络持续性的高速发展使数据分析达到了人们前所未有的高度,通过机器学 习方法,一系列复杂工业过程的控制与优化的问题有了良好的解决方案。其中最热门的方 法当属深度学习,然而深度学习的网络输入节点多,网络层次深。甚至为了提高准确度, 更需要更多的网络层数和大量的超参数,不断地迭代运算。这对于算法的结构来讲,这种 方法会使算法结构非常复杂,分析这种结构的工作将变得繁琐。对于训练来讲,大量的运 算导致训练时间增加和对计算机计算能力要求持续的增加。
现有技术中出现了一种新的方法——宽度学习系统(BLS),一种不需要深度结构的高 效增量学习系统。宽度学习是一种用于替代深度学习的方法,不需要消耗大量的人力物力 来优化大量的参数,其层数是单隐层,网络具有扁平化优点。宽度学习也不存在过多的层 次数增加网络的复杂性,这样,系统所需的训练时间就非常的短。而且在有网络扩增需求 时,宽度学习也可以通过增量学习快速重新搭建,这是深度学习所不能达到的。
BLS及其变体在分类、回归、聚类和预测中表现优异,但是BLS现阶段依旧存在一些问 题。比如,在一些模型中存在着对预测结果作用较小的节点,甚至其中一部分对结果而言 毫无作用。这样的节点存在于网络中,不但会使模型过于复杂导致训练过程耗时,并且存 在降低模型泛化性的风险。这一问题阻碍了其在一些领域的发展与应用,因此寻找一种网 络结构简化方法以提高训练效率同时使BLS结构简化易于分析是很有必要的。
发明内容
针对上述现有技术存在的问题,本发明提供一种基于L1和L2范数的简化宽度学习系 统,该系统能有效简化宽度学习系统的网络结构,可有效去除与结果相关性低的节点,能 适应复杂工业过程中相关指标的预测需求。
为了实现上述目的,本发明提供一种基于L1和L2范数的简化宽度学习系统,包括以下 步骤:
其中,N1、N2分别为训练测试数据样本数目,T1、T2分别为输入和输出数据的维度;
步骤2:构建宽度模型;
步骤2.1:根据标准宽度学习系统,通过公式(1)计算第i个映射特征Zi:
步骤2.2:根据公式(2)将N1组特征节点连接为一个整体;
步骤2.4:根据公式(4)连接所有Hj得到增强层总输出;
Hm@[H1,H2,...,Hm] (21);
步骤3:获取新的目标函数;
步骤4:对于新的目标函数,采用增广拉格朗日乘子法迭代求解输出权重W;
步骤5:根据公式(17)得到简化的宽度学习系统的输出Y;
其中,Wm为连接特征节点层与增强节点层到输出层的权值整体,由W连接所得。
其中λ1、λ2分别为L1和L2的正则项参数。
在步骤4中:当使用L1范数时,通过增广拉格朗日乘子法迭代优化来处理,先引入稀疏 变量Q代替W得到新的目标函数如公式(7)所示;
再使用增广拉格朗日乘子法得到目标函数如公式(8)所示;
其中,C是拉格朗日乘子,μ≥0是惩罚参数。
利用以下方法对原始变量W、Q和C进行优化;
S1:固定其它变量,去除不相关项,对公式(9)进行求解;
W=(μI+2ATA)-1(2ATY+μF) (28);
S3:更新参数C,在每次迭代中C更新为:C+μ(Q-W)。
在步骤4中:当使用L1和L2组合范数时,通过增广拉格朗日乘子法迭代优化来处理, 先引入稀疏变量Q代替W得到新的目标函数如公式(12)所示;
再使用增广拉格朗日乘子法得到目标函数如公式(13)所示;
其中,C是拉格朗日乘子,μ≥0是惩罚参数。
利用以下方法对原始变量W、Q和C进行优化;
S1:固定其它变量,去除不相关项,对公式(14)进行求解;
W=(μI+2λ2I+2ATA)-1(2ATY+μF) (33);
S3:更新参数C,在每次迭代中C更新为:C+μ(Q-W)。
本发明先利用宽度学习系统基础框架,再利用Lasso和ElasticNet正则化技术,去除与 结果相关性低的节点,保留与结果相关性高的节点,从而实现了宽度学习系统网络结构的 简化。与原有的宽度学习系统相比,本发明在节点数量、预测精度方面有明显的优势。本 发明使网络中与结果相关性低的节点数量有效减少,宽度学习系统的网络结构得到简化。
具体实施方式
下面结合实施例对本发明作进一步说明。
本发明提供一种基于L1和L2范数的简化宽度学习系统,包括以下步骤:
其中,N1、N2分别为训练测试数据样本数目,T1、T2分别为输入和输出数据的维度;
步骤2:构建宽度模型;
步骤2.1:根据标准宽度学习系统,通过公式(1)计算第i个映射特征Zi:
步骤2.2:根据公式(2)将N1组特征节点连接为一个整体;
步骤2.4:根据公式(4)连接所有Hj得到增强层总输出;
Hm@[H1,H2,...,Hm] (38);
步骤3:获取新的目标函数;
步骤4:对于新的目标函数,采用增广拉格朗日乘子法迭代求解输出权重W;
步骤5:根据公式(17)得到简化的宽度学习系统的输出Y;
其中,Wm为连接特征节点层与增强节点层到输出层的权值整体,由W连接所得。
其中λ1、λ2分别为L1和L2的正则项参数。
在步骤4中:当使用L1范数时,通过增广拉格朗日乘子法迭代优化来处理,先引入稀疏 变量Q代替W得到新的目标函数如公式(7)所示;
再使用增广拉格朗日乘子法得到目标函数如公式(8)所示;
其中,C是拉格朗日乘子,μ≥0是惩罚参数。
利用以下方法对原始变量W、Q和C进行优化;
S1:固定其它变量,去除不相关项,对公式(9)进行求解;
W=(μI+2ATA)-1(2ATY+μF) (45);
S3:更新参数C,在每次迭代中C更新为:C+μ(Q-W)。
在步骤4中:当使用L1和L2组合范数时,通过增广拉格朗日乘子法迭代优化来处理, 先引入稀疏变量Q代替W得到新的目标函数如公式(12)所示;
再使用增广拉格朗日乘子法得到目标函数如公式(13)所示;
其中,C是拉格朗日乘子,μ≥0是惩罚参数。
利用以下方法对原始变量W、Q和C进行优化;
S1:固定其它变量,去除不相关项,对公式(14)进行求解;
W=(μI+2λ2I+2ATA)-1(2ATY+μF) (50);
S3:更新参数C,在每次迭代中C更新为:C+μ(Q-W)。
为了方便表示将提出的网络结构简化的宽度学习系统简写为L1BLS和ENBLS。
实施例:
为了展现本发明的优势之处,同时将BLS、L1BLS和ENBLS同时用于UCI数据库中的4个不同数据集的预测任务。
Abalone数据集是鲍鱼数据集,其中含有4177个样本,其中8个输入变量,将数据集分 成2784个样本的训练集和1393个样本的测试集。
Basketball数据集是篮球数据集,其中含有96个样本,其中4个输入变量,将数据集分 成64个样本的训练集和32个样本的测试集。
Heart Disease数据集是克利夫兰市的心脏病数据集,其中含有303个样本,其中13个输 入变量,将数据集分成202个样本的训练集和101个样本的测试集。
Quake数据集是地震数据集,其中含有2178个样本,其中3个输入变量,将数据集分成 1452个样本的训练集和726个样本的测试集。
使用以上数据集对算法进行测试。为了模拟实际过程,在第二次测试中为每个数据集添 加了30%的离群点。
为了便于比较,以均方根误差值作为判断标准(Root Mean Square Error,RMSE),均方根 误差如下:
采用网格搜索法确定正则化参数λ,确定条件为精度最高,搜索范围为 {2-5,2-4,2-3,2-2,2-1,20,21,22,23,24,25}。
表1:应用原始数据集时,提出的L1BLS、ENBLS与标准BLS在RMSE和节点数量上 的表现
表1为应用原始数据集时,提出的L1BLS、ENBLS与标准BLS在RMSE和节点数量上 的表现。表中每个数据都是运行10次取平均值得到的。可以看出L1BLS在节点数大幅度减 少的情况下,精度仍然不低于BLS;ENBLS在性能上明显优于BLS。
表2:训练集加入30%离群点后,提出的L1BLS、ENBLS与标准BLS在RMSE和节点 数量上的表现
表2为训练集加入30%离群点后,提出的L1BLS、ENBLS与标准BLS在RMSE和节点 数量上的表现。表中每个数据都是运行10次取平均值得到的。可以看到在添加了离群点后,L1BLS和ENBLS的性能与之前相仿,优于BLS。
Claims (6)
1.一种基于L1和L2范数的简化宽度学习系统,其特征在于,包括以下步骤:
其中,N1、N2分别为训练测试数据样本数目,T1、T2分别为输入和输出数据的维度;
步骤2:构建宽度模型;
步骤2.1:根据标准宽度学习系统,通过公式(1)计算第i个映射特征Zi:
步骤2.2:根据公式(2)将N1组特征节点连接为一个整体;
步骤2.4:根据公式(4)连接所有Hj得到增强层总输出;
Hm@[H1,H2,...,Hm] (4);
步骤3:获取新的目标函数;
步骤4:对于新的目标函数,采用增广拉格朗日乘子法迭代求解输出权重W;
步骤5:根据公式(17)得到简化的宽度学习系统的输出Y;
其中,Wm为连接特征节点层与增强节点层到输出层的权值整体,由W连接所得。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010547848.1A CN111680846A (zh) | 2020-06-16 | 2020-06-16 | 一种基于l1和l2范数的简化宽度学习系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010547848.1A CN111680846A (zh) | 2020-06-16 | 2020-06-16 | 一种基于l1和l2范数的简化宽度学习系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN111680846A true CN111680846A (zh) | 2020-09-18 |
Family
ID=72436405
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010547848.1A Pending CN111680846A (zh) | 2020-06-16 | 2020-06-16 | 一种基于l1和l2范数的简化宽度学习系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111680846A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115392543A (zh) * | 2022-07-29 | 2022-11-25 | 广东工业大学 | 一种结合l21范数和残差级联宽度学习的注塑产品质量预测方法 |
-
2020
- 2020-06-16 CN CN202010547848.1A patent/CN111680846A/zh active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115392543A (zh) * | 2022-07-29 | 2022-11-25 | 广东工业大学 | 一种结合l21范数和残差级联宽度学习的注塑产品质量预测方法 |
CN115392543B (zh) * | 2022-07-29 | 2023-11-24 | 广东工业大学 | 一种结合l21范数和残差级联宽度学习的注塑产品质量预测方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Matković et al. | Visual analytics for complex engineering systems: Hybrid visual steering of simulation ensembles | |
CN111461286B (zh) | 基于进化神经网络的Spark参数自动优化系统和方法 | |
CN113688869B (zh) | 一种基于生成对抗网络的光伏数据缺失重构方法 | |
CN107491508B (zh) | 一种基于循环神经网络的数据库查询时间预测方法 | |
CN110888859A (zh) | 一种基于组合深度神经网络的连接基数估计方法 | |
Lou et al. | Development of an integrated knowledge-based system for mold-base design | |
CN113722997A (zh) | 一种基于静态油气田数据的新井动态产量预测方法 | |
CN111126865B (zh) | 一种基于科技大数据的技术成熟度判断方法和系统 | |
CN111832839A (zh) | 基于充分增量学习的能耗预测方法 | |
CN111680846A (zh) | 一种基于l1和l2范数的简化宽度学习系统 | |
Wen et al. | MapReduce-based BP neural network classification of aquaculture water quality | |
CN113609763A (zh) | 基于不确定性的卫星组件布局温度场预测方法 | |
CN113032367A (zh) | 面向动态负载场景的大数据系统跨层配置参数协同调优方法和系统 | |
Shi et al. | Human resources balanced allocation method based on deep learning algorithm | |
CN112100759A (zh) | 复杂工程结构系统逼近分析的分布式协同代理模型方法 | |
CN117334271A (zh) | 一种基于指定属性生成分子的方法 | |
CN112200208A (zh) | 基于多维度特征融合的云工作流任务执行时间预测方法 | |
CN115409541A (zh) | 基于数据血缘的卷烟品牌数据处理方法 | |
CN114810008A (zh) | 一种油田分层注水量预测方法 | |
CN113761777A (zh) | 一种基于hp-ovmd的超短期光伏功率预测方法 | |
CN110942149B (zh) | 一种基于信息变化率及条件互信息的特征变量选择方法 | |
CN111160048A (zh) | 一种基于聚类进化的翻译引擎优化系统及方法 | |
CN115577872B (zh) | 基于多能智能体深度强化学习的结构化数据预测优化方法 | |
CN117435308B (zh) | 一种基于并行计算算法的Modelica模型仿真方法及系统 | |
CN115063165A (zh) | 一种基于特征筛选和注意力机制的制造装备价格预测方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |