CN107633301B - 一种bp神经网络回归模型的训练测试方法及其应用系统 - Google Patents

一种bp神经网络回归模型的训练测试方法及其应用系统 Download PDF

Info

Publication number
CN107633301B
CN107633301B CN201710749951.2A CN201710749951A CN107633301B CN 107633301 B CN107633301 B CN 107633301B CN 201710749951 A CN201710749951 A CN 201710749951A CN 107633301 B CN107633301 B CN 107633301B
Authority
CN
China
Prior art keywords
training
neural network
data
dimension
rmse
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN201710749951.2A
Other languages
English (en)
Other versions
CN107633301A (zh
Inventor
陈达权
黄运保
李海艳
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangdong University of Technology
Original Assignee
Guangdong University of Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangdong University of Technology filed Critical Guangdong University of Technology
Priority to CN201710749951.2A priority Critical patent/CN107633301B/zh
Publication of CN107633301A publication Critical patent/CN107633301A/zh
Application granted granted Critical
Publication of CN107633301B publication Critical patent/CN107633301B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

一种BP神经网络回归模型的训练测试方法,用于橡木激光切割系统切口宽度预测,主要包括如下步骤:a、获取数据,得到N个实验样本的数据集,其中一共包含M组实验数据;b、数据预处理;c、数据分组;d、寻优BP神经网络超参数并初始化;e、BP神经网络第一次训练;f、BP神经网络第二次训练;g、BP神经网络训练完成,预测橡木激光切割系统不同参数下的切口宽度。本发明的目的在于提出一种BP神经网络回归模型的训练测试方法,该方法在训练集数据过于集中或过少的情况下,提高BP神经网络训练的效果。

Description

一种BP神经网络回归模型的训练测试方法及其应用系统
技术领域
本发明涉及产品加工制造领域,尤其是涉及一种BP神经网络回归模型的训练测试方法及其应用系统。
背景技术
回归分析是通过规定因变量和自变量来确定变量之间的因果关系,建立回归模型,并根据实测数据来求解模型的各个参数,然后评价回归模型是否能够很好的拟合实测数据;如果能够很好的拟合,则可以根据自变量作进一步预测。
产品加工制造领域中一般使用实验公式或经验公式来粗劣估算生产加工中需要用到的关键参数,而这些实验公式或经验公式一般是利用回归分析确定因变量与自变量之间的关系。这些实验公式或经验公式一般都有比较严格的适用范围,当实验条件改变后,公式的正确性将受到影响。随着数值分析与统计学的逐渐相互渗透,人们已经意识到某些曾一度认为相当可靠的计算方法在实施中有很大困难,其精确的数学模型难以建立,因此建立一套精确而有效的计算机回归程序已成为当前研究中的一个重要课题。
社会的需求推动着预测理论和方法的不断发展,迄今为止,已经有近200种的预测方法。尽管各种方法各不相同,但是具体进行预测的过程中都遵循着可能性原理、可知性原理、可控性原理、连续性原理、反馈性原理、系统性原理等哲学高度上的一般原理。
神经网络是一种大规模并行复杂的非线性动力系统,它可表示极其复杂的非线性模型系统,具有高度并行的处理机制、高速运算的能力、高度灵活可变的拓扑结构、高度的非线性运算,具有自学习、自组织的能力,得到了预测科学研究的重视。
在神经网络训练中需要用到训练集以及测试集,在训练集上训练神经网络模型,即得到神经网络较好的权值和阈值找到能有效逼近该训练集的函数,模型训练好后再利用测试集验证该神经网络模型的泛化能力,即该神经网络对于训练集以外的数据进行预测的准确率。然而,在训练集数据过于集中或过少的情况下,神经网络模型的训练效果往往不好,即泛化能力不足,因此,针对该种训练集情况下最大限度提高神经网络的训练效果具有重要的现实意义。
发明内容
鉴于现有社会需求背景和技术现状,本发明的目的在于提出一种BP神经网络回归模型的训练测试方法,该方法在训练集数据过于集中或过少的情况下,训练完成的BP神经网络也有较好的训练效果。
为达此目的,本发明采用一下技术方案:
一种BP神经网络回归模型的训练测试方法,用于橡木激光切割系统切口宽度预测,包括如下步骤:a.获取数据:得到N个实验样本的已标定五维数据集R,其中一共包含M组实验数据及其对应实验结果;b.数据预处理:对所述已标定五维数据集R利用PCA降维一维,并进行归一化处理,得到已标定四维数据集S;c.数据分组:将所述已标定四维数据集S分为训练集D和测试集T两类数据;d.寻优BP神经网络超参数并初始化:创建一个三层BP神经网络,找到隐藏层最佳神经元个数,按照实际需要设定学习率、神经元激活函数、训练最小均方误差目标、训练最小性能梯度及最大训练次数等;e.BP神经网络第一次训练:训练出泛化能力满足用户实际需求的BP神经网络所有权值和阈值,若该BP神经网络经第一次训练后,该BP神经网络泛化能力满足用户实际需,则该BP神经网络训练完成,可直接用于预测橡木激光切割系统不同参数下的切口宽度,否则,对该BP神经网络进行第二次训练;f.BP神经网络第二次训练:通过微调,增强BP神经网络经第一次训练后的泛化能力,使该BP神经网络泛化能力满足用户实际需,若该BP神经网络泛化能力仍未满足用户实际需,则重新执行步骤a,增加实验样本数量从而增大所述训练集D,并继续执行步骤b至步骤f直至完成第二次训练的BP神经网络泛化能力满足用户实际需,此时BP神经网络训练完成;g.BP神经网络训练完成,预测橡木激光切割系统不同参数下的切口宽度。
具体的,所述步骤a中获取数据包括:
对于橡木激光切割系统获取在不同的激光能量、切割速度、离焦量、橡木含水率、橡木气干密度情况下的切口宽度,由此得到由N个实验样本组成的已标定五维数据集R,其中一共包含M组实验数据。
具体的,所述步骤b中数据预处理包括如下步骤:
b1.定义所述已标定五维数据集R中的第一维为激光能量,记为x;第二维为切割速度,记为y;第三维为离焦量,记为z;第四维为橡木含水率,记为r1;第五维为橡木气干密度,记为r2;
b2.分别对所述已标定五维数据集R求解每一维上的均值和方差,并对所述已标定五维数据集R中每一组的实验数据分别减去对应维数上的均值,组成行数为M、列数为5的样本矩阵Q;
b3.求解所述已标定五维数据集R的五维协方差矩阵K,即:
b4.求解所述五维协方差矩阵K的5个特征值γ1、γ2、γ3、γ4、γ5,由大到小排序获得其中前四个特征值γ1'、γ2'、γ3'、γ4',并求解所述五维协方差矩阵K分别对应γ1'、γ2'、γ3'、γ4'的特征向量β1、β2、β3、β4,所述特征向量β1、β2、β3、β4均为单位化的五维列向量,并组成映射矩阵T=[β1,β2,β3,β4];
b5.将所述样本矩阵Q和映射矩阵T相乘获得矩阵Y,所述矩阵Y中的每一行即为所述已标定五维数据集R降维一维后的一组实验数据,从而获得已标定四维数据集S。
b6.对所述已标定四维数据集S进行归一化处理为均值为0方差为1的数据。
具体的,所述步骤c中数据分组包括:
将已标定四维数据集S按照原来N个实验样本的分组方式分为N个数据集,选取其中0.3×N个数据集编号并组成测试集T,剩余数据集组成训练集D,其中0.3×N取不大于其具体值的最大整数;若N小于10,则将该N个数据集里的M组实验数据随机的划分成15个数据集,在该15个数据集中随机选取其中3个数据集编号并组成测试集T,剩余数据集组成训练集D,记测试集T由nt个数据集组成。
具体的,所述步骤d中寻优BP神经网络超参数并初始化包括:
创建一个三层BP神经网络,分别为输入层、隐藏层和输出层,输入层神经元个数为4,输出层神经元个数为1。
隐藏层神经元个数设定范围在0.75×4到5×4之间(包括两个端点值3和20);依次设定隐藏层神经元个数为所述隐藏层神经元个数设定范围内的所有整数,按遍历搜索的方式寻找隐藏层最佳神经元个数,此处寻找隐藏层最佳神经元个数过程中每次BP神经网络的训练中,训练集均为从所述训练集D中随机抽取其中的20%组成训练集Dp,测试集均为从所述测试集T中随机抽取其中一个数据集组成测试集Tp;隐藏层神经元个数从设置为3开始,利用所述训练集Dp进行第一次训练,训练完成后预测所述测试集Tp的数据,将所述测试集Tp的预测值与实验值进行对比,计算出均方根误差RMSE01,重新初始化所有权值和阈值并利用所述训练集Dp进行第二次训练,训练完成后预测所述测试集Tp的数据,将所述测试集Tp的预测值与实验值进行对比,计算出均方根误差RMSE02,重新初始化所有权值和阈值并利用所述训练集Dp进行第三次训练,训练完成后预测所述测试集Tp的数据,将所述测试集Tp的预测值与实验值进行对比,计算出均方根误差RMSE03,比较RMSE01、RMSE02和RMSE03的大小,得到其中的最小值RMSE(1)作为BP神经网络隐藏层神经元个数为3时所对应的该模型预测效果;重复上述步骤找到BP神经网络隐藏层神经元个数分别为4、5、6……20时所对应的RMSE(2)、RMSE(3)…RMSE(18),找出RMSE(1)、RMSE(2)…RMSE(18)中的最小值RMSEm所对应的隐藏层神经元个数nn,则BP神经网络隐藏层最优神经元个数为nn,若有多个隐藏层神经元个数所对应的模型预测效果为RMSEm,则取其中隐藏层神经元个数最少的个数作为BP神经网络隐藏层最优神经元个数。
以隐藏层神经元个数为nn,创建一个三层BP神经网络,利用高斯分布随机数初始化BP神经网络的所有权值和阈值;学习率初始化为0.01;所有神经元激活函数均采用tansig;训练最小均方误差目标设置为1e-3;训练最小性能梯度设置为1e-6;最大训练次数设置为50000;训练算法选取贝叶斯正则化算法。
具体的,所述步骤e中BP神经网络第一次训练包括如下步骤:
e1.根据步骤d的寻优结果创建BP神经网络并进行超参数初始化;
e2.从所述测试集T中编号为2的数据集中随机抽取50%的样本数据组成数据集T1,从所述测试集T中抽取除编号为1的数据集和编号为2的数据集外的其他样本数据组成数据集T2,所述测试集T中除去所述数据集T1和所述数据集T2外剩余的样本数据组成训练集D”,将所述数据集T1、所述数据集T2和所述训练集D组成训练集D';
e3.利用所述训练集D'通过贝叶斯正则化算法对步骤e1所创建的BP神经网络进行训练,直至满足训练均方误差达到训练最小均方误差目标或训练性能梯度达到训练最小性能梯度或训练次数达到最大训练次数中任意一条训练结束条件后,完成该BP神经网络的第一次训练;
e4.该BP神经网络的第一次训练完成后,利用该完成第一次训练的BP神经网络分别对所述测试集T中nt个数据集分别对其中数据样本进行预测得到预测值,并将该预测值与对应的实验值进行对比,按所述测试集T中nt个数据集的编号顺序计算nt个数据集的预测值对应其实验值的均方根误差RMSE_1、RMSE_2…RMSE_nt及可决系数(亦称确定系数)R^2_1、R^2_2…R^2_nt;
e5.根据RMSE_2、RMSE_3…RMSE_nt结合R^2_2、R^2_3…R^2_nt判断完成第一次训练的BP神经网络的训练结果是否过拟合及过拟合程度,并根据RMSE_1和R^2_1判断完成第一次训练的BP神经网络的泛化能力;若完成第一次训练的BP神经网络满足用户要求的过拟合和泛化能力要求,则保存该完成第一次训练的BP神经网络的所有权值W和阈值B,该BP神经网络训练完成,可直接用于预测橡木激光切割系统不同参数下的切口宽度,否则,对该BP神经网络进行第二次训练。
具体的,所述步骤f中BP神经网络第二次训练包括:
对BP神经网络在完成第一次训练的基础上,利用训练集D”对该BP神经网络的权值和阈值通过BP算法进行微调,从而增强该BP神经网络的泛化能力。
一种应用上述的方法的应用系统,其包括:包括数据录入模块、数据预处理模块、数据分组模块、BP神经网络超参数设定模块、神经网络训练模块和执行预测模块;
数据录入模块:用于向所述应用系统中输入N个实验样本的五维实验数据及其对应实验结果;
数据预处理模块:对数据录入模块所获取到的已标定五维数据集利用PCA降维一维,并进行归一化处理,得到已标定四维数据集;
数据分组模块:将所述已标定四维数据集分为训练集和测试集两类数据;
BP神经网络超参数设定模块:创建一个三层BP神经网络,找到隐藏层最佳神经元个数,按照实际需要设定学习率、神经元激活函数、训练最小均方误差目标、训练最小性能梯度及最大训练次数等;
神经网络训练模块:训练出泛化能力满足用户实际需求的BP神经网络所有权值和阈值,若该BP神经网络经第一次训练后,该BP神经网络泛化能力满足用户实际需,则该BP神经网络训练完成,否则,对该BP神经网络进行第二次训练;BP神经网络第二次训练通过微调,增强BP神经网络经第一次训练后的泛化能力,使该BP神经网络泛化能力满足用户实际需,若该BP神经网络泛化能力仍未满足用户实际需,向所述应用系统中输入更多实验样本的五维实验数据及其对应实验结果,从而增大BP神经网络的训练集,并按上述步骤重新训练BP神经网络,直至其泛化能力满足用户实际需,BP神经网络训练完成;
执行预测模块:预测橡木激光切割系统不同参数下的切口宽度。
本发明的有益效果:本发明的一种结合PCA的BP神经网络回归模型训练及测试方法,主要通过对所获取的数据进行归一化及PCA降低数据冗余,将获取到的所有数据合理划分为训练集和测试集并在BP神经网络训练中充分利用,寻优并初始化BP神经网络超参数,利用贝叶斯正则化算法进行权值和阈值的训练,结合迁移学习思想对完成第一次训练的BP神经网络进行微调,实现了在训练集数据过于集中或过少的情况下对BP神经网络的训练效果(泛化能力)有所提高。
附图说明
图1为本发明的一个实施例的结合PCA的BP神经网络回归模型训练及测试方法的流程图;
图2为本发明的一个实施例的寻优BP神经网络超参数并初始化的流程图;
图3为本发明的一个实施例的BP神经网络第一次训练的流程图。
具体实施方式
下面结合附图并通过具体实施方式来进一步说明本发明的技术方案。
本发明提出一种结合PCA的BP神经网络回归模型训练及测试方法,用于橡木激光切割系统切口宽度预测,实现了在训练集数据过于集中或过少的情况下对BP神经网络的训练效果有所提高,如图1所示,包括如下步骤:
S10:获取数据,得到N个实验样本的已标定五维数据集R,其中一共包含M组实验数据及其对应实验结果。
较优地,所述获取数据包括:
对于橡木激光切割系统获取在不同的激光能量、切割速度、离焦量、橡木含水率、橡木气干密度情况下的切口宽度,由此得到由N个实验样本组成的已标定五维数据集R,其中一共包含M组实验数据。
S20:数据预处理,对所述已标定五维数据集R利用PCA降维一维,并进行归一化处理,得到已标定四维数据集S。
较优地,所述数据预处理包括如下步骤:
S21:定义所述已标定五维数据集R中的第一维为激光能量,记为x;第二维为切割速度,记为y;第三维为离焦量,记为z;第四维为橡木含水率,记为r1;第五维为橡木气干密度,记为r2;
S22:分别对所述已标定五维数据集R求解每一维上的均值和方差,并对所述已标定五维数据集R中每一组的实验数据分别减去对应维数上的均值,组成行数为M、列数为5的样本矩阵Q;
S23:求解所述已标定五维数据集R的五维协方差矩阵K,即:
S24:求解所述五维协方差矩阵K的5个特征值γ1、γ2、γ3、γ4、γ5,由大到小排序获得其中前四个特征值γ1'、γ2'、γ3'、γ4',并求解所述五维协方差矩阵K分别对应γ1'、γ2'、γ3'、γ4'的特征向量β1、β2、β3、β4,所述特征向量β1、β2、β3、β4均为单位化的五维列向量,并组成映射矩阵T=[β1,β2,β3,β4];
S25:将所述样本矩阵Q和映射矩阵T相乘获得矩阵Y,所述矩阵Y中的每一行即为所述已标定五维数据集R降维一维后的一组实验数据,从而获得已标定四维数据集S。
S26:对所述已标定四维数据集S进行归一化处理为均值为0方差为1的数据。
S30:数据分组,将所述已标定四维数据集S分为训练集D和测试集T两类数据。
较优地,所述数据分组包括:
将已标定四维数据集S按照原来N个实验样本的分组方式分为N个数据集,选取其中0.3×N个数据集编号并组成测试集T,剩余数据集组成训练集D,其中0.3×N取不大于其具体值的最大整数;若N小于10,则将该N个数据集里的M组实验数据随机的划分成15个数据集,在该15个数据集中随机选取其中3个数据集编号并组成测试集T,剩余数据集组成训练集D,记测试集T由nt个数据集组成。
S40:寻优BP神经网络超参数并初始化,创建一个三层BP神经网络,找到隐藏层最佳神经元个数,按照实际需要设定学习率、神经元激活函数、训练最小均方误差目标、训练最小性能梯度及最大训练次数等。
较优地,如图2所示,所述寻优BP神经网络超参数并初始化包括:
S41:创建一个三层BP神经网络,分别为输入层、隐藏层和输出层,输入层神经元个数为4,输出层神经元个数为1。
S42:隐藏层神经元个数设定范围在0.75×4到5×4之间(包括两个端点值3和20);依次设定隐藏层神经元个数为所述隐藏层神经元个数设定范围内的所有整数,按遍历搜索的方式寻找隐藏层最佳神经元个数。
较优地,此处寻找隐藏层最佳神经元个数过程中每次BP神经网络的训练中,训练集均为从所述训练集D中随机抽取其中的20%组成训练集Dp,测试集均为从所述测试集T中随机抽取其中一个数据集组成测试集Tp;隐藏层神经元个数从设置为3开始,利用所述训练集Dp进行第一次训练,训练完成后预测所述测试集Tp的数据,将所述测试集Tp的预测值与实验值进行对比,计算出均方根误差RMSE01,重新初始化所有权值和阈值并利用所述训练集Dp进行第二次训练,训练完成后预测所述测试集Tp的数据,将所述测试集Tp的预测值与实验值进行对比,计算出均方根误差RMSE02,重新初始化所有权值和阈值并利用所述训练集Dp进行第三次训练,训练完成后预测所述测试集Tp的数据,将所述测试集Tp的预测值与实验值进行对比,计算出均方根误差RMSE03,比较RMSE01、RMSE02和RMSE03的大小,得到其中的最小值RMSE(1)作为BP神经网络隐藏层神经元个数为3时所对应的该模型预测效果;重复上述步骤找到BP神经网络隐藏层神经元个数分别为4、5、6……20时所对应的RMSE(2)、RMSE(3)…RMSE(18),找出RMSE(1)、RMSE(2)…RMSE(18)中的最小值RMSEm所对应的隐藏层神经元个数nn,则BP神经网络隐藏层最优神经元个数为nn,若有多个隐藏层神经元个数所对应的模型预测效果为RMSEm,则取其中隐藏层神经元个数最少的个数作为BP神经网络隐藏层最优神经元个数。
S43:以隐藏层神经元个数为nn,创建一个三层BP神经网络,利用高斯分布随机数初始化BP神经网络的所有权值和阈值;学习率初始化为0.01;所有神经元激活函数均采用tansig;训练最小均方误差目标设置为1e-3;训练最小性能梯度设置为1e-6;最大训练次数设置为50000;训练算法选取贝叶斯正则化算法。
S50:BP神经网络第一次训练,训练出泛化能力满足用户实际需求的BP神经网络所有权值和阈值,若该BP神经网络经第一次训练后,该BP神经网络泛化能力满足用户实际需,则该BP神经网络训练完成,可直接用于预测橡木激光切割系统不同参数下的切口宽度,否则,对该BP神经网络进行第二次训练。
较优地,如图3所示,所述BP神经网络第一次训练包括如下步骤:
S51:根据步骤d的寻优结果创建BP神经网络并进行超参数初始化;
S52:从所述测试集T中编号为2的数据集中随机抽取50%的样本数据组成数据集T1,从所述测试集T中抽取除编号为1的数据集和编号为2的数据集外的其他样本数据组成数据集T2,所述测试集T中除去所述数据集T1和所述数据集T2外剩余的样本数据组成训练集D”,将所述数据集T1、所述数据集T2和所述训练集D组成训练集D';
S53:利用所述训练集D'通过贝叶斯正则化算法对步骤S51所创建的BP神经网络进行训练,直至满足训练均方误差达到训练最小均方误差目标或训练性能梯度达到训练最小性能梯度或训练次数达到最大训练次数中任意一条训练结束条件后,完成该BP神经网络的第一次训练;
S54:该BP神经网络的第一次训练完成后,利用该完成第一次训练的BP神经网络分别对所述测试集T中nt个数据集分别对其中数据样本进行预测得到预测值,并将该预测值与对应的实验值进行对比,按所述测试集T中nt个数据集的编号顺序计算nt个数据集的预测值对应其实验值的均方根误差RMSE_1、RMSE_2…RMSE_nt及可决系数(亦称确定系数)R^2_1、R^2_2…R^2_nt;
S55:根据RMSE_2、RMSE_3…RMSE_nt结合R^2_2、R^2_3…R^2_nt判断完成第一次训练的BP神经网络的训练结果是否过拟合及过拟合程度,并根据RMSE_1和R^2_1判断完成第一次训练的BP神经网络的泛化能力;若完成第一次训练的BP神经网络满足用户要求的过拟合和泛化能力要求,则保存该完成第一次训练的BP神经网络的所有权值W和阈值B,该BP神经网络训练完成,可直接用于预测橡木激光切割系统不同参数下的切口宽度,否则,对该BP神经网络进行第二次训练。
S60:BP神经网络第二次训练,通过微调,增强BP神经网络经第一次训练后的泛化能力,使该BP神经网络泛化能力满足用户实际需,若该BP神经网络泛化能力仍未满足用户实际需,则重新执行步骤S10,增加实验样本数量从而增大所述训练集D,并继续执行步骤S20至步骤S60直至完成第二次训练的BP神经网络泛化能力满足用户实际需,此时BP神经网络训练完成。
较优地,所述BP神经网络第二次训练包括:
对BP神经网络在完成第一次训练的基础上,利用训练集D”对该BP神经网络的权值和阈值通过BP算法进行微调,从而增强该BP神经网络的泛化能力。
S70:BP神经网络训练完成,预测橡木激光切割系统不同参数下的切口宽度。
另一实施例
一种应用上述的方法的应用系统,其包括:包括数据录入模块、数据预处理模块、数据分组模块、BP神经网络超参数设定模块、神经网络训练模块和执行预测模块;
数据录入模块:用于向所述应用系统中输入N个实验样本的五维实验数据及其对应实验结果;
数据预处理模块:对数据录入模块所获取到的已标定五维数据集利用PCA降维一维,并进行归一化处理,得到已标定四维数据集;
数据分组模块:将所述已标定四维数据集分为训练集和测试集两类数据;
BP神经网络超参数设定模块:创建一个三层BP神经网络,找到隐藏层最佳神经元个数,按照实际需要设定学习率、神经元激活函数、训练最小均方误差目标、训练最小性能梯度及最大训练次数等;
神经网络训练模块:训练出泛化能力满足用户实际需求的BP神经网络所有权值和阈值,若该BP神经网络经第一次训练后,该BP神经网络泛化能力满足用户实际需,则该BP神经网络训练完成,否则,对该BP神经网络进行第二次训练;BP神经网络第二次训练通过微调,增强BP神经网络经第一次训练后的泛化能力,使该BP神经网络泛化能力满足用户实际需,若该BP神经网络泛化能力仍未满足用户实际需,向所述应用系统中输入更多实验样本的五维实验数据及其对应实验结果,从而增大BP神经网络的训练集,并按上述步骤重新训练BP神经网络,直至其泛化能力满足用户实际需,BP神经网络训练完成;
执行预测模块:预测橡木激光切割系统不同参数下的切口宽度。
本发明的一种结合PCA的BP神经网络回归模型训练及测试方法,主要通过对所获取的数据进行归一化及PCA降低数据冗余,将获取到的所有数据合理划分为训练集和测试集并在BP神经网络训练中充分利用,寻优并初始化BP神经网络超参数,利用贝叶斯正则化算法进行权值和阈值的训练,结合迁移学习思想对完成第一次训练的BP神经网络进行微调,实现了在训练集数据过于集中或过少的情况下对BP神经网络的训练效果(泛化能力)有所提高。
以上结合具体实施例描述了本发明的技术原理。这些描述只是为了解释本发明的原理,而不能以任何方式解释为对本发明保护范围的限制。基于此处的解释,本领域的技术人员不需要付出创造性的劳动即可联想到本发明的其它具体实施方式,这些方式都将落入本发明的保护范围之内。

Claims (5)

1.一种BP神经网络回归模型的训练测试方法,用于橡木激光切割系统切口宽度预测,其特征在于,包括如下步骤:
a.获取数据:得到N个实验样本的已标定五维数据集R,其中一共包含M组实验数据及其对应实验结果;
b.数据预处理:对所述已标定五维数据集R利用PCA降维一维,并进行归一化处理,得到已标定四维数据集S;
c.数据分组:将所述已标定四维数据集S分为训练集D和测试集T两类数据;
d.寻优BP神经网络超参数并初始化:创建一个三层BP神经网络,找到隐藏层最佳神经元个数,按照实际需要设定学习率、神经元激活函数、训练最小均方误差目标、训练最小性能梯度及最大训练次数等;
e.BP神经网络第一次训练:训练出泛化能力满足用户实际需求的BP神经网络所有权值和阈值,若该BP神经网络经第一次训练后,该BP神经网络泛化能力满足用户实际需,则该BP神经网络训练完成,直接用于预测橡木激光切割系统不同参数下的切口宽度,否则,对该BP神经网络进行第二次训练;
f.BP神经网络第二次训练:通过微调,增强BP神经网络经第一次训练后的泛化能力,使该BP神经网络泛化能力满足用户实际需,若该BP神经网络泛化能力仍未满足用户实际需,则重新执行步骤a,增加实验样本数量从而增大所述训练集D,并继续执行步骤b至步骤f直至完成第二次训练的BP神经网络泛化能力满足用户实际需,此时BP神经网络训练完成;
g.BP神经网络训练完成,预测橡木激光切割系统不同参数下的切口宽度;
所述步骤b中数据预处理包括如下步骤:
b1.定义所述已标定五维数据集R中的第一维为激光能量,记为x;第二维为切割速度,记为y;第三维为离焦量,记为z;第四维为橡木含水率,记为r1;第五维为橡木气干密度,记为r2
b2.分别对所述已标定五维数据集R求解每一维上的均值和方差,并对所述已标定五维数据集R中每一组的实验数据分别减去对应维数上的均值,组成行数为M、列数为5的样本矩阵Q;
b3.求解所述已标定五维数据集R的五维协方差矩阵K,即:
b4.求解所述五维协方差矩阵K的5个特征值γ1、γ2、γ3、γ4、γ5,由大到小排序获得其中前四个特征值γ1'、γ2'、γ3'、γ4',并求解所述五维协方差矩阵K分别对应γ1'、γ2'、γ3'、γ4'的特征向量β1、β2、β3、β4,所述特征向量β1、β2、β3、β4均为单位化的五维列向量,并组成映射矩阵T=[β1,β2,β3,β4];
b5.将所述样本矩阵Q和映射矩阵T相乘获得矩阵Y,所述矩阵Y中的每一行即为所述已标定五维数据集R降维一维后的一组实验数据,从而获得已标定四维数据集S;
b6.对所述已标定四维数据集S进行归一化处理为均值为0方差为1的数据;
所述步骤d中寻优BP神经网络超参数并初始化包括:
创建一个三层BP神经网络,分别为输入层、隐藏层和输出层,输入层神经元个数为4,输出层神经元个数为1;
隐藏层神经元个数设定范围在0.75×4到5×4之间(包括两个端点值3和20);依次设定隐藏层神经元个数为所述隐藏层神经元个数设定范围内的所有整数,按遍历搜索的方式寻找隐藏层最佳神经元个数,此处寻找隐藏层最佳神经元个数过程中每次BP神经网络的训练中,训练集均为从所述训练集D中随机抽取其中的20%组成训练集Dp,测试集均为从所述测试集T中随机抽取其中一个数据集组成测试集Tp;隐藏层神经元个数从设置为3开始,利用所述训练集Dp进行第一次训练,训练完成后预测所述测试集Tp的数据,将所述测试集Tp的预测值与实验值进行对比,计算出均方根误差RMSE01,重新初始化所有权值和阈值并利用所述训练集Dp进行第二次训练,训练完成后预测所述测试集Tp的数据,将所述测试集Tp的预测值与实验值进行对比,计算出均方根误差RMSE02,重新初始化所有权值和阈值并利用所述训练集Dp进行第三次训练,训练完成后预测所述测试集Tp的数据,将所述测试集Tp的预测值与实验值进行对比,计算出均方根误差RMSE03,比较RMSE01、RMSE02和RMSE03的大小,得到其中的最小值RMSE(1)作为BP神经网络隐藏层神经元个数为3时所对应的该模型预测效果;重复上述步骤找到BP神经网络隐藏层神经元个数分别为4、5、6……20时所对应的RMSE(2)、RMSE(3)…RMSE(18),找出RMSE(1)、RMSE(2)…RMSE(18)中的最小值RMSEm所对应的隐藏层神经元个数nn,则BP神经网络隐藏层最优神经元个数为nn,若有多个隐藏层神经元个数所对应的模型预测效果为RMSEm,则取其中隐藏层神经元个数最少的个数作为BP神经网络隐藏层最优神经元个数;
以隐藏层神经元个数为nn,创建一个三层BP神经网络,利用高斯分布随机数初始化BP神经网络的所有权值和阈值;学习率初始化为0.01;所有神经元激活函数均采用tansig;训练最小均方误差目标设置为1e-3;训练最小性能梯度设置为1e-6;最大训练次数设置为50000;训练算法选取贝叶斯正则化算法;
所述步骤e中BP神经网络第一次训练包括如下步骤:
e1.根据步骤d的寻优结果创建BP神经网络并进行超参数初始化;
e2.从所述测试集T中编号为2的数据集中随机抽取50%的样本数据组成数据集T1,从所述测试集T中抽取除编号为1的数据集和编号为2的数据集外的其他样本数据组成数据集T2,所述测试集T中除去所述数据集T1和所述数据集T2外剩余的样本数据组成训练集D”,将所述数据集T1、所述数据集T2和所述训练集D组成训练集D';
e3.利用所述训练集D'通过贝叶斯正则化算法对步骤e1所创建的BP神经网络进行训练,直至满足训练均方误差达到训练最小均方误差目标或训练性能梯度达到训练最小性能梯度或训练次数达到最大训练次数中任意一条训练结束条件后,完成该BP神经网络的第一次训练;
e4.该BP神经网络的第一次训练完成后,利用该完成第一次训练的BP神经网络分别对所述测试集T中nt个数据集分别对其中数据样本进行预测得到预测值,并将该预测值与对应的实验值进行对比,按所述测试集T中nt个数据集的编号顺序计算nt个数据集的预测值对应其实验值的均方根误差RMSE_1、RMSE_2…RMSE_nt及可决系数(亦称确定系数)R^2_1、R^2_2…R^2_nt;
e5.根据RMSE_2、RMSE_3…RMSE_nt结合R^2_2、R^2_3…R^2_nt判断完成第一次训练的BP神经网络的训练结果是否过拟合及过拟合程度,并根据RMSE_1和R^2_1判断完成第一次训练的BP神经网络的泛化能力;若完成第一次训练的BP神经网络满足用户要求的过拟合和泛化能力要求,则保存该完成第一次训练的BP神经网络的所有权值W和阈值B,该BP神经网络训练完成,可直接用于预测橡木激光切割系统不同参数下的切口宽度,否则,对该BP神经网络进行第二次训练。
2.根据权利要求1所述的BP神经网络回归模型的训练测试方法,用于橡木激光切割系统切口宽度预测,其特征在于,所述步骤a中获取数据包括:
对于橡木激光切割系统获取在不同的激光能量、切割速度、离焦量、橡木含水率、橡木气干密度情况下的切口宽度,由此得到由N个实验样本组成的已标定五维数据集R,其中一共包含M组实验数据。
3.根据权利要求1所述的BP神经网络回归模型的训练测试方法,用于橡木激光切割系统切口宽度预测,其特征在于,所述步骤c中数据分组包括:
将所述已标定四维数据集S分为训练集和测试集两类数据,具体为:
将已标定四维数据集S按照原来N个实验样本的分组方式分为N个数据集,选取其中0.3×N个数据集编号并组成测试集T,剩余数据集组成训练集D,其中0.3×N取不大于其具体值的最大整数;若N小于10,则将该N个数据集里的M组实验数据随机的划分成15个数据集,在该15个数据集中随机选取其中3个数据集编号并组成测试集T,剩余数据集组成训练集D,记测试集T由nt个数据集组成。
4.根据权利要求1所述的BP神经网络回归模型的训练测试方法,用于橡木激光切割系统切口宽度预测,其特征在于,所述步骤f中BP神经网络第二次训练包括:
对BP神经网络在完成第一次训练的基础上,利用训练集D”对该BP神经网络的权值和阈值通过BP算法进行微调,从而增强该BP神经网络的泛化能力。
5.一种应用权利要求1-4中任意一项所述的方法的应用系统,其特征在于,包括数据录入模块、数据预处理模块、数据分组模块、BP神经网络超参数设定模块、神经网络训练模块和执行预测模块;
数据录入模块:用于向所述应用系统中输入N个实验样本的五维实验数据及其对应实验结果;
数据预处理模块:对数据录入模块所获取到的已标定五维数据集利用PCA降维一维,并进行归一化处理,得到已标定四维数据集;
数据分组模块:将所述已标定四维数据集分为训练集和测试集两类数据;
BP神经网络超参数设定模块:创建一个三层BP神经网络,找到隐藏层最佳神经元个数,按照实际需要设定学习率、神经元激活函数、训练最小均方误差目标、训练最小性能梯度及最大训练次数等;
神经网络训练模块:训练出泛化能力满足用户实际需求的BP神经网络所有权值和阈值,若该BP神经网络经第一次训练后,该BP神经网络泛化能力满足用户实际需,则该BP神经网络训练完成,否则,对该BP神经网络进行第二次训练;BP神经网络第二次训练通过微调,增强BP神经网络经第一次训练后的泛化能力,使该BP神经网络泛化能力满足用户实际需,若该BP神经网络泛化能力仍未满足用户实际需,向所述应用系统中输入更多实验样本的五维实验数据及其对应实验结果,从而增大BP神经网络的训练集,并按上述步骤重新训练BP神经网络,直至其泛化能力满足用户实际需,BP神经网络训练完成;
执行预测模块:预测橡木激光切割系统不同参数下的切口宽度。
CN201710749951.2A 2017-08-28 2017-08-28 一种bp神经网络回归模型的训练测试方法及其应用系统 Expired - Fee Related CN107633301B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710749951.2A CN107633301B (zh) 2017-08-28 2017-08-28 一种bp神经网络回归模型的训练测试方法及其应用系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710749951.2A CN107633301B (zh) 2017-08-28 2017-08-28 一种bp神经网络回归模型的训练测试方法及其应用系统

Publications (2)

Publication Number Publication Date
CN107633301A CN107633301A (zh) 2018-01-26
CN107633301B true CN107633301B (zh) 2018-10-19

Family

ID=61100144

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710749951.2A Expired - Fee Related CN107633301B (zh) 2017-08-28 2017-08-28 一种bp神经网络回归模型的训练测试方法及其应用系统

Country Status (1)

Country Link
CN (1) CN107633301B (zh)

Families Citing this family (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108961346B (zh) * 2018-08-08 2022-02-18 浙江工商大学 基于bp神经网络对颜色和谐度进行预测的方法
CN109359722A (zh) * 2018-09-25 2019-02-19 北京工业大学 一种仿脑非常态工作状态的神经网络及电路设计方法
CN109356652B (zh) * 2018-10-12 2020-06-09 深圳市翌日科技有限公司 一种矿井下自适应的火灾分级预警方法及系统
CN109508455B (zh) * 2018-10-18 2021-11-19 山西大学 一种GloVe超参数调优方法
CN109635831B (zh) * 2018-10-30 2023-04-25 成都大超科技有限公司 一种锂离子电池正极材料电压性能预测方法
CN111407279A (zh) * 2019-01-07 2020-07-14 四川锦江电子科技有限公司 一种基于神经网络的磁电结合定位追踪方法及装置
CN110363232B (zh) * 2019-06-27 2022-09-27 南京理工大学 基于bp神经网络的毫米波探测器干扰效果评估方法
CN112348159A (zh) * 2019-08-07 2021-02-09 青岛鼎信通讯股份有限公司 一种故障电弧神经网络优化训练方法
CN110728360B (zh) * 2019-10-12 2020-07-03 联合微电子中心有限责任公司 一种基于bp神经网络的微能源器件能量识别方法
CN111755120B (zh) * 2020-06-29 2023-07-21 西南民族大学 一种基于边缘智能和多模感知的认知障碍预测方法
CN112949203B (zh) * 2021-03-19 2023-02-21 福州大学 一种基于电参数和xgboost-nn算法的板材激光切割质量判断方法
CN113421176B (zh) * 2021-07-16 2022-11-01 昆明学院 一种学生成绩分数中异常数据智能筛选方法
CN114936413B (zh) * 2022-04-21 2023-06-06 哈尔滨工程大学 船体外形优化神经网络建模方法及船体外形优化方法
CN114732373B (zh) * 2022-06-13 2022-12-02 深圳市奋达智能技术有限公司 基于步态检测的步行活动卡路里消耗计算方法及装置
CN115222125B (zh) * 2022-07-15 2024-03-12 应急管理部国家自然灾害防治研究院 基于深度学习神经网络的地震死亡人数预测方法及系统
CN116759031B (zh) * 2023-08-10 2024-01-26 内蒙古工业大学 一种基于ann的污泥灰混凝土材料配合比的设计方法
CN117892640B (zh) * 2024-03-15 2024-05-24 成都航空职业技术学院 一种激光器控制方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1410774A (zh) * 2002-11-29 2003-04-16 清华大学 基于主成分分析和神经元网络的两相流相浓度测量方法
CN106023065A (zh) * 2016-05-13 2016-10-12 中国矿业大学 一种基于深度卷积神经网络的张量型高光谱图像光谱-空间降维方法
CN106355249A (zh) * 2016-08-29 2017-01-25 国网江苏省电力公司电力科学研究院 一种基于bp神经网络的继电保护设备状态识别方法
CN106845510A (zh) * 2016-11-07 2017-06-13 中国传媒大学 基于深度层级特征融合的中国传统视觉文化符号识别方法

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20180330056A1 (en) * 2015-07-02 2018-11-15 Indevr Inc. Methods of Processing and Classifying Microarray Data for the Detection and Characterization of Pathogens
CN105354611B (zh) * 2015-10-08 2018-01-09 程涛 一种基于人工神经网络的最佳质量图像扫描方法及系统
CN106203625B (zh) * 2016-06-29 2019-08-02 中国电子科技集团公司第二十八研究所 一种基于多重预训练的深层神经网络训练方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1410774A (zh) * 2002-11-29 2003-04-16 清华大学 基于主成分分析和神经元网络的两相流相浓度测量方法
CN106023065A (zh) * 2016-05-13 2016-10-12 中国矿业大学 一种基于深度卷积神经网络的张量型高光谱图像光谱-空间降维方法
CN106355249A (zh) * 2016-08-29 2017-01-25 国网江苏省电力公司电力科学研究院 一种基于bp神经网络的继电保护设备状态识别方法
CN106845510A (zh) * 2016-11-07 2017-06-13 中国传媒大学 基于深度层级特征融合的中国传统视觉文化符号识别方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
基于BP神经网络的光纤激光切割切口粗糙度预测;郭华锋等;《激光技术》;20141130;第38卷(第6期);第798-803页 *

Also Published As

Publication number Publication date
CN107633301A (zh) 2018-01-26

Similar Documents

Publication Publication Date Title
CN107633301B (zh) 一种bp神经网络回归模型的训练测试方法及其应用系统
CN109215028A (zh) 一种基于卷积神经网络的多目标优化图像质量评估方法
Guthikonda Kohonen self-organizing maps
Wang et al. Correlation aware multi-step ahead wind speed forecasting with heteroscedastic multi-kernel learning
CN110046710A (zh) 一种神经网络的非线性函数极值优化方法及系统
US20210334658A1 (en) Method for performing clustering on power system operation modes based on sparse autoencoder
Ueno et al. Computerized adaptive testing based on decision tree
CN106656357B (zh) 一种工频通信信道状态评估系统和方法
CN105046376A (zh) 考虑指标相关性的水库群防洪调度方案优选方法
CN112614552B (zh) 基于bp神经网络的土壤重金属含量预测方法及系统
CN107092987A (zh) 一种中小型无人机自主着舰风速预测方法
Leauprasert et al. Intelligent machine learning techniques for condition assessment of power transformers
CN117436929A (zh) 一种用于用户复购行为的预测方法及其装置
CN114781503A (zh) 一种基于深度特征融合的点击率预估方法
Viktorovich et al. Predicting sales prices of the houses using regression methods of machine learning
CN107392315A (zh) 一种优化大脑情感学习模型的方法
CN117932934A (zh) 一种基于态势的无人集群协同效能动态评估方法
Lizhe et al. BP network model optimized by adaptive genetic algorithms and the application on quality evaluation for class teaching
CN115454988B (zh) 基于随机森林网络的卫星电源系统缺失数据补全方法
RU2725789C1 (ru) Способ обработки массивов аналоговых сигналов
Yang et al. An improved probabilistic neural network with ga optimization
CN112651628A (zh) 一种基于胶囊神经网络的电力系统暂态稳定评估方法
CN104537665A (zh) 基于多局部搜索的遗传聚类图像分割方法
Zhang et al. Evaluation of Multimedia Physical Education Quality in Colleges and Universities Oriented to Data Assimilation
Xu-hui et al. Notice of violation of IEEE publication principles: efficient technique to accelerate neural network training by freezing hidden layers

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20181019

Termination date: 20200828