具体实施方式
本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”、“第三”、“第四”等(如果存在)是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的实施例能够以除了在这里图示或描述的内容以外的顺序实施。此外,术语“包括”或“具有”及其任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
为便于理解,下面对本发明实施例的具体流程进行描述,请参阅图1,本发明实施例的纸板线湿部生产速度预测模型构建方法包括:
S101、获取样本数据集,并对样本数据集进行预处理,得到处理后数据集,并将处理后数据集划分为训练集和测试集。
S102、构建BP神经网络模型,并将训练集输入BP神经网络模型进行训练,并寻优BP神经网络模型的超参数,得到训练后的BP神经网络模型,并将测试集输入训练后的BP神经网络模型进行测试,得到第一测试结果。
S103、构建XGBOOST模型,并将训练集输入XGBOOST模型进行训练,并寻优XGBOOST模型的超参数,得到训练后的XGBOOST模型,并将测试集输入训练后的XGBOOST模型进行测试,得到第二测试结果。
S104、当第一测试结果和第二测试结果均符合预设准确率时,则基于训练后的BP神经网络模型和训练后的XGBOOST模型构建生产速度初始模型。
S105、寻优得到训练后的BP神经网络模型的最优权重a和训练后的XGBOOST模型的最优权重b,基于最优权重a和最优权重b优化生产速度初始模型,得到生产速度预测模型,其中,a∈(0,1),b=1-a。
可以理解地,为了更加精准地预测纸板线湿部生产速度,针对纸板线生产的纸板类型构建与纸板类型对应的纸板线湿部生产速度预测模型,构建与纸板类型对应的纸板线湿部生产速度预测模型时获取对应的纸板类型的样本数据集,例如,构建对应B瓦型瓦楞纸板的纸板线湿部生产速度预测模型时,获取纸板线湿部生产B瓦型瓦楞纸板时的样本数据集;构建对应BC瓦型瓦楞纸板的纸板线湿部生产速度预测模型时,获取纸板线湿部生产BC瓦型瓦楞纸板时的样本数据集。
本实施例提供的是一种纸板线湿部生产速度预测模型,其基于训练后的BP神经网络模型和训练后的XGBOOST模型构建生产速度初始模型;并寻优得到训练后的BP神经网络模型的最优权重a和训练后的XGBOOST模型的最优权重b,基于最优权重a和最优权重b得到生产速度预测模型,使得生产速度预测模型预测准确度更高,对纸板线湿部生产速度的预测更加精准。
在本实施例中,步骤S101的获取样本数据集,并对样本数据集进行预处理,得到处理后数据集,并将处理后数据集划分为训练集和测试集,包括:
S1011、获取样本数据集,并按照采样时间对样本数据集中的样本数据进行排序,得到预处理数据集。
获取样本数据集中的样本数据包括纸板线湿部设备生产参数,纸板线湿部设备生产参数可以通过采集纸板线湿部设备的各传感器的数据以及系统参数得到,在各传感器进行采集数据前,设定各传感器的采样间隔为同一采样间隔,例如可以设定采样间隔为1s。
各传感器采集的数据包括双面机上胶单元上层上胶量、双面机上胶单元下层上胶量、双面机段热板蒸汽压力、双面机段压板压力、双面机段热板蒸汽压力、双面机段压板压力、双面机段热板蒸汽压力、双面机段压板压力、双面机段压板压力、双面机冷段压板压力、生产速度,系统参数包括纸板材质,纸板材质采用one-hot编码。
在本实施例中,按照采样时间对样本数据集中的样本数据进行排序有利于进行后续处理,进行排序时,将样本数据集中所有的样本数据以采样时间为索引放入一张表中。
S1012、统一预处理数据集中的样本数据的数据类型,得到预设类型的时序生产数据集。
在本实施例中,可以根据各样本数据的数据类型和预设的统一数据模型,将各样本数据的数据类型转换为预设类型。
S1013、去除时序生产数据集中的异常数据和重复数据,得到处理后数据集。
在本实施例中,去除时序生产数据集中的异常数据和重复数据,得到处理后数据集包括:对时序生产数据集的生产速度数据进行滤波,得到滤波后数据;基于滤波后数据采用四分位距统计量方法筛选出不稳定区间值,并删除不稳定区间值内的所有参数,得到稳定数据集;去除稳定数据集中的样本数据的重复数据,得到处理后数据集。
具体地,采用二阶Butterworth滤波器高通滤波。
具体地,基于滤波后数据采用四分位距统计量方法筛选出不稳定区间值时,计算得出滤波后数据Q1=-0.000074,Q3=0.000064,IQR=0.000138。正常区间端点值为Q1-3×IQR=-0.000488,Q3-3×IQR=0.000478,正常区间值为(-0.000488,0.000478),正常区间范围外数据即为不稳定数据。
把筛选出的不稳定区间值与时序生产数据集对应,并删除不稳定区间值内的所有参数,即,记录下不稳定数据索引,删除索引对应的所有生产参数。
S1014、将处理后数据集划分为训练集和测试集。
作为举例说明,处理后数据集为70600,则训练集的数据为63540(90%),测试集的数据有7060(10%);数据集为179490,则训练集161541(90%),测试集17949(10%)。
本实施例中,通过去除生产速度不稳定的数据、异常区间的数据和重复数据使得训练样本的有效性更强。
在本实施例中,步骤S102的构建BP神经网络模型,并将训练集输入BP神经网络模型进行训练,并寻优BP神经网络模型的超参数,得到训练后的BP神经网络模型,并将测试集输入训练后的BP神经网络模型进行测试,得到第一测试结果,包括:
S1021、构建BP神经网络模型,并将训练集输入BP神经网络模型进行训练。
可以理解地,为了提高模型的预测精度,分别构建隐藏层为一层的BP神经网络模型和隐藏层为两层的BP神经网络模型,并采用同样的方法得到对应的训练后的BP神经网络模型。
训练时,输入参数为双面机上胶单元上层上胶量、双面机上胶单元下层上胶量、双面机段热板蒸汽压力、双面机段压板压力、双面机段热板蒸汽压力、双面机段压板压力、双面机段热板蒸汽压力、双面机段压板压力、双面机段压板压力、双面机冷段压板压力和纸板材质,纸板材质采用one-hot编码,输出参数为生产速度。
S1022、采用贝叶斯优化寻优BP神经网络模型的超参数,得到最优隐藏层神经元个数、最优优化器和最优学习率。
在本实施例中,将训练集输入BP神经网络模型进行训练,并输入测试集进行测试,再根据测试结果采用贝叶斯优化寻优BP神经网络模型的超参数,得到最优隐藏层神经元个数、最优优化器和最优学习率。
可以理解地,对于隐藏层为一层的BP神经网络模型的超参数主要包括隐藏层神经元个数、优化器和学习率,其它超参数采用默认值。
对于隐藏层为二层的BP神经网络模型的超参数主要包括第一层隐藏层神经元个数、第二层隐藏层神经元个数、优化器和学习率,其它超参数采用默认值。
作为举例说明,构建与B瓦型瓦楞纸板对应的纸板线湿部生产速度预测模型时,隐藏层为一层的BP神经网络模型的超参数设置范围如下:优化器寻优范围(Adam,RMSprop,SGD,AdamW),学习率寻优范围(1e-6,1e-3),隐藏层寻优范围(0,2000),损失函数为soomthl1loss,batch_size为64,迭代次数为4000,寻优次数为100。
采用贝叶斯优化寻优BP神经网络模型的超参数,得到的寻优结果为:最优隐藏层神经元个数:1421,最优优化器:Adam,最优学习率:1e-5。
隐藏层为两层的BP神经网络模型的超参数设置范围如下:
优化器寻优范围(Adam,RMSprop,SGD,AdamW),学习率寻优范围(1e-6,1e-3),第一层隐藏层寻优范围(0,2000),第二层隐藏层寻优范围(0,2000),损失函数为soomthl1loss,batch_size为64,迭代次数为3000,寻优次数为100。
采用贝叶斯优化寻优BP神经网络模型的超参数,得到的寻优结果为:第一层最优隐藏层神经元个数:471,第二层最优隐藏层神经元个数:910,最优优化器:Adam,最优学习率:1.524e-5。
构建与BC瓦型瓦楞纸板对应的纸板线湿部生产速度预测模型时,隐藏层为一层的BP神经网络模型的超参数设置范围如下:优化器寻优范围(Adam,RMSprop,SGD,AdamW),学习率寻优范围(1e-6,1e-3),隐藏层寻优范围(0,3000),损失函数为soomthl1loss,batch_size为256,迭代次数为5000,寻优次数为100。
采用贝叶斯优化寻优BP神经网络模型的超参数,得到的寻优结果为:最优隐藏层:2707,最优优化器:Adam,最优学习率:7.6996e-6。
隐藏层为两层的BP神经网络模型的超参数设置范围如下:优化器寻优范围(Adam,RMSprop,SGD,AdamW),学习率寻优范围(1e-6,1e-3),第一层隐藏层寻优范围(0,2000),第二层隐藏层寻优范围(0,3000),损失函数为soomthl1loss,batch_size为256,迭代次数为5000,寻优次数为100。
采用贝叶斯优化寻优BP神经网络模型的超参数,得到的寻优结果为:第一层最优隐藏层:868,第二层最优隐藏层:1863,最优优化器:Adam,最优学习率:1.1642e-5。
S1023、根据最优隐藏层神经元个数、最优优化器和最优学习率优化BP神经网络模型,得到训练后的BP神经网络模型。
S1024、将测试集输入训练后的BP神经网络模型进行测试,得到第一测试结果。
可以理解地,当BP神经网络模型的隐藏层为一层,获取第一测试结果A;当BP神经网络模型的隐藏层为两层,获取第一测试结果B。
构建与B瓦型瓦楞纸板对应的生产速度预测模型的测试结果如表1所示,构建与BC瓦型瓦楞纸板对应的生产速度预测模型时测试结果如表2所示。表1和表2中,MSE表示均方误差,RMSE表示均方根误差,MAE表示平均绝对误差,MAPE表示平均绝对百分比误差,误差值越小,表示模型的精确度越高。
在本实施例中,如表1所示,第一测试结果A的RMSE误差比第一测试结果B的RMSE误差小,即隐藏层为一层的BP神经网络模型的RMSE误差比隐藏层为两层的BP神经网络模型的RMSE误差小,因此选取隐藏层为一层的训练后的BP神经网络模型和训练后的XGBOOST模型构建生产速度初始模型。
表1与B瓦型瓦楞纸板对应的模型预测结果
表2与BC瓦型瓦楞纸板对应的模型预测结果
在本实施例中,将训练集输入BP神经网络模型进行训练,并输入测试集进行测试,再根据测试结果采用贝叶斯优化寻优BP神经网络模型的超参数,得到最优隐藏层神经元个数、最优优化器和最优学习率,并根据最优隐藏层神经元个数、最优优化器和最优学习率优化BP神经网络模型,得到训练后的BP神经网络模型,使得到训练后的BP神经网络模型预测精度更高,最后将测试集输入训练后的BP神经网络模型进行测试,得到第一测试结果。
在本实施例中,步骤S103的构建XGBOOST模型,并将训练集输入XGBOOST模型进行训练,并寻优XGBOOST模型的超参数,得到训练后的XGBOOST模型,并将测试集输入训练后的XGBOOST模型进行测试,得到第二测试结果,包括:
S1031、构建XGBOOST模型,并将训练集输入XGBOOST模型进行训练。
S1032、采用网格搜索寻优XGBOOST模型的超参数,得到最优最大深度,最优最小叶子节点样本权重,最优弱学习器个数和最优学习率。
在本实施例中,将训练集输入XGBOOST模型进行训练,并输入测试集进行测试,再根据测试结果采用网格搜索寻优XGBOOST的超参数,得到最优最大深度,最优最小叶子节点样本权重,最优弱学习器个数和最优学习率。
在本实施例中,作为举例说明,构建与B对应瓦型瓦楞纸板的纸板线湿部生产速度预测模型时,XGBOOST模型的超参数设置范围如下:
最大深度寻优范围(0,30)步长为1,最小叶子节点样本权重和寻优范围(2,15)步长为1,弱学习器个数寻优范围(0,5000)步长为1,学习率寻优范围(0.05,0.7)设置100份等差数列,损失函数为reg:squarederror,其他超参数均为默认值。
采用网格搜索寻优XGBOOST的超参数,得到寻优结果为:最优最大深度:23,最优最小叶子节点样本权重和:9,最优弱学习器个数:3361,最优学习率:0.573822。
构建与BC瓦型瓦楞纸板对应的纸板线湿部生产速度预测模型时,XGBOOST模型的超参数设置范围如下:
最大深度寻优范围(0,38)步长为1,最小叶子节点样本权重和寻优范围(2,15)步长为1,弱学习器个数寻优范围(0,10000)步长为10,学习率寻优范围(0.05,0.8)设置100份等差数列,损失函数为reg:squarederror,其他超参数均为默认值。
采用网格搜索寻优XGBOOST的超参数,得到寻优结果为:最优最大深度:35,最优最小叶子节点样本权重和:7,最优弱学习器个数:8000,最优学习率:0.712244。
S1033、根据最优最大深度、最优最小叶子节点样本权重、最优弱学习器个数和最优学习率优化XGBOOST模型,得到训练后的XGBOOST模型。
S1034、将测试集输入训练后的XGBOOST模型进行测试,得到第二测试结果。
在本实施例中,构建与B瓦型瓦楞纸板对应的生产速度预测模型的测试结果如表1所示,构建与BC瓦型瓦楞纸板对应的生产速度预测模型时测试结果如表2所示。
在本实施例中,将训练集输入XGBOOST模型进行训练,并输入测试集进行测试,再根据测试结果采用网格搜索寻优XGBOOST的超参数,得到最优最大深度,最优最小叶子节点样本权重,最优弱学习器个数和最优学习率,并根据得到最优最大深度,最优最小叶子节点样本权重,最优弱学习器个数和最优学习率优化XGBOOST模型,得到训练后的XGBOOST模型,使得到训练后的XGBOOST模型预测精度更高,最后将测试集输入训练后的XGBOOST模型进行测试,得到第二测试结果。
在本实施例中,步骤S105的寻优得到训练后的BP神经网络模型的最优权重a和训练后的XGBOOST模型的最优权重b,基于最优权重a和最优权重b优化生产速度初始模型,得到生产速度预测模型,包括:
S1051、将第一测试结果和第二测试结果加权求和,得到加权相加值。
可以理解地,由于选取了隐藏层为一层的训练后的BP神经网络模型和训练后的XGBOOST模型构建生产速度初始模型,因此,将第一测试结果和第二测试结果加权求和时,隐藏层为一层的训练后的BP神经网络模型对应的测试结果与训练后的XGBOOST模型的测试结果加权相加。
S1052、基于加权相加值采用粒子群算法对训练后的BP神经网络模型的权重a和训练后的XGBOOST模型的权重b寻优,得到与最小测试集误差对应的最优权重a和最优权重b。
在本实施例中,基于加权相加值采用粒子群算法寻优过程中,维度设置为1,种群个数为50,迭代次数为300,加速度常数分别为2,2,随机数分别为0.7,0.5,目标函数为加权相加值和测试集RMSE。寻优结果为:a=0.36,b=0.64。
S1053、基于最优权重a和最优权重b优化生产速度初始模型,得到生产速度预测模型。
在本实施例中,构建与B瓦型瓦楞纸板对应的生产速度预测模型的测试结果如表1所示,构建与BC瓦型瓦楞纸板对应的生产速度预测模型时测试结果如表2所示。
请参阅图1和图2所示,本发明实施例还提供了一种纸板线湿部生产速度预测方法,包括:
S201、获取纸板线生产的纸板类型。
纸板的类型可以预先配置,获取时可以通过系统参数获取。
S202、采集纸板线湿部设备的实时生产参数。
实时生产参数包括双面机上胶单元上层上胶量、双面机上胶单元下层上胶量、双面机段热板蒸汽压力、双面机段压板压力、双面机段热板蒸汽压力、双面机段压板压力、双面机段热板蒸汽压力、双面机段压板压力、双面机段压板压力、双面机冷段压板压力和纸板材质,纸板材质采用one-hot编码。
S203、将实时生产参数输入与纸板类型对应的生产速度预测模型,输出预测生产速度;生产速度预测模型的构建方法采用如上所述的生产速度预测模型构建方法。
可以理解地,利用生产速度预测模型进行预测时,通过训练后的BP神经网络模型得到第一预测值,通过训练后的XGBOOST模型得到第二预测值,再通过第一预测值和第二预测值加权相知得到生产速度预测值,例如,a=0.36,b=0.64,生产速度预测值=0.36*第一预测值+0.64*第二预测值。
本发明实施例的纸板线湿部生产速度预测方法通过构建生产速度预测模型,可有效预测不同原纸、温度、湿度等情况下的湿部生产速度,提高瓦楞纸板生产线在不同生产条件的适应性,优化生产过程提高效率。
以上所述,以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。