CN112951349A - 基于dnn神经网络的硅酸盐水泥熟料的强度预测方法 - Google Patents

基于dnn神经网络的硅酸盐水泥熟料的强度预测方法 Download PDF

Info

Publication number
CN112951349A
CN112951349A CN202110314662.6A CN202110314662A CN112951349A CN 112951349 A CN112951349 A CN 112951349A CN 202110314662 A CN202110314662 A CN 202110314662A CN 112951349 A CN112951349 A CN 112951349A
Authority
CN
China
Prior art keywords
neural network
clinker
strength
layer
portland cement
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202110314662.6A
Other languages
English (en)
Inventor
林国荣
段振洪
王真
胥坤泉
蔡照海
段文虎
赖德发
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhongsai Bangye Hangzhou Intelligent Technology Co ltd
Huzhou Huaikan South Cement Co ltd
Original Assignee
Zhongsai Bangye Hangzhou Intelligent Technology Co ltd
Huzhou Huaikan South Cement Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhongsai Bangye Hangzhou Intelligent Technology Co ltd, Huzhou Huaikan South Cement Co ltd filed Critical Zhongsai Bangye Hangzhou Intelligent Technology Co ltd
Priority to CN202110314662.6A priority Critical patent/CN112951349A/zh
Publication of CN112951349A publication Critical patent/CN112951349A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16CCOMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
    • G16C60/00Computational materials science, i.e. ICT specially adapted for investigating the physical or chemical properties of materials or phenomena associated with their design, synthesis, processing, characterisation or utilisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/048Activation functions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/084Backpropagation, e.g. using gradient descent
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16CCOMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
    • G16C20/00Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
    • G16C20/30Prediction of properties of chemical compounds, compositions or mixtures
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16CCOMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
    • G16C20/00Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
    • G16C20/70Machine learning, data mining or chemometrics

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Computing Systems (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Software Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • General Health & Medical Sciences (AREA)
  • Biophysics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Computational Linguistics (AREA)
  • Biomedical Technology (AREA)
  • Molecular Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Chemical & Material Sciences (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Databases & Information Systems (AREA)
  • Medical Informatics (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了基于DNN神经网络的硅酸盐水泥熟料的强度预测方法,包括如下步骤:S1,获取影响水泥熟料强度的因素;S2,神经网络模型选择,选取DNN神经网络模型;S3,数据量纲化处理;S4,构建神经网络模型,包括输入层、一组隐含层、输出层,输入层全连接隐含层,各层神经元仅与相邻层神经元之间相互全连接,同层内神经元之间无连接,各层神经元之间无反馈连接,将量纲化处理的数据作为输入变量,将强度值作为输出;有效提前对硅酸盐水泥熟料强度进行预测,以便为后续的水泥混合材掺入量提高提供有效的支撑依据,从而节省生产成本,提高企业利润。

Description

基于DNN神经网络的硅酸盐水泥熟料的强度预测方法
技术领域
本发明涉及神经网络技术领域,尤其是涉及了一种基于DNN神经网络的硅酸盐水泥熟料28天强度预测方法。
背景技术
硅酸盐水泥熟料28天强度的预测是一个多变量、非线性、大时滞、无固定模型的复杂问题。熟料中各种矿物质在水泥水化、硬化过程中进行了一系列复杂的化学反应,所以熟料中各种矿物质及相对含量对熟料强度的影响非常复杂,无法用简单的函数关系来表示。企业熟料28天强度需要等到28天人工化验得到,周期长,滞后时间长,无法预先调配混合材掺入量。因此需要找到影响熟料强度的主要因素,摸索并进一步完善适应生产工程实际的预测熟料28天强度的方法,建立合理的预测模型,从而可以及早发现水泥熟料的质量问题,及时调整生料配比、水泥配合比中混合材的掺加量,合理确定水泥粉磨细度和粉磨时间,使水泥生产过程处于科学控制状态,在确保出厂水泥的标号的同时,获得更高的市场收益和环境回报。
传统的回归预测算法如线性回归、最小二乘法等算法对该复杂场景预测精度不够,容易把高度非线性关系简化为线性关系,影响预测精度,DNN神经网络是一种基于误差反向传播的神经网络算法,也是目前应用最为广泛的神经网络算法之一。该网络能学习和存贮大量输入一输出模式映射关系。而无需事先了解描述这种映射关系的数学方程。只要能提供足够多的样本模式对供网络进行学习训练,它便能完成由n维输入空间到m维输出空间的非线性映射,从而获得较好的预测效果。因此,将DNN神经网络技术与硅酸盐水泥熟料28天强度预测场景结合,可以发挥AI先进技术与水泥掺入量调配融合的市场产品价值。
发明内容
为解决现有技术的不足,实现提高熟料预测精度的目的,本发明采用如下的技术方案:
基于DNN神经网络的硅酸盐水泥熟料的强度预测方法,包括如下步骤:
S1,获取影响水泥熟料强度的因素;
S2,神经网络模型选择,由于水泥强度预测是一个非线性、多变量、大时滞问题,利用传统的线性回归模型进行预测很难满足精度要求,因此选取DNN神经网络模型,该模型无需事先了解描述这种映射关系的数学方程,只要能提供足够多的样本模式对供网络进行学习训练,它便能完成由n维输入空间到m维输出空间的非线性映射,具有极强的非线性映射能力;
S3,数据量纲化处理;
S4,构建神经网络模型,包括输入层、一组隐含层、输出层,输入层全连接隐含层,各层神经元仅与相邻层神经元之间相互全连接,同层内神经元之间无连接,各层神经元之间无反馈连接,构成具有层次结构的前馈型神经网络系统,将量纲化处理的数据作为输入变量,将强度值作为输出;
单计算层前馈神经网络只能求解线性可分问题,能够求解非线性问题的网络必须是具有隐层的多层神经网络,构建的神经网络模型通过调节神经网络的层数、网络的拓扑结构以及神经元的参数,去改变对一个输入向量的不同数学维度上的处理方式,进而达成不同的训练目的;
S5,训练神经网络模型;
S6,神经网络模型的预测。
进一步地,所述步骤S4中,为了防止模型的过拟合,采用正则化方法,用于约束神经网络的权重参数,从而让模型变得简单,减少过拟合,得到结构风险最小化的损失函数,公式如下:
Figure BDA0002990664230000021
p∈{1,2},λ表示正则化系数,N表示样本数量,
Figure BDA0002990664230000022
()表示损失函数,y(n)表示样本的输出,x(n)表示样本,f()表示经验风险项,θ表示正则化参数,l()是惩罚函数,λl()构成了正则项,通过使用正则化方法,增加正则化系数λ,使得最佳的损失函数最小化。
进一步地,所述正则化方法,包括L1和L2正则化方法,将权重参数的L1范数或L2范数或二者同时加入到结构风险最小化的损失函数中,L1范数,使得权重参数是稀疏的,即权重矩阵中部分权重参数为0,由于L1范数在取得最小值处是不可导的,这会给后续求梯度带来麻烦,因此在实际操作中,选择L2正则化,L2范数,使部分权重参数在最小阈值的范围内。
进一步地,所述步骤S4中,随着网络层数的增加,拓扑结构的复杂,随之而来也会带来整个神经网络的副作用和难题,比如容易陷入局部最优解,梯度消失严重等问题,为了防止模型的过拟合,采用Dropout方法,随机去掉部分神经元,在一个密集的(或全连接的)网络中,对于每一层,给出了一个Dropout的概率p,在每次迭代中,每个神经元被去掉的概率为p。
进一步地,所述步骤S4中,采用ReLU作为神经网络的激活函数,用于神经网络中神经元与神经元连接的中间部分,即隐含层与隐含层之间,表达式如下:
f(x)=max(0,x)
定义了神经元在线性变换之后的非线性输出结果,即对于进入神经元的来自上一层神经网络的输入向量x,使用ReLU激活函数的神经元,输出最大值max(),至下一层神经元或作为整个神经网络的输出,ReLU激活函数可以对抗梯度爆炸/消失问题,计算效率也很高,所述x是神经元与权重相乘的加权和。
进一步地,所述步骤S5中,将样本数据分为训练集和测试集,损失函数采用均方误差,对预测结果的评估,表示预测结果的准确度,误差大小,采用优化器adam对神经网络模型的权重参数进行优化,选择最佳的模型参数,达到预测误差效果,即通过调参,调节到适合的权重,使均方误差最小,指定批数量和迭代次数,对神经网络模型进行训练,神经网络对样本数据集进行小批量划分,优化器、批数量用于神经网络的所有批处理中,均方误差公式如下:
Figure BDA0002990664230000031
其中,MSE表示均方误差,将真实值与预测值的差值的平方然后求和平均,
Figure BDA0002990664230000032
表示真实值,yi表示预测值,通过训练集和测试集的损失曲线判断模型效果,当训练集和测试集两条损失曲线比较靠近,说明模型未发生过拟合,模型效果较好。
进一步地,所述步骤S6中,通过绝对误差衡量测量值对真值偏离的绝对大小,通过平均绝对误差,作为所有单个观测值与算术平均值的偏差的绝对值的平均,避免误差相互抵消的问题,准确反映实际预测误差的大小。
进一步地,所述步骤S1中的影响因素是熟料的化学成分及三率值,所述化学成分包括熟料烧矢量Loss、熟料游离钙F_Cao、熟料氧化钙CaO、熟料氧化硅SiO2、熟料氧化铝A1203、熟料氧化铁Fe2O3、熟料氧化镁MgO,所述三率值包括饱和比系数KH、熟料硅率SM、熟料铝率IM。
进一步地,所述化学成分还包括熟料三氧化硫SO3,所述三率值还包括扣除氧化钙的熟料饱和比系数KH_f,通过化学成分计算各率值:
KH=round((Cao-1.65*Al2O3-0.35*Fe2O3)/(2.8*Sio2),3)
KH_f=round(KH-(F_Cao/(2.8*Sio2)),3)
SM=round(Sio2/(Al2O3+Fe2O3),3)
IM=round(Al2O3/Fe2O3,3)
通过化学成分、饱和比系数计算矿物组成:
C3S=3.8*(3*KH-2)*SiO2
C2S=8.61*(1-KH)*SiO2
C3A=2.65*(Al2O3-0.64*Fe2O3)
C4AF=3.04*Fe2O3
得到熟料硅酸3钙C3S、熟料硅酸2钙C2S、熟料铝酸三钙C3A、熟料铁铝酸四钙C4AF。
进一步地,所述步骤S3采用max-min归一化对影响因素的数据进行处理:
Figure BDA0002990664230000041
所述x表示影响因素的数据,xmax表示同一类影响因素中的最大值,xmin表示同一类影响因素中的最小值。
由于一些归一化方法对数据分布有要求,需要假设数据符合正态分布,但实际数据情况分布往往并非如此,因此选择max-min归一化方法消除量纲,同时也能加速网络收敛。
本发明的优势和有益效果在于:
通过采用DNN神经网络的非线性映射能力,构建能够更为准确的预测硅酸盐水泥熟料28天强度值的神经网络模型,将神经网络技术融入实际的生产预测,从而简化了复杂的熟料强度影响因素与熟料强度的对应关系,避免了28天的人工化验周期,且预测结果更为贴近真实值,从而可以及早发现水泥熟料的质量问题,及时调整生料配比、水泥配合比中混合材的掺加量,合理确定水泥粉磨细度和粉磨时间,使水泥生产过程处于科学控制状态,在确保出厂水泥的标号的同时,获得更高的市场收益和环境回报。
附图说明
图1是本发明中需要归一化处理的数据信息图。
图2是本发明中DNN神经网络模型架构图。
图3a是本发明中普通的神经网络模型图。
图3b是本发明中图采用Dropout后的神经网络模型图。
图4是本发明中激活函数表达式曲线图。
图5是本发明中训练集损失曲线和测试集损失曲线比较图。
图6是本发明中熟料28天强度预测值与真实值效果图。
具体实施方式
以下结合附图对本发明的具体实施方式进行详细说明。应当理解的是,此处所描述的具体实施方式仅用于说明和解释本发明,并不用于限制本发明。
硅酸盐水泥熟料是由主要含cao、sio2、A12o3、Fe2o3的原料按适当比例磨成细粉烧到部分熔融所得以硅酸三钙、硅酸二钙、铝酸三钙和铁铝酸四钙为主要矿物成分的水硬性胶凝性物质。硅酸盐水泥熟料再加上适量的石膏共同磨细后,即制作成硅酸盐水泥。在硅酸盐水泥制作这个过程中,硅酸盐水泥熟料强度是水泥生产企业的立根之本,水泥熟料强度低,所生产出的水泥强度等级就不会高,水泥混合材掺入量就变少,这使得生产成本必然升高,利润空间大幅降低,因此,有效提高水泥熟料强度,就等于降低生产成本,增加企业市场竞争力。水泥熟料强度既是水泥生产质量控制的一个重要参数,同时也是衡量水泥厂技术、质量控制部门管理水平的一个重要标志。熟料强度对水泥强度起着决定性的作用。通过人工物理检验熟料抗压强度。需等到28天才能进行得到,存在着明显的大滞后的问题。由于水泥生产是一个连续过程,如果能提前对熟料强度进行预测,将有利于对水泥粉磨配比进行灵活调整,对水泥生产的“均衡稳定”也有着积极的意义。
因此提出了一种基于DNN神经网络的硅酸盐水泥熟料28天强度预测方法,包括如下步骤:
1、影响因素变量选择
影响水泥熟料强度的因素很多。如矿物组成、数量、化学成分、熟料的烧结状况、熟料矿物晶体的晶型。目前的强度预测模型主要建立在熟料化学成分与抗压强度基础上,熟料化学成分主要由Loss、SiO2、A1203、Fe203、CaO、MgO、f-Ca0 7个因素组成。熟料三率值主要由饱和比(KH)、硅率(SM)、铝率(IM)组成,皆由熟料化学成分计算而得。在游离钙较低的情况下,饱和比越高,C3S含量越高,对水泥熟料早期和后期强度贡献都比较大。硅率(SM)值越高,表示硅酸盐矿物多搭剂矿物少,对熟料强度有利。铝率(IM)反映了熟料中C3A和C4AF的相对含量,也反映煅烧过程中液相的性质,铝率越高对C3S的形成越有利。综上所述,我们选择如下影响因素作为建模的输入变量:
Figure BDA0002990664230000051
Figure BDA0002990664230000061
表1:水泥熟料28天强度预测影响因素表
注明:
化验室出窑熟料化学分析主要测量变量有Loss,sio2,Al2o3,Fe2o3,Mgo,cao,so3,fcao,其他化验分析由这些测量变量经过公式计算得到,如下:
(1)由化学成分、饱和比系数计算矿物组成:
C3S=3.8*(3*KH-2)*SiO2
C2S=8.61*(1-KH)*SiO2
C3A=2.65*(Al2O3-0.64*Fe2O3)
C4AF=3.04*Fe2O3
(2)由化学组成计算各率值:
KH=round((Cao-1.65*Al2O3-0.35*Fe2O3)/(2.8*Sio2),3)
KH_f=round(KH-(F_Cao/(2.8*Sio2)),3)
SM=round(Sio2/(Al2O3+Fe2O3),3)
IM=round(Al2O3/Fe2O3,3)
2、模型对比选择
水泥强度是水泥重要的物理力学性能之一,它是评定水泥质量好坏的一个重要指标,水泥强度的有效预测可以普遍提高水泥产品质量。影响水泥熟料强度的因素很多。如矿物组成、数量、化学成分、熟料的烧结状况、熟料矿物晶体的晶型,各个因素之间相互交叉,因素与强度之间没有一个很好的线性回归关系。由于水泥强度预测是一个非线性、多变量、大时滞问题,因此利用传统的线性回归模型进行预测很难满足精度要求。
因此我们必须选择具有处理非线性能力的模型。具有处理非线性能力的模型我们这里可选择集成学习算法当中主流的XGBoost算法以及深度学习神经网络算法。
梯度提升算法XGBoost是当下最流行的梯度提升树Boosting集成算法,因其在诸多分类与回归案例中良好的性能而深受数据挖掘爱好者的喜爱。在机器学习与人工智能的浪潮中,XGBoost凭借高效、便捷、扩展性强等优势,在众多开源机器学习库中脱颖而出,广受各大企业青睐。目前XGBoost已成为热门的机器学习开源项目之一,拥有强大的社区支持,技术也日趋成熟。
DNN神经网络是一种基于误差反向传播的神经网络算法,也是目前应用最为广泛的神经网络算法之一。该网络能学习和存贮大量输入一输出模式映射关系。而无需事先了解描述这种映射关系的数学方程。只要能提供足够多的样本模式对供网络进行学习训练,它便能完成由n维输入空间到m维输出空间的非线性映射,从而获得较好的预测效果。
神经网络技术在水泥领域里的应用已经受到人们的广泛关注,神经网络方法与传统的数据处理方法相比,具有明显优势。它长于处理复杂的非线性问题。理论上已证明,一个三层网络可以任意精度逼近任意给定的连续函数。这说明其非线性映射能力极强,它还可以从已有的实验数据中通过一定算法(学习算法)获取信息,总结规律,即具有自学习功能。同时,它还有很强的容错性,及一定的拓广能力和联想记忆。神经网络回归(QuantileRegressionNeural Network,QRNN)是由Talor提出来的非参数非线性方法。它结合了神经网络和回归的两大优势,具有强大功能,能够揭示数据分布规律。回归是确定两种或两种以上的变量间相互依赖的定量关系的方法。
这里我们选择DNN神经网络模型来训练槐坎的28天强度预测模型,以达到一个较好的预测效果。
3、数据量纲化处理
神经网络需要对数据进行归一化/标准化处理,消除量纲,同时也能加速网络的收敛。特征归一化是为了使不同的数据类别具有可比性,比如人的身高和体重,让它们可以在同一个标准下衡量。主流的两种归一化方法有max-min归一化,以及z-socre归一化。由于z-score归一化对数据的分布有要求,需要假设数据符合正态分布,但是实际数据情况分布往往不是这样子,因此这里我们选择主流的max-min归一化,对我们的数据进行归一化,如图1所示。
Figure BDA0002990664230000081
图1中R28表示熟料28天的强度值。
4、DNN神经网络模型的架构设计
网络结构架构设计共5层,如图2所示,包含一层输入层,3层隐含层,1层输出层,输入层为16个经过归一化之后的输入变量,输入层全连接隐含层,各层神经元仅与相邻层神经元之间相互全连接,同层内神经元之间无连接,各层神经元之间无反馈连接,构成具有层次结构的前馈型神经网络系统。单计算层前馈神经网络只能求解线性可分问题,能够求解非线性问题的网络必须是具有隐层的多层神经网络。
神经网络的厉害之处就在于,我们可以调节神经网络的层数,网络的拓扑结构以及神经元的参数,去改变对一个输入向量x的不同数学维度上的处理方式,进而达成不同的训练目的。其实DNN,单从结构上来说,可以简单理解为层数的增加,进而带来对特征的提取和抽象能力的增强。当然,随着网络层数的增加,拓扑结构的复杂,随之而来也会带来整个神经网络的副作用和难题,比如容易陷入局部最优解,梯度消失严重等问题。
为了防止模型的过拟合,架构设计当中,我们加入dropout方法,随机去掉神经元。在一个密集的(或全连接的)网络中,对于每一层,我们给出了一个dropout的概率p。在每次迭代中,每个神经元被去掉的概率为p。
为了防止模型的过拟合,架构设计当中,我们也加入了L1-L2正则化方法。L1和L2正则化方法就是把权重的L1范数或L2范数加入到经验风险最小化的损失函数中(或者把二者同时加进去),用来约束神经网络的权重,让部分权重为0(L1范数的效果)或让权重的值非常小(L2范数的效果),从而让模型变得简单,减少过拟合。得到的损失函数为结构风险最小化的损失函数。公式如下:
Figure BDA0002990664230000082
p∈{1,2},λ表示正则化系数,如果模型可能发生严重的过拟合问题,那就选择比较大的λ,比如训练一个非常庞大的网络,否则可以设置得小一些,N表示样本数量,
Figure BDA0002990664230000083
()表示损失函数,y(n)表示样本的输出,x(n)表示样本,f()表示经验风险项,θ表示正则化参数,l()是惩罚函数,λl()构成了正则项。通过使用正则化方法,增加正则化系数,使得最佳的损失函数最小化。
正则化技术中使用的调整因子λ,能控制对方差和偏差的影响。当λ的值开始上升时,它减小了系数的值,从而降低了方差。直到上升到某个值之前,λ的增大很有利,因为它只是减少方差(避免过拟合),而不会丢失数据的任何重要特性。
L1正则化会使得最终的权重参数是稀疏的,也就是说权重矩阵中很多值为0;而L2正则化会使得最终的权重值非常小,但不会等于0。这么说来L1正则化有点像Dropout的另一种不常见的方式——丢弃连接边。在实际操作中一般来说选择L2正则化,因为L1范数在取得最小值处是不可导的,这会给后续求梯度带来麻烦。
如图3a、b所示,图3a是带有两个隐含层的神经网络,图3b是请求Dropout后的薄网,十字单元为已丢弃项。
采用ReLU作为激活函数,激活函数是神经网络中一个至关重要的部分,如图4所示,ReLu的表达式所示:
f(x)=max(0,x)
将线性整流函数(即数学中的斜坡函数)作为神经元的激活函数,定义了神经元在线性变换wTx+b之后的非线性输出结果,即对于进入神经元的来自上一层神经网络的输入向量x(神经元与权重相乘的加权和),使用线性整流激活函数的神经元会输出max(0,wTx+b),至下一层神经元或作为整个神经网络的输出,max()表示取最大值。
ReLU可以对抗梯度爆炸/消失问题,相对而言计算效率也很高,目前它被普遍认为是效果最好的激活函数,因此我们选择ReLU作为DNN神经网络的激活函数,ReLU用于神经网络中,神经元与神经元连接的中间部分,即隐含层与隐含层之间。
5、DNN神经网络模型的训练
我们选择某水泥厂2020年数据,按照0.15的比例分割训练集和测试集,即训练集占比85%,测试集占比15%。损失函数选择均方误差,均方误差是对预测结果的评估,表示预测结果的准确度,误差大小,优化器选择adam,批数量batch_size=4,迭代次数epochs=1000,进行模型训练,神经网络对样本数据集进行小批量划分,优化器、批数量用在神经网络的所有批处理中,优化器对神经网络模型参数进行优化,选择最佳的模型参数,达到预测误差效果,即通过调参,调节到适合的权重,使均方误差最小,均方误差公式:
Figure BDA0002990664230000091
其中,MSE(Mean Square Error)表示均方误差,将真实值与预测值的差值的平方然后求和平均,
Figure BDA0002990664230000092
表示真实值,yi表示预测值。
如图5所示,训练集和测试集两条损失曲线比较靠近,说明模型未发生过拟合,模型效果较好。
6、DNN神经网络模型在线预测
训练好DNN神经网络模型之后,我们针对实时数据进行在线预测,我们对模型进行服务化,进行FastAPI接口开发。FastAPI拥有简单直观的API,它是一个比Flask和Tornado更高性能的API框架。post参数以json格式传输。
在线传输数据:
{"create_time":"2021-02-20 14:29:52","LOSS":0.1,"F_Cao":0.62,"Cao":65.63,"Sio2":21.35,"Al2O3":5.66,"Fe2O3":3.75,"Mg0":1.74,"SO3":0.46,"C3S":59.06,"C2S":16.671,"C3A":8.639,"C4AF":11.4}
在线预测输出:
{"code":200,"msg":"ok","action":1,"predict":"58.33","gmt_created":"2021-02-2008:55:04"}
绝对误差是测量值对真值偏离的绝对大小,因此它的单位与测量值的单位相同。平均绝对误差是所有单个观测值与算术平均值的偏差的绝对值的平均。平均绝对误差可以避免误差相互抵消的问题,因而可以准确反映实际预测误差的大小。我们选择平均绝对误差准确率来作为熟料28天强度预测效果的评估项。如图6与下表所示,我们取得+-1Mpa平均绝对误差准确率90.92%的好成绩。
效果评估项 效果评估项描述 平均绝对误差准确率 备注
1Mpa +-1Mpa以内 90.92% 平均绝对误差准确率=累加个数/总个数
1.5Mpa +-1.5Mpa以内 92.87% 平均绝对误差准确率=累加个数/总个数
2.0Mpa +-2.0Mpa以内 96.84% 平均绝对误差准确率=累加个数/总个数
2.5Mpa +-2.5Mpa以内 99.33% 平均绝对误差准确率=累加个数/总个数
以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明实施例技术方案的范围。

Claims (10)

1.基于DNN神经网络的硅酸盐水泥熟料的强度预测方法,其特征在于包括如下步骤:
S1,获取影响水泥熟料强度的因素;
S2,神经网络模型选择,选取DNN神经网络模型;
S3,数据量纲化处理;
S4,构建神经网络模型,包括输入层、一组隐含层、输出层,输入层全连接隐含层,各层神经元仅与相邻层神经元之间相互全连接,同层内神经元之间无连接,各层神经元之间无反馈连接,将量纲化处理的数据作为输入变量,将强度值作为输出;
S5,训练神经网络模型;
S6,神经网络模型的预测。
2.如权利要求1所述的基于DNN神经网络的硅酸盐水泥熟料的强度预测方法,其特征在于所述步骤S4中,采用正则化方法,用于约束神经网络的权重参数,得到结构风险最小化的损失函数,公式如下:
Figure FDA0002990664220000011
p∈{1,2},λ表示正则化系数,N表示样本数量,
Figure FDA0002990664220000012
表示损失函数,y(n)表示样本的输出,x(n)表示样本,f()表示经验风险项,θ表示正则化参数,l()是惩罚函数,λl()构成了正则项,通过使用正则化方法,增加正则化系数λ,使得最佳的损失函数最小化。
3.如权利要求2所述的基于DNN神经网络的硅酸盐水泥熟料的强度预测方法,其特征在于所述正则化方法,包括L1和L2正则化方法,将权重参数的L1范数或L2范数或二者同时加入到结构风险最小化的损失函数中,L1范数,使部分权重参数为0,L2范数,使部分权重参数在最小阈值的范围内。
4.如权利要求1所述的基于DNN神经网络的硅酸盐水泥熟料的强度预测方法,其特征在于所述步骤S4中,采用Dropout方法,随机去掉部分神经元,对于每一层,给出了一个Dropout的概率p,在每次迭代中,每个神经元被去掉的概率为p。
5.如权利要求1所述的基于DNN神经网络的硅酸盐水泥熟料的强度预测方法,其特征在于所述步骤S4中,采用ReLU作为神经网络的激活函数,用于隐含层与隐含层之间,表达式如下:
f(x)=max(0,x)
对于来自上一层神经网络的输入向量x,使用ReLU激活函数,输出最大值max(),至下一层或作为整个神经网络的输出,所述x是神经元与权重相乘的加权和。
6.如权利要求1所述的基于DNN神经网络的硅酸盐水泥熟料的强度预测方法,其特征在于所述步骤S5中,将样本数据分为训练集和测试集,损失函数采用均方误差,采用优化器adam对神经网络模型的权重参数进行优化,指定批数量和迭代次数,对神经网络模型进行训练,均方误差公式如下:
Figure FDA0002990664220000021
其中,MSE表示均方误差,将真实值与预测值的差值的平方然后求和平均,
Figure FDA0002990664220000022
表示真实值,yi表示预测值,通过训练集和测试集的损失曲线判断模型效果。
7.如权利要求1所述的基于DNN神经网络的硅酸盐水泥熟料的强度预测方法,其特征在于所述步骤S6中,通过绝对误差衡量测量值对真值偏离的绝对大小,通过平均绝对误差,作为所有单个观测值与算术平均值的偏差的绝对值的平均,反映实际预测误差的大小。
8.如权利要求1所述的基于DNN神经网络的硅酸盐水泥熟料的强度预测方法,其特征在于所述步骤S1中的影响因素是熟料的化学成分及三率值,所述化学成分包括熟料烧矢量Loss、熟料游离钙F_Cao、熟料氧化钙CaO、熟料氧化硅SiO2、熟料氧化铝A1203、熟料氧化铁Fe2O3、熟料氧化镁MgO,所述三率值包括饱和比系数KH、熟料硅率SM、熟料铝率IM。
9.如权利要求8所述的基于DNN神经网络的硅酸盐水泥熟料的强度预测方法,其特征在于所述化学成分还包括熟料三氧化硫SO3,所述三率值还包括扣除氧化钙的熟料饱和比系数KH_f,通过化学成分计算各率值:
KH=round((Cao-1.65*Al2O3-0.35*Fe2O3)/(2.8*Sio2),3)
KH_f=round(KH-(F_Cao/(2.8*Sio2)),3)
SM=round(Sio2/(Al2O3+Fe2O3),3)
IM=round(Al2O3/Fe2O3,3)
通过化学成分、饱和比系数计算矿物组成:
C3S=3.8*(3*KH-2)*SiO2
C2S=8.61*(1-KH)*SiO2
C3A=2.65*(Al2O3-0.64*Fe2O3)
C4AF=3.04*Fe2O3
得到熟料硅酸3钙C3S、熟料硅酸2钙C2S、熟料铝酸三钙C3A、熟料铁铝酸四钙C4AF。
10.如权利要求1所述的基于DNN神经网络的硅酸盐水泥熟料的强度预测方法,其特征在于所述步骤S3采用max-min归一化对影响因素的数据进行处理:
Figure FDA0002990664220000031
所述x表示影响因素的数据,xmax表示同一类影响因素中的最大值,xmin表示同一类影响因素中的最小值。
CN202110314662.6A 2021-03-24 2021-03-24 基于dnn神经网络的硅酸盐水泥熟料的强度预测方法 Pending CN112951349A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110314662.6A CN112951349A (zh) 2021-03-24 2021-03-24 基于dnn神经网络的硅酸盐水泥熟料的强度预测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110314662.6A CN112951349A (zh) 2021-03-24 2021-03-24 基于dnn神经网络的硅酸盐水泥熟料的强度预测方法

Publications (1)

Publication Number Publication Date
CN112951349A true CN112951349A (zh) 2021-06-11

Family

ID=76226559

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110314662.6A Pending CN112951349A (zh) 2021-03-24 2021-03-24 基于dnn神经网络的硅酸盐水泥熟料的强度预测方法

Country Status (1)

Country Link
CN (1) CN112951349A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114692515A (zh) * 2022-06-01 2022-07-01 中材邦业(杭州)智能技术有限公司 一种基于时间滞后xgboost模型的熟料游离钙含量软测量方法
CN117174219A (zh) * 2023-11-02 2023-12-05 济南大学 基于隐变量模型的水泥强度条件概率分布估计方法及系统
CN117265251A (zh) * 2023-09-20 2023-12-22 索罗曼(广州)新材料有限公司 一种钛扁条氧含量在线监测系统及其方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109165798A (zh) * 2018-10-19 2019-01-08 燕山大学 一种水泥熟料游离氧化钙含量在线预测方法及系统
US20190325313A1 (en) * 2018-04-20 2019-10-24 Google Llc Systems and Methods for Regularizing Neural Networks
CN110444257A (zh) * 2019-08-05 2019-11-12 燕山大学 一种基于无监督和有监督学习的水泥游离钙软测量方法
CN111445965A (zh) * 2020-03-25 2020-07-24 长安大学 一种基于深度学习的碳纤维增强水泥基材料的设计方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20190325313A1 (en) * 2018-04-20 2019-10-24 Google Llc Systems and Methods for Regularizing Neural Networks
CN109165798A (zh) * 2018-10-19 2019-01-08 燕山大学 一种水泥熟料游离氧化钙含量在线预测方法及系统
CN110444257A (zh) * 2019-08-05 2019-11-12 燕山大学 一种基于无监督和有监督学习的水泥游离钙软测量方法
CN111445965A (zh) * 2020-03-25 2020-07-24 长安大学 一种基于深度学习的碳纤维增强水泥基材料的设计方法

Non-Patent Citations (6)

* Cited by examiner, † Cited by third party
Title
吕清勇等: "BP神经网络在水泥熟料强度预测中的应用", 《微计算机信息》, 31 October 2010 (2010-10-31), pages 227 - 228 *
张爱华等: "《无线通信系统稀疏信道信息获取技术研究》", 30 September 2020, 北京邮电大学出版社, pages: 103 - 115 *
彭宝利等: "《现代水泥制造技术》", 中国建材工业出版社, pages: 52 - 53 *
徐洛屹等: "《水泥生产制造 立窑煅烧》", 30 November 2006, 中国建材工业出版社, pages: 28 - 30 *
朱喜安等: "《综合评价方法优良标准研究》", 31 December 2020, 武汉大学出版社, pages: 133 - 134 *
杨淑媛等: "《现代神经网络教程》", 30 April 2020, 西安电子科技大学出版社, pages: 302 - 303 *

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114692515A (zh) * 2022-06-01 2022-07-01 中材邦业(杭州)智能技术有限公司 一种基于时间滞后xgboost模型的熟料游离钙含量软测量方法
CN114692515B (zh) * 2022-06-01 2022-09-02 中材邦业(杭州)智能技术有限公司 一种基于时间滞后xgboost模型的熟料游离钙含量软测量方法
CN117265251A (zh) * 2023-09-20 2023-12-22 索罗曼(广州)新材料有限公司 一种钛扁条氧含量在线监测系统及其方法
CN117265251B (zh) * 2023-09-20 2024-04-09 索罗曼(广州)新材料有限公司 一种钛扁条氧含量在线监测系统及其方法
CN117174219A (zh) * 2023-11-02 2023-12-05 济南大学 基于隐变量模型的水泥强度条件概率分布估计方法及系统
CN117174219B (zh) * 2023-11-02 2024-02-02 济南大学 基于隐变量模型的水泥强度条件概率分布估计方法及系统

Similar Documents

Publication Publication Date Title
CN112951349A (zh) 基于dnn神经网络的硅酸盐水泥熟料的强度预测方法
Belalia Douma et al. Prediction of properties of self-compacting concrete containing fly ash using artificial neural network
Yeh Design of high-performance concrete mixture using neural networks and nonlinear programming
Zhang et al. Automating the mixture design of lightweight foamed concrete using multi-objective firefly algorithm and support vector regression
Khademi et al. Prediction of compressive strength of concrete by data-driven models
Lam et al. Prediction and optimization of a ceramic casting process using a hierarchical hybrid system of neural networks and fuzzy logic
Liang et al. Prediction of compressive strength of concrete in wet‐dry environment by BP artificial neural networks
CN113033923B (zh) 水泥熟料性能的预测、评价及优化方法及其装置和系统
CN110435009B (zh) 一种混凝土生产配合比的智能设计方法
Fasihihour et al. Experimental and numerical model for mechanical properties of concrete containing fly ash: Systematic review
Rahchamani et al. A hybrid optimized learning‐based compressive performance of concrete prediction using GBMO‐ANFIS classifier and genetic algorithm reduction
Rasa et al. PREDICTING DENSITY AND COMPRESSIVE STRENGTH OF CONCRETE CEMENT PASTE CONTAINING SILICA FUME USING AR-TIFICIAL NEURAL NETWORKS
Vakhshouri et al. Application of adaptive neuro-fuzzy inference system in high strength concrete
CN114757416A (zh) 一种基于定额法的需水预测方法及系统
Yuan et al. Application of deep belief network in prediction of secondary chemical components of sinter
CN114912712A (zh) 一种耦合前馈人工神经网络和进化算法的固体废物协同处置水泥配料控制方法
Cruz et al. A neural network approach for predicting microstructure development in cement
Kumar et al. Prediction of cement strength using machine learning approach
CN103116272B (zh) 一种氢氰酸生产过程的在线自适应建模方法
Tiryaki et al. Mathematical modeling of a cement raw-material blending process using a neural network
Claudius et al. Simplex lattice method: A predictive tool for concrete materials
Wang Overview of logistics demand forecasting methods
Bao et al. A novel chemical composition estimation model for cement raw material blending process
Haorui et al. Quality stability evaluation model based on intelligent control
CN113593657B (zh) 以质量目标为导向半监督学习的水泥游离钙软测量系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20210611