CN111833970B - 一种水泥熟料质量表征参数预测模型构建方法及其应用 - Google Patents

一种水泥熟料质量表征参数预测模型构建方法及其应用 Download PDF

Info

Publication number
CN111833970B
CN111833970B CN202010560105.8A CN202010560105A CN111833970B CN 111833970 B CN111833970 B CN 111833970B CN 202010560105 A CN202010560105 A CN 202010560105A CN 111833970 B CN111833970 B CN 111833970B
Authority
CN
China
Prior art keywords
parameters
cement clinker
characteristic
cement
prediction model
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010560105.8A
Other languages
English (en)
Other versions
CN111833970A (zh
Inventor
彭刚
何雷
阮景
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hubei Bohua Automation System Engineering Co ltd
Huazhong University of Science and Technology
Original Assignee
Hubei Bohua Automation System Engineering Co ltd
Huazhong University of Science and Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hubei Bohua Automation System Engineering Co ltd, Huazhong University of Science and Technology filed Critical Hubei Bohua Automation System Engineering Co ltd
Priority to CN202010560105.8A priority Critical patent/CN111833970B/zh
Publication of CN111833970A publication Critical patent/CN111833970A/zh
Application granted granted Critical
Publication of CN111833970B publication Critical patent/CN111833970B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16CCOMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
    • G16C20/00Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
    • G16C20/30Prediction of properties of chemical compounds, compositions or mixtures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/004Artificial life, i.e. computing arrangements simulating life
    • G06N3/006Artificial life, i.e. computing arrangements simulating life based on simulated virtual individual or collective life forms, e.g. social simulations or particle swarm optimisation [PSO]
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02PCLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
    • Y02P90/00Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
    • Y02P90/30Computing systems specially adapted for manufacturing

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Computing Systems (AREA)
  • Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Biophysics (AREA)
  • Data Mining & Analysis (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Biomedical Technology (AREA)
  • Chemical & Material Sciences (AREA)
  • Computational Linguistics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Computation (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Curing Cements, Concrete, And Artificial Stone (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明属于水泥质量分析领域,具体公开一种水泥熟料质量表征参数预测模型构建方法及其应用,方法包括:采集各批次水泥制造时的水泥熟料质量特征参数值集合和表征参数值,特征参数包括生料成分参数和熟料煅烧DCS参数;将特征参数中的各种参数按照与表征参数的相关度从大到小进行排序,调取每批次对应的特征参数中排序前n个参数的值,构成该批次对应的特征集,确定训练所得预测精度最高的辅助预测模型所对应的n值,基于该n值对应的所有特征集,采用GA在每次迭代中同步调优随机森林模型的多个参数,训练水泥熟料质量表征参数预测模型。本发明用于训练水泥熟料质量表征参数预测模型的训练样本更加合理,训练效率高,训练出来的模型预测精度较高。

Description

一种水泥熟料质量表征参数预测模型构建方法及其应用
技术领域
本发明属于水泥质量分析领域,更具体地,涉及一种水泥熟料质量表征参数预测模型构建方法及其应用。
背景技术
水泥是建筑工程的基础原材料之一,在国民经济建设中具有重要的地位,如何有效控制水泥质量,是每个水泥企业都关注的焦点。
水泥熟料的质量对水泥最终的质量有很大的影响,所以在生产过程中要控制好水泥熟料的质量,水泥熟料质量的一个重要评价指标就是f-CaO,实现在线估算熟料f-CaO含量对于准确分析水泥熟料质量十分关键。f-CaO就是水泥熟料中少量以游离态存在的CaO,一般应该将熟料f-CaO含量控制在0.5%~1.5%之间。如果熟料f-CaO含量过高,水泥稳定性会降低,并且水泥和混凝土之间的相容性也会降低;如果熟料f-CaO含量过低,粉磨的电能消耗会增加,并且熟料会处于过烧状态,当含量低到一定程度,熟料会处于死烧状态,此时水泥失去活性,强度下降。目前主要采用人工离线方式检测熟料f-CaO含量,需要化验室人员采集样本对熟料f-CaO含量进行检测,但是这类检测方法会受人为因素影响,并且检测结果有较大的滞后性,不能达到对水泥生产的及时指导。随着人工智能技术的发展,可以建立基于机器学习方法的熟料f-CaO含量估算模型,实现对熟料f-CaO含量在线估算。
基于机器学习的方法进行水泥熟料质量评估预测时,评估预测效果和准确性依赖于机器学习算法的参数优化以及训练集的选取,不同的参数和训练集训练出来的模型会有差异。
发明内容
本发明提供一种水泥熟料质量表征参数预测模型构建方法及其应用,用以解决现有水泥熟料质量表征参数预测精确度不高的问题。
本发明解决上述技术问题的技术方案如下:一种水泥熟料质量表征参数预测模型构建方法,包括:
采集各批次水泥制造时的水泥熟料质量特征参数值集合和表征参数值,所述特征参数包括生料成分参数和熟料煅烧DCS参数;
将所述特征参数中的各种参数按照与所述表征参数的相关度,从大到小进行排序,调取每批次对应的特征参数中所述排序前n个参数的值,构成该批次对应的特征集,基于所有所述特征集和所述表征参数值,训练辅助预测模型;
确定训练所得预测精度最高的辅助预测模型所对应的n值,基于各批次的表征参数值和该n值对应的特征集,采用遗传算法在每次迭代中同步调优随机森林模型的多个参数,训练基于该随机森林模型的水泥熟料质量表征参数预测模型。
本发明的有益效果是:本发明首先采集各批次水泥制造时的水泥熟料质量特征参数值集合和表征参数值,进一步通过特征参数排序,并采用辅助预测模型,进行特征选择,选出与表征参数相关性较高的多个特征,得到各批次水泥制造时的特征集,通过以上步骤,最终得到的用于训练水泥熟料质量表征参数预测模型的训练样本更加合理,训练出来的模型预测精度更高。另外,由于预测模型参数具体影响会随着训练数据的不同而有差异,本发明采用遗传算法同时得到最优的多个关键参数,而不是逐个参数进行优化,提高了参数优化效率和精度,进而极大提高水泥强度预测模型的自适应性和训练效率。
上述技术方案的基础上,本发明还可以做如下改进。
进一步,所述生料成分参数包括石灰石饱和比、硅酸率和铝酸率,所述熟料煅烧DCS参数包括预热器出口温度、分解炉温度、回转窑主机电流、回转窑窑尾温度、篦冷机高温风机转速和篦冷机三次风温。
本发明的进一步有益效果是:熟料质量特征参数集合既包括生料成分参数,又包括熟料煅烧DCS参数,可以全面多角度进行熟料质量评估。
进一步,所述采集各批次水泥制造时的水泥熟料质量特征参数值集合和表征参数值,具体实现方式为:
计算每个批次水泥制造时生料在四个设备中的停留时间,根据停留时间对生料成分参数、熟料煅烧DCS参数、表征参数进行时间匹配,构造该批次水泥制造时的水泥熟料质量数据集,该水泥熟料质量数据集包括该批次水泥制造时的水泥熟料质量特征参数值集合和表征参数值,其中,所述四个设备为预热器、分解炉、回转窑和篦冷机。
本发明的进一步有益效果是:根据停留时间,保证采集的每组生料成分参数、熟料煅烧DCS参数与表征参数属于同一批次水泥制造时的数据,以构建各批次对应的水泥熟料质量数据集。需要说明的是,由于生料依次经过预热器、分解炉、回转窑和篦冷机,且在各个设备中所采集的参数种类不同,其中,各个参数的参数值采集可以为:采用各停留时间内的每个对应特征参数的平均值或最大值或最小值或某个瞬时值作为该停留时间内该对应特征参数的值。
进一步,生料在所述预热器和所述分解炉中的停留时间均为20~40秒;生料在所述回转窑中停留时间MRT根据公式
Figure BDA0002545787490000031
确定,生料在所述篦冷机中停留时间T根据公式/>
Figure BDA0002545787490000032
确定,其中,γ为物料休止角,β为窑倾斜角,n为窑转速,L为回转窑长度,D为回转窑内径,W表示流量,ρ表示密度,H表示篦冷机内料层高度,A表示篦板有效面积。
进一步,在构建每个批次对应的特征集之前,采用箱线图法对各批次对应的特征参数值集合中的异常值进行检测,并将检测出来的含有异常值的特征参数值集合删除;
采用基于条件互信息的特征选择算法,将所述特征参数中的各种参数按照与所述表征参数的相关度,从大到小进行排序。
本发明的进一步有益效果是:利用箱线图方法对各批次对应的特征参数值集合中的异常值进行检测,并将检测出来的含有异常值的特征参数值集合删除,保证用于水泥熟料质量表征参数预测模型训练的样本准确性、可靠性,提高水泥熟料质量表征参数预测模型的预测精度。另外,各个特征参数值集合中含有一些与目标变量无关或关系很小的特征变量,针对这种情况,采用基于条件互信息的特征选择算法进行特征选择,找出与目标变量相关性较高的特征,得到水泥熟料质量的特征集,保证训练得到的水泥熟料质量表征参数预测模型的预测精度,同时也减少了计算量。
进一步,水泥熟料质量的表征参数为熟料f-CaO含量。
进一步,所述采用遗传算法在每次迭代中同步调优随机森林模型的多个参数,该多个参数包括最佳决策树棵数、每棵决策树随机选择的特征数目和叶子节点最小样本数。
本发明的进一步有益效果是:影响随机森林模型性能的关键参数有最佳决策树棵数、每棵决策树随机选择的特征数目和叶子节点最小样本数,这三个参数具体的影响随着数据的不同而有差异,为了让随机森林模型进行水泥熟料质量表征参数预测时对不同的数据能自动调节参数,采用基于遗传算法同时优化随机森林模型的上述三个参数,提高了优化效率,达到了在不同数据情况下,随机森林模型能自动匹配出最佳的训练参数的目的,提高了随机森林模型预测算法的适应性。
进一步,所述采用遗传算法在每次迭代中同步调优随机森林模型的多个参数,具体为:
S1、初始化种群,种群中每个个体基因型均为随机生成的17位二进制数,其中前9位、中间3位和后5位分别表示所述最佳决策树棵数、所述每棵决策树随机选择的特征数目和所述叶子节点最小样本数的二进制编码;
S2、将各个体基因型对应的所述前9位、所述中间3位和所述后5位分别转换成十进制,作为训练过程中随机森林模型的最佳决策树棵数、每棵决策树随机选择的特征数目和叶子节点最小样本数;
S3、将所述随机森林模型输出的均方误差值作为适应度值,选择适应度值前k高的多个个体;
S4、对所述多个个体的基因型之间进行杂交运算和变异运算,产生新的个体基因型,重复执行S2,直至达到收敛终止条件,完成随机森林模型每次训练迭代所需的最佳决策树棵数、每棵决策树随机选择的特征数目和叶子节点最小样本数;所述收敛终止条件是所述随机森林模型输出的均方误差值小于设定均方误差值,或训练迭代次数到达设定最大迭代次数。
本发明还提供一种水泥熟料质量评估方法,包括:
采集待预测水泥熟料的水泥熟料质量特征参数值集合,并调取该特征参数值集合中n个特征参数值,构成预测特征集;其中,所述n个特征参数为如上所述的预测精度最高的辅助预测模型所对应的n个特征参数;
基于所述预测特征集,采用如上所述的一种水泥熟料质量表征参数预测模型构建方法所构建的水泥熟料质量表征参数预测模型,预测所述待预测水泥熟料的水泥熟料质量表征参数;
基于该水泥熟料质量表征参数,评估得到水泥熟料质量。
本发明的有益效果是:本发明采用如上所述的一种水泥熟料质量表征参数预测模型构建方法所构建的水泥熟料质量表征参数预测模型,提高水泥熟料质量表征参数预测的精度和实时性。
本发明还提供一种计算机存储介质,所述机器可读存储介质存储有机器可执行指令,所述机器可执行指令在被处理器调用和执行时,所述机器可执行指令促使所述处理器实现如上所述的一种水泥熟料质量表征参数预测模型构建方法和/或如上所述的一种水泥熟料质量评估方法。
附图说明
图1为本发明实施例提供的一种水泥熟料质量表征参数预测模型构建方法的流程框图;
图2为本发明实施例提供的特征选择对模型精度影响示意图;
图3为本发明实施例提供的分别基于随机森林模型和结合遗传算法的随机森林模型的水泥熟料质量表征参数预测值。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。此外,下面所描述的本发明各个实施方式中所涉及到的技术特征只要彼此之间未构成冲突就可以相互组合。
实施例一
一种水泥熟料质量表征参数预测模型构建方法,如图1所示,包括:
采集各批次水泥制造时的水泥熟料质量特征参数值集合和表征参数值,特征参数包括生料成分参数和熟料煅烧DCS参数;
将特征参数中的各种参数按照与表征参数的相关度,从大到小进行排序,调取每批次对应的特征参数中排序前n个参数的值,构成该批次对应的特征集,基于所有特征集和表征参数值,训练辅助预测模型;
确定训练所得预测精度最高的辅助预测模型所对应的n值,基于各批次的表征参数值和该n值对应的特征集,采用遗传算法在每次迭代中同步调优随机森林模型的多个参数,训练基于该随机森林模型的水泥熟料质量表征参数预测模型。
需要说明的是,熟料煅烧DCS参数是生产设备DCS参数,n取值为正整数。本实施例首先采集各批次水泥制造时的水泥熟料质量特征参数值集合和表征参数值,进一步通过特征参数排序,并采用辅助预测模型,进行特征选择,选出与表征参数相关性较高的多个特征,得到各批次水泥制造时的特征集,通过以上步骤,最终得到的用于训练水泥熟料质量表征参数预测模型的训练样本更加合理,训练出来的模型预测精度更高。另外,由于预测模型参数具体影响会随着训练数据的不同而有差异,采用遗传算法同时得到最优的多个关键参数,而不是逐个参数进行优化,提高了参数优化效率和精度,进而极大提高水泥强度预测模型的自适应性和训练效率。
优选的,上述生料成分参数包括石灰石饱和比(KH)、硅酸率(SM)和铝酸率(IM),熟料煅烧DCS参数包括预热器出口温度、分解炉温度、回转窑主机电流、回转窑窑尾温度、篦冷机高温风机转速和三次风温。
熟料质量特征参数集合既包括生料成分参数,又包括熟料煅烧DCS参数,可以全面多角度进行熟料质量评估。
优选的,上述采集各批次水泥制造时的水泥熟料质量特征参数值集合和表征参数值,具体实现方式为:
计算每个批次水泥制造时生料在四个设备中的停留时间,根据停留时间对生料成分参数、熟料煅烧DCS参数、表征参数进行时间匹配,构造该批次水泥制造时的水泥熟料质量数据集,该水泥熟料质量数据集包括该批次水泥制造时的水泥熟料质量特征参数值集合和表征参数值,其中,四个设备为预热器、分解炉、回转窑和篦冷机。
需要说明的是,由于生料依次经过预热器、分解炉、回转窑和篦冷机,且在各个设备中所采集的参数种类不同,其中,各个参数的参数值采集可以为:采用各停留时间内的每个对应特征参数的平均值或最大值或最小值或某个瞬时值作为该停留时间内该对应特征参数的值。
计算生料在四个设备中的停留时间,根据停留时间,对生料成分参数、熟料煅烧DCS参数、表征参数(如熟料f-CaO)进行时间匹配,构造原始水泥熟料质量数据集。水泥生产过程具有大滞后和强时变性等特点,生料在水泥生产过程中要经历预热器、分解炉、回转窑和篦冷机这四个设备,涉及的变量包括生料成分参数和DCS参数,物料在各个设备中停留的时间也有很大差异,并且停留时间与水泥质量有密切关系。同时水泥生产过程是一个连续不断的过程,同一批物料先后进入不同设备,因此在选取变量时,需要对变量与熟料f-CaO进行时间匹配,才能构造合适的数据样本。
优选的,生料在预热器和分解炉中的停留时间均为20~40秒;生料在回转窑中停留时间MRT根据公式
Figure BDA0002545787490000081
确定,生料在篦冷机中停留时间T根据公式
Figure BDA0002545787490000082
确定,其中,γ为物料休止角,β为窑倾斜角,n为窑转速,L为回转窑长度,D为回转窑内径,W表示流量,ρ表示密度,H表示篦冷机内料层高度,A表示篦板有效面积。
根据以上步骤以及水泥生产相关数据可以计算出生料在四个设备中的停留时间,具体计算结果如表1所示。
表1
Figure BDA0002545787490000083
Figure BDA0002545787490000091
根据表1得到生料在各设备中的停留时间,可以解决不同设备中变量与熟料f-CaO时间匹配问题,假定0:00(分钟:秒)时刻生料进入预热系统,则变量与熟料f-CaO的时间匹配结果如表2所示。
表2
Figure BDA0002545787490000092
优选的,水泥熟料质量的表征参数为熟料f-CaO含量。
优选的,在构建每个批次对应的特征集之前,采用箱线图法对各批次对应的特征参数值集合中的异常值进行检测,并将检测出来的含有异常值的特征参数值集合删除,例如,有700批次水泥制造,对应有700个特征值参数集合,经过箱线图法清洗后,去掉50批的采集数据,剩余650批对应的特征参数值集合和表征参数值。
采用基于条件互信息的特征选择算法,将所述特征参数中的各种参数按照与表征参数的相关度从大到小进行排序。
则构建各批次对应的特征集,具体过程为:
S1、清洗后的原始水泥熟料质量特征参数值集合包含9个特征参数,分别为KH、SM、IM、预热器出口温度、分解炉温度、窑主机电流、窑尾温度、高温风机转速和三次风温,设定这9个特征参数构成待选特征集合X,熟料f-CaO含量实测值为Y,已选特征集合为Z,最终选定的特征数目为n;
S2、输入X和Y,X中特征个数为l,l=9;
S3、计算特征Xi(i=1,2…l)与Y的互信息I(Xi,Y),对互信息进行排序,互信息最大的特征Xp即为第一阶段的被选特征,将该特征放入集合Z,放入序号为1,并将特征Xp从X中剔除;
S4、计算条件互信息I(Y;Xi|Z),对条件互信息进行排序,条件互信息最大的特征Xq为第二阶段的被选特征,将该特征放入集合Z,放入序号依次递增,并将特征Xq从X中剔除;
S5、循环执行S4,直至集合Z中变量的个数达到设定的特征数目n,输出特征集合,选出与熟料f-CaO含量相关性较高的特征,包括若干生料成分参数和若干熟料煅烧DCS参数,得到水泥熟料质量的特征集。
其中,X与Y的边际密度函数分别为P(x)和P(y),二者的联合概率密度函数为P(x,y),则X与Y之间的互信息为
Figure BDA0002545787490000101
在已选特征Z已知的条件下,X中的待选特征与Y的条件互信息为:
Figure BDA0002545787490000102
式中P(x,y,z)为X、Y和Z的联合概率密度函数;P(x,y|z)为Z条件下X、Y的联合概率密度函数;P(x|z)为Z条件下X的概率密度函数,P(y|z)为Z条件下Y的概率密度函数。Xi为第i个参数在各批次中的参数值所构成的集合。
根据实际数据确定n的值,优选的n可取值为5、6或7。
例如,取n=9,九个特征有序加入集合Z中,具体顺序如表3所示。表中特征顺序越靠前,说明与熟料f-CaO含量相关性越大。为了选出最佳特征组合,接下来按照特征加入集合Z的先后顺序依次选择3到9个特征构成7个特征集,并利用辅助预测模型(例如支持向量机)对熟料f-CaO含量进行估算,计算不同特征集下支持向量机的均方误差,以此来选出最佳特征组合,结果如图2所示。
表3
序号 特征 序号 特征
1 窑主机电流 6 IM
2 窑尾温度 7 三次风温
3 分解炉出口温度 8 预热器出口温度
4 KH 9 高温风机转速
5 SM
从图2可知,在特征数小于6时,均方误差下降非常大,当特征数为6时,均方误差取得最小值,当特征数目继续增加时,均方误差稍微有点增大,说明选取前6个特征是最佳方案。因此,最终选取窑主机电流、窑尾温度、分解炉出口温度、KH、SM、IM这6个特征。
利用箱线图方法对原始水泥熟料数据集进行异常值检测,并将含有异常值的样本从原始数据集中删除,保证用于水泥熟料质量表征参数预测模型训练的样本准确性、可靠性,提高水泥熟料质量表征参数预测模型的预测精度。另外,各个特征参数值集合中含有一些与目标变量无关或关系很小的特征变量,针对这种情况,采用基于条件互信息的特征选择算法进行特征选择,找出与目标变量相关性较高的特征,得到水泥熟料质量的特征集,保证训练得到的水泥熟料质量表征参数预测模型的预测精度。
优选的,上述采用遗传算法在每次迭代中同步调优随机森林模型的多个参数,该多个参数包括最佳决策树棵数、每棵决策树随机选择的特征数目和叶子节点最小样本数。
影响随机森林模型性能的关键参数有最佳决策树棵数、每棵决策树随机选择的特征数目和叶子节点最小样本数,这三个参数具体的影响随着数据的不同而有差异,为了让随机森林模型进行水泥熟料质量表征参数预测时对不同的数据能自动调节参数,采用基于遗传算法优化随机森林模型的上述三个参数,达到了在不同数据情况下,随机森林模型能自动匹配出最佳的训练参数的目的,提高了随机森林模型预测算法的适应性。
优选的,上述采用遗传算法在每次迭代中同步调优随机森林模型的多个参数,具体为:
S1、初始化种群,种群中每个个体基因型均为随机生成的17位二进制数,其中前9位、中间3位和后5位分别表示所述最佳决策树棵数、所述每棵决策树随机选择的特征数目和所述叶子节点最小样本数的二进制编码;
例如,种群初始化,设定种群规模S和最大迭代次数Nmax,设定染色体长度L=17,其中前9位表示n_estimators的二进制编码,十进制取值范围为[1,512],中间3位表示max_features的二进制编码,十进制取值范围为[1,7],后5位表示min_sample_leaf的二进制编码,十进制取值范围为[1,30];为了避免出现局部最优解,设定杂交概率pc=0.7,变异概率pm=0.7。种群中每一个个体的基因型均为随机生成的17位二进制数。
S2、将各个体基因型对应的所述前9位、所述中间3位和所述后5位分别转换成十进制,作为训练过程中随机森林模型的最佳决策树棵数、每棵决策树随机选择的特征数目和叶子节点最小样本数;
S3、将所述随机森林模型输出的均方误差值作为适应度值,选择适应度值前k高的多个个体;
根据S2计算出来的个体适应度大小,采取轮盘赌选择法选择出适应度较高的个体,即先计算个体适应度占种群总适应度的比值,然后根据该比值来确定遗传到下一代的个体数量。
S4、对所述多个个体的基因型之间进行杂交运算和变异运算,产生新的个体基因型,重复执行S2,直至达到收敛终止条件,完成随机森林模型每次训练迭代所需的最佳决策树棵数、每棵决策树随机选择的特征数目和叶子节点最小样本数;所述收敛终止条件是所述随机森林模型输出的均方误差值小于设定均方误差值,或训练迭代次数到达设定最大迭代次数。
杂交运算,设定杂交概率,根据杂交概率互换父母双方的部分基因,并产生新的个体;变异运算,设定变异概率,随机产生变异点,根据变异概率对变异点的原有基因取反,从而产生新的个体。
为了说明本发明优势,分别利用RF(随机森林模型)和GA-RF(基于遗传算法的随机森林模型)两种算法模型对熟料f-CaO含量进行估算。在测试集中选择15个测试样本,并用以上训练好的模型对这些测试样本进行估算,并计算估算值和实测值之间的相对误差,具体估算结果如表4所示。
表4
序号 f-CaO实测值 GA-RF估算值 相对误差(%) RF估算值 相对误差(%)
1 0.58 0.636 9.655 0.668 15.172
2 1.11 1.137 2.432 1.183 6.577
3 1.13 1.096 -3.009 1.057 -6.46
4 0.93 0.964 3.656 1.006 8.172
5 1.63 1.598 -1.963 1.708 4.785
6 1.02 1.058 3.726 1.091 6.961
7 0.78 0.753 -3.462 0.719 -7.821
8 0.71 0.674 -5.07 0.643 -9.437
9 0.48 0.507 5.625 0.547 13.958
10 0.69 0.661 -4.203 0.628 -8.986
11 0.46 0.434 -5.652 0.391 -15.0
12 1.41 1.447 2.6241 1.482 5.106
13 1.04 1.062 2.1154 1.107 6.442
14 0.62 0.587 -5.323 0.688 10.968
15 1.38 1.356 -1.739 1.458 5.652
从表4可以看出RF估算值与实测值之间的绝对值相对误差范围为4.785%~15.172%,GA-RF估算值与实测值之间的绝对值相对误差范围为1.739%~9.655%,GA-RF的绝对值相对误差比RF小一些,GA-RF模型估算值相比于RF更加接近实测值,说明优化后的随机森林估算精度有了明显提高。
图3中GA-RF和RF两个模型在15个测试样本上的估算值绘制的变化曲线,图中圆形所连曲线代表了实测值变化,三角形所连曲线代表了RF估算值变化,叉形所连曲线代表了GA-RF估算值变化。从图中可以看出:叉形所连曲线比三角形所连曲线更加靠近圆形所连曲线,这说明GA-RF估算值的变化曲线更接近实测值的变化曲线,GA-RF估算值与实测值更加接近。
根据MSE、MAE、R2这三个指标进一步评估RF和GA-RF在水泥熟料质量数据集上的性能表现,同时还选择K近邻(KNN)、决策树(DT)进行对比实验,其中,对于K近邻、决策树和随机森林算法,均采用人工经验调参方式调节其参数,各模型的MSE、MAE、R2如表5所示。
表5
Figure BDA0002545787490000141
从表5可以看出,在同样都采用人工经验调节参数的条件下,RF的精度比KNN和DT的精度高。同样还可以看出GA-RF的MSE、MAE均小于RF的MSE、MAE,并且GA-RF的R2比RF的R2大,其中GA-RF的R2达到了0.99013,这说明使用GA算法优化后的随机森林估算精度有很大的提高。
使用GA(Genetic Algorithm,遗传算法)对随机森林模型的三个关键参数进行同步优化,同时得到最优的三个关键参数,而不是逐个参数进行优化,提高了优化效率。
实施例二
一种水泥熟料质量评估方法,包括:
采集待预测水泥熟料的水泥熟料质量特征参数值集合,并调取该特征参数值集合中n个特征参数值,构成预测特征集;其中n个特征参数为如上所述的预测精度最高的辅助预测模型所对应的n个特征参数;
基于预测特征集,采用如上所述的一种水泥熟料质量表征参数预测模型构建方法所构建的水泥熟料质量表征参数预测模型,预测待预测水泥熟料的水泥熟料质量表征参数;
基于该水泥熟料质量表征参数,评估得到水泥熟料质量。
相关技术方案同实施例一,在此不再赘述。采用如上所述的一种水泥熟料质量表征参数预测模型构建方法所构建的水泥熟料质量表征参数预测模型,提高水泥熟料质量表征参数预测的精度和实时性。
实施例三
一种计算机存储介质,所述机器可读存储介质存储有机器可执行指令,所述机器可执行指令在被处理器调用和执行时,所述机器可执行指令促使所述处理器实现如上所述的一种水泥熟料质量表征参数预测模型构建方法和/或如上所述的一种水泥熟料质量评估方法。相关技术方案同实施例一和实施例二,在此不再赘述。
本领域的技术人员容易理解,以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。

Claims (6)

1.一种水泥熟料质量表征参数预测模型构建方法,其特征在于,包括:
采集各批次水泥制造时的水泥熟料质量特征参数值集合和表征参数值,所述特征参数包括生料成分参数和熟料煅烧DCS参数;
将所述特征参数中的各种参数按照与所述表征参数的相关度,从大到小进行排序,调取每批次对应的特征参数中所述排序前n个参数的值,构成该批次对应的特征集,基于所有所述特征集和所述表征参数值,训练辅助预测模型;
确定训练所得预测精度最高的辅助预测模型所对应的n值,基于各批次的表征参数值和该n值对应的特征集,采用遗传算法在每次迭代中同步调优随机森林模型的多个参数,训练基于该随机森林模型的水泥熟料质量表征参数预测模型;
其中,所述生料成分参数包括石灰石饱和比、硅酸率和铝酸率,所述熟料煅烧DCS参数包括预热器出口温度、分解炉温度、回转窑主机电流、回转窑窑尾温度、篦冷机高温风机转速和篦冷机三次风温;
所述采集各批次水泥制造时的水泥熟料质量特征参数值集合和表征参数值,具体实现方式为:
计算每个批次水泥制造时生料在四个设备中的停留时间,根据停留时间对生料成分参数、熟料煅烧DCS参数、表征参数进行时间匹配,构造该批次水泥制造时的水泥熟料质量数据集,该水泥熟料质量数据集包括该批次水泥制造时的水泥熟料质量特征参数值集合和表征参数值,其中,所述四个设备为预热器、分解炉、回转窑和篦冷机;
在构建每个批次对应的特征集之前,采用箱线图法对各批次对应的特征参数值集合中的异常值进行检测,并将检测出来的含有异常值的特征参数值集合删除;
采用基于条件互信息的特征选择算法,将所述特征参数中的各种参数按照与所述表征参数的相关度,从大到小进行排序;
水泥熟料质量的表征参数为熟料f-CaO含量。
2.根据权利要求1所述的一种水泥熟料质量表征参数预测模型构建方法,其特征在于,生料在所述预热器和所述分解炉中的停留时间均为20~40秒;生料在所述回转窑中停留时间MRT根据公式
Figure FDA0004203271870000021
确定,生料在所述篦冷机中停留时间T根据公式
Figure FDA0004203271870000022
确定,其中,γ为物料休止角,β为窑倾斜角,n为窑转速,L为回转窑长度,D为回转窑内径,W表示流量,ρ表示密度,H表示篦冷机内料层高度,A表示篦板有效面积。
3.根据权利要求1或2所述的一种水泥熟料质量表征参数预测模型构建方法,其特征在于,所述采用遗传算法在每次迭代中同步调优随机森林模型的多个参数,该多个参数包括最佳决策树棵数、每棵决策树随机选择的特征数目和叶子节点最小样本数。
4.根据权利要求3所述的一种水泥熟料质量表征参数预测模型构建方法,其特征在于,所述采用遗传算法在每次迭代中同步调优随机森林模型的多个参数,具体方式为:
S1、初始化种群,种群中每个个体基因型均为随机生成的17位二进制数,其中前9位、中间3位和后5位分别表示所述最佳决策树棵数、所述每棵决策树随机选择的特征数目和所述叶子节点最小样本数的二进制编码;
S2、将各个体基因型对应的所述前9位、所述中间3位和所述后5位分别转换成十进制,作为训练过程中随机森林模型的最佳决策树棵数、每棵决策树随机选择的特征数目和叶子节点最小样本数;
S3、将所述随机森林模型输出的均方误差值作为适应度值,选择适应度值前k高的多个个体;
S4、对所述多个个体的基因型之间进行杂交运算和变异运算,产生新的个体基因型,重复执行S2,直至达到收敛终止条件,完成随机森林模型每次训练迭代所需的最佳决策树棵数、每棵决策树随机选择的特征数目和叶子节点最小样本数;所述收敛终止条件是所述随机森林模型输出的均方误差值小于设定均方误差值,或训练迭代次数到达设定最大迭代次数。
5.一种水泥熟料质量评估方法,其特征在于,包括:
采集待预测水泥熟料的水泥熟料质量特征参数值集合,并调取该特征参数值集合中n个特征参数值,构成预测特征集;其中,所述n个特征参数为如权利要求1至4任一项所述的预测精度最高的辅助预测模型所对应的n个特征参数;
基于所述预测特征集,采用如权利要求1至4任一项所述的一种水泥熟料质量表征参数预测模型构建方法所构建的水泥熟料质量表征参数预测模型,预测所述待预测水泥熟料的水泥熟料质量表征参数;
基于该水泥熟料质量表征参数,评估得到水泥熟料质量。
6.一种计算机存储介质,其特征在于,所述计算机存储介质存储有机器可执行指令,所述机器可执行指令在被处理器调用和执行时,所述机器可执行指令促使所述处理器实现如权利要求1至4任一项所述的一种水泥熟料质量表征参数预测模型构建方法和/或如权利要求5所述的一种水泥熟料质量评估方法。
CN202010560105.8A 2020-06-18 2020-06-18 一种水泥熟料质量表征参数预测模型构建方法及其应用 Active CN111833970B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010560105.8A CN111833970B (zh) 2020-06-18 2020-06-18 一种水泥熟料质量表征参数预测模型构建方法及其应用

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010560105.8A CN111833970B (zh) 2020-06-18 2020-06-18 一种水泥熟料质量表征参数预测模型构建方法及其应用

Publications (2)

Publication Number Publication Date
CN111833970A CN111833970A (zh) 2020-10-27
CN111833970B true CN111833970B (zh) 2023-06-20

Family

ID=72897751

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010560105.8A Active CN111833970B (zh) 2020-06-18 2020-06-18 一种水泥熟料质量表征参数预测模型构建方法及其应用

Country Status (1)

Country Link
CN (1) CN111833970B (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113406313A (zh) * 2021-06-28 2021-09-17 浙江邦业科技股份有限公司 基于全自动游离氧化钙分析仪数据实时预测熟料f-CaO的方法
CN113627036A (zh) * 2021-09-15 2021-11-09 昆明理工大学 材料介电常数预测方法、装置、计算机设备及存储介质
CN114721263B (zh) * 2022-03-16 2024-01-23 中国中材国际工程股份有限公司 基于机器学习和智能优化算法的水泥分解炉智慧调控方法

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106202946A (zh) * 2016-07-18 2016-12-07 燕山大学 基于深度信念网络模型的水泥熟料游离钙含量预测方法
WO2018076403A1 (zh) * 2016-10-25 2018-05-03 浙江邦业科技股份有限公司 一种预测水泥回转窑熟料质量的一维仿真方法
CN108229093A (zh) * 2018-01-23 2018-06-29 广西大学 饱和再生混凝土氯离子扩散系数多尺度预测模型的构建方法
CN109977028A (zh) * 2019-04-08 2019-07-05 燕山大学 一种基于遗传算法和随机森林的软件缺陷预测方法
CN110177854A (zh) * 2017-02-22 2019-08-27 哈利伯顿能源服务公司 反应性映射
CN110187060A (zh) * 2019-05-31 2019-08-30 华中科技大学 一种水泥固化淤泥强度超早期预测方法
CN110263431A (zh) * 2019-06-10 2019-09-20 中国科学院重庆绿色智能技术研究院 一种混凝土28d抗压强度预测方法
CN110610061A (zh) * 2019-09-30 2019-12-24 湖南大学 一种融合多源信息的混凝土塌落度高精度预测方法
CN110930198A (zh) * 2019-12-05 2020-03-27 佰聆数据股份有限公司 基于随机森林的电能替代潜力预测方法、系统、存储介质及计算机设备

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10604814B2 (en) * 2017-09-27 2020-03-31 International Business Machines Coporation Manufacturing process control with deep learning-based predictive model for hot metal temperature of blast furnace

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106202946A (zh) * 2016-07-18 2016-12-07 燕山大学 基于深度信念网络模型的水泥熟料游离钙含量预测方法
WO2018076403A1 (zh) * 2016-10-25 2018-05-03 浙江邦业科技股份有限公司 一种预测水泥回转窑熟料质量的一维仿真方法
CN110177854A (zh) * 2017-02-22 2019-08-27 哈利伯顿能源服务公司 反应性映射
CN108229093A (zh) * 2018-01-23 2018-06-29 广西大学 饱和再生混凝土氯离子扩散系数多尺度预测模型的构建方法
CN109977028A (zh) * 2019-04-08 2019-07-05 燕山大学 一种基于遗传算法和随机森林的软件缺陷预测方法
CN110187060A (zh) * 2019-05-31 2019-08-30 华中科技大学 一种水泥固化淤泥强度超早期预测方法
CN110263431A (zh) * 2019-06-10 2019-09-20 中国科学院重庆绿色智能技术研究院 一种混凝土28d抗压强度预测方法
CN110610061A (zh) * 2019-09-30 2019-12-24 湖南大学 一种融合多源信息的混凝土塌落度高精度预测方法
CN110930198A (zh) * 2019-12-05 2020-03-27 佰聆数据股份有限公司 基于随机森林的电能替代潜力预测方法、系统、存储介质及计算机设备

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
基于GM-RBF神经网络组合模型的水泥强度预测方法;裘国华;申屠南瑛;施正伦;;科技导报(03);第56-61页 *
基于不同破坏准则的混凝土冻融双轴受压破坏模型研究;刘苗苗等;水力发电;第第45卷卷(第第10期期);第116-121页 *
用于水泥熟料fCaO预测的多核最小二乘支持向量机模型;赵朋程;刘彬;高伟;赵志彪;王美琪;;化工学报(06);第2480-2487 *

Also Published As

Publication number Publication date
CN111833970A (zh) 2020-10-27

Similar Documents

Publication Publication Date Title
CN111833970B (zh) 一种水泥熟料质量表征参数预测模型构建方法及其应用
CN111832101B (zh) 一种水泥强度预测模型的构建方法及水泥强度预测方法
CN106202946A (zh) 基于深度信念网络模型的水泥熟料游离钙含量预测方法
CN110975597B (zh) 一种水泥脱硝的神经网络混合优化方法
CN111639838B (zh) 一种适用于供水管网的水质监测点布局优化方法
CN114186749A (zh) 基于强化学习及遗传算法的柔性车间调度方法及模型
CN106327004A (zh) 一种基于熟料质量指标的水泥烧成过程优化方法
CN113033786B (zh) 基于时间卷积网络的故障诊断模型构建方法及装置
CN112163376A (zh) 一种基于天牛须搜索的极端随机树炉温预测控制方法
CN111027117B (zh) 胶凝砂砾石配合比关键指标预测抗压强度的bp神经网络分析方法
CN114169434A (zh) 一种负荷预测方法
CN112836902B (zh) 一种基于改进型bp神经网络的煤燃烧发热量预测方法
US20230307093A1 (en) Method for predicting dna recombination sites based on xgboost
Ehsani et al. Machine learning for predicting concrete carbonation depth: A comparative analysis and a novel feature selection
CN116010291A (zh) 基于均衡优化理论与灰色预测模型的多路径覆盖测试方法
CN111178627B (zh) 一种基于spca的神经网络混合优化预测方法
CN112881333B (zh) 一种基于改进免疫遗传算法的近红外光谱波长筛选方法
CN115545279A (zh) 一种风电场风电功率预测方法
CN114580756A (zh) 一种基于数据驱动的矿热炉节能优化方法及其装置
CN113762591A (zh) 一种基于gru和多核svm对抗学习的短期电量预测方法及系统
CN113723536A (zh) 一种电力巡检目标识别方法及系统
CN111639821A (zh) 一种水泥炉窑生产能耗预测方法及系统
Fang et al. Twin support vector regression based on fruit fly optimization algorithm
CN116486969B (zh) 基于遗传算法的材料最优相关性关系获取方法及应用
CN116993172A (zh) 一种基于分形进化学习的钢水质量多任务预测方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant