CN111950854A - 一种基于多层神经网络的焦炭质量指标预测方法 - Google Patents
一种基于多层神经网络的焦炭质量指标预测方法 Download PDFInfo
- Publication number
- CN111950854A CN111950854A CN202010675306.2A CN202010675306A CN111950854A CN 111950854 A CN111950854 A CN 111950854A CN 202010675306 A CN202010675306 A CN 202010675306A CN 111950854 A CN111950854 A CN 111950854A
- Authority
- CN
- China
- Prior art keywords
- formula
- model
- data
- tree
- quality index
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 239000000571 coke Substances 0.000 title claims abstract description 60
- 238000000034 method Methods 0.000 title claims abstract description 43
- 238000013528 artificial neural network Methods 0.000 title claims abstract description 23
- 238000012549 training Methods 0.000 claims abstract description 34
- 238000004519 manufacturing process Methods 0.000 claims abstract description 15
- 238000010219 correlation analysis Methods 0.000 claims abstract description 12
- NINIDFKCEFEMDL-UHFFFAOYSA-N Sulfur Chemical compound [S] NINIDFKCEFEMDL-UHFFFAOYSA-N 0.000 claims abstract description 9
- 229910052717 sulfur Inorganic materials 0.000 claims abstract description 9
- 239000011593 sulfur Substances 0.000 claims abstract description 9
- 238000004140 cleaning Methods 0.000 claims abstract description 8
- 238000005457 optimization Methods 0.000 claims abstract description 4
- 230000006870 function Effects 0.000 claims description 39
- 239000003245 coal Substances 0.000 claims description 32
- 210000002569 neuron Anatomy 0.000 claims description 11
- 230000008569 process Effects 0.000 claims description 11
- 238000003062 neural network model Methods 0.000 claims description 8
- 238000012546 transfer Methods 0.000 claims description 8
- 238000006243 chemical reaction Methods 0.000 claims description 5
- 238000010606 normalization Methods 0.000 claims description 5
- 238000012545 processing Methods 0.000 claims description 5
- 238000012360 testing method Methods 0.000 claims description 5
- 238000004364 calculation method Methods 0.000 claims description 4
- 230000000694 effects Effects 0.000 claims description 4
- 238000002474 experimental method Methods 0.000 claims description 3
- 238000012886 linear function Methods 0.000 claims description 3
- 238000004458 analytical method Methods 0.000 claims description 2
- 238000003066 decision tree Methods 0.000 claims description 2
- 230000009466 transformation Effects 0.000 claims description 2
- 230000002708 enhancing effect Effects 0.000 claims 1
- 230000001737 promoting effect Effects 0.000 claims 1
- 238000004939 coking Methods 0.000 abstract description 22
- 238000009776 industrial production Methods 0.000 abstract description 2
- 238000011156 evaluation Methods 0.000 description 6
- 229910000831 Steel Inorganic materials 0.000 description 3
- 238000010276 construction Methods 0.000 description 3
- 238000002156 mixing Methods 0.000 description 3
- 239000010959 steel Substances 0.000 description 3
- XEEYBQQBJWHFJM-UHFFFAOYSA-N Iron Chemical compound [Fe] XEEYBQQBJWHFJM-UHFFFAOYSA-N 0.000 description 2
- 230000002159 abnormal effect Effects 0.000 description 2
- 238000007418 data mining Methods 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000005259 measurement Methods 0.000 description 2
- 230000007246 mechanism Effects 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- NAWXUBYGYWOOIX-SFHVURJKSA-N (2s)-2-[[4-[2-(2,4-diaminoquinazolin-6-yl)ethyl]benzoyl]amino]-4-methylidenepentanedioic acid Chemical compound C1=CC2=NC(N)=NC(N)=C2C=C1CCC1=CC=C(C(=O)N[C@@H](CC(=C)C(O)=O)C(O)=O)C=C1 NAWXUBYGYWOOIX-SFHVURJKSA-N 0.000 description 1
- 238000003723 Smelting Methods 0.000 description 1
- 238000009825 accumulation Methods 0.000 description 1
- 230000002411 adverse Effects 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000015556 catabolic process Effects 0.000 description 1
- 238000007405 data analysis Methods 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 238000006731 degradation reaction Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 238000009826 distribution Methods 0.000 description 1
- 238000000556 factor analysis Methods 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 229910052742 iron Inorganic materials 0.000 description 1
- 238000012417 linear regression Methods 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000000197 pyrolysis Methods 0.000 description 1
- 239000002994 raw material Substances 0.000 description 1
- 238000012216 screening Methods 0.000 description 1
- 239000004449 solid propellant Substances 0.000 description 1
- 239000000126 substance Substances 0.000 description 1
- 238000012706 support-vector machine Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0639—Performance analysis of employees; Performance analysis of enterprise or organisation operations
- G06Q10/06393—Score-carding, benchmarking or key performance indicator [KPI] analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/243—Classification techniques relating to the number of classes
- G06F18/24323—Tree-organised classifiers
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0639—Performance analysis of employees; Performance analysis of enterprise or organisation operations
- G06Q10/06395—Quality analysis or management
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/04—Manufacturing
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02P—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
- Y02P90/00—Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
- Y02P90/30—Computing systems specially adapted for manufacturing
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Human Resources & Organizations (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Strategic Management (AREA)
- Economics (AREA)
- Data Mining & Analysis (AREA)
- Entrepreneurship & Innovation (AREA)
- Software Systems (AREA)
- Educational Administration (AREA)
- Artificial Intelligence (AREA)
- General Engineering & Computer Science (AREA)
- Evolutionary Computation (AREA)
- Development Economics (AREA)
- Mathematical Physics (AREA)
- General Health & Medical Sciences (AREA)
- Tourism & Hospitality (AREA)
- Marketing (AREA)
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Computing Systems (AREA)
- General Business, Economics & Management (AREA)
- Computational Linguistics (AREA)
- Operations Research (AREA)
- Biophysics (AREA)
- Molecular Biology (AREA)
- Game Theory and Decision Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Quality & Reliability (AREA)
- Biomedical Technology (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Evolutionary Biology (AREA)
- Manufacturing & Machinery (AREA)
- Primary Health Care (AREA)
- Medical Informatics (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了一种基于多层神经网络的焦炭质量指标预测方法,属于工业信息技术领域。采用工业实际生产数据,首先对数据进行清洗,采用梯度增强树对影响焦炭质量指标的因素进行相关性分析,选择出与灰分、硫分、M10、M40、CRI和CSR等最相关的变量,进而构建训练样本,建立多层神经网络预测模型来对焦炭质量指标进行预测,并采用智能优化算法对模型中的变量进行优化,给出最终的焦炭质量指标预测结果。本发明能够对焦炭质量指标进行高精度预测,满足工业生产需求,并为后续生产提供数据支撑和指导,亦可推广到其他焦化产品行业。
Description
技术领域
本发明具体涉及一种基于多层神经网络的焦炭质量指标预测方法,属于 工业信息技术领域。
背景技术
焦炭作为钢铁工业生产过程中的一种重要的固体燃料,是由煤在高温条件 下经干馏等工艺获得的。目前,焦化厂的配煤基本是以肥煤和焦煤等优质炼焦 煤为主,其中国内焦煤加肥煤的最大配比超过了80%,弱黏煤不足5%甚至不配 弱黏煤(王帅.(2018).炼焦煤分析及焦炭质量预测的研究.(Doctoral dissertation))。而从现有生产工艺与我国煤炭资源分布来看,气煤、1/3焦 煤等弱黏煤和中黏煤作为炼焦过程中的优质煤种,其储量和产量相对较大,但 在实际炼焦生产中配比偏低,造成了优质炼焦煤供不应求。因此,从能源的可 持续利用和国家战略发展的角度来看,更加科学的统筹与规划炼焦煤资源的开 发和利用,以及加强对稀缺煤种的保护与开采,成为了亟待解决的关键技术问 题。
此外,由于近年来我国钢铁产量逐年攀升,焦炭作为高炉炼铁的主要原料, 其需求量也急剧增加,导致了焦炭产能的扩张对炼焦煤需求量的大幅度上升, 出现了优质炼焦煤资源供应紧张、价格偏高的现象。企业炼焦煤来源矿点较多 且其质量波动较大,使得焦炭质量的稳定性降低,这也给高炉的冶炼带来不利 影响。因此,准确预测焦炭的质量,成为了焦化行业急需解决的问题。
鉴于此,国内外的研究者对焦炭质量的预测模型提出了各种不同的预测方 法(Zhang,Q.,Wu,X.,Feng,A.,&Shi,M..(2004).Prediction of coke quality atbaosteel.Fuel Processing Technology,86(1),1-11) (Golovko,M.B.,Drozdnik,I.D.,Miroshnichenko,D.V.,&Kaftan, Y.S..(2012).Predicting the yield of cokingbyproducts on the basis of elementary and petrographic analysis of the coalbatch.Coke and Chemistry,55(6),204-214),所建模型的差异性也较大,其根本原因在于各 焦化企业入炉煤质量各不相同以及每个焦化企业的炼焦工艺及炼焦操作条件互 有差异,因此现有的模型无法直接满足钢厂的实际生产。
发明内容
因此,本发明目的是提供一种基于多层神经网络的焦炭质量指标预测方 法,解决钢铁企业焦炭生产过程中的质量指标预测问题。方法使用采集自现场 的实际工业数据,首先对数据进行数据清洗;使用梯度增强树模型进行各因素 的相关性分析,并构建训练集;最后本发明采用多层神经网络模型实现焦炭质 量指标的准确预测。
具体的,本发明提供的基于多层神经网络的焦炭质量指标预测方法,具 体步骤如下:
(1)由现场数据库采集历史配合煤指标、工业参数以及对应的焦炭各质量 指标数据,经过数据清洗后作为基础数据样本;
(2)为减少预测模型的复杂度,降低相关性不强的因素对预测结果的影响, 采用极限梯度增强树方法对各因素进行相关性分析,选择出与结果相关性较高 的指标进行后续预测;
(3)对焦炭各质量指标建立多层神经网络(Multi-layer Neural Network) 模型,确定其输入层、隐含层数、隐含节点数以及输出层的确定;
(4)基于智能优化算法对模型中各变量参数进行优化,提高预测精度,并 给出最终的预测结果。
本发明的有益效果在于:本发明克服了传统焦炭质量指标预测方法对机 理依赖性过强、需假设线性关系以及平均精度较低的问题。首先基于梯度增强 树对影响焦炭质量指标的因素进行相关性分析,进而筛选出最相关的变量,并 基于多层神经网络对各质量指标进行预测。实验结果表明,其平均绝对误差与 平均相对误差等指标均高于国家标准和企业标准,符合实际生产应用的需求。
附图说明
图1为相关性分析流程图
图2为数据处理与样本构建流程图
图3为质量指标预测的网络结构图
图4为本发明的总体流程图
图5(a)为相对焦炭灰分的特征重要性评估图
图5(b)为相对焦炭硫分的特征重要性评估图
图5(c)为相对焦炭M10的特征重要性评估图
图5(d)为相对焦炭M40的特征重要性评估图
图5(e)为相对焦炭CRI的特征重要性评估图
图5(f)为相对焦炭CSR的特征重要性评估图
图6为焦炭灰分预测值与测量值趋势图
图7为焦炭硫分预测值与测量值趋势图
图8为焦炭M10预测值与测量值趋势图
图9为焦炭M40预测值与测量值趋势图
图10为焦炭CRI预测值与测量值趋势图
图11为焦炭CSR预测值与测量值趋势图
具体实施方式
下面结合附图对本发明的具体实施方式进行说明:
本发明采用工业实际生产数据,首先对数据进行清洗,采用梯度增强树对 影响焦炭质量指标的因素进行相关性分析,选择出与灰分、硫分、M10、M40、 CRI和CSR等最相关的变量,进而构建训练样本,建立多层神经网络预测模型 来对焦炭质量指标进行预测,并采用智能优化算法对模型中的变量进行优化, 给出最终的焦炭质量指标预测结果。本发明能够对焦炭质量指标进行高精度预 测,满足工业生产需求,并为后续生产提供数据支撑和指导,亦可推广到其他 焦化产品行业。
(1)影响焦炭质量指标的相关性分析
为了减少预测模型的复杂度,降低相关性不强的因素对预测结果造成的影 响,对各因素进行相关性分析是十分有必要的。极限梯度增强树(Extreme Gradient BoostingTrees,EGBT)是一种集成学习算法,其通过提升训练多个 弱分类器从而组成一个强健的分类/回归模型,每个弱分类器都由CART回归树 构成。EGBT的思想是不断的训练新树来拟合之前树种群的预测残差,在训练完 成后,将每棵树对应叶节点的分数汇总即得样本的预测值。极限梯度增强树的 目标函数定义为:
其中:Obj表示目标函数,n表示样本数,yi表示第i个样本的类别标签,表 示模型对训练样本的预测值,表示为最终模型的预测误差,K表示树的 数量,fk表示第几个颗树,Ω(fk)即为正则项表示第k棵树的复杂度。F为所有 决策树代表的函数空间,,训练损失部分可写作
其中:Ω(ft)即为正则项表示第t棵树的复杂度,T为叶节点个数,wj表示各叶 节点的分数,系数γ和λ分别为控制叶节点个数和叶节点分数的权重。
式(1)给出了EGBT方法的训练、扩充和分配方法,每一棵树的结构则遵循 普通CART树的训练思想进行学习。将某次迭代后的集成模型定义如(4)所示:
公式(6)近似展开成二阶项形式,表示为公式(7):
将树拆分成结构部分q和叶子权重部分w,其中结构函数q把输入映射到 叶子的索引上,w给定每个索引号对应的椅子分数,则树的叶子节点值函数ft(x) 表示为公式(8):
ft(x)=wq(x),w∈RT,q:Rd→{1,2,…,T} (8)
公式(8)代入公式(7),整理如公式(9)所示:
公式(9)进行简化,表示为公式(10):
由公式(11)和公式(12)选出各个叶子节点的最佳值,相互比对相对应的 目标函数值,选出树的最优结构,当整个模型训练完成后,统计各个输入特 征在所有树节点中出现时所带来的分支信息增益来衡量其特征重要性,即可 得到该特征与目标指标的相关性。其技术路线如图1所示。
(2)数据处理与样本构建
随着大量数据集的不断积累,我们可以对其进行数据挖掘,从中挖掘出隐 含的先前未知的并具有潜在价值的信息。但大量学者在研究数据挖掘的过程中 普遍发现:“数据存储丰富但难以提取有效信息”,究其原因有二,一是缺乏行 之有效的数据分析技术,二是数据中存在许多异常数据。故进行数据清洗,剔 除或纠正数据中的异常数据,是非常有必要的。
本模型采用现场获取的生产数据作为训练集和测试集样本。由于实际生产 过程采集的数据比较复杂,存在错误数据(例如参数为0或负数)、缺失数据(有 个别参数没有记录)和非典型数据(数据明显偏离正常值且很少出现)等“脏 数据”,该数据不能作为训练样本和测试样本,必须剔除。操作包括删除错误数 据、删除缺失数据、删除非典型数据等步骤。本项目基于焦炭生产工艺知识及 焦化工程师长年累积的经验,初步建立数据清洗的规则,进而综合近期焦炭生 产的实际情况,确定最终的样本数据清洗规则,如表1所示,将超过取值范围 的数据全都清除。
表1样本数据取值范围
对数据进行处理之后,根据焦炭质量指标的相关性分析,基于样本权重构 造训练集,即将各因素对结果的影响以权重的方式分配到训练集中,更加突出 各因素对预测结果的不同影响。
在对训练集选取完毕之后,对数据进行归一化也是必不可少的。神经网络 误差反向传播算法中权值的学习采用绝对误差平方和为指标函数,各个输入数 据之间量纲往往不同,这势必造成各神经元在学习中收敛的不平衡性。例如配 合煤细度的数值在65-85之间,而配合煤的硫分在0.6-1.3之间,两者在数值 上差了几十倍,硫分的数值信息会被大数值信息所“淹没”。为了防止该情况发 生,可以通过尺度变换,将所有参数取值的都变换到[-1,1]的区间内,从而使 得网络训练一开始就给各输入分量以同等重要的地位。对于网络的输入、输出 数据,都需要进行归一化,具体的公式如下所示:
式中a、b为常量,Xmax、Xmin为每组因子变量的最大值和最小值。X、X′为每 组因子变量归一化前和归一化后的值。由于网络的输出是归一化后的输出值, 因而在模型工作过程中,对网络输出依据公式
进行反归一化换算。式中a、b与归一化公式的a、b同值,Xmax、Xmin为 输出样本的最大值和最小值,与公式四中的Xmax、Xmin同值,X′1、X1为网络输 出的归一化值和反归一化值,即X1为网络模型的最终输出。数据处理与样本构 建的流程图如图2所示。
(3)基于多层神经网络的焦炭质量指标预测
由于炼焦过程中存在复杂的化学反应,焦炭质量指标与配合煤的指标之间 存在较强的非线性关系,无法直接用线性函数表示,也无法直接基于工艺过程 构建机理模型。目前生产过程信息化程度较高,现场数据库中存有大量配合煤 指标、工艺过程参数、焦炭质量指标等的测量数据。因此,可采用基于数据的 方法来对该反应过程建模,并预测对应的质量指标。
目前,基于数据的机器学习预测方法已有许多研究,如线性回归模型、BP 神经网络、支持向量机等。其中,BP神经网络由于其自学习能力强、能以任意 精度逼近一个非线性函数的优点而被广泛应用于数据预测领域。针对炼焦过程 具有复杂的非线性关系的特点,本项目采用多层BP神经网络模型来进行质量指 标的预测。
通过多层神经网络建立焦炭质量指标预测模型的主要步骤如下:
步骤1:输入层和输出层的确定
输出层确定为焦炭质量指标,即焦炭灰分、硫分、M10、M40、CRI、CSR。对 于输入层,根据不同的质量指标,采用极限梯度增强树对输入参数进行相应的 特征选择,选取相关性强的指标作为多层神经网络模型的输入。
步骤2:隐含层数和隐节点数的确定
增加神经网络隐含层数,可以降低误差,拟合更加复杂的函数关系,但同 时也会增加训练时间和出现“过拟合”的概率。通过多次实验,确定隐含层数 为3层。隐含层节点的个数取决于训练样本数、样本噪声大小以及样本中蕴涵 规律的复杂程度。确定隐含层节点数常用的方法是试凑法,该方法常采用经验 公式
式中,I为输入层神经元的个数,K为输出层神经元的个数。神经网络模型的最 佳隐含层节点数一般会落入区间[2,2J+3]。在每次训练中,设定一个固定的训 练周期,分别使用不同的隐含层节点,训练模型之后检验模型,比较每次获得 的目标误差,找出最佳隐含层节点数。最终,确定三个隐含层的节点数目分别 为10、8、5。
步骤3:转移函数的选择
转移函数用于对求和单元的计算结果进行函数运算,进而得到神经元的输 出。模型采用sigmoid和purelin函数作为转移函数,tan-sigmoid可以将神 经元的输入范围从(-∞,+∞)映射到(-1,1),log-sigmoid可以将神经元的输入 范围从(-∞,+∞)映射到(0,1),purelin为线性函数。本发明综合运用这些转移 函数来处理和逼近输入和输出的非线性关系。
步骤4:动量项参数的选择
动量项参数的选择范围为0.1~0.9,其值的确定可以通过对比实验来实现; 即在模型建立过程中应用样本数据,动量每次递增0.1,其它条件不变进行测 试,取测试效果最好的值。
综上,本发明所提的焦炭质量指标预测模型的基本结构如图3所示,计算 流程如图4焦炭质量预测流程图所示。各因素分析结果如图5(a)-图5(f)所示, 质量指标的预测效果与误差分别如图6-图11所示,预测精度统计如表2所示。 其中精度统计指标平均绝对误差(MAE)的计算公式为
其中,T为计算长度,y(t)为预测值,yd(t)为真实测量值。
表2预测结果精度统计
质量名称 | 国家标准 | 企业标准 | 预测结果(MAE) |
灰分 | 0.2 | 0.15 | 0.10 |
硫分 | 0.05 | 0.02 | 0.01 |
M<sub>10</sub> | 1.0 | 0.5 | 0.03 |
M<sub>40</sub> | 3.0 | 1.0 | 0.20 |
CRI | 2.4 | 0.5 | 0.39 |
CSR | 3.2 | 0.5 | 0.47 |
以上所述是本发明的优选实施方式,应当指出,对于本技术领域的普通 技术人员来说,在不脱离本发明所述原理的前提下,还可以作出若干改进和 润饰,这些改进和润饰也应视为本发明的保护范围。
Claims (4)
1.一种基于多层神经网络的焦炭质量指标预测方法,其特征在于,所述方法具体包括:
步骤一 由现场数据库采集历史配合煤指标、工业参数以及对应的焦炭各质量指标数据,经过数据清洗后作为基础数据样本;
步骤二 采用极限梯度增强树方法对各因素进行相关性分析,选择出与结果相关性较高的指标进行后续预测;
步骤三 对焦炭各质量指标建立多层神经网络模型,确定其输入层、隐含层数、隐含节点数以及输出层的确定;
步骤四 基于智能优化算法对模型中各变量参数进行优化,提高预测精度,并给出最终的预测结果。
2.如权利要求1所述的基于多层神经网络的焦炭质量指标预测方法,其特征在于,所述方法中相关性分析具体为:
对各因素进行极限梯度增强树相关性分析,通过提升训练多个弱分类器从而组成一个强健的分类/回归模型,每个弱分类器都由CART回归树构成,极限梯度增强树不断的训练新树来拟合之前树种群的预测残差,在训练完成后,将每棵树对应叶节点的分数汇总即得样本的预测值,极限梯度增强树的目标函数定义如公式一所示:
其中:Obj表示目标函数,n表示样本数,yi表示第i个样本的类别标签,表示模型对训练样本的预测值,表示为最终模型的预测误差,K表示树的数量,fk表示第几个颗树,Ω(fk)即为正则项表示第k棵树的复杂度。F为所有决策树代表的函数空间,训练损失部分如公式二所示
其中:Ω(ft)即为正则项表示第t棵树的复杂度,T为叶节点个数,wj表示各叶节点的分数,系数γ和λ分别为控制叶节点个数和叶节点分数的权重。
具体实施方式如下:公式一给出了EGBT方法的训练、扩充和分配方法,每一棵树的结构则遵循普通CART树的训练思想进行学习。将某次迭代后的集成模型定义如公式四所示:
公式六近似展开成二阶项形式,表示为公式七:
ft(x)=wq(x),w∈RT,q:Rd→{1,2,…,T} 公式八
公式八代入公式七,整理如公式九所示:
公式九进行简化,表示为公式十:
由公式十一和公式十二选出各个叶子节点的最佳值,相互比对相对应的目标函数值,选出树的最优结构,当整个模型训练完成后,统计各个输入特征在所有树节点中出现时所带来的分支信息增益来衡量其特征重要性,即可得到该特征与目标指标的相关性。
3.如权利要求2所述的基于多层神经网络的焦炭质量指标预测方法,其特征在于,所述方法中数据清洗后作为基础数据样本具体包括:
采用现场获取的生产数据作为训练集和测试集样本,剔除数据操作包括删除错误数据、删除缺失数据、删除非典型数据,将超过取值范围的数据全都清除;
对数据进行处理之后,根据焦炭质量指标的相关性分析,基于样本权重构造训练集,即将各因素对结果的影响以权重的方式分配到训练集中;
在对训练集选取完毕之后,对数据进行归一化,通过尺度变换,将所有参数取值的都变换到[-1,1]的区间内,从而使得网络训练一开始就给各输入分量以同等重要的地位,对于网络的输入、输出数据,都进行归一化,具体的公式如公式十三所示:
式中a、b为常量,Xmax、Xmin为每组变量的最大值和最小值,X、X′为每组变量归一化前和归一化后的值,由于网络的输出是归一化后的输出值,因而在模型工作过程中,对网络输出依据公式十四进行反归一化换算,
式中a、b为常量,与公式四的a、b同值,Xmax、Xmin为输出样本的最大值和最小值,与公式四中的Xmax、Xmin同值,X′1、X1为网络输出的归一化值和反归一化值,即X1为网络模型的最终输出。
4.如权利要求3所述的基于多层神经网络的焦炭质量指标预测方法,其特征在于,所述方法中步骤三具体包括:
采用基于数据的方法来对该反应过程建模,并预测对应的质量指标,具体采用多层BP神经网络模型来进行质量指标的预测,
通过多层神经网络建立焦炭质量指标预测模型的主要步骤如下:
步骤三一:输入层和输出层的确定
输出层确定为焦炭质量指标,即焦炭灰分、硫分、M10、M40、CRI、CSR,对于输入层,根据不同的质量指标,采用极限梯度增强树对输入参数进行相应的特征选择,选取相关性强的指标作为多层神经网络模型的输入;
步骤三二:隐含层数和隐节点数的确定
确定隐含层和隐节点数采用试凑法,采用公式十五
式中,I为输入层神经元的个数,K为输出层神经元的个数,神经网络模型的最佳隐含层节点数一般会落入区间[2,2J+3],在每次训练中,设定一个固定的训练周期,分别使用不同的隐含层节点,训练模型之后检验模型,比较每次获得的目标误差,找出最佳隐含层数和隐节点数;
步骤三三:转移函数的选择
转移函数用于对求和单元的计算结果进行函数运算,进而得到神经元的输出,模型采用sigmoid和purelin函数作为转移函数,tan-sigmoid可以将神经元的输入范围从(-∞,+∞)映射到(-1,1),log-sigmoid可以将神经元的输入范围从(-∞,+∞)映射到(0,1),purelin为线性函数,运用这些转移函数来处理和逼近输入和输出的非线性关系;
步骤三四:动量项参数的选择
动量项参数的选择范围为0.1~0.9,其值的确定可以通过对比实验来实现;即在模型建立过程中应用样本数据,动量每次递增0.1,其它条件不变进行测试,取测试效果最好的值。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010675306.2A CN111950854B (zh) | 2020-07-14 | 2020-07-14 | 一种基于多层神经网络的焦炭质量指标预测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010675306.2A CN111950854B (zh) | 2020-07-14 | 2020-07-14 | 一种基于多层神经网络的焦炭质量指标预测方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111950854A true CN111950854A (zh) | 2020-11-17 |
CN111950854B CN111950854B (zh) | 2022-04-19 |
Family
ID=73341049
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010675306.2A Active CN111950854B (zh) | 2020-07-14 | 2020-07-14 | 一种基于多层神经网络的焦炭质量指标预测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111950854B (zh) |
Cited By (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112580257A (zh) * | 2020-12-10 | 2021-03-30 | 东北大学 | 基于深度学习的复杂工业系统预报模型构建方法、装置、设备及存储介质 |
CN112801366A (zh) * | 2021-01-27 | 2021-05-14 | 上海微亿智造科技有限公司 | 工业质量数据指标智能预测方法、系统及介质 |
CN113408186A (zh) * | 2021-05-10 | 2021-09-17 | 包头钢铁(集团)有限责任公司 | 一种冶金焦炭质量预测影响因素确定方法 |
CN113836786A (zh) * | 2021-08-03 | 2021-12-24 | 包头钢铁(集团)有限责任公司 | 一种结合焦炉加热制度参数的智能冶金焦炭预测方法 |
CN114580963A (zh) * | 2022-03-18 | 2022-06-03 | 武汉科技大学 | 一种基于dnn神经网络的复合产品的质量指标预测方法 |
CN114692986A (zh) * | 2022-04-11 | 2022-07-01 | 山东青博工业科技有限公司 | 一种基于神经网络模型的炼焦人工智能配煤系统 |
CN114971258A (zh) * | 2022-05-20 | 2022-08-30 | 安徽工业大学 | 基于焦炭质量预测的工业流程优化方法及系统 |
CN115294671A (zh) * | 2022-08-08 | 2022-11-04 | 杭州哲达科技股份有限公司 | 一种空压机出口压力预测方法和预测系统 |
CN115331394A (zh) * | 2022-08-30 | 2022-11-11 | 重庆地质矿产研究院 | 基于关键参数预测值降低地质灾害预警系统故障率的方法 |
CN115394052A (zh) * | 2022-08-30 | 2022-11-25 | 重庆地质矿产研究院 | 基于机器学习获得地质灾害预警关键参数预测值的方法 |
WO2023005302A1 (zh) * | 2021-07-26 | 2023-02-02 | 东南大学 | 一种生物质焦气化反应特性的预测方法 |
CN115796707A (zh) * | 2023-02-02 | 2023-03-14 | 浪潮通用软件有限公司 | 一种pvb树脂产品质量指标预测方法及装置 |
CN116841269A (zh) * | 2023-07-26 | 2023-10-03 | 枣庄杰富意振兴化工有限公司 | 基于煤焦油生产流程的工艺调整方法、系统及存储介质 |
CN117030635A (zh) * | 2023-10-09 | 2023-11-10 | 自贡市凤祥化工有限公司 | 一种基于多指标测定的硫酸铝的质量分析方法 |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102890144A (zh) * | 2012-10-22 | 2013-01-23 | 辽宁科技大学 | 煤岩镜质组全反射率非线性优化配煤预测焦炭质量的方法 |
CN103853915A (zh) * | 2014-01-14 | 2014-06-11 | 辽宁科技大学 | 一种由炼焦煤非线性优化配煤预测焦炭质量的方法 |
CN104318303A (zh) * | 2014-09-23 | 2015-01-28 | 杭州电子科技大学 | 遗传算法优化的rbf神经网络的焦化炉温度预测方法 |
CN104463327A (zh) * | 2014-10-27 | 2015-03-25 | 中国石油大学(北京) | 一种预测催化裂化焦炭产率的方法 |
CN108647373A (zh) * | 2018-03-21 | 2018-10-12 | 浙江大学 | 一种基于xgboost模型的工业过程软测量方法 |
CN108717867A (zh) * | 2018-05-02 | 2018-10-30 | 中国科学技术大学苏州研究院 | 基于梯度迭代树的疾病预测模型建立方法及装置 |
CN109359790A (zh) * | 2018-12-26 | 2019-02-19 | 黑龙江建龙化工有限公司 | 预测冶金焦炭质量指标的方法 |
CN109858709A (zh) * | 2019-03-01 | 2019-06-07 | 联想(北京)有限公司 | 一种优化焦炭生产的方法、装置和设备 |
-
2020
- 2020-07-14 CN CN202010675306.2A patent/CN111950854B/zh active Active
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102890144A (zh) * | 2012-10-22 | 2013-01-23 | 辽宁科技大学 | 煤岩镜质组全反射率非线性优化配煤预测焦炭质量的方法 |
CN103853915A (zh) * | 2014-01-14 | 2014-06-11 | 辽宁科技大学 | 一种由炼焦煤非线性优化配煤预测焦炭质量的方法 |
CN104318303A (zh) * | 2014-09-23 | 2015-01-28 | 杭州电子科技大学 | 遗传算法优化的rbf神经网络的焦化炉温度预测方法 |
CN104463327A (zh) * | 2014-10-27 | 2015-03-25 | 中国石油大学(北京) | 一种预测催化裂化焦炭产率的方法 |
CN108647373A (zh) * | 2018-03-21 | 2018-10-12 | 浙江大学 | 一种基于xgboost模型的工业过程软测量方法 |
CN108717867A (zh) * | 2018-05-02 | 2018-10-30 | 中国科学技术大学苏州研究院 | 基于梯度迭代树的疾病预测模型建立方法及装置 |
CN109359790A (zh) * | 2018-12-26 | 2019-02-19 | 黑龙江建龙化工有限公司 | 预测冶金焦炭质量指标的方法 |
CN109858709A (zh) * | 2019-03-01 | 2019-06-07 | 联想(北京)有限公司 | 一种优化焦炭生产的方法、装置和设备 |
Non-Patent Citations (3)
Title |
---|
周洪等: "基于神经网络的特大型焦炉焦炭质量预测研究", 《系统仿真学报》 * |
孟子薇等: "基于梯度增强回归树算法的磨浆过程打浆度软测量模型", 《造纸科学与技术》 * |
芦建文等: "采用多层神经网络预测焦炭质量", 《包钢科技》 * |
Cited By (17)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112580257A (zh) * | 2020-12-10 | 2021-03-30 | 东北大学 | 基于深度学习的复杂工业系统预报模型构建方法、装置、设备及存储介质 |
CN112801366A (zh) * | 2021-01-27 | 2021-05-14 | 上海微亿智造科技有限公司 | 工业质量数据指标智能预测方法、系统及介质 |
CN113408186A (zh) * | 2021-05-10 | 2021-09-17 | 包头钢铁(集团)有限责任公司 | 一种冶金焦炭质量预测影响因素确定方法 |
WO2023005302A1 (zh) * | 2021-07-26 | 2023-02-02 | 东南大学 | 一种生物质焦气化反应特性的预测方法 |
CN113836786A (zh) * | 2021-08-03 | 2021-12-24 | 包头钢铁(集团)有限责任公司 | 一种结合焦炉加热制度参数的智能冶金焦炭预测方法 |
CN114580963A (zh) * | 2022-03-18 | 2022-06-03 | 武汉科技大学 | 一种基于dnn神经网络的复合产品的质量指标预测方法 |
CN114692986A (zh) * | 2022-04-11 | 2022-07-01 | 山东青博工业科技有限公司 | 一种基于神经网络模型的炼焦人工智能配煤系统 |
CN114971258A (zh) * | 2022-05-20 | 2022-08-30 | 安徽工业大学 | 基于焦炭质量预测的工业流程优化方法及系统 |
CN115294671A (zh) * | 2022-08-08 | 2022-11-04 | 杭州哲达科技股份有限公司 | 一种空压机出口压力预测方法和预测系统 |
CN115331394A (zh) * | 2022-08-30 | 2022-11-11 | 重庆地质矿产研究院 | 基于关键参数预测值降低地质灾害预警系统故障率的方法 |
CN115394052A (zh) * | 2022-08-30 | 2022-11-25 | 重庆地质矿产研究院 | 基于机器学习获得地质灾害预警关键参数预测值的方法 |
CN115331394B (zh) * | 2022-08-30 | 2023-09-01 | 重庆地质矿产研究院 | 基于关键参数预测值降低地质灾害预警系统故障率的方法 |
CN115796707A (zh) * | 2023-02-02 | 2023-03-14 | 浪潮通用软件有限公司 | 一种pvb树脂产品质量指标预测方法及装置 |
CN116841269A (zh) * | 2023-07-26 | 2023-10-03 | 枣庄杰富意振兴化工有限公司 | 基于煤焦油生产流程的工艺调整方法、系统及存储介质 |
CN116841269B (zh) * | 2023-07-26 | 2024-01-23 | 枣庄杰富意振兴化工有限公司 | 基于煤焦油生产流程的工艺调整方法、系统及存储介质 |
CN117030635A (zh) * | 2023-10-09 | 2023-11-10 | 自贡市凤祥化工有限公司 | 一种基于多指标测定的硫酸铝的质量分析方法 |
CN117030635B (zh) * | 2023-10-09 | 2023-12-15 | 自贡市凤祥化工有限公司 | 一种基于多指标测定的硫酸铝的质量分析方法 |
Also Published As
Publication number | Publication date |
---|---|
CN111950854B (zh) | 2022-04-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111950854B (zh) | 一种基于多层神经网络的焦炭质量指标预测方法 | |
CN109002686B (zh) | 一种自动生成样本的多牌号化工过程软测量建模方法 | |
CN103927412B (zh) | 基于高斯混合模型的即时学习脱丁烷塔软测量建模方法 | |
CN110472349B (zh) | 一种基于eemd和深度卷积网络的热轧钢性能预测方法 | |
CN110428175B (zh) | 一种基于深度学习的热轧带钢板凸度预报方法 | |
CN111563706A (zh) | 一种基于lstm网络的多变量物流货运量预测方法 | |
CN114897227B (zh) | 基于改进随机森林算法的多钢种力学性能预报方法 | |
CN112966954A (zh) | 一种基于时间卷积网络的防洪调度方案优选方法 | |
CN114678080B (zh) | 转炉终点磷含量预测模型及构建方法、磷含量预测方法 | |
CN106777465A (zh) | 高含硫天然气净化工艺动态演化建模与节能优化方法 | |
CN109697566A (zh) | 机电产品加工工艺评价系统及其评价方法 | |
CN114239400A (zh) | 基于局部双加权概率隐变量回归模型的多工况过程自适应软测量建模方法 | |
CN115096357A (zh) | 一种基于ceemdan-pca-lstm的室内环境质量预测方法 | |
CN116187835A (zh) | 一种基于数据驱动的台区理论线损区间估算方法及系统 | |
CN106777466A (zh) | 基于st‑upfnn算法的高含硫天然气净化工艺的动态演化建模方法 | |
CN109711727A (zh) | 机电产品加工工艺组合评价系统及其评价方法 | |
CN111861002A (zh) | 基于数据驱动高斯学习技术的建筑物冷热负荷预测方法 | |
CN105354644A (zh) | 一种基于集成经验模态分解和1-范数支持向量机分位数回归的金融时间序列预测方法 | |
CN116823487A (zh) | 一种esg评价体系投资决策系统 | |
CN116757545A (zh) | 一种基于多任务深度学习的多级制造系统质量预测方法 | |
CN114971022B (zh) | 基于D-value-LSTM神经网络模型的风电功率预测方法 | |
CN115841184A (zh) | 一种基于工序聚类的工时预测方法 | |
CN113988409B (zh) | 一种基于多层门控神经网络的学情预测方法 | |
CN114798763B (zh) | 一种加热炉出钢板坯粗轧出口温度的预测方法及系统 | |
Tsai | The application of grey theory to taiwan pollution prediction |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |