CN116070929B - 一种基于自适应的局部动态焦炭质量预测方法及系统 - Google Patents

一种基于自适应的局部动态焦炭质量预测方法及系统 Download PDF

Info

Publication number
CN116070929B
CN116070929B CN202211247136.3A CN202211247136A CN116070929B CN 116070929 B CN116070929 B CN 116070929B CN 202211247136 A CN202211247136 A CN 202211247136A CN 116070929 B CN116070929 B CN 116070929B
Authority
CN
China
Prior art keywords
coal blending
scheme
historical
coal
blending scheme
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202211247136.3A
Other languages
English (en)
Other versions
CN116070929A (zh
Inventor
李欣荣
董武军
张涛
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Huayuan Computing Technology Shanghai Co ltd
Original Assignee
Huayuan Computing Technology Shanghai Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Huayuan Computing Technology Shanghai Co ltd filed Critical Huayuan Computing Technology Shanghai Co ltd
Priority to CN202211247136.3A priority Critical patent/CN116070929B/zh
Priority to PCT/CN2023/083565 priority patent/WO2024077876A1/zh
Publication of CN116070929A publication Critical patent/CN116070929A/zh
Application granted granted Critical
Publication of CN116070929B publication Critical patent/CN116070929B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0639Performance analysis of employees; Performance analysis of enterprise or organisation operations
    • G06Q10/06395Quality analysis or management
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/242Query formulation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2458Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
    • G06F16/2465Query processing support for facilitating data mining operations in structured databases
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/02Agriculture; Fishing; Forestry; Mining
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02PCLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
    • Y02P90/00Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
    • Y02P90/30Computing systems specially adapted for manufacturing

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Human Resources & Organizations (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Strategic Management (AREA)
  • Economics (AREA)
  • Databases & Information Systems (AREA)
  • Mathematical Physics (AREA)
  • Entrepreneurship & Innovation (AREA)
  • General Engineering & Computer Science (AREA)
  • Tourism & Hospitality (AREA)
  • Data Mining & Analysis (AREA)
  • General Business, Economics & Management (AREA)
  • Educational Administration (AREA)
  • Computational Linguistics (AREA)
  • Development Economics (AREA)
  • Marketing (AREA)
  • Primary Health Care (AREA)
  • Health & Medical Sciences (AREA)
  • Quality & Reliability (AREA)
  • General Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Animal Husbandry (AREA)
  • Marine Sciences & Fisheries (AREA)
  • Agronomy & Crop Science (AREA)
  • Game Theory and Decision Science (AREA)
  • Operations Research (AREA)
  • Mining & Mineral Resources (AREA)
  • Fuzzy Systems (AREA)
  • Probability & Statistics with Applications (AREA)
  • Software Systems (AREA)
  • Coke Industry (AREA)

Abstract

本发明提供一种基于自适应的局部动态焦炭质量预测方法,包括以下步骤:获取历史配煤全集;将待预测配煤方案和历史配煤方案转化为矩阵并进行距离度量;根据待预测配煤方案与各个历史配煤方案的所述距离d以及预设的阈值δ,从历史配煤全集中提取部分历史配煤方案作为配煤方案邻域subS;根据配煤方案邻域subS和预设条件,将历史配煤全集或配煤方案邻域subS中的历史配煤方案对预设模型进行训练;将待预测配煤方案输入目标预测模型进行预测。本发明还提供一种基于自适应的局部动态焦炭质量预测系统。本发明尤其适合生产煤种类型多的焦化企业进行配煤预测和科学配煤,从而做到真正的降本增效。

Description

一种基于自适应的局部动态焦炭质量预测方法及系统
技术领域
本发明涉及工业生产配煤方案领域,具体涉及一种基于自适应的局部动态焦炭质量预测方法及系统。
背景技术
随着配煤炼焦的技术在不断的升级迭代,企业对焦炭质量的要求越来越高的同时也对焦炭质量的稳定性提出更高的要求,另外,由于优质炼焦煤的紧缺,国内外煤焦市场的波动,对焦化企业的煤源采购造成一定的挑战,并由此影响最终焦炭质量的把控。因此,准确把握配煤方案的焦炭质量预测,成为焦化企业亟需解决的一大难题。
尽管目前的焦炭质量预测模型有不少,但大多无法适配配煤师的工作思路,更难以做到动态调整,因此,在缺乏数据量的情况下,模型预测表现会有所偏低,无法捕捉到更多的数据信息,而与预期产生较大差距,而在数据量充足的情况下,由于配煤炼焦与生产环境、原煤来源、库存结构等极大相关,则大量数据有时候却会给模型带来噪音,从而导致模型结果产生较大偏差,而影响最终的焦炭质量预测。
因此,一个稳定且误差低的焦炭质量预测模型对于焦化企业来讲,一方面可以避免由于煤源变化所引起的焦炭质量波动问题,另一方面在焦炭质量得到控制的前提下,可以做到有效的成本节约。
发明内容
本发明的目的在于提供一种精度上得到提升的基于自适应的局部动态焦炭质量预测方法及系统。
为解决上述技术问题,本发明提供一种基于自适应的局部动态焦炭质量预测方法,包括以下步骤:
获取历史配煤全集,历史配煤全集包括多个历史配煤方案;
将待预测配煤方案和历史配煤方案转化为矩阵并进行距离度量,计算得到待预测配煤方案与各个历史配煤方案的距离d;
根据待预测配煤方案与各个历史配煤方案的距离d以及预设的阈值δ,从历史配煤全集中提取部分历史配煤方案作为配煤方案邻域subS;
根据配煤方案邻域subS和预设条件,将历史配煤全集或配煤方案邻域subS中的历史配煤方案对预设模型进行训练,得到目标预测模型;
将待预测配煤方案输入目标预测模型进行预测,得到局部动态焦炭质量。
优选地,根据配煤方案邻域subS和预设条件,将历史配煤全集或配煤方案邻域subS中的历史配煤方案对预设模型进行训练,得到目标预测模型,具体包括以下步骤:
判断配煤方案邻域sub S是否满足预设条件;
若配煤方案邻域subS满足预设条件,则根据配煤方案邻域subS中的历史配煤方案对第一预设模型进行训练,得到目标预测模型;
若配煤方案邻域subS不满足预设条件,则根据历史配煤全集中的历史配煤方案对第二预设模型进行训练,得到目标预测模型。
优选地,判断配煤方案邻域sub S是否满足预设条件,具体包括以下步骤:
若配煤方案邻域subS不为空,则满足预设条件;
若配煤方案邻域subS为空,则不满足预设条件。
优选地,所述第一预设模型为一般线性模型;
所述第二预设模型为回归树模型。
优选地,根据待预测配煤方案与各个历史配煤方案的距离d以及预设的阈值δ,从历史配煤全集中提取部分历史配煤方案作为配煤方案邻域subS,具体包括以下步骤:
判断待预测配煤方案与各个历史配煤方案的距离d是否小于等于预设的阈值δ;
若待预测配煤方案与各个历史配煤方案的距离d小于等于预设的阈值δ,则将相应的历史配煤方案加入配煤方案邻域subS。
优选地,所述阈值δ为最少配煤方案个数阈值或最短距离阈值。
优选地,将历史配煤全集或配煤方案邻域subS中的历史配煤方案对预设模型进行训练,得到目标预测模型;具体包括以下步骤:
以历史配煤方案的煤种比例以及煤质指标作为输入参数,以历史配煤方案的焦炭质量作为输出参数,对预设模型进行训练,得到目标预测模型。
优选地,所述历史配煤方案和待预测配煤方案均包括煤种比例以及煤质指标;
所述矩阵为:
式中,为配煤方案中各单种煤的煤种比例,/>为配煤方案中各单种煤的煤质指标,m为配煤方案中单种煤个数,n为配煤方案中单种煤的煤质指标个数;
然后需要计算待预测配煤方案与各个历史配煤方案的距离d;
对待预测配煤方案与历史配煤方案的距离进行度量,计算公式如下所示:
d=fdist(Q′,Q)
式中,Q和Q'分别为待预测配煤方案和历史配煤方案转化后的矩阵;fdist为距离度量方法,d为距离。
优选地,所述距离度量方法为曼哈顿距离方法、欧氏距离方法、切比雪夫距离方法、闵可夫斯基距离方法、余弦夹角距离方法或马氏距离方法。
本发明还提供一种用于实现上述基于自适应的局部动态焦炭质量预测方法的一种基于自适应的局部动态焦炭质量预测系统,其特征在于,包括:
获取模块,用于获取历史配煤全集,历史配煤全集包括多个历史配煤方案;
转化模块,用于将待预测配煤方案和历史配煤方案转化为矩阵;
计算模块,用于对转化为矩阵的待预测配煤方案和历史配煤方案进行度量,计算得到待预测配煤方案与各个历史配煤方案的距离d;
提取模块,用于根据待预测配煤方案与各个历史配煤方案的所述距离d以及预设的阈值δ,从历史配煤全集中提取部分历史配煤方案作为配煤方案邻域subS;
训练模块,用于根据配煤方案邻域subS和预设条件,将历史配煤全集或配煤方案邻域subS中的历史配煤方案对预设模型进行训练,得到目标预测模型;
预测模块,用于将待预测配煤方案输入目标预测模型进行预测,得到局部动态焦炭质量
与现有技术相比,本发明的有益效果为:
本发明提供一种以配煤方案进行查询并且基于历史配煤方案做搜索构建相似配煤方案邻域,相似配煤方案邻域的准则基于度量距离,在相似配煤方案邻域基础上构建的预测模型可以是线性也可以是非线性,该预测方法可以称之为“局部预测”,考虑到配煤方案邻域的构建也需要消耗一定的运算时间,因此预测模型的选择可以从精度以及运算速度的平衡中进行选择。经过“查询”、“搜索”、“配煤方案邻域构建”、“局部预测”等四个步骤所计算得到的焦炭质量相比于以往的单步骤预测模型在精度上得到一定的提升,尤其适合来煤渠道广,生产煤种类型多的焦化企业进行配煤预测和科学配煤,从而进行企业可以做到真正的降本增效。
本发明通过需要查询的配煤单,在历史数据集搜索并构建与所查询的配煤单相似的数据集作为配煤方案邻域,并以该配煤方案邻域为训练数据集进行预测模型的构建,使得每次查询都会进行一次动态的建模,最终获得该查询配煤单的焦炭质量指标预测,包括焦炭CRI、CSR、M10、M40等。
附图说明
下面结合附图对本发明的具体实施方式作进一步详细说明。
图1是本发明一种基于自适应的局部动态焦炭质量预测方法的流程示意图;
图2是模型预测表现示意图。
具体实施方式
在下面的描述中阐述了很多具体细节以便于充分理解本发明。但是本发明能够以很多不同于在此描述的其它方式来实施,本配煤方案邻域技术人员可以在不违背本发明内涵的情况下做类似推广,因此本发明不受下面公开的具体实施的限制。
在本说明书一个或多个实施例中使用的术语是仅仅出于描述特定实施例的目的,而非旨在限制本说明书一个或多个实施例。在本说明书一个或多个实施例和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式,除非上下文清楚地表示其他含义。还应当理解,本说明书一个或多个实施例中使用的术语“和/或”是指并包含一个或多个相关联的列出项目的任何或所有可能组合。
应当理解,尽管在本说明书一个或多个实施例中可能采用术语第一、第二等来描述各种信息,但这些信息不应限于这些术语。这些术语仅用来将同一类型的信息彼此区分开。例如,在不脱离本说明书一个或多个实施例范围的情况下,第一也可以被称为第二,类似地,第二也可以被称为第一。取决于语境,如在此所使用的词语“如果”可以被解释成为“在……时”或“当……时”或“响应于确定”。
下面结合附图1-2对本发明做进一步的详细描述:
一种基于自适应的局部动态焦炭质量预测方法,包括以下步骤:
1)、获取历史配煤全集,历史配煤全集包括多个历史配煤方案;
2)、将待预测配煤方案和历史配煤方案转化为矩阵并进行度量,计算得到待预测配煤方案与各个历史配煤方案的距离d;
历史配煤方案主要包含煤种比例以及煤质指标,因此,对于配煤方案矩阵Q,可通过矩阵来表示如下:
式中,为配煤方案中各单种煤的煤种比例,/>为配煤方案中各单种煤的煤质指标,m为配煤方案中单种煤个数,n为配煤方案中单种煤的煤质指标个数。
然后需要计算待预测配煤方案与所有历史配煤方案的距离;
对两个配煤方案进行度量,可通过距离来表征,则有如下定义:
d=fdist(Q′,Q) (1)
式中,Q和Q'分别为待预测配煤方案和历史配煤方案转化后的矩阵;fdist为距离度量方法,d为距离。
考虑到配煤方案所用煤种是可变的,即m是不固定的,因此为方便计算两个不等矩阵(待预测配煤方案和历史配煤方案)的距离,对配煤方案进行数值处理。具体工厂所用煤种类型有所不一样,但考虑到一般性,根据《中国煤炭分类国家标准(GB/T 5751-2009)》且结合大部分的用煤场景,可对每个配煤方案的煤种归类为气、肥、焦、瘦、1/3焦、贫瘦、气肥、贫煤等8类煤种类型,因此,结合煤种类型并通过配煤比例以及对应的单种煤的煤质指标,可以将Q∈Rm×n转化为A∈R8×n,A为配煤方案转化后的矩阵,可通过如下过程进行转化:
对于配煤方案Q:
属于气煤类型(QM)的煤种编号有{0,…,m1};
属于肥煤(FM)类型的煤种编号有{m1+1,…,m2};
属于焦煤(JM)类型的煤种编号有{m2+1,…,m3};
属于瘦煤(SM)类型的煤种编号有{m3+1,…,m4};
属于1/3焦煤(1/3JM)类型的煤种编号有{m4+1,…,m5};
属于贫瘦煤(PS)类型的煤种编号有{m5+1,…,m6};
属于气肥煤(QF)类型的煤种编号有{m6+1,…,m7};
属于贫煤(PM)类型的煤种编号有{m7+1,…,m8}。
因此,有:
则对于待预测配煤方案转化后的矩阵A∈R8×n,有
因此对于公式(1),有
d=fdist(Q′,Q)=fdist(A′,A) (2)
对于距离度量方法fdist,可以从表1中选择:
表1
式中:x1k为待预测配煤方案转化后的矩阵中第k行的数据;x2k为历史配煤方案转化后的矩阵中第k行的数据;X1为待预测配煤方案转化后的矩阵;X2为历史配煤方案转化后的矩阵;n代表n维空间;d12与d同样代表距离。
3)、根据待预测配煤方案与各个历史配煤方案的距离d以及预设的阈值δ,从历史配煤全集中提取部分历史配煤方案作为配煤方案邻域subS;
可通过阈值δ来限定配煤方案邻域范围,阈值δ可以是配煤方案个数,如获取距离d最小的δ个历史配煤方案作为配煤方案邻域subS,也可以是距离阈值(如果采用距离来度量相似度的方法)。则对于相似度量方法所得的配煤方案集合S’,通过阈值筛选可得待查询配煤方案的配煤方案邻域,其配煤方案邻域为历史配煤方案全集S的子集subS,结合距离d,则有,
Q'∈sub S,if d≤δ
4)、根据配煤方案邻域subS和预设条件,将历史配煤全集或配煤方案邻域subS中的历史配煤方案对预设模型进行训练,得到目标预测模型;
其中:以煤种比例以及煤质指标作为输入参数,以焦炭质量作为输出,历史配煤方案中包含煤种比例、煤质指标、焦炭质量;
配煤方案邻域subS作为数据输入,预测模型可从一般线性模型、支持向量机、回归树和多层感知机进行选择,但考虑到现实生产中,配煤方案数量有限,因此选取回归树模型以及一般线性模型进行预测,预设模型包括第一预设模型和第二预设模型;可通过以下表2来决定模型的选择:
表2
在配煤方案邻域sub S为空时,使用步骤1历史配煤全集S中所有历史配煤方案共同作为输入。
对于配煤方案邻域sub S不为空所选择的预测模型(第一预设模型)主要考虑到以下:
(1)一般情况下配煤方案邻域sub S的数据量相对较少,采用复杂模型容易过拟合;
(2)考虑到计算速度,由于在预测前需要构建配煤方案邻域,且如果配煤方案邻域sub S不为空,需要每次进行模型训练,会造成一定程度的计算消耗,因此选择一般线性模型可提升计算速度;
对于配煤方案邻域sub S为空所选择的预测模型(第二预设模型)主要考虑到以下:
(1)历史配煤全集S数据量充足,可以进行复杂度相对较高的模型构建;
(2)历史配煤全集S训练所得的模型可以重复使用,不需要每次查询进行模型构建。
5)、将待预测配煤方案输入目标预测模型进行预测,得到待预测的配煤方案的焦炭质量。
本发明还提供一种用于实现上述基于自适应的局部动态焦炭质量预测方法的一种基于自适应的局部动态焦炭质量预测系统,包括:
获取模块,用于获取历史配煤全集,历史配煤全集包括多个历史配煤方案;
转化模块,用于将待预测配煤方案和历史配煤方案转化为矩阵;
计算模块,用于对转化为矩阵的待预测配煤方案和历史配煤方案进行度量,计算得到待预测配煤方案与各个历史配煤方案的距离d;
提取模块,用于根据待预测配煤方案与各个历史配煤方案的所述距离d以及预设的阈值δ,从历史配煤全集中提取部分历史配煤方案作为配煤方案邻域subS;
训练模块,用于根据配煤方案邻域subS和预设条件,将历史配煤全集或配煤方案邻域subS中的历史配煤方案对预设模型进行训练,得到目标预测模型;
预测模块,用于将待预测配煤方案输入目标预测模型进行预测,得到局部动态焦炭质量。
为了更好的说明本发明的技术效果,本发明提供如下具体实例说明上述技术流程:
实例1:
步骤一、构建历史配煤方案全集:
从历史配煤方案中选择过去一年的的配煤方案共212张配煤方案,选择前200张作为构造历史配煤全集所用的历史配煤方案,剩余12张历史配煤方案作为测试数据集,每张历史配煤方案的单种煤共有13个煤质指标(包括3个工分指标、2个粘结指标以及8个煤岩指标),对每张历史配煤方案进行如下转换:
对于每个历史配煤方案,属于气煤类型(QM)的煤种编号有{0,…,m1},属于肥煤(FM)类型的煤种编号有{m1+1,…,m2},属于焦煤(JM)类型的煤种编号有{m2+1,…,m3},属于瘦煤(SM)类型的煤种编号有{m3+1,…,m4},属于1/3焦煤(1/3JM)类型的煤种编号有{m4+1,…,m5},属于贫瘦煤(PS)类型的煤种编号有{m5+1,…,m6},属于气肥煤(QF)类型的煤种编号有{m6+1,…,m7},属于贫煤(PM)类型的煤种编号有{m7+1,…,m8},其中m1、m2、m3、m4、m5、m6、m7、m8均属于整数域,根据单种煤所属类型以及单种煤所在配煤方案中的比例,可得如下
则对于每个配煤方案,可表征为大小为8×13的矩阵,即对于配煤方案全集来讲,共有200条数据,每条数据大小为8×13的矩阵,测试用数据集有12条,每条数据大小为8×13的矩阵。
步骤二、基于历史配煤全集构造预测模型:
对于历史配煤全集,其规格为200×8×13,对历史配煤全集进行处理,即对于每条数据进行列加和,使得变换后的历史配煤全集规格为200×1×13,每条数据的转换如下:
其中
基于转换后的历史配煤全集,采用回归树算法进行预测模型的构建。由于是树模型,即在回归问题中,对于每一片叶子,都输出一个预测值,预测值一般是该片叶子所含训练集元素输出的均值
cm=ave(yi|xi∈leafm)
对于历史配煤方案,其标签yi可以是焦炭的CSR、CRI、M10、M40以及灰分和硫分等,在本实例中,选择焦炭的CSR作为标签。因此结合上述的数据转换,则给定一个转换后的历史配煤全集进行预测建模,有
D={(x1,y1)…(x200,y200)}
其中xi是一个13维向量,xi=(a'01…a'0,13)。
回归问题的目标就是构造一个函数f(x)能够拟合数据集D中的元素,使得mse(均方差)最小,即:
假设一颗构建好的回归树有M片叶子,这意味着将输入空间x划分成为了M个单元R1,R2,…,RM,同时意味着回归树至多会有M个不同的预测值,则最小化mse公式如下:
其中cm表示第m片叶子的预测值。
想要最小化CART总体的mse,只需要最小化每一片叶子的mse即可,而最小化一片叶子的mse,只需要将预测值设定为叶子中含有的训练集元素的均值,即:
cm=ave(yi|xi∈leafm) (3)
所以,在每一次划分中,选择切分变量(splitting variable)和切分点(splitting point)时(也就是选择feature和将该feature space一分为二的split),树模型在训练集上的mse最小,也就是每片叶子的mse之和最小。
所以,在每一次的划分中,选择切分变量(splitting variable)和切分点(splitting point)时(也就是选择feature和将该feature space一分为二的split),使得模型在训练集上的mse最小,也就是每片叶子的mse之和最小。
这里采用启发式的方法,遍历所有的切分变量和切分点,然后选出叶子节点mse之和最小的那种情况作为划分。选择第j个煤质指标和它的取值s,作为切分变量和切分点,则切分变量和切分点将父节点的输入空间一分为二:R1{j,s}={x|xj≤s}
R2{j,s}={x|xj>s} (4)
回归树选择切分变量j和切分点s的公式如下:
采取遍历的方式,可以将切分变量j和切分点s找出来:先固定煤质指标j再选出在该煤质指标下的最佳划分s;对每一个煤质指标都这么做,那么就可以得到13个煤质指标对应的最佳划分,从这13个值中取最小值即可得到令全局最优的(j,s)。
式(5)中第一项得到的c1值按照式(3)就是ave(yi|xi∈R1{j,s}),同理,第二项中c2=ave(yi|xi∈R2{j,s})。此时,有相应的输出值:
对得到的两个子区域继续进行划分,直至满足条件,这里设树的深度为10。最后将输入空间划分为M个区域R1,R2,…,RM,这里的M可通过超参数搜索得到最优值,最终生成回归树预测模型:
式中:M代表空间区域;m为大于1的正整数;cm代表第m片叶子的预测值;Rm代表第m个输入空间区域;x代表输入变量;I为单位矩阵。
步骤三、构造查询配煤方案邻域:
对于12个测试数据集中的待预测配煤方案,通过步骤一中所述的转换方法,转换后的每一个测试配煤方案通过列求和,如下
其中
采用欧氏距离作为度量两个配煤方案的相似度,欧式距离计算如下:
即对于每一个测试配煤方案,计算该测试配煤方案与全集数据中的每条数据的距离,并且给定阈值δ,若di,j小于等于阈值δ,则为待预测配煤方案的配煤方案邻域中的元素,若在全集数据中的所有距离都大于阈值δ,则该测试配煤方案的配煤方案邻域为空。
步骤四:构造查询配煤方案邻域上的预测模型
考虑到每次做配煤方案查询都需要构建配煤方案邻域,且每次的配煤方案邻域并不一定相同,这个过程会消耗计算时间,并且所得配煤方案邻域数据量一般较历史配煤全集要少,因此对于配煤方案邻域不为空的情况,采用线性模型作为预测模型,如下:
yi=g(x)=α01xi,1+…+α13xi,13 (9)
xi=(xi,1…xi,13),/>为邻域。对于一般线性模型的求解,可以通过最小二乘法求得;α0~α13为模型参数。
步骤五、局部动态预测:
对于查询配煤方案的配煤方案邻域,若配煤方案邻域不为空,则选择步骤三所得的模型作为预测模型,若配煤方案邻域为空则选择步骤二所得的模型作为预测模型。在本实施例中的12张用作测试的查询配煤方案中,其中10张查询配煤方案的配煤方案邻域不为空,另外两张的查询配煤方案的配煤方案邻域为空。
步骤六、结果评估:
本实施例选择步骤二中所得的模型作为基准模型,不加入自适应的局部动态预测,也即没有步骤三和步骤四,以焦炭CSR作为焦炭质量预测目标,实现的对比结果如下表所示:
模型 误差
基准模型 2.84
自适应的局部动态预测模型 2.23
从结果来看,本发明中的自适应的局部动态预测模型误差仅为2.23,优于基准模型的2.84,因此有以下结论:
(1)、自适应的局部动态预测模型对于每条输入的测试数据,在大多数情况下(即配煤方案邻域不为空的情况)都会进行一次配煤方案邻域搜索,能有效的过滤噪音数据,提高数据利用效率;
(2)、自适应的局部动态预测模型在配煤方案邻域不为空的情况下,每次测试都会重新进行建模,使得模型更灵活的捕捉到数据所包含的信息,降低模型的误差。
在本发明所提供的几个实施例中,应该理解到,所揭露的装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述模块、模组或单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元、模组或组件可以结合或者可以集成到另一个装置,或一些特征可以忽略,或不执行。
所述单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是一个物理单元或多个物理单元,即可以位于一个地方,或者也可以分布到多个不同地方。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
特别地,根据本发明公开的实施例,上文参考流程图描述的过程可以被实现为计算机软件程序。例如,本公开的实施例包括一种计算机程序产品,其包括承载在计算机可读介质上的计算机程序,该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信部分从网络上被下载和安装,和/或从可拆卸介质被安装。在该计算机程序被中央处理单元(CPU)执行时,执行本发明的方法中限定的上述功能。需要说明的是,本发明上述的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是但不限于电、磁、光、电磁、红外线段、或半导体的系统、装置或器件,或者任意以上的组合。
附图中的流程图和框图,图示了按照本发明各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,该模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何在本发明揭露的技术范围内的变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以所述权利要求的保护范围为准。

Claims (8)

1.一种基于自适应的局部动态焦炭质量预测方法,其特征在于,包括以下步骤:
获取历史配煤全集,历史配煤全集包括多个历史配煤方案;
历史配煤方案和待预测配煤方案均包括煤种比例以及煤质指标;
将待预测配煤方案和历史配煤方案转化为矩阵,所述矩阵为:
式中,为配煤方案中各单种煤的煤种比例,/>为配煤方案中各单种煤的煤质指标,m为配煤方案中单种煤个数,n为配煤方案中单种煤的煤质指标个数;
对待预测配煤方案与历史配煤方案的距离进行度量,计算公式如下所示:
d=fdist(Q′,Q)
式中,Q和Q'分别为待预测配煤方案和历史配煤方案转化后的矩阵;fdist为距离度量方法,d为距离;
判断待预测配煤方案与各个历史配煤方案的距离d是否小于等于预设的阈值δ;
若待预测配煤方案与各个历史配煤方案的距离d小于等于预设的阈值δ,则将相应的历史配煤方案加入配煤方案邻域subS;
根据配煤方案邻域subS和预设条件,将历史配煤全集或配煤方案邻域subS中的历史配煤方案对预设模型进行训练,得到目标预测模型;
将待预测配煤方案输入目标预测模型进行预测,得到局部动态焦炭质量。
2.根据权利要求1所述的一种基于自适应的局部动态焦炭质量预测方法,其特征在于,根据配煤方案邻域subS和预设条件,将历史配煤全集或配煤方案邻域subS中的历史配煤方案对预设模型进行训练,得到目标预测模型,具体包括以下步骤:
判断配煤方案邻域sub S是否满足预设条件;
若配煤方案邻域subS满足预设条件,则根据配煤方案邻域subS中的历史配煤方案对第一预设模型进行训练,得到目标预测模型;
若配煤方案邻域subS不满足预设条件,则根据历史配煤全集中的历史配煤方案对第二预设模型进行训练,得到目标预测模型。
3.根据权利要求2所述的一种基于自适应的局部动态焦炭质量预测方法,其特征在于,判断配煤方案邻域sub S是否满足预设条件,具体包括以下步骤:
若配煤方案邻域subS不为空,则满足预设条件;
若配煤方案邻域subS为空,则不满足预设条件。
4.根据权利要求3所述的一种基于自适应的局部动态焦炭质量预测方法,其特征在于:
所述第一预设模型为一般线性模型;
所述第二预设模型为回归树模型。
5.根据权利要求1所述的一种基于自适应的局部动态焦炭质量预测方法,其特征在于:
所述阈值δ为最少配煤方案个数阈值或最短距离阈值。
6.根据权利要求1所述的一种基于自适应的局部动态焦炭质量预测方法,其特征在于,将历史配煤全集或配煤方案邻域subS中的历史配煤方案对预设模型进行训练,得到目标预测模型;具体包括以下步骤:
以历史配煤方案的煤种比例以及煤质指标作为输入参数,以历史配煤方案的焦炭质量作为输出参数,对预设模型进行训练,得到目标预测模型。
7.根据权利要求1所述的一种基于自适应的局部动态焦炭质量预测方法,其特征在于:
所述距离度量方法为曼哈顿距离方法、欧氏距离方法、切比雪夫距离方法、闵可夫斯基距离方法、余弦夹角距离方法或马氏距离方法。
8.一种实现权利要求1-7任一所述的基于自适应的局部动态焦炭质量预测方法的一种基于自适应的局部动态焦炭质量预测系统,其特征在于,包括:
获取模块,用于获取历史配煤全集,历史配煤全集包括多个历史配煤方案;
转化模块,用于将待预测配煤方案和历史配煤方案转化为矩阵;
计算模块,用于将待预测配煤方案和历史配煤方案转化为矩阵,所述矩阵为:
式中,为配煤方案中各单种煤的煤种比例,/>为配煤方案中各单种煤的煤质指标,m为配煤方案中单种煤个数,n为配煤方案中单种煤的煤质指标个数;
计算模块还用于对待预测配煤方案与历史配煤方案的距离进行度量,计算公式如下所示:
d=fdist(Q′,Q)
式中,Q和Q'分别为待预测配煤方案和历史配煤方案转化后的矩阵;fdist为距离度量方法,d为距离;
提取模块,用于判断待预测配煤方案与各个历史配煤方案的距离d是否小于等于预设的阈值δ;若待预测配煤方案与各个历史配煤方案的距离d小于等于预设的阈值δ,则将相应的历史配煤方案加入配煤方案邻域subS;
训练模块,用于根据配煤方案邻域subS和预设条件,将历史配煤全集或配煤方案邻域subS中的历史配煤方案对预设模型进行训练,得到目标预测模型;
预测模块,用于将待预测配煤方案输入目标预测模型进行预测,得到局部动态焦炭质量。
CN202211247136.3A 2022-10-12 2022-10-12 一种基于自适应的局部动态焦炭质量预测方法及系统 Active CN116070929B (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN202211247136.3A CN116070929B (zh) 2022-10-12 2022-10-12 一种基于自适应的局部动态焦炭质量预测方法及系统
PCT/CN2023/083565 WO2024077876A1 (zh) 2022-10-12 2023-03-24 一种基于自适应的局部动态焦炭质量预测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211247136.3A CN116070929B (zh) 2022-10-12 2022-10-12 一种基于自适应的局部动态焦炭质量预测方法及系统

Publications (2)

Publication Number Publication Date
CN116070929A CN116070929A (zh) 2023-05-05
CN116070929B true CN116070929B (zh) 2023-10-03

Family

ID=86173836

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211247136.3A Active CN116070929B (zh) 2022-10-12 2022-10-12 一种基于自适应的局部动态焦炭质量预测方法及系统

Country Status (2)

Country Link
CN (1) CN116070929B (zh)
WO (1) WO2024077876A1 (zh)

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH07216358A (ja) * 1994-02-03 1995-08-15 Nkk Corp コークス工場の操業支援方法
CN102779223A (zh) * 2011-05-13 2012-11-14 富士通株式会社 短期电力负荷预测的方法及装置
CN110910257A (zh) * 2019-11-15 2020-03-24 泰康保险集团股份有限公司 信息预测方法、装置、电子设备和计算机可读介质
CN114354654A (zh) * 2022-01-07 2022-04-15 中国矿业大学 基于dw-knn的煤炭水分含量快速无损检测方法
CN115115085A (zh) * 2022-03-31 2022-09-27 北京旭阳数字科技有限公司 一种优化炼焦配煤的方法、优化炼焦配煤的系统及配煤优化管理系统
WO2023017162A1 (en) * 2021-08-13 2023-02-16 Basf Se Supply chain optimization

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105488317B (zh) * 2014-09-17 2018-11-16 日本电气株式会社 用于预测空气质量的系统和方法
US10738599B2 (en) * 2017-03-10 2020-08-11 International Business Machines Corporation System and tool with increased forecast accuracy to configure well settings in mature oil fields
CN108701274B (zh) * 2017-05-24 2021-10-08 北京质享科技有限公司 一种城市小尺度空气质量指数预测方法与系统
CN112784396B (zh) * 2019-11-08 2024-01-19 华为云计算技术有限公司 一种焦炭质量预测方法、装置及系统
CN113496305A (zh) * 2020-04-03 2021-10-12 浙江大学 数据处理方法及装置

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH07216358A (ja) * 1994-02-03 1995-08-15 Nkk Corp コークス工場の操業支援方法
CN102779223A (zh) * 2011-05-13 2012-11-14 富士通株式会社 短期电力负荷预测的方法及装置
CN110910257A (zh) * 2019-11-15 2020-03-24 泰康保险集团股份有限公司 信息预测方法、装置、电子设备和计算机可读介质
WO2023017162A1 (en) * 2021-08-13 2023-02-16 Basf Se Supply chain optimization
CN114354654A (zh) * 2022-01-07 2022-04-15 中国矿业大学 基于dw-knn的煤炭水分含量快速无损检测方法
CN115115085A (zh) * 2022-03-31 2022-09-27 北京旭阳数字科技有限公司 一种优化炼焦配煤的方法、优化炼焦配煤的系统及配煤优化管理系统

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
基于神经网络的特大型焦炉焦炭质量预测研究;周洪 等;系统仿真学报(第06期);全文 *
焦炉配煤专家系统的定性定量综合设计方法;阳春华 等;自动化学报(第02期);全文 *
自适应邻域构造流形学习算法及故障降维诊断;张晓涛 等;振动.测试与诊断(第06期);全文 *

Also Published As

Publication number Publication date
WO2024077876A1 (zh) 2024-04-18
CN116070929A (zh) 2023-05-05

Similar Documents

Publication Publication Date Title
Chen et al. KNN-BLOCK DBSCAN: Fast clustering for large-scale data
CN104881706B (zh) 一种基于大数据技术的电力系统短期负荷预测方法
CN100456281C (zh) 数据划分设备和数据划分方法
CN110163429B (zh) 一种基于相似日优化筛选的短期负荷预测方法
Fujiwara et al. Development of correlation-based pattern recognition algorithm and adaptive soft-sensor design
Sarhani et al. Intelligent system based support vector regression for supply chain demand forecasting
Moghadasi et al. Steam consumption prediction of a gas sweetening process with methyldiethanolamine solvent using machine learning approaches
He et al. A fast semi-supervised clustering framework for large-scale time series data
CN112801388B (zh) 一种基于非线性时间序列算法的电力负荷预测方法及系统
CN102831489A (zh) 电力配网建设物资需求预测方法及装置
Wang et al. Fault detection and identification using a Kullback-Leibler divergence based multi-block principal component analysis and Bayesian inference
CN115907173A (zh) 一种基于stirpat模型的碳峰值预测方法、系统和装置
CN116070929B (zh) 一种基于自适应的局部动态焦炭质量预测方法及系统
CN113962333A (zh) 模型训练方法、细颗粒物浓度预测方法、装置及电子设备
CN115600773B (zh) 一种基于序列模式挖掘的生产路径分析方法及系统
Syaputra The Implementation of Support Vector Machine Method with Genetic Algorithm in Predicting Energy Consumption for Reinforced Concrete Buildings
CN115759469A (zh) 一种针对峰值负荷及其出现时间的预测方法及其装置
Li et al. Exceptional events classification in warehousing based on an integrated clustering method for a dataset with mixed-valued attributes
McWilliams et al. A PRESS statistic for two-block partial least squares regression
Rajeswari et al. Chi-square mapreduce model for agricultural data
Ompusunggu et al. Implementation of Data Mining To Predict the Value of Indonesian Oil and Non-Oil and Gas Import Exports Using the Linear Regression Method
Kim et al. A new common weights DEA model based on cluster analysis
Yinghao et al. Study on optimization of temperature measuring points for machine tools based on Grey Correlation and Kohonen network
Kalisch et al. Data intensive vs sliding window outlier detection in the stream data—an experimental approach
CN113741263B (zh) 基于全局-局部信息聚类的多模态过程模态划分方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant