CN116523374A - 一种基于无监督式机器学习的炼焦用煤资源综合评价方法 - Google Patents
一种基于无监督式机器学习的炼焦用煤资源综合评价方法 Download PDFInfo
- Publication number
- CN116523374A CN116523374A CN202310308906.9A CN202310308906A CN116523374A CN 116523374 A CN116523374 A CN 116523374A CN 202310308906 A CN202310308906 A CN 202310308906A CN 116523374 A CN116523374 A CN 116523374A
- Authority
- CN
- China
- Prior art keywords
- coal
- quality
- index
- coking
- coking coal
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 239000003245 coal Substances 0.000 title claims abstract description 268
- 238000004939 coking Methods 0.000 title claims abstract description 123
- 238000011156 evaluation Methods 0.000 title claims abstract description 44
- 238000010801 machine learning Methods 0.000 title claims abstract description 20
- 238000005553 drilling Methods 0.000 claims abstract description 48
- 229910052717 sulfur Inorganic materials 0.000 claims abstract description 37
- 239000011593 sulfur Substances 0.000 claims abstract description 37
- NINIDFKCEFEMDL-UHFFFAOYSA-N Sulfur Chemical compound [S] NINIDFKCEFEMDL-UHFFFAOYSA-N 0.000 claims abstract description 33
- OAICVXFJPJFONN-UHFFFAOYSA-N Phosphorus Chemical compound [P] OAICVXFJPJFONN-UHFFFAOYSA-N 0.000 claims abstract description 30
- 229910052698 phosphorus Inorganic materials 0.000 claims abstract description 30
- 239000011574 phosphorus Substances 0.000 claims abstract description 30
- 238000004422 calculation algorithm Methods 0.000 claims abstract description 24
- 238000002156 mixing Methods 0.000 claims abstract description 8
- 239000002956 ash Substances 0.000 claims abstract 8
- 238000000034 method Methods 0.000 claims description 55
- 238000004364 calculation method Methods 0.000 claims description 19
- 239000011159 matrix material Substances 0.000 claims description 12
- 238000007621 cluster analysis Methods 0.000 claims description 11
- 238000011161 development Methods 0.000 claims description 11
- 230000008569 process Effects 0.000 claims description 8
- 238000011160 research Methods 0.000 claims description 8
- 230000007613 environmental effect Effects 0.000 claims description 7
- 230000007704 transition Effects 0.000 claims description 6
- 230000000694 effects Effects 0.000 claims description 3
- 230000006870 function Effects 0.000 claims description 3
- 238000000605 extraction Methods 0.000 claims description 2
- 239000000571 coke Substances 0.000 description 11
- 238000004458 analytical method Methods 0.000 description 5
- 238000006243 chemical reaction Methods 0.000 description 4
- 238000005065 mining Methods 0.000 description 4
- 230000006866 deterioration Effects 0.000 description 3
- 238000009826 distribution Methods 0.000 description 3
- 238000013441 quality evaluation Methods 0.000 description 3
- 229910000805 Pig iron Inorganic materials 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 2
- 239000002802 bituminous coal Substances 0.000 description 2
- 238000007405 data analysis Methods 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 238000011835 investigation Methods 0.000 description 2
- 239000000463 material Substances 0.000 description 2
- OKTJSMMVPCPJKN-UHFFFAOYSA-N Carbon Chemical compound [C] OKTJSMMVPCPJKN-UHFFFAOYSA-N 0.000 description 1
- 229910000831 Steel Inorganic materials 0.000 description 1
- 229910052799 carbon Inorganic materials 0.000 description 1
- 238000006555 catalytic reaction Methods 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000003912 environmental pollution Methods 0.000 description 1
- 238000002309 gasification Methods 0.000 description 1
- 238000010438 heat treatment Methods 0.000 description 1
- 239000012535 impurity Substances 0.000 description 1
- 229910052500 inorganic mineral Inorganic materials 0.000 description 1
- 238000012804 iterative process Methods 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000005272 metallurgy Methods 0.000 description 1
- 239000011707 mineral Substances 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000008520 organization Effects 0.000 description 1
- 230000002688 persistence Effects 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 238000002310 reflectometry Methods 0.000 description 1
- 239000010959 steel Substances 0.000 description 1
- 239000000126 substance Substances 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 239000004079 vitrinite Substances 0.000 description 1
- 239000003039 volatile agent Substances 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0639—Performance analysis of employees; Performance analysis of enterprise or organisation operations
- G06Q10/06395—Quality analysis or management
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/088—Non-supervised learning, e.g. competitive learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/02—Agriculture; Fishing; Forestry; Mining
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02P—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
- Y02P90/00—Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
- Y02P90/30—Computing systems specially adapted for manufacturing
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Human Resources & Organizations (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Physics & Mathematics (AREA)
- Economics (AREA)
- Strategic Management (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Computation (AREA)
- Tourism & Hospitality (AREA)
- General Engineering & Computer Science (AREA)
- General Business, Economics & Management (AREA)
- Entrepreneurship & Innovation (AREA)
- Health & Medical Sciences (AREA)
- Marketing (AREA)
- Educational Administration (AREA)
- General Health & Medical Sciences (AREA)
- Development Economics (AREA)
- Marine Sciences & Fisheries (AREA)
- Mining & Mineral Resources (AREA)
- Animal Husbandry (AREA)
- Primary Health Care (AREA)
- Agronomy & Crop Science (AREA)
- Quality & Reliability (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Operations Research (AREA)
- Game Theory and Decision Science (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
Abstract
本发明涉及煤炭资源管理领域,公开了一种基于无监督式机器学习的炼焦用煤资源综合评价方法,包括如下步骤:步骤1、建立起基于GIS平台的煤类煤质数据库;在GIS中通过栅格计算器方式对不属于炼焦配煤的煤类进行剔除;步骤2、选取灰分、硫分、磷分、挥发分、黏结指数作为炼焦用煤的关键性指标,并通过GIS内栅格计算器工具进行提取;步骤3、调用煤田钻孔煤质数据库中的煤田钻孔,在GIS地图上依次显示各钻孔的坐标点,消除量纲对结果的影响。本发明基于python采用层次聚类算法对炼焦用煤的煤质指标进行多角度、多维的分类处理,同时结合ISO算法对煤质指标数据进行相似聚类,这极大地拓展了煤质数据的使用方式。
Description
技术领域
本发明涉及煤炭资源管理领域,尤其涉及一种基于无监督式机器学习的炼焦用煤资源综合评价方法。
背景技术
炼焦煤是指变质程度较高的烟煤,现被广泛应用于冶金、煤化工、电力等行业,对国家整个工业体系的长远发展和人民生活具有重要影响,近三年,高炉和焦炉的大型化就对焦炭质量提出了更高要求,而常年开采利用低硫优质炼焦煤资源已经非常有限,焦化企业必须最大限度利用有限的炼焦煤资源,生产出高质量焦炭以应对高炉需求。
煤质评价是根据煤质分析结果,对煤炭质量进行客观、正确地评价,通过煤质评价可了解煤的成分与性质,为煤炭资源的合理开发和利用提供科学依据。现阶段对液化用煤、气化用煤的煤质评价体系相对较为完善,然而对炼焦煤质量分级的研究程度相对较低。
随着机器学习的发展水平不断上升,各行各业机器学习的运用的愈发多样,但在煤炭资源管理方面仍处在起步阶段。通过不同的大数据分析方法可以优化煤炭资源的分析模式,与传统的分析方法相比具有更好的精确度。实现煤炭资源绿色开采的大数据分析。
本文聚焦于机器学习与煤炭资源管理结合,充分发挥机器学习的庞大优势,在具体研究区域内,基于本地海量煤质数据建立起炼焦煤的煤质质量分级标准,圈定优势范围,对今后炼焦煤资源研究现状清洁化、精细化勘查和开发都有着非常重要的意义。
公告号为CN 111423894A的中国发明专利中公开了一种焦化用煤资源圈定方法及装置。其根据通过选择的钻孔浮煤指标,圈定第一个研究范围,其次筛选原煤磷分满足预设条件钻孔,圈定另一个区域范围。最后将圈定的第一个区域范围和另一个区域范围的重叠区域作为所述勘查区中焦化用煤资源的区域范围。
公告号为CN 115247075 A的中国发明专利中公开了一种炼焦煤的分类方法。其通过获取焦煤的镜质体随机反射率和矿物质催化指数,根据焦煤的镜质体随机反射率和矿物质催化指数对焦煤进行分类。
在公告号为CN 109294608 A(文献3)的中国发明专利中公开了一种炼焦煤的煤质分类方法一参与炼焦煤配煤方法:其通过测定干燥无灰基挥发分、测定奥亚膨胀度b、镜质组平均最大反射率、基氏最大流动度和焦炭光学组织结构作为确定炼焦煤结焦性。
针对上述中的相关技术,发明人认为存在以下缺陷:
根据上述相关文献,发明人综合考虑认为:
1、研究方法存在问题,未体现机器学习算法的当下优势。
2、步骤繁琐、操作耗时问题(传统评价方法无法快速对炼焦煤进行聚类,且存在主观判断,已有方法操作过于简单或过于繁琐,且多为人机互联操作,GIS空间数据处理可极大减少人工操作步骤,提高评价效率与精度,)
3、主要依据国家行业规范,缺乏基于煤质大数据的质量等级评价方法,无法达到深度挖掘炼焦煤煤质数据之间的关联性。
发明内容
为了解决传统技术方法无法对煤田尺度下钻孔煤质大数据中优质炼焦用煤资源快速识别、划分与有利区评价的问题。本发明基于无监督式机器学习原理,结合ISO聚类算法,利用煤田范围内海量的钻孔煤质数据,快速挖掘煤质大数据隐藏的同质化信息,达到多属性、多指标综合评价炼焦用煤优劣的目的。本发明提供一种基于无监督式机器学习的炼焦用煤资源优劣等级划分与综合评价方法,本发明提供一种基于无监督式机器学习的炼焦用煤资源综合评价方法。
本发明采用以下技术方案实现:一种基于无监督式机器学习的炼焦用煤资源综合评价方法,包括如下步骤:
步骤1、建立起基于GIS平台的煤类煤质数据库;在GIS中通过栅格计算器方式对不属于炼焦配煤的煤类进行剔除;在所述步骤一中,剔除的数据包括不属于炼焦配煤的煤质数据以及原始数据明显录入错误的煤质数据。
步骤2、选取灰分(Ad)、硫分(Std)、磷分(Pd)、挥发分(Vdaf)、黏结指数(G)作为炼焦用煤的关键性指标,并通过GIS内栅格计算器工具进行提取;
步骤3、调用煤田钻孔煤质数据库中的煤田钻孔,在GIS地图上依次显示各钻孔的坐标点,消除量纲对结果的影响,并且对灰分(Ad)、硫分(Std)、磷分(Pd)、挥发分(Vdaf)、黏结指数(G)进行专题图的绘制;
所述步骤三中,采用如下公式消除量纲,其中逆向指标用公式1,正向指标用公式2,且灰分(Ad)、硫分(Std)、磷分(Pd)、挥发分(Vdaf)是反应炼焦用煤质量优劣逆向指标,黏结指数(G)是反应炼焦用煤质质量的正向指标
步骤4、通过无监督学习ISO算法对煤田范围内钻孔煤质数据进行聚类分析;
步骤4.1、选取层次聚类算法从单纯的数据角度对所选钻孔的灰分(Ad)、硫分(Std)、磷分(Pd)、挥发分(Vdaf)、黏结指数(G)分别进行聚类运算;
步骤4.2、基于Python建立层次聚类算法模型,并结合轮廓系数法对所选钻孔煤质数据迭代计算;其中,轮廓系数是描述聚类后各个类别的轮廓清晰度的指标,且轮廓系数越大,代表聚类效果越好,轮廓系数可通过公式(3)不断进行迭代,迭代次数可自己设定,轮廓系数最大值对应的聚类数即是本钻孔煤层数据的最大聚类数;
S(i)=(b(i)-a(i))/max{a(i),b(i)}(3)
步骤4.3、在步骤4.2所算结果的基础上,结合层次聚类学习算法与GIS软件中ISO算法对煤田内所有钻孔煤质数据进行综合聚类分析;
步骤4.4、为更加准确的反应不同聚类结果的差异性,将所筛选的数据按照坐标位置进行投影,并基于层次聚类与ISO算法结果,在GIS中通过按掩膜提取与空间连接工具提取各结果上的钻孔点,并对每一类聚类结果单独评价分析
步骤5、采用熵权法计算灰分(Ad)、硫分(Std)、磷分(Pd)、挥发分(Vdaf)、黏结指数(G)各指标对炼焦用煤使用技术条件的权重,为后续方法的操作奠定参考基础;
所述步骤5包括如下子步骤:
步骤5.1、其操作步骤如下:首先需构建样本数为m,评价指标数为n的判断矩阵:X=(xij)m×n(i=1,2,……m;j=1,2,…,n);
步骤5.2、由于灰分(Ad)、硫分(Std)、磷分(Pd)、挥发分(Vdaf)、黏结指数(G)各个参数的单位量纲不同,需将该矩阵进行归一化、无量纲化处理,得到归一化矩阵B=(bij)m×n(i=1,2,……m;j=1,2,…,n)与同趋势化新矩阵B′=(bij′)m×n(i=1,2,……m;j=1,2,…,n)
式中bij为第i个评价对象的第j个指标值;
根据信息熵定义,计算熵权公式为:
式中:Hj为熵权计算过程中j评价指标的对应过渡变量值;fij为熵权计算过程中过渡变量,且
由公式3得到信息熵计算向量:
式中W为最终计算所得的熵权变量;wj为j评价指标对应的熵权值,且
步骤5.3、最终根据熵权法计算原理,基于GIS中栅格计算器工具,按以上公式分别计算灰分(Ad)、硫分(Std)、磷分(Pd)、挥发分(Vdaf)、黏结指数(G)的权重大小。
步骤6、将炼焦煤煤质划分等级,获得各个聚类下不同等级和不同煤质特征的炼焦用煤资源。
所述步骤6包括如下子步骤:
步骤6.1、从炼焦用煤经济指标与环保指标角度出发,对炼焦煤煤质进行单项指标分级,并根据炼焦用煤质量标准与研究区实际情况,可将炼焦用煤进划分为优质煤、中质煤、劣质煤3个等级;其中,硫分(Std)、磷分(Pd)为环境指标,灰分(Ad)、挥发分(Vdaf)、黏结指数(G)为经济指标;
步骤6.2、参照综合指数评判法,对各指标值进行赋值,并根据相应步骤对应表1权重求取钻孔综合评价值;合指标评价法依据各个质量指标进行等级划分,并对其赋值参数,其中:属于优质煤的赋值为“3.5”;属于中质煤的赋值为“2.5”;属于劣质煤的赋值为“1.5”,再依据各个指标的权重和下式求出各煤样的质量综合评价值(是否要对指标界限进行解释);
其中,Xij对应质量指标的赋值,且Xij=1,2,3,(i表示各个指标质量编号、j分别表示各个煤样编号);Kj表示各个质量指标的赋值,Kj=0.1或0.2
步骤6.3、按照上述公式计算综合评价值,将不同聚类的钻孔炼焦用煤划分为优质煤、中质煤以及劣质煤,根据GIS中栅格计算器功能,当3≤Ej≤3.5时,该煤种属于优质炼焦煤;当2.5≤Ej<3时,该煤种属于中质炼焦煤;当Ej<2.5时,该煤种则属于劣质炼焦煤;
步骤6.4、将步骤6.3处理好的钻孔结果投影到GIS中,使用反距离权重法与自然间断分级方法,对两聚类钻孔煤质数据进行划分,且根据不同颜色区域,可明显地区分出各个聚类下不同等级和不同煤质特征的炼焦用煤资源;
步骤6.5、综合比较出不同聚类钻孔单项指标结果的差异性,参照国家标准与规范,对两类数据钻孔进行比较分析。
步骤7、基于大量煤质数据的聚类分析、炼焦煤等级的划分、煤质指标等级的界定和综合考虑,对优质炼焦用煤发育区进行圈定,并提供合理的开发利用方案。
相比现有技术,本发明的有益效果在于:
(1)本发明基于python采用层次聚类算法对炼焦用煤的煤质指标进行多角度、多维的分类处理,同时结合ISO算法对煤质指标数据进行相似聚类,这极大地拓展了煤质数据的使用方式。
(2)本发明通过综合运用熵权法与综合指数评判法对炼焦用煤的煤质指标进行权重的分析,突出了各指标对炼焦煤质量影响程度,使评价结果更客观。
(3)本文从环保与经济两方面考虑炼焦煤质量等级,从源头上圈定了矿区炼焦煤赋存范围,并控制了炼焦煤使用成本与环境污染因素,可为后期矿区炼焦煤生产、开发提供技术指导。
附图说明
图1为本发明提出的淮北煤田煤质数据库图;
图2为本发明实施例中的钻孔分布与各指标专题图;
图3为本发明实施例中的轮廓系数通过公式(3)迭代结果图;
图4为本发明实施例中对煤田内所有钻孔煤质数据进行综合聚类分析图;
图5为本发明实施例中使用反距离权重法与自然间断分级方法,对两类煤质数据进行划分得到煤质等级划分图;
图6为本发明实施例中聚类分析后煤质环境指标方面的第一类数据与第二类数据的对比图;
图7为本发明实施例中图七为聚类后煤质经济指标方面的第一类数据与第二类数据对比图;
图8为本发明实施例提出的炼焦用煤资源综合评价方法的工作流程图。
具体实施方式
下面,结合附图以及具体实施方式,对本发明做进一步描述,需要说明的是,在不相冲突的前提下,以下描述的各实施例之间或各技术特征之间可以任意组合形成新的实施例。
实施例
本方案提出的一种基于无监督式机器学习的炼焦用煤资源综合评价方法,包括如下步骤:
步骤1、建立起基于GIS平台的煤类煤质数据库;在GIS中通过栅格计算器方式对不属于炼焦配煤的煤类进行剔除;在所述步骤一中,剔除的数据包括不属于炼焦配煤的煤质数据以及原始数据明显录入错误的煤质数据。
首先通过收集、整理淮北煤田范围内所有钻孔煤质数据,获取淮北煤田内的钻孔煤质指标数据,按照各个矿井分别建立的钻孔表、煤质表、岩性表、有益元素表、有害元素表。最后将所有数据导入GIS中,建立起基于GIS平台的煤类煤质数据库,该数据库为后续操作步骤建立基础。如图1。
由于灰分是焦炭中的有害杂质,其含量越高,焦炭黏结性越低,且固定碳含量就越低,发热量也就越低,同时也会降低焦炭的强度。因此,灰分是炼焦煤关键指标之一。煤中挥发分决定了焦炭孔隙率的大小,且挥发分越高,会使焦碳强度降低,且挥发分的大小决定了煤炭的变质程度,挥发分越低,表明该煤的变质程度越高。因此,挥发分是炼焦用煤关键指标之二。硫是煤中的有害元素,硫含量过高,会造成生铁硫含量过高,降低生铁质量。因此,焦炭中硫分需尽可能低及含量稳定。因此,硫是评价炼焦用煤优劣关键指标之三。煤中磷炼焦时会全部进入焦炭,会是的冶炼的钢铁变脆。因此,磷是炼焦用煤关键指标之四。煤中黏结指数是炼焦煤的关键指标,黏结指数越高,其粘结性越好,同时结焦性越高,焦炭质量越高。因此,黏结指数炼焦用煤关键指标之五。相较于以上指标参数,水分、发热量等其他煤质指标亦对炼焦用煤存在一定的影响,同时也需根据具体实际情况作为重要指标予以考虑。
步骤2、选取灰分(Ad)、硫分(Std)、磷分(Pd)、挥发分(Vdaf)、黏结指数(G)作为炼焦用煤的关键性指标,并通过GIS内栅格计算器工具进行提取;
步骤3、调用煤田钻孔煤质数据库中的煤田钻孔,在GIS地图上依次显示各钻孔的坐标点,消除量纲对结果的影响,并且对灰分(Ad)、硫分(Std)、磷分(Pd)、挥发分(Vdaf)、黏结指数(G)进行专题图的绘制;钻孔分布与各指标专题图如图2。
所述步骤三中,采用如下公式消除量纲,其中逆向指标用公式1,正向指标用公式2,且灰分(Ad)、硫分(Std)、磷分(Pd)、挥发分(Vdaf)是反应炼焦用煤质量优劣逆向指标,黏结指数(G)是反应炼焦用煤质质量的正向指标
步骤4、通过无监督学习ISO算法对煤田范围内钻孔煤质数据进行聚类分析;该聚类方法其实是一种迭代过程,用于在将各个候选像元指定给聚类时计算最小欧氏距离,其次在每次迭代期间,将所有样本分配给现有的聚类中心并为每个类重新计算新的平均值,最后需人为指定最佳分类数,本操作方法可对各类煤质指标进行快速聚类分析,对大数据样本处理具有明显的优势。
步骤4.1、选取层次聚类算法从单纯的数据角度对所选钻孔的灰分(Ad)、硫分(Std)、磷分(Pd)、挥发分(Vdaf)、黏结指数(G)分别进行聚类运算;其能减少人为主观因素对聚类结果的影响,并且其结果更具有科学性、客观性,且不受传统上人为主观因素影响。
步骤4.2、基于Python建立层次聚类算法模型,并结合轮廓系数法对所选钻孔煤质数据迭代计算;其中,轮廓系数是描述聚类后各个类别的轮廓清晰度的指标,且轮廓系数越大,代表聚类效果越好,轮廓系数可通过公式(3)不断进行迭代,迭代次数可自己设定,迭代结果如图3,轮廓系数最大值对应的聚类数即是本钻孔煤层数据的最大聚类数;
S(i)=(b(i)-a(i))/max{a(i),b(i)}(3)
步骤4.3、在步骤4.2所算结果的基础上,结合层次聚类学习算法与GIS软件中ISO算法对煤田内所有钻孔煤质数据进行综合聚类分析;如图4
步骤4.4、为更加准确的反应不同聚类结果的差异性,将所筛选的数据按照坐标位置进行投影,并基于层次聚类与ISO算法结果,在GIS中通过按掩膜提取与空间连接工具提取各结果上的钻孔点,并对每一类聚类结果单独评价分析。
步骤5、在本方案中,为充分了解聚类结果中炼焦用煤的煤质的特征及变化规律,在坚持指标主次明显、评价尺度清晰、指标之间的独立性、可获得性的原则下,采用熵权法计算灰分(Ad)、硫分(Std)、磷分(Pd)、挥发分(Vdaf)、黏结指数(G)各指标对炼焦用煤使用技术条件的权重,为后续方法的操作奠定参考基础;
熵权法根据各项指标指标值的变异程度来确定指标权数。作为一种客观赋权法,在一定程度上避免了人为因素带来的偏差,适合计算大数据样本指标权重系数,将其与ISO聚类方法联合使用,可更好的挖掘数据指标之间隐藏的关联信息。
步骤5.1、其操作步骤如下:首先需构建样本数为m,评价指标数为n的判断矩阵:X=(xij)m×n(i=1,2,……m;j=1,2,…,n);
步骤5.2、由于灰分(Ad)、硫分(Std)、磷分(Pd)、挥发分(Vdaf)、黏结指数(G)各个参数的单位量纲不同,需将该矩阵进行归一化、无量纲化处理,得到归一化矩阵B=(bij)m×n(i=1,2,……m;j=1,2,…,n)与同趋势化新矩阵B′=(bij′)m×n(i=1,2,……m;j=1,2,…,n)
式中bij为第i个评价对象的第j个指标值;
根据信息熵定义,计算熵权公式为:
式中:Hj为熵权计算过程中j评价指标的对应过渡变量值;fij为熵权计算过程中过渡变量,且
由公式3得到信息熵计算向量:
式中W为最终计算所得的熵权变量;wj为j评价指标对应的熵权值,且
步骤5.3、最终根据熵权法计算原理,基于GIS中栅格计算器工具,按以上公式分别计算灰分(Ad)、硫分(Std)、磷分(Pd)、挥发分(Vdaf)、黏结指数(G)的权重大小。如下表所示。
步骤6、将炼焦煤煤质划分等级,获得各个聚类下不同等级和不同煤质特征的炼焦用煤资源。
所述步骤6包括如下子步骤:
步骤6.1、从炼焦用煤经济指标与环保指标角度出发,对炼焦煤煤质进行单项指标分级,并根据炼焦用煤质量标准与研究区实际情况,可将炼焦用煤进划分为优质煤、中质煤、劣质煤3个等级;其中,硫分(Std)、磷分(Pd)为环境指标,灰分(Ad)、挥发分(Vdaf)、黏结指数(G)为经济指标;
上表为炼焦用煤质量等级表。
步骤6.2、参照综合指数评判法,对各指标值进行赋值,并根据相应步骤对应表1权重求取钻孔综合评价值;合指标评价法依据各个质量指标进行等级划分,并对其赋值参数,其中:属于优质煤的赋值为“3.5”;属于中质煤的赋值为“2.5”;属于劣质煤的赋值为“1.5”,再依据各个指标的权重和下式求出各煤样的质量综合评价值;数值(3.5、2.5、1.5)该数值 是综合数据结果将煤质等级划分进行量化的过程,同时将计算模式简化,使过程更加简洁 明了,无其他特殊含义。
其中,Xij对应质量指标的赋值,且Xij=1,2,3,(i表示各个指标质量编号、j分别表示各个煤样编号);Kj表示各个质量指标的赋值,Kj=0.1或0.2
步骤6.3、按照上述公式计算综合评价值,将不同聚类的钻孔炼焦用煤划分为优质煤、中质煤以及劣质煤,根据GIS中栅格计算器功能,当3≤Ej≤3.5时,该煤种属于优质炼焦煤;当2.5≤Ej<3时,该煤种属于中质炼焦煤;当Ej<2.5时,该煤种则属于劣质炼焦煤;
步骤6.4、将步骤6.3处理好的钻孔结果投影到GIS中,使用反距离权重法与自然间断分级方法,对两聚类钻孔煤质数据进行划分,且根据不同颜色区域,可明显地区分出各个聚类下不同等级和不同煤质特征的炼焦用煤资源;从图5中可以较为明显看出,两类聚类结果存在明显差异,第一类中以中质炼焦煤为主、优质炼焦煤次之、劣质炼焦煤零星分布。第二类中优质炼焦煤的数量明显增加,劣质炼焦煤仍零星存在。因此根据聚类结果显示,第二类炼焦煤的质量要明显优于第一类。具体分布面积占比如下表。
各簇类炼焦煤质量等级面积统计表
步骤6.5、综合比较出不同聚类钻孔单项指标结果的差异性,参照国家标准与规范,对两类数据钻孔进行比较分析,其中,煤中灰分参照GN/T15224.1-2018《煤炭质量分级》,煤中挥发分参照MT/T849-2000《煤的挥发分产率分级》,煤种黏结指数参照MT/T596-2008《烟煤黏结指数分级》,煤中硫分参照GB/T15224.2-2021《煤炭质量分级》,煤种磷分参照GB/T20475.1-2006《煤中有害元素含量分级》进行煤质质量分级。
根据以上标准规范对聚类结果进行比照,如图6、7。环境指标中,临涣矿区硫分差异较大,第一聚类硫分以低硫煤-中硫煤为主,第二聚类以特低硫煤-低硫煤为主。磷分第二聚类的平均值略大于第一聚类;经济指标中,第一聚类以中灰煤-中高灰煤为主,第二聚类灰分以低灰煤-中灰煤为主。第一聚类以强黏结煤为主,第二聚类黏结指数以中黏结煤-强粘结煤为主。挥发分第二聚类的平均值略低于第一聚类。根据以上煤质结果综合分析表明,第二类炼焦煤质量优于第一类。
步骤7、基于大量煤质数据的聚类分析、炼焦煤等级的划分、煤质指标等级的界定和综合考虑,对优质炼焦用煤发育区进行圈定,并提供合理的开发利用方案。
上述实施方式仅为本发明的优选实施方式,不能以此来限定本发明保护的范围,本领域的技术人员在本发明的基础上所做的任何非实质性的变化及替换均属于本发明所要求保护的范围。
Claims (7)
1.一种基于无监督式机器学习的炼焦用煤资源综合评价方法,其特征在于,包括如下步骤:
步骤1、建立起基于GIS平台的煤类煤质数据库;在GIS中通过栅格计算器方式对不属于炼焦配煤的煤类进行剔除;
步骤2、选取灰分、硫分、磷分、挥发分、黏结指数作为炼焦用煤的关键性指标,并通过GIS内栅格计算器工具进行提取;
步骤3、调用煤田钻孔煤质数据库中的煤田钻孔,在GIS地图上依次显示各钻孔的坐标点,消除量纲对结果的影响,并且对灰分、硫分、磷分、挥发分、黏结指数进行专题图的绘制;
步骤4、通过无监督学习ISO算法对煤田范围内钻孔煤质数据进行聚类分析;
步骤5、采用熵权法计算灰分、硫分、磷分、挥发分、黏结指数各指标对炼焦用煤使用技术条件的权重,为后续方法的操作奠定参考基础;
步骤6、将炼焦煤煤质划分等级,获得各个聚类下不同等级和不同煤质特征的炼焦用煤资源。
2.如权利要求1所述的一种基于无监督式机器学习的炼焦用煤资源综合评价方法,其特征在于,在所述步骤一中,剔除的数据包括不属于炼焦配煤的煤质数据以及原始数据明显录入错误的煤质数据。
3.如权利要求1所述的一种基于无监督式机器学习的炼焦用煤资源综合评价方法,其特征在于,所述步骤三中,采用如下公式消除量纲,其中逆向指标用公式1,正向指标用公式2,且灰分、硫分、磷分、挥发分是反应炼焦用煤质量优劣逆向指标,黏结指数是反应炼焦用煤质质量的正向指标
4.如权利要求1所述的一种基于无监督式机器学习的炼焦用煤资源综合评价方法,其特征在于,所述步骤4包括如下子步骤:
步骤4.1、选取层次聚类算法从单纯的数据角度对所选钻孔的灰分、硫分、磷分、挥发分、黏结指数分别进行聚类运算;
步骤4.2、基于Python建立层次聚类算法模型,并结合轮廓系数法对所选钻孔煤质数据迭代计算;其中,轮廓系数是描述聚类后各个类别的轮廓清晰度的指标,且轮廓系数越大,代表聚类效果越好,轮廓系数可通过公式(3)不断进行迭代,迭代次数可自己设定,轮廓系数最大值对应的聚类数即是本钻孔煤层数据的最大聚类数;
S(i)=(b(i)-a(i))/max{a(i),b(i)}(3)
步骤4.3、在步骤4.2所算结果的基础上,结合层次聚类学习算法与GIS软件中ISO算法对煤田内所有钻孔煤质数据进行综合聚类分析;
步骤4.4、将所筛选的数据按照坐标位置进行投影,并基于层次聚类与ISO算法结果,在GIS中通过按掩膜提取与空间连接工具提取各结果上的钻孔点,并对每一类聚类结果单独评价分析。
5.如权利要求1所述的一种基于无监督式机器学习的炼焦用煤资源综合评价方法,其特征在于,所述步骤5包括如下子步骤:
步骤5.1、其操作步骤如下:首先需构建样本数为m,评价指标数为n的判断矩阵:X=(xij)m×n(i=1,2,……m;j=1,2,……,n);
步骤5.2、由于灰分、硫分、磷分、挥发分、黏结指数各个参数的单位量纲不同,需将该矩阵进行归一化、无量纲化处理,得到归一化矩阵B=(bij)m×n(i=1,2,……m;j=1,2,…,n)与同趋势化新矩阵B′=(bij′)m×n(i=1,2,……m;j=1,2,…,n)
式中bij为第i个评价对象的第j个指标值;
根据信息熵定义,计算熵权公式为:
式中:Hj为熵权计算过程中j评价指标的对应过渡变量值;fij为熵权计算过程中过渡变量,且
由公式3得到信息熵计算向量:
式中W为最终计算所得的熵权变量;wj为j评价指标对应的熵权值,且
步骤5.3、最终根据熵权法计算原理,基于GIS中栅格计算器工具,按以上公式分别计算灰分、硫分、磷分、挥发分、黏结指数的权重大小。
6.如权利要求1所述的一种基于无监督式机器学习的炼焦用煤资源综合评价方法,其特征在于,所述步骤6包括如下子步骤:
步骤6.1、对炼焦煤煤质进行单项指标分级,并根据炼焦用煤质量标准与研究区实际情况,可将炼焦用煤进划分为优质煤、中质煤、劣质煤3个等级;其中,硫分、磷分为环境指标,灰分、挥发分、黏结指数为经济指标;
步骤6.2、参照综合指数评判法,对各指标值进行赋值,并根据相应步骤对应表1权重求取钻孔综合评价值;合指标评价法依据各个质量指标进行等级划分,并对其赋值参数,其中:属于优质煤的赋值为“3.5”;属于中质煤的赋值为“2.5”;属于劣质煤的赋值为“1.5”,再依据各个指标的权重和下式求出各煤样的质量综合评价值(是否要对指标界限进行解释);
其中,Xij对应质量指标的赋值,且Xij=1,2,3,(i表示各个指标质量编号、j分别表示各个煤样编号);Kj表示各个质量指标的赋值,Kj=0.1或0.2
步骤6.3、按照上述公式计算综合评价值,将不同聚类的钻孔炼焦用煤划分为优质煤、中质煤以及劣质煤,根据GIS中栅格计算器功能,当3≤Ej≤3.5时,该煤种属于优质炼焦煤;当2.5≤Ej<3时,该煤种属于中质炼焦煤;当Ej<2.5时,该煤种则属于劣质炼焦煤;
步骤6.4、将步骤6.3处理好的钻孔结果投影到GIS中,使用反距离权重法与自然间断分级方法,对两聚类钻孔煤质数据进行划分,且根据不同颜色区域,可明显地区分出各个聚类下不同等级和不同煤质特征的炼焦用煤资源;
步骤6.5、综合比较出不同聚类钻孔单项指标结果的差异性,参照国家标准与规范,对两类数据钻孔进行比较分析。
7.如权利要求1所述的一种基于无监督式机器学习的炼焦用煤资源综合评价方法,其特征在于,所述还包括如下步骤,基于大量煤质数据的聚类分析、炼焦煤等级的划分、煤质指标等级的界定和综合考虑,对优质炼焦用煤发育区进行圈定,并提供合理的开发利用方案。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310308906.9A CN116523374A (zh) | 2023-03-28 | 2023-03-28 | 一种基于无监督式机器学习的炼焦用煤资源综合评价方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310308906.9A CN116523374A (zh) | 2023-03-28 | 2023-03-28 | 一种基于无监督式机器学习的炼焦用煤资源综合评价方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116523374A true CN116523374A (zh) | 2023-08-01 |
Family
ID=87389408
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310308906.9A Pending CN116523374A (zh) | 2023-03-28 | 2023-03-28 | 一种基于无监督式机器学习的炼焦用煤资源综合评价方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116523374A (zh) |
-
2023
- 2023-03-28 CN CN202310308906.9A patent/CN116523374A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108009716B (zh) | 一种水平井体积压裂效果影响因素多层次评价方法 | |
Shan et al. | City-level climate change mitigation in China | |
CN108960651B (zh) | 一种致密油气藏多级压裂水平井完井效率的综合评价方法 | |
CN108416686A (zh) | 一种基于煤炭资源开发的生态地质环境类型划分方法 | |
CN105243437B (zh) | 用于捣固炼焦的预测焦炭质量和优化配煤比的方法 | |
CN109034647A (zh) | 一种致密油气藏体积压裂水平井重复压裂选井的方法 | |
CN111210170B (zh) | 基于90%用电分布特征指标的环保管控监测及评价方法 | |
CN108416691A (zh) | 一种能源替代环保潜力计算方法 | |
CN111914942A (zh) | 一种多表合一用能异常分析方法 | |
CN103632306A (zh) | 一种基于聚类分析的配电网供电区域划分方法 | |
CN115907822A (zh) | 一种考虑区域及经济影响的负荷特征指标关联性挖掘方法 | |
CN113222445A (zh) | 考虑空心化率的乡村振兴电力综合指数的计算方法及系统 | |
CN116796403A (zh) | 一种基于商业建筑综合能耗预测的建筑节能方法 | |
CN114970956A (zh) | 一种基于ols和qoic人口关联分析及预测方法 | |
CN113962477A (zh) | 一种产业电量关联聚集预测方法、装置、设备及存储介质 | |
CN116523374A (zh) | 一种基于无监督式机器学习的炼焦用煤资源综合评价方法 | |
Chen et al. | Prediction of cleaned coal yield based on different S-shaped curve models in coal cleaning production | |
CN116720750A (zh) | 综合能源站设备容量规划方法、装置、终端及存储介质 | |
CN116306232A (zh) | 一种基于工业大数据的高炉能耗与碳排放分析方法及系统 | |
CN113298148B (zh) | 一种面向生态环境评价的不平衡数据重采样方法 | |
Yufei et al. | Application of big data analysis method in technology foresight for strategic emerging industries | |
CN108038572A (zh) | 一种农村地区新态势负荷潜力预测方法 | |
CN111125082B (zh) | 基于关联规则挖掘的水泥工艺参数数据分析方法 | |
CN113468821A (zh) | 一种基于决策回归算法的坡面产流产沙阈值确定方法 | |
CN114462323A (zh) | 一种基于多属性场融合的油藏流场表征方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |