CN114611940A - 一种多源煤基固废资源化利用方向的决策方法及系统 - Google Patents
一种多源煤基固废资源化利用方向的决策方法及系统 Download PDFInfo
- Publication number
- CN114611940A CN114611940A CN202210247435.0A CN202210247435A CN114611940A CN 114611940 A CN114611940 A CN 114611940A CN 202210247435 A CN202210247435 A CN 202210247435A CN 114611940 A CN114611940 A CN 114611940A
- Authority
- CN
- China
- Prior art keywords
- data
- solid waste
- resource utilization
- based solid
- classification
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 239000002910 solid waste Substances 0.000 title claims abstract description 113
- 239000003245 coal Substances 0.000 title claims abstract description 71
- 238000000034 method Methods 0.000 title claims abstract description 30
- 238000007637 random forest analysis Methods 0.000 claims abstract description 48
- 238000005516 engineering process Methods 0.000 claims abstract description 12
- 230000007613 environmental effect Effects 0.000 claims abstract description 5
- 238000012549 training Methods 0.000 claims description 42
- 238000012545 processing Methods 0.000 claims description 21
- 238000012360 testing method Methods 0.000 claims description 18
- 238000007726 management method Methods 0.000 claims description 15
- 238000013500 data storage Methods 0.000 claims description 14
- 238000012795 verification Methods 0.000 claims description 12
- 238000004064 recycling Methods 0.000 claims description 10
- 238000007781 pre-processing Methods 0.000 claims description 8
- 238000013145 classification model Methods 0.000 claims description 7
- 239000002131 composite material Substances 0.000 claims description 5
- 238000010276 construction Methods 0.000 claims description 5
- 239000000463 material Substances 0.000 claims description 5
- 239000000126 substance Substances 0.000 claims description 5
- 229910052500 inorganic mineral Inorganic materials 0.000 claims description 4
- 239000011707 mineral Substances 0.000 claims description 4
- 239000000203 mixture Substances 0.000 claims description 4
- 238000007792 addition Methods 0.000 claims description 3
- 238000012217 deletion Methods 0.000 claims description 3
- 230000037430 deletion Effects 0.000 claims description 3
- 238000012986 modification Methods 0.000 claims description 3
- 230000004048 modification Effects 0.000 claims description 3
- 238000010801 machine learning Methods 0.000 abstract description 4
- 239000002245 particle Substances 0.000 description 3
- PXHVJJICTQNCMI-UHFFFAOYSA-N Nickel Chemical compound [Ni] PXHVJJICTQNCMI-UHFFFAOYSA-N 0.000 description 2
- VYPSYNLAJGMNEJ-UHFFFAOYSA-N Silicium dioxide Chemical compound O=[Si]=O VYPSYNLAJGMNEJ-UHFFFAOYSA-N 0.000 description 2
- 238000007635 classification algorithm Methods 0.000 description 2
- 238000011156 evaluation Methods 0.000 description 2
- 238000009270 solid waste treatment Methods 0.000 description 2
- OKTJSMMVPCPJKN-UHFFFAOYSA-N Carbon Chemical compound [C] OKTJSMMVPCPJKN-UHFFFAOYSA-N 0.000 description 1
- VYZAMTAEIAYCRO-UHFFFAOYSA-N Chromium Chemical compound [Cr] VYZAMTAEIAYCRO-UHFFFAOYSA-N 0.000 description 1
- RYGMFSIKBFXOCR-UHFFFAOYSA-N Copper Chemical compound [Cu] RYGMFSIKBFXOCR-UHFFFAOYSA-N 0.000 description 1
- NINIDFKCEFEMDL-UHFFFAOYSA-N Sulfur Chemical compound [S] NINIDFKCEFEMDL-UHFFFAOYSA-N 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 229910052785 arsenic Inorganic materials 0.000 description 1
- RQNWIZPPADIBDY-UHFFFAOYSA-N arsenic atom Chemical compound [As] RQNWIZPPADIBDY-UHFFFAOYSA-N 0.000 description 1
- 239000004566 building material Substances 0.000 description 1
- 229910052793 cadmium Inorganic materials 0.000 description 1
- BDOSMKKIYDKNTQ-UHFFFAOYSA-N cadmium atom Chemical compound [Cd] BDOSMKKIYDKNTQ-UHFFFAOYSA-N 0.000 description 1
- BRPQOXSCLDDYGP-UHFFFAOYSA-N calcium oxide Chemical compound [O-2].[Ca+2] BRPQOXSCLDDYGP-UHFFFAOYSA-N 0.000 description 1
- 239000000292 calcium oxide Substances 0.000 description 1
- ODINCKMPIJJUCX-UHFFFAOYSA-N calcium oxide Inorganic materials [Ca]=O ODINCKMPIJJUCX-UHFFFAOYSA-N 0.000 description 1
- 229910052799 carbon Inorganic materials 0.000 description 1
- 229910052804 chromium Inorganic materials 0.000 description 1
- 239000011651 chromium Substances 0.000 description 1
- 229910052802 copper Inorganic materials 0.000 description 1
- 239000010949 copper Substances 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- TXKMVPPZCYKFAC-UHFFFAOYSA-N disulfur monoxide Inorganic materials O=S=S TXKMVPPZCYKFAC-UHFFFAOYSA-N 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 239000000446 fuel Substances 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 229910001385 heavy metal Inorganic materials 0.000 description 1
- 238000011835 investigation Methods 0.000 description 1
- UQSXHKLRYXJYBZ-UHFFFAOYSA-N iron oxide Inorganic materials [Fe]=O UQSXHKLRYXJYBZ-UHFFFAOYSA-N 0.000 description 1
- 239000011133 lead Substances 0.000 description 1
- 239000000395 magnesium oxide Substances 0.000 description 1
- CPLXHLVBOLITMK-UHFFFAOYSA-N magnesium oxide Inorganic materials [Mg]=O CPLXHLVBOLITMK-UHFFFAOYSA-N 0.000 description 1
- AXZKOIWUVFPNLO-UHFFFAOYSA-N magnesium;oxygen(2-) Chemical compound [O-2].[Mg+2] AXZKOIWUVFPNLO-UHFFFAOYSA-N 0.000 description 1
- WJZHMLNIAZSFDO-UHFFFAOYSA-N manganese zinc Chemical compound [Mn].[Zn] WJZHMLNIAZSFDO-UHFFFAOYSA-N 0.000 description 1
- QSHDDOUJBYECFT-UHFFFAOYSA-N mercury Chemical compound [Hg] QSHDDOUJBYECFT-UHFFFAOYSA-N 0.000 description 1
- 229910052753 mercury Inorganic materials 0.000 description 1
- 238000005065 mining Methods 0.000 description 1
- 229910052759 nickel Inorganic materials 0.000 description 1
- TWNQGVIAIRXVLR-UHFFFAOYSA-N oxo(oxoalumanyloxy)alumane Chemical compound O=[Al]O[Al]=O TWNQGVIAIRXVLR-UHFFFAOYSA-N 0.000 description 1
- NDLPOXTZKUMGOV-UHFFFAOYSA-N oxo(oxoferriooxy)iron hydrate Chemical compound O.O=[Fe]O[Fe]=O NDLPOXTZKUMGOV-UHFFFAOYSA-N 0.000 description 1
- CHWRSCGUEQEHOH-UHFFFAOYSA-N potassium oxide Chemical compound [O-2].[K+].[K+] CHWRSCGUEQEHOH-UHFFFAOYSA-N 0.000 description 1
- 229910001950 potassium oxide Inorganic materials 0.000 description 1
- 238000010248 power generation Methods 0.000 description 1
- 230000001737 promoting effect Effects 0.000 description 1
- 238000000746 purification Methods 0.000 description 1
- 238000012163 sequencing technique Methods 0.000 description 1
- 239000000377 silicon dioxide Substances 0.000 description 1
- 235000012239 silicon dioxide Nutrition 0.000 description 1
- 239000002689 soil Substances 0.000 description 1
- 239000011593 sulfur Substances 0.000 description 1
- 229910052717 sulfur Inorganic materials 0.000 description 1
- XTQHKBHJIVJGKJ-UHFFFAOYSA-N sulfur monoxide Chemical compound S=O XTQHKBHJIVJGKJ-UHFFFAOYSA-N 0.000 description 1
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0637—Strategic management or analysis, e.g. setting a goal or target of an organisation; Planning actions based on goals; Analysis or evaluation of effectiveness of goals
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/243—Classification techniques relating to the number of classes
- G06F18/24323—Tree-organised classifiers
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/06—Energy or water supply
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Human Resources & Organizations (AREA)
- Theoretical Computer Science (AREA)
- Economics (AREA)
- Physics & Mathematics (AREA)
- Strategic Management (AREA)
- General Physics & Mathematics (AREA)
- Entrepreneurship & Innovation (AREA)
- Marketing (AREA)
- Tourism & Hospitality (AREA)
- General Business, Economics & Management (AREA)
- Health & Medical Sciences (AREA)
- Data Mining & Analysis (AREA)
- Educational Administration (AREA)
- Evolutionary Computation (AREA)
- Bioinformatics & Cheminformatics (AREA)
- General Engineering & Computer Science (AREA)
- Evolutionary Biology (AREA)
- Game Theory and Decision Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Computational Biology (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Development Economics (AREA)
- Artificial Intelligence (AREA)
- Life Sciences & Earth Sciences (AREA)
- Public Health (AREA)
- Water Supply & Treatment (AREA)
- General Health & Medical Sciences (AREA)
- Primary Health Care (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Processing Of Solid Wastes (AREA)
Abstract
本发明属于煤基固废资源化利用领域,具体涉及一种多源煤基固废资源化利用方向的决策方法及系统。为解决煤基固废资源化利用的过程中存在产业信息不对称的问题,本发明基于机器学习的随机森林模型,通过对多源煤基固废的资源环境属性数据与固废资源化利用技术数据收集与分析处理,运用机器学习的方法建立随机森林分类模型,达到对固废资源环境属性数据与资源化利用方向技术方向的对应分类,决策者输入一种固废资源环境属性数据,系统输出一个或多个资源化利用的方向,每个方向下有许多具体的资源化处理技术,再结合技术需求方的经济环保政策等要求与固废资源化处理技术对所处理固废的理化特性的具体要求,作为一个决策参考。
Description
技术领域
本发明属于煤基固废资源化利用领域,具体涉及一种多源煤基固废资源化利用方向的决策方法及系统。
背景技术
多源煤基固废主要包括在煤炭开采与加工利用过程中产生的固体废弃物。煤基固废综合利用率约只有60%,资源化利用潜力没有被充分挖掘。在推进煤基固废资源化利用的过程中,存在产业信息不对称的问题,煤基固废资源化处理利用的技术种类繁多,技术需求方针对一种煤基固废选择何种利用方向与详细的技术方案成为了一个难题,这就需要一种针对多源煤基固废资源化利用方向的决策方法与系统,为技术需求方选取资源化利用方向与技术提供决策支持,推进煤基固废资源化利用,提升综合利用率。
发明内容
本发明的目的是解决多源煤基固废资源化利用领域产业信息不对称的问题,提供一种多源煤基固废资源化利用方向的决策方法及系统。
为解决上述问题,本发明基于机器学习的随机森林模型,通过对多源煤基固废的资源环境属性数据与固废资源化利用技术数据收集与分析处理,运用机器学习的方法建立随机森林分类模型,达到对固废资源环境属性数据与资源化利用方向技术方向的对应分类,决策者输入一种固废资源环境属性数据,系统输出一个或多个资源化利用的方向,每个方向下有许多具体的资源化处理技术,再结合技术需求方的经济环保政策等要求与固废资源化处理技术对所处理固废的理化特性的具体要求,作为一个决策参考。
为了达到上述目的,本发明采用了下列技术方案:
一种多源煤基固废资源化利用方向的决策方法,包括以下步骤:
步骤1,获取数据集:获取多源煤基固废的资源环境属性信息与固废资源化利用的技术方向信息,将多源煤基固废的资源环境属性信息作为数据集,划分为训练集和测试集;
步骤2,从获取到的数据集中选取特征属性:对固废资源环境属性信息进行分析,选取对固废资源化利用的三类特征属性,包括材料科学特征、化学成分与结构特征、矿物相与组成特征;
步骤3,数据预处理:一组特征属性下的数据有20%以上的缺失值,则删除这组数据,20%以下的缺失值则用均值补全;将同一特征属性下的数据进行一致性检查,将文字型特征属性转化为数值型,将固废资源化利用的技术方向的分类标签转化为分类数值,并对没有关联的特征属性和分类标签进行独热编码;
步骤4,搭建随机森林分类器模型:以训练集内特征属性下的数据为输入,以固废资源化利用技术方向的分类标签为输出,建立随机森林分类器模型,将测试集内特征属性下的数据零均值标准化处理,导入建立的模型中,测试模型的泛化性,调整随机森林参数,完善模型实现对固废资源化利用方向的分类决策;
步骤5,得到一个或多个固废资源化利用的分类标签,每个分类标签代表着一个固废资源化利用方向。
进一步,所述步骤3中一致性检查包括检查数据的取值范围,对超出合数量级范围的数据进行修正,并且将数据单位格式保持一致。
进一步,所述步骤4中建立随机森林分类器模型的具体步骤为:
(1)设定随机森林参数的范围,树的数量在100~200之间,树的特征个数为数据集全部特征属性的开平方,树的深度为10~100之间;
(2)将训练集中的数据进行零均值标准化处理,运用网格搜索法,通过十折交叉验证法,将训练集数据分为十份,轮流将其中九份作为训练数据,一份作为验证数据,十次结果分类正确率的均值作为评判参树模型的标准,选择准确率最高的参数模型作为最优超参数配比,再将零均值标准化处理后的训练集导入最优超参数的随机森林模型进行训练,得到随机森林分类器模型。
一种多源煤基固废资源化利用方向的决策系统,包括数据采集模块、数据存储管理模块、模型构建模块、决策分类模块;
所述数据采集模块采集多源煤基固废的资源环境属性信息数据、多源煤基固废资源化利用方向数据以及每个利用方向下的多个资源化利用技术方案,将采集的数据传输至数据存储管理模块;
所述数据存储管理模块将来自数据采集模块的数据存储,并对数据进行随时的增删改查;
所述分类模型构建模块对数据存储管理模块内的多源煤基固废的资源环境属性信息数据、多源煤基固废资源化利用方向数据进行预处理,多源煤基固废的资源环境属性信息数据作为数据集,分为训练集和测试集,以训练集内特征属性下的数据为输入,以固废资源化利用技术方向的分类标签为输出,建立随机森林分类器模型,将测试集内特征属性下的数据零均值标准化处理,导入建立的模型中,测试模型的泛化性,调整随机森林参数,完善模型实现对固废资源化利用方向的分类决策;
所述分类模型构建模块将建立好的随机森林分类器输送至决策分类模块,将煤基固废的资源环境属性输入到决策分类模块中,输出煤基固废的资源化利用方向标签分类,以及每个利用方向下的多个资源化利用技术方案。
进一步,所述对数据存储管理模块内的多源煤基固废的资源环境属性信息数据、多源煤基固废资源化利用方向数据进行预处理,具体为:
一组特征属性下的数据有20%以上的缺失值,则删除这组数据,20%以下的缺失值则用均值补全;将同一特征属性下的数据进行一致性检查,将文字型特征属性转化为数值型,将固废资源化利用的技术方向的分类标签转化为分类数值,并对没有关联的特征属性和分类标签进行独热编码。
进一步,所述一致性检查包括检查数据的取值范围,对超出合数量级范围的数据进行修正,并且将数据单位格式保持一致。
进一步,所述建立随机森林分类器模型的具体步骤为:
(1)设定随机森林参数的范围,树的数量在100~200之间,树的特征个数为数据集全部特征属性的开平方,树的深度为10~100;
(2)将训练集中的数据进行零均值标准化处理,运用网格搜索法,通过十折交叉验证法,将训练集数据分为十份,轮流将其中九份作为训练数据,一份作为验证数据,十次结果分类正确率的均值作为评判参树模型的标准,选择准确率最高的参数模型作为最优超参数配比,再将零均值标准化处理后的训练集导入最优超参数的随机森林模型进行训练,得到随机森林分类器模型
与现有技术相比本发明具有以下优点:
本发明可以智能实现对多源煤基固废资源化利用方向的分类,为决策者提供清晰的处理煤基固废的方向,结合相关方向下的煤基固废处理技术方案,可以快速对煤基固废的资源化利用做出辅助决策意见,在煤基固废资源化利用的前期调研阶段发挥指导作用,大大缩短了制定方案的时间,清晰了固废利用的方向与途径,推进了煤基固废的资源化利用。
附图说明
图1为本发明的多源煤基固废资源化利用方向的决策方法流程图;
图2为本发明的多源煤基固废资源化利用方向的决策系统示意图。
具体实施方式
实施例1
如图1所示,一种多源煤基固废资源化利用方向的决策方法,包括以下步骤:
步骤1,获取数据集:通过网上资料查询与课题项目实践测试获取多源煤基固废的资源环境属性信息与固废资源化利用的技术方向信息,将多源煤基固废的资源环境属性信息作为数据集,划分为划分为80%的训练集和20%的测试;
步骤2,从获取到的数据集中选取特征属性:对固废资源环境属性信息进行分析,选取对固废资源化利用的三类特征属性,包括材料科学特征、化学成分与结构特征、矿物相与组成特征,其中材料科学特征包括颗粒大小、颗粒密度、颗粒形貌,化学成分组成特征包括含碳量、含水量、烧失量、热值、灰分含量、全硫含量以及二氧化硅、三氧化二铁、氧化铝、氧化硫、氧化钙、氧化镁、氧化钾等氧化物含量数据以及镍、砷、铬、铜、铅、汞、锌锰、镉等重金属含量数据,矿物相包括结晶度百分比和结晶相数据。煤基固废资源化利用方向技术信息包括该技术的方向标签,方向标签包括燃料发电、工程建材、土壤复垦、矿井充填产品提纯、产品辅料,生态治理这七个标签;
步骤3,数据预处理:一组特征属性下的数据有20%以上的缺失值,则删除这组数据,20%以下的缺失值则用均值补全;将同一特征属性下的数据进行一致性检查,包括检查数据的取值范围,对超出合数量级范围的数据进行修正,并且将数据单位格式保持一致。将文字型特征属性转化为数值型,将固废资源化利用的技术方向的分类标签转化为分类数值,并对没有关联的特征属性和分类标签进行独热编码;
步骤4,搭建随机森林分类器模型:以训练集内特征属性下的数据为输入,以固废资源化利用技术方向的分类标签为输出,建立随机森林分类器模型,将测试集内特征属性下的数据零均值标准化处理,导入建立的模型中,测试模型的泛化性,调整随机森林参数,完善模型实现对固废资源化利用方向的分类决策,其中测试集评价指标为汉明损失函数、0-1错误率、覆盖率、排序损失以及平均精确度;
建立随机森林分类器模型的具体步骤为:
(1)设定随机森林参数的范围,树的数量在100~200之间,树的特征个数为数据集全部特征属性的开平方,树的深度为10~100之间;
(2)将训练集中的数据进行零均值标准化处理,运用网格搜索法,通过十折交叉验证法,将训练集数据分为十份,轮流将其中九份作为训练数据,一份作为验证数据,十次结果分类正确率的均值作为评判参树模型的标准,选择准确率最高的参数模型作为最优超参数配比,再将零均值标准化处理后的训练集导入最优超参数的随机森林模型进行训练,得到随机森林分类器模。
步骤5,得到一个或多个固废资源化利用的分类标签,每个分类标签代表着一个固废资源化利用方向。
如图2所示,一种多源煤基固废资源化利用方向的决策系统,包括数据采集模块、数据存储管理模块、模型构建模块、决策分类模块;
所述数据采集模块采集多源煤基固废的资源环境属性信息数据、多源煤基固废资源化利用方向数据以及每个利用方向下的多个资源化利用技术方案,将采集的数据传输至数据存储管理模块;
所述数据存储管理模块将来自数据采集模块的数据存储,并对数据进行随时的增删改查;
所述分类模型构建模块对数据存储管理模块内的多源煤基固废的资源环境属性信息数据、多源煤基固废资源化利用方向数据进行预处理:
一组特征属性下的数据有20%以上的缺失值,则删除这组数据,20%以下的缺失值则用均值补全;将同一特征属性下的数据进行一致性检查,将文字型特征属性转化为数值型,将固废资源化利用的技术方向的分类标签转化为分类数值,并对没有关联的特征属性和分类标签进行独热编码。
多源煤基固废的资源环境属性信息数据作为数据集,分为80%训练集和20%测试集,以训练集内特征属性下的数据为输入,以固废资源化利用技术方向的分类标签为输出,建立随机森林分类器模型,将测试集内特征属性下的数据零均值标准化处理,导入建立的模型中,测试模型的泛化性,调整随机森林参数,完善模型实现对固废资源化利用方向的分类决策;
建立随机森林分类器模型的具体步骤为:
(1)设定随机森林参数的范围,树的数量在100~200之间,树的特征个数为数据集全部特征属性的开平方,树的深度为10~100;
(2)将训练集中的数据进行零均值标准化处理,运用网格搜索法,通过十折交叉验证法,将训练集数据分为十份,轮流将其中九份作为训练数据,一份作为验证数据,十次结果分类正确率的均值作为评判参树模型的标准,选择准确率最高的参数模型作为最优超参数配比,再将零均值标准化处理后的训练集导入最优超参数的随机森林模型进行训练,得到随机森林分类器模型。
所述分类模型构建模块将建立好的随机森林分类器输送至决策分类模块,将煤基固废的资源环境属性输入到决策分类模块中,输出煤基固废的资源化利用方向标签分类,以及每个利用方向下的多个资源化利用技术方案。
本模型在构建过程中,分析比对了基于多种机器学习分类算法提出的构建方案,从分类模型评价指标如准确率、精度率、召回率与F1-score比对了该方法模型的优劣:
基于随机森林构建的模型同其他典型分类算法构建的模型对比中,基与随机森林构建的模型在分类准确率上优于其他模型,证明该模型有良好的分类效果,分类精度高,且在精确率、召回率、F1-Score等各项指标的对比下,也比其他典型模型要好,充分证明了基于随机森林构建煤基固废资源化利用方向分类模型的优越性。
Claims (7)
1.一种多源煤基固废资源化利用方向的决策方法,其特征在于,包括以下步骤:
步骤1,获取数据集:获取多源煤基固废的资源环境属性信息与固废资源化利用的技术方向信息,将多源煤基固废的资源环境属性信息作为数据集,划分为训练集和测试集;
步骤2,从获取到的数据集中选取特征属性:对固废资源环境属性信息进行分析,选取对固废资源化利用的三类特征属性,包括材料科学特征、化学成分与结构特征、矿物相与组成特征;
步骤3,数据预处理:一组特征属性下的数据有20%以上的缺失值,则删除这组数据,20%以下的缺失值则用均值补全;将同一特征属性下的数据进行一致性检查,将文字型特征属性转化为数值型,将固废资源化利用的技术方向的分类标签转化为分类数值,并对没有关联的特征属性和分类标签进行独热编码;
步骤4,搭建随机森林分类器模型:以训练集内特征属性下的数据为输入,以固废资源化利用技术方向的分类标签为输出,建立随机森林分类器模型,将测试集内特征属性下的数据零均值标准化处理,导入建立的模型中,测试模型的泛化性,调整随机森林参数,完善模型实现对固废资源化利用方向的分类决策;
步骤5,得到一个或多个固废资源化利用的分类标签,每个分类标签代表着一个固废资源化利用方向。
2.根据权利要求1所述的一种多源煤基固废资源化利用方向的决策方法,其特征在于,所述步骤3中一致性检查包括检查数据的取值范围,对超出合数量级范围的数据进行修正,并且将数据单位格式保持一致。
3.根据权利要求1所述的一种多源煤基固废资源化利用方向的决策方法,其特征在于,所述步骤4中建立随机森林分类器模型的具体步骤为:
(1)设定随机森林参数的范围,树的数量在100~200之间,树的特征个数为数据集全部特征属性的开平方,树的深度为10~100之间;
(2)将训练集中的数据进行零均值标准化处理,运用网格搜索法,通过十折交叉验证法,将训练集数据分为十份,轮流将其中九份作为训练数据,一份作为验证数据,十次结果分类正确率的均值作为评判参树模型的标准,选择准确率最高的参数模型作为最优超参数配比,再将零均值标准化处理后的训练集导入最优超参数的随机森林模型进行训练,得到随机森林分类器模型。
4.一种多源煤基固废资源化利用方向的决策系统,其特征在于,包括数据采集模块、数据存储管理模块、模型构建模块、决策分类模块;
所述数据采集模块采集多源煤基固废的资源环境属性信息数据、多源煤基固废资源化利用方向数据以及每个利用方向下的多个资源化利用技术方案,将采集的数据传输至数据存储管理模块;
所述数据存储管理模块将来自数据采集模块的数据存储,并对数据进行随时的增删改查;
所述分类模型构建模块对数据存储管理模块内的多源煤基固废的资源环境属性信息数据、多源煤基固废资源化利用方向数据进行预处理,多源煤基固废的资源环境属性信息数据作为数据集,分为训练集和测试集,以训练集内特征属性下的数据为输入,以固废资源化利用技术方向的分类标签为输出,建立随机森林分类器模型,将测试集内特征属性下的数据零均值标准化处理,导入建立的模型中,测试模型的泛化性,调整随机森林参数,完善模型实现对固废资源化利用方向的分类决策;
所述分类模型构建模块将建立好的随机森林分类器输送至决策分类模块,将煤基固废的资源环境属性输入到决策分类模块中,输出煤基固废的资源化利用方向标签分类,以及每个利用方向下的多个资源化利用技术方案。
5.根据权利要求4所述的一种多源煤基固废资源化利用方向的决策系统,其特征在于,所述对数据存储管理模块内的多源煤基固废的资源环境属性信息数据、多源煤基固废资源化利用方向数据进行预处理,具体为:
一组特征属性下的数据有20%以上的缺失值,则删除这组数据,20%以下的缺失值则用均值补全;将同一特征属性下的数据进行一致性检查,将文字型特征属性转化为数值型,将固废资源化利用的技术方向的分类标签转化为分类数值,并对没有关联的特征属性和分类标签进行独热编码。
6.根据权利要求5所述的一种多源煤基固废资源化利用方向的决策系统,其特征在于,所述一致性检查包括检查数据的取值范围,对超出合数量级范围的数据进行修正,并且将数据单位格式保持一致。
7.根据权利要求4所述的一种多源煤基固废资源化利用方向的决策系统,其特征在于,所述建立随机森林分类器模型的具体步骤为:
(1)设定随机森林参数的范围,树的数量在100~200之间,树的特征个数为数据集全部特征属性的开平方,树的深度为10~100;
(2)将训练集中的数据进行零均值标准化处理,运用网格搜索法,通过十折交叉验证法,将训练集数据分为十份,轮流将其中九份作为训练数据,一份作为验证数据,十次结果分类正确率的均值作为评判参树模型的标准,选择准确率最高的参数模型作为最优超参数配比,再将零均值标准化处理后的训练集导入最优超参数的随机森林模型进行训练,得到随机森林分类器模型。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210247435.0A CN114611940A (zh) | 2022-03-14 | 2022-03-14 | 一种多源煤基固废资源化利用方向的决策方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210247435.0A CN114611940A (zh) | 2022-03-14 | 2022-03-14 | 一种多源煤基固废资源化利用方向的决策方法及系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN114611940A true CN114611940A (zh) | 2022-06-10 |
Family
ID=81864099
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210247435.0A Pending CN114611940A (zh) | 2022-03-14 | 2022-03-14 | 一种多源煤基固废资源化利用方向的决策方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114611940A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115271481A (zh) * | 2022-08-03 | 2022-11-01 | 武汉憬易达外仓国际物流有限公司 | 一种基于机器视觉的工业固废智能分类处理监测管理系统 |
CN115310628A (zh) * | 2022-07-18 | 2022-11-08 | 浙江大学 | 基于有机固废特性数据的资源化复配利用的方法及系统 |
-
2022
- 2022-03-14 CN CN202210247435.0A patent/CN114611940A/zh active Pending
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115310628A (zh) * | 2022-07-18 | 2022-11-08 | 浙江大学 | 基于有机固废特性数据的资源化复配利用的方法及系统 |
CN115310628B (zh) * | 2022-07-18 | 2023-10-13 | 浙江大学 | 基于有机固废特性数据的资源化复配利用的方法及系统 |
CN115271481A (zh) * | 2022-08-03 | 2022-11-01 | 武汉憬易达外仓国际物流有限公司 | 一种基于机器视觉的工业固废智能分类处理监测管理系统 |
CN115271481B (zh) * | 2022-08-03 | 2024-02-23 | 余石平 | 一种基于机器视觉的工业固废智能分类处理监测管理系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN114611940A (zh) | 一种多源煤基固废资源化利用方向的决策方法及系统 | |
CN110135468B (zh) | 一种煤矸石的识别方法 | |
Chapman et al. | Metal Resources and Energy: Butterworths Monographs in Materials | |
Jennings et al. | A biface and blade core efficiency experiment: implications for Early Paleoindian technological organization | |
CN105975589A (zh) | 一种高维数据的特征选择方法及装置 | |
CN114862169A (zh) | 一种基于bim的隧道工程安全风险监测系统及方法 | |
Liu et al. | Research trend and dynamical development of focusing on the global critical metals: a bibliometric analysis during 1991–2020 | |
Xiong et al. | Eco-efficiency measurement and improvement of Chinese industry using a new closest target method | |
CN117745103A (zh) | 基于指标体系法的海上风电场海洋生态环境影响评价方法 | |
CN112062517B (zh) | 一种基于再生砖混粗骨料分级分类的混凝土配制方法 | |
CN109753739B (zh) | 评估生物质能利用技术对环境影响的方法及装置 | |
CN109447453B (zh) | 一种多阶段网络数据包络分析模型评估包装绿色度的方法 | |
Wang et al. | Hierarchy performance assessment of industrial solid waste utilization—Tracking resource recycling and utilization centers in China | |
CN108564260A (zh) | 用于工业过程海量数据处理和存储的评估方法 | |
CN115526407A (zh) | 基于因果机器学习的电网大数据安全检测预警方法及系统 | |
Bertok et al. | Structure of the RAINS 7.0 Energy and Emissions Database | |
Xie et al. | Coal Gangue data set expansion method based on DCGAN | |
Melo et al. | An assessment of biomass supply chain: a DEA application | |
Meidiana et al. | A Mass Balance Method for Assessing Emergy Benefit of Waste Mining for Refuse Derived Fuel Production | |
Petrova | Exploring the Opportunities for Sustainable Management of Critical Raw Materials in the Circular Economy | |
CN111767945A (zh) | 基于CycleGAN网络模型的车牌样本生成方法及系统 | |
DeWit et al. | Society 5.0 and inclusive resilience | |
CN117591817B (zh) | 煤质资料动态校正方法、装置、电子设备及存储介质 | |
Nelson | New Directions for Tailings Management | |
CN107516313A (zh) | 基于集成学习与密度聚类的锻件表面缺陷在位检测方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |