CN113793645A - 一种基于机器学习模型的堆肥腐熟度预测方法 - Google Patents
一种基于机器学习模型的堆肥腐熟度预测方法 Download PDFInfo
- Publication number
- CN113793645A CN113793645A CN202111087852.5A CN202111087852A CN113793645A CN 113793645 A CN113793645 A CN 113793645A CN 202111087852 A CN202111087852 A CN 202111087852A CN 113793645 A CN113793645 A CN 113793645A
- Authority
- CN
- China
- Prior art keywords
- maturity
- compost
- machine learning
- indexes
- model
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 239000002361 compost Substances 0.000 title claims abstract description 99
- 238000000034 method Methods 0.000 title claims abstract description 83
- 238000010801 machine learning Methods 0.000 title claims abstract description 56
- 230000008569 process Effects 0.000 claims abstract description 36
- 238000009264 composting Methods 0.000 claims abstract description 28
- 238000012549 training Methods 0.000 claims abstract description 23
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 claims abstract description 17
- 238000011156 evaluation Methods 0.000 claims description 26
- 238000007637 random forest analysis Methods 0.000 claims description 19
- 238000010219 correlation analysis Methods 0.000 claims description 15
- 238000012795 verification Methods 0.000 claims description 8
- 238000004458 analytical method Methods 0.000 claims description 7
- 238000007477 logistic regression Methods 0.000 claims description 7
- 238000012706 support-vector machine Methods 0.000 claims description 7
- XKMRRTOUMJRJIA-UHFFFAOYSA-N ammonia nh3 Chemical compound N.N XKMRRTOUMJRJIA-UHFFFAOYSA-N 0.000 claims description 6
- 238000005259 measurement Methods 0.000 claims description 6
- 238000013528 artificial neural network Methods 0.000 claims description 4
- 230000007226 seed germination Effects 0.000 claims description 4
- 230000003247 decreasing effect Effects 0.000 claims description 2
- 238000000354 decomposition reaction Methods 0.000 abstract description 9
- 238000001514 detection method Methods 0.000 abstract 1
- 238000004422 calculation algorithm Methods 0.000 description 12
- 238000004364 calculation method Methods 0.000 description 5
- 230000008859 change Effects 0.000 description 5
- 230000009467 reduction Effects 0.000 description 5
- 230000006870 function Effects 0.000 description 4
- 238000004519 manufacturing process Methods 0.000 description 4
- 238000005070 sampling Methods 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 3
- 239000010813 municipal solid waste Substances 0.000 description 3
- 238000005457 optimization Methods 0.000 description 3
- 239000002910 solid waste Substances 0.000 description 3
- 238000012360 testing method Methods 0.000 description 3
- 230000000694 effects Effects 0.000 description 2
- 230000035784 germination Effects 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 238000004064 recycling Methods 0.000 description 2
- 238000001228 spectrum Methods 0.000 description 2
- 239000000126 substance Substances 0.000 description 2
- 241001532704 Azolla Species 0.000 description 1
- 239000002028 Biomass Substances 0.000 description 1
- OKTJSMMVPCPJKN-UHFFFAOYSA-N Carbon Chemical compound [C] OKTJSMMVPCPJKN-UHFFFAOYSA-N 0.000 description 1
- CKUAXEQHGKSLHN-UHFFFAOYSA-N [C].[N] Chemical compound [C].[N] CKUAXEQHGKSLHN-UHFFFAOYSA-N 0.000 description 1
- 230000009471 action Effects 0.000 description 1
- 238000013473 artificial intelligence Methods 0.000 description 1
- 244000052616 bacterial pathogen Species 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000012925 biological evaluation Methods 0.000 description 1
- 229910052799 carbon Inorganic materials 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 238000002790 cross-validation Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 238000012854 evaluation process Methods 0.000 description 1
- 239000003337 fertilizer Substances 0.000 description 1
- PCHJSUWPFVWCPO-UHFFFAOYSA-N gold Chemical compound [Au] PCHJSUWPFVWCPO-UHFFFAOYSA-N 0.000 description 1
- 239000003864 humus Substances 0.000 description 1
- 238000002329 infrared spectrum Methods 0.000 description 1
- 244000005700 microbiome Species 0.000 description 1
- 239000003895 organic fertilizer Substances 0.000 description 1
- 238000011548 physical evaluation Methods 0.000 description 1
- WVWHRXVVAYXKDE-UHFFFAOYSA-N piperine Natural products O=C(C=CC=Cc1ccc2OCOc2c1)C3CCCCN3 WVWHRXVVAYXKDE-UHFFFAOYSA-N 0.000 description 1
- 235000019100 piperine Nutrition 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- 238000010200 validation analysis Methods 0.000 description 1
- 239000002699 waste material Substances 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B40/00—ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16C—COMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
- G16C20/00—Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
- G16C20/70—Machine learning, data mining or chemometrics
Landscapes
- Engineering & Computer Science (AREA)
- Medical Informatics (AREA)
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- General Health & Medical Sciences (AREA)
- Evolutionary Computation (AREA)
- Artificial Intelligence (AREA)
- Bioinformatics & Computational Biology (AREA)
- Software Systems (AREA)
- Biophysics (AREA)
- Public Health (AREA)
- Biotechnology (AREA)
- Evolutionary Biology (AREA)
- Epidemiology (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Bioethics (AREA)
- Chemical & Material Sciences (AREA)
- Crystallography & Structural Chemistry (AREA)
- Computing Systems (AREA)
- Processing Of Solid Wastes (AREA)
- Fertilizers (AREA)
Abstract
本发明公开了一种基于机器学习模型的堆肥腐熟度预测方法。本发明的步骤如下:S1、获取目标堆肥工艺下不同腐熟阶段堆肥样本指标组成的数据集,且数据集中每个样本包括堆体的含水率、温度、pH、E4/E6以及腐熟度;S2、利用数据集对机器学习模型进行训练,其中模型以经过标准化后的堆体的含水率、温度、pH、E4/E6四个指标作为输入,以腐熟度作为输出,通过监督学习得到堆肥腐熟度预测模型;S3、针对目标堆肥工艺下的堆体,测定堆体的四个输入指标,将其标准化后输入堆肥腐熟度预测模型中,得到堆肥腐熟度的预测结果。本发明基于4种简单易测定的指标来判断堆肥的腐熟情况,避免了较为复杂的检测过程,具有精度高,方便快捷等优点,易于推广应用。
Description
技术领域
本发明属于堆肥技术领域,特别是涉及到堆体腐熟度的预测方法。
背景技术
随着经济的发展和城市化水平的快速推进,城镇厨余垃圾年产生量不断增长,推进有机固废的减量化、资源化和无害化迫在眉睫。在众多处理处置方法中,好氧堆肥技术是颇具前景的处理技术。该技术是指在好氧条件下,通过微生物作用,对厨余垃圾中的有机物进行分解,最终形成稳定的、富含腐殖质的生物质有机肥。其操作简单成本低,不仅实现了废弃物的资源化利用,也是达成碳减排的重要途径。
腐熟度是判断堆肥资源化水平的重要依据,好氧堆肥工艺中,确定堆体的腐熟度至关重要。过腐熟的堆肥会降低资源利用效率,如长时间占用土地,后续有机固废得不到及时堆置;而未腐熟的有机固废不稳定,存在物质分解不完全,病原菌未被完全杀死等问题。现有的堆肥腐熟度指标种类繁多,包括物理评价指标、化学评价指标和生物评价指标,但不同指标预测结果差异较大。有的研究人员利用模糊综合评价法、灰色关联分析法等数学分析方法对几类主要指标进行综合评判,基于多指标的综合评价能较准确地反映堆体腐熟度,这类综合评价方法多用到的指标包括:表观性状、含水率、高温期持续时间、C/N下降速率、氨氮浓度变化速率、NH4 +-N/NO3 --N、种子发芽指数等,但在各指标测定过程中往往操作过程繁琐,耗时较长(Bernal等,2009;娄义晟等,2020)。为了克服上述问题,近年来研究人员采用基于图像或近红外光谱等手段构建智能模型,其优点在于通过图像或光谱等变化即可判断堆体是否腐熟,但实现过程较为繁琐,而且还需将图像或光谱等解析成算法可识别数据,技术难度较大(Xue等,2019;黄圆萍等,2020),普通技术人员难以实现。
因而需要一种能快速、简单、准确地反映堆肥体系腐熟度的方法,便于在实际生产环节进行应用。
发明内容
基于此,本发明针对背景技术中存在的问题,提出一种基于机器学习模型的堆肥腐熟度预测方法,其思路是先将4种简单易测指标与堆肥真实腐熟度对应建立机器学习模型,让模型进行有监督学习,之后仅输入某一阶段4种简单易测指标,模型就可以预测出该阶段的腐熟情况。
本发明具体采用的技术方案如下:
一种基于机器学习模型的堆肥腐熟度预测方法,其步骤如下:
S1、获取目标堆肥工艺下不同堆肥腐熟阶段堆肥样本指标组成的数据集,且数据集中每一个样本包括堆体的含水率、温度、pH、E4/E6以及腐熟度五个指标;
S2、利用所述数据集对机器学习模型进行训练,其中机器学习模型以经过标准化后的堆体的含水率、温度、pH、E4/E6四个指标作为输入,以腐熟度作为输出,通过监督学习得到堆肥腐熟度预测模型;
S3、针对目标堆肥工艺下的堆体,测定堆体的含水率、温度、pH和E4/E6四个指标,将其标准化后输入所述堆肥腐熟度预测模型中,得到堆肥腐熟度的预测结果。
作为优选,所述S1的每一个样本中,作为真值标签的腐熟度由多个评价指标通过综合评价方法确定,其中评价指标为含水率、C/N下降速率(η(C/N))、氨氮浓度变化速率(γ(NH4 +-N))和种子发芽指数(GI)。
作为优选,所述综合评价方法为灰色关联分析方法。
进一步的,通过灰色关联分析确定的腐熟度采用精确划分等级或模糊划分等级,其中精确划分等级包括完全腐熟、较好腐熟、基本腐熟、未腐熟四种等级,所述模糊划分等级包括腐熟和未腐熟两种等级。
作为优选,所述S2中,所选择的机器学习模型为逻辑回归(LR)、线性判别分析(LDA)、K近邻(KNN)、朴素贝叶斯(NB)、支持向量机(SVM)、随机森林(RF)、神经网络(DL)中的至少一种。
进一步的,所述S2中,将所述数据集分为训练集和验证集,利用训练集同时训练多种机器学习模型,并利用验证集评估不同机器学习模型的表现精度,选择表现最佳的机器学习模型构建堆肥腐熟度预测模型。
进一步的,所述表现最佳的机器学习模型为随机森林模型。
作为优选,所述随机森林模型需进行超参数优化,所优化的超参数为:不纯度的衡量指标、模型构建树的个数n_estimators、树的最大深度max_depth、最小子节点min_samples_leaf和最小训练样本min_sample_split。
相对于现有技术而言,本发明具有以下有益效果:
本发明提出了一种以温度、含水率、pH和E4/E6这一类简单易测的指标作为输入特征,借助机器学习方法的高效学习能力,可以快速准确的评价堆肥的腐熟情况的方法。本发明克服了传统方法在确定堆肥腐熟度时耗时长、操作繁琐等弊端,用机器学习模型将简单易得的指标与堆肥腐熟度联系起来,结果准确,操作简单,耗时较短,提高了生产效率。
附图说明
图1为本发明腐熟度预测方法的流程图;
图2为7种机器学习算法的表现精度;
图3为随机森林模型的表现精度;
图4为实施例中不同阶段堆体腐熟度的预测结果。
具体实施方式
为了使本发明的目的、技术方案和优点更加清楚明白,下面结合附图和具体实施方式对本发明做进一步阐述和说明。应当理解,此处所描述的实施方式和实例仅用于解释本发明,并不用于限定本发明。
参见图1,在本发明的一个较佳实施例中,提供了一种基于机器学习模型的堆肥腐熟度预测方法,该方法的目的是用简单易测的指标来预测难以直接测定的堆肥腐熟度。该方法具体包括以下步骤:
S1、获取目标堆肥工艺下不同堆肥腐熟阶段堆肥样本指标组成的数据集,且数据集中每一个样本包括堆体的含水率、温度、pH、E4/E6以及腐熟度五个指标。
需注意的是,本发明中构建数据集所用的指标数据是从与待预测腐熟度的堆体采用相同堆肥工艺的堆体中采集的。可在堆体的堆肥过程中,定时采集代表不同堆肥腐熟阶段的样品并测定其中的不同指标。在上述五个指标中,堆体的含水率、温度、pH、E4/E64个指标简单易测,但堆体的腐熟度则并非是一个能够直接测得的指标,而是需要通过多个评判指标综合确定。在现有技术中,具有多种相对科学合理的综合确定方法可以用来最终确定真实腐熟度,本发明中可以任意选择其中一种或多种方法确定堆体的真实腐熟度,进而作为后续模型训练的金标准。在本实施例中,每一个样本对应的作为真值标签的腐熟度由4个评价指标通过灰色关联分析方法确定,其中4个评价指标为:含水率、C/N下降速率(η(C/N))、氨氮浓度变化速率(γ(NH4 +-N))和种子发芽指数(GI),可以从堆体中取样测定得到。
灰色关联分析法确定堆肥腐熟度属于现有技术,在众多现有技术文献中也都给出了相应的实现方法,可参照任意一种现有方法实现。一般而言,在进行灰色关联分析之前需要预先确定所要划分的腐熟度等级,本实施例中可以选用两种等级划分方式,即精确划分等级和模糊划分等级,其中精确划分等级(记为腐熟预测模式Ⅰ)包括完全腐熟、较好腐熟、基本腐熟、未腐熟四种等级,而模糊划分等级(记为腐熟预测模式Ⅱ)包括腐熟和未腐熟两种等级。
灰色关联分析方法需要预先设定一个堆肥腐熟度分级标准,该堆肥腐熟度分级标准可以在上述4个评价指标的基础上结合现有文献报道、公认标准或者专家经验进行确定。在本实施例中,对于腐熟预测模式Ⅰ,堆肥腐熟度分级标准可以采用下表:
(注:本表指标选取和等级划分参考:Bernal等,2009;Kristine等,2013;李洋等,2014;Zhang等,2020;张永涛等,2009;任春晓等,2012;弓凤莲等,2014;孟国欣等,2018;冯雯雯等,2020;戴美玲等,2020;《有机肥料》(NY/T525-2021)标准)。
而对于腐熟预测模式Ⅱ,可以在腐熟预测模式Ⅰ所确定的腐熟度等级上,把基本腐熟、较好腐熟和完全腐熟归为腐熟,即仅存在腐熟和未腐熟,两者的堆肥腐熟等级划分对照如下表:
为了便于理解,下面以精确划分等级为例,介绍本实施例中灰色关联分析方法的基本过程,其计算步骤如下:
1)设待评价堆肥样品序列{x0(k)}={x0(1),x0(2),x0(3),x0(4)}为参考序列;{xi(k)}={xi(1),xi(2),xi(3),xi(4)}为被比较序列
其中,i为腐熟度等级划分,i=1表示完全腐熟;i=2表示较好腐熟;i=3表示基本腐熟;i=4表示未腐熟。k为评价指标,如上所述四类。
2)关联分析的关联系数公式为L0i:
其中,ρ为分辨系数,0<ρ<1,通常取值为0.5。
3)计算被比较序列和比较序列间的关联度r0i:
关联度r0i最大的数对应的评价等级为腐熟等级,从而确定各个样品腐熟度等级。
当然,在其他实施例中,每一个样本的真实腐熟度也可以采用除上述灰色关联分析法之外的其他综合方法确定,对此不作限制。
由此,经过上述方法,即可建立一个包含了众多数据样本的数据集,该数据集中的每一个样本均具有四个简单易测的指标(含水率、温度、pH、E4/E6)和一个通过综合分析得到的腐熟度指标。数据集中的样本量应当保证能够满足机器学习模型的训练对于样本量的要求,在允许的情况下尽可能收集更多的样本。
S2、利用S1中建立的数据集对机器学习模型进行训练,其中机器学习模型以经过标准化后的堆体的含水率、温度、pH、E4/E6四个指标作为输入,以腐熟度作为输出。在该训练过程中,数据集中的样本不断输入机器学习模型中,由其根据输入指标对腐熟度进行预测输出,然后以样本中通过灰色关联分析得到的真实腐熟度作为标签进行监督学习,通过不断优化模型参数,最终得到堆肥腐熟度预测模型。
在本发明中,所采用的机器学习模型不限,任意能够实现预测功能的机器学习算法均可。在本实施例中,为了测试不同的机器学习模型对于堆肥腐熟度预测的性能,选择了7种经典的机器学习模型进行测试,分别为:逻辑回归(LR)、线性判别分析(LDA)、K近邻(KNN)、支持向量机(SVM)、朴素贝叶斯(NB)、随机森林(RF)、神经网络(DL)。在测试过程中,可实现将S1中构建的数据集分为训练集和验证集,利用训练集同时训练多种机器学习模型,并利用验证集评估不同机器学习模型的表现精度,选择表现最佳的机器学习模型构建堆肥腐熟度预测模型。需要说明的是,在其他实施例中,所选取的机器学习模型也可以是其他算法,并不一定仅限于上述7种。机器学习模型的训练过程属于现有技术,可通过不断优化模型参数实现,对此不再赘述。
机器学习模型的性能评估方法可以选用现有技术中的任意方法实现,其评估指标可根据实际情况调整。本实施例中,主要考虑模型的预测准确性,因此用模型精确度来评价模型优劣,具体评估算法可采用pipelines初步评估算法。通过性能评估,可从上述7种机器学习模型中选择出性能最佳的机器学习模型类型,进而基于该模型类型构建堆肥腐熟度预测模型。
另外,需要注意的是,由于机器学习模型类型内部除了训练过程中能自动优化的模型参数外,还存在大量的超参数。因此,针对选择出性能最佳的机器学习模型,还可以在投入实际的预测任务之前进一步对其超参数进行优化,进一步提高模型精度,构建能基于4个简单指标快速、准确预测堆肥腐熟度的堆肥腐熟度预测模型。以随机森林模型为例,该模型中需进行优化的超参数为:不纯度的衡量指标、模型构建树的个数n_estimators、树的最大深度max_depth、最小子节点min_samples_leaf和最小训练样本min_sample_split,其余的超参数可按照默认参数进行设置。当然,该超参数的优化过程是否执行以及对哪些超参数进行调整,可根据实际情况进行取舍。
最终,经过上述训练过程后,即可得到在对同一种堆肥工艺中的堆体进行快速堆肥腐熟度预测的模型。需说明的是,本发明中的目标堆肥工艺并无限制,对于任意一种待预测的堆肥工艺,只要按照S1对此种堆肥工艺下的不同腐熟阶段堆体进行采样进而构建数据集训练相应的机器学习模型,即可实现该种堆肥工艺下的堆肥腐熟度预测。本发明的后续实施例中,堆肥工艺为传统的好氧堆肥工艺,但本发明亦可适用于其他的堆肥工艺。
S3、针对目标堆肥工艺下的堆体,测定堆体的含水率、温度、pH和E4/E6四个指标,将其标准化后输入所述堆肥腐熟度预测模型中,得到堆肥腐熟度的预测结果。由此,无需测定其他的指标,即可实现堆肥腐熟度的快速预测。
下面将上述S1~S3的做法应用于一个具体的实例中,以展示本发明的具体实现过程和技术效果。
应用例1
本实施例中,采集某城镇生活垃圾阳光房堆肥站点的堆肥样品数据进行预测,该站点采用好氧堆肥工艺,堆肥周期为30天,分别在不同堆肥腐熟阶段即堆肥开始的第0、5、12、20、25、30天对堆体不同点位进行采样分析。每一个采样样本所测定各指标分别为温度、含水率、pH、E4/E6、碳氮比下降速率(η(C/N))、氨氮浓度变化速率(γ(NH4 +-N))、种子发芽指数(GI)。
部分所采集样品理化性质测定结果如表1所示:
由于γ(NH4 +-N)=(NH4 +-N终/NH4 +-N初)×100%,所以第0天计算可得为1)
本实例中基于机器学习模型的堆肥腐熟度预测方法的具体过程如下:
步骤1:基于好氧堆肥工艺下不同堆肥腐熟阶段的堆肥样本测定指标构建得到数据集,数据集中每一个样本包括输入指标和输出标签两类,其中:
输入指标为每一个采样样本的温度、含水率、pH、E4/E6这4个指标,用于输入模型预测堆肥腐熟度;
输出标签为堆体的真实腐熟度,可选择含水率、C/N下降速率、氨氮浓度变化速率和种子发芽指数结合灰色关联分析方法确定,堆肥真实腐熟度的确定方法如下:
1)精确划分腐熟等级如下表:
2)灰色关联预测分析法将堆肥腐熟度分级标准、待评价堆肥样品看做一个灰色系统
设待评价堆肥样品序列{x0(k)}={x0(1),x0(2),x0(3),x0(4)}为参考序列;{xi(k)}={xi(1),xi(2),xi(3),xi(4)}为被比较序列;
其中,i为腐熟度等级划分,i=1表示完全腐熟;i=2表示较好腐熟;i=3表示基本腐熟;i=4表示未腐熟。k为评价指标,如上所述四类。
这里,令{x0(k)}={35,40,50,75}。
以第20天为例,计算这一天关联系数公式L0i,公式如下:
计算结果如下表:
在上述计算结果下,进一步计算这一天关联度r0i,公式如下:
计算结果如下表,第20天与“较好腐熟”关联度最高,判定为较好腐熟。
按照腐熟预测模式Ⅱ,可以判定为:腐熟
进一步的,按上述计算步骤,得到所采集样本的真实腐熟情况:
步骤2:将上一步得到的数据集分别训练集和验证集,对待优化的7种机器学习模型进行训练,其中机器学习模型以经过标准化后的堆体的含水率、温度、pH、E4/E6四个指标作为输入,以腐熟度作为输出,通过监督学习得到堆肥腐熟度预测模型。7种模型分别为逻辑回归(LR)、线性判别分析(LDA)、K近邻(KNN)、朴素贝叶斯(NB)、支持向量机(SVM)、随机森林(RF)、神经网络(DL),具体的优化过程如下:
1)在Python3.6版本中调用所需要的库,读取数据,进行数据标准化,分离评估数据集,确定训练集:验证集=7:3,选用5折交叉验证,用pipelines初步评估算法,按精确度大小确定模型优劣。
pipelines初步评估算法过程如下:1)构建pipelines={}的集合,子集为各机器学习算法,先对数据进行标准化处理,调用StandardScaler()函数,在每个子集中导入各个模型算法,这里先不对模型算法进行任何处理,暂时按照系统默认设置;2)集合构建好后,按照Python语法编写循环语句;3)评价过程中,编写输出结果的均值函数和标准差函数用以反映各个模型表现,腐熟预测模式Ⅰ下,模型表现如图2所示。从图2中可以看出,随机森林(RF)的模型精度最高,因此本实施例中选择以随机森林模型为最佳模型,构建堆肥腐熟度预测模型。
2)基于上一步确定的最佳模型——随机森林模型,基于sklearn库中的GridSearchCV确定所需要进一步调整的超参数为:不纯度的衡量指标criterion为基尼系数,模型构建树的个数n_estimators为100,树的最大深度max_depth为3,最小子节点min_samples_leaf为10,最小训练样本min_sample_split为60,其他参数操作按系统默认。优化后,随机森林模型对腐熟度预测表现如图3所示。
需要说明的是,上述超参数的最终优化数值并非定值,在不同数据集下,最优参数会发生变化,按照GridSearchCV所得结果为准。
3)预测过程:将上述验证集输入优化后的随机森林模型中,调用Predict命令,以堆体的含水率、温度、pH和E4/E6四个指标标准化后作为输入,输出堆肥腐熟度的预测结果,进而与标签值比较得到模型精度。
图4给出了模型对不同时期样品腐熟度的预测结果,当按照腐熟预测模式Ⅰ,想要确定堆肥腐熟度的四个不同等级,模型预测中存在一个偏差,将“较好腐熟”预测成了“基本腐熟”,其他各种情况预测结果准确;当按照腐熟预测模式Ⅱ,仅考虑堆体是否腐熟,模型可以准确判断不同时期样品的腐熟情况。
由上述实例可以看出,本发明可以通过仅仅几个简单易测指标从而较好的预测堆肥腐熟度,当涉及精确预测不同等级的腐熟情况时,会有一定错误率,但预测效果也不错;当仅考虑堆体是否腐熟时,模型能进行准确的预测。
本发明从考虑几个简单易测的指标出发,基于人工智能技术,提出了一种基于简单易测指标预测堆肥腐熟度的方法,该方法避免了传统腐熟度确定中耗时长、操作繁琐等问题,具有精度高、预测快等优点。
需要说明的是,本发明用了部分篇幅讲述灰色关联分析对腐熟度的确定,该部分在现有的文献和专利中已有研究,鉴于其采用综合判断手段,结果准确。本发明主要在建模过程中将几种简单易测的指标与真实腐熟度结果对应起来构建机器学习模型,当模型构建好后,本申请的创造性体现在用几种简单易测的指标直接实现对腐熟度的预测。
以上所述的实施例只是本发明的一种较佳的方案,然其并非用以限制本发明。有关技术领域的普通技术人员在进行实际生产运作时,在不脱离本发明的精神和范围的情况下,还可以针对指标、算法等进行适当调整。因此凡采取等同替换或等效变换的方式所获得的技术方案,均落在本发明的保护范围内。
Claims (8)
1.一种基于机器学习模型的堆肥腐熟度预测方法,其特征在于,步骤如下:
S1、获取目标堆肥工艺下不同堆肥腐熟阶段堆肥样本指标组成的数据集,且数据集中每一个样本包括堆体的含水率、温度、pH、E4/E6以及腐熟度五个指标;
S2、利用所述数据集对机器学习模型进行训练,其中机器学习模型以经过标准化后的堆体的含水率、温度、pH、E4/E6四个指标作为输入,以腐熟度作为输出,通过监督学习得到堆肥腐熟度预测模型;
S3、针对目标堆肥工艺下的堆体,测定堆体的含水率、温度、pH和E4/E6四个指标,将其标准化后输入所述堆肥腐熟度预测模型中,得到堆肥腐熟度的预测结果。
2.根据权利要求1所述的基于机器学习模型的堆肥腐熟度预测方法,其特征在于,所述S1的每一个样本中,作为真值标签的腐熟度由多个评价指标通过综合评价方法确定,其中评价指标为含水率、C/N下降速率、氨氮浓度变化速率和种子发芽指数。
3.根据权利要求1所述的基于机器学习模型的堆肥腐熟度预测方法,其特征在于,所述综合评价方法为灰色关联分析方法。
4.根据权利要求2所述的基于机器学习模型的堆肥腐熟度预测方法,其特征在于,通过灰色关联分析确定的腐熟度采用精确划分等级或模糊划分等级,其中精确划分等级包括完全腐熟、较好腐熟、基本腐熟、未腐熟四种等级,所述模糊划分等级包括腐熟和未腐熟两种等级。
5.根据权利要求1所述的基于机器学习模型的堆肥腐熟度预测方法,其特征在于,所述S2中,所选择的机器学习模型为逻辑回归、线性判别分析、K近邻、朴素贝叶斯、支持向量机、随机森林、神经网络中的至少一种。
6.根据权利要求5所述的基于机器学习模型的堆肥腐熟度预测方法,其特征在于,所述S2中,将所述数据集分为训练集和验证集,利用训练集同时训练多种机器学习模型,并利用验证集评估不同机器学习模型的表现精度,选择表现最佳的机器学习模型构建堆肥腐熟度预测模型。
7.根据权利要求6所述的基于机器学习模型的堆肥腐熟度预测方法,其特征在于,所述表现最佳的机器学习模型为随机森林模型。
8.根据权利要求7所述基于机器学习模型的堆肥腐熟度预测方法,其特征在于,所述随机森林模型需进行超参数优化,所优化的超参数为:不纯度的衡量指标、模型构建树的个数n_estimators、树的最大深度max_depth、最小子节点min_samples_leaf和最小训练样本min_sample_split。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111087852.5A CN113793645A (zh) | 2021-09-16 | 2021-09-16 | 一种基于机器学习模型的堆肥腐熟度预测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111087852.5A CN113793645A (zh) | 2021-09-16 | 2021-09-16 | 一种基于机器学习模型的堆肥腐熟度预测方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN113793645A true CN113793645A (zh) | 2021-12-14 |
Family
ID=78878692
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111087852.5A Pending CN113793645A (zh) | 2021-09-16 | 2021-09-16 | 一种基于机器学习模型的堆肥腐熟度预测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113793645A (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114048897A (zh) * | 2021-10-29 | 2022-02-15 | 西藏电建成勘院工程有限公司 | 一种基于温度、湿度条件的秸秆堆肥有机质含量预测模型构建方法 |
CN114530209A (zh) * | 2022-03-30 | 2022-05-24 | 哈尔滨工业大学 | 一种基于ann的城乡混合垃圾好氧发酵腐殖程度预测方法 |
CN114757543A (zh) * | 2022-04-20 | 2022-07-15 | 福建农林大学 | 一种堆肥工艺效能评价方法 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20090050789A (ko) * | 2007-11-16 | 2009-05-20 | 대한민국(관리부서:농촌진흥청) | 바실러스 아밀로리퀴페시언스 케이제이-6 및 이를 이용하여감귤원 부산물을 퇴비화하는 방법 |
CN106018375A (zh) * | 2016-08-09 | 2016-10-12 | 东北农业大学 | 一种基于lm神经网络的堆肥腐熟度分级评价方法 |
CN108168608A (zh) * | 2017-12-21 | 2018-06-15 | 中国科学院合肥物质科学研究院 | 农牧废弃物无害化高效堆肥品质在线智能监测系统 |
CN109214635A (zh) * | 2017-07-06 | 2019-01-15 | 北京市首发天人生态景观有限公司 | 一种堆肥腐熟度的评价方法 |
CN113139342A (zh) * | 2021-04-23 | 2021-07-20 | 上海交通大学 | 一种好氧堆肥监测系统及结果预测方法 |
-
2021
- 2021-09-16 CN CN202111087852.5A patent/CN113793645A/zh active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20090050789A (ko) * | 2007-11-16 | 2009-05-20 | 대한민국(관리부서:농촌진흥청) | 바실러스 아밀로리퀴페시언스 케이제이-6 및 이를 이용하여감귤원 부산물을 퇴비화하는 방법 |
CN106018375A (zh) * | 2016-08-09 | 2016-10-12 | 东北农业大学 | 一种基于lm神经网络的堆肥腐熟度分级评价方法 |
CN109214635A (zh) * | 2017-07-06 | 2019-01-15 | 北京市首发天人生态景观有限公司 | 一种堆肥腐熟度的评价方法 |
CN108168608A (zh) * | 2017-12-21 | 2018-06-15 | 中国科学院合肥物质科学研究院 | 农牧废弃物无害化高效堆肥品质在线智能监测系统 |
CN113139342A (zh) * | 2021-04-23 | 2021-07-20 | 上海交通大学 | 一种好氧堆肥监测系统及结果预测方法 |
Non-Patent Citations (5)
Title |
---|
任春晓 等: "有机生活垃圾不同微生物接种工艺堆肥腐熟度评价", 《环境科学研究》, vol. 25, no. 2, pages 227 - 230 * |
刘建伟 等: "生活垃圾综合处理与资源化利用技术", 30 September 2018, 北京:中国环境出版集团, pages: 175 - 182 * |
卢鹏: "剩余污泥好氧堆肥及蚯蚓处理研究", 《中国优秀硕士学位论文全文数据库 工程科技I辑》, no. 08, 15 August 2015 (2015-08-15), pages 20 - 22 * |
王新杰 等: "超高温好氧堆肥技术对隔离区餐厨垃圾处理的应用可行性分析", 《厦门大学学报(自然科学版)》, vol. 59, no. 3, pages 357 * |
黄游 等: "基于概率神经网络的污泥堆肥腐熟度的综合判别", 《生态环境》, vol. 15, no. 1, 31 January 2006 (2006-01-31), pages 54 - 56 * |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114048897A (zh) * | 2021-10-29 | 2022-02-15 | 西藏电建成勘院工程有限公司 | 一种基于温度、湿度条件的秸秆堆肥有机质含量预测模型构建方法 |
CN114530209A (zh) * | 2022-03-30 | 2022-05-24 | 哈尔滨工业大学 | 一种基于ann的城乡混合垃圾好氧发酵腐殖程度预测方法 |
CN114757543A (zh) * | 2022-04-20 | 2022-07-15 | 福建农林大学 | 一种堆肥工艺效能评价方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Guo et al. | Application of machine learning methods for the prediction of organic solid waste treatment and recycling processes: A review | |
CN113793645A (zh) | 一种基于机器学习模型的堆肥腐熟度预测方法 | |
Weber et al. | Community-level physiological profiling | |
Gaida et al. | State estimation for anaerobic digesters using the ADM1 | |
CN106991437A (zh) | 基于随机森林预测污水水质数据的方法及系统 | |
CN113658640B (zh) | 一种淡水生态系统健康评价方法 | |
CN103793604A (zh) | 一种基于相关向量机的污水处理软测量方法 | |
CN118098409B (zh) | 一种临海黑臭淤泥质黏土处理工艺参数选择方法、介质及系统 | |
CN116882562A (zh) | 一种农业碳排放影响因素分析方法及系统 | |
CN117216724A (zh) | 一种微生物培养过程中多种物质实时检测的方法 | |
CN117711521A (zh) | 一种人工智能模型预测堆肥氨氮含量的方法 | |
Zuxing et al. | A Prediction Model of Forest Preliminary Precision Fertilization Based on Improved GRA‐PSO‐BP Neural Network | |
Ramya et al. | A predictive model construction for mulberry crop productivity | |
Huang et al. | Machine-learning intervention progress in the field of organic waste composting: Simulation, prediction, optimization, and challenges | |
Wang et al. | Predicting maturity and identifying key factors in organic waste composting using machine learning models | |
CN115343421A (zh) | 一种基于智能算法的堆肥腐熟度提升方法 | |
Kubule et al. | Modelling of the bioeconomy system using interpretive structural modelling | |
CN115497573B (zh) | 一种炭基生物地质催化材料性质预测与制备方法 | |
Shi et al. | Improving prediction of N2O emissions during composting using model-agnostic meta-learning | |
CN118324559A (zh) | 一种堆肥有机质分子量定向调控方法、装置、介质及产品 | |
Hou et al. | Machine learning for high-precision simulation of dissolved organic matter in sewer: Overcoming data restrictions with generative adversarial networks | |
CN118235588B (zh) | 基于作物相对产量差优化氮肥用量的方法 | |
CN118866171A (zh) | 一种基于随机森林模型预测畜禽粪便堆肥腐熟度的方法 | |
AU2021103994A4 (en) | An Ensemble Based Machine Learning System and Method for Predicting the level of Biological Oxygen Demand in River Water | |
CN118800337A (zh) | 一种基于人工智能的中药渣堆肥菌剂制备方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |