CN116542343B - 一种用于水生态治理的微生物生长状况监测管理方法 - Google Patents

一种用于水生态治理的微生物生长状况监测管理方法 Download PDF

Info

Publication number
CN116542343B
CN116542343B CN202310612492.9A CN202310612492A CN116542343B CN 116542343 B CN116542343 B CN 116542343B CN 202310612492 A CN202310612492 A CN 202310612492A CN 116542343 B CN116542343 B CN 116542343B
Authority
CN
China
Prior art keywords
data set
environmental parameter
original data
growth period
period
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202310612492.9A
Other languages
English (en)
Other versions
CN116542343A (zh
Inventor
郑晓霞
赵淼
冯军涛
陈志峰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Suzhou Shuoya Ep Technology Co ltd
Original Assignee
Suzhou Shuoya Ep Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Suzhou Shuoya Ep Technology Co ltd filed Critical Suzhou Shuoya Ep Technology Co ltd
Priority to CN202310612492.9A priority Critical patent/CN116542343B/zh
Publication of CN116542343A publication Critical patent/CN116542343A/zh
Application granted granted Critical
Publication of CN116542343B publication Critical patent/CN116542343B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/18Complex mathematical operations for evaluating statistical data, e.g. average values, frequency distributions, probability functions, regression analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/211Selection of the most significant subset of features
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/01Dynamic search techniques; Heuristics; Dynamic trees; Branch-and-bound
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • G06Q50/26Government or public services

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Software Systems (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • Mathematical Physics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Computational Mathematics (AREA)
  • Pure & Applied Mathematics (AREA)
  • Computing Systems (AREA)
  • Mathematical Analysis (AREA)
  • Mathematical Optimization (AREA)
  • Tourism & Hospitality (AREA)
  • Development Economics (AREA)
  • Economics (AREA)
  • Algebra (AREA)
  • Databases & Information Systems (AREA)
  • Medical Informatics (AREA)
  • Computational Linguistics (AREA)
  • Educational Administration (AREA)
  • Operations Research (AREA)
  • Health & Medical Sciences (AREA)
  • Probability & Statistics with Applications (AREA)
  • General Health & Medical Sciences (AREA)
  • Human Resources & Organizations (AREA)
  • Marketing (AREA)
  • Primary Health Care (AREA)
  • Strategic Management (AREA)
  • General Business, Economics & Management (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

本发明公开了一种用于水生态治理的微生物生长状况监测管理方法,属于水生态治理领域,解决了如何较为准确的判断微生物生长时期以及对相应生长时期进行更好的管理的问题;包括:采集包含目标微生物群的培养水体的环境参数值;对获取的环境参数值进行预处理,并根据目标微生物的生长周期构建不同生长时期的原始数据集;依次对各个原始数据集进行随机森林模型的构建,并输出相应的预测结果;分析各个随机森林模型的预测结果,确定当前目前微生物群的生长时期的最终预测结果以及获取在该生长时期下各个环境参数平均值;根据最终预测结果和各个环境参数平均值对培养水体的目标微生物群进行管理;加快了微生物群的培养进度和污染水体的治理进度。

Description

一种用于水生态治理的微生物生长状况监测管理方法
技术领域
本发明属于水生态治理领域,具体是一种用于水生态治理的微生物生长状况监测管理方法。
背景技术
水生态治理指的是在河道陆域控制线内,在满足防洪、排涝以及引水等河道基本功能的基础上,通过人工修复措施促进河道水生态系统恢复,构建健康、完整、稳定的河道水生态系统的活动。其中,水生态治理的方式有多种,其中通过微生物对污染水体中的有机物进行降解,可做到自然修复的效果。
目前针对水污染治理的微生物的培养采用异地培养,效率低,在对微生物的生长状况进行监测时,一般是通过图像或者其他参数来计算微生物数量,较为繁琐,且有时微生物的个别生长时期的数量相差较小,不能准确判断。为此,本发明提出了一种用于水生态治理的微生物生长状况监测管理方法,能够就如何较为准确的判断微生物生长时期以及对相应生长时期进行更好的管理的问题进行解决。
发明内容
本发明旨在至少解决现有技术中存在的技术问题之一。为此,本发明提出一种用于水生态治理的微生物生长状况监测管理方法,该一种用于水生态治理的微生物生长状况监测管理方法解决了如何较为准确的判断微生物生长时期以及对相应生长时期进行更好的管理的问题。
为了实现上述目的,本发明采用了如下技术方案:
一种用于水生态治理的微生物生长状况监测管理方法,包括:
步骤一:采集包含目标微生物群的培养水体的环境参数值;
步骤二:对获取的环境参数值进行预处理,并根据目标微生物的生长周期构建不同生长时期的原始数据集;
步骤三:依次对各个原始数据集进行随机森林模型的构建,并输出相应的预测结果;包括以下过程:
步骤S1:对原始数据集Di进行有放回的随机采样,获取原始数据集Di的若干个训练样本数据集,其中i表示原始数据集的类型编号,i=1,2,3,4;
步骤S2:对训练样本数据集Dij进行特征选择,进行对应决策树的划分;其中j表示属于相应原始数据集的训练样本数据集的编号,j=1,2……j;
步骤S3:重复步骤S2,将训练后的多个决策树组合成随机森林模型,并统计预测结果的数量;
步骤四:分析各个随机森林模型的预测结果,确定当前目前微生物群的生长时期的最终预测结果以及获取在该生长时期下各个环境参数平均值;
步骤五:根据最终预测结果和各个环境参数平均值对培养水体的目标微生物群进行管理。
进一步地,对获取的环境参数值进行预处理包括:若对应时间点所获取的一组环境参数值中有缺失值或异常值,则使用上一个时间点所获取的对应特征类型的环境参数值进行补充;若对应时间点获取的一组环境参数值中有重复的环境参数值,则去除其中的异常值,并将剩下的重复环境参数值进行平均计算,将计算获取的平均值作为对应特征类型的环境参数值进行存储。
进一步地,原始数据集的类型包括:迟缓期原始数据集D1、对数期原始数据集D2、稳定期原始数据集D3以及衰亡期原始数据集D4。
进一步地,将每个原始数据集中存储的各个环境参数值数据组与目标微生物群对应生长时期的环境参数标准范围表进行比对,并将原始数据集中各个环境参数数据组打上目标微生物群是否处于对应生长时期的标签;
若其中一个原始数据集所存储的所有环境参数数据组的参数值均不在该原始数据集所比对的对应生长时期的环境参数标准范围内,则将该原始数据集中的数据清除,否则保留。
进一步地,步骤S2中,按照温度、湿度、PH、COD、BOD、氨氮以及溶氧量7类特征分别对训练样本数据集Dij中的样本数据进行特征选择;
对每个特征的属性值进行区间划分,参照对应生长时期的环境参数标准范围表进行比对,将属于对应环境参数标准范围的属性值标记为第一属性类,将小于对应环境参数标准范围的属性值标记为第二属性类,将大于对应环境参数标准范围的属性值标记为第三属性类;根据特征的属性类,将训练样本数据集Dij中的样本数据划分为不同的子集Dijq,其中q=1,2,3;每个子集Dijq包含NDijq个样本数据;
将训练样本数据集Dij所表征的目标微生物群是否处于对应生长时期的类别标记为Cijr,其中r=1,2;当r=1时,则表示目标微生物群处于对应生长时期,当r=2,则表示目标微生物群不处于对应生长时期;训练样本数据集Dij的Cijr类别包含NCijr个样本数据;
将子集Dijq中属于Cijr的样本数据的集合标记为Dijqr=Dijq∩Cijr;其中NDijqr表示属于Dijqr的样本数据的个数;
则计算获取A类特征的信息增益G(Dij,A),公式如下:
其中A=1,2……7;
用所有特征对训练样本数据集Dij进行划分,获得多个信息增益,并对信息增益按照从大到小的顺序排列,选取前70%的特征进行决策树的节点分裂和训练。
进一步地,步骤S3中,对训练后的随机森林模型的多个决策树的不同输出结果进行汇总统计,该输出结果包括目标微生物群处于对应生长时期和目标微生物群不处于对应生长时期;将两种输出结果的数量进行比较,选择数量大的输出结果作为该随机森林模型的预测结果。
进一步地,步骤四中,通过步骤三获取分别通过迟缓期原始数据集D1、对数期原始数据集D2、稳定期原始数据集D3以及衰亡期原始数据集D4构建的随机森林模型获取对应预测结果的数量;
将各个预测结果的数量按照从小到大的顺序进行排列,选取其中数量最大的预测结果作为最终预测结果;
针对最终预测结果,获取对应随机森林模型中预测结果为目标微生物群处于对应生长时期的以及处于对应环境参数标准范围的各个特征节点的环境参数属性值,并将相同特征的环境参数属性值进行平均计算,进而获取对应生长时期的各个环境参数平均值。
进一步地,亡期,则生成缩短生长周期的信号至管理后台;
若最终预测结果表示当前目标微生物群处于稳定期,则生成将目标微生物群放入目标河流污染水体的信号至管理后台;
将获取的对应生长时期的环境参数平均值存入管理后台;当管理后台获取更改相应环境参数值缩短生长周期的信号时,以其下一生长时期的各个环境参数平均值为标准来更改当前生长时期的环境参数值。
与现有技术相比,本发明的有益效果是:
1、本发明通过对包含目标微生物群的培养水体的环境参数值进行采集,并基于随机森林模型对获取的环境参数值进行分析,从而实现对目标微生物群当前处于何种生长时期进行监测,并获取对应生长时期的环境参数平均值,作为下一生长时期的标准更改当前生长时期的各个环境参数值,从而使当前迟缓期、对数期或衰亡期尽快进入下一生长时期,缩短目标微生物群的生长周期,从而为目标河流污染水体加快了治理进度。
2、本发明基于随机森林模型对获取的环境参数值进行分析,其中根据目标微生物群的生长周期对同一数据集设置有四种不同的原始数据集,并对各个数据集中的所有环境参数数据组进行目标微生物群是否处于对应生长时期打标签,后续分别根据四个类型的原始数据集建立四个随机森林模型,并将每个随机森林模型的预测结果进行分析,获取最终预测结果,能够消除根据采集到的各个环境参数数据组判断目标微生物群当前所处生长时期的偶然性,使得最终预测结果更加准确,有助于判断目标微生物群所处的生长时期,从而有助于对目标微生物群进行管理,进而提高了目标河流污染水体的治理效率。
3、本发明中通过分析获取当前目标微生物生长时期为稳定期,则可以将目标微生物群放入目标河流污染水体,而目标微生物群是从目标河流污染水体中获取后培养,最终再放入目标河流污染水体,使得经培养后的目标微生物群能够适应目标河流污染水体环境,从而达到水生态修复的作用,方法简便,无需从其他地方获取目标微生物群,随取随用,加快了目标微生物群培养进度和提高了水生态修复的效率。
附图说明
图1为本发明的一种用于水生态治理的微生物生长状况监测管理方法的流程示意图。
具体实施方式
下面将结合实施例对本发明的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例,都属于本发明保护的范围。
如图1所示,一种用于水生态治理的微生物生长状况监测管理方法,包括以下步骤:
步骤一:采集包含目标微生物群的培养水体的环境参数值;
在本实施例中,所述目标微生物群指的是经过本领域人员研究后,对目标河流污染水体进行生物治理的有益微生物群,可以对目标河流污染水体中的污染物进行降解;污染物可以是植物腐败的产物和代谢的产物、生活污水和工业废水的有机类污染物等,当水体有机物过多,会带来水质恶化、水体污染等危害;其中目标微生物群取至目标河流污染水体中,经后期培养后,能够适应目标河流污染水体环境,从而达到水生态修复的作用;
将含有目标微生物群的污染水体倒入培养器中进行目标微生物群的驯化和繁殖;
其中,通过各个类型的传感器对包含目标微生物群的培养水体的环境参数值进行实时检测,并上传至云端数据库中进行存储;
可选的,环境参数值包括培养水体的温度、湿度、PH(酸碱度)、COD(化学需氧量)、BOD(生化需氧量)、氨氮以及溶氧量;每一个时间点对上述环境参数值进行采集时,需要同时采集所有特征类型的环境参数值,并上传至云端数据库;
步骤二:对获取的环境参数值进行预处理,并根据目标微生物的生长周期构建不同生长时期的原始数据集;
为确保数据的可靠性和一致性,对获取的环境参数值进行预处理,包括对每个时间点所获取的各个环境参数值是否缺失、异常、冗余进行处理;
若对应时间点所获取的一组环境参数值中有缺失值或异常值,则使用上一个时间点所获取的对应特征类型的环境参数值进行补充;若对应时间点获取的一组环境参数值中有重复的环境参数值,则去除其中的异常值,并将剩下的重复环境参数值进行平均计算,将计算获取的平均值作为对应特征类型的环境参数值进行存储;
进一步的,每隔单位时间段从云端数据库中获取最新存储的多个环境参数数据组,并分别存入迟缓期原始数据集D1、对数期原始数据集D2、稳定期原始数据集D3以及衰亡期原始数据集D4;其中,单位时间段可以是几分钟,一个小时等;
将每个原始数据集中存储的各个环境参数值数据组与目标微生物群对应生长时期的环境参数标准范围表进行比对,例如,将迟缓期原始数据集中存储的其中一组环境参数值:温度、湿度、PH、COD、BOD、氨氮以及溶氧量分别与迟缓期对应环境参数标准范围进行比对,若该组环境参数值都在各自环境参数标准范围内,则将该环境参数数据组打上目标微生物群处于迟缓期的标签,若其中任何一个环境参数值不在对应环境参数标准范围内,则将该环境参数数据组打上目标微生物群不处于迟缓期的标签;根据上述方法依次对迟缓期原始数据集中所有环境参数数据组分析,并打上相应的标签;
类似的,对其他的原始数据集中环境数据组目标微生物群是否处于对应生长时期进行分析,并打上目标微生物群是否处于对应生长时期的标签;
若其中一个原始数据集所存储的所有环境参数数据组的参数值均不在该原始数据集所比对的对应生长时期的环境参数标准范围内,则将该原始数据集中的数据清除,否则保留;
不同生长时期的环境参数标准范围表是通过前期对目标微生物群进行实验以及通过后期计算获取;
需要说明的是,在初期将环境参数值与对应生长时期的环境参数标准范围表进行比对、并获取目标微生物群是否处于相应生长时期的结论具有偶然性,因为每一次检测获取的环境参数值可能存在不同,需要对每个原始数据集中的环境参数数据组进行进一步的分析,通过随机森林算法判断当前培养水体中目标微生物群的准确生长时期,从而方便后续管理;
需要说明的是,后期针对迟缓期原始数据集D1、对数期原始数据集D2、稳定期原始数据集D3以及衰亡期原始数据集D4所构建的随机森林,均是判断目标微生物群是否在对应生长时期,同一个随机森林不涉及其他生长时期,只针对目标微生物群处于对应生长时期或目标微生物群不处于对应生长时期进行判断;
步骤三:依次对各个原始数据集进行随机森林模型的构建,并输出相应的预测结果;包括以下过程:
步骤S1:对原始数据集Di进行有放回的随机采样,获取原始数据集Di的若干个训练样本数据集,其中i表示原始数据集的类型编号,i=1,2,3,4;
可选的,从原始数据集Di中有放回的随机抽取环境参数数据组作为样本数据,放入训练样本数据集Dij中,其中j表示属于相应原始数据集的训练样本数据集的编号,j=1,2……j;例如,第一次从迟缓期原始数据集D1中抽取一组环境参数数据组放入第一个训练样本数据集D11中作为第一个样本数据,并将该选中的样本数据放回至迟缓期原始数据集D1,方便下次再次抽取,重复上述操作n次,则第一个训练样本数据集D11包括n个样本数据,n个样本数据中可能重复,也可能不重复;然后重复上述操作,获取若干个属于迟缓期原始数据集的训练样本数据集;
步骤S2:对训练样本数据集Dij进行特征选择,进行对应决策树的划分;
可选的,对训练样本数据集Dij中的样本数据进行特征选择;
即按照温度、湿度、PH、COD、BOD、氨氮以及溶氧量这7类特征分别对训练样本数据集Dij中的样本数据进行特征选择;
需要说明的是,特征类型还可以是其他的参数,本实施例中暂且只描述7类;
其中每个特征均包含多个属性值,例如温度可以有16摄氏度、18摄氏度、25摄氏度等;在本实施例中,对每个特征的属性值进行区间划分,即参照对应生长时期的环境参数标准范围表进行比对,将属于对应环境参数标准范围的属性值标记为第一属性类,将小于对应环境参数标准范围的属性值标记为第二属性类,将大于对应环境参数标准范围的属性值标记为第三属性类;根据特征的属性类,将训练样本数据集Dij中的样本数据划分为不同的子集Dijq,其中q=1,2,3;每个子集Dijq包含NDijq个样本数据;
将训练样本数据集Dij所表征的目标微生物群是否处于对应生长时期的类别标记为Cijr,其中r=1,2;当r=1时,则表示目标微生物群处于对应生长时期,当r=2,则表示目标微生物群不处于对应生长时期;训练样本数据集Dij的Cijr类别包含NCijr个样本数据;
将子集Dijq中属于Cijr的样本数据的集合标记为Dijqr=Dijq∩Cijr;其中NDijqr表示属于Dijqr的样本数据的个数;
则计算获取A类特征的信息增益G(Dij,A),公式如下:
其中A=1,2……7;
用所有特征对训练样本数据集Dij进行划分,获得多个信息增益,并对信息增益按照从大到小的顺序排列,选取前70%的特征进行决策树的节点分裂和训练;舍弃后30%的特征,避免过度拟合训练数据;
步骤S3:重复步骤S2,将训练后的多个决策树组合成随机森林模型,并统计预测结果的数量;
可选的,对训练后的随机森林模型的多个决策树的不同输出结果进行汇总统计,该输出结果包括目标微生物群处于对应生长时期和目标微生物群不处于对应生长时期;将两种输出结果的数量进行比较,选择数量大的输出结果作为该随机森林模型的预测结果;
步骤四:分析各个随机森林模型的预测结果,确定当前目前微生物群的生长时期的最终预测结果以及获取在该生长时期下各个环境参数平均值;
可选的,通过步骤三获取分别通过迟缓期原始数据集D1、对数期原始数据集D2、稳定期原始数据集D3以及衰亡期原始数据集D4构建的随机森林模型获取对应预测结果的数量;
将各个预测结果的数量按照从小到大的顺序进行排列,选取其中数量最大的预测结果作为本次从云端数据库获取环境参数数据的最终预测结果;
针对该最终预测结果,获取对应随机森林模型中预测结果为目标微生物群处于对应生长时期的、处于对应环境参数标准范围的各个特征节点的环境参数属性值,并将相同特征的环境参数属性值进行平均计算,获取对应生长时期的各个环境参数平均值;
将获取的最终预测结果和对应生长时期的各个环境参数平均值上传至云端数据库进行存储;
步骤五:根据最终预测结果和各个环境参数平均值对培养水体的目标微生物群进行管理;
若最终预测结果表示当前目标微生物群处于迟缓期、对数期或衰亡期,则生成缩短生长周期的信号至管理后台;
若最终预测结果表示当前目标微生物群处于稳定期,则生成将目标微生物群放入目标河流污染水体的信号至管理后台;
可选的,将获取的对应生长时期的环境参数平均值存入管理后台,方便后续在获取更改相应环境参数值缩短生长周期的信号时,以其下一生长时期的环境参数平均值为标准来更改当前生长时期的各个环境参数值;从而使当前迟缓期、对数期或衰亡期尽快进入下一生长时期,缩短目标微生物群的生长周期,从而为目标河流污染水体加快了治理进度。
上述公式均是去除量纲取其数值计算,公式是由采集大量数据进行软件模拟得到最接近真实情况的一个公式,公式中的预设参数和预设阈值由本领域的技术人员根据实际情况设定或者大量数据模拟获得。
在本发明所提供的实施例中,应该理解到,所揭露的设备,装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述模块的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式;所述作为分离部件说明的模块可以是或者也可以不是物理上分开的,作为模块显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方法的目的。
以上实施例仅用以说明本发明的技术方法而非限制,尽管参照较佳实施例对本发明进行了详细说明,本领域的普通技术人员应当理解,可以对本发明的技术方法进行修改或等同替换,而不脱离本发明技术方法的精神和范围。

Claims (1)

1.一种用于水生态治理的微生物生长状况监测管理方法,其特征在于:
步骤一:采集包含目标微生物群的培养水体的环境参数值;
步骤二:对获取的环境参数值进行预处理,并根据目标微生物的生长周期构建不同生长时期的原始数据集;
对获取的环境参数值进行预处理包括:若对应时间点所获取的一组环境参数值中有缺失值或异常值,则使用上一个时间点所获取的对应特征类型的环境参数值进行补充;若对应时间点获取的一组环境参数值中有重复的环境参数值,则去除其中的异常值,并将剩下的重复环境参数值进行平均计算,将计算获取的平均值作为对应特征类型的环境参数值进行存储;
原始数据集的类型包括:迟缓期原始数据集D1、对数期原始数据集D2、稳定期原始数据集D3以及衰亡期原始数据集D4;
将每个原始数据集中存储的各个环境参数值数据组与目标微生物群对应生长时期的环境参数标准范围表进行比对,并将原始数据集中各个环境参数数据组打上目标微生物群是否处于对应生长时期的标签;
若其中一个原始数据集所存储的所有环境参数数据组的参数值均不在该原始数据集所比对的对应生长时期的环境参数标准范围内,则将该原始数据集中的数据清除,否则保留;
步骤三:依次对各个原始数据集进行随机森林模型的构建,并输出相应的预测结果;包括以下过程:
步骤S1:对原始数据集Di进行有放回的随机采样,获取原始数据集Di的若干个训练样本数据集,其中i表示原始数据集的类型编号,i=1,2,3,4;
步骤S2:对训练样本数据集Dij进行特征选择,进行对应决策树的划分;其中j表示属于相应原始数据集的训练样本数据集的编号,j=1,2……j;
按照温度、湿度、PH、COD、BOD、氨氮以及溶氧量7类特征分别对训练样本数据集Dij中的样本数据进行特征选择;
对每个特征的属性值进行区间划分,参照对应生长时期的环境参数标准范围表进行比对,将属于对应环境参数标准范围的属性值标记为第一属性类,将小于对应环境参数标准范围的属性值标记为第二属性类,将大于对应环境参数标准范围的属性值标记为第三属性类;根据特征的属性类,将训练样本数据集Dij中的样本数据划分为不同的子集Dijq,其中q=1,2,3;每个子集Dijq包含NDijq个样本数据;
将训练样本数据集Dij所表征的目标微生物群是否处于对应生长时期的类别标记为Cijr,其中r=1,2;当r=1时,则表示目标微生物群处于对应生长时期,当r=2,则表示目标微生物群不处于对应生长时期;训练样本数据集Dij的Cijr类别包含NCijr个样本数据;
将子集Dijq中属于Cijr的样本数据的集合标记为Dijqr=Dijq∩Cijr;其中NDijqr表示属于Dijqr的样本数据的个数;
则计算获取A类特征的信息增益G(Dij,A),公式如下:
其中A=1,2……7;
用所有特征对训练样本数据集Dij进行划分,获得多个信息增益,并对信息增益按照从大到小的顺序排列,选取前70%的特征进行决策树的节点分裂和训练;
步骤S3:重复步骤S2,将训练后的多个决策树组合成随机森林模型,并统计预测结果的数量;
对训练后的随机森林模型的多个决策树的不同输出结果进行汇总统计,该输出结果包括目标微生物群处于对应生长时期和目标微生物群不处于对应生长时期;将两种输出结果的数量进行比较,选择数量大的输出结果作为该随机森林模型的预测结果;
步骤四:分析各个随机森林模型的预测结果,确定当前目前微生物群的生长时期的最终预测结果以及获取在该生长时期下各个环境参数平均值;
通过步骤三获取分别通过迟缓期原始数据集D1、对数期原始数据集D2、稳定期原始数据集D3以及衰亡期原始数据集D4构建的随机森林模型获取对应预测结果的数量;
将各个预测结果的数量按照从小到大的顺序进行排列,选取其中数量最大的预测结果作为最终预测结果;
针对最终预测结果,获取对应随机森林模型中预测结果为目标微生物群处于对应生长时期的以及处于对应环境参数标准范围的各个特征节点的环境参数属性值,并将相同特征的环境参数属性值进行平均计算,进而获取对应生长时期的各个环境参数平均值;
步骤五:根据最终预测结果和各个环境参数平均值对培养水体的目标微生物群进行管理;
若最终预测结果表示当前目标微生物群处于迟缓期、对数期或衰亡期,则生成缩短生长周期的信号至管理后台;
若最终预测结果表示当前目标微生物群处于稳定期,则生成将目标微生物群放入目标河流污染水体的信号至管理后台;
将获取的对应生长时期的环境参数平均值存入管理后台;当管理后台获取更改相应环境参数值缩短生长周期的信号时,以其下一生长时期的各个环境参数平均值为标准来更改当前生长时期的环境参数值。
CN202310612492.9A 2023-05-29 2023-05-29 一种用于水生态治理的微生物生长状况监测管理方法 Active CN116542343B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310612492.9A CN116542343B (zh) 2023-05-29 2023-05-29 一种用于水生态治理的微生物生长状况监测管理方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310612492.9A CN116542343B (zh) 2023-05-29 2023-05-29 一种用于水生态治理的微生物生长状况监测管理方法

Publications (2)

Publication Number Publication Date
CN116542343A CN116542343A (zh) 2023-08-04
CN116542343B true CN116542343B (zh) 2023-11-10

Family

ID=87445235

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310612492.9A Active CN116542343B (zh) 2023-05-29 2023-05-29 一种用于水生态治理的微生物生长状况监测管理方法

Country Status (1)

Country Link
CN (1) CN116542343B (zh)

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106991437A (zh) * 2017-03-20 2017-07-28 浙江工商大学 基于随机森林预测污水水质数据的方法及系统
CN109256176A (zh) * 2018-10-28 2019-01-22 浙江师范大学 基于代谢产物测量的微生物生长过程评估模型
AU2018328254A1 (en) * 2017-09-08 2020-04-30 9337-4791 Quebec, Inc. System and method for controlling a growth environment of a crop
CN111689587A (zh) * 2020-07-24 2020-09-22 科盛环保科技股份有限公司 一种微生物集成生态修复对河道治理的方法及其应用
AU2020102540A4 (en) * 2020-09-30 2020-11-19 Beijing baijialun Environmental Protection Technology Co., Ltd Method, product and application for degrading sludge heavy metals by extreme microorganisms
WO2021243009A1 (en) * 2020-05-29 2021-12-02 Can Technologies, Inc. Microbiome analytics such as for animal nutrition management

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106991437A (zh) * 2017-03-20 2017-07-28 浙江工商大学 基于随机森林预测污水水质数据的方法及系统
AU2018328254A1 (en) * 2017-09-08 2020-04-30 9337-4791 Quebec, Inc. System and method for controlling a growth environment of a crop
CN109256176A (zh) * 2018-10-28 2019-01-22 浙江师范大学 基于代谢产物测量的微生物生长过程评估模型
WO2021243009A1 (en) * 2020-05-29 2021-12-02 Can Technologies, Inc. Microbiome analytics such as for animal nutrition management
CN111689587A (zh) * 2020-07-24 2020-09-22 科盛环保科技股份有限公司 一种微生物集成生态修复对河道治理的方法及其应用
AU2020102540A4 (en) * 2020-09-30 2020-11-19 Beijing baijialun Environmental Protection Technology Co., Ltd Method, product and application for degrading sludge heavy metals by extreme microorganisms

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
"基于拉曼技术的单细胞生长检测方法";李新立;《生物化学与生物物理进展》;第1-9页 *
"水生态修复技术在河道治理中的应用探讨";孙旭;《水电水利》;第1-2页 *

Also Published As

Publication number Publication date
CN116542343A (zh) 2023-08-04

Similar Documents

Publication Publication Date Title
Fdez-Riverola et al. CBR based system for forecasting red tides
CN113658640B (zh) 一种淡水生态系统健康评价方法
CN116842350B (zh) 一种污染场地植物修复的分析方法、系统及介质
CN111680820A (zh) 分布式光伏电站故障诊断方法和装置
CN114511157B (zh) 一种基于蔬菜青枯病防治的微生态调控方法及系统
CN118071177B (zh) 一种污水处理模拟调控方法和系统
CN109711590B (zh) 渔业水质分析监测方法、装置和系统
CN117164103B (zh) 生活污水处理系统的智能控制方法、终端及系统
CN117408430A (zh) 一种基于大数据的农业种植用土壤改良评估系统
CN115795367A (zh) 基于机器学习的藻华爆发预测方法及应用
Ellina et al. Research of fuzzy implications via fuzzy linear regression in data analysis for a fuzzy model
CN116542343B (zh) 一种用于水生态治理的微生物生长状况监测管理方法
Zuxing et al. A Prediction Model of Forest Preliminary Precision Fertilization Based on Improved GRA‐PSO‐BP Neural Network
CN117314024B (zh) 一种智慧农业病虫害云平台
CN114239387A (zh) 一种有机生化反应菌种投放指导方法及系统
CN115064218B (zh) 一种构建病原微生物数据鉴定平台的方法及装置
Sorayya et al. A self organizing map (SOM) guided rule based system for freshwater tropical algal analysis and prediction
CN116451870A (zh) 基于多模型的水生态系统健康评价与预测系统
CN116523174A (zh) 基于自组织神经网络的污水处理厂工况评估方法及系统
CN115016413A (zh) 一种用于植物工厂作物种植的智能环境控制方法
CN117171597B (zh) 一种基于微生物的污染场地分析方法、系统及介质
Pulido et al. Asymmetry in marginal population performance foreshadows widespread species range shifts
Liu et al. Study on Ecological Environmental Impact Assessment of Saihanba Afforestation Project Based on Grey Target Model
CN118094268B (zh) 一种面向食品安全监管的数据处理方法
CN116579508B (zh) 一种鱼类预测方法、装置、设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant