CN115007634B - 一种基于机器学习的修复有机污染土壤的方法 - Google Patents

一种基于机器学习的修复有机污染土壤的方法 Download PDF

Info

Publication number
CN115007634B
CN115007634B CN202210713071.0A CN202210713071A CN115007634B CN 115007634 B CN115007634 B CN 115007634B CN 202210713071 A CN202210713071 A CN 202210713071A CN 115007634 B CN115007634 B CN 115007634B
Authority
CN
China
Prior art keywords
soil
benzopyrene
optimal
regression
contaminated soil
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202210713071.0A
Other languages
English (en)
Other versions
CN115007634A (zh
Inventor
陈斌
朱利中
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhejiang University ZJU
Original Assignee
Zhejiang University ZJU
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhejiang University ZJU filed Critical Zhejiang University ZJU
Priority to CN202210713071.0A priority Critical patent/CN115007634B/zh
Publication of CN115007634A publication Critical patent/CN115007634A/zh
Application granted granted Critical
Publication of CN115007634B publication Critical patent/CN115007634B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • BPERFORMING OPERATIONS; TRANSPORTING
    • B09DISPOSAL OF SOLID WASTE; RECLAMATION OF CONTAMINATED SOIL
    • B09CRECLAMATION OF CONTAMINATED SOIL
    • B09C1/00Reclamation of contaminated soil
    • B09C1/08Reclamation of contaminated soil chemically
    • B09C1/085Reclamation of contaminated soil chemically electrochemically, e.g. by electrokinetics

Landscapes

  • Chemical & Material Sciences (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Soil Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Environmental & Geological Engineering (AREA)
  • Processing Of Solid Wastes (AREA)

Abstract

本发明公开了一种机器学习调控化学氧化耦合微生物修复有机污染土壤的方法,所述方法先用化学氧化预处理有机污染土壤,再利用土著微生物进一步修复有机污染土壤;再结合有机污染土壤类型(LC\S)、氧化剂类型(PP\PS\FR\HO)、氧化剂浓度(C)、修复时间(T)、氧化还原电位(Eh)、总有机碳含量(TOC)、土壤酸碱度(pH)和苯并芘去除率(BaP%)开展人工智能机器学习的训练、十折交叉验证和XGBoost模型构建;评估并验证最优的XGBoost模型;最终通过最优的XGBoost模型协同Eh调控化学氧化耦合微生物修复有机污染土壤。本发明方法实现了过程可控制、结果可预测且绿色、经济和高效的机器学习调控化学氧化耦合微生物修复有机污染土壤目标,适用于大规模使用。

Description

一种基于机器学习的修复有机污染土壤的方法
技术领域
本发明主要涉及有机污染土壤耦合修复技术领域,尤其涉及一种基于机器学习的调控化学氧化耦合微生物修复有机污染土壤的方法。
背景技术
城市化进程及产业调整遗留大量有机污染场地土壤,有机污染物会破坏生态环境并增加人类健康风险,有机污染场地土壤再开发利用前亟需一种绿色、经济和高效的修复技术。常见的有机污染土壤修复技术有气相抽提、热脱附、化学淋洗、化学氧化还原和微生物修复等。气相抽提与热脱附需要整套大型设备且不能真正去除有机物;化学淋洗液易产生二次污染(Kuppusamy S,Thavamani P,Venkateswarlu K,et al.Remediationapproaches for polycyclic aromatic hydrocarbons(PAHs)contaminated soils:Technological constraints,emerging trends and future directions[J].Chemosphere.2017,168:944-968.)。化学氧化耦合微生物修复技术集成修复周期短、治理方案灵活、可去除难降解有机物与修复成本低、环境友好的技术优点。有机物(如BaP)的检测大都采用传统实验室技术,需贵重设备、繁杂前处理和大量时间。XGBoost是基于梯度提升技术实现人工智能机器学习算法(Peterson J C,Bourgin D D,Agrawal M,et al.Usinglarge-scale experiments and machine learning to discover theories of humandecision-making[J].Science.2021,372(6547):1209-1214),具有更强学习器的分类与回归树集成模型,相比传统模型具有更快速、稳定和精准的数据拟合能力。
发明内容
鉴于此,本发明提出了一种基于机器学习的调控化学氧化耦合微生物修复有机污染土壤的方法。
为实现上述技术目的,本发明的技术方案为:本发明实施例提出了一种基于机器学习的修复有机污染土壤的方法,所述方法具体为:先化学氧化预处理有机污染土壤,再利用土著微生物进一步修复有机污染土壤;采集修复有机污染土壤过程中的有机污染土壤类型、氧化剂类型、氧化剂浓度、修复时间、氧化还原电位、总有机碳含量、土壤酸碱度和苯并芘去除率数据;利用十折交叉验证构建XGBoost模型,并进行训练,得到最优的XGBoost模型,通过最优的XGBoost模型协同Eh调控化学氧化耦合微生物修复有机污染土壤。
进一步地,所述有机污染土壤类型包括苯并芘有机污染壤质粘土和苯并芘有机污染壤质砂土。
进一步地,所述化学氧化预处理有机污染土壤通过高锰酸钾、硫酸亚铁与过硫酸钠、芬顿试剂或双氧水预处理有机污染土壤。
进一步地,通过高锰酸钾预处理有机污染土壤的过程具体为;根据修复的土壤质量,按土水比1kg:1L加入浓度为1.96~15.8g/L高锰酸钾溶液;
通过硫酸亚铁与过硫酸钠预处理有机污染土壤的过程具体为;根据修复的土壤质量,按土水比2kg:1L加入浓度为16.72-133.44g/L七水硫酸亚铁活化剂溶液,再按土水比2kg:1L加入浓度为1.20-9.52g/L过硫酸钠溶液,且保持硫酸亚铁与化学氧化物质量的之比是9.6:1;
通过芬顿试剂预处理有机污染土壤的过程具体为;根据修复的土壤质量,按土水比1kg:1L加入浓度为1.40-11.12g/L七水硫酸亚铁活化剂溶液,再每1000g土中加0.70-5.70mL的质量百分比为30%的过氧化氢溶液;
通过双氧水处理有机污染土壤的过程具体为;根据修复的土壤质量,按每1000g土中加0.70-5.70mL的质量百分比为30%的过氧化氢溶液。
进一步地,采集修复有机污染土壤过程中的有机污染土壤类型、氧化剂类型、氧化剂浓度、修复时间、氧化还原电位、总有机碳含量、土壤酸碱度和苯并芘去除率数据;具体为:
每5-7天翻动预处理后的有机污染土壤,持续修复40天;
每0、1、2、3、4、5、6、7、10、15、20、25、30、35、40天检测土壤的苯并芘浓度、氧化还原电位、总有机碳含量、土壤酸碱度;
将苯并芘去除率作为因变量,将土壤类型、氧化剂类型、氧化剂浓度、时间、氧化还原电位、总有机碳含量和土壤酸碱度作为自变量;再将采集的因变量和自变量进行Z-Score归一化处理。
进一步地,在每5-7天翻动预处理后的有机污染土壤,持续修复40天的过程中,保持有机污染土壤的湿度为70%~75%,控制土壤修复室内温度20~25℃。
进一步地,利用十折交叉验证构建XGBoost模型,并进行训练的过程具体为:建立树的模型、寻找最优分裂点构建得到XGBoost模型,采用十折交叉验证基于训练集训练XGBoost模型,并计算目标函数MSE,采用目标函数MSE对XGBoost模型进行误差评定拟合学习计算,利用决定系数R2和均方根误差RMSE对最优XGBoost模型进行精准度评价;若目标函数MSE的误差评定不是最优的,则继续开展十折交叉验证,直到MSE的误差评定为最优精度,进而训练得到最优的XGBoost模型,并保存最优的XGBoost模型的模型参数。
进一步地,建立树的模型、寻找最优分裂点构建得到XGBoost模型的过程具体包括以下步骤:
建立树的模型具体为:利用XGBoost算法生成回归树的集合F为:
Figure BDA0003707640940000031
其中,q为一棵回归树结构的确定法则,即将m维的特征向量xi映射到T个叶子节点的数值,而T个叶子节点数值的权重由T维向量ω指定;f(x)表示某一棵回归树的映射关系,即由特征向量x映射至目标值f(x),Wq(x)为一棵回归树的结构由法则q确定,并将特征向量x映射至目标值Wq(x);
利用树集成的思想将K棵回归树的结果进行求和,作为最终的预测值,数据集合表示为:
Figure BDA0003707640940000032
其中,数据集合D中样本条目数为n,xi为m维的特征向量,yi为第i个特征向量xi对应的苯并芘去除率,且1≤i≤n;
一条数据样本的回归值由K棵回归树的计算结果的和确定,公式如下:
Figure BDA0003707640940000033
其中,表示第i个预测苯并芘去除率值,表示映射特征向量xi得到的预测值,fk(xi)表示第k棵回归树对特征向量xi进行映射得到的回归数值,fk表示第k棵回归树的映射关系;
通过XGBoost算法对比使用土壤类型、氧化剂类型、氧化剂浓度、时间、氧化还原电位、TOC和pH在内的不同特征变量的预测苯并芘去除率值与实际值的误差,并根据误差的大小判断不同的特征变量与苯并芘去除率之间的相关程度,获得不同特征变量与苯并芘去除率之间的相关性数值;
训练初始XGBoost模型生成回归树集合时,使用带正则项的目标函数,公式如下:
Figure BDA0003707640940000034
Figure BDA0003707640940000035
其中,L(ф)为目标函数,
Figure BDA0003707640940000036
是损失函数,
Figure BDA0003707640940000037
为初始XGBoost回归模型对训练集中第i个特征向量xi进行预测得到的预测苯并芘去除率值,yi为数据样本对应的真实目标值;Ω(f)是正则惩罚项,通过调节系数γ和λ的大小控制生成的K棵回归树的复杂度;fk表示第k棵回归树的映射关系,T表示每棵回归树叶子节点的数量,而||ω||2表示T个叶子节点权重的L2范数,即叶子节点的权重向量ω的欧式距离,如下式所示:
Figure BDA0003707640940000041
其中,权重向量ω有n个维度,ωi为权重向量ω的第i个维度的取值。
寻找最优分裂点,即基于网格搜索方式设置搜索网格找到最优的回归树数目和树的最大深度,构建得到XGBoost模型的过程具体为:
设置搜索网格为:
生成回归树数目:[1,2,3,...,j-1,j],
回归树最大深度:[1,2,3,...,k-1,k];
其中,最大生成回归树数目为j,最大的回归树深度为k;遍历所有生成回归树数目和回归树最大深度的参数组合,依次选用每一种参数组合,计算在训练集上的苯并芘去除率值,当计算所得的苯并芘去除率值与真实苯并芘去除率值之间的误差最小时,对应的参数组合即为最优解,即获得最优的回归树数目和树的最大深度,即找到最优分裂点,完成了XGBoost模型的构建。
进一步地,所述方法还包括验证评估最优XGBoost模型,具体为:将测试数据代入最优的XGBoost模型进行验证和评定模型精度,并评估未参与建模数据的预测精度。
本发明的有益效果是:本发明利用人工智能协同氧化还原电位(Eh)精准调控化学氧化耦合土著微生物修复苯并芘污染土壤的过程,并对此修复过程进行建模且模型预测拟合度R2=0.815,RMSE是2.288%。本发明方法利用模型拟合Eh原位、精准调控土壤修复过程的总有机碳含量(TOC)、pH,并利用Eh原位精准预测有机物的剩余量;也可按照预期的BaP%进行修复调控,省去了繁琐的有机物分析前处理与昂贵的仪器设备、避免产生更多的副产物和缩短了检测周期等,实现了过程可控制、结果可预测且绿色、经济和高效的化学氧化耦合微生物修复有机污染土壤目标,适用于大规模使用。本发明方法通过XBGoost协同Eh精准调控,能获得更加好的稳定性和预测效果。
附图说明
图1为XGBoost协同Eh调控化学氧化耦合微生物修复有机污染土壤工艺流程图;
图2为XGBoost调控化学氧化耦合微生物修复有机污染土壤的特征重要性图;
图3为化学氧化耦合微生物修复有机污染土壤的TOC图;
图4为化学氧化耦合微生物修复有机污染土壤的pH图;
图5为化学氧化耦合微生物修复有机污染土壤的Eh图;
图6为化学氧化耦合微生物修复有机污染土壤的BaP%图。
具体实施方式
下面结合附图对本发明的较佳实施案例进行详细阐述,以使本发明的优点和特征能更易于被本领域技术人员理解,从而对本发明的保护范围作出更清楚明确的界定。
如图1所示,本发明提供了一种调控化学氧化耦合微生物修复有机污染土壤的方法,所述方法具体为:先经化学氧化预处理有机污染土壤,再利用土著微生物进一步修复有机污染土壤;采集修复有机污染土壤过程中包括有机污染土壤类型(LC\S)、氧化剂类型(PP\PS\FR\HO)、氧化剂浓度(C)、修复时间(T)、氧化还原电位(Eh)、总有机碳含量(TOC)、土壤酸碱度(pH)和苯并芘去除率(BaP%)在内的数据,将采集的数据划分为训练和测试集;基于训练集利用十折交叉验证构建XGBoost模型,并进行训练;基于测试集评估并验证最优的XGBoost模型(本发明实施例中,决定系数R2是0.815,均方根误差RMSE是2.288%),并评估未参与建模数据的预测精度;最终通过最优的XGBoost模型协同Eh调控化学氧化耦合微生物修复有机污染土壤。
所述有机污染土壤类型(LC\S)包括苯并芘有机污染壤质粘土(LC)和苯并芘有机污染壤质砂土(S)。苯并芘是多环芳烃的典型污染物,而且多环芳烃、多氯联苯、石油烃中的化合物也能适用本发明提出的基于机器学习的修复有机物污染土壤的方法。
进一步地,所述化学氧化预处理有机污染土壤包括通过高锰酸钾(PP)、硫酸亚铁与过硫酸钠(PS)、芬顿试剂(FR)或双氧水(HO)预处理有机污染土壤。
其中,通过高锰酸钾(PP)预处理有机污染土壤的过程具体为;根据修复的土壤质量,按土水比1:1(kg/L)加入浓度为1.96~15.8g/L高锰酸钾溶液。
通过硫酸亚铁与过硫酸钠(PS)预处理有机污染土壤的过程具体为;根据修复的土壤质量,按土水比2:1(kg/L)加入浓度为16.72-133.44g/L七水硫酸亚铁活化剂溶液,再按土水比2:1(kg/L)加入浓度为1.20-9.52g/L过硫酸钠溶液,且保持硫酸亚铁与化学氧化物质量的之比是9.6:1。
通过芬顿试剂(FR)预处理有机污染土壤的过程具体为;根据修复的土壤质量,按土水比1:1(kg/L)加入浓度为1.40-11.12g/L七水硫酸亚铁活化剂溶液,再每1000g土中加0.70-5.70mL的质量百分比为30%的过氧化氢溶液。
通过双氧水(HO)处理有机污染土壤的过程具体为;根据修复的土壤质量,按每1000g土中加0.70-5.70mL的质量百分比为30%的过氧化氢溶液。
结合有机污染土壤类型、氧化剂类型、氧化剂浓度、修复时间、氧化还原电位、总有机碳含量、土壤酸碱度和苯并芘去除率构建XGBoost模型还包括采集训练集和测试集;具体为:
每5-7天翻动预处理后的有机污染土壤,持续修复40天;保持有机污染土壤的湿度为70%~75%,控制土壤修复室内温度20~25℃。
每0、1、2、3、4、5、6、7、10、15、20、25、30、35、40天检测土壤的苯并芘浓度、氧化还原电位、总有机碳含量、土壤酸碱度。
将苯并芘去除率作为因变量,将土壤类型、氧化剂类型、氧化剂浓度梯度、时间、氧化还原电位、总有机碳含量和土壤酸碱度作为自变量;再将采集的因变量和自变量进行Z-Score归一化处理,并划分训练集和测试集。本发明实施例中选取所有数据中的80%作为训练集进行模型训练,剩余20%作为测试集进行模型的精度评价。
进一步地,利用十折交叉验证构建XGBoost模型,并进行训练的过程具体为:利用十折交叉验证构建XGBoost模型,并进行训练的过程具体为:建立树的模型、寻找最优分裂点构建得到XGBoost模型,采用十折交叉验证基于训练集训练XGBoost模型,并计算目标函数MSE,采用目标函数MSE对XGBoost模型进行误差评定拟合学习计算,利用决定系数R2和均方根误差RMSE对最优XGBoost模型进行精准度评价;若目标函数MSE的误差评定不是最优的,则继续开展十折交叉验证,直到MSE的误差评定为最优精度,进而训练得到最优的XGBoost模型,并保存最优的XGBoost模型的模型参数。
建立树的模型、寻找最优分裂点构建得到XGBoost模型的过程具体包括以下子步骤:
建立树的模型具体为:利用XGBoost算法生成回归树的集合F为:
Figure BDA0003707640940000061
其中,q为一棵回归树结构的确定法则,即将m维的特征向量xi映射到T个叶子节点的数值,而T个叶子节点数值的权重由T维向量ω指定;f(x)表示某一棵回归树的映射关系,即由特征向量x映射至目标值f(x),Wq(x)为一棵回归树的结构由法则q确定,并将特征向量x映射至目标值Wq(x);
利用树集成的思想将K棵回归树的结果进行求和,作为最终的预测值,数据集合表示为:
Figure BDA0003707640940000062
其中,数据集合D中样本条目数为n,xi为m维的特征向量,yi为第i个特征向量xi对应的苯并芘去除率,且1≤i≤n;
一条数据样本的回归值由K棵回归树的计算结果的和确定,公式如下:
Figure BDA0003707640940000063
其中,表示第i个预测苯并芘去除率值,表示映射特征向量xi得到的预测值,fk(xi)表示第k棵回归树对特征向量xi进行映射得到的回归数值,fk表示第k棵回归树的映射关系;
通过XGBoost算法对比使用土壤类型、氧化剂类型、氧化剂浓度、时间、氧化还原电位、TOC和pH在内的不同特征变量的预测苯并芘去除率值与实际值的误差,并根据误差的大小判断不同的特征变量与苯并芘去除率之间的相关程度,获得不同特征变量与苯并芘去除率之间的相关性数值;
训练初始XGBoost模型生成回归树集合时,使用带正则项的目标函数,公式如下:
Figure BDA0003707640940000071
Figure BDA0003707640940000072
其中,L(ф)为目标函数,
Figure BDA0003707640940000073
是损失函数,
Figure BDA0003707640940000074
为初始XGBoost回归模型对训练集中第i个特征向量xi进行预测得到的预测苯并芘去除率值,yi为数据样本对应的真实目标值;Ω(f)是正则惩罚项,通过调节系数γ和λ的大小控制生成的K棵回归树的复杂度;fk表示第k棵回归树的映射关系,T表示每棵回归树叶子节点的数量,而||ω||2表示T个叶子节点权重的L2范数,即叶子节点的权重向量ω的欧式距离,如下式所示:
Figure BDA0003707640940000075
其中,权重向量ω有n个维度,ωi为权重向量ω的第i个维度的取值。
寻找最优分裂点,即基于网格搜索方式设置搜索网格找到最优的回归树数目和树的最大深度,构建得到XGBoost模型的过程具体为:
设置搜索网格为:
生成回归树数目:[1,2,3,...,j-1,j],
回归树最大深度:[1,2,3,...,k-1,k];
其中,最大生成回归树数目为j,最大的回归树深度为k;遍历所有生成回归树数目和回归树最大深度的参数组合,依次选用每一种参数组合,计算在训练集上的苯并芘去除率值,当计算所得的苯并芘去除率值与真实苯并芘去除率值之间的误差最小时,对应的参数组合即为最优解,即获得最优的回归树数目和树的最大深度,即找到最优分裂点,完成了XGBoost模型的构建。以下所有实施例中所用的污染土壤均为人工污染土壤。图2为XGBoost调控化学氧化耦合微生物修复有机污染土壤的特征重要性图。苯并芘有机污染壤质粘土(LC)和砂土(S)制备如下:
取阴暗通风、自然风干、研磨并过100目筛子的干净壤质粘土(LC)和砂土(S),放置在遮光容器中,缓慢加入含有45mg BaP的丙酮溶液。待丙酮挥发后用搅拌机混匀污染土壤,并每7天用搅拌机混匀土壤,遮光老化180天。将污染后的土壤再次过100目不锈钢筛以获得均匀的污染土壤样品,最终得到LC和S的污染土壤各15kg。老化后LC、S土壤的BaP浓度分别是2.25mg/kg、2.17mg/kg。
实施例1
250g的LC污染土壤放于500mL烧杯中,加入250mL无菌水配置浓度是1.96g/L的高锰酸钾溶液,无菌玻璃棒快速搅拌混匀,无菌封口膜密封,再将样品避光放置在温度为25℃、转速150转/min的恒温摇床混匀2h。将土壤样品避光放置在恒温恒湿培养箱中,控制温度为25℃、湿度为70%、土壤含水率20-30%。每隔12小时用无菌玻璃棒搅动土壤样本使土壤与上层液体混匀。恒温恒湿避光修复40天。每0、1、2、3、4、5、6、7、10、15、20、25、30、35、40天检测土壤的苯并芘浓度(BaP)、氧化还原电位(Eh)、有机质含量(TOC)、土壤酸碱度(pH)(如图3A、图4A、图5A和图6A所示)。
获得本实验的因变量(BaP%)和自变量(Eh、TOC、pH、氧化剂类型(PP)、氧化剂浓度(PP12.5)、土壤类型(LC)、时间(T))指标数据;将此次获取的数据与其他处理(不同土壤类型、氧化剂类型和氧化剂浓度)产生的数据合并,合并汇总的数据分成训练集(80%数据)和测试集(20%数据),利用十折交叉验证进行模型构建。利用Python程序包XGBoost以model文件的形式保存最优XGBoost协同Eh调控化学氧化氧化耦合微生物修复有机污染土壤模型。
实施例2
250g的S污染土壤放于500mL烧杯中,依次加入125mL无菌水配置浓度是66.72g/L的七水硫酸亚铁溶液和125mL无菌水配置浓度是4.80g/L的过硫酸钠溶液,无菌玻璃棒快速搅拌混匀,无菌封口膜密封,再将样品避光放置在温度为25℃、转速150转/min的恒温摇床混匀2h。将土壤样品避光放置在恒温恒湿培养箱中,控制温度为25℃、湿度为70%、土壤含水率20-30%。每隔12小时用无菌玻璃棒搅动土壤样本使土壤与上层液体混匀。恒温恒湿避光修复40天。每0、1、2、3、4、5、6、7、10、15、20、25、30、35、40天检测土壤的苯并芘浓度(BaP)、氧化还原电位(Eh)、有机质含量(TOC)、土壤酸碱度(pH)(如图3B、图4B、图5B和图6B所示)。
获得本实验的因变量(BaP%)和自变量(Eh、TOC、pH、氧化剂类型(PS)、氧化剂浓度(PS10)、土壤类型(LC)、时间(T))指标数据;将此次获取的数据与其他处理产生的数据合并,合并汇总的数据分成训练集(80%数据)和测试集(20%数据),利用十折交叉验证进行模型构建。利用Python程序包XGBoost以model文件的形式保存最优XGBoost协同Eh调控化学氧化氧化耦合微生物修复有机污染土壤模型。
实施例3
250g的LC污染土壤放于500mL烧杯中,依次加入125mL无菌水配置浓度是2.80g/L的七水硫酸亚铁溶液,待硫酸亚铁溶液渗透土壤后再加1.40mL 30%质量百分比的过氧化氢溶液,无菌玻璃棒快速搅拌混匀,无菌封口膜密封,再将样品避光放置在温度为25℃、转速150转/min的恒温摇床混匀2h。将土壤样品避光放置在恒温恒湿培养箱中,控制温度为25℃、湿度为70%、土壤含水率20-30%。每隔12小时用无菌玻璃棒搅动土壤样本使土壤与上层液体混匀。恒温恒湿避光修复40天。每0、1、2、3、4、5、6、7、10、15、20、25、30、35、40天检测土壤的苯并芘浓度(BaP)、氧化还原电位(Eh)、有机质含量(TOC)、土壤酸碱度(pH);(如图3A、图4A、图5A和图6A所示)。
获得本实验的因变量(BaP%)和自变量(Eh、TOC、pH、氧化剂类型(FR)、氧化剂浓度(FR50)、土壤类型(LC)、时间(T))指标数据;将此次获取的数据与其他处理产生的数据合并,合并汇总的数据分成训练集(80%数据)和测试集(20%数据),利用十折交叉验证进行模型构建。利用Python程序包XGBoost以model文件的形式保存最优XGBoost协同Eh调控化学氧化氧化耦合微生物修复有机污染土壤模型。
实施例4
250g的LC污染土壤放于500mL烧杯中,加入2.80mL 30%质量百分比的过氧化氢溶液,无菌玻璃棒快速搅拌混匀,无菌封口膜密封,再将样品避光放置在温度为25℃、转速150转/min的恒温摇床混匀2h。将土壤样品避光放置在恒温恒湿培养箱中,控制温度为25℃、湿度为70%、土壤含水率20-30%。每隔12小时用无菌玻璃棒搅动土壤样本使土壤与上层液体混匀。恒温恒湿避光修复,每0、1、2、3、4、5、6、7、10、15、20、25、30、35、40天检测土壤的苯并芘浓度(BaP)、氧化还原电位(Eh)、有机质含量(TOC)、土壤酸碱度(pH);(如图3A、图4A、图5A和图6A所示)。
利用Python程序包XGBoost以model文件的形式保存最优XGBoost协同Eh调控化学氧化氧化耦合微生物修复有机污染土壤的模型,输入过程控制想要获得的BaP%为56.7%,输出对应Eh为541.2mV。在定期监测Eh数据时,当Eh在541.0mV时,即T为25d且取样分析检测TOC、pH指标,将Eh为541、TOC为0.218%、pH为4.93、T为25d、土壤类型为LC、氧化剂类型为HO、氧化剂浓度为HO100输入模型中,得到模型预测BaP%为47.1%(准确率是83.1%),从而实现基于Eh对过程可控制的目的。
实施例5
250g的LC污染土壤放于500mL烧杯中,依次加入125mL无菌水配置浓度是66.72g/L的七水硫酸亚铁溶液和125mL无菌水配置浓度是4.80g/L的过硫酸钠溶液,无菌玻璃棒快速搅拌混匀,无菌封口膜密封,再将样品避光放置在温度为25℃、转速150转/min的恒温摇床混匀2h。将土壤样品避光放置在恒温恒湿培养箱中,控制温度为25℃、湿度为70%、土壤含水率20-30%。每隔12小时用无菌玻璃棒搅动土壤样本使土壤与上层液体混匀。恒温恒湿避光修复30天。第30天时检测土壤的苯并芘浓度、氧化还原电位(Eh)、有机质含量(TOC)、土壤酸碱度(pH)(如图3A、图4A、图5A和图6A所示)。
将自变量Eh为633.0mV、TOC为0.085%、pH为3.96、氧化剂类型为PS、氧化剂浓度为PS10、土壤类型为LC、时间T为30d,代入Python程序包XGBoost以model文件形式保存最优XGBoost协同Eh调控化学氧化氧化耦合微生物修复有机污染土壤的模型中,得到预测BaP%为72.2%,对比预测BaP%与实测BaP%(88.2%),模型准确率是81.9%,从而实现基于模型对结果可预测的目的。
以上所述仅为本发明的较佳实例,本发明包含并不限于较佳实例,凡在本发明的精神和原则之内,所做的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。

Claims (7)

1.一种基于机器学习的修复有机污染土壤的方法,其特征在于,所述方法具体为:先化学氧化预处理有机污染土壤,再利用土著微生物进一步修复有机污染土壤;采集修复有机污染土壤过程中的有机污染土壤类型、氧化剂类型、氧化剂浓度、修复时间、氧化还原电位、总有机碳含量、土壤酸碱度和苯并芘去除率数据;利用十折交叉验证构建XGBoost模型,并进行训练,得到最优的XGBoost模型,通过最优的XGBoost模型协同Eh调控化学氧化耦合微生物修复有机污染土壤;
利用十折交叉验证构建XGBoost模型,并进行训练的过程具体为:建立树的模型、寻找最优分裂点构建得到XGBoost模型,采用十折交叉验证基于训练集训练XGBoost模型,并计算目标函数MSE,采用目标函数MSE对XGBoost模型进行误差评定拟合学习计算,利用决定系数R2和均方根误差RMSE对最优XGBoost模型进行精准度评价;若目标函数MSE的误差评定不是最优的,则继续开展十折交叉验证,直到MSE的误差评定为最优精度,进而训练得到最优的XGBoost模型,并保存最优的XGBoost模型的模型参数;
建立树的模型、寻找最优分裂点构建得到XGBoost模型的过程具体包括以下步骤:
建立树的模型具体为:利用XGBoost算法生成回归树的集合F为:
Figure FDA0003906249730000011
其中,q为一棵回归树结构的确定法则,即将m维的特征向量xi映射到T个叶子节点的数值,而T个叶子节点数值的权重由T维向量ω指定;f(x)表示某一棵回归树的映射关系,即由特征向量x映射至目标值f(x),Wq(x)为一棵回归树的结构由法则q确定,并将特征向量x映射至目标值Wq(x);
利用树集成的思想将K棵回归树的结果进行求和,作为最终的预测值,数据集合表示为:
Figure FDA0003906249730000012
其中,数据集合D中样本条目数为n,xi为m维的特征向量,yi为第i个特征向量xi对应的苯并芘去除率,且1≤i≤n;
一条数据样本的回归值由K棵回归树的计算结果的和确定,公式如下:
Figure FDA0003906249730000013
其中,表示第i个预测苯并芘去除率值,表示映射特征向量xi得到的预测值,fk(xi)表示第k棵回归树对特征向量xi进行映射得到的回归数值,fk表示第k棵回归树的映射关系;
通过XGBoost算法对比使用土壤类型、氧化剂类型、氧化剂浓度、时间、氧化还原电位、TOC和pH在内的不同特征变量的预测苯并芘去除率值与实际值的误差,并根据误差的大小判断不同的特征变量与苯并芘去除率之间的相关程度,获得不同特征变量与苯并芘去除率之间的相关性数值;
训练初始XGBoost模型生成回归树集合时,使用带正则项的目标函数,公式如下:
Figure FDA0003906249730000021
Figure FDA0003906249730000022
其中,L(ф)为目标函数,
Figure FDA0003906249730000023
是损失函数,
Figure FDA0003906249730000024
为初始XGBoost回归模型对训练集中第i个特征向量xi进行预测得到的预测苯并芘去除率值,yi为数据样本对应的真实目标值;Ω(f)是正则惩罚项,通过调节系数γ和λ的大小控制生成的K棵回归树的复杂度;fk表示第k棵回归树的映射关系,T表示每棵回归树叶子节点的数量,而||ω||2表示T个叶子节点权重的L2范数,即叶子节点的权重向量ω的欧式距离,如下式所示:
Figure FDA0003906249730000025
其中,权重向量ω有n个维度,ωi为权重向量ω的第i个维度的取值;
寻找最优分裂点,即基于网格搜索方式设置搜索网格找到最优的回归树数目和树的最大深度,构建得到XGBoost模型的过程具体为:
设置搜索网格为:
生成回归树数目:[1,2,3,...,j-1,j],
回归树最大深度:[1,2,3,...,k-1,k];
其中,最大生成回归树数目为j,最大的回归树深度为k;遍历所有生成回归树数目和回归树最大深度的参数组合,依次选用每一种参数组合,计算在训练集上的苯并芘去除率值,当计算所得的苯并芘去除率值与真实苯并芘去除率值之间的误差最小时,对应的参数组合即为最优解,即获得最优的回归树数目和树的最大深度,即找到最优分裂点,完成了XGBoost模型的构建。
2.根据权利要求1所述的基于机器学习的修复有机污染土壤的方法,其特征在于,所述有机污染土壤类型包括苯并芘有机污染壤质粘土和苯并芘有机污染壤质砂土。
3.根据权利要求1所述的基于机器学习的修复有机污染土壤的方法,其特征在于,所述化学氧化预处理有机污染土壤通过高锰酸钾、硫酸亚铁与过硫酸钠、芬顿试剂或双氧水预处理有机污染土壤。
4.根据权利要求3所述的基于机器学习的修复有机污染土壤的方法,其特征在于,通过高锰酸钾预处理有机污染土壤的过程具体为;根据修复的土壤质量,按土水比1kg:1L加入浓度为1.96~15.8g/L高锰酸钾溶液;
通过硫酸亚铁与过硫酸钠预处理有机污染土壤的过程具体为;根据修复的土壤质量,按土水比2kg:1L加入浓度为16.72-133.44g/L七水硫酸亚铁活化剂溶液,再按土水比2kg:1L加入浓度为1.20-9.52g/L过硫酸钠溶液,且保持硫酸亚铁与化学氧化物质量的之比是9.6:1;
通过芬顿试剂预处理有机污染土壤的过程具体为;根据修复的土壤质量,按土水比1kg:1L加入浓度为1.40-11.12g/L七水硫酸亚铁活化剂溶液,再每1000g土中加0.70-5.70mL的质量百分比为30%的过氧化氢溶液;
通过双氧水处理有机污染土壤的过程具体为;根据修复的土壤质量,按每1000g土中加0.70-5.70mL的质量百分比为30%的过氧化氢溶液。
5.根据权利要求1所述的基于机器学习的修复有机污染土壤的方法,其特征在于,采集修复有机污染土壤过程中的有机污染土壤类型、氧化剂类型、氧化剂浓度、修复时间、氧化还原电位、总有机碳含量、土壤酸碱度和苯并芘去除率数据;具体为:
每5-7天翻动预处理后的有机污染土壤,持续修复40天;
每0、1、2、3、4、5、6、7、10、15、20、25、30、35、40天检测土壤的苯并芘浓度、氧化还原电位、总有机碳含量、土壤酸碱度;
将苯并芘去除率作为因变量,将土壤类型、氧化剂类型、氧化剂浓度、时间、氧化还原电位、总有机碳含量和土壤酸碱度作为自变量;再将采集的因变量和自变量进行Z-Score归一化处理。
6.根据权利要求5所述的基于机器学习的修复有机污染土壤的方法,其特征在于,在每5-7天翻动预处理后的有机污染土壤,持续修复40天的过程中,保持有机污染土壤的湿度为70%~75%,控制土壤修复室内温度20~25℃。
7.根据权利要求1所述的基于机器学习的修复有机污染土壤的方法,其特征在于,所述方法还包括验证评估最优XGBoost模型,具体为:将测试数据代入最优的XGBoost模型进行验证和评定模型精度,并评估未参与建模数据的预测精度。
CN202210713071.0A 2022-06-22 2022-06-22 一种基于机器学习的修复有机污染土壤的方法 Active CN115007634B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210713071.0A CN115007634B (zh) 2022-06-22 2022-06-22 一种基于机器学习的修复有机污染土壤的方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210713071.0A CN115007634B (zh) 2022-06-22 2022-06-22 一种基于机器学习的修复有机污染土壤的方法

Publications (2)

Publication Number Publication Date
CN115007634A CN115007634A (zh) 2022-09-06
CN115007634B true CN115007634B (zh) 2022-12-06

Family

ID=83076835

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210713071.0A Active CN115007634B (zh) 2022-06-22 2022-06-22 一种基于机器学习的修复有机污染土壤的方法

Country Status (1)

Country Link
CN (1) CN115007634B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116822753B (zh) * 2023-08-30 2023-11-03 北京建筑大学 基于神经网络的电动淋洗修复底泥预测优化方法及系统
CN117171660B (zh) * 2023-11-02 2024-03-12 北京建工环境修复股份有限公司 基于支持向量机的微生物修复状态监测方法及系统

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108114976A (zh) * 2017-12-19 2018-06-05 轻工业环境保护研究所 一种修复污染土壤的方法
CN108580539A (zh) * 2018-04-18 2018-09-28 浙江大学 一种化学氧化耦合微生物修复有机污染土壤的方法
CN110428106A (zh) * 2019-08-05 2019-11-08 山东农业大学 一种基于机器学习的农作物需水量预测方法
CN110533248A (zh) * 2019-09-02 2019-12-03 中科格物智信(天津)科技有限公司 融合机器学习和lstm的大气污染物浓度预测方法
CN112700863A (zh) * 2020-12-28 2021-04-23 天津市眼科医院 一种基于Scheimpflug眼前节形态的屈光度精准评估的方法和应用
CN114037184A (zh) * 2021-12-01 2022-02-11 国网江苏省电力有限公司经济技术研究院 收益评价指标的预测方法、装置、介质、设备及程序产品

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11328177B2 (en) * 2019-09-18 2022-05-10 Hartford Steam Boiler Inspection And Insurance Company Computer-based systems, computing components and computing objects configured to implement dynamic outlier bias reduction in machine learning models

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108114976A (zh) * 2017-12-19 2018-06-05 轻工业环境保护研究所 一种修复污染土壤的方法
CN108580539A (zh) * 2018-04-18 2018-09-28 浙江大学 一种化学氧化耦合微生物修复有机污染土壤的方法
CN110428106A (zh) * 2019-08-05 2019-11-08 山东农业大学 一种基于机器学习的农作物需水量预测方法
CN110533248A (zh) * 2019-09-02 2019-12-03 中科格物智信(天津)科技有限公司 融合机器学习和lstm的大气污染物浓度预测方法
CN112700863A (zh) * 2020-12-28 2021-04-23 天津市眼科医院 一种基于Scheimpflug眼前节形态的屈光度精准评估的方法和应用
CN114037184A (zh) * 2021-12-01 2022-02-11 国网江苏省电力有限公司经济技术研究院 收益评价指标的预测方法、装置、介质、设备及程序产品

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
《基于逐步回归的XGboost方法的森林蓄积量估测》;黄宇玲;《中南林业科技大学学报》;中南林业科技大学;20200630;第40卷(第6期);第72-80页 *

Also Published As

Publication number Publication date
CN115007634A (zh) 2022-09-06

Similar Documents

Publication Publication Date Title
CN115007634B (zh) 一种基于机器学习的修复有机污染土壤的方法
Faist et al. Biological soil crust and disturbance controls on surface hydrology in a semi‐arid ecosystem
Alavi et al. Design equations for prediction of pressuremeter soil deformation moduli utilizing expression programming systems
Arnett et al. A caveat regarding diatom-inferred nitrogen concentrations in oligotrophic lakes
CN113943039B (zh) 一种有机污染地下水原位化学氧化工艺的修复效果预测建模方法
Arias-Real et al. Fungal biodiversity mediates the effects of drying on freshwater ecosystem functioning
Peralta‐Maraver et al. Comparing biotic drivers of litter breakdown across stream compartments
Du et al. Effect of metal pollution on the distribution and co-occurrence pattern of bacterial, archaeal and fungal communities throughout the soil profiles
Qin et al. A fuzzy composting process model
CN109365524A (zh) 一种复合有机污染的生物修复方法
Yang et al. A Fuzzy Simulation-Based Optimization Approach for Groundwater Remediation Design at Contaminated Aquifers.
Wang Permanence and stability for a competition and cooperation model of two enterprises with feedback controls on time scales
Alvarez et al. Reusing learned functionality to address complex boolean functions
Chen et al. Machine-learning-based prediction and key factor identification of the organic carbon in riverine floodplain soils with intensive agricultural practices
Jama et al. PFAS removal from percolate by super critical water oxidation (SCWO)
Faybishenko et al. Preface to the special issue of Vadose Zone Journal on soil as complex systems
Aisyah et al. Process dynamics modeling on polishing unit of artificial neural network-based produced water treatment system
Shi et al. Improving prediction of N2O emissions during composting using model-agnostic meta-learning
Beretta Point and nonpoint pollution and restoring groundwater quality in Italy: 30 years of experience
Alcaraz-González et al. Robust interval-based SISO regulation of an anaerobic reactor
Man et al. Improving Characterization of Vapor Intrusion Sites with A Deep Learning-based Data Assimilation Method
CN117854632A (zh) 基于铁生物地球化学机制的强化自然重金属污染修复方法
Sun Investigation of the Effects of Geochemical Perturbation and Arsenic as a Co-contaminant on Dehalococcoides mccartyi-containing TCE Dechlorination Consortia
Ershadi et al. Applicability of machine learning models for the assessment of long-term pollutant leaching from solid waste materials
Sun et al. Genetic algorithm solution of a gray nonlinear water environment management model developed for the liming river in Daqing, China

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant