CN115049019A - 金属有机框架对砷的吸附性能评估方法、装置及相关设备 - Google Patents

金属有机框架对砷的吸附性能评估方法、装置及相关设备 Download PDF

Info

Publication number
CN115049019A
CN115049019A CN202210875620.4A CN202210875620A CN115049019A CN 115049019 A CN115049019 A CN 115049019A CN 202210875620 A CN202210875620 A CN 202210875620A CN 115049019 A CN115049019 A CN 115049019A
Authority
CN
China
Prior art keywords
data
model
performance evaluation
training
adsorption
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202210875620.4A
Other languages
English (en)
Other versions
CN115049019B (zh
Inventor
熊婷
崔佳文
侯泽敏
陈杰
杨艺
曹文治
周豪洁
廖妍
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hunan University of Technology
Original Assignee
Hunan University of Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hunan University of Technology filed Critical Hunan University of Technology
Priority to CN202210875620.4A priority Critical patent/CN115049019B/zh
Publication of CN115049019A publication Critical patent/CN115049019A/zh
Application granted granted Critical
Publication of CN115049019B publication Critical patent/CN115049019B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/20Metals
    • G01N33/204Structure thereof, e.g. crystal structure
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16CCOMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
    • G16C60/00Computational materials science, i.e. ICT specially adapted for investigating the physical or chemical properties of materials or phenomena associated with their design, synthesis, processing, characterisation or utilisation

Landscapes

  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Computing Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Medicinal Chemistry (AREA)
  • Biochemistry (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Food Science & Technology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Physics & Mathematics (AREA)
  • Analytical Chemistry (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • General Physics & Mathematics (AREA)
  • Immunology (AREA)
  • Pathology (AREA)
  • Investigating And Analyzing Materials By Characteristic Methods (AREA)
  • Solid-Sorbent Or Filter-Aiding Compositions (AREA)

Abstract

本发明公开了一种金属有机框架对砷的吸附性能评估方法、装置、设备及介质,包括:采集测试信息数据;对测试信息数据进行预处理,并将预处理后的数据按比例划分为训练集和测试集,确定模型输入特征;基于BP神经网络算法构建初始性能评估模型;采用提前停止算法在训练集上训练初始性能评估模型,并采用验证集对初始性能评估模型进行交叉验证,通过自动调参算法根据交叉验证误差调整优化初始性能评估模型的超参数,得到目标性能评估模型;采用预设的评价指标对目标性能评估模型进行评估,得到评估值;基于评估值和Shapley值法,确定各个模型输入特征吸附砷的性能,采用本发明提高了金属有机框架对砷的吸附性能评估的效率和准确性。

Description

金属有机框架对砷的吸附性能评估方法、装置及相关设备
技术领域
本发明涉及材料吸附性能评估领域,尤其涉及一种金属有机框架对砷的吸附性能评估方法、装置、计算机设备及介质。
背景技术
近年来随着我国人口的增长和工业的发展,水污染的情况不断加重,水污染事故频频发生,水污染防治成为人们日益关注的重点问题。水质污染不仅严重影响人类的健康,还会造成生物多样性减少、生态系统失衡等一系列问题,其中砷污染是水污染中一个急需解决的问题。
吸附技术是用于去除水体中污染物的常用修复手段之一,高效吸附剂的选择是该技术的关键。金属有机框架(MOFs)材料被广泛用于水中砷的去除,已经研制出的MOFs材料以及类MOFs材料已近上万种,不同的MOFs材料对砷的吸附能力有所差异,选择一个高效的MOFs材料用于处理含砷污水,将使得水污染治理成效事半功倍。
目前用于吸附含砷污水的金属有机框架材料的选择依赖于传统的实验筛选,然而通过实验来探索具有一定的盲目性,需要消耗实验人员大量的时间、精力和财力。此外,该试错过程还很难对所有可能的材料进行效果检测。
机器学习在材料性能预测方面虽然已经有了一些成功的应用,但是在材料的水体污染物吸附性能预测方面的模型研究较少,仅有少数关于生物碳材料的吸附预测模型,由于金属有机框架(MOFs)材料与碳材料在结构性能等方面存在较大差异,现有预测模型难以直接套用。
金属有机框架(MOFs)材料的性质结构和吸附能力有很强的相关性,材料的几何构型、表面结构及官能团等均影响着水体中砷污染物在其表面和内部的传质效率。同时吸附条件如时间、温度、pH等对吸附效果也有较大影响,但是通过简单的实验操作很难对各种特征的影响大小进行定量描述。
发明内容
本发明实施例提供一种金属有机框架对砷的吸附性能评估方法、装置、计算机设备和存储介质,以提高金属有机框架对砷的吸附性能评估准确性和效率。
为了解决上述技术问题,本申请实施例提供一种金属有机框架对砷的吸附性能评估方法,所述金属有机框架对砷的吸附性能评估方法包括:
采集金属有机框架对砷吸附的测试信息数据,所述测试信息数据包括材料结构信息、吸附条件信息、污染物特性信息和吸附量信息;
对所述测试信息数据进行预处理,并将预处理后的数据按比例划分为训练集和测试集,确定模型输入特征;
基于BP神经网络算法构建初始性能评估模型,将训练集分为训练集和验证集;
采用提前停止算法在训练集上训练所述初始性能评估模型,并采用验证集对所述初始性能评估模型进行交叉验证,通过自动调参算法根据交叉验证误差调整优化所述初始性能评估模型的超参数,得到目标性能评估模型;
采用预设的评价指标对所述目标性能评估模型进行评估,得到评估值;
基于所述评估值和Shapley值法,确定各个模型输入特征吸附砷的性能。
可选地,所述材料结构信息为比表面积、材料极化性、材料电负性、材料零电荷点、官能团密度、碳不饱和度中的一种或多种;所述吸附条件信息为污染物初始浓度、温度、溶液pH、共存离子中的一种或多种;所述污染物特性信息为污染物类型、污染物解离常数pka1、污染物解离常数pka2、污染物解离常数pka3、亲水性、主要官能团中的一种或多种;所述吸附量信息为最大吸附量、吸附系数kd中的一种或多种。
可选地,所述预处理包括数据初筛和数据标准化操作,其中,
所述数据初筛包括删除冗余数据、平均值填充缺失值和删除异常值;
采用如下公式进行数据标准化:
Figure BDA0003762342090000031
式中,
Figure BDA0003762342090000032
为归一化数据,xi为原始数据,
Figure BDA0003762342090000033
为原始数据中每一维数据中的均值,σ为原始数据中每一维数据中的标准差。经过处理的数据符合标准正态分布,即均值为0,标准差为1。
可选地,所述确定模型输入特征包括:
采用如下公式计算皮尔森相关系数:
Figure BDA0003762342090000034
式中,Xi和Yi是两个变量的第i个数据,
Figure BDA0003762342090000035
是变量X的平均值,
Figure BDA0003762342090000036
是变量Y的平均值,r为两个变量X和Y的相关系数;
基于所述相关系数进行特征选择,确定所述模型输入特征。
可选地,所述BP人工神经网络采用五层神经层,其中包含了三层隐藏层,激活函数选择ReLU函数,损失函数选择均方差损失函数,所述采用验证集对所述初始性能评估模型进行交叉验证,通过自动调参算法根据交叉验证误差调整优化所述初始性能评估模型的超参数,得到目标性能评估模型包括:
使用Adam优化算法进行参数和权重的更新,采用前馈误差-反向传播算法训练神经网络,利用梯度的一阶矩估计和二阶矩估计动态调整每个参数;
将训练集输入到初步建立的BP神经网络中进行训练学习,并进行十折交叉验证;
在每一次交叉验证中采用提前停止算法训练预测模型,监测验证集的损失值,当验证集损失值在达到预设阈值次数的训练周期中都没有得到降低时,则停止模型训练,否则训练到设置的最大迭代次数后为止。
使用网格搜索或Hyperopt自动化超参数调优算法,根据交叉验证误差不断调整优化预测模型的超参数,得到所述目标性能评估模型。
可选地,所述评价指标为决定系数R2和均方根误差RMSE中的一种或多种。
可选地,采用如下公式计算决定系数R2
Figure BDA0003762342090000041
采用如下公式计算均方根误差RMSE:
Figure BDA0003762342090000042
式中,
Figure BDA0003762342090000043
Figure BDA0003762342090000044
分别表示测试值和预测值,
Figure BDA0003762342090000045
是测试的平均值。
为了解决上述技术问题,本申请实施例还提供一种金属有机框架对砷的吸附性能评估装置,包括:
数据采集模块,用于采集金属有机框架对砷吸附的测试信息数据,所述测试信息数据包括材料结构信息、吸附条件信息、污染物特性信息和吸附量信息;
数据预处理模块,用于对所述测试信息数据进行预处理,并将预处理后的数据按比例划分为训练集和测试集,确定模型输入特征;
初始模型构建模块,用于基于BP神经网络算法构建初始性能评估模型,将训练集分为训练集和验证集;
目标模型训练模块,用于采用提前停止算法在训练集上训练所述初始性能评估模型,并采用验证集对所述初始性能评估模型进行交叉验证,通过自动调参算法根据交叉验证误差调整优化所述初始性能评估模型的超参数,得到目标性能评估模型;
评估值计算模块,用于采用预设的评价指标对所述目标性能评估模型进行评估,得到评估值;
性能评估模块,用于基于所述评估值和Shapley值法,确定各个模型输入特征吸附砷的性能。
可选地,所述预处理包括数据初筛和数据标准化操作,其中,所述数据初筛包括删除冗余数据、平均值填充缺失值和删除异常值;
第一计算单元,用于采用如下公式进行数据标准化:
Figure BDA0003762342090000051
式中,
Figure BDA0003762342090000052
为归一化数据,xi为原始数据,
Figure BDA0003762342090000053
为原始数据中每一维数据中的均值,σ为原始数据中每一维数据中的标准差。经过处理的数据符合标准正态分布,即均值为0,标准差为1。
可选地,所述数据预处理模块包括:
第二计算单元,用于采用如下公式计算皮尔森相关系数:
Figure BDA0003762342090000061
式中,Xi和Yi是两个变量的第i个数据,
Figure BDA0003762342090000062
是变量X的平均值,
Figure BDA0003762342090000063
是变量Y的平均值,r为两个变量X和Y的相关系数;
特征确定单元,用于基于所述相关系数进行特征选择,确定所述模型输入特征。
可选地,所述BP人工神经网络采用五层神经层,其中包含了三层隐藏层,激活函数选择ReLU函数,损失函数选择均方差损失函数,所述目标模型训练模块包括:
参数调整单元,用于使用Adam优化算法进行参数和权重的更新,采用前馈误差-反向传播算法训练神经网络,利用梯度的一阶矩估计和二阶矩估计动态调整每个参数;
交叉验证单元,用于将训练集输入到初步建立的BP神经网络中进行训练学习,并进行十折交叉验证;
迭代条件判断单元,用于在每一次交叉验证中采用提前停止算法训练预测模型,监测验证集的损失值,当验证集损失值在达到预设阈值次数的训练周期中都没有得到降低时,则停止模型训练,否则训练到设置的最大迭代次数后为止。
模型优化单元,用于使用网格搜索或Hyperopt自动化超参数调优算法,根据交叉验证误差不断调整优化预测模型的超参数,得到所述目标性能评估模型。
可选地,所述装置还包括:
第三计算单元,用于采用如下公式计算决定系数R2
Figure BDA0003762342090000071
第四计算单元,用于采用如下公式计算均方根误差:
Figure BDA0003762342090000072
式中,
Figure BDA0003762342090000073
Figure BDA0003762342090000074
分别表示测试值和预测值,
Figure BDA0003762342090000075
是测试的平均值。
为了解决上述技术问题,本申请实施例还提供一种计算机设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述金属有机框架对砷的吸附性能评估方法的步骤。
为了解决上述技术问题,本申请实施例还提供一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现上述金属有机框架对砷的吸附性能评估方法的步骤。
本发明实施例提供的金属有机框架对砷的吸附性能评估方法、装置、计算机设备及存储介质,通过采集金属有机框架对砷吸附的测试信息数据,测试信息数据包括材料结构信息、吸附条件信息、污染物特性信息和吸附量信息;对测试信息数据进行预处理,并将预处理后的数据按比例划分为训练集和测试集,确定模型输入特征;基于BP神经网络算法构建初始性能评估模型,将训练集分为训练集和验证集;采用提前停止算法在训练集上训练初始性能评估模型,并采用验证集对初始性能评估模型进行交叉验证,通过自动调参算法根据交叉验证误差调整优化初始性能评估模型的超参数,得到目标性能评估模型;采用预设的评价指标对目标性能评估模型进行评估,得到评估值;基于评估值和Shapley值法,确定各个模型输入特征吸附砷的性能,实现了准确快速地预测不同金属有机框架材料在不同吸附条件下对砷污染物的吸附效果,具有较好的泛化能力和较强的鲁棒性,提高了金属有机框架对砷的吸附性能评估的效率和准确性。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对本发明实施例的描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1是本申请的金属有机框架对砷的吸附性能评估方法的一个实施例的流程图;
图2为本申请的性能评估模型在验证集的预测结果图;
图3为本申请的性能评估模型在测试集的预测结果图;
图4为本申请的性能评估模型在测试集的预测值与实验值散点图;
图5为本申请的性能评估模型解释的影响材料吸附砷污染物效果的主要特征图;
图6为本申请的性能评估模型解释的特征总体分析图。
图7是根据本申请的金属有机框架对砷的吸附性能评估装置的一个实施例的结构示意图;
图8是根据本申请的计算机设备的一个实施例的结构示意图。
具体实施方式
除非另有定义,本文所使用的所有的技术和科学术语与属于本申请的技术领域的技术人员通常理解的含义相同;本文中在申请的说明书中所使用的术语只是为了描述具体的实施例的目的,不是旨在于限制本申请;本申请的说明书和权利要求书及上述附图说明中的术语“包括”和“具有”以及它们的任何变形,意图在于覆盖不排他的包含。本申请的说明书和权利要求书或上述附图中的术语“第一”、“第二”等是用于区别不同对象,而不是用于描述特定顺序。
在本文中提及“实施例”意味着,结合实施例描述的特定特征、结构或特性可以包含在本申请的至少一个实施例中。在说明书中的各个位置出现该短语并不一定均是指相同的实施例,也不是与其它实施例互斥的独立的或备选的实施例。本领域技术人员显式地和隐式地理解的是,本文所描述的实施例可以与其它实施例相结合。
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
请参阅图1,图1示出本发明实施例提供的一种金属有机框架对砷的吸附性能评估方法,详述如下:
S201:采集金属有机框架对砷吸附的测试信息数据,测试信息数据包括材料结构信息、吸附条件信息、污染物特性信息和吸附量信息。
其中,材料结构信息包括但不限于比表面积、材料极化性、材料电负性、材料零电荷点、官能团密度、碳不饱和度等中的一种或多种。
其中,吸附条件信息包括但不限于污染物初始浓度、温度、溶液pH、共存离子等中的一种或多种。
其中,污染物特性信息包括但不限于污染物类型、污染物解离常数pka1、污染物解离常数pka2、污染物解离常数pka3、亲水性、主要官能团中的一种或多种;吸附量信息为最大吸附量、吸附系数kd等中的一种或多种。
在一具体实施方式中,收集已知的金属有机框架对砷吸附的实验信息作为数据构建数据库,本实施例收集到1573条金属有机框架对砷吸附的实验信息,其中材料结构信息为比表面积、材料极化性、材料电负性、材料零电荷点;吸附条件信息为污染物初始浓度溶液pH;污染物特性信息为污染物类型、污染物解离常数pka1、污染物解离常数pka2、污染物解离常数pka3;吸附量信息为最大吸附量。
S202:对测试信息数据进行预处理,并将预处理后的数据按比例划分为训练集和测试集,确定模型输入特征。
具体地,对采集到的测试信息数据进行预处理,并对预处理后的数据按比例划分为训练集和测试集。
可选地,预处理包括数据初筛和数据标准化操作。
其中,数据初筛包括删除冗余数据、平均值填充缺失值和删除异常值;
进一步地,对初筛后数据进行标准化处理,标准化处理后的数据符合标准正态分布,即均值为0,标准差为1,具体采用如下公式进行数据标准化:
Figure BDA0003762342090000101
式中,
Figure BDA0003762342090000102
为归一化数据,xi为原始数据,
Figure BDA0003762342090000103
为原始数据中每一维数据中的均值,σ为原始数据中每一维数据中的标准差。
优选地,本实施例采用随机划分的方法将数据按照9:1的比例划分为两份,其中占比90%的作为训练集、占比10%的作为测试集;训练集用于性能评估模型的训练及调优,测试集用于评价最终的性能评估模型。
进一步地,确定模型输入特征包括:
采用如下公式计算皮尔森相关系数:
Figure BDA0003762342090000111
式中,Xi和Yi是两个变量的第i个数据,
Figure BDA0003762342090000112
是变量X的平均值,
Figure BDA0003762342090000113
是变量Y的平均值,r为两个变量X和Y的相关系数;
基于相关系数进行特征选择,确定模型输入特征。
具体地,采用皮尔森相关系数进行特征选择,皮尔森相关系数也叫皮尔森积差相关系数,是用来反应两个变量X和Y相似程度的统计量,即线性相关程度,其数值介于-1到1之间,绝对值越大表明相关性越强。根据上述计算出的皮尔森相关系数选择有意义的特征输入初始性能评估模型进行训练,在一具体实施方式中确定了11个模型输入特征。
S203:基于BP神经网络算法构建初始性能评估模型,将训练集分为训练集和验证集。
S204:采用提前停止算法在训练集上训练初始性能评估模型,并采用验证集对初始性能评估模型进行交叉验证,通过自动调参算法根据交叉验证误差调整优化初始性能评估模型的超参数,得到目标性能评估模型。
本实施中,采用网格搜索、随机搜索、Hyperopt自动化超参数调优算法或遗传算法粒子群等优化算法获取最优的超参数。
本案例使用网格搜索,网格搜索法是指定参数值的一种穷举搜索方法,也就是说,将各个参数可能的取值进行排列组合,列出所有可能的组合结果生成“网格”。本案例主要调优的超参数是学习率和隐藏层的神经元个数(总共三层隐藏层,每层神经元个数相同),最终得到最优的学习率为0.001,隐藏层神经元为180。
可选地,BP人工神经网络采用五层神经层,其中包含了三层隐藏层,激活函数选择ReLU函数,损失函数选择均方差损失函数,采用验证集对初始性能评估模型进行交叉验证,通过自动调参算法根据交叉验证误差调整优化初始性能评估模型的超参数,得到目标性能评估模型包括:
使用Adam优化算法进行参数和权重的更新,采用前馈误差-反向传播算法训练神经网络,利用梯度的一阶矩估计和二阶矩估计动态调整每个参数;
将训练集输入到初步建立的BP神经网络中进行训练学习,并进行十折交叉验证;
在每一次交叉验证中采用提前停止算法训练预测模型,监测验证集的损失值,当验证集损失值在达到预设阈值次数的训练周期中都没有得到降低时,则停止模型训练,否则训练到设置的最大迭代次数后为止。
使用网格搜索或Hyperopt自动化超参数调优算法,根据交叉验证误差不断调整优化预测模型的超参数,得到目标性能评估模型。
其中,损失值为实验值与预测值的均方误差MSE。
本实施例中,BP人工神经网络采用五层神经层,其中包含了三层隐藏层,激活函数选择ReLU函数,损失函数选择均方差损失函数,并且设置学习率初始值为0.001,监听损失函数的值,当损失函数值增长超过五次,则减少学习率,同时采用dropout技术,在每次训练中随机使10%的每一隐藏层的神经元失活,防止过拟合。
进一步地,将训练集输入到初步建立的BP神经网络中进行训练学习,并进行十折交叉验证具体实现如下:
随机地将数据集(初始训练集)切分为10个互不相交的大小相同的子集;
将9个子集当成训练集训练模型,剩下的1个子集当验证集评估模型;
将上一步对可能的10种选择重复进行(每次挑1个不同的子集做验证集);
每个模型都在相应的验证集上计算验证误差,得到了10个验证误差,计算平均验证误差(交叉验证误差)来评估当前参数下的模型性能,
在一具体实施方式中,模型在验证集上的预测值与实验值散点图如图2 所示,模型预测值与实际值之间的决定系数R2达到0.951,均方根误差RMSE 约为0.216。
优选地,将预设阈值次数设置为20次,防止过拟合,将模型迭代次数最大值为300。
S205:采用预设的评价指标对目标性能评估模型进行评估,得到评估值。
可选地,评价指标为决定系数R2和均方根误差RMSE中的一种或多种。
进一步地,采用如下公式计算决定系数R2
Figure BDA0003762342090000131
采用如下公式计算均方根误差RMSE:
Figure BDA0003762342090000132
式中,
Figure BDA0003762342090000133
Figure BDA0003762342090000134
分别表示测试值和预测值,
Figure BDA0003762342090000135
是测试的平均值。
在一具体示例中,使用最优的超参数构建目标性能评估模型,对测试集的数据进行预测,预测结果如图3所示,预测模型在测试集的预测值与实验值散点图如图4所示,模型预测值与实际值之间的决定系数R2达到0.952,均方根误差RMSE约为0.229。
S206:基于评估值和Shapley值法,确定各个模型输入特征吸附砷的性能。
具体地,基于Shapley值建立一个解释器,对预测模型进行解释,并深入分析金属有机框架的材料结构特性和吸附环境等影响因素与预测结果之间的复杂关系,找到影响材料吸附砷污染物效果的主要因子,具体实现如下:
步骤A:Shapley值的核心思想是计算每个特征对模型输出的边际贡献, Shapley值的计算公式如下:
Figure BDA0003762342090000141
式中,N是参与成员的集合;n是参与成员的总数;S表示为N的任意子集,即一个联盟;|S|表示联盟S中所含成员个数;υ(S)是评估每个联盟S效用水平的特征函数,(S-i)集合表示S中除了i之外的其他成员组成的联盟,为成员对联盟S的边际贡献,前面的分数为加权因子;υi为第i位成员的应得分配,即 Shapley值。在一具体实施方式中,假设有4个成员A,B,C,D,N是参与成员的集合{A,B,C,D},S是N的任意子集{A},{B},{C},{AB},{CD},{ABC},{ACD} 每个联盟的划分依据为属于参与成员的集合N的子集即可。
步骤B:通过计算出的Shapley值,对各种特征的影响大小进行定量分析,将一个特征对目标变量影响程度的绝对值的均值作为这个特征的重要性,如图5所示,影响材料吸附砷污染物效果的主要特征为污染物初始浓度、污染物解离常数pka3、金属极化性、比表面积等。
步骤C:通过对特征的总体分析,如图6所示,每一行代表一个特征,横坐标为SHAP值(Shapley值)。一个点代表一个样本,颜色越红说明特征本身数值越大,颜色越蓝说明特征本身数值越小。从图中我们可以直观地看出污染物初始浓度与最大吸附量预测值是呈正相关,而污染物解离常数pka3与最大吸附量预测值呈负相关的。
通过计算出的Shapley值,将一个特征对目标变量影响程度的绝对值的均值作为这个特征对预测值的贡献,也即该特征的重要性。按照贡献大小排序就可以得到图5的结果。
本实施例中,通过采集金属有机框架对砷吸附的测试信息数据,测试信息数据包括材料结构信息、吸附条件信息、污染物特性信息和吸附量信息;对测试信息数据进行预处理,并将预处理后的数据按比例划分为训练集和测试集,确定模型输入特征;基于BP神经网络算法构建初始性能评估模型,将训练集分为训练集和验证集;采用提前停止算法在训练集上训练初始性能评估模型,并采用验证集对初始性能评估模型进行交叉验证,通过自动调参算法根据交叉验证误差调整优化初始性能评估模型的超参数,得到目标性能评估模型;采用预设的评价指标对目标性能评估模型进行评估,得到评估值;基于评估值和Shapley值法,确定各个模型输入特征吸附砷的性能,实现了准确快速地预测不同金属有机框架材料在不同吸附条件下对砷污染物的吸附效果,具有较好的泛化能力和较强的鲁棒性,提高了金属有机框架对砷的吸附性能评估的效率和准确性。
应理解,上述实施例中各步骤的序号的大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本发明实施例的实施过程构成任何限定。
图7示出与上述实施例金属有机框架对砷的吸附性能评估方法一一对应的金属有机框架对砷的吸附性能评估装置的原理框图。如图7所示,该金属有机框架对砷的吸附性能评估装置包括数据采集模块31、数据预处理模块32、初始模型构建模块33、目标模型训练模块34、评估值计算模块35和性能评估模块36。各功能模块详细说明如下:
数据采集模块31,用于采集金属有机框架对砷吸附的测试信息数据,测试信息数据包括材料结构信息、吸附条件信息、污染物特性信息和吸附量信息;
数据预处理模块32,用于对测试信息数据进行预处理,并将预处理后的数据按比例划分为训练集和测试集,确定模型输入特征;
初始模型构建模块33,用于基于BP神经网络算法构建初始性能评估模型,将训练集分为训练集和验证集;
目标模型训练模块34,用于采用提前停止算法在训练集上训练初始性能评估模型,并采用验证集对初始性能评估模型进行交叉验证,通过自动调参算法根据交叉验证误差调整优化初始性能评估模型的超参数,得到目标性能评估模型;
评估值计算模块35,用于采用预设的评价指标对目标性能评估模型进行评估,得到评估值;
性能评估模块36,用于基于评估值和Shapley值法,确定各个模型输入特征吸附砷的性能。
可选地,预处理包括数据初筛和数据标准化操作,其中,数据初筛包括删除冗余数据、平均值填充缺失值和删除异常值;
第一计算单元,用于采用如下公式进行数据标准化:
Figure BDA0003762342090000161
式中,
Figure BDA0003762342090000162
为归一化数据,xi为原始数据,
Figure BDA0003762342090000163
为原始数据中每一维数据中的均值,σ为原始数据中每一维数据中的标准差。经过处理的数据符合标准正态分布,即均值为0,标准差为1。
可选地,数据预处理模块32包括:
第二计算单元,用于采用如下公式计算皮尔森相关系数:
Figure BDA0003762342090000171
式中,Xi和Yi是两个变量的第i个数据,
Figure BDA0003762342090000172
是变量X的平均值,
Figure BDA0003762342090000173
是变量Y的平均值,r为两个变量X和Y的相关系数;
特征确定单元,用于基于相关系数进行特征选择,确定模型输入特征。
可选地,BP人工神经网络采用五层神经层,其中包含了三层隐藏层,激活函数选择ReLU函数,损失函数选择均方差损失函数,目标模型训练模块 34包括:
参数调整单元,用于使用Adam优化算法进行参数和权重的更新,采用前馈误差-反向传播算法训练神经网络,利用梯度的一阶矩估计和二阶矩估计动态调整每个参数;
交叉验证单元,用于将训练集输入到初步建立的BP神经网络中进行训练学习,并进行十折交叉验证;
迭代条件判断单元,用于在每一次交叉验证中采用提前停止算法训练预测模型,监测验证集的损失值,当验证集损失值在达到预设阈值次数的训练周期中都没有得到降低时,则停止模型训练,否则训练到设置的最大迭代次数后为止。
模型优化单元,用于使用网格搜索或Hyperopt自动化超参数调优算法,根据交叉验证误差不断调整优化预测模型的超参数,得到目标性能评估模型。
可选地,该装置还包括:
第三计算单元,用于采用如下公式计算决定系数R2
Figure BDA0003762342090000174
第四计算单元,用于采用如下公式计算均方根误差:
Figure BDA0003762342090000181
式中,
Figure BDA0003762342090000182
Figure BDA0003762342090000183
分别表示测试值和预测值,
Figure BDA0003762342090000184
是测试的平均值。
关于金属有机框架对砷的吸附性能评估装置的具体限定可以参见上文中对于金属有机框架对砷的吸附性能评估方法的限定,在此不再赘述。上述金属有机框架对砷的吸附性能评估装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
为解决上述技术问题,本申请实施例还提供计算机设备。具体请参阅图8,图8为本实施例计算机设备基本结构框图。
所述计算机设备4包括通过系统总线相互通信连接存储器41、处理器42、网络接口43。需要指出的是,图中仅示出了具有组件连接存储器41、处理器 42、网络接口43的计算机设备4,但是应理解的是,并不要求实施所有示出的组件,可以替代的实施更多或者更少的组件。其中,本技术领域技术人员可以理解,这里的计算机设备是一种能够按照事先设定或存储的指令,自动进行数值计算和/或信息处理的设备,其硬件包括但不限于微处理器、专用集成电路(Application Specific Integrated Circuit,ASIC)、可编程门阵列(Field-Programmable Gate Array,FPGA)、数字处理器(Digital Signal Processor,DSP)、嵌入式设备等。
所述计算机设备可以是桌上型计算机、笔记本、掌上电脑及云端服务器等计算设备。所述计算机设备可以与用户通过键盘、鼠标、遥控器、触摸板或声控设备等方式进行人机交互。
所述存储器41至少包括一种类型的可读存储介质,所述可读存储介质包括闪存、硬盘、多媒体卡、卡型存储器(例如,SD或D界面显示存储器等)、随机访问存储器(RAM)、静态随机访问存储器(SRAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、可编程只读存储器(PROM)、磁性存储器、磁盘、光盘等。在一些实施例中,所述存储器41可以是所述计算机设备4的内部存储单元,例如该计算机设备4的硬盘或内存。在另一些实施例中,所述存储器41也可以是所述计算机设备4的外部存储设备,例如该计算机设备4上配备的插接式硬盘,智能存储卡(Smart Media Card,SMC),安全数字(Secure Digital,SD)卡,闪存卡(Flash Card)等。当然,所述存储器 41还可以既包括所述计算机设备4的内部存储单元也包括其外部存储设备。本实施例中,所述存储器41通常用于存储安装于所述计算机设备4的操作系统和各类应用软件,例如金属有机框架对砷的吸附性能评估的程序代码等。此外,所述存储器41还可以用于暂时地存储已经输出或者将要输出的各类数据。
所述处理器42在一些实施例中可以是中央处理器(Central Processing Unit,CPU)、控制器、微控制器、微处理器、或其他数据处理芯片。该处理器42 通常用于控制所述计算机设备4的总体操作。本实施例中,所述处理器42用于运行所述存储器41中存储的程序代码或者处理数据,例如运行金属有机框架对砷的吸附性能评估的控制的程序代码。
所述网络接口43可包括无线网络接口或有线网络接口,该网络接口43 通常用于在所述计算机设备4与其他电子设备之间建立通信连接。
本申请还提供了另一种实施方式,即提供一种计算机可读存储介质,所述计算机可读存储介质存储有界面显示程序,所述界面显示程序可被至少一个处理器执行,以使所述至少一个处理器执行如上述的金属有机框架对砷的吸附性能评估方法的步骤。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,空调器,或者网络设备等)执行本申请各个实施例所述的方法。
显然,以上所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例,附图中给出了本申请的较佳实施例,但并不限制本申请的专利范围。本申请可以以许多不同的形式来实现,相反地,提供这些实施例的目的是使对本申请的公开内容的理解更加透彻全面。尽管参照前述实施例对本申请进行了详细的说明,对于本领域的技术人员来而言,其依然可以对前述各具体实施方式所记载的技术方案进行修改,或者对其中部分技术特征进行等效替换。凡是利用本申请说明书及附图内容所做的等效结构,直接或间接运用在其他相关的技术领域,均同理在本申请专利保护范围之内。

Claims (10)

1.一种金属有机框架对砷的吸附性能评估方法,其特征在于,所述金属有机框架对砷的吸附性能评估方法包括:
采集金属有机框架对砷吸附的测试信息数据,所述测试信息数据包括材料结构信息、吸附条件信息、污染物特性信息和吸附量信息;
对所述测试信息数据进行预处理,并将预处理后的数据按比例划分为训练集和测试集,确定模型输入特征;
基于BP神经网络算法构建初始性能评估模型,将训练集分为训练集和验证集;
采用提前停止算法在训练集上训练所述初始性能评估模型,并采用验证集对所述初始性能评估模型进行交叉验证,通过自动调参算法根据交叉验证误差调整优化所述初始性能评估模型的超参数,得到目标性能评估模型;
采用预设的评价指标对所述目标性能评估模型进行评估,得到评估值;
基于所述评估值和Shapley值法,确定各个模型输入特征吸附砷的性能。
2.如权利要求1所述的金属有机框架对砷的吸附性能评估方法,其特征在于,所述材料结构信息为比表面积、材料极化性、材料电负性、材料零电荷点、官能团密度、碳不饱和度中的一种或多种;所述吸附条件信息为污染物初始浓度、温度、溶液pH、共存离子中的一种或多种;所述污染物特性信息为污染物类型、污染物解离常数pka1、污染物解离常数pka2、污染物解离常数pka3、亲水性、主要官能团中的一种或多种;所述吸附量信息为最大吸附量、吸附系数kd中的一种或多种。
3.如权利要求1所述的金属有机框架对砷的吸附性能评估方法,其特征在于,所述预处理包括数据初筛和数据标准化操作,其中,
所述数据初筛包括删除冗余数据、平均值填充缺失值和删除异常值;
所述数据标准化采用如下公式:
Figure FDA0003762342080000021
式中,
Figure FDA0003762342080000022
为归一化数据,xi为原始数据,
Figure FDA0003762342080000023
为原始数据中每一维数据中的均值,σ为原始数据中每一维数据中的标准差。经过处理的数据符合标准正态分布,即均值为0,标准差为1。
4.如权利要求1所述的金属有机框架对砷的吸附性能评估方法,其特征在于,所述确定模型输入特征包括:
采用如下公式计算皮尔森相关系数:
Figure FDA0003762342080000024
式中,Xi和Yi是两个变量的第i个数据,
Figure FDA0003762342080000025
是变量X的平均值,
Figure FDA0003762342080000026
是变量Y的平均值,r为两个变量X和Y的相关系数;
基于所述相关系数进行特征选择,确定所述模型输入特征。
5.如权利要求1所述的金属有机框架对砷的吸附性能评估方法,其特征在于,BP人工神经网络采用五层神经层,其中包含了三层隐藏层,激活函数选择ReLU函数,损失函数选择均方差损失函数,所述采用验证集对所述初始性能评估模型进行交叉验证,通过自动调参算法根据交叉验证误差调整优化所述初始性能评估模型的超参数,得到目标性能评估模型包括:
使用Adam优化算法进行参数和权重的更新,采用前馈误差-反向传播算法训练神经网络,利用梯度的一阶矩估计和二阶矩估计动态调整每个参数;
将训练集输入到初步建立的BP神经网络中进行训练学习,并进行十折交叉验证;
在每一次交叉验证中采用提前停止算法训练预测模型,监测验证集的损失值,当验证集损失值在达到预设阈值次数的训练周期中都没有得到降低时,则停止模型训练,否则训练到设置的最大迭代次数后为止。
使用网格搜索或Hyperopt自动化超参数调优算法,根据交叉验证误差不断调整优化预测模型的超参数,得到所述目标性能评估模型。
6.如权利要求1所述的金属有机框架对砷的吸附性能评估方法,其特征在于,所述评价指标为决定系数R2和均方根误差RMSE中的一种或多种。
7.如权利要求6所述的金属有机框架对砷的吸附性能评估方法,其特征在于,采用如下公式计算决定系数R2
Figure FDA0003762342080000031
采用如下公式计算均方根误差RMSE:
Figure FDA0003762342080000032
式中,
Figure FDA0003762342080000033
Figure FDA0003762342080000034
分别表示测试值和预测值,
Figure FDA0003762342080000035
是测试的平均值。
8.一种金属有机框架对砷的吸附性能评估装置,其特征在于,所述金属有机框架对砷的吸附性能评估装置包括:
数据采集模块,用于采集金属有机框架对砷吸附的测试信息数据,所述测试信息数据包括材料结构信息、吸附条件信息、污染物特性信息和吸附量信息;
数据预处理模块,用于对所述测试信息数据进行预处理,并将预处理后的数据按比例划分为训练集和测试集,确定模型输入特征;
初始模型构建模块,用于基于BP神经网络算法构建初始性能评估模型,将训练集分为训练集和验证集;
目标模型训练模块,用于采用提前停止算法在训练集上训练所述初始性能评估模型,并采用验证集对所述初始性能评估模型进行交叉验证,通过自动调参算法根据交叉验证误差调整优化所述初始性能评估模型的超参数,得到目标性能评估模型;
评估值计算模块,用于采用预设的评价指标对所述目标性能评估模型进行评估,得到评估值;
性能评估模块,用于基于所述评估值和Shapley值法,确定各个模型输入特征吸附砷的性能。
9.一种计算机设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1至7任一项所述的金属有机框架对砷的吸附性能评估方法。
10.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至7任一项所述的金属有机框架对砷的吸附性能评估方法。
CN202210875620.4A 2022-07-25 2022-07-25 金属有机框架对砷的吸附性能评估方法、装置及相关设备 Active CN115049019B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210875620.4A CN115049019B (zh) 2022-07-25 2022-07-25 金属有机框架对砷的吸附性能评估方法、装置及相关设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210875620.4A CN115049019B (zh) 2022-07-25 2022-07-25 金属有机框架对砷的吸附性能评估方法、装置及相关设备

Publications (2)

Publication Number Publication Date
CN115049019A true CN115049019A (zh) 2022-09-13
CN115049019B CN115049019B (zh) 2023-04-07

Family

ID=83168249

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210875620.4A Active CN115049019B (zh) 2022-07-25 2022-07-25 金属有机框架对砷的吸附性能评估方法、装置及相关设备

Country Status (1)

Country Link
CN (1) CN115049019B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116306321A (zh) * 2023-05-18 2023-06-23 湖南工商大学 基于粒子群的吸附水处理方案优化方法、装置及设备
CN117686555A (zh) * 2024-02-04 2024-03-12 南京邮电大学 一种基于机器学习的lc湿度传感器漂移补偿方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108494620A (zh) * 2018-02-28 2018-09-04 南京邮电大学 基于多目标自适应演化算法的网络业务流特征选择与分类方法
US20200104678A1 (en) * 2018-09-27 2020-04-02 Google Llc Training optimizer neural networks
CN114202060A (zh) * 2021-11-25 2022-03-18 浙江工业大学 基于深度神经网络的生物质活性炭吸附亚甲基蓝性能预测方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108494620A (zh) * 2018-02-28 2018-09-04 南京邮电大学 基于多目标自适应演化算法的网络业务流特征选择与分类方法
US20200104678A1 (en) * 2018-09-27 2020-04-02 Google Llc Training optimizer neural networks
CN114202060A (zh) * 2021-11-25 2022-03-18 浙江工业大学 基于深度神经网络的生物质活性炭吸附亚甲基蓝性能预测方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
孙晓蒙: "金属有机骨架化合物吸附去除水体中砷、磷、氟等污染物" *

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116306321A (zh) * 2023-05-18 2023-06-23 湖南工商大学 基于粒子群的吸附水处理方案优化方法、装置及设备
CN117686555A (zh) * 2024-02-04 2024-03-12 南京邮电大学 一种基于机器学习的lc湿度传感器漂移补偿方法
CN117686555B (zh) * 2024-02-04 2024-05-14 南京邮电大学 一种基于机器学习的lc湿度传感器漂移补偿方法

Also Published As

Publication number Publication date
CN115049019B (zh) 2023-04-07

Similar Documents

Publication Publication Date Title
CN115049019B (zh) 金属有机框架对砷的吸附性能评估方法、装置及相关设备
CN110738564A (zh) 贷后风险评估方法及装置、存储介质
CN110135635B (zh) 一种区域电力饱和负荷预测方法及系统
CN111814956B (zh) 一种基于多维度二次特征提取的多任务学习的空气质量预测方法
CN107729241B (zh) 一种基于变异体分组的软件变异测试数据进化生成方法
CN110991568A (zh) 目标识别方法、装置、设备和存储介质
CN112508243A (zh) 电力信息系统多故障预测网络模型的训练方法及装置
CN113094988A (zh) 一种基于数据驱动的浆液循环泵运行优化方法及系统
CN113449919B (zh) 一种基于特征和趋势感知的用电量预测方法及系统
CN111199469A (zh) 用户还款模型生成方法、装置及电子设备
CN115394358A (zh) 基于深度学习的单细胞测序基因表达数据插补方法和系统
CN114139931A (zh) 企业数据评估方法、装置、计算机设备及存储介质
CN116306321B (zh) 基于粒子群的吸附水处理方案优化方法、装置及设备
CN116303786B (zh) 一种基于多维数据融合算法的区块链金融大数据管理系统
CN117543544A (zh) 一种负荷预测方法、装置、设备及存储介质
CN109784417B (zh) 黑毛猪肉图像的识别方法
Hein et al. Can we compare effect size of spatial genetic structure between studies and species using Moran eigenvector maps?
CN116542701A (zh) 一种基于cnn-lstm组合模型的碳价预测方法及系统
CN115270861A (zh) 一种产品成分数据监测方法、装置、电子设备及存储介质
CN113762591B (zh) 一种基于gru和多核svm对抗学习的短期电量预测方法及系统
CN115375456A (zh) 用于信贷风险评估的数据处理方法、装置、设备及介质
CN114864015A (zh) 水体富营养化检测方法、装置、设备及存储介质
Darvish et al. Discovering dynamic regulatory pathway by applying an auto regressive model to time series DNA microarray data
CN112133383B (zh) 基于遗传符号回归预测钙钛矿比表面积的方法
CN113685972B (zh) 一种空调系统控制策略识别方法、装置、设备及介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant