CN111554358A - 一种重金属毒性终点和海洋水质基准阈值的预测方法 - Google Patents

一种重金属毒性终点和海洋水质基准阈值的预测方法 Download PDF

Info

Publication number
CN111554358A
CN111554358A CN202010322812.3A CN202010322812A CN111554358A CN 111554358 A CN111554358 A CN 111554358A CN 202010322812 A CN202010322812 A CN 202010322812A CN 111554358 A CN111554358 A CN 111554358A
Authority
CN
China
Prior art keywords
toxicity
data
value
marine
metal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202010322812.3A
Other languages
English (en)
Inventor
穆云松
吴丰昌
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Renmin University of China
Original Assignee
Renmin University of China
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Renmin University of China filed Critical Renmin University of China
Priority to CN202010322812.3A priority Critical patent/CN111554358A/zh
Publication of CN111554358A publication Critical patent/CN111554358A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16CCOMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
    • G16C20/00Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
    • G16C20/30Prediction of properties of chemical compounds, compositions or mixtures
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16CCOMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
    • G16C20/00Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
    • G16C20/20Identification of molecular entities, parts thereof or of chemical compositions
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16CCOMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
    • G16C20/00Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
    • G16C20/70Machine learning, data mining or chemometrics
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16CCOMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
    • G16C20/00Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
    • G16C20/90Programming languages; Computing architectures; Database systems; Data warehousing

Landscapes

  • Engineering & Computer Science (AREA)
  • Computing Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Chemical & Material Sciences (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Databases & Information Systems (AREA)
  • Software Systems (AREA)
  • Medical Informatics (AREA)
  • Health & Medical Sciences (AREA)
  • Data Mining & Analysis (AREA)
  • General Health & Medical Sciences (AREA)
  • Evolutionary Computation (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Artificial Intelligence (AREA)
  • Physics & Mathematics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种重金属毒性终点和海洋水质基准阈值的预测方法,基于重金属结构参数和影响金属形态的海洋环境理化要素特征,建立多变量的定量结构‑毒性相关预测模型,实现了对海洋重金属“原位”毒性值的预测,并进一步将海洋中代表性水生生物的毒性预测值进行物种敏感度分析(SSD),获得保护95%海洋生物的基准阈值。以Sigmoldal‑Logistic模型对SSD曲线进行拟合,曲线拟合参数与毒性预测模型中自变量进行多元相关性分析,本发明建立基于重金属结构和环境要素特征的物种敏感度分析普适模型,“量身定制”不同海洋环境中重金属的基准阈值,解决了因忽视水化学特征对毒性的影响而导致预测结果不准确的问题。

Description

一种重金属毒性终点和海洋水质基准阈值的预测方法
技术领域
本发明涉及海洋环境中重金属生物效应和风险评价领域,具体为基于重金属形态和生物有效性的一种重金属毒性终点和海洋水质基准阈值的预测方法。
背景技术
定量结构活性相关(QSAR)理论已取得重要进展,并在有机污染物的构效关系和毒性预测方面得到广泛应用。金属的定量构效关系研究始于上世纪七八十年代,但由于金属的形态和生物效应的复杂性,导致相关研究遇到了瓶颈,也是金属毒性预测领域的难点和挑战。例如,有效反映致毒机理的结构描述符难于获得,制约着QSAR在金属毒性预测中的应用。目前,获得金属毒性效应数据的唯一途径依然是通过传统毒理学试验测定,不仅耗费大量的人力、物力和财力,也必须面对生态伦理的挑战。进行金属定量构效关系和建模方法的研究对预测和评估生物效应具有广阔的应用前景。
近年来,随着金属形态分析技术的进步和对致毒机理的认识逐渐深入,为金属QSAR研究提供了克服瓶颈的新途径。基于致毒机理相同的科学假设,在相对理想的体系下,可以基于已有的QSAR模型经济、高效地实现一系列金属生物效应的纵向预测。目前的金属毒性预测技术基于金属的物理化学参数初步构建了一系列定量离子特征-毒性模型。然而,已报道的研究工作仅关注于金属自身的结构特点,而忽视了外界水化学条件对金属生物效应的影响,QSAR模型不能实现对不同环境条件下生物效应的横向预测。考虑到金属的形态和生物有效性对金属毒性的影响,已开发出生物配位体(Biotic Ligand model,BLM)模型。模型的主要思想是金属毒性以金属在生物敏感受体-鱼鳃上的累积过程模拟,包括金属形态和竞争性阳离子的防护效应。影响毒性的所有水化学特征包括在内,整合了金属离子与Ca2+、Na+、Mg2+、H+的竞争作用,与非生物配体DOC、氯化物、碳酸盐和硫化物结合。该模型比较全面地考虑了影响金属生物有效性的因素,与建立在硬度基础上的模型相比,生物配体模型具有更好的预测能力,是一个能够替代生物毒性试验预测金属毒性的有用工具。到目前为止,模型中最全面的数据是关于铜对虹鳟鱼的毒性。Playle等发现鳃膜上的钠离子通道是铜急性毒性效应的生物配位体,通过在宽泛水质条件范围内测定铜在鱼鳃表面的累积来校准BLM模型中铜的吸收。Rebort Santore发展了BLM模型,能够预测五种金属对五种水生生物的毒性效应。马义兵等对环境中金属BLM模型研究进展进行了较为全面的综述,并应用BLM模型预测我国多个水体的重金属毒性。Balistrieri等借鉴了生物配位体模型的原理,进一步预测了金属混合物对鳟鱼的复合毒性,同时指出温度、pH、主要离子浓度和溶解有机碳共同影响复合毒性。
但是BLM模型的应用也存在一些限制,主要包括以下方面:多数物种的BLM模型还未开发出来,相关的平衡系数有待率定和评估;针对不同物种的环境条件范围存在差异,超出范围时BLM模型不再适用;痕量金属的吸收要受生物学的控制,急性毒性的预测优于慢性。自然界的重金属并不是单独存在的,模型没有考虑多种重金属的复合效应对这种金属毒性的影响;针对特定金属开发的BLM模型,不能直接通过参数校正预测其他金属的毒性。因此,在BLM模型中引入金属结构特征参数,将有效扩展模型的应用范围。在不同外部环境条件下预测的毒性效应更贴近实际环境背景,使水生生物的保护更有针对性和科学性。
总体而言,以上方法只考虑海洋环境中金属离子结构特征与毒性的定量关系,忽视了环境理化要素特征对毒性的影响。对于重金属“原位”毒性的定量预测,缺乏系统的研究和可靠的预测方法。
发明内容
名称解释:
重金属“原位”毒性:区别于实验室人为设定条件下毒性测试获得的毒性阈值,“原位”毒性指水生模式生物在实际野外环境中开展毒性实验获得的毒性阈值,受环境理化要素的变化而改变。
海洋重金属“原位”毒性值:本发明的毒性数据都是在海水背景中测定完成的,并重点反映了温度和盐度两个指标对毒性阈值的影响。
本发明的目的在于提供一种基于重金属化学形态和海洋水体环境特征的重金属毒性终点和海洋水质基准阈值的预测方法,用以解决忽视了水化学特征对毒性的影响而导致预测结果不准确的问题。
为实现上述目的,本发明提出了海洋环境中重金属“原位”毒性和基准预测方法,基于重金属结构参数和影响金属形态的海洋环境理化要素特征,建立多变量的定量结构-毒性相关预测模型,预测海洋重金属“原位”毒性值。
进一步将海洋中代表性水生生物的毒性预测值进行物种敏感度分析(Speciessensitivity distribution analysis,SSDs),获得保护95%海洋生物的基准阈值。以Sigmoldal-Logistic模型对SSD曲线进行拟合,曲线拟合参数与毒性预测模型中多变量进行相关性分析,建立基于重金属结构和环境要素特征的物种敏感度分析普适模型,“量身定制”不同海洋环境中重金属的基准阈值。
基于重金属形态和生物有效性的生物毒性水质基准预测方法,包括以下步骤:
步骤a,毒性效应终点数据采集,筛选,汇总;
步骤b,通过单一变量的Pearson相关性分析,获得最优重金属结构描述符和海洋环境理化要素指标;
步骤c,构建多元海洋毒性预测模型及稳健性检验;
步骤d,模型验证;
随机从训练集中抽出一个数据,用其他的毒性数据和步骤c获得的最佳结构描述符建立多元回归模型,根据抽出数据的预测值与实验值的比较,来校验所建立的多元相关模型;
步骤e,基于海洋生态系统模式生物的定量结构-毒性相关模型,通过正交实验设计,计算典型重金属在不同温度和盐度条件下的急性毒性终点预测值;并利用得到的预测值构建物种敏感度分布曲线;拟合采用Sigmoidal-Logistic模型;
Figure BDA0002462078270000031
式中,a表示振幅,k表示曲线倾斜度,xc表示中间值;
步骤f,以软指数σp,温度T和盐度S为自变量,SSDs曲线拟合参数为因变量进行多元线性和非线性回归分析,构建定量相关关系模型;
步骤g,预测海洋急性基准阈值;
计算特定金属在不同温度、盐度条件下对应的SSDs方程,累计概率为0.05对应的剂量阈值为保护95%海洋水生生物免受的危害浓度阈值(HC5)。
优选地,所述步骤a具体包括以下步骤:
步骤a1、数据采集过程;
步骤a2、数据筛选过程:
数据筛选满足的条件为:1)重金属海洋生物急性毒性终点数据来源于科学引文索引期刊报道和美国环境保护局(U.S.EPA)生态毒理数据库;2)每个毒性数据必须包括科学,完整的试验条件参数,至少包括温度,酸度,硬度和盐度,不同水化学参数的范围是温度10~30℃之间,酸度5.5~8之间,硬度20~5000mg/L之间,盐度10~35‰;
3)包含美国环保局推荐的至少3门8科海洋物种类型,对于每种生物,至少包含6种金属的毒性试验数据;
4)毒性终点数据类型为致死率,表示为LC50
步骤a3、数据运算过程;
以重金属的水溶液浓度为数据的衡量指标;
步骤a4,数据汇总过程:
最终得到的数据集包括金属分子式,受试生物类型,毒性效应类型,终点指标,试验条件,暴露时间和数据来源。
优选地,步骤b中所述重金属结构描述符包括软指数σp、单位电荷软指数σp/Z、原子序数AN、离子半径r、IP:ON态离子的离子势、IP(N+1):ON+1态离子的离子势、IP(N+1)和IP的差值ΔIP、原子量AW、鲍林电负性Xm、共价指数Xm 2r、原子电离势AN/ΔIP、第一水解常数|logKOH|、电化学势ΔE0;所述环境理化要素指标包括温度T,盐度S,酸度pH和硬度。
优选地,步骤b具体包括以下步骤:以毒性终点为因变量,各重金属对应的结构参数和环境理化要素指标为单一自变量进行线性Pearson相关性分析,根据公式(1)计算各重金属结构参数的Pearson相关系数r;
Figure BDA0002462078270000041
式中,xi和yi分别表示第i种金属对应的结构参数和实测毒性值,
Figure BDA0002462078270000042
分别表示各金属结构参数和实测毒性值的平均值;相关系数r2>0.6对应的变量用于多元线性回归。
优选地,步骤c的具体方法为:
步骤c1,多元线性回归方程的构建与参数估计;
以步骤b中筛选出的最优结构参数和环境理化要素指标为自变量矩阵X,海洋金属实测水生毒性值为因变量矩阵Y,利用多元线性回归分析方法构建方程Y=XB+E,如公式(2):
Figure BDA0002462078270000043
式中,n为观测值个数;B代表未知参数;E代表随机误差项;
并采用最小二乘法对构建方程中参数进行估计,如公式(3)所示,:
Figure BDA0002462078270000051
其中,X′为X的转置矩阵;
步骤c2,拟合优度检验和回归方程的显著性检验;
模型的拟合优度检验指标为:相关系数的平方R2、自由度校正的相关系数
Figure BDA0002462078270000052
和标准偏差RMSE;F检验的指标为F值和相关概率p;
步骤c3,判别标准:
根据毒性数据获取途径,体外实验R2≥0.81,体内试验R2≥0.64,显著水平为α,当p<α时,方程显著相关。
优选地,所述步骤c2按照下述公式计算:
Figure BDA0002462078270000053
Figure BDA0002462078270000054
Figure BDA0002462078270000055
式中,R2表示相关系数的平方,
Figure BDA0002462078270000056
表示自由度校正的相关系数,RMSE表示标准偏差;
Figure BDA0002462078270000057
式中,yi表示第i种金属实测的毒性值,
Figure BDA0002462078270000058
表示第i种金属预测的毒性值,
Figure BDA0002462078270000059
表示各毒性值的平均值,n为训练集中金属的个数。
优选地,步骤d的具体方法为:
步骤d1,在给定的建模样本中,抽取一个样本作为预测集,其余样本作为训练集建模,并计算该样本的预测误差;
步骤d2,记录每个方程中预测误差的平方加和,直到所有的样本都被预报了一次而且仅被预报一次;
步骤d3,计算交叉验证相关系数Q2 cv和交叉验证均方根误差RMSEcv
判别依据:Q2 cv>0.6,R2-Q2 cv≤0.3。
优选地,步骤d3按以下公式计算:
Figure BDA0002462078270000061
Figure BDA0002462078270000062
式中,yi obs表示第i个金属毒性的实测值,
Figure BDA0002462078270000064
代表第i个金属毒性的预测值,
Figure BDA0002462078270000063
代表训练集毒性的平均值。
优选地,步骤e中所述典型重金属包括Cd2+、Cr3+、Cu2+、Hg2+、Ni2+和Zn2+
优选地,步骤e中拟合优度检验指标为相关系数的平方R2,F检验的指标为F值和相关概率p。
优选地,步骤f中SSDs曲线拟合参数包括振幅a,曲线倾斜度k和中间值xc
本发明基于重金属结构参数和影响金属形态的海洋环境理化要素特征,建立多变量的定量结构-毒性相关预测模型,实现了对海洋重金属“原位”毒性值的预测,并进一步将海洋中代表性水生生物的毒性预测值进行物种敏感度分析(Species sensitivitydistribution analysis,SSDs),获得保护95%海洋生物的基准阈值。以Sigmoldal-Logistic模型对SSD曲线进行拟合,曲线拟合参数与毒性预测模型中多变量进行相关性分析,本发明建立基于重金属结构和环境要素特征的物种敏感度分析普适模型,“量身定制”不同海洋环境中重金属的基准阈值,解决了因忽视水化学特征对毒性的影响而导致预测结果不准确的问题。
相对现有的QSAR-SSD模型,本发明将变量维度从一维增加到三维,模型可同时定量化金属结构,温度,和盐度对海水毒性和基准的影响,获得的毒性预测值更加接近真实水环境中重金属对水生生物危害水平。环境管理部门可采用本发明的模型和基准值有的放矢地防控不同海域,不同环境背景下的重金属污染事件,更科学地保护海洋生态系统。
具体实施方式
以下结合具体实施例对本发明上述的和另外的技术特征和优点作更详细的说明。
本发明的原理是以已知毒性的重金属原子的结构特征和海洋环境理化要素为自变量,海洋水生生物急性毒性为因变量,采用多元线性回归方法建立定量相关关系模型,预测未知金属的“原位”毒性效应。进一步采用Sigmoldal-Logistic模型对海洋生态系统的模式生物毒性预测值进行物种敏感度分布分析和拟合,建立拟合参数与毒性预测方程中自变量的相关关系,获得基于重金属“原位”毒性的预测方程。累计概率为0.05对应的危害浓度值为保护95%水生生物物种免受伤害的基准阈值。
本发明是是综合重金属的致毒机理和生物有效性建立重金属“原位”毒性预测模型,并将其应用于预测重金属毒性终点和海洋水质基准阈值的一种方法。
本发明一种基于重金属形态和生物有效性的重金属毒性终点和海洋水质基准阈值的预测方法,该具体过程为:
步骤a,毒性效应终点数据采集,筛选,汇总;
步骤a1,数据采集过程;
步骤a2,数据筛选过程;数据筛选满足的条件为:
1)重金属海洋生物急性毒性终点数据来源于科学引文索引(SCI)期刊报道和美国环保局生态毒理(ECOTOX)数据库,数据有效期限为近20年;
2)每个毒性数据必须包括科学,完整的试验条件参数,至少包括温度,酸度,硬度和盐度,不同水化学参数的范围是温度10~30℃之间,酸度5.5~8之间,硬度(CaCO3 mg/L)20~5000mg/L之间,盐度10~35‰。
3)包含美国环保局(EPA)推荐的至少3门8科海洋物种类型,对于每种生物,至少包含6种金属的毒性试验数据;
4)毒性终点数据类型为致死率,表示为LC50
步骤a3,数据运算过程;在本发明实施例中的运算方法为:
以重金属的水溶液浓度为数据的衡量指标,如单位为质量浓度除以分子量统一转化为微摩尔浓度,即μmol/L。
步骤a4,数据汇总过程:
最终得到的数据集包括金属分子式,受试生物类型,毒性效应类型,终点指标,试验条件,暴露时间,数据来源。
详细的毒性数据获取过程如下:
急性毒性数据优先采集自美国环境保护局(U.S.EPA)ECOTOX毒性数据库(http://cfpub.epa.gov/ecotox/)。如果毒性数据不足,以近20年SCI科学引文索引论文报道的有效数据(ISI Web of Knowledge)作为补充。通过数据库和文献检索引擎,输入金属名称、待测物种名称和急性毒性等关键词,导出满足条件的毒性数据集。在满足步骤a2条件的前提下,筛选出合格的毒性数据。以金属自由离子浓度为数据的衡量指标,如果原始数据以离子化合物质量为毒性终点指标。需除以分子量统一转化为微摩尔浓度,即μmol/L。在数据汇编过程中,记录金属种类,受试生物类型,毒性效应类型,终点指标,试验条件,暴露时间,数据来源等信息,整理成Excel表格作为建模依据。
以杂色鳉鱼(Cyprinodon variegatus)的急性毒性终点为例,进行数据筛选,运算和汇总,结果如表1所示。
表1 杂色鳉鱼急性毒性数据筛选,运算和汇总范例
Figure BDA0002462078270000081
步骤b,通过单一变量的Pearson相关性分析,获得最优重金属结构描述符和海洋环境理化要素指标。
其中,重金属的结构参数包括软指数σp、单位电荷软指数σp/Z、原子序数AN、离子半径r、IP:ON态离子的离子势、IP(N+1):ON+1态离子的离子势、IP(N+1)和IP的差值ΔIP、原子量AW、鲍林(Pauling)电负性Xm、共价指数Xm 2r、原子电离势AN/ΔIP、第一水解常数|logKOH|、电化学势ΔE0。环境理化要素指标包括温度T,盐度S,酸度pH和硬度(CaCO3,mg/L)。
步骤b,以毒性终点为因变量,各金属对应的结构参数和环境指标为单一自变量进行线性Pearson相关性分析,根据下述公式(1)计算相关系数r;
Figure BDA0002462078270000091
式中,xi和yi分别表示第i种金属对应的结构参数和实测毒性值,
Figure BDA0002462078270000092
分别表示各结构参数和实测毒性值的平均值,相关系数r2>0.6对应的变量用于多元线性回归。
按照步骤b所述的方法,分别计算各结构参数的Pearson相关系数r2,如表2所示。
表2 各参数之间的Pearson相关系数
Figure BDA0002462078270000093
步骤c,构建多元海洋毒性预测模型及稳健性检验;
步骤c1,多元线性回归方程的构建与参数估计;
步骤b中筛选出的最优结构参数和环境指标为自变量矩阵X,海洋金属实测水生毒性值为因变量矩阵Y,利用多元线性回归分析方法构建方程Y=XB+E,见公式(2),其中:
Figure BDA0002462078270000094
n为观测值个数;B代表未知参数,是方程中需要通过最小二乘法进行估计的;E代表随机误差项,反映了除x1,x2对y的线性关系之外的随机因素对y的影响。
采用最小二乘法对方程中参数进行估计,X′为X的转置矩阵:
Figure BDA0002462078270000101
最小二乘回归是从误差拟合角度对回归模型进行参数估计,是一种标准的多元建模工具,尤其适用于预测分析。
步骤c2,拟合优度检验和回归方程的显著性检验(F检验);
模型的拟合优度检验指标为:相关系数的平方(R2)和自由度校正的相关系数
Figure BDA0002462078270000102
标准偏差(RMSE)。F检验的指标为多因子方差分析(Multi-ANOVA)计算得到的F值和相关概率p。
步骤c3,判别标准:根据毒性数据获取途径,体外实验R2≥0.81,体内试验R2≥0.64。显著水平为α,当p<α时,方程显著相关。
Figure BDA0002462078270000103
Figure BDA0002462078270000104
Figure BDA0002462078270000105
式中,R2表示相关系数的平方,
Figure BDA0002462078270000106
表示自由度校正的相关系数,RMSE表示标准偏差。方程(4)、(5)的相关系数和标准偏差可以度量回归直线的拟合优度;
Figure BDA0002462078270000107
式中,yi表示第i种金属实测的毒性值,
Figure BDA0002462078270000108
表示第i种金属预测的毒性值,
Figure BDA0002462078270000109
表示各毒性值的平均值,n为训练集中金属的个数。方程(6)是检验因变量与多个自变量的线性关系是否显著的通用方法。
步骤d,模型验证;
多元线性回归模型采用抽一法进行验证,方法的核心思想是随机从训练集中抽出一个数据,用其他的毒性数据和步骤c获得的最佳结构描述符建立多元回归模型,根据抽出数据的预测值与实验值的比较,来校验所建立的网络模型。为了减少交叉验证结果的可变性,对一个样本数据集进行多次不同的划分,得到不同的互补子集,进行多次交叉验证。
具体步骤如下:
步骤d1,在给定的建模样本中,抽取一个样本作为预测集,其余样本作为训练集建模,并计算该样本的预测误差;
步骤d2,记录每个方程中预测误差的平方加和,直到所有的样本都被预报了一次而且仅被预报一次;
步骤d3,计算交叉验证相关系数Q2 cv和交叉验证均方根误差RMSEcv,计算公式如下所述;判别依据:Q2 cv>0.6,R2-Q2 cv≤0.3;
Figure BDA0002462078270000111
Figure BDA0002462078270000112
式中,yi obs表示第i个及金属毒性的实测值,
Figure BDA0002462078270000115
代表第i个金属毒性的预测值,代表训练集毒性的平均值。
方程(7)、(8)是抽一法内部验证的指示参数,可有效降低模型对训练集数据的过拟合,测定训练集中有无特定金属对模型稳健性的影响。
采用本发明步骤d所述的方法对模型进行内部验证。以预测方程log-C=(5.454±2.841)+(-0.211±0.071)T+(-0.031±0.008)S+(13.769±10.322)σp为例,对模型进行抽一法内部验证,相关拟合参数见表3。根据步骤d3中的公式(7)和(8),计算Q2 cv=0.8773,RMSEcv=0.2935,R2-Q2 cv=0.946-0.8773=0.0687。满足模型稳健性判别依据Q2 cv>0.6,R2-Q2 cv≤0.3,该模型通过内部验证。
表3 抽一法内部验证结果
Figure BDA0002462078270000114
Figure BDA0002462078270000121
步骤e,基于海洋生态系统模式生物(五门八科)的定量结构-毒性相关模型,通过正交实验设计,计算六种典型重金属(Cd2+、Cr3+、Cu2+、Hg2+、Ni2+和Zn2+)在不同温度(10,14,18,22,26,30℃)和盐度(10,15,20,25,30,35‰)条件下的急性毒性终点预测值。预测值用于构建物种敏感度分布曲线,拟合采用Sigmoidal-Logistic模型。
Figure BDA0002462078270000122
其中,a表示振幅,k表示曲线倾斜度,xc表示中间值。
拟合优度检验方法同步骤c2,相关系数的平方(R2),多因子方差分析(Multi-ANOVA)计算得到的F值和相关概率P值。
表4.正交实验条件下的物种敏感度分布曲线拟合结果
Figure BDA0002462078270000123
Figure BDA0002462078270000131
Figure BDA0002462078270000141
Figure BDA0002462078270000151
Figure BDA0002462078270000161
Figure BDA0002462078270000171
Figure BDA0002462078270000181
Figure BDA0002462078270000191
步骤f,以软指数σp,温度T和盐度S为自变量,SSDs曲线拟合参数(a,k和xc)为因变量进行多元线性和非线性回归分析,构建定量相关关系模型。
根据表5中各参数数值,a为常量,σp,T,S与xc成线性相关,σp,T,S与k成非线性相关。具体计算结果为:
a=0.9195±0.0465
xc=(-1.77±0.068)-(0.0501±0.0012)T-(0.0022±0.0001)S+(53.0±0.311)σp
k=-681σp2+119σp-0.704T/S-0.005S/σp-1.65
步骤g,预测海洋急性基准阈值。
具体过程为,计算特定金属在不同温度、盐度条件下对应的SSDs方程,累计概率为0.05对应的剂量阈值为保护95%海洋水生生物免受的危害浓度阈值(HC5)。
以金属镉为例,在海水表层温度25℃,盐度20‰环境条件下,将对应的软指数σp为0.081。根据步骤f公布的计算方法,计算SSD曲线的拟合参数为:
xc=(-1.77±0.068)-(0.0501±0.0012)T-(0.0022±0.0001)S+(53.0±0.311)σp
=-1.77-0.0501×25-0.0022×20+53×0.081
=1.218
k=-681σp2+119σp-0.704T/S-0.005S/σp-1.65
=-681×0.0812+119×0.081-0.704×25/20-0.005×20/0.081-1.65
=1.404
SSD拟合曲线方程为
Figure BDA0002462078270000201
为保护95%海洋生物免受危害,当f(x)=0.05时,对应的x=0.816μmol/L。因此,金属Cd的海洋水质基准阈值为10^0.816×112=17.1μg/L。
以上是结合具体实施例对本发明进一步的描述,但这些实施例仅仅是范例性的,并不对本发明的范围构成任何限制。本领域技术人员应该理解的是,在不偏离本发明的精神和范围下可以对本发明技术方案的细节和形式进行修改或替换,但这些修改和替换均落入本发明的保护范围内。

Claims (9)

1.一种重金属毒性终点和海洋水质基准阈值的预测方法,其特征在于,包括以下步骤:
步骤a,毒性效应终点数据采集,筛选,汇总;
步骤b,通过单一变量的Pearson相关性分析,获得最优重金属结构描述符和海洋环境理化要素指标;
步骤c,构建多元海洋毒性预测模型及稳健性检验;
步骤d,模型验证;
随机从训练集中抽出一个数据,用其他的毒性数据和步骤c获得的最佳结构描述符建立多元回归模型,根据抽出数据的预测值与实验值的比较,来校验所建立的多元线性模型;
步骤e,基于海洋生态系统模式生物的定量结构-毒性相关模型,通过正交实验设计,计算典型重金属在不同温度和盐度条件下的急性毒性终点预测值;并利用得到的预测值构建物种敏感度分布曲线;拟合采用Sigmoidal-Logistic模型;
Figure FDA0002462078260000011
式中,а表示振幅,k表示曲线倾斜度,xc表示中间值;
步骤f,以软指数σp,温度T和盐度S为自变量,SSDs曲线拟合参数为因变量进行多元线性和非线性回归分析,构建定量相关关系模型;
步骤g,预测海洋急性基准阈值;
计算特定金属在不同温度、盐度条件下对应的SSDs方程,累计概率为0.05对应的剂量阈值为保护95%海洋水生生物免受的危害浓度阈值HC5
2.根据权利要求1所述的预测方法,其特征在于,所述步骤a具体包括以下步骤:
步骤a1、数据采集过程;
步骤a2、数据筛选过程:数据筛选满足的条件为:
1)重金属海洋生物急性毒性终点数据来源于科学引文索引期刊报道和美国环境保护局生态毒理数据库;
2)每个毒性数据必须包括科学,完整的试验条件参数,至少包括温度,酸度,硬度和盐度,不同水化学参数的范围是温度10~30℃之间,酸度5.5~8之间,硬度20~5000mg/L之间,盐度10~35‰;
3)包含美国环保局推荐的至少3门8科海洋物种类型,对于每种生物,至少包含6种金属的毒性试验数据;
4)毒性终点数据类型为致死率,表示为LC50
步骤a3、数据运算过程;
以重金属的水溶液浓度为数据的衡量指标;
步骤a4,数据汇总过程:
最终得到的数据集包括金属分子式,受试生物类型,毒性效应类型,终点指标,试验条件,暴露时间和数据来源。
3.根据权利要求1所述的预测方法,其特征在于,步骤b中所述重金属结构描述符包括软指数σp、单位电荷软指数σp/Z、原子序数AN、离子半径r、IP:ON态离子的离子势、IP(N+1):ON+1态离子的离子势、IP(N+1)和IP的差值ΔIP、原子量AW、鲍林电负性Xm、共价指数Xm 2r、原子电离势AN/ΔIP、第一水解常数|logKOH|、电化学势ΔE0;所述环境理化要素指标包括温度T,盐度S,酸度pH和硬度。
4.根据权利要求3所述的预测方法,其特征在于,步骤b具体包括以下步骤:以毒性终点为因变量,各重金属对应的结构参数和环境理化要素指标为单一自变量进行线性Pearson相关性分析,根据公式(1)计算各重金属结构参数的Pearson相关系数r;
Figure FDA0002462078260000021
式中,xi和yi分别表示第i种金属对应的结构参数和实测毒性值,
Figure FDA0002462078260000022
分别表示各金属结构参数和实测毒性值的平均值;相关系数r2>0.6对应的变量用于多元线性回归。
5.根据权利要求1所述的预测方法,其特征在于,步骤c的具体方法为:
步骤c1,多元线性回归方程的构建与参数估计;
以步骤b中筛选出的最优结构参数和环境理化要素指标为自变量矩阵X,海洋金属实测水生毒性值为因变量矩阵Y,利用多元线性回归分析方法构建方程Y=XB+E,如公式(2):
Figure FDA0002462078260000023
式中,n为观测值个数;B代表未知参数;E代表随机误差项;
并采用最小二乘法对构建方程中参数进行估计,如公式(3)所示:
Figure FDA0002462078260000031
其中,X′为X的转置矩阵;
步骤c2,拟合优度检验和回归方程的显著性检验;
模型的拟合优度检验指标为:相关系数的平方R2、自由度校正的相关系数
Figure FDA0002462078260000032
和标准偏差RMSE;F检验的指标为F值和相关概率p;
步骤c3,判别标准:
根据毒性数据获取途径,体外实验R2≥0.81,体内试验R2≥0.64,显著水平为α,当p<α时,方程显著相关。
6.根据权利要求5所述的预测方法,其特征在于,所述步骤c2按照下述公式计算:
Figure FDA0002462078260000033
Figure FDA0002462078260000034
Figure FDA0002462078260000035
式中,R2表示相关系数的平方,
Figure FDA0002462078260000036
表示自由度校正的相关系数,RMSE表示标准偏差;
Figure FDA0002462078260000037
式中,yi表示第i种金属实测的毒性值,
Figure FDA0002462078260000038
表示第i种金属预测的毒性值,
Figure FDA0002462078260000039
表示各毒性值的平均值,n为训练集中金属的个数。
7.根据权利要求1所述的预测方法,其特征在于,步骤d的具体方法为:
步骤d1,在给定的建模样本中,抽取一个样本作为预测集,其余样本作为训练集建模,并计算该样本的预测误差;
步骤d2,记录每个方程中预测误差的平方加和,直到所有的样本都被预报了一次而且仅被预报一次;
步骤d3,计算交叉验证相关系数Q2 cv和交叉验证均方根误差RMSEcv
判别依据:Q2 cv>0.6,R2-Q2 cv≤0.3。
8.根据权利要求7所述的预测方法,其特征在于,步骤d3按以下公式计算:
Figure FDA0002462078260000041
Figure FDA0002462078260000042
式中,yi obs表示第i个金属毒性的实测值,yi predcv代表第i个金属毒性的预测值,
Figure FDA0002462078260000043
代表训练集毒性的平均值。
9.根据权利要求1所述的预测方法,其特征在于,步骤e中所述典型重金属为Cd2+、Cr3+、Cu2+、Hg2+、Ni2+和Zn2+
CN202010322812.3A 2020-04-22 2020-04-22 一种重金属毒性终点和海洋水质基准阈值的预测方法 Pending CN111554358A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010322812.3A CN111554358A (zh) 2020-04-22 2020-04-22 一种重金属毒性终点和海洋水质基准阈值的预测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010322812.3A CN111554358A (zh) 2020-04-22 2020-04-22 一种重金属毒性终点和海洋水质基准阈值的预测方法

Publications (1)

Publication Number Publication Date
CN111554358A true CN111554358A (zh) 2020-08-18

Family

ID=72007573

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010322812.3A Pending CN111554358A (zh) 2020-04-22 2020-04-22 一种重金属毒性终点和海洋水质基准阈值的预测方法

Country Status (1)

Country Link
CN (1) CN111554358A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112489736A (zh) * 2020-12-09 2021-03-12 中国石油大学(北京) 一种矿物含量分析方法、装置、设备及存储介质
CN113917102A (zh) * 2021-10-09 2022-01-11 中国人民大学 通过参数校正获取铜短期水质基准的方法
CN113917101A (zh) * 2021-10-09 2022-01-11 中国人民大学 流域水环境中铜的慢性毒性预测与长期基准推导方法

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104820873A (zh) * 2015-05-13 2015-08-05 中国环境科学研究院 一种基于金属定量构效关系的淡水急性基准预测方法
CN105447248A (zh) * 2015-11-24 2016-03-30 中国环境科学研究院 基于金属定量构效关系的海水急性基准预测方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104820873A (zh) * 2015-05-13 2015-08-05 中国环境科学研究院 一种基于金属定量构效关系的淡水急性基准预测方法
CN105447248A (zh) * 2015-11-24 2016-03-30 中国环境科学研究院 基于金属定量构效关系的海水急性基准预测方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
郄玉: "重金属水生生物毒性和基准预测模型研究", 《中国优秀硕士学位论文全文数据库 工程科技I辑》 *

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112489736A (zh) * 2020-12-09 2021-03-12 中国石油大学(北京) 一种矿物含量分析方法、装置、设备及存储介质
CN113917102A (zh) * 2021-10-09 2022-01-11 中国人民大学 通过参数校正获取铜短期水质基准的方法
CN113917101A (zh) * 2021-10-09 2022-01-11 中国人民大学 流域水环境中铜的慢性毒性预测与长期基准推导方法
CN113917102B (zh) * 2021-10-09 2024-01-12 中国人民大学 通过参数校正获取铜短期水质基准的方法
CN113917101B (zh) * 2021-10-09 2024-01-12 中国人民大学 流域水环境中铜的慢性毒性预测与长期基准推导方法

Similar Documents

Publication Publication Date Title
CN104820873B (zh) 一种基于金属定量构效关系的淡水急性基准预测方法
CN111554358A (zh) 一种重金属毒性终点和海洋水质基准阈值的预测方法
Horrigan et al. Response of stream macroinvertebrates to changes in salinity and the development of a salinity index
CN105608324B (zh) 基于毒性效应的流域沉积物中重金属生态风险评估方法
AU2011349050B2 (en) Analyte ion detection method and device
CN105447248B (zh) 基于金属定量构效关系的海水急性基准预测方法
Magni et al. Animal-sediment relationships: Evaluating the ‘Pearson–Rosenberg paradigm’in Mediterranean coastal lagoons
CN105069315A (zh) 基于金属形态和有效性的水生生物毒性预测方法
Rooney et al. Development and testing of an index of biotic integrity based on submersed and floating vegetation and its application to assess reclamation wetlands in Alberta’s oil sands area, Canada
CN104915563B (zh) 基于金属定量构效关系的淡水慢性基准预测方法
Zhu et al. A hybrid decomposition and Machine learning model for forecasting Chlorophyll-a and total nitrogen concentration in coastal waters
CN117875573B (zh) 一种基于生物毒性和生物有效性的水环境评价方法和系统
Dou et al. Influence of environmental variables on macroinvertebrate community structure in Lianhuan Lake
CN106919789B (zh) 突发环境事件应急处置限值的非参数核密度确定方法
CN114217025B (zh) 评估空气质量浓度预测中气象数据对其影响的分析方法
Baldigo et al. Acidification impacts and goals for gauging recovery of brook trout populations and fish communities in streams of the western Adirondack Mountains, New York, USA
Cairns et al. Developing a sampling strategy
Schryver et al. Application of nonlinear analysis methods for identifying relationships between microbial community structure and groundwater geochemistry
Xu et al. Can annual cyclicity of protozoan communities reflect water quality status in coastal ecosystems?
Bertoni et al. A non-deterministic approach to forecasting the trophic evolution of lakes
CN107391960B (zh) 基于过渡金属保护水生生物水质基准的CCCs预测方法
CN113990407B (zh) 对多氯萘及其同系物的含量及来源进行解析的解析方法
Vijver et al. Uncertainty of water type–specific hazardous copper concentrations derived with biotic ligand models
Galatro et al. Data Analytics for Process Engineers: Prediction, Control and Optimization
CN116307184B (zh) 一种基于因果关系的空气污染治理效果评估方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20200818