CN111554358A - 一种重金属毒性终点和海洋水质基准阈值的预测方法 - Google Patents
一种重金属毒性终点和海洋水质基准阈值的预测方法 Download PDFInfo
- Publication number
- CN111554358A CN111554358A CN202010322812.3A CN202010322812A CN111554358A CN 111554358 A CN111554358 A CN 111554358A CN 202010322812 A CN202010322812 A CN 202010322812A CN 111554358 A CN111554358 A CN 111554358A
- Authority
- CN
- China
- Prior art keywords
- toxicity
- data
- marine
- value
- model
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 229910001385 heavy metal Inorganic materials 0.000 title claims abstract description 57
- 238000000034 method Methods 0.000 title claims abstract description 53
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 title claims abstract description 19
- 231100000783 metal toxicity Toxicity 0.000 title claims description 20
- 230000001988 toxicity Effects 0.000 claims abstract description 75
- 231100000419 toxicity Toxicity 0.000 claims abstract description 75
- 229910052751 metal Inorganic materials 0.000 claims abstract description 55
- 239000002184 metal Substances 0.000 claims abstract description 55
- 229910052729 chemical element Inorganic materials 0.000 claims abstract description 9
- 238000012360 testing method Methods 0.000 claims description 31
- 230000007613 environmental effect Effects 0.000 claims description 25
- 150000002739 metals Chemical class 0.000 claims description 20
- 230000008569 process Effects 0.000 claims description 16
- 241000894007 species Species 0.000 claims description 15
- 231100000048 toxicity data Toxicity 0.000 claims description 14
- 238000012549 training Methods 0.000 claims description 14
- 230000001419 dependent effect Effects 0.000 claims description 11
- 150000002500 ions Chemical class 0.000 claims description 11
- 238000012417 linear regression Methods 0.000 claims description 11
- 231100000331 toxic Toxicity 0.000 claims description 11
- 230000007059 acute toxicity Effects 0.000 claims description 10
- 231100000403 acute toxicity Toxicity 0.000 claims description 10
- 238000012216 screening Methods 0.000 claims description 10
- 230000002588 toxic effect Effects 0.000 claims description 10
- 239000011159 matrix material Substances 0.000 claims description 9
- 238000002790 cross-validation Methods 0.000 claims description 8
- 238000004458 analytical method Methods 0.000 claims description 7
- 239000000126 substance Substances 0.000 claims description 7
- 238000010220 Pearson correlation analysis Methods 0.000 claims description 6
- 230000035945 sensitivity Effects 0.000 claims description 6
- FGUUSXIOTUKUDN-IBGZPJMESA-N C1(=CC=CC=C1)N1C2=C(NC([C@H](C1)NC=1OC(=NN=1)C1=CC=CC=C1)=O)C=CC=C2 Chemical compound C1(=CC=CC=C1)N1C2=C(NC([C@H](C1)NC=1OC(=NN=1)C1=CC=CC=C1)=O)C=CC=C2 FGUUSXIOTUKUDN-IBGZPJMESA-N 0.000 claims description 5
- 230000001154 acute effect Effects 0.000 claims description 4
- 238000010276 construction Methods 0.000 claims description 4
- 230000001186 cumulative effect Effects 0.000 claims description 4
- 238000005259 measurement Methods 0.000 claims description 4
- 231100000820 toxicity test Toxicity 0.000 claims description 4
- GNFTZDOKVXKIBK-UHFFFAOYSA-N 3-(2-methoxyethoxy)benzohydrazide Chemical compound COCCOC1=CC=CC(C(=O)NN)=C1 GNFTZDOKVXKIBK-UHFFFAOYSA-N 0.000 claims description 3
- 239000007864 aqueous solution Substances 0.000 claims description 3
- 238000012937 correction Methods 0.000 claims description 3
- 238000013401 experimental design Methods 0.000 claims description 3
- 230000007062 hydrolysis Effects 0.000 claims description 3
- 238000006460 hydrolysis reaction Methods 0.000 claims description 3
- 238000001727 in vivo Methods 0.000 claims description 3
- 231100000225 lethality Toxicity 0.000 claims description 3
- 238000000611 regression analysis Methods 0.000 claims description 3
- 241001137307 Cyprinodon variegatus Species 0.000 claims description 2
- 238000012404 In vitro experiment Methods 0.000 claims description 2
- 238000013403 standard screening design Methods 0.000 claims 2
- 241000425347 Phyla <beetle> Species 0.000 claims 1
- 230000037361 pathway Effects 0.000 claims 1
- 231100000027 toxicology Toxicity 0.000 claims 1
- 238000011065 in-situ storage Methods 0.000 abstract description 10
- 230000000694 effects Effects 0.000 abstract description 6
- 238000010219 correlation analysis Methods 0.000 abstract description 3
- 238000010206 sensitivity analysis Methods 0.000 abstract description 2
- 230000000875 corresponding effect Effects 0.000 description 12
- 230000004071 biological effect Effects 0.000 description 6
- 239000010949 copper Substances 0.000 description 6
- 238000011160 research Methods 0.000 description 5
- RYGMFSIKBFXOCR-UHFFFAOYSA-N Copper Chemical compound [Cu] RYGMFSIKBFXOCR-UHFFFAOYSA-N 0.000 description 4
- 238000004364 calculation method Methods 0.000 description 4
- 229910052802 copper Inorganic materials 0.000 description 4
- 238000013480 data collection Methods 0.000 description 4
- 231100000463 ecotoxicology Toxicity 0.000 description 4
- 239000003446 ligand Substances 0.000 description 4
- 230000007246 mechanism Effects 0.000 description 4
- 238000012795 verification Methods 0.000 description 4
- 210000002816 gill Anatomy 0.000 description 3
- 239000013535 sea water Substances 0.000 description 3
- 241000251468 Actinopterygii Species 0.000 description 2
- 241000276423 Fundulus heteroclitus Species 0.000 description 2
- 238000004617 QSAR study Methods 0.000 description 2
- 238000009825 accumulation Methods 0.000 description 2
- 231100000369 acute toxicity data Toxicity 0.000 description 2
- 230000002776 aggregation Effects 0.000 description 2
- 238000004220 aggregation Methods 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 230000002596 correlated effect Effects 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000000556 factor analysis Methods 0.000 description 2
- 229910021645 metal ion Inorganic materials 0.000 description 2
- 238000010200 validation analysis Methods 0.000 description 2
- OKTJSMMVPCPJKN-UHFFFAOYSA-N Carbon Chemical compound [C] OKTJSMMVPCPJKN-UHFFFAOYSA-N 0.000 description 1
- 241001327682 Oncorhynchus mykiss irideus Species 0.000 description 1
- 241000277331 Salmonidae Species 0.000 description 1
- 108010052164 Sodium Channels Proteins 0.000 description 1
- 102000018674 Sodium Channels Human genes 0.000 description 1
- 229910052793 cadmium Inorganic materials 0.000 description 1
- BDOSMKKIYDKNTQ-UHFFFAOYSA-N cadmium atom Chemical compound [Cd] BDOSMKKIYDKNTQ-UHFFFAOYSA-N 0.000 description 1
- 229910052799 carbon Inorganic materials 0.000 description 1
- 150000004649 carbonic acid derivatives Chemical class 0.000 description 1
- 150000001768 cations Chemical class 0.000 description 1
- 150000003841 chloride salts Chemical class 0.000 description 1
- 230000001684 chronic effect Effects 0.000 description 1
- 230000002301 combined effect Effects 0.000 description 1
- 230000000295 complement effect Effects 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 238000007429 general method Methods 0.000 description 1
- 238000000338 in vitro Methods 0.000 description 1
- -1 ion ion Chemical class 0.000 description 1
- 150000008040 ionic compounds Chemical class 0.000 description 1
- 238000013332 literature search Methods 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 239000012528 membrane Substances 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 239000002957 persistent organic pollutant Substances 0.000 description 1
- 230000001681 protective effect Effects 0.000 description 1
- 238000012552 review Methods 0.000 description 1
- 238000012502 risk assessment Methods 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 239000011734 sodium Substances 0.000 description 1
- 239000000243 solution Substances 0.000 description 1
- 238000005556 structure-activity relationship Methods 0.000 description 1
- 239000013589 supplement Substances 0.000 description 1
- 230000002194 synthesizing effect Effects 0.000 description 1
- 230000009897 systematic effect Effects 0.000 description 1
- 238000010998 test method Methods 0.000 description 1
- 150000003568 thioethers Chemical class 0.000 description 1
- 238000013417 toxicology model Methods 0.000 description 1
- 238000009602 toxicology test Methods 0.000 description 1
- 229910021654 trace metal Inorganic materials 0.000 description 1
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16C—COMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
- G16C20/00—Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
- G16C20/30—Prediction of properties of chemical compounds, compositions or mixtures
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16C—COMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
- G16C20/00—Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
- G16C20/20—Identification of molecular entities, parts thereof or of chemical compositions
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16C—COMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
- G16C20/00—Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
- G16C20/70—Machine learning, data mining or chemometrics
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16C—COMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
- G16C20/00—Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
- G16C20/90—Programming languages; Computing architectures; Database systems; Data warehousing
Landscapes
- Engineering & Computer Science (AREA)
- Computing Systems (AREA)
- Theoretical Computer Science (AREA)
- Chemical & Material Sciences (AREA)
- Crystallography & Structural Chemistry (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Databases & Information Systems (AREA)
- Software Systems (AREA)
- Medical Informatics (AREA)
- Health & Medical Sciences (AREA)
- Data Mining & Analysis (AREA)
- General Health & Medical Sciences (AREA)
- Evolutionary Computation (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Artificial Intelligence (AREA)
- Physics & Mathematics (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了一种重金属毒性终点和海洋水质基准阈值的预测方法,基于重金属结构参数和影响金属形态的海洋环境理化要素特征,建立多变量的定量结构‑毒性相关预测模型,实现了对海洋重金属“原位”毒性值的预测,并进一步将海洋中代表性水生生物的毒性预测值进行物种敏感度分析(SSD),获得保护95%海洋生物的基准阈值。以Sigmoldal‑Logistic模型对SSD曲线进行拟合,曲线拟合参数与毒性预测模型中自变量进行多元相关性分析,本发明建立基于重金属结构和环境要素特征的物种敏感度分析普适模型,“量身定制”不同海洋环境中重金属的基准阈值,解决了因忽视水化学特征对毒性的影响而导致预测结果不准确的问题。
Description
技术领域
本发明涉及海洋环境中重金属生物效应和风险评价领域,具体为基于重金属形态和生物有效性的一种重金属毒性终点和海洋水质基准阈值的预测方法。
背景技术
定量结构活性相关(QSAR)理论已取得重要进展,并在有机污染物的构效关系和毒性预测方面得到广泛应用。金属的定量构效关系研究始于上世纪七八十年代,但由于金属的形态和生物效应的复杂性,导致相关研究遇到了瓶颈,也是金属毒性预测领域的难点和挑战。例如,有效反映致毒机理的结构描述符难于获得,制约着QSAR在金属毒性预测中的应用。目前,获得金属毒性效应数据的唯一途径依然是通过传统毒理学试验测定,不仅耗费大量的人力、物力和财力,也必须面对生态伦理的挑战。进行金属定量构效关系和建模方法的研究对预测和评估生物效应具有广阔的应用前景。
近年来,随着金属形态分析技术的进步和对致毒机理的认识逐渐深入,为金属QSAR研究提供了克服瓶颈的新途径。基于致毒机理相同的科学假设,在相对理想的体系下,可以基于已有的QSAR模型经济、高效地实现一系列金属生物效应的纵向预测。目前的金属毒性预测技术基于金属的物理化学参数初步构建了一系列定量离子特征-毒性模型。然而,已报道的研究工作仅关注于金属自身的结构特点,而忽视了外界水化学条件对金属生物效应的影响,QSAR模型不能实现对不同环境条件下生物效应的横向预测。考虑到金属的形态和生物有效性对金属毒性的影响,已开发出生物配位体(Biotic Ligand model,BLM)模型。模型的主要思想是金属毒性以金属在生物敏感受体-鱼鳃上的累积过程模拟,包括金属形态和竞争性阳离子的防护效应。影响毒性的所有水化学特征包括在内,整合了金属离子与Ca2+、Na+、Mg2+、H+的竞争作用,与非生物配体DOC、氯化物、碳酸盐和硫化物结合。该模型比较全面地考虑了影响金属生物有效性的因素,与建立在硬度基础上的模型相比,生物配体模型具有更好的预测能力,是一个能够替代生物毒性试验预测金属毒性的有用工具。到目前为止,模型中最全面的数据是关于铜对虹鳟鱼的毒性。Playle等发现鳃膜上的钠离子通道是铜急性毒性效应的生物配位体,通过在宽泛水质条件范围内测定铜在鱼鳃表面的累积来校准BLM模型中铜的吸收。Rebort Santore发展了BLM模型,能够预测五种金属对五种水生生物的毒性效应。马义兵等对环境中金属BLM模型研究进展进行了较为全面的综述,并应用BLM模型预测我国多个水体的重金属毒性。Balistrieri等借鉴了生物配位体模型的原理,进一步预测了金属混合物对鳟鱼的复合毒性,同时指出温度、pH、主要离子浓度和溶解有机碳共同影响复合毒性。
但是BLM模型的应用也存在一些限制,主要包括以下方面:多数物种的BLM模型还未开发出来,相关的平衡系数有待率定和评估;针对不同物种的环境条件范围存在差异,超出范围时BLM模型不再适用;痕量金属的吸收要受生物学的控制,急性毒性的预测优于慢性。自然界的重金属并不是单独存在的,模型没有考虑多种重金属的复合效应对这种金属毒性的影响;针对特定金属开发的BLM模型,不能直接通过参数校正预测其他金属的毒性。因此,在BLM模型中引入金属结构特征参数,将有效扩展模型的应用范围。在不同外部环境条件下预测的毒性效应更贴近实际环境背景,使水生生物的保护更有针对性和科学性。
总体而言,以上方法只考虑海洋环境中金属离子结构特征与毒性的定量关系,忽视了环境理化要素特征对毒性的影响。对于重金属“原位”毒性的定量预测,缺乏系统的研究和可靠的预测方法。
发明内容
名称解释:
重金属“原位”毒性:区别于实验室人为设定条件下毒性测试获得的毒性阈值,“原位”毒性指水生模式生物在实际野外环境中开展毒性实验获得的毒性阈值,受环境理化要素的变化而改变。
海洋重金属“原位”毒性值:本发明的毒性数据都是在海水背景中测定完成的,并重点反映了温度和盐度两个指标对毒性阈值的影响。
本发明的目的在于提供一种基于重金属化学形态和海洋水体环境特征的重金属毒性终点和海洋水质基准阈值的预测方法,用以解决忽视了水化学特征对毒性的影响而导致预测结果不准确的问题。
为实现上述目的,本发明提出了海洋环境中重金属“原位”毒性和基准预测方法,基于重金属结构参数和影响金属形态的海洋环境理化要素特征,建立多变量的定量结构-毒性相关预测模型,预测海洋重金属“原位”毒性值。
进一步将海洋中代表性水生生物的毒性预测值进行物种敏感度分析(Speciessensitivity distribution analysis,SSDs),获得保护95%海洋生物的基准阈值。以Sigmoldal-Logistic模型对SSD曲线进行拟合,曲线拟合参数与毒性预测模型中多变量进行相关性分析,建立基于重金属结构和环境要素特征的物种敏感度分析普适模型,“量身定制”不同海洋环境中重金属的基准阈值。
基于重金属形态和生物有效性的生物毒性水质基准预测方法,包括以下步骤:
步骤a,毒性效应终点数据采集,筛选,汇总;
步骤b,通过单一变量的Pearson相关性分析,获得最优重金属结构描述符和海洋环境理化要素指标;
步骤c,构建多元海洋毒性预测模型及稳健性检验;
步骤d,模型验证;
随机从训练集中抽出一个数据,用其他的毒性数据和步骤c获得的最佳结构描述符建立多元回归模型,根据抽出数据的预测值与实验值的比较,来校验所建立的多元相关模型;
步骤e,基于海洋生态系统模式生物的定量结构-毒性相关模型,通过正交实验设计,计算典型重金属在不同温度和盐度条件下的急性毒性终点预测值;并利用得到的预测值构建物种敏感度分布曲线;拟合采用Sigmoidal-Logistic模型;
式中,a表示振幅,k表示曲线倾斜度,xc表示中间值;
步骤f,以软指数σp,温度T和盐度S为自变量,SSDs曲线拟合参数为因变量进行多元线性和非线性回归分析,构建定量相关关系模型;
步骤g,预测海洋急性基准阈值;
计算特定金属在不同温度、盐度条件下对应的SSDs方程,累计概率为0.05对应的剂量阈值为保护95%海洋水生生物免受的危害浓度阈值(HC5)。
优选地,所述步骤a具体包括以下步骤:
步骤a1、数据采集过程;
步骤a2、数据筛选过程:
数据筛选满足的条件为:1)重金属海洋生物急性毒性终点数据来源于科学引文索引期刊报道和美国环境保护局(U.S.EPA)生态毒理数据库;2)每个毒性数据必须包括科学,完整的试验条件参数,至少包括温度,酸度,硬度和盐度,不同水化学参数的范围是温度10~30℃之间,酸度5.5~8之间,硬度20~5000mg/L之间,盐度10~35‰;
3)包含美国环保局推荐的至少3门8科海洋物种类型,对于每种生物,至少包含6种金属的毒性试验数据;
4)毒性终点数据类型为致死率,表示为LC50;
步骤a3、数据运算过程;
以重金属的水溶液浓度为数据的衡量指标;
步骤a4,数据汇总过程:
最终得到的数据集包括金属分子式,受试生物类型,毒性效应类型,终点指标,试验条件,暴露时间和数据来源。
优选地,步骤b中所述重金属结构描述符包括软指数σp、单位电荷软指数σp/Z、原子序数AN、离子半径r、IP:ON态离子的离子势、IP(N+1):ON+1态离子的离子势、IP(N+1)和IP的差值ΔIP、原子量AW、鲍林电负性Xm、共价指数Xm 2r、原子电离势AN/ΔIP、第一水解常数|logKOH|、电化学势ΔE0;所述环境理化要素指标包括温度T,盐度S,酸度pH和硬度。
优选地,步骤b具体包括以下步骤:以毒性终点为因变量,各重金属对应的结构参数和环境理化要素指标为单一自变量进行线性Pearson相关性分析,根据公式(1)计算各重金属结构参数的Pearson相关系数r;
优选地,步骤c的具体方法为:
步骤c1,多元线性回归方程的构建与参数估计;
以步骤b中筛选出的最优结构参数和环境理化要素指标为自变量矩阵X,海洋金属实测水生毒性值为因变量矩阵Y,利用多元线性回归分析方法构建方程Y=XB+E,如公式(2):
式中,n为观测值个数;B代表未知参数;E代表随机误差项;
并采用最小二乘法对构建方程中参数进行估计,如公式(3)所示,:
其中,X′为X的转置矩阵;
步骤c2,拟合优度检验和回归方程的显著性检验;
步骤c3,判别标准:
根据毒性数据获取途径,体外实验R2≥0.81,体内试验R2≥0.64,显著水平为α,当p<α时,方程显著相关。
优选地,所述步骤c2按照下述公式计算:
优选地,步骤d的具体方法为:
步骤d1,在给定的建模样本中,抽取一个样本作为预测集,其余样本作为训练集建模,并计算该样本的预测误差;
步骤d2,记录每个方程中预测误差的平方加和,直到所有的样本都被预报了一次而且仅被预报一次;
步骤d3,计算交叉验证相关系数Q2 cv和交叉验证均方根误差RMSEcv;
判别依据:Q2 cv>0.6,R2-Q2 cv≤0.3。
优选地,步骤d3按以下公式计算:
优选地,步骤e中所述典型重金属包括Cd2+、Cr3+、Cu2+、Hg2+、Ni2+和Zn2+。
优选地,步骤e中拟合优度检验指标为相关系数的平方R2,F检验的指标为F值和相关概率p。
优选地,步骤f中SSDs曲线拟合参数包括振幅a,曲线倾斜度k和中间值xc。
本发明基于重金属结构参数和影响金属形态的海洋环境理化要素特征,建立多变量的定量结构-毒性相关预测模型,实现了对海洋重金属“原位”毒性值的预测,并进一步将海洋中代表性水生生物的毒性预测值进行物种敏感度分析(Species sensitivitydistribution analysis,SSDs),获得保护95%海洋生物的基准阈值。以Sigmoldal-Logistic模型对SSD曲线进行拟合,曲线拟合参数与毒性预测模型中多变量进行相关性分析,本发明建立基于重金属结构和环境要素特征的物种敏感度分析普适模型,“量身定制”不同海洋环境中重金属的基准阈值,解决了因忽视水化学特征对毒性的影响而导致预测结果不准确的问题。
相对现有的QSAR-SSD模型,本发明将变量维度从一维增加到三维,模型可同时定量化金属结构,温度,和盐度对海水毒性和基准的影响,获得的毒性预测值更加接近真实水环境中重金属对水生生物危害水平。环境管理部门可采用本发明的模型和基准值有的放矢地防控不同海域,不同环境背景下的重金属污染事件,更科学地保护海洋生态系统。
具体实施方式
以下结合具体实施例对本发明上述的和另外的技术特征和优点作更详细的说明。
本发明的原理是以已知毒性的重金属原子的结构特征和海洋环境理化要素为自变量,海洋水生生物急性毒性为因变量,采用多元线性回归方法建立定量相关关系模型,预测未知金属的“原位”毒性效应。进一步采用Sigmoldal-Logistic模型对海洋生态系统的模式生物毒性预测值进行物种敏感度分布分析和拟合,建立拟合参数与毒性预测方程中自变量的相关关系,获得基于重金属“原位”毒性的预测方程。累计概率为0.05对应的危害浓度值为保护95%水生生物物种免受伤害的基准阈值。
本发明是是综合重金属的致毒机理和生物有效性建立重金属“原位”毒性预测模型,并将其应用于预测重金属毒性终点和海洋水质基准阈值的一种方法。
本发明一种基于重金属形态和生物有效性的重金属毒性终点和海洋水质基准阈值的预测方法,该具体过程为:
步骤a,毒性效应终点数据采集,筛选,汇总;
步骤a1,数据采集过程;
步骤a2,数据筛选过程;数据筛选满足的条件为:
1)重金属海洋生物急性毒性终点数据来源于科学引文索引(SCI)期刊报道和美国环保局生态毒理(ECOTOX)数据库,数据有效期限为近20年;
2)每个毒性数据必须包括科学,完整的试验条件参数,至少包括温度,酸度,硬度和盐度,不同水化学参数的范围是温度10~30℃之间,酸度5.5~8之间,硬度(CaCO3 mg/L)20~5000mg/L之间,盐度10~35‰。
3)包含美国环保局(EPA)推荐的至少3门8科海洋物种类型,对于每种生物,至少包含6种金属的毒性试验数据;
4)毒性终点数据类型为致死率,表示为LC50;
步骤a3,数据运算过程;在本发明实施例中的运算方法为:
以重金属的水溶液浓度为数据的衡量指标,如单位为质量浓度除以分子量统一转化为微摩尔浓度,即μmol/L。
步骤a4,数据汇总过程:
最终得到的数据集包括金属分子式,受试生物类型,毒性效应类型,终点指标,试验条件,暴露时间,数据来源。
详细的毒性数据获取过程如下:
急性毒性数据优先采集自美国环境保护局(U.S.EPA)ECOTOX毒性数据库(http://cfpub.epa.gov/ecotox/)。如果毒性数据不足,以近20年SCI科学引文索引论文报道的有效数据(ISI Web of Knowledge)作为补充。通过数据库和文献检索引擎,输入金属名称、待测物种名称和急性毒性等关键词,导出满足条件的毒性数据集。在满足步骤a2条件的前提下,筛选出合格的毒性数据。以金属自由离子浓度为数据的衡量指标,如果原始数据以离子化合物质量为毒性终点指标。需除以分子量统一转化为微摩尔浓度,即μmol/L。在数据汇编过程中,记录金属种类,受试生物类型,毒性效应类型,终点指标,试验条件,暴露时间,数据来源等信息,整理成Excel表格作为建模依据。
以杂色鳉鱼(Cyprinodon variegatus)的急性毒性终点为例,进行数据筛选,运算和汇总,结果如表1所示。
表1 杂色鳉鱼急性毒性数据筛选,运算和汇总范例
步骤b,通过单一变量的Pearson相关性分析,获得最优重金属结构描述符和海洋环境理化要素指标。
其中,重金属的结构参数包括软指数σp、单位电荷软指数σp/Z、原子序数AN、离子半径r、IP:ON态离子的离子势、IP(N+1):ON+1态离子的离子势、IP(N+1)和IP的差值ΔIP、原子量AW、鲍林(Pauling)电负性Xm、共价指数Xm 2r、原子电离势AN/ΔIP、第一水解常数|logKOH|、电化学势ΔE0。环境理化要素指标包括温度T,盐度S,酸度pH和硬度(CaCO3,mg/L)。
步骤b,以毒性终点为因变量,各金属对应的结构参数和环境指标为单一自变量进行线性Pearson相关性分析,根据下述公式(1)计算相关系数r;
按照步骤b所述的方法,分别计算各结构参数的Pearson相关系数r2,如表2所示。
表2 各参数之间的Pearson相关系数
步骤c,构建多元海洋毒性预测模型及稳健性检验;
步骤c1,多元线性回归方程的构建与参数估计;
步骤b中筛选出的最优结构参数和环境指标为自变量矩阵X,海洋金属实测水生毒性值为因变量矩阵Y,利用多元线性回归分析方法构建方程Y=XB+E,见公式(2),其中:
n为观测值个数;B代表未知参数,是方程中需要通过最小二乘法进行估计的;E代表随机误差项,反映了除x1,x2对y的线性关系之外的随机因素对y的影响。
采用最小二乘法对方程中参数进行估计,X′为X的转置矩阵:
最小二乘回归是从误差拟合角度对回归模型进行参数估计,是一种标准的多元建模工具,尤其适用于预测分析。
步骤c2,拟合优度检验和回归方程的显著性检验(F检验);
步骤c3,判别标准:根据毒性数据获取途径,体外实验R2≥0.81,体内试验R2≥0.64。显著水平为α,当p<α时,方程显著相关。
步骤d,模型验证;
多元线性回归模型采用抽一法进行验证,方法的核心思想是随机从训练集中抽出一个数据,用其他的毒性数据和步骤c获得的最佳结构描述符建立多元回归模型,根据抽出数据的预测值与实验值的比较,来校验所建立的网络模型。为了减少交叉验证结果的可变性,对一个样本数据集进行多次不同的划分,得到不同的互补子集,进行多次交叉验证。
具体步骤如下:
步骤d1,在给定的建模样本中,抽取一个样本作为预测集,其余样本作为训练集建模,并计算该样本的预测误差;
步骤d2,记录每个方程中预测误差的平方加和,直到所有的样本都被预报了一次而且仅被预报一次;
步骤d3,计算交叉验证相关系数Q2 cv和交叉验证均方根误差RMSEcv,计算公式如下所述;判别依据:Q2 cv>0.6,R2-Q2 cv≤0.3;
方程(7)、(8)是抽一法内部验证的指示参数,可有效降低模型对训练集数据的过拟合,测定训练集中有无特定金属对模型稳健性的影响。
采用本发明步骤d所述的方法对模型进行内部验证。以预测方程log-C=(5.454±2.841)+(-0.211±0.071)T+(-0.031±0.008)S+(13.769±10.322)σp为例,对模型进行抽一法内部验证,相关拟合参数见表3。根据步骤d3中的公式(7)和(8),计算Q2 cv=0.8773,RMSEcv=0.2935,R2-Q2 cv=0.946-0.8773=0.0687。满足模型稳健性判别依据Q2 cv>0.6,R2-Q2 cv≤0.3,该模型通过内部验证。
表3 抽一法内部验证结果
步骤e,基于海洋生态系统模式生物(五门八科)的定量结构-毒性相关模型,通过正交实验设计,计算六种典型重金属(Cd2+、Cr3+、Cu2+、Hg2+、Ni2+和Zn2+)在不同温度(10,14,18,22,26,30℃)和盐度(10,15,20,25,30,35‰)条件下的急性毒性终点预测值。预测值用于构建物种敏感度分布曲线,拟合采用Sigmoidal-Logistic模型。
其中,a表示振幅,k表示曲线倾斜度,xc表示中间值。
拟合优度检验方法同步骤c2,相关系数的平方(R2),多因子方差分析(Multi-ANOVA)计算得到的F值和相关概率P值。
表4.正交实验条件下的物种敏感度分布曲线拟合结果
步骤f,以软指数σp,温度T和盐度S为自变量,SSDs曲线拟合参数(a,k和xc)为因变量进行多元线性和非线性回归分析,构建定量相关关系模型。
根据表5中各参数数值,a为常量,σp,T,S与xc成线性相关,σp,T,S与k成非线性相关。具体计算结果为:
a=0.9195±0.0465
xc=(-1.77±0.068)-(0.0501±0.0012)T-(0.0022±0.0001)S+(53.0±0.311)σp
k=-681σp2+119σp-0.704T/S-0.005S/σp-1.65
步骤g,预测海洋急性基准阈值。
具体过程为,计算特定金属在不同温度、盐度条件下对应的SSDs方程,累计概率为0.05对应的剂量阈值为保护95%海洋水生生物免受的危害浓度阈值(HC5)。
以金属镉为例,在海水表层温度25℃,盐度20‰环境条件下,将对应的软指数σp为0.081。根据步骤f公布的计算方法,计算SSD曲线的拟合参数为:
xc=(-1.77±0.068)-(0.0501±0.0012)T-(0.0022±0.0001)S+(53.0±0.311)σp
=-1.77-0.0501×25-0.0022×20+53×0.081
=1.218
k=-681σp2+119σp-0.704T/S-0.005S/σp-1.65
=-681×0.0812+119×0.081-0.704×25/20-0.005×20/0.081-1.65
=1.404
以上是结合具体实施例对本发明进一步的描述,但这些实施例仅仅是范例性的,并不对本发明的范围构成任何限制。本领域技术人员应该理解的是,在不偏离本发明的精神和范围下可以对本发明技术方案的细节和形式进行修改或替换,但这些修改和替换均落入本发明的保护范围内。
Claims (9)
1.一种重金属毒性终点和海洋水质基准阈值的预测方法,其特征在于,包括以下步骤:
步骤a,毒性效应终点数据采集,筛选,汇总;
步骤b,通过单一变量的Pearson相关性分析,获得最优重金属结构描述符和海洋环境理化要素指标;
步骤c,构建多元海洋毒性预测模型及稳健性检验;
步骤d,模型验证;
随机从训练集中抽出一个数据,用其他的毒性数据和步骤c获得的最佳结构描述符建立多元回归模型,根据抽出数据的预测值与实验值的比较,来校验所建立的多元线性模型;
步骤e,基于海洋生态系统模式生物的定量结构-毒性相关模型,通过正交实验设计,计算典型重金属在不同温度和盐度条件下的急性毒性终点预测值;并利用得到的预测值构建物种敏感度分布曲线;拟合采用Sigmoidal-Logistic模型;
式中,а表示振幅,k表示曲线倾斜度,xc表示中间值;
步骤f,以软指数σp,温度T和盐度S为自变量,SSDs曲线拟合参数为因变量进行多元线性和非线性回归分析,构建定量相关关系模型;
步骤g,预测海洋急性基准阈值;
计算特定金属在不同温度、盐度条件下对应的SSDs方程,累计概率为0.05对应的剂量阈值为保护95%海洋水生生物免受的危害浓度阈值HC5。
2.根据权利要求1所述的预测方法,其特征在于,所述步骤a具体包括以下步骤:
步骤a1、数据采集过程;
步骤a2、数据筛选过程:数据筛选满足的条件为:
1)重金属海洋生物急性毒性终点数据来源于科学引文索引期刊报道和美国环境保护局生态毒理数据库;
2)每个毒性数据必须包括科学,完整的试验条件参数,至少包括温度,酸度,硬度和盐度,不同水化学参数的范围是温度10~30℃之间,酸度5.5~8之间,硬度20~5000mg/L之间,盐度10~35‰;
3)包含美国环保局推荐的至少3门8科海洋物种类型,对于每种生物,至少包含6种金属的毒性试验数据;
4)毒性终点数据类型为致死率,表示为LC50;
步骤a3、数据运算过程;
以重金属的水溶液浓度为数据的衡量指标;
步骤a4,数据汇总过程:
最终得到的数据集包括金属分子式,受试生物类型,毒性效应类型,终点指标,试验条件,暴露时间和数据来源。
3.根据权利要求1所述的预测方法,其特征在于,步骤b中所述重金属结构描述符包括软指数σp、单位电荷软指数σp/Z、原子序数AN、离子半径r、IP:ON态离子的离子势、IP(N+1):ON+1态离子的离子势、IP(N+1)和IP的差值ΔIP、原子量AW、鲍林电负性Xm、共价指数Xm 2r、原子电离势AN/ΔIP、第一水解常数|logKOH|、电化学势ΔE0;所述环境理化要素指标包括温度T,盐度S,酸度pH和硬度。
5.根据权利要求1所述的预测方法,其特征在于,步骤c的具体方法为:
步骤c1,多元线性回归方程的构建与参数估计;
以步骤b中筛选出的最优结构参数和环境理化要素指标为自变量矩阵X,海洋金属实测水生毒性值为因变量矩阵Y,利用多元线性回归分析方法构建方程Y=XB+E,如公式(2):
式中,n为观测值个数;B代表未知参数;E代表随机误差项;
并采用最小二乘法对构建方程中参数进行估计,如公式(3)所示:
其中,X′为X的转置矩阵;
步骤c2,拟合优度检验和回归方程的显著性检验;
步骤c3,判别标准:
根据毒性数据获取途径,体外实验R2≥0.81,体内试验R2≥0.64,显著水平为α,当p<α时,方程显著相关。
7.根据权利要求1所述的预测方法,其特征在于,步骤d的具体方法为:
步骤d1,在给定的建模样本中,抽取一个样本作为预测集,其余样本作为训练集建模,并计算该样本的预测误差;
步骤d2,记录每个方程中预测误差的平方加和,直到所有的样本都被预报了一次而且仅被预报一次;
步骤d3,计算交叉验证相关系数Q2 cv和交叉验证均方根误差RMSEcv;
判别依据:Q2 cv>0.6,R2-Q2 cv≤0.3。
9.根据权利要求1所述的预测方法,其特征在于,步骤e中所述典型重金属为Cd2+、Cr3+、Cu2+、Hg2+、Ni2+和Zn2+。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010322812.3A CN111554358A (zh) | 2020-04-22 | 2020-04-22 | 一种重金属毒性终点和海洋水质基准阈值的预测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010322812.3A CN111554358A (zh) | 2020-04-22 | 2020-04-22 | 一种重金属毒性终点和海洋水质基准阈值的预测方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN111554358A true CN111554358A (zh) | 2020-08-18 |
Family
ID=72007573
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010322812.3A Pending CN111554358A (zh) | 2020-04-22 | 2020-04-22 | 一种重金属毒性终点和海洋水质基准阈值的预测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111554358A (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112489736A (zh) * | 2020-12-09 | 2021-03-12 | 中国石油大学(北京) | 一种矿物含量分析方法、装置、设备及存储介质 |
CN113917101A (zh) * | 2021-10-09 | 2022-01-11 | 中国人民大学 | 流域水环境中铜的慢性毒性预测与长期基准推导方法 |
CN113917102A (zh) * | 2021-10-09 | 2022-01-11 | 中国人民大学 | 通过参数校正获取铜短期水质基准的方法 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104820873A (zh) * | 2015-05-13 | 2015-08-05 | 中国环境科学研究院 | 一种基于金属定量构效关系的淡水急性基准预测方法 |
CN105447248A (zh) * | 2015-11-24 | 2016-03-30 | 中国环境科学研究院 | 基于金属定量构效关系的海水急性基准预测方法 |
-
2020
- 2020-04-22 CN CN202010322812.3A patent/CN111554358A/zh active Pending
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104820873A (zh) * | 2015-05-13 | 2015-08-05 | 中国环境科学研究院 | 一种基于金属定量构效关系的淡水急性基准预测方法 |
CN105447248A (zh) * | 2015-11-24 | 2016-03-30 | 中国环境科学研究院 | 基于金属定量构效关系的海水急性基准预测方法 |
Non-Patent Citations (1)
Title |
---|
郄玉: "重金属水生生物毒性和基准预测模型研究", 《中国优秀硕士学位论文全文数据库 工程科技I辑》 * |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112489736A (zh) * | 2020-12-09 | 2021-03-12 | 中国石油大学(北京) | 一种矿物含量分析方法、装置、设备及存储介质 |
CN113917101A (zh) * | 2021-10-09 | 2022-01-11 | 中国人民大学 | 流域水环境中铜的慢性毒性预测与长期基准推导方法 |
CN113917102A (zh) * | 2021-10-09 | 2022-01-11 | 中国人民大学 | 通过参数校正获取铜短期水质基准的方法 |
CN113917101B (zh) * | 2021-10-09 | 2024-01-12 | 中国人民大学 | 流域水环境中铜的慢性毒性预测与长期基准推导方法 |
CN113917102B (zh) * | 2021-10-09 | 2024-01-12 | 中国人民大学 | 通过参数校正获取铜短期水质基准的方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN104820873B (zh) | 一种基于金属定量构效关系的淡水急性基准预测方法 | |
Shi et al. | A brief review and evaluation of earthworm biomarkers in soil pollution assessment | |
CN111554358A (zh) | 一种重金属毒性终点和海洋水质基准阈值的预测方法 | |
Edgar et al. | Broad-scale effects of marine salmonid aquaculture on macrobenthos and the sediment environment in southeastern Tasmania | |
CN105069315A (zh) | 基于金属形态和有效性的水生生物毒性预测方法 | |
Horrigan et al. | Response of stream macroinvertebrates to changes in salinity and the development of a salinity index | |
CN102313722B (zh) | 一种基于多元线性回归的煤质工业分析方法 | |
Rodil et al. | Tracking environmental stress gradients using three biotic integrity indices: advantages of a locally-developed traits-based approach | |
CN105447248A (zh) | 基于金属定量构效关系的海水急性基准预测方法 | |
CN104915563B (zh) | 基于金属定量构效关系的淡水慢性基准预测方法 | |
De Jonge et al. | The use of invertebrate body burdens to predict ecological effects of metal mixtures in mining-impacted waters | |
CN103712939B (zh) | 一种基于紫外可见光谱的污染物浓度拟合方法 | |
CN106650020A (zh) | 一种复合受体模型污染源解析方法 | |
Arvidsson et al. | Influence of natural organic matter on the aquatic ecotoxicity of engineered nanoparticles: Recommendations for environmental risk assessment | |
Arhonditsis et al. | Application of Bayesian structural equation modeling for examining phytoplankton dynamics in the Neuse River Estuary (North Carolina, USA) | |
Turley et al. | Evaluation of a fine sediment biomonitoring tool across a wide range of temperate rivers and streams | |
Dou et al. | Influence of environmental variables on macroinvertebrate community structure in Lianhuan Lake | |
Yates et al. | Interspecific allometric scaling in eDNA production among northwestern Atlantic bony fishes reflects physiological allometric scaling | |
Edgar et al. | Application of biotic and abiotic indicators for detecting benthic impacts of marine salmonid farming among coastal regions of Tasmania | |
CN117875573B (zh) | 一种基于生物毒性和生物有效性的水环境评价方法和系统 | |
CN110910970A (zh) | 一种通过建立qsar模型预测化学品以斑马鱼胚胎为受体的毒性的方法 | |
Rashleigh et al. | Biological assessment of streams and rivers in US-design, methods, and analysis | |
Liu et al. | Comparison Between Environmental DNA Metabarcoding and Traditional Survey Method to Identify Community Composition and Assembly of Stream Fish | |
Chung et al. | Comparison of the estimation methods from acute to chronic biotic ligand model‐based predicted no‐effect concentrations for nickel in freshwater species | |
Jin et al. | Characterization and source-apportionment of synergistic ecotoxicities of multiple pollutants based on a biosensor-biospectroscopy coupling (BBC) test battery approach |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20200818 |
|
RJ01 | Rejection of invention patent application after publication |