CN102323973A - 一种基于智能相关指数对常见环境毒物性质/活性预测方法 - Google Patents

一种基于智能相关指数对常见环境毒物性质/活性预测方法 Download PDF

Info

Publication number
CN102323973A
CN102323973A CN201110145336A CN201110145336A CN102323973A CN 102323973 A CN102323973 A CN 102323973A CN 201110145336 A CN201110145336 A CN 201110145336A CN 201110145336 A CN201110145336 A CN 201110145336A CN 102323973 A CN102323973 A CN 102323973A
Authority
CN
China
Prior art keywords
correlation
intelligent
character
poisonous substance
activity
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201110145336A
Other languages
English (en)
Other versions
CN102323973B (zh
Inventor
仝建波
李云飞
车挺
刘淑玲
周鹏
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shaanxi University of Science and Technology
Original Assignee
Shaanxi University of Science and Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shaanxi University of Science and Technology filed Critical Shaanxi University of Science and Technology
Priority to CN 201110145336 priority Critical patent/CN102323973B/zh
Publication of CN102323973A publication Critical patent/CN102323973A/zh
Application granted granted Critical
Publication of CN102323973B publication Critical patent/CN102323973B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明涉及一种新型的基于智能相关指数的环境毒物分子性质/活性的预测方法,适用于根据环境毒物化合物分子结构信息预测其在环境中的性质/活性。该方法包括如下步骤:1)定义原子类型,将原子按照其支化度化分为4类;2)依据所研究环境毒物分子的结构特征由用户自己定义非氢原子的性质相关参数(PCP)、距离关系函数(DCF);3)确定智能相关函数;4)智能相关指数(ICI)的计算;5)根据统计结果得到最佳预测模型。经验证本发明的环境毒物分子结构表征方法具有物化意义明确、可调节、结构表征能力强、拓展性能好的优点,在多类环境毒物分子的定量构效预测研究中取得了良好的效果。

Description

一种基于智能相关指数对常见环境毒物性质/活性预测方法
技术领域
本发明涉及一种分子定量结构-性质/活性相关研究方法,特别是一种新颖分子结构表征方法的设计应用,即一种基于智能相关指数对常见环境毒物性质/活性的预测方法。
背景技术
人们在长期的实践中认识到:分子是构成物质的基本单位,物质的许多理化性质以及生物活性都是以分子为主体来表示和解释的。分子结构一经确定,其性质也随之而定。分子结构表征(Molecular Structural Characterization,MSC)是当代环境评价与药物设计中不可缺少的重要技术,同时也是定量构效关系(Quantitative Structure Property/Activity Relationship,QSP/AR)研究中所涉及到的第一个主要环节。其核心思想是将一个分子结构性质特征转化为一组数值代码,并使这个参数化结构表达过程中信息流失达到最小。近几年发展起来的利用化合物结构参数预测各种有害物质性质的定量结构毒性关系(QSTR)技术是有效工具。通常环境毒物分子结构表征方法分为拓扑图论描述子、物化性质参数和量子化学指数等几类途径。其中,拓扑描述子是一种完全不同于其他形式的QSP/AR表征工具,它基于分子图中的拓扑不变量将环境毒物化合物转化为一组具有数学抽象意义的特征参数,从而实现纯理论层面上的分子结构表征。自从1947年Winer提出W指数[Winer,H.J.Am.Chem.Soc.1947,69:2636]以来,至今已出现了两百余种分子拓扑描述子,一般可以按数值类型和复杂程度将这些描述子大致分为三代:第一代拓扑描述子通常是对分子顶点不变量进行简单操作得到的整型量,如上述W指数以及Hosoya提出的Z指数[Hosoya,H.Bull.Chem.Soc.1971,44:2332]等;第二代拓扑描述子是通过对分子整型拓扑不变量进行较复杂变换得到的实型量,如Randic提出的分子连接指数χ[Randic,M.J.Am.Chem.Soc.1975,97:6609]和Balaban提出的J指数[Balaban,A.T.Chem.Phys.Lett.1982:89]等;第三代拓扑描述子是将实型顶点不变量通过复杂的变换转化为一组实型矢量,如Kier和Hall提出的mχv指数[Kier L B,Hall L H.Molecular connectivityin structure-activity analysis.New York:J Wiley & Sons,1986]等。由此可以看到,用来表达环境毒物分子结构的拓扑描述子经历了一个由简单到复杂、从单一到多样的变化过程,并且正向着通用性、多元化和易解释性等方向发展。然而,传统的拓扑描述子仅仅从分子图形特征提取信息,没有很好地考虑到环境毒物化合物自身性质与纯数学图之间的联系和差异,这样就造成了大量信息的浪费及干扰因素的引入。如何将环境毒物的化学特征以及理化性质包含在拓扑指数中,建立一种可以由用户(使用者)自己定义和根据需要扩充的环境毒物分子结构表征方法,并将其应用到环境毒物的性质/活性的预测成为发展趋势。
发明内容
基于以上现状,为了解决上述问题,本发明的目的是提供了一种基于智能相关指数表达环境毒物分子结构的方法。该方法能够用于常见的环境毒物的定量结构-性质/活性相关研究,预测出环境毒物性质/活性值。
本发明是通过以下技术方案来解决的:
一种基于智能相关指数对常见环境毒物性质/活性的预测方法,该方法包括下述步骤:
1)根据环境毒物分子结构性质特征定义性质相关参数(PropertyCorrelative Parameter,PCP)、距离关系函数(Distance Correlative Function,DCF);
2)根据定义的性质相关参数PCP、距离关系函数DCF获得智能相关函数(Intelligent Correlative Function,ICF);
3)由智能相关函数ICF与原子支化度获得智能相关指数(IntelligentCorrelative Index,ICI)进行环境毒物分子结构参数化计算;
4)在环境毒物分子实测的实验活性值与环境毒物分子结构参数化计算值间运用多元线性回归、偏最小二乘方法进行数学建模;
5)构建环境毒物分子结构与性质/活性间关系的数学模型;
6)在构建环境毒物分子数学模型中获得留一法交互检验复相关系数Qcum’;
7)调整智能相关指数(ICI)值,重复步骤2)-5),得到Qcum”,……
8)在多个Qcum值中选取最大复相关系数Qcum
9)由对应最大复相关系数Qcum的数学模型,确定最佳对环境毒物性质/活性的预测模型,用于预测没有经过实验测定的同类型有机毒物的相关性质/活性。
本发明的进一步特征在于:
所述定义性质相关参数PCP包括定义原子量、范德瓦尔斯体积、电负性、疏水性和杂化状态5种参数。用户可依据所研究环境毒物分子的结构特征从以上5种性质相关参数中选取对所研究环境毒物分子性质/活性影响较大的几种作为性质相关参数。
所述定义距离关系函数DCF,包括下述内容:
对于给定分子结构,由用户自己从以下3种函数中选取其中一种距离关系函数:
①高斯Gaussian形距离关系函数:
f(α;dij)=exp(-α·dij 2)    (1)
α为确定该函数的参数;dij为i,j两原子间的距离量度;
②倒数(Reciprocal)形距离关系函数:
f ( α ; d ij ) = 1 d ij α - - - ( 2 )
α为确定该函数的参数;dij为i,j两原子间的距离量度;
③指数(Exponential)形距离关系函数:
f ( α ; d ij ) = α - d ij - - - ( 3 )
α为确定该函数的参数;dij为i,j两原子间的距离量度。
所述根据定义的性质相关参数PCP、距离关系函数DCF获得智能相关函数ICF,通过下式实现:
I(α;ηi,ηj,dij)=ηi·ηj·f(α;dij)    (4)
其中α为确定该函数的参数集;ηi和ηj为i,j两原子的性质相关参数;dij为i,j两原子的某种距离量度;f(dij;α)为距离关系函数(DCF);α为确定该函数的参数;dij为i,j两原子间的某种距离量度。
所述由智能相关函数ICF与原子支化度获得智能相关指数ICI,通过下式实现:
Figure BDA0000065348400000043
其中η和I(α;ηi,ηj,dij)分别为用户具体选定的某种原子性质相关参数和智能相关函数;dij表示i,j两原子之间的最短相对键距。
所述利用智能相关指数(ICI)进行分子结构参数化计算,包括下述步骤:
1)首先按原子支化度将环境毒物分子的非氢原子分为4类,仅甲烷为0除外;
2)依据所研究环境毒物分子的结构特征由用户从原子量、范德瓦尔斯体积、电负性、疏水性和杂化状态5种性质相关参数PCP中选取对所研究环境毒物分子性质/活性影响较大的性质相关参数;
3)对于给定分子结构,由用户自己从高斯Gaussian形、倒数形和指数形3种距离关系函数中选取合适的距离关系函数来确定智能相关函数;
4)通过上步中确定的智能相关函数获得智能相关指数;
5)依据扫描的距离函数参数α的变化情况,从而得到相关性最佳的α值,建立预测环境毒物性质/活性的最佳模型。
本发明的有益效果是:
传统的拓扑描述子仅仅从环境毒物分子图形特征提取信息,没有很好地考虑到环境毒物化合物自身性质与纯数学图之间的联系和差异,这样就造成了大量信息的浪费及干扰因素的引入。本发明将环境毒物的化学特征以及理化性质包含在拓扑指数中,建立一种可以由用户(使用者)自己定义和根据需要扩充的环境毒物分子结构表征方法,并应用于对部分环境毒物的性质/活性的预测中,取得了良好的预测效果。
附图说明
图1为预测常见环境毒物性质活性的流程示意图。
图2为对于多氯联苯类化合物(PCBs)采用高斯形距离关系函数所建立模型的留一法交叉检验复相关系数与函数参数α的变化情况。
图3为33个多氯联苯类化合物(PCBs)水溶性(pS)的预测值和实验值的相关散点图。
图4为对于烃类化合物采用高斯形距离关系函数所建立模型的留一法交叉检验复相关系数与函数参数α的变化情况。
图5为45个烃类化合物正辛醇/水分配系数(logKsw)的预测值和实验值的相关散点图。
图6为对于烃基酚类化合物采用高斯形距离关系函数所建立模型的留一法交叉检验复相关系数与函数参数α的变化情况。
图7为41个烃基酚类化合物对梨形四膜虫的水生急性毒性的预测值和实验值的相关散点图。
具体实施方式
下面通过具体实施例对本发明做进一步详细说明。
本发明基于智能相关指数对常见环境毒物性质/活性的预测方法,包括下述步骤:
1)根据环境毒物分子结构性质特征定义性质相关参数PCP和距离关系函数DCF;
所述定义性质相关参数PCP,包括下述内容:
定量结构-性质/活性关系(QSP/AR)研究中所面临的目标变量(化合物物化性质或生物活性)是千差万别的,如何保证环境毒物分子结构表征方法所提取的特征参数尽可能地与具体目标问题直接关联,这是决定解决问题的关键,也是在实际应用中诸多分子表征方法没有很好解决的一个难题。我们认为,由用户根据其所要研究问题的特点自己定义初始参数,在此基础上进一步通过某种统一规则来建立整体环境毒物分子描述子是解决上述难题的一个可行办法。众所周知,原子是分子的基本组成单位,一个化合物所表现出的外在性质可以从组成其原子水平上得到反映,因此在智能相关指数(ICI)中首先要求用户自己定义非氢原子的性质相关参数(Property CorrelativeParameter,PCP),这种定义没有明确限制,可以是原子的基本属性或各类特征参数,甚至是观测得到的实验数据(如化学位移等),其目的是与所研究的实际问题尽量相关。
几类常见的性质相关参数:
①原子量(Atomic Weight):原子量是反映分子整体质量的一个指标,也是一个非常基本的原子属性;
②范德瓦尔斯体积(van der Waals volume):分子的整体体积在一定程度上可以由组成其原子的范德瓦尔斯体积得到体现,同时范德瓦尔斯体积也是一个基本的原子参数;
③电负性(Electronegativity):电负性可以间接表现出分子内部的电荷分布情况以及局部偶极特征;
④疏水性(Hydrophobicity):诸多研究表明分子的水溶性可以由组成其原子片段疏水性线性加和得到,与前面三种性质不同之处在于原子疏水性不但与原子种类有关,还与原子的杂化状态以及所处环境有关;
⑤杂化状态(Hybridization State):原子处于不同杂化时其化学性质具有很大差异,但是至今还没有一个统一指标来度量原子的杂化状态。我们对Kier和Hall提出的原子固有状态(I)进行改造,从原子的电子结构角度出发得到了一种用于反映原子杂化状态的参数:原子杂化状态指数(AtomicHeterocyclic State Index,AHSI),计算式如下:
AHSI = v / 4 · ( ( 2 / n ) 2 δ σ + π + 1 ) / δ σ
其中v是原子价电层的电子数;n为该原子价电层所属的主量子数;δσ+π是原子参与成σ和π键的总电子数;δσ为成σ键的电子数。上述定义比Hall和Kier的原始定义多了一个(v/4)1/2系数以及在δσ+π和δσ值的计算中没有减去该原子与氢成键的电子数。这样就完全不考虑原子所处环境因素,而重点放在了杂化类型的表达上。需要说明的是由于各类性质之间单位上的不统一使得计算出的分子描述子在数量级上差别较大,因此我们以sp3杂化的碳原子作为标准原子,并将其他原子的性质相关参数与其比值称为相对性质相关参数(Relative Property Correlative Parameter,RPCP),并直接使用该参数进行智能相关指数的计算。表1和2列出了有机化合物中几类常见原子的性质相关参数和相对性质相关参数。
表1.几类常见原子的原子量、范德瓦尔斯体积和鲍林电负性以及它们的相对值
Figure BDA0000065348400000082
Figure BDA0000065348400000091
表2.几类常见原子的杂化状态指数(AHSI)和其相对值(RAHSI)
Figure BDA0000065348400000092
所述定义距离关系函数DCF,包括下述内容:
下面给出几种常见的距离关系函数(Distance Correlative Function,DCF):
①高斯Gaussian形距离关系函数:
f(α;dij)=exp(-α·dij 2)  (1)
α为确定该函数的参数;dij为i,j两原子间的距离量度;
②倒数(Reciprocal)形距离关系函数:
f ( α ; d ij ) = 1 d ij α - - - ( 2 )
α为确定该函数的参数;dij为i,j两原子间的距离量度;
③指数(Exponential)形距离关系函数:
f ( α ; d ij ) = α - d ij - - - ( 3 )
α为确定该函数的参数;dij为i,j两原子间的距离量度。
距离关系函数的形式可由用户根据具体问题从3种函数中选取其中一种加以定义。
2)根据定义的性质相关参数PCP、距离关系函数DCF获得智能相关函数ICF;
所述获得智能相关函数ICF,包括下述内容:
通过表达分子中不同类别原子之间的性质关联程度来间接反映分子的整体性质是智能相关指数(ICI)的中心思想。这种关联并不是原子间的某种具体作用方式,而是要反映出相关程度随距离增减呈反向变化以及随原子性质改变呈正向变化的两方面趋势。上述假设提供了智能相关函数(IntelligentCorrelative Function,ICF)的定义形式:满足相关性随原子性质及距离分别成正、反向变化的函数集合。其通式为:
I(α;ηi,ηj,dij)=ηi·ηj·f(α;dij)  (4)
其中α为确定该函数的参数集;ηi和ηj为i,j两原子的性质相关参数;dij为i,j两原子的某种距离量度;f(dij;α)为距离关系函数(DCF);α为确定该函数的参数。很显然,上式规定了原子相关程度与其性质η成正比,而与距离d存在某种函数依赖关系却没有明确给出,因此只要满足相关程度与距离成反向变化(即dij增加,i,j两原子的相关性下降)的所有函数f(α;dij)都可以作为距离关系函数(DCF)。
3)由智能相关函数和原子支化度获得智能相关指数进行环境毒物分子结构参数化计算;
所述定义原子支化度,包括下述内容:
“结构决定性质,性质反映结构”这是QSP/AR研究中的基本思想。将一个环境毒物分子隐氢后抽象为一个非染色图,其结构特征仅仅表现为顶点(原子)的连接方式。从拓扑学角度来看,每一个顶点所连接其他顶点的数量不同标志着该顶点分支程度的差异,它能直接反映图中局部拓扑特征。因此我们首先定义原子支化度(Atomic Branched Degree,ABD)为环境毒物分子中原子键连非氢原子的数目。很显然,对于一个环境毒物分子而言其原子支化度变化范围为1~4(仅甲烷为0除外)。
所述定义智能相关指数ICI,包括下述内容:
按原子支化度(ABD)将环境毒物分子中各原子分为伯、仲、叔、季4类,从而可以得到不同类型原子之间的10种相关项(表3),并统称为智能相关指数(Intelligent Correlative Index,ICI)。其具体计算公式为:
Figure BDA0000065348400000111
其中η和I(α;ηi,ηj,dij)分别为用户具体选定的某种原子性质相关参数和智能相关函数;dij表示i,j两原子之间的最短相对键距(Shortest RelativeBond-Distance),即连接两原子间所有化学路径中最短一条与C-C单键键长的比值。另外,单个化学键与C-C单键键长的比值称为该化学键的相对键长(Relative Bond-Length)。
需要说明的是这里“智能”二字包含着两层含义:
①性质相关程度并不是一般意义上的原子之间物理量作用大小,而是指原子性质的某种关联度,它间接反映了原子间的物理作用以及其他一些隐含信息;
②智能相关函数具有普适性,即在实际应用中一个恰当的相关函数可以代表任意类型的性质相关。
表3.有机分子中原子支化度不同的4类原子以及它们之间的10种原子相关项
Figure BDA0000065348400000121
所述利用智能相关指数(ICI)进行分子结构参数化计算,包括下述步骤:
①首先按原子支化度将环境毒物分子的非氢原子分为4类(仅甲烷为0除外);
②依据所研究环境毒物分子的结构特征由用户从原子量、范德瓦尔斯体积、电负性、疏水性和杂化状态5种性质相关参数(Property CorrelativeParameter,PCP)中选取对所研究环境毒物分子性质/活性影响较大的性质相关参数;
③对于给定分子结构,由用户自己从Gaussian形、倒数形和指数形3种距离关系函数中选取合适的距离关系函数来确定智能相关函数;
④通过上步中确定的智能相关函数计算智能相关指数;
⑤依据扫描的距离函数参数α的变化情况,从而得到相关性最佳的α值,建立预测环境毒物性质/活性的最佳模型。
4)在环境毒物分子实测的实验活性值与环境毒物分子结构参数化计算值间运用多元线性回归、偏最小二乘建模方法进行数学建模;
5)构建环境毒物分子结构与性质/活性间关系的数学模型;
6)在构建环境毒物分子性质/活性间关系的数学模型中获得留一法交互检验复相关系数(Qcum)’;
7)调整智能相关指数(ICI)值,重复步骤2)-5),得到(Qcum)”,……
8)在多个(Qcum)值中选取最大复相关系数(Qcum);
9)由对应最大复相关系数(Qcum)的数学模型,确定最佳对环境毒物性质/活性的预测模型。用于预测没有经过实验测定的同类型有机毒物的相关性质/活性。
下面通过智能相关指数在几类有机物性质/活性预测中的具体实施例对本发明做进一步说明。
将智能相关指数(ICI)分别对33个多氯联苯类化合物(PCBs)、45个烃类化合物、41个烃基酚类化合物共3类环境毒物的结构进行表征,选用说明书中提到的5种性质相关参数,每个化合物可得到50个描述子,并与其相应的性质/活性建立多元线性回归模型,从而验证智能相关指数(ICI)在环境毒物分子定量结构-性质/活性关系研究的有效性。
①33个多氯联苯类化合物(PCBs)及其对水溶性(pS)的QSPR研究
随机选取5个化合物为测试集样本,并以剩余的28个作为训练集样本,经多元线性回归(MLR)、留一法交互检验复相关系数(Qcum)为目标函数通过计算机逐点扫描确定α=1.9的高斯(Gaussian)形距离关系函数(DCF)具有最佳性质相关性(如图2),故以此为基础进行变量筛选,所得5个最优结构描述子,此时所得回归模型为:
pS=5.248+168.963×X(43)-1.623×X(38)+1853.796×X(32)+21360.490×X(12)-9735.178×X(2)
模型相关统计量为:样本数(N)为28,复相关系数(Rcum)为0.968,标准差(SD)为0.422,统计量(F)为64.872,留一法交互检验的复相关系数(Qcum),标准差(SDCV)和统计量(FCV)分别为0.946,0.541和37.635。进一步对模型外部5个化合物组成的测试集样本预测诊断,计算出外部检验的复相关系数(Qext)为0.866,实验值和预测值的相关性如图3所示。
②45个烃类化合物及其对正辛醇/水分配系数(1ogKsw)的QSPR研究
随机选取5个化合物为测试集样本,并以剩余的了40个作为训练集样本,经多元线性回归(MLR)留一法交互检验复相关系数(Qcum)为目标函数通过计算机逐点扫描确定α=0.7的高斯(Gaussian)形距离关系函数(DCF)具有最佳性质相关性(如图4所示),故以此为基础进行变量筛选,所得12个最优结构描述子,此时所得回归模型为:
logKsw=0.250+0.253×X(36)+0.080×X(42)+0.270×X(45)+1.636×X(2)+1.156×X(3)+0.582×X(5)-0.193×X(32)+0.699×X(8)-0.154×X(35)-0.232×X(46)-0.411×X(48)-3.132×X(31)
模型相关统计量为:样本数(N)为40,复相关系数(Rcum)为0.971,标准差(SD)为0.200,统计量(F)为36.994,留一法交互检验的复相关系数(Qcum),标准差(SDCV)和统计量(FCV)分别为0.935,0.296和15.577。进一步对模型外部5个化合物组成的测试集样本预测诊断,计算出外部检验的复相关系数(Qext)为0.977,实验值和预测值的相关性如图5所示。
③41个烃基酚类化合物及其对梨形四膜虫的水生急性毒性研究
随机选取5个化合物为测试集样本,并以剩余的了36个作为训练集样本,经多元线性回归(MLR)留一法交互检验复相关系数(Qcum)为目标函数通过计算机逐点扫描确定α=2.2的高斯(Gaussian)形距离关系函数(DCF)具有最佳性质相关性(如图6所示),故以此为基础进行变量筛选,所得7个最优结构描述子,此时所得回归模型为:
pIGC50=-0.963+0.522×V5+0.166×V6+0.341×V12+3.610×V13+0.436×V14-2.931×V23-0.101×V35
模型相关统计量为:样本数(N)为36,复相关系数(Rcum)为0.967,标准差(SD)为0.209,统计量(F)为58.068,留一法交互检验的复相关系数(Qcum),标准差(SDCV)和统计量(FCV)分别为0.931,0.302和25.821。进一步对模型外部5个化合物组成的测试集样本预测诊断,计算出外部检验的复相关系数(Qext)为0.944,实验值和预测值的相关性如图7所示。
以上所述,仅是本发明的较佳实施例而已,并非对本发明作任何形式上的限制,凡是依据本发明的技术实质对以上实施例所作的任何简单修改、等同变化与修饰,均仍属于本发明技术方案的范围内。

Claims (6)

1.一种基于智能相关指数对常见环境毒物性质/活性的预测方法,其特征在于,该方法包括下述步骤:
1)根据环境毒物分子结构性质特征定义性质相关参数PCP、距离关系函数DCF;
2)根据定义的性质相关参数PCP、距离关系函数DCF获得智能相关函数ICF;
3)由智能相关函数ICF与原子支化度获得智能相关指数ICI进行环境毒物分子结构参数化计算;
4)在环境毒物分子实测的实验活性值与环境毒物分子结构参数化计算值间运用多元线性回归、偏最小二乘方法进行数学建模;
5)构建环境毒物分子结构与性质/活性间关系的数学模型;
6)在构建环境毒物分子数学模型中获得留一法交互检验复相关系数Qcum’;
7)调整智能相关指数ICI值,重复步骤2)-5),得到Qcum”,……
8)在多个Qcum值中选取最大复相关系数Qcum
9)由对应最大复相关系数Qcum的数学模型,确定最佳对环境毒物性质/活性的预测模型,用于预测没有经过实验测定的同类型有机毒物的相关性质/活性。
2.根据权利要求1所述的一种基于智能相关指数对常见环境毒物性质/活性的预测方法,其特征在于,所述定义性质相关参数PCP,具体包括原子量、范德瓦尔斯体积、电负性、疏水性和杂化状态5种参数。
3.根据权利要求1所述的一种基于智能相关指数对常见环境毒物性质/活性的预测方法,其特征在于,所述定义距离关系函数DCF,包括下述内容:
对于给定分子结构,由用户自己从以下3种函数中选取其中一种距离关系函数:
①高斯形距离关系函数:
f(α;dij)=exp(-α·dij 2)  (1)
α为确定该函数的参数;dij为i,j两原子间的距离量度;
②倒数形距离关系函数:
f ( α ; d ij ) = 1 d ij α - - - ( 2 )
α为确定该函数的参数;dij为i,j两原子间的距离量度;
③指数形距离关系函数:
( α ; d ij ) = α - d ij - - - ( 3 )
α为确定该函数的参数;dij为i,j两原子间的距离量度。
4.根据权利要求1所述的一种基于智能相关指数对常见环境毒物性质/活性的预测方法,其特征在于,所述根据定义的性质相关参数PCP、距离关系函数DCF获得智能相关函数ICF,通过下式实现:
I(α;ηi,ηj,dij)=ηi·ηj·f(α;dij)  (4)
其中α为确定该函数的参数集;ηi和ηj为i,j两原子的性质相关参数;dij为i,j两原子的距离量度;f(dij;α)为距离关系函数DCF;α为确定该函数的参数。
5.根据权利要求1所述的一种基于智能相关指数对常见环境毒物性质/活性的预测方法,其特征在于,所述由智能相关函数ICF与原子支化度获得智能相关指数ICI,通过下式实现:
其中η和I(α;ηi,ηj,dij)分别为用户具体选定的某种原子性质相关参数和智能相关函数;dij表示i,j两原子之间的最短相对键距。
6.根据权利要求1所述的一种基于智能相关指数对常见环境毒物性质/活性的预测方法,其特征在于,所述利用智能相关指数ICI进行分子结构参数化计算,包括下述步骤:
1)首先按原子支化度将环境毒物分子的非氢原子分为4类,仅甲烷为0除外;
2)依据所研究环境毒物分子的结构特征由用户从原子量、范德瓦尔斯体积、电负性、疏水性和杂化状态5种性质相关参数PCP中选取对所研究环境毒物分子性质/活性影响较大的性质相关参数;
3)对于给定分子结构,由用户自己从高斯形、倒数形和指数形3种距离关系函数中选取合适的距离关系函数来确定智能相关函数;
4)通过上步中确定的智能相关函数获得智能相关指数;
5)依据扫描的距离函数参数α的变化情况,从而得到相关性最佳的α值,建立预测环境毒物性质/活性的最佳模型。
CN 201110145336 2011-05-31 2011-05-31 一种基于智能相关指数对常见环境毒物性质/活性预测方法 Expired - Fee Related CN102323973B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN 201110145336 CN102323973B (zh) 2011-05-31 2011-05-31 一种基于智能相关指数对常见环境毒物性质/活性预测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN 201110145336 CN102323973B (zh) 2011-05-31 2011-05-31 一种基于智能相关指数对常见环境毒物性质/活性预测方法

Publications (2)

Publication Number Publication Date
CN102323973A true CN102323973A (zh) 2012-01-18
CN102323973B CN102323973B (zh) 2013-08-14

Family

ID=45451715

Family Applications (1)

Application Number Title Priority Date Filing Date
CN 201110145336 Expired - Fee Related CN102323973B (zh) 2011-05-31 2011-05-31 一种基于智能相关指数对常见环境毒物性质/活性预测方法

Country Status (1)

Country Link
CN (1) CN102323973B (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103207947A (zh) * 2013-03-29 2013-07-17 陕西科技大学 一种预测血管紧张素转化酶抑制剂活性的方法
CN103678951A (zh) * 2013-12-11 2014-03-26 陕西科技大学 分子表面随机采样分析法对抗艾滋病药物活性的预测
CN103778483A (zh) * 2014-02-17 2014-05-07 山东大学 一种通过定量构效关系模型预测有机磷农药对水生生物急性毒性的方法

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103646180A (zh) * 2013-12-19 2014-03-19 山东大学 一种通过量子化学方法构建定量构效关系模型来预测有机化合物急性毒性的方法

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101419214A (zh) * 2007-10-23 2009-04-29 中国科学院上海药物研究所 基于分层原子加和模型的分子酸碱解离常数的预测方法
CN101587510A (zh) * 2008-05-23 2009-11-25 中国科学院上海药物研究所 基于复杂抽样和改进决策森林算法的化合物致癌毒性预测方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101419214A (zh) * 2007-10-23 2009-04-29 中国科学院上海药物研究所 基于分层原子加和模型的分子酸碱解离常数的预测方法
CN101587510A (zh) * 2008-05-23 2009-11-25 中国科学院上海药物研究所 基于复杂抽样和改进决策森林算法的化合物致癌毒性预测方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
王斌等: "基于QSAR和PCA方法的硝基芳烃综合毒性评价", 《清华大学学报(自然科学版)》, vol. 47, no. 3, 31 March 2007 (2007-03-31), pages 369 - 372 *
袁哲明等: "基于SVR和k_近邻群的组合预测在QSAR中的应用", 《分子科学学报》, vol. 23, no. 3, 30 June 2007 (2007-06-30), pages 163 - 169 *

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103207947A (zh) * 2013-03-29 2013-07-17 陕西科技大学 一种预测血管紧张素转化酶抑制剂活性的方法
CN103678951A (zh) * 2013-12-11 2014-03-26 陕西科技大学 分子表面随机采样分析法对抗艾滋病药物活性的预测
CN103778483A (zh) * 2014-02-17 2014-05-07 山东大学 一种通过定量构效关系模型预测有机磷农药对水生生物急性毒性的方法

Also Published As

Publication number Publication date
CN102323973B (zh) 2013-08-14

Similar Documents

Publication Publication Date Title
Uddin et al. A novel approach for estimating and predicting uncertainty in water quality index model using machine learning approaches
Li et al. A review on statistical postprocessing methods for hydrometeorological ensemble forecasting
Beran Statistical methods for data with long-range dependence
Suuster et al. Soil bulk density pedotransfer functions of the humus horizon in arable soils
Schultz et al. The present status of QSAR in toxicology
CN102323973B (zh) 一种基于智能相关指数对常见环境毒物性质/活性预测方法
Aburas et al. A review of land suitability analysis for urban growth by using the GIS-based analytic hierarchy process
Wong et al. Application of interval clustering approach to water quality evaluation
Gharagheizi A simple equation for prediction of net heat of combustion of pure chemicals
CN103425872B (zh) 通过定量构效关系模型预测大气中有机物与羟基反应速率常数的方法
Wu et al. Runoff modeling in ungauged catchments using machine learning algorithm-based model parameters regionalization methodology
Nagalli Estimation of construction waste generation using machine learning
Fu et al. Prediction of soil heavy metal distribution using geographically weighted regression kriging
CN103390092A (zh) 一种城市河道生态评测模型及评测方法
Pattanayak et al. Parameter scaling in the decoherent quantum-classical transition for chaotic systems
Zhang et al. Runoff prediction under extreme precipitation and corresponding meteorological conditions
Xu et al. Pedotransfer functions for estimating soil water retention properties of northern China agricultural soils: Development and needs
Kisi et al. Reply to discussion of “Precipitation forecasting using wavelet-genetic programming and wavelet-neuro-fuzzy conjunction models”
Intihar et al. The relationship between the economic indicators and the accuracy of container throughput forecasting
Phan Fast prediction of the compressive strength of high-performance concrete through a k-nearest neighbor approach
He et al. Predictability of monthly streamflow time series and its relationship with basin characteristics: an empirical study based on the MOPEX basins
Yang et al. Prediction of spatial distribution of soil available iron in a typical hilly farm-land using terrain attributes and random forest model
CN103077313B (zh) 酚对发光菌毒性预测及评估的非线性高效模型构建方法及应用
Yu et al. Adaptivity of Budyko hypothesis in evaluating interannual variability of watershed water balance in Northern China
Wei et al. Utilization of the copula-based composite likelihood approach to improve design precipitation estimates accuracy

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20130814

Termination date: 20210531