CN108009394A - 一种快速预测羟基多溴代联苯醚解离常数的方法 - Google Patents
一种快速预测羟基多溴代联苯醚解离常数的方法 Download PDFInfo
- Publication number
- CN108009394A CN108009394A CN201711173682.6A CN201711173682A CN108009394A CN 108009394 A CN108009394 A CN 108009394A CN 201711173682 A CN201711173682 A CN 201711173682A CN 108009394 A CN108009394 A CN 108009394A
- Authority
- CN
- China
- Prior art keywords
- model
- prediction
- compound
- lumo
- hydroxyl
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16C—COMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
- G16C20/00—Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
- G16C20/30—Prediction of properties of chemical compounds, compositions or mixtures
Landscapes
- Chemical & Material Sciences (AREA)
- Crystallography & Structural Chemistry (AREA)
- Life Sciences & Earth Sciences (AREA)
- Engineering & Computer Science (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computing Systems (AREA)
- Theoretical Computer Science (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了一种快速预测羟基多溴代联苯醚解离常数(pKa)的方法,属于面向化学品环境生态风险评价的定量结构‑性质关系(QSPR)技术领域。本发明使用分子量Mw和表征电子受体能力的最低分子轨道能ELUMO两个分子结构描述符,构建了预测pKa的QSPR模型。模型统计学性能优异,相关系数的平方r2=0.90,均方根误差rms=0.46。模拟外部验证和交叉验证表明模型具有良好的稳健性和预测能力。基于Williams图表征了模型的应用域,该模型可用于预测837种不同溴原子取代的单羟基取代的HO‑PBDEs及其他结构相类似化合物的pKa值。
Description
技术领域
本发明属于生态安全评价技术领域,特别是涉及一种面向环境生态风险评价的定量结构-性质关系(QSPR)技术领域。
背景技术
pKa是有机化合物非常重要的性质,决定化合物在介质中的存在形态,进而决定其溶解度、亲脂性、生物富集性以及毒性。获得有机化合物的精确pKa值在环境化学、生物化学以及药物化学等领域都有重要意义。作为化合物最基础的理化性质参数,pKa的实验数据还相当缺乏,并且存在着准确性不高等问题,特别是对于新兴的环境污染物而言,更是如此。因此,发展性能良好的预测方法尤为重要。
HO-PBDEs是由母体化合物多溴联苯醚(PBDEs)经生物转化或大气氧化而形成的一类新兴环境污染物,不仅在生物体内富集,而且会与激素受体、转运蛋白或代谢酶等生物大分子相互作用,进而导致内分泌功能紊乱、引发相关疾病,严重危害生态环境安全和人类健康。不同的解离形态会显著影响该类化合物的毒性强弱和作用机制。但由于以下几点原因,该类化合物的pKa实验测定值极度缺乏:首先,仅单羟基取代的HO-PBDE系列物就高达837个,95%以上没有标准样品,无法开展实验研究;其次,实验测定耗费大量的人力、物力和财力,不同实验室的数据还存在系统误差;很多高溴取代的HO-PBDEs水溶解度极低,实验测定受到极大限制,同时也无法满足有毒有害化学品污染管理的“预先防范原则”。因此,亟需开发适用于该类化合物的成本低廉、方便快捷的pKa评估预测方法。
定量结构-性质关系(QSPR)可以根据分子结构信息,预测化合物的pKa值,为开发快速预测方法提供了良好的思路。然而,目前报道的关于pKa的QSPR模型,在化合物的适用范围、模型的预测能力以及实际应用的可操作性等方面还存在问题。
Tehan等人(Tehan B G,Lloyd E J,Wong M G,et al.Estimation of pKa usingsemiempirical molecular orbital methods.Part 1:application to phenols andcarboxylic acids.Quant Struct-Act Rel,2002,21:457–472;Part 2:Application toamines,anilines and various nitrogen containing heterocyclic compounds.QuantStruct-Act Rel,2002,21:473–485)使用超离域度、极化率和Coulson净原子电荷等建立了417个有机酸(包括苯酚和羧酸)和282个有机碱(包括苯胺、脂肪胺和杂环化合物)的pKa预测模型。但该系列模型预测性能较差,并且受到训练集化合物选择和应用域的限制,不能用于HO-PBDEs化合物pKa的计算。Yu等人(Yu H Y,Kühne R,Ebert R-U,et al.Prediction ofthe dissociation constant pKa of organic acids from local molecularparameters of their electronic ground state.J Chem Inf Model,2011,51:2336–2344)使用量子化学方法计算了反映解离官能团原子的能量和电荷信息的三类局域分子结构描述符,建立了5类酸和7类碱的QSPR预测模型,模型性能良好,但是同样受到应用域的限制,无法应用于HO-PBDEs化合物。2015年,Yu等人(Yu H Y,Wondrousch D,Yuan Q,etal.Modeling and predicting pKa values of mono-hydroxylated polychlorinatedbiphenyls(HO-PCBs)and polybrominated diphenyl ethers(HO-PBDEs)by localmolecular descriptors.Chemosphere,2015,138:829–836)使用相类似的量子化学方法建立了专门针对HO-PBDEs和羟基多氯联苯(HO-PCBs)的pKa预测模型,然而由于涉及复杂的量子化学描述符的计算且需要专家经验,该模型不能被方便地用于此类化合物pKa的预测,并且模型性能也需要进一步提高。由此可见,目前已有的模型尚不能简单、快捷地预测HO-PBDEs及其它结构类似化合物的pKa值。
开发性能优良、算法简单透明、实用性强的pKa预测模型,使其可用于预测系列HO-PBDEs化合物的pKa值,将会有效弥补该类有机化合物基础数据的缺失,为其生态安全和健康风险评价提供数据支持和理论指导。
发明内容
本发明要解决的技术问题是开发一种高效快速、成本低廉、实用性强的预测HO-PBDEs化合物pKa值的方法。
为解决以上技术问题本发明采用的技术方案如下:
(1)高质量的数据会显著提高模型性能,为确保建立模型所用数据的准确性,选择了商业软件ACD数据库中的14个HO-PBDEs的pKa值,化合物结构包含从一溴取代到八溴取代(苯环上的氢全部被溴取代)的所有典型单羟基多溴联苯醚,pKa数值范围为4.45-9.20,跨越5个数量级。
(2)根据化合物解离机理的分析,选择分子量Mw和表征电子受体能力的最低分子轨道能ELUMO两个描述符构建pKa预测模型。使用Gaussian 09软件的密度泛函理论(DFT)B3LYP/6-31G**算法对分子进行结构优化和频率分析,在输出文件中可以直接提取化合物的Mw和ELUMO值。
(3)在此基础上,采用多元线性回归(MLR)方法建立pKa与Mw和ELUMO之间的回归模型,具体过程由SPSS 21.0执行。使用相关系数的平方(r2)和均方根误差(rms)作为统计学指标表征模型的拟合性能,使用预测相关系数的平方(q2)表征模型的预测性能。
经MLR分析得到的最优模型为:pKa=-0.007×Mw+15.937×ELUMO+11.811 (1)
其中,Mw代表分子量,ELUMO代表最低未占据分子轨道能。
模型1的r2为0.90,rms为0.46,表明模型具有良好的拟合能力,同时预测误差与实验值之间没有依附性。模型的稳定性和预测能力通过两种方法来评价。首先是模拟外部验证,将原始数据集随机分成两个子集(分别含有70%和30%化合物),使用一个子集(含70%化合物)和模型1中的两个分子结构描述符重新建立模型,拟合结果为r2=0.89和rms=0.43,应用于另一个子集(含30%化合物)得到的预测结果为q2=0.91和rms=0.61。两个子集统计学性能均与模型1非常接近,表明模型1是基于pKa与描述符之间的本质相关而不是偶然相关得到的,是统计学稳定的。第二种方法是去一法交叉验证,结果为q2 CV=0.81,rmsCV=0.60,再次证明了模型具有良好的稳定性和预测能力。
以化合物描述符矩阵的hi值作为横坐标,以标准残差(SE)为纵坐标绘制Williams图,进而确定高影响度化合物和离域点。在Williams图中,所有化合物的hi值都小于警戒值h*=0.64,表明没有明显影响模型回归系数的化合物。所有化合物的标准残差都落在±2以内,说明模型也没有离域点。综上,模型的应用域定义为:单羟基取代的837个含不同溴原子个数的HO-PBDEs以及与其结构相类似的其他化合物。进行pKa的预测时,如果某些化合物的hi值大于0.64,有可能得到不可靠的预测结果,则对于这些化合物模型1的使用要非常谨慎。
本发明的有益效果是采用本发明方法可以快速预测837种单羟基取代的HO-PBDEs及其他结构类似化合物的pKa值。所使用的分子结构描述符容易获得,回归分析简单,模型性能优异。因此该方法方便快捷、成本低廉、便于使用。该发明所涉及的pKa预测方法的建立和验证严格依照经济合作与发展组织(OECD)规定的QSPR模型发展和使用的导则,使用该发明专利得到的pKa预测结果,可以为HO-PBDEs及其他结构类似化合物的生态风险评价提供重要的基础数据。
本发明提供的pKa预测模型有如下几个优点:(1)模型适用范围广,可用于837个HO-PBDEs及其他结构相似化合物的pKa预测;(2)所使用的分子结构描述符的计算和建模方法简单易实现,模型的实际应用能力强;(3)模型稳定性高,预测性能优异。
附图说明
图1是本发明中模型预测pKa值与商业数据库ACD中pKa值的对比图。
图2是预测误差值与pKa值的拟合图。
图3是表征模型高影响度化合物和离域点的Williams图。
具体实施方式
实施例1
3'-OH BDE 7:
采用Williams图法计算得到其hi值为0.103<h*(警戒值)=0.64,标准残差(SE)=0.649<3,说明此化合物在QSPR模型应用域内。采用Gaussian 09软件的DFT B3LYP/6-31G**算法进行结构优化和频率分析,得到化合物的Mw和ELUMO值分别为341.89和-0.0322。
ACD数据库中3'-OH BDE 7的pKa值为9.20,本发明中基于QSPR模型预测步骤如下:
pKa=-0.007×Mw+15.937×ELUMO+11.811
=-0.007×341.89+15.937×(-0.0322)+11.811
=8.90
实施例2
5-OH BDE 47:
采用Williams图法计算得到其hi值为0.111<h*(警戒值)=0.64,标准残差(SE)=0.065<3,说明此化合物在QSPR模型应用域内。采用Gaussian 09软件的DFT B3LYP/6-31G**算法进行结构优化和频率分析,得到化合物的Mw和ELUMO值分别为497.71和-0.0781。
ACD数据库中5-OH BDE47的pKa值为7.11,本发明中基于QSPR模型预测步骤如下:
pKa=-0.007×Mw+15.937×ELUMO+11.811
=-0.007×497.71+15.937×(-0.0781)+11.811
=7.08
实施例3
5'-OH BDE 99:
采用Williams图法计算得到其hi值为0.243<h*(警戒值)=0.64,标准残差(SE)=0.346<3,说明此化合物在QSPR模型应用域内。采用Gaussian 09软件的DFT B3LYP/6-31G**算法进行结构优化和频率分析,得到化合物的Mw和ELUMO值分别为575.62和-0.0570。
ACD数据库中5'-OH BDE 99的pKa值为7.03,本发明中基于QSPR模型预测步骤如下:
pKa=-0.007×Mw+15.937×ELUMO+11.811
=-0.007×575.62+15.937×(-0.0570)+11.811
=6.87
实施例4
4'-OH BDE 201:
采用Williams图法计算得到其hi值为0.373>h*(警戒值)=0.64,标准残差(SE)=-0.735>-3,说明此化合物在QSPR模型应用域内。采用Gaussian 09软件的DFT B3LYP/6-31G**算法计算该化合物的Mw和ELUMO值分别为809.35和-0.0852。
ACD数据库中4'-OH BDE 201的pKa值为4.45,本发明中基于QSPR模型预测步骤如下:
pKa=-0.007×Mw+15.937×ELUMO+11.811
=-0.007×809.35+15.937×(-0.0852)+11.811
=4.79
以上所述,仅为本发明较佳的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到的变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以所述权利要求的保护范围为准。
Claims (2)
1.一种快速预测羟基多溴代联苯醚解离常数的方法,其特征在于:
(1)首先,数据集覆盖了从一溴取代到八溴取代的典型单羟基多溴联苯醚化合物,所述八溴取代为苯环上的氢全部被溴取代,pKa数值范围为4.45-9.20,跨越5个数量级;
(2)根据化合物解离机理的分析,选择分子量Mw和表征电子受体能力的最低未占据分子轨道能ELUMO两个描述符构建pKa预测模型,使用Gaussian 09软件的密度泛函理论(DFT)B3LYP/6-31G**算法对分子进行结构优化和频率分析,在输出文件中直接提取化合物的Mw和ELUMO值;
(3)采用多元线性回归(MLR)方法建立模型,具体过程由SPSS 21.0执行;使用相关系数的平方(r2)和均方根误差(rms)作为统计学指标表征模型的拟合性能,使用预测相关系数的平方(q2)表征模型的预测性能;
经MLR分析得到的模型为:
pKa=-0.007×Mw+15.937×ELUMO+11.811 (1)
式(1)中,Mw代表分子量,ELUMO代表最低未占据分子轨道能。
2.根据权利要求1所述的方法,其特征在于,所述的化合物包括单羟基取代的837个含不同溴原子个数的羟基多溴联苯醚。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201711173682.6A CN108009394B (zh) | 2017-11-22 | 2017-11-22 | 一种快速预测羟基多溴代联苯醚解离常数的方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201711173682.6A CN108009394B (zh) | 2017-11-22 | 2017-11-22 | 一种快速预测羟基多溴代联苯醚解离常数的方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN108009394A true CN108009394A (zh) | 2018-05-08 |
CN108009394B CN108009394B (zh) | 2021-10-08 |
Family
ID=62053572
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201711173682.6A Active CN108009394B (zh) | 2017-11-22 | 2017-11-22 | 一种快速预测羟基多溴代联苯醚解离常数的方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN108009394B (zh) |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20070145355A1 (en) * | 2005-12-22 | 2007-06-28 | Ansgar Werner | Doped organic semiconductor material |
CN101419214A (zh) * | 2007-10-23 | 2009-04-29 | 中国科学院上海药物研究所 | 基于分层原子加和模型的分子酸碱解离常数的预测方法 |
CN104200071A (zh) * | 2014-08-15 | 2014-12-10 | 浙江师范大学 | 一种预测羟基取代的多溴代联苯醚甲状腺激素效应的方法及模型的建立方法 |
-
2017
- 2017-11-22 CN CN201711173682.6A patent/CN108009394B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20070145355A1 (en) * | 2005-12-22 | 2007-06-28 | Ansgar Werner | Doped organic semiconductor material |
CN101419214A (zh) * | 2007-10-23 | 2009-04-29 | 中国科学院上海药物研究所 | 基于分层原子加和模型的分子酸碱解离常数的预测方法 |
CN104200071A (zh) * | 2014-08-15 | 2014-12-10 | 浙江师范大学 | 一种预测羟基取代的多溴代联苯醚甲状腺激素效应的方法及模型的建立方法 |
Also Published As
Publication number | Publication date |
---|---|
CN108009394B (zh) | 2021-10-08 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Poater et al. | The delocalization index as an electronic aromaticity criterion: application to a series of planar polycyclic aromatic hydrocarbons | |
Irikura et al. | Uncertainties in scaling factors for ab initio vibrational frequencies | |
Dračínský et al. | Effects of quantum nuclear delocalisation on NMR parameters from path integral molecular dynamics | |
CN103488901B (zh) | 采用定量结构-活性关系模型预测有机化合物的土壤或沉积物吸附系数的方法 | |
Powis et al. | A valence photoelectron imaging investigation of chiral asymmetry in the photoionization of fenchone and camphor | |
Ewing et al. | Novel 2D fingerprints for ligand-based virtual screening | |
Keshavarz et al. | Accurate prediction of the toxicity of benzoic acid compounds in mice via oral without using any computer codes | |
Saielli | Computational spectroscopy of ionic liquids for bulk structure elucidation | |
CN104573863A (zh) | 预测水相中有机化合物与羟基自由基反应速率常数的方法 | |
Brown | Predicting hexadecane–air equilibrium partition coefficients (L) using a group contribution approach constructed from high quality data | |
CN103425872A (zh) | 通过定量构效关系模型预测大气中有机物与羟基反应速率常数的方法 | |
Boehm et al. | Lower heating value of jet fuel from hydrocarbon class concentration data and thermo-chemical reference data: An uncertainty quantification | |
Carrera et al. | The Solubility of Gases in Ionic Liquids: A Chemoinformatic Predictive and Interpretable Approach | |
Venkatraman et al. | In silico prediction and experimental verification of ionic liquid refractive indices | |
Li et al. | Force distribution analysis of mechanochemically reactive dimethylcyclobutene | |
Kang et al. | Atom surface fragment contribution method for predicting the toxicity of ionic liquids | |
Bryce et al. | Symmetry Properties of Indirect Nuclear Spin− Spin Coupling Tensors: First Principles Results for ClF3 and OF2 | |
CN108009394A (zh) | 一种快速预测羟基多溴代联苯醚解离常数的方法 | |
Taneja et al. | A review on prognosis and diagnosis of transformer oil quality using intelligent techniques based on dissolved gas analysis | |
Sessa et al. | Experimental Quantum Chemistry: A Hammett‐inspired Fingerprinting of Substituent Effects | |
Wang et al. | Modification of the onsager reaction field and its application on spectral parameters | |
Provasi et al. | The Importance of the Density Functional Theory Exchange–Correlation Hartree–Fock Term in Magnetic Resonance: Application to an Aqueous Environment | |
Pan et al. | Theoretical Study on the Photodegradation Mechanism of Nona‐BDEs in Methanol | |
Li et al. | Density functional theory study of 13C NMR chemical shift of chlorinated compounds | |
Hilal et al. | Verification and validation of the SPARC model |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |