CN111462827A - 一种基于核受体二聚过程的雌激素干扰活性定量预测方法 - Google Patents
一种基于核受体二聚过程的雌激素干扰活性定量预测方法 Download PDFInfo
- Publication number
- CN111462827A CN111462827A CN202010466655.3A CN202010466655A CN111462827A CN 111462827 A CN111462827 A CN 111462827A CN 202010466655 A CN202010466655 A CN 202010466655A CN 111462827 A CN111462827 A CN 111462827A
- Authority
- CN
- China
- Prior art keywords
- ligand
- estrogen
- complex
- cofactor
- monomer
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 82
- 230000000694 effects Effects 0.000 title claims abstract description 45
- 229940011871 estrogen Drugs 0.000 title claims abstract description 38
- 239000000262 estrogen Substances 0.000 title claims abstract description 38
- 230000008569 process Effects 0.000 title claims abstract description 27
- 238000006471 dimerization reaction Methods 0.000 title claims abstract description 24
- 108020005497 Nuclear hormone receptor Proteins 0.000 title claims abstract description 22
- 108020004017 nuclear receptors Proteins 0.000 title claims abstract description 22
- 102000006255 nuclear receptors Human genes 0.000 title claims description 21
- 239000003446 ligand Substances 0.000 claims abstract description 118
- 230000027455 binding Effects 0.000 claims abstract description 53
- 102000015694 estrogen receptors Human genes 0.000 claims abstract description 53
- 108010038795 estrogen receptors Proteins 0.000 claims abstract description 53
- 239000013078 crystal Substances 0.000 claims abstract description 31
- 238000000329 molecular dynamics simulation Methods 0.000 claims abstract description 21
- 102000005962 receptors Human genes 0.000 claims abstract description 17
- 108020003175 receptors Proteins 0.000 claims abstract description 17
- 238000007781 pre-processing Methods 0.000 claims abstract description 3
- 239000000178 monomer Substances 0.000 claims description 62
- 239000000539 dimer Substances 0.000 claims description 27
- 238000004088 simulation Methods 0.000 claims description 14
- 238000004364 calculation method Methods 0.000 claims description 6
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 claims description 6
- VEXZGXHMUGYJMC-UHFFFAOYSA-M Chloride anion Chemical compound [Cl-] VEXZGXHMUGYJMC-UHFFFAOYSA-M 0.000 claims description 3
- 125000000539 amino acid group Chemical group 0.000 claims description 3
- 230000003993 interaction Effects 0.000 claims description 3
- 238000011478 gradient descent method Methods 0.000 claims description 2
- 229910001415 sodium ion Inorganic materials 0.000 claims description 2
- 230000001502 supplementing effect Effects 0.000 claims description 2
- 230000007115 recruitment Effects 0.000 abstract description 4
- 231100000027 toxicology Toxicity 0.000 abstract description 2
- 102000007399 Nuclear hormone receptor Human genes 0.000 abstract 1
- 239000000598 endocrine disruptor Substances 0.000 description 11
- 238000011160 research Methods 0.000 description 7
- 239000000126 substance Substances 0.000 description 7
- 108010007005 Estrogen Receptor alpha Proteins 0.000 description 5
- 102100038595 Estrogen receptor Human genes 0.000 description 5
- 238000010586 diagram Methods 0.000 description 4
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 3
- 238000003041 virtual screening Methods 0.000 description 3
- 206010006187 Breast cancer Diseases 0.000 description 2
- 208000026310 Breast neoplasm Diseases 0.000 description 2
- 238000012404 In vitro experiment Methods 0.000 description 2
- AUYYCJSJGJYCDS-LBPRGKRZSA-N Thyrolar Chemical class IC1=CC(C[C@H](N)C(O)=O)=CC(I)=C1OC1=CC=C(O)C(I)=C1 AUYYCJSJGJYCDS-LBPRGKRZSA-N 0.000 description 2
- 102000040945 Transcription factor Human genes 0.000 description 2
- 108091023040 Transcription factor Proteins 0.000 description 2
- 230000002411 adverse Effects 0.000 description 2
- 230000015572 biosynthetic process Effects 0.000 description 2
- 230000001419 dependent effect Effects 0.000 description 2
- 201000010099 disease Diseases 0.000 description 2
- 230000008821 health effect Effects 0.000 description 2
- 108091008039 hormone receptors Proteins 0.000 description 2
- 230000002452 interceptive effect Effects 0.000 description 2
- 238000004519 manufacturing process Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000012216 screening Methods 0.000 description 2
- 239000005495 thyroid hormone Substances 0.000 description 2
- 229940036555 thyroid hormone Drugs 0.000 description 2
- 238000013518 transcription Methods 0.000 description 2
- 230000035897 transcription Effects 0.000 description 2
- 208000032170 Congenital Abnormalities Diseases 0.000 description 1
- 206010010356 Congenital anomaly Diseases 0.000 description 1
- 230000004568 DNA-binding Effects 0.000 description 1
- DGAQECJNVWCQMB-PUAWFVPOSA-M Ilexoside XXIX Chemical compound C[C@@H]1CC[C@@]2(CC[C@@]3(C(=CC[C@H]4[C@]3(CC[C@@H]5[C@@]4(CC[C@@H](C5(C)C)OS(=O)(=O)[O-])C)C)[C@@H]2[C@]1(C)O)C)C(=O)O[C@H]6[C@@H]([C@H]([C@@H]([C@H](O6)CO)O)O)O.[Na+] DGAQECJNVWCQMB-PUAWFVPOSA-M 0.000 description 1
- 241001465754 Metazoa Species 0.000 description 1
- 206010067572 Oestrogenic effect Diseases 0.000 description 1
- 108091027981 Response element Proteins 0.000 description 1
- 230000009471 action Effects 0.000 description 1
- 230000003213 activating effect Effects 0.000 description 1
- 230000001270 agonistic effect Effects 0.000 description 1
- 230000003042 antagnostic effect Effects 0.000 description 1
- 229940046836 anti-estrogen Drugs 0.000 description 1
- 230000001833 anti-estrogenic effect Effects 0.000 description 1
- 230000007698 birth defect Effects 0.000 description 1
- 210000003855 cell nucleus Anatomy 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 230000000052 comparative effect Effects 0.000 description 1
- 150000001875 compounds Chemical class 0.000 description 1
- 230000002124 endocrine Effects 0.000 description 1
- 231100000507 endocrine disrupting Toxicity 0.000 description 1
- 210000000750 endocrine system Anatomy 0.000 description 1
- 230000005183 environmental health Effects 0.000 description 1
- 239000000328 estrogen antagonist Substances 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 230000002779 inactivation Effects 0.000 description 1
- 230000002401 inhibitory effect Effects 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 230000001404 mediated effect Effects 0.000 description 1
- 230000035772 mutation Effects 0.000 description 1
- 210000004940 nucleus Anatomy 0.000 description 1
- 238000002203 pretreatment Methods 0.000 description 1
- 230000022532 regulation of transcription, DNA-dependent Effects 0.000 description 1
- 230000001105 regulatory effect Effects 0.000 description 1
- 230000001850 reproductive effect Effects 0.000 description 1
- 208000017443 reproductive system disease Diseases 0.000 description 1
- 229910052708 sodium Inorganic materials 0.000 description 1
- 239000011734 sodium Substances 0.000 description 1
- HZRPRSVIPZNVKZ-UHFFFAOYSA-M sodium;[2-(4-aminophenyl)-1-hydroxy-1-phosphonoethyl]-hydroxyphosphinate Chemical compound [Na+].NC1=CC=C(CC(O)(P(O)(O)=O)P(O)([O-])=O)C=C1 HZRPRSVIPZNVKZ-UHFFFAOYSA-M 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 230000002103 transcriptional effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16C—COMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
- G16C10/00—Computational theoretical chemistry, i.e. ICT specially adapted for theoretical aspects of quantum chemistry, molecular mechanics, molecular dynamics or the like
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16C—COMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
- G16C20/00—Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
- G16C20/30—Prediction of properties of chemical compounds, compositions or mixtures
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16C—COMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
- G16C20/00—Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
- G16C20/70—Machine learning, data mining or chemometrics
Landscapes
- Engineering & Computer Science (AREA)
- Computing Systems (AREA)
- Theoretical Computer Science (AREA)
- Life Sciences & Earth Sciences (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Chemical & Material Sciences (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Crystallography & Structural Chemistry (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Evolutionary Computation (AREA)
- Medical Informatics (AREA)
- Software Systems (AREA)
- Peptides Or Proteins (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了一种基于核受体二聚过程的雌激素干扰活性定量预测方法,属于预测毒理学领域。本发明首先获取雌激素受体的晶体结构,并确定晶体结构中配体的雌激素效应EC50值,然后对雌激素受体的晶体结构的受体蛋白和配体分子进行预处理;然后构建复合体对复合体进行分子动力学模拟,计算复合体的自由结合能;建立定量相关关系,拟合回归预测模型;最后利用所拟合的回归模型进行雌激素干扰活性预测。本发明综合考虑了受配体结合、二聚化、共因子招募过程,然后利用分子动力学方法计算复合体的结合能,并建立预测回归模型,有效地提高了雌激素干扰活性的预测准确性。
Description
技术领域
本发明属于预测毒理学领域,具体涉及一种基于核受体二聚过程的雌激素干扰活性定量预测方法。
背景技术
内分泌干扰物(endocrine disrupting chemicals,EDCs)是指能干扰人类或动物内分泌系统并导致不良健康效应的物质。EDCs在环境和人体中都有广泛检出,暴露于内分泌干扰物质不仅引起一系列不良健康影响,也会造成巨大的经济损失,欧盟因EDCs导致的疾病治疗花费为2170亿美元,占国内生产总值的1.28%,而美国的这一数值达到 3400亿美元,占国内生产总值的2.33%。因而,EDCs的识别与控制一直是世界环境健康与安全领域研究的热点。
EDCs的主要作用途径是通过与细胞核中的激素受体结合并改变其功能,从而导致干扰效应。雌激素干扰物与生殖疾病、出生缺陷和乳腺癌等疾病之间存在着较大的潜在关系,因此雌激素受体成为了关于EDCs的研究中被广泛关注的受体,例如,EDCs可以通过雌激素受体α(estrogen receptorα,ERα)产生拟雌效应或抗雌效应,拟雌激素效应会导致乳腺癌,而抗雌激素效应则会导致生殖紊乱。由于检测EDCs的体外和体内实验成本高、耗时长等问题,无法对全球现有超过1.35亿种化合物进行逐一筛查。随着计算机辅助技术的发展,采用计算机辅助的EDCs筛选方法得到越来越多的关注,通过计算机模拟结果,结合体内、体外实验数据,能够更好地预测化合物干扰效应。
现有技术中,存在很多通过计算机辅助的EDCs筛选或预测方法,例如申请号为:200810123727.3的中国专利公开了一种有机物雌激素受体激动和拮抗作用的识别方法;申请号为201310288617.3的中国专利公开了一种基于分子动力学模拟的核受体介导内分泌干扰物质的虚拟筛选方法;申请号为201610201950.X的中国专利公开了一种基于核受体共调节因子的甲状腺激素干扰物虚拟筛选及其干扰活性的定量计算方法。雌激素受体(estrogen receptor,ER)属于配体依赖性转录因子,其活性高度依赖于配体结合,一旦进入细胞核内,ER便会以同源或异源二聚体的形式与特定的基因组DNA反应元件结合,进而通过招募共因子及其他转录因子形成转录调节复合物以激活或抑制转录。二聚体的形成被认为是正常受体功能所必需的,干扰二聚体形成的突变导致受体转录失活。二聚作用受化学物质与核受体结合的影响,其二聚体的稳定性不仅仅是配体对受体亲和力的反映,更是配体自身特性的反映。由于核受体在DNA结合和转录调控中的重要性,其二聚化是EDCs筛选的一个特征。
在现有的研究中,对二聚过程主要有两方面研究,一个是体外实验(低通量,耗时耗力),一个是模拟研究,但目前模拟大部分都是针对单体的研究,主要是因为认为招募共因子这一步更加重要,因此在模拟过程中往往会忽略二聚过程。而且现有的关于二聚体的模拟研究,多是基于一个并非ER本身初始态的未折叠结构进行研究,体系大,过程复杂,要考虑的因素很多;并且这种基于二聚体的研究主要是看分析该过程对于 H12(ER受体结构有12个螺旋,第12个螺旋H12对于判定物质的拟抗效应至关重要) 的影响,很难对雌激素的干扰活性进行预测。因此现有技术中对于雌激素干扰活性的预测的方法,还都是在基于核受体为单体的形式下利用配受体结合以及共因子招募过程针对拟性或抗性效应建立预测模型,并没有全面考虑EDCs与受体结合后的二聚化过程,而导致采用现有的方法对雌激素干扰活性进行预测时,准确性较低。
发明内容
技术问题:本发明提供一种基于核受体二聚过程的雌激素干扰活性定量预测方法,综合考虑配受体结合、二聚化、共因子招募过程的基础上,对于内分泌干扰物质的雌激素干扰活性进行预测,提高了预测的准确性。
技术方案:本发明一种基于核受体二聚过程的雌激素干扰活性定量预测方法,其特征在于,包括:
S1:获取雌激素受体的晶体结构,并确定晶体结构中配体的雌激素效应EC50值;
S2:对雌激素受体的晶体结构的受体蛋白和配体分子进行预处理;
S3:构建雌激素受体二聚体-配体复合体以及雌激素受体二聚体-配体-共因子复合体,并分别对每个复合体进行分子动力学模拟,从分子动力学模拟的轨迹中提取若干个构象,计算每个复合体的自由结合能;
S4:分别建立雌激素受体二聚体-配体复合体的自由结合能和与雌激素受体二聚体- 配体-共因子复合体间自由结合能与雌激素效应EC50值之间的定量相关关系,并拟合相应的回归预测模型;
S5:利用所得回归预测模型,并利用分子动力学模拟得到自由结合能的值,对雌激素干扰活性进行预测。
进一步地,所述步骤S2中,对雌激素受体的晶体结构的受体蛋白进行预处理的方法为:
首先检查晶体结构的完整性,并将残缺的氨基酸残基补充完整,然后对晶体结构进行加氢处理;
从处理后晶体结构中分别提取如下结构:(1)提取雌激素受体二聚体,其中雌激素受体二聚体包括单体1和单体2;
(2)提取雌激素受体二聚体与共因子的复合体,所述复合体包括单体1、单体2、共因子1和共因子2;
(3)提取配体,所述配体包括配体1和配体2,配体1和配体2分别提取。
进一步地,所述步骤S2中,对配体分子进行预处理的方法为:对提取的配体进行加氢处理,并赋予配体力场。
进一步地,所述步骤S3中,利用经过预处理的配体与雌激素受体二聚体构建雌激素受体二聚体-配体复合体,所述雌激素受体二聚体-配体复合体包括单体1、单体2、配体1和配体2;
利用雌激素受体二聚体与共因子的复合体和经过预处理的配体构建雌激素受体二聚体-配体-共因子复合体,所述雌激素受体二聚体-配体-共因子复合体包括单体1、单体2、配体1、配体2、共因子1和共因子2。
进一步地,所述步骤S3中,采用GROMACS软件对复合体进行分子动力学模拟,具体方法为:
S3.1:赋予受体蛋白CHARMM力场;
S3.2:将复合体浸入TIP3P模型水中,复合体的边缘到水层边缘的距离大于或等于1.4nm,并加入钠离子或氯离子以平衡体系的电荷;
S3.3:采用梯度下降法进行能量最小化,进而通过NVT系综和NPT系宗两步平衡模拟使体系平衡下来;
S3.4:设定模拟环境和模拟时间,并采用PME法用于计算远程电的相互作用,采用LINCS方法进行键的约束,然后完成分子动力学模拟。
进一步地,所述步骤S3中,采用分子力学-泊松玻尔兹曼表面积法计算复合体的自由结合能。
进一步地,计算雌激素受体二聚体-配体复合体的自由结合能方法为:计算单体1与配体1间的自由结合能ΔG单体1,计算单体2与配体2间的自由结合能ΔG单体2,雌激素受体二聚体-配体复合体的自由结合能ΔG二聚体=ΔG单体1+ΔG单体2;
计算雌激素受体二聚体-配体-共因子复合体的自由结合能方法为:计算单体1、配体1和共因子1间的自由结合能ΔG单体1-共因子1,计算单体2、配体2和共因子2间自由结合能ΔG单体2-共因子2,雌激素受体二聚体-配体-共因子复合体的自由结合能ΔG二聚体-共因子=ΔG单体1-共因子1+ΔG单体2-共因子2。
进一步地,所述步骤S4中,所确定回归预测模型的形式为:
-logEC50=a+kΔG
式中,log(EC50)表示EC50值的对数,a、k为系数,ΔG表示自由结合能。
进一步地,所述步骤S1中,采集的雌激素受体的晶体结构均为二聚体形式,且分辨率小于或等于2.4埃米。
进一步地,所述步骤S2中,采用Swiss-PdbViewer软件检查晶体结构的完整性,采用PyMOL软件对晶体结构进行加氢处理。
有益效果:本发明与现有技术相比,具有以下优点:
(1)现有技术中只考虑了配体受体结合、共因子招募过程,因雌激素机制不清楚,从而导致对雌激素干扰效应的预测准确性不高,本发明的方法,强调了受体二聚化过程的重要性,综合考虑了配体受体结合、二聚化、共因子招募过程,全面的考虑了雌激素干扰机制,并利用分子动力学模拟,建立了雌激素干扰效应与自由结合能的定量相关关系,并拟合了预测回归模型,该方法相对于现有技术,对雌激素干扰活性的预测准确性更高。
(2)相比于传统的体外实验方法,本发明的方法成本低廉,效率高。
附图说明
图1为本发明的方法的流程图;
图2为本发明的实施例中ERα二聚体-配体复合体的结构图;
图3为本发明的实施例中ERα二聚体-配体复合体的自由结合能与-logEC50值的定量关系图;
图4为本发明的实施例中ERα二聚体-配体-共因子复合体的结构图;
图5为本发明的实施例中ERα二聚体-配体-共因子复合体的自由结合能与-logEC50 值的定量关系图;
图6为本发明的实施例中ERα单体-配体的结构图;
图7为本发明的实施例中ERα单体-配体复合体的自由结合能与-logEC50值的定量关系图;
图8为本发明的实施例中ERα单体-配体-共因子的结构图;
图9为本发明的实施例中ERα单体-配体-共因子复合体的自由结合能与-logEC50值的定量关系图。
具体实施方式
下面结合实施例和说明书附图对本发明作进一步的说明。
实施例1
本实施例采用的雌激素受体为雌激素受体α(estrogen receptorα,ERα),以下均用 ERα表示雌激素受体α,说明的是,本发明的雌激素受体并不局限于ERα。
结合图1所示,对本发明的方法进行说明。获取ERα的晶体结构,本实施例中,从RCSB Protein Data Bank(http://www.rcsb.org/pdb/home/home.do)中搜索并下载ERα的晶体结构,所下载ERα晶体结构均为二聚体形式,分辨率小于或等于2.4埃米,并综合已有报导的确定所下载的ERα晶体结构相应配体的雌激素效应EC50值,EC50的值可用于显示雌激素的干扰活性。本实施例中,共获取了10个ERα晶体结构,如表1所示。
表1 ERα晶体结构及相应配体的雌激素效应EC50和-logEC50值
ERα二聚体由两个单体组成,为便于说明,此处称为单体1和单体2,每个单体对应一个配体和一个共因子,因此单体1对应配体1和共因子1,单体2对应配体2和共因子2。对获得的ERα晶体结构的受体蛋白进行预处理,首先利用Swiss-PdbViewer软件检查晶体结构的完整性,并将残缺的氨基酸残基补充完整,然后采用PyMOL软件,对晶体结构进行加氢处理。然后分别提取如下结构:
(1)提取ERα的ERα二聚体,ERα二聚体包括两个单体,分别为单体1和单体2;
(2)提取ERα二聚体与共因子的复合体,因此该复合体中包括两个单体和两个共因子,分别为单体1、单体2、共因子1和共因子2;
(3)提取配体,因为每个单体有一个与之相应的配体,在具体操作中,将每个单体对应的配体分别提取出来,并分别保存,在采用软件进行操作时,将配体1保存为配体1.pdb;将配体2保存为配体2.pdb。
将配体提取出来后,对配体分子进行预处理,预处理的方法为:对提取的配体进行加氢处理,并赋予配体力场。在通过软件进行具体操作时,首先将文件配体1.pdb和配体2.pdb使用Open Babel软件打开,对配体1和配体2进行加氢处理,然后转换为.mol2 格式的文件进行保存,即配体1.mol2和配体2.mol2,然后利用Swiss-Param赋予配体力场。
预处理完成后,构建ERα二聚体-配体复合体,具体是利用经过预处理的配体与ERα二聚体构建ERα二聚体-配体复合体,因此构建出的ERα二聚体-配体复合体中包括ERα二聚体和配体1以及配体2,即单体1、单体2、配体1和配体2,ERα二聚体-配体复合体的结构如图2所示。
构建ERα二聚体-配体-共因子复合体,具体是利用经过预处理的配体与ERα二聚体与共因子的复合体构建ERα二聚体-配体-共因子复合体,因此该复合体中包括单体1、单体2、配体1、配体2、共因子1和共因子2,ERα二聚体-配体-共因子复合体的结构如图4所示。
对构建的ERα二聚体-配体复合体以及ERα二聚体-配体-共因子复合体分别进行分子动力学模拟,在本实施例中,采用GROMACS软件完成分子动力学模拟。对复合体进行分子动力学模拟的方法具体如下:
S3.1:赋予受体蛋白CHARMM力场,在具体操作时,选择的是CHARMM 27力场。因为在对配体进行预处理时,已经对配体赋予了力场,但在具体的软件操作过程中,配体1和配体2赋予力场之后,产生的拓扑文件中包括atomtypes和pairtypes部分,在具体操作时需要对两部分进行合并。
S3.2:将复合体浸入TIP3P模型水中,其中复合体的边缘到水层边缘的距离大于或等于1.4nm,在本实施例中该距离设置为1.4nm,并加入钠离子或氯离子以平衡体系的电荷。
S3.3:采用梯度下降法(steepest-descent)进行能量最小化,进而通过NVT(恒温恒容)系综和NPT(恒温恒压)系宗两步平衡模拟使体系平衡下来。
S3.4:设定模拟环境和模拟时间,并采用PME法用于计算远程电的相互作用,采用LINCS(Linear Constraint Solver,LINCS)方法进行键的约束,然后完成分子动力学模拟,模拟环境包括大气压和温度,本实施例中采用1个标准大气压,温度为300K,模拟时间设置为20ns。
设置完所有参数后,进行即可完成复合体的分子动力学模拟,并生成分子动力学轨迹。
利用上述方法,分别完成ERα二聚体-配体复合体以及ERα二聚体-配体-共因子复合体的分子动力学模拟,并生成响应的分子动力学模拟轨迹。从分子动力学模拟轨迹中提取若干个构象,在本实施例中提取了100个构象,采用分子力学-泊松玻尔兹曼表面积(molecular mechanics Poisson-Boltzmann surface area,MM-PBSA)方法计算两个复合体的自由结合能。
其中ERα二聚体-配体复合体的自由结合能的计算方法为:计算单体1与配体1间的自由结合能ΔG单体1,计算单体2与配体2间的自由结合能ΔG单体2,则ERα二聚体- 配体复合体的自由结合能ΔG二聚体=ΔG单体1+ΔG单体2。
ERα二聚体-配体-共因子复合体的自由结合能的计算方法为:计算单体1、配体1和共因子1间的自由结合能ΔG单体1-共因子1,计算单体2、配体2和共因子2间自由结合能ΔG单体2-共因子2,则雌激素受体二聚体-配体-共因子复合体的自由结合能ΔG二聚体-共因子=ΔG单体1-共因子1+ΔG单体2-共因子2。自由结合能可以直接通过软件计算得到,采用GROMACS和APBS 开发的g_mmpbsa程序进行计算。本实施例中,两个复合体的自由结合能的具体数值如表2所示:
表2两个复合体的自由结合能计算结果
注:自由结合能单位为kJ/mol。
根据计算结果,建立定量相关关系,并拟合回归预测模型。在本实施例中,采用GraphPad Prism 8.0建立定量相关关系,拟合回归预测模型,在本实施例中,采用EC50 值的对数形式表示拟雌激素效应,具体的是采用-logEC50的形式,因此根据表2,建立 ERα二聚体-配体复合体的定量相关关系,如图3所示,并拟合的回归预测模型为:
-logEC50=-0.0072ΔG二聚体+4.3002
其中,在进行回归拟合时,R2为0.8296。
采用同样的方式,建立ERα二聚体-配体-共因子复合体的定量相关关系,如图5所示,并拟合回归预测模型为:
-logEC50=-0.0073ΔG二聚体-共因子+4.1913
其中R2为0.8338。
根据所拟合的回归预测模型,即可在自由结合能已知的情况下,预测雌激素受体的雌激素干扰活性。
为了说明本发明的方法相对于现有方法,预测的准确性较高,因此将本发明的方法与现有方法进行对比。现有方法中,是考虑单体、配体和共因子进行预测的,在具体的方法中,构建了ERα单体-配体复合体,结构如图6所示,并建立ERα单体-配体复合体的定量相关关系,如图7所示,结合表2数据,拟合的回归预测模型为:
-logEC50=-0.0248ΔG单体+2.5275
其中,R2为0.7413。
构建了单体-配体-共因子复合体,结构如图8所示,并建立了ERα单体-配体共因子复合体的定量相关关系,如图9所示,然后拟合的回归预测模型为:
-logEC50=-0.0268ΔG单体-共因子+2.1759
其中,R2为0.7599。
根据R2可以看出,本发明的回归预测模型的拟合效果更好,因此利用所拟合出的回归预测模型对雌激素干扰活性进行预测,能够具有更好的准确性。为进一步地说明对本发明相对现有技术具有更好的准确性,选取部分化合物进行计算对比,具体如表3所示。
表3本发明的方法与现有方法的对比数据
从表3可以看出,采用本发明的方法对雌激素的干扰活性进行预测时,与通过试验测得值的相对误差要比利用现有技术进行预测的相对误差小,从而说明,本发明的方法,相对于现有技术,预测的准确性得到有效的提高。
本发明提供了一种基于核受体二聚过程的雌激素干扰活性定量预测方法,综合考虑了干扰物质与核受体结合、二聚化、共因子结合等过程,利用分子动力学对构建的复合体进行模拟,并建立了雌激素效应与自由结合能间的定量相关关系,拟合了回归预测模型。本发明的方法,相对与现有技术,具有更高的预测准确性。
上述实施例仅是本发明的优选实施方式,应当指出:对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和等同替换,这些对本发明权利要求进行改进和等同替换后的技术方案,均落入本发明的保护范围。
Claims (10)
1.一种基于核受体二聚过程的雌激素干扰活性定量预测方法,其特征在于,包括:
S1:获取雌激素受体的晶体结构,并确定晶体结构中配体的雌激素效应EC50值;
S2:对雌激素受体的晶体结构的受体蛋白和配体分子进行预处理;
S3:构建雌激素受体二聚体-配体复合体以及雌激素受体二聚体-配体-共因子复合体,并分别对每个复合体进行分子动力学模拟,从分子动力学模拟的轨迹中提取若干个构象,计算每个复合体的自由结合能;
S4:分别建立雌激素受体二聚体-配体复合体的自由结合能和与雌激素受体二聚体-配体-共因子复合体间自由结合能与雌激素效应EC50值之间的定量相关关系,并拟合相应的回归预测模型;
S5:利用所得回归预测模型,并利用分子动力学模拟得到自由结合能的值,对雌激素干扰活性进行预测。
2.根据权利要求1所述的一种基于核受体二聚过程的雌激素干扰活性定量预测方法,其特征在于,所述步骤S2中,对雌激素受体的晶体结构的受体蛋白进行预处理的方法为:
首先检查晶体结构的完整性,并将残缺的氨基酸残基补充完整,然后对晶体结构进行加氢处理;
从处理后晶体结构中分别提取如下结构:(1)提取雌激素受体二聚体,其中雌激素受体二聚体包括单体1和单体2;
(2)提取雌激素受体二聚体与共因子的复合体,所述复合体包括单体1、单体2、共因子1和共因子2;
(3)提取配体,所述配体包括配体1和配体2,配体1和配体2分别提取。
3.根据权利要求2所述的一种基于核受体二聚过程的雌激素干扰活性定量预测方法,其特征在于,所述步骤S2中,对配体分子进行预处理的方法为:对提取的配体进行加氢处理,并赋予配体力场。
4.根据权利要求3所述的一种基于核受体二聚过程的雌激素干扰活性定量预测方法,其特征在于,所述步骤S3中,利用经过预处理的配体与雌激素受体二聚体构建雌激素受体二聚体-配体复合体,所述雌激素受体二聚体-配体复合体包括单体1、单体2、配体1和配体2;
利用雌激素受体二聚体与共因子的复合体和经过预处理的配体构建雌激素受体二聚体-配体-共因子复合体,所述雌激素受体二聚体-配体-共因子复合体包括单体1、单体2、配体1、配体2、共因子1和共因子2。
5.根据权利要求4所述的一种基于核受体二聚过程的雌激素干扰活性定量预测方法,其特征在于,所述步骤S3中,采用GROMACS软件对复合体进行分子动力学模拟,具体方法为:
S3.1:赋予受体蛋白CHARMM力场;
S3.2:将复合体浸入TIP3P模型水中,复合体的边缘到水层边缘的距离大于或等于1.4nm,并加入钠离子或氯离子以平衡体系的电荷;
S3.3:采用梯度下降法进行能量最小化,进而通过NVT系综和NPT系宗两步平衡模拟使体系平衡下来;
S3.4:设定模拟环境和模拟时间,并采用PME法用于计算远程电的相互作用,采用LINCS方法进行键的约束,然后完成分子动力学模拟。
6.根据权利要求5所述的一种基于核受体二聚过程的雌激素干扰活性定量预测方法,其特征在于,所述步骤S3中,采用分子力学-泊松玻尔兹曼表面积法计算复合体的自由结合能。
7.根据权利要求6所述的一种基于核受体二聚过程的雌激素干扰活性定量预测方法,其特征在于,计算雌激素受体二聚体-配体复合体的自由结合能方法为:计算单体1与配体1间的自由结合能ΔG单体1,计算单体2与配体2间的自由结合能ΔG单体2,雌激素受体二聚体-配体复合体的自由结合能ΔG二聚体=ΔG单体1+ΔG单体2;
计算雌激素受体二聚体-配体-共因子复合体的自由结合能方法为:计算单体1、配体1和共因子1间的自由结合能ΔG单体1-共因子1,计算单体2、配体2和共因子2间自由结合能ΔG单体2-共因子2,雌激素受体二聚体-配体-共因子复合体的自由结合能ΔG二聚体-共因子=ΔG单体1-共因子1+ΔG单体2-共因子2。
8.根据权利要求1-7任一项所述的一种基于核受体二聚过程的雌激素干扰活性定量预测方法,其特征在于,所述步骤S4中,所确定回归预测模型的形式为:
-logEC50=a+kΔG
式中,log(EC50)表示EC50值的对数,a、k为系数,ΔG表示自由结合能。
9.根据权利要求1所述的一种基于核受体二聚过程的雌激素干扰活性定量预测方法,其特征在于,所述步骤S1中,采集的雌激素受体的晶体结构均为二聚体形式,且分辨率小于或等于2.4埃米。
10.根据权利要求2所述的一种基于核受体二聚过程的雌激素干扰活性定量预测方法,其特征在于,所述步骤S2中,采用Swiss-PdbViewer软件检查晶体结构的完整性,采用PyMOL软件对晶体结构进行加氢处理。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010466655.3A CN111462827B (zh) | 2020-05-28 | 2020-05-28 | 一种基于核受体二聚过程的雌激素干扰活性定量预测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010466655.3A CN111462827B (zh) | 2020-05-28 | 2020-05-28 | 一种基于核受体二聚过程的雌激素干扰活性定量预测方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111462827A true CN111462827A (zh) | 2020-07-28 |
CN111462827B CN111462827B (zh) | 2023-07-28 |
Family
ID=71678827
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010466655.3A Active CN111462827B (zh) | 2020-05-28 | 2020-05-28 | 一种基于核受体二聚过程的雌激素干扰活性定量预测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111462827B (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113181366A (zh) * | 2021-05-12 | 2021-07-30 | 杭州诺莘科技有限责任公司 | 含gaba和cb1受体激动剂的营养组合物及其制备和应用 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20050074809A1 (en) * | 2001-03-10 | 2005-04-07 | Vladimir Brusic | System and method for systematic prediction of ligand/receptor activity |
CN101381894A (zh) * | 2008-05-30 | 2009-03-11 | 南京大学 | 一种有机物雌激素受体激动和拮抗作用的识别方法 |
CN103324861A (zh) * | 2013-07-10 | 2013-09-25 | 南京大学 | 基于分子动力学模拟的核受体介导内分泌干扰物质的虚拟筛选方法 |
CN105893759A (zh) * | 2016-04-01 | 2016-08-24 | 南京大学 | 一种基于核受体共调节因子的甲状腺激素干扰物虚拟筛选及其干扰活性的定量计算方法 |
-
2020
- 2020-05-28 CN CN202010466655.3A patent/CN111462827B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20050074809A1 (en) * | 2001-03-10 | 2005-04-07 | Vladimir Brusic | System and method for systematic prediction of ligand/receptor activity |
CN101381894A (zh) * | 2008-05-30 | 2009-03-11 | 南京大学 | 一种有机物雌激素受体激动和拮抗作用的识别方法 |
CN103324861A (zh) * | 2013-07-10 | 2013-09-25 | 南京大学 | 基于分子动力学模拟的核受体介导内分泌干扰物质的虚拟筛选方法 |
CN105893759A (zh) * | 2016-04-01 | 2016-08-24 | 南京大学 | 一种基于核受体共调节因子的甲状腺激素干扰物虚拟筛选及其干扰活性的定量计算方法 |
Non-Patent Citations (1)
Title |
---|
石来昊: "基于Metadynamic的分子动力学模拟建立受体活性区分模型" * |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113181366A (zh) * | 2021-05-12 | 2021-07-30 | 杭州诺莘科技有限责任公司 | 含gaba和cb1受体激动剂的营养组合物及其制备和应用 |
Also Published As
Publication number | Publication date |
---|---|
CN111462827B (zh) | 2023-07-28 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Domingo-Almenara et al. | The METLIN small molecule dataset for machine learning-based retention time prediction | |
Vanhaelen et al. | Design of efficient computational workflows for in silico drug repurposing | |
Hu et al. | Genetic reconstruction of a functional transcriptional regulatory network | |
Draghici et al. | Reliability and reproducibility issues in DNA microarray measurements | |
Herbrich et al. | Statistical inference from multiple iTRAQ experiments without using common reference standards | |
Zondervan et al. | Designing candidate gene and genome-wide case–control association studies | |
Suomi et al. | Enhanced differential expression statistics for data-independent acquisition proteomics | |
De Hertogh et al. | A benchmark for statistical microarray data analysis that preserves actual biological and technical variance | |
Franceschi et al. | Multiple comparisons in mass-spectrometry-based-omics technologies | |
CN111462827A (zh) | 一种基于核受体二聚过程的雌激素干扰活性定量预测方法 | |
Sun et al. | Testing for gene–environment interaction under exposure misspecification | |
Hu et al. | The benefits of using genetic information to design prevention trials | |
Nagai et al. | Risk Stratification Towards Precision Medicine in Heart Failure―Current Progress and Future Perspectives― | |
Qi et al. | From genetic associations to genes: methods, applications, and challenges | |
Mak et al. | Disparate metabolomics data reassembler: a novel algorithm for agglomerating incongruent LC-MS metabolomics datasets | |
Forshed et al. | Proteomic data analysis workflow for discovery of candidate biomarker peaks predictive of clinical outcome for patients with acute myeloid leukemia | |
Gao et al. | A multi-tissue, splicing-based joint transcriptome-wide association study identifies susceptibility genes for breast cancer | |
Vasconcelos et al. | IsomiR_Window: a system for analyzing small-RNA-seq data in an integrative and user-friendly manner | |
EP2656071B1 (en) | Method to identify liver toxicity using metabolite profiles | |
CN113215261A (zh) | 胰腺癌的预后预测诊断用基因标记物及其用途 | |
CN113234833A (zh) | 一种胰腺癌的预后标志物、预后风险评估模型及其应用 | |
Johansen et al. | Predictive genetic testing for coronary artery disease | |
Leach et al. | malbacR: a package for standardized implementation of batch correction methods for omics data | |
Xiong et al. | Improved estimation of functional enrichment in SNP heritability using feasible generalized least squares | |
Wu et al. | GlycAP, a glycoproteomic analysis platform for site-specific N-glycosylation research |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |