CN112420122B

CN112420122B - 一种内分泌干扰物与核受体作用的别构位点识别方法

Info

Publication number: CN112420122B
Application number: CN202011216404.6A
Authority: CN
Inventors: 史薇; 张驰; 陈钦畅; 郭婧; 于红霞; 谭皓月
Original assignee: Nanjing University
Current assignee: Nanjing University
Priority date: 2020-11-04
Filing date: 2020-11-04
Publication date: 2021-06-22
Anticipated expiration: 2040-11-04
Also published as: CN112420122A

Abstract

本发明公开了一种内分泌干扰物与核受体作用的别构位点识别方法，属于计算毒理学领域。该方法首先获取并优化受体蛋白的晶体结构，构建并优化正构配体分子、非竞争性配体分子结构，然后，构建核受体‑正构配体分子复合体，并将非竞争性配体分子放置于远离核受体表面的位置，构建核受体‑正构配体分子‑非竞争性配体分子三元复合体，并对三元复合体进行分子动力学模拟；然后，进行全局搜索分子动力学模拟；将获取的分子运动轨迹进行位置聚类分析，根据非竞争性配体分子在模拟空间范围内的团簇分布进行团簇优先级排序，识别潜在的别构位点。本发明不受已知信息、初始蛋白构象和化合物种类的限制，能够对核受体表面潜在的别构位点进行高效准确识别。

Description

一种内分泌干扰物与核受体作用的别构位点识别方法

技术领域

本发明属于计算毒理学领域，具体涉及一种内分泌干扰物与核受体作用的别构位点识别方法。

背景技术

随着工业的发展与人们生产生活水平的提高，双酚类、全氟化合物、多氯联苯、有机氯杀虫剂、邻苯二甲酸酯等大量化学品被投入生产和使用，后经过多种途径进入生物体，干扰内源激素的合成、分泌、转运、作用、代谢等生物过程，最终改变内分泌系统正常功能，引发发育异常、生殖缺陷、神经行为障碍、糖尿病及癌症等多种健康风险。因此，这些外源化合物也被称之为环境内分泌干扰物(EDCs)。因其对人类健康造成的有害影响，EDCs的作用机制解析也一直是世界环境健康与安全领域研究的热点。

核受体，如雄激素受体(AR)、雌激素受体(ER)、甲状腺激素受体(TR)等，作为典型的配体依赖性转录调控因子，在生物体的新陈代谢、性别决定和分化、生殖发育和稳态过程中发挥重要调节功能的同时，也是EDCs的重要靶标。NRs是多结构域蛋白，主要包含N末端结构域(NTD)、DNA结合结构域(DBD)、铰链区域和C末端配体结合结构域(LBD)等。NRs的自然调节过程与几大结构域息息相关，主要是通过配体结合于正构结合口袋(OrthostericLigandBinding Pocket)以及结构域内和域间的变构调节机制实现的。常见的NRs激活路径为：在缺乏内源配体结合时，NRs与伴侣蛋白形成非活跃态的复合体定位于细胞质中；当与配体结合时，LBD区域会发生结构改变，后受体与伴侣蛋白解离，转移进入细胞核内，形成二聚体并结合于DNA响应元件上，同时招募共因子、RNA聚合酶等辅因子形成转录调控复合物激活或抑制转录。

目前，已有研究发现EDCs通过模仿或者拮抗内源激素自然作用过程发挥内分泌干扰效应。例如，非甾体类雌激素药物己烯雌酚(DES)、塑化剂邻苯二甲酸酯(PAEs)、防腐剂对羟基苯甲酸酯(Paraben)等均可采用与天然雌二醇相似的结合方式，结合于ERα-LBP，干扰正常的受体功能。同样地，玉米赤霉醇(α-Za)及其衍生物、农药代谢物(如DDE、HPTE)、二苯甲酮2(Benzophenone 2)等化合物会与内源激素竞争结合于正构结合口袋产生抗雄激素活性。然而，在美国环境保护署(US EPA)发起的Toxcast/Tox21测试项目中，超85％的化合物在未表现出AR竞争结合效力的同时仍表现干扰活性，说明存在大量雄激素干扰物可能是通过结合于非正构结合口袋(即别构位点)产生的非竞争性干扰。而传统的与正构结合口袋作用的认识局限，严重影响了对别构位点结合化合物的作用机制与效应预测，亟需识别出别构位点结合化合物与受体作用的别构位点。

现有研究中，核受体蛋白表面的别构位点主要来源于实验中的随机发现。若想深入获取蛋白复合物的空间结构，明晰结合位点信息，还需要结构生物学方法如X射线晶体衍射技术、核磁共振光谱(NMR)、冷冻电镜技术(Cryo-EM)、氢氘交换质谱(HDX)等进行验证，但这些方法成本高昂、技术难度大，无法广泛推广到EDCs的研究中，极大程度限制了对EDCs别构机制的进一步挖掘与应用。而随着理论方法和计算机科学技术的迅速发展，计算毒理学蓬勃兴起，分子对接、分子动力学模拟、生物信息学分析等计算机方法成为辅助EDCs筛选和机制解析的重要策略之一。例如，申请号为201580058788.4的中国发明专利公开了一种识别配体-蛋白质结合位点的方法和系统，依赖于已知药物靶点的结构相似性分析搜索新的药物靶点，在大量无已知结合信息的EDCs中难以推广。申请号201910879922.7的中国发明专利公开了一种基于深度学习的蛋白质—配体结合位点预测算法，但这种基于结构的预测方法忽略了蛋白—配体的动态作用过程。PhaniGhanakota等人开发出基于蛋白质在二元混合溶剂中进行分子动力学模拟的热点映射技术——混合溶剂分子动力学模拟(MixMD)，创新性考虑了蛋白灵活性以及探针分子与水分子的竞争结合状态，获得了优于FTMap方法的别构位点识别结果。然而，该方法选取的探针数量和种类有限，并倾向于识别可给药和易去溶剂化的结合位点，应用于结构丰富、种类多样的EDCs核受体表面别构位点的识别仍存在困难。

综上，现有模拟方法具有较高的局限性，易受已知信息、初始蛋白构象和化合物种类的限制，难以对内分泌干扰物的核受体表面潜在别构位点进行准确识别。

发明内容

技术问题：针对现有模拟方法易受已知信息、初始蛋白构象和化合物种类的限制，难以对核受体表面潜在的别构位点进行准确识别的问题，本发明提供一种内分泌干扰物与核受体作用的别构位点识别方法，本发明中，利用全局搜索分子动力学模拟，搜寻非竞争性EDCs在核受体表面的别构位点，能够不受已知信息、初始蛋白构象和化合物种类的限制，对核受体表面潜在的别构位点进行高效准确的识别。

技术方案：本发明的内分泌干扰物与核受体作用的别构位点识别方法，包括以下步骤：

步骤1：获取并优化受体蛋白的晶体结构；

步骤2：构建并优化正构配体分子、非竞争性配体分子结构；

步骤3：将正构配体分子对接到核受体正构结合口袋，构建核受体-正构配体分子复合体，并将非竞争性配体分子放置于远离核受体表面的位置，构建核受体-正构配体分子-非竞争性配体分子三元复合体，并对所述三元复合体进行分子动力学模拟；

步骤4：经分子动力学模拟稳定复合体结构后，进行全局搜索分子动力学模拟；

步骤5：将经全局搜索分子动力学模拟获取的分子运动轨迹进行位置聚类分析，根据非竞争性配体分子在模拟空间范围内的团簇分布进行团簇优先级排序，识别潜在的别构位点。

进一步地，步骤4中，进行全局搜索分子动力学模拟的方法为：

首先，设置集合变量以确定非竞争性配体分子相对于受体蛋白的空间位置信息；

然后，采用GROMACS软件和Plumed软件运行，体系维持在设定气压和温度下，并定量设置高斯高度和宽度。

进一步地，步骤1中，通过蛋白质数据库获取受体蛋白的晶体结构。

进一步地，步骤1中，优化受体蛋白的晶体结构的方法为：

首先，检查受体蛋白结构的完整性，并将残缺的氨基酸残基补充完整；

然后，移除受体蛋白的水分子，再对受体蛋白添加氢原子，并赋予AMBER力场。

进一步地，步骤2中，构建正构配体分子、非竞争性配体分子结构的方法为：

由数据库中获取；或自行绘制配体分子结构；或经由晶体结构提取。

进一步地，步骤2中，优化正构配体分子、非竞争性配体分子结构的方法为：

首先，由分子力学阿林格力场2进行初步优化；

然后，由鲍威尔梯度算法和特里波力场进行再次优化，添加采用Gasteiger-Huckel方法计算电荷。

进一步地，步骤3中，放置非竞争性配体分子时，非竞争性配体分子到远离核受体表面的距离大于5埃米。

进一步地，步骤3中，构建核受体-正构配体分子-非竞争性配体分子三元复合体，进行分子动力学模拟的方法为：

首先，使用SwissParam网站对配体分子赋予CHARMM力场，使用GROMACS软件对受体蛋白赋予CHARMM力场；

其次，将三元复合体浸入TIP3P模型水中，构建三元复合体的边缘到水层边缘的距离大于8.5埃米，并加入钠离子和氯离子以平衡体系电荷；

然后，三元复合体经由梯度下降法进行能量最小化，进而通过NVT系综和NPT系综两步平衡模拟使体复合体系平衡下来；

最后，在设定的气压和温度环境下，计算远程电的相互作用并进行键的约束，完成设定时长的分子动力学模拟，平衡复合体系。

有益效果：本发明与现有技术相比，具有以下优点：

(1)现存针对环境内分泌干扰物的研究只考虑了EDCs通过与内源激素竞争正构结合口袋，模仿或者拮抗内源激素自然作用过程发挥内分泌干扰效应，对于通过别构位点产生的内分泌干扰机制的研究仍存空白，本发明采用全局搜索分子动力学模拟方法，在内源激素结合于受体正构结合口袋的前提下，高效准确地识别了非竞争性EDCs在受体蛋白表面的别构位点，对EDCs的别构调控机制解析具有重要意义。

(2)相比于传统生物物理实验方法，本发明成本低廉、效率更高、技术难度低，更适用于复杂多样的环境内分泌干扰物高通量筛查，相较于已有的计算机模拟方法，该方法不受已知信息、受体蛋白构象及探针分子种类限制，可灵活适用于多种配体分子，普适性较高。

附图说明

图1为本发明的方法的流程图；

图2为实施例1中50nsGSMD模拟识别T3的AR别构位点与晶体结果对比图；

图3为实施例2中50nsGSMD模拟识别4HY的AR别构位点与晶体结果对比图；

图4为实施例3中25nsGSMD模拟识别T4的TRα别构位点与晶体结果对比图；

图5为实施例4中50nsGSMD模拟识别CC-CHF的AR别构位点及代表性构象示意图。

具体实施方式

下面结合实施例和说明书附图对本发明作进一步的说明。

实施例1

本实施例选用的受体蛋白为雄激素受体(Androgenreceptor，AR)，以下均用AR表示雄激素受体；正构配体分子选用AR内源激动剂二氢睾酮(Dihydro-testosterone，DHT)，以下均用DHT表示二氢睾酮；非竞争性配体分子选用具有结晶信息的3,3’,5-三碘代-L-甲状腺原氨酸(3,3’,5-Triiodo-L-thyronine，T3)，以下均用T3表示3,3’,5-三碘代-L-甲状腺原氨酸。

结合图1所示，本实施例的具体操作步骤如下：

(1)获取并优化受体蛋白的晶体结构：

在自蛋白质数据库RCSB Protein Data Bank(https://www.rcsb.org/)中搜索并下载AR的晶体结构，选择PDB代码为2piv的AR-DHT-T3复合体结构，分辨率为1.95埃米。经由Swiss-pdbviewer检查受体蛋白结构的完整性，并将残缺的氨基酸残基补充完整，随后在Pymol软件中移除受体蛋白的水分子，在SYBYL软件中对受体蛋白添加氢原子，并赋予AMBER力场。

(2)构建并优化配体分子结构：由于从蛋白质数据库中下载的PDB代码为2piv的AR-DHT-T3复合体结构，包括了正构配体分子DHT和非竞争性配体分子T3，且正构配体分子DHT已经对接到核受体正构结合口袋，因此核受体-正构配体分子复合体已经构建完成。此外，在所下载的AR-DHT-T3复合体晶体结构中，T3已结合在特定的位点，因此该AR-DHT-T3复合体结构并不满足模拟的需求，需要重新进行构建。

在本实施例中，自蛋白质数据库中获取PDB代码为2piv的AR-DHT-T3复合体结构，因DHT和T3均来源于晶体结构，因此无需再次进行优化。当然，也可以再进行优化，对DHT和T3进行优化的方法是，首先，由分子力学阿林格力场2进行初步优化，然后，由鲍威尔梯度算法和特里波力场进行再次优化，添加采用Gasteiger-Huckel方法计算电荷。

在Pymol软件中打开PDB代码为2piv的晶体结构，将T3放置于AR表面大于5埃米的任意位置后，构建AR-DHT-T3三元复合体，分别保存正构配体分子DHT和非竞争性配体分子T3为.pdb格式，随后经由Open Bable软件进行加氢处理，并转换为.mol2格式转存，说明的是，如果是经过优化的配体分子，也可以不用再经Open Bable软件进行加氢处理，直接以.mol2格式转存即可。

(3)对AR-DHT-T3三元复合体，利用GROMACS软件进行4ns的分子动力学模拟。首先，使用SwissParam网站(http://www.swissparam.ch/)对DHT、T3两个配体分子赋予CHARMM(Chemistryat Harvard Macromolecular Mechanics)力场，使用GROMACS软件对受体蛋白软件赋予CHARMM(Chemistryat Harvard Macromolecular Mechanics)力场；其次，将三元复合体浸入TIP3P模型水中，本实施例中构建复合体的边缘到水层边缘的距离为15埃米，并加入氯离子以平衡体系正电荷；随后，复合体系经由梯度下降法(steepest-descent)进行能量最小化，进而通过NVT(恒温恒容)系综和NPT(恒温恒压)系综两步平衡模拟使体系平衡下来。最后，在1个标准大气压和300K温度下，采用PME(Particle Mesh Ewald)法用于计算远程电的相互作用，采用LINCS方法进行键的约束，完成4ns的分子动力学模拟，平衡复合体系。

(4)分子动力学模拟稳定复合体结构后，进行全局搜索分子动力学模拟(GlobalSearching Molecular Dynamics，GSMD)。具体是指：为使非竞争性配体分子T3可在有限的模拟时长内有效搜索AR表面，设置三个集合变量(Collectivevariables，CVs)以确定非竞争性配体分子相对于受体蛋白的空间位置信息，CV1为T3与正构配体结合腔(LigandBinding Pocket，LBP)的距离；CV2为T3、Asn705的α碳和Arg752的α碳之间形成的夹角；CV3为T3、Arg752的α碳和Thr877的α碳之间形成的夹角。GSMD在GROMACS软件和Plumed 2.3.5软件运行，体系维持在1个标准大气压和300K温度下，高斯高度和宽度分别设置为1.2kJ/mol和0.1nm，模拟时长设定为50ns。

(5)分子运动轨迹的位置聚类分析与代表性构象识别，具体的：将GSMD获取的分子运动轨迹进行位置聚类分析，cutoff值选定为0.25，筛选高频团簇位置为关键位点，并提取相应团簇的代表性构象信息。如图2所示，卡通螺旋结构为AR受体，棍棒结构分别代表晶体结构和模拟结果中的T3构象信息高频团簇代表性构象与晶体结构PDB代码为2piw的构象进行叠合分析，发现模拟识别出T3的所处位点与晶体结构所示两位点一致，证明该模拟方法的有效性和可靠性。

实施例2

本实施例与实施例1基本相同，区别之处在于：

(1)本实施例选用具有结晶信息的甲状腺激素的代谢产物[4-(4-羟基-3-碘代苯氧基)-3,5-二碘代-苯基]-乙酸([4-(4-Hydroxy-3-iodo-phenoxy)-3,5-Diiodophenyl]-Acetic Acid，4HY)为非竞争性配体分子，以下均用4HY表示4-(4-羟基-3-碘代苯氧基)-3,5-二碘代-苯基]-乙酸。

(2)本实施例中，构建并优化非竞争性配体分子4HY的方法为：经由PubChem网站(https://pubchem.ncbi.nlm.nih.gov/)获取4HY的SMILES号，通过Chemdraw软件绘制结构，并经由Chem3D软件分子力学阿林格力场2(Molecular Mechanics,Allinger ForceField Version 2,MM2)进行初步优化，再由SYBYL软件下的鲍威尔(Powell)梯度算法和特里波(Tripos)力场进行再次优化，添加采用Gasteiger-Huckel方法计算电荷。在Pymol软件中同时打开PDB代码为2piv的晶体结构的.pdb文件，说明的是，因为从蛋白质数据库中下载的PDB代码为2piv的晶体结构为AR-DHT-T3复合体结构，因此，在本实施例中，为了构建AR-DHT-4HY三元复合体，需要将其中的T3去掉。然后打开4HY的.mol2文件，将4HY放置于AR表面大于5埃米的任意位置后，构建了AR-DHT-4HY三元复合体，存为.mol2格式，并使用SwissParam网站(http://www.swissparam.ch/)赋予4HY分子CHARMM力场。

(3)本实施例中，分子动力学模拟稳定复合体结构后，进行GSMD，具体的，为使非竞争性配体分子4HY可在有限的模拟时长内有效搜索AR表面，设置三个集合变量(Collectivevariables，CVs)以确定非竞争性配体分子相对于受体蛋白的空间位置信息。其中，CV1为4HY与正构配体结合腔(Ligand Binding Pocket，LBP)的距离；CV2为4HY、Asn705的α碳和Arg752的α碳之间形成的夹角；CV3为4HY、Arg752的α碳和Thr877的α碳之间形成的夹角。GSMD在GROMACS软件和Plumed 2.3.5软件运行，体系维持在1个标准大气压和300K温度下，高斯高度和宽度分别设置为1.2kJ/mol和0.1nm，模拟时长设定为50ns。

(4)本实施例中，如图3所示，卡通螺旋结构为AR受体，棍棒结构分别代表晶体结构和模拟结果中的4HY构象信息，自GSMD分子运动轨迹提取高频团簇代表性构象与晶体结构PDB代码为2piu的构象进行叠合分析，发现模拟识别出4HY的所处位点与晶体结构所示两位点一致，证明了该模拟方法的有效性和可靠性。

实施例3

本实施例选用受体蛋白为甲状腺激素受体α(Thyroid Hormone Receptor alpha，TRα)，以下均用TRα表示甲状腺激素受体α；正构配体分子选用3,3',5-三碘代-L-甲状腺原氨酸(3,3',5-Triiodo-L-thyronine，T3)，以下均用T3表示3,3',5-三碘代-L-甲状腺原氨酸；非竞争性配体分子选用3,5,3',5'-四碘-L-甲状腺素(3,5,3',5'-Tetraiodo-L-Thyronine，T4)，以下均用T4表示3,5,3',5'-四碘-L-甲状腺素。

本实施例的具体操作步骤如下：

(1)获取并优化受体蛋白的晶体结构：自蛋白质数据库RCSB Protein Data Bank(https://www.rcsb.org/)中搜索并下载TRα的晶体结构，选择PDB代码为4lnx的TRα-T3-T4复合体结构，分辨率为2.05埃米。经由Swiss-pdbviewer检查受体蛋白结构的完整性，并将残缺的氨基酸残基补充完整，随后在Pymol软件中移除受体蛋白的水分子，在SYBYL软件中对受体蛋白添加氢原子，并赋予AMBER力场。

(2)构建并优化配体分子结构：由于从蛋白质数据库中下载的PDB代码为4lnx的TRα-T3-T4复合体结构，包括了正构配体分子T3和非竞争性配体分子T4，且正构配体分子T3已经对接到核受体正构结合口袋，因此核受体-正构配体分子复合体已经构建完成。此外，在所下载的TRα-T3-T4复合体晶体结构中，T4已经结合在特定的位点上，因此该TRα-T3-T4复合体结构并不满足模拟的需求，需要重新进行构建。

在本实施例中，也无需再对配体分子进行优化。

在Pymol软件中打开PDB代码为4lnx的晶体结构，将T4放置于TRα表面大于5埃米的任意位置后，构建TRα-T3-T4三元复合体，分别保存配体分子T3和T4为.pdb格式，随后经由OpenBable软件进行加氢处理，并转换为.mol2格式转存。

(3)对TRα-T3-T4三元复合体，采用GROMACS软件进行4ns的分子动力学模拟。首先，对T3、T4两个配体分子和受体蛋白分别使用SwissParam网站(http://www.swissparam.ch/)和GROMACS软件赋予CHARMM(Chemistryat Harvard MacromolecularMechanics)力场；其次，将复合体浸入TIP3P模型水中，本实施例中构建复合体的边缘到水层边缘的距离为15埃米，并加入氯离子以平衡体系正电荷；随后，复合体系经由梯度下降法(steepest-descent)进行能量最小化，进而通过NVT(恒温恒容)系综和NPT(恒温恒压)系综两步平衡模拟使体系平衡下来。最后，在1个标准大气压和300K温度下，采用PME法用于计算远程电的相互作用，采用LINCS方法进行键的约束，完成4ns的分子动力学模拟，平衡复合体系。

(4)分子动力学模拟稳定复合体结构后，进行GSMD，为使非竞争性配体分子T4可在有限的模拟时长内有效搜索TRα表面，设置三个集合变量(Collective variables，CVs)以确定非竞争性配体分子相对于受体蛋白的空间位置信息。具体是指，将TRα受体与AR受体进行叠合后选择相对应的氨基酸，以设定集合变量，运行GSMD。本实施例中，CV1为T4与正构配体结合腔(Ligand Binding Pocket，LBP)的距离；CV2为T4、Thr76的α碳和Arg123的α碳之间形成的夹角；CV3为T4、Arg123的α碳和Phe242的α碳之间形成的夹角。GSMD在GROMACS软件和Plumed 2.3.5软件运行，体系维持在1个标准大气压和300K温度下，高斯高度和宽度分别设置为1.2kJ/mol和0.1nm，模拟时长设定为25ns。

(5)分子运动轨迹的位置聚类分析与代表性构象识别，具体的，将GSMD获取的分子运动轨迹进行位置聚类分析，cutoff值选定为0.25，筛选高频团簇位置为关键位点，并提取相应团簇的代表性构象信息。如图4所示，卡通螺旋结构为TRα受体，棍棒结构分别代表晶体结构和模拟结果中的T4构象信息，高频团簇代表性构象与晶体结构PDB代码为4lnx的构象叠合分析，发现模拟识别出T4的所处位点与晶体结构所示位点一致，证明了该方法的有效性和可靠性。

实施例4

本实施例与实施例1基本相同，区别在于：

(1)本实施例基于ToxCast/Tox21数据库检索选择溴虫腈(Chlorfenapyr)为非竞争性EDCs代表进行AR表面别构位点识别，即非竞争性配体分子为溴虫腈，以下均用CC-CHF表示溴虫腈。

(2)本实施例中，构建并优化CC-CHF的方法为：经由PubChem网站(https://pubchem.ncbi.nlm.nih.gov/)获取CC-CHF的SMILES号，通过Chemdraw软件绘制结构，并经由Chem3D软件分子力学阿林格力场2(Molecular Mechanics,Allinger Force FieldVersion 2,MM2)进行初步优化，再由SYBYL软件下的鲍威尔(Powell)梯度算法和特里波(Tripos)力场进行再次优化，添加采用Gasteiger-Huckel方法计算电荷。在Pymol软件中同时打开PDB代码为2piv的晶体结构的.pdb文件，说明的是，在本实施例中，也需要将T3去掉。然后打开CC-CHF的.mol2文件，将CC-CHF放置于AR表面大于5埃米的任意位置后，构建了AR-DHT-CC-CHF三元复合体。随后，CC-CHF存为.mol2格式并使用Swiss Param网站(http://www.swissparam.ch/)赋予CC-CHF分子CHARMM力场。

(3)本实施例中，分子动力学模拟稳定复合体结构后，进行GSMD，具体的，为使CC-CHF可在有限的模拟时长内有效搜索AR表面，设置三个集合变量(Collective variables，CVs)以确定CC-CHF对于受体蛋白的空间位置信息。其中CV1为CC-CHF与正构配体结合腔(Ligand Binding Pocket，LBP)的距离；CV2为CC-CHF、Asn705的α碳和Arg752的α碳之间形成的夹角；CV3为CC-CHF、Arg752的α碳和Thr877的α碳之间形成的夹角。GSMD在GROMACS软件和Plumed 2.3.5软件运行，体系维持在1个标准大气压和300K温度下，高斯高度和宽度分别设置为1.2kJ/mol和0.1nm，模拟时长设定为50ns。

(4)本实施例中，GSMD识别出的位点信息及代表性构象信息见图5，其中，卡通螺旋结构为AR受体，棍棒结构代表模拟结果中的CC-CHF代表性构象信息，椭圆区域代表别构位点信息。识别结果显示，在50ns模拟时间内溴虫腈完整搜索了AR表面，共识别出四大高频团簇(据出现频次由高到低排序，依次记为Site1-4)，即四大潜在别构位点；其中，CC-CHF主要停留的两大高频位点：第一个位点(Site1)位于AR的H3、H5和H12形成的空腔，为已知AR共激活因子结合位点(Activation Function 2，AF-2)；第二个位点(Site2)位于H6羧基端、H9和H1形成的凹状表面，为AR二聚过程的关键界面。共激活因子招募实验表明溴虫腈可抑制AR招募转录共激活因子，表明CC-CHF可能通过结合于AR别构位点干扰共激活因子招募过程从而产生内分泌干扰效应。

在本发明的所提供的四个实施例中，正构配体分子均是从晶体结构中提取的，并且，从蛋白质数据库中下载时，正构配体分子已经结合于核受体正构结合口袋中，因此无需再进行人工对接，但是，在本发明的其他实施例中，可能需要进行人工对接，在进行对接时，可将优化后的受体蛋白和正构配体分子导入SYBYL软件，然后将正构配体分子对接进入核受体正构结合口袋中即可。

最后，应该说明的是，本发明中，获取受体蛋白、配体因子的方法不局限与实施例中所使用的数据库或者网站，也可以是自行绘制或者从晶体结构中提取，进行相关操作是，也不局限于实施例中所采用的软件，也可采用能实现相同功能的其他软件。

综上，本发明所提供的方法，不易受初始已知信息、蛋白构象和化合物种类的限制，能够高效准确地识别出ECDs核受体异构位点信息，从而为深入解析ECDs的核受体别构调控机制奠定基础。

上述实施例仅是本发明的优选实施方式，应当指出：对于本技术领域的普通技术人员来说，在不脱离本发明原理的前提下，还可以做出若干改进和等同替换，这些对本发明权利要求进行改进和等同替换后的技术方案，均落入本发明的保护范围。

Claims

1.一种内分泌干扰物与核受体作用的别构位点识别方法，其特征在于，包括以下步骤：

步骤1：获取并优化受体蛋白的晶体结构；

步骤2：构建并优化正构配体分子、非竞争性配体分子结构；

步骤3：将正构配体分子对接到核受体正构结合口袋，构建核受体-正构配体分子复合体，并将非竞争性配体分子放置于远离核受体表面的位置，构建核受体-正构配体分子-非竞争性配体分子三元复合体，并对所述三元复合体进行分子动力学模拟；进行分子动力学模拟的方法为：

然后，三元复合体经由梯度下降法进行能量最小化，进而通过NVT系综和NPT系综两步平衡模拟使复合体系平衡下来；

步骤4：经分子动力学模拟稳定复合体结构后，进行全局搜索分子动力学模拟；进行全局搜索分子动力学模拟的方法为：

然后，采用GROMACS软件和Plumed软件运行，体系维持在设定气压和温度下，并定量设置高斯高度和宽度；

2.根据权利要求1所述的一种内分泌干扰物与核受体作用的别构位点识别方法，其特征在于，步骤1中，通过蛋白质数据库获取受体蛋白的晶体结构。

3.根据权利要求1所述的一种内分泌干扰物与核受体作用的别构位点识别方法，其特征在于，步骤1中，优化受体蛋白的晶体结构的方法为：

4.根据权利要求1所述的一种内分泌干扰物与核受体作用的别构位点识别方法，其特征在于，步骤2中，构建正构配体分子、非竞争性配体分子结构的方法为：

5.根据权利要求1所述的一种内分泌干扰物与核受体作用的别构位点识别方法，其特征在于，步骤2中，优化正构配体分子、非竞争性配体分子结构的方法为：

首先，由分子力学阿林格力场2进行初步优化；

6.根据权利要求1-5任一项所述的一种内分泌干扰物与核受体作用的别构位点识别方法，其特征在于，步骤3中，放置非竞争性配体分子时，非竞争性配体分子到远离核受体表面的距离大于5埃米。