CN116434828B - 基于计算结构生物学的蛋白分子动态二硫键的引入方法及装置 - Google Patents
基于计算结构生物学的蛋白分子动态二硫键的引入方法及装置 Download PDFInfo
- Publication number
- CN116434828B CN116434828B CN202310418537.9A CN202310418537A CN116434828B CN 116434828 B CN116434828 B CN 116434828B CN 202310418537 A CN202310418537 A CN 202310418537A CN 116434828 B CN116434828 B CN 116434828B
- Authority
- CN
- China
- Prior art keywords
- site
- protein molecule
- target protein
- crystal structure
- sites
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 102000004169 proteins and genes Human genes 0.000 title claims abstract description 238
- 108090000623 proteins and genes Proteins 0.000 title claims abstract description 238
- 238000000034 method Methods 0.000 title claims abstract description 40
- 235000018102 proteins Nutrition 0.000 claims abstract description 108
- 239000013078 crystal Substances 0.000 claims abstract description 96
- 125000000539 amino acid group Chemical group 0.000 claims abstract description 71
- 235000018417 cysteine Nutrition 0.000 claims abstract description 70
- XUJNEKJLAYXESH-UHFFFAOYSA-N cysteine Natural products SCC(N)C(O)=O XUJNEKJLAYXESH-UHFFFAOYSA-N 0.000 claims abstract description 68
- 238000012216 screening Methods 0.000 claims abstract description 45
- 238000000329 molecular dynamics simulation Methods 0.000 claims abstract description 35
- 238000004364 calculation method Methods 0.000 claims abstract description 32
- 230000008859 change Effects 0.000 claims abstract description 31
- 230000035772 mutation Effects 0.000 claims abstract description 31
- 230000003993 interaction Effects 0.000 claims description 26
- 239000002904 solvent Substances 0.000 claims description 20
- 239000003446 ligand Substances 0.000 claims description 15
- 150000003384 small molecules Chemical class 0.000 claims description 14
- 125000000151 cysteine group Chemical group N[C@@H](CS)C(=O)* 0.000 claims description 13
- 238000012545 processing Methods 0.000 claims description 12
- 230000003068 static effect Effects 0.000 abstract description 12
- XUJNEKJLAYXESH-REOHCLBHSA-N L-Cysteine Chemical group SC[C@H](N)C(O)=O XUJNEKJLAYXESH-REOHCLBHSA-N 0.000 description 56
- 238000013461 design Methods 0.000 description 30
- 101000917237 Homo sapiens Fibroblast growth factor 10 Proteins 0.000 description 23
- 102100028412 Fibroblast growth factor 10 Human genes 0.000 description 22
- 102000005962 receptors Human genes 0.000 description 13
- 108020003175 receptors Proteins 0.000 description 13
- 230000006870 function Effects 0.000 description 11
- 230000033001 locomotion Effects 0.000 description 11
- 238000010586 diagram Methods 0.000 description 8
- 238000001727 in vivo Methods 0.000 description 7
- 229960002897 heparin Drugs 0.000 description 6
- 229920000669 heparin Polymers 0.000 description 6
- 230000002085 persistent effect Effects 0.000 description 6
- BWGNESOTFCXPMA-UHFFFAOYSA-N Dihydrogen disulfide Chemical compound SS BWGNESOTFCXPMA-UHFFFAOYSA-N 0.000 description 5
- 101710182389 Fibroblast growth factor receptor 2 Proteins 0.000 description 5
- 102100023600 Fibroblast growth factor receptor 2 Human genes 0.000 description 5
- HTTJABKRGRZYRN-UHFFFAOYSA-N Heparin Chemical compound OC1C(NC(=O)C)C(O)OC(COS(O)(=O)=O)C1OC1C(OS(O)(=O)=O)C(O)C(OC2C(C(OS(O)(=O)=O)C(OC3C(C(O)C(O)C(O3)C(O)=O)OS(O)(=O)=O)C(CO)O2)NS(O)(=O)=O)C(C(O)=O)O1 HTTJABKRGRZYRN-UHFFFAOYSA-N 0.000 description 5
- 238000004088 simulation Methods 0.000 description 5
- 102000008300 Mutant Proteins Human genes 0.000 description 4
- 108010021466 Mutant Proteins Proteins 0.000 description 4
- 238000004590 computer program Methods 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 3
- 230000003287 optical effect Effects 0.000 description 3
- 125000004429 atom Chemical group 0.000 description 2
- 230000008827 biological function Effects 0.000 description 2
- 238000006243 chemical reaction Methods 0.000 description 2
- 150000001945 cysteines Chemical class 0.000 description 2
- 238000000324 molecular mechanic Methods 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 230000002269 spontaneous effect Effects 0.000 description 2
- 125000004434 sulfur atom Chemical group 0.000 description 2
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 2
- -1 Amino Chemical group 0.000 description 1
- 238000005481 NMR spectroscopy Methods 0.000 description 1
- 240000005499 Sasa Species 0.000 description 1
- 238000002441 X-ray diffraction Methods 0.000 description 1
- 239000002253 acid Substances 0.000 description 1
- 125000003275 alpha amino acid group Chemical group 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000003851 biochemical process Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000005460 biophysical method Methods 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 230000015556 catabolic process Effects 0.000 description 1
- 238000003776 cleavage reaction Methods 0.000 description 1
- 238000002425 crystallisation Methods 0.000 description 1
- 230000008025 crystallization Effects 0.000 description 1
- 238000006731 degradation reaction Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 229940079593 drug Drugs 0.000 description 1
- 239000003814 drug Substances 0.000 description 1
- 239000002355 dual-layer Substances 0.000 description 1
- 102000057243 human FGF10 Human genes 0.000 description 1
- 230000008676 import Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000000338 in vitro Methods 0.000 description 1
- 230000002779 inactivation Effects 0.000 description 1
- 229920002521 macromolecule Polymers 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000007935 neutral effect Effects 0.000 description 1
- 108090000765 processed proteins & peptides Proteins 0.000 description 1
- 230000004853 protein function Effects 0.000 description 1
- 238000000746 purification Methods 0.000 description 1
- 238000005215 recombination Methods 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 230000007017 scission Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 230000000087 stabilizing effect Effects 0.000 description 1
- 239000000758 substrate Substances 0.000 description 1
- 125000003396 thiol group Chemical group [H]S* 0.000 description 1
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B15/00—ICT specially adapted for analysing two-dimensional or three-dimensional molecular structures, e.g. structural or functional relations or structure alignment
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B20/00—ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
- G16B20/30—Detection of binding sites or motifs
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16C—COMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
- G16C10/00—Computational theoretical chemistry, i.e. ICT specially adapted for theoretical aspects of quantum chemistry, molecular mechanics, molecular dynamics or the like
Landscapes
- Life Sciences & Earth Sciences (AREA)
- Physics & Mathematics (AREA)
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Health & Medical Sciences (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- General Health & Medical Sciences (AREA)
- Biotechnology (AREA)
- Evolutionary Biology (AREA)
- Biophysics (AREA)
- Medical Informatics (AREA)
- Chemical & Material Sciences (AREA)
- Computing Systems (AREA)
- Crystallography & Structural Chemistry (AREA)
- Analytical Chemistry (AREA)
- Genetics & Genomics (AREA)
- Molecular Biology (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Peptides Or Proteins (AREA)
Abstract
本申请涉及基于计算结构生物学的蛋白分子动态二硫键的引入方法及装置。该引入方法包括:获取目标蛋白分子的第一晶体结构,按照第一预设条件从第一晶体结构的氨基酸残基中筛选出可突变为半胱氨酸的潜在位点;对目标蛋白分子的第一晶体结构进行分子动力学模拟,直至目标蛋白分子的构象变化处于平衡状态,选取处于平衡状态的目标蛋白分子的多个构象作为目标构象;计算目标构象的潜在位点中突变成半胱氨酸后可形成二硫键的位点作为待选位点;在待选位点中,筛选出突变后符合成键条件的位点作为动态二硫键引入位点。本申请提供的方案,能够解决因蛋白质晶体结构的静态单一构象造成的计算偏差问题。
Description
技术领域
本申请涉及计算机及计算结构生物学技术领域,尤其涉及一种基于计算结构生物学的蛋白分子动态二硫键的引入方法、装置、设备及存储介质。
背景技术
蛋白质的稳定性是影响蛋白药物的一个关键性因素。蛋白质的稳定性与其特定的氨基酸序列、剪切加工及空间结构都有密切的关系,其中,蛋白质的局部结构不稳定可能会引起蛋白质的局部构象变化,甚至导致蛋白质降解失活。提高蛋白质的局部稳定性的一种方法是设计引入二硫键。二硫键是由两个游离的半胱氨酸残基的硫醇基团间形成的共价键,在蛋白分子中起着稳定蛋白肽链空间结构的作用。通常二硫键数目越多,蛋白分子的稳定性就越强。
蛋白质结构数据库(Protein Data Bank,简称PDB)中已经解析出的蛋白晶体结构,绝大多数都是蛋白分子经蛋白重组技术在体外进行表达纯化与结晶,再利用X射线衍射、核磁共振或冷冻电镜等生物物理学方法解析所得,所得到的蛋白晶体构象往往是在实验状态下的一种单一非动态的物理静态单晶构象。然而蛋白分子作为一类生物大分子,在体内具有一定的刚性与柔性,蛋白分子在发挥其生物学功能时的构象不一定就是其所解析出的构象。蛋白分子的活性区域是灵活的,并非单一的刚性结构,伴随与受体、配体和底物的相互作用发生构象变化,存在不同层次不同自由度的运动,并在一定程度上达到一种运动平衡状态。而PDB数据库中解析出的蛋白晶体结构并不能完整地代表蛋白分子在体内发挥生物学功能的结构及体内运动状态下的形态。
随着量子化学、计算机技术及计算结构生物学的发展,分子动力学也融入到蛋白分子的结构与功能中。蛋白分子的结构、功能与分子动力学三者相适应:蛋白分子在行使功能的生化过程中,会有分子力学的能量变化,蛋白结构也会改变;蛋白结构发生变化,是受到分子力学的能量变化的影响,也影响蛋白功能。蛋白分子在体内是一个动态平衡的状态,是一个结构、功能与分子动力学三者相适应的状态。
相关技术中,一般可以通过二硫键设计软件如Disulfide by Design等利用PDB数据库中已经解析的蛋白质晶体结构,对蛋白质进行二硫键的设计引入。但是,这种二硫键的设计引入方法未考虑到蛋白分子动力学与运动平衡状态,引入的二硫键称为静态二硫键,容易因蛋白质晶体结构的静态单一构象造成计算偏差的问题。
发明内容
为解决或部分解决相关技术中存在的问题,本申请提供一种基于计算结构生物学的蛋白分子动态二硫键的引入方法及装置,能够解决因蛋白质晶体结构的静态单一构象造成的计算偏差问题。
本申请第一方面提供一种基于计算结构生物学的蛋白分子动态二硫键的引入方法,包括:
获取目标蛋白分子的第一晶体结构,按照第一预设条件从所述第一晶体结构的氨基酸残基中筛选出可突变为半胱氨酸的潜在位点;
对所述目标蛋白分子的第一晶体结构进行分子动力学模拟,直至所述目标蛋白分子的构象变化处于平衡状态,选取处于所述平衡状态的目标蛋白分子的多个构象作为目标构象;
计算所述目标构象的所述潜在位点中突变成半胱氨酸后可形成二硫键的位点作为待选位点;在所述待选位点中,筛选出突变后符合成键条件的位点作为动态二硫键引入位点。
作为一个可选的实施例,所述计算所述目标构象的所述潜在位点中突变成半胱氨酸后可形成二硫键的位点作为待选位点,包括:
计算所述目标构象的所述潜在位点中突变成半胱氨酸后可两两相互形成二硫键的潜在位点对,并作为待选位点对;和/或,
计算所述目标构象的所述潜在位点中突变成半胱氨酸后可与固有半胱氨酸残基形成二硫键的潜在位点,并作为待选位点。
作为一个可选的实施例,所述在所述待选位点中,筛选出突变后符合成键条件的位点作为动态二硫键引入位点,包括:
在所述待选位点对中,筛选出成键概率大于第一预设值、成键后熵和自由能减小且在所述目标构象中出现频率大于第二预设值的位点对作为动态二硫键引入位点对;和/或,
在所述待选位点中,筛选出成键概率大于第一预设值、成键后熵和自由能减小且在所述目标构象中出现频率大于第二预设值的位点作为动态二硫键引入位点。
作为一个可选的实施例,所述按照第一预设条件从所述第一晶体结构的氨基酸残基中筛选出可突变为半胱氨酸的潜在位点,包括:
计算所述第一晶体结构中每个氨基酸残基的溶剂可及表面积,将所述溶剂可及表面积大于阈值的氨基酸残基作为可突变为半胱氨酸的潜在位点。
作为一个可选的实施例,所述方法还包括:
获取目标蛋白分子与受体复合物的第二晶体结构,按照第二预设条件从所述第二晶体结构的氨基酸残基中筛选出第一关键位点,所述第一关键位点为筛选出可突变为半胱氨酸的潜在位点时待排除的氨基酸残基位点;和/或,
获取目标蛋白分子与小分子配体复合物的第三晶体结构,按照第三预设条件从所述第三晶体结构的氨基酸残基中筛选出第二关键位点,所述第二关键位点为筛选出可突变为半胱氨酸的潜在位点时待排除的氨基酸残基位点。
作为一个可选的实施例:
所述按照第二预设条件从所述第二晶体结构的氨基酸残基中筛选出第一关键位点,包括:
根据所述第二晶体结构,计算所述目标蛋白分子与所述目标蛋白分子的受体之间相互作用的氨基酸残基,并将所述相互作用的氨基酸残基作为第一关键位点;和/或,
所述按照第三预设条件从所述第三晶体结构的氨基酸残基中筛选出第二关键位点,包括:
根据所述第三晶体结构,计算所述目标蛋白分子与所述目标蛋白分子的小分子配体之间相互作用的氨基酸残基,并将所述相互作用的氨基酸残基作为第二关键位点。
作为一个可选的实施例,所述对所述目标蛋白分子的第一晶体结构进行分子动力学模拟,直至所述目标蛋白分子的构象变化处于平衡状态,包括:
对所述目标蛋白分子的第一晶体结构进行分子动力学模拟,判断所述目标蛋白分子的RMSD的收敛状况;
若所述目标蛋白分子的RMSD的收敛状况达到预设平台区域,则确定所述目标蛋白分子的构象变化处于平衡状态。
本申请第二方面提供一种基于计算结构生物学的蛋白分子动态二硫键的引入装置,包括:
第一获取及处理模块,用于获取目标蛋白分子的第一晶体结构,按照第一预设条件从所述第一晶体结构的氨基酸残基中筛选出可突变为半胱氨酸的潜在位点;
分子动力学模块,用于对所述目标蛋白分子的第一晶体结构进行分子动力学模拟,直至所述目标蛋白分子的构象变化处于平衡状态,选取处于所述平衡状态的目标蛋白分子的多个构象作为目标构象;
动态二硫键计算及筛选模块,用于计算所述目标构象的所述潜在位点中突变成半胱氨酸后可形成二硫键的位点作为待选位点;在所述待选位点中,筛选出突变后符合成键条件的位点作为动态二硫键引入位点。
本申请第三方面提供一种电子设备,包括:
处理器;以及
存储器,其上存储有可执行代码,当所述可执行代码被所述处理器执行时,使所述处理器执行如上所述的引入方法。
本申请第四方面提供一种计算机可读存储介质,其上存储有可执行代码,当所述可执行代码被电子设备的处理器执行时,使所述处理器执行如上所述的引入方法。
本申请提供的技术方案可以包括以下有益效果:
由于本申请实施例对目标蛋白分子的第一晶体结构进行了分子动力学模拟,在目标蛋白分子的构象变化处于平衡状态后再从中选择多个达到动态平衡状态的蛋白分子的构象作为二硫键的设计引入计算的初始构象,即通过蛋白分子的分子动力学模拟获取运动达到动态平衡时期的各蛋白分子构象,这样可以减少由蛋白分子运动造成的引起的误差,同时避免了使用蛋白晶体结构静态单一构象引起的计算偏差,可以获得更接近于体内真实状态的蛋白分子演算结果。而且,本申请实施例计算出目标构象的潜在位点中突变成半胱氨酸后可形成二硫键的位点作为待选位点,再在待选位点中,筛选出符合成键条件的位点作为动态二硫键引入位点,这样实现了二硫键的动态引入,可以大幅提高二硫键引入的成功率。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本申请。
附图说明
通过结合附图对本申请示例性实施方式进行更详细地描述,本申请的上述以及其他目的、特征和优势将变得更加明显,其中,在本申请示例性实施方式中,相同的参考标号通常代表相同部件。
图1是本申请实施例示出的基于计算结构生物学设计的蛋白分子表面动态二硫键的引入方法的第一流程示意图;
图2是本申请实施例示出的基于计算结构生物学设计的蛋白分子表面动态二硫键的引入方法的第二流程示意图;
图3是本申请实施例示出的基于计算结构生物学设计的蛋白分子表面动态二硫键的引入方法的框架示意图;
图4是本申请实施例示出的以FGF10晶体结构为基础K153C-F167C位点对突变成半胱氨酸后相互形成二硫键的突变蛋白分子的模型图;
图5是本申请实施例示出的基于计算结构生物学设计的蛋白分子表面动态二硫键的引入装置的结构示意图;
图6是本申请实施例示出的电子设备的结构示意图。
具体实施方式
下面将参照附图更详细地描述本申请的实施方式。虽然附图中显示了本申请的实施方式,然而应该理解,可以以各种形式实现本申请而不应被这里阐述的实施方式所限制。相反,提供这些实施方式是为了使本申请更加透彻和完整,并且能够将本申请的范围完整地传达给本领域的技术人员。
在本申请使用的术语是仅仅出于描述特定实施例的目的,而非旨在限制本申请。在本申请和所附权利要求书中所使用的单数形式的“一种”、“一个”、“此”、“其”和“该”也旨在包括多数形式,除非上下文清楚地表示其他含义。还应当理解,本文中使用的术语“和/或”是指并包含一个或多个相关联的列出项目的任何或所有可能组合。
在提供了数值范围的情况下,应当理解范围的上限和下限和规定范围中的任何其他规定或居间数值之间的每个居间数值均涵盖在本申请内。这些较小范围的上限和下限可以独立包括在较小的范围中,并且也涵盖在本申请内,服从规定范围中任何明确排除的限度。在规定的范围包含一个或两个限度的情况下,排除那些包括的限度之任一或两者的范围也包含在本申请中。
相关技术中,一般可以通过二硫键设计软件如Disulfide by Design等利用PDB数据库中已经解析的蛋白质晶体结构,对蛋白质进行二硫键的设计引入。但是,这种二硫键的设计引入方法未考虑到蛋白分子动力学与运动平衡状态,引入的二硫键称为静态二硫键,容易因蛋白质晶体结构的静态单一构象造成计算偏差的问题。
针对上述问题,本申请实施例提供一种基于计算结构生物学设计的蛋白分子表面动态二硫键的引入方法,能够解决因蛋白质晶体结构的静态单一构象造成的计算偏差问题。
以下结合附图详细描述本申请实施例的技术方案。
图1是本申请实施例示出的基于计算结构生物学设计的蛋白分子表面动态二硫键的引入方法的第一流程示意图。
参见图1,该基于计算结构生物学设计的蛋白分子表面动态二硫键的引入方法包括:
步骤S1:获取目标蛋白分子的第一晶体结构,按照第一预设条件从第一晶体结构的氨基酸残基中筛选出可突变为半胱氨酸的潜在位点。
获取目标蛋白分子的第一晶体结构可以从PDB数据库或者通过建模获得,以目标蛋白分子的第一晶体结构作为初始的计算文件。其中,PDB数据库获取的目标蛋白分子的第一晶体结构可以是指以pdb文件保存的蛋白质三维结构信息,其包含蛋白质的结构说明,如二硫键、螺旋、片层、活性位点等等。还需说明的是,可以采用相关技术的建模方法进行建模,本申请对此不加以限定。
其中按照第一预设条件从第一晶体结构的氨基酸残基中筛选出可突变为半胱氨酸的潜在位点,可以包括:计算第一晶体结构中每个氨基酸残基的溶剂可及表面积,将溶剂可及表面积大于阈值的氨基酸残基作为可突变为半胱氨酸的潜在位点。
步骤S2:对目标蛋白分子的第一晶体结构进行分子动力学模拟,直至目标蛋白分子的构象变化处于平衡状态,选取处于平衡状态的目标蛋白分子的多个构象作为目标构象。
其中,可以对目标蛋白分子的第一晶体结构进行分子动力学模拟,判断目标蛋白分子的RMSD的收敛状况;若目标蛋白分子的RMSD的收敛状况达到预设平台区域,则确定目标蛋白分子的构象变化处于平衡状态。
步骤S3:计算目标构象的潜在位点中突变成半胱氨酸后可形成二硫键的位点作为待选位点;在待选位点中,筛选出突变后符合成键条件的位点作为动态二硫键引入位点。
由于目标构象的潜在位点中突变成半胱氨酸后可形成二硫键的待选位点是利用动态构象计算得到,存在一定的动态偏差,因此不是所有的待选位点在真实蛋白质分子中都能形成稳固的二硫键,且不影响真实蛋白质分子的结构。所以还需要对待选位点按照成键条件进行筛选,最后在筛选出的动态二硫键引入位点设计半胱氨酸突变而引入二硫键,可提高蛋白质分子的稳定性。
其中,可以计算目标构象的潜在位点中突变成半胱氨酸后可两两相互形成二硫键的潜在位点对,并作为待选位点对。
其中,可以计算目标构象的潜在位点中突变成半胱氨酸后可与固有半胱氨酸形成二硫键的潜在位点,并作为待选位点。
例如,在待选位点对和/或待选位点中,筛选出成键概率大于第一预设值、成键后熵和自由能减小且在目标构象中出现频率大于第二预设值的位点作为动态二硫键引入位点。
从该实施例可以看出,由于本申请实施例对目标蛋白分子的第一晶体结构进行了分子动力学模拟,在目标蛋白分子的构象变化处于平衡状态后再从中选择多个达到动态平衡状态的蛋白分子的构象作为动态二硫键的设计引入计算的初始构象,即通过蛋白分子的分子动力学模拟获取运动达到动态平衡时期的各蛋白分子构象,这样可以减少由蛋白分子运动造成的引起的误差,同时避免了使用蛋白晶体结构静态单一构象引起的计算偏差,可以获得更接近于体内真实状态的蛋白分子演算结果。而且,本申请实施例计算出目标构象的潜在位点中突变成半胱氨酸后可形成二硫键的位点作为待选位点,再在待选位点中,筛选出符合成键条件的位点作为动态二硫键引入位点,这样实现了二硫键的动态引入,可以大幅提高二硫键引入的成功率。
图2是本申请实施例示出的基于计算结构生物学设计的蛋白分子表面动态二硫键的引入方法的第二流程示意图。
参见图2,该基于计算结构生物学设计的蛋白分子表面动态二硫键的引入方法包括:
步骤S10:获取目标蛋白分子的第一晶体结构,计算第一晶体结构中每个氨基酸残基的溶剂可及表面积,将溶剂可及表面积大于阈值的氨基酸残基作为可突变为半胱氨酸的潜在位点。
获取目标蛋白分子的第一晶体结构可以从PDB数据库或者通过建模获得,以目标蛋白分子的第一晶体结构作为初始的计算文件。其中,PDB数据库获取的目标蛋白分子的第一晶体结构可以是指以pdb文件保存的蛋白质三维结构信息,其包含蛋白质的结构说明,如二硫键、螺旋、片层、活性位点等等。其中,蛋白质结构数据库可以预先构建。还需说明的是,可以采用相关技术的建模方法进行建模,本申请对此不加以限定。
本申请实施例先按照第一预设条件初步筛选出可突变为半胱氨酸的潜在位点,后续再参考这些非关键位点,筛选出可形成二硫键的半胱氨酸残基位点,可以大大节约计算量,提高处理效率。
作为一个优选的实施例,步骤S10可以包括:计算第一晶体结构中每个氨基酸残基的溶剂可及表面积,将溶剂可及表面积大于阈值的氨基酸残基作为可形成二硫键的氨基酸残基位点。
本申请实施例利用预设软件例如Gromacs软件中的gmx sasa函数,计算目标蛋白分子的第一晶体结构的各氨基酸残基的溶剂可及表面积。选择溶剂可及表面积大于的氨基酸残基作为可突变为半胱氨酸的潜在位点。这些位点为蛋白分子的表面位点,且侧链基团朝向蛋白分子外部延伸,占据一定的蛋白分子表面空间,并能与外界环境溶液直接接触,因此可将这些位点作为可突变为半胱氨酸而引入二硫键的潜在位点。
步骤S11:获取目标蛋白分子与受体复合物的第二晶体结构,按照第二预设条件从第二晶体结构的氨基酸残基中筛选出第一关键位点,第一关键位点为筛选出可突变为半胱氨酸的潜在位点时待排除的氨基酸残基位点。
本申请实施例中将目标蛋白分子和受体之间相互作用的位点定义为第一关键位点。由于第一关键位点为目标蛋白分子与受体之间相互作用的位点,说明第一关键位点发生突变会对目标蛋白分子的结构和功能产生大幅度的改变,甚至使蛋白分子失去活性。因此在筛选出可突变为半胱氨酸的潜在位点时需要将第一关键位点排除,以免在后续将关键位点作为二硫键引入位点而进行半胱氨酸突变,导致目标蛋白分子的结构产生大的变化,影响目标蛋白分子的稳定性。
作为一个优选的实施例,步骤S11可以包括:根据第二晶体结构,计算目标蛋白分子与目标蛋白分子的受体之间相互作用的氨基酸残基,并将相互作用的氨基酸残基作为第一关键位点。
将目标蛋白分子与受体复合物的第二晶体结构导入LigPlot软件,选择DIMPLOT功能,分析目标蛋白分子与目标蛋白分子的受体蛋白分子之间的相互作用,计算目标蛋白分子中与受体蛋白分子存在相互作用的氨基酸残基位点,并作为第一关键位点,从而在后续动态二硫键设计引入计算中排除这些第一关键位点。
步骤S12:获取目标蛋白分子与小分子配体复合物的第三晶体结构,按照第三预设条件从第三晶体结构的氨基酸残基中筛选出第二关键位点,第二关键位点为筛选出可突变为半胱氨酸的潜在位点时待排除的氨基酸残基位点。
本申请实施例将目标蛋白分子和小分子配体之间相互作用的位点定义为第二关键位点。由于第二关键位点为目标蛋白分子与小分子配体之间相互作用的位点,说明第二关键位点发生突变会对目标蛋白分子的结构和功能产生大幅度的改变,甚至使蛋白分子失去活性。因此在筛选出可突变为半胱氨酸的潜在位点时需要将第二关键位点排出,以免在后续将关键位点作为动态二硫键引入位点而进行半胱氨酸突变,导致目标蛋白分子的结构产生大的变化,影响目标蛋白分子的稳定性。
作为一个优选的实施例,步骤S12可以包括:根据第三晶体结构,计算目标蛋白分子与目标蛋白分子的小分子配体之间相互作用的氨基酸残基,并将相互作用的氨基酸残基作为第二关键位点。
将目标蛋白分子与小分子配体复合物的第三晶体结构导入LigPlot软件,选择LIGPLOT功能,分析目标蛋白分子与小分子配体复合物之间的相互作用,计算目标蛋白分子中与小分子配体复合物存在相互作用的氨基酸残基位点,并作为第二关键位点,从而在后续动态二硫键设计引入计算中排除这些第二关键位点。
需说明的是,步骤S10、S11和S12没有必然的顺序关系,可以同时并列执行。
步骤S20:对目标蛋白分子的第一晶体结构进行分子动力学模拟,判断目标蛋白分子的RMSD的收敛状况。
本申请对目标蛋白分子晶体结构进行分子动力学模拟可以由预设软件例如Gromacs软件进行。例如,对目标蛋白分子晶体结构在30℃下进行分子动力学模拟。在Gromacs软件中输入目标蛋白分子晶体结构,并设置适当的模拟参数进行模拟,观察分子运动的构象变化以及RMSD(Root Mean Squared Error,均方根误差)的收敛情况。RMSD表示蛋白质分子的构象变化对于原子总数的平均。RMSD表示蛋白质分子不同构象同一原子的距离。蛋白质分子的RMSD可以揭示蛋白质分子在模拟过程中的构象与初始构象之间的位置变化;蛋白质的RMSD的变化趋势也是判断模拟是否达到稳定的重要表征。
步骤S21:若目标蛋白分子的RMSD的收敛状况达到预设平台区域,则确定目标蛋白分子的构象变化趋于平衡状态。
当RMSD达到预设平台区域时,表明蛋白质分子的构象与初始构象之间的位置变化趋于稳定,即在平衡时期内的目标蛋白分子的构象变化会趋于平衡状态。
目标蛋白分子的构象变化处于平衡状态之后,可以随机选取多个处于平衡状态的蛋白分子构象作为动态二硫键引入计算的初始构象。一般可以在选择蛋白分子构象时选择500-50000,例如可以选10000个处于平衡状态的蛋白分子构象作为动态二硫键设计引入计算的初始构象。使用多个达到动态平衡状态的蛋白分子的构象作为计算结构生物学的起始文件,可以获得更接近于真实状态的蛋白分子演算结果,实现二硫键的动态引入。
步骤S30:计算目标构象的潜在位点中突变成半胱氨酸后可两两相互形成二硫键的潜在位点对,并作为待选位点对。
本申请实施例中的待选位点对可以利用预设软件例如SSBONDPredict软件进行。在SSBONDPredict软件中输入多个目标构象,可以计算每个目标构象的潜在位点中突变成半胱氨酸后可两两相互形成二硫键的位点作为待选位点对,即潜在位点中两个潜在位点突变成半光氨酸后可相互形成二硫键。
步骤S31:在待选位点对中,筛选出成键概率大于第一预设值、成键后熵和自由能减小且在目标构象中出现频率大于第二预设值的位点对作为动态二硫键引入位点对。
本申请实施例的第一预设值和第二预设值可以均设置为50%,还可根据实际需求进行调整,对此并不限定。
步骤S32:计算目标构象的潜在位点中突变成半胱氨酸后可与固有半胱氨酸形成二硫键的潜在位点,并作为待选位点。
本申请实施例中的待选位点可以利用预设软件例如SSBONDPredict软件进行。在SSBONDPredict软件中输入多个目标构象,可以计算每个目标构象的潜在位点中突变成半胱氨酸后可与固有半胱氨酸残基形成二硫键的位点作为待选位点,即一个潜在位点突变成半光氨酸后可与目标蛋白分子中固有的半胱氨酸残基相互形成二硫键。
步骤S33:在待选位点中,筛选出成键概率大于第一预设值、成键后熵和自由能减小且在目标构象中出现频率大于第二预设值的位点作为动态二硫键引入位点。
本申请实施例的第一预设值和第二预设值可以均设置为50%,还可根据实际需求进行调整,对此并不限定。
本申请实施例通过成键条件对待选位点对和待选位点进行筛选,得到的二硫键引入位点的成键概率大,说明引入二硫键后目标蛋白分子的稳固性可以得到保障;且成键后的熵和自由能减小,说明成键反应基本是自发形成,成键过程对目标蛋白分子的构象基本不会产生变化;以及在多个目标构象中出现的频率大于第二预设值,说明成键后即使目标蛋白分子的构象产生变化,变化的趋势也是接近多个目标构象,仍然属于分子动力学的平衡状态。因此,成键条件的设置使得二硫键引入位点突变为半胱氨酸后能两两之间形成稳固的二硫键或与目标蛋白分子固有的半胱氨酸残基之间形成稳固的二硫键,从而可以提高目标蛋白分子的稳定性。
还需说明的是,步骤S30和S32没有必然的顺序关系,可以同时并列执行。
作为一个可选的实施例,本申请可以根据上述的处理结果,使动态二硫键引入位点突变为半胱氨酸后引入二硫键,从而产生突变蛋白;再对突变蛋白建模,观察新引入的半胱氨酸在分子结构中的位置,检查侧链基团的分布合理性,分析新引入的半胱氨酸在蛋白分子构象不发生重大改变的条件下形成二硫键的可能性,以及测量两个可形成二硫键的半胱氨酸残基中的硫原子的分子距离是否在二硫键的键长范围内。
从该实施例可以发现,本申请实施例通过成键条件对待选位点对和待选位点进行筛选,得到的二硫键引入位点的成键概率大,说明引入二硫键后目标蛋白分子的稳固性可以得到保障;且成键后的熵和自由能减小,说明成键反应基本是自发形成,成键过程对目标蛋白分子的构象基本不会产生变化;以及在多个目标构象中出现的频率大于第二预设值,说明成键后即使目标蛋白分子的构象产生变化,变化的趋势也是接近多个目标构象,仍然属于分子动力学的平衡状态。因此,成键条件的设置使得二硫键引入位点突变为半胱氨酸后能两两之间形成稳固的二硫键或与目标蛋白分子固有的半胱氨酸残基之间形成稳固的二硫键,从而可以提高目标蛋白分子的稳定性。
本申请实施例通过在待选位点对和待选位点中筛选出符合成键条件的动态二硫键引入位点之后,可在动态二硫键引入位点设计突变,使动态二硫键引入位点突变成半胱氨酸之后可两两之间形成二硫键或与目标蛋白分子固有的半胱氨酸残基之间形成二硫键,实现目标蛋白分子的表面动态二硫键的引入,从而提高蛋白质分子的稳定性。
下面本申请实施例以人FGF10蛋白分子为例,对基于计算结构生物学设计的蛋白分子表面动态二硫键的引入方法进行说明,但并不局限于此蛋白,参见图3所示,包括以下步骤:
1、从PDB数据库中获得FGF10蛋白分子与受体(例如FGFR2b)复合物的第二晶体结构1NUN,作为初始的计算文件。并从1NUN中分离出FGF10蛋白分子的第一晶体结构。
2、将1NUN复合物晶体结构导入LigPlot软件,选择DIMPLOT功能,分析FGF10与FGFR2b之间的相互作用,计算FGF10蛋白分子中与FGFR2b蛋白分子相互作用的氨基酸残基位点,并作为第一关键位点。FGF10的第73、74、75、76、77、78、83、85、87、89、102、104、113、114、115、116、117、118、121、122、131、146、154、155、156、159、160、161、162、202、203、204位氨基酸残基与FGFR2b有直接相互作用,后续动态二硫键设计引入的计算中可以排除这些第一关键位点。
3、由于PDB数据库中缺少FGF10蛋白分子与小分子配体复合物(例如肝素)的第三晶体结构。利用FGF2-FGFR2c-heparin的模型对FGF10进行了比对,得出FGF10的第177-197位点氨基酸残基为肝素结合区,其中R187是最重要的肝素结合位点,R193、K195、T197直接参与肝素结合,将这些位点作为第二关键位点,后续动态二硫键设计引入的计算中可以排除这些第二关键位点。
4、在Gromacs软件中输入FGF10晶体结构,利用gmx–sasa函数,计算FGF10蛋白分子的第一晶体结构中的各氨基酸残基的溶剂可及表面积,筛选溶剂可及表面积大于的氨基酸残基。排除FGF10与受体FGFR2b相互作用的第一关键位点,以及FGF10与小分子肝素相互作用的第二关键位点后,从FGF10蛋白分子的关键位点中筛选出第71、79、80、81、86、88、91、93、94、95、97、101、103、105、107、108、110、112、124、126、127、129、130、135、136、137、139、141、142、143、144、145、147、148、149、151、153、157、158、167、168、169、170、171、172、173、174、175、181、182、183、185、186、188、190、191、194、196、205、206、207位氨基酸残基溶剂可及表面积大于/>上述位点的氨基酸残基的侧链基团朝向蛋白分子外部延伸,占据一定的蛋白分子表面空间,且能与外界环境溶液直接接触,这些位点作为可突变为半胱氨酸而引入二硫键的潜在位点。
5、在Gromacs软件中输入FGF10的第一晶体结构,添加TIP3P水分子模型、Amber99sb-ildn力场及模拟盒子,再加入SPC216水溶剂模型,并将系统的电荷平衡至中性,将体系能量最小化,经NVT平衡与NPT平衡后,进行FGF10在30℃下30ns的分子动力学模拟。分析FGF10的分子的RMSD,当RMSD到达了预设平台区域,分子运动趋于平衡状态。随机选取10000个处于平衡状态时的蛋白分子构象作为动态二硫键的设计引入计算的初始构象。
6、在SSBONDPredict软件中输入上一步获取的10000个FGF10构象,计算每一个FGF10构象的潜在位点中突变成半胱氨酸后可两两相互形成二硫键的潜在位点对,以及可与固有半胱氨酸残基形成二硫键的潜在位点,并分别作为待选位点对和待选位点。以待选位点对为例,再根据待选位点对的二硫键成键概率、在10000个FGF10构象中重复出现的频率、自由能变化和熵变化,筛选出成键概率大于50%、熵和自由能减少、重复出现的频率大于50%的待选位点对作为动态二硫键引入位点对(参见表1)。
表1动态二硫键引入位点对
在上述动态二硫键引入位点对中,K153C-F167C在10000个FGF10构象计算结果中出现了9943次,出现频率最高,且K153C-F167C之间二硫键的形成概率最低为56.40%,最高为98.60%,熵变为-35.0117J/K﹒mol。因此确定K153C-F167C位点对为突变成半胱氨酸后可相互形成二硫键的动态二硫键引入位点对。
还需说明的是,本申请还可以是以FGF10晶体结构为基础,对K153C-F167C位点对突变成半胱氨酸后相互形成二硫键的突变蛋白分子建模,观察新引入的半胱氨酸在分子结构中的位置,检查侧链基团的分布合理性,分析新引入的半胱氨酸在蛋白分子构象不发生重大改变的条件下形成二硫键的可能性,以及测量两个半胱氨酸残基中的硫原子的分子距离是否在二硫键的键长范围内。如图4所示,突变蛋白模型中,突变后的153位与167位的半胱氨酸残基形成了稳固的二硫键,可以起到稳定蛋白结构的作用。
与前述应用功能实现方法实施例相对应,本申请还提供了一种基于计算结构生物学设计的蛋白分子表面动态二硫键的引入装置、电子设备及相应的实施例。
图5是本申请实施例示出的基于计算结构生物学设计的蛋白分子表面动态二硫键的引入装置的结构示意图。
参见图5,基于计算结构生物学设计的蛋白分子表面动态二硫键的引入装置包括第一获取及处理模块510、分子动力学模块520、动态二硫键计算及筛选模块530。
第一获取及处理模块510,用于获取目标蛋白分子的第一晶体结构,按照第一预设条件从第一晶体结构的氨基酸残基中筛选出可突变为半胱氨酸的潜在位点。
分子动力学模块520,用于对目标蛋白分子的第一晶体结构进行分子动力学模拟,直至目标蛋白分子的构象变化处于平衡状态,选取处于平衡状态的目标蛋白分子的多个构象作为目标构象。
动态二硫键计算及筛选模块530,用于计算目标构象的潜在位点中突变成半胱氨酸后可形成二硫键的位点作为待选位点;在待选位点中,筛选出突变后符合成键条件的位点作为动态二硫键引入位点。
可选的,第一获取及处理模块510可以包括潜在位点处理模块(图中未示出)。
潜在位点处理模块,用于计算第一晶体结构中每个氨基酸残基的溶剂可及表面积,将溶剂可及表面积大于阈值的氨基酸残基作为可突变为半胱氨酸的潜在位点。
可选的,动态二硫键计算及筛选模块530可以包括动态二硫键计算模块、第一筛选模块和第二筛选模块(图中未示出)。
动态二硫键计算模块,用于计算目标构象的潜在位点中突变成半胱氨酸后可两两相互形成二硫键的潜在位点对,并作为待选位点对;和/或,计算目标构象的潜在位点中突变成半胱氨酸后可与固有半胱氨酸残基形成二硫键的潜在位点,并作为待选位点。
第一筛选模块,用于在待选位点对中,筛选出成键概率大于第一预设值、成键后熵和自由能减小且在目标构象中出现频率大于第二预设值的位点对作为动态二硫键引入位点对;和/或,
第二筛选模块,用于在待选位点中,筛选出成键概率大于第一预设值、成键后熵和自由能减小且在目标构象中出现频率大于第二预设值的位点作为动态二硫键引入位点。
该基于计算结构生物学设计的蛋白分子表面动态二硫键的引入装置还可以包括关键位点处理模块(图中未示出)。
关键位点处理模块,用于获取目标蛋白分子与受体复合物的第二晶体结构,按照第二预设条件从第二晶体结构的氨基酸残基中筛选出第一关键位点,第一关键位点为筛选出可突变为半胱氨酸的潜在位点时待排除的氨基酸残基位点;和/或,获取目标蛋白分子与小分子配体复合物的第三晶体结构,按照第三预设条件从第三晶体结构的氨基酸残基中筛选出第二关键位点,第二关键位点为筛选出可突变为半胱氨酸的潜在位点时待排除的氨基酸残基位点。
优选的,关键位点处理模块用于根据第二晶体结构,计算目标蛋白分子与目标蛋白分子的受体之间相互作用的氨基酸残基,并将相互作用的氨基酸残基作为第一关键位点;和/或,用于根据第三晶体结构,计算目标蛋白分子与目标蛋白分子的小分子配体之间相互作用的氨基酸残基,并将相互作用的氨基酸残基作为第二关键位点。
优选的,分子动力学模块520用于对目标蛋白分子的第一晶体结构进行分子动力学模拟,判断目标蛋白分子的RMSD的收敛状况;若目标蛋白分子的RMSD的收敛状况达到预设平台区域,则确定目标蛋白分子的构象变化处于平衡状态。
本申请提供的基于计算结构生物学设计的蛋白分子表面动态二硫键的引入装置,对目标蛋白分子的第一晶体结构进行了分子动力学模拟,在目标蛋白分子的构象变化处于平衡状态后再从中选择多个达到动态平衡状态的蛋白分子的构象作为动态二硫键的设计引入计算的初始构象,即通过蛋白分子的分子动力学模拟获取运动达到动态平衡时期的各蛋白分子构象,这样可以减少由蛋白分子运动造成的引起的误差,同时避免了使用蛋白晶体结构静态单一构象引起的计算偏差,可以获得更接近于体内真实状态的蛋白分子演算结果。而且,本申请实施例计算出目标构象的潜在位点中突变成半胱氨酸后可形成二硫键的位点作为待选位点,再在待选位点中,筛选出符合成键条件的位点作为动态二硫键引入位点,这样实现了二硫键的动态引入,可以大幅提高二硫键引入的成功率。
关于上述实施例中的装置,其中各个模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述,此处将不再做详细阐述说明。
图6是本申请实施例示出的电子设备的结构示意图。
参见图6,电子设备600包括存储器610和处理器620。
处理器620可以是中央处理单元(Central Processing Unit,CPU),还可以是其他通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
存储器610可以包括各种类型的存储单元,例如系统内存、只读存储器(ROM)和永久存储装置。其中,ROM可以存储处理器620或者计算机的其他模块需要的静态数据或者指令。永久存储装置可以是可读写的存储装置。永久存储装置可以是即使计算机断电后也不会失去存储的指令和数据的非易失性存储设备。在一些实施方式中,永久性存储装置采用大容量存储装置(例如磁或光盘、闪存)作为永久存储装置。另外一些实施方式中,永久性存储装置可以是可移除的存储设备(例如软盘、光驱)。系统内存可以是可读写存储设备或者易失性可读写存储设备,例如动态随机访问内存。系统内存可以存储一些或者所有处理器在运行时需要的指令和数据。此外,存储器610可以包括任意计算机可读存储媒介的组合,包括各种类型的半导体存储芯片(例如DRAM,SRAM,SDRAM,闪存,可编程只读存储器),磁盘和/或光盘也可以采用。在一些实施方式中,存储器610可以包括可读和/或写的可移除的存储设备,例如激光唱片(CD)、只读数字多功能光盘(例如DVD-ROM,双层DVD-ROM)、只读蓝光光盘、超密度光盘、闪存卡(例如SD卡、min SD卡、Micro-SD卡等)、磁性软盘等。计算机可读存储媒介不包含载波和通过无线或有线传输的瞬间电子信号。
电子设备600还包括显示器,显示器用于展示处理器620的执行结果。例如包括展示运算结果和计算结构等。
存储器610上存储有可执行代码,当可执行代码被处理器620处理时,可以使处理器620执行上文述及的方法中的部分或全部。
此外,根据本申请的方法还可以实现为一种计算机程序或计算机程序产品,该计算机程序或计算机程序产品包括用于执行本申请的上述方法中部分或全部步骤的计算机程序代码指令。
或者,本申请还可以实施为一种计算机可读存储介质(或非暂时性机器可读存储介质或机器可读存储介质),其上存储有可执行代码(或计算机程序或计算机指令代码),当可执行代码(或计算机程序或计算机指令代码)被电子设备(或服务器等)的处理器执行时,使处理器执行根据本申请的上述方法的各个步骤的部分或全部。
以上已经描述了本申请的各实施例,上述说明是示例性的,并非穷尽性的,并且也不限于所披露的各实施例。在不偏离所说明的各实施例的范围和精神的情况下,对于本技术领域的普通技术人员来说许多修改和变更都是显而易见的。本文中所用术语的选择,旨在最好地解释各实施例的原理、实际应用或对市场中的技术的改进,或者使本技术领域的其他普通技术人员能理解本文披露的各实施例。
Claims (9)
1.一种基于计算结构生物学的蛋白分子动态二硫键的引入方法,其特征在于,包括:
获取目标蛋白分子的第一晶体结构,按照第一预设条件从所述第一晶体结构的氨基酸残基中筛选出可突变为半胱氨酸的潜在位点;包括:计算所述第一晶体结构中每个氨基酸残基的溶剂可及表面积,将所述溶剂可及表面积大于阈值的氨基酸残基作为可突变为半胱氨酸的潜在位点;
对所述目标蛋白分子的第一晶体结构进行分子动力学模拟,直至所述目标蛋白分子的构象变化处于平衡状态,选取处于所述平衡状态的目标蛋白分子的多个构象作为目标构象;
计算所述目标构象的所述潜在位点中突变成半胱氨酸后可形成二硫键的位点作为待选位点;在所述待选位点中,筛选出突变后符合成键条件的位点作为动态二硫键引入位点;其中,所述成键条件为:成键概率大于第一预设值、成键后熵和自由能减小且在目标构象中出现频率大于第二预设值。
2.根据权利要求1所述的引入方法,其特征在于,所述计算所述目标构象的所述潜在位点中突变成半胱氨酸后可形成二硫键的位点作为待选位点,包括:
计算所述目标构象的所述潜在位点中突变成半胱氨酸后可两两相互形成二硫键的潜在位点对,并作为待选位点对;和/或,
计算所述目标构象的所述潜在位点中突变成半胱氨酸后可与固有半胱氨酸残基形成二硫键的潜在位点,并作为待选位点。
3.根据权利要求2所述的引入方法,其特征在于,所述在所述待选位点中,筛选出突变后符合成键条件的位点作为动态二硫键引入位点,包括:
在所述待选位点对中,筛选出成键概率大于第一预设值、成键后熵和自由能减小且在所述目标构象中出现频率大于第二预设值的位点对作为动态二硫键引入位点对;和/或,
在所述待选位点中,筛选出成键概率大于第一预设值、成键后熵和自由能减小且在所述目标构象中出现频率大于第二预设值的位点作为动态二硫键引入位点。
4.根据权利要求1所述的引入方法,其特征在于,所述方法还包括:
获取目标蛋白分子与受体复合物的第二晶体结构,按照第二预设条件从所述第二晶体结构的氨基酸残基中筛选出第一关键位点,所述第一关键位点为筛选出可突变为半胱氨酸的潜在位点时待排除的氨基酸残基位点;和/或,
获取目标蛋白分子与小分子配体复合物的第三晶体结构,按照第三预设条件从所述第三晶体结构的氨基酸残基中筛选出第二关键位点,所述第二关键位点为筛选出可突变为半胱氨酸的潜在位点时待排除的氨基酸残基位点。
5.根据权利要求4所述的引入方法,其特征在于:
所述按照第二预设条件从所述第二晶体结构的氨基酸残基中筛选出第一关键位点,包括:
根据所述第二晶体结构,计算所述目标蛋白分子与所述目标蛋白分子的受体之间相互作用的氨基酸残基,并将所述相互作用的氨基酸残基作为第一关键位点;和/或,
所述按照第三预设条件从所述第三晶体结构的氨基酸残基中筛选出第二关键位点,包括:
根据所述第三晶体结构,计算所述目标蛋白分子与所述目标蛋白分子的小分子配体之间相互作用的氨基酸残基,并将所述相互作用的氨基酸残基作为第二关键位点。
6.根据权利要求1所述的引入方法,其特征在于,所述对所述目标蛋白分子的第一晶体结构进行分子动力学模拟,直至所述目标蛋白分子的构象变化处于平衡状态,包括:
对所述目标蛋白分子的第一晶体结构进行分子动力学模拟,判断所述目标蛋白分子的RMSD的收敛状况;
若所述目标蛋白分子的RMSD的收敛状况达到预设平台区域,则确定所述目标蛋白分子的构象变化处于平衡状态。
7.一种基于计算结构生物学的蛋白分子动态二硫键的引入装置,其特征在于,包括:
第一获取及处理模块,用于获取目标蛋白分子的第一晶体结构,按照第一预设条件从所述第一晶体结构的氨基酸残基中筛选出可突变为半胱氨酸的潜在位点;包括:计算所述第一晶体结构中每个氨基酸残基的溶剂可及表面积,将所述溶剂可及表面积大于阈值的氨基酸残基作为可突变为半胱氨酸的潜在位点;
分子动力学模块,用于对所述目标蛋白分子的第一晶体结构进行分子动力学模拟,直至所述目标蛋白分子的构象变化处于平衡状态,选取处于所述平衡状态的目标蛋白分子的多个构象作为目标构象;
动态二硫键计算及筛选模块,用于计算所述目标构象的所述潜在位点中突变成半胱氨酸后可形成二硫键的位点作为待选位点;在所述待选位点中,筛选出突变后符合成键条件的位点作为动态二硫键引入位点;其中,所述成键条件为:成键概率大于第一预设值、成键后熵和自由能减小且在目标构象中出现频率大于第二预设值。
8.一种电子设备,其特征在于,包括:
处理器;以及
存储器,其上存储有可执行代码,当所述可执行代码被所述处理器执行时,使所述处理器执行如权利要求1-6中任一项所述的引入方法。
9.一种计算机可读存储介质,其上存储有可执行代码,当所述可执行代码被电子设备的处理器执行时,使所述处理器执行如权利要求1-6中任一项所述的引入方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310418537.9A CN116434828B (zh) | 2023-04-17 | 2023-04-17 | 基于计算结构生物学的蛋白分子动态二硫键的引入方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310418537.9A CN116434828B (zh) | 2023-04-17 | 2023-04-17 | 基于计算结构生物学的蛋白分子动态二硫键的引入方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN116434828A CN116434828A (zh) | 2023-07-14 |
CN116434828B true CN116434828B (zh) | 2024-03-26 |
Family
ID=87087017
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310418537.9A Active CN116434828B (zh) | 2023-04-17 | 2023-04-17 | 基于计算结构生物学的蛋白分子动态二硫键的引入方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116434828B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117198390B (zh) * | 2023-09-08 | 2024-03-12 | 中国科学院广州生物医药与健康研究院 | 通过设计和改造二硫键交联位点的slc膜蛋白复合物的制备方法 |
Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4908773A (en) * | 1987-04-06 | 1990-03-13 | Genex Corporation | Computer designed stabilized proteins and method for producing same |
WO2002073193A1 (en) * | 2001-03-12 | 2002-09-19 | Board Of Regents, The University Of Texas System | Computer-based strategy for peptide and protein conformational ensemble enumeration and ligand affinity analysis |
WO2005034840A2 (en) * | 2003-09-17 | 2005-04-21 | Sunesis Pharmaceuticals, Inc. | Identification of kinase inhibitors |
CN105950585A (zh) * | 2016-04-29 | 2016-09-21 | 华南农业大学 | 一种热稳定的脂肪酶及制备方法与应用 |
CN107698629A (zh) * | 2017-10-19 | 2018-02-16 | 上海科技大学 | 二硫键桥连去垢剂及其在膜蛋白研究中的应用 |
CN107858338A (zh) * | 2017-11-29 | 2018-03-30 | 华南农业大学 | 一种组合二硫键的耐热突变脂肪酶及其制备方法与应用 |
CN111161792A (zh) * | 2019-12-18 | 2020-05-15 | 南通大学 | 一种基于蛋白质空间结构的二硫键预测方法 |
CN113528476A (zh) * | 2021-08-20 | 2021-10-22 | 福建福大百特生物科技有限公司 | 一种葡萄糖氧化酶突变体及其编码基因和高效重组表达 |
CN115181169A (zh) * | 2022-05-13 | 2022-10-14 | 南京工业大学 | 一种提高重组贻贝蛋白黏附力的方法 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20140134647A1 (en) * | 2012-11-01 | 2014-05-15 | La Jolla Institute For Allergy And Immunology | Novel crystal structure and ligand binding sites of trail receptor |
-
2023
- 2023-04-17 CN CN202310418537.9A patent/CN116434828B/zh active Active
Patent Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4908773A (en) * | 1987-04-06 | 1990-03-13 | Genex Corporation | Computer designed stabilized proteins and method for producing same |
WO2002073193A1 (en) * | 2001-03-12 | 2002-09-19 | Board Of Regents, The University Of Texas System | Computer-based strategy for peptide and protein conformational ensemble enumeration and ligand affinity analysis |
WO2005034840A2 (en) * | 2003-09-17 | 2005-04-21 | Sunesis Pharmaceuticals, Inc. | Identification of kinase inhibitors |
CN105950585A (zh) * | 2016-04-29 | 2016-09-21 | 华南农业大学 | 一种热稳定的脂肪酶及制备方法与应用 |
CN107698629A (zh) * | 2017-10-19 | 2018-02-16 | 上海科技大学 | 二硫键桥连去垢剂及其在膜蛋白研究中的应用 |
CN107858338A (zh) * | 2017-11-29 | 2018-03-30 | 华南农业大学 | 一种组合二硫键的耐热突变脂肪酶及其制备方法与应用 |
CN111161792A (zh) * | 2019-12-18 | 2020-05-15 | 南通大学 | 一种基于蛋白质空间结构的二硫键预测方法 |
CN113528476A (zh) * | 2021-08-20 | 2021-10-22 | 福建福大百特生物科技有限公司 | 一种葡萄糖氧化酶突变体及其编码基因和高效重组表达 |
CN115181169A (zh) * | 2022-05-13 | 2022-10-14 | 南京工业大学 | 一种提高重组贻贝蛋白黏附力的方法 |
Non-Patent Citations (8)
Title |
---|
Molecular dynamics simulation and essential dynamics study of mutated plastocyanin: structural, dynamical and functional effects of a disulfide bridge insertion at the protein surface;Caterina Arcangeli 等;Biophysical Chemistry;第92卷(第3期);183-199 * |
Molecular Dynamics Simulations of Human Serum Albumin and Role of Disulfide Bonds;Maria Monica Castellanos 等;The Journal of Physical Chemistry B;第117卷(第40期);11895-11905 * |
二硫键对蛋白质稳定性的作用;张瑜虹;生物技术通讯;127-130 * |
基于理性设计及两亲聚合物修饰提升华根霉脂肪酶特性的研究;王睿;中国博士学位论文全文数据库 工程科技Ⅰ辑;第2021年卷(第3期);B018-5 * |
用嫁接活性位点方法设计新的功能蛋白质;叶玉珍 等;生物化学与生物物理学报;19991231(第03期);303-308 * |
蛋白质系统突变分析及系综优化算法的计算机实现;沈称意 等;上海大学学报(自然科学版);第14卷(第4期);377-382 * |
解脂耶氏酵母脂肪酶2的热稳定性改造及其突变体表达水平的优化;李力浪;中国优秀硕士学位论文全文数据库 农业科技辑;第2020年卷(第8期);D050-91 * |
钮成拓.芽孢杆菌属来源1,3-1,4-β-葡聚糖酶的热稳定性研究.中国博士学位论文全文数据库 工程科技Ⅰ辑.2017,第2017年卷(第3期),第2.2.6节、第3章. * |
Also Published As
Publication number | Publication date |
---|---|
CN116434828A (zh) | 2023-07-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Maffucci et al. | An efficient implementation of the Nwat-MMGBSA method to rescore docking results in medium-throughput virtual screenings | |
Li et al. | Systematic parameterization of monovalent ions employing the nonbonded model | |
Bordogna et al. | Predicting the accuracy of protein–ligand docking on homology models | |
Micheletti et al. | Accurate and efficient description of protein vibrational dynamics: comparing molecular dynamics and Gaussian models | |
Kitchen et al. | Docking and scoring in virtual screening for drug discovery: methods and applications | |
Ding et al. | Rapid flexible docking using a stochastic rotamer library of ligands | |
CN116434828B (zh) | 基于计算结构生物学的蛋白分子动态二硫键的引入方法及装置 | |
KR101991725B1 (ko) | 정량적 구조-성능 관계식의 수치적 반전과 분자동역학 전산모사를 통한 표적신약의 스크리닝 방법 | |
Çınaroğlu et al. | Comparative assessment of seven docking programs on a nonredundant metalloprotein subset of the PDBbind refined | |
Bruce Macdonald et al. | Ligand binding free energies with adaptive water networks: two-dimensional grand canonical alchemical perturbations | |
Hu et al. | Protein pharmacophore selection using hydration-site analysis | |
Nguyen et al. | Spatial decomposition of translational water–water correlation entropy in binding pockets | |
WO1996013785A1 (fr) | Procede pour extraire de nouveaux composes ligands contenus dans une base de donnees a structure tridimensionelle | |
Ortiz et al. | Reliability of comparative molecular field analysis models: effects of data scaling and variable selection using a set of human synovial fluid phospholipase A2 inhibitors | |
Mancini et al. | Unsupervised search of low-lying conformers with spectroscopic accuracy: A two-step algorithm rooted into the island model evolutionary algorithm | |
Hoffer et al. | S4MPLE—sampler for multiple protein-ligand entities: methodology and rigid-site docking benchmarking | |
Bottegoni | Protein-ligand docking | |
Tripathi et al. | Settling the long-standing debate on the proton storage site of the prototype light-driven proton pump bacteriorhodopsin | |
Mondal et al. | Exploring the effectiveness of binding free energy calculations | |
Nikitina et al. | Mixed implicit/explicit solvation models in quantum mechanical calculations of binding enthalpy for protein–ligand complexes | |
Singh et al. | The plasma factor XIII heterotetrameric complex structure: unexpected unequal pairing within a symmetric complex | |
Santos-Martins et al. | Charting hydrogen bond anisotropy | |
CN116486906B (zh) | 基于氨基酸残基突变提高蛋白质分子稳定性的方法及装置 | |
Melling et al. | Enhanced grand canonical sampling of occluded water sites using nonequilibrium candidate Monte Carlo | |
Baker et al. | Modeling aromatic liquids: toluene, phenol, and pyridine |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |