CN116486906B - 基于氨基酸残基突变提高蛋白质分子稳定性的方法及装置 - Google Patents
基于氨基酸残基突变提高蛋白质分子稳定性的方法及装置 Download PDFInfo
- Publication number
- CN116486906B CN116486906B CN202310458615.8A CN202310458615A CN116486906B CN 116486906 B CN116486906 B CN 116486906B CN 202310458615 A CN202310458615 A CN 202310458615A CN 116486906 B CN116486906 B CN 116486906B
- Authority
- CN
- China
- Prior art keywords
- crystal structure
- mutation
- free energy
- protein molecule
- site
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 230000035772 mutation Effects 0.000 title claims abstract description 173
- 102000004169 proteins and genes Human genes 0.000 title claims abstract description 171
- 108090000623 proteins and genes Proteins 0.000 title claims abstract description 171
- 125000000539 amino acid group Chemical group 0.000 title claims abstract description 77
- 238000000034 method Methods 0.000 title claims abstract description 40
- 239000013078 crystal Substances 0.000 claims abstract description 160
- 238000004364 calculation method Methods 0.000 claims abstract description 57
- 238000012216 screening Methods 0.000 claims abstract description 35
- 238000003860 storage Methods 0.000 claims abstract description 20
- 235000018102 proteins Nutrition 0.000 claims description 52
- 238000004422 calculation algorithm Methods 0.000 claims description 44
- 239000002904 solvent Substances 0.000 claims description 31
- 230000008859 change Effects 0.000 claims description 19
- 238000012867 alanine scanning Methods 0.000 claims description 11
- 235000004279 alanine Nutrition 0.000 claims description 10
- 230000033001 locomotion Effects 0.000 claims description 10
- 238000012545 processing Methods 0.000 claims description 7
- 238000006467 substitution reaction Methods 0.000 claims description 5
- 125000003295 alanine group Chemical group N[C@@H](C)C(=O)* 0.000 claims description 4
- 230000006870 function Effects 0.000 description 30
- 101000917237 Homo sapiens Fibroblast growth factor 10 Proteins 0.000 description 25
- 102100028412 Fibroblast growth factor 10 Human genes 0.000 description 24
- 102000005962 receptors Human genes 0.000 description 13
- 108020003175 receptors Proteins 0.000 description 13
- 230000003993 interaction Effects 0.000 description 10
- 230000008093 supporting effect Effects 0.000 description 9
- 102220362307 c.239G>T Human genes 0.000 description 8
- 238000010586 diagram Methods 0.000 description 7
- 239000000178 monomer Substances 0.000 description 7
- QNAYBMKLOCPYGJ-REOHCLBHSA-N L-alanine Chemical compound C[C@H](N)C(O)=O QNAYBMKLOCPYGJ-REOHCLBHSA-N 0.000 description 6
- 239000002245 particle Substances 0.000 description 6
- 230000002085 persistent effect Effects 0.000 description 6
- 240000005499 Sasa Species 0.000 description 5
- 239000003814 drug Substances 0.000 description 5
- 239000000126 substance Substances 0.000 description 5
- FAPWRFPIFSIZLT-UHFFFAOYSA-M Sodium chloride Chemical compound [Na+].[Cl-] FAPWRFPIFSIZLT-UHFFFAOYSA-M 0.000 description 4
- 238000004590 computer program Methods 0.000 description 4
- 238000013461 design Methods 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 4
- 238000004088 simulation Methods 0.000 description 4
- 102100023600 Fibroblast growth factor receptor 2 Human genes 0.000 description 3
- 101710182389 Fibroblast growth factor receptor 2 Proteins 0.000 description 3
- 238000012824 chemical production Methods 0.000 description 3
- 230000003287 optical effect Effects 0.000 description 3
- 230000009466 transformation Effects 0.000 description 3
- 102000016928 DNA-directed DNA polymerase Human genes 0.000 description 2
- 108010014303 DNA-directed DNA polymerase Proteins 0.000 description 2
- 102000008300 Mutant Proteins Human genes 0.000 description 2
- 108010021466 Mutant Proteins Proteins 0.000 description 2
- 229940079593 drug Drugs 0.000 description 2
- 230000007613 environmental effect Effects 0.000 description 2
- 229920002521 macromolecule Polymers 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 230000005610 quantum mechanics Effects 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 238000000926 separation method Methods 0.000 description 2
- 239000011780 sodium chloride Substances 0.000 description 2
- 241000894007 species Species 0.000 description 2
- 241000193830 Bacillus <bacterium> Species 0.000 description 1
- 102220477368 Bis(5'-nucleosyl)-tetraphosphatase [asymmetrical]_K81M_mutation Human genes 0.000 description 1
- 102000004190 Enzymes Human genes 0.000 description 1
- 108090000790 Enzymes Proteins 0.000 description 1
- 241000588724 Escherichia coli Species 0.000 description 1
- 102220535519 Probable methyltransferase TARBP1_T86F_mutation Human genes 0.000 description 1
- 238000009825 accumulation Methods 0.000 description 1
- 235000001014 amino acid Nutrition 0.000 description 1
- 150000001413 amino acids Chemical class 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 125000004429 atom Chemical group 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000000975 bioactive effect Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 239000002355 dual-layer Substances 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 102000057243 human FGF10 Human genes 0.000 description 1
- 229910052739 hydrogen Inorganic materials 0.000 description 1
- 239000001257 hydrogen Substances 0.000 description 1
- 230000002209 hydrophobic effect Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000001727 in vivo Methods 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000003752 polymerase chain reaction Methods 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B20/00—ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
- G16B20/50—Mutagenesis
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B15/00—ICT specially adapted for analysing two-dimensional or three-dimensional molecular structures, e.g. structural or functional relations or structure alignment
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B20/00—ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
- G16B20/30—Detection of binding sites or motifs
Landscapes
- Physics & Mathematics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Engineering & Computer Science (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Chemical & Material Sciences (AREA)
- Biophysics (AREA)
- Theoretical Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Medical Informatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Biotechnology (AREA)
- Evolutionary Biology (AREA)
- Analytical Chemistry (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Molecular Biology (AREA)
- Genetics & Genomics (AREA)
- Crystallography & Structural Chemistry (AREA)
- Peptides Or Proteins (AREA)
Abstract
本申请涉及一种基于氨基酸残基突变提高蛋白质分子稳定性的方法、装置、设备及存储介质。该方法包括:获取目标蛋白分子的第一晶体结构;从第一晶体结构的氨基酸残基中筛选出非关键位点;对第一晶体结构进行自由能计算,并得到多个计算结果,多个计算结果包括目标蛋白分子的构象和自由能;比较多个计算结果的自由能,并将满足预置条件的构象作为目标蛋白分子的目标晶体结构;对目标晶体结构的非关键位点进行虚拟突变,并计算非关键位点的突变自由能;根据非关键位点的突变自由能,将满足突变条件的非关键位点作为突变位点;根据突变位点对目标蛋白分子进行突变以提高目标蛋白分子的稳定性。本申请提供的方案,能够提高蛋白质分子稳定性。
Description
技术领域
本申请涉及计算机及计算结构生物学技术领域,尤其涉及一种基于氨基酸残基突变致使其自由能变下降以提高蛋白质分子稳定性的方法、装置、设备及存储介质。
背景技术
蛋白质作为生物活性因子及酶已被广泛地运用于生物医药领域与化工生产领域。蛋白质具有高活性、特异性强、功能明确等特性。但蛋白质结构也具有物理与化学性质的不稳定性,这也使得很多天然蛋白无法直接被利用。
传统的生物学认为,蛋白的结构与功能相适应,是一种自然选择与进化的结果。提高蛋白质分子的稳定性需要从其它生存在环境条件恶劣的物种中所获得。例如聚合酶链式反应中所使用的DNA聚合酶来自于一株生长在温泉中的噬热杆菌,较最原始的大肠杆菌DNA聚合酶的热稳定性大幅提升。然而在恶劣环境条件中生存的物种只占有极少部分,从天然环境中搜寻稳定性高的蛋白质分子的成本巨大。
之后出现了蛋白定向进化技术:对于已知结构与功能的蛋白分子人为制造筛选压力,定向筛选适应压力环境的突变,加快蛋白分子进化的速率。但是,定向进化非常耗时,代价昂贵,具有不可预知性。实验条件下难以模拟出生物医药尤其是化工生产的复杂苛刻环境,所获得突变体蛋白很难满足工程化需求。对于未知结构与功能的蛋白,使用传统生物学进行定向进化难度更大。
再之后出现了计算结构生物学,使得传统生物大分子研究走上了信息化和计算结构的快车道。计算结构生物学的计算遵循物质的第一性原理与能量最低原理,即包括生物大分子在内的所有物质均由基本粒子组成,所有基本粒子相互作用及其基本运动规律,均可使用量子力学理论计算,而一个系统中所有基本粒子在总体能量最低时的状态是最稳定的平衡态。在模拟药物如何与体内蛋白分子耦合时,计算机可针对目标蛋白分子中与药物相互作用的原子进行量子理论计算。
因此,如何基于计算结构生物学技术,使蛋白分子整体自由能最小化,最终形成较为稳定的具有一定功能的结构,是亟需解决的难题。
发明内容
为解决或部分解决相关技术中存在的问题,本申请提供一种基于氨基酸残基突变提高蛋白质分子稳定性的方法及装置,能够从蛋白分子整体自由能最小化的角度计算可突变位点,最终形成较为稳定的具有一定功能的结构,提高蛋白质分子稳定性。
本申请第一方面提供一种基于氨基酸残基突变提高蛋白质分子稳定性的方法,包括:
获取目标蛋白分子的第一晶体结构;
从所述第一晶体结构的氨基酸残基中筛选出非关键位点;
对所述第一晶体结构进行自由能计算,并得到多个计算结果,所述多个计算结果包括目标蛋白分子的构象和自由能;
比较所述多个计算结果的自由能,并将满足预置条件的构象作为所述目标蛋白分子的目标晶体结构;
对所述目标晶体结构的所述非关键位点进行虚拟突变,并计算所述非关键位点的突变自由能;
根据所述非关键位点的突变自由能,将满足突变条件的所述非关键位点作为突变位点;
根据所述突变位点对所述目标蛋白分子进行突变以提高所述目标蛋白分子的稳定性。
作为一个可选的实施例,所述获取目标蛋白分子的第一晶体结构,包括:
获取带有所述目标蛋白分子的受体复合物的第二晶体结构;
从所述第二晶体结构中分离出所述目标蛋白分子的第一晶体结构。
作为一个可选的实施例,所述从所述第一晶体结构的氨基酸残基中筛选出非关键位点,包括:
对所述第一晶体结构进行丙氨酸扫描,从所述第一晶体结构的氨基酸残基中筛选出满足第一预设条件的第一位点;
根据所述目标蛋白分子的每个氨基酸残基在所述第一晶体结构和所述第二晶体结构中的第一溶剂可及表面积和第二溶剂可及表面积,从所述第一晶体结构的氨基酸残基中筛选出满足第二预设条件的第二位点;
将所述第一位点和/或所述第二位点作为关键位点,并将其余的氨基酸残基作为非关键位点。
作为一个可选的实施例,所述第一预设条件为:所述氨基酸残基被丙氨酸替代后的自由能变超过2kcal·mol-1;和/或,
所述第二预设条件为:所述氨基酸残基的所述第一溶剂可及表面积和所述第二溶剂可及表面积的差值大于0。
作为一个可选的实施例,所述预置条件为:所述计算结果的自由能最低。
作为一个可选的实施例,所述对所述目标晶体结构的所述非关键位点进行虚拟突变,并计算所述非关键位点的突变自由能,包括:
分别利用第一预设算法和第二预设算法对所述目标晶体结构的所有所述非关键位点进行饱和突变扫描,并计算得到所有所述非关键位点的第一突变自由能变和第二突变自由能变。
作为一个可选的实施例,所述突变条件为:所述非关键位点的所述第一突变自由能变和所述第二突变自由能变均小于-0.5kcal·mol-1,且所述非关键位点的所述第一突变自由能变或所述第二突变自由能变小于-1kcal·mol-1。
作为一个可选的实施例,所述第一预设算法为Rosetta ddg函数中的ddg_monomer算法;和/或,
所述第二预设算法为FoldX5.0 position scan算法。
作为一个可选的实施例,所述利用第一预设算法对所述目标晶体结构的所有所述非关键位点进行饱和突变扫描之前,包括:
对所述目标晶体结构主链中的α-C原子的位置进行限制,以减小所述目标晶体结构主链的运动幅度。
本申请第二方面提供一种提高蛋白质分子稳定性的装置,包括:
获取模块,用于获取目标蛋白分子的第一晶体结构;
第一筛选模块,用于从所述第一晶体结构的氨基酸残基中筛选出关非关键位点;
自由能计算模块,用于对所述第一晶体结构进行自由能计算,并得到多个计算结果,所述多个计算结果包括目标蛋白分子的构象和自由能;
比较模块,用于比较所述多个计算结果的自由能,并将满足预置条件的构象作为所述目标蛋白分子的目标晶体结构;
突变自由能计算模块,用于对所述目标晶体结构的所述非关键位点进行虚拟突变,并计算所述非关键位点的突变自由能;
第二筛选模块,用于根据所述非关键位点的突变自由能,将满足突变条件的所述非关键位点作为突变位点;
突变处理模块,用于根据所述突变位点对所述目标蛋白分子进行突变以提高所述目标蛋白分子的稳定性。
作为一个可选的实施例,所述获取模块包括:
获取子模块,用于获取带有所述目标蛋白分子的受体复合物的第二晶体结构;
分离子模块,用于从所述第二晶体结构中分离出所述目标蛋白分子的第一晶体结构。
作为一个可选的实施例,所述第一筛选模块包括:
丙氨酸扫描模块,用于对所述第一晶体结构进行丙氨酸扫描,从所述第一晶体结构的氨基酸残基中筛选出满足第一预设条件的第一位点;
溶剂可及表面积计算模块,用于根据所述目标蛋白分子的每个氨基酸残基在所述第一晶体结构和所述第二晶体结构中的第一溶剂可及表面积和第二溶剂可及表面积,从所述第一晶体结构的氨基酸残基中筛选出满足第二预设条件的第二位点;
第一筛选子模块,用于将所述第一位点和/或所述第二位点作为关键位点,并将其余的氨基酸残基作为非关键位点。
作为一个可选的实施例,所述突变自由能计算模块包括:
第一算法模块,用于利用第一预设算法对所述目标晶体结构的所述非关键位点进行饱和突变扫描,并计算得到所述非关键位点的第一突变自由能变;
第二算法模块,用于利用第二预设算法对所述目标晶体结构的所述非关键位点进行饱和突变扫描,并计算得到所述非关键位点的第二突变自由能变。
本申请第三方面提供一种电子设备,包括:
处理器;以及
存储器,其上存储有可执行代码,当所述可执行代码被所述处理器执行时,使所述处理器执行如上所述的方法。
本申请第四方面提供一种计算机可读存储介质,其上存储有可执行代码,当所述可执行代码被电子设备的处理器执行时,使所述处理器执行如上所述的方法。
本申请提供的技术方案可以包括以下有益效果:
本申请实施例通过从目标蛋白分子的第一晶体结构的氨基酸残基中筛选出对目标蛋白分子结构不具有支持作用的位点,以及不是目标蛋白分子与目标蛋白分子的受体相互作用的位点,并作为非关键位点。在后续突变引入时主要考虑这些非关键位点,初步排除了大部分产生突变会影响目标蛋白分子稳定性的关键位点,大大节省了定向进化的效率。然后计算得到低自由能(高稳定性)的目标晶体结构,对目标晶体结构的非关键位点进行虚拟突变,计算非关键位点的突变自由能;再根据非关键位点的突变自由能,将满足突变条件的非关键位点作为突变位点;最后将突变位点作为后续突变引入点,根据这些突变位点对目标蛋白分子进行突变,基本可以使得目标蛋白分子的整体自由能最小化。这样目标蛋白分子在突变位点引入突变后所产生的突变体能基本保持原有的结构和功能,从而大大提高了蛋白分子的稳定性。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本申请。
附图说明
通过结合附图对本申请示例性实施方式进行更详细地描述,本申请的上述以及其它目的、特征和优势将变得更加明显,其中,在本申请示例性实施方式中,相同的参考标号通常代表相同部件。
图1是本申请实施例示出的基于氨基酸残基突变致使其自由能变下降以提高蛋白质分子稳定性的方法的流程示意图;
图2是本申请实施例示出的基于氨基酸残基突变致使其自由能变下降以提高蛋白质分子稳定性的方法的流程框架示意图;
图3是本申请实施例示出的R80L突变体分子模型;
图4是本申请实施例示出的R80L突变体与FGF10蛋白分子在氯化钠水溶液中10ns的分子运动模拟示意图;
图5是本申请实施例示出的基于氨基酸残基突变致使其自由能变下降以提高蛋白质分子稳定性的装置的结构示意图;
图6是本申请实施例示出的电子设备的结构示意图。
具体实施方式
下面将参照附图更详细地描述本申请的实施方式。虽然附图中显示了本申请的实施方式,然而应该理解,可以以各种形式实现本申请而不应被这里阐述的实施方式所限制。相反,提供这些实施方式是为了使本申请更加透彻和完整,并且能够将本申请的范围完整地传达给本领域的技术人员。
在本申请使用的术语是仅仅出于描述特定实施例的目的,而非旨在限制本申请。在本申请和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式,除非上下文清楚地表示其他含义。还应当理解,本文中使用的术语“和/或”是指并包含一个或多个相关联的列出项目的任何或所有可能组合。
应当理解,尽管在本申请可能采用术语“第一”、“第二”、“第三”等来描述各种信息,但这些信息不应限于这些术语。这些术语仅用来将同一类型的信息彼此区分开。例如,在不脱离本申请范围的情况下,第一信息也可以被称为第二信息,类似地,第二信息也可以被称为第一信息。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括一个或者更多个该特征。在本申请的描述中,“多个”的含义是两个或两个以上,除非另有明确具体的限定。
为了提高蛋白分子的稳定性,相关技术中,通过定向进化技术对蛋白分子进行定向进化。但是从天然环境中搜寻稳定性高的蛋白质分子的成本巨大,定向进化非常耗时,代价昂贵,具有不可预知性。实验条件下难以模拟出生物医药尤其是化工生产的复杂苛刻环境,所获得突变体蛋白很难满足工程化需求。对于未知结构与功能的蛋白,使用传统生物学进行定向进化难度更大。再之后出现了计算结构生物学,使得传统生物大分子研究走上了信息化和计算结构的快车道。计算结构生物学的计算遵循物质的第一性原理与能量最低原理,即包括生物大分子在内的所有物质均由基本粒子组成,所有基本粒子相互作用及其基本运动规律,均可使用量子力学理论计算,而一个系统中所有基本粒子在总体能量最低时的状态是最稳定的平衡态。因此,如何基于计算结构生物学技术,从蛋白分子整体自由能最小化的角度计算可突变位点,最终形成较为稳定的具有一定功能的结构,是亟需解决的难题。
针对上述问题,本申请实施例提供一种基于氨基酸残基突变致使其自由能变下降以提高蛋白质分子稳定性的方法,能够基于计算机及计算结构生物学技术,通过蛋白分子某些氨基酸残基突变以降低蛋白分子整体自由能,最终形成较为稳定的具有一定功能的结构,提高蛋白质分子稳定性。
以下结合附图详细描述本申请实施例的技术方案。
图1是本申请实施例示出的基于氨基酸残基突变致使其自由能变下降以提高蛋白质分子稳定性的方法的流程示意图;图2是本申请实施例示出的基于氨基酸残基突变致使其自由能变下降以提高蛋白质分子稳定性的方法的流程框架示意图。
参见图1和图2,一种基于氨基酸残基突变致使其自由能变下降以提高蛋白质分子稳定性的方法,包括步骤S1~步骤S7:
S1:获取目标蛋白分子的第一晶体结构。
本申请实施例可以通过步骤S10~步骤S11获取目标蛋白分子的第一晶体结构,包括:
S10:获取带有目标蛋白分子的受体复合物的第二晶体结构。
本申请实施例的第二晶体结构指目标蛋白分子与其受体结合形成的复合物的晶体结构。第二晶体结构可以从蛋白质结构数据库(Protein Data Bank,简称PDB)或者建模获得。其中,蛋白质结构数据库可以预先构建。还需说明的是,可以采用相关技术的建模方法进行建模,本申请对此不加以限定。
S11:从第二晶体结构中分离出目标蛋白分子的第一晶体结构。
本申请实施例还可以从蛋白质结构数据库(Protein Data Bank,简称PDB)或者建模直接获得目标蛋白分子的第一晶体结构,该第一晶体结构为目标蛋白分子单晶体结构。
S2:从第一晶体结构的氨基酸残基中筛选出非关键位点。
本申请实施例的关键位点为对目标蛋白分子结构具有支持作用的位点,和/或为目标蛋白分子与目标蛋白分子的受体相互作用的位点。反之,非关键位点为对目标蛋白分子结构不具有支持作用的位点,以及不是目标蛋白分子与目标蛋白分子的受体相互作用的位点。
由于关键位点为对目标蛋白分子结构具有支持作用的位点,和/或为目标蛋白分子与目标蛋白分子的受体相互作用的位点,说明关键位点发生突变会对蛋白分子的结构和功能产生大幅度的改变,甚至使蛋白分子失去活性。因此在突变进化时需要尽量避开关键位点,将其余的氨基酸残基作为非关键位点进行后续的突变设计。
作为一个可选的实施例,步骤S2包括步骤S20~步骤S23:
S20:对第一晶体结构进行丙氨酸扫描,从第一晶体结构的氨基酸残基中筛选出满足第一预设条件的第一位点。
本申请实施例的第一预设条件为:氨基酸残基被丙氨酸替代后的自由能变超过2kcal·mol-1。当然,本申请实施例并不限制自由能变的限制为2kcal·mol-1,也可以根据实际情况进行调整。
相关的步骤如下:
使用预设软件例如FoldX软件,对目标蛋白分子的第一晶体结构中的氨基酸残基进行丙氨酸扫描,得到丙氨酸扫描突变体。计算目标蛋白分子与丙氨酸扫描突变体的自由能,利用以下公式来计算丙氨酸突变体自由能的变化:
ΔΔG=ΔG(Mut-Ala)-ΔG(WT)
ΔG(Mut-Ala)代表丙氨酸突变体的自由能,ΔG(WT)代表目标蛋白分子的自由能。当ΔΔG大于2kcal·mol-1时,丙氨酸突变体结构的稳定性显著降低,说明该氨基酸残基对目标蛋白分子的整体结构具有支持作用,并将这些氨基酸残基作为第一位点。
S22:根据目标蛋白分子的每个氨基酸残基在第一晶体结构和第二晶体结构中的第一溶剂可及表面积和第二溶剂可及表面积,从第一晶体结构得到所有氨基酸残基中筛选出满足第二预设条件的第二位点。
本申请实施例的第二预设条件为:氨基酸残基的第一溶剂可及表面积和第二溶剂可及表面积的差值大于0。
相关的步骤如下:
利用预设软件例如Gromacs软件中的Gromacs sasa函数,分别计算目标蛋白分子的每个氨基酸残基在第一晶体结构和第二晶体结构中的第一溶剂可及表面积和第二溶剂可及表面积,并计算每个氨基酸残基的第一溶剂可及表面积和第二溶剂可及表面积的差值。将差值大于0的氨基酸残基视为目标蛋白分子与目标蛋白分子的受体相互作用的第二位点。
S23:将第一位点和/或第二位点作为关键位点,并将其余的氨基酸残基作为非关键位点。
本申请实施例将所有的第一位点和第二位点作为关键位点,避免突变时引入关键位点,造成突变体的结构和功能产生大的变化而不稳定的问题。
S3:对第一晶体结构进行自由能计算,并得到多个计算结果,多个计算结果包括目标蛋白分子的构象和自由能。
该步骤可以对第一晶体结构进行多轮独立自由能最小化,并得到多个计算结果。例如,利用预设算法例如Rosetta minimize_with_cst算法,对目标蛋白分子的第一晶体结构进行能量最小化处理,例如能量最小化计算独立重复5次,每次能量最小化计算重复迭代10次,得到50个计算结果。
S4:比较多个计算结果的自由能,并将满足预置条件的构象作为目标蛋白分子的目标晶体结构。
作为一个可选的实施例,本申请实施例的预置条件为:计算结果的自由能最低。
取计算结果中自由能最低的一个构象作为目标蛋白分子能量最小化的目标晶体结构,将目标晶体结构作为后续突变自由能变运算的基础。
例如,此处的目标晶体结构可以是50个计算结果中能量最低的一个晶体,相当于第三晶体结构。需说明的是,此处以取计算结果中自由能最低的构象作为目标蛋白分子能量最小化的目标晶体结构为例但不局限于此,也可以考虑选择取计算结果中自由能次低的构象作为目标蛋白分子能量最小化的目标晶体结构。
S5:对目标晶体结构的非关键位点进行虚拟突变,并计算非关键位点的突变自由能。
作为一个可选的实施例,步骤S5包括步骤S50:
S50:分别利用第一预设算法和第二预设算法对目标晶体结构的所有非关键位点进行饱和突变扫描,并计算得到所有非关键位点的第一突变自由能变和第二突变自由能变。
本申请实施例的第一预设算法可以为Rosetta ddg函数中的ddg_monomer算法;第二预设算法可以为FoldX5.0 position scan算法。
例如步骤如下:
对目标晶体结构主链中的α-C原子的位置进行限制,以减小目标晶体结构主链的运动幅度,防止主链运动幅度过大,偏离能量最小化的构象。
利用第一预设算法例如Rosetta ddg函数中ddg_monomer算法,对目标晶体结构的所有非关键位点进行饱和突变扫描,计算所有非关键位点的第一突变自由能变。
利用第二预设算法例如FoldX5.0 position scan算法,对目标晶体结构的所有非关键位点进行饱和突变扫描,计算所有非关键位点的第二突变自由能变。
S6:根据非关键位点的突变自由能,将满足突变条件的非关键位点作为突变位点。
所有非关键位点并不都是突变后能提高目标蛋白分子的稳定性的位点,因此需要从中进行筛选出突变位点,使得利用在突变位点产生的突变来提高蛋白分子的稳定性。
优选的,本申请实施例的突变条件条件为:非关键位点的第一突变自由能变和第二突变自由能变均小于-0.5kcal·mol-1,且非关键位点的第一突变自由能变或第二突变自由能变小于-1kcal·mol-1。
也就是说,将满足第一突变自由能变和第二突变自由能变均小于-0.5kcal·mol-1,且第一突变自由能变或第二突变自由能变小于-1kcal·mol-1的非关键位点作为突变位点。
S7:根据突变位点对目标蛋白分子进行突变以提高目标蛋白分子的稳定性。
在后续对目标蛋白分子进行定向进化时,可采用在突变位点引入突变的方式定向进化目标蛋白分子,根据突变位点对目标蛋白分子进行突变,可以保持蛋白分子原有的结构和功能,从而提高蛋白分子的定向进化效率,提高蛋白分子的稳定性。
需说明的是,对目标蛋白分子进行突变可以采用相关技术的突变处理方法,本申请对此不加以限定。
本申请实施例通过从目标蛋白分子的第一晶体结构的氨基酸残基中筛选出对目标蛋白分子结构不具有支持作用的位点,以及不是目标蛋白分子与目标蛋白分子的受体相互作用的位点,并作为非关键位点。在后续突变引入时主要设计这些非关键位点,初步排除了大部分产生突变会影响目标蛋白分子稳定性的关键位点,大大节省了定向进化的效率。然后计算得到低自由能(高稳定性)的目标晶体结构,对目标晶体结构的非关键位点进行虚拟突变,计算非关键位点的突变自由能;再根据非关键位点的突变自由能,将满足突变条件的非关键位点作为突变位点;最后将突变位点作为后续突变引入点,根据这些突变位点对目标蛋白分子进行突变,基本可以使得目标蛋白分子的整体自由能最小化。这样目标蛋白分子在突变点引入突变后所产生的突变体能基本保持原有的结构和功能,大大提高了蛋白分子的稳定性。
下面本申请实施例以人FGF10蛋白分子为例,对基于氨基酸残基突变致使其自由能变下降以提高蛋白质分子稳定性的方法进行说明,包括以下步骤:
1、从PDB数据库中获得带有FGF10蛋白分子的受体FGFR2b复合物的第二晶体结构1NUN,并从1NUN中分离出FGF10蛋白分子的第一晶体结构,作为初始的计算文件。
2、将FGF10蛋白分子的第一晶体结构导入Yasara软件,使用FoldX5.0Alaninescan of object功能对目标蛋白分子的第一晶体结构进行丙氨酸扫描,筛选出被丙氨酸替代后的自由能变超过2kcal·mol-1的氨基酸残基,这些氨基酸残基可以被视为对目标蛋白分子结构具有支持作用的关键位点,并在后续设计引入突变时避开这些残基。经丙氨酸扫描,FGF10蛋白分子中第75、82、83、89、90、92、96、98、111、113、119、120、121、123、131、132、134、138、140、141、146、152、160、164、169、173、176、178、180、184、189、201位氨基酸残基被丙氨酸替代后的自由能变超过2kcal·mol-1。上述氨基酸残基可以被视为对目标蛋白分子结构具有支持作用的关键位点,并在后续设计引入突变时避开这些氨基酸残基。
3、在Gromacs软件中输入FGF10蛋白分子的第一晶体结构,利用gmx sasa函数,计算FGF10蛋白分子中各氨基酸残基在单体晶体结构中的溶剂可及表面积(sasa);在Gromacs软件中输入FGF10蛋白分子与其受体FGFR2b晶体结构1NUN,利用gmx–sasa函数,计算FGF10蛋白分子中各氨基酸残基在复合物晶体结构中的溶剂可及表面积(sasa)。计算二者的差值(Δsasa)。
利用Gromacs软件中的Gromacs sasa函数,分别计算FGF10蛋白分子的每个氨基酸残基在第一晶体结构和第二晶体结构中的第一溶剂可及表面积和第二溶剂可及表面积,并计算每个氨基酸残基的第一溶剂可及表面积和第二溶剂可及表面积的差值。将差值大于0的氨基酸残基视为目标蛋白分子与目标蛋白分子的受体相互作用的关键位点。FGF10蛋白分子的第69、70、72、73、74、75、76、77、78、83、85、87、102、104、113、114、115、116、117、118、119、121、122、131、146、154、155、156、159、160、161、162、202、203、204位的溶剂可及表面积差值大于0。这些氨基酸残基可以被视为与FGFR2b受体蛋白具有直接相互作用的关键位点,后续设计引入突变时的计算中排除上述氨基酸残基。
4、利用Rosetta minimize_with_cst算法,对FGF10蛋白分子的第一晶体结构进行能量最小化处理,例如能量最小化计算独立重复5次,每次能量最小化计算重复迭代10次,取计算结果中自由能最低的构象作为FGF10蛋白分子能量最小化的目标晶体结构,进行后续突变自由能变运算。在FGF10蛋白分子的第一晶体结构的能量最小化计算独立重复5次,每次能量最小化计算重复迭代10次生成的50个构象中,第4次重复第3次迭代时生成的构象自由能最低,因此作为FGF10蛋白分子能量最小化的目标晶体结构,进行后续突变自由能变运算。
5、利用Rosetta ddg函数中的convert_to_cst_file.sh算法对FGF10蛋白分子的目标晶体结构主链的α-C原子位置限制,防止主链运动幅度过大,偏离能量最小化的构象。再利用Rosetta ddg函数中ddg_monomer算法,对FGF10蛋白分子的目标晶体结构的所有非关键位点进行饱和突变扫描,对饱和突变扫描生成的突变体进行主链与侧链能量最小化。所有FGF10蛋白分子的非关键位点的突变计算重复迭代50次,取50次重复迭代计算中的自由能变最低值作为第一突变自由能变。
6、利用FoldX5.0 position scan算法,对FGF10蛋白分子的目标晶体结构的所有非关键位点进行饱和突变扫描,计算所有非关键位点的第二突变自由能变
7、将满足第一突变自由能变和第二突变自由能变均小于-0.5kcal·mol-1,且第一突变自由能变或第二突变自由能变小于-1kcal·mol-1的非关键位点作为可以提高FGF10蛋白质分子稳定性的突变位点(见表1)。
表1提高FGF10蛋白质分子稳定性的突变位点
突变位点 | Rosetta ddg(kcal·mol-1) | FoldX ddg(kcal·mol-1) |
R80L | -2.251 | -2.322 |
K81M | -1.087 | -0.980 |
T86F | -1.853 | -1.878 |
K91L | -2.087 | -1.454 |
K137L | -2.125 | -0.525 |
K151L | -1.392 | -0.922 |
E157M | -1.995 | -1.246 |
E158P | -3.833 | -0.954 |
T163V | -3.814 | -0.786 |
N168F | -2.316 | -0.863 |
H171F | -0.794 | -1.035 |
R174I | -4.375 | -0.845 |
Q175P | -3.404 | -1.801 |
H200W | -3.552 | -1.360 |
本申请实施例可以在FGF10蛋白分子的第一晶体结构基础上,对上述步骤筛选出的R80L位点建立突变体分子模型(参见图3),分析R80L突变体分子模型的氨基酸的堆积紧密程度、电荷是否存在排斥作用、有无生成新的氢键或盐桥等。分析得到突变后蛋白分子内部的疏水作用增加,提高了蛋白的稳定性。使用Gromacs模拟R80L突变体分子和FGF10蛋白分子(WT)在氯化钠水溶液中10ns的分子运动模拟,得到RMSD(Root Mean Squared Error,均方根误差)随时间的变化曲线图。验证得到R80L突变体相对于FGF10蛋白分子的稳定性增加(参见图4)。图4中位于下面的图形表示R80L突变体分子的运动模拟数据,位于上面的图形表示FGF10蛋白分子(WT)的运动模拟数据。
与前述应用功能实现方法实施例相对应,本申请还提供了一种基于氨基酸残基突变致使其自由能变下降以提高蛋白质分子稳定性的装置、电子设备及相应的实施例。
图5是本申请实施例示出的基于氨基酸残基突变致使其自由能变下降以提高蛋白质分子稳定性的装置的结构示意图。
参见图5,一种基于氨基酸残基突变致使其自由能变下降以提高蛋白质分子稳定性的装置,包括:获取模块40、第一筛选模块41、自由能计算模块42、比较模块43、突变自由能计算模块44、第二筛选模块45和突变处理模块46。
获取模块40,用于获取目标蛋白分子的第一晶体结构。
第一筛选模块41,用于从第一晶体结构的所有氨基酸残基中筛选出非关键位点。
自由能计算模块42,用于对第一晶体结构进行自由能计算,并得到多个计算结果,多个计算结果包括目标蛋白分子的构象和自由能。
比较模块43,用于比较多个计算结果的自由能,并将满足预置条件的构象作为目标蛋白分子的目标晶体结构。
突变自由能计算模块44,用于对目标晶体结构的非关键位点进行虚拟突变,并计算非关键位点的突变自由能。
第二筛选模块45,用于根据非关键位点的突变自由能,将满足突变条件的非关键位点作为突变位点。
突变处理模块46,用于根据突变位点对目标蛋白分子进行突变以提高目标蛋白分子的稳定性。
本申请实施例通过从目标蛋白分子的第一晶体结构的氨基酸残基中筛选出对目标蛋白分子结构不具有支持作用的位点,以及不是目标蛋白分子与目标蛋白分子的受体相互作用的位点,并作为非关键位点。在后续突变引入时主要设计这些非关键位点,初步排除了大部分产生突变会影响目标蛋白分子稳定性的关键位点,大大节省了定向进化的效率。然后计算得到低自由能(高稳定性)的目标晶体结构,对目标晶体结构的非关键位点进行虚拟突变,计算非关键位点的突变自由能;再根据非关键位点的突变自由能,将满足突变条件的非关键位点作为突变位点;最后将突变位点作为后续突变引入点,基本可以使得目标蛋白分子的整体自由能最小化。这样目标蛋白分子在突变点引入突变后所产生的突变体能基本保持原有的结构和功能,大大提高了蛋白分子的稳定性。
作为一个可选的实施例,获取模块40包括:
获取子模块,用于获取带有目标蛋白分子的受体复合物的第二晶体结构。
分离子模块,用于从第二晶体结构中分离出目标蛋白分子的第一晶体结构。
作为一个可选的实施例,第一筛选模块41包括:
丙氨酸扫描模块,用于对第一晶体结构进行丙氨酸扫描,从第一晶体结构的氨基酸残基中筛选出满足第一预设条件的第一位点。
溶剂可及表面积计算模块,用于根据目标蛋白分子的每个氨基酸残基在第一晶体结构和第二晶体结构中的第一溶剂可及表面积和第二溶剂可及表面积,从第一晶体结构的氨基酸残基中筛选出满足第二预设条件的第二位点。
第一筛选子模块,用于将第一位点和/或第二位点作为关键位点,并将其余的氨基酸残基作为非关键位点。
作为一个可选的实施例,突变自由能计算模块44包括:
第一算法模块,用于利用第一预设算法对目标晶体结构的非关键位点进行饱和突变扫描,并计算得到非关键位点的第一突变自由能变。
第二算法模块,用于利用第二预设算法对目标晶体结构的非关键位点进行饱和突变扫描,并计算得到非关键位点的第二突变自由能变。
本申请实施例的第一预设算法可以为Rosetta ddg函数中的ddg_monomer算法;第二预设算法可以为FoldX5.0 position scan算法。其中,利用第一预设算法例如Rosettaddg函数中ddg_monomer算法,对目标晶体结构的所有非关键位点进行饱和突变扫描,计算所有非关键位点的第一突变自由能变。利用第二预设算法例如FoldX5.0 position scan算法,对目标晶体结构的所有非关键位点进行饱和突变扫描,计算所有非关键位点的第二突变自由能变。
关于上述实施例中的装置,其中各个模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述,此处将不再做详细阐述说明。
图6是本申请实施例示出的电子设备的结构示意图。
参见图6,电子设备500包括存储器510和处理器520。
处理器520可以是中央处理单元(Central Processing Unit,CPU),还可以是其他通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
存储器510可以包括各种类型的存储单元,例如系统内存、只读存储器(ROM)和永久存储装置。其中,ROM可以存储处理器520或者计算机的其他模块需要的静态数据或者指令。永久存储装置可以是可读写的存储装置。永久存储装置可以是即使计算机断电后也不会失去存储的指令和数据的非易失性存储设备。在一些实施方式中,永久性存储装置采用大容量存储装置(例如磁或光盘、闪存)作为永久存储装置。另外一些实施方式中,永久性存储装置可以是可移除的存储设备(例如软盘、光驱)。系统内存可以是可读写存储设备或者易失性可读写存储设备,例如动态随机访问内存。系统内存可以存储一些或者所有处理器在运行时需要的指令和数据。此外,存储器510可以包括任意计算机可读存储媒介的组合,包括各种类型的半导体存储芯片(例如DRAM,SRAM,SDRAM,闪存,可编程只读存储器),磁盘和/或光盘也可以采用。在一些实施方式中,存储器510可以包括可读和/或写的可移除的存储设备,例如激光唱片(CD)、只读数字多功能光盘(例如DVD-ROM,双层DVD-ROM)、只读蓝光光盘、超密度光盘、闪存卡(例如SD卡、min SD卡、Micro-SD卡等)、磁性软盘等。计算机可读存储媒介不包含载波和通过无线或有线传输的瞬间电子信号。
其中,处理器520可以包括获取模块40、第一筛选模块41、自由能计算模块42、比较模块43、突变自由能计算模块44、第二筛选模块45和突变处理模块46,具体功能和连接关系可参见图5中的描述,此处不再赘述。
电子设备500还可以包括显示器,显示器用于展示处理器520的执行结果。
存储器510上存储有可执行代码,当可执行代码被处理器520处理时,可以使处理器520执行上文述及的方法中的部分或全部。
此外,根据本申请的方法还可以实现为一种计算机程序或计算机程序产品,该计算机程序或计算机程序产品包括用于执行本申请的上述方法中部分或全部步骤的计算机程序代码指令。
或者,本申请还可以实施为一种计算机可读存储介质(或非暂时性机器可读存储介质或机器可读存储介质),其上存储有可执行代码(或计算机程序或计算机指令代码),当可执行代码(或计算机程序或计算机指令代码)被电子设备(或服务器等)的处理器执行时,使处理器执行根据本申请的上述方法的各个步骤的部分或全部。
以上已经描述了本申请的各实施例,上述说明是示例性的,并非穷尽性的,并且也不限于所披露的各实施例。在不偏离所说明的各实施例的范围和精神的情况下,对于本技术领域的普通技术人员来说许多修改和变更都是显而易见的。本文中所用术语的选择,旨在最好地解释各实施例的原理、实际应用或对市场中的技术的改进,或者使本技术领域的其他普通技术人员能理解本文披露的各实施例。
Claims (7)
1.一种基于氨基酸残基突变提高蛋白质分子稳定性的方法,其特征在于,包括:
获取目标蛋白分子的第一晶体结构,所述第一晶体结构为目标蛋白分子的单晶体结构;
从所述第一晶体结构的氨基酸残基中筛选出非关键位点,包括:对所述第一晶体结构进行丙氨酸扫描,从所述第一晶体结构的氨基酸残基中筛选出满足第一预设条件的第一位点;根据所述目标蛋白分子的每个氨基酸残基在所述第一晶体结构和第二晶体结构中的第一溶剂可及表面积和第二溶剂可及表面积,从所述第一晶体结构的氨基酸残基中筛选出满足第二预设条件的第二位点;将所述第一位点和/或所述第二位点作为关键位点,并将其余的氨基酸残基作为非关键位点;所述第二晶体结构指目标蛋白分子与其受体结合形成的复合物的晶体结构;
对所述第一晶体结构进行自由能计算,并得到多个计算结果,所述多个计算结果包括目标蛋白分子的构象和自由能;
比较所述多个计算结果的自由能,并将满足预置条件的构象作为所述目标蛋白分子的目标晶体结构;
对所述目标晶体结构的所述非关键位点进行虚拟突变,并计算所述非关键位点的突变自由能,其中包括:分别利用第一预设算法和第二预设算法对所述目标晶体结构的所有所述非关键位点进行饱和突变扫描,并计算得到所有所述非关键位点的第一突变自由能变和第二突变自由能变;
根据所述非关键位点的突变自由能,将满足突变条件的所述非关键位点作为突变位点,其中包括:将满足所述第一突变自由能变和所述第二突变自由能变均小于-0.5kcal·mol-1,且所述第一突变自由能变或所述第二突变自由能变小于-1kcal·mol-1的非关键位点作为突变位点;
根据所述突变位点对所述目标蛋白分子进行突变以提高所述目标蛋白分子的稳定性。
2.根据权利要求1所述的方法,其特征在于,所述获取目标蛋白分子的第一晶体结构,包括:
获取带有所述目标蛋白分子的受体复合物的第二晶体结构;
从所述第二晶体结构中分离出所述目标蛋白分子的第一晶体结构。
3.根据权利要求1所述的方法,其特征在于:
所述第一预设条件为:所述氨基酸残基被丙氨酸替代后的自由能变超过2kcal·mol-1;和/或,
所述第二预设条件为:所述氨基酸残基的所述第一溶剂可及表面积和所述第二溶剂可及表面积的差值大于0。
4.根据权利要求1所述的方法,其特征在于,所述利用第一预设算法对所述目标晶体结构的所有所述非关键位点进行饱和突变扫描之前,包括:
对所述目标晶体结构主链中的α-C原子的位置进行限制,以减小所述目标晶体结构主链的运动幅度。
5.一种基于氨基酸残基突变提高蛋白质分子稳定性的装置,其特征在于,包括:
获取模块,用于获取目标蛋白分子的第一晶体结构,所述第一晶体结构为目标蛋白分子的单晶体结构;
第一筛选模块,用于从所述第一晶体结构的氨基酸残基中筛选出非关键位点,其中包括:对所述第一晶体结构进行丙氨酸扫描,从所述第一晶体结构的氨基酸残基中筛选出满足第一预设条件的第一位点;根据所述目标蛋白分子的每个氨基酸残基在所述第一晶体结构和第二晶体结构中的第一溶剂可及表面积和第二溶剂可及表面积,从所述第一晶体结构的氨基酸残基中筛选出满足第二预设条件的第二位点;将所述第一位点和/或所述第二位点作为关键位点,并将其余的氨基酸残基作为非关键位点;所述第二晶体结构指目标蛋白分子与其受体结合形成的复合物的晶体结构;自由能计算模块,用于对所述第一晶体结构进行自由能计算,并得到多个计算结果,所述多个计算结果包括目标蛋白分子的构象和自由能;
比较模块,用于比较所述多个计算结果的自由能,并将满足预置条件的构象作为所述目标蛋白分子的目标晶体结构;
突变自由能计算模块,用于对所述目标晶体结构的所述非关键位点进行虚拟突变,并计算所述非关键位点的突变自由能,其中包括:分别利用第一预设算法和第二预设算法对所述目标晶体结构的所有所述非关键位点进行饱和突变扫描,并计算得到所有所述非关键位点的第一突变自由能变和第二突变自由能变;
第二筛选模块,用于根据所述非关键位点的突变自由能,将满足突变条件的所述非关键位点作为突变位点,其中包括:将满足所述第一突变自由能变和所述第二突变自由能变均小于-0.5kcal·mol-1,且所述第一突变自由能变或所述第二突变自由能变小于-1kcal·mol-1的非关键位点作为突变位点;
突变处理模块,用于根据所述突变位点对所述目标蛋白分子进行突变以提高所述目标蛋白分子的稳定性。
6.一种电子设备,其特征在于,包括:
处理器;
存储器,其上存储有可执行代码,当所述可执行代码被所述处理器执行时,使所述处理器执行如权利要求1-4中任一项所述的方法。
7.一种计算机可读存储介质,其上存储有可执行代码,当所述可执行代码被电子设备的处理器执行时,使所述处理器执行如权利要求1-4中任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310458615.8A CN116486906B (zh) | 2023-04-17 | 2023-04-17 | 基于氨基酸残基突变提高蛋白质分子稳定性的方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310458615.8A CN116486906B (zh) | 2023-04-17 | 2023-04-17 | 基于氨基酸残基突变提高蛋白质分子稳定性的方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN116486906A CN116486906A (zh) | 2023-07-25 |
CN116486906B true CN116486906B (zh) | 2024-03-19 |
Family
ID=87226528
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310458615.8A Active CN116486906B (zh) | 2023-04-17 | 2023-04-17 | 基于氨基酸残基突变提高蛋白质分子稳定性的方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116486906B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117116336B (zh) * | 2023-10-18 | 2024-01-23 | 深圳新锐基因科技有限公司 | 基于内部原子波动改善蛋白结构柔性弱点的方法和装置 |
Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4853871A (en) * | 1987-04-06 | 1989-08-01 | Genex Corporation | Computer-based method for designing stablized proteins |
WO2008134261A2 (en) * | 2007-04-27 | 2008-11-06 | The Research Foundation Of State University Of New York | A method for protein structure determination, gene identification, mutational analysis, and protein design |
WO2009149218A2 (en) * | 2008-06-03 | 2009-12-10 | Codon Devices, Inc. | Novel proteins and methods of designing and using same |
WO2011035456A1 (zh) * | 2009-09-25 | 2011-03-31 | 上海抗体药物国家工程研究中心有限公司 | 通过计算机辅助设计来获得高亲和力的蛋白质的方法 |
CN102222177A (zh) * | 2011-07-08 | 2011-10-19 | 上海生物信息技术研究中心 | 抗体蛋白的分子改造辅助预测方法 |
CN112582031A (zh) * | 2020-12-24 | 2021-03-30 | 江南大学 | 结合高压分子动力学模拟、自由能计算改善水解酶鲁棒性 |
CN113727994A (zh) * | 2019-05-02 | 2021-11-30 | 德克萨斯大学董事会 | 提高合成蛋白质稳定性的系统和方法 |
CN114038498A (zh) * | 2022-01-06 | 2022-02-11 | 北京晶泰科技有限公司 | Gpcr的热稳定性突变预测方法、结构筛选方法及其装置 |
CN114927160A (zh) * | 2022-03-03 | 2022-08-19 | 北京晶泰科技有限公司 | 热点残基和靶点蛋白复合物结构的生成方法及装置 |
CN115295077A (zh) * | 2021-05-03 | 2022-11-04 | 宁波酶赛生物工程有限公司 | 一种设计具有非天然底物活性的蛋白酶突变体的计算方法 |
-
2023
- 2023-04-17 CN CN202310458615.8A patent/CN116486906B/zh active Active
Patent Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4853871A (en) * | 1987-04-06 | 1989-08-01 | Genex Corporation | Computer-based method for designing stablized proteins |
WO2008134261A2 (en) * | 2007-04-27 | 2008-11-06 | The Research Foundation Of State University Of New York | A method for protein structure determination, gene identification, mutational analysis, and protein design |
WO2009149218A2 (en) * | 2008-06-03 | 2009-12-10 | Codon Devices, Inc. | Novel proteins and methods of designing and using same |
WO2011035456A1 (zh) * | 2009-09-25 | 2011-03-31 | 上海抗体药物国家工程研究中心有限公司 | 通过计算机辅助设计来获得高亲和力的蛋白质的方法 |
CN102222177A (zh) * | 2011-07-08 | 2011-10-19 | 上海生物信息技术研究中心 | 抗体蛋白的分子改造辅助预测方法 |
CN113727994A (zh) * | 2019-05-02 | 2021-11-30 | 德克萨斯大学董事会 | 提高合成蛋白质稳定性的系统和方法 |
CN112582031A (zh) * | 2020-12-24 | 2021-03-30 | 江南大学 | 结合高压分子动力学模拟、自由能计算改善水解酶鲁棒性 |
CN115295077A (zh) * | 2021-05-03 | 2022-11-04 | 宁波酶赛生物工程有限公司 | 一种设计具有非天然底物活性的蛋白酶突变体的计算方法 |
CN114038498A (zh) * | 2022-01-06 | 2022-02-11 | 北京晶泰科技有限公司 | Gpcr的热稳定性突变预测方法、结构筛选方法及其装置 |
CN114927160A (zh) * | 2022-03-03 | 2022-08-19 | 北京晶泰科技有限公司 | 热点残基和靶点蛋白复合物结构的生成方法及装置 |
Non-Patent Citations (2)
Title |
---|
Predicting the Effect of Amino Acid Single-Point Mutations on Protein Stability Large-Scale Validation of MD-Based Relative Free Energy Calculations;Thomas Steinbrecher 等;《Journal of Molecular Biology》;第429卷(第7期);第948-963页 * |
计算机辅助分子设计提高蛋白质热稳定性的研究;田健;《中国博士学位论文全文数据库 基础科学辑》(第10期);第A006-28页 * |
Also Published As
Publication number | Publication date |
---|---|
CN116486906A (zh) | 2023-07-25 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Li et al. | Comparative assessment of scoring functions on an updated benchmark: 1. Compilation of the test set | |
Šponer et al. | Molecular dynamics simulations of nucleic acids. From tetranucleotides to the ribosome | |
MacKerell Jr | Empirical force fields for biological macromolecules: overview and issues | |
Maffucci et al. | An efficient implementation of the Nwat-MMGBSA method to rescore docking results in medium-throughput virtual screenings | |
Giulini et al. | An information-theory-based approach for optimal model reduction of biomolecules | |
Nguyen et al. | Refinement of generalized born implicit solvation parameters for nucleic acids and their complexes with proteins | |
Smith et al. | CSAR benchmark exercise 2013: evaluation of results from a combined computational protein design, docking, and scoring/ranking challenge | |
Das et al. | Rapid convergence of energy and free energy profiles with quantum mechanical size in quantum mechanical–molecular mechanical simulations of proton transfer in DNA | |
Liu | Homochirality originates from the handedness of helices | |
Minhas et al. | Modeling DNA flexibility: comparison of force fields from atomistic to multiscale levels | |
US20070020642A1 (en) | Structural interaction fingerprint | |
CN116486906B (zh) | 基于氨基酸残基突变提高蛋白质分子稳定性的方法及装置 | |
Trnka et al. | Automated training of ReaxFF reactive force fields for Energetics of Enzymatic reactions | |
Schrodt et al. | Large-scale analysis of 48 DNA and 48 RNA tetranucleotides studied by 1 μs explicit-solvent molecular dynamics simulations | |
Giese et al. | Extension of the variational free energy profile and multistate Bennett acceptance ratio methods for high-dimensional potential of mean force profile analysis | |
Mondal et al. | Exploring the effectiveness of binding free energy calculations | |
Ngo et al. | Improving the thermostability of xylanase a from Bacillus subtilis by combining bioinformatics and electrostatic interactions optimization | |
Charpentier et al. | Variable neighborhood search with cost function networks to solve large computational protein design problems | |
CN116486903B (zh) | 基于同源蛋白序列进化方向结合自由能变提高蛋白稳定性的方法及装置 | |
CN116434828B (zh) | 基于计算结构生物学的蛋白分子动态二硫键的引入方法及装置 | |
Mlynsky et al. | Simple Adjustment of Intranucleotide Base-Phosphate Interaction in the OL3 AMBER Force Field Improves RNA Simulations | |
Kuang et al. | Motif-based protein ranking by network propagation | |
Love et al. | van der Waals Parameter Scanning with Amber Nucleic Acid Force Fields: Revisiting Means to Better Capture the RNA/DNA Structure through MD | |
Antes et al. | POEM: parameter optimization using ensemble methods: application to target specific scoring functions | |
Topham et al. | An atomistic statistically effective energy function for computational protein design |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |