CN117116336A - 基于蛋白分子内部原子波动改善蛋白结构柔性弱点的方法和装置 - Google Patents
基于蛋白分子内部原子波动改善蛋白结构柔性弱点的方法和装置 Download PDFInfo
- Publication number
- CN117116336A CN117116336A CN202311345518.4A CN202311345518A CN117116336A CN 117116336 A CN117116336 A CN 117116336A CN 202311345518 A CN202311345518 A CN 202311345518A CN 117116336 A CN117116336 A CN 117116336A
- Authority
- CN
- China
- Prior art keywords
- energy minimization
- protein molecule
- fluctuation
- target protein
- topological structure
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 102000004169 proteins and genes Human genes 0.000 title claims abstract description 195
- 108090000623 proteins and genes Proteins 0.000 title claims abstract description 195
- 238000000034 method Methods 0.000 title claims abstract description 47
- 239000013078 crystal Substances 0.000 claims abstract description 79
- 238000004088 simulation Methods 0.000 claims abstract description 48
- 125000000539 amino acid group Chemical group 0.000 claims abstract description 44
- 238000004458 analytical method Methods 0.000 claims abstract description 35
- 238000000329 molecular dynamics simulation Methods 0.000 claims abstract description 30
- 230000035790 physiological processes and functions Effects 0.000 claims description 14
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 claims description 7
- 230000035772 mutation Effects 0.000 claims description 6
- 150000001413 amino acids Chemical class 0.000 claims description 2
- 230000015556 catabolic process Effects 0.000 abstract description 8
- 238000006731 degradation reaction Methods 0.000 abstract description 8
- 230000002269 spontaneous effect Effects 0.000 abstract description 8
- 235000018102 proteins Nutrition 0.000 description 63
- 108010017080 Granulocyte Colony-Stimulating Factor Proteins 0.000 description 20
- 102000004269 Granulocyte Colony-Stimulating Factor Human genes 0.000 description 20
- 108090000765 processed proteins & peptides Proteins 0.000 description 14
- 229910052739 hydrogen Inorganic materials 0.000 description 9
- 239000001257 hydrogen Substances 0.000 description 9
- 229940024606 amino acid Drugs 0.000 description 6
- 238000010586 diagram Methods 0.000 description 6
- 230000002085 persistent effect Effects 0.000 description 6
- 230000004962 physiological condition Effects 0.000 description 6
- 239000000243 solution Substances 0.000 description 6
- 238000004364 calculation method Methods 0.000 description 5
- 238000005516 engineering process Methods 0.000 description 5
- 238000004590 computer program Methods 0.000 description 4
- 230000006870 function Effects 0.000 description 4
- 125000000404 glutamine group Chemical group N[C@@H](CCC(N)=O)C(=O)* 0.000 description 3
- 230000003993 interaction Effects 0.000 description 3
- 230000003287 optical effect Effects 0.000 description 3
- 125000003275 alpha amino acid group Chemical group 0.000 description 2
- 125000003368 amide group Chemical group 0.000 description 2
- 125000000613 asparagine group Chemical group N[C@@H](CC(N)=O)C(=O)* 0.000 description 2
- 238000005460 biophysical method Methods 0.000 description 2
- 125000002915 carbonyl group Chemical group [*:2]C([*:1])=O 0.000 description 2
- 238000010276 construction Methods 0.000 description 2
- 238000004925 denaturation Methods 0.000 description 2
- 230000036425 denaturation Effects 0.000 description 2
- 239000003814 drug Substances 0.000 description 2
- 229940079593 drug Drugs 0.000 description 2
- 125000000487 histidyl group Chemical group [H]N([H])C(C(=O)O*)C([H])([H])C1=C([H])N([H])C([H])=N1 0.000 description 2
- 125000002883 imidazolyl group Chemical group 0.000 description 2
- 229920001184 polypeptide Polymers 0.000 description 2
- 102000004196 processed proteins & peptides Human genes 0.000 description 2
- 238000000926 separation method Methods 0.000 description 2
- 238000002945 steepest descent method Methods 0.000 description 2
- 101000746367 Homo sapiens Granulocyte colony-stimulating factor Proteins 0.000 description 1
- QIVBCDIJIAJPQS-VIFPVBQESA-N L-tryptophane Chemical compound C1=CC=C2C(C[C@H](N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-VIFPVBQESA-N 0.000 description 1
- 108010021466 Mutant Proteins Proteins 0.000 description 1
- 102000008300 Mutant Proteins Human genes 0.000 description 1
- QIVBCDIJIAJPQS-UHFFFAOYSA-N Tryptophan Natural products C1=CC=C2C(CC(N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-UHFFFAOYSA-N 0.000 description 1
- 238000002441 X-ray diffraction Methods 0.000 description 1
- 235000001014 amino acid Nutrition 0.000 description 1
- 125000003277 amino group Chemical group 0.000 description 1
- 239000007864 aqueous solution Substances 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 238000013473 artificial intelligence Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 239000003086 colorant Substances 0.000 description 1
- 238000002425 crystallisation Methods 0.000 description 1
- 230000008025 crystallization Effects 0.000 description 1
- 239000002355 dual-layer Substances 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- ZDXPYRJPNDTMRX-UHFFFAOYSA-N glutamine Natural products OC(=O)C(N)CCC(N)=O ZDXPYRJPNDTMRX-UHFFFAOYSA-N 0.000 description 1
- 230000002209 hydrophobic effect Effects 0.000 description 1
- 125000001841 imino group Chemical group [H]N=* 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000005065 mining Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
- 230000008439 repair process Effects 0.000 description 1
- 230000002441 reversible effect Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 239000002904 solvent Substances 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B5/00—ICT specially adapted for modelling or simulations in systems biology, e.g. gene-regulatory networks, protein interaction networks or metabolic networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F30/00—Computer-aided design [CAD]
- G06F30/20—Design optimisation, verification or simulation
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B20/00—ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
- G16B20/50—Mutagenesis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2119/00—Details relating to the type or aim of the analysis or the optimisation
- G06F2119/14—Force analysis or force optimisation, e.g. static or dynamic forces
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Theoretical Computer Science (AREA)
- Medical Informatics (AREA)
- Biophysics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Biotechnology (AREA)
- Evolutionary Biology (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Chemical & Material Sciences (AREA)
- Physiology (AREA)
- Analytical Chemistry (AREA)
- Genetics & Genomics (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Computer Hardware Design (AREA)
- Evolutionary Computation (AREA)
- Geometry (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Peptides Or Proteins (AREA)
Abstract
本申请涉及一种基于蛋白分子内部原子波动改善蛋白结构柔性弱点的方法和装置。该方法包括获取目标蛋白分子的第一晶体结构;对第一晶体结构进行自由能极小化模拟,获得目标蛋白分子的能量极小化拓扑结构;对能量极小化拓扑结构进行分子动力学模拟,直至能量极小化拓扑结构达到运动平衡状态;对达到运动平衡状态的能量极小化拓扑结构中原子的波动性进行解析,得到解析结果;根据解析结果,找出目标蛋白分子中的高波动性区域;对高波动性区域内的高波动性氨基酸残基所在位点进行突变,得到可降低目标蛋白分子整体波动性的目标突变体。本申请提供的方案,能够快速解析且改善蛋白结构的柔性弱点,增强蛋白分子的稳定性,减少蛋白分子的自发性降解。
Description
技术领域
本申请涉及信息技术、计算机技术、人工智能技术、生物大分子多尺度模拟技术及计算结构生物学技术领域,尤其涉及基于蛋白分子内部原子波动改善蛋白结构柔性弱点的方法和装置。
背景技术
蛋白质在水溶液中,在范德华作用与疏水作用等熵效应的干预下,蛋白主链会倾向形成分子内氢键。由于氢键的协同性,一旦有氢键形成,每个氢键能增强下一个氢键的稳定性,促进氢键在蛋白分子内部进一步延伸。例如:肽平面中的羰基可以与邻近第2、3或4位肽平面中的亚氨基之间形成氢键,可以形成非常稳定的螺旋状结构。肽链中平行或反平行延伸的主链之间也可以形成氢键,形成一种有序的结构称为β-折叠。肽链延伸时会出现转向或者回折现象,肽平面中的羰基可以与邻近第2位或第3位肽平面中氨基形成氢键即转角结构。螺旋状结构、β-折叠结构与转角结构都是较为稳固的结构,这些结构是蛋白质的刚性所在,均有利于蛋白高级结构的形成。
肽链中的有些松散结构不能归类到螺旋、β-折叠或转角结构中,它们的肽平面排列无规律,结构较为松散。这些序列的连续出现可能造成蛋白分子局部成为“无序区域”。甚至有一些蛋白,不能形成稳定的高级结构,被称作固有无序蛋白。蛋白分子中这些无序区域是其柔性所在,导致蛋白结构灵活可不断变化,且稳定性差。
然而蛋白分子的柔性也是影响蛋白质稳定性的关键因素。蛋白分子的整体或局部的柔性过高极易造成其自发性地变性、降解与多聚化。也正是此原因,许多具有治疗功效的蛋白或多肽未能转化成药物为患者所使用。
因此,如何快速从蛋白质分子氨基酸序列与结构入手,定点精准解析并改善蛋白质的柔性弱点,是亟需解决的问题。
发明内容
为解决或部分解决相关技术中存在的问题,本申请提供一种基于蛋白分子内部原子波动改善蛋白结构柔性弱点的方法和装置,通过AI挖掘与分析,能够快速解析且改善蛋白结构的柔性弱点,增强蛋白分子的稳定性,减少蛋白分子的自发性降解。
本申请第一方面提供一种基于蛋白分子内部原子波动改善蛋白结构柔性弱点的方法,包括:
获取目标蛋白分子的第一晶体结构;
对所述第一晶体结构进行自由能极小化模拟,获得所述目标蛋白分子的能量极小化拓扑结构;
对所述能量极小化拓扑结构进行分子动力学模拟,直至所述能量极小化拓扑结构达到运动平衡状态;
对达到运动平衡状态的所述能量极小化拓扑结构中原子的波动性进行解析,并得到解析结果;
根据所述解析结果,找出所述目标蛋白分子中的高波动性区域;
对所述高波动性区域内的高波动性氨基酸残基所在位点进行突变,得到可降低所述目标蛋白分子整体波动性的目标突变体。
作为一个可选的实施例,所述获取目标蛋白分子的第一晶体结构,包括:
获取带有所述目标蛋白分子的第二晶体结构;
对所述第二晶体结构进行修复,得到修复后的第二晶体结构;
从所述修复后的第二晶体结构中分离出所述目标蛋白分子的第一晶体结构。
作为一个可选的实施例,所述对所述第一晶体结构进行自由能极小化模拟,获得所述目标蛋白分子的能量极小化拓扑结构,包括:
为所述第一晶体结构添加水分子模型与力场,构建所述目标蛋白分子的拓扑结构;
为所述拓扑结构添加模拟盒子;
采用预置方法对添加模拟盒子的所述拓扑结构在真空条件下进行能量极小化模拟的预处理;
对预处理后的所述拓扑结构在真空条件下正式进行能量极小化模拟,获取能量极小化拓扑结构。
作为一个可选的实施例,所述对所述能量极小化拓扑结构进行分子动力学模拟,直至所述能量极小化拓扑结构达到运动平衡状态,包括:
为所述能量极小化拓扑结构添加溶液模型和离子模型,以使所述能量极小化拓扑结构达到电荷平衡的生理状态;
分别在正则系综与等温等压系综中对达到电荷平衡的生理状态的所述能量极小化拓扑结构进行分子动力学模拟,直至所述能量极小化拓扑结构达到运动平衡状态。
作为一个可选的实施例,所述对达到运动平衡状态的所述能量极小化拓扑结构中原子的波动性进行解析,并得到解析结果,包括:
采集达到运动平衡状态的所述能量极小化拓扑结构中原子的波动信息;
根据所述波动信息,计算达到运动平衡状态的所述能量极小化拓扑结构中原子的波动幅度,并将所述原子的波动幅度作为解析结果。
作为一个可选的实施例,所述根据所述解析结果,找出所述目标蛋白分子中的高波动性区域,包括:
根据所述原子的波动幅度,判断所述原子的波动幅度与第一预设阈值之间的关系;
若所述原子的波动幅度大于所述第一预设阈值,则确定所述原子为高波动性氨基酸残基,并将连续分布的所述高波动性氨基酸残基所在区域标记为高波动性区域。
作为一个可选的实施例,所述对所述高波动性区域内的高波动性氨基酸残基所在位点进行突变,得到可降低所述目标蛋白分子整体波动性的目标突变体,包括:
对所述高波动性区域内的高波动性氨基酸残基所在位点进行全氨基酸饱和扫描,得到突变体;
迭代计算所述突变体的整体波动幅度,直至找到可降低所述目标蛋白分子整体波动性的目标突变体。
本申请第二方面提供一种基于蛋白分子内部原子波动改善蛋白结构柔性弱点的装置,包括:
获取模块,用于获取目标蛋白分子的第一晶体结构;
第一模拟模块,用于对所述第一晶体结构进行自由能极小化模拟,获得所述目标蛋白分子的能量极小化拓扑结构;
第二模拟模块,用于对所述能量极小化拓扑结构进行分子动力学模拟,直至所述能量极小化拓扑结构达到运动平衡状态;
解析模块,用于对达到运动平衡状态的所述能量极小化拓扑结构中原子的波动性进行解析,并得到解析结果;
查找模块,用于根据所述解析结果,找出所述目标蛋白分子中的高波动性区域;
突变模块,用于对所述高波动性区域内的高波动性氨基酸残基所在位点进行突变,得到可降低所述目标蛋白分子整体波动性的目标突变体。
本申请第三方面提供一种电子设备,包括:
处理器;以及
存储器,其上存储有可执行代码,当所述可执行代码被所述处理器执行时,使所述处理器执行如上所述的方法。
本申请第四方面提供一种计算机可读存储介质,其上存储有可执行代码,当所述可执行代码被电子设备的处理器执行时,使所述处理器执行如上所述的方法。
本申请提供的技术方案可以包括以下有益效果:
本申请先通过获取目标蛋白分子的第一晶体结构;再对第一晶体结构进行自由能极小化模拟,获得能量极小化拓扑结构;然后对能量极小化拓扑结构进行分子动力学模拟,直至能量极小化拓扑结构达到运动平衡状态;再对达到运动平衡状态的能量极小化拓扑结构中原子的波动性进行解析,并得到解析结果;然后根据解析结果,找出目标蛋白分子中的高波动性区域,在运动平衡状态下目标蛋白分子的高波动性区域就是目标蛋白分子的高柔性弱点区域,会影响目标蛋白分子的稳定性,甚至导致目标蛋白分子的自发性降解;本申请实施例最后对高波动性区域内的高波动性氨基酸残基所在位点进行突变,得到可降低目标蛋白分子整体波动性的目标突变体,目标突变体在保持目标蛋白分子的原有结构和功能的同时,还减弱了高柔性弱点区域的柔性甚至消除高柔性弱点区域。因此,本申请能够快速解析出蛋白结构的高柔性弱点区域,并找到可降低目标蛋白分子整体波动性的目标突变体,从而提高蛋白的稳定性,减少蛋白的自发性降解。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本申请。
附图说明
通过结合附图对本申请示例性实施方式进行更详细地描述,本申请的上述以及其它目的、特征和优势将变得更加明显,其中,在本申请示例性实施方式中,相同的参考标号通常代表相同部件。
图1是本申请实施例示出的基于蛋白分子内部原子波动改善蛋白结构柔性弱点的方法的流程示意图;
图2是本申请实施例示出的基于蛋白分子内部原子波动改善蛋白结构柔性弱点的方法的另一流程示意图;
图3是本申请实施例示出的基于蛋白分子内部原子波动改善蛋白结构柔性弱点的方法的流程框架结构示意图;
图4是本申请实施例示出的G-CSF蛋白分子的高、中、低波动性区域示意图;
图5是本申请实施例示出的G-CSF蛋白分子突变前后整体波动性的对比图;
图6是本申请实施例示出的基于蛋白分子内部原子波动改善蛋白结构柔性弱点的装置的结构示意图;
图7是本申请实施例示出的电子设备的结构示意图。
具体实施方式
下面将参照附图更详细地描述本申请的实施方式。虽然附图中显示了本申请的实施方式,然而应该理解,可以以各种形式实现本申请而不应被这里阐述的实施方式所限制。相反,提供这些实施方式是为了使本申请更加透彻和完整,并且能够将本申请的范围完整地传达给本领域的技术人员。
在本申请使用的术语是仅仅出于描述特定实施例的目的,而非旨在限制本申请。在本申请和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式,除非上下文清楚地表示其他含义。还应当理解,本文中使用的术语“和/或”是指并包含一个或多个相关联的列出项目的任何或所有可能组合。
应当理解,尽管在本申请可能采用术语“第一”、“第二”、“第三”等来描述各种信息,但这些信息不应限于这些术语。这些术语仅用来将同一类型的信息彼此区分开。例如,在不脱离本申请范围的情况下,第一信息也可以被称为第二信息,类似地,第二信息也可以被称为第一信息。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括一个或者更多个该特征。在本申请的描述中,“多个”的含义是两个或两个以上,除非另有明确具体的限定。
肽链中的有些松散结构不能归类到螺旋、β-折叠或转角结构中,它们的肽平面排列无规律,结构较为松散。这些序列的连续出现可能造成蛋白分子局部成为“无序区域”。甚至有一些蛋白,不能形成稳定的高级结构,被称作固有无序蛋白。蛋白分子中这些无序区域是其柔性所在,导致蛋白结构灵活可不断变化,且稳定性差。
然而蛋白分子的柔性也是影响蛋白质稳定性的关键因素。蛋白分子的整体或局部的柔性过高极易造成其自发性地变性、降解与多聚化。也正是此原因,许多具有治疗功效的蛋白或多肽未能转化成药物为患者所使用。
因此,如何快速从蛋白质分子氨基酸序列与结构入手,定点精准解析并改善蛋白质的柔性弱点,是亟需解决的问题。
针对上述问题,本申请实施例提供一种基于蛋白分子内部原子波动改善蛋白结构柔性弱点的方法,能够快速解析且改善蛋白分子结构的柔性弱点,增强蛋白的稳定性,减少蛋白分子的自发性降解。
以下结合附图详细描述本申请实施例的技术方案。
图1是本申请实施例示出的基于蛋白分子内部原子波动改善蛋白结构柔性弱点的方法的流程示意图。
参见图1,一种基于蛋白分子内部原子波动改善蛋白结构柔性弱点的方法,包括步骤S1至步骤S6:
步骤S1:获取目标蛋白分子的第一晶体结构。
本申请实施例可通过以下方式获得获取目标蛋白分子的第一晶体结构:获取目标蛋白分子的第二晶体结构;对第二晶体结构进行修复,得到修复后的第二晶体结构;从修复后的第二晶体结构中分离出目标蛋白分子的第一晶体结构。
其中,本申请实施例的第二晶体结构指目标蛋白分子通过生物物理学方法解析出的晶体结构。第二晶体结构从蛋白质结构数据库(Protein Data Bank,简称PDB)获得目标蛋白分子的晶体结构。其中,蛋白质结构数据库可以预先构建。还需说明的是,可以采用相关技术的建模方法进行建模,本申请对此不加以限定。
步骤S2:对第一晶体结构进行自由能极小化模拟,获得目标蛋白分子的能量极小化拓扑结构。
本申请实施例可以通过以下方式获得能量极小化晶体结构:为第一晶体结构添加水分子模型与力场,构建目标蛋白分子的拓扑结构;为拓扑结构添加模拟盒子;采用预置方法对添加模拟盒子的拓扑结构在真空条件下进行能量极小化模拟的预处理;对预处理后的拓扑结构在真空条件下正式进行能量极小化模拟,获取能量极小化拓扑结构。
步骤S3:对能量极小化拓扑结构进行分子动力学模拟,直至能量极小化拓扑结构达到运动平衡状态。
本申请实施例可以通过以下方式进行分子动力学模拟:为所述能量极小化拓扑结构添加溶液模型和离子模型,以使所述能量极小化拓扑结构达到电荷平衡的生理状态;分别在正则系综与等温等压系综中对达到电荷平衡的生理状态的所述能量极小化拓扑结构进行分子动力学模拟,直至所述能量极小化拓扑结构达到运动平衡状态。
步骤S4:对达到运动平衡状态的能量极小化拓扑结构中原子的波动性进行解析,并得到解析结果。
本申请实施例可以通过以下方式进行解析:采集达到运动平衡状态的能量极小化拓扑结构中原子的波动信息;根据波动信息,计算达到运动平衡状态的能量极小化拓扑结构中原子的波动幅度,并将原子的波动幅度作为解析结果。
步骤S5:根据解析结果,找出目标蛋白分子中的高波动性区域。
本申请实施例可以通过以下方式找出目标蛋白分子中的高波动性区域:根据原子的波动幅度,判断原子的波动幅度与第一预设阈值之间的关系;若原子的波动幅度大于第一预设阈值,则确定原子为高波动性氨基酸残基,并将连续分布的高波动性氨基酸残基所在区域标记为高波动性区域。
步骤S6:对高波动性区域内的高波动性氨基酸残基所在位点进行突变,得到可降低目标蛋白分子整体波动性的目标突变体。
本申请实施例可以以下方式得到目标突变体:通过对高波动性区域内的高波动性氨基酸残基所在位点进行全氨基酸饱和扫描,得到突变体;迭代计算突变体的整体波动幅度,直至找到可降低目标蛋白分子整体波动性的目标突变体。
本申请实施例先通过获取目标蛋白分子的第一晶体结构;再对第一晶体结构进行自由能极小化模拟,获得能量极小化拓扑结构;然后对能量极小化拓扑结构进行分子动力学模拟,直至能量极小化拓扑结构达到运动平衡状态;再对达到运动平衡状态的能量极小化拓扑结构中原子的波动性进行解析,并得到解析结果;然后根据解析结果,找出目标蛋白分子中的高波动性区域,在运动平衡状态下目标蛋白分子的高波动性区域就是目标蛋白分子的高柔性弱点区域,会影响目标蛋白分子的稳定性,甚至导致目标蛋白分子的自发性降解;本申请实施例最后对高波动性区域内的高波动性氨基酸残基所在位点进行突变,得到可降低目标蛋白分子整体波动性的目标突变体,目标突变体在保持目标蛋白分子的原有结构和功能的同时,还减弱了高柔性弱点区域的柔性甚至消除高柔性弱点区域。因此,本申请实施例能够快速解析出蛋白结构的高柔性弱点区域,并找到可降低目标蛋白分子整体波动性的目标突变体,从而提高蛋白的稳定性,减少蛋白的自发性降解。
图2是本申请实施例示出的一种基于蛋白分子内部原子波动改善蛋白结构柔性弱点的方法的另一种流程示意图;图3是本申请实施例示出的一种基于蛋白分子内部原子波动改善蛋白结构柔性弱点的方法的流程框架示意图。
参见图2和图3,本申请实施例一种基于蛋白分子内部原子波动改善蛋白结构柔性弱点的方法,包括以下步骤:
步骤S10:获取带有目标蛋白分子的第二晶体结构。
本申请实施例的第二晶体结构指目标蛋白分子通过生物物理学方法解析出的晶体结构。第二晶体结构从蛋白质结构数据库(Protein Data Bank,简称PDB)获得目标蛋白分子的晶体结构。其中,蛋白质结构数据库可以预先构建。还需说明的是,可以采用相关技术的建模方法进行建模,本申请对此不加以限定。
步骤S11:对第二晶体结构进行修复,得到修复后的第二晶体结构。
例如第二晶体结构中谷氨酰胺残基、天冬酰胺残基侧链中的酰胺基团与组氨酸残基侧链中的咪唑基团的电子密度对称性极高,需要将这些氨基酸残基侧链翻转180°,再通过计算与周围原子的相互作用来判定具体位置。其它氨基酸残基则通过侧链基团或肽平面的细微旋转使得能量最优,最终得到修复后的第二晶体结构。
步骤S12:从修复后的第二晶体结构中分离出目标蛋白分子的第一晶体结构。
其中,可以采用相关技术中的分离方法,从修复后的第二晶体结构中分离出目标蛋白分子的第一晶体结构,本申请对此不加以限定。
步骤S20:为第一晶体结构添加水分子模型与力场,构建目标蛋白分子的拓扑结构。
本申请实施例可以利用分子动力学模拟,输入第一晶体结构,为第一晶体结构添加例如TIP3P的水分子模型以及例如Amber99sb-ildn的力场,构建目标蛋白分子的拓扑结构。
步骤S21:为拓扑结构添加模拟盒子。
本申请实施例的模拟盒子可以为溶剂盒子,可以定义模拟盒子的形状和大小,例如可以为目标蛋白分子的拓扑结构添加与边界距离为2nm的立方体模拟盒子。
步骤S22:采用预置方法对添加模拟盒子的拓扑结构在真空条件下进行能量极小化模拟的预处理。
本申请实施例的预置方法可以为最陡下降法,可根据实际情况设置能量极小化的步数。
步骤S23:对预处理后的拓扑结构在真空条件下正式进行能量极小化模拟,获取能量极小化拓扑结构。
根据步骤S22的预处理可以获得能量极小化的最优步数,利用能量极小化的最优步数对拓扑结构在真空条件下正式进行能量极小化模拟,获取能量极小化拓扑结构。
步骤S30:为所述能量极小化拓扑结构添加溶液模型和离子模型,以使所述能量极小化拓扑结构达到电荷平衡的生理状态。
本申请实施例可以利用分子动力学模拟,输入能量极小化拓扑结构,为能量极小化拓扑结构添加例如spc216溶液模型和生理条件浓度的离子模型,以使能量极小化拓扑结构达到电荷平衡的生理状态。
步骤S31:分别在正则系综与等温等压系综中对达到电荷平衡的生理状态的所述能量极小化拓扑结构进行分子动力学模拟,直至所述能量极小化拓扑结构达到运动平衡状态。
本申请实施例将添加生理条件环境的能量极小化拓扑结构分别在正则系综与等温等压系综中进行分子动力学模拟,直至添加生理条件环境的能量极小化拓扑结构处于运动平衡状态。
步骤S40:采集达到运动平衡状态的能量极小化拓扑结构中原子的波动信息。
本申请实施例采集达到运动平衡状态的能量极小化拓扑结构中所有原子的波动信息,波动信息包括所有原子在所有时间点的坐标、速度和能量。
步骤S41:根据波动信息,计算达到运动平衡状态的能量极小化拓扑结构中原子的波动幅度,并将原子的波动幅度作为解析结果。
本申请实施例根据步骤S40采集的原子的坐标、速度、能量等波动信息,计算原子的波动幅度,各原子的波动幅度d1的计算如下公式:
式中:T表示分子动力学模拟总时间,rj表示某原子在分子动力学模拟时间内的第j时刻的坐标,tj表示分子动力学模拟时间内的第j时刻,表示某原子在分子动力学模拟时间内的平均坐标。
步骤S50:根据原子的波动幅度,判断原子的波动幅度与第一预设阈值之间的关系。
本申请实施例中第一预设阈值用于判断原子是否为高波动性氨基酸残基。
步骤S51:若原子的波动幅度大于第一预设阈值,则确定原子为高波动性氨基酸残基,并将连续分布的高波动性氨基酸残基所在区域标记为高波动性区域。
本申请实施例的第一预设阈值可以为1 Å,还可以设置第二预设阈值,第二预设阈值小于第一预设阈值,可以为0.6 Å。
将波动幅度不大于0.6 Å的原子定义为低波动性氨基酸残基,将波动幅度大于0.6Å且不大于0.1 Å的原子定义为中波动性氨基酸残基,将波动幅度大于1 Å的原子定义为高波动性氨基酸残基,并将连续分布的高波动性氨基酸残基所在区域标记为高波动性区域。
本申请实施例可以将波动性分为高、中、低三类,并将不同波动性区域及氨基酸残基标记不同颜色,得到具有不同颜色标记的蛋白结构。
步骤S60:对高波动性区域内的高波动性氨基酸残基所在位点进行全氨基酸饱和扫描,得到突变体。
步骤S61:迭代计算突变体的整体波动幅度,直至找到可降低目标蛋白分子整体波动性的目标突变体。
突变体的整体波动幅度d2的计算如下公式:
式中:N表示突变体中的原子总数,ri表示突变前蛋白分子中的原子坐标,ri ref表示突变体中与ri对应的原子坐标。
下面本申请实施例以人粒细胞集落刺激因子(G-CSF)蛋白分子为例,对基于蛋白分子内部原子波动改善蛋白结构柔性弱点的方法进行说明,但并不局限于此蛋白,包括以下步骤:
1、先从PDB数据库中获得通过结晶与X射线衍射方法解析得到的带有G-CSF蛋白分子的受体GCSFR蛋白复合物的第二晶体结构1CD9,再对第二晶体结构1CD9进行修复,最后从修复后的第二晶体结构1CD9中分离出G-CSF蛋白分子的第一晶体结构。对第二晶体结构1CD9进行修复包括:第二晶体结构1CD9中谷氨酰胺残基、天冬酰胺残基侧链中的酰胺基团与组氨酸残基侧链中的咪唑基团的电子密度对称性极高,需要将这些氨基酸残基侧链翻转180°,通过计算与周围原子的相互作用来判定具体位置;其它氨基酸残基则通过侧链基团或肽平面的细微旋转使得能量最优;最终得到修复后的第二晶体结构1CD9。
2、对第一晶体结构进行自由能极小化模拟,获得G-CSF蛋白分子的能量极小化拓扑结构。例如可以先利用分子动力学模拟,输入G-CSF蛋白分子的第一晶体结构,添加TIP3P水分子模型与Amber99sb-ildn力场,构建G-CSF蛋白分子的拓扑结构;再添加与边界距离为2nm的立方体模拟盒子;然后先采用最陡下降法对G-CSF蛋白分子的拓扑结构在真空条件下进行能量最小化预处理,再对预处理后的G-CSF蛋白分子的拓扑结构在真空条件下正式进行能量极小化模拟,获取G-CSF蛋白分子的能量极小化拓扑结构。
3、对G-CSF蛋白分子的能量极小化拓扑结构进行分子动力学模拟,直至能量极小化拓扑结构达到运动平衡状态。例如输入G-CSF蛋白分子的能量极小化拓扑结构,为能量极小化拓扑结构添加例如spc216溶液模型和生理条件浓度的离子模型,以使能量极小化拓扑结构达到电荷平衡的生理状态。将添加了生理条件环境的能量极小化拓扑结构分别在正则系综与等温等压系综中进行分子动力学模拟,直至添加了生理条件环境的能量极小化拓扑结构达到运动平衡状态。
4、采集达到运动平衡状态的能量极小化拓扑结构中原子的波动信息;根据波动信息,计算达到运动平衡状态的能量极小化拓扑结构中原子的波动幅度,并将原子的波动幅度作为解析结果;根据原子的波动幅度,判断原子的波动幅度与第一预设阈值之间的关系。若原子的波动幅度大于第一预设阈值,则确定原子为高波动性氨基酸残基,并将连续分布的高波动性氨基酸残基所在区域标记为高波动性区域。例如:参见图4所示,将G-CSF蛋白分子中波动幅度不大于0.6 Å的原子定义为低波动性氨基酸残基,标记为黑色。将G-CSF蛋白分子中幅度大于0.6 Å且不大于1 Å的原子定义为中波动性氨基酸残基,标记为灰色。将G-CSF蛋白分子中幅度大于1 Å的原子的定义为高波动性氨基酸残基,标记为白色。
5、对G-CSF蛋白分子中高波动性区域内的高波动性氨基酸残基所在位点进行全氨基酸饱和扫描,得到突变体。迭代计算突变体的整体波动幅度,直至找到可降低目标蛋白分子整体波动性的目标突变体,从而获得稳定性更高的G-CSF突变蛋白。
6、针对G-CSF蛋白分子中的高波动性氨基酸残基所在位点,例如第132位的谷氨酰胺残基(Q132),进行全氨基酸饱和扫描,经多轮迭代计算,将132位的谷氨酰胺突变成为色氨酸,获得G-CSF蛋白分子(WT)的突变体Q132W蛋白分子,可以降低蛋白分子的整体波动性,提高蛋白分子的稳定性。见图5中WT和Q132W蛋白分子的整体波动性对比图。
与前述应用功能实现方法实施例相对应,本申请还提供了一种基于蛋白分子内部原子波动改善蛋白结构柔性弱点的装置、电子设备及相应的实施例。
图6是本申请实施例示出的基于蛋白分子内部原子波动改善蛋白结构柔性弱点的装置的结构示意图。
参见图6,一种基于蛋白分子内部原子波动改善蛋白结构柔性弱点的装置,包括:
获取模块60,用于获取目标蛋白分子的第一晶体结构。
第一模拟模块61,用于对第一晶体结构进行自由能极小化模拟,获得目标蛋白分子的能量极小化拓扑结构。
第二模拟模块62,用于对能量极小化拓扑结构进行分子动力学模拟,直至能量极小化拓扑结构达到运动平衡状态。
解析模块63,用于对达到运动平衡状态的能量极小化拓扑结构中原子的波动性进行解析,并得到解析结果。
查找模块64,用于根据解析结果,找出目标蛋白分子中的高波动性区域。
突变模块65,用于对高波动性区域内的高波动性氨基酸残基所在位点进行突变,得到可降低目标蛋白分子整体波动性的目标突变体。
其中,获取模块60包括第一获取模块、修复模块和分离模块,第一获取模块用于获取带有目标蛋白分子的第二晶体结构;修复模块用于对第二晶体结构进行修复,得到修复后的第二晶体结构;分离模块用于从修复后的第二晶体结构中分离出目标蛋白分子的第一晶体结构。
第一模拟模块61包括构建模块、添加模块、预处理模块和正式模拟模块,构建模块用于为第一晶体结构添加水分子模型与力场,构建目标蛋白分子的拓扑结构;添加模块用于为拓扑结构添加模拟盒子;预处理模块用于采用预置方法对添加模拟盒子的拓扑结构在真空条件下进行能量极小化模拟的预处理;正式模拟模块用于对预处理后的拓扑结构在真空条件下正式进行能量极小化模拟,获取能量极小化拓扑结构。
第二模拟模块62包括生理状态模拟模块和分子动力学模拟模块,生理状态模拟模块用于为能量极小化拓扑结构添加溶液模型和离子模型,以使能量极小化拓扑结构达到电荷平衡的生理状态;分子动力学模拟模块用于分别在正则系综与等温等压系综中对达到电荷平衡的生理状态的能量极小化拓扑结构进行分子动力学模拟,直至能量极小化拓扑结构达到运动平衡状态。
解析模块63包括采集模块和第一计算模块,采集模块用于采集达到运动平衡状态的能量极小化拓扑结构中原子的波动信息;第一计算模块用于根据波动信息,计算达到运动平衡状态的能量极小化拓扑结构中原子的波动幅度,并将原子的波动幅度作为解析结果。
查找模块64包括判断模块和确定模块,判断模块用于根据原子的波动幅度,判断原子的波动幅度与第一预设阈值之间的关系,并得到判断结果;确定模块用于当判断结果为原子的波动幅度大于第一预设阈值时,确定原子为高波动性氨基酸残基,并将连续分布的高波动性氨基酸残基所在区域标记为高波动性区域。
突变模块65包括扫描模块和第二计算模块,扫描模块用于对高波动性区域内的高波动性氨基酸残基所在位点进行全氨基酸饱和扫描,得到突变体;第二计算模块用于迭代计算突变体的整体波动幅度,直至找到可降低目标蛋白分子整体波动性的目标突变体。
本申请实施例先通过获取目标蛋白分子的第一晶体结构;再对第一晶体结构进行自由能极小化模拟,获得能量极小化拓扑结构;然后对能量极小化拓扑结构进行分子动力学模拟,直至能量极小化拓扑结构达到运动平衡状态;再对达到运动平衡状态的能量极小化拓扑结构中原子的波动性进行解析,并得到解析结果;然后根据解析结果,找出目标蛋白分子中的高波动性区域,在运动平衡状态下目标蛋白分子的高波动性区域就是目标蛋白分子的高柔性弱点区域,会影响目标蛋白分子的稳定性,甚至导致目标蛋白分子的自发性降解;本申请实施例最后对高波动性区域内的高波动性氨基酸残基所在位点进行突变,得到可降低目标蛋白分子整体波动性的目标突变体,目标突变体在保持目标蛋白分子的原有结构和功能的同时,还减弱了高柔性弱点区域的柔性甚至消除高柔性弱点区域。因此,本申请实施例能够快速解析出蛋白结构的高柔性弱点区域,并找到可降低目标蛋白分子整体波动性的目标突变体,从而提高蛋白的稳定性,减少蛋白的自发性降解。
关于上述实施例中的装置,其中各个模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述,此处将不再做详细阐述说明。
图7是本申请实施例示出的电子设备的结构示意图。
参见图7,电子设备700包括存储器710和处理器720。
处理器720可以是中央处理单元(Central Processing Unit,CPU),还可以是其他通用处理器、数字信号处理器 (Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现场可编程门阵列 (Field-Programmable Gate Array,FPGA) 或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
存储器710可以包括各种类型的存储单元,例如系统内存、只读存储器(ROM)和永久存储装置。其中,ROM可以存储处理器720或者计算机的其他模块需要的静态数据或者指令。永久存储装置可以是可读写的存储装置。永久存储装置可以是即使计算机断电后也不会失去存储的指令和数据的非易失性存储设备。在一些实施方式中,永久性存储装置采用大容量存储装置(例如磁或光盘、闪存)作为永久存储装置。另外一些实施方式中,永久性存储装置可以是可移除的存储设备(例如软盘、光驱)。系统内存可以是可读写存储设备或者易失性可读写存储设备,例如动态随机访问内存。系统内存可以存储一些或者所有处理器在运行时需要的指令和数据。此外,存储器710可以包括任意计算机可读存储媒介的组合,包括各种类型的半导体存储芯片(例如DRAM,SRAM,SDRAM,闪存,可编程只读存储器),磁盘和/或光盘也可以采用。在一些实施方式中,存储器710可以包括可读和/或写的可移除的存储设备,例如激光唱片(CD)、只读数字多功能光盘(例如DVD-ROM,双层DVD-ROM)、只读蓝光光盘、超密度光盘、闪存卡(例如SD卡、min SD卡、Micro-SD卡等)、磁性软盘等。计算机可读存储媒介不包含载波和通过无线或有线传输的瞬间电子信号。
存储器710上存储有可执行代码,当可执行代码被处理器720处理时,可以使处理器720执行上文述及的方法中的部分或全部。
此外,根据本申请的方法还可以实现为一种计算机程序或计算机程序产品,该计算机程序或计算机程序产品包括用于执行本申请的上述方法中部分或全部步骤的计算机程序代码指令。
或者,本申请还可以实施为一种计算机可读存储介质(或非暂时性机器可读存储介质或机器可读存储介质),其上存储有可执行代码(或计算机程序或计算机指令代码),当可执行代码(或计算机程序或计算机指令代码)被电子设备(或服务器等)的处理器执行时,使处理器执行根据本申请的上述方法的各个步骤的部分或全部。
以上已经描述了本申请的各实施例,上述说明是示例性的,并非穷尽性的,并且也不限于所披露的各实施例。在不偏离所说明的各实施例的范围和精神的情况下,对于本技术领域的普通技术人员来说许多修改和变更都是显而易见的。本文中所用术语的选择,旨在最好地解释各实施例的原理、实际应用或对市场中的技术的改进,或者使本技术领域的其他普通技术人员能理解本文披露的各实施例。
Claims (10)
1.一种基于蛋白分子内部原子波动改善蛋白结构柔性弱点的方法,其特征在于,包括:
获取目标蛋白分子的第一晶体结构;
对所述第一晶体结构进行自由能极小化模拟,获得所述目标蛋白分子的能量极小化拓扑结构;
对所述能量极小化拓扑结构进行分子动力学模拟,直至所述能量极小化拓扑结构达到运动平衡状态;
对达到运动平衡状态的所述能量极小化拓扑结构中原子的波动性进行解析,并得到解析结果;
根据所述解析结果,找出所述目标蛋白分子中的高波动性区域;
对所述高波动性区域内的高波动性氨基酸残基所在位点进行突变,得到可降低所述目标蛋白分子整体波动性的目标突变体。
2.根据权利要求1所述的方法,其特征在于,所述获取目标蛋白分子的第一晶体结构,包括:
获取带有所述目标蛋白分子的第二晶体结构;
对所述第二晶体结构进行修复,得到修复后的第二晶体结构;
从所述修复后的第二晶体结构中分离出所述目标蛋白分子的第一晶体结构。
3.根据权利要求1所述的方法,其特征在于,所述对所述第一晶体结构进行自由能极小化模拟,获得所述目标蛋白分子的能量极小化拓扑结构,包括:
为所述第一晶体结构添加水分子模型与力场,构建所述目标蛋白分子的拓扑结构;
为所述拓扑结构添加模拟盒子;
采用预置方法对添加模拟盒子的所述拓扑结构在真空条件下进行能量极小化模拟的预处理;
对预处理后的所述拓扑结构在真空条件下正式进行能量极小化模拟,获取能量极小化拓扑结构。
4.根据权利要求1所述的方法,其特征在于,所述对所述能量极小化拓扑结构进行分子动力学模拟,直至所述能量极小化拓扑结构达到运动平衡状态,包括:
为所述能量极小化拓扑结构添加溶液模型和离子模型,以使所述能量极小化拓扑结构达到电荷平衡的生理状态;
分别在正则系综与等温等压系综中对达到电荷平衡的生理状态的所述能量极小化拓扑结构进行分子动力学模拟,直至所述能量极小化拓扑结构达到运动平衡状态。
5.根据权利要求1所述的方法,其特征在于,所述对达到运动平衡状态的所述能量极小化拓扑结构中原子的波动性进行解析,并得到解析结果,包括:
采集达到运动平衡状态的所述能量极小化拓扑结构中原子的波动信息;
根据所述波动信息,计算达到运动平衡状态的所述能量极小化拓扑结构中原子的波动幅度,并将所述原子的波动幅度作为解析结果。
6.根据权利要求5所述的方法,其特征在于,所述根据所述解析结果,找出所述目标蛋白分子中的高波动性区域,包括:
根据所述原子的波动幅度,判断所述原子的波动幅度与第一预设阈值之间的关系;
若所述原子的波动幅度大于所述第一预设阈值,则确定所述原子为高波动性氨基酸残基,并将连续分布的所述高波动性氨基酸残基所在区域标记为高波动性区域。
7.根据权利要求1所述的方法,其特征在于,所述对所述高波动性区域内的高波动性氨基酸残基所在位点进行突变,得到可降低所述目标蛋白分子整体波动性的目标突变体,包括:
对所述高波动性区域内的高波动性氨基酸残基所在位点进行全氨基酸饱和扫描,得到突变体;
迭代计算所述突变体的整体波动幅度,直至找到可降低所述目标蛋白分子整体波动性的目标突变体。
8.一种基于蛋白分子内部原子波动改善蛋白结构柔性弱点的装置,其特征在于,包括:
获取模块,用于获取目标蛋白分子的第一晶体结构;
第一模拟模块,用于对所述第一晶体结构进行自由能极小化模拟,获得所述目标蛋白分子的能量极小化拓扑结构;
第二模拟模块,用于对所述能量极小化拓扑结构进行分子动力学模拟,直至所述能量极小化拓扑结构达到运动平衡状态;
解析模块,用于对达到运动平衡状态的所述能量极小化拓扑结构中原子的波动性进行解析,并得到解析结果;
查找模块,用于根据所述解析结果,找出所述目标蛋白分子中的高波动性区域;
突变模块,用于对所述高波动性区域内的高波动性氨基酸残基所在位点进行突变,得到可降低所述目标蛋白分子整体波动性的目标突变体。
9.一种电子设备,其特征在于,包括:
处理器;以及
存储器,其上存储有可执行代码,当所述可执行代码被所述处理器执行时,使所述处理器执行如权利要求1-7中任一项所述的方法。
10.一种计算机可读存储介质,其上存储有可执行代码,其特征在于,当所述可执行代码被电子设备的处理器执行时,使所述处理器执行如权利要求1-7中任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311345518.4A CN117116336B (zh) | 2023-10-18 | 2023-10-18 | 基于内部原子波动改善蛋白结构柔性弱点的方法和装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311345518.4A CN117116336B (zh) | 2023-10-18 | 2023-10-18 | 基于内部原子波动改善蛋白结构柔性弱点的方法和装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN117116336A true CN117116336A (zh) | 2023-11-24 |
CN117116336B CN117116336B (zh) | 2024-01-23 |
Family
ID=88813081
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311345518.4A Active CN117116336B (zh) | 2023-10-18 | 2023-10-18 | 基于内部原子波动改善蛋白结构柔性弱点的方法和装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117116336B (zh) |
Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20130338988A1 (en) * | 2012-05-22 | 2013-12-19 | Indiana University Research And Technology Corp. | Method for Computer-Aided Vaccine Discovery |
US20150261913A1 (en) * | 2014-03-11 | 2015-09-17 | The Board of Trustees of the Leland Stanford, Junior, University | Method and System for Identifying Clinical Phenotypes in Whole Genome DNA Sequence Data |
EP3082056A1 (en) * | 2015-04-14 | 2016-10-19 | Frédéric Cadet | Method and electronic system for predicting at least one fitness value of a protein, related computer program product |
EP3598327A1 (en) * | 2018-07-20 | 2020-01-22 | Peaccel | Method and electronic system for predicting at least one fitness value of a protein via an extended numerical sequence, related computer program product |
US20210110882A1 (en) * | 2019-10-11 | 2021-04-15 | Arium BioLabs LLC | Computational Systems and Methods for Discovering Allosteric Sites and Allosteric Modulators of Proteins |
CN115698052A (zh) * | 2020-03-19 | 2023-02-03 | 信达生物制药(苏州)有限公司 | 白介素2突变体及其用途 |
CN116486903A (zh) * | 2023-04-17 | 2023-07-25 | 深圳新锐基因科技有限公司 | 基于同源蛋白序列进化方向结合自由能变提高蛋白稳定性的方法及装置 |
CN116486906A (zh) * | 2023-04-17 | 2023-07-25 | 深圳新锐基因科技有限公司 | 基于氨基酸残基突变提高蛋白质分子稳定性的方法及装置 |
CN116665765A (zh) * | 2023-06-14 | 2023-08-29 | 深圳新锐基因科技有限公司 | 基于原子节点与网络约束模型解析蛋白结构刚性弱点的方法和装置 |
-
2023
- 2023-10-18 CN CN202311345518.4A patent/CN117116336B/zh active Active
Patent Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20130338988A1 (en) * | 2012-05-22 | 2013-12-19 | Indiana University Research And Technology Corp. | Method for Computer-Aided Vaccine Discovery |
US20150261913A1 (en) * | 2014-03-11 | 2015-09-17 | The Board of Trustees of the Leland Stanford, Junior, University | Method and System for Identifying Clinical Phenotypes in Whole Genome DNA Sequence Data |
EP3082056A1 (en) * | 2015-04-14 | 2016-10-19 | Frédéric Cadet | Method and electronic system for predicting at least one fitness value of a protein, related computer program product |
EP3598327A1 (en) * | 2018-07-20 | 2020-01-22 | Peaccel | Method and electronic system for predicting at least one fitness value of a protein via an extended numerical sequence, related computer program product |
US20210110882A1 (en) * | 2019-10-11 | 2021-04-15 | Arium BioLabs LLC | Computational Systems and Methods for Discovering Allosteric Sites and Allosteric Modulators of Proteins |
CN115698052A (zh) * | 2020-03-19 | 2023-02-03 | 信达生物制药(苏州)有限公司 | 白介素2突变体及其用途 |
CN116486903A (zh) * | 2023-04-17 | 2023-07-25 | 深圳新锐基因科技有限公司 | 基于同源蛋白序列进化方向结合自由能变提高蛋白稳定性的方法及装置 |
CN116486906A (zh) * | 2023-04-17 | 2023-07-25 | 深圳新锐基因科技有限公司 | 基于氨基酸残基突变提高蛋白质分子稳定性的方法及装置 |
CN116665765A (zh) * | 2023-06-14 | 2023-08-29 | 深圳新锐基因科技有限公司 | 基于原子节点与网络约束模型解析蛋白结构刚性弱点的方法和装置 |
Also Published As
Publication number | Publication date |
---|---|
CN117116336B (zh) | 2024-01-23 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Zimmer et al. | Auto-pytorch: Multi-fidelity metalearning for efficient and robust autodl | |
Cang et al. | Representability of algebraic topology for biomolecules in machine learning based scoring and virtual screening | |
Liu et al. | Query-adaptive reciprocal hash tables for nearest neighbor search | |
Liu et al. | Query-adaptive hash code ranking for large-scale multi-view visual search | |
Cao et al. | Minimal scene descriptions from structure from motion models | |
Venkatraman et al. | Potential for protein surface shape analysis using spherical harmonics and 3D Zernike descriptors | |
Bogunovic et al. | Robust maximization of non-submodular objectives | |
Pelta et al. | A simple and fast heuristic for protein structure comparison | |
Zhang et al. | ResGen is a pocket-aware 3D molecular generation model based on parallel multiscale modelling | |
Zeng et al. | High-throughput cryo-ET structural pattern mining by unsupervised deep iterative subtomogram clustering | |
WO2023065475A1 (zh) | 晶型预测方法、装置及电子设备 | |
Olson et al. | Guiding probabilistic search of the protein conformational space with structural profiles | |
Aizenbud et al. | A max-cut approach to heterogeneity in cryo-electron microscopy | |
Si et al. | Artificial intelligence advances for de novo molecular structure modeling in cryo‐electron microscopy | |
Raffo et al. | SHREC 2021: Retrieval and classification of protein surfaces equipped with physical and chemical properties | |
CN117198386B (zh) | 基于人工智能技术预测蛋白分子相互作用的方法和装置 | |
CN117116336B (zh) | 基于内部原子波动改善蛋白结构柔性弱点的方法和装置 | |
Vega-Rodriguez et al. | Genetic algorithms using parallelism and FPGAs: the TSP as case study | |
Bruno et al. | Comparing chemistry to outcome: the development of a chemical distance metric, coupled with clustering and hierarchal visualization applied to macromolecular crystallography | |
Corso | Modeling molecular structures with intrinsic diffusion models | |
CN116110515A (zh) | 分子应变能的计算方法、分子筛选方法及相关装置 | |
Moshawih et al. | Consensus holistic virtual screening for drug discovery: a novel machine learning model approach | |
Grigoryan | Absolute free energies of biomolecules from unperturbed ensembles | |
CN116486906A (zh) | 基于氨基酸残基突变提高蛋白质分子稳定性的方法及装置 | |
Gómez-Tamayo et al. | Binding Affinity Prediction with 3D Machine Learning: Training Data and Challenging External Testing |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |