CN108959849A - 一种基于计算生物学筛选提高沉香倍半萜合酶活性的关键氨基酸位点的方法 - Google Patents
一种基于计算生物学筛选提高沉香倍半萜合酶活性的关键氨基酸位点的方法 Download PDFInfo
- Publication number
- CN108959849A CN108959849A CN201810604291.3A CN201810604291A CN108959849A CN 108959849 A CN108959849 A CN 108959849A CN 201810604291 A CN201810604291 A CN 201810604291A CN 108959849 A CN108959849 A CN 108959849A
- Authority
- CN
- China
- Prior art keywords
- sesquiterpene synthase
- agalloch eaglewood
- site
- model
- positive selection
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 101710093888 Pentalenene synthase Proteins 0.000 title claims abstract description 71
- 101710115850 Sesquiterpene synthase Proteins 0.000 title claims abstract description 71
- 241000271309 Aquilaria crassna Species 0.000 title claims abstract description 68
- 238000000034 method Methods 0.000 title claims abstract description 19
- 150000001413 amino acids Chemical class 0.000 title claims abstract description 15
- 238000004364 calculation method Methods 0.000 title claims abstract description 10
- 230000035772 mutation Effects 0.000 claims abstract description 29
- 230000000694 effects Effects 0.000 claims abstract description 13
- 238000001514 detection method Methods 0.000 claims abstract description 8
- 238000012216 screening Methods 0.000 claims abstract description 8
- 108090000623 proteins and genes Proteins 0.000 claims description 23
- 102000004169 proteins and genes Human genes 0.000 claims description 16
- 241000196324 Embryophyta Species 0.000 claims description 15
- 102000004190 Enzymes Human genes 0.000 claims description 10
- 108090000790 Enzymes Proteins 0.000 claims description 10
- 241000218922 Magnoliophyta Species 0.000 claims description 8
- 238000005421 electrostatic potential Methods 0.000 claims description 8
- 230000003993 interaction Effects 0.000 claims description 7
- RXHIKAIVEMAPRU-JRIGQVHBSA-N sequiterpene Natural products C1=C(C)[C@@H](OC(C)=O)[C@H](O)[C@@]2(O)[C@H](C)CC[C@@H](C(C)=C)[C@H]21 RXHIKAIVEMAPRU-JRIGQVHBSA-N 0.000 claims description 6
- 239000000758 substrate Substances 0.000 claims description 5
- QGZKDVFQNNGYKY-UHFFFAOYSA-N Ammonia Chemical compound N QGZKDVFQNNGYKY-UHFFFAOYSA-N 0.000 claims description 4
- 230000005611 electricity Effects 0.000 claims description 4
- 241000218631 Coniferophyta Species 0.000 claims description 3
- 230000015572 biosynthetic process Effects 0.000 claims description 3
- 241000195940 Bryophyta Species 0.000 claims description 2
- 241000209510 Liliopsida Species 0.000 claims description 2
- 239000002253 acid Substances 0.000 claims description 2
- 229910021529 ammonia Inorganic materials 0.000 claims description 2
- 239000005515 coenzyme Substances 0.000 claims description 2
- 238000013480 data collection Methods 0.000 claims description 2
- 230000009467 reduction Effects 0.000 claims description 2
- 239000002904 solvent Substances 0.000 claims description 2
- 101710118490 Copalyl diphosphate synthase Proteins 0.000 claims 1
- 101710174833 Tuberculosinyl adenosine transferase Proteins 0.000 claims 1
- 241001233957 eudicotyledons Species 0.000 claims 1
- 238000004458 analytical method Methods 0.000 abstract description 6
- 230000002596 correlated effect Effects 0.000 abstract 1
- 235000018102 proteins Nutrition 0.000 description 14
- 230000006870 function Effects 0.000 description 12
- 238000003657 Likelihood-ratio test Methods 0.000 description 11
- 230000026731 phosphorylation Effects 0.000 description 6
- 238000006366 phosphorylation reaction Methods 0.000 description 6
- 241001533085 Aquilaria sinensis Species 0.000 description 5
- 229930000044 secondary metabolite Natural products 0.000 description 5
- 102000008122 Casein Kinase I Human genes 0.000 description 3
- 108010049812 Casein Kinase I Proteins 0.000 description 3
- 102000003923 Protein Kinase C Human genes 0.000 description 3
- 108090000315 Protein Kinase C Proteins 0.000 description 3
- 230000003044 adaptive effect Effects 0.000 description 3
- 238000011160 research Methods 0.000 description 3
- 238000006467 substitution reaction Methods 0.000 description 3
- 230000004083 survival effect Effects 0.000 description 3
- 238000004114 suspension culture Methods 0.000 description 3
- 241001265525 Edgeworthia chrysantha Species 0.000 description 2
- 238000007476 Maximum Likelihood Methods 0.000 description 2
- 125000003275 alpha amino acid group Chemical group 0.000 description 2
- 230000008901 benefit Effects 0.000 description 2
- 238000009826 distribution Methods 0.000 description 2
- 239000003814 drug Substances 0.000 description 2
- 230000002255 enzymatic effect Effects 0.000 description 2
- 230000007774 longterm Effects 0.000 description 2
- 238000004519 manufacturing process Methods 0.000 description 2
- 239000000463 material Substances 0.000 description 2
- 210000003205 muscle Anatomy 0.000 description 2
- 238000002703 mutagenesis Methods 0.000 description 2
- 231100000350 mutagenesis Toxicity 0.000 description 2
- 108010087432 terpene synthase Proteins 0.000 description 2
- 241000218642 Abies Species 0.000 description 1
- 235000001405 Artemisia annua Nutrition 0.000 description 1
- 240000000011 Artemisia annua Species 0.000 description 1
- 206010011224 Cough Diseases 0.000 description 1
- 235000009429 Gossypium barbadense Nutrition 0.000 description 1
- 244000299507 Gossypium hirsutum Species 0.000 description 1
- RRHGJUQNOFWUDK-UHFFFAOYSA-N Isoprene Chemical group CC(=C)C=C RRHGJUQNOFWUDK-UHFFFAOYSA-N 0.000 description 1
- 241000208682 Liquidambar Species 0.000 description 1
- 235000006552 Liquidambar styraciflua Nutrition 0.000 description 1
- 241000195887 Physcomitrella patens Species 0.000 description 1
- 238000005411 Van der Waals force Methods 0.000 description 1
- 206010047700 Vomiting Diseases 0.000 description 1
- 208000027418 Wounds and injury Diseases 0.000 description 1
- 208000006673 asthma Diseases 0.000 description 1
- 230000004071 biological effect Effects 0.000 description 1
- 238000004422 calculation algorithm Methods 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 230000006378 damage Effects 0.000 description 1
- 230000007850 degeneration Effects 0.000 description 1
- 229910003460 diamond Inorganic materials 0.000 description 1
- 239000010432 diamond Substances 0.000 description 1
- 230000004069 differentiation Effects 0.000 description 1
- 238000009792 diffusion process Methods 0.000 description 1
- 235000013399 edible fruits Nutrition 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 239000007789 gas Substances 0.000 description 1
- 244000059217 heterotrophic organism Species 0.000 description 1
- 239000001257 hydrogen Substances 0.000 description 1
- 229910052739 hydrogen Inorganic materials 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 239000004615 ingredient Substances 0.000 description 1
- 208000014674 injury Diseases 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000012269 metabolic engineering Methods 0.000 description 1
- 238000002887 multiple sequence alignment Methods 0.000 description 1
- 125000003729 nucleotide group Chemical group 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 230000001151 other effect Effects 0.000 description 1
- 239000002304 perfume Substances 0.000 description 1
- 230000003285 pharmacodynamic effect Effects 0.000 description 1
- 238000013081 phylogenetic analysis Methods 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 230000001737 promoting effect Effects 0.000 description 1
- 102200014005 rs1051338 Human genes 0.000 description 1
- 238000004088 simulation Methods 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
- 230000033772 system development Effects 0.000 description 1
- 150000003505 terpenes Chemical class 0.000 description 1
- 235000007586 terpenes Nutrition 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 238000013519 translation Methods 0.000 description 1
- 230000014616 translation Effects 0.000 description 1
- 235000018322 upland cotton Nutrition 0.000 description 1
- 239000003039 volatile agent Substances 0.000 description 1
- 239000000341 volatile oil Substances 0.000 description 1
- 230000008673 vomiting Effects 0.000 description 1
- 238000010792 warming Methods 0.000 description 1
Landscapes
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
Abstract
本发明公开了一种基于计算生物学筛选提高沉香倍半萜合酶活性的关键氨基酸位点的方法,包括如下步骤:1)获得沉香等68条倍半萜合酶相关序列;2)通过Modeltest、PAUP*和MrBayes等软件构建倍半萜合酶系统发育树;3)采用PAML软件的位点模型、枝模型和枝位点模型检测倍半萜合酶的正选择位点;4)对沉香倍半萜合酶进行同源建模,通过PyMOL软件显示正选择位点;5)运用Discovery Studio软件进行沉香倍半萜合酶突变体的计算分析。结果表明,247Q、403D、412P、426Y、470G和538S等6个正选择位点与沉香倍半萜合酶功能位点或功能保守区密切相关;D403R、G470Q和S538K突变后有利于提高沉香倍半萜合酶活性与稳定性。本发明方法基于计算生物学,操作简单,能够实现经济快捷筛选提高沉香倍半萜合酶活性的关键氨基酸位点。
Description
技术领域
本发明涉及一种基于计算生物学筛选提高沉香倍半萜合酶活性的关键氨基酸位点的方法。
背景技术
沉香是传统的名贵中药,印度尼西亚、马来西亚和越南是沉香的主要出口国。在中国,沉香主要分布在海南、广东等省。沉香具有行气止痛、温中止呕、纳气平喘等功效,主要用于治疗风湿病和咳嗽。此外,沉香还广泛应用于天然香料、精油等。高品质沉香价格可达每千克1000美元,具有巨大的商业价值,被誉为“植物中的钻石”,市场需求量很大。而沉香是在沉香属植物受到自然或人为伤害后形成,自然条件下沉香结香非常缓慢。因此,沉香的供应量远远不能满足市场需求,迫切需要发现一种提高沉香产量的新方法。
白木香(Aquilaria sinensis (Lour.) Spreng)为瑞香科沉香属植物,是生产芳香类药材国产沉香的主要资源植物和正品来源。倍半萜是沉香的主要药效成分,是白木香适应环境而产生的次生代谢产物。沉香倍半萜合酶(Aquilaria sinensis Sesquiterpenesynthase)是沉香生物合成的关键酶,其活性高低直接影响沉香的结香量。然而,天然的倍半萜合酶活性很低,成为制约代谢工程量产倍半萜的关键技术瓶颈。研究表明,基于适应性进化理论对蛋白质进行正选择位点分析,为深化阐明蛋白质活性位点与功能的相互关系,改良酶的活性提供了重要的信息。
正选择也指达尔文选择或定向选择,即把具有提高个体适合度的有利突变等位基因在某个群体中固定下来的选择作用,以适应不同的生存环境。正选择作用在适应性进化机制中处于核心地位,当群体中出现能够提高个体生存力及繁衍力的突变时,具有该基因型的个体较其它个体将更可能存活并遗留更多子代,导致突变基因型最终得以在整个群体中扩散和固定。而基因水平的适应性进化的一种重要方式是指基因通过正选择得到积累并保持有利突变,改变蛋白结构和功能,进而适应外界变化。正选择表现在蛋白质氨基酸序列上,其非同义置换率(dN)高于同义置换率(dS)。适应性正选择的研究既有助于对基因功能区的预测,为解决某些生物技术和生物医学难题提供了崭新的思路。
植物在长期的生物进化过程中,为了提高适应环境的生存能力,会产生一些对生态环境高度适应的次生代谢物质,这些次生代谢物质具有自身防御和繁衍后代的重要功能。植物进化学家已在陆生植物中陆续发现了适应性进化的正选择作用,研究发现的正选择作用主要集中在与抗逆及生殖相关的基因。2008年美国科学家Howitz K T和Sinclair DA在《Cell》提出了Xenohormesis效应假说,从进化与生态角度解释了由植物产生的次生代谢产物可使异养生物受益,增加其生存机会的原因。Xenohormesis效应假说也为从进化和生态角度理解植物类中药次生代谢产物的生物效应提供了理论支持。
作为一类庞大的植物次生代谢产物群,倍半萜类化合物属于萜类家族,其C15结构包含三个异戊二烯单元。迄今已发现至少有300种倍半萜类化合物,大多是挥发性化合物。倍半萜类由倍半萜合成途径中的限速酶倍半萜合酶催化合成。然而,倍半萜合酶功能分化和基因进化的过程仍然是未知的。在本项目中,基于计算生物学,以沉香倍半萜合酶为目标序列,从陆生植物的倍半萜合酶基因中分析氨基酸和核苷酸残基的差异,利用位点模型、枝模型和枝位点模型来检测倍半萜合酶基因的正选择位点,并利用虚拟突变模拟正选择位点定点突变后对沉香倍半萜合酶功能和稳定性的影响,为筛选提高沉香倍半萜合酶活性的关键氨基酸位点提供了一种新方法。
发明内容
本发明的目的:基于计算生物学,检测及鉴定沉香倍半萜合酶的正选择位点,并利用虚拟突变模拟正选择位点定点突变后对沉香倍半萜合酶功能和稳定性的影响,为筛选提高沉香倍半萜合酶活性的关键氨基酸位点提供新方法。
本发明技术方案如下:
(1) 被子植物倍半萜合酶基因以及蛋白质序列获得;
(2) 被子植物倍半萜合酶基因系统发育分析;
(3) 正选择位点检测;
(4) 蛋白质序列及三维结构上预测正选择位点对沉香倍半萜合酶功能保守区及活性的影响。
(5) 虚拟突变正选择位点及突变结果分析。
本发明的优点及其效果:
(1) 本项目分析了植物倍半萜合酶的分子进化和结构特征。
(2) 本项目从分子进化角度检测倍半萜合酶在物种进化过程中潜在的有利突变位点,通过同源建模、虚拟突变等计算生物学方法探讨正选择位点与沉香倍半萜合酶功能进化的关系,为筛选提高沉香倍半萜合酶活性的关键氨基酸位点提供了一种新方法。
具体实施方式:
实施例一
(1)植物倍半萜合酶基因以及蛋白质序列获得。从GenBank数据库中检索沉香倍半萜合酶蛋白质序列(GenBank号:AIT75876.1),并以AIT75876.1序列为目标序列,通过使用非冗余蛋白质数据库进行PSI-BLAST检索,从GenBank数据库中收集蛋白质序列和编码序列,排除所有预测、推定、部分、未命名和假设序列,只纳入全长编码序列。最终纳入68条倍半萜合酶蛋白质以及对应的编码序列,此序列数据集含68种陆生植物,包括66种被子植物(63种双子叶植物和3种单子叶植物)、苔藓植物和裸子植物。
(2)被子植物倍半萜合酶基因系统发育分析。使用MUSCLE网络服务器(www.ebi.ac.uk/Tools/msa/muscle/)对68条蛋白质序列进行多重比对,参数设定为默认值。将比对好的蛋白质序列和编码序列导入PAL2NAL(www.bork.embl.de/pal2nal/)中构建的多重密码子比对。经过PAL2NAL对齐后,通过MEGA7软件将数据集文件转换为nexus格式进行系统发育分析。根据68条比对好基因序列nexus格式文件,使用Modeltest 3.7和PAUP *4.0软件计算优化参数,首先通过PAUP* 4.0中的Akaike Information Criterion(AIC)选定最佳氨基酸替代模型评估建树分析,然后PAUP* 4.0中PhyML程序的distance methods和maximum likelihood(ML)方法进行优化评估。最后,根据Modeltest 3.7评估的最佳模型(GTR + I + G)获得最优设置参数,通过MrBayes 3.1.2利用最优设置参数重建倍半萜合酶基因系统发育树。在重建过程中,使用贝叶斯后验概率(PP)来评估系统发育树中的所有进化枝支持率。
(3)正选择位点检测。基于MrBayes软件构建系统发育关系树,采用PAML 4.9软件的位点模型、枝模型和枝位点模型检测倍半萜合酶的正选择位点。这三种模型均通过codeml应用程序计算非同义替代(dN)和同义替代(dS)比值(ω= dN / dS)。ω值是自然选择的度量,其通过最大似然法估计,ω> 1表明某些进化枝或位点受到正选择;位点模型、枝模型和枝位点模型均通过不同嵌套模型检测正选择,嵌套模型包括空模型和替代模型。空模型不允许正选择位点(ω > 1)存在,替代模型允许正选择位点(ω> 1)存在。在实际应用中,似然比检验(LRT)用来评估每对嵌套模型是否具有统计学意义。嵌套模型的两倍对数似然比值之差(2ΔlnL)遵循χ2分布,自由度(df)为空模型和替代模型中np值之差,P < 0.05时表明替代模型比空模型更显著,差异具有统计学意义。然后使用Naive Empirical Bayes(NEB)和Bayes Empirical Bayes(BEB)算法计算正选择位点的后验概率(PP)。
(4)蛋白质序列及三维结构上预测正选择位点对沉香倍半萜合酶功能保守区及活性的影响。搜索白木香、马来西亚沉香、印尼沉香、喜树、陆地棉和黄花蒿的六条倍半萜合酶序列,利用ClustalW(www.genome.jp/tools-bin/clustalw)对上述六条蛋白质序列进行两两比对,结果由GENEDOC软件显示;Predict Protein(www.predictprotein.org)预测沉香倍半萜合酶潜在的功能位点,包括酪蛋白激酶II磷酸化位点(19-22aa)和蛋白激酶C磷酸化位点(356-358aa);在NCBI数据库中搜索活性位点结构域(24-31、460,461、463-466、468-471和532-535aa)、底物结合位点(270、279、330、302-304、307和535 aa等)以及RRx8W(24-34aa)、DDXXD(307-311aa)和NSE / DTE(453-461aa)保守区信息。根据ClustalW两两比对结果,通过类比预测沉香倍半萜合酶存在RXR(270-272aa)保守区。SWISS-MODEL(https:// swissmodel.expasy.org/)用于进行沉香倍半萜合酶同源建模,PyMOL软件显示正选择位点在沉香倍半萜合酶三维结构上分布,并用于预测其对酶结构和功能的潜在影响。
(5)虚拟突变正选择位点及突变结果分析。将Discovery Studio中的CHARMMforcefield, Calculate Mutation Energy (Stability), Electrostatic Potential 和“Build Mutant”模块用于沉香倍半萜合酶突变体的计算分析。其中,应用CalculateMutation Energy (Stability)评价点突变对酶稳定性的影响。采用ElectrostaticPotential研究蛋白质表面的静电势分布。此外,DS软件中的“Build Mutant”用于构建虚拟突变体。
结果表明:
(1)倍半萜合酶基因序列的系统发育树如图1所示。 Physcomitrella patens(苔藓植物)和Picea abies(裸子植物)为外类群(A组),被子植物内群被分成三个进化枝群(B组、C组和D组)。在这些群体中,沉香属物种和枫香形成进化枝群(B 组)并位于被子植物内群基部位置,暗示沉香倍半萜合酶基因在被子植物内群中处于较原始的进化状态。
(2)根据位点模型(表1)的似然比检验(LRT),M1a与M2a的2ΔlnL值分别为0,p =1.00,故M2a检测到的18A(96%**)不是正选择位点。M0与M3模型也没有检测出正选择位点。而M8模型明显优于M7模型(2ΔlnL= 34.12,p < 0.001,df = 2),检测到18个具有ω> 1的正选择位点。其中,3个位点(14H、16A和18A)PP值大于99%,6个位点(3A,12P,15N,17A,20K和46A)检测到PP值在95%和99%之间,9个位点(4A,10P,11V ,19S,21E,51K,403D,412P和426Y)PP值在50 %到95%之间。
(4)在长期进化过程中,正选择并没有影响所有物种的相应氨基酸位点,这意味着它可能仅在某些特定进化枝中发生。因此,我们采用枝模型来检测正选择进化枝(表2)。枝模型表明,模型free-ratio显着高于模型M0(2ΔlnL= 452.54,p = 0.00,df = 131),这表明这些枝(Ta、Tb、Tc、Td、Te、Tf、Tg和Th)中存在正选择信号。模型two-ratio的结果表明,其中四枝(Ta、Tc、Td和Tg)ω> 1且p <0.05,剩余四枝(Tb、Te、Tf和Th)p >0.05,并且枝Th的ω< 1。因此,Ta、Tc、Td和Tg被设定为枝位点模型中的四个前景枝,用于进一步检测潜在的正选择位点。
(3)根据枝位点模型的LRT(表3),两对模型BSc1 Vs. BSc0-fix(2ΔlnL= 11.16,p= 0.0008,df = 1)和BSg1 Vs. BSg0- fix(2ΔlnL = 8.64,p = 0.0033,df = 1)显示出显著性差异。结果表明,枝Tc的3个氨基酸位点(247Q、333A、538S)和枝Tg的3个氨基酸位点(362A、470G、403D)中,BEB检测结果为0.5 < PP < 0.95。根据NEB方法分析,枝Tg的403D的PP为0.814。而403D在位点模型中也被检测为正选择位点。
表1 倍半萜合酶正选择检测位点模型
np:可用参数的数量。 lnL:对数似然。 LRT:似然比检验。df:自由度。2ΔlnL:比较两个模型的对数似然差的两倍。 PP> 50%检验通过后验概率显示,PP> 95%标记有*,而PP>99%的标记用**标记。
表2 倍半萜合酶正选择检测枝模型
np:可用参数的数量。 lnL:对数似然。 LRT:似然比检验。df:自由度。2ΔlnL:比较两个模型的对数似然差的两倍。
表3 倍半萜合酶正选择检测枝位点模型
np:可用参数的数量。 lnL:对数似然。 LRT:似然比检验。df:自由度。2ΔlnL:比较两个模型的对数似然差的两倍。 PP> 50%检验通过后验概率显示。
(4)如图2所示,沉香倍半萜合酶功能域包括活性位点结构域、底物结合口袋、两个翻译后修饰位点区(酪蛋白激酶II磷酸化位点和蛋白激酶C磷酸化位点)和四个高度保守保守区(RRx8W、RXR、DDXXD和NSE / DTE)。位点模型和枝位点模型检测的23个正选择位点在倍半萜合酶一级序列分布如GeneDoc图所示(图2)。其中,19S、20K和21E位于酪蛋白激酶II磷酸化位点区域(19-22aa),362A位于蛋白激酶C磷酸化位点附近(356-358aa),470G位于活性位点结构域(468-471aa)中并位于NSE / DTE保守区(453-461aa)附近,538S位于活性位点结构域(532-535aa)附近。
(5)图3展示了10个正选择位点(红色),它们都位于AsSTS的α螺旋上(图3A),包括46A、51K、247Q、333A、362A、403D、412P、426Y、470G和538S。其中,412P、470G和538S位于AsSTS活性位点结构域附近(图3B),470G为活性位点(3C)。图3D显示四个保守保守区(RRx8W,RXR,DDXXD和NSE / DTE)附近的正选择位点247Q、403D、470G和538S的分布,在图3-D1中,403D和470G分别显示位于DDXXD和NSE / DTE保守区附近,图3-D2和图3-D3展示538S与其他功能性位点之间的关系。通过与275E和541T产生非键相互作用,538S与RRX8W和RXR保守区中的残基30H、32S、34W和272R以及活性位点结构域中的532G、533D和535Y形成相互作用网络。由于同源建模模板中缺失一段氨基酸,另外的13个正选择位点(3A、4A、10P、11V、12P、14H、15N、16A、17A、18A、19S、20K和21E)无法显示在酶结构上。总之,247Q,403D,412P,426Y,470G和538S 等6个正选择位点与沉香倍半萜合酶功能位点或保守保守区密切相关。
正选择位点(46A、51K、247Q、333A、362A、403D、412P、426Y、470G和538S)虚拟突变静电势项、范德华力项和熵变项能量变化见表4。如表4,大部分正选择位点突变为改善酶稳定性的有利突变。例如,A46C、Q247M、A362W、Y426V和G470Q突变能减少-1.0 〜 -2.0 kcal•mol-1,A333F和S538K突变能减少-2.3 〜 -2.7kcal•mol-1,K51Q和D403Q突变能减少-3.4〜-3.6 kcal•mol-1。D403R突变能量降低-3.5kcal•mol-1,这可能与403D突变为403R后静电势表面由负电变为正电有关。突变后403R正电静电势表面与周围负电表面抵消而使沉香倍半萜合酶体系能量降低,可能提高沉香倍半萜合酶适应环境的稳定性。如图4B,G470Q和S538K突变体对RRx8W、RXR和NSE/DTE保守区可能存在较大影响,G470Q通过非键相互作用影响NSE / DTE的保守位点454D和底物结合位点451L,而且G470Q也有助于454D与Mg2+形成新的非键相互作用而结合牢固。因此,我们推测G470Q能够与底物结合位点451L和454D连接,并通过形成更多的非键相互作用来提高辅酶区域对Mg2+结合稳定性。538S突变为538K后,能量降低-2.7 kcal•mol-1,揭示S538K突变有利于提高沉香倍半萜合酶稳定性,而且538K与275E形成氢键,并与33F形成了新的π-烷基相互作用。因此,我们推测S538K通过与33F和272R形成新的非键相互作用,可以提高酶稳定性并可能增强RRx8W和RXR两个保守区在阻止水分子和其它外部溶剂侵入酶活性中心的作用。总之,本项目为筛选提高沉香倍半萜合酶活性的关键氨基酸位点提供了一种新方法。
表4 沉香倍半萜合酶正选择位点虚拟突变
能量单位为kcal / mol。 VDW项:范德华能。稳定:突变能< -0.5kcal / mol,中性:突变能> -0.5kcal / mol和<0.5kcal / mol。
附图说明
图1 陆生植物倍半萜合酶基因系统发育树
图2 陆生植物部分氨基酸序列的多重序列比对GENDOC图
图3 沉香倍半萜合酶三维结构图
图4 沉香倍半萜合酶正选择位点(403D、470G和538S)虚拟突变结果图。
Claims (4)
1.一种基于计算生物学筛选提高沉香倍半萜合酶活性的关键氨基酸位点的方法,其特征在于该方法包括以下步骤:
(1)从GenBank数据库中检索沉香倍半萜合酶蛋白质序列(GenBank号:AIT75876.1),并以AIT75876.1序列为目标序列,通过使用非冗余蛋白质数据库进行PSI-BLAST检索,从GenBank数据库中收集蛋白质序列和编码序列,最终纳入68条倍半萜合酶蛋白质序列以及68条对应的编码序列,此序列数据集含68种陆生植物,包括66种被子植物(63种双子叶植物和3种单子叶植物)、苔藓植物和裸子植物;
(2)通过Modeltest 3.7获得最佳模型(GTR + I + G),利用PAUP* 4.0软件计算最优设置参数,运用MrBayes 3.1.2构建倍半萜合酶基因系统发育树;
(3)采用PAML 4.9软件的位点模型、枝模型和枝位点模型检测倍半萜合酶的正选择位点;
(4)利用SWISS-MODEL(https://swissmodel.expasy.org/)进行沉香倍半萜合酶同源建模,PyMOL软件显示正选择位点在沉香倍半萜合酶三维结构上的分布位置,并预测其对酶结构和功能的潜在影响;
(5)运用Discovery Studio中的CHARMM forcefield、Calculate Mutation Energy(Stability)、Electrostatic Potential 和“Build Mutant”模块进行沉香倍半萜合酶突变体的计算分析。
2.根据权利要求1所述的一种基于计算生物学筛选提高沉香倍半萜合酶活性的关键氨基酸位点的方法,其特征包括步骤(3)和步骤(5)。
3.其中,步骤(3)所述采用PAML 4.9软件的位点模型、枝模型和枝位点模型检测沉香倍半萜合酶的正选择位点,结果显示,247Q,403D,412P,426Y,470G和538S 等6个正选择位点与沉香倍半萜合酶功能位点或保守保守区密切相关。
4.此外,步骤(5)运用Discovery Studio中的CHARMM forcefield, CalculateMutation Energy (Stability), Electrostatic Potential 和“Build Mutant”模块进行沉香倍半萜合酶突变体的计算分析,结果显示,D403R、G470Q和S538K突变后沉香倍半萜合酶自由能降低,这有利于提高沉香倍半萜合酶稳定性;D403R突变的正电静电势表面与周围负电表面抵消而使沉香倍半萜合酶体系能量降低,可能提高沉香倍半萜合酶适应环境的稳定性;G470Q突变能够与底物结合位点451L和454D连接,并通过形成更多的非键相互作用来提高辅酶区域对Mg2+结合稳定性;S538K突变通过与33F和272R形成新的非键相互作用而使沉香倍半萜合酶自由能降低,这提高了酶稳定性并可能增强RRx8W和RXR两个保守区在阻止水分子和其它外部溶剂侵入酶活性中心的作用。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810604291.3A CN108959849A (zh) | 2018-06-13 | 2018-06-13 | 一种基于计算生物学筛选提高沉香倍半萜合酶活性的关键氨基酸位点的方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810604291.3A CN108959849A (zh) | 2018-06-13 | 2018-06-13 | 一种基于计算生物学筛选提高沉香倍半萜合酶活性的关键氨基酸位点的方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN108959849A true CN108959849A (zh) | 2018-12-07 |
Family
ID=64488667
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810604291.3A Pending CN108959849A (zh) | 2018-06-13 | 2018-06-13 | 一种基于计算生物学筛选提高沉香倍半萜合酶活性的关键氨基酸位点的方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN108959849A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109852600A (zh) * | 2018-12-25 | 2019-06-07 | 天津大学 | 一种小萼苔倍半萜合成酶MTb及其基因序列 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20050202440A1 (en) * | 2003-11-06 | 2005-09-15 | Robert Fletterick | Inhibitors for androgen antagonist refractory prostate cancer |
CN102156823A (zh) * | 2011-02-18 | 2011-08-17 | 复旦大学 | 一种靶向作用于蛋白激酶非活性构象的化合物筛选方法 |
CN103014029A (zh) * | 2012-12-28 | 2013-04-03 | 贵州省烟草科学研究院 | 普通烟草类异黄酮还原酶基因及其应用 |
CN106021976A (zh) * | 2016-06-23 | 2016-10-12 | 中国科学院寒区旱区环境与工程研究所 | 一种检测柽柳科植物rbcL基因适应性进化与结构建模的方法 |
CN106834312A (zh) * | 2017-03-09 | 2017-06-13 | 曲阜师范大学 | 一种超氧化物歧化酶Cu,Zn‑SOD基因及其应用 |
-
2018
- 2018-06-13 CN CN201810604291.3A patent/CN108959849A/zh active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20050202440A1 (en) * | 2003-11-06 | 2005-09-15 | Robert Fletterick | Inhibitors for androgen antagonist refractory prostate cancer |
CN102156823A (zh) * | 2011-02-18 | 2011-08-17 | 复旦大学 | 一种靶向作用于蛋白激酶非活性构象的化合物筛选方法 |
CN103014029A (zh) * | 2012-12-28 | 2013-04-03 | 贵州省烟草科学研究院 | 普通烟草类异黄酮还原酶基因及其应用 |
CN106021976A (zh) * | 2016-06-23 | 2016-10-12 | 中国科学院寒区旱区环境与工程研究所 | 一种检测柽柳科植物rbcL基因适应性进化与结构建模的方法 |
CN106834312A (zh) * | 2017-03-09 | 2017-06-13 | 曲阜师范大学 | 一种超氧化物歧化酶Cu,Zn‑SOD基因及其应用 |
Non-Patent Citations (2)
Title |
---|
刘镛等: "陆生植物鲨烯合酶适应性进化正选择位点分析", 《中国生物化学与分子生物学报》 * |
郎大田等: "啮齿目核糖酸酶5基因(RNase5)的分子进化", 《兽类学报》 * |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109852600A (zh) * | 2018-12-25 | 2019-06-07 | 天津大学 | 一种小萼苔倍半萜合成酶MTb及其基因序列 |
CN109852600B (zh) * | 2018-12-25 | 2021-12-31 | 天津大学 | 一种小萼苔倍半萜合成酶MTb及其基因序列 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Qi et al. | Molecular data and ecological niche modelling reveal a highly dynamic evolutionary history of the East Asian Tertiary relict Cercidiphyllum (Cercidiphyllaceae) | |
Smith et al. | Combining historical biogeography with niche modeling in the Caprifolium clade of Lonicera (Caprifoliaceae, Dipsacales) | |
Yao et al. | Diversity distribution and population structure of tea germplasms in China revealed by EST-SSR markers | |
Sun et al. | Multi-environment mapping and meta-analysis of 100-seed weight in soybean | |
Yang et al. | The monophyly of Chimonocalamus and conflicting gene trees in Arundinarieae (Poaceae: Bambusoideae) inferred from four plastid and two nuclear markers | |
Du et al. | Multilocus analysis of nucleotide variation and speciation in three closely related P opulus (S alicaceae) species | |
Xu et al. | Phylogeny and biogeography of the eastern Asian–North American disjunct wild-rice genus (Zizania L., Poaceae) | |
Li et al. | Molecular phylogeny, divergence time estimates and historical biogeography within one of the world's largest monocot genera | |
Wu et al. | Assessing differences in the response of forest aboveground biomass and composition under climate change in subtropical forest transition zone | |
Miao et al. | Chromosome-scale assembly and analysis of biomass crop Miscanthus lutarioriparius genome | |
Hou et al. | RAD-seq data point to a northern origin of the arctic–alpine genus Cassiope (Ericaceae) | |
Ma et al. | Negative correlation between rates of molecular evolution and flowering cycles in temperate woody bamboos revealed by plastid phylogenomics | |
Yan et al. | Phytogeographic history of the tea family inferred through high-resolution phylogeny and fossils | |
Hohmann et al. | An Arabidopsis introgression zone studied at high spatio-temporal resolution: interglacial and multiple genetic contact exemplified using whole nuclear and plastid genomes | |
Qiao et al. | Comparison of the cytoplastic genomes by resequencing: insights into the genetic diversity and the phylogeny of the agriculturally important genus Brassica | |
Cheng et al. | The influence of geological movements on the population differentiation of Biston panterinaria (Lepidoptera: Geometridae) | |
Gong et al. | Population structure of Nouelia insignis (Asteraceae), an endangered species in southwestern China, based on chloroplast DNA sequences: recent demographic shrinking | |
CN108959849A (zh) | 一种基于计算生物学筛选提高沉香倍半萜合酶活性的关键氨基酸位点的方法 | |
Xiong et al. | A large‐scale whole‐exome sequencing mutant resource for functional genomics in wheat | |
Fan et al. | Phylogenetic reconstruction and diversification of the Triticeae (Poaceae) based on single-copy nuclear Acc1 and Pgk1 gene data | |
Peng et al. | Hybrid genome assembly and gene repertoire of the root endophyte Clitopilus hobsonii QYL-10 (Entolomataceae, Agaricales, Basidiomycetes) | |
Wang et al. | Chromosome-level genome assembly and population genomics of Robinia pseudoacacia reveal the genetic basis for its wide cultivation | |
Li et al. | The distribution and origins of Pyrus hopeiensis-“Wild Plant With Tiny Population” using whole genome resequencing | |
Jifar et al. | Genetic diversity and population structure of tef [Eragrostis tef (Zucc.) Trotter] as Revealed by SSR Markers | |
Zhao et al. | Population genomics unravels the Holocene history of Triticum-Aegilops species |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20181207 |