工程化的葡糖基转移酶
本申请要求美国临时申请号62/557,834(2017年9月13日提交)的权益,所述临时申请通过引用以其全文并入本文。
技术领域
本公开属于酶催化领域。例如,本公开涉及具有经修饰的氨基酸序列的葡糖基转移酶。此类经修饰的酶合成具有增加的分子量的产物。
以电子方式提交的序列表的引用
所述序列表的官方副本经由EFS-Web作为ASCII格式的序列表以电子方式提交,文件名为20180911_CL6159WOPCT_SequenceListing_ST25,创建于2018年9月11日,且具有约315千字节的大小,并与本说明书同时提交。包含在所述ASCII格式的文件中的序列表是本说明书的一部分并且以其全文通过引用并入本文。
背景技术
受到在多种应用中使用多糖的期望所驱动,研究人员已经探索了可生物降解的、并且可以从可再生来源的原料节约地制造的多糖。一种这样的多糖是α-1,3-葡聚糖,这种多糖是特征在于具有α-1,3-糖苷键的不溶性葡聚糖聚合物。例如,已经使用从唾液链球菌(Streptococcus salivarius)分离的葡糖基转移酶制备了这种聚合物(Simpson等人,Microbiology[微生物学]141:1451-1460,1995)。还例如,美国专利号7000000公开了从酶促生产的α-1,3-葡聚糖制备纺成纤维。还研究了用于开发新应用或增强的应用的多种其他葡聚糖材料。例如,美国专利申请公开号2015/0232819公开了具有混合的α-1,3键和α-1,6键的若干种不溶性葡聚糖的酶促合成。
虽然已经在使用葡糖基转移酶生产葡聚糖聚合物方面取得了这些进展和其他进展,但似乎很少关注增强由此类酶合成的不溶性葡聚糖产物的分子量。为解决这一技术差距,本文公开了具有经修饰的氨基酸序列的葡糖基转移酶,该葡糖基转移酶产生更高分子量不溶性葡聚糖产物。
发明内容
在一个实施例中,本公开涉及在与SEQ ID NO:62的氨基酸残基Asn-531、Arg-534、Thr-563、Glu-567、Val-586、Gln-588、Ile-591、Lys-593、Ile-608、Ala-610、Leu-661、Arg-722、Thr-728、Met-732、Arg-741、Asn-743、Ala-777、Tyr-848或Ile-1453相对应的位置处包含至少一个氨基酸取代的非天然葡糖基转移酶,其中所述非天然葡糖基转移酶合成包含1,3-键的不溶性α-葡聚糖,并且所述不溶性α-葡聚糖的分子量高于由第二葡糖基转移酶合成的不溶性α-葡聚糖的分子量,所述第二葡糖基转移酶仅在一个或多个取代位置处不同于非天然葡糖基转移酶。
在另一个实施例中,本公开涉及包含编码如目前公开的非天然葡糖基转移酶的核苷酸序列的多核苷酸,任选地其中一个或多个调节序列可操作地连接到所述核苷酸序列,并且优选地其中所述一个或多个调节序列包含启动子序列。
在另一个实施例中,本公开涉及反应组合物,所述反应组合物包含水、蔗糖和如目前公开的非天然葡糖基转移酶。
在另一个实施例中,本公开涉及产生不溶性α-葡聚糖的方法,所述方法包括:(a)使至少水、蔗糖和如目前公开的非天然葡糖基转移酶接触,从而产生不溶性α-葡聚糖;和(b)任选地,分离在步骤(a)中产生的不溶性α-葡聚糖。
在另一个实施例中,本公开涉及制备编码非天然葡糖基转移酶的多核苷酸序列的方法,所述方法包括:(a)鉴定编码亲本葡糖基转移酶的多核苷酸序列,所述亲本葡糖基转移酶(i)包含与SEQ ID NO:4或SEQ ID NO:4的位置55-960具有至少约40%同一性的氨基酸序列,并且(ii)合成包含1,3-键的不溶性α-葡聚糖;和(b)修饰在步骤(a)中鉴定的多核苷酸序列以在与SEQ ID NO:62的氨基酸残基Asn-531、Arg-534、Thr-563、Glu-567、Val-586、Gln-588、Ile-591、Lys-593、Ile-608、Ala-610、Leu-661、Arg-722、Thr-728、Met-732、Arg-741、Asn-743、Ala-777、Tyr-848、或Ile-1453相对应的位置处取代亲本葡糖基转移酶的至少一个氨基酸,从而提供编码非天然葡糖基转移酶的多核苷酸序列,所述非天然葡糖基转移酶合成具有分子量高于由亲本葡糖基转移酶合成的不溶性α-葡聚糖的分子量的不溶性α-葡聚糖。
序列简述
表1.核酸和蛋白质SEQ ID号的汇总
b
a将该DNA编码序列进行密码子优化用于在大肠杆菌(E.coli)中表达,并且仅公开为合适编码序列的实例。
b SEQ ID NO:21-24、31、32、35-58和66有意不包括在本表中,并且仅作为占位符。
具体实施方式
所有引用的专利和非专利文献的公开内容通过引用以其全文并入本文。
除非另外公开,否则如本文所使用的术语“一个/一种”旨在涵盖一个/一种或多个/多种(即至少一个/一种)所引用的特征。
如果存在,所有范围是包含性的和可组合的,除非另有说明。例如,当列举“1至5”的范围时,所列举的范围应解释为包括“1至4”、“1至3”、“1-2”、“1-2和4-5”、“1-3和5”等范围。
术语“α-葡聚糖”、“α-葡聚糖聚合物”等在本文中可互换地使用。α-葡聚糖是包含通过α-糖苷键连接在一起的葡萄糖单体单元的聚合物。在典型的实施例中,本文中的α-葡聚糖包含至少约80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、或100%的α-糖苷键。本文中的α-葡聚糖聚合物的实例包括α-1,3-葡聚糖。
术语“聚α-1,3-葡聚糖”、“α-1,3-葡聚糖”、“α-1,3-葡聚糖聚合物”等在本文中可互换地使用。α-1,3-葡聚糖是包含通过糖苷键连接在一起的葡萄糖单体单元的聚合物,典型地其中至少约50%的糖苷键是α-1,3糖苷键。在某些实施例中,α-1,3-葡聚糖包含至少90%或95%的α-1,3糖苷键。本文中α-1,3-葡聚糖中的大部分键或全部其他键典型地是α-1,6,尽管一些键还可以是α-1,2和/或α-1,4。
术语“糖苷键(glycosidic linkage和glycosidic bond)”、“键(linkage)”等在本文中可互换地使用,并且是指将碳水化合物(糖)分子连接到另一基团(例如另一种碳水化合物)的共价键。如在本文中所用的术语“α-1,3-糖苷键”是指通过相邻的α-D-葡萄糖环上的碳1和3将α-D-葡萄糖分子彼此连接的共价键的类型。如本文所使用的术语“α-1,6-糖苷键”是指通过相邻α-D-葡萄糖环上的碳1和6将α-D-葡萄糖分子彼此连接的共价键。本文中的葡聚糖聚合物的糖苷键(glycosidic linkage)也可以称为“糖苷键(glucosidiclinkage)”。本文中,“α-D-葡萄糖”将被称为“葡萄糖”。
本文中α-葡聚糖的糖苷键谱图可以使用本领域已知的任何方法确定。例如,可以使用采用核磁共振(NMR)波谱法(例如,13C NMR或1H NMR)的方法确定键谱图。可以使用的这些和其他方法公开于例如,Food Carbohydrates:Chemistry,Physical Properties,and Applications[食品碳水化合物:化学、物理特性和应用](S.W.Cui编辑,第3章,S.W.Cui,Structural Analysis of Polysaccharides[多糖的结构分析],美国佛罗里达州波卡拉顿泰勒弗朗西斯集团有限公司(Taylor&Francis Group LLC,Boca Raton,FL),2005),将所述文献通过引用并入本文。
本文中大α-葡聚糖聚合物的“分子量”可以表示为重均分子量(Mw)或数均分子量(Mn),其单位为道尔顿或克/摩尔。可替代地,大α-葡聚糖聚合物的分子量可以被表示为DPw(重均聚合度)或DPn(数均聚合度)。较小α-葡聚糖聚合物(如寡糖)的分子量可以典型地以“DP”(聚合度)提供,所述分子量仅指α-葡聚糖内包含的葡萄糖的数量。用于计算这些不同分子量测量值的各种手段在本领域中是已知的,例如采用高压液相色谱法(HPLC)、尺寸排阻色谱法(SEC)或凝胶渗透色谱法(GPC)。
本文中,术语“蔗糖”是指由α-1,2-糖苷键连接的α-D-葡萄糖分子和β-D-果糖分子构成的非还原性二糖。通常,蔗糖被称为食用糖。
术语“明串珠菌二糖”和“D-吡喃葡糖基-α(1-5)-D-吡喃果糖”在本文中可互换地使用,并且是指含有α-1,5-葡糖基-果糖键的二糖。
术语“葡糖基转移酶(glucosyltransferase)”、“葡糖基转移酶(glucosyltransferase enzyme)”、“GTF”、“葡聚糖蔗糖酶”等在本文中可互换地使用。本文中的葡糖基转移酶的活性催化底物蔗糖的反应以制成产物α-葡聚糖和果糖。GTF反应的其他产物(副产物)可以包括葡萄糖、各种可溶性葡萄糖-寡糖、和明串珠菌二糖。葡糖基转移酶的野生型形式通常含有(在N-末端至C-末端方向上)信号肽(典型地被裂解过程除去)、可变结构域、催化结构域和葡聚糖-结合结构域。根据CAZy(碳水化合物活性酶)数据库(Cantarel等人,Nucleic Acids Res.[核酸研究]37:D233-238,2009),将本文中的葡糖基转移酶分类在糖苷水解酶家族70(GH70)下。
本文中的术语“葡糖基转移酶催化结构域”是指为葡糖基转移酶提供α-葡聚糖合成活性的葡糖基转移酶的结构域。典型地,葡糖基转移酶催化结构域不需要存在任何其他的结构域以具有此活性。
术语“酶促反应”、“葡糖基转移酶反应”、“葡聚糖合成反应”、“反应组合物”、“反应制剂”等在本文中可互换地使用,并且通常指最初包含水、蔗糖、至少一种活性葡糖基转移酶和任选的其他组分的反应。典型地在葡糖基转移酶反应开始后可以进一步存在于所述反应中的组分包括果糖、葡萄糖、明串珠菌二糖、可溶性葡萄糖-寡糖(例如,DP2-DP7)(这类糖可以被认为是基于使用的葡糖基转移酶的产物或副产物)、和/或DP8或更高(例如,DP100和更高)的一种或多种不溶性α-葡聚糖产物。应当理解的是,具有聚合度(DP)为至少8或9的某些葡聚糖产物(如α-1,3-葡聚糖)是水不溶性的,并因此不溶解于葡聚糖合成反应,而是可能存在于溶液之外(例如,由于从反应中沉淀出来)。在葡聚糖合成反应中,进行了使水、蔗糖和葡糖基转移酶接触的步骤。如本文所使用的术语“在合适的反应条件下”是指通过葡糖基转移酶活性支持将蔗糖转化为一种或多种α-葡聚糖产物的反应条件。
术语“按体积计百分比(percent by volume)”、“体积百分比(volume percent)”、“体积%(vol%)”、“体积/体积%(v/v%)”等在本文中可互换地使用。溶质在溶液中的按体积计百分比可以使用以下公式确定:[(溶质体积)/(溶液体积)]×100%。
术语“按重量计百分比(percent by weight)”、“重量百分比(weightpercentage,wt%)”、“重量-重量百分比(weight-weight percentage,%w/w)”等在本文中可互换地使用。按重量计百分比是指当材料包含在组合物、混合物、或溶液中时,所述材料在质量基础上的百分比。
术语“水性条件”、“水性反应条件”、“水性设置”、“水性体系”等在本文中可互换地使用。本文中的水性条件是指其中溶剂为例如至少约60wt%的水的溶液或混合物。本文中的葡糖基转移酶反应在水性条件下进行。
如本文所使用的术语“可溶性”、“水性可溶性”、“水可溶性”等表征具有溶解于水和/或本文的水性溶液中的能力的葡聚糖。本文中可溶性葡聚糖的实例是某些寡糖,如具有DP小于8的α-1,3-葡聚糖。相反,为“不溶性”、“水性不溶性”、“水不溶性”(等术语)的葡聚糖不溶于(或不明显溶于)水和/或本文的水性溶液中。任选地,用于确定溶解性的条件包括水/溶液温度范围为约1℃至85℃(例如,20℃-25℃)和/或pH范围为约4-9(例如6-8)。
术语“多核苷酸”、“多核苷酸序列”、“核酸分子”等在本文中可互换地使用。这些术语涵盖核苷酸序列等。多核苷酸可以是单链或双链的DNA或RNA的聚合物,其任选地含有合成的、非天然的或改变的核苷酸碱基。多核苷酸可以由cDNA、基因组DNA、合成DNA或其混合物的一个或多个区段构成。
如本文所使用的术语“基因”是指从编码区表达RNA(RNA转录自DNA多核苷酸序列)的DNA多核苷酸序列,所述RNA可以是信使RNA(编码蛋白质)或非蛋白质编码RNA。基因可以是指单独的编码区,或者可以包括编码区上游和/或下游的调节序列(例如启动子、5’-非翻译区、3’-转录终止子区)。可替代地,编码蛋白质的编码区在本文中可以被称为“可读框”(ORF)。“天然”或“内源”的基因是指自然界中发现的具有其自身调节序列的基因;这样的基因位于宿主细胞的基因组中的其天然位置。“嵌合”基因是指不是天然基因的任何基因,所述基因包括在自然界中未一起发现的调节序列和编码序列(即,调节区和编码区彼此是异源的)。因此,嵌合基因可以包含衍生自不同来源的调节序列和编码序列,或者包含衍生自同一来源但以不同于天然存在的方式排列的调节序列和编码序列。“外来”或“异源”的基因可能是指通过基因转移引入宿主生物体的基因。外来/异源基因可以包含插入非天然生物体内的天然基因、引入天然宿主内的新位置的天然基因、或嵌合基因。在某些实施例中,本文公开的多核苷酸序列是异源的。“转基因”是通过基因递送程序(例如,转化)已经引入基因组中的基因。“密码子优化的”可读框的密码子使用频率被设计为模拟宿主细胞的优选密码子使用的频率。
如本文所使用的,术语“多肽”被定义为氨基酸残基链,通常具有确定的序列。如本文所使用的,术语多肽可与术语“肽”和“蛋白质”互换。在本文的多肽中包含的典型氨基酸包括(括号中显示了相应的三字母和单字母代码):丙氨酸(Ala,A)、精氨酸(Arg,R)、天冬酰胺(Asn,N)、天冬氨酸(Asp,D)、半胱氨酸(Cys,C)、谷氨酸(Glu,E)、谷氨酰胺(Gln,Q)、甘氨酸(Gly,G)、组氨酸(His,H)、异亮氨酸(Ile,I)、亮氨酸(Leu,L)、赖氨酸(Lys,K)、甲硫氨酸(Met,M)、苯丙氨酸(Phe,F)、脯氨酸(Pro,P)、丝氨酸(Ser,S)、苏氨酸(Thr,T)、色氨酸(Trp,W)、酪氨酸(Tyr,Y)、缬氨酸(Val,V)。
术语“异源”意指不是天然地在目的位置发现的。例如,异源基因可以不是天然地在宿主生物体中发现的基因,而是通过基因转移引入所述宿主生物体中的基因。作为另一个实例,存在于嵌合基因中的核酸分子可以表征为异源的,因为这样的核酸分子不与所述嵌合基因的其他区段天然相关(例如,启动子对于编码序列可以是异源的)。
本文中包含在细胞或生物体中的“非天然”氨基酸序列或多核苷酸序列不会出现在这样的细胞或生物体的天然的(自然的)对应物中。这样的氨基酸序列或多核苷酸序列也可以被称为是与细胞或生物体异源的。
如本文所使用的“调节序列”是指位于基因转录起始位点(例如启动子)上游的核苷酸序列、5’非翻译区、内含子和3’非编码区,并且所述调节序列可以影响转录、加工或稳定性、和/或从所述基因转录的RNA的翻译。本文中,调节序列可以包括启动子、增强子、沉默子、5′非翻译前导序列、内含子、聚腺苷酸化识别序列、RNA加工位点、效应子结合位点、茎环结构以及涉及基因表达调节的其他元件。本文中的一个或多个调节元件可以与本文中的编码区异源。
如本文所使用的“启动子”是指能够控制从基因转录RNA的DNA序列。通常,启动子序列位于基因的转录起始位点的上游。启动子可以全部衍生自天然基因,或者由衍生自在自然界发现的不同启动子的不同元件构成,或者甚至包含合成的DNA区段。在所有情况下在多数时候引起基因在细胞中表达的启动子通常称为“组成型启动子”。可替代地,启动子可以是诱导型的。本文中的一个或多个启动子可以与本文中的编码区异源。
如本文所使用的“强启动子”是指可以指导每单位时间相对大量的生产性启动的启动子,和/或是驱动比在细胞中基因的平均转录水平更高的基因转录水平的启动子。
如本文所使用的术语“3’非编码序列”、“转录终止子”、“终止子”等是指位于编码序列下游的DNA序列。这包括多腺苷酸化识别序列和编码能够影响mRNA加工或基因表达的调节信号的其他序列。
如本文所使用的,当在合适的退火条件下(例如,温度、溶液离子强度)单链形式的第一核酸序列可以退火为第二核酸序列时,第一核酸序列可与第二核酸序列“杂交”。杂交和洗涤条件是熟知的并且在Sambrook J,Fritsch EF和Maniatis T,Molecular Cloning:A Laboratory Manual[分子克隆:实验手册],第2版,冷泉港实验室(Cold Spring HarborLaboratory):冷泉港,纽约州(1989),特别是第11章和表11.1中进行示例,将该文献通过引用并入本文。
术语“DNA操作技术”是指其中将DNA多核苷酸序列的序列进行修饰的任何技术。尽管可以将经修饰的DNA多核苷酸序列用作用于修饰的底物本身,但是对于某些技术,无需有形存在(例如,可以将存储在计算机中的序列用作操作技术的基础)。可以将DNA操作技术用于在更长的序列中使一个或多个DNA序列缺失和/或突变。DNA操作技术的实例包括重组DNA技术(限制和连接,分子克隆),聚合酶链式反应(PCR)和合成DNA的方法(例如寡核苷酸合成和连接)。关于合成DNA技术,DNA操作技术可能需要经由计算机模拟观察DNA多核苷酸,确定DNA多核苷酸的所希望的修饰(例如一个或多个缺失),并合成含有所希望的修饰的DNA多核苷酸。
本文术语“经由计算机模拟”意指在诸如计算机的信息存储和/或处理设备中或其上;使用计算机软件或模拟来完成或产生,即虚拟现实。
如本文关于多核苷酸所使用的术语“上游”和“下游”分别是指“5’的”和“3’的”。
如本文中所使用的术语“表达”是指(i)由编码区转录RNA(例如,mRNA或非蛋白质编码RNA),或(ii)由mRNA翻译多肽。在某些实施例中,可以对多核苷酸序列的编码区域的表达进行上调或下调。
如本文所使用的术语“可操作地连接”是指两种或更多种核酸序列的缔合,这样使得其中一种核酸序列的功能受到另一种核酸序列的影响。例如,当启动子能够影响编码序列的表达时,所述启动子与所述编码序列可操作地连接。即,编码序列处于启动子的转录控制下。例如,编码序列可以可操作地连接到一种(例如,启动子)或多种(例如,启动子和终止子)调节序列。
当本文中用于表征DNA序列例如质粒、载体或构建体时,术语“重组”是指例如通过化学合成和/或通过用基因工程技术操纵分离的核酸区段来将两个原本分离的序列区段进行人工组合。
如本文所使用的术语“转化”是指通过任何方法将核酸分子转移到宿主生物体或宿主细胞中。已经转化到生物体/细胞中的核酸分子可以是在生物体/细胞中自主复制、或整合到生物体/细胞的基因组中、或瞬时存在于细胞中而不进行复制或整合的核酸分子。在本文中公开了适合于转化的核酸分子的非限制性实例,例如质粒和线性DNA分子。本文中含有转化核酸序列的宿主生物体/细胞可以被称为例如“转基因的”、“重组的”、“转化的”、“工程化的”、被称为“转化体”、和/或被称为“经修饰以用于外源基因表达”。
如本文所使用的,关于多核苷酸或多肽序列的术语“序列同一性”、“同一性”等是指在两个序列中的核酸残基或氨基酸残基当在指定的比较窗口上比对最大对应度时是相同的。因此,“序列同一性百分比”、“百分比同一性”等是指通过在比较窗口上比较两个最佳比对的序列所确定的值,其中与参比序列(其不包含添加或缺失)比较两个序列的最佳比对时,所述多核苷酸或多肽序列在比较窗口中的部分可以包含添加或缺失(即空位)。通过以下方式计算所述百分比:确定在两个序列中出现相同核酸碱基或氨基酸残基的位置的数目以产生匹配位置的数目,将匹配位置的数目除以比较窗口中的位置的总数目,然后将所述结果乘以100以产生序列同一性的百分比。应当理解的是,当计算DNA序列和RNA序列之间的序列同一性时,DNA序列的T残基与RNA序列的U残基比对,并且可以被认为与其“同一”。出于确定第一和第二多核苷酸的“百分比互补性”的目的,可以通过确定(i)第一多核苷酸和第二多核苷酸的补体序列之间的百分比同一性(或反之亦然),例如和/或(ii)将产生规范的沃森和克里克碱基对的第一和第二多核苷酸之间的碱基百分比来获得。
可通过任何已知方法容易地确定百分比同一性,所述方法包括但不限于以下文献中所述的那些:1)Computational Molecular Biology[计算分子生物学](Lesk,A.M.编辑),牛津大学出版社(Oxford University):纽约州(1988);2)Biocomputing:Informatics and Genome Projects[生物计算:信息学和基因组工程](Smith,D.W.编辑),学术出版社(Academic):纽约州(1993);3)Computer Analysis of Sequence Data,Part I[序列数据的计算机分析,第一部分](Griffin,A.M.,和Griffin,H.G.编辑),胡玛纳出版社(Humana),新泽西州(1994);4)Sequence Analysis in Molecular Biology[分子生物学中的序列分 析](von Heinje,G.编辑),学术出版社(Academic)(1987);和5)Sequence Analysis Primer[引物序列分析](Gribskov,M.和Devereux,J.编辑),斯托克顿出版社(Stockton):纽约州(1991),将其全部通过引用并入本文。
用于确定百分比同一性的优选方法被设计为在测试序列之间给出最佳匹配。例如,确定同一性和相似性的方法被编入公共可用的计算机程序中。例如,序列比对和百分比同一性计算可以使用LASERGENE生物信息学计算套件(DNASTAR公司,麦迪逊(Madison),威斯康星州)的MEGALIGN程序进行。例如,可以使用Clustal比对方法进行序列的多重比对,所述Clustal比对方法涵盖几种算法,包括Clustal V比对方法(描述于以下文献中:Higgins和Sharp,CABIOS.[计算机在生物学中的应用]5:151-153(1989);Higgins,D.G.等人,Comput.Appl.Biosci.[计算机应用生物科学],8:189-191(1992)),并在LASERGENE生物信息学计算套件的MEGALIGN v8.0程序(DNASTAR公司)中找到。对于多重比对,默认值可能对应于空位罚分(GAP PENALTY)=10和空位长度罚分(GAP LENGTH PENALTY)=10。使用Clustal方法进行逐对比对和蛋白质序列的百分比同一性计算的默认参数可以为KTUPLE=1、空位罚分=3、窗口(WINDOW)=5、以及存储的对角线(DIAGONALS SAVED)=5。对于核酸,这些参数可以是KTUPLE=2、空位罚分=5、窗口=4、以及存储的对角线=4。此外,可以使用Clustal W比对方法(描述于以下文献中:Higgins和Sharp,CABIOS.[计算机在生物学中的应用]5:151-153(1989);Higgins,D.G.等人,Comput.Appl.Biosci.[计算机应用生物科学],8:189-191(1992);Thompson,J.D.等人,Nucleic Acids Research[核酸研究],22(22):4673-4680,1994),并在LASERGENE生物信息学计算套件的MEGALIGN v8.0程序(DNASTAR公司)中找到。用于多重比对(蛋白质/核酸)的默认参数可以是:空位罚分=10/15、空位长度罚分=0.2/6.66、延迟发散序列(Delay Divergent Seqs)(%)=30/30、DNA转换权重=0.5、蛋白质权重矩阵=Gonnet系列、DNA权重矩阵=IUB。
作为某些实施例的特征,本文公开了各种多肽氨基酸序列和多核苷酸序列。可以使用或引用与本文公开的序列具有至少约70%-85%、85%-90%、或90%-95%同一性的这些序列的变体。可替代地,变体氨基酸序列或多核苷酸序列可以与本文公开的序列具有至少70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的同一性。变体氨基酸序列或多核苷酸序列具有所公开的序列的相同功能/活性,或具有所公开的序列的功能/活性的至少约80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的功能/活性。典型地,本文公开的不以甲硫氨酸开始的任何多肽氨基酸序列可以在氨基酸序列的N-末端进一步包含至少一个起始甲硫氨酸。相反,本文公开的以甲硫氨酸开始的任何多肽氨基酸序列可以任选地缺少这种甲硫氨酸残基。
术语“与......比对”、“对应于”等在本文中可互换地使用。本文的一些实施例涉及在与SEQ ID NO:62的至少一个特定氨基酸残基相对应的位置处包含至少一个氨基酸取代的葡糖基转移酶。葡糖基转移酶的氨基酸位置或其子序列(例如,催化结构域或催化结构域加葡聚糖-结合结构域)(可以将这样的氨基酸位置或序列称为“查询”位置或序列)可以被表征为与SEQ ID NO:62的特定氨基酸残基(可以将这样的氨基酸位置或序列称为“主题”位置或序列)相对应,如果(1)可以将所述查询序列与所述主题序列比对(例如,其中比对表明所述查询序列和所述主题序列[或主题序列的子序列]具有至少约30%、40%、50%、60%、70%、80%或90%同一性),并且(2)如果直接将所述查询氨基酸位置与在(1)的比对下的主题氨基酸位置进行比对(直接排列对比)。通常,可以使用本文公开所述的任何比对算法、工具和/或软件(例如,BLASTP、ClustalW、ClustalV、Clustal-Omega、EMBOSS)将查询氨基酸序列与主题序列(SEQ ID NO:62或SEQ ID NO:62的子序列)进行比对以确定百分比同一性。仅用于另外的实例,可以使用Needleman-Wunsch算法(Needleman和Wunsch,J.Mol.Biol.[分子生物学杂志]48:443-453,1970)将查询序列与本文中的主题序列进行比对,如在欧洲分子生物学开放软件包(European Molecular Biology Open SoftwareSuite,EMBOSS[例如,版本5.0.0或更新],Rice等人,Trends Genet.[遗传学趋势]16:276-277,2000)的Needle程序中所执行的。这样的EMBOSS比对的参数可以包括例如:空位开放罚分为10、空位延伸罚分为0.5、EBLOSUM62(BLOSUM62的EMBOSS版本)取代矩阵。
本文的SEQ ID NO:62的特定氨基酸残基(例如,Asn-531、Arg-534、Thr-563、Glu-567、Val-586、Gln-588、Ile-591、Lys-593、Ile-608、Ala-610、Leu-661、Arg-722、Thr-728、Met-732、Arg-741、Asn-743、Ala-777、Tyr-848、Ile-1453)的编号是相对于SEQ ID NO:62的全长氨基酸序列而言的。SEQ ID NO:62的第一个氨基酸(即,位置1,Met-1)位于信号肽的起始处。除非另有公开,否则本文的取代是相对于SEQ ID NO:62的全长氨基酸序列而言的。
本文中的“非天然葡糖基转移酶”(“突变体”、“变体”、“经修饰的”等术语同样可用于描述这样的葡糖基转移酶)在与SEQ ID NO:62的特定氨基酸残基相对应的位置处具有至少一个氨基酸取代。这样的至少一种氨基酸取代典型地代替正常地(天然地)发生在非天然葡糖基转移酶的天然对应物(亲本)中的相同位置的一个或多个氨基酸残基(即,尽管SEQID NO:62被用作位置的参考,但本文中的氨基酸取代是相对于非天然葡糖基转移酶的天然对应物)(考虑另一种方式,当将非天然葡糖基转移酶的序列与SEQ ID NO:62比对时,确定在特定位置是否存在取代本身并不取决于SEQ ID NO:62中的各自的氨基酸残基,而是取决于在非天然葡糖基转移酶的天然对应物的主题位置上存在什么氨基酸)。正常地出现在天然对应物葡糖基转移酶的相关位点的氨基酸通常(但不总是)与进行比对的SEQ ID NO:62的特定氨基酸残基相同(或与之保持一致)。相对于其天然对应物序列,非天然葡糖基转移酶任选地可以具有其他氨基酸变化(突变、缺失和/或插入)。
在本文中阐明取代/比对可能是有益的。SEQ ID NO:12(GTF0544)是表兄链球菌葡糖基转移酶的截短形式。应注意,SEQ ID NO:12的Leu-193与SEQ ID NO:62的Leu-373相对应(比对未显示)。例如,如果SEQ ID NO:12在位置193处突变以用不同的残基(例如,Gln)取代Leu残基,那么可以这样说SEQ ID NO:12的位置193突变的版本表示在与SEQ ID NO:62的Leu-373相对应的位置处具有氨基酸取代的非天然葡糖基转移酶。
术语“分离的”意指呈自然界中不存在的形式或在自然界中不存在的环境中的物质(或过程)。分离的物质的非限制性实例包括(1)任何非天然存在的物质(例如,本文的非天然葡糖基转移酶),(2)任何物质,包括但不限于,从与其天然相关联的天然存在的成分中的一种或多种中或所有中至少部分地除去的任何宿主细胞、酶、变体、核酸、蛋白质、肽、辅因子、或碳水化合物/糖类;(3)相对于自然界中发现的物质,经人手修饰的任何物质(例如,本文的非天然葡糖基转移酶);或(4)相对于与其天然相关的其他成分,通过增加物质的量进行修饰的任何物质。据信,本文公开的实施例(例如,酶和反应组合物)是合成的/人造的,和/或具有非天然存在的性质。
如本文所使用的术语“增加的”可以是指比所述增加的量或活性与之进行比较的量或活性多至少约1%、2%、3%、4%、5%、6%、7%、8%、9%、10%、11%、12%、13%、14%、15%、16%、17%、18%、19%、20%、50%、100%或200%的量或活性。术语“增加的”、“提高的”、“增强的”、“大于”、“改进的”等在本文中可互换地使用。例如,可以将这些术语用于表征编码蛋白质的多核苷酸的“过表达”或“上调”。
虽然已经在使用葡糖基转移酶生产不溶性葡聚糖聚合物方面取得了进展,但似乎很少关注增强由此类酶合成的不溶性葡聚糖产物的分子量。为解决这一技术差距,本文公开了具有经修饰的氨基酸序列的葡糖基转移酶,该葡糖基转移酶产生更高分子量不溶性葡聚糖产物。
本公开的某些实施例涉及在与SEQ ID NO:62的一个或多个氨基酸残基Asn-531、Arg-534、Thr-563、Glu-567、Val-586、Gln-588、Ile-591、Lys-593、Ile-608、Ala-610、Leu-661、Arg-722、Thr-728、Met-732、Arg-741、Asn-743、Ala-777、Tyr-848、或Ile-1453相对应的位置处包含至少一个氨基酸取代的非天然葡糖基转移酶,其中所述非天然葡糖基转移酶合成包含1,3-键的不溶性α-葡聚糖,并且该α-葡聚糖的分子量高于由第二葡糖基转移酶合成的不溶性α-葡聚糖的分子量,所述第二葡糖基转移酶仅在一个或多个取代位置处不同于非天然葡糖基转移酶。因此,通常,本文公开了突变体葡糖基转移酶,这些酶可以合成具有α-1,3键的更高分子量不溶性α-葡聚糖。
本文的非天然葡糖基转移酶合成包含1,3-键的不溶性α-葡聚糖。在一些方面,这种α-葡聚糖的至少约30%、31%、32%、33%、34%、35%、36%、37%、38%、39%、40%、41%、42%、43%、44%、45%、46%、47%、48%、49%、50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、69%、70%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%或100%的糖苷键可以是α-1,3键。α-葡聚糖的键谱图可以任选地被表征为具有这些值中的任何两个之间的范围。在具有30%-99%α-1,3键的这些方面中的任一个中,其他键可以是例如α-1,6和/或不包括任何α-1,4或α-1,2键。
在一些方面中,α-葡聚糖可以具有例如小于10%、9%、8%、7%、6%、5%、4%、3%、2%、1%或0.5%的α-1,2或α-1,4糖苷键。在另一个实施例中,α-葡聚糖仅具有α-1,3键和任选地α-1,6键(即,不具有α-1,2键或α-1,4键)。
在一些方面中,α-葡聚糖可以是线性/非支化的(不具有分支点)。可替代地,本文的α-葡聚糖中可以存在分支。例如,作为聚合物中这些键的百分比,α-葡聚糖可以具有小于约10%、9%、8%、7%、6%、5%、4%、3%、2%或1%的分支点。
在某些方面,α-葡聚糖可以具有以DPw或DPn表示的至少约100的分子量。例如,DPw或DPn可以是约、或至少约100、150、200、250、300、350、400、450、500、550、600、650、700、750、800、850、900、950、1000、1100或1200。α-葡聚糖的分子量可以任选地表示为这些值中的任两个之间的范围(例如,100-1200、400-1200、700-1200、100-1000、400-1000、700-1000)。例如,本文的分子量可以根据任何合适的方法进行测量,所述方法包括本实例(下文)中公开的或如在美国专利申请公开号2017/0002335、2015/0064748或2015/0232819中公开的那些方法。
在某些方面,由非天然葡糖基转移酶产生的α-1,3-葡聚糖的多分散性指数(PDI,其等于DPw/DPn)可以与由第二葡糖基转移酶(例如,亲本葡糖基转移酶)产生的α-1,3-葡聚糖的PDI相同或相似,所述第二葡糖基转移酶仅在一个或多个取代位置处不同于非天然葡糖基转移酶。所述PDI可以是例如在约或低于约2.5、2.4、2.3、2.2、2.1或2.0,或者在约2.0-2.5、2.0-2.4、2.0-2.3、2.0-2.2、2.1-2.5、2.1-2.4、2.1-2.3或2.1-2.2的范围内。可以任选地表征提供本文的非天然葡糖基转移酶的氨基酸取代,以允许酶法合成具有保守PDI但具有增加的分子量的α-1,3-葡聚糖。
由本文的非天然葡糖基转移酶产生的α-葡聚糖是水不溶性。在中性(例如,pH 6-8)水性条件下,在DPw为8或9及以上时,α-1,3-葡聚糖通常是不溶性的。
例如,可以将本文中的前述键谱图和/或分子量谱图中的任一种进行合并以适当地表征本公开的非天然葡糖基转移酶的α-葡聚糖产物。在一些方面,α-葡聚糖产物的键和/或分子量谱图可以按以下出版物中的任一者公开,将这些出版物全部通过引用并入本文:美国专利号7000000和8871474,美国专利申请公开号2015/0232819。
非天然葡糖基转移酶例如可以包含在以下出版物中公开的能够产生如目前公开的不溶性α-葡聚糖的任何葡糖基转移酶的氨基酸序列,但除了所述非天然葡糖基转移酶在与SEQ ID NO:62的氨基酸残基Asn-531、Arg-534、Thr-563、Glu-567、Val-586、Gln-588、Ile-591、Lys-593、Ile-608、Ala-610、Leu-661、Arg-722、Thr-728、Met-732、Arg-741、Asn-743、Ala-777、Tyr-848或Ile-1453相对应的位置处具有至少一个氨基酸取代:美国专利号7000000和8871474;以及美国专利申请公开号2015/0232819和2017/0002335中,将其全部通过引用并入本文。在一些方面,这样的非天然葡糖基转移酶(i)具有前述取代中的至少一个,并且(ii)包含与不具有所述至少一个取代的各自对应物/亲本葡糖基转移酶的氨基酸序列具有至少约90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或99.5%同一性的氨基酸序列。
在一些方面,非天然葡糖基转移酶(i)在与SEQ ID NO:62的氨基酸残基Asn-531、Arg-534、Thr-563、Glu-567、Val-586、Gln-588、Ile-591、Lys-593、Ile-608、Ala-610、Leu-661、Arg-722、Thr-728、Met-732、Arg-741、Asn-743、Ala-777、Tyr-848或Ile-1453相对应的位置处包含至少一个氨基酸取代,并且(ii)包含与SEQ ID NO:2、4、6、8、10、12、14、16、18、20、26、28、30、34或59具有至少约90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或99.5%同一性的氨基酸序列,或由其组成。在表2中提供了关于具有这些氨基酸序列中大多数的葡糖基转移酶的不溶性α-葡聚糖产物的某些信息。
表2.GTF酶和相关的α-葡聚糖产物
a
a如下进行GTF反应和产物分析。制备包含蔗糖(50g/L)、磷酸钾缓冲液(pH 6.5,20mM)和GTF酶(按体积计2.5%细菌细胞提取物;按与美国专利号8871474中公开的程序类似的方式,根据美国申请公开号2017/0002335制备的提取物)的反应。在22℃-25℃ 24-30小时后,通过离心收获不溶性产物,用水洗涤三次,用乙醇洗涤一次,并在50℃干燥24-30小时。示出了每种不溶性产物的大致的键和DPn。分别通过13C NMR和SEC确定键和DPn。
在一些方面,非天然葡糖基转移酶(i)在与SEQ ID NO:62的氨基酸残基Asn-531、Arg-534、Thr-563、Glu-567、Val-586、Gln-588、Ile-591、Lys-593、Ile-608、Ala-610、Leu-661、Arg-722、Thr-728、Met-732、Arg-741、Asn-743、Ala-777、Tyr-848或Ile-1453相对应的位置处包含至少一个氨基酸取代,并且(ii)包含与SEQ ID NO:4的氨基酸残基55-960、SEQID NO:65的残基54-957、SEQ ID NO:30的残基55-960、SEQ ID NO:28的残基55-960、或SEQID NO:20的残基55-960具有至少约90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或99.5%同一性的葡糖基转移酶催化结构域,或由其组成。例如,据信这种非天然葡糖基转移酶能够产生水不溶性的α-葡聚糖,并且包含至少约50%(例如,≥90%或≥95%)的α-1,3键,并且任选地进一步具有至少100的DPw。例如,应注意具有SEQ ID NO:65的氨基酸位置54-957的葡糖基转移酶可以产生具有100%α-1,3键和DPw为至少400的α-1,3-葡聚糖(数据未显示,参考美国专利申请公开号2017/0002335的表6,将这些申请通过引用并入本文)。进一步注意到SEQ ID NO:65(GTF 7527)、30(GTF 2678)、4(GTF 6855)、28(GTF 2919)和20(GTF 2765)各自表示一种葡糖基转移酶,所述葡糖基转移酶与其各自的野生型对应物相比缺少信号肽结构域以及全部或大部分的可变结构域。因此,这些葡糖基转移酶中的每一个具有催化结构域,之后是葡聚糖结合结构域。催化结构域序列在这些酶中的大致位置如下:7527(SEQ ID NO:65的残基54-957)、2678(SEQ ID NO:30的残基55-960)、6855(SEQID NO:4的残基55-960)、2919(SEQ ID NO:28的残基55-960)、2765(SEQ ID NO:20的残基55-960)。GTF 2678、6855、2919和2765的催化结构域(大致)的氨基酸序列分别与GTF 7527的大致催化结构域序列(即,SEQ ID NO:65的氨基酸54-957)具有约94.9%、99.0%、95.5%和96.4%的同一性。这些具体的葡糖基转移酶(GTF 2678、6855、2919和2765)中的每一个可以产生具有100%α-1,3键和DPw为至少400的α-1,3-葡聚糖(数据未显示,参考美国专利申请公开号2017/0002335的表4)。基于前述催化结构域的活性和关联性(高百分比同一性),预期具有前述催化结构域之一的本文的非天然葡糖基转移酶可以产生包含至少约50%(例如,≥90%或≥95%)α-1,3键和DPw为至少100的不溶性α-葡聚糖,这些催化结构域进一步具有如目前公开的至少一个氨基酸取代。
在一些方面,非天然葡糖基转移酶(i)在与SEQ ID NO:62的氨基酸残基Asn-531、Arg-534、Thr-563、Glu-567、Val-586、Gln-588、Ile-591、Lys-593、Ile-608、Ala-610、Leu-661、Arg-722、Thr-728、Met-732、Arg-741、Asn-743、Ala-777、Tyr-848或Ile-1453相对应的位置处包含至少一个氨基酸取代,并且(ii)包含与SEQ ID NO:62或其子序列如SEQ ID NO:4(无其起始甲硫氨酸)或SEQ ID NO:4的位置55-960(大致催化结构域)具有至少约40%、41%、42%、43%、44%、45%、46%、47%、48%、49%、50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、69%、70%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或99.5%同一性的氨基酸序列,或由其组成。
尽管据信在某些方面非天然葡糖基转移酶仅需要具有催化结构域,但所述非天然葡糖基转移酶可以包含在更大的氨基酸序列内。例如,可以将催化结构域在其C-末端连接至葡聚糖结合结构域,和/或在其N-末端连接至可变结构域和/或信号肽。
尽管本文通常公开了非天然葡糖基转移酶中的关于SEQ ID NO:62中相应位置的氨基酸取代,但是这样的取代可以可替代地关于非天然葡糖基转移酶本身的序列中的位置编号而简单地陈述,按方便可以这样规定。
非天然葡糖基转移酶的仍进一步的实例可以是如本文公开的任何酶并且包括在N-末端和/或C-末端的1-300(或之间的任何整数[例如,10、15、20、25、30、35、40、45、或50])个残基。例如,这样的另外的残基可以来自衍生出葡糖基转移酶的相应的野生型序列,或可以是异源序列例如像表位标签(在N-或C-末端)或异源信号肽(在N-末端)。本文中非天然葡糖基转移酶典型地缺少N-末端信号肽;如果在分泌过程中去除其信号肽,则这种酶可任选地被表征为是成熟的。
本文的非天然葡糖基转移酶可以衍生自任何微生物来源,例如像细菌。细菌葡糖基转移酶的实例是衍生自链球菌属物种、明串珠菌属(Leuconostoc)物种或乳杆菌属(Lactobacillus)物种的那些。链球菌属物种的实例包括唾液链球菌、表兄链球菌、牙链球菌、汗毛链球菌、变异链球菌、口腔链球菌、解没食子酸链球菌(S.gallolyticus)和血链球菌。明串珠菌属物种的实例包括肠膜明串珠菌(L.mesenteroides)、阿米巴氏明串珠菌(L.amelibiosum)、阿根廷明串珠菌(L.argentinum)、肉明串珠菌(L.carnosum)、柠檬明串珠菌(L.citreum)、乳脂明串珠菌(L.cremoris)、葡聚糖明串珠菌(L.dextranicum)和果糖明串珠菌(L.fructosum)。乳杆菌属物种的实例包括嗜酸乳杆菌(L.acidophilus)、德氏乳杆菌(L.delbrueckii)、瑞士乳杆菌(L.helveticus)、唾液乳杆菌(L.salivarius)、干酪乳杆菌(L.casei)、弯曲乳杆菌(L.curvatus)、植物乳杆菌(L.plantarum)、清酒乳杆菌(L.sakei)、短乳杆菌(L.brews)、布赫内氏乳杆菌(L.buchneri)、发酵乳杆菌(L.fermentum)和罗伊氏乳杆菌(L.reuteri)。
例如,本文的非天然葡糖基转移酶可以通过适当工程化的微生物菌株的发酵来制备。通过发酵进行重组酶生产是本领域熟知的,使用微生物种类如大肠杆菌、芽孢杆菌(Bacillus)菌株(例如,枯草芽孢杆菌(B.subtilis))、富养罗尔斯通氏菌(Ralstoniaeutropha)、荧光假单胞菌(Pseudomonas fluorescens)、酿酒酵母(Saccharomycescerevisiae)、巴斯德毕赤酵母(Pichia pastoris)、多形汉逊酵母(Hansenulapolymorpha)、以及曲霉属(Aspergillus)(例如,泡盛曲霉(A.awamori))和木霉属(Trichoderma)(例如,里氏木霉(T.reesei))的物种(例如,参见Adrio和Demain,Biomolecules[生物分子]4:117-139,2014,将其通过引用并入本文)。将编码非天然葡糖基转移酶氨基酸序列的核苷酸序列典型地与异源启动子序列连接以产生所述酶的表达盒,和/或因此被密码子优化。可以使用本领域熟知的方法将这样的表达盒并入到合适的质粒上或整合到微生物宿主染色体中。表达盒可以包括在氨基酸编码序列之后的转录终止子核苷酸序列。表达盒还可以在启动子序列和葡糖基转移酶氨基酸编码序列之间包括编码信号肽(例如,异源信号肽)的核苷酸序列,所述信号肽被设计用于指导葡糖基转移酶的分泌。在发酵结束时,细胞可以相应地破裂(通常当不使用用于分泌的信号肽时),并且可以使用诸如沉淀、过滤和/或浓缩等方法分离葡糖基转移酶。可替代地,可以使用包含葡糖基转移酶的裂解物或提取物而无需进一步分离。如果葡糖基转移酶被分泌(即,它存在于发酵液中),则所述葡糖基转移酶可以任选地与发酵液分离来使用或包含在发酵液中使用。葡糖基转移酶的活性可以通过生物化学测定来确认,例如测量其将蔗糖转化成葡聚糖聚合物。
本文的非天然葡糖基转移酶可以在与SEQ ID NO:62的氨基酸残基Asn-531、Arg-534、Thr-563、Glu-567、Val-586、Gln-588、Ile-591、Lys-593、Ile-608、Ala-610、Leu-661、Arg-722、Thr-728、Met-732、Arg-741、Asn-743、Ala-777、Tyr-848、或Ile-1453相对应的位置处包含至少一个氨基酸取代。在一些方面,在与SEQ ID NO:62的氨基酸残基Asn-531相对应的位置处的氨基酸可以被Gly、Leu或Met残基取代。在一些方面,在与SEQ ID NO:62的氨基酸残基Arg-534相对应的位置处的氨基酸可以被Lys、Gly、Ile、Leu或Met残基取代。在一些方面,在与SEQ ID NO:62的氨基酸残基Thr-563相对应的位置处的氨基酸可以被Ala残基取代。在一些方面,在与SEQ ID NO:62的氨基酸残基Glu-567相对应的位置处的氨基酸可以被Gln残基取代。在一些方面,在与SEQ ID NO:62的氨基酸残基Val-586相对应的位置处的氨基酸可以被Thr残基取代。在一些方面,在与SEQ ID NO:62的氨基酸残基Gln-588相对应的位置处的氨基酸可以被Leu残基取代。在一些方面,在与SEQ ID NO:62的氨基酸残基Ile-591相对应的位置处的氨基酸可以被Val、Lys或Arg残基取代。在一些方面,在与SEQ ID NO:62的氨基酸残基Lys-593相对应的位置处的氨基酸可以被Met残基取代。在一些方面,在与SEQ ID NO:62的氨基酸残基Ile-608相对应的位置处的氨基酸可以被Tyr残基取代。在一些方面,在与SEQ ID NO:62的氨基酸残基Ala-610相对应的位置处的氨基酸可以被Cys或Thr残基取代。在一些方面,在与SEQ ID NO:62的氨基酸残基Leu-661相对应的位置处的氨基酸可以被Pro残基取代。在一些方面,在与SEQ ID NO:62的氨基酸残基Arg-722相对应的位置处的氨基酸可以被His或Asn残基取代。在一些方面,在与SEQ ID NO:62的氨基酸残基Thr-728相对应的位置处的氨基酸可以被Ser残基取代。在一些方面,在与SEQ ID NO:62的氨基酸残基Met-732相对应的位置处的氨基酸可以被Leu残基取代。在一些方面,在与SEQ IDNO:62的氨基酸残基Arg-741相对应的位置处的氨基酸可以被Ser、Ala、Pro、Gln或Thr残基取代。在一些方面,在与SEQ ID NO:62的氨基酸残基Asn-743相对应的位置处的氨基酸可以被Ser、Thr或Asp残基取代。在一些方面,在与SEQ ID NO:62的氨基酸残基Ala-777相对应的位置处的氨基酸可以被Asn残基取代。在一些方面,在与SEQ ID NO:62的氨基酸残基Tyr-848相对应的位置处的氨基酸可以被Glu残基取代。在一些方面,在与SEQ ID NO:62的氨基酸残基Ile-1453相对应的位置处的氨基酸可以被Gly或Met残基取代。
某些实施例中的非天然葡糖基转移酶可以包含(除了以上列出的一种或多种取代的任一种,或可替代地除了以上列出的一种或多种取代)在与SEQ ID NO:62的氨基酸残基Phe-424、Asn-475、Trp-511、Arg-609、Asn-614或Asn-1214相对应的位置处至少一个氨基酸取代。例如,这样的非天然葡糖基转移酶可以基于任何上述公开的葡糖基转移酶/催化结构域氨基酸序列(及其百分比同一性)。在一些方面,在与SEQ ID NO:62的氨基酸残基Phe-424相对应的位置处的氨基酸可以被Ala、Val、Leu、Glu或Gln残基取代。在一些方面,在与SEQID NO:62的氨基酸残基Asn-475相对应的位置处的氨基酸可以被Gln或Ser残基取代。在一些方面,在与SEQ ID NO:62的氨基酸残基Trp-511相对应的位置处的氨基酸可以被Tyr残基取代。在一些方面,在与SEQ ID NO:62的氨基酸残基Arg-609相对应的位置处的氨基酸可以被His残基取代。在一些方面,在与SEQ ID NO:62的氨基酸残基Asn-614相对应的位置处的氨基酸可以被Phe残基取代。在一些方面,在与SEQ ID NO:62的氨基酸残基Asn-1214相对应的位置处的氨基酸可以被Leu或Ile残基取代。
本文的非天然葡糖基转移酶可以包含目前公开的氨基酸取代的例如一个、两个、三个、四个、五个、六个、七个、八个、九个或更多个。在一些方面,非天然葡糖基转移酶在与SEQ ID NO:62的氨基酸残基Gln-588、Arg-741或Arg-722相对应的位置处可以包含至少一个氨基酸取代。在一些方面,非天然葡糖基转移酶可以包含在这些位点的一个(例如Q588)、这些位点的两个(例如Q588和R741)或这些位点的全部三个(Q588、R741和Arg-722)处的取代。这样的一个或多个氨基酸取代可以是例如如以上公开的那些的任一种(例如,Q588L、R741S、R722H)。在一些方面,非天然葡糖基转移酶可以包含在这些位点的一个、两个或全部三个处的取代,并且具有如以上公开的目前公开的取代的总数。
例如,合适的取代位点和在这些位点具体取代的实例可以包括如在实例1(以下)的表3中列出的那些,其与α-1,3-葡聚糖产物的分子量(DPw)中增加至少约5%、10%、15%、20%、25%、30%、35%、40%、45%、50%、55%或60%相关。在一些替代方面,取代位点和在这样的位点的一个或多个具体取代的一个或多个实例可以包括任何如在实例1(以下)的表3中列出的那些,所述取代位点与赋予葡糖基转移酶合成不溶性α-1,3-葡聚糖的益处的特征相关。如在表3中列出的前述取代与SEQ ID NO:62中列出的残基位置编号相对应。在一些方面,一个或多个取代是保守取代或非保守取代;这种保守(或不保守)可以是例如相对于衍生出非天然葡糖基转移酶的天然葡糖基转移酶中存在的氨基酸而言的。
本文的非天然葡糖基转移酶可以合成包含1,3-键的不溶性α-葡聚糖,所述不溶性α-葡聚糖具有比由第二葡糖基转移酶(或,仅,“另一个”葡糖基转移酶)(例如,亲本葡糖基转移酶)合成的包含1,3-键的不溶性α-葡聚糖的分子量更高的分子量,所述第二葡糖基转移酶仅在一个或多个取代位置处不同于非天然葡糖基转移酶。本文的第二葡糖基转移酶例如可以由天然氨基酸序列的全部或大部分组成。因此,当本文的第二葡糖基转移酶在一些方面可以是天然葡糖基转移酶时,所述第二葡糖基转移酶在其他方面可以是修饰前的葡糖基转移酶(例如,具有与本公开的一个或多个取代不同的一个或多个其他氨基酸取代的葡糖基转移酶)。在一些实施例中,与非天然葡糖基转移酶相比的第二葡糖基转移酶在一个或多个取代位置处具有一个或多个天然氨基酸残基。可以通过将第二葡糖基转移酶氨基酸序列与衍生出所述第二葡糖基转移酶的天然/野生型葡糖基转移酶氨基酸序列进行比较来确定氨基酸残基是否是天然的。
在一些方面,本文的非天然葡糖基转移酶可合成具有分子量比由第二葡糖基转移酶合成的不溶性α-葡聚糖分子量高至少约5%、10%、15%、20%、25%、30%、35%、40%、45%、50%、55%或60%的不溶性α-葡聚糖。关于如本文公开的任何葡聚糖合成反应/过程(例如,考虑到初始蔗糖浓度、温度、pH和/或反应时间),并且使用任何合适的测量技术(例如,SEC),可以进行这样的测定。典型地,在相同或相似的反应条件下,可以进行非天然葡糖基转移酶和本文的第二葡糖基转移酶之间的比较。例如,不溶性α-葡聚糖的分子量可以表示为DPw。
本文公开的一些实施例涉及包含编码如目前公开的非天然葡糖基转移酶(例如,在与SEQ ID NO:62的氨基酸残基Asn-531、Arg-534、Thr-563、Glu-567、Val-586、Gln-588、Ile-591、Lys-593、Ile-608、Ala-610、Leu-661、Arg-722、Thr-728、Met-732、Arg-741、Asn-743、Ala-777、Tyr-848或Ile-1453相对应的位置处包含至少一个氨基酸取代的非天然葡糖基转移酶)的核苷酸序列的多核苷酸。任选地,一个或多个调节序列与所述核苷酸序列可操作地连接,并且优选包含启动子序列作为调节序列。
包含编码本文的非天然葡糖基转移酶的核苷酸序列的多核苷酸可以是例如用于将核苷酸序列转移到细胞中的载体或构建体。合适的载体/构建体的实例可以选自质粒、酵母人工染色体(YAC)、粘粒、噬菌粒、细菌人工染色体(BAC)、病毒、或线性DNA(例如,线性PCR产物)。在一些方面多核苷酸序列能够在细胞中瞬时存在(即未整合到基因组中)或稳定存在(即整合到基因组中)。在一些方面多核苷酸序列可以包含或缺少一个或多个合适的标记序列(例如选择或表型标记)。
在某些实施例中,多核苷酸序列可以包含与编码非天然葡糖基转移酶的核苷酸序列可操作地连接的一个或多个调节序列。例如,编码非天然葡糖基转移酶的核苷酸序列可以与启动子序列(例如,异源启动子)可操作地连接。例如,启动子序列可适用于在细胞(例如细菌细胞,如大肠杆菌或芽孢杆菌;真核细胞,如真菌、酵母、昆虫或哺乳动物细胞)中或体外蛋白质表达系统中表达。其他合适的调节序列的实例包括转录终止子序列。
本文的一些方面涉及包含如目前公开的多核苷酸序列的细胞;这样的细胞可以是本文所公开的任何类型(例如,细菌细胞,如大肠杆菌或芽孢杆菌属;真核细胞,如真菌、酵母、昆虫或哺乳动物细胞)。细胞可以任选地表达由多核苷酸序列编码的非天然葡糖基转移酶。在一些方面,所述多核苷酸序列在细胞中瞬时存在(即,未整合到基因组中)或稳定存在(即,整合到基因组中)。
本文公开的一些实施例涉及包含水、蔗糖和本文的一种或多种非天然葡糖基转移酶(例如,在与SEQ ID NO:62的氨基酸残基Asn-531、Arg-534、Thr-563、Glu-567、Val-586、Gln-588、Ile-591、Lys-593、Ile-608、Ala-610、Leu-661、Arg-722、Thr-728、Met-732、Arg-741、Asn-743、Ala-777、Tyr-848或Ile-1453相对应的位置处包含至少一个氨基酸取代的非天然葡糖基转移酶)的反应组合物。这样的反应组合物至少产生包含如公开的1,3-键的α-葡聚糖。
如果需要,可以控制本文的反应组合物的温度,并且可以是例如约5℃-50℃、20℃-40℃、30℃-40℃、20℃-30℃、20℃-25℃、20℃、25℃、30℃、35℃或40℃。
本文的反应组合物中蔗糖的初始浓度可以是例如约20-400g/L、75-175g/L或50-150g/L。在一些方面,初始蔗糖浓度是至少约50、75、100、150或200g/L,或是约50-600g/L、100-500g/L、50-100g/L、100-200g/L、150-450g/L、200-450g/L或250-600g/L。“蔗糖的初始浓度”是指在反应组合物中刚刚在已经添加/合并所有反应组分(例如,至少水、蔗糖、非天然葡糖基转移酶)之后的蔗糖浓度。
在某些实施例中,反应组合物的pH可以是约4.0-9.0、4.0-8.5、4.0-8.0、5.0-8.0、5.5-7.5、或5.5-6.5。在一些方面,pH可以是约4.0、4.5、5.0、5.5、6.0、6.5、7.0、7.5或8.0。可以通过添加或掺入适合的缓冲液来调节或控制pH,所述缓冲液包括但不限于:磷酸盐、三羟甲基氨基甲烷、柠檬酸盐、或其组合。在本文的反应组合物中的缓冲液浓度可以是例如约0.1-300mM、0.1-100mM、10-100mM、10mM、20mM或50mM。
反应组合物可以包含在适合用于应用本文公开的一种或多种反应条件的任何容器(例如,惰性容器/器皿)中。在一些方面,惰性容器可以是不锈钢、塑料、或玻璃(或包含这些组分中的两种或更多种)并且具有适合于含有特定反应的大小。例如,惰性容器的体积/容量(和/或本文中的反应组合物的体积)可以是约或至少约1、10、50、100、500、1000、2500、5000、10000、12500、15000、或20000升。惰性容器可以任选地配备有搅拌装置。
本文的反应组合物可以包含一种、两种或更多种葡糖基转移酶,例如,只要至少一种酶是如目前公开的非天然葡糖基转移酶。在一些实施例中,仅一种或两种葡糖基转移酶包含在反应组合物中。本文的葡糖基转移酶反应可以是并且典型地是不含细胞的(例如,无全细胞存在)。
本文公开的关于反应组合物的任何特征(例如,以上和下面的实例中)可以表征本文的葡聚糖生产方法的合适方面,反之亦然。
本公开还涉及用于产生不溶性α-葡聚糖的方法,所述方法包括:(a)使至少水、蔗糖以及如本文公开的产生不溶性α-葡聚糖的至少一种非天然葡糖基转移酶接触,从而产生不溶性α-葡聚糖;和b)任选地,分离在步骤(a)中产生的不溶性α-葡聚糖。当利用本文的反应组合物时,典型地还进行这样的方法,所述方法可以任选地被表征为葡聚糖合成方法。
如目前公开的葡聚糖合成方法包括使至少水、蔗糖以及产生不溶性α-葡聚糖的本文的非天然葡糖基转移酶接触。如下文的讨论,可以将这些和任选地其他试剂一起添加或按任何顺序添加。该步骤可任选地被表征为提供反应组合物,所述反应组合物包含水、蔗糖以及合成不溶性α-葡聚糖的非天然葡糖基转移酶。本文中的接触步骤能以任何数目的方式进行。例如,可以首先将所希望的量的蔗糖溶解在水中(任选地,也可以在这个制备阶段添加其他组分,例如缓冲液组分),接着添加葡糖基转移酶。溶液可以保持静止,或经由例如搅拌或轨道振摇而搅动。葡聚糖合成方法可以通过分批、补料分批、连续模式或通过这些模式的任何变化来进行。
在某些实施例中,反应的完成可以目视地(例如,无更多的不溶性葡聚糖积累),和/或通过测量溶液中剩余的蔗糖的量(残余的蔗糖)来确定,其中至少约90%、95%或99%的蔗糖消耗百分比可以表示反应完成。例如,可以将所公开方法的反应进行约1小时至约2、4、6、8、10、12、14、16、18、20、22、24、36、48、60、72、96、120、144或168小时。
在本文葡聚糖合成方法的一些方面中产生的不溶性α-葡聚糖的分子量可以比由第二葡糖基转移酶合成的不溶性α-葡聚糖的分子量高至少约5%、10%、15%、20%、25%、30%、35%、40%、45%、50%、55%或60%。在一些方面,在进行约16-24小时(例如,约20小时)的反应中,实现了这样的分子量增强。
可任选地分离本文方法中产生的不溶性α-葡聚糖。在某些实施例中,分离不溶性α-葡聚糖至少可包括进行离心和/或过滤的步骤。分离可以任选地进一步包括用水或其他水性液体洗涤α-葡聚糖一次、两次或更多次,和/或干燥所述α-葡聚糖产物。
本文中的分离的α-葡聚糖产物,如以干的形式提供的,可包含例如不超过2.0wt%、1.5wt%、1.0wt%、0.5wt%、0.25wt%、0.10wt%、0.05wt%、或0.01wt%水。在一些方面,α-葡聚糖产物以至少1克的量(例如,至少约2.5g、5g、10g、25g、50g、100g、250g、500g、750g、1000g、2500g、5000g、7500g、10000g、25000g、50000g、或100000g)提供;此类的量可以是例如干的量。
可以将用于合成α-葡聚糖的任何公开的条件(例如前述或在以下实例中描述的那些)应用于实践如目前公开的反应组合物(并且反之亦然),和/或因此用于表征非天然葡糖基转移酶的特征/活性。
本公开还涉及制备编码本文的非天然葡糖基转移酶的多核苷酸序列的方法。该方法包括:
(a)鉴定编码亲本葡糖基转移酶的多核苷酸序列,所述亲本葡糖基转移酶(i)包含与SEQ ID NO:4或SEQ ID NO:4的位置55-960具有至少约40%同一性的氨基酸序列,并且(ii)合成包含1,3-键的不溶性α-葡聚糖;和
(b)修饰在步骤(a)中鉴定的多核苷酸序列以在与SEQ ID NO:62的氨基酸残基Asn-531、Arg-534、Thr-563、Glu-567、Val-586、Gln-588、Ile-591、Lys-593、Ile-608、Ala-610、Leu-661、Arg-722、Thr-728、Met-732、Arg-741、Asn-743、Ala-777、Tyr-848或、Ile-1453相对应的位置处取代亲本葡糖基转移酶的至少一个氨基酸,从而提供编码非天然葡糖基转移酶的多核苷酸序列,所述非天然葡糖基转移酶合成具有分子量高于由亲本葡糖基转移酶合成的不溶性α-葡聚糖的分子量的不溶性α-葡聚糖。
这种方法可任选地进一步包括使用以这种方式制备的多核苷酸用于表达由所述多核苷酸编码的非天然葡糖基转移酶的方法中。这种表达方法可以遵循例如如本领域已知的任何异源蛋白质表达方法。制备多核苷酸的本方法可任选地可替代地被表征为增加葡糖基转移酶的产物分子量的方法。
在一些情况下,本文的鉴定步骤(a)可以包括鉴定亲本葡糖基转移酶的氨基酸序列。可以根据遗传密码(密码子)(例如鉴定出亲本葡糖基转移酶的物种中使用的遗传密码)从该氨基酸序列确定多核苷酸序列。
例如,可以按以下进行鉴定编码本文的亲本葡糖基转移酶的多核苷酸:(a)经由计算机模拟,(b)用包括核酸杂交步骤的方法,(c)用包括蛋白质测序步骤的方法,和/或(d)用包括蛋白质结合步骤的方法。
关于经由计算机模拟检测,可以将存储在计算机或数据库(例如,公共数据库,例如GENBANK、EMBL、REFSEQ、GENEPEPT、SWISS-PROT、PIR、PDB)中的候选亲本葡糖基转移酶的氨基酸序列(和/或编码这样的葡糖基转移酶的核苷酸序列)经由计算机模拟进行评估以鉴定葡糖基转移酶,所述葡糖基转移酶包含与如上文所述的亲本葡糖基转移酶具有百分比序列同一性的氨基酸序列。这样的评估可以包括使用本领域已知的任何手段,例如通过使用如以上描述的比对算法或软件(例如,BLASTN、BLASTP、ClustalW、ClustalV、Clustal-Omega、EMBOSS)。
可以任选地通过包括核酸杂交步骤的方法进行如以上公开的亲本葡糖基转移酶的鉴定。这样的方法可以包括使用例如DNA杂交(例如DNA印迹、斑点印迹)、RNA杂交(例如RNA印迹),或具有核酸杂交步骤的任何其他的方法(例如DNA测序、PCR、RT-PCR,所有这些都可以包括寡核苷酸的杂交)。例如,在这样的杂交中,可以将编码SEQ ID NO:4或其子序列(例如,SEQ ID NO:4的位置55-960)的多核苷酸序列用作探针。用于进行杂交方法的条件和参数通常是熟知的并且公开于以下文献中:例如,在Sambrook J,Fritsch EF和ManiatisT,Molecular Cloning:A Laboratory Manual[分子克隆:实验手册],冷泉港实验室(ColdSpring Harbor Laboratory):冷泉港,纽约州(1989);Silhavy TJ,Bennan ML和EnquistLW,Experiments with Gene Fusions[使用基因融合的实验],冷泉港实验室(Cold SpringHarbor Laboratory):冷泉港,纽约州(1984);Ausubel FM等人,Current Protocols in Molecular Biology[分子生物学当前方案],由新泽西州霍博肯格林(Hoboken)格林出版联合公司(Greene Publishing Assoc.)与威利交叉科学出版社(Wiley-Interscience)出版(1987);以及Innis MA,Gelfand DH,Sninsky JJ和White TJ(编辑),PCR Protocols:A Guide to Methods and Applications[PCR方案:方法与应用指南],学术出版社公司(Academic Press,Inc.),圣地亚哥,加利福尼亚州(1990)。
可以任选地通过包括蛋白质测序步骤的方法进行如以上公开的亲本葡糖基转移酶的鉴定。这样的蛋白质测序步骤可以包括一种或多种程序,例如N-末端氨基酸分析、C-末端氨基酸分析、埃德曼降解、或质谱法。
可以任选地通过包括蛋白质结合步骤的方法进行如以上公开的亲本葡糖基转移酶的鉴定。可以使用例如与SEQ ID NO:4内(例如,SEQ ID NO:4的位置55-960内)的基序或表位结合的抗体进行这样的蛋白质结合步骤。
在一些方面,步骤(a)中鉴定的多核苷酸(即,在步骤[b]中进行其修饰之前)可以编码葡糖基转移酶,所述葡糖基转移酶包含与表1中公开的任何葡糖基转移酶的氨基酸序列相同或与其具有至少90%、91%、92%、93%、94%、95%、96%、97%、98%或99%同一性的氨基酸序列。由这种葡糖基转移酶产生的α-葡聚糖可以例如是如本文所公开的。
制备编码本文的非天然葡糖基转移酶的多核苷酸序列的方法包括修饰步骤(a)中鉴定的多核苷酸序列(编码亲本葡糖基转移酶)的步骤(b)。此类修饰在与SEQ ID NO:62的氨基酸残基Asn-531、Arg-534、Thr-563、Glu-567、Val-586、Gln-588、Ile-591、Lys-593、Ile-608、Ala-610、Leu-661、Arg-722、Thr-728、Met-732、Arg-741、Asn-743、Ala-777、Tyr-848、或Ile-1453相对应的位置处取代亲本葡糖基转移酶的至少一个氨基酸。由这样的一个或多个取代得到的非天然葡糖基转移酶(由经修饰的多核苷酸序列编码)可以任选地被表征为本文的“子代葡糖基转移酶”。
例如,本文的亲本葡糖基转移酶可以包含与SEQ ID NO:4(任选地无其起始甲硫氨酸)或SEQ ID NO:4的位置55-960(大致催化结构域)具有至少约40%、41%、42%、43%、44%、45%、46%、47%、48%、49%、50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、69%、70%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、或99.5%同一性的氨基酸序列。应注意仅出于参考目的,无其起始甲硫氨酸的SEQ ID NO:4是SEQ ID NO:62的子序列。
对步骤(b)中多核苷酸的适合的修饰可以遵循本领域已知的任何DNA操作技术进行。修饰步骤(b)可任选地经由计算机模拟进行,然后合成编码非天然葡糖基转移酶的多核苷酸序列。例如,可以使用合适的序列操作程序/软件(例如,VECTOR NTI,生命技术公司(Life Technologies),卡尔斯巴德(Carlsbad),加利福尼亚州;DNAStrider;DNASTAR,麦迪逊,威斯康星州)经由计算机模拟对步骤(a)中鉴定的多核苷酸序列进行操作。在这种虚拟操作之后,可以通过任何合适的技术(例如,基于退火的寡核苷酸连接,或在Hughes等人,Methods Enzymol.[酶学方法]498:277-309中公开的任何技术,将所述文献通过引用并入本文)人工合成经修饰的多核苷酸序列。应当理解,不认为前述方法必然依赖于使预先存在的多核苷酸(编码亲本葡糖基转移酶)受控。
使用在步骤(a)中鉴定的编码亲本葡糖基转移酶的多核苷酸序列的物理拷贝可以任选地进行修饰步骤(b)。作为实例,使用按使得扩增产物编码本文的非天然葡糖基转移酶的方式设计的引物,这样的多核苷酸可以用作扩增模板(例如,参考Innis等人,同上)。
该方法中的氨基酸取代可以是如本文公开的那些取代组合的任何一个。例如,基本上,如目前公开的任何非天然葡糖基转移酶可以通过如通过这种方法制备的多核苷酸编码。
本文公开的组合物和方法的非限制性实例包括:
1.一种非天然葡糖基转移酶,所述非天然葡糖基转移酶在与SEQ ID NO:62的氨基酸残基Asn-531、Arg-534、Thr-563、Glu-567、Val-586、Gln-588、Ile-591、Lys-593、Ile-608、Ala-610、Leu-661、Arg-722、Thr-728、Met-732、Arg-741、Asn-743、Ala-777、Tyr-848、或Ile-1453相对应的位置处包含至少一个氨基酸取代,其中所述非天然葡糖基转移酶合成包含1,3-键的不溶性α-葡聚糖,并且所述不溶性α-葡聚糖的分子量高于由第二葡糖基转移酶合成的不溶性α-葡聚糖的分子量,所述第二葡糖基转移酶仅在一个或多个取代位置处不同于非天然葡糖基转移酶。
2.如实施例1所述的非天然葡糖基转移酶,其中:(i)在与氨基酸残基Asn-531相对应的位置处的氨基酸被Gly、Leu或Met残基取代;(ii)在与氨基酸残基Arg-534相对应的位置处的氨基酸被Lys、Gly、Ile、Leu或Met残基取代;(iii)在与氨基酸残基Thr-563相对应的位置处的氨基酸被Ala残基取代;(iv)在与氨基酸残基Glu-567相对应的位置处的氨基酸被Gln残基取代;(v)在与氨基酸残基Val-586相对应的位置处的氨基酸被Thr残基取代;(vi)在与氨基酸残基Gln-588相对应的位置处的氨基酸被Leu残基取代;(vii)在与氨基酸残基Ile-591相对应的位置处的氨基酸被Val、Lys或Arg残基取代;(viii)在与氨基酸残基Lys-593相对应的位置处的氨基酸被Met残基取代;(ix)在与氨基酸残基Ile-608相对应的位置处的氨基酸被Tyr残基取代;(x)在与氨基酸残基Ala-610相对应的位置处的氨基酸被Cys或Thr残基取代;(xi)在与氨基酸残基Leu-661相对应的位置处的氨基酸被Pro残基取代;(xii)在与氨基酸残基Arg-722相对应的位置处的氨基酸被His或Asn残基取代;(xiii)在与氨基酸残基Thr-728相对应的位置处的氨基酸被Ser残基取代;(xiv)在与氨基酸残基Met-732相对应的位置处的氨基酸被Leu残基取代;(xv)在与氨基酸残基Arg-741相对应的位置处的氨基酸被Ser、Ala、Pro、Gln或Thr残基取代;(xvi)在与氨基酸残基Asn-743相对应的位置处的氨基酸被Ser、Thr或Asp残基取代;(xvii)在与氨基酸残基Ala-777相对应的位置处的氨基酸被Asn残基取代;(xviii)在与氨基酸残基Tyr-848相对应的位置处的氨基酸被Glu残基取代;和/或(xix)在与氨基酸残基Ile-1453相对应的位置处的氨基酸被Gly或Met残基取代。
3.如实施例1或2所述的非天然葡糖基转移酶,所述非天然葡糖基转移酶在与SEQID NO:62的氨基酸残基Gln-588、Arg-741或Arg-722相对应的位置处包含至少一个氨基酸取代;任选地,其中:(i)在与氨基酸残基Gln-588相对应的位置处的氨基酸被Leu残基取代;(ii)在与氨基酸残基Arg-741相对应的位置处的氨基酸被Ser残基取代;和/或(iii)在与氨基酸残基Arg-722相对应的位置处的氨基酸被His残基取代。
4.如实施例3所述的非天然葡糖基转移酶,所述非天然葡糖基转移酶在与SEQ IDNO:62的氨基酸残基Gln-588、Arg-741或Arg-722相对应的位置处包含两个或更多个氨基酸取代。
5.如实施例1、2、3或4所述的非天然葡糖基转移酶,其中由所述非天然葡糖基转移酶产生的不溶性α-葡聚糖包含至少约50%的α-1,3键,并且任选地其中所述α-葡聚糖具有至少100的重均聚合度(DPw)。
6.如实施例1、2、3、4或5所述的非天然葡糖基转移酶,其中由所述非天然葡糖基转移酶产生的不溶性α-葡聚糖具有至少650的DPw。
7.如实施例5或6所述的非天然葡糖基转移酶,所述非天然葡糖基转移酶包含与SEQ ID NO:4的残基55-960、SEQ ID NO:65的残基54-957、SEQ ID NO:30的残基55-960、SEQID NO:28的残基55-960、或SEQ ID NO:20的残基55-960具有至少约90%同一性的催化结构域。
8.如实施例5、6或7所述的非天然葡糖基转移酶,所述非天然葡糖基转移酶包含与SEQ ID NO:4、SEQ ID NO:65、SEQ ID NO:30、SEQ ID NO:28、或SEQ ID NO:20具有至少约90%同一性的氨基酸序列。
9.如实施例1、2、3、4、5、6、7或8所述的非天然葡糖基转移酶,其中由所述非天然葡糖基转移酶产生的不溶性α-葡聚糖包含至少约90%(或至少95%)的α-1,3键。
10.如实施例1、2、3、4、5、6、7、8或9所述的非天然葡糖基转移酶,其中由所述非天然葡糖基转移酶产生的不溶性α-葡聚糖的分子量比由第二葡糖基转移酶合成的不溶性α-葡聚糖的分子量高至少约10%。
11.一种多核苷酸,所述多核苷酸包含编码如实施例1-10中任一项所述的非天然葡糖基转移酶的核苷酸序列,任选地其中一个或多个调节序列可操作地连接到所述核苷酸序列,并且优选地其中所述一个或多个调节序列包含启动子序列。
12.一种反应组合物,所述反应组合物包含水、蔗糖以及如实施例1-10中任一项所述的非天然葡糖基转移酶。
13.一种产生不溶性α-葡聚糖的方法,所述方法包括:(a)使至少水、蔗糖以及如实施例1-10中任一项所述的非天然葡糖基转移酶接触,从而产生不溶性α-葡聚糖;和(b)任选地,分离在步骤(a)中产生的不溶性α-葡聚糖。
14.一种制备编码非天然葡糖基转移酶(例如,实施例1-10中任一项所述的)的多核苷酸序列的方法,所述方法包括:(a)鉴定编码亲本葡糖基转移酶的多核苷酸序列,所述亲本葡糖基转移酶(i)包含与SEQ ID NO:4或SEQ ID NO:4的位置55-960具有至少约40%同一性的氨基酸序列,并且(ii)合成包含1,3-键的不溶性α-葡聚糖;和(b)修饰在步骤(a)中鉴定的多核苷酸序列以在与SEQ ID NO:62的氨基酸残基Asn-531、Arg-534、Thr-563、Glu-567、Val-586、Gln-588、Ile-591、Lys-593、Ile-608、Ala-610、Leu-661、Arg-722、Thr-728、Met-732、Arg-741、Asn-743、Ala-777、Tyr-848、或Ile-1453相对应的位置处取代亲本葡糖基转移酶的至少一个氨基酸,从而提供编码非天然葡糖基转移酶的多核苷酸序列,所述非天然葡糖基转移酶合成具有分子量高于由亲本葡糖基转移酶合成的不溶性α-葡聚糖的分子量的不溶性α-葡聚糖。
15.如实施例14所述的方法,其中按以下进行所述鉴定步骤:(a)经由计算机模拟,(b)用包括核酸杂交步骤的方法,(c)用包括蛋白质测序步骤的方法,和/或(d)用包括蛋白质结合步骤的方法;和/或其中按如下进行所述修饰步骤:(e)经由计算机模拟,随后合成编码所述非天然葡糖基转移酶的多核苷酸序列,或(f)使用编码所述亲本葡糖基转移酶的多核苷酸序列的物理拷贝。
实例
本公开在以下实例中进一步举例说明。应当理解,这些实例尽管说明了本文的某些优选方面,但仅是以例证的方式给出的。从上述论述和这些实例中,本领域的技术人员可确定所公开的实施例的必要特性,并且在不脱离所公开的实施例的精神和范围的情况下,可进行各种变化和修改以使所公开的实施例适应多种用途和条件。
实例1
影响葡糖基转移酶α-葡聚糖产物分子量的氨基酸位点的分析
本实例描述了对产生具有增加的分子量的α-葡聚糖的葡糖基转移酶变体的筛选。使用位点评估文库(SEL)进行该筛选。
在所述实例中用于制备氨基酸取代的葡糖基转移酶的氨基酸序列是SEQ ID NO:4(GTF 6855),所述序列本质上是来自唾液链球菌SK126(参见表1)的全长野生型葡糖基转移酶(由SEQ ID NO:62表示)的N-末端截短(去除信号肽和可变区)形式。SEQ ID NO:4中做出的取代可以被表征为取代天然氨基酸残基,因为SEQ ID NO:4的每个氨基酸残基/位置(除了SEQ ID NO:4的Met-1残基)与SEQ ID NO:62中的氨基酸残基/位置相对应。在至少包含蔗糖和水的反应中,具有SEQ ID NO:4的葡糖基转移酶典型地产生具有约100%α-1,3键和DPw为400或更高的α-葡聚糖(例如,参考美国专利号8871474和9169506,和美国专利申请公开号2017/0002336,将这些文献通过引用并入本文)。例如,可以在酶催化合成后经由过滤分离该不溶性的α-葡聚糖产物。
为总结该实例,将来自SEL的GTF 6855变体(各自具有单个氨基酸取代)各自进行细菌性地表达、纯化,并标准化至浓度为100ppm。然后使用蔗糖作为α-1,3-葡聚糖合成反应中的底物来筛选每种酶配制品(一式三份)。使用尺寸排阻色谱法(SEC)分析每个反应中获得的α-1,3-葡聚糖聚合物的长度(DPw)。
制备用于在枯草芽孢杆菌(Bacillus subtilis)宿主中单独表达GTF 6855(SEQID NO:4)的各种单个氨基酸取代的变体的质粒。如下制备这样的质粒。合成具有(以5’-至-3’顺序可操作地连接)枯草芽孢杆菌aprE启动子、编码SEQ ID NO:4(GTF 6855)的密码子优化的序列、和BPN’终止子的DNA表达盒。将这个表达盒克隆到pHYT复制穿梭载体(形成pHYT-GTF6855)中并转化到枯草芽孢杆菌CBS12-1中。通过使用BstEII和EcoRI位点在四环素抗性基因之后添加终止子序列(SEQ ID NO:67),从pHY300PLK(宝生物公司(Takara))衍生出pHYT载体。通过将接头序列(未显示)克隆到BamHI和HindIII位点中去除pHY300PLK中的HindIII位点。扩增pHYT-GTF6855质粒并用于生成SEL。对所得的编码单个氨基酸取代的GTF的质粒进行测序来验证每个取代。
为产生GTF 6855(SEQ ID NO:4)及其单个氨基酸取代的变体,将用pHYT-GTF6855或其突变版本单独转化的枯草芽孢杆菌在胰胨大豆肉汤(Oxoid有限公司,英国)和格兰特II培养基(Grant’s II medium)中培养。使用心浸液琼脂板(Difco实验室,密歇根州)来选择转化体。通过添加25μg/mL四环素维持质粒完整性。在37℃孵育约6小时后,在生长培养基中检测到靶向表达的每种GTF。离心并过滤后,获得具有表达的GTF的培养上清液。通过使用经洗涤的(2x MILLIQ 1x 25mM NaH2PO4pH 5.7,中间离心步骤100x g)SUPERDEX 200树脂(GE医疗集团(GE Healthcare))的亲和色谱法,将所述上清液中存在的GTF酶纯化至表观同质性。通过离心100x g,用右旋糖酐T1(Pharmacosmos)在25mM NaH2PO4(pH 5.7)中的15%溶液对每种GTF进行洗脱。使用哈佛仪器公司(Harvard Apparatus)96孔DISPODIALYZER(10000道尔顿MWCO),将每种经纯化的GTF针对25mM NaH2PO4 pH 5.7缓冲液进行透析(至少100次)。
透析后,使用经纯化的GTF 6855作为标准品,通过OD280确定GTF酶浓度。通过用25mM NaH
2PO
4(pH 5.7)适当地稀释来实现将每种经纯化的GTF标准化至100ppm。使用配备有AGILENT BIO SEC3保护柱(3μm
(4.6x 50mm))的AGILENT 1200(安捷伦技术公司(Agilent Technologies))HPLC确认每种样品的蛋白质浓度。将五(5)μL的样品注入到柱上用于每次测定。以0.5mL/min流速,用25mM KH
2PO
4 pH 6.8+0.1M NaCl的等度流洗脱化合物1.3分钟。
将每种GTF(GTF 6855及其每种变体)添加到具有蔗糖的反应中来产生α-葡聚糖。如下进行每个反应:将37.5μL的100ppm酶样品(基于BSA校准曲线的ppm)添加至在20mMNa2HPO4/NaH2PO4(pH 5.7)中的262.5μL 86g/L蔗糖(最终75g/L)中并在30℃下孵育过夜(约20小时)。该孵育后,通过在80℃孵育1小时将每个反应淬灭。适当的分析表明,下表3中列出的每种变体酶都能够进行产生α-1,3-葡聚糖的葡糖基转移酶反应(数据未显示)。
在DMSO/2%LiCl中将每种淬灭反应的100-μL等分试样稀释20倍,并通过0.2-μmPALL GHP膜(4000g x 30min x 30℃)经由离心过滤,准备进行SEC分析。用配备有WATERSACQUITY APC-XT
2.5-μm 4.6x30mm柱的WATERS APC-SEC系统估计α-1,3-葡聚糖聚合物的尺寸。将柱保持在55℃下,其中DMSO/0.25%LiCl流动相的流速为0.65mL/min。使用具有分子量为80kD、165kD、325kD和750kD的右旋糖酐分析标准,分别估计α-1,3-葡聚糖的DP
w分别为280、480、660和880(经由洗脱峰顶点)。
表3中提供了如经由上述方法测量的每个反应(约20小时)中产生的α-1,3-葡聚糖的分子量(DPw)和多分散性指数(PDI)。
表3.通过GTF 6855(SEQ ID NO:4)及其单个氨基酸取代的变体产生的不溶性α-1,
3-葡聚糖
a以微量滴定板形式(两个板)运行葡聚糖合成反应。
b GTF 6855,SEQ ID NO:4。以一式四份/板运行用该GTF进行的反应。
c列出的每种具有取代的GTF是在各自位置处包含取代的GTF6855的一个版本,其中所述位置编号与SEQ ID NO:62的残基编号相对应。首先列出的是野生型残基(残基位置编号之前),第二列出的是取代的残基(残基位置编号之后)(贯穿本公开应用该“野生型残基-位置编号-变体残基”标注形式)。
d将具有被破坏的活性的GTF加入到所述反应中。未检测到α-1,3-葡聚糖。
e无GTF添加至所述反应。未检测到α-1,3-葡聚糖。
基于表3中的数据,在氨基酸位置Y848、I591、Q588、A610、R534、N531、I1453、K593、M732、T728、R722、A777和I608(例如,在GTF 6855(SEQ ID NO:4))处的单个取代每个产生一种酶,所述酶产生具有DPw比由亲本未取代的酶(GTF 6855,SEQ ID NO:4)产生的不溶性α-1,3-葡聚糖的平均DPw至少高10%的不溶性α-1,3-葡聚糖。有趣的是,这些更高DPw α-1,3-葡聚糖产物通常具有与由亲本未取代酶(GTF 6855,SEQ ID NO:4)产生的α-1,3-葡聚糖的平均PDI(2.1-2.2)相同或相似的PDI,这意味着子量的增加可能不会损害聚合物的均匀性。
在类似的SEL研究(未示出所有数据)中,GTF 6855(SEQ ID NO:4)在以下氨基酸位置的个别取代似乎也对不溶性α-1,3-葡聚糖分子量(取代残基,产生的DPw)具有增强作用:N614(P,1054)、R609(H,1052)、F424(A,1051;V,1023;L,942;E,937;Q,725)、W511(Y,1020)、N475(Q,975;S,954)、A610(T,972;C,959)、Y848(E,922)、N1214(L,918;I,863)、N531(L,879;M,724;G,714)、I591(K,840;R,824)、R534(K,759)、Q588(L,734)和R722(H,701)(未取代的GTF 6855产生具有DPw 487的不溶性α-1,3-葡聚糖)。
在该实例中,在前述任何一个位点的一个或多个取代预期允许产生不溶性α-1,3-葡聚糖,该α-1,3-葡聚糖具有显著高于由亲本未取代葡糖基转移酶产生的α-1,3-葡聚糖的DPw的DPw。
实例2
生成葡糖基转移酶变体,其产生更高分子量的α-葡聚糖产物
该实例描述了对产生具有增加的分子量的α-葡聚糖的葡糖基转移酶变体的另一个筛选。
对GTF 6855(SEQ ID NO:4)进行饱和诱变,以提供该葡糖基转移酶的大量单个单氨基酸取代变体。将每种变体加入葡聚糖合成反应中,所述反应具有与以下相同或相似的参数:容器,以120rpm摇动的250-mL底部带凹槽的摇瓶;初始pH,5.7;反应体积,50mL;蔗糖,75g/L;GTF,异源表达酶的大肠杆菌细胞的1.5mL裂解物;KH2PO4,5mM;温度,30℃;时间,约20小时。表4中提供了每个反应中产生的α-1,3-葡聚糖的分子量(DPw),如经由类似于实例1中公开的SEC方法测量的。
表4.通过GTF 6855(SEQ ID NO:4)及其单个氨基酸取代的变体产生的不溶性α-1,
3-葡聚糖的分子量
aGTF 6855,SEQ ID NO:4。与该GTF的反应在如上所述相同条件下分别进行。
明显的是,例如,基于表4中的数据,GTF 6855(SEQ ID NO:4)中每个列出的单个氨基酸取代生成产生具有增加的分子量(DPw)的不溶性α-1,3-葡聚糖的酶。因此,在表4中表明的位置处的一个或多个取代预期允许产生不溶性α-1,3-葡聚糖,该α-1,3-葡聚糖具有显著高于由亲本未取代葡糖基转移酶产生的α-1,3-葡聚糖的DPw的DPw。
实例3
氨基酸取代组合对葡糖基转移酶对α-葡聚糖合成活性影响的分析
该实例描述了以下操作的效果:将多个氨基酸取代引入葡糖基转移酶中并确定它们对其α-葡聚糖合成功能的影响。例如,该分析表明,上述为增强α-葡聚糖产物分子量而鉴定的氨基酸取代可以包括在同样赋予这种分子量增强的取代组合中。
简言之,通过定点诱变质粒中含有的适当的DNA模板,对SEQ ID NO:4(GTF 6855,参见表1和实例1中关于所述葡糖基转移酶的描述)进行某些氨基酸组合取代。编码每个经修饰的葡糖基转移酶的质粒序列被单独测序以确认预期的密码子变化。下表5中列出了取代的每种组合;适当的分析表明,每种经修饰的酶都能够进行产生α-1,3-葡聚糖的葡糖基转移酶反应(数据未显示)。
编码经修饰的葡糖基转移酶的表达质粒被单独用于转化含有九个蛋白酶缺失的枯草芽孢杆菌菌株(amyE::xylRPxylAcomK-ermC、degUHy32、oppA、ΔspoIIE3501、ΔaprE、ΔnprE、Δepr、ΔispA、Δbpr、Δvpr、ΔwprA、Δmpr-ybfJ、ΔnprB)。将转化的细胞涂布在补充有5μg/mL氯霉素的LB板上。将在这些板上生长的菌落多次加条纹涂到具有25μg/mL氯霉素的LB板上。每个所得的用于表达特定变体葡糖基转移酶的芽孢杆菌菌株然后在含有25μg/mL氯霉素的LB培养基中生长6-8小时,并且然后在格兰特II培养基(Grant’s IImedium)中在30℃下传代培养2-3天。将培养物在4℃以15000g旋转30分钟,并将上清液通过0.22-μm过滤器过滤。将过滤的上清液(每种上清液含有表达的分泌的变体葡糖基转移酶)等分并冷冻在-80℃下,然后用于(下文)分析α-1,3-葡聚糖的合成活性。
将相同量的每种变体酶(优良活性的(activity-wise))加入葡聚糖合成反应中,所述反应具有与以下相同或相似的参数:容器,在玻璃搅拌棒上具有
斜叶涡轮(45度角)的500-mL夹套反应器,并以50-200rpm搅拌;初始pH,5.5;反应体积,500mL;蔗糖,108g/L;KH
2PO
4,1mM;温度,39℃;时间,约18-24小时;来自先前α-1,3-葡聚糖合成反应的滤液,50vol%。表5中提供了每个反应(如经由类似于实例1中公开的方法测量的)中产生的α-1,3-葡聚糖的分子量(DP
w)。
基于表5中的数据,明显的是,将多个氨基酸取代(包括增强分子量的取代)引入GTF 6855(SEQ ID NO:4)中可用于更好地产生更高分子量的不溶性α-1,3-葡聚糖;例如,将这些DPw值与在表3中示出的无取代的GTF 6855(SEQ ID NO:4)的那些DPw值相比。
明显的是,例如,具有多个取代(包括在与SEQ ID NO:62的位置Gln-588、Arg-741和/或Arg-722相对应的位置处的那些)的葡糖基转移酶可以增加由葡糖基转移酶产生的不溶性α-葡聚糖的分子量。