CN117321071A - 表达转化酶/蔗糖水解酶的微生物菌株 - Google Patents

表达转化酶/蔗糖水解酶的微生物菌株 Download PDF

Info

Publication number
CN117321071A
CN117321071A CN202280035391.3A CN202280035391A CN117321071A CN 117321071 A CN117321071 A CN 117321071A CN 202280035391 A CN202280035391 A CN 202280035391A CN 117321071 A CN117321071 A CN 117321071A
Authority
CN
China
Prior art keywords
leu
ala
sucrose
genetically modified
gly
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202280035391.3A
Other languages
English (en)
Inventor
M·帕帕扎基斯
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
DSM IP Assets BV
Original Assignee
DSM IP Assets BV
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from DKPA202270138A external-priority patent/DK181442B1/en
Application filed by DSM IP Assets BV filed Critical DSM IP Assets BV
Priority claimed from PCT/EP2022/063314 external-priority patent/WO2022243311A1/en
Publication of CN117321071A publication Critical patent/CN117321071A/zh
Pending legal-status Critical Current

Links

Abstract

本公开涉及在表达单一异源酶后能够利用蔗糖作为能量和碳源的基因修饰细胞,该异源酶在表达后从胞质溶胶易位并且能够将非磷酸化的蔗糖水解成果糖和葡萄糖。能够水解未修饰形式的蔗糖的有效酶的鉴定是非常有利的,因为它允许在大规模生产过程中经济有效地使用蔗糖,并且其自身使细胞能够利用蔗糖作为碳源和/或能源,或作为主要和/或唯一的碳源和/或能源,即不需要包含几种其他异源多肽(例如其他酶和/或转运蛋白)的多基因蔗糖利用系统。

Description

表达转化酶/蔗糖水解酶的微生物菌株
技术领域
本公开涉及在表达单一异源酶后能够利用蔗糖作为能源和碳源的基因修饰细胞,该异源酶在表达后从胞质溶胶中易位并且能够将非磷酸化蔗糖水解成果糖和葡萄糖。
背景技术
过去几十年,微生物细胞在生物合成生产(例如有用的化学品和药品)中的用途不断发展。在这方面,生物技术行业致力于开发由丰富且廉价的碳源(如蔗糖)驱动的需氧生物工艺。这既适用于人乳寡糖的生物合成生产,也适用于其他生物合成产品的生产。
由于发现了人乳寡糖(HMO)在人类发育中的重要功能,因此在过去十年中,人乳寡糖(HMO)引起了人们的极大兴趣。除了它们的益生元特性之外,HMO具有额外的积极作用,扩大了其应用领域。HMO的健康益处使其被批准用于食品(例如婴儿配方奶粉和食品)以及消费者保健产品。
迄今为止,至少115种HMO的结构已被确定,而且母乳中可能存在更多的HMO。
由于HMO的可用性有限,非常需要有效的商业化,即大规模生产。目前尚未通过化学合成实现食品和医疗应用所需的大规模生产和高质量生产。此外,HMO的化学合成途径涉及多种有毒化学品,这会给最终产品带来污染风险。
为了克服与HMO化学合成相关的缺点,已经开发了几种酶法和发酵方法。已经针对多种HMO开发了基于发酵的工艺,例如2’-岩藻糖基乳糖、3-岩藻糖基乳糖、乳-N-四糖、乳-N-新四糖、3’-唾液酸乳糖和6’-唾液酸乳糖。基于发酵的工艺通常利用基因修饰的细菌菌株,例如重组大肠杆菌(E.coli)或酵母,例如酿酒酵母(S.cerevisiae)(参见例如Bych等人Current Opinion in Biotechnology 56:130-137和Lu等人2021ACS Synth.Biol.10:923-938)。
在修饰的菌株中生物合成生产HMO是HMO制造的一种有价值、经济高效且大规模适用的解决方案。它依赖于构建的基因修饰细菌,以表达合成所需寡糖所需的糖基转移酶,并利用细菌固有的核苷酸糖库作为HMO前体。
HMO生物技术生产的最新发展使得克服细菌表达系统的某些固有局限性成为可能。例如,产生HMO的细菌细胞可以进行基因修饰以增加细菌中有限的细胞内核苷酸糖库(WO2012/112777)、以提高参与HMO生产的酶的活性(WO2016/040531)、或以促进合成的HMO分泌到细胞外培养基中(WO2010/142305,WO2017/042382)。此外,重组细胞中目的基因的表达可以通过使用特定的启动子序列或其他基因表达调控子来调控,例如最近在WO2019/123324中描述的。
HMO的这种生物合成生产的代谢途径需要碳源,该碳源主要是简单的碳构件。通常,已使用甘油、葡萄糖或乳糖(参见例如WO2001/04341、Priem等人Glycobiology 12,235(2002)、Fort等人Chem.Comm.2558(2005)、Drouillard等人Angew.Chem.Int.Ed.45,1778(2006)、WO2010/070104、WO2012/112777、WO2013/182206、WO2014/048439)。
此外,大约50%的野生型大肠杆菌能够利用蔗糖作为碳源和能源,或甚至作为唯一的碳源和能源,但其中大多数是致病性的。然而,在某些情况下,蔗糖将是更便宜的唯一碳源和唯一能源。它可以直接发酵(作为甘蔗汁或糖蜜),或者它可以通过高温结晶轻松制成纯糖,而葡萄糖必须通过研磨和酶水解从淀粉转化而来。此外,基于蔗糖的生物过程比基于葡萄糖的生物过程更加环保和可持续。最后,与葡萄糖相比,蔗糖分子中缺乏化学反应性还原端,导致热灭菌和发酵后的杂质分布更干净。由于这些主要因素,相关的总体生物过程成本相对于葡萄糖而言降低了。此外,蔗糖储量丰富且容易获得。
出于这个原因,人们尝试从头创造出能够依靠蔗糖生存和生长的大肠杆菌非致病性菌株(Suc+)(例如,Sabri等人Appl.Environ.Microbiol79,478(2013)),并通过它们生产工业上有利可图的产品,如氨基酸、生物燃料、类胡萝卜素等。大肠杆菌菌株已通过将蔗糖分解代谢能力转移到非蔗糖利用菌株中进行基因修饰,主要用于工业合成化学材料,如石化产品。然而,这些Suc+转化体的生产力通常低于Suc-菌株(Khamduang等人,J.Ind.Microbiol.Biotechnol.36,1267(2009))。因此,已经转移了完整的蔗糖利用盒系统,当整合到大肠杆菌染色体上时,其组合赋予有效的蔗糖分解代谢(Bruschi等人Biotechnol.Adv.30,1001(2012))。
WO2012/007481和WO2009/078687描述了表达蔗糖磷酸化酶、蔗糖6-磷酸水解酶或与果糖激酶组合的蔗糖转化酶的大肠杆菌转化体。因此,微生物能够利用蔗糖作为其主要碳源来生产2’-岩藻糖基乳糖。此外,WO2014/067696描述了包含含有蔗糖通透酶、果糖激酶、蔗糖水解酶和转录阻遏物(分别为基因cscB、cscK、cscA和cscR)的csc基因簇的大肠杆菌转化体,使其能够依靠蔗糖生长并产生岩藻糖。
WO2015/197082描述了包含异源PTS依赖性蔗糖利用转运系统的大肠杆菌,该系统含有蔗糖特异性孔蛋白、蔗糖转运蛋白和蔗糖-6-磷酸水解酶。葡萄糖-6-磷酸和果糖的氧化因此通过生物体自身的代谢系统提供了生物能源。此外,葡萄糖-6-磷酸和果糖可作为碳源用于细胞自然生物合成途径中产生糖核苷酸。如此产生的糖核苷酸是糖基化碳水化合物受体(例如乳糖)的供体,通过细胞的特定通透酶内化,从而制造目的寡糖。糖基化由一种或多种糖基转移酶介导,所述糖基转移酶是通过表达异源基因直接产生的。该生物体缺乏任何降解细胞中受体或寡糖产物的酶。
本公开首次显示了在表达单一异源酶后能够利用蔗糖作为能源和/或碳源的基因修饰细胞,从而克服了表达多种蛋白质和蛋白质复合物以便能够利用蔗糖作为能源和碳源的需要。
发明内容
公开的是在表达单一异源酶后能够利用蔗糖作为能源和碳源的基因修饰细胞,该异源酶在表达后在足够程度上从胞质溶胶中易位并且其能够将蔗糖水解成果糖和葡萄糖。因此,本文描述的基因修饰细胞能够利用蔗糖作为其主要碳源和能源,或者在一些实施方式中甚至作为其唯一的碳源和能源。
能够水解未修饰形式的蔗糖的有效酶的鉴定是非常有利的,并且其单独地或其本身使得细胞能够利用蔗糖作为主要和/或唯一的碳源和/或能源,即不需要包含几种其他异源多肽(例如其他酶和/或转运蛋白)的多基因蔗糖利用盒系统,这是非常有利的,因为它允许在大规模生物合成生产过程中经济有效地使用蔗糖。其显著降低了在最终产物的纯化过程中从发酵产物中去除副产物和代谢物的需要和相关成本。使用能够在基因修饰细胞的细胞外或周质侧将蔗糖水解成果糖和葡萄糖的蔗糖水解酶的另一个优点是蔗糖不会进入细胞,其中如果过量的蔗糖将导致代谢溢出,导致形成代谢物如乳酸、乙酸盐和乙醇,这会对细胞生长和生产能力产生负面影响。
因此,在最广泛的意义上,本公开涉及包含编码异源多肽的异源核酸序列的基因修饰细胞,其在表达后至少在足够的程度上从胞质溶胶易位至位于细胞外、周质和/或膜结合或膜嵌入,并且其能够在细胞外或在周质空间中将蔗糖水解成果糖和葡萄糖,其中所述异源多肽单独或其本身的表达使得能够利用蔗糖作为所述基因修饰细胞的主要和/或唯一碳源和/或能源,而不使蔗糖进入宿主细胞的细胞质。表达后,多肽通常位于细胞外和/或周质空间中和/或胞质膜中。当所述异源多肽是转化酶时,其能够将非磷酸化蔗糖水解成果糖和葡萄糖。
因此,本发明的一个方面涉及包含编码转化酶的异源核酸序列的基因修饰细胞,其中所述转化酶是包含SEQ ID NO:1的氨基酸序列或由其组成的SacC Agal,或其氨基酸序列与SEQ ID NO:1具有至少80%同一性的功能同源物。
异源核酸序列可以以附加型(即,通过多拷贝质粒)和/或染色体(即,通过基因组整合)提供给细胞。它可以包含异源基因的单个或多拷贝,例如编码转化酶的异源核酸序列的至少两个基因组整合拷贝。在实施方式中,异源核酸序列编码转化酶的附加型和/或基因组整合的拷贝。
异源多肽能够将非磷酸化蔗糖,即未修饰形式的蔗糖水解成果糖和葡萄糖。在一个实施方式中,异源多肽是转化酶。异源多肽本身不转运蔗糖并且不编码完整的蔗糖利用系统。在另一个实施方式中,转化酶酶能够水解非磷酸化蔗糖。在这方面,本发明的转化酶是能够在细胞的周质空间和/或细胞外侧将蔗糖水解成果糖和葡萄糖的转化酶。此外,在实施方式中,所述转化酶的表达使得能够利用蔗糖作为本发明的基因修饰细胞的主要和/或唯一碳源和/或作为主要和/或唯一能源。就此而言,在实施方式中,本发明的基因修饰细胞不包含完整的蔗糖利用系统。
此外,在基因修饰细胞中,内源性葡萄糖转运系统完全或部分失活。因此,在一个优选的实施方式中,编码细胞质膜葡萄糖通透酶的基因修饰细胞的ptsG基因完全或部分失活。
在本发明优选的实施方式中,根据本公开的基因修饰细胞还能够产生一种或多种人乳寡糖(HMO)。
在一个实施方式中,异源多肽是SEQ ID NO:1或2中任一个,或SEQ ID NO:1或2中任一个的功能同源物,其氨基酸序列与SEQ ID NO:1或2中任一个具有至少70%同一性。
在目前优选的实施方式中,异源多肽是来自鸡禽杆菌(Avibacteriumgallinarum)的糖苷水解酶家族32蛋白,如SEQ ID NO:1(SacC Agal)所示,或其氨基酸序列与SEQ ID NO:1具有至少70%,例如至少80%,例如至少85%,例如至少90%,例如至少95%或例如至少99%同一性的功能同源物。
在另一个本发明优选的实施方式中,异源多肽是来自球形节杆菌IFO 3062(Arthrobacter globiformis IFO 3062)的β-呋喃果糖苷酶蛋白,如SEQ ID NO:2(Bff)所示,或其氨基酸序列与SEQ ID NO:2具有至少70%,例如至少80%,例如至少85%,例如至少90%,例如至少95%或例如至少99%同一性的功能同源物。
异源核酸序列还可包含用于调控异源核酸序列的表达的调控元件,其包含例如一个或多个诱导型启动子序列和/或一个或多个组成型启动子序列。调控元件可以是选自以下的启动子:如表6中所示的PglpF(SEQ ID NO:42)或Plac(SEQ ID NO:51)或PmglB_UTR70(SEQ ID NO:38)或PglpA_70UTR(SEQ ID NO:39)或PglpT_70UTR(SEQ ID NO:40)或这些启动子的变体。
异源核酸序列还可以编码能够增强所述异源多肽连续分泌到基因修饰细胞的周质和/或发酵培养基中的信号肽。在一个优选的实施方式中,所述信号肽选自表1,优选为SEQ ID NO:28的信号肽。
通常,根据前述权利要求中任一项所述的基因修饰细胞是单细胞生物,例如原核或真核细胞。在具体的实施方式中,基因修饰细胞选自驹形氏酵母属Komagataella、克鲁维酵母属Kluyveromyces、耶氏酵母属Yarrowia、毕赤酵母属Pichia、酵母菌属Saccharomyces、裂殖酵母属Schizosaccharomyces或汉逊酵母属Hansenula的酵母细胞,或选自曲霉属Aspargillus、镰刀菌属Fusarium或木霉菌属Thricoderma的丝状真菌。或者,在实施方式中,基因修饰细胞选自埃希氏杆菌属Escherichia sp.、芽孢杆菌属Bacillussp.、乳酸杆菌属lactobacillus sp.和弯曲杆菌属Campylobacter sp.。具体地,根据本公开内容的基因修饰细胞可以是大肠杆菌。
本发明还涉及根据本发明的基因修饰细胞用于生物合成生产的用途。具体地,本发明涉及一种或多种HMO的生物合成生产。在这方面,本发明涉及用于生物合成生产一种或多种HMO的方法,该方法包括步骤:a)提供根据本发明的基因修饰细胞,b)在含有蔗糖作为碳源的合适的细胞培养基中培养(a)的细胞,和c)收获步骤(b)中产生的HMO。因此,在本发明的用于生物合成生产一种或多种HMO的方法中,步骤a)的基因修饰细胞中的转化酶本身能够在基因修饰细胞的细胞外侧和/或周质空间中将蔗糖水解成果糖和葡萄糖,并且其中所述酶的表达足以使得能够利用蔗糖作为所述基因修饰细胞的碳源和/或能源。因此,在实施方式中,步骤b)中的蔗糖是主要和/或唯一的碳源和/或能源。
或者,本发明还涉及在能够产生所需生物合成产物的基因修饰宿主细胞中进行生物合成生产的方法,该方法包括步骤:a)提供能够产生所需生物合成产物的非利用蔗糖(Suc-)宿主细胞或利用蔗糖的能力有限和/或低效的宿主细胞,b)将编码转化酶的异源核酸序列引入所述宿主细胞中,其中所述转化酶是包含SEQ ID NO:1的氨基酸序列或由其组成的SacC Agal,或其氨基酸序列与SEQ ID NO:1具有至少80%同一性的功能同源物,任选地其中所述宿主细胞的编码葡萄糖通透酶的ptsG基因完全或部分失活,c)在合适的细胞培养基中培养(b)的细胞,所述培养基含有蔗糖作为碳源,作为主要和/或唯一碳源,和/或作为能源,作为主要和/或唯一能源,和d)收获步骤c)中产生的生物合成产物。
根据本公开的修饰细胞可用于表达如本文所述的异源多肽,其可被收获、纯化和/或分离并用于从蔗糖体外生产果糖和葡萄糖。
根据本公开内容的修饰细胞可用于生产果糖和葡萄糖。
根据本公开内容的修饰细胞可以用于一种或多种HMO的生物合成生产。
因此,本发明还涉及能够将蔗糖水解成葡萄糖和果糖的转化酶,用于生物合成生产,其中所述转化酶是包含SEQ ID NO:1的氨基酸序列或由其组成的SacC Agal,或其氨基酸序列与SEQ ID NO:1具有至少80%同一性的功能同源物。此外,所述转化酶能够在生物合成生产中使用的细胞的周质空间和/或细胞外侧将非磷酸化蔗糖水解为果糖和葡萄糖。因此,本发明的转化酶还可用于一种或多种HMO的生物合成生产。
因此,本公开还涉及用于生物合成生产一种或多种HMO的方法,该方法包括步骤:(a)提供根据本公开的基因修饰细胞,(b)在含有蔗糖作为一种、或作为主要、或甚至作为唯一碳源的合适的细胞培养基中培养(a)的细胞,和(c)收获步骤(b)中产生的HMO。
附图说明
图1
基因修饰细胞能够通过简单地表达单一异源酶来利用蔗糖作为能源和碳源,如本公开内容的框架中所描述的。此类异源酶的可能定位由数字指示符表示:细胞外部(1)、周质(2)或细胞质(3)。
图2
大肠杆菌细胞在蔗糖上的批量生长曲线,这些细胞表达或不表达能够利用蔗糖作为主要和/或唯一碳源和/或能源的蛋白质。ScrYA-ScrBR:如WO2015/197082中所述的蔗糖利用技术,SacC_Msuc&SacA_Bsuc:如WO2009/078687A2中所述的用于蔗糖水解的酶,SacC_Agal&Bff:如本公开中所述的用于蔗糖利用的酶。
图3
表达酶SacC_Agal或蔗糖利用系统ScrBRYA的大肠杆菌细胞在蔗糖上的批量生长曲线。ScrYA-ScrBR:如WO2015/197082中所述的蔗糖利用技术,SacC_Agal(x1、x2、x3):如本公开中所述的用于蔗糖利用的酶。括号内提供了不同菌株中SacC_Agal基因的拷贝数;x1表示一个SacC_Agal拷贝,x2表示两个SacC_Agal拷贝,x3表示三个SacC_Agal拷贝。
图4
在分批模式培养物中,表达或不表达能够利用蔗糖作为碳源和/或能源,和/或作为主要和/或唯一碳源和/或能源的蛋白质的菌株在蔗糖上的相对生长速率。ScrYA-ScrBR:如WO2015/197082中所述的蔗糖利用技术,SacC_Msuc&SacA_Bsuc:如WO2009/078687A2中所述的用于蔗糖水解的酶,SacC_Agal和Bff:如本公开中所述的用于蔗糖利用的酶。括号内提供了不同菌株中SacC_Agal基因的拷贝数;x1表示一个SacC_Agal拷贝,x2表示两个SacC_Agal拷贝,x3表示三个SacC_Agal拷贝。
图5
与表达该酶或蔗糖利用系统ScrBRYA(MP2)的大肠杆菌细胞相比,在PlgpF启动子(MP9和MP10)控制下或在Pscr启动子(MP11和MP12)控制下表达两个SacC_Agal拷贝的大肠杆菌细胞的LNnT相对产量(最大表达设置为100%)。此外,MP10和MP12有ptsG基因缺失。
图6
菌株MP13、MP14和MP15在蔗糖上的生长。大肠杆菌细胞在蔗糖上的批量生长曲线,这些细胞表达或不表达能够利用蔗糖作为主要和/或唯一碳源和/或能源的蛋白质。菌株MP13不能利用蔗糖,而菌株MP14和MP15分别从一个或两个PglpF驱动基因组拷贝表达细胞外蔗糖水解酶SacC_Agal。
具体实施方式
本公开提供了在微生物生物合成过程中,使用蔗糖作为,和/或作为主要和/或甚至唯一碳源和/或能源的新方法。之前尝试创建例如可以依靠蔗糖生存和生长的非致病性大肠杆菌Suc+菌株的生产力通常低于Suc-菌株和/或需要将包括几个异源基因的完整系统引入宿主细胞。
本公开首次公开了非蔗糖利用(Suc-)细胞或蔗糖利用效率低的细胞的基因修饰,其使得细胞在表达单一异源多肽后能够有效地利用蔗糖作为能源和/或碳源。单一异源多肽在表达后从胞质溶胶易位至细胞外空间和/或胞质膜和/或周质膜,并且能够将蔗糖水解成果糖和葡萄糖。因此,本公开首次公开了基因修饰细胞,其在修饰之前是非蔗糖利用(Suc-)或者其在修饰之前仅有限和/或低效地能够利用蔗糖,其在表达单一异源多肽后变得能够利用蔗糖作为能源和/或碳源,其在表达后从胞质溶胶易位至细胞外空间和/或胞质膜和/或周质膜,并且能够将蔗糖水解成果糖和葡萄糖。
本发明的一个方面涉及基因修饰细胞,其包含编码异源多肽酶、优选转化酶的异源核酸序列,其在表达后本身以足够的量位于细胞外、周质和/或膜结合或膜嵌入中,并且其中所述异源多肽酶能够在基因修饰细胞的细胞外侧和/或周质中将蔗糖水解成果糖和葡萄糖,并且其中所述异源多肽酶的进一步表达足以使蔗糖能够用作所述基因修饰细胞的碳源和/或能源。在一个优选的实施方式中,异源多肽酶位于基因修饰细胞的细胞外和/或周质中。
在这方面,本发明还涉及包含编码转化酶的异源核酸序列的基因修饰细胞,其中所述转化酶是包含SEQ ID NO:1的氨基酸序列或由其组成的SacC Agal,或其氨基酸序列与SEQ ID NO:1具有至少80%同一性的功能同源物。
能够水解蔗糖的新的有效多肽的鉴定是非常有利的,因为它允许在大规模生物合成生产过程中经济高效地使用蔗糖,该有效多肽本身能够使基因修饰前(Suc-)细胞或仅有限利用蔗糖的细胞利用蔗糖作为碳源和/或能源,或作为主要和/或唯一碳源和/或能源,即不需要将协助蔗糖利用到细胞中的其他异源多肽引入,所述异源多肽例如转运蛋白、孔蛋白、通透酶、激酶和/或磷酸转移酶系统(PTS)。使用蔗糖作为碳源的优点是成本低。此外,将避免当使用葡萄糖作为碳源时可能成为问题的葡萄糖降解产物,而当使用蔗糖作为碳源时很少观察到基于蔗糖的杂质。蔗糖还可能具有其他好处,例如使蛋白质能够保留其二级结构并防止有害的外部因素。
先前将suc-大肠杆菌菌株转化为suc+菌株的努力需要掺入几个异源基因,例如,称为完整蔗糖利用盒系统,例如PTS系统,其组合允许基因修饰细胞利用蔗糖作为唯一碳源和/或唯一能源。这些系统通常包含一种或多种孔蛋白、一种或多种通透酶和一种或多种磷酸糖基水解酶的掺入。孔蛋白和转运蛋白促进蔗糖跨细胞膜的主动运输,一旦进入细胞质,蔗糖就会发生磷酸化(6-P-蔗糖),以便被蔗糖-6-P水解酶识别,从而促进蔗糖-6-P水解成葡萄糖-6-P和果糖,从而使葡萄糖-6-P掺入到中心碳代谢中。因此,这些系统需要掺入多个异源基因,依赖于通过异源转运蛋白将蔗糖主动转运到胞质溶胶中,并且蔗糖的磷酸化被能够水解蔗糖-6-P的特定糖苷水解酶识别。
蔗糖的利用
本公开涉及向天然不含有相关基因的宿主生物体提供利用蔗糖的新能力或增强已经存在但低效的蔗糖利用能力的简单且有效的方法。
因此,本发明的基因修饰细胞具有编码能够在细胞胞质溶胶外水解蔗糖的异源多肽(酶)的单一基因,从而为细胞提供分解代谢利用蔗糖作为碳源以及能源的能力,而不将蔗糖转运到细胞的胞质溶胶中。
使细胞能够利用蔗糖的基因是异源基因(即,源自不同的生物体并通过常规重组DNA操作技术转移至基因修饰细胞)。
在本发明的一种实施方式中,细胞表达的能够水解蔗糖的酶位于细胞的周质中或细胞外空间中。
通常,Suc+微生物可利用两种蔗糖分解代谢。磷酸烯醇式丙酮酸-糖磷酸转移酶系统(PEP-PTS)系统和非PTS系统。在磷酸烯醇式丙酮酸(PEP)依赖性磷酸转移酶系统(“PTS”)中,蔗糖通过蔗糖特异性PEP依赖性磷酸转移酶转运通过质膜,而在非PTS系统中,蔗糖被蔗糖通透酶吸收。与此同时,蔗糖在胞质溶胶中被磷酸化,生成细胞内的蔗糖-6-磷酸,其被水解为葡萄糖-6-磷酸和果糖,然后直接进入细胞的中心碳代谢。
然而,本发明涉及转化酶或蔗糖-6-磷酸水解酶的用途,其在表达后从胞质溶胶易位至胞质膜、周质膜和/或细胞外空间,并且其允许细胞利用蔗糖作为碳源和能源,而不需要将蔗糖转运至胞质溶胶中。而且,转化酶本身不需要蔗糖在水解前被磷酸化。
因此,本发明有利于宿主细胞在细胞质、周质或细胞外培养基中从头或至少改进蔗糖水解,从而为细胞提供葡萄糖和果糖形式的碳源和能源。
使用能够在不能吸收蔗糖的基因修饰细胞的细胞外侧或周质中将蔗糖水解成果糖和葡萄糖的蔗糖水解酶的优点是,大规模的分批补料和连续工艺中出现的高浓度糖的局部梯度(Lara等人2006,Molecular Biotechnology 34:p355-381)不能立即获得生产细胞。
相反,蔗糖仅受到存在于梯度内的一小部分水解酶的作用,因此蔗糖以非常低的速率水解。这反过来又推迟了蔗糖水解,直到蔗糖更均匀地分布在发酵容器中并暴露于更大部分的输出水解酶。从蔗糖延迟释放葡萄糖和果糖导致代谢可用糖梯度的减少或消除,从而减少或消除细胞中的溢出代谢。当由于进料混合不充分而出现碳源梯度时,在大规模发酵中会引发溢出代谢,导致乙酸盐等代谢物的形成并增加维持能量需求,进而影响细胞生长和产品产量。因此,本发明的蔗糖水解酶的使用可以在大规模发酵中产生更稳定的生产宿主,并具有更高的产品产量。
本发明表明,这可以通过降低细胞外形成的葡萄糖的摄取率来进一步改善,例如通过删除葡萄糖转运蛋白基因,例如编码天然大肠杆菌PTS系统的葡萄糖特异性EIICB成分的ptsG。不受理论的束缚,据信ptsG的缺失降低了细胞的葡萄糖摄取速率,从而限制了细胞中葡萄糖-6-磷酸的形成速率,因此额外地减少了溢出代谢。
实施例清楚地表明,本文首次公开的在基因修饰细胞的细胞外侧或周质中使用能够将蔗糖水解成果糖和葡萄糖的单一多肽的方法优于现有技术中描述的使用PEP-PTS系统。
作为唯一碳源
本发明的基因修饰细胞可以利用蔗糖作为唯一的碳源,从而在发酵过程中不依赖于添加其他糖。相反,细胞可以利用蔗糖水解产生的果糖和葡萄糖作为碳源。
细胞外、周质和/或膜结合或膜嵌入的异源多肽。
在实施本发明时,编码能够水解蔗糖的异源多肽的异源核酸可以在胞质溶胶、周质和/或胞外表达,只要其能够利用蔗糖作为本发明的基因修饰细胞中的主要和/或唯一碳源和/或能源的功能得以保留。异源多肽的功能是它水解蔗糖,并且当它是转化酶时,它水解非磷酸化蔗糖。异源多肽表达后,它被易位到细胞外培养基。然而,在这个过程中,它也可以发挥其蔗糖水解功能,因此至少在某种程度上水解胞质溶胶和/或周质中的蔗糖。如果在活性多肽被输出到细胞的周质或细胞外侧之前发生蔗糖被动转运到胞质溶胶中,则胞质溶胶中的蔗糖水解可能在有限程度上发生。
当根据本公开易位至膜时,酶将嵌入所述膜中和/或附着至其上。该酶可以穿透膜(跨膜)或与膜的一侧或另一侧结合(整体单位)。酶可以与细胞膜整体地、外周地或瞬时地结合。
在本发明的另一个实施方式中,能够水解蔗糖的酶是可溶的(即非膜结合的)并且位于细胞的周质中或细胞外空间中。
在本文中,膜是周质膜和/或胞质膜。
在一个实施方式中,本发明的异源多肽嵌入和/或附着于膜,其中所述膜是质膜、周质膜和/或胞质膜。在一个实施方式中,膜是质膜,并且酶锚定、嵌入和/或附着在膜的周质侧、细胞外侧和/或胞质侧。
在本公开的上下文中,膜可以是胞质/内膜和/或周质/外膜,只要其中嵌入和/或附着多肽的膜允许多肽发挥其功能即可。如果异源多肽与基因修饰细胞的胞质/内膜结合,则其优选位于面向周质空间的一侧。
术语“不编码蔗糖利用系统”。
如上所述,蔗糖作为主要和/或唯一的碳源和/或能源的利用可以通过磷酸烯醇式丙酮酸依赖性糖磷酸转移酶(PEP-PTS)系统的表达来获得,该系统是需要4种不同酶相互作用的多组分系统。一个例子是scr PEP-PTS系统(WO2015/197082),其中基因scrA编码蔗糖转运蛋白酶IIScr,其通过穿过细胞膜的主动转运和伴随的磷酸化从细胞外蔗糖提供细胞内蔗糖-6-磷酸。蔗糖特异性ScrY孔蛋白(由scrY编码)促进蔗糖通过外膜扩散。ScrB转化酶(由scrB编码)通过水解将积累的蔗糖-6-磷酸分裂为葡萄糖-6-磷酸和果糖。阻遏蛋白(由scrB编码)负向控制scrYAB基因的表达,并由蔗糖或果糖或包含以下基因的WO2014/067696中描述的大肠杆菌csc PEP-PTS系统诱导:蔗糖通透酶、果糖激酶、蔗糖水解酶和转录抑制因子(分别为cscB、cscK、cscA和cscR基因)。然而,PEP-PTS系统不在本发明的范围内,因为它需要表达多种不同的异源多肽,以使得在插入多个基因之前不能利用蔗糖或至少不能有效利用蔗糖(即,不作为主要和/或唯一碳源和/或能源)的细胞能够利用蔗糖作为主要和/或唯一碳源和/或能源。因此,本发明涉及如上所述的基因修饰细胞,其中异源核酸序列不编码完整的蔗糖利用系统,即其中细胞不编码scrYABR(例如SEQ ID NO:65至68)或cscBKAR。
因此,在一个实施方式中,本发明涉及如上所述的基因修饰细胞,其中所述基因修饰细胞不表达完整的多组分蔗糖利用系统,其包含孔蛋白、蔗糖转运蛋白和不能水解非磷酸化蔗糖的转化酶。在另一个实施方式中,本发明涉及如上所述的基因修饰细胞,其中所述基因修饰细胞不包含一种或多种包含蔗糖利用系统的异源核酸序列,所述蔗糖利用系统包含孔蛋白、蔗糖转运蛋白和不能水解非磷酸化蔗糖的转化酶。
在本发明的一个实施方式中,能够水解蔗糖的酶不是scrB(例如SEQ ID NO:67)或cscA。
异源多肽
如实验部分所证明的,本公开内容鉴定了异源来源的多肽,其本身能够在基因修饰宿主细胞(该宿主细胞先前(Suc-)或仅有限或低效地利用蔗糖)中利用蔗糖作为主要和/或唯一的碳源和/或能源,即,不需要将异源完全蔗糖利用系统,例如但不限于完全蔗糖利用盒引入宿主细胞。
因此,本发明的异源多肽涉及能够自身水解蔗糖的酶。具体地,本发明的异源多肽涉及能够水解非磷酸化蔗糖的酶。
通常,所述酶是转化酶。特别地,所述酶是能够在细胞内、周质和细胞外发挥其功能的转化酶。再次特别地,本文描述的异源多肽涉及转化酶,其在表达时从胞质溶胶易位至胞外空间和/或胞质膜和/或周质膜,并且其能够在细胞外或周质空间中将蔗糖(例如非磷酸化蔗糖)水解成果糖和葡萄糖。
就本发明而言,术语转化酶涉及能够水解β-D-呋喃果糖苷中的末端非还原性β-D-呋喃果糖苷残基,例如蔗糖中的β-D-呋喃果糖苷残基,如酶条目(enzyme entry)EC3.2.1.26所述。
在本发明的一个实施方式中,转化酶有利于非磷酸化蔗糖的水解。
在本发明的另一个实施方式中,所述酶是分类为EC 3.1B3的蔗糖6-磷酸水解酶,根据本公开,其令人惊讶地可以充当将非磷酸化蔗糖水解成果糖和葡萄糖的转化酶。或者,所述酶充当胞外蔗糖-6-磷酸水解酶。
因此,本公开的异源多肽能够通过在宿主细胞的细胞外和/或周质中催化蔗糖产生葡萄糖和果糖来利用蔗糖作为主要和/或唯一的碳源和/或能源。
本公开公开了两个示例性异源多肽序列,其允许在先前不能或仅低效地能够利用蔗糖作为能源和/或碳源的细胞中利用蔗糖作为能源和碳源。正如实验部分所证明的,这是在没有任何进一步的基因修饰的情况下实现的,旨在以其他方式帮助促进蔗糖作为能源和/或碳源的利用。
在本发明优选的实施方式中,异源多肽是来自鸡禽杆菌(Avibacteriumgallinarum)的氨基酸序列如SEQ ID NO:1所示(SacC_Agal)的糖苷水解酶家族32(GH32)蛋白,或其氨基酸序列与SEQ ID NO:1具有至少70%,例如至少80%,例如至少85%,例如至少90%,例如至少95%,例如至少98%,例如至少99%或例如至少99.9%同一性的功能同源物。
在另一个目前优选的实施方式中,异源多肽是来自球形节杆菌IFO 3062(Arthrobacter globiformis IFO 3062)的β-呋喃果糖苷酶蛋白,如SEQ ID NO:2(Bff)所示,或其氨基酸序列与SEQ ID NO:2具有至少70%,例如至少80%,例如至少85%,例如至少90%,例如至少95%,例如至少98%,例如至少99%或例如至少99.9%同一性的功能同源物。
SacC_Agal和Bff
目前鉴定的能够实施所描述的本发明的异源多肽在本文中被鉴定为“SacC_Agal”和“Bff”。
本文中如SEQ ID NO:1所示的称为SacC_Agal的多肽与GeneBankID:WP_103853210.1具有100%同一性,并且特征在于作为糖苷水解酶和蔗糖-6-磷酸水解酶,并且根据本公开能够充当水解未修饰的蔗糖的转化酶。
本文中如SEQ ID NO:2所示的称为Bff的多肽与GeneBank ID:BAD18121.1具有100%同一性,属于β-呋喃果糖苷酶蛋白,如本公开的实施例1所示,其能够利用蔗糖作为本公开的基因修饰细胞的主要和/或唯一的碳源和主要和/或唯一的能源。
因此,在目前优选的实施方式中,本发明涉及表达异源多肽的基因修饰细胞,所述异源多肽选自SEQ ID NO:1、SEQ ID NO:2和SEQ ID NO:1或2中任一个的功能同源物,其氨基酸序列与SEQ ID NO:1或2中任一个具有至少70%,例如至少80%,例如至少85%,例如至少90%,例如至少95%,例如至少98%同一性。
在另一个优选的实施方式中,本发明涉及包含编码异源多肽的异源核酸序列的基因修饰细胞,其中所编码的多肽是来自鸡禽杆菌的糖苷水解酶家族32蛋白,如SEQ ID NO:1[SacC_Agal]所示,或其功能同源物,其氨基酸序列与SEQ ID NO:1具有至少80%,例如至少81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98或99%同一性。
在另一个优选的实施方式中,本发明涉及包含编码异源多肽的异源核酸序列的基因修饰细胞,其中所编码的多肽是来自球状节杆菌IFO 3062的β-呋喃果糖苷酶蛋白,如SEQID NO:2[Bff]所示,或其功能同源物,其氨基酸序列与SEQ ID NO:2具有至少80%,例如至少81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98或99%同一性。
功能同源物
SEQ ID NO:1中所示的多肽SacC_Agal的功能同源物或SEQ ID NO:2中所示的多肽Bff的功能同源物可以例如是:通过诱变获得。与具有如SEQ ID NO:1或SEQ ID NO:2所示的氨基酸序列的多肽的功能性相比,功能同源物应具有至少5%,例如10%、15%、20%、25%、30%、35%、40%、50%、60%、70%、80%、90%或100%的剩余功能性。与具有如SEQ ID NO:1和/或SEQ ID NO:2所示的氨基酸序列的多肽的功能性相比,功能同源物可以具有更高的功能性。如SEQ ID NO:1或SEQ ID NO:2所示的氨基酸序列的多肽的功能同源物应能够利用蔗糖作为基因修饰细胞的主要和/或唯一的碳源和作为能源,作为主要和/或唯一的能源。
如实验部分所证明的,通过将根据本发明的异源多肽引入不能依靠蔗糖生长的宿主细胞(即(Suc-)菌株)中,然后以分批模式并在选定的培养条件(例如但不限于在28℃下,在含有例如15g/L蔗糖作为主要或唯一碳源和/或能源的培养基中)培养基因修饰的菌株,可以容易地测试功能性。
为了消除本领域技术人员未知的(Suc-)菌株已经包含若干异源基因的可能性,这些异源基因是完整的蔗糖利用盒系统或PEP-PTS系统的一部分但不足以作为完整的蔗糖利用盒系统或PEP-PTS系统,其与另外的异源多肽组合将允许基因修饰细胞利用蔗糖作为主要和/或唯一的碳源和/或能源,可以进行简单的PCR测试来鉴定此类组分。
异源融合多肽
本发明的异源多肽还可以是重组两个或更多个异源多肽的异源融合多肽,其中例如多肽的一部分是跨膜或膜嵌入的多肽,并且重组多肽的第二部分是异源多肽,如上所述,能够水解蔗糖,例如Bff或SacC_Agal。因此,在一个实施方式中,本发明的转化酶重组成融合多肽,其中一个片段引导和/或锚定和/或插入融合多肽到特定的细胞膜中。根据本发明,膜可以是周质膜和/或胞质膜。
在其中异源多肽是融合多肽的一部分的实施方式中,融合多肽的其他部分本身不是异源多肽的部分,因此当如本文所述确定氨基酸序列同一性时不计数。
信号肽
根据本公开的重组融合多肽可以例如包含酶和信号肽,信号肽可以起到提示宿主细胞在胞质溶胶中表达后易位酶的作用。一般而言,信号肽可将表达的多肽引导至特定的细胞区室和/或细胞器、周质或示意细胞排泄。在本文中,信号肽优选将表达的多肽引导至质膜、周质膜、周质或细胞排泄。
信号肽通常长16-30个氨基酸,存在于新合成的多肽的N末端。关于本发明的核酸构建体,信号肽由可以与编码根据本发明的多肽的异源核酸序列可操作地连接的核酸序列编码。信号肽还可以是多肽标签,其氨基酸序列包含超过30个氨基酸。
信号肽充当多肽标签以促进本发明的多肽的选择性分泌,例如促进本发明的多肽的分泌的多肽标签,即促进Bff和/或SacC_Agal的分泌。
就本发明而言,其中所编码的多肽能够水解蔗糖,有利于将多肽分泌到周质或细胞外空间中,因为蔗糖仅能够以非常低的程度从外部渗透到细胞中,这不会或至少仅非常有限地促进细胞利用蔗糖作为碳源和/或能源。
信号肽通常选自但不限于下表1中列出的信号序列。
表1:可用于与本发明的异源多肽组合的信号序列
在一个实施方式中,异源多肽是包含信号序列的融合多肽的一部分,其中信号序列本身不是异源多肽的一部分,因此当如本文所述确定氨基酸序列同一性时不计数。
在一个优选的实施方式中,编码本发明的异源酶(例如SacC_Agal或Bff)的异源核酸序列还编码SEQ ID NO:28的信号肽,优选地在本发明的异源酶的N端,或者在本发明的异源酶的C端。
核酸构建体
本发明的异源多肽由包含编码单独的异源多肽的核酸序列的核酸构建体表达。本发明的核酸构建体可以进一步包含另外的元件,例如确保多肽适当表达水平的调控序列以及编码一种或多种信号肽、确保本发明表达的多肽的易位和/或适当分选和/或分泌的核酸序列。因此,本发明还涉及核酸构建体,其在插入(Suc-)宿主细胞或插入仅低效利用蔗糖的宿主细胞后,使得所述基因修饰细胞能够利用蔗糖作为主要和/或唯一的碳源和/或能源。
根据本公开的核酸构建体可以是载体DNA的一部分。在另一个实施方式中,核酸构建体是整合到宿主细胞基因组中的表达盒/盒。因此,在本上下文中,术语“核酸构建体”是指人工构建的核酸片段,特别是旨在被引入宿主细胞例如微生物细胞中的核酸片段。在本发明的上下文中,核酸构建体包含编码异源多肽的重组和/或异源核酸序列。
通常,重组和/或异源核酸序列基本上包含一种或多种非编码核酸序列,所述非编码核酸序列包含调控核酸序列,例如但不限于启动子核酸序列,和一种或多种编码目的基因的编码核酸序列,例如蔗糖水解酶,其在插入(Suc-)宿主细胞或仅低效利用蔗糖的宿主细胞后,使所述基因修饰细胞能够利用蔗糖作为主要和/或唯一的碳源和/或能源,优选地作为主要和/或唯一碳源和/或能源。
另外,重组和/或异源核酸序列还可包含可用于在基因修饰细胞中产生人乳寡糖(HMO)的非编码和/或编码序列,例如但不限于编码糖基转移酶。或者,可用于在基因修饰细胞中产生HMO的所述非编码和/或编码序列通过另一核酸序列可被引入和/或可已被引入宿主细胞中。在一个实施方式中,基因修饰细胞包含至少一种选自具有以下酶活性的重组糖基转移酶:α-1,2-岩藻糖基转移酶、α-1,3-岩藻糖基转移酶、α-1,3/4-岩藻糖基转移酶、α-1,4-岩藻糖基转移酶、α-2,3-唾液酸转移酶、α-2,6-唾液酸转移酶、β-1,3-N-乙酰葡糖胺基转移酶、β-1,6-N-乙酰葡糖胺基转移酶、β-1,3-半乳糖基转移酶和β-1,4-半乳糖基转移酶。适合于生产HMO的糖基转移酶在下文“一种或多种HMO的生物合成生产中的功能酶”部分中描述。
就本发明而言,术语“异源”是指对于细胞或生物体来说是外源的多肽、氨基酸序列、核酸分子、核酸序列或核苷酸序列,即,在所述细胞或生物体中天然不存在的多肽、氨基酸序列、核酸分子、核酸序列或核苷酸序列。如本文所用,“异源序列”或“异源核酸”或“异源多肽”是对于特定宿主细胞来说的外来来源(例如,来自不同个体、菌株或物种),或者如果其源自相同来源,则从其原始形式被修饰。因此,可操作地连接至启动子的异源核酸来自与启动子的来源不同的来源,或者,如果来自相同来源,则从其原始形式被修饰。异源序列可以例如通过转染、转化、缀合或转导稳定地引入微生物宿主细胞的基因组中,从而使宿主细胞成为基因修饰宿主细胞。可以应用取决于宿主细胞以及待引入的序列的技术。各种技术是本领域技术人员已知的并且例如公开于Sambrook等人,分子克隆:实验室手册,第二版,冷泉港实验室出版社,冷泉港,纽约(1989)中。
在这方面,根据本公开内容的核酸构建体在目前优选的实施方式中是包含以下的核酸构建体,
a)编码异源多肽的核酸序列,所述异源多肽在表达后位于细胞外、周质和/或膜结合或膜嵌入并且能够将蔗糖水解成果糖和葡萄糖,其中所述多肽的表达使得基因修饰细胞能够利用蔗糖作为主要和/或唯一碳和/或作为主要和/或唯一能源,和
b)包含调控元件的核酸序列,能够调节所述核酸序列的表达,和任选地
c)编码信号肽的核酸序列,所述信号肽使得所述多肽能够连续分泌到基因修饰细胞的周质中和/或发酵培养基中。
在一个实施方式中,根据本公开的核酸构建体包含编码如SEQ ID NO:1所示的异源多肽或其功能同源物的核酸序列,其中功能同源物的氨基酸序列与SEQ ID NO:1具有至少70%,例如至少80%,例如至少85%,例如至少90%,例如至少95%,例如至少98%同一性。在另一个实施方式中,本公开的核酸构建体包含编码如SEQ ID NO:2所示的异源多肽或其功能同源物的核酸序列,其中功能同源物的氨基酸序列与SEQ ID NO:2具有至少70%,例如至少80%,例如至少85%,例如至少90%,例如至少95%,例如至少98%同一性。
在一个优选的实施方式中,根据本发明的核酸构建体包含,
a)编码转化酶的核酸序列,其中所述转化酶是包含SEQ ID NO:1的氨基酸序列或由其组成的SacC Agal,或其氨基酸序列与SEQ ID NO:1具有至少80%同一性的功能同源物,和
b)包含调控元件的核酸序列,该调控元件能够调节所述核酸序列的表达,和任选地
c)编码信号肽的核酸序列,该信号肽使得所述多肽能够连续分泌到基因修饰细胞的周质中和/或发酵培养基中。
在一个实施方式中,b)中的调控元件是启动子序列。
在目前优选的实施方式中,根据本发明的核酸构建体包含,
a)编码转化酶的核酸序列,其中所述转化酶是包含SEQ ID NO:1的氨基酸序列或由其组成的SacC Agal,或其氨基酸序列与SEQ ID NO:1具有至少80%同一性的功能同源物,和
b)包含调控元件的核酸序列,能够调节所述核酸序列的表达,其中所述调控元件是选自表6中示出的PglpF(SEQ ID NO:42)或Plac(SEQ ID NO:51)或PmglB_UTR70(SEQ IDNO:38)或PglpA_70UTR(SEQ ID NO:39)或PglpT_70UTR(SEQ ID NO:40)或这些启动子的变体,和任选地
c)编码信号肽的核酸序列,其中信号肽选自表1,优选SEQ ID NO:28的信号肽。
在另一个优选的实施方式中,根据本发明的核酸构建体包含,
a)编码转化酶的核酸序列,其中所述转化酶是包含SEQ ID NO:2的氨基酸序列或由其组成的Bff,或其氨基酸序列与SEQ ID NO:2具有至少80%同一性的功能同源物,和
b)包含调控元件的核酸序列,该调控元件能够调节所述核酸序列的表达,其中调控元件是选自表6中示出的PglpF(SEQ ID NO:42)或Plac(SEQ ID NO:51)或PmglB_UTR70(SEQ ID NO:38)或PglpA_70UTR(SEQ ID NO:39)或PglpT_70UTR(SEQ ID NO:40)或这些启动子的变体,和任选地
c)编码信号肽的核酸序列,其中信号肽选自表1,优选SEQ ID NO:28的信号肽。
此外,本发明的核酸构建体可以整合到基因修饰细胞的基因组中,或者它可以包含在表达载体中,例如细菌质粒、人工染色体、噬菌粒和/或另一种病毒载体中。
如本文所用,术语“核酸”和“多核苷酸”是指单链或双链形式的脱氧核糖核苷酸或核糖核苷酸聚合物,并且除非另有限制,涵盖以类似于天然存在的核苷酸的方式与核酸杂交的天然核苷酸的已知类似物。除非另有说明,特定的核酸序列包括其互补序列。
编码酶的异源核酸序列,该酶本身能够将蔗糖水解成果糖和葡萄糖
在一个实施方式中,本发明的核酸构建体编码一种多肽,该多肽是来自鸡禽杆菌的糖苷水解酶家族32蛋白,如SEQ ID NO:1[SacC_Agal]所示,或其氨基酸序列与SEQ IDNO:1具有至少80%同一性的功能同源物。因此,该核酸构建体包含SEQ ID NO:3[SacC_Agal]的核酸序列,或与SEQ ID NO:3[SacC_Agal]具有至少70%序列同一性的核酸序列,例如与SEQ ID NO:3[SacC_Agal]具有至少75%、例如至少80%、例如至少85%、例如至少90%、例如至少95%、或例如至少99%序列同一性。
在一个实施方式中,编码SEQ ID NO:1[SacC_Agal]或其氨基酸序列与SEQ ID NO:1[SacC_Agal]具有至少80%同一性的功能同源物的核酸序列是SEQ ID NO:3[SacC_AgaI]的核酸序列。
在另一个实施方式中,本发明的核酸构建体是这样的构建体,其中所编码的多肽是来自球形节杆菌IFO 3062的β-呋喃果糖苷酶蛋白,如SEQ ID NO:2[Bff]所示,或其氨基酸序列与SEQ ID NO:2具有至少80%同一性的功能同源物。因此,核酸构建体包含SEQ IDNO:4[Bff]的核酸序列,或与SEQ ID NO:4[Bff]具有至少70%序列同一性的核酸序列,例如至少75%、例如至少80%、例如至少85%、例如至少90%、例如至少95%或例如至少99%序列同一性。在一个实施方式中,编码SEQ ID NO:2[Bff]或其氨基酸序列与SEQ ID NO:2[Bff]具有至少80%同一性的功能同源物的核酸序列是SEQ ID NO:4[Bff]的核酸序列。
确定序列同一性
在两个或更多个核酸或氨基酸序列的上下文中,术语“[某一]的序列同一性%”是指当在核酸或氨基酸的比较窗口或指定序列上以获得最大对应性进行比较和比对时,两个或更多个序列具有给定百分比的共同核苷酸或氨基酸(即,序列具有至少90%同一性)。核酸或氨基酸序列的百分比同一性可以使用具有默认参数的BLASTn或BLASTp序列比较算法来测量,或者通过手动比对和目视检查来测量(参见例如http://www.ncbi.nlm.nih.gov/BLAST/)。该定义也适用于测试序列的互补序列和具有删除和/或添加的序列,以及具有取代的序列。适合确定百分比同一性和比对的算法的一个示例是BLAST 2.2.20+算法,该算法在Altschul等人.Nucl.Acids Res.25,3389(1997)中进行了描述。BLAST 2.2.20+用于确定本发明的核酸和/或氨基酸的序列同一性百分比。用于执行BLAST分析的软件可通过国家生物技术信息中心(http://www.ncbi.nlm.nih.gov/)公开获取。常用的序列比对算法的示例有:
CLUSTAL Omega(http://www.ebi.ac.uk/Tools/msa/clustalo/),
EMBOSS Needle(http://www.ebi.ac.uk/Tools/psa/emboss_needle/),MAFFT(http://mafft.cbrc.jp/alignment/server/),或
MUSCLE(http://www.ebi.ac.uk/Tools/msa/muscle/)。
优选地,使用Needleman-Wunsch算法(Needleman和Wunsch,1970,J.Mo/.Biol.48:443-453)确定两个氨基酸序列之间的序列同一性,如在EMBOSS包(EMBOSS:欧洲分子生物学开放软件套件,Rice等人,2000,Trends Genet.16:276-277)的Needle程序中实施,优选版本5.0.0或更高版本(可从https://www.ebi.ac.uk/Tools/psa/emboss needle/获取)。使用的参数是空位开放罚分10、空位延伸罚分0.5以及EBLOSUM62(30BLOSUM62的EMBOSS版本)替换矩阵。标记为“最长同一性”的Needle输出(使用-nobrief选项获得)用作百分比同一性,计算如下:(相同残基×100)/(比对长度-比对中的空位总数)。
为了本发明的目的,使用Needleman-Wunsch算法(Needleman和Wunsch,1970,同上)确定两个核苷酸序列之间的序列同一性,如在EMBOSS包的Needle程序(EMBOSS:欧洲分子生物学开放软件套件,Rice等人,2000,Trends Genet.16:276-277)中实施,10优选版本5.0.0或更高版本。使用的参数是空位开放罚分10、空位延伸罚分0.5和DNAFULL(NCBINUC4.4的EMBOSS版本)替换矩阵。标记为“最长同一性”的Needle输出(使用-nobrief选项获得)用作百分比同一性,计算如下:(相同的脱氧核糖核苷酸×100)/(比对长度-比对中的空位总数)。
编码酶的所述异源核酸序列的一个或多个拷贝,所述酶本身能够将蔗糖水解成果糖和葡萄糖
根据本发明的构建体的单个拷贝可能足以使基因修饰细胞能够利用蔗糖作为主要和/或唯一的碳源和/或能源,并且实现根据所公开的本发明的另外期望的效果。因此,在一些优选的实施方式中,本发明涉及包含异源核酸序列、调控元件和/或信号肽的一个、两个、三个或更多个拷贝的核酸构建体和/或基因修饰细胞。
在一些实施方式中,优选核酸构建体的单拷贝。
在这样的实施方式中,本发明涉及根据本公开内容的基因修饰细胞,其中异源核酸序列编码能够将蔗糖水解成果糖和葡萄糖的异源多肽的单拷贝。
此外,发明人在本文中公开了包含一个或多个拷贝的构建体对基因修饰细胞利用蔗糖作为主要和/或唯一的碳源和/或能源的能力的影响,所述构建体包含调控元件和编码多肽Bff或SacC_Agal的异源核酸序列,如从实施例2可见。
本发明的核酸构建体可以包含编码本发明的多肽的核酸序列的一个或多个拷贝;因此,其还可以包含一种或多种调控元件的一个或多个拷贝和/或编码一种或多种信号肽的一种或多种核酸序列。
因此,在本发明的一个实施方式中,本发明的核酸构建体是包含所述异源核酸序列的一个或多个拷贝的核酸构建体。
多于一种的异源核酸序列可以相同或不同。
因此,在本发明的一个实施方式中,基因修饰细胞包含编码多肽Bff或SacC_Agal的异源核酸序列的至少两个拷贝,例如编码多肽Bff或SacC_Agal的异源核酸序列的2、3或4个基因组整合拷贝。
增加基因修饰细胞利用蔗糖作为主要和/或唯一碳源和/或能源的能力的替代方法也可以是将核酸序列置于强启动子的控制下。
在本发明的一个实施方式中,编码多肽Bff或SacC_Agal的核酸序列处于比表6中的PglpF启动子强至少20%、例如至少50%的启动子的控制下。
在优选的实施方式中,编码多肽Bff或SacC_Agal的核酸序列受选自以下的启动子控制:PmglB_70UTR_SD8、PmglB_70UTR_SD10、PmglB_54UTR、Plac_70UTR、PmglB_70UTR_SD9、PmglB_70UTR_SD4、PmglB_70UTR_SD5、PglpF_SD4、PmglB_70UTR_SD7、PmglB_70UTR、PglpA_70UTR和PglpT_70UTR(如表6所示)。
当本发明的核酸构建体包含多于一种调控元件时,调控元件可以或可以不与编码本发明的一种或多种多肽的异源核酸序列或编码一种或多种信号肽的核酸序列可操作地连接。此外,当本发明的核酸构建体包含多于一种如上所述的异源核酸序列时,本发明的核酸构建体可以包含或可以不包含编码信号肽的一种或多种核酸序列,其可以或可以不与本发明的异源核酸序列可操作地连接。
在这个意义上,核酸构建体可以以其中序列涵盖在以下序列中的方式构建:调控元件、编码信号肽的核酸序列和编码多肽的异源核酸。编码信号肽的核酸序列也可以不存在,或者可以存在任一元件的几个拷贝,或者它们可以被改组并以不同的序列出现。
本文所用的术语“可操作地连接”应指一种核酸与第二核酸序列之间的功能性连接。这可以例如是包含调控元件的核酸序列,所述调控元件影响对应于第二序列的核酸的转录和/或翻译。
调控表达的调控元件
本发明的核酸构建体可以包含能够控制内源或异源和/或合成核酸序列的过表达的调控元件。术语“调控元件”包括启动子序列、信号序列和/或转录因子结合位点阵列,这些序列影响与调控元件可操作地连接的核酸序列的转录和/或翻译。
调控元件在转录和转录后水平建立,并进一步在这些水平上启用分子网络。例如,在转录后水平,控制mRNA稳定性、翻译和亚细胞定位的生化信号由调控元件处理。RNA结合蛋白是另一类转录后调控元件,并进一步分类为序列元件或结构元件。可用作调控元件的特定的序列基序也与mRNA修饰有关。多种DNA调控元件参与基因表达的调控,并依赖于DNA、构成染色质的细胞蛋白和转录因子的生化相互作用。
启动子和增强子是基因表达的主要基因组调控元件。启动子是基因转录起始位点(TSS)1-2千碱基(kb)范围内的DNA区域;它们含有组装RNA聚合酶转录机制所必需的短调控元件(DNA基序)。然而,如果没有位于TSS远端的DNA调控元件的贡献,转录通常是最小的。这些区域通常被称为增强子,是位置无关的DNA调控元件,它们与位点特异性转录因子相互作用,以建立细胞类型身份并调控基因表达。增强子可以通过称为成环(looping)的过程独立于其序列背景并在距其靶基因数至数百kb的距离处发挥作用。就本公开而言,调控元件可以是或可以不是翻译后调控子,或者它们可以是或可以不是翻译调控子。
在本发明的一个实施方式中,调控元件包含一种或多种能够增强根据本发明的异源核酸序列的表达的元件。
在目前优选的实施方式中,能够调控本发明的异源核酸表达的调控元件是启动子序列。
启动子序列
术语“启动子”指核酸序列,其通常位于核酸构建体中编码多肽的异源核酸序列之前,并提供起始转录成mRNA的位点。统称为“启动子”或“控制”核酸序列,这些序列位于功能性核酸构建体中编码多肽的所选异源核酸序列(或一系列序列)之前,共同确定编码多肽的异源核酸序列是否会发生转录(和最终表达)。在核酸构建体中“跟随”编码多肽的异源核酸序列并提供终止转录成mRNA的信号的核酸序列被称为转录“终止子”序列。
一般而言,启动子可以包含同源、异源或合成的核酸序列,并且可以是重组核酸序列,重组两个或更多个核酸序列或如上所述的相同或不同来源,从而产生同源、异源或合成的核酸启动子序列,和/或同源、异源或合成的核酸调控元件。WO2019/123324和WO2020/255054详细描述了衍生自PglpF、PglpA、PglpT、PgatY、Plac和PmglB启动子系统的多种启动子序列,其中一些显示在表6中。
表6-选定的启动子序列
*在下述LacZ测定中评估启动子活性,并在同一测定中将PglpF启动子作为阳性参考运行。为了比较不同测定的活性,计算相对于PglpF启动子的活性,范围表示多个测定的结果。
启动子可以是异源来源的、基因修饰细胞天然的,或者它可以是组合异源和/或天然元件的重组启动子。
增加产物产量的一种方法可以是调控用于生产产物的所需酶活性的产生,例如糖基转移酶或参与糖基供体生物合成途径的酶。
增加驱动所需酶表达的启动子强度可能是实现此目的的一种方法。可以使用lacZ酶测定来评估启动子的强度,其中如前所述测定β-半乳糖苷酶活性(参见例如MillerJ.H.Experiments in molecular Genetics,Cold spring Harbor Laboratory Press,NY,1972)。简而言之,将细胞在Z缓冲液中稀释并用十二烷基硫酸钠(0.1%)和氯仿进行透化。LacZ测定在30℃进行。预热样品,通过添加200μl邻硝基苯基-β-半乳糖苷酶(4mg/ml)启动测定,并当样品变成浅黄色时通过添加500μl的1M Na2CO3停止测定。随后将邻硝基苯酚的释放确定为420nm处光密度的变化。具体活性以米勒单位(MU)[A420/(min*ml*A600)]报告。活性高于10,000MU的调控元件被认为是强调控元件,而活性低于3,000MU的调控元件被认为是弱的,介于两者之间的为中等强度。强调控元件的一个例子是具有大约14,000MU活性的PglpF启动子,而弱启动子的一个例子是Plac,当用IPTG诱导时,其具有大约2300MU的活性。
因此,在本发明的一个实施方式中,本发明涉及一种核酸构建体,其包含一种或多种调控元件,所述调控元件是一种或多种启动子序列。优选地是来自表6的启动子序列。根据本公开内容,启动子促进SacC_Agal或Bff的表达。
启动子序列是能够以组成型或诱导型方式促进和/或增强编码多肽的核酸序列的表达的序列。
本发明涉及如上所述的核酸构建体,其中所述一种或多种启动子序列是一种或多种诱导型启动子和/或一种或多种组成型启动子。
诱导型启动子
在本发明的一个实施方式中,一种或多种启动子序列是一种或多种诱导型启动子。因此,在另一个实施方式中,一个或多个启动子序列是一个或多个组成型启动子。
在本发明的实施方式中,本发明选择的核酸序列的表达受如表6所示的PglpF(SEQID NO:42)或Plac(SEQ ID NO:51)或PmglB_UTR70(SEQ ID NO:38)或PglpA_70UTR(SEQ IDNO:39)或PglpT_70UTR(SEQ ID NO:40)或PgatY(SEQ ID NO:41)或这些启动子的变体的控制。
具体的PglpF变体可以选自SEQ ID NO:36、43、44、45、47、48、49、52或53。具体的Plac变体是SEQ ID NO:32。具体的PmglB_70UTR变体可以选自:SEQ ID NO:29、30、31、33、34、35、37或46。
PglpF、PglpA_70UTR、PglpT_70UTR和PmglB_70UTR启动子序列的其他合适变体分别描述于WO2019/123324和WO2020/255054(通过引用并入本文)。
在一个或多个示例性实施方式中,调控元件是具有高或中等强度的启动子,例如选自以下的启动子序列:PmglB_70UTR_SD8、PmglB_70UTR_SD10、PmglB_54UTR、Plac_70UTR、PmglB_70UTR_SD9、PmglB_70UTR_SD4、PmglB_70UTR_SD5、PglpF_SD4、PmglB_70UTR_SD7、PmglB_70UTR、PglpA_70UTR、PglpT_70UTR、pgatY_70UTR、PglpF、PglpF_SD10、PglpF_SD5、PglpF_SD8、PmglB_16UTR、PglpF_SD9、PglpF_SD7、PglpF_SD6和PglpA_16UTR、Pscr。
在所涉及的实施方式中,启动子是选自以下的强启动子:PmglB_70UTR_SD8、PmglB_70UTR_SD10、PmglB_54UTR、Plac_70UTR、PmglB_70UTR_SD9、PmglB_70UTR_SD4、PmglB_70UTR_SD5、PglpF_SD4、PmglB_70UTR_SD7、PmglB_70UTR、PglpA_70UTR、PglpT_70UTR、pgatY_70UTR、PglpF、PglpF_SD10、PglpF_SD5、PglpF_SD8和PmglB_16UTR。
在另一个实施方式中,启动子选自具有中等强度的启动子,例如PglpF_SD9、PglpF_SD7、PglpF_SD6和PglpA_16UTR。
在另一个实施方式中,启动子选自具有低强度的启动子,例如Plac_wt、PglpF_SD3和PglpF_SD1。
在本发明的优选实施方式中,本发明涉及如上所述的核酸构建体,其包含调控元件,其中调控元件是选自以下的启动子:PgatY_70UTR、PglpF、PglpF_SD1、PglpF_SD10、PglpF_SD2、PglpF_SD3、PglpF_SD4、PglpF_SD5、PglpF_SD6、PglpF_SD7、PglpF_SD8、PglpF_SD9、Plac_16UTR、Plac、PmglB_70UTR、PmglB_70UTR_SD4、Pxyl、Ptet、PsacB、PxylA、PrpR、PnitA、PBAD、PT7、Ptac、PL、PR、PnisA和Pb。启动子并未详尽。现有技术中说明了更多示例,例如Carrol等人,Applied and Environmental Microbiology,June 2005,p.3077-3084。
因此,本发明的核酸构建体可以包含与编码本发明的异源多肽的异源核酸序列可操作地连接的启动子序列,从而在特定提示下增强所述核酸序列的表达,所述特定提示例如pH、营养物、糖相关的调控蛋白、离子例如磷酸盐、有机化学物质例如IPTG或碳水化合物、物理参数例如温度、pH、信号传导分子、短核酸、毒素相关或类似的细胞内或细胞外相关提示。
因此,在本发明的一个实施方式中,本发明涉及如上所述的包含调控元件的核酸构建体,其中所述调控元件包括诱导型启动子,其是蔗糖诱导型启动子,例如但不限于Pscr和/或PsacB。
在本发明的另一个优选实施方式中,本发明涉及如上所述的核酸构建体,其包含调控元件,其中所述调控元件是诱导型启动子Pscr。
在本发明的另一个实施方式中,本发明涉及如上所述的核酸构建体,其包含诱导型启动子,其中诱导型启动子是PglpF(SEQ ID NO:42)和/或Plac(SEQ ID NO:51)。在本发明的另一个实施方式中,本发明涉及如上所述的核酸构建体,其包含诱导型启动子,其中所述诱导型启动子是PglpF(SEQ ID NO:42)
组成型启动子
在本发明的另一个优选实施方式中,本发明涉及如上所述的包含调控元件的核酸构建体,其中所述调控元件包括组成型启动子。
当调控元件包括组成型启动子时,即,其组成型促进编码根据本发明的异源多肽的异源核酸的表达,组成型启动子可以是强或弱组成型启动子。本公开内容的典型组成型启动子以下中提及:Liang等人,Activities of Constitutive Promoters inEscherichia coli,J.Mol.Biol.(1999)292,19-37,Yim等人,MolecularCharacterization of the Promoter of osmY,a rpoS-DependentGene,JOURNAL OFBACTERIOLOGY,Jan.1994,p.100-107,和Jensen and Hammer,Appl EnvironMicrobiol.1998Jan;64(1):82-7。
在这方面,在本发明的优选实施方式中,本发明涉及如上所述的核酸构建体,其包括组成型启动子,其中组成型启动子选自CP6、PosmY、Pspc、Pbla、Prrn1和Prrn2。
信号肽
在本发明的一个实施方式中,核酸构建体包含编码如上所述的信号肽的核酸序列。因此,在本发明的优选实施方式中,根据本公开内容的核酸构建体包含编码信号肽的核酸序列,其中所述信号肽置于编码能够水解蔗糖的多肽的异源核酸的上游或下游。优选地,信号肽选自表1,甚至更优选地,信号肽是SEQ ID NO:28。
基因修饰细胞
本公开涉及基因修饰细胞,其包含编码细胞外的、周质的和/或膜结合的或膜嵌入的异源多肽的异源核酸序列,所述异源多肽是能够将蔗糖水解成果糖和葡萄糖的酶,其中所述多肽的表达使得能够利用蔗糖作为主要和/或唯一的碳源和/或能源。或者,作为所述基因修饰细胞的主要和/或唯一碳源和/或作为主要和/或唯一能源,或者甚至作为所述基因修饰细胞的唯一碳源和唯一能源。优选地,能够将蔗糖水解成果糖和葡萄糖的异源酶可以使用未修饰的蔗糖,例如非磷酸化的蔗糖作为底物。
本发明的一个方面是基因修饰细胞,其包含编码异源酶的异源核酸序列,所述异源酶本身能够在基因修饰细胞的细胞外侧将蔗糖水解成果糖和葡萄糖,并且其中所述酶的表达足以使得能够利用蔗糖作为所述基因修饰细胞的碳源和/或能源。
在本发明的一个实施方式中,酶位于细胞的周质或细胞外空间中。
在一个实施方式中,酶锚定、嵌入和/或附着在质膜的周质侧、细胞外侧和/或胞质侧。
在另一个实施方式中,酶是可溶的。
如上所述,发酵过程中不均匀的蔗糖梯度可能会导致基因修饰细胞的代谢应激。为了避免这种情况,内源性葡萄糖转运系统的部分可以完全或部分失活,以减慢从培养基中摄取葡萄糖的速度。
因此,在一个实施方式中,基因修饰细胞的内源葡萄糖转运系统完全或部分失活。
因此,在一个优选的实施方式中,本发明的基因修饰细胞不含有功能性ptsG基因,因此不产生天然大肠杆菌葡萄糖PTS系统的葡萄糖特异性EIICB组分(UniProt P69786)。在另一个优选的实施方式中,编码细胞质膜葡萄糖通透酶的ptsG基因完全或部分失活。与具有功能性ptsG基因的细胞相比,具有非功能性ptsG基因的细胞的葡萄糖摄取减少或有限。ptsG可以从细胞中删除,或者可以对其进行编辑,导致ptsG基因或基因产物的功能丧失,或者消除由突变的ptsG基因编码的多肽的功能。用于此类基因编辑的合适方法是本领域技术人员众所周知的。
基因修饰细胞通常可以含有一种或多种在细胞的天然(非基因工程)形式中不存在的基因。用于引入外源核酸分子/序列和/或将外源核酸分子/序列(重组的、异源的)插入细胞遗传信息中以插入、删除或改变细胞遗传信息的核酸序列的技术是本领域技术人员已知的。
基因修饰细胞可以含有一种或多种以细胞天然形式存在的基因,其中所述基因被修饰并通过人工方式重新引入微生物细胞中。
术语“基因修饰”还涵盖含有对细胞来说是内源性的核酸分子的细胞,该核酸分子已被修饰但没有从细胞中除去该核酸分子。此类修饰包括通过基因替换、位点特异性突变和相关技术获得的修饰。
本发明的基因修饰细胞可以使用本领域的标准方法来提供,例如Sambrook等人、Wilson&Walker、Maniatis等人和Ausubel等人的手册中描述的那些方法。
宿主细胞
对于基因修饰细胞,原则上没有限制;它们可以是真细菌(革兰氏阳性或革兰氏阴性)或古细菌,只要它们允许进行基因操作以插入目的基因并且可以大规模培养即可。优选地,宿主细胞具有允许培养至高细胞密度的特性。
一般而言,合适的宿主生物体是天然不含有使细胞能够利用蔗糖作为碳源的基因的宿主细胞,从而赋予所述受体生物体利用蔗糖的新能力或通过添加本发明的基因来增强已经存在的、有限的蔗糖利用能力。
所述宿主生物体的实例包括不具有利用蔗糖的天然能力或利用蔗糖较差的多种微生物。唯一的限制是受体生物体必须能够被遗传改变(通过基因工程、交配、转导、转化等),使得本发明的蔗糖利用基因可以被安装在宿主菌株中。
适合于重组工业生产根据本发明的HMO的细菌宿主细胞的非限制性实例可以是草生欧文氏杆菌(Erwinia herbicola)(成团泛菌(Pantoea agglomerans))、弗氏柠檬酸杆菌(Citrobacter freundii)、弯曲杆菌属(Campylobacter sp)、柠檬泛菌(Pantoea citrea)、胡萝卜软腐果胶杆菌(Pectobacterium carotovorum)或野油菜黄单胞菌(Xanthomonascampestris)。还可以使用芽孢杆菌属(Bacillus)的细菌,包括枯草芽孢杆菌(Bacillussubtilis)、地衣芽孢杆菌(Bacillus licheniformis)、凝结芽孢杆菌(Bacilluscoagulans)、嗜热芽孢杆菌(Bacillus thermophilus)、侧孢芽孢杆菌(Bacilluslaterosporus)、巨大芽孢杆菌(Bacillus megaterium)、蕈状芽孢杆菌(Bacillusmycoides)、短小芽孢杆菌(Bacillus pumilus)、迟缓芽孢杆菌(Bacillus lentus)、蜡样芽孢杆菌(Bacillus cereus)和环状芽孢杆菌(Bacillus circulans)。类似地,可以使用本发明的方法工程化乳杆菌属(Lactobacillus)和乳球菌属(Lactococcus)的细菌,包括但不限于嗜酸乳杆菌(Lactobacillus acidophilus)、唾液乳杆菌(Lactobacillus salivarius)、植物乳杆菌(Lactobacillus plantarum)、瑞士乳杆菌(Lactobacillus helveticus)、德氏乳杆菌(Lactobacillus delbrueckii)、鼠李糖乳杆菌(Lactobacillus rhamnosus)、保加利亚乳杆菌(Lactobacillus bulgaricus)、卷曲乳杆菌(Lactobacillus crispatus)、加氏乳杆菌(Lactobacillus gasseri)、干酪乳杆菌(Lactobacillus casei)、罗伊氏乳杆菌(Lactobacillus reuteri)、詹氏乳杆菌(Lactobacillus jensenii)和乳酸乳球菌(Lactococcus lactis)。嗜热链球菌(Streptococcus thermophiles)和费氏丙酸杆菌(Proprionibacterium freudenreichii)也是本文所述的本发明的合适细菌种类。作为本发明的一部分还包括如本文所述工程化的菌株,其来自肠球菌属(Enterococcus)(例如屎肠球菌(Enterococcus faecium)和嗜热肠球菌(Enterococcus thermophiles))、双歧杆菌属(Bifidobacterium)(例如长双歧杆菌(Bifidobacterium longum)、婴儿双歧杆菌(Bifidobacteriuminfantis)和两歧双歧杆菌(Bifidobacterium bifidum))、芽孢乳杆菌属(Sporolactobacillus spp.)、小单胞菌属(Micromomospora spp.)、微球菌属(Micrococcus spp.)、红球菌属(Rhodococcus spp.)和假单胞菌属(Pseudomonas)(例如荧光假单胞菌(Pseudomonas fluorescens)和铜绿假单胞菌(Pseudomonas aeruginosa))。
适合异源产物的重组工业生产的真菌宿主细胞的非限制性实例是例如酵母细胞,例如法夫驹形氏酵母(Komagataella phaffii)、乳酸克鲁维酵母(Kluyveromyceslactis)、解脂耶氏酵母(Yarrowia lipolytica)、巴斯德毕赤酵母(Pichia pastoris)和酿酒酵母(Saccaromyces cerevisiae),或丝状真菌,例如曲霉属(Aspargillus sp)、镰刀菌属(Fusarium sp)或木霉菌属(Thricoderma sp),示例性物种是黑曲霉(A.niger)、构巢曲霉(A.nidulans)、米曲霉(A.oryzae)、茄腐镰刀菌(F.solani)、禾谷镰刀菌(F.graminearum)和瑞氏木霉(T.reesei)。
哺乳动物细胞系的非限制性实例是中国仓鼠卵巢细胞(CHO)和鼠类骨髓瘤细胞(NS0、Sp2/0)、幼仓鼠肾细胞(BHK)、鼠类C127、人类细胞系例如PER.C6、HKB-11、CAP和HuH-7、HEK293、HT-1080和HeLa细胞(参见例如Dumont等人2016Crit Rev Biotechnol 36(6):1110-1122)。
在一个或多个实施方式中,基因工程细胞选自大肠杆菌、乳酸乳球菌、枯草芽孢杆菌、变铅青链霉菌(S.lividans)、巴斯德毕赤酵母(P.pastoris)、解脂耶氏酵母(Y.lipolytica)和酿酒酵母(S.cerevisiae)。
在一个或多个示例性实施方式中,基因工程细胞是枯草芽孢杆菌。
在一个或多个示例性实施方式中,基因工程细胞是酿酒酵母或巴斯德毕赤酵母。
在一个或多个示例性实施方式中,基因工程细胞是大肠杆菌。
在一个或多个示例性实施方式中,本发明涉及一种基因工程细胞,其中所述细胞源自大肠杆菌K-12菌株或DE3。大肠杆菌K-12菌株是本领域众所周知的(例如EMG2、MG1655、W3110、W3350、C600和DH5α),其是在大肠杆菌ATCC 8739(大肠杆菌C)、ATCC 11303(大肠杆菌B)、BL21(参见新英格兰生物实验室目录,2007-2008)和这些菌株的衍生物中进行的绝大多数基因工程工作的菌株背景。
在本发明的另一个实施方式中,所述基因修饰细胞可以选自以下:Suc+微生物细胞,其在不存在编码赋予蔗糖水解能力的多肽的核酸序列的情况下,利用蔗糖作为碳源和能源的能力较低和/或次优,并且其中编码根据本公开的多肽的核酸序列的转移能够使已经具有蔗糖水解能力的Suc+微生物细胞能够更好地利用蔗糖作为碳源和能源。在所述实施方式中,除了引入编码根据本公开的多肽的核酸序列之外,还可以对所选择的Suc+微生物细胞进行工程改造,以增加其内源性蔗糖转化酶/水解酶基因的表达。根据所述实施方式的微生物细胞可以选自Suc+酿酒酵母和Suc+枯草芽孢杆菌。
基因整合
包含在构建体(表达盒)中的目的异源核酸整合到基因组中可以通过以下方法实现:常规方法,例如通过使用包含与染色体上的特定位点同源的侧翼序列的线性盒,如attTn7位点所述(Waddell C.S.和Craig N.L.,Genes Dev.(1988)Feb;2(2):137-49.);用于核酸序列的基因组整合的方法,其中重组由噬菌体λ的Red重组酶功能或Rac原噬菌体的RecE/RecT重组酶功能介导(Murphy,J Bacteriol.(1998);180(8):2063-7;Zhang等人,Nature Genetics(1998)20:123-128;Muyrers等人,EMBO Rep.(2000)1(3):239-243);基于Red/ET重组的方法(Wenzel等人,Chem Biol.(2005),12(3):349-56.;Vetcher等人,ApplEnviron Microbiol.(2005);71(4):1829-35);或阳性克隆,即携带表达盒的克隆,可以例如通过标志物基因、或基因功能的丧失或获得而被选择。
在一个实施方式中,异源多肽的表达可以通过附加型整合获得,即编码异源多肽的核酸可以插入到核酸构建体中,如上所述,然后该核酸构建体随后包含在质粒或另一染色体独立的表达载体中,其中表达载体在一些情况下可能能够整合到染色体中,然而,为了获得编码本发明的异源多肽的异源核酸的表达不需要这样做。附加体的实例例如是转座子和插入序列。
在所公开的本发明的范围中,术语“基因组整合”是指将异源核酸整合到染色体中或整合到内源质粒中,从而整合到本发明的基因修饰细胞的基因组中。
因此,在优选的实施方式中,本发明涉及如上所述的基因修饰细胞,其中异源核酸序列编码能够将蔗糖水解成果糖和葡萄糖的异源多肽的附加型和/或基因组整合的拷贝。
在一个实施方式中,编码根据本发明的异源多肽的异源核酸序列以稳定的方式整合到基因修饰细胞的基因组中。在另一个实施方式中,将根据本发明的异源多肽以瞬时方式引入基因修饰细胞中。
能够产生生物合成产物的细胞
本发明上下文中的生物合成产物是从插入宿主细胞中的一种或多种异源基因直接表达的化合物,或者是通过利用细胞的一种或多种代谢途径和/或经工程改造以产生目的化合物的一种或多种酶活性而产生的化合物。生物合成产物可以是例如蛋白质、肽、脂类、脂肪酸、氨基酸、有机酸、寡糖、多糖、聚酯或维生素。
生物合成产生的蛋白质或多肽例如是生物药物化合物,例如抗体、疫苗、细胞因子、血液因子、酶、激素和生长因子,或工业化合物例如酶。这些通常是通过将编码所需蛋白质或多肽的重组基因插入宿主细胞来产生的。
在这方面,本发明还涉及用于生物合成生产的多肽酶,其中所述多肽酶是能够将蔗糖水解成葡萄糖和果糖的转化酶,并且是包含SEQ ID NO:1的氨基酸序列或由其组成的多肽酶SacC_Agal,或其功能同源物,其中功能同源物的氨基酸序列与SEQ ID NO:1具有至少80%,例如至少85%,例如至少90%,例如至少95%或例如至少99%同一性。在一个实施方式中,多肽酶用于一种或多种寡糖和/或多糖的生物合成生产。在进一步的实施方式中,多肽酶用于一种或多种HMO的生物合成生产。
在这方面,本发明还涉及用于生物合成生产的多肽酶,其中所述多肽酶是能够将蔗糖水解成葡萄糖和果糖的转化酶,并且是包含SEQ ID NO:2的氨基酸序列或由其组成的多肽酶Bff,或其功能同源物,其中功能同源物的氨基酸序列与SEQ ID NO:2具有至少80%,例如至少85%,例如至少90%,例如至少95%或例如至少99%同一性。在一个实施方式中,多肽酶用于一种或多种寡糖和/或多糖的生物合成生产。在进一步的实施方式中,多肽酶用于一种或多种HMO的生物合成生产。
生物合成产生的寡糖和多糖是例如人乳寡糖(HMO)或生物聚合物。这些通常是通过插入编码酶的基因来产生的,这些酶可以基于提供给细胞的前体分子或通过宿主细胞中的合成途径产生所需的化合物(也可以是基因工程的)。
本发明还涉及一种基因修饰细胞,其包含编码异源酶的异源核酸序列,所述异源酶本身能够在基因修饰细胞的胞外侧将蔗糖水解成果糖和葡萄糖,并且其中所述酶的表达足以使得能够利用蔗糖作为所述基因修饰细胞的碳源和/或能源,其中所述细胞还包含允许其产生目的生物合成产物的一种或多种重组基因。
能够产生人乳寡糖(HMO)的细胞
本公开涉及在修饰的细菌菌株中生物合成生产HMO的改进且有效的方法,用于HMO制造的大规模适用解决方案。它依赖于构建的基因修饰细菌来表达合成所需寡糖的糖基转移酶,并利用细菌固有的核苷酸糖库作为HMO前体。
因此,本发明还涉及所公开的根据本发明的基因修饰细胞或核酸构建体用于生物合成生产一种或多种HMO的用途。
为了使根据本公开的基因修饰细胞能够产生一种或多种HMO,其需要多种基因修饰。这些修饰中的一些可以包括包含糖基转移酶,其使得能够基本上从乳糖和碳供体(例如活化的糖核苷酸)生物合成一种或多种HMO、用于产生活化的糖核苷酸的生物合成途径以及用于输入乳糖或输出产物的潜在转运蛋白。
上述修饰涉及代谢工程以及功能酶的引入和表达,所述功能酶使得能够从起始材料(通常是乳糖)生产所述一种或多种HMO。
因此,细胞产生一种或多种HMO的能力与其利用蔗糖作为碳源和作为能源和/或主要碳源和主要能源,和/或唯一碳源和唯一能源的能力需要多种遗传修饰,因此,为了满足本文公开的发明,本发明的所述基因修饰细胞包含编码能够水解蔗糖的异源多肽的异源核酸序列,所述多肽的氨基酸序列与SEQ ID NO:1或SEQ ID NO:2具有至少70%、更优选至少80%、更优选至少90%、更优选至少95%、甚至更优选至少99%序列同一性。
此外,本发明涉及针对生产一种或多种特定寡糖、特别是一种或多种特定HMO而优化的基因修饰细胞,所述细胞包含编码与SEQ ID NO:1或SEQ ID NO:2的氨基酸序列具有至少70%、例如至少90%序列同一性、优选至少95%、更优选至少97%、更优选至少98%、甚至更优选至少99%序列同一性的多肽的异源核酸。
因此,本发明的一个实施方式涉及能够产生一种或多种人乳寡糖(HMO)的基因修饰细胞,其中所述基因修饰细胞包含编码能够水解蔗糖的多肽的异源核酸序列,所述核酸序列具有与SEQ ID NO:1或SEQ ID NO:2具有70%、更优选至少75%、更优选至少80%、更优选至少90%、甚至更优选至少95%,例如99%序列同一性的核酸序列。
由于在能够利用蔗糖作为碳源和作为能源、或主要碳源和主要能源、或唯一碳源和唯一能源的基因修饰细胞中生产一种或多种HMO,还需要一种或多种功能性酶,这些在以下段落中详细描述。
HMO
本文中的术语“人乳寡糖”或“HMO”是指在人母乳中发现的复杂碳水化合物(作为参考,参见Urashima等人:Milk Oligo Sugars.Nova Science Publisher(2011);或Chen,Adv.CarboHydr.Chem.Biochem.72,113(2015))。HMO具有核心结构,该核心结构在还原端包含乳糖单元,可被一个或多个β-N-乙酰基-乳糖胺基和/或一个或多个β-乳-N-二糖单元拉长,并且该核心结构可被α-L-岩藻吡喃基和/或α-N-乙酰基-神经氨酸基(唾液酸基)部分取代。在这方面,非酸性(或中性)HMO缺乏唾液酸残基,并且酸性HMO在其结构中具有至少一个唾液酸残基。非酸性(或中性)HMO可以是岩藻糖基化的或非岩藻糖基化的。此类中性非岩藻糖基化HMO的实例包括乳-N-三糖II(LNT-II)、乳-N-四糖(LNT)、乳-N-新四糖(LNnT)、乳-N-新六糖(LNnH)、对-乳-N-新六糖(pLNnH)、对-乳-N-六糖(pLNH)和乳-N-六糖(LNH)。中性岩藻糖基化HMO的实例包括2’-岩藻糖基乳糖(2’-FL)、乳-N-岩藻五糖I(LNFP-I)、乳-N-二岩藻六糖I(LNDFH-I)、3-岩藻糖基乳糖(3’-FL)、二岩藻糖基乳糖(DFL)、乳-N-岩藻五糖II(LNFP-II)、乳-N-岩藻五糖III(LNFP-III)、乳-N-二岩藻六糖III(LNDFH-III)、岩藻糖基-乳-N-六糖II(FLNH-II)、乳-N-岩藻五糖V(LNFP-V)、乳-N-二岩藻六糖II(LNDFH-II)、岩藻糖基-乳-N-六糖I(FLNH-I)、岩藻糖基-对-乳-N-六糖I(FpLNH-I)、岩藻糖基-对-乳-N-新六糖II(F-pLNnH II)和岩藻糖基-乳-N-新六糖(FLNnH)。酸性HMO的实例包括3’-唾液酸基乳糖(3’-SL)、6’-唾液酸基乳糖(6’-SL)、3-岩藻糖基-3’-唾液酸基乳糖(FSL)、3’-O-唾液酸基乳-N-四糖a(LST a)、岩藻糖基-LST a(FLST a)、6’-O-唾液酸基乳-N-四糖b(LST b)、岩藻糖基-LST b(FLST b)、6’-O-唾液酸基乳-N-新四糖(LST c)、岩藻糖基-LST c(FLST c)、3’-O-唾液酸基乳-N-新四糖(LST d)、岩藻糖基-LST d(FLST d)、唾液酸-乳-N-六糖(SLNH)、唾液酸-乳-N-新六糖I(SLNH-I)、唾液酸-乳-N-新六糖II(SLNH-II)和二唾液酸-乳-N-四糖(DSLNT)。在本公开的上下文中,乳糖不被视为HMO种类。
因此,在一个实施方式中,由基因修饰细胞产生的一种或多种HMO选自乳-N-三糖II(LNT-II)、乳-N-四糖(LNT)、乳-N-新四糖(LNnT)、乳-N-新六糖(LNnH)、对-乳-N-新六糖(pLNnH)、对-乳-N-六糖(pLNH))、乳-N-六糖(LNH)、2’-岩藻糖基乳糖(2’-FL)、乳-N-岩藻五糖I(LNFP-I)、乳-N-二岩藻六糖I(LNDFH-I)、3-岩藻糖基乳糖(3-FL)、二岩藻糖基乳糖(DFL)、乳-N-岩藻五糖II(LNFP-II)、乳-N-岩藻五糖III(LNFP-III)、乳-N-二岩藻六糖III(LNDFH-III)、岩藻糖基-乳-N-六糖II(FLNH-II)、乳-N-岩藻五糖V(LNFP-V)、乳-N-二岩藻六糖II(LNDFH-II)、岩藻糖基-乳-N-六糖I(FLNH-I)、岩藻糖基-对-乳-N-六糖I(FpLNH-l)、岩藻糖基-对-乳-N-新六糖II(F-pLNnH II)、岩藻糖基-乳-N-新六糖(FLNnH)、3’-唾液酸基乳糖(3’-SL)、6’-唾液酸基乳糖(6’-SL)、3-岩藻糖基-3’-唾液酸基乳糖(FSL)、3’-O-唾液酸基乳-N-四糖a(LST a)、岩藻糖基-LST a(FLST a)、6’-O-唾液酸基乳-N-四糖b(LST b)、岩藻糖基-LST b(FLST b)、6’-O-唾液酸基乳-N-新四糖(LST c)、岩藻糖基-LST c(FLSTc)、3’-O-唾液酸基乳-N新四糖(LST d)、岩藻糖基-LST d(FLST d)、唾液酸基-乳-N-己糖(SLNH)、唾液酸基-乳-N-新己糖I(SLNH-I)、唾液酸基-乳-N-新六糖II(SLNH-II)和二唾液酸基-乳-N-四糖(DSLNT)。
在本发明的另一个实施方式中,所述一种或多种HMO是一种或多种根据以下式1的HMO,
其中Y是OH,
R1是岩藻糖基或H,
R2是岩藻糖基或H,
R3选自H、唾液酸基、N-乙酰基-乳糖胺基和乳-N-二糖基,其中N-乙酰基-乳糖胺基可以携带包含一个或多个N-乙酰基-乳糖胺基和/或一个或多个乳-N-二糖基的糖基残基;每个N-乙酰基-乳糖胺基和乳-N-二糖基基团可以被一个或多个唾液酸基和/或岩藻糖基残基取代,
R4选自H、唾液酸基和任选被包含一个或多个N-乙酰基-乳糖胺基和/或一个或多个乳-N-二糖基的糖基残基取代的N-乙酰基-乳糖胺基;每个N-乙酰基-乳糖胺基和乳-N-二糖基可以被一个或多个唾液酸基和/或岩藻糖基残基取代,条件是R2、R2、R3和R4基团中的至少一个不同于H。
β-半乳糖苷酶
适用于HMO生产的宿主,例如大肠杆菌可以包含内源β-半乳糖苷酶基因或外源β-半乳糖苷酶基因,例如大肠杆菌包含内源lacZ基因(例如,GenBank登录号V00296(GI:41901))。出于本发明的目的,对产生HMO的宿主细胞进行遗传操作,使其不包含任何β-半乳糖苷酶基因或包含失活的β-半乳糖苷酶基因。基因可以通过从细菌基因组中完全或部分删除相应的核酸序列而失活,或者基因序列以不转录的方式突变,或者如果转录,则转录物不翻译,或者如果翻译成蛋白质(即β-半乳糖苷酶),则该蛋白质不具有相应的酶活性。通过这种方式,HMO生产细菌积累了更多的细胞内乳糖库,这有利于HMO的生产。
一种或多种HMO生物合成生产中的功能酶
如上所述,对于能够合成一种或多种HMO的细胞,除了能够利用蔗糖作为主要和/或唯一碳源和/或作为主要和/或唯一能源的异源核酸之外,本发明的基因修饰细胞还必须包含至少一种另外的异源核酸,其中另外的异源核酸序列编码一种或多种具有糖基转移酶活性的功能性酶。糖基转移酶基因可以整合到基因修饰细胞的基因组中(通过染色体整合),或者可替代地,它可以包含在质粒中并作为质粒携带的表达,如本发明的异源核酸序列所述。如果基因修饰细胞需要两种或多种糖基转移酶才能产生HMO,例如LNT或LNnT,两个或多个编码具有糖基转移酶活性的不同酶的异源核酸可以整合到本发明的核酸构建体中,或者它可以是单独的核酸序列,其可以整合到基因组中和/或从质粒表达,例如β-1,3-N-乙酰葡糖胺基转移酶(编码第一葡糖基转移酶的第一异源核酸序列)与β-1,3-半乳糖基转移酶(编码第二葡糖基转移酶的第二异源核酸序列)组合用于生产LNT,其中第一和第二异源核酸序列可以彼此独立地在染色体上或在质粒上整合,或者它们可以组合成核酸构建体,任选地包含在还包括上述特征的本发明的核酸构建体中。
在一个优选的实施方式中,编码一种或多种糖基转移酶的第一和第二异源核酸均稳定整合至基因修饰细胞的染色体中;另一个优选的实施方式中,编码一种或多种糖基转移酶的第一和第二异源核酸独立于编码本发明的异源多肽的异源核酸序列而整合。在进一步的实施方式中,编码一种或多种糖基转移酶的第一和第二异源核酸被整合到所公开的本发明的核酸构建体中。在另一个实施方式中,编码糖基转移酶的至少一种异源核酸序列是质粒携带的。
在不同的实施方式中,具有糖基转移酶活性的蛋白质/酶(糖基转移酶)可以选自具有以下活性的酶:α-1,2-岩藻糖基转移酶、α-1,3-岩藻糖基转移酶、α-1,3/4-岩藻糖基转移酶、α-1,4-岩藻糖基转移酶、α-2,3-唾液酸转移酶、α-2,6-唾液酸转移酶、β-1,3-N-乙酰葡糖胺基转移酶、β-1,6-N-乙酰葡糖胺基转移酶、β-1,3-半乳糖基转移酶和β-1,4-半乳糖基转移酶。例如,2’-FL的生物合成生产需要修饰细胞表达活性α-1,2-岩藻糖基转移酶;为了生产3-FL,修饰细胞需要表达活性α-1,3-岩藻糖基转移酶;为了生产LNT,修饰细胞需要表达至少两种糖基转移酶,β-1,3-N-乙酰葡糖胺基转移酶和β-1,3-半乳糖基转移酶;为了生产6’-SL,修饰细胞必须表达活性α-2,6-唾液酸转移酶和CMP-唾液酸合成途径;为了生产3’SL,基因修饰细胞必须表达活性α-2,3-唾液酸转移酶和CMP唾液酸合成途径。可以由生产细胞包含的重组基因编码的具有糖基转移酶活性的蛋白质的一些非限制性实施方式可以选自表2的非限制性实例。
表2适合HMO生产的糖基转移酶
/>
/>
上述酶能够生物合成生产HMO核心结构以及岩藻糖基化和/或唾液酸化的HMO,及其糖苷衍生物。编码上述转移酶的基因已在文献中描述。
活化糖核苷酸
每个活化的糖核苷酸通常包含与核苷连接的磷酸化糖基残基,并且特定的糖基转移酶仅接受特定的糖核苷酸。因此,优选地,以下活化的糖核苷酸参与糖基转移:UDP-Glc、UDP-Gal、UDP-GlcNAc、UDP-GalNAc、UDP-葡萄糖醛酸、GDP-Man、GDP-Fuc和CMP-唾液酸,特别是选自UDP-Gal、UDP-GlcNAc、GDP-Fuc和CMP-唾液酸的那些。
根据本发明的基因修饰细胞拥有上述活化糖核苷酸的生物合成途径,即,其具有一组或多组基因,所述基因编码负责合成一种或多种活化糖基核苷酸的一种或多种酶,在培养时准备好在细胞中的糖基转移酶介导的反应中进行糖基化。该组基因或者天然存在于细胞中,或者通过如上文详细描述的编码相关基因的核酸序列的遗传整合引入到细胞中。细胞对活化的糖基核苷酸的生物合成生产是在参与从碳源开始的相应糖核苷酸逐步反应序列的生物合成途径的酶的作用下进行的,在本公开中,唯一的碳源是蔗糖(关于单糖代谢的综述,参见例如H.H.Freeze和A.D.Elbein:第4章:糖生物学基础(Essentials ofGlycobiology)中的糖基化前体(Glycosylation precursors),第2版(Eds.A.Varki等人),冷泉港实验室出版社(2009))。
应该强调的是,与体外形式的转移糖基化相比,基因修饰细胞通过其自身的生物合成途径细胞生物合成生产活化的糖核苷酸是有利的,因为它避免使用外源添加的非常昂贵的糖核苷酸类型供体,因此供体由细胞原位形成,并且磷脂酰核苷离去基团在细胞中循环利用。
根据本发明,细胞外或周质蔗糖可以借助一般的糖通透酶进入细胞,或者它可以从细胞外培养基扩散到周质中,或者它可以位于细胞外培养基中靠近细胞的位置,其中,根据本发明,蔗糖被转化酶水解为葡萄糖和果糖,随后通过各自的通透酶和/或葡萄糖和/或果糖的磷酸化摄取葡萄糖和果糖,然后产生活化的糖,从而使其能够在细胞代谢和糖酵解中使用,从而使蔗糖充当基因修饰细胞的唯一碳源和唯一能源。
荚膜异多糖酸(Colanic acid)基因簇
对于岩藻糖基化HMO的生产,荚膜异多糖酸基因簇对于确保存在足够的GDP-岩藻糖非常重要。在大肠杆菌中,GDP-岩藻糖是细胞外多糖荚膜异多糖酸(细菌细胞壁的主要寡糖)生产的中间体。在本发明的上下文中,荚膜异多糖酸基因簇编码参与GDP-岩藻糖从头合成的酶(gmd、wcaG、wcaH、wcal、manB、manC),而GDP-L-岩藻糖下游的一个或多个基因,例如wcaJ,可以被删除以防止GDP-岩藻糖转化为荚膜异多糖酸。
负责形成GDP-岩藻糖的荚膜异多糖酸基因簇包含以下基因或由以下基因组成:gmd,其编码蛋白质GDP-甘露糖-4,6-脱水酶;wcaG(fcl),其编码蛋白质GDP-L-岩藻糖合酶;wcaH,其编码蛋白质GDP-甘露糖甘露糖基水解酶;wcal,其编码荚膜异多糖酸生物合成糖基转移酶,manB,其编码蛋白质磷酸甘露糖变位酶,manC,其编码蛋白质甘露糖-1-磷酸鸟苷酸转移酶。
在一个或多个示例性实施方式中,负责GDP-岩藻糖形成的荚膜异多糖酸基因簇可以从其天然基因组基因座表达。可以主动调控表达以增加GDP-岩藻糖的形成。可以通过用感兴趣的启动子交换天然启动子来调控表达,和/或通过从不同于天然的另一个基因组基因座表达基因簇来增加编码所述蛋白质的荚膜异多糖酸基因的拷贝数,或附加型表达荚膜异多糖酸基因簇或其特定基因。
就本公开内容而言,与荚膜异多糖酸基因簇相关的术语“天然基因组基因座”涉及基因工程细胞的基因组中的基因簇的原始且天然的位置。
唾液酸分解代谢和生物合成途径
在一些实施方式中,基因修饰细胞含有缺陷的唾液酸分解代谢途径。“唾液酸分解代谢途径”是指通常由酶控制和催化的一系列反应,其导致唾液酸的降解。本文描述的示例性唾液酸分解代谢途径是大肠杆菌途径。在此途径中,唾液酸(Neu5Ac;N-乙酰神经氨酸)被酶NanA(N-乙酰神经氨酸裂解酶)、NanK(N-乙酰甘露糖胺激酶)和NanE(N-乙酰甘露糖胺-6-磷酸差向异构酶)降解,这些酶均由nanATEK-yhcH操纵子编码,并被NanR抑制(http://ecocyc.org/ECOLI)。通过在内源性nanA(N-乙酰神经氨酸裂解酶)(例如GenBank登录号D00067.1(GL216588))和/或nanK(N-乙酰甘露糖胺激酶)(例如GenBank登录号(氨基酸)BAE77265.1(GL85676015)),和/或nanE(N-乙酰甘露糖胺-6-磷酸差向异构酶,GI:947745,通过引用并入本文)中引入突变,在大肠杆菌宿主中产生缺陷的唾液酸分解代谢途径。任选地,nanT(N-乙酰神经氨酸转运蛋白)基因也失活或突变。唾液酸代谢的其他中间体包括:(ManNAc-6-P)N-乙酰甘露糖胺-6-磷酸;(GlcNAc-6-P)N-乙酰葡萄糖胺-6-磷酸;(GlcN-6-P)葡萄糖胺-6-磷酸和(Fruc-6-P)果糖-6-磷酸。在一些优选的实施方式中,nanA是突变的。在其他优选的实施方式中,nanA和nanK被突变,而nanE保持功能。在另一优选实施方式中,nanA和nanE被突变,而nanK未被突变、失活或删除。突变是编码nanA、nanK、nanE和/或nanT基因产物的核酸序列中的一种或多种改变。例如,突变可以是核酸序列中的1、2、最多5、最多10、最多25、最多50或最多100个改变。例如,nanA、nanK、nanE和/或nanT基因通过无效突变而突变。本文所述的无效突变涵盖氨基酸取代、添加、缺失或插入,其导致酶功能丧失(即活性降低或无活性)或酶丧失(即无基因产物)。“删除”是指编码区被完全或部分去除,使得不产生(功能性)基因产物。失活是指编码序列已被改变,使所得基因产物功能性失活或编码基因产物的活性低于天然、天然存在的内源性基因产物的100%,例如90%、80%、70%、60%、50%、40%、30%或20%。“未突变的”基因或蛋白质与天然的、天然存在的或内源性的编码序列没有1、2、至多5、至多10、至多20、至多50、至多100、至多200或至多500个或更多个密码子的差异,或者与相应的编码氨基酸序列没有差异。
此外,细菌(例如,大肠杆菌)还可以包含唾液酸合成能力。例如,细菌通过提供外源UDP-GlcNAc 2-差向异构酶(例如,空肠弯曲杆菌(Campylobacter jejuni)的neuC(GenBank AAK91727.1)或等效物(例如(GenBank CAR04561.1))、Neu5Ac合酶(例如空肠弯曲杆菌的NeuB(GenBank AAK91726.1)或等效物(例如,湖沼黄杆菌(Flavobacteriumlimnosediminis)唾液酸合酶,GenBank WP_023580510.1)、和/或CMP-Neu5Ac合成酶(例如空肠弯曲杆菌的neuA(GenBank AAK91728.1)或等效物(例如巴西弧菌(Vibriobrasiliensis)CMP唾液酸合酶,GenBank WP_006881452.1)。
MFS转运蛋白
生物合成产物的大小和形成后扩散穿过生产细胞壁的能力可能会有所不同。特别是较大的产物可能受益于在基因修饰细胞中表达的活性转运蛋白的存在,以促进所产生的生物产物的输出。
术语“主要促进子超家族(MFS)”是指次级主动转运蛋白类别的一个大且极其多样化的家族,其负责跨细胞膜转运一系列不同的底物,包括糖、药物、疏水性分子、肽、有机离子等。
因此,在一个或多个示例性实施方式中,根据本文所述方法的基因工程细胞还包含充当MFS转运蛋白的基因产物。充当MFS转运蛋白的基因产物可以由在基因工程细胞中表达的重组核酸序列编码。编码MFS转运蛋白的重组核酸序列可以整合到基因工程细胞的基因组中。
在本发明的一个优选实施方式中,MFS转运蛋白促进寡糖、优选HMO穿过细胞膜的转运,优选将由本文所述的基因工程细胞合成的HMO/寡糖从细胞胞质溶胶转运至细胞培养基。另外或替代地,MFS转运蛋白还可以促进不被认为是HMO或寡糖的分子的流出,例如乳糖、葡萄糖、细胞代谢物和/或毒素。
在一个或多个示例性实施方式中,MFS转运蛋白选自Bad、Nec、YberC、Fred、Vag和Marc。
本文中可互换地标识为“Bad蛋白”或“Bad转运蛋白”或“Bad”的MFS转运蛋白的氨基酸序列为SEQ ID NO:59;本文中鉴定为SEQ ID NO:59的氨基酸序列是与具有GenBank登录ID WP_017489914.1的氨基酸序列具有100%同一性的氨基酸序列。
在一个或多个示例性实施方式中,MFS转运蛋白是Bad。
氨基酸序列为SEQ ID NO:60的MFS转运蛋白在本文中可互换地被标识为“Nec蛋白”或“Nec转运蛋白”或“Nec”;编码nec蛋白的核酸序列在本文中被标识为“Nec编码核酸/DNA”或“nec基因”或“nec”;本文中标识为SEQ ID NO:60的氨基酸序列是与具有GenBank登录ID WP_092672081.1的氨基酸序列具有100%同一性的氨基酸序列。
在一个或多个示例性实施方式中,MFS转运蛋白是Nec。在另一个实施方式中,MFS转运蛋白的氨基酸序列为SEQ ID NO:4,或是氨基酸序列与SEQ ID NO:60中任一个具有至少70%同一性,例如至少80%同一性,例如至少85%同一性,例如至少90%同一性,例如至少95%同一性或例如至少99%同一性的功能同源物。
在一个或多个示例性实施方式中,MFS转运蛋白是Nec。
氨基酸序列为SEQ ID NO:61的MFS转运蛋白在本文中可互换地被标识为“YberC蛋白”或“YberC转运蛋白”或“YberC”;编码YberC蛋白的核酸序列在本文中被标识为“YberC编码核酸/DNA”或“yberC基因”或“yberC”;本文中被标识为SEQ ID NO:61的氨基酸序列是与GenBank登录ID EEQ08298.1的氨基酸序列具有100%同一性的氨基酸序列。
在一个或多个示例性实施方式中,MFS转运蛋白是YberC。在另一实施方式中,MFS转运蛋白的氨基酸序列为SEQ ID NO:61,或是氨基酸序列与SEQ ID NO:61中任一个具有至少70%同一性,例如至少80%同一性,例如至少85%同一性,例如至少90%同一性,例如至少95%同一性或例如至少99%同一性的功能同源物。
在一个或多个示例性实施方式中,MFS转运蛋白是YberC。
氨基酸序列为SEQ ID NO:62的MFS转运蛋白在本文中可互换地被标识为“Fred蛋白”或“Fred转运蛋白”或“Fred”;编码fred蛋白的核酸序列在本文中被标识为“Fred编码核酸/DNA”或“fred基因”或“fred”;本文中标识为SEQ ID NO:62的氨基酸序列是与GenBank登录ID WP_087817556.1的氨基酸序列具有100%同一性的氨基酸序列。
在一个或多个示例性实施方式中,MFS转运蛋白是Fred。在另一实施方式中,MFS转运蛋白的的氨基酸序列为SEQ ID NO:62,或是氨基酸序列与SEQ ID NO:62中任一个具有至少70%同一性,例如至少80%同一性,例如至少85%同一性,例如至少90%同一性,例如至少95%同一性或例如至少99%同一性的功能同源物。
在一个或多个示例性实施方式中,MFS转运蛋白是Fred。
氨基酸序列为SEQ ID NO:63的MFS转运蛋白在本文中可互换地被标识为“Vag蛋白”或“Vag转运蛋白”或“Vag”;编码vag蛋白的核酸序列在本文中被标识为“Vag编码核酸/DNA”或“vag基因”或“vag”;本文中标识为SEQ ID NO:63的氨基酸序列是与GenBank登录IDWP_048785139.1的氨基酸序列具有100%同一性的氨基酸序列。
在一个或多个示例性实施方式中,MFS转运蛋白是vag。在另一个实施方式中,MFS转运蛋白的氨基酸序列为SEQ ID NO:63,或是氨基酸序列与SEQ ID NO:63中任一个具有至少70%同一性,例如至少80%同一性,例如至少85%同一性,例如至少90%同一性,例如至少95%同一性或例如至少99%同一性的功能同源物。
在一个或多个示例性实施方式中,MFS转运蛋白是Vag。
氨基酸序列为SEQ ID NO:64的MFS转运蛋白在本文中可互换地被标识为“Marc蛋白”或“Marc转运蛋白”或“Marc”;编码marc蛋白的核酸序列在本文中被标识为“Marc编码核酸/DNA”或“marc基因”或“Marc”;本文中被标识为SEQ ID NO:64的氨基酸序列是与GenBank登录ID WP_060448169.1的氨基酸序列具有100%同一性的氨基酸序列。
在一个或多个示例性实施方式中,MFS转运蛋白是marc。在进一步的实施方式中,MFS转运蛋白的氨基酸序列为SEQ ID NO:64或是氨基酸序列与SEQ ID NO:64中任一个具有至少70%同一性,例如至少80%同一性,例如至少85%同一性,例如至少90%同一性,例如至少95%同一性或例如至少99%同一性的功能同源物。
在一个或多个示例性实施方式中,MFS转运蛋白是Marc。
一种用于生物合成生产一种或多种HMO或另一种生物合成产物的方法
本发明涉及如上所述的核酸构建体以及基因修饰宿主细胞在一种或多种HMO的生物合成生产中的用途。生物合成生产的特征在于其利用基因修饰细胞的方式,其中如上文详细描述的将核酸构建体掺入所述细胞中,此后基因修饰细胞能够利用蔗糖作为主要和/或唯一碳源和/或作为主要和/或唯一能源,优选作为主要和/或唯一碳源和/或作为主要和/或唯一能源。
用于生物合成产生一种或多种HMO的方法包括以下步骤:
a)提供根据本发明的异源核酸构建体,
b)将该核酸构建体整合或转化至能够产生一种或多种HMO的细胞中;
c)在含有蔗糖作为唯一碳源的合适的细胞培养基中培养b)的细胞,和
d)收获步骤c)中产生的HMO。
本发明的异源核酸构建体可以以任何合适的方法掺入能够产生一种或多种HMO的细胞中,可能如上所述。
因此,本发明的一个优选实施方式涉及生物合成生产一种或多种HMO的方法,该方法包括步骤:
a)提供根据本公开的基因修饰细胞,
b)在含有蔗糖作为唯一碳源的合适细胞培养基中培养a)的细胞,和
c)收获步骤b)中产生的HMO。
用于生物合成生产目的生物合成产物的方法,包括步骤:
a)提供根据本发明的异源核酸构建体;
b)将所述核酸构建体整合或转化到能够产生目的生物合成产物的细胞中;
c)在含有蔗糖作为唯一碳源的合适的细胞培养基中培养b)的细胞,和
d)收获步骤c)中产生的目的生物合成产物。
本发明的异源核酸构建体可以以任何合适的方法掺入能够产生一种或多种HMO的细胞中,可能如上所述。
因此,本发明的一个优选实施方式涉及一种用于生物合成生产目的生物合成产物的方法,该方法包括以下步骤:
a)提供具有根据本公开的异源多肽的基因修饰细胞,其也能够产生目的生物合成产物;
b)在含有蔗糖作为唯一碳源的合适的细胞培养基中培养a)的细胞,和
c)收获步骤b)中产生的目的生物合成产物。
培养
根据本发明,在培养能够利用蔗糖作为主要和/或唯一、碳源和/或作为主要和/或唯一能源并且能够产生一种或多种HMO的基因修饰细胞期间,用蔗糖喂养产生寡糖的细胞,蔗糖通过糖酵解提供能量用于生长、繁殖和维持其结构。此外,如上所述,细胞吸收的蔗糖通过所描述的蔗糖分解代谢提供了合成细胞中发生的糖基化过程所必需的活化糖核苷酸的前体。内化的碳水化合物受体,例如乳糖,参与糖基转移酶诱导的糖基化反应,其中细胞产生的活化核苷酸供体的糖基残基被转移,使得受体被糖基化。任选地,当细胞表达多于一种糖基转移酶时,可以发生另外的糖基化反应,导致目标寡糖的形成。当然,细胞优选缺乏任何会降解细胞中产生的寡糖衍生物的酶活性。
根据本发明,术语“培养(culturing)”(或“培养(cultivating)”或“培养(cultivation)”,也称为“发酵”)涉及根据工业中已知的方法在受控生物反应器中繁殖细菌表达细胞。
根据所述方法,基因修饰细胞,优选细菌,更优选大肠杆菌,是针对工业上有利可图的转化如寡糖生产而优化的菌株,因为这样的菌株通常不具有利用蔗糖的能力。因此,应使用适当的表达质粒或通过染色体整合来引入能够利用蔗糖的多肽,将蔗糖负细胞转化为蔗糖正细胞,如上文详细描述的。
为了产生一种或多种HMO,根据本领域已知的程序在蔗糖作为碳源,或作为主要或唯一碳源以及作为能源,作为主要或唯一能源的存在下培养本文所述的产生的HMO微生物,并且从培养基和培养过程期间形成的生物质收获产生的HMO。此后,根据本领域已知的程序纯化HMO,例如WO2015188834、WO2017182965或WO2017152918中描述的程序,并将纯化的HMO用作营养制品、药物或用于任何其他目的,例如,用于研究。
生物合成生产
本发明的方法涉及一种或多种目的生物合成产物的生产,特别是一种或多种HMO的生产。本发明的方法还涵盖大规模生产中目的生物合成产物或HMO的制造。目的生物合成产物或HMO的制造通常是通过进行较大体积的培养来完成的。
术语“制造”或“制造规模”或“大规模生产”或“大规模发酵”可互换使用,并且在本发明的含义中定义了具有100L的最小体积的发酵,例如1000L、例如10000L、例如100000L、例如200000L培养液。通常,“制造规模”工艺被定义为能够加工大量产生目的HMO产物,例如,在治疗化合物或组合物的情况下,满足毒性测试、临床试验以及市场供应的需求。除了体积大之外,与摇瓶培养等简单的实验室规模方法相比,大规模生产方法的特点是使用生物反应器(发酵罐)的技术系统,该系统配备有搅拌、通气、营养物供给、过程参数(pH、温度、溶解氧张力、背压等)监测和控制装置。在很大程度上,实验室规模方法中的表达系统的行为,例如本公开实施例中描述的摇瓶、台式生物反应器或深孔形式,确实允许预测该系统在生物反应器的复杂环境中的行为。
对于发酵过程中使用的合适的细胞培养基没有限制,除了就本发明而言,培养基含有蔗糖作为主要碳源和能源。
收获
本发明上下文中的术语“收获”涉及在发酵终止后收集产生的HMO。在不同的实施方式中,其可以包括收集包含在生物质(即,基因修饰细胞)和培养基两者中的HMO,即,在发酵液与生物质分离之前/未分离。在其他实施方式中,产生的HMO可以与生物质和发酵液分开收集,即,在生物质与培养基(即,发酵液)分离之后/随后。细胞与培养基的分离可以用本领域技术人员熟知的任何方法进行,例如任何合适类型的离心或过滤。细胞与培养基的分离可以在收获发酵液后立即进行,或者在适当条件下储存发酵液后的稍后阶段进行。从剩余生物质(或总发酵)中回收产生的HMO包括从生物质(生产细胞)中提取其。它可以通过本领域任何合适的方法来完成,例如通过超声处理、煮沸、均质化、使用溶菌酶的酶裂解、或冷冻和研磨。
从发酵中回收后,HMO可用于进一步加工和纯化。
通过发酵产生的HMO的纯化可以使用WO2016/095924、WO2015/188834、WO2017/152918、WO2017/182965、US2019/0119314中描述的合适程序进行。
蔗糖水解酶的体外用途
如上所述,目前适合发酵制造的糖的制备成本高且效率低。蔗糖由于其丰度高且处理简单,是其他糖的一种经济高效的替代品。也如上所述,蔗糖比例如葡萄糖更容易制备用于发酵。然而,制造中使用的许多生产单元无法充分利用蔗糖作为碳源和能源(如果有的话)。因此,本发明的一方面涉及本发明的转化酶,即Bff和SacC_Agal在从蔗糖制备葡萄糖和果糖中的用途。
因此,本发明的一个实施方式涉及SEQ ID NO:1或2中任一个的多肽[SacC_Agal或Bff]或SEQ ID NO:1或2中任一个的功能同源物在生产和/或制造葡萄糖和/或果糖中的用途,功能同源物的氨基酸序列与SEQ ID NO:1或2中任一个具有超过70%同一性。本发明的另一个实施方式涉及SEQ ID NO:1或2中任一个的多肽[SacC Agal或Bff]或SEQ ID NO:1或2中任一个的功能同源物在葡萄糖和果糖的生产中的用途,功能同源物的氨基酸序列与SEQID NO:1或2中任一个具有超过70%、例如至少80%、例如至少85%、例如至少90%、例如至少95%或例如至少99%同一性。
本发明的另一个实施方式涉及用于从蔗糖获得葡萄糖和/或果糖的方法,该方法包括,
a)使蔗糖与SEQ ID NO:1或2中任一个的多肽[SacC Agal和Bff]或SEQ ID NO:1或2中任一个的功能同源物反应,该功能同源物的氨基酸序列与SEQ ID NO:1或2中任一个具有超过70%、例如至少80%、例如至少85%、例如至少90%、例如至少95%或例如至少99%同一性,
b)在反应完成后从反应组合物中提取所述多肽,和
c)从反应组合物中提取和/或纯化葡萄糖和/或果糖。
序列ID
本申请包含文本格式和电子格式的序列表,其通过引用并入本文,如优先权申请DK PA 2021 70248和DK PA 2022 70138中的更正序列表中列出的序列。下面是表1或表6中未示出的序列的总结。
SEQ ID NO:1[SacC_Agal,转化酶蛋白]
SEQ ID NO:2[Bff,转化酶蛋白]
SEQ ID NO:3[SacC_Agal,编码转化酶的DNA]
SEQ ID NO:4[编码转化酶的Bff DNA]
SEQUENCE ID NO 55[lgtA蛋白-β-1,3-N-乙酰基-葡糖胺基转移酶]
SEQUENCE ID NO 56[galT-β-1,4-半乳糖基转移酶]
SEQUENCE ID NO 57[galTK-β-1,3-半乳糖基转移酶]
SEQUENCE ID NO 58[smob-α-1,2-岩藻糖基转移酶]
SEQ ID NO:59[Bad,MFS转运蛋白]
SEQ ID NO:60[Nec,MFS转运蛋白]
SEQ ID NO:61[YberC,MFS转运蛋白]
SEQ ID NO:62[Fred,MFS转运蛋白]
SEQ ID NO:63[Vag,MFS转运蛋白]
SEQ ID NO:64[Marc,MFS转运蛋白]
SEQ ID NO:65[ScrY,scr PEP-PTS系统中的孔蛋白]
SEQ ID NO:66[ScrA,scr PEP-PTS系统中的蔗糖转运蛋白酶IIScr]
SEQ ID NO:67[scr PEP-PTS系统中的ScrB转化酶]
SEQ ID NO:68[scr PEP-PTS系统中的ScrR阻遏蛋白]
通用
应当理解,上文结合所描述的发明讨论的任何特征和/或方面通过类推适用于本文所描述的方法。
术语乳-N-三糖、LNT-II、LNT II、LNT2和LNT 2可互换使用。
术语核酸序列和核苷酸序列可互换使用。
下面提供附图和实施例来说明本公开。它们旨在是说明性的并且不应被解释为以任何方式进行限制。
项目
1.一种基因修饰细胞,其包含编码异源酶的异源核酸序列,所述异源酶本身能够在基因修饰细胞的胞外侧和/或周质空间中将蔗糖水解成果糖和葡萄糖,并且其中所述酶的表达足以使得能够利用蔗糖作为所述基因修饰细胞的碳源和/或能源。
2.根据项目1的基因修饰细胞,其中所述酶位于细胞的周质中或细胞外空间中。
3.根据项目1或2的基因修饰细胞,其中所述酶锚定、嵌入和/或附着在质膜的周质侧、细胞外侧和/或胞质侧。
4.根据项目1或2的基因修饰细胞,其中所述酶是可溶的。
5.根据项目1至4中任一项的基因修饰细胞,其中所述细胞能够产生一种或多种人乳寡糖(HMO)。
6.根据前述项目中任一项的基因修饰细胞,其中异源酶能够水解非磷酸化蔗糖。
7.根据前述项目中任一项的基因修饰细胞,其中异源酶是转化酶。
8.根据项目7的基因修饰细胞,其中所述转化酶不由scrB或cscA编码。
9.根据前述项目中任一项的基因修饰细胞,其中异源核酸序列编码能够将蔗糖水解成果糖和葡萄糖的异源酶的附加型和/或基因组整合拷贝。
10.根据项目9的基因修饰细胞,其中编码所述酶的异源核酸序列的单个基因组整合拷贝能够将蔗糖水解成果糖和葡萄糖。
11.根据前述项目中任一项的基因修饰细胞,其中所述酶的表达使得能够利用蔗糖作为所述基因修饰细胞的主要和/或唯一碳源和/或作为主要和/或唯一能源。
12.根据前述项目中任一项的基因修饰细胞,其中异源酶不转运蔗糖。
13.根据前述项目中任一项的基因修饰细胞,其中细胞不包含完整的蔗糖利用系统。
14.根据前述项目中任一项的基因修饰细胞,其中细胞在添加异源酶之前不能依靠蔗糖维持生长。
15.根据前述项目中任一项的基因修饰细胞,其中异源核酸序列编码SEQ ID NO:1或2的酶[SacC Agal或Bff],或SEQ ID NO:1或2中任一个的功能同源物,功能同源物的氨基酸序列与SEQ ID NO:1或2中任一个具有超过70%同一性。
16.根据前述项目中任一项的基因修饰细胞,其中所编码的酶是来自鸡禽杆菌的糖苷水解酶家族32蛋白,如SEQ ID NO:1[SacC Agal]所示,或其氨基酸序列与SEQ ID NO:1具有至少80%同一性的功能同源物。
17.根据前述项目中任一项的基因修饰细胞,其中所编码的酶是来自球形节杆菌IFO 3062的β-呋喃果糖苷酶蛋白,如SEQ ID NO:2[Bff]中所示,或其氨基酸序列与SEQ IDNO:2具有至少80%同一性的功能同源物。
18.根据项目16或17的基因修饰细胞,其中编码酶的核酸序列的至少两个拷贝存在于细胞的基因组中。
19.根据前述项目中任一项的基因修饰细胞,其中异源核酸序列还包含用于调控所述异源核酸序列的表达的一个或多个调控元件。
20.根据项目19的基因修饰细胞,其中所述调控元件调控选自SEQ ID NO:1或2中所示氨基酸序列之一或SEQ ID NO:1或2中任一个的功能同源物的特定异源酶的表达,所述功能同源物的氨基酸序列与SEQ ID NO:1或2中任一个具有超过80%同一性。
21.根据项目19或20中任一项的基因修饰细胞,其中所述调控元件包含一个或多个诱导型启动子序列和/或一个或多个组成型启动子序列。
22.根据项目19-21中任一项的基因修饰细胞,其中所述调控元件包括诱导型启动子。
23.根据项目19-22中任一项的基因修饰细胞,其中所述调控元件选自PBAD、Ptet、Pxyl、Plac、PsacB、PxylA、PrpR、PnitA、PT7、Ptac、PL、PR、PnisA,Pb、PgatY_70UTR、PglpF、PglpF_SD1、PglpF_SD10、PglpF_SD2、PglpF_SD3、PglpF_SD4、PglpF_SD5、PglpF_SD6、PglpF_SD7、PglpF_SD8、PglpF_SD9、Plac_16UTR、Plac、PmglB_70UTR和PmglB_70UTR_SD4。
24.根据项目19-22中任一项的基因修饰细胞,其中所述调控元件是选自如表6所示的PglpF(SEQ ID NO:42)或Plac(SEQ ID NO:51)或PmglB_UTR70(SEQ ID NO:38)或PglpA_70UTR(SEQ ID NO:39)或PglpT_70UTR(SEQ ID NO:40)或PgatY(SEQ ID NO:41)的启动子或这些启动子的变体。
25.根据项目19-23中任一项的基因修饰细胞,其中所述调控元件选自PmglB_70UTR_SD8、PmglB_70UTR_SD10、PmglB_54UTR、Plac_70UTR、PmglB_70UTR_SD9、PmglB_70UTR_SD4、PmglB_70UTR_SD5、PglpF_SD4、PmglB_70UTR_SD7、PmglB_70UTR、PglpA_70UTR和PglpT_70UTR。
26.根据项目19-23中任一项的基因修饰细胞,其中所述调控元件是选自PmglB_70UTR_SD8、PmglB_70UTR_SD10、PmglB_54UTR、Plac_70UTR、PmglB_70UTR_SD9、PmglB_70UTR_SD4、PmglB_70UTR_SD5、PglpF_SD4、PmglB_70UTR_SD7、PmglB_70UTR、PglpA_70UTR、PglpT_70UTR、pgatY_70UTR、PglpF、PglpF_SD10、PglpF_SD5、PglpF_SD8、PgatY和PmglB_16UTR的强启动子。
27.根据项目23的基因修饰细胞,其中所述调控元件是PglpF启动子或其变体。
28.根据项目19-27中任一项的基因修饰细胞,其中所述调控元件包括组成型启动子。
29.根据项目28的基因修饰细胞,其中所述组成型启动子选自CP6、PosmY、Pspc、Pbla、Prrn1和Prrn2。
30.根据前述项目中任一项的基因修饰细胞,其中所述异源核酸序列包含编码信号肽的核酸序列,所述信号肽能够增强所述异源酶持续分泌到基因修饰细胞的周质中和/或发酵培养基中。
31.根据项目30的基因修饰细胞,其中所述信号肽是SEQ ID NO:28。
32.根据前述项目中任一项的基因修饰细胞,其中所述基因修饰细胞具有有限的葡萄糖摄取。
33.根据项目32的基因修饰细胞,其中所述细胞不含有功能性ptsG基因。
34.根据前述项目中任一项的基因修饰细胞,其中所述细胞还包含编码主要促进子超家族(MFS)转运蛋白的异源核酸序列。
35.根据项目34的基因修饰细胞,其中所述MFS转运蛋白选自:
a)编码SEQ ID NO:60的氨基酸序列或其氨基酸序列与SEQ ID NO:60具有至少70%同一性的功能同源物的异源核酸序列,
b)编码SEQ ID NO:61的氨基酸序列或其氨基酸序列与SEQ ID NO:61具有至少70%同一性的功能同源物的异源核酸序列,
c)编码SEQ ID NO:59的氨基酸序列或其氨基酸序列与SEQ ID NO:59具有至少70%同一性的功能同源物的异源核酸序列,
d)编码SEQ ID NO:62的氨基酸序列或其氨基酸序列与SEQ ID NO:62具有至少70%同一性的功能同源物的异源核酸序列,
e)编码SEQ ID NO:63的氨基酸序列或其氨基酸序列与SEQ ID NO:63具有至少70%同一性的功能同源物的异源核酸序列,和
f)编码SEQ ID NO:64的氨基酸序列或其氨基酸序列与SEQ ID NO:64具有至少70%同一性的功能同源物的异源核酸序列。
36.根据前述项目中任一项的基因修饰细胞,其中所述基因修饰细胞是单细胞生物体。
37.根据前述项目中任一项的基因修饰细胞,其中所述基因修饰细胞是原核细胞或真核细胞。
38.根据前述项目中任一项的基因修饰细胞,其中所述基因修饰细胞选自大肠杆菌和枯草芽孢杆菌。
39.根据前述项目中任一项的基因修饰细胞,其中所述基因修饰细胞选自酿酒酵母Saccharomyces cerevisiae、巴斯德毕赤酵母Pichia pastoris和解脂耶氏酵母Yarrowia lipolytica。
40.一种核酸构建体,其包含:
a)编码异源酶的核酸序列,所述异源酶本身能够在基因修饰细胞的胞外侧和/或周质空间中将蔗糖水解成果糖和葡萄糖,和
b)包含调控元件的核酸序列,所述调控元件能够调节所述核酸序列的表达,和任选地
c)编码信号肽的核酸序列,所述信号肽使得所述多肽能够连续分泌到基因修饰细胞的周质中和/或进入发酵培养基。
41.根据项目40的核酸构建体,其中调控子是选自如表6所示的以下的启动子:PglpF(SEQ ID NO:42)或Plac(SEQ ID NO:51)或PmglB_UTR70(SEQ ID NO:38)或PglpA_70UTR(SEQ ID NO:39)或PglpT_70UTR(SEQ ID NO:40)或PgatY(SEQ ID NO:41)或这些启动子的变体。
42.根据项目40或41的核酸构建体,其中所述信号肽选自表1。
43.根据项目42的核酸构建体,其中所述信号肽是SEQ ID NO:28
44.根据项目1-39中任一项的基因修饰细胞或根据项目40至43中任一项的核酸构建体用于生物合成生产的用途。
45.根据项目44的基因修饰细胞或根据项目40至43中任一项的核酸构建体用于生物合成生产一种或多种HMO的用途。
46.用于生物合成生产一种或多种HMO的方法,该方法包括以下步骤:
a)提供根据项目1-39中任一项的基因修饰细胞,
b)在含有蔗糖作为碳源的合适的细胞培养基中培养(a)的细胞,
c)收获步骤(b)中产生的HMO。
47.根据项目46的用于生物合成生产一种或多种HMO的方法,其中步骤b)中的蔗糖是主要和/或唯一的碳源和/或能源。
48.一种在能够产生所需生物合成产物的基因修饰宿主细胞中进行生物合成生产的方法,该方法包括以下步骤:
a)提供能够产生所需生物合成产物的非蔗糖利用(Suc-)宿主细胞或利用蔗糖的能力有限和/或低效的宿主细胞,
b)将编码异源酶的异源核酸序列引入所述宿主细胞中,其中所述异源酶本身能够在基因修饰细胞的胞外侧和/或周质空间中将蔗糖水解为果糖和葡萄糖,并且其中所述酶的表达足以能够利用蔗糖作为所述基因修饰细胞的碳源和/或能源,
c)在含有蔗糖作为碳源的合适的细胞培养基中培养(b)的细胞,
d)收获步骤c)中产生的生物合成产物。
49.根据项目48的方法,其中所述培养基含有蔗糖作为主要和/或唯一碳源和/或作为主要和/或唯一能源。
实施例
实施例1-在大肠杆菌DH1 K12菌株中引入单个基因sacC_Agal或bff赋予其依靠蔗糖作为唯一碳源和能源生长的能力
在生长监测测定中测试的MP1、MP2、MP3、MP4、MP5和MP6菌株基因型的描述
使用细菌菌株MDO作为菌株的背景菌株。MDO由大肠杆菌K-12DH1构建。大肠杆菌K-12DH1基因型是:F-gyrA96、recA1、relA1、endA1、thi-1、hsdR17、supE44。除了大肠杆菌K-12DH1基因型之外,MDO还进行了以下修饰:lacZ:删除1.5kbp,lacA:删除0.5kbp,nanKETA:删除3.3kbp,melA:删除0.9kbp,wcaJ:删除0.5kbp,mdoH:删除0.5kbp,并在gmd基因上游插入Plac启动子(WO2019/123324A1,下表3中总结的修饰)。/>
基于平台菌株(“MDO”,MP1),获得全染色体菌株MP2、MP3、MP4、MP5和MP6。
菌株MP2可以产生四糖HMO、LNnT,而其他菌株不形成具有生物技术兴趣的产物。菌株MP2携带负责LNnT生物合成的基因,即来自脑膜炎奈瑟氏球菌(N.meningitidis)的lgtA(编码β-1,3-N-乙酰葡糖胺转移酶)和来自幽门螺杆菌(H.pylori)的galT(编码β-1,4-半乳糖基转移酶),以及赋予依靠蔗糖作为唯一碳源和能源生长的能力的4个额外基因。这4个基因被组织在2个操纵子scrBR和scrYA中,它们分别由野生型蔗糖启动子(Pscr)和合成双启动子(PglpF_SD1-Pscr)控制。
如上所述,菌株MP3、MP4、MP5和MP6既不产生HMO或任何其他高价值产物,也不表达scrBR和scrYA操纵子。相反,这些菌株中的每一个都带有编码蔗糖水解酶或转化酶的基因的单个基因组拷贝,其表达由合成的诱导型启动子PglpF驱动。具体而言,菌株MP3表达单个PglpF驱动的sacC_Msuc基因拷贝(曼氏产琥珀酸菌(Mannheimia succiniciproducens),W02009078687A2和NCBI登录号AAU37516.1);菌株MP4表达单个PglpF驱动的sacA_Bsub基因拷贝(枯草芽孢杆菌,W02009078687A2;和NCBI登录号WP_010886636.1);菌株MP5表达单个PglpF驱动的sacC_Agal基因拷贝(鸡禽杆菌),以及菌株MP6表达单个PglpF驱动的bff基因拷贝(球形节杆菌IFO 3062)。
在本实施例中,证明了大肠杆菌DH1 K12菌株中单个基因sacC_Agal或bff的基因组整合如何赋予依靠蔗糖作为主要和/或唯一碳以及作为主要和/或唯一能源生长的能力。本公开还证明,这两种基因之一在大肠杆菌宿主中的表达可以有利地用作菌株工程工具,用于产生能够利用不同碳源和能源的菌株,通常也称为灵活燃料菌株,其可能具有改善的整体细胞生理学,这是由于与配备有其他蔗糖利用系统(例如ScrBR-ScrYA系统(SEQ IDNO:65至68))的细胞相比,表达bff或sacC_Agal的细胞所经历的代谢负担可能较低。
表3.MP1、MP2、MP3、MP4、MP5和MP6菌株的基因型
**GlcNAcT:β-1,3-N-乙酰葡糖胺转移酶
***GalT:β-1,4-半乳糖基转移酶
生长监测测定中应用的方案的描述
使用4天方案在96孔微量滴定板中筛选本实施例中公开的菌株。在最初的24小时内,细胞生长至高密度,而在接下来的72小时内,细胞被转移到含有蔗糖作为唯一碳源和能源的培养基中。具体地,在第1天期间,使用含有20%葡萄糖的Luria-Bertani培养液制备新鲜接种物。将制备的培养物在34℃温育24小时后,将细胞转移至补充有硫酸镁和硫胺素的基础基本培养基(200μL)中,向细胞提供初始推注的20%葡萄糖溶液和15g/L蔗糖溶液作为碳源。接种新培养基后,将细胞在28℃以1200rpm摇动72小时。细胞在与ThermoFisherScientific的Varioskan LUX多模式酶标仪兼容的微量滴定板中以批量培养模式生长。
生长监测测定的结果
使用上述72小时方案在生长监测测定中测试菌株,并在蔗糖存在下以分批模式操作培养物。为了评估不同菌株依靠蔗糖生长的能力作为其基因组成(即与不同蔗糖利用系统相关的不同蛋白质的表达)的功能,使用Varioskan LUX系统报告的培养物吸光度原始数据(600nm)来检查测试菌株在蔗糖上的生长曲线。使用数据分析软件Skanlt提取所有这些生长曲线。
如图2所示,不表达转化酶或蔗糖水解酶的大肠杆菌宿主(菌株MDO、MP1)预计无法依靠蔗糖生长(即菌株MP1作为实验的阴性对照)。正如WO2009/078687A2中呈现的结果所预期的,SacA_Bsub和SacC_Msuc蔗糖水解酶的表达使得MDO菌株能够利用蔗糖作为唯一的碳源和能源(即,菌株MP3和MP4用作实验的阳性对照)。对于表达由4种蛋白质(即ScrB、ScrR、ScrY和ScrA(WO2015/197082))组成的复杂蔗糖利用系统的细胞来说也是如此(即菌株MP2也充当实验的阳性对照)。
如图2中所示,本公开的酶SacA_Agal和Bff也使得MDO菌株能够利用蔗糖,但是它们中的每一个都显示出彼此非常不同的特征性生长概况,并且也与由表达上述蔗糖水解酶的菌株(MP3和MP4)产生的生长概况不同。具体而言,表达bff基因的单个基因组拷贝的MDO细胞(菌株MP6)显示出较长的滞后期,该滞后期结束后在蔗糖上快速生长,从而产生高光密度。另一方面,与其他三种工程菌株(即MP2、MP3、MP4或MP6)相比,从单个基因组拷贝表达sacC_Agal基因的MDO细胞(菌株MP5)非常快地达到高光密度(图2)。
表达SacC_Agal(或Bff)酶的细胞能够胜过先前已知的细胞外蔗糖水解酶的事实是令人惊讶的并且突出了本公开的优势。此外,如下表4所示,值得注意的是,先前描述的细胞外蔗糖水解酶SacA_Bsub和SacC_Msuc(W02009/078687A2和NCBI登录号)、细胞内蔗糖水解酶ScrB(分别为WO2015/197082和NCBI登录号WP_000056853.1和AAU37516.1),以及本公开的SacC_Agal和Bff酶之间共享的序列同一性较低。只有SacC_Agal和SacC_Msuc酶似乎具有较高的序列同一性,达到略低于70%的水平(表4)。
表4.使用Emboss-Needle默认设置,与不同蔗糖利用系统相关的蔗糖水解酶之间共享的序列同一性。
实施例2-SacC_Agal蔗糖利用技术可替代多基因蔗糖利用系统ScrBRYA
在生长监测分析中测试的MP2、MP5、MP7和MP8菌株基因型的描述
基于先前报道的平台菌株(“MDO”,MP1),进行下表5中总结的修饰,以获得全染色体菌株MP2、MP5、MP7和MP8。
菌株MP2可以产生四糖HMO LNnT,而其他菌株不形成具有生物技术兴趣的产物。菌株MP2携带负责LNnT生物合成的基因,即来自脑膜炎奈瑟氏球菌的lgtA(编码β-1,3-N-乙酰葡糖胺转移酶)和来自幽门螺杆菌的galT(编码β-1,4-半乳糖基转移酶),以及赋予依靠蔗糖作为唯一碳源和能源生长的能力的4个额外基因。这4个基因被组织在2个操纵子scrBR和scrYA中,它们分别由野生型蔗糖启动子(Pscr)和合成双启动子(PglpF_SD1-Pscr)控制。
如上所述,菌株MP3、MP4、MP5和MP6既不产生HMO或任何其他高价值产物,也不表达scrBR和scrYA操纵子。相反,这些菌株中的每一种都带有编码酶SacC_Agal的基因的一个或多个基因组拷贝。具体而言,菌株MP5表达单个PglpF驱动的sacC_Agal基因拷贝;菌株MP7表达两个PglpF驱动的sacC_Agal基因拷贝;菌株MP8表达三个PglpF驱动的sacC_Agal基因拷贝。
在本实施例中,证明了将单个基因sacC_Agal的两个PglpF驱动的表达盒整合到大肠杆菌DH1 K12菌株的基因组中赋予了依靠蔗糖生长的能力,所述蔗糖作为碳源,或作为主要或唯一的碳源和作为能源,或作为主要或唯一的能源,且水平高于其他单酶蔗糖利用系统(例如SacC_Msuc或SacA_Bsub),或至少达到与已建立的ScrBR-ScrYA系统相当的水平。
表5.MP5、MP7、MP8和MP2菌株的基因型
**GlcNAcT:β-1,3-N-乙酰葡糖胺转移酶
***GalT:β-1,4-半乳糖基转移酶
生长监测测定中应用的方案的描述
使用4天方案在96孔微量滴定板中筛选本实施例中公开的菌株。在最初的24小时内,细胞生长至高密度,而在接下来的72小时内,细胞被转移到含有蔗糖作为主要碳源和能源的培养基中。具体地,在第1天期间,使用含有20%葡萄糖的Luria-Bertani培养液制备新鲜接种物。将制备的培养物在34℃温育24小时后,将细胞转移至补充有硫酸镁和硫胺素的基础基本培养基(200μL)中,向细胞提供初始推注的20%葡萄糖溶液和15g/L蔗糖溶液作为碳源。接种新培养基后,将细胞在28℃以1200rpm摇动72小时。细胞在与ThermoFisherScientific的Varioskan LUX多模式酶标仪兼容的微量滴定板中以批次培养模式生长。
生长监测测定的结果
使用上述72小时方案在生长监测测定中测试菌株,并在蔗糖存在下以分批模式操作培养物。为了评估不同菌株依靠蔗糖生长的能力作为其基因组成(即与不同蔗糖利用系统相关的不同蛋白质的表达)的功能,使用Varioskan LUX系统报告的培养物吸光度原始数据(600nm)来检查测试菌株在蔗糖上的生长曲线。数据分析软件Skanlt用于提取所有生长曲线并执行各种计算,包括每个测试菌株对蔗糖的特定生长率。
如图3所示,与具有两个(菌株MP7)或三个(菌株MP8)PglpF驱动的该基因的基因组副本的菌株相比,具有单个sacC_Agal拷贝的菌株MP5依靠蔗糖生长时可以达到更高的光密度。然而,菌株MP5在早期指数生长期的生长速率低于菌株MP7和MP8之一(图4)。此外,具有两个(菌株MP7)或三个(菌株MP8)PglpF驱动的sacC_Agal基因的基因组拷贝的菌株表现出非常相似的生长曲线(图3),并且在指数生长期间达到相似的比生长速率(图4)。
总之,两个PglpF驱动的sacC_Agal基因的基因组拷贝足以使MDO菌株能够利用蔗糖,几乎与表达ScrBR-ScrYA蔗糖利用系统的MP2菌株一样有效。此外,sacC_Agal赋予的大肠杆菌DH1 K12菌株依靠蔗糖高效生长的能力优于其他单酶蔗糖利用系统(例如SacC_Msuc或SacA_Bsub)所赋予的能力,无论是在分批培养中达到的最终光密度还是在指数生长阶段达到的生长速率(图2和3)。
以这种方式,本公开内容指出了用于产生具有改善的整体细胞生理学的灵活燃料菌株的有效菌株工程工具,这可能是由于表达sacC_Agal的细胞的低代谢负担造成的。
实施例3-HMO生产宿主中的SacC_Agal蔗糖利用技术
在本实施例中,将SacC_Agal蔗糖转化酶引入表达LNnT的宿主细胞(在表7中标识为MP2),用SacC_Agal基因的两个拷贝替换由scrYA、scrBR基因编码的PEP-PTS蔗糖系统。此外,SacC_Agal基因被置于PglpF启动子(菌株MP9和MP10)或蔗糖依赖性Pscr启动子(菌株MP11和MP12)的控制之下。此外,在菌株MP10和MP12中测试了删除ptsG的效果。
菌株的基因型列于表7中。
表7:MP2和MP9至14的基因型
**GlcNAcT:β-1,3-N-乙酰葡糖胺转移酶
***GalT:β-1,4-半乳糖基转移酶
发酵方案
大肠杆菌菌株在250mL发酵罐(Ambr 250生物反应器系统,Sartorius)中培养,起始使用100mL由31.2g/L蔗糖和包含H3PO4、MgSO4×7H2O、KOH、柠檬酸、微量元素溶液、消泡剂和硫胺素的矿物培养基组成的矿物培养基。通过一系列的首次鼓动,然后以700rpm(最高4500rpm)和1VVM(最高3VVM)开始气流,将溶解氧水平保持在23%。用8.5% NH4OH溶液滴定将pH值保持在6.8。培养开始于来自预培养物的2%(v/v)接种物,预培养物包含10g/L蔗糖、(NH4)2HPO4、KH2PO4、MgSO4×7H2O、KOH、NaOH、柠檬酸、微量元素溶液、消泡剂和硫胺素。在耗尽批次培养基中所含的蔗糖后,将含有蔗糖的进料溶液以维持碳限制条件的速率连续添加至发酵罐中。温度最初为33℃,但在进料20小时后降至27℃。在开始进料25%乳糖一水合物溶液时以推注方式添加乳糖,然后每32小时添加一次,以防止乳糖成为速率限制因素。通过在线测量反射率和二氧化碳释放速率来跟踪细胞的生长、代谢活动和代谢状态。
结果
LNnT的产量显示为产生的总HMO的摩尔百分比。除菌株MP10外,发酵一式两份进行。数据如图5所示。
具体地,可以看出,与表达四基因PEP-PTS蔗糖系统的菌株相比,表达在PglpF启动子控制下的sacC_Agal的菌株(菌株MP9和MP10)产生更高量的LNnT。特别地,具有额外的葡萄糖转运蛋白ptsG缺失的菌株(MP10)似乎具有达到非常高滴度的LNnT产量的潜力,因为发酵在115小时终止时尚未达到LNnT生产的平台期。
从图5可以证实,细胞摄取非常少的蔗糖,如表达在蔗糖诱导型启动子Pscr控制下的sacC_Agal的菌株(菌株MP11和MP12)所示,与其中sacC_Agal表达在PglpF启动子控制下的菌株相比,其产生显著更少的LNnT。然而,与MP11菌株相比,MP12菌株也观察到了ptsG缺失调控葡萄糖摄取的积极作用。
对于菌株MP10,对副产物的形成进行了进一步分析。对于MP10菌株,与MP2菌株发酵后剩余的乳糖相比,乳糖减少了5.5倍。发酵后减少乳糖的量是有利的,因为最终产物中仅允许有限量的乳糖,并且优选不必在发酵后的下游过程中除去乳糖。与MP2菌株相比,MP10菌株的其他副产物如LNT-II和pLNnH也有所减少(表8)。
表8:副产物形成。
菌株 LNT-II/LNnT pLNnH/LNnT
MP2 6-7% 15%
MP10 3-5% 11%
实施例4–在产生复杂五糖LNFP-I的大肠杆菌细胞中的SacC_Agal蔗糖利用技术
MP13、MP14和MP15菌株基因型的描述
基于实施例1中描述的平台菌株(“MDO”,MP1),进行下表9中总结的修饰以获得全染色体菌株MP13、MP14和MP15。
该菌株可产生五糖HMO LNFP-I、四糖HMO LNT和三糖HMO 2’-FL。来自脑膜炎奈瑟菌的糖基转移酶LgtA(β-1,3-N-乙酰葡糖胺转移酶)、来自幽门螺杆菌的GalTK(β-1,3-半乳糖基转移酶)、来自运动性硫曲霉菌S.mobilis的Smob(α-1,2-岩藻糖基转移酶)和来自Rosenbergiella nectarea的异源MFS转运蛋白Nec存在于所有三种菌株中。与菌株MP13相反,菌株MP14和MP15可以利用蔗糖作为碳源和能源,因为来自鸡禽杆菌的基因sacC_Agal分别整合在其基因组上的一或两个基因座中。
本发明展示了细胞外转化酶例如SacC_Agal的引入如何可以有利地用于赋予产生复杂五糖LNFP-I的工程化大肠杆菌利用蔗糖作为碳源和/或能源的能力。如下表所示,菌株MP13和MP14或MP15之间的唯一区别是前者不存在SacC_Agal酶,而后两个菌株则存在该酶。虽然菌株MP14具有单个PglpF驱动的sacC_Agal基因拷贝,但菌株MP15具有两个这样的拷贝。
在本实施例中,证明表达sacC_Agal的细胞不仅在含有蔗糖的分批培养物中强劲生长,而且它们还在补料分批发酵过程中以高滴度产生LNFP-I。
表9.MP13、MP14和MP15菌株的基因型
1 GlcNAcT:编码SEQ ID NO:55的β-1,3-N-乙酰葡糖胺转移酶LgtA的基因
2 GalTK:编码SEQ ID NO:57的β-1,3-半乳糖基转移酶GalTK的基因
3 CA:位于与天然基因座不同的基因座处的额外的荚膜异多糖酸基因簇(gmd-wcaG-wcaH-wcal-manC-manB)(参见例如PCT/EP2021/086932 SEQ ID NO:30)
4 smob:编码SEQ ID NO:58的α-1,2-岩藻糖基转移酶的基因
5 BD182026.1(修饰的):与BD182026.1相比,所应用的β-1,3-半乳糖基转移酶序列有两个12和30个氨基酸的缺失,并且在同源区域具有90%的同一性
6 nec:具有GenBank登录ID GenBank登录ID WP_092672081.1的MFS转运蛋白,受PglpF启动子控制
7 sacC_Agal:SEQ ID NO:1的蔗糖转化酶
生长监测测定中应用的方案的描述
使用2.5天方案在96孔微量滴定板中筛选本实施例中公开的菌株。在最初的24小时内,细胞生长至高密度,而在接下来的36小时内,细胞被转移到含有蔗糖作为主要碳源和能源的培养基中。具体地,在第1天期间,使用含有20%葡萄糖的Luria-Bertani培养液制备新鲜接种物。将制备的培养物在34℃温育24小时后,将细胞转移至补充有硫酸镁和硫胺素的基础基本培养基(200μL)中,向细胞提供初始推注的20%葡萄糖溶液和15g/L蔗糖溶液作为碳源。接种新培养基后,将细胞在28℃下以1200rpm摇动72小时。细胞在与ThermoFisherScientific的Varioskan LUX多模式酶标仪兼容的微量滴定板中以批量培养模式生长。
发酵方案
大肠杆菌菌株在250mL发酵罐(Ambr250 HT生物反应器系统,Sartorius)中培养,起始使用100mL由30g/L葡萄糖或蔗糖(分别为AL-X16和AL-X17)和包含NH4H2PO4、KH2PO4、MgSO4×7H2O、NaOH、柠檬酸、微量元素溶液、消泡剂和硫胺素的矿物培养基组成的矿物培养基。通过一系列的首次鼓动,然后以700rpm(最高4500rpm)和1VVM(最高3VVM)开始气流,将溶解氧水平保持在20%。用8.5%NH4OH溶液滴定将pH值保持在6.8。培养开始于来自预培养物的2%(v/v)接种物,预培养物包含10g/L葡萄糖(AL-X16)或蔗糖(AL-X17)、(NH4)2HPO4、KH2PO4、MgSO4×7H2O、KOH、NaOH、柠檬酸、微量元素溶液、消泡剂和硫胺素。基础基本培养基中所含的葡萄糖或蔗糖耗尽后,将含有葡萄糖(AL-X16)或蔗糖(AL-X17)的进料溶液以维持碳限制条件的速率连续添加到发酵罐中。温度最初为33℃,但在进料3小时后降至30℃。开始进料后36小时以25%乳糖一水合物溶液的形式推注添加乳糖,然后每19小时添加一次,以防止乳糖成为速率限制因素。通过在线测量反射率和二氧化碳释放速率来跟踪细胞的生长、代谢活动和代谢状态。在整个发酵过程中,取样并使用HPLC测定HMO产物、乳糖和其他少量副产物的浓度。
测定中生长监测的结果
使用上述60小时方案在生长监测测定中测试菌株,并在蔗糖存在下以分批模式操作培养物。为了评估不同菌株依靠蔗糖生长的能力作为其基因组成(即与蔗糖利用直接相关的SacC_Agal酶的表达或不表达)的功能,由Varioskan LUX系统报告的培养物吸光度(600nm)的原始数据用于检查所测试菌株(即MP13、MP15和MP15)依靠蔗糖的生长曲线。数据分析软件SkanIt用于提取所有生长曲线并执行各种计算。
如图6所示,MP13菌株的基因组上不带有sacC_Agal,因此不能依靠制备的分批培养物中存在的培养基中提供的蔗糖生长。经过一点生长后(由于培养基中可能存在低水平的葡萄糖和可能存在的部分降解的蔗糖),菌株MP13具有平坦的生长曲线(图6)。相反,菌株MP14和MP15分别携带单个或两个PglpF驱动的sacC_Agal基因拷贝,依靠蔗糖长时间生长良好,并达到比菌株MP13高得多的光密度值(图6)。还值得注意的是,菌株MP14和MP15具有几乎相同的生长概况,这表明单个PglpF驱动的sacC_Agal基因拷贝应足以支持依靠蔗糖的强劲生长(图6)。
以这种方式,本公开指出了一种用于生产具有正常细胞生理学的灵活燃料菌株(能够在多于一种碳源上生长)的有效菌株工程工具,这可以表明与本领域已知的其他多基因蔗糖利用技术(例如,scrBRYA)相比,sacC_Agal表达细胞中的代谢负担可能较低。
在本实施例中,将SacC_Agal蔗糖转化酶引入表达LNFP-I的宿主细胞中,在表9中标识为MP13。详细地,sacC_Agal基因被置于PglpF启动子的控制下并以单个拷贝(菌株MP14)或两个拷贝(菌株MP15)整合到染色体中。此外,据此证明,表达sacC_Agal的细胞不仅在含有蔗糖的分批培养物中强劲生长,而且它们还在补料分批发酵过程中以高滴度产生LNFP-I,如下面的发酵结果所示。
发酵结果
LNFP-I、LNT、2’FL和LNT-II的产量显示为总HMO产量的百分比分数。使用菌株MP13进行单次发酵,同时对菌株MP9进行两次平行发酵。发酵终点数据呈现在表10中。一般来说,在选定的发酵过程中,菌株MP13和MP15都以高水平和相似的滴度产生LNFP-I。
具体来说,当实施基于葡萄糖的工艺(AL-X16)时,不能依靠蔗糖生长的菌株(即MP13)提供了由3种HMO组成的HMO谱。具体而言,MP13菌株的HMO谱包含大约95% LNFP-I、1% LNT和4%2'-FL(表10)。相反,当实施基于蔗糖的工艺(AL-X17)时,与菌株MP13相比,在PglpF启动子控制下表达sacC_Agal的菌株(菌株MP15)产生了更高量的2’-FL。特别是,菌株MP15的HMO谱包含约90% LNFP-I和10%2’-FL,但不含LNT(表10)。
总之,SacC_Agal蔗糖利用技术能够使用相应的工程细胞进行高水平的LNFP-I生产,该细胞提供的HMO谱与使用葡萄糖作为碳源获得的HMO谱高度相似。然而,在发酵结束时,2’-FL的量存在趋势,对于蔗糖而不是非蔗糖利用的LNFP-I菌株,该值往往略高(约5%),而LNT HMO副产物在利用蔗糖的菌株中完全消失,提供了LNFP-I和2’FL的纯共混物。
表10.发酵时间点89小时总培养液样品中的HMO混合物组成。菌株MP13依靠葡萄糖生长(工艺AL-X16),而菌株MP15(两次独立运行)表达SacC_Agal酶因此可以利用蔗糖作为碳源和/或能源(工艺AL-X17)。
/>
序列表
<110> 帝斯曼知识产权资产管理有限公司(DSM IP ASSETS B.V.)
<120> 表达转化酶/蔗糖水解酶的微生物菌株
<130> 34033-WO-PCT2
<150> DK202270138
<151> 2022-03-25
<150> DK202170248
<151> 2021-05-17
<160> 68
<170> BiSSAP 1.3.6
<210> 1
<211> 483
<212> PRT
<213> 鸡禽杆菌
<220>
<223> SacC_Agal, 糖苷水解酶家族32蛋白, WP_103853210.1
<400> 1
Met Ile Ile Phe Asn Glu Gly Lys Tyr Lys Ser Leu Tyr Ala Ala Glu
1 5 10 15
Gln Gly Glu Leu Glu Lys Ile Ala Gln Thr Val Ala Gln Asp Gln Asp
20 25 30
Phe Arg Pro Val Tyr His Leu Ala Pro Pro Thr Gly Leu Leu Asn Asp
35 40 45
Pro Asn Gly Leu Ile Phe Asp Gly Glu Lys Tyr His Leu Phe Tyr Gln
50 55 60
Trp Tyr Pro Phe Asp Ala Leu His Gly Met Lys His Trp Gln His Phe
65 70 75 80
Ile Thr Gln Asp Phe Lys Gln Phe Ser Gln Ala Asp Leu Leu Val Pro
85 90 95
Cys Glu Leu Tyr Glu Ser His Gly Cys Tyr Ser Gly Gly Ala Val Lys
100 105 110
Ile Gly Asp Gln Ile Ala Val Phe Tyr Thr Gly Asn Thr Arg Arg Pro
115 120 125
Ser Asp Asn Gln Arg Val Pro Tyr Gln Asn Leu Ala Ile Phe Ser Lys
130 135 140
Asp Gly Lys Leu Leu Ser Lys Arg Pro Leu Ile Glu Gln Ala Pro Gln
145 150 155 160
Gly Tyr Thr Glu His Val Arg Asp Pro Lys Pro Phe Leu Thr Lys Asp
165 170 175
Gly Lys Ile Arg Phe Ile Cys Gly Ala Gln Arg Glu Asn Leu Thr Gly
180 185 190
Thr Ala Leu Val Phe Glu Met Asp Asn Leu Ala Asp Thr Pro Arg Leu
195 200 205
Leu Gly Glu Leu Ala Leu Pro Ala Phe Asp Asn Gln Gly Val Phe Met
210 215 220
Trp Glu Cys Pro Asp Leu Ser Gln Met Gly Asp Lys Ser Leu Phe Ile
225 230 235 240
Trp Ser Pro Gln Gly Lys Ala Arg Glu Leu Glu Gln Tyr Gln Asn Asn
245 250 255
Tyr His Ala Val Tyr Ala Leu Gly Glu Leu Ala Asp Arg Gln Phe His
260 265 270
Ala Glu Gln Ile Ala Glu Leu Asp Gln Gly Phe Asp Phe Tyr Ala Pro
275 280 285
Gln Thr Phe Ser Gly Thr Gln Thr Met Leu Leu Gly Trp Val Gly Leu
290 295 300
Pro Asp Leu Ser Tyr Pro Thr Asp Leu Tyr Lys Trp His Ser Met Leu
305 310 315 320
Ser Met Pro Arg Gln Leu Arg Leu Gln Asp Gly Lys Ile Tyr Gln Gln
325 330 335
Pro Ile Glu Asn Ile Tyr Lys Asn Leu Thr Ala Leu Gln Ser Ile Thr
340 345 350
Val Glu Lys Glu Ala Glu Ile Ala Asp Leu Asp Arg Ala Tyr Leu Lys
355 360 365
Phe Asp Ala Asn Ala Gln Pro Phe Ser Leu Lys Phe Phe Asn Asn Ala
370 375 380
Gln Asn Gln Arg Leu Ile Leu Ser Tyr Asp Gly Glu Met Leu Cys Leu
385 390 395 400
Asp Arg Ser Gln Thr Glu Gln Thr Asp Ser Met Lys Ser Phe Gly Asp
405 410 415
Lys Arg Tyr Cys Arg Ile Glu Asp Leu Arg Gln Val Glu Ile Phe Phe
420 425 430
Asp Arg Ser Val Ala Glu Ile Phe Leu Asn Gln Gly Glu Lys Ala Met
435 440 445
Thr Ser Arg Phe Phe Ile Cys Ala Arg Glu Asn Gln Leu Cys Thr Asp
450 455 460
Lys Pro Leu Thr Leu Gln Val Gly Tyr Pro Lys Lys Ile Glu Val Asp
465 470 475 480
Tyr Thr Lys
<210> 2
<211> 548
<212> PRT
<213> 球形节杆菌
<220>
<223> Bff, β-呋喃果糖苷酶蛋白, BAD18121.1
<400> 2
Met Glu Arg Thr Cys Ile Thr Val Arg Ala Ile Val Arg Phe His Ile
1 5 10 15
Glu Gln Arg Gln Thr Ile Val Asn Lys Gln Arg Thr Lys Arg Gly Ile
20 25 30
Leu Thr Ala Ala Leu Ser Ile Gly Ala Leu Gly Ala Thr Leu Ile Ser
35 40 45
Gly Pro Ala Val Ala Ala Thr Asp Ala Ala Pro Gly Phe Pro Gln Pro
50 55 60
Thr Glu His Thr Gln Lys Ala Tyr Ser Pro Thr Asp Asn Phe Thr Ser
65 70 75 80
Arg Trp Thr Arg Ala Asp Ala Lys Gln Leu Lys Ala Met Ser Asp Pro
85 90 95
Asp Ala Gly Ser Arg Glu Asn Ser Met Pro Thr Glu Tyr Thr Met Pro
100 105 110
Thr Val Ser Gln Asp Phe Pro Asp Met Ser Asn Glu Lys Val Trp Val
115 120 125
Trp Asp Thr Trp Pro Leu Ile Asp Glu Asn Ala Asn Gln Tyr Ser Val
130 135 140
Asn Gly Gln Glu Ile Ile Phe Ser Leu Val Ala Asp Arg Lys Leu Gly
145 150 155 160
Phe Asp Glu Arg His Gln Tyr Ala Arg Ile Gly Tyr Phe Tyr Arg Pro
165 170 175
Ala Gly Ile Pro Ala Asp Glu Arg Pro Glu Asp Gly Gly Trp Thr Tyr
180 185 190
Gly Gly Gln Val Phe Asp Glu Gly Val Thr Gly Lys Ile Phe Glu Asp
195 200 205
Gln Ser Phe Thr His Gln Thr Gln Trp Ser Gly Ser Ala Arg Val Ser
210 215 220
Lys Asn Gly Glu Ile Lys Leu Phe Phe Thr Asp Val Ala Phe Tyr Arg
225 230 235 240
Asp Lys Asp Gly Gln Asp Val Lys Pro Tyr Asp Ser Arg Ile Ala Leu
245 250 255
Ser Val Gly His Val His Ser Asn Lys Lys Gly Val Lys Leu Thr Gly
260 265 270
Phe Asn Lys Val Lys Glu Leu Leu Gln Ala Asp Gly Lys Asn Tyr Gln
275 280 285
Asn Ala Ala Gln Asn Ser Tyr Tyr Asn Phe Arg Asp Pro Phe Thr Phe
290 295 300
Val Asp Pro Ala His Pro Gly Glu Thr Tyr Met Val Phe Glu Gly Asn
305 310 315 320
Ser Ala Met Asp Arg Asp Glu Ala Lys Cys Thr Ala Glu Asp Leu Gly
325 330 335
Tyr Arg Glu Gly Glu Thr Asn Gly Glu Thr Val Glu Gln Val Asn Asn
340 345 350
Ser Gly Ala Thr Tyr Gln Ile Gly Asn Val Gly Leu Ala Arg Ala Lys
355 360 365
Asn Lys Ala Leu Thr Glu Trp Glu Phe Leu Pro Pro Ile Leu Ser Ala
370 375 380
Asn Cys Val Thr Asp Gln Thr Glu Arg Pro Gln Ile Tyr Met Gln Asp
385 390 395 400
Gly Lys Tyr Tyr Leu Phe Thr Ile Ser His Arg Ser Thr Phe Ala Thr
405 410 415
Gly Ile Asp Gly Pro Glu Gly Val Tyr Gly Phe Val Gly Asn Gly Ile
420 425 430
Arg Ser Asp Tyr Gln Pro Leu Asn Arg Gly Ser Gly Leu Ala Leu Gly
435 440 445
Ser Pro Thr Asn Leu Asn Phe Ala Ala Gly Thr Pro Phe Ala Pro Asp
450 455 460
Tyr Asn Gln His Pro Gly Gln Phe Gln Ala Tyr Ser His Tyr Val Met
465 470 475 480
Pro Gly Gly Leu Val Gln Ser Phe Ile Asp Thr Ile Gly Thr Lys Asp
485 490 495
Asn Phe Val Arg Gly Gly Thr Leu Gly Pro Thr Val Lys Leu Asn Ile
500 505 510
Lys Gly Asp Ser Ala Thr Val Asp Tyr Asn Tyr Gly Asp Asn Gly Leu
515 520 525
Gly Gly Trp Ala Asp Ile Pro Ala Asn Arg Glu Leu Lys Asn Ser Lys
530 535 540
Ala Val Ala Lys
545
<210> 3
<211> 1452
<212> DNA
<213> 鸡禽杆菌
<220>
<223> SacC_Agal
<400> 3
atgatcatct ttaacgaggg caaatacaaa agcctgtatg cagcagaaca gggtgaactg 60
gaaaaaattg cacagaccgt tgcacaggat caggattttc gtccggttta tcatctggca 120
ccgcctaccg gtctgctgaa tgatccgaat ggtctgattt ttgatggcga gaaatatcac 180
ctgttctatc agtggtatcc gtttgatgca ctgcatggta tgaaacattg gcagcatttt 240
atcacccagg actttaaaca gtttagccag gccgatctgc tggttccgtg tgaactgtat 300
gaaagccatg gttgttatag cggtggtgca gttaaaattg gtgatcagat tgcagtgttt 360
tataccggta atacccgtcg tccgagcgat aatcagcgtg ttccgtatca gaatctggcc 420
atttttagca aagatggtaa actgctgagc aaacgtccgc tgattgaaca ggcaccgcag 480
ggttataccg aacatgtgcg tgatccgaaa ccgtttctga ccaaagatgg caaaattcgc 540
tttatttgtg gtgcccagcg tgaaaatctg accggcaccg cactggtttt tgaaatggat 600
aatctggcag atacaccgcg tctgctgggc gaactggcac tgcctgcatt tgataatcag 660
ggcgttttta tgtgggaatg tccggatctg agccagatgg gcgataaaag tctgtttatt 720
tggagtccgc agggtaaagc acgcgaactg gaacagtatc agaacaatta tcatgcagtt 780
tatgcactgg gtgagctggc agatcgtcag tttcatgcag aacaaattgc agaactggat 840
cagggctttg atttttatgc accgcagacc tttagcggca cccagaccat gctgttaggt 900
tgggttggtc tgccggatct gtcatatccg accgatctgt ataaatggca tagcatgctg 960
agtatgcctc gtcagctgcg tctgcaggat ggtaaaatct atcagcagcc gattgagaac 1020
atctacaaaa acctgaccgc actgcagagc attaccgttg aaaaagaagc agaaattgcc 1080
gatctggacc gtgcatatct gaaatttgat gcaaatgcac agccgttcag cctgaaattt 1140
ttcaataatg cacagaacca gcgtctgatc ctgagctatg atggtgaaat gctgtgtctg 1200
gatcgtagcc agaccgaaca gaccgatagc atgaaaagct ttggtgataa acgttattgc 1260
cgcattgaag atctgcgtca ggttgaaatc ttttttgatc gtagcgtggc agaaatcttt 1320
ctgaatcagg gtgaaaaagc aatgaccagc cgctttttta tctgtgcacg cgaaaatcag 1380
ctgtgtaccg ataaaccgct gacactgcag gttggttatc cgaaaaaaat cgaagtggac 1440
tacaccaaat aa 1452
<210> 4
<211> 1647
<212> DNA
<213> 球形节杆菌
<220>
<223> Bff, β-呋喃果糖苷酶
<400> 4
atggaacgta cctgtattac cgttcgtgca attgtgcgtt ttcatattga acagcgtcag 60
accattgtga ataaacagcg taccaaacgt ggtattctga ccgcagcact gagcattggt 120
gcactgggtg caaccctgat tagcggtccg gcagttgcag caaccgatgc agcaccgggt 180
tttccgcagc cgaccgaaca tacccagaaa gcatatagcc cgaccgataa ctttaccagc 240
cgttggaccc gtgcagatgc aaaacagctg aaagcaatga gcgatccgga tgcaggtagc 300
cgtgaaaata gcatgccgac agaatatacc atgccgaccg ttagccagga ttttccggat 360
atgagcaatg aaaaagtttg ggtttgggat acctggcctc tgattgatga aaatgcaaat 420
cagtatagcg tgaacggcca agaaattatc tttagcctgg ttgcagatcg caaactgggt 480
tttgatgaac gtcatcagta tgcacgtatc ggctatttct atcgtccggc aggtattccg 540
gcagatgaac gccctgaaga tggtggttgg acctatggtg gtcaggtgtt tgatgaaggt 600
gtgaccggta aaatctttga ggatcagagc tttacccatc agacccagtg gtctggtagc 660
gcacgtgtta gcaaaaatgg tgaaatcaaa ctgttcttta ccgacgtggc cttctatcgt 720
gataaagatg gtcaggatgt taaaccgtat gatagccgta ttgccctgag cgttggtcat 780
gttcatagca acaaaaaagg tgttaaactg accggcttca acaaagttaa agaactgctg 840
caggcagatg gcaaaaacta tcagaatgca gcacagaaca gctattataa ctttcgtgat 900
ccgtttacct ttgtggatcc ggcacatccg ggtgaaacct atatggtttt tgaaggtaat 960
agcgccatgg atcgtgatga agcaaaatgt acagccgaag atctgggtta tcgtgaaggt 1020
gaaaccaatg gcgaaaccgt tgaacaggtg aataatagcg gtgcaaccta tcagattggt 1080
aatgttggtc tggcacgtgc aaaaaacaaa gcactgaccg aatgggaatt tctgcctccg 1140
attctgagcg caaattgtgt gaccgatcag accgaacgtc cgcagattta tatgcaggat 1200
ggcaaatatt acctgtttac cattagccat cgtagcacct ttgcaaccgg tattgatggt 1260
ccggaaggtg tttatggttt tgttggtaat ggtatccgta gcgattatca gccgctgaat 1320
cgtggtagcg gtctggccct gggtagtccg acaaatctga attttgcagc aggcaccccg 1380
tttgcaccgg attataacca gcatccgggt cagtttcagg cctatagcca ttatgttatg 1440
cctggtggcc tggttcagag ttttattgat accattggca ccaaagataa ctttgtgcgt 1500
ggtggcaccc tgggtccgac cgtgaaactg aacattaaag gtgatagcgc aaccgtggat 1560
tacaattatg gtgataatgg tttaggtggc tgggcagata ttcctgcaaa tcgtgaactg 1620
aaaaatagca aagccgtggc caaataa 1647
<210> 5
<211> 30
<212> PRT
<213> 枯草芽孢杆菌
<220>
<223> yvcE 信号肽
<400> 5
Met Arg Lys Ser Leu Ile Thr Leu Gly Leu Ala Ser Val Ile Gly Thr
1 5 10 15
Ser Ser Phe Leu Ile Pro Phe Thr Ser Lys Thr Ala Ser Ala
20 25 30
<210> 6
<211> 25
<212> PRT
<213> 枯草芽孢杆菌
<220>
<223> yoqM 信号肽
<400> 6
Met Lys Leu Arg Lys Val Leu Thr Gly Ser Val Leu Ser Leu Gly Leu
1 5 10 15
Leu Val Ser Ala Ser Pro Ala Phe Ala
20 25
<210> 7
<211> 30
<212> PRT
<213> 枯草芽孢杆菌
<220>
<223> yuaB 信号肽
<400> 7
Met Lys Arg Lys Leu Leu Ser Ser Leu Ala Ile Ser Ala Leu Ser Leu
1 5 10 15
Gly Leu Leu Val Ser Ala Pro Thr Ala Ser Phe Ala Ala Glu
20 25 30
<210> 8
<211> 21
<212> PRT
<213> 枯草芽孢杆菌
<220>
<223> pel 信号肽
<400> 8
Met Lys Lys Val Met Leu Ala Thr Ala Leu Phe Leu Gly Leu Thr Pro
1 5 10 15
Ala Gly Ala Asn Ala
20
<210> 9
<211> 24
<212> PRT
<213> 枯草芽孢杆菌
<220>
<223> pelB 信号肽
<400> 9
Met Lys Arg Leu Cys Leu Trp Phe Thr Val Phe Ser Leu Phe Leu Val
1 5 10 15
Leu Leu Pro Gly Lys Ala Leu Gly
20
<210> 10
<211> 24
<212> PRT
<213> 枯草芽孢杆菌
<220>
<223> yoaW 信号肽
<400> 10
Met Lys Lys Met Leu Met Leu Ala Phe Thr Phe Leu Leu Ala Leu Thr
1 5 10 15
Ile His Val Gly Glu Ala Ser Ala
20
<210> 11
<211> 28
<212> PRT
<213> 枯草芽孢杆菌
<220>
<223> yqxl 信号肽
<400> 11
Met Phe Lys Lys Leu Leu Leu Ala Thr Ser Ala Leu Thr Phe Ser Leu
1 5 10 15
Ser Leu Val Leu Pro Leu Asp Gly His Ala Lys Ala
20 25
<210> 12
<211> 32
<212> PRT
<213> 枯草芽孢杆菌
<220>
<223> lipA 信号肽
<400> 12
Met Lys Phe Val Lys Arg Arg Ile Ile Ala Leu Val Thr Ile Leu Met
1 5 10 15
Leu Ser Val Thr Ser Leu Phe Ala Leu Gln Pro Ser Ala Lys Ala Ala
20 25 30
<210> 13
<211> 28
<212> PRT
<213> 枯草芽孢杆菌
<220>
<223> lipB 信号肽
<400> 13
Met Lys Lys Val Leu Met Ala Phe Ile Ile Cys Leu Ser Leu Ile Leu
1 5 10 15
Ser Val Leu Ala Ala Pro Pro Ser Gly Ala Lys Ala
20 25
<210> 14
<211> 23
<212> PRT
<213> 枯草芽孢杆菌
<220>
<223> yogH 信号肽
<400> 14
Met Lys Arg Phe Ile Leu Val Leu Ser Phe Leu Ser Ile Ile Val Ala
1 5 10 15
Tyr Pro Ile Gln Thr Asn Ala
20
<210> 15
<211> 28
<212> PRT
<213> 枯草芽孢杆菌
<220>
<223> ybfO 信号肽
<400> 15
Met Lys Arg Met Ile Val Arg Met Thr Leu Pro Leu Leu Ile Val Cys
1 5 10 15
Leu Ala Phe Ser Ser Phe Ser Ala Ser Ala Arg Ala
20 25
<210> 16
<211> 28
<212> PRT
<213> 枯草芽孢杆菌
<220>
<223> sacB 信号肽
<400> 16
Met Asn Ile Lys Lys Phe Ala Lys Gln Thr Val Leu Thr Phe Thr Thr
1 5 10 15
Ala Leu Leu Ala Gly Gly Ala Thr Gln Ala Phe Ala
20 25
<210> 17
<211> 28
<212> PRT
<213> 枯草芽孢杆菌
<220>
<223> bglS 信号肽
<400> 17
Met Pro Tyr Leu Lys Arg Val Leu Leu Leu Leu Val Thr Gly Leu Phe
1 5 10 15
Met Ser Leu Phe Ala Val Thr Ala Thr Ala Ser Ala
20 25
<210> 18
<211> 28
<212> PRT
<213> 枯草芽孢杆菌
<220>
<223> yddT 信号肽
<400> 18
Met Arg Lys Lys Arg Val Ile Thr Cys Val Met Ala Ala Ser Leu Thr
1 5 10 15
Leu Gly Ser Leu Leu Pro Ala Gly Tyr Ala Ser Ala
20 25
<210> 19
<211> 25
<212> PRT
<213> 枯草芽孢杆菌
<220>
<223> yobB 信号肽
<400> 19
Met Lys Ile Arg Lys Ile Leu Leu Ser Ser Ala Leu Ser Phe Gly Met
1 5 10 15
Leu Ile Ser Ala Val Pro Ala Leu Ala
20 25
<210> 20
<211> 22
<212> PRT
<213> 酿酒酵母Saccharomyces cerevisiae
<220>
<223> pelB 信号肽
<400> 20
Met Lys Tyr Leu Leu Pro Thr Ala Ala Ala Gly Leu Leu Leu Leu Ala
1 5 10 15
Ala Gln Pro Ala Met Ala
20
<210> 21
<211> 21
<212> PRT
<213> 大肠杆菌
<220>
<223> phoA 信号肽
<400> 21
Met Lys Gln Ser Thr Ile Ala Leu Ala Leu Leu Pro Leu Leu Phe Thr
1 5 10 15
Pro Val Thr Lys Ala
20
<210> 22
<211> 25
<212> PRT
<213> 大肠杆菌
<220>
<223> lamB
<400> 22
Met Met Ile Thr Leu Arg Lys Leu Pro Leu Ala Val Ala Val Ala Ala
1 5 10 15
Gly Val Met Ser Ala Gln Ala Met Ala
20 25
<210> 23
<211> 21
<212> PRT
<213> 大肠杆菌
<220>
<223> ompA 信号肽
<400> 23
Met Lys Lys Thr Ala Ile Ala Ile Ala Val Ala Leu Ala Gly Phe Ala
1 5 10 15
Thr Val Ala Gln Ala
20
<210> 24
<211> 30
<212> PRT
<213> 大肠杆菌
<220>
<223> fhuD 信号肽
<400> 24
Met Ser Gly Leu Pro Leu Ile Ser Arg Arg Arg Leu Leu Thr Ala Met
1 5 10 15
Ala Leu Ser Pro Leu Leu Trp Gln Met Asn Thr Ala His Ala
20 25 30
<210> 25
<211> 32
<212> PRT
<213> 大肠杆菌
<220>
<223> mdoD
<400> 25
Met Asp Arg Arg Arg Phe Ile Lys Gly Ser Met Ala Met Ala Ala Val
1 5 10 15
Cys Gly Thr Ser Gly Ile Ala Ser Leu Phe Ser Gln Ala Ala Phe Ala
20 25 30
<210> 26
<211> 26
<212> PRT
<213> 大肠杆菌
<220>
<223> ycdO 信号肽
<400> 26
Met Thr Ile Asn Phe Arg Arg Asn Ala Leu Gln Leu Ser Val Ala Ala
1 5 10 15
Leu Phe Ser Ser Ala Phe Met Ala Asn Ala
20 25
<210> 27
<211> 19
<212> PRT
<213> 大肠杆菌
<220>
<223> dsbA 信号肽
<400> 27
Met Lys Lys Ile Trp Leu Ala Leu Ala Gly Leu Val Leu Ala Phe Ser
1 5 10 15
Ala Ser Ala
<210> 28
<211> 26
<212> PRT
<213> 粪产碱菌
<220>
<223> AF-ss
<400> 28
Met Gln Lys Gly Leu Val Arg Thr Gly Leu Ala Ala Ala Gly Leu Ile
1 5 10 15
Leu Gly Trp Ala Gly Ala Pro Thr His Ala
20 25
<210> 29
<211> 203
<212> DNA
<213> 人工序列
<220>
<223> PmglB_70UTR_SD8
<400> 29
tgcgtcgcca ttctgtcgca acacgccaga atgcggcggc gatcactaac tcaacaaatc 60
aggcgatgta accgctttca atctgtgagt gatttcacag tatcttaaca atgtgatagc 120
tatgattgca ccgtgcctac aagcatcgtg gaggtccgtg actttcacgc atacaacaaa 180
cattaaccaa gagaaaaaca gct 203
<210> 30
<211> 203
<212> DNA
<213> 人工序列
<220>
<223> PmglB_70UTR_SD10
<400> 30
tgcgtcgcca ttctgtcgca acacgccaga atgcggcggc gatcactaac tcaacaaatc 60
aggcgatgta accgctttca atctgtgagt gatttcacag tatcttaaca atgtgatagc 120
tatgattgca ccgtgcctac aagcatcgtg gaggtccgtg actttcacgc atacaacaaa 180
cattaaccaa ctgagaaaca gct 203
<210> 31
<211> 203
<212> DNA
<213> 人工序列
<220>
<223> PmglB-54UTR
<400> 31
tgcgtcgcca ttctgtcgca acacgccaga atgcggcggc gatcactaac tcaacaaatc 60
aggcgatgta accgctttca atctgtgagt gatttcacag tatcttaaca atgtgatagc 120
tatgattgca ccgtgcctac aagcatcgtg gaggtccgtg actttcacgc atacaacaaa 180
cattaacaaa aaccggagat acc 203
<210> 32
<211> 141
<212> DNA
<213> 人工序列
<220>
<223> Plac_70UTR
<400> 32
tgtgagttag ctcactcatt aggcacccca ggctttacac tttatgcttc cggctcgtat 60
gttgtgtgga atgcctacaa gcatcgtgga ggtccgtgac tttcacgcat acaacaaaca 120
ttaaccaagg aggaaacagc t 141
<210> 33
<211> 203
<212> DNA
<213> 人工序列
<220>
<223> PmglB_70UTR_SD9
<400> 33
tgcgtcgcca ttctgtcgca acacgccaga atgcggcggc gatcactaac tcaacaaatc 60
aggcgatgta accgctttca atctgtgagt gatttcacag tatcttaaca atgtgatagc 120
tatgattgca ccgtgcctac aagcatcgtg gaggtccgtg actttcacgc atacaacaaa 180
cattaaccaa aggaaaaaca gct 203
<210> 34
<211> 203
<212> DNA
<213> 人工序列
<220>
<223> PmglB_70UTR_SD4
<400> 34
tgcgtcgcca ttctgtcgca acacgccaga atgcggcggc gatcactaac tcaacaaatc 60
aggcgatgta accgctttca atctgtgagt gatttcacag tatcttaaca atgtgatagc 120
tatgattgca ccgtgcctac aagcatcgtg gaggtccgtg actttcacgc atacaacaaa 180
cattaaccaa ctaggaaaca gct 203
<210> 35
<211> 203
<212> DNA
<213> 人工序列
<220>
<223> PmglB_70UTR_SD5
<400> 35
tgcgtcgcca ttctgtcgca acacgccaga atgcggcggc gatcactaac tcaacaaatc 60
aggcgatgta accgctttca atctgtgagt gatttcacag tatcttaaca atgtgatagc 120
tatgattgca ccgtgcctac aagcatcgtg gaggtccgtg actttcacgc atacaacaaa 180
cattaaccaa ccgagaaaca gct 203
<210> 36
<211> 310
<212> DNA
<213> 人工序列
<220>
<223> PglpF_SD4
<400> 36
atgcgcaaat gcggcacgcc ttgcagatta cggtttgcca cacttttcat ccttctcctg 60
gtgacataat ccacatcaat cgaaaatgtt aataaatttg ttgcgcgaat gatctaacaa 120
acatgcatca tgtacaatca gatggaataa atggcgcgat aacgctcatt ttatgacgag 180
gcacacacat tttaagttcg atatttctcg tttttgctcg ttaacgataa gtttacagca 240
tgcctacaag catcgtggag gtccgtgact ttcacgcata caacaaacat taaccaacta 300
ggaaacagct 310
<210> 37
<211> 203
<212> DNA
<213> 人工序列
<220>
<223> PmglB_70UTR_SD7
<400> 37
tgcgtcgcca ttctgtcgca acacgccaga atgcggcggc gatcactaac tcaacaaatc 60
aggcgatgta accgctttca atctgtgagt gatttcacag tatcttaaca atgtgatagc 120
tatgattgca ccgtgcctac aagcatcgtg gaggtccgtg actttcacgc atacaacaaa 180
cattaaccaa gagcaaaaca gct 203
<210> 38
<211> 203
<212> DNA
<213> 人工序列
<220>
<223> PmglB_70UTR
<400> 38
tgcgtcgcca ttctgtcgca acacgccaga atgcggcggc gatcactaac tcaacaaatc 60
aggcgatgta accgctttca atctgtgagt gatttcacag tatcttaaca atgtgatagc 120
tatgattgca ccgtgcctac aagcatcgtg gaggtccgtg actttcacgc atacaacaaa 180
cattaaccaa ggaggaaaca gct 203
<210> 39
<211> 189
<212> DNA
<213> 人工序列
<220>
<223> PglpA_70UTR
<400> 39
gaaaacattc ataaattaaa tgtgaattgc cgcacacatt attaaataag atttacaaaa 60
tgttcaaaat gacgcatgaa atcacgtttc actttcgaat tatgagcgaa tatgcgcgat 120
gcctacaagc atcgtggagg tccgtgactt tcacgcatac aacaaacatt aaccaaggag 180
gaaacagct 189
<210> 40
<211> 239
<212> DNA
<213> 人工序列
<220>
<223> PglpT_70UTR
<400> 40
ccatttagcc atagtaaaaa catgaattgt ttgatttcgc gcatattcgc tcataattcg 60
aaagtgaaac gtgatttcat gcgtcatttt gaacattttg taaatcttat ttaataatgt 120
gtgcggcaat tcacatttaa tttatgaatg ttttcttaac atcgcggcat gcctacaagc 180
atcgtggagg tccgtgactt tcacgcatac aacaaacatt aaccaaggag gaaacagct 239
<210> 41
<211> 291
<212> DNA
<213> 人工序列
<220>
<223> PgatY_70UTR
<400> 41
cggcaaccta tgcctgatgc gacgctgaag cgtcttatca tgcctacata gcactgccac 60
gtatgtttac accgcatccg gcataaaaac acgcgcactt tgctacggct tccctatcgg 120
gaggccgttt ttttgccttt cactcctcga ataattttca tattgtcgtt tttgtgatcg 180
ttatctcgat atttaaaaac aaataatttc attatatttt gtgcctacaa gcatcgtgga 240
ggtccgtgac tttcacgcat acaacaaaca ttaaccaagg aggaaacagc t 291
<210> 42
<211> 300
<212> DNA
<213> 人工序列
<220>
<223> PglpF
<400> 42
gcggcacgcc ttgcagatta cggtttgcca cacttttcat ccttctcctg gtgacataat 60
ccacatcaat cgaaaatgtt aataaatttg ttgcgcgaat gatctaacaa acatgcatca 120
tgtacaatca gatggaataa atggcgcgat aacgctcatt ttatgacgag gcacacacat 180
tttaagttcg atatttctcg tttttgctcg ttaacgataa gtttacagca tgcctacaag 240
catcgtggag gtccgtgact ttcacgcata caacaaacat taaccaagga ggaaacagct 300
<210> 43
<211> 310
<212> DNA
<213> 人工序列
<220>
<223> PglpF_SD10
<400> 43
atgcgcaaat gcggcacgcc ttgcagatta cggtttgcca cacttttcat ccttctcctg 60
gtgacataat ccacatcaat cgaaaatgtt aataaatttg ttgcgcgaat gatctaacaa 120
acatgcatca tgtacaatca gatggaataa atggcgcgat aacgctcatt ttatgacgag 180
gcacacacat tttaagttcg atatttctcg tttttgctcg ttaacgataa gtttacagca 240
tgcctacaag catcgtggag gtccgtgact ttcacgcata caacaaacat taaccaactg 300
agaaacagct 310
<210> 44
<211> 310
<212> DNA
<213> 人工序列
<220>
<223> PglpF_SD5
<400> 44
atgcgcaaat gcggcacgcc ttgcagatta cggtttgcca cacttttcat ccttctcctg 60
gtgacataat ccacatcaat cgaaaatgtt aataaatttg ttgcgcgaat gatctaacaa 120
acatgcatca tgtacaatca gatggaataa atggcgcgat aacgctcatt ttatgacgag 180
gcacacacat tttaagttcg atatttctcg tttttgctcg ttaacgataa gtttacagca 240
tgcctacaag catcgtggag gtccgtgact ttcacgcata caacaaacat taaccaaccg 300
agaaacagct 310
<210> 45
<211> 310
<212> DNA
<213> 人工序列
<220>
<223> PglpF_SD8
<400> 45
atgcgcaaat gcggcacgcc ttgcagatta cggtttgcca cacttttcat ccttctcctg 60
gtgacataat ccacatcaat cgaaaatgtt aataaatttg ttgcgcgaat gatctaacaa 120
acatgcatca tgtacaatca gatggaataa atggcgcgat aacgctcatt ttatgacgag 180
gcacacacat tttaagttcg atatttctcg tttttgctcg ttaacgataa gtttacagca 240
tgcctacaag catcgtggag gtccgtgact ttcacgcata caacaaacat taaccaagag 300
aaaaacagct 310
<210> 46
<211> 350
<212> DNA
<213> 人工序列
<220>
<223> PmglB_16UTR
<400> 46
tgcgtcgcca ttctgtcgca acacgccaga atgcggcggc gatcactaac tcaacaaatc 60
aggcgatgta accgctttca atctgtgagt gatttcacag tatcttaaca atgtgatagc 120
tatgattgca ccgttttaac gttgtaaccc gtatgtaaca gtgaataatc acttttgccg 180
aggtaacagc gtcataacaa caattaaagc cgttttctgg agcgttaccg ggcatggaag 240
aacgaatttt aaaaagtgag cttcggcgtt cagtaacact tcattaactc tactgccccg 300
ccgagcattt atctcaagca ctaccctgca taagcaagga ggaaacagct 350
<210> 47
<211> 310
<212> DNA
<213> 人工序列
<220>
<223> PglpF_SD9
<400> 47
atgcgcaaat gcggcacgcc ttgcagatta cggtttgcca cacttttcat ccttctcctg 60
gtgacataat ccacatcaat cgaaaatgtt aataaatttg ttgcgcgaat gatctaacaa 120
acatgcatca tgtacaatca gatggaataa atggcgcgat aacgctcatt ttatgacgag 180
gcacacacat tttaagttcg atatttctcg tttttgctcg ttaacgataa gtttacagca 240
tgcctacaag catcgtggag gtccgtgact ttcacgcata caacaaacat taaccaaagg 300
aaaaacagct 310
<210> 48
<211> 300
<212> DNA
<213> 人工序列
<220>
<223> PglpF_SD7
<400> 48
gcggcacgcc ttgcagatta cggtttgcca cacttttcat ccttctcctg gtgacataat 60
ccacatcaat cgaaaatgtt aataaatttg ttgcgcgaat gatctaacaa acatgcatca 120
tgtacaatca gatggaataa atggcgcgat aacgctcatt ttatgacgag gcacacacat 180
tttaagttcg atatttctcg tttttgctcg ttaacgataa gtttacagca tgcctacaag 240
catcgtggag gtccgtgact ttcacgcata caacaaacat taaccaagag caaaacagct 300
<210> 49
<211> 310
<212> DNA
<213> 人工序列
<220>
<223> PglpF_SD6
<400> 49
atgcgcaaat gcggcacgcc ttgcagatta cggtttgcca cacttttcat ccttctcctg 60
gtgacataat ccacatcaat cgaaaatgtt aataaatttg ttgcgcgaat gatctaacaa 120
acatgcatca tgtacaatca gatggaataa atggcgcgat aacgctcatt ttatgacgag 180
gcacacacat tttaagttcg atatttctcg tttttgctcg ttaacgataa gtttacagca 240
tgcctacaag catcgtggag gtccgtgact ttcacgcata caacaaacat taaccaagag 300
ctaaacagct 310
<210> 50
<211> 189
<212> DNA
<213> 人工序列
<220>
<223> PglpA_16UTR
<400> 50
gaaaacattc ataaattaaa tgtgaattgc cgcacacatt attaaataag atttacaaaa 60
tgttcaaaat gacgcatgaa atcacgtttc actttcgaat tatgagcgaa tatgcgcgat 120
gcctacaagc atcgtggagg tccgtgactt tcacgcatac aacaaacatt aaccaaggag 180
gaaacagct 189
<210> 51
<211> 107
<212> DNA
<213> 大肠杆菌
<220>
<223> Plac
<400> 51
tgtgagttag ctcactcatt aggcacccca ggctttacac tttatgcttc cggctcgtat 60
gttgtgtgga attgtgagcg gataacaatt tcacacagga aacagct 107
<210> 52
<211> 300
<212> DNA
<213> 人工序列
<220>
<223> PglpF_SD3
<400> 52
gcggcacgcc ttgcagatta cggtttgcca cacttttcat ccttctcctg gtgacataat 60
ccacatcaat cgaaaatgtt aataaatttg ttgcgcgaat gatctaacaa acatgcatca 120
tgtacaatca gatggaataa atggcgcgat aacgctcatt ttatgacgag gcacacacat 180
tttaagttcg atatttctcg tttttgctcg ttaacgataa gtttacagca tgcctacaag 240
catcgtggag gtccgtgact ttcacgcata caacaaacat taaccaagaa caaaacagct 300
<210> 53
<211> 300
<212> DNA
<213> 人工序列
<220>
<223> PglpF_SD1
<400> 53
gcggcacgcc ttgcagatta cggtttgcca cacttttcat ccttctcctg gtgacataat 60
ccacatcaat cgaaaatgtt aataaatttg ttgcgcgaat gatctaacaa acatgcatca 120
tgtacaatca gatggaataa atggcgcgat aacgctcatt ttatgacgag gcacacacat 180
tttaagttcg atatttctcg tttttgctcg ttaacgataa gtttacagca tgcctacaag 240
catcgtggag gtccgtgact ttcacgcata caacaaacat taaccaaatt cgaaacagct 300
<210> 54
<211> 152
<212> DNA
<213> 肺炎克雷伯氏菌Klebsiella pneumoniae
<220>
<223> Pscr 启动子序列
<400> 54
ggttaacggc ccactttgct ggcgacatca caattcttaa accggtttag caatttttat 60
tttcaccgcg ttaccgacat gtttaccata tcaactaaac cggtttagca aacattagca 120
cactcactga tttacctttg gatgtcacca ac 152
<210> 55
<211> 332
<212> PRT
<213> 脑膜炎奈瑟氏球菌Neisseria meningitidis
<220>
<223> LgtA, β-1,3-N-乙酰葡糖胺转移酶
<400> 55
Met Gln Pro Leu Val Ser Val Leu Ile Cys Ala Tyr Asn Val Glu Lys
1 5 10 15
Tyr Phe Ala Gln Ser Leu Ala Ala Val Val Asn Gln Thr Trp Arg Asn
20 25 30
Leu Glu Ile Leu Ile Val Asp Asp Gly Ser Thr Asp Gly Thr Leu Ala
35 40 45
Ile Ala Lys Asp Phe Gln Lys Arg Asp Ser Arg Ile Lys Ile Leu Ala
50 55 60
Gln Ala Gln Asn Ser Gly Leu Ile Pro Ser Leu Asn Ile Gly Leu Asp
65 70 75 80
Glu Leu Ala Lys Ser Gly Met Gly Glu Tyr Ile Ala Arg Thr Asp Ala
85 90 95
Asp Asp Ile Ala Ala Pro Asp Trp Ile Glu Lys Ile Val Gly Glu Met
100 105 110
Glu Lys Asp Arg Ser Ile Ile Ala Met Gly Ala Trp Leu Glu Val Leu
115 120 125
Ser Glu Glu Lys Asp Gly Asn Arg Leu Ala Arg His His Arg His Gly
130 135 140
Lys Ile Trp Lys Lys Pro Thr Arg Pro Glu Asp Ile Ala Asp Phe Phe
145 150 155 160
Pro Phe Gly Asn Pro Ile His Asn Asn Thr Met Ile Met Arg Arg Ser
165 170 175
Val Ile Asp Gly Gly Leu Arg Tyr Asn Thr Glu Arg Asp Trp Ala Glu
180 185 190
Asp Tyr Gln Phe Trp Tyr Asp Val Ser Lys Leu Gly Arg Leu Ala Tyr
195 200 205
Tyr Pro Glu Ala Leu Val Lys Tyr Arg Leu His Ala Asn Gln Val Ser
210 215 220
Ser Lys Tyr Ser Ile Arg Gln His Glu Ile Ala Gln Gly Ile Gln Lys
225 230 235 240
Thr Ala Arg Asn Asp Phe Leu Gln Ser Met Gly Phe Lys Thr Arg Phe
245 250 255
Asp Ser Leu Glu Tyr Arg Gln Ile Lys Ala Val Ala Tyr Glu Leu Leu
260 265 270
Glu Lys His Leu Pro Glu Glu Asp Phe Glu Arg Ala Arg Arg Phe Leu
275 280 285
Tyr Gln Cys Phe Lys Arg Thr Asp Thr Leu Pro Ala Gly Ala Trp Leu
290 295 300
Asp Phe Ala Ala Asp Gly Arg Met Arg Arg Leu Phe Thr Leu Arg Gln
305 310 315 320
Tyr Phe Gly Ile Leu His Arg Leu Leu Lys Asn Arg
325 330
<210> 56
<211> 273
<212> PRT
<213> 幽门螺杆菌
<220>
<223> GalT, β-1,4-半乳糖基转移酶
<400> 56
Met Arg Val Phe Ala Ile Ser Leu Asn Gln Lys Val Cys Asp Thr Phe
1 5 10 15
Gly Leu Val Phe Arg Asp Thr Thr Thr Leu Leu Asn Ser Ile Asn Ala
20 25 30
Thr His His Gln Ala Gln Ile Phe Asp Ala Ile Tyr Ser Lys Thr Phe
35 40 45
Glu Gly Gly Leu His Pro Leu Val Lys Lys His Leu His Pro Tyr Phe
50 55 60
Ile Thr Gln Asn Ile Lys Asp Met Gly Ile Thr Thr Asn Leu Ile Ser
65 70 75 80
Glu Val Ser Lys Phe Tyr Tyr Ala Leu Lys Tyr His Ala Lys Phe Met
85 90 95
Ser Leu Gly Glu Leu Gly Cys Tyr Ala Ser His Tyr Ser Leu Trp Glu
100 105 110
Lys Cys Ile Glu Leu Asn Glu Ala Ile Cys Ile Leu Glu Asp Asp Ile
115 120 125
Thr Leu Lys Glu Asp Phe Lys Glu Gly Leu Asp Phe Leu Glu Lys His
130 135 140
Ile Gln Glu Leu Gly Tyr Ile Arg Leu Met His Leu Leu Tyr Asp Ala
145 150 155 160
Ser Val Lys Ser Glu Pro Leu Ser His Lys Asn His Glu Ile Gln Glu
165 170 175
Arg Val Gly Ile Ile Lys Ala Tyr Ser Glu Gly Val Gly Thr Gln Gly
180 185 190
Tyr Val Ile Thr Pro Lys Ile Ala Lys Val Phe Leu Lys Cys Ser Arg
195 200 205
Lys Trp Val Val Pro Val Asp Thr Ile Met Asp Ala Thr Phe Ile His
210 215 220
Gly Val Lys Asn Leu Val Leu Gln Pro Phe Val Ile Ala Asp Asp Glu
225 230 235 240
Gln Ile Ser Thr Ile Ala Arg Lys Glu Glu Pro Tyr Ser Pro Lys Ile
245 250 255
Ala Leu Met Arg Glu Leu His Phe Lys Tyr Leu Lys Tyr Trp Gln Phe
260 265 270
Val
<210> 57
<211> 439
<212> PRT
<213> 人工序列
<220>
<223> GalTK, β-1,3-半乳糖基转移酶
<400> 57
Met Ile Ser Val Tyr Ile Ile Ser Leu Lys Glu Ser Gln Arg Arg Leu
1 5 10 15
Asp Thr Glu Lys Leu Val Leu Glu Ser Asn Glu Lys Phe Lys Gly Arg
20 25 30
Cys Val Phe Gln Ile Phe Asp Ala Ile Ser Pro Lys His Glu Asp Phe
35 40 45
Glu Lys Phe Val Gln Glu Leu Tyr Asp Ser Ser Ser Leu Leu Lys Ser
50 55 60
Asp Trp Phe His Ser Asp Tyr Cys Tyr Gln Glu Leu Leu Pro Gln Glu
65 70 75 80
Phe Gly Cys Tyr Leu Ser His Tyr Leu Leu Trp Lys Glu Cys Val Lys
85 90 95
Leu Asn Gln Pro Val Val Ile Leu Glu Asp Asp Val Ala Leu Glu Ser
100 105 110
Asn Phe Met Gln Ala Leu Glu Asp Cys Leu Lys Ser Pro Phe Asp Phe
115 120 125
Val Arg Leu Tyr Gly His Tyr Trp Gly Gly His Lys Thr Asn Leu Cys
130 135 140
Ala Leu Pro Val Tyr Thr Glu Thr Glu Glu Ala Glu Ala Ser Ile Glu
145 150 155 160
Lys Thr Pro Ile Glu Asn Tyr Glu Val Thr Ser Pro Pro Pro Pro Asn
165 170 175
Pro Thr Arg Asp Thr Gln Gln Asp Phe Ile Thr Glu Thr Gln Gln Asp
180 185 190
Pro Lys Glu Leu Ser Glu Pro Cys Lys Ile Ala Pro Gln Lys Ile Ser
195 200 205
Phe Asn Gln Val Val Phe Lys Lys Ile Lys Arg Lys Leu Asn Arg Phe
210 215 220
Ile Gly Ser Ile Leu Ala Arg Thr Glu Val Tyr Lys Asn Ile Val Ala
225 230 235 240
Lys Tyr Asp Asp Leu Thr Thr Lys Tyr Asp Asp Leu Thr Thr Lys Tyr
245 250 255
Asp Asp Leu Thr Thr Lys Tyr Asp Asp Leu Thr Thr Lys Tyr Asp Asp
260 265 270
Leu Asn Lys Asn Ile Ala Glu Lys Tyr Asp Glu Leu Met Gly Lys Tyr
275 280 285
Glu Ser Leu Leu Ala Lys Glu Val Asn Ile Lys Glu Thr Phe Trp Glu
290 295 300
Ser Arg Ala Asp Ser Glu Lys Glu Ala Leu Phe Leu Asp His Phe Tyr
305 310 315 320
Leu Thr Ser Val Tyr Val Ala Thr Thr Ala Gly Tyr Tyr Leu Thr Pro
325 330 335
Lys Gly Ala Lys Thr Phe Ile Glu Ala Thr Glu Arg Phe Lys Ile Ile
340 345 350
Glu Pro Val Asp Met Phe Ile Asn Asn Pro Thr Tyr His Asp Ile Ala
355 360 365
Asn Phe Thr Tyr Val Pro Cys Pro Val Ser Leu Asn Lys His Ala Phe
370 375 380
Asn Ser Thr Ile Gln Asn Ala Lys Lys Pro Asp Ile Ser Leu Lys Pro
385 390 395 400
Pro Lys Lys Ser Tyr Phe Asp Asn Leu Phe Tyr His Lys Phe Asn Ala
405 410 415
Arg Lys Cys Leu Lys Ala Phe Asn Lys Tyr Ser Lys Gln Tyr Ala Pro
420 425 430
Leu Lys Thr Pro Lys Glu Val
435
<210> 58
<211> 292
<212> PRT
<213> 运动性硫曲霉菌
<220>
<223> Smob, α-1,2-岩藻糖基转移酶
<400> 58
Met Ile Ile Ser Gln Ile Ile Gly Gly Leu Gly Asn Gln Met Phe Gln
1 5 10 15
Tyr Ala Ala Gly Arg Ala Leu Ser Leu Val Arg Gly Gln Pro Leu Leu
20 25 30
Leu Asp Val Thr Gly Phe Ala Gly Tyr Gly Leu His Gln Gly Phe Glu
35 40 45
Leu Gln Arg Val Phe Asp Cys Pro Ile Gly Ile Ala Thr Glu Glu Asp
50 55 60
Val Arg Gly Ile Leu Gly Trp Gln Phe Ser Ala Gly Ile Arg Arg Ile
65 70 75 80
Val Ala Arg Pro Gly Met Ala Ala Phe Arg Arg Lys Gly Phe Ile Val
85 90 95
Glu Pro His Phe His Tyr Trp Pro Glu Ile Lys Asn Val Pro Arg Asp
100 105 110
Cys Tyr Leu Leu Gly Tyr Trp Gln Ser Glu Arg Tyr Phe Arg Ala Ala
115 120 125
Thr Ala Asp Ile Arg Ala Asp Phe Ser Phe Lys Ser Pro Leu Val Asn
130 135 140
Arg Asn Ala Glu Thr Ala Ala Gln Ile Asp Gln Val Asn Ala Ile Ser
145 150 155 160
Leu His Met Arg Arg Gly Asp Tyr Val Asn Asn Pro Lys Thr Ser Ala
165 170 175
Thr His Gly Leu Cys Ser Leu Asp Tyr Tyr Gln Ala Ala Ile Lys Phe
180 185 190
Val Ser Glu Arg Val Glu Glu Pro Phe Phe Phe Ile Phe Ser Asp Asp
195 200 205
Ile Ala Trp Val Lys Ala Asn Leu Lys Leu Asp Phe Pro Cys Gln Tyr
210 215 220
Val Asp His Asn His Gly Ala Glu Ser Phe Asn Asp Met His Leu Met
225 230 235 240
Ser Leu Cys Gln His His Ile Ile Ala Asn Ser Ser Phe Ser Trp Trp
245 250 255
Gly Ala Trp Leu Asn Ser Asp Pro Lys Lys Ile Val Leu Ala Pro Lys
260 265 270
Lys Trp Phe Ala Asn Lys Asn Asn Ile Lys Asp Leu Phe Pro Pro Gly
275 280 285
Trp Val Ser Leu
290
<210> 59
<211> 387
<212> PRT
<213> 巴登鲁希拉菌Rouxiella badensis
<220>
<223> Bad, MFS 转运蛋白
<400> 59
Met Ser Ser Arg Arg Leu Ser Ile Ile Phe Ala Thr Phe Leu Leu Val
1 5 10 15
Ser Phe Leu Thr Gly Ile Ala Gly Ala Leu Gln Ala Pro Thr Leu Ser
20 25 30
Leu Phe Leu Thr Asn Glu Val Lys Val Arg Pro Leu Trp Val Gly Leu
35 40 45
Phe Tyr Thr Val Asn Ala Leu Gly Gly Ile Val Ile Ser Phe Leu Leu
50 55 60
Ala Asn Tyr Ser Asp Lys Lys Gly Asp Arg Arg Lys Leu Leu Phe Phe
65 70 75 80
Cys Thr Leu Met Ala Ile Gly Asn Ser Leu Ile Phe Ala Tyr Ser Arg
85 90 95
Asp Tyr Leu Val Leu Ile Ser Val Gly Val Leu Leu Ala Ala Ile Gly
100 105 110
Asn Ala Ser Met Pro Gln Leu Phe Ala Leu Ala Arg Glu Tyr Ala Asp
115 120 125
Arg Ser Ala His Glu Val Val Met Phe Ser Ser Met Met Arg Ala Thr
130 135 140
Leu Ser Leu Ala Trp Val Leu Gly Pro Pro Ile Ser Phe Thr Leu Ala
145 150 155 160
Leu Asn Tyr Gly Phe Thr Leu Met Tyr Leu Cys Ala Ala Gly Val Phe
165 170 175
Ile Phe Ser Ala Leu Met Val Trp Phe Phe Leu Pro Ser Val Gly Arg
180 185 190
Ile Glu Gln Pro Val Asp Lys Val Val Val His Val Ser Ala Trp Lys
195 200 205
Asn Arg Asp Val Arg Leu Leu Phe Phe Ala Ser Leu Leu Met Trp Thr
210 215 220
Cys Asn Ile Met Tyr Ile Ile Asp Met Pro Leu Tyr Ile Thr Ser Asp
225 230 235 240
Leu Gly Leu Pro Glu Gly Leu Ala Gly Leu Leu Met Gly Ala Ala Ala
245 250 255
Gly Leu Glu Ile Pro Val Met Leu Ile Ala Gly Tyr Leu Val Lys Arg
260 265 270
Thr Gly Lys Arg Arg Leu Met Leu Cys Ala Ala Val Phe Gly Ile Leu
275 280 285
Phe Tyr Leu Gly Leu Val Leu Phe Gln Phe Lys Ala Ala Leu Met Ile
290 295 300
Leu Gln Leu Phe Asn Ala Ile Phe Ile Gly Ile Ile Ala Gly Ile Gly
305 310 315 320
Met Leu Tyr Phe Gln Asp Leu Met Pro Gly Arg Ala Gly Ser Ala Thr
325 330 335
Thr Leu Phe Thr Asn Ser Ile Ser Thr Gly Ala Ile Leu Ala Gly Val
340 345 350
Ile Gln Gly Thr Ile Val Gln Asn Phe Gly His Tyr Gln Val Tyr Trp
355 360 365
Met Ala Leu Ala Leu Ala Val Gly Ala Leu Val Leu Met Thr Arg Val
370 375 380
Lys Asn Val
385
<210> 60
<211> 394
<212> PRT
<213> Rosenbergiella nectarea
<220>
<223> Nec, MFS 转运蛋白
<400> 60
Met Gln Ser Phe Thr Pro Pro Ala Pro Lys Gly Gly Asn Pro Val Phe
1 5 10 15
Met Met Phe Met Leu Val Thr Phe Phe Val Ser Ile Ala Gly Ala Leu
20 25 30
Gln Ala Pro Thr Leu Ser Leu Tyr Leu Ser Gln Glu Leu Ala Ala Lys
35 40 45
Pro Phe Met Val Gly Leu Phe Phe Thr Ile Asn Ala Val Thr Gly Ile
50 55 60
Ile Ile Ser Phe Ile Leu Ala Lys Arg Ser Asp Arg Lys Gly Asp Arg
65 70 75 80
Arg Arg Leu Leu Met Phe Cys Cys Ala Met Ala Ile Ala Asn Ala Leu
85 90 95
Met Phe Ala Phe Val Arg Gln Tyr Val Val Leu Ile Thr Leu Gly Leu
100 105 110
Ile Leu Ser Ala Leu Thr Ser Val Val Met Pro Gln Leu Phe Ala Leu
115 120 125
Ala Arg Glu Tyr Ala Asp Arg Thr Gly Arg Glu Val Val Met Phe Ser
130 135 140
Ser Val Met Arg Thr Gln Met Ser Leu Ala Trp Val Ile Gly Pro Pro
145 150 155 160
Ile Ser Phe Ala Leu Ala Leu Asn Tyr Gly Phe Ile Thr Leu Tyr Leu
165 170 175
Val Ala Ala Ala Leu Phe Leu Leu Ser Leu Ile Leu Ile Lys Thr Thr
180 185 190
Leu Pro Ser Val Pro Arg Leu Tyr Pro Ala Glu Asp Leu Ala Lys Ser
195 200 205
Ala Ala Ser Gly Trp Lys Arg Thr Asp Val Arg Phe Leu Phe Ala Ala
210 215 220
Ser Val Leu Met Trp Val Cys Asn Leu Met Tyr Ile Ile Asp Met Pro
225 230 235 240
Leu Tyr Ile Ser Lys Ser Leu Gly Met Pro Glu Ser Phe Ala Gly Val
245 250 255
Leu Met Gly Thr Ala Ala Gly Leu Glu Ile Pro Val Met Leu Leu Ala
260 265 270
Gly Tyr Leu Ala Lys Arg Val Gly Lys Arg Pro Leu Val Ile Val Ala
275 280 285
Ala Val Cys Gly Leu Ala Phe Tyr Pro Ala Met Leu Val Phe His Gln
290 295 300
Gln Thr Gly Leu Leu Ile Ile Gln Leu Leu Asn Ala Val Phe Ile Gly
305 310 315 320
Ile Val Ala Gly Leu Val Met Leu Trp Phe Gln Asp Leu Met Pro Gly
325 330 335
Lys Ala Gly Ala Ala Thr Thr Leu Phe Thr Asn Ser Val Ser Thr Gly
340 345 350
Met Ile Phe Ala Gly Leu Cys Gln Gly Leu Leu Ser Asp Leu Leu Gly
355 360 365
His Gln Ala Ile Tyr Val Leu Ala Thr Val Leu Met Val Ile Ala Leu
370 375 380
Leu Leu Leu Leu Arg Val Lys Glu Gln Ala
385 390
<210> 61
<211> 393
<212> PRT
<213> 伯氏耶尔森菌Yersinia bercovieri
<220>
<223> YberC, MFS 转运蛋白
<400> 61
Met Lys Ser Ala Leu Thr Phe Ser Arg Arg Ile Asn Pro Val Phe Leu
1 5 10 15
Ala Phe Phe Val Val Ala Phe Leu Ser Gly Ile Ala Gly Ala Leu Gln
20 25 30
Ala Pro Thr Leu Ser Leu Phe Leu Ser Thr Glu Val Lys Val Arg Pro
35 40 45
Leu Trp Val Gly Leu Phe Tyr Thr Val Asn Ala Ile Ala Gly Ile Thr
50 55 60
Val Ser Phe Ile Leu Ala Lys Arg Ser Asp Ser Arg Gly Asp Arg Arg
65 70 75 80
Lys Leu Ile Met Val Cys Tyr Leu Met Ala Val Gly Asn Cys Leu Leu
85 90 95
Phe Ala Phe Asn Arg Asp Tyr Leu Thr Leu Ile Thr Ala Gly Val Leu
100 105 110
Leu Ala Ser Val Ala Asn Thr Ala Met Pro Gln Ile Phe Ala Leu Ala
115 120 125
Arg Glu Tyr Ala Asp Ser Ser Ala Arg Glu Val Val Met Phe Ser Ser
130 135 140
Ile Met Arg Ala Gln Leu Ser Leu Ala Trp Val Ile Gly Pro Pro Leu
145 150 155 160
Ser Phe Met Leu Ala Leu Asn Tyr Gly Phe Thr Leu Met Phe Ser Ile
165 170 175
Ala Ala Gly Ile Phe Val Leu Ser Ala Leu Val Val Trp Phe Ile Leu
180 185 190
Pro Ser Val Pro Arg Ala Glu Pro Val Val Asp Ala Pro Val Val Val
195 200 205
Gln Gly Ser Leu Phe Ala Asp Lys Asn Val Leu Leu Leu Phe Ile Ala
210 215 220
Ser Met Leu Met Trp Thr Cys Asn Thr Met Tyr Ile Ile Asp Met Pro
225 230 235 240
Leu Tyr Ile Thr Ala Ser Leu Gly Leu Pro Glu Arg Leu Ala Gly Leu
245 250 255
Leu Met Gly Thr Ala Ala Gly Leu Glu Ile Pro Ile Met Leu Leu Ala
260 265 270
Gly Tyr Ser Val Arg Tyr Phe Gly Lys Arg Lys Ile Met Leu Phe Ala
275 280 285
Val Leu Ala Gly Val Leu Phe Tyr Thr Gly Leu Val Leu Phe Lys Phe
290 295 300
Lys Thr Ala Leu Met Leu Leu Gln Ile Phe Asn Ala Ile Phe Ile Gly
305 310 315 320
Ile Val Ala Gly Ile Gly Met Leu Tyr Phe Gln Asp Leu Met Pro Gly
325 330 335
Arg Ala Gly Ala Ala Thr Thr Leu Phe Thr Asn Ser Ile Ser Thr Gly
340 345 350
Val Ile Leu Ala Gly Val Leu Gln Gly Gly Leu Thr Glu Thr Trp Gly
355 360 365
His Asp Ser Val Tyr Val Met Ala Met Val Leu Ser Ile Leu Ala Leu
370 375 380
Ile Ile Cys Ala Arg Val Arg Glu Ala
385 390
<210> 62
<211> 393
<212> PRT
<213> 弗氏耶尔森菌Yersinia frederiksenii
<220>
<223> Fred, MFS 转运蛋白
<400> 62
Met Lys Ser Ala Leu Thr Phe Ser Arg Arg Ile Asn Pro Val Phe Leu
1 5 10 15
Ala Phe Phe Val Val Ala Phe Leu Ser Gly Ile Ala Gly Ala Leu Gln
20 25 30
Ala Pro Thr Leu Ser Leu Phe Leu Ser Thr Glu Val Lys Val Arg Pro
35 40 45
Leu Trp Val Gly Leu Phe Tyr Thr Val Asn Ala Ile Ala Gly Ile Thr
50 55 60
Val Ser Phe Val Leu Ala Lys Arg Ser Asp Leu Arg Gly Asp Arg Arg
65 70 75 80
Lys Leu Ile Leu Val Cys Tyr Leu Met Ala Val Gly Asn Cys Leu Leu
85 90 95
Phe Ala Phe Asn Arg Asp Tyr Leu Thr Leu Ile Thr Ala Gly Val Leu
100 105 110
Leu Ala Ala Val Ala Asn Thr Ala Met Pro Gln Ile Phe Ala Leu Ala
115 120 125
Arg Glu Tyr Ala Asp Asn Ser Ala Arg Glu Val Val Met Phe Ser Ser
130 135 140
Ile Met Arg Ala Gln Leu Ser Leu Ala Trp Val Ile Gly Pro Pro Leu
145 150 155 160
Ser Phe Met Leu Ala Leu Asn Tyr Gly Phe Thr Leu Met Phe Cys Ile
165 170 175
Ala Ala Gly Ile Phe Val Leu Ser Ala Leu Val Val Trp Phe Ile Leu
180 185 190
Pro Ser Val Gln Arg Ala Glu Pro Val Met Asp Ala Pro Thr Val Ala
195 200 205
Gln Gly Ser Leu Phe Ala Asp Lys Asp Val Leu Leu Leu Phe Ile Ala
210 215 220
Ser Met Leu Met Trp Thr Cys Asn Thr Met Tyr Ile Ile Asp Met Pro
225 230 235 240
Leu Tyr Ile Thr Ala Ser Leu Gly Leu Pro Glu Arg Leu Ala Gly Leu
245 250 255
Leu Met Gly Thr Ala Ala Gly Leu Glu Ile Pro Ile Met Leu Leu Ala
260 265 270
Gly Tyr Ser Val Arg Arg Phe Gly Lys Arg Lys Ile Met Leu Phe Ala
275 280 285
Val Leu Ala Gly Val Leu Phe Tyr Thr Gly Leu Val Leu Phe Lys Phe
290 295 300
Lys Ser Ala Leu Met Leu Leu Gln Ile Phe Asn Ala Ile Phe Ile Gly
305 310 315 320
Ile Val Ala Gly Ile Gly Met Leu Tyr Phe Gln Asp Leu Met Pro Gly
325 330 335
Arg Ala Gly Ala Ala Thr Thr Leu Phe Thr Asn Ser Ile Ser Thr Gly
340 345 350
Val Ile Leu Ala Gly Val Leu Gln Gly Val Leu Thr Glu Thr Trp Gly
355 360 365
His Asn Ser Val Tyr Val Met Ala Met Ile Leu Ala Ile Leu Ser Leu
370 375 380
Ile Ile Cys Ala Arg Val Arg Glu Ala
385 390
<210> 63
<211> 392
<212> PRT
<213> 泛菌Pantoea vagans
<220>
<223> Vag, MFS 转运蛋白
<400> 63
Met Lys Ser Leu Leu Thr Arg Lys Arg Arg Ile Asn Pro Val Phe Leu
1 5 10 15
Ala Phe Met Ala Ala Ser Phe Met Ile Gly Val Ala Gly Ala Leu Gln
20 25 30
Ala Pro Thr Leu Ser Leu Phe Leu Thr Arg Glu Val Gln Ala Arg Pro
35 40 45
Leu Trp Val Gly Leu Phe Phe Thr Val Asn Ala Ile Ala Gly Ile Val
50 55 60
Val Ser Met Leu Val Ala Lys Arg Ser Asp Ser Arg Gly Asp Arg Arg
65 70 75 80
Thr Leu Ile Leu Phe Cys Cys Ala Met Ala Phe Cys Asn Ala Leu Leu
85 90 95
Phe Ala Phe Thr Arg His Tyr Leu Thr Leu Ile Thr Leu Gly Val Leu
100 105 110
Leu Ser Ala Leu Ala Ser Val Ser Met Pro Gln Ile Phe Ala Leu Ala
115 120 125
Arg Glu Tyr Ala Asp Gln Ser Ala Arg Glu Ala Val Met Phe Ser Ser
130 135 140
Val Met Arg Ala Gln Leu Ser Leu Ala Trp Val Ile Gly Pro Pro Leu
145 150 155 160
Ser Phe Ala Leu Ala Leu Asn Phe Gly Phe Val Thr Leu Phe Leu Val
165 170 175
Ala Ala Ala Leu Phe Leu Val Cys Ile Leu Leu Ile Lys Phe Thr Leu
180 185 190
Pro Ser Val Pro Arg Ala Glu Pro Leu Met Arg Ser Gly Gly Met Pro
195 200 205
Leu Ser Gly Trp Arg Asp Arg Asp Val Arg Leu Leu Phe Ile Ala Ser
210 215 220
Val Thr Met Trp Thr Cys Asn Thr Met Tyr Ile Ile Asp Met Pro Leu
225 230 235 240
Tyr Ile Ser Val Thr Leu Gly Leu Pro Glu Lys Leu Ala Gly Leu Leu
245 250 255
Met Gly Thr Ala Ala Gly Leu Glu Ile Pro Val Met Leu Leu Ala Gly
260 265 270
His Tyr Ala Lys Arg Val Gly Lys Arg Asn Leu Met Leu Ile Ala Val
275 280 285
Ala Ala Gly Val Leu Phe Tyr Ala Gly Leu Ala Met Phe Ala Ser Gln
290 295 300
Thr Ala Leu Met Ala Leu Gln Leu Phe Asn Ala Val Phe Ile Gly Ile
305 310 315 320
Ile Ala Gly Ile Gly Met Leu Trp Phe Gln Asp Leu Met Pro Gly Arg
325 330 335
Pro Gly Ala Ala Thr Thr Met Phe Thr Asn Ser Ile Ser Thr Gly Met
340 345 350
Ile Leu Ala Gly Val Ile Gln Gly Thr Leu Ser Glu Arg Phe Gly His
355 360 365
Ile Ala Val Tyr Trp Leu Ala Leu Gly Leu Ala Val Ala Ala Phe Ala
370 375 380
Met Ser Ala Arg Val Lys Asn Val
385 390
<210> 64
<211> 398
<212> PRT
<213> 粘质沙雷氏菌Serratia marcescens
<220>
<223> Marc, MFS 转运蛋白
<400> 64
Met Gln Arg Leu Ser Arg Leu Ser Leu Arg Ile Asn Pro Ile Phe Ala
1 5 10 15
Ala Phe Leu Leu Ile Ala Phe Leu Ser Gly Ile Ala Gly Ala Leu Leu
20 25 30
Thr Pro Thr Leu Ser Leu Phe Leu Thr Thr Glu Val Lys Val Arg Pro
35 40 45
Leu Trp Val Gly Leu Phe Tyr Thr Ala Asn Ala Val Ala Gly Ile Val
50 55 60
Val Ser Phe Leu Leu Ala Lys Arg Ser Asp Thr Arg Gly Asp Arg Arg
65 70 75 80
Arg Leu Ile Leu Leu Cys Cys Leu Met Ala Val Gly Asn Cys Leu Leu
85 90 95
Phe Ala Phe Asn Arg Asp Tyr Leu Thr Leu Ile Thr Ala Gly Val Leu
100 105 110
Met Ser Ala Val Ala Asn Thr Ala Met Pro Gln Ile Phe Ala Leu Ala
115 120 125
Arg Glu Tyr Ala Asp Ser Glu Ala Arg Glu Val Val Met Phe Ser Ser
130 135 140
Val Met Arg Ala Gln Leu Ser Leu Ala Trp Val Ile Gly Pro Pro Leu
145 150 155 160
Ser Phe Ala Leu Ala Leu Asn Tyr Gly Phe Thr Val Met Phe Leu Ile
165 170 175
Ala Ala Val Thr Phe Ala Val Cys Val Leu Leu Val Gly Phe Met Leu
180 185 190
Pro Ser Val Pro Arg Ala Ala Glu Asn Glu Gly Leu Gln Gly Gly Val
195 200 205
Ser Ala Pro Ile Ala Pro Ala Ser Ala Trp Arg Asn Arg Asp Val Arg
210 215 220
Leu Leu Phe Ile Ala Ser Met Leu Met Trp Thr Cys Asn Thr Leu Tyr
225 230 235 240
Ile Ile Asp Met Pro Leu Tyr Ile Thr Ala Asp Leu Gly Leu Pro Glu
245 250 255
Gly Leu Ala Gly Val Leu Met Gly Thr Ala Ala Gly Leu Glu Ile Pro
260 265 270
Ala Met Leu Leu Ala Gly Tyr Tyr Val Lys Arg Phe Gly Lys Arg Asn
275 280 285
Met Met Leu Leu Ala Val Val Ala Gly Val Leu Phe Tyr Leu Gly Leu
290 295 300
Thr Val Leu Glu Ser Lys Pro Ala Leu Ile Ala Leu Gln Leu Leu Asn
305 310 315 320
Ala Val Phe Ile Gly Ile Val Ala Gly Ile Gly Met Leu Tyr Phe Gln
325 330 335
Asp Leu Met Pro Gly Arg Pro Gly Ala Ala Thr Thr Leu Phe Thr Asn
340 345 350
Ser Ile Ser Thr Gly Val Ile Leu Ala Gly Val Leu Gln Gly Ala Leu
355 360 365
Val Glu Asn Leu Gly His Gly Ser Val Tyr Trp Met Ala Ala Leu Leu
370 375 380
Ala Leu Ala Ala Leu Gly Met Ser Ala Lys Val Arg Glu Val
385 390 395
<210> 65
<211> 505
<212> PRT
<213> 肺炎克雷伯菌Klebsiella pneumoniae
<220>
<223> ScrY
<400> 65
Met Tyr Lys Lys Arg Lys Leu Ala Ile Leu Ile Ala Leu Leu Thr Gly
1 5 10 15
Thr Ala Ala Ala His Gly Gln Thr Asp Leu Asn Ser Ile Glu Ala Arg
20 25 30
Leu Ala Ala Leu Glu Lys Arg Leu Gln Asp Ala Glu Thr Arg Ala Ser
35 40 45
Thr Ala Glu Ser Arg Ala Ala Ser Ala Glu Gln Lys Val Gln Gln Leu
50 55 60
Thr Gln Gln Gln Gln Gln Thr Gln Ala Thr Thr Gln Gln Val Ala Arg
65 70 75 80
Arg Thr Thr Gln Leu Glu Glu Lys Ala Glu Arg Pro Gly Gly Phe Glu
85 90 95
Phe His Gly Tyr Ala Arg Ser Gly Val Ile Met Asn Asp Ser Ala Ala
100 105 110
Ser Thr Lys Ser Gly Ala Tyr Met Thr Pro Ala Gly Glu Thr Gly Gly
115 120 125
Ala Ile Gly Arg Leu Gly Asn Gln Ala Asp Thr Tyr Val Glu Met Asn
130 135 140
Leu Glu His Lys Gln Thr Leu Asp Asn Gly Ala Thr Thr Arg Phe Lys
145 150 155 160
Val Met Val Ala Asp Gly Gln Thr Thr Tyr Asn Asp Trp Thr Ala Ser
165 170 175
Ser Ser Asp Leu Asn Val Arg Gln Ala Phe Val Glu Leu Gly Asn Leu
180 185 190
Pro Thr Phe Glu Gly Pro Phe Lys Gly Ser Thr Leu Trp Ala Gly Lys
195 200 205
Arg Phe Asp Arg Asp Asn Phe Asp Ile His Trp Ile Asp Ser Asp Val
210 215 220
Val Phe Leu Ala Gly Thr Gly Gly Gly Ile Tyr Asp Val Lys Trp Asn
225 230 235 240
Asp Ser Leu Arg Ser Asn Phe Ser Leu Tyr Gly Arg Asn Phe Gly Asp
245 250 255
Ile Ala Asp Ser Ser Asn Ser Val Gln Asn Tyr Ile Val Ser Met Asn
260 265 270
Asn Phe Ala Gly Pro Val Gln Met Met Val Ser Gly Met Arg Ala Lys
275 280 285
Asp Asn Asp Asp Arg Gln Asp Ala Asn Gly Asn Leu Val Lys Gly Asp
290 295 300
Ala Ala Asn Thr Gly Val His Ala Leu Leu Gly Leu His Asn Glu Ser
305 310 315 320
Phe Tyr Gly Leu Arg Asp Gly Thr Ser Lys Thr Ala Leu Leu Tyr Gly
325 330 335
His Gly Leu Gly Ala Glu Val Lys Gly Ile Gly Ser Asp Gly Ala Leu
340 345 350
Arg Pro Gly Ala Asn Thr Trp Arg Phe Ala Ser Tyr Gly Thr Thr Pro
355 360 365
Leu Ser Asp Arg Trp Phe Ile Ala Pro Ala Val Leu Ala Gln Ser Ser
370 375 380
Lys Asp Arg Tyr Val Asp Gly Asp Ser Tyr Gln Trp Ala Thr Leu Asn
385 390 395 400
Leu Arg Leu Ile Gln Glu Val Thr Gln Asn Phe Ala Leu Ala Trp Glu
405 410 415
Gly Ser Tyr Gln Tyr Met Asp Leu Gln Pro Glu Gly Tyr Asn Asp Arg
420 425 430
His Ala Val Asn Gly Ser Phe Tyr Lys Leu Thr Phe Ala Pro Thr Phe
435 440 445
Lys Val Gly Ser Ile Gly Asp Phe Phe Ser Arg Pro Glu Ile Arg Phe
450 455 460
Tyr Thr Ser Trp Met Asp Trp Ser Lys Lys Leu Asp Asn Tyr Ala Asn
465 470 475 480
Asp Asp Ala Leu Gly Ser Asn Gly Phe Lys Ser Gly Gly Glu Trp Ser
485 490 495
Phe Gly Met Gln Met Glu Thr Trp Phe
500 505
<210> 66
<211> 456
<212> PRT
<213> 肺炎克雷伯菌Klebsiella pneumoniae
<220>
<223> ScrA
<400> 66
Met Asp Phe Glu Gln Ile Ser Arg Ser Leu Leu Pro Leu Leu Gly Gly
1 5 10 15
Lys Glu Asn Ile Ala Ser Ala Ala His Cys Ala Thr Arg Leu Arg Leu
20 25 30
Val Leu Val Asp Asp Ala Leu Ala Asp Gln Gln Ala Ile Gly Lys Ile
35 40 45
Asp Gly Val Lys Gly Cys Phe Arg Asn Ala Gly Gln Met Gln Ile Ile
50 55 60
Phe Gly Thr Gly Val Val Asn Lys Val Tyr Ala Ala Phe Ile Gln Ala
65 70 75 80
Ala Gly Ile Ser Glu Ser Ser Lys Ser Glu Ala Ala Asp Leu Ala Ala
85 90 95
Lys Lys Leu Asn Pro Phe Gln Arg Ile Ala Arg Leu Leu Ser Asn Ile
100 105 110
Phe Val Pro Ile Ile Pro Ala Ile Val Ala Ser Gly Leu Leu Met Gly
115 120 125
Leu Leu Gly Met Val Lys Thr Tyr Gly Trp Val Asp Pro Ser Asn Ala
130 135 140
Leu Tyr Ile Met Leu Asp Met Cys Ser Ser Ala Ala Phe Ile Ile Leu
145 150 155 160
Pro Ile Leu Ile Gly Phe Thr Ala Ala Arg Glu Phe Gly Gly Asn Pro
165 170 175
Tyr Leu Gly Ala Thr Leu Gly Gly Ile Leu Thr His Pro Ala Leu Thr
180 185 190
Asn Ala Trp Gly Val Ala Ala Gly Phe His Thr Met Asn Phe Phe Gly
195 200 205
Ile Glu Val Ala Met Ile Gly Tyr Gln Gly Thr Val Phe Pro Val Leu
210 215 220
Leu Ala Val Trp Phe Met Ser Met Val Glu Lys Arg Leu Arg Arg Val
225 230 235 240
Ile Pro Asp Ala Leu Asp Leu Ile Leu Thr Pro Phe Leu Thr Val Ile
245 250 255
Ile Ser Gly Phe Ile Ala Leu Leu Leu Ile Gly Pro Ala Gly Arg Ala
260 265 270
Leu Gly Asp Gly Ile Ser Phe Ile Leu Ser Thr Leu Ile Ser His Ala
275 280 285
Gly Trp Leu Ala Gly Leu Leu Phe Gly Gly Leu Tyr Ser Val Ile Val
290 295 300
Ile Thr Gly Ile His His Ser Phe His Ala Ile Glu Ala Gly Leu Leu
305 310 315 320
Gly Asn Pro Ser Ile Gly Val Asn Phe Leu Leu Pro Ile Trp Ala Met
325 330 335
Ala Asn Val Ala Gln Gly Gly Ala Cys Phe Ala Val Trp Phe Lys Thr
340 345 350
Lys Asp Ala Lys Ile Lys Ala Ile Thr Leu Pro Ser Ala Phe Ser Ala
355 360 365
Met Leu Gly Ile Thr Glu Ala Ala Ile Phe Gly Ile Asn Leu Arg Phe
370 375 380
Val Lys Pro Phe Ile Ala Ala Leu Val Gly Gly Ala Ala Gly Gly Ala
385 390 395 400
Trp Val Val Ser Met His Val Tyr Met Thr Ala Val Gly Leu Thr Ala
405 410 415
Ile Pro Gly Met Ala Ile Val Gln Ala Ser Ser Leu Leu Asn Tyr Ile
420 425 430
Ile Gly Met Ala Ile Ala Phe Ala Val Ala Phe Ala Leu Ser Leu Thr
435 440 445
Leu Lys Tyr Lys Thr Asp Ala Glu
450 455
<210> 67
<211> 466
<212> PRT
<213> 肠道沙门菌亚种肠型鼠伤寒血清型
Salmonella enterica subsp. enterica serovar Typhimurium
<220>
<223> ScrB
<400> 67
Met Ser Leu Pro Ser Arg Leu Pro Ala Ile Leu Gln Ala Val Met Gln
1 5 10 15
Gly Gln Pro Arg Ala Leu Ala Asp Ser His Tyr Pro Arg Trp His His
20 25 30
Ala Pro Val Thr Gly Leu Met Asn Asp Pro Asn Gly Phe Ile Glu Phe
35 40 45
Ala Gly Arg Tyr His Leu Phe Tyr Gln Trp Asn Pro Leu Ala Cys Asp
50 55 60
His Thr Phe Lys Cys Trp Ala His Trp Ser Ser Ile Asp Leu Leu His
65 70 75 80
Trp Gln His Glu Pro Ile Ala Leu Met Pro Asp Glu Glu Tyr Asp Arg
85 90 95
Asn Gly Cys Tyr Ser Gly Ser Ala Val Asp Asn Asn Gly Thr Leu Thr
100 105 110
Leu Cys Tyr Thr Gly Asn Val Lys Phe Ala Glu Gly Gly Arg Thr Ala
115 120 125
Trp Gln Cys Leu Ala Thr Glu Asn Ala Asp Gly Thr Phe Arg Lys Ile
130 135 140
Gly Pro Val Leu Pro Leu Pro Glu Gly Tyr Thr Gly His Val Arg Asp
145 150 155 160
Pro Lys Val Trp Arg His Glu Asp Leu Trp Tyr Met Val Leu Gly Ala
165 170 175
Gln Asp Arg Gln Lys Arg Gly Lys Val Leu Leu Phe Ser Ser Ala Asp
180 185 190
Leu His Gln Trp Thr Ser Met Gly Glu Ile Ala Gly His Gly Ile Asn
195 200 205
Gly Leu Asp Asp Val Gly Tyr Met Trp Glu Cys Pro Asp Leu Phe Pro
210 215 220
Leu Gly Asp Gln His Ile Leu Ile Cys Cys Pro Gln Gly Ile Ala Arg
225 230 235 240
Glu Glu Glu Cys Tyr Leu Asn Thr Tyr Pro Ala Val Trp Met Ala Gly
245 250 255
Glu Phe Asp Tyr Ala Ala Gly Ala Phe Arg His Gly Glu Leu His Glu
260 265 270
Leu Asp Ala Gly Phe Glu Phe Tyr Ala Pro Gln Thr Met Leu Thr Ser
275 280 285
Asp Gly Arg Arg Leu Leu Val Gly Trp Met Gly Val Pro Glu Gly Glu
290 295 300
Glu Met Leu Gln Pro Thr Leu Asn Asn Gly Trp Ile His Gln Met Thr
305 310 315 320
Cys Leu Arg Glu Leu Glu Phe Ile Asn Gly Gln Leu Tyr Gln Arg Pro
325 330 335
Leu Arg Glu Leu Ser Ala Leu Arg Gly Glu Ala Asn Gly Trp Ser Gly
340 345 350
Asn Ala Leu Pro Leu Ala Pro Met Glu Ile Asp Leu Gln Thr Arg Gly
355 360 365
Gly Asp Met Leu Ser Leu Asp Phe Gly Gly Val Leu Thr Leu Glu Cys
370 375 380
Asp Ala Ser Gly Leu Arg Leu Ala Arg Arg Ser Leu Ala Ser Asp Glu
385 390 395 400
Met His Tyr Arg Tyr Trp Arg Gly Asn Val Arg Ser Leu Arg Val Phe
405 410 415
Ile Asp Gln Ser Ser Val Glu Ile Phe Ile Asn Gly Gly Glu Gly Val
420 425 430
Met Ser Ser Arg Tyr Phe Pro Ala Cys Ser Gly Gln Leu Thr Phe Ser
435 440 445
Gly Ile Thr Pro Asp Ala Phe Cys Tyr Trp Pro Leu Arg Thr Cys Met
450 455 460
Val Glu
465
<210> 68
<211> 334
<212> PRT
<213> 肠道沙门菌亚种肠型鼠伤寒血清型
Salmonella enterica subsp. enterica serovar Typhimurium
<220>
<223> ScrR
<400> 68
Met Lys Thr Lys Arg Val Thr Ile Lys Asp Ile Ala Glu Gln Ala Gly
1 5 10 15
Val Ser Lys Ala Thr Ala Ser Leu Val Leu Asn Gly Arg Gly Lys Glu
20 25 30
Leu Arg Val Ala Gln Glu Thr Arg Glu Arg Val Leu Ser Ile Ala Arg
35 40 45
Lys His His Tyr Gln Pro Ser Ile His Ala Arg Ser Leu Arg Asn Asn
50 55 60
Arg Ser His Thr Ile Gly Leu Val Val Pro Glu Ile Thr Asn His Gly
65 70 75 80
Phe Ala Val Phe Ala His Glu Leu Glu Met Leu Cys Arg Glu Ala Gly
85 90 95
Val Gln Leu Leu Ile Ser Cys Thr Asp Glu Asn Pro Gly Gln Glu Ser
100 105 110
Val Val Val Asn Asn Met Ile Ala Arg Gln Val Asp Gly Met Ile Val
115 120 125
Ala Ser Cys Met His Asn Asp Ala Asp Tyr Leu Lys Leu Ser Gln Gln
130 135 140
Leu Pro Val Val Leu Phe Asp Arg Cys Pro Asn Glu Ser Ala Leu Pro
145 150 155 160
Leu Val Met Thr Asp Ser Ile Thr Pro Thr Ala Glu Leu Ile Ser Arg
165 170 175
Ile Ala Pro Gln His Ser Asp Glu Phe Trp Phe Leu Gly Gly Gln Ala
180 185 190
Arg Leu Ser Pro Ser Arg Asp Arg Leu Thr Gly Phe Thr Gln Gly Leu
195 200 205
Ala Gln Ala Gly Ile Ala Leu Arg Pro Glu Trp Val Ile Asn Gly Asn
210 215 220
Tyr His Pro Ser Ser Gly Tyr Glu Met Phe Ala Ala Leu Cys Ala Arg
225 230 235 240
Leu Gly Arg Pro Pro Lys Ala Leu Phe Thr Ala Ala Cys Gly Leu Leu
245 250 255
Glu Gly Val Leu Arg Tyr Met Ser Gln His His Leu Leu Asp Ser Asp
260 265 270
Ile His Leu Thr Ser Phe Asp Asp His Tyr Leu Tyr Asp Ser Leu Ser
275 280 285
Leu Arg Ile Asp Thr Val Gln Gln Asp Asn Arg Gln Leu Ala Trp His
290 295 300
Cys Tyr Asp Leu Ile Ser Gln Leu Ile Glu Gly Asp Thr Pro Glu Thr
305 310 315 320
Leu Gln Arg Tyr Leu Pro Ala Thr Leu Gln Phe Arg His Gln
325 330

Claims (29)

1.一种基因修饰细胞,其包含编码转化酶的异源核酸序列,其中所述转化酶是包含SEQID NO:1的氨基酸序列或由其组成的SacC_Agal,或其氨基酸序列与SEQ ID NO:1具有至少80%同一性的功能同源物。
2.根据权利要求1所述的基因修饰细胞,其中内源性葡萄糖转运系统完全或部分失活。
3.根据权利要求2所述的基因修饰细胞,其中编码细胞质膜葡萄糖通透酶的ptsG基因完全或部分失活。
4.根据前述权利要求中任一项所述的基因修饰细胞,其中所述细胞能够产生一种或多种人乳寡糖(HMO)。
5.根据前述权利要求中任一项所述的基因修饰细胞,其中所述异源核酸序列包含编码信号肽的核酸序列,所述信号肽能够增强所述转化酶连续分泌到所述基因修饰细胞的周质和/或细胞外培养基中。
6.根据权利要求5所述的基因修饰细胞,其中所述信号肽选自表1,优选为SEQ ID NO:28的信号肽。
7.根据前述权利要求中任一项所述的基因修饰细胞,其中所述转化酶能够水解非磷酸化的蔗糖。
8.根据前述权利要求中任一项所述的基因修饰细胞,其中所述转化酶能够在细胞的周质空间和/或细胞外侧将蔗糖水解成果糖和葡萄糖。
9.根据前述权利要求中任一项所述的基因修饰细胞,其中所述异源核酸序列编码所述转化酶的附加型和/或基因组整合拷贝。
10.根据权利要求9所述的基因修饰细胞,其中所述细胞包含编码所述转化酶的异源核酸序列的至少两个基因组整合拷贝。
11.根据前述权利要求中任一项所述的基因修饰细胞,其中所述转化酶的表达使得能够利用蔗糖作为所述基因修饰细胞的主要和/或唯一碳源和/或主要和/或唯一能源。
12.根据前述权利要求中任一项所述的基因修饰细胞,其中所述转化酶不转运蔗糖。
13.根据前述权利要求中任一项所述的基因修饰细胞,其中所述细胞不包含完整的蔗糖利用系统。
14.根据前述权利要求中任一项的基因修饰细胞,其中所述异源核酸序列还包含一个或多个用于调控所述异源核酸序列的表达的调控元件。
15.根据权利要求14所述的基因修饰细胞,其中所述调控元件包含一个或多个诱导型启动子序列和/或一个或多个组成型启动子序列。
16.根据权利要求14或15中任一项所述的基因修饰细胞,其中所述调控元件是选自以下的启动子:如表6所示的PglpF(SEQ ID NO:42)或Plac(SEQ ID NO:51)或PmglB_UTR70(SEQ ID NO:38)或PglpA_70UTR(SEQ ID NO:39)或PglpT_70UTR(SEQ ID NO:40)或PgatY(SEQ ID NO:41)或这些启动子的变体。
17.根据前述权利要求中任一项所述的基因修饰细胞,其中所述基因修饰细胞是原核细胞或真核细胞。
18.根据前述权利要求中任一项所述的基因修饰细胞,其中所述基因修饰细胞是选自驹形氏酵母属Komagataella、克鲁维氏酵母属Kluyveromyces、耶氏酵母属Yarrowia、毕赤酵母属Pichia、酵母菌属Saccaromyces、裂殖酵母属Schizosaccharomyces或汉逊酵母属Hansenula的酵母细胞,或是选自曲霉属Aspargillus、镰刀菌属Fusarium或木霉菌属Thricoderma的丝状真菌。
19.根据前述权利要求中任一项所述的基因修饰细胞,其中所述基因修饰细胞选自埃希氏杆菌属Escherichia sp.、芽孢杆菌属Bacillus sp.、乳酸杆菌属lactobacillus sp.和弯曲杆菌属Campylobacter sp.。
20.根据权利要求1-19中任一项所述的基因修饰细胞用于生物合成生产的用途。
21.根据权利要求20所述的基因修饰细胞的用途,为用于生物合成生产一种或多种HMO。
22.用于生物合成生产一种或多种HMO的方法,所述方法包括以下步骤:
a)提供根据权利要求1-19中任一项所述的基因修饰细胞,
b)在含有蔗糖作为碳源的合适的细胞培养基中培养(a)的细胞,
c)收获步骤(b)中产生的HMO。
23.根据权利要求22所述的用于生物合成生产一种或多种HMO的方法,其中步骤a)的所述基因修饰细胞中的转化酶自身能够在所述基因修饰细胞的细胞外侧和/或周质空间中将蔗糖水解成果糖和葡萄糖,并且其中所述酶的表达足以能够利用蔗糖作为所述基因修饰细胞的碳源和/或能源。
24.根据权利要求22或23所述的用于生物合成生产一种或多种HMO的方法,其中步骤b)中的所述蔗糖是主要和/或唯一的碳源和/或能源。
25.一种在能够产生所需生物合成产物的基因修饰宿主细胞中进行生物合成生产的方法,所述方法包括以下步骤:
a)提供能够产生所需生物合成产物的非蔗糖利用(Suc-)宿主细胞或利用蔗糖的能力有限和/或低效的宿主细胞,
b)将编码转化酶的异源核酸序列引入所述宿主细胞中,其中所述转化酶是包含SEQ IDNO:1的氨基酸序列或由其组成的SacC_Agal,或其氨基酸序列与SEQ ID NO:1具有至少80%同一性的功能同源物,
c)在合适的细胞培养基中培养(b)的细胞,所述培养基含有蔗糖作为碳源,作为主要和/或唯一碳源,和/或作为能源,作为主要和/或唯一能源,和
d)收获步骤c)中产生的生物合成产物。
26.根据权利要求25所述的方法,其中所述宿主细胞的编码葡萄糖通透酶的ptsG基因完全或部分失活。
27.一种能够将蔗糖水解成葡萄糖和果糖的转化酶,其用于生物合成生产,其中所述转化酶是包含SEQ ID NO:1的氨基酸序列或由其组成的SacC_Agal,或其氨基酸序列与SEQ IDNO:1具有至少80%同一性的功能同源物。
28.根据权利要求27所述的用于生物合成生产的转化酶,其中所述转化酶能够在用于生物合成生产的细胞的周质空间和/或细胞外侧将非磷酸化蔗糖水解成果糖和葡萄糖。
29.根据权利要求27或28所述的用于生物合成生产的转化酶,其中生物合成产物是一种或多种HMO。
CN202280035391.3A 2021-05-17 2022-05-17 表达转化酶/蔗糖水解酶的微生物菌株 Pending CN117321071A (zh)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
DKPA202170248 2021-05-17
DKPA202270138A DK181442B1 (en) 2021-05-17 2022-03-25 Cells capable of producing one or more human milk oligosaccharides (hmos) comprising expression of an invertase, method comprising said cells for biosynthetic production and use of said cells for biosynthetic production; use of an invertase in a biosynthetic production
DKPA202270138 2022-03-25
PCT/EP2022/063314 WO2022243311A1 (en) 2021-05-17 2022-05-17 Microbial strain expressing an invertase/sucrose hydrolase

Publications (1)

Publication Number Publication Date
CN117321071A true CN117321071A (zh) 2023-12-29

Family

ID=89285298

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202280035391.3A Pending CN117321071A (zh) 2021-05-17 2022-05-17 表达转化酶/蔗糖水解酶的微生物菌株

Country Status (1)

Country Link
CN (1) CN117321071A (zh)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101970648A (zh) * 2007-12-18 2011-02-09 韩国科学技术院 具有使用蔗糖作为碳源能力的重组微生物
CN106460024A (zh) * 2014-06-27 2017-02-22 格礼卡姆股份公司 寡糖的制备
CN107603935A (zh) * 2010-07-12 2018-01-19 因比奥斯公司 用于生产附加值生物产品的代谢改造的生物
CN109554385A (zh) * 2018-07-24 2019-04-02 石家庄葛兰德生物科技有限公司 一种基因工程菌制备2-岩藻糖基乳糖的方法
CN110669747A (zh) * 2019-11-12 2020-01-10 广西师范大学 一种酶改制甜菊糖苷的制备用酶及其应用

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101970648A (zh) * 2007-12-18 2011-02-09 韩国科学技术院 具有使用蔗糖作为碳源能力的重组微生物
CN107603935A (zh) * 2010-07-12 2018-01-19 因比奥斯公司 用于生产附加值生物产品的代谢改造的生物
CN106460024A (zh) * 2014-06-27 2017-02-22 格礼卡姆股份公司 寡糖的制备
CN109554385A (zh) * 2018-07-24 2019-04-02 石家庄葛兰德生物科技有限公司 一种基因工程菌制备2-岩藻糖基乳糖的方法
CN110669747A (zh) * 2019-11-12 2020-01-10 广西师范大学 一种酶改制甜菊糖苷的制备用酶及其应用

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
QU, Y.N.等: "Biosynthesis of D-glucaric acid from sucrose with routed carbon distribution in metabolically engineered Escherichia coli", METABOLIC ENGINEERING, vol. 47, 30 April 2018 (2018-04-30), pages 393 - 400 *
ROYLE;S.: "SUB26766.1:protein ScrB[Avibacterium gallinarum]", GENBANK, 30 July 2018 (2018-07-30), pages 1 *

Similar Documents

Publication Publication Date Title
US20230193335A1 (en) Hmo production
US20230072639A1 (en) New major facilitator superfamily (mfs) protein (bad) in hmo production
US20230227876A1 (en) Hmo production
CN113166789A (zh) 岩藻糖基化寡糖lnfp-v的合成
US20230109661A1 (en) Hmo production
CN117321217A (zh) 用于体内生产纯LNFP-I的α-1,2-岩藻糖基转移酶的识别
JP2024516207A (ja) インベルターゼ/スクロースヒドロラーゼを発現する微生物株
US20240102063A1 (en) New major facilitator superfamily (mfs) protein (fred) in production of sialylated hmos
CN117321071A (zh) 表达转化酶/蔗糖水解酶的微生物菌株
DK181442B1 (en) Cells capable of producing one or more human milk oligosaccharides (hmos) comprising expression of an invertase, method comprising said cells for biosynthetic production and use of said cells for biosynthetic production; use of an invertase in a biosynthetic production
JP7331278B1 (ja) 3’slのインビボ合成のための新規なシアリルトランスフェラーゼ
US20230109937A1 (en) New major facilitator superfamily (mfs) protein (fred) in hmo production
JP2024517144A (ja) 細胞中のラクトース取り込みを改変することによるhmoの形成の増強
CN117355613A (zh) 产生以lnfp-i和2’-fl作为主要化合物的hmo共混物分布的方法
WO2023247537A1 (en) New sialyltransferases for in vivo synthesis of lst-c
WO2023166035A2 (en) New sialyltransferases for in vivo synthesis of 3&#39;sl and 6&#39;sl
WO2022243315A1 (en) Methods of producing hmo blend profiles with lnfp-i and 2&#39;-fl, with lnfp-i as the predominant compound
CN116802302A (zh) 唾液酸化hmo生产中的新主要易化子超家族(mfs)蛋白(fred)
CN117321210A (zh) 产生以lnfp-i和lnt作为主要化合物的hmo共混物的方法
EA046260B1 (ru) Получение огм

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination