CN116802302A

CN116802302A - 唾液酸化hmo生产中的新主要易化子超家族（mfs）蛋白（fred）

Info

Publication number: CN116802302A
Application number: CN202280010781.5A
Authority: CN
Inventors: M·彼得森; I·达里戈; K·贝奇坎普曼; M·帕帕扎基斯
Original assignee: Glycom AS
Current assignee: Glycom AS
Priority date: 2021-01-22
Filing date: 2022-01-21
Publication date: 2023-09-22

Abstract

本发明涉及在遗传修饰细胞中重组生产生物分子的领域。更具体地，本发明涉及使用表达主要易化子超家族(MFS)蛋白质的遗传修饰细胞重组生产唾液酸化人乳寡糖(HMO)的方法，所表达的蛋白质是Fred。

Description

唾液酸化HMO生产中的新主要易化子超家族(MFS)蛋白(FRED)

技术领域

背景技术

人乳寡糖(HMO)是不可消化的碳水化合物，是母乳的第三大成分。与人类母乳相比，没有其他哺乳动物具有类似浓度或复杂性的不可消化低聚糖。迄今为止，已鉴定出200多种HMO(参见XI Chen,Chapter 4of Advances in Carbohydrate Chemistry andBiochemistry,2015,Volume 72和Urashima等人:Milk Oligosaccharides,NovaBiomedical Books,New York,2011,ISBN:978-1-61122-831-1)。

由于发现了HMO在人类发育中的重要功能，因此在过去十年中HMO引起了人们的极大兴趣。除了其益生元特性外，HMO还具有其他积极作用，从而扩大了其应用领域(Kunz C.等人,(2014)Food Oligosaccharides:Production,Analysis and Bioactivity,1stEdition,p 5-20,Eds.Moreno J.and Luz Sanz M.,John Wiley&Sons,Ltd)。HMO的健康益处使其被批准用于食品(例如婴儿配方奶粉和食品)以及消费者保健产品。

HMO可以化学合成；然而，这对大规模生产提出了挑战。为了克服与HMO化学合成相关的挑战，已经开发了若干酶法和发酵方法。已经针对多种HMO，例如2’-岩藻糖基乳糖、3-岩藻糖基乳糖、乳-N-四糖、乳-N-新四糖、3’-唾液酸乳糖和6’-唾液酸乳糖开发了基于发酵的方法。基于发酵的方法通常利用基因改造的细菌菌株，例如重组大肠杆菌(E.coli)(有关综述，请参阅Bych等人,Current Opinion in Biotechnology 2019,56:130-137)。

HMO生物技术生产的最新发展使得克服细菌表达系统的某些固有局限性成为可能。例如，可以对产生HMO的细菌细胞进行基因修饰，以增加细菌中有限的细胞内核苷酸糖库(WO2012/112777)，以提高参与HMO产生的酶的活性(WO2016/040531)，或促进将合成的HMO分泌到细胞外介质中(WO2010/142305、WO2017/042382)。此外，重组细胞中目的基因的表达可以通过使用特定的启动子或其他基因表达调节子来调节，例如如WO2019/123324中所描述的。

糖流出转运蛋白的使用已在WO2010/142305和WO2017/042382中描述，并且具有通过产生高水平的HMO并允许HMO在生产过程中离开细胞而减少对细胞造成的代谢负担的优点。这种方法在重组HMO生产细胞工程中引起了越来越多的关注，例如，最近描述了几种新的糖转运蛋白基因编码蛋白和发酵过程，其可以促进重组生产的2’-岩藻糖基乳糖(2’-FL)这种人母乳中最丰富的HMO的流出(WO2018/077892、US2019/00323053、US2019/00323052)。

唾液酸化HMO的生产已在WO2007/101862中描述，其描述了从微生物生产例如3’-SL所需的修饰。由于唾液酸部分的酸性，唾液酸化HMO的产生导致细胞酸化，而由于细胞酸化的生理影响，这又导致总体生产结果不太有利。因此，增强特别是唾液酸化HMO从细胞中的输出将为细胞带来生理学益处，同时还简化唾液酸化HMO的下游收获和纯化，总体而言对于唾液酸化HMO的大规模生产具有巨大益处。

然而，目前还没有算法能够在多个蛋白质数据库(例如UniProt)中具有预测转运蛋白功能的众多细菌蛋白中精准确定能够流出不同重组产生的HMO结构的正确转运蛋白，因为定义糖转运蛋白底物特异性的结构-功能关系尚未得到充分研究，并且仍然高度不可预测。

本公开首次展示了特定异源糖流出转运蛋白在唾液酸化HMO生产菌株中用于提高生产的产品量以及其他有利的生产益处的用途。

发明内容

最近，本申请的发明人已经鉴定了主要易化子超家族(MFS)中的几种能够转运其他HMO例如3-FL、LNT、LNT-II、LNnT和LNFP-I的转运蛋白(WO2021/148615和WO2021/148614和WO2021/148611和WO2021/110610和PCT/EP2021/0514662和WO2021/148620和WO2021/148618)。本公开首次展示了异源糖流出转运蛋白Fred在唾液酸化HMO生产菌株中用于获得有利的生产效益的用途。

本公开表明，异源基因fred(编码来自主要易化子超家族(MFS)的Fred蛋白)在产生唾液酸化HMO的菌株中的过表达增加了从细胞输出的HMO的量，而不影响HMO的总体生产。鉴定对不同重组产生的HMO具有特异性的新型有效糖流出转运蛋白以及开发表达所述蛋白的重组细胞对于大规模工业HMO制造是有利的。

产生的HMO可以包括一个或多个唾液酸部分。在这方面，产生的HMO可选自3’-SL(3’-唾液酸乳糖)、6’-SL(6’-唾液酸乳糖)、LSTc(唾液酸乳-N-新四糖c)、LSTa(唾液酸乳-N-四糖a)、LSTb(唾液酸乳-N-四糖b)、3’-S,3-FL(唾液酸-3-岩藻糖基乳糖)和DS-LNT(二唾液酸乳-N-四糖)。特别地，3’-SL和6’-SL令人感兴趣，因为它们是最丰富的唾液酸化HMO。

因此，本发明涉及能够产生一种或多种唾液酸化人乳寡糖(HMO)的遗传修饰细胞，其中所述遗传修饰细胞包括编码SEQ ID NO:1的主要易化子超家族(MFS)多肽或其功能同源物的异源核酸序列，所述功能同源物具有与SEQ ID NO:1超过70％同一性，例如与SEQ IDNO:1至少80％、例如至少90％、例如至少95％、例如至少99％或例如至少99.7％同一性的氨基酸序列。

此外，遗传修饰细胞表达唾液酸转移酶。特别地，唾液酸转移酶选自α-2,3-唾液酸转移酶和α-2,6-唾液酸转移酶，例如表2的唾液酸转移酶。

在一个实施方式中，表达Fred的遗传修饰细胞可以进一步被修饰以异源表达SEQID NO:3的α-2,3-唾液酸转移酶和/或其功能同源物，所述功能同源物具有与SEQ ID NO:3至少70％，例如至少80％、例如至少90％、例如至少95％、例如至少99％或例如至少99％同一性的氨基酸序列。此外，遗传修饰细胞含有用于制造唾液酸糖核苷酸的生物合成途径。

在一个实施方式中，表达Fred的遗传修饰细胞可以进一步被修饰以异源表达SEQID NO:4的α-2,6-唾液酸转移酶和/或其功能同源物，所述功能同源物具有与SEQ ID NO:4至少70％，例如至少80％、例如至少90％、例如至少95％、例如至少99％或例如至少99％同一性的氨基酸序列。此外，遗传修饰细胞含有用于制造唾液酸糖核苷酸的生物合成途径。

在一个实施方式中，表达Fred的遗传修饰细胞可被进一步修饰以异源表达SEQ IDNO:3的α-2,3-唾液酸转移酶和SEQ ID NO:4的α-2,6-唾液酸转移酶和/或SEQ ID NO:3或4的功能同源物，所述功能同源物具有与SEQ ID NO:3或4至少70％，例如至少80％、例如至少90％、例如至少95％、例如至少99％或例如至少99％同一性的氨基酸序列。此外，遗传修饰细胞含有用于制造唾液酸糖核苷酸的生物合成途径。

根据本发明的遗传修饰细胞还可包括：包含用于调节异源核酸序列表达的调控元件的核酸序列。调控元件可以调节编码目的多肽的核酸的表达并且可以选自PglpF、PglpF_SD4和PglpF_SD7。

在本发明的一个实施方式中，所述调控元件调节SEQ ID NO:1中所示的MFS多肽或其功能同源物的表达，所述功能同源物具有与SEQ ID NO:1超过70％同一性，例如与SEQ IDNO:1至少80％、例如至少90％、例如至少95％、例如至少99％或例如至少99.7％同一性的氨基酸序列。

在一个优选的方面，所述调控元件调节SEQ ID NO:1中所示的MFS多肽或其功能同源物的表达，所述功能同源物具有与SEQ ID NO:1超过95.4％，例如超过99.7％、例如100％同一性的氨基酸序列。本发明显示使用表达Fred蛋白的HMO生产重组细胞导致与HMO发酵和纯化相关的HMO制造工艺的非常显著的改进。本文公开的用于HMO生产的重组细胞和方法提供了从细胞到上清液的更高的HMO分泌、更低的副产物形成或副产物与产物的比率以及在发酵液的下游加工期间促进HMO的回收。

发现编码Fred的DNA序列在不同HMO生产细胞中的表达与细胞外介质中某些特定HMO和生产细胞内其他HMO的积累以及HMO总产量的增加有关(参见WO2021/148620)。令人惊讶的是，发现所产生的HMO的流出量增加是由三或四单元单糖组成的HMO的特征，即三糖或四糖的HMO，例如2’-岩藻糖基乳糖(2’-FL)、3-岩藻糖基乳糖(3-FL)、3-唾液酸乳糖(3’-SL)、6’-唾液酸乳糖(6’-SL)、乳-N-三糖2(LNT-2)、乳-N-新四糖(LNnT)或乳-N-四糖(LNT)，尤其是2’-岩藻糖基乳糖(2’-FL)、3-岩藻糖基乳糖(3-FL)或乳-N-四糖(LNT)，如从本文的实施例中看到的，但不适用于较大的寡糖结构，如五糖或六糖，它们在生产细胞内部积累。

一方面，由所述细胞产生的HMO是唾液酸化HMO，例如但不限于选自3’-SL和6’-SL的一种或多种人乳寡糖。在一个优选的实施方式中，唾液酸化HMO是3’-SL。

更令人惊讶的是，发现在表达fred基因的相应HMO生产细胞中，HMO 3’-SL几乎完全是3’-SL并且几乎只在发酵培养基中发现。

本发明还涉及包括编码主要易化子超家族(MFS)多肽的核酸序列的核酸构建体，其中编码主要易化子超家族(MFS)多肽的核酸序列与SEQ ID NO:2具有至少70％、更优选至少80％、更优选至少90％、更优选至少95％、甚至更优选至少99％的序列同一性，本发明还涉及包括核酸构建体的遗传修饰细胞，其是大肠杆菌。

此外，本发明提供一种用于生物合成生产一种或多种唾液酸化人乳寡糖(HMO)的方法，该方法包括以下步骤：

(i)提供根据本发明的遗传修饰细胞；

(ii)在合适的细胞培养基中培养根据(i)的遗传修饰细胞以表达能够流出糖转运的所述多肽，并产生一种或多种唾液酸化人乳寡糖(HMO)，和；

(iii)收获步骤(ii)中产生的一种或多种唾液酸化HMO。

本发明还涉及包括编码主要易化子超家族(MFS)多肽的异源核酸序列的遗传修饰细胞或核酸构建体用于生物合成生产一种或多种唾液酸化人乳寡糖(HMO)的用途，所述核酸序列与SEQ ID NO:2具有至少70％序列同一性。

在优选的实施方式中，本发明还涉及遗传修饰细胞或核酸构建体的用途，所述遗传修饰细胞或核酸构建体包括：(i)一个或多个编码根据SEQ ID NO:1的MFS多肽或其与SEQID NO:1序列同一性超过70％、80％、94.5％或99.7％的功能同源物的核酸序列，其中编码MFS多肽的核酸序列与SEQ ID NO:2具有至少70％、例如至少80％序列同一性，(ii)一个或多个编码一种或多种具有唾液酸转移酶能力的多肽的异源核酸序列，以及一个或多个包括调控元件的核酸序列，所述调控元件调节第(i)点和/或第(ii)点所述核酸序列的任意一个或多个的表达。

如上所述，在培养能够产生一种或多种唾液酸化HMO的遗传修饰细胞(该细胞包括编码Fred转运蛋白的核酸序列)期间，令人惊奇地发现相应的一种或多种唾液酸化HMO以高产量产生，同时副产物和生物质的形成减少。这有利于改善下游过程中HMO的回收率，例如，总体回收和纯化过程可以包括更少的步骤，并且可以缩短纯化的总时间。

特别地，改进产物回收的效果使得本发明优于现有技术的公开内容。

本发明的其他方面和有利特征通过下面的非限制性实施例进行详细描述和说明。

附图说明

图1分别显示修饰的大肠杆菌菌株的相对3’-SL产量，在菌株2和1中整合(菌株2)及不整合(菌株1)SEQ ID NO:2的fred基因，所述fred基因编码用于SEQ ID NO:1的FredMFS转运蛋白的表达，数据通过深孔补料分批测定获得。

图2显示整合(菌株2)及不整合(菌株1)SEQ ID NO:2的fred基因的修饰的大肠杆菌菌株的细胞内部和外部的3’-SL的相对分布，所述fred基因编码用于SEQ ID NO:1的FredMFS转运蛋白的表达。数据通过深孔补料分批测定获得。

图3显示整合(菌株2，批次GDF21173和GDF21177)及不整合(菌株1，批次GDF21170和GDF21174)SEQ ID NO:2的fred基因的修饰的大肠杆菌菌株的细胞内发酵液的沉淀和上清液级分之间的3’-SL分布的时间曲线，所述fred基因编码用于SEQ ID NO:1的Fred MFS转运蛋白的表达。

图4显示整合(菌株2，批次GDF21173和GDF21177)及不整合(菌株1，批次GDF21170和GDF21174)SEQ ID NO:2的fred基因的修饰的大肠杆菌菌株的细胞内整个发酵过程中生物湿质量(BWM)发展的时间曲线，所述fred基因编码用于SEQ ID NO:1的Fred MFS转运蛋白的表达。

图5显示整合(菌株4)及不整合(菌株3)SEQ ID NO:2的fred基因的修饰的大肠杆菌菌株的细胞内发酵液的沉淀和上清液级分之间的3’-SL分布的时间曲线，所述fred基因编码用于SEQ ID NO:1的Fred MFS转运蛋白的表达。

图6显示整合(菌株4)及不整合(菌株3)SEQ ID NO:2的fred基因的修饰的大肠杆菌菌株的细胞内整个发酵过程中生物湿质量(BWM)发展的时间曲线，所述fred基因编码用于SEQ ID NO:1的Fred MFS转运蛋白的表达。菌株3和菌株4具有从基因组整合并过表达的neuBCA基因。

图7显示与没有转运蛋白的细胞(菌株1)相比，表达替代MFS转运蛋白YberC(菌株5)的细胞中3’-SL的相对产量(A)，以及沉淀和上清液之间的分布(B)。数据通过深孔补料分批测定获得。

具体实施方式

下面对本发明的实施方式进行进一步详细说明。除非另有明确说明，特征的每个具体变型可以应用于本发明的其他实施方式。

一般而言，除非另有明确定义或说明，否则本文中使用的所有术语应根据其在技术领域中的普通含义来解释，并且适用于本发明的所有方面和实施方式。

除非另有明确说明，所有提及“一/所述”(“a/an/the”)“[细胞、序列、基因、转运蛋白、步骤等]”应开放地解释为指所述细胞、序列、基因、转运蛋白、步骤等的至少一种情况。

除非另有明确说明，否则本文公开的任何方法的步骤不必按照所公开的确切顺序执行。

本发明总体上涉及用于高效生产寡糖的遗传修饰细胞以及所述遗传修饰细胞在生产寡糖的方法中的用途。具体地，本发明涉及能够合成寡糖、优选异源寡糖、特别是人乳寡糖(HMO)的遗传修饰细胞。

因此，本发明的遗传修饰细胞是经修饰以表达一组重组核酸的宿主细胞，所述重组核酸是细胞合成一种或多种HMO所必需的(其使得宿主细胞能够合成一种或多种HMO)，例如如下所述的编码一种或多种具有糖基转移酶活性的酶的基因。本发明的产生寡糖的重组细胞被进一步修饰以包括异源重组核酸序列，优选DNA序列，其编码源自细菌弗氏耶尔森菌(Yersinia frederiksenii)的推定MFS(主要易化子超家族)转运蛋白。

具体地，本发明涉及针对生产一种或多种特定寡糖、特别是一种或多种特定HMO而优化的遗传修饰细胞，其包括编码Fred蛋白的重组核酸。

具有SEQ ID NO:2的核酸序列的编码Fred蛋白的核酸序列在本文中被标识为“Fred编码核酸/DNA”或“fred基因”或“fred”。

本文中可互换地标识为“Fred蛋白”或“Fred转运蛋白”或“Fred MFS(主要易化子超家族)转运蛋白”或“Fred”的MFS转运蛋白具有SEQ ID NO:1的氨基酸序列；本文中标识为SEQ ID NO:1的氨基酸序列是与具有GenBank登录号WP_087817556.1的氨基酸序列具有100％同一性的氨基酸序列。

因此，本发明的一方面涉及能够产生一种或多种人乳寡糖(HMO)的遗传修饰细胞，其中所述遗传修饰细胞包括编码能够糖转运的多肽的异源核酸序列，所述核酸序列与SEQID NO:2具有至少70％、更优选至少80％、更优选至少90％、更优选至少95％并且甚至更优选至少99％序列同一性。

因此，本发明的一方面涉及能够产生一种或多种唾液酸化人乳寡糖(HMO)的遗传修饰细胞，其中所述遗传修饰细胞包括编码能够糖转运的多肽的异源核酸序列，所述核酸序列与SEQ ID NO:2具有至少70％、更优选至少80％、更优选至少90％、更优选至少95％并且甚至更优选至少99％序列同一性。

此外，本发明涉及针对生产一种或多种特定寡糖、特别是一种或多种特定HMO而优化的遗传修饰细胞，其包括编码与SEQ ID NO:1的氨基酸序列具有超过95.4％，例如至少95.5％序列同一性、优选至少96％、更优选至少97％、更优选至少98％、甚至更优选至少99％序列同一性的蛋白质的重组核酸。

此外，在一个优选的方面，本发明涉及能够产生一种或多种唾液酸化人乳寡糖(HMO)的遗传修饰细胞，其包括编码与SEQ ID NO:1的氨基酸序列具有超过70％，例如至少80％序列同一性、优选至少95％、更优选至少98％、更优选至少99％、甚至更优选至少99.9％序列同一性的蛋白质的重组核酸。

Fred转运蛋白在遗传修饰的HMO生产细胞中的存在导致HMO，特别是唾液酸化HMO的输出增加，使得与无Fred转运蛋白的相同细胞相比，更大比例的HMO存在于培养液的上清液中。优选地，至少80％的唾液酸化HMO，例如3’-SL、6’-SL、FSL、DS-LNT、LSTc、LSTa和LSTb，被输出到细胞外。特别是至少80％的3’-SL或6’-SL被输出到细胞外。优选地，HMO(例如3’-SL或6’-SL)的总体生产不会受到Fred转运蛋白的存在的显著影响。

本文中的术语“功能同源物”是指具有与SEQ ID NO:1超过70％，例如71％-99.9％、例如95.4％、例如95.5％-99.7％或100％同一性的氨基酸序列、并且具有有益于实现本发明的至少一种有利效果的功能(例如，所产生的HMO的回收率、HMO生产效率和/或HMO生产细胞的生存力增加)的蛋白质。

术语“主要易化子超家族(MFS)”是指次级主动转运蛋白类的一个大且极其多样化的家族，其负责转运一系列不同的底物，包括糖、药物、疏水性分子、肽、有机离子等。糖转运蛋白的特异性是高度不可预测的，对例如寡糖具有特异性的新型转运蛋白的鉴定需要无负担的实验室实验(更多详细信息请参见Reddy V.S.等人,(2012),FEBS J.279(11):2022–2035的综述)。术语“MFS转运蛋白”在本文中是指促进寡糖(优选HMO)通过细胞膜的转运、优选将由遗传修饰的细胞合成的HMO/寡糖从细胞胞浆转运至细胞培养基的蛋白质，优选包括三个或四个糖单元的HMO/寡糖，例如2’-FL、3-FL、LNT-2、LNT、LNnT、3’-SL或6’-SL。另外或可选地，MFS转运蛋白还可以促进不被认为是根据本发明的HMO或寡糖的分子(例如乳糖、葡萄糖、细胞代谢物或毒素)的流出。

术语“Fred”用于描述MFS转运蛋白类别的一个成员。本文中标识为SEQ ID NO:1的氨基酸序列是与具有GenBank登录号WP_087817556.1的氨基酸序列100％相同的氨基酸序列。具有SEQ ID NO:1的氨基酸序列的MFS转运蛋白在本文中可互换地被称为“Fred蛋白”或“Fred转运蛋白”或“Fred MFS(主要易化子超家族)转运蛋白”或“Fred”。编码Fred蛋白的核酸序列在本文中被标识为SEQ ID NO:2“Fred编码核酸/DNA”或“fred基因”或“fred”。

本文使用的术语“唾液酸转移酶”是指能够将唾液酸从活化的供体分子转移至寡糖受体形成糖苷键的蛋白质或多肽。唾液酸转移酶属于Cazy家族29。一种类型的唾液酸转移酶可以通过α-2,3连接将唾液酸添加到半乳糖，而另一种类型的唾液酸转移酶可以通过α-2,6连接将唾液酸添加到半乳糖或N-乙酰半乳糖胺。活化的供体分子优选是CMP-唾液酸或CMP-Neu5Ac。

在两种或多种核酸或氨基酸序列的上下文中，术语“[某一]的序列同一性％”意指当在比较窗口或指定的核酸或氨基酸序列上进行最大对应性比较和比对时，两种或多种序列在给定的百分比中具有共同的核苷酸或氨基酸残基(例如序列具有至少百分之90(％)同一性)。核酸或氨基酸序列的同一性百分比可使用具有默认参数的BLAST 2.0序列比较算法，或者通过人工比对和目视检查来测量(参见例如http://www.ncbi.nlm.nih.gov/BLAST/)。该定义也适用于测试序列的互补序列和具有缺失和/或添加的序列，以及具有取代的序列。适用于确定百分比同一性、序列同一性和比对的算法示例是BLAST 2.2.20+算法，其描述于Altschul等人Nucl.Acids Res.25,3389(1997)中。BLAST 2.2.20+用于确定本发明核酸和蛋白的序列同一性百分比。用于进行BLAST分析的软件可通过国家生物技术信息中心(http://www.ncbi.nlm.nih.gov/)公开获得。序列比对算法的实例是CLUSTALOmega(http://www.ebi.ac.uk/Tools/msa/clustalo/)、EMBOSS Needle(http://www.ebi.ac.uk/Tools/psa/emboss_needle/)、MAFFT(http://mafft.cbrc.jp/alignment/server/)或MUSCLE(http://www.ebi.ac.uk/Tools/msa/muscle/)。

为了本发明的目的，两个氨基酸序列之间的序列同一性使用如在EMBOSS包(EMBOSS:The European Molecular Biology Open Software Suite,Rice等人,2000,Trends Genet.16:276-277)的Needle程序中实施的Needleman-Wunsch算法(Needlemanand Wunsch,1970,J.Mo/.Biol.48:443-453)来确定，优选版本5.0.0或更高版本(可访问https://www.ebi.ac.uk/Tools/psa/emboss needle/)。使用的参数是空位开放罚分(gapopen penalty)10、空位扩展罚分(gap extension penalty)0.5和EBLOSUM62(30BLOSUM62的EMBOSS版本)替换矩阵(substitution matrix)。标记为“最长同一性”的Needle输出(使用-nobrief选项获得)用作同一性百分比，计算如下：(相同残基×100)/(比对长度-比对中空位总数)。

为了本发明的目的，两个核苷酸序列之间的序列同一性使用如在EMBOSS包(EMBOSS:The European Molecular Biology Open Software Suite,Rice等人,2000,Trends Genet.16:276-277)的Needle程序中实施的Needleman-Wunsch算法(Needlemanand Wunsch,1970如上文)来确定，10优选版本5.0.0或更高版本。使用的参数是空位开放罚分(gap open penalty)10、空位扩展罚分(gap extension penalty)0.5和DNAFULL(NCBINUC4.4的EMBOSS版本)替换矩阵。标记为“最长同一性”的Needle输出(使用-nobrief选项获得)用作同一性百分比，计算如下：(相同的脱氧核糖核苷酸×100)/(比对长度-比对中空位总数)。

在本发明的上下文中，术语“寡糖”是指含有数个单糖单元的糖聚合物。在一些实施方式中，优选的寡糖是由三个或四个单糖单元，即三糖或四糖组成的糖聚合物。本发明优选的寡糖是人乳寡糖(HMO)。

HMO

本文中的术语“人乳寡糖”或“HMO”意指人乳中发现的复杂碳水化合物(参见Urashima等人:Milk Oligosaccharides.Nova Science Publisher(2011)；或Chen,Adv.Carbohydr.Chem.Biochem.72,113(2015))。HMO具有在还原端包含乳糖单元的核心结构，该核心结构可由一个或多个β-N-乙酰基-乳糖胺基和/或一个或多个β-乳-N-二糖基单元延长，并且该核心结构可由α-L-岩藻吡喃基(α-L-fucopyranosyl)和/或α-N-乙酰基神经氨酰(唾液酸)部分取代。在这方面，非酸性(或中性)HMO不含唾液酸残基，而酸性HMO在其结构中具有至少一个唾液酸残基。非酸性(或中性)HMO可为岩藻糖基化或非岩藻糖基化的。此类中性非岩藻糖基化HMO的实例包括乳-N-三糖2(LNT-2)、乳-N-四糖(LNT)、乳-N-新四糖(LNnT)、乳-N-新六糖(LNnH)、对-乳-N-新六糖(pLNnH)、对-乳-N-六糖(pLNH)和乳-N-六糖(LNH)。中性岩藻糖基化HMO的实例包括2’-岩藻糖基乳糖(2’-FL)、乳-N-岩藻五糖I(LNFP-I)、乳-N-二岩藻六糖I(LNDFH-I)、3-岩藻糖基乳糖(3-FL)、二岩藻糖基乳糖(DFL)、乳-N-岩藻五糖II(LNFP-II)、乳-N-岩藻五糖III(LNFP-III)、乳-N-二岩藻六糖III(LNDFH-III)、岩藻糖基-乳-N-六糖II(FLNH-II)、乳-N-岩藻五糖V(LNFP-V)、乳-N-二岩藻六糖II(LNDFH-II)、岩藻糖基-乳-N-六糖I(FLNH-I)、岩藻糖基-对-乳-N-六糖I(FpLNH-I)、岩藻糖基-对-乳-N-新六糖II(F-pLNnH II)和岩藻糖基-乳-N-新六糖(FLNnH)。

酸性和唾液酸化HMO的实例包括3’-唾液酸乳糖(3’-SL)、6’-唾液酸乳糖(6’-SL)、3-岩藻糖基-3’-唾液酸乳糖(FSL)、3’-O-唾液酸乳-N-四糖a(LST a)、岩藻糖基-LST a(FLST a)、6’-O-唾液酸乳-N-四糖b(LST b)、岩藻糖基-LST b(FLST b)、6’-O-唾液酸乳-N-新四糖(LST c)、岩藻糖基-LST c(FLST c)、3’-O-唾液酸乳-N-新四糖(LST d)、岩藻糖基-LST d(FLST d)、唾液酸-乳-N-六糖(SLNH)、唾液酸-乳-N-新六糖I(SLNH-I)、唾液酸-乳-N-新六糖II(SLNH-II)和二唾液酸-乳-N-四糖(DSLNT)。在本发明的上下文中，乳糖不被视为HMO种类。

在本发明的一个优选方面，三糖HMO是优选的，特别是选自3’-SL和6’-SL的三糖，例如特别是3’-SL。

在本发明的另一个优选的方面，四糖HMO是优选的，特别是四糖例如FSL。

2’-FL

2’-岩藻糖基乳糖(2’-FL或2’O-岩藻糖基乳糖)是一种三糖，更准确地说，是由L-岩藻糖、D-半乳糖和D-葡萄糖单元组成的岩藻糖基化中性三糖(Fucα1-2Galβ1-4Glc)。它是人母乳中天然存在的最常见的人乳寡糖(HMO)，约占所有HMO的30％。在遗传修饰细胞或酶促反应中，2’-FL主要是通过α1,2-岩藻糖基转移酶与乳糖和岩藻糖基供体的酶促反应产生的。

3-FL

3-岩藻糖基乳糖(3-FL)是一种三糖，更准确地说，是由D-半乳糖、L-岩藻糖和D-葡萄糖组成的岩藻糖基化中性三糖(Galβ1-4(Fucα1-3)Glc)。它天然存在于人乳中。在遗传修饰细胞或酶促反应中，3-FL主要通过α1,3-岩藻糖基转移酶或α1,3/4-岩藻糖基转移酶与乳糖和岩藻糖基供体的酶促反应产生。

LNT

乳-N-四糖(LNT)是一种四糖，更准确地说，是由半乳糖、N-乙酰葡糖胺、半乳糖和葡萄糖组成的中性四糖(GlcNAcβ1-3Galβ1-4Glc)。它天然存在于人乳中。

DFL

二岩藻糖基乳糖(DFL或2',3-二-O-岩藻糖基乳糖)是一种寡糖，更准确地说，是由L-岩藻糖、D-半乳糖、L-岩藻糖和D-葡萄糖组成的岩藻糖基化中性四糖(Fucα1-2Galβ1-4(Fucα1-3)Glc)。它天然存在于人乳中。在遗传修饰细胞或酶促反应中，DFL主要通过α1,2-岩藻糖基转移酶、α1,3-岩藻糖基转移酶和/或α1,3/4-岩藻糖基转移酶与乳糖和两种岩藻糖基供体的酶促反应产生。

3’-SL和6’-SL

3’-唾液酸乳糖和6’-唾液酸乳糖是寡糖，更准确地说，是由N-乙酰神经氨酰、半乳糖和葡萄糖组成的唾液酸化三糖(Neu5Ac-α2-3Galβ1-4-Glc或Neu5Ac-α2-6Galβ1-4-Glc)。它们天然存在于人乳中。3’-SL的具体功能优势包括通过抑制病原菌(例如幽门螺杆菌(Helicobacter pylori))及其毒素或病毒(例如轮状病毒(Rotavirus)的粘附来降低感染风险。3’-SL和6’-SL特别通过提供唾液酸(神经元的重要组成部分)来促进婴儿的大脑发育。

FSL(3’-S,3-FL)

3’-唾液酸-3-岩藻糖基乳糖是一种寡糖，更准确地说，是一种由N-乙酰神经氨酸、D-半乳糖、L-岩藻糖和D-葡萄糖单元组成的唾液酸化和岩藻糖基化四糖(Neu5Ac-α2-3Galβ1-4(Fucα1-3)Glc)。它天然存在于人乳中。

LST-a

唾液酸乳-N-四糖A是一种寡糖，更准确地说，是一种由N-乙酰神经氨酸、D-半乳糖、N-乙酰葡糖胺、D-半乳糖和D-葡萄糖单元组成的唾液酸化五糖(Neu5Ac-α2-3Galβ1-3GlcNAcβ1-3Galβ1-4Glc)。它天然存在于人乳中。

LST-b

唾液酸乳-N-四糖B是一种寡糖，更准确地说，是一种由D-半乳糖、N-乙酰神经氨酸、N-乙酰葡糖胺、D-半乳糖和D-葡萄糖单元组成的唾液酸化五糖(Galβ1-3(Neu5Ac-α2-6)GlcNAcβ1-3Galβ1-4Glc)。它天然存在于人乳中。

LST-c

唾液酸乳-N-新四糖C是一种寡糖，更准确地说，是一种由N-乙酰神经氨酸、D-半乳糖、N-乙酰葡糖胺、D-半乳糖和D-葡萄糖组成的唾液酸化五糖(Neu5Ac-α2-6Galβ1-4GlcNAcβ1-3Galβ1-4Glc)。它天然存在于人乳中。

DS-LNT

二唾液酸乳-N-四糖是一种寡糖，更准确地说，是一种由N-乙酰神经氨酸、D-半乳糖、N-乙酰神经氨酸、N-乙酰葡糖胺、D-半乳糖和D-葡萄糖单元组成的唾液酸化六糖(Neu5Ac-α2-3Galβ1-3(Neu5Ac-α2-6)GlcNAcβ1-3Galβ1-4Glc)。它天然存在于人乳中。

S-pLNnH

唾液酸-对-乳-N-新六糖是一种寡糖，更准确地说，是一种由N-乙酰神经氨酸、D-半乳糖、N-乙酰葡糖胺、D-半乳糖、N-乙酰葡糖胺、D-半乳糖和D-葡萄糖单元组成的唾液酸化七糖(Neu5Ac-α2-3Galβ1-4GlcNAcβ1-3Galβ1-4GlcNAcβ1-3Galβ1-4Glc)。

S-LNnH-I

唾液酸-乳-N-新六糖I是一种寡糖，更准确地说，是一种由N-乙酰神经氨酸、D-半乳糖、N-乙酰葡糖胺、D-半乳糖、N-乙酰葡糖胺、D-半乳糖和D-葡萄糖单元组成的唾液酸化七糖(Neu5Ac-α2-3Galβ1-4GlcNAcβ1-6(Galβ1-4GlcNAcβ1-3Galβ1-4Glc)。

DS-F-LNH II

二唾液酸-岩藻糖基-乳-N-六糖II是一种寡糖，更准确地说，是一种由N-乙酰神经氨酸、D-半乳糖、N-乙酰葡糖胺、N-乙酰神经氨酸、D-半乳糖、N-乙酰葡糖胺、L-岩藻糖、D-半乳糖和D-葡萄糖单元组成的唾液酸化、岩藻糖基化九糖(Neu5Ac-α2-3Galβ1-3(Neu5Ac-α2-6)GlcNAcβ1-3(Galβ1-4(Fucα1-3)Glc NAcβ1-6)Galβ1-4Glc)。

FS-LNnH-I

岩藻糖基-唾液酸-乳-N-新六糖I是一种寡糖，更准确地说是一种由N-乙酰神经氨酸、D-半乳糖、N-乙酰葡糖胺、D-半乳糖、L-岩藻糖、N-乙酰葡糖胺、D-半乳糖和D-葡萄糖单元组成的唾液酸化、岩藻糖基化八糖(Neu5Ac-α2-6Galβ1-4GlcNAcβ1-3(Galβ1-4(Fucα1-3)GlcNAcβ1-6)Galβ1-4Glc)。

FS-LNH

岩藻糖基-唾液酸-乳-N-六糖是一种寡糖，更准确地说，是一种由N-乙酰神经氨酸、D-半乳糖、N-乙酰葡糖胺、L-岩藻糖、D-半乳糖、N-乙酰葡糖胺、D-半乳糖和D-葡萄糖单元组成的唾液酸化、岩藻糖基化八糖(Neu5Ac-α2-6Galβ1-4GlcNAcβ1-6(Fucα1-2Galβ1-3GlcNAcβ1-3)Galβ1-4Glc)。

岩藻糖基-LST-a(FLST-a)

岩藻糖基-唾液酸乳-N-四糖A是一种寡糖，更准确地说，是一种由N-乙酰神经氨酸、D-半乳糖、L-岩藻糖、N-乙酰葡糖胺、D-半乳糖和D-葡萄糖单元组成的唾液酸化、岩藻糖基化六糖(Neu5Ac-α2-3Galβ1-3(Fucα1-4)GlcNAcβ1-3Galβ1-4Glc)。

岩藻糖基-LST-b(FLST-b)

岩藻糖基-唾液酸乳-N-四糖B是一种寡糖，更准确地说，是一种由L-岩藻糖、D-半乳糖、N-乙酰神经氨酸、N-乙酰葡糖胺、D-半乳糖和D-葡萄糖单元组成的唾液酸化、岩藻糖基化六糖(Fucα1-2Galβ1-3(Neu5Ac-α2-6)GlcNAcβ1-3Galβ1-4Glc)。

岩藻糖基-LST-c(FLST-c)

岩藻糖基-唾液酸乳-N-新四糖C是一种寡糖，更准确地说，是一种由N-乙酰神经氨酸、D-半乳糖、N-乙酰葡糖胺、D-半乳糖、L-岩藻糖和D-葡萄糖单元组成的唾液酸化、岩藻糖基化六糖(Neu5Ac-α2-6Galβ1-4GlcNAcβ1-3Galβ1-4(Fucα1-3)Glc)。

SLNH

唾液酸-乳-N-六糖是一种寡糖，更准确地说，是一种由N-乙酰神经氨酸、D-半乳糖、N-乙酰葡糖胺、D-半乳糖、N-乙酰葡糖胺、D-半乳糖和D-葡萄糖单元组成的唾液酸化七糖(Neu5Ac-α2-6Galβ1-4GlcNAcβ1-6(Galβ1-3GlcNAcβ1-3)Galβ1-4Glc)。

SLNH-II

唾液酸-乳-N-新六糖II是一种寡糖，更准确地说，是一种由N-乙酰神经氨酸、D-半乳糖、N-乙酰葡糖胺、D-半乳糖、N-乙酰葡糖胺、D-半乳糖和D-葡萄糖单元组成的唾液酸化七糖，(Neu5Ac-α2-6Galβ1-4GlcNAcβ1-3(Galβ1-4GlcNAcβ1-6)Galβ1-4Glc)。

■用于HMO合成的功能酶

为了能够合成一种或多种HMO，本发明的重组细胞包括至少一种编码具有糖基转移酶活性的功能酶的重组核酸。半乳糖基转移酶基因可(通过染色体整合)整合到遗传修饰细胞的基因组中，或者另选地，它可包含在质粒DNA中并表达为质粒携带的。如果产生HMO例如LNT或LNnT需要两种或更多种糖基转移酶，则编码具有糖基转移酶活性的不同酶的两种或更多种重组核酸可整合在基因组中和/或从质粒中表达，例如β-1,3-N-乙酰葡糖胺基转移酶(编码第一糖基转移酶的第一重组核酸)与β-1,3-半乳糖基转移酶(编码第二糖基转移酶的第二重组核酸)组合用于生产LNT，其中第一和第二重组核酸可彼此独立地进行染色体整合或整合在质粒上。

在一个优选实施方式中，第一和第二重组核酸均稳定整合到生产细胞的染色体中；在另一实施方式中，第一和第二糖基转移酶中的至少一种是质粒携带的。具有糖基转移酶活性的蛋白/酶(糖基转移酶)可在不同实施方式中选自具有以下项的活性的酶：α-1,2-岩藻糖基转移酶、α-1,3-岩藻糖基转移酶、α-1,3/4-岩藻糖基转移酶、α-1,4-岩藻糖基转移酶α-2,3-唾液酸转移酶、α-2,6-唾液酸转移酶、β-1,3-N-乙酰葡糖胺基转移酶、β-1,6-N-乙酰葡糖胺基转移酶、β-1,3-半乳糖基转移酶和β-1,4-半乳糖基转移酶。例如，2’-FL的生产需要修饰细胞表达活性α-1,2-岩藻糖基转移酶。为了生产3-FL，修饰细胞需要表达活性α-1,3-岩藻糖基转移酶。为了生产LNT，修饰细胞需要表达至少两种糖基转移酶，一种β-1,3-N-乙酰葡糖胺基转移酶和一种β-1,3-半乳糖基转移酶。为了生产6’-SL，修饰细胞须表达活性α-2,6-唾液酸转移酶和生成唾液酸糖核苷酸的途径，例如CMP-唾液酸，特别是CMP-neu5A的合成途径。为了生产3’-SL，修饰细胞须表达活性α-2,3-唾液酸转移酶和生成唾液酸糖核苷酸的途径，例如CMP-唾液酸，特别是CMP-neu5A的合成途径。可由生产细胞包含的重组基因编码的具有糖基转移酶活性的蛋白的一些非限制性实施方式可选自表1的非限制性示例。

表1：用于生产中性HMO的糖基转移酶

表2：用于生产唾液酸化HMO的糖基转移酶

在一个实施方式中，本发明的遗传修饰细胞被修饰以异源表达如SEQ ID NO:3所示的α-2,3-唾液酸转移酶和/或其功能同源物，所述功能同源物具有与SEQ ID NO:3至少70％，例如至少80％、例如至少90％、例如至少95％、例如至少99％或例如100％同一性的氨基酸序列。此外，遗传修饰细胞含有用于制造唾液酸糖核苷酸的生物合成途径。

在另一个实施方式中，本发明的遗传修饰细胞被修饰以异源表达如SEQ ID NO:4所示的α-2,6-唾液酸转移酶和/或其功能同源物，所述功能同源物具有与SEQ ID NO:4至少70％，例如至少80％、例如至少90％、例如至少95％、例如至少99％或例如100％同一性的氨基酸序列。此外，遗传修饰细胞含有用于制造唾液酸糖核苷酸的生物合成途径。

用于制造唾液酸糖核苷酸的生物合成途径可以是细胞固有的或者由一种或多种异源基因提供，所述异源基因例如SEQ ID NO:17的neuBCA基因簇，其中异源CMP-Neu5Ac合成酶由SEQ ID NO:16的neuA编码，异源唾液酸合酶由SEQ ID NO:12的neuB编码，并且异源GlcNAc-6-磷酸2差向异构酶由SEQ ID NO:14的neuC编码。

在一个实施方式中，表达Fred的遗传修饰细胞可以进一步被修饰以异源表达如SEQ ID NO:4所示的α-2,6-唾液酸转移酶和/或其功能同源物，所述功能同源物具有与SEQID NO:4至少70％，例如至少80％、例如至少90％、例如至少95％、例如至少99％或例如100％同一性的氨基酸序列。此外，遗传修饰细胞含有用于制造唾液酸糖核苷酸的生物合成途径。这可以是细胞固有的或由一种或多种异源基因提供，所述异源基因例如SEQ ID NO:17的neuBCA基因簇，其中异源CMP-Neu5Ac合成酶由SEQ ID NO:16的neuA编码，异源唾液酸合酶由SEQ ID NO:12的neuB编码，并且异源GlcNAc-6-磷酸2差向异构酶由SEQ ID NO:14的neuC编码。

编码MFS转运蛋白的异源核酸序列

本发明的一个方面是提供包括编码能够糖转运的多肽的异源核酸序列的核酸构建体，所述多肽是如SEQ ID NO:1中所示的主要易化子超家族(MFS)多肽，或其功能同源物，所述功能同源物具有与SEQ ID NO:1超过95.4％或99.7％同一性的氨基酸序列，其中编码糖转运多肽的核酸序列与SEQ ID NO:2具有至少70％、例如至少80％序列同一性。

优选地，SEQ ID NO:2的核酸序列或其同源物受调控元件，特别是选自PglpF、PglpF_SD4和PglpF_SD7的元件调节。在进一步的实施方式中，核酸构建体还包括编码唾液酸转移酶、特别是选自本文表2的唾液酸转移酶的核酸序列。

术语“异源核酸序列”、“重组基因/核酸/编码DNA”或“编码核酸序列”意指人工核酸序列(即，使用用于制备核酸序列的标准实验室方法在体外产生)，其包括一组连续的、不重叠的三联体(密码子)，当在适当的控制序列(即启动子)的控制下时，其被转录成mRNA并翻译成多肽。编码序列的边界通常由位于mRNA5’端开放阅读框上游的核糖体结合位点、转录起始密码子(AUG、GUG或UUG)和翻译终止密码子(UAA、UGA或UAG)决定。编码序列可包括但不限于基因组DNA、cDNA、合成的和重组的核酸序列。

术语“核酸”包括RNA、DNA和cDNA分子。应当理解，由于遗传密码的简并性，可以产生编码给定蛋白质的大量核苷酸序列。术语核酸与术语“多核苷酸”可互换使用。

“寡核苷酸”是短链核酸分子。

“引物”是一种寡核苷酸，无论是天然存在的如在纯化的限制性消化物中还是合成产生的，当置于诱导与核酸链互补的引物延伸产物合成的条件下(即在核苷酸和诱导剂如DNA聚合酶的存在下和在合适的温度和pH下)时，其能够作为合成的起点。为了扩增的最大效率，引物优选是单链的，但也可为双链的。如果引物是双链的，则在用于制备延伸产物之前，首先对其进行处理以分离其链。优选地，引物是脱氧核糖核酸序列。引物必须足够长，以便在存在诱导剂的情况下引发延伸产物的合成。引物的确切长度取决于许多因素，包括温度、引物来源和方法的使用。

本发明的重组核酸序列可以是编码DNA序列，例如基因，或非编码DNA序列，例如调控DNA，例如启动子序列。本发明的一个方面涉及提供一种重组细胞，其包括编码产生一种或多种HMO所需的酶的重组DNA序列和编码Fred转运蛋白的DNA序列。因此，在一个实施方式中，本发明涉及一种核酸构建体，其包括编码核酸序列，即目的基因的重组DNA序列，例如糖基转移酶基因或fred基因，以及非编码DNA序列，例如，启动子DNA序列，例如衍生自lac操纵子或glp操纵子的启动子的重组启动子序列，或衍生自另一基因组启动子DNA序列的启动子序列，或合成的启动子序列，其中编码序列和启动子序列可操作地连接。

术语“可操作地连接”是指两个或更多个核酸(例如，DNA)片段之间的功能关系。通常，它是指转录调控序列与转录序列的功能关系。例如，如果启动子序列引起或调节编码序列在适当的宿主细胞或其他表达系统中的转录，则该启动子序列与该编码序列可操作地连接。一般而言，可操作地连接至转录序列的启动子转录调控序列与转录序列物理上连续，即，它们是顺式作用的。

在一个实施方式中，本发明的核酸构建体可以是载体DNA的一部分，在另一实施方式中，该构建体是整合在宿主细胞基因组中的表达盒(cassette/cartridge)。因此，术语“核酸构建体”是指人工构建的核酸片段，特别是DNA片段，其旨在被“移植”至靶细胞，例如细菌细胞中，以修饰基因组基因的表达或表达可包括在构建体中的基因/编码DNA序列。在本发明的上下文中，核酸构建体含有重组DNA序列，所述重组DNA序列包括两个或更多个重组DNA序列：这基本上包括启动子DNA序列的非编码DNA序列和编码目的基因的编码DNA序列，目的基因如Fred蛋白、可用于在宿主细胞中生产HMO的另一种基因的糖基转移酶。优选地，构建体还包括调节构建体的编码DNA的转录或翻译的非编码DNA序列，例如促进核糖体与转录物结合的DNA序列、稳定转录物的前导DNA序列。

构建体(表达盒)中包含的目的重组核酸整合到细菌基因组中可以通过常规方法实现，例如通过使用含有与染色体上特定位点同源的侧翼序列的线性盒，如针对attTn7位点所述(Waddell C.S.and Craig N.L.,Genes Dev.(1988)Feb；2(2):137-49.)；核酸序列的基因组整合方法，其中重组由噬菌体λ的Red重组酶功能或Rac原噬菌体的RecE/RecT重组酶功能介导(Murphy,J Bacteriol.(1998)；180(8):2063-7；Zhang等人,Nature Genetics(1998)20:123-128；Muyrers等人,EMBO Rep.(2000)1(3):239–243)；基于Red/ET重组的方法(Wenzel等人,Chem Biol.(2005),12(3):349-56.；Vetcher等人,Appl EnvironMicrobiol.(2005)；71(4):1829-35)；或阳性克隆，即携带表达盒的克隆，可以被选择出，例如通过标记基因，或基因功能的丧失或获得。

根据本发明，包括目的基因的表达盒的单个拷贝可能足以确保所需HMO的生产并实现所需效果。因此，在一些优选的实施方式中，本发明涉及重组HMO生产细胞，其包括整合到细胞的基因组DNA中的一个、两个或三个拷贝的目的基因。在一些实施方式中，基因的单拷贝是优选的。

在一个优选的实施方式中，本发明的核酸构建体的重组编码核酸序列相对于启动子是异源的，这意味着来源物种基因组中的等效天然编码序列在另一启动子序列的控制下转录(即，不是构建体的启动子序列)。而且，相对于宿主细胞，编码DNA可以是异源的(即，源自另一生物物种或属)，例如编码在大肠杆菌宿主细胞中表达的Fred蛋白的DNA序列，或同源的(即，源自宿主细胞)，例如荚膜异多糖酸操纵子的基因、wca基因。

优选地，本发明的构建体包括在遗传修饰细胞中表达的与HMO的生物合成生产相关的基因、启动子DNA序列和其他调控序列，例如核糖体结合位点序列(例如Shine-Dalgarno序列)，使得1升包括遗传修饰细胞悬浮液的发酵培养基能够以至少0.03g/OD(光密度)的水平，例如以约0.05g/l/OD至约0.5g/l/OD的水平生产HMO。为了本发明的目的，后面的HMO产生水平被认为是“足够的”，并且能够产生该水平的所需HMO的遗传修饰细胞被认为是“合适的遗传修饰细胞”，即，该细胞可以进一步被修饰以表达HMO转运蛋白，例如Fred，以实现本文所述的至少一种有利于HMO生产的效果。

本发明的遗传修饰细胞或核酸构建体包括核酸序列，例如编码推定的Fred MFS(主要易化子超家族)转运蛋白的异源基因。

因此，本发明的核酸构建体含有与基因fred、SEQ ID NO:2具有至少70％序列同一性的核酸序列，并且其能够编码功能性MFS转运蛋白。优选地，SEQ ID NO:2的核酸序列或其同源物受到调控元件、特别是选自PglpF、PglpF_SD4和PglpF_SD7的元件的调节。在另一个实施方式中，核酸构建体还包括编码唾液酸转移酶，尤其是选自本文表2的唾液酸转移酶的核酸序列。

遗传修饰细胞或核酸构建体中含有的核酸序列编码SEQ ID NO:1的蛋白质，或其氨基酸序列与SEQ ID NO:1同一性超过70％的功能同源物。

遗传修饰细胞或核酸构建体中含有的核酸序列编码SEQ ID NO:1的蛋白质，或其氨基酸序列与SEQ ID NO:1同一性超过95.4％的功能同源物。

SEQ ID NO:1的蛋白质的功能同源物可以通过诱变获得。与SEQ ID NO:1的氨基酸序列的功能性相比，功能同源物应当具有至少50％，例如60％、70％、80％、90％或100％的剩余功能性。功能同源物可以具有与SEQ ID NO:1的氨基酸序列的功能性相比更高的功能性。SEQ ID NO:1的功能同源物应当能够增强根据本发明的遗传修饰细胞的HMO生产。

遗传修饰细胞

本文使用的“遗传修饰细胞”应理解为其遗传物质已通过使用基因工程技术的人为干预而改变的细胞，此类技术例如但不限于转化或转染(例如用异源多核苷酸序列)、Crisper/Cas编辑和/或随机诱变。在本文中，术语“遗传修饰细胞”和“宿主细胞”可互换使用。

在本发明中，“遗传修饰细胞”优选是已被外源多核苷酸序列转化或转染的宿主细胞。

遗传修饰细胞优选是原核细胞。可充当宿主细胞的合适的微生物细胞包括酵母细胞、细菌细胞、古细菌细胞、藻类细胞和真菌细胞。

遗传工程化细胞可以是例如细菌或真菌。在一个优选的实施方式中，遗传工程化细胞是细菌细胞。

宿主细胞

遗传修饰细胞(宿主细胞或重组细胞)可以是例如细菌或酵母细胞。在一个优选的实施方式中，遗传修饰细胞是细菌细胞。

关于细菌宿主细胞，原则上没有限制；它们可为真细菌(革兰氏阳性或革兰氏阴性)或古细菌，只要它们允许插入目的基因的基因操作，并且可在制造规模上培养。优选地，宿主细胞具有允许培养至高细胞密度的属性。适于重组工业产生根据本发明的HMO(一种或多种)的细菌宿主细胞的非限制性示例可为草生欧文氏菌(Erwinia herbicola)(成团泛菌(Pantoea agglomerans))、弗氏柠檬酸杆菌(Citrobacter freundii)、弯曲杆菌(Campylobacter sp)、柠檬泛菌(Pantoea citrea)、胡萝卜软腐果胶杆菌(Pectobacteriumcarotovorum)或野油菜黄单胞菌(Xanthomonas campestris)。也可使用芽孢杆菌(Bacillus)属的细菌，包括枯草芽孢杆菌(Bacillus subtilis)、地衣芽孢杆菌(Bacilluslicheniformis)、凝结芽孢杆菌(Bacillus coagulans)、嗜热芽孢杆菌(Bacillusthermophilus)、侧孢芽孢杆菌(Bacillus laterosporus)、巨大芽孢杆菌(Bacillusmegaterium)、丝状芽孢杆菌(Bacillus mycoides)、短小芽孢杆菌(Bacillus pumilus)、迟缓芽孢杆菌(Bacillus lentus)、蜡样芽孢杆菌(Bacillus cereus)和环状芽孢杆菌(Bacillus circulans)。类似地，可使用本发明的方法修饰乳杆菌(Lactobacillus)属和乳球菌(Lactococcus)属的细菌，包括但不限于嗜酸乳杆菌(Lactobacillus acidophilus)、唾液乳杆菌(Lactobacillus salivarius)、植物乳杆菌(Lactobacillus plantarum)、瑞士乳杆菌(Lactobacillus helveticus)、德氏乳杆菌(Lactobacillus delbrueckii)、鼠李糖乳杆菌(Lactobacillus rhamnosus)、保加利亚乳杆菌(Lactobacillus bulgaricus)、卷曲乳杆菌(Lactobacillus crispatus)、加氏乳杆菌(Lactobacillus gasseri)、干酪乳杆菌(Lactobacillus casei)、罗伊氏乳杆菌(Lactobacillus reuteri)、詹氏乳杆菌(Lactobacillus jensenii)和乳酸乳球菌(Lactococcus lactis)。嗜热链球菌(Streptococcus thermophiles)和费氏丙酸杆菌(Proprionibacterium freudenreichii)也是本文所述发明的合适细菌种类。作为本发明的一部分，还包括如本文所述修饰的菌株，其来自肠球菌(Enterococcus)属(例如屎肠球菌(Enterococcus faecium)和嗜热肠球菌(Enterococcus thermophiles))、双歧杆菌(Bifidobacterium)属(例如长双歧杆菌(Bifidobacterium longum)、婴儿双歧杆菌(Bifidobacterium infantis)和两岐双岐杆菌(Bifidobacterium bifidum))、芽孢乳杆菌(Sporolactobacillus spp.)、小单孢菌(Micromomospora spp.)、微球菌(Micrococcus spp.)、红球菌(Rhodococcus spp.)和假单胞菌(Pseudomonas)属(例如荧光假单胞菌(Pseudomonas fluorescens)和绿脓假单胞菌(Pseudomonas aeruginosa))。

在乳糖存在下培养包括本文所述特征的细菌，并且从细菌本身或细菌培养上清液中提取由细胞产生的寡糖，诸如HMO。在一个优选实施方式中，本发明的遗传修饰细胞是大肠杆菌细胞。

在另一优选实施方式中，宿主细胞是酵母细胞，例如酿酒酵母(Saccharomycescerevisiae)、粟酒裂殖酵母(Schizosaccharomyces pombe)、巴斯德毕赤酵母(Pichiapastoris)、乳酸克鲁维酵母(Kluveromyces lactis)、马克斯克鲁维酵母(Kluveromycesmarxianus)等。

在另一个实施方式中，宿主细胞是丝状真菌，例如曲霉(Aspargillussp.)、鐮刀菌(Fusarium sp.)或Thricoderma sp.，示例性种为黑曲霉(A.niger)、小巢状麹菌(A.nidulans)、米曲菌(A.oryzae)、腐皮镰刀菌(F.solani)、禾谷镰刀菌(F.graminearum)和里氏木霉(T.reesei)。

本发明的遗传修饰细胞可使用本领域的标准方法提供，例如Sambrook等人，Wilson&Walker,Maniatise等人和Ausubel等人在手册中所述的方法。

适用于HMO生产的宿主，例如大肠杆菌，可包括内源性β-半乳糖苷酶基因或外源性β-半乳糖苷酶基因，例如大肠杆菌包括内源性lacZ基因(例如GenBank登录号V00296(GI:41901))。为了本发明的目的，对生产HMO的宿主细胞进行遗传操作，使其包括任何β-半乳糖苷酶基因或包括失活的基因。该基因可通过从细菌基因组中完全或部分缺失对应的核酸序列而失活，或者该基因序列以其转录的方式发生突变，或者如果被转录，则转录物不被翻译，或者如果翻译为蛋白(即β-半乳糖苷酶)，则该蛋白不具有对应的酶活性。通过这种方式，HMO生产菌积累了更多的细胞内乳糖库，这有利于HMO的产生。

在一些实施方式中，工程细胞(例如细菌)包括缺陷唾液酸分解代谢途径。“唾液酸分解代谢途径”意指通常由酶控制和催化的导致唾液酸降解的一系列反应。本文所描述的实例性唾液酸分解代谢途径为大肠杆菌途径。在该途径中，唾液酸(Neu5Ac；N-乙酰神经氨酸)由酶NanA(N-乙酰神经氨酸裂解酶)和NanK(N-乙酰甘露糖胺激酶)和NanE(N-乙酰甘露糖胺-6-磷酸差向异构酶)降解，这些酶均由nanATEK-yhcH操纵子编码，并且由NanR抑制(http://ecocyc.org/ECOLI)。通过在内源性nanA(N-乙酰神经氨酸裂解酶)(例如GenBank登录号D00067.1(GL216588))和/或nanK(N-乙酰甘露糖胺激酶)基因(例如GenBank登录号(氨基酸)BAE77265.1(GL85676015))和/或nanE(N-乙酰甘露糖胺-6-磷酸差向异构酶，GI：947745，通过引用并入本文)中引入突变，在大肠杆菌宿主中呈现缺陷唾液酸分解代谢途径。任选地，nanT(N-乙酰神经氨酸转运体)基因也被失活或突变。唾液酸代谢的其它中间产物包括：(ManNAc-6-P)N-乙酰甘露糖胺-6-磷酸；(GlcNAc-6-P)N-乙酰葡糖胺-6-磷酸；(GlcN-6-P)氨基葡萄糖-6-磷酸和(Fruc-6-P)果糖-6-磷酸。在一些优选实施方式中，nanA被突变。在其它优选实施方式中，nanA和nanK被突变，而nanE保持功能性。在另一优选实施方式中，nanA和nanE被突变，而nanK未被突变、失活或缺失。突变是编码nanA、nanK、nanE和/或nanT基因产物的核酸序列中的一种或多种变化。例如，核酸序列中的突变可为1、2、至多5、至多10、至多25、至多50或至多100个变化。例如，nanA、nanK、nanE和/或nanT基因通过无效突变而突变。本文所描述的无效突变包括氨基酸替换、添加、缺失或插入，其要么导致酶功能丧失(即活性降低或无活性)要么导致酶丧失(即无基因产物)。“缺失”意指完全或部分缺失编码区，从而不产生(功能性)基因产物。失活是指编码序列已被改变，使得所得基因产物在功能上无活性，或者编码的基因产物的活性低于天然、天然存在的内源基因产物的100％，例如90％、80％、70％、60％、50％、40％、30％或20％。“未突变的”基因或蛋白与天然、天然发生或内源性编码序列没有1、2、至多5、至多10、至多20、至多50、至多100、至多200或至多500个或更多密码子的不同，或与对应的编码氨基酸序列的不同。

在优选的实施方式中，细菌(例如，大肠杆菌)包括唾液酸合成能力，即遗传修饰细胞包括用于制造唾液酸糖核苷酸的生物合成途径。例如，遗传修饰细菌通过提供外源性UDP-GIcNAc 2-差向异构酶(例如空肠弯曲杆菌(Campylobacter jejuni)的neuC(GenBankAAK91727.1)或等效物(例如GenBank CAR04561.1)、Neu5Ac合酶(例如空肠弯曲杆菌的neuB(GenBank AAK91726.1)或等效物(例如黄杆菌利姆诺西氏(Flavobacteriumlimnosediminis)唾液酸合酶，GenBank WP_023580510.1)和/或CMP-Neu5Ac合成酶(例如空肠弯曲杆菌的neuA(GenBank AAK91728.1)或等效物(例如巴西弧菌(Vibriobrasiliensis)CMP-唾液酸合成酶，GenBank WP_006881452.1)而具有唾液酸合成能力。

在一个实施方式中，遗传修饰细胞包括SEQ ID NO:13的UDP-GlcNAc 2-差向异构酶(NeuC)和/或SEQ ID NO:11的CMP-Neu5Ac合成酶(NeuB)和/或SEQ ID NO:15的Neu5Ac合酶(NeuA)或其功能变体，所述功能变体分别具有与SEQ ID NO:11或13或15至少80％，例如至少90％或例如至少99％同一性的氨基酸序列。

在修饰的细菌中生产中性的含有N-乙酰葡糖胺的HMO也是本领域已知的(参见例如Gebus C等人(2012)Carbohydrate Research 36383-90)。

为生产含N-乙酰神经氨酸(唾液酸)的HMO，例如3’-唾液酸乳糖(3’-SL)、6’-唾液酸乳糖(6’-SL)、3-岩藻糖基-3’-唾液酸乳糖(FSL)、3’-O-唾液酸乳-N-四糖a(LST a)、岩藻糖基-LST a(FLST a)、6’-O-唾液酸乳-N-四糖b(LST b)、岩藻糖基-LST b(FLST b)、6’-O-唾液酸乳-N-新四糖(LST c)、岩藻糖基-LST c(FLST c)、唾液酸-乳-N-六糖(SLNH)、唾液酸-乳-N-新六糖I(SLNH-I)、唾液酸-乳-N-新六糖II(SLNH-II)和二唾液酸-乳-N-四糖(DSLNT)、唾液酸-对-乳-N-新六糖(S-pLNnH)、唾液酸-乳-N-新六糖I(S-LNnH-I)、二唾液酸-岩藻糖基-乳-N-六糖II(DS-F-LNH II)、岩藻糖基-唾液酸-乳-N-新六糖I(FS-LNnH-I)和/或岩藻糖基-唾液酸-乳-N-六糖(FS-LNH)所述遗传修饰细胞被修饰以包括外源N-乙酰神经氨酸转移酶(即唾液酸转移酶)或其功能变体或片段。外源唾液酸转移酶基因可以从多种来源中的任一种获得，例如但不限于表2中列出的唾液酸转移酶。

为生产含N-乙酰葡糖胺的HMO，诸如乳-N-三糖(LNT-2)、乳-N-四糖(LNT)、乳-N-新四糖(LNnT)、乳-N-岩藻五糖I(LNFP-I)、乳-N-岩藻五糖II(LNFP-II)、乳-N-岩藻五糖III(LNFP-III)、乳-N-岩藻五糖V(LNFP-V)、乳-N-二岩藻六糖I(LDFH-I)、乳-N-二岩藻六糖II(LDFH-II)和乳-N-新二岩藻六糖II(LNDFH-III)，如上文所述，经修饰处理以包含外源性UDP-GlcNAc:Galα/β-Rβ-3-N-乙酰葡糖胺基转移酶基因或其功能性变体或片段。这种外源性UDP-GlcNAc:Galα/β-Rβ-3-N-乙酰葡糖胺基转移酶基因可从多种来源中的任一种获得，例如从脑膜炎奈瑟菌(N.meningitides)(Genbank蛋白质登录号AAF42258.1)或淋病奈瑟菌(N.gonorrhoeae)(Genbank蛋白质登录号ACF31229.1)中描述的lgtA基因。任选地，附加的外源性糖基转移酶基因可在包含外源性UDP-GlcNAc:Galα/β-Rβ-3-N-乙酰葡糖胺基转移酶的细菌中共表达。例如，β-1,4-半乳糖基转移酶基因与UDP-GlcNAc:Galα/β-Rβ-3-N-乙酰葡糖胺基转移酶基因共表达。这种外源性β-1,4-半乳糖基转移酶基因可从多种来源中的任一种获得，例如来自于脑膜炎奈瑟菌的lgtB基因(Genbank蛋白质登录号AAF42257.1)或来自于幽门螺杆菌(H.pylori)的HP0826/galT基因(Genbank蛋白质登录号NP_207619.1)中描述的基因。任选地，在包含外源性UDP-GlcNAc:Galα/β-Rβ-3-N-乙酰葡糖胺基转移酶基因的细菌中共同表达的附加外源性糖基转移酶基因是P-1,3-半乳糖基转移酶基因，例如描述的来自于大肠杆菌055:H7的wbgO基因(Genbank蛋白质登录号WP_000582563.1)或来自于幽门螺杆菌的jhp0563基因(Genbank蛋白质登录号AEZ55696.1)，或来自于无乳链球菌(Streptococcus agalactiae)lb OI2型的cpslBJ基因(Genbank蛋白质登录号AB050723)。上述任何酶的功能变体和片段也涵盖在本发明中。

唾液酸转移酶基因、N-乙酰葡糖胺基转移酶基因和/或半乳糖基转移酶基因也可以可操作地连接至Pglp启动子并从相应的基因组整合盒表达。在一个实施方式中，基因组整合的基因是编码半乳糖基转移酶的基因，例如编码来自幽门螺杆菌的GalT酶的HP0826基因(Genbank蛋白质登录号NP_207619.1)；在另一个实施方式中，基因组整合的基因是编码β-1,3-N-乙酰葡糖胺基转移酶的基因，例如来自脑膜炎奈瑟菌的lgtA基因(Genbank蛋白质登录号AAF42258.1)；在本文优选的实施方式中，基因组整合的基因是编码α-2,3-唾液酸转移酶的基因，例如脑膜炎奈瑟菌的NST(Genbank蛋白质序列AAC44541.1或SEQ ID NO:3)。在这些实施方式中，相应地编码β-1,3-N-乙酰葡糖胺基转移酶或半乳糖基转移酶的基因可以从基因组整合的盒或质粒携带的盒表达。第二基因可以任选地在glp启动子(SEQ ID NO:5)的控制下或在适合表达系统的任何其他启动子例如Plac(SEQ ID NO:8)的控制下表达。

产生HMO的宿主细胞通常包括功能性lacY基因和功能异常性lacZ基因。

由本发明的重组细胞产生的HMO可以使用本领域可用的合适程序来纯化(例如，如WO2015/188834、WO2017/182965或WO2017/152918中描述的)。

编码的能够糖转运的多肽

糖转运涉及糖例如但不限于寡糖的转运，并且就本发明而言，涉及一种/或多种HMO流入和/或流出转运，从遗传修饰细胞的细胞质或周质至生产培养基和/或从生产培养基至遗传修饰细胞的细胞质或周质。因此，在遗传修饰细胞中表达的能够将HMO从细胞质或周质转运至生产培养基和/或从生产培养基转运至遗传修饰细胞的细胞质或周质的多肽是能够进行糖转运的多肽。因此，在本发明中，糖转运可以指糖例如但不限于寡糖的流出和/或流入转运。

在这方面，能够进行糖转运的多肽是属于主要易化子超家族(MFS)的多肽。基本上，该多肽与SEQ ID NO:1具有超过70％，例如至少80％，例如至少90％、95％、99％或99.9％序列同一性，或其是如本文所述的其功能变体。具体地，该多肽与SEQ ID NO:1具有超过95.4％，例如至少95.5％，例如至少96％、97％、98％或99％序列同一性，或其是如本文所描述的其功能变体。SEQ ID NO:1是Fred蛋白的氨基酸序列。

本发明的遗传修饰细胞或核酸构建体包括核酸序列，例如编码Fred蛋白的异源基因。所述核酸序列与SEQ ID NO:2所示的fred基因具有至少70％，例如至少75％、80％、85％、90％、95％或99％的序列同一性。

在一个实施方式中，核酸序列构建体编码SEQ ID NO:1的蛋白质或其功能同源物，所述功能同源物具有与SEQ ID NO:1同一性超过70％，例如至少80％、90％、95％、99％或99.9％的氨基酸序列。

在另一个实施方式中，核酸序列构建体编码SEQ ID NO:1的蛋白质或其功能同源物，所述功能同源物具有与SEQ ID NO:1同一性超过95.4％，例如至少95.5％、96％、97％、98％或99％的氨基酸序列。

SEQ ID NO:1的蛋白质的功能同源物可以通过诱变获得。与SEQ ID NO:1的氨基酸序列的功能性相比，功能同源物应当具有至少50％，例如60％、70％、80％、90％或100％的剩余功能性。功能同源物可以具有与SEQ ID NO:1的氨基酸序列的功能性相比更高的功能性。SEQ ID NO:1的功能同源物应当能够增强根据本发明的遗传修饰细胞的HMO生产。具体地，SEQ ID NO:1的功能同源物应当能够提高根据本发明的遗传修饰细胞的细胞外唾液酸化HMO的比例。

遗传修饰细胞或核酸构建体可以含有一种或多种编码能够进行糖转运的多肽的核酸序列。更常见的是，本发明的遗传修饰细胞或核酸构建体编码能够糖转运的多肽的单拷贝。

包括目的基因的表达盒的单拷贝可能足以确保所需HMO的产生并实现根据本发明的所需效果。因此，在一些优选实施方式中，本发明涉及重组HMO产生细胞，其包括整合在细胞基因组DNA中的一个或多个目的基因的一个、两个或三个拷贝。在一些实施方式中，优选一个或多个基因的单拷贝。

遗传修饰细胞或核酸构建体还可以含有一种或多种调控元件，用于调控编码糖转运多肽的核酸序列的表达，并且其中所述核酸序列与SEQ ID NO:2具有至少70％的序列同一性。

核酸构建体

对于宿主细胞的转染或转化，需要核酸构建体。它们可以作为细胞内的质粒构建体存在，也适合基因组整合。

本发明的一个方面是核酸构建体，其包括：i)编码根据SEQ ID NO:1的MFS多肽或其功能同源物的核酸序列，所述功能同源物与SEQ ID NO:1具有至少70％序列同一性，例如与SEQ ID NO:1具有例如80％、例如90％、例如95％、例如99.7％、例如100％序列同一性，其中编码MFS多肽的核酸序列与SEQ ID NO:2具有至少70％序列同一性，例如与SEQ ID NO:2具有80％、例如90％、例如95％、例如100％序列同一性，和/或ii)编码一种或多种具有唾液酸转移酶能力的多肽的核酸序列，例如SEQ ID NO:3或SEQ ID NO:4的多肽或其与SEQ IDNO:3或SEQ ID NO:4具有至少70％、例如80％、例如90％、例如95％同一性的功能变体，和iii)包括调控元件的核酸序列，所述调控元件调节点i)和/或ii)的核酸序列的表达。

在本发明的一个实施方式中，核酸构建体包括：i)编码根据SEQ ID NO:1的MFS多肽或其功能同源物的核酸序列，所述功能同源物与SEQ ID NO:1具有至少70％序列同一性，例如与SEQ ID NO:1具有80％、例如90％、例如95％、例如100％序列同一性，其中编码MFS多肽的核酸序列与SEQ ID NO:2具有至少70％序列同一性，例如与SEQ ID NO:2具有80％、例如90％、例如95％、例如100％序列同一性，和ii)编码一种或多种具有唾液酸转移酶能力的多肽的核酸序列，例如SEQ ID NO:3或SEQ ID NO:4的多肽或其与SEQ ID NO:3或SEQ IDNO:4具有至少70％、例如80％、例如90％、例如95％同一性的功能变体，和iii)包括调控元件的核酸序列，所述调控元件调节点i)和ii)的核酸序列两者的表达。

在本发明的一个实施方式中，核酸构建体包括：i)编码根据SEQ ID NO:1的MFS多肽或其功能同源物的核酸序列，所述功能同源物与SEQ ID NO:1具有至少70％序列同一性，例如与SEQ ID NO:1具有80％、例如90％、例如95％、例如100％序列同一性，其中编码MFS多肽的核酸序列与SEQ ID NO:2具有至少70％序列同一性，例如与SEQ ID NO:2具有80％、例如90％、例如95％、例如100％序列同一性，和ii)包括调节点i)的两种核酸序列表达的调控元件的核酸序列。

在本发明的一个实施方式中，核酸构建体包括：i)编码一种或多种具有唾液酸转移酶能力的多肽的核酸序列，例如SEQ ID NO:3或SEQ ID NO:4的多肽或其与SEQ ID NO:3或SEQ ID NO:4具有至少70％、例如80％、例如90％、例如95％同一性的功能变体，和ii)包括调节点i)和ii)的两种核酸序列表达的调控元件的核酸序列。

在本发明的一个实施方式中，核酸构建体包括：i)编码根据SEQ ID NO:1的MFS多肽或其功能同源物的核酸序列，所述功能同源物与SEQ ID NO:1具有至少70％序列同一性，例如与SEQ ID NO:1具有80％、例如90％、例如95％、例如100％序列同一性，其中编码MFS多肽的核酸序列与SEQ ID NO:2具有至少70％序列同一性，例如与SEQ ID NO:2具有80％、例如90％、例如95％、例如100％序列同一性，和ii)编码一种或多种具有唾液酸转移酶能力的多肽的核酸序列，例如SEQ ID NO:3或SEQ ID NO:4的多肽或其与SEQ ID NO:3或SEQ IDNO:4具有至少70％、例如80％、例如90％、例如95％同一性的功能变体，和iii)包括独立调节点i)和ii)的核酸序列的表达的调控元件的至少两个核酸序列。

本发明的核酸构建体的调控元件优选选自PglpF、PglpF_SD4和PglpF_SD7。

调控元件

如上所述，遗传修饰细胞或核酸构建体还可包括核酸序列，该核酸序列包括用于调控核酸序列的表达的调控元件，核酸序列例如但不限于与SEQ ID NO:2、表2的唾液酸转移酶和/或表1的可替代的转移酶具有至少70％序列同一性的核酸序列。调控区的核酸序列可以是异源的或同源的。

术语“调控元件”或“启动子”或“启动子区域”或“启动子元件”是在转录启动期间被DNA依赖性RNA聚合酶识别和结合的核酸序列。启动子以及其它转录和翻译调控核酸序列(也称为“控制序列”)是表达给定基因或基因组(操纵子)所必需的。一般而言，转录和翻译调控序列包括但不限于启动子序列、核糖体结合位点、转录起始和终止序列、翻译起始和终止序列以及增强子或激活子序列。“转录起始位点”意指第一个被转录的核苷酸，被指定为+1。起始位点下游的核苷酸编号为+2、+3、+4等，而5’相反(上游)的核苷酸编号为-1、-2、-3等。构建体的启动子可以来源于物种基因组中编码的任何基因的启动子区。优选大肠杆菌基因组DNA的启动子区。因此，任何能够与RNA聚合酶结合并启动转录的启动子都适用于实施本发明。原则上，任何启动子都可用于控制重组基因例如本发明的MFS转运蛋白或糖基转移酶的转录。在实施本发明时，可以使用不同或相同的启动子序列来驱动整合至宿主细胞基因组或表达载体DNA中的不同目的基因的转录。在一个实例中，启动子序列A启动MFS转运蛋白的表达，而另一启动子序列B或相同的启动子序列A启动糖基转移酶的表达。

为了使构建体中包含的重组基因得到最佳表达，构建体可以包含其他调控序列，例如：前导DNA序列，例如源自大肠杆菌的glp基因的5’-非翻译区(5’UTR)的DNA序列，核糖体结合的序列。后面序列的实例在WO2019/123324(并入本文以供参考)中进行了描述，并且在本文的非限制性实施例中进行了说明。

在本发明的一方面，可以将一种或多种调控元件插入至编码根据SEQ ID NO:2的fred基因的DNA构建体中和/或插入至编码根据本发明的一种或多种糖基转移酶的DNA构建体中。在本发明的另一方面，根据本发明，可以将根据SEQ ID NO:2的fred基因的一个或多个拷贝插入至DNA构建体中。在本发明的又一方面，根据本发明，可以将根据SEQ ID NO:2的fred基因插入至一个或多个相同或不同的DNA构建体中。

在本发明的一方面，本发明构建体中包含的用于调控重组基因表达的调控元件是glpFKX操纵子启动子PglpF(SEQ ID NO:5)。在本发明的另一方面，启动子是lac操纵子启动子Plac(SEQ ID NO:8)。并且在本发明的又一方面，调控元件是PglpF_SD4(SEQ ID NO:6)和/或PglpF_SD7(SEQ ID NO:7)，它们是PglpF序列的修饰后版本，包含启动子序列下游的经修饰的核糖体结合位点序列。然而，任何能够实现转录和/或调控一种或多种编码根据本发明的一种或多种多肽的重组核酸的转录水平的启动子都适用于实施本发明。

通常，用于根据本发明表达异源基因的启动子选自表3。

表3

本发明的遗传修饰细胞或核酸构建体中存在的优选调控元件选自PgatY_70UTR、PglpF、PglpF_SD1、PglpF_SD10、PglpF_SD2、PglpF_SD3、PglpF_SD4、PglpF_SD5、PglpF_SD6、PglpF_SD7、PglpF_SD8、PglpF_SD9、Plac_16UTR、Plac、PmglB_70UTR和PmglB_70UTR_SD4。

本发明的遗传修饰细胞或核酸构建体中存在的特别优选的调控元件选自PglpF、PglpF_SD4和PglpF_SD7。

用于生物合成生产的遗传修饰细胞

在本发明中，启动子对于在遗传修饰细胞中实现一种或多种HMO的最佳生物合成产生的水平和允许实现根据本发明的期望效果可能是必需的或有益的。因此，本发明的启动子序列能够转录和/或调控能够进行糖转运的多肽和/或本发明的糖基转移酶的表达，导致优化的HMO或HMO前体的生物合成和转运和/或HMO生产的副产物的降解。

在本发明的遗传修饰细胞中，核酸构建体包含在遗传修饰细胞中，其编码与生物合成生产一种或多种HMO相关的至少一种基因、启动子DNA序列和其他调控序列，比如核糖体结合位点序列(例如Shine-Dalgarno序列)。在遗传修饰细胞中表达与生物合成产生一种或多种HMO相关的一个或多个基因能够生产HMO，从而使宿主细胞成为实施所述发明的“合适的宿主细胞”。在遗传修饰细胞中，如上所述，与生物合成产生HMO相关的一个或多个基因的表达，使得能够从1升包含遗传修饰细胞悬浮液的发酵培养基中以0.03g/l/OD(光密度)的水平产生一种或多种HMO。因此，HMO水平可以为约0.05g/l/OD至约0.5g/l/OD，比如至少0.4g/L/OD。为了本发明的目的，认为HMO生产的水平是“足够的”，并且认为能够产生该水平的所需HMO或HMO混合物的遗传修饰细胞是用于实施本发明的合适的遗传修饰细胞。

因此，根据本发明，如上所述，“合适的遗传修饰细胞”可以进一步修饰以表达MFS家族的能够进行糖转运的糖多肽，例如fred，以一种或另一种方式实现有利的HMO生产，例如但不限于生物合成生产中更高的HMO水平、生物合成生产中更高水平的纯度、更快的生产时间和/或更高效的HMO生物合成生产。

生产方法

本发明的一个方面涉及一种用于生产一种或多种唾液酸化HMO的方法，该方法包括以下步骤：

a)提供能够产生HMO的遗传修饰细胞，其中所述细胞包括

i.编码SEQ ID NO:1的蛋白质或其功能同源物的重组核酸，所述功能同源物具有与SEQ ID NO:1超过70％，例如至少80％同一性、优选至少90％同一性、更优选至少94.5％、最优选至少99.7％同一性的氨基酸序列；和

ii.编码唾液酸转移酶的异源核酸序列，唾液酸转移酶优选选自表2的唾液酸转移酶，甚至更优选SEQ ID NO:3或SEQ ID NO:4的异源唾液酸转移酶或其功能变体，所述功能变体具有与SEQ ID NO:3或SEQ ID NO:4至少70％，例如80％、例如90％、例如95％同一性；和

iii.用于制造唾液酸糖核苷酸的生物合成途径；和

b)在合适的细胞培养基中培养(i)的所述细胞以允许HMO生产和表达DNA序列以产生具有SEQ ID NO:1的氨基酸序列的蛋白质或其功能同源物，所述功能同源物具有与SEQID NO:1超过70％，例如至少80％同一性、优选至少90％同一性、更优选至少95％、最优选至少99.7％同一性的氨基酸序列；

c)收获步骤(ii)中产生的一种或多种唾液酸化HMO。

根据本发明，术语“培养(culturing或cultivating或cultivation)”(也称为“发酵”)涉及根据业内已知方法在受控生物反应器中繁殖细菌表达细胞。

为了生产一种或多种HMO，根据本领域已知的程序，在合适的碳源(例如葡萄糖、甘油、乳糖等)存在下培养本文所描述的HMO生产菌，并且从培养基和培养过程期间形成的微生物生物质中收获产生的HMO。此后，根据本领域已知的程序(例如WO2015/188834、WO2017/182965或WO2017/152918中所述)纯化HMO，并且纯化的HMO用作营养食品、药物或任何其它目的，例如用于研究。

HMO的制造通常通过大量培养来完成。本发明含义中的术语“制造”和“制造规模”定义了最小体积为5L培养液的发酵。经常地，“制造规模”工艺的定义是能够处理大量含有所需产品的制剂，并且产生一定量的目的蛋白，例如在治疗化合物或组合物的情况下，满足临床试验以及市场供应的需求。除了大体积之外，与简单的实验室规模方法如摇瓶培养相反，制造规模方法的特征在于使用生物反应器(发酵罐)的技术系统，该系统配备有用于搅拌、通气、营养补料、监测和控制工艺参数(pH、温度、溶解氧张力、背压等)的装置。在很大程度上，表达系统在实验室规模方法中的行为，例如摇瓶、台式生物反应器或本公开实施例中描述的深孔形式，确实允许预测该系统在生物反应器的复杂环境中的行为。

关于发酵过程中使用的合适细胞培养基，没有限制。培养基可为半合成培养基(semi-defined)，即含有复杂培养基化合物(例如酵母提取物、大豆蛋白胨、酪氨酸氨基酸等)，也可为化学确定的，不含任何复杂化合物。

术语“一种或多种HMO”意指HMO生产细胞可生产单一HMO结构(第一HMO)或多种HMO结构(第二、第三HMO等)。在一些实施方式中，可优选生产单一HMO的遗传修饰细胞，在其它优选实施方式中，可优选生产多种HMO结构的遗传修饰细胞。生产单一HMO结构的遗传修饰细胞的非限制性示例为2’-FL、3-FL、3’-SL、6’-SL或LNT-2生产细胞。能够生产多种HMO结构的遗传修饰细胞的非限制性示例可为DFL、FSL、LNT、LNnT、LNFP I、LNFP II、LNFP III、LNFPIV、LNFP V、pLNnH、pLNH2、LSTa、LSTb、LSTc、DSLNT、F-LSTa和F-LSTb生产细胞。

特别地，本发明涉及产生所述单一HMO结构中的一种或多种的遗传修饰细胞，其选自产生3’-SL和/或6’-SL的细胞。

本发明上下文中的术语“收获”涉及在终止发酵后收集产生的(一种或多种)HMO。在不同实施方式中，其可包括收集生物质(即遗传修饰细胞)和培养基中包括的(一种或多种)HMO，即在从生物质中分离发酵液之前/不从生物质中分离发酵液。在其它实施方式中，可从生物质和发酵液中分别收集所产生的HMO，即在从培养基(即发酵液)分离生物质之后。可使用本领域技术人员熟知的任何方法，诸如任何合适类型的离心或过滤，从培养基中分离细胞。从培养基中分离细胞可在收获发酵液后立即进行，或者在适当条件下储存发酵液后的稍后阶段进行。从剩余生物质(或总发酵)中回收产生的HMO，包括从生物质(生产细胞)中进行提取。这可通过本领域任何合适的方法来完成，例如通过超声处理、煮沸、均质化、使用溶菌酶的酶促裂解或冷冻和研磨。

从发酵中回收后，HMO可用于进一步加工和纯化。

通过发酵产生的HMO的纯化可以使用WO2016/095924、WO2015/188834、WO2017/152918、WO2017/182965、US2019/0119314(均通过引用并入)中描述的合适程序进行。

所描述的本发明的HMO产物优选为3’-SL和/或6’-SL。

用途

本发明还涉及本文所述的宿主细胞用于生产一种或多种人乳寡糖(HMO)的用途。特别地，本发明涉及如本文所述的宿主细胞用于生产特定HMO的用途，其中选择宿主细胞的目的是生成大部分的一特定HMO，优选选自3’-SL和6’-SL，最优选3’-SL。

序列

本申请含有文本格式和电子格式的序列表，其通过引用并入本文。

这里提供了序列的概述，如果列出的序列与公开参考文献之间存在差异，则以序列表中的序列为准。

表4：序列概述

当GenBank ID和SEQ ID NO之间出现序列差异时，认为SEQ ID NO是正确的序列。

通用

应当理解，上面讨论的与所描述的发明有关的任何特征和/或方面通过类比适用于本文所描述的方法。

下面提供附图和实施例来说明本发明。它们旨在是说明性的并且不应被解释为以任何方式进行限制。

项

1.一种能够产生一种或多种包括唾液酸部分(唾液酸化HMO)的人乳寡糖(HMO)的遗传修饰细胞，其中所述遗传修饰细胞包括，

(i)编码SEQ ID NO:1的主要易化子超家族(MFS)多肽或其功能同源物的异源核酸序列，所述功能同源物具有与SEQ ID NO:1至少70％同一性的氨基酸序列，和

(ii)编码唾液酸转移酶的异源核酸序列；和

(iii)用于制造唾液酸糖核苷酸的生物合成途径。

2.根据第1项的遗传修饰细胞，其中所述一种或多种产生的HMO选自3’-SL、6’-SL、FSL、DS-LNT、LSTc、LSTa和LSTb。

3.根据第2项的遗传修饰细胞，其中所述细胞产生的HMO选自3’-SL、6’-SL和LSTa。

4.根据第2项或第3项的遗传修饰细胞，其中HMO是3’-SL或6’SL。

5.根据前述项中任一项的遗传修饰细胞，其中所述功能同源物与SEQ ID NO:1同一性为至少94.6％。

6.根据前述项中任一项的遗传修饰细胞，其中与没有MFS多肽的细胞相比，所述SEQ ID NO:1的MFS多肽或其功能同源物的表达导致所述HMO的输出增加。

7.根据第6项的遗传修饰细胞，其中至少80％的唾液酸化HMO输出到遗传修饰细胞外。

8.根据前述项中任一项的遗传修饰细胞，其中唾液酸转移酶选自α-2,3-唾液酸转移酶和α-2,6-唾液酸转移酶，例如表2中呈现的那些。

9.根据前述项中任一项的遗传修饰细胞，其中α-2,3-唾液酸转移酶选自Nst(SEQID NO:3)或Pd2(SEQ ID NO:4)和/或其功能同源物，所述功能同源物具有与SEQ ID NO:3或SEQ ID NO:4同一性为至少70％的氨基酸序列。

10.根据前述项中任一项的遗传修饰细胞，其中唾液酸糖核苷酸是CMP-Neu5Ac。

11.根据第10项的遗传修饰细胞，其中细胞包括编码SEQ ID NO:11的NeuB、SEQ IDNO:13的NeuC和SEQ ID NO:15的NeuA或其功能同源物的核酸序列，所述功能同源物具有分别与SEQ ID NO:11、13或15同一性为至少80％的氨基酸序列。

12.根据第10或11项的遗传修饰细胞，其中细胞包括编码neuBCA簇的SEQ ID NO:17的异源核酸序列，或其与SEQ ID NO:17序列同一性为至少80％的功能同源物。

13.根据前述项中任一项的遗传修饰细胞，其中细胞还包括：包含用于调节异源核酸序列的表达的调控元件的核酸序列。

14.根据第13项的遗传修饰细胞，其中调控元件调节SEQ ID NO:1的MFS多肽或其功能同源物的表达，所述功能同源物具有与SEQ ID NO:1同一性为至少70％的氨基酸序列。

15.根据第13或14项的遗传修饰细胞，其中调控元件选自PglpF(SEQ ID NO:5)、PglpF_SD4(SEQ ID NO:6)和PglpF_SD7(SEQ ID NO:7)。

16.根据前述项中任一项的遗传修饰细胞，其中遗传修饰细胞是微生物细胞。

17.根据第16项的遗传修饰细胞，其中微生物细胞是细菌或真菌。

18.根据第17项的遗传修饰细胞，其中所述真菌选自Komagataella属、克鲁维酵母菌属(Kluyveromyces)、亚罗酵母属(Yarrowia)、毕赤酵母属(Pichia)、啤酒酵母属(Saccaromyces)、裂殖酵母属或汉逊酵母属(Hansenula)的酵母细胞或选自曲霉属、鐮刀菌属或Thricoderma属的丝状真菌。

19.根据第17项的遗传修饰细胞，其中细菌选自埃希氏菌(Escherichia sp.)、芽孢杆菌、乳杆菌和弯曲杆菌。

20.根据第17或19项的遗传修饰细胞，其中细菌是大肠杆菌，例如K-12或B21。

21.一种核酸构建体，包括

(i)编码根据SEQ ID NO:1的MFS多肽或其功能同源物的核酸序列，所述功能同源物与SEQ ID NO:1序列同一性超过70％，其中编码MFS多肽的核酸序列与SEQ ID NO:2序列同一性为至少70％，和

(ii)包括调控元件的核酸序列，所述调控元件调节点(i)的核酸序列中的任意一个或多个的表达。

22.一种核酸构建体，包括

(ii)编码一种或多种具有唾液酸转移酶能力的多肽的核酸序列，和/或

(iii)包括调控元件的核酸序列，所述调控元件调节点(i)和/或(ii)的核酸序列中的任意一个或多个的表达。

23.根据第21或22项的核酸构建体，其中所述调控元件选自PglpF(SEQ ID NO:5)、PglpF_SD4(SEQ ID NO:6)和PglpF_SD7(SEQ ID NO:7)。

24.一种用于生物合成生产一种或多种唾液酸化人乳寡糖(HMO)的方法，该方法包括以下步骤：

(i)提供根据第1-20项中任一项的遗传修饰细胞；

(ii)在合适的细胞培养基中培养遗传修饰细胞以表达编码SEQ ID NO:1的主要易化子超家族(MFS)多肽或其功能同源物的所述异源核酸序列和编码唾液酸转移酶的异源核酸序列以产生一种或多种唾液酸化人乳寡糖(HMO)，所述功能同源物的氨基酸序列与SEQID NO:1同一性超过70％，和；

(iii)收获步骤(ii)中产生的一种或多种唾液酸化HMO。

25.根据第24项的方法，其中至少80％的唾液酸化HMO存在于细胞培养物的上清液中。

26.根据第24或25项的方法，其中从细胞培养物的上清液收获唾液酸化HMO。

27.根据第24至26项的方法，其中唾液酸化HMO产物选自3’-SL和6’SL。

28.根据第24至27项中任一项的方法，其中培养基包括选自葡萄糖、蔗糖、果糖、木糖和甘油的能源。

29.根据第24至28项中任一项的方法，其中在遗传修饰细胞的培养期间添加乳糖作为底物用于HMO形成。

30.根据第1至20项中任一项的遗传修饰细胞或根据第21至23项中任一项的核酸构建体用于生物合成生产一种或多种唾液酸化人乳寡糖(HMO)的用途。

31.根据第1至20项中任一项的遗传修饰细胞或根据第21至23项中任一项的核酸构建体用于生物合成生产选自3’-SL和6’-SL的HMO的用途。

实施例

材料和方法

除非另有说明，否则分子生物学领域中已知的标准技术、载体、控制序列元件和其它表达系统元件用于核酸操纵、转化和表达。此类标准技术、载体和元件可在例如以下内容中找到：Ausubel等人(著),Current Protocols in Molecular Biology(1995)(JohnWiley&Sons)；Sambrook,Fritsch,&Maniatis(著),Molecular Cloning(1989)(ColdSpring Harbor Laboratory Press,NY)；Berger&Kimmel,Methods in Enzymology 152:Guide to Molecular Cloning Techniques(1987)(Academic Press)；Bukhari等人(著),DNA Insertion Elements,Plasmids and Episomes(1977)(Cold Spring HarborLaboratory Press,NY)；Miller,J.H.Experiments in molecular genetics(1972.)(Coldspring Harbor Laboratory Press,NY)。

选择以下描述的实施方式来说明本发明并且不以任何方式限制本发明。

菌株

本实施例中使用的菌株描述于下表5中。

表5

培养

除非另有说明，否则大肠杆菌菌株在37℃下在含有0.2％葡萄糖的基本最低培养基中通过搅拌进行繁殖。琼脂板在37℃下孵育过夜。

基本最低培养基的组成如下：NaOH(1g/L)、KOH(2.5g/L)、KH₂PO₄(7g/L)、NH₄H₂PO₄(7g/L)、柠檬酸(0.5g/L)、微量矿物质溶液(5mL/L)。微量矿物质储备液包含：ZnSO₄*7H₂O0.82g/L、柠檬酸20g/L、MnSO₄*H₂O 0.98g/L、FeSO₄*7H₂O 3.925g/L、CuSO₄*5H₂O 0.2g/L。用5N NaOH将基本最低培养基的pH值调整为7.0并高压灭菌。在接种之前，向基本最低培养基提供1mM MgSO₄、4μg/mL硫胺素、0.5％的给定碳源(甘油(Carbosynth))。硫胺素和抗生素通过过滤灭菌。甘油的所有百分比浓度表示为v/v，葡萄糖的所有百分比浓度表示为w/v。

化学感受态细胞与转化

将大肠杆菌在37℃下从LB平板接种到含有0.2％葡萄糖的5mL LB中，摇动直至OD600～0.4。通过在13.000g下离心25秒获得2mL培养物。去除上清液，并且将细胞沉淀重新悬浮在600μL冷TB溶液中(10mM PIPES、15mM CaCl₂、250mM KCI)。将细胞在冰上培养20分钟，随后在13000g下沉淀15秒。去除上清液，将细胞沉淀重新悬浮在100μL冷TB溶液中。使用100μL感受态细胞和1至10ng质粒DNA进行质粒转化。细胞和DNA在冰上孵育20分钟，然后在42℃下热击45秒。在冰上孵育2分钟后，加入400μL SOC(20g/L胰蛋白胨、5g/L酵母抽提物、0.5g/L NaCl、0.186g/L KCI、10mM MgCl₂、10mM MgSO₄和20mM葡萄糖)，细胞培养物在37℃下振荡培养1小时，然后涂布在选择性平板上。

在供应商(ThermoFisher Scientific)推荐的条件下，将质粒转化进TOP10化学感受态细胞。

DNA技术

使用QIAprep Spin-Miniprep试剂盒(Qiagen)从大肠杆菌中分离质粒DNA。使用QIAmp DNA Mini试剂盒(Qiagen)从大肠杆菌中分离染色体DNA。使用QIAquick PCR纯化试剂盒(Qiagen)纯化PCR产物。按照供应商的建议使用DreamTaq PCR master mix(Thermofisher)、Phusion U热启动PCR master mix(Thermofisher)、USEREnzym(新英格兰生物实验室)。引物由德国Eurofins Genomics公司提供。PCR片段和质粒通过EurofinsGenomics进行测序。菌落PCR使用DreamTaq PCR Master Mix在T100^TM热循环仪(Bio-Rad)中进行。

在本发明的遗传修饰的HMO生产细胞中表达的异源蛋白在表6中描述，用于本发明以下示例的启动子元件在表7中描述，用于扩增质粒主链、启动子、元件和fred的寡核苷酸在表8中描述。

表6：可在遗传修饰的HMO生产细胞中表达的异源蛋白

*为了本发明的目的，给出基因名称以标识编码具有相应GenBank登录号的氨基酸序列的蛋白质的核酸。

表7：用于表达fred和唾液酸转移酶的合成调控元件由下面的SEQ ID NO标识

序列名称	SEQ ID NO	描述
			PglpF	5	300-核苷酸DNA表达元件
PglpF_SD4	6	300-核苷酸DNA表达元件
			PglpF_SD7	7	300-核苷酸DNA表达元件
Plac	8	195-核苷酸DNA表达元件

表8：用于扩增质粒主链、启动子、调控元件和目的基因(包括fred)的寡核苷酸。

名称	SEQ ID NO	描述
			O40	22	Backbone.for
O79	23	Backbone.rev
			O261	24	PglpF.for
O262	25	PglpF.rev
			O459	26	PglpF_SD4
O462	27	PglpF_SD7
			KABY733	28	fred.for
KABY734	29	fred.rev
			O48	20	galK.for
O49	21	galK.rev
			O68	30	Plac.for
O113	31	Plac.rev
			KABY721	32	yberC0001_9420.for
KABY722	33	yberC0001_9420.rev

质粒的构建

合成了含有两个I-SceI核酸内切酶位点的质粒主链，这两个位点被适于同源重组到大肠杆菌基因组中的两个DNA片段和T1转录终止子序列分开。例如，在一个质粒主链(pUC57::gal)中合成了gal操纵子(galK中同源重组所需)和T1转录终止序列(GeneScript)。gal操纵子中用于同源重组的DNA序列包括序列大肠杆菌K-12MG155完整基因组GenBank:ID:CP014225.1中的碱基对3.628.621-3.628.720和3.627.572-3.627.671。通过同源重组插入将导致galK的949个碱基对缺失和galK-表型。以类似的方式，可合成基于pUC57(GeneScript)或含有两个I-SceI核酸内切酶位点的任何其它合适载体的主链，所述位点被适于同源重组到大肠杆菌基因组中的两个DNA片段和T1转录终止子序列分开。使用分子生物学领域中众所周知的标准技术用于设计引物和扩增大肠杆菌K-12DH1染色体DNA的特定DNA序列。例如，此类标准技术、载体和元件可见：Ausubel等人(著),CurrentProtocols in Molecular Biology(1995)(John Wiley&Sons)；Sambrook,Fritsch,&Maniatis(著),Molecular Cloning(1989)(Cold Spring Harbor Laboratory Press,NY)；Berger&Kimmel,Methods in Enzymology 152:Guide to Molecular Cloning Techniques(1987)(Academic Press)；Bukhari等人(著)。

从大肠杆菌DH1获得的染色体DNA用于扩增含有启动子的300bp DNA片段，使用寡核苷酸O261和O262扩增PglpF，或使用寡核苷酸O261和O459扩增PglpF_SD4，并使用寡核苷酸O261和O462扩增PglpF_SD7(表8)。

通过Genescript合成一个1.182bp的DNA片段，该片段含有源自弗氏耶尔森菌的fred基因的密码子优化形式SEQ ID NO:2(表6)。使用寡核苷酸KABY733和KABY734扩增fred基因。

纯化所有PCR片段(质粒主链、包含启动子的元件和fred基因)，组装质粒主链、启动子元件(Plac、PglpF、PglpF_SD4或PglpF_SD7)和含有fred(或其他目的基因，见表6)的DNA片段。通过标准USER克隆法克隆质粒。可使用任何标准的DNA克隆技术在任何适当的质粒中进行克隆。将质粒转化到TOP10细胞中，并且在含有100μg/mL氨苄青霉素(或任何合适的抗生素)和0.2％葡萄糖的LB板上进行选择。纯化构建的质粒，并且通过DNA测序(MWGEurofins Genomics)验证启动子序列和fred基因的5’端。通过这种方式，构建了含有与fred(或其他目的基因，见表6)基因连接的任何启动子的基因盒。

菌株的构建

使用的细菌菌株MDO是由大肠杆菌K-12DH1构建的。大肠杆菌K-12DH1基因型为：F^-,-,gyrA96,recA1,relA1,endA1,thi-1,hsdR17,supE44。除了大肠杆菌K-12DH1基因型外，MDO还有以下修饰：lacZ：缺失1.5kbp；lacA：缺失0.5kbp；nanKETA：缺失3.3kbp；melA：缺失0.9kbp；wcaJ：缺失0.5kbp；mdoH：缺失0.5kbp，以及在gmd基因上游插入Plac启动子。

在大肠杆菌K-12DH1 MDO的染色体DNA中插入含有连接到fred基因和T1转录终止序列的启动子的表达盒基本上是通过Gene Gorging来完成的，这基本如Herring等人(Herring,C.D.,Glasner,J.D.和Blattner,F.R.(2003).Gene(311).153-163)所述。简而言之，将供体质粒和辅助质粒共转化到MDO中，并且在含有0.2％葡萄糖、氨苄青霉素(100μg/mL)或卡那霉素(50mg/mL)和氯霉素(20μg/mL)的LB板上进行选择。将单个菌落接种在1mL含有氯霉素(20μg/mL)的和10μL的20％ L-阿拉伯糖的LB中，并且在37℃下振荡培养7至8小时。为了整合到大肠杆菌细胞的galK位点上，然后将其接种在M9-DOG平板上，并且在37℃下孵育48小时。将在MM-DOG平板上形成的单个菌落在含有0.2％葡萄糖的LB平板上重新划线，并且在37℃下培养24小时。在MacConkey半乳糖琼脂平板上显示白色并且对氨苄青霉素和氯霉素均敏感的菌落预计已失去供体和辅助质粒，并且在galK位点中具有插入。使用引物O48(SEQ ID NO:20)和O49(SEQ ID NO:21)通过菌落PCR鉴定galK位点的插入，并且通过测序(Eurofins Genomics，德国)验证插入的DNA。

使用不同的选择标记基因和不同的筛选方法以类似的方式在大肠杆菌染色体DNA的其它位点插入遗传盒。

深孔测定

深孔测定如Lv等人(Bioprocess Biosyst Eng(2016)39:1737–1747)最初所述进行，并针对本发明的目的进行优化。

更具体地，实施例中公开的菌株使用4天方案在24个深孔板中筛选。在最初的24小时内，在34℃下摇床培养细胞以700rpm振摇生长至高密度，而对于2’-FL、3-FL和3’-SL生产细胞在接下来的48小时，对于LNT生产细胞则是在接下来的72小时，将细胞转移至允许诱导基因表达和产物形成的培养基中。具体地，在第1天，使用补充有硫酸镁、硫胺素和葡萄糖的基础最低培养基制备新鲜接种物。孵育24小时后，将细胞转移至补充有硫酸镁和硫胺素的新的基础最低培养基(2ml)中，并添加由20％葡萄糖溶液(1μl)和10％乳糖溶液(0.1ml)组成的初始大剂量加入物，然后将50％蔗糖溶液(0.04ml)作为碳源提供至细胞，同时加入蔗糖水解酶(转化酶，5μl的0.1g/L溶液)，通过由转化酶裂解蔗糖从而以缓慢的速率提供葡萄糖用于生长。接种新培养基后，在28℃下将细胞以700rpm振荡48小时。在变性和随后的离心之后，通过HPLC分析上清液。对于总样品的分析，通过在4700rpm下离心10分钟使煮沸制备的细胞裂解物沉淀。上清液中的HMO浓度通过HPLC或HPAC方法测定。

3’-SL发酵方法及相关测量

所有发酵均在200mL Dasbox生物反应器(Eppendorf，德国)中进行，各自起始体积为100mL。培养基为限定基本培养基，由25g/kg碳源(葡萄糖)、30g/kg乳糖、MgSO₄×7H₂O、KOH、NaOH、NH₄H₂PO₄、KH₂PO₄、微量元素溶液、柠檬酸、消泡剂和硫胺素组成。微量金属溶液(TMS)含有硫酸盐形式的Mn、Cu、Fe、Zn和柠檬酸。通过接种在上述的限定基本培养基中生长的2％(v/v)预培养物来开始发酵。在耗尽批次培养基中所含的碳源后，使用预定的线性曲线以葡萄糖限制的方式连续供给含有葡萄糖、MgSO₄×7H₂O、TMS、消泡剂和乳糖的无菌补料溶液。

通过用NH₄OH溶液滴定将整个发酵过程的pH控制在6.8。使用空气将通气控制在1VVM，并且通过搅拌器速率控制溶氧保持在空气饱和度的20％以上。温度持续保持在34℃。

在整个发酵过程中，取样并使用HPLC测定3’-SL、唾液酸、乳糖和其他少量副产物的浓度。将总培养液样品在去离子水中稀释三倍并煮沸20分钟，然后在17000g下离心3分钟，然后通过HPLC分析所得上清液，得到所产生的3’-SL的总培养液级分。3’-SL的上清液级分在不煮沸的情况下通过HPLC进行分析，并通过在17000g下离心3分钟将其与沉淀分离。

生物湿质量(BWM)的测定：将1mL发酵液移液至已知重量(g)的2mL微量离心管中，测量发酵液样品的重量(g)，离心后除去上清液(17000g，3分钟)，最后测量沉淀的重量。将沉淀的重量(g)除以培养液的重量(g)，并将结果乘以1000，得出BWM(g/kg)。所有重量测量均使用分析天平进行，精确度为小数点后三位。

通过使用BWM(g/kg)和累积发酵液重量(kg)计算每个采集样品的上清液重量(kg)，从而计算上清液和沉淀分布。将上清液重量(kg)乘以上清液中3’-SL的浓度(g/L)，再除以总培养液中3’-SL的重量(g)，最后乘以100计算出上清液中3’-SL的比率(％)。发酵液上清液的密度为1g/cm³。

实施例1–使用和不使用MFS转运蛋白Fred生产3’-SL。

表达fred基因的用于3’-SL生产的大肠杆菌工程

表11：用于菌株构建的质粒的示例

质粒	相关基因型	标记基因
			pACBSR	Para-I-SceI-λRed,p15A ori,cam*	cam
pBS-nadC-neuBCA	pBS-nadC-Plac-neuBCA[其他基因型信息见表4]	nadC

可以操纵大肠杆菌K-12(DH1)MDO菌株来表达目的异源基因。例如，菌株1和菌株3是产生3’-SL的菌株，过表达α-2,3-唾液酸转移酶nst和CMP-Neu5Ac合成酶neuBCA基因。neuBCA基因可以从pBS-nadC-neuBCA质粒(菌株1)表达，也可以整合到基因组中(菌株3)。将含有与fred连接的启动子元件(PglpF)的表达盒以单拷贝插入到菌株1或菌株3背景中，分别产生菌株2和菌株4。

如“材料和方法”部分所述，在深孔测定中测试菌株。

深孔测定结果表明，3’-SL的表达不受Fred转运蛋白插入的影响(图1)。然而，随着Fred转运蛋白的存在，3’-SL的分布发生了显著变化，清楚地表明Fred转运蛋白促进了3’-SL从细胞到上清液的转运，仅留下一小部分3’-SL在沉淀中，而在没有Fred转运蛋白的情况下，几乎40％的3’-SL保留在细胞内(图2)。

如“材料和方法”部分所述发酵菌株后，对菌株进行了进一步评估。

从发酵数据可以看出，对于没有Fred转运蛋白的菌株(菌株1和3)，3’-SL最初在细胞内较高，随着时间的推移，它被释放到上清液中，而具有Fred转运蛋白的细胞(菌株2和4)似乎开始就在上清液中具有高水平的3’-SL(图3和图5)。

Fred转运蛋白的存在似乎也会影响生物质的发展，因为虽产生了相同量的3’-SL，但是当Fred转运蛋白存在时，产生相同量的3’-SL所需的生物质显著更少(图4和图6)，这不仅在能源消耗方面具有优势，而且在生物质去除的下游加工方面也具有优势。

实施例2–使用和不使用MFS转运蛋白YberC生产3’-SL。

表达yberC基因的用于3’-SL生产的大肠杆菌工程

可以如实施例1中所述操纵大肠杆菌K-12(DH1)MDO菌株来表达目的异源基因。在本实施例中，产生了与菌株2类似的菌株，不同的是它表达YberC的异源拷贝而不是表达Fred。简而言之，将含有与密码子优化的yberC基因连接的启动子元件(PglpF)的表达盒以单拷贝插入到菌株1中，从而产生菌株5。

如“材料和方法”部分所述，在深孔测定中测试菌株。深孔测定结果表明，与没有YberC的菌株(菌株1)相比，使用PglpF表达yberC基因(5)导致3’-SL产量减少约16％(图7A)。这表明与Fred转运蛋白相比，YberC转运蛋白对3’-SL产生具有负面影响。

对于上清液的分泌，YberC与Fred一样，通过降低沉淀级分中3’-SL的量并增加培养基中3’-SL的量来改善3’-SL产物的分布(参见图7B)。

序列表

<110> 格礼卡姆股份公司

<120> 唾液酸化HMO生产中的新主要易化子超家族（MFS）蛋白（FRED）

<130> 34166-WO-PCT

<150> PCT/EP2021/051479

<151> 2021-01-22

<150> EP21185379.1

<151> 2021-07-13

<160> 33

<170> BiSSAP 1.3.6

<210> 1

<211> 393

<212> PRT

<213> Yersinia frederiksenii

<220>

<223> fred_WP_087817556.1\优化的翻译:

<400> 1

Met Lys Ser Ala Leu Thr Phe Ser Arg Arg Ile Asn Pro Val Phe Leu

1 5 10 15

Ala Phe Phe Val Val Ala Phe Leu Ser Gly Ile Ala Gly Ala Leu Gln

20 25 30

Ala Pro Thr Leu Ser Leu Phe Leu Ser Thr Glu Val Lys Val Arg Pro

35 40 45

Leu Trp Val Gly Leu Phe Tyr Thr Val Asn Ala Ile Ala Gly Ile Thr

50 55 60

Val Ser Phe Val Leu Ala Lys Arg Ser Asp Leu Arg Gly Asp Arg Arg

65 70 75 80

Lys Leu Ile Leu Val Cys Tyr Leu Met Ala Val Gly Asn Cys Leu Leu

85 90 95

Phe Ala Phe Asn Arg Asp Tyr Leu Thr Leu Ile Thr Ala Gly Val Leu

100 105 110

Leu Ala Ala Val Ala Asn Thr Ala Met Pro Gln Ile Phe Ala Leu Ala

115 120 125

Arg Glu Tyr Ala Asp Asn Ser Ala Arg Glu Val Val Met Phe Ser Ser

130 135 140

Ile Met Arg Ala Gln Leu Ser Leu Ala Trp Val Ile Gly Pro Pro Leu

145 150 155 160

Ser Phe Met Leu Ala Leu Asn Tyr Gly Phe Thr Leu Met Phe Cys Ile

165 170 175

Ala Ala Gly Ile Phe Val Leu Ser Ala Leu Val Val Trp Phe Ile Leu

180 185 190

Pro Ser Val Gln Arg Ala Glu Pro Val Met Asp Ala Pro Thr Val Ala

195 200 205

Gln Gly Ser Leu Phe Ala Asp Lys Asp Val Leu Leu Leu Phe Ile Ala

210 215 220

Ser Met Leu Met Trp Thr Cys Asn Thr Met Tyr Ile Ile Asp Met Pro

225 230 235 240

Leu Tyr Ile Thr Ala Ser Leu Gly Leu Pro Glu Arg Leu Ala Gly Leu

245 250 255

Leu Met Gly Thr Ala Ala Gly Leu Glu Ile Pro Ile Met Leu Leu Ala

260 265 270

Gly Tyr Ser Val Arg Arg Phe Gly Lys Arg Lys Ile Met Leu Phe Ala

275 280 285

Val Leu Ala Gly Val Leu Phe Tyr Thr Gly Leu Val Leu Phe Lys Phe

290 295 300

Lys Ser Ala Leu Met Leu Leu Gln Ile Phe Asn Ala Ile Phe Ile Gly

305 310 315 320

Ile Val Ala Gly Ile Gly Met Leu Tyr Phe Gln Asp Leu Met Pro Gly

325 330 335

Arg Ala Gly Ala Ala Thr Thr Leu Phe Thr Asn Ser Ile Ser Thr Gly

340 345 350

Val Ile Leu Ala Gly Val Leu Gln Gly Val Leu Thr Glu Thr Trp Gly

355 360 365

His Asn Ser Val Tyr Val Met Ala Met Ile Leu Ala Ile Leu Ser Leu

370 375 380

Ile Ile Cys Ala Arg Val Arg Glu Ala

385 390

<210> 2

<211> 1182

<212> DNA

<213> 人工序列

<220>

<223> 编码fred的核酸序列

<400> 2

atgaagagcg cgctgacctt cagccgtcgt attaacccgg tttttctggc gttctttgtg 60

gttgcgttcc tgagcggtat tgcgggtgcg ctgcaggcgc cgaccctgag cctgttcctg 120

agcaccgagg tgaaagttcg tccgctgtgg gtgggcctgt tctacaccgt taacgcgatt 180

gcgggtatca ccgtgagctt tgttctggcg aagcgtagcg acctgcgtgg cgatcgtcgt 240

aaactgatcc tggtgtgcta cctgatggcg gttggtaact gcctgctgtt cgcgtttaac 300

cgtgactatc tgaccctgat taccgcgggc gtgctgctgg cggcggttgc gaacaccgcg 360

atgccgcaga ttttcgcgct ggcgcgtgag tacgcggata acagcgcgcg tgaagtggtt 420

atgtttagca gcattatgcg tgcgcaactg agcctggcgt gggttatcgg tccgccgctg 480

agcttcatgc tggcgctgaa ctatggcttc accctgatgt tttgcattgc ggcgggtatc 540

ttcgtgctga gcgcgctggt tgtgtggttt attctgccga gcgtgcagcg tgcggaaccg 600

gttatggatg cgccgaccgt ggcgcaaggc agcctgttcg cggacaagga tgttctgctg 660

ctgtttattg cgagcatgct gatgtggacc tgcaacacca tgtacatcat tgatatgccg 720

ctgtatatca ccgcgagcct gggtctgccg gagcgtctgg cgggtctgct gatgggcacc 780

gcggcgggtc tggaaatccc gattatgctg ctggcgggct acagcgtgcg tcgttttggc 840

aagcgtaaaa tcatgctgtt cgcggtgctg gcgggcgttc tgttttatac cggtctggtt 900

ctgttcaagt ttaaaagcgc gctgatgctg ctgcagattt tcaacgcgat ctttattggt 960

atcgtggcgg gtatcggcat gctgtacttc caagacctga tgccgggtcg tgcgggtgcg 1020

gcgaccaccc tgtttaccaa cagcattagc accggcgtta tcctggcggg cgtgctgcaa 1080

ggtgttctga ccgaaacctg gggtcacaac agcgtgtatg ttatggcgat gattctggcg 1140

atcctgagcc tgatcatttg cgcgcgtgtg cgtgaagcgt aa 1182

<210> 3

<211> 342

<212> PRT

<213> Neisseria meningitidis

<220>

<223> 2,3-唾液酸转移酶d29-NST, 截短的

<400> 3

Met Glu Arg Asn Ala Val Ser Leu Leu Lys Glu Lys Leu Phe Asn Glu

1 5 10 15

Glu Gly Glu Pro Val Asn Leu Ile Phe Cys Tyr Thr Ile Leu Gln Met

20 25 30

Lys Val Ala Glu Arg Ile Met Ala Gln His Pro Gly Glu Arg Phe Tyr

35 40 45

Val Val Leu Met Ser Glu Asn Arg Asn Glu Lys Tyr Asp Tyr Tyr Phe

50 55 60

Asn Gln Ile Lys Asp Lys Ala Glu Arg Ala Tyr Phe Phe His Leu Pro

65 70 75 80

Tyr Gly Leu Asn Lys Ser Phe Asn Phe Ile Pro Thr Met Ala Glu Leu

85 90 95

Lys Val Lys Ser Met Leu Leu Pro Lys Val Lys Arg Ile Tyr Leu Ala

100 105 110

Ser Leu Glu Lys Val Ser Ile Ala Ala Phe Leu Ser Thr Tyr Pro Asp

115 120 125

Ala Glu Ile Lys Thr Phe Asp Asp Gly Thr Gly Asn Leu Ile Gln Ser

130 135 140

Ser Ser Tyr Leu Gly Asp Glu Phe Ser Val Asn Gly Thr Ile Lys Arg

145 150 155 160

Asn Phe Ala Arg Met Met Ile Gly Asp Trp Ser Ile Ala Lys Thr Arg

165 170 175

Asn Ala Ser Asp Glu His Tyr Thr Ile Phe Lys Gly Leu Lys Asn Ile

180 185 190

Met Asp Asp Gly Arg Arg Lys Met Thr Tyr Leu Pro Leu Phe Asp Ala

195 200 205

Ser Glu Leu Lys Thr Gly Asp Glu Thr Gly Gly Thr Val Arg Ile Leu

210 215 220

Leu Gly Ser Pro Asp Lys Glu Met Lys Glu Ile Ser Glu Lys Ala Ala

225 230 235 240

Lys Asn Phe Lys Ile Gln Tyr Val Ala Pro His Pro Arg Gln Thr Tyr

245 250 255

Gly Leu Ser Gly Val Thr Thr Leu Asn Ser Pro Tyr Val Ile Glu Asp

260 265 270

Tyr Ile Leu Arg Glu Ile Lys Lys Asn Pro His Thr Arg Tyr Glu Ile

275 280 285

Tyr Thr Phe Phe Ser Gly Ala Ala Leu Thr Met Lys Asp Phe Pro Asn

290 295 300

Val His Val Tyr Ala Leu Lys Pro Ala Ser Leu Pro Glu Asp Tyr Trp

305 310 315 320

Leu Lys Pro Val Tyr Ala Leu Phe Thr Gln Ser Gly Ile Pro Ile Leu

325 330 335

Thr Phe Asp Asp Lys Asn

340

<210> 4

<211> 483

<212> PRT

<213> Photobacterium damselae

<220>

<223> 2,6-唾液酸转移酶, Pd2,6ST

<400> 4

Met Cys Asn Ser Asp Asn Thr Ser Leu Lys Glu Thr Val Ser Ser Asn

1 5 10 15

Ser Ala Asp Val Val Glu Thr Glu Thr Tyr Gln Leu Thr Pro Ile Asp

20 25 30

Ala Pro Ser Ser Phe Leu Ser His Ser Trp Glu Gln Thr Cys Gly Thr

35 40 45

Pro Ile Leu Asn Glu Ser Asp Lys Gln Ala Ile Ser Phe Asp Phe Val

50 55 60

Ala Pro Glu Leu Lys Gln Asp Glu Lys Tyr Cys Phe Thr Phe Lys Gly

65 70 75 80

Ile Thr Gly Asp His Arg Tyr Ile Thr Asn Thr Thr Leu Thr Val Val

85 90 95

Ala Pro Thr Leu Glu Val Tyr Ile Asp His Ala Ser Leu Pro Ser Leu

100 105 110

Gln Gln Leu Ile His Ile Ile Gln Ala Lys Asp Glu Tyr Pro Ser Asn

115 120 125

Gln Arg Phe Val Ser Trp Lys Arg Val Thr Val Asp Ala Asp Asn Ala

130 135 140

Asn Lys Leu Asn Ile His Thr Tyr Pro Leu Lys Gly Asn Asn Thr Ser

145 150 155 160

Pro Glu Met Val Ala Ala Ile Asp Glu Tyr Ala Gln Ser Lys Asn Arg

165 170 175

Leu Asn Ile Glu Phe Tyr Thr Asn Thr Ala His Val Phe Asn Asn Leu

180 185 190

Pro Pro Ile Ile Gln Pro Leu Tyr Asn Asn Glu Lys Val Lys Ile Ser

195 200 205

His Ile Ser Leu Tyr Asp Asp Gly Ser Ser Glu Tyr Val Ser Leu Tyr

210 215 220

Gln Trp Lys Asp Thr Pro Asn Lys Ile Glu Thr Leu Glu Gly Glu Val

225 230 235 240

Ser Leu Leu Ala Asn Tyr Leu Ala Gly Thr Ser Pro Asp Ala Pro Lys

245 250 255

Gly Met Gly Asn Arg Tyr Asn Trp His Lys Leu Tyr Asp Thr Asp Tyr

260 265 270

Tyr Phe Leu Arg Glu Asp Tyr Leu Asp Val Glu Ala Asn Leu His Asp

275 280 285

Leu Arg Asp Tyr Leu Gly Ser Ser Ala Lys Gln Met Pro Trp Asp Glu

290 295 300

Phe Ala Lys Leu Ser Asp Ser Gln Gln Thr Leu Phe Leu Asp Ile Val

305 310 315 320

Gly Phe Asp Lys Glu Gln Leu Gln Gln Gln Tyr Ser Gln Ser Pro Leu

325 330 335

Pro Asn Phe Ile Phe Thr Gly Thr Thr Thr Trp Ala Gly Gly Glu Thr

340 345 350

Lys Glu Tyr Tyr Ala Gln Gln Gln Val Asn Val Ile Asn Asn Ala Ile

355 360 365

Asn Glu Thr Ser Pro Tyr Tyr Leu Gly Lys Asp Tyr Asp Leu Phe Phe

370 375 380

Lys Gly His Pro Ala Gly Gly Val Ile Asn Asp Ile Ile Leu Gly Ser

385 390 395 400

Phe Pro Asp Met Ile Asn Ile Pro Ala Lys Ile Ser Phe Glu Val Leu

405 410 415

Met Met Thr Asp Met Leu Pro Asp Thr Val Ala Gly Ile Ala Ser Ser

420 425 430

Leu Tyr Phe Thr Ile Pro Ala Asp Lys Val Asn Phe Ile Val Phe Thr

435 440 445

Ser Ser Asp Thr Ile Thr Asp Arg Glu Glu Ala Leu Lys Ser Pro Leu

450 455 460

Val Gln Val Met Leu Thr Leu Gly Ile Val Lys Glu Lys Asp Val Leu

465 470 475 480

Phe Trp Ala

<210> 5

<211> 310

<212> DNA

<213> 人工序列

<220>

<223> PflpF 启动子元件

<300>

<310> WO/2019/123324

<311> 19.12.2018

<312> 27.06.2019

<400> 5

atgcgcaaat gcggcacgcc ttgcagatta cggtttgcca cacttttcat ccttctcctg 60

gtgacataat ccacatcaat cgaaaatgtt aataaatttg ttgcgcgaat gatctaacaa 120

acatgcatca tgtacaatca gatggaataa atggcgcgat aacgctcatt ttatgacgag 180

gcacacacat tttaagttcg atatttctcg tttttgctcg ttaacgataa gtttacagca 240

tgcctacaag catcgtggag gtccgtgact ttcacgcata caacaaacat taaccaagga 300

ggaaacagct 310

<210> 6

<211> 310

<212> DNA

<213> 人工序列

<220>

<223> PglpF_SD4 启动子元件

<300>

<310> WO/2019/123324

<311> 19.12.2018

<312> 27.06.2019

<400> 6

atgcgcaaat gcggcacgcc ttgcagatta cggtttgcca cacttttcat ccttctcctg 60

gtgacataat ccacatcaat cgaaaatgtt aataaatttg ttgcgcgaat gatctaacaa 120

acatgcatca tgtacaatca gatggaataa atggcgcgat aacgctcatt ttatgacgag 180

gcacacacat tttaagttcg atatttctcg tttttgctcg ttaacgataa gtttacagca 240

tgcctacaag catcgtggag gtccgtgact ttcacgcata caacaaacat taaccaacta 300

ggaaacagct 310

<210> 7

<211> 310

<212> DNA

<213> 人工序列

<220>

<223> Pg.pF_SD7 启动子元件

<300>

<310> WO/2019/123324

<311> 19.12.2018

<312> 27.06.2019

<400> 7

atgcgcaaat gcggcacgcc ttgcagatta cggtttgcca cacttttcat ccttctcctg 60

gtgacataat ccacatcaat cgaaaatgtt aataaatttg ttgcgcgaat gatctaacaa 120

acatgcatca tgtacaatca gatggaataa atggcgcgat aacgctcatt ttatgacgag 180

gcacacacat tttaagttcg atatttctcg tttttgctcg ttaacgataa gtttacagca 240

tgcctacaag catcgtggag gtccgtgact ttcacgcata caacaaacat taaccaagag 300

caaaacagct 310

<210> 8

<211> 195

<212> DNA

<213> 人工序列

<220>

<223> Plac 启动子元件

<400> 8

atgcgcaaat tgtgagttag ctcactcatt aggcacccca ggctttacac tttatgcttc 60

cggctcgtat gttgtgtgga attgtgagcg gataacaatt tcacacagga aacagctatg 120

accatgatta cgccaagcgc gcaattaacc ctcactaaag ggaacaaaag ctgggtacct 180

aaggaggaaa cagct 195

<210> 9

<211> 1029

<212> DNA

<213> 人工序列

<220>

<223> 编码2,3-唾液酸转移酶NST的核酸序列

<400> 9

atggaacgta acgccgtgag cctgctgaaa gaaaaactgt ttaacgaaga aggtgaaccg 60

gtcaatctga tcttctgcta taccattctg cagatgaaag tggcagaacg tattatggct 120

caacatccgg gcgaacgctt ttatgtggtt ctgatgagtg aaaaccgtaa cgaaaaatac 180

gattactact tcaaccagat caaagacaaa gcagaacgcg cttatttctt tcacctgccg 240

tacggtctga acaaatcgtt taatttcatt ccgacgatgg cggaactgaa agttaaaagc 300

atgctgctgc cgaaagtcaa acgtatctat ctggcatccc tggaaaaagt gtcaattgcg 360

gcctttctgt ccacctaccc ggatgctgaa atcaaaacct tcgatgacgg cacgggtaac 420

ctgattcaaa gctctagtta tctgggcgat gaattttctg ttaacggtac gatcaaacgt 480

aatttcgccc gcatgatgat cggcgattgg tctattgcga aaacccgcaa cgccagtgac 540

gaacattaca cgatcttcaa aggcctgaaa aacatcatgg atgacggtcg tcgcaaaatg 600

acctacctgc cgctgttcga tgccagcgaa ctgaaaacgg gcgacgaaac cggcggtacg 660

gttcgtattc tgctgggttc cccggataaa gaaatgaaag aaatctcaga aaaagcagct 720

aaaaacttca aaatccagta tgtcgcaccg cacccgcgcc aaacctacgg tctgtcgggt 780

gtgaccacgc tgaacagccc gtatgttatt gaagattaca tcctgcgtga aattaagaaa 840

aacccgcata cccgctatga aatctacacg tttttctctg gtgcggccct gaccatgaaa 900

gattttccga atgtccacgt gtatgcgctg aaaccggcca gtctgccgga agactactgg 960

ctgaaaccgg tgtacgctct gttcacgcaa tccggcatcc cgattctgac ctttgacgat 1020

aaaaactaa 1029

<210> 10

<211> 1452

<212> DNA

<213> 人工序列

<220>

<223> 编码2,6-唾液酸转移酶Pd2,ST6的核酸序列

<400> 10

atgtgcaata gcgataacac cagcctgaaa gaaaccgtta gcagcaatag cgcagatgtt 60

gttgaaaccg aaacctatca gctgaccccg attgatgcac cgagcagctt tctgagccat 120

agctgggaac agacctgtgg caccccgatt ctgaatgaaa gcgataaaca ggcaatcagc 180

tttgattttg ttgcaccgga actgaaacag gatgagaaat attgctttac cttcaaaggc 240

attaccggtg atcatcgtta tattaccaat accaccctga ccgttgttgc accgaccctg 300

gaagtttata ttgatcatgc aagcctgccg agcctgcagc agctgattca tattattcag 360

gccaaagatg aatatccgag caatcagcgt tttgttagct ggaaacgtgt taccgttgat 420

gcagataatg ccaacaaact gaacattcat acctatccgc tgaaaggcaa taataccagt 480

ccggaaatgg ttgcagcaat tgatgaatat gcacagagca aaaatcgcct gaacatcgaa 540

ttctatacca ataccgcaca cgtgtttaat aacctgcctc cgattattca gccgctgtat 600

aataacgaga aagtgaaaat tagccatatt agcctgtatg atgatggcag cagcgaatat 660

gttagcctgt atcagtggaa agataccccg aacaaaattg aaaccctgga aggtgaagtt 720

agcctgctgg caaattatct ggcaggcacc agtccggatg caccgaaagg tatgggtaat 780

cgttataatt ggcacaaact gtatgacacc gactattact ttctgcgcga agattatctg 840

gatgttgaag caaatctgca tgatctgcgt gattatctgg gtagcagcgc aaaacaaatg 900

ccgtgggatg aatttgcaaa actgagcgat agccagcaga ccctgtttct ggatattgtt 960

ggttttgata aagaacagct gcagcagcag tatagccaga gtccgctgcc gaattttatc 1020

tttaccggca ccaccacctg ggcaggcggt gaaaccaaag aatactatgc acagcagcag 1080

gttaacgtga ttaacaatgc aattaatgaa accagcccgt actatctggg taaagattat 1140

gacctgtttt tcaaaggtca tccggctggc ggtgttatta atgatattat tctgggtagc 1200

ttcccggata tgattaacat tccggcaaaa attagcttcg aggttctgat gatgaccgat 1260

atgctgccgg ataccgttgc aggtattgca agcagcctgt atttcaccat tccggcagat 1320

aaagtgaact ttattgtttt caccagcagc gataccatta ccgatcgtga agaagcactg 1380

aaaagtccgc tggttcaggt tatgctgacc ctgggtattg ttaaagaaaa agatgttctg 1440

ttctgggcct aa 1452

<210> 11

<211> 346

<212> PRT

<213> Campylobacter jejuni

<220>

<223> 唾液酸合酶, NeuB, GenBank ID: AAK91726.1

<400> 11

Met Lys Glu Ile Lys Ile Gln Asn Ile Ile Ile Ser Glu Glu Lys Ala

1 5 10 15

Pro Leu Val Val Pro Glu Ile Gly Ile Asn His Asn Gly Ser Leu Glu

20 25 30

Leu Ala Lys Ile Met Val Asp Ala Ala Phe Ser Ala Gly Ala Lys Ile

35 40 45

Ile Lys His Gln Thr His Ile Val Glu Asp Glu Met Ser Lys Ala Ala

50 55 60

Lys Lys Val Ile Pro Gly Asn Ala Lys Ile Ser Ile Tyr Glu Ile Met

65 70 75 80

Gln Lys Cys Ala Leu Asp Tyr Lys Asp Glu Leu Ala Leu Lys Glu Tyr

85 90 95

Thr Glu Lys Leu Gly Leu Val Tyr Leu Ser Thr Pro Phe Ser Arg Ala

100 105 110

Gly Ala Asn Arg Leu Glu Asp Met Gly Val Ser Ala Phe Lys Ile Gly

115 120 125

Ser Gly Glu Cys Asn Asn Tyr Pro Leu Ile Lys His Ile Ala Ala Phe

130 135 140

Lys Lys Pro Met Ile Val Ser Thr Gly Met Asn Ser Ile Glu Ser Ile

145 150 155 160

Lys Pro Thr Val Lys Ile Leu Leu Asp Asn Glu Ile Pro Phe Val Leu

165 170 175

Met His Thr Thr Asn Leu Tyr Pro Thr Pro His Asn Leu Val Arg Leu

180 185 190

Asn Ala Met Leu Glu Leu Lys Lys Glu Phe Ser Cys Met Val Gly Leu

195 200 205

Ser Asp His Thr Thr Asp Asn Leu Ala Cys Leu Gly Ala Val Val Leu

210 215 220

Gly Ala Cys Val Leu Glu Arg His Phe Thr Asp Ser Met His Arg Ser

225 230 235 240

Gly Pro Asp Ile Val Cys Ser Met Asp Thr Lys Ala Leu Lys Glu Leu

245 250 255

Ile Ile Gln Ser Glu Gln Met Ala Ile Ile Arg Gly Asn Asn Glu Ser

260 265 270

Lys Lys Ala Ala Lys Gln Glu Gln Val Thr Ile Asp Phe Ala Phe Ala

275 280 285

Ser Val Val Ser Ile Lys Asp Ile Lys Lys Gly Glu Val Leu Ser Met

290 295 300

Asp Asn Ile Trp Val Lys Arg Pro Gly Leu Gly Gly Ile Ser Ala Ala

305 310 315 320

Glu Phe Glu Asn Ile Leu Gly Lys Lys Ala Leu Arg Asp Ile Glu Asn

325 330 335

Asp Ala Gln Leu Ser Tyr Glu Asp Phe Ala

340 345

<210> 12

<211> 1041

<212> DNA

<213> Campylobacter jejuni

<220>

<223>编码唾液酸合酶, NeuB的核酸序列

<400> 12

atgaaagaaa taaaaataca aaatataatc ataagtgaag aaaaagcacc cttagtcgta 60

cctgaaatag gcattaatca taatggcagt ttagaactag ctaaaattat ggtagatgca 120

gcctttagcg caggtgctaa gattataaag catcaaactc atattgttga agatgagatg 180

agtaaggccg ctaaaaaagt aattcctggt aatgcaaaaa taagcattta tgagattatg 240

caaaaatgtg ctttggatta taaagatgag ctagcactta aagaatacac agaaaaatta 300

ggtcttgttt atcttagcac acctttttct cgtgcaggtg cgaaccgctt agaagatatg 360

ggagttagtg cttttaagat tggttcaggt gagtgtaata attatccgct tattaaacac 420

atagcagcct ttaaaaagcc tatgatagtt agcacaggaa tgaatagtat tgaaagtata 480

aaaccaactg taaaaatctt attagacaat gaaattcctt ttgttttaat gcacacgacc 540

aatctttacc caaccccgca taatcttgta agattaaacg ctatgcttga gttaaaaaaa 600

gaattttctt gtatggtagg cttaagcgac cacacaacag ataatcttgc gtgtttaggt 660

gcagttgtac ttggagcttg tgtgcttgaa agacatttta ctgatagtat gcatagaagt 720

ggccctgata tagtttgttc tatggataca aaggctttaa aagagctaat tatacaaagt 780

gagcaaatgg ctataataag aggaaataat gaaagtaaaa aagcggctaa acaagaacaa 840

gttacaattg attttgcctt tgcaagtgta gttagcatta aagatattaa aaaaggcgaa 900

gttttatcta tggataatat ttgggttaaa agacctggac ttggtggaat tagtgcggct 960

gaatttgaaa atattttagg caaaaaagca ttaagagata tagaaaatga tgctcagtta 1020

agctatgagg attttgcgtg a 1041

<210> 13

<211> 372

<212> PRT

<213> Campylobacter jejuni

<220>

<223> N-乙酰葡糖胺-6-磷酸2-差向异构酶, NeuC

<400> 13

Val Lys Lys Ile Leu Phe Ile Thr Gly Ser Arg Ala Asp Tyr Ser Lys

1 5 10 15

Ile Lys Ser Leu Met Tyr Arg Val Gln Asn Ser Ser Glu Phe Glu Leu

20 25 30

Tyr Ile Phe Ala Thr Gly Met His Leu Ser Lys Asn Phe Gly Tyr Thr

35 40 45

Val Lys Glu Leu Tyr Lys Asn Gly Phe Lys Asn Ile Tyr Glu Phe Ile

50 55 60

Asn Tyr Asp Lys Tyr Tyr Gln Thr Asp Lys Ala Leu Ala Thr Thr Ile

65 70 75 80

Asp Gly Phe Ser Arg Tyr Ala Asn Glu Leu Lys Pro Asp Leu Ile Val

85 90 95

Val His Gly Asp Arg Ile Glu Pro Leu Ala Ala Ala Ile Val Gly Ala

100 105 110

Leu Asn Asn Ile Leu Val Ala His Ile Glu Gly Gly Glu Ile Ser Gly

115 120 125

Thr Ile Asp Asp Ser Leu Arg His Ala Ile Ser Lys Leu Ala His Ile

130 135 140

His Leu Val Asn Asp Glu Phe Ala Lys Arg Arg Leu Met Gln Leu Gly

145 150 155 160

Glu Asp Glu Lys Ser Ile Phe Ile Ile Gly Ser Pro Asp Leu Glu Leu

165 170 175

Leu Asn Asp Asn Lys Ile Ser Leu Ser Glu Ala Lys Lys Tyr Tyr Asp

180 185 190

Ile Asn Tyr Glu Asn Tyr Ala Leu Leu Met Phe His Pro Val Thr Thr

195 200 205

Glu Ile Thr Ser Ile Lys Asn Gln Ala Asp Asn Leu Val Lys Ala Leu

210 215 220

Ile Gln Ser Asn Lys Asn Tyr Ile Val Ile Tyr Pro Asn Asn Asp Leu

225 230 235 240

Gly Phe Glu Leu Ile Leu Gln Ser Tyr Glu Glu Phe Lys Asn Asn Pro

245 250 255

Arg Phe Lys Leu Phe Pro Ser Leu Arg Phe Glu Tyr Phe Ile Thr Leu

260 265 270

Leu Lys Asn Ala Asp Phe Ile Ile Gly Asn Ser Ser Cys Ile Leu Lys

275 280 285

Glu Ala Leu Tyr Leu Lys Thr Ala Gly Ile Leu Val Gly Ser Arg Gln

290 295 300

Asn Gly Arg Leu Gly Asn Glu Asn Thr Leu Lys Val Asn Ala Asn Ser

305 310 315 320

Asp Glu Ile Leu Lys Ala Ile Asn Thr Ile His Lys Lys Gln Asp Leu

325 330 335

Phe Ser Ala Lys Leu Glu Ile Leu Asp Ser Ser Lys Leu Phe Phe Glu

340 345 350

Tyr Leu Gln Ser Gly Asp Phe Phe Lys Leu Ser Thr Gln Lys Val Phe

355 360 365

Lys Asp Ile Lys

370

<210> 14

<211> 1119

<212> DNA

<213> Campylobacter jejuni

<220>

<223>编码N-乙酰葡糖胺-6-磷酸

2-差向异构酶, NeuC的核酸序列

<400> 14

gtgaaaaaaa tcctttttat aacaggctct agggctgatt attctaagat taaatcttta 60

atgtacaggg tgcaaaactc aagcgaattt gaactttaca tctttgcaac aggaatgcac 120

ttaagtaaaa attttggcta tacagttaaa gaactttata aaaatggctt taaaaatatt 180

tatgaattta taaattatga taaatattat caaactgata aggctttagc tactacaatt 240

gatggatttt caaggtatgc aaatgagcta aaacctgatt taatcgtagt acatggagat 300

agaattgagc ctttagcagc agctattgtt ggagcattaa ataatatctt agtagcgcat 360

attgaaggcg gagagatttc aggaactatt gacgatagct tacgccacgc tatatcaaaa 420

ctagctcata ttcatttagt aaatgatgag tttgcaaaaa ggcgtttaat gcagcttgga 480

gaagatgaaa aatctatttt tatcataggt tcgcctgatt tagaactttt aaacgataat 540

aaaatttcac ttagcgaagc aaaaaaatat tatgatataa attatgaaaa ctacgctttg 600

cttatgtttc atcctgttac aactgaaatt actagcatta aaaatcaagc agacaattta 660

gtaaaagcac tgatacaaag taataaaaat tatattgtta tttatccaaa taatgattta 720

ggttttgaat taatcttgca aagctatgaa gagtttaaaa ataaccctag atttaagctt 780

tttccatcgc ttagatttga gtattttata actttgttaa aaaatgctga ttttataata 840

ggtaattcaa gttgtatttt aaaagaggcc ttatacttaa aaacagcagg gattttagtt 900

ggctcaagac aaaatggaag acttggcaat gaaaatacac taaaagttaa tgcaaatagt 960

gatgaaatac taaaagctat taacactatt cataaaaaac aagatttatt tagcgctaag 1020

ttagagattt tagatagctc aaaattattt tttgaatatt tacaaagcgg agattttttt 1080

aaactcagca cacaaaaagt ttttaaggat ataaaatga 1119

<210> 15

<211> 221

<212> PRT

<213> Campylobacter jejuni

<220>

<223> CMP-Neu5Ac 合成酶, NeuA

<400> 15

Met Ser Leu Ala Ile Ile Pro Ala Arg Gly Gly Ser Lys Gly Ile Lys

1 5 10 15

Asn Lys Asn Leu Val Leu Leu Asn Asn Lys Pro Leu Ile Tyr Tyr Thr

20 25 30

Ile Lys Ala Ala Leu Asn Ala Lys Ser Ile Ser Lys Val Val Val Ser

35 40 45

Ser Asp Ser Asp Glu Ile Leu Asn Tyr Ala Lys Ser Gln Asn Val Asp

50 55 60

Ile Leu Lys Arg Pro Ile Ser Leu Ala Gln Asp Asp Thr Thr Ser Asp

65 70 75 80

Lys Val Leu Leu His Ala Leu Lys Phe Tyr Lys Asp Tyr Glu Asp Val

85 90 95

Val Phe Leu Gln Pro Thr Ser Pro Leu Arg Thr Asn Ile His Ile Asn

100 105 110

Glu Ala Phe Asn Leu Tyr Lys Asn Ser Asn Ala Asn Ala Leu Ile Ser

115 120 125

Val Ser Glu Cys Asp Asn Lys Ile Leu Lys Ala Phe Val Cys Asn Asp

130 135 140

Cys Gly Asp Leu Ala Gly Ile Cys Asn Asp Glu Tyr Pro Phe Met Pro

145 150 155 160

Arg Gln Lys Leu Pro Lys Thr Tyr Met Ser Asn Gly Ala Ile Tyr Ile

165 170 175

Leu Lys Ile Lys Glu Phe Leu Asn Asn Pro Ser Phe Leu Gln Ser Lys

180 185 190

Thr Lys His Phe Leu Met Asp Glu Ser Ser Ser Leu Asp Ile Asp Cys

195 200 205

Leu Glu Asp Leu Lys Lys Val Glu Gln Ile Trp Lys Lys

210 215 220

<210> 16

<211> 666

<212> DNA

<213> Campylobacter jejuni

<220>

<223>编码CMP-Neu5Ac合成酶, neuA的核酸序列

<400> 16

atgagcttag caataatccc tgctcgtggt ggctcaaagg gtattaaaaa taaaaatttg 60

gttttattaa acaataaacc tttaatttac tacacgatca aagctgcact aaatgctaaa 120

agcattagta aagttgttgt aagcagtgat agtgatgaaa ttttaaatta tgcaaaaagt 180

caaaatgttg atattttaaa acgcccaatt agccttgcac aagatgatac cacaagcgat 240

aaagtgctgt tacatgctct aaaattttat aaagattatg aagatgtagt ttttttacaa 300

cccacttcac cgctaagaac aaatattcat attaatgaag cttttaatct ttataaaaat 360

agcaatgcaa atgccctaat tagcgtaagc gaatgtgata ataaaattct aaaagccttt 420

gtttgtaatg attgtggcga tttagcaggg atttgtaatg atgaatatcc ttttatgcca 480

aggcaaaaat tgcctaaaac ttatatgagc aatggtgcaa tttatatttt aaagataaaa 540

gaatttttaa acaatcctag ctttttacaa agcaaaacca agcatttttt aatggacgaa 600

agctcaagtt tagatattga ctgtttggag gatttaaaaa aggttgaaca gatatggaaa 660

aaataa 666

<210> 17

<211> 2818

<212> DNA

<213> Campylobacter jejuni

<220>

<223> neuCBA基因簇

<400> 17

atgaaagaaa taaaaataca aaatataatc ataagtgaag aaaaagcacc cttagtcgta 60

cctgaaatag gcattaatca taatggcagt ttagaactag ctaaaattat ggtagatgca 120

gcctttagcg caggtgctaa gattataaag catcaaactc atattgttga agatgagatg 180

agtaaggccg ctaaaaaagt aattcctggt aatgcaaaaa taagcattta tgagattatg 240

caaaaatgtg ctttggatta taaagatgag ctagcactta aagaatacac agaaaaatta 300

ggtcttgttt atcttagcac acctttttct cgtgcaggtg cgaaccgctt agaagatatg 360

ggagttagtg cttttaagat tggttcaggt gagtgtaata attatccgct tattaaacac 420

atagcagcct ttaaaaagcc tatgatagtt agcacaggaa tgaatagtat tgaaagtata 480

aaaccaactg taaaaatctt attagacaat gaaattcctt ttgttttaat gcacacgacc 540

aatctttacc caaccccgca taatcttgta agattaaacg ctatgcttga gttaaaaaaa 600

gaattttctt gtatggtagg cttaagcgac cacacaacag ataatcttgc gtgtttaggt 660

gcagttgtac ttggagcttg tgtgcttgaa agacatttta ctgatagtat gcatagaagt 720

ggccctgata tagtttgttc tatggataca aaggctttaa aagagctaat tatacaaagt 780

gagcaaatgg ctataataag aggaaataat gaaagtaaaa aagcggctaa acaagaacaa 840

gttacaattg attttgcctt tgcaagtgta gttagcatta aagatattaa aaaaggcgaa 900

gttttatcta tggataatat ttgggttaaa agacctggac ttggtggaat tagtgcggct 960

gaatttgaaa atattttagg caaaaaagca ttaagagata tagaaaatga tgctcagtta 1020

agctatgagg attttgcgtg aaaaaaatcc tttttataac aggctctagg gctgattatt 1080

ctaagattaa atctttaatg tacagggtgc aaaactcaag cgaatttgaa ctttacatct 1140

ttgcaacagg aatgcactta agtaaaaatt ttggctatac agttaaagaa ctttataaaa 1200

atggctttaa aaatatttat gaatttataa attatgataa atattatcaa actgataagg 1260

ctttagctac tacaattgat ggattttcaa ggtatgcaaa tgagctaaaa cctgatttaa 1320

tcgtagtaca tggagataga attgagcctt tagcagcagc tattgttgga gcattaaata 1380

atatcttagt agcgcatatt gaaggcggag agatttcagg aactattgac gatagcttac 1440

gccacgctat atcaaaacta gctcatattc atttagtaaa tgatgagttt gcaaaaaggc 1500

gtttaatgca gcttggagaa gatgaaaaat ctatttttat cataggttcg cctgatttag 1560

aacttttaaa cgataataaa atttcactta gcgaagcaaa aaaatattat gatataaatt 1620

atgaaaacta cgctttgctt atgtttcatc ctgttacaac tgaaattact agcattaaaa 1680

atcaagcaga caatttagta aaagcactga tacaaagtaa taaaaattat attgttattt 1740

atccaaataa tgatttaggt tttgaattaa tcttgcaaag ctatgaagag tttaaaaata 1800

accctagatt taagcttttt ccatcgctta gatttgagta ttttataact ttgttaaaaa 1860

atgctgattt tataataggt aattcaagtt gtattttaaa agaggcctta tacttaaaaa 1920

cagcagggat tttagttggc tcaagacaaa atggaagact tggcaatgaa aatacactaa 1980

aagttaatgc aaatagtgat gaaatactaa aagctattaa cactattcat aaaaaacaag 2040

atttatttag cgctaagtta gagattttag atagctcaaa attatttttt gaatatttac 2100

aaagcggaga tttttttaaa ctcagcacac aaaaagtttt taaggatata aaatgagctt 2160

agcaataatc cctgctcgtg gtggctcaaa gggtattaaa aataaaaatt tggttttatt 2220

aaacaataaa cctttaattt actacacgat caaagctgca ctaaatgcta aaagcattag 2280

taaagttgtt gtaagcagtg atagtgatga aattttaaat tatgcaaaaa gtcaaaatgt 2340

tgatatttta aaacgcccaa ttagccttgc acaagatgat accacaagcg ataaagtgct 2400

gttacatgct ctaaaatttt ataaagatta tgaagatgta gtttttttac aacccacttc 2460

accgctaaga acaaatattc atattaatga agcttttaat ctttataaaa atagcaatgc 2520

aaatgcccta attagcgtaa gcgaatgtga taataaaatt ctaaaagcct ttgtttgtaa 2580

tgattgtggc gatttagcag ggatttgtaa tgatgaatat ccttttatgc caaggcaaaa 2640

attgcctaaa acttatatga gcaatggtgc aatttatatt ttaaagataa aagaattttt 2700

aaacaatcct agctttttac aaagcaaaac caagcatttt ttaatggacg aaagctcaag 2760

tttagatatt gactgtttgg aggatttaaa aaaggttgaa cagatatgga aaaaataa 2818

<210> 18

<211> 297

<212> PRT

<213> Escherichia coli

<220>

<223> 羧化烟酸-核苷酸二磷酸化酶, nadC

<400> 18

Met Pro Pro Arg Arg Tyr Asn Pro Asp Thr Arg Arg Asp Glu Leu Leu

1 5 10 15

Glu Arg Ile Asn Leu Asp Ile Pro Gly Ala Val Ala Gln Ala Leu Arg

20 25 30

Glu Asp Leu Gly Gly Thr Val Asp Ala Asn Asn Asp Ile Thr Ala Lys

35 40 45

Leu Leu Pro Glu Asn Ser Arg Ser His Ala Thr Val Ile Thr Arg Glu

50 55 60

Asn Gly Val Phe Cys Gly Lys Arg Trp Val Glu Glu Val Phe Ile Gln

65 70 75 80

Leu Ala Gly Asp Asp Val Thr Ile Ile Trp His Val Asp Asp Gly Asp

85 90 95

Val Ile Asn Ala Asn Gln Ser Leu Phe Glu Leu Glu Gly Pro Ser Arg

100 105 110

Val Leu Leu Thr Gly Glu Arg Thr Ala Leu Asn Phe Val Gln Thr Leu

115 120 125

Ser Gly Val Ala Ser Lys Val Arg His Tyr Val Glu Leu Leu Glu Gly

130 135 140

Thr Asn Thr Gln Leu Leu Asp Thr Arg Lys Thr Leu Pro Gly Leu Arg

145 150 155 160

Ser Ala Leu Lys Tyr Ala Val Leu Cys Gly Gly Gly Ala Asn His Arg

165 170 175

Leu Gly Leu Ser Asp Ala Phe Leu Ile Lys Glu Asn His Ile Ile Ala

180 185 190

Ser Gly Ser Val Arg Gln Ala Val Glu Lys Ala Ser Trp Leu His Pro

195 200 205

Asp Ala Pro Val Glu Val Glu Val Glu Asn Leu Glu Glu Leu Asp Glu

210 215 220

Ala Leu Lys Ala Gly Ala Asp Ile Ile Met Leu Asp Asn Phe Glu Thr

225 230 235 240

Glu Gln Met Arg Glu Ala Val Lys Arg Thr Asn Gly Lys Ala Leu Leu

245 250 255

Glu Val Ser Gly Asn Val Thr Asp Lys Thr Leu Arg Glu Phe Ala Glu

260 265 270

Thr Gly Val Asp Phe Ile Ser Val Gly Ala Leu Thr Lys His Val Gln

275 280 285

Ala Leu Asp Leu Ser Met Arg Phe Arg

290 295

<210> 19

<211> 894

<212> DNA

<213> Escherichia coli

<220>

<223> 核酸序列，编码羧化烟酸-核苷酸二磷酸化酶, nadC

<400> 19

atgccgcctc gccgctataa ccctgacacc cgacgtgacg agctgctgga acgcattaat 60

ctcgatatcc ccggcgcggt ggcccaggcg ctgcgggaag atttaggcgg aacagtcgat 120

gccaacaatg atattacggc aaaactttta ccggaaaatt ctcgctctca tgccacggtg 180

atcacccgcg agaatggcgt cttttgcggc aaacgctggg ttgaagaggt gtttattcaa 240

ctggcaggcg acgatgtcac cataatctgg catgtggatg acggcgatgt catcaatgcc 300

aatcaatcct tgttcgaact tgaaggccca tcccgcgtgc tgttaacggg cgaacgcact 360

gcgcttaatt ttgtgcaaac cctttcagga gttgccagta aggtacgcca ctatgtcgaa 420

ttgctggaag gcaccaacac gcagttgttg gatacgcgca aaaccttacc cggcctgcgt 480

tcagctctga aatacgcggt actttgcggc ggcggagcga atcaccgtct ggggctttct 540

gatgccttcc tgatcaaaga aaaccatatt attgcctccg gctcagtgcg ccaggcggtc 600

gaaaaagcgt cctggctgca cccggatgcg ccagtagaag tcgaagtaga gaatctggaa 660

gaacttgatg aagccctgaa agcaggagcc gatatcatca tgctggataa cttcgaaaca 720

gaacagatgc gcgaagccgt caaacgcacc aacggcaagg cgctactgga agtgtctggc 780

aacgtcactg acaaaacact gcgtgaattt gccgaaacgg gcgtggactt tatctccgtc 840

ggtgcgctaa ctaaacacgt acaagcactc gacctttcaa tgcgttttcg ctaa 894

<210> 20

<211> 24

<212> DNA

<213> 人工序列

<220>

<223> Oligo O48, galK.for

<400> 20

cccagcgaga cctgaccgca gaac 24

<210> 21

<211> 24

<212> DNA

<213> 人工序列

<220>

<223> Oligo O49, galK.rev

<400> 21

ccccagtcca tcagcgtgac tacc 24

<210> 22

<211> 34

<212> DNA

<213> 人工序列

<220>

<223> Oligo O40 Backbone.for

<220>

<221> misc_RNA

<222> 9

<400> 22

attaacccuc caggcatcaa ataaaacgaa aggc 34

<210> 23

<211> 32

<212> DNA

<213> 人工序列

<220>

<223> Oligo O79, Backbone.rev

<220>

<221> misc_RNA

<222> 10

<400> 23

atttgcgcau caccaatcaa attcacgcgg cc 32

<210> 24

<211> 32

<212> DNA

<213> 人工序列

<220>

<223> Oligo O261, PglpF.for

<220>

<221> misc_RNA

<222> 10

<400> 24

atgcgcaaau gcggcacgcc ttgcagatta cg 32

<210> 25

<211> 36

<212> DNA

<213> 人工序列

<220>

<223> Oligo O262, PglpF.rev

<220>

<221> misc_RNA

<222> 8

<400> 25

agctgttucc tccttggtta atgtttgttg tatgcg 36

<210> 26

<211> 36

<212> DNA

<213> 人工序列

<220>

<223> Oligo O459, PglpF_SD4

<220>

<221> misc_RNA

<222> 8

<400> 26

agctgttucc tagttggtta atgtttgttg tatgcg 36

<210> 27

<211> 36

<212> DNA

<213> 人工序列

<220>

<223> Oligo O462, PglpF_SD7

<220>

<221> misc_RNA

<222> 8

<400> 27

agctgttutg ctcttggtta atgtttgttg tatgcg 36

<210> 28

<211> 31

<212> DNA

<213> 人工序列

<220>

<223> Oligo KABY733, fred.for

<220>

<221> misc_RNA

<222> 8

<400> 28

aaacagcuat gaagagcgcg ctgaccttca g 31

<210> 29

<211> 29

<212> DNA

<213> 人工序列

<220>

<223> Oligo KABY 734, fred.rev

<220>

<221> misc_RNA

<222> 9

<400> 29

agggttaaut tacgcttcac gcacacgcg 29

<210> 30

<211> 32

<212> DNA

<213> 人工序列

<220>

<223> Oligo O68, Plac.for

<220>

<221> misc_RNA

<222> 10

<400> 30

atgcgcaaau tgtgagttag ctcactcatt ag 32

<210> 31

<211> 36

<212> DNA

<213> 人工序列

<220>

<223> Oligo O113, Plac.rev

<220>

<221> misc_RNA

<222> 8

<400> 31

agctgttucc tccttaggta cccagctttt gttccc 36

<210> 32

<211> 32

<212> DNA

<213> 人工序列

<220>

<223> Oligo KABY721, YberC0001_9420.for

<220>

<221> misc_RNA

<222> 8

<400> 32

aaacagcuat gaagagcgcg ctgaccttta gc 32

<210> 33

<211> 29

<212> DNA

<213> 人工序列

<220>

<223> Oligo KABY722, YberC0001_9420.rev

<220>

<221> misc_RNA

<222> 9

<400> 33

agggttaaut tacgcctcac gcacacgcg 29

Claims

1.一种能够产生一种或多种包括唾液酸部分的人乳寡糖(HMO)的遗传修饰细胞，其中所述遗传修饰细胞包括，

(i)编码SEQ ID NO:1的主要易化子超家族(MFS)多肽或其氨基酸序列与SEQ ID NO:1同一性为至少70％的功能同源物的异源核酸序列，和

(ii)编码唾液酸转移酶的异源核酸序列；和

(iii)用于制造唾液酸糖核苷酸的生物合成途径。

2.根据权利要求1所述的遗传修饰细胞，其中所产生的一种或多种HMO选自3’-SL、6’-SL、FSL、DS-LNT、LSTc、LSTa和LSTb。

3.根据前述权利要求中任一项所述的遗传修饰细胞，其中与没有MFS多肽的细胞相比，SEQ ID NO:1的所述MFS多肽或其功能同源物的表达导致所述HMO的输出增加。

4.根据前述权利要求中任一项所述的遗传修饰细胞，其中所述唾液酸转移酶选自α-2,3-唾液酸转移酶和α-2,6-唾液酸转移酶，例如表2中呈现的那些。

5.根据前述权利要求中任一项所述的遗传修饰细胞，其中所述α-2,3-唾液酸转移酶选自Nst(SEQ ID NO:3)或Pd2(SEQ ID NO:4)和/或其氨基酸序列与SEQ ID NO:3或SEQ IDNO:4同一性为至少70％的功能同源物。

6.根据前述权利要求中任一项所述的遗传修饰细胞，其中所述唾液酸糖核苷酸是CMP-Neu5Ac。

7.根据前述权利要求中任一项所述的遗传修饰细胞，其中用于制造唾液酸糖核苷酸的生物合成途径由以下编码：SEQ ID NO:17的neuBCA基因簇，或一个或多个异源基因：SEQ IDNO:12的NeuB和SEQ ID NO:14的NeuC和SEQ ID NO:16的NeuA，或其核酸序列与SEQ ID NO:17、SEQ ID NO:12、SEQ ID NO:14或SEQ ID NO:16同一性为至少80％的功能同源物。

8.根据前述权利要求中任一项所述的遗传修饰细胞，其中所述细胞还包括：包含用于调节所述异源核酸序列的表达的调控元件的核酸序列。

9.根据权利要求8所述的遗传修饰细胞，其中所述调控元件调节SEQ ID NO:1的MFS多肽或其氨基酸序列与SEQ ID NO:1同一性为至少70％的功能同源物的表达。

10.根据权利要求8或9所述的遗传修饰细胞，其中所述调控元件选自PglpF(SEQ IDNO:5)、PglpF_SD4(SEQ ID NO:6)和PglpF_SD7(SEQ ID NO:7)。

11.根据前述权利要求中任一项所述的遗传修饰细胞，其中所述遗传修饰细胞是微生物细胞，例如大肠杆菌。

12.一种核酸构建体，包括

(i)编码根据SEQ ID NO:1的MFS多肽或其与SEQ ID NO:1序列同一性超过70％的功能同源物的核酸序列，其中编码MFS多肽的所述核酸序列与SEQ ID NO:2序列同一性为至少70％，和

(ii)包括调控元件的核酸序列，所述调控元件调节第(i)点的所述核酸序列的任意一个或多个的表达。

13.根据权利要求12的核酸构建体，其中所述调控元件选自PglpF(SEQ ID NO:5)、PglpF_SD4(SEQ ID NO:6)和PglpF_SD7(SEQ ID NO:7)。

14.一种用于生物合成产生一种或多种唾液酸化人乳寡糖(HMO)的方法，所述方法包括以下步骤：

(i)提供根据权利要求1-11中任一项所述的遗传修饰细胞；

(ii)在合适的细胞培养基中培养所述遗传修饰细胞，以表达编码SEQ ID NO:1的主要易化子超家族(MFS)多肽或其氨基酸序列与SEQ ID NO:1同一性超过70％的功能同源物的所述异源核酸序列、和编码唾液酸转移酶的异源核酸序列，从而产生一种或多种唾液酸化人乳寡糖(HMO)，和

(iii)收获步骤(ii)中产生的一种或多种唾液酸化HMO。

15.根据权利要求1至11中任一项所述的遗传修饰细胞或根据权利要求12或13中任一项所述的核酸构建体用于生物合成产生一种或多种唾液酸化人乳寡糖(HMO)的用途。

16.根据权利要求15的遗传修饰细胞的用途，其中所述唾液酸化HMO选自3’-SL和6’-SL。