CN116249781A - 在细胞中的含有GlcNAc的生物产品的产生 - Google Patents

在细胞中的含有GlcNAc的生物产品的产生 Download PDF

Info

Publication number
CN116249781A
CN116249781A CN202180055890.4A CN202180055890A CN116249781A CN 116249781 A CN116249781 A CN 116249781A CN 202180055890 A CN202180055890 A CN 202180055890A CN 116249781 A CN116249781 A CN 116249781A
Authority
CN
China
Prior art keywords
seq
cell
acetylglucosamine
udp
sequence
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202180055890.4A
Other languages
English (en)
Inventor
苏菲·艾斯艾特
乔瑞·博普雷兹
彼得·考斯蒙特
托马斯·德科恩
娜乌西卡·兰诺
格特·彼得斯
克里斯托夫·范德瓦勒
安妮莉丝·维考特伦
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Inbiose NV
Original Assignee
Inbiose NV
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from EP20190203.8A external-priority patent/EP3954778B1/en
Priority claimed from EP20190205.3A external-priority patent/EP3954769A1/en
Application filed by Inbiose NV filed Critical Inbiose NV
Publication of CN116249781A publication Critical patent/CN116249781A/zh
Pending legal-status Critical Current

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P19/00Preparation of compounds containing saccharide radicals
    • C12P19/12Disaccharides
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N1/00Microorganisms, e.g. protozoa; Compositions thereof; Processes of propagating, maintaining or preserving microorganisms or compositions thereof; Processes of preparing or isolating a composition containing a microorganism; Culture media therefor
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N1/00Microorganisms, e.g. protozoa; Compositions thereof; Processes of propagating, maintaining or preserving microorganisms or compositions thereof; Processes of preparing or isolating a composition containing a microorganism; Culture media therefor
    • C12N1/20Bacteria; Culture media therefor
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N1/00Microorganisms, e.g. protozoa; Compositions thereof; Processes of propagating, maintaining or preserving microorganisms or compositions thereof; Processes of preparing or isolating a composition containing a microorganism; Culture media therefor
    • C12N1/20Bacteria; Culture media therefor
    • C12N1/205Bacterial isolates
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/52Genes encoding for enzymes or proenzymes
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/70Vectors or expression systems specially adapted for E. coli
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N5/00Undifferentiated human, animal or plant cells, e.g. cell lines; Tissues; Cultivation or maintenance thereof; Culture media therefor
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/10Transferases (2.)
    • C12N9/1025Acyltransferases (2.3)
    • C12N9/1029Acyltransferases (2.3) transferring groups other than amino-acyl groups (2.3.1)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/10Transferases (2.)
    • C12N9/1048Glycosyltransferases (2.4)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/10Transferases (2.)
    • C12N9/1048Glycosyltransferases (2.4)
    • C12N9/1051Hexosyltransferases (2.4.1)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/10Transferases (2.)
    • C12N9/1048Glycosyltransferases (2.4)
    • C12N9/1081Glycosyltransferases (2.4) transferring other glycosyl groups (2.4.99)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/10Transferases (2.)
    • C12N9/1096Transferases (2.) transferring nitrogenous groups (2.6)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P19/00Preparation of compounds containing saccharide radicals
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P19/00Preparation of compounds containing saccharide radicals
    • C12P19/18Preparation of compounds containing saccharide radicals produced by the action of a glycosyl transferase, e.g. alpha-, beta- or gamma-cyclodextrins
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P19/00Preparation of compounds containing saccharide radicals
    • C12P19/26Preparation of nitrogen-containing carbohydrates
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P7/00Preparation of oxygen-containing organic compounds
    • C12P7/40Preparation of oxygen-containing organic compounds containing a carboxyl group including Peroxycarboxylic acids
    • C12P7/58Aldonic, ketoaldonic or saccharic acids
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y203/00Acyltransferases (2.3)
    • C12Y203/01Acyltransferases (2.3) transferring groups other than amino-acyl groups (2.3.1)
    • C12Y203/01004Glucosamine-phosphate N-acetyltransferase (2.3.1.4)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y204/00Glycosyltransferases (2.4)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y204/00Glycosyltransferases (2.4)
    • C12Y204/01Hexosyltransferases (2.4.1)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y206/00Transferases transferring nitrogenous groups (2.6)
    • C12Y206/01Transaminases (2.6.1)
    • C12Y206/01016Glutamine-fructose-6-phosphate transaminase (isomerizing) (2.6.1.16), i.e. glucosamine-6-phosphate-synthase
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2500/00Specific components of cell culture medium
    • C12N2500/30Organic components
    • C12N2500/34Sugars
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y204/00Glycosyltransferases (2.4)
    • C12Y204/01Hexosyltransferases (2.4.1)
    • C12Y204/01038Beta-N-acetylglucosaminylglycopeptide beta-1,4-galactosyltransferase (2.4.1.38)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y204/00Glycosyltransferases (2.4)
    • C12Y204/99Glycosyltransferases (2.4) transferring other glycosyl groups (2.4.99)
    • C12Y204/99001Beta-galactoside alpha-2,6-sialyltransferase (2.4.99.1)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y204/00Glycosyltransferases (2.4)
    • C12Y204/99Glycosyltransferases (2.4) transferring other glycosyl groups (2.4.99)
    • C12Y204/99004Beta-galactoside alpha-2,3-sialyltransferase (2.4.99.4)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y204/00Glycosyltransferases (2.4)
    • C12Y204/99Glycosyltransferases (2.4) transferring other glycosyl groups (2.4.99)
    • C12Y204/99007Alpha-N-acetylneuraminyl-2,3-beta-galactosyl-1,3-N-acetylgalactosaminide 6-alpha-sialyltransferase (2.4.99.7)

Landscapes

  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Organic Chemistry (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Genetics & Genomics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • Biotechnology (AREA)
  • General Health & Medical Sciences (AREA)
  • Biochemistry (AREA)
  • Microbiology (AREA)
  • Biomedical Technology (AREA)
  • Molecular Biology (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • General Chemical & Material Sciences (AREA)
  • Medicinal Chemistry (AREA)
  • Plant Pathology (AREA)
  • Biophysics (AREA)
  • Physics & Mathematics (AREA)
  • Tropical Medicine & Parasitology (AREA)
  • Virology (AREA)
  • Cell Biology (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)
  • Saccharide Compounds (AREA)
  • Enzymes And Modification Thereof (AREA)

Abstract

本发明是属于合成生物学和代谢工程的技术领域。更具体而言,本发明是属于代谢工程细胞的培养及发酵的技术领域。本发明描述通过细胞产生还原端具有N‑乙酰葡萄糖胺的双糖或寡糖且自培养物纯化该双糖或寡糖的方法。此外,本发明提供一种用于产生还原端具有N‑乙酰葡萄糖胺的双糖或寡糖的代谢工程细胞。

Description

在细胞中的含有GlcNAc的生物产品的产生
本发明是属于合成生物学和代谢工程的技术领域。更具体而言,本发明是属于代谢工程细胞的培养或发酵的技术领域。本发明描述一种通过细胞产生在还原端具有N-乙酰葡萄糖胺单元(N-acetylglucosamine unit)的双糖或寡糖以及从培养物中纯化该双糖或寡糖的方法。此外,本发明提供一种代谢工程化的细胞,其用于产生在还原端具有N-乙酰葡萄糖胺单元的双糖或寡糖。
引言
碳水化合物经常以蛋白质和脂质的糖-共轭形式存在,参与许多重要现象,例如与受精、胚胎发生、发炎、转移(metastasis)和宿主病原体黏附的发展和进程相关的分化、发展和生物识别过程。碳水化合物也可于体液和母乳中以未共轭的聚糖存在,其中其也调节重要的发展及免疫过程(Bode,Early Hum.Dev.1-4(2015);Reily et al.,Nat.Rev.Nephrol.15,346-366(2019);Varki,Glycobiology 27,3-49(2017))。
双糖Galβ1,3GlcNAc,也称为lacto-N-biose、LNB、第1型N-乙酰乳糖胺(N-acetyllactosamine type 1)或第1型LacNAc,其由β-1,3连接至N-乙酰葡萄糖胺(GlcNAc)的半乳糖组成。GlcNAc存在于双糖的还原端。LNB已知是几种重要血型表位的前驱物,例如路易斯(Lewis)A、路易斯B或唾液酸化路易斯A。含有聚糖的第1型LacNAc也在肿瘤转移中具有重要的作用,因此被视为肿瘤标志物(
Figure BDA0004113293730000011
Molecules 22,1320(2017))。它们也是黏蛋白型糖蛋白的重要成分。广布的双糖Galβ1,4GlcNAc,也称为N-乙酰乳糖胺、LacNAc或第2型LacNAc,其由β-1,4连接至N-乙酰葡萄糖胺(GlcNAc)的半乳糖组成。同样地,GlcNAc存在于双糖的还原端。LacNAc经常在癌细胞表面过度表达,在癌细胞表面其与肿瘤分泌的半乳糖凝集素(galectins)结合,以促进癌症相关过程,如转移、黏附、肿瘤存活及免疫逃脱(Romano and Oscarson,Org.Biomol.Chem.17,2265-2278(2019))。LacNAc也为路易斯X、路易斯Y和唾液酸化路易斯X表位的一部分。第1型(Galβ1,3GlcNAc)及第2型(Galβ1,4GlcNAc)两者的二聚及延长的LacNAc结构和聚-N-乙酰乳糖胺(poly-LacNAc)通常与发炎进程及癌症相关。双糖LNB和LacNAc及其部分和路易斯型表位也存在于人乳中,作为人乳寡糖(HMO)组合物的一部分(Prudden etal.,PNAS USA 114,6954-6959(2017))。存在于结肠中的部分的双叉乳杆菌(Bifidobacterium)物种能够特定消耗HMO,例如LNB或含有糖类的LNB。一些乳酸杆菌(lactobacilli)(例如干酪乳杆菌(L.casei))已显示可以在泌乳早期代谢人乳中存在的LacNAc双糖(Bidart et al.,Sci.Rep.8,7152(2018))。因此,乳酸杆菌和双叉乳杆菌占母乳喂养的婴儿的总肠道菌相(total gut flora)达90%(
Figure BDA0004113293730000021
etal.,Molecules 22,1320(2017))。
由于这些在还原端具有GlcNAc的双糖及寡糖参与大量(plethora)的重要进程,因此有许多制药及营养品关注在开发新型N-乙酰乳糖胺类(第1型或第2型)的治疗剂或有益的营养化合物。相当多的努力投入在发展聚糖(如双糖LNB和LacNAc)或在还原端含有LNB或LacNAc的聚糖的合成制程上。
化学合成方法是费力和费时的,而且由于涉及大量的步骤,其很难进行扩大规模。生物催化方式提供许多优势,因此有大量与产生LNB、LacNAc及其变体有关的公开。
Figure BDA0004113293730000022
al.(RSC Advances 3(30)(2013))报告使用来自环状芽孢杆菌(Bacilluscirculans)的经纯化β-Gal-3半乳糖苷酶,以自补充有p-NP-Gal作为供给者且补充有GlcNAc作为接受者的生质中产生LNB。专利申请案JP2017195793A另一种半乳糖苷酶,由一种芽孢杆菌(Bacillus species)重组产生并从芽孢杆菌中纯化,以用于经由水解体外合成例如LNB的半乳寡糖(galacto-oligosaccharide)。其他报告利用来自双歧杆菌(Bifidobacteria)的LNB磷酸化酶,在从蔗糖和补充GlcNAc起始的酶反应混合物,另外补充有蔗糖磷酸化酶、UDP-葡萄糖-己糖-1-磷酸尿苷酰转移酶(UDP-glucose-hexose-1-phosphate uridylyltransferase)和UDP-葡萄糖4-表异构酶(UDP-glucose 4-epimerase),以产生LNB(Nishimoto and Kitaoka,Biosci.Biotechnol.Biochem.71,2101-2104(2007);Nishimoto,Biosci.Biotechnol.Biochem.84,17-24(2020);US2010120096A;JP4264742 B2;JP2005341883 A2)。并且,提出一种使用含有半乳糖、GlcNAc、半乳糖激酶与LNB磷酸化酶一起的体外反应混合物(CN110527704 A)。经常报导的另一种作用方式是利用偶合偶接以进行催化转化。在这样的例子中,表达参与本发明的糖类催化途径的酶的几个重组细菌菌株被培育和裂解,以获得分解反应混合物中必要的酶。专利申请案JP2013201913的发明人描述了在含有补充蔗糖、GlcNAc、磷酸盐、UDP-葡萄糖及/或UDP-半乳糖的混合物中,将布氏双叉乳杆菌(Bifidobacterium breve)MCC1320或婴儿双叉乳杆菌菌株(Bifidobacterium infantis strain)和长双叉乳杆菌菌株(B.longum strain)一起偶合使用,而分别表达LNB磷酸化酶和蔗糖磷酸化酶,以制造LNB。Endo和共同工作者甚至报告三个细菌菌株的偶合使用,即用于过度表达来自淋病双球菌(Neisseria gonorrhoeae)的galT、galK、galU、ppa和lgtB的两个重组大肠杆菌菌株以及用于产生UTP的产胺棒状杆菌(Corynebacterium ammoniagenes)菌株,以在补充半乳糖和GlcNAc的反应中制造LacNAc(Endo et al.,Carb.Res.316(1-4),179-183(1999))。同一小组描述了一个类似的偶合系统,其中一种大肠杆菌菌株表达来自幽门螺旋杆菌(H.pylori)的β1,4-galT,而不是NgLgtB,以参与酶的转换,辅以额外的GlcNAc,以产生LacNAc(Endo et al.,Glycobiology10(8),809-813(2000))。脑膜炎双球菌(N.meningitidis)的NmLgtB酶(Wakarchuk et al.,Protein Engineering,Design and Selection 11(4),295-302(1998))也经常被选殖与来自大肠杆菌或嗜热链球菌(Streptococcus thermophilus)的galE一起作为融合蛋白的一部分,以用于在额外的GlcNAc反应中合成LacNAc类寡糖(Blixt et al.,J.Org.Chem.66(7),2442-2448(2001);Ruffing et al.,Metab.Eng.8(5),465-473(2006);Mao et al.,Biotechnol.Prog.22(2),369-374(2006))。在路易士X表位的合成方法中也描述了细菌偶合,也被称为3'-岩藻糖基化(3’-fucosylated)的LacNAc(Koizumi et al.,J.Ind.Microbiol.Biotech.25,213-217(2000))。
上述方法通常存在以下问题:糖基转移酶及/或糖基水解酶的可用性及/或稳定性相对较差,对最优选化学计算平衡的要求、需要原位再生核苷酸-糖、添加多种反应化合物,例如包括GlcNAc或在其还原端含有GlcNAc的寡糖的接受者,以及需要培育不同的产生生物体,这些生物体分别产生一或多种催化转换中所必需的酶或融合酶。这些列举中最重要的障碍是包括GlcNAc或在其还原端含有GlcNAc的寡糖的主接受者的细胞合成。在提到的例子中,用于合成LNB、LacNAc或在其还原端具有GlcNAc的寡糖的GlcNAc单糖被外部补充到相关的反应或细胞中。
Bettler和共同工作者描述了六糖βGal(1,4)[βGlcNAc(1,4)]4GlcNAc的产生,其在没有补充GlcNAc的情况下以单一细胞所构建(Bettler et al.,Glycoconj.J.16,205-212(1999))。此种六糖在其还原端具有GlcNAc单元,在其非还原端具有终端LacNAc部分。为此,在一个重组的大肠杆菌细胞中,来自细菌性固氮根瘤菌属(Azorhizobium)的NodC酶(β1,4-GlcNAc-寡糖合成酶)与来自脑膜炎双球菌的LgtB酶(β(1,4)-半乳糖基转移酶(β(1,4)-galactosyltransferase))共同表达。然而在这个例子中,存在于这种六糖中,并且在其还原端具有GlcNAc的甲壳素结构(GlcNAc-GlcNAc)n是通过UDP-GlcNAc部分的连接而产生。Bettler和共同工作者也描述在类似的系统中,以重组大肠杆菌细胞共同表达NodC、LgtB和牛a1,3-半乳糖基转移酶GstA而产生在其还原端含有GlcNAc的异种移植抗原Galα1,3Galβ1,4[βGlcNAc(1,4)]4GlcNAc(Bettler et al.,Biochem.Biophys.Res.Commun.302(3),620-624(2003))。同样,甲壳素结构和存在于七糖中的LacNAc部分是由UDP-GlcNAc部分替代非活化的GlcNAc的使用而构建。Deng和共同工作者描报告了使用重组大肠杆菌细胞经由发酵成功产生GlcNAc的情况(Deng et al.,Metab.Eng.7,201-214(2005);EP1576106。在Deng和共同工作者开发的微生物系统中,GlcNAc是在大肠杆菌细胞的细胞外,更具体而言,是在大肠杆菌的周质(periplasm)中,经由在输出GlcNAc-6-磷酸盐的过程中对后者去磷酸化时产生。因此,获得的GlcNAc部分不能再用于细胞内的转化,如进一步的糖化,而其为制造本发明的糖类所需。另外,Deng和共同工作者所描述的过程需要两阶段喂养批次系统,其需要精确的控制以使磷酸化胺基糖对产生宿主的抑制作用最小化,其使得该过程对产生高力价的(细胞外)GlcNAc不具商业价值。
本发明克服上述问题,由于其提供一种在相对容易情况下产生所欲产品的方法及细胞,且若需要,可进行连续产生。
详细说明
令人惊讶的是,现已发现可由单一细胞产生GlcNAc,并由同一细胞进一步将此GlcNAc单糖糖化,以制造在其还原端具有GlcNAc的双糖或寡糖。本发明提供了一种由细胞产生还原端具有N-乙酰葡萄糖胺单元的双糖或寡糖的方法。该方法包括以下步骤:提供能够合成核苷酸-糖的细胞,以合成GlcNAc,以使该GlcNAc单糖糖化。本发明也关于一种通过在允许产生该双糖或寡糖的条件下培养该细胞,以产生还原端具有GlcNAc的双糖或寡糖的方法。并且,本发明还提供了从培养物中分离该双糖或寡糖的方法。此外,本发明提供一种经过代谢工程的细胞,其用于产生在还原端具有N-乙酰葡萄糖胺单元的双糖或寡糖。
定义
本说明书中用来描述本发明及其各项实施方案的字词不仅应被理解为其等通常定义含义的意义,而且在本说明书中通过特殊定义包含超出通常定义含义的范畴的结构、材料及动作。因此,若一元件在本说明书的内文中可被理解为包含一个以上含义,则其在一权利要求书中的使用必须被理解为对于由说明书及其字词本身支援的所有可能含义的通用。
此处公开的本发明的各种实施方案和实施方案的各方面不仅应按照本说明书中具体描述的顺序和上下文来理解,而且应包括任何顺序和其任何组合。只要上下文需要,所有用于单数的字词应被视为包括复数,反之亦然。除非另有定义,本文中所用的所有技术和科学用语通常具有如本领域技术人员所通常理解的涵义相同。一般而言,本文使用的用语和细胞培养、分子遗传学、有机化学及核酸化学及杂交的实验室程序是所属技术领域已知且普遍采用。标准技术用于核酸和胜肽的合成。一般而言,纯化步骤是根据制造商的说明书进行。
在说明书中,已公开本发明的实施方案,而尽管使用特定的用语,这些用语只于描述性的意义使用,而不意图为限制,本发明的范围由以下的权利要求书所阐述。应理解的是,图示的实施方案只为了举例说明的目的,不应该被视为对本发明的限制。对于本领域技术人员而言显而易见的是,可与本文内发明的文字和精神一致并在本发明的范围内进行修饰、其他实施方案、改善、细节及用途,其仅受权利要求书的限制,并根据专利法,包括等效物原则进行解释。在以下的权利要求书中,所提供用于指定权利要求书步骤的参考特征只为了方便描述,而不表示执行步骤的任何特定顺序。
在本文及其权利要求书中,动词“包括(to comprise)”及其词形变化在其非限制性意义上使用,意味着该字词后面的项目被包括在内,但未具体提及的项目不被排除。在本申请中,动词“包括”可以用“构成(to consist)”或“实质上构成(to consist essentiallyof)”来代替,反之亦然。此外,动词“构成(to consist)”可以由“实质上构成(to consistessentially of)”代替,其表示本文定义的组合物可包括比具体确定的成分更多的成分,该额外成分不会改变本发明的独特特征。此外,以不定冠词“一(a)”或“一(an)”提到一个元件并不排除存在一个以上的元件的可能性,除非上下文明确要求存在一个且只有一个元件。因此,不定冠词“一(a)”或“一(an)”通常表示“至少一个(at least one)”。
在本申请中,除非另有明确说明,冠词“一(a)”及“一(an)”优选由“至少二个(atleast two)”取代,更优选由“至少三个(at least three)”取代,再更优选由“至少四个(atleast four)”取代,再更优选由“至少五个(at least five)”取代,再更优选由“至少六个(at least six)”取代,最优选由“至少二个(at least two)”取代。
在本申请中,除非另有明确说明,否则“合成(synthesize)”、“合成(synthesized)”和“合成(synthesis)”的特征分别可与“产生(produce)”、“产生(produced)”和“产生(production)”的特征互换使用。
除非另有说明,否则本文所确定的各实施方案都可组合在一起。此说明书中提到的所有公开、专利、及专利申请案在此通过参照而并入,其程度与每个单独的公开、专利、或专利申请案被具体和单独指定为通过参照而并入相同。优先权申请案的全部内容,包括EP20190198、EP20190200和EP20190206也通过参照而并入,其程度与该优先权申请案被具体和单独指示以引用方式并入一样。
根据本发明,用语“多核苷酸(polynucleotide(s))”通常是指任何多核肽酸(polyribonucleotide)或聚去氧核糖核苷酸(polydeoxyribonucleotide),其可以是未修饰的RNA或DNA或修饰的RNA或DNA。“多核苷酸”包括但不限于单链和双链DNA、单链和双链区域或单链、双链和三链区域的混合的DNA、以及单链和双链RNA及单双链区域混合的RNA、包括可为单链或更典型的双链或三链区、或单链及双链区域的混合的DNA和RNA的混合分子(hybrid molecules)。此外,本文所用的“多核苷酸”是指包括RNA或DNA或RNA及DNA两者的三链区域。这些区域的链可以来自同一个分子,也可以来自不同的分子。这些区域可以包括一个或多个分子的全部,但更典型的是只关于一些分子的区域。三螺旋区域的分子之一经常是寡核苷酸。如本文所用的用语“多核苷酸”也包括上述含有一个或多个修饰碱基的DNA或RNA。因此,根据本发明,为了稳定性或其他原因而修饰了骨架的DNA或RNA是“多核苷酸”。此外,包含特殊碱基(unusual bases)(如肌苷)或经修饰的碱基(如三苯甲基化碱基(tritylated bases))的DNA或RNA应理解为涵盖在用语“多核苷酸”中。可以理解的是,已经对DNA和RNA进行了各种各样的修饰,这些修饰可用于本领域技术人员已知的许多有用目的。本文使用的用语“多核苷酸”包括多核苷酸的此种化学、酶或代谢修饰形式,以及病毒和细胞(包括例如,简单及复杂细胞)所特有的DNA和RNA的化学形式。用语“多核苷酸”也包括经常被称为寡核苷酸的短多核苷酸。
“多肽(Polypeptide(s))”是指包含通过肽键或修饰的肽键彼此连接的两个或更多个氨基酸的任何肽或蛋白质。“多肽”既指短链(通常称为肽、寡肽和寡聚物),也指长链(通常称为蛋白质)。多肽可含有20种基因编码氨基酸以外的氨基酸。“多肽”包括通过通过过程(例如加工和其他转译后修饰)修饰的多肽,也包括通过化学修饰技术修饰的多肽。这样的修饰已在基础教科书和更详细的专著中以及多卷研究文献中充分描述,并且其对于本领域技术人员是已知的。相同类型的修饰可以相同的程度或不同的程度存在于给定多肽中的数个位点上。此外,给定的多肽可包含许多类型的修饰。修饰可以在多肽的任意位置发生,包括肽主链、氨基酸侧链和胺基末端或羧基末端。修饰包括,例如,乙酰化、酰化、ADP-核糖基化、酰胺化、黄素(flavin)的共价连接、血红素部分的共价连接、核苷酸或核苷酸衍生物的共价连接、脂质或脂质衍生物的共价连接、磷脂酰肌醇的共价连接、交联、环化、二硫键形成、去甲基化作用、共价交联的形成、焦谷氨酸的形成、甲酰化作用、γ-羧基化、糖化、GPI锚定形成、羟基化、碘化、甲基化、肉豆蔻酰化(myristoylation)作用、氧化、蛋白水解加工、磷酸化、异戊二烯化(prenylation)、外消旋化、脂质连接、硫化、谷氨酸残基的γ-羧化、羟基化和ADP-核糖基化、硒化(selenoylation)、转移RNA介导的向蛋白添加氨基酸(例如精氨酸化)和泛蛋白化(ubiquitination)。多肽可以是分支的或有或无分支的环状。环状、分支的和分支环状的多肽可以由后转译天然过程形成,并且也可以通过完全合成法制得。
本文所用的用语“编码多肽的多核苷酸”涵盖包含编码本发明多肽的序列的多核苷酸。该用语也涵盖包括编码多肽的单一连续区域或不连续区域(例如,被整合的噬菌体或插入序列或编辑所间隔)以及也可含有编码及/或非编码序列的附加区域的多核苷酸。
“分离(Isolated)”表示“经人的手”改变了其自然状态,亦即,若其在自然界中出现,则已经被改变或从其原来的环境中移走,或两者都是。例如,自然存在于生物体内的多核苷酸或多肽不是“分离的”,但从其自然状态的共存材料中分离出来的同一多核苷酸或多肽是“分离的”,正如本文所使用的用语。同样地,如本文所用的“合成(synthetic)”序列表示以合成方式产生的任何序列,而不是直接从天然来源中分离出来。如本文所用“经合成的(Synthesized)”一词表示任何合成产生的序列,而不是直接从自然来源中分离出来。
用语“重组(recombinant)”或“基因转殖(transgenic)”或“代谢工程(metabolically engineered)”或“基因改造(genetically modified)”,在本文提及细胞或宿主细胞时可互换使用,并表示细菌细胞复制异源核酸,或表达由异源核酸编码的胜肽或蛋白质(即,“对该细胞而言是外来的”序列或“对该细胞中的该位置或环境而言是外来的”序列)。这种细胞被描述为用至少一个异源或外源基因进行转形,或被描述为通过引入至少一个异源或外源基因进行转形。代谢工程或重组或基因转殖细胞可包含在细胞的原始(非重组)形式中没有的基因。重组细胞也可包含在原生形式的细胞中发现的基因,其中基因被修饰并通过人工手段重新引入细胞中。这些用语也涵盖含有细胞内源性核酸的细胞,该核酸已被修饰、或其表达或活性已被修饰,而没有从细胞中移除核酸;这种修饰包括通过基因取代、取代启动子、特定位突变;以及相关技术获得的修饰。因此,“重组多肽(recombinant polypeptide)”是一种由重组细胞产生的多肽。本文所用的“异源序列(heterologous sequence)”或“异源核酸(heterologous nucleic acid)”是指来自特定细胞以外的起源(例如来自不同的物种),或者若为同一来源,则从其原始形式或在基因组中的位置被修饰。因此,与启动子可操作连接的异源核酸的来源与衍生的启动子的来源不同,或者若为同一来源,则从其原始形式或在基因组中的位置进行了修饰。异源序列可通过例如转染、转形、共轭或转导等方式稳定地引入到宿主微生物细胞的基因组中,其中可应用的技术将取决于细胞和待引入的序列。各种技术是本领域技术人员已知,且例如,描述在Sambrook等人的Molecular Cloning:ALaboratory Manual,2nd Ed.,Cold Spring HarborLaboratory Press,Cold Spring Harbor,N.Y.(1989)。在本发明内容中内使用的用语“突变(mutant)”细胞或微生物是指经过基因改造的细胞或微生物。
在本发明内容中内使用的用语“用于产生在还原端具有N-乙酰葡萄糖胺(GlcNAc)单元的双糖或寡糖的细胞基因改造”是指在一或多种选自包括以下群组的酶的表达或活性方面进行基因改造的微生物细胞:N-乙酰葡萄糖胺-6-磷酸转移酶(glucosamine 6-phosphate N-acetyltransferase)、磷酸酶(磷酸酶)、糖基转移酶、L-谷氨酰氨酸-D-果糖-6-磷酸转氨酶(L-glutamine—D-fructose-6-phosphate aminotransferase)及UDP-葡萄糖4-表异构酶。
在本发明内容的上下文中,用语“内源性(endogenous)”是指任何多核苷酸、多肽或蛋白质序列,其是细胞的天然部分并且存在于其在细胞染色体中的天然位置,与作用于其表达的自然控制机制相比,其表达控制没有被改变。用语“外源性(exogenous)”是指任何多核苷酸、多肽或蛋白质序列,其来源于所研究的细胞外部,并且不是细胞的天然部分,或不存在于细胞染色体或质体中的其天然位置。
用语“异源(heterologous)”当用于提及多核苷酸、基因、核酸、多肽或酶时,是指来自或衍生自宿主物种以外的来源的多核苷酸、基因、核酸、多肽或酶。相反,本文使用的“同源(homologous)”多核苷酸、基因、核酸、多肽或酶来表示衍生自宿主生物体物种的多核苷酸、基因、核酸、多肽或酶。当提及用于维持或操纵基因序列的基因调控序列或辅助核酸序列(例如,启动子、5'非转译区域、3'非转译区域、poly A附加序列、内含子序列、剪接位点、核糖体结合位点、内部核糖体进入序列、基因组同源区域、重组位点等)时,“异源”是指调控序列或辅助序列与在构建体、基因组、染色体或附加体中与调控或辅助核酸序列并列(juxtaposed)的基因不天然相关联。因此,在本文中所谓的“异源启动子”是指可操作地连接至在其天然状态下(即,在非基因工程生物体的基因组中)不是可操作地连接的基因的启动子,即使该启动子可衍生自与其所连接的基因相同的物种(或在一些情况下,同一个生物体)。
用语蛋白质或酶的“修饰活性(modified activity)”是关于与该蛋白质或酶的野生型(即,天然)的活性相比,该蛋白质或酶的活性发生变化。与蛋白质或酶的野生型活性相比,该修饰活性可以是该蛋白质或酶的破坏(abolished)、受损、减少或延迟的活性,但也可以是与蛋白质或酶的野生型活性相比,该蛋白质或酶的加速或增强的活性。蛋白质或酶的修饰活性是通过修饰该蛋白质或酶的表达而获得或通过表达经修饰,即突变形式的蛋白质或酶而获得。酶的修饰活性进一步关于在酶的显著的米氏(Michaelis)常数Km及/或显著的最大速度(Vmax)的改变。
用语基因的“修饰表达(modified expression)”是关于在编码蛋白质的产生过程的任何阶段与该基因的野生型相比的表达变化。与野生型相比,该修饰表达是较低或较高的表达,其中用语“较高的表达(higher expression)”是指在内源基因的情况下也被定义为该基因的“过度表达”,或在野生型菌株中不存在的异源基因的情况下“表达”。较低的表达或减少的表达是通过对本领域技术人员而言通常已知的技术(如使用siRNA、CrispR、CrispRi、核糖开关、重组、同源重组、ssDNA突变诱发(mutagenesis)、RNAi、miRNA、asRNA、突变基因、敲除基因、转位子突变诱发…)所获得,该技术用于改变基因,使其能力较差(less-able)(即,与功能性野生型基因相比,在统计学上显著地“能力较差”)或完全不能(如敲除的基因)产生功能性最终产物。本文所用的用语“核糖开关(riboswitch)”定义为讯息RNA的一部分,其折迭成复杂的结构,以通过干扰转译而阻止表达。效应分子的结合诱导构象变化,其允许后转录地(post-transcriptionally)调节表达。除了以上述方式改变感兴趣的基因以获得较低的表达外,也可通过改变转录单元、启动子、非转译区、核糖体结合位点、Shine Dalgarno序列或转录终止子获得较低的表达。例如,可以通过突变启动子序列中的一个或多个碱基对或将启动子序列完全改变为与野生型相比具有较低表达强度的持续型(constitutive)启动子或导致调节表达的诱导型(inducible)启动子或导致调节表达的抑制型(repressible)启动子来获得较低表达或减少的表达过量表达或表达是对本领域技术人员而言通常已知的技术(例如,使用人工转录因子、重新设计(de novo design)启动子序列、核糖体工程、在真染色质上引入或再引入表达模组,高复制数的质体的使用)而获得,其中该基因是“表达盒(expression cassette)”的一部分,其关于任何序列,其中存在启动子序列、非转译区域序列(含有核糖体结合序列、Shine Dalgarno或Kozak序列)、编码序列及可选的转录终止子,并导致功能性活性蛋白的表达。该表达是持续性的或调节性的。
用语“持续型表达(constitutive expression)”定义为在一些生长条件下不受除RNA聚合酶的子单元以外的转录因子(如σ70、σ54或相关的细菌σ因子以及与RNA聚合酶核心酶共同关联的酵母粒线体RNA聚合酶特异性因子MTF1)调节的表达。这种转录因子的非限制性例子是大肠杆菌中的CRP、LacI、ArcA、Cra、IclR,或啤酒酵母菌(Saccharomycescerevisiae)中的Aft2p、Crz1p、Skn7,或枯草芽孢杆菌(B.subtilis)中的DeoR、GntR、Fur。这些转录因子结合在一个特定的序列上,在一些生长条件下可能阻止或促进表达。RNA聚合酶是由DNA模板合成RNA的催化机。RNA聚合酶结合特定的序列以起始转录,例如在原核生物宿主中经由σ因子或在酵母中经由MTF1。持续型表达提供了一个恒定的表达水准,不需要诱导或抑制。
用语“调节表达(regulated expression)”定义为在一些生长条件下由RNA聚合酶的子单元以外的转录因子(例如细菌σ因子)调节的表达。这种转录因子的例子已于上文描述。常见的表达调节是通过诱导或抑制的方式获得,例如但不限于IPTG、阿拉伯糖、鼠李糖(rhamnose)、岩藻糖、异乳糖(allo-lactose)或pH转变或温度转变或碳耗竭或接受者或产生的产物或化学抑制。
用语“由天然诱导物的表达(expression by a natural inducer)”定义为基因的偶发性(facultative)或调节性表达,该基因仅在宿主的某种自然条件下(例如,生物体正在分娩、或在哺乳期)作为对环境变化(例如,包括但不限于激素、热、冷、pH转变、光、氧化或渗透压力/讯号)的反应或取决于该宿主细胞的发育阶段或细胞周期的位置(包括但不限于细胞凋亡和自噬)。
用语“化学处理后的诱导性表达(inducible expression upon chemicaltreatment)”定义为一种基因的偶发性或调节性表达,该基因仅在用化学诱导物或抑制物处理时表达,其中该诱导物和抑制物包括但不限于酒精(如乙醇、甲醇)、碳水化合物(如葡萄糖、半乳糖、甘油、乳糖、阿拉伯糖、鼠李糖、岩藻糖、异乳糖)、金属离子(如铝、铜、锌)、氮、磷酸盐、IPTG、乙酸盐、甲酸盐、二甲苯。
用语“控制序列(control sequences)”是指由细胞转录和转译系统识别的序列,其允许将多核苷酸序列转录和转译成多肽。因此此DNA序列对于特定的细胞或生物体中可操作结合的编码序列的表达是必要的。此控制序列可为但不限于启动子序列、核糖体结合序列、Shine Dalgarno序列、Kozak序列、转录终止子序列。例如,适用于原核生物的控制序列包括启动子、可选的操作子序列及核糖体结合位点。已知真核细胞利用启动子、多腺核苷酸化讯号和强化子。若作为参与多肽分泌的前蛋白表达,前序列或分泌前导的DNA可与多肽的DNA可操作地结合;若启动子或强化子影响编码序列的转录,则与编码序列可操作地结合;或者若核糖体结合位点影响编码序列的转录,则与编码序列可操作地结合;或者若核糖体结合位点有利于转译,则与编码序列可操作地结合。该控制序列可进一步用外部化学品,例如但不限于,IPTG、阿拉伯糖、乳糖、异乳糖、鼠李糖或岩藻糖经由诱导型启动子或经由诱导或抑制该多核苷酸转录或转译成多肽的基因电路(genetic circuit)而进行控制。
一般而言,“可操作地结合(operably linked)”表示连接的DNA序列是连续的,且在分泌前导的情况下,是连续性并且处于阅读阶段(reading phase)。然而,强化子不一定是连续的。
用语“野生型(wild type)”是指自然界中常见的基因或表达型情况。
如本文所用的用语“蛋白质的修饰表达”是指i)内源性蛋白质的较高表达或过度表达,ii)异源蛋白质的表险、或iii)与野生型(即,天然(native))蛋白质相比,具有更高活性的变体蛋白质的表达及/或过度表达。
如本文所用的用语“乳腺细胞(mammary cell(s))”一般是指乳腺上皮细胞、乳腺上皮管腔细胞(mammary-epithelial luminal cell(s))或哺乳动物上皮肺泡细胞(mammalian epithelial alveolar cell(s))或其任意组合。如本文所用的用语“乳腺样细胞(mammary-like cell(s))”一般是指具有与天然乳腺细胞相似(或实质上相似)的表型/基因型的细胞,但其衍生自非乳腺细胞来源。如此的乳腺样细胞可以被改造,以移除至少一种不需要的基因成分及/或包含至少一种乳腺细胞典型的预定遗传结构。乳腺样细胞的非限制性例子可包括乳腺样上皮细胞、乳腺样上皮管腔细胞、展现乳腺细胞系细胞的一或多个特征的非乳腺细胞或其任意组合。乳腺样细胞的进一步非限制性例子可包括具有与天然乳腺细胞相似(或实质上相似)的表型的细胞,或更具体而言是与天然乳腺上皮细胞相似(或实质上相似)的表型的细胞。与天然乳腺细胞或乳腺上皮细胞相似(或实质上相似)的表型或展现出与其至少一种特征相似(或实质上相似)的细胞可以包括自然展现出或经过改造能够表达至少一种乳成分的细胞(例如,衍生自乳腺细胞系或非乳腺细胞系)。
如本文所用的用语“非乳腺细胞(non-mammary cell(s))”一般可包括非乳腺系的任意细胞。在本发明的内文中,非乳腺细胞可以是能够被改造成表达至少一种乳成分的任何哺乳动物细胞。如此的非乳腺细胞的非限制性例子包括肝细胞、血细胞、肾细胞、脐带血细胞、上皮细胞、表皮细胞、肌细胞、纤维母细胞、间质细胞或其任意组合。在一些情况下,分子生物学和基因组编辑技术可以被设计成同步消除、沉默或弱化无数的基因。
在本申请中,除非另有明确说明,“能够…<动词>(capable of…<verb>)”和“能够.....<动词>(capable to…<verb>)”的表达优选以该动词的主动语态代替,反之亦然。例如,表达“能够表达(capable of expressing)”优选替换为“表达(expresses)”,反之亦然,亦即,“表达”优选替换为“能够表达”。
在本文中所用的用语“变体(Variant(s))”是分别与参照多核苷酸或多肽不同但是保留基本特性的多核苷酸或多肽。多核苷酸的典型变体在核苷酸序列上与另一种参照多核苷酸不同。变体的核苷酸序列中的变化可以改变或可以不改变由参照多核苷酸编码的多肽的氨基酸序列。核苷酸变化可导致由参照序列编码的多肽中的氨基酸取代、添加、缺失、融合和截短,如下文所述。多肽的典型变体在氨基酸序列上与另一种参照多肽不同。一般而言,限制差异以使参照多肽和变体的序列在整体上紧密相似,并且在许多区域中是相同的。变体和参照多肽可以在氨基酸序列中有以任意组合的一或多个取代、添加、缺失的不同。取代或插入的氨基酸残基可以是或可以不是由遗传密码编码的氨基酸残基。多核苷酸或多肽的变体可以是天然存在的,诸如对偶基因变体,或者其可以是不已知天然存在的变体。多核苷酸和多肽的非天然存在的变体可以通过突变诱发技术、通过直接合成和通过本领域技术人员已知的其他重组方法制得。
本文所用的用语多肽的“衍生物(derivative)”是指在多肽的氨基酸序列中可能包含氨基酸残基的缺失、添加或取代,但其造成无征状变化(silent change),从而产生功能等效的多肽。氨基酸的取代可以基于相关残基的极性、电荷、溶解度、疏水性、亲水性及/或双性本质(amphipathic nature)的相似性来进行。例如,非极性(疏水性)氨基酸包括丙氨酸、亮氨酸、异亮氨酸、缬氨酸、脯氨酸、苯丙氨酸、色氨酸和甲硫氨酸;平面中性氨基酸包括甘氨酸、丝氨酸、苏氨酸、半胱氨酸、酪氨酸、天冬酰胺和谷氨酰胺;带正电(碱性)氨基酸包括精氨酸、赖氨酸和组氨酸;及带负电(酸性)氨基酸包括天冬氨酸和谷氨酸。在本发明的内容中,本文所用的衍生多肽是指能够展现出与原始多肽实质上相似的体外及/或体内活性的多肽,其如通过许多标准中的任意来判断,包括但不限于酶活性,并且在转译中或转译后可进行不同的修饰。此外,非经典氨基酸或化学氨基酸类似物可以作为替代物或添加物引入原始多肽序列中。
在一些实施方案中,本发明设想通过修饰本发明中使用的酶结构来制备功能性变体。可以通过氨基酸取代、缺失、添加或其组合来产生变体。例如,有理由期望用异亮氨酸或缬氨酸单独取代亮氨酸、用谷氨酸单独取代天冬氨酸、用丝氨酸单独取代苏氨酸、或用结构上相关的氨基酸对氨基酸的相似取代(例如,保守突变)不会对所得分子的生物活性产生重大影响。保守取代是发生在与其侧链相关的氨基酸家族内的取代。通过评估变体多肽以类似于野生型多肽的方式在细胞中产生应答的能力,可以容易地确定本发明的多肽的氨基酸序列中的改变是否导致功能性同源物。
本文所使用的用语“功能性同源物(functional homolog)”描述具有序列相似性(换句而言,同源性)并且还共用诸如生化活性的至少一功能特征的那些分子(Altenhoffetal.,PLoS Comput.Biol.8(2012)e1002514)。功能性同源物通常对于相同的特征产生相似的,但不一定相同的程度。功能上同源的蛋白质具有相同的特征,其中由一个同源物产生的定量测量值为另一个的至少10%;更典型为原始分子所产生的定量测量值的至少20%,在约30%和约40%之间;例如,在约50%和约60%之间;在约70%和约80%之间;或者在约90%和约95%之间;在约98%和约100%之间,或者超过100%。因此,当分子具有酶活性时,功能性同源物将具有与原始酶相比的上述酶活性百分比。当分子为DNA结合分子(例如,多肽)时,则同源物将具有与原始分子相比,通过结合分子的重量所测定的上述结合亲和力百分比。
功能性同源物和参照多肽可为天然存在的多肽,并且序列相似性可因趋同或发散的演化事件造成。功能性同源物有时被称为异种同源物,其中“异种同源物(ortholog)”是指在另一物种中与参考基因或蛋白质功能等效的同源基因或蛋白质。
异种同源基因(orthologous genes)是指不同物种中的同源基因,该基因通过垂直遗传起源于最后共同祖先的单一基因,其中的基因及其主要功能是保守的。同源基因是指在两个物种中由共同的祖先遗传的基因。
用语“异种同源物(ortholog)”在提到一特定物种的氨基酸或核苷酸/核酸序列时,是指来自不同物种的相同氨基酸或核苷酸/核酸序列。应该理解的是,当两个序列经由线性血缘关系从一个共同祖先序列衍生出来、及/或在其序列和生物功能方面密切相关时,该两个序列为彼此的异种同源物。异种同源物通常具有高度的序列同一性,但不一定(且经常不一定)具有100%的序列同一性。
同种同源(Paralogous)基因是由基因复制事件产生的同源基因。同种同源基因通常属于同一物种,但其非必须的。同种同源物可分为内同种同源物(in-paralogs)(发生在物种演变事件之后的同种同源对)和外同种同源物(out-paralogs)(发生在物种演变事件之前的同种同源对)。物种之间的外同种同源物是指两个生物体之间在物种演变前因复制而存在的一对同种同源物。在物种内,外同种同源物是存在于同一生物体内的一对同种同源物,但其复制是发生在物种演变之后。同种同源物通常具有相同或相似的功能。
可以通过分析核苷酸和多肽序列比对来确定功能性同源物。例如,对核苷酸或多肽序列的资料库进行查询可以确定感兴趣的多肽的同源物,如生质调节多肽、糖基转移酶、参与核苷酸活性糖合成的蛋白质或膜转运蛋白。序列分析可以关于非冗余资料库的BLAST、倒数(Reciprocal BLAST)或PSI-BLAST分析,其分别使用生质调节多肽、糖基转移酶、参与核苷酸活性糖合成的蛋白质或膜转运蛋白的氨基酸序列作为参照序列。在一些情况下,氨基酸序列是由核苷酸序列所推导出来。通常情况下,资料库中序列一致性大于40%的那些多肽是进一步评估是否分别适合作为生质调节多肽、糖基转移酶、参与核苷酸活性糖合成的蛋白质或膜转运蛋白的候选者。氨基酸序列的相似性允许保守的氨基酸取代,如用一个疏水残基取代另一个疏水残基、或用一个极性残基取代另一个极性残基、或用一个酸性氨基酸取代另一个酸性氨基酸、或用一个碱性氨基酸取代另一个碱性氨基酸等。优选的是,保守取代是指一些组合,例如由丙氨酸取代甘氨酸,反之亦然;由甲硫氨酸取代缬氨酸、异亮氨酸和亮氨酸,反之亦然;由谷氨酸取代天冬氨酸,反之亦然;由谷氨酰胺取代天冬酰胺,反之亦然;由苏氨酸取代丝氨酸,反之亦然;由精氨酸取代赖氨酸,反之亦然;由甲硫氨酸取代半胱氨酸,反之亦然;以及由色氨酸取代苯丙氨酸和酪氨酸,反之亦然。如果需要,可以对这些候选者进行人工检查,以缩小进一步评估的候选者的数量。人工检查可通过选择似乎具有调节产生力的多肽中存在的域(domains),例如,保守的功能域,的候选者来进行。
“片段(Fragment)”,就多核苷酸而言,是指选殖体或多核苷酸分子的任何部分,特别是多核苷酸的部分,其保留全长多核苷酸分子的可用的功能特征。有用的片段包括寡核苷酸和多核苷酸,其可用于杂交或扩增技术或者复制、转录或转译的调控。“多核苷酸片段”是指多核苷酸SEQ ID NO(或GenbankNO.)的任何子序列,通常包括或由该多核苷酸SEQ IDNO(或Genbank NO.)的至少约9、10、11、12个连续核苷酸所组成,例如本文提供的任何多核苷酸序列的至少约30个核苷酸或至少约50个核苷酸。示例性片段可另外或替代地包括片段,该片段包括编码多肽的保守家族域的区域、实质上由该区域所组成、或由该区域所组成。示例性片段可另外或替代地包括片段,该片段包括多肽的保守域。因此,多核苷酸SEQID NO(或Genbank NO.)的片段优选地表示包括或由该多核苷酸SEQ ID NO(或GenbankNO.)所组成的核苷酸序列,其中缺失的连续核苷酸不超过200、150、100、50或25个,优选为缺失的连续核苷酸不超过50个,并且保留全长多核苷酸分子的可用的功能特征(例如,活性),其可由本领域技术人员通过常规实验进行评估。另外,多核苷酸SEQ ID NO(或GenbankNO.)的片段优选地表示包括来自该多核苷酸SEQ ID NO(或Genbank NO.)的一定量的连续核苷酸或由该连续核苷酸所组成的核苷酸序列,其中该连续核苷酸的量为该多核甘酸SEQID NO(或Genbank NO.)全长的至少为50.0%、60.0%、70.0%、80.0%、81.0%、82.0%、83.0%、84.0%、85.0%、86.0%、87.0%、88.0%、89.0%、90.0%、91.0%、92.0%、93.0%、94.0%、95.0%、95.5%、96.0%、96.5%、97.0%、97.5%、98.0%、98.5%、99.0%、99.5%、100%,优选至少80.0%,更优选至少87.0%,又更优选至少90%,又更优选至少95.0%,最优选至少97.0%,并保留了全长多核苷酸分子的可用的功能特征(例如,活性)。因此,多核苷酸SEQ ID NO(或Genbank NO.)的片段优选地表示包括或由该多核苷酸SEQ ID NO(或Genbank NO.)组成的核苷酸序列,其中缺少一数量的连续核苷酸,并且该数量不超过该多核苷酸SEQ ID NO(或Genbank NO.)全长的50.0%、40.0%、30.0%,优选不超过该多核苷酸SEQ ID NO(或GenbankNO.)全长的20.0%、15.0%、10.0%、9.0%、8.0%、7.0%、6.0%、5.0%、4.5%、4.0%、3.5%、3.0%、2.5%、2.0%、1.5%、1.0%、0.5%,更优选不超过15.0%,又更优选不超过10.0%,又更优选不超过5.0%,最优选不超过2.5%,并且其中该片段保留了全长多核苷酸分子的可用的功能特征(例如,活性),该特征可由本领域技术人员常规评估。
在本申请中,多核苷酸的序列可以SEQ ID NO表示,也可以用GenBank NO表示。因此,用语“多核苷酸SEQ ID NO”和“多核苷酸GenBank NO.”可互换使用,除非另有明确说明。片段可以额外地或替代地包括多肽和蛋白质分子的子序列、或多肽的子序列。在一些情况下,片段或域是多肽的子序列,其以与完整多肽实质上相同的方式、优选为相似程度的方式执行完整多肽的至少一种生物功能。本文定义的“多肽的子序列(subsequence of thepolypeptide)”是指来自多肽衍生的连续的氨基酸残基的序列。例如,多肽片段可包括可识别的结构模体或功能域,如与DNA启动子区域结合的DNA结合位或结合域、活化域或蛋白质-蛋白质相互作用的域,并可启始转录。片段可从少至3个氨基酸残基到完整多肽的全长内改变大小,例如至少约20个氨基酸残基的长度,例如至少约30个氨基酸残基的长度。因此,多肽SEQ ID NO(或UniProt ID或Genbank NO.)的片段优选地表示包括或由该多肽SEQ ID NO(或UniProt ID或Genbank NO.)组成的多肽序列,其中不缺少超过80、60、50、40、30、20或15个连续的氨基酸残基,优选不缺少超过40个连续的氨基酸残基,并且其以与完整多肽实质上相同的方式、优选为相似或更大程度的方式执行完整多肽的至少一种生物功能,其可由本领域技术人员常规评估。另外,多肽SEQ ID NO(或UniProt ID或Genbank NO.)的片段优选地表示包括或由来自该多肽SEQ ID NO(或UniProt ID或Genbank NO.)的连续氨基酸残基数量组成的多肽序列,且其中该连续氨基酸残基的数量为该多肽SEQ ID NO(或UniProtID或Genbank NO)全长的至少50.0%、60.0%、70.0%、80.0%、81.0%、82.0%、83.0%、84.0%、85.0%、86.0%、87.0%、88.0%、89.0%、90.0%、91.0%、92.0%、93.0%、94.0%、95.0%、95.5%、96.0%、96.5%、97.0%、97.5%、98.0%、98.5%、99.0%、99.5%、100%,优选至少80.0%,更优选至少87.0%,又更优选至少90.0%,又更优选至少95.0%,最优选至少97.0%,并其以与完整多肽实质上相同的方式、优选为相似或更大程度的方式执行完整多肽的至少一种生物功能,其可由本领域技术人员常规评估。因此,多肽SEQ ID NO(或UniProt ID或Genbank NO.)的片段优选地表示包括或由该多肽SEQ ID NO(或UniProt ID或Genbank NO.)组成的多肽序列,其中缺少一数量的连续氨基酸残基,并且不超过该多肽SEQ ID NO(或UniProt ID或Genbank NO.)全长的50.0%、40.0%、30.0%,优选不超过该多肽SEQ ID NO(或UniProt ID或Genbank NO.)全长的20.0%、15.0%、10.0%、9.0%、8.0%、7.0%、6.0%、5.0%、4.5%、4.0%、3.5%、3.0%、2.5%、2.0%、1.5%、1.0%、0.5%,更优选不超过15.0%,又更优选不超过10.0%,又更优选不超过5.0%,最优选不超过2.5%,并且其以与完整多肽实质上相同的方式、优选为相似或更大程度的方式执行完整多肽的至少一种生物功能,其可由本领域技术人员常规评估。
在本申请中,多肽的序列可以SEQ ID NO表示,或者以UniProt ID或GenBank No.表示。因此,用语“多肽SEQ ID NO”以及“多肽Uniprot ID”以及“多肽GenBank No.”可以互换使用,除非另有明确说明。
优选地,多肽的片段是功能片段,其具有其衍生的多肽的至少一种特性或活性,优选是相似或更大的程度。例如,功能片段可以包括多肽的功能域或保守域。可理解的是,多肽或其片段可具有保守的氨基酸取代,这些取代对多肽的活性实质上没有影响。所谓的保守取代是指用一个疏水氨基酸取代另一个疏水氨基酸、或用一个极性氨基酸取代另一个极性氨基酸、或用一个酸性氨基酸取代另一个酸性氨基酸、或用一个碱性氨基酸取代另一个碱性氨基酸等。优选的是,保守替代是指组合,例如由丙氨酸取代甘氨酸,反之亦然;由甲硫氨酸取代缬氨酸、异亮氨酸和亮氨酸,反之亦然;由谷氨酸取代天冬氨酸,反之亦然;由谷氨酰胺取代天冬酰胺,反之亦然;由苏氨酸取代丝氨酸,反之亦然;由精氨酸取代赖氨酸,反之亦然;由甲硫氨酸取代半胱氨酸,反之亦然;以及由色氨酸取代苯丙氨酸和酪氨酸,反之亦然。例如,一个域可以通过Pfam(El-Gebali et al.,Nucleic Acids Res.47(2019)D427-D432)或保守结构域资料库(CDD)(https://www.ncbi.nlm.nih.gov/cdd)(Lu et al.,Nucleic Acids Res.48(2020)D265-D268)指定进行特征化。每个资料库的内容在每次发布时都是固定的,不得更改。当改变特定资料库的内容时,此特定资料库会接收新的发布版本并有新的发布日期。每个资料库的所有发布版本及其相应的发布日期和在这些特定的发布日期所注释的特定内容都是可用的,也是本领域技术人员所知。本文使用的PFAM资料库(https://pfam.xfam.org/)是2020年6月11日发布的Pfam 33.1版本。蛋白质序列资讯和功能资讯可以由蛋白质序列和注释资料的综合资源提供,例如通用蛋白质资源(UniProt)(www.uniprot.org)(Nucleic Acids Res.2021,49(D1),D480-D489)。UniProt包括被称为UniProt知识库(UniProtKB)的专业且丰富的蛋白质资料库,以及UniProt参考簇(UniRef)和UniProt档案(UniParc)。UniProt识别码(UniProt ID)对存在于资料库中的每个蛋白质都是独特的。本文中使用的UniProt ID是2021年5月5日UniProt资料库版本中的UniProtID。不具有UniProt ID的蛋白质在本文中使用各自的GenBank登录号(GenBank No.),该登录号存在于2021年5月5日的NIH基因序列资料库(https://www.ncbi.nlm.nih.gov/genbank/)(Nucleic Acids Res.2013,41(D1),D36-D42)版本中。
在本发明中,多肽序列延伸用于指本发明中使用的N-乙酰葡萄糖胺b-1,3-半乳糖基转移酶及N-乙酰葡萄糖胺b-1,4-半乳糖基转移酶的片段,这些片段为那些N-乙酰葡萄糖胺b-1,3-半乳糖基转移酶及N-乙酰葡萄糖胺b-1,4-半乳糖基转移酶所共通的。如此的多肽延伸是以单字母代码的氨基酸序列的形式书写。如果在如此的多肽延伸的特定位置上的氨基酸可为几个氨基酸,该特定位置将为氨基酸代码X。除非本文另有描述,字母“X”是指可能的任何氨基酸。用语(Xn)是指由数量n个氨基酸残基X组成的蛋白质序列的延伸,其中每个所述X是可能的任何氨基酸,且其中n是2、3、4或更多。用语(Xm)是指由数量m个氨基酸残基X组成的蛋白质序列的延伸,其中每个所述X是可能的任何氨基酸,其中m是2、3、4或更多。用语(Xp)是指由数量p个氨基酸残基X组成的蛋白质序列的延伸,其中每个所述X是可能的任何氨基酸,其中p是2、3、4或更多。用语“[X,无A、G或S]”是指任何氨基酸,其排除氨基酸残基丙氨酸(A)、甘氨酸(G)或丝氨酸(S)。用语“[X,无F、H、W或Y]”是指任何氨基酸,其排除氨基酸残基苯丙氨酸(F)、组氨酸(H)、色氨酸(W)和酪氨酸(Y)。
本文所用的用语“核苷酸-糖(nucleotide-sugar)”或“活性糖(activatedsugar)”是指单糖的活化形式。活化的单糖的例子包含但不限于UDP-半乳糖(UDP-Gal)、UDP-N-乙酰葡萄糖胺(UDP-GlcNAc)、UDP-N-乙酰半乳糖胺(UDP-GalNAc)、UDP-N-乙酰甘露糖胺(UDP-ManNAc)、GDP-岩藻糖(GDP-Fuc)、GDP-甘露糖(GDP-Man)、UDP-葡萄糖(UDP-Glc)、UDP-2-乙酰胺基-2,6-双去氧--L阿拉伯-4-己酮糖(UDP-2-acetamido-2,6-dideoxy--L-arabino-4-hexulose)、UDP-2-乙酰胺基-2,6-双去氧--L-来苏-4-己酮糖、UDP-N-乙酰基-L-鼠李糖胺(UDP-L-RhaNAc或UDP-2-乙酰胺基-2,6-双去氧-L-甘露糖)、dTDP-N-乙酰岩藻糖胺(dTDP-N-acetylfucosamine)、UDP-N-乙酰岩藻糖胺(UDP-L-FucNAc或UDP-2-乙酰胺基-2,6-双去氧-L-半乳糖)、UDP-N-乙酰基-L-肺炎糖胺(UDP-N-acetyl-L-pneumosamine)(UDP-L-PneNAC或UDP-2-乙酰胺基-2,6-双去氧-L-塔罗糖(UDP-2-acetamido-2,6-dideoxy-L-talose))、UDP-N-乙酰胞壁酸(UDP-N-acetylmuramic acid)、UDP-N-乙酰基-L-奎诺糖胺(UDP-N-acetyl-L-quinovosamine)(UDP-L-QuiNAc或UDP-2-乙酰胺基-2,6-双去氧-L-葡萄糖)、GDP-L-异鼠李糖(GDP-L-quinovose)、CMP-N-乙酰基神经氨酸(CMP-N-acetylneuraminic acid)(CMP-Neu5Ac)、CMP-N-乙醇酰神经氨酸(CMP-N-glycolylneuraminic acid)(CMP-Neu5Gc)、CMP-Neu4Ac、CMP-Neu5Ac9N3、CMP-Neu4,5Ac2、CMP-Neu5,7Ac2、CMP-Neu5,9Ac2、CMP-Neu5,7(8,9)Ac2、UDP-葡萄糖醛酸盐(UDP-glucuronate)、UDP-半乳糖醛酸盐(UDP-galacturonate)、GDP-鼠李糖或UDP-木糖。核苷酸-糖作为糖化反应中的糖苷基供给者。这些反应通过称为糖基转移酶的一组酶进行催化。
本发明所用的用语“N-乙酰葡萄糖胺b-1,3-半乳糖基转移酶(N-acetylglucosamine b-1,3-galactosyltransferase)”、“N-乙酰葡萄糖胺β-1,3-半乳糖基转移酶(N-acetylglucosamine beta-1,3-galactosyltransferase)”、“N-乙酰葡萄糖胺β1,3半乳糖基转移酶(N-acetylglucosamine beta 1,3galactosyltransferase)”、“N-乙酰葡萄糖胺β-1,3-半乳糖基转移酶(N-acetylglucosamineβ-1,3-galactosyltransferase)”、“N-乙酰葡萄糖胺β1,3半乳糖基转移酶(N-acetylglucosamineβ1,3galactosyltransferase)”可互换使用,且是指催化将来自供给者UDP-半乳糖的半乳糖以β-1,3糖苷键结转移至接受者N-乙酰葡萄糖胺的半乳糖基转移酶。编码“N-乙酰葡萄糖胺b-1,3-半乳糖基转移酶”或任何上述用语的多核苷酸是指编码如此的糖基转移酶的多核苷酸,该糖基转移酶催化以将来自供给者UDP-半乳糖的半乳糖以β-1,3糖苷键结转移至接受者N-乙酰葡萄糖胺。
本发明所用的用语“N-乙酰葡萄糖胺b-1,4-半乳糖基转移酶(N-acetylglucosamine b-1,4-galactosyltransferase)”、“N-乙酰葡萄糖胺β-1,4-半乳糖基转移酶(N-acetylglucosamine beta-1,4-galactosyltransferase)”、“N-乙酰葡萄糖胺β1,4半乳糖基转移酶(N-acetylglucosamine beta 1,4galactosyltransferase)”、“N-乙酰葡萄糖胺β-1,4-半乳糖基转移酶(N-acetylglucosamineβ-1,4-galactosyltransferase)”、“N-乙酰葡萄糖胺β1,4半乳糖基转移酶(N-acetylglucosamineβ1,4galactosyltransferase)”可互换使用,且是指催化将来自供给者UDP-半乳糖的半乳糖以β-1,4糖苷键结转移至接受者N-乙酰葡萄糖胺的半乳糖基转移酶。编码“N-乙酰葡萄糖胺b-1,4-半乳糖基转移酶”或任何上述用语的多核苷酸是指编码如此的糖基转移酶的多核苷酸,该糖基转移酶催化以将来自供给者UDP-半乳糖的半乳糖以β-1,4糖苷键结转移至接受者N-乙酰葡萄糖胺。
本发明所用的用语“N-乙酰葡萄糖胺-6-磷酸转移酶(glucosamine 6-phosphateN-acetyltransferase)”、“葡萄糖胺-磷酸盐N-乙酰转移酶(glucosamine-phosphate N-acetyltransferase)”、“GNA”、“GNA1”、“葡萄糖胺-6P N-乙酰转移酶(glucosamine-6P N-acetyltransferase)”、“GlcN6P N-乙酰转移酶”可互换使用,且是指催化以将来自乙酰辅酶A(acetyl-CoA)的乙酰基转移至葡萄糖胺-6-磷酸盐中的一级胺,产生N-乙酰-D-葡萄糖胺-6-磷酸盐(也称为GlcNAc-6P)的酶。编码“N-乙酰葡萄糖胺-6-磷酸转移酶”或任何上述用语的多核苷酸是指编码如此的酶的多核苷酸,该酶催化以将来自乙酰辅酶A的乙酰基转移至葡萄糖胺-6-磷酸盐中的一级胺,产生N-乙酰-D-葡萄糖胺-6-磷酸盐。
本发明所用的用语“果糖-6-磷酸转氨酶(fructose-6-phosphateaminotransferase)”、“谷氨酰胺--果糖-6-磷酸-转氨酶(glutamine--fructose-6-phosphate-aminotransferase)”、“谷氨酰胺--果糖-6-磷酸转氨酶(glutamine--fructose-6-phosphate aminotransferase)”、“L-谷氨酰胺—D-果糖-6-磷酸转氨酶(L-glutamine—D-fructose-6-phosphate aminotransferase)”、“glmS”、“glms”、“glmS*54”可互换使用,且是指催化以利用谷氨酰胺作为氮源而将果糖-6-磷酸盐转换成葡萄糖胺-6-磷酸盐的酶。编码“果糖-6-磷酸转氨酶”或任何上述用语的多核苷酸是指编码如此的酶的多核苷酸,该酶催化以利用谷氨酰胺作为氮源而将果糖-6-磷酸盐转换成葡萄糖胺-6-磷酸盐。
本文所用的用语“生物产品(bioproduct)是指在还原端具有N-乙酰葡萄糖胺单元的双糖或寡糖,其是以生物方式合成,即通过微生物合成、细胞合成。
本文所用的用语“双糖(disaccharide)”是指由两个单糖单元组成的糖类。本文所用的用语“寡糖(Oligosaccharide)”,按照本领域的一般理解,是指含有少量(通常为三至二十个)单糖,即单糖的糖类聚合物。本文所用的单糖是还原糖。双糖及寡糖可以是还原糖或非还原糖,并且具有还原端和非还原端。还原糖是能够还原另一种化合物并且本身被氧化(即,糖的羰基被氧化成羧基)的任何糖。本发明中使用的用语“糖的还原端(reducingend of a saccharide)”是指糖中可用于还原另一种化合物的自由异构碳。
本文所用的用语“单糖(monosaccharide)”是指不能通过水解分解为更简单的糖,属于醛糖或酮糖,每个分子中含有一个或多个羟基的糖。单糖是只含有一种单糖的糖类。单糖的例子包括己糖、D-哌喃葡萄糖(D-Glucopyranose)、D-半乳糖呋喃糖(D-galactofuranose)、D-半乳糖哌喃糖(D-galactopyranose)、L-半乳糖哌喃糖、D-哌喃甘露糖(Mannopyranose)、D-哌喃阿洛糖(D-Allopyranose)、D-哌喃古洛糖(D-Gulopyranose)、D-艾杜哌喃糖(D-idopyranose)、D-塔罗哌喃糖(D-talopyranose)、D-核呋喃糖(D-ribofuranose)、D-核哌喃糖(D-ribopyranose)、D-阿拉伯呋喃糖(D-arabinofuranose)、D-阿拉伯哌喃糖(D-arabinopyranose)、L-阿拉伯呋喃糖、L-阿拉伯哌喃糖、D-木哌喃糖(D-xylopyranose)、D-来苏哌喃糖(D-lyxopyranose)、D-赤藻呋喃糖(D-erythrofuranose)、D-苏呋喃糖(D-threofuranose)、庚糖(heptose)、L-甘油-D-甘露-哌喃庚糖(L-glycero-D-manno-Heptopyranose,LDmanHep)、D-甘油-D-甘露-庚哌喃糖(D-glycero-D-manno-Heptopyranose,DDmanHep)、6-去氧-L-阿卓哌喃糖(6-Deoxy-L-altropyranose)、6-去氧--D-哌喃古洛糖、6-去氧-D-塔罗哌喃糖、6-去氧-D-半乳糖哌喃糖、6-去氧-L-半乳糖哌喃糖、6-去氧-D-哌喃甘露糖、6-去氧-L-哌喃甘露糖、6-去氧-D-哌喃葡萄糖、2-去氧-D-阿拉伯-己糖(2-Deoxy-D-arabino-hexose)、2-去氧-D-赤藻-戊糖(2-Deoxy-D-erythro-pentose)、2,6-双去氧-D-阿拉伯-己哌喃糖(2,6-Dideoxy-D-arabino-hexopyranose)、3,6-双去氧-D-阿拉伯-己哌喃糖、3,6-双去氧-L-阿拉伯-己哌喃糖、3,6-双去氧-D-木糖-己哌喃糖(3,6-Dideoxy-D-xylo-hexopyranose)、3,6-双去氧-D-核糖-己哌喃糖(3,6-Dideoxy-D-ribo-hexopyranose)、2,6-双去氧-D-核糖-己哌喃糖、3,6-双去氧-L-木糖-己哌喃糖、2-氨基-2-去氧-D-哌喃葡萄糖、2-氨基-2-去氧-D-半乳糖哌喃糖、2-氨基-2-去氧-D-哌喃甘露糖、2-氨基-2-去氧-D-哌喃阿洛糖、2-氨基-2-去氧-L-阿卓哌喃糖、2-氨基-2-去氧-D-哌喃古洛糖、2-氨基-2-去氧-L-艾杜哌喃糖、2-氨基-2-去氧-D-塔罗哌喃糖、2-乙酰胺基-2-去氧-D-哌喃葡萄糖、2-乙酰胺基-2-去氧-D-半乳糖哌喃糖、2-乙酰胺基-2-去氧-D-哌喃甘露糖、2-乙酰胺基-2-去氧-D-哌喃阿洛糖、2-乙酰胺基-2-去氧-L-阿卓哌喃糖、2-乙酰胺基-2-去氧-D-哌喃古洛糖、2-乙酰胺基-2-去氧-L-艾杜哌喃糖、2-乙酰胺基-2-去氧-D-塔罗哌喃糖、2-乙酰胺基-2,6-双去氧-D-半乳糖哌喃糖、2-乙酰胺基-2,6-双去氧-L-半乳糖哌喃糖、2-乙酰胺基-2,6-双去氧-L-哌喃甘露糖、2-乙酰胺基-2,6-双去氧-D-哌喃葡萄糖、2-乙酰胺基-2,6-双去氧-L-阿卓哌喃糖、2-乙酰胺基-2,6-双去氧-D-塔罗哌喃糖、D-哌喃葡糖醛酸(D-glucopyranuronic acid)、D-哌喃半乳糖醛酸(D-Galactopyranuronic acid)、D-哌喃甘露糖醛酸(D-Mannopyranuronic acid)、D-哌喃阿洛糖醛酸(D-Allopyranuronicacid)、L-哌喃阿卓糖醛酸(L-Altropyranuronic acid)、D-哌喃古洛糖醛酸(D-Gulopyranuronic acid)、L-哌喃古洛糖醛酸、L-哌喃艾杜糖醛酸(L-Idopyranuronicacid)、D-哌喃塔罗糖醛酸(D-Talopyranuronic acid)、唾液酸(sialic acid)、5-氨基-3,5-双去氧-D-甘油-D-半乳糖-壬-2-酮糖酸(5-Amino-3,5-dideoxy-D-glycero-D-galacto-non-2-ulosonic acid)、5-乙酰胺基-3,5-双去氧-D-甘油-D-半乳糖-壬-2-酮糖酸、5-乙醇酰胺基-3,5-双去氧-D-甘油-D-半乳糖-壬-2-酮糖酸(5-Glycolylamido-3,5-dideoxy-D-glycero-D-galacto-non-2-ulosonic acid)、赤藻糖醇(erythritol)、阿拉伯糖醇(Arabinitol)、木糖醇(Xylitol)、核糖醇(Ribitol)、山梨醇(Glucitol)、半乳糖醇(Galactitol)、甘露醇(Mannitol)、D-核糖-己-2-酮哌喃糖(D-ribo-Hex-2-ulopyranose)、D-阿拉伯-己-2-酮呋喃糖(D-arabino-Hex-2-ulofuranose)(D-果呋喃糖(D-fructofuranose))、D-阿拉伯-己-2-酮哌喃糖(D-arabino-Hex-2-ulopyranose)、L-木糖-己-2-酮哌喃糖(L-xylo-Hex-2-ulopyranose)、D-木糖-己-2-酮哌喃糖(D-lyxo-Hex-2-ulopyranose)、D-苏-戊-2-酮哌喃糖(D-threo-Pent-2-ulopyranose)、D-阿卓糖-庚-2-酮哌喃糖(D-altro-Hept-2-ulopyranose)、3-C-(羟基甲基)-D-赤藻呋喃糖(3-C-(Hydroxymethyl)-D-erythofuranose)、2,4,6-三去氧-2,4-二胺基-D-哌喃葡萄糖(2,4,6-Trideoxy-2,4-diamino-D-glucopyranose)、6-去氧-3-O-甲基-D-葡萄糖、3-O-甲基-D-鼠李糖、2,6-双去氧-3-甲基-D-核糖-己糖、2-氨基-3-O-[(R)-1-羧乙基]-2-去氧-D-哌喃葡萄糖、2-乙酰胺基-3-O-[(R)-羧乙基]-2-去氧-D-哌喃葡萄糖、2-乙醇酰胺基-3-O-[(R)-1-羧乙基]-2-去氧-D-哌喃葡萄糖、3-去氧-D-木糖-庚-2-酮哌喃糖酸(3-Deoxy-D-lyxo-hept-2-ulopyranosaric acid)、3-去氧-D-甘露-辛-2-酮哌喃糖酸(3-Deoxy-D-manno-oct-2-ulopyranosonic acid)、3-去氧-D-甘油-D-半乳糖-壬-2-酮哌喃糖酸(3-Deoxy-D-glycero-D-galacto-non-2-ulopyranosonic acid)、5,7-二胺基-3,5,7,9-四去氧-L-甘油-L-甘露-壬-2-酮哌喃糖酸(5,7-Diamino-3,5,7,9-tetradeoxy-L-glycero-L-manno-non-2-ulopyranosonic acid)、5,7-二胺基-3,5,7,9-四去氧-L-甘油o-L-阿卓糖-壬-2-酮哌喃糖酸(5,7-Diamino-3,5,7,9-tetradeoxy-L-glycero-L-altro-non-2-ulopyranosonic acid)、5,7-二胺基-3,5,7,9-四去氧-D-甘油-D-半乳糖-壬-2-酮哌喃糖酸(5,7-Diamino-3,5,7,9-tetradeoxy-D-glycero-D-galacto-non-2-ulopyranosonicacid)、5,7-二胺基-3,5,7,9-四去氧-D-甘油-D-塔罗-壬-2-酮哌喃糖酸(5,7-Diamino-3,5,7,9-tetradeoxy-D-glycero-D-talo-non-2-ulopyranosonic acid)、葡萄糖、半乳糖、N-乙酰葡萄糖胺、葡萄糖胺、甘露糖、木糖、N-乙酰甘露糖胺、N-乙酰基神经氨酸、N-乙醇酰神经氨酸、N-乙酰半乳糖胺、半乳糖胺、岩藻糖、鼠李糖、葡萄糖醛酸、葡萄糖酸、果糖及多元醇。
用语“多元醇”是指含有多个羟基的醇。例如,甘油、山梨醇或甘露醇。
用语“在还原端具有N-乙酰葡萄糖胺单元的双糖”包含但不限于产物Gal-b1,3-GlcNAc或Gal-b1,4-GlcNAc,其中半乳糖分别以β-1,3-键结或β-1,4-键结的方式与N-乙酰葡萄糖胺连接,且其中N-乙酰葡萄糖胺位于双糖的还原端。
用语“Gal-b1,3-GlcNAc”、“Gal-beta-1,3-GlcNAc”、“Gal-β1,3-GlcNAc”、“Galb1,3GlcNAc”、“Galβ1,3GlcNAc”、“lacto-N-biose”、“LNB”、“LacNAc type I”、“type1LacNAc”、“LacNAc(i)”可互换使用,且是指双糖,其中半乳糖以β-1,3-键结的方式与N-乙酰葡萄糖胺连接,且其中N-乙酰葡萄糖胺位于双糖的还原端。
用语“Gal-b1,4-GlcNAc”、“Gal-beta-1,4-GlcNAc”、“Gal-β1,4-GlcNAc”、“Galb1,4GlcNAc”、“Galβ1,4GlcNAc”、“N-乙酰乳糖胺”、“LacNAc”、“LacNAc type II”、“type2LacNAc”、“LacNAc(ii)”可互换使用,且是指双糖,其中半乳糖以β-1,4-键结的方式与N-乙酰葡萄糖胺连接,且其中N-乙酰葡萄糖胺位于双糖的还原端。
在本发明使用的用语“在还原端具有N-乙酰葡萄糖胺单元的寡糖”是指由三至二十个单糖单位组成的寡糖,其中N-乙酰葡萄糖胺存在于寡糖的还原端。在本发明使用的寡糖可为线性结构或可包括分支。两个糖单元之间的键结(如,糖苷键结、半乳糖苷键结、葡萄糖苷键结等)可以表示为,例如,1,4、1->4或(1-4),在此可互换使用。例如,用语“Gal-b1,4-Glc”、“β-Gal-(1->4)-Glc”、“Galbeta1-4-Glc”及“Gal-b(1-4)-Glc”具有相同的含义,即β-糖苷键将半乳糖(Gal)的碳1与葡萄糖(Glc)的碳4连接。每个单糖都可为环状形式(如,呋喃糖的哌喃糖形式)。单个单糖单元之间的键结可以包括α1->2、α1->3、α1->4、α1->6、α2->1、α2->3、α2->4、α2->6、β1->2、β1->3、β1->4、β1->6、β2->1、β2->3、β2->4及β2->6。寡糖可以同时含有α-和β-糖苷键或可以只含有β-糖苷键。本发明中使用的寡糖可以根据通式1定义:
Figure BDA0004113293730000241
其中该寡糖由以下以α或β糖苷键键结的单糖组成,其中B为N-乙酰葡萄糖胺,且其中A、V、W、X、Y及/或Z不存在,或为半乳糖、葡萄糖、岩藻糖、甘露糖、木糖、葡萄糖醛酸、半乳糖醛酸、艾杜糖醛酸、N-乙酰基神经氨酸、N-乙醇酰神经氨酸、葡萄糖胺、N-乙酰半乳糖胺、N-乙酰甘露糖胺、N-乙酰葡萄糖胺及/或由通式2定义的寡糖结构:
Figure BDA0004113293730000251
其中B是N-乙酰葡萄糖胺,且其中A、V、W、X、Y及/或Z不存在,或为半乳糖、葡萄糖、岩藻糖、甘露糖、木糖、葡萄糖醛酸、半乳糖醛酸、艾杜糖醛酸、N-乙酰基神经氨酸、N-乙醇酰神经氨酸、葡萄糖胺、N-乙酰半乳糖胺、N-乙酰甘露糖胺或N-乙酰葡萄糖胺;且其中,在通式1和通式2中,m是3且可选地v是4,或者m是4且可选地v是3,并且其中p是3及/或4,且其中w是6,并且其中如果n>1且p是3,x是3且X不是单糖,并且其中如果n>1且p为4,y是4且Y不是单糖,并且其中z是6,且其中n从1至10。
如本文所使用的“哺乳动物乳寡糖(mammalian milk oligosaccharide)”(MMO)是指寡糖,例如但不限于乳-N-三糖II(lacto-N-triose II)、3-岩藻糖基乳糖(3-fucosyllactose)、2′-岩藻糖基乳糖、6-岩藻糖基乳糖、2’,3-二岩藻糖基乳糖、2’,2-二岩藻糖基乳糖、3,4-二岩藻糖基乳糖、6′-唾液酸乳糖(6′-sialyllactose)、3′-唾液酸乳糖、3,6-二唾液酸乳糖、6,6’-二唾液酸乳糖、8,3-二唾液酸乳糖、3,6-二唾液酸乳-N-四糖(3,6-disialyllacto-N-tetraose)、乳二岩藻四糖(lactodifucotetraose)、乳-N-四糖(lacto-N-tetraose)、乳-N-新四糖(lacto-N-neotetraose)、乳-N-岩藻五糖II(lacto-N-fucopentaose II)、乳-N-岩藻五糖I、乳-N-岩藻五糖III、乳-N-岩藻五糖V、乳-N-岩藻五糖VI、唾液酸乳-N-四糖c(sialyllacto-N-tetraose c)、唾液酸乳-N-四糖b、唾液酸乳-N-四糖a、乳-N-二岩藻六糖I(lacto-N-difucohexaose I)、乳-N-二岩藻六糖II、乳-N-六糖、乳-N-新六糖(lacto-N-neohexaose)、对乳-N-六糖(para-lacto-N-hexaose)、单岩藻糖基单唾液酸乳-N-四糖c(monofucosylmonosialyllacto-N-tetraose c)、单岩藻糖基对乳-N-六糖(monofucosyl para-lacto-N-hexaose)、单岩藻糖基乳-N-六糖III、异构岩藻糖基化乳-N-六糖III(isomeric fucosylated lacto-N-hexaose III)、异构岩藻糖基化乳-N-六糖I、唾液酸乳-N-六糖、唾液酸乳-N-新六糖II、二岩藻糖-对乳-N-六糖、二岩藻糖乳-N-六糖、二岩藻糖乳-N-六糖a、二岩藻糖乳-N-六糖c、岩藻糖基化几丁聚糖、岩藻糖基化寡糖、中性寡糖及/或唾液酸化寡糖。哺乳动物乳寡糖(MMO)包括存在于哺乳期任何阶段的乳中的寡糖,包括人类(即,人乳寡糖或HMO)和哺乳动物的初乳,该哺乳动物包括但不限于牛(BosTaurus)、羊(Ovis aries)、山羊(Capra aegagrus hircus)、双峰骆驼(Camelusbactrianus)、马(Equus ferus caballus)、猪(Sus scropha)、狗(Canis lupusfamiliaris)、日本棕熊(Ursus arctos yesoensis)、北极熊(Ursus maritimus)、日本黑熊(Ursus thibetanus japonicus)、条纹臭鼬(Mephitis mephitis)、冠海豹(Cystophoracristata)、亚洲象(Elephas maximus)、非洲象(Loxodontaafricana)、巨型食蚁兽(Myrmecophagatridactyla)、真瓶鼻海豚(Tursiopstruncates)、北方小须鲸(Balaenopteraacutorostrata)、尤金袋鼠(Macropuseugenii)、红袋鼠(Macropusrufus)、刷尾负鼠(TrichosurusVulpecula)、无尾熊(Phascolarctos cinereus)、东袋鼬(Dasyurusviverrinus)、鸭嘴兽(Ornithorhynchusanatinus)。人乳寡糖(HMOs)也被称为同人乳寡糖(human identical milk oligosaccharides),其化学成分与人乳中的人乳寡糖相同,但其通过生物技术产生的(例如,使用无细胞系统或包括细菌、真菌、酵母、植物、动物或原生动物细胞的细胞和生物体,优选为基因工程细胞和生物体)。同人乳寡糖在市场上以HiMO的名义贩售。
用语“纯化的(purified)”是指实质上或基本上不含干扰生物分子活性成分的材料。对于细胞、糖类、核酸和多肽,用语“纯化的”是指实质上或基本上不含通常在材料以其天然状态存在时伴随材料的组分的材料。典型地,本发明的纯化的糖类、寡糖、蛋白质或核酸是通过银染凝胶上的条带强度或其他测定纯度的方法测量的至少约50%、55%、60%、65%、70%、75%、80%或85%纯度,通常至少约为90%、91%、92%、93%、94%、95%、96%、97%、98%或99%纯度。纯度或均一性可通过本领域已知的许多方法来指示,例如蛋白质或核酸样品的聚丙烯酰胺凝胶电泳,随后在染色时视觉化。出于一些目的,需要高解析度,并使用HPLC或类似的纯化方法。对于寡糖,可使用例如但不限于薄层色层分析、气相色层分析、NMR、HPLC、毛细管电泳或质谱的方法来测定纯度。
用语“相同(identical)”或“百分比同一性(percent identity)”或“%同一性(%identity)”在两个或更多个核酸或多肽序列的情形中,是指两个或更多个序列或子序列,当使用序列比较演算法或目测法测量就最大对应性进行比较和比对时,其是相同的或具有特定百分比的相同的氨基酸残基或核苷酸。对于序列比较,一个序列作为参照序列,将测试序列与的进行比较。当使用序列比较演算法时,将测试序列和参照序列输入电脑,必要时指定子序列座标,并指定序列演算法程式参数。然后,序列比较演算法基于指定的程式参数,计算测试序列相对于参照序列的序列同一性百分比。百分比同一性可以通过参照序列的全长序列总体地计算,从而得到总体的百分比同一性分数。或者,可以在参照序列的部分序列上计算同一性百分比,从而得出局部同一性百分比分数。在局部序列比对中使用参照序列的全长,而得到测试序列与参照序列之间的总体百分比同一性分数。使用不同的演算法确定百分比同一性,例如BLAST和PSI-BLAST(Altschulet al.,1990,J Mol Biol 215:3,403-410;Altschulet al.,1997,Nucleic Acids Res 25:17,3389-402)、Clustal Omega方法(Sievers et al.,2011,Mol.Syst.Biol.7:539)、MatGAT方法(Campanella et al.,2003,BMC Bioinformatics,4:29)或EMBOSS Needle。
BLAST(Basic Local Alignment Search Tool))的比对方法是由美国国家生物技术资讯中心(National Center for Biotechnology Information,NCBI)提供的一种演算法,使用预设参数(default parameters)来比较序列。该程式将核苷酸或蛋白质序列与序列资料库进行比较,并计算出统计意义。特定位置反覆运算基本局部排列检索工具(Position-Specific Iterative Basic Local Alignment Search Tool,PSI-BLAST)是从使用蛋白质-蛋白质BLAST(BLASTp)检测到的高于给定分数阈值的序列的多序列比对中得出特定位置评分矩阵(PSSM)或概况。BLAST方法可用于成对或多序列比对。成对序列比对用于识别可能表明两个生物序列(蛋白质或核酸)之间功能、结构及/或进化关系的相似区域。BLAST的网路介面可得自:https://blast.ncbi.nlm.nih.gov/Blast.cgi。
Clustal Omega(Clustal W)是一个多序列比对程式,其使用种子引导树和HMM轮廓-轮廓(profile-profile)技术以产生三个或更多序列之间的比对。其产生有生物学意义的发散序列(divergent sequences)的多序列比对。Clustal W的网路介面可得自https://www.ebi.ac.uk/Tools/msa/clustalo/。使用Clustal W方法进行多序列比对和计算蛋白质序列的百分比同一性的预设参数是:启用输入序列的去比对:FALSE;启用mbed-like群集引导树(mbed-like clustering guide-tree):TRUE;启用mbed-like群集迭代法(mbed-likeclustering iteration):TRUE;(结合的引导树/HMM)迭代法的次数:预设(0);最大引导树迭代法:预设[-1];最大HMM迭代法:预设[-1];顺序:对齐。
矩阵全局比对工具(Matrix Global Alignment Tool,MatGAT)是电脑应用程式,其产生DNA或蛋白质序列的相似性/同一性矩阵,而不需要对资料进行预比对。该程式使用Myers和Miller全局比对演算法执行一系列的成对比对,计算相似性和同一性,然后将结果放在距离矩阵中。使用者可指定哪种类型的比对矩阵(如,BLOSUM50、BLOSUM62和PAM250),以用于那些蛋白质序列检查。
EMBOSS Needle(https://galaxy-iuc.github.io/emboss-5.0-docs/ needle.html)使用Needleman-Wunsch全局排列演算法,在考虑到该些序列的整体长度时,找到两个序列的最优选排列(包括空位(gap))。通过动态程式设计方法,探索所有可能的排列并选择最优选排列,以确保最优选排列。Needleman-Wunsch演算法是一类演算法的成员,其可在mn步骤的顺序中计算出最优选分数和排列,(其中'n'和'm'是两个序列的长度)。空位开放罚分(gap open penalty)(预设10.0)是在产生空位时被扣除的分数。预设值是推定使用对于蛋白质序列的EBLOSUM62矩阵。空位延伸(预设0.5)罚分增加至对于空位中的每一个碱基或残基的标准空位罚分。其为长空位的惩罚。
如本文所用,具有氨基酸序列与参照多肽序列的全长序列具有至少80%的序列同一性的多肽,应理解为该序列具有80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、91.50%、92.00%、92.50%、93.00%、93.50%、94.00%、94.50%、95.00%、95.50%、96.00%、96.50%、97.00%、97.50%、98.00%、98.50%、99.00%、99.50%、99.60%、99.70%、99.80%、99.90%、100%与参照多肽序列的全长氨基酸序列相同。在本申请中,除非明确规定,包括/具有与参照多肽(或核苷酸序列)的全长氨基酸序列(或核苷酸序列)至少80%序列同一性/由其组成的多肽(或DNA序列),通常以SEQ ID NO或UniProt ID或Genbank NO.表示,优选具有至少85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%,更优选具有至少85%,又更优选具有至少90%,最优选具有至少95%与全长参照序列相同的序列。
为了本发明的目的,使用MatGAT2.01(Campanellaet al.,2003,BMCBioinformatics 4:29)确定百分比同一性。采用了以下用于蛋白质的预设参数:(1)空位成本存在性(Gap cost Existence):12和延伸:2;(2)采用的矩阵是BLOSUM65。在优选的实施方案中,序列同一性是根据给定的SEQ ID NO的全长序列,即参照序列,或其一部分所计算。其中的一部分优选是指完整参照序列的至少50%、60%、70%、80%、90%或95%。
用语“培养物(cultivation)”是指培养基,其中培养或发酵细胞、细胞本身、及通过在培养液中的本发明细胞产生在其还原端带有GlcNAc的双糖及/或寡糖,即,细胞的内部(细胞内)以及外部(细胞外)。
本文所用的用语“膜转运蛋白”是指细胞膜的一部分或与的交互作用并控制分子和资讯横跨细胞的流动的蛋白质。因此,膜蛋白参与运输,无论是细胞的输入或输出。
如此的膜转运蛋白可为如转运分类资料库(Transporter ClassificationDatabase)所定义的运输蛋白(Porters)、P-P-键水解-驱动的转运体(P-P-bond-hydrolysis-driven transporters)、β-桶状孔蛋白(β-Barrel Porins)、辅助转运蛋白(auxiliary transport proteins)、推定转运蛋白(putative transport proteins)和磷酸转移-驱动组转位蛋白(phosphotransfer-driven group translocators),该资料库由Saier实验室生物资讯学组(Saier Lab Bioinformatics Group)操作和策划,且可经由www.tcdb.org获得,并提供膜转运蛋白的功能和系统分类此转运分类资料库详细说明IUBMB批准的膜转运蛋白的综合分类系统,称为转运分类(TC)系统。本文描述的TCDB分类检索是基于2019年6月17日发布的TCDB.Org所定义。
运输蛋白是利用载体介导过程的单运输蛋白(uniporters)、共运输蛋白(symporter)和反向运输蛋白(antiporter)的总称(Saieret al.,Nucleic Acids Res.44(2016)D372-D379)。其属于电化学电位驱动的转运体,也称为二级载体型促进体。当膜转运蛋白在单一物种通过促进扩散或在膜电位依赖过程中(如果溶质是带电的)运输时,利用载体介导过程催化单向运输;当两个或更多的物种在一个紧密耦合的过程中于反向运输时,利用载体介导过程催化反向运输,而不与化学渗透能(chemiosmotic energy)以外的直接形式能量耦合;及/或当两个或更多的物种在一个紧密耦合过程中以相同方向运输时,利用载体介导过程催化共同运输,而不与化学渗透能以外的直接形式能量耦合,则膜转运蛋白包括在二级载体的此分类中(Forrestet al.,Biochim.Biophys.Acta1807(2011)167-188)。这些系统通常具有立体特异性。溶质:溶质反运输是二级载体的特征特性。运输蛋白和酶的动态联结创造功能性膜,将通常从细胞外腔室获得的通道基质的代谢群组直接转运进入到其细胞代谢中(Moraes and Reithmeier,Biochim.Biophys.Acta 1818(2012),2687-2706)。经由此运输蛋白系统运输的溶质包括但不限于阳离子、有机阴离子、无机阴离子、核苷、氨基酸、多元醇、磷酸化的糖解中间产物、渗透物、螯铁蛋白(siderophores)。
如果膜转运蛋白水解无机焦磷酸、ATP或另一种核苷三磷酸的二磷酸键,以驱动一或多种溶质的主动摄入及/或排出,则该膜转运蛋白包含在P-P-键水解-驱动的转运体的分类中(Saieret al.,Nucleic Acids Res.44(2016)D372-D379)。膜转运蛋白可能或不可能被暂时性磷酸化,但基质不被磷酸化。经由P-P-键水解-驱动的转运体运输的基质包括但不限于阳离子、重金属、β-葡聚糖、UDP-葡萄糖、脂多糖、磷壁酸(teichoic acid)。
β-桶状孔蛋白膜转运蛋白形成跨膜孔,其通常允许溶质不依赖能量穿过膜。这些蛋白的跨膜部分完全由形成β-桶状的β链组成(Saieret al.,Nucleic Acids Res.44(2016)D372-D379)。这些孔蛋白类型的蛋白质存在于革兰氏阴性菌、粒线体、色素体(plastid)和可能在抗酸革兰氏阳性菌(acid-fast Gram-positive bacteria)的外膜。经由这些β-桶状孔蛋白运输的溶质包括但不限于核苷、棉子糖、葡萄糖、β-葡萄糖苷、寡糖。
辅助转运蛋白被定义为促进跨越一或多个生物膜的运输,但本身不直接参与运输的蛋白质。这些膜转运蛋白总是与一或多个已建立的转运系统一起发挥作用,例如但不限于外膜因子(OMFs)、多糖(PST)运输蛋白、ATP结合盒(ATP-binding cassette,ABC)型运输蛋白。其可提供与运输的能量耦合有关的功能,在复合物的形成中发挥结构性作用,发挥生物或稳定性功能或调节功能(Saier et al.,Nucleic Acids Res.44(2016)D372-D379)。辅助转运蛋白的例子包括但不限于参与多糖转运的多糖共聚酶家族、参与菌素(bacteriocin)和化学毒素转运的膜融合蛋白家族。
推定转运蛋白包括一些家族,当成员的转运功能被确定时,这些家族将被分类到别处,或者如果提出的转运功能被推翻,将自转运分类系统删除。这些家族包括一或多个成员,这些成员被认为具有转运功能,但此功能的证据尚未被信服(Saier et al.,NucleicAcids Res.44(2016)D372-D379)。分类于2019年6月17日发布的TCDB系统下的此组的推定转运体的例子包括但不限于铜转运体。
磷酸转移-驱动组转位蛋也称为细菌的磷酸烯醇丙酮酸(磷酸烯醇丙酮酸):糖磷酸转移酶系统(PTS)的PEP依赖性磷氧基转移-驱动组转位蛋白。衍生自细胞外的糖的该反应的产物是细胞质的糖-磷酸盐。催化糖磷酸化的酶成分是在紧密耦合过程中迭加在运输过程上。PTS系统关于许多不同方面,包括调节和趋化(chemotaxis)、生物膜形成及致病机制(Lengeler,J.Mol.Microbiol.Biotechnol.25(2015)79-93;Saier,J.Mol.Microbiol.Biotechnol.25(2015)73-78)。分类于2019年6月17日发布的TCDB系统下的磷酸转移-驱动组转位蛋白的膜转运蛋白家族包括与转运葡萄糖-葡萄糖苷、果糖-甘露醇、乳糖-N,N'-二乙酰几丁二糖-β-葡萄糖苷、山梨醇、半乳糖醇、甘露糖-果糖-山梨糖和抗坏血酸有关的PTS系统。
主要促进者超级家族(major facilitator superfamily,MFS)是膜转运蛋白超级家族,其催化单向运输蛋白、溶质:阳离子(H+,但很少是Na+)共运输及/或溶质:H+或溶质:溶质反向运输。如由Saier实验室生物资讯学组(www.tcdb.org)运作的转运分类资料库所定义,大多数转运体的长度为400-600个氨基酸残基,拥有12、14或偶尔24个跨膜α-螺旋扳(transmembraneα-helical spanners,TMS)。
本文所用的“SET”或“糖排出转运体(Sugar Efflux Transporter)”是指SET家族的膜蛋白,其具有InterPRO域IPR004750的蛋白质及/或属于eggNOGv4.5家族ENOG410XTE9的蛋白质。InterPro域的识别可通过使用https://www.ebi.ac.uk/interpro/的线上工具或使用预设值的InterProScan(https://www.ebi.ac.uk/interpro/download.html)独立版本进行。eggNOGv4.5中异种同源y家族的识别可使用eggNOG-mapperv1的线上版本或独立版本(http://eggnogdb.embl.de/#/app/home)进行。
本文所用的用语“螯铁蛋白(Siderophore)”是指各种微生物的二级代谢物,其主要是铁离子特异性螯合剂。这些分子被分类为儿茶酚盐(catecholate)、羟胺盐(hydroxamate)、羧酸盐(carboxylate)和混合类型。螯铁蛋白一般是通过非核糖体肽合成酶(nonribosomal peptide synthetase,NRPS)依赖途径或NRPS独立途径(NIS)合成。在NRPS依赖性螯铁蛋白生物合成途径中,最重要的前驱物是分支盐酸(chorismate)。2,3-DHBA可通过三步骤反应,在异分支盐酸合成酶(isochorismate synthase)、异分支盐酸酶(isochorismatase)和2,3-二羟基苯甲酸-2,3-脱氢酶(2,3-dihydroxybenzoate-2,3-dehydrogenase)的催化下而自分支盐酸形成。螯铁蛋白也可自水杨酸形成,该水杨酸是通过异分支盐酸丙酮酸裂解酶(isochorismate丙酮酸lyase)而从异分支盐形成。当鸟氨酸(ornithine)使用作为螯铁蛋白的前驱物时,生物合成取决于由L-鸟氨酸N5-单氧酶催化(L-ornithine N5-monooxygenase)的鸟氨酸的羟基化。在NIS途径中,螯铁蛋白生物合成的重要步骤是N(6)-羟基赖氨酸合成酶。
需要转运体需要将螯铁蛋白输出到细胞外。在这一过程中,在此过程中,已识别出四个膜蛋白的超级家族:主要促进者超级家族(major facilitator superfamily,MFS);多药/寡糖-脂/多糖翻转酶超级家族(Multidrug/Oligosaccharidyl-lipid/PolysaccharideFlippase Superfamily,MOP);抗性、结核作用和细胞分裂超级家族(resistance,nodulation and cell division superfamily,RND);以及ABC超级家族。一般而言,参与螯铁蛋白输出的基因与螯铁蛋白生物合成基因聚集在一起。本文所使用的用语“螯铁蛋白输出体(siderophore exporter)”是指需要将螯铁蛋白输出到细胞外的这类转运体。
ATP结合盒(ABC)超级家族包含摄入和排出转运系统,且这两组成员通常松散地群集。ATP水解而不需要蛋白质磷酸化就能为运输提供能量。ABC超级家族内有几十个家族,家族一般与基质特异性相关。成员根据经由www.tcdb.org可获得的Saier实验室生物资讯学组运作的转运分类资料库所定义的3.A.1类进行分类,且该资料库提供了膜转运蛋白的功能和系统分类。
用语“允许排出(enabled efflux)”表示在细胞质膜及/或细胞壁上引入溶质的转运活性。可通过引入及/或增加本发明所述的转运蛋白的表达允许所述的转运。用语“促进排出(enhanced efflux)”是指改善溶质在细胞质膜及/或细胞壁上的转运活性。可通过引入及/或增加本发明所述的膜转运蛋白的表达促进溶质在细胞质膜及/或细胞壁上的转运。膜转运蛋白的“表达”定义为在编码该膜转运蛋白的基因是内源性基因的情况下,该基因的“过度表达”,或在编码该膜转运蛋白的基因是异源基因(于野生型菌株或细胞中不存在)的情况下的“表达”。
本文所使用的用语“前驱物(precursor)”是指被用于具体产生双糖及/或寡糖(例如,在还原端具有N-乙酰葡萄糖胺单元的双糖或寡糖)的细胞摄入及/或合成的物质。在此意义上,前驱物可为本文定义的接受者,但也可以是另一种物质、代谢物,其在细胞内先被修饰而作为双糖及/或寡糖(例如,在还原端具有N-乙酰葡萄糖胺单元的双糖或寡糖)的生化合成途径的一部分。这种前驱物的例子包括本文定义的接受者,及/或葡萄糖、半乳糖、果糖、甘油、唾液酸、岩藻糖、甘露糖、麦芽糖、蔗糖、乳糖、二羟丙酮、葡萄糖胺、甘露糖胺、N-乙酰甘露糖胺、半乳糖胺、N-乙酰半乳糖胺、磷酸化糖,例如但不限于葡萄糖-1-磷酸盐(glucose-1-phosphate)、半乳糖-1-磷酸盐(galactose-1-phosphate)、葡萄糖-6-磷酸盐、果糖-1,6-二磷酸盐、甘露糖-6-磷酸盐、甘露糖-1-磷酸盐、甘油-3-磷酸盐、甘油醛-3-磷酸盐、二羟基丙酮-磷酸盐(dihydroxyacetone-phosphate)、葡萄糖胺-6-磷酸、N-乙酰-葡萄糖胺-6-磷酸盐、N-乙酰甘露糖胺-6-磷酸盐、N-乙酰葡萄糖胺-1-磷酸盐、N-乙酰神经氨酸-9-磷酸盐及/或本文定义的核苷酸活性糖,例如UDP-葡萄糖、UDP-半乳糖、UDP-N-乙酰葡萄糖胺、CMP-唾液酸、GDP-甘露糖、GDP-4-脱氢-6-去氧-α-D-甘露糖、GDP-岩藻糖。
本文所使用的用语“接受者(acceptor)”是指可通过糖基转移酶修饰的单糖、双糖或寡糖。此接受者的例子包括葡萄糖、半乳糖、果糖、甘油、唾液酸、岩藻糖、甘露糖、麦芽糖、蔗糖、乳糖、乳-N-双糖(LNB)、乳-N-三糖、乳-N-四糖(LNT)、乳-N-新四糖(LNnT)、N-乙酰-乳糖胺(LacNAc)、乳-N-五糖(LNP)、乳-N-新戊糖、对乳-N-戊糖、对乳-N-新戊糖、乳-N-新戊糖I、乳-N-六糖(LNH)、乳-N-新六糖(LNNH)、对乳-N-新六糖(pLNNH)、对乳-N-六糖(pLNH)、乳-N-庚糖(lacto-N-heptaose)、乳-N-新庚糖(lacto-N-neoheptaose)、对乳-N-新庚糖(paralacto-N-neoheptaose)、对乳-N-庚糖(para lacto-N-heptaose)、乳-N-辛糖(lacto-N-octaose,LNO)、乳-N-新辛糖、异乳-N-辛糖、对乳-N-辛糖、异乳-N-新辛糖(iso lacto-N-neooctaose)、新乳-N-新辛糖(novo lacto-N-neooctaose)、对乳-N-新辛糖(para lacto-N-neooctaose)、异乳-N-壬糖(iso lacto-N-nonaose)、新乳-N-壬糖(novo lacto-N-nonaose)、乳-N-壬糖(lacto-N-nonaose)、乳-N-癸糖(lacto-N-decaose)、异乳-N-癸糖(iso lacto-N-decaose)、新乳-N-癸糖(novo lacto-N-decaose)、乳-N-新癸糖(lacto-N-neodecaose)、半乳糖乳糖(galactosyllactose)、以1、2、3、4、5或多个的N-乙酰乳糖胺单元及/或以1、2、3、4、5或多个的乳-N-双糖单元延伸的乳糖、及包含1个或多个N-乙酰乳糖胺单元及/或1个或多个乳糖-N-双糖单元的寡糖或其寡糖、岩藻糖基化及唾液酸化形式的中间体。
本发明的详细说明
根据第一方面,本发明提供一种通过细胞,优选为单一细胞产生在还原端具有N-乙酰葡萄糖胺(GlcNAc)单元的双糖或寡糖的方法。该方法包括以下步骤:
-提供能够合成核苷酸-糖及单糖GlcNAc并能够糖化该GlcNAc单糖的细胞,
-在允许产生该双糖或寡糖的条件下培养该细胞,
-优选地,自培养物分离该双糖或寡糖。
在本发明的范畴中,字词“允许产生该双糖或寡糖的条件(conditionspermissive for producing said di-or oligosaccharide)”应理解为与物理或化学参数有关的条件,其包括但不限于温度、pH值、压力、渗透压和产物/前驱物/接受者浓度。
在特定实施方案,此条件可包含30+/-20摄氏度的温度范围、7+/-3的pH值范围。
在本申请中,特征“双糖或寡糖”优选以“寡糖”替代,特征“双糖及/或寡糖”优选以“寡糖”替代。根据本发明,细胞能够合成GlcNAc且此GlcNAc单糖进一步通过糖化修饰,该糖化在同一细胞中进行,以合成在还原端具有GlcNAc的双糖或寡糖。藉此,细胞表达糖基转移酶,以使合成的N-乙酰葡萄糖胺糖化,形成本发明的在还原端带有GlcNAc的双糖或寡糖。
因此,本发明提供一种通过细胞,优选为单一细胞产生在还原端具有N-乙酰葡萄糖胺(GlcNAc)单元的双糖或寡糖的方法。该方法包括以下步骤:
-提供能够合成核苷酸-糖及单糖GlcNAc并能够表达糖基转移酶以糖化该GlcNAc单糖而形成该双糖或寡糖的细胞,
-在允许产生该双糖或寡糖的条件下培养该细胞,
-优选地,自培养物分离该双糖或寡糖。
糖基转移酶是催化来自活化的供给者分子的糖部分转移到特定的接受者分子,以形成糖苷键的酶。如本文所用的该糖基转移酶可选自包含下列的列举但不限于此:α-1,2-岩藻糖基转移酶(alpha-1,2-fucosyltransferases)、α-1,3/1,4-岩藻糖基转移酶、α-1,6-岩藻糖基转移酶、α-2,3-唾液酸转移酶(alpha-2,3-sialyltransferases)、α-2,6-唾液酸转移酶,α-2,8-唾液酸转移酶、β-1,3-半乳糖基转移酶、β-1,4-半乳糖基转移酶、α-1,3-半乳糖基转移酶、α-1,4-半乳糖基转移酶、N-乙酰基葡糖胺转移酶、N-乙酰基半乳糖胺转移酶、葡萄糖基转移酶(glucosyltransferases)、甘露糖基转移酶、N-乙酰基甘露糖胺转移酶、木糖基转移酶、葡萄糖醛酸苷转移酶(glucuronyltransferases)、半乳糖醛酸转移酶、葡萄糖胺转移酶、N-乙醇酰神经胺转移酶(glycolylneuraminyltransferases)。
细胞需要在细胞内产生GlcNAc,以便能够进一步对合成的GlcNAc进行糖化。GlcNAc的细胞内产生需要理解为在细胞内或细胞质内的合成GlcNAc,而不是在胞器或胞器膜或细胞的周质或细胞膜或细胞壁内的合成。
在优选实施方案中,本文所述的细胞表达至少一N-乙酰葡萄糖胺-6-磷酸转移酶及磷酸酶,以合成N-乙酰葡萄糖胺。在此优选实施方案中,该N-乙酰葡萄糖胺-6-磷酸转移酶为在细胞中能够将葡萄糖胺-6-磷酸盐转变成N-乙酰葡萄糖胺-6-磷酸盐的酶,且该磷酸酶为在细胞中能够将N-乙酰葡萄糖胺-6-磷酸盐去磷酸化以产生N-乙酰葡萄糖胺。在更优选实施方案中,此磷酸酶为HAD样(HAD-like)磷酸酶。来自HAD超级家族和HAD样家族的磷酸酶在本领域中被描述。这些家族的例子可以在来自大肠杆菌的基因yqaB、inhX、yniC、ybiV、yidA、ybjI、yigL或cof、或例如包括aphA、Cof、HisB、OtsB、SurE、Yaed、YcjU、YedP、YfbT、YidA、YigB、YihX、YniC、YqaB、YrbL、AppA、Gph、SerB、YbhA、YbiV、YbjL、Yfb、YieH、YjgL、YjjG、YrfG及YbiU的任一或多个的大肠杆菌基因;或来自恶臭假单胞菌(Pseudomonasputida)的PsMupP、来自啤酒酵母菌(S.cerevisiae)的ScDOG1、或来自枯草芽孢杆菌(Bacillus subtilis)的BsAraL基因(如WO18122225所述)所表达的酶中发现。在埃默森小芽枝霉(Blastocladiella emersonii)识别出催化此反应的一种磷酸酶。一个磷酸酶通常并不特异且活性通常与家族或结构相关。因此,在所有的磷酸酶家族中都可以找到其他的例子。特定的磷酸酶通过如Fahs等人(ACS Chem.Biol.11(11),2944-2961(2016))描述的已知方法可容易地识别和筛选。
在本发明的内容中,应理解的是根据本发明的在还原端具有GlcNAc单元的双糖或寡糖是在细胞内合成。本领域技术人员将进一步理解,部分(fraction)或实质上全部合成的还原端具有GlcNAc单元的双糖或寡糖保留在细胞内及/或经由被动或主动运输排出细胞外。
在优选实施方案中,该细胞能够表达至少一种糖基转移酶,以糖化该GlcNAc单糖而形成该双糖或寡糖。在另一优选实施方案中,该细胞能够表达至少两种、更优选为至少三种、又更优选为至少四种、又更优选为至少五种、最优选为至少六种糖基转移酶,以糖化该GlcNAc单糖而形成根据本发明的该双糖或寡糖。
在本发明的内容中,该核苷酸-糖优选为用于该糖基转移酶的供给者。优选地,该细胞能够合成至少两种、更优选为至少三种、又更优选为至少四种、最优选为至少五种核苷酸-糖。
在优选实施方案中,该双糖或寡糖为乳-N-双糖(LNB)或N-乙酰乳糖胺(LacNAc),优选为在还原端含有LNB或LacNAc的寡糖,更优选为LNB或LacNAc的唾液酸化及/或岩藻糖基化及/或半乳糖基化及/或GlcNAc-修饰形式、或者又更优选为在还原端含有LNB或LacNAc的寡糖的唾液酸化及/或岩藻糖基化及/或半乳糖基化及/或GlcNAc-修饰形式。在另一优选实施方案中,该双糖或寡糖为在还原端具有N-乙酰葡萄糖胺单元的中性双糖或寡糖,优选为在还原端含有LNB或LacNAc的中性寡糖。优选地,该中性寡糖为岩藻糖基化。或者,优选为该中性寡糖并未岩藻糖基化。
在另一优选实施方案中,本发明提供一种通过细胞,优选为单一细胞产生在还原端具有N-乙酰葡萄糖胺(GlcNAc)单元的双糖及/或寡糖混合物的方法。该方法包括以下步骤:
-提供能够合成核苷酸-糖及单糖GlcNAc并能够表达糖基转移酶以糖化该GlcNAc单糖而形成其还原端具有GlcNAc的该双糖及/或寡糖混合物的细胞,
-在允许产生该还原端具有GlcNAc的双糖及/或寡糖的混合物的条件下培养该细胞,
-优选地,自培养物分离该混合物。
根据本发明,该混合物包括或由至少两种不同的其还原端具有GlcNAc的双糖及/或寡糖所组成,优选为包括或由至少三种不同的其还原端具有GlcNAc的双糖及/或寡糖所组成,更优选为包括或由至少四种不同的其还原端具有GlcNAc的双糖及/或寡糖所组成。优选地,该混合物包括或由中性双糖及/或寡糖所组成。更优选地,该混合物包括或由带电及/或中性的双糖及/或寡糖所组成。在本方法及/或细胞的优选实施方案中,带电双糖及/或寡糖为唾液酸化的双糖及/或寡糖。在本方法及/或细胞的优选实施方案中,中性的双糖及/或寡糖为岩藻糖基化的。在本方法及/或细胞的另一优选实施方案中,中性的双糖及/或寡糖并未岩藻糖基化。
在本发明的范畴中优选为一种通过细胞,优选为单一细胞产生混合物的方法,该混合物包括(i)如本文所述的在还原端具有N-乙酰葡萄糖胺(GlcNAc)单元的双糖及/或寡糖、及(ii)一或多种基于乳糖的哺乳动物乳寡糖(MMO),优选为一或多种基于乳糖的人乳寡糖(HMOs)。该方法包括以下步骤:
-提供细胞,该细胞(i)能够合成核苷酸-糖及单糖GlcNAc且能够表达糖基转移酶以糖化该GlcNAc单糖而产生该双糖及/或寡糖,且(ii)其中该细胞进一步能够表达一或多种糖基转移酶以糖化乳糖而产生该一或多种基于乳糖的哺乳动物乳寡糖且其中该细胞能够合成一或多种核苷酸-糖,其为用于该糖基转移酶的供给者,其中该乳糖是由细胞(优选为细胞内)所制造或在培养之前及/或之后添加,
-在允许产生包括(i)双糖及/或寡糖及(ii)一或多种基于乳糖的哺乳动物乳寡糖的混合物的条件下培养该细胞,
-优选地,自培养物分离该混合物。
本领域技术人员将理解的是,参与产生该还原端具有GlcNAc的双糖及/或寡糖的一或多种糖基转移酶可与糖化乳糖以形成一或多种基于乳糖的哺乳动物乳寡糖的糖基转移酶相同。或者,参与产生该还原端具有GlcNAc的双糖及/或寡糖的糖基转移酶与参与产生一或多种基于乳糖的哺乳动物乳寡糖的糖基转移酶不同。
本领域技术人员也将理解的是,参与产生该还原端具有GlcNAc的双糖及/或寡糖的一或多种核苷酸-糖可以与参与产生一或多种基于乳糖的哺乳动物乳寡糖的核苷酸-糖相同。或者,参与产生该还原端具有GlcNAc的双糖及/或寡糖的一或多种核苷酸-糖可以与参与产生一或多种基于乳糖的哺乳动物乳寡糖的核苷酸-糖不同。
产生在还原端具有GlcNAc单元的双糖或寡糖以及产生在还原端具有GlcNAc单元的双糖及/或寡糖混合物的方法及/或细胞的内容中所公开的每个实施方案也公开在产生混合物的方法的内容中,该混合物包括(i)在还原端具有GlcNAc单元的双糖及/或寡糖、及(ii)一或多种基于乳糖的哺乳动物乳寡糖,优选为一或多种基于乳糖的人乳寡糖。
此外,本文在产生还原端具有GlcNAc单元的双糖或寡糖或包括还原端具有GlcNAc单元的双糖及/或寡糖的混合物的方法及/或细胞方面的内容中所公开的每个实施方案也公开用于产生一或多种基于乳糖的哺乳动物乳寡糖。例如,为了产生在还原端具有GlcNAc单元的双糖或寡糖而公开的糖基转移酶和核苷酸-糖的量和同一性也可应用于产生一或多种基于乳糖的哺乳动物乳寡糖的内容。这同样适用于本发明的其他方面,如该细胞产生在还原端具有GlcNAc单元的双糖或寡糖的用途。
另一实施方案提供一种通过基因改造细胞,优选为单一基因改造细胞产生该还原端具有GlcNAc单元的双糖或寡糖的方法,该方法包括以下步骤:
-提供能够合成核苷酸-糖及单糖GlcNAc并能够糖化该GlcNAc单糖的基因改造细胞,
-在允许产生该双糖或寡糖的条件下培养该细胞,
-优选地,自培养物分离该双糖或寡糖。
在本申请中,除非另有明确说明,“基因改造细胞(genetically modified cell)”或“代谢工程细胞(metabolically engineered cell)”优选是指分别经过基因改造或代谢工程的细胞,其用于产生根据本发明的还原端具有N-乙酰葡萄糖胺单元的双糖或寡糖。
根据第二方面,提供一种代谢工程细胞,其能够(i)合成核苷酸-糖、(ii)合成N-乙酰葡萄糖胺、及(iii)糖化该N-乙酰葡萄糖胺单糖,其中该细胞产生还原端具有N-乙酰葡萄糖胺单元的双糖或寡糖(或如本文所公开的混合物),即,该细胞经代谢工程以用于产生该还原端具有N-乙酰葡萄糖胺单元的双糖或寡糖(或如本文所公开的混合物)。还原端具有N-乙酰葡萄糖胺单元的双糖或寡糖(或如本文所公开的混合物)优选不发生在该代谢工程细胞的野生型中。
因此,本发明提供一种经代谢工程以用于产生还原端具有N-乙酰葡萄糖胺单元的双糖或寡糖的细胞,其中该细胞能够(i)合成核苷酸-糖、(ii)合成N-乙酰葡萄糖胺、及(iii)表达糖基转移酶以糖化该GlcNAc单糖而形成该双糖或寡糖。进一步具体说明第二方面的任何特征(例如,该核苷酸-糖及糖基转移酶的量和同一性;包含其混合物的该双糖或寡糖的量和同一性;等)的本发明的第一方面的各实施方案视为也公开在第二方面的内容中。
在本文所述的方法及细胞中,细胞优选包括包括编码一种蛋白质的同一编码DNA序列的多个拷贝。在本发明的内容中,该蛋白质可为糖基转移酶、膜转运蛋白或本文公开的任何其他蛋白质。在本申请中,“多个(multiple)”表示至少2个,优选至少3个,更优选至少4个,又更优选至少5个。
在本发明所述的方法和细胞中,细胞优选对选自以下群组的酶的表达或活性进行基因改造:N-乙酰葡萄糖胺-6-磷酸转移酶、磷酸酶、糖基转移酶、L-谷氨酰胺—D-果糖-6-磷酸转氨酶或UDP-葡萄糖4-表异构酶。根据本发明,包括N-乙酰葡萄糖胺-6-磷酸转移酶、磷酸酶、糖基转移酶、L-谷氨酰胺—D-果糖-6-磷酸转氨酶或UDP-葡萄糖4-表异构酶的上述列举的酶是经修饰的表达或活性的内源性蛋白质,优选地该内源性蛋白质为过度表达;或者上述组的酶是异源蛋白质,其可以由细胞进行异源表达。然后,异源表达的蛋白质被引入并表达,优选为过度表达。在另一个实施方案中,内源性蛋白质在细胞中可具有经修饰的表达,该细胞也表达异源蛋白质。异源表达可来自宿主的基因组或也可来自本文所述的引入细胞的载体。
包括N-乙酰葡萄糖胺-6-磷酸转移酶、磷酸酶、糖基转移酶、L-谷氨酰胺—D-果糖-6-磷酸转氨酶或UDP-葡萄糖4-表异构酶的上述列举的酶可以使用本领域已知的技术经由重组DNA技术产生的多核苷酸表达而产生。本领域技术人员已知的方法可用于构建含有本发明多肽的编码序列和适当的转录及/或转译控制讯号的表达载体。这些方法包括,例如体外重组DNA技术、合成技术及体内基因重组。例如,参照Sambrook et al.(2001)MolecularCloning:a laboratory manual,3rd Edition,Cold Spring Harbor Laboratory Press,CSH,New York or to Current Protocols in Molecular Biology,John Wiley andSons,N.Y.(1989and yearly updates)中描述的技术。
根据本发明的另一个方面,提供载体至细胞,该载体含有编码包括本文所述的N-乙酰葡萄糖胺-6-磷酸转移酶、磷酸酶、糖基转移酶、L-谷氨酰胺—D-果糖-6-磷酸转氨酶或UDP-葡萄糖4-表异构酶的如上所列的酶的多核苷酸,其中该多核苷酸与用该载体转形的细胞识别的控制序列可操作地连接。在一个特别优选的实施方案中,该载体为表达载体,根据本发明的另一个方面,该载体可以质体、黏接质体(cosmid)、噬菌体、脂质体或病毒的形式存在。因此,编码本发明的多肽的多核苷酸可例如包含在载体中,该载体被稳定转形/转染至细胞中。在该载体中,本文所述的多肽的编码序列受启动子控制。启动子可为例如诱导型启动子,以使基因/多核苷酸的表达可被特定地靶向,如果需要,基因可以此方式过度表达。该启动子也可为持续型启动子。可以使用大量的表达系统以产生本发明的多肽。此载体包括,特别是染色体、外显体(episomal)和病毒衍生的载体,例如,从细菌质体、噬菌体、转位子、酵母外显体、插入元件(insertion elements)、酵母染色体元件、病毒衍生的载体,以及从其组合衍生的载体,如从质体和噬菌体基因元件衍生的载体,如黏接质体和噬质体(phagemids)。这些载体可含有选择标记,例如但不限于抗生素标记、辅助性标记、毒素-抗毒素标记、RNA有义/反义标记。表达系统构建体可含有调节以及引起表达的控制区域。一般而言,任何适合维持、繁殖或表达多核苷酸及/或在宿主中表达多肽的系统或载体可用于此方面的表达。适当的DNA序列可以通过各种已知且常规技术中的任一插入至表达系统中,例如上述Sambrook等人提出的技术等。为了进行重组产生,可对细胞进行基因工程,以并入本发明的表达系统或其部分或多核苷酸。将多核苷酸引入细胞可通过许多标准实验室手册中描述的方法进行,如Davis et al.,Basic Methods in Molecular Biology,(1986)及上文的Sambrook等人,1989。
根据本发明的进一步方面,编码N-乙酰葡萄糖胺-6-磷酸转移酶、磷酸酶、糖基转移酶、L-谷氨酰胺—D-果糖-6-磷酸转氨酶或UDP-葡萄糖4-表异构酶的多核苷酸适用于各细胞或表达系统的密码子用法。
在另一实施方案,本文所用的细胞包括N-乙酰葡萄糖胺b-1,3-半乳糖基转移酶或N-乙酰葡萄糖胺b-1,4-半乳糖基转移酶。N-乙酰葡萄糖胺b-1,3-半乳糖基转移酶及N-乙酰葡萄糖胺b-1,4-半乳糖基转移酶为能够将来自UDP-半乳糖供给者的半乳糖单元以分别以β-1,3和β-1,4-依赖性糖苷键结方式转移至在GlcNAc接受者的糖基转移酶。
在另一优选实施方案中,本文所用的细胞,无论是否经基因改造,能够产生选自以下群组的核苷酸-糖:UDP-半乳糖(UDP-Gal)、UDP-N-乙酰葡萄糖胺(UDP-GlcNAc)、UDP-N-乙酰半乳糖胺(UDP-GalNAc)、UDP-N-乙酰甘露糖胺(UDP-ManNAc)、GDP-岩藻糖(GDP-Fuc)、GDP-甘露糖(GDP-Man)、UDP-葡萄糖(UDP-Glc)、UDP-2-乙酰胺基-2,6-双去氧--L阿拉伯-4-己酮糖、UDP-2-乙酰胺基-2,6-双去氧--L-来苏-4-己酮糖、UDP-N-乙酰基-L-鼠李糖胺(UDP-L-RhaNAc或UDP-2-乙酰胺基-2,6-双去氧-L-甘露糖)、dTDP-N-乙酰岩藻糖胺、UDP-N-乙酰岩藻糖胺(UDP-L-FucNAc或UDP-2-乙酰胺基-2,6-双去氧-L-半乳糖)、UDP-N-乙酰基-L-肺炎糖胺(UDP-L-PneNAC或UDP-2-乙酰胺基-2,6-双去氧-L-塔罗糖)、UDP-N-乙酰胞壁酸、UDP-N-乙酰基-L-奎诺糖胺(UDP-L-QuiNAc或UDP-2-乙酰胺基-2,6-双去氧-L-葡萄糖)、GDP-L-异鼠李糖、CMP-N-乙酰基神经氨酸(CMP-Neu5Ac)、CMP-N-乙醇酰神经氨酸(CMP-Neu5Gc)、CMP-Neu4Ac、CMP-Neu5Ac9N3、CMP-Neu4,5Ac2、CMP-Neu5,7Ac2、CMP-Neu5,9Ac2、CMP-Neu5,7(8,9)Ac2、UDP-葡萄糖醛酸盐、UDP-半乳糖醛酸盐、GDP-鼠李糖或UDP-木糖。在进一步实施方案中,细胞经基因改造以用于产生该核苷酸-糖。在另一优选实施方案中,细胞经基因改造以用于优化产生该核苷酸-糖。
在另一实施方案中,细胞能够产生UDP-半乳糖。在优化实施方案中,细胞经优化以用于UDP-半乳糖产生。在优化实施方案中,细胞在UDP-葡萄糖4-表异构酶GalE的表达或活性方面经修饰,该酶能够将UDP-葡萄糖转化为UDP-半乳糖。
在进一步实施方案中,由细胞合成的核苷酸-糖为UDP-半乳糖且糖基转移酶为N-乙酰葡萄糖胺b-1,3-半乳糖基转移酶或N-乙酰葡萄糖胺b-1,4-半乳糖基转移酶。
在优选实施方案中,细胞中产生的双糖为乳-N-双糖(Gal-b1,3-GlcNAc)或N-乙酰乳糖胺(Gal-b1,4-GlcNAc),其在非还原端含有半乳糖单元,该半乳糖单元分别以β-1,3-或β-1,4-依赖性糖苷键结的方式连接至存在于双糖还原端的GlcNAc部分。在另一优选实施方案中,细胞中产生的寡糖在还原端含有乳-N-双糖(Gal-b1,3-GlcNAc)或N-乙酰乳糖胺(Gal-b1,4-GlcNAc)。
在另一优选实施方案中,根据本发明的由细胞合成的双糖或寡糖(或本文所述的混合物)在还原端不包括几丁二糖(即,GlcNAc-b1,4-GlcNAc),更优选为不包括N-聚糖。换句而言,细胞经基因改造以用于产生在还原端具有N-乙酰葡萄糖胺(GlcNAc)单元的双糖或寡糖(或本文所述的混合物),其中该双糖或寡糖在还原端不包括几丁二糖,更优选为不包括N-聚糖。
在另一优选实施方案中,细胞中表达的N-乙酰葡萄糖胺b-1,3-半乳糖基转移酶1)具有PFAM域PF00535,并且(i)包括SEQ ID NO 01的序列[AGPS]XXLN(Xn)RXDXD,其中X是任何氨基酸,其中n为12至17、或(ii)包括SEQ ID NO 02的序列PXXLN(Xn)RXDXD(Xm)[FWY]XX[HKR]XX[NQST],其中X是任何氨基酸,其中n是12至17且m是100至115、或(iii)包括根据SEQID NO:03、04、05、06、07或08中的任一,优选为SEQ ID NO 03、04、05、06或07中的任一,更优选为SEQ ID NO 03、06或07中的任一,最优选为SEQ ID NO03或06中的任一的多肽序列、或(iv)为SEQ ID NO:03、04、05、06、07或08中的任一,优选为SEQ ID NO 03、04、05、06或07中的任一,更优选为SEQ ID NO 03、06或07中的任一,最优选为SEQ ID NO 03或06中的任一的功能性同源物、变体或衍生物,其具有与SEQ ID NO:03、04、05、06、07或08中的任一,优选为SEQ ID NO 03、04、05、06或07中的任一,更优选为SEQ ID NO 03、06或07中的任一,最优选为SEQ ID NO 03或06中的任一的该N-乙酰葡萄糖胺b-1,3-半乳糖基转移酶多肽全长的至少80%整体序列同一性且具有N-乙酰葡萄糖胺b-1,3-半乳糖基转移酶活性、或(v)包括来自SEQ ID NO:03、04、05、06、07或08中的任一,优选为SEQ ID NO03、04、05、06或07中的任一,更优选为SEQ ID NO 03、06或07中的任一,最优选为SEQ ID NO 03或06中的任一的至少8、9、10、11、12、13、14、15、16、17、18、19、20个连续氨基酸残基的寡肽序列,且具有N-乙酰葡萄糖胺b-1,3-半乳糖基转移酶活性、或(vi)为SEQ ID NO:03、04、05、06、07或08中的任一,优选为SEQ ID NO 03、04、05、06或07中的任一,更优选为SEQ ID NO 03、06或07中的任一,最优选为SEQ ID NO 03或06中的任一的功能片段,且具有N-乙酰葡萄糖胺b-1,3-半乳糖基转移酶活性、或(vii)包括多肽,该多肽包括或由具有与SEQ ID NO:03、04、05、06、07或08中的任一,优选为SEQ ID NO 03、04、05、06或07中的任一,更优选为SEQ ID NO 03、06或07中的任一,最优选为SEQ ID NO 03或06中的任一的全长氨基酸序列的至少80%序列同一性的氨基酸序列所组成,且具有N-乙酰葡萄糖胺b-1,3-半乳糖基转移酶活性,或2)具有PFAM域IPR002659,并且(i)包括SEQ ID NO 09的序列KT(Xn)[FY]XXKXDXD(Xm)[FHY]XXG(X,无A、G、S)(Xp)X(无F、H、W、Y)[DE]D[ILV]XX[AG],其中X是任何氨基酸,其中n是13至16,m是35至70,且p是20至45、或(ii)包括根据SEQ ID NO:10、11、12或13中的任一的多肽序列、或(iii)为SEQ ID NO:10、11、12或13中的任一的功能性同源物、变体或衍生物,其具有与SEQ ID NO:10、11、12或13的该N-乙酰葡萄糖胺b-1,3-半乳糖基转移酶多肽中的任一全长的至少80%整体序列同一性且具有N-乙酰葡萄糖胺b-1,3-半乳糖基转移酶活性、或(iv)包括来自SEQID NO:10、11、12或13中的任一的至少8、9、10、11、12、13、14、15、16、17、18、19、20个连续氨基酸残基的寡肽序列,且具有N-乙酰葡萄糖胺b-1,3-半乳糖基转移酶活性、或(v)为SEQ IDNO:10、11、12或13中的任一的功能片段,且具有N-乙酰葡萄糖胺b-1,3-半乳糖基转移酶活性、或(vi)包括多肽,该多肽包括或由具有与SEQ ID NO:10、11、12或13中的任一的全长氨基酸序列的至少80%序列同一性的氨基酸序列所组成,且具有N-乙酰葡萄糖胺b-1,3-半乳糖基转移酶活性。
在另一优选实施方案中,细胞中表达的N-乙酰葡萄糖胺b-1,4-半乳糖基转移酶1)具有PFAM域PF01755,并且(i)包括SEQ ID NO 14的序列EXXCXXSHXX[ILV][FWY](Xn)EDD(Xm)[ACGST]XXYX[ILMV],其中X是任何氨基酸,其中n为13至15且m是50至76、或(ii)包括根据SEQ ID NO:15、16、17、18、19、20、21、22或23中的任一,优选为SEQ ID NO:15、16、17、18、20或21中的任一,更优选为SEQ ID NO:17、18、20或21中的任一的多肽序列、或(iii)为SEQ IDNO:15、16、17、18、19、20、21、22或23中的任一,优选为SEQ ID NO:15、16、17、18、20或21中的任一,更优选为SEQ ID NO:17、18、20或21中的任一的功能性同源物、变体或衍生物,其具有与SEQ ID NO:15、16、17、18、19、20、21、22或23中的任一,优选为SEQ ID NO:15、16、17、18、20或21中的任一,更优选为SEQ ID NO:17、18、20或21中的任一的该N-乙酰葡萄糖胺b-1,4-半乳糖基转移酶多肽全长的至少80%整体序列同一性且具有N-乙酰葡萄糖胺b-1,4-半乳糖基转移酶活性、(vi)或包括来自SEQ ID NO:15、16、17、18、19、20、21、22或23中的任一,优选为SEQ ID NO:15、16、17、18、20或21中的任一,更优选为SEQ ID NO:17、18、20或21中的任一的至少8、9、10、11、12、13、14、15、16、17、18、19、20个连续氨基酸残基的寡肽序列,且N-乙酰葡萄糖胺b-1,4-半乳糖基转移酶活性、或(v)为SEQ ID NO:15、16、17、18、19、20、21、22或23中的任一,优选为SEQ ID NO:15、16、17、18、20或21中的任一,更优选为SEQ ID NO:17、18、20或21中的任一的功能片段,且具有具有N-乙酰葡萄糖胺b-1,4-半乳糖基转移酶活性、或(vi)包括多肽,该多肽包括或由具有与SEQ ID NO:15、16、17、18、19、20、21、22或23中的任一,优选为SEQ ID NO:15、16、17、18、20或21中的任一,更优选为SEQ ID NO:17、18、20或21中的任一的全长氨基酸序列的至少80%序列同一性的氨基酸序列所组成,且具有N-乙酰葡萄糖胺b-1,4-半乳糖基转移酶活性,或2)具有PFAM域PF00535,并且(i)包括SEQ ID NO24的序列R[KN]XXXXXXXGXXXX[FL]XDXD(Xn)[FHW]XXX[FHNY](Xm)E[DE],其中X是任何氨基酸,其中n是50至75,m是10至30、或(ii)包括SEQ ID NO 25的序列R[KN]XXXXXXXGXXXXFXDXD(Xn)[FHW]XXX[FHNY](Xm)E[DE](Xp)[FWY]XX[HKR]XX[NQST],其中X是任何氨基酸,其中n是50至75,m是10至30,且p是20至25、或(iii)包括根据SEQ ID NO:26、27或28中的任一的多肽序列、或(iv)为SEQ ID NO:58、59或60中的任一的功能性同源物、变体或衍生物,其具有与SEQ ID NO:26、27或28的该N-乙酰葡萄糖胺b-1,4-半乳糖基转移酶多肽中的任一全长的至少80%整体序列同一性且具有N-乙酰葡萄糖胺b-1,4-半乳糖基转移酶活性、或(v)包括来自SEQ ID NO:26、27或28中的任一的至少8、9、10、11、12、13、14、15、16、17、18、19、20个连续氨基酸残基的寡肽序列,且具有N-乙酰葡萄糖胺b-1,4-半乳糖基转移酶活性、或(vi)为SEQID NO:26、27或28中的任一的功能片段,且具有N-乙酰葡萄糖胺b-1,4-半乳糖基转移酶活性、或(vii)包括多肽,该多肽包括或由具有与SEQ ID NO:26、27或28中的任一的全长氨基酸序列的至少80%序列同一性的氨基酸序列所组成,且具有N-乙酰葡萄糖胺b-1,4-半乳糖基转移酶活性,或3)具有PFAM域PF02709且不具有PFAM域PF00535,并且(i)包括SEQ ID NO29的序列[FWY]XX[FY][FWY](X23)[FWY][GQ]X[DE]D,其中X是任何氨基酸、或(ii)包括SEQID NO 30的序列[PV]W[GHNP](Xn)[FWY][GQ]X[DE]D,其中X是任何氨基酸,其中n是21至24、或(iii)包括根据SEQ ID NO:31、32、33、34、35或36中的任一的多肽序列、或(iv)为SEQ IDNO:31、32、33、34、35或36中的任一的功能性同源物、变体或衍生物,其具有与SEQ ID NO:31、32、33、34、35或36的该N-乙酰葡萄糖胺b-1,4-半乳糖基转移酶多肽中的任一全长的至少80%整体序列同一性且具有N-乙酰葡萄糖胺b-1,4-半乳糖基转移酶活性、或(v)包括来自SEQ ID NO:31、32、33、34、35或36中的任一的至少8、9、10、11、12、13、14、15、16、17、18、19、20个连续氨基酸残基的寡肽序列,且具有N-乙酰葡萄糖胺b-1,4-半乳糖基转移酶活性、或(vi)为SEQ ID NO:31、32、33、34、35或36中的任一的功能片段,且具有N-乙酰葡萄糖胺b-1,4-半乳糖基转移酶活性、或(vii)包括多肽,该多肽包括或由具有与SEQ ID NO:31、32、33、34、35或36中的任一的全长氨基酸序列的至少80%序列同一性的氨基酸序列所组成,且具有N-乙酰葡萄糖胺b-1,4-半乳糖基转移酶活性,或4)具有PFAM域PF03808,并且(i)包括SEQ ID NO 37的序列[ST][FHY]XN(Xn)DG(X16)[HKR]X[ST]FDXX[ST]XA,其中X是任何氨基酸,且其中n是20至25、或(ii)包括SEQ ID NO 38的序列[ST][FHY]XN(Xn)DG(X16)[HKR]X[ST]FDXX[ST]XA(Xm)[HR]XG[FWY](Xp)GXGXXXQ[DE],其中X是任何氨基酸,其中n是20至25,m是40至50,且p是22至30、或(iii)包括根据SEQ ID NO:39、40或41中的任一的多肽序列、或(iv)为SEQ ID NO:39、40或41中的任一的功能性同源物、变体或衍生物,其具有与SEQ IDNO:39、40或41的该N-乙酰葡萄糖胺b-1,4-半乳糖基转移酶多肽中的任一全长的至少80%整体序列同一性且具有N-乙酰葡萄糖胺b-1,4-半乳糖基转移酶活性、或(v)包括来自SEQID NO:39、40或41中的任一的至少8、9、10、11、12、13、14、15、16、17、18、19、20个连续氨基酸残基的寡肽序列,且具有N-乙酰葡萄糖胺b-1,4-半乳糖基转移酶活性、或(vi)为SEQ IDNO:39、40或41中的任一的功能片段,且具有N-乙酰葡萄糖胺b-1,4-半乳糖基转移酶活性、或(vii)包括多肽,该多肽包括或由具有与SEQ ID NO:39、40或41中的任一的全长氨基酸序列的至少80%序列同一性的氨基酸序列所组成,且具有N-乙酰葡萄糖胺b-1,4-半乳糖基转移酶活性。
本文使用的PFAM模体,PF00535、IPR002659、PF01755、PF02709、PF03808是2020年6月11日发布的PFAM资料库Pfam 33.1版本中注释的蛋白质域。PF00535属于糖基转移酶2(GT2)家族,该家族包括将来自UDP-葡萄糖、UDP-N-乙酰基-半乳糖胺、GDP-甘露糖或CDP-阿比可糖(CDP-abequose)的糖转移到一系列接受者(包括纤维素、多萜醇磷酸(dolicholphosphate)及磷壁酸)的酶。
IPR002659属于糖基转移酶家族31(GH31),该家族包括具有许多已知活性的酶,包括N-乙酰乳糖胺β-1,3-N-乙酰基葡糖胺转移酶(N-acetyllactosaminide beta-1,3-N-acetylglucosaminyltransferase)(2.4.1.149)、β-1,3-半乳糖基转移酶(2.4.1),岩藻糖特异性β-1,3-N-乙酰基葡糖胺转移酶(2.4.1)、酰基鞘鞍醇三己糖β-1,3-GalNAc转移酶(globotriosylceramideβ-1,3-GalNAc transferase)(2.4.1.79)。PF01755属于糖基转移酶25(GT25)家族。此为参与脂多糖(LPS)的生物合成的糖基转移酶家族。这些酶在生物合成过程中催化各种糖类转移到生长中的LPS链上。PF02709是指Glyco_transf_7C家族。此为来自广泛的后生动物(Metazoa)的半乳糖基转移酶家族的N端域,其具有三种相关的半乳糖基转移酶活性,在某些情况下,这三种活性都是由一个序列所拥有:EC:2.4.1.90,N-乙酰乳糖胺合成酶、EC:2.4.1.38,β-N-乙酰基葡糖胺-糖肽β-1,4-半乳糖基转移酶,以及EC:2.4.1.22乳糖合成酶。PF03808是指糖基转移酶26(GT26)家族,该家族包括具有如β-N-乙酰基甘露糖胺糖醛酸基转移酶(β-N-acetyl mannosaminuronyltransferase)(EC 2.4.1.-)、β-N-乙酰-甘露糖胺基转移酶(β-N-acetyl-mannosaminyltransferase)(EC 2.4.1.-)、β-1,4-葡萄糖基转移酶(EC 2.4.1.-)和β-1,4-半乳糖基转移酶(EC 2.4.1.-)等活性的酶。
具有与该N-乙酰葡萄糖胺b-1,3-半乳糖基转移酶或该N-乙酰葡萄糖胺b-1,4-半乳糖基转移酶的各类指定的相同PFAM域和模体的蛋白质可以经由RegEx分析进行检索。
RegEx或称正规表示式(Regular Expression)特殊的字符序列,其使用模式中的专门语法,帮助配对或搜寻其他字串或字串集。许多程序都可用以进行RegEx检索。其中一个是Python模组“re”,其提供了对Python中正规表示式的全面支援。详细讯息,以及本领域技术人员已知的讯息可得自2019年4月6日发布的https://towardsdatascience.com/using-regular-expression-in-genetics-with-python-175e2b9395c2。用于所述发明的蛋白质的RegEx分析已经包括在本文的实施方案部分。
糖基转移酶家族是一个非常广泛的酶家族,能够催化以将糖部分从活化的供给者分子转移到特定的接受者分子,以形成糖苷键。已描述使用核苷酸二磷酸糖(nucleotidediphospho-sugar)、核苷酸单磷酸糖(nucleotide monophospho-sugar)和糖磷酸盐(sugarphosphates)及相关蛋白的糖基转移酶分类成基于序列的不同家族(Campbell et al.,Biochem.J.326,929-939(1997)),并可得自CAZy(CArbohydrat-Active EnZymes)网站(www.cazy.org)。
在另一优选实施方案中,该N-乙酰葡萄糖胺-6-磷酸转移酶由异源核酸编码。换句而言,该N-乙酰葡萄糖胺-6-磷酸转移酶在该细胞中异源地表达。在另一优选实施方案中,该N-乙酰葡萄糖胺-6-磷酸转移酶(i)包括,优选为来自啤酒酵母菌的具有UniProt IDP43577的多肽序列,或(ii)为具有UniProt ID P43577的多肽的功能性同源物、变体或衍生物,其具有与UniProt ID P43577的多肽全长的至少80%整体序列同一性且具有N-乙酰葡萄糖胺-6-磷酸转移酶活性、或(iii)为具有UniProt ID P43577的多肽的功能片段,并具有N-乙酰葡萄糖胺-6-磷酸转移酶的活性、或(iv)包括或由氨基酸序列组成的多肽,该氨基酸序列具有与UniProt ID P43577的多肽全长氨基酸序列的至少80%的序列同一性,并具有N-乙酰葡萄糖胺-6-磷酸转移酶活性。在另一优选实施方案中,该L-谷氨酰胺—D-果糖-6-磷酸转氨酶(i)包括,优选为来自大肠杆菌的UniProt ID P17169的多肽序列、或(ii)为具有UniProt ID P17169的多肽的功能性同源物、变体或衍生物,其具有与UniProt IDP17169的多肽全长的至少80%整体序列同一性,且具有L-谷氨酰胺—D-果糖-6-磷酸转氨酶活性、或(iii)为具有UniProt ID P17169的多肽的功能片段,且具有L-谷氨酰胺—D-果糖-6-磷酸转氨酶活性、或(iv)包括或由氨基酸序列组成的多肽,该氨基酸序列具有与UniProt ID P17169的多肽全长氨基酸序列的至少80%的序列同一性,并具有L-谷氨酰胺—D-果糖-6-磷酸转氨酶活性。在替代性优选实施方案中,该L-谷氨酰胺—D-果糖-6-磷酸转氨酶(i)包括,优选为与UniProt ID P17169的野生型大肠杆菌蛋白不同之处在于具有A39T、R250C和G472S突变,如Deng等人所述(Biochimie 88,419-29(2006))的多肽序列、或(ii)为该突变多肽(与UniProt ID P17169的野生型大肠杆菌蛋白不同之处在于具有A39T、R250C和G472S突变)的功能性同源物、变体或衍生物,其具有与该突变多肽(与UniProt IDP17169的野生型大肠杆菌蛋白不同之处在于具有A39T、R250C和G472S突变)全长的至少80%整体序列同一性,并具有L-谷氨酰胺—D-果糖-6-磷酸转氨酶活性、或(iii)为该突变多肽(与UniProt ID P17169的野生型大肠杆菌蛋白不同之处在于具有A39T、R250C和G472S突变)的功能片段,并具有L-谷氨酰胺—D-果糖-6-磷酸转氨酶活性、或(iv)包括或由氨基酸序列组成的多肽,该氨基酸序列具有与该突变多肽(与UniProt ID P17169的野生型大肠杆菌蛋白不同之处在于具有A39T、R250C和G472S突变)全长氨基酸序列的至少80%的序列同一性,并具有L-谷氨酰胺—D-果糖-6-磷酸转氨酶活性。
整体序列同一性是使用全局比对演算法(global alignment algorithm)确定,例如程式GAP(GCG Wisconsin Package,Accelrys)中的Needleman Wunsch演算法,优选使用预设参数,且优选使用成熟蛋白质的序列(即,不考虑分泌讯号或转运肽)。与整体序列同一性相比,当只考虑保守域或模体时,序列同一性通常会更高。
与SEQ ID NO:03、04、05、06、07、08、10、11、12、13、15、16、17、18、19、20、21、22、23、26、27、28、31、32、33、34、35、36、39、40或41的多肽、或者UniProt ID P43577或P17169、或者与UniProt ID P17169不同的A39T、R250C和G472S突变的该突变多肽中的任一全长的至少80%整体序列同一性应理解分别为与SEQ ID NO:03、04、05、06、07、08、10、11、12、13、15、16、17、18、19、20、21、22、23、26、27、28、31、32、33、34、35、36、39、40或41的多肽、或者UniProt ID P43577或P17169、或者与UniProt ID P17169不同的A39T、R250C和G472S突变的该突变多肽中的任一的至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%整体序列同一性,如本文所述。来自SEQ ID NO:03、04、05、06、07、08、10、11、12、13、15、16、17、18、19、20、21、22、23、26、27、28、31、32、33、34、35、36、39、40或41的多肽、或者UniProt ID P43577或P17169、或者与UniProt ID P17169不同的A39T、R250C和G472S突变的该突变多肽中的任一的至少8、9、10、11、12、13、14、15、16、17、18、19、20个连续氨基酸残基的寡肽序列应理解分别为连续氨基酸残基的至少8、9、10、11、12、13、14、15、16、17、18、19个氨基酸残基总数以内的寡肽序列中的任一,该连续氨基酸残基来自SEQ ID NO:03、04、05、06、07、08、10、11、12、13、15、16、17、18、19、20、21、22、23、26、27、28、31、32、33、34、35、36、39、40或41的多肽、或者UniProt IDP43577或P17169、或者与UniProt ID P17169不同的A39T、R250C和G472S突变的该突变多肽中的任一,优选其中该寡肽不与PFAM域完全重迭(如果存在),更优选其中该寡肽不与PFAM域重迭(如果存在)。
在本发明的方法及/或细胞的优选实施方案中,该细胞能够分解代谢选自包括以下列表的碳源:葡萄糖、果糖、半乳糖、乳糖、蔗糖、麦芽糖、麦芽-寡糖(malto-oligosaccharides)、麦芽三糖(maltotriose)、山梨醇、木糖、鼠李糖、甘露糖、甲醇、乙醇、阿拉伯糖、海藻糖(trehalose)、淀粉、纤维素、半纤维素、糖蜜(molasses)、玉米浸液(corn-steep liquor)、高果糖浆、甘油、乙酸盐、柠檬酸盐、乳酸、丙酮酸。
在本发明的方法及/或细胞的优选实施方案中,细胞在糖化反应中使用乳糖以产生寡糖,优选为本文所述的基于乳糖的MMO。乳糖可以由细胞产生(例如,通过细胞的代谢及/或如本领域技术人员所知的为此目的对细胞进行代谢工程后产生),优选在细胞内产生,或者可添加到细胞中,该细胞可以通过被动或主动运输引入该乳糖。由细胞产生乳糖可通过N-乙酰葡萄糖胺β-1,4-半乳糖基转移酶和UDP-葡萄糖4-表异构酶的表达而获得。更优选地,该细胞被修饰以促进乳糖产生。该修饰可为选自包括过度表达N-乙酰葡萄糖胺β-1,4-半乳糖基转移酶、过度表达UDP-葡萄糖4-表异构酶的群组的一或多种。
在本发明的方法及/或细胞的优选实施方案中,在糖化反应中使用乳糖作为接受者的细胞优选具有从培养物中摄取乳糖的转运体。更优选地,该细胞为摄取乳糖而进行优化。该优化可以是过度表达乳糖转运体,如大肠杆菌或乳酸克鲁维酵母(Kluyveromyceslactis)的乳糖通透酶。优选地,细胞持续表达乳糖通透酶。乳糖可以在培养开始时添加,也可以在培养的生长阶段形成足够的生质后立即添加,亦即,通过向培养物中添加乳糖而起始的基于乳糖的MMO产生阶段是与生长阶段分开(decoupled)。在优选实施方案中,乳糖是在开始及/或在培养过程中添加的,亦即,生长阶段和产生阶段没有分开。
在根据本发明的方法及/或细胞的优选实施方案中,当细胞在乳糖与一或多种其他碳源结合的环境中生长时,细胞抵抗乳糖杀伤现象。用与“乳糖杀伤(lactose killing)”是指细胞在乳糖与其他碳源一起存在的培养基中的生长受阻。在优选实施方案中,细胞经基因改造,使其保留至少50%的乳糖流入而不发生乳糖杀伤,即使在高乳糖浓度下也是如此,如WO 2016/075243所述。该基因修饰包括通过不导致乳糖杀伤表型的异源启动子表达及/或过度表达外源及/或内源乳糖转运体基因及/或修饰乳糖转运体的密码子用法,以产生不导致乳糖杀伤表型的该乳糖转运体的改变表达。WO 2016/075243的内容于此方面并入作为参照。
在本发明的进一步实施方案中,果糖-6-磷酸盐是L-谷氨酰胺—D-果糖-6-磷酸转氨酶的基质,该L-谷氨酰胺—D-果糖-6-磷酸转氨酶在细胞中表达且能够将果糖-6-磷酸盐转换为葡萄糖胺-6-磷酸盐,作为合成GlcNAc的前驱物。葡萄糖胺-6-磷酸盐是N-乙酰葡萄糖胺-6-磷酸转移酶的基质,该N-乙酰葡萄糖胺-6-磷酸转移酶在细胞内表达,能够将葡萄糖胺-6-磷酸盐转换为N-乙酰葡萄糖胺-6-磷酸盐。N-乙酰葡萄糖胺-6-磷酸盐是磷酸酶的基质,该磷酸酶在细胞中表达,能够将N-乙酰葡萄糖胺-6-磷酸盐去磷酸化以合成单糖GlcNAc。
在另一优选实施方案中,该细胞无法将N-乙酰葡萄糖胺-6-磷酸盐转换成葡萄糖胺-6-磷酸盐,及/或无法将葡萄糖胺-6-磷酸盐转换成果糖-6-磷酸盐。在细胞中,N-乙酰葡萄糖胺-6-磷酸盐可通过N-乙酰葡萄糖胺-6-磷酸盐去乙酰酶(如nagA)的活性转换成葡萄糖胺-6-磷酸盐,且葡萄糖胺-6-磷酸盐可通过葡萄糖胺-6-磷酸盐脱胺酶(如nagB)的活性转换成果糖-6-磷酸盐。如此的N-乙酰葡萄糖胺-6-磷酸盐去乙酰酶及/或葡萄糖胺-6-磷酸盐脱胺酶可通过本领域技术人员已知的方法使编码编码序列的对应多核苷酸的突变诱发或部分或完全缺失、或控制对应编码多核苷酸表达的启动子序列的突变诱发而获得减少的表达或减少的活性或被去活性。
在一实施方案中,细胞能够合成核苷酸-糖GDP-岩藻糖。GDP-岩藻糖可通过在细胞中表达的酶或通过细胞的代谢而提供。此合成GDP-岩藻糖的细胞可表达将例如添加至细胞的岩藻糖转换成GDP-岩藻糖的酶。此酶可例如为双官能岩藻糖激酶/岩藻糖-1-磷酸盐鸟苷酸转移酶(guanylyltransferase),如来自脆弱拟杆菌(Bacteroides fragilis)的Fkp、或一种独立的岩藻糖激酶与一种独立的岩藻糖-1-磷酸盐鸟苷酸转移酶的组合,其该些酶已知来自包括智人(Homo sapiens)、猪(Sus scrofa)及褐鼠(Rattus norvegicus)的几个物种。
优选地,该细胞经修饰以产生GDP-岩藻糖。
更优选地,该细胞经修饰以促进GDP-岩藻糖产生。该修饰可选择自包括UDP-葡萄糖:十一异戊二烯(undecaprenyl)-磷酸葡萄糖-1-磷酸转移酶编码基因的剃除(knock-out)、GDP-L-岩藻糖合成酶编码基因的过度表达、GDP-甘露糖4,6-脱水酶编码基因的过度表达、甘露糖-1-磷酸盐鸟苷酸转移酶编码基因的过度表达、磷酸甘露糖变位酶(phosphomannomutase)编码基因的过度表达、以及甘露糖-6-磷酸盐异构酶编码基因的过度表达的群组中的一或多种。
在一实施方案中,该细胞能够合成核苷酸-糖UDP-半乳糖。UDP-半乳糖可通过在细胞中表达的酶或通过细胞的代谢而提供。优选地,该细胞经修饰以合成UDP-半乳糖。更优选地,该细胞经修饰以促进UDP-半乳糖产生。该修饰可选择自包括5'-核苷酸酶/UDP-糖水解酶(5'-nucleotidase/UDP-sugar hydrolase)编码基因的剃除、半乳糖-1-磷酸盐尿苷酰转移酶(galactose-1-phosphate uridylyltransferase)编码基因的剃除以及UDP-半乳糖4-表异构酶(如,galE)的过度表达的群组中的一或多种。
在一实施方案中,该细胞能够合成核苷酸-糖CMP-N-乙酰基神经氨酸(CMP-唾液酸)。CMP-N-乙酰基神经氨酸可通过在细胞中表达的酶或通过细胞的代谢而提供。优选地,该细胞经修饰以合成CMP-N-乙酰基神经氨酸。更优选地,该细胞经修饰以促进CMP-N-乙酰基神经氨酸产生。该修饰可选择自CMP-唾液酸合成酶编码基因的过度表达、唾液酸(sialate)合成酶编码基因的过度表达、以及N-乙酰基-D-葡萄糖胺2-表异构酶编码基因的过度表达的群组中的一或多种。
CMP-N-乙酰基神经氨酸的合成使用GlcNAc,但如本文所述的细胞中的GlcNAc用于还原端具有GlcNAc单元的双糖或寡糖的合成。因此,细胞中CMP-N-乙酰基神经氨酸的产生可能会降低可用于产生感兴趣的生物产品的GlcNAc,亦即,在还原端具有GlcNAc单元的双糖或寡糖。CMP-N-乙酰基神经氨酸和GlcNAc的产生需要彼此仔细优化,以确保CMP-N-乙酰基神经氨酸和GlcNAc两者的高水平。优化可能包括有效平衡和微调参与CMP-N-乙酰基神经氨酸和GlcNAc两者合成的多肽的表达水平。
在另一优选实施方案中,细胞表达至少一种其他糖基转移酶,以将合成的N-乙酰葡萄糖胺单糖糖化而形成如本文所述的在还原端具有GlcNAc的寡糖。优选地,表达至少一种糖基转移酶,以将该GlcNAc单糖糖化而形成双糖或寡糖。更优选地,该细胞表达至少二种、又更优选至少三种、又更优选至少四种糖基转移酶,最优选为表达至少五种糖基转移酶,以将该GlcNAc单糖糖化而形成根据本发明的双糖或寡糖。该糖基转移酶可选自包括但不限于以下的列举:α-1,2-岩藻糖基转移酶、α-1,3/1,4-岩藻糖基转移酶、α-1,6-岩藻糖基转移酶、α-2,3-唾液酸转移酶、α-2,6-唾液酸转移酶、α-2,8-唾液酸转移酶、β-1,3-半乳糖基转移酶、β-1,4-半乳糖基转移酶、α-1,3-半乳糖基转移酶、α-1,4-半乳糖基转移酶、N-乙酰基葡糖胺转移酶、N-乙酰基半乳糖胺转移酶、葡萄糖基转移酶、甘露糖基转移酶、N-乙酰基甘露糖胺转移酶、木糖基转移酶、葡萄糖醛酸苷转移酶、半乳糖醛酸转移酶、葡萄糖胺转移酶、N-乙醇酰神经胺转移酶。在优选实施方案中,该糖基转移酶为具有经修饰的表达或活性的细胞内源性蛋白质,优选地,该内源性糖基转移酶是过度表达;或者该糖基转移酶是异源性蛋白质,其异源地引入至该细胞并在该细胞中表达,优选为过度表达。该内源性糖基转移酶可在细胞中具有经修饰的表达,其也表达异源性糖基转移酶。如此合成的寡糖可为线性类型或分支类型并且可包含多个单糖建构区块(monosaccharide building blocks),如本文所述的定义中所解释。
通过在如本文所述的相同细胞中组合不同的活性糖基转移酶,产生GlcNAc和包含UDP-半乳糖(UDP-Gal)的核苷酸-活性糖,其包括UDP-半乳糖(UDP-Gal)、UDP-N-乙酰葡萄糖胺(UDP-GlcNAc)、UDP-N-乙酰半乳糖胺(UDP-GalNAc)、UDP-N-乙酰甘露糖胺(UDP-ManNAc)、GDP-岩藻糖(GDP-Fuc)、GDP-甘露糖(GDP-Man)、UDP-葡萄糖(UDP-Glc)、UDP-2-乙酰胺基-2,6-双去氧--L阿拉伯-4-己酮糖、UDP-2-乙酰胺基-2,6-双去氧--L-来苏-4-己酮糖、UDP-N-乙酰基-L-鼠李糖胺(UDP-L-RhaNAc或UDP-2-乙酰胺基-2,6-双去氧-L-甘露糖)、dTDP-N-乙酰岩藻糖胺、UDP-N-乙酰岩藻糖胺(UDP-L-FucNAc或UDP-2-乙酰胺基-2,6-双去氧-L-半乳糖)、UDP-N-乙酰基-L-肺炎糖胺(UDP-L-PneNAC或UDP-2-乙酰胺基-2,6-双去氧-L-塔罗糖)、UDP-N-乙酰胞壁酸、UDP-N-乙酰基-L-奎诺糖胺(UDP-L-QuiNAc或UDP-2-乙酰胺基-2,6-双去氧-L-葡萄糖)、GDP-L-异鼠李糖、CMP-N-乙酰基神经氨酸(CMP-Neu5Ac)、CMP-N-乙醇酰神经氨酸(CMP-Neu5Gc)、CMP-Neu4Ac、CMP-Neu5Ac9N3、CMP-Neu4,5Ac2、CMP-Neu5,7Ac2、CMP-Neu5,9Ac2、CMP-Neu5,7(8,9)Ac2、UDP-葡萄糖醛酸盐、UDP-半乳糖醛酸盐、GDP-鼠李糖或UDP-木糖,该细胞能够产生根据通式1的还原端具有GlcNAc单元的双糖或寡糖:
Figure BDA0004113293730000521
如本文所述的寡糖可以线性或分支结构形成,其包含α-和β-糖苷键两者或可仅包含β-糖苷键,其中B为N-乙酰葡萄糖胺,且其中A、V、W、X、Y及/或Z不存在,或为半乳糖、葡萄糖、岩藻糖、甘露糖、木糖、葡萄糖醛酸、半乳糖醛酸、艾杜糖醛酸、N-乙酰基神经氨酸、N-乙醇酰神经氨酸、葡萄糖胺、N-乙酰半乳糖胺、N-乙酰甘露糖胺、N-乙酰葡萄糖胺及/或由通式2定义的寡糖结构:
Figure BDA0004113293730000522
其中B为N-乙酰葡萄糖胺,其中A、V、W、X、Y及/或Z不存在,或为半乳糖、葡萄糖、岩藻糖、甘露糖、木糖、葡萄糖醛酸、半乳糖醛酸、艾杜糖醛酸、N-乙酰基神经氨酸、N-乙醇酰神经氨酸、葡萄糖胺、N-乙酰半乳糖胺、N-乙酰甘露糖胺或N-乙酰葡萄糖胺,且在通式1及通式2中,m是3且可选地v是4,或者m是4且可选地v是3,并且其中p是3及/或4,且其中w是6,并且其中如果n>1且p是3,x是3且X不是单糖,并且其中如果n>1且p为4,y是4且Y不是单糖,并且其中z是6,且其中n从1至10。
在优选实施方案中,如本文所述的细胞在该其他糖基转移酶的表达或活性方面被修饰。
在另一优选实施方案中,如本文所述的方法及由本文所述的细胞所产生的还原端具有GlcNAc单元的寡糖选择自包括以下的列举:2-岩藻糖基乳-N-双糖、4-岩藻糖基乳-N-双糖、2-4-二岩藻糖基乳-N-双糖、3’-唾液酸乳-N-双糖、6’-唾液酸乳-N-双糖、3’,6’-二唾液酸乳-N-双糖、6,6’-二唾液酸乳-N-双糖、2’-岩藻糖基-3’-唾液酸乳-N-双糖、2’-岩藻糖基-6’-唾液酸乳-N-双糖、4-岩藻糖基-3'-唾液酸乳-N-双糖、4-岩藻糖基-6’-唾液酸乳-N-双糖、2-岩藻糖基N-乙酰乳糖胺、3’-岩藻糖基N-乙酰乳糖胺、2,3’-二岩藻糖基N-乙酰乳糖胺、3’-唾液酸N-乙酰乳糖胺、6’-唾液酸N-乙酰乳糖胺、3’,6’-二唾液酸N-乙酰乳糖胺、6,6’-二唾液酸N-乙酰乳糖胺、2’-岩藻糖基-3’-唾液酸N-乙酰乳糖胺、2’-岩藻糖基-6’-唾液酸N-乙酰乳糖胺、3-岩藻糖基-3'-唾液酸N-乙酰乳糖胺、3’-岩藻糖基-6’-唾液酸N-乙酰乳糖胺、P1三糖(P1 trisaccharide)(Gal-a1,4-Gal-b1,4-GlcNAc)、异源移植抗原决定位(xenotransplantation epitope)(Gal-a1,3-Gal-b1,4-GlcNAc)、Gal-b14-(Galb13)-GlcNAc、聚-N-乙酰乳糖胺、GalNAc-b1,3-Gal-b1,4-GlcNAc。
在根据本发明的方法及/或细胞的优选实施方案中,细胞表达膜转运蛋白或具有转运活性的多肽,以转运化合物穿过细胞壁的外膜。在本发明的方法及/或细胞的更优选实施方案中,细胞在该膜转运蛋白或具有转运活性的多肽的表达或活性方面被修饰。该膜转运蛋白或具有转运活性的多肽为具有经修饰的表达或活性的细胞内源性蛋白质,优选为该内源性膜转运蛋白或具有转运活性的多肽为过度表达;或者,该膜转运蛋白或具有转运活性的多肽为异源性蛋白质,其异源地引入该细胞并在该细胞中表达,优选为过度表达。该内源性膜转运蛋白或具有转运活性的多肽可在细胞中具有修饰的表达,该细胞也表达异源性膜转运蛋白或具有转运活性的多肽。
在本发明的方法及/或细胞的更优选实施方案中,膜转运蛋白或具有转运活性的多肽选自包括以下的列举:运输蛋白、P-P-键-水解-驱动的转运体、β-桶状孔蛋白、辅助转运蛋白、推定转运蛋白及磷酸转移-驱动组转位蛋白。在本发明的方法及/或细胞的又更优选实施方案中,运输蛋白包括MFS转运体、糖排出转运体及螯铁蛋白输出体。在本发明的方法及/或细胞的另一更优选实施方案中,P-P-键-水解-驱动的转运体包括ABC转运体及螯铁蛋白输出体。
在本发明的方法及/或细胞的另一优选实施方案中,膜转运蛋白或具有转运活性的多肽控制该还原端具有GlcNAc单元的双糖或寡糖在细胞壁外膜上的流动。在本发明的方法及/或细胞的替代及/或另外优选实施方案中,膜转运蛋白或具有转运活性的多肽控制该还原端具有GlcNAc单元的双糖及寡糖在细胞壁外膜上的流动。在本发明的方法及/或细胞的替代及/或另外优选实施方案中,膜转运蛋白或具有转运活性的多肽控制该一或多种基于乳糖的MMO在细胞壁外膜上的流动。
在本发明的方法及/或细胞的替代及/或另外优选实施方案中,膜转运蛋白或具有转运活性的多肽控制一或多种前驱物在细胞壁外膜上的流动,该前驱物用于产生该还原端具有GlcNAc单元的双糖或寡糖在本发明的方法及/或细胞的替代及/或另外优选实施方案中,膜转运蛋白或具有转运活性的多肽控制一或多种前驱物在细胞壁外膜上的流动,该前驱物用于产生该还原端具有GlcNAc单元的双糖及寡糖。在本发明的方法及/或细胞的替代及/或另外优选实施方案中,膜转运蛋白或具有转运活性的多肽控制一或多种前驱物在细胞壁外膜上的流动,该前驱物用于产生一或多种基于乳糖的MMO。
在本发明的方法及/或细胞的替代及/或另外优选实施方案中,膜转运蛋白或具有转运活性的多肽控制一或多种接受者在细胞壁外膜上的流动,该接受者用于产生该还原端具有GlcNAc单元的双糖或寡糖。在本发明的方法及/或细胞的替代及/或另外优选实施方案中,膜转运蛋白或具有转运活性的多肽控制一或多种接受者在细胞壁外膜上的流动,该接受者用于产生该还原端具有GlcNAc单元的双糖及寡糖。在本发明的方法及/或细胞的替代及/或另外优选实施方案中,膜转运蛋白或具有转运活性的多肽控制一或多种接受者在细胞壁外膜上的流动,该接受者用于产生该一或多种基于乳糖的MMO。
在本发明的方法及/或细胞的另一优选实施方案中,膜转运蛋白或具有转运活性的多肽提供该还原端具有GlcNAc单元的双糖或寡糖的改善产生。在本发明的方法及/或细胞的另一优选实施方案中,膜转运蛋白或具有转运活性的多肽提供该还原端具有GlcNAc单元的双糖及寡糖的改善产生。在本发明的方法及/或细胞的另一优选实施方案中,膜转运蛋白或具有转运活性的多肽提供该一或多种基于乳糖的MMO的改善产生。
在本发明的方法及/或细胞的替代及/或另外优选实施方案中,膜转运蛋白或具有转运活性的多肽提供允许该还原端具有GlcNAc残基的双糖或寡糖的流出。在本发明的方法及/或细胞的替代及/或另外优选实施方案中,膜转运蛋白或具有转运活性的多肽提供允许该还原端具有GlcNAc残基的双糖及寡糖的流出。在本发明的方法及/或细胞的替代及/或另外优选实施方案中,膜转运蛋白或具有转运活性的多肽提供允许该一或多种基于乳糖的MMO的流出。
在本发明的方法及/或细胞的替代及/或另外优选实施方案中,膜转运蛋白或具有转运活性的多肽提供促进该还原端具有GlcNAc残基的双糖或寡糖的流出。在本发明的方法及/或细胞的替代及/或另外优选实施方案中,膜转运蛋白或具有转运活性的多肽提供促进该还原端具有GlcNAc残基的双糖及寡糖的流出。在本发明的方法及/或细胞的替代及/或另外优选实施方案中,膜转运蛋白或具有转运活性的多肽提供促进该一或多种基于乳糖的MMO的流出。
在本发明的方法及/或细胞的另一优选实施方案中,细胞表达选自包括乳糖转运体的群组的多肽,例如LacY或lac12通透酶、葡萄糖转运体、半乳糖转运体、岩藻糖转运体、核苷酸活性糖的转运体,例如UDP-Gal、UDP-GlcNAc、GDP-Fuc或CMP-唾液酸的转运体。如此,该转运体将内化经添加前驱物及/或接受者的培养基,以用于合成在还原端具有GlcNAc单元的双糖或寡糖及/或基于乳糖的MMO。
在本发明的方法及/或细胞的更优选实施方案中,细胞表达属于MFS转运体家族的膜转运蛋白,例如来自包括大肠杆菌(UniProt ID P0AEY8)、阪崎肠杆菌(Cronobactermuytjensii)(UniProt ID A0A2T7ANQ9)、杨氏柠檬酸杆菌(Citrobacter youngae)(UniProt ID D4BC23)和肺炎克雷伯氏菌(Yokenella regensburgei)(UniProt IDG9Z5F4)物种的多药转运体MdfA家族的MdfA多肽。在本发明的方法及/或细胞的另一更优选实施方案中,细胞表达属于糖排出转运体家族的膜转运蛋白,例如来自包含大肠杆菌(UniProt ID P31675)、科氏柠檬酸杆菌(Citrobacter koseri)(UniProt ID A0A078LM16)和克雷伯氏菌肺炎菌(Klebsiella pneumoniae)(UniProt ID A0A0C4MGS7)的物种的SetA家族的SetA多肽。在本发明的方法及/或细胞的另一更优选实施方案中,细胞表达属于螯铁蛋白输出体家族的膜转运蛋白,例如大肠杆菌entS(UniProt ID P24077)和大肠杆菌iceT(UniProt ID A0A024L207)。在本发明的方法及/或细胞的另一更优选实施方案中,细胞表达属于ABC转运体家族的膜转运蛋白,例如来自大肠杆菌的oppF(UniProt ID P77737)、来自乳酸乳球菌乳酸亚种双乙酰生物突变株(Lactococcus lactis subsp.lactisbv.Diacetylactis)(UniProt ID A0A1V0NEL4)的lmrA以及来自双叉乳杆菌婴儿亚种(Bifidobacterium longum subsp.Infantis)(UniProt ID B7GPD4)的Blon_2475。
根据本发明的方法及/或细胞的另一实施方案,细胞能够产生磷酸烯醇丙酮酸(PEP)。根据本发明的方法及/或细胞的另一实施方案,细胞包含还原端具有N-乙酰葡萄糖胺单元的双糖或寡糖的产生途径,其包括PEP的产生途径。在本发明的方法及/或细胞的优选实施方案中,与未修饰的先驱细胞(progenitor)相比,该细胞被修饰以促进PEP的产生及/或供应。
在另一优选实施方案中,细胞包含还原端具有N-乙酰葡萄糖胺单元的双糖或寡糖的产生途径,其包括与未修饰的先驱细胞相比,用于促进PEP的产生及/或供应的任一或多个修饰。
在优选实施方案中且作为促进PEP产生及/或供应的手段,一或多个PEP依赖性的糖转运磷酸转移酶系统被破坏,例如但不限于:1)N-乙酰基-D-葡糖胺Npi-磷酸转移酶(EC2.7.1.193),例如由大肠杆菌或芽孢杆菌中的nagE基因(或簇nagABCD)编码、2)编码酶llMan复合物(甘露糖PTS通透酶、蛋白质-Npi-磷酸组氨酸-D-甘露糖磷酸转移酶)的ManXYZ导入外源己糖(甘露糖、葡萄糖、葡萄糖胺、果糖、2-脱氧葡萄糖、甘露糖胺、N-乙酰葡萄糖胺等)并将磷酸酯释放到细胞质中、3)葡萄糖特异性PTS转运体(例如由PtsG/Crr编码),其吸收葡萄糖并在细胞质中形成葡萄糖-6-磷酸盐、4)蔗糖特异性PTS转运体,其吸收蔗糖并在细胞质中形成蔗糖-6-磷酸盐、5)果糖特异性PTS转运体(例如由基因fruA和fruB和激酶fruK编码,其吸收果糖并在第一步中形成果糖-1-磷酸盐且在第二步中形成果糖1,6-二磷酸盐、6)乳糖PTS转运体(例如,由干酪乳杆菌(Lactococcus casei)中的lacE编码),其吸收乳糖并形成乳糖-6-磷酸盐、7)半乳糖醇特异性PTS酶,其吸收半乳糖醇及/或山梨醇并分别形成半乳糖醇-1-磷酸盐或山梨醇-6-磷酸盐、8)甘露醇特异性PTS酶,其吸收甘露醇及/或山梨醇并分别形成甘露醇-1-磷酸盐或山梨醇-6-磷酸盐、以及9)海藻糖特异性PTS酶,其吸收海藻糖并形成海藻糖-6-磷酸盐。
在另一及/或另外优选实施方案且作为促进PEP产生及/或供应的手段,通过破坏PtsIH/Crr基因簇而破坏PTS系统整体。PtsI(酶I)是细胞质蛋白,其可作为大肠杆菌K-12的磷酸烯醇丙酮酸:糖磷酸转移酶系统(PTSsugar)的门户。PtsI是PTSsugar的两种(PtsI和PtsH)糖非特异性蛋白质建构之一,其与糖特异性内膜通透酶一起影响磷酸转移级联(phosphotransfer cascade),导致多种碳水化合物基质的耦合磷酸化及转运。HPr(含组氨酸蛋白质)是PTSsugar的两种糖非特异性蛋白质建构之一。其接受来自磷酸化酶I(PtsI-P)的磷酰基,接着将其转移到PTSsugar的许多糖特异性酶(统称为酶II)中的任一种的EIIA域。Crr或EIIAGlc在需要PtsH和PtsI的反应中通过PEP磷酸化。
在另一及/或另外优选实施方案,通过引入及/或过度表达对应的通透酶,进一步修饰细胞以补偿碳源的PTS系统缺失。这些是例如通透酶或ABC转运体,其包括但不限于特异性输入乳糖(例如由大肠杆菌的LacY基因编码的转运体等)、蔗糖(例如由来自大肠杆菌的cscB基因编码的转运体等)、葡萄糖(例如由来自大肠杆菌的galP基因编码的转运体等)、果糖(例如由变异链球菌(Streptococcus mutans)的fruI基因编码的转运体等)、或山梨醇/甘露醇ABC转运蛋白(例如由类红球杆菌(Rhodobacter sphaeroides)的SmoEFGK簇编码的转运体等)、海藻糖/蔗糖/麦芽糖转运体(例如由苜蓿中华根瘤菌(Sinorhizobiummeliloti)的基因簇ThuEFGK编码的转运转运体等)、和N-乙酰葡萄糖胺/半乳糖/葡萄糖转运体(例如由奥奈达希瓦氏菌(Shewanella oneidensis)的NagP编码的转运体)的转运体。PTS缺失与替代转运体过度表达的组合的例子是:1)葡萄糖PTS系统(例如,ptsG基因)的缺失结合葡萄糖通透酶(例如,glcP的galP)的引入及/或过度表达、2)果糖PTS系统(例如,一或多个fruB、fruA、fruK基因)的缺失结合果糖通透酶(例如,fruI)的引入及/或过度表达、3)乳糖PTS系统的缺失结合乳糖通透酶(例如,LacY)的引入及/或过度表达、及/或4)蔗糖PTS系统的缺失结合蔗糖通透酶(例如,cscB)的引入及/或过度表达。
在进一步优选实施方案中,通过引入碳水化合物激酶(例如葡萄糖激酶(EC2.7.1.1、EC 2.7.1.2、EC 2.7.1.63)、半乳糖激酶(EC 2.7.1.6)及/或果糖激酶(EC2.7.1.3、EC 2.7.1.4))修饰细胞以补偿碳源的PTS系统的缺失。PTS缺失与替代转运体和激酶的过度表达的组合的例子是:1)葡萄糖PTS系统(例如,ptsG基因)的缺失结合葡萄糖通透酶(例如,glcP的galP)的引入及/或过度表达、结合葡萄糖激酶(例如,glk)的引入及/或过度表达、及/或2)果糖PTS系统(例如,一或多个fruB、fruA、fruK基因)的缺失结合结合果糖通透酶(例如,fruI)的引入及/或过度表达、结合果糖激酶(例如,frk或mak)的引入及/或过度表达。
在另一及/或另外优选实施方案并且作为促进PEP产生及/或供应的手段,通过包含以下列举中的任一或多种进行引入或修饰:磷酸烯醇丙酮酸合成酶活性(例如在大肠杆菌中由ppsA编码的EC:2.7.9.2)、磷酸烯醇丙酮酸羧激酶活性(分别例如在谷氨酸棒状杆菌(Corynebacterium glutamicum)中由PCK编码或在大肠杆菌中由pckA编码的EC 4.1.1.32或EC 4.1.1.49)、磷酸烯醇丙酮酸羧酶活性(例如在大肠杆菌中由ppc编码的EC4.1.1.31)、草酰乙酸盐去羧酶(oxaloacetate decarboxylase)(例如在大肠杆菌中由eda编码的EC4.1.1.112)、丙酮酸激酶活性(例如在大肠杆菌中由pykA及pykF编码的EC2.7.1.40)、丙酮酸羧酶活性(例如在枯草芽孢杆菌中由pyc编码的EC 6.4.1.1)和苹果酸脱氢酶活性(分别例如在大肠杆菌中由maeA或maeB编码的EC1.1.1.38或EC 1.1.1.40)。
在更优选实施方案中,细胞经修饰以过度表达任一或多种多肽,其包括来自大肠杆菌的ppsA(UniProt ID P23538)、来自谷氨酸棒状杆菌的PCK(UniProt ID Q6F5A5)、来自大肠杆菌的pcka(UniProt ID P22259)、来自大肠杆菌的eda(UniProt ID P0A955)、来自大肠杆菌的maeA(UniProt ID P26616)和来自大肠杆菌的maeB(UniProt ID P76558)。
在另一及/或另外优选实施方案,细胞经修饰以表达具有磷酸烯醇丙酮酸合成酶活性、磷酸烯醇丙酮酸羧激酶活性、草酰乙酸盐去羧酶活性或苹果酸脱氢酶活性的任一或多种多肽。
在另一及/或另外优选实施方案并且作为促进PEP产生及/或供应的手段,通过磷酸烯醇丙酮酸羧酶活性及/或丙酮酸激酶活性的降低活性,优选为编码磷酸烯醇丙酮酸羧酶、丙酮酸羧酶活性及/或丙酮酸激酶的基因缺失进行细胞修饰。
在例示性实施方案中,细胞通过不同的适应进行基因改造,例如磷酸烯醇丙酮酸合成酶的过度表达结合丙酮酸激酶基因的缺失、磷酸烯醇丙酮酸合成酶的过度表达结合磷酸烯醇丙酮酸羧酶基因的缺失、磷酸烯醇丙酮酸合成酶的过度表达结合丙酮酸羧酶基因的缺失、磷酸烯醇丙酮酸羧激酶的过度表达结合丙酮酸激酶基因的缺失、磷酸烯醇丙酮酸羧激酶的过度表达结合磷酸烯醇丙酮酸羧酶基因的缺失、磷酸烯醇丙酮酸羧激酶的过度表达结合丙酮酸羧酶基因的缺失、草酰乙酸盐去羧酶的过度表达结合丙酮酸激酶基因的缺失、草酰乙酸盐去羧酶的过度表达结合磷酸烯醇丙酮酸羧酶基因的缺失、草酰乙酸盐去羧酶的过度表达结合丙酮酸羧酶基因的缺失、苹果酸脱氢酶的过度表达结合丙酮酸激酶基因的缺失、苹果酸脱氢酶的过度表达结合磷酸烯醇丙酮酸羧酶基因的缺失、及/或苹果酸脱氢酶的过度表达结合丙酮酸羧酶基因的缺失。
在另一例示性实施方案中,细胞通过不同的适应进行基因改造,例如磷酸烯醇丙酮酸合成酶的过度表达结合磷酸烯醇丙酮酸羧激酶的过度表达、磷酸烯醇丙酮酸合成酶的过度表达结合草酰乙酸盐去羧酶的过度表达、磷酸烯醇丙酮酸合成酶的过度表达结合苹果酸脱氢酶的过度表达、磷酸烯醇丙酮酸羧激酶的过度表达结合草酰乙酸盐去羧酶的过度表达、磷酸烯醇丙酮酸羧激酶的过度表达结合苹果酸脱氢酶的过度表达、草酰乙酸盐去羧酶的过度表达结合苹果酸脱氢酶的过度表达、磷酸烯醇丙酮酸合成酶的过度表达结合磷酸烯醇丙酮酸羧激酶的过度表达及草酰乙酸盐去羧酶的过度表达、磷酸烯醇丙酮酸合成酶的过度表达结合磷酸烯醇丙酮酸羧激酶的过度表达及苹果酸脱氢酶的过度表达、磷酸烯醇丙酮酸合成酶的过度表达结合磷酸烯醇丙酮酸羧激酶的过度表达及草酰乙酸盐去羧酶的过度表达及苹果酸脱氢酶的过度表达、磷酸烯醇丙酮酸羧激酶的过度表达结合草酰乙酸盐去羧酶的过度表达及苹果酸脱氢酶的过度表达、及/或磷酸烯醇丙酮酸合成酶的过度表达结合草酰乙酸盐去羧酶的过度表达及苹果酸脱氢酶的过度表达。
在另一例示性实施方案中,细胞通过不同的适应进行基因改造,例如磷酸烯醇丙酮酸合成酶的过度表达结合磷酸烯醇丙酮酸羧激酶的过度表达及丙酮酸激酶基因的缺失、磷酸烯醇丙酮酸合成酶的过度表达结合草酰乙酸盐去羧酶的过度表达及丙酮酸激酶基因的缺失、磷酸烯醇丙酮酸合成酶的过度表达结合苹果酸脱氢酶的过度表达及丙酮酸激酶基因的缺失、磷酸烯醇丙酮酸羧激酶的过度表达结合草酰乙酸盐去羧酶的过度表达及丙酮酸激酶基因的缺失、磷酸烯醇丙酮酸羧激酶的过度表达结合苹果酸脱氢酶的过度表达及丙酮酸激酶基因的缺失、草酰乙酸盐去羧酶的过度表达结合苹果酸脱氢酶的过度表达及丙酮酸激酶基因的缺失、磷酸烯醇丙酮酸合成酶的过度表达结合磷酸烯醇丙酮酸羧激酶的过度表达及草酰乙酸盐去羧酶的过度表达及丙酮酸激酶基因的缺失、磷酸烯醇丙酮酸合成酶的过度表达结合磷酸烯醇丙酮酸羧激酶的过度表达及苹果酸脱氢酶的过度表达及丙酮酸激酶基因的缺失、磷酸烯醇丙酮酸合成酶的过度表达结合磷酸烯醇丙酮酸羧激酶的过度表达及草酰乙酸盐去羧酶的过度表达及苹果酸脱氢酶的过度表达及丙酮酸激酶基因的缺失、磷酸烯醇丙酮酸羧激酶的过度表达结合草酰乙酸盐去羧酶的过度表达及苹果酸脱氢酶的过度表达及丙酮酸激酶基因的缺失、磷酸烯醇丙酮酸合成酶的过度表达结合草酰乙酸盐去羧酶的过度表达及苹果酸脱氢酶的过度表达及丙酮酸激酶基因的缺失。
在另一例示性实施方案中,细胞通过不同的适应进行基因改造,例如磷酸烯醇丙酮酸合成酶的过度表达结合磷酸烯醇丙酮酸羧激酶的过度表达及磷酸烯醇丙酮酸羧酶基因的缺失、磷酸烯醇丙酮酸合成酶的过度表达结合草酰乙酸盐去羧酶的过度表达及磷酸烯醇丙酮酸羧酶基因的缺失、磷酸烯醇丙酮酸合成酶的过度表达结合苹果酸脱氢酶的过度表达及磷酸烯醇丙酮酸羧酶基因的缺失、磷酸烯醇丙酮酸羧激酶的过度表达结合草酰乙酸盐去羧酶的过度表达及磷酸烯醇丙酮酸羧酶基因的缺失、磷酸烯醇丙酮酸羧激酶的过度表达结合苹果酸脱氢酶的过度表达及磷酸烯醇丙酮酸羧酶基因的缺失、草酰乙酸盐去羧酶的过度表达结合苹果酸脱氢酶的过度表达及磷酸烯醇丙酮酸羧酶基因的缺失、磷酸烯醇丙酮酸合成酶的过度表达结合磷酸烯醇丙酮酸羧激酶的过度表达及草酰乙酸盐去羧酶的过度表达及磷酸烯醇丙酮酸羧酶基因的缺失、磷酸烯醇丙酮酸合成酶的过度表达结合磷酸烯醇丙酮酸羧激酶的过度表达及苹果酸脱氢酶的过度表达及磷酸烯醇丙酮酸羧酶基因的缺失、磷酸烯醇丙酮酸合成酶的过度表达结合磷酸烯醇丙酮酸羧激酶的过度表达及草酰乙酸盐去羧酶的过度表达及苹果酸脱氢酶的过度表达及磷酸烯醇丙酮酸羧酶基因的缺失、磷酸烯醇丙酮酸羧激酶的过度表达结合草酰乙酸盐去羧酶的过度表达及苹果酸脱氢酶的过度表达及磷酸烯醇丙酮酸羧酶基因的缺失、磷酸烯醇丙酮酸合成酶的过度表达结合草酰乙酸盐去羧酶的过度表达及苹果酸脱氢酶的过度表达及磷酸烯醇丙酮酸羧酶基因的缺失。
在另一例示性实施方案中,细胞通过不同的适应进行基因改造,例如磷酸烯醇丙酮酸合成酶的过度表达结合磷酸烯醇丙酮酸羧激酶的过度表达及丙酮酸羧酶基因的缺失、磷酸烯醇丙酮酸合成酶的过度表达结合草酰乙酸盐去羧酶的过度表达及丙酮酸羧酶基因的缺失、磷酸烯醇丙酮酸合成酶的过度表达结合苹果酸脱氢酶的过度表达及丙酮酸羧酶基因的缺失、磷酸烯醇丙酮酸羧激酶的过度表达结合草酰乙酸盐去羧酶的过度表达及丙酮酸羧酶基因的缺失、磷酸烯醇丙酮酸羧激酶的过度表达结合苹果酸脱氢酶的过度表达及丙酮酸羧酶基因的缺失、草酰乙酸盐去羧酶的过度表达结合苹果酸脱氢酶的过度表达及丙酮酸羧酶基因的缺失、磷酸烯醇丙酮酸合成酶的过度表达结合磷酸烯醇丙酮酸羧激酶的过度表达及草酰乙酸盐去羧酶的过度表达及丙酮酸羧酶基因的缺失、磷酸烯醇丙酮酸合成酶的过度表达结合磷酸烯醇丙酮酸羧激酶的过度表达及苹果酸脱氢酶的过度表达及丙酮酸羧酶基因的缺失、磷酸烯醇丙酮酸合成酶的过度表达结合磷酸烯醇丙酮酸羧激酶的过度表达及草酰乙酸盐去羧酶的过度表达及苹果酸脱氢酶的过度表达及丙酮酸羧酶基因的缺失、磷酸烯醇丙酮酸羧激酶的过度表达结合草酰乙酸盐去羧酶的过度表达及苹果酸脱氢酶的过度表达及丙酮酸羧酶基因的缺失、磷酸烯醇丙酮酸合成酶的过度表达结合草酰乙酸盐去羧酶的过度表达及苹果酸脱氢酶的过度表达及丙酮酸羧酶基因的缺失。
在另一例示性实施方案中,细胞通过不同的适应进行基因改造,例如磷酸烯醇丙酮酸合成酶的过度表达结合磷酸烯醇丙酮酸羧激酶的过度表达及丙酮酸羧酶基因和磷酸烯醇丙酮酸羧酶基因的缺失、磷酸烯醇丙酮酸合成酶的过度表达结合草酰乙酸盐去羧酶的过度表达及丙酮酸羧酶基因和磷酸烯醇丙酮酸羧酶基因的缺失、磷酸烯醇丙酮酸合成酶的过度表达结合苹果酸脱氢酶的过度表达及丙酮酸羧酶基因和磷酸烯醇丙酮酸羧酶基因的缺失、磷酸烯醇丙酮酸羧激酶的过度表达结合草酰乙酸盐去羧酶的过度表达及丙酮酸羧酶基因和磷酸烯醇丙酮酸羧酶基因的缺失、磷酸烯醇丙酮酸羧激酶的过度表达结合苹果酸脱氢酶的过度表达及丙酮酸羧酶基因和磷酸烯醇丙酮酸羧酶基因的缺失、草酰乙酸盐去羧酶的过度表达结合苹果酸脱氢酶的过度表达及丙酮酸羧酶基因和磷酸烯醇丙酮酸羧酶基因的缺失、磷酸烯醇丙酮酸合成酶的过度表达结合磷酸烯醇丙酮酸羧激酶的过度表达及草酰乙酸盐去羧酶的过度表达及丙酮酸羧酶基因和磷酸烯醇丙酮酸羧酶基因的缺失、磷酸烯醇丙酮酸合成酶的过度表达结合磷酸烯醇丙酮酸羧激酶的过度表达及苹果酸脱氢酶的过度表达及丙酮酸羧酶基因和磷酸烯醇丙酮酸羧酶基因的缺失、磷酸烯醇丙酮酸合成酶的过度表达结合磷酸烯醇丙酮酸羧激酶的过度表达及草酰乙酸盐去羧酶的过度表达及苹果酸脱氢酶的过度表达及丙酮酸羧酶基因和磷酸烯醇丙酮酸羧酶基因的缺失、磷酸烯醇丙酮酸羧激酶的过度表达结合草酰乙酸盐去羧酶的过度表达及苹果酸脱氢酶的过度表达及丙酮酸羧酶基因和磷酸烯醇丙酮酸羧酶基因的缺失、磷酸烯醇丙酮酸合成酶的过度表达结合草酰乙酸盐去羧酶的过度表达及苹果酸脱氢酶的过度表达及丙酮酸羧酶基因和磷酸烯醇丙酮酸羧酶基因的缺失。
在另一例示性实施方案中,细胞通过不同的适应进行基因改造,例如磷酸烯醇丙酮酸合成酶的过度表达结合磷酸烯醇丙酮酸羧激酶的过度表达及丙酮酸激酶基因和丙酮酸羧酶基因和磷酸烯醇丙酮酸羧酶基因的缺失、磷酸烯醇丙酮酸合成酶的过度表达结合草酰乙酸盐去羧酶的过度表达及丙酮酸激酶基因和丙酮酸羧酶基因和磷酸烯醇丙酮酸羧酶基因的缺失、磷酸烯醇丙酮酸合成酶的过度表达结合苹果酸脱氢酶的过度表达及丙酮酸激酶基因和丙酮酸羧酶基因和磷酸烯醇丙酮酸羧酶基因的缺失、磷酸烯醇丙酮酸羧激酶的过度表达结合草酰乙酸盐去羧酶的过度表达及丙酮酸激酶基因和丙酮酸羧酶基因和磷酸烯醇丙酮酸羧酶基因的缺失、磷酸烯醇丙酮酸羧激酶的过度表达结合苹果酸脱氢酶的过度表达及丙酮酸激酶基因和丙酮酸羧酶基因和磷酸烯醇丙酮酸羧酶基因的缺失、草酰乙酸盐去羧酶的过度表达结合苹果酸脱氢酶的过度表达及丙酮酸激酶基因和丙酮酸羧酶基因和磷酸烯醇丙酮酸羧酶基因的缺失、磷酸烯醇丙酮酸合成酶的过度表达结合磷酸烯醇丙酮酸羧激酶的过度表达及草酰乙酸盐去羧酶的过度表达及丙酮酸激酶基因和丙酮酸羧酶基因和磷酸烯醇丙酮酸羧酶基因的缺失、磷酸烯醇丙酮酸合成酶的过度表达结合磷酸烯醇丙酮酸羧激酶的过度表达及苹果酸脱氢酶的过度表达及丙酮酸激酶基因和丙酮酸羧酶基因和磷酸烯醇丙酮酸羧酶基因的缺失、磷酸烯醇丙酮酸合成酶的过度表达结合磷酸烯醇丙酮酸羧激酶的过度表达及草酰乙酸盐去羧酶的过度表达及苹果酸脱氢酶的过度表达及丙酮酸激酶基因的缺失和丙酮酸羧酶基因和磷酸烯醇丙酮酸羧酶基因的缺失、磷酸烯醇丙酮酸羧激酶的过度表达结合草酰乙酸盐去羧酶的过度表达及苹果酸脱氢酶的过度表达及丙酮酸激酶基因和丙酮酸羧酶基因和磷酸烯醇丙酮酸羧酶基因的缺失、磷酸烯醇丙酮酸合成酶的过度表达结合草酰乙酸盐去羧酶的过度表达及苹果酸脱氢酶的过度表达及丙酮酸激酶基因和丙酮酸羧酶基因和磷酸烯醇丙酮酸羧酶基因的缺失。
根据本发明的方法及/或细胞的另一优选实施方案,该细胞包括与未修饰的先驱细胞相比,用于降低乙酸盐产生的修饰。该修饰可选自包括以下的群组的任一或多种:乙酰辅酶A合成酶的过度表达、丙酮酸脱氢酶、完全或部分剃除或降低功能的丙酮酸脱氢酶和完全或部分剃除或降低功能的乳酸脱氢酶。
在本发明的方法及/或细胞的进一步实施方案中,细胞在至少一种乙酰辅酶A合成酶(例如,来自大肠杆菌、啤酒酵母菌、智人、小鼠的acs)的表达或活性方面进行修饰。在优选实施方案中,该乙酰辅酶A合成酶为具有经修饰的表达或活性的细胞内源性蛋白质,优选为该乙酰辅酶A合成酶为过度表达;或者,该乙酰辅酶A合成酶为异源性蛋白质,其异源地引入该细胞并在该细胞中表达,优选为过度表达。该内源性乙酰辅酶A合成酶可在细胞中具有修饰的表达,该细胞也表达异源性乙酰辅酶A合成酶。在更优选实施方案中,细胞在乙酰辅酶A合成酶的表达或活性方面进行修饰,例如来自大肠杆菌(UniProt ID P27550)的acs。在另一及/或另外优选实施方案,细胞在来自大肠杆菌(UniProt ID P27550)的acs的功能性同源物、变体或衍生物的表达或活性方面进行修饰,该功能性同源物、变体或衍生物具有与来自大肠杆菌(UniProt ID P27550)的该多肽全长的至少80%整体序列同一性且具有乙酰辅酶A合成酶活性。
在本发明的方法及/或细胞的替代及/或另外进一步实施方案中,细胞在至少一种丙酮酸脱氢酶(例如,来自大肠杆菌、啤酒酵母菌、智人及褐鼠)的表达或活性方面进行修饰。在优选实施方案中,通过本领域技术人员已知的手段修饰为具有至少一种部分或完全剔除或突变的丙酮酸脱氢酶编码基因,从而产生至少一种功能较差或失能的丙酮酸脱氢酶活性的蛋白质。在更优选实施方案中,细胞的poxB编码基因被完全剃除,导致细胞缺乏丙酮酸脱氢酶活性。
在本发明的方法及/或细胞的替代及/或另外进一步实施方案中,细胞在至少一种乳酸脱氢酶(例如,来自大肠杆菌、啤酒酵母菌、智人及褐鼠)的表达或活性方面进行修饰。在优选实施方案中,通过本领域技术人员已知的手段修饰为具有至少一种部分或完全剔除或突变的乳酸脱氢酶编码基因,从而产生至少一种功能较差或失能的乳酸脱氢酶活性的蛋白质。在更优选实施方案中,细胞的ldhA编码基因被完全剃除,导致细胞缺乏乳酸脱氢酶活性。
根据本发明的方法及/或细胞的另一优选实施方案,该细胞包括与未修饰的先驱细胞相比,任一或多种蛋白质的较低或减少的表达及/或消除、受损、降低或延迟的活性,该蛋白质包含:β-半乳糖苷酶、半乳糖苷O-乙酰转移酶(galactoside O-acetyltransferase)、N-乙酰葡萄糖胺-6-磷酸盐去乙酰酶、葡萄糖胺-6-磷酸盐脱胺酶、N-乙酰葡萄糖胺抑制蛋白、核糖核苷酸单磷酸酶、EIICBA-Nag、UDP-葡萄糖:十一异戊二烯-磷酸葡萄糖-1-磷酸转移酶(UDP-glucose:undecaprenyl-phosphate glucose-1-phosphatetransferase)、L-岩藻酮糖激酶(L-fuculokinase)、L-岩藻糖异构酶、N-乙酰神经氨酸解离酶(N-acetylneuraminate lyase)、N-乙酰甘露糖胺激酶、N-乙酰甘露糖胺-6-磷酸盐2-表异构酶、EIIAB-Man、EIIC-Man、EIID-Man、ushA、半乳糖-1-磷酸盐尿苷酰转移酶、葡萄糖-1-磷酸盐腺苷酰转移酶、葡萄糖-1-磷酸酶、ATP-依赖性6-磷酸果糖激酶同功酶1、ATP-依赖性6-磷酸果糖激酶同功酶2、葡萄糖-6-磷酸盐异构酶、有氧呼吸调控蛋白(aerobicrespiration control protein)、转录抑制蛋白IclR、lon蛋白酶、葡萄糖特异性转位磷酸转移酶酶IIBC成分ptsG、葡萄糖特异性转位磷酸转移酶(PTS)酶IIBC成分malX、酶IIAGlc、β-葡萄糖苷特异性PTS酶II、果糖特异性PTS多磷酰转移蛋白(fructose-specific PTSmultiphosphoryl transfer protein)FruA及FruB、乙醇脱氢酶醛脱氢酶、丙酮酸-甲酸盐解离酶、乙酸盐激酶、磷酰基转移酶(phosphoacyltransferase)、磷酸乙酰转移酶(phosphate acetyltransferase)、丙酮酸去羧酶。
根据本发明的方法及/或细胞的另一优选实施方案,该细胞包含至少部分失活的所选单糖、双糖或寡糖的分解代谢途径,该单糖、双糖或寡糖参与还原端具有N-乙酰葡萄糖胺单元的双糖或寡糖的产生及/或为产生还原端具有N-乙酰葡萄糖胺单元的双糖或寡糖所需。
根据本发明的方法及/或细胞的另一优选实施方案,细胞使用前驱物以产生在还原端具有N-乙酰葡萄糖胺单元的双糖或寡糖,优选地,该前驱物从培养基供给细胞。根据方法及/或细胞的更优选方面,细胞使用至少两种前驱物以产生在还原端具有N-乙酰葡萄糖胺单元的双糖或寡糖,优选地,该前驱物从培养基供给细胞。根据本发明的方法及/或细胞的另一优选方面,细胞产生至少一种前驱物,优选为至少两种前驱物,以产生在还原端具有N-乙酰葡萄糖胺单元的双糖或寡糖。在本方法及/或细胞的优选实施方案中,细胞用于产生在还原端具有N-乙酰葡萄糖胺单元的双糖或寡糖的前驱物完全转化为该还原端具有N-乙酰葡萄糖胺单元的双糖或寡糖。
根据本发明的方法及/或细胞的另一优选实施方案,细胞在整个培养液及/或上清液产生90g/L或多于90g/L的还原端具有N-乙酰葡萄糖胺单元的双糖或寡糖。在更优选实施方案中,在整个培养液及/或上清液中产生还原端具有N-乙酰葡萄糖胺单元的双糖或寡糖具有至少80%的纯度,其以在整个培养液及/或上清液中分别由细胞产生的还原端具有N-乙酰葡萄糖胺单元的双糖或寡糖及其前驱物的总量计。
本发明的另一实施方案提供一种方法及细胞,其中还原端具有GlcNAc单元的双糖或寡糖产生在及/或由本文所述的真菌、酵母、细菌、昆虫、动物、植物或原生动物细胞所产生。表达系统或细胞选自包括细菌、酵母或真菌的列表,或指植物或动物细胞。细胞选自包括细菌、酵母、原生动物或真菌、或者所指的植物或动物细胞的列举。后者的细菌优选属于变形菌(Proteobacteria)门或厚壁菌(Firmicutes)门或蓝细菌(Cyanobactria)门或者异常球菌-栖热菌(Deinococcus-Thermus)门。属于变形菌门的后者细菌优选属于肠杆菌科(Enterobacteriaceae),优选属于大肠杆菌种。后者细菌优选关于属于大肠杆菌种的任何菌株,例如但不限于大肠杆菌B、大肠杆菌C、大肠杆菌W、大肠杆菌K12、大肠杆菌Nissle。更具体而言,后者用与关于培养的大肠杆菌菌株——称为大肠杆菌菌株K12菌株—其非常适合于实验室环境,并且与野生型菌株不同,其已丧失了在肠中繁殖的能力。大肠杆菌菌株K12菌株的已知实例是K12野生型、W3110、MG1655、M182、MC1000、MC1060、MC1061、MC4100、JM101、NZN111和AA200。因此,本发明特别关于如上所述突变和/或转形的大肠杆菌宿主细胞或菌株,其中该大肠杆菌菌株是K12菌株。更具体而言,大肠杆菌菌株K12菌株是大肠杆菌MG1655。属于厚壁菌门的后者细菌优选属于芽孢杆菌纲(Bacilli),优选属于乳杆菌目(Lactobacilliales),其成员例如,乳酸乳杆菌(Lactobacillus lactis)、肠系膜明串珠菌(Leuconostoc mesenteroides),或芽孢杆菌目(Bacillales),其成员例如,来自芽孢杆菌属,例如,枯草芽孢杆菌(Bacillus subtilis)或解淀粉芽孢杆菌(B.amyloliquefaciens)。属于放线菌(Actinobacteria)门的后者细菌优选属于棒杆菌科(Corynebacteriaceae),其成员为谷氨酸棒状杆菌或非发酵棒杆菌(C.afermentans),或属于链霉菌科(Streptomycetaceae),其成员为灰链霉菌(Streptomyces griseus)或弗雷迪链霉菌(S.fradiae)。后者酵母优选属于子囊菌门(Ascomycota)或担子菌门(Basidiomycota)或半知菌门(Deuteromycota)或接合菌门(Zygomycetes)。后者酵母优选属于酵母属(Saccharomyces)(其成员为例如,啤酒酵母菌、贝酵母(S.bayanus)、布拉氏酵母菌(S.boulardii))、接合酵母菌属(Zygosaccharomyces)、毕赤酵母菌属(Pichia)(其成员为例如,巴斯德毕赤酵母(Pichia pastoris)、异常毕赤酵母(P.anomala)、克鲁维毕赤酵母(P.kluyveri))、克马格特勒酵母(Komagataella)、汉逊氏酵母菌属(Hansenula)、克鲁维酵母菌属(Kluyveromyces)(其成员为例如,乳酸克鲁维酵母、马克斯克鲁维酵母(K.marxianus)、耐热克鲁维酵母(K.thermotolerans)))、德巴利酵母菌属(Debaromyces)、子囊菌酵母属(Yarrowia)(其成员为例如,解脂耶氏酵母(Yarrowia lipolytica))或拟球酵母菌属(Starmerella)(其成员为例如,球拟假丝酵母(Starmerella bombicola)。后者的酵母优选选自巴斯德毕赤酵母、解脂耶氏酵母(Yarrowia lipolitica)、啤酒酵母菌及乳酸克鲁维酵母。后者真菌优选属于黑霉菌属(Rhizopus)、网柱黏菌属(Dictyostelium)、青霉菌属(Penicillium)、白霉菌属(Mucor)或曲菌属(Aspergillus)。植物细胞包括开花和非开花植物细胞,以及藻类细胞,例如单胞藻属(Chlamydomonas)、绿球藻属(Chlorella)等。优选地,植物是烟草、苜蓿、稻米、番茄、棉花、油菜籽、大豆、玉米或谷类植物。后者的动物细胞优选衍生自非人类哺乳动物(例如,牛、水牛、猪、羊、小鼠、大鼠)、鸟类(例如,鸡、鸭、鸵鸟、火鸡、雉)、鱼类(例如,箭鱼、鲑鱼、鲔、海鲈、鳟鱼、鲶鱼)、无脊椎动物(例如,龙虾、螃蟹、虾、蛤蜊、牡蛎、贻贝、海胆)、爬虫类(例如,蛇、鳄鱼、乌龟)、两栖类(例如,青蛙)或昆虫类(例如,苍蝇、线虫)或为基因改造细胞株,其衍生自排除胚胎干细胞的人类细胞。人类和非人类哺乳动物细胞均优选选自包含上皮细胞的列举,例如,乳腺上皮细胞、胚胎肾细胞(例如,HEK293或HEK 293T细胞)、纤维母细胞、COS细胞、中国仓鼠卵巢(CHO)细胞、鼠骨髓瘤细胞,例如N20、SP2/0或YB2/0细胞、NIH-3T3细胞、非乳腺成体干细胞或其衍生物,如WO21067641所述。后者的昆虫细胞优选衍生自秋行军虫(Spodoptera frugiperda),例如,Sf9或Sf21细胞、蚕(Bombyx mori)、甘蓝夜蛾(Mamestra brassicae)、粉纹夜蛾(Trichoplusia ni)等,例如BTI-TN-5B1-4细胞或黑腹果蝇(Drosophila melanogaster),例如果蝇S2细胞。后者的原生动物细胞优选为狼蛛利什曼原虫(Leishmania tarentolae)细胞。
在本发明的方法及/或细胞的优选实施方案中,细胞为活的革兰氏阴性菌,其包含与未修饰的先驱细胞相比,降低或消除聚-N-乙酰-葡萄糖胺(PNAG)、肠细菌共同抗原(ECA)、纤维素、可拉酸(colanic acid)、核心寡糖、渗压调节间质葡聚糖(OsmoregulatedPeriplasmic Glucan,OPG)、葡萄糖基甘油(Glucosylglycerol)、聚糖及/或海藻糖的合成。
在方法及/或细胞的更优选实施方案中,该降低或消除聚-N-乙酰-葡萄糖胺(PNAG)、肠细菌共同抗原(ECA)、纤维素、可拉酸、核心寡糖、渗压调节间质葡聚糖(OPG)、葡萄糖基甘油、聚糖及/或海藻糖的合成是由参与该聚-N-乙酰-葡萄糖胺(PNAG)、肠细菌共同抗原(ECA)、纤维素、可拉酸、核心寡糖、渗压调节间质葡聚糖(OPG)、葡萄糖基甘油、聚糖及/或海藻糖中的任一合成的任一或多种糖基转移酶的突变所提供,其中该突变提供任一种该糖基转移酶的缺失或较低的表达。该糖基转移酶包括糖基转移酶基因,其编码聚-N-乙酰-D-葡萄糖胺合成酶子单元、UDP-N-乙酰葡萄糖胺—十一异戊二烯-磷酸N-乙酰葡萄糖胺磷酸转移酶、Fuc4NAc(4-乙酰胺基-4,6-双去氧-D-半乳糖)转移酶、UDP-N-乙酰基-D-甘露糖胺糖醛酸转移酶(UDP-N-acetyl-D-mannosaminuronic acid transferase)、编码纤维素合成酶催化子单元的糖基转移酶基因、纤维素生物合成蛋白、可拉酸生物合成葡萄糖醛酸转移酶(colanic acid biosynthesis glucuronosyltransferase)、可拉酸生物合成半乳糖基转移酶、可拉酸生物合成岩藻糖基转移酶、UDP-葡萄糖:十一异戊二烯-磷酸葡萄糖-1-磷酸转移酶、推定的结肠生物合成糖基转移酶(putative colanic biosynthesis glycosyltransferase)、UDP-葡萄糖醛酸盐:LPS(HepIII)糖基转移酶、ADP-庚糖—LPS庚糖基转移酶(heptosyltransferase)2、ADP-庚糖:LPS庚糖基转移酶1、推定的ADP-庚糖:LPS庚糖基转移酶4、脂多糖核心生物合成蛋白、UDP-葡萄糖:(葡萄糖基)LPSα-1,2-葡萄糖基转移酶、UDP-D-葡萄糖:(葡萄糖基)LPSα-1,3-葡萄糖基转移酶、UDP-D-半乳糖:(葡萄糖基)脂多糖-1,6-D-半乳糖基转移酶、脂多糖葡萄糖基转移酶I、脂多糖核心庚糖基转移酶3、β-1,6-呋喃半乳糖基转移酶(β-1,6-galactofuranosyltransferase)、十一异戊二烯-磷酸4-去氧-4-甲磺酰胺-L-阿拉伯糖转移酶、脂质IVA 4-氨基-4-去氧-L-阿拉伯糖基转移酶、细菌萜醇葡萄糖基转移酶(bactoprenol glucosyl transferase)、堆定的家族2糖基转移酶、渗压调节间质葡聚糖(OPG)生物合成G、OPG生物合成H、葡萄糖基甘油酸酯(glucosylglycerate)磷酸化酶、酐糖合成酶(glycogen synthase)、1,4-α-葡聚糖分支酶、4-α葡聚糖转移酶(4-α-glucanotransferase)及海藻糖-6-磷酸盐合成酶。在例示性实施方案中,细胞在包含pgaC、pgaD、rfe、rffT、rffM、bcsA、bcsB、bcsC、wcaA、wcaC、wcaE、wcaI、wcaJ、wcaL、waaH、waaF、waaC、waaU、waaZ、waaJ、waaO、waaB、waaS、waaG、waaQ、wbbl、arnC、arnT、yfdH、wbbK、opgG、opgH、ycjM、glgA、glgB、malQ、otsA及yaiP的任一或多种糖基转移酶中发生突变,其中该突变提供该糖基转移酶中任一的缺失或较低的表达。
在方法及/或细胞的替代及/或另外优选实施方案中,该降低或消除聚-N-乙酰-葡萄糖胺(PNAG)的合成是通过碳储存调节子编码基因的过度表达、Na+/H+反向运输调节剂编码基因的缺失及/或感测器组氨酸激酶编码基因的缺失提供。
如本文所述的微生物或细胞能够在单糖、双糖、寡糖、多糖、多元醇、甘油、包括糖蜜、玉米浆、蛋白胨、胰蛋白胨、酵母萃取物的复合培养基或其混合物(例如,混合原料,优选为混合单糖原料,例如水解蔗糖)作为主要碳源上生长。用语“复合培养基(complexmedium)”是指其未定义的精确构成介质。该用与主要是指所关注的生物产品、生质形成、二氧化碳及/或副产物形成(例如,酸及/或醇,例如乙酸盐、乳酸及/或乙醇)的最重要的碳源,即所有所需碳的20、30、40、50、60、70、75、80、85、90、95、98、99%来自上述所指碳源。在本发明的实施方案中,该碳源是该生物体的唯一碳源,即所有所需碳的100%源自上述所指碳源。通常主要碳源包括但不限于葡萄糖、甘油、果糖、麦芽糖、乳糖、阿拉伯糖、麦芽-寡糖、麦芽三糖、山梨醇、木糖、鼠李糖、蔗糖、半乳糖、甘露糖、甲醇、乙醇、海藻糖、淀粉、纤维素、半纤维素、糖蜜、玉米浸液、高果糖浆、乙酸盐、柠檬酸盐、乳酸和丙酮酸。用语复合培养基是指其未定义的精确构成介质。实例为糖蜜、玉米浆、蛋白胨、胰蛋白胨或酵母萃取物。
在进一步优选实施方案中,此处描述的微生物或细胞使用具有产生途径和生质途径的分裂代谢,如WO2012/007481所述,其通过并入本文作为参照。可以例如通过改变选自以下的基因而对该生物体进行基因改造以累积果糖-6-磷酸盐,该基因选自:磷酸葡萄糖异构酶(phosphoglucoisomerase)基因、磷酸果糖激酶基因、果糖-6-磷酸盐醛醇缩酶基因、果糖异构酶基因及/或果糖:PEP磷酸转移酶基因。
根据本发明方法的另一实施方案中,允许产生该还原端具有N-乙酰葡萄糖胺单元的双糖或寡糖的条件包括使用包含至少一种前驱物及/或接受者的培养基以用于产生该还原端具有N-乙酰葡萄糖胺单元的双糖或寡糖。优选地,培养基包含选自包括乳糖、半乳糖、岩藻糖、唾液酸的群组的至少一种前驱物。
根据本发明方法的替代及/或另外的实施方案,允许产生该还原端具有N-乙酰葡萄糖胺单元的双糖或寡糖的条件包括向培养基添加至少一种前驱物及/或接受者原料以用于产生该还原端具有N-乙酰葡萄糖胺单元的双糖或寡糖。
根据本发明方法的替代实施方案,允许产生该还原端具有N-乙酰葡萄糖胺单元的双糖或寡糖的条件包括使用培养基培养本发明的细胞以产生还原端具有N-乙酰葡萄糖胺单元的双糖或寡糖,其中该培养基缺乏用于产生该还原端具有N-乙酰葡萄糖胺单元的双糖或寡糖的任何前驱物及/或接受者,并且进一步结合向该培养基添加至少一种前驱物及/或接受者原料以用于产生该还原端具有N-乙酰葡萄糖胺单元的双糖或寡糖。
在优选实施方案中,如本文所述的用于产生在还原端具有N-乙酰葡萄糖胺单元的双糖或寡糖的方法,其包括以下步骤中的至少一者:
i)使用包括至少一种前驱物及/或接受者的培养基;
ii)向反应器中的培养基添加至少一种前驱物及/或接受者原料,其中总反应器体积范围为250mL(毫升)至10,000m3(立方米),优选以连续方式,并且优选使得培养基的最终体积不超过在添加该前驱物及/或接受者原料之前的培养基体积的三倍,优选不超过两倍,更优选小于两倍;
iii)向反应器中的培养基添加至少一种前驱物及/或接受者原料,优选以连续方式,并且优选使得培养基的最终体积不超过在添加该前驱物及/或接受者原料之前的培养基体积的三倍,优选不超过两倍,更优选小于两倍,且其中优选地,该前驱物及/或接受者原料的pH设定在3与7之间,且其中优选地,该前驱物及/或接受者原料的温度维持在20℃与80℃之间;
iv)通过进料溶液的手段在1天、2天、3天、4天、5天的过程中以连续方式添加至少一种前驱物及/或接受者原料至培养基;
v)通过进料溶液的手段在1天、2天、3天、4天、5天的过程中以连续方式添加至少一种前驱物及/或接受者原料至培养基,且其中优选地,该进料溶液的pH设定在3与7之间,且其中优选地,该进料溶液的温度维持在20℃与80℃之间;
该方法产生在还原端具有N-乙酰葡萄糖胺单元的双糖或寡糖,其在最终培养物中的浓度为至少50g/L,优选为至少75g/L,更优选为至少90g/L,更优选为至少100g/L,更优选为至少125g/L,更优选为至少150g/L,更优选为至少175g/L,更优选为至少200g/L。
在另一及/或另外优选实施方案,如本文所述的用于产生在还原端具有N-乙酰葡萄糖胺单元的双糖或寡糖的方法,其包括以下步骤中的至少一者:
i)使用每公升初始反应器体积包含至少50克,更优选为至少75克,更优选为至少100克,更优选为至少120克,更优选为至少150克乳糖的培养基,其中反应器体积为250mL至10,000m3(立方米);
ii)以一次脉冲输送或以不连续(脉冲输送)方式将至少一种前驱物及/或接受者添加至培养基,其中总反应器体积范围为250mL(毫升)至10,000m3(立方米),优选地使得培养基的最终体积不超过在添加该前驱物及/或接受者原料脉冲之前的培养基体积的三倍,优选不超过两倍,更优选小于两倍;
iii)以一次脉冲输送或以不连续(脉冲输送)方式向反应器中的培养基添加至少一种前驱物及/或接受者原料,其中总反应器体积范围为250mL(毫升)至10,000m3(立方米),优选使得培养基的最终体积不超过在添加该前驱物及/或接受者原料脉冲之前的培养基体积的三倍,优选不超过两倍,更优选小于两倍,且其中该前驱物及/或接受者原料脉冲的pH设定在3与7之间,且其中优选地,该前驱物及/或接受者原料脉冲的温度维持在20℃与80℃之间;
iv)通过进料溶液的手段在5分钟、10分钟、30分钟、1小时、2小时、4小时、10小时、12小时、1天、2天、3天、4天、5天的过程中以不连续(脉冲输送)方式添加至少一种前驱物及/或接受者原料至培养基;
v)通过进料溶液的手段在5分钟、10分钟、30分钟、1小时、2小时、4小时、10小时、12小时、1天、2天、3天、4天、5天的过程中以不连续(脉冲输送)方式添加至少一种前驱物及/或接受者原料至培养基,且其中该进料溶液的pH设定在3与7之间,且其中优选地,该进料溶液的温度维持在20℃与80℃之间;
该方法产生在还原端具有N-乙酰葡萄糖胺单元的双糖或寡糖,其在最终培养物中的浓度为至少50g/L,优选为至少75g/L,更优选为至少90g/L,更优选为至少100g/L,更优选为至少125g/L,更优选为至少150g/L,更优选为至少175g/L,更优选为至少200g/L。
在进一步更优选的实施方案中,如本文所述的用于产生在还原端具有N-乙酰葡萄糖胺单元的双糖或寡糖的方法,其包括以下步骤中的至少一者:
i)使用每公升初始反应器体积包含至少50克,更优选为至少75克,更优选为至少100克,更优选为至少120克,更优选为至少150克乳糖的培养基,其中反应器体积范围为250mL至10,000m3(立方米);
ii)添加每公升初始反应器体积包含至少50克,更优选为至少75克,更优选为至少100克,更优选为至少120克,更优选为至少150克乳糖的乳糖原料至培养基,其中总反应器体积范围为250mL(毫升)至10,000m3(立方米),优选以连续方式,且优选使得培养基的最终体积不超过在添加该乳糖原料之前的培养基体积的三倍,优选不超过两倍,更优选小于两倍;
iii)添加每公升初始反应器体积包含至少50克,更优选为至少75克,更优选为至少100克,更优选为至少120克,更优选为至少150克乳糖的乳糖原料至培养基,其中反应器体积范围为250mL至10,000m3(立方米),优选以连续方式,且优选使得培养基的最终体积不超过在添加该乳糖原料之前的培养基体积的三倍,优选不超过两倍,更优选小于两倍,且其中优选地,该乳糖原料的pH设定在3与7之间,且其中优选地,该乳糖原料的温度维持在20℃与80℃之间;
iv)通过进料溶液的手段在1天、2天、3天、4天、5天的过程中以连续方式添加乳糖原料至培养基;
v)通过进料溶液的手段在1天、2天、3天、4天、5天的过程中以连续方式添加乳糖原料至培养基,且其中该乳糖进料溶液的浓度为50g/L,优选为75g/L,更优选为100g/L,更优选为125g/L,更优选为150g/L,更优选为175g/L,更优选为200g/L,更优选为225g/L,更优选为250g/L,更优选为275g/L,更优选为300g/L,更优选为325g/L,更优选为350g/L,更优选为375g/L,更优选为400g/L,更优选为450g/L,更优选为500g/L,又更优选为550g/L,最优选为600g/L;且其中优选地,该进料溶液的pH设定在3与7之间,且其中优选地,该进料溶液的温度维持在20℃与80℃之间;
该方法产生在还原端具有N-乙酰葡萄糖胺单元的双糖或寡糖,其在最终培养物中的浓度为至少50g/L,优选为至少75g/L,更优选为至少90g/L,更优选为至少100g/L,更优选为至少125g/L,更优选为至少150g/L,更优选为至少175g/L,更优选为至少200g/L。
在本文所述的方法的进一步实施方案中,宿主细胞培养至少约60、80、100或约120小时或以连续方式培养。
在优选实施方案中,在培养基中提供碳源,优选为蔗糖,持续3天或3天以上,优选为长达7天;及/或在培养基中以连续方式提供每公升初始培养体积至少100克,优选为至少105克,更优选为至少110克,又更优选为至少120克蔗糖,使得培养基的最终体积不超过培养前培养基体积的三倍,优选为不超过两倍,更优选为小于两倍。
优选地,当进行如本文所述的方法时,在第二阶段将前驱物添加至培养物之前,通过向培养基添加碳源,优选为葡萄糖或蔗糖,而提供指数细胞生长的第一阶段。
在本发明方法的另一优选实施方案中,通过向包含前驱物的培养基添加碳类基质,优选为葡萄糖或蔗糖,而提供指数细胞生长的第一阶段,接着在第二阶段,其中仅将碳类基质,优选为葡萄糖或蔗糖,添加到培养物中。
在本发明方法的另一优选实施方案中,通过向包含前驱物的培养基中加入碳类基质,优选为葡萄糖或蔗糖,而提供指数细胞生长的第一阶段,接着在第二阶段,其中碳类基质,优选为葡萄糖或蔗糖,及前驱物添加到培养物中。
在替代性优选实施方案中,如本文所述的方法,前驱物已在指数增长的第一阶段与碳类基质一起添加。
如本文所述的用于产生在还原端具有N-乙酰葡萄糖胺单元的双糖或寡糖的方法,其进一步包括:自细胞或其生长的培养基中分离该还原端具有GlcNAc单元的双糖或寡糖的步骤。
用与“分离(separating)”是指从细胞及/或其生长的培养基中收获、收集或回收还原端具有GlcNAc单元的双糖或寡糖或其混合物。
在还原端具有GlcNAc单元的双糖或寡糖可以常规方式从细胞在其中生长的水性培养基中分离。在还原端具有GlcNAc单元的双糖或寡糖仍然存在于产生还原端具有GlcNAc单元的双糖或寡糖的细胞中的情况下,则能够使用常规方法以释放或萃取还原端具有GlcNAc单元的双糖或寡糖至细胞外,如使用高pH、热休克、音振、法式压碎、均质化、酶水解、化学水解、溶剂水解、清洁剂、水解等破坏细胞。接着可将培养基及/或细胞萃取物一起和单独地进一步用于分离还原端具有GlcNAc单元的双糖或寡糖。此优选地包括使含有还原端具有GlcNAc单元的双糖或寡糖的混合物澄清以去除悬浮颗粒及污染物,特别是细胞、细胞成分、不溶性代谢物和通过培养基因改造细胞产生的碎片。在此步骤中,在含有还原端具有GlcNAc单元的双糖或寡糖的混合物可以常规方式进行澄清。优选地,在含有还原端具有GlcNAc单元的双糖或寡糖的混合物通过离心、凝聚、倾析及/或过滤进行澄清。自含有还原端具有GlcNAc单元的双糖或寡糖的混合物分离还原端具有GlcNAc单元的双糖或寡糖的另一步骤优选包括自含有还原端具有GlcNAc单元的双糖或寡糖的混合物,优选地在进行澄清之后,实质上去除所有蛋白质,以及胜肽、氨基酸、RNA及DNA和任何内毒素和糖脂,其可能会干扰随后的分离步骤。在此步骤中,可以常规方式自含有还原端具有GlcNAc单元的双糖或寡糖的混合物去除蛋白质和相关杂质。优选地,通过超微过滤、纳米过滤、两相分配、逆渗透、微过滤、活性炭或碳处理、非离子界面活性剂处理、酶消化、切向流(tangential flow)高性能过滤、切向流超微过滤、电泳(例如,使用平板-聚丙烯酰胺或十二烷基硫酸钠-聚丙烯酰胺凝胶电泳(PAGE))、亲和色谱(使用亲和配体,包括例如DEAE-Sepharose、聚-L-赖氨酸及多黏菌素-B(polymyxin-B)、内毒素选择性吸附剂基质)、离子交换色谱(例如但不限于,阳离子交换、阴离子交换、混合床离子交换、里面朝外配体连接(inside-out ligandattachment))、疏水交互作用色谱及/或凝胶过滤(即,尺寸排阻色谱),特别是通过色谱法,更具体而言通过离子交换色谱或疏水交互作用色谱或配体交换色谱,自含有还原端具有GlcNAc单元的双糖或寡糖的混合物去除蛋白质、盐类、副产物、色素、内毒素和其他相关杂质。除了尺寸排阻色谱,蛋白质和相关杂质通过色谱介质或选定的膜保留,而还原端具有GlcNAc单元的双糖或寡糖保留在含有还原端具有GlcNAc单元的双糖或寡糖的混合物。
在进一步优选实施方案中,如本文所述的方法也提供进一步纯化还原端具有GlcNAc单元的双糖或寡糖。该还原端具有GlcNAc单元的双糖或寡糖的进一步纯化可通过例如使用(活性)炭或碳、纳米过滤、超微过滤、电泳、酶处理或离子交换以除去任何残留的DNA、蛋白质、LPS、内毒素或其他杂质而完成。也可以使用醇类,例如乙醇、和含水的醇类混合物。另一纯化步骤是通过产物的结晶、蒸发或沉淀而完成。另一纯化步骤是通过例如喷雾干燥、冻干、喷雾冷冻干燥、冷冻喷雾干燥、带式干燥(band dry)、传送带干燥(belt dry)、真空带式干燥(vacuum band dry)、真空带式干燥(vacuum belt dry)、转筒干燥、滚筒干燥、真空转筒干燥或真空滚筒干燥进行干燥所产生的在还原端带有GlcNAc的双糖或寡糖。
在例示性实施方案中,所产生的还原端具有N-乙酰葡萄糖胺单元的双糖或寡糖的分离及纯化是在制程中进行,其包括以任何顺序的以下步骤:
a)将培养物或其澄清形式与截留分子量(molecular weight cut-off,MWCO)为600-3500Da的纳米过滤膜接触,以确保保留产生的双糖或寡糖并允许至少部分蛋白质、盐类、副产物、色素和其他相关杂质通过,
b)使用该膜以无机电解质的水溶液对来自步骤a)的渗余物进行透析(Diafiltration)制程,然后可选地用纯水透析以去除过量的电解质,
c)并从该电解质的阳离子中以盐类形式收集富含还原端具有N-乙酰葡萄糖胺单元的双糖或寡糖的截留物,
d)优选地,干燥渗余物。
在替代的例示性实施方案中,所产生的还原端具有N-乙酰葡萄糖胺单元的双糖或寡糖的分离及纯化是在制程中进行,其包括以任何顺序的以下步骤:使用不同的膜对培养物或其澄清形式进行两个膜过滤的步骤,其中一个膜的截留分子量为约300至约500道尔顿之间,且另一个膜的截留分子量为约600到约800道尔顿之间。
在替代的例示性实施方案中,所产生的还原端具有N-乙酰葡萄糖胺单元的双糖或寡糖的分离和纯化是在制程中进行,其包括以任何顺序的以下步骤:包括以H+形式的强阳离子交换树脂和游离碱形式的弱阴离子交换树脂处理培养物或其澄清形式的步骤。
在替代的例示性实施方案中,所产生的还原端具有N-乙酰葡萄糖胺单元的双糖或寡糖的分离和纯化是以下列方式进行。包含所产生的还原端具有N-乙酰葡萄糖胺单元的双糖或寡糖、生质、介质成分及污染物的培养物适用于以下分离及纯化步骤:
i)自培养物分离生质,
ii)用于去除带正电材料的阳离子交换剂处理,
iii)用于去除带负电材料的阴离子交换剂处理,
iv)纳米过滤步骤及/或电透析步骤,
其中提供纯度大于或等于80%的包括所产生的还原端具有N-乙酰葡萄糖胺单元的双糖或寡糖的纯化溶液。可选地,通过选自包含喷雾干燥、冻干、喷雾冷冻干燥、冷冻喷雾干燥、带式干燥、传送带干燥、真空带式干燥、真空带式干燥、转筒干燥、滚筒干燥、真空转筒干燥及真空滚筒干燥的列举的任一或多种干燥步骤进行干燥纯化溶液。
在替代的例示性实施方案中,所产生的还原端具有N-乙酰葡萄糖胺单元的双糖或寡糖的分离及纯化是在制程中进行,其包括以任何顺序的以下步骤:培养物的酶处理;从培养物中去除生质;超微过滤;纳米过滤;及柱色谱步骤。优选地,如此的柱色谱是单柱或多柱。更优选地,柱色谱步骤是模拟移动床色谱(simulated moving bed chromatography)。如此的模拟移动床色谱优选包括i)至少4个柱,其中至少一个柱包含弱或强阳离子交换树脂;及/或ii)具有不同流速的四个区I、II、III和IV;及/或iii)包含水的溶析液;及/或iv)15至60摄氏度的工作温度。优选地,该制程进一步包括选自包括喷雾干燥、冻干、喷雾冷冻干燥、冷冻喷雾干燥、带式干燥、传送带干燥、真空带式干燥、真空带式干燥、转筒干燥、滚筒干燥、真空转筒干燥及真空滚筒干燥的列举的步骤。
在特定实施方案中,本发明提供通过选自包含喷雾干燥、冻干、喷雾冷冻干燥、冷冻喷雾干燥、带式干燥、传送带干燥、真空带式干燥、真空带式干燥、转筒干燥、滚筒干燥、真空转筒干燥及真空滚筒干燥的列举的任一或多种干燥步骤所干燥成粉末的所产生的在还原端带有GlcNAc的双糖或寡糖,其中干燥粉末含有<15%-wt的水,优选为<10%-wt的水,更优选为<7%-wt的水,最优选为<5%-wt的水。
在第三方面中,本发明提供如本文所述的代谢工程细胞用于产生还原端具有N-乙酰葡萄糖胺单元的双糖或寡糖的用途,优选为用于产生LNB或LacNAc,更优选为用于产生在还原端含有LNB或LacNAc的寡糖,又更优选为用于产生唾液酸化及/或岩藻糖基化及/或半乳糖基化及/或GlcNAc-修饰形式的LNB或LacNAc,或最优选为用于产生唾液酸化及/或岩藻糖基化及/或半乳糖基化及/或GlcNAc修饰形式的在还原端含有LNB或LacNAc的寡糖。
在第三方面的另一优选实施方案中,如本文所述的代谢工程细胞用于产生在还原端具有N-乙酰葡萄糖胺单元的中性双糖或寡糖,更优选为在还原端含有LNB或LacNAc的中性寡糖。
在第三方面的另一优选实施方案中,如本文所述的代谢工程细胞用于产生如本文所述的还原端具有N-乙酰葡萄糖胺(GlcNAc)单元的双糖及/或寡糖混合物。
在第三方面的另一优选实施方案中,如本文所述的代谢工程细胞用于产生混合物,该混合物包括(i)在还原端具有N-乙酰葡萄糖胺(GlcNAc)单元的双糖或寡糖(或如本文所述的混合物)及(ii)一或多种基于乳糖的哺乳动物乳寡糖,优选为如本文所述的一或多种基于乳糖的人乳寡糖。
为了识别如本文所述的细胞中产生的还原端具有GlcNAc单元的双糖或寡糖、单体建构区块(例如,单糖或聚糖单元组成)、侧链的变旋异构构型(anomeric configuration)、取代基的存在及位置、聚合度/分子量和连接模式的程度可通过本领域已知的标准方法进行识别,例如甲基化分析、还原裂解、水解、GC-MS(气相色谱-质谱测定)、MALDI-MS(间质辅助雷测脱附/电离-质谱测定)、ESI-MS(电喷雾电离-质谱测定)、HPLC(带紫外光或折射率检测的高效能液相色谱)、HPAEC-PAD(带脉冲电流检测的高效能阴离子交换色谱)、CE(毛细管电泳)、IR(红外光)/拉曼光谱和NMR(核磁共振)光谱技术。晶体结构可使用例如固态NMR、FT-IR(傅立叶变换红外光谱)和WAXS(广角X射线散射)进行解析。聚合度(DP)、DP分布和多分散性可以通过例如黏度测定法和SEC(SEC-HPLC,高效能尺寸排阻色谱法)进行确定。为了识别糖类方法的单体成分,例如可使用酸-催化水解、HPLC(高效能液相色谱)或GLC(气液色谱)(转化为醛糖醇乙酸盐后)。为了确定糖苷键结,在DMSO中用碘甲烷和强碱将糖进行甲基化,执行水解,完成还原为部分甲基化的醛糖醇,执行乙酰化为甲基化的醛糖醇乙酸盐,并通过GLC/MS(气液色谱与质谱测定联用)进行分析。为了确定寡糖序列,使用酸或酶进行部分解聚合以确定结构。为了识别变旋异构构型,对寡糖进行酶促分析,例如将其与对于特定类型的键(例如,β-半乳糖苷酶或α-葡萄糖苷酶等)具有特异性的酶接触,并可使用NMR进行产物分析。
包括还原端具有N-乙酰葡萄糖胺单元的双糖或寡糖的产物
在部分实施方案中,将如本文所述产生的还原端具有N-乙酰葡萄糖胺单元的双糖或寡糖(或如本文所述的混合物)掺入食物(例如人类食物或饲料)、膳食补充剂、药物成分、化妆品成分或药物中。在部分实施方案中,还原端具有N-乙酰葡萄糖胺单元的双糖或寡糖与一或多种适用于食品、饲料、膳食补充剂、药物成分、化妆品成分或药物的成分混合。
在部分实施方案中,膳食补充剂包括至少一种益生质成分及/或至少一种益生菌成分。
“益生质(prebiotic)”是促进有益于宿主的微生物的,特别是胃肠道中微生物生长的物质。在部分实施方案中,膳食补充剂提供多种益生质,其包括节由本说明书中公开的制程产生及/或纯化的还原端具有N-乙酰葡萄糖胺单元的双糖或寡糖,以促进一种或多种有益微生物的生长。用于膳食补充剂的益生质成分的例子包括其他益生质分子(如HMO)和植物多糖(例如,菊糖、果胶、b-葡聚糖和木质寡糖)。“益生菌(probiotic)”产物通常含有活的微生物,其替代或添加至胃肠道微生物群中,而有益于受体。此类微生物的实例包括乳酸杆菌种(例如,嗜酸乳杆菌(L.acidophilus)和保加利亚乳杆菌(L.bulgaricus))、双叉乳杆菌种(例如,动物双叉乳杆菌(B.animalis)、长双叉乳杆菌(B.longum)和婴儿双叉乳杆菌(B.infantis)(例如Bi-26))和布拉氏酵母菌。在部分实施方案中,通过本说明书的制程产生及/或纯化的还原端具有N-乙酰葡萄糖胺单元的双糖或寡糖与此类微生物组合口服施予。
膳食补充剂的其他成分的实例包括双糖(例如,乳糖)、单糖(例如,葡萄糖和半乳糖)、增稠剂(例如,阿拉伯树胶)、酸度调节剂(例如,柠檬酸三钠)、水、脱脂牛奶和调味剂。
在部分实施方案中,还原端具有N-乙酰葡萄糖胺单元的双糖或寡糖(或如本文所述的混合物)掺入人类婴儿食品(例如,婴儿配方)中。婴儿配方通常是用于喂养婴儿的人造食品,作为人类母乳的完全或部分替代品。在部分实施方案中,婴儿配方作为粉末出售并通过与水混合制备于婴儿喂养用的奶瓶或杯子。婴儿配方的成分通常设计为大致模仿人类母乳。在部分实施方案中,通过本说明书中的方法产生及/或纯化的还原端具有N-乙酰葡萄糖胺单元的双糖或寡糖(或如本文所述的混合物)被包括在婴儿配方中以提供营养益处,其类似于由人类母乳中的寡糖提供所提供的益处。在部分实施方案中,还原端具有N-乙酰葡萄糖胺单元的双糖或寡糖与婴儿配方的一或多种成分混合。婴儿配方成分的例子包括脱脂奶、碳水化合物来源(例如,乳糖)、蛋白质来源(例如,乳清蛋白浓缩物和酪蛋白)、脂肪来源(例如,植物油-例如棕榈、高油酸红花油、菜籽油、椰子油及/或葵花籽油;和鱼油)、维生素(例如,维生素A、Bb、Bi2、C和D)、矿物质(例如,柠檬酸钾、柠檬酸钙、氯化镁、氯化钠、柠檬酸钠和磷酸钙)及可能的人乳寡糖(HMO)。此类HMO可包括例如DiFL、乳-N-三糖II、LNT、LNnT、乳-N-岩藻五糖I、乳-N-新岩藻五糖、乳-N-岩藻五糖II、乳-N-岩藻五糖III、乳-N-岩藻五糖V、乳-N-新岩藻五糖V、乳-N-二岩藻六糖I、乳-N-二岩藻六糖II、6'-半乳糖基乳糖、3'-半乳糖基乳糖、乳-N-六糖和乳-N-新六糖。
在部分实施方案中,一或多种婴儿配方成分包括脱脂奶、碳水化合物来源、蛋白质来源、脂肪来源及/或维生素和矿物质。
在部分实施方案中,一或多种婴儿配方成分包括乳糖、乳清蛋白浓缩物及/或高油酸红花油。
在部分实施方案中,婴儿配方中的还原端具有N-乙酰葡萄糖胺单元的双糖或寡糖(或如本文所述的混合物)的浓度与人类母乳中通常存在的寡糖浓度大致相同。在部分实施方案中,婴儿配方中的双糖或寡糖浓度大约与人类母乳中通常存在的寡糖的浓度相同。
在部分实施方案中,还原端具有N-乙酰葡萄糖胺单元的双糖或寡糖(或如本文所述的混合物)被掺入饲料制剂中,其中该饲料选自包括宠物食品、动物代乳品、兽医产品、断奶后的饲料,或教槽饲料的列举。
在部分实施方案中,食物、饲料、膳食补充剂、药物成分及/或药物包含至少一种免疫调节成分。
“免疫调节(immunomodulatory)”是改变免疫反应或免疫系统功能的物质。“免疫调节”成分可通过增加(免疫刺激)或减少(免疫抑制剂)血清抗体的产生而改变免疫反应。免疫刺激剂用于增强例如针对传染病、肿瘤、原发性或继发性免疫缺陷以及抗体转移改变的免疫反应。免疫抑制成分用于降低对移植器官的免疫反应,并治疗自身免疫性疾病,如天疱疮(pemphigus)、狼疮或过敏症。在部分实施方案中,免疫调节成分具有抗炎活性。在部分实施方案中,食物、饲料、膳食补充剂、药物成分及/或药物提供多种免疫调节剂,其包括通过本说明书中公开的制程产生及/或纯化的还原端具有N-乙酰葡萄糖胺单元的双糖或寡糖(或如本文所述的混合物),以使免疫系统适应正常功能。在可区分的生命阶段,免疫力差异很大。不同的食物成分会影响特定的免疫反应,其依据偏向的代谢过程、以及消费者和患者的特征。添加有免疫调节成分的食品也称为功能性食品。功能性食品是对特定消费者群体具有特定健康益处的食品。存在于功能性食品以及饲料和膳食补充剂中的免疫调节成分的例子包括其他免疫调节分子,例如作为本说明书指定的还原端具有N-乙酰葡萄糖胺单元的双糖或寡糖和脂肪酸(PUFA)、鱼油、氨基酸(例如,精氨酸和谷氨酰胺)、凝集素(例如,选滞蛋白)、维生素(例如,维生素A、B6、C、E、硫胺素、叶酸)和矿物质(例如,锌)。这种在还原端具有N-乙酰葡萄糖胺单元的双糖或寡糖可以包括LNB、LacNAc、聚-LacNAc和路易斯X、路易斯Y和唾液酸路易斯X抗原决定位。此外,存在于药物成分和药物中的免疫调节成分的例子包括其他免疫调节分子,例如例如作为本说明书指定的还原端具有N-乙酰葡萄糖胺单元的双糖或寡糖以及介白素、脂多糖、葡聚糖、干扰素γ和特异性抗体。存在于药物混合物及/或药物中这种在还原端具有N-乙酰葡萄糖胺单元的双糖或寡糖可包括LNB、LacNAc、聚-LacNAc和路易斯X、路易斯Y和唾液酸路易斯X抗原决定位。
在本发明的一方面的上下文中公开的各实施方案,也在本发明的所有其他方面的上下文中公开,除非另有明确说明。
除非另有定义,否则本文中使用的所有技术和科学用语通常具有与本领域技术人员通常理解的相同含义。一般而言,本文中使用的用语以及上下文描述的细胞培养、分子遗传学、有机化学和核酸化学以及杂交中的实验室程序是所属技术领域中习知和常用。核酸和肽的合成使用标准技术。一般而言,纯化步骤根据制造商的说明书执行。
其他优点来自具体实施方案、实例及附图。不言而喻,在不脱离本发明的范围的情况下,上述特征和下面仍要说明的特征不仅可以在各自指定的组合中使用,也可以在其他组合中使用或单独使用。
本发明关于下列优选实施方案:
1.一种通过细胞产生还原端具有N-乙酰葡萄糖胺单元的双糖或寡糖的方法,该方法包括以下步骤:
a.提供细胞,该细胞能够(i)合成核苷酸-糖、(ii)合成N-乙酰葡萄糖胺、以及(iii)糖化该N-乙酰葡萄糖胺单糖,
b.在允许产生该双糖或寡糖的条件下培养该细胞,
c.自该培养物分离所欲的双糖或寡糖。
2.根据实施方案1的方法,其中该细胞表达至少一种N-乙酰葡萄糖胺-6-磷酸转移酶及磷酸酶以合成单糖N-乙酰葡萄糖胺。
3.根据实施方案1及2中任一项的方法,其中该细胞表达至少一种糖基转移酶,以糖化N-乙酰葡萄糖胺。
4.根据实施方案1至3中任一项的方法,其中该细胞被基因改造以产生该双糖或寡糖。
5.根据实施方案1至4中任一项的方法,其中该细胞是在选自包含下列的群组中的酶的表达或活性上被修饰:N-乙酰葡萄糖胺-6-磷酸转移酶、磷酸酶、糖基转移酶、L-谷氨酰胺—D-果糖-6-磷酸转氨酶及UDP-葡萄糖4-表异构酶。
6.根据实施方案1至5中任一项的方法,其中该核苷酸-糖选自包含下列的群组:UDP-半乳糖(UDP-Gal)、UDP-N-乙酰葡萄糖胺(UDP-GlcNAc)、UDP-N-乙酰半乳糖胺(UDP-GalNAc)、UDP-N-乙酰甘露糖胺(UDP-ManNAc)、GDP-岩藻糖(GDP-Fuc)、GDP-甘露糖(GDP-Man)、UDP-葡萄糖(UDP-Glc)、CMP-N-乙酰基神经氨酸(CMP-Neu5Ac)、CMP-N-乙醇酰神经氨酸(CMP-Neu5Gc)、UDP-葡萄糖醛酸盐、UDP-半乳糖醛酸盐、GDP-鼠李糖以及UDP-木糖。
7.根据实施方案1至6中任一项的方法,其中该核苷酸-糖为UDP-半乳糖,且该糖基转移酶为N-乙酰葡萄糖胺b-1,3-半乳糖基转移酶或N-乙酰葡萄糖胺b-1,4-半乳糖基转移酶。
8.根据实施方案1至7中任一项的方法,其中该双糖为乳-N-双糖(Gal-b1,3-GlcNAc)或N-乙酰乳糖胺(Gal-b1,4-GlcNAc),或该寡糖在该还原端具有乳-N-双糖(Gal-b1,3-GlcNAc)或N-乙酰乳糖胺(Gal-b1,4-GlcNAc)。
9.根据实施方案1至8中任一项的方法,其中该N-乙酰葡萄糖胺b-1,3-半乳糖基转移酶为糖基转移酶,其具有:
a.PFAM域PF00535,且
i)包括SEQ ID NO 01的序列[AGPS]XXLN(Xn)RXDXD,其中X是任何氨基酸,其中n为12至17,或
ii)包括SEQ ID NO 02的序列PXXLN(Xn)RXDXD(Xm)[FWY]XX[HKR]XX[NQST],其中X是任何氨基酸,其中n是12至17且m是100至115,或
iii)包括根据SEQ ID NO:03、04、05、06、07或08中的任一的多肽序列,或
iv)为SEQ ID NO:03、04、05、06、07或08中的任一的功能性同源物、变体或衍生物,其具有与SEQ ID NO:03、04、05、06、07或08中的任一的该N-乙酰葡萄糖胺b-1,3-半乳糖基转移酶多肽全长的至少80%整体序列同一性且具有N-乙酰葡萄糖胺b-1,3-半乳糖基转移酶活性,或
v)包括来自SEQ ID NO:03、04、05、06、07或08中的任一的至少8、9、10、11、12、13、14、15、16、17、18、19、20个连续氨基酸残基的寡肽序列,且具有N-乙酰葡萄糖胺b-1,3-半乳糖基转移酶活性,或者
b.PFAM域IPR002659,且
i)包括SEQ ID NO 09的序列KT(Xn)[FY]XXKXDXD(Xm)[FHY]XXG(X,无A、G、S)(Xp)X(无F、H、W、Y)[DE]D[ILV]XX[AG],其中X是任何氨基酸,其中n是13至16,m是35至70,且p是20至45,或
ii)包括根据SEQ ID NO:10、11、12或13中的任一的多肽序列,或
iii)为SEQ ID NO:10、11、12或13中的任一的功能性同源物、变体或衍生物,其具有与SEQ ID NO:10、11、12或13的该N-乙酰葡萄糖胺b-1,3-半乳糖基转移酶多肽中的任一全长的至少80%整体序列同一性且具有N-乙酰葡萄糖胺b-1,3-半乳糖基转移酶活性,或
iv)包括来自SEQ ID NO:10、11、12或13中的任一的至少8、9、10、11、12、13、14、15、16、17、18、19、20个连续氨基酸残基的寡肽序列,且具有N-乙酰葡萄糖胺b-1,3-半乳糖基转移酶活性。
10.根据实施方案1至8中任一项的方法,其中该N-乙酰葡萄糖胺b-1,4-半乳糖基转移酶为糖基转移酶,其具有
a.PFAM域PF01755,且
i)包括SEQ ID NO 14的序列EXXCXXSHXX[ILV][FWY](Xn)EDD(Xm)[ACGST]XXYX[ILMV],其中X是任何氨基酸,其中n为13至15且m是50至76,或
ii)包括根据SEQ ID NO:15、16、17、18、19、20、21、22或23中的任一的多肽序列,或
iii)为SEQ ID NO:15、16、17、18、19、20、21、22或23中的任一的功能性同源物、变体或衍生物,其具有与SEQ ID NO:15、16、17、18、19、20、21、22或23中的任一的该N-乙酰葡萄糖胺b-1,4-半乳糖基转移酶多肽全长的至少80%整体序列同一性且具有N-乙酰葡萄糖胺b-1,4-半乳糖基转移酶活性,或
iv)包括来自SEQ ID NO:15、16、17、18、19、20、21、22或23中的任一的至少8、9、10、11、12、13、14、15、16、17、18、19、20个连续氨基酸残基的寡肽序列,且N-乙酰葡萄糖胺b-1,4-半乳糖基转移酶活性,或者
b.PFAM域PF00535,且
i)包括SEQ ID NO 24的序列R[KN]XXXXXXXGXXXX[FL]XDXD(Xn)[FHW]XXX[FHNY](Xm)E[DE],其中X是任何氨基酸,其中n是50至75,m是10至30,或
ii)包括SEQ ID NO 25的序列R[KN]XXXXXXXGXXXXFXDXD(Xn)[FHW]XXX[FHNY](Xm)E[DE](Xp)[FWY]XX[HKR]XX[NQST],其中X是任何氨基酸,其中n是50至75,m是10至30,且p是20至25,或
iii)包括根据SEQ ID NO:26、27或28中的任一的多肽序列,或
iv)为SEQ ID NO:26、27或28中的任一的功能性同源物、变体或衍生物,其具有与SEQ ID NO:26、27或28的该N-乙酰葡萄糖胺b-1,4-半乳糖基转移酶多肽中的任一全长的至少80%整体序列同一性且具有N-乙酰葡萄糖胺b-1,4-半乳糖基转移酶活性,或
v)包括来自SEQ ID NO:26、27或28中的任一的至少8、9、10、11、12、13、14、15、16、17、18、19、20个连续氨基酸残基的寡肽序列,且具有N-乙酰葡萄糖胺b-1,4-半乳糖基转移酶活性,或者
c.PFAM域PF02709且不具有PFAM域PF00535,且
i)包括SEQ ID NO 29的序列[FWY]XX[FY][FWY](X23)[FWY][GQ]X[DE]D,其中X是任何氨基酸,或
ii)包括SEQ ID NO 30的序列[PV]W[GHNP](Xn)[FWY][GQ]X[DE]D,其中X是任何氨基酸,其中n是21至24,或
iii)包括根据SEQ ID NO:31、32、33、34、35或36中的任一的多肽序列,或
iv)为SEQ ID NO:31、32、33、34、35或36中的任一的功能性同源物、变体或衍生物,其具有与SEQ ID NO:31、32、33、34、35或36的该N-乙酰葡萄糖胺b-1,4-半乳糖基转移酶多肽中的任一全长的至少80%整体序列同一性且具有N-乙酰葡萄糖胺b-1,4-半乳糖基转移酶活性,或
v)包括来自SEQ ID NO:31、32、33、34、35或36中的任一的至少8、9、10、11、12、13、14、15、16、17、18、19、20个连续氨基酸残基的寡肽序列,且具有N-乙酰葡萄糖胺b-1,4-半乳糖基转移酶活性,或者
d.PFAM域PF03808,且
i)包括SEQ ID NO 37的序列[ST][FHY]XN(Xn)DG(X16)[HKR]X[ST]FDXX[ST]XA,其中X是任何氨基酸,且其中n是20至25,或
ii)包括SEQ ID NO 38的序列[ST][FHY]XN(Xn)DG(X16)[HKR]X[ST]FDXX[ST]XA(Xm)[HR]XG[FWY](Xp)GXGXXXQ[DE],其中X是任何氨基酸,其中n是20至25,m是40至50,且p是22至30,或
iii)包括根据SEQ ID NO:39、40或41中的任一的多肽序列,或
iv)为SEQ ID NO:39、40或41中的任一的功能性同源物、变体或衍生物,其具有与SEQ ID NO:39、40或41的该N-乙酰葡萄糖胺b-1,4-半乳糖基转移酶多肽中的任一全长的至少80%整体序列同一性且具有N-乙酰葡萄糖胺b-1,4-半乳糖基转移酶活性,或
v)包括来自SEQ ID NO:39、40或41中的任一的至少8、9、10、11、12、13、14、15、16、17、18、19、20个连续氨基酸残基的寡肽序列,且具有N-乙酰葡萄糖胺b-1,4-半乳糖基转移酶活性。
11.根据上述实施方案中任一项的方法,其中
a.该N-乙酰葡萄糖胺-6-磷酸转移酶为包括UniProt ID P43577的多肽的多肽序列,或为UniProt ID P43577的多肽的功能性同源物、变体或衍生物,其具有与UniProt IDP43577的多肽全长的至少80%整体序列同一性,且具有N-乙酰葡萄糖胺-6-磷酸转移酶活性,且
b.该L-谷氨酰胺—D-果糖-6-磷酸转氨酶为包括UniProt ID P17169的多肽的多肽序列,或为具有UniProt ID P17169的多肽的功能性同源物、变体或衍生物,其具有与UniProt ID P17169的多肽全长的至少80%整体序列同一性,且具有L-谷氨酰胺—D-果糖-6-磷酸转氨酶活性;或为与UniProt ID P17169多肽不同的A39T、R250C和G472S突变的修饰版本。
12.根据上述实施方案中任一项的方法,其中该细胞可代谢碳源,其选自包含下列列举的群组:葡萄糖、果糖、半乳糖、乳糖、蔗糖、麦芽糖、麦芽-寡糖、麦芽三糖、山梨醇、木糖、鼠李糖、甘露糖、甲醇、乙醇、阿拉伯糖、海藻糖、淀粉、纤维素、半纤维素、糖蜜、玉米浸液、高果糖浆、甘油、乙酸盐、柠檬酸盐、乳酸、丙酮酸。
13.根据上述实施方案中任一项的方法,其中该细胞无法将N-乙酰葡萄糖胺-6-磷酸盐转换成葡萄糖胺-6-磷酸盐,及/或无法将葡萄糖胺-6-磷酸盐转换成果糖-6-磷酸盐。
14.根据上述实施方案中任一项的方法,其中该细胞经修饰以产生GDP-岩藻糖。
15.根据上述实施方案中任一项的方法,其中该细胞经修饰以促进GDP-岩藻糖产生,其中该修饰选择自包含下列列举的群组:UDP-葡萄糖:十一异戊二烯-磷酸葡萄糖-1-磷酸转移酶编码基因的剃除、GDP-L-岩藻糖合成酶编码基因的过度表达、GDP-甘露糖4,6-脱水酶编码基因的过度表达、甘露糖-1-磷酸盐鸟苷酸转移酶编码基因的过度表达、磷酸甘露糖变位酶编码基因的过度表达、或甘露糖-6-磷酸盐异构酶编码基因的过度表达。
16.根据上述实施方案中任一项的方法,其中该细胞经修饰以产生UDP-半乳糖。
17.根据上述实施方案中任一项的方法,其中该细胞经修饰以促进UDP-半乳糖产生,其中该修饰选择自包含下列列举的群组:5’-核苷酸酶/UDP-糖水解酶编码基因的剃除或半乳糖-1-磷酸盐尿苷酰转移酶编码基因的剃除。
18.根据上述实施方案中任一项的方法,其中该细胞经修饰以产生CMP-N-乙酰基神经氨酸。
19.根据上述实施方案中任一项的方法,其中该细胞经修饰以促进CMP-N-乙酰基神经氨酸产生,其中该修饰选择自包含下列列举的群组:CMP-唾液酸合成酶编码基因的过度表达、唾液酸合成酶编码基因的过度表达、N-乙酰基-D-葡萄糖胺2-表异构酶编码基因的过度表达。
20.根据上述实施方案中任一项的方法,其中该细胞能够表达至少一种其他糖基转移酶,且其中该其他糖基转移酶选自包括下列的群组:岩藻糖基转移酶、唾液酸转移酶、半乳糖基转移酶、葡萄糖基转移酶、甘露糖基转移酶、N-乙酰基葡糖胺转移酶、N-乙酰基半乳糖胺转移酶、N-乙酰基甘露糖胺转移酶、木糖基转移酶、葡萄糖醛酸苷转移酶、半乳糖醛酸转移酶、葡萄糖胺转移酶、N-乙醇酰神经胺转移酶、鼠李糖基转移酶(rhamnosyltransferases)。
21.根据实施方案20的方法,其中该细胞在该其他糖基转移酶的表达或活性方面被修饰。
22.根据上述实施方案中任一项的方法,其中该寡糖选自包括下列的列举:2-岩藻糖基乳-N-双糖、4-岩藻糖基乳-N-双糖、2-4-二岩藻糖基乳-N-双糖、3’-唾液酸乳-N-双糖、6’-唾液酸乳-N-双糖、3’,6’-二唾液酸乳-N-双糖、6,6’-二唾液酸乳-N-双糖、2’-岩藻糖基-3’-唾液酸乳-N-双糖、2’-岩藻糖基-6’-唾液酸乳-N-双糖、4-岩藻糖基-3'-唾液酸乳-N-双糖、4-岩藻糖基-6’-唾液酸乳-N-双糖、2-岩藻糖基N-乙酰乳糖胺、3’-岩藻糖基N-乙酰乳糖胺、2,3’-二岩藻糖基N-乙酰乳糖胺、3’-唾液酸N-乙酰乳糖胺、6’-唾液酸N-乙酰乳糖胺、3’,6’-二唾液酸N-乙酰乳糖胺、6,6’-二唾液酸N-乙酰乳糖胺、2’-岩藻糖基-3’-唾液酸N-乙酰乳糖胺、2’-岩藻糖基-6’-唾液酸N-乙酰乳糖胺、3-岩藻糖基-3'-唾液酸N-乙酰乳糖胺、3’-岩藻糖基-6’-唾液酸N-乙酰乳糖胺、P1三糖(Gal-a1,4-Gal-b1,4-GlcNAc)、异源移植抗原决定位(Gal-a1,3-Gal-b1,4-GlcNAc)、Gal-b14-(Galb13)-GlcNAc、聚-N-乙酰乳糖胺、GalNAc-b1,3-Gal-b1,4-GlcNAc。
23.一种代谢工程细胞,其能够(i)合成核苷酸-糖、(ii)合成N-乙酰葡萄糖胺、及(iii)糖化该N-乙酰葡萄糖胺单糖,其中该细胞产生还原端具有N-乙酰葡萄糖胺单元的双糖或寡糖。
24.根据实施方案23的细胞,其中该细胞表达至少一种N-乙酰葡萄糖胺-6-磷酸转移酶及磷酸酶,以合成N-乙酰葡萄糖胺。
25.根据实施方案23及24中任一项的细胞,其中该细胞表达至少一种糖基转移酶,以糖化N-乙酰葡萄糖胺。
26.根据实施方案23至25中任一项的细胞,其中该细胞在选自包括下列的群组的酶的表达或活性方面被修饰:N-乙酰葡萄糖胺-6-磷酸转移酶、磷酸酶、糖基转移酶、L-谷氨酰胺—D-果糖-6-磷酸转氨酶及UDP-葡萄糖4-表异构酶。
27.根据实施方案23至26中任一项的细胞,其中该核苷酸-糖选自包含下列的群组:UDP-半乳糖(UDP-Gal)、UDP-N-乙酰葡萄糖胺(UDP-GlcNAc)、UDP-N-乙酰半乳糖胺(UDP-GalNAc)、UDP-N-乙酰甘露糖胺(UDP-ManNAc)、GDP-岩藻糖(GDP-Fuc)、GDP-甘露糖(GDP-Man)、UDP-葡萄糖(UDP-Glc)、CMP-N-乙酰基神经氨酸(CMP-Neu5Ac)、CMP-N-乙醇酰神经氨酸(CMP-Neu5Gc)、UDP-葡萄糖醛酸盐、UDP-半乳糖醛酸盐、GDP-鼠李糖以及UDP-木糖。
28.根据实施方案23至27中任一项的细胞,其中该核苷酸-糖为UDP-半乳糖,且该糖基转移酶为N-乙酰葡萄糖胺b-1,3-半乳糖基转移酶或N-乙酰葡萄糖胺b-1,4-半乳糖基转移酶。
29.根据实施方案23至28中任一项的细胞,其中该双糖为乳-N-双糖(Gal-b1,3-GlcNAc)或N-乙酰乳糖胺(Gal-b1,4-GlcNAc),或其中该寡糖在该还原端具有乳-N-双糖(Gal-b1,3-GlcNAc)或N-乙酰乳糖胺(Gal-b1,4-GlcNAc)。
30.根据实施方案23至29中任一项的细胞,其中该N-乙酰葡萄糖胺b-1,3-半乳糖基转移酶为糖基转移酶,其具有
a.PFAM域PF00535,且
i)包括SEQ ID NO 01的序列[AGPS]XXLN(Xn)RXDXD,其中X是任何氨基酸,其中n为12至17,或
ii)包括SEQ ID NO 02的序列PXXLN(Xn)RXDXD(Xm)[FWY]XX[HKR]XX[NQST],其中X是任何氨基酸,其中n是12至17且m是100至115,或
iii)包括根据SEQ ID NO:03、04、05、06、07或08中的任一的多肽序列,或
iv)为SEQ ID NO:03、04、05、06、07或08中的任一的功能性同源物、变体或衍生物,其具有与SEQ ID NO:03、04、05、06、07或08中的任一的该N-乙酰葡萄糖胺b-1,3-半乳糖基转移酶多肽全长的至少80%整体序列同一性且具有N-乙酰葡萄糖胺b-1,3-半乳糖基转移酶活性,或
v)包括来自SEQ ID NO:03、04、05、06、07或08中的任一的至少8、9、10、11、12、13、14、15、16、17、18、19、20个连续氨基酸残基的寡肽序列,且具有N-乙酰葡萄糖胺b-1,3-半乳糖基转移酶活性,或者
b.PFAM域IPR002659,且
i)包括SEQ ID NO 09的序列KT(Xn)[FY]XXKXDXD(Xm)[FHY]XXG(X,无A、G、S)(Xp)X(无F、H、W、Y)[DE]D[ILV]XX[AG],其中X是任何氨基酸,其中n是13至16,m是35至70,且p是20至45,或
ii)包括根据SEQ ID NO:10、11、12或13中的任一的多肽序列,或
iii)为SEQ ID NO:10、11、12或13中的任一的功能性同源物、变体或衍生物,其具有与SEQ ID NO:10、11、12或13的该N-乙酰葡萄糖胺b-1,3-半乳糖基转移酶多肽中的任一全长的至少80%整体序列同一性且具有N-乙酰葡萄糖胺b-1,3-半乳糖基转移酶活性,或
iv)包括来自SEQ ID NO:10、11、12或13中的任一的至少8、9、10、11、12、13、14、15、16、17、18、19、20个连续氨基酸残基的寡肽序列,且具有N-乙酰葡萄糖胺b-1,3-半乳糖基转移酶活性。
31.根据实施方案23至29中任一项的细胞,其中该N-乙酰葡萄糖胺b-1,4-半乳糖基转移酶为糖基转移酶,其具有
a.PFAM域PF01755,且
i)包括SEQ ID NO 14的序列EXXCXXSHXX[ILV][FWY](Xn)EDD(Xm)[ACGST]XXYX[ILMV],其中X是任何氨基酸,其中n为13至15且m是50至76,或
ii)包括根据SEQ ID NO:15、16、17、18、19、20、21、22或23中的任一的多肽序列,或
iii)为SEQ ID NO:15、16、17、18、19、20、21、22或23中的任一的功能性同源物、变体或衍生物,其具有与SEQ ID NO:15、16、17、18、19、20、21、22或23中的任一的该N-乙酰葡萄糖胺b-1,4-半乳糖基转移酶多肽全长的至少80%整体序列同一性且具有N-乙酰葡萄糖胺b-1,4-半乳糖基转移酶活性,或
iv)包括来自SEQ ID NO:15、16、17、18、19、20、21、22或23中的任一的至少8、9、10、11、12、13、14、15、16、17、18、19、20个连续氨基酸残基的寡肽序列,且具有N-乙酰葡萄糖胺b-1,4-半乳糖基转移酶活性,或者
b.PFAM域PF00535,且
i)包括SEQ ID NO 24的序列R[KN]XXXXXXXGXXXX[FL]XDXD(Xn)[FHW]XXX[FHNY](Xm)E[DE],其中X是任何氨基酸,其中n是50至75,m是10至30,或
ii)包括SEQ ID NO 25的序列R[KN]XXXXXXXGXXXXFXDXD(Xn)[FHW]XXX[FHNY](Xm)E[DE](Xp)[FWY]XX[HKR]XX[NQST],其中X是任何氨基酸,其中n是50至75,m是10至30,且p是20至25,或
iii)包括根据SEQ ID NO:26、27或28中的任一的多肽序列,或
iv)为SEQ ID NO:26、27或28中的任一的功能性同源物、变体或衍生物,其具有与SEQ ID NO:26、27或28的该N-乙酰葡萄糖胺b-1,4-半乳糖基转移酶多肽中的任一全长的至少80%整体序列同一性,且具有N-乙酰葡萄糖胺b-1,4-半乳糖基转移酶活性,或
v)包括来自SEQ ID NO:26、27或28中的任一的至少8、9、10、11、12、13、14、15、16、17、18、19、20个连续氨基酸残基的寡肽序列,且具有N-乙酰葡萄糖胺b-1,4-半乳糖基转移酶活性,或者
c.PFAM域PF02709且不具有PFAM域PF00535,且
i)包括SEQ ID NO 29的序列[FWY]XX[FY][FWY](X23)[FWY][GQ]X[DE]D,其中X是任何氨基酸,或
ii)包括SEQ ID NO 30的序列[PV]W[GHNP](Xn)[FWY][GQ]X[DE]D,其中X是任何氨基酸,其中n是21至24,或
iii)包括根据SEQ ID NO:31、32、33、34、35或36中的任一的多肽序列,或
iv)为SEQ ID NO:31、32、33、34、35或36中的任一的功能性同源物、变体或衍生物,其具有与SEQ ID NO:31、32、33、34、35或36的该N-乙酰葡萄糖胺b-1,4-半乳糖基转移酶多肽中的任一全长的至少80%整体序列同一性且具有N-乙酰葡萄糖胺b-1,4-半乳糖基转移酶活性,或
v)包括来自SEQ ID NO:31、32、33、34、35或36中的任一的至少8、9、10、11、12、13、14、15、16、17、18、19、20个连续氨基酸残基的寡肽序列,且具有N-乙酰葡萄糖胺b-1,4-半乳糖基转移酶活性,或者
d.PFAM域PF03808,且
i)包括SEQ ID NO 37的序列[ST][FHY]XN(Xn)DG(X16)[HKR]X[ST]FDXX[ST]XA,其中X是任何氨基酸,且其中n是20至25,或
ii)包括SEQ ID NO 38的序列[ST][FHY]XN(Xn)DG(X16)[HKR]X[ST]FDXX[ST]XA(Xm)[HR]XG[FWY](Xp)GXGXXXQ[DE],其中X是任何氨基酸,其中n是20至25,m是40至50,且p是22至30,或
iii)包括根据SEQ ID NO:39、40或41中的任一的多肽序列,或
iv)为SEQ ID NO:39、40或41中的任一的功能性同源物、变体或衍生物,其具有与SEQ ID NO:39、40或41的该N-乙酰葡萄糖胺b-1,4-半乳糖基转移酶多肽中的任一全长的至少80%整体序列同一性且具有N-乙酰葡萄糖胺b-1,4-半乳糖基转移酶活性,或
v)包括来自SEQ ID NO:39、40或41中的任一的至少8、9、10、11、12、13、14、15、16、17、18、19、20个连续氨基酸残基的寡肽序列,且具有N-乙酰葡萄糖胺b-1,4-半乳糖基转移酶活性。
32.根据实施方案23至31中任一项的细胞,其中
a.该N-乙酰葡萄糖胺-6-磷酸转移酶为包括UniProt ID P43577的多肽的多肽序列,或为UniProt ID P43577的多肽的功能性同源物、变体或衍生物,其具有与UniProt IDP43577的多肽全长的至少80%整体序列同一性,且具有N-乙酰葡萄糖胺-6-磷酸转移酶活性,且
b.该L-谷氨酰胺—D-果糖-6-磷酸转氨酶为包括UniProt ID P17169的多肽的多肽序列,或为具有UniProt ID P17169的多肽的功能性同源物、变体或衍生物,其具有与UniProt ID P17169的多肽全长的至少80%整体序列同一性,且具有L-谷氨酰胺—D-果糖-6-磷酸转氨酶活性;或为与UniProt ID P17169多肽不同的A39T、R250C和G472S突变的修饰版本。
33.根据实施方案23至32中任一项的细胞,其中该细胞可代谢碳源,其选自包含下列列举的群组:葡萄糖、果糖、半乳糖、乳糖、蔗糖、麦芽糖、麦芽-寡糖、麦芽三糖、山梨醇、木糖、鼠李糖、甘露糖、甲醇、乙醇、阿拉伯糖、海藻糖、淀粉、纤维素、半纤维素、糖蜜、玉米浸液、高果糖浆、甘油、乙酸盐、柠檬酸盐、乳酸、丙酮酸。
34.根据实施方案23至33中任一项的细胞,其中该细胞无法将N-乙酰葡萄糖胺-6-磷酸盐转换成葡萄糖胺-6-磷酸盐,及/或无法将葡萄糖胺-6-磷酸盐转换成果糖-6-磷酸盐。
35.根据实施方案23至34中任一项的细胞,其中该细胞经修饰以产生GDP-岩藻糖。
36.根据实施方案23至35中任一项的细胞,其中该细胞经修饰以促进GDP-岩藻糖产生,其中该修饰选择自包含下列列举的群组:UDP-葡萄糖:十一异戊二烯-磷酸葡萄糖-1-磷酸转移酶编码基因的剃除、GDP-L-岩藻糖合成酶编码基因的过度表达、GDP-甘露糖4,6-脱水酶编码基因的过度表达、甘露糖-1-磷酸盐鸟苷酸转移酶编码基因的过度表达、磷酸甘露糖变位酶编码基因的过度表达、或甘露糖-6-磷酸盐异构酶编码基因的过度表达。
37.根据实施方案23至36中任一项的细胞,其中该细胞经修饰以产生UDP-半乳糖。
38.根据实施方案23至37中任一项的细胞,其中该细胞经修饰以促进UDP-半乳糖产生,其中该修饰选择自包含下列列举的群组:5’-核苷酸酶/UDP-糖水解酶编码基因的剃除或半乳糖-1-磷酸盐尿苷酰转移酶编码基因的剃除。
39.根据实施方案23至38中任一项的细胞,其中该细胞经修饰以产生CMP-N-乙酰基神经氨酸。
40.根据实施方案23至39中任一项的细胞,其中该细胞经修饰以促进CMP-N-乙酰基神经氨酸产生,其中该修饰选择自包含下列列举的群组:CMP-唾液酸合成酶编码基因的过度表达、唾液酸合成酶编码基因的过度表达、N-乙酰基-D-葡萄糖胺2-表异构酶编码基因的过度表达。
41.根据实施方案23至40中任一项的细胞,其中该细胞能够表达至少一种其他糖基转移酶,且其中该其他糖基转移酶选自包括下列的群组:岩藻糖基转移酶、唾液酸转移酶、半乳糖基转移酶、葡萄糖基转移酶、甘露糖基转移酶、N-乙酰基葡糖胺转移酶、N-乙酰基半乳糖胺转移酶、N-乙酰基甘露糖胺转移酶、木糖基转移酶、葡萄糖醛酸苷转移酶、半乳糖醛酸转移酶、葡萄糖胺转移酶、N-乙醇酰神经胺转移酶、鼠李糖基转移酶。
42.根据实施方案41的细胞,其中该细胞在该其他糖基转移酶的表达或活性方面被修饰。
43.根据实施方案23至41中任一项的细胞,其中该寡糖选自包括下列的列举:2-岩藻糖基乳-N-双糖、4-岩藻糖基乳-N-双糖、2-4-二岩藻糖基乳-N-双糖、3’-唾液酸乳-N-双糖、6’-唾液酸乳-N-双糖、3’,6’-二唾液酸乳-N-双糖、6,6’-二唾液酸乳-N-双糖、2’-岩藻糖基-3’-唾液酸乳-N-双糖、2’-岩藻糖基-6’-唾液酸乳-N-双糖、4-岩藻糖基-3’-唾液酸乳-N-双糖、4-岩藻糖基-6’-唾液酸乳-N-双糖、2-岩藻糖基N-乙酰乳糖胺、3’-岩藻糖基N-乙酰乳糖胺、2,3’-二岩藻糖基N-乙酰乳糖胺、3’-唾液酸N-乙酰乳糖胺、6’-唾液酸N-乙酰乳糖胺、3’,6’-二唾液酸N-乙酰乳糖胺、6,6’-二唾液酸N-乙酰乳糖胺、2’-岩藻糖基-3’-唾液酸N-乙酰乳糖胺、2’-岩藻糖基-6’-唾液酸N-乙酰乳糖胺、3-岩藻糖基-3’-唾液酸N-乙酰乳糖胺、3’-岩藻糖基-6’-唾液酸N-乙酰乳糖胺、P1三糖(Gal-a1,4-Gal-b1,4-GlcNAc)、异源移植抗原决定位(Gal-a1,3-Gal-b1,4-GlcNAc)、Gal-b14-(Galb13)-GlcNAc、聚-N-乙酰乳糖胺、GalNAc-b1,3-Gal-b1,4-GlcNAc。
44.根据实施方案23至43中任一项的细胞或根据实施方案1至22中任一项的方法,其中该细胞选自由微生物、植物或动物细胞所组成的群组,优选地,该微生物为细菌、真菌或酵母,优选地,该植物为棉花、油菜籽、大豆、玉米或谷类植物,优选地,该动物为昆虫类、鱼类、鸟类或非人类哺乳动物;优选地,该细胞为大肠杆菌细胞。
45.根据实施方案23至44中任一项的细胞或根据实施方案1至22或44中任一项的方法,其中该细胞为细菌细胞,优选为大肠杆菌菌株,更优选为大肠杆菌菌株K12菌株,又更优选地,该大肠杆菌菌株K12菌株为大肠杆菌MG1655。
46.根据实施方案23至45中任一项的细胞或根据实施方案1至22、44或45中任一项的方法,其中该细胞为酵母菌细胞。
47.根据实施方案1至22、44至46中任一项的方法,其中该分离包括下列列举的至少一种:澄清、超微过滤、纳米过滤、逆渗透、微过滤、活性炭或碳处理、切向流高性能过滤、切向流超微过滤、亲和色谱、离子交换色谱、疏水交互作用色谱及/或凝胶过滤、配体交换色谱。
48.根据实施方案1至22、44至47中任一项的方法,其进一步包括自该细胞纯化该双糖或寡糖。
49.根据实施方案1至22、44至48中任一项的方法,其中该纯化包括下列步骤的至少一种:活性炭或碳的使用、炭的使用、纳米过滤、超微过滤或离子交换、醇类的使用、含水的醇类混合物的使用、结晶、蒸发、沉淀、干燥、喷雾干燥或冻干。
50.一种根据实施方案23至46中任一项的细胞用于产生还原端具有N-乙酰葡萄糖胺单元的双糖或寡糖,优选为用于产生LNB或LacNAc,更优选为用于产生唾液酸化或岩藻糖基化形式的LNB或LacNAc的用途。
此外,本发明关于以下优选特定实施方案:
1.一种通过细胞,优选为单一细胞产生还原端具有N-乙酰葡萄糖胺单元的寡糖或双糖的方法,该方法包括以下步骤:
a.提供细胞,该细胞能够:(i)合成核苷酸-糖及单糖N-乙酰葡萄糖胺(GlcNAc)、以及(ii)表达糖基转移酶以糖化该GlcNAc单糖,而产生该双糖或寡糖,
b.在允许产生该双糖或寡糖的条件下培养该细胞,
c.优选地,自培养物分离该双糖或寡糖。
2.一种通过细胞产生还原端具有N-乙酰葡萄糖胺单元的寡糖的方法,该方法包括以下步骤:
a.提供细胞,该细胞能够:(i)合成核苷酸-糖及单糖N-乙酰葡萄糖胺(GlcNAc)、以及(ii)表达糖基转移酶以糖化该GlcNAc单糖,而产生该寡糖,
b.在允许产生该寡糖的条件下培养该细胞,
c.优选地,自该培养物分离该寡糖。
3.一种通过细胞用于产生混合物的方法,该混合物包括(i)还原端具有N-乙酰葡萄糖胺单元的双糖及/或寡糖、以及(ii)一或多种基于乳糖的哺乳动物乳寡糖(MMOs),该方法包括以下步骤:
a.提供细胞,该细胞能够:(i)合成核苷酸-糖及单糖N-乙酰葡萄糖胺(GlcNAc)、以及(ii)表达糖基转移酶以糖化该GlcNAc单糖,而产生该还原端具有N-乙酰葡萄糖胺单元的双糖及/或寡糖,
b.在允许产生该混合物的条件下培养该细胞,
c.优选地,自培养物分离该混合物。
4.根据上述特定实施方案中任一项的方法,其中该细胞表达至少一种N-乙酰葡萄糖胺-6-磷酸转移酶及磷酸酶,以合成单糖N-乙酰葡萄糖胺。
5.根据上述特定实施方案中任一项的方法,其中该细胞表达至少一种糖基转移酶,以糖化N-乙酰葡萄糖胺。
6.根据上述特定实施方案中任一项的方法,其中该细胞经基因改造,以产生该双糖或寡糖。
7.根据特定实施方案6的方法,其中该细胞以一或多种基因表达模组进行修饰,其特征在于任何该表达模组的表达形式是组成型或由天然诱导物所产生。
8.根据特定实施方案6或7的任一项的方法,其中该细胞包括编码一蛋白质的相同编码DNA序列的多个复制(multiple copies)。
9.根据上述特定实施方案中任一项的方法,其中该细胞在选自包括下列的群组的酶的表达或活性方面被修饰:N-乙酰葡萄糖胺-6-磷酸转移酶、磷酸酶、糖基转移酶、L-谷氨酰胺—D-果糖-6-磷酸转氨酶及UDP-葡萄糖4-表异构酶。
10.根据上述特定实施方案中任一项的方法,其中该核苷酸-糖选自包含下列的群组:UDP-半乳糖(UDP-Gal)、UDP-N-乙酰葡萄糖胺(UDP-GlcNAc)、UDP-N-乙酰半乳糖胺(UDP-GalNAc)、UDP-N-乙酰甘露糖胺(UDP-ManNAc)、GDP-岩藻糖(GDP-Fuc)、GDP-甘露糖(GDP-Man)、UDP-葡萄糖(UDP-Glc)、UDP-2-乙酰胺基-2,6-双去氧--L阿拉伯-4-己酮糖、UDP-2-乙酰胺基-2,6-双去氧--L-来苏-4-己酮糖、UDP-N-乙酰基-L-鼠李糖胺(UDP-L-RhaNAc或UDP-2-乙酰胺基-2,6-双去氧-L-甘露糖)、dTDP-N-乙酰岩藻糖胺、UDP-N-乙酰岩藻糖胺(UDP-L-FucNAc或UDP-2-乙酰胺基-2,6-双去氧-L-半乳糖)、UDP-N-乙酰基-L-肺炎糖胺(UDP-L-PneNAC或UDP-2-乙酰胺基-2,6-双去氧-L-塔罗糖)、UDP-N-乙酰胞壁酸、UDP-N-乙酰基-L-奎诺糖胺(UDP-L-QuiNAc或UDP-2-乙酰胺基-2,6-双去氧-L-葡萄糖)、GDP-L-异鼠李糖、CMP-N-乙酰基神经氨酸(CMP-Neu5Ac)、CMP-N-乙醇酰神经氨酸(CMP-Neu5Gc)、CMP-Neu4Ac、CMP-Neu5Ac9N3、CMP-Neu4,5Ac2、CMP-Neu5,7Ac2、CMP-Neu5,9Ac2、CMP-Neu5,7(8,9)Ac2、UDP-葡萄糖醛酸盐、UDP-半乳糖醛酸盐、GDP-鼠李糖及UDP-木糖。
11.根据上述特定实施方案中任一项的方法,其中该核苷酸-糖为UDP-半乳糖,且该糖基转移酶为N-乙酰葡萄糖胺b-1,3-半乳糖基转移酶或N-乙酰葡萄糖胺b-1,4-半乳糖基转移酶。
12.根据上述特定实施方案中任一项的方法,其中寡糖在该还原端具有乳-N-双糖(Gal-b1,3-GlcNAc)或N-乙酰乳糖胺(Gal-b1,4-GlcNAc)。
13.根据上述特定实施方案中任一项的方法,其中该N-乙酰葡萄糖胺b-1,3-半乳糖基转移酶为糖基转移酶,其具有
a.PFAM域PF00535,且
i.包括SEQ ID NO 01的序列[AGPS]XXLN(Xn)RXDXD,其中X是任何氨基酸,其中n为12至17,或
ii.包括SEQ ID NO 02的序列PXXLN(Xn)RXDXD(Xm)[FWY]XX[HKR]XX[NQST],其中X是任何氨基酸,其中n是12至17且m是100至115,或
iii.包括根据SEQ ID NO:03、04、05、06、07或08中的任一,优选为SEQ ID NO 03、04、05、06或07中的任一,更优选为SEQ ID NO 03、06或07中的任一,最优选为SEQ ID NO 03或06中的任一的多肽序列,或
iv.为SEQ ID NO:03、04、05、06、07或08中的任一,优选为SEQ ID NO 03、04、05、06或07中的任一,更优选为SEQ ID NO 03、06或07中的任一,最优选为SEQ ID NO 03或06中的任一的功能性同源物、变体或衍生物,其具有与SEQ ID NO:03、04、05、06、07或08中的任一,优选为SEQ ID NO 03、04、05、06或07中的任一,更优选为SEQ ID NO 03、06或07中的任一,最优选为SEQ ID NO 03或06中的任一的该N-乙酰葡萄糖胺b-1,3-半乳糖基转移酶多肽全长的至少80%整体序列同一性且具有N-乙酰葡萄糖胺b-1,3-半乳糖基转移酶活性,或
v.包括来自SEQ ID NO:03、04、05、06、07或08中的任一,优选为SEQ ID NO 03、04、05、06或07中的任一,更优选为SEQ ID NO 03、06或07中的任一,最优选为SEQ ID NO 03或06中的任一的至少8、9、10、11、12、13、14、15、16、17、18、19、20个连续氨基酸残基的寡肽序列,且具有N-乙酰葡萄糖胺b-1,3-半乳糖基转移酶活性,或
vi.为SEQ ID NO:03、04、05、06、07或08中的任一,优选为SEQ ID NO 03、04、05、06或07中的任一,更优选为SEQ ID NO 03、06或07中的任一,最优选为SEQ ID NO 03或06中的任一的功能片段,且具有N-乙酰葡萄糖胺b-1,3-半乳糖基转移酶活性,或
vii.包括多肽,该多肽包括或由具有与SEQ ID NO:03、04、05、06、07或08中的任一,优选为SEQ ID NO 03、04、05、06或07中的任一,更优选为SEQ ID NO 03、06或07中的任一,最优选为SEQ ID NO 03或06中的任一的全长氨基酸序列的至少80%序列同一性的氨基酸序列所组成,且具有N-乙酰葡萄糖胺b-1,3-半乳糖基转移酶活性,或者
b.PFAM域IPR002659,且
i.包括SEQ ID NO 09的序列KT(Xn)[FY]XXKXDXD(Xm)[FHY]XXG(X,无A、G、S)(Xp)X(无F、H、W、Y)[DE]D[ILV]XX[AG],其中X是任何氨基酸,其中n是13至16,m是35至70,且p是20至45,或
ii.包括根据SEQ ID NO:10、11、12或13中的任一的多肽序列,或
iii.为SEQ ID NO:10、11、12或13中的任一的功能性同源物、变体或衍生物,其具有与SEQ ID NO:10、11、12或13的该N-乙酰葡萄糖胺b-1,3-半乳糖基转移酶多肽中的任一全长的至少80%整体序列同一性,且具有N-乙酰葡萄糖胺b-1,3-半乳糖基转移酶活性,或
iv.包括来自SEQ ID NO:10、11、12或13中的任一的至少8、9、10、11、12、13、14、15、16、17、18、19、20个连续氨基酸残基的寡肽序列,且具有N-乙酰葡萄糖胺b-1,3-半乳糖基转移酶活性,或
v.为SEQ ID NO:10、11、12或13中的任一的功能片段,且具有N-乙酰葡萄糖胺b-1,3-半乳糖基转移酶活性,或
vi.包括多肽,该多肽包括或由具有与SEQ ID NO:10、11、12或13中的任一的全长氨基酸序列的至少80%序列同一性的氨基酸序列所组成,且具有N-乙酰葡萄糖胺b-1,3-半乳糖基转移酶活性。
14.根据上述特定实施方案1至12的任一项的方法,其中该N-乙酰葡萄糖胺b-1,4-半乳糖基转移酶为糖基转移酶,其具有:
a.PFAM域PF01755,且
i.包括SEQ ID NO 14的序列EXXCXXSHXX[ILV][FWY](Xn)EDD(Xm)[ACGST]XXYX[ILMV],其中X是任何氨基酸,其中n为13至15且m是50至76,或
ii.包括根据SEQ ID NO:15、16、17、18、19、20、21、22或23中的任一,优选为SEQ IDNO:15、16、17、18、20或21中的任一,更优选为SEQ ID NO:17、18、20或21中的任一的多肽序列,或
iii.为SEQ ID NO:15、16、17、18、19、20、21、22或23中的任一,优选为SEQ ID NO:15、16、17、18、20或21中的任一,更优选为SEQ ID NO:17、18、20或21中的任一的功能性同源物、变体或衍生物,其具有与SEQ ID NO:15、16、17、18、19、20、21、22或23中的任一,优选为SEQ ID NO:15、16、17、18、20或21中的任一,更优选为SEQ ID NO:17、18、20或21中的任一的该N-乙酰葡萄糖胺b-1,4-半乳糖基转移酶多肽全长的至少80%整体序列同一性且具有N-乙酰葡萄糖胺b-1,4-半乳糖基转移酶活性,或
iv.包括来自SEQ ID NO:15、16、17、18、19、20、21、22或23中的任一,优选为SEQ IDNO:15、16、17、18、20或21中的任一,更优选为SEQ ID NO:17、18、20或21中的任一的至少8、9、10、11、12、13、14、15、16、17、18、19、20个连续氨基酸残基的寡肽序列,且N-乙酰葡萄糖胺b-1,4-半乳糖基转移酶活性,或
v.为SEQ ID NO:15、16、17、18、19、20、21、22或23中的任一,优选为SEQ ID NO:15、16、17、18、20或21中的任一,更优选为SEQ ID NO:17、18、20或21中的任一的功能片段,且具有具有N-乙酰葡萄糖胺b-1,4-半乳糖基转移酶活性,或
vi.包括多肽,该多肽包括或由具有与SEQ ID NO:15、16、17、18、19、20、21、22或23中的任一,优选为SEQ ID NO:15、16、17、18、20或21中的任一,更优选为SEQ ID NO:17、18、20或21中的任一的全长氨基酸序列的至少80%序列同一性的氨基酸序列所组成,且具有N-乙酰葡萄糖胺b-1,4-半乳糖基转移酶活性,或者
b.PFAM域PF00535,且
i.包括SEQ ID NO 24的序列R[KN]XXXXXXXGXXXX[FL]XDXD(Xn)[FHW]XXX[FHNY](Xm)E[DE],其中X是任何氨基酸,其中n是50至75,m是10至30,或
ii.包括SEQ ID NO 25的序列R[KN]XXXXXXXGXXXXFXDXD(Xn)[FHW]XXX[FHNY](Xm)E[DE](Xp)[FWY]XX[HKR]XX[NQST],其中X是任何氨基酸,其中n是50至75,m是10至30,且p是20至25,或
iii.包括根据SEQ ID NO:26、27或28中的任一的多肽序列,或
iv.为SEQ ID NO:26、27或28中的任一的功能性同源物、变体或衍生物,其具有与SEQ ID NO:26、27或28的该N-乙酰葡萄糖胺b-1,4-半乳糖基转移酶多肽中的任一全长的至少80%整体序列同一性,且具有N-乙酰葡萄糖胺b-1,4-半乳糖基转移酶活性,或
v.包括来自SEQ ID NO:26、27或28中的任一的至少8、9、10、11、12、13、14、15、16、17、18、19、20个连续氨基酸残基的寡肽序列,且具有N-乙酰葡萄糖胺b-1,4-半乳糖基转移酶活性,或
vi.为SEQ ID NO:26、27或28中的任一的功能片段,且具有N-乙酰葡萄糖胺b-1,4-半乳糖基转移酶活性,或
vii.包括多肽,该多肽包括或由具有与SEQ ID NO:26、27或28中的任一的全长氨基酸序列的至少80%序列同一性的氨基酸序列所组成,且具有N-乙酰葡萄糖胺b-1,4-半乳糖基转移酶活性,或者
c.PFAM域PF02709且不具有PFAM域PF00535,且
i.包括SEQ ID NO 29的序列[FWY]XX[FY][FWY](X23)[FWY][GQ]X[DE]D,其中X是任何氨基酸,或
ii.包括SEQ ID NO 30的序列[PV]W[GHNP](Xn)[FWY][GQ]X[DE]D,其中X是任何氨基酸,其中n是21至24,或
iii.包括根据SEQ ID NO:31、32、33、34、35或36中的任一的多肽序列,或
iv.为SEQ ID NO:31、32、33、34、35或36中的任一的功能性同源物、变体或衍生物,其具有与SEQ ID NO:31、32、33、34、35或36的该N-乙酰葡萄糖胺b-1,4-半乳糖基转移酶多肽中的任一全长的至少80%整体序列同一性and具有N-乙酰葡萄糖胺b-1,4-半乳糖基转移酶活性,或
v.包括来自SEQ ID NO:31、32、33、34、35或36中的任一的至少8、9、10、11、12、13、14、15、16、17、18、19、20个连续氨基酸残基的寡肽序列,且具有N-乙酰葡萄糖胺b-1,4-半乳糖基转移酶活性,或
vi.为SEQ ID NO:31、32、33、34、35或36中的任一的功能片段,且具有N-乙酰葡萄糖胺b-1,4-半乳糖基转移酶活性,或
vii.包括多肽,该多肽包括或由具有与SEQ ID NO:31、32、33、34、35或36中的任一的全长氨基酸序列的至少80%序列同一性的氨基酸序列所组成,且具有N-乙酰葡萄糖胺b-1,4-半乳糖基转移酶活性,或者
d.PFAM域PF03808,且
i.包括SEQ ID NO 37的序列[ST][FHY]XN(Xn)DG(X16)[HKR]X[ST]FDXX[ST]XA,其中X是任何氨基酸,且其中n是20至25,或
ii.包括SEQ ID NO 38的序列[ST][FHY]XN(Xn)DG(X16)[HKR]X[ST]FDXX[ST]XA(Xm)[HR]XG[FWY](Xp)GXGXXXQ[DE],其中X是任何氨基酸,其中n是20至25,m是40至50,且p是22至30,或
iii.包括根据SEQ ID NO:39、40或41中的任一的多肽序列,或
iv.为SEQ ID NO:39、40或41中的任一的功能性同源物、变体或衍生物,其具有与SEQ ID NO:39、40或41的该N-乙酰葡萄糖胺b-1,4-半乳糖基转移酶多肽中的任一全长的至少80%整体序列同一性,且具有N-乙酰葡萄糖胺b-1,4-半乳糖基转移酶活性,或
v.包括来自SEQ ID NO:39、40或41中的任一的至少8、9、10、11、12、13、14、15、16、17、18、19、20个连续氨基酸残基的寡肽序列,且具有N-乙酰葡萄糖胺b-1,4-半乳糖基转移酶活性,或
vi.为SEQ ID NO:39、40或41中的任一的功能片段,且具有N-乙酰葡萄糖胺b-1,4-半乳糖基转移酶活性,或
vii.包括多肽,该多肽包括或由具有与SEQ ID NO:39、40或41中的任一的全长氨基酸序列的至少80%序列同一性的氨基酸序列所组成,且具有N-乙酰葡萄糖胺b-1,4-半乳糖基转移酶活性。
15.根据上述特定实施方案中任一项的方法,其中
a.该N-乙酰葡萄糖胺-6-磷酸转移酶为包括UniProt ID P43577的多肽的多肽序列、或为UniProt ID P43577的多肽的功能性同源物、变体或衍生物,其具有与UniProt IDP43577的多肽全长的至少80%整体序列同一性,且具有N-乙酰葡萄糖胺-6-磷酸转移酶活性,以及
b.该L-谷氨酰胺—D-果糖-6-磷酸转氨酶为包括UniProt ID P17169的多肽的多肽序列、或为具有UniProt ID P17169的多肽的功能性同源物、变体或衍生物,其具有与UniProt ID P17169的多肽全长的至少80%整体序列同一性,且具有L-谷氨酰胺—D-果糖-6-磷酸转氨酶活性;或为与UniProt ID P17169多肽不同的A39T、R250C和G472S突变的修饰版本。
16.根据上述特定实施方案中任一项的方法,其中该细胞可代谢碳源,其选自包含下列列举的群组:葡萄糖、果糖、半乳糖、乳糖、蔗糖、麦芽糖、麦芽-寡糖、麦芽三糖、山梨醇、木糖、鼠李糖、甘露糖、甲醇、乙醇、阿拉伯糖、海藻糖、淀粉、纤维素、半纤维素、玉米浸液、高果糖浆、糖蜜、甘油、乙酸盐、柠檬酸盐、乳酸、丙酮酸。
17.根据上述特定实施方案中任一项的方法,其中该细胞无法将N-乙酰葡萄糖胺-6-磷酸盐转换成葡萄糖胺-6-磷酸盐,及/或无法将葡萄糖胺-6-磷酸盐转换成果糖-6-磷酸盐。
18.根据上述特定实施方案中任一项的方法,其中该细胞经修饰以产生GDP-岩藻糖。
19.根据上述特定实施方案中任一项的方法,其中该细胞经修饰以促进GDP-岩藻糖产生,其中该修饰选择自包含下列列举的群组:UDP-葡萄糖:十一异戊二烯-磷酸葡萄糖-1-磷酸转移酶编码基因的剃除、GDP-L-岩藻糖合成酶编码基因的过度表达、GDP-甘露糖4,6-脱水酶编码基因的过度表达、甘露糖-1-磷酸盐鸟苷酸转移酶编码基因的过度表达、磷酸甘露糖变位酶编码基因的过度表达、或甘露糖-6-磷酸盐异构酶编码基因的过度表达。
20.根据上述特定实施方案中任一项的方法,其中该细胞经修饰以产生UDP-半乳糖。
21.根据上述特定实施方案中任一项的方法,其中该细胞经修饰以促进UDP-半乳糖产生,其中该修饰选择自包含下列列举的群组:5’-核苷酸酶/UDP-糖水解酶编码基因的剃除或半乳糖-1-磷酸盐尿苷酰转移酶编码基因的剃除。
22.根据上述特定实施方案中任一项的方法,其中该细胞经修饰以产生CMP-N-乙酰基神经氨酸。
23.根据上述特定实施方案中任一项的方法,其中该细胞经修饰以促进CMP-N-乙酰基神经氨酸产生,其中该修饰选择自包含下列列举的群组:CMP-唾液酸合成酶编码基因的过度表达、唾液酸合成酶编码基因的过度表达、N-乙酰基-D-葡萄糖胺2-表异构酶编码基因的过度表达。
24.根据上述特定实施方案中任一项的方法,其中该细胞能够表达至少一种其他糖基转移酶,其中该其他糖基转移酶选自包括下列的群组:岩藻糖基转移酶、唾液酸转移酶、半乳糖基转移酶、葡萄糖基转移酶、甘露糖基转移酶、N-乙酰基葡糖胺转移酶、N-乙酰基半乳糖胺转移酶、N-乙酰基甘露糖胺转移酶、木糖基转移酶、葡萄糖醛酸苷转移酶、半乳糖醛酸转移酶、葡萄糖胺转移酶、N-乙醇酰神经胺转移酶、鼠李糖基转移酶、N-乙酰基鼠李糖基转移酶、UDP-4-氨基-4,6-双去氧-N-乙酰基-β-L-阿卓糖胺转氨酶(UDP-4-amino-4,6-dideoxy-N-acetyl-beta-L-altrosamine transaminases)、UDP-N-乙酰葡萄糖胺烯醇丙酮基转移酶(UDP-N-acetylglucosamine enolpyruvyl transferases)和岩藻糖胺基转移酶(fucosaminyltransferases),
-优选地,该岩藻糖基转移酶选自包括下列列举:α-1,2-岩藻糖基转移酶、α-1,3-岩藻糖基转移酶、α-1,4-岩藻糖基转移酶及α-1,6-岩藻糖基转移酶,
-优选地,该唾液酸转移酶选自包括下列列举:α-2,3-唾液酸转移酶、α-2,6-唾液酸转移酶及α-2,8-唾液酸转移酶,
-优选地,该半乳糖基转移酶选自包括下列列举:β-1,3-半乳糖基转移酶、N-乙酰葡萄糖胺β-1,3-半乳糖基转移酶、β-1,4-半乳糖基转移酶、N-乙酰葡萄糖胺β-1,4-半乳糖基转移酶、α-1,3-半乳糖基转移酶及α-1,4-半乳糖基转移酶,
-优选地,该葡萄糖基转移酶选自包括下列列举:α-葡萄糖基转移酶、β-1,2-葡萄糖基转移酶、β-1,3-葡萄糖基转移酶及β-1,4-葡萄糖基转移酶,
-优选地,该甘露糖基转移酶(mannosyltransferase)选自包括下列列举:α-1,2-甘露糖基转移酶、α-1,3-甘露糖基转移酶及α-1,6-甘露糖基转移酶,
-优选地,该N-乙酰基葡糖胺转移酶选自包括下列列举:β-1,3-N-乙酰基葡糖胺转移酶及β-1,6-N-乙酰基葡糖胺转移酶,
-优选地,该N-乙酰基半乳糖胺转移酶为α-1,3-N-乙酰基半乳糖胺转移酶。
25.根据特定实施方案24的方法,其中该细胞在该其他糖基转移酶的表达或活性方面被修饰。
26.根据上述特定实施方案中任一项的方法,其中该细胞使用用于产生该在还原端具有GlcNAc单元的双糖或寡糖的一或多种前驱物,该前驱物从培养基供给该细胞。
27.根据上述特定实施方案中任一项的方法,其中该细胞产生一或多种前驱物,其用于产生该在还原端具有GlcNAc单元的双糖或寡糖。
28.根据特定实施方案26或27中任一项的方法,其中用于产生该双糖或寡糖的前驱物完全转化为还原端具有GlcNAc单元的双糖或寡糖。
29.根据上述特定实施方案中任一项的方法,其中该细胞在细胞内产生还原端具有GlcNAc单元的双糖或寡糖,且其中部分或实质上全部的所产生的还原端具有GlcNAc单元的双糖或寡糖保留在细胞内及/或经由被动或主动运输排出细胞外。
30.根据上述特定实施方案中任一项的方法,其中该细胞表达膜转运蛋白或具有转运活性的多肽,以转运化合物穿过细胞壁的外膜,
优选地,该细胞在该膜转运蛋白或具有转运活性的多肽的表达或活性方面被修饰。
31.根据特定实施方案30的方法,其中该膜转运蛋白或具有转运活性的多肽选自包括下列列举:运输蛋白、P-P-键-水解-驱动的转运体、β-桶状孔蛋白、辅助转运蛋白、推定转运蛋白及磷酸转移-驱动组转位蛋白,
优选地,该运输蛋白包括MFS转运体、糖排出转运体及螯铁蛋白输出体,
优选地,该P-P-键-水解-驱动的转运体包括ABC转运体及螯铁蛋白输出体。
32.根据特定实施方案30或31中任一项的方法,其中该膜转运蛋白或具有转运活性的多肽控制该还原端具有GlcNAc单元的双糖或寡糖及/或一或多种前驱物及/或接受者在细胞壁外膜上的流动,该一或多种前驱物及/或接受者用于产生该还原端具有GlcNAc单元的双糖或寡糖。
33.根据特定实施方案30或32中任一项的方法,其中该膜转运蛋白或具有转运活性的多肽提供该还原端具有GlcNAc单元的双糖或寡糖的改善产生及/或允许排出及/或促进排出。
34.根据特定实施方案6或33中任一项的方法,其中该细胞包括与未修饰的先驱细胞相比,用于降低乙酸盐产生的修饰。
35.根据特定实施方案34的方法,其中该细胞包括与未修饰的先驱细胞相比,任一或多种蛋白质的较低或减少的表达及/或消除、受损、降低或延迟的活性,该蛋白质包含:β-半乳糖苷酶、半乳糖苷O-乙酰转移酶、N-乙酰葡萄糖胺-6-磷酸盐去乙酰酶、葡萄糖胺-6-磷酸盐脱胺酶、N-乙酰葡萄糖胺抑制蛋白、核糖核苷酸单磷酸酶、EIICBA-Nag、UDP-葡萄糖:十一异戊二烯-磷酸葡萄糖-1-磷酸转移酶、L-岩藻酮糖激酶、L-岩藻糖异构酶、N-乙酰神经氨酸解离酶、N-乙酰甘露糖胺激酶、N-乙酰甘露糖胺-6-磷酸盐2-表异构酶、EIIAB-Man、EIIC-Man、EIID-Man、ushA、半乳糖-1-磷酸盐尿苷酰转移酶、葡萄糖-1-磷酸盐腺苷酰转移酶、葡萄糖-1-磷酸酶、ATP-依赖性6-磷酸果糖激酶同功酶1、ATP-依赖性6-磷酸果糖激酶同功酶2、葡萄糖-6-磷酸盐异构酶、有氧呼吸调控蛋白、转录抑制蛋白IclR、lon蛋白酶、葡萄糖特异性转位磷酸转移酶酶IIBC成分ptsG、葡萄糖特异性转位磷酸转移酶(PTS)酶IIBC成分malX、enzyme IIAGlc、β-葡萄糖苷特异性PTS酶II、果糖特异性PTS多磷酰转移蛋白FruA及FruB、乙醇脱氢酶醛脱氢酶、丙酮酸-甲酸盐解离酶、乙酸盐激酶、磷酰基转移酶、磷酸乙酰转移酶、丙酮酸去羧酶。
36.根据上述特定实施方案中任一项的方法,其中该细胞能够产生磷酸烯醇丙酮酸(PEP)。
37.根据特定实施方案6或36中任一项的方法,其中该细胞与未修饰的先驱细胞相比,具有用于磷酸烯醇丙酮酸(PEP)的促进产生及/或供应的修饰。
38.根据特定实施方案6至37中任一项的方法,其中该细胞包含至少部分失活的所选单糖、双糖或寡糖的分解代谢途径,该单糖、双糖或寡糖参与该还原端具有GlcNAc单元的双糖或寡糖的产生及/或为产生该还原端具有GlcNAc单元的双糖或寡糖所需。
39.根据上述特定实施方案中任一项的方法,其中当该细胞在乳糖与一或多种其他碳源结合的环境中生长时,该细胞抵抗乳糖杀伤现象。
40.根据上述特定实施方案中任一项的方法,其中该细胞在整个培养液及/或上清液产生90g/L或多于90g/L的该还原端具有GlcNAc的双糖或寡糖、及/或其中在整个培养液及/或上清液中的该还原端具有GlcNAc的双糖或寡糖具有至少80%的纯度,其在整个培养液及/或上清液中分别以该还原端具有GlcNAc单元的双糖或寡糖及其前驱物的总量计。
41.根据上述特定实施方案中任一项的方法,其中该细胞在培养基中稳定地培养。
42.根据上述特定实施方案中任一项的方法,其中该条件包括:
-使用包括至少一种前驱物及/或接受者的培养基,以用于产生该还原端具有GlcNAc单元的双糖或寡糖,及/或
-添加至少一种前驱物及/或接受者原料至培养基,以用于产生该还原端具有GlcNAc单元的双糖或寡糖。
43.根据上述特定实施方案中任一项的方法,该方法包括下列步骤中的至少一者:
i)使用包括至少一种前驱物及/或接受者的培养基;
ii)向反应器中的培养基添加至少一种前驱物及/或接受者原料,其中总反应器体积范围为250mL(毫升)至10,000m3(立方米),优选以连续方式,并且优选使得培养基的最终体积不超过在添加该前驱物及/或接受者原料之前的培养基体积的三倍,优选不超过两倍,更优选小于两倍;
iii)向反应器中的培养基添加至少一种前驱物及/或接受者原料,其中总反应器体积范围为250mL(毫升)至10,000m3(立方米),优选以连续方式,并且优选使得培养基的最终体积不超过在添加该前驱物及/或接受者原料之前的培养基体积的三倍,优选不超过两倍,更优选小于两倍,其中优选地,该前驱物及/或接受者原料的pH设定在3与7之间,且优选地,该前驱物及/或接受者原料的温度维持在20℃与80℃之间;
iv)通过进料溶液的手段在1天、2天、3天、4天、5天的过程中以连续方式添加至少一种前驱物及/或接受者原料至培养基;
v)通过进料溶液的手段在1天、2天、3天、4天、5天的过程中以连续方式添加至少一种前驱物及/或接受者原料至培养基,其中优选地,该进料溶液的pH设定在3与7之间,且优选地,该进料溶液的温度维持在20℃与80℃之间;
该方法产生该还原端具有GlcNAc单元的双糖或寡糖,其在最终培养物中的浓度为至少50g/L,优选为至少75g/L,更优选为至少90g/L,更优选为至少100g/L,更优选为至少125g/L,更优选为至少150g/L,更优选为至少175g/L,更优选为至少200g/L。
44.根据特定实施方案1至42中任一项的方法,该方法包括下列步骤中的至少一者:
i)使用每公升初始反应器体积包含至少50克,更优选为至少75克,更优选为至少100克,更优选为至少120克,更优选为至少150克乳糖的培养基,其中反应器体积范围为250mL至10,000m3(立方米);
ii)添加每公升初始反应器体积包含至少50克,更优选为至少75克,更优选为至少100克,更优选为至少120克,更优选为至少150克乳糖的乳糖原料至培养基,其中优选以连续方式,且优选地,使得培养基的最终体积不超过在添加该乳糖原料之前的培养基体积的三倍,优选不超过两倍,更优选小于两倍;
iii)添加每公升初始反应器体积包含至少50克,更优选为至少75克,更优选为至少100克,更优选为至少120克,更优选为至少150克乳糖的乳糖原料至培养基,其中反应器体积范围为250mL至10,000m3(立方米),优选以连续方式,且优选地,使得培养基的最终体积不超过在添加该乳糖原料之前的培养基体积的三倍,优选不超过两倍,更优选小于两倍,其中优选地,该乳糖原料的pH设定在3与7之间,且优选地,该乳糖原料的温度维持在20℃与80℃之间;
iv)通过进料溶液的手段在1天、2天、3天、4天、5天的过程中以连续方式添加乳糖原料至培养基;
v)通过进料溶液的手段在1天、2天、3天、4天、5天的过程中以连续方式添加乳糖原料至培养基,其中该乳糖进料溶液的浓度为50g/L,优选为75g/L,更优选为100g/L,更优选为125g/L,更优选为150g/L,更优选为175g/L,更优选为200g/L,更优选为225g/L,更优选为250g/L,更优选为275g/L,更优选为300g/L,更优选为325g/L,更优选为350g/L,更优选为375g/L,更优选为400g/L,更优选为450g/L,更优选为500g/L,又更优选为550g/L,最优选为600g/L;其中优选地,该进料溶液的pH设定在3与7之间,且优选地,该进料溶液的温度维持在20℃与80℃之间;
该方法产生该还原端具有GlcNAc单元的双糖或寡糖,其在最终培养物中的浓度为至少50g/L,优选为至少75g/L,更优选为至少90g/L,更优选为至少100g/L,更优选为至少125g/L,更优选为至少150g/L,更优选为至少175g/L,更优选为至少200g/L。
45.根据特定实施方案44的方法,其中该乳糖原料是通过从培养开始以至少5mM,优选以30、40、50、60、70、80、90、100、150mM的浓度添加乳糖,更优选为以>300mM的浓度添加乳糖而完成。
46.根据特定实施方案44或45中任一项的方法,其中该乳糖原料是通过将乳糖以一定浓度添加至培养物中而完成,使得在培养物的整个生产阶段获得至少5mM,优选为10mM或30mM的乳糖浓度。
47.根据上述特定实施方案中任一项的方法,其中该细胞培养至少约60、80、100或约120小时或以连续方式培养。
48.根据上述特定实施方案中任一项的方法,其中该培养基包含选自包括乳糖、半乳糖、岩藻糖及唾液酸的群组的至少一种前驱物。
49.根据上述特定实施方案中任一项的方法,其中通过向包含前驱物的培养基添加碳类基质,优选为葡萄糖或蔗糖,而提供指数细胞生长的第一阶段,接着在第二阶段,仅将碳类基质,优选为葡萄糖或蔗糖,添加到培养基中。
50.根据特定实施方案1至49中任一项的方法,其中通过向包含前驱物的培养基中加入碳类基质,优选为葡萄糖或蔗糖,而提供指数细胞生长的第一阶段,接着在第二阶段,其中碳类基质,优选为葡萄糖或蔗糖,及前驱物添加到培养基中。
51.根据上述特定实施方案中任一项的方法,其中该细胞产生带电的混合物,该混合物为包含至少一种还原端具有GlcNAc单元的双糖或寡糖,优选为唾液酸化的双糖及/或寡糖及/或中性的双糖及/或寡糖。
52.根据上述特定实施方案中任一项的方法,其中该细胞产生带电的混合物,该混合物为包含至少还原端具有GlcNAc单元的寡糖,优选为唾液酸化的寡糖及/或中性的寡糖。
53.根据上述特定实施方案中任一项的方法,其中该寡糖选自包括下列的列举:2-岩藻糖基乳-N-双糖、4-岩藻糖基乳-N-双糖、2-4-二岩藻糖基乳-N-双糖、3’-唾液酸乳-N-双糖、6’-唾液酸乳-N-双糖、3’,6’-二唾液酸乳-N-双糖、6,6’-二唾液酸乳-N-双糖、2’-岩藻糖基-3’-唾液酸乳-N-双糖、2’-岩藻糖基-6’-唾液酸乳-N-双糖、4-岩藻糖基-3’-唾液酸乳-N-双糖、4-岩藻糖基-6’-唾液酸乳-N-双糖、2-岩藻糖基N-乙酰乳糖胺、3’-岩藻糖基N-乙酰乳糖胺、2,3’-二岩藻糖基N-乙酰乳糖胺、3’-唾液酸N-乙酰乳糖胺、6’-唾液酸N-乙酰乳糖胺、3’,6’-二唾液酸N-乙酰乳糖胺、6,6’-二唾液酸N-乙酰乳糖胺、2’-岩藻糖基-3’-唾液酸N-乙酰乳糖胺、2’-岩藻糖基-6’-唾液酸N-乙酰乳糖胺、3-岩藻糖基-3’-唾液酸N-乙酰乳糖胺、3’-岩藻糖基-6’-唾液酸N-乙酰乳糖胺、P1三糖(Gal-a1,4-Gal-b1,4-GlcNAc)、异源移植抗原决定位(Gal-a1,3-Gal-b1,4-GlcNAc)、Gal-b14-(Galb13)-GlcNAc、聚-N-乙酰乳糖胺、GalNAc-b1,3-Gal-b1,4-GlcNAc。
54.根据特定实施方案1或3至53中任一项的方法,其中该还原端具有GlcNAc单元的双糖不包括几丁二糖(GlcNAc-GlcNAc)。
55.根据上述特定实施方案中任一项的方法,其中该还原端具有GlcNAc单元的寡糖在还原端不包括几丁二糖,优选为不包括N-聚糖。
56.一种用于产生还原端具有N-乙酰葡萄糖胺单元的寡糖或双糖的代谢工程细胞,其中该细胞能够:(i)合成核苷酸-糖及单糖N-乙酰葡萄糖胺(GlcNAc)、以及(ii)表达糖基转移酶以糖化该GlcNAc单糖,而产生该双糖或寡糖。
57.一种用于产生还原端具有N-乙酰葡萄糖胺单元的寡糖的代谢工程细胞,其中该细胞能够:(i)合成核苷酸-糖及单糖N-乙酰葡萄糖胺(GlcNAc)、以及(ii)表达糖基转移酶以糖化该GlcNAc单糖,而产生寡糖。
58.一种用于产生混合物的代谢工程细胞,该混合物包括(i)还原端具有N-乙酰葡萄糖胺单元的双糖及/或寡糖、以及(ii)一或多种基于乳糖的哺乳动物乳寡糖(MMOs),其中该细胞能够:(i)合成核苷酸-糖及单糖N-乙酰葡萄糖胺(GlcNAc)、以及(ii)表达糖基转移酶以糖化该GlcNAc单糖,而产生该还原端具有N-乙酰葡萄糖胺单元的双糖或寡糖。
59.根据特定实施方案56或58中任一项的细胞,其中该细胞经代谢工程以产生该还原端具有N-乙酰葡萄糖胺的双糖或寡糖。
60.根据特定实施方案57的细胞,其中该细胞经代谢工程以产生该还原端具有N-乙酰葡萄糖胺的寡糖。
61.根据特定实施方案56至60中任一项的细胞,其中该细胞以一或多种基因表达模组进行修饰,其特征在于任何该表达模组的表达形式是组成型或由天然诱导物所产生。
62.根据特定实施方案56至61中任一项的细胞,其中该细胞包括编码一蛋白质的相同编码DNA序列的多个复制。
63.根据特定实施方案56至62中任一项的细胞,其中该细胞表达至少一种N-乙酰葡萄糖胺-6-磷酸转移酶及磷酸酶,以合成N-乙酰葡萄糖胺。
64.根据特定实施方案56至63中任一项的细胞,其中该细胞表达至少一种糖基转移酶,以糖化N-乙酰葡萄糖胺。
65.根据特定实施方案56至64中任一项的细胞,其中该细胞在选自包括下列的群组的酶的表达或活性方面被修饰:N-乙酰葡萄糖胺-6-磷酸转移酶、磷酸酶、糖基转移酶、L-谷氨酰胺—D-果糖-6-磷酸转氨酶及UDP-葡萄糖4-表异构酶。
66.根据特定实施方案56至65中任一项的细胞,其中该核苷酸-糖选自包含下列的群组:UDP-半乳糖(UDP-Gal)、UDP-N-乙酰葡萄糖胺(UDP-GlcNAc)、UDP-N-乙酰半乳糖胺(UDP-GalNAc)、UDP-N-乙酰甘露糖胺(UDP-ManNAc)、GDP-岩藻糖(GDP-Fuc)、GDP-甘露糖(GDP-Man)、UDP-葡萄糖(UDP-Glc)、UDP-2-乙酰胺基-2,6-双去氧--L阿拉伯-4-己酮糖、UDP-2-乙酰胺基-2,6-双去氧--L-来苏-4-己酮糖、UDP-N-乙酰基-L-鼠李糖胺(UDP-L-RhaNAc或UDP-2-乙酰胺基-2,6-双去氧-L-甘露糖)、dTDP-N-乙酰岩藻糖胺、UDP-N-乙酰岩藻糖胺(UDP-L-FucNAc或UDP-2-乙酰胺基-2,6-双去氧-L-半乳糖)、UDP-N-乙酰基-L-肺炎糖胺(UDP-L-PneNAC或UDP-2-乙酰胺基-2,6-双去氧-L-塔罗糖)、UDP-N-乙酰胞壁酸、UDP-N-乙酰基-L-奎诺糖胺(UDP-L-QuiNAc或UDP-2-乙酰胺基-2,6-双去氧-L-葡萄糖)、GDP-L-异鼠李糖、CMP-N-乙酰基神经氨酸(CMP-Neu5Ac)、CMP-N-乙醇酰神经氨酸(CMP-Neu5Gc)、CMP-Neu4Ac、CMP-Neu5Ac9N3、CMP-Neu4,5Ac2、CMP-Neu5,7Ac2、CMP-Neu5,9Ac2、CMP-Neu5,7(8,9)Ac2、UDP-葡萄糖醛酸盐、UDP-半乳糖醛酸盐、GDP-鼠李糖及UDP-木糖。
67.根据特定实施方案56至66中任一项的细胞,其中该核苷酸-糖为UDP-半乳糖,且该糖基转移酶为N-乙酰葡萄糖胺b-1,3-半乳糖基转移酶或N-乙酰葡萄糖胺b-1,4-半乳糖基转移酶。
68.根据特定实施方案56至67中任一项的细胞,其中寡糖在该还原端具有乳-N-双糖(Gal-b1,3-GlcNAc)或N-乙酰乳糖胺(Gal-b1,4-GlcNAc)。
69.根据特定实施方案56至68中任一项的细胞,其中该N-乙酰葡萄糖胺b-1,3-半乳糖基转移酶为糖基转移酶,其具有:
a.PFAM域PF00535,且
i.包括SEQ ID NO 01的序列[AGPS]XXLN(Xn)RXDXD,其中X是任何氨基酸,其中n为12至17,或
ii.包括SEQ ID NO 02的序列PXXLN(Xn)RXDXD(Xm)[FWY]XX[HKR]XX[NQST],其中X是任何氨基酸,其中n是12至17且m是100至115,或
iii.包括根据SEQ ID NO:03、04、05、06、07或08中的任一,优选为SEQ ID NO 03、04、05、06或07中的任一,更优选为SEQ ID NO 03、06或07中的任一,最优选为SEQ ID NO 03或06中的任一的多肽序列,或
iv.为SEQ ID NO:03、04、05、06、07或08中的任一,优选为SEQ ID NO 03、04、05、06或07中的任一,更优选为SEQ ID NO 03、06或07中的任一,最优选为SEQ ID NO 03或06中的任一的功能性同源物、变体或衍生物,其具有与SEQ ID NO:03、04、05、06、07或08中的任一,优选为SEQ ID NO 03、04、05、06或07中的任一,更优选为SEQ ID NO 03、06或07中的任一,最优选为SEQ ID NO 03或06中的任一的该N-乙酰葡萄糖胺b-1,3-半乳糖基转移酶多肽全长的至少80%整体序列同一性且具有N-乙酰葡萄糖胺b-1,3-半乳糖基转移酶活性,或
v.包括来自SEQ ID NO:03、04、05、06、07或08中的任一,优选为SEQ ID NO 03、04、05、06或07中的任一,更优选为SEQ ID NO 03、06或07中的任一,最优选为SEQ ID NO 03或06中的任一的至少8、9、10、11、12、13、14、15、16、17、18、19、20个连续氨基酸残基的寡肽序列,且具有N-乙酰葡萄糖胺b-1,3-半乳糖基转移酶活性,或
vi.为SEQ ID NO:03、04、05、06、07或08中的任一,优选为SEQ ID NO 03、04、05、06或07中的任一,更优选为SEQ ID NO 03、06或07中的任一,最优选为SEQ ID NO 03或06中的任一的功能片段,且具有N-乙酰葡萄糖胺b-1,3-半乳糖基转移酶活性,或
vii.包括多肽,该多肽包括或由具有与SEQ ID NO:03、04、05、06、07或08中的任一,优选为SEQ ID NO 03、04、05、06或07中的任一,更优选为SEQ ID NO 03、06或07中的任一,最优选为SEQ ID NO 03或06中的任一的全长氨基酸序列的至少80%序列同一性的氨基酸序列所组成,且具有N-乙酰葡萄糖胺b-1,3-半乳糖基转移酶活性,或者
b.PFAM域IPR002659,且
i.包括SEQ ID NO 09的序列KT(Xn)[FY]XXKXDXD(Xm)[FHY]XXG(X,无A、G、S)(Xp)X(无F、H、W、Y)[DE]D[ILV]XX[AG],其中X是任何氨基酸,其中n是13至16,m是35至70,且p是20至45,或
ii.包括根据SEQ ID NO:10、11、12或13中的任一的多肽序列,或
iii.为SEQ ID NO:10、11、12或13中的任一的功能性同源物、变体或衍生物,其具有与SEQ ID NO:10、11、12或13的该N-乙酰葡萄糖胺b-1,3-半乳糖基转移酶多肽中的任一全长的至少80%整体序列同一性,且具有N-乙酰葡萄糖胺b-1,3-半乳糖基转移酶活性,或
iv.包括来自SEQ ID NO:10、11、12或13中的任一的至少8、9、10、11、12、13、14、15、16、17、18、19、20个连续氨基酸残基的寡肽序列,且具有N-乙酰葡萄糖胺b-1,3-半乳糖基转移酶活性,或
v.为SEQ ID NO:10、11、12或13中的任一的功能片段,且具有N-乙酰葡萄糖胺b-1,3-半乳糖基转移酶活性,或
vi.包括多肽,该多肽包括或由具有与SEQ ID NO:10、11、12或13中的任一的全长氨基酸序列的至少80%序列同一性的氨基酸序列所组成,且具有N-乙酰葡萄糖胺b-1,3-半乳糖基转移酶活性。
70.根据特定实施方案56至69中任一项的细胞,其中该N-乙酰葡萄糖胺b-1,4-半乳糖基转移酶为糖基转移酶,其具有:
a.PFAM域PF01755,且
i.包括SEQ ID NO 14的序列EXXCXXSHXX[ILV][FWY](Xn)EDD(Xm)[ACGST]XXYX[ILMV],其中X是任何氨基酸,其中n为13至15且m是50至76,或
ii.包括根据SEQ ID NO:15、16、17、18、19、20、21、22或23中的任一,优选为SEQ IDNO:15、16、17、18、20或21中的任一,更优选为SEQ ID NO:17、18、20或21中的任一的多肽序列,或
iii.为SEQ ID NO:15、16、17、18、19、20、21、22或23中的任一,优选为SEQ ID NO:15、16、17、18、20或21中的任一,更优选为SEQ ID NO:17、18、20或21中的任一的功能性同源物、变体或衍生物,其具有与SEQ ID NO:15、16、17、18、19、20、21、22或23中的任一,优选为SEQ ID NO:15、16、17、18、20或21中的任一,更优选为SEQ ID NO:17、18、20或21中的任一的该N-乙酰葡萄糖胺b-1,4-半乳糖基转移酶多肽全长的至少80%整体序列同一性且具有N-乙酰葡萄糖胺b-1,4-半乳糖基转移酶活性,或
iv.包括来自SEQ ID NO:15、16、17、18、19、20、21、22或23中的任一,优选为SEQ IDNO:15、16、17、18、20或21中的任一,更优选为SEQ ID NO:17、18、20或21中的任一的至少8、9、10、11、12、13、14、15、16、17、18、19、20个连续氨基酸残基的寡肽序列,且具有N-乙酰葡萄糖胺b-1,4-半乳糖基转移酶活性,或
v.为SEQ ID NO:15、16、17、18、19、20、21、22或23中的任一,优选为SEQ ID NO:15、16、17、18、20或21中的任一,更优选为SEQ ID NO:17、18、20或21中的任一的功能片段,且具有N-乙酰葡萄糖胺b-1,4-半乳糖基转移酶活性,或
vi.包括多肽,该多肽包括或由具有与SEQ ID NO:15、16、17、18、19、20、21、22或23中的任一,优选为SEQ ID NO:15、16、17、18、20或21中的任一,更优选为SEQ ID NO:17、18、20或21中的任一的全长氨基酸序列的至少80%序列同一性的氨基酸序列所组成,且具有N-乙酰葡萄糖胺b-1,4-半乳糖基转移酶活性,或者
b.PFAM域PF00535,且
i.包括SEQ ID NO 24的序列R[KN]XXXXXXXGXXXX[FL]XDXD(Xn)[FHW]XXX[FHNY](Xm)E[DE],其中X是任何氨基酸,其中n是50至75,m是10至30,或
ii.包括SEQ ID NO 25的序列R[KN]XXXXXXXGXXXXFXDXD(Xn)[FHW]XXX[FHNY](Xm)E[DE](Xp)[F WY]XX[HKR]XX[NQST],其中X是任何氨基酸,其中n是50至75,m是10至30,且p是20至25,或
iii.包括根据SEQ ID NO:26、27或28中的任一的多肽序列,或
iv.为SEQ ID NO:26、27或28中的任一的功能性同源物、变体或衍生物,其具有与SEQ ID NO:26、27或28的该N-乙酰葡萄糖胺b-1,4-半乳糖基转移酶多肽中的任一全长的至少80%整体序列同一性,且具有N-乙酰葡萄糖胺b-1,4-半乳糖基转移酶活性,或
v.包括来自SEQ ID NO:26、27或28中的任一的至少8、9、10、11、12、13、14、15、16、17、18、19、20个连续氨基酸残基的寡肽序列,且具有N-乙酰葡萄糖胺b-1,4-半乳糖基转移酶活性,或
vi.为SEQ ID NO:26、27或28中的任一的功能片段,且具有N-乙酰葡萄糖胺b-1,4-半乳糖基转移酶活性,或
vii.包括多肽,该多肽包括或由具有与SEQ ID NO:26、27或28中的任一的全长氨基酸序列的至少80%序列同一性的氨基酸序列所组成,且具有N-乙酰葡萄糖胺b-1,4-半乳糖基转移酶活性,或者
c.PFAM域PF02709且不具有PFAM域PF00535,且
i.包括SEQ ID NO 29的序列[FWY]XX[FY][FWY](X23)[FWY][GQ]X[DE]D,其中X是任何氨基酸,或
ii.包括SEQ ID NO 30的序列[PV]W[GHNP](Xn)[FWY][GQ]X[DE]D,其中X是任何氨基酸,其中n是21至24,或
iii.包括根据SEQ ID NO:31、32、33、34、35或36中的任一的多肽序列,或
iv.为SEQ ID NO:31、32、33、34、35或36中的任一的功能性同源物、变体或衍生物,其具有与SEQ ID NO:31、32、33、34、35或36的该N-乙酰葡萄糖胺b-1,4-半乳糖基转移酶多肽中的任一全长的至少80%整体序列同一性,且具有N-乙酰葡萄糖胺b-1,4-半乳糖基转移酶活性,或
v.包括来自SEQ ID NO:31、32、33、34、35或36中的任一的至少8、9、10、11、12、13、14、15、16、17、18、19、20个连续氨基酸残基的寡肽序列,且具有N-乙酰葡萄糖胺b-1,4-半乳糖基转移酶活性,或
vi.为SEQ ID NO:31、32、33、34、35或36中的任一的功能片段,且具有N-乙酰葡萄糖胺b-1,4-半乳糖基转移酶活性,或
vii.包括多肽,该多肽包括或由具有与SEQ ID NO:31、32、33、34、35或36中的任一的全长氨基酸序列的至少80%序列同一性的氨基酸序列所组成,且具有N-乙酰葡萄糖胺b-1,4-半乳糖基转移酶活性,或
d.PFAM域PF03808,且
i.包括SEQ ID NO 37的序列[ST][FHY]XN(Xn)DG(X16)[HKR]X[ST]FDXX[ST]XA,其中X是任何氨基酸,且其中n是20至25,或
ii.包括SEQ ID NO 38的序列[ST][FHY]XN(Xn)DG(X16)[HKR]X[ST]FDXX[ST]XA(Xm)[HR]XG[FWY](Xp)GXGXXXQ[DE],其中X是任何氨基酸,其中n是20至25,m是40至50,且p是22至30,或
iii.包括根据SEQ ID NO:39、40或41中的任一的多肽序列,或
iv.为SEQ ID NO:39、40或41中的任一的功能性同源物、变体或衍生物,其具有与SEQ ID NO:39、40或41的该N-乙酰葡萄糖胺b-1,4-半乳糖基转移酶多肽中的任一全长的至少80%整体序列同一性,且具有N-乙酰葡萄糖胺b-1,4-半乳糖基转移酶活性,或
v.包括来自SEQ ID NO:39、40或41中的任一的至少8、9、10、11、12、13、14、15、16、17、18、19、20个连续氨基酸残基的寡肽序列,且具有N-乙酰葡萄糖胺b-1,4-半乳糖基转移酶活性,或
vi.为SEQ ID NO:39、40或41中的任一的功能片段,且具有N-乙酰葡萄糖胺b-1,4-半乳糖基转移酶活性,或
vii.包括多肽,该多肽包括或由具有与SEQ ID NO:39、40或41中的任一的全长氨基酸序列的至少80%序列同一性的氨基酸序列所组成,且具有N-乙酰葡萄糖胺b-1,4-半乳糖基转移酶活性。
71.根据特定实施方案56至70中任一项的细胞,其中
a.该N-乙酰葡萄糖胺-6-磷酸转移酶为包括UniProt ID P43577的多肽的多肽序列,或为UniProt ID P43577的多肽的功能性同源物、变体或衍生物,其具有与UniProt IDP43577的多肽全长的至少80%整体序列同一性,且具有N-乙酰葡萄糖胺-6-磷酸转移酶活性,以及
b.该L-谷氨酰胺—D-果糖-6-磷酸转氨酶为包括UniProt ID P17169的多肽的多肽序列,或为具有UniProt ID P17169的多肽的功能性同源物、变体或衍生物,其具有与UniProt ID P17169的多肽全长的至少80%整体序列同一性,且具有L-谷氨酰胺—D-果糖-6-磷酸转氨酶活性;为与UniProt ID P17169多肽不同的A39T、R250C和G472S突变的修饰版本。
72.根据特定实施方案56至71中任一项的细胞,其中该细胞可代谢碳源,其选自包含下列列举的群组:葡萄糖、果糖、半乳糖、乳糖、蔗糖、麦芽糖、麦芽-寡糖、麦芽三糖、山梨醇、木糖、鼠李糖、甘露糖、甲醇、乙醇、阿拉伯糖、海藻糖、淀粉、纤维素、半纤维素、玉米浸液、高果糖浆、糖蜜、甘油、乙酸盐、柠檬酸盐、乳酸、丙酮酸。
73.根据特定实施方案56至72中任一项的细胞,其中该细胞无法将N-乙酰葡萄糖胺-6-磷酸盐转换成葡萄糖胺-6-磷酸盐,及/或无法将葡萄糖胺-6-磷酸盐转换成果糖-6-磷酸盐。
74.根据特定实施方案56至73中任一项的细胞,其中该细胞经修饰以产生GDP-岩藻糖。
75.根据特定实施方案56至74中任一项的细胞,其中该细胞经修饰以促进GDP-岩藻糖产生,其中该修饰选择自包含下列列举的群组:UDP-葡萄糖:十一异戊二烯-磷酸葡萄糖-1-磷酸转移酶编码基因的剃除、GDP-L-岩藻糖合成酶编码基因的过度表达、GDP-甘露糖4,6-脱水酶编码基因的过度表达、甘露糖-1-磷酸盐鸟苷酸转移酶编码基因的过度表达、磷酸甘露糖变位酶编码基因的过度表达、或甘露糖-6-磷酸盐异构酶编码基因的过度表达。
76.根据特定实施方案56至75中任一项的细胞,其中该细胞经修饰以产生UDP-半乳糖。
77.根据特定实施方案56至76中任一项的细胞,其中该细胞经修饰以促进UDP-半乳糖产生,其中该修饰选择自包含下列列举的群组:5’-核苷酸酶/UDP-糖水解酶编码基因的剃除或半乳糖-1-磷酸盐尿苷酰转移酶编码基因的剃除。
78.根据特定实施方案56至75中任一项的细胞,其中该细胞经修饰以产生CMP-N-乙酰基神经氨酸。
79.根据特定实施方案56至78中任一项的细胞,其中该细胞经修饰以促进CMP-N-乙酰基神经氨酸产生,其中该修饰选择自包含下列列举的群组:CMP-唾液酸合成酶编码基因的过度表达、唾液酸合成酶编码基因的过度表达、N-乙酰基-D-葡萄糖胺2-表异构酶编码基因的过度表达。
80.根据特定实施方案56至79中任一项的细胞,其中该细胞能够表达至少一种其他糖基转移酶,其中该其他糖基转移酶选自包括下列的群组:岩藻糖基转移酶、唾液酸转移酶、半乳糖基转移酶、葡萄糖基转移酶、甘露糖基转移酶、N-乙酰基葡糖胺转移酶、N-乙酰基半乳糖胺转移酶、N-乙酰基甘露糖胺转移酶、木糖基转移酶、葡萄糖醛酸苷转移酶、半乳糖醛酸转移酶、葡萄糖胺转移酶、N-乙醇酰神经胺转移酶、鼠李糖基转移酶、N-乙酰基鼠李糖基转移酶、UDP-4-氨基-4,6-双去氧-N-乙酰基-β-L-阿卓糖胺转氨酶、UDP-N-乙酰葡萄糖胺烯醇丙酮基转移酶和岩藻糖胺基转移酶,
-优选地,该岩藻糖基转移酶选自包括下列列举:α-1,2-岩藻糖基转移酶、α-1,3-岩藻糖基转移酶、α-1,4-岩藻糖基转移酶及α-1,6-岩藻糖基转移酶,
-优选地,该唾液酸转移酶选自包括下列列举:α-2,3-唾液酸转移酶、α-2,6-唾液酸转移酶及α-2,8-唾液酸转移酶,
-优选地,该半乳糖基转移酶选自包括下列列举:β-1,3-半乳糖基转移酶、N-乙酰葡萄糖胺β-1,3-半乳糖基转移酶、β-1,4-半乳糖基转移酶、N-乙酰葡萄糖胺β-1,4-半乳糖基转移酶、α-1,3-半乳糖基转移酶及α-1,4-半乳糖基转移酶,
-优选地,该葡萄糖基转移酶选自包括下列列举:α-葡萄糖基转移酶、β-1,2-葡萄糖基转移酶、β-1,3-葡萄糖基转移酶及β-1,4-葡萄糖基转移酶,
-优选地,该甘露糖基转移酶选自包括下列列举:α-1,2-甘露糖基转移酶、α-1,3-甘露糖基转移酶及α-1,6-甘露糖基转移酶,
-优选地,该N-乙酰基葡糖胺转移酶选自包括下列列举:β-1,3-N-乙酰基葡糖胺转移酶及β-1,6-N-乙酰基葡糖胺转移酶,
-优选地,该N-乙酰基半乳糖胺转移酶为α-1,3-N-乙酰基半乳糖胺转移酶。
81.根据特定实施方案80的细胞,其中该细胞在该其他糖基转移酶的表达或活性方面被修饰。
82.根据特定实施方案56至81中任一项的细胞,其中该细胞使用用于产生该在还原端具有GlcNAc单元的双糖或寡糖的一或多种前驱物,该前驱物从培养基供给该细胞。
83.根据特定实施方案56至82中任一项的细胞,其中该细胞产生一或多种前驱物,其用于产生该在还原端具有GlcNAc单元的双糖或寡糖。
84.根据特定实施方案82或83中任一项的细胞,其中用于产生该双糖或寡糖的前驱物完全转化为还原端具有GlcNAc单元的双糖或寡糖。
85.根据特定实施方案56至84中任一项的细胞,其中该细胞在细胞内产生还原端具有GlcNAc单元的双糖或寡糖,且其中部分或实质上全部的所产生的还原端具有GlcNAc单元的双糖或寡糖保留在细胞内及/或经由被动或主动运输排出细胞外。
86.根据特定实施方案56至85中任一项的细胞,其中该细胞表达膜转运蛋白或具有转运活性的多肽,以转运化合物穿过细胞壁的外膜,
优选地,该细胞在该膜转运蛋白或具有转运活性的多肽的表达或活性方面被修饰。
87.根据特定实施方案86的细胞,其中该膜转运蛋白或具有转运活性的多肽选自包括下列列举:运输蛋白、P-P-键-水解-驱动的转运体、β-桶状孔蛋白、辅助转运蛋白、推定转运蛋白及磷酸转移-驱动组转位蛋白,
优选地,该运输蛋白包括MFS转运体、糖排出转运体及螯铁蛋白输出体,
优选地,该P-P-键-水解-驱动的转运体包括ABC转运体及螯铁蛋白输出体。
88.根据特定实施方案86或87中任一项的细胞,其中该膜转运蛋白或具有转运活性的多肽控制该还原端具有GlcNAc单元的双糖或寡糖及/或一或多种前驱物及/或接受者在细胞壁外膜上的流动,该一或多种前驱物及/或接受者用于产生该还原端具有GlcNAc单元的双糖或寡糖。
89.根据特定实施方案86至88中任一项的细胞,其中该膜转运蛋白或具有转运活性的多肽提供该还原端具有GlcNAc单元的双糖或寡糖的改善产生及/或允许排出及/或促进排出。
90.根据特定实施方案56至89中任一项的细胞,其中该细胞包括与未修饰的先驱细胞相比,用于降低乙酸盐产生的修饰。
91.根据特定实施方案90的细胞,其中该细胞包括与未修饰的先驱细胞相比,任一或多种蛋白质的较低或减少的表达及/或消除、受损、降低或延迟的活性,该蛋白质包含:β-半乳糖苷酶、半乳糖苷O-乙酰转移酶、N-乙酰葡萄糖胺-6-磷酸盐去乙酰酶、葡萄糖胺-6-磷酸盐脱胺酶、N-乙酰葡萄糖胺抑制蛋白、核糖核苷酸单磷酸酶、EIICBA-Nag、UDP-葡萄糖:十一异戊二烯-磷酸葡萄糖-1-磷酸转移酶、L-岩藻酮糖激酶、L-岩藻糖异构酶、N-乙酰神经氨酸解离酶、N-乙酰甘露糖胺激酶、N-乙酰甘露糖胺-6-磷酸盐2-表异构酶、EIIAB-Man、EIIC-Man、EIID-Man、ushA、半乳糖-1-磷酸盐尿苷酰转移酶、葡萄糖-1-磷酸盐腺苷酰转移酶、葡萄糖-1-磷酸酶、ATP-依赖性6-磷酸果糖激酶同功酶1、ATP-依赖性6-磷酸果糖激酶同功酶2、葡萄糖-6-磷酸盐异构酶、有氧呼吸调控蛋白、转录抑制蛋白IclR、lon蛋白酶、葡萄糖特异性转位磷酸转移酶酶IIBC成分ptsG、葡萄糖特异性转位磷酸转移酶(PTS)酶IIBC成分malX、enzyme IIAGlc、β-葡萄糖苷特异性PTS酶II、果糖特异性PTS多磷酰转移蛋白FruA及FruB、乙醇脱氢酶醛脱氢酶、丙酮酸-甲酸盐解离酶、乙酸盐激酶、磷酰基转移酶、磷酸乙酰转移酶、丙酮酸去羧酶。
92.根据特定实施方案56至91中任一项的细胞,其中细胞能够产生磷酸烯醇丙酮酸(PEP)。
93.根据特定实施方案56至92中任一项的细胞,该细胞与未修饰的先驱细胞相比,具有用于磷酸烯醇丙酮酸(PEP)的促进产生及/或供应的修饰。
94.根据特定实施方案56至93中任一项的细胞,其中该细胞包含至少部分失活的所选单糖、双糖或寡糖的分解代谢途径,该单糖、双糖或寡糖参与该还原端具有GlcNAc单元的双糖或寡糖的产生及/或为产生该还原端具有GlcNAc单元的双糖或寡糖所需。
95.根据特定实施方案56至94中任一项的细胞,其中当该细胞在乳糖与一或多种其他碳源结合的环境中生长时,该细胞抵抗乳糖杀伤现象。
96.根据特定实施方案56至95中任一项的细胞,其中该细胞在整个培养液及/或上清液产生90g/L或多于90g/L的该还原端具有GlcNAc的双糖或寡糖、及/或其中在整个培养液及/或上清液中的该还原端具有GlcNAc的双糖或寡糖具有至少80%的纯度,其在整个培养液及/或上清液中分别以该还原端具有GlcNAc单元的双糖或寡糖及其前驱物的总量计。
97.根据特定实施方案56至96中任一项的细胞,其中该细胞产生带电的混合物,该混合物为包含至少一种还原端具有GlcNAc单元的双糖或寡糖,优选为唾液酸化的双糖及/或寡糖及/或中性的双糖及/或寡糖。
98.根据特定实施方案56至97中任一项的细胞,其中该细胞产生带电的混合物,该混合物为包含至少还原端具有GlcNAc单元的寡糖,优选为唾液酸化的寡糖及/或中性的寡糖。
99.根据特定实施方案56至98中任一项的细胞,其中该寡糖选自包括下列的列举:2-岩藻糖基乳-N-双糖、4-岩藻糖基乳-N-双糖、2-4-二岩藻糖基乳-N-双糖、3’-唾液酸乳-N-双糖、6’-唾液酸乳-N-双糖、3’,6’-二唾液酸乳-N-双糖、6,6’-二唾液酸乳-N-双糖、2’-岩藻糖基-3’-唾液酸乳-N-双糖、2’-岩藻糖基-6’-唾液酸乳-N-双糖、4-岩藻糖基-3’-唾液酸乳-N-双糖、4-岩藻糖基-6’-唾液酸乳-N-双糖、2-岩藻糖基N-乙酰乳糖胺、3’-岩藻糖基N-乙酰乳糖胺、2,3’-二岩藻糖基N-乙酰乳糖胺、3’-唾液酸N-乙酰乳糖胺、6’-唾液酸N-乙酰乳糖胺、3’,6’-二唾液酸N-乙酰乳糖胺、6,6’-二唾液酸N-乙酰乳糖胺、2’-岩藻糖基-3’-唾液酸N-乙酰乳糖胺、2’-岩藻糖基-6’-唾液酸N-乙酰乳糖胺、3-岩藻糖基-3’-唾液酸N-乙酰乳糖胺、3’-岩藻糖基-6’-唾液酸N-乙酰乳糖胺、P1三糖(Gal-a1,4-Gal-b1,4-GlcNAc)、异源移植抗原决定位(Gal-a1,3-Gal-b1,4-GlcNAc)、Gal-b14-(Galb13)-GlcNAc、聚-N-乙酰乳糖胺、GalNAc-b1,3-Gal-b1,4-GlcNAc。
100.根据特定实施方案56或58至99中任一项的细胞,其中该还原端具有GlcNAc单元的双糖不包括几丁二糖(GlcNAc-GlcNAc)。
101.根据特定实施方案56至100中任一项的细胞,其中该还原端具有GlcNAc单元的寡糖在还原端不包括几丁二糖,优选为不包括N-聚糖。
102.根据特定实施方案56至101中任一项的细胞或根据特定实施方案1至55中任一项的方法,其中该细胞为细菌、真菌、酵母菌、植物细胞、动物细胞或原生动物细胞,
-优选地,该细菌为大肠杆菌菌株,更优选为大肠杆菌菌株K12菌株,又更优选地,该大肠杆菌菌株K12菌株为大肠杆菌MG1655,
-优选地,该真菌属于选自包括黑霉菌属、网柱黏菌属、青霉菌属、白霉菌属或曲菌属的群组的属(genus),
-优选地,该酵母菌属于选自包括酵母属、接合酵母菌属、毕赤酵母菌属、克马格特勒酵母、汉逊氏酵母菌属、子囊菌酵母属、拟球酵母菌属、克鲁维酵母菌属或德巴利酵母菌属的群组的属,
-优选地,该植物细胞为藻细胞或衍生自烟草、苜蓿、稻米、番茄、棉花、油菜籽、大豆、玉米或谷类植物,
-优选地,该动物细胞衍生自非人类哺乳动物、鸟类、鱼类、无脊椎动物、爬虫类、两栖类或昆虫类、或为衍生自排除胚胎干细胞的人类细胞的基因改造细胞株,更优选地,该人类及非人类哺乳动物细胞为上皮细胞、胚胎肾细胞、纤维母细胞、COS细胞、中国仓鼠卵巢(CHO)细胞、鼠骨髓瘤细胞、NIH-3T3细胞、非乳腺成体干细胞或其衍生物,更优选地,该昆虫细胞衍生自秋行军虫、蚕、甘蓝夜蛾、粉纹夜蛾或黑腹果蝇,
-优选地,该原生动物细胞为狼蛛利什曼原虫细胞。
103.根据特定实施方案102的细胞或根据特定实施方案102的方法,其中该细胞为活的革兰氏阴性菌,其包含与未修饰的先驱细胞相比,降低或消除聚-N-乙酰-葡萄糖胺(PNAG)、肠细菌共同抗原(ECA)、纤维素、可拉酸、核心寡糖、渗压调节间质葡聚糖(OPG)、葡萄糖基甘油、聚糖及/或海藻糖的合成。
104.根据特定实施方案1至55、102或103中任一项的方法,其中该分离包括下列列举的至少一种:澄清、超微过滤、纳米过滤、两相分配、逆渗透、微过滤、活性炭或碳处理、非离子界面活性剂处理、酶消化、切向流高性能过滤、切向流超微过滤、亲和色谱、离子交换色谱、疏水交互作用色谱及/或凝胶过滤、配体交换色谱。
105.根据特定实施方案1至55、102至104中任一项的方法,其更包括自该细胞纯化该双糖或寡糖。
106.根据特定实施方案1至55、102至105中任一项的方法,其中该纯化包括下列步骤的至少一种:活性炭或碳的使用、炭的使用、纳米过滤、超微过滤、电泳、酶处理或离子交换、醇类的使用、含水的醇类混合物的使用、结晶、蒸发、沉淀、干燥、喷雾干燥、冻干、喷雾冷冻干燥、冷冻喷雾干燥、带式干燥、传送带干燥、真空带式干燥、真空传送带干燥、转筒干燥、滚筒干燥、真空转筒干燥或真空滚筒干燥。
107.一种根据特定实施方案56至103中任一项的细胞或根据特定实施方案1至55、102至106中任一项的方法用于产生还原端具有N-乙酰葡萄糖胺单元的双糖或寡糖的用途。
108.一种根据特定实施方案56、58至103中任一项的细胞或根据特定实施方案1、3至55、102至106中任一项的方法用于产生还原端具有N-乙酰葡萄糖胺单元的寡糖,优选为用于产生还原端具有N-乙酰葡萄糖胺单元的带电或中性寡糖,更优选为用于产生唾液酸化或岩藻糖基化形式的LNB或LacNAc的用途。
以下实施例将作为本发明的进一步说明和澄清,并且不旨在限制本发明。
实施例
实施例1:材料和方法大肠杆菌
培养基
Luria肉汤(Luria Broth,LB)培养基由1%胰蛋白胨(Difco,Erembodegem,Belgium)、0.5%酵母菌萃取物(Difco)和0.5%氯化钠(VWR.Leuven,Belgium)组成。用于96孔盘培养物实验或摇瓶实验的培养基包含2.00g/L NH4Cl、5.00g/L(NH4)2SO4、2.993g/LKH2PO4、7.315g/L K2HPO4、8.372g/L MOPS、0.5g/L NaCl、0.5g/L MgSO4.7H2O、30g/L蔗糖或30g/L甘油、1ml/L维生素溶液、100μL/L钼酸盐溶液和1ml/L硒溶液。如各自实施例中所述,0.30g/L唾液酸、20g/L乳糖、20g/L LacNAc及/或20g/L LNB额外添加至培养基作为前驱物。用1M KOH将培养基的pH值设为7。维生素溶液由3.6g/LFeCl2.4H2O、5g/L CaCl2.2H2O、1.3g/L MnCl2.2H2O、0.38g/L CuCl2.2H2O、0.5g/L CoCl2.6H2O、0.94g/L ZnCl2、0.0311g/L H3BO4、0.4g/L Na2EDTA.2H2O和1.01g/L盐酸硫胺组成。钼酸盐溶液含有0.967g/LNaMoO4.2H2O。硒溶液含42g/L SeO2。
用于发酵的基本培养基含有6.75g/L NH4Cl、1.25g/L(NH4)2SO4、2.93g/LKH2PO4和7.31g/L KH2PO4、0.5g/L NaCl、0.5g/L MgSO4.7H2O、30g/L蔗糖或30g/L甘油、1mL/L维生素溶液、100μL/L钼酸盐溶液和1mL/L硒溶液,组成与上述相同。如各自实施例中所述,0.30g/L唾液酸、20g/L乳糖、20g/L LacNAc及/或20g/L LNB额外添加至用于发酵的基本培养基作为前驱物。
通过高压灭菌(121℃,21分钟)对复合培养基进行灭菌,并通过过滤(0.22μmSartorius)对基本培养基进行灭菌。必要时,通过添加抗生素:例如氯霉素(chloramphenicol)(20mg/L)、羧卡本西林(carbenicillin)(100mg/L)、观霉素(40mg/L)及/或康霉素(kanamycin)(50mg/L))使培养基具有选择性。
质体
pKD46(Red辅助质体,胺苄青霉素抗性)、pKD3(包含FRT侧接的氯霉素抗性(cat)基因)、pKD4(包含FRT侧接的康霉素抗性(kan)基因)和pCP20(表达FLP重组酶活性)质体从R.Cunin教授(Vrije Universiteit Brussel,Belgium in2007)获得。
质体维持在从Invitrogen购买的宿主大肠杆菌DH5α(F-,phi80dlacZΔM15,Δ(lacZYA-argF)U169,deoR,recA1,endA1,hsdR17(rk-,mk+),phoA,supE44,lambda-,thi-1,gyrA96,relA1)中。
菌株和突变
大肠杆菌K12 MG1655[λ-,F-,rph-1]于2007年3月从Coli Genetic StockCenter(US),CGSC菌株#:7740获得。使用Datsenko和Wanner(PNAS97(2000),6640-6645)发表的技术进行基因破坏、基因导入和基因置换。这项技术是基于通过lambda Red重组酶进行的同源重组后的抗生素选择。翻转酶重组酶的后续催化确保在最终生产菌株中去除抗生素选择盒。
将携带Red辅助质体pKD46的转形子在含有胺苄青霉素(100mg/L)和L-阿拉伯糖(10mM)的10ml LB培养基中于30℃培养至OD600nm为0.6。通过第一次用50ml冰冷水洗涤,第二次用1ml冰冷水洗涤,使细胞成为电转感受态(electrocompetent)。然后,将细胞重悬浮在50μl的冰冷水中。使用Gene PulserTM(BioRad)(600Ω、25μFD和250伏)用50μl细胞和10-100ng线性双链DNA产物进行电穿孔。
电穿孔后,将细胞加入1mL LB培养基中于37℃培养1h,并最后涂布于含有25mg/L氯霉素或50mg/L康霉素的LB琼脂上,以选择抗生素抗性转形子。所选择的突变体通过PCR用修饰区上游和下游的引子进行验证,并于42℃在LB琼脂中生长以失去辅助质体。对突变体测试胺苄青霉素敏感性。
使用pKD3、pKD4及其衍生物作为模板,通过PCR获得线性ds-DNA扩增子。所用的引子有一部分序列与模板互补,另一部分与染色体DNA上必须发生重组的那一侧互补。对于基因敲除,同源区域被设计为目标基因的起始密码子和终止密码子的上游50-nt和下游50-nt。对于基因敲入,必须考虑转录起点(+1)。PCR产物经PCR纯化,Dpnl消化,从琼脂糖凝胶再纯化,并悬浮于溶析缓冲液(5mM Tris,ph8.0)中。
将选择的突变体用pCP20质体转形,pCP20质体为胺苄青霉素和氯霉素抗性质体,其显示温度敏感复制和热诱导的FLP合成。于30℃选择胺苄青霉素抗性转形子,然后于42℃在LB中纯化少数菌落,并且然后测试所有抗生素抗性和FLP辅助质体的丢失。用对照引子检查基因剃除和敲入。
在GDP-岩藻糖及岩藻糖基化寡糖产生的一实施例中,突变菌株衍生自大肠杆菌K12 MG1655,其包括大肠杆菌wcaJ和thyA基因的剃除及持续型表达建构体的基因敲入,该建构体含有蔗糖转运体(例如,源自大肠杆菌W的CscB(UniProt ID E0IXR1))、果糖激酶(例如,源自运动发酵单胞菌(Zymomonas mobilis,ZmFrk)的frk(UniProt ID Q03417))、蔗糖磷酸化酶(例如,源自青春双歧杆菌(Bifidobacterium adolescentis)的BaSP(UniProt IDA0ZZH6)),另外包括表达质体,其具有用于α-1,2-岩藻糖基转移酶(例如,来自幽门螺旋杆菌的HpFutC(GenBank No.AAD29863.1))及/或α-1,3-岩藻糖基转移酶(例如,来自幽门螺旋杆菌的HpFucT(UniProt ID O30511))的持续型表达建构体、且具有用于大肠杆菌thyA(UniProt ID P0A884)的持续型表达建构体作为选择性标记。岩藻糖基转移酶基因的也可经由基因敲入而存在于突变的大肠杆菌菌株。通过基因剃除大肠杆菌基因(包括glgC、agp、pfkA、pfkB、pgi、arcA、iclR、pgi和lon)可进一步优化在突变大肠杆菌菌株中GDP-岩藻糖产生,如WO2016075243及WO2012007481所述。GDP-岩藻糖产生可另外被优化,其包括甘露糖-6-磷酸盐异构酶(例如,来自大肠杆菌的manA(UniProt ID P00946))、磷酸甘露糖变位酶(例如,来自大肠杆菌的manB(UniProt ID P24175))、甘露糖-1-磷酸盐鸟苷酸转移酶(例如,来自大肠杆菌的manC(UniProt ID P24174))、GDP-甘露糖4,6-脱水酶(例如,来自大肠杆菌的gmd(UniProt ID P0AC88))及GDP-L-岩藻糖合成酶(例如,来自大肠杆菌的fcl(UniProt ID P32055))的持续型表达建构体的基因敲入。GDP-岩藻糖产生也可通过大肠杆菌fucK及fucI的基因剃除与含有岩藻糖通透酶(例如,来自大肠杆菌的fucP(UniProt IDP11551))及具有岩藻糖激酶/岩藻糖-1-磷酸盐鸟苷酸转移酶活性的双官能酶(例如,来自脆弱拟杆菌的fkp(UniProt ID SUV40286.1))的持续型表达建构体的基因敲入而获得。如果产生GDP-岩藻糖的突变菌株旨在制造岩藻糖基化乳糖结构,则该菌株还需通过基因剃除大肠杆菌LacZ、LacY和LacA基因以及用于乳糖通透酶(例如,大肠杆菌LacY(UniProt IDP02920))的持续型表达建构体的基因敲入进行修饰。或者,及/或另外,GDP-岩藻糖及/或岩藻糖基化寡糖产生可通过持续型转录单元(constitutive transcriptional units)的基因敲入而在突变大肠杆菌菌株中进一步优化,该转录单元包含膜转运蛋白,例如来自阪崎肠杆菌的MdfA(UniProt ID A0A2T7ANQ9)、来自杨氏柠檬酸杆菌的的MdfA(UniProt IDD4BC23)、来自大肠杆菌的MdfA(UniProt ID P0AEY8)、来自肺炎克雷伯氏菌的MdfA(UniProt ID G9Z5F4)、来自大肠杆菌的iceT(UniProt ID A0A024L207)或来自杨氏柠檬酸杆菌的iceT(UniProt ID D4B8A6)。
在唾液酸产生的一实施例中,突变菌株衍生自大肠杆菌K12 MG1655,其包括持续型转录单元的基因敲入,该持续型转录单元含有一或多个复制的N-乙酰葡萄糖胺-6-磷酸转移酶(例如,来自啤酒酵母菌的GNA1(UniProt ID P43577))、N-乙酰葡萄糖胺2-表异构酶(例如,来自卵形拟杆菌(Bacteroides ovatus)的AGE(UniProt ID A7LVG6))、N-乙酰神经氨酸合成酶(例如,来自脑膜炎双球菌(Neisseria meningitidis)(UniProt ID E0NCD4)或空肠曲杆菌(Campylobacter jejuni)(UniProt ID Q93MP9))。
或者,及/或另外,唾液酸产生可通过持续型转录单元的基因敲入而获得,该持续型转录单元含有UDP-N-乙酰葡萄糖胺2-表异构酶(例如,来自空肠曲杆菌的NeuC(UniProtID Q93MP8))及N-乙酰神经氨酸合成酶(例如,来自脑膜炎双球菌(UniProt ID E0NCD4)或空肠曲杆菌(UniProt ID Q93MP9))。
或者及/或另外,唾液酸产生可通过持续型转录单元的基因敲入而获得,该持续型转录单元含有磷葡萄胺变位酶(phosphoglucosamine mutase)(例如,来自大肠杆菌的glmM(UniProt ID P31120))、N-乙酰葡萄糖胺-1-磷酸盐尿苷转移酶/葡萄糖胺-1-磷酸盐乙酰基转移酶(例如,来自大肠杆菌的glmU(UniProt ID P0ACC7))、UDP-N-乙酰葡萄糖胺2-表异构酶(例如,来自空肠曲杆菌的NeuC(UniProt ID Q93MP8))和N-乙酰神经氨酸合成酶(例如,来自脑膜炎双球菌(UniProt ID E0NCD4)或空肠曲杆菌(UniProt ID Q93MP9))。
或者,及/或另外,唾液酸产生可通过持续型转录单元的基因敲入而获得,该持续型转录单元含有双官能UDP-GlcNAc2-表异构酶/N-乙酰甘露糖胺激酶(例如,来自小鼠(品系C57BL/6J)(UniProt ID Q91WG8))、N-酰基神经氨酸-9-磷酸合成酶(N-acylneuraminate-9-phosphate synthetase)(例如,来自假单胞菌属(Pseudomonas sp.)UW4(UniProt ID K9NPH9)及N-酰基神经氨酸-9-磷酸酶(例如,来自磁藻属候选(Candidatus Magnetomorum sp.)HK-1(UniProt ID KPA15328.1)或来自多形拟杆菌(Bacteroides thetaiotaomicron)(UniProt ID Q8A712))。
或者,及/或另外,唾液酸产生可通过持续型转录单元的基因敲入而获得,该持续型转录单元含有磷葡萄胺变位酶(例如,来自大肠杆菌的glmM(UniProt ID P31120))、N-乙酰葡萄糖胺-1-磷酸盐尿苷转移酶/葡萄糖胺-1-磷酸盐乙酰基转移酶(例如,来自大肠杆菌的glmU(UniProt ID P0ACC7))、双官能UDP-GlcNAc 2-表异构酶/N-乙酰甘露糖胺激酶(例如,来自小鼠(品系C57BL/6J)(UniProt ID Q91WG8)、N-酰基神经氨酸-9-磷酸合成酶(例如,来自假单胞菌属UW4(UniProt ID K9NPH9)及N-酰基神经氨酸-9-磷酸酶(例如,来自磁藻属候选(Candidatus Magnetomorum sp.)HK-1(UniProt ID KPA15328.1)或来自多形拟杆菌(UniProt ID Q8A712))。
通过大肠杆菌基因(包括一或多个nagA、nagB、nagC、nagD、nagE、nanA、nanE、nanK、manX、manY及manZ)的基因剃除,如WO18122225所述、及/或大肠杆菌基因(包括一或多个nanT、poxB、ldhA、adhE、aldB、pflA、pflC、ybiY、ackA及/或pta)的基因剃除、以及持续型转录单元的基因敲入可进一步优化在突变大肠杆菌菌株中的唾液酸产生,该持续型转录单元包括一或多个复制的L-谷氨酰胺—D-果糖-6-磷酸转氨酶(例如,来自大肠杆菌的突变体glmS*54(与UniProt ID P17169的野生型大肠杆菌glmS不同之处在于具有A39T、R250C和G472S突变,如Deng等人所述(Biochimie 88,419-29(2006))),优选为一个磷酸酶(例如,来自包含aphA、Cof、HisB、OtsB、SurE、Yaed、YcjU、YedP、YfbT、YidA、YigB、YihX、YniC、YqaB、YrbL、AppA、Gph、SerB、YbhA、YbiV、YbjL、Yfb、YieH、YjgL、YjjG、YrfG及YbiU的大肠杆菌基因中任一或多个、或者来自恶臭假单胞菌的PsMupP、来自啤酒酵母菌的ScDOG1或来自枯草芽孢杆菌的BsAraL)及乙酰辅酶A合成酶(例如,来自大肠杆菌的acs(UniProt ID P27550)),如WO18122225所述。
对于唾液酸化寡糖产生,该唾液酸产生菌株进一步修饰,以表达N-酰基神经氨酸胞苷酰转移酶(N-acylneuraminate cytidylyltransferase)(例如,来自空肠曲杆菌的NeuA酶(UniProt ID Q93MP7)、来自流感嗜血杆菌(Haemophilus influenzae)的NeuA酶(GenBank No.AGV11798.1)或来自出血性巴氏杆菌(Pasteurella multocida)的NeuA酶(GenBank No.AMK07891.1)以及表达一或多个复制的β-半乳糖苷α-2,3-唾液酸转移酶(例如,来自出血性巴氏杆菌的PmultST3(UniProt ID Q9CLP3)或由具有β-半乳糖苷α-2,3-唾液酸转移酶活性的UniProt ID Q9CLP3的1至268氨基酸残基所组成的PmultST3样多肽、来自脑膜炎双球菌的NmeniST3(GenBank No.ARC07984.1)或来自出血性巴氏杆菌出血性亚种菌株(P.multocida subsp.multocida str.)Pm70的PmultST2(GenBank No.AAK02592.1))、β-半乳糖苷α-2,6-唾液酸转移酶(例如,来自海鲡发光杆菌(Photobacterium damselae)的PdST6(UniProt ID O66375)或由具有β-半乳糖苷α-2,6-唾液酸转移酶活性的UniProt IDO66375的108至497氨基酸残基所组成的PdST6样多肽或来自发光杆菌属JT-ISH-224的P-JT-ISH-224-ST6(UniProt ID A8QYL1)或由具有β-半乳糖苷α-2,6-唾液酸转移酶活性的UniProt ID A8QYL1的18至514氨基酸残基所组成的P-JT-ISH-224-ST6样多肽)及/或α-2,8-唾液酸转移酶(例如,来自小鼠(UniProt ID Q64689))。N-酰基神经氨酸胞苷酰转移酶及唾液酸转移酶的持续型转录单元可经由基因敲入或表达质体传递给突变株。若产生唾液酸及CMP-唾液酸的突变株旨在使乳糖结构唾液酸化,则该菌株通过基因剃除大肠杆菌LacZ、LacY和LacA基因以及基因组敲入乳糖通透酶的持续型转录单元(例如,大肠杆菌LacY(UniProt ID P02920))进行额外修饰。产生唾液酸、CMP-唾液酸及/或唾液酸化寡糖的所有突变株可选择性地经由含有蔗糖转运体(例如,源自大肠杆菌W的CscB(UniProt IDE0IXR1))、果糖激酶(例如,来自运动发酵单胞菌的Frk(UniProt ID Q03417))及蔗糖磷酸化酶(例如,来自青春双歧杆菌的BaSP(UniProt ID A0ZZH6))的持续型转录单元的基因敲入来适应在蔗糖上的生长。
或者,及/或另外,唾液酸及/或唾液酸化寡糖产生可进一步通过包括持续型转录单元的持续型转录单元的基因敲入使突变大肠杆菌株优化,该膜转运蛋白例如为唾液酸转运体,例如来自大肠杆菌K-12MG1655的nanT(UniProt ID P41036)、来自大肠杆菌O6:H1的nanT(UniProt ID Q8FD59)、来自大肠杆菌O157:H7的nanT(UniProt ID Q8X9G8)或来自艾伯特埃希菌(E.albertii)的nanT(UniProt ID B1EFH1)、或者为运输蛋白,例如来自大肠杆菌的EntS(UniProt ID P24077)、来自抗坏血酸克吕沃尔氏菌(Kluyvera ascorbata)的EntS(UniProt ID A0A378GQ13)、来自肠道沙门杆菌亚利桑那亚种(Salmonella entericasubsp.arizonae)的EntS(UniProt ID A0A6Y2K4E8)、来自阪崎肠杆菌的MdfA(UniProt IDA0A2T7ANQ9)、来自杨氏柠檬酸杆菌的的MdfA(UniProt ID D4BC23)、来自大肠杆菌的MdfA(UniProt ID P0AEY8)、来自肺炎克雷伯氏菌的MdfA(UniProt ID G9Z5F4)、来自大肠杆菌的iceT(UniProt ID A0A024L207)、来自杨氏柠檬酸杆菌的iceT(UniProt ID D4B8A6)、来自大肠杆菌的SetA(UniProt ID P31675)、来自大肠杆菌的SetB(UniProt ID P33026)或来自大肠杆菌的SetC(UniProt ID P31436)、或者为ABC转运体,例如来自大肠杆菌的oppF(UniProt ID P77737)、来自乳酸乳球菌乳酸亚种双乙酰生物突变株的lmrA(UniProt IDA0A1V0NEL4)、或来自双叉乳杆菌婴儿亚种的Blon_2475(UniProt ID B7GPD4)。
在用于促进UDP-半乳糖产生的实施例中,大肠杆菌K12 MG1655菌株通过将大肠杆菌ushA、galT、ldhA及agp基因中的一或多种的基因剃除并通过大肠杆菌的UDP-葡萄糖-4-表异构酶(galE)(UniProt ID P09147)的持续型表达建构体的基因敲入进行修饰。
在用于促进UDP-GlcNAc产生的实施例中,大肠杆菌K12 MG1655菌株通过将L-谷氨酰胺—D-果糖-6-磷酸转氨酶(例如来自大肠杆菌的突变体glmS*54(其不同于UniProt IDP17169的野生型大肠杆菌glmS蛋白质具有A39T、R250C及G472S突变,如Deng等人所述(Biochimie 2006,88:419-429)))的持续型转录单元的基因敲入进行修饰。
在用于产生乳-N-三糖(LN3,GlcNAc-b1,3-Gal-b1,4-Glc)的实施例中,突变菌株衍生自大肠杆菌K12 MG1655并通过将大肠杆菌lacZ、lacY、lacA及nagB基因剃除以及通过乳糖通透酶(例如,大肠杆菌LacY(UniProt ID P02920))及半乳糖苷β-1,3-N-乙酰基葡糖胺转移酶(例如,来自脑膜炎双球菌的lgtA(UniProt ID Q9JXQ6))的持续型转录单元的基因敲入进行修饰。
在用于产生LN3衍生的寡糖(例如,乳-N-四糖)(LNT,Gal-b1,3-GlcNAc-b1,3-Gal-b1,4-Glc)的实施例中,突变的LN3产生菌株进一步以经由N-乙酰葡萄糖胺β-1,3-半乳糖基转移酶(例如,来自大肠杆菌O55:H7的具有SEQ ID NO 03的wbgO)的基因敲入或形成表达质体而将持续型转录单元递送至菌株的方式进行修饰。
在用于产生LN3衍生的寡糖(例如,乳-N-新四糖)(LNnT,Gal-b1,4-GlcNAc-b1,3-Gal-b1,4-Glc)的实施例中,突变的LN3产生菌株进一步以经由N-乙酰葡萄糖胺β-1,4-半乳糖基转移酶(例如,来自脑膜炎双球菌的具有SEQ ID NO 15的lgtB)的基因敲入或形成表达质体而将持续型转录单元递送至菌株的方式进行修饰。
在用于产生乳-N-双糖(LNB,Gal-b1,3-GlcNAc)及LNB衍生的寡糖的实施例中,菌株进一步经由针对一或多个复制的N-乙酰葡萄糖胺-6-磷酸转移酶(例如,来自啤酒酵母菌的GNA1(UniProt ID P43577))及N-乙酰葡萄糖胺β-1,3-半乳糖基转移酶(选自包括来自SEQ ID NO:03、04、05、06、07、08、10、11、12及13的项次)的基因敲入或包含持续型转录单元的表达质体进行修饰。
在用于产生N-乙酰乳糖胺(LacNAc,Gal-b1,4-GlcNAc)及LacNAc衍生的寡糖的实施例中,菌株进一步经由针对一或多个复制的N-乙酰葡萄糖胺-6-磷酸转移酶(例如,来自啤酒酵母菌的GNA1(UniProt ID P43577))及N-乙酰葡萄糖胺β-1,4-半乳糖基转移酶(选自包括来自SEQ ID NO:15、16、17、18、20、21、22、23、26、27、28、31、32、33、34、35、36、39、40或41的项次)的基因敲入或包含持续型转录单元的表达质体进行修饰。
突变体LNB、LacNAc、LN3、LNT及LNnT产生大肠杆菌菌株也可选择性地经由含有蔗糖转运体(例如,源自大肠杆菌W的CscB(UniProt ID E0IXR1))、果糖激酶(例如,来自运动发酵单胞菌的Frk(UniProt ID Q03417))及蔗糖磷酸化酶(例如,来自青春双歧杆菌的BaSP(UniProt ID A0ZZH6))的持续型转录单元的基因敲入来适应在蔗糖上的生长。
或者,及/或另外,LN3、LNT、LNnT、LNB及LacNAc及其衍生的寡糖的产生可通过持续型转录单元的基因敲入而在突变大肠杆菌菌株中进一步优化,该转录单元包含膜转运蛋白,例如来自阪崎肠杆菌的MdfA(UniProt ID A0A2T7ANQ9)、来自杨氏柠檬酸杆菌的的MdfA(UniProt ID D4BC23)、来自大肠杆菌的MdfA(UniProt ID P0AEY8)、来自肺炎克雷伯氏菌的MdfA(UniProt ID G9Z5F4)、来自大肠杆菌的iceT(UniProt ID A0A024L207)或来自杨氏柠檬酸杆菌的iceT(UniProt ID D4B8A6)。
优选但并非必须,糖基转移酶、核苷酸活性糖合成的蛋白质及/或膜转运蛋白中的任一或多种在N-和/或C-端融合至溶解度强化子标签,例如例如SUMO标签、MBP标签、His、FLAG、Strep-II、Halo-tag、NusA、硫氧还蛋白(thioredoxin)、GST及/Fh8标签,以提高其溶解度(Costa et al.,Front.Microbiol.2014,https://doi.org/10.3389/ fmicb.2014.00063;Fox et al.,Protein Sci.2001,10(3),622-630;Jia and Jeaon,OpenBiol.2016,6:160196)。
可选地,突变大肠杆菌菌株通过持续型转录单元的基因敲入进行修饰,该持续型转录单元编码伴护蛋白(chaperone protein)(例如,DnaK、DnaJ、GrpE或the GroEL/ES伴护蛋白系统(chaperonin system)(Baneyx F.,Palumbo J.L.(2003)ImprovingHeterologous Protein Folding via Molecular Chaperone and Foldase Co-Expression.In:Vaillancourt P.E.(eds)E.coli Gene Expression Protocols.Methodsin Molecular BiologyTM,vol 205.Humana Press)。
可选地,突变大肠杆菌菌株进行修饰以制造糖最小化大肠杆菌菌株,其包含非必须糖基转移酶基因的任一或多种的基因剃除,该非必须糖基转移酶基因包括pgaC、pgaD、rfe、rffT、rffM、bcsA、bcsB、bcsC、wcaA、wcaC、wcaE、wcaI、wcaJ、wcaL、waaH、waaF、waaC、waaU、waaZ、waaJ、waaO、waaB、waaS、waaG、waaQ、wbbl、arnC、arnT、yfdH、wbbK、opgG、opgH、ycjM、glgA、glgB、malQ、otsA及yaiP。
所有持续型启动子及UTRs均源自De Mey等人(BMC Biotechnology,2007)、Dunn等人(Nucleic Acids Res.1980,8(10),2119-2132)、Kim和Lee(FEBS letters 1997,407(3),353-356)、以及Mutalik等人(Nat.Methods 2013,No.10,354-360)描述的资料库。
本发明所述的SEQ ID NO总结于表1。
所有基因均在Twist Bioscience(twistbioscience.com)或IDT(eu.idtdna.com)合成订购,并使用供应商的工具调整密码子使用。
所有菌株都储存在-80℃的冷冻小瓶中(过夜LB培养物与70%甘油按1:1比率混合)。
表1:本发明中描述的SEQ ID NO的概述
Figure BDA0004113293730001271
Figure BDA0004113293730001281
Figure BDA0004113293730001291
培养条件
从冷冻小瓶开始96孔微量滴定盘实验的预培养,在150μL LB中并于37℃在800rpm的轨道振荡器上培养过夜。将该培养物用作96孔方形微量滴定盘的接种物,用400μL MMsf培养基稀释400倍。然后将这些最终的96孔培养盘于37℃在800rpm的轨道振荡器上培养72h或更短或更长时间。为了在培养实验结束时测定糖浓度,通过将细胞离心之前将培养液于60℃煮沸15分钟,从每个孔中取出全肉汤样品(=细胞内和细胞外的糖浓度平均值)。
生物反应器的预培养从特定菌株的整个1mL冷冻小瓶开始,接种在1L或2.5L摇瓶中的250mL或500mL MMsf培养基中,并于37℃在200rpm的轨道振荡器上培养24h。然后接种5L生物反应器(在2L批次培养基中接种250mL);该过程由MFCS控制软件(SartoriusStedimBiotech,Melsungen,德国)控制。培养条件设置为37℃,最大搅拌;压力气体流速取决于菌株和生物反应器。使用0.5M H2SO4和20%NH4OH将pH控制在6.8。冷却废气。发酵过程中发泡时加入10%的有机硅消泡剂溶液。
光密度
通过测定600nm处的光密度(Implen Nanophotometer NP80,Westburg,比利时或Spark 10M微孔盘读取器,Tecan,瑞士)经常监测培养物的细胞密度。
分析性解析
标准品,例如但不限于,蔗糖、葡萄糖、N-乙酰葡萄糖胺、N-乙酰乳糖胺、乳-N-双糖、岩藻糖基化N-乙酰乳糖胺(2’FLAcNAc、3-FlacNAc)、岩藻糖基化乳-N-双糖(2’FLNB、4-FLNB)、唾液酸化N-乙酰乳糖胺(3’SLacNAc、6’SLacNAc)购自Carbosynth(英国)、Elicityl(法国)及IsoSep(瑞典)。其他化合物使用内部制定的标准进行分析。
N-乙酰葡萄糖胺及N-乙酰乳糖胺在Dionex HPAEC系统上使用脉冲安培检测(PAD)进行分析。将5μL样品注射到Dionex CarboPac PA1管柱4x250mm与Dionex CarboPac PA1保护管柱4x 50mm。管柱温度为20℃。使用3种溶析液进行分离:A)去离子水、B)200mM氢氧化钠、以及C)500mM乙酸钠。溶析曲线如下应用:0-10分钟50% A和50% B;10-18分钟50-44%A和50%B;18-28分钟44%A和50%B;28-32分钟44-30.8%A和50%B;32-39分钟30.8%A和50%B;39-40分钟30.8-2%A和50%B;40-43分钟2%A和50%B;43-44分钟2-50%A和50%B;44-50分钟50%A和50%B。流速为1.0mL/min。
N-乙酰葡萄糖胺、N-乙酰乳糖胺、乳-N-双糖、岩藻糖基化N-乙酰乳糖胺、及岩藻糖基化LNB在配有蒸发光散射检测器(ELSD)或折射率(RI)检测器的Waters Acquity H级UPLC上进行分析。将体积0.7μL的样品注入Waters Acquity UPLC BEH Amide管柱(2.1x 100mm;
Figure BDA0004113293730001301
1.7μm)和配有Acquity UPLC BEH Amide VanGuard管柱,
Figure BDA0004113293730001302
2.1x 5mm。管柱温度为50℃。移动相由1/4水和3/4乙腈溶液组成,并添加了0.2%三乙胺。该方法是以流速为0.130mL/min进行等度。ELS检测器的漂移管温度为50℃,N2气压为50psi,增益为200,数据速率为10pps。RI检测器的温度设为35℃。
唾液酸化N-乙酰乳糖胺及唾液酸化乳-N-双糖以配有折射率(RI)检测器的WatersAcquity H级UPLC上进行分析。将体积0.5μL的样品注入具有移动相的Waters AcquityUPLC BEH Amide管柱(具有1.7μm粒径的2.1x100mm),该移动相包含70mL乙腈、26mL超纯水中的150mM乙酸铵以及4mL添加有0.05%吡咯烷的甲醇。该方法是以流速为0.150mL/min进行等度。管柱温度设为50℃。
在Dionex HPAEC系统上使用脉冲安培检测(PAD)分析低浓度(低于50mg/L)的糖。将体积5μL的样品注入Dionex CarboPac PA200管柱4x 250mm和Dionex CarboPac PA200保护柱4x 50mm。管柱温度设为30℃。使用梯度,其中溶析液A是去离子水,其中溶析液B是200mM氢氧化钠并且其中溶析液C是500mM乙酸钠。寡糖在60分钟内分离,同时使用以下梯度保持25%的溶析液B的恒定比例:初始等度步骤将75%的溶析液A保持10分钟,在8分钟内初始增加溶析液C从0到4%,第二等度步骤将71%的溶析液A和4%的溶析液C保持6分钟,在2.6分钟内第二次增加溶析液C从4%到12%,第三等度步骤将63%溶析液A和12%的溶析液C保持3.4分钟,在5分钟内第三次增加溶析液C从12%到48%。作为洗涤步骤,使用48%的溶析液C洗涤3分钟。对于管柱平衡,75%的溶析液A和0%的溶析液C的初始条件在1分钟内恢复并保持11分钟。施加的流速为0.5mL/min。
数据的标准化
对于所有类型的培养条件,从突变菌株获得的数据针对在与参考菌株相同的培养条件下获得的数据进行标准化。
实施例2:经修饰的大肠杆菌宿主中GlcNAc的产生
在此实施例中,首先,野生型大肠杆菌K-12MG1655可通过同源大肠杆菌N-乙酰葡萄糖胺-6-磷酸盐去乙酰酶(nagA)基因及大肠杆菌葡萄糖胺-6-磷酸盐脱胺酶(nagB)基因的剔除进行修饰,接着以表达质体进一步转形,该表达质体包括来自啤酒酵母菌的N-乙酰葡萄糖胺-6-磷酸转移酶GNA1(UniProt ID P43577)的持续型表达匣。当根据实施例1中的培养条件(其中培养基含有甘油)在生长实验中进行评估时,由此获得的突变大肠杆菌菌株在全肉汤样品中产生GlcNAc。
实施例3:经修饰的大肠杆菌宿主中GlcNAc的产生
如实施例2所述的经修饰以产生GlcNAc的突变大肠杆菌菌株可进一步以第二相容表达质体进行转形,该第二相容表达质体包括来自大肠杆菌的L-谷氨酰胺—D-果糖-6-磷酸转氨酶glmS*54的突变变体的持续型表达匣,该突变变体与野生型glmS蛋白质(UniProtID P17169)不同在于A39T、R250C和G472S突变,如Deng等人所述(Biochimie 2006:88,419-429)。当根据实施例1中的培养条件(其中培养基含有甘油)在生长实验中进行评估时,新颖菌株也在全肉汤样品中产生GlcNAc,且在该菌株中所获得的GlcNAc力价高于在实施例2产生且缺乏突变glmS*54的突变菌株所获得的GlcNAc力价。
实施例4:经修饰的大肠杆菌宿主中GlcNAc的产生
野生型大肠杆菌K-12MG1655可通过大肠杆菌nagA及nagB基因的剔除及来自啤酒酵母菌的GNA1(UniProt ID P43577)的持续型表达匣的基因敲入进行修饰。当根据实施例1中的培养条件(其中培养基含有甘油)在生长实验中进行评估时,由此获得的突变大肠杆菌菌株在全肉汤样品中产生GlcNAc。
实施例5:经修饰的大肠杆菌宿主中GlcNAc的产生
如实施例4所述的经修饰以产生GlcNAc的突变大肠杆菌菌株可进一步以表达质体进行转形,该表达质体包括来自大肠杆菌的glmS*54的持续型表达匣,该glmS*54与野生型glmS蛋白质(UniProt ID P17169)不同在于A39T、R250C和G472S突变,如Deng等人所述(Biochimie 2006:88,419-429)。当根据实施例1中的培养条件(其中培养基含有甘油)在生长实验中进行评估时,新颖菌株也在全肉汤样品中产生GlcNAc,且在此菌株中所获得的GlcNAc力价高于在实施例4产生且缺乏突变glmS*54的突变菌株所获得的GlcNAc力价。
实施例6:经修饰的大肠杆菌宿主中GlcNAc的产生
如实施例4所述的经修饰以产生GlcNAc的突变大肠杆菌菌株可进一步以包括来自大肠杆菌的glmS*54的持续型表达匣的基因敲入进行转形,该glmS*54与野生型glmS蛋白质(UniProt ID P17169)不同在于A39T、R250C和G472S突变,如Deng等人所述(Biochimie2006:88,419-429)。当根据实施例1中的培养条件(其中培养基含有甘油)在生长实验中进行评估时,新颖菌株也在全肉汤样品中产生GlcNAc,且在此菌株中所获得的GlcNAc力价高于在实施例4产生且缺乏突变glmS*54的突变菌株所获得的GlcNAc力价。
实施例7:经修饰的大肠杆菌宿主中GlcNAc的产生
如实施例2所述的经修饰以产生GlcNAc的突变大肠杆菌菌株可进一步以包括来自大肠杆菌的glmS*54的持续型表达匣的基因敲入进行转形,该glmS*54与野生型glmS蛋白质(UniProt ID P17169)不同在于A39T、R250C和G472S突变,如Deng等人所述(Biochimie2006:88,419-429)。当根据实施例1中的培养条件(其中培养基含有甘油)在生长实验中进行评估时,新颖菌株也在全肉汤样品中产生GlcNAc,且在此菌株中所获得的GlcNAc力价高于在实施例2产生且缺乏突变glmS*54的突变菌株所获得的GlcNAc力价。
实施例8:经修饰的大肠杆菌宿主中LacNAc或LNB的产生
如实施例2及4至7所述,具有nagAB KO并表达GNA1(UniProt ID P43577)且具有或不具有额外的突变glmS*54表达(与野生型glmS蛋白质(UniProt ID P17169)不同在于A39T、R250C和G472S突变,如Deng等人所述(Biochimie 2006:88,419-429))的的突变GlcNAc产生大肠杆菌K-12MG1655菌株可进一步以含有持续型转录单元的质体进行转形以表达具有SEQ ID NO 15的脑膜炎双球菌的N-乙酰葡萄糖胺β1,4-半乳糖基转移酶LgtB或具有SEQ ID NO 03的来自大肠杆菌O55:H7的N-乙酰葡萄糖胺β1,3-半乳糖基转移酶WbgO。
当根据实施例1中的培养条件(其中培养基含有甘油)在生长实验中进行评估时,表达SEQ ID NO 15的LgtB的各新颖菌株在全肉汤样品中产生GlcNAc及LacNAc。与表达SEQID NO 15但缺乏突变glmS*54的修饰菌株相比,表达SEQ ID NO 15且也表达突变glmS*54的新颖菌株中的GlcNAc及LacNAc力价较高。
当根据实施例1中的培养条件(其中培养基含有甘油)在生长实验中进行评估时,表达SEQ ID NO 03的WbgO的各新颖菌株在全肉汤样品中产生GlcNAc及LNB。与表达SEQ IDNO 03的WbgO但缺乏突变glmS*54的修饰菌株相比,表达SEQ ID NO 03且也表达突变glmS*54的新颖菌株中的GlcNAc及LNB力价较高。
实施例9:经修饰的大肠杆菌宿主中GlcNAc的产生
如实施例1所述,优化GDP-岩藻糖产生的大肠杆菌突变K-12MG1655菌株可进一步突变以额外产生GlcNAc。该突变包括大肠杆菌nagA及nagB基因的剃除与持续型表达建构体的敲入,该持续型表达建构体含有突变glmS*54(其与野生型glmS蛋白质(UniProt IDP17169)不同在于A39T、R250C和G472S突变)及来自啤酒酵母菌的GNA1(UniProt IDP43577)。根据实施例1提供的培养条件(其中培养基含有30g/L蔗糖),在生长实验中评价新颖菌株并与其亲本菌株进行比较。各菌株在96孔盘的多个孔中生长72小时。实验显示,在新颖突变菌株的全肉汤样品中可以测量到0.90±0.10g/L GlcNAc,而在原始亲本菌株的全肉汤样品中没有检测到GlcNAc产生。实验进一步证明,与原始亲本菌株相比,为GlcNAc产生添加的突变不影响新颖菌株产生GDP-岩藻糖。
实施例10:经修饰的大肠杆菌宿主中GlcNAc及LacNAc的产生
如实施例1所述,优化GDP-岩藻糖产生的大肠杆菌突变K-12MG1655菌株可以大肠杆菌nagA及nagB基因的剃除与具有SEQ ID NO 15的脑膜炎双球菌的N-乙酰葡萄糖胺β1,4-半乳糖基转移酶(LgtB)的持续型表达建构体的基因敲入进行进一步突变。下一步,用由不同转录单元(TU)构建的不同持续型表达载体转形该突变株的细胞,该转录单元含有来自大肠杆菌的突变glmS*54(其与野生型glmS蛋白质(UniProt ID P17169)不同在于A39T、R250C和G472S突变)及来自啤酒酵母菌的GNA1(UniProt ID P43577),如表2及表3所列。根据实施例1提供的培养条件在生长实验中评估所有新颖菌株(A-H)。表2显示在含有30g/L蔗糖的基本培养基中培养72小时后,采集来自每个新颖突变大肠杆菌菌株的全肉汤样品中的GlcNAc(g/L)和LacNAc(g/L)的产量。数据证明,所有新菌株均能够产生GlcNAc和LacNAc两者,无需向培养基中补充添加GlcNAc。相比之下,具有相同遗传背景但缺乏glmS*54和GNA1表达质体的参考菌株只能在补充有GlcNAc的培养基中产生LacNAc(结果未示出)。表2也显示,所有新颖菌株中GlcNAc和LacNAc两者的产生力价可以根据表达载体A-H中选择的转录单元而变化,以表达SEQ ID NO 15和19。
表2:在含有30g/L蔗糖的基本培养基中培养72小时后,采集来自突变大肠杆菌菌株的全肉汤样品中的GlcNAc(g/L)和LacNAc(g/L)的产量
Figure BDA0004113293730001341
Figure BDA0004113293730001351
*与野生型glmS蛋白质(UniProt ID P17169)不同在于A39T、R250C和G472S突变
表3:用于转录单元(TU)的启动子及UTR序列,以表达如表2所示的glmS*54(其与野生型glmS蛋白质(UniProt ID P17169)不同在于A39T、R250C和G472S突变)及GNA1(UniProtID P43577)
TU 启动子* UTR* 终止子
TU44 Mutalik_P11 GalE_BCD18 rnpB_T1**
TU45 Mutalik_P5 Gene10_LeuL T7early***
TU46 Mutalik_P5 GalE_LeuAB T7early***
TU47 Mutalik_P9 Gene10_LeuL T7early***
TU52 Mutalik_P11 ThrA_BCD2 rnpB_T1**
TU53 Mutalik_P9 GalE_LeuAB T7early***
TU54 Mutalik_P10 GalE_BCD18 rnpB_T1**
TU55 Mutalik_P10 GalE_BCD18 rnpB_T1**
TU57 Mutalik_P10 ThrA_BCD2 rnpB_T1**
*取自Mutalik等人的序列(Nat.Methods 2013,10,354-360)
**取自Kim及Lee的序列(FEBS letters 1997,407(3),353-356)
***取自Dunn等人的序列(Nucleic Acids Res.1980,8(10),2119-2132)
实施例11:评估经修饰的大肠杆菌宿主中LacNAc产生
在下一实验中,优化GDP-岩藻糖产生且如实施例9所述的产生GlcNAc的大肠杆菌K-12MG1655菌株可进一步以具有SEQ ID NO 15的脑膜炎双球菌的N-乙酰葡萄糖胺β1,4-半乳糖基转移酶(LgtB)的敲入进行修饰。在如实施例1所述的生长实验中评估此新颖菌株,其与参考菌株共享nagAB剃除及LgtB敲入但表达来自相同转录单元的glmS*54(其与野生型glmS蛋白质(UniProt ID P17169)不同在于A39T、R250C和G472S突变)及GNA1(UniProt IDP43577)呈递给来自质体的菌株。表4显示来自在具有30g/L蔗糖的基本培养基中培养72小时后采集的每个突变大肠杆菌菌株的全肉汤样品中GlcNAc(g/L)和LacNAc(g/L)的产生。数据显示,突变菌株两者皆产生GlcNAc和LacNAc,其与GNA1和glmS*54两者如何呈递给菌株无关。
表4:在包括30g/L蔗糖的基本培养基中培养72小时后,采集自突变大肠杆菌菌株的全肉汤样品中GlcNAc(g/L)和LacNAc(g/L)的产生
Figure BDA0004113293730001361
*UniProt ID P43577
**与野生型glmS蛋白质(UniProt ID P17169)不同在于A39T、R250C和G472S突变
实施例12:修饰的大肠杆菌宿主中GlcNAc和LacNAc的产生
在下一实验中,大肠杆菌K-12MG1655菌株通过具有SEQ ID NO 15的脑膜炎双球菌的N-乙酰葡萄糖胺β1,4-半乳糖基转移酶(LgtB)的敲入进行进一步修饰,该大肠杆菌K-12MG1655菌株如实施例1所述,产生唾液酸且含有大肠杆菌nagA及nagB基因的剃除及含有glmS*54(其与野生型glmS蛋白质(UniProt ID P17169)不同在于A39T、R250C和G472S突变)、GNA1(UniProt ID P43577)、来自卵形拟杆菌的N-乙酰葡萄糖胺2-表异构酶(AGE)(UniProt ID A7LVG6)及来自脑膜炎双球菌的N-乙酰神经氨酸合成酶(NeuB)(UniProt IDE0NCD4)的持续型表达建构体的基因敲入。
并且,如实施例1所述的以基因剃除大肠杆菌ushA及galT基因并以基因敲入大肠杆菌的UDP-葡萄糖-4-表异构酶(galE)(UniProt ID P09147)的持续型表达建构体优化促进UDP-半乳糖产生且大肠杆菌K-12MG1655菌株通过剃除大肠杆菌nagB基因和基因敲入编码SEQ ID NO 15的基因的持续型表达构建体进行额外的突变。根据实施例1中提供的培养条件(其中,该培养基含有蔗糖)在生长实验中评估新颖菌株并与其各自的亲本菌株进行比较。各菌株在96孔盘的多个孔中生长72小时。实验证实,在全肉汤样品中,各新颖菌株均产生GlcNAc和LacNAc,而亲本菌株两者均不产生LacNAc。
实施例13:修饰的大肠杆菌宿主中半乳糖基化寡糖的产生
优化促进UDP-半乳糖产生且如实施例12所述的产生GlcNAc和LacNAc的大肠杆菌K-12MG1655菌株可进一步以含有SEQ ID NO 3的来自E.coli O55:H7的N-乙酰葡萄糖胺β1,3-半乳糖基转移酶WbgO的持续型表达建构体的表达载体进行额外转形。当根据实施例1中提供的培养条件(其中,培养基含有蔗糖)评估的生长实验中,除了GlcNAc、LacNAc和LNB之外,新颖菌株还产生Gal-b14-(Galb13)-GlcNAc,其含有两个将β-1,3及β-1,4连接至GlcNAc的半乳糖部分。
实施例14:修饰的大肠杆菌宿主中岩藻糖基化LacNAc的产生
优化GDP-岩藻糖产生且如实施例10所述的产生GlcNAc及LacNAc的大肠杆菌K-12MG1655突变菌株H可以含有皆来自幽门螺旋杆菌的a1,2-岩藻糖基转移酶HpFutC(GenBank NO.AAD29863.1)或a1,3-岩藻糖基转移酶HpFucT(UniProt ID O30511)的持续型表达建构体的表达质体进行额外转形。根据实施例1中提供的培养条件在生长实验中评估新颖菌株。表5显示来自在具有30g/L蔗糖的基本培养基中培养72小时后采集的两种突变菌株的全肉汤样品中2'FLacNAc(g/L)或3-FLacNAc(g/L)的产生。数据证实,各新颖菌株产生GlcNAc、LacNAc及岩藻糖基化形式的LacNAc,其中2'FLacNAc在表达HpFutC(GenBankNO.AAD29863.1)的菌株中产生,3-FLacNAc在表达HpFucT(UniProt ID O30511)的菌株中产生。在此实验中未检测到二岩藻糖基化LacNAc。在缺乏岩藻糖基转移酶表达载体的相同遗传背景的亲本菌株的全肉汤样品中无法检测到岩藻糖基化LacNAc变体。
表5:来自在包括30g/L蔗糖的基本培养基中培养72小时后的突变大肠杆菌菌株采集的全肉汤样品中2'FLacNAc(g/L)及3-FLacNAc(g/L)的产生
Figure BDA0004113293730001371
Figure BDA0004113293730001381
实施例15:修饰的大肠杆菌宿主中二岩藻糖基化LacNAc的产生
优化GDP-岩藻糖产生且如实施例10所述的产生GlcNAc及LacNAc的大肠杆菌K-12MG1655突变菌株H可以含有岩藻糖基转移酶HpFutC(GenBank NO.AAD29863.1)及HpFucT(UniProt ID O30511)的持续型表达建构体的表达质体进行额外转形。当根据实施例1中提供的培养条件(其中,培养基含有蔗糖)评估的生长实验中,在全肉汤样品中除了GlcNAc及LacNAc之外,新颖菌株还产生2’-岩藻糖基化、3-岩藻糖基化及二岩藻糖基化LacNAc。
实施例16:修饰的大肠杆菌宿主中唾液酸化LacNAc的产生
如实施例1所述的产生唾液酸的大肠杆菌K-12MG1655菌株进一步以具有SEQ IDNO 15的LgtB的持续型表达建构体的敲入进行突变并以表达质体进行转形,该表达质体含有来自出血性巴氏杆菌的N-酰基神经氨酸胞苷酰转移酶(NeuA)(GenBank NO.AMK07891.1)及由具有β-半乳糖苷α-2,3-唾液酸转移酶活性的UniProt ID Q9CLP3的氨基酸残基1至268所组成的PmultST3样多肽的持续型表达建构体。根据实施例1提供的培养条件(其中培养基含有30g/L蔗糖),在生长实验中评价新颖菌株并与其亲本菌株进行比较。各菌株在96孔盘的多个孔中生长72小时。数据显示,在全肉汤样品中,除了GlcNAc及LacNAc之外,新颖菌株产生0.32±0.02g/L a2,3-唾液酸化LacNAc。无法检测到二唾液酸化LacNAc。在缺乏唾液酸转移酶表达载体的相同遗传背景的亲本菌株的全肉汤样品中无法检测到唾液酸化的LacNAc变体。
相似地,如实施例1所述的产生唾液酸的大肠杆菌K-12MG1655菌株可进一步以具有SEQ ID NO 15的LgtB的持续型表达建构体的敲入进行突变并以表达质体进行转形,该表达质体含有来自出血性巴氏杆菌的NeuA(GenBank NO.AMK07891.1)及由具有β-半乳糖苷α-2,6-唾液酸转移酶活性的UniProt ID O66375的氨基酸残基108至497所组成的PdST6样多肽的持续型表达建构体。当根据实施例1中提供的培养条件(其中,培养基含有蔗糖)评估的生长实验中,在全肉汤样品中新颖菌株产生GlcNAc及LacNAc、以及a2,6-唾液酸化LacNAc。
实施例17:修饰的大肠杆菌宿主中二唾液酸化LacNAc的产生
如实施例1所述的产生CMP-唾液酸的大肠杆菌K-12MG1655菌株可进一步以具有SEQ ID NO 15的LgtB的持续型表达建构体的敲入进行突变并以表达质体进行转形,该表达质体含有由具有β-半乳糖苷α-2,3-唾液酸转移酶活性的UniProt ID Q9CLP3的氨基酸残基1至268所组成的PmultST3样多肽及由具有β-半乳糖苷α-2,6-唾液酸转移酶活性的UniProtID O66375的氨基酸残基108至497所组成的PdST6样多肽的持续型表达建构体。当根据实施例1中提供的培养条件(其中,培养基含有蔗糖)评估的生长实验中,在全肉汤样品中新颖菌株产生GlcNAc及LacNAc、以及3’-唾液酸化、6’-唾液酸化以及二唾液酸化LacNAc。
实施例18:大肠杆菌宿主中修饰的LacNAc的产生
优化GDP-岩藻糖产生且如实施例11所述的产生GlcNAc及LacNAc的大肠杆菌K-12MG1655菌株可以含有皆来自脑膜炎双球菌的b1,3-N-乙酰基-己糖胺转移酶lgtA(GenBank NO.AAM33849.1)的持续型表达建构体的表达质体进行额外转形。通过突变体glmS*54(其与野生型glmS蛋白质(UniProt ID P17169)不同在于A39T、R250C和G472S突变)、同源EcGlmM和EcGlmU以及异源NmLgtA(GenBank NO.AAM33849.1)的后续作用,由此产生的菌株当根据实施例1中提供的培养条件(其中,培养基含有蔗糖)评估的生长实验中,在细胞内将果糖-6-磷酸盐转化为UDP-GlcNAc,并使用此UDP-GlcNAc进行细胞内修饰LacNAc以导致在全肉汤样品中产生GlcNAc-b1,3-Gal-b1,4-GlcNAc。该菌株也产生聚-LacNAc结构,即(Gal-b1,4-GlcNAc)n,其由重复的N-乙酰乳糖胺建构而成,该重复的N-乙酰乳糖胺是通过具有SEQ ID NO15的LgtB的替代活性以及在菌株中表达的LgtA(GenBankNO.AAM33849.1)将beta1,3相互连接。
优化UDP-半乳糖产生且如实施例12所述的产生GlcNAc和LacNAc的大肠杆菌K-12MG1655菌株经修饰以持续性表达来自绿脓杆菌(Pseudomonas aeruginosa)的UDP-GlcNAc表异构酶wbpP(UniProt ID Q8KN66)以及来自流感嗜血杆菌的糖基转移酶lgtD(UniProt ID A0A2X4DBP3)。通过突变大肠杆菌glmS*54(其与野生型glmS蛋白质(UniProtID P17169)不同在于A39T、R250C和G472S突变)、同源大肠杆菌GlmM和GlmU以及绿脓杆菌wbpP(UniProt ID Q8KN66)的后续作用,果糖-6-磷酸盐经由中间化合物葡萄糖胺-6-磷酸盐、葡萄糖胺-1-磷酸盐和UDP-GlcNAc在细胞内将果糖-6-磷酸盐转换为UDP-GalNAc。通过新表达的LgtD酶(UniProt ID A0A2X4DBP3)的后续作用,新颖菌株当根据实施例1中提供的培养条件,其中,培养基含有30g/L蔗糖,评估的生长实验中,能够用GalNAc修饰细胞内产生的LacNAc,在全肉汤样品中产生0.12±0.02g/L GalNAc-b1,3-Gal-b1,4-GlcNAc。
实施例19:修饰的大肠杆菌中唾液酸化的聚LacNAc的产生
如实施例16及17所述的全肉汤样品中产生LacNAc及LacNAc的唾液酸化形式的大肠杆菌菌株可进一步以表达质体进行转形,该表达质体含有LgtA(GenBankNO.AAM33849.1)的持续型表达建构体。通过分别具有SEQ ID NO 15及GenBankNO.AAM33849.1的LgtB和LgtA转移酶的替代活性,当根据实施例1中提供的培养条件(其中,培养基含有蔗糖)评估的生长实验中,新颖菌株另外产生聚-LacNAc结构,即(Gal-b1,4-GlcNAc)n,其由重复的N-乙酰乳糖胺构成,该重复的N-乙酰乳糖胺是连同其中Gal被唾液酸化的唾液酸化聚lacNAc结构,将β1,3-互相连接。
实施例20:修饰的大肠杆菌宿主中LNB的产生
在下一实验中,优化GDP-岩藻糖产生且如实施例9所述的产生GlcNAc的大肠杆菌K-12MG1655菌株可进一步以具有SEQ ID NO 03或者来自质体或来自基因敲入的WbgO的持续型表达进行修饰。根据实施例1提供的培养条件,在生长实验中评价新颖菌株并与缺少SEQ ID NO 03表达构建体的亲本菌株进行比较。表6显示在含有30g/L蔗糖的基本培养基中培养72小时后获取的每个突变菌株的全肉汤样品中LNB(g/L)的产生。数据证实,这两种新颖菌株在全肉汤样品中都产生LNB,与WbgO如何呈递给菌株无关。
表6:在包括30g/L蔗糖的基本培养基中培养72小时后,采集自突变大肠杆菌菌株的全肉汤样品中LNB(g/L)的产生
Figure BDA0004113293730001411
实施例21:修饰的大肠杆菌宿主中岩藻糖基化LNB的产生
优化GDP-岩藻糖产生且如实施例20(其中具有SEQ ID NO 03的WbgO是来自基因敲入的表达)所述的产生GlcNAc及LNB的大肠杆菌K-12MG1655菌株可以含有皆来自幽门螺旋杆菌的a1,2-岩藻糖基转移酶HpFutC(GenBank NO.AAD29863.1)或a1,3-岩藻糖基转移酶HpFucT(UniProt ID O30511)的持续型表达建构体的表达质体进行额外转形。根据实施例1中提供的培养条件在生长实验中评估新颖菌株。表7显示来自在具有30g/L蔗糖的基本培养基中培养72小时后采集的两种突变菌株的全肉汤样品中2’FLNB(g/L)或4-FLNB(g/L)的产生。数据证实,各新颖菌株在全肉汤样品产生岩藻糖基化形式的LNB,其中2’FLNB在表达HpFutC(GenBank NO.AAD29863.1)的菌株中测量到,且4-FLNB在表达HpFucT(UniProt IDO30511)的菌株中测量到。在此实验中未检测到二岩藻糖基化LNB。在缺乏岩藻糖基转移酶表达载体的相同遗传背景的亲本菌株的全肉汤样品中无法检测到岩藻糖基化LNB变体。
7:来自在包括30g/L蔗糖的基本培养基中培养72小时后的突变大肠杆菌菌株采集的全肉汤样品中2’FLNB(g/L)及4-FLNB(g/L)的产生
Figure BDA0004113293730001412
Figure BDA0004113293730001421
实施例22:修饰的大肠杆菌宿主中二岩藻糖基化LNB的产生
优化GDP-岩藻糖产生且如实施例20(其中具有SEQ ID NO 03的WbgO是来自基因敲入的表达)所述的产生GlcNAc及LNB的大肠杆菌K-12MG1655菌株可以含有a1,2-岩藻糖基转移酶HpFutC(GenBank NO.AAD29863.1)及a1,3-岩藻糖基转移酶HpFucT(UniProt IDO30511)两者的持续型表达建构体的表达质体进行额外转形。当根据实施例1中提供的培养条件(其中,培养基含有蔗糖)评估的生长实验中,新颖菌株在全肉汤样品产生GlcNAc和LNB以及2'-岩藻糖基化、4-岩藻糖基化和二岩藻糖基化的LNB。
实施例23:修饰的大肠杆菌宿主中半乳糖基化LNB的产生
如实施例1所述的优化促进UDP-半乳糖产生的大肠杆菌K-12MG1655菌株可进一步通过大肠杆菌nagB基因的剃除进行额外突变并进一步以具有SEQ ID NO 03或者来自质体或来自基因敲入的WbgO的持续型表达进行进一步修饰。当根据实施例1中提供的培养条件(其中,培养基含有蔗糖)评估的生长实验中,在全肉汤样品中新颖菌株皆产生LNB。当用α-1,2-半乳糖基转移酶及/或α-1,3-半乳糖基转移酶及/或β-1,3-半乳糖基转移酶及/或β-1,4-半乳糖基转移酶的表达构建体额外转化新颖的LNB产生菌株时,在根据实施例1中提供的培养条件(其中,培养基含有蔗糖)评估的生长实验中,各新颖菌株在全肉汤样品中产生GlcNAc和LNB以及半乳糖基化的LNB形式。
实施例24:修饰的大肠杆菌宿主中唾液酸化LNB的产生
如实施例1所述的产生CMP-唾液酸的大肠杆菌K-12MG1655菌株可进一步以具有SEQ ID NO 03的WbgO的持续型表达建构体的敲入进行突变并以表达质体进行转形,该表达质体含有由具有β-半乳糖苷α-2,3-唾液酸转移酶活性的UniProt ID Q9CLP3的氨基酸残基1至268所组成的PmultST3样多肽的持续型表达建构体。当根据实施例1中提供的培养条件(其中,培养基含有蔗糖)评估的生长实验中,新颖菌株在全肉汤样品中,除了GlcNAc及LNB之外,产生唾液酸化LacNAc LNB形式。相似地,另外表达具有SEQ ID NO 03的WbgO及由具有β-半乳糖苷α-2,6-唾液酸转移酶活性的UniProt ID O66375的氨基酸残基108至497所组成的PdST6样多肽的大肠杆菌K-12MG1655 CMP-唾液酸产生菌株,当根据实施例1中提供的培养条件(其中,培养基含有蔗糖)评估的生长实验时,在全肉汤样品中产生GlcNAc和LNB以及唾液酸化LNB形式。
实施例25:修饰的大肠杆菌宿主中二唾液酸化LNB的产生
如实施例1所述的产生CMP-唾液酸的大肠杆菌K-12MG1655菌株可进一步以具有SEQ ID NO 03的WbgO的持续型表达建构体的敲入进行突变并以表达质体进行转形,该表达质体含有由具有β-半乳糖苷α-2,3-唾液酸转移酶活性的UniProt ID Q9CLP3的氨基酸残基1至268所组成的PmultST3样多肽及/或由具有β-半乳糖苷α-2,6-唾液酸转移酶活性的UniProt ID O66375的氨基酸残基108至497所组成的PdST6样多肽的持续型表达建构体。当根据实施例1中提供的培养条件(其中,培养基含有蔗糖)评估的生长实验中,在全肉汤样品中新颖菌株产生GlcNAc及LNB、以及单唾液酸化及/或二唾液酸化LNB。
实施例26:用突变大肠杆菌宿主发酵生产LacNAc
优化GDP-岩藻糖产生且如实施例11中所述的通过从表达质体呈递给宿主的glmS*54(其与野生型glmS蛋白质(UniProt ID P17169)不同在于A39T、R250C和G472S突变)及GNA1(UniProt ID P43577)产生GlcNAc和LacNAc的突变大肠杆菌K-12MG1655菌株根据实施例1提供的条件,在5L生物反应器规模的补料批次发酵中进行评估。在此实施例中,蔗糖用作碳源。如实施例1所述,定期取样并测量LacNAc的产生。
实施例27:当在除了蔗糖以外的其他碳源上生长时,经修饰的大肠杆菌宿主中 LacNAc或LNB的产生
当根据实施例1中提供的培养条件(其中,培养基含有甘油)评估的生长实验中,如实施例10至12所述的经修饰产生GlcNAc和LacNAc的突变大肠杆菌菌株或如实施例20所述的经修饰产生GlcNAc和LNB的突变大肠杆菌菌株分别产生GlcNAc和LacNAc或GlcNAc和LNB。当如实施例1中所述,使用以下任一或多种的碳源,但不限于此:甘油、葡萄糖、果糖、乳糖、阿拉伯糖、麦芽三糖、山梨醇、木糖、鼠李糖及甘露糖而在生物反应器规模的补料批次发酵中进行评估时,该突变菌株也分别产生GlcNAc和LacNAc或GlcNAc和LNB。
实施例28:材料与方法啤酒酵母菌
培养基
菌株在含有6.7g/L酵母氮基不含氨基酸(YNB w/o AA,Difco)、20g/L琼脂(Difco)(固体培养物)、22g/L一水合葡萄糖或20g/L乳糖与0.79g/L CSM或0.77g/L CSM-Ura的具有完全补充混合物(SD CSM)或CSM脱落(CSM drop-out)(SD CSM-Ura)的合成限定酵母培养基(MP生物医学)上生长。
菌株
由Bachmann等人(Yeast(1998)14:115-32)创建的啤酒酵母菌(Saccharomycescerevisiae)BY4742从Euroscarf培养物中心获得。所有突变体菌株均采用Gietz的方法(Yeast 11:355-360,1995)Y通过同源重组或质体转形产生。
质体
酵母菌表达质体p2a_2μ(Chan 2013,Plasmid 70,2-17)用于啤酒酵母菌的表达外源基因。此质体包含胺苄青霉素抗性基因和细菌复制起点,以允许在大肠杆菌中进行选择和维持。质体进一步含有2μ酵母ori和Ura3选择标志物以用于在酵母中的选择和维持。
在一实施例中,酵母菌表达质体p2a_2μ可经修饰以获得如WO18122225所述的来自大肠杆菌突变果糖-6-磷酸转氨酶glmS*54(其与野生型glmS蛋白质(UniProt ID P17169)不同在于A39T、R250C和G472S突变)、来自啤酒酵母菌的N-乙酰葡萄糖胺-6-磷酸转移酶GNA1(UniProt ID P43577)、例如包括aphA、Cof、HisB、OtsB、SurE、Yaed、YcjU、YedP、YfbT、YidA、YigB、YihX、YniC、YqaB、YrbL、AppA、Gph、SerB、YbhA、YbiV、YbjL、Yfb、YieH、YjgL、YjjG、YrfG及YbiU的大肠杆菌基因中任一或多个基因、或来自恶臭假单胞菌的PsMupP、来自啤酒酵母菌的ScDOG1或来自枯草芽孢杆菌的BsAraL的磷酸酶,如WO18122225所述。该修饰的质体可进一步经修饰以获得选自包括以下列举的N-乙酰葡萄糖胺b-1,3-半乳糖基转移酶SEQ ID NO:03、04、05、06、07、08、10、11、12及13及/或选自包括以下列举的N-乙酰葡萄糖胺b-1,4-半乳糖基转移酶SEQ ID NO:15、16、17、18、19、20、21、22、23、26、27、28、31、32、33、34、35、36、39、40及41。
在产生GDP-岩藻糖的一实施例中,酵母菌表达质体例如p2a_2μ_Fuc(Chan 2013,Plasmid 70,2-17)可以持续型转录单元进行修饰,该持续型转录单元为针对例如来自乳酸克鲁维酵母(K.lactis)的LAC12(UniProt ID P07921)的乳糖通透酶、例如来自大肠杆菌的gmd(UniProt ID P0AC88)的GDP-甘露糖4,6-脱水酶、以及例如来自大肠杆菌的fcl(UniProt ID P32055)的GDP-L-岩藻糖合成酶。酵母菌表达质体p2a_2μ_Fuc2可使用作为p2a_2μ_Fuc质体的替代表达质体,该质体包含胺苄青霉素抗性基因、细菌ori、2μ酵母ori和Ura3选择标志物持续型转录单元,其用于例如来自乳酸克鲁维酵母的LAC12(UniProt IDP07921)的乳糖通透酶、例如来自大肠杆菌的fucP(UniProt ID P11551)的岩藻糖通透酶、以及例如来自脆弱拟杆菌的fkp(UniProt ID SUV40286.1)的具有岩藻糖激酶/岩藻糖-1-磷酸盐鸟苷酸转移酶活性的双官能酶。为了进一步生产岩藻糖基化寡糖,p2a_2μ_Fuc及其变体p2a_2μ_Fuc2还包含一个持续型转录单元,其用于例如来自幽门螺旋杆菌的HpFutC(GenBank No.AAD29863.1)的α-1,2-岩藻糖基转移酶及/或例如来自幽门螺旋杆菌的HpFucT(UniProt ID O30511)的α-1,3-岩藻糖基转移酶。
在产生UDP-半乳糖的一实施例中,酵母菌表达质体可衍生自pRS420-质体系列(Christiansonet al.,1992,Gene 110:119-122),该质体系列含有HIS3选择标志物及用于例如来自大肠杆菌的galE(UniProt ID P09147)的UDP-葡萄糖-4-表异构酶的持续型转录单元。此质体可进一步以例如来自乳酸克鲁维酵母的LAC12(UniProt ID P07921)的乳糖通透酶和例如来自脑膜炎双球菌的lgtA(UniProt ID Q9JXQ6)的半乳糖苷β-1,3-N-乙酰基葡糖胺转移酶活性的持续型转录单元进行修饰,以产生LN3。为了进一步产生LN3衍生的寡糖,例如LNT,突变LN3产生菌株进一步以选自包含SEQ ID NO:03、04、05、06、07、08、10、11、12及13的列举的N-乙酰葡萄糖胺β-1,3-半乳糖基转移酶的持续型转录单元进行修饰。为了进一步产生LN3衍生的寡糖,例如LNnT,突变LN3产生菌株进一步以选自包含SEQ ID NO:15、16、17、18、19、20、21、22、23、26、27、28、31、32、33、34、35、36、39、40及41的列举的N-乙酰葡萄糖胺β-1,4-半乳糖基转移酶的持续型转录单元进行修饰。
在产生唾液酸及CMP-唾液酸的一实施例中,酵母菌表达质体可衍生自pRS420-质体系列(Christiansonet al.,1992,Gene 110:119-122),该质体系列含有TRP1选择标志物及持续型转录单元,该持续型转录单元用于一或多个复制的L-谷氨酰胺—D-果糖-6-磷酸转氨酶,例如,来自大肠杆菌的突变体glmS*54(与UniProt ID P17169的野生型大肠杆菌glmS不同之处在于具有A39T、R250C和G472S突变,如Deng等人所述(Biochimie 88,419-29(2006))、一个磷酸酶,例如,包含aphA、Cof、HisB、OtsB、SurE、Yaed、YcjU、YedP、YfbT、YidA、YigB、YihX、YniC、YqaB、YrbL、AppA、Gph、SerB、YbhA、YbiV、YbjL、Yfb、YieH、YjgL、YjjG、YrfG及YbiU的大肠杆菌基因中任一或多个、或者来自恶臭假单胞菌的PsMupP、来自啤酒酵母菌的ScDOG1或来自枯草芽孢杆菌的BsAraL,如WO18122225所述、例如来自卵形拟杆菌的AGE(UniProt ID A7LVG6)的N-乙酰葡萄糖胺2-表异构酶、例如来自脑膜炎双球菌的N-乙酰神经氨酸合成酶(UniProt ID E0NCD4)以及例如来自空肠曲杆菌的NeuA酶(UniProt IDQ93MP7)的N-酰基神经氨酸胞苷酰转移酶、来自流感嗜血杆菌的NeuA酶(GenBankNo.AGV11798.1)或来自出血性巴氏杆菌的NeuA酶(GenBank No.AMK07891.1)。可选地,包括一或多个复制的N-乙酰葡萄糖胺-6-磷酸转移酶的持续型转录单元例如更添加例如来自啤酒酵母菌的GNA1(UniProt ID P43577)。为了产生唾液酸化寡糖,该质体进一步包括持续型转录单元,其用于例如来自乳酸克鲁维酵母的LAC12(UniProt ID P07921)的乳糖通透酶、以及一或多个复制的β-半乳糖苷α-2,3-唾液酸转移酶,例如来自出血性巴氏杆菌的PmultST3(UniProt ID Q9CLP3)或由具有β-半乳糖苷α-2,3-唾液酸转移酶活性的UniProtID Q9CLP3的氨基酸残基1至268所组成的PmultST3样多肽及、来自脑膜炎双球菌的NmeniST3(GenBankNo.ARC07984.1)或来自出血性巴氏杆菌出血性亚种菌株Pm70的PmultST2(GenBank No.AAK02592.1)、β-半乳糖苷α-2,6-唾液酸转移酶,例如来自海鲡发光杆菌的PdST6(UniProt ID O66375)或由具有β-半乳糖苷α-2,6-唾液酸转移酶活性的UniProt ID O66375的氨基酸残基108至497所组成的PdST6样多肽或来自发光杆菌属(Photobacterium sp)JT-ISH-224的P-JT-ISH-224-ST6(UniProt ID A8QYL1)或由具有β-半乳糖苷α-2,6-唾液酸转移酶活性的UniProt ID A8QYL1的氨基酸残基18至514所组成的P-JT-ISH-224-ST6样多肽及/或例如来自小鼠(UniProt ID Q64689)的α-2,8-唾液酸转移酶。
优选但非必须地,糖基转移酶蛋白及/或参与核苷酸活化糖合成的蛋白质在N端融合到SUMOstar标签(例如从pYSUMOstar,Life Sensors,Malvern,PA获得)以提高其溶解度。
可选地,以编码例如Hsp31、Hsp32、Hsp33、Sno4、Kar2、Ssb1、Sse1、Sse2、Ssa1、Ssa2、Ssa3、Ssa4、Ssb2、Ecm10、Ssc1、Ssq1、Ssz1、Lhs1、Hsp82、Hsc82、Hsp78、Hsp104、Tcp1、Cct4、Cct8、Cct2、Cct3、Cct5、Cct6或Cct7(Gong et al.,2009,Mol.Syst.Biol.5:275)的伴护蛋白的持续型转录单元的敲入修饰突变酵母菌株。
质体维持在购自Invitrogen的宿主大肠杆菌DH5α(F-,phi80dlacZdeltaM15,delta(lacZYA-argF)U169,deoR,recA1,endA1,hsdR17(rk-,mk+),phoA,supE44,lambda-,thi-1,gyrA96,relA1)。
异源及同源表达
需要表达的基因,无论是来自质体还是来自基因组,都是由以下公司之一以合成方法合成:DNA2.0、Gen9、IDT或Twist Bioscience。
通过针对表达宿主的密码子使用优化密码子的使用,可以进一步促进表达。利用供应商的工具对基因进行优化。
培养条件
一般而言,酵母菌菌株最初生长在SD-CSM平板上以获得单一菌落。这些平板于30℃生长2-3天。
从单一菌落开始,预培养物于30℃,以200rpm摇动在5mL中过夜生长。随后的125ml摇瓶实验在25mL培养基中接种2%的此类预培养物。这些摇瓶于30℃使用200rpm的轨道振荡进行培养。
基因表达启动子
基因利用由Blazeck(Biotechnology and Bioengineering,Vol.109,No.11,2012)所述的合成持续型启动子表达。
实施例29:啤酒酵母菌中GlcNAc及LacNAc;或GlcNAc及LNB的产生
另一实施例提供以啤酒酵母菌形式的真核生物用于实施本发明的用途。使用如实施例28所述的菌株、质体及方法,生成产生GlcNAc和LacNAc的突变啤酒酵母菌菌株。此些修饰包括额外的持续型表达单元,其用于大肠杆菌的突变果糖-6-磷酸转氨酶glmS*54(与具有UniProt ID P17169的野生型大肠杆菌glmS不同之处在于具有A39T、R250C和G472S突变)、啤酒酵母菌的N-乙酰葡萄糖胺-6-磷酸转移酶GNA1(UniProt ID P43577)、选自以下列举的磷酸酶,该列举包括:包含aphA、Cof、HisB、OtsB、SurE、Yaed、YcjU、YedP、YfbT、YidA、YigB、YihX、YniC、YqaB、YrbL、AppA、Gph、SerB、YbhA、YbiV、YbjL、Yfb、YieH、YjgL、YjjG、YrfG及YbiU的大肠杆菌基因中任一或多个、或来自恶臭假单胞菌的PsMupP、来自啤酒酵母菌的ScDOG1以及来自枯草芽孢杆菌的BsAraL,如WO18122225所述,以及SEQ ID NO 15的脑膜炎双球菌的N-乙酰葡萄糖胺b-1,4-半乳糖基转移酶LgtB。突变啤酒酵母菌菌株能够以葡萄糖或甘油为碳源生长,将碳源转化为果糖-6-磷酸盐,然后通过新表达的果糖-6-磷酸转氨酶、N-乙酰葡萄糖胺-6-磷酸转移酶、磷酸酶及N-乙酰葡萄糖胺b-1,4-半乳糖基转移酶的活性将其转化为GlcNAc和随后的LacNAc。
该菌株的预培养物在含有22g/L葡萄糖的5mL合成成分确定培养基SD-CSM中进行,并如实施例28所述在30℃下生长。然后将此预培养物接种在摇瓶中的25mL培养基,其中含有10g/L葡萄糖作为唯一碳源并在30℃下生长。定期取样并如实施例1中所述地测量GlcNAc和LacNAc的产生。在类似实验中,含有SEQ ID NO 03的大肠杆菌O55:H7的N-乙酰葡萄糖胺b-1,3-半乳糖基转移酶WbgO,而不是SEQ ID NO 15的N-乙酰葡萄糖胺b-1,4-半乳糖基转移酶LgtB的类似酵母菌株能够产生GlcNAc和LNB。
实施例30:用于具有PFAM域PF00535的N-乙酰葡萄糖胺b-1,3-半乳糖基转移酶基 因的RegEx检索
针对具有PFAM域PF00535的N-乙酰葡萄糖胺b-1,3-半乳糖基转移酶基因执行RegEx分析,以找到包含具有SEQ ID NO 01的[AGPS]XXLN(Xn)RXDXD的成员,其中X为是任何氨基酸,其中n为12至17、或找到包含具有SEQ ID NO 02的序列PXXLN(Xn)RXDXD(Xm)[FWY]XX[HKR]XX[NQST]的成员,其中X是任何氨基酸,其中n是12至17且m是100至115。为此,如Pfam数据库版本Pfam 33.1(2020年6月11日发布)注释的所有具有PFAM域PF00535的N-乙酰葡萄糖胺b-1,3-半乳糖基转移酶基因均从UniProt数据库(2020年7月03日发布)下载并根据如得自https://towardsdatascience.com/using-regular-expression-in-genetics-with-python-175e2b9395c2(2019年4月06日发布)的方法分析该模体的存在。来自该RegEx检索的相应成员包括:A0A354SD93、A0A108TBL4、A0A1G2TK10、A0A1G2UER6、A0A1G2UVR8、T1RPX3、U4SLB4、T1RNY4、T1RQ38、A0A377HVE3、A0A0M7B6J0、A0A0K1Q500、A0A3S0CAP8、A0A5C8BKY0、A0A0G0R169、A0A5C6Y259、A0A5C9C3N6、A0A1G7VWF9、A0A193KHC3、A0A5N1GML0、A0A3N2I9V8,A0A2I1RGW1、A0A5N1JGF2、A0A538SYW6、N8U0B3、A0A1G8DZV8、A0A538U133、A0A538SYT2、F3PEK1、B0NR63、A0A3D3JDC2、A0A5C5Y5M7、A0A1G9SAW9、E3HB28及A0A538TXM3。
实施例31:用于其他N-乙酰葡萄糖胺b-1,3-半乳糖基转移酶或N-乙酰葡萄糖胺b- 1,4-半乳糖基转移酶基因的RegEx检索
可针对具有PFAM域IPR002659的N-乙酰葡萄糖胺b-1,3-半乳糖基转移酶基因执行RegEx分析,以找到包含具有SEQ ID NO 09的序列KT(Xn)[FY]XXKXDXD(Xm)[FHY]XXG(X,无A、G、S)(Xp)X(无F、H、W、Y)[DE]D[ILV]XX[AG]的成员,其中X是任何氨基酸,其中n是13至16,m是35至70,且p是20至45。为此,如Pfam数据库版本Pfam 33.1(2020年6月11日发布)注释的所有具有PFAM域IPR002659的N-乙酰葡萄糖胺b-1,3-半乳糖基转移酶基因均从UniProt数据库(2020年7月03日发布)下载并根据如得自https://towardsdatascience.com/using-regular-expression-in-genetics-with-python-175e2b9395c2(2019年4月06日发布)的方法分析该模体的存在。
可针对具有PFAM域PF01755的N-乙酰葡萄糖胺b-1,4-半乳糖基转移酶基因执行相似的RegEx分析,以找到具有SEQ ID NO 14的序列EXXCXXSHXX[ILV][FWY](Xn)EDD(Xm)[ACGST]XXYX[ILMV]的成员,其中X是任何氨基酸,其中n为13至15且m是50至76。为此,如Pfam数据库版本Pfam 33.1(2020年6月11日发布)注释的所有具有PFAM域PF01755的N-乙酰葡萄糖胺b-1,4-半乳糖基转移酶基因均从UniProt数据库(2020年7月03日发布)下载并根据如得自https://towardsdatascience.com/using-regular-expression-in-genetics-with-python-175e2b9395c2(2019年4月06日发布)的方法分析该模体的存在。
相似地,可针对具有PFAM域PF00535的N-乙酰葡萄糖胺b-1,4-半乳糖基转移酶基因执行RegEx分析,以找到具有SEQ ID NO 24的序列R[KN]XXXXXXXGXXXX[FL]XDXD(Xn)[FHW]XXX[FHNY](Xm)E[DE]的成员,其中X是任何氨基酸,其中n是50至75,m是10至30、或具有SEQ ID NO 25的序列R[KN]XXXXXXXGXXXXFXDXD(Xn)[FHW]XXX[FHNY](Xm)E[DE](Xp)[FWY]XX[HKR]XX[NQST]的成员,其中X是任何氨基酸,其中n是50至75,m是10至30,且p是20至25。为此,如Pfam数据库版本Pfam 33.1(2020年6月11日发布)注释的所有具有PFAM域PF00535的N-乙酰葡萄糖胺b-1,4-半乳糖基转移酶基因均从UniProt数据库(2020年7月03日发布)下载并根据如得自https://towardsdatascience.com/using-regular-expression-in-genetics-with-python-175e2b9395c2(2019年4月06日发布)的方法分析该模体的存在。
可针对具有PFAM域PF02709而不具有PFAM域PF00535的N-乙酰葡萄糖胺b-1,4-半乳糖基转移酶基因执行相似的RegEx分析,以找到具有SEQ ID NO 29的序列[FWY]XX[FY][FWY](X23)[FWY][GQ]X[DE]D的成员,其中X是任何氨基酸、或者具有SEQ ID NO 30的序列[PV]W[GHNP](Xn)[FWY][GQ]X[DE]D的成员,其中X是任何氨基酸,且n为21至24。为此,如Pfam数据库版本Pfam 33.1(2020年6月11日发布)注释的所有具有PFAM域PF02709而不具有PFAM域PF00535的N-乙酰葡萄糖胺b-1,4-半乳糖基转移酶基因均从UniProt数据库(2020年7月03日发布)下载并根据如得自https://towardsdatascience.com/using-regular-expression-in-genetics-with-python-175e2b9395c2(2019年4月06日发布)的方法分析该模体的存在。
最后,可针对具有PFAM域PF03808的N-乙酰葡萄糖胺b-1,4-半乳糖基转移酶基因执行RegEx分析,以找到具有SEQ ID NO 37的序列[ST][FHY]XN(Xn)DG(X16)[HKR]X[ST]FDXX[ST]XA的成员,其中X是任何氨基酸,且其中n是20至25、或者具有SEQ ID NO 38的序列[ST][FHY]XN(Xn)DG(X16)[HKR]X[ST]FDXX[ST]XA(Xm)[HR]XG[FWY](Xp)GXGXXXQ[DE]的成员,其中X是任何氨基酸,其中n是20至25,m是40至50,且p是22至30。为此,如Pfam数据库版本Pfam33.1(2020年6月11日发布)注释的所有具有PFAM域PF03808的N-乙酰葡萄糖胺b-1,4-半乳糖基转移酶基因均从UniProt数据库(2020年7月03日发布)下载并根据如得自https://towardsdatascience.com/using-regular-expression-in-genetics-with-python-175e2b9395c2(2019年4月06日发布)的方法分析该模体的存在。
实施例32:以修饰的大肠杆菌宿主产生包含6'-SL、LacNAc、唾液酸化LacNAc、LN3、 唾液酸化LN3、LNnT及LSTc的寡糖混合物
大肠杆菌K-12菌株MG1655经修饰以如实施例1所述的产生唾液酸,其包括大肠杆菌nagA、nagB、nanA、nanT、nanE、nanK、LacZ、LacY及LacA基因的剃除及持续型转录单元的基因敲入,该持续型转录单元包括编码来自大肠杆菌的乳糖通透酶(LacY)(UniProt IDP02920)、来自大肠杆菌的唾液酸转运体(nanT)(UniProt ID P41036)、来自大肠杆菌的突变L-谷氨酰胺—D-果糖-6-磷酸转氨酶glmS*54(与具有UniProt ID P17169的野生型大肠杆菌glmS不同之处在于具有A39T、R250C和G472S突变)、来自啤酒酵母菌的N-乙酰葡萄糖胺-6-磷酸转移酶(GNA1)(UniProt ID P43577)、来自卵形拟杆菌的N-乙酰葡萄糖胺2-表异构酶(AGE)(UniProt ID A7LVG6)、来自空肠曲杆菌N-乙酰神经氨酸合成酶(NeuB)(UniProtID Q93MP9)、来自大肠杆菌W的蔗糖转运体(CscB)(UniProt ID E0IXR1)、来自运动发酵单胞菌的果糖激酶(Frk)(UniProt ID Q03417)及来自青春双歧杆菌的蔗糖磷酸化酶(BaSP)(UniProt ID A0ZZH6)的基因。因此,所获得的产生唾液酸的突变大肠杆菌菌株进一步以持续型转录单元的基因敲入进行修饰,以表达来自空肠曲杆菌的N-酰基神经氨酸胞苷酰转移酶NeuA(UniProt ID Q93MP7)及来自海鲡发光菌(P.damselae)的α-2,6-唾液酸转移酶PdbST(UniProt ID O66375)而产生6’-唾液酸乳糖。在下一步骤中,突变菌株进一步以包含持续型转录单元的基因敲入进行修饰,该持续型转录单元用于来自脑膜炎双球菌的半乳糖苷β-1,3-N-乙酰基葡糖胺转移酶lgtA(UniProt ID Q9JXQ6)及选自包括SEQ ID NO:15、16、17、18、19、20、21、22、23、26、27、28、31、32、33、34、35、36、39、40及41的列举的N-乙酰葡萄糖胺β-1,4-半乳糖基转移酶,以产生包括6’-SL、LacNAc、唾液酸化LacNAc、LN3、唾液酸化LN3、LNnT及LSTc(Neu5Ac-a2,6-Gal-b1,4-GlcNAc-b1,3-Gal-b1,4-Glc)的寡糖混合物。根据实施例1(其中,培养基含有蔗糖及乳糖)中提供的培养条件在生长实验中评估新颖菌株。该菌株在96孔盘中以四个生物学重复进行生长。培养72小时后,收集培养肉汤,并在UPLC分析糖类。
实施例33:以修饰的大肠杆菌宿主产生LN3、唾液酸化LN3、LNT、LNB、唾液酸化LNB、 3’-SL及LSTa的寡糖混合物
如实施例32所述的修饰以产生唾液酸(Neu5Ac)的大肠杆菌进一步以持续型转录单元的基因敲入进行修饰,以表达来自空肠曲杆菌的N-酰基神经氨酸胞苷酰转移酶NeuA(UniProt ID Q93MP7)及来自出血性巴氏杆菌的α-2,3-唾液酸转移酶PmultST3(UniProtID Q9CLP3)以产生3’-唾液乳糖(3’-siayllactose)。在下一步骤中,突变菌株进一步以包含持续型转录单元的基因敲入进行修饰,该持续型转录单元用于来自脑膜炎双球菌的半乳糖苷β-1,3-N-乙酰基葡糖胺转移酶lgtA(UniProt ID Q9JXQ6)及选自包括SEQ ID NO:03、04、05、06、07、08、10、11、12或13的列举的N-乙酰葡萄糖胺β-1,3-半乳糖基转移酶,以产生包括LN3、3’-唾液酸化LN3(Neu5Ac-a2,3-GlcNAc-b1,3-Gal-b1,4-Glc)、LNT、LNB、唾液酸化LNB、3’-SL及LSTa(Neu5Ac-a2,3-Gal-b1,3-GlcNAc-b1,3-Gal-b1,4-Glc)的寡糖混合物。根据实施例1中提供的培养条件(其中,培养基含有蔗糖及乳糖)在生长实验中评估新颖菌株。该菌株在96孔盘中以四个生物学重复进行生长。培养72小时后,收集培养肉汤,并在UPLC分析糖类。
实施例34:材料及方法枯草芽孢杆菌
培养基
使用两种不同的培养基,名为丰富的Luria肉汤(LB)和用于摇瓶的基本培养基(MMsf)。基本培养基使用微量元素混合物。
微量元素混合物由0.735g/L CaCl2.2H2O、0.1g/L MnCl2.2H2O、0.033g/LCuCl2.2H2O、0.06g/L CoCl2.6H2O、0.17g/L ZnCl2、0.0311g/L H3BO4、0.4g/LNa2EDTA.2H2O及0.06g/L Na2MoO4组成。柠檬酸铁溶液含有0.135g/L FeCl3.6H2O、1g/L柠檬酸钠(Hoch 1973PMC1212887)。
Luria肉汤(LB)培养基由1%胰蛋白胨(Difco,Erembodegem,Belgium)、0.5%酵母菌萃取物(Difco)和0.5%氯化钠(VWR.Leuven,Belgium)组成。Luria肉汤琼脂(LBA)盘由具有2g/L琼脂(Difco,Erembodegem,Belgium)的LB培养基组成。
用于摇瓶实验的基本培养基(MMsf)由2.00g/L(NH4)2SO4、7.5g/LKH2PO4、17.5g/LK2HPO4、1.25g/L柠檬酸钠、0.25g/L MgSO4.7H2O、0.05g/L色氨酸、10至30g/L葡萄糖或其他碳源,包括但不限于果糖、麦芽糖、蔗糖、甘油和麦芽三糖(当在实施例中指定时)、10ml/L微量元素混合物及10ml/L柠檬酸铁溶液组成。使用1M KOH将培养基的pH值设为7。根据实验,可以添加唾液酸或乳糖作为前驱物。
例如LB的复合培养基通过高压灭菌(121℃,21')且基本培养基通过过滤(0.22μmSartorius)进行灭菌。当必要时,通过添加抗生素(例如吉欧霉素(zeocin)(20mg/L))使培养基具有选择性。
菌株、质体及突变
枯草芽孢杆菌168获得自Bacillus Genetic Stock Center(Ohio,USA)。
用于经由Cre/lox进行基因删除的质体由Yan等人(Appl.&Environm.Microbial.,Sept 2008,p5556-5562)的描述进行构建。如Xue等人(J.Microb.Meth.34(1999)183-191)所述,基因破坏是经由与线性DNA的同源重组和经由电穿孔进行转形而完成。Liu等人(Metab.Engine.24(2014)61-69)描述基因剃除的方法。此方法使用目标基因的上游和下游的1000bp同源性。
由Popp等人(Sci.Rep.,2017,7,15158)所述的整合载体使用作为表达载体,如必要时可进一步用于基因整合。用于表达的合适启动子可以从部件储存库(iGem)中获得:sequence id:Bba_K143012、Bba_K823000、Bba_K823002或Bba_K823003。可使用Gibson组件、Golden Gate组件、Cliva组件、LCR或限制性连接进行选殖。
在产生LNB的实施例中,枯草芽孢杆菌突变株以包括持续型转录单元的基因组敲入进行修饰,该持续型转录单元针对来自大肠杆菌的glmS*54(与具有UniProt ID P17169的野生型大肠杆菌glmS不同之处在于具有A39T、R250C和G472S突变,如Deng等人所述(Biochimie 88,419-29(2006)))、来自啤酒酵母菌的N-乙酰葡萄糖胺-6-磷酸转移酶GNA1(UniProt ID P43577)、选自以下列举的磷酸酶,该列举包括:包含aphA、Cof、HisB、OtsB、SurE、Yaed、YcjU、YedP、YfbT、YidA、YigB、YihX、YniC、YqaB、YrbL、AppA、Gph、SerB、YbhA、YbiV、YbjL、Yfb、YieH、YjgL、YjjG、YrfG及YbiU的大肠杆菌基因中任一或多个、或来自恶臭假单胞菌的PsMupP、来自啤酒酵母菌的DOG1或来自枯草芽孢杆菌的AraL,如WO18122225所述、以及选自包括SEQ ID NO:03、04、05、06、07、08、10、11、12或13的列举的N-乙酰葡萄糖胺β-1,3-半乳糖基转移酶。
在产生LacNAc的实施例中,枯草芽孢杆菌突变株以包括持续型转录单元的基因组敲入进行修饰,该持续型转录单元针对来自大肠杆菌的glmS*54(与具有UniProt IDP17169的野生型大肠杆菌glmS不同之处在于具有A39T、R250C和G472S突变,如Deng等人所述(Biochimie 88,419-29(2006)))、来自啤酒酵母菌的N-乙酰葡萄糖胺-6-磷酸转移酶GNA1(UniProt ID P43577)、选自以下列举的磷酸酶,该列举包括:包含aphA、Cof、HisB、OtsB、SurE、Yaed、YcjU、YedP、YfbT、YidA、YigB、YihX、YniC、YqaB、YrbL、AppA、Gph、SerB、YbhA、YbiV、YbjL、Yfb、YieH、YjgL、YjjG、YrfG及YbiU的大肠杆菌基因中任一或多个、或来自恶臭假单胞菌的PsMupP、来自啤酒酵母菌的DOG1或来自枯草芽孢杆菌的AraL,如WO18122225所述、以及选自包括SEQ ID NO:15、16、17、18、19、20、21、22、23、26、27、28、31、32、33、34、35、36、39、40及41的列举的N-乙酰葡萄糖胺β-1,4-半乳糖基转移酶。为了进一步使该LNB或LacNAc岩藻糖基化,LNB或LacNAc产生菌株进一步以持续型转录单元进行修饰,该持续型转录单元针对例如来自幽门螺旋杆菌的HpFutC(GenBank No.AAD29863.1)的α-1,2-岩藻糖基转移酶及/或来自幽门螺旋杆菌的HpFucT(UniProt ID O30511)的α-1,3-岩藻糖基转移酶。
在产生乳糖类的寡糖的实施例中,创建枯草芽孢杆菌突变菌株以含有编码乳糖输入蛋白的基因(例如,UniProt ID P02920的大肠杆菌LacY)。对于2'FL、3FL和diFL产生,α-1,2-岩藻糖基转移酶及/或α-1,3-岩藻糖基转移酶表达建构体额外添加到菌株中。
在产生乳-N-三糖(LNT-II、LN3、GlcNAc-b1,3-Gal-b1,4-Glc)的实施例中,枯草芽孢杆菌菌株以持续型转录单元的基因敲入进行修饰,该持续型转录单元包含乳糖输入蛋白(lactose importer)(例如,UniProt ID P02920的大肠杆菌LacY)和半乳糖苷β-1,3-N-乙酰基葡糖胺转移酶,例如来自脑膜炎双球菌的LgtA(GenBank:AAM33849.1)。为了LNT产生,LN3产生菌株进一步以持续型转录单元进行修饰,该持续型转录单元针对选自包括SEQ IDNO:03、04、05、06、07、08、10、11、12或13的列举的N-乙酰葡萄糖胺β-1,3-半乳糖基转移酶,其可经由基因敲入或自表达质体呈递给菌株。为了LNnT产生,LN3产生菌株进一步以持续型转录单元进行修饰,该持续型转录单元针对选自包括SEQ ID NO:15、16、17、18、19、20、21、22、23、26、27、28、31、32、33、34、35、36、39、40及41的列举的N-乙酰葡萄糖胺β-1,4-半乳糖基转移酶。为了进一步使LN3、LNT或LNnT岩藻糖基化,突变菌株进一步以持续型转录单元进行修饰,该持续型转录单元针对例如来自幽门螺旋杆菌的HpFutC(GenBankNo.AAD29863.1)的α-1,2-岩藻糖基转移酶及/或来自幽门螺旋杆菌的HpFucT(UniProt IDO30511)的α-1,3-岩藻糖基转移酶。
在唾液酸产生的实施例中,突变枯草芽孢杆菌菌株通过过度表达天然的果糖-6-P-转氨酶(UniProt ID P0CI73)创建,以促进细胞内葡萄糖胺-6-磷酸盐库。此外,nagA、nagB及gamA基因的酶活性通过基因剃除而破坏且来自啤酒酵母菌的葡萄糖胺-6-P-转氨酶GNA1(UniProt ID P43577)、来自卵形拟杆菌的N-乙酰葡萄糖胺-2-表异构酶(UniProt IDA7LVG6)和来自空肠曲杆菌的N-乙酰神经氨酸合成酶(UniProt ID Q93MP9)在基因组上过度表达。为了允许唾液酸化寡糖的产生,唾液酸产生菌株进一步以表达建构体进行修饰,该表达建构体包括N-酰基神经氨酸胞苷酰转移酶,例如来自空肠曲杆菌的NeuA酶(UniProtID Q93MP7)、来自流行性感冒嗜血杆菌(H.influenzae)的NeuA酶(GenBankNo.AGV11798.1)或来自出血性巴氏杆菌的NeuA酶(GenBank No.AMK07891.1)、以及一或多个复制的β-半乳糖苷α-2,3-唾液酸转移酶,例如来自出血性巴氏杆菌的PmultST3(UniProtID Q9CLP3)或由具有β-半乳糖苷α-2,3-唾液酸转移酶活性的UniProt ID Q9CLP3的氨基酸残基1至268所组成的PmultST3样多肽及、来自脑膜炎双球菌的NmeniST3(GenBankNo.ARC07984.1)或来自出血性巴氏杆菌出血性亚种菌株Pm70的PmultST2(GenBankNo.AAK02592.1)、β-半乳糖苷α-2,6-唾液酸转移酶,例如来自海鲡发光杆菌的PdST6(UniProt ID O66375)或由具有β-半乳糖苷α-2,6-唾液酸转移酶活性的UniProt IDO66375的氨基酸残基108至497所组成的PdST6样多肽或来自发光杆菌属JT-ISH-224的P-JT-ISH-224-ST6(UniProt ID A8QYL1)或由具有β-半乳糖苷α-2,6-唾液酸转移酶活性的UniProt ID A8QYL1的氨基酸残基18至514所组成的P-JT-ISH-224-ST6样多肽及/或例如来自小鼠(UniProt ID Q64689)的α-2,8-唾液酸转移酶。在产生乳糖类唾液酸化寡糖的实施例中,枯草芽孢杆菌突变菌株进一步以持续型转录单元进行修饰,该持续型转录单元针对乳糖输入蛋白(例如,UniProt ID P02920的大肠杆菌LacY)。
为了在蔗糖上生长,突变菌株可额外以持续型转录单元的基因敲入进行修饰,该持续型转录单元包括来自大肠杆菌W的蔗糖转运体(CscB)(UniProt ID E0IXR1)、来自运动发酵单胞菌的果糖激酶(Frk)(UniProt ID Q03417)及来自青春双歧杆菌的蔗糖磷酸化酶(BaSP)(UniProt ID A0ZZH6)。
异源及同源表达
需要表达的基因,无论是来自质体还是来自基因组,都是由以下公司之一以合成方法合成:DNA2.0、Gen9、Twist Biosciences或IDT。
通过针对表达宿主的密码子使用优化密码子的使用,可以进一步促进表达。利用供应商的工具对基因进行优化。
培养条件
从冷冻小瓶或LB盘的单一菌落开始96孔微量滴定盘实验的预培养,在150μL LB中并于37℃在800rpm的轨道振荡器上培养过夜。将此培养物用作96孔方形微量滴定盘的接种物,用400μL MMsf培养基稀释400倍。每个菌株在96孔盘的多个孔中以生物学重复进行生长。然后将这些最终的96孔培养盘于37℃在800rpm的轨道振荡器上培养72h或更短或更长时间。在培养实验结束时,从每个孔中取出样品以测量上清液浓度(细胞离心(spinningdown)5分钟后的细胞外糖浓度),或者通过在离心细胞之前将培养肉汤在90℃下煮沸15分钟或在60℃下煮沸60分钟(=如本文所定义的全肉汤浓度、细胞内及细胞外糖浓度)。
再者,稀释培养物以测量600nm的光密度。细胞性能指数或CPI是通过将寡糖浓度除以生质而确定,与参考菌株相比的相对百分比。生质根据经验确定为在600nm处测量的光密度的约1/3。
实施例35:以修饰的枯草芽孢杆菌菌株产生2’FLNB
枯草芽孢杆菌菌株首先通过nagB、glmS及gamA基因的基因剃除以及持续型转录单元的基因敲入进行修饰以用于产生LNB及在蔗糖上生长,该持续型转录单元包括编码天然的果糖-6-P-转氨酶(UniProt ID P0CI73)、来自大肠杆菌的glmS*54(与具有UniProt IDP17169的野生型大肠杆菌glmS不同之处在于具有A39T、R250C和G472S突变,如Deng等人所述(Biochimie 88,419-29(2006)))、来自啤酒酵母菌的N-乙酰葡萄糖胺-6-磷酸转移酶GNA1(UniProt ID P43577)、来自枯草芽孢杆菌的磷酸酶AraL(UniProt ID P94526)、选自包括SEQ ID NO:03、04、05、06、07、08、10、11、12或13的列举的N-乙酰葡萄糖胺β-1,3-半乳糖基转移酶、来自大肠杆菌W的蔗糖转运体(CscB)(UniProt ID E0IXR1)、来自运动发酵单胞菌的果糖激酶(Frk)(UniProt ID Q03417)及来自青春双歧杆菌的蔗糖磷酸化酶(BaSP)(UniProt ID A0ZZH6)的基因。在下一步骤中,LNB产生菌株以包括针对例如来自幽门螺旋杆菌的HpFutC(GenBank No.AAD29863.1)的α-1,2-岩藻糖基转移酶的持续型转录单元的表达质体进行转形。
根据实施例34提供的培养条件,在缺乏前驱物的MMsf培养基的生长实验中评估新颖菌株的2’FLNB产生。培养72小时后,收集培养肉汤,并在UPLC分析糖类。
实施例36:以修饰的枯草芽孢杆菌菌株产生包括6’-SL、LacNAc、唾液酸化LacNAc、 LN3、唾液酸化LN3、LNnT及LSTc的寡糖混合物
在第一步骤中,枯草芽孢杆菌菌株以nagA、nagB及gamA基因的基因剃除以及持续型转录单元的基因敲入进行修饰以用于产生唾液酸,该持续型转录单元包括编码天然的果糖-6-P-转氨酶(UniProt ID P0CI73)、来自啤酒酵母菌的葡萄糖胺-6-P-转氨酶(UniProtID P43577)、来自卵形拟杆菌的N-乙酰葡萄糖胺-2-表异构酶(UniProt ID A7LVG6)、及来自空肠曲杆菌的N-乙酰神经氨酸合成酶(UniProt ID Q93MP9)的基因。在下一步骤中,突变菌株进一步以持续型转录单元的基因敲入进行修饰,该持续型转录单元包括编码来自空肠曲杆菌的N-酰基神经氨酸胞苷酰转移酶NeuA(UniProt ID Q93MP7)及来自海鲡发光杆菌(P.damselae)的α-2,6-唾液酸转移酶PdbST(UniProt ID O66375)的基因,以产生6’-唾液酸乳糖。在下一步骤中,突变菌株进一步包括持续型转录单元的基因敲入进行修饰,该持续型转录单元针对来自脑膜炎双球菌的半乳糖苷β-1,3-N-乙酰基葡糖胺转移酶lgtA(UniProt ID Q9JXQ6)及选自包括SEQ ID NO:15、16、17、18、19、20、21、22、23、26、27、28、31、32、33、34、35、36、39、40及41的列举的N-乙酰葡萄糖胺β-1,4-半乳糖基转移酶。根据实施例34提供的培养条件,在含有乳糖作为前驱物的MMsf培养基的生长实验中评估新颖菌株的包括6’-SL、LacNAc、唾液酸化LacNAc、LN3、唾液酸化LN3、LNnT及LSTc(Neu5Ac-a2,6-Gal-b1,4-GlcNAc-b1,3-Gal-b1,4-Glc)的寡糖混合物的产生。培养72小时后,收集培养肉汤,并在UPLC分析糖类。
实施例37:材料及方法谷氨酸棒状杆菌
培养基
使用两种不同的培养基,名为丰富胰蛋白胨-酵母菌萃取物(TY)培有基和用于摇瓶的基本培养基(MMsf)。基本培养基使用1000倍库存微量元素混合物。
微量元素混合物由10g/L CaCl2、10g/L FeSO4.7H2O、10g/L MnSO4.H2O、1g/LZnSO4.7H2O、0.2g/L CuSO4、0.02g/L NiCl2.6H2O、0.2g/L生物素(pH7.0)及0.03g/L原儿茶酸组成。
用于摇瓶实验的基本培养基(MMsf)含有20g/L(NH4)2SO4、5g/L尿素、1g/LKH2PO4、1g/L K2HPO4、0.25g/L MgSO4.7H2O、42g/L MOPS、10至30g/L葡萄糖或其他碳源,包括但不限于果糖、麦芽糖、蔗糖、甘油和麦芽三糖(当在实施例中指定时)、及1ml/L微量元素混合物。根据实验,可以添加乳糖及/或唾液酸作为前驱物。
TY培养基由1.6%胰蛋白胨(Difco,Erembodegem,Belgium)、1%酵母菌萃取物(Difco)和0.5%氯化钠(VWR.Leuven,Belgium)组成。TY琼脂(TYA)盘由添加12g/L琼脂(Difco,Erembodegem,Belgium)的TY培养基组成。
例如TY的复合培养基通过高压灭菌(121℃,21')且基本培养基通过过滤(0.22μmSartorius)进行灭菌。当必要时,通过添加抗生素(例如,康霉素、胺苄青霉素)使培养基具有选择性。
菌株及突变
谷氨酸棒状杆菌ATCC 13032获得自American Type Culture Collection。
构建基于由Suzuki等人(Appl.Microbiol.Biotechnol.,2005Apr,67(2):225-33)所述的Cre/loxP技术的整合质粒载体和由Okibe等人(Journal of MicrobiologicalMethods 85,2011,155-163)所述的温度敏感的穿梭载体以用于基因缺失、突变和插入。(异源)基因表达的合适启动子可来自Yim等人(Biotechnol.Bioeng.,2013Nov,110(11):2959-69)。可使用Gibson组件、Golden Gate组件、Cliva组件、LCR或限制性连接进行选殖。
在产生LNB的实施例中,谷氨酸棒状杆菌以持续型表达单元的基因组敲入进行修饰,该持续型表达单元包括来自大肠杆菌的glmS*54(与具有UniProt ID P17169的野生型大肠杆菌glmS不同之处在于具有A39T、R250C和G472S突变,如Deng等人所述(Biochimie88,419-29(2006)))、来自啤酒酵母菌的N-乙酰葡萄糖胺-6-磷酸转移酶GNA1(UniProt IDP43577)、选自以下列举的磷酸酶,该列举包括:包含aphA、Cof、HisB、OtsB、SurE、Yaed、YcjU、YedP、YfbT、YidA、YigB、YihX、YniC、YqaB、YrbL、AppA、Gph、SerB、YbhA、YbiV、YbjL、Yfb、YieH、YjgL、YjjG、YrfG及YbiU的大肠杆菌基因中任一或多个、或来自恶臭假单胞菌的PsMupP、来自啤酒酵母菌的ScDOG1或来自枯草芽孢杆菌的BsAraL,如WO18122225所述、以及选自包括SEQ ID NO:03、04、05、06、07、08、10、11、12或13的列举的N-乙酰葡萄糖胺β-1,3-半乳糖基转移酶。
在产生LacNAc的实施例中,谷氨酸棒状杆菌菌株以持续型表达单元的基因组敲入进行修饰,该持续型表达单元包括来自大肠杆菌的glmS*54(与具有UniProt ID P17169的野生型大肠杆菌glmS不同之处在于具有A39T、R250C和G472S突变,如Deng等人所述(Biochimie 88,419-29(2006)))、来自啤酒酵母菌的N-乙酰葡萄糖胺-6-磷酸转移酶GNA1(UniProt ID P43577)、选自以下列举的磷酸酶,该列举包括:包含aphA、Cof、HisB、OtsB、SurE、Yaed、YcjU、YedP、YfbT、YidA、YigB、YihX、YniC、YqaB、YrbL、AppA、Gph、SerB、YbhA、YbiV、YbjL、Yfb、YieH、YjgL、YjjG、YrfG及YbiU的大肠杆菌基因中任一或多个、或来自恶臭假单胞菌的PsMupP、来自啤酒酵母菌的ScDOG1或来自枯草芽孢杆菌的BsAraL,如WO18122225所述、以及选自包括SEQ ID NO:15、16、17、18、19、20、21、22、23、26、27、28、31、32、33、34、35、36、39、40及41的列举的N-乙酰葡萄糖胺β-1,4-半乳糖基转移酶。为了进一步使该LNB或LacNAc岩藻糖基化,LNB或LacNAc产生菌株进一步以持续型转录单元进行修饰,该持续型转录单元针对例如来自幽门螺旋杆菌的HpFutC(GenBank No.AAD29863.1)的α-1,2-岩藻糖基转移酶及/或来自幽门螺旋杆菌的HpFucT(UniProt ID O30511)的α-1,3-岩藻糖基转移酶。
在产生乳糖类的寡糖的实施例中,创建突变谷氨酸棒状杆菌菌株以含有编码乳糖输入蛋白的基因(例如,UniProt ID P02920的大肠杆菌LacY)。对于2'FL、3FL和diFL产生,例如来自幽门螺旋杆菌的HpFutC(GenBank No.AAD29863.1)的α-1,2-岩藻糖基转移酶及/或来自幽门螺旋杆菌的HpFucT(UniProt ID O30511)的α-1,3-岩藻糖基转移酶额外添加到菌株中。
在产生乳-N-三糖(LNT-II、LN3、GlcNAc-b1,3-Gal-b1,4-Glc)的实施例中,谷氨酸棒状杆菌菌株以持续型转录单元的基因敲入进行修饰,该持续型转录单元包含乳糖输入蛋白(例如,UniProt ID P02920的大肠杆菌LacY)和半乳糖苷β-1,3-N-乙酰基葡糖胺转移酶,例如来自脑膜炎双球菌的LgtA(GenBank:AAM33849.1)。为了LNT产生,LN3产生菌株进一步以持续型转录单元进行修饰,该持续型转录单元针对选自包括SEQ ID NO:03、04、05、06、07、08、10、11、12或13的列举的N-乙酰葡萄糖胺β-1,3-半乳糖基转移酶,其可经由基因敲入或自表达质体呈递给菌株。为了LNnT产生,LN3产生菌株进一步以持续型转录单元进行修饰,该持续型转录单元针对选自包括SEQ IDNO:15、16、17、18、19、20、21、22、23、26、27、28、31、32、33、34、35、36、39、40及41的列举的N-乙酰葡萄糖胺β-1,4-半乳糖基转移酶。为了进一步使LN3、LNT或LNnT岩藻糖基化,突变菌株进一步以持续型转录单元进行修饰,该持续型转录单元针对例如来自幽门螺旋杆菌的HpFutC(GenBank No.AAD29863.1)的α-1,2-岩藻糖基转移酶及/或来自幽门螺旋杆菌的HpFucT(UniProt ID O30511)的α-1,3-岩藻糖基转移酶。
在唾液酸产生的实施例中,突变谷氨酸棒状杆菌菌株通过过度表达天然的果糖-6-P-转氨酶(UniProt ID Q8NND3)创建,以促进细胞内葡萄糖胺-6-磷酸盐库。此外,谷氨酸棒状杆菌基因ldh、cgl2645、nagB、gamA及nagA的酶活性通过基因剃除而破坏且来自啤酒酵母菌的葡萄糖胺-6-P-转氨酶GNA1(UniProt ID P43577)、来自卵形拟杆菌的N-乙酰葡萄糖胺-2-表异构酶(UniProt ID A7LVG6)和来自空肠曲杆菌的N-乙酰神经氨酸合成酶(UniProt ID Q93MP9)在基因组上过度表达。为了允许唾液酸化寡糖的产生,唾液酸产生菌株进一步以表达建构体进行修饰,该表达建构体包括N-酰基神经氨酸胞苷酰转移酶,例如来自空肠曲杆菌的NeuA酶(UniProt ID Q93MP7)、来自流行性感冒嗜血杆菌(H.influenzae)的NeuA酶(GenBank No.AGV11798.1)或来自出血性巴氏杆菌的NeuA酶(GenBank No.AMK07891.1)、以及一或多个复制的β-半乳糖苷α-2,3-唾液酸转移酶,例如来自出血性巴氏杆菌的PmultST3(UniProt ID Q9CLP3)或由具有β-半乳糖苷α-2,3-唾液酸转移酶活性的UniProt ID Q9CLP3的氨基酸残基1至268所组成的PmultST3样多肽及、来自脑膜炎双球菌的NmeniST3(GenBank No.ARC07984.1)或来自出血性巴氏杆菌出血性亚种菌株Pm70的PmultST2(GenBank No.AAK02592.1)、β-半乳糖苷α-2,6-唾液酸转移酶,例如来自海鲡发光杆菌的PdST6(UniProt ID O66375)或由具有β-半乳糖苷α-2,6-唾液酸转移酶活性的UniProt ID O66375的氨基酸残基108至497所组成的PdST6样多肽或来自发光杆菌属JT-ISH-224的P-JT-ISH-224-ST6(UniProt ID A8QYL1)或由具有β-半乳糖苷α-2,6-唾液酸转移酶活性的UniProt ID A8QYL1的氨基酸残基18至514所组成的P-JT-ISH-224-ST6样多肽及/或例如来自小鼠(UniProt ID Q64689)的α-2,8-唾液酸转移酶。在产生乳糖类唾液酸化寡糖的实施例中,谷氨酸棒状杆菌突变菌株进一步以持续型转录单元进行修饰,该持续型转录单元针对乳糖输入蛋白(例如,UniProt ID P02920的大肠杆菌LacY)。
为了在蔗糖上生长,突变菌株可额外以持续型转录单元的基因敲入进行修饰,该持续型转录单元包括来自大肠杆菌W的蔗糖转运体(CscB)(UniProt ID E0IXR1)、来自运动发酵单胞菌的果糖激酶(Frk)(UniProt ID Q03417)及来自青春双歧杆菌的蔗糖磷酸化酶(BaSP)(UniProt ID A0ZZH6)。
异源及同源表达
需要表达的基因,无论是来自质体还是来自基因组,都是由以下公司之一以合成方法合成:DNA2.0、Gen9、Twist Biosciences或IDT。
通过针对表达宿主的密码子使用优化密码子的使用,可以进一步促进表达。利用供应商的工具对基因进行优化。
培养条件
从冷冻小瓶或TY盘的单一菌落开始96孔微量滴定盘实验的预培养,在150μL TY中并于37℃在800rpm的轨道振荡器上培养过夜。将此培养物用作96孔方形微量滴定盘的接种物,用400μL MMsf培养基稀释400倍。每个菌株在96孔盘的多个孔中以生物学重复进行生长。然后将这些最终的96孔培养盘于37℃在800rpm的轨道振荡器上培养72h或更短或更长时间。在培养实验结束时,从每个孔中取出样品以测量上清液浓度(细胞离心(spinningdown)5分钟后的细胞外糖浓度),或者通过在离心细胞之前将培养肉汤在60℃下煮沸15分钟(=如本文所定义的全肉汤浓度、细胞内及细胞外糖浓度)。
再者,稀释培养物以测量600nm的光密度。细胞性能指数或CPI是通过将整个肉汤中测量的寡糖浓度除以生质而确定,与参考菌株相比的相对百分比。生质根据经验确定为在600nm处测量的光密度的约1/3。
实施例38:以修饰的谷氨酸棒状杆菌菌株产生2’FLNB
谷氨酸棒状杆菌菌株首先通过ldh、cgl2645及nagB基因的基因剃除以及持续型转录单元的基因敲入进行修饰以用于产生LNB及在蔗糖上生长,该持续型转录单元包括编码来自大肠杆菌的glmS*54(与具有UniProt ID P17169的野生型大肠杆菌glmS不同之处在于具有A39T、R250C和G472S突变,如Deng等人所述(Biochimie 88,419-29(2006)))、来自啤酒酵母菌的N-乙酰葡萄糖胺-6-磷酸转移酶GNA1(UniProt ID P43577)、来自枯草芽孢杆菌的磷酸酶AraL(UniProt ID P94526)、选自包括SEQ ID NO:03、04、05、06、07、08、10、11、12及13的列举的N-乙酰葡萄糖胺β-1,3-半乳糖基转移酶、来自大肠杆菌W的蔗糖转运体(CscB)(UniProt ID E0IXR1)、来自运动发酵单胞菌的果糖激酶(Frk)(UniProt ID Q03417)及来自青春双歧杆菌的蔗糖磷酸化酶(BaSP)(UniProt ID A0ZZH6)的基因。在下一步骤中,LNB产生菌株以包括针对例如来自幽门螺旋杆菌的HpFutC(GenBank No.AAD29863.1)的α-1,2-岩藻糖基转移酶的持续型转录单元的表达质体进行转形。根据实施例37提供的培养条件,在缺乏前驱物的MMsf培养基的生长实验中评估新颖菌株的2’FLNB产生。培养72小时后,收集培养肉汤,并在UPLC分析糖类。
实施例39:以修饰的谷氨酸棒状杆菌菌株产生包括唾液酸化LacNAc的混合物
谷氨酸棒状杆菌首先以ldh、cgl2645、nagB、nagA及gamA基因的基因剃除以及持续型转录单元的基因敲入进行修饰以用于产生LacNAc及在蔗糖上生长,该持续型转录单元包括编码天然的果糖-6-P-转氨酶(UniProt ID Q8NND3)、来自大肠杆菌的突变glmS*54(与具有UniProt ID P17169的野生型大肠杆菌glmS不同之处在于具有A39T、R250C和G472S突变,如Deng等人所述(Biochimie 88,419-29(2006)))、来自啤酒酵母菌的N-乙酰葡萄糖胺-6-磷酸转移酶GNA1(UniProt ID P43577)、来自枯草芽孢杆菌的磷酸酶AraL(UniProt IDP94526)、选自包括SEQ ID NO:15、16、17、18、19、20、21、22、23、26、27、28、31、32、33、34、35、36、39、40及41的列举的N-乙酰葡萄糖胺β-1,4-半乳糖基转移酶、来自大肠杆菌W的蔗糖转运体(CscB)(UniProt ID E0IXR1)、来自运动发酵单胞菌的果糖激酶(Frk)(UniProt IDQ03417)及来自青春双歧杆菌的蔗糖磷酸化酶(BaSP)(UniProt ID A0ZZH6)的基因。在唾液酸合成的下一步骤中,突变菌株进一步以持续型转录单元的基因敲入进行修饰,该持续型转录单元包括编码来自卵形拟杆菌的N-乙酰葡萄糖胺-2-表异构酶(UniProt ID A7LVG6)以及来自空肠曲杆菌的N-乙酰神经氨酸合成酶(UniProt ID Q93MP9)的基因。在下一步骤中,新颖菌株以包括持续型转录单元的表达质体进行转形,该持续型转录单元包括编码来自空肠曲杆菌的NeuA酶(UniProt ID Q93MP7)的基因且与编码来自出血性巴氏杆菌的β-半乳糖苷α-2,3-唾液酸转移酶PmultST3(UniProt ID Q9CLP3)或来自海鲡发光杆菌的β-半乳糖苷α-2,6-唾液酸转移酶PdST6(UniProt ID O66375)的基因组合。根据实施例37提供的培养条件,在缺乏前驱物的MMsf培养基的生长实验中评估新颖菌株的LacNAc、唾液酸及唾液酸化LacNAc的产生。当将乳糖作为前驱物添加到MMsf培养基中时,依据α-唾液酸转移酶的表达,也评估突变菌株是否额外产生3'-SL或6'-SL。培养72小时后,收集培养肉汤,并在UPLC分析糖类。
实施例40:材料及方法莱茵衣藻(Chlamydomonas reinhardtii)
培养基
莱茵衣藻细胞在Tris-乙酸-磷酸盐(Tris-acetate-phosphate,TAP)培养基(pH7.0)中培养。TAP培养基使用1000倍的Hutner微量元素混合物。Hutner微量元素混合物由50g/L Na2EDTA.H2O(Titriplex III)、22g/L ZnSO4.7H2O、11.4g/L H3BO3、5g/LMnCl2.4H2O、5g/L FeSO4.7H2O、1.6g/L CoCl2.6H2O、1.6g/L CuSO4.5H2O及1.1g/L(NH4)6MoO3所组成。
1.6g/L CuSO4.5H2O含有2.42g/L Tris(参(羟甲基)胺基甲烷(tris(hydroxymethyl)aminomethane))、25mg/L盐储备溶液、0.108g/L K2HPO4、0.054g/LKH2PO4及1.0mL/L冰醋酸。盐储备溶液由15g/L NH4CL、4g/LMgSO4.7H2O及2g/L CaCl2.2H2O所组成。作为糖类合成的前驱物,可添加例如半乳糖、葡萄糖、果糖及/或岩藻糖的前驱物。培养基通过高压灭菌(121℃,21')灭菌。对于在琼脂斜面上的原种培养,使用含有1%琼脂(纯化的高强度,1000g/cm2)的TAP培养基。
菌株、质体及突变
莱茵衣藻野生型菌株21gr(CC-1690,野生型,mt+)、6145C(CC-1691,野生型,mt-)、CC-125(137c,野生型,mt+)、CC-124(137c,野生型,mt-)获得自Chlamydomonas ResourceCenter(https://www.chlamycollection.org),明尼苏达大学,美国。
源自pSI103的表达质体或得自Chlamydomonas Resource Center。可使用Gibson组件、Golden Gate组件、Cliva组件、LCR或限制性连接进行选殖。(异源)基因表达的合适启动子可来自例如Scranton等人(Algal Res.2016,15:135-142)。目标基因的修饰(例如,基因剔除或基因替代)可使用由Jiang等人(Eukaryotic Cell 2014,13(11):1465-1469)所述的Crispr-Cas技术执行。
可如Wang等人(Biosci.Rep.2019,39:BSR2018210)所述经由电穿孔执行转形。细胞在在液体TAP培养基中在恒定通气和连续光照下生长,光强度为8000Lx,直到细胞密度达到1.0至2.0×107cells/mL。接着,将细胞以1.0×106cells/mL的浓度接种到新鲜的液体TAP培养基中,并在连续光照下生长18-20小时,直至细胞密度达到4.0×106cells/mL。然后,通过在室温下以1250g离心5分钟收集细胞,以含有60mM山梨醇(Sigma,美国)的预冷液体TAP培养基洗涤并再悬浮,并冰冻10分钟。接着,将250μL细胞悬浮液(对应于5.0×107cells)与含有100ng质体DNA(400ng/mL)放入预冷的0.4cm电穿孔比色管中。使用BTX ECM830电穿孔设备(1575Ω,50μFD)以6个500V脉冲进行电穿孔,每个脉冲具有4ms的脉冲长度和100ms的脉冲间隔时间。电穿孔后,立即将比色管置于冰上10分钟。最后,将细胞悬浮液转移到含有10mL新鲜液体TAP培养基和60mM山梨醇的50mL锥形离心管中,在昏暗的光线下缓慢摇动过夜恢复。在过夜恢复后,重新收集细胞并用淀粉包埋(starch embedding)法将细胞接种到含有胺苄青霉素(100mg/L)或氯霉素(100mg/L)的选择性1.5%(w/v)琼脂-TAP盘上。然后将盘在23+-0.5℃下,以8000Lx的光强度连续照明下进行培养。5-7天后分析细胞。
在用于产生UDP-半乳糖的实施例中,莱茵衣藻细胞以转录单元进行修饰,该转录单元包括编码来自阿拉伯芥(Arabidopsis thaliana)的半乳糖激酶(KIN,UniProt IDQ9SEE5)的基因、及编码来自阿拉伯芥的UDP-糖焦磷酸化酶(USP)(UniProt ID Q9C5I1)的基因。
在产生LNB的实施例中,修饰以产生UDP-半乳糖的莱茵衣藻细胞以表达质体进行修饰,该表达质体包括选自包括SEQ ID NO:03、04、05、06、07、08、10、11、12及13的列举的N-乙酰葡萄糖胺β-1,3-半乳糖基转移酶的转录单元。另外,突变莱茵衣藻细胞可以表达质体进行修饰,该表达质体包括例如来自幽门螺旋杆菌的HpFutC(GenBank No.AAD29863.1)的α-1,2-岩藻糖基转移酶及/或来自幽门螺旋杆菌的HpFucT(UniProt ID O30511)的α-1,3-岩藻糖基转移酶的转录单元。
在产生LacNAc的实施例中,修饰以产生UDP-半乳糖的莱茵衣藻细胞进一步以表达质体进行修饰,该表达质体包括选自包括SEQ ID NO:15、16、17、18、19、20、21、22、23、26、27、28、31、32、33、34、35、36、39、40及41的列举的N-乙酰葡萄糖胺β-1,4-半乳糖基转移酶的转录单元。另外,突变莱茵衣藻细胞可以表达质体进行修饰,该表达质体包括例如来自幽门螺旋杆菌的HpFutC(GenBank No.AAD29863.1)的α-1,2-岩藻糖基转移酶及/或来自幽门螺旋杆菌的HpFucT(UniProt ID O30511)的α-1,3-岩藻糖基转移酶的转录单元。
在CMP-唾液酸合成的实施例中,莱茵衣藻细胞以持续型转录单元进行修饰,该持续型转录单元针对例如来自智人的GNE(UniProt ID Q9Y223)的UDP-N-乙酰葡萄糖胺-2-表异构酶/N-乙酰甘露糖胺激酶或包括R263L突变的人类GNE多肽的突变形式、例如来自智人的NANS(UniProt ID Q9NR45)的N-酰基神经氨酸-9-磷酸合成酶及例如来自智人的CMAS(UniProt ID Q8NFW8)的N-酰基神经氨酸胞苷酰转移酶。在产生唾液酸化寡糖的实施例中,莱茵衣藻细胞以例如来自小鼠的CST(UniProt ID Q61420)的CMP唾液酸转运子、及选自例如智人、小鼠、褐鼠的物种的高基氏体定位的唾液酸转移酶(Golgi-localisedsialyltransferase)进行修饰。
异源及同源表达
需要表达的基因,无论是来自质体还是来自基因组,都是由以下公司之一以合成方法合成:DNA2.0、Gen9、Twist Biosciences或IDT。
通过针对表达宿主的密码子使用优化密码子的使用,可以进一步促进表达。利用供应商的工具对基因进行优化。
培养条件
莱茵衣藻细胞在23+/-0.5℃下,以8000Lx的光强度的14/10小时光照/黑暗循环下于选择性TAP琼脂盘中进行培养。培养5至7天后进行细胞分析。
对于高密度培养,细胞可以在封闭系统,例如如Chen等人(Bioresour.Technol.2011,102:71-81)和Johnson等人(Biotechnol.Prog.2018,34:811-827)所述的垂直或水平管光生物反应器、搅拌槽光生物反应器或平板光生物反应器(Bioresour.Technol.2011,102:71-81)中进行培养。
实施例41:于修饰的莱茵衣藻细胞中产生LNB及2’FLNB
如实施例40中所述,以持续型转录单元的基因敲入改造莱茵衣藻细胞以产生UDP-Gal,该持续型转录单元包括来自阿拉伯芥的半乳糖激酶(KIN,UniProt ID Q9SEE5)及来自阿拉伯芥的UDP-糖焦磷酸化酶(USP)(UniProt ID Q9C5I1)。在下一步骤中,以包括转录单元的表达质体将突变细胞进行转形,该转录单元包括选自包括SEQ ID NO:03、04、05、06、07、08、10、11、12及13的列举的N-乙酰葡萄糖胺β-1,3-半乳糖基转移酶及来自幽门螺旋杆菌的α-1,2-岩藻糖基转移酶HpFutC(GenBank No.AAD29863.1)。根据实施例40提供的培养条件,在包括半乳糖作为前驱物的TAP琼脂盘的培养实验中评估新颖菌株。培养5天后,收获细胞,并在UPLC分析LNB及2’FLNB的产生。
实施例42:于修饰的莱茵衣藻细胞中产生LacNAc及3’-岩藻糖基化LacNAc
如实施例40中所述,以持续型转录单元的基因敲入改造莱茵衣藻细胞以产生UDP-Gal,该持续型转录单元包括来自阿拉伯芥的半乳糖激酶(KIN,UniProt ID Q9SEE5)及来自阿拉伯芥的UDP-糖焦磷酸化酶(USP)(UniProt ID Q9C5I1)。在下一步骤中,以包括转录单元的表达质体将突变细胞进行转形,该转录单元包括选自包括SEQ ID NO:15、16、17、18、19、20、21、22、23、26、27、28、31、32、33、34、35、36、39、40及41的列举的N-乙酰葡萄糖胺β-1,4-半乳糖基转移酶及例如来自幽门螺旋杆菌的HpFucT(UniProt ID O30511)的α-1,3-岩藻糖基转移酶。根据实施例40提供的培养条件,在包括半乳糖作为前驱物的TAP琼脂盘的培养实验中评估新颖菌株。培养5天后,收获细胞,并在UPLC分析LacNAc及3’-岩藻糖基化LacNAc的产生。
实施例43:材料及方法动物细胞
从不同哺乳动物的脂肪组织中分离间质干细胞
新鲜脂肪组织获得自屠宰场(例如,牛、猪、羊、鸡、鸭、鲶鱼、蛇、青蛙)或抽脂(例如,在人类的情况下,在知情同意后)并保存在补充有抗生素的磷酸盐缓冲盐水中。对脂肪组织进行酶消化,然后离心以分离间质干细胞。将分离的间质干细胞转移到细胞培养瓶中并在标准生长条件下生长,例如37℃,5%CO2。初始培养基包括DMEM-F12、RPMI及Α-MEM培养基(补充有15%胎牛血清)和1%抗生素。在第一次继代后,随后将培养基替换为添加10%FBS(胎牛血清)的培养基。例如,出于所有目的通过参照整体而并入本文的Ahmad和Shakoori(2013,Stem Cell Regen.Med.9(2):29-36)描述此实施例中在此描述的方法的部分变化。
从乳汁分离间质干细胞
本实施例说明了从人类或如本文所述的任何其他哺乳动物在无菌条件下收集的乳汁中分离间质干细胞。将等体积的磷酸盐缓冲盐水加入稀释的乳汁中,然后离心20分钟。物用磷酸盐缓冲盐水洗涤细胞沉淀三次,并且在标准培养条件下,将细胞接种在细胞培养瓶的补充有10%胎牛血清及1%抗生素的DMEM-F12、RPMI及Α-MEM培养基中。例如,出于所有目的通过参照整体而并入本文的Hassiotou等人(2012,Stem Cells.30(10):2164-2174)描述此实施例中在此描述的方法的部分变化。
使用2D及3D培养系统分化干细胞
分离的间质细胞可以在2D及3D培养系统中分化为乳腺样上皮细胞和管状细胞(luminal cells)。例如,参照Huynh et al.1991.Exp Cell Res.197(2):191 -199;Gibsonet al.1991,In Vitro Cell Dev Biol Anim.27(7):585-594;Blatchford etal.1999;Animal Cell Technology’:Basic&Applied Aspects,Springer,Dordrecht.141-145;Williams et al.2009,Breast Cancer Res 11(3):26-43;以及Arevalo et al.2015,Am J Physiol Cell Physiol.310(5):C348-C356;其皆出于所有目的通过参照整体而并入本文。
针对2D培养,最初将分离的细胞接种在补充有10ng/ml上皮生长因子及5pg/ml胰岛素的生长培养基中的培养盘中。在汇合时,以补充有2%胎牛血清、1%青霉素-链霉素(100U/ml青霉素、100ug/ml链霉素)和5pg/ml胰岛素的生长培养基喂养细胞48小时。为了诱导分化,以含有5pg/ml胰岛素、1pg/ml氢化可的松、0.65ng/ml三碘甲状腺素、100nM地塞米松及1pg/ml泌乳素的完全生长培养基喂养细胞。24小时后,从完全诱导培养基中去除血清。
针对3D培养,将分离的细胞以胰蛋白酶消化并在基质胶(Matrigel)、透明质酸或超低附着表面培养盘中培养6天,并通过添加补充有10ng/ml上皮生长因子和5pg/ml胰岛素的生长培养基诱导分化和乳酸。在汇合时,以补充有2%胎牛血清、1%青霉素-链霉素(100U/ml青霉素、100ug/ml链霉素)及5pg/ml胰岛素的生长培养基喂养细胞48小时。为了诱导分化,以含有5pg/ml胰岛素、1pg/ml氢化可的松、0.65ng/ml三碘甲状腺素、100nM地塞米松和1pg/ml泌乳素的完全生长培养基喂养细胞。24小时后,从完全诱导培养基中除去血清。
制备乳腺样细胞的方法
通过编码Oct4、Sox2、Klf4及c-Myc的病毒载体的再编程,使哺乳动物细胞具有诱导多能性(pluripotency)。接着,将得到的再编程细胞在Mammocult培养基(可获得自StemCell Technologies)或乳腺细胞富集培养基(DMEM,3% FBS、雌激素、黄体酮、肝素、氢化可的松、胰岛素、EGF)中培养,使其类似乳腺,从中可诱导选择乳成分的表达。或者,使用重塑系统(如CRISPR/Cas9)进行表观遗传重塑(epigenetic remodelling),以持续性活化选择的感兴趣基因,如酪蛋白、α-乳清蛋白,以使其允许各自的蛋白质表达,及/或下调及/或剔除选择的内源基因,如例如WO21067641所述,其出于所有目的通过参照整体而并入本文。
培养
完全生长培养基包括高糖DMEM/F12、10% FBS、1% NEAA、1%pen/strep、1%ITS-X、1% F-Glu、10ng/ml EGF及5pg/m氢化可的松。完全泌乳培养基包括高糖DMEM/F12、1% NEAA、1%pen/strep、1% ITS-X、1%F-Glu、10ng/ml EGF、5pg/ml氢化可的松及1pg/ml泌乳素(在Hyunh 1991为5ug/ml)。将细胞以20,000cells/cm2的密度接种到胶原涂布的烧瓶上的完全生长培养基,并使其在完全生长培养基中黏附和扩增48小时,之后将培养基切换为完全泌乳培养基。接触泌乳培养基后,细胞开始分化并停止生长。在约一周内,细胞开始将例如乳脂、乳糖、酪蛋白和乳清等泌乳产物分泌到培养基中。可以通过超微过滤浓缩或稀释以获得所欲浓度的泌乳培养基。泌乳培养基的所欲盐平衡可以通过透析完成,例如,从培养基中移除不需要的代谢产物。使用的激素和其他生长因子可通过树脂纯化选择性地萃取,例如使用镍树脂以移除带His-标签的生长因子,以进一步降低乳酸产物中的污染物水平。
实施例44:评估非乳腺成体干细胞中2'FL、LNFP-I及2'FLNB的产生
如实施例43所述的分离的间质细胞及再编程为乳腺样细胞经CRISPR-CAS修饰以过度表达选自包含03、04、05、06、07、08、10、11、12及13的列举的密码子优化的N-乙酰葡萄糖胺β-1,3-半乳糖基转移酶、来自智人的GDP-岩藻糖合成酶GFUS(UniProt ID Q13630)、以及来自幽门螺旋杆菌的密码子优化的α-1,2-岩藻糖基转移酶(GenBank No.AAD29863.1)。细胞以20,000cells/cm2的密度接种至胶原涂布的烧瓶上的完全生长培养基,并使其在完全生长培养基中黏附和扩增48小时,之后将培养基切换为完全泌乳培养基约7天。在如实施例43所述的培养之后,细胞进行UPLC以分析2'FL、LNFP-I(乳-N-岩藻五糖I,Fuc-a1,2-Gal-b1,3-GlcNAc-b1,3-Gal-b1,4-Glc)及2'FLNB的产生。
实施例45:评估非乳腺成体干细胞中LacNAc、唾液酸化LacNAc及唾液酸-路易斯x (sialyl-Lewis x)的产生
如实施例43所述的分离的间质细胞及再编程为乳腺样细胞经CRISPR-CAS修饰以过度表达选自包含15、16、17、18、19、20、21、22、23、26、27、28、31、32、33、34、35、36、39、40及41的列举的N-乙酰葡萄糖胺β-1,4-半乳糖基转移酶、来自智人的GDP-岩藻糖合成酶GFUS(UniProt ID Q13630)、来自智人的半乳糖苷α-1,3-岩藻糖基转移酶FUT3(UniProt IDP21217)、来自小鼠的N-酰基神经氨酸胞苷酰转移酶(UniProt ID Q99KK2)及来自智人的CMP-N-乙酰神经氨酸-β-1,4-半乳糖苷α-2,3-唾液酸转移酶ST3GAL3(UniProt IDQ11203)。导入细胞的所有基因都针对宿主进行密码子优化。细胞以20,000cells/cm2的密度接种至胶原涂布的烧瓶上的完全生长培养基,并使其在完全生长培养基中黏附和扩增48小时,之后将培养基切换为完全泌乳培养基约7天。在如实施例43所述的培养之后,细胞进行UPLC以分析LacNAc、唾液酸化LacNAc及唾液酸-路易斯x的产生。
序列表
<110> 因比奥斯公司
<120> 在细胞中的含有GlcNAc的生物产品的产生
<130> 026-PCT
<160> 41
<170> PatentIn版本3.5
<210> 1
<211> 10
<212> PRT
<213> 人工序列
<220>
<223> 基序
<220>
<221> 变体
<222> (1)..(1)
<223> Xaa可为Ala、Gly、Pro或Ser
<220>
<221> 不确定的
<222> (2)..(3)
<223> Xaa可为任何天然存在的氨基酸
<220>
<221> NON_CONS
<222> (5)..(6)
<223> 第5位的Asn残基及第6位的Arg残基由12至17个介入氨基酸残基隔开
<220>
<221> 不确定的
<222> (7)..(7)
<223> Xaa可为任何天然存在的氨基酸
<220>
<221> 不确定的
<222> (9)..(9)
<223> Xaa可为任何天然存在的氨基酸
<400> 1
Xaa Xaa Xaa Leu Asn Arg Xaa Asp Xaa Asp
1 5 10
<210> 2
<211> 17
<212> PRT
<213> 人工序列
<220>
<223> 基序
<220>
<221> 不确定的
<222> (2)..(3)
<223> Xaa可为任何天然存在的氨基酸
<220>
<221> NON_CONS
<222> (5)..(6)
<223> 第5位的Asn残基及第6位的Arg残基由12至17个介入氨基酸残基隔开
<220>
<221> 不确定的
<222> (7)..(7)
<223> Xaa可为任何天然存在的氨基酸
<220>
<221> 不确定的
<222> (9)..(9)
<223> Xaa可为任何天然存在的氨基酸
<220>
<221> NON_CONS
<222> (10)..(11)
<223> 第10位的Asp残基及第11位的Xaa残基由100至115个介入氨基酸残基隔开
<220>
<221> 变体
<222> (11)..(11)
<223> Xaa可为Phe、Trp或Tyr
<220>
<221> 不确定的
<222> (12)..(13)
<223> Xaa可为任何天然存在的氨基酸
<220>
<221> 变体
<222> (14)..(14)
<223> Xaa可为His、Lys或Arg
<220>
<221> 不确定的
<222> (15)..(16)
<223> Xaa可为任何天然存在的氨基酸
<220>
<221> 变体
<222> (17)..(17)
<223> Xaa可为Asn、Gln、Ser或Thr
<400> 2
Pro Xaa Xaa Leu Asn Arg Xaa Asp Xaa Asp Xaa Xaa Xaa Xaa Xaa Xaa
1 5 10 15
Xaa
<210> 3
<211> 265
<212> PRT
<213> 大肠杆菌O55:H7
<400> 3
Met Ile Ile Asp Glu Ala Glu Ser Ala Glu Ser Thr His Pro Val Val
1 5 10 15
Ser Val Ile Leu Pro Val Asn Lys Lys Asn Pro Phe Leu Asp Glu Ala
20 25 30
Ile Asn Ser Ile Leu Ser Gln Thr Phe Ser Ser Phe Glu Ile Ile Ile
35 40 45
Val Ala Asn Cys Cys Thr Asp Asp Phe Tyr Asn Glu Leu Lys His Lys
50 55 60
Val Asn Asp Lys Ile Lys Leu Ile Arg Thr Asn Ile Ala Tyr Leu Pro
65 70 75 80
Tyr Ser Leu Asn Lys Ala Ile Asp Leu Ser Asn Gly Glu Phe Ile Ala
85 90 95
Arg Met Asp Ser Asp Asp Ile Ser His Pro Asp Arg Phe Thr Lys Gln
100 105 110
Val Asp Phe Leu Lys Asn Asn Pro Tyr Val Asp Val Val Gly Thr Asn
115 120 125
Ala Ile Phe Ile Asp Asp Lys Gly Arg Glu Ile Asn Lys Thr Lys Leu
130 135 140
Pro Glu Glu Asn Leu Asp Ile Val Lys Asn Leu Pro Tyr Lys Cys Cys
145 150 155 160
Ile Val His Pro Ser Val Met Phe Arg Lys Lys Val Ile Ala Ser Ile
165 170 175
Gly Gly Tyr Met Phe Ser Asn Tyr Ser Glu Asp Tyr Glu Leu Trp Asn
180 185 190
Arg Leu Ser Leu Ala Lys Ile Lys Phe Gln Asn Leu Pro Glu Tyr Leu
195 200 205
Phe Tyr Tyr Arg Leu His Glu Gly Gln Ser Thr Ala Lys Lys Asn Leu
210 215 220
Tyr Met Val Met Val Asn Asp Leu Val Ile Lys Met Lys Cys Phe Phe
225 230 235 240
Leu Thr Gly Asn Ile Asn Tyr Leu Phe Gly Gly Ile Arg Thr Ile Ala
245 250 255
Ser Phe Ile Tyr Cys Lys Tyr Ile Lys
260 265
<210> 4
<211> 275
<212> PRT
<213> 氧化亚铁假高炳根氏菌
<400> 4
Met Asp Lys Ile Lys Gln Gly Ser Ala Ser Leu Val Val Gly Asp Gln
1 5 10 15
Gln Glu Lys His Pro Val Val Ser Val Leu Leu Pro Val Asn Arg Val
20 25 30
Asp Arg Phe Phe Ile Pro Ala Val Glu Ser Ile Leu Thr Gln Thr Leu
35 40 45
Gln Asp Phe Glu Leu Ile Ile Ile Ala Asn Gly Cys Ser Thr Glu His
50 55 60
Leu Asn Lys Ile Arg Leu Thr Tyr Gly Asp His Asn Arg Val Arg Ile
65 70 75 80
Leu Asn Thr Glu Ile Lys Gly Leu Pro Phe Ala Leu Asn Leu Gly Val
85 90 95
His Asn Ala Arg Gly Leu Tyr Ile Ala Arg Met Asp Ala Asp Asp Ile
100 105 110
Ser Ile Pro Glu Arg Leu Glu Lys Gln Leu Asn Thr Leu Glu Gln Asn
115 120 125
Lys Lys Ile Gly Val Val Ser Ser Gly Val Asp Phe Ile Asp Glu Asn
130 135 140
Asp Gln Ala Ile Arg Glu Gly Lys Phe Pro Glu Leu Thr Asp Lys Asp
145 150 155 160
His Arg Arg Leu Leu Pro Leu Ile Cys Cys Ile Ala His Pro Thr Val
165 170 175
Met Val Arg Lys Glu Ile Ile Asn Lys Leu Gly Gly Tyr Ser Phe Gly
180 185 190
Ser Phe Ser Glu Asp Tyr Asp Leu Trp Leu Arg Ile Met Arg Glu Leu
195 200 205
Pro Glu Val Glu Phe Tyr Arg Ile Pro Glu Ser Leu Leu Lys Tyr Arg
210 215 220
Arg His Gly Asn Gln Ala Thr Ser Ser Lys Asn Ile Lys Lys Ile Arg
225 230 235 240
Ala Tyr Asn Ser Ala Leu Lys Ile Arg Glu Leu Phe Leu Ser Arg Lys
245 250 255
Leu Lys Phe Ile Ile Gly Ile Ile Leu Pro Ala Arg Met Val Thr Leu
260 265 270
Trp Arg Lys
275
<210> 5
<211> 264
<212> PRT
<213> 血清型肠道沙门杆菌萨拉姆亚种(Salmonella enterica subsp. salamaeserovar)
<400> 5
Met Leu Thr Glu Val Arg Pro Val Ser Thr Thr Lys Pro Leu Val Ser
1 5 10 15
Val Ile Leu Pro Val Asn Lys Phe Asn Pro Tyr Leu Asp Arg Ala Ile
20 25 30
His Ser Ile Leu Ser Gln Ser Tyr Pro Ser Ile Glu Leu Ile Ile Ile
35 40 45
Ala Asn Asn Cys Thr Asn Asp Phe Phe Asp Ala Leu Lys Lys Arg Glu
50 55 60
Cys Glu Thr Ile Lys Val Leu Arg Thr Asn Ile Ala Tyr Leu Pro Tyr
65 70 75 80
Cys Leu Asn Lys Gly Leu Asp Leu Cys Asn Gly Asp Phe Val Ala Arg
85 90 95
Met Asp Ser Asp Asp Ile Ser His Pro Glu Arg Ile Asp Arg Gln Val
100 105 110
Asp Phe Leu Ile Asn Asn Pro Asp Ile Asp Val Val Gly Thr Asn Ala
115 120 125
Val Tyr Ile Asp Glu Asp Asp Ile Glu Leu Glu Lys Ser Asn Leu Pro
130 135 140
Val Asn Asn Asn Ala Ile Arg Lys Met Leu Pro Tyr Lys Cys Cys Leu
145 150 155 160
Val His Pro Ser Val Met Phe Arg Lys Asn Val Val Ile Thr Ser Gly
165 170 175
Gly Tyr Met Phe Ala Asn Tyr Ser Glu Asp Tyr Glu Leu Trp Asn Arg
180 185 190
Leu Ala Val Glu Gly Arg Asn Phe Tyr Asn Leu Ser Glu Tyr Leu Leu
195 200 205
Tyr Tyr Arg Leu His Asn Asn Gln Ser Thr Ser Lys Asn Asn Leu Phe
210 215 220
Met Val Met Ala Asn Asp Val Ala Ile Lys Val Lys Tyr Phe Leu Leu
225 230 235 240
Thr Lys Lys Ile Ser Tyr Leu Leu Gly Ile Ile Arg Thr Val Phe Ser
245 250 255
Val Phe Tyr Cys Lys Tyr Ile Lys
260
<210> 6
<211> 274
<212> PRT
<213> 谷氨酸棒状杆菌
<400> 6
Met Thr Ser Ser Ala Pro Leu Ile Ser Val Val Ile Pro Thr Ile Ala
1 5 10 15
Tyr Asp Glu Tyr Cys Ser Gln Ser Ile Lys Ser Val Cys Glu Gln Asn
20 25 30
Tyr Glu Asn Trp Gln Ile Val Leu Val Leu Asp Gly Ala Pro Ile Lys
35 40 45
Asp Val Pro Gln Trp Val Lys Glu His Glu Arg Ile Lys Ile Val Glu
50 55 60
Gln Lys Ile Arg Gln Gly Thr Pro Thr Ser Leu Asn Asn Gly Ile Lys
65 70 75 80
Ala Ser Asp Gly Gln Leu Ile Ala Arg Leu Asp Ser Asp Asp Leu Ala
85 90 95
Ala Pro Ser Arg Leu Ser Lys Gln Glu Glu Phe Leu Arg Asn His Pro
100 105 110
Tyr Ile Ile Cys Val Ala Thr Lys Thr Lys His Ile Asn Glu His Gly
115 120 125
Lys Ile Phe Gly Gln Ser Ala Asp Leu Pro Thr Ser Gln Asp Ile Arg
130 135 140
Gln Ile Leu Leu Val Lys Asn Pro Ile Ile His Ser Ser Val Met Tyr
145 150 155 160
Arg Lys Gln Val Val Glu Gln Ile Gly Gly Tyr Ser Leu Glu Met Thr
165 170 175
Arg Ser Gln Asp Tyr Glu Leu Phe Leu Arg Leu Ser Lys Ile Gly Ala
180 185 190
Ile Gly Tyr Leu Asp Glu Ser Leu Ser Ser Tyr Arg Ile His Gly Gly
195 200 205
Gln His Ser Arg Lys Thr Ser Pro Phe Lys Lys Tyr Thr Trp Ile Ile
210 215 220
Leu Lys Arg Arg Met Glu Leu Ala Ser Phe Leu Lys Arg Ser Pro Val
225 230 235 240
Arg Gln Ile Phe Leu Asn Phe Ile Trp Tyr Gly Ala Gln Val Thr Arg
245 250 255
Tyr Leu Gly Leu Arg Lys Ala Gly Phe Met Thr Gly Tyr Thr Pro Asp
260 265 270
Arg Ile
<210> 7
<211> 260
<212> PRT
<213> 海洋发光杆菌(Photobacterium leiognathi)
<400> 7
Met Ile Lys Val Ser Val Leu Met Ala Leu Asn Lys Phe Asp Gln Tyr
1 5 10 15
Thr Lys Pro Ser Ile Asp Ser Ile Leu Thr Gln Asp Phe Ser Asn Phe
20 25 30
Glu Phe Ile Ile Val Ala Asn Asn Cys Thr Asp Glu Asp Phe Leu Ser
35 40 45
Ile Gln Lys Cys Cys Asn Asp Lys Arg Ile Arg Leu Phe Arg Asn Asn
50 55 60
Ile Pro Gln Leu Pro Tyr Ser Leu Asn Phe Ala Leu Asn Glu Ala Lys
65 70 75 80
Gly Glu Phe Ile Ala Arg Met Asp Ser Asp Asp Ile Ser Met Ser Asp
85 90 95
Arg Phe Ser Lys Gln Val Glu Tyr Leu Glu Arg Tyr Lys Asp Ile Asn
100 105 110
Val Leu Gly Thr Ser Tyr Tyr Thr Ile Asn Glu Asp Gly Ile Ile Thr
115 120 125
Ser Lys Val Lys Ala Thr Lys Thr Pro Glu Arg Ile Phe Ala Lys Leu
130 135 140
Pro Leu Gly Thr Gln Leu Cys His Pro Ser Val Met Met Arg Arg Asp
145 150 155 160
Tyr Ile Leu Arg Met Gly Gly Tyr Cys Tyr Gly Phe Phe Ala Glu Asp
165 170 175
Tyr Asp Leu Trp Leu Arg Val Ile Gln Asp Ser Pro Tyr Cys Ile Asp
180 185 190
Asn Ile Asp Asp Tyr Leu Leu Lys Tyr Arg Ile His Ala Ser Gln Ala
195 200 205
Thr Ser Lys Lys Asn Val Ile Lys Asn Lys Ser Tyr Asn Tyr Ala Leu
210 215 220
Leu Leu Met Asn Phe Ile Gln Thr Asn Arg Val Lys Phe Leu Leu Gly
225 230 235 240
Leu Ile Trp Ile Asn Pro Val Phe Val Gly Val Lys Asp Tyr Ile Lys
245 250 255
Asn Lys Phe Lys
260
<210> 8
<211> 258
<212> PRT
<213> 紫色杆菌(Chromobacterium violaceum)
<400> 8
Met Ile Lys Arg Pro Leu Val Ser Val Ile Leu Pro Val Asn Lys Asn
1 5 10 15
Asn Pro His Leu Glu Glu Ala Ile Gln Ser Ile Lys Asn Gln Thr Tyr
20 25 30
Lys Glu Leu Glu Leu Ile Ile Ile Ala Asn Asn Cys Glu Asp Asn Phe
35 40 45
Tyr Ser Leu Leu Leu Lys Tyr Gln Asp Gln Lys Thr Lys Ile Ile Arg
50 55 60
Thr Ser Ile Lys Tyr Leu Pro Phe Ser Leu Asn Leu Gly Val His Leu
65 70 75 80
Ser Gln Gly Glu Tyr Ile Ala Arg Met Asp Ser Asp Asp Ile Ser Val
85 90 95
Leu Asp Arg Ile Glu Lys Gln Val Lys Arg Phe Leu Asn Thr Pro Glu
100 105 110
Leu Ser Ile Leu Gly Ser Asn Val Glu Tyr Ile Asn Glu Ala Ser Glu
115 120 125
Ser Ile Gly Tyr Ser Asn Tyr Pro Leu Asn His Ser Ser Ile Val Asn
130 135 140
Ser Phe Pro Phe Arg Cys Asn Leu Ala His Pro Thr Ile Met Val Lys
145 150 155 160
Lys Glu Val Ile Thr Thr Leu Gly Gly Tyr Met Tyr Gly Ser Leu Ser
165 170 175
Glu Asp Tyr Asp Leu Trp Ile Arg Ala Ser Arg His Gly Asn Phe Lys
180 185 190
Phe Ser Asn Ile Asp Glu Pro Leu Leu Lys Tyr Arg Ile His Lys Gly
195 200 205
Gln Ala Thr Asn Lys Ser Asn Ala Tyr Asn Ile Phe Ala Phe Asp Ser
210 215 220
Ser Leu Lys Ile Arg Glu Phe Leu Leu Asn Gly Asn Val Gln Tyr Leu
225 230 235 240
Leu Gly Ala Ala Arg Gly Phe Phe Ala Phe Leu Tyr Val Arg Phe Ile
245 250 255
Lys Lys
<210> 9
<211> 22
<212> PRT
<213> 人工序列
<220>
<223> 基序
<220>
<221> NON_CONS
<222> (2)..(3)
<223> 第2位的Thr残基及第3位的Xaa残基由13至16个介入氨基酸残基隔开
<220>
<221> 变体
<222> (3)..(3)
<223> Xaa可为Phe或Tyr
<220>
<221> 不确定的
<222> (4)..(5)
<223> Xaa可为任何天然存在的氨基酸
<220>
<221> 不确定的
<222> (7)..(7)
<223> Xaa可为任何天然存在的氨基酸
<220>
<221> 不确定的
<222> (9)..(9)
<223> Xaa可为任何天然存在的氨基酸
<220>
<221> NON_CONS
<222> (10)..(11)
<223> 第10位的Asp残基及第11位的Xaa残基由35至70个介入氨基酸残基隔开
<220>
<221> 变体
<222> (11)..(11)
<223> Xaa可为Phe、His或Tyr
<220>
<221> 不确定的
<222> (12)..(13)
<223> Xaa可为任何天然存在的氨基酸
<220>
<221> 不确定的
<222> (15)..(15)
<223> Xaa可为任何天然存在的氨基酸,除了Ala、Gly或Ser
<220>
<221> NON_CONS
<222> (15)..(16)
<223> 第15位的Xaa残基及第16位的Xaa残基由20至45个介入氨基酸残基隔开
<220>
<221> 不确定的
<222> (16)..(16)
<223> Xaa可为任何天然存在的氨基酸,除了His、Phe、Trp或Tyr
<220>
<221> 变体
<222> (17)..(17)
<223> Xaa可为Glu或Asp
<220>
<221> 变体
<222> (19)..(19)
<223> Xaa可为Ile、Leu或Val
<220>
<221> 不确定的
<222> (20)..(21)
<223> Xaa可为任何天然存在的氨基酸
<220>
<221> 变体
<222> (22)..(22)
<223> Xaa可为Ala或Gly
<400> 9
Lys Thr Xaa Xaa Xaa Lys Xaa Asp Xaa Asp Xaa Xaa Xaa Gly Xaa Xaa
1 5 10 15
Xaa Asp Xaa Xaa Xaa Xaa
20
<210> 10
<211> 393
<212> PRT
<213> 阿拉伯芥(Arabidopsis thaliana)
<400> 10
Met Lys His Lys Val Ser Lys Arg Val Ile Ser Leu Lys Trp Val Pro
1 5 10 15
Phe Leu Cys Ile Ser Phe Phe Ala Leu Gly Ala Ile Phe Thr Ser Arg
20 25 30
Ser Trp Glu Pro Ser Ser Asp Ser Gly Ser Gln Leu Ile Ser Gln His
35 40 45
His Arg Asp His Glu Leu Gln Ile Val Ser Asp Asp Cys Ala His Asn
50 55 60
Lys Lys Ala Thr Gln Glu Lys Asp Val Thr Gly Glu Val Leu Arg Thr
65 70 75 80
His Glu Ala Ile Gln Asp Asp Arg Ser Leu Asp Lys Ser Val Ser Thr
85 90 95
Leu Ser Ser Thr Arg Ser Ser Gln Glu Met Val Asp Gly Ser Glu Thr
100 105 110
Asn Pro Arg Lys Lys Val Phe Met Val Met Gly Ile Asn Thr Ala Phe
115 120 125
Ser Ser Arg Lys Arg Arg Asp Ser Val Arg Glu Thr Trp Met Pro Gln
130 135 140
Gly Glu Lys Leu Glu Arg Leu Glu Gln Glu Lys Gly Ile Val Ile Lys
145 150 155 160
Phe Met Ile Gly His Ser Ala Thr Ser Asn Ser Ile Leu Asp Arg Ala
165 170 175
Ile Asp Ser Glu Asp Ala Gln His Lys Asp Phe Leu Arg Leu Glu His
180 185 190
Val Glu Gly Tyr His Glu Leu Ser Ala Lys Thr Lys Ile Phe Phe Ser
195 200 205
Thr Ala Val Ala Lys Trp Asp Ala Glu Phe Tyr Ile Lys Val Asp Asp
210 215 220
Asp Val His Val Asn Leu Gly Met Leu Ala Ser Thr Leu Ala Arg His
225 230 235 240
Arg Ser Lys Pro Arg Val Tyr Ile Gly Cys Met Lys Ser Gly Pro Val
245 250 255
Leu Ala Gln Asn Leu Leu Asn Cys Phe Arg Thr Val Lys Tyr His Glu
260 265 270
Pro Glu Tyr Trp Lys Phe Gly Glu Asp Gly Asn Lys Tyr Phe Arg His
275 280 285
Ala Thr Gly Gln Ile Tyr Ala Ile Ser Lys Asp Leu Ala Asn Tyr Ile
290 295 300
Ser Ile Asn Gln Pro Ile Leu His Lys Tyr Ala Asn Glu Asp Val Ser
305 310 315 320
Leu Gly Ser Trp Phe Ile Gly Leu Glu Val Glu His Ile Asp Asp Arg
325 330 335
Asn Phe Cys Cys Gly Thr Pro Pro Asp Cys Arg Trp Lys Ala Glu Ala
340 345 350
Gly Asp Val Cys Val Ala Ser Phe Glu Trp Ser Cys Ser Gly Ile Cys
355 360 365
Lys Ser Val Glu Arg Met Lys Ile Val His Glu Val Cys Ser Glu Gly
370 375 380
Glu Gly Ala Val Trp Asn Thr Leu Leu
385 390
<210> 11
<211> 377
<212> PRT
<213> 布氏锥虫(Trypanosoma brucei)
<400> 11
Met Val Ser Lys Gly Leu Gln Met Val Gly Ser Thr Arg Arg Lys Arg
1 5 10 15
Ile Val Leu Val Val Phe Leu Val Phe Ala Val Leu Phe Ile Ala Trp
20 25 30
Ile Asn Lys Gln Pro Lys Arg Lys Glu Leu Thr Phe Gln Gln Arg Arg
35 40 45
Gln Gln Met His Leu Thr Glu Val Asp Asn Asp Glu Tyr Leu Thr Leu
50 55 60
Val Pro Glu Lys Thr Ile Lys Ile Trp Glu Ser Ser Lys Tyr Leu Val
65 70 75 80
Ala Ala Gly Ile Pro Ser Ile Asp Asn Lys Glu Arg Phe Arg Arg Arg
85 90 95
Gly Leu Gln Arg Ser Thr Cys Trp Thr Tyr Gly Gly Val Ala Thr Arg
100 105 110
Arg Asn Asp Phe Ala Gly Asp Leu Ile Pro Leu Tyr Leu Leu Ser Pro
115 120 125
His Glu Arg Asn Asp Phe Ile Leu Ser Asp Ser Val Arg Ala Glu Ala
130 135 140
Gln Lys Asn His Asp Ile Ile Val Leu Pro Thr Phe Asp Val Pro Ser
145 150 155 160
Thr Asn Gly Lys Val Ile Gly Glu Leu Gln Ser Trp Gly Asn Glu Val
165 170 175
Glu Leu Val Met Ser Lys Lys Thr Tyr Leu Trp Leu Lys Phe Ala Ser
180 185 190
Asn Phe Phe Gly Thr Ala Thr Tyr Ile Met Lys Ala Asp Asp Asp Leu
195 200 205
Phe Ile Arg Val Pro Tyr Tyr Leu Ser Ser Leu Lys Leu Met Pro Lys
210 215 220
Tyr Arg Leu Tyr Met Gly Trp Tyr Gly Leu Thr Pro Glu Val Phe Val
225 230 235 240
Asp Arg Trp Val Pro Phe Ile Ala Gly Tyr Cys Val Thr Leu Ser Arg
245 250 255
Asp Val Ala Asp Gly Val Val Asn Tyr Ser Pro Leu Glu Arg Leu Val
260 265 270
Asn Thr Pro Tyr Ser Glu Ser Asn Ile Glu Asp Phe Arg Glu Met Ala
275 280 285
Met Phe Asn Glu Asp Val Met Val Ala Val Thr Leu Gly Glu Lys Val
290 295 300
Gly Tyr Ser Asp Leu Val Thr Ala Asp Ile Gly Arg Cys His Tyr Ile
305 310 315 320
Ser His Leu Arg Arg Arg Leu Ser Lys Val Val Thr Glu Lys Thr Met
325 330 335
Val Val His His Ile Lys Glu Lys Asp Tyr Gly Tyr Leu Met Lys Leu
340 345 350
Phe Pro Asn Asn Ser Glu Thr Pro Pro Pro Val Val Leu Gln Trp Lys
355 360 365
Asp Lys Asn Phe Ala Arg Gly Lys Cys
370 375
<210> 12
<211> 326
<212> PRT
<213> 小鼠
<400> 12
Met Ala Ser Lys Val Ser Cys Leu Tyr Val Leu Ser Val Val Cys Trp
1 5 10 15
Ala Ser Ala Leu Trp Tyr Leu Ser Ile Thr Arg Pro Thr Ser Ser Tyr
20 25 30
Thr Gly Ser Lys Pro Phe Ser His Leu Thr Val Ala Arg Lys Asn Phe
35 40 45
Thr Phe Gly Asn Ile Arg Thr Arg Pro Ile Asn Pro His Ser Phe Glu
50 55 60
Phe Leu Ile Asn Glu Pro Asn Lys Cys Glu Lys Asn Ile Pro Phe Leu
65 70 75 80
Val Ile Leu Ile Ser Thr Thr His Lys Glu Phe Asp Ala Arg Gln Ala
85 90 95
Ile Arg Glu Thr Trp Gly Asp Glu Asn Asn Phe Lys Gly Ile Lys Ile
100 105 110
Ala Thr Leu Phe Leu Leu Gly Lys Asn Ala Asp Pro Val Leu Asn Gln
115 120 125
Met Val Glu Gln Glu Ser Gln Ile Phe His Asp Ile Ile Val Glu Asp
130 135 140
Phe Ile Asp Ser Tyr His Asn Leu Thr Leu Lys Thr Leu Met Gly Met
145 150 155 160
Arg Trp Val Ala Thr Phe Cys Ser Lys Ala Lys Tyr Val Met Lys Thr
165 170 175
Asp Ser Asp Ile Phe Val Asn Met Asp Asn Leu Ile Tyr Lys Leu Leu
180 185 190
Lys Pro Ser Thr Lys Pro Arg Arg Arg Tyr Phe Thr Gly Tyr Val Ile
195 200 205
Asn Gly Gly Pro Ile Arg Asp Val Arg Ser Lys Trp Tyr Met Pro Arg
210 215 220
Asp Leu Tyr Pro Asp Ser Asn Tyr Pro Pro Phe Cys Ser Gly Thr Gly
225 230 235 240
Tyr Ile Phe Ser Ala Asp Val Ala Glu Leu Ile Tyr Lys Thr Ser Leu
245 250 255
His Thr Arg Leu Leu His Leu Glu Asp Val Tyr Val Gly Leu Cys Leu
260 265 270
Arg Lys Leu Gly Ile His Pro Phe Gln Asn Ser Gly Phe Asn His Trp
275 280 285
Lys Met Ala Tyr Ser Leu Cys Arg Tyr Arg Arg Val Ile Thr Val His
290 295 300
Gln Ile Ser Pro Glu Glu Met His Arg Ile Trp Asn Asp Met Ser Ser
305 310 315 320
Lys Lys His Leu Arg Cys
325
<210> 13
<211> 422
<212> PRT
<213> 智人
<400> 13
Met Leu Gln Trp Arg Arg Arg His Cys Cys Phe Ala Lys Met Thr Trp
1 5 10 15
Asn Ala Lys Arg Ser Leu Phe Arg Thr His Leu Ile Gly Val Leu Ser
20 25 30
Leu Val Phe Leu Phe Ala Met Phe Leu Phe Phe Asn His His Asp Trp
35 40 45
Leu Pro Gly Arg Ala Gly Phe Lys Glu Asn Pro Val Thr Tyr Thr Phe
50 55 60
Arg Gly Phe Arg Ser Thr Lys Ser Glu Thr Asn His Ser Ser Leu Arg
65 70 75 80
Asn Ile Trp Lys Glu Thr Val Pro Gln Thr Leu Arg Pro Gln Thr Ala
85 90 95
Thr Asn Ser Asn Asn Thr Asp Leu Ser Pro Gln Gly Val Thr Gly Leu
100 105 110
Glu Asn Thr Leu Ser Ala Asn Gly Ser Ile Tyr Asn Glu Lys Gly Thr
115 120 125
Gly His Pro Asn Ser Tyr His Phe Lys Tyr Ile Ile Asn Glu Pro Glu
130 135 140
Lys Cys Gln Glu Lys Ser Pro Phe Leu Ile Leu Leu Ile Ala Ala Glu
145 150 155 160
Pro Gly Gln Ile Glu Ala Arg Arg Ala Ile Arg Gln Thr Trp Gly Asn
165 170 175
Glu Ser Leu Ala Pro Gly Ile Gln Ile Thr Arg Ile Phe Leu Leu Gly
180 185 190
Leu Ser Ile Lys Leu Asn Gly Tyr Leu Gln Arg Ala Ile Leu Glu Glu
195 200 205
Ser Arg Gln Tyr His Asp Ile Ile Gln Gln Glu Tyr Leu Asp Thr Tyr
210 215 220
Tyr Asn Leu Thr Ile Lys Thr Leu Met Gly Met Asn Trp Val Ala Thr
225 230 235 240
Tyr Cys Pro His Ile Pro Tyr Val Met Lys Thr Asp Ser Asp Met Phe
245 250 255
Val Asn Thr Glu Tyr Leu Ile Asn Lys Leu Leu Lys Pro Asp Leu Pro
260 265 270
Pro Arg His Asn Tyr Phe Thr Gly Tyr Leu Met Arg Gly Tyr Ala Pro
275 280 285
Asn Arg Asn Lys Asp Ser Lys Trp Tyr Met Pro Pro Asp Leu Tyr Pro
290 295 300
Ser Glu Arg Tyr Pro Val Phe Cys Ser Gly Thr Gly Tyr Val Phe Ser
305 310 315 320
Gly Asp Leu Ala Glu Lys Ile Phe Lys Val Ser Leu Gly Ile Arg Arg
325 330 335
Leu His Leu Glu Asp Val Tyr Val Gly Ile Cys Leu Ala Lys Leu Arg
340 345 350
Ile Asp Pro Val Pro Pro Pro Asn Glu Phe Val Phe Asn His Trp Arg
355 360 365
Val Ser Tyr Ser Ser Cys Lys Tyr Ser His Leu Ile Thr Ser His Gln
370 375 380
Phe Gln Pro Ser Glu Leu Ile Lys Tyr Trp Asn His Leu Gln Gln Asn
385 390 395 400
Lys His Asn Ala Cys Ala Asn Ala Ala Lys Glu Lys Ala Gly Arg Tyr
405 410 415
Arg His Arg Lys Leu His
420
<210> 14
<211> 21
<212> PRT
<213> 人工序列
<220>
<223> 基序
<220>
<221> 不确定的
<222> (2)..(3)
<223> Xaa可为任何天然存在的氨基酸
<220>
<221> 不确定的
<222> (5)..(6)
<223> Xaa可为任何天然存在的氨基酸
<220>
<221> 不确定的
<222> (9)..(10)
<223> Xaa可为任何天然存在的氨基酸
<220>
<221> 变体
<222> (11)..(11)
<223> Xaa可为Ile、Leu或Val
<220>
<221> 变体
<222> (12)..(12)
<223> Xaa可为Phe、Trp或Tyr
<220>
<221> NON_CONS
<222> (12)..(13)
<223> 第12位的Xaa残基及第13位的Glu残基由13至15个介入氨基酸残基隔开
<220>
<221> NON_CONS
<222> (15)..(16)
<223> 第15位的Asp残基及第16位的Xaa残基由50至76个介入氨基酸残基隔开
<220>
<221> 变体
<222> (16)..(16)
<223> Xaa可为Ala、Cys、Gly、Ser或Thr
<220>
<221> 不确定的
<222> (17)..(18)
<223> Xaa可为任何天然存在的氨基酸
<220>
<221> 不确定的
<222> (20)..(20)
<223> Xaa可为任何天然存在的氨基酸
<220>
<221> 变体
<222> (21)..(21)
<223> Xaa可为Ile、Leu、Met或Val
<400> 14
Glu Xaa Xaa Cys Xaa Xaa Ser His Xaa Xaa Xaa Xaa Glu Asp Asp Xaa
1 5 10 15
Xaa Xaa Tyr Xaa Xaa
20
<210> 15
<211> 275
<212> PRT
<213> 脑膜炎双球菌MC58
<400> 15
Met Gln Asn His Val Ile Ser Leu Ala Ser Ala Ala Glu Arg Arg Ala
1 5 10 15
His Ile Ala Asp Thr Phe Gly Arg His Gly Ile Pro Phe Gln Phe Phe
20 25 30
Asp Ala Leu Met Pro Ser Glu Arg Leu Glu Gln Ala Met Ala Glu Leu
35 40 45
Val Pro Gly Leu Ser Ala His Pro Tyr Leu Ser Gly Val Glu Lys Ala
50 55 60
Cys Phe Met Ser His Ala Val Leu Trp Lys Gln Ala Leu Asp Glu Gly
65 70 75 80
Leu Pro Tyr Ile Thr Val Phe Glu Asp Asp Val Leu Leu Gly Glu Gly
85 90 95
Ala Glu Lys Phe Leu Ala Glu Asp Ala Trp Leu Gln Glu Arg Phe Asp
100 105 110
Pro Asp Thr Ala Phe Ile Val Arg Leu Glu Thr Met Phe Met His Val
115 120 125
Leu Thr Ser Pro Ser Gly Val Ala Asp Tyr Cys Gly Arg Ala Phe Pro
130 135 140
Leu Leu Glu Ser Glu His Trp Gly Thr Ala Gly Tyr Ile Ile Ser Arg
145 150 155 160
Lys Ala Met Arg Phe Phe Leu Asp Arg Phe Ala Ala Leu Pro Pro Glu
165 170 175
Gly Leu His Pro Val Asp Leu Met Met Phe Ser Asp Phe Phe Asp Arg
180 185 190
Glu Gly Met Pro Val Cys Gln Leu Asn Pro Ala Leu Cys Ala Gln Glu
195 200 205
Leu His Tyr Ala Lys Phe His Asp Gln Asn Ser Ala Leu Gly Ser Leu
210 215 220
Ile Glu His Asp Arg Leu Leu Asn Arg Lys Gln Gln Arg Arg Asp Ser
225 230 235 240
Pro Ala Asn Thr Phe Lys His Arg Leu Ile Arg Ala Leu Thr Lys Ile
245 250 255
Ser Arg Glu Arg Glu Lys Arg Arg Gln Arg Arg Glu Gln Phe Ile Val
260 265 270
Pro Phe Gln
275
<210> 16
<211> 275
<212> PRT
<213> 脑膜炎双球菌MC58
<400> 16
Met Gln Asn His Val Ile Ser Leu Ala Ser Ala Ala Glu Arg Arg Ala
1 5 10 15
His Ile Thr Asp Thr Phe Gly Val Arg Gly Ile Pro Phe Gln Phe Phe
20 25 30
Asp Ala Leu Met Pro Ser Glu Arg Leu Glu Gln Val Met Ala Glu Leu
35 40 45
Val Pro Gly Leu Ser Ala His Pro Tyr Leu Ser Gly Val Glu Lys Ala
50 55 60
Cys Phe Met Ser His Ala Val Leu Trp Lys Gln Ala Leu Asp Glu Gly
65 70 75 80
Leu Pro Tyr Ile Thr Val Phe Glu Asp Asp Val Leu Leu Gly Glu Gly
85 90 95
Ala Glu Lys Phe Leu Ala Glu Asp Ala Trp Leu Gln Glu Arg Phe Asp
100 105 110
Pro Asp Ser Ala Phe Ile Val Arg Leu Glu Thr Met Phe Met His Val
115 120 125
Leu Thr Ser Pro Ser Gly Val Ala Asp Tyr Gly Gly Arg Ala Phe Pro
130 135 140
Leu Leu Glu Ser Glu His Trp Gly Thr Ala Gly Tyr Ile Ile Ser Lys
145 150 155 160
Lys Ala Ile Arg Phe Phe Leu Asp Arg Phe Ala Ala Leu Pro Pro Glu
165 170 175
Gly Leu His Pro Val Asp Leu Met Met Phe Ser Asp Phe Phe Asp Arg
180 185 190
Glu Gly Val Pro Val Cys Gln Leu Asn Pro Ala Leu Cys Ala Gln Glu
195 200 205
Leu His Tyr Ala Lys Phe His Asp Gln Asn Ser Ala Leu Gly Ser Leu
210 215 220
Ile Glu His Asp Arg Leu Leu Asn Arg Lys Gln Gln Trp Arg Asp Ser
225 230 235 240
Pro Ala Asn Thr Phe Lys Arg Arg Leu Ile Arg Ala Leu Thr Lys Ile
245 250 255
Ser Arg Glu Arg Glu Lys Arg Arg Gln Arg Arg Glu Gln Phe Ile Val
260 265 270
Pro Phe Gln
275
<210> 17
<211> 273
<212> PRT
<213> 幽门螺旋杆菌
<400> 17
Met Arg Val Phe Ile Ile Ser Leu Asn Gln Lys Val Cys Asp Thr Phe
1 5 10 15
Gly Leu Val Phe Arg Asp Thr Thr Thr Leu Leu Asn Asn Ile Asn Ala
20 25 30
Thr His His Gln Ala Gln Ile Phe Asp Ala Ile Tyr Ser Lys Thr Phe
35 40 45
Glu Gly Gly Leu His Pro Leu Val Lys Lys His Leu His Pro Tyr Phe
50 55 60
Ile Thr Gln Asn Ile Lys Asp Met Gly Ile Thr Thr Asn Leu Ile Ser
65 70 75 80
Glu Val Ser Lys Phe Tyr Tyr Ala Leu Lys Tyr His Ala Lys Phe Met
85 90 95
Ser Leu Gly Glu Leu Gly Cys Tyr Ala Ser His Tyr Ser Leu Trp Glu
100 105 110
Lys Cys Ile Glu Leu Asn Glu Ala Ile Cys Ile Leu Glu Asp Asp Ile
115 120 125
Thr Leu Lys Glu Asp Phe Lys Glu Gly Leu Asp Phe Leu Glu Lys His
130 135 140
Ile Gln Glu Leu Gly Tyr Val Arg Leu Met His Leu Leu Tyr Asp Pro
145 150 155 160
Asn Val Lys Ser Glu Pro Leu Asn His Lys Asn His Glu Ile Gln Glu
165 170 175
Arg Val Gly Ile Ile Lys Ala Tyr Ser His Gly Val Gly Thr Gln Gly
180 185 190
Tyr Val Ile Thr Pro Lys Ile Ala Lys Val Phe Lys Lys His Ser Arg
195 200 205
Lys Trp Val Val Pro Val Asp Thr Ile Met Asp Ala Thr Phe Ile His
210 215 220
Gly Val Lys Asn Leu Val Leu Gln Pro Phe Val Ile Ala Asp Asp Glu
225 230 235 240
Gln Ile Ser Thr Ile Ala Arg Lys Glu Glu Pro Tyr Ser Pro Lys Ile
245 250 255
Ala Leu Met Arg Glu Leu His Phe Lys Tyr Leu Lys Tyr Trp Gln Phe
260 265 270
Val
<210> 18
<211> 273
<212> PRT
<213> 幽门螺旋杆菌
<400> 18
Met Arg Val Phe Ala Ile Ser Leu Asn Gln Lys Val Cys Asp Thr Phe
1 5 10 15
Gly Leu Val Phe Arg Asp Thr Thr Thr Leu Leu Asn Ser Ile Asn Ala
20 25 30
Thr His His Gln Ala Gln Ile Phe Asp Ala Ile Tyr Ser Lys Thr Phe
35 40 45
Glu Gly Gly Leu His Pro Leu Val Lys Lys His Leu His Pro Tyr Phe
50 55 60
Ile Thr Gln Asn Ile Lys Asp Met Gly Ile Thr Thr Asn Leu Ile Ser
65 70 75 80
Glu Val Ser Lys Phe Tyr Tyr Ala Leu Lys Tyr His Ala Lys Phe Met
85 90 95
Ser Leu Gly Glu Leu Gly Cys Tyr Ala Ser His Tyr Ser Leu Trp Glu
100 105 110
Lys Cys Ile Glu Leu Asn Glu Ala Ile Cys Ile Leu Glu Asp Asp Ile
115 120 125
Thr Leu Lys Glu Asp Phe Lys Glu Gly Leu Asp Phe Leu Glu Lys His
130 135 140
Ile Gln Glu Leu Gly Tyr Ile Arg Leu Met His Leu Leu Tyr Asp Ala
145 150 155 160
Ser Val Lys Ser Glu Pro Leu Ser His Lys Asn His Glu Ile Gln Glu
165 170 175
Arg Val Gly Ile Ile Lys Ala Tyr Ser Glu Gly Val Gly Thr Gln Gly
180 185 190
Tyr Val Ile Thr Pro Lys Ile Ala Lys Val Phe Leu Lys Cys Ser Arg
195 200 205
Lys Trp Val Val Pro Val Asp Thr Ile Met Asp Ala Thr Phe Ile His
210 215 220
Gly Val Lys Asn Leu Val Leu Gln Pro Phe Val Ile Ala Asp Asp Glu
225 230 235 240
Gln Ile Ser Thr Ile Ala Arg Lys Glu Glu Pro Tyr Ser Pro Lys Ile
245 250 255
Ala Leu Met Arg Glu Leu His Phe Lys Tyr Leu Lys Tyr Trp Gln Phe
260 265 270
Val
<210> 19
<211> 282
<212> PRT
<213> 嗜沫聚集杆菌(Aggregatibacter aphrophilus)
<400> 19
Met His Phe Ile Glu Asn Lys Asn Phe Val Ile Ser Ile Pro Thr Ala
1 5 10 15
Asp Lys Arg Arg Asn His Ile Ile Gln Gln Phe Gly Gln Lys Lys Ile
20 25 30
Pro Phe Glu Phe Phe Asp Ala Phe Thr Pro Ser Glu Arg Leu Asn Asp
35 40 45
His Leu Gln Arg Tyr Leu Pro Asn Val Ala Ala Thr Pro Arg Leu Thr
50 55 60
Met Gly Glu Lys Gly Cys Leu Met Ser His Phe Met Leu Trp Lys Lys
65 70 75 80
Cys Val Asp Asp Gly Leu Asp Tyr Ile Thr Leu Phe Glu Asp Asp Ile
85 90 95
Leu Leu Gly Glu Asn Ala Glu Gln Phe Leu Ala Glu Asp Glu Trp Leu
100 105 110
Lys Val Arg Phe Asn Phe Gln Glu Ile Phe Val Leu Arg Leu Glu Thr
115 120 125
Phe Leu Met Pro Val Lys Ile Glu Lys Gln Gln Gly Ile Leu Pro Phe
130 135 140
Gln Gln Arg Glu Ile Asp Ile Leu Lys Ser Lys His Phe Gly Thr Ala
145 150 155 160
Gly Tyr Val Ile Ser His Gly Ala Ala Lys Tyr Leu Ile Glu Val Phe
165 170 175
Glu Lys Phe Ser Ser Glu Glu Val Lys Pro Ile Asp Glu Ile Met Phe
180 185 190
Asn Gln Leu Ile Asp Ile Ser Gly Tyr Gln Val Tyr Gln Leu Asn Pro
195 200 205
Ala Ile Cys Val Gln Glu Leu Gln Leu Asn Gln Glu Asn Ser Val Leu
210 215 220
Glu Ser Gly Leu Gln Lys Glu Arg Lys Lys Asn Thr Val Ser His Thr
225 230 235 240
Lys Lys Thr Leu Lys Tyr Arg Leu Thr Arg Met Lys Glu Asn Ile Leu
245 250 255
Arg Ala Leu Asn Lys Lys Lys Trp Glu Glu Arg Gln Tyr Ile Lys Gly
260 265 270
Leu Gln Gly Lys Asn Ile Ile Leu Phe Ile
275 280
<210> 20
<211> 274
<212> PRT
<213> 幽门螺旋杆菌
<400> 20
Met Leu Arg Val Phe Ile Ile Ser Leu Asn Gln Lys Val Cys Asp Thr
1 5 10 15
Phe Gly Leu Val Phe Arg Asp Thr Thr Thr Leu Leu Asn Asn Ile Asn
20 25 30
Ala Thr His His Gln Ala Gln Ile Phe Asp Ala Ile Tyr Ser Lys Thr
35 40 45
Phe Glu Gly Gly Leu His Pro Leu Val Lys Lys His Leu His Pro Tyr
50 55 60
Phe Ile Thr Gln Asn Ile Lys Asp Met Gly Ile Thr Thr Asn Leu Ile
65 70 75 80
Ser Glu Val Ser Lys Phe Tyr Tyr Ala Leu Lys Tyr His Ala Lys Phe
85 90 95
Met Ser Leu Gly Glu Leu Gly Cys Tyr Ala Ser His Tyr Ser Leu Trp
100 105 110
Glu Lys Cys Ile Glu Leu Asn Glu Ala Ile Cys Ile Leu Glu Asp Asp
115 120 125
Ile Thr Leu Lys Glu Asp Phe Lys Glu Gly Leu Asp Phe Leu Glu Lys
130 135 140
His Ile Gln Glu Leu Gly Tyr Val Arg Leu Met His Leu Leu Tyr Asp
145 150 155 160
Pro Asn Val Lys Ser Glu Pro Leu Asn His Lys Asn His Glu Ile Gln
165 170 175
Glu Arg Val Gly Ile Ile Lys Ala Tyr Ser His Gly Val Gly Thr Gln
180 185 190
Gly Tyr Val Ile Thr Pro Lys Ile Ala Lys Val Phe Lys Lys His Ser
195 200 205
Arg Lys Trp Val Val Pro Val Asp Thr Ile Met Asp Ala Thr Phe Ile
210 215 220
His Gly Val Lys Asn Leu Val Leu Gln Pro Phe Val Ile Ala Asp Asp
225 230 235 240
Glu Gln Ile Ser Thr Ile Ala Arg Lys Glu Glu Pro Tyr Ser Pro Lys
245 250 255
Ile Ala Leu Met Arg Glu Leu His Phe Lys Tyr Leu Lys Tyr Trp Gln
260 265 270
Phe Val
<210> 21
<211> 280
<212> PRT
<213> 出血性巴氏杆菌
<400> 21
Met Ser Ser Ala Phe His Tyr Val Ile Ser Leu Ala Ser Ala Val Glu
1 5 10 15
Arg Arg Gln His Ile Ser Glu Gln Phe Ser Gln Tyr Asp Ile Pro Phe
20 25 30
Gln Phe Phe Asp Ala Ile Ser Pro Ser Pro Leu Leu Asn Gln Leu Val
35 40 45
Ser Gln Phe Phe Pro Ser Leu Ala Asp Ser Ser Leu Thr Asp Gly Glu
50 55 60
Lys Gly Cys Phe Ile Ser His Leu Ser Leu Trp His Lys Cys Val Glu
65 70 75 80
Lys Asn Leu Pro Tyr Ile Val Val Phe Glu Asp Asp Ile Leu Leu Gly
85 90 95
Lys Asn Ala Asp Lys Phe Leu Ile Glu Asp Glu Trp Phe Phe Ser Arg
100 105 110
Phe Asn Thr Asn Asp Val Phe Ile Val Arg Leu Glu Thr Phe Leu Gln
115 120 125
Lys Val Tyr Cys Gln Pro Ser Tyr Ile Lys Ser Tyr Tyr Asn Arg Glu
130 135 140
Leu Leu Thr Leu Lys Ser Thr His Phe Gly Thr Ala Gly Tyr Ile Ile
145 150 155 160
Ser Leu Gly Ala Ala Lys Phe Leu Leu Ser Leu Phe Asn Lys Met His
165 170 175
Ile Glu Glu Val Ala Pro Ile Asp Glu Leu Leu Phe Asn Lys Phe Leu
180 185 190
Glu Arg Lys Asp Phe Thr Val Tyr Gln Phe Ser Pro Ala Leu Cys Ile
195 200 205
Gln Glu Leu Gln Leu Asn Lys Ser Asp Ala Val Leu Leu Ser Gln Leu
210 215 220
Glu Leu Glu Arg Ser Lys Cys Arg Ile Met Thr Glu Ser Arg Ile Gly
225 230 235 240
Arg Glu Lys Lys Lys Leu Lys Asp Lys Ile Ile His Val Leu Thr Lys
245 250 255
Pro Lys Arg Met Leu Glu Lys Lys Arg Gln Arg Asn Glu Asp Lys Lys
260 265 270
Ile Thr Met Ile Ile Glu Phe Glu
275 280
<210> 22
<211> 257
<212> PRT
<213> 流感嗜血杆菌
<400> 22
Met Leu Lys Lys Tyr Leu Ile Ser Leu Asp Lys Asp Ile Gln Arg Arg
1 5 10 15
Lys Leu Phe Phe Ser Gln Lys Asn Thr Glu Asp Phe Gln Ile Phe Ser
20 25 30
Ala Ile Asn Thr Met Gln Lys Asp Trp Asp Glu Leu Ala Ser Ile Phe
35 40 45
Asn Ile Glu Gln Phe Lys Ala His Tyr Phe Arg Asn Val Thr Lys Gly
50 55 60
Glu Ile Gly Cys Thr Leu Ser His Leu Ser Val Tyr Gln Lys Ile Val
65 70 75 80
Glu Asp Asn Asp Ile Ala Glu Asp Ser Tyr Ala Leu Val Cys Glu Asp
85 90 95
Asp Ala Leu Phe His Leu Asp Phe Gln Gln Asn Leu Thr Ala Leu Leu
100 105 110
Ser Glu Lys Leu Glu Ala Glu Ile Ile Leu Leu Gly Gln Ser Asn Ile
115 120 125
Asn Asn Phe Asn Asp Thr Asp Leu Glu Ile Asn Tyr Pro Thr Thr Phe
130 135 140
Ser Phe Leu Cys Lys Lys Thr Gly Asn Val Asn Tyr Ala Phe Pro Tyr
145 150 155 160
Lys Ser Tyr Phe Ala Gly Thr Val Gly Tyr Leu Ile Lys Lys Ser Ala
165 170 175
Ala Arg Arg Phe Ile Gln Gln Ile Ser Gln Asn Lys Pro Phe Trp Leu
180 185 190
Ala Asp Asp Phe Leu Leu Phe Glu Gln Asn Phe Asn Ile Arg Asn Lys
195 200 205
Val Val Arg Pro Leu Met Val Ile Glu Asn Pro Val Leu Ile Ser Asn
210 215 220
Leu Glu Ser Val Arg Gly Ser Leu Ser Asn Asn Leu Leu Lys Lys Leu
225 230 235 240
Met Lys Tyr Pro Leu Lys Lys Ile Phe Ala Ile Lys Lys Asn Leu Ala
245 250 255
Asn
<210> 23
<211> 277
<212> PRT
<213> 去硝化金氏菌
<400> 23
Met Glu Asn Tyr Val Val Ser Ile Arg Thr Ala Ala Gln Arg Arg Gln
1 5 10 15
His Val Ala Ala Glu Phe Asn Lys His Gln Ile Ala Phe His Phe Phe
20 25 30
Asp Ala Val Thr Pro Glu Thr Leu Ala Glu Ser Ile Ala Glu His Cys
35 40 45
Pro Asn Leu Ala Asp Ala Phe Leu Thr Gly Gly Glu Lys Gly Cys Phe
50 55 60
Met Ser His Val Cys Leu Trp Ala Lys Cys Val Ala Asp Asp Leu Pro
65 70 75 80
Tyr Ile Gly Ile Phe Glu Asp Asp Val Ile Phe Gly Gln Asn Ser Ser
85 90 95
Arg Phe Leu Asn Asp Thr Lys Trp Leu Asp Glu Arg Phe Gln Asn Gln
100 105 110
Ser Phe Ile Ile Arg Met Glu Thr Phe Leu Lys Ala Asn Pro Val Ala
115 120 125
Leu Ser Lys Ser Gly Val Arg Pro Phe Asn Gly Arg Lys Ile Leu Arg
130 135 140
Leu Gln Ser Phe Gly Phe Gly Thr Ala Ala Tyr Leu Ile Ser Gln Gln
145 150 155 160
Thr Ala Ile Thr Leu Leu Asn Trp Ile Arg Glu Val Ala Pro Glu Lys
165 170 175
Leu Glu Pro Ile Asp Asn Met Leu Phe Asn Ala Ala Ser Glu Ile Pro
180 185 190
Glu Ile Gln Met Tyr Gln Ile Ser Pro Ala Leu Cys Ile Gln Glu Leu
195 200 205
Gln Leu Asn Arg Ala Asp Ser Ser Leu Ser Ser Thr Leu Glu Asp Gly
210 215 220
Arg Leu Ala Arg His Gln Gln Leu Asp Gly Gly Lys Thr Gln Pro Glu
225 230 235 240
Gln Thr Gln Glu Asn Arg Asn Ile Phe Ala Trp Ala Lys Asn Lys Ile
245 250 255
Val Lys Glu Tyr Lys Arg Val Lys Arg Arg Trp Thr Asp Asp Lys Lys
260 265 270
Ile Val Pro Phe Lys
275
<210> 24
<211> 26
<212> PRT
<213> 人工序列
<220>
<223> 基序
<220>
<221> 变体
<222> (2)..(2)
<223> Xaa可为Lys或Asn
<220>
<221> 不确定的
<222> (3)..(9)
<223> Xaa可为任何天然存在的氨基酸
<220>
<221> 不确定的
<222> (11)..(14)
<223> Xaa可为任何天然存在的氨基酸
<220>
<221> 变体
<222> (15)..(15)
<223> Xaa可为Phe或Leu
<220>
<221> 不确定的
<222> (16)..(16)
<223> Xaa可为任何天然存在的氨基酸
<220>
<221> 不确定的
<222> (18)..(18)
<223> Xaa可为任何天然存在的氨基酸
<220>
<221> NON_CONS
<222> (19)..(20)
<223> 第19位的Asp残基及第20位的Xaa残基由50至75个介入氨基酸残基隔开
<220>
<221> 变体
<222> (20)..(20)
<223> Xaa可为Phe、His或Trp
<220>
<221> 不确定的
<222> (21)..(23)
<223> Xaa可为任何天然存在的氨基酸
<220>
<221> 变体
<222> (24)..(24)
<223> Xaa可为Phe、His、Asn或Tyr
<220>
<221> NON_CONS
<222> (24)..(25)
<223> 第24位的Xaa残基及第25位的Glu残基由10至30个介入氨基酸残基隔开
<220>
<221> 变体
<222> (26)..(26)
<223> Xaa可为Asp或Glu
<400> 24
Arg Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Gly Xaa Xaa Xaa Xaa Xaa Xaa
1 5 10 15
Asp Xaa Asp Xaa Xaa Xaa Xaa Xaa Glu Xaa
20 25
<210> 25
<211> 33
<212> PRT
<213> 人工序列
<220>
<223> 基序
<220>
<221> 变体
<222> (2)..(2)
<223> Xaa可为Lys或Asn
<220>
<221> 不确定的
<222> (3)..(9)
<223> Xaa可为任何天然存在的氨基酸
<220>
<221> 不确定的
<222> (11)..(14)
<223> Xaa可为任何天然存在的氨基酸
<220>
<221> 不确定的
<222> (16)..(16)
<223> Xaa可为任何天然存在的氨基酸
<220>
<221> 不确定的
<222> (18)..(18)
<223> Xaa可为任何天然存在的氨基酸
<220>
<221> NON_CONS
<222> (19)..(20)
<223> 第19位的Asp残基及第20位的Xaa残基由50至75个介入氨基酸残基隔开
<220>
<221> 变体
<222> (20)..(20)
<223> Xaa可为Phe、His或Trp
<220>
<221> 不确定的
<222> (21)..(23)
<223> Xaa可为任何天然存在的氨基酸
<220>
<221> 变体
<222> (24)..(24)
<223> Xaa可为Tyr、His、Phe或Asn
<220>
<221> NON_CONS
<222> (24)..(25)
<223> 第24位的Xaa残基及第25位的Glu残基由10至30个介入氨基酸残基隔开
<220>
<221> 变体
<222> (26)..(26)
<223> Xaa可为Asp或Glu
<220>
<221> NON_CONS
<222> (26)..(27)
<223> 第26位的Xaa残基及第27位的Xaa残基由20至25个介入氨基酸残基隔开
<220>
<221> 变体
<222> (27)..(27)
<223> Xaa可为Phe、Trp或Tyr
<220>
<221> 不确定的
<222> (28)..(29)
<223> Xaa可为任何天然存在的氨基酸
<220>
<221> 变体
<222> (30)..(30)
<223> Xaa可为His、Lys或Arg
<220>
<221> 不确定的
<222> (31)..(32)
<223> Xaa可为任何天然存在的氨基酸
<220>
<221> 变体
<222> (33)..(33)
<223> Xaa可为Asn、Gln、Ser 或Thr
<400> 25
Arg Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Gly Xaa Xaa Xaa Xaa Phe Xaa
1 5 10 15
Asp Xaa Asp Xaa Xaa Xaa Xaa Xaa Glu Xaa Xaa Xaa Xaa Xaa Xaa Xaa
20 25 30
Xaa
<210> 26
<211> 318
<212> PRT
<213> 肺炎链球菌
<400> 26
Met Glu Asp Leu Val Ser Ile Val Val Pro Val Tyr Asn Val Glu Lys
1 5 10 15
Tyr Leu Lys Lys Ser Ile Glu Ser Ile Leu Asn Gln Thr Tyr Asp Asn
20 25 30
Leu Glu Val Leu Leu Val Asp Asp Gly Ser Thr Asp Ser Ser Gly Glu
35 40 45
Ile Cys Asp Ser Phe Ile Lys Val Asp Ser Arg Ile Arg Val Phe His
50 55 60
Lys Glu Asn Gly Gly Leu Ser Asp Ala Arg Asn Phe Gly Ile Glu His
65 70 75 80
Met Lys Gly Gln Tyr Val Ser Phe Ile Asp Gly Asp Asp Tyr Ile Ser
85 90 95
Lys Asp Tyr Val Trp Lys Leu Tyr His Ser Leu Lys Asn Asn Asn Ser
100 105 110
Glu Val Ser Ile Cys Ser Phe Ser Leu Val Asp Glu Thr Gly Glu Lys
115 120 125
Ile Lys Asp Glu Leu Leu Asp Ser Gly Glu Val Ser Leu Ser Gly Gln
130 135 140
Gln Ile Leu Glu Lys Ala Leu Thr Ala Asp Gly Tyr Arg Tyr Val Val
145 150 155 160
Ala Trp Asn Lys Leu Tyr Arg Ser Thr Leu Phe Glu Lys Leu Lys Phe
165 170 175
Lys Lys Gly Met Leu Tyr Glu Asp Glu Phe Leu Asn Tyr Pro Leu Phe
180 185 190
Trp Asp Cys Lys Arg Val Ser Ile Val Glu Glu Pro Leu Tyr Leu Tyr
195 200 205
Val Gln Arg Lys Gly Ser Ile Ile Gln Ser Asn Met Thr Leu Glu Lys
210 215 220
Ile Lys Met Lys Asp Lys Met His Thr Ser Arg Ile Glu Phe Tyr Ala
225 230 235 240
Glu Lys Lys Asn Ser Phe Leu His Gln Arg Ser Cys Gln Gln Tyr Cys
245 250 255
Asn Trp Ile Val Thr Ile Thr Val Ser His Tyr Asn Val Leu Asn Val
260 265 270
Ala Phe Leu Lys Tyr Leu Gln His Gln Phe Arg Arg Ile Val Lys Tyr
275 280 285
Thr Gln Asn Asp Asp Lys Lys Leu Ile Ile Gln Asn Ile Leu Gly Tyr
290 295 300
Ile Asn Ile Arg Leu Ala Ala Tyr Val Lys Ser Lys Val Met
305 310 315
<210> 27
<211> 315
<212> PRT
<213> 无乳链球菌
<400> 27
Met Ile Lys Lys Ile Glu Lys Asp Leu Ile Ser Val Ile Val Pro Ile
1 5 10 15
Tyr Asn Val Glu Asp Tyr Leu Val Glu Cys Ile Glu Ser Leu Ile Val
20 25 30
Gln Thr Tyr Arg Asn Ile Glu Ile Leu Leu Ile Asn Asp Gly Ser Thr
35 40 45
Asp Asn Cys Ala Thr Ile Ala Lys Glu Phe Ser Glu Arg Asp Cys Arg
50 55 60
Val Ile Tyr Ile Glu Lys Ser Asn Gly Gly Leu Ser Glu Ala Arg Asn
65 70 75 80
Tyr Gly Ile Tyr His Ser Lys Gly Lys Tyr Leu Thr Phe Val Asp Ser
85 90 95
Asp Asp Lys Val Ser Ser Asp Tyr Ile Ala Asn Leu Tyr Asn Ala Ile
100 105 110
Gln Lys His Asp Ser Ser Ile Ala Ile Gly Gly Tyr Leu Glu Phe Tyr
115 120 125
Glu Arg His Asn Ser Ile Arg Asn Tyr Glu Tyr Leu Asp Lys Val Ile
130 135 140
Pro Val Glu Glu Ala Leu Leu Asn Met Tyr Asp Ile Lys Thr Tyr Gly
145 150 155 160
Ser Ile Phe Ile Thr Ala Trp Gly Lys Leu Phe His Lys Ser Ile Phe
165 170 175
Asn Asp Leu Glu Phe Ala Leu Asn Lys Tyr His Glu Asp Glu Phe Phe
180 185 190
Asn Tyr Lys Ala Tyr Leu Lys Ala Asn Ser Ile Thr Tyr Ile Asp Lys
195 200 205
Pro Leu Tyr His Tyr Arg Ile Arg Val Gly Ser Ile Met Asn Asn Ser
210 215 220
Asp Asn Val Ile Ile Ala Arg Lys Lys Leu Asp Val Leu Ser Ala Leu
225 230 235 240
Asp Glu Arg Ile Lys Leu Ile Thr Ser Leu Arg Lys Tyr Ser Val Phe
245 250 255
Leu Gln Lys Thr Glu Ile Phe Tyr Val Asn Gln Tyr Phe Arg Thr Lys
260 265 270
Lys Phe Leu Lys Gln Gln Ser Val Met Phe Lys Glu Asp Asn Tyr Ile
275 280 285
Asp Ala Tyr Arg Met Tyr Gly Arg Leu Leu Arg Lys Val Lys Leu Val
290 295 300
Asp Lys Leu Lys Leu Ile Lys Asn Arg Phe Phe
305 310 315
<210> 28
<211> 283
<212> PRT
<213> 蜂房哈夫尼菌(Hafnia alvei)
<400> 28
Met Thr Ser Asn Pro Lys Phe Ser Leu Ile Leu Cys Thr Leu Gly Asn
1 5 10 15
Phe Thr Asp Ile Lys Asn Phe Ile Ser Ser Ile Ile His Tyr Asp Lys
20 25 30
Gly Phe Val Glu Leu Ile Val Val Asp Gln Asn Lys Thr Ser Ile Ser
35 40 45
His Phe Phe Asp Glu Ile Arg Tyr Val Gly Val Ile Val Lys Tyr Phe
50 55 60
His Val Asn Phe Thr Gly Leu Ser Arg Ala Arg Asn Phe Gly Leu Asn
65 70 75 80
Tyr Ala Asp Gly Asp Tyr Ile Ala Phe Pro Asp Asp Asp Cys Cys Tyr
85 90 95
Ser Lys Asp Leu Leu Lys Asn Val Ala Asn Tyr Phe Ser Asn Glu Ile
100 105 110
Asp Phe Leu Ser Val Asn Thr Ser Asp Glu Lys Asp Thr Thr Lys Ser
115 120 125
Leu Val Cys Leu Pro Gln Val Arg Gly Glu Ile Ser Tyr Lys Glu Arg
130 135 140
Lys Ser Val Ser Phe Thr Leu Phe Phe Thr Lys Arg Ala Ile Asn Leu
145 150 155 160
Ile Gly Leu Phe Asp Gln Asn Met Gly Val Gly Ala Gly Thr Lys Tyr
165 170 175
Gly Ala Gly Glu Glu Ser Asp Tyr Ile Val Arg Ala Leu His Leu Gly
180 185 190
Leu Lys Gly Val Tyr Phe Pro Asp Leu Tyr Val Phe His Pro Ala Lys
195 200 205
Glu Ser Thr Gly Phe Phe Asn Glu Glu Leu Lys Arg Arg Met Ile Ser
210 215 220
Tyr Gly Gly Gly Tyr Gly Tyr Phe Leu Arg Lys Asn Phe Phe Val Leu
225 230 235 240
Gly Tyr Ile Ile Ala Phe Lys Ala Val Ile Gly Val Phe Trp Arg Val
245 250 255
Ile Lys Asn Ile Pro Ser Gln Phe Lys Leu Lys Met Ala Val Tyr Phe
260 265 270
Leu Cys Gly Phe Val Asn Gly Phe Leu Lys Arg
275 280
<210> 29
<211> 10
<212> PRT
<213> 人工序列
<220>
<223> 基序
<220>
<221> 变体
<222> (1)..(1)
<223> Xaa可为Phe、Trp或Tyr
<220>
<221> 不确定的
<222> (2)..(3)
<223> Xaa可为任何天然存在的氨基酸
<220>
<221> 变体
<222> (4)..(4)
<223> Xaa可为Phe或Tyr
<220>
<221> 变体
<222> (5)..(5)
<223> Xaa可为Phe、Trp或Tyr
<220>
<221> NON_CONS
<222> (5)..(6)
<223> 第5位的Xaa残基及第6位的Xaa残基由23个介入氨基酸残基隔开
<220>
<221> 变体
<222> (6)..(6)
<223> Xaa可为Phe、Trp或Tyr
<220>
<221> 变体
<222> (7)..(7)
<223> Xaa可为Gly或Gln
<220>
<221> 不确定的
<222> (8)..(8)
<223> Xaa可为任何天然存在的氨基酸
<220>
<221> 变体
<222> (9)..(9)
<223> Xaa可为Asp或Glu
<400> 29
Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Asp
1 5 10
<210> 30
<211> 8
<212> PRT
<213> 人工序列
<220>
<223> 基序
<220>
<221> 变体
<222> (1)..(1)
<223> Xaa可为Pro或Val
<220>
<221> 变体
<222> (3)..(3)
<223> Xaa可为Gly、His、Asn或Pro
<220>
<221> NON_CONS
<222> (3)..(4)
<223> 第3位的Xaa残基及第4位的Xaa残基由21至24个介入氨基酸残基隔开
<220>
<221> 变体
<222> (4)..(4)
<223> Xaa可为Phe、Trp或Tyr
<220>
<221> 变体
<222> (5)..(5)
<223> Xaa可为Gly或Gln
<220>
<221> 不确定的
<222> (6)..(6)
<223> Xaa可为任何天然存在的氨基酸
<220>
<221> 变体
<222> (7)..(7)
<223> Xaa可为Asp或Glu
<400> 30
Xaa Trp Xaa Xaa Xaa Xaa Xaa Asp
1 5
<210> 31
<211> 297
<212> PRT
<213> 去硝化类固醇杆菌
<400> 31
Met Pro Gln Ser Thr Leu Ser Ala Ala Gln Arg Trp Phe Asn Arg Leu
1 5 10 15
Trp Pro Ser Thr Arg Leu Gly His Asp Pro Leu Gly Asp Trp Cys Val
20 25 30
Gln Gly Arg Tyr Val Pro Val Ser Ile Ala Asn Trp Lys Leu Thr Phe
35 40 45
Met Met Arg Arg Arg Val Leu Glu Cys Arg Val Ala Gln Pro Leu Ser
50 55 60
Phe Thr Ser Thr Gln Arg Leu Thr Ile Val Ile Pro Phe Arg Asp Arg
65 70 75 80
Glu Thr His Leu Arg Gln Leu Leu Pro Ile Leu Val Pro Met Leu Arg
85 90 95
Glu Gln Gly Ile Arg Tyr Arg Ile Val Val Val Glu Gln Glu Arg Gly
100 105 110
Gln Leu Phe Asn Arg Gly Arg Leu Ile Asn Ala Gly Ile Arg Phe Thr
115 120 125
Ala Glu Ala Thr Asp Tyr Tyr Cys Leu His Asp Val Asp Ala Leu Pro
130 135 140
Leu Val Ala Asn Tyr Ala Cys Pro Ser Gln Pro Leu Arg Leu Val Arg
145 150 155 160
Trp Ile Ala Asp His Arg Ala Asp Pro Pro Ala Asp Ala Gln Arg Ser
165 170 175
Gln His Tyr Phe Ser Gly Ala Val Ser Ile Arg Lys Asp Gln Val Phe
180 185 190
Ala Ala Asn Gly Tyr Ser Asn Asp Tyr Trp Gly Trp Gly Gly Glu Asp
195 200 205
Asp Asp Phe Phe Phe Arg Leu Leu Leu Gln Gly Met Leu Cys Tyr Tyr
210 215 220
Asp Thr Gln Gly Arg Phe Leu Asp Leu Pro Asn Pro Ala His Gln Gln
225 230 235 240
Val Arg Arg Asp Ala Arg Thr Val Pro Ser His Trp Lys His Asn Arg
245 250 255
Arg Arg Arg Ser Arg Leu Val Arg Gly Leu Leu Asp Pro Ala Gln Asp
260 265 270
Gly Leu Ser Thr Leu Arg Tyr Glu Val Ile Asp His Arg Gly His Gly
275 280 285
Asp His Glu Arg Leu Arg Val Arg Trp
290 295
<210> 32
<211> 221
<212> PRT
<213> 副衣原体科菌HS-T3
<400> 32
Met Glu Leu Glu Ser Ser Ile Lys Arg Leu Gly Ile Ile Val Pro Tyr
1 5 10 15
Arg Asn Arg Glu Glu His Leu Lys Gln Phe Ile Pro Tyr Met Lys Asn
20 25 30
Phe Leu Lys Asp Val Pro Tyr His Ile Tyr Val Ile Glu Gln Thr Asp
35 40 45
Glu Lys Pro Phe Asn Arg Gly Ser Leu Leu Asn Ile Gly Phe Leu Leu
50 55 60
Ala Lys Glu Lys Cys Asp Tyr Val Cys Phe His Asp Val Asp Met Leu
65 70 75 80
Pro Val Ser Ala Asp Tyr Ser Tyr Cys Thr Val Pro Thr His Leu Ala
85 90 95
Thr His Val Glu Gln Phe Asp Tyr Gln Met Pro Tyr Pro Gln Tyr Phe
100 105 110
Gly Gly Val Thr Leu Phe Asn Arg His Asp Phe Ala Leu Ile Asn Gly
115 120 125
Tyr His Asn Gly Tyr Phe Gly Trp Gly Leu Glu Asp Asp Asp Leu Arg
130 135 140
Val Arg Cys Phe Met His Gly Leu Thr Ile Glu Ser Arg Ala Gly Thr
145 150 155 160
Phe Leu Ser Leu Ser His Pro His Ala Glu Glu Ala Asn Pro Asp Thr
165 170 175
Gln Arg Asn Arg Gln Leu Phe Glu Arg Phe Tyr Arg Gly Asp Ile Thr
180 185 190
Leu Leu Ala Asp Gly Leu Asp Ser Leu His Phe Thr Ile Leu His Glu
195 200 205
Ser His Leu Gln Asp Val Ser Gln Ile Leu Val Glu Phe
210 215 220
<210> 33
<211> 307
<212> PRT
<213> 柯克斯氏体属(Coxiella sp.)DG_40
<400> 33
Met Ile Lys Asn Phe Ile Lys Ser Ile Met Pro Ser Ser Arg Cys Ser
1 5 10 15
Ile Asp Pro Leu Arg Val Thr Met His Asp Gly Asn Lys Cys Leu Tyr
20 25 30
Gln Pro Ile Pro Ile Asn Asp Ile Lys Leu Thr His Trp Val Arg Tyr
35 40 45
Lys Ile Asn Lys Ala Arg Phe Leu Ser Ala Ser Val Asp Thr Pro Ile
50 55 60
Tyr Asp Lys Lys Leu Ala Val Ile Val Thr Tyr Arg Asn Arg Glu Gln
65 70 75 80
His Leu Gln Lys Phe Pro Asp Tyr Leu Lys Asn Phe Leu Leu Lys Gln
85 90 95
Gly Ile Asp Asn Lys Ile Leu Ile Val Glu Gln Tyr Asp Asn Glu Pro
100 105 110
Phe Asn Arg Gly Lys Leu Phe Asn Val Gly Ala Met Gln Met Phe Asp
115 120 125
Glu Cys Asp Tyr Phe Cys Phe His Asp Ile Asp Met Leu Pro Glu Val
130 135 140
Ala Ser Tyr Ala Tyr Val Asn His Pro Val Leu Leu Ala Asn Ser Ala
145 150 155 160
Ser Gln Phe Asp Asp Asp Asn Thr Ala Gln Pro Thr Val Trp Cys Arg
165 170 175
His Ser Ser Tyr Phe Ser Gly Val Ile Leu Phe Pro Lys Thr Asp Phe
180 185 190
Ile Lys Ile Asn Gly Phe Ser Asn Asn Tyr Trp His Trp Gly Phe Glu
195 200 205
Asp Asp Asp Leu Leu Met Arg Cys Leu Phe Cys Gly Leu Thr Pro Ile
210 215 220
Ala Tyr Ile Lys Gly Cys Tyr Ile Ser Leu Pro His Glu Arg Thr Ile
225 230 235 240
Thr Gln Thr Pro Asp Gly Ile Tyr His Arg Asp Gln Glu Thr Ile Ala
245 250 255
Lys Leu Asn Glu Tyr Tyr Gln Arg Asn Arg Lys Arg Tyr Lys Lys Met
260 265 270
Arg Arg Gly Met Leu Asp Ile Asn Gln Asp Gly Ile Asn Asn Leu Asn
275 280 285
Tyr Lys Phe Ile Lys Lys Asp Asn Tyr Glu Leu Tyr Thr Lys Ile Ser
290 295 300
Val Cys Leu
305
<210> 34
<211> 520
<212> PRT
<213> 脆弱拟杆菌(Bacteroides fragilis)
<400> 34
Met Asn Val Asn Lys Pro Thr Thr Glu Lys Lys Leu Ile Asp Leu Asn
1 5 10 15
Asn Asp Ile Ile His Asn Phe Asp Val Ser Ile Val Met Ser Phe Tyr
20 25 30
Lys Arg Tyr Thr Glu Phe Arg Lys Val Leu Pro His Asn Ala Pro Tyr
35 40 45
Leu Gln Arg Asn Gly Ile Glu Val Ile Ile Val Leu Asp Asp Pro Asp
50 55 60
Glu Lys Ser Glu Leu Leu Met Leu Leu Gln Asn Tyr Pro Phe Ile Asn
65 70 75 80
Trp Lys Leu Ile Ile Asn Glu Arg Lys His Ala Pro Arg Asn His Ala
85 90 95
Ser Val Leu Asn Val Gly Leu Lys His Ala Thr Lys Lys Tyr Ile Leu
100 105 110
Gln Ile Asp Pro Glu Val Glu Phe Leu Thr Asp Ile Ile Trp Gln Met
115 120 125
Arg Asp Ala Ile Glu Lys Tyr Pro Met His Tyr Ile Leu Ala Met Met
130 135 140
Ala Tyr Val Pro Tyr Glu Gln Glu Leu Thr Glu Asn Asn Ile Lys Glu
145 150 155 160
Leu Asp Phe Ile Pro Trp Gly Asn Leu Met Val Glu Arg Asn His Leu
165 170 175
Tyr Lys Leu His Gly Tyr Asp Glu Thr Phe Ile Thr Trp Gly Gly Glu
180 185 190
Asp Asn Asn Met Arg Ala Arg Leu Asp Met Ser Gly Ile Lys Lys Phe
195 200 205
Ile Leu Pro Glu Ala Lys Thr Ile His Arg Glu Lys Asn Tyr Asp Pro
210 215 220
Asn Glu Arg Ser Lys Arg Ile Asn Lys His Ser Ile Ser Asp Trp Arg
225 230 235 240
Lys Met Asn Tyr Pro Ser Glu Ala Ile Ala Asn Lys Asp Ile Trp Gly
245 250 255
Ser Glu Phe Asn Lys Val Ile Tyr Asp Trp Gln Asp Asn Gln Tyr Ala
260 265 270
Lys Asp Leu Cys Tyr Thr Tyr Leu Gln Gln Phe Ile Gly Phe Glu Ile
275 280 285
Arg His Pro Ala Ala Phe Arg Lys Arg His Lys Lys Ile Val Leu Cys
290 295 300
Gln Ala Tyr Asn Glu Glu Lys Leu Ile Glu Gly Phe Leu Thr Asn Met
305 310 315 320
Ala Asn Tyr Phe Asp Gly Ile Ile Leu Leu Asp Asp Glu Ser Thr Asp
325 330 335
Arg Thr Trp Asp Leu Ala Ile His Asp Lys Ile Ile Leu Lys Val Lys
340 345 350
Lys Lys Arg Ser Gly Phe Asn Asp Leu Glu Asn Arg Asn Ile Leu Leu
355 360 365
Asp Leu Ser Ala Phe Phe Gln Ser Glu Trp Phe Cys Phe Met Asp Ile
370 375 380
Asp Glu Arg Phe Asp Glu Arg Phe Thr Asn Phe Ser Glu Phe Glu Asn
385 390 395 400
Asn Lys Glu Ile His Val Val Ser Phe Arg Gly Val Tyr Leu Trp Asn
405 410 415
Asp Glu Gln Ser Tyr Lys Gly Asp Ile Pro Asn Ser Asn Lys Gly Ile
420 425 430
Leu Thr Val Tyr Arg Met Phe Arg Pro Ile Gly His Thr His Ile Asn
435 440 445
Thr His Lys Lys Leu His Phe Ile Ala Thr Pro Tyr Phe Thr Asn Thr
450 455 460
Trp Gln Ser Asn Ile Leu Phe Lys Asp Tyr Gly Ser Met Lys Glu Asn
465 470 475 480
Asp Arg Ile Arg Lys Tyr Glu Arg Tyr Ile Gln Glu Asp Gln Gln Lys
485 490 495
Asp Met Ser Ser Gly Tyr Asp Tyr Leu Leu Asn Ser Glu Asn Leu Tyr
500 505 510
Gln Leu Asp Lys Ile Glu Glu Tyr
515 520
<210> 35
<211> 254
<212> PRT
<213> 珊瑚球菌属(Corallococcus exercitus)
<400> 35
Met Gln Val Asn Glu Ile Gln Leu Ser Val Val Met Pro Tyr Tyr Lys
1 5 10 15
Arg Leu Arg Glu Phe Gln Arg Val Leu Pro Leu Asn Ala Arg Tyr Phe
20 25 30
Ser Arg Pro Glu Tyr Glu Val Val Leu Ser Leu Asp Glu Pro Ser Glu
35 40 45
Glu Thr Glu Leu Leu Arg Val Leu Arg Asp Phe Pro Ser Ile Arg Trp
50 55 60
Arg Val Leu Val Asn Asp Phe Asp His Pro Trp Arg Pro Pro Cys Arg
65 70 75 80
Ala Ile Asn Val Gly Val Arg His Ala Leu Gly Glu Asn Val Leu Val
85 90 95
Val Ser Pro Glu Ser Ala Phe Ile Thr Asp Val Pro Ala Leu Gly Leu
100 105 110
Gly His Ile Ala Ala Asn Pro Gly Thr Ala Ala Leu Gly Arg Val Cys
115 120 125
Phe Gly Thr Phe Asp Ser Leu Glu Ala His Gly Gly Ser Leu Glu Lys
130 135 140
Thr Ser Ala Pro Pro Trp His His Tyr Gly Ser Ile Cys Val Pro Arg
145 150 155 160
Glu Arg Leu Val Arg Ile His Gly Tyr Asp Glu Gly Phe Asp Arg Trp
165 170 175
Gly Gly Asp Asp Asp Asn Leu Arg Ile Arg Leu Met Gln Thr Glu Thr
180 185 190
Tyr Gln His Pro Leu Asp Asp Met Arg Ile Leu His Leu Ser Phe Glu
195 200 205
Ala Arg Lys Val Arg Gln Ala Ala Glu Pro Pro Thr Pro Glu Tyr Ala
210 215 220
Gln Arg Ile Phe Asn Pro Ala Ser Pro Gln Ala Asn Pro Asp Gly Trp
225 230 235 240
Gly Glu Ser Phe Gln Arg Val Ala Phe Asp Trp Arg Arg Gln
245 250
<210> 36
<211> 248
<212> PRT
<213> 黏附金丝桃菌(Hypericibacter adhaerens)
<400> 36
Met Thr Ala Ser Arg Leu Ser Ile Ile Val Pro Tyr Arg Asp Arg Pro
1 5 10 15
Asp Ser Leu Ala Arg Phe Leu Gln His Val Thr Phe Tyr Phe Gln Arg
20 25 30
Asp Lys Val Asp Arg Thr Leu Pro Tyr Arg Ile Thr Val Val Glu Gln
35 40 45
Glu Ala Gly Arg Pro Phe Asn Val Gly Ala Met Arg Asn Ile Gly Phe
50 55 60
Leu Leu Asn Glu Gly Ser Ala Glu Gln Val Cys Phe His Asp Val Asp
65 70 75 80
Tyr Leu Pro Ile Trp Ala Asp Tyr Gln Pro Val Asp Arg Pro Thr Arg
85 90 95
Leu Leu Trp His Gly Ala Glu Ala Val Pro Ile Asp Asp Thr Glu Lys
100 105 110
Arg Phe Ile Asn His Asp Tyr Glu Lys Tyr Phe Gly Gly Val Val Met
115 120 125
Phe Pro Thr Ala Leu Phe Arg Arg Val Asn Gly Tyr Ser Asn Gly Tyr
130 135 140
Trp Gly Trp Gly Tyr Glu Asp Leu Asp Leu Arg Ala Arg Cys Val Ala
145 150 155 160
Glu Gly Leu Glu Ile Gly Tyr Arg Asp Gly Thr Phe Gly Pro Ile Arg
165 170 175
His Val Ser Arg Gly Tyr Gln Pro Asp Gly Gly Arg Ser Glu Ala Asn
180 185 190
Leu Val Asn Arg Lys Leu Tyr Gln Ala Asn Tyr Ala Ala Met Gln Thr
195 200 205
Ser Gln Ala His Arg Gln Asp Gly Leu Asn Asp Leu Arg Phe Glu Val
210 215 220
Leu Glu Arg Gly Pro Ile Pro Asp Gly Lys Gly Glu Pro Ile Pro His
225 230 235 240
Ala Glu Arg Val Leu Val Arg Ile
245
<210> 37
<211> 16
<212> PRT
<213> 人工序列
<220>
<223> 基序
<220>
<221> 变体
<222> (1)..(1)
<223> Xaa可为Ser或Thr
<220>
<221> 变体
<222> (2)..(2)
<223> Xaa可为Phe、Tyr或His
<220>
<221> 不确定的
<222> (3)..(3)
<223> Xaa可为任何天然存在的氨基酸
<220>
<221> NON_CONS
<222> (4)..(5)
<223> 第4位的Asn残基及第5位的Asp残基由20至25个介入氨基酸残基隔开
<220>
<221> NON_CONS
<222> (6)..(7)
<223> 第6位的Gly残基及第7位的Xaa残基由16个介入氨基酸残基隔开
<220>
<221> 变体
<222> (8)..(8)
<223> Xaa可为Arg、Lys或His
<220>
<221> 不确定的
<222> (9)..(9)
<223> Xaa可为任何天然存在的氨基酸
<220>
<221> 变体
<222> (10)..(10)
<223> Xaa可为Ser或Thr
<220>
<221> misc_feature
<222> (12)..(12)
<223> Xaa可为任何天然存在的氨基酸
<220>
<221> 不确定的
<222> (13)..(14)
<223> Xaa可为任何天然存在的氨基酸
<220>
<221> 变体
<222> (15)..(15)
<223> Xaa可为Ser或Thr
<220>
<221> 不确定的
<222> (16)..(16)
<223> Xaa可为任何天然存在的氨基酸
<400> 37
Xaa Xaa Xaa Asn Asp Gly Xaa Xaa Xaa Phe Asp Xaa Xaa Xaa Xaa Ala
1 5 10 15
<210> 38
<211> 28
<212> PRT
<213> 人工序列
<220>
<223> 基序
<220>
<221> 变体
<222> (1)..(1)
<223> Xaa可为Ser或Thr
<220>
<221> 变体
<222> (2)..(2)
<223> Xaa可为Phe、Tyr或His
<220>
<221> 不确定的
<222> (3)..(3)
<223> Xaa可为任何天然存在的氨基酸
<220>
<221> NON_CONS
<222> (4)..(5)
<223> 第4位的Asp残基及第5位的Asp残基由20至25个介入氨基酸残基隔开
<220>
<221> NON_CONS
<222> (6)..(7)
<223> 第6位的Gly残基及第7位的Xaa残基由16个介入氨基酸残基隔开
<220>
<221> 变体
<222> (7)..(7)
<223> Xaa可为Arg、Lys或His
<220>
<221> 不确定的
<222> (8)..(8)
<223> Xaa可为任何天然存在的氨基酸
<220>
<221> 变体
<222> (9)..(9)
<223> Xaa可为Ser或Thr
<220>
<221> 不确定的
<222> (12)..(13)
<223> Xaa可为任何天然存在的氨基酸
<220>
<221> 变体
<222> (14)..(14)
<223> Xaa可为Ser或Thr
<220>
<221> misc_feature
<222> (15)..(15)
<223> Xaa可为任何天然存在的氨基酸
<220>
<221> NON_CONS
<222> (16)..(17)
<223> 第16位的Ala残基及第17位的Xaa残基由40至50个介入氨基酸残基隔开
<220>
<221> 变体
<222> (17)..(17)
<223> Xaa可为Arg或His
<220>
<221> 不确定的
<222> (18)..(18)
<223> Xaa可为任何天然存在的氨基酸
<220>
<221> 变体
<222> (20)..(20)
<223> Xaa可为Phe、Trp或Tyr
<220>
<221> NON_CONS
<222> (20)..(21)
<223> 第20位的Xaa残基及第21位的Gly残基由22至30个介入氨基酸残基隔开
<220>
<221> 不确定的
<222> (22)..(22)
<223> Xaa可为任何天然存在的氨基酸
<220>
<221> 不确定的
<222> (24)..(26)
<223> Xaa可为任何天然存在的氨基酸
<220>
<221> 变体
<222> (28)..(28)
<223> Xaa可为Glu或Asp
<400> 38
Xaa Xaa Xaa Asn Asp Gly Xaa Xaa Xaa Phe Asp Xaa Xaa Xaa Xaa Ala
1 5 10 15
Xaa Xaa Gly Xaa Gly Xaa Gly Xaa Xaa Xaa Gln Xaa
20 25
<210> 39
<211> 237
<212> PRT
<213> 普通拟杆菌(Bacteroides vulgatus)
<400> 39
Met Thr Ser Leu Leu Val Asn His Ile Leu Gln Thr Glu Lys Trp Thr
1 5 10 15
Ser Pro Glu Leu Phe Glu Thr Lys Asn Arg Ile Tyr Thr Phe Leu Asn
20 25 30
Pro Val Ser Tyr Leu Ile Ala Leu Glu Asn Lys Ser Leu Phe Glu Gln
35 40 45
Phe Asp Gly Ile Phe Ala Asp Gly Ser Leu Leu Val Ser Ala Ile Arg
50 55 60
Leu Val Tyr Gly Lys Arg Val Thr Arg Arg Ser Phe Asp Met Thr Ser
65 70 75 80
Leu Ala Pro Glu Leu Leu Asn Tyr Leu Met Glu Ser Arg Lys Thr Leu
85 90 95
Tyr Ile Val Ala Ser Gly Gln Glu Gln Val Glu Cys Ser Val Arg Ile
100 105 110
Phe Gln Glu Gln Tyr Pro Glu Leu Arg Ile Ala Gly Phe Arg Asn Gly
115 120 125
Tyr Phe Ser Ser Asp Ala Glu Met Asn Lys Glu Ala Ser His Ile Val
130 135 140
Glu Leu Asn Pro Asp Phe Leu Ile Val Gly Met Gly Ala Leu Met Gln
145 150 155 160
Glu Lys Phe Leu Leu Lys Val Lys Lys Met Gly Tyr Gln Gly Ile Gly
165 170 175
Phe Thr Cys Gly Gly Phe Val His Gln Thr Ala Met Asn Arg Met His
180 185 190
Tyr Tyr Pro Asn Trp Val Asp Lys Met Asn Leu Arg Phe Val Tyr Arg
195 200 205
Met Tyr Lys Glu Lys His Thr Arg Thr Arg Tyr Leu Gln Ala Ala Phe
210 215 220
Leu Phe Pro Val Arg Phe Ile Gly Glu Arg Ile Phe Gly
225 230 235
<210> 40
<211> 237
<212> PRT
<213> 普雷沃氏菌(Prevotella copri)
<400> 40
Met Val Ser Ile Leu Val Ser Lys Ile Ile Ser Thr Glu Lys Tyr Ser
1 5 10 15
Val Asn Gln Ile Phe Glu Thr Lys Gly Lys Val Tyr Thr Tyr Leu Asn
20 25 30
Pro Val Ser Tyr Leu Thr Ala Leu Asp Asn Lys Glu Leu Phe Gly Lys
35 40 45
Met Asp Gly Ile Phe Ala Asp Gly Gly Leu Leu Val Lys Ala Ile Lys
50 55 60
Leu Val Tyr Gly Lys Leu Val Thr Arg Arg Ser Phe Asp Met Thr Ser
65 70 75 80
Met Ala Pro Glu Leu Phe Ser Tyr Ala Glu Glu His Gly Lys Thr Ile
85 90 95
Tyr Ile Val Ala Ser Lys Gln Glu Gln Val Glu Lys Ala Val Glu Ile
100 105 110
Phe Arg Glu Arg Tyr Pro Lys Val Lys Phe Ala Gly Tyr Arg Asn Gly
115 120 125
Tyr Phe Ala Ser Glu Ser Glu Met Asp Val Glu Ala Lys Tyr Ile Ala
130 135 140
Lys Leu Asn Pro Asp Phe Leu Ile Val Gly Met Gly Ala Leu Met Gln
145 150 155 160
Glu Lys Phe Leu Leu Lys Val Lys Asn Ala Gly Tyr Gln Gly Val Gly
165 170 175
Phe Thr Cys Gly Gly Phe Ile His Gln Thr Ser Lys Asn Glu Ile Asp
180 185 190
Tyr Tyr Pro Ala Trp Val Asp Lys Thr Asn Leu Arg Phe Val Tyr Arg
195 200 205
Met Trp Lys Glu Pro His Thr Arg Lys Arg Tyr Val Met Ala Gly Leu
210 215 220
Leu Phe Pro Ala Arg Phe Ile Ala Glu Lys Ile Phe Gly
225 230 235
<210> 41
<211> 235
<212> PRT
<213> 萤光假单胞菌(Pseudomonas fluorescens)90F12-2
<400> 41
Met Ile Arg Leu Glu Leu Leu Asp Arg Tyr Ser Pro Ala Leu Leu Asp
1 5 10 15
Ser Asn Arg Ala Phe Ser Phe Leu Asn Phe Ala Ser Ile Gly Ser Phe
20 25 30
Ile Arg Gln Pro Pro Pro Ser Leu Ala Tyr Phe Cys Asp Gly Met Leu
35 40 45
Met Ser Gly Phe Met Ser Arg Ile Thr Gly Arg Ala Val Gln Arg Val
50 55 60
Ser Phe Asp Phe Thr Ser Ile Ala Asp Pro Val Leu Arg Glu Ser Glu
65 70 75 80
Gln Arg Gly Lys Arg Val Tyr Val Val Gly Ala Arg Gln Ala Glu Leu
85 90 95
Asp Arg Phe Val Asp Lys Leu Gly Thr Gln Tyr Pro Arg Leu Gln Leu
100 105 110
Val Gly Ala Arg Asn Gly Tyr Phe Asp Ala Glu Gln Gly Ala Ala Ile
115 120 125
Gln Ala Asp Ile Arg Arg Gln Arg Thr Asn Leu Leu Leu Val Gly Leu
130 135 140
Gly Ala Gly Leu Gln Glu Arg Phe Ile Leu Glu Ala Leu Arg Gly Gly
145 150 155 160
Phe Ser Gly Val Ala Phe Thr Cys Gly Gly Phe Ile Arg Gln Glu Ala
165 170 175
Asn Ala Ser Glu Arg Tyr Tyr Pro Asp Ala Ile Asn Arg Leu His Leu
180 185 190
Arg Ala Phe Tyr Arg Met Tyr Arg Glu Pro His Thr Ile Lys Arg Tyr
195 200 205
Leu Leu Asp Tyr Pro Ser Asn Ala Leu Arg Leu Thr Glu Leu Ile Leu
210 215 220
Arg Gln Gln Val Ala Ile Asn Val Thr Ala Pro
225 230 235

Claims (108)

1.一种通过细胞,优选为单一细胞,产生还原端具有N-乙酰葡萄糖胺单元的寡糖或双糖的方法,所述方法包括以下步骤:
a.提供细胞,所述细胞能够:(i)合成核苷酸-糖及单糖N-乙酰葡萄糖胺(GlcNAc)且(ii)表达糖基转移酶以糖化所述GlcNAc单糖,而产生所述双糖或寡糖,
b.在允许产生所述双糖或寡糖的条件下培养所述细胞,
c.优选地,自培养物分离所述双糖或寡糖。
2.一种通过细胞产生还原端具有N-乙酰葡萄糖胺单元的寡糖的方法,所述方法包括以下步骤:
a.提供细胞,所述细胞能够:(i)合成核苷酸-糖及单糖N-乙酰葡萄糖胺(GlcNAc)且(ii)表达糖基转移酶以糖化所述GlcNAc单糖,而产生所述寡糖,
b.在允许产生所述寡糖的条件下培养所述细胞,
c.优选地,自所述培养物分离所述寡糖。
3.一种通过细胞产生混合物的方法,所述混合物包括(i)还原端具有N-乙酰葡萄糖胺单元的双糖及/或寡糖、及(ii)一或多种基于乳糖的哺乳动物乳寡糖(MMOs),所述方法包括以下步骤:
a.提供细胞,所述细胞能够:(i)合成核苷酸-糖及单糖N-乙酰葡萄糖胺(GlcNAc)且(ii)表达糖基转移酶以糖化所述GlcNAc单糖,而产生所述还原端具有N-乙酰葡萄糖胺单元的双糖及/或寡糖,
b.在允许产生所述混合物的条件下培养所述细胞,
c.优选地,自培养物分离所述混合物。
4.如上述权利要求中任一项所述的方法,其中所述细胞表达至少一种N-乙酰葡萄糖胺-6-磷酸转移酶及磷酸酶,以合成所述单糖N-乙酰葡萄糖胺。
5.如上述权利要求中任一项所述的方法,其中所述细胞表达至少一种糖基转移酶,以糖化N-乙酰葡萄糖胺。
6.如上述权利要求中任一项所述的方法,其中所述细胞经基因改造以产生所述双糖或寡糖。
7.如权利要求6所述的方法,其中所述细胞以一或多种基因表达模组进行修饰,其特征在于任何所述表达模组的表达形式是组成型或由天然诱导物所产生。
8.如权利要求6或7中任一项所述的方法,其中所述细胞包括编码一蛋白质的相同编码DNA序列的多个复制。
9.如上述权利要求中任一项所述的方法,其中所述细胞在选自包括下列的群组的酶的表达或活性方面被修饰:N-乙酰葡萄糖胺-6-磷酸转移酶、磷酸酶、糖基转移酶、L-谷氨酰胺—D-果糖-6-磷酸转氨酶及UDP-葡萄糖4-表异构酶。
10.如上述权利要求中任一项所述的方法,其中所述核苷酸-糖选自包含下列的群组:UDP-半乳糖(UDP-Gal)、UDP-N-乙酰葡萄糖胺(UDP-GlcNAc)、UDP-N-乙酰半乳糖胺(UDP-GalNAc)、UDP-N-乙酰甘露糖胺(UDP-ManNAc)、GDP-岩藻糖(GDP-Fuc)、GDP-甘露糖(GDP-Man)、UDP-葡萄糖(UDP-Glc)、UDP-2-乙酰胺基-2,6-双去氧--L阿拉伯-4-己酮糖、UDP-2-乙酰胺基-2,6-双去氧--L-来苏-4-己酮糖、UDP-N-乙酰基-L-鼠李糖胺(UDP-L-RhaNAc或UDP-2-乙酰胺基-2,6-双去氧-L-甘露糖)、dTDP-N-乙酰岩藻糖胺、UDP-N-乙酰岩藻糖胺(UDP-L-FucNAc或UDP-2-乙酰胺基-2,6-双去氧-L-半乳糖)、UDP-N-乙酰基-L-肺炎糖胺(UDP-L-PneNAC或UDP-2-乙酰胺基-2,6-双去氧-L-塔罗糖)、UDP-N-乙酰胞壁酸、UDP-N-乙酰基-L-奎诺糖胺(UDP-L-QuiNAc或UDP-2-乙酰胺基-2,6-双去氧-L-葡萄糖)、GDP-L-异鼠李糖、CMP-N-乙酰基神经氨酸(CMP-Neu5Ac)、CMP-N-乙醇酰神经氨酸(CMP-Neu5Gc)、CMP-Neu4Ac、CMP-Neu5Ac9N3、CMP-Neu4,5Ac2、CMP-Neu5,7Ac2、CMP-Neu5,9Ac2、CMP-Neu5,7(8,9)Ac2、UDP-葡萄糖醛酸盐、UDP-半乳糖醛酸盐、GDP-鼠李糖及UDP-木糖。
11.如上述权利要求中任一项所述的方法,其中所述核苷酸-糖为UDP-半乳糖,且所述糖基转移酶为N-乙酰葡萄糖胺b-1,3-半乳糖基转移酶或N-乙酰葡萄糖胺b-1,4-半乳糖基转移酶。
12.如上述权利要求中任一项所述的方法,其中所述寡糖在所述还原端具有乳-N-双糖(Gal-b1,3-GlcNAc)或N-乙酰乳糖胺(Gal-b1,4-GlcNAc)。
13.如上述权利要求中任一项所述的方法,其中所述N-乙酰葡萄糖胺b-1,3-半乳糖基转移酶为糖基转移酶,其具有:
a.PFAM域PF00535,且
i.包括SEQ ID NO 01的序列[AGPS]XXLN(Xn)RXDXD,其中X是任何氨基酸,其中n为12至17,或
ii.包括SEQ ID NO 02的序列PXXLN(Xn)RXDXD(Xm)[FWY]XX[HKR]XX[NQST],其中X是任何氨基酸,其中n是12至17且m是100至115,或
iii.包括根据SEQ ID NO:03、04、05、06、07或08中的任一,优选为SEQ ID NO 03、04、05、06或07中的任一,更优选为SEQ ID NO 03、06或07中的任一,最优选为SEQ ID NO 03或06中的任一的多肽序列,或
iv.为SEQ ID NO:03、04、05、06、07或08中的任一,优选为SEQ ID NO 03、04、05、06或07中的任一,更优选为SEQ ID NO 03、06或07中的任一,最优选为SEQ ID NO 03或06中的任一的功能性同源物、变体或衍生物,其具有与SEQ ID NO:03、04、05、06、07或08中的任一,优选为SEQ ID NO 03、04、05、06或07中的任一,更优选为SEQ ID NO 03、06或07中的任一,最优选为SEQ ID NO 03或06中的任一的所述N-乙酰葡萄糖胺b-1,3-半乳糖基转移酶多肽全长的至少80%整体序列同一性且具有N-乙酰葡萄糖胺b-1,3-半乳糖基转移酶活性,或
v.包括来自SEQ ID NO:03、04、05、06、07或08中的任一,优选为SEQ ID NO 03、04、05、06或07中的任一,更优选为SEQ ID NO 03、06或07中的任一,最优选为SEQ ID NO 03或06中的任一的至少8、9、10、11、12、13、14、15、16、17、18、19、20个连续氨基酸残基的寡肽序列,且具有N-乙酰葡萄糖胺b-1,3-半乳糖基转移酶活性,或
vi.为SEQ ID NO:03、04、05、06、07或08中的任一,优选为SEQ ID NO 03、04、05、06或07中的任一,更优选为SEQ ID NO 03、06或07中的任一,最优选为SEQ ID NO 03或06中的任一的功能片段,且具有N-乙酰葡萄糖胺b-1,3-半乳糖基转移酶活性,或
vii.包括多肽,所述多肽包括或由具有与SEQ ID NO:03、04、05、06、07或08中的任一,优选为SEQ ID NO 03、04、05、06或07中的任一,更优选为SEQ ID NO 03、06或07中的任一,最优选为SEQ ID NO 03或06中的任一的全长氨基酸序列的至少80%序列同一性的氨基酸序列所组成,且具有N-乙酰葡萄糖胺b-1,3-半乳糖基转移酶活性,或者
b.PFAM域IPR002659,且
i.包括SEQ ID NO 09的序列KT(Xn)[FY]XXKXDXD(Xm)[FHY]XXG(X,无A、G、S)(Xp)X(无F、H、W、Y)[DE]D[ILV]XX[AG],其中X是任何氨基酸,其中n是13至16,m是35至70,且p是20至45,或
ii.包括根据SEQ ID NO:10、11、12或13中的任一的多肽序列,或
iii.为SEQ ID NO:10、11、12或13中的任一的功能性同源物、变体或衍生物,其具有与SEQ ID NO:10、11、12或13的所述N-乙酰葡萄糖胺b-1,3-半乳糖基转移酶多肽中的任一全长的至少80%整体序列同一性,且具有N-乙酰葡萄糖胺b-1,3-半乳糖基转移酶活性,或
iv.包括来自SEQ ID NO:10、11、12或13中的任一的至少8、9、10、11、12、13、14、15、16、17、18、19、20个连续氨基酸残基的寡肽序列,且具有N-乙酰葡萄糖胺b-1,3-半乳糖基转移酶活性,或
v.为SEQ ID NO:10、11、12或13中的任一的功能片段,且具有N-乙酰葡萄糖胺b-1,3-半乳糖基转移酶活性,或
vi.包括多肽,所述多肽包括或由具有与SEQ ID NO:10、11、12或13中的任一的全长氨基酸序列的至少80%序列同一性的氨基酸序列所组成,且具有N-乙酰葡萄糖胺b-1,3-半乳糖基转移酶活性。
14.如权利要求1至12中任一项所述的方法,其中所述N-乙酰葡萄糖胺b-1,4-半乳糖基转移酶为糖基转移酶,其具有:
a.PFAM域PF01755,且
i.包括SEQ ID NO 14的序列EXXCXXSHXX[ILV][FWY](Xn)EDD(Xm)[ACGST]XXYX[ILMV],其中X是任何氨基酸,其中n为13至15且m是50至76,或
ii.包括根据SEQ ID NO:15、16、17、18、19、20、21、22或23中的任一,优选为SEQ ID NO:15、16、17、18、20或21中的任一,更优选为SEQ ID NO:17、18、20或21中的任一的多肽序列,或
iii.为SEQ ID NO:15、16、17、18、19、20、21、22或23中的任一,优选为SEQ ID NO:15、16、17、18、20或21中的任一,更优选为SEQ ID NO:17、18、20或21中的任一的功能性同源物、变体或衍生物,其具有与SEQ ID NO:15、16、17、18、19、20、21、22或23中的任一,优选为SEQID NO:15、16、17、18、20或21中的任一,更优选为SEQ ID NO:17、18、20或21中的任一的所述N-乙酰葡萄糖胺b-1,4-半乳糖基转移酶多肽中全长的至少80%整体序列同一性,且具有N-乙酰葡萄糖胺b-1,4-半乳糖基转移酶活性,或
iv.包括来自SEQ ID NO:15、16、17、18、19、20、21、22或23中的任一,优选为SEQ ID NO:15、16、17、18、20或21中的任一,更优选为SEQ ID NO:17、18、20或21中的任一的至少8、9、10、11、12、13、14、15、16、17、18、19、20个连续氨基酸残基的寡肽序列,且具有N-乙酰葡萄糖胺b-1,4-半乳糖基转移酶活性,或
v.为SEQ ID NO:15、16、17、18、19、20、21、22或23中的任一,优选为SEQ ID NO:15、16、17、18、20或21中的任一,更优选为SEQ IDNO:17、18、20或21中的任一的功能片段,且具有N-乙酰葡萄糖胺b-1,4-半乳糖基转移酶活性,或
vi.包括多肽,所述多肽包括或由具有与SEQ ID NO:15、16、17、18、19、20、21、22或23中的任一,优选为SEQ ID NO:15、16、17、18、20或21中的任一,更优选为SEQ ID NO:17、18、20或21中的任一的全长氨基酸序列的至少80%序列同一性的氨基酸序列所组成,且具有N-乙酰葡萄糖胺b-1,4-半乳糖基转移酶活性,或者
b.PFAM域PF00535,且
i.包括SEQ ID NO 24的序列R[KN]XXXXXXXGXXXX[FL]XDXD(Xn)[FHW]XXX[FHNY](Xm)E[DE],其中X是任何氨基酸,其中n是50至75,m是10至30,或
ii.包括SEQ ID NO 25的序列R[KN]XXXXXXXGXXXXFXDXD(Xn)[FHW]XXX[FHNY](Xm)E[DE](Xp)[FWY]XX[HKR]XX[NQST],其中X是任何氨基酸,其中n是50至75,m是10至30,且p是20至25,或
iii.包括根据SEQ ID NO:26、27或28中的任一的多肽序列,或
iv.为SEQ ID NO:26、27或28中的任一的功能性同源物、变体或衍生物,其具有与SEQID NO:26、27或28的所述N-乙酰葡萄糖胺b-1,4-半乳糖基转移酶多肽中的任一全长的至少80%整体序列同一性,且具有N-乙酰葡萄糖胺b-1,4-半乳糖基转移酶活性,或
v.包括来自SEQ ID NO:26、27或28中的任一的至少8、9、10、11、12、13、14、15、16、17、18、19、20个连续氨基酸残基的寡肽序列,且具有N-乙酰葡萄糖胺b-1,4-半乳糖基转移酶活性,或
vi.为SEQ ID NO:26、27或28中的任一的功能片段,且具有N-乙酰葡萄糖胺b-1,4-半乳糖基转移酶活性,或
vii.包括多肽,所述多肽包括或由具有与SEQ ID NO:26、27或28中的任一的全长氨基酸序列的至少80%序列同一性的氨基酸序列所组成,且具有N-乙酰葡萄糖胺b-1,4-半乳糖基转移酶活性,或者
c.PFAM域PF02709且不具有PFAM域PF00535,且
viii.包括SEQ ID NO 29的序列[FWY]XX[FY][FWY](X23)[FWY][GQ]X[DE]D,其中X是任何氨基酸,或
ix.包括SEQ ID NO 30的序列[PV]W[GHNP](Xn)[FWY][GQ]X[DE]D,其中X是任何氨基酸,其中n是21至24,或
x.包括根据SEQ ID NO:31、32、33、34、35或36中的任一的多肽序列,或
xi.为SEQ ID NO:31、32、33、34、35或36中的任一的功能性同源物、变体或衍生物,其具有与SEQ ID NO:31、32、33、34、35或36的所述N-乙酰葡萄糖胺b-1,4-半乳糖基转移酶多肽中的任一全长的至少80%整体序列同一性,且具有N-乙酰葡萄糖胺b-1,4-半乳糖基转移酶活性,或
xii.包括来自SEQ ID NO:31、32、33、34、35或36中的任一的至少8、9、10、11、12、13、14、15、16、17、18、19、20个连续氨基酸残基的寡肽序列,且具有N-乙酰葡萄糖胺b-1,4-半乳糖基转移酶活性,或
xiii.为SEQ ID NO:31、32、33、34、35或36中的任一的功能片段,且具有N-乙酰葡萄糖胺b-1,4-半乳糖基转移酶活性,或
xiv.包括多肽,所述多肽包括或由具有与SEQ ID NO:31、32、33、34、35或36中的任一的全长氨基酸序列的至少80%序列同一性的氨基酸序列所组成,且具有N-乙酰葡萄糖胺b-1,4-半乳糖基转移酶活性,或
d.PFAM域PF03808,且
viii.包括SEQ ID NO 37的序列[ST][FHY]XN(Xn)DG(X16)[HKR]X[ST]FDXX[ST]XA,其中X是任何氨基酸,且其中n是20至25,或
ix.包括SEQ ID NO 38的序列[ST][FHY]XN(Xn)DG(X16)[HKR]X[ST]FDXX[ST]XA(Xm)[HR]XG[FWY](Xp)GXGXXXQ[DE],其中X是任何氨基酸,其中n是20至25,m是40至50,且p是22至30,或
x.包括根据SEQ ID NO:39、40或41中的任一的多肽序列,或
xi.为SEQ ID NO:39、40或41中的任一的功能性同源物、变体或衍生物,其具有与SEQID NO:39、40或41的所述N-乙酰葡萄糖胺b-1,4-半乳糖基转移酶多肽中的任一全长的至少80%整体序列同一性,且具有N-乙酰葡萄糖胺b-1,4-半乳糖基转移酶活性,或
xii.包括来自SEQ ID NO:39、40或41中的任一的至少8、9、10、11、12、13、14、15、16、17、18、19、20个连续氨基酸残基的寡肽序列,且具有N-乙酰葡萄糖胺b-1,4-半乳糖基转移酶活性,或
xiii.为SEQ ID NO:39、40或41中的任一的功能片段,且具有N-乙酰葡萄糖胺b-1,4-半乳糖基转移酶活性,或
xiv.包括多肽,所述多肽包括或由具有与SEQ ID NO:39、40或41中的任一的全长氨基酸序列的至少80%序列同一性的氨基酸序列所组成,且具有N-乙酰葡萄糖胺b-1,4-半乳糖基转移酶活性。
15.如上述权利要求中任一项所述的方法,其中
a.所述N-乙酰葡萄糖胺-6-磷酸转移酶为包括UniProt ID P43577的多肽的多肽序列、或为UniProt ID P43577的多肽的功能性同源物、变体或衍生物,其具有与UniProt IDP43577的多肽全长的至少80%整体序列同一性,且具有N-乙酰葡萄糖胺-6-磷酸转移酶活性,以及
b.所述L-谷氨酰胺—D-果糖-6-磷酸转氨酶为包括UniProt ID P17169的多肽的多肽序列、或为具有UniProtID P17169的多肽的功能性同源物、变体或衍生物,其具有与UniProt ID P17169的多肽全长的至少80%整体序列同一性,且具有L-谷氨酰胺—D-果糖-6-磷酸转氨酶活性;或为与UniProt ID P17169多肽不同的A39T、R250C和G472S突变的修饰版本。
16.如上述权利要求中任一项所述的方法,其中所述细胞能够代谢碳源,所述碳源选自包含下列列举的群组:葡萄糖、果糖、半乳糖、乳糖、蔗糖、麦芽糖、麦芽-寡糖、麦芽三糖、山梨醇、木糖、鼠李糖、甘露糖、甲醇、乙醇、阿拉伯糖、海藻糖、淀粉、纤维素、半纤维素、玉米浸液、高果糖浆、糖蜜、甘油、乙酸盐、柠檬酸盐、乳酸、丙酮酸。
17.如上述权利要求中任一项所述的方法,其中所述细胞无法将N-乙酰葡萄糖胺-6-磷酸盐转换成葡萄糖胺-6-磷酸盐,及/或无法将葡萄糖胺-6-磷酸盐转换成果糖-6-磷酸盐。
18.如上述权利要求中任一项所述的方法,其中所述细胞经修饰以产生GDP-岩藻糖。
19.如上述权利要求中任一项所述的方法,其中所述细胞经修饰以促进GDP-岩藻糖产生,且所述修饰选择自包含下列列举的群组:UDP-葡萄糖:十一异戊二烯-磷酸葡萄糖-1-磷酸转移酶编码基因的剃除、GDP-L-岩藻糖合成酶编码基因的过度表达、GDP-甘露糖4,6-脱水酶编码基因的过度表达、甘露糖-1-磷酸盐鸟苷酸转移酶编码基因的过度表达、磷酸甘露糖变位酶编码基因的过度表达、或甘露糖-6-磷酸盐异构酶编码基因的过度表达。
20.如上述权利要求中任一项所述的方法,其中所述细胞经修饰以产生UDP-半乳糖。
21.如上述权利要求中任一项所述的方法,其中所述细胞经修饰以促进UDP-半乳糖产生,且所述修饰选择自包含下列列举的群组:5’-核苷酸酶/UDP-糖水解酶编码基因的剃除或半乳糖-1-磷酸盐尿苷酰转移酶编码基因的剃除。
22.如上述权利要求中任一项所述的方法,其中所述细胞经修饰以产生CMP-N-乙酰基神经氨酸。
23.如上述权利要求中任一项所述的方法,其中所述细胞经修饰以促进CMP-N-乙酰基神经氨酸产生,且所述修饰选择自包含下列列举的群组:CMP-唾液酸合成酶编码基因的过度表达、唾液酸合成酶编码基因的过度表达、N-乙酰基-D-葡萄糖胺2-表异构酶编码基因的过度表达。
24.如上述权利要求中任一项所述的方法,其中所述细胞能够表达至少一种其他糖基转移酶,且其中所述其他糖基转移酶选自包括下列的群组:岩藻糖基转移酶、唾液酸转移酶、半乳糖基转移酶、葡萄糖基转移酶、甘露糖基转移酶、N-乙酰基葡糖胺转移酶、N-乙酰基半乳糖胺转移酶、N-乙酰基甘露糖胺转移酶、木糖基转移酶、葡萄糖醛酸苷转移酶、半乳糖醛酸转移酶、葡萄糖胺转移酶、N-乙醇酰神经胺转移酶、鼠李糖基转移酶、N-乙酰基鼠李糖基转移酶、UDP-4-氨基-4,6-双去氧-N-乙酰基-β-L-阿卓糖胺转氨酶、UDP-N-乙酰葡萄糖胺烯醇丙酮基转移酶和岩藻糖胺基转移酶,
-优选地,所述岩藻糖基转移酶选自包括下列列举:α-1,2-岩藻糖基转移酶、α-1,3-岩藻糖基转移酶、α-1,4-岩藻糖基转移酶及α-1,6-岩藻糖基转移酶,
-优选地,所述唾液酸转移酶选自包括下列列举:α-2,3-唾液酸转移酶、α-2,6-唾液酸转移酶及α-2,8-唾液酸转移酶,
-优选地,所述半乳糖基转移酶选自包括下列列举:β-1,3-半乳糖基转移酶、N-乙酰葡萄糖胺β-1,3-半乳糖基转移酶、β-1,4-半乳糖基转移酶、N-乙酰葡萄糖胺β-1,4-半乳糖基转移酶、α-1,3-半乳糖基转移酶及α-1,4-半乳糖基转移酶,
-优选地,所述葡萄糖基转移酶选自包括下列列举:α-葡萄糖基转移酶、β-1,2-葡萄糖基转移酶、β-1,3-葡萄糖基转移酶及β-1,4-葡萄糖基转移酶,
-优选地,所述甘露糖基转移酶选自包括下列列举:α-1,2-甘露糖基转移酶、α-1,3-甘露糖基转移酶及α-1,6-甘露糖基转移酶,
-优选地,所述N-乙酰基葡糖胺转移酶选自包括下列列举:β-1,3-N-乙酰基葡糖胺转移酶及β-1,6-N-乙酰基葡糖胺转移酶,
-优选地,所述N-乙酰基半乳糖胺转移酶为α-1,3-N-乙酰基半乳糖胺转移酶。
25.如权利要求24所述的方法,其中所述细胞在所述其他糖基转移酶的表达或活性方面被修饰。
26.如上述权利要求中任一项所述的方法,其中所述细胞使用用于产生所述在还原端具有GlcNAc单元的双糖或寡糖的一或多种前驱物,所述前驱物从培养基供给所述细胞。
27.如上述权利要求中任一项所述的方法,其中所述细胞产生一或多种前驱物,所述前驱物用于产生所述在还原端具有GlcNAc单元的双糖或寡糖。
28.如权利要求26或27中任一项所述的方法,其中用于产生所述双糖或寡糖的所述前驱物完全转化为所述还原端具有GlcNAc单元的双糖或寡糖。
29.如上述权利要求中任一项所述的方法,其中所述细胞在细胞内产生所述还原端具有GlcNAc单元的双糖或寡糖,且其中部分或实质上全部的所产生的所述还原端具有GlcNAc单元的双糖或寡糖保留在细胞内及/或经由被动或主动运输排出所述细胞外。
30.如上述权利要求中任一项所述的方法,其中所述细胞表达膜转运蛋白或具有转运活性的多肽,以转运化合物穿过细胞壁的外膜,
优选地,所述细胞在所述膜转运蛋白或具有转运活性的多肽的表达或活性方面被修饰。
31.如权利要求30所述的方法,其中所述膜转运蛋白或具有转运活性的多肽选自包括下列列举:运输蛋白、P-P-键-水解-驱动的转运体、β-桶状孔蛋白、辅助转运蛋白、推定转运蛋白及磷酸转移-驱动组转位蛋白,
优选地,所述运输蛋白包括MFS转运体、糖排出转运体及螯铁蛋白输出体,
优选地,所述P-P-键-水解-驱动的转运体包括ABC转运体及螯铁蛋白输出体。
32.如权利要求30或31中任一项所述的方法,其中所述膜转运蛋白或具有转运活性的多肽控制所述还原端具有GlcNAc单元的双糖或寡糖及/或一或多种前驱物及/或接受者在细胞壁外膜上的流动,所述一或多种前驱物及/或接受者用于产生所述还原端具有GlcNAc单元的双糖或寡糖。
33.如权利要求30至32中任一项所述的方法,其中所述膜转运蛋白或具有转运活性的多肽提供所述还原端具有GlcNAc单元的双糖或寡糖的改善产生及/或允许排出及/或促进排出。
34.如权利要求6至33中任一项所述的方法,其中所述细胞包括与未修饰的先驱细胞相比,用于降低乙酸盐产生的修饰。
35.如权利要求34所述的方法,其中所述细胞包括与未修饰的先驱细胞相比,任一或多种蛋白质的较低或减少的表达及/或消除、受损、降低或延迟的活性,所述蛋白质包含:β-半乳糖苷酶、半乳糖苷O-乙酰转移酶、N-乙酰葡萄糖胺-6-磷酸盐去乙酰酶、葡萄糖胺-6-磷酸盐脱胺酶、N-乙酰葡萄糖胺抑制蛋白、核糖核苷酸单磷酸酶、EIICBA-Nag、UDP-葡萄糖:十一异戊二烯-磷酸葡萄糖-1-磷酸转移酶、L-岩藻酮糖激酶、L-岩藻糖异构酶、N-乙酰神经氨酸解离酶、N-乙酰甘露糖胺激酶、N-乙酰甘露糖胺-6-磷酸盐2-表异构酶、EIIAB-Man、EIIC-Man、EIID-Man、ushA、半乳糖-1-磷酸盐尿苷酰转移酶、葡萄糖-1-磷酸盐腺苷酰转移酶、葡萄糖-1-磷酸酶、ATP-依赖性6-磷酸果糖激酶同功酶1、ATP-依赖性6-磷酸果糖激酶同功酶2、葡萄糖-6-磷酸盐异构酶、有氧呼吸调控蛋白、转录抑制蛋白IclR、lon蛋白酶、葡萄糖特异性转位磷酸转移酶酶IIBC成分ptsG、葡萄糖特异性转位磷酸转移酶(PTS)酶IIBC成分malX、enzyme IIAGlc、β-葡萄糖苷特异性PTS酶II、果糖特异性PTS多磷酰转移蛋白FruA及FruB、乙醇脱氢酶醛脱氢酶、丙酮酸-甲酸盐解离酶、乙酸盐激酶、磷酰基转移酶、磷酸乙酰转移酶、丙酮酸去羧酶。
36.如上述权利要求中任一项所述的方法,其中细胞能够产生磷酸烯醇丙酮酸(PEP)。
37.如权利要求6至36中任一项所述的方法,其中所述细胞与未修饰的先驱细胞相比,具有用于磷酸烯醇丙酮酸(PEP)的促进产生及/或供应的修饰。
38.如权利要求6至37中任一项所述的方法,其中所述细胞包含至少部分失活的所选单糖、双糖或寡糖的分解代谢途径,所述单糖、双糖或寡糖参与所述还原端具有GlcNAc单元的双糖或寡糖的产生及/或为产生所述还原端具有GlcNAc单元的双糖或寡糖所需。
39.如上述权利要求中任一项所述的方法,其中当所述细胞在乳糖与一或多种其他碳源结合的环境中生长时,所述细胞抵抗乳糖杀伤现象。
40.如上述权利要求中任一项所述的方法,其中所述细胞在整个培养液及/或上清液产生90g/L或多于90g/L的所述还原端具有GlcNAc的双糖或寡糖、及/或其中在整个培养液及/或上清液中的所述还原端具有GlcNAc的双糖或寡糖具有至少80%的纯度,其在整个培养液及/或上清液中分别以所述还原端具有GlcNAc单元的双糖或寡糖及其前驱物的总量计。
41.如上述权利要求中任一项所述的方法,其中所述细胞在培养基中稳定地培养。
42.如上述权利要求中任一项所述的方法,其中所述条件包括:
-使用包括至少一种前驱物及/或接受者的培养基,以用于产生所述还原端具有GlcNAc单元的双糖或寡糖,及/或
-添加至少一种前驱物及/或接受者原料至培养基,以用于产生所述还原端具有GlcNAc单元的双糖或寡糖。
43.如上述权利要求中任一项所述的方法,所述方法包括下列步骤中的至少一者:
vi)使用包括至少一种前驱物及/或接受者的培养基;
vii)向反应器中的培养基添加至少一种前驱物及/或接受者原料,其中总反应器体积范围为250mL(毫升)至10,000m3(立方米),优选以连续方式,并且优选使得培养基的最终体积不超过在添加所述前驱物及/或接受者原料之前的培养基体积的三倍,优选不超过两倍,更优选小于两倍;
viii)向反应器中的培养基添加至少一种前驱物及/或接受者原料,其中总反应器体积范围为250mL(毫升)至10,000m3(立方米),优选以连续方式,并且优选使得培养基的最终体积不超过在添加所述前驱物及/或接受者原料之前的培养基体积的三倍,优选不超过两倍,更优选小于两倍,且优选地,所述前驱物及/或接受者原料的pH设定在3与7之间,且优选地,所述前驱物及/或接受者原料的温度维持在20℃与80℃之间;
ix)通过进料溶液的手段在1天、2天、3天、4天、5天的过程中以连续方式添加至少一种前驱物及/或接受者原料至培养基;
x)通过进料溶液的手段在1天、2天、3天、4天、5天的过程中以连续方式添加至少一种前驱物及/或接受者原料至培养基,且优选地,所述进料溶液的pH设定在3与7之间,且优选地,所述前驱物及/或接受者原料的温度维持在20℃与80℃之间;
所述方法产生所述还原端具有GlcNAc单元的双糖或寡糖,其在最终培养物中的浓度为至少50g/L,优选为至少75g/L,更优选为至少90g/L,更优选为至少100g/L,更优选为至少125g/L,更优选为至少150g/L,更优选为至少175g/L,更优选为至少200g/L。
44.如权利要求1至42中任一项所述的方法,所述方法包括下列步骤中的至少一者:
vi)使用每公升初始反应器体积包含至少50克,更优选为至少75克,更优选为至少100克,更优选为至少120克,更优选为至少150克乳糖的培养基,其中反应器体积范围为250mL至10,000m3(立方米);
vii)以每公升初始反应器体积包含至少50克,更优选为至少75克,更优选为至少100克,更优选为至少120克,更优选为至少150克乳糖的乳糖原料添加至培养基,其中反应器体积范围为250mL至10,000m3(立方米),优选以连续方式,且优选地,使得所述培养基的最终体积不超过在添加所述乳糖原料之前的培养基体积的三倍,优选不超过两倍,更优选小于两倍;
viii)以每公升初始反应器体积包含至少50克,更优选为至少75克,更优选为至少100克,更优选为至少120克,更优选为至少150克乳糖的乳糖原料添加至培养基,其中反应器体积范围为250mL至10,000m3(立方米),优选以连续方式,且优选地,使得所述培养基的最终体积不超过在添加所述乳糖原料之前的培养基体积的三倍,优选不超过两倍,更优选小于两倍,且优选地,所述乳糖原料的pH设定在3与7之间,且优选地,所述乳糖原料的温度维持在20℃与80℃之间;
ix)通过进料溶液的手段在1天、2天、3天、4天、5天的过程中以连续方式添加乳糖原料至培养基;
x)通过进料溶液的手段在1天、2天、3天、4天、5天的过程中以连续方式添加乳糖原料至培养基,其中所述乳糖进料溶液的浓度为50g/L,优选为75g/L,更优选为100g/L,更优选为125g/L,更优选为150g/L,更优选为175g/L,更优选为200g/L,更优选为225g/L,更优选为250g/L,更优选为275g/L,更优选为300g/L,更优选为325g/L,更优选为350g/L,更优选为375g/L,更优选为400g/L,更优选为450g/L,更优选为500g/L,又更优选为550g/L,最优选为600g/L;以及其中优选地,所述进料溶液的pH设定在3与7之间,且优选地,所述前驱物及/或接受者原料的温度维持在20℃与80℃之间;
所述方法产生所述还原端具有GlcNAc单元的双糖或寡糖,其在最终培养物中的浓度为至少50g/L,优选为至少75g/L,更优选为至少90g/L,更优选为至少100g/L,更优选为至少125g/L,更优选为至少150g/L,更优选为至少175g/L,更优选为至少200g/L。
45.如权利要求44所述的方法,其中所述乳糖原料是通过从培养开始以至少5mM,优选以30、40、50、60、70、80、90、100、150mM的浓度添加乳糖,更优选为以>300mM的浓度添加乳糖而完成。
46.如权利要求44或45中任一项所述的方法,其中所述乳糖原料是通过将乳糖以一定浓度添加至培养物中而完成,使得在培养物的整个生产阶段获得至少5mM,优选为10mM或30mM的乳糖浓度。
47.如上述权利要求中任一项所述的方法,其中所述细胞培养至少约60、80、100或约120小时或以连续方式培养。
48.如上述权利要求中任一项所述的方法,其中所述培养基包含选自包括乳糖、半乳糖、岩藻糖及唾液酸的群组的至少一种前驱物。
49.如上述权利要求中任一项所述的方法,其中通过向包含前驱物的培养基添加碳类基质,优选为葡萄糖或蔗糖,而提供指数细胞生长的第一阶段,接着在第二阶段,仅将碳类基质,优选为葡萄糖或蔗糖,添加到培养基中。
50.如权利要求1至49中任一项所述的方法,其中通过向包含前驱物的培养基中加入碳类基质,优选为葡萄糖或蔗糖,而提供指数细胞生长的第一阶段,接着在第二阶段,其中碳类基质,优选为葡萄糖或蔗糖,及前驱物添加到培养基中。
51.如上述权利要求中任一项所述的方法,其中所述细胞产生带电的混合物,所述混合物为包含至少一种还原端具有GlcNAc单元的双糖或寡糖,优选为唾液酸化的双糖及/或寡糖及/或中性的双糖及/或寡糖。
52.如上述权利要求中任一项所述的方法,其中所述细胞产生带电的混合物,所述混合物为包含至少还原端具有GlcNAc单元的寡糖,优选为唾液酸化的寡糖及/或中性的寡糖。
53.如上述权利要求中任一项所述的方法,其中所述寡糖选自包括下列的列举:2-岩藻糖基乳-N-双糖、4-岩藻糖基乳-N-双糖、2-4-二岩藻糖基乳-N-双糖、3’-唾液酸乳-N-双糖、6’-唾液酸乳-N-双糖、3’,6’-二唾液酸乳-N-双糖、6,6’-二唾液酸乳-N-双糖、2’-岩藻糖基-3’-唾液酸乳-N-双糖、2’-岩藻糖基-6’-唾液酸乳-N-双糖、4-岩藻糖基-3’-唾液酸乳-N-双糖、4-岩藻糖基-6’-唾液酸乳-N-双糖、2-岩藻糖基N-乙酰乳糖胺、3’-岩藻糖基N-乙酰乳糖胺、2,3’-二岩藻糖基N-乙酰乳糖胺、3’-唾液酸N-乙酰乳糖胺、6’-唾液酸N-乙酰乳糖胺、3’,6’-二唾液酸N-乙酰乳糖胺、6,6’-二唾液酸N-乙酰乳糖胺、2’-岩藻糖基-3’-唾液酸N-乙酰乳糖胺、2’-岩藻糖基-6’-唾液酸N-乙酰乳糖胺、3-岩藻糖基-3’-唾液酸N-乙酰乳糖胺、3’-岩藻糖基-6’-唾液酸N-乙酰乳糖胺、P1三糖(Gal-a1,4-Gal-b1,4-GlcNAc)、异源移植抗原决定位(Gal-a1,3-Gal-b1,4-GlcNAc)、Gal-b14-(Galb13)-GlcNAc、聚-N-乙酰乳糖胺、GalNAc-b1,3-Gal-b1,4-GlcNAc。
54.如权利要求1或3至53中任一项所述的方法,其中所述还原端具有GlcNAc单元的双糖不包括几丁二糖(GlcNAc-GlcNAc)。
55.如上述权利要求中任一项所述的方法,其中所述还原端具有GlcNAc单元的寡糖在还原端不包括几丁二糖,优选为不包括N-聚糖。
56.一种用于产生还原端具有N-乙酰葡萄糖胺单元的寡糖或双糖的代谢工程细胞,其中所述细胞能够:(i)合成核苷酸-糖及单糖N-乙酰葡萄糖胺(GlcNAc)、以及(ii)表达糖基转移酶以糖化所述GlcNAc单糖,而产生所述双糖或寡糖。
57.一种用于产生还原端具有N-乙酰葡萄糖胺单元的寡糖的代谢工程细胞,其中所述细胞能够:(i)合成核苷酸-糖及单糖N-乙酰葡萄糖胺(GlcNAc)、以及(ii)表达糖基转移酶以糖化所述GlcNAc单糖,而产生所述寡糖。
58.一种用于产生混合物的代谢工程细胞,所述混合物包括:(i)还原端具有N-乙酰葡萄糖胺单元的双糖及/或寡糖、以及(ii)一或多种基于乳糖的哺乳动物乳寡糖(MMOs),其中所述细胞能够:(i)合成核苷酸-糖及单糖N-乙酰葡萄糖胺(GlcNAc)、以及(ii)表达糖基转移酶以糖化所述GlcNAc单糖,而产生所述还原端具有N-乙酰葡萄糖胺单元的双糖或寡糖。
59.如权利要求56或58中任一项所述的细胞,其中所述细胞经代谢工程以产生所述还原端具有N-乙酰葡萄糖胺的双糖或寡糖。
60.如权利要求57所述的细胞,其中所述细胞经代谢工程以产生所述还原端具有N-乙酰葡萄糖胺的寡糖。
61.如权利要求56至60中任一项所述的细胞,其中所述细胞以一或多种基因表达模组进行修饰,其特征在于任何所述表达模组的表达形式是组成型或由天然诱导物所产生。
62.如权利要求56至61中任一项所述的细胞,其中所述细胞包括编码一蛋白质的相同编码DNA序列的多个复制。
63.如权利要求56至62中任一项所述的细胞,其中所述细胞表达至少一种N-乙酰葡萄糖胺-6-磷酸转移酶及磷酸酶,以合成N-乙酰葡萄糖胺。
64.如权利要求56至63中任一项所述的细胞,其中所述细胞表达至少一种糖基转移酶,以糖化N-乙酰葡萄糖胺。
65.如权利要求56至64中任一项所述的细胞,其中所述细胞在选自包括下列的群组的酶的表达或活性方面被修饰:N-乙酰葡萄糖胺-6-磷酸转移酶、磷酸酶、糖基转移酶、L-谷氨酰胺—D-果糖-6-磷酸转氨酶及UDP-葡萄糖4-表异构酶。
66.如权利要求56至65中任一项所述的细胞,其中所述核苷酸-糖选自包含下列的群组:UDP-半乳糖(UDP-Gal)、UDP-N-乙酰葡萄糖胺(UDP-GlcNAc)、UDP-N-乙酰半乳糖胺(UDP-GalNAc)、UDP-N-乙酰甘露糖胺(UDP-ManNAc)、GDP-岩藻糖(GDP-Fuc)、GDP-甘露糖(GDP-Man)、UDP-葡萄糖(UDP-Glc)、UDP-2-乙酰胺基-2,6-双去氧--L阿拉伯-4-己酮糖、UDP-2-乙酰胺基-2,6-双去氧--L-来苏-4-己酮糖、UDP-N-乙酰基-L-鼠李糖胺(UDP-L-RhaNAc或UDP-2-乙酰胺基-2,6-双去氧-L-甘露糖)、dTDP-N-乙酰岩藻糖胺、UDP-N-乙酰岩藻糖胺(UDP-L-FucNAc或UDP-2-乙酰胺基-2,6-双去氧-L-半乳糖)、UDP-N-乙酰基-L-肺炎糖胺(UDP-L-PneNAC或UDP-2-乙酰胺基-2,6-双去氧-L-塔罗糖)、UDP-N-乙酰胞壁酸、UDP-N-乙酰基-L-奎诺糖胺(UDP-L-QuiNAc或UDP-2-乙酰胺基-2,6-双去氧-L-葡萄糖)、GDP-L-异鼠李糖、CMP-N-乙酰基神经氨酸(CMP-Neu5Ac)、CMP-N-乙醇酰神经氨酸(CMP-Neu5Gc)、CMP-Neu4Ac、CMP-Neu5Ac9N3、CMP-Neu4,5Ac2、CMP-Neu5,7Ac2、CMP-Neu5,9Ac2、CMP-Neu5,7(8,9)Ac2、UDP-葡萄糖醛酸盐、UDP-半乳糖醛酸盐、GDP-鼠李糖及UDP-木糖。
67.如权利要求56至66中任一项所述的细胞,其中所述核苷酸-糖为UDP-半乳糖,且所述糖基转移酶为N-乙酰葡萄糖胺b-1,3-半乳糖基转移酶或N-乙酰葡萄糖胺b-1,4-半乳糖基转移酶。
68.如权利要求56至67中任一项所述的细胞,其中寡糖在所述还原端具有乳-N-双糖(Gal-b1,3-GlcNAc)或N-乙酰乳糖胺(Gal-b1,4-GlcNAc)。
69.如权利要求56至68中任一项所述的细胞,其中所述N-乙酰葡萄糖胺b-1,3-半乳糖基转移酶为糖基转移酶,其具有:
c.PFAM域PF00535,且
viii.包括SEQ ID NO 01的序列[AGPS]XXLN(Xn)RXDXD,其中X是任何氨基酸,其中n为12至17,或
ix.包括SEQ ID NO 02的序列PXXLN(Xn)RXDXD(Xm)[FWY]XX[HKR]XX[NQST],其中X是任何氨基酸,其中n是12至17且m是100至115,或
x.包括根据SEQ ID NO:03、04、05、06、07或08中的任一,优选为SEQ ID NO 03、04、05、06或07中的任一,更优选为SEQ ID NO 03、06或07中的任一,最优选为SEQ ID NO 03或06中的任一的多肽序列,或
xi.为SEQ ID NO:03、04、05、06、07或08中的任一,优选为SEQ ID NO 03、04、05、06或07中的任一,更优选为SEQ ID NO 03、06或07中的任一,最优选为SEQ ID NO 03或06中的任一的功能性同源物、变体或衍生物,其具有与SEQ ID NO:03、04、05、06、07或08中的任一,优选为SEQ ID NO 03、04、05、06或07中的任一,更优选为SEQ ID NO 03、06或07中的任一,最优选为SEQ ID NO 03或06中的任一的所述N-乙酰葡萄糖胺b-1,3-半乳糖基转移酶多肽全长的至少80%整体序列同一性且具有N-乙酰葡萄糖胺b-1,3-半乳糖基转移酶活性,或
xii.包括来自SEQ ID NO:03、04、05、06、07或08中的任一,优选为SEQ ID NO 03、04、05、06或07中的任一,更优选为SEQ ID NO 03、06或07中的任一,最优选为SEQ ID NO 03或06中的任一的至少8、9、10、11、12、13、14、15、16、17、18、19、20个连续氨基酸残基的寡肽序列,且具有N-乙酰葡萄糖胺b-1,3-半乳糖基转移酶活性,或
xiii.为SEQ ID NO:03、04、05、06、07或08中的任一,优选为SEQ ID NO 03、04、05、06或07中的任一,更优选为SEQ ID NO 03、06或07中的任一,最优选为SEQ ID NO 03或06中的任一的功能片段,且具有N-乙酰葡萄糖胺b-1,3-半乳糖基转移酶活性,或
xiv.包括多肽,所述多肽包括或由具有与SEQ ID NO:03、04、05、06、07或08中的任一,优选为SEQ ID NO 03、04、05、06或07中的任一,更优选为SEQ ID NO 03、06或07中的任一,最优选为SEQ ID NO 03或06中的任一的全长氨基酸序列的至少80%序列同一性的氨基酸序列所组成,且具有N-乙酰葡萄糖胺b-1,3-半乳糖基转移酶活性,或者
d.PFAM域IPR002659,且
vii.包括SEQ ID NO 09的序列KT(Xn)[FY]XXKXDXD(Xm)[FHY]XXG(X,无A、G、S)(Xp)X(无F、H、W、Y)[DE]D[ILV]XX[AG],其中X是任何氨基酸,其中n是13至16,m是35至70,且p是20至45,或
viii.包括SEQ ID NO:10、11、12或13中的任一的多肽序列,或
ix.为SEQ ID NO:10、11、12或13中的任一的功能性同源物、变体或衍生物,其具有与SEQ ID NO:10、11、12或13的所述N-乙酰葡萄糖胺b-1,3-半乳糖基转移酶多肽中的任一全长的至少80%整体序列同一性,且具有N-乙酰葡萄糖胺b-1,3-半乳糖基转移酶活性,或
x.包括来自SEQ ID NO:10、11、12或13中的任一的至少8、9、10、11、12、13、14、15、16、17、18、19、20个连续氨基酸残基的寡肽序列,且具有N-乙酰葡萄糖胺b-1,3-半乳糖基转移酶活性,或
xi.为SEQ ID NO:10、11、12或13中的任一的功能片段,且具有N-乙酰葡萄糖胺b-1,3-半乳糖基转移酶活性,或
xii.包括多肽,所述多肽包括或由具有与SEQ ID NO:10、11、12或13中的任一的全长氨基酸序列的至少80%序列同一性的氨基酸序列所组成,且具有N-乙酰葡萄糖胺b-1,3-半乳糖基转移酶活性。
70.如权利要求56至69中任一项所述的细胞,其中所述N-乙酰葡萄糖胺b-1,4-半乳糖基转移酶为糖基转移酶,其具有:
a.PFAM域PF01755,且
vii.包括SEQ ID NO 14的序列EXXCXXSHXX[ILV][FWY](Xn)EDD(Xm)[ACGST]XXYX[ILMV],其中X是任何氨基酸,其中n为13至15且m是50至76,或
viii.包括根据SEQ ID NO:15、16、17、18、19、20、21、22或23中的任一,优选为SEQ IDNO:15、16、17、18、20或21中的任一,更优选为SEQ ID NO:17、18、20或21中的任一的多肽序列,或
ix.为SEQ ID NO:15、16、17、18、19、20、21、22或23中的任一,优选为SEQ ID NO:15、16、17、18、20或21中的任一,更优选为SEQ ID NO:17、18、20或21中的任一的功能性同源物、变体或衍生物,其具有与SEQ ID NO:15、16、17、18、19、20、21、22或23中的任一,优选为SEQ IDNO:15、16、17、18、20或21中的任一,更优选为SEQ ID NO:17、18、20或21中的任一的所述N-乙酰葡萄糖胺b-1,4-半乳糖基转移酶多肽全长的至少80%整体序列同一性且具有N-乙酰葡萄糖胺b-1,4-半乳糖基转移酶活性,或
x.包括来自SEQ ID NO:15、16、17、18、19、20、21、22或23中的任一,优选为SEQ ID NO:15、16、17、18、20或21中的任一,更优选为SEQ ID NO:17、18、20或21中的任一的至少8、9、10、11、12、13、14、15、16、17、18、19、20个连续氨基酸残基的寡肽序列,且具有N-乙酰葡萄糖胺b-1,4-半乳糖基转移酶活性,或
xi.为SEQ ID NO:15、16、17、18、19、20、21、22或23中的任一,优选为SEQ ID NO:15、16、17、18、20或21中的任一,更优选为SEQ ID NO:17、18、20或21中的任一的功能片段,且具有N-乙酰葡萄糖胺b-1,4-半乳糖基转移酶活性,或
xii.包括多肽,所述多肽包括或由具有与SEQ ID NO:15、16、17、18、19、20、21、22或23中的任一,优选为SEQ ID NO:15、16、17、18、20或21中的任一,更优选为SEQ ID NO:17、18、20或21中的任一的全长氨基酸序列的至少80%序列同一性的氨基酸序列所组成,且具有N-乙酰葡萄糖胺b-1,4-半乳糖基转移酶活性,或者
b.PFAM域PF00535,且
viii.包括SEQ ID NO 24的序列R[KN]XXXXXXXGXXXX[FL]XDXD(Xn)[FHW]XXX[FHNY](Xm)E[DE],其中X是任何氨基酸,其中n是50至75,m是10至30,或
ix.包括SEQ ID NO 25的序列R[KN]XXXXXXXGXXXXFXDXD(Xn)[FHW]XXX[FHNY](Xm)E[DE](Xp)[FWY]XX[HKR]XX[NQST],其中X是任何氨基酸,其中n是50至75,m是10至30,且p是20至25,或
x.包括根据SEQ ID NO:26、27或28中的任一的多肽序列,或
xi.为SEQ ID NO:26、27或28中的任一的功能性同源物、变体或衍生物,其具有与SEQID NO:26、27或28的所述N-乙酰葡萄糖胺b-1,4-半乳糖基转移酶多肽中的任一全长的至少80%整体序列同一性,且具有N-乙酰葡萄糖胺b-1,4-半乳糖基转移酶活性,或
xii.包括来自SEQ ID NO:26、27或28中的任一的至少8、9、10、11、12、13、14、15、16、17、18、19、20个连续氨基酸残基的寡肽序列,且具有N-乙酰葡萄糖胺b-1,4-半乳糖基转移酶活性,或
xiii.为SEQ ID NO:26、27或28中的任一的功能片段,且具有N-乙酰葡萄糖胺b-1,4-半乳糖基转移酶活性,
xiv.包括多肽,所述多肽包括或由具有与SEQ ID NO:26、27或28中的任一的全长氨基酸序列的至少80%序列同一性的氨基酸序列所组成,且具有N-乙酰葡萄糖胺b-1,4-半乳糖基转移酶活性,或者
c.PFAM域PF02709且不具有PFAM域PF00535,且
viii.包括SEQ ID NO 29的序列[FWY]XX[FY][FWY](X23)[FWY][GQ]X[DE]D,其中X是任何氨基酸,或
ix.包括SEQ ID NO 30的序列[PV]W[GHNP](Xn)[FWY][GQ]X[DE]D,其中X是任何氨基酸,其中n是21至24,或
x.包括SEQ ID NO:31、32、33、34、35或36中的任一的多肽序列,或
xi.为SEQ ID NO:31、32、33、34、35或36中的任一的功能性同源物、变体或衍生物,其具有与SEQ ID NO:31、32、33、34、35或36的所述N-乙酰葡萄糖胺b-1,4-半乳糖基转移酶多肽中的任一全长的至少80%整体序列同一性,且具有N-乙酰葡萄糖胺b-1,4-半乳糖基转移酶活性,或
xii.包括来自SEQ ID NO:31、32、33、34、35或36中的任一的至少8、9、10、11、12、13、14、15、16、17、18、19、20个连续氨基酸残基的寡肽序列,且具有N-乙酰葡萄糖胺b-1,4-半乳糖基转移酶活性,或
xiii.为SEQ ID NO:31、32、33、34、35或36中的任一的功能片段,且具有N-乙酰葡萄糖胺b-1,4-半乳糖基转移酶活性,或
xiv.包括多肽,所述多肽包括或由具有与SEQ ID NO:31、32、33、34、35或36中的任一的全长氨基酸序列的至少80%序列同一性的氨基酸序列所组成,且具有N-乙酰葡萄糖胺b-1,4-半乳糖基转移酶活性,或者
d.PFAM域PF03808,且
viii.包括SEQ ID NO 37的序列[ST][FHY]XN(Xn)DG(X16)[HKR]X[ST]FDXX[ST]XA,其中X是任何氨基酸,且其中n是20至25,或
ix.包括SEQ ID NO 38的序列[ST][FHY]XN(Xn)DG(X16)[HKR]X[ST]FDXX[ST]XA(Xm)[HR]XG[FWY](Xp)GXGXXXQ[DE],其中X是任何氨基酸,其中n是20至25,m是40至50,且p是22至30,或
x.包括根据SEQ ID NO:39、40或41中的任一的多肽序列,或
xi.为SEQ ID NO:39、40或41中的任一的功能性同源物、变体或衍生物,其具有与SEQID NO:39、40或41的所述N-乙酰葡萄糖胺b-1,4-半乳糖基转移酶多肽中的任一全长的至少80%整体序列同一性,且具有N-乙酰葡萄糖胺b-1,4-半乳糖基转移酶活性,或
xii.包括来自SEQ ID NO:39、40或41中的任一的至少8、9、10、11、12、13、14、15、16、17、18、19、20个连续氨基酸残基的寡肽序列,且具有N-乙酰葡萄糖胺b-1,4-半乳糖基转移酶活性,或
xiii.为SEQ ID NO:39、40或41中的任一的功能片段,且具有N-乙酰葡萄糖胺b-1,4-半乳糖基转移酶活性,或
xiv.包括多肽,所述多肽包括或由具有与SEQ ID NO:39、40或41中的任一的全长氨基酸序列的至少80%序列同一性的氨基酸序列所组成,且具有N-乙酰葡萄糖胺b-1,4-半乳糖基转移酶活性。
71.如权利要求56至70中任一项所述的细胞,其中
c.所述N-乙酰葡萄糖胺-6-磷酸转移酶为包括UniProt ID P43577的多肽的多肽序列、或为UniProt ID P43577的多肽的功能性同源物、变体或衍生物,其具有与UniProt IDP43577的多肽全长的至少80%整体序列同一性,且具有N-乙酰葡萄糖胺-6-磷酸转移酶活性,以及
d.所述L-谷氨酰胺—D-果糖-6-磷酸转氨酶为包括UniProt ID P17169的多肽的多肽序列、或为UniProtID P17169的多肽的功能性同源物、变体或衍生物,其具有与UniProtIDP17169的多肽全长的至少80%整体序列同一性,且具有L-谷氨酰胺—D-果糖-6-磷酸转氨酶活性;或为与UniProt ID P17169多肽不同的A39T、R250C和G472S突变的修饰版本。
72.如权利要求56至71中任一项所述的细胞,其中所述细胞可代谢碳源,所述碳源选自包含下列列举的群组:葡萄糖、果糖、半乳糖、乳糖、蔗糖、麦芽糖、麦芽-寡糖、麦芽三糖、山梨醇、木糖、鼠李糖、甘露糖、甲醇、乙醇、阿拉伯糖、海藻糖、淀粉、纤维素、半纤维素、玉米浸液、高果糖浆、糖蜜、甘油、乙酸盐、柠檬酸盐、乳酸、丙酮酸。
73.如权利要求56至72中任一项所述的细胞,其中所述细胞无法将N-乙酰葡萄糖胺-6-磷酸盐转换成葡萄糖胺-6-磷酸盐,及/或无法将葡萄糖胺-6-磷酸盐转换成果糖-6-磷酸盐。
74.如权利要求56至73中任一项所述的细胞,其中所述细胞经修饰以产生GDP-岩藻糖。
75.如权利要求56至74中任一项所述的细胞,其中所述细胞经修饰以促进GDP-岩藻糖产生,且所述修饰选择自包含下列列举的群组:UDP-葡萄糖:十一异戊二烯-磷酸葡萄糖-1-磷酸转移酶编码基因的剃除、GDP-L-岩藻糖合成酶编码基因的过度表达、GDP-甘露糖4,6-脱水酶编码基因的过度表达、甘露糖-1-磷酸盐鸟苷酸转移酶编码基因的过度表达、磷酸甘露糖变位酶编码基因的过度表达、或甘露糖-6-磷酸盐异构酶编码基因的过度表达。
76.如权利要求56至75中任一项所述的细胞,其中所述细胞经修饰以产生UDP-半乳糖。
77.如权利要求56至76中任一项所述的细胞,其中所述细胞经修饰以促进UDP-半乳糖产生,且所述修饰选择自包含下列列举的群组:5’-核苷酸酶/UDP-糖水解酶编码基因的剃除或半乳糖-1-磷酸盐尿苷酰转移酶编码基因的剃除。
78.如权利要求56至75中任一项所述的细胞,其中所述细胞经修饰以产生CMP-N-乙酰基神经氨酸。
79.如权利要求56至78中任一项所述的细胞,其中所述细胞经修饰以促进CMP-N-乙酰基神经氨酸产生,且所述修饰选择自包含下列列举的群组:CMP-唾液酸合成酶编码基因的过度表达、唾液酸合成酶编码基因的过度表达、N-乙酰基-D-葡萄糖胺2-表异构酶编码基因的过度表达。
80.如权利要求56至79中任一项所述的细胞,其中所述细胞能够表达至少一其他糖基转移酶,且所述其他糖基转移酶选自包括下列的群组:岩藻糖基转移酶、唾液酸转移酶、半乳糖基转移酶、葡萄糖基转移酶、甘露糖基转移酶、N-乙酰基葡糖胺转移酶、N-乙酰基半乳糖胺转移酶、N-乙酰基甘露糖胺转移酶、木糖基转移酶、葡萄糖醛酸苷转移酶、半乳糖醛酸转移酶、葡萄糖胺转移酶、N-乙醇酰神经胺转移酶、鼠李糖基转移酶、N-乙酰基鼠李糖基转移酶、UDP-4-氨基-4,6-双去氧-N-乙酰基-β-L-阿卓糖胺转氨酶、UDP-N-乙酰葡萄糖胺烯醇丙酮基转移酶和岩藻糖胺基转移酶,
-优选地,所述岩藻糖基转移酶选自包括下列列举:α-1,2-岩藻糖基转移酶、α-1,3-岩藻糖基转移酶、α-1,4-岩藻糖基转移酶及α-1,6-岩藻糖基转移酶,
-优选地,所述唾液酸转移酶选自包括下列列举:α-2,3-唾液酸转移酶、α-2,6-唾液酸转移酶及α-2,8-唾液酸转移酶,
-优选地,所述半乳糖基转移酶选自包括下列列举:β-1,3-半乳糖基转移酶、N-乙酰葡萄糖胺β-1,3-半乳糖基转移酶、β-1,4-半乳糖基转移酶、N-乙酰葡萄糖胺β-1,4-半乳糖基转移酶、α-1,3-半乳糖基转移酶及α-1,4-半乳糖基转移酶,
-优选地,所述葡萄糖基转移酶选自包括下列列举:α-葡萄糖基转移酶、β-1,2-葡萄糖基转移酶、β-1,3-葡萄糖基转移酶及β-1,4-葡萄糖基转移酶,
-优选地,所述甘露糖基转移酶选自包括下列列举:α-1,2-甘露糖基转移酶、α-1,3-甘露糖基转移酶及α-1,6-甘露糖基转移酶,
-优选地,所述N-乙酰基葡糖胺转移酶选自包括下列列举:β-1,3-N-乙酰基葡糖胺转移酶及β-1,6-N-乙酰基葡糖胺转移酶,
-优选地,所述N-乙酰基半乳糖胺转移酶为α-1,3-N-乙酰基半乳糖胺转移酶。
81.如权利要求80所述的细胞,其中所述细胞在所述其他糖基转移酶的表达或活性方面被修饰。
82.如权利要求56至81中任一项所述的细胞,其中所述细胞使用用于产生所述在还原端具有GlcNAc单元的双糖或寡糖的一或多种前驱物,所述前驱物从培养基供给所述细胞。
83.如权利要求56至82中任一项所述的细胞,其中所述细胞产生一或多种前驱物,其用于产生所述在还原端具有GlcNAc单元的双糖或寡糖。
84.如权利要求82或83中任一项所述的细胞,其中用于产生所述双糖或寡糖的前驱物完全转化为还原端具有GlcNAc单元的双糖或寡糖。
85.如权利要求56至84中任一项所述的细胞,其中所述细胞在细胞内产生还原端具有GlcNAc单元的双糖或寡糖,且其中部分或实质上全部的所产生的还原端具有GlcNAc单元的双糖或寡糖保留在细胞内及/或经由被动或主动运输排出细胞外。
86.如权利要求56至85中任一项所述的细胞,其中所述细胞表达膜转运蛋白或具有转运活性的多肽,以转运化合物穿过细胞壁的外膜,
优选地,所述细胞在所述膜转运蛋白或具有转运活性的多肽的表达或活性方面被修饰。
87.如权利要求86所述的细胞,其中所述膜转运蛋白或具有转运活性的多肽选自包括下列列举:运输蛋白、P-P-键-水解-驱动的转运体、β-桶状孔蛋白、辅助转运蛋白、推定转运蛋白及磷酸转移-驱动组转位蛋白,
优选地,所述运输蛋白包括MFS转运体、糖排出转运体及螯铁蛋白输出体,
优选地,所述P-P-键-水解-驱动的转运体包括ABC转运体及螯铁蛋白输出体。
88.如权利要求86或87中任一项所述的细胞,其中所述膜转运蛋白或具有转运活性的多肽控制所述还原端具有GlcNAc单元的双糖或寡糖及/或一或多种前驱物及/或接受者在细胞壁外膜上的流动,所述一或多种前驱物及/或接受者用于产生所述还原端具有GlcNAc单元的双糖或寡糖。
89.如权利要求86至88中任一项所述的细胞,其中所述膜转运蛋白或具有转运活性的多肽提供所述还原端具有GlcNAc单元的双糖或寡糖的改善产生及/或允许排出及/或促进排出。
90.如权利要求56至89中任一项所述的细胞,其中所述细胞包括与未修饰的先驱细胞相比,用于降低乙酸盐产生的修饰。
91.如权利要求90所述的细胞,其中所述细胞包括与未修饰的先驱细胞相比,任一或多种蛋白质的较低或减少的表达及/或消除、受损、降低或延迟的活性,所述蛋白质包含:β-半乳糖苷酶、半乳糖苷O-乙酰转移酶、N-乙酰葡萄糖胺-6-磷酸盐去乙酰酶、葡萄糖胺-6-磷酸盐脱胺酶、N-乙酰葡萄糖胺抑制蛋白、核糖核苷酸单磷酸酶、EIICBA-Nag、UDP-葡萄糖:十一异戊二烯-磷酸葡萄糖-1-磷酸转移酶、L-岩藻酮糖激酶、L-岩藻糖异构酶、N-乙酰神经氨酸解离酶、N-乙酰甘露糖胺激酶、N-乙酰甘露糖胺-6-磷酸盐2-表异构酶、EIIAB-Man、EIIC-Man、EIID-Man、ushA、半乳糖-1-磷酸盐尿苷酰转移酶、葡萄糖-1-磷酸盐腺苷酰转移酶、葡萄糖-1-磷酸酶、ATP-依赖性6-磷酸果糖激酶同功酶1、ATP-依赖性6-磷酸果糖激酶同功酶2、葡萄糖-6-磷酸盐异构酶、有氧呼吸调控蛋白、转录抑制蛋白IclR、lon蛋白酶、葡萄糖特异性转位磷酸转移酶酶IIBC成分ptsG、葡萄糖特异性转位磷酸转移酶(PTS)酶IIBC成分malX、enzyme IIAGlc、β-葡萄糖苷特异性PTS酶II、果糖特异性PTS多磷酰转移蛋白FruA及FruB、乙醇脱氢酶醛脱氢酶、丙酮酸-甲酸盐解离酶、乙酸盐激酶、磷酰基转移酶、磷酸乙酰转移酶、丙酮酸去羧酶。
92.如权利要求56至91中任一项所述的细胞,其中所述细胞能够产生磷酸烯醇丙酮酸(PEP)。
93.如权利要求56至92中任一项所述的细胞,其中所述细胞与未修饰的先驱细胞相比,具有用于磷酸烯醇丙酮酸(PEP)的促进产生及/或供应的修饰。
94.如权利要求56至93中任一项所述的细胞,其中所述细胞包含至少部分失活的所选单糖、双糖或寡糖的分解代谢途径,所述单糖、双糖或寡糖参与所述还原端具有GlcNAc单元的双糖或寡糖的产生及/或为产生所述还原端具有GlcNAc单元的双糖或寡糖所需。
95.如权利要求56至94中任一项所述的细胞,其中当所述细胞在乳糖与一或多种其他碳源结合的环境中生长时,所述细胞抵抗乳糖杀伤现象。
96.如权利要求56至95中任一项所述的细胞,其中所述细胞在整个培养液及/或上清液产生90g/L或多于90g/L的所述还原端具有GlcNAc的双糖或寡糖、及/或其中在整个培养液及/或上清液中的所述还原端具有GlcNAc的双糖或寡糖具有至少80%的纯度,其在整个培养液及/或上清液中分别以所述还原端具有GlcNAc单元的双糖或寡糖及其前驱物的总量计。
97.如权利要求56至96中任一项所述的细胞,其中所述细胞产生带电的混合物,所述混合物为包含至少一种还原端具有GlcNAc单元的双糖或寡糖,优选为唾液酸化的双糖及/或寡糖及/或中性的双糖及/或寡糖。
98.如权利要求56至97中任一项所述的细胞,其中所述细胞产生带电的混合物,所述混合物为包含至少还原端具有GlcNAc单元的寡糖,优选为唾液酸化的寡糖及/或中性的寡糖。
99.如权利要求56至98中任一项所述的细胞,其中所述寡糖选自包括下列的列举:2-岩藻糖基乳-N-双糖、4-岩藻糖基乳-N-双糖、2-4-二岩藻糖基乳-N-双糖、3’-唾液酸乳-N-双糖、6’-唾液酸乳-N-双糖、3’,6’-二唾液酸乳-N-双糖、6,6’-二唾液酸乳-N-双糖、2’-岩藻糖基-3’-唾液酸乳-N-双糖、2’-岩藻糖基-6’-唾液酸乳-N-双糖、4-岩藻糖基-3’-唾液酸乳-N-双糖、4-岩藻糖基-6’-唾液酸乳-N-双糖、2-岩藻糖基N-乙酰乳糖胺、3’-岩藻糖基N-乙酰乳糖胺、2,3’-二岩藻糖基N-乙酰乳糖胺、3’-唾液酸N-乙酰乳糖胺、6’-唾液酸N-乙酰乳糖胺、3’,6’-二唾液酸N-乙酰乳糖胺、6,6’-二唾液酸N-乙酰乳糖胺、2’-岩藻糖基-3’-唾液酸N-乙酰乳糖胺、2’-岩藻糖基-6’-唾液酸N-乙酰乳糖胺、3-岩藻糖基-3’-唾液酸N-乙酰乳糖胺、3’-岩藻糖基-6’-唾液酸N-乙酰乳糖胺、P1三糖(Gal-a1,4-Gal-b1,4-GlcNAc)、异源移植抗原决定位(Gal-a1,3-Gal-b1,4-GlcNAc)、Gal-b14-(Galb13)-GlcNAc、聚-N-乙酰乳糖胺、GalNAc-b1,3-Gal-b1,4-GlcNAc。
100.如权利要求56或58至99中任一项所述的细胞,其中所述还原端具有GlcNAc单元的双糖不包括几丁二糖(GlcNAc-GlcNAc)。
101.如权利要求56至100中任一项所述的细胞,其中所述还原端具有GlcNAc单元的寡糖在还原端不包括几丁二糖,优选为不包括N-聚糖。
102.如权利要求56至101中任一项所述的细胞或如权利要求1至55中任一项所述的方法,其中所述细胞为细菌、真菌、酵母菌、植物细胞、动物细胞或原生动物细胞,
-优选地,所述细菌为大肠杆菌菌株,更优选为大肠杆菌菌株K12菌株,又更优选地,所述大肠杆菌菌株K12菌株为大肠杆菌MG1655,
-优选地,所述真菌属于选自包括黑霉菌属、网柱黏菌属、青霉菌属、白霉菌属或曲菌属的群组的属,
-优选地,所述酵母菌属于选自包括酵母属、接合酵母菌属、毕赤酵母菌属、克马格特勒酵母、汉逊氏酵母菌属、子囊菌酵母属、拟球酵母菌属、克鲁维酵母菌属或德巴利酵母菌属的群组的属,
-优选地,所述植物细胞为藻细胞或衍生自烟草、苜蓿、稻米、番茄、棉花、油菜籽、大豆、玉米或谷类植物,
-优选地,所述动物细胞衍生自非人类哺乳动物、鸟类、鱼类、无脊椎动物、爬虫类、两栖类或昆虫类、或为衍生自排除胚胎干细胞的人类细胞的基因改造细胞株,更优选地,所述人类及非人类哺乳动物细胞为上皮细胞、胚胎肾细胞、纤维母细胞、COS细胞、中国仓鼠卵巢(CHO)细胞、鼠骨髓瘤细胞、NIH-3T3细胞、非乳腺成体干细胞或其衍生物,更优选地,所述昆虫细胞衍生自秋行军虫、蚕、甘蓝夜蛾、粉纹夜蛾或黑腹果蝇,
-优选地,所述原生动物细胞为狼蛛利什曼原虫细胞。
103.如权利要求102所述的细胞或如权利要求102所述的方法,其中所述细胞为活的革兰氏阴性菌,其包含与未修饰的先驱细胞相比,降低或消除聚-N-乙酰-葡萄糖胺(PNAG)、肠细菌共同抗原(ECA)、纤维素、可拉酸、核心寡糖、渗压调节间质葡聚糖(OPG)、葡萄糖基甘油、聚糖及/或海藻糖的合成。
104.如权利要求1至55、102或103中任一项所述的方法,其中所述分离包括下列列举的至少一种:澄清、超微过滤、纳米过滤、两相分配、逆渗透、微过滤、活性炭或碳处理、非离子界面活性剂处理、酶消化、切向流高性能过滤、切向流超微过滤、亲和色谱、离子交换色谱、疏水交互作用色谱及/或凝胶过滤、配体交换色谱。
105.如权利要求1至55、102至104中任一项所述的方法,其更包括自所述细胞纯化所述双糖或寡糖。
106.如权利要求1至55、102至105中任一项所述的方法,其中所述纯化包括下列步骤的至少一种:活性炭或碳的使用、炭的使用、纳米过滤、超微过滤、电泳、酶处理或离子交换、醇类的使用、含水的醇类混合物的使用、结晶、蒸发、沉淀、干燥、喷雾干燥、冻干、喷雾冷冻干燥、冷冻喷雾干燥、带式干燥、传送带干燥、真空带式干燥、真空传送带干燥、转筒干燥、滚筒干燥、真空转筒干燥或真空滚筒干燥。
107.一种如权利要求56至103中任一项所述的细胞、或如权利要求1至55、102至106中任一项所述的方法用于产生还原端具有N-乙酰葡萄糖胺单元的双糖或寡糖的用途。
108.一种如权利要求56、58至103中任一项所述的细胞、或如权利要求1、3至55、102至106中任一项所述的方法用于产生还原端具有N-乙酰葡萄糖胺单元的寡糖,优选为用于产生还原端具有N-乙酰葡萄糖胺单元的带电或中性寡糖,更优选为用于产生唾液酸化或岩藻糖基化形式的LNB或LacNAc的用途。
CN202180055890.4A 2020-08-10 2021-08-10 在细胞中的含有GlcNAc的生物产品的产生 Pending CN116249781A (zh)

Applications Claiming Priority (27)

Application Number Priority Date Filing Date Title
EP20190207.9 2020-08-10
EP20190204.6 2020-08-10
EP20190208.7 2020-08-10
EP20190198 2020-08-10
EP20190207 2020-08-10
EP20190203.8A EP3954778B1 (en) 2020-08-10 2020-08-10 Production of a mixture of neutral non-fucosylated oligosaccharides by a cell
EP20190198.0 2020-08-10
EP20190205.3A EP3954769A1 (en) 2020-08-10 2020-08-10 Production of oligosaccharide mixtures by a cell
EP20190203.8 2020-08-10
EP20190202 2020-08-10
EP20190200.4 2020-08-10
EP20190204 2020-08-10
EP20190201.2 2020-08-10
EP20190206.1 2020-08-10
EP20190208 2020-08-10
EP20190200 2020-08-10
EP20190202.0 2020-08-10
EP20190201 2020-08-10
EP20190205.3 2020-08-10
EP20190206 2020-08-10
EP21168997.1 2021-04-16
EP21168997 2021-04-16
EP21186203 2021-07-16
EP21186202 2021-07-16
EP21186202.4 2021-07-16
EP21186203.2 2021-07-16
PCT/EP2021/072269 WO2022034075A1 (en) 2020-08-10 2021-08-10 Production of glcnac containing bioproducts in a cell

Publications (1)

Publication Number Publication Date
CN116249781A true CN116249781A (zh) 2023-06-09

Family

ID=80246994

Family Applications (7)

Application Number Title Priority Date Filing Date
CN202180056272.1A Pending CN116261597A (zh) 2020-08-10 2021-08-10 α-1,3糖基化形式的Fuc-a1,2-Gal-R的产生
CN202180056014.3A Pending CN116096911A (zh) 2020-08-10 2021-08-10 借由细胞制造寡糖混合物
CN202180056310.3A Pending CN116096912A (zh) 2020-08-10 2021-08-10 借由细胞生产中性未岩藻糖化寡糖的混合物
CN202180050133.8A Pending CN116234919A (zh) 2020-08-10 2021-08-10 借由细胞制造中性岩藻糖基化寡糖的混合物
CN202180050134.2A Pending CN116348610A (zh) 2020-08-10 2021-08-10 借由细胞生产岩藻糖化的乳糖结构
CN202180055890.4A Pending CN116249781A (zh) 2020-08-10 2021-08-10 在细胞中的含有GlcNAc的生物产品的产生
CN202180050167.7A Pending CN116323958A (zh) 2020-08-10 2021-08-10 借由细胞制造寡糖混合物

Family Applications Before (5)

Application Number Title Priority Date Filing Date
CN202180056272.1A Pending CN116261597A (zh) 2020-08-10 2021-08-10 α-1,3糖基化形式的Fuc-a1,2-Gal-R的产生
CN202180056014.3A Pending CN116096911A (zh) 2020-08-10 2021-08-10 借由细胞制造寡糖混合物
CN202180056310.3A Pending CN116096912A (zh) 2020-08-10 2021-08-10 借由细胞生产中性未岩藻糖化寡糖的混合物
CN202180050133.8A Pending CN116234919A (zh) 2020-08-10 2021-08-10 借由细胞制造中性岩藻糖基化寡糖的混合物
CN202180050134.2A Pending CN116348610A (zh) 2020-08-10 2021-08-10 借由细胞生产岩藻糖化的乳糖结构

Family Applications After (1)

Application Number Title Priority Date Filing Date
CN202180050167.7A Pending CN116323958A (zh) 2020-08-10 2021-08-10 借由细胞制造寡糖混合物

Country Status (8)

Country Link
US (6) US12077788B2 (zh)
EP (9) EP4192973A2 (zh)
KR (1) KR20230048380A (zh)
CN (7) CN116261597A (zh)
AU (1) AU2021324068A1 (zh)
BR (1) BR112023002410A2 (zh)
CA (1) CA3188909A1 (zh)
WO (10) WO2022034074A1 (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN118166010A (zh) * 2024-03-19 2024-06-11 浙江熙正霖生物科技有限公司 一种n-乙酰神经氨酸的生物合成方法

Families Citing this family (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113652385B (zh) * 2021-08-06 2023-10-03 江南大学 一种高产乳酰-n-四糖的微生物的构建方法及应用
WO2023168441A1 (en) * 2022-03-04 2023-09-07 The Regents Of The University Of California Production of milk oligosaccharides in plants
WO2023182527A1 (ja) * 2022-03-25 2023-09-28 キリンホールディングス株式会社 ラクトジフコテトラオース(ldft)の製造法
WO2023209098A1 (en) * 2022-04-29 2023-11-02 Dsm Ip Assets B.V. Hmo producing microorganism with increased robustness towards glucose gradients
DK202200561A1 (en) * 2022-06-13 2024-02-14 Dsm Ip Assets Bv Sigma factor modifications for biosynthetic production
DK202200588A1 (en) 2022-06-20 2024-02-23 Dsm Ip Assets Bv Mixture of fucosylated HMOs
WO2024003223A1 (en) 2022-06-29 2024-01-04 Inbiose N.V. Fucosylated saccharide for use in the prevention or treatment of parasitic disease
WO2024003222A1 (en) 2022-06-29 2024-01-04 Inbiose N.V. Fucosylated saccharide for use in the prevention or treatment of bacterial disease
WO2024017987A1 (en) 2022-07-20 2024-01-25 Inbiose N.V. Production of oligosaccharides in host cells
WO2024047096A1 (en) 2022-08-30 2024-03-07 Inbiose N.V. Process for purification of an oligosaccharide
WO2024050533A2 (en) * 2022-09-02 2024-03-07 Arzeda Corp. Compositions and methods for producing rebaudioside m
WO2024089131A1 (en) 2022-10-25 2024-05-02 Inbiose N.V. Saccharide importers for lacto-n-triose
DK202201117A1 (en) * 2022-12-09 2024-08-08 Dsm Ip Assets Bv Genetically modified udp-n-acetylgalactosamine producing cells
WO2024153786A1 (en) 2023-01-19 2024-07-25 Inbiose N.V. Purification of an oligosaccharide or oligosaccharide mixture from a fermentation broth
WO2024153787A1 (en) 2023-01-19 2024-07-25 Inbiose N.V. Purification of a saccharide from a fermentation broth
WO2024153788A1 (en) 2023-01-19 2024-07-25 Inbiose N.V. Purification of an oligosaccharide or oligosaccharide mixture
WO2024165524A1 (en) 2023-02-06 2024-08-15 Inbiose N.V. Production of a saccharide by a cell with reduced synthesis of lactobionic acid
WO2024165525A1 (en) 2023-02-06 2024-08-15 Inbiose N.V. Production of a saccharide, lactobionic acid and/or glycosylated forms of lactobionic acid
WO2024165611A1 (en) 2023-02-07 2024-08-15 Inbiose N.V. Production of a disaccharide and/or milk oligosaccharide by a cell with reduced synthesis of udp-glcnac
CN118047820B (zh) * 2024-04-16 2024-07-19 北京三元食品股份有限公司 一种3-岩藻糖基乳糖的制备方法及制备的标准品

Family Cites Families (38)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO1991016449A1 (en) * 1990-04-16 1991-10-31 The Trustees Of The University Of Pennsylvania Saccharide compositions, methods and apparatus for their synthesis
ES2129458T3 (es) * 1991-10-15 1999-06-16 Scripps Research Inst Produccion de carbohidratos fucosilados por sintesis con fucosilacion enzimatica de nucleotidos de azucares y regeneracion in situ de gdp-fucosa.
JP2002530087A (ja) * 1998-11-18 2002-09-17 ネオーズ テクノロジーズ, インコーポレイテッド オリゴ糖の安価な産生
FR2796082B1 (fr) * 1999-07-07 2003-06-27 Centre Nat Rech Scient Procede de production d'oligosaccharides
CN101365785A (zh) 2002-07-01 2009-02-11 阿基昂生命科学公司,以生物技术资源部的名义经营 用于生产葡糖胺和n-乙酰氨基葡糖的方法和物质
JP4264742B2 (ja) 2004-06-03 2009-05-20 独立行政法人農業・食品産業技術総合研究機構 ラクトnビオースホスホリラーゼ遺伝子、該遺伝子を含む組換えベクター及び該ベクターを含む形質転換体
WO2006034225A2 (en) * 2004-09-17 2006-03-30 Neose Technologies, Inc. Production of oligosaccharides by microorganisms
WO2007101862A1 (en) * 2006-03-09 2007-09-13 Centre National De La Recherche Scientifique (Cnrs) Method of producing sialylated oligosaccharides
WO2008033520A2 (en) 2006-09-15 2008-03-20 The Regents Of The University Of California Bifidobacterial gene sequences and their use
JP4915917B2 (ja) 2006-12-22 2012-04-11 独立行政法人農業・食品産業技術総合研究機構 ラクト−n−ビオースi及びガラクト−n−ビオースの製造方法
CA2773240C (en) 2009-09-22 2015-11-10 Volker Sandig Process for producing molecules containing specialized glycan structures
EP4242320A3 (en) 2010-07-12 2023-11-29 Inbiose N.V. Metabolically engineered organisms for the production of added value bio-products
US9234225B2 (en) 2011-05-13 2016-01-12 Glycom A/S Method for generating human milk oligosaccharides (HMOs) or precursors thereof
PL2722394T3 (pl) * 2011-06-07 2018-09-28 Hero Ag Otrzymywanie oligosacharydów za pomocą procesu biotechnologicznego
JP5800741B2 (ja) 2012-03-27 2015-10-28 森永乳業株式会社 ラクト−n−ビオースiの製造方法
US9029136B2 (en) 2012-07-25 2015-05-12 Glycosyn LLC Alpha (1,2) fucosyltransferases suitable for use in the production of fucosylated oligosaccharides
DK3467100T3 (da) * 2013-03-14 2022-11-14 Glycosyn LLC Mikroorganismer og fremgangsmåder til fremstilling af sialylerede og n-acetylglucosamin-holdige oligosaccharider
SG10201707565WA (en) 2013-03-14 2017-10-30 Glycobia Inc Oligosaccharide compositions, glycoproteins and methods to produce the same in prokaryotes
SG10201707607PA (en) * 2013-03-15 2017-10-30 Glycobia Inc Polysialic acid, blood group antigens and glycoprotein expression
ES2715010T3 (es) * 2014-03-31 2019-05-31 Jennewein Biotechnologie Gmbh Fermentación total de oligosacáridos
SG10202010599TA (en) * 2014-05-15 2020-11-27 Glycosyn LLC Alpha (1,2) fucosyltransferase syngenes for use in the production of fucosylated oligosaccharides
US10731193B2 (en) * 2014-06-27 2020-08-04 Glycom A/S Oligosaccharide production
US10307474B2 (en) 2014-08-08 2019-06-04 Glaxosmithkline Biologicals S.A. Modified host cells and hybrid oligosaccharides for use in bioconjugate production
JP6737788B2 (ja) 2014-09-09 2020-08-12 グリコシン リミテッド ライアビリティー カンパニー フコシル化オリゴ糖の生産において使用するためのα(1,3)フコシルトランスフェラーゼ
DK3209673T4 (da) * 2014-10-24 2023-10-02 Glycom As Mixtures of human milk oligosaccharides
RU2021109889A (ru) 2014-11-14 2021-05-06 Инбиос Н.В. Мутантные микроорганизмы, устойчивые к гибели под действием лактозы
EP3230438A2 (en) 2014-12-12 2017-10-18 University of Copenhagen N-glycosylation
EP3390652A4 (en) * 2015-12-18 2019-06-12 Glycom A/S Fermentative preparation of oligosaccharides
JP6771756B2 (ja) 2016-04-26 2020-10-21 国立大学法人 和歌山大学 β−ガラクトシダーゼ
PL3315610T3 (pl) * 2016-10-29 2021-06-14 Jennewein Biotechnologie Gmbh Sposób wytwarzania fukozylowanych oligosacharydów
AU2017385601B2 (en) 2016-12-27 2022-08-25 Inbiose N.V. In vivo synthesis of sialylated compounds
EP3425052A1 (en) * 2017-07-07 2019-01-09 Jennewein Biotechnologie GmbH Fucosyltransferases and their use in producing fucosylated oligosaccharides
US20210087599A1 (en) * 2017-07-26 2021-03-25 Jennewein Biotechnologie Gmbh Sialyltransferases and their use in producing sialylated oligosaccharides
EP3569713A1 (en) * 2018-05-16 2019-11-20 Jennewein Biotechnologie GmbH Use of glycosidases in the production of oligosaccharides
EP3702468A1 (en) * 2019-03-01 2020-09-02 Jennewein Biotechnologie GmbH Fermentative production of carbohydrates by microbial cells utilizing a mixed feedstock
EP3751003A1 (en) * 2019-06-12 2020-12-16 Jennewein Biotechnologie GmbH Production of fucosylated oligosaccharides in bacillus
EP4038178A4 (en) 2019-10-03 2023-11-01 TurtleTree Labs Pte. Ltd. NUTRIENT COMPOSITIONS AND METHODS, KITS AND CELLULAR COMPOSITIONS FOR THE PRODUCTION THEREOF
CN110527704B (zh) 2019-10-31 2020-03-13 烟台华康荣赞生物科技有限公司 一种合成乳-n-二糖的方法

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN118166010A (zh) * 2024-03-19 2024-06-11 浙江熙正霖生物科技有限公司 一种n-乙酰神经氨酸的生物合成方法
CN118166010B (zh) * 2024-03-19 2024-08-30 浙江熙正霖生物科技有限公司 一种n-乙酰神经氨酸的生物合成方法

Also Published As

Publication number Publication date
US20230416796A1 (en) 2023-12-28
US20230279403A1 (en) 2023-09-07
EP4192971A1 (en) 2023-06-14
WO2022034071A1 (en) 2022-02-17
CA3188909A1 (en) 2022-02-17
EP4192972A1 (en) 2023-06-14
US20230287470A1 (en) 2023-09-14
WO2022034076A3 (en) 2022-04-28
WO2022034075A1 (en) 2022-02-17
KR20230048380A (ko) 2023-04-11
CN116348610A (zh) 2023-06-27
WO2022034076A2 (en) 2022-02-17
WO2022034068A1 (en) 2022-02-17
CN116261597A (zh) 2023-06-13
WO2022034074A1 (en) 2022-02-17
CN116323958A (zh) 2023-06-23
EP4192973A2 (en) 2023-06-14
WO2022034067A1 (en) 2022-02-17
US20230313253A1 (en) 2023-10-05
WO2022034073A1 (en) 2022-02-17
EP4192969A1 (en) 2023-06-14
EP4192970A1 (en) 2023-06-14
WO2022034069A1 (en) 2022-02-17
US12077788B2 (en) 2024-09-03
WO2022034070A1 (en) 2022-02-17
EP4192944A1 (en) 2023-06-14
EP4192968A1 (en) 2023-06-14
US20230265399A1 (en) 2023-08-24
AU2021324068A1 (en) 2023-03-30
CN116096912A (zh) 2023-05-09
BR112023002410A2 (pt) 2023-03-21
EP4192967A1 (en) 2023-06-14
CN116234919A (zh) 2023-06-06
CN116096911A (zh) 2023-05-09
EP4192974A1 (en) 2023-06-14
WO2022034077A1 (en) 2022-02-17
US20240209405A1 (en) 2024-06-27

Similar Documents

Publication Publication Date Title
CN116249781A (zh) 在细胞中的含有GlcNAc的生物产品的产生
CN116323927A (zh) 双糖及/或寡糖的细胞生产
EP4192945A1 (en) Cellular production of sialylated di- and/or oligosaccharides
KR20230170961A (ko) 시알릴화 이당 및/또는 올리고당의 세포 생산
TW202219275A (zh) 在細胞中之含有GlcNAc的生物產品的產生
CN117157394A (zh) 发酵生产
CN116783291A (zh) 糖基化产物的细胞生产
CN117957316A (zh) 转化乳糖-n-二糖的岩藻糖基转移酶
AU2022312712A1 (en) Lacto-n-biose converting fucosyltransferases
CN116472346A (zh) 借由细胞的唾液酸化寡糖混合物的生产
TW202221132A (zh) 藉由細胞生產哺乳動物乳寡醣的混合物
TW202212572A (zh) 藉由細胞製造中性岩藻糖基化寡醣之混合物
TW202221135A (zh) α-1,3醣化形式的Fuc-a1,2-Gal-R的產生

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination