CN116261597A - α-1,3糖基化形式的Fuc-a1,2-Gal-R的产生 - Google Patents

α-1,3糖基化形式的Fuc-a1,2-Gal-R的产生 Download PDF

Info

Publication number
CN116261597A
CN116261597A CN202180056272.1A CN202180056272A CN116261597A CN 116261597 A CN116261597 A CN 116261597A CN 202180056272 A CN202180056272 A CN 202180056272A CN 116261597 A CN116261597 A CN 116261597A
Authority
CN
China
Prior art keywords
gal
fuc
cell
alpha
galactose
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202180056272.1A
Other languages
English (en)
Inventor
苏菲·艾斯艾特
乔瑞·博普雷兹
彼得·考斯蒙特
托马斯·德科恩
娜乌西卡·兰诺
格特·彼得斯
克里斯托夫·范德瓦勒
安妮莉丝·维考特伦
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Inbiose NV
Original Assignee
Inbiose NV
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from EP20190205.3A external-priority patent/EP3954769A1/en
Priority claimed from EP20190203.8A external-priority patent/EP3954778B1/en
Application filed by Inbiose NV filed Critical Inbiose NV
Publication of CN116261597A publication Critical patent/CN116261597A/zh
Pending legal-status Critical Current

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P19/00Preparation of compounds containing saccharide radicals
    • C12P19/12Disaccharides
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N1/00Microorganisms, e.g. protozoa; Compositions thereof; Processes of propagating, maintaining or preserving microorganisms or compositions thereof; Processes of preparing or isolating a composition containing a microorganism; Culture media therefor
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N1/00Microorganisms, e.g. protozoa; Compositions thereof; Processes of propagating, maintaining or preserving microorganisms or compositions thereof; Processes of preparing or isolating a composition containing a microorganism; Culture media therefor
    • C12N1/20Bacteria; Culture media therefor
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N1/00Microorganisms, e.g. protozoa; Compositions thereof; Processes of propagating, maintaining or preserving microorganisms or compositions thereof; Processes of preparing or isolating a composition containing a microorganism; Culture media therefor
    • C12N1/20Bacteria; Culture media therefor
    • C12N1/205Bacterial isolates
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/52Genes encoding for enzymes or proenzymes
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/70Vectors or expression systems specially adapted for E. coli
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N5/00Undifferentiated human, animal or plant cells, e.g. cell lines; Tissues; Cultivation or maintenance thereof; Culture media therefor
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/10Transferases (2.)
    • C12N9/1025Acyltransferases (2.3)
    • C12N9/1029Acyltransferases (2.3) transferring groups other than amino-acyl groups (2.3.1)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/10Transferases (2.)
    • C12N9/1048Glycosyltransferases (2.4)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/10Transferases (2.)
    • C12N9/1048Glycosyltransferases (2.4)
    • C12N9/1051Hexosyltransferases (2.4.1)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/10Transferases (2.)
    • C12N9/1048Glycosyltransferases (2.4)
    • C12N9/1081Glycosyltransferases (2.4) transferring other glycosyl groups (2.4.99)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/10Transferases (2.)
    • C12N9/1096Transferases (2.) transferring nitrogenous groups (2.6)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P19/00Preparation of compounds containing saccharide radicals
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P19/00Preparation of compounds containing saccharide radicals
    • C12P19/18Preparation of compounds containing saccharide radicals produced by the action of a glycosyl transferase, e.g. alpha-, beta- or gamma-cyclodextrins
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P19/00Preparation of compounds containing saccharide radicals
    • C12P19/26Preparation of nitrogen-containing carbohydrates
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P7/00Preparation of oxygen-containing organic compounds
    • C12P7/40Preparation of oxygen-containing organic compounds containing a carboxyl group including Peroxycarboxylic acids
    • C12P7/58Aldonic, ketoaldonic or saccharic acids
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y203/00Acyltransferases (2.3)
    • C12Y203/01Acyltransferases (2.3) transferring groups other than amino-acyl groups (2.3.1)
    • C12Y203/01004Glucosamine-phosphate N-acetyltransferase (2.3.1.4)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y204/00Glycosyltransferases (2.4)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y204/00Glycosyltransferases (2.4)
    • C12Y204/01Hexosyltransferases (2.4.1)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y206/00Transferases transferring nitrogenous groups (2.6)
    • C12Y206/01Transaminases (2.6.1)
    • C12Y206/01016Glutamine-fructose-6-phosphate transaminase (isomerizing) (2.6.1.16), i.e. glucosamine-6-phosphate-synthase
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2500/00Specific components of cell culture medium
    • C12N2500/30Organic components
    • C12N2500/34Sugars
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y204/00Glycosyltransferases (2.4)
    • C12Y204/01Hexosyltransferases (2.4.1)
    • C12Y204/01038Beta-N-acetylglucosaminylglycopeptide beta-1,4-galactosyltransferase (2.4.1.38)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y204/00Glycosyltransferases (2.4)
    • C12Y204/99Glycosyltransferases (2.4) transferring other glycosyl groups (2.4.99)
    • C12Y204/99001Beta-galactoside alpha-2,6-sialyltransferase (2.4.99.1)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y204/00Glycosyltransferases (2.4)
    • C12Y204/99Glycosyltransferases (2.4) transferring other glycosyl groups (2.4.99)
    • C12Y204/99004Beta-galactoside alpha-2,3-sialyltransferase (2.4.99.4)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y204/00Glycosyltransferases (2.4)
    • C12Y204/99Glycosyltransferases (2.4) transferring other glycosyl groups (2.4.99)
    • C12Y204/99007Alpha-N-acetylneuraminyl-2,3-beta-galactosyl-1,3-N-acetylgalactosaminide 6-alpha-sialyltransferase (2.4.99.7)

Landscapes

  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Organic Chemistry (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Genetics & Genomics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • Biotechnology (AREA)
  • General Health & Medical Sciences (AREA)
  • Biochemistry (AREA)
  • Microbiology (AREA)
  • Biomedical Technology (AREA)
  • Molecular Biology (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • General Chemical & Material Sciences (AREA)
  • Medicinal Chemistry (AREA)
  • Biophysics (AREA)
  • Plant Pathology (AREA)
  • Physics & Mathematics (AREA)
  • Virology (AREA)
  • Tropical Medicine & Parasitology (AREA)
  • Cell Biology (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)
  • Enzymes And Modification Thereof (AREA)
  • Saccharide Compounds (AREA)

Abstract

α‑1,3糖基化形式的Fuc‑a1,2‑Gal‑R的产生。本发明系于合成生物学与代谢工程技术领域中。更特别的,本发明系于代谢工程化细胞的培养或发酵的技术领域中。本发明描述了代谢工程化细胞,用于产生α‑1,3糖基化形式的岩藻糖‑α1,2‑半乳糖‑R(Fuc‑a1,2‑Gal‑R)。又,本发明提供了一种藉由细胞产生α‑1,3糖基化形式的Fuc‑a1,2‑Gal‑R以及从培养物中纯化所述α‑1,3糖基化形式的Fuc‑a1,2‑Gal‑R的方法。

Description

α-1,3糖基化形式的Fuc-a1,2-Gal-R的产生
本发明系于合成生物学与代谢工程技术领域中。更特别的,本发明系于代谢工程化细胞的培养或发酵的技术领域中。本发明描述了代谢工程化细胞,用于产生α-1,3糖基化形式的岩藻糖-α1,2-半乳糖-R(Fuc-a1,2-Gal-R)。又,本发明提供了一种藉由细胞产生α-1,3糖基化形式的Fuc-a1,2-Gal-R以及从培养物中纯化所述α-1,3糖基化形式的Fuc-a1,2-Gal-R的方法。
背景技术
寡糖通常以糖偶联形式存在于蛋白质与脂质中,参与许多重要现象,例如与受精、胚胎发生(embryogenesis)、发炎、转移与宿主病原体贴附的发展与进程相关的分化、发育与生物识别过程。寡糖也可以作为未结合的聚糖存在于体液和母乳中,其中它们也调节重要的发育与免疫过程(Bode,Early Hum.Dev.1-4(2015);Reily et al.,Nat.Rev.Nephrol.15,346-366(2019);Varki,Glycobiology 27,3-49(2017))。岩藻糖-α1,2-半乳糖-R(Fuc-a1,2-Gal-R)已在多种类型的寡糖与蛋白质和脂质的糖偶联形式中被鉴定。其包含与其他聚糖、糖蛋白或糖脂相连的双糖岩藻糖-α1,2-半乳糖抗原表位。所述岩藻糖-α1,2-半乳糖抗原表位经常被报导参与神经元形态学(neuronal morphology)、神经元发育(neuronal development)、学习与记忆(Kalovidouris et al.,J.Am.Chem.Soc.127(5),1340-1341(2005);Tosh et al.,Sci.Rep.9,18806(2019))。Fuc-a1,2-Gal也是母乳中最丰富的寡糖2'-岩藻糖基乳糖(2'FL,Fuc-a1,2-Gal-b1,4-Glc)的一部分。人乳寡糖(Human milk oligosaccharides,HMO),特别是2'FL具有多种功能,包括益生元、免疫、肠道和认知益处(Reverri et al.,Nutrients 10(10),1346(2018))。Fuc-a1,2-Gal也形成H抗原,其为A与B血型抗原的亚结构(substructure)。α-1,3糖基化形式的岩藻糖-α1,2-半乳糖抗原表位是组织血型ABH碳水化合物抗原表位(也称为组织血型抗原(histo-blood groupantigens),HBGA)的一部分。HBGA是一种复合的碳水化合物,于许多细胞类型的表面被发现,包括上皮肠细胞且作为游离寡糖于生物体液,如唾液与乳汁中(Marionneau et al.,Biochimie 83,565-573(2001))。Fuc-a1,2-Gal基团也存在于乳-N-岩藻糖五糖I(LNFP-I、Fuc-a1,2-Gal-b1,3-GlcNAc-b1,3-Gal-b1,4-Glc)中,此为一种存在于人乳中的高度丰富的寡糖。LNFP-I代表一种重要的免疫调节剂,可藉由抑制病原菌如大肠杆菌(EPEC、UPEC)与病毒等的贴附来避免养育婴儿严重感染性腹泻。LNFP-I也与病原体毒素的结合、B组链球菌(Streptococci)的生长抑制与双歧杆菌群落(bifidobacterial communities)的选择性刺激有关(Derya et al.,J.Biotechnol.318,31-38(2020);Gotoh et al.,Sci.Rep.8,13958(2018);Lin et al.J.Biol.Chem.292,11243-11249(2017);Sotgiu et al.,Int.J.Biomed.Sci.2(2),114-120(2006))。LNFP-I可以进一步以末端半乳糖或N-乙酰半乳糖胺基团修饰,分别产生携带B抗原(Gal-a1,3-(Fuc-a1,2)-Gal-beta)或A抗原(GalNAc-a1,3-(Fuc-a1,2)-Gal-beta)的寡糖结构。这些寡糖结构具有巨大的科学与商业利益,但其可用性有限,由于产生依赖于化学或化学酶合成,或从天然来源,例如动物乳汁纯化。化学合成方法费时费力,并且由于涉及大量步骤,因此难以扩大规模。酶方法比化学合成具有优势,但必需酶的立体特异性与区域选择性仍然是一项艰巨的挑战。
本发明的一个目的是提供工具与方法,藉由这些工具与方法的方式可以高效、时间与成本有效的方式,并且若需要,连续方法来产生α-1,3糖基化形式的Fuc-a1,2-Gal-R。
根据本发明,藉由提供用于产生α-1,3糖基化形式的Fuc-a1,2-Gal-R的细胞、方法与新型态的糖基转移酶(glycosyltransferase)来实现此目的与其他目的,其中细胞经过基因修饰以产生所述的α-1,3糖基化形式的Fuc-a1,2-Gal-R。
发明概述
令人惊讶的是,现已发现可以藉由单一细胞产生α-1,3糖基化形式的Fuc-a1,2-Gal-R。本发明提供了一种用于产生α-1,3糖基化形式的Fuc-a1,2-Gal-R的细胞与方法。该方法包括提供具有合成Fuc-a1,2-Gal-R的能力、表达α-1,3-糖基转移酶(alpha-1,3-glycosyltransferas)与具有合成为α-1,3-糖基转移酶的供体的核苷酸-糖的细胞的步骤,且于允许产生α-1,3糖基化形式的Fuc-a1,2-Gal-R的条件下培养该细胞。本发明也提供分离该α-1,3糖基化形式的Fuc-a1,2-Gal-R的方法。又,本发明提供代谢工程化细胞以产生α-1,3糖基化形式的Fuc-a1,2-Gal-R。
定义
本说明书中描述本发明及其各种实施例的术语不可仅理解为其通常所定义的含意,且应通过本说明书中的特殊定义而包括通常所定义的含意范围以外的结构、材料或动作。因此,若一个要素在本说明书的背景下可被理解为包括一种以上的含意,则在权利要求书中使用此要素需理解为说明书与该术语本身所支持的所有可能含意是通用的。
于此揭示的发明的各种实施例与方面不仅在本说明书具体描述的顺序与背景下进行解读,且应包括任何顺序及其任何组合。每当内容有需要,所有以单数形式的术语应视为包含复数,反之亦然。除非另有定义,于此使用的所有技术与科学术语一般具有本发明所属技术领域中具有通常知识者一般理解的相同含意。一般而言,于此使用的命名法及细胞培养、分子遗传学、有机化学与核酸化学的实验程序及于此所述的杂交(hybridization)步骤为本领域所周知且时常采用的。标准技术用于核酸与肽合成。一般而言,根据制造商说明书来进行纯化步骤。
本说明书中揭示了本发明的实施例,且虽然使用了特定术语,但术语仅是以描述性质而使用,并非用以作为限定,本发明的范围如下文权利要求书所述。应能理解的是,所述实施例仅是出于例示的目的而描述,不应将其视为限定本发明。对于本发明所属技术领域中具有通常知识者显而易见的是,其他实施例、改良、细节和用途与本发明的文字及精神为一致的且在本发明的范围以内,仅以权利要求书来限定本发明的范围,且以包括等同原则的专利法来进行解读。仅是为了便于描述起见,在下文权利要求书中,提供了用以表明权利要求书步骤的参考符号,而并非意图隐含进行这些步骤的特定顺序。
在此文件及其权利要求书中,动词「包括(comprise)」及其词型变化是以非限定的方式而使用,以意指在此术语之后所包含的项目,但不排除未特别提及的项目。在整个申请中,可利用「由…所组成」或「实质上由…所组成」取代动词「包括」,反之亦然。此外,可利用「实质上由…所组成」取代动词「由…所组成」,「实质上由…所组成」指的是于此所定义的 合物可包括所特别指明之外的额外成分,所述额外成分不会改变本发明的独特的特征。此外,以不定冠词「一(a或an)」提及成分不排除存在一个成分以上的可能性,除非内容明确指出仅有一个成分或其中一个成分。因此,不定冠词「一(a或an)」一般指的是「至少一个」。
在整个申请中,除非另有明确说明,「合成(synthesize)」、「合成(synthesized)」与「合成(synthesis)」的特征分别与特征「产生(produce)」、「产生(produced)」与「产生(production)」的互换使用。
除非另有说明,于此所识别的每个实施例可以组合在一起。本说明书中提及的所有出版物、专利与专利申请案通过引用的方式并入于此,就如同明确且单独指明各个单独的出版物、专利或专利申请案通过引用的方式并入于此。优先权申请案,包括EP20190208、EP20190198及EP20190199,其全文亦通过引用的方式并入于此,就如同明确且单独指明所述优先权申请案通过引用的方式并入于此。
根据本发明,「多核苷酸」一词通常指的是任何多核糖核苷酸或多脱氧核糖核苷酸,其可以是未修饰的RNA或DNA或者修饰的RNA或DNA。「多核苷酸」包括但不限于单链和双链DNA,作为单链和双链区域或单链、双链和三链区域的混合物的DNA、单链和双链RNA,以及作为单链和双链区域的混合物的RNA,包含DNA和RNA,其可以是单链,或更典型的双链或三链区域,或单链和双链区域的混合物的杂交分子。此外,于此所使用的「多核苷酸」指的是包含RNA或DNA或者RNA和DNA两者的三链区域。这些区域中的链可以来自相同分子或来自不同的分子。这些区域可以包括所有的一个或多个分子,但更典型地只涉及一些分子的区域。三螺旋区域的分子之一通常是寡核苷酸。如于此所使用,「多核苷酸」一词还包括如上所述含有一个或多个修饰碱基的DNA或RNA。因此,具有出于稳定性或其他原因而修饰的主链的DNA或RNA是根据本发明的「多核苷酸」。再者,包含不寻常碱基,例如肌苷(inosine))或修饰的碱基(例如三酰化(tritylated)碱基的DNA或RNA应理解为涵盖在「多核苷酸」一词中。应当理解,已经对DNA和RNA进行了多种修饰,其用于本领域技术人员已知的许多有用目的。于此中使用的「多核苷酸」一词包括这种经化学、酶或代谢修饰的多核苷酸形式,以及病毒和细胞,包括如简单和复杂细胞所特有的DNA和RNA的化学形式。「多核苷酸」一词也包括通常称为寡核苷酸的短多核苷酸。
「多肽」是指包含通过肽键或修饰的肽键彼此连接的两个或更多个氨基酸的任何肽或蛋白质。「多肽」指的是短链,通常称为肽、寡肽和寡聚物,也指的是长链,通常称为蛋白质。多肽可以含有20种基因编码氨基酸以外的氨基酸。「多肽」包括通过自然过程修饰的多肽,例如经过处理和其他翻译后修饰,也包括通过化学修饰技术修饰的多肽。这样的修饰在基础教科书和更详细的专著中以及多卷研究文献中充分描述,并且其对于本领域技术人员是周知的。相同类型的修饰可以以相同的程度或不同的程度存在于给定多肽中的数个位点上。此外,给定的多肽可以包含许多类型的修饰。修饰可以在多肽的任意位置发生,包括肽主链、氨基酸侧链和氨基末端或羧基末端。修饰包括,例如,乙酰化(acetylation)、酰化(acylation)、ADP-核糖基化、酰胺化、黄素(flavin)的共价连接、血红素部分的共价连接、核苷酸或核苷酸衍生物的共价连接、脂质或脂质衍生物的共价连接、磷脂酸肌醇(phosphatidylinositol)的共价连接、交联、环化(cyclization)、二硫键(disulphidebond)形成、去甲基化作用、共价交联的形成、焦谷氨酸(pyroglutamate)的形成、甲酰化作用、γ-羧基化、糖基化、GPI锚定形成、羟基化、碘化、甲基化、荳蔻酰化(myristolyation)、氧化、蛋白水解处理、磷酸化、异戊二烯化(prenylation)、外消旋化(racemization)、脂质连接、硫化、谷氨酸残基的γ-羧化、羟基化和ADP-核糖基化、硒化(selenoylation)、向蛋白质添加转移RNA介导的氨基酸,诸如精氨化和泛素化。多肽可以是分支的或有或无分支的环状。环状、分支的和分支环状的多肽可以由翻译后天然过程形成,并且也可以通过全合成法(entirely synthetic methods)制得。
如于此所使用的,术语「编码多肽的多核苷酸」包括包含编码本发明多肽的序列的多核苷酸。此术语还包括多核苷酸,所述多核苷酸包括编码多肽的单一连续区域或不连续区域(例如,被整合的噬菌体或插入序列或通过编辑所间隔)以及也可包含编码及/或非编码序列的额外区域。
「分离的(isolated)」指的是「通过人工的方式」由其天然状态改变,亦即,如果存在于自然界,则其已经改变或从其原始环境中移出,或者二者。例如,天然存在于生物体中的多核苷酸或多肽不是「分离的」,但是与其天然状态的共存物质分开的相同的多核苷酸或多肽是「分离的」,如此术语在于此中所用的。同样地,如于此所使用的术语「合成的」序列是指合成产生而不是从天然来源直接分离的任何序列。如于此所使用的术语「合成的」是指任何合成生成的序列,并且不是直接从天然来源分离出来的。
如于此提及细胞或宿主细胞而使用的「重组的(recombinant)」或「转基因的(transgenic)」或「代谢工程化(metabolically engineered)」或「经基因改造的(genetically modified)」一词可交替使用,且指的是细胞复制异源核酸或表达异源核酸(亦即,对所述细胞而言是外来的序列,或对所述细胞中的所述位置或环境而言是外来的序列)编码的肽或蛋白质。这类细胞被描述为用至少一种异源或外源基因进行转化,或描述为通过导入至少一种异源或外源基因而进行转化。代谢改造或重组或转基因细胞可包含在细胞的天然(非重组)形式中不存在的基因。重组细胞也可包含在细胞的天然形式中存在的基因,其中这些基因是经过修饰且利用人工方式重新导入至细胞。这些术语也包含含有对细胞而言为内源的核酸的细胞,所述核酸已经过修饰,或其表达或活性已在未从细胞移除核酸的情况下进行修饰,这些修饰包括通过基因取代而取得的修饰、启动子(promoter)的取代、定点突变(site-specific mutation)及相关的技术。因此,「重组多肽」是由重组细胞所生产。如于此所使用的,「异源序列」或「异源核酸」是源自对特定细胞而言是外来的来源(例如,从不同的物种),或者,若是源自相同来源,则是从其原始形式或基因体中的位置进行修饰。因此,与启动子可操作连接的异源核酸来自与衍生启动子的来源不同的来源,或者,若是自相同来源,则从其原始形式或基因体中的位置进行修饰。可稳定地导入异源序列,例如,通过转染、转化、接合或转导(transduction),到宿主微生物细胞的基因体中,其中可以应用取决于细胞和将导入序列的技术。各种技术对于本发明所属技术领域具有通常知识者而言是习知的,且揭露于如Sambrook et al.,Molecular Cloning:A Laboratory Manual,2nd Ed.,Cold Spring Harbor Laboratory Press,Cold Spring Harbor,N.Y.(1989)中。本发明内容中所使用的「突变」细胞或微生物指的是经基因改造的细胞或微生物。
在本发明内容中的「内源的」一词是指任何多核苷酸、多肽或蛋白质序列,其是细胞的天然部分并且存在于其在细胞染色体中的自然位置。「外源的」一词是指任何多核苷酸、多肽或蛋白质序列,其源自于所研究的细胞外部,并且不是细胞的天然部分,或不存在于细胞染色体或质粒中的其自然位置。
「异源的」一词当用于提及多核苷酸、基因、核酸、多肽或酶时,是指来自或衍生自宿主物种以外的来源的多核苷酸、基因、核酸、多肽或酶。相反地,于此使用的「同源」多核苷酸、基因、核酸、多肽或酶来表示衍生自宿主生物体物种的多核苷酸、基因、核酸、多肽或酶。当提及用于维持或操纵基因序列的基因调控序列或辅助核酸序列时(例如,启动子、5'未翻译区、3'未翻译区、poly A附加序列、内含子(intron)序列、剪接位点(splice site)、核糖体结合位点、内部核糖体进入序列、基因体同源区、重组位点等),「异源的」是指调控序列或辅助序列与在构建体、基因体、染色体或附加体(episome)中与调控或辅助核酸序列并列的基因未有天然关联。因此,可操作地连接至在其天然状态下(亦即,在非基因改造生物体的基因体中)非可操作地连接至的基因的启动子在于此中被称为「异源启动子」,即使该启动子可衍生自与其所连接的基因相同的物种(或在某些情况下,相同的生物体)。
蛋白质或酶「经修饰的活性」一词是关于与所述蛋白质或酶的野生型活性(即,天然活性)相比蛋白质或酶活性的变化。所述经修饰的活性与蛋白质或酶的野生型活性相比可以是所述蛋白质或酶经破坏、削弱、减少或延迟的活性,但与蛋白质或酶的野生型活性相比也可以是所述蛋白质或酶加速或增强的活性。通过修饰所述蛋白质或酶的表达或通过表达修饰型(即,突变型)蛋白质或酶而达到蛋白质或酶经修饰的活性。酶经修饰的活性更关于酶的表观(apparent)Michaelis常数Km及/或表观最大速率(Vmax)中的修饰。
基因「经修饰的表达」一词是关于在编码蛋白质生产过程的任何阶段中,所述基因的表达量与野生型相比的变化。所述经修饰的表达与野生型相比为较低或较高的表达量,其中「较高的表达量」一词也定义为以内源基因而言所述基因的「过表达(overexpression)」,或以未存在于野生型品系的异源基因而言的表达。藉由技术人员通常习知技术来达到较低的表达量或减弱的表达量,例如使用SiRNA、CrispR、CrispRi、核糖开关(riboswitch)、重组介导的基因工程(recombination-mediated genetic engineering,recombineering)、同源重组、ssDNA诱发突变(mutagenesis)、RNAi、miRNA、asRNA、突变基因、剔除基因、转位子(transposon)诱发突变等,这些技术以不太可能(亦即,与功能性野生型基因相比统计上显著「不太可能」)或完全无法(例如,剔除基因)生产功能性最终产物的方式而改变基因。如于此所使用的,「核糖开关(riboswitch)」一词是定义为信使RNA(messenger RNA)的一部分,其折叠为错综复杂的结构而通过干扰翻译阻挡表达。与效应分子结合造成构型改变,进而得以调控转录后的表达。
以降低表达量的方式改变感兴趣的基因是通过如上述所述而获得,也可通过改变转录单元(transcription unit)、启动子、未翻译区、核糖体结合位点、Shine Dalgarno序列或转录终止序列(terminator)来获得较低的表达量。例如,可通过突变启动子序列中一或多个碱基对或将启动子序列完全改变为比野生型具有更低表达强度的组成型启动子(constitutive promoter)或调控表达量的可诱导型启动子或调控表达量的可抑制型启动子。
藉由技术人员通常习知技术来达到过表达或表达,例如使用人造转录因子、从头合成设计启动子序列、改造RNA开关、在常染色质(euchromatin)导入或再导入表达模块或使用高复制数量的质粒,其中所述基因是「表达盒(expression cassette)」的一部份,其是关于其中存在有启动子序列、未翻译区序列、编码序列以及视需要而定的转录终止序列的任何序列,并造成功能活性蛋白质的表达。所述表达是组成型(constitutive)的或受调控的。
「组成型表达(constitutive expression)」一词定义为在特定成长条件下,不受RNA聚合酶的次单位(例如,细菌sigma因子)以外的转录因子调控的表达。这些转录因子的非限制性范例为大肠杆菌中的CRP、LacI、ArcA、Cra与IclR。这些转利因子结合至特定序列且在特定成长条件下可阻挡或增强表达。RNA聚合酶结合至特定序列以起始转录,例如通过原核宿主的sigma因子。
「调控的表达」一词定义为在特定成长条件下,受到RNA聚合酶的次单位(例如,细菌sigma因子)以外的转录因子调控的表达。这些转录因子的范例如前文所述。通过诱导子(inducer)或抑制子(repressor)来达到通常表达调控,例如但不限于,IPTG、阿拉伯糖(arabinose)、鼠李糖(rhamnose)、岩藻糖(fucose)、异乳糖(allolactose)或调整pH、或调整温度或碳耗竭,或通过受质、产物或化学抑制法。
术语「通过天然诱导子的表达」定义为仅在宿主的自然条件下(例如,分娩中的生物,或在泌乳期时)表达的基因的兼性或调控表达,对于环境变化(例如,包括荷尔蒙、热、冷、pH改变、光线、氧化压力或渗透压力/信号)有所反应,或取决于发育阶段的位置或所述宿主细胞的细胞周期,但不限于细胞凋亡(apoptosis)或细胞自噬(autophagy)。
术语「化学处理后可诱导的表达」定义为仅在用化学诱导子或抑制子处理后表达的基因的兼性或调控表达,其中所述诱导子与抑制子包括但不限于醇类(例如,乙醇、甲醇)、碳水化合物(例如,葡萄糖、半乳糖、甘油、乳糖、阿拉伯糖、鼠李糖、岩藻糖、异乳糖(allo-lactose))、金属离子(例如,铝、铜、锌)、氮气、磷酸盐、异丙基-β-D-硫代半乳糖苷(Isopropylβ-D-1-thiogalactopyranoside,IPTG)、醋酸盐、甲酸盐或二甲苯。
「控制序列(control sequences)」一词是指由宿主细胞转录和翻译系统识别的序列,能够使多核苷酸序列转录及翻译成多肽。因此,这种DNA序列对于在特定宿主细胞或生物体中表达可操作连接的编码序列是必需的。这种控制序列可以是但不限于启动子序列、核糖体结合序列、ShineDalgarno序列、Kozak序列、转录终止子序列。例如,适用于原核生物的控制序列包括启动子、任选的操纵子序列和核糖体结合位点。已知真核细胞利用启动子、多聚腺苷酸化信号和增强子。如果前序列或可分泌前导物(secretory leader)的DNA作为参与多肽分泌的前蛋白表达,则将前序列或可分泌前导物的DNA可操作地连接到多肽的DNA;如果启动子或增强子影响序列的转录,则将启动子或增强子可操作地连接到编码序列;或者如果核糖体结合位点影响序列的转录,则将核糖体结合位点可操作地连接到编码序列;或者如果核糖体结合位点的定位便于翻译,则将核糖体结合位点可操作地连接到编码序列。所述控制序列还可利用外部化学物质(例如,但不限于IPTG、阿拉伯糖、乳糖、异乳糖、鼠李糖或岩藻糖)经由可诱导启动子或经由诱导或抑制所述多核苷酸转录或翻译为多肽的遗传回路而得到另外控制。
一般而言,「可操作连接」是指被连接的DNA序列是连续的,且在可分泌前导物的情况下,是连续的并处于阅读框架中。然而,增强子不必是连续的。
「野生型」一词指的是通常习知发生于自然界的遗传型或表达型情况。
如于此所使用,术语「蛋白质经修饰的表达」是指相较于野生型(即,天然)蛋白质:i)内源性蛋白质较高的表达或过表达,ii)异源性蛋白质的表达,或iii)具有较高活性的变体蛋白质的表达及/或过表达。
如于此所使用,「乳腺细胞」一词一般是指乳腺上皮细胞、乳腺上皮腔细胞或哺乳动物上皮乳泡细胞(alveolar cell)或前述的任何组合。如于此所使用,「类乳腺细胞」一词一般是指具有与自然乳腺细胞相似(或实质上相似)但源自于非乳腺细胞来源的表达型/基因型的细胞。这样的类乳腺细胞可经过改造以移除至少一种不需要的遗传成分,及/或包括至少一种典型的乳腺细胞的预定基因建构体(construct)。类乳腺细胞的非限制性范例可包括类乳腺上皮细胞、类乳腺上皮腔细胞、展现出乳腺细胞品系细胞的一或多种特征的非乳腺细胞或前述的任何组合。类乳腺细胞更多的非限制性范例可包括具有与自然乳腺细胞相似(或实质上相似)的表达型的细胞。具有表达型或展现出与自然乳腺细胞或乳腺上皮细胞相似(或实质上相似)的至少一种特征的细胞可包括展现出可自然表达至少一种乳汁成分或经改造为可表达至少一种乳汁成分的细胞(例如,源自乳腺细胞品系或非乳腺细胞品系)。
如于此所使用,「非乳腺细胞」一般可包括非乳腺细胞品系的任何细胞。在本发明的背景下,非乳腺细胞可以是可经改造而表达至少一种乳汁成分的任何哺乳类细胞。这样的非乳腺细胞的非限制性范例包括肝细胞、血细胞、肾细胞、脐带血细胞、上皮细胞、表皮细胞、肌细胞、纤维母细胞、间质细胞或前述的任何组合。在一些范例中,分子生物学和基因体编辑技术可被设计为同时消除、沉默或减弱各式各样的基因。
在本申请中,除非有明确说明,否则「可(capable of)…<动词>」与「可(capableto)…<动词>」的表示方式较佳为利用动词的主动语态取代,且反之亦然。例如,「可表达」的表示方式较佳为利用「表达」取代,且反之亦然,亦即,「表达」较佳为利用「可表达」取代。
如于此所使用,「变体(variant)」是分别不同于参考多核苷酸或多肽但保留必要特性的多核苷酸或多肽。多核苷酸或多肽典型的变体与另一参考多核苷酸的核苷酸序列不同。变体的核苷酸序列中的改变可能会或可能不会改变参考多核苷酸所编码的多肽氨基酸序列。如下文所讨论,核苷酸改变可能会造成参考序列所编码的多肽中氨基酸取代(substitution)、添加(addition)、缺失(deletion)、融合(fusion)与截断(truncation)。多肽典型的变体与另一参考多肽的氨基酸序列不同。一般而言,差异有限导致参考多肽与变体的序列整体而言非常相似,且在许多区域中相同。变体与参考多肽的差异可在于一或多个取代、添加、缺失的任何组合。取代或插入的氨基酸残基可能会或可能不会是遗传密码所编码的氨基酸残基。多核苷酸或多肽的变体可以是自然发生的,例如等位基因变体,或者可以是已知非自然发生的变体。多核苷酸或多肽非自然发生的变体可以利用突变技术、直接合成法及本发明所属技术领域中具有通常知识者已知的其他重组方法而产生。
如于此所使用,多肽的「衍生物」一词为在多肽的氨基酸序列中可能含有氨基酸残基的缺失、添加或置换,但会导致沉默变化,从而产生功能性等效多肽的多肽。可以基于极性、电荷、溶解性、疏水性、亲水性及/或所涉及残基的双性性质的相似性进行氨基酸取代。例如,非极性(疏水)氨基酸包括丙氨酸、亮氨酸、异亮氨酸、缬氨酸、脯氨酸、苯丙氨酸、色氨酸和甲硫氨酸;平面中性氨基酸包括甘氨酸、丝氨酸、苏氨酸、半胱氨酸、酪氨酸、天门冬酰胺和谷氨酰胺;带正电荷的(碱性)氨基酸包括精氨酸、赖氨酸与组氨酸;带负电荷的(酸性)氨基酸包括天门冬氨酸和谷氨酸。在本发明的前后文中,如于此所使用的衍生多肽是指能够表达出与原始多肽实质上相似的体外(in vitro)及/或体内(in vivo)活性的多肽,如通过许多标准中的任一个而进行判断,包括但不限于酶活性,且可以在翻译期间或之后进行不同的修饰。再者,可以将非经典氨基酸或化学氨基酸类似物置换于或添加至原始多肽序列中。
在一些实施例中,本发明设想到通过修饰如本发明中使用的酶结构来产生功能性变体。可通过氨基酸置换、缺失、添加或前述的组合来制造变体。例如,可合理预期用异亮氨酸或缬氨酸单独替换亮氨酸、用谷氨酸单独替换天门冬氨酸、用丝氨酸单独替换苏氨酸、或用结构上相关的氨基酸对氨基酸的相似取代(例如,保守型突变)不会对所得分子的生物活性产生重大影响。保守取代是发生在与其侧链相关的氨基酸家族内进行的取代。藉由评估变体多肽以类似于野生型多肽的方式在细胞中产生应答的能力,可以轻易地确定本发明的多肽的氨基酸序列中的改变是否会造成功能同系物。
于此所使用的「功能同系物」一词描述的是具有序列相似性(换言的,同源性)并且还共享如生化活性的至少一个功能特征的那些分子(Altenhoff et al.,PLoSComput.Biol.8(2012)e1002514)。功能同系物通常对于相同的特征产生相似的,但不一定相同的程度。功能上同源的多肽具有相同的特征,其中一个同系物产生的定量测量值为另一个的至少10%;更典型为至少为20%,在约30%与约40%之间;例如,在约50%与约60%之间;在约70%与约80%之间;或者在约90%与约95%之间;在约98%与约100%之间,或者超过原始分子所产生的定量测量值的100%。因此,当分子具有酶活性时,功能同系物将具有与原始酶相比的上述酶活性百分比。如果分子是DNA结合分子(例如,多肽),则同系物将具有上述结合亲与力百分比,藉由结合分子的重量与原始分子相比进行测量。
功能同系物与参考多肽可能是天然存在的多肽,并且序列相似性可能是由趋同或趋异演化事件所造成的。功能同系物有时被称为直系同源物(orthologs),其中「直系同源物」是指在另一物种中与参考基因或蛋白质功能等同的同源基因或蛋白质。
直系同源蛋白质为不同物种中的同源基因,其起源于最后一个共同祖先的单一基因的垂直遗传传递(vertical descent),其中此基因及其主要功能是保守的。同源基因为遗传自共同祖先的两种物种的基因。
当「直系同源」一词用于来自给定物种的氨基酸或核苷酸/核酸序列时,指的是来自不同物种的氨基酸或核苷酸/核酸序列。应能理解的是,当两个序列源自于通过线性遗传传递(linear descent)的共同祖先及/或在序列与生物功能方面密切相关时,这两个序列彼此互为直系同源物。直系同源物通常具有高度的序列相似度,但可能不会(且一般不会)共有100%的序列相似度。
旁系同源基因(paralogous gene)是源自基因复制现象的同源基因。旁系同源基因通常属于相同物种,但这并非必需条件。旁系同源基因可分为内旁系同源基因(in-paralog,物种形成事件之后出现的同种同源对)与外旁系同源基因(out-paralog,物种形成事件之前出现的同种同源对)。物种之间的外旁系同源基因为物种形成之前因复制而存在于两种生物之间成对的同种同系物。在物种之中,物种之中的外旁系同源基因为存在于相同生物成对的旁系同源基因,但复制事件是发生于物种形成之后。旁系同源基因同系物一般具有相同或相似的功能。
功能同系物可以藉由核苷酸和多肽序列比对分析来鉴定。例如,对核苷酸或多肽序列的数据库执行查询可以鉴定的同系物,感兴趣的多肽如生物量调节多肽、糖基转移酶、涉及核苷酸活化糖合成的蛋白质或膜运输蛋白。序列分析可以涉及分别使用生物量调节多肽、糖基转移酶、涉及核苷酸活化糖合成的蛋白质或膜运输蛋白的氨基酸序列作为参照序列的非冗余数据库的BLAST、交互BLAST(reciprocal BLAST)或PSI-BLAST分析。在某些情况下,氨基酸序列是从核苷酸序列推导出来的。通常,数据库中序列相似度大于40%的多肽是进一步评估分别作为生物量调节多肽、糖基转移酶、涉及核苷酸活化糖合成的蛋白质或膜运输蛋白适合的候选物。氨基酸序列相似性允许保守的氨基酸取代,例如一个疏水性残基取代另一个疏水性残基,或一个极性残基取代另一个极性残基,或一个酸性残基取代另一个酸性残基,或一个碱性残基取代另一个碱性残基等。较佳的是,保守性取代是指诸如甘氨酸被丙氨酸取代的组合,反之亦然;缬氨酸、异亮氨酸、亮氨酸被甲硫氨酸取代的组合,反之亦然;天门冬氨酸被谷氨酸取代的组合,反之亦然;天门冬酰胺被谷氨酰胺取代的组合,反之亦然;丝氨酸被苏氨酸取代的组合,反之亦然;赖氨酸被精氨酸取代的组合,反之亦然;半胱氨酸被甲硫氨酸取代的组合,反之亦然;苯丙氨酸与酪氨酸被色氨酸取代的组合,反之亦然。如有需要,可以对这类候选物进行手动检查,以缩小待进一步评估的候选物的数量。可以通过选择那些似乎具有在生产率调控多肽中存在的结构域,例如,保守的功能结构域的候选物来执行手动检查。
以多核苷酸而言,「片段」是指克隆(clone)或多核苷酸分子的任何部分,特别是多核苷酸保留全长多核苷酸分子可用的功能特征的部分。有用的片段包括寡核苷酸和多核苷酸,它们可用于杂交或扩增技术或者复制、转录或翻译的调控。「多核苷酸片段」是指多核苷酸SEQ ID NO(或Genbank NO.)的任何子序列,通常包括或由所述于此提供多核苷酸SEQ IDNO(或Genbank NO.)的至少约9、10、11、12个连续核苷酸,例如任何多核苷酸序列的至少约30个核苷酸或至少约50个核苷酸所组成。例示性片段可额外或备选地包括包含编码多肽的保守家族结构域的区域、实质上由其组成或由其组成的片段。示例性片段可额外或备选地包括包含多肽的保守结构域的片段。因此,多核苷酸SEQ ID NO(或Genbank NO.)的片段较佳指的是包括或由所述SEQ ID NO(或Genbank NO.)所组成的核苷酸序列,其中不多于200、150、100、50或25个连续核苷酸缺失(missing),较佳不多于50个连续核苷酸缺失,且上述核苷酸序列保留全长多核苷酸分子可用的功能特征(例如,活性),可利用通常知识者日常实验方法来评估可用的功能特征。或者,多核苷酸SEQ ID NO(或Genbank NO.)的片段较佳指的是包括或由来自所述SEQ ID NO(或Genbank NO.)的一些连续核苷酸所组成的核苷酸序列,其中所述的一些连续核苷酸为所述SEQ ID NO(或Genbank NO.)的至少50.0%、60.0%、70.0%、80.0%、81.0%、82.0%、83.0%、84.0%、85.0%、86.0%、87.0%、88.0%、89.0%、90.0%、91.0%、92.0%、93.0%、94.0%、95.0%、95.5%、96.0%、96.5%、97.0%、97.5%、98.0%、98.5%、99.0%、99.5%、100.0%,较佳为至少80.0%,更佳为至少87%,更佳为至少90.0%,更佳为至少95.0%,更佳为至少97.0%,且保留全长多核苷酸分子可用的功能特征(例如,活性)。因此,多核苷酸SEQ ID NO(或Genbank NO.)的片段较佳指的是包括或由所述SEQ ID NO(或Genbank NO.)所组成的核苷酸序列,其中一些连续的核苷酸缺失,且其中缺失的含量不多于所述SEQ ID NO(或Genbank NO.)全长的50.0%、40.0%、30.0%,较佳为不多于所述SEQ ID NO(或Genbank NO.)全长的20.0%、15.0%、10.0%、9.0%、8.0%、7.0%、6.0%、5.0%、4.5%、4.0%、3.5%、3.0%、2.5%、2.0%、1.5%、1.0%、0.5%,更佳为不多于所述SEQ ID NO(或Genbank NO.)全长的15.0%,更佳为不多于所述SEQ ID NO(或Genbank NO.)全长的10.0%,更佳为不多于所述SEQ ID NO(或Genbank NO.)全长的5.0%,最佳为不多于所述SEQ ID NO(或Genbank NO.)全长的2.5%,且其中所述片段留全长多核苷酸分子可用的功能特征(例如,活性),可用的功能特征可由通常知识者例行评估。
片段可额外或备选地包括多肽和蛋白质分子的子序列,或多肽的子序列。在某些情况下,片段或结构域是多肽的子序列,其以与完整多肽实质上相同的方式或较佳为类似程度执行完整多肽的至少一种生物功能。如于此所定义,「多肽的子序列」指的是源自多肽的连续氨基酸残基的序列。例如,多肽片段可包含可识别的结构基序(motif)或功能结构域,例如DNA结合位点或结构域,其与DNA启动子区、活化结构域或用于蛋白质-蛋白质相互作用的结构域结合,并且可启动转录。片段的大小可以从少至3个氨基酸残基到完整多肽的全长,例如长度至少约20个氨基酸残基,例如长度至少约30个氨基酸残基。因此,多肽SEQID NO(或UniProt ID或Genbank NO.)较佳指的是包括或由所述多肽SEQ ID NO(或UniProtID或Genbank NO.)所组成的多肽序列,其中不多于80、60、50、40、30、20或15个连续氨基酸残基缺失,较佳为不多于40个氨基酸残基缺失,且其以与完整多肽实质上相同的方式或较佳为类似程度执行完整多肽的至少一种生物功能,可利用通常知识者日常实验方法来评估生物功能。或者,多肽SEQ ID NO(或UniProt ID或Genbank NO.)的片段指的是包括或由来自所述多肽SEQ ID NO(或UniProt ID或Genbank NO.)的一些连续的氨基酸残基所组成的多肽序列,且其中所述的一些连续的氨基酸残基为所述多肽SEQ ID NO(或UniProt ID或Genbank NO.)全长的至少50.0%、60.0%、70.0%、80.0%、81.0%、82.0%、83.0%、84.0%、85.0%、86.0%、87.0%、88.0%、89.0%、90.0%、91.0%、92.0%、93.0%、94.0%、95.0%、95.5%、96.0%、96.5%、97.0%、97.5%、98.0%、98.5%、99.0%、99.5%、100.0%,较佳为至少80.0%,更佳为至少87.0%,更佳为至少90.0%,更佳为至少95.0%,更佳为至少97.0%,且其以与完整多肽实质上相同的方式或较佳为类似程度执行完整多肽的至少一种生物功能,可利用通常知识者日常实验方法来评估生物功能。因此,多肽SEQ IDNO(或UniProt ID或Genbank NO.)的片段较佳指的是包括或由所述多肽SEQ ID NO(或UniProt ID或Genbank NO.)所组成的多肽序列,其中一些连续的氨基酸残基缺失,且其中缺失的含量不多于所述多肽SEQ ID NO全长的50.0%、40.0%、30.0%,较佳为不多于所述SEQ ID NO(或UniProt ID或Genbank NO.)全长的20.0%、15.0%、10.0%、9.0%、8.0%、7.0%、6.0%、5.0%、4.5%、4.0%、3.5%、3.0%、2.5%、2.0%、1.5%、1.0%、0.5%,更佳为不多于所述多肽SEQ ID NO(或UniProt ID或Genbank NO.)全长的15%,更佳为不多于所述多肽SEQ ID NO(或UniProt ID或Genbank NO.)全长的10%,更佳为不多于所述多肽SEQID NO(或UniProt ID或Genbank NO.)全长的5%,最佳为不多于所述多肽SEQ ID NO(或UniProt ID或Genbank NO.)全长的2.5%,且其以与完整多肽实质上相同的方式或较佳为类似程度执行完整多肽的至少一种生物功能,生物功能可由通常知识者来例行评估。
在本申请中,可利用SEQ ID NO或者是UniProt ID或GenBank NO.来表示多肽的序列。因此,除非另有明确说明,否则用语「多肽SEQ ID NO」与「多肽UniProt ID」与「多肽GenBank NO.」可交替使用。
较佳的是,多肽的片段是以类似程度具有衍生片段的多肽的至少一种特性或活性的功能性片段,例如,功能性片段可以包括多肽的功能结构域或保守结构域。应能理解的是,多肽或其片段可具有保守型氨基酸取代,对于多肽的活性没有实质上的影响。保守性取代可以是一个疏水性氨基酸取代另一个疏水性氨基酸,或一个极性氨基酸取代另一个极性氨基酸,或一个酸性氨基酸取代另一个酸性氨基酸,或一个碱性氨基酸取代另一个碱性氨基酸等。较佳的是,保守性取代是指诸如甘氨酸被丙氨酸取代的组合,反之亦然;缬氨酸、异亮氨酸、亮氨酸被甲硫氨酸取代的组合,反之亦然;天门冬氨酸被谷氨酸取代的组合,反之亦然;天门冬酰胺被谷氨酰胺取代的组合,反之亦然;丝氨酸被苏氨酸取代的组合,反之亦然;赖氨酸被精氨酸取代的组合,反之亦然;半胱氨酸被甲硫氨酸取代的组合,反之亦然;苯丙氨酸与酪氨酸被色氨酸取代的组合,反之亦然。
例如,可以藉由Pfam(El-Gebali et al.,Nucleic Acids Res.47(2019)D427-D432)、IPR(InterPro domain)(Mitchell et al.,Nucleic Acids Res.47(2019)D351-D360),蛋白质指纹结构域(protein fingerprint domain)(PRINTS)(Attwood et al.,Nucleic Acids Res.31(2003)400-402)、SUBFAM结构域(Gough et al.,J.Mol.Biol.313(2001)903-919)、TIGRFAM结构域(Selengut et al.,Nucleic Acids Res.35(2007)D260-D264)、保守结构域数据库(Conserved Domain Database)(CDD)命名(designation)(https://www.ncbi.nlm.nih.gov/cdd)(Lu et al.,Nucleic Acids Res.48(2020)D265-D268)、PTHR结构域(http://www.pantherdb.org)(Mi et al.,Nucleic Acids.Res.41(2013)D377-D386;Thomas et al.,Genome Research 13(2003)2129-2141)或PATRIC识别符(identifier)或PATRIC DB全球家族结构域(global family domain)(https://www.patricbrc.org/)(Davis et al.,Nucleic Acids Res.48(D1)(2020)D606-D612)。该技术领域应理解的是,对于于此所使用的数据库而言,包括Pfam 32.0(released Sept2018)、CDD v3.17(released 3rd April 2019),eggnogdb4.5.1(released Sept 2016)、InterPro 75.0(released 4th July 2019),TCDB(released17th June 2019)与PATRIC3.6.9(released March 2020)指定来表征结构域,各个数据库的内容在各个释出版本为固定的而不会改变。当特定数据库的内容改变时,此特定数据库接收到具有新释出日期的新释出版本。各个数据库的所有释出版本与其对应的释出日期以及所注释的特定内容对于本发明所属技术领域中具有通常知识者而言是可得且习知的。
蛋白质序列和注释资料的综合资源可以提供蛋白质或多肽序列信息和功能信息,例如通用蛋白质资源(Universal Protein Resource,UniProt)(www.uniprot.org)(Nucleic Acids Res.2021,49(D1),D480-D489)。UniProt包括专业且丰富的蛋白质数据库,称为UniProt知识库(UniProt Knowledgebase,UniProtKB)以及UniProt参考群集(UniRef)与UniProt档案(UniParc)。UniProt标识符(UniProt ID)是数据库中的每个蛋白质独有的。于此所使用的UniProt ID为2021年5月5日UniProt数据库版本中的UniProt ID。没有UniProt ID的蛋白质于于此系利用2021年5月5日版本的NIH基因序列数据库(https://www.ncbi.nlm.nih.gov/genbank/)(Nucleic Acids Res.2013,41(D1),D36-D42)中所呈现的个别GenBank登录号码(GenBank No.)来称呼。
术语「相同」或「相似度百分比」或「%相似度」在两个或两个以上的核酸或多肽序列的情形中,是指两个或两个以上的序列或子序列,当用序列比较算法或目测法测量就最大对应性进行比较和比对时,其是相同的或具有特定百分比的相同的氨基酸残基或核苷酸。对于序列比较,一个序列作为参照序列,将测试序列与的进行比较。当使用序列比较算法时,将测试序列和参照序列输入计算机,必要时指定子序列坐标,并指定序列算法程序参数。然后,序列比较算法根据指定的程序参数,计算测试序列相对于参照序列的序列百分比相似度。可以在参考序列的全长序列上整体计算百分比相似度,从而得到整体百分比相似度分数。或者,可以在参考序列的部分序列上计算百分比相似度,从而得到局部百分比相似度分数。在局部序列比对中使用参考序列的全长可产生测试和参考序列之间的整体百分比相似度分数。
可利用不同算法决定百分比相似度,例如BLAST与PSI-BLAST(Altschul et al.,1990,J Mol Biol 215:3,403-410;Altschul et al.,1997,Nucleic Acids Res25:17,3389-402)、Clustal Omega方法(Sievers et al.,2011,Mol.Syst.Biol.7:539),MatGAT方法(Campanella et al.,2003,BMC Bioinformatics,4:29)或EMBOSS Needle。
比对的BLAST(局部比对检索基本工具)方法是由美国国家生物技术信息中心所提供的算法,利用默认参数来比较序列。程序将核苷酸或蛋白质序列与序列数据库进行比较并计算统计上的显著性。PSI-BLAST(位置特定迭代局部比对检索基本工具)从使用蛋白质-蛋白质BLAST(BLASTp)检测到的高于给定分数阈值的序列的多序列比对中得出位置特定计分矩阵(position-specific scoring matrix,PSSM)或概述。BLAST方法可用于成对或多序列比对。成对序列比对用以识别可能表明两个生物序列(蛋白质或核酸)之间的功能、结构及/或进化关系的相似区域。BLAST的网页界面位于:https://blast.ncbi.nlm.nih.gov/Blast.cgi。
Clustal Omega(Clustal W)是一个多序列比对程序,其使用种子引导树(seededguided tree)和HMM profile-profile技术来产生三个或三个以上的序列之间的比对结果。它产生不同序列的具有生物学意义的多序列比对。Clustal W的网页界面位于:https://www.ebi.ac.uk/Tools/msa/clustalo/。使用Clustal W方法进行多序列比对与蛋白质序列的百分比相似度的预设参数为:启用输入序列的去比对:FALSE;启用类mbed群集引导树(mbed-like clustering guide-tree):TRUE;启用类mbed群集迭代(mbed-likeclustering iteration):TRUE;(结合引导树/HMM)迭代数量:预设(0);最大引导树迭代:预设[-1];最大HMM迭代[-1];顺序(order):对齐的(aligned)。
MatGAT(Matrix Global Alignment Tool)是一种计算机应用程序,可生成DNA或蛋白质序列的相似性(similarity)/相似度(identity)矩阵,而无需对数据进行预比对。程序使用Myers与Miller整体比对算法执行一系列成对比对,计算相似性和相似度,然后将结果放入距离矩阵中。使用者可以指定哪种类型的比对矩阵(例如,BLOSUM50、BLOSUM62与PAM250)用于检视蛋白质序列。
EMBOSS Needle(https://galaxy-iuc.github.io/emboss-5.0-docs/needle.html)使用Needleman-Wunsch整体比对算法在考虑两个序列的全长时找到它们的最佳比对(包括间隙)。动态程序法藉由探索所有可能的比对结果并选择最佳比对结果来确保最佳比对结果。Needleman-Wunsch算法是可以按mn步骤的顺序(其中m与n为两序列的长度)计算最佳分数和比对结果的一类算法的成员之一。间隙开放惩罚(gap open penalty)(预设10.0)为产生间隙时的分数。预设数值假设你对蛋白质序列使用EBLOSUM62矩阵。间隙延伸(预设0.5)惩罚被添加至间隙中每个碱基或残基的标准间隙惩罚。这便是长间隙如何被惩罚的。
如于此所使用的,具有相对于参考多肽序列的全长序列具有至少80%序列相似度的氨基酸序列的多肽可被理解为此序列对于参考多肽序列的氨基酸序列的全长具有80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、91.50%、92.00%、92.50%、93.00%、93.50%、94.00%、94.50%、95.00%、95.50%、96.00%、96.50%、97.00%、97.50%、98.00%、98.50%、99.00%、99.50%、99.60%、99.70%、99.80%、99.90%、100%的序列相似度。在本申请中,除非另有明确指明,否则多肽包括/由/具有相对于参考多肽序列的全长氨基酸序列,通常以SEQ ID NO或UniProt ID或Genbank NO.所指明,具有至少80.0%序列相似度的氨基酸序列所组成,较佳为相对于全长参考序列具有至少85.0%、90.0%、91.0%、92.0%、93.0%、94.0%、95.0%、96.0%、97.0%、98.0%或99.0%的序列相似度,更佳具有至少85.0%的序列相似度,更佳具有至少90.0%的序列相似度,最佳具有至少95.0%的序列相似度。另外,除非另有明确指明,否则多核苷酸序列包括/具有/由相对于参考多核苷酸序列的全长核苷酸序列,通常以SEQ ID NO或Genbank NO.所指明,具有至少80.0%序列相似度的氨基酸序列所组成,较佳为相对于全长参考序列具有至少85.0%、90.0%、91.0%、92.0%、93.0%、94.0%、95.0%、96.0%、97.0%、98.0%或99.0%的序列相似度,更佳具有至少85.0%的序列相似度,更佳具有至少90.0%的序列相似度,最佳具有至少95.0%的序列相似度。
为了达到本发明的目的,使用MatGAT2.01(Campanella et al.,2003,BMCBioinformatics 4:29)来决定百分比相似度。采用以下蛋白质的预设参数:(1)间隙成本存在:12以及延长:2;(2)使用的矩阵为BLOSUM65。在较佳实施例中,根据给定SEQ ID NO(即,参考序列)的全长序列或其部分来计算序列相似度。其部分较佳是指完整参考序列的至少50%、60%、70%、80%、90%或95%。
如于此所使所用,术语「糖基转移酶」是指能够催化糖部分从活化的供体(donor)分子转移至特定受体(acceptor)分子,形成糖苷键(glycosidic bonds)的酶。
术语「α-1,3-糖基转移酶」、「a1,3-糖基转移酶」、「α1,3糖基转移酶」、「a1,3-糖基转移酶」是指一种能够催化糖基从活化的供体分子转移到特定的受体分子中的α-1,3糖苷键(alpha-1,3glycosidic linkage)的酶。于此所使用的术语「α-1,3-糖基转移酶」是指α-1,3-半乳糖基转移酶与α-1,3-N-乙酰半乳糖胺基转移酶。
「α-1,3-半乳糖基转移酶」,也被称为「a-1,3-半乳糖基转移酶」、「a1,3-半乳糖基转移酶」,是催化半乳糖残基从UDP-半乳糖(UDP-Gal)转移到α-1,3键结(alpha-1,3linkage)的特定受体分子的糖基转移酶。
α-1,3-N-乙酰半乳糖胺转移酶,也被称为「a-1,3-N-乙酰半乳糖胺转移酶」、「a1,3N-乙酰半乳糖胺转移酶」、「a1,3-N-乙酰半乳糖胺转移酶」为催化N-乙酰半乳糖胺(GalNAc)从UDP-GalNAc转移到α-1,3键结的特定受体分子上的糖基转移酶。
在本发明中,多肽序列段被用来意指本发明中使用的α-1,3-糖基转移酶的片段,其为那些α-1,3-糖基转移酶共同的。此种多肽段是以单字母代码的氨基酸的序列的形式书写的。若在此种多肽段的特定位置上的一个氨基酸可以是数种氨基酸,该特定位置将有氨基酸代码X。除非于此另有提及,字母「X」是指任何可能的氨基酸。序列中的术语[FHMQT]是指F、H、M、Q或T作为该特定位置的可能氨基酸。序列中的术语[ACG]系指A、C或G作为可能的氨基酸在该特定位置。序列中的术语[ACIL]系指A、C、I或L作为可能的氨基酸在该特定位置。序列中的术语[AG]系指A或G作为可能的氨基酸在该特定位置。
如于此所使用的,「核苷酸糖」或「活化糖」一词指的是单糖的活化形式。活化单糖的范例包括UDP-半乳糖(UDP-Gal)、UDP-N-乙酰葡萄糖胺(UDP-GlcNAc)、UDP-N-乙酰半乳糖胺(UDP-GalNAc)、UDP-N-乙酰甘露糖胺(UDP-ManNAc)、GDP-岩藻糖(GDP-Fuc)、GDP-甘露糖(GDP-Man)、UDP-葡萄糖(UDP-Glc)、UDP-2-乙酰胺基-2,6-双脱氧-L-阿拉伯-4-己酮糖(UDP-2-acetamido-2,6-dideoxy-L-arabino-4-hexulose)、UDP-2-乙酰胺基-2,6-双脱氧-L-来苏-4-己酮糖(UDP-2-acetamido-2,6-dideoxy-L-lyxo-4-hexulose)、UDP-N-乙酰-L-鼠李糖胺(UDP-L-RhaNAc或UDP-2-乙酰胺基-2,6-双脱氧-L-甘露糖)、dTDP-N-乙酰岩藻糖胺、UDP-N-乙酰岩藻糖胺(UDP-L-FucNAc或UDP-2-乙酰胺基-2,6-双脱氧-L-半乳糖)、UDP-N-乙酰-L-6-脱氧塔罗糖胺(UDP-L-PneNAc或UDP-2-乙酰胺基-2,6-双脱氧-L-塔罗糖)、UDP-N-乙酰胞壁酸(UDP-N-acetylmuramic acid)、UDP-N-乙酰-L-异鼠李糖(UDP-L-QuiNAc或UDP-2-乙酰胺基-2,6-双脱氧-L-葡萄糖)、GDP-L异鼠李糖(GDP-L-quinovose)、CMP-N-乙酰神经氨酸(N-acetylneuraminic acid,CMP-Neu5Ac)、CMP-N-乙醇酰神经氨酸(N-glycolylneuraminic acid,CMP-Neu5Gc)、CMP-Neu4Ac、CMP-Neu5Ac9N3、CMP-Neu4,5Ac2、CMP-Neu5,7Ac2、CMP-Neu5,9Ac2、CMP-Neu5,7(8,9)Ac2、UDP-半乳糖醛酸盐(UDP-galacturonate)、UDP-葡萄糖醛酸盐(UDP-glucuronate)、GDP-鼠李糖(GDP-rhamnose)、或GDP-木糖(UDP-xylose)。核苷酸糖在糖基化反应中作为糖基供体。这些反应被糖基转移酶所催化。
于此所使用且在现有技术中一般所能理解的「寡糖」一词指的是含有少量,通常为三至二十个单糖(simple sugar),即单糖(monosaccharide)的糖聚合物。于此使用的单糖是还原糖。寡糖可以是还原糖或非还原糖,并具有还原和非还原端。还原糖是能够还原另一种化合物并且自身被氧化的任何糖,亦即,糖的羰基碳被氧化成羧基。本发明中使用的寡糖可为线性结构或可包括分支。两个糖单元之间的键结(linkage)(例如,糖苷键结、半乳糖苷键结、糖苷键结等)可以表示为例如于此可互换使用的1,4、1->4或(1-4)。例如,术语「Gal-b1,4-Glc」、「b-Gal-(1->4)-Glc」、「Galbeta1-4-Glc」与「Gal-b(1-4)-Glc」具有相同的意义,即一个β-糖苷键将半乳糖(Gal)的碳-1与葡萄糖(Glc)的碳-4连接起来。每个单糖都可以是环状形式(例如,吡喃糖(pyranose)的呋喃糖(furanose)形式)。个别的单糖单元之间的连接可以包括α1->2、α1->3、α1->4、α1->6、α2->1、α2->3、α2->4、α2->6、β1->2、β1->3、β1->4、β1->6、β2->1、β2->3、β2->4与β2->6。寡糖可以同时含有α-与β-糖苷键,也可以只含有β-糖苷键。
于此所使用的「单糖」一词指的是无法通过水解而分解成较简单糖类的糖,其被归类为醛糖(aldose)或酮糖(ketose),且每个分子包含一或多个羟基。单糖为仅包含一个简单糖的糖类。单糖的范例包括己糖、D-葡萄吡喃糖(D-glucopyranose)、D-半乳呋喃糖(D-galactofuranose)、D-半乳吡喃糖、L-半乳吡喃糖、D-甘露吡喃糖、D-异吡喃糖(D-allopyranose)、L-阿卓吡喃糖(L-altropyranose)、D-古洛吡喃糖(D-gulopyranose)、L-艾杜吡喃糖(L-idopyranose)、D-塔罗吡喃糖(D-talopyranose)、D-核呋喃糖、D-核吡喃糖、D-阿拉伯呋喃糖、D-阿拉伯吡喃糖、L-阿拉伯呋喃糖、L-阿拉伯吡喃糖、D-木吡喃糖(D-xylopyranose)、D-来苏吡喃糖(D-lyxopyranose)、D-赤藻呋喃糖(D-erythrofuranose)、D-苏呋喃糖(D-threofuranose)、庚糖、L-甘油-D-甘露吡喃庚糖(LDmanHep),D-甘油-D-甘露吡喃庚糖(DDmanHep)、6-脱氧-L-阿卓吡喃糖、6-脱氧-D-古洛吡喃糖、6-脱氧-D-塔罗吡喃糖、6-脱氧-D-半乳吡喃糖、6-脱氧-L-半乳吡喃糖、6-脱氧-D-甘露吡喃糖、6-脱氧-L-甘露吡喃糖、6-脱氧-D-古洛吡喃糖、2-脱氧-D-阿拉伯己糖、2-脱氧-D-赤藻戊糖、2,6-双脱氧-D-阿拉伯吡喃己糖、3,6-双脱氧-D-阿拉伯吡喃己糖、3,6-双脱氧-L-阿拉伯吡喃己糖、3,6-双脱氧-D-木吡喃己糖(3,6-dideoxy-D-xylopyranose)、3,6-双脱氧-D-核吡喃己糖、2,6-双脱氧-D-核吡喃己糖、3,6-双脱氧-L-木吡喃己糖、2-胺基-2-脱氧-D-葡萄吡喃糖、2-胺基-2-脱氧-D-半乳吡喃糖、2-胺基-2-脱氧-D-甘露吡喃糖、2-胺基-2-脱氧-D-异吡喃糖、2-胺基-2-脱氧-L-阿卓吡喃糖、2-胺基-2-脱氧-D-古洛吡喃糖、2-胺基-2-脱氧-L-艾杜吡喃糖、2-胺基-2-脱氧-D-塔罗吡喃糖、2-乙酰胺基-2-脱氧-D-葡萄吡喃糖、2-乙酰胺基-2-脱氧-D-半乳吡喃糖、2-乙酰胺基-2-脱氧-D-甘露吡喃糖、2-乙酰胺基-2-脱氧-D-异吡喃糖、2-乙酰胺基-2-脱氧-L-阿卓吡喃糖、2-乙酰胺基-2-脱氧-D-古洛吡喃糖、2-乙酰胺基-2-脱氧-L-艾杜吡喃糖、2-乙酰胺基-2-脱氧-D-塔罗吡喃糖、2-乙酰胺基-2,6-双脱氧-D-半乳吡喃糖、2-乙酰胺基-2,6-双脱氧-L-半乳吡喃糖、2-乙酰胺基-2,6-双脱氧-L-甘露吡喃糖、2-乙酰胺基-2,6-双脱氧-D-葡萄吡喃糖、2-乙酰胺基-2,6-双脱氧-L-阿卓吡喃糖、2-乙酰胺基-2,6-双脱氧-D-塔罗吡喃糖、D-葡萄吡喃糖醛酸(D-glucopyanuronic acid)、D-半乳呋喃糖醛酸、D-甘露吡喃糖醛酸、D-异吡喃糖醛酸、L-阿卓吡喃糖醛酸、D-古洛吡喃糖醛酸、L-古洛吡喃糖醛酸、L-艾杜吡喃糖醛酸、D-塔罗吡喃糖醛酸、唾液酸(sialic acid)、5-胺基-3,5-双脱氧-D-甘油-D-半乳-非-2-酮糖酸(5-Amino-3,5-dideoxy-D-glycero-D-galacto-non-2-ulosonic acid)、5-乙酰胺基-3,5-双脱氧-D-甘油-D-半乳-非-2-酮糖酸、5-乙醇酰胺基-3,5-双脱氧-D-甘油-D-半乳-非-2-酮糖酸(5-Glycolylamido-3,5-dideoxy-D-glycero-D-galacto-non-2-ulosonic acid)、赤藻糖醇(erythritol)、阿拉伯糖醇、木糖醇、核糖醇、葡萄糖醇、半乳糖醇、甘露糖醇、D-核-己-2-吡喃酮糖(D-ribo-Hex-2-ulopyranose)、D-阿拉伯-己-2-呋喃酮糖(D-果呋喃糖)、D-阿拉伯-己-2-吡喃酮糖、D-木-己-2-吡喃酮糖、L-来苏-己-2-吡喃酮糖、D-来苏-己-2-吡喃酮糖、D-苏-戊-2-吡喃酮糖(D-threo-pent-2-ulopyranose)、D-阿卓-庚-2吡喃酮糖、3-C-(羟甲基)-D-赤藻呋喃糖、2,4,6-三脱氧-2,4-二胺基-D-葡萄吡喃糖、6-脱氧-3-O-甲基-D-葡萄糖、3-O-甲基-D-鼠李糖(3-O-mehtyl-rhamnose)、2,6-双脱氧-3甲基-D-核己糖、2-胺基-3-O-[(R)-1-羧乙基]-2-脱氧-D-葡萄吡喃糖(2-Amino-3-O-[(R)-1-carboxyethyl]-2-deoxy-D-glucopyranose)、2-乙酰胺基-3-O-[(R)-羧乙基]-2-脱氧-D-葡萄吡喃糖、2-乙醇酰胺基-3-O-[(R)-1-羧乙基]-2-脱氧-D-葡萄吡喃糖(2-Glycolylamido-3-O-[(R)-1-carboxyethyl]-2-deoxy-D-glucopyranose)、3-脱氧-D-来苏-庚-2-吡喃酮糖酸(3-Deoxy-D-lyxo-hept-2-ulopyranosaric acid)、3-脱氧-D-甘露-辛-2-吡喃酮糖酸、3-脱氧-D-甘油-D-半乳-非-2-吡喃酮糖酸、5,7-二胺基-3,5,7,9-四脱氧-L-甘油-L-甘露-非-2-吡喃酮糖酸、5,7-二胺基-3,5,7,9-四脱氧-L-甘油-L-阿卓-非-2-吡喃酮糖酸、5,7-二胺基-3,5,7,9-四脱氧-D-甘油-D-半乳-非-2-吡喃酮糖酸、5,7-二胺基-3,5,7,9-四脱氧-D-甘油-D-塔罗-非-2-吡喃酮糖酸、葡萄糖、半乳糖、N-乙酰胺基葡萄糖、胺基葡萄糖、甘露糖、木糖、N-乙酰甘露糖胺、N-乙酰神经氨酸、N-乙醇酰神经氨酸(N-glycolylneuraminic acid)、唾液酸、N-乙酰半乳糖胺、半乳糖胺、岩藻糖、鼠李糖、葡萄糖醛酸(glucuronic acid)、葡萄糖酸(gluconicacid)、果糖与多元醇(polyols)。
术语多元醇是指含有多个羟基的醇。例如,甘油、山梨糖醇或甘露糖醇。
如此所使用,术语「双糖(disaccharide)」是指由两个单糖单元组成的糖。双糖的例子包括乳糖(Gal-b1,4-Glc)、乳-N-二糖(Gal-b1,3-GlcNAc)、N-乙酰乳糖胺(Gal-b1,4-GlcNAc)、LacDiNAc(GalNAc-b1,4-GlcNAc)、N-乙酰半乳糖胺基葡萄糖(GalNAc-b1,4-Glc)。
较佳为,于此所述的寡糖含有选自上方所用列表的单糖。寡糖的例子包括但不限于刘易斯型(Lewis-type)抗原寡糖、哺乳动物乳汁寡糖与人乳汁寡糖。
于此所使用的「哺乳类乳寡糖」(mammalian milk oligosaccharide;MMO)是指寡糖,例如但不限,于3-岩藻糖基乳糖、2'-岩藻糖基乳糖、6-岩藻糖基乳糖、2',3-双岩藻糖基乳糖、2',2-双岩藻糖基乳糖、3,4-双岩藻糖基乳糖、6'-唾液酸乳糖、3'-唾液酸乳糖、3,6-二唾液酸乳糖、6,6'-二唾液酸乳糖、8,3-二唾液酸乳糖、3,6-二唾液酸乳糖基-N-四糖、乳糖基双岩藻四糖、乳糖基-N-四糖、乳糖基-N-新四糖、乳糖基-N-岩藻戊糖II、乳糖基-N-岩藻戊糖I,乳糖基-N-岩藻戊糖III、乳糖基-N-岩藻戊糖V、乳糖基-N-岩藻戊糖VI、唾液酸乳糖基-N-四糖c,唾液酸乳糖基-N-四糖b、唾液酸乳糖基-N-四糖a、乳糖基-N-双岩藻糖己糖I、乳糖基-N-双岩藻糖己糖II、乳糖基-N-己糖、乳糖基-N-新己糖、对-乳糖基-N-己糖、单岩藻糖基单唾液酸乳糖-N-四糖c(monofucosylmonosialyllacto-N-neotetraose c)、单岩藻糖基对乳糖-N-己糖(monofucosyl para-lacto-N-hexaose)、单岩藻糖基乳糖-N-己糖III(monofucosyllacto-N-hexaose III)、异构岩藻糖基化乳糖-N-己糖III(isomericfucosylated lacto-N-hexaose III)、异构岩藻糖基化乳糖-N-己糖I(isomericfucosylated lacto-N-hexaose I)、唾液酸乳糖基-N-己糖、唾液酸乳糖基-N-新己糖II、双岩藻糖基-对-乳糖-N-己糖(difucosyl-para-lacto-N-hexaose)、双岩藻糖基乳糖-N-己糖(difucosyllacto-N-hexaose)、双岩藻糖基乳糖-N-己糖a(difucosyllacto-N-hexaosea)、双岩藻糖基乳糖-N-己糖c(difucosyllacto-N-hexaose c)、半乳糖基化几丁聚糖、岩藻糖基化寡糖、中性寡糖及/或唾液酸化寡糖。
哺乳动物乳汁寡糖(mammalian milk oligosaccharides)或MMOs包括哺乳期任何阶段的乳汁中存在的寡糖,包括人类的初乳(即,人乳寡糖或HMOs)与哺乳动物的初乳,哺乳动物包括但不限于牛(Bos Taurus)、羊(Ovis aries)、山羊(Capra aegagrus hircus)、双峰驼(Camelus bactrianus)、马(Equest ferus caballus)、猪(Sus scropha)、狗(Canislupus familiaris)、埃佐棕熊(Ursus arctos yesoensis)、北极熊(Ursus maritimus)、日本黑熊(Ursus thibetanus japonicus)、条纹臭鼬(Mephitis mephitis)、海豹(Cystophora cristata)、亚洲象(Elephas maximus)、非洲象(Loxodonta africana)、巨型食蚁兽(Myrmecophaga tridactyla)、普通瓶鼻海豚(Tursiops truncates)、北方小鲸(Balaenoptera acutorostrata)、塔马小袋鼠(Macropus eugenii)、红袋鼠(Macropusrufus)。普通刷尾负鼠(Trichosurus Vulpecula)、无尾熊(Phascolarctos cinereus)、东袋鼬(Dasyurus viverrinus)、鸭嘴兽(Ornithorhynchus anatinus)。人乳寡糖(HMOs)也被称为相同人乳寡糖,其化学成分与人乳中的人乳寡糖相同,但是是通过生物技术生产的(例如,使用无细胞系统或包括细菌、真菌、酵母、植物、动物或原生动物细胞与生物体,较佳为基因改造细胞与生物体)。相同人乳寡糖在市场上的名称为HiMO。
于此所使用的「路易斯型抗原」一词包括下列寡糖:H1抗原,其是Fucα1-2Galβ1-3GlcNAc,或简称为2'FLNB;Lewisa,即三糖Galβ1-3[Fucα1-4]GlcNAc,或简称4-FLNB;Lewisb,即丁糖Fucα1-2Galβ1-3[Fucα1-4]GlcNAc,或简称DiF-LNB;sialyl Lewisa即5-乙酰神经氨酰-(2-3)-半乳糖基-(1-3)-(吡喃岩藻糖基-(1-4))-N-乙酰葡糖胺(5-acetylneuraminyl-(2-3)-galactosyl-(1-3)-(fucopyranosyl-(1-4))-N-acetylglucosamine),或简写为Neu5Acα2-3Galβ1-3[Fucα1-4]GlcNAc;H2抗原,即Fucα1-2Galβ1-4GlcNAc,或2’岩藻糖基-N-乙酰-乳糖胺,简称2'FLacNAc;Lewisx,即三糖Galβ1-4[Fucα1-3]GlcNAc,或称为3-岩藻糖基-N-乙酰-乳糖胺(3-Fucosyl-N-acetyl-lactosamine),简称3-FLacNAc;Lewisy,即丁糖Fucα1-2Galβ1-4[Fucα1-3]GlcNAc,和唾液酸Lewisx即5-乙酰神经氨酰-(2-3)-半乳糖基-(1-4)-(吡喃岩藻糖基-(1-3))-N-乙酰葡糖胺(5-acetylneuraminyl-(2-3)-galactosyl-(1-4)-(fucopyranosyl-(1-3))-N-acetylglucosa mine),或简写为Neu5Acα2-3Galβ1-4[Fucα1-3]GlcNAc。
于此所使用的术语「Fuc-a1,2-Gal-R」是指与R基相连的末端双糖Fuc-alpha-1,2-Gal。于此所使用的术语「Fuc-a1,2-Gal-b1,3-R」是指以β-1,3糖苷连接方式与R基相连的末端双糖Fuc-alpha-1,2-Gal。于此所使用的术语「Fuc-a1,2-Gal-b1,3-GlcNAc-R」是指与R基团相连的末端三糖Fuc-alpha-1,2-Gal-b1,3-GlcNAc。在整个申请中使用的所述"R-基团"或"R"是指单糖、双糖、寡糖、脂质、肽或蛋白质,或与肽、糖肽、蛋白质、糖蛋白、脂质或糖脂(glycolipid)结合的单、双或寡糖。
术语「乳-N-三碳糖(lacto-N-triose)」、「LN3」与「LNT II」是指三糖GlcNAc-b1,3-Gal-b1,4-Glc。术语「乳-N-四糖」与「LNT」是指寡糖Gal-b1,3-GlcNAc-b1,3-Gal-b1,4-Glc。
术语「乳-N-岩藻五糖I」、「乳-N-岩藻五糖-I」、「LNFP-I」、「LNFP I」、「LNF I OH I型决定簇(determinant)」、「LNF I」、「LNF1」、「LNF1」与「血型H抗原戊糖1型(Blood group Hantigen pentaose type 1)」是指藉由α-1,2-岩藻糖基转移酶将岩藻糖残基从GDP-L-岩藻糖以α-1,2-键结转移到LNT的末端半乳糖残基的催化作用所获得的寡糖Fuc-a1,2-Gal-b1,3-GlcNAc-b1,3-Gal-b1,4-Glc,如Miyazaki et al.(2010,Methods Enzym.480,511-524)、
Figure BDA0004113329090000251
et al.(2015,Bioorg.Med.Chem.23,6799-6806)、Zhao et al.(2016,Chem.Commun.52,3899-3902)、Sugiyama et al.(2016,Glycobiology 26,1235-1247)与专利文献(例如,WO19008133,WO2014018596A2)所述。
术语「GalNAc-LNFP-I」和「A血型抗原己糖I型」可互换使用,且意指GalNAc-a1,3-(Fuc-a1,2)-Gal-b1,3-GlcNAc-b1,3-Gal-b1,4-Glc。
术语「LNFP-II」与「乳糖基-N-岩藻糖戊糖II」可互换使用,且意指Gal-b1,3-(Fuc-a1,4)-GlcNAc-b1,3-Gal-b1,4-Glc。
术语「LNFP-III」与「乳糖基-N-岩藻糖戊糖III」可互换使用,且意指Gal-b1,4-(Fuc-a1,3)-GlcNAc-b1,3-Gal-b1,4-Glc。
术语「LNFP-V」与「乳糖基-N-岩藻糖戊糖V」可互换使用,且意指Gal-b1,3-GlcNAc-b1,3-Gal-b1,4-(Fuc-a1,3)-Glc。
术语「LNFP-VI」、「LNnFP V」与「乳糖基-N-新岩藻戊糖V」可互换使用,且意指Gal-b1,4-GlcNAc-b1,3-Gal-b1,4-(Fuc-a1,3)-Glc。
术语「LNnFP I」和「乳糖基-N-新岩藻糖戊糖I」可互换使用,且意指Fuc-a1,2-Gal-b1,4-GlcNAc-b1,3-Gal-b1,4-Glc。
术语「LNDFH I」、「乳糖基-N-双岩藻己糖I」、与「LDFH I」可互换使用,且意指Fuc-a1,4-(Fuc-a1,2-Gal-b1,3)-GlcNAc-b1,3-Gal-b1,4-Glc,其包括Lewisb抗原Fuc-a1,4-(Fuc-a1,2-Gal-b1,3)-GlcNAc。
术语「LNDFH II」、「乳糖基-N-双岩藻己糖II」、「Lewis a-Lewis x」与「LDFH II」可互换使用,且意指Fuc-a1,4-(Gal-b1,3)-GlcNAc-b1,3-Gal-b1,4-(Fuc-a1,3)-Glc。
术语「LNnDFH」、「乳糖基-N-新双岩藻己糖」和「Lewis x己糖」可互换使用,且意指Gal-b1,4-(Fuc-a1,3)-GlcNAc-b1,3-Gal-b1,4-(Fuc-a1,3)-Glc。
术语「alpha-丁糖」与「A-丁糖」可互换使用,且意指GalNAc-a1,3-(Fuc-a1,2)-Gal-b1,4-Glc。
于此所使用且如本领域中通常理解的,「岩藻糖基化寡糖」是携带岩藻糖残基的寡糖。例子包括2'-岩藻糖基乳糖(2'-fucosyllactose,2'FL)、3-岩藻糖基乳糖(3FL)、4-岩藻糖基乳糖(4FL)、6-岩藻糖基乳糖(6FL)、双岩藻基乳糖(diFL)、乳双岩藻丁糖(lactodifucotetraose,LDFT)、乳糖基-N-岩藻糖戊糖I(LNFP I)、乳糖基-N-岩藻戊糖II(LNFP II)、乳糖基-N-岩藻戊糖III(LNFP III)、乳糖基-N-岩藻戊糖V(LNFP V)、乳糖基-N-岩藻戊糖VI(LNFP VI)、乳糖基-N-新岩藻糖戊糖I、乳糖基-N-双岩藻己糖I(LDFH I)、乳糖基-N-双岩藻己糖II(LDFH II)、单岩藻糖基乳糖-N-己糖III(Monofucosyllacto-N-hexaose III,MFLNH III)、双岩藻基乳糖基-N-己糖(DFLNHa)、双岩藻基-乳糖基-N-新己糖。
本发明中使用的术语「alpha-1,2-岩藻糖基转移酶」、「alpha 1,2岩藻糖基转移酶」、「2-岩藻糖基转移酶」、「α-1,2-岩藻糖基转移酶」、「α1,2岩藻糖基转移酶」、「2岩藻糖基转移酶」、「2-FT」或「2FT」可互换使用,意指催化岩藻糖从供体GDP-L-岩藻糖以α-1,2-键结转移到受体分子中的糖基转移酶。本发明中使用的术语「2'岩藻糖基乳糖」、「2'-岩藻糖基乳糖」、「alpha-1,2-岩藻糖基乳糖」、「alpha 1,2岩藻糖基乳糖」、「α-1,2-岩藻糖基乳糖」、「α1,2岩藻糖基乳糖」、「Galβ-4(Fucα1-2)Glc」、「2FL」或「2'FL」可互换使用,是指通过alpha-1,2-岩藻糖基转移酶的催化,从GDP-L-岩藻糖中将岩藻糖残基以α-1,2-键结转移至乳糖获得的产物。本发明中使用的术语「双岩藻基乳糖」、「二-岩藻糖基乳糖」、「乳双岩藻丁糖」、「2',3-双岩藻基乳糖」、「2',3双岩藻基乳糖」、「α-2',3-岩藻糖基乳糖」、「α2',3岩藻糖基乳糖」、「Fucα1-2Galβ1-4(Fucα1-3)Glc」、「DFLac」、「2',3diFL」、「DFL」、「DiFL」或「diFL」可互换使用。
如于此所使用,「岩藻糖基化途径(fucosylation pathway)」是由酶及其各自的基因、甘露糖-6-磷酸糖异构酶、磷酸甘露糖变位酶、甘露糖-1-磷酸鸟苷转移酶、GDP甘露糖4,6-脱水酶、GDP-L-岩藻糖合成途径及/或再利用路径L-岩藻糖激酶/GDP-L-岩藻糖焦磷酸化酶(GDP-L-fucose synthase and/or the salvage pathway L-fucokinase/GDP-fucosepyrophosphorylase),结合导致α1,2、α1,3、α1,4或α1,6岩藻糖基化寡糖的岩藻糖基转移酶。
如于此所使用,「半乳糖基化途径(galactosylation pathway)」是由酶及其各自的基因体成的生化途径,半乳糖-1-差向异构酶、半乳糖激酶、葡萄糖激酶、半乳糖-1-磷酸尿苷酰转移酶、UDP-葡萄糖4-差向异构酶、葡萄糖-1-磷酸尿苷酰转移酶及/或磷酸葡萄糖变位酶(phosphoglucomutase),与导致寡糖的2、3、4、6羟基上形成α或β结合的半乳糖的半乳糖基转移酶结合。
如于此所使用,「N-乙酰葡萄糖胺碳水化合物途径(N-acetylglucosaminecarbohydrate pathway)」是由酶及其各自的基因体成的生化途径,L-谷氨酰胺-D-果糖-6-磷酸胺基转移酶、葡萄糖胺-6-磷酸脱胺酶、磷酸葡萄糖胺变位酶、N-乙酰葡萄糖胺-6-磷酸去乙酰酶、葡萄糖胺6-磷酸N-乙酰转移酶、N-乙酰葡萄糖胺-1-磷酸尿苷酰转移酶、葡萄糖胺-1-磷酸乙酰转移酶及/或葡萄糖胺-1-磷酸乙酰转移酶,与导致寡糖的3、4、6羟基上形成α或β结合的N-乙酰葡萄糖胺的糖基转移酶结合。
于此所使用的术语「糖肽」是指含有一个或多个糖基的肽,这些糖基是单糖、双糖、寡糖、多糖及/或聚糖(glycans),是共价连接到肽的氨基酸残基的侧链上。糖肽包括天然的糖肽抗生素,例如由各种土壤放线菌产生的糖基化非核糖体肽,它们通过与细胞质膜外表面的生长肽聚糖(peptidoglycan)的酰基-D-丙氨酰-D-丙氨酸(acyl-D-alanyl-D-alanine,D-Ala-D-Ala)末端结合而针对革兰氏阳性细菌,以及合成的糖肽抗生素。天然糖肽的共同核心是由7个氨基酸组成的环肽构成,环肽上结合有2个糖。糖肽的例子包括万古霉素(vancomycin)、替考拉宁(teicoplanin)、奥利万星(oritavancin)、氯瑞霉素(chloroeremomycin)、特拉万星(telavancin)与达巴万星(dalbavancin)。
术语「糖蛋白」与「糖多肽」可互换使用,是指含有共价连接到一多肽的氨基酸残基的侧链的为单糖、双糖、寡糖、多糖及/或聚糖的一个或多个糖基团的多肽。
如于此所使用的,术语「糖脂(glycolipid)」是指本领域普遍已知的任何一种糖脂。糖脂(GLs)可以被细分为简单(simple)糖脂(SGLs)与复合(complex)(CGLs)糖脂。简单的GLs,有时被称为糖脂(saccharolipids),是双组分(糖基与脂质)的GLs,其中糖基与脂质分子直接彼此连接在一起。SGL的例子包括糖基化脂肪酸、脂肪醇(fatty alcohol)、类胡萝卜素(carotenoid)、类藿烷(hopanoid)、固醇(sterol)或仲康酸(paraconic acid)。细菌产生的SGL可分为鼠李糖脂、糖脂(glucolipid)、海藻脂(trehalolipid)、其他糖基化(不含海藻糖)霉菌酸盐(mycolate)、含海藻糖的寡糖脂质、糖基化脂肪醇、糖基化大环内酯(macro-lactone)与大环内酰胺(macro-lactam)、糖基大环内二酯(glycomacrodiolides)(糖基化大环内二酯(glycosylated macrocyclic dilactones))、糖基类胡萝卜素与糖基萜类(glyco-terpenoid),以及糖基化类藿烷/固醇。然而,复合糖脂(CGL)在结构上更具异质性,由于除了糖基(glycosyl)与脂质部分外,它们还包含其他残基,例如甘油(糖基甘油脂(glycoglycerolipids))、肽(糖肽脂)、酰化鞘氨醇(acylated-sphingosine)(糖鞘脂(glycosphingolipids))或其他残基(脂多糖(lipopolysaccharides)、酚糖脂(phenolicglycolipid)、核苷脂(nucleoside lipids))。
于此所使用的「膜转运蛋白」是指作为细胞膜的一部分或与的相互作用并控制分子和信息在细胞内外流动的蛋白质。因此,膜蛋白参与运输作用,无论是输入至细胞中或输出至细胞外。
此种膜转运蛋白可以是运输蛋白(porter)、P-P键结水解驱动运输蛋白、β桶孔蛋白(β-barrel porin)、辅助运输蛋白(auxiliary transport protein)、推定运输蛋白(putative transport protein)及磷酸转移驱动基团转位蛋白(phosphotransfer-drivengroup translocator)由Saier实验室生物信息学组操作和策划位于www.tcdb.org的运输蛋白分类数据库而定义,运输蛋白分类数据库提供膜转运蛋白的功能和系统发育分类。运输蛋白分类数据库详细介绍了IUBMB批准的膜转运蛋白的综合分类系统,称为膜转运蛋白分类(transporter classification,TC)系统。如于此所述的TCDB分类检索是根据TCDB.org于2019年6月17日释出的版本而定义。
运输蛋白(porter)是单向运输蛋白(uniporter)、同向运输蛋白(symporter)、反向运输蛋白(antiporter)的共同名称,其利用载体所介导的过程(Saier et al.,NucleicAcids Res.44(2016)D372-D379)。它们属于电化学电位驱动的运输蛋白,也被称为二级载体型促进子(facilitator)。当膜转运蛋白利用载体介导的过程来催化二级载体的单向运输或单一物质通过促进扩散或在膜电位依赖性的过程中(如果溶质是带电的)进行运输时;当两个或更多种的物质在一个紧密耦合的过程中二级载体向相反的方向运输时,不与化学能以外的直接能量形式相耦合;及/或当两个或更多的物种在一个紧密耦合的过程中二级载体一起向同一方向运输时,不与化能以外的直接能量形式相耦合,由(Forrest et al.,Biochim.Biophys.Acta 1807(2011)167-188),则包括在这一分类的中。这些系统通常具有立体特异性。溶质:溶质反运输是二级载体的一个特点。运输蛋白与酶的动态缔合产生了功能性膜运输代谢物(metabolon),将通常从细胞外获得的通道受质直接输送到其细胞代谢中(Moraes andReithmeier,Biochim.Biophys.Acta 1818(2012),2687-2706)。藉由此运输蛋白系统运输的溶质包括但不限于阳离子、有机阴离子、无机阴离子、核苷、氨基酸、多元醇、磷酸化的糖解中间产物(phosphorylated glycolytic intermediates)、渗透物、嗜铁素(siderophores)。
若膜转运蛋白水解无机焦磷酸盐、ATP或另一种三磷酸核苷的二磷酸键以驱动溶质的主动摄入(uptake)及/或排出(extrusion),膜转运蛋白则包含于P-P键结水解驱动运输蛋白类别(Saier et al.,Nucleic Acids Res.44(2016)D372-D379)。膜运输蛋白可能会或可能不会暂时被磷酸化,但受质不会被磷酸化。通过P-P键结水解驱动运输蛋白类别所运输的基质包括但不限于阳离子、重金属、β-葡聚糖、UDP-葡萄糖、脂多糖、磷壁酸(teichoicacid)。
β桶孔蛋白膜转运蛋白(β-Barrel porins membrane transporter proteins)形成穿膜孔洞,通常使溶质得以不需能量便横跨穿越膜。这些蛋白的穿膜部分完全由形成β桶状的β链(β-strand)所组成(Saier et al.,Nucleic Acids Res.44(2016)D372-D379)。这些孔蛋白型蛋白质存在于革兰氏阴性菌、粒线体、色素体(plastid)的外膜中,且可能存在于抗酸性的(acid-fast)革兰氏阳性菌的外膜中。藉由这些β桶孔蛋白所运输的溶质包括但不限于核苷、棉子糖(raffinose)、葡萄糖、β-葡萄糖苷、寡糖。
辅助运输蛋白(auxiliary transport protein)定义为促进横跨一或更多个的生物膜的运输的蛋白质,但其本身不会直接参与运输的过程。这些膜转运蛋白总是与一或多个已建立的运输系统一起作用,例如但不限于外膜因子(outer membrane factors,OMFs)、多糖运输蛋白(polysaccharide porters,PST porters)、ATP-结合盒型(ATP-bindingcassette,ABC)运输蛋白。它们可提供与能量耦合运输相关的功能、在复合物形成的过程中扮演结构性的角色、发挥生物或稳定性功能或调节功能(Saier et al.,Nucleic AcidsRes.44(2016)D372-D379)。辅助运输蛋白的范例包括但不限于参与多糖运输的多糖共聚酶家族,参与细菌素(bacteriocin)和化学毒素运输的膜融合蛋白家族。
推定运输蛋白(putative transport protein)包含的家族在成员的运输功能建立时归类到别处,或者是在提议的运输功能被否定时从运输蛋白分类系统中删除。这些家族包括一个或多个成员,已建议其具有运输功能,但这种功能的证据尚不完整(Saier etal.,Nucleic Acids Res.44(2016)D372-D379)。如2019年6月17日所释出,在TCDB系统的下分类为此群组的推定运输蛋白范例包括但不限于铜运输蛋白。
磷酸转移驱动基团转位蛋白(phosphotransfer-driven group translocator)也称为细菌磷酸烯醇丙酮酸盐:糖磷酸转移酶系统(PTS)的PEP依赖性磷酰基转移驱动转位蛋白。衍生自胞外糖的反应产物为细胞质糖磷酸(cytoplasmic sugar-phosphate)。催化糖磷酸化的酶成分在紧密耦合的过程中迭加在运输过程中。PTS系统涉及许多不同的方面,包括调节和趋化性、生物膜形成和发病机制(Lengeler,J.Mol.Microbiol.Biotechnol.25(2015)79-93;Saier,J.Mol.Microbiol.Biotechnol.25(2015)73-78)。如2019年6月17日所释出,在TCDB系统的下分类在磷酸转移驱动基团转位蛋白的中的膜转运蛋白家族包括与葡萄糖-葡萄糖苷、果糖-甘露糖醇、乳糖-N,N'-二乙酰几丁二糖-β-葡萄糖苷(lactose-N,N’-diacetylchitobiose-beta-glucoside)、葡萄糖醇、半乳糖醇、甘露糖-果糖-山梨糖和抗坏血酸的转运相关的PTS系统。
主要促进子超家族(main facilitator superfamily,MFS)是一个膜转运蛋白超家族,催化单向运输、溶质:阳离子(H+,但少数是Na+)同向运输及/或溶质:H+或溶质:溶质反向运输。根据Saier实验室生物信息学组(www.tcdb.org)运作的运输蛋白体分类数据库的定义,大多数运输蛋白的长度为400-600个氨基酸残基,具有12、14或偶尔24个穿膜α螺旋形扳手(transmembraneα-helical spanners,TMS)。
于此所使用的「糖流出运输蛋白(sugar efflux transporter,SET)」指的是SET家族的膜蛋白,SET家族的膜蛋白为具有InterPRO结构域IPR004750的蛋白质及/或属于eggNOGv4.5家族ENOG410XTE9的蛋白质。可使用https://www.ebi.ac.uk/interpro/的在线工具或以预设数值使用InterProScan(https://www.ebi.ac.uk/interpro/download.html)的独立版本来识别interPRO结构域。可使用eggNOG-mapperv1(http://eggnogdb.embl.de/#/app/home)的独立版本来识别eggNOGv4.5中的直系同源家族。
于此所使用的「嗜铁素(siderophore)」指的是各种微生物主要为铁离子特异性螯合剂的次级代谢物。这些分子被分类为儿茶酚酸盐(catecholater)、异羟肟酸盐(hydroxamate)、羧酸盐和混合类型。嗜铁素通常由非核糖体肽合成酶(nonribosomalpeptide synthetase,NRPS)依赖性途径或NRPS非依赖性途径(NRPS independentpathway,NIS)合成。NRPS依赖性嗜铁素生物合成途径中最重要的前体为分支酸(chorismate)。可由分支酸利用异分支酸合成酶、异分支酸酶与2,3-二羟基苯甲酸-2,3-脱氢酶催化的三步反应形成2,3-DHBA。当使用鸟氨酸(ornithine)作为嗜铁素的前体时,生物合成取决于L-鸟氨酸N5-单氧酶(L-ornithine N5-monooxygenase)催化的鸟氨酸羟基化。在NIS途径中,嗜铁素生物合成的重要步骤为N(6)-羟基赖氨酸合成酶(N(6)-hydroxylysine synthase)。
将嗜铁素输出至细胞外所需的运输蛋白。至今为止,在过程中鉴定出了四个膜蛋白超家族:主要促进子超家族(MFS)、多药/寡糖脂/多糖翻转酶超家族(Multidrug/Oligosaccharidyl-lipid/Polysaccharide Flippase Superfamily,MOP)、抗性、结瘤与细胞分裂超家族(the resistance,nodulation and cell division superfamily,RND)与ABC超家族。一般而言,参与嗜铁素输出的基因会与嗜铁素基因群集在一起。于此所使用的「嗜铁素输出蛋白」一词指的是将嗜铁素输出至细胞外所需的运输蛋白。
ATP结合盒(ATP-binding cassette,ABC)超家族包含摄入与流出运输系统,且这两群组的成员一般会松散地群集在一起。没有蛋白质磷酸化的ATP水解为运输提供能量。ABC超家族中有几十个家族,家族通常与受质特异性相关。成员根据由Saier实验室生物信息学组运作的运输蛋白分类数据库定义的3.A.1类进行分类,其位于www.tcdb.org,并提供膜转运蛋白的功能和系统亲源分类。
「允许流出(enabled efflux)」一词指的是导入溶质在细胞膜及/或细胞壁的运输活性。所述的运输可以通过导入及/或增加本发明中所述的运输蛋白的表达量而实现。「增强的流出」一词指的是改善溶质在细胞膜及/或细胞壁的运输活性。可通过导入及/或增加本发明中所述的膜转运蛋白的表达量来增强溶质在细胞膜及/或细胞壁的运输。膜转运蛋白的「表达」定义为编码所述膜转运蛋白的基因在所述基因是内源基因的情况下的「过表达」,或在编码所述膜转运蛋白的基因是异源基因的情况下的「表达」,而异源基因不存在于野生型菌株或细胞中。
「纯化的」一词指的是实质上不含干扰生物分子活性的成分的材料。对于细胞、糖类、核酸、多肽、肽、糖蛋白、糖肽、脂质与糖脂而言,术语「纯化的」指的是基本上或实质上不含在其天然状态下通常伴随该材料的组分的材料。一般而言,本发明纯化的糖类、寡糖、肽、糖肽、蛋白质、糖蛋白、脂质、糖脂或核酸的纯度至少约为50%、55%、60%、65%、70%、75%、80%或85%,通常至少约为90%、91%、92%、93%、94%、95%、96%、97%、98%或99%,利用银染凝胶上的条带强度或其他决定纯度的方法进行测量。可利用本领域习知的许多方法来表明纯度或均质度,例如,蛋白质或核酸样品的聚丙烯酰胺凝胶电泳,并接着进行染色而显像。出于某些目的,需要高分辨率并使用HPLC或类似的纯化方法。对于寡糖而言,可利用以下方法,但不限于薄层色层分析、气相色层分析、NMR、HPLC、毛细管电泳或质谱法来决定纯度。
术语「培养物」是指其中培养或发酵细胞的培养基、细胞本身和本发明的细胞在全肉汤中产生的α-1,3-糖基化寡糖,即细胞内部(细胞内(intracellularly))与细胞外(细胞外(extracellularly))。术语「培养物」是指其中培养或发酵细胞的培养基、细胞本身和本发明的细胞在全肉汤中产生的α-1,3-糖基化寡糖,即细胞内部(细胞内(intracellularly))与细胞外(细胞外(extracellularly))。
如于此所使用的,「前体」一词是指被细胞吸收及/或合成用于生产特定寡糖的物质。就此意义而言,前体可以是如于此所定义的受体(acceptor),但也可以是另一物质-代谢物,在细胞内作为寡糖的生化合成路径的一部分而先进行修饰。这类前体的范例包括于此所定义的受体,及/或葡萄糖、半乳糖、果糖、甘油、唾液酸、岩藻糖、甘露糖、麦芽糖、蔗糖、乳糖、二羟基丙酮、胺基葡萄糖、N-乙酰葡萄糖胺、甘露糖胺、N-乙酰甘露糖胺、半乳糖胺、N-乙酰半乳糖胺、磷酸化糖例如但不限于葡萄糖-1-磷酸、半乳糖-1-磷酸、葡萄糖-6-磷酸、果糖-6-磷酸、果糖-1,6-二磷酸、甘露糖-6-磷酸、甘露糖-1-磷酸、甘油-3-磷酸、甘油醛-3-磷酸、二羟基丙酮-磷酸、葡糖胺-6-磷酸、N-乙酰-葡糖胺-6-磷酸、N-乙酰甘露糖胺-6-磷酸、N-乙酰葡萄糖胺-1-磷酸、N-乙酰-神经氨酸-9-磷酸及/或如于此所定义的核苷酸活化糖,例如UDP-葡萄糖、UDP-半乳糖、UDP-N-乙酰葡萄糖胺、CMP-唾液酸、GDP-甘露糖、GDP-4-脱氢-6-脱氧-α-D-甘露糖、GDP-岩藻糖。
如于此所使用,术语「受体」是指可以被糖基转移酶修饰的单糖、二糖或寡糖、蛋白质、糖蛋白、肽、糖肽、脂质或糖脂。此类受体的例子包括葡萄糖、半乳糖、果糖、甘油、唾液酸、岩藻糖、甘露糖、麦芽糖、蔗糖、乳糖、乳糖-N-二糖(LNB)、乳-N-丙糖、乳糖-N-四糖(LNT)、乳-N-新四糖(LNnT)、N-乙酰基-乳糖胺(LacNAc)、乳-N-戊糖(LNP)、乳-N-新戊糖、对乳-N-戊糖、对乳-N-新戊糖、乳-N-新戊糖I、乳-N-六糖(LNH)、乳-N-新六糖(LNnH)、对乳-N-新六糖(pLNnH)、对乳-N-六糖(pLNH)、乳-N-庚糖、乳-N-新庚糖、对乳-N-新庚糖、对乳-N-庚糖、乳-N-八糖(LNO)、乳-N-新八糖、异乳-N-八糖、对乳-N-八糖、异乳-N-新八糖、新乳-N-新八糖、对乳-N-新八糖、异乳-N-九糖、新乳-N-九糖、乳-N-九糖、乳-N-十糖、异乳-N-十糖、新乳-N-十糖、乳-N-新十糖、半乳糖基乳糖、以1、2、3、4、5或多个N-乙酰乳糖胺单元及/或1、2、3、4、5或多个乳-N-二糖单元扩展的乳糖,与含有1个或多个N-乙酰乳糖胺单元和或1个或多个乳-N-二糖单元的寡糖,或成为寡糖脂中间物(intermediate into oligosaccharide)、其岩藻糖基化和唾液酸化形式、肽、多肽、脂质、鞘脂、脑苷脂、神经酰胺脂质、磷脂酰肌醇脂质和糖基化形式的肽、多肽、脂质、鞘脂、脑苷脂、神经酰胺脂质、磷脂酰肌醇。
发明详述
根据第一方面,本发明提供了一种产生α-1,3糖基化形式的Fuc-a1,2-Gal-R的方法,其中所述α-1,3糖基化发生在岩藻糖-α-1,2-半乳糖R(Fuc-a1,2-Gal-R)的末端「岩藻糖-α1,2-半乳糖」-基团。该方法包括下列步骤:
i)提供具有合成Fuc-a1,2-Gal-R、表达α-1,3-糖基转移酶(alpha-1,3-glycosyltransferase)的能力,并具有合成为该α-1,3-糖基转移酶的供体的核苷酸-糖(nucleotide-sugar)的能力的细胞,与
ii)在允许合成该Fuc-a1,2-Gal-R、表达该α-1,3-糖基转移酶、合成该核苷酸-糖与合成该α-1,3糖基化形式的Fuc-a1,2-Gal-R的条件下培养该细胞,
iii)较佳为自该培养物分离该α-1,3糖基化形式的Fuc-a1,2-Gal-R。
在一实施例中,本发明提供了一种产生α-1,3糖基化形式的Fuc-a1,2-Gal-R的混合物的方法。该方法包括下列步骤:
提供具有合成至少两种不同的Fuc-a1,2-Gal-R的能力、表达α-1,3-糖基转移酶并且具有合成为该α-1,3-糖基转移酶的供体的核苷酸-糖的能力的细胞,较佳为单一细胞,与
在允许合成该至少两种不同的Fuc-a1,2-Gal-R、表达该α-1,3-糖基转移酶、合成该核苷酸-糖与合成该α-1,3糖基化形式的各Fuc-a1,2-Gal-R的条件下培养该细胞,
较佳为自该培养物分离该α-1,3糖基化形式的各Fuc-a1,2-Gal-R。
根据本发明,所述混合物包含或由至少两种不同的「α-1,3糖基化形式的Fuc-a1,2-Gal-R」组成,优选至少三种不同的“α-1,3糖基化形式的Fuc”-a1,2-Gal-R',更优选至少四种不同的「α-1,3糖基化形式的Fuc-a1,2-Gal-R」。较佳为,所述至少两种、更佳为至少三种、甚至更佳为至少四种不同的Fuc-a1,2-Gal-R由所述细胞合成。在进一步及/或替代实施方案中,α-1,3糖基化形式的Fuc-a1,2-Gal-R的混合物可以通过如于此揭露的方法获得,其中所述细胞表达多种α-1,3-糖基转移酶(优选α-1,3-半乳糖基转移酶与α-1,3-N-乙酰半乳糖胺基转移酶)。在进一步及/或替代实施方案中,可以通过如于此揭露的方法获得α-1,3糖基化形式的Fuc-a1,2-Gal-R的混合物,其中提供如于此揭露的多种不同受体。
在第二方面中,本发明提供了代谢工程化细胞,用于产生如于此所述的α-1,3糖基化形式的Fuc-a1,2-Gal-R。在本发明的上下文中,本文所述的α-1,3糖基化形式的Fuc-a1,2-Gal-R较佳为不发生于所述细胞的野生型先驱细胞(progenitor)中。
提供代谢工程化细胞,较佳为单一细胞,其具有合成Fuc-a1,2-Gal-R的能力,其表达α-1,3-糖基转移酶并且其具有具有合成为该α-1,3-糖基转移酶的供体的核苷酸-糖的能力。
根据本发明,所述用于产生α-1,3糖基化形式的Fuc-a1,2-Gal-R的方法可利用非代谢工程化细胞或可利用如于此揭露的代谢工程化细胞。
在本发明的上下文中,应当理解,所述Fuc-a1,2-Gal-R、核苷酸-糖与α-1,3糖基化形式的Fuc-a1,2-Gal-R形式较佳为在细胞内合成。技术人员将进一步理解,合成的α-1,3糖基化形式的Fuc-a1,2-Gal-R的一部分或基本上全部保留在细胞内及/或被动地或通过主动运输(active transport)排出到细胞外。
在整个申请中,除非另有明确说明,根据本发明,「经基因修饰的细胞」或「经代谢工程化的细胞」较佳为意指分别经基因修饰或代谢工程化以产生α-1,3-糖基化形式的Fuc-a1,2-Gal-R的细胞。
在本发明的上下文中,术语「α-1,3糖基化形式」的Fuc-a1,2-Gal-R(或其衍生结构,如于此所述)较佳表示糖部分(例如单糖)通过α-1,3-糖苷键与岩藻糖-α-1,2-半乳糖-R(Fuc-a1,2-Gal-R)的所述“Fuc-a1,2-Gal”-基团的半乳糖残基结合,即,糖部分不直接连接到包含在Fuc-a1,2-Gal-R中的另一个残基,例如a1,2-连接的岩藻糖或包含在R部分中的任何残基。
在一较佳实施例中,所述α-1,3糖基化形式的Fuc-a1,2-Gal-R是(i)Gal-a1,3-(Fuc-a1,2)-Gal-R,较佳为Gal-a1,3-(Fuc-a1,2)-Gal-b1,3-R,更佳为Gal-a1,3-(Fuc-a1,2)-Gal-b1,3-GlcNAc-R,甚至更佳为Gal-a1,3-(Fuc-a1,2)-Gal-b1,3-GlcNAc-b1,3-R,甚至更佳为Gal-a1,3-(Fuc-a1,2)-Gal-b1,3-GlcNAc-b1,3-Gal-R,最佳为Gal-a1,3-(Fuc-a1,2)-Gal-b1,3-GlcNAc-b1,3-Gal-b1,4-Glc;或(ii)GalNAc-a1,3-(Fuc-a1,2)-Gal-R,较佳为GalNAc-a1,3-(Fuc-a1,2)-Gal-b1,3-R,更佳为GalNAc-a1,3-(Fuc-a1,2)-Gal-b1,3-GlcNAc-R,甚至更佳为GalNAc-a1,3-(Fuc-a1,2)-Gal-b1,3-GlcNAc-b1,3-R,甚至更佳为GalNAc-a1,3-(Fuc-a1,2)-Gal-b1,3-GlcNAc-b1,3-Gal-R,最佳为GalNAc-a1,3-(Fuc-a1,2)-Gal-b1,3-GlcNAc-b1,3-Gal-b1,4-Glc。
换句话说,在一较佳实施例中,所述α-1,3糖基化形式的Fuc-a1,2-Gal-R是α-1,3半乳糖或α-1,3GalNAc修饰形式的Fuc-a1,2-Gal-R,其中所述半乳糖或GlcNAc以α-1,3-糖苷键结合至岩藻糖-α-1,2-半乳糖-R(Fuc-a1,2-Gal-R)的「Fuc-a1,2-Gal」基团的半乳糖残基。
在一更佳实施例中,所述α-1,3糖基化形式的Fuc-a1,2-Gal-R为Gal-a1,3-(Fuc-a1,2)-Gal-R,较佳为Gal-a1,3-(Fuc-a1,2)-Gal-b1,3-R,更较佳为Gal-a1,3-(Fuc-a1,2)-Gal-b1,3-GlcNAc-R,甚至更较佳为Gal-a1,3-(Fuc-a1,2)-Gal-b1,3-GlcNAc-b1,3-R,甚至更较佳为Gal-a1,3-(Fuc-a1,2)-Gal-b1,3-GlcNAc-b1,3-Gal-R,最较佳为Gal-a1,3-(Fuc-a1,2)-Gal-b1,3-GlcNAc-b1,3-Gal-b1,4-Glc。换言之,在一更佳实施例中,所述α-1,3糖基化形式的Fuc-a1,2-Gal-R是α-1,3半乳糖修饰的Fuc-a1,2-Gal-R。
在另一更佳实施例中,所述α-1,3糖基化形式的Fuc-a1,2-Gal-R是GalNAc-a1,3-(Fuc-a1,2)-Gal-R,较佳为GalNAc-a1,3-(Fuc-a1,2)-Gal-b1,3-R,更较佳为GalNAc-a1,3-(Fuc-a1,2)-Gal-b1,3-GlcNAc-R,甚至更较佳为GalNAc-a1,3-(Fuc-a1,2)-Gal-b1,3-GlcNAc-b1,3-R,甚至更较佳为GalNAc-a1,3-(Fuc-a1,2)-Gal-b1,3-GlcNAc-b1,3-Gal-R,最较佳为GalNAc-a1,3-(Fuc-a1,2)-Gal-b1,3-GlcNAc-b1,3-Gal-b1,4-Glc。换言的,在更佳的实施方案中,所述α-1,3糖基化形式的Fuc-a1,2-Gal-R是1,3GalNAc修饰的Fuc-a1,2-Gal-R。
在整个申请中,除非另有明确说明,所述Fuc-a1,2-Gal-R较佳为为Fuc-a1,2-Gal-b1,3-R,更较佳为所述Fuc-a1,2-Gal-R为Fuc-a1,2-Gal-b1,3-GlcNAc-R,甚至更较佳为,所述Fuc-a1,2-Gal-R为乳-N-岩藻糖五糖I(LNFP-I,Fuc-a1,2-Gal-b1,3-GlcNAc-b1,3-Gal-b1,4-Glc)。
在一实施例中,所述α-1,3糖基化形式的Fuc-a1,2-Gal-R为组织血型抗原(histoblood group antigen,HBGA)系统的结构。在一较佳实施例中,所述α-1,3糖基化形式的Fuc-a1,2-Gal-R为Gal-a1,3-(Fuc-a1,2)-Gal-b1,3-GlcNAc-b1,3-R。在一更佳实施例中,所述α-1,3糖基化形式的Fuc-a1,2-Gal-R为Gal-a1,3-(Fuc-a1,2)-Gal-b1,3-GlcNAc-b1,3-Gal-b1,4-Glc。在一替代较佳实施例中,所述α-1,3糖基化形式的Fuc-a1,2-Gal-R为GalNAc-a1,3-(Fuc-a1,2)-Gal-b1,3-GlcNAc-b1,3-R。在一更佳实施例中,所述α-1,3糖基化形式的Fuc-a1,2-Gal-R为GalNAc-a1,3-(Fuc-a1,2)-Gal-b1,3-GlcNAc-b1,3-Gal-b1,4-Glc。
在另一实施例中,α-1,3糖基化形式的Fuc-a1,2-Gal-R为Gal-a1,3-(Fuc-a1,2)-Gal-b1,4-Glc,其中葡萄糖可以视需要而定地被岩藻糖基化(较佳为a1,3-岩藻糖基化)。较佳为,α-1,3糖基化形式的Fuc-a1,2-Gal-R为Gal-a1,3-(Fuc-a1,2)-Gal-b1,4-Glc。
在另一实施例中,α-1,3糖基化形式的Fuc-a1,2-Gal-R为Gal-a1,3-(Fuc-a1,2)-Gal-b1,4-(Fuc-a1,3)-Glc。
在另一实施例中,α-1,3糖基化形式的Fuc-a1,2-Gal-R为α-四糖GalNAc-a1,3-(Fuc-a1,2)-Gal-b1,4-Glcthe(alpha-tetrasaccharide GalNAc-a1,3-(Fuc-a1,2)-Gal-b1,4-Glc)。
在另一实施例中,α-1,3糖基化形式的Fuc-a1,2-Gal-R为一α-1,3GalNAc或一α-1,3半乳糖修饰的Fuc-a1,2-Gal-GlcNAc,其中Fuc-a1,2-Gal-GlcNA中的半乳糖经由β-1,3或β-1,4键与GlcNAc结合。在一较佳实施例中,α-1,3糖基化形式的Fuc-a1,2-Gal-R为GalNAc-a1,3-(Fuc-a1,2)-Gal-GlcNAc,其中半乳糖经由β-1,3或β-1,4键与GlcNAc结合。在一更佳实施例中,α-1,3糖基化形式的Fuc-a1,2-Gal-R为GalNAc-a1,3-(Fuc-a1,2)-Gal-b1,3-GlcNAc。在另一更佳实施例中,α-1,3糖基化形式的Fuc-a1,2-Gal-R为GalNAc-a1,3-(Fuc-a1,2)-Gal-b1,4-GlcNAc。在一较佳实施例中,α-1,3糖基化形式的Fuc-a1,2-Gal-R为一Gal-a1,3-(Fuc-a1,2)-Gal-GlcNAc,其中半乳糖经由β-1,3或β-1,4键与GlcNAc结合。在一更佳实施例中,α-1,3糖基化形式的Fuc-a1,2-Gal-R为Gal-a1,3-(Fuc-a1,2)-Gal-b1,3-GlcNAc。在另一更佳实施例中,α-1,3糖基化形式的Fuc-a1,2-Gal-R为Gal-a1,3-(Fuc-a1,2)-Gal-b1,4-GlcNAc。
在本发明的范围内,措辞「许可条件」应理解为与物理或化学参数相关的条件,包括但不限于温度、pH、压力、渗透压和产物/前体/受体浓度。
在特定实施例中,此类条件可包括30+/-20摄氏度的温度范围、7+/-3的pH范围。
根据本发明的一较佳实施利,以一个或更多的表达模块来修饰细胞。所述表达模块也已知为转录单元且包括重组基因表达的多核苷酸,重组基因包括编码基因序列以及与编码基因有效连接的适当转录及/或翻译控制信号。所述控制信号包括启动子序列、未翻译区、核糖体结合位点与终止子序列。所述表达模块可包括一个单一重组基因的表达单元,但也可包括更多重组基因的表达单元,或可以组织为操纵子(operon)结构以整合表达两个或两个以上的重组基因。可利用使用本领域习知的技术的重组DNA技术来产生所述多核苷酸。建构表达模块方法对于本发明所属技术领域具有通常知识者而言是习知的,其包括如体外(in vitro)重组DNA技术、合成技术与体内(in vivo)基因重组。参照如Sambrook et al.(2001)Molecular Cloning:a laboratory manual,3rd Edition,Cold Spring HarborLaboratory Press,CSH,New York or to Current Protocols in Molecular Biology,John Wiley and Sons,N.Y.(1989及每年更新版本)中所述的技术。
各所述表达模块(expression module)的表达可以是组成型的或由天然或化学诱导物产生。如于此所使用,组成型表达应理解为在生物体中被连续转录的基因的表达。由天然诱导物产生的表达应被理解为一种基因的趋向性或调节性表达,该基因仅在宿主的某种自然条件下(如生物体正在分娩(labour),或在哺乳(lactation)期)表达,作为对环境变化(如包括但不限于荷尔蒙、热、冷、pH值变化、光、氧化或渗透压力/信号)的反应,或依赖于所述细胞的发育阶段或细胞周期的位置,包括但不限于凋亡与自噬(autophagy)。由化学诱导剂产生的表达应理解为基因的兼性或调节性表达,该基因仅在通过诱导型启动子或通过诱导或抑制所述多核苷酸转录或翻译成多肽的遗传回路感知外部化学物质(例如IPTG、阿拉伯糖、乳糖、同种乳糖(allo-lactose)、鼠李糖或岩藻糖)时表达。
表达模块可整合至所述细胞的基因体中,或可以载体(vector)的形式呈现给所述细胞。所述载体可以质粒、黏粒(cosmid)、噬菌体、脂质体或病毒的形式存在,被稳定地转化/转染至所述代谢改造细胞中。这类载体其中包括染色体的(chromosomal)、附加体(episomal)与衍生自病毒的载体,例如衍生自细菌质粒、噬菌体、酵母菌附加体(episome)、插入单元、酵母菌染色体单元的载体及衍生自前述组合的载体,例如衍生自质粒与噬菌体基因单元的载体,例如黏粒与噬菌粒(phagemid)。这些载体可包含选择标记(selectionmarker),例如但不限于抗生素标记、营养缺陷(auxotrophic)标记、毒素-抗毒素标记或RNA正股/反股标记。表达系统构建体(construct)可包括调控与引起表达的控制区域。一般而言,任何适合于在宿主中维持、增殖或表达多核苷酸及/或表达多肽的系统或载体均可用于在这方面的表达。可以通过多种众所周知的常规技术中的任何一种将合适的DNA序列插入到表达系统中,例如Sambrook等人中所述的技术。对于重组生产而言,可基因改造细胞以并入表达系统或其部分或本发明的多核苷酸。可利用许多标准实验室操作手册中所述的方法来将多核苷酸导入至细胞中,例如如前文所述的Davis et al.,Basic Methods inMolecular Biology,(1986),and Sambrook et al.,1989。
如于此所使用,表达模块包括用于至少一个重组基因的表达的多核苷酸。所述重组基因参与在α-1,3糖基化形式的LNFP-I或LNFP-I的合成中起作用的多肽的表达;或所述重组基因与所述细胞中不参与α-1,3糖基化形式的LNFP-1或LNFP-1的合成的其他途径相关联。所述重组基因编码具有修饰的表达或活性的内源蛋白质,较佳为,所述内源蛋白质是被过表达的;或所述重组基因编码异源蛋白质,所述异源蛋白质在所述修饰细胞中异源地被引入与表达,较佳为被过表达。内源蛋白质可以在细胞中具有一经修饰的表达,该细胞也表达异源蛋白质。
在根据本发明的方法及/或细胞的一个实施例中,细胞具有合成乳-N-岩藻糖五糖I(LNFP-I)的能力。LNFP-I是一种岩藻糖基化五糖,源自乳-N-四糖(LNT),其中所述LNT被岩藻糖基团a1,2-连接到其末端半乳糖残基来修饰。在一较佳实例中,该细胞具合成LNT的能力并表达α-1,2-岩藻糖基转移酶,该酶将岩藻糖残基从GDP岩藻糖供体转移到受体LNT以产生LNFP-I。在一更佳实施例中,细胞具有合成LNT的能力、表达使用LNT作为α-1,2-岩藻糖基化接受体的α-1,2-岩藻糖基转移酶且具有合成为所述α-1,2-岩藻糖基转移酶的供体的GDP-岩藻糖的能力。
LNT可在细胞中产生,藉由半乳糖苷β-1,3-N-乙酰氨基葡萄糖转移酶基因和N-乙酰氨基葡萄糖β-1,3-半乳糖基转移酶基因的过表达,它们分别将GlcNAc残基从UDP-GlcNAc转移到乳糖形成LN3与将Gal残基从UDP-Gal转移到LN3形成LNT。较佳为,细胞不具有活化的半乳糖苷酶,例如lacZ,其将乳糖降解为葡萄糖与半乳糖。所述半乳糖苷β-1,3-N-乙酰氨基葡糖基转移酶所需的乳糖可以供培养或通过细胞的代谢合成。所述酶所需的UDP-GlcNAc与UDP-Gal可由细胞中表达的酶或细胞的代谢来提供。
在糖基化反应中使用乳糖作为受体的细胞较佳为具有用于从培养物中摄取乳糖的转运蛋白。更佳为,该细胞针对乳糖摄取进行了优化。所述优化可以是乳糖转运蛋白如来自大肠杆菌或乳酸克鲁维酵母的乳糖通透酶的过表达。
在本发明的方法/或细胞的较佳实施例中,当在乳糖与一种或多种其他碳源结合的环境中生长时,细胞会抵抗乳糖杀伤(lactose killing)的现象。「乳糖杀伤」一词指的是细胞在含有乳糖和另一种碳源的培养基中生长受阻。在较佳实施例中,如WO 2016/075243中所述,细胞系经过基因修饰,即使在高乳糖浓度下,也能保留至少50%的乳糖流入而不会经历乳糖杀伤。所述基因修饰包括通过没有造成乳糖杀伤表达型的异源性启动子的外源性及/或内源性乳糖运输基因的表达及/或过表达,及/或修饰乳糖运输蛋白的密码子使用偏好以产生没有造成乳糖杀伤表达型的所述乳糖运输蛋白改变的表达。WO2016/075243的内容在这方面通过引用的方式并入于此。在本发明的背景下,乳糖较佳为由于此揭露的细胞所摄入,其中所述乳糖进一步由于此揭露的糖基转移酶而糖基化以合成MMO,较佳为HMO。
或者,藉由表达β-1,4-半乳糖基转移酶与UDP-葡萄糖4-表异构酶(UDP-glucose4-eprimerase),可以获得产生乳糖的细胞。更佳为,细胞经过改良以提高乳糖产量。所述修饰可以是选自包括β-1,4-半乳糖基转移酶的过表达、UDP-葡萄糖4-表异构酶的过表达的群组中的任何一个或更多。
产生UDP-GlcNAc的细胞可以表达酶,其将例如要添加到细胞的GlcNAc转化为UDP-GlcNAc。这些酶可以是来自包括智人、大肠杆菌的几种物种的N-乙酰基-D-葡糖胺激酶、N-乙酰基葡糖胺-6-磷酸脱乙酰酶、磷酸葡糖胺变位酶与N-乙酰基葡糖胺-1-磷酸尿苷酰转移酶/葡糖胺-1-磷酸乙酰转移酶。较佳为,细胞被修饰以产生UDP-GlcNAc。更佳为,细胞经修饰以增强UDP-GlcNAc的产生。所述修饰可以是选自包括N-乙酰氨基葡萄糖-6-磷酸脱乙酰酶的敲除、L-谷氨酰胺-D-果糖-6-磷酸氨基转移酶的过表达、磷酸葡糖胺变位酶的过表达,以及N-乙酰葡糖胺-1-磷酸尿苷酰转移酶/葡糖胺-1-磷酸乙酰转移酶的过表达的群组的任一个或更多。
产生UDP-Gal的细胞可以表达酶,其将例如UDP-葡萄糖转化为UDP-Gal。这种酶可以是,例如,UDP-葡萄糖4-差向异构酶GalE,如从包括智人、大肠杆菌和褐家鼠的几种物种中已知的。较佳为,细胞被修改以产生UDP-Gal。更佳为,细胞被修改以增强UDP-Gal产生。所述修饰可以是选自包括双功能5'-核苷酸酶/UDP-糖水解酶编码基因的敲除、半乳糖-1-磷酸尿苷转移酶编码基因的敲除与UDP-葡萄糖4-差向异构酶编码基因的过表达的群组的任一个或更多。
GDP-岩藻糖可藉由细胞中表达的酶或藉由细胞的代谢所提供。这种产生GDP-岩藻糖的细胞可表达酶,其将例如要添加到细胞的岩藻糖转化为GDP-岩藻糖。这种酶可以是,例如,双功能岩藻糖激酶/岩藻糖-1-磷酸鸟苷酰转移酶,如来自脆弱类杆菌(Bacteroidesfragilis)的Fkp,或一种单独的岩藻糖激酶与一种单独的岩藻糖-1-磷酸鸟嘌呤转移酶(fucose-1-phosphate guanylyltransferase)的组合,如它们从包括智人、猪(Susscrofa)与褐家鼠的几个物种中为已知。
较佳为,细胞被修饰以产生GDP岩藻糖。更佳为,细胞经过修饰以提高GDP岩藻糖产量。所述修饰可以是选自包括UDP-葡萄糖:十一烯丙基-磷酸葡萄糖-1-磷酸转移酶的编码基因的敲除,表达GDP-L-岩藻糖合成酶的编码基因的过表达、GDP-甘露糖4,6-脱水酶的编码基因的过表达、甘露糖-1-磷酸瓜酰转移酶的编码基因的过表达、磷酸甘露酶的编码基因的过表达与甘露糖-6-磷酸异构酶的编码基因的过表达的群组的任一个或多个。
将岩藻糖残基从GDP-岩藻糖转移到细胞内合成的LNT的α-1,2-岩藻糖基转移酶是α-1,2-岩藻糖基转移酶,其接受LNT的末端半乳糖残基作为岩藻糖基化的受体。所述α-1,2-岩藻糖基转移酶除了LNT的外,还可以使用其他接受体进行岩藻糖基化。所述额外的受体可以包括但不限于单糖、双糖和寡糖,例如半乳糖、葡萄糖、N-乙酰葡萄糖胺(GlcNAc)、乳糖、乳酮糖、乳-N-生物糖(LNB)、N-乙酰半乳糖胺(LacNAc)、3’-岩藻糖(3'FL)、乳-N-三糖(LN3)与乳-N-新四糖(LNnT)。所述α-1,2-岩藻糖基转移酶可以是例如于此举例的幽门螺杆菌的α-1,2-岩藻糖基转移酶。
在本发明的方法及/或细胞的一个较佳实施例中,所述α-1,2-岩藻糖基转移酶选自包含来自毛样短螺旋体(Brachyspira pilosicoli)的多肽(UniProt ID A0A2N5RQ26)、来自Dysgonomonas mossii的多肽(UniProt ID F8X274)、来自Dechlorosoma suillum的多肽(UniProt ID G8QLF4)、来自Desulfovibrio alaskensis的多肽(UniProt ID Q316B5)与来自Polaribacter vadi的多肽(UniProt ID A0A1B8TNT0)。
在替代较佳实施例中,所述α-1,2-岩藻糖基转移酶是对LNT的末端半乳糖残基具有α-1,2-岩藻糖基转移酶活性的来自毛样短螺旋体的多肽(UniProt ID A0A2N5RQ26)、来自Dysgonomonas mossii的多肽(UniProt ID F8X274)、来自Dechlorosoma suillum的多肽(UniProt ID G8QLF4)、来自Desulfovibrio alaskensis的多肽(UniProt ID Q316B5)与来自P.vadi的多肽(UniProt ID A0A1B8TNT0)的任一个的功能片段。
在替代较佳实施例中,所述α-1,2-岩藻糖基转移酶是来自毛样短螺旋体的多肽(UniProt ID A0A2N5RQ26)、来自Dysgonomonas mossii的多肽(UniProt ID F8X274)、来自Dechlorosoma suillum的多肽(UniProt ID G8QLF4)、来自Desulfovibrio alaskensis的多肽(UniProt ID Q316B5)与来自P.vadi的多肽(UniProt ID A0A1B8TNT0)的任一个的功能同系物、变体或衍生物,且对LNT的末端半乳糖残基具有α-1,2-岩藻糖基转移酶活性。
在替代较佳实施例中,所述α-1,2-岩藻糖基转移酶为多肽包括一氨基酸序列,或是由氨基酸序列所组成,该氨基酸序列具有与来自毛样短螺旋体(UniProt IDA0A2N5RQ26)的多肽、来自D.mossii(UniProt ID F8X274)的多肽、来自D.suillum(UniProtID G8QLF4)的多肽、来自D.alaskensis(UniProt ID Q316B5)的多肽与来自P.vadi(UniProt ID A0A1B8TNT0)的多肽的任一者的全长氨基酸序列至少80%序列相似度,且对LNT的末端半乳糖残基具有α-1,2-岩藻糖基转移酶活性。
在本发明的方法及/或细胞的另一较佳实施例中,细胞表达α-1,2-岩藻糖基转移酶,该酶较佳为使用LNT作为α-1,2-岩藻糖基化的受体而不是其他受体,例如半乳糖、葡萄糖、N-乙酰氨基葡萄糖(GlcNAc)、乳糖、乳果糖、乳糖-N-二糖(LNB)、N-乙酰乳糖胺(LacNAc)、3'-岩藻糖基乳糖(3'FL)、乳糖-N-丙糖(LN3)与乳-N-新四糖(LNnT)。在更佳实施例中,通过在细胞中表达的α-1,2-岩藻糖基转移酶在混合物中获得的至少50%的岩藻糖基化化合物源自LNT的α-1,2-岩藻糖基化。换言之,通过细胞中表达的α-1,2-岩藻糖基转移酶在混合物中获得的岩藻糖基化化合物的至少50%是岩藻糖基化的LNT。至少50%的岩藻糖基化化合物在混合物中,应被理解为至少50%、55%、60%、65%、70%、75%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、91.50%、92.00%、92.50%、93.00%、93.50%、94.00%、94.50%、95.00%、95,50%、96.00%、96,50%、97.00%、97,50%、98.00%、98,50%、99.00%、99,50%、99,60%、99,70%、99,80%、99,90%、100%的岩藻糖基化化合物在混合物中为岩藻糖基化LNT。较佳为,至少60%、更佳为至少70%、甚至更佳为至少75%、甚至更佳为至少80%、甚至更佳为至少85%、甚至更佳为至少90%、最佳为至少95%通过在细胞中表达的在混合物中获得的岩藻糖基化化合物是岩藻糖基化的LNT。
在更佳实施例中,所述α-1,2-岩藻糖基转移酶仅使用LNT作为α-1,2-岩藻糖基化的受体。术语「仅(solely)」表示仅。换句话说,所述α-1,2-岩藻糖基转移酶仅接受LNT作为所述LNT末端半乳糖残基的α-1,2-键中岩藻糖基化的受体,而无其他受体。
根据本发明的方法及/或细胞的一个实施例,具有产生α-1,3-糖基化形式的Fuc-a1,2-Gal-R的能力的α-1,3-糖基转移酶是一种α-1,3-半乳糖基转移酶,其为一种糖基转移酶,具有将半乳糖残基从UDP-Gal转移到Fuc-a1,2-Gal-R的末端「岩藻糖-a1,2-半乳糖」基团的能力,其中所述R包括单糖、双糖、寡糖、肽、糖肽、蛋白质、糖蛋白、脂质或糖脂,如于此前面所定义。
在本发明的方法及/或细胞的一个实施例中,α-1,3-半乳糖基转移酶具有PFAMPF03414结构域(domain),且包括具有SEQ ID NO:01的基序(motif)YX[FHMQT]XAXX[ACG][ACG],其中X可为任何氨基酸残基。
在一替代实施例中,α-1,3-半乳糖基转移酶具有PFAM PF03414结构域,且包括具有SEQ ID NO:02的基序YXQXCXX[ACG][ACG],其中X可为任何氨基酸残基。
在一替代实施例中,α-1,3-半乳糖基转移酶具有PFAM PF03414结构域,且包括根据SEQ ID NO:03、04、05、06、07、08、09、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36或37的任一者的多肽序列。
在一替代实施例中,α-1,3-半乳糖基转移酶具有PFAM PF03414结构域,且为SEQID NO:03、04、05、06、07、08、09、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36或37的任一者的功能性同系物(functionalhomolog)、变体(variant)或衍生物(derivative),具有与具有SEQ ID NO:03、04、05、06、07、08、09、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36或37的该a-1,3-半乳糖基转移酶多肽的任一者的全长至少80%整体序列相似度,且对岩藻糖-a1,2-半乳糖-R(fucose-a1,2-galactose-R,Fuc-a1,2-Gal-R)的末端“岩藻糖-a1,2-半乳糖”-基团具有a-1,3-半乳糖基转移酶活性。
在一替代实施例中,α-1,3-半乳糖基转移酶具有PFAM PF03414结构域,且为SEQID NO:03、04、05、06、07、08、09、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36或37的功能性片段,对岩藻糖-a1,2-半乳糖-R(Fuc-a1,2-Gal-R)的末端“岩藻糖-a1,2-半乳糖”-基团具有a-1,3-半乳糖基转移酶活性。
在一较佳替代实施例中,α-1,3-半乳糖基转移酶具有一PFAM PF03414结构域且包括来自SEQ ID NO:03、04、05、06、07、08、09、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36或37的任一者的至少8、9、10、11、12、13、14、15、16、17、18、19、20个连续不断的氨基酸残基的寡肽序列,且对岩藻糖-a1,2-半乳糖-R(Fuc-a1,2-Gal-R)的末端“岩藻糖-a1,2-半乳糖”-基团具有a-1,3-半乳糖基转移酶活性。
在一替代实施例中,α-1,3-半乳糖基转移酶具有一PFAM PF03414结构域且包括或系由多肽所组成,此多肽包括或系由氨基酸序列所组成,此氨基酸序列与SEQ ID NO:03、04、05、06、07、08、09、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36或37的任一者的全长氨基酸序列具有至少80%序列相似度,且对岩藻糖-a1,2-半乳糖-R(Fuc-a1,2-Gal-R)的末端“岩藻糖-a1,2-半乳糖”-基团具有a-1,3-半乳糖基转移酶活性。
根据本发明的方法及/或细胞的另一个实施例,具有产生α-1,3-糖基化形式的Fuc-a1,2-Gal-R的α-1,3-糖基转移酶是一种α-1,3-N-乙酰半乳糖胺基转移酶,它是一种糖基转移酶,具有将N-乙酰半乳糖胺残基从UDP-GalNAc转移到Fuc-a1,2-Gal-R的末端“岩藻糖-a1,2-半乳糖”基团的能力,其中所述R包括单糖、双糖、寡糖、肽、糖肽、蛋白质、糖蛋白或脂质或糖脂,如于此前面所定义。
在本发明的方法及/或细胞的一个实施例中,该α-1,3-N-乙酰半乳糖胺转移酶具有PFAM PF03414结构域,且包括具有SEQ ID NO:38的基序YX[ACIL]XGXX[ACG][ACG],其中X可为任何氨基酸残基。
在一替代实施例中,该α-1,3-N-乙酰半乳糖胺转移酶具有PFAM PF03414结构域,且包括具有SEQ ID NO:39的基序YX[AG]XAXX[ACG][ACG],其中X可为任何氨基酸残基。
在一替代实施例中,该α-1,3-N-乙酰半乳糖胺转移酶具有PFAM PF03414结构域,且包括如SEQ ID NO:40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99、100、101或102的任一者的多肽序列。
在一替代实施例中,该α-1,3-N-乙酰半乳糖胺转移酶具有PFAM PF03414结构域,且为SEQ ID NO:40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99、100、101或102的任一者的功能性同系物、变体或衍生物,具有与具有SEQ ID NO:40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99、100、101或102的该a-1,3-N-乙酰半乳糖基转移酶(a-1,3-N-acetylgalactosyltransferase)多肽的任一者的全长至少80%整体序列相似度,且对岩藻糖-a1,2-半乳糖-R(Fuc-a1,2-Gal-R)的末端“岩藻糖-a1,2-半乳糖”基团具有a-1,3-N-乙酰半乳糖基转移酶活性。
在一替代实施例中,该α-1,3-N-乙酰半乳糖胺转移酶具有PFAM PF03414结构域,且为SEQ ID NO:40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99、100、101或102的功能性片段,且对岩藻糖-a1,2-半乳糖-R(Fuc-a1,2-Gal-R)的末端“岩藻糖-a1,2-半乳糖”基团具有a-1,3-N-乙酰半乳糖基转移酶活性。
在一较佳替代实施例中,该α-1,3-N-乙酰半乳糖胺转移酶具有PFAM PF03414结构域,且包括来自SEQ ID NO:40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99、100、101或102的任一者的至少8、9、10、11、12、13、14、15、16、17、18、19、20个连续不断的氨基酸残基的一寡肽序列,且对岩藻糖-a1,2-半乳糖-R(Fuc-a1,2-Gal-R)的末端“岩藻糖-a1,2-半乳糖”基团具有a-1,3-N-乙酰半乳糖基转移酶活性。
在一替代实施例中,该α-1,3-N-乙酰半乳糖胺转移酶具有PFAM PF03414结构域,且包括或系由多肽所组成,此多肽包括或系由一氨基酸序列所组成,此氨基酸序列与SEQID NO:40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99、100、101或102的任一者的全长氨基酸序列具有至少80%序列相似度,且对岩藻糖-a1,2-半乳糖-R(Fuc-a1,2-Gal-R)的末端“岩藻糖-a1,2-半乳糖”基团具有a-1,3-N-乙酰半乳糖基转移酶活性。
如于此所使用,所述PFAM PF03414结构域是指存在于2018年9月发布的Pfam 32.0数据库中并且存在于糖基转移酶6(GT6)家族中的PF03414结构域。所述α-1,3-半乳糖基转移酶和α-1,3-N-乙酰半乳糖基转移酶均属于GT6家族。
总体序列同一性使用全球比对算法确定,例如程序GAP(GCG Wisconsin Package,Accelrys)中的Needleman Wunsch算法,较佳为使用默认参数并叫佳为使用成熟蛋白质的序列(即不考虑分泌信号或转运肽(transit peptide))。与整体序列相似度相比,当仅考虑保守结构域或基序时,序列相似度通常会更高。
来自具有SEQ ID NO:03、04、05、06、07、08、09、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36或37的多肽的任一者的至少8、9、10、11、12、13、14、15、16、17、18、19、20个连续氨基酸残基并且对Fuc-a1,2-Gal-R的末端“岩藻糖-a1,2-半乳糖”基团具有a-1,3-半乳糖基转移酶活性的寡肽序列应理解为于此所提供的来自具有SEQ ID NO:03、04、05、06、07、08、09、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36或37的多肽的任一者的至少8、9、10、11、12、13、14、15、16、17、18、19、20个至多连续氨基酸残基总数的寡肽序列的任一者,较佳为其中若存在的话,所述寡肽不与PFAM结构域完全重叠,更佳为其中若存在的话,所述寡肽不与PFAM结构域重叠,并且对Fuc-a1,2-Gal-R的末端“岩藻糖-a1,2-半乳糖”基团具有a-1,3-半乳糖基转移酶活性。
来自具有SEQ ID NO:40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99、100、101或102的多肽的任一者的至少8、9、10、11、12、13、14、15、16、17、18、19、20个连续氨基酸残基并且对Fuc-a1,2-Gal-R的末端“岩藻糖-a1,2-半乳糖”基团具有a-1,3-N-乙酰半乳糖基转移酶活性的寡肽序列应理解为于此所提供的来自具有SEQ ID NO:40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99、100、101或102的多肽的任一者的至少8、9、10、11、12、13、14、15、16、17、18、19、20个至多连续氨基酸残基总数的寡肽序列的任一者,较佳为其中若存在的话,所述寡肽不与PFAM结构域完全重叠,更佳为其中若存在的话,所述寡肽不与PFAM结构域重叠,并且对Fuc-a1,2-Gal-R的末端“岩藻糖-a1,2-半乳糖”基团具有a-1,3-N-乙酰半乳糖基转移酶活性。
在本发明的方法及/或细胞的一个优选实施方案中,细胞表达α-1,3-糖基转移酶,该酶具有修饰细胞内合成的Fuc-a1,2-Gal-R的能力,从而形成α-1,3糖基化形式的Fuc-a1,2-Gal-R,如于此前方所揭露。较佳为,所述细胞能够合成作为所述α-1,3-糖基转移酶供体的核苷酸-糖。
在本发明的方法及/或细胞的一个更佳实施例中,所述α-1,3-糖基转移酶是于此所述的α-1,3-半乳糖基转移酶,具有将半乳糖残基从UDP-Gal转移到Fuc-a1,2-Gal-R的末端“岩藻糖-α1,2-半乳糖”的能力,如于此所述,所述核苷酸-糖为UDP-Gal,产生如于此所述的α-1,3半乳糖修饰的Fuc-a1,2-Gal-R。
在本发明的方法及/或细胞的另一个更佳实施例中,所述α-1,3-糖基转移酶是于此所述的α-1,3-N-乙酰半乳糖胺基转移酶,具有将GalNAc残基从UDP-GalNAc转移到Fuc-a1的末端“岩藻糖-a1,2-半乳糖”的能力,如于此所述,所述核苷酸-糖是UDP-GalNAc,产生如于此所述的α-1,3GalNAc修饰的Fuc-a1,2-Gal-R。
在本发明的方法及/或细胞的一更佳实施例中,所述α-1,3-糖基转移酶是于此所述的α-1,3-半乳糖基转移酶,具有将半乳糖残基从UDP-Gal转移到Fuc-a1,2-Gal-b1,3-R的末端“岩藻糖-α1,2-半乳糖”的能力,如于此所述,所述核苷酸-糖是UDP-Gal,产生如于此所述的α-1,3半乳糖修饰的Fuc-a1,2-Gal-b1,3-R。
在本发明的方法及/或细胞的另一个更佳实施例中,所述α-1,3-糖基转移酶是于此所述的α-1,3-N-乙酰半乳糖胺基转移酶,具有将GalNAc残基从UDP-GalNAc转移到Fuc-a1,2-Gal-b1,3-R的末端“岩藻糖-a1,2-半乳糖”的能力,如于此所述,所述核苷酸-糖是UDP-GalNAc,产生如于此所述的α-1,3GalNAc修饰的Fuc-a1,2-Gal-b1,3-R。
在本发明的方法及/或细胞的一更佳实施例中,所述α-1,3-糖基转移酶是于此所述的α-1,3-半乳糖基转移酶,具有将半乳糖残基从UDP-Gal转移到Fuc-a1,2-Gal-b1,3-GlcNAc-R的末端“岩藻糖-α1,2-半乳糖”的能力,如于此所述,所述核苷酸-糖是UDP-Gal,产生如于此所述的α-1,3半乳糖修饰的Fuc-a1,2-Gal-b1,3-GlcNAc-R。
在本发明的方法及/或细胞的一更佳实施例中,所述α-1,3-糖基转移酶是于此所述的α-1,3-半乳糖基转移酶,具有将半乳糖残基从UDP-Gal转移到Fuc-a1,2-Gal-b1,3-GlcNAc-R的末端“岩藻糖-α1,2-半乳糖”的能力,如于此所述,所述核苷酸-糖是UDP-Gal,产生如于此所述的α-1,3半乳糖修饰的Fuc-a1,2-Gal-b1,3-GlcNAc-R。
在本发明的方法及/或细胞的另一个更佳实施例中,所述α-1,3-糖基转移酶是于此所述的α-1,3-N-乙酰半乳糖胺基转移酶,具有将GalNAc残基从UDP-GalNAc转移到Fuc-a1,2-Gal-b1,3-GlcNAc-R的末端“岩藻糖-a1,2-半乳糖”的能力,如于此所述,所述核苷酸-糖是UDP-GalNAc,产生如于此所述的α-1,3GalNAc修饰的Fuc-a1,2-Gal-b1,3-GlcNAc-R。
在本发明的方法及/或细胞的一更佳实施例中,所述α-1,3-糖基转移酶是于此所述的α-1,3-半乳糖基转移酶,具有将半乳糖残基从UDP-Gal转移到Fuc-a1,2-Gal-b1,3-GlcNAc-b1,3-R的末端“岩藻糖-α1,2-半乳糖”的能力,如于此所述,所述核苷酸-糖是UDP-Gal,产生如于此所述的α-1,3半乳糖修饰的Fuc-a1,2-Gal-b1,3-GlcNAc-b1,3-R。
在本发明的方法及/或细胞的另一个更佳实施例中,所述α-1,3-糖基转移酶是于此所述的α-1,3-N-乙酰半乳糖胺基转移酶,具有将GalNAc残基从UDP-GalNAc转移到Fuc-a1,2-Gal-b1,3-GlcNAc-b1,3-R的末端“岩藻糖-a1,2-半乳糖”的能力,如于此所述,所述核苷酸-糖是UDP-GalNAc,产生如于此所述的α-1,3GalNAc修饰的Fuc-a1,2-Gal-b1,3-GlcNAc-b1,3-R。
在本发明的方法及/或细胞的一更佳实施例中,细胞表达α-1,3-糖基转移酶,该酶能够将细胞内合成的LNFP-I修饰为α-1,3糖基化形式的LNFP-I。在本发明的方法及/或细胞的另一额外实施例中,该细胞能够合成为所述α-1,3-糖基转移酶的供体的核苷酸-糖。
在本发明的方法及/或细胞的一更佳实施例中,所述α-1,3-糖基转移酶是于此所述的α-1,3-半乳糖基转移酶,具有将半乳糖残基从UDP-Gal转移到LNFP-1的末端“岩藻糖-α1,2-半乳糖”基团的能力,所述核苷酸-糖是UDP-Gal并且所述α-1,3糖基化形式5乳-N-岩藻糖五糖I(LNFP-I)是Gal-a1,3-(Fuc-a1,2)-Gal-b1,3-GlcNAc-b1,3-Gal-b1,4-Glc(Gal-a1,3-LNFP-I)。
在本发明的方法及/或细胞的一更佳实施例中,所述α-1,3-糖基转移酶是于此所述的α-1,3-N-乙酰半乳糖胺基转移酶,具有将GalNAc残基从UDP-GalNAc转移到LNFP-I的末端“岩藻糖-α1,2-半乳糖”基团的能力,所述核苷酸-糖是UDP-GalNAc并且所述α-1,3糖基化形式的乳-N-岩藻糖五糖I(LNFP-I)是GalNAc-a1,3-(Fuc-a1,2)-Gal-b1,3-GlcNAc-b1,3-Gal-b1,4-Glc(GalNAc-a1,3-LNFP-I)。
在本发明的方法及/或细胞的一更进一步实施例中,细胞在至少一种糖基转移酶的表达或活性方面被修饰,所述糖基转移酶包括半乳糖基转移酶(例如β-1,3-半乳糖基转移酶、β-1,4-半乳糖基转移酶、α-1,3-半乳糖基转移酶、α-1,4-半乳糖基转移酶)、N-乙酰半乳糖基转移酶、岩藻糖基转移酶(例如2-岩藻糖基转移酶、α-1,3/1,4-岩藻糖基转移酶、α-1,6-岩藻糖基转移酶)、N-乙酰葡糖胺基转移酶、甘露糖基转移酶、N-乙酰甘露糖胺基转移酶、葡萄糖基转移酶。在一较佳实施利中,所述糖基转移酶包含对末端“岩藻糖-α1,2-半乳糖-R”基团具有α-1,3-半乳糖基转移酶活性的α-1,3-半乳糖基转移酶与对末端“岩藻糖-α1,2-半乳糖-R”基团具有α-1,3-N-乙酰半乳糖基转移酶活性的α-1,3-N-乙酰半乳糖基转移酶,如于此所述。
在一实施例中,所述糖基转移酶是具有修饰的表达或活性的细胞的内源性蛋白质,较佳为所述内源性糖基转移酶过表达;或者,所述糖基转移酶是异源蛋白质,其异源地引入并在所述细胞中表达,较佳为过表达。所述内源性糖基转移酶可以在细胞中具有经修饰的表达,该细胞也表达异源糖基转移酶。
在本发明的方法的一实施例中,培养物被供给用于合成岩藻糖-a1,2-半乳糖-R及/或α-1,3糖基化形式的岩藻糖-a1,2-半乳糖-R的前体。可被供给用于合成岩藻糖-a1,2-半乳糖-R及/或α-1,3糖基化形式的岩藻糖-a1,2-半乳糖-R的培养的前体包括乳糖、乳糖-N-丙糖(LN3、LNT II)、岩藻糖、葡萄糖、半乳糖、GlcNAc、GDP-岩藻糖、UDP-半乳糖与UDP-GlcNAc或于此定义的任何其他前体。
在本发明方法的一实施例中,培养物被供给用于合成LNFP-1及/或α-1,3糖基化形式的LNFP-1的前体。可被供给用于培养以合成LNFP-I及/或α-1,3糖基化形式的LNFP-I的前体包括乳糖、乳糖-N-丙糖(LN3、LNT II)、岩藻糖、葡萄糖与半乳糖。
在根据本发明的方法/或细胞的一实施例中,细胞表达膜转运蛋白或具有运输活性的多肽,借此将化合物运输穿越细胞壁的外膜。在本发明的方法/或细胞的一较佳实施例中,细胞表达一种以上的膜转运蛋白或具有运输活性的多肽,借此将化合物运输穿越细胞壁的外膜。在本发明的方法/或细胞的更佳实施例中,细胞系经修饰所述膜转运蛋白或具有运输活性的多肽的表达或活性。所述膜转运蛋白或具有运输活性的多肽为细胞具有修饰的表达或活性的内源性蛋白质,较佳的是所述内源性膜转运蛋白或具有运输活性的多肽是过表达的;或者,所述内源性膜转运蛋白或具有运输活性的多肽为异源导入至所述细胞并于细胞中表达的异源性蛋白质,较佳的是其为过表达的。所述内源性膜转运蛋白或具有运输活性的多肽在细胞中可具有修饰的表达,所述细胞也表达异源性膜转运蛋白或具有运输活性的多肽。
在本发明的方法/或细胞的另一实施例中,膜转运蛋白或具有运输活性的多肽是选自于包含以下所列的名单:运输蛋白(porter)、P-P键结水解驱动运输蛋白、b桶孔蛋白(b-barrel porin)、辅助运输蛋白、推定运输蛋白(putative transport protein)及磷酸转移驱动基团转位蛋白(phosphotransfer-driven group translocator)。在本发明的方法/或细胞的一更佳实施例中,运输蛋白(porter)包括MFS运输蛋白、糖流出运输蛋白及螯铁体输出蛋白(siderophore exporter)。在本发明的方法/或细胞的另一更佳实施例中,P-P键结水解驱动运输蛋白包括ABC运输蛋白与螯铁体输出蛋白。
在本发明的方法及/或细胞的另一较佳实施例中,具有转运活性的膜转运蛋白或多肽控制如于此所述的α-1,3糖基化形式的岩藻糖-α1,2-半乳糖-R在细胞壁的外膜上的流动。在本发明的方法及/或细胞的替代及/或额外较佳实施例中,具有转运活性的膜转运蛋白或多肽控制一种或更多的前体在细胞壁的外膜上的流动,所述前体用于α-1,3糖基化形式的岩藻糖-α1,2-半乳糖-R的所述产生。在本发明的方法及/或细胞的替代及/或额外较佳实施例中,具有转运活性的膜转运蛋白或多肽控制一种或更多的受体在细胞壁的外膜上的流动,所述受体用于α-1,3糖基化形式的岩藻糖-α1,2-半乳糖-R的所述产生。
在本发明的方法/或细胞的另一较佳实施例中,细胞表达属于MFS运输蛋白家族的膜转运蛋白,例如来自以下物种的多药运输蛋白MdfA家族的MdfA多肽,包括大肠杆菌(UniProt ID P0AEY8)、穆汀斯克罗诺杆菌(Cronobacter muytjensii)(UniProt IDA0A2T7ANQ9)、杨氏柠檬酸杆菌(Citrobacter youngae)(UniProt ID D4BC23)与雷金斯堡预研菌(Yokenella regensburgei)(UniProt ID G9Z5F4)。在本发明的方法/或细胞的另一更佳实施例中,细胞表达属于糖流出运输蛋白家族的膜转运蛋白,例如来自以下物种的SetA家族的SetA多肽,包括大肠杆菌(UniProt ID P31675)、克氏柠檬酸杆菌(Citrobacterkoseri)(UniProt ID A0A078LM16)、克雷伯氏肺炎杆菌(Klebsiella pneumoniae)(UniProt ID A0A0C4MGS7)。在本发明的方法/或细胞的另一更佳实施例中,细胞表达属于嗜铁素输出蛋白(siderophore exporter)家族的膜转运蛋白,例如大肠杆菌的entS(UniProt ID P24077)与大肠杆菌的iceT(UniProt ID A0A024L207)。在本发明的方法/或细胞的另一更佳实施例中,细胞表达属于ABC运输蛋白家族的膜转运蛋白,例如来自大肠杆菌的oppF(UniProt ID P77737)、来自乳酸乳球菌亚种双乙酸乳酸变种(Lactococcuslactis subsp.lactis bv.Diacetylactis)的ImrA(UniProt ID A0A1V0NEL4)与婴儿长双歧杆菌亚种(Bifidobacterium longum subsp.Infantis)的Blon_2475(UniProt IDB7GPD4)。在本发明的方法/或细胞的更佳实施例中,细胞表达的选自包含以下所列的名单的膜转运蛋白:LacY或lac12通透酶、岩藻糖转运蛋白、葡萄糖转运蛋白、半乳糖转运蛋白、核苷酸活化糖的转运蛋白,例如UDP-GlcNAc、UDP-Gal及/或GDP-Fuc的转运蛋白,来自大肠杆菌的MdfA蛋白(UniProt ID P0AEY8)、来自克罗诺杆菌的MdfA蛋白(UniProt IDA0A2T7ANQ9)、来自杨氏柠檬酸杆菌的MdfA蛋白(UniProt ID D4BC23)、来自约克氏菌的MdfA蛋白(来自SetZ5F ID G9的Z5F蛋白)、来自大肠杆菌的SetA蛋白(UniProt IDP31675)、来自克氏柠檬酸杆菌的SetA蛋白(UniProt ID A0A078LM16)、来自肺炎克雷伯菌的SetA蛋白(UniProt ID A0A0C4MGS7)、来自大肠杆菌的entS蛋白(UniProt ID P24077)、来自大肠杆菌的iceT蛋白质(UniProt ID A0A024L207)、来自大肠杆菌的oppF蛋白(UniProt ID P77737)、来自乳酸乳球菌亚种双乙酸乳酸变种的lmrA蛋白(UniProt IDA0A1V0NEL4)与来自婴儿长双歧杆菌亚种的Blon_2475(UniProt ID B7GPD4)。优选地,细胞被转化为包括至少一种编码蛋白质的核酸序列,该蛋白质选自包括乳糖转运蛋白,例如LacY或lac12通透酶、岩藻糖转运蛋白、葡萄糖转运蛋白、半乳糖转运蛋白、核苷酸活化糖的转运蛋白,例如UDP-GlcNAc、UDP-GalNAc及/或GDP-Fuc的转运蛋白。因此,所述转运蛋白内化(internalizes)于经添加用于本发明α-1,3糖基化形式的岩藻糖-α1,2-半乳糖-R的合成的前体及/或受体。
在根据本发明的方法及/或细胞的额外及/或替代实施例中,所述细胞被基因修饰以通过膜输出本发明的α-1,3糖基化形式的岩藻糖-α1,2-半乳糖-R。例如,此种转运蛋白是一种膜转运蛋白,属于嗜铁素输出体家族(siderophore exporter family)、主要促进者超家族(major facilitator superfamily,MFS)、ATP结合盒(ATP-binding cassette,ABC)转运蛋白家族或糖外流转运蛋白家族。
在本发明的方法及/或细胞的进一步实施例中,细胞较佳包含编码一种蛋白质的相同编码DNA序列的多个复制。在本发明的上下文中,所述蛋白质可以是糖基转移酶、膜转运蛋白或于此揭露的任何其他蛋白质。在整个申请中,特征“多个”是指至少2个,较佳为至少3个,更佳为至少4个,甚至更佳为至少5个。
在本发明的方法及/或细胞的另一实施例中,该细胞包括用于减少醋酸盐产生的修改。所述修饰可以是选自一组中的任何一个或多个,包括乙酰辅酶A合成酶的过量表达,完全或部分敲除或功能较差的丙酮酸脱氢酶与完全或部分敲除或功能较差的乳酸脱氢酶。
在本发明的方法及/或细胞的又一实施例中,细胞系经修饰至少一乙酰辅酶A合成酶(acetyl-coenzyme Asynthetase,acs)的表达或活性,例如来自大肠杆菌、酿酒酵母菌、人类或小鼠(M.musculus)的acs。在较佳实施例中,所述乙酰辅酶A合成酶为具有修饰的表达或活性的细胞的内源性蛋白质,较佳的是所述内源性乙酰辅酶A合成酶为过表达的;或者,所述乙酰辅酶A合成酶为异源导入所述细胞并于所述细胞中表达的异源性蛋白质,较佳为过表达的。所述内源性乙酰辅酶A合成酶在细胞中可具有修饰的表达,而所述细胞也表达异源性乙酰辅酶A合成酶。在更佳实施例中,细胞系经修饰来自大肠杆菌的乙酰辅酶A合成酶acs(UniProt ID P27550)的表达或活性。在另一及/或额外较佳实施例中,细胞系经修饰来自大肠杆菌的乙酰辅酶A合成酶acs(UniProt ID P27550)的功能性同系物、变体或衍生物,其相对于来自大肠杆菌的所述多肽(UniProt ID P27550)具有至少80%的全体序列相似度,且具有乙酰辅酶A合成酶的活性。
在本发明的方法及/或细胞的更一替代及/或额外实施例中,细胞系经修饰至少一种丙酮酸脱氢酶的表达或活性,例如来自大肠杆菌、酵母菌、褐家鼠(R.norvegicus)的丙酮酸脱氢酶。在较佳实施例中,通过本发明所属技术领域中具有通常知识者一般所知的方法导致至少一种蛋白质具有较少的功能或失去丙酮酸脱氢酶活性,细胞系经过修饰以具有至少一部分或完全剔除的或突变的编码丙酮酸脱氢酶的基因。在更佳实施例中,细胞编码poxB的基因被完全剔除,导致细胞缺少丙酮酸脱氢酶活性。
在本发明的方法及/或细胞的又一替代及/或额外实施例中,细胞系经修饰至少一种乳酸脱氢酶的表达或活性,例如来自大肠杆菌、酵母菌、褐家鼠(R.norvegicus)的乳酸脱氢酶。在较佳实施例中,通过本发明所属技术领域中具有通常知识者一般所知的方法导致至少一种蛋白质具有较少的功能或失去乳酸脱氢酶活性,细胞系经过修饰以具有至少一部分或完全剔除的或突变的编码乳酸脱氢酶的基因。在更佳实施例中,细胞编码ldhA的基因被完全剔除,导致细胞缺少乳酸脱氢酶活性。
根据本发明的方法及/或细胞的另一较佳实施例,细胞与未经修饰的前驱细胞相比包括以下任一或多种蛋白质降低或减少的表达及/或经破坏、削弱、减少或延迟的活性,所述一或多种蛋白质包括:β-半乳糖苷酶、半乳糖苷O-乙酰转移酶、N-乙酰葡萄糖胺-6-磷酸脱乙酰酶、葡萄糖胺-6-磷酸脱胺酶、N-乙酰葡萄糖胺抑制蛋白(N-acetylglucosaminerepressor)、核糖核苷酸单磷酸酶、EIICBA-Nag、UDP-葡萄糖:十一异戊烯基-磷酸葡萄糖1-磷酸转移酶(UDP-glucose:undecaprenyl-phosphate glucose-1-phosphatetransferase)、L-岩藻糖激酶、L-岩藻糖异构酶(L-fucose isomerase)、N-乙酰神经氨酸裂解酶、N-乙酰甘露糖胺激酶、N-乙酰甘露糖胺-6-磷酸2-表异构酶、EIIAB-Man、EIIC-Man、EIID-Man、ushA、半乳糖-1-磷酸尿苷转移酶、葡萄糖-1-磷酸腺苷转移酶、葡萄糖-1-磷酸酶、ATP依赖性6-磷酸果糖激酶同功酶1(ATP-dependent 6-phosphofructokinase isozyme1)、ATP依赖性6-磷酸果糖激酶同功酶2、葡萄糖-6-磷酸异构酶、有氧呼吸控制蛋白、转录抑制蛋白IclR、lon蛋白酶、葡萄糖特异性转位磷酸转移酶(glucose-specifictranslocating phosphotransferase)酶IIBC组成ptsG、葡萄糖特异性转位磷酸转移酶(phosphotransferase,PTS)酶IIBC组成malX、酶IIAGlc、β-葡萄糖苷特异性PTS酶II、果糖特异性PTS多磷酰基转移蛋白FruA与FruB、乙醇脱氢酶、醛脱氢酶、丙酮酸甲酸裂解酶(pyruvate-formate lyase)、乙酸激酶、磷酸酰基转移酶、磷酸乙酰转移酶及丙酮酸脱羧酶。
根据本发明的方法及/或细胞的另一较佳实施例,细胞具有产生磷酸烯醇丙酮酸(phosphoenolpyruvate,PEP)的能力。在本发明的方法及/或细胞的另一较佳实施例中,细胞被修饰以增强磷酸烯醇丙酮酸(PEP)的产生及/或供应。
在较佳实施例中且作为增强PEP的产生与供应的方法,一种或多种PEP依赖性糖运输磷酸转移酶系统被破坏,例如但不限于:1)N-乙酰-D-葡萄糖胺Npi-磷酸转移酶(EC2.7.1.193),由如大肠杆菌或杆菌物种的nagE基因(或丛集nagABCD)所编码,2)ManXYZ,其编码输入外源性六碳糖(甘露糖、葡萄糖、葡萄糖胺、果糖、2-脱氧葡萄糖、甘露糖胺、N-乙酰葡萄糖胺等)且释出磷酸酯至细胞质的酶II Man复合体(甘露糖PTS通透酶、蛋白质-Npi-磷酸组氨酸-D-甘露糖磷酸转移酶(protein-Npi-phosphohistidine-D-mannosephosphotransferase),3)葡萄糖特异性PTS运输蛋白(例如由PtsG/Crr所编码),其摄入葡萄糖并于细胞质中形成葡萄糖-6-磷酸,4)蔗糖特异性运输蛋白,其摄入蔗糖并于细胞质中形成蔗糖-6-磷酸,5)果糖特异性运输蛋白(例如由基因fruA与fruB及基因fruK所编码),其摄入果糖并在第一步骤形成果糖-1-磷酸,且在第二步骤形成果糖1,6-二磷酸,6)乳糖PTS运输蛋白(例如由干酪乳杆菌(Lactococcus casei)中的lacE所编码),其摄入乳糖并形成乳糖-6-磷酸,7)半乳糖醇特异性PTS酶,其摄入半乳糖醇及/或山梨醇并分别形成半乳糖醇-1-磷酸或山梨醇-6-磷酸,8)甘露醇特异性PTS酶,其摄入甘露醇及/或山梨醇并分别形成甘露醇-1-磷酸或山梨醇-6-磷酸,及9)海藻糖特异性PTS酶,其摄入海藻糖并形成海藻糖-6-磷酸。
在另一及/或额外较佳实施例中且作为增强PEP的产生与供应的方法,通过破坏PtsIH/Crr基因簇来破坏完整的PTS系统。PtsI(酶I)为细胞质蛋白质,其作为大肠杆菌K-12的磷酸烯醇丙酮酸盐:糖磷酸转移酶系统(PTSsugar)的途径(gateway)。PtsI是PTSsugar两个糖非特异性蛋白组成(PtsI与PtsH)的其中之一,其与糖特异性内膜通透酶造成磷酸转移反应(cascade),而磷酸转移反应导致耦合磷酸化以及一系列糖受质的运输。HPr(含组氨酸蛋白质)为是PTSsugar两个糖特异性蛋白组成的其中之一。HPr丛磷酸化酶I(PtsI-P)接受磷酸基团,并接着转移至PTSsugar的许多糖特异性酶的任一者的EIIA结构域。Crr或EIIAGlc是被需要PtsH与PtsI的反应中的PEP所磷酸化。
在另一及/或额外较佳实施例中,通过导入及/或过表达对应的通透酶,细胞经进一步的修饰以补偿碳源的PTS系统的缺失。这些是如通透酶或ABC运输蛋白,其包括但不限于特异性输入乳糖的运输蛋白,例如由来自大肠杆菌的LacY基因所编码的运输蛋白,特异性输入蔗糖的运输蛋白,例如由来自大肠杆菌的cscB基因所编码的运输蛋白,特异性输入葡萄糖的运输蛋白,例如由来自大肠杆菌的galP基因所编码的运输蛋白,特异性输入果糖的运输蛋白,例如由来自变种链球菌(Streptococcus mutans)的fruI基因所编码的运输蛋白,或者是山梨醇/甘露醇ABC运输蛋白,例如类球红细菌(Rhodobacter sphaeroides)簇SmoEFGK所编码的运输蛋白,海藻糖/蔗糖/麦芽糖运输蛋白,例如苜蓿中华根瘤菌(Sinorhizobium meliloti)的丛集ThuEFGK所编码的运输蛋白,以及N-乙酰葡萄糖胺/半乳糖/葡萄糖运输蛋白,例如奥奈达希瓦氏菌(Shewanella oneidensis)的NagP所编码的运输蛋白。PTS缺失与替代运输蛋白过表达的组合范例为:1)缺失葡萄糖PTS系统,例如ptsG基因,结合导入及/或过表达葡萄糖通透酶(例如galP或glcP),2)缺失果糖PTS系统,例如fruB、fruA、fruK基因的一或多种,结合导入及/或过表达果糖通透酶,例如fruI,3)缺失乳糖PTS系统,结合导入及/或过表达乳糖通透酶,例如LacY,及/或4)缺失蔗糖PTS系统,结合导入及/或过表达蔗糖通透酶,例如cscB。
在更佳实施例中,通过导入及/或过表达糖激酶,细胞经修饰以补偿碳源的PTS系统的缺失,糖激酶如葡萄糖激酶(EC 2.7.1.1、EC 2.7.1.2、EC 2.7.1.63)、半乳糖激酶(EC2.7.1.6)及/或果糖激酶(EC 2.7.1.3、EC 2.7.1.4)。PTS缺失与替代运输蛋白与激酶过表达的组合范例为:1)缺失葡萄糖PTS系统,例如ptsG基因,结合导入及/或过表达葡萄糖通透酶(例如galP或glcP),结合导入及/或过表达葡萄糖激酶(例如,glk),及/或2)缺失果糖PTS系统,例如fruB、fruA、fruK基因的一或多种,结合导入及/或过表达果糖通透酶,例如fruI,结合导入及/或过表达果糖激酶(例如frk或mak)。
在另一及/或额外较佳实施例中且作为增强PEP的产生与供应的方法,通过导入或修饰以下所列的一或多种来修饰细胞:磷酸烯醇丙酮酸盐合成酶活性(EC:2.7.9.2,例如由大肠杆菌中的ppsA所编码)、磷酸烯醇丙酮酸盐羧化激酶活性(EC 4.1.1.32或EC4.1.1.49,例如分别由谷氨酸棒状杆菌(Corynebacterium glutamicum)中的PCK或由大肠杆菌中的pckA所编码)、磷酸烯醇丙酮酸盐羧酶活性(EC 4.1.1.31,例如由大肠杆菌中的ppc所编码)、草酰醋酸盐去羧酶(oxaloacetate decarboxylase)活性(EC 4.1.1.112,例如由大肠杆菌的eda所编码)、丙酮酸激酶活性(EC 2.7.1.40,例如由大肠杆菌中的pykA与pykF所编码)、丙酮酸羧酶活性(EC 6.4.1.1,例如由枯草杆菌中的pyc所编码)、以及苹果酸脱氢酶活性(EC 1.1.1.38或EC 1.1.1.40,例如分别由大肠杆菌中的maeA或maeB所编码)。
在更佳实施例中,细胞系经修饰以过表达包含以下任一或多种的多肽:大肠杆菌的ppsA(UniProt ID P23538)、谷氨酸棒状杆菌(C.glutamicum)的PCK(UniProt IDQ6F5A5)、大肠杆菌的pcka(UniProt ID P22259)、大肠杆菌的eda(UniProt ID P0A955)、大肠杆菌的maeA(UniProt ID P26616)以及大肠杆菌的maeB(UniProt ID P76558)。
在另一及/或额外的较佳实施例中,细胞系经修饰以表达任一或多种多肽,所述多肽具有磷酸烯醇丙酮酸盐合成酶活性、磷酸烯醇丙酮酸盐羧化激酶活性、草酰醋酸盐去羧酶活性或苹果酸脱氢酶活性。
在另一及/或额外的较佳实施例中且作为增强PEP的产生与供应的方法,通过减少磷酸烯醇丙酮酸盐羧酶活性及/或丙酮酸激酶活性来修饰细胞,较佳为缺失编码磷酸烯醇丙酮酸盐羧酶、丙酮酸羧酶及/或丙酮酸激酶的基因。
在一例示性实施例中,细胞通过不同的适应(adaptation)来进行修饰,例如过表达磷酸烯醇丙酮酸盐合成酶结合缺失磷酸烯醇丙酮酸盐羧酶基因;过表达磷酸烯醇丙酮酸盐合成酶结合缺失丙酮酸羧酶基因;过表达磷酸烯醇丙酮酸盐羧化激酶结合缺失磷酸烯醇丙酮酸盐羧酶基因;过表达磷酸烯醇丙酮酸盐羧化激酶结合缺失丙酮酸羧酶基因;过表达草酰醋酸盐去羧酶结合缺失丙酮酸激酶基因;过表达草酰醋酸盐去羧酶结合缺失磷酸烯醇丙酮酸盐羧酶基因;过表达苹果酸脱氢酶结合缺失磷酸烯醇丙酮酸盐羧酶基因、及/或苹果酸脱氢酶结合缺失丙酮酸羧酶基因。
在另一例示性实施例中,细胞通过不同的适应来进行修饰,例如过表达磷酸烯醇丙酮酸盐合成酶结合过表达磷酸烯醇丙酮酸盐羧化激酶;过表达磷酸烯醇丙酮酸盐合成酶结合过表达草酰醋酸盐去羧酶;过表达磷酸烯醇丙酮酸盐合成酶结合过表达苹果酸脱氢酶;过表达磷酸烯醇丙酮酸盐羧化激酶结合过表达草酰醋酸盐去羧酶;过表达磷酸烯醇丙酮酸盐羧化激酶结合过表达苹果酸脱氢酶、过表达草酰醋酸盐去羧酶结合过表达苹果酸脱氢酶;过表达磷酸烯醇丙酮酸盐合成酶结合过表达磷酸烯醇丙酮酸盐羧化激酶以及过表达草酰醋酸盐去羧酶;过表达磷酸烯醇丙酮酸盐合成酶结合过表达磷酸烯醇丙酮酸盐羧化激酶以及过表达苹果酸脱氢酶;过表达磷酸烯醇丙酮酸盐合成酶结合过表达磷酸烯醇丙酮酸盐羧化激酶、过表达草酰醋酸盐去羧酶以及过表达苹果酸脱氢酶;过表达磷酸烯醇丙酮酸盐羧化激酶结合过表达草酰醋酸盐去羧酶以及过表达苹果酸脱氢酶;及/或过表达磷酸烯醇丙酮酸盐合成酶结合过表达草酰醋酸盐去羧酶以及过表达苹果酸脱氢酶。
在另一例示性实施例中,细胞通过不同的适应来进行修饰,例如过表达磷酸烯醇丙酮酸盐合成酶结合过表达磷酸烯醇丙酮酸盐羧化激酶并结合缺失丙酮酸激酶的基因;过表达磷酸烯醇丙酮酸盐合成酶结合过表达草酰醋酸盐去羧酶并结合缺失丙酮酸激酶的基因;过表达磷酸烯醇丙酮酸盐合成酶结合过表达苹果酸脱氢酶并结合缺失丙酮酸激酶的基因;过表达磷酸烯醇丙酮酸盐羧化激酶结合过表达草酰醋酸盐去羧酶并结合缺失丙酮酸激酶的基因;过表达磷酸烯醇丙酮酸盐羧化激酶结合过表达苹果酸脱氢酶并结合缺失丙酮酸激酶的基因;过表达草酰醋酸盐去羧酶结合过表达苹果酸脱氢酶并结合缺失丙酮酸激酶的基因;过表达磷酸烯醇丙酮酸盐合成酶结合过表达草酰醋酸盐去羧酶并结合缺失丙酮酸激酶的基因;过表达磷酸烯醇丙酮酸盐合成酶结合过表达磷酸烯醇丙酮酸盐羧化激酶及过表达苹果酸脱氢酶并结合缺失丙酮酸激酶的基因;过表达磷酸烯醇丙酮酸盐合成酶结合过表达磷酸烯醇丙酮酸盐羧化激酶、过表达草酰醋酸盐去羧酶、及过表达苹果酸脱氢酶并结合缺失丙酮酸激酶的基因;过表达磷酸烯醇丙酮酸盐羧化激酶结合过表达草酰醋酸盐去羧酶及过表达苹果酸脱氢酶并结合缺失丙酮酸激酶的基因;以及过表达磷酸烯醇丙酮酸盐合成酶结合过表达草酰醋酸盐去羧酶及过表达苹果酸脱氢酶并结合缺失丙酮酸激酶的基因。
在另一例示性实施例中,细胞通过不同的适应来进行修饰,例如过表达磷酸烯醇丙酮酸盐合成酶结合过表达磷酸烯醇丙酮酸盐羧化激酶并结合缺失磷酸烯醇丙酮酸盐羧酶基因;过表达磷酸烯醇丙酮酸盐合成酶结合过表达草酰醋酸盐去羧酶并结合缺失磷酸烯醇丙酮酸盐羧酶基因;过表达磷酸烯醇丙酮酸盐合成酶结合过表达苹果酸脱氢酶并结合缺失磷酸烯醇丙酮酸盐羧酶基因;过表达磷酸烯醇丙酮酸盐羧化激酶结合过表达磷酸烯醇丙酮酸盐并结合缺失磷酸烯醇丙酮酸盐羧酶基因;过表达磷酸烯醇丙酮酸盐羧化激酶结合过表达苹果酸脱氢酶并结合缺失磷酸烯醇丙酮酸盐羧酶基因;过表达草酰醋酸盐去羧酶结合过表达苹果酸脱氢酶并结合缺失磷酸烯醇丙酮酸盐羧酶基因;过表达磷酸烯醇丙酮酸盐合成酶结合过表达磷酸烯醇丙酮酸盐羧化激酶及过表达草酰醋酸盐去羧酶并结合缺失磷酸烯醇丙酮酸盐羧酶基因;过表达磷酸烯醇丙酮酸盐合成酶结合过表达磷酸烯醇丙酮酸盐羧化激酶及过表达苹果酸脱氢酶并结合缺失磷酸烯醇丙酮酸盐羧酶基因;过表达磷酸烯醇丙酮酸盐合成酶结合过表达磷酸烯醇丙酮酸盐羧化激酶、过表达草酰醋酸盐去羧酶及过表达苹果酸脱氢酶并结合缺失磷酸烯醇丙酮酸盐羧酶基因;过表达磷酸烯醇丙酮酸盐羧化激酶结合过表达草酰醋酸盐去羧酶及过表达苹果酸脱氢酶并结合缺失磷酸烯醇丙酮酸盐羧酶基因;以及过表达磷酸烯醇丙酮酸盐合成酶结合过表达草酰醋酸盐去羧酶及过表达苹果酸脱氢酶并结合缺失磷酸烯醇丙酮酸盐羧酶基因。
在另一例示性实施例中,细胞通过不同的适应来进行修饰,例如过表达磷酸烯醇丙酮酸盐合成酶结合过表达磷酸烯醇丙酮酸盐羧化激酶并结合缺失丙酮酸羧酶基因;过表达磷酸烯醇丙酮酸盐合成酶结合过表达草酰醋酸盐去羧酶并结合缺失丙酮酸羧酶基因;过表达磷酸烯醇丙酮酸盐合成酶结合过表达苹果酸脱氢酶并结合缺失丙酮酸羧酶基因;过表达磷酸烯醇丙酮酸盐羧化激酶结合过表达草酰醋酸盐去羧酶并结合缺失丙酮酸羧酶基因;过表达磷酸烯醇丙酮酸盐羧化激酶结合过表达苹果酸脱氢酶并结合缺失丙酮酸羧酶基因;过表达草酰醋酸盐去羧酶结合过表达苹果酸脱氢酶并结合缺失丙酮酸羧酶基因;过表达磷酸烯醇丙酮酸盐合成酶结合过表达磷酸烯醇丙酮酸盐羧化激酶及过表达草酰醋酸盐去羧酶并结合缺失丙酮酸羧酶基因;过表达磷酸烯醇丙酮酸盐合成酶结合过表达磷酸烯醇丙酮酸盐羧化激酶及过表达苹果酸脱氢酶并结合缺失丙酮酸羧酶基因;过表达磷酸烯醇丙酮酸盐合成酶结合过表达磷酸烯醇丙酮酸盐羧化激酶、过表达草酰醋酸盐去羧酶及过表达苹果酸脱氢酶并结合缺失丙酮酸羧酶基因;过表达磷酸烯醇丙酮酸盐羧化激酶结合过表达草酰醋酸盐去羧酶及过表达苹果酸脱氢酶并结合缺失丙酮酸羧酶基因;以及过表达磷酸烯醇丙酮酸盐合成酶结合过表达草酰醋酸盐去羧酶及过表达苹果酸脱氢酶并结合缺失丙酮酸羧酶基因。
在另一例示性实施例中,细胞通过不同的适应来进行修饰,例如过表达磷酸烯醇丙酮酸盐合成酶结合过表达磷酸烯醇丙酮酸盐羧化激酶并结合缺失丙酮酸激酶的基因与磷酸烯醇丙酮酸盐羧酶的基因;过表达磷酸烯醇丙酮酸盐合成酶结合过表达草酰醋酸盐去羧酶并结合缺失丙酮酸激酶的基因与磷酸烯醇丙酮酸盐羧酶的基因;过表达磷酸烯醇丙酮酸盐合成酶结合过表达苹果酸脱氢酶并结合缺失丙酮酸激酶的基因与磷酸烯醇丙酮酸盐羧酶的基因;过表达磷酸烯醇丙酮酸盐羧化激酶结合过表达草酰醋酸盐去羧酶并结合缺失丙酮酸激酶的基因与磷酸烯醇丙酮酸盐羧酶的基因;过表达磷酸烯醇丙酮酸盐羧化激酶结合过表达苹果酸脱氢酶并结合缺失丙酮酸激酶的基因与磷酸烯醇丙酮酸盐羧酶的基因;过表达草酰醋酸盐去羧酶结合过表达苹果酸脱氢酶并结合缺失丙酮酸激酶的基因与磷酸烯醇丙酮酸盐羧酶的基因;过表达磷酸烯醇丙酮酸盐合成酶结合过表达磷酸烯醇丙酮酸盐羧化激酶及过表达草酰醋酸盐去羧酶并结合缺失丙酮酸激酶的基因与磷酸烯醇丙酮酸盐羧酶的基因;过表达磷酸烯醇丙酮酸盐合成酶结合过表达磷酸烯醇丙酮酸盐羧化激酶及过表达苹果酸脱氢酶并结合缺失丙酮酸激酶的基因与磷酸烯醇丙酮酸盐羧酶的基因;过表达磷酸烯醇丙酮酸盐合成酶结合过表达磷酸烯醇丙酮酸盐羧化激酶、过表达草酰醋酸盐去羧酶及过表达苹果酸脱氢酶并结合缺失丙酮酸激酶的基因与磷酸烯醇丙酮酸盐羧酶的基因;过表达磷酸烯醇丙酮酸盐羧化激酶结合过表达草酰醋酸盐去羧酶及过表达苹果酸脱氢酶并结合缺失丙酮酸激酶的基因与磷酸烯醇丙酮酸盐羧酶的基因;以及过表达磷酸烯醇丙酮酸盐合成酶结合过表达草酰醋酸盐去羧酶及过表达苹果酸脱氢酶并结合缺失丙酮酸激酶的基因与磷酸烯醇丙酮酸盐羧酶的基因。
在另一例示性实施例中,细胞通过不同的适应来进行修饰,例如过表达磷酸烯醇丙酮酸盐合成酶结合过表达磷酸烯醇丙酮酸盐羧化激酶并结合缺失丙酮酸激酶的基因、丙酮酸羧酶的基因与磷酸烯醇丙酮酸盐羧酶的基因;过表达磷酸烯醇丙酮酸盐合成酶结合过表达草酰醋酸盐去羧酶并结合缺失丙酮酸激酶的基因、丙酮酸羧酶的基因与磷酸烯醇丙酮酸盐羧酶的基因;过表达磷酸烯醇丙酮酸盐合成酶结合过表达苹果酸脱氢酶并结合缺失丙酮酸激酶的基因、丙酮酸羧酶的基因与磷酸烯醇丙酮酸盐羧酶的基因;过表达磷酸烯醇丙酮酸盐羧化激酶结合过表达草酰醋酸盐去羧酶并结合缺失丙酮酸激酶的基因、丙酮酸羧酶的基因与磷酸烯醇丙酮酸盐羧酶的基因;过表达磷酸烯醇丙酮酸盐羧化激酶结合过表达苹果酸脱氢酶并结合缺失丙酮酸激酶的基因、丙酮酸羧酶的基因与磷酸烯醇丙酮酸盐羧酶的基因;过表达草酰醋酸盐去羧酶结合过表达苹果酸脱氢酶并结合缺失丙酮酸激酶的基因、丙酮酸羧酶的基因与磷酸烯醇丙酮酸盐羧酶的基因;过表达磷酸烯醇丙酮酸盐合成酶结合过表达磷酸烯醇丙酮酸盐羧化激酶及过表达草酰醋酸盐去羧酶并结合缺失丙酮酸激酶的基因、丙酮酸羧酶的基因与磷酸烯醇丙酮酸盐羧酶的基因;过表达磷酸烯醇丙酮酸盐合成酶结合过表达磷酸烯醇丙酮酸盐羧化激酶及过表达苹果酸脱氢酶并结合缺失丙酮酸激酶的基因、丙酮酸羧酶的基因与磷酸烯醇丙酮酸盐羧酶的基因;过表达磷酸烯醇丙酮酸盐合成酶结合过表达磷酸烯醇丙酮酸盐羧化激酶、过表达草酰醋酸盐去羧酶及过表达苹果酸脱氢酶并结合缺失丙酮酸激酶的基因、丙酮酸羧酶的基因与磷酸烯醇丙酮酸盐羧酶的基因;过表达磷酸烯醇丙酮酸盐羧化激酶结合过表达草酰醋酸盐去羧酶及过表达苹果酸脱氢酶并结合缺失丙酮酸激酶的基因、丙酮酸羧酶的基因与磷酸烯醇丙酮酸盐羧酶的基因;以及过表达磷酸烯醇丙酮酸盐合成酶结合过表达草酰醋酸盐去羧酶及过表达苹果酸脱氢酶并结合缺失丙酮酸激酶的基因、丙酮酸羧酶的基因与磷酸烯醇丙酮酸盐羧酶的基因。
根据本发明的方法及/或细胞的另一个较佳实施例,细胞包含至少部分失活的所选单糖、双糖或寡糖的分解代谢途径,所述单糖、双糖或寡糖参与/或为产生如于此所述的岩藻糖-α1,2-半乳糖-R的α-1,3糖基化形式所必需。
根据本发明的方法及/或细胞的另一个较佳实施例,全肉汤(whole broth)及/或上清液中产生90g/L或更多的该α-1,3糖基化形式的Fuc-a1,2-Gal-R,及/或其中在全肉汤及/或上清液中,该α-1,3糖基化形式的Fuc-a1,2-Gal-R依据该α-1,3糖基化形式的Fuc-a1,2-Gal-与其前体于该全肉汤及/或上清液中的总量测量分别具有至少80%的纯度。
根据本发明的方法及/或细胞的另一实施例,允许产生所述α-1,3糖基化形式的Fuc-a1,2-Gal-R的条件包括使用包含至少一种前体及/或受体的培养基用于产生所述α-1,3糖基化形式的Fuc-a1,2-Gal-R。较佳为,培养基包含选自包括乳糖、半乳糖、岩藻糖、唾液酸、GlcNAc、GalNAc、乳-N-二糖(LNB)、N-乙酰基乳糖胺(LacNAc)的群组的至少一种前体。
根据本发明方法的替代及/或附加实施例,允许产生所述α-1,3糖基化形式的Fuc-a1,2-Gal-R的条件包括对培养基添加至少一种前体及/或受体补料以用于产生所述α-1,3糖基化形式的Fuc-a1,2-Gal-R。
根据本发明方法的一个替代实施例,允许产生所述α-1,3糖基化形式的Fuc-a1,2-Gal-R的条件包括使用培养基以培养本发明的细胞以产生α-1,3糖基化形式的Fuc-a1,2-Gal-R,其中所述培养基缺乏以用于产生所述α-1,3糖基化形式的Fuc-a1,2-Gal-R的任何前体及/或受体,并且与进一步添加至所述培养基的至少一种前体及/或受体进料组合以用于产生所述α-1,3糖基化形式的Fuc-a1,2-Gal-R。
在一较佳实施例中,用于产生如于此所述的α-1,3糖基化形式的Fuc-a1,2-Gal-R的方法包括以下步骤中的至少一个:
i)用包括至少一种前体及/或受体的培养基;
ii)对于反应器中的该培养基添加至少一种前体及/或受体进料,其中总反应器体积在250mL(毫升)至10.000m3(立方公尺)的范围内,较佳为以连续方式,且较佳为使得该培养基的最终体积不大于三倍,较佳为不大于两倍,更佳为小于两倍的在添加该前体及/或受体进料之前的该培养基的体积;
iii)对于反应器中的该培养基添加至少一种前体及/或受体进料,其中总反应器体积在250mL(毫升)至10.000m3(立方公尺)的范围内,较佳为以连续方式,且较佳为使得该培养基的最终体积不大于三倍,较佳为不大于两倍,更佳为小于两倍的在添加该前体及/或受体进料之前的该培养基的体积,且其中较佳为该前体及/或受体进料的pH被设定为介于3与7之间,且其中较佳为该前体及/或受体进料的温度被维持在介于20℃与80℃之间;
iv)藉由进料溶液的方式,在1天、2天、3天、4天、5天的进程期间,以连续方式添加至少一种前体及/或受体进料至该培养基;
v)藉由进料溶液的方式,在1天、2天、3天、4天、5天的进程期间,以连续方式添加至少一种前体及/或受体进料至该培养基,且其中较佳为该进料溶液的pH被设定为介于3与7之间,又其中较佳为该进料溶液的温度被维持在介于20℃与80℃之间;
该方法导致在该最终培养物中具有至少50g/L,较佳为至少75g/L,更佳为至少90g/L,更佳为至少100g/L,更佳为至少125g/L,更佳为至少150g/L,更佳为至少175g/L,更佳为至少200g/L的浓度的α-1,3糖基化形式的Fuc-a1,2-Gal-R。
在另一及/或额外较佳实施例中,用于产生如于此所述的α-1,3糖基化形式的Fuc-a1,2-Gal-R的方法包括以下步骤中的至少一个:
i)使用培养基,其包括每公升的起始反应器体积至少50,更佳为至少75,更佳为至少100,更佳为至少120,更佳为至少150公克的乳糖,其中该反应器体积在250mL(毫升)至10.000m3(立方公尺)的范围内;
ii)对该培养基添加至少一种前体及/或受体进料以一次脉冲或不连续(脉冲)的方式,其中该反应器体积在250mL(毫升)至10.000m3(立方公尺)的范围内,较佳为使得该培养基的最终体积不大于三倍,较佳为不大于两倍,更佳为小于两倍的在添加该前体及/或受体进料脉冲之前的该培养基的体积;
iii)对于生物反应器中的该培养基添加至少一种前体及/或受体进料以一次脉冲或不连续(脉冲)的方式,其中该反应器体积在250mL(毫升)至10.000m3(立方公尺)的范围内,较佳为使得该培养基的最终体积不大于三倍,较佳为不大于两倍,更佳为小于两倍的在添加该前体及/或受体进料脉冲之前的该培养基的体积,且其中较佳为该前体及/或受体进料脉冲的pH被设定为介于3与7之间,且其中较佳为该前体及/或受体进料脉冲的温度被维持在介于20℃与80℃之间;
iv)在5分钟、10分钟、30分钟、1小时、2小时、4小时、10小时、12小时、1天、2天、3天、4天、5天的过程中,通过进料溶液的方式以不连续(脉冲)的方式对培养基添加至少一种前体及/或受体进料;
v)在5分钟、10分钟、30分钟、1小时、2小时、4小时、10小时、12小时、1天、2天、3天、4天、5天的过程中,通过进料溶液的方式以一不连续(脉冲)的方式对培养基添加至少一种前体及/或受体进料,其中较佳为所述进料溶液的pH被设定为介于3与7之间,且其中较佳为所述进料溶液的温度被维持在介于20℃与80℃之间;
该方法导致在该最终培养物中具有至少50g/L,较佳为至少75g/L,更佳为至少90g/L,更佳为至少100g/L,更佳为至少125g/L,更佳为至少150g/L,更佳为至少175g/L,更佳为至少200g/L的浓度的α-1,3糖基化形式的Fuc-a1,2-Gal-R。
在一进一步更佳实施例中,用于产生如于此所述的α-1,3糖基化形式的Fuc-a1,2-Gal-R的方法包括以下步骤中的至少一个:
i)使用培养基,其包括每公升的起始反应器体积至少50,更佳为至少75,更佳为至少100,更佳为至少120,更佳为至少150公克的乳糖,其中该反应器体积在250mL(毫升)至10.000m3(立方公尺)的范围内;
ii)对该培养基添加乳糖进料,其包括每公升的起始反应器体积至少50,更佳为至少75,更佳为至少100,更佳为至少120,更佳为至少150公克的乳糖,其中该反应器体积在250mL(毫升)至10.000m3(立方公尺)的范围内,较佳为以连续形式,且较佳为使得该培养基的最终体积不大于三倍,较佳为不大于两倍,更佳为小于两倍的在添加该乳糖进料之前的该培养基的体积;
iii)对该培养基添加乳糖进料,其包括每公升的起始反应器体积至少50,更佳为至少75,更佳为至少100,更佳为至少120,更佳为至少150公克的乳糖,其中该反应器体积在250mL(毫升)至10.000m3(立方公尺)的范围内,较佳为以连续形式,且较佳为使得该培养基的最终体积不大于三倍,较佳为不大于两倍,更佳为小于两倍的在添加该乳糖进料之前的该培养基的体积,且其中较佳为该乳糖进料的pH被设定为介于3与7之间,又其中较佳为该乳糖进料的温度被维持在介于20℃与80℃之间;
iv)藉由进料溶液的方式,在1天、2天、3天、4天、5天的进程期间,以连续方式添加一乳糖进料至该培养基;
v)藉由进料溶液的方式,在1天、2天、3天、4天、5天的进程期间,以连续方式添加一乳糖进料至该培养基,且其中该乳糖进料溶液的浓度为50g/L,较佳为75g/L,更佳为100g/L,更佳为125g/L,更佳为150g/L,更佳为175g/L,更佳为200g/L,更佳为225g/L,更佳为250g/L,更佳为275g/L,更佳为300g/L,更佳为325g/L,更佳为350g/L,更佳为375g/L,更佳为400g/L,更佳为450g/L,更佳为500g/L,还更佳为,550g/L,最佳为600g/L;且其中较佳为该进料溶液的pH被设定为介于3与7之间,又其中较佳为该进料溶液的温度被维持在介于20℃与80℃之间;
该方法导致在该培养物的最终体积中具有至少50g/L,较佳为至少75g/L,更佳为至少90g/L,更佳为至少100g/L,更佳为至少125g/L,更佳为至少150g/L,更佳为至少175g/L,更佳为至少200g/L的浓度的α-1,3糖基化形式的Fuc-a1,2-Gal-R。
较佳为,藉由从培养开始以至少5mM的浓度,较佳为以30、40、50、60、70、80、90、100、150mM的浓度,更佳为以>300mM的浓度添加乳糖,来实现乳糖进料。
在另一实施例中,藉由对培养基中添加一定浓度的乳糖来实现乳糖进料,使得在培养的整个生产阶段获得至少5mM,较佳为10mM或30mM的乳糖浓度。
在于此所述方法的进一步实施例中,细胞培养至少约60、80、100或约120小时或以连续方式培养。
在一个较佳实施例中,在培养基中提供碳源,较佳为蔗糖,3天或更多天,较佳为上至7天;及/或在培养基中以连续方式提供每升初始培养体积至少100、有利地至少105、更有利地至少110、甚至更有利地至少120克的蔗糖,使得培养基的最终体积的体积不超过培养前的培养基体积的三倍,有利地不超过两倍,更有利地小两倍。
较佳为,当进行如于此所述的方法时,通过在第二阶段(second phase)中将乳糖添加到培养基之前对培养基添加碳源,较佳为葡萄糖或蔗糖,提供指数细胞生长的第一阶段(first phase)。
在本发明方法的另一较佳实施例中,通过对包含前体,较佳为乳糖的培养基中添加碳基基质,较佳为葡萄糖或蔗糖,提供指数细胞生长的第一阶段,然后是第二阶段,其中仅将碳基基质,较佳为葡萄糖或蔗糖添加到培养基中。
在本发明方法的另一个较佳实施例中,藉由将碳基基质,较佳为葡萄糖或蔗糖添加到包含前体,较佳为乳糖的培养基中,提供指数细胞生长的第一阶段,然后是第二阶段,其中将碳基基质,较佳为葡萄糖或蔗糖和前体,较佳为乳糖添加到培养基中。
在一个替代的较佳实施例中,在如于此所述的方法中,已经在指数生长的第一阶段将乳糖与碳基基质一起添加。
在一实施例中,如于此所述的方法较佳为包括分离如于此所述的α-1,3糖基化形式的岩藻糖-α1,2-半乳糖-R的步骤。
在一较佳实施例中,于此所述的方法较佳为包括分离所述α-1,3糖基化形式的LNFP-I的步骤。
术语“从所述培养物分离”是指从细胞或其生长的培养基收获、收集或回收于此所述的所述α-1,3糖基化形式的岩藻糖-α1,2-半乳糖-R或所述α-1,3糖基化形式的LNFP-1。
如于此所述的α-1,3糖基化形式的岩藻糖-α1,2-半乳糖-R或α-1,3糖基化形式的LNFP-I可以以一般方式从于其中细胞生长的水性培养基分离。如果所述α-1,3糖基化形式的岩藻糖-α1,2-半乳糖-R或α-1,3糖基化形式的LNFP-1仍然存在于产生α-1,3糖基化形式的岩藻糖-α1,2-半乳糖-R或α-1,3糖基化形式的LNFP-1的细胞中,可使用一般方式游离或萃取α-1,3糖基化形式的岩藻糖-α1,2-半乳糖-R或α-1,3糖基化形式的LNFP-1出细胞,例如使用高pH值、热震(heat shock)、超声处理(sonication)、法式压碎机(French press)、均质化(homogenization)、酶水解、化学水解、溶剂水解、清洁剂、水解、...的细胞破坏。培养基及/或细胞萃取物一起和单独可的后进一步用于分离α-1,3糖基化形式的岩藻糖-α1,2-半乳糖-R或α-1,3糖基化形式的LNFP-1。此较佳为包括澄清含有所述α-1,3糖基化形式的岩藻糖-α1,2-半乳糖-R或α-1,3糖基化形式的LNFP-1的混合物,以去除悬浮颗粒与污染物,特别是通过培养基因修饰细胞产生的细胞、细胞成分、不溶性代谢物与碎片。在该步骤中,可以以一般方式澄清含有所述α-1,3糖基化形式的岩藻糖-α1,2-半乳糖-R或α-1,3糖基化形式的LNFP-1的混合物。优选地,含有所述α-1,3糖基化形式的岩藻糖-α1,2-半乳糖-R或α-1,3糖基化形式的LNFP-1的混合物藉由离心、絮凝、倾析及/或过滤来澄清。
将所述α-1,3糖基化形式的岩藻糖-a1,2-半乳糖-R或α-1,3糖基化形式的LNFP-I从含所述α-1,3糖基化形式的LNFP-I混合物中分离出来的另一个步骤较佳为包括从含有所述岩藻糖-a-1,2-半乳糖-R的α-1,3糖基化形式或LNFP-I的α-1,3糖基化形式的混合物,较佳为在澄清之后,基本上去除所有的蛋白质,以及肽、氨基酸、RNA和DNA和任何可能干扰后续分离步骤的内毒素和糖脂。在该步骤中,可以以一般方式从含有所述α-1,3糖基化形式的岩藻糖-α1,2-半乳糖-R或α-1,3糖基化形式的LNFP-1的混合物去除蛋白质和相关杂质。较佳为,从含有所述α-1,3糖基化形式的岩藻糖-α1,2-半乳糖-R或α-1,3糖基化形式的LNFP-1的混合物中去除蛋白质、盐、副产物、颜色、内毒素和其他相关杂质,藉由超滤、纳米过滤、两相分配、反渗透、微过滤、活性炭或碳处理、用非离子界面活性剂处理、酶消化、切向流高性能过滤、切向流超过滤、电泳(例如使用板状聚丙烯酰胺或钠十二烷基硫酸盐-聚丙烯酰胺凝胶电泳(PAGE))、亲和层析(使用亲和配体,包括例如DEAE-Sepharose、聚-L-赖氨酸和多粘菌素-B、内毒素选择性吸附剂基质)、离子交换层析(例如但不限于阳离子交换、阴离子交换、混合床离子交换、内外配体连接)、疏水相互作用层析及/或凝胶过滤(即粒径排阻层析法(size exclusion chromatography)),特别是藉由层析,更特别是藉由离子交换层析或疏水相互作用层析或配体交换层析。除了粒径排阻层析,蛋白质和相关杂质被层析介质或选定的膜保留,所述α-1,3糖基化形式的岩藻糖-α1,2-半乳糖-R或α-1,3糖基化形式的LNFP-1的保留在含有α-1,3糖基化形式的岩藻糖-α1,2-半乳糖-R或α-1,3糖基化形式的LNFP-1的混合物中。
在进一步较佳实施例中,于此所述的方法还提供了从混合物中进一步纯化α-1,3糖基化形式的岩藻糖-α1,2-半乳糖-R或α-1,3糖基化形式的LNFP-1。所述α-1,3糖基化形式的岩藻糖-α1,2-半乳糖-R或α-1,3糖基化形式的LNFP-I的进一步纯化可以例如藉由使用(活化)木炭或碳、纳米过滤、超过滤或离子交换来达成,以去除任何残留的DNA、蛋白质、LPS、内毒素或其他杂质。也可以使用醇,例如乙醇,和含水醇混合物。另一个纯化步骤是通过产物的结晶、蒸发或沉淀来完成的。其他纯化步骤为干燥,例如喷雾干燥(spraydrying)、冷冻干燥(lyophilization)、喷雾冷冻干燥(spray freeze drying)、冷冻喷雾干燥(freeze spray drying)、条式干燥(band drying)、带式干燥(belt drying)、真空条式干燥(vacuum band drying)、真空带式干燥(vacuum belt drying)、滚筒式干燥(drumdrying)、滚筒干燥(roller drying)、真空滚筒式干燥(vacuum drum drying)或真空滚筒干燥(vacuum roller drying)所产生的α-1,3糖基化形式的岩藻糖-α1,2-半乳糖-R或α-1,3糖基化形式的LNFP-I。
在示例性实施例中,α-1,3糖基化形式的岩藻糖-α1,2-半乳糖-R或α-1,3糖基化形式的LNFP-I的分离和纯化是在包括以下任意顺序的步骤的方法中进行的:
a)将培养物或其澄清形式与具600-3500Da的截留分子量(MWCO)的纳米滤膜接触,确保保留产生的α-1,3糖基化形式的LNFP-1并允许至少一部分蛋白质、盐类、副产品、颜色和其他相关杂质通过,
b)对来自步骤a)的渗余物进行渗滤过程,使用所述膜,用无机电解质的水溶液,然后视需要而定以纯水渗滤以除去过量的电解质,
c)且分别以来自所述电解质的阳离子的盐的形式收集富含α-1,3糖基化形式的岩藻糖-α1,2-半乳糖-R或α-1,3糖基化形式的LNFP-I的滞留物。
在一替代示例性实施例中,α-1,3糖基化形式的岩藻糖-α1,2-半乳糖-R或α-1,3糖基化形式的LNFP-I的分离和纯化是在包括以下任意顺序的步骤的方法中进行的:使用不同的膜对培养物或其澄清版本进行两个膜过滤步骤,其中-一膜具有约300至约500道尔顿之间的截留分子量,并且-另一膜具有约600至约800道尔顿之间的截留分子量。
在一替代示例性实施例中,α-1,3糖基化形式的岩藻糖-α1,2-半乳糖-R或α-1,3糖基化形式的LNFP-I的分离和纯化是在包括以下任意顺序的步骤的方法中进行的,包括用H+-形式的强阳离子交换树脂和游离碱形式的弱阴离子交换树脂处理培养物或其澄清形式的步骤。
在一替代示例性实施例中,α-1,3糖基化形式的岩藻糖-α1,2-半乳糖-R或α-1,3糖基化形式的LNFP-1的分离和纯化按以下方式进行。
包含所产生的α-1,3糖基化形式的岩藻糖-α1,2-半乳糖-R或α-1,3糖基化形式的LNFP-1、生物质、培养基成分和污染物的培养物适用于以下纯化步骤:
i)从培养物分离生物质,
ii)用于去除带正电材料的阳离子交换剂处理,
iii)用于去除带负电材料的阴离子交换剂处理,
iv)纳米过滤步骤及/或电渗析步骤,
其中提供了一种纯化的溶液,该溶液包含所产生的α-1,3糖基化形式的LNFP-1的,纯度大于或等于80%。视需要而定,将经纯化的溶液干燥,藉由选自包括喷雾干燥、冷冻干燥、喷雾冷冻干燥、冷冻喷雾干燥、条式干燥、带式干燥(belt drying)、真空条式干燥、真空带式干燥、滚筒式干燥、滚筒干燥、真空滚筒式干燥或真空滚筒干燥的列表的一或更多种的干燥步骤。
在一替代示例性实施例中,α-1,3糖基化形式的岩藻糖-α1,2-半乳糖-R或α-1,3糖基化形式的LNFP-I的分离和纯化是在包括以下任意顺序的步骤的方法中进行的:培养物的酶处理;从培养物中去除生物质;超过滤;纳米过滤;与柱层析步骤。优选地,此种柱层析是单柱式或多柱式。更佳为,柱层析步骤是模拟移动床层析(simulated moving bedchromatography)。此种模拟移动床层析较佳为包括i)至少4个柱,其中至少一个柱包含弱或强阳离子交换树脂;及/或ii)具有不同流速的四个区域I、II、III和IV;及/或iii)包含水的洗脱液;及/或iv)15至60摄氏度的操作温度。较佳为,所述方法还包括喷雾干燥步骤。
在一实施例中,本发明提供所产生的α-1,3糖基化形式的岩藻糖-α1,2-半乳糖-R或α-1,3糖基化形式的LNFP-I,其被干燥为粉末,藉由选自包括喷雾干燥、冷冻干燥、喷雾冷冻干燥、冷冻喷雾干燥、条式干燥、带式干燥、真空条式干燥、真空带式干燥、滚筒式干燥、滚筒干燥、真空滚筒式干燥或真空滚筒干燥的列表的一或更多的干燥步骤,其中干燥的粉末含有<15%-wt.的水,较佳为<10%-wt.的水,更佳为<7%-wt.的水,最佳为<5%-wt.的水。
本发明的另一实施例提供一种方法与一种细胞,其中于此所述的α-1,3糖基化形式的岩藻糖-α1,2-半乳糖-R,较佳为α-1,3糖基化形式的LNFP-1是于此所述的真菌、酵母菌、细菌、昆虫、植物、动物或原生细胞中产生及/或由其所产生。细胞是选自包含以下所列的名单:细菌、酵母菌、或真菌,或指的是植物、动物或原生动物细胞。后者的细菌较佳属于变形菌门(Proteobacteria)或后壁菌门(Firmicutes)或蓝绿菌门(Cyanobacteria)或异常球菌-栖热菌门(Deinococcus-Thermus)。属于变形菌门的后者细菌较佳属于肠杆菌科(Enterobacteriaceae),较佳属于大肠杆菌种。后者的细菌较佳属于大肠杆菌种的任何菌株,例如但不限于大肠杆菌B(Escherichia coli B)、大肠杆菌C(Escherichia coli C)、大肠杆菌W(Escherichia coli W)、大肠杆菌K12(Escherichia coli K12)、大肠杆菌Nissle(Escherichia coli Nissle)。更具体而言,后者一词是关于培养的大肠杆菌菌株,其指定为大肠杆菌K12菌株,对于实验室环境适应良好,且与野生行菌株不同的是失去在肠道生存的能力。大肠杆菌K12菌株众所周知的范例为K12野生型、W3110、MG1655、M182、MC1000、MC1060、MC1061、MC4100、JM101、NZN111与AA200。因此,本发明特别是关于如前文所述的突变及/或转化的大肠杆菌细胞或菌株,其中所述大肠杆菌菌株为K12菌株。更佳的是,大肠杆菌K12菌株为大肠杆菌MG1655。属于后壁菌门(Firmicutes)的后者细菌较佳属于杆菌(Bacilli),较佳为乳酸杆菌(Lactobacilliales),其成员有乳酸乳酸杆菌(Lactobacilluslactis)、肠膜明串珠菌(Leuconostoc mesenteroides),或较佳为核衣细菌目(Bacillales),其成员如来自杆菌属(Bacillus),例如枯草杆菌(Bacillus subtilis)或芽孢枯草杆菌(B.amyloliquefaciens)。属于放线菌门(Actinobacteria)的后者细菌较佳属于棒状杆菌科(Corynebacteriaceae),其成员有谷氨酸棒状杆菌(Corynebacteriumglutamicum)或非发酵棒杆菌(C.afermentans),或较佳属于链丝菌科(Streptomycetaceae),其成员有灰色链霉菌(Streptomyces griseus)或弗氏链霉菌(S.fradiae)。后者的酵母菌较佳属于子囊菌门(Ascomycota)或担子菌门(Basidiomycota)或半知菌门(Deuteromycota)或接合菌门(Zygomycetes)。后者的酵母菌较佳属于酵母菌属(Saccharomyces)(其成员如酿酒酵母菌(Saccharomyces cerevisiae)、贝酵母菌(S.bayanus)、布拉迪酵母(S.boulardii))、接合酵母菌属(Zygosaccharomyces)、毕赤酵母菌属(Pichia)(甲醇酵母(Pichia pastoris)、异常毕赤酵母(P.anomala)、克鲁维毕赤酵母(P.kluyveri))、克马格特勒酵母菌属(Komagataella)、汉逊氏酵母菌属(Hansenula)、克鲁维酵母菌属(Kluyveromyces)(其成员如乳酸克鲁维酵母(Kluyveromyces lactis)、马克斯克鲁维酵母(K.marxianus)、耐热克鲁维酵母(K.thermotolerans))、德巴利酵母菌属(Debaromyces)、子囊菌酵母属(Yarrowia)(例如,解脂耶氏酵母(Yarrowia lipolytica))、或拟球酵母菌属(Starmerella)(例如,拟球酵母菌(Starmerella bombicola))。后者的酵母菌较佳选自甲醇酵母(Pichia pastoris)、解脂耶氏酵母(Yarrowia lipolytica)、酿酒酵母菌(Saccharomyces cerevisiae)与乳酸克鲁维酵母(Kluyveromyces lactis)。后者的真菌较佳属于酒曲菌属(Rhizopus)、网柄菌属(Dictyostelium)、青霉菌属(Penicillium)、白霉菌属(Mucor)或曲菌属(Aspergillus)。植物细胞包括开花植物与非开花植物的细胞,以及藻类细胞,例如单胞藻属(Chlamydomonas)、绿球藻属(Chlorella)等。较佳的是,所述植物为烟草、苜蓿、水稻、西红柿、棉花、油菜籽、大豆、玉米或玉米植物。后者的动物细胞较佳为衍生自非人类哺乳类(例如,牛、水牛、猪、羊、小鼠、大鼠)、鸟类(例如,鸡、鸭、鸵鸟、火鸡、野鸡(pheasant))、鱼类(例如,剑鱼、鲑鱼、金枪鱼、鲈鱼、鳟鱼、鲶鱼)、无脊椎动物(例如,龙虾、螃蟹、虾、蛤蜊、牡蛎、贻贝、海胆)、爬虫类(例如,蛇、短吻鳄、乌龟)、两栖类(例如,青蛙)或昆虫类(例如,果蝇、线虫),或是衍生自胚胎干细胞的外的人类细胞的基因修饰细胞株。人类与非人类哺乳类细胞较佳皆可选自包含以下所列的名单:上皮细胞如乳腺上皮细胞、胚胎肾细胞(例如,HEK293或HEK 293T细胞)、纤维母细胞、COS细胞、中华仓鼠卵巢细胞(Chinese Hamster ovary cell,CHO cell)、鼠类骨髓瘤细胞(例如,N20、SP2/0或YB2/0cell)、NIH-3T3细胞、非哺乳类成人干细胞或其衍生细胞,例如如WO21067641中所述。后者的昆虫细胞较佳是衍生自草地贪夜蛾(Spodoptera frugiperda)(例如,sf9或sf21细胞)、家蚕(Bombyx mori)、甘蓝夜蛾(Mamestra brassicae)、粉纹夜蛾(Trichoplusia ni)(例如,BTI-TN-5B1-4细胞)或黑腹果蝇(Drosophila melanogaster)(例如,果蝇S2细胞)。后者的原生动物细胞较佳为蜥蜴利什曼原虫(Leishmania tarentolae)细胞。
根据本发明的方法及/或细胞的较佳实施例,α-1,3糖基化形式的岩藻糖-a1,2-半乳糖-R产生在细胞中及/或由细胞产生,此细胞为活革兰氏阴性菌,所述活革兰氏阴性菌包括聚N-乙酰葡萄糖胺(poly-N-acetyl-glucosamine,PNAG)、肠细菌共同抗原(Enterobacterial Common Antigen,ECA)、纤维素、可拉酸(colonic acid)、核心寡糖、渗透调节间质葡聚糖(osmoregulated perplasmic glucan,OPG)、葡萄糖苷甘油(glucosylglycerol)、聚糖(glycan)及/或海藻糖减弱或经破坏的合成。
在本发明的方法及/或细胞的更佳实施例中,通过对参与合成任一或多种的聚N-乙酰葡萄糖胺(poly-N-acetyl-glucosamine,PNAG)、肠细菌共同抗原(EnterobacterialCommon Antigen,ECA)、纤维素、可拉酸(colonic acid)、核心寡糖、渗透调节间质葡聚糖(osmoregulated perplasmic glucan,OPG)、葡萄糖苷甘油(glucosylglycerol)、聚糖(glycan)及/或海藻糖的一或多种糖基转移酶进行突变,以提供聚N-乙酰葡萄糖胺(poly-N-acetyl-glucosamine,PNAG)、肠细菌共同抗原(Enterobacterial Common Antigen,ECA)、纤维素、可拉酸(colonic acid)、核心寡糖、渗透调节间质葡聚糖(osmoregulatedperplasmic glucan,OPG)、葡萄糖苷甘油(glucosylglycerol)、聚糖(glycan)及/或海藻糖减弱或经破坏的合成,其中所述突变提供任一所述的糖基转移酶的缺失或较低的表达。所述糖基转移酶包括编码下述的糖基转移酶基因:聚-N-乙酰-D-葡萄糖胺合成酶次单元、UDP-N-乙酰葡萄糖胺-十一异戊烯基-磷酸N-乙酰葡萄糖胺磷酸转移酶(UDP-N-acetylglucosamine—undecaprenyl-phosphate N-acetylglucosaminephosphotransferase)、Fuc4NAc(4-乙酰胺基-4,6-二脱氧-D-半乳糖)转移酶、UDP-N-乙酰-D-甘露糖胺醛酸转移酶(UDP-N-acetyl-D-mannosaminuronic acid transferase)、编码下述的糖基转移酶基因:纤维素合成酶催化次单元、纤维素生合成蛋白、可拉酸生合成醛酸基转移酶(colanic acid biosynthesis glucuronosyltransferase)、可拉酸生合成半乳糖基转移酶、可拉酸生合成岩藻糖基转移酶、UDP-葡萄糖:十一异戊烯基-磷酸葡萄糖1-磷酸转移酶(UDP-glucose:undecaprenyl-phosphate glucose-1-phosphate transferase)、推定(putative)可拉酸生合成糖基转移酶、UDP-葡萄糖醛酸盐:LPS(HepIII)糖基转移酶、ADP-庚糖-LPD庚糖基转移酶2(ADP-heptose—LPS heptosyltransferase 2)、ADP-庚糖:LPS庚糖基转移酶1(ADP-heptose:LPS heptosyltransferase 1)、推定ADP-庚糖:LPS庚糖基转移酶4、脂多糖核心生合成蛋白、UDP-葡萄糖:(葡萄糖基)LPSα-1,2-葡萄糖基转移酶(UDP-glucose:(glucosyl)LPSα-1,2-glucosyltransferase)、UDP-葡萄糖:(葡萄糖基)LPSα-1,3-葡萄糖基转移酶、UDP-D-半乳糖:(葡萄糖基)脂多糖-1,6-D-半乳糖基转移酶、脂多糖葡萄糖基转移酶I、脂多糖核心庚糖基转移酶3、β-1,6-半乳呋喃糖基转移酶(β-1,6-galactofuranosyltransferase)、十一异戊烯基-磷酸4-脱氧-6-甲酰胺基-L-阿拉伯糖转移酶(undecaprenyl-phosphate 4-deoxy-4-formamido-L-arabinose transferase)、脂质IVA4-胺基-4-脱氧-L-阿拉伯糖基转移酶(lipid IVA4-amino-4-deoxy-L-arabinosyltransferase)、细菌聚异平醇糖基转移酶(bactoprenol glucosyltransferase)、推定家族2糖基转移酶、渗透调节间质葡聚糖(osmoregulated perplasmicglucan,OPG)生合成蛋白质G、渗透调节间质葡聚糖生合成蛋白质H、葡萄糖甘油酸磷酸化酶(glucosylglycerate phosphorylase)、肝糖合成酶、1,4-α-葡聚糖分支酶(1,4-α-glucanbranching enzyme)、4-α-葡聚糖转移酶(4-α-glucanotransferase)及海藻糖-6-磷酸合成酶。在一例示性实施例中,细胞系经突变包含下列的一或多种糖基转移酶:pgaC、pgaD、rfe、rffT、rffM、bcsA、bcsB、bcsC、wcaA、wcaC、wcaE、wcaI、wcaJ、wcaL、waaH、waaF、waaC、waaU、waaZ、waaJ、waaO、waaB、waaS、waaG、waaQ、wbbl、arnC、arnT、yfdH、wbbK、opgG、opgH、ycjM、glgA、glgB、malQ、otsA与yaiP,其中所述突变提供任一所述糖基转移酶的缺失或较低的表达。
在方法及/或细胞替代及/或额外的较佳实施例中,通过过表达编码碳储存调控蛋白的基因、缺失编码Na+/H+反向运输蛋白的基因及/或缺失编码感测组氨酸激酶的基因而提供所述聚N-乙酰葡萄糖胺(poly-N-acetyl-glucosamine,PNAG)减弱或经破坏的合成。
如于此所使用的微生物或细胞能够在单糖、双糖、寡糖、多糖、多元醇、甘油、包括糖蜜、玉米浆、蛋白胨、胰蛋白胨、酵母菌萃取物或它们的混合物如例如混合原料的复合培养基,较佳为混合单糖原料,例如水解蔗糖为主要碳源上生长。术语“主要”是指感兴趣的生物产品、生物质形成、二氧化碳及/或副产品形成(例如酸及/或醇,例如醋酸盐、乳酸盐及/或乙醇)的最重要的碳源,即所有所需碳的20、30、40、50、60、70、75、80、85、90、95、98、99%来自上述碳源。在本发明的一实施例中,所述碳源是所述生物体的唯一碳源,即所有所需碳的100%来自上述碳源。常见的主要碳源包括但不限于葡萄糖、甘油、果糖、麦芽糖、乳糖、阿拉伯糖、麦芽低聚糖、麦芽三糖、山梨糖醇、木糖、鼠李糖、蔗糖、半乳糖、甘露糖、甲醇、乙醇、海藻糖、淀粉、纤维素、半纤维素、糖蜜、玉米浆、高果糖浆、醋酸盐、柠檬酸盐、乳酸盐与丙酮酸盐。术语复合培养基是指其确切构成未确定的培养基。例子是糖蜜、玉米浆、蛋白胨、胰蛋白胨或酵母菌萃取物。如于此所使用,如于此所定义的前体不能用作产生α-1,3糖基化形式的岩藻糖-α1,2-半乳糖-R的碳源。
在进一步较佳实施例中,于此描述的微生物或细胞使用具有生产途径和生物质途径的分裂代谢,如WO2012/007481中所述,其通过引用并入于此。例如,所述生物体可以通过改变选自磷酸葡萄糖异构酶基因、磷酸果糖激酶基因、果糖-6-磷酸醛酸酶基因、果糖异构酶基因及/或果糖:PEP磷酸转移酶基因的基因进行基因修饰以积累果糖-6-磷酸。
在第三方面中,本发明提供本发明提供了一种如于此所述代谢工程化细胞用于产生α-1,3糖基化形式的岩藻糖-a1,2-半乳糖-R,较佳为α-1,3糖基化形式的LNFP-I的用途。在第三方面的一较佳实施例中,于此所述代谢工程化细胞用于产生(i)Gal-a1,3-(Fuc-a1,2)-Gal-R,较佳为Gal-a1,3-(Fuc-a1,2)-Gal-b1,3-R,更佳为Gal-a1,3-(Fuc-a1,2)-Gal-b1,3-GlcNAc-R,甚至更佳为Gal-a1,3-(Fuc-a1,2)-Gal-b1,3-GlcNAc-b1,3-R,甚至更佳为Gal-a1,3-(Fuc-a1,2)-Gal-b1,3-GlcNAc-b1,3-Gal-R,最佳为Gal-a1,3-(Fuc-a1,2)-Gal-b1,3-GlcNAc-b1,3-Gal-b1,4-Glc;或(ii)GalNAc-a1,3-(Fuc-a1,2)-Gal-R,较佳为GalNAc-a1,3-(Fuc-a1,2)-Gal-b1,3-R,更佳为GalNAc-a1,3-(Fuc-a1,2)-Gal-b1,3-GlcNAc-R,甚至更佳为GalNAc-a1,3-(Fuc-a1,2)-Gal-b1,3-GlcNAc-b1,3-R,甚至更佳为GalNAc-a1,3-(Fuc-a1,2)-Gal-b1,3-GlcNAc-b1,3-Gal-R,最佳为GalNAc-a1,3-(Fuc-a1,2)-Gal-b1,3-GlcNAc-b1,3-Gal-b1,4-Glc。在第三方面的一更佳实施例中,于此所述代谢工程化细胞用于产生于此所揭露的血型抗原(histo blood group antigen,HBGA)系统的结构。在第三方面的一更佳实施例中,于此所述代谢工程化细胞用于产生α-1,3糖基化形式的Fuc-a1,2-Gal-R为Gal-a1,3-(Fuc-a1,2)-Gal-b1,4-Glc,其中葡萄糖可以视需要而定地被岩藻糖基化(较佳为a1,3-岩藻糖基化),如于此所揭露。在第三方面的另一更佳实施例中,于此所述代谢工程化细胞用于产生α-1,3GalNAc修饰或一α-1,3半乳糖修饰的Fuc-a1,2-Gal-GlcNAc,其中Fuc-a1,2-Gal-GlcNAc中的半乳糖通过β-1,3或β-1,4键与GlcNAc结合,如于此所揭露。
为了鉴定于此所述的α-1,3糖基化形式的岩藻糖-a1,2-半乳糖-R或α-1,3糖基化形式的LNFP-1,可利用本领域习知的标准方法来鉴定单体构件(building block)(例如,单糖或聚糖单元组成)、侧链的变旋异构构型(anomeric configuration)、取代基团的存在与位置、聚合程度/分子量及链接模式,例如,甲基分析、还原式切割(reductive cleavage)、水解、气相速层分析-质谱法(GC-MS)、基质辅助激光解吸/离子化-质谱法(MALDI-MS)、电喷雾离子化-质谱法(ESI-MS)、以紫外光或折射率侦测的高效能液相层析(HPLC)、以脉冲电流侦测的高效能阴离子交换层析(HPAEC-PAD)、毛细管电泳(capillary electrophoresis,CE)、远红外光/拉曼光谱及核磁共振(NMR)谱量技术。可利用固态NMR、傅立叶-远红外光光谱法(FT-IR)及广角X光散射法来解析晶体结构。聚合程度(degree of polymerization,DP)、DP分布与多分散性(polydispersity)可利用如黏度计与高效能液相层析来决定。为了鉴定糖类的单体组成,可利用如酸催化水解、高效能液相层析或气相-液相层析法(转化为糖醇乙酸酯后)。为了决定糖苷键,糖类以在DMSO中的碘甲烷和强碱进行甲基化、进行水解、还原为部分甲基化的糖醇,乙酰化为甲基化的糖醇乙酸酯,并藉由与质谱耦合的气相液相层析(GLC/MS)来进行分析。为了决定寡糖的序列,利用酸或酶进行部分去聚合以决定结构。为了鉴定出变旋异构构型,对寡糖进行酶分析,即,使其接触对特定型态的链接有特异性的酶,例如,β-半乳糖苷酶或α-葡萄糖苷酶,且可使用NMR分析包括所产生的α-1,3糖基化形式的岩藻糖-a1,2-半乳糖-R,较佳为α-1,3糖基化形式的LNFPI的产物。
在一些实施例中,α-1,3糖基化形式的Fuc-a1,2-Gal-R,其中所述R是单糖、双糖或寡糖,其如于此所述产生,被掺入食物(例如人类食物或饲料)、膳食补充剂、药物成分、化妆品成分或药物中。在一些实施例中,α-1,3糖基化形式的Fuc-a1,2-Gal-R,其中所述R为单糖、二糖或寡糖,与一种或多种适用于食品、饲料、膳食补充剂、药物成分、化妆品成分或药物的成分混合。
在一些实施例中,膳食补充剂包括至少一种益生菌(probiotic)成分及/或至少一种益生元(prebiotic)成分。
「益生元(prebiotic)」是一种促进对宿主有益的微生物生长的物质,特别是胃肠道微生物。在一些实施例中,膳食补充剂提供多种益生元,包括α-1,3糖基化形式的Fuc-a1,2-Gal-R,其中所述R是单糖、双糖或寡糖,且其通过本说明书中公开的方法产生及/或纯化,以促进一种或多种有益微生物的生长。用于膳食补充剂的益生元成分的例子包括其他益生元分子(如HMO)和植物多糖(如菊糖(inulin)、果胶、β-葡聚糖和低聚木糖)。「益生菌(probiotic)」产品通常含有活的微生物,它们取代或添加到胃肠道微生物群中而为受体提供帮助。这类微生物的范例包括乳酸杆菌种(Lactobacillus)(例如,噬酸乳酸杆菌(L.acidophilus)和保加利亚乳酸杆菌(L.bulgaricus))、双歧杆菌种(Bifidobacterium)(例如,动物双歧杆菌(B.animalis)、长双歧杆菌(B.longum)和婴儿双歧杆菌(B.infantis)(例如Bi-26))和布拉氏酵母菌(Saccharomyces boulardii)。在一些实施例中,通过本说明书的方法产生及/或纯化的寡糖与此类微生物结合口服施用。
膳食补充剂的其他成分的例子包括双糖(例如乳糖)、单糖(例如葡萄糖和半乳糖)、增稠剂(例如阿拉伯树胶)、酸度调节剂(例如柠檬酸三钠)、水、脱脂牛奶和调味剂。
在一些实施例中,如于此所述产生的α-1,3糖基化形式的Fuc-a1,2-Gal-R,其中所述R是单糖、双糖或寡糖,添加至人类婴儿食物(例如,婴幼儿配方奶粉)。婴幼儿配方奶粉一般是作为完全或部分取代人类母乳来喂养婴儿所制造的食物。在一些实施例中,婴幼儿配方奶粉以粉末的形式贩卖,且在瓶中与水混合或以杯子与水混合后喂养婴儿。婴儿配方奶粉的成分通常被设计为大致模仿人类母乳。在一些实施例中,通过本说明书中的方法产生的α-1,3糖基化形式的Fuc-a1,2-Gal-R,其中所述R是单糖、双糖或寡糖,包含于婴幼儿配方奶分中以提供类似于人类母乳中寡糖所提供的营养益处。在一些实施例中,α-1,3糖基化形式的Fuc-a1,2-Gal-R,其中所述R是单糖、双糖或寡糖,与婴幼儿配方奶粉的一或多种成分混合。婴幼儿配方奶粉成分的范例包括脱脂奶、碳水化合物来源(例如乳糖)、蛋白质来源(例如浓缩乳清蛋白和酪蛋白)、脂肪来源(例如植物油如棕榈油、高油酸红花油、菜籽油、椰子油及/或葵花籽油;和鱼油)、维生素(例如维生素A、Bb、Bi2、C和D)、矿物质(例如柠檬酸钾、柠檬酸钙、氯化镁、氯化钠、柠檬酸钠和磷酸钙)以及可能包括人乳寡糖(HMO)。例如,这类HMO可包括DiFL、乳糖-N-丙糖II、LNT、LNnT、乳糖-N-岩藻戊糖I、乳糖-N-新岩藻戊糖、乳糖-N-岩藻戊糖II、乳糖-N-岩藻戊糖III、乳糖-N-岩藻戊糖V、乳糖-N-新岩藻糖戊糖V、乳糖-N-二岩藻糖己糖I、乳糖-N-二岩藻糖己糖II、6'-半乳糖基乳糖、3'-半乳糖基乳糖、乳糖-N-己糖以及乳糖-N-新己糖。
在一些实施例中,一种或多种婴儿配方成分包括脱脂奶、碳水化合物源、蛋白质源、脂肪源及/或维生素和矿物质。
在一些实施例中,一或多种婴幼儿配方奶分可包括乳糖、乳清蛋白浓缩物及/或高油酸红花油。
在一些实施例中,婴幼儿配方奶粉中的α-1,3糖基化形式的Fuc-a1,2-Gal-R,其中所述R是单糖、双糖或寡糖的浓度大约与人类母乳中一般存在的寡糖浓度相同。在一些实施例中婴幼儿配方奶粉中的半乳糖基化寡糖的浓度大约与人类母乳中一般存在的寡糖浓度相同。
在一些实施例中,α-1,3糖基化形式的Fuc-a1,2-Gal-R,其中所述R是单糖、双糖或寡糖,并入至饲料制品中,其中所述饲料选自包括下列的名单:宠物食品、动物代乳品、兽医产品、断奶后饲料或教槽饲料(creep feed)。
除非另有明确说明,在本发明的一方面的上下文中揭露的每个实施例,也在本发明的所有其他方面的上下文中公开。
在整个申请中,除非另有明确说明,否则冠词「一(a或an)」较佳可利用「至少二」取代,更佳可利用「至少三」取代,更佳可利用「至少四」取代,更佳可利用「至少五」取代,更佳可利用「至少六」取代,最佳可利用「至少二」取代。
除非另有定义,于此使用的所有技术和科学术语通常具有与本发明所属领域的普通技术人员通常理解的相同的含义。一般而言,于此所使用的命名法和细胞培养、分子遗传学、有机化学和核酸化学以及前后文所述的杂交中的实验室流程是本领域习知和常用的命名法与流程。标准技术用于核酸和肽合成。一般而言,纯化步骤是根据制造商的说明书而进行的。
进一步的优点来自于具体的实施例与实例。不言而喻,在不脱离本发明的范围的情况下,上述特征和下文解释的特征不仅可以以各自指明的组合使用,而且可以以其他组合或单独使用。
本发明关于以下特定实施例:
1.一种藉由细胞,较佳为单一细胞产生α-1,3糖基化形式的岩藻糖-α-1,2-半乳糖-R(fucose-alpha-1,2-galactose-R,Fuc-a1,2-Gal-R)的方法,其中该α-1,3糖基化发生于岩藻糖-α-1,2-半乳糖-R(Fuc-a1,2-Gal-R)的末端“岩藻糖-a1,2-半乳糖”-基团,其中该方法包括下列步骤:
i.提供具有合成Fuc-a1,2-Gal-R的能力、表达α-1,3-糖基转移酶(alpha-1,3-glycosyltransferase),并具有合成为该α-1,3-糖基转移酶的供体的核苷酸-糖(nucleotide-sugar)的能力的细胞,与
ii.在允许合成该Fuc-a1,2-Gal-R、表达该α-1,3-糖基转移酶、合成该核苷酸-糖与合成该α-1,3糖基化形式的Fuc-a1,2-Gal-R的条件下培养该细胞,
iii.较佳为自该培养物分离该α-1,3糖基化形式的Fuc-a1,2-Gal-R。
2.如实施例1的方法,其中于该Fuc-a1,2-Gal-R中的半乳糖(galactose,Gal)残基经由β-1,3或β-1,4糖苷键(glycosidic linkage)与R结合。
3.如实施例1或2的方法,其中该R包括单糖(monosaccharide)、双糖(disaccharide)、寡糖(oligosaccharide)、肽、蛋白质、糖肽(glycopeptide)、糖蛋白(glycoprotein)、脂质或糖脂(glycolipid)
4.如实施例1至3的任一项的方法,其中该Fuc-a1,2-Gal-R为Fuc-a1,2-Gal-b1,3-R,较佳为其中该Fuc-a1,2-Gal-R为Fuc-a1,2-Gal-b1,3-GlcNAc-R。
5.如实施例4的方法,其中于该Fuc-a1,2-Gal-b1,3-GlcNAc-R中的N-乙酰葡萄糖胺(N-acetylglucosamine,GlcNAc)残基经由β-1,3或β-1,4糖苷键与R结合。
6.如实施例4或5的方法,其中该Fuc-a1,2-Gal-R为Fuc-a1,2-Gal-b1,3-GlcNAc-b1,3-R,较佳为,其中该Fuc-a1,2-Gal-R为Fuc-a1,2-Gal-b1,3-GlcNAc-b1,3-Gal-R,更佳为,其中该Fuc-a1,2-Gal-R为乳-N-岩藻五糖I(lacto-N-fucopentaose I,LNFP-I,Fuc-a1,2-Gal-b1,3-GlcNAc-b1,3-Gal-b1,4-Glc)。
7.如实施例1至3的任一项的方法,其中该Fuc-a1,2-Gal-R为Fuc-a1,2-Gal-b1,4-R,较佳为,其中该Fuc-a1,2-Gal-R为Fuc-a1,2-Gal-b1,4-Glc,视需要而定,其中该Fuc-a1,2-Gal-R为Fuc-a1,2-Gal-b1,4-(Fuc-a1,3)-Glc。
8.如实施例1至7的任一项的方法,其中该α-1,3糖基化形式的Fuc-a1,2-Gal-R为组织血型抗原(histo blood group antigen,HBGA)系统的结构。
9.如实施例1至8的任一项的方法,其中该α-1,3-糖基转移酶为一α-1,3-半乳糖基转移酶(alpha-1,3-galactosyltransferase),其为具有将一半乳糖(galactose,Gal)残基自UDP-半乳糖(UDP-galactose,UDP-Gal)转移至岩藻糖-a1,2-半乳糖-R(Fuc-a1,2-Gal-R)的末端“岩藻糖-a1,2-半乳糖”-基团的能力的糖基转移酶。
10.如实施例1至6、8或9的任一项的方法,其中该α-1,3-糖基转移酶α-1,3-半乳糖基转移酶,其为具有将半乳糖(Gal)残基自UDP-Gal转移至LNFP-I的末端“岩藻糖-a1,2-半乳糖”-基团的能力的糖基转移酶。
11.如实施例1至3、7、9或10的任一项的方法,其中该α-1,3-糖基转移酶为α-1,3-半乳糖基转移酶,其为具有将半乳糖(Gal)残基自UDP-Gal转移至Fuc-a1,2-Gal-b1,4-Glc的末端“岩藻糖-a1,2-半乳糖”-基团的能力的糖基转移酶,视需要而定,于该Fuc-a1,2-Gal-b1,4-Glc中的葡萄糖残基为经岩藻糖基化,较佳为经α-1,3-岩藻糖基化。
12.如实施例1至6或8至10的任一项的方法,其中该α-1,3糖基化形式的Fuc-a1,2-Gal-R为α-1,3糖基化形式的乳-N-岩藻五糖I(LNFP-I),其为Gal-a1,3-(Fuc-a1,2)-Gal-b1,3-GlcNAc-b1,3-Gal-b1,4-Glc(Gal-a1,3-LNFP-I),该α-1,3-糖基转移酶为α-1,3-半乳糖基转移酶,且该核苷酸-糖为UDP-半乳糖(UDP-galactose,UDP-Gal)。
13.如实施例1至3、7或9至11的任一项的方法,其中该α-1,3糖基化形式的Fuc-a1,2-Gal-R为α-1,3糖基化形式的Fuc-a1,2-Gal-b1,4-Glc,其为Gal-a1,3-(Fuc-a1,2)-Gal-b1,4-Glc,视需要而定,α-1,3糖基化形式的Fuc-a1,2-Gal-b1,4-(Fuc-a1,3)-Glc,其为
Gal-a1,3-(Fuc-a1,2)-Gal-b1,4-(Fuc-a1,3)-Glc,该α-1,3-糖基转移酶为α-1,3-半乳糖基转移酶,且该核苷酸-糖为UDP-半乳糖(UDP-Gal)。
14.如实施例9至13的任一项的方法,其中该α-1,3-半乳糖基转移酶具有PFAMPF03414结构域(domain),且
a.包括具有SEQ ID NO:01的基序(motif)YX[FHMQT]XAXX[ACG][ACG]其中X可为任何氨基酸残基,或
b.包括具有SEQ ID NO:02的基序YXQXCXX[ACG][ACG]其中X可为任何氨基酸残基,或
c.包括如SEQ ID NO:03、04、05、06、07、08、09、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36或37的任一者的多肽序列,或
d.系为SEQ ID NO:03、04、05、06、07、08、09、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36或37的任一者的功能性同系物(functional homolog)、变体(variant)或衍生物(derivative),其具有与具有SEQ ID NO:03、04、05、06、07、08、09、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36或37的该a-1,3-半乳糖基转移酶多肽的任一者的全长至少80%整体序列相似度,且对岩藻糖-a1,2-半乳糖-R(fucose-a1,2-galactose-R,Fuc-a1,2-Gal-R)的末端“岩藻糖-a1,2-半乳糖”-基团具有a-1,3-半乳糖基转移酶活性,或
e.系为功能性片段,包括来自SEQ ID NO:03、04、05、06、07、08、09、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36或37的任一者的至少8、9、10、11、12、13、14、15、16、17、18、19、20个连续不断的氨基酸残基的寡肽序列,且对岩藻糖-a1,2-半乳糖-R(Fuc-a1,2-Gal-R)的末端“岩藻糖-a1,2-半乳糖”-基团具有a-1,3-半乳糖基转移酶活性。
15.如实施例1至8的任一项的方法,其中该α-1,3-半乳糖基转移酶为α-1,3-N-乙酰半乳糖胺转移酶(alpha-1,3-N-acetylgalactosaminyltransferase),其为具有将N-乙酰半乳糖胺(N-acetylgalactosamine,GalNAc)残基自UDP-N-乙酰半乳糖胺(UDP-N-acetylgalactosamine,UDP-GalNAc)转移至岩藻糖-a1,2-半乳糖-R(Fuc-a1,2-Gal-R)的末端“岩藻糖-a1,2-半乳糖”-基团的能力的糖基转移酶。
16.如实施例1至6、8或15的任一项的方法,其中该α-1,3-半乳糖基转移酶为α-1,3-N-乙酰半乳糖胺转移酶,其为具有将N-乙酰半乳糖胺(GalNAc)残基自UDP-N-乙酰半乳糖胺(UDP-GalNAc)转移至LNFP-I的末端“岩藻糖-a1,2-半乳糖”-基团的能力的糖基转移酶。
17.如实施例1至3、7或15的任一项的方法,其中该α-1,3-半乳糖基转移酶为α-1,3-N-乙酰半乳糖胺转移酶,其为具有将N-乙酰半乳糖胺(GalNAc)残基自UDP-GalNAc转移至Fuc-a1,2-Gal-b1,4-Glc的末端“岩藻糖-a1,2-半乳糖”-基团的能力的糖基转移酶,视需要而定,于该
Fuc-a1,2-Gal-b1,4-Glc中的葡萄糖残基为经岩藻糖基化,较佳为经α-1,3-岩藻糖基化。
18.如实施例1至6、8、15或16的任一项的方法,其中该α-1,3糖基化形式的Fuc-a1,2-Gal-R为α-1,3糖基化形式的乳-N-岩藻五糖I(LNFP-I),其为GalNAc-a1,3-(Fuc-a1,2)-Gal-b1,3-GlcNAc-b1,3-Gal-b1,4-Glc
(GalNAc-a1,3-LNFP-I),该α-1,3-糖基转移酶为α-1,3-N-乙酰半乳糖胺转移酶,且该核苷酸-糖为UDP-N-乙酰半乳糖胺(UDP-GalNAc)。
19.如实施例1至3、7、15或17的任一项的方法,其中该α-1,3糖基化形式的Fuc-a1,2-Gal-R为α-1,3糖基化形式的Fuc-a1,2-Gal-b1,4-Glc,其为GalNAc-a1,3-(Fuc-a1,2)-Gal-b1,4-Glc(α-四糖(alpha-tetrasaccharide)或A-四糖(A-tetrasaccharide)),视需要而定α-1,3糖基化形式的Fuc-a1,2-Gal-b1,4-(Fuc-a1,3)-Glc,其为
GalNAc-a1,3-(Fuc-a1,2)-Gal-b1,4-(Fuc-a1,3)-Glc,该α-1,3-糖基转移酶为α-1,3-N-乙酰半乳糖胺转移酶,且该核苷酸-糖为UDP-N-乙酰半乳糖胺(UDP-GalNAc)。
20.如实施例15至19的任一项的方法,其中该α-1,3-N-乙酰半乳糖胺转移酶具有PFAM PF03414结构域,且
a.包括具有SEQ ID NO:38的基序YX[ACIL]XGXX[ACG][ACG]其中X可为任何氨基酸残基,或
b.包括具有SEQ ID NO:39的基序YX[AG]XAXX[ACG][ACG]其中X可为任何氨基酸残基,或
c.包括如SEQ ID NO:40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99、100、101或102的任一者的多肽序列,或
d.系为SEQ ID NO:40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99、100、101或102的任一者的功能性同系物、变体或衍生物,具有与具有SEQ ID NO:40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99、100、101或102的该a-1,3-N-乙酰半乳糖基转移酶(a-1,3-N-acetylgalactosyltransferase)多肽的任一者的全长至少80%整体序列相似度,且对岩藻糖-a1,2-半乳糖-R(Fuc-a1,2-Gal-R)的末端“岩藻糖-a1,2-半乳糖”基团具有a-1,3-N-乙酰半乳糖基转移酶活性,或
e.系为功能性片段,包括来自SEQ ID NO:40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99、100、101或102的任一者的至少8、9、10、11、12、13、14、15、16、17、18、19、20个连续不断的氨基酸残基的寡肽序列,且对岩藻糖-a1,2-半乳糖-R(Fuc-a1,2-Gal-R)的末端“岩藻糖-a1,2-半乳糖”基团具有a-1,3-N-乙酰半乳糖基转移酶活性。
21.如实施例6、10、12、14、16、18或20的任一项的方法,其中藉由糖基转移酶的作用,经由将岩藻糖自GDP-岩藻糖转移到乳-N-四糖(lacto-N-tetraose,LNT,Gal-b1,3-GlcNAc-b1,3-Gal-b1,4-Glc)的末端半乳糖残基,于该细胞中合成该LNFP-I,该糖基转移酶为:
a.α-1,2-岩藻糖基转移酶(alpha-1,2-fucosyltransferase),选自包括来自具有UniProt ID A0A2N5RQ26的毛样短螺旋体(Brachyspira pilosicoli)、具有UniProt IDF8X274的Dysgonomonas mossii、具有UniProt ID G8QLF4的Dechlorosoma suillum、具有UniProt ID Q316B5的Desulfovibrio alaskensis与具有UniProt ID A0A1B8TNT0的Polaribacter vadi的多肽的列表,或
b.对LNT的末端半乳糖残基具有α-1,2-岩藻糖基转移酶活性的来自毛样短螺旋体(UniProt ID A0A2N5RQ26)的多肽、来自D.mossii(UniProt ID F8X274)的多肽、来自D.suillum(UniProt ID G8QLF4)的多肽、来自D.alaskensis(UniProt ID Q316B5)的多肽与来自P.vadi(UniProt ID A0A1B8TNT0)的多肽的任一者的功能性片段,或
c.来自具有UniProt ID A0A2N5RQ26的毛样短螺旋体、具有UniProt ID F8X274的D.mossii、具有UniProt ID G8QLF4的D.suillum、具有UniProt ID Q316B5的D.alaskensis与具有UniProt ID A0A1B8TNT0的P.vadi的多肽的任一者的功能性同系物、变体或衍生物,具有分别与来自UniProt ID A0A2N5RQ26的毛样短螺旋体、具有UniProt ID F8X274的D.mossii、具有UniProt ID G8QLF4的D.suillum、具有UniProt ID Q316B5的D.alaskensis与具有UniProt ID A0A1B8TNT0的P.vadi的该多肽的任一者的全长的至少80%整体序列相似度,且对乳-N-四糖(LNT)的末端半乳糖残基具有α-1,2-岩藻糖基转移酶活性,或
d.多肽包括氨基酸序列,或由氨基酸序列组成,该氨基酸序列具有与来自毛样短螺旋体(UniProt ID A0A2N5RQ26)的多肽、来自D.mossii(UniProt ID F8X274)的多肽、来自D.suillum(UniProt ID G8QLF4)的多肽、来自D.alaskensis(UniProt ID Q316B5)的多肽与来自P.vadi(UniProt ID A0A1B8TNT0)的多肽的任一者的全长氨基酸序列至少80%序列相似度,且对LNT的末端半乳糖残基具有α-1,2-岩藻糖基转移酶活性。
22.如实施例1至21的任一项的方法,其中该细胞在糖基转移酶的表达或活性方面被修饰。
23.如前方实施例的任一项的方法,其中该细胞表达膜转运蛋白(membranetransporter protein)或具有转运活性的多肽,从而将化合物转运穿过细胞壁的外膜(outer membrane)。
24.如实施例23的方法,其中该膜转运蛋白(membrane transporter protein)或该具有转运活性的多肽系选自列表,其包括运输蛋白(porter)、P-P-键-水解驱动转运蛋白(P-P-bond-hydrolysis-driven transporter)、b-桶孔蛋白
(b-barrel porins)、辅助转运蛋白(auxiliary transport protein)、推定转运蛋白(putative transport protein)与磷酸转移驱动的基团转位蛋白(phosphotransfer-driven group translocator),
较佳为,该运输蛋白包括MFS转运蛋白、糖外流转运蛋白(sugar effluxtransporter)与嗜铁素输出蛋白(siderophore exporters),
较佳为,该P-P-键-水解驱动转运蛋白包括ABC转运蛋白与嗜铁素输出蛋白。
25.如实施例23或24的任一项方法,其中该膜转运蛋白或具有转运活性的多肽控制该α-1,3糖基化形式的Fuc-a1,2-Gal-R及/或用于该α-1,3糖基化形式的Fuc-a1,2-Gal-R的产生的一或更多种的前体及/或受体的于细胞壁的外膜上的流动。
26.如实施例23至25的任一项的方法,其中该膜转运蛋白或具有转运活性的多肽提供该α-1,3糖基化形式的Fuc-a1,2-Gal-R的经改善的产生及/或经启动及/或经增强的流出。
27.如前方实施例的任一项的方法,其中该细胞为代谢工程化(metabolicallyengineered)细胞。
28.如实施例27的方法,其中该细胞系以基因表达模块(module)修饰,其特征在于来自任何该表达模块的表达为组成型的(constitutive),或是由天然诱导物(naturalinducer)创造的。
29.如实施例27或28的任一项的方法,其中该细胞包括编码一种蛋白质的相同编码DNA序列的多个复制(copies)。
30.如实施例27至29的任一项的培养基,其中该细胞包括用于醋酸的经降低的产量的修饰。
31.如实施例27至29的任一项的方法,其中该细胞包括任一或更多种的蛋白质的较低或经降低的表达及/或经消除、受损、经降低或经延迟的活性,该任一或更多的蛋白质包括β-半乳糖苷酶(beta-galactosidase)、半乳糖苷O-乙酰转移酶(galactoside O-acetyltransferase)、N-乙酰葡萄糖胺-6-磷酸去乙酰酶(N-acetylglucosamine-6-phosphate deacetylase)、葡萄糖胺-6-磷酸去胺酶(glucosamine-6-phosphatedeaminase)、N-乙酰葡萄糖胺抑制蛋白(N-acetylglucosamine repressor)、核糖核苷酸单磷酸酶(ribonucleotide monophosphatase)、EIICBA-Nag、UDP-葡萄糖:十一碳烯-磷酸葡萄糖-1-磷酸转移酶(UDP-glucose:undecaprenyl-phosphate glucose-1-phosphatetransferase)、L-墨角藻糖激酶(L-fuculokinase)、L-岩藻糖异构酶(L-fucoseisomerase)、N-乙酰神经氨酸解离酶(N-acetylneuraminate lyase)、N-乙酰甘露糖胺激酶(N-acetylmannosamine kinase)、N-乙酰甘露糖胺-6-磷酸2-表异构酶(N-acetylmannosamine-6-phosphate 2-epimerase)、EIIAB-Man、EIIC-Man、EIID-Man、ushA、半乳糖-1-磷酸尿苷酸转移酶(galactose-1-phosphate uridylyltransferase)、葡萄糖-1-磷酸腺苷酸转移酶(glucose-1-phosphate adenylyltransferase)、葡萄糖-1-磷酸酶(glucose-1-phosphatase)、ATP-依赖性6-磷酸果糖激活酶同功酶1(ATP-dependent 6-phosphofructokinase isozyme 1)、ATP-依赖性6-磷酸果糖激活酶同功酶2(ATP-dependent 6-phosphofructokinase isozyme 2)、葡萄糖-6-磷酸异构酶(glucose-6-phosphate isomerase)、有氧呼吸控制蛋白(aerobic respiration control protein)、转录抑制蛋白IclR
(transcriptional repressor IclR)、lon蛋白酶(lon protease)、葡萄糖特异性易位磷酸转移酶IIBC成分ptsG(glucose-specific translocating phosphotransferaseenzyme IIBC component ptsG)、葡萄糖特异性易位磷酸转移酶(PTS)酶IIBC成分malX(glucose-specific translocating phosphotransferase(PTS)enzyme IIBC componentmalX)、酶IIAGlc、β-葡糖苷特异性PTS酶II(beta-glucoside specific PTS enzyme II)、果糖特异性PTS多磷酸基转移蛋白FruA与FruB(fructose-specific PTS multiphosphoryltransfer protein FruA and FruB)、乙醇脱氢酶(ethanol dehydrogenase)醛脱氢酶(aldehyde dehydrogenase)、丙酮酸甲酸裂解酶(pyruvate-formate lyase)、醋酸激酶(acetate kinase)、磷酸酰基转移酶(phosphoacyltransferase)、磷酸乙酰转移酶(phosphate acetyltransferase)、丙酮酸去羧酶(pyruvate decarboxylase)。
32.如前方实施例的任一项的方法,其中该细胞具有产生磷酸烯醇丙酮酸盐(phosphoenolpyruvate,PEP)的能力。
33.如前方实施例的任一项的方法,其中该细胞被修饰以增强磷酸烯醇丙酮酸盐(PEP)的产生及/或供应。
34.如前方实施例的任一项的方法,其中该细胞包含至少部分失活的所选单糖、双糖或寡糖的分解代谢途径,该单糖、双糖或寡糖参与及/或被该α-1,3糖基化形式的Fuc-a1,2-Gal-R的该产生所需。
35.如前方实施例的任一项的方法,其中当在于其中乳糖与一种或更多的其他碳源结合的环境中生长时,该细胞抵抗乳糖杀伤(lactose killing)现象。
36.如前方实施例的任一项的方法,其中该细胞在全肉汤(whole broth)及/或上清液中产生90g/L或更多的该α-1,3糖基化形式的Fuc-a1,2-Gal-R,及/或其中在全肉汤及/或上清液中,该α-1,3糖基化形式的Fuc-a1,2-Gal-R依据该α-1,3糖基化形式的Fuc-a1,2-Gal-R与其前体于该全肉汤及/或上清液中的总量测量分别具有至少80%的纯度。
37.如前方实施例的任一项的方法,其中该细胞被稳定地培养于培养基中。
38.如前方实施例的任一项的方法,其中该条件包括:
(i)使用包含用于该α-1,3糖基化形式的Fuc-a1,2-Gal-R的产生的至少一种前体及/或受体(acceptor)的培养基,及/或
(ii)对该培养基添加用于该α-1,3糖基化形式的Fuc-a1,2-Gal-R的产生的至少一种前体及/或受体进料(feed).
39.如前方实施例的任一项的方法,该方法包括下列步骤的至少一者:
i)使用包括至少一种前体及/或受体的培养基;
ii)对于反应器中的该培养基添加至少一种前体及/或受体进料,其中总反应器体积在250mL(毫升)至10.000m3(立方公尺)的范围内,较佳为以连续方式,且较佳为使得该培养基的最终体积不大于三倍,较佳为不大于两倍,更佳为小于两倍的在添加该前体及/或受体进料之前的该培养基的体积;
iii)对于反应器中的该培养基添加至少一种前体及/或受体进料,其中总反应器体积在250mL(毫升)至10.000m3(立方公尺)的范围内,较佳为以连续方式,且较佳为使得该培养基的最终体积不大于三倍,较佳为不大于两倍,更佳为小于两倍的在添加该前体及/或受体进料之前的该培养基的体积,且其中较佳为该前体及/或受体进料的pH被设定为介于3与7之间,且其中较佳为该前体及/或受体进料的温度被维持在介于20℃与80℃之间;
iv)藉由进料溶液的方式,在1天、2天、3天、4天、5天的进程期间,以连续方式添加至少一种前体及/或受体进料至该培养基;
v)藉由进料溶液的方式,在1天、2天、3天、4天、5天的进程期间,以连续方式添加至少一种前体及/或受体进料至该培养基,且其中较佳为该进料溶液的pH被设定为介于3与7之间,又其中较佳为该进料溶液的温度被维持在介于20℃与80℃之间;
该方法导致在该最终培养物中具有至少50g/L,较佳为至少75g/L,更佳为至少90g/L,更佳为至少100g/L,更佳为至少125g/L,更佳为至少150g/L,更佳为至少175g/L,更佳为至少200g/L的浓度的α-1,3糖基化形式的Fuc-a1,2-Gal-R。
40.如实施例1至38的任一项的方法,该方法包括下列步骤的至少一者:
i)使用培养基,其包括每公升的起始反应器体积至少50,更佳为至少75,更佳为至少100,更佳为至少120,更佳为至少150公克的乳糖,其中该反应器体积在250mL(毫升)至10.000m3(立方公尺)的范围内;
ii)对该培养基添加乳糖进料,其包括每公升的起始反应器体积至少50,更佳为至少75,更佳为至少100,更佳为至少120,更佳为至少150公克的乳糖,其中该反应器体积在250mL(毫升)至10.000m3(立方公尺)的范围内,较佳为以连续形式,且较佳为使得该培养基的最终体积不大于三倍,较佳为不大于两倍,更佳为小于两倍的在添加该乳糖进料之前的该培养基的体积;
iii)对该培养基添加乳糖进料,其包括每公升的起始反应器体积至少50,更佳为至少75,更佳为至少100,更佳为至少120,更佳为至少150公克的乳糖,其中该反应器体积在250mL(毫升)至10.000m3(立方公尺)的范围内,较佳为以连续形式,且较佳为使得该培养基的最终体积不大于三倍,较佳为不大于两倍,更佳为小于两倍的在添加该乳糖进料之前的该培养基的体积,且其中较佳为该乳糖进料的pH被设定为介于3与7之间,又其中较佳为该乳糖进料的温度被维持在介于20℃与80℃之间;
iv)藉由进料溶液的方式,在1天、2天、3天、4天、5天的进程期间,以连续方式添加乳糖进料至该培养基;
v)藉由进料溶液的方式,在1天、2天、3天、4天、5天的进程期间,以连续方式添加一乳糖进料至该培养基,且其中该乳糖进料溶液的浓度为50g/L,较佳为75g/L,更佳为100g/L,更佳为125g/L,更佳为150g/L,更佳为175g/L,更佳为200g/L,更佳为225g/L,更佳为250g/L,更佳为275g/L,更佳为300g/L,更佳为325g/L,更佳为350g/L,更佳为375g/L,更佳为400g/L,更佳为450g/L,更佳为500g/L,还更佳为,550g/L,最佳为600g/L;且其中较佳为该进料溶液的pH被设定为介于3与7之间,又其中较佳为该进料溶液的温度被维持在介于20℃与80℃之间;
该方法导致在该培养物的最终体积中具有至少50g/L,较佳为至少75g/L,更佳为至少90g/L,更佳为至少100g/L,更佳为至少125g/L,更佳为至少150g/L,更佳为至少175g/L,更佳为至少200g/L的浓度的α-1,3糖基化形式的Fuc-a1,2-Gal-R。
41.如实施例39的方法,其中该乳糖进料是藉由从培养开始以至少为5mM的浓度,较佳为以30、40、50、60、70、80、90、100、150mM的浓度,更佳为以>300mM的浓度添加乳糖来完成的。
42.如实施例39或40的任一项的方法,其中该乳糖进料是藉由将乳糖以浓度添加到培养物中来实现的,使得在整个培养物的产生阶段获得至少5mM,较佳为10mM或30mM的乳糖浓度。
43.如前方实施例的任一项的方法,其中细胞培养至少约60、80、100或约120小时或以连续方式培养。
44.如前方实施例的任一项的方法,其中该细胞在包括包含单糖、双糖、寡糖、多糖、多元醇、甘油的碳源的培养基,包括糖蜜(molasses)、玉米浆(corn steep liquor)、蛋白胨(peptone)、胰蛋白胨(tryptone)或酵母萃取物(yeast extract)的复合培养基中培养;较佳为,其中该碳源选自包括葡萄糖、甘油、果糖、蔗糖、麦芽糖、乳糖、阿拉伯糖(arabinose)、麦芽寡糖
(malto-oligosaccharides)、麦芽三糖(maltotriose)、山梨糖醇(sorbitol)、木糖
(xylose)、鼠李糖(rhamnose)、半乳糖、甘露糖、甲醇、乙醇、海藻糖(trehalose)、淀粉,纤维素、半纤维素(hemi-cellulose)、糖蜜、玉米浆、高果糖糖浆(high-fructosesyrup)、醋酸盐、柠檬酸盐、乳酸盐与丙酮酸盐的列表。
45.如前方实施例的任一项的方法,其中该培养基包含至少一种前体,其系选自包括乳糖、半乳糖、岩藻糖、唾液酸、GlcNAc、GalNAc、乳-N-二糖(lacto-N-biose,LNB)、N-乙酰乳糖胺(N-acetyllactosamine,LacNAc)的群组。
46.如前方实施例的任一项的方法,其中藉由添加碳基质(carbon-basedsubstrate),较佳为葡萄糖或蔗糖至包括前体,较佳为乳糖的培养基中来提供指数型细胞生长的第一阶段,然后是第二阶段,其中,只有碳基基质,较佳为葡萄糖或蔗糖,被添加至培养基。
47.如实施例1至45的任一项的方法,其中藉由添加碳基质,较佳为葡萄糖或蔗糖至包括前体,较佳为乳糖的培养基中来提供指数型细胞生长的第一阶段,然后是第二阶段,其中碳基质,较佳为葡萄糖或蔗糖,与前体,较佳为乳糖被添加至该培养基。
48.如前方实施例的任一项的方法,其中该细胞产生带电、较佳为唾液酸化(sialylated)及/或中性双糖与寡糖的混合物,其包括α-1,3糖基化形式的Fuc-a1,2-Gal-R。
49.如前方实施例的任一项的方法,其中该细胞产生带电、较佳为唾液酸化及/或中性寡糖的混合物,其包括α-1,3糖基化形式的Fuc-a1,2-Gal-R。
50.一种代谢工程化细胞,用以产生α-1,3糖基化形式的岩澡糖-α-1,2-半乳糖-R(fucose-alpha-1,2-galactose-R,Fuc-a1,2-Gal-R),其中该α-1,3糖基化发生于岩藻糖-α-1,2-半乳糖-R(Fuc-a1,2-Gal-R)的末端“岩藻糖-a1,2-半乳糖”-基团,且其中该细胞
-合成Fuc-a1,2-Gal-R,与
-表达α-1,3-糖基转移酶,且
-具有产生核苷酸-糖的能力,其中该核苷酸-糖为该α-1,3-糖基转移酶的供体。
51.如实施例50的细胞,其中于该Fuc-a1,2-Gal-R中的半乳糖(galactose,Gal)残基经由β-1,3或β-1,4糖苷键(glycosidic linkage)与R结合。
52.如实施例50或51的任一项的细胞,其中该R包括单糖、双糖、寡糖、肽、蛋白质、糖肽、糖蛋白、脂质或糖脂(glycolipid)。
53.如实施例50至52的任一项的细胞,其中该Fuc-a1,2-Gal-R为Fuc-a1,2-Gal-b1,3-R,较佳为该Fuc-a1,2-Gal-R为Fuc-a1,2-Gal-b1,3-GlcNAc-R。
54.如实施例53的细胞,其中于该Fuc-a1,2-Gal-b1,3-GlcNAc-R中的N-乙酰葡萄糖胺(GlcNAc)残基经由β-1,3或β-1,4糖苷键与R结合。
55.如实施例53或54的任一项的细胞,其中该Fuc-a1,2-Gal-R为Fuc-a1,2-Gal-b1,3-GlcNAc-b1,3-R,较佳为,其中该Fuc-a1,2-Gal-R为Fuc-a1,2-Gal-b1,3-GlcNAc-b1,3-Gal-R,更佳为,其中Fuc-a1,2-Gal-R为乳-N-岩藻五糖I(LNFP-I,Fuc-a1,2-Gal-b1,3-GlcNAc-b1,3-Gal-b1,4-Glc)。
56.如实施例50至52的任一项的细胞,其中该Fuc-a1,2-Gal-R为Fuc-a1,2-Gal-b1,4-R,较佳为,其中该Fuc-a1,2-Gal-R为Fuc-a1,2-Gal-b1,4-Glc,视需要而定,其中该Fuc-a1,2-Gal-R为Fuc-a1,2-Gal-b1,4-(Fuc-a1,3)-Glc。
57.如实施例50至56的任一项的细胞,其中该α-1,3糖基化形式的Fuc-a1,2-Gal-R为组织血型抗原(HBGA)系统的结构。
58.如实施例50至57的任一项的细胞,其中该α-1,3-糖基转移酶为α-1,3-半乳糖基转移酶,其为具有将半乳糖(Gal)残基自UDP-半乳糖(UDP-Gal)转移至岩藻糖-a1,2-半乳糖-R(Fuc-a1,2-Gal-R)的末端“岩藻糖-a1,2-半乳糖”-基团的能力的糖基转移酶。
59.如实施例50至55、57或58的任一项的细胞,其中该α-1,3-糖基转移酶为α-1,3-半乳糖基转移酶,其为具有将半乳糖(Gal)残基自UDP-Gal转移至LNFP-I的末端“岩藻糖-a1,2-半乳糖”-基团的能力的糖基转移酶。
60.如实施例50至52、56、58或59的任一项的细胞,其中该α-1,3-糖基转移酶为α-1,3-半乳糖基转移酶,其为具有将半乳糖(Gal)残基自UDP-Gal转移至Fuc-a1,2-Gal-b1,4-Glc的末端“岩藻糖-a1,2-半乳糖”-基团的能力的糖基转移酶,视需要而定,于该Fuc-a1,2-Gal-b1,4-Glc中的葡萄糖残基为经岩藻糖基化,较佳为经α-1,3-岩藻糖基化。
61.如实施例50至55或57至59的任一项的细胞,其中该α-1,3糖基化形式的Fuc-a1,2-Gal-R为α-1,3糖基化形式的乳-N-岩藻五糖I(LNFP-I),其为Gal-a1,3-(Fuc-a1,2)-Gal-b1,3-GlcNAc-b1,3-Gal-b1,4-Glc(Gal-a1,3-LNFP-I),该α-1,3-糖基转移酶为α-1,3-半乳糖基转移酶,且该核苷酸-糖为UDP-半乳糖(UDP-Gal)。
62.如实施例50至52、56或58至60的任一项的细胞,其中该α-1,3糖基化形式的Fuc-a1,2-Gal-R为α-1,3糖基化形式的Fuc-a1,2-Gal-b1,4-Glc,其为Gal-a1,3-(Fuc-a1,2)-Gal-b1,4-Glc,视需要而定,α-1,3糖基化形式的Fuc-a1,2-Gal-b1,4-(Fuc-a1,3)-Glc,其为
Gal-a1,3-(Fuc-a1,2)-Gal-b1,4-(Fuc-a1,3)-Glc,该α-1,3-糖基转移酶为α-1,3-半乳糖基转移酶,且该核苷酸-糖为UDP-半乳糖(UDP-Gal)。
63.如实施例58至62的任一项的细胞,其中该α-1,3-半乳糖基转移酶具有PFAMPF03414结构域,且
a.包括具有SEQ ID NO:01的基序(motif)YX[FHMQT]XAXX[ACG][ACG],其中X可为任何氨基酸残基,或
b.包括具有SEQ ID NO:02的基序YXQXCXX[ACG][ACG],其中X可为任何氨基酸残基,或
c.包括如SEQ ID NO:03、04、05、06、07、08、09、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36或37的任一者的多肽序列,或
d.系为SEQ ID NO:03、04、05、06、07、08、09、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36或37的任一者的功能性同系物、变体或衍生物,具有与具有SEQ ID NO:03、04、05、06、07、08、09、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36或37的该a-1,3-半乳糖基转移酶多肽的任一者的全长至少80%整体序列相似度,且对岩藻糖-a1,2-半乳糖-R(Fuc-a1,2-Gal-R)的末端“岩藻糖-a1,2-半乳糖”-基团具有a-1,3-半乳糖基转移酶活性,或
e.系为一功能性片段,包括来自SEQ ID NO:03、04、05、06、07、08、09、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36或37的任一者的至少8、9、10、11、12、13、14、15、16、17、18、19、20个连续不断的氨基酸残基的寡肽序列,且对岩藻糖-a1,2-半乳糖-R(Fuc-a1,2-Gal-R)的末端“岩藻糖-a1,2-半乳糖”-基团具有a-1,3-半乳糖基转移酶活性。
64.如实施例50至57的任一项的细胞,其中该α-1,3-半乳糖基转移酶为α-1,3-N-乙酰半乳糖胺转移酶,其为具有将N-乙酰半乳糖胺(GalNAc)残基自UDP-N-乙酰半乳糖胺(UDP-GalNAc)转移至岩藻糖-a1,2-半乳糖-R(Fuc-a1,2-Gal-R)的末端“岩藻糖-a1,2-半乳糖”-基团的能力的糖基转移酶。
65.如实施例50至55、57或64的任一项的细胞,其中该α-1,3-半乳糖基转移酶为α-1,3-N-乙酰半乳糖胺转移酶,其为具有将N-乙酰半乳糖胺(GalNAc)残基自UDP-N-乙酰半乳糖胺(UDP-GalNAc)转移至LNFP-I的末端“岩藻糖-a1,2-半乳糖”-基团的能力的糖基转移酶。
66.如实施例50至52、56或64的任一项的细胞,其中该α-1,3-半乳糖基转移酶为α-1,3-N-乙酰半乳糖胺转移酶,其为具有将N-乙酰半乳糖胺(GalNAc)残基自UDP-GalNAc转移至Fuc-a1,2-Gal-b1,4-Glc的末端“岩藻糖-a1,2-半乳糖”-基团的能力的糖基转移酶,视需要而定,于该Fuc-a1,2-Gal-b1,4-Glc中的葡萄糖残基为经岩藻糖基化,较佳为经α-1,3-岩藻糖基化。
67.如实施例50至55、57、64或65的任一项的细胞,其中该α-1,3糖基化形式的Fuc-a1,2-Gal-R为α-1,3糖基化形式的乳-N-岩藻五糖I(LNFP-I),其为GalNAc-a1,3-(Fuc-a1,2)-Gal-b1,3-GlcNAc-b1,3-Gal-b1,4-Glc(GalNAc-a1,3-LNFP-I),该α-1,3-糖基转移酶为α-1,3-N-乙酰半乳糖胺转移酶,且该核苷酸-糖为UDP-N-乙酰半乳糖胺(UDP-GalNAc)。
68.如实施例50至52、56、64或66的任一项的细胞,其中该α-1,3糖基化形式的Fuc-a1,2-Gal-R为α-1,3糖基化形式的Fuc-a1,2-Gal-b1,4-Glc,其为GalNAc-a1,3-(Fuc-a1,2)-Gal-b1,4-Glc(α-四糖或A-四糖),视需要而定α-1,3糖基化形式的Fuc-a1,2-Gal-b1,4-(Fuc-a1,3)-Glc,其为GalNAc-a1,3-(Fuc-a1,2)-Gal-b1,4-(Fuc-a1,3)-Glc,该α-1,3-糖基转移酶为α-1,3-N-乙酰半乳糖胺转移酶,且该核苷酸-糖为UDP-N-乙酰半乳糖胺(UDP-GalNAc)。
69.如实施例64至68的任一项的细胞,其中该α-1,3-N-乙酰半乳糖胺转移酶具有PFAM PF03414结构域,且
a.包括具有SEQ ID NO:38的基序YX[ACIL]XGXX[ACG][ACG],其中X可为任何氨基酸残基,或
b.包括具有SEQ ID NO:39的基序YX[AG]XAXX[ACG][ACG],其中X可为任何氨基酸残基,或
c.包括如SEQ ID NO:40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99、100、101或102的任一者的多肽序列,或
d.系为SEQ ID NO:40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99、100、101或102的任一者的功能性同系物、变体或衍生物,具有与具有SEQ ID NO:40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99、100、101或102的该a-1,3-N-乙酰半乳糖基转移酶(a-1,3-N-acetylgalactosyltransferase)多肽的任一者的全长至少80%整体序列相似度,且对岩藻糖-a1,2-半乳糖-R(Fuc-a1,2-Gal-R)的末端“岩藻糖-a1,2-半乳糖”基团具有a-1,3-N-乙酰半乳糖基转移酶活性,或
e.系为一功能性片段,包括来自SEQ ID NO:40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99、100、101或102的任一者的至少8、9、10、11、12、13、14、15、16、17、18、19、20个连续不断的氨基酸残基的寡肽序列,且对岩藻糖-a1,2-半乳糖-R(Fuc-a1,2-Gal-R)的末端末端“岩藻糖-a1,2-半乳糖”基团具有a-1,3-N-乙酰半乳糖基转移酶活性。
70.如实施例55、59、61、63、65、67或69的任一项的细胞,其中藉由糖基转移酶的作用,经由将岩藻糖自GDP-岩藻糖转移到乳-N-四糖(LNT,Gal-b1,3-GlcNAc-b1,3-Gal-b1,4-Glc)的末端半乳糖残基,于该细胞中合成该LNFP-I,该糖基转移酶为
a.α-1,2-岩藻糖基转移酶(alpha-1,2-fucosyltransferase),选自包括来自具有UniProt ID A0A2N5RQ26的毛样短螺旋体、具有UniProt ID F8X274的Dysgonomonasmossii、具有UniProt ID G8QLF4的Dechlorosoma suillum、具有UniProt ID Q316B5的Desulfovibrio alaskensis与具有UniProt ID A0A1B8TNT0的Polaribacter vadi的多肽的列表,或
b.对LNT的末端半乳糖残基具有α-1,2-岩藻糖基转移酶活性的来自毛样短螺旋体(UniProt ID A0A2N5RQ26)的多肽、来自D.mossii(UniProt ID F8X274)的多肽、来自D.suillum(UniProt ID G8QLF4)的多肽、来自D.alaskensis(UniProt ID Q316B5)的多肽与来自P.vadi(UniProt ID A0A1B8TNT0)的多肽的任一者的功能性片段,或
c.来自具有UniProt ID A0A2N5RQ26的毛样短螺旋体、具有UniProt ID F8X274的D.mossii、具有UniProt ID G8QLF4的D.suillum、具有UniProt ID Q316B5的D.alaskensis与具有UniProt ID A0A1B8TNT0的P.vadi的多肽的任一者的功能性同系物、变体或衍生物,具有分别与来自UniProt ID A0A2N5RQ26的毛样短螺旋体、具有UniProt ID F8X274的D.mossii、具有UniProt ID G8QLF4的D.suillum、具有UniProt ID Q316B5的D.alaskensis与具有UniProt ID A0A1B8TNT0的P.vadi的该多肽的任一者的全长的至少80%整体序列相似度,且对乳-N-四糖(LNT)的末端半乳糖残基具有α-1,2-岩藻糖基转移酶活性,或
d.多肽包括氨基酸序列,或是由氨基酸序列组成,该氨基酸序列具有与来自毛样短螺旋体(UniProt ID A0A2N5RQ26)的多肽、来自D.mossii(UniProt ID F8X274)的多肽、来自D.suillum(UniProt ID G8QLF4)的多肽、来自D.alaskensis(UniProt ID Q316B5)的多肽与来自P.vadi(UniProt ID A0A1B8TNT0)的多肽的任一者的全长氨基酸序列至少80%序列相似度,且对LNT的末端半乳糖残基具有α-1,2-岩藻糖基转移酶活性。
71.如实施例50至70的任一项的细胞,其中该细胞在糖基转移酶的表达或活性方面被修饰。
72.如实施例50至71的任一项的细胞,其中该细胞表达膜转运蛋白或具有转运活性的多肽,从而将化合物转运穿过细胞壁的外膜。
73.如实施例72的细胞,其中该膜转运蛋白或该具有转运活性的多肽系选自列表,其包括运输蛋白、P-P-键-水解驱动转运蛋白、b-桶孔蛋白、辅助转运蛋白、推定的转运蛋白与磷酸转移驱动的基团转位蛋白,
较佳为,该运输蛋白包括MFS转运蛋白、糖外流转运蛋白(sugar effluxtransporter)与嗜铁素输出蛋白(siderophore exporters),或
较佳为,该P-P-键-水解驱动转运蛋白包括ABC转运蛋白与嗜铁素输出蛋白。
74.如实施例72或73的任一项的细胞,其中该膜转运蛋白或具有转运活性的多肽控制该α-1,3糖基化形式的Fuc-a1,2-Gal-R及/或用于该α-1,3糖基化形式的Fuc-a1,2-Gal-R的产生的一或更多种的前体及/或受体的于细胞壁的外膜上的流动。
75.如实施例72至74的任一项的细胞,其中该膜转运蛋白或具有转运活性的多肽提供该α-1,3糖基化形式的Fuc-a1,2-Gal-R的经改善的产生及/或经启动及/或经增强的流出。
76.如实施例50至75的任一项的细胞,其中该细胞系以基因表达模块修饰,其特征在于来自任何该表达模块的表达为组成型的,或是由天然诱导物创造的。
77.如实施例50至76的任一项的细胞,其中该细胞包括编码一种蛋白质的相同编码DNA序列的多个复制。
78.如实施例50至77的任一项的细胞,其中该细胞包括用于降低醋酸的产量的修饰。
79.如实施例50至78的任一项的细胞,其中该细胞包括任一或更多的蛋白质的较低或经降低的表达及/或经消除、受损、经降低或经延迟的活性,该任一或更多的蛋白质包括β-半乳糖苷酶、半乳糖苷O-乙酰转移酶、N-乙酰葡萄糖胺-6-磷酸去乙酰酶、葡萄糖胺-6-磷酸去胺酶、N-乙酰葡萄糖胺抑制蛋白、核糖核苷酸单磷酸酶、EIICBA-Nag、UDP-葡萄糖:十一碳烯-磷酸葡萄糖-1-磷酸转移酶、L-墨角藻糖激酶、L-岩藻糖异构酶、N-乙酰神经氨酸解离酶、N-乙酰甘露糖胺激酶、N-乙酰甘露糖胺-6-磷酸2-表异构酶、EIIAB-Man、EIIC-Man、EIID-Man、ushA、半乳糖-1-磷酸尿苷酸转移酶、葡萄糖-1-磷酸腺苷酸转移酶、葡萄糖-1-磷酸酶、ATP-依赖性6-磷酸果糖激活酶同功酶1、ATP-依赖性6-磷酸果糖激活酶同功酶2、葡萄糖-6-磷酸异构酶、有氧呼吸控制蛋白、转录抑制蛋白IclR、lon蛋白酶、葡萄糖特异性易位磷酸转移酶IIBC成分ptsG、葡萄糖特异性易位磷酸转移酶(PTS)酶IIBC成分malX、酶IIAGlc、β-葡糖苷特异性PTS酶II、果糖特异性PTS多磷酸基转移蛋白FruA与FruB、乙醇脱氢酶醛脱氢酶、丙酮酸甲酸裂解酶、醋酸激酶、磷酸酰基转移酶、磷酸乙酰转移酶、丙酮酸去羧酶。
80.如实施例50至79的任一项的细胞,其中该细胞具有产生磷酸烯醇丙酮酸盐(PEP)的能力。
81.如实施例50至80的任一项的细胞,其中该细胞被修饰以增强磷酸烯醇丙酮酸盐(PEP)的产生及/或供应。
82.如实施例50至81的任一项的细胞,其中该细胞包含至少部分失活的所选单糖、双糖或寡糖的分解代谢途径,该单糖、双糖或寡糖参与及/或被该α-1,3糖基化形式的Fuc-a1,2-Gal-R的该产生所需。
83.如实施例50至82的任一项的细胞,其中当在于其中乳糖与一种或更多的其他碳源结合的环境中生长时,该细胞抵抗乳糖杀伤现象。
84.如实施例50至83的任一项的细胞,其中该细胞在全肉汤(whole broth)及/或上清液中产生90g/L或更多的该α-1,3糖基化形式的Fuc-a1,2-Gal-R,及/或其中在全肉汤及/或上清液中,该α-1,3糖基化形式的Fuc-a1,2-Gal-R依据该α-1,3糖基化形式的Fuc-a1,2-Gal-与其前体于该全肉汤及/或上清液中的总量测量分别具有至少80%的纯度。
85.如实施例50至84的任一项的细胞,其中该细胞产生带电、较佳为唾液酸化及/或中性双糖与寡糖的混合物,其包括α-1,3糖基化形式的Fuc-a1,2-Gal-R。
86.如实施例50至85的任一项的细胞,其中该细胞产生带电、较佳为唾液酸化及/或中性寡糖的混合物,其包括α-1,3糖基化形式的Fuc-a1,2-Gal-R。
87.如实施例1至49的任一项的方法或如实施例50至86的任一项的细胞,其中该细胞为细菌、真菌、酵母菌、植物细胞、动物细胞或原生动物细胞(protozoan cell),
-较佳为,该细菌为一大肠杆菌(Escherichia coli)株(strain),更佳为大肠杆菌株,其为K-12株,还更佳为,该大肠杆菌K-12株为大肠杆菌MG1655,
-较佳为,该真菌属于选自包括黑霉菌属(Rhizopus)、网柄菌属(Dictyostelium)、青霉菌属(Penicillium)、白霉菌属(Mucor)或曲菌属(Aspergillus)的群组的属,
-较佳为,该酵母菌属于选自包括酵母菌属(Saccharomyces)、接合酵母菌属(Zygosaccharomyces)、毕赤酵母菌属(Pichia)、克马格特勒酵母(Komagataella)、汉逊氏酵母菌属(Hansenula)、子囊菌酵母属(Yarrowia)、拟球酵母菌属(Starmerella)、克鲁维酵母菌属(Kluyveromyces)或德巴利酵母菌属(Debaromyces)的群组的属,
-较佳为,该植物细胞为藻类细胞(algal cell)或系源自烟草(tobacco)、苜蓿(alfalfa)、水稻(rice)、西红柿、棉花、油菜籽(rapeseed)、大豆、玉蜀黍(maize)或玉米(corn)植物,
-较佳为,该动物细胞源自非人类哺乳动物(non-human mammals)、鸟、鱼、无脊椎动物(invertebrates)、爬虫类(reptiles)、两栖类(amphibians)或昆虫(insects),或源自排除胚胎干细胞的人类细胞的基因修饰细胞系(cell line),更佳为该人类和非人类哺乳动物细胞为上皮细胞(epithelial cell)、胚胎肾细胞(embryonic kidney cell)、纤维母细胞(fibroblast cell)、COS细胞、中国仓鼠卵巢(Chinese hamster ovary,CHO)细胞、鼠骨髓瘤细胞(murine myeloma cell)、NIH-3T3细胞、非哺乳动物成人干细胞(non-mammaryadult stem cell)或其衍生物,更佳为该昆虫细胞系源自草地贪夜蛾(Spodopterafrugiperda)、蚕(Bombyx mori)、甘蓝夜蛾(Mamestra brassicae)、粉纹夜蛾(Trichoplusia ni)或黑腹果蝇(Drosophila melanogaster),
较佳为,该原生动物细胞为蜥蜴利什曼原虫(Leishmania tarentolae)细胞。
88.如实施例1至49与87的任一项的方法,或如实施例50至87的任一项的细胞,其中该细胞为细菌,较佳为大肠杆菌株,更佳为一K-12株的大肠杆菌株的细胞,还更佳为,该大肠杆菌K-12株为大肠杆菌MG1655。
89.如实施例88的方法,或如实施例88的细胞,其中该细胞为活革兰氏阴性细菌(Gram-negative bacterium),其包括经降低或消除的聚-N-乙酰-葡萄糖胺(poly-N-acetyl-glucosamine,PNAG)、肠杆菌共同抗原(Enterobacterial Common Antigen,ECA)、纤维素、可拉酸(colanic acid)、核心寡糖(core oligosaccharides)、渗透调节周质葡聚糖(Osmoregulated Periplasmic Glucans,OPG)、葡萄糖基甘油(Glucosylglycerol)、聚糖(glycan)、及/或海藻糖(trehalose)的合成。
90.如实施例1至49与87的任一项的方法,或如实施例50至87的任一项的细胞,其中该细胞为酵母菌细胞。
91.如实施例1至49与87至90的任一项的方法,其中该分离包括下列步骤的至少一者:澄清(clarification)、超过滤(ultrafiltration)、纳米过滤(nanofiltration)、两相分配(two-phase partitioning)、逆渗透(reverse osmosis)、微过滤(microfiltration)、活性炭或碳处理(activated charcoal or carbon treatment)、以非离子界面活性剂处理(treatment with non-ionic surfactants)、酶消化(enzymatic digestion)、切向流高效过滤(tangential flow high-performance filtration)、切向流超过滤(tangentialflow ultrafiltration)、亲和层析(affinity chromatography)、离子交换层析(ionexchange chromatography)、疏水相互作用层析(hydrophobic interactionchromatography)及/或凝胶过滤(gel filtration),配体交换层析(ligand exchangechromatography)。
92.如实施例1至49与87至91的任一项的方法,还包括来自该细胞的任一该α-1,3糖基化形式的Fuc-a1,2-Gal-R,较佳为来自该细胞的α-1,3糖基化形式的LNFP-I的纯化。
93.如实施例1至49与87至92的任一项的方法,其中该纯化包括下列步骤的至少一者:活性炭或碳的使用、炭(charcoal)、纳米过滤、超过滤、电泳(electrophoresis)、酶处理或离子交换的使用、醇的使用,含水醇混合物(aqueous alcohol mixtures)的使用、结晶、蒸发、沉淀、干燥、喷雾干燥(spray drying)、冷冻干燥(lyophilization)、喷雾冷冻干燥(spray freeze drying)、冷冻喷雾干燥(freeze spray drying)、条式干燥(banddrying)、带式干燥(belt drying)、真空条式干燥(vacuum band drying)、真空带式干燥(vacuum belt drying)、滚筒式干燥(drum drying)、滚筒干燥(roller drying)、真空滚筒式干燥(vacuum drum drying)或真空滚筒干燥(vacuum roller drying)。
94.一种如实施例50至90的任一项的细胞,或如实施例1至49或87至93的任一项的方法的用途,其用于α-1,3糖基化形式的Fuc-a1,2-Gal-R,较佳为α-1,3糖基化形式的LNFP-I的产生。
将在实施例中更详细地描述本发明。以下实施例将作为对本发明的进一步说明和澄清,而不是限制性的。
实施例
实施例1材料与方法大肠杆菌(Escherichia coli)
培养基
Luria肉汤(Luria Broth,LB)培养基由1%胰蛋白胨(Difco,Erembodegem,Belgium)、0.5%酵母萃取物(Difco)与0.5%氯化钠(VWR.Leuven,Belgium)所组成。培养实验中96孔板或摇瓶中所使用的基本培养基(minimal medium)含有2.00g/L NH4Cl、5.00g/L(NH4)2SO4、2.993g/L KH2PO4、7.315g/L K2HPO4、8.372g/L MOPS、0.5g/L NaCl、0.5g/LMgSO4.7H2O、30g/L蔗糖或30g/L甘油、1ml/L维生素溶液、100μl/L钼酸盐(molybdate)溶液与1mL/L硒(selenium)溶液。如各个实施例中所具体说明,将0.30g/L唾液酸(sialic acid)、20g/L乳糖、20g/L LacNAc及/或20g/L LNB作为前体额外加入培养基中。将基本培养基以1MKOH设为pH为7。维生素溶液由3.6g/L FeCl2.4H2O、5g/L CaCl2.2H2O、1.3g/L MnCl2.2H2O、0.38g/L CuCl2.2H2O、0.5g/L CoCl2.6H2O、0.94g/L ZnCl2 0.0311g/L H3BO4、0.4g/LNa2EDTA.2H2O与1.01g/L硫胺素(thiamine).HCl组成。钼酸盐溶液含有0.967g/LNaMoO4.2H2O。硒溶液含有42g/L Seo2。
用于发酵的基本培养基,具有上方所述相同组成,含有6.75g/L NH4Cl、1.25g/L(NH4)2SO4、2.93g/L KH2PO4与7.31g/L KH2PO4、0.5g/L NaCl、0.5g/L MgSO4.7H2O、30g/L蔗糖或30g/L甘油、1mL/L维生素溶液、100μL/L钼酸盐溶液与1mL/L硒溶液。如各个实施例中所具体说明,将0.30g/L唾液酸、20g/L乳糖、20g/L LacNAc及/或20g/L LNB作为前体额外加入培养基中。
复合培养基(complex medium)藉由高压灭菌(autoclaving)(121℃,21分钟)进行灭菌,而基本培养基藉由过滤(0.22μm Sartorius)进行灭菌。必要时,藉由添加抗生素使培养基具有选择性:如氯霉素(chloramphenicol)(20mg/L)、卡本西林(carbenicillin)(100mg/L)、奇霉素(spectinomycin)(40mg/L)及/或卡那霉素(kanamycin)(50mg/L)。
质粒(Plasmid)
pKD46(Red辅助质粒,氨苄青霉素(Ampicillin)抗性)、pKD3(包含FRT侧面(FRT-flanked)氯霉素抗性(cat)基因)、pKD4(包含FRT侧面卡那霉素抗性(kan)基因)与pCP20(表达FLP重组酶活性)质粒为获自R.Cunin教授(比利时布鲁塞尔自由大学(VrijeUniversiteit Brussel),2007年)。质粒维持于购自Invitrogen的宿主E.coli DH5alpha(F-,phi80dlacZΔM15,Δ(lacZYA-argF)U169,deoR,recA1,endA1,hsdR17(rk-,mk+),phoA,supE44,lambda-,thi-1,gyrA96,relA1)。
菌株(Strains)与突变(mutations)
大肠杆菌K12 MG1655[λ-,F-,rph-1]于2007年3月从大肠杆菌遗传储备中心(ColiGenetic Stock Center)(US),CGSC Strain#:7740获得。使用Datsenko与Wanner(PNAS 97(2000),6640-6645)发表的技术进行基因破坏(gene disruption)、基因导入(geneintroduction)与基因置换(gene replacement)。此种技术是基于藉由λRed重组酶(lambdaRed recombinase)进行同源重组(homologous recombination)后的抗生素选择(antibiotic selection)。随后的内翻转酶(flippase)重组酶的催化作用确保了在最终产生菌株(final production strain)中的抗生素选择卡盒(antibiotic selectioncassette)的去除。携带Red辅助质粒pKD46的转化体(transformant)在10mL具有氨苄青霉素(100mg/L)与L-阿拉伯糖(10mM)的LB培养基中于30℃下生长至OD600 nm为0.6。藉由第一次以50mL冰冷水(ice-cold water)洗涤细胞与第二次以1mL冰冷水洗涤细胞,而使细胞为电转感受态(electrocompetent)。使用Gene PulserTM(BioRad)(600Ω,25μFD与250volts)对50μL细胞与10-100ng线性双股DNA产物进行电穿孔。之后,将细胞重新悬浮于50μL冰冷的水中。电穿孔(electroporation)后,将细胞加入到1mL LB培养基中,在37℃下培养1小时,最后涂于含有25mg/L的氯霉素或50mg/L卡那霉素的LB-琼脂上,以选择抗生素耐药的转化体。选择的突变株以修饰区上游与下游的引物经由PCR来验证,并在42℃于LB琼脂中生长以消除辅助质粒。测试突变株的氨苄青霉素(ampicillin)敏感性。使用pKD3、pKD4与其衍生物作为模板,藉由PCR获得线性ds-DNA扩增子(amplicon)。所使用的引物具有的一部分序列与模板互补,与另一部分与染色体DNA上需发生重组的一侧互补。对于基因体(genomic)敲除(knock-out),同源(homology)的区域被设计在目标基因的起始密码子(codon)与终止密码子的上游50-nt与下游50-nt。对于基因体敲入(knock-in),必须尊重转录起点(transcriptional starting point)(+1)。将PCR产物PCR-纯化、以DpnI消化、从琼脂糖凝胶中重新纯化,并悬浮在洗脱缓冲液(5mM Tris,pH 8.0)中。选择的突变株以pCP20质粒转化,其为一种氨苄青霉素与氯霉素抗性质粒,显示出FLP合成的温度敏感复制(replication)与热诱导。在30℃选择氨苄青霉素抗性转化体,于其后在42℃在LB中纯化一些菌落,然后测试所有抗生素抗性与FLP辅助质粒的丧失。使用对照引物(controlprimers)检查基因敲除与敲入。
在GDP-岩藻糖产生的一个例子中,突变株源自大肠杆菌(E.coli)K12MG1655,其包括大肠杆菌wcaJ与thyA基因的敲除以及含有蔗糖转运蛋白,例如来自大肠杆菌W的CscB(UniProt ID E0IXR1)、果糖激酶(fructose kinase),例如源自运动发酵单胞菌(Zymomonas mobilis)的Frk(UniProt ID Q03417)与一蔗糖磷酸化酶(sucrosephosphorylase),例如源自青春双歧杆菌(Bifidobacterium adolescentis)的BaSP(UniProt ID A0ZZH6)的组成型转录单元的基因体敲入。藉由基因体敲除包含glgC、agp、pfkA、pfkB、pgi、arcA、iclR、pgi与lon的任何一种或更多的大肠杆菌基因,可以进一步优化突变大肠杆菌菌株中的GDP-岩藻糖产生,如WO2016075243与WO2012007481中所述。GDP-岩藻糖产生可以另外优化,包括基因体敲入甘露糖-6-磷酸异构酶(mannose-6-phosphateisomerase),例如来自大肠杆菌的manA(UniProt ID P00946)、磷酸甘露糖变位酶(phosphomannomutase),例如来自大肠杆菌的manB(UniProt ID P24175)、甘露糖-1-磷酸鸟苷酸转移酶(mannose-1-phosphate guanylyltransferase),例如来自大肠杆菌的manC(UniProt ID P24174)、GDP-甘露糖4,6-脱水酶(GDP-mannose 4,6-dehydratase),例如来自大肠杆菌的gmd(UniProt ID P0AC88)与GDP-L-岩藻糖合成酶(GDP-L-fucosesynthase),例如来自大肠杆菌的fcl(UniProt ID P32055)的组成型转录单元。GDP-岩藻糖产生也可以藉由敲除大肠杆菌fucK与fucI基因与基因体敲入包含岩藻糖通透酶(fucosepermease),例如来自大肠杆菌的fucP(UniProt ID P11551)与双功能岩藻糖激酶(fucosekinase)/岩藻糖-1-磷酸鸟苷酸转移酶(fucose-1-phosphate guanylyltransferase),例如来自脆弱类杆菌(Bacteroides fragilis)的fkp(UniProt ID SUV40286.1)的组成型转录单元来获得。所有突变菌株皆可以大肠杆菌LacZ、LacY与LacA基因的基因体敲除以及乳糖通透酶(lactose permease),例如大肠杆菌LacY(UniProt ID P02920)的组成型转录单元的基因体敲入进行额外修饰。在产生如本发明中所用的岩藻糖基化结构的下一步中,突变的GDP-岩藻糖产生株被以包含α-1,2-岩藻糖基转移酶(alpha-1,2-fucosyltransferase),例如来自幽门螺杆菌(H.pylori)的HpFutC(GenBank:AAD29863.1)、具UniProt ID A0A2N5RQ26的来自Brachyspira pilosicoli的多肽、具UniProt ID F8X274的来自Dysgonomonas mossii的多肽、具UniProt ID G8QLF4的来自Dechlorosoma suillum的多肽、具UniProt ID Q316B5的来自Desulfovibrio alaskensis的多肽或具UniProt IDA0A1B8TNT0的来自Polaribacter vadi的多肽的组成型转录单元的表达质粒以及选择标记(selection marker),例如大肠杆菌thyA(UniProt ID P0A884)的组成型转录单元额外修饰。α-1,2-岩藻糖基转移酶的组成型转录单元也可以经由基因体敲入呈现给突变的大肠杆菌菌株。
或者,及/或另外,GDP-岩藻糖及/或岩藻糖基化结构的产生,可在突变的大肠杆菌菌株中进一步优化,藉由包含膜运输蛋白(membrane transporter protein),例如来自莫金斯克罗诺杆菌的MdfA(UniProt ID A0A2T7ANQ9)、来自杨氏柠檬酸杆菌的MdfA(UniProtID D4BC23)、来自大肠杆菌的MdfA(UniProt ID P0AEY8)、来自雷克斯堡约克氏菌的MdfA(UniProt ID G9Z5F4)、来自大肠杆菌的iceT(UniProt ID A0A024L207)或来自杨氏柠檬酸杆菌的iceT(UniProt ID D4B8A6)的组成型转录单元的基因体敲入。
在产生乳-N-三碳糖(lacto-N-triose)(LNT-II,LN3,GlcNAc-b1,3-Gal-b1,4-Glc)的一个例子中,突变株源自大肠杆菌K12 MG1655,并以大肠杆菌LacZ、LacY、LacA与nagB基因的敲除,以及乳糖通透酶,例如来自大肠杆菌的LacY(UniProt ID P02920),与半乳糖苷β-1,3-N-乙酰葡萄糖胺转移酶(galactoside beta-1,3-N-acetylglucosaminyltransferase),例如来自脑膜炎双球菌(N.meningitidis)的LgtA(GenBank:AAM33849.1)的组成型转录单元的基因体敲入来修饰。为了产生乳-N-四糖(lacto-N-tetraose)(LNT,Gal-b1,3-GlcNAc-b1,3-Gal-b1,4-Glc),以可以藉由基因体敲入或从表达质粒传递给菌株的N-乙酰葡萄糖胺β-1,3-半乳糖基转移酶(N-acetylglucosamine beta-1,3-galactosyltransferase),例如来自大肠杆菌O55:H7(UniProt ID D3QY14)的WbgO的组成型转录单元来进一步修饰LN3产生菌株。为了产生乳-N-新四糖(lacto-N-neotetraose,LNnT,Gal-b1,4-GlcNAc-b1,3-Gal-b1,4-Glc)进一步以N-乙酰葡萄糖胺β-1,4-半乳糖基转移酶(N-acetylglucosamine beta-1,4-galactosyltransferase),例如来自脑膜炎双球菌的LgtB(UniProt ID Q51116)的组成型转录单元来修饰LN3产生菌株。视需要而定,可以添加乳糖通透酶、半乳糖苷β-1,3-N-乙酰葡萄糖胺转移酶、N-乙酰葡萄糖胺β-1,3-半乳糖基转移酶及/或N-乙酰葡萄糖胺β-1,4-半乳糖基转移酶基因的多复制到突变的大肠杆菌菌株。突变株还可以视需要而定藉由基因体敲入L-谷氨酰胺-D-果糖-6-磷酸转胺酶(L-glutamine-D-fructose-6-phosphateaminotransferase),例如来自大肠杆菌的突变株glmS*54(不同于野生型大肠杆菌glmS蛋白,具有UniProt ID P17169,藉由A39T、R250C与G472S突变,如Deng et al.所述(Biochimie 2006,88:419-429)的组成型转录单元来修饰,以增强UDP-GlcNAc产生。
此外,LN3、LNT及/或LNnT的产生可以包括galT、ushA、ldhA与agp的任一个或更多的大肠杆菌基因的基因体敲除来于突变的大肠杆菌中进一步优化。突变的大肠杆菌菌株也可以视需要而定以UDP-葡萄糖-4-差向异构酶(UDP-glucose-4-epimerase),例如来自大肠杆菌的galE(UniProt ID P09147),磷酸葡萄糖胺变位酶(phosphoglucosamine mutase),例如来自大肠杆菌的glmM(UniProt ID P31120)与N-乙酰葡萄糖胺-1-磷酸尿苷酰转移酶(N-acetylglucosamine-1-phosphate uridylyltransferase)/葡萄糖胺-1-磷酸乙酰转移酶(glucosamine-1-phosphate acetyltransferase),例如来自大肠杆菌的glmU(UniProtID P0ACC7)的组成型转录单元的基因体敲入以适应。突变的大肠杆菌菌株也可藉由旁边是磷酸葡萄糖胺变位酶(phosphoglucosamine mutase),例如来自大肠杆菌的glmM(UniProtID P31120),与N-乙酰葡萄糖胺-1-磷酸尿苷酰转移酶/葡萄糖胺-1-磷酸乙酰转移酶,例如来自大肠杆菌的glmU(UniProt ID P0ACC7)的视需要而定的敲入的4-差向异构酶(4-epimerase),例如来自绿脓杆菌(Pseudomonas aeruginosa)的WbpP(UniProt ID Q8KN66)的组成型转录单元的基因体敲入,来适应UDP-GalNAc的产生。此外,突变菌株可以α-1,3-半乳糖基转移酶,例如SEQ ID NO:3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36或37的组成型转录单元进行修饰。或者及/或另外,突变菌株可以α-1,3-N-乙酰半乳糖胺转移酶(alpha-1,3-N-acetylgalactosaminyl transferase),例如SEQ ID NO:40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、63、6、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、89、90、91、92、93、94、95、96、97、98、99、100、101或102的组成型转录单元进行修饰。
或者,及/或另外,LN3、LNT、LNnT及其衍生的寡糖的产生可以包括膜转运蛋白如膜转运蛋白,例如来自莫金斯克罗诺杆菌的MdfA(UniProt ID A0A2T7ANQ9)、来自杨氏柠檬酸杆菌(UniProt ID D4BC23)的MdfA、来自大肠杆菌的MdfA(UniProt ID P0AEY8)、来自雷克斯堡约克氏菌的MdfA(UniProt ID G90T4L)或来自杨氏柠檬酸杆菌(UniProt ID D4B8A6)的iceT的组成型转录单元的基因体敲入来进一步于突变的大肠杆菌中进一步优化。
在唾液酸产生的一个实例中,突变株源自大肠杆菌K12 MG1655,其包含组成型转录单元的基因体敲入,此转录单元含有一个或更多的复制的葡糖胺6-磷酸N-乙酰转移酶(glucosamine 6-phosphate N-acetyltransferase),例如来自酿酒酵母的GNA1(UniProtID P43577)、N-乙酰葡糖胺2-差向异构酶(N-acetylglucosamine 2-epimerase),例如来自卵形拟杆菌(Bacteroides ovatus)的AGE(UniProt ID A7LVG6)与N-乙酰神经氨酸合成酶(N-acetylneuraminate synthas),例如来自脑膜炎双球菌(Neisseria meningitidis)(UniProt ID E0NCD4)或曲状杆菌(Campylobacter jejuni)(UniProt ID Q93MP9)。
或者,及/或另外,唾液酸的产生可以藉由含有UDP-N-乙酰葡糖胺2-差向异构酶(UDP-N-acetylglucosamine 2-epimerase),例如来自曲状杆菌的NeuC(UniProt IDQ93MP8)与N-乙酰神经氨酸合成酶,例如来自脑膜炎双球菌(UniProt ID E0NCD4)或曲状杆菌(UniProt ID Q93MP9)的组成型转录单元的基因体敲入获得。
或者,及/或另外,唾液酸的产生可藉由含有磷酸葡萄糖胺变位酶(phosphoglucosamine mutase),例如来自大肠杆菌的glmM(UniProt ID P31120)、N-乙酰葡萄糖胺-1-磷酸尿苷基转移酶(N-acetylglucosamine-1-phosphateuridyltransferase)/葡萄糖胺-1-磷酸乙酰转移酶(glucosamine-1-phosphateacetyltransferase),例如来自大肠杆菌的glmU(UniProt ID P0ACC7),一UDP-N-乙酰葡萄糖胺2-差向异构酶(UDP-N-acetylglucosamine 2-epimerase),例如来自曲状杆菌的NeuC(UniProt ID Q93MP8)与N-乙酰神经氨酸合成酶,例如来自脑膜炎双球菌(UniProt IDE0NCD4)或曲状杆菌(UniProt ID Q93MP9)的组成型转录单元的基因体敲入获得。
或者,及/或另外,唾液酸的产生可藉由含有一双功能UDP-GlcNAc 2-差向异构酶(UDP-GlcNAc 2-epimerase)/N-乙酰甘露糖胺激酶(N-acetylmannosamine kinase),例如来自M.musculus(菌株C57BL/6J)(UniProt ID Q91WG8)、N-酰基神经氨酸-9-磷酸合成酶(N-acylneuraminate-9-phosphate synthetase),例如来自假单胞菌(Pseudomonas sp.)UW4(UniProt ID K9NPH9)与N-酰基神经氨酸-9-磷酸酶(N-acylneuraminate-9-phosphatase),例如来自Candidatus Magnetomorum sp.HK-1(UniProt ID KPA15328.1)或来自多形拟杆菌(Bacteroides thetaiotaomicron)(UniProt ID Q8A712)的组成型转录单元的基因体敲入获得。
或者,及/或另外,唾液酸的产生可藉由含有磷酸葡糖胺变位酶例如,来自大肠杆菌的glmM(UniProt ID P31120)、N-乙酰葡萄糖胺-1-磷酸尿苷基转移酶(N-acetylglucosamine-1-phosphate uridyltransferase)/葡萄糖胺-1-磷酸乙酰转移酶(glucosamine-1-phosphate acetyltransferase),例如来自大肠杆菌的glmU(UniProt IDP0ACC7)、双功能UDP-GlcNAc 2-差向异构酶(UDP-GlcNAc2-epimerase)/N-乙酰甘露糖胺激酶(N-acetylmannosamine kinase),例如来自M.musculus(菌株C57BL/6J)(UniProt IDQ91WG8)、N-酰基神经氨酸-9-磷酸合成酶(N-acylneuraminate-9-phosphatesynthetase),例如来自假单胞菌UW4(UniProt ID K9NPH9)与N-酰基神经氨酸-9-磷酸酶,例如来自Candidatus Magnetomorum sp.HK-1(UniProt ID KPA15328.1)或来自多形拟杆菌(UniProt ID Q8A712)的组成型转录单元的基因体敲入获得。
突变大肠杆菌菌株中的唾液酸产生可以进一步以包含nagA、nagB、nagC、nagD、nagE、nanA、nanE、nanK、manX、manY、manZ的任何一个或更多的大肠杆菌基因的基因体敲除如WO18122225中所述,及/或以包含nanT、poxB、ldhA、adhE、aldB、pflA、pflC、ybiY、ackA及/或pta任何一个或更多的大肠杆菌基因的基因体敲除,及以包括L-谷氨酰胺-D-果糖-6-磷酸转胺酶(L-glutamine-D-fructose-6-phosphate aminotransferase),例如突变的glmS*54(不同于野生型大肠杆菌glmS,具有UniProt ID P17169,藉由A39T、R250C与G472S突变,如Deng et al.所述(Biochimie 2006,88:419-429)),较佳为磷酸酶(phosphatase),例如包括aphA、Cof、HisB、OtsB、Sure、Yaed、YcjU、YedP、YfbT、YidA、YigB、YihX、YniC、YqaB、YrbL、AppA、Gph、SerB、YbhA、YbiV、YbjL、Yfb、YieH、YjgL、YjjG、YrfG与YbiU的大肠杆菌基因或来自恋臭假单胞菌(Pseudomonas putida)的PsMupP、来自酿酒酵母菌的ScDOG1或来自枯草杆菌(Bacillus subtilis)的BsAraL,如WO1812222所述,与乙酰辅酶A合成酶(acetyl-CoAsynthetase),例如来自大肠杆菌的acs(UniProt ID P27550)的一或更多个的复制的组成型转录单元的基因体敲入来优化。S
对于唾液酸化寡糖产生,所述唾液酸产生菌株被进一步修饰以表达N-酰基神经氨酸胞苷酸转移酶(N-acylneuraminate cytidylyltransferase),例如来自曲状杆菌的NeuA酶(UniProt ID Q93MP7)、来自流感嗜血杆菌(Haemophilus influenzae)的NeuA酶(GenBank NO.AGV11798.1)或来自败血性巴斯德拉菌(Pasteurella multocida)的NeuA酶(GenBank NO.AMK07891.1),并表达β-半乳糖苷α-2,3-唾液酸转移酶(beta-galactosidealpha-2,3-sialyltransferase),例如来自败血性巴斯德拉菌的PmultST3(UniProt IDQ9CLP3)或由具有β-半乳糖苷α-2,3-唾液酸转移酶活性的UniProt ID Q9CLP3的氨基酸残基1至268所组成的PmultST3样多肽(PmultST3-like polypeptide)、来自脑膜炎双球菌的NmeniST3(GenBank NO.ARC07984.1)或来自败血性巴斯德拉菌subsp.multocida str.Pm70的PmultST2(GenBank NO.AAK02592.1)、β-半乳糖苷α-2,6-唾液酸转移酶(beta-galactoside alpha-2,6-sialyltransferase),例如来自发光杆菌(Photobacteriumdamselae)的PdST6(UniProt ID O66375)或由具有β-半乳糖苷α-2,6-唾液酸转移酶活性的UniProt ID O66375的氨基酸残基108至497所组成的PdST6样多肽(PdST6-likepolypeptide)或来自发光杆菌属的菌(Photobacterium sp.)JT-ISH-224的P-JT-ISH-224-ST6(UniProt ID A8QYL1)或由具有β-半乳糖苷α-2,6-唾液酸转移酶活性的UniProt IDA8QYL1的氨基酸残基18至514组成的P-JT-ISH-224-ST6样多肽,及/或α-2,8-唾液酸转移酶(alpha-2,8-sialyltransferase),例如来自M.musculus(UniProt ID Q64689)的一个或多个复制。N-酰基神经氨酸胞苷酰转移酶(N-acylneuraminate cytidylyltransferase)与唾液酸转移酶(sialyltransferases)的组成型转录单元可以经由基因体敲入或经由表达质粒传递给突变株。若产生唾液酸与CMP-唾液酸的突变菌株旨在制造唾液酸化乳糖结构,则以大肠杆菌LacZ、LacY与LacA基因的基因体敲除,并以乳糖通透酶,例如大肠杆菌LacY(UniProt ID P02920)的组成型转录单元的基因体敲入额外修饰此菌株。
或者,及/或另外,唾液酸及/或唾液酸化寡糖的产生可以在突变大肠杆菌菌株中进一步优化,藉由包含膜转运蛋白,例如唾液酸转运蛋白,如来自大肠杆菌K-12MG1655(UniProt ID P41036)的nanT、来自大肠杆菌O6:H1(UniProt ID Q8FD59)的nanT、来自大肠杆菌O157:H7(UniProt ID Q8X9G8)的nanT或来自E.albertii的nanT(UniProt IDP24077),或一运输蛋白(porter),例如来自大肠杆菌的EntS(UniProt ID P24077)、来自抗坏血酸克吕沃尔菌(Kluyvera ascorbate)的EntS(UniProt ID A0A378GQ13)或来自肠道沙门氏菌(Salmonella enterica)subsp.arizonae的EntS(UniProt ID A0A6Y2K4E8)、来自克罗诺杆菌的MdfA(UniProt ID A0A2T7ANQ9)、来自杨氏柠檬酸杆菌的MdfA(UniProt IDD4BC23)、来自大肠杆菌的MdfA (UniProt ID P0AEY8)、来自Yokenella regensburgei的MdfA、来自大肠杆菌的MdfA(UniProt ID A0A024L207)、来自杨氏柠檬酸杆菌的iceT(UniProt ID D4B8A6)、来自大肠杆菌的SetA(UniProt ID P31675)、来自大肠杆菌的SetB(UniProt ID P33026)或来自大肠杆菌的SetC(UniProt ID P33026)或ABC转运蛋白(transporter),例如来自大肠杆菌的oppF(UniProt ID P77737),来自乳酸链球菌(Lactococcus lactis)subsp.lactis bv.Diacetylactis的lmrA(UniProt IDA0A1V0NEL4)或来自婴儿长双歧杆菌亚种(Bifidobacterium longum subsp.Infantis)的Blon_2475(UniProt ID B7GPD4)的组成型转录单元的基因体敲入。
所有突变菌株也可以视需要而定,经由含有蔗糖转运蛋白,例如来自大肠杆菌W(UniProt ID E0IXR1)的CscB,果糖激酶,例如源自运动发酵单胞菌(Z.mobilis)的Frk(UniProt ID Q03417)与蔗糖磷酸化酶(sucrose phosphorylase),例如来自B.teenis的BaSP(UniProt ID A0ZZH6)的组成型转录单元的基因体敲入来适应在蔗糖上生长。
较佳为但非必须地,糖基转移酶、参与核苷酸活化糖合成的蛋白质及/或膜转运蛋白的任一个或更多在N-及/或C-末端融合至溶解度增强子标签(solubility enhancertag),例如SUMO卷标、MBP卷标、His、FLAG、Strep-II、Halo-tag、NusA、硫氧还蛋白(thioredoxin)、GST及/或Fh8标签以提高其溶解度(Costa et al.,Front.Microbiol.2014,https://doi.org/10.3389/fmicb.2014.00063;Fox et al.,Protein Sci.2001,10(3),622-630;Jia and Jeaon,Open Biol.2016,6:160196)。
视需要而定,以编码伴护蛋白(chaperone),例如DnaK、DnaJ、GrpE或GroEL/ES陪伴蛋白(chaperonin)系统(Baneyx F.,Palumbo J.L.(2003)Improving HeterologousProtein Folding via Molecular Chaperone and Foldase Co-Expression.In:Vaillancourt P.E.(eds)E.coliGene Expression Protocols.Methods in MolecularBiologyTM,vol 205.Humana Press)的组成型转录单元的基因体敲入来修饰突变的大肠杆菌菌株。
视需要而定,修饰突变大肠杆菌菌株以产生糖最少化(glycominimized)大肠杆菌菌株,其包括,包括pgaC、pgaD、rfe、rffT、rffM、bcsA、bcsB、bcsC、wcaA、wcaC、wcaE、wcaI、wcaJ、wcaL、waaH、waaF、waaC、waaU、waaZ、waaJ、waaO、waaB、waaS、waaG、waaQ、wbbl、arnC、arnT、wbbkgh、opjhg、glgA、glgB、malQ、otsA与yaiP的非必需糖基转移酶基因的任一个或更多的基因体敲除。
所有组成型启动子(constitutive promoters)、UTR与终止子(terminator)序列均源自Mutalik et al.(Nat.Methods 2013,No.10,354-360)与Cambray et al.(NucleicAcids Res.2013,41(9),5139-5148)描述的库(libraries)。所有基因均在TwistBioscience(twistbioscience.com)或IDT(eu.idtdna.com)上合成订购,并使用供货商的工具调整密码子使用。本发明中描述的SEQ ID NO总结于表1中。
所有菌株皆于-80℃储存在冷冻管中(隔夜LB培养物以1:1的比例与70%甘油混合)。
表1.于本发明中描述的SEQ ID NO的概述
Figure BDA0004113329090001051
Figure BDA0004113329090001061
Figure BDA0004113329090001071
Figure BDA0004113329090001081
Figure BDA0004113329090001091
Figure BDA0004113329090001101
Figure BDA0004113329090001111
Figure BDA0004113329090001121
Figure BDA0004113329090001131
Figure BDA0004113329090001141
Figure BDA0004113329090001151
培养条件
96孔微量滴定盘实验的预培养起始于冷冻管,于150μL LB中,并在37℃下在800rpm的定轨振荡器(orbital shaker)上隔夜培养。使用此培养物用作96孔方形微量滴定盘的接种物,以稀释400x加入400μL基本培养基。然后将这些最终的96孔培养盘于37℃在定轨振荡器上以800rpm培养72小时,或更短或更长。为了在培养实验结束时测量糖浓度,从每个孔中取出全部肉汤样品,藉由在旋下细胞之前,将培养液在60℃煮15分钟(=细胞内与细胞外糖浓度的平均值)。
生物反应器的预培养起始于特定菌株的整个1mL冷冻管,接种在1L或2.5L摇瓶中的250mL或500mL基本培养基中,并于37℃在定轨振荡器上以200rpm培养24小时。然后接种5L生物反应器(250mL接种物于2L批次培养基中);此过程由MFCS控制软件(SartoriusStedim Biotech,Melsungen,Germany)控制。培养条件设为37℃与最大搅拌;压力气体流速取决于菌株与生物反应器。使用0.5M H2SO4与20% NH4OH将pH控制在6.8。将排出气体冷却。当发酵过程中起泡时加入聚硅氧消泡剂(silicone antifoaming agent)的10%溶液。
光学密度(Optical density)
培养物的细胞密度常经由测量于600nm的光学密度来监测(ImplenNanophotometer NP80,Westburg,Belgium或以Spark 10M microplate reader,Tecan,Switzerland)。
解析分析(Analytical analysis)
标准品,如,但不限于,蔗糖、乳糖、乳-N-三碳糖II(LN3)、乳-N-四糖(LNT)、LNFP-I购自Carbosynth(UK)、Elicityl(France)与IsoSep(Sweden)。其他化合物使用内部制定的标准进行分析。
在具有蒸发光散射检测器(Evaporative Light Scattering Detector,ELSD)或折光率(Refractive Index,RI)侦测的Waters Acquity H-class UPLC上分析寡糖。将0.7μL体积的样品注入Waters Acquity UPLC BEH Amide柱(2.1x 100mm;
Figure BDA0004113329090001161
1.7μm)与Acquity UPLC BEH Amide VanGuard柱,
Figure BDA0004113329090001162
2.1x 5mm。柱温为50℃。流动相由1/4水与3/4乙腈溶液组成,其中添加了0.2%三乙胺(triethylamine)。此方法是等度的(isocratic),伴随流速为0.130mL/分钟。ELS检测器的漂移管(drift tube)温度为50℃,N2气压为50psi,增益(gain)为200,数据速率为10pps。RI检测器的温度设置为35℃。
糖也在具有折光率(RI)检测的Waters Acquity H-class UPLC上分析。将0.5μL体积的样品注入Waters Acquity BEH Amide柱(2.1x 100mm;
Figure BDA0004113329090001171
1.7μm)。柱温为50℃。流动相由72%乙腈与28%醋酸铵缓冲液(100mM)的混合物组成,其中加入了0.1%三乙胺。此方法是等度的,流速为0.260mL/分钟。RI检测器的温度设置为35℃。
为了在质谱仪上进行分析,使用具有电子喷雾电离(Electron SprayIonisation,ESI)的Waters Xevo TQ-MS,伴随450℃的去溶剂化(desolvation)温度,650L/小时的氮去溶剂化气流与20V的锥孔电压(cone voltage)。对所有寡糖,MS在选择离子监测(selected ion monitoring,SIM)中以负模式(negative mode)进行操作。在具有ThermoHypercarb柱(2.1x 100mm;3μm)的Waters Acquity UPLC上于35℃执行分离。使用梯度,其中洗脱液A是具有0.1%甲酸的超纯水(ultrapure water),其中洗脱液B是具有0.1%甲酸的乙腈。使用以下梯度在55分钟内分离寡糖:在21分钟内从2%的洗脱液B初始增加至12%,在11分钟内从12%第二次增加到40%的洗脱液B,在5分钟内从40%第三次增加到100%洗脱液B。作为洗涤步骤,使用100%的洗脱液B,5分钟。对于柱平衡,2%的洗脱液B的初始条件在1分钟内恢复并保持12分钟。
为了分析低浓度(低于50mg/L)的糖,使用了具有脉冲安培检测(pulsedamperometric detection,PAD)的Dionex HPAEC系统。将5μL体积的样品注入DionexCarboPac PA200柱4x 250mm与Dionex CarboPac PA200保护柱4x50mm。柱温设置为30℃。使用梯度,其中洗脱液A为去离子水,其中洗脱液B是200mM氢氧化钠,并且其中洗脱液C是500Mm醋酸钠。寡糖在60分钟内分离,同时使用以下梯度保持25%的洗脱液B的恒定比例:初始等度步骤保持75%的洗脱液A,10分钟,在8分钟内从0初始增加至4%的洗脱液C,第二个等度步骤保持71%的洗脱液A与4%的洗脱液C,6分钟,在2.6分钟内从4%第二次增加至12%的洗脱液C,第三个等度步骤保持63%的洗脱液A与12%的洗脱液C,3.4分钟,在5分钟内从12%第三次增加至48%的洗脱液。作为洗涤步骤,使用48%的洗脱液C,3分钟。对于柱平衡,75%的洗脱液A与0%的洗脱液C的初始条件在1分钟内恢复并保持11分钟。施加的流速为0.5mL/分钟。
实施例2.材料与方法酿酒酵母菌
培养基
菌株在具有完全补充混合物(Complete Supplement Mixture)(SD CSM)或含有6.7g/L无氨基酸酵母菌氮基(Yeast Nitrogen Base without amino acids)(YNB w/o AA,Difco)、20g/L琼脂(Difco)(固体培养物)、22g/L一水合葡萄糖(glucose monohydrate)或20g/L乳糖与0.79g/L CSM或0.77g/L CSM-Ura或0.77g/L CSM-His(MP Biomedicals)的CSMdrop-out(SD CSM-Ura或SD CSM-His)的合成界定酵母菌培养基(Synthetic Definedyeast medium)上生长。
菌株
酿酒酵母菌(S.cerevisiae)BY4742由Brachmann et al.(Yeast(1998)14:115-32)所创建,可在Euroscarf培养物收集中获得。使用Gietz的方法(Yeast11:355-360,1995)经由同源重组或质粒转化产生所有突变菌株。
质粒
在产生GDP-岩藻糖的例子中,酵母菌表达质粒如p2a_2μ_Fuc(Chan 2013,Plasmid70,2-17)用于在酿酒酵母中表达外来基因。该质粒包含氨苄青霉素抗性基因与细菌复制起点(origin)以允许在大肠杆菌中的选择与维持,以及2μ酵母菌ori与Ura3选择标记用于在酵母菌中的选择与维持。此质粒还包含乳糖通透酶,例如来自乳酸克鲁维酵母的LAC12(UniProt ID P07921)、GDP-甘露糖4,6-脱水酶,例如来自大肠杆菌的gmd(UniProt IDP0AC88)与GDP-L-岩藻糖合成酶,例如来自大肠杆菌的fcl(UniProt ID P32055)的组成型转录单元。酵母菌表达质粒p2a_2μ_Fuc2用作p2a_2μ_Fuc质粒的替代表达质粒,此质粒于氨苄青霉素抗性基因旁包含细菌ori、2μ酵母ori与Ura3选择标记乳糖通透酶,例如来自乳酸乳球菌(UniProt ID P07921)的LAC12、岩藻糖通透酶(fucose permease),例如来自大肠杆菌的fucP(UniProt ID P11551)与双功能岩藻糖激酶/岩藻糖-1-磷酸鸟苷酸转移酶,例如来自脆弱类杆菌的fkp(UniProt ID SUV40286.1)的组成型转录单元。为了进一步产生岩藻糖基化寡糖,p2a_2μ_Fuc及其变体p2a_2μ_Fuc2还包含α-1,2-岩藻糖基转移酶,例如来自幽门螺杆菌的HpFutC(GenBank:AAD29863.1)的组成型转录单元。
在产生UDP-半乳糖的实例中,酵母菌表达质粒源自pRS420-质粒系列(Christianson et al.,1992,Gene 110:119-122),其包含HIS3选择标记与葡萄糖-4-差向异构酶,例如来自大肠杆菌的galE(UniProt ID P09147)的组成型转录单元。为了产生LN3与LNT,此质粒进一步以乳糖通透酶,例如来自乳酸乳球菌(UniProt ID P07921)的LAC12、半乳糖苷β-1,3-N-乙酰葡萄糖胺转移酶,例如来自脑膜炎双球菌的lgtA(GenBank:AAM33849.1)与N-乙酰葡萄糖胺β-1,3-半乳糖基转移酶,例如来自大肠杆菌O55:H7的WbgO(UniProt ID D3QY14)的组成型转录单元来修饰。为了产生UDP-GalNAc,此质粒以4-差向异构酶,例如来自绿脓杆菌的WbpP(UniProt ID Q8KN66)的组成型转录单元进行了额外修饰于磷酸葡萄糖胺变位酶,例如来自大肠杆菌的glmM(UniProt ID P31120)与N-乙酰葡萄糖胺-1-磷酸尿苷酰转移酶/葡萄糖胺-1-磷酸乙酰转移酶,例如来自大肠杆菌的glmU(UniProt ID P0ACC7)的视需要而定的敲入的旁边。此外,突变菌株可以α-1,3-半乳糖基转移酶,例如SEQ ID NO:3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36或37的组成型转录单元进行修饰。或者及/或另外,突变菌株可以α-1,3-N-乙酰半乳糖胺转移酶,例如SEQ ID NO:40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、63、6、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、89、90、91、92、93、94、95、96、97、98、99、100、101或102的组成型转录单元进行修饰。
在产生唾液酸与CMP-唾液酸的一个例子中,酵母菌表达质粒可以源自pRS420-质粒系列(Christianson et al.,1992,Gene 110:119-122),其含有TRP1选择标记与L-谷氨酰胺-D-果糖-6-磷酸转胺酶,例如突变的glmS*54(不同于野生型大肠杆菌glmS,具有UniProt ID P17169,藉由A39T、R250C与G472S突变,如Deng et al.所述(Biochimie 2006,88:419-429))、磷酸酶(phosphatase),例如包括aphA、Cof、HisB、OtsB、Sure、Yaed、YcjU、YedP、YfbT、YidA、YigB、YihX、YniC、YqaB、YrbL、AppA、Gph、SerB、YbhA、YbiV、YbjL、Yfb、YieH、YjgL、YjjG、YrfG与YbiU的大肠杆菌基因或来自恋臭假单胞菌的PsMupP、来自酿酒酵母菌的ScDOG1或来自枯草杆菌的BsAraL,如WO18122225所述、N-乙酰葡萄糖胺2-差向异构酶,例如来自卵形拟杆菌的AGE(UniProt ID A7LVG6)、N-乙酰神经氨酸合酶,例如来自如来自脑膜炎双球菌(UniProt ID E0NCD4)或曲状杆菌(UniProt ID Q93MP9)与N-酰基神经氨酸胞苷酸转移酶,例如来自曲状杆菌的NeuA(UniProt ID Q93MP7)、来自流感嗜血杆菌的NeuA(GenBank NO.AGV11798.1)或来自败血性巴斯德拉菌的NeuA(GenBankNO.AMK07891.1)的一个或更多的复制的组成型转录单元。视需要而定,也可加入包括葡萄糖胺6-磷酸N-乙酰转移酶,例如来自酿酒酵母的GNA1(UniProt ID P43577)的一个或更多的复制的组成型转录单元。为了产生唾液酸化寡糖,质粒进一步包含乳糖通透酶,例如来自克鲁维乳酸酵母菌的LAC12(UniProt ID P07921)的组成型转录单元,与β-半乳糖苷α-2,3-唾液酸转移酶,例如来自败血性巴斯德拉菌的PmultST3(UniProt ID Q9CLP3)或由具有β-半乳糖苷α-2,3-唾液酸转移酶活性的UniProt ID Q9CLP3的氨基酸残基1至268所组成的PmultST3样多肽(PmultST3-like polypeptide)、来自脑膜炎双球菌的NmeniST3(GenBankNO.ARC07984.1)或来自败血性巴斯德拉菌subsp.multocida str.Pm70的PmultST2(GenBank NO.AAK02592.1)、β-半乳糖苷α-2,6-唾液酸转移酶,例如来自发光杆菌的PdST6(UniProt ID O66375)或由具有β-半乳糖苷α-2,6-唾液酸转移酶活性的UniProt IDO66375的氨基酸残基108至497所组成的PdST6样多肽(PdST6-like polypeptide)或来自发光杆菌属的菌(Photobacterium sp.)JT-ISH-224的P-JT-ISH-224-ST6(UniProt IDA8QYL1)或由具有β-半乳糖苷α-2,6-唾液酸转移酶活性的UniProt ID A8QYL1的氨基酸残基18至514组成的P-JT-ISH-224-ST6样多肽,及/或α-2,8-唾液酸转移酶,例如来自M.musculus(UniProt ID Q64689)的一个或更多的复制。
较佳为但非必须地,糖基转移酶、参与核苷酸活化糖合成的蛋白质及/或膜转运蛋白的任一个或更多在N-及/或C-末端融合至SUMOstar标签(例如,获自pYSUMOstar,LifeSensors,Malvern,PA)以提高其溶解度。
视需要而定,将突变酵母菌株以编码伴侣蛋白,例如Hsp31、Hsp32、Hsp33、Sno4、Kar2、Ssb1、Sse1、Sse2、Ssa1、Ssa2、Ssa3、Ssa4、Ssb2、Ecm10、Ssc1、Ssq1、Ssz1、Lhs1、Hsp82、Hsc82、Hsp78、Hsp104、Tcp1、Cct4、Cct8、Cct2、Cct3、Cct5、Cct6或Cct7的组成型转录单元的基因体敲入来修饰(Gong et al.、2009、Mol.Syst.Biol.5:275)。
质粒保存在宿主大肠杆菌DH5alpha(F-,phi80dlacZdeltaM15,delta(lacZYA-argF)U169,deoR,recA1,endA1,hsdR17(rk-,mk+),phoA,supE44,lambda-,thi-1,gyrA96,relA1)购自Invitrogen。
异源(heterologous)与同源(homologous)表达
需要表达的基因,无论是来自质粒还是来自基因体,均由以下公司的人工合成:DNA2.0、Gen9、IDT或Twist Bioscience。藉由针对表达宿主的密码子使用(codon usage)优化密码子使用,可以进一步促进表达。使用供货商的工具优化基因。
培养条件
一般而言,酵母菌菌株最初在SD CSM平板上生长以获得单一菌落。这些平板于30℃生长2-3天。从一个单一菌落开始,预培养物在5mL中于30℃隔夜生长,以200rpm振荡。随后的125mL摇瓶实验以2%的此预培养物于25mL培养基中接种。这些摇瓶在30℃以200rpm的轨道振荡(orbital shaking)进行培养。
基因表达启动子
使用合成的组成型启动子表达基因,如Blazeck(Biotechnology andBioengineering,Vol.109,No.11,2012)所述。
实施例3.以经修饰的大肠杆菌宿主的包括2’FL,DiFL,LN3,LNT,LNFP-I与Gal-a1, 3-(Fuc-a1,2)-Gal-b1,3-GlcNAc-b1,3-Gal-b1,4-Glc的寡糖混合物的产生
如实施例1中所述经修饰以用于GDP-岩藻糖产生与在蔗糖上生长的大肠杆菌菌株,藉由来自脑膜炎双球菌的半乳糖苷β-1,3-N-乙酰葡萄糖转胺酶LgtA(GenBank:AAM33849.1)与来自大肠杆菌O55:H7的N-乙酰葡萄糖胺β-1,3-半乳糖基转移酶WbgO(UniProt ID D3QY14)的组成型转录单元的基因体敲入,进一步适用于LN3与LNT产生。为了产生LNFP-I,以含有来自幽门螺杆菌的α-1,2-岩藻糖基转移酶HpFutC(GenBank:AAD29863.1)的组成型转录单元的表达质粒进一步修饰新颖菌株。在产生Gal-LNFP-I的最后步骤中,将突变菌株以第二兼容的表达质粒进行修饰,此质粒含有来自大肠杆菌的α-1,3-半乳糖基转移酶WbnI的组成型转录单元,具SEQ ID NO:03。新颖菌株在生长实验中评估2’FL、DiFL、LN3、LNT、LNFP-I(Fuc-a1,2-Gal-b1,3-GlcNAc-b1,3-Gal-b1,4-Glc)与Gal-a1,3-LNFP-I(Gal-a1,3-(Fuc-a1,2)-Gal-b1,3-GlcNAc-b1,3-Gal-b1,4-Glc)的产生,依据实施例1中所提供的培养条件,于其中培养基含有30g/L蔗糖与20g/L乳糖。此菌株在96孔板中以四个生物学重复生长。培养72小时后,收集培养肉汤,并以UPLC分析糖。
实施例4.以经修饰的大肠杆菌宿主的在补料批次发酵(fed-batch fermentation)中Gal-a1,3-(Fuc-a1,2)-Gal-b1,3-GlcNAc-b1,3-Gal-b1,4-Glc的产生
在补料批次发酵方法中进一步评估如实施例3中所述的突变大肠杆菌菌株。如实施例1中所述进行生物反应器规模的补料批次发酵。在这些实施例中,蔗糖用作碳源并且将乳糖作为前体添加到批次培养基中。取一般的肉汤样品,并如实施例1中所述使用UPLC测量寡糖的产生。
实施例5.以经修饰的大肠杆菌宿主的包括2’FL、DiFL、LN3、LNT、LNFP-I与GalNAc- a1,3-(Fuc-a1,2)-Gal-b1,3-GlcNAc-b1,3-Gal-b1,4-Glc的寡糖混合物的产生
将如实施例3所述经修饰以用于GDP-岩藻糖产生与LNFP-1产生及在蔗糖上生长的大肠杆菌菌株进一步以含有具有SEQ ID NO:40的来自H.mustelae的α-1,3-N-乙酰半乳糖胺转移酶BgtA与来自绿脓杆菌的4-差向异构酶WbpP(UniProt ID Q8KN66)的组成型转录单元的第二兼容表达质粒转化,以用于UDP-GalNAc产生。新颖菌株在生长实验中评估2’FL、DiFL、LN3、LNT、LNFP-I(Fuc-a1,2-Gal-b1,3-GlcNAc-b1,3-Gal-b1,4-Glc)与GalNAc-a1,3-LNFP-I
(GalNAc-a1,3-(Fuc-a1,2)-Gal-b1,3-GlcNAc-b1,3-Gal-b1,4-Glc)的产生,依据实施例1中所提供的培养条件,于其中培养基含有30g/L蔗糖与20g/L乳糖。此菌株在96孔板中以四个生物学重复生长。培养72小时后,收集培养肉汤,并以UPLC分析糖。
实施例6.以经修饰的大肠杆菌宿主的在补料批次发酵中GalNAc-a1,3-(Fuc-a1, 2)-Gal-b1,3-GlcNAc-b1,3-Gal-b1,4-Glc的产生
在补料批次发酵方法中进一步评估如实施例5中所述的突变大肠杆菌菌株。如实施例1中所述进行生物反应器规模的补料批次发酵。在这些实施例中,蔗糖用作碳源并且将乳糖作为前体添加到批次培养基中。取一般的肉汤样品,并如实施例1中所述使用UPLC测量寡糖的产生。
实施例7.以经修饰的酿酒酵母菌宿主的包括2’FL、DiFL、LN3、LNT、LNFP-I与Gal- a1,3-(Fuc-a1,2)-Gal-b1,3-GlcNAc-b1,3-Gal-b1,4-Glc的寡糖混合物的产生
酿酒酵母菌菌株如实施例2中所述,适用于GDP-岩藻糖与LNT的产生以及表达α-1,2-岩藻糖基转移酶与α-1,3-半乳糖基转移酶,藉由第一酵母菌表达质粒,其包含来自克鲁维乳酸酵母菌的乳糖通透酶LAC12(UniProt ID P07921)、来自大肠杆菌的GDP-甘露糖4,6-脱水酶gmd(UniProt ID P0AC88)、来自大肠杆菌的GDP-L-岩藻糖合酶fcl(UniProt IDP32055)与来自幽门螺杆菌的a1,2-岩藻糖基转移酶HpFutC(GenBank:AAD29863.1)组成型转录单元,以及藉由第二酵母菌表达质粒,其包含来自大肠杆菌的UDP-葡萄糖4-差向构酶galE(UniProt ID P09147)、来自脑膜炎双球菌的半乳糖苷β-1,3-N-乙酰葡萄糖胺转移酶lgtA(GenBank:AAM33849.1)、来自大肠杆菌O55:H7的N-乙酰葡萄糖胺β-1,3-半乳糖基转移酶WbgO(UniProt ID D3QY14)与具有SEQ ID NO:03的来自大肠杆菌的α-1,3-半乳糖基转移酶WbnI的组成型转录转录单元。新颖菌株在生长实验中评估2’FL、DiFL、LN3、LNT、LNFP-I(Fuc-a1,2-Gal-b1,3-GlcNAc-b1,3-Gal-b1,4-Glc)与Gal-a1,3-LNFP-I(Gal-a1,3-(Fuc-a1,2)-Gal-b1,3-GlcNAc-b1,3-Gal-b1,4-Glc)的产生,依据实施例2中所提供的培养条件,于其中SD CSM-Ura-His drop-ou培养基包括乳糖为前体。此菌株在96孔板中以四个生物学重复生长。培养72小时后,收集培养肉汤,并以UPLC分析糖。
实施例8.以经修饰的酿酒酵母菌宿主的包括2’FL、DiFL、LN3、LNT、LNFP-I与 GalNAc-a1,3-(Fuc-a1,2)-Gal-b1,3-GlcNAc-b1,3-Gal-b1,4-Glc的寡糖混合物的产生
酿酒酵母菌菌株如实施例2中所述,适用于GDP-岩藻糖与LNT的产生以及表达α-1,2-岩藻糖基转移酶与α-1,3-N-乙酰半乳糖转胺酶,藉由第一酵母菌表达质粒,其包括来自克鲁维乳酸酵母菌的乳糖通透酶LAC12(UniProt ID P07921)、来自绿脓杆菌的4-差向异构酶WbpP(UniProt ID Q8KN66),用于UDP-GalNAc的产生、来自大肠杆菌的GDP-甘露糖4,6-脱水酶gmd(UniProt ID P0AC88)、来自大肠杆菌的GDP-L-岩藻糖合酶fcl(UniProt IDP32055)与来自幽门螺杆菌的a1,2-岩藻糖基转移酶HpFutC(GenBank:AAD29863.1)组成型转录转录单元,以及藉由第二酵母菌表达质粒,其包括来自大肠杆菌的UDP-葡萄糖4-差向构酶galE(UniProt ID P09147)、来自脑膜炎双球菌的半乳糖苷β-1,3-N-乙酰葡萄糖胺转移酶lgtA(GenBank:AAM33849.1)、来自大肠杆菌O55:H7的N-乙酰葡萄糖胺β-1,3-半乳糖基转移酶WbgO(UniProt ID D3QY14)与具有SEQ ID NO:40的来自H.mustelae的α-1,3-N-乙酰半乳糖胺转移酶BgtA的组成型、转录单元。新颖菌株在生长实验中评估2’FL、DiFL、LN3、LNT、LNFP-I(Fuc-a1,2-Gal-b1,3-GlcNAc-b1,3-Gal-b1,4-Glc)与GalNAc-a1,3-LNFP-I
(GalNAc-a1,3-(Fuc-a1,2)-Gal-b1,3-GlcNAc-b1,3-Gal-b1,4-Glc)的产生,依据实施例2中所提供的培养条件,于其中SD CSM-Ura-His drop-out培养基包括乳糖为前体。此菌株在96孔板中以四个生物学重复生长。培养72小时后,收集培养肉汤,并以UPLC分析糖。
实施例9.以表达来自毛样短螺旋体的α-1,2-岩藻糖基转移酶的经修饰的大肠杆 菌宿主的GalNAc-a1,3-(Fuc-a1,2)-Gal-b1,3-GlcNAc-b1,3-Gal-b1,4-Glc的产生
如实施例1中所述经修饰以用于GDP-岩藻糖产生与在蔗糖上生长的大肠杆菌菌株,藉由来自脑膜炎双球菌的半乳糖苷β-1,3-N-乙酰葡萄糖转胺酶LgtA(GenBank:AAM33849.1)与来自大肠杆菌O55:H7的N-乙酰葡萄糖胺β-1,3-半乳糖基转移酶WbgO(UniProt ID D3QY14)的组成型转录单元的基因体敲入,进一步适用于LN3与LNT产生。此菌株也藉由来自绿脓杆菌的4-差向异构酶WbpP(UniProt ID Q8KN66)的组成型转录单元的基因体敲入,适用于UDP-GalNAc产生。为了产生GalNAc-LNFP-I,新颖菌株被进一步修饰,藉由第一表达质粒,其包括来自毛样短螺旋体的具有UniProt ID A0A2N5RQ26的α-1,2-岩藻糖基转移酶的组成型转录单元,与藉由第二相容表达质粒,其包括α-1,3-N-乙酰半乳糖胺转移酶,其选自包括来自Helicobacter mustelae的具有SEQ ID NO:40的BgtA、来自卵形拟杆菌的具有SEQ ID NO:49的多肽、来自Lachnospiraceae bacterium的具有SEQ ID NO:74的多肽、来自食葡糖罗斯氏菌(Roseburia inulinivorans)的具有SEQ ID NO:91的多肽与来自卵形拟杆菌的具有SEQ ID NO:102的多肽的列表的组成型转录单元。新颖菌株在生长实验中被评估,依据实施例1中所提供的培养条件,于其中培养基含有30g/L蔗糖与20g/L乳糖。各菌株在96孔板中以四个生物学重复生长。培养72小时后,收集培养肉汤,并以UPLC分析糖。实验证明所有菌株均产生GalNAc-a1,3-LNFP-I(GalNAc-a1,3-(Fuc-a1,2)-Gal-b1,3-GlcNAc-b1,3-Gal-b1,4-Glc)于全肉汤样品中,如表2所总结。
表2.在表达来自多毛短螺旋体的具有UniProt ID A0A2N5RQ26的α-1,2-岩藻糖基转移酶与α-1,3-N-乙酰半乳糖转胺酶的突变大肠杆菌菌株的全肉汤样品中GalNAc-a1,3-LNFP-I的产生,当根据如实施例1所述的培养条件在生长实验中进行评估时,其中培养基含有蔗糖作为碳源与乳糖作为前体。
Figure BDA0004113329090001251
实施例10.以表达来自Dysgonomonasmossii的α-1,2-岩藻糖基转移酶的经修饰的 大肠杆菌宿主的GalNAc-a1,3-(Fuc-a1,2)-Gal-b1,3-GlcNAc-b1,3-Gal-b1,4-Glc的产生
如实施例1中所述经修饰以用于GDP-岩藻糖产生与在蔗糖上生长的大肠杆菌菌株,藉由来自脑膜炎双球菌的半乳糖苷β-1,3-N-乙酰葡萄糖转胺酶LgtA(GenBank:AAM33849.1)与来自大肠杆菌O55:H7的N-乙酰葡萄糖胺β-1,3-半乳糖基转移酶WbgO(UniProt ID D3QY14)的组成型转录单元的基因体敲入,进一步适用于LN3与LNT产生。此菌株也藉由来自绿脓杆菌的4-差向异构酶WbpP(UniProt ID Q8KN66)的组成型转录单元的基因体敲入,适用于UDP-GalNAc产生。为了产生GalNAc-LNFP-I,新颖菌株被进一步修饰,藉由第一表达质粒,其包括来自Dysgonomonas mossii的具有UniProt ID F8X274的α-1,2-岩藻糖基转移酶的组成型转录单元,与藉由第二相容表达质粒,其包括α-1,3-N-乙酰半乳糖胺转移酶,其系选自包括来自Helicobacter mustelae的具有SEQ ID NO:40的BgtA、来自卵形拟杆菌的具有SEQ ID NO:49的多肽与来自卵形拟杆菌的具有SEQ ID NO:102的多肽的列表的组成型转录单元。新颖菌株在生长实验中被评估,依据实施例1中所提供的培养条件,于其中培养基含有30g/L蔗糖与20g/L乳糖。各菌株在96孔板中以四个生物学重复生长。培养72小时后,收集培养肉汤,并以UPLC分析糖。实验证明所有菌株均产生GalNAc-a1,3-LNFP-I(GalNAc-a1,3-(Fuc-a1,2)-Gal-b1,3-GlcNAc-b1,3-Gal-b1,4-Glc)于全肉汤样品中,如表3所总结。
表3.在表达来自D.mossii的具有UniProt ID F8X274的α-1,2-岩藻糖基转移酶与α-1,3-N-乙酰半乳糖转胺酶的突变大肠杆菌菌株的全肉汤样品中GalNAc-a1,3-LNFP-I的产生,当根据如实施例1所述的培养条件在生长实验中进行评估时,其中培养基含有蔗糖作为碳源与乳糖作为前体。
Figure BDA0004113329090001261
实施例11.以表达来自Dechlorosomasuillum的α-1,2-岩藻糖基转移酶的经修饰 的大肠杆菌宿主的GalNAc-a1,3-(Fuc-a1,2)-Gal-b1,3-GlcNAc-b1,3-Gal-b1,4-Glc的产
如实施例1中所述经修饰以用于GDP-岩藻糖产生与蔗糖上生长的大肠杆菌菌株,藉由来自脑膜炎双球菌的半乳糖苷β-1,3-N-乙酰葡萄糖转胺酶LgtA(GenBank:AAM33849.1)与来自大肠杆菌O55:H7的N-乙酰葡萄糖胺β-1,3-半乳糖基转移酶WbgO(UniProt ID D3QY14)的组成型转录单元的基因体敲入,进一步适用于LN3与LNT产生。此菌株也藉由来自绿脓杆菌的4-差向异构酶WbpP(UniProt ID Q8KN66)的组成型转录单元的基因体敲入,适用于UDP-GalNAc产生。为了产生GalNAc-LNFP-I,新颖菌株被进一步修饰,藉由第一表达质粒,其包括来自Dechlorosoma suillum的具有UniProt ID G8QLF4的α-1,2-岩藻糖基转移酶的组成型转录单元,与藉由第二相容表达质粒,其包括α-1,3-N-乙酰半乳糖胺转移酶,其系选自包括来自Helicobacter mustelae的具有SEQ ID NO:40的BgtA与来自卵形拟杆菌的具有SEQ ID NO:102的多肽的列表的组成型转录单元。新颖菌株在生长实验中被评估,依据实施例1中所提供的培养条件,于其中培养基含有30g/L蔗糖与20g/L乳糖。各菌株在96孔板中以四个生物学重复生长。培养72小时后,收集培养肉汤,并以UPLC分析糖。实验证明所有菌株均产生GalNAc-a1,3-LNFP-I(GalNAc-a1,3-(Fuc-a1,2)-Gal-b1,3-GlcNAc-b1,3-Gal-b1,4-Glc)于全肉汤样品中,如表4所总结。
表4.在表达来自D.suillum的具有UniProt ID G8QLF4的α-1,2-岩藻糖基转移酶与α-1,3-N-乙酰半乳糖转胺酶的突变大肠杆菌菌株的全肉汤样品中GalNAc-a1,3-LNFP-I的产生,当根据如实施例1所述的培养条件在生长实验中进行评估时,其中培养基含有蔗糖作为碳源与乳糖作为前体。
Figure BDA0004113329090001271
实施例12.以表达来自Desulfovibrioalaskensis的α-1,2-岩藻糖基转移酶的经 修饰的大肠杆菌宿主的GalNAc-a1,3-(Fuc-a1,2)-Gal-b1,3-GlcNAc-b1,3-Gal-b1,4-Glc 的产生
如实施例1中所述经修饰以用于GDP-岩藻糖产生与在蔗糖上生长的大肠杆菌菌株,藉由来自脑膜炎双球菌的半乳糖苷β-1,3-N-乙酰葡萄糖转胺酶LgtA(GenBank:AAM33849.1)与来自大肠杆菌O55:H7的N-乙酰葡萄糖胺β-1,3-半乳糖基转移酶WbgO(UniProt ID D3QY14)的组成型转录单元的基因体敲入,进一步适用于LN3与LNT产生。此菌株也藉由来自绿脓杆菌的4-差向异构酶WbpP(UniProt ID Q8KN66)的组成型转录单元的基因体敲入,适用于UDP-GalNAc产生。为了产生GalNAc-LNFP-I,新颖菌株被进一步修饰,藉由第一表达质粒,其包括来自Desulfovibrio alaskensis的具有UniProt ID Q316B5的α-1,2-岩藻糖基转移酶的组成型转录单元,与藉由第二相容表达质粒,其包括α-1,3-N-乙酰半乳糖胺转移酶,其系选自包括来自Helicobacter mustelae的具有SEQ ID NO:40的BgtA与来自卵形拟杆菌的具有SEQ ID NO:102的多肽的列表的组成型转录单元。新颖菌株在生长实验中被评估,依据实施例1中所提供的培养条件,于其中培养基含有30g/L蔗糖与20g/L乳糖。各菌株在96孔板中以四个生物学重复生长。培养72小时后,收集培养肉汤,并以UPLC分析糖。实验证明所有菌株均产生GalNAc-a1,3-LNFP-I(GalNAc-a1,3-(Fuc-a1,2)-Gal-b1,3-GlcNAc-b1,3-Gal-b1,4-Glc)于全肉汤样品中,如表5所总结。
表5.在表达来自D.alaskensis的具有UniProt ID Q316B5的α-1,2-岩藻糖基转移酶与α-1,3-N-乙酰半乳糖转胺酶的突变大肠杆菌菌株的全肉汤样品中GalNAc-a1,3-LNFP-I的产生,当根据如实施例1所述的培养条件在生长实验中进行评估时,其中培养基含有蔗糖作为碳源与乳糖作为前体。
Figure BDA0004113329090001281
实施例13.以一经修饰的大肠杆菌宿主的Gal-a1,3-(Fuc-a1,2)-Gal-b1,3- GlcNAc-b1,3-Gal-b1,4-Glc的产生
如实施例1中所述经修饰以用于GDP-岩藻糖产生与在蔗糖上生长的大肠杆菌菌株,藉由来自脑膜炎双球菌的半乳糖苷β-1,3-N-乙酰葡萄糖转胺酶LgtA(GenBank:AAM33849.1)与来自大肠杆菌O55:H7的N-乙酰葡萄糖胺β-1,3-半乳糖基转移酶WbgO(UniProt ID D3QY14)的组成型转录单元的基因体敲入,进一步适用于LN3与LNT产生。为了产生LNFP-I,新颖菌株被进一步修饰,藉由表达质粒,其包括来自幽门螺杆菌的α-1,2-岩藻糖基转移酶HpFutC(GenBank:AAD29863.1)的组成型转录单元。在产生Gal-LNFP-I的最后步骤中,将突变菌株以第二兼容的表达质粒进行修饰,此质粒含有选自包括SEQ ID NO:04、05、06、07、08、09、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36与37的列表的α-1,3-半乳糖基转移酶的组成型转录单元。新颖菌株在生长实验中评估Gal-a1,3-LNFP-I(Gal-a1,3-(Fuc-a1,2)-Gal-b1,3-GlcNAc-b1,3-Gal-b1,4-Glc的产生,依据实施例1中所提供的培养条件,于其中培养基含有30g/L蔗糖与20g/L乳糖。此菌株在96孔板中以四个生物学重复生长。培养72小时后,收集培养肉汤,并以UPLC分析糖。
实施例14.以经修饰的大肠杆菌宿主的GalNAc-a1,3-(Fuc-a1,2)-Gal-b1,3- GlcNAc-b1,3-Gal-b1,4-Glc的产生
如实施例3中所述经修饰以用于GDP-岩藻糖与LNFP-I产生以及在蔗糖上生长的大肠杆菌菌株,以来自绿脓杆菌的4-差向异构酶WbpP(UniProt ID Q8KN66)的组成型转录单元来进一步修饰,用于UDP-GalNAc产生,并以第二兼容的表达质粒进行转化,此质粒含有选自包括SEQ ID NO:41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98;99、100、101与102的列表的α-1,3-N-乙酰半乳糖胺转移酶的组成型转录单元。新颖菌株在生长实验中评估2’FL、DiFL、LN3、LNT、LNFP-I、Gal-a1,3-(Fuc-a1,2)-Gal-b1,3-GlcNAc-b1,3-Gal-b1,4-Glc与GalNAc-a1,3-LNFP-I(GalNAc-a1,3-(Fuc-a1,2)-Gal-b1,3-GlcNAc-b1,3-Gal-b1,4-Glc)的产生,依据实施例1中所提供的培养条件,于其中培养基含有30g/L蔗糖与20g/L乳糖。此菌株在96孔板中以四个生物学重复生长。培养72小时后,收集培养肉汤,并以UPLC分析糖。
实施例15.以经修饰的大肠杆菌宿主的Gal-a1,3-(Fuc-a1,2)-Gal-b1,4-Glc与 Gal-a1,3-(Fuc-a1,2)-Gal-b1,4-(Fuc-a1,3)-Glc的产生
如实施例1中所述经修饰以用于GDP-岩藻糖产生与在蔗糖上生长的大肠杆菌菌株进一步被转化,藉由第一表达质粒,其包含来自幽门螺杆菌的α-1,2-岩藻糖基转移酶HpFutC(GenBank:AAD29863.1)的组成型转录单元,与第二相容的表达质粒,其含有选自包括SEQ ID NO:04、05、06、07、08、09、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36与37的列表的α-1,3-半乳糖基转移酶的组成型转录单元。新颖菌株在生长实验中评估Gal-a1,3-(Fuc-a1,2)-Gal-b1,4-Glc与Gal-a1,3-(Fuc-a1,2)-Gal-b1,4-(Fuc-a1,3)-Glc的产生,依据实施例1中所提供的培养条件,于其中培养基含有30g/L蔗糖与20g/L乳糖。此菌株在96孔板中以四个生物学重复生长。培养72小时后,收集培养肉汤,并以UPLC分析糖。
实施例16.以经修饰的大肠杆菌宿主的包含Gal-a1,3-(Fuc-a1,2)-Gal-b1,4- Glc,Gal-a1,3-(Fuc-a1,2)-Gal-b1,4-(Fuc-a1,3)-Glc与3’-SL的寡糖混合物的产生
如实施例15中所述经修饰的大肠杆菌菌株,以nagA与nagB基因的基因体敲除与包括编码来自大肠杆菌的L-谷氨酰胺-D-果糖-6-磷酸转胺酶(glmS*54)(藉由A39T、R250C与G472S突变不同于野生型大肠杆菌glmS蛋白,具有UniProt ID P17169)、来自大肠杆菌的磷酸葡萄糖胺变位酶(glmM)(UniProt ID P31120)、来自大肠杆菌的N-乙酰葡萄糖胺-1-磷酸尿苷酰转移酶/葡萄糖胺-1-磷酸乙酰转移酶(glmU)(UniProt ID P0ACC7)、来自曲状杆菌的UDP-N-乙酰葡糖胺2-差向异构酶(NeuC)(UniProt ID Q93MP8)、来自脑膜炎双球菌的N-乙酰神经氨酸合成酶(NeuB)(UniProt ID E0NCD4)、来自大肠杆菌的唾液酸转运蛋白(nanT)((UniProt ID P41036)、来自曲状杆菌的N-酰基神经氨酸胞苷酸转移酶(UniProtID Q93MP7)与来自败血性巴斯德拉菌的β-半乳糖苷α-2,3-唾液酸转移酶PmultST3(UniProt ID Q9CLP3)的基因的组成型转录单元的基因体敲入来进一步修饰。新颖菌株在生长实验中评估包含Gal-a1,3-(Fuc-a1,2)-Gal-b1,4-Glc,Gal-a1,3-(Fuc-a1,2)-Gal-b1,4-(Fuc-a1,3)-Glc与3’-唾液酸乳糖(3’-sialyllactose,3’-SL)的寡糖混合物的产生,依据实施例1中所提供的培养条件,于其中培养基含有30g/L蔗糖与20g/L乳糖。此菌株在96孔板中以四个生物学重复生长。培养72小时后,收集培养肉汤,并以UPLC分析糖。
实施例17.以经修饰的大肠杆菌宿主的GalNAc-a1,3-(Fuc-a1,2)-Gal-b1,4-Glc 的产生
如实施例1中所述经修饰以用于GDP-岩藻糖产生以及在糖上生长的大肠杆菌菌株,以来自绿脓杆菌的4-差向异构酶WbpP(UniProt ID Q8KN66)的组成型转录单元来进一步修饰,用于UDP-GalNAc产生,并且进行转化,藉由第一表达质粒,其含有来自幽门螺杆菌的α-1,2-岩藻糖基转移酶HpFutC(GenBank:AAD29863.1),以及第二兼容的表达质粒,其含有选自包括SEQ ID NO:41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99、100、101与102的列表的α-1,3-N-乙酰半乳糖胺转移酶的组成型转录单元。新颖菌株在生长实验中评估α-四糖(GalNAc-a1,3-(Fuc-a1,2)-Gal-b1,4-Glc)(alpha-tetrasaccharide
(GalNAc-a1,3-(Fuc-a1,2)-Gal-b1,4-Glc))的产生,依据实施例1中所提供的培养条件,于其中培养基含有30g/L蔗糖与20g/L乳糖。此菌株在96孔板中以四个生物学重复生长。培养72小时后,收集培养肉汤,并以UPLC分析糖。
实施例18.以经修饰的大肠杆菌宿主的Gal-a1,3-(Fuc-a1,2)-Gal-b1,3-GlcNAc 的产生
如实施例1中所述经修饰以用于GDP-岩藻糖产生以及在蔗糖上生长的大肠杆菌菌株,进行转化,藉由第一表达质粒,其含有来自幽门螺杆菌的α-1,2-岩藻糖基转移酶HpFutC(GenBank:AAD29863.1)的组成型转录单元,以及第二兼容的表达质粒,其含有选自包括SEQID NO:04、05、06、07、08、09、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36与37的列表的α-1,3-半乳糖基转移酶的组成型转录单元。新颖菌株在生长实验中评估Gal-a1,3-(Fuc-a1,2)-Gal-b1,3-GlcNAc的产生,依据实施例1中所提供的培养条件,于其中培养基含有30g/L蔗糖与20g/L乳-N-二糖(lacto-N-biose,LNB,Gal-b1,3-GlcNAc)。此菌株在96孔板中以四个生物学重复生长。培养72小时后,收集培养肉汤,并以UPLC分析糖。
实施例19.以经修饰的大肠杆菌宿主的Gal-a1,3-(Fuc-a1,2)-Gal-b1,3-GlcNAc
如实施例1中所述经修饰的大肠杆菌菌株,被进一步转化,以nagA与nagB基因的基因体敲除与来自大肠杆菌的突变L-谷氨酰胺-D-果糖-6-磷酸转胺酶(glmS*54)(藉由A39T、R250C与G472S突变不同于野生型大肠杆菌glmS蛋白,具有UniProt ID P17169)、来自酿酒酵母菌的葡萄糖胺6-磷酸N-乙酰转移酶GNA1(UniProt ID P43577)、来自枯草杆菌的磷酸酶BsAraL(UniProt ID P94526)与来自大肠杆菌O55:H7的N-乙酰葡萄糖胺β-1,3-半乳糖基转移酶WbgO(UniProt ID D3QY14)的组成型转录单元的基因体敲入,用于产生乳-N-二糖(LNB,Gal-b1,3-GlcNAc)。在最后步骤中,将新颖菌株以表达质粒进行转化,此质粒含有选自包括SEQ ID NO:04、05、06、07、08、09、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36与37的列表的α-1,3-半乳糖基转移酶的组成型转录单元。新颖菌株在生长实验中评估Gal-a1,3-(Fuc-a1,2)-Gal-b1,3-GlcNAc的产生,依据实施例1中所提供的培养条件,于其中培养基含有30g/L蔗糖。此菌株在96孔板中以四个生物学重复生长。培养72小时后,收集培养肉汤,并以UPLC分析糖。
实施例20.以经修饰的大肠杆菌宿主的Gal-a1,3-(Fuc-a1,2)-Gal-b1,3-GlcNAc、 唾液酸化LNB与6’-SL的寡糖混合物的产生
如实施例19中所述经修饰的大肠杆菌菌株,以来自卵形拟杆菌的N-乙酰葡糖胺2-差向异构酶(AGE)(UniProt ID A7LVG6)与自脑膜炎双球菌的N-乙酰神经氨酸合成酶(NeuB)(UniProt ID E0NCD4)的基因体敲入进一步修饰,并以表达质粒进行转化,此质粒包括组成型表达单元,其包括来自曲状杆菌的N-酰基神经氨酸胞苷酸转移酶(UniProt IDQ93MP7)与来自发光杆菌的PdST6(UniProt ID O66375)。新颖菌株在生长实验中评估LNB、Gal-a1,3-(Fuc-a1,2)-Gal-b1,3-GlcNAc、唾液酸化LNB与6’-唾液酸乳糖(6’-SL)的产生,依据实施例1中所提供的培养条件,于其中培养基含有30g/L蔗糖与20g/L乳糖。此菌株在96孔板中以四个生物学重复生长。培养72小时后,收集培养肉汤,并以UPLC分析糖。
实施例21.以经修饰的大肠杆菌宿主的GalNAc-a1,3-(Fuc-a1,2)-Gal-b1,3- GlcNAc的产生
如实施例1中所述经修饰以用于GDP-岩藻糖产生与在蔗糖上生长的大肠杆菌菌株,藉由来自绿脓杆菌的4-差向异构酶WbpP(UniProt ID Q8KN66)的组成型转录单元来进一步修饰以用于UDP-GalNAc产生,并被转化,藉由第一表达质粒,其包括来自幽门螺杆菌的α-1,2-岩藻糖基转移酶HpFutC(GenBank:AAD29863.1)的组成型转录单元,以及第二兼容的表达质粒,其含有选自包括SEQ ID NO:41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99、100、101与102的列表的α-1,3-N-乙酰半乳糖胺转移酶的组成型转录单元。新颖菌株在生长实验中评估GalNAc-a1,3-(Fuc-a1,2)-Gal-b1,3-GlcNAc的产生,依据实施例1中所提供的培养条件,于其中培养基含有30g/L蔗糖与20g/L乳-N-二糖(LNB,Gal-b1,3-GlcNAc)。此菌株在96孔板中以四个生物学重复生长。培养72小时后,收集培养肉汤,并以UPLC分析糖。
实施例22.以经修饰的大肠杆菌宿主的GalNAc-a1,3-(Fuc-a1,2)-Gal-b1,3- GlcNAc的产生
如实施例1中所述经修饰以用于GDP-岩藻糖产生与在蔗糖上生长的大肠杆菌菌株,藉由来自绿脓杆菌的4-差向异构酶WbpP(UniProt ID Q8KN66)的组成型转录单元来进一步修饰以用于UDP-GalNAc产生,且被进一步转化,以nagA与nagB基因的基因体敲除与来自大肠杆菌的突变L-谷氨酰胺-D-果糖-6-磷酸转胺酶(glmS*54)(藉由A39T、R250C与G472S突变不同于野生型大肠杆菌glmS蛋白,具有UniProt ID P17169)、来自枯草杆菌的磷酸酶BsAraL(UniProt ID P94526)与来自大肠杆菌O55:H7的N-乙酰葡萄糖胺β-1,3-半乳糖基转移酶WbgO(UniProt ID D3QY14)的组成型转录单元的基因体敲入,用于产生乳-N-二糖(LNB,Gal-b1,3-GlcNAc)。在最后步骤中,将新颖菌株进一步以表达质粒进行转化,此质粒含有选自包括SEQ ID NO:41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99、100、101与102的列表的α-1,3-N-乙酰半乳糖胺转移酶的组成型转录单元。新颖菌株在生长实验中评估GalNAc-a1,3-(Fuc-a1,2)-Gal-b1,3-GlcNAc的产生,依据实施例1中所提供的培养条件,于其中培养基含有30g/L蔗糖。此菌株在96孔板中以四个生物学重复生长。培养72小时后,收集培养肉汤,并以UPLC分析糖。
实施例23.以经修饰的大肠杆菌宿主的Gal-a1,3-(Fuc-a1,2)-Gal-b1,4-GlcNAc 的产生
如实施例1中所述经修饰以用于GDP-岩藻糖产生与在蔗糖上生长的大肠杆菌菌株,被进一步转化,藉由第一表达质粒,其包括来自幽门螺杆菌的α-1,2-岩藻糖基转移酶HpFutC(GenBank:AAD29863.1)的组成型转录单元,以及一第二兼容的表达质粒,其包括选自包括SEQ ID NO:04、05、06、07、08、09、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36与37的列表的α-1,3-半乳糖基转移酶的组成型转录单元。新颖菌株在生长实验中评估Gal-a1,3-(Fuc-a1,2)-Gal-b1,4-GlcNAc的产生,依据实施例1中所提供的培养条件,于其中培养基含有30g/L蔗糖与20g/L N-乙酰乳糖胺(N-acetyllactosamine,LacNAc,Gal-b1,4-GlcNAc)。此菌株在96孔板中以四个生物学重复生长。培养72小时后,收集培养肉汤,并以UPLC分析糖。
实施例24.以经修饰的大肠杆菌宿主的Gal-a1,3-(Fuc-a1,2)-Gal-b1,4-GlcNAc 的产生
如实施例1中所述经修饰以用于GDP-岩藻糖产生与在蔗糖上生长的大肠杆菌菌株,被进一步转化,以nagA与nagB基因的基因体敲除与来自大肠杆菌的突变L-谷氨酰胺-D-果糖-6-磷酸转胺酶(glmS*54)(藉由A39T、R250C与G472S突变不同于野生型大肠杆菌glmS蛋白,具有UniProt ID P17169)、来自酿酒酵母菌的葡萄糖胺6-磷酸N-乙酰转移酶GNA1(UniProt ID P43577)、来自枯草杆菌的磷酸酶BsAraL(UniProt ID P94526)与来自脑膜炎双球菌的N-乙酰葡萄糖胺β-1,4-半乳糖基转移酶LgtB(UniProt ID Q51116)的组成型转录单元的基因体敲入,用于产生N-乙酰乳糖胺(N-acetyllactosamine,LacNAc,Gal-b1,4-GlcNAc)。在最后步骤中,将新颖菌株以一表达质粒进行转化,此质粒含有选自包括SEQ IDNO:04、05、06、07、08、09、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36与37的列表的α-1,3-半乳糖基转移酶的组成型转录单元。新颖菌株在生长实验中评估Gal-a1,3-(Fuc-a1,2)-Gal-b1,4-GlcNAc的产生,依据实施例1中所提供的培养条件,于其中培养基含有30g/L蔗糖。此菌株在96孔板中以四个生物学重复生长。培养72小时后,收集培养肉汤,并以UPLC分析糖。
实施例25.以经修饰的大肠杆菌宿主的GalNAc-a1,3-(Fuc-a1,2)-Gal-b1,4- GlcNAc的产生
如实施例1中所述经修饰以用于GDP-岩藻糖产生与在蔗糖上生长的大肠杆菌菌株,藉由来自绿脓杆菌的4-差向异构酶WbpP(UniProt ID Q8KN66)的组成型转录单元来进一步修饰以用于UDP-GalNAc产生,并被转化,藉由第一表达质粒,其包含来自幽门螺杆菌的α-1,2-岩藻糖基转移酶HpFutC(GenBank:AAD29863.1)的组成型转录单元,以及第二兼容的表达质粒,其包含选自包括SEQ ID NO:41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99、100、101与102的列表的α-1,3-N-乙酰半乳糖胺转移酶的组成型转录单元。新颖菌株在生长实验中评估GalNAc-a1,3-(Fuc-a1,2)-Gal-b1,4-GlcNAc的产生,依据实施例1中所提供的培养条件,于其中培养基含有30g/L蔗糖与20g/L N-乙酰乳糖胺(LacNAc,Gal-b1,4-GlcNAc)。此菌株在96孔板中以四个生物学重复生长。培养72小时后,收集培养肉汤,并以UPLC分析糖。
实施例26.以经修饰的大肠杆菌宿主的GalNAc-a1,3-(Fuc-a1,2)-Gal-b1,4- GlcNAc的产生
如实施例1中所述经修饰以用于GDP-岩藻糖产生与在蔗糖上生长的大肠杆菌菌株,藉由来自绿脓杆菌的4-差向异构酶WbpP(UniProt ID Q8KN66)的组成型转录单元来进一步修饰以用于UDP-GalNAc产生,且被转化,以nagA与nagB基因的基因体敲除与来自大肠杆菌的突变L-谷氨酰胺-D-果糖-6-磷酸转胺酶(glmS*54)(藉由A39T、R250C与G472S突变不同于野生型大肠杆菌glmS蛋白,具有UniProt ID P17169)、来自酿酒酵母菌的葡萄糖胺6-磷酸N-乙酰转移酶GNA1(UniProt ID P43577)、来自枯草杆菌的磷酸酶BsAraL(UniProt IDP94526)与来自脑膜炎双球菌的N-乙酰葡萄糖胺β-1,4-半乳糖基转移酶LgtB(UniProt IDQ51116)的组成型转录单元的基因体敲入,用于产生N-乙酰乳糖胺(LacNAc,Gal-b1,4-GlcNAc)。在最后步骤中,将新颖菌株进一步以表达质粒进行转化,此质粒含有选自包括SEQID NO:41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99、100、101与102的列表的α-1,3-N-乙酰半乳糖胺转移酶的组成型转录单元。新颖菌株在生长实验中评估GalNAc-a1,3-(Fuc-a1,2)-Gal-b1,4-GlcNAc的产生,依据实施例1中所提供的培养条件,于其中培养基含有30g/L蔗糖。此菌株在96孔板中以四个生物学重复生长。培养72小时后,收集培养肉汤,并以UPLC分析糖。
实施例27.以经修饰的大肠杆菌宿主的Gal-a1,3-(Fuc-a1,2)-Gal-b1,4-(Fuc- a1,3)-Glc的产生
如实施例1中所述经修饰以用于GDP-岩藻糖产生与在蔗糖上生长的大肠杆菌菌株,被进一步转化,藉由来自幽门螺杆菌的α-1,2-岩藻糖基转移酶HpFutC(GenBank:AAD29863.1)的组成型转录单元的基因体敲入,连同第一表达质粒,其包括来自幽门螺杆菌的α-1,2-岩藻糖基转移酶HpFutC(GenBank:AAD29863.1)的组成型转录单元,以及第二兼容的表达质粒,其包括选自包括SEQ ID NO:04、05、06、07、08、09、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36与37的列表的α-1,3-半乳糖基转移酶的组成型转录单元。新颖菌株在生长实验中评估Gal-a1,3-(Fuc-a1,2)-Gal-b1,4-(Fuc-a1,3)-Glc的产生,依据实施例1中所提供的培养条件,于其中培养基含有30g/L蔗糖与20g/L乳糖。此菌株在96孔板中以四个生物学重复生长。培养72小时后,收集培养肉汤,并以UPLC分析糖。
实施例28.材料与方法枯草杆菌
培养基
使用两种不同的培养基,即丰富的Luria肉汤(Luria Broth,LB)与用于摇瓶的基本培养基(minimal medium for shake flask,MMsf)。基本培养基使用微量元素混合物。
微量元素混合物由0.735g/L CaCl2.2H2O、0.1g/L MnCl2.2H2O、0.033g/LCuCl2.2H2O、0.06g/L CoCl2.6H2O、0.17g/L ZnCl2、0.0311g/L H3BO4、0.4g/L Na2EDTA.2H2O与0.06g/L Na2MoO4所组成。柠檬酸铁(Fe-citrate)溶液含有0.135g/L FeCl3.6H2O、1g/L柠檬酸钠(Na-citrate)(Hoch 1973PMC1212887)。
Luria肉汤(LB)培养基由1%胰蛋白胨(Difco,Erembodegem,Belgium)、0.5%酵母提取物(Difco)与0.5%氯化钠(VWR.Leuven,Belgium)组成。Luria肉汤琼脂(Luria Brothagar,LBA)平板由LB培养基组成,伴随添加12g/L琼脂(Difco,Erembodegem,Belgium)。
用于摇瓶的基本培养基(MMsf)实验含有2.00g/L(NH4)2SO4、7.5g/L KH2PO4、17.5g/L K2HPO4、1.25g/L柠檬酸钠、0.25g/L MgSO4.7H2O、0.05g/L色氨酸、10上至30g/L葡萄糖或其他碳源,当在实施例中指定时,包括但不限于果糖、麦芽糖、蔗糖、甘油与麦芽三糖(maltotriose)、10ml/L微量元素混合物与10ml/L柠檬酸铁溶液。以1M KOH将培养基设置pH值为7。根据实验乳糖,可添加LNB或LacNAc作为前体。
复合培养基,例如LB,藉由高压灭菌(121℃,21'),而基本培养基藉由过滤(0.22μmSartorius)进行灭菌。必要时,藉由添加抗生素(例如,吉欧霉素(zeocin)(20mg/L))使培养基具有选择性。.
菌株、质粒与突变
枯草杆菌168,可在芽孢杆菌遗传储备中心(Bacillus Genetic Stock Center)(Ohio,USA)获得。
如Yan et al.所述,构建用于经由Cre/lox的基因缺失(gene deletion)的质粒(Appl.&Environm.Microbial.,Sept 2008,p5556-5562)。如Xue et al.所述,基因破坏(Gene disruption)是经由以线性DNA的同源重组与经由电穿孔进行转化来完成(J.Microb.Meth.34(1999)183-191)。Liu et al.描述了基因敲除的方法(Metab.Engine.24(2014)61-69)。此方法使用目标基因上游与下游的1000bp同源性。
Popp et al.描述的整合载体(integrative vectors)(Sci.Rep.,2017,7,15158)使用为表达载体,必要时可进一步用于基因体整合。用于表达的合适启动子可来自从部件库(part repository,iGem):序列ID:Bba_K143012,Bba_K823000,Bba_K823002或Bba_K823003。可以使用Gibson组装(assembly)、Golden Gate组装、Cliva组装、LCR或限制性连接进行选殖(cloning)。
在产生基于乳糖的寡糖的一个例子中,枯草杆菌突变菌株被创建以包含一个编码乳糖输入子(importer)的基因(例如,具有UniProt ID P02920的大肠杆菌lacY)。对于2’FL、3FL与diFL的产生,α-1,2-及/或α-1,3-岩藻糖基转移酶表达构建体额外添加到菌株中。
在一个产生乳-N-三碳糖(LNT-II、LN3、GlcNAc-b1,3-Gal-b1,4-Glc)的例子中,枯草杆菌菌株被包含乳糖输入体子(例如,具有UniProt ID P02920的大肠杆菌lacY)与半乳糖苷β-1,3-N-乙酰葡萄糖转胺酶,例如来自脑膜炎双球菌的LgtA(GenBank:AAM33849.1)的组成型转录单元的基因体敲修饰。对于LNT产生,LN3产生菌株被以N-乙酰葡糖胺β-1,3-半乳糖基转移酶,例如来自大肠杆菌O55:H7的WbgO(UniProt ID D3QY14)的组成型转录单元进一步修饰。为了产生乳-N-新四糖(lacto-N-neotetraose,LNnT,Gal-b1,4-GlcNAc-b1,3-Gal-b1,4-Glc)进一步以N-乙酰葡萄糖胺β-1,4-半乳糖基转移酶(N-acetylglucosaminebeta-1,4-galactosyltransferase),例如来自脑膜炎双球菌的LgtB(UniProt ID Q51116)的组成型转录单元来修饰LN3产生菌株。N-乙酰葡萄糖胺β-1,3-半乳糖基转移酶与N-乙酰葡萄糖胺β-1,4-半乳糖基转移酶皆可以藉由基因体敲入或从表达质粒传递给菌株。为了产生LNFP-1与其他LNT及/或LNnT的岩藻糖基化衍生物,LNT与LNnT产生菌株可以进一步以α-1,2-岩藻糖基转移酶及/或α-1,3-岩藻糖基转移酶表达构建体进行修饰。
又,突变菌株可以α-1,3-半乳糖基转移酶,例如SEQ ID NO:3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36或37的组成型转录单元进行修饰。或者及/或另外,突变菌株可以α-1,3-N-乙酰半乳糖胺基转移酶,例如SEQ ID NO:40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、63、6、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、89、90、91、92、93、94、95、96、97、98、99、100、101或102的组成型转录单元修饰。
对于唾液酸产生,藉由过表达天然果糖-6-P-转胺酶(fructose-6-P-aminotransferase)(UniProt ID P0CI73)产生突变枯草杆菌菌株,来增强细胞内葡萄糖胺-6-磷酸池(pool)。此外,nagA、nagB与gamA基因的酶活性经由基因敲除被破坏与来自酿酒酵母菌的葡萄糖胺-6-P-转胺酶(glucosamine-6-P-aminotransferase)(UniProt IDP43577)、来自卵形拟杆菌的N-乙酰葡糖胺2-差向异构酶(UniProt ID A7LVG6)与来自曲状杆菌的N-乙酰神经氨酸合成酶(UniProt ID Q93MP9)在基因体上过表达。为了使唾液酸化寡糖产生,唾液酸产生菌株被进一步以表达构建体修饰,此表达构建体包括来自曲状杆菌的N-酰基神经氨酸胞苷酸转移酶NeuA(UniProt ID Q93MP7),与β-半乳糖苷α-2,3-唾液酸转移酶(beta-galactoside alpha-2,3-sialyltransferase),例如来自败血性巴斯德拉菌的PmultST3(UniProt ID Q9CLP3)或由具有β-半乳糖苷α-2,3-唾液酸转移酶活性的UniProt ID Q9CLP3的氨基酸残基1至268所组成的PmultST3样多肽(PmultST3-likepolypeptide)、来自脑膜炎双球菌的NmeniST3(GenBank NO.ARC07984.1)或来自败血性巴斯德拉菌subsp.multocida str.Pm70的PmultST2(GenBank NO.AAK02592.1)、β-半乳糖苷α-2,6-唾液酸转移酶(beta-galactoside alpha-2,6-sialyltransferase),例如来自发光杆菌(Photobacterium damselae)的PdST6(UniProt ID O66375)或由具有β-半乳糖苷α-2,6-唾液酸转移酶活性的UniProt ID O66375的氨基酸残基108至497所组成的PdST6样多肽(PdST6-like polypeptide)或来自发光杆菌属的菌(Photobacterium sp.)JT-ISH-224的P-JT-ISH-224-ST6(UniProt ID A8QYL1)或由具有β-半乳糖苷α-2,6-唾液酸转移酶活性的UniProt ID A8QYL1的氨基酸残基18至514组成的P-JT-ISH-224-ST6样多肽,及/或α-2,8-唾液酸转移酶(alpha-2,8-sialyltransferase),例如来自M.musculus(UniProt IDQ64689)的一个或更多的复制。
异源与同源表达
需要表达的基因,无论是来自质粒还是来自基因体,均由以下公司合成:DNA2.0、Gen9、Twist Biosciences或IDT。
根据表达宿主的密码子使用优化密码子使用,可以进一步促进表达。使用供货商的工具优化基因。
培养条件
96孔微量滴定盘实验的预培养起始于冷冻管或来自LB盘的单一菌落,于150μL LB中,并在37℃下在800rpm的定轨振荡器(orbital shaker)上隔夜培养。使用此培养物用作96孔方形微量滴定盘的接种物,以稀释400x加入400μL MMsf培养基。每个菌株在96孔板的多个孔中生长作为生物学重复。然后将这些最终的96孔培养盘于37℃在定轨振荡器上以800rpm培养72小时,或更短或更长。在培养实验结束时,从每个孔中取出样品以测量上清液浓度(细胞外糖浓度,在5分钟后使细胞旋下),或藉由将培养液在90℃下煮沸15分钟或在60℃下煮沸60分钟,然后旋下细胞(=全肉汤浓度、细胞内与细胞外糖浓度,如于此所定义)。
又,进行培养物稀释以测量于600nm的光学密度。细胞性能指数(cellperformance index)或CPI是经由将寡糖浓度除以生物量(biomass)来确定的,以相较于参考菌株的相对百分比。生物量根据经验确定为在600nm测量的光学密度的大约1/3。
实施例29.以经修饰的枯草杆菌宿主的Gal-a1,3-(Fuc-a1,2)-Gal-b1,3-GlcNAc- b1,3-Gal-b1,4-Glc的产生
首先,枯草杆菌菌株被修饰以用于LN3产生与在蔗糖上生长,藉由nagB、glmS与gamA基因的基因体敲除与包括编码来自大肠杆菌的乳糖通透酶(LacY)(UniProt IDP02920)、天然果糖-6-P-转胺酶(UniProt ID P0CI73)、来自脑膜炎双球菌菌的半乳糖苷β-1,3-N-乙酰葡萄糖胺转移酶LgtA(GenBank:AAM33849.1)、来自大肠杆菌W的蔗糖转运蛋白(CscB)(UniProt ID E0IXR1)、来自运动发酵单胞菌的果糖激酶(Frk)(UniProt IDQ03417)与来自青春双歧杆菌的蔗糖磷酸化酶BaSP(UniProt ID A0ZZH6)的基因的组成型转录单元的基因体敲入。在下一步骤中,进一步修饰突变菌株,藉由包括来自大肠杆菌O55:H7的N-乙酰葡糖胺β-1,3-半乳糖基转移酶WbgO(UniProt ID D3QY14)的组成型转录单元的基因体敲入,以产生LNT。在一随后步骤中,LNT产生菌株以表达质粒来转化,此表达质粒包括选自包括来自幽门螺旋杆菌的HpFutC(GenBank:AAD29863.1)、来自毛样短螺旋体(Brachyspira pilosicoli)的多肽(UniProt ID A0A2N5RQ26)、来自Dysgonomonas mossii的多肽(UniProt ID F8X274)、来自Dechlorosoma suillum的多肽(UniProt ID G8QLF4)、来自Desulfovibrio alaskensis的多肽(UniProt ID Q316B5)与来自Polaribacter vadi的多肽(UniProt ID A0A1B8TNT0)的列表α-1,2-岩藻糖基转移酶(alpha-1,2-fucosyltransferase),与选自包括SEQ ID NO:04、05、06、07、08、09、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36与37的列表的α-1,3-半乳糖基转移酶的组成型转录单元。新颖菌株在以包括乳糖为一前体的MMsf培养基的生长实验中评估包括LN3、LNFP-I与Gal-a1,3-LNFP-I(Gal-a1,3-(Fuc-a1,2)-Gal-b1,3-GlcNAc-b1,3-Gal-b1,4-Glc)的寡糖混合物的产生,依据实施例28中所提供的培养条件。培养72小时后,收集培养肉汤,并以UPLC分析糖。
实施例30.以一经修饰的枯草杆菌宿主的GalNAc-a1,3-(Fuc-a1,2)-Gal-b1,3-GlcNAc-b1,3-Gal-b1,4-Glc的产生
在本实施例中,如实施例29所述,对枯草杆菌菌株进行修饰以用于LNT产生与在蔗糖上生长。下一步骤中,突变LNT产生菌株被以来自绿脓杆菌的4-差向异构酶WbpP(UniProtID Q8KN66)的组成型转录单元进一步修饰,用于UDP-GalNAc的产生,并以表达质粒转化,此表达质粒包括选自包括来自幽门螺旋杆菌的HpFutC(GenBank:AAD29863.1)、来自毛样短螺旋体的多肽(UniProt ID A0A2N5RQ26)、来自Dysgonomonas mossii的多肽(UniProt IDF8X274)、来自Dechlorosoma suillum的多肽(UniProt ID G8QLF4)、来自Desulfovibrioalaskensis的多肽(UniProt ID Q316B5)与来自Polaribacter vadi的多肽(UniProt IDA0A1B8TNT0)的列表α-1,2-岩藻糖基转移酶,与选自包括SEQ ID NO:41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99、100、101与102的列表的α-1,3-N-乙酰半乳糖胺转移酶的组成型转录单元。新颖菌株在以包括乳糖为一前体的MMsf培养基的生长实验中评估GalNAc-a1,3-LNFP-I(GalNAc-a1,3-(Fuc-a1,2)-Gal-b1,3-GlcNAc-b1,3-Gal-b1,4-Glc)的产生,依据实施例28中所提供的培养条件。培养72小时后,收集培养肉汤,并以UPLC分析糖。
实施例31.以经修饰的枯草杆菌宿主的包括LNT、唾液酸化LN3、LSTa与GalNAc-a1, 3-(Fuc-a1,2)-Gal-b1,3-GlcNAc-b1,3-Gal-b1,4-Glc的寡糖混合物的产生
如实施例30所述的产生GalNAc-a1,3-LNFP-I的突变枯草杆菌菌株被进一步修饰,藉由nagA基因的基因体敲除与第二相容的表达质粒,此表达质粒包括含TRP1选择标记与来自大肠杆菌的突变L-谷氨酰胺-D-果糖-6-磷酸转胺酶(glmS*54)(不同于野生型大肠杆菌glmS,具有UniProt ID P17169,藉由A39T、R250C与G472S突变,如Deng et al.所述(Biochimie 2006,88:419-429))、一磷酸酶,例如选自包括aphA、Cof、HisB、OtsB、Sure、Yaed、YcjU、YedP、YfbT、YidA、YigB、YihX、YniC、YqaB、YrbL、AppA、Gph、SerB、YbhA、YbiV、YbjL、Yfb、YieH、YjgL、YjjG、YrfG与YbiU的大肠杆菌基因或来自恋臭假单胞菌(Pseudomonas putida)的PsMupP、来自酿酒酵母菌的ScDOG1或来自枯草杆菌(Bacillussubtilis)的BsAraL,如WO1812222所述的磷酸酶、来自卵形拟杆菌的N-乙酰葡糖胺2-差向异构酶(AGE)(UniProt ID A7LVG6)、来自脑膜炎双球菌的N-乙酰神经氨酸合成酶(NeuB)(UniProt ID E0NCD4)、来自流感嗜血杆菌的N-酰基神经氨酸胞苷酸转移酶NeuA(GenBankNO.AGV11798.1)的两个复制与来自败血性巴斯德拉菌的PmultST3多肽(UniProt IDQ9CLP3)的三个复制的组成型转录单元。新颖菌株在以包括乳糖为前体的MMsf培养基的生长实验中评估包括LN3、唾液酸化LN3、LNT、LNFP-I、2’-FL、GalNAc-a1,3-LNFP-I(GalNAc-a1,3-(Fuc-a1,2)-Gal-b1,3-GlcNAc-b1,3-Gal-b1,4-Glc)、3’-SL与LSTa(Neu5Ac-a2,3-Gal-b1,3-GlcNAc-b1,3-Gal-b1,4-Glc)的寡糖混合物的产生,依据实施例28中所提供的培养条件。培养72小时后,收集培养肉汤,并以UPLC分析糖。
实施例32.以经修饰的枯草杆菌宿主的Gal-a1,3-(Fuc-a1,2)-Gal-b1,4-Glc的产
枯草杆菌菌株被修饰用于2’-FL产生,如实施例28所述,藉由来自大肠杆菌的乳糖通透酶(LacY)(UniProt ID P02920)与来自幽门螺杆菌的α-1,2-岩藻糖基转移酶HpFutC(GenBank:AAD29863.1)的组成型转录单元的基因体敲入。在下一步骤中,突变菌株被以表达质粒转化,此表达质粒含有选自包括SEQ ID NO:04、05、06、07、08、09、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36与37的列表的α-1,3-半乳糖基转移酶的组成型转录单元。新颖菌株在以包括乳糖为前体的MMsf培养基的生长实验中评估Gal-a1,3-(Fuc-a1,2)-Gal-b1,4-Glc的产生,依据实施例28中所提供的培养条件。培养72小时后,收集培养肉汤,并以UPLC分析糖。
实施例33.以经修饰的枯草杆菌宿主的GalNAc-a1,3-(Fuc-a1,2)-Gal-b1,4- GlcNAc的产生
枯草杆菌菌株,如实施例28所述被转化,藉由表达质粒,此表达质粒包括来自幽门螺杆菌的α-1,2-岩藻糖基转移酶HpFutC(GenBank:AAD29863.1)、用于UDP-GalNAc的产生的来自绿脓杆菌的4-差向异构酶WbpP(UniProt ID Q8KN66),与选自包括SEQ ID NO:41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99、100、101与102的列表的α-1,3-N-乙酰半乳糖胺转移酶的组成型转录单元。新颖菌株在以包括乳糖为前体的MMsf培养基的生长实验中评估GalNAc-a1,3-(Fuc-a1,2)-Gal-b1,4-GlcNAc的产生,依据实施例28中所提供的培养条件。培养72小时后,收集培养肉汤,并以UPLC分析糖。
实施例34.材料与方法谷氨酸棒状杆菌
培养基
使用两种不同的培养基,即丰富的胰蛋白胨-酵母菌萃取物(tryptone-yeastextract,TY)与用于摇瓶的基本培养基。基本培养基使用1000x储备微量元素混合物。
微量元素混合物由10g/L CaCl2、10g/L FeSO4.7H2O、10g/L MnSO4.H2O、1g/LZnSO4.7H2O、0.2g/L CuSO4、0.02g/L NiCl2.6H2O、0.2g/L生物素(pH 7.0)与0.03g/L原儿茶酸(protocatechuic acid)组成。
用于摇瓶的基本培养基(MMsf)实验含有20g/L(NH4)2SO4,5g/L urea,1g/LKH2PO4,1g/L K2HPO4,0.25g/L MgSO4.7H2O,42g/L MOPS、10上至30g/L葡萄糖或其他碳源,当在实施例中指定时,包括但不限于果糖、麦芽糖、蔗糖、甘油与麦芽三糖(maltotriose)与1ml/L微量元素混合物。根据实验,可添加乳糖、LNB或LacNAc作为前体。
TY培养基由1.6%胰蛋白胨(Difco,Erembodegem,Belgium)、1%酵母菌萃取物(Difco)与0.5%氯化钠(VWR.Leuven,Belgium)组成。TY琼脂(TYA)平板由TY培养基组成,伴随添加12g/L琼脂(Difco,Erembodegem,Belgium)。
复合培养基,例如TY,藉由高压灭菌(121℃,21'),而基本培养基藉由过滤(0.22μmSartorius)进行灭菌。必要时,藉由添加抗生素(例如,卡那霉素、氨苄青霉素)使培养基具有选择性。
菌株与突变
谷氨酸棒状杆菌ATCC 13032,可自美国典型培养物保藏中心(American TypeCulture Collection)获得。
基于Suzuki et al.描述的Cre/loxP技术的整合质粒载体(Appl.Microbiol.Biotechnol.,2005Apr,67(2):225-33)与Okibe et al.描述的温度敏感穿梭载体(temperature-sensitive shuttle vectors)(Journal of MicrobiologicalMethods 85,2011,155-163)被构建以用于基因缺失、突变与插入。用于(异源)基因表达的合适启动子可以来自Yim et al.(Biotechnol.Bioeng.,2013Nov,110(11):2959-69)。可以使用Gibson组装、Golden Gate组装、Cliva组装、LCR或限制性连接进行选殖。
在产生基于乳糖的寡糖的一个例子中,谷氨酸棒状杆菌突变菌株被创建以包含一个编码乳糖输入子(importer)的基因(例如,具有UniProt ID P02920的大肠杆菌lacY)。对于2’FL、3FL与diFL的产生,α-1,2-及/或α-1,3-岩藻糖基转移酶表达构建体额外添加到菌株中。
在一个产生乳-N-三碳糖(LNT-II、LN3、GlcNAc-b1,3-Gal-b1,4-Glc)的例子中,谷氨酸棒状杆菌菌株被包含乳糖输入体子(例如,具有UniProt ID P02920的大肠杆菌lacY)与半乳糖苷β-1,3-N-乙酰葡萄糖转胺酶,例如来自脑膜炎双球菌的LgtA(GenBank:AAM33849.1)的组成型转录单元的基因体敲入修饰。对于LNT产生,LN3产生菌株被以一N-乙酰葡糖胺β-1,3-半乳糖基转移酶,例如来自大肠杆菌O55:H7的WbgO(UniProt ID D3QY14)的组成型转录单元修饰。为了产生乳-N-新四糖(lacto-N-neotetraose,LNnT,Gal-b1,4-GlcNAc-b1,3-Gal-b1,4-Glc)进一步以一N-乙酰葡萄糖胺β-1,4-半乳糖基转移酶(N-acetylglucosamine beta-1,4-galactosyltransferase),例如来自脑膜炎双球菌的LgtB(UniProt ID Q51116)的组成型转录单元来修饰LN3产生菌株。N-乙酰葡萄糖胺β-1,3-半乳糖基转移酶与N-乙酰葡萄糖胺β-1,4-半乳糖基转移酶皆可以藉由基因体敲入或从表达质粒传递给菌株。为了产生LNFP-1,LNT产生菌株可以进一步以α-1,2-岩藻糖基转移酶表达构建体进行修饰。
又,突变菌株可以α-1,3-半乳糖基转移酶,例如SEQ ID NO:3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36或37的组成型转录单元进行修饰。或者及/或另外,突变菌株可以α-1,3-N-乙酰半乳糖胺基转移酶,例如SEQ ID NO:40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、63、6、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、89、90、91、92、93、94、95、96、97、98、99、100、101或102的组成型转录单元修饰。
对于唾液酸产生,藉由过表达天然果糖-6-P-转胺酶(fructose-6-P-aminotransferase)(UniProt ID Q8NND3)产生突变谷氨酸棒状杆菌菌株,来增强细胞内葡萄糖胺-6-磷酸池(pool)。此外,nagA、nagB与gamA基因的酶活性经由基因敲除被破坏与来自酿酒酵母菌的葡萄糖胺-6-P-转胺酶(glucosamine-6-P-aminotransferase)(UniProtID P43577)、来自卵形拟杆菌的N-乙酰葡糖胺2-差向异构酶(UniProt ID A7LVG6)与来自曲状杆菌的N-乙酰神经氨酸合成酶(UniProt ID Q93MP9)在基因体上过表达。为了使唾液酸化寡糖产生,唾液酸产生菌株被进一步以表达构建体修饰,此表达构建体包括来自曲状杆菌的N-酰基神经氨酸胞苷酸转移酶NeuA酶(UniProt ID Q93MP7)、来自流感嗜血杆菌的NeuA酶(GenBank NO.AGV11798.1)或来自败血性巴斯德拉菌的NeuA酶(GenBankNO.AMK07891.1),与β-半乳糖苷α-2,3-唾液酸转移酶(beta-galactoside alpha-2,3-sialyltransferase),例如来自败血性巴斯德拉菌的PmultST3(UniProt ID Q9CLP3)或由具有β-半乳糖苷α-2,3-唾液酸转移酶活性的UniProt ID Q9CLP3的氨基酸残基1至268所组成的PmultST3样多肽(PmultST3-like polypeptide)、来自脑膜炎双球菌的NmeniST3(GenBank NO.ARC07984.1)或来自败血性巴斯德拉菌subsp.multocida str.Pm70的PmultST2(GenBank NO.AAK02592.1)、β-半乳糖苷α-2,6-唾液酸转移酶(beta-galactosidealpha-2,6-sialyltransferase),例如来自发光杆菌(Photobacterium damselae)的PdST6(UniProt ID O66375)或由具有β-半乳糖苷α-2,6-唾液酸转移酶活性的UniProt IDO66375的氨基酸残基108至497所组成的PdST6样多肽(PdST6-like polypeptide)或来自发光杆菌属的菌(Photobacterium sp.)JT-ISH-224的P-JT-ISH-224-ST6(UniProt IDA8QYL1)或由具有β-半乳糖苷α-2,6-唾液酸转移酶活性的UniProt ID A8QYL1的氨基酸残基18至514组成的P-JT-ISH-224-ST6样多肽,及/或α-2,8-唾液酸转移酶(alpha-2,8-sialyltransferase),例如来自M.musculus(UniProt ID Q64689)的一个或更多的复制。
异种与同源表达
需要表达的基因,无论是来自质粒还是来自基因体,均由以下公司合成:DNA2.0、Gen9、Twist Biosciences或IDT。
藉由针对表达宿主的密码子使用(codon usage)优化密码子使用,可以进一步促进表达。使用供货商的工具优化基因。
培养条件
96孔微量滴定盘实验的预培养起始于一冷冻管或来自TY盘的单一菌落,于150μLTY中,并在37℃下在800rpm的定轨振荡器上隔夜培养。使用此培养物用作96孔方形微量滴定盘的接种物,以稀释400x加入400μL MMsf培养基。每个菌株在96孔板的多个孔中生长作为生物学重复。然后将这些最终的96孔培养盘于37℃在定轨振荡器上以800rpm培养72小时,或更短或更长。在培养实验结束时,从每个孔中取出样品以测量上清液浓度(细胞外糖浓度,在5分钟后使细胞旋下),或藉由将培养液在90℃下煮沸15分钟或在60℃下煮沸60分钟,然后旋下细胞(=全肉汤浓度、细胞内与细胞外糖浓度,如于此所定义)。
又,进行培养物稀释以测量于600nm的光学密度。细胞性能指数或CPI是经由将于整体肉汤中测量的寡糖浓度,例如唾液乳糖浓度除以生物量来确定的,以相较于参考菌株的相对百分比。生物量根据经验确定为在600nm测量的光学密度的大约1/3。
实施例35.以经修饰的谷氨酸棒状杆菌的包括LN3、LNT、LNFP-I、2’-FL与Gal-a1, 3-(Fuc-a1,2)-Gal-b1,3-GlcNAc-b1,3-Gal-b1,4-Glc的寡糖混合物的产生
首先,谷氨酸棒状杆菌菌株被修饰以用于LN3产生与在蔗糖上生长,藉由ldh、cgl2645与nagB基因的基因体敲除与包括编码来自大肠杆菌的乳糖通透酶(LacY)(UniProtID P02920)、天然果糖-6-P-转胺酶(UniProt ID Q8NND3)、来自脑膜炎双球菌菌的半乳糖苷β-1,3-N-乙酰葡萄糖胺转移酶LgtA(GenBank:AAM33849.1)、来自大肠杆菌W的蔗糖转运蛋白(CscB)(UniProt ID E0IXR1)、来自运动发酵单胞菌的果糖激酶(Frk)(UniProt IDQ03417)与来自青春双歧杆菌的蔗糖磷酸化酶BaSP(UniProt ID A0ZZH6)的基因的组成型转录单元的基因体敲入。在下一步骤中,进一步修饰突变菌株,藉由包括来自大肠杆菌O55:H7的N-乙酰葡糖胺β-1,3-半乳糖基转移酶WbgO(UniProt ID D3QY14)的组成型转录单元的基因体敲入,以产生LNT。在随后步骤中,LNT产生菌株以表达质粒来转化,此表达质粒包括择自包括来自幽门螺旋杆菌的HpFutC(GenBank:AAD29863.1)与选自包括SEQ ID NO:04、05、06、07、08、09、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36与37的列表的α-1,3-半乳糖基转移酶的组成型转录单元。新颖菌株在以包括乳糖为前体的MMsf培养基的生长实验中评估包括LN3、LNT、LNFP-I、2’-FL与Gal-a1,3-LNFP-I(Gal-a1,3-(Fuc-a1,2)-Gal-b1,3-GlcNAc-b1,3-Gal-b1,4-Glc)的寡糖混合物的产生,依据实施例34中所提供的培养条件。培养72小时后,收集培养肉汤,并以UPLC分析糖。
实施例36.以经修饰的谷氨酸棒状杆菌的包括LN3、唾液酸化LN3LNT、3’-SL、LSTa、2’-FL与Gal-a1,3-(Fuc-a1,2)-Gal-b1,3-GlcNAc-b1,3-Gal-b1,4-Glc的寡糖混合物的产生
如实施例34所述的经修饰的谷氨酸棒状杆菌被进一步修饰,藉由gamA与nagA基因的基因体敲除连同包括天然果糖-6-P-转胺酶(UniProt ID Q8NND3)、来自酿酒酵母菌的葡萄糖胺-6-P-转胺酶(UniProt ID P43577)、来自卵形拟杆菌的N-乙酰葡糖胺2-差向异构酶(UniProt ID A7LVG6)与来自曲状杆菌的N-乙酰神经氨酸合成酶(UniProt ID Q93MP9)的组成型转录单元的基因体敲入。在下一步骤中,突变菌株被转化,以相容的表达质粒,此表达质粒包括编码来自曲状杆菌的NeuA酶(UniProt ID Q93MP7)的基因与编码来自败血性巴斯德拉菌的β-半乳糖苷α-2,3-唾液酸转移酶PmultST3(UniProt ID Q9CLP3)的基因的组成型转录单元。新颖菌株在以包括乳糖为前体的MMsf培养基的生长实验中评估包括LN3、唾液酸化LN3、LNT、LSTa、LNFP-I、2’-FL、3’-SL与Gal-a1,3-LNFP-I(Gal-a1,3-(Fuc-a1,2)-Gal-b1,3-GlcNAc-b1,3-Gal-b1,4-Glc)的寡糖混合物的产生,依据实施例34中所提供的培养条件。培养72小时后,收集培养肉汤,并以UPLC分析糖。
实施例37.以经修饰的谷氨酸棒状杆菌的Gal-a1,3-(Fuc-a1,2)-Gal-b1,3-GlcNAc的产生
首先,野生型谷氨酸棒状杆菌菌株被修饰,藉由谷氨酸棒状杆菌基因ldh、cgl2645、nagB与glmS的基因体敲除,连同包括编码来自大肠杆菌W的蔗糖转运蛋白(CscB)(UniProt ID E0IXR1)、来自运动发酵单胞菌的果糖激酶(Frk)(UniProt ID Q03417)与来自青春双歧杆菌的蔗糖磷酸化酶BaSP(UniProt ID A0ZZH6)、天然果糖-6-P-转胺酶(UniProt ID Q8NND3)、来自大肠杆菌的突变L-谷氨酰胺-D-果糖-6-磷酸转胺酶glmS*54(不同于野生型大肠杆菌glmS蛋白,具有UniProt ID P17169,藉由A39T、R250C与G472S突变)、来自酿酒酵母菌的葡萄糖胺6-磷酸N-乙酰转移酶GNA1(UniProt ID P43577)、来自枯草杆菌的磷酸酶BsAraL(UniProt ID P94526)与来自大肠杆菌O55:H7的WbgO(UniProt IDD3QY14)的组成型转录单元的基因体敲入,以产生LNB。在下一步骤中,突变菌株以表达质粒来转化,此表达质粒包括来自幽门螺旋杆菌的α-1,2-岩藻糖基转移酶HpFutC(GenBank:AAD29863.1)与选自包括SEQ ID NO:SEQ ID NO:04、05、06、07、08、09、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36与37的列表的α-1,3-半乳糖基转移酶的基因的组成型转录单元的基因体敲入。新颖菌株在以包括乳糖为一前体的MMsf培养基的生长实验中评估Gal-a1,3-(Fuc-a1,2)-Gal-b1,3-GlcNAc的产生,依据实施例34中所提供的培养条件。培养72小时后,收集培养肉汤,并以UPLC分析糖。
实施例38.以经修饰的谷氨酸棒状杆菌的GalNAc-a1,3-(Fuc-a1,2)-Gal-b1,3-GlcNAc的产生
首先,野生型谷氨酸棒状杆菌菌株被修饰,藉由谷氨酸棒状杆菌基因ldh、cgl2645、nagB与glmS的基因体敲除,连同包括编码来自大肠杆菌W的蔗糖转运蛋白(CscB)(UniProt ID E0IXR1)、来自运动发酵单胞菌的果糖激酶(Frk)(UniProt ID Q03417)与来自青春双歧杆菌的蔗糖磷酸化酶BaSP(UniProt ID A0ZZH6)、来自绿脓杆菌的WbpP(UniProt ID Q8KN66)、天然果糖-6-P-转胺酶(UniProt ID Q8NND3)、来自大肠杆菌的突变L-谷氨酰胺-D-果糖-6-磷酸转胺酶glmS*54(不同于野生型大肠杆菌glmS蛋白,具有UniProt ID P17169,藉由A39T、R250C与G472S突变)、来自酿酒酵母菌的葡萄糖胺6-磷酸N-乙酰转移酶GNA1(UniProt ID P43577)、来自枯草杆菌的磷酸酶BsAraL(UniProt IDP94526)与来自大肠杆菌O55:H7的WbgO(UniProt ID D3QY14)的组成型转录单元的基因体敲入,以产生LNB。在下一步骤中,突变菌株以表达质粒来转化,此表达质粒包括来自幽门螺旋杆菌的α-1,2-岩藻糖基转移酶HpFutC(GenBank:AAD29863.1)与选自包括SEQ ID NO:41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99、100、101与102的列表的α-1,3-N-乙酰半乳糖胺转移酶的基因的组成型转录单元的基因体敲入。新颖菌株在以包括乳糖为前体的MMsf培养基的生长实验中评估GalNAc-a1,3-(Fuc-a1,2)-Gal-b1,3-GlcNAc的产生,依据实施例34中所提供的培养条件。培养72小时后,收集培养肉汤,并以UPLC分析糖。
实施例39.材料与方法莱茵衣藻(Chlamydomonas reinhardtii)
培养基
莱茵衣藻细胞在Tris-醋酸-磷酸盐(Tris-acetate-phosphate,TAP)培养基(pH7.0)中培养。TAP培养基使用1000x储备Hutner’s微量元素混合物。Hutner’s微量元素混合物包括50g/L Na2EDTA.H2O(Titriplex III)、22g/L ZnSO4.7H2O、11.4g/L H3BO3、5g/LMnCl2.4H2O、5g/L FeSO4.7H2O、1.6g/L CoCl2.6H2O、1.6g/L CuSO4.5H2O与1.1g/L(NH4)6MoO3
TAP培养基含有2.42g/L Tris(三羟甲基胺基甲烷(Tris(tris(hydroxymethyl)aminomethane)))、25mg/L盐储备溶液、0.108g/L K2HPO4、0.054g/L KH2PO4与1.0mL/L冰醋酸(glacial acetic acid)。盐储备溶液由15g/L NH4CL、4g/L MgSO4.7H2O与2g/LCaCl2.2H2O组成。作为糖类合成的前体,可以添加前体如半乳糖、葡萄糖、果糖、岩藻糖、GlcNAc、LNB及/或LacNAc。培养基藉由高压灭菌(121℃,21’)灭菌。对于在琼脂斜面上的原种培养(stock cultures),使用含有1%琼脂(纯化高强度,1000g/cm2)的TAP培养基。
菌株、质粒与突变
莱茵衣藻野生型菌株21gr(CC-1690,野生型,mt+)、6145C(CC-1691,野生型,mt-)、CC-125(137c,野生型,mt+)、CC-124(137c,野生型,mt-),可从美国明尼苏达大学(University of Minnesota,U.S.A)衣藻资源中心(Chlamydomonas Resource Center)(https://www.chlamycollection.org)获得。
表达质粒来源于pSI103,可从衣藻资源中心获得。可以使用Gibson组装、GoldenGate组装、Cliva组装、LCR或限制性连接进行选殖。用于(异源)基因表达的合适启动子可以源自例如Scranton et al.(Algal Res.2016,15:135-142)。可以使用Crispr-Cas技术进行目标基因修饰(如基因敲除或基因置换),例如Jiang et al.(Eukaryotic Cell 2014,13(11):1465-1469)所述。
藉由电穿孔进行转化,如Wang et al.(Biosci.Rep.2019,39:BSR2018210)所述。细胞在液体TAP培养基中在恒定通气与具8000Lx的光强度的连续光照下生长,直到细胞密度达到1.0-2.0×107个细胞/mL。然后,将细胞以1.0×106个细胞/mL的浓度接种到新鲜的液体TAP培养基中,并在连续光照下生长18-20小时,直至细胞密度达到4.0×106个细胞/mL。接着,经由在室温于1250g离心5分钟收集细胞,以含有60mM山梨糖醇(Sigma,U.S.A.)的预冷(pre-chilled)液体TAP培养基洗涤并重新悬浮,并冰冻10分钟。然后,将250μL细胞悬浮液(对应于5.0×107个细胞)放入具有100ng质粒DNA(400ng/mL)的预冷的0.4cm电穿孔比色管(cuvette)中。使用BTX ECM830电穿孔装置(1575Ω,50μFD)以6个500V的脉冲进行电穿孔,每个脉冲具有4ms的脉冲长度与100ms的脉冲间隔时间。电穿孔后,立即将比色管置于冰上10分钟。最后,将细胞悬浮液转移到含有具有60mM山梨糖醇的10mL新鲜液体TAP培养基的50ml锥形离心管中,以在昏暗的光线下藉由缓慢摇动隔夜恢复。隔夜恢复后,重新收集细胞并以淀粉包埋法(starch embedding method)制成平板至含有氨苄青霉素(100mg/L)或氯霉素(100mg/L)的选择性1.5%(w/v)琼脂-TAP平板上。然后将平板在23+-0.5℃在具8000Lx的光强度的连续照明下培养。5-7天后分析细胞。
在一个产生UDP-半乳糖的例子中,莱茵衣藻细胞被修饰,藉由包括编码来自阿拉伯芥(Arabidopsis thaliana)的半乳糖激酶(galactokinase)(KIN,UniProt ID Q9SEE5)与来自阿拉伯芥的UDP-糖焦磷酸化酶(UDP-sugar pyrophosphorylase,USP)(UniProt IDQ9C5I1)的基因的转录单元。
在产生UDP-N-乙酰半乳糖胺的一个例子中,莱茵衣藻细胞被以包括来自绿脓杆菌血清型(serotype)O6的UDP-N-乙酰葡萄糖胺4-差向异构酶wbpP(UniProt ID Q8KN66)的转录单元修饰。
在产生LNB的一个例子中,为产生UDP-半乳糖而被修饰的莱茵衣藻细胞进一步以包括来自大肠杆菌O55:H7的N-乙酰葡糖胺β-1,3-半乳糖基转移酶WbgO(UniProt IDD3QY14)的转录单元的一表达质粒来修饰。在产生LacNAc的一个例子中,为产生UDP-半乳糖而被修饰的莱茵衣藻细胞进一步以包括来自脑膜炎双球菌的N-乙酰葡萄糖胺β-1,4-半乳糖基转移酶LgtB(UniProt ID Q51116)的转录单元的表达质粒来修饰。
此外,突变的莱茵衣藻细胞可被表达载体修饰,此表达质粒包括α-1,2-岩藻糖基转移酶、α-1,3-岩藻糖基转移酶、选自包括SEQ ID NO:04、05、06、07、08、09、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36与37的列表的α-1,3-半乳糖基转移酶及/或α-1,3-N-乙酰半乳糖胺转移酶,例如SEQ ID NO:40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99、100、101或102的转录单元。
在CMP-唾液酸合成的一个例子中,莱茵衣藻细胞被修饰,藉由UDP-N-乙酰葡萄糖胺-2-差向异构酶(UDP-N-acetylglucosamine-2-epimerase)/N-乙酰甘露糖胺激酶(N-acetylmannosamine kinase),例如来自智人(Homo sapiens)的GNE(UniProt ID Q9Y223)或包括R263L突变的人类GNE多肽的突变形式、N-酰基神经氨酸-9-磷酸合成酶(N-acylneuraminate-9-phosphate synthetase),例如来自智人的NANS(UniProt ID Q9NR45)与N-酰基神经氨酸胞苷酰转移酶(N-acylneuraminate cytidylyltransferase),例如来自智人的CMAS(UniProt ID Q8NFW8)的组成型转录单元。在产生唾液酸化寡糖的一个例子中,莱茵衣藻细胞被修饰,藉由CMP-唾液酸转运蛋白,例如来自小鼠(Mus musculus)的CST(UniProt ID Q61420),以及选自物种,例如智人、家鼠、褐家鼠(Rattus norvegicus)的高基定位的唾液基转移酶(Golgi-localised sialyltransferase)。
异源与同源表达
需要表达的基因,无论是来自质粒还是来自基因体,均由以下公司合成:DNA2.0、Gen9、Twist Biosciences或IDT。
藉由针对表达宿主的密码子使用(codon usage)优化密码子使用,可以进一步促进表达。使用供货商的工具优化基因。
培养条件
莱茵衣藻的细胞在选择性TAP-琼脂平板上,于23+/-0.5℃,在具8000Lx的光照强度的14/10h光/黑循环下培养。培养5至7天后分析细胞。
对于高密度培养,细胞可以在封闭系统中培养,例如垂直或水平管光生物反应器(vertical or horizontal tube photobioreactors)、搅拌罐光生物反应器(stirredtank photobioreactors)或平板光生物反应器(flat panel photobioreactors),如Chenet al.(Bioresour.Technol.2011,102:71-81)与Johnson et al.(Biotechnol.Prog.2018,34:811-827)所述。
实施例40.在一突变的莱茵衣藻细胞的Gal-a1,3-(Fuc-a1,2)-Gal-b1,4-GlcNAc 的产生
如实施例39所述设计莱茵衣藻细胞以产生UDP-Gal,藉由包括编码半乳糖激酶(KIN,UniProt ID Q9SEE5)与UDP-糖焦磷酸化酶(USP)(UniProt ID Q9C5I1)的阿拉伯芥基因的组成型转录单元的基因体敲入。在下一步骤中,突变菌株以表达质粒来转化,此表达质粒包括自脑膜炎双球菌的N-乙酰葡糖胺β-1,4-半乳糖基转移酶LgtB(UniProt IDQ51116)、来自幽门螺旋杆菌的α-1,2-岩藻糖基转移酶HpFutC(GenBank:AAD29863.1)与选自包括SEQ ID NO:04、05、06、07、08、09、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36与37的列表的α-1,3-半乳糖基转移酶的组成型转录单元。新颖藻株在以包括乳糖与GlcNAc为前体的TAP-琼脂平板的培养实验中评估,依据实施例39中所提供的培养条件。培养5天后,收集细胞,并以UPLC分析Gal-a1,3-(Fuc-a1,2)-Gal-b1,4-GlcNAc的产生。
实施例41.在突变的莱茵衣藻细胞的GalNAc-a1,3-(Fuc-a1,2)-Gal-b1,4-GlcNAc 的产生
如实施例39所述设计莱茵衣藻细胞以产生UDP-Gal,藉由包括编码半乳糖激酶(KIN,UniProt ID Q9SEE5)与UDP-糖焦磷酸化酶(USP)(UniProt ID Q9C5I1)的阿拉伯芥基因的组成型转录单元的基因体敲入。在下一步骤中,突变菌株以表达质粒来转化,此表达质粒包括自脑膜炎双球菌的N-乙酰葡糖胺β-1,4-半乳糖基转移酶LgtB(UniProt IDQ51116)、来自幽门螺旋杆菌的α-1,2-岩藻糖基转移酶HpFutC(GenBank:AAD29863.1)、来自绿脓杆菌的4-差向异构酶WbpP(UniProt ID Q8KN66),用于UDP-GalNAc产生,与选自包括SEQ ID NO:40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99、100、101与102的列表的α-1,3-N-乙酰半乳糖胺转移酶的转录单元。新颖藻株在以包括乳糖与GlcNAc为前体的TAP-琼脂平板的培养实验中评估,依据实施例39中所提供的培养条件。培养5天后,收集细胞,并以UPLC分析GalNAc-a1,3-(Fuc-a1,2)-Gal-b1,4-GlcNAc的产生。
实施例42.材料与方法动物细胞
来自不同哺乳动物的脂肪组织(adipose tissue)的间叶系干细胞(mesenchymal stem cells)的分离
新鲜脂肪组织获自屠宰场(如牛、猪、绵羊、鸡、鸭、鲶鱼、蛇、青蛙)或抽脂(如,若为人类,则为知情同意后)并保存在补充有抗生素的磷酸盐缓冲盐水中。执行脂肪组织的酶消化,然后离心以分离间叶系干细胞。将分离的间叶系干细胞转移到细胞培养瓶中并在标准生长条件,例如37℃、5%CO2下生长。初始培养基包括DMEM-F12、RPMI与Alpha-MEM培养基(补充15%胎牛血清)与1%抗生素。在第一次继代(passage)后,随后将培养基替换为10%FBS(胎牛血清)补充的培养基。例如,Ahmad与Shakoori(2013,Stem Cell Regen Med.9(2):29-36),其出于所有目的通过引用整体并入于此,描述了于此所述方法的某些变体于此例子中。
来自牛奶的间叶系干细胞的分离
此实施例说明了在无菌条件下从人类或任何其他哺乳动物,如于此所述,所收集的乳汁的间叶系干细胞的分离。将等体积的磷酸盐缓冲盐水加入稀释的牛奶中,然后离心20分钟。将细胞团块(pellet)以磷酸盐缓冲盐水洗涤三次,然后在标准培养条件下将细胞接种于细胞培养瓶中于补充有10%胎牛血清与1%抗生素的DMEM-F12、RPMI与Alpha-MEM培养基中。例如,Hassiotou et al.(2012,Stem Cells.30(10):2164-2174),出于所有目的将其通过引用整体并入于此,描述了于此所述方法的某些变体于此例子中。
使用2D与3D培养系统的干细胞的分化
分离的间叶细胞可在2D与3D培养系统中分化为乳腺样上皮细胞与管腔细胞(mammary-like epithelial and luminal cells)。例如,参见Huynh et al.1991.ExpCell Res.197(2):191 -199;Gibson et al.1991,In Vitro Cell Dev Biol Anim.27(7):585-594;Blatchfordetal.1999;Animal Cell Technology’:Basic&Applied Aspects,Springer,Dordrecht.141-145;Williams et al.2009,Breast Cancer Res11(3):26-43;与Arevalo et al.2015,Am J Physiol Cell Physiol.310(5):C348-C356;出于所有目的,其中的各个均通过引用整体并入于此。
对于2D培养,分离的细胞最初接种在培养盘中,于补充有10ng/ml上皮生长因子与5pg/ml胰岛素的生长培养基中。在满盘(confluence)时,以补充有2%胎牛血清、1%青霉素-链霉素(penicillin-streptomycin)(100U/ml青霉素、100ug/ml链霉素)与5pg/ml胰岛素的生长培养基喂养细胞48小时。为了诱导分化,以含有5pg/ml胰岛素、1pg/ml氢皮质酮(hydrocortisone)、0.65ng/ml三碘甲腺氨酸(triiodothyronine)、100nM地塞米松(dexamethasone)与1pg/ml泌乳素(prolactin)的完全生长培养基喂养细胞。于24小时后,从完全诱导培养基中除去血清。
对于3D培养,分离的细胞被胰蛋白酶消化,在基质胶(Matrigel)、透明质酸或超低附着表面培养盘(ultra-low attachment surface culture plates)中培养6天,并藉由添加补充有10ng/ml上皮生长因子与5pg/ml胰岛素的生长培养基诱导分化与乳酸盐。在满盘时,以补充有2%胎牛血清、1%青霉素-链霉素(penicillin-streptomycin)(100U/ml青霉素、100ug/ml链霉素)与5pg/ml胰岛素的生长培养基喂养细胞48小时。为了诱导分化,以含有5pg/ml胰岛素、1pg/ml氢皮质酮、0.65ng/ml三碘甲腺氨酸、100nM地塞米松与1pg/ml泌乳素的完全生长培养基喂养细胞。于24小时后,从完全诱导培养基中除去血清。
制作乳腺样细胞的方法
藉由以编码Oct4、Sox2、Klf4与c-Myc的病毒载体重新编程(reprogramming),使哺乳动物细胞被带入诱导的多能性(induced pluripotency)。然后,将所产生的经重新编程细胞培养于Mammocult培养基(可自Stem Cell Technologies获得)或乳腺细胞丰富培养基(mammary cell enrichment media)(DMEM、3%FBS、雌激素(estrogen)、孕酮(progesterone)、肝素(heparin)、氢皮质酮、胰岛素、EGF)中,使其为乳腺样(mammary-like),从其可以诱导选择乳成分的表达。或者,表观遗传(epigenetic)重塑(remodelling)为使用重塑系统,如CRISPR/Cas9来进行,以激活感兴趣的选择基因,如酪蛋白、a-乳白蛋白(a-lactalbumin)组成型(constitutively on),以允许其各自的蛋白质表达,及/或向下调控及/或敲除选择的内源基因,如于WO21067641中所述,出于所有目的,经由引用将其整体并入于此。
培养
完全生长培养基(completed growth media)包括高葡萄糖DMEM/F12、10%FBS、1% NEAA、1%pen/strep、1% ITS-X、1% F-Glu、10ng/ml EGF与5pg/ml氢皮质酮。完全泌乳培养基(completed lactation media)包括高糖DMEM/F12、1%NEAA、1%pen/strep、1%ITS-X、1%F-Glu、10ng/ml EGF、5pg/ml氢皮质酮与1pg/ml泌乳素(5ug/ml于Hyunh 1991)。将细胞以20,000个细胞/cm2的密度接种至胶原蛋白涂覆烧瓶于完全生长培养基中,并使其在完全生长培养基中粘附与扩增48小时,然后将培养基切换为完全泌乳培养基。曝露于泌乳培养基后,细胞开始分化并停止生长。在大约一周内,细胞开始将泌乳产物,如乳脂(milklipids)、乳糖、酪蛋白与乳清(whey)分泌至培养基中。可以藉由超过滤浓缩或稀释来达成泌乳培养基的所需浓度。泌乳培养基的所需盐平衡可以藉由透析来达成,例如,从培养基中去除不需要的代谢产物。使用的荷尔蒙与其他生长因子可以藉由树脂纯化被选择性地萃取,例如使用镍树脂(nickel resins)去除带组氨酸标签的生长因子,以进一步降低乳酸产品(lactated product)中的污染物程度。
实施例43.于非乳腺成体干细胞(non-mammary adult stem cell)中的Gal-a1,3- LNFP-I(Gal-a1,3-(Fuc-a1,2)-Gal-b1,3-GlcNAc-b1,3-Gal-b1,4-Glc)的制作
如实施例42所述的分离的间叶细胞与重新编程为乳腺样细胞,藉由CRISPR-CAS修饰,以过表达来自智人的GDP-岩藻糖合酶GFUS(UniProt ID Q13630)、人类半乳糖苷α-1,2-岩藻糖基转移酶FUT1(UniProt ID P19526)与密码子优化的选自包括SEQ ID NO:04、05、06、07、08、09、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36与37的列表的α-1,3-半乳糖基转移酶。将细胞以20,000个细胞/cm2的密度接种至胶原蛋白涂覆烧瓶于完全生长培养基中,并使其在完全生长培养基中粘附与扩增48小时,然后将培养基切换为完全泌乳培养基约7天。如实施例42中所述培养后,对细胞进行UPLC以分析Gal-a1,3-LNFP-I(Gal-a1,3-(Fuc-a1,2)-Gal-b1,3-GlcNAc-b1,3-Gal-b1,4-Glc)的产生。
实施例44.于非乳腺成体干细胞中的GalNAc-a1,3-(Fuc-a1,2)-Gal-b1,4-Glc的 制作
如实施例42所述的分离的间叶细胞与重新编程为乳腺样细胞,藉由CRISPR-CAS修饰,以过表达来自智人的GDP-岩藻糖合酶GFUS(UniProt ID Q13630)、人类半乳糖苷α-1,2-岩藻糖基转移酶FUT1(UniProt ID P19526)与密码子优化的选自包括SEQ ID NO:41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99、100、101与102的列表的α-1,3-N-乙酰半乳糖胺转移酶。将细胞以20,000个细胞/cm2的密度接种至胶原蛋白涂覆烧瓶于完全生长培养基中,并使其在完全生长培养基中粘附与扩增48小时,然后将培养基切换为完全泌乳培养基约7天。如实施例42中所述培养后,对细胞进行UPLC以分析GalNAc-a1,3-(Fuc-a1,2)-Gal-b1,4-Glc。
实施例45.于非乳腺成体干细胞中的包括Gal-a1,3-(Fuc-a1,2)-Gal-b1,4-Glc、 2’-FL与3’-SL的寡糖混合物的制作
如实施例42所述的分离的间叶细胞与重新编程为乳腺样细胞,藉由CRISPR-CAS修饰,以过表达来自智人的GDP-岩藻糖合酶GFUS(UniProt ID Q13630)、人类半乳糖苷α-1,2-岩藻糖基转移酶FUT1(UniProt ID P19526)、密码子优化的选自包括SEQ ID NO:04、05、06、07、08、09、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36与37的列表的α-1,3-半乳糖基转移酶、来自小鼠的N-酰基神经氨酸胞苷酰转移酶(N-acylneuraminate cytidylyltransferase)(UniProt ID Q99KK2)与来自智人的CMP-N-乙酰神经氨酸-β-1,4-半乳糖苷α-2,3-唾液酸转移酶(CMP-N-acetylneuraminate-beta-1,4-galactoside alpha-2,3-sialyltransferase)ST3GAL3(UniProt ID Q11203)。将细胞以20,000个细胞/cm2的密度接种至胶原蛋白涂覆烧瓶于完全生长培养基中,并使其在完全生长培养基中粘附与扩增48小时,然后将培养基切换为完全泌乳培养基约7天。如实施例42中所述培养后,对细胞进行UPLC以分析2’-FL、3’-SL与Gal-a1,3-(Fuc-a1,2)-Gal-b1,4-Glc的产生。I
实施例46.在经修饰的大肠杆菌宿主中基于GalNAc-a1,3-(Fuc-a1,2)-Gal-b1,3- GlcNAc-b1,3-Gal-b1,4-Glc的产生的膜转运蛋白的表达的评估
实施例9、10、11与12中描述的经修饰的大肠杆菌宿主被进一步修饰,藉由异源膜转运蛋白的组成型转录单元的基因体敲入,此异源膜转运蛋白,选自包括来自莫金斯克罗诺杆菌的MdfA(UniProt ID A0A2T7ANQ9)、来自杨氏柠檬酸杆菌的MdfA(UniProt IDD4BC23)、来自大肠杆菌的MdfA(UniProt ID P0AEY8)、来自雷克斯堡约克氏菌的MdfA(UniProt ID G9Z5F4)、来自大肠杆菌的iceT(Uni0bactrot4L A20T)与来自杨氏柠檬酸杆菌的iceT(UniProt ID D4B8A6)的列表。新颖菌株,各表达所述异源性膜转运蛋白之一,在生长实验中被评估,依据实施例1中所提供的培养条件,于其中培养基含有30g/L蔗糖与20g/L乳糖。各菌株在96孔板中以四个生物学重复生长。培养72小时后,收集培养肉汤(即,细胞外与细胞内部分)连同分别细胞外与细胞内部分,并以UPLC分析糖。
实施例47.在经修饰的大肠杆菌宿主中膜转运蛋白的表达的评估
实施例16与20中描述的经修饰的大肠杆菌宿主被进一步修饰,藉由一膜转运蛋白的组成型转录单元的基因体敲入,此膜转运蛋白,选自包括来自莫金斯克罗诺杆菌的MdfA(UniProt ID A0A2T7ANQ9)、来自杨氏柠檬酸杆菌的MdfA(UniProt ID D4BC23)、来自大肠杆菌的MdfA(UniProt ID P0AEY8)、来自雷克斯堡约克氏菌的MdfA(UniProt ID G9Z5F4)、来自大肠杆菌的iceT(UniProt ID A0A024L207)、来自杨氏柠檬酸杆菌的iceT(UniProt IDD4B8A6)、来自大肠杆菌O6:H1的nanT(UniProt ID Q8FD59)、来自大肠杆菌O157:H7的nanT(UniProt ID Q8X9G8)、来自E.albertii的nanT(UniProt ID B1EFH1)、来自大肠杆菌的EntS(UniProt ID P24077)、来自抗坏血酸克吕沃尔菌的EntS(UniProt ID A0A378GQ13)、来自肠道沙门氏菌(Salmonella enterica)subsp.arizonae的EntS(UniProt IDA0A6Y2K4E8)、来自大肠杆菌的SetA(UniProt ID P31675)、来自大肠杆菌的SetB(UniProtID P33026)、来自大肠杆菌的SetC(UniProt ID P31436)、来自大肠杆菌的oppF(UniProtID P77737),来自乳酸链球菌(Lactococcus lactis)subsp.lactis bv.Diacetylactis的lmrA(UniProt ID A0A1V0NEL4)与来自婴儿长双歧杆菌亚种(Bifidobacterium longumsubsp.Infantis)的Blon_2475(UniProt ID B7GPD4)的列表。新颖菌株,各表达所述异源性膜转运蛋白,在生长实验中被评估,依据实施例1中所提供的培养条件,于其中培养基含有30g/L蔗糖与20g/L乳糖。各菌株在96孔板中以四个生物学重复生长。培养72小时后,收集培养肉汤(即,细胞外与细胞内部分)连同分别细胞外与细胞内部分,并以UPLC分析糖。
序列表
<110> 因比奥斯公司(Inbiose N.V.)
<120> α-1,3糖基化形式的Fuc-a1,2-Gal-R的产生
<130> P22H77839A
<160> 102
<170> PatentIn version 3.5
<210> 1
<211> 9
<212> PRT
<213> 人工序列
<220>
<223> motif 1
<220>
<221> UNSURE
<222> (2)..(2)
<223> Xaa可为任何自然发生氨基酸
<220>
<221> VARIANT
<222> (3)..(3)
<223> Xaa可为Phe, His, Met, Gln or Thr
<220>
<221> UNSURE
<222> (4)..(4)
<223> Xaa可为任何自然发生氨基酸
<220>
<221> UNSURE
<222> (6)..(7)
<223> Xaa可为任何自然发生氨基酸
<220>
<221> VARIANT
<222> (8)..(9)
<223> Xaa可为Ala, Cys or Gly
<400> 1
Tyr Xaa Xaa Xaa Ala Xaa Xaa Xaa Xaa
1 5
<210> 2
<211> 9
<212> PRT
<213> 人工序列
<220>
<223> motif 2
<220>
<221> UNSURE
<222> (2)..(2)
<223> Xaa可为任何自然发生氨基酸
<220>
<221> UNSURE
<222> (4)..(4)
<223> Xaa可为任何自然发生氨基酸
<220>
<221> UNSURE
<222> (6)..(7)
<223> Xaa可为任何自然发生氨基酸
<220>
<221> VARIANT
<222> (8)..(9)
<223> Xaa可为Ala, Cys或Gly
<400> 2
Tyr Xaa Gln Xaa Cys Xaa Xaa Xaa Xaa
1 5
<210> 3
<211> 234
<212> PRT
<213> 大肠杆菌K-12 MG1655
<400> 3
Met Val Ile Asn Ile Phe Tyr Ile Cys Thr Gly Glu Tyr Lys Arg Phe
1 5 10 15
Phe Asp Lys Phe Tyr Leu Ser Cys Glu Asp Lys Phe Ile Pro Glu Phe
20 25 30
Gly Lys Lys Tyr Tyr Val Phe Thr Asp Ser Asp Arg Ile Tyr Phe Ser
35 40 45
Lys Tyr Leu Asn Val Glu Val Ile Asn Val Glu Lys Asn Cys Trp Pro
50 55 60
Leu Asn Thr Leu Leu Arg Phe Ser Tyr Phe Leu Lys Val Ile Asp Lys
65 70 75 80
Leu Gln Thr Asn Ser Tyr Thr Phe Phe Phe Asn Ala Asn Ala Val Ile
85 90 95
Val Lys Glu Ile Pro Phe Ser Thr Phe Met Glu Ser Asp Leu Ile Gly
100 105 110
Val Ile His Pro Gly Tyr Lys Asn Arg Ile Ser Ile Leu Tyr Pro Trp
115 120 125
Glu Arg Arg Lys Asn Ala Thr Cys Tyr Leu Gly Tyr Leu Lys Lys Gly
130 135 140
Ile Tyr Tyr Gln Gly Cys Phe Asn Gly Gly Lys Thr Ala Ser Phe Lys
145 150 155 160
Arg Leu Ile Gln Ile Cys Asn Met Met Thr Met Ala Asp Leu Lys Lys
165 170 175
Asn Leu Ile Ala Lys Val His Asp Glu Ser Tyr Leu Asn Tyr Tyr Tyr
180 185 190
Tyr Tyr Asn Lys Pro Leu Leu Leu Ser Glu Leu Tyr Ser Trp Pro Glu
195 200 205
Lys Tyr Gly Glu Asn Lys Asp Ala Lys Ile Ile Met Arg Asp Lys Glu
210 215 220
Arg Glu Ser Trp Tyr Gly Asn Ile Lys Lys
225 230
<210> 4
<211> 277
<212> PRT
<213> Pasteurella mairii
<400> 4
Met Ala Lys Val Ala Ile Leu Tyr Ile Ala Thr Gly Arg Tyr Ile Val
1 5 10 15
Phe Trp Glu His Phe Tyr Arg Ser Ala Glu Lys Phe Leu Leu Pro Lys
20 25 30
Ser Asp Lys His Tyr Phe Val Phe Thr Asp Ser Pro His Ile Leu Gly
35 40 45
Glu Asp His Ser Asn Val Thr Arg Ile Glu Gln Lys Lys Leu Gly Trp
50 55 60
Pro Tyr Asp Thr Leu Met Arg Phe Asp Ile Phe Leu Ser Ile Arg Glu
65 70 75 80
Thr Leu Glu Asn Phe Asp Tyr Ile Tyr Phe Phe Asn Gly Asn Ser Glu
85 90 95
Ile Leu Val Glu Val Asn Glu Ser Glu Phe Leu Pro Leu Glu Asp Asn
100 105 110
Tyr Asn Leu Val Phe Thr His Gln Pro His Met Phe His Leu Ser Lys
115 120 125
Arg Arg Phe Thr Tyr Asp Arg Asn Pro Glu Ser Cys Ala Tyr Ile Pro
130 135 140
Gln Gly Gly Gly Lys Tyr Tyr Phe Thr Gly Ala Leu Asn Gly Gly Lys
145 150 155 160
Ala Lys Tyr Tyr Leu Glu Met Cys Glu Lys Leu Ser Gln Asn Thr His
165 170 175
Thr Asp Leu Glu Lys Asn Ile Ile Ala Arg Trp His Asp Glu Ser His
180 185 190
Leu Asn Arg Tyr Ala Ile Gly Arg Met Asp Ile Lys Ile Leu Pro Pro
195 200 205
Tyr Phe Thr Arg Ser Glu Ser Glu Lys Trp Lys Thr Ser Ala Lys Ile
210 215 220
Met Phe Ser Asp Lys Thr His Tyr Arg Phe Gly Gly His Ala Tyr Leu
225 230 235 240
Arg Gly Glu Ser Glu Asn Lys Ile Thr Pro Thr Glu Trp Glu Glu Lys
245 250 255
Tyr Lys Asn Lys Lys Arg Arg Phe Ser Phe Arg Ile Lys Gln Tyr Ile
260 265 270
Lys Ser Trp Phe Leu
275
<210> 5
<211> 286
<212> PRT
<213> Acinetobacter bereziniae
<400> 5
Met Arg Asp Glu Val Lys Leu Pro Lys Tyr Ser Val Ala Ile Leu Tyr
1 5 10 15
Ile Ala Thr Gly Arg Tyr Asn Ile Phe Trp Glu Tyr Phe Tyr Lys Ser
20 25 30
Ala Glu Gln Phe Leu Leu Lys Asp Cys Glu Lys His Phe Phe Ile Phe
35 40 45
Thr Asp Ser Val Glu Pro Met Val Gly Glu Gly Gln Lys Asn Val Thr
50 55 60
Arg Ile Glu Gln Lys Lys Leu Gly Trp Pro Phe Asp Thr Leu Leu Arg
65 70 75 80
Phe Glu Ile Phe Leu Ser Ile Glu Asp Lys Leu Gln Asp Phe Asp Tyr
85 90 95
Val Phe Phe Phe Asn Gly Asn Thr Glu Ile Leu Ser Glu Ile Lys Ala
100 105 110
Ala Asp Leu Leu Pro Leu Ser Ile His Gln Lys Leu Val Phe Ala His
115 120 125
Gln Pro His Leu Phe His Asn Lys Ile Asn Lys Phe Thr Tyr Asp Arg
130 135 140
Asn Pro Glu Ser Ser Ala Tyr Ile Ala Tyr Asn Tyr Gly His Ala Tyr
145 150 155 160
Phe Thr Gly Ala Leu Asn Gly Gly Glu Val Phe Ser Tyr Leu Glu Met
165 170 175
Cys Lys Val Leu Ala Lys Asn Ile Gln Arg Asp Leu Ser Lys Asp Ile
180 185 190
Ile Ala Leu Trp His Asp Glu Ser His Leu Asn His Tyr Ala Leu Asn
195 200 205
Arg Asn Asp Ile Lys Ile Leu Pro Pro Tyr Phe Thr Arg Gly Glu Thr
210 215 220
Glu Tyr Trp Lys Thr Asp Ser Lys Val Met Phe Ser Asp Lys Thr His
225 230 235 240
Phe Arg Phe Gly Gly His Ala Tyr Leu Arg Gly Glu Thr Asp Glu Lys
245 250 255
Ile Ser Gln Asn Glu Trp Glu Asn Lys Tyr Gly Lys Ser Arg Ser Arg
260 265 270
Phe Lys Phe Arg Phe Lys Gln Phe Ile Lys Ser Ile Phe Leu
275 280 285
<210> 6
<211> 287
<212> PRT
<213> Acinetobacter boissieri
<400> 6
Met Cys Thr Asn Lys Pro Lys Tyr Arg Val Ala Ile Leu Tyr Ile Ala
1 5 10 15
Thr Gly Arg Tyr Thr Val Phe Trp Asp Gly Phe Phe Lys Ser Ala Glu
20 25 30
Lys Tyr Leu Leu Leu Glu Ser Gln Lys Glu Tyr Phe Ile Phe Thr Asp
35 40 45
Thr Pro His Val Leu Gln Glu Asn Glu Arg Val His Gln His Phe Gln
50 55 60
Ser Lys Leu Gly Trp Pro Phe Asp Thr Leu Lys Arg Phe Glu Ile Phe
65 70 75 80
Leu Ser Ile Lys Asp Gln Leu Lys Gly Phe Asp Phe Ile Tyr Phe Phe
85 90 95
Asn Gly Asn Thr Glu Phe Val Thr Glu Ile Thr Glu Gln Glu Phe Leu
100 105 110
Pro Leu Asp Lys Gln Gln Asn Leu Thr Leu Leu His Gln Pro His Leu
115 120 125
Phe His Arg Arg Pro Arg His Phe Pro Tyr Asp Arg Asn Lys Glu Ser
130 135 140
Leu Ala Cys Ile Pro Tyr Asn Glu Gly Met Tyr Tyr Phe Thr Gly Ala
145 150 155 160
Leu Asn Gly Gly Lys Ala Ser Ala Tyr Leu Glu Met Cys Glu Gln Leu
165 170 175
Asn Lys Asn Thr Asn Ile Asp Leu Lys Asn Asn Val Ile Ala Leu Phe
180 185 190
His Asp Glu Ser His Leu Asn Arg Tyr Val Leu Gly Arg Asp Asp Val
195 200 205
Lys Ile Leu Asp Pro Tyr Phe Ala Lys Gly Glu Thr Glu Tyr Trp Lys
210 215 220
His Ala Ser Lys Val Met Phe Ser Asp Lys Thr His Tyr Arg Phe Gly
225 230 235 240
Gly His Asp Tyr Leu Arg Gly Glu Ser Asp His Lys Ile Thr Gln Asp
245 250 255
Glu Trp Glu Asn Gly Lys Lys Arg Asn Lys Lys Arg Tyr Lys Phe Arg
260 265 270
Leu Arg Gln Ala Ile His Ala Phe Phe Ile Gln Arg Ser Leu Lys
275 280 285
<210> 7
<211> 281
<212> PRT
<213> Acinetobacter calcoaceticus
<400> 7
Met Asn Leu Ser Pro Lys Lys Val Ala Ile Leu Tyr Ile Ala Thr Gly
1 5 10 15
Arg Tyr Thr Val Phe Trp Asp Tyr Phe Tyr Gln Ser Ala Glu Ser Asn
20 25 30
Leu Leu Arg Glu Cys Lys Lys His Tyr Phe Val Phe Thr Asp Asn Glu
35 40 45
Glu Leu Leu Lys Lys Lys Thr Asp Gln Asn Val Ser Tyr Ile Ser Gln
50 55 60
Asp Lys Leu Gly Trp Pro Tyr Asp Thr Leu Met Arg Phe Asp Ile Phe
65 70 75 80
Leu Ser Ile Glu Asp Arg Leu Asn Thr Phe Asp Tyr Ile Tyr Phe Phe
85 90 95
Asn Ala Asn Thr Glu Ile Leu Lys Pro Ile Asp Ala Gln Asp Ile Leu
100 105 110
Pro Ile Asp Gln Gln Asn Leu Ala Phe Ala Ile Gln Pro His Ala Phe
115 120 125
His Arg Asn Lys Lys Lys Tyr Thr Tyr Asp Arg Asn Pro Asn Ser Thr
130 135 140
Ala Tyr Ile Ala Met Asp Glu Gly Lys Tyr Tyr Phe Thr Gly Ala Leu
145 150 155 160
Asn Gly Gly Arg Ala Gln Ala Tyr Leu Glu Met Cys Arg Gln Leu Ser
165 170 175
Ser Asn Thr His Val Asp Leu Ser Asn Glu Gln Ile Ala Leu Trp His
180 185 190
Asp Glu Ser His Leu Asn Lys Tyr Ala Leu Asn Arg Lys Asp Ile Lys
195 200 205
Val Leu Pro Pro Phe Phe Thr Arg Gly Glu Asn Glu Ile Trp Lys Lys
210 215 220
Lys Ala Lys Val Met Phe Ser Asp Lys Ser His Phe Arg Phe Gly Gly
225 230 235 240
His Ala Tyr Leu Arg Gly Glu Thr Asp Glu Lys Ile Ser Glu Lys Gln
245 250 255
Trp Glu Val Ser Lys Asn Ala Lys His Lys Gly Trp Gly Phe Arg Ile
260 265 270
Lys Gln Arg Ile Ser Ser Trp Phe Leu
275 280
<210> 8
<211> 281
<212> PRT
<213> Acinetobacter johnsonii
<400> 8
Met Tyr Ser Lys Thr Lys Val Ala Ile Leu Tyr Ile Ala Thr Gly Arg
1 5 10 15
Tyr Ile Thr Phe Trp Asp Phe Phe Tyr Lys Ser Ala Glu Gln Asn Leu
20 25 30
Leu Leu Asn Ser Ser Lys His Tyr Phe Val Phe Thr Asp Cys Lys Glu
35 40 45
Leu Leu Glu Ser Asp Ile Glu Lys Asn Ile Thr Tyr Ile Lys Gln Gln
50 55 60
Lys Leu Gly Trp Pro Tyr Asp Thr Leu Met Arg Phe Asn Ile Phe Leu
65 70 75 80
Thr Gln Lys Asp Gln Leu Lys Lys Phe Asp Tyr Ile Phe Phe Phe Asn
85 90 95
Ala Asn Thr Glu Ile Ile Lys Asn Ile Lys Glu Glu Asp Leu Leu Pro
100 105 110
Leu His Ser Asp Glu Asn Leu Val Leu Thr His Gln Pro His Val Phe
115 120 125
His Lys Asn Lys Lys Gln Phe Thr Tyr Asp Arg Asn Pro Leu Ser Asn
130 135 140
Ala Tyr Ile Pro Leu Ser Gln Gly Arg Tyr Tyr Phe Thr Gly Ala Leu
145 150 155 160
Asn Gly Gly Lys Ser Val Asn Phe Leu Glu Met Cys Glu His Leu Asn
165 170 175
Arg Asn Thr Lys Glu Asp Leu Asp Gln Asn Ile Ile Ala Leu Trp His
180 185 190
Asp Glu Ser His Leu Asn Lys Tyr Val Leu Asp Arg Thr Asp Val Lys
195 200 205
Ile Leu Pro Pro Tyr Phe Thr Arg Gly Glu Lys Glu Tyr Trp Lys Lys
210 215 220
Glu Ala Lys Val Met Phe Ser Asp Lys Ser His Tyr Arg Phe Gly Gly
225 230 235 240
His Ala Phe Leu Arg Gly Glu Thr Asp Gln Tyr Ile Asp Gln Ile Glu
245 250 255
Trp Lys Ala Leu Asn Gly Lys Pro Lys Lys Arg Ile Ser Phe Arg Leu
260 265 270
Lys Gln Tyr Ile Lys Ser Phe Phe Ile
275 280
<210> 9
<211> 285
<212> PRT
<213> Brachyspira sp. CAG:484
<400> 9
Met Gly Asn Lys Val Ala Val Leu Tyr Ile Val Thr Gly Arg Tyr Val
1 5 10 15
Cys Phe Trp Asp Glu Phe Tyr Pro Ser Cys Glu Lys Tyr Phe Leu Pro
20 25 30
Asp Ala Gln Lys Lys Tyr Phe Val Phe Thr Asp Ala Glu His Leu Asn
35 40 45
Phe Glu Glu Asn Asp Asn Val Leu Lys Ile His Gln Glu Lys Leu Gly
50 55 60
Trp Pro Tyr Asp Thr Met Leu Arg Phe Asp Ile Phe Leu Lys Gln Lys
65 70 75 80
Glu Ala Leu Lys Glu Tyr Asp Tyr Ile Phe Phe Phe Asn Ala Asn Thr
85 90 95
Lys Phe Leu Asn Tyr Val Arg Glu Glu Ile Leu Pro Asn Glu Glu Asn
100 105 110
Asp Trp Leu Ile Thr Gly Ser His Pro Ala Phe Tyr Asn Lys His Pro
115 120 125
Asp Glu Phe Thr Tyr Asp Arg Asn Pro Glu Ser Gln Ala Tyr Ile Pro
130 135 140
Tyr Gly Ala Gly Lys His Tyr Ala Thr Gly Ala Leu Asn Gly Gly Ser
145 150 155 160
Gly Ala Ser Phe Leu Glu Met Cys Glu Glu Leu Ser Arg Leu Thr His
165 170 175
Ile Asp Met Asp Asn Gly Val Val Pro Leu Trp His Asp Glu Ser Met
180 185 190
Leu Asn Lys Tyr Met Leu Asn Lys Asn Pro Leu Ile Met Pro Val Asn
195 200 205
Tyr Leu Tyr Pro Glu Glu Arg Trp Met Pro Arg Lys Trp Tyr Arg Asn
210 215 220
Asn Pro Phe Lys Lys Asp Ile Lys Ile Leu Ser Thr Asp Lys Thr His
225 230 235 240
Pro Arg Tyr Gly Gly Lys Glu Tyr Leu Arg Gly Ile Ser Asp Lys Lys
245 250 255
Ala Lys Met Pro Asn Pro Ile Phe Ser Val Ser Tyr Glu Asp Ala Lys
260 265 270
Lys Val Leu Arg Ile Leu Gly Phe Lys Ile Arg Ile Val
275 280 285
<210> 10
<211> 274
<212> PRT
<213> Candidatus Melainabacteria
<400> 10
Met Leu Lys Phe Thr Tyr Asn Lys Lys Lys Glu Ser Leu Met Lys Ile
1 5 10 15
Ala Ile Ile Tyr Ile Gly Ile Gly Arg Tyr Thr Val Phe Trp Asp Glu
20 25 30
Phe Tyr Lys Ser Cys Glu Lys Asn Phe Ile Arg Asn Ala Gln Lys His
35 40 45
Tyr Phe Tyr Phe Thr Asp Ser Lys Glu Tyr Lys Ser Asp Asp Lys Ile
50 55 60
Thr Ile Ile Pro Gln Glu Asn Leu Gly Trp Pro Leu Val Thr Cys Leu
65 70 75 80
Arg Tyr Lys Phe Ile Asn Thr Ile Lys Asp Ser Leu Lys Asn Tyr Asp
85 90 95
Tyr Ile Phe Phe Phe Asn Gly Asn Tyr Glu Val Tyr Ser Lys Val Thr
100 105 110
Ala Glu Glu Phe Leu Pro Thr Asp Glu Asp Gly Gly Leu Ile Ala Leu
115 120 125
Lys His Asn Tyr Asn Lys Tyr Lys Lys Pro Asp Asp Phe Pro Trp Glu
130 135 140
Arg Asn Pro Lys Ser Thr Ser Tyr Ile Pro Tyr Gly Thr Asp Ser Phe
145 150 155 160
Tyr Tyr Gln Ala Cys Leu Trp Gly Gly Lys Thr Ser Gln Met Leu Lys
165 170 175
Leu Val Glu Asp Cys Glu Lys Met Met Asp Glu Asp Leu Ala Asn Asp
180 185 190
Ile Val Pro Ile Phe His Asp Glu Ser Leu Phe Asn Lys Tyr Met Leu
195 200 205
Asp Lys Lys His Lys Thr Leu Gly Tyr Glu Tyr Gly Phe Val Pro Glu
210 215 220
Gly Lys Pro Phe Trp Lys Tyr Phe Gly Val Lys Met Thr Gln Arg Pro
225 230 235 240
Lys Ser Trp Lys Tyr Gly Gly Val Asp Trp Leu Arg Gly Leu Thr Asp
245 250 255
Lys Lys Gln Thr Leu Phe Ser Tyr Ile Leu Glu Lys Leu His Leu Thr
260 265 270
Lys Lys
<210> 11
<211> 253
<212> PRT
<213> Candidatus Pacearchaeota
<400> 11
Met Pro Pro Lys Val Ala Ile Ile Phe Ile Gly Thr Ser Lys Tyr Ala
1 5 10 15
Asp Phe Phe Pro Glu Trp Lys Arg Cys Val Asp Lys His Phe Leu Lys
20 25 30
Glu Cys Asp Lys Thr Ile Ile Ala Ile Thr Asp Arg Val Asp Glu Glu
35 40 45
Tyr Phe His Leu Glu Asp Val Tyr Cys Gly Lys Val Ala His Met Glu
50 55 60
Trp Pro Phe Ile Thr Val Leu Arg Phe Arg Phe Ile Asn Glu Ile Pro
65 70 75 80
Gly Leu Lys Gln Phe Asp Tyr Val Phe Phe Leu Asp Ala Asp Leu Phe
85 90 95
Pro Ser Asn Asp Ile Leu Leu Ser Glu Ile Ile Ser Pro Asp Lys Lys
100 105 110
Leu Val Gly Val Gln His Pro Gly Asn Phe Leu Asp Ser Thr Trp Asn
115 120 125
Thr Leu Asp Arg Thr Pro Gly Ser Thr Ala Cys Val Ser Gly Asp Ile
130 135 140
Thr Ser Tyr Gly Thr Thr Phe Tyr His Gln Gly Cys Leu Trp Gly Gly
145 150 155 160
Thr Gly Lys Ala Val Ser Glu Met Val Leu Lys Leu Ala Lys Asn Val
165 170 175
Asp Ala Asp Leu Lys Asn Asn Ile Met Ala Ile Trp His Asp Glu Ser
180 185 190
His Met Asn Lys Tyr Phe Leu Glu Asn Ile Ala Asp Val His Thr Leu
195 200 205
His Ser Gly Phe Ala Tyr Pro Glu His Gly Asn Trp Ala Val Ile Glu
210 215 220
Asp Asn Leu Glu Ile Lys Met Val His Lys Glu Lys Ser His Glu Asp
225 230 235 240
Phe Pro Arg Phe Arg Gly Asn Asn Pro His Asp Lys Gly
245 250
<210> 12
<211> 289
<212> PRT
<213> Candidatus Pacearchaeota
<400> 12
Met Ala Ser Lys Ser Leu Arg Glu Lys Leu Met Arg Val Lys Trp Ile
1 5 10 15
Lys Lys Leu Leu Arg Ala Leu Pro Thr Leu Leu Arg Leu His Ile Lys
20 25 30
Tyr Phe Glu Asn Arg Lys Tyr Thr Ile Arg Ile Leu Lys Lys Glu Glu
35 40 45
Arg Lys Glu Lys Lys Gln Met Gln Phe Pro Lys Ser Ile Ala Ile Leu
50 55 60
Phe Val Gly Thr Gly Ile Tyr Phe Asn Tyr Phe Gly Glu Phe Tyr Glu
65 70 75 80
Asn Ile Lys Arg Asn Phe Leu Pro Glu Ile Pro Lys Lys Phe Phe Val
85 90 95
Phe Thr Asp Lys Asp Phe Lys Glu Asn Glu Asp Val Glu Arg Val Lys
100 105 110
Ile Pro Asp Glu Lys Ile Tyr Ala Ile Leu Arg Tyr Leu Gly Asp Ile
115 120 125
Pro Lys Ile Lys Asn Leu Lys Asn Phe Glu Tyr Val Ile Lys Met Asp
130 135 140
Ala Asp Leu Val Val Pro Glu Pro Ile Ser Ser Ala Glu Phe Phe Tyr
145 150 155 160
His Asn Lys Pro Leu Phe Gly Val Arg His Pro Tyr Phe Leu Cys Arg
165 170 175
Gln Gly Ser Phe Glu Ile Ser Pro Lys Ser Lys Ala Ala Val Ser Pro
180 185 190
Arg Glu Asp Leu Ser Glu Tyr Ile Gln Cys Cys Phe Trp Gly Gly Lys
195 200 205
Thr Asn Tyr Val Val Lys Met Val Lys Glu Met Tyr Lys Asn Ile Lys
210 215 220
Ile Asp Leu Asn Asn Gly Ile Ile Ala Arg Ile Phe Asp Glu Ser Tyr
225 230 235 240
Leu Asn Lys Tyr Phe Ile Ser Asn Lys Pro Leu Phe Tyr Val Tyr Pro
245 250 255
Pro Asn Tyr Ala Tyr Pro Asp Val Pro Ile Pro Glu Lys Leu Lys Lys
260 265 270
Lys Ile Leu His Val Thr Asn Lys Arg Phe Lys Val Asn Tyr Gln Lys
275 280 285
Lys
<210> 13
<211> 261
<212> PRT
<213> Chitinophaga niabensis
<400> 13
Met Lys Ile Ala Leu Leu Phe Ile Cys Thr Gly Lys Tyr Ser Ile Phe
1 5 10 15
Trp Lys Asp Phe Tyr Thr Ser Ala Glu Gln Tyr Phe Val Pro Gly Ala
20 25 30
Glu Lys Ala Tyr Phe Val Phe Thr Asp Asp Ala Asp Leu Pro Phe Lys
35 40 45
Asp Ala Gln Asn Val His Val His His Gln Gln Lys Leu Gly Trp Pro
50 55 60
Tyr Asp Thr Leu Met Arg Phe Ser Ile Phe Ser Arg Val Glu Lys Glu
65 70 75 80
Leu Ala Ala Phe Asp Tyr Ile Phe Phe Phe Asn Ala Asn Thr Glu Phe
85 90 95
Ile Lys Pro Ile Thr Ala Ala Glu Ile Leu Pro Thr Asp Ala Glu Asp
100 105 110
Gly Leu Thr Val Val Leu His Pro Gly Tyr Tyr Asn Lys Pro Leu Lys
115 120 125
Ala Phe Pro Tyr Glu Lys Thr Gln Lys Lys Ser Thr Ala Tyr Met Pro
130 135 140
Ser Asn Glu Arg His Gln Tyr Phe Gln Gly Cys Leu Asn Gly Gly Thr
145 150 155 160
Gly Lys Ala Tyr Leu Gln Leu Ile Arg Gln Leu Thr Glu Asn Thr Gln
165 170 175
Lys Asp Leu Asp Asn Gly Ile Ile Ala Ile Trp His Asp Glu Ser Gln
180 185 190
Leu Asn Lys Tyr Val Ala Asn Lys His Pro Lys Val Leu Thr Pro Gly
195 200 205
Tyr Ala Tyr Pro Glu Gly Trp Asp Leu Pro Phe Glu Lys Ala Ile Leu
210 215 220
Met Arg Asp Lys Gly Arg Phe Gly Gly Ser Asp Phe Met Arg Gln Thr
225 230 235 240
Thr Pro Glu Ala Pro Leu Asn Thr Phe Gln Leu Ile Ile Arg Lys Ile
245 250 255
Lys Arg Leu Phe Ser
260
<210> 14
<211> 234
<212> PRT
<213> 大肠杆菌
<400> 14
Met Val Ile Asn Ile Phe Tyr Ile Cys Thr Gly Glu Tyr Lys Arg Phe
1 5 10 15
Phe Asp Lys Phe Tyr Leu Ser Cys Glu Asp Lys Phe Ile Pro Glu Phe
20 25 30
Glu Lys Lys Tyr Tyr Val Phe Thr Asp Ser Asp Arg Ile Tyr Phe Ser
35 40 45
Lys Tyr Leu Asn Val Glu Val Ile Asn Val Glu Lys Asn Cys Trp Pro
50 55 60
Leu Asn Thr Leu Leu Arg Phe Ser Tyr Phe Leu Lys Val Ile Asp Lys
65 70 75 80
Leu Gln Thr Asn Ser Tyr Thr Phe Phe Phe Asn Ala Asn Ala Val Ile
85 90 95
Val Lys Glu Ile Pro Phe Ser Thr Phe Met Glu Ser Asp Leu Ile Gly
100 105 110
Val Ile His Pro Gly Tyr Lys Asn Arg Ile Ser Ile Leu Tyr Pro Trp
115 120 125
Glu Arg Arg Lys Asn Ala Thr Cys Tyr Leu Gly Tyr Leu Lys Lys Gly
130 135 140
Ile Tyr Tyr Gln Gly Cys Phe Asn Gly Gly Lys Thr Ala Ser Phe Lys
145 150 155 160
Arg Leu Ile Gln Ile Cys Asn Met Met Thr Met Ala Asp Leu Lys Lys
165 170 175
Asn Leu Ile Ala Lys Val His Asp Glu Ser Tyr Leu Asn Tyr Tyr Tyr
180 185 190
Tyr Tyr Asn Lys Pro Leu Leu Leu Ser Glu Leu Tyr Ser Trp Pro Glu
195 200 205
Lys Tyr Gly Glu Asn Lys Asp Ala Lys Ile Ile Met Arg Asp Lys Glu
210 215 220
Arg Glu Ser Trp Tyr Gly Asn Ile Lys Lys
225 230
<210> 15
<211> 185
<212> PRT
<213> 大肠杆菌
<400> 15
Tyr Leu Asn Val Glu Val Ile Asn Val Glu Lys Asn Cys Trp Pro Leu
1 5 10 15
Asn Thr Leu Leu Arg Phe Ser Tyr Phe Leu Lys Val Ile Asp Lys Leu
20 25 30
Gln Thr Asn Ser Tyr Thr Phe Phe Phe Asn Ala Asn Ala Val Ile Val
35 40 45
Lys Glu Ile Pro Phe Ser Thr Phe Met Glu Ser Asp Leu Ile Gly Val
50 55 60
Ile His Pro Gly Tyr Lys Asn Arg Ile Ser Ile Leu Tyr Pro Trp Glu
65 70 75 80
Arg Arg Lys Asn Ala Thr Cys Tyr Leu Gly Tyr Leu Lys Lys Gly Ile
85 90 95
Tyr Tyr Gln Gly Cys Phe Asn Gly Gly Lys Thr Ala Ser Phe Lys Arg
100 105 110
Leu Ile Gln Ile Cys Asn Met Met Thr Met Ala Asp Leu Lys Lys Asn
115 120 125
Leu Ile Ala Lys Val His Asp Glu Ser Tyr Leu Asn Tyr Tyr Tyr Tyr
130 135 140
Tyr Asn Lys Pro Leu Leu Leu Ser Glu Leu Tyr Ser Trp Pro Glu Lys
145 150 155 160
Tyr Gly Glu Asn Lys Asp Ala Lys Ile Ile Met Arg Asp Lys Glu Arg
165 170 175
Glu Ser Trp Tyr Gly Asn Ile Lys Lys
180 185
<210> 16
<211> 542
<212> PRT
<213> Haemophilus pittmaniae
<400> 16
Met Ile Lys Glu Thr Ile Ala Val Leu Tyr Ile Val Gln Gly Asn Asp
1 5 10 15
Phe Ala Ala Trp Asp Asn Phe Tyr Arg Ser Ser Glu Glu Phe Leu Leu
20 25 30
Pro Arg Gln His Lys Gln Tyr Phe Val Phe Ser Asp Asp Glu Ser Ile
35 40 45
Thr Arg Asn Ser Asn Ile Ser Ile Val Arg Thr Asn Gly Leu Lys Asp
50 55 60
Ser Lys Ser Arg Phe Trp Leu Phe Ser Ala Ile Glu Asn Gln Leu Ala
65 70 75 80
Glu Phe Thr Tyr Val Tyr Ala Phe Ser Ser His Val Arg Phe Val Ser
85 90 95
Pro Ile Val Ala Glu Asp Ile Thr Pro Thr Pro Asn Ser Pro Phe Val
100 105 110
Val Tyr Arg Gln Tyr Pro Asp Leu Asp His Val Leu Ala Asn Glu Phe
115 120 125
Pro Tyr Glu Arg Val Val Asn Ala Asn Ser Tyr Val Pro Tyr Gly Val
130 135 140
Gly Glu Gln Tyr Leu Thr Cys Ala Leu Phe Gly Gly Met Arg Asp Ser
145 150 155 160
Phe Ile Ser Ala Cys Arg Cys Ile Asp Ala Ala Ile Glu Asp Asp Arg
165 170 175
Tyr Arg His Ile Ala Ser Leu Asn Ala Glu Asp Lys Gln Leu Asn Gln
180 185 190
Tyr Phe Leu Tyr Lys Asn Asn Met Asn Val Leu Ser Ala Asn Trp Ile
195 200 205
Arg Lys Ala Asn Glu Pro Trp Lys Arg Tyr Ala Lys Met Leu Asp Val
210 215 220
Ile Gln Glu Asp Ser Phe Asp Ile Pro Val Asp Val Leu Glu Ser Val
225 230 235 240
Lys Asn Ile His Glu Ile Phe Arg Tyr Ala Pro His Ser Phe Phe Leu
245 250 255
Asp Leu Gln Glu Asn Val Ala Lys Ser Trp Arg Ala Leu Leu Lys Ala
260 265 270
Tyr Leu Tyr Gly Gln Leu Thr Thr Phe Asp Phe Pro Ala Lys Lys Pro
275 280 285
Glu Leu Val Gly Lys Asn Ile Ile Trp Gln Tyr Trp Gly Gln Gly Ile
290 295 300
Asp Asp Arg Leu Pro Glu Leu Thr Lys Val Cys Phe Ala Ser Val Asp
305 310 315 320
Arg Asn Lys Gly Asp Tyr Thr Val Ile Arg Val Asp Asp Ala Ser Leu
325 330 335
Ala Glu Tyr Ile Asp Leu Pro Asp Phe Met Trp Gln Lys Arg Gly Gly
340 345 350
Ala Phe Ser Thr Ala Leu Phe Ser Asp Val Val Arg Leu Ile Leu Leu
355 360 365
Tyr Val Tyr Gly Gly Ile Trp Val Asp Ala Thr Ile Ile Phe Ser Ser
370 375 380
Pro Leu Pro Lys Gly Leu Leu Glu Gln Asp Phe Phe Leu Phe His Arg
385 390 395 400
Asp Ile Gly Asn Ser Asn Lys Ala Tyr Trp Glu Arg Ile Asn Lys Asp
405 410 415
Tyr Phe Cys Trp Asp Lys Glu His Lys Val Asn Ser Leu Asn Ser Phe
420 425 430
Ile Ile Ala Lys Pro Arg His Val Val Thr Glu Thr Leu Leu Gln Leu
435 440 445
Leu Leu Asn Tyr Trp Lys Thr Gln Asp His Val Pro Cys Tyr Tyr Ile
450 455 460
Phe Gln Ile Leu Phe Asp Gln Val Met Lys Tyr Asp Leu Asp Asn Gln
465 470 475 480
Arg Leu Leu Val Arg Asp Asp Thr Phe Pro His Glu Leu Ser Met Lys
485 490 495
Leu Trp Ser Asp Tyr Asn Ala Glu Glu Ile Asn Asp Leu Phe Ser Arg
500 505 510
Cys Ser Val His Lys Leu Thr Gly His Ala Asn Leu Ala Asp Cys Gly
515 520 525
Glu Asn Ser Val Trp Gln His Leu Lys Arg Glu Tyr Leu Gly
530 535 540
<210> 17
<211> 542
<212> PRT
<213> Haemophilus pittmaniae HK 85
<400> 17
Met Ile Lys Glu Thr Ile Ala Val Leu Tyr Ile Val Gln Gly Asn Asp
1 5 10 15
Phe Ala Ala Trp Asp Asn Phe Tyr Arg Ser Ser Glu Glu Phe Leu Leu
20 25 30
Pro Gly Gln His Lys Gln Tyr Phe Val Phe Ser Asp Asp Glu Ser Ile
35 40 45
Thr Arg Asn Ser Asn Val Ser Ile Val Arg Thr Asn Gly Leu Lys Asp
50 55 60
Ser Lys Ser Arg Phe Trp Leu Phe Ser Ala Ile Glu Asn Gln Leu Ala
65 70 75 80
Glu Phe Thr Tyr Val Tyr Ala Phe Ser Ser His Ile Arg Phe Val Ser
85 90 95
Pro Val Val Ser Glu Asp Ile Thr Pro Thr Pro Asn Ser Pro Phe Val
100 105 110
Val Tyr Arg Gln Tyr Pro Asn Leu Asp His Val Leu Ala Asn Glu Phe
115 120 125
Pro Tyr Glu Arg Ala Val Asn Ala Asn Ser Tyr Val Pro Tyr Gly Ala
130 135 140
Gly Glu Gln Tyr Leu Thr Cys Ala Leu Phe Gly Gly Met Arg Asp Ser
145 150 155 160
Phe Ile Ser Ala Cys Arg Cys Ile Asp Ala Ala Ile Glu Asp Asp Arg
165 170 175
Tyr Arg His Ile Ala Ser Leu Asn Ala Glu Asp Lys Gln Leu Asn Gln
180 185 190
Tyr Phe Leu Tyr Lys Asn Asn Met Asn Val Leu Ser Ala Asn Trp Ile
195 200 205
Arg Lys Ala Asn Glu Pro Trp Lys Arg Tyr Ala Lys Met Leu Asp Val
210 215 220
Ile Gln Glu Gly Ser Phe Asp Ile Pro Val Asp Val Leu Glu Ser Val
225 230 235 240
Lys Asn Ile His Glu Ile Phe Arg Tyr Ala Pro His Ser Ser Phe Leu
245 250 255
Asp Leu Gln Glu Asn Val Ala Lys Ser Trp Arg Ala Leu Leu Lys Ala
260 265 270
Tyr Leu Tyr Gly Gln Leu Thr Thr Phe Asp Phe Pro Ala Lys Lys Pro
275 280 285
Asp Leu Val Gly Lys Asn Ile Ile Trp Gln Tyr Trp Gly Gln Gly Ile
290 295 300
Asp Asp Gly Leu Pro Glu Leu Thr Lys Val Cys Phe Ala Ser Val Asp
305 310 315 320
Arg Asn Lys Gly Asp Tyr Thr Val Ile Arg Val Asp Asp Ala Ser Leu
325 330 335
Ala Glu Tyr Ile Asp Leu Pro Asp Phe Met Trp Gln Lys Arg Gly Gly
340 345 350
Ala Phe Ser Ala Ala Leu Phe Ser Asp Val Val Arg Leu Val Leu Leu
355 360 365
Tyr Val Tyr Gly Gly Ile Trp Val Asp Ala Thr Ile Ile Phe Ser Ser
370 375 380
Pro Leu Pro Lys Glu Leu Leu Glu Gln Asp Phe Phe Leu Phe His Arg
385 390 395 400
Asp Ile Gly Asn Ser Asn Lys Ala Tyr Trp Glu Arg Ile Asn Lys Asp
405 410 415
Tyr Phe Cys Trp Asn Lys Glu His Lys Val Asn Ser Leu Asn Ser Phe
420 425 430
Ile Ile Ala Lys Pro Trp His Val Val Thr Glu Thr Leu Leu Gln Leu
435 440 445
Leu Leu Asn Tyr Trp Lys Thr Gln Asp His Val Pro Cys Tyr Tyr Ile
450 455 460
Phe Gln Ile Leu Phe Asp Gln Val Met Lys Tyr Asp Leu Asp Asn Gln
465 470 475 480
Arg Leu Leu Ile Arg Asp Asp Thr Phe Pro His Glu Leu Ser Met Lys
485 490 495
Leu Trp Ser Asp Tyr Asn Ala Glu Glu Ile Asn Asp Leu Phe Ser Arg
500 505 510
Cys Ser Val His Lys Leu Thr Gly His Ala Asn Leu Ala Asp Cys Gly
515 520 525
Glu Asn Ser Val Trp Gln His Leu Lys Arg Glu Tyr Leu Gly
530 535 540
<210> 18
<211> 641
<212> PRT
<213> Helicobacter sp. 11S02629-2
<400> 18
Met Lys Leu Asp Leu Asp Lys Ser Tyr Asn Phe Leu Ile Val Arg Leu
1 5 10 15
Asp His Ile Gly Asp Val Val Leu Thr Leu Gly Cys Ala Glu Ala Ile
20 25 30
Lys Thr Arg Phe Lys Asn Ala Lys Val Phe Tyr Leu Val Asn Ser Tyr
35 40 45
Thr Ala Pro Leu Phe Glu His His Ala Phe Val Asp Gly Phe Ile Asp
50 55 60
Leu Asn Thr Asn Gly Val Phe Asp Gln Lys Ala Leu Ile Ser Arg Ile
65 70 75 80
Lys Ala Ala Lys Ile Asp Ile Ser Ile Ser Phe Ala Pro Asp Lys Phe
85 90 95
Ala Leu Pro Ala Ile Phe Lys Ala Arg Val Lys Ile Arg Leu Gly Asn
100 105 110
Phe Ile Lys Leu Tyr Ser Leu Leu Leu Thr Lys Arg Val Ile Gln Asn
115 120 125
Arg Ser Ala Cys Asn Arg Ser Glu Ala Leu Tyr Asp Leu Glu Leu Leu
130 135 140
Lys Pro Leu Gly Cys Ser Thr Asn Phe Tyr Pro Lys Leu Phe Val Ser
145 150 155 160
Glu Ala Glu Lys Glu Glu Ala Leu Lys Tyr Ile Glu Ser Ser Phe Ala
165 170 175
Asn Lys Arg Pro Leu Val Ile Val His Pro Gly Ser Leu Lys Ser Thr
180 185 190
Val Glu Trp Gly Arg Glu Lys Phe Leu Glu Val Ala Ser Leu Leu Ser
195 200 205
Glu Asn Tyr Asn Val Leu Val Thr Gly Ser Asp Ser Glu Met Lys Glu
210 215 220
Leu Leu Thr Phe Lys Arg Gly Asn Leu Lys Glu Ser Asn Phe Leu Lys
225 230 235 240
Pro Gly Ser Leu Arg Trp Ile Ile Ser Ile Ile Ser Leu Ala Asp Leu
245 250 255
Ile Val Val Asn Ala Thr Gly Thr Leu His Ile Ala Ala Ala Leu Gly
260 265 270
Val Arg Ile Val Gly Ile Tyr Pro Asp Arg Leu Gln Ile Asn Pro Thr
275 280 285
Arg Trp Ala Ala Phe Thr Lys Glu Asp Asp Asp Val Tyr Ile Thr Pro
290 295 300
Ser Gly Ile Phe Tyr Gly Ala Lys Ser Tyr Lys Pro Pro Ser Phe Asp
305 310 315 320
Asn Asn Asp Pro Arg Met Val Asn Met Asp Ala Ile Lys Val Asp Glu
325 330 335
Val Tyr Lys Ile Ala Asp Leu Glu Leu Lys Lys Leu Asp Pro Arg Tyr
340 345 350
Lys Lys Ile Ala Ile Leu Tyr Ile Ala Leu Gly Arg Tyr Asp Ile Phe
355 360 365
Phe Asn Asp Phe Tyr Glu Ser Met Glu Lys His Phe Val Thr Ser Ala
370 375 380
Lys Lys Thr Tyr Phe Val Phe Thr Asp Ser Ala Asn Ile Ser Thr His
385 390 395 400
Asp Asn Val Val Lys Ile Lys Gln Glu Lys Leu Gly Trp Pro Phe Asp
405 410 415
Thr Leu Lys Arg Phe Ala Met Phe Glu Ser Ile Lys Asp Arg Leu Ala
420 425 430
Asn Phe Asp Tyr Ile Phe Phe Phe Asn Ala Asn Ala Leu Val Leu Glu
435 440 445
Asp Ile Gln Ala Lys Glu Val Leu Pro Ser Glu Lys Glu Gly Leu Val
450 455 460
Phe Ala Arg His Pro Ser Phe Ser Tyr Ile Lys Glu Asp Leu Thr Trp
465 470 475 480
Asp Ser Arg Asp Ser Phe Arg Asp Ser Tyr His Lys Asp Leu Asn Ser
485 490 495
Leu Ala Cys Ile Lys Glu Asp Glu Gly Phe Ala Tyr Val Met Gly Ala
500 505 510
Leu Asn Gly Gly Arg Ala Lys Glu Tyr Leu Glu Leu Ile Ser Thr Leu
515 520 525
His Ala Asn Val Glu Ser Asp Leu Gln Lys Asp Val Ile Ala Val Trp
530 535 540
His Asp Glu Ser His Leu Asn Arg Tyr Leu Ile Asp Phe Cys Lys Ala
545 550 555 560
Gly His Ala Pro Lys Ile Leu Gly Ala Asn Phe Leu Val Pro Glu Glu
565 570 575
Cys Leu Glu Lys Leu Gly Phe Gly Phe Tyr Lys Asp Thr Pro Phe Leu
580 585 590
Lys Leu Ser Ser Leu Lys Ala Lys Ile Thr Leu Leu Asp Lys Ser His
595 600 605
Pro Arg Phe Gly Gly His Glu Tyr Leu Arg Gly Ala Val Val Gln Asp
610 615 620
Phe Lys Pro Lys Val Gly Leu Thr Cys Ile Lys Asp Thr Gly Gly Gly
625 630 635 640
Gly
<210> 19
<211> 331
<212> PRT
<213> Helicobacter sp. 13S00401-1
<400> 19
Met Leu Asn Pro Phe Lys Thr Asn Thr Ile Ala Ile Leu Tyr Ile Ala
1 5 10 15
Leu Gly Arg Tyr Asp Ile Phe Phe Asn Asp Phe Tyr Glu Asn Met Glu
20 25 30
Lys Asn Phe Val Pro Asn Thr Lys Lys Thr Tyr Phe Val Phe Thr Asp
35 40 45
Ser Lys Asn Ile Thr Ser His Glu Asn Ile Val Arg Ile Glu Gln Ala
50 55 60
Lys Leu Gly Trp Pro Tyr Asp Thr Leu Lys Arg Phe Ala Met Phe Glu
65 70 75 80
Gly Ile Lys Glu Glu Leu Ala Ser Phe Asp Tyr Ile Phe Phe Phe Asn
85 90 95
Ala Asn Ala Leu Val Leu Glu Lys Ile Thr Ala Pro Met Ile Leu Pro
100 105 110
Ser Lys Asp Glu Gly Leu Val Phe Ala Arg His Pro Ala Phe Ser Cys
115 120 125
Ile Leu Pro Asp Met Asn Trp Glu Ser Arg Glu Ser Phe Arg Gln Ser
130 135 140
Tyr Cys Lys Asp Pro Asn Ser Leu Ala Cys Ile Lys Asp Asp Glu Gly
145 150 155 160
Phe Cys Tyr Val Met Gly Ala Leu Asn Gly Gly Arg Ala Lys Glu Tyr
165 170 175
Leu Glu Leu Ile Glu Thr Leu Ala Ala Arg Val Glu Ala Asp Leu Gln
180 185 190
Lys Asp Val Val Ala Val Trp His Asp Glu Ser His Leu Asn Arg Tyr
195 200 205
Leu Ile Asp Val Val Lys Asn Gly Lys Lys Pro Lys Ile Ile Gly Ala
210 215 220
Asn Phe Leu Val Pro Glu Glu His Leu Glu Ala Leu Gly Phe His Phe
225 230 235 240
Tyr Lys Asp Val Pro Phe Leu Lys Leu Ala Lys Leu Arg Ala Asn Ile
245 250 255
Thr Leu Leu Asn Lys Ser His Pro Arg Phe Gly Gly His Glu Tyr Leu
260 265 270
Arg Gly Leu Ser Asp Val Lys Val Glu Leu Gln Lys Gly Asp Glu Val
275 280 285
Asn Leu Tyr Lys Arg Tyr Gly Gly Gly Gly Glu Leu Gly Ala Phe Ser
290 295 300
Pro Lys Leu Phe Leu Lys Cys Phe Tyr Leu Asn Leu Lys His Asn Leu
305 310 315 320
Ser Ala Lys Lys Gly Leu Lys Asp Lys Asn Ala
325 330
<210> 20
<211> 226
<212> PRT
<213> Hyphomonas sp.
<220>
<221> misc_feature
<222> (54)..(54)
<223> Xaa可为任何自然发生氨基酸
<220>
<221> misc_feature
<222> (74)..(74)
<223> Xaa可为任何自然发生氨基酸
<220>
<221> misc_feature
<222> (114)..(114)
<223> Xaa可为任何自然发生氨基酸
<400> 20
Met Ile Gly Trp Leu Val Ile Gly Thr Asn Lys Tyr Leu Glu Leu Gly
1 5 10 15
Val Glu Cys Leu Glu Ser Ile Lys Glu Lys Tyr Thr Gly Ser Gln Ser
20 25 30
Gln Lys Phe Phe Leu Phe Thr Asp Arg Val Asp Glu Val Lys Gln Asp
35 40 45
Trp Ile Thr Thr Phe Xaa Ile Glu His Glu Val Phe Pro Tyr Ile Ser
50 55 60
Met Ser Arg Tyr Arg His Phe Val Asp Xaa Lys Glu Val Leu Ala Glu
65 70 75 80
Met Asp Tyr Leu Tyr Tyr Val Asp Ala Asp Ser Leu Phe Leu Asn Val
85 90 95
Gly Asp Glu Ile Leu Gly Glu Arg Val Thr Thr Arg His Pro Gly Trp
100 105 110
Phe Xaa Arg Glu Ser Ile Asp Cys Pro Phe Asp Arg Asn Pro Asn Ser
115 120 125
Asn Ala Phe Val Ser Tyr Asp Tyr Lys Gly Pro Tyr Phe Gln Asn Cys
130 135 140
Phe Gln Gly Gly Tyr Ser Lys Glu Phe Leu Lys Met Ser Glu Ile Leu
145 150 155 160
Ala Glu Arg Thr Lys Met Asp Leu Gly Asn Asp Val Met Pro Leu Trp
165 170 175
His Asp Glu Ser His Met Asn Lys Tyr Met Ser Glu Asn Pro Pro Thr
180 185 190
Arg Ile Leu Asp Pro Gly Tyr Ala Tyr Pro Glu Asn Trp Arg Ile Pro
195 200 205
Phe Glu Gln Lys Ile Ile Gly Val Ser Lys Asn His Asp Glu Ile Arg
210 215 220
Ser Asp
225
<210> 21
<211> 610
<212> PRT
<213> Neisseria shayeganii 871
<400> 21
Met His Thr Pro Thr Ile Ala Val Leu Tyr Ile Ala Thr Gly Arg Tyr
1 5 10 15
Thr Val Phe Trp Glu Pro Phe Tyr Gln Ser Ala Glu Arg Phe Leu Leu
20 25 30
Thr Asp Cys Arg Lys His Tyr Phe Leu Phe Thr Asp Ser Pro Glu Pro
35 40 45
Leu Ala Gly Glu Ala Glu Gly Lys Val Thr Arg Ile His Gln Asn Lys
50 55 60
Leu Gly Trp Pro Tyr Asp Thr Leu Met Arg Phe Glu Met Phe Leu Gly
65 70 75 80
Ile Lys Ala Gln Leu Ala Ala Tyr Asp Phe Ile Tyr Phe Phe Asn Gly
85 90 95
Asn Thr Glu Leu Leu Ser Pro Val Ser Arg Glu Asp Leu Leu Pro Leu
100 105 110
Gln Ala His Glu Asn Leu Val Ala Ala Arg Gln Pro His Ile Thr His
115 120 125
Leu Ser Ala Asp Glu Phe Pro Tyr Glu Arg Asn Pro Lys Ser Thr Ala
130 135 140
Cys Ile Pro Arg Gly Gln Gly Arg Tyr Tyr Phe Thr Gly Ala Leu Asn
145 150 155 160
Gly Gly Arg Ala Ala Ala Tyr Leu Ala Met Cys Glu Thr Leu Asn Arg
165 170 175
His Ile Gln Gln Asp Leu Asp Lys Asn Val Ile Ala Leu Trp His Asp
180 185 190
Glu Ser Gln Leu Asn Arg Tyr Leu Leu Asp Arg Asn Asp Val Lys Ile
195 200 205
Leu Pro Arg Tyr Phe Thr Arg Gly Glu Thr Glu Pro Trp Lys Gln Asn
210 215 220
Ala Lys Val Met Phe Ser Asp Lys Thr His Tyr Arg Phe Gly Gly His
225 230 235 240
Ala Tyr Leu Arg Gly Glu Ser Glu Gln Lys Ile Ser Arg Glu Glu Trp
245 250 255
Glu Ala Glu Tyr Arg Val Pro Ala Asp Val Ala Ala Thr Ala Arg Gln
260 265 270
Pro His Thr Val Phe Ala Thr Asp Ala Lys Trp Lys Arg Arg Val Asp
275 280 285
Ala Cys Asn Arg Arg Pro Trp Lys Ile Leu Tyr Lys Gly Leu Val Pro
290 295 300
Lys Pro Val Arg Asn Arg Leu Asn Lys Lys Ala Gln Leu Ala Gln Gln
305 310 315 320
Arg His Val Ala Ala Cys Trp Glu Arg Phe Leu Lys Ala Tyr Phe Tyr
325 330 335
Gly Ile Leu Glu Ser Phe Ser Leu Gln Pro Lys Gln Asp Leu Arg Gly
340 345 350
Arg Lys Ile Ile Trp Gln Tyr Trp Gly Gln Gly Ala Asp Ala Ala Asp
355 360 365
Leu Pro Asp Ile Val Arg Leu Cys Phe His Ser Val Glu Gln His Lys
370 375 380
Gly Asp Tyr Asp Ile Ile Arg Leu Asp Asp Gly Asn Val Arg Asp Tyr
385 390 395 400
Val Asp Phe Pro Asp Phe Val Trp Glu Lys Arg His Asn Pro Glu Phe
405 410 415
Lys His Ala Phe Phe Ala Asp Leu Leu Arg Leu Ala Leu Leu Asp Leu
420 425 430
Tyr Gly Gly Ala Trp Leu Asp Ala Thr Ile Leu Leu Thr Ala Pro Leu
435 440 445
Pro Glu Gly Tyr Leu Lys Asp Ala Gly Phe Phe Met Phe Gln Arg Asp
450 455 460
Pro Ala Ala Ala Asp Gln Ala Ala Trp Glu Lys Leu Asn Ala Asp Tyr
465 470 475 480
Phe Gly Trp Gln Pro Asn His Lys Val Ser Val Leu Asn Ser Phe Ile
485 490 495
Met Ala His Pro Gly Asn Thr Val Ile His Thr Cys Leu Asp Leu Leu
500 505 510
Leu Asn Phe Trp Lys Thr Gln Asn Arg Ile Pro His Tyr Phe Phe Phe
515 520 525
Gln Ile Met Phe His Glu Leu Met Arg Leu Tyr Phe Ala Asp Arg Gln
530 535 540
Cys Pro Leu Ala Asp Asp Thr Leu Pro His Leu Leu Tyr Arg Gln Ile
545 550 555 560
Gln Gln Pro Phe Asp Ala Gly Arg Phe Ala Asp Ile Thr Arg Arg Cys
565 570 575
Gly Val His Lys Leu Ser Tyr Leu Lys His Cys Pro Pro Gly Ser Phe
580 585 590
Tyr His His Leu Arg Thr Glu Ala Gly Leu Pro Pro Ala Asn Ala Asn
595 600 605
Gly His
610
<210> 22
<211> 277
<212> PRT
<213> Pasteurella aerogenes
<400> 22
Met Ala Lys Val Ala Ile Leu Tyr Ile Ala Thr Gly Arg Tyr Ile Val
1 5 10 15
Phe Trp Glu His Phe Tyr Arg Ser Ala Glu Lys Phe Leu Leu Pro Lys
20 25 30
Ser Asp Lys Asn Tyr Phe Val Phe Thr Asp Ser Pro His Ile Leu Gly
35 40 45
Glu Glu His Ser Asn Val Thr Arg Ile Glu Gln Lys Lys Leu Gly Trp
50 55 60
Pro Tyr Asp Thr Leu Met Arg Phe Asp Ile Phe Leu Ser Ile Arg Glu
65 70 75 80
Thr Leu Glu Lys Phe Asp Tyr Ile Tyr Phe Phe Asn Gly Asn Ser Glu
85 90 95
Leu Leu Ser Glu Val Asn Glu Thr Glu Phe Leu Pro Cys Glu Asp Asn
100 105 110
Tyr Asn Leu Val Phe Thr His Gln Pro His Met Phe His Leu Pro Lys
115 120 125
Arg Arg Phe Thr Tyr Asp Arg Asn Pro Glu Ser Cys Ala Tyr Ile Pro
130 135 140
Gln Gly Asp Gly Lys Tyr Tyr Phe Thr Gly Ala Leu Asn Gly Gly Lys
145 150 155 160
Ala Lys Tyr Tyr Leu Glu Met Cys Glu Lys Leu Ser Gln Asn Thr His
165 170 175
Thr Asp Leu Glu Lys Asn Ile Ile Ala Arg Trp His Asp Glu Ser His
180 185 190
Leu Asn Arg Tyr Ala Ile Gly Arg Thr Asp Ile Lys Ile Leu Pro Pro
195 200 205
Tyr Phe Thr Arg Ser Glu Thr Glu Lys Trp Lys Thr Ser Ala Lys Ile
210 215 220
Met Phe Ser Asp Lys Thr His Tyr Arg Phe Gly Gly His Ala Tyr Leu
225 230 235 240
Arg Gly Glu Ser Glu Asn Lys Ile Thr Pro Thr Glu Trp Glu Glu Lys
245 250 255
Tyr Lys Asn Lys Lys Arg Arg Phe Ser Phe Arg Ile Lys Gln Tyr Ile
260 265 270
Lys Ser Trp Phe Leu
275
<210> 23
<211> 301
<212> PRT
<213> Psychrobacter sp. (strain PRwf-1)
<400> 23
Met Lys Ile Thr Glu Leu Asn Met Ser Leu Ser Thr Ser Ala Leu Ser
1 5 10 15
Asn Asn Ser Lys Pro Ser Val Ala Ile Leu Tyr Ile Ala Thr Gly Arg
20 25 30
Tyr Thr Val Phe Trp Asp Tyr Phe Tyr Lys Ser Ala Glu Lys Tyr Leu
35 40 45
Leu Pro Asp Cys Asn Lys His Tyr Ile Leu Phe Thr Asp Ser Asp Ala
50 55 60
Leu Ile Asp Ser Phe Arg Thr Lys Ser Asp Gln Val Thr Ala Leu Lys
65 70 75 80
Lys Glu Ala Met Glu Trp Pro Phe Cys Thr Leu Met Arg Phe Arg Phe
85 90 95
Phe Leu Asp Ala Glu Asn Ile Ile Lys Gln His Asp Phe Val Phe Phe
100 105 110
Phe Asn Ala Asn Thr Glu Phe Leu Ser Thr Ile Thr Gln Tyr Asp Leu
115 120 125
Leu Pro Leu Gly Ser His Glu Asn Leu Thr Leu Cys Leu Gln Pro His
130 135 140
Met Phe His Arg Asn Arg Glu Lys Tyr Thr Tyr Asp Arg Asn Pro Lys
145 150 155 160
Ser Thr Ala Tyr Ile Ala Tyr Gly Glu Gly Lys Tyr Tyr Phe Thr Gly
165 170 175
Ala Leu Asn Gly Gly Lys Ser Ala Ala Phe Leu Asp Leu Cys His Thr
180 185 190
Leu Tyr Asn Asn Thr Gln Ser Asp Leu Lys Gln Asp Ile Ile Ala Leu
195 200 205
Trp His Asp Glu Ser His Leu Asn Lys Phe Ala Leu Gly Arg Glu Asp
210 215 220
Ile Lys Ile Leu Pro Pro Tyr Phe Thr Arg Gly Glu Arg Glu Tyr Trp
225 230 235 240
Lys Lys Thr Ser Lys Leu Met Phe Ser Asp Lys Ser His Tyr Arg Phe
245 250 255
Gly Gly His Ala Tyr Leu Arg Ser Glu Thr Asp Glu Lys Ile Thr Gln
260 265 270
Ala Glu Trp Asn Lys Lys Asn Ala Lys Arg Arg Arg Lys Leu Lys Phe
275 280 285
Arg Ala Lys Gln Tyr Ile Ser Ser Leu Leu Phe Arg Gln
290 295 300
<210> 24
<211> 284
<212> PRT
<213> Psychrobacter sp. P11F6
<400> 24
Met Thr Glu Asp Asn Lys Pro Ser Val Ala Ile Leu Tyr Ile Ala Thr
1 5 10 15
Gly Arg Tyr Thr Val Phe Trp Asp Tyr Phe Tyr Cys Ser Ala Glu Lys
20 25 30
His Leu Leu Pro Asn Ser Asn Lys His Tyr Val Leu Phe Thr Asp Asp
35 40 45
Leu Ala Leu Ile Ser Arg Gln Thr Asp Tyr Pro Asn Val Thr Met Ile
50 55 60
Lys Gln Glu Ala Leu Gly Trp Pro Tyr Ser Thr Leu Met Arg Phe Lys
65 70 75 80
Phe Phe Leu Gly Ala Lys Ser Ile Ile Glu Lys Tyr Asp Phe Ile Phe
85 90 95
Tyr Phe Asn Ala Asn Thr Glu Phe Leu Ser Asp Ile Thr Glu Asp Glu
100 105 110
Leu Leu Pro Leu Asp His His Glu Glu Leu Ser Leu Gly Val Gln Pro
115 120 125
His Met Phe His Leu Asn Lys Arg Ala Tyr Thr Tyr Asp Arg Asn Pro
130 135 140
Gln Ser Gln Ala Tyr Ile Pro Tyr His Lys Gly Arg Tyr Tyr Phe Thr
145 150 155 160
Gly Ala Leu Asn Gly Gly Lys Ser His Ala Tyr Leu Gln Met Cys Glu
165 170 175
Thr Leu Asn Gln Asn Thr Glu Leu Asp Leu Lys Asn Asn Val Ile Ala
180 185 190
Leu Trp His Asp Glu Ser Gln Leu Asn Lys Phe Ala Leu Asp Arg Thr
195 200 205
Asp Ile Lys Val Leu Pro Pro Tyr Phe Thr Arg Gly Glu His Glu Tyr
210 215 220
Trp Lys Lys Ser Ser Lys Ile Met Phe Ser Asp Lys Thr His Tyr Arg
225 230 235 240
Phe Gly Gly His Ala Tyr Leu Arg Ala Glu Thr Asn Asp Lys Ile Thr
245 250 255
Lys Ser Asp Trp Glu Gln Lys Asn Gly Lys Arg Arg Arg Lys Leu Asn
260 265 270
Thr Arg Phe Lys Gln Tyr Ile Ala Ser Leu Phe Phe
275 280
<210> 25
<211> 234
<212> PRT
<213> 肠道沙门氏菌
<400> 25
Met Thr Ile Asn Ile Leu Tyr Ile Cys Thr Gly Glu Tyr Arg Asn Phe
1 5 10 15
Phe Asp Lys Phe Tyr Ser Ser Cys Glu Gly Tyr Phe Ile Pro Glu Tyr
20 25 30
Lys Lys Lys Tyr Tyr Val Phe Thr Asp Ser His Ser Asp Lys Phe Ser
35 40 45
Lys Tyr Ser Asn Val Thr Val Val Pro Val Glu Asn Asn Cys Trp Pro
50 55 60
Leu Asn Thr Leu Leu Arg Phe Ser Tyr Phe Ser Lys Ile Val Ser Asp
65 70 75 80
Leu Gln Pro Asn Thr Tyr Thr Phe Phe Phe Asn Ala Asn Ala Leu Ile
85 90 95
Val Lys Thr Ile Pro Phe Asp Ile Phe Lys Asn Ala Asn Leu Val Gly
100 105 110
Val Val His Pro Gly Tyr Lys Asn Lys Met Ser Ile Phe Tyr Pro Trp
115 120 125
Glu Arg Lys Lys Ser Ala Val Cys Tyr Leu Ser Tyr Phe Lys Lys Gly
130 135 140
Ile Tyr Phe Gln Gly Cys Phe Asn Gly Gly Arg Thr Glu Tyr Phe Cys
145 150 155 160
Asp Leu Ile Lys Thr Cys Asn Asp Met Thr Ile Lys Asp Leu Lys Arg
165 170 175
Asn Ile Ile Ala Lys Val His Asp Glu Ser Tyr Leu Asn Tyr Tyr Phe
180 185 190
Tyr Phe Lys Glu Pro Leu Cys Leu Ser Glu Leu Tyr Ser Trp Pro Glu
195 200 205
Lys Tyr Gly Glu Asn Thr Glu Ala Lys Ile Ile Met Arg Asp Lys Glu
210 215 220
Arg Glu Asp Trp Tyr Ala Asn Ile Lys Ser
225 230
<210> 26
<211> 234
<212> PRT
<213> 肠道沙门氏菌
<400> 26
Met Thr Ile Asn Ile Leu Tyr Ile Cys Thr Gly Glu Tyr Arg Asn Phe
1 5 10 15
Phe Asp Lys Phe Tyr Thr Ser Cys Glu Gly Tyr Phe Ile Pro Glu Cys
20 25 30
Lys Lys Lys Tyr Tyr Val Phe Thr Asp Ser His Ser Asp Lys Phe Ser
35 40 45
Lys Tyr Asn Asn Val Thr Val Val Pro Val Glu Asn Asn Cys Trp Pro
50 55 60
Leu Asn Thr Leu Leu Arg Phe Ser Tyr Phe Ser Lys Ile Val Pro Asp
65 70 75 80
Leu Gln Pro Asn Thr Tyr Thr Phe Phe Phe Asn Ala Asn Ala Leu Ile
85 90 95
Val Lys Thr Ile Pro Phe Asp Thr Phe Lys Asn Ala Asn Leu Val Gly
100 105 110
Val Val His Pro Gly Tyr Lys Asn Lys Met Ser Ile Phe Tyr Pro Trp
115 120 125
Glu Arg Lys Lys Ser Ala Ala Cys Tyr Leu Ser Tyr Phe Lys Asn Gly
130 135 140
Ile Tyr Phe Gln Gly Cys Phe Asn Gly Gly Arg Thr Glu Tyr Phe Cys
145 150 155 160
Asp Leu Ile Lys Thr Cys Asn Asp Met Thr Ile Lys Asp Leu Lys Arg
165 170 175
Asn Ile Ile Ala Lys Val His Asp Glu Ser Tyr Leu Asn Tyr Tyr Phe
180 185 190
Tyr Phe Lys Glu Pro Leu Cys Leu Ser Glu Leu Tyr Ser Trp Pro Glu
195 200 205
Lys Tyr Gly Glu Asn Thr Glu Ala Arg Ile Ile Met Arg Asp Lys Glu
210 215 220
Arg Glu Tyr Trp Tyr Ala Asn Ile Lys Asn
225 230
<210> 27
<211> 189
<212> PRT
<213> 肠道沙门氏菌 I
<400> 27
Lys Phe Ser Lys Tyr Ser Asn Val Thr Val Val Pro Val Glu Asn Asn
1 5 10 15
Cys Trp Pro Leu Asn Thr Leu Leu Arg Phe Ser Tyr Phe Ser Lys Ile
20 25 30
Val Ser Asp Leu Gln Pro Asn Thr Tyr Thr Phe Phe Phe Asn Ala Asn
35 40 45
Ala Leu Ile Val Lys Thr Ile Pro Phe Asp Ile Phe Lys Asn Ala Asn
50 55 60
Leu Val Gly Val Val His Pro Gly Tyr Lys Asn Lys Met Ser Ile Phe
65 70 75 80
Tyr Pro Trp Glu Arg Lys Lys Ser Ala Val Cys Tyr Leu Ser Tyr Phe
85 90 95
Lys Lys Gly Ile Tyr Phe Gln Gly Cys Phe Asn Gly Gly Arg Thr Glu
100 105 110
Tyr Phe Cys Asp Leu Ile Lys Thr Cys Asn Asp Met Thr Ile Lys Asp
115 120 125
Leu Lys Arg Asn Ile Ile Ala Lys Val His Asp Glu Ser Tyr Leu Asn
130 135 140
Tyr Tyr Phe Tyr Phe Lys Glu Pro Leu Cys Leu Ser Glu Leu Tyr Ser
145 150 155 160
Trp Pro Glu Lys Tyr Gly Glu Asn Thr Glu Ala Lys Ile Ile Met Arg
165 170 175
Asp Lys Glu Arg Glu Asp Trp Tyr Ala Asn Ile Lys Ser
180 185
<210> 28
<211> 234
<212> PRT
<213> 肠道沙门氏菌 subsp. enterica serovar Ahuza
<400> 28
Met Thr Ile Asn Ile Leu Tyr Ile Cys Thr Gly Glu Tyr Arg Asn Phe
1 5 10 15
Phe Asp Lys Phe Tyr Pro Ser Cys Glu Gly Tyr Phe Ile Pro Glu Tyr
20 25 30
Lys Lys Lys Tyr Tyr Val Phe Thr Asp Ser His Ser Asp Lys Phe Ser
35 40 45
Lys Tyr Ser Asn Val Thr Val Val Pro Val Glu Asn Asn Cys Trp Pro
50 55 60
Leu Asn Thr Leu Leu Arg Phe Ser Tyr Phe Ser Lys Ile Val Ser Asp
65 70 75 80
Leu Gln Pro Asn Thr Tyr Thr Phe Phe Phe Asn Ala Asn Ala Leu Ile
85 90 95
Val Lys Thr Ile Pro Phe Asp Ile Phe Lys Asn Ala Asn Leu Val Gly
100 105 110
Val Val His Pro Gly Tyr Lys Asn Lys Met Ser Ile Phe Tyr Pro Trp
115 120 125
Glu Arg Lys Lys Ser Ala Val Cys Tyr Leu Ser Tyr Phe Lys Lys Gly
130 135 140
Ile Tyr Phe Gln Gly Cys Phe Asn Gly Gly Arg Thr Glu Tyr Phe Cys
145 150 155 160
Asp Leu Ile Lys Thr Cys Asn Asp Met Thr Ile Lys Asp Leu Lys Arg
165 170 175
Asn Ile Ile Ala Lys Val His Asp Glu Ser Tyr Leu Asn Tyr Tyr Phe
180 185 190
Tyr Phe Lys Glu Pro Leu Cys Leu Ser Glu Leu Tyr Ser Trp Pro Glu
195 200 205
Lys Tyr Gly Glu Asn Thr Glu Ala Lys Ile Ile Met Arg Asp Lys Glu
210 215 220
Arg Glu Asp Trp Tyr Ala Asn Ile Lys Ser
225 230
<210> 29
<211> 165
<212> PRT
<213> 肠道沙门氏菌 subsp. enterica serovar Kingabwa
<400> 29
Met Thr Ile Asn Ile Leu Tyr Ile Cys Thr Gly Glu Tyr Arg Asn Phe
1 5 10 15
Phe Asp Lys Phe Tyr Ser Ser Cys Glu Gly Tyr Phe Ile Pro Glu Tyr
20 25 30
Lys Lys Lys Tyr Tyr Val Phe Thr Asp Ser His Ser Asp Lys Phe Ser
35 40 45
Lys Tyr Ser Asn Val Thr Val Val Pro Val Glu Asn Asn Cys Trp Pro
50 55 60
Leu Asn Thr Leu Leu Arg Phe Ser Tyr Phe Ser Lys Ile Val Ser Asp
65 70 75 80
Leu Gln Pro Asn Thr Tyr Thr Phe Phe Phe Asn Ala Asn Ala Leu Ile
85 90 95
Val Lys Thr Ile Pro Phe Asp Ile Phe Lys Asn Ala Asn Leu Val Gly
100 105 110
Val Val His Pro Gly Tyr Lys Asn Lys Met Ser Ile Phe Tyr Pro Trp
115 120 125
Glu Arg Lys Lys Ser Ala Val Cys Tyr Leu Ser Tyr Phe Lys Lys Gly
130 135 140
Ile Tyr Phe Gln Gly Cys Phe Asn Gly Gly Arg Thr Glu Tyr Phe Cys
145 150 155 160
Asp Leu Ile Lys Thr
165
<210> 30
<211> 258
<212> PRT
<213> Selenomonas ruminantium
<400> 30
Met Lys Ile Ala Ile Leu Tyr Ile Ala Leu Gly Lys Tyr Asp Val Phe
1 5 10 15
Trp Lys Asp Phe Tyr Leu Ser Ala Glu Met His Phe Ile Lys Ser Ile
20 25 30
Lys Lys Asp Tyr Tyr Ile Phe Thr Asp Ala Gln His Ile Tyr Lys Glu
35 40 45
Asp Ala Asp Asn Val Lys Lys Ile Pro Gln Glu Asn Leu Gly Trp Pro
50 55 60
Gly Asn Thr Leu Phe Arg Phe Asn Ile Phe Leu Asn Met Glu Ser Glu
65 70 75 80
Leu Glu Lys Tyr Asp Tyr Ile Phe Phe Phe Asn Ala Asn Tyr Ile Phe
85 90 95
Val Lys Asp Ile Asp Val Asp Phe Leu Pro Ile Asn Lys Leu Leu Val
100 105 110
Val Gln His Pro Gly Tyr Tyr Asn Lys Arg Val Asn Lys Tyr Pro Tyr
115 120 125
Glu Lys Asn Pro Asn Ser Leu Ala Tyr Val Ser Asn Lys Glu Lys Lys
130 135 140
Thr Tyr Val Gln Gly Cys Leu Glu Gly Gly Ser Lys Lys Glu Phe Ile
145 150 155 160
Asn Leu Ile Arg Asp Leu Ala Gly Asn Ile Lys Asn Asp Tyr Ser Asn
165 170 175
Gly Ile Ile Ala Lys Trp His Asp Glu Ser His Leu Asn Lys Tyr Ile
180 185 190
Cys Ser His Glu Tyr Lys Leu Met His Pro Gly Tyr Ala Tyr Pro Glu
195 200 205
Gly Trp Glu Ile Pro Tyr Pro Met Glu Ile Met Thr Arg Asp Lys Arg
210 215 220
Lys Ile Ala Ser Tyr Asp Val Leu Arg Gly Thr Asn Ser Lys Gly Gly
225 230 235 240
Lys Ala Ile Leu Lys Lys Ile Lys Ile Arg Leu Ile Asp Ile Met Glu
245 250 255
His Phe
<210> 31
<211> 262
<212> PRT
<213> Smithella sp. SDB
<400> 31
Met Gln Ile Gly Val Leu Tyr Ile Cys Ile Gly Lys Tyr Ser Ile Phe
1 5 10 15
Trp Lys Ser Phe Tyr Glu Ser Ser Glu Lys His Phe Leu Val His His
20 25 30
Gln Lys Lys Tyr Phe Val Phe Thr Asp Ala Gln Ile Ile Asp Tyr Gln
35 40 45
Asp Asn Ala Asn Val Val Ile Val Phe Gln Lys Asn Leu Gly Trp Pro
50 55 60
Asn Asn Thr Leu Met Arg Phe His Ile Phe Leu Arg His Lys Thr Leu
65 70 75 80
Leu Gln Glu Met Asp Phe Leu Phe Phe Cys Asn Ala Asn Leu Leu Phe
85 90 95
Val Asp Asn Val Gly Asp Glu Ile Leu Pro Leu Glu Glu Gly Phe Ala
100 105 110
Ala Leu Gln His Pro Gly Tyr Trp Asn Lys Pro Arg Lys Leu Phe Pro
115 120 125
Tyr Glu Thr Asn Pro Met Ser Leu Ala Asn Val Pro Ala His Gln Gly
130 135 140
Lys Tyr Tyr Val Met Gly Ala Phe Asn Gly Gly Gln Ala Lys Ile Phe
145 150 155 160
Leu Lys Met Ser Glu Glu Leu Ser Lys Asn Ile Asp Glu Asp Phe Lys
165 170 175
Lys Asn Ile Val Ala Val Trp His Asp Glu Ser His Leu Asn Lys Tyr
180 185 190
Val Val Asp Lys Lys Val Lys Ile Leu Asn Pro Ser Tyr Gly Tyr Pro
195 200 205
Glu Asp Arg Asp Leu Pro Phe Lys Pro Lys Ile Met Ile Arg Asp Lys
210 215 220
Ala Lys Tyr Gly Gly His Asn Leu Leu Arg Gly Ile Pro Glu Asn Ser
225 230 235 240
Ser Phe Ile Arg Lys Tyr Phe Arg Glu Ile Lys Ser Phe Ile Ala Lys
245 250 255
Tyr Leu Arg Asn Asn Arg
260
<210> 32
<211> 243
<212> PRT
<213> Synechococcus phage ACG-2014f
<400> 32
Met Lys Lys Val Ala Ile Ile Phe Ile Gly Thr Gly Arg Tyr Leu Glu
1 5 10 15
Phe Leu Pro Lys Tyr Tyr Glu Gln Ala Glu Ala Asn Leu Phe Pro Asp
20 25 30
Arg Pro Lys His Tyr Tyr Val Phe Thr Asp Gly Asp Leu Gly Asn Glu
35 40 45
Leu Pro Asp Asn Val Thr Val Tyr Glu Gln Glu His Leu Gln Trp Pro
50 55 60
Tyr Ile Thr Leu Tyr Arg Phe Gly Ile Ile Gln Lys His Leu Glu Glu
65 70 75 80
Ile Glu Lys Glu Cys Gly Phe Leu Leu Phe Met Asp Ala Asp Thr Gln
85 90 95
Val Val Ser Pro Val Ser Phe Asp Glu Val Phe Lys Lys Gly Lys Pro
100 105 110
Tyr Thr Gly Val His His Pro Cys His Ala Leu Asn Met Pro Pro His
115 120 125
Asn Glu Phe Pro Gly Ser Leu Glu Thr Asn Thr Ala Ser Lys Ala Ala
130 135 140
Cys Lys Pro Gly Asp Asp Phe Ser Val Tyr Trp Gln Gly Cys Val Trp
145 150 155 160
Gly Gly Asn Ile Lys Gly Ala Arg Lys Ile Ile Asp Thr Leu His His
165 170 175
Arg Thr Lys Gln Asp Glu Glu Asn Gly Ile Val Ala Leu Trp His Asp
180 185 190
Glu Ser His Ile Asn Arg Tyr Phe Leu Asp Asn Lys Asp Lys Val Asn
195 200 205
Thr Leu Ser Pro Ser Phe Ala Tyr Pro Glu Ser Phe Thr Glu Tyr Met
210 215 220
Glu Asp Tyr Glu Pro Lys Ile Val His Leu Ala Lys Glu Asn Ser Lys
225 230 235 240
Tyr Gln Val
<210> 33
<211> 243
<212> PRT
<213> Synechococcus phage ACG-2014f
<400> 33
Met Lys Lys Val Ala Ile Ile Phe Ile Gly Thr Gly Arg Tyr Leu Glu
1 5 10 15
Phe Leu Pro Lys Tyr Tyr Glu Gln Ala Glu Ala Asn Leu Phe Pro Asp
20 25 30
Arg Pro Lys His Tyr Tyr Val Phe Thr Asp Gly Asp Leu Gly Asn Glu
35 40 45
Leu Pro Asp Asn Val Thr Val Tyr Glu Gln Glu His Leu Gln Trp Pro
50 55 60
Tyr Ile Thr Leu Tyr Arg Phe Gly Ile Ile Gln Lys His Leu Glu Glu
65 70 75 80
Ile Glu Lys Glu Cys Gly Phe Leu Leu Phe Met Asp Ala Asp Thr Gln
85 90 95
Val Val Ser Pro Val Ser Phe Asp Glu Val Phe Lys Lys Gly Lys Pro
100 105 110
Tyr Thr Gly Val His His Pro Cys His Ala Leu Asn Met Pro Pro His
115 120 125
Asn Glu Phe Pro Gly Ser Leu Glu Thr Asn Thr Ala Ser Lys Ala Ala
130 135 140
Cys Lys Pro Gly Asp Asp Phe Ser Val Tyr Trp Gln Gly Cys Val Trp
145 150 155 160
Gly Gly Asn Ile Lys Gly Ala Arg Lys Ile Ile Asp Thr Leu His His
165 170 175
Arg Thr Lys Gln Asp Glu Glu Asn Gly Ile Ile Ala Lys Trp His Asp
180 185 190
Glu Ser His Ile Asn Arg Tyr Phe Leu Asp Asn Lys Asp Lys Val Asn
195 200 205
Thr Leu Ser Pro Ser Phe Ala Tyr Pro Glu Ser Phe Thr Glu Tyr Met
210 215 220
Glu Asp Tyr Glu Pro Lys Ile Val His Leu Ala Lys Glu Asn Ser Lys
225 230 235 240
Tyr Gln Val
<210> 34
<211> 243
<212> PRT
<213> Synechococcus phage ACG-2014f
<400> 34
Met Lys Lys Val Ala Ile Ile Phe Ile Gly Thr Asp Arg Tyr Leu Glu
1 5 10 15
Phe Leu Pro Lys Tyr Tyr Glu Gln Ala Glu Ala Asn Leu Phe Pro Asp
20 25 30
Arg Pro Lys His Tyr Tyr Val Phe Thr Asp Gly Asp Leu Gly Asn Glu
35 40 45
Leu Pro Asp Asn Val Thr Val Tyr Glu Gln Glu His Leu Gln Trp Pro
50 55 60
Tyr Ile Thr Leu Tyr Arg Phe Gly Ile Ile Gln Lys His Leu Glu Glu
65 70 75 80
Ile Glu Lys Glu Cys Gly Phe Leu Leu Phe Met Asp Ala Asp Thr Gln
85 90 95
Val Val Ser Pro Val Ser Phe Asp Glu Val Phe Lys Lys Gly Lys Pro
100 105 110
Tyr Thr Gly Val His His Pro Cys His Ala Leu Asn Met Pro Pro His
115 120 125
Asn Glu Phe Pro Gly Ser Leu Glu Thr Asn Thr Ala Ser Lys Ala Ala
130 135 140
Cys Lys Pro Gly Asp Asp Phe Ser Val Tyr Trp Gln Gly Cys Val Trp
145 150 155 160
Gly Gly Asn Ile Lys Gly Ala Arg Lys Ile Ile Asp Thr Leu His His
165 170 175
Arg Thr Lys Gln Asp Glu Glu Asn Gly Ile Ile Ala Lys Trp His Asp
180 185 190
Glu Ser His Ile Asn Arg Tyr Phe Leu Asp Asn Lys Asp Lys Val Asn
195 200 205
Thr Leu Ser Pro Ser Phe Ala Tyr Pro Glu Ser Phe Thr Glu Tyr Met
210 215 220
Glu Asp Tyr Glu Pro Lys Ile Val His Leu Ala Lys Glu Asn Ser Lys
225 230 235 240
Tyr Gln Val
<210> 35
<211> 238
<212> PRT
<213> Synechococcus phage Bellamy
<400> 35
Met Lys Leu Ala Val Val Phe Ile Gly Thr Gly Asp Tyr Ile Asn Phe
1 5 10 15
Leu Pro Ser Tyr Tyr Glu Ala Cys Glu Glu Phe Leu Val Pro Asn Thr
20 25 30
Glu Lys Thr Tyr Phe Val Phe Thr Asp Gly Asp Ile Gly Asp Pro Pro
35 40 45
Glu Asn Val Lys Leu Tyr Glu Gln Glu His Leu Pro Trp Pro Tyr Ile
50 55 60
Thr Leu Glu Arg Phe Lys Tyr Ile Leu Lys Ala Glu Ser Asp Leu Ala
65 70 75 80
Glu Phe Asp Tyr Val Leu Phe Leu Asp Ala Asp Thr Arg Val Val Glu
85 90 95
Thr Val Thr Glu Glu Glu Leu Phe Thr Asp Lys Lys Tyr Ile Gly Val
100 105 110
His His Pro Cys His Phe Leu Gly Met Pro Pro His Asp Asn Pro Pro
115 120 125
Gly Ala Phe Glu Thr Arg Phe Glu Ser Ala Ala Gly Ile Ser Gly Asp
130 135 140
Asp Asp Thr Ser Ile Tyr Phe Gln Gly Cys Leu Trp Gly Gly Lys Met
145 150 155 160
Pro Tyr Val Leu Asp Met Ile Arg Glu Leu Ala Gln Arg Thr Gln Phe
165 170 175
Asp Leu Asn Arg Asp Val Ile Ala Gln Trp His Asp Glu Ser Gln Met
180 185 190
Asn Lys Phe Phe Cys Glu Arg Arg Glu Asp Val His Val Met Gly Pro
195 200 205
Glu Tyr Ala Tyr Pro Glu Cys Phe Gly Ala Tyr Cys Thr Phe Glu Pro
210 215 220
Lys Ile Val His Leu Ala Lys Asp Asn Ser Lys Tyr Gln Gln
225 230 235
<210> 36
<211> 238
<212> PRT
<213> Synechococcus phage S-CAM9
<400> 36
Met Lys Val Ala Val Val Phe Ile Gly Thr Glu Lys Tyr Leu Asp Phe
1 5 10 15
Leu Pro Ser Trp Tyr Glu Arg Cys Glu Glu Asn Phe Leu Pro Gly Val
20 25 30
Glu Lys Lys Tyr Leu Val Phe Thr Asp Gly Asp Val Pro Glu Ser Pro
35 40 45
Asp Asn Ala Val Val Tyr Lys Gln Glu His Leu Asp Trp Pro Tyr Ile
50 55 60
Thr Leu Tyr Arg Phe Lys Ile Ile Gln Lys Ala Leu Asp Glu Ile Val
65 70 75 80
Gly Cys Asp Trp Leu Val Phe Leu Asp Ala Asp Met Ala Val Val Asp
85 90 95
Thr Val Thr Ala Pro Glu Ile Phe Thr Asp Lys Pro Tyr Ile Gly Val
100 105 110
His His Pro Cys His Phe Leu Lys Phe Pro Pro His Asn Gln Pro Pro
115 120 125
Gly Ser Phe Glu Thr Asn Pro Leu Ser Thr Ala Lys Val Pro Asp Asp
130 135 140
Tyr Asp Phe Ser Ile Tyr Trp Gln Gly Cys Leu Trp Gly Gly Lys Thr
145 150 155 160
Ser Glu Val Ile Ser Met Met Glu Glu Leu Asn Ala Arg Ile Ser Leu
165 170 175
Asp Glu Glu Asn Asn Val Ile Ala Gln Trp His Asp Glu Ser His Leu
180 185 190
Asn Ala Phe Tyr Ala Gln Asn Lys Asn Leu Val His Thr Leu Gly Pro
195 200 205
Glu Phe Ala Phe Pro Glu Val Phe Ala Glu Ala Cys Glu Phe Gln Ala
210 215 220
Lys Ile Val His Leu Ala Lys Asp Asn Ser Lys Tyr His Val
225 230 235
<210> 37
<211> 236
<212> PRT
<213> Yersinia kristensenii
<400> 37
Met Thr Val Asn Ile Leu Tyr Val Cys Thr Gly Asn Tyr Phe Ser Phe
1 5 10 15
Phe Lys Asp Phe Tyr Val Ser Cys Glu Lys Leu Phe Leu Pro Asp Cys
20 25 30
Lys Lys Lys Tyr Phe Val Phe Thr Asp Ile Asp Thr Ser Ser Phe Asp
35 40 45
Ile Asn Asp Asp Ile Glu Tyr Ile Lys Ile Glu Lys Asn Cys Trp Pro
50 55 60
Leu Asn Thr Leu Leu Arg Phe Ser Tyr Phe Asn Ile Val Arg Asn Lys
65 70 75 80
Ile Leu Lys Ser Asp Tyr Val Phe Phe Phe Asn Ala Asn Ala Leu Ile
85 90 95
Val Lys Glu Phe Ser Ser Asp Leu Leu Pro Thr Glu Asp Glu Asn Tyr
100 105 110
Leu Val Gly Val Val His Pro Gly Tyr Glu Asn Lys Pro Ser Phe Leu
115 120 125
Tyr Pro Trp Glu Arg Arg Ile Lys Ser Gln Cys Arg Ile Gly Tyr Leu
130 135 140
Cys Lys Gly Thr Tyr Tyr Gln Gly Cys Phe Ser Gly Gly Arg Thr Asn
145 150 155 160
Glu Tyr Val Asp Leu Ile Asp Thr Cys Arg Leu Asn Thr Glu Lys Asp
165 170 175
Leu Lys Lys Asn Ile Ile Ala Lys Val His Asp Glu Ser Tyr Leu Asn
180 185 190
His Tyr Phe Lys Asn Lys Lys Pro Lys Ser Leu Ser Ser Leu Tyr Ser
195 200 205
Trp Pro Glu Lys Tyr Gly Asp Asn Glu Asn Ala Ile Ile Ile Met Arg
210 215 220
Asp Lys Glu Lys Tyr Glu Trp Tyr Ser Leu Ile Lys
225 230 235
<210> 38
<211> 9
<212> PRT
<213> 人工序列
<220>
<223> motif 1
<220>
<221> UNSURE
<222> (2)..(2)
<223> Xaa可为任何自然发生氨基酸
<220>
<221> VARIANT
<222> (3)..(3)
<223> Xaa可为Ala, Cys, Ile或Leu
<220>
<221> UNSURE
<222> (4)..(4)
<223> Xaa可为任何自然发生氨基酸
<220>
<221> UNSURE
<222> (6)..(7)
<223> Xaa可为任何自然发生氨基酸
<220>
<221> VARIANT
<222> (8)..(9)
<223> Xaa可为Ala, Cys或Gly
<400> 38
Tyr Xaa Xaa Xaa Gly Xaa Xaa Xaa Xaa
1 5
<210> 39
<211> 9
<212> PRT
<213> 人工序列
<220>
<223> motif 2
<220>
<221> UNSURE
<222> (2)..(2)
<223> Xaa可为任何自然发生氨基酸
<220>
<221> VARIANT
<222> (3)..(3)
<223> Xaa可为Ala或Gly
<220>
<221> UNSURE
<222> (4)..(4)
<223> Xaa可为任何自然发生氨基酸
<220>
<221> UNSURE
<222> (6)..(7)
<223> Xaa可为任何自然发生氨基酸
<220>
<221> VARIANT
<222> (8)..(9)
<223> Xaa可为Ala, Cys或Gly
<400> 39
Tyr Xaa Xaa Xaa Ala Xaa Xaa Xaa Xaa
1 5
<210> 40
<211> 306
<212> PRT
<213> Helicobacter mustelae
<400> 40
Met Gln Ser Thr Ala Gln Asn Thr Gln Gln Asn Thr His Phe Ala Gly
1 5 10 15
Ser Ser Gln Thr Thr Pro Gln Ala Ala Gln Ser Val Gln Gln Ala Ser
20 25 30
Leu Ala Leu Pro Lys Ser Ser Pro Thr Cys Tyr Lys Ile Ala Ile Leu
35 40 45
Tyr Ile Cys Thr Gly Ala Tyr Ser Ile Phe Trp Gln Asp Phe Tyr Asp
50 55 60
Ser Ala Lys Val His Leu Leu Pro Ala His Arg Leu Thr Tyr Phe Val
65 70 75 80
Phe Thr Asp Ala Asp Ser Leu Tyr Ala Glu Glu Ala Ser Asp Val Arg
85 90 95
Lys Ile Tyr Gln Glu Asn Leu Gly Trp Pro Phe Asn Thr Leu Lys Arg
100 105 110
Phe Glu Met Phe Leu Gly Gln Glu Glu Ala Leu Arg Glu Phe Asp Phe
115 120 125
Val Phe Phe Phe Asn Ala Asn Cys Leu Phe Phe Gln His Ile Gly Asp
130 135 140
Glu Phe Leu Pro Ile Glu Glu Asp Ile Leu Val Thr Gln His Tyr Gly
145 150 155 160
Phe Arg Asp Ala Ser Pro Glu Cys Phe Thr Tyr Glu Arg Asn Pro Lys
165 170 175
Ser Leu Ala Tyr Val Pro Phe Gly Lys Gly Lys Ala Tyr Val Tyr Gly
180 185 190
Ser Thr Asn Gly Gly Lys Ala Gly Ala Phe Leu Ala Leu Ala Arg Thr
195 200 205
Leu Gln Glu Arg Ile Gln Glu Asp Leu Ser Arg Gly Ile Ile Ala Ile
210 215 220
Trp His Asp Glu Ser His Leu Asn Ala Tyr Ile Ile Asp His Pro Asn
225 230 235 240
Tyr Lys Met Leu Asp Tyr Gly Tyr Gly Phe Pro Glu Gly Tyr Gly Arg
245 250 255
Val Pro Gly Gly Gly Val Tyr Ile Phe Leu Arg Asp Lys Ser Arg Val
260 265 270
Ile Asp Val Asn Ala Ile Lys Gly Met Gly Ser Pro Ala Asn Arg Arg
275 280 285
Leu Lys Asn Ala Leu Arg Lys Leu Lys His Phe Ser Lys Arg Leu Leu
290 295 300
Gly Arg
305
<210> 41
<211> 268
<212> PRT
<213> Clostridium bolteae 90A9
<400> 41
Met Thr Lys Ile Ala Ile Leu Tyr Ile Cys Ile Gly Lys Tyr Asp Thr
1 5 10 15
Phe Trp Lys Asp Phe Tyr Ile Ser Phe Glu Glu Arg Phe Met Thr Glu
20 25 30
Cys Glu Lys Glu Tyr Phe Val Phe Thr Asp Ser Lys Phe Ile Tyr Gly
35 40 45
Glu Asn Val Thr Glu Arg Ile His Arg Ile His Gln Glu Asn Leu Gly
50 55 60
Trp Pro Gly Asn Thr Leu Phe Arg Phe Lys Met Phe Leu Gln Ile Ile
65 70 75 80
Pro Glu Leu Lys Lys Phe Asp Tyr Thr Phe Phe Met Asn Ala Asn Val
85 90 95
Ile Cys Lys Glu Arg Val Thr Glu Glu Met Met Leu Pro Lys Asp Glu
100 105 110
Lys Leu Val Val Val Gln His Pro Gly Tyr Tyr Lys Gln Lys Pro Tyr
115 120 125
Glu Phe Glu Tyr Asp Arg Asn Arg Lys Ser Lys Ala Tyr Ile Pro Tyr
130 135 140
Tyr Lys Gly Glu Val Tyr Ile Cys Gly Gly Ile Asn Gly Gly Arg Thr
145 150 155 160
Glu Ala Tyr Ile Glu Leu Ile Lys Thr Leu Asn Lys Asn Ile Asn Ser
165 170 175
Asp Ile Glu Asn Gly Ile Ile Ala Arg Trp His Asp Glu Ser His Ile
180 185 190
Asn Arg Tyr Ile Leu Asp Asn Thr Cys Tyr Lys Leu Leu Ser Pro Ala
195 200 205
Tyr Cys Tyr Pro Glu Asn Trp Asp Ile Pro Phe Thr Pro Ile Leu Val
210 215 220
Val Leu Asp Lys Lys Asp Arg Ile Cys Leu Asp Ser Ala Lys Thr Ala
225 230 235 240
Glu Gln Cys Ala Asp Ile Phe Phe Leu Glu Lys Ile Lys Lys Gln Phe
245 250 255
Ile Gln Phe Phe Trp Lys Leu Ile Tyr Ile Leu Lys
260 265
<210> 42
<211> 786
<212> PRT
<213> Akkermansia muciniphila
<400> 42
Met Lys Cys Val Leu Ile Val Ser Pro Gly Glu Lys Ser Glu Gly Ala
1 5 10 15
Ser Glu Leu His Arg Met Gly Tyr Glu Leu Glu Leu Tyr Pro Ser Thr
20 25 30
Ala Asp Leu Ser Pro Leu Arg Asp Ala Arg Glu Glu Glu Ser Ala Ser
35 40 45
Tyr Leu Gly Arg Ser Pro Ala Ser Ala Glu Arg Ser His Val Arg Ser
50 55 60
Leu Arg Ala Ser Phe Ile Arg Leu Leu Glu Asp Arg Asn Tyr Ala Gly
65 70 75 80
Ser Asp Leu Ile Ile Phe Gly Glu Ser Asp Ala Val Pro Met Val Ala
85 90 95
Ser Ser Arg Leu Glu Thr Ala Leu Arg Lys Glu Met Lys Glu His Pro
100 105 110
Glu Thr Asp Ile Phe Arg Leu Phe His His Ala Val Trp Ser Pro Gln
115 120 125
Gly Ala Pro Gly Glu Ser Asp Glu Ile Leu Phe Glu Asp Phe Lys Thr
130 135 140
Gly Lys Thr Asp Ala Asn Thr Ser Tyr Val Trp Gly Thr His Ala Leu
145 150 155 160
Val Ile Pro Ala Ala Arg Arg Pro Arg Val Ala Arg Val Phe Ala Asp
165 170 175
Tyr Arg Leu Pro Thr Asp Ile Ala Leu Glu Ala Ala Asn Ser His Gly
180 185 190
Asp Leu Lys Ile Arg Val Ala Arg His Asn Leu Phe Tyr Gln His Glu
195 200 205
Arg Thr Lys Gln Arg Pro Asp Cys Lys Ile Ala Val Cys Leu Ser Ser
210 215 220
Tyr Lys Arg Leu Thr Asp Leu Gln Arg Gln Ile Trp Cys Met Met Asp
225 230 235 240
Gln Ser Tyr Pro Asn Leu His Val Phe Ala Ala Val Lys Gly Ile Pro
245 250 255
Glu Gly Thr Tyr Arg Arg Thr Val Leu Pro Leu Phe Glu His Phe Ile
260 265 270
His Glu Gly Arg Leu Thr Met Arg Leu Phe Pro Asn Lys Asn Gln Leu
275 280 285
Ser Asn Phe Leu Asp Thr Ile Arg Asp Leu Asn Val Ser Asp Tyr Asp
290 295 300
Leu Phe Ala Lys Ile Asp Asp Asp Asp Leu Tyr Gly Arg Asp Tyr Phe
305 310 315 320
Lys Ser Val Asn Lys Phe His Leu His Leu Pro Pro Glu Phe Ser Ser
325 330 335
Phe Tyr Cys Gly Pro Gly Glu Tyr Leu Ser Val Arg Gly Gly Tyr Pro
340 345 350
Phe Ser Gly Asn Gly Phe Phe Gly Cys Phe Gly Pro Thr Leu Val Leu
355 360 365
Ser Arg Asp Val Leu Glu Lys Leu Ile Ile Cys Glu Thr Asn Pro His
370 375 380
Met Ile Ser Gln Ile Ser Pro Arg Leu Arg His Ala Gly Tyr Gly Phe
385 390 395 400
Thr Glu Asp Asn Phe Met His Met Met Met Leu Asp Thr Gly Ser Ser
405 410 415
Asn Arg Thr Arg Tyr Val Gln Glu Met Ala Leu Pro Met His Leu Ala
420 425 430
Ile Gln Thr Gly Asn Ala Ser Val Met Arg Gly Gly Leu Val Pro Gly
435 440 445
Asp Phe Arg Gly Arg Asn Trp Asn Ile Ser Thr Asn Gln Val Asn Glu
450 455 460
Glu Arg Leu Met Glu Val Tyr His Pro Gln Trp His Asp Ile Val Arg
465 470 475 480
Val Phe Gly Asn Arg Ala Arg Arg Phe Glu Arg Asp Asp Glu Ala Asp
485 490 495
Val Leu Ser Val Thr Asp Glu Lys Ile Thr Leu Lys Trp Asp Cys Trp
500 505 510
Gly Val Glu Ala Phe Lys Lys Met Glu Asp Gly Thr Phe Tyr Leu Ser
515 520 525
Ser Gly Gly Arg Gln Glu Glu Pro Phe Ser Pro Arg Lys Lys Val Ala
530 535 540
Val Leu Phe Ile Ala Thr Gly Arg Tyr Met Thr Phe Trp Glu Glu Phe
545 550 555 560
Tyr Ala Ala Ser Lys Gln Tyr Phe Leu Thr Gly His Asp Val His Tyr
565 570 575
Phe Leu Phe Thr Asp His Pro Glu Val Glu Thr Gly Asp Asp Val Thr
580 585 590
Leu Val Arg Lys Pro Phe Tyr Pro Trp Pro Met Glu Thr Leu Arg Arg
595 600 605
Phe Glu Thr Phe Leu Thr Val Arg Glu Glu Leu Gln Gln Tyr Asp Tyr
610 615 620
Ile Tyr Phe Met Asn Gly Thr Leu Leu Pro Val Gly Pro Val Gly Gln
625 630 635 640
Glu Ile Phe Pro Met Asn Arg Gln Gly Leu Met Val Thr Leu His Pro
645 650 655
Gly Tyr Tyr Gln Arg Pro Arg Ser Thr Tyr Pro Tyr Glu Lys Asn Gly
660 665 670
Met Ser Arg Ala Arg Val Leu His Ser Glu Gly Glu Tyr Tyr Val Ala
675 680 685
Gly Gly Phe Asn Gly Gly Arg Ala Glu Asp Tyr Leu Arg Met Cys Arg
690 695 700
Glu Leu Ala Asp Ala Val Arg Arg Asp Leu Glu Asp Gly Val Ile Ala
705 710 715 720
Val Trp His Asp Glu Ser His Leu Asn Lys Tyr Val Ile Gly Arg His
725 730 735
Pro Leu Val Leu Ser Pro Glu Tyr Leu Phe Pro Glu Thr Leu Asp Phe
740 745 750
Asn Gln Lys Asn Leu Met Ala Ile Lys Pro Lys Val Lys Met Ile Val
755 760 765
Lys Asp Lys Ser Leu Gln Lys His Gly Gly His Ala Trp Leu Arg Gln
770 775 780
Gln Ile
785
<210> 43
<211> 786
<212> PRT
<213> Akkermansia muciniphila
<400> 43
Met Lys Cys Val Leu Ile Val Ser Pro Gly Glu Lys Ser Glu Gly Ala
1 5 10 15
Ser Glu Leu His Arg Met Gly Tyr Glu Leu Glu Leu Tyr Pro Ser Thr
20 25 30
Ala Asp Leu Ser Pro Leu Arg Asp Ala Arg Glu Glu Glu Ser Ala Ser
35 40 45
Tyr Leu Gly Arg Ser Pro Ala Ser Ala Glu Arg Ser His Val Arg Ser
50 55 60
Leu Arg Ala Ser Phe Ile Arg Leu Leu Glu Asp Arg Asn Tyr Ala Gly
65 70 75 80
Ser Asp Leu Ile Ile Phe Gly Glu Ser Asp Ala Val Pro Met Val Ala
85 90 95
Ser Ser Arg Leu Glu Thr Ala Leu Arg Lys Glu Met Lys Glu His Pro
100 105 110
Glu Thr Asp Ile Phe Arg Leu Phe His His Ala Val Trp Ser Pro Gln
115 120 125
Gly Ala Pro Gly Glu Ser Asp Glu Ile Leu Phe Glu Asp Phe Lys Thr
130 135 140
Gly Lys Thr Asp Ala Asn Thr Ser Tyr Val Trp Gly Thr His Ala Leu
145 150 155 160
Val Ile Pro Ala Ala Arg Arg Pro Arg Val Ala Arg Val Phe Ala Asp
165 170 175
Tyr Arg Leu Pro Thr Asp Ile Ala Leu Glu Ala Ala Asn Ser His Gly
180 185 190
Asp Leu Lys Ile Arg Val Ala Arg His Asn Leu Phe Tyr Gln His Glu
195 200 205
Arg Thr Lys Gln Arg Pro Asp Cys Lys Ile Ala Val Cys Leu Ser Ser
210 215 220
Tyr Lys Arg Leu Thr Asp Leu Gln Arg Gln Ile Trp Cys Met Met Asp
225 230 235 240
Gln Ser Tyr Pro Asn Leu His Val Phe Ala Ala Val Lys Gly Ile Pro
245 250 255
Glu Gly Thr Tyr Arg Arg Thr Val Leu Pro Leu Phe Glu His Phe Ile
260 265 270
His Glu Gly Arg Leu Thr Met Arg Leu Phe Pro Asn Lys Asn Gln Leu
275 280 285
Ser Asn Phe Leu Asp Thr Ile Arg Asp Leu Asn Val Ser Asp Tyr Asp
290 295 300
Leu Phe Ala Lys Ile Asp Asp Asp Asp Leu Tyr Gly Arg Asp Tyr Phe
305 310 315 320
Lys Ser Val Asn Lys Phe His Leu His Leu Pro Pro Glu Phe Ser Ser
325 330 335
Phe Tyr Cys Gly Pro Gly Glu Tyr Leu Ser Val Arg Gly Gly Tyr Pro
340 345 350
Phe Ser Gly Asn Gly Phe Phe Gly Cys Phe Gly Pro Thr Leu Val Leu
355 360 365
Ser Trp Asp Val Leu Glu Lys Leu Ile Ile Cys Glu Thr Asn Pro His
370 375 380
Met Ile Ser Gln Ile Ser Pro Arg Leu Arg His Ala Gly Tyr Gly Phe
385 390 395 400
Thr Glu Asp Asn Phe Met His Met Met Met Leu Asp Thr Gly Ser Ser
405 410 415
Asn Arg Thr Arg Tyr Val Gln Glu Met Ala Leu Pro Met His Leu Ala
420 425 430
Ile Gln Thr Gly Asn Ala Ser Val Met Arg Gly Gly Leu Val Pro Gly
435 440 445
Asp Phe Arg Gly Arg Asn Trp Asn Ile Ser Thr Asn Gln Val Asn Glu
450 455 460
Glu Arg Leu Met Glu Val His His Pro Gln Trp His Asp Ile Val Arg
465 470 475 480
Val Phe Gly Asn Arg Ala Arg Arg Phe Glu Arg Asp Asp Glu Ala Asp
485 490 495
Val Leu Ser Val Thr Asp Glu Lys Ile Thr Leu Lys Trp Asp Cys Trp
500 505 510
Gly Val Glu Ala Phe Lys Lys Met Glu Asp Gly Thr Phe Tyr Leu Ser
515 520 525
Ser Gly Gly Arg Gln Glu Glu Pro Phe Ser Pro Arg Lys Lys Val Ala
530 535 540
Val Leu Phe Ile Ala Thr Gly Arg Tyr Met Thr Phe Trp Glu Glu Phe
545 550 555 560
Tyr Ala Ala Ser Lys Gln Tyr Phe Leu Thr Gly His Asp Val His Tyr
565 570 575
Phe Leu Phe Thr Asp His Pro Glu Val Glu Thr Gly Asp Asp Val Thr
580 585 590
Leu Val Arg Lys Pro Phe Tyr Pro Trp Pro Met Glu Thr Leu Arg Arg
595 600 605
Phe Glu Thr Phe Leu Thr Val Arg Glu Glu Leu Gln Gln Tyr Asp Tyr
610 615 620
Ile Tyr Phe Met Asn Gly Thr Leu Leu Pro Val Gly Pro Val Gly Gln
625 630 635 640
Glu Ile Phe Pro Met Asp Arg Gln Gly Leu Met Val Thr Leu His Pro
645 650 655
Gly Tyr Tyr Gln Arg Pro Arg Ser Thr Tyr Pro Tyr Glu Lys Asn Gly
660 665 670
Met Ser Arg Ala Arg Val Leu His Ser Glu Gly Glu Tyr Tyr Val Ala
675 680 685
Gly Gly Phe Asn Gly Gly Arg Ala Glu Asp Tyr Leu Arg Met Cys Arg
690 695 700
Glu Leu Ala Asp Ala Val Arg Arg Asp Leu Glu Asp Gly Val Ile Ala
705 710 715 720
Val Trp His Asp Glu Ser His Leu Asn Lys Tyr Val Ile Gly Arg His
725 730 735
Pro Leu Val Leu Ser Pro Glu Tyr Leu Phe Pro Glu Thr Leu Asp Phe
740 745 750
Asn Gln Lys Asn Leu Met Ala Ile Lys Pro Lys Val Lys Met Ile Val
755 760 765
Lys Asp Lys Ser Leu Gln Lys His Gly Gly His Ala Trp Leu Arg Gln
770 775 780
Gln Ile
785
<210> 44
<211> 787
<212> PRT
<213> Akkermansia sp. BIOML-A61
<400> 44
Met Lys Cys Val Leu Ile Ile Ser Ser Gly Glu Met Ala Glu Gly Ala
1 5 10 15
Ser Glu Leu His Arg Met Gly Tyr Glu Leu Glu Leu Tyr Pro Ser Thr
20 25 30
Arg Asp Leu Ser Ser Leu Lys Asp Thr Arg Glu Lys Glu Ser Ala Ala
35 40 45
Phe Ile Gly Arg Asp Pro Cys Ser Ala Glu Arg Ser His Val Arg Ser
50 55 60
Leu Arg Ala Ser Phe Ile Arg Met Leu Glu Asp Arg Arg Tyr Ala Gly
65 70 75 80
Asn Asp Leu Ile Ile Phe Gly Glu Ser Asp Ala Val Pro Met Val Ala
85 90 95
Ser Ser Arg Leu Glu Ala Ala Leu Arg Lys Glu Met Lys Glu His Pro
100 105 110
Glu Thr Asp Ile Phe Arg Leu Phe His His Ala Val Trp Ser Pro Gln
115 120 125
Gly Asn Pro Phe Glu Ser Asp Glu Leu Leu Phe Glu Asp Phe Lys Thr
130 135 140
Gly Lys Thr Asp Phe Asn Thr Pro Tyr Val Trp Gly Thr His Ala Met
145 150 155 160
Val Ile Pro Ser Cys Lys Arg Glu Lys Val Ile Gln Val Phe Ala Asp
165 170 175
Tyr Arg Leu Pro Thr Asp Ile Ala Leu Glu Ala Ala Asn Ser Asn Gly
180 185 190
Glu Leu His Ile Arg Val Ala Arg His Asn Leu Phe Tyr Gln His Glu
195 200 205
Arg Thr Lys Lys Arg Pro Ala Cys Arg Ile Ala Ala Cys Leu Ser Ser
210 215 220
Tyr Arg Arg Leu Thr Asp Leu Gln Arg Gln Ile Trp Cys Met Met Asp
225 230 235 240
Gln Ser Tyr Glu Asn Phe His Val Phe Ala Ala Val Lys Gly Ile Pro
245 250 255
Glu Ala Thr Tyr Arg Lys Thr Val Leu Pro Leu Phe Glu His Phe Ile
260 265 270
Gln Glu Gly Arg Leu Thr Met Arg Leu Phe Pro Asn Lys Asn Gln Leu
275 280 285
Ser Asn Phe Leu Asp Ala Ile Arg Asp Leu Asp Ile Ser Asp Tyr Asp
290 295 300
Leu Phe Ala Lys Ile Asp Asp Asp Asp Leu Tyr Gly Arg Asp Tyr Phe
305 310 315 320
Lys Ser Ile Asn Asp Phe His Gln His Leu Pro Arg Glu Phe Ser Ser
325 330 335
Tyr Tyr Cys Gly Phe Gly Gln Tyr Leu Asn Ala Arg Gly Gly Tyr Pro
340 345 350
Leu Cys Gly Asn Gly Phe Phe Ser Cys Phe Gly Pro Thr Met Val Phe
355 360 365
Ser Arg Asp Val Leu Glu Lys Leu Ile Thr Cys Glu Gln Asp Pro Gly
370 375 380
Arg Ile Ser Glu Ile Ser Pro Arg Leu Gly His Ser Gly Tyr Gly Phe
385 390 395 400
Thr Glu Asp Asn Leu Met His Lys Leu Met Ile Asp Thr Gly Ser Cys
405 410 415
Asn Arg Ile Arg Tyr Val Gln Glu Met Ser Leu Pro Met His Leu Val
420 425 430
Ile Gln Thr Asn Asn Ala Ser Val Met Arg Gly Gly Leu Val Pro Gly
435 440 445
Asp Phe Arg Gly Arg Asn Trp Gln Ile Ser His Ser Arg Phe Asn Ala
450 455 460
Glu Ser Phe Met Glu Ile Gly His Pro Gln Trp Tyr Asp Ile Val Arg
465 470 475 480
Ile Phe Gly Gly Arg Ala Cys Arg Phe Gln Arg Asn Asp Trp Ala Asp
485 490 495
Val Leu Ser Leu Thr Asp Glu Glu Val Thr Leu Lys Trp Asp Gln Trp
500 505 510
Gly Thr Glu Thr Phe Arg Arg Arg Asp Asp Gly Ser Phe Phe Leu Ser
515 520 525
Gly Asn Gly Glu Gln Gln Asn Ser Pro Ser Ser Gln Arg Lys Lys Val
530 535 540
Ala Val Leu Tyr Ile Ala Thr Gly Arg Tyr Met Ala Phe Trp Lys Asp
545 550 555 560
Phe Tyr Ala Ala Ala Lys Gln Tyr Phe Leu Pro Gly His Asp Val Arg
565 570 575
Tyr Phe Leu Phe Thr Asp His Asn Glu Val Lys Thr Pro Asp Asp Val
580 585 590
Thr Leu Val Ile Lys Pro Phe Tyr Pro Trp Pro Met Glu Thr Leu Arg
595 600 605
Arg Phe Glu Thr Phe Leu Ser Val Gln Lys Glu Leu Gln Glu Tyr Asp
610 615 620
Tyr Ile Tyr Phe Met Asn Gly Thr Leu Leu Pro Val Ser Pro Ile Gly
625 630 635 640
Glu Glu Ile Phe Pro Asn Asp Arg Gln Gly Ile Ala Val Thr Leu His
645 650 655
Pro Gly Tyr Tyr Gly Asn Thr Arg Ser Cys Tyr Pro Tyr Glu Lys Asn
660 665 670
Gly Met Ser Glu Ala Arg Ile Leu Pro Glu Gln Gly Glu Tyr Tyr Val
675 680 685
Ala Gly Gly Phe Asn Gly Gly Arg Thr Lys Asp Phe Leu Ser Met Cys
690 695 700
Arg Glu Leu Ala Gly Ala Val Lys Arg Asp Leu Asp Asn Gly Ile Ile
705 710 715 720
Ala Val Trp His Asp Glu Ser His Leu Asn Lys Tyr Val Val Gly Arg
725 730 735
His Pro Leu Val Leu Gly Pro Glu Tyr Leu Phe Pro Glu Thr Leu Val
740 745 750
Phe Asn Arg Tyr Tyr Leu Met Gly Leu Lys His Arg Val Lys Ile Leu
755 760 765
Val Lys Asp Lys Ser Leu Ser Lys Tyr Gly Gly His Ala Trp Leu Arg
770 775 780
Lys Leu Val
785
<210> 45
<211> 786
<212> PRT
<213> Akkermansia sp. CAG:344
<400> 45
Met Lys Cys Val Leu Ile Val Ser Ser Gly Glu Lys Ser Glu Gly Ala
1 5 10 15
Ser Glu Leu His Arg Met Gly Tyr Glu Leu Glu Leu Tyr Pro Ser Thr
20 25 30
Ala Asp Leu Ser Pro Leu Arg Asp Ala Arg Glu Glu Glu Ser Ala Ser
35 40 45
Tyr Leu Gly Arg Ser Pro Ala Ser Ala Glu Arg Ser His Val Arg Ser
50 55 60
Leu Arg Ala Ser Phe Ile Arg Leu Leu Glu Asp Arg Asn Tyr Ala Gly
65 70 75 80
Ser Asp Leu Ile Ile Phe Gly Glu Ser Asp Ala Val Pro Met Val Ala
85 90 95
Ser Ser Arg Leu Glu Thr Ala Leu Arg Lys Glu Met Lys Glu His Pro
100 105 110
Glu Thr Asp Ile Phe Arg Leu Phe His His Ala Val Trp Ser Pro Gln
115 120 125
Gly Ala Pro Gly Glu Ser Asp Glu Ile Leu Phe Glu Asp Phe Lys Thr
130 135 140
Gly Lys Thr Asp Ala Asn Thr Ser Tyr Val Trp Gly Thr His Ala Leu
145 150 155 160
Val Ile Pro Ala Ala Arg Arg Pro Arg Val Ala Arg Val Phe Ala Asp
165 170 175
Tyr Arg Leu Pro Thr Asp Ile Ala Leu Glu Ala Ala Asn Ser His Gly
180 185 190
Asp Leu Lys Ile Arg Val Ala Arg His Asn Leu Phe Tyr Gln His Glu
195 200 205
Arg Thr Lys Gln Arg Pro Asp Cys Lys Ile Ala Val Cys Leu Ser Ser
210 215 220
Tyr Lys Arg Leu Thr Asp Leu Gln Arg Gln Ile Trp Cys Met Met Asp
225 230 235 240
Gln Ser Tyr Pro Asn Leu His Val Phe Ala Ala Val Lys Gly Ile Pro
245 250 255
Glu Gly Thr Tyr Arg Arg Thr Val Leu Pro Leu Phe Glu His Phe Ile
260 265 270
His Glu Gly Arg Leu Thr Met Arg Leu Phe Pro Asn Lys Asn Gln Leu
275 280 285
Ser Asn Phe Leu Asp Thr Ile Arg Asp Leu Asn Val Ser Asp Tyr Asp
290 295 300
Leu Phe Ala Lys Ile Asp Asp Asp Asp Leu Tyr Gly Arg Asp Tyr Phe
305 310 315 320
Lys Ser Val Asn Lys Phe His Leu His Leu Pro Pro Glu Phe Ser Ser
325 330 335
Phe Tyr Cys Gly Pro Gly Glu Tyr Leu Ser Val Arg Gly Gly Tyr Pro
340 345 350
Phe Ser Gly Asn Gly Phe Phe Gly Cys Phe Gly Pro Thr Leu Val Leu
355 360 365
Ser Arg Asp Val Leu Glu Lys Leu Ile Ile Cys Glu Thr Asn Pro His
370 375 380
Met Ile Ser Gln Ile Ser Pro Arg Leu Arg His Ala Gly Tyr Gly Phe
385 390 395 400
Thr Glu Asp Asn Phe Met His Met Met Met Leu Asp Thr Gly Ser Ser
405 410 415
Asn Arg Thr Arg Tyr Val Gln Glu Met Ala Leu Pro Met His Leu Ala
420 425 430
Ile Gln Thr Gly Asn Ala Ser Val Met Arg Gly Gly Leu Val Pro Gly
435 440 445
Asp Phe Arg Gly Arg Asn Trp Asn Ile Ser Thr Asn Gln Val Asn Glu
450 455 460
Glu Arg Leu Met Glu Val His His Pro Gln Trp His Asp Ile Val Arg
465 470 475 480
Val Phe Gly Asn Arg Ala Arg Arg Phe Glu Arg Asp Asp Glu Ala Asp
485 490 495
Val Leu Ser Val Thr Asp Glu Lys Ile Thr Leu Lys Trp Asp Cys Trp
500 505 510
Gly Val Glu Ala Phe Lys Lys Met Glu Asp Gly Thr Phe Tyr Leu Ser
515 520 525
Ser Gly Gly Arg Gln Glu Glu Pro Phe Ser Pro Arg Lys Lys Val Ala
530 535 540
Val Leu Phe Ile Ala Thr Gly Arg Tyr Met Thr Phe Trp Glu Glu Phe
545 550 555 560
Tyr Ala Ala Ser Lys Gln Tyr Phe Leu Thr Gly His Asp Val His Tyr
565 570 575
Phe Leu Phe Thr Asp His Pro Glu Val Glu Thr Gly Asp Asp Val Thr
580 585 590
Leu Val Arg Lys Pro Phe Tyr Pro Trp Pro Met Glu Thr Leu Arg Arg
595 600 605
Phe Glu Thr Phe Leu Thr Val Arg Glu Glu Leu Gln Gln Tyr Asp Tyr
610 615 620
Ile Tyr Phe Met Asn Gly Thr Leu Leu Pro Val Gly Pro Val Gly Gln
625 630 635 640
Glu Ile Phe Pro Met Asn Arg Gln Gly Leu Met Val Thr Leu His Pro
645 650 655
Gly Tyr Tyr Gln Arg Pro Arg Ser Thr Tyr Pro Tyr Glu Lys Asn Gly
660 665 670
Met Ser Arg Ala Arg Val Leu His Ser Glu Gly Glu Tyr Tyr Val Ala
675 680 685
Gly Gly Phe Asn Gly Gly Arg Ala Glu Asp Tyr Leu Arg Met Cys Arg
690 695 700
Glu Leu Ala Asp Ala Val Arg Arg Asp Leu Glu Asp Gly Val Ile Ala
705 710 715 720
Val Trp His Asp Glu Ser His Leu Asn Lys Tyr Val Ile Gly Arg His
725 730 735
Pro Leu Val Leu Ser Pro Glu Tyr Leu Phe Pro Glu Thr Leu Asp Phe
740 745 750
Asn Gln Lys Asn Leu Met Ala Ile Lys Pro Lys Val Lys Met Ile Val
755 760 765
Lys Asp Lys Ser Leu Gln Lys His Gly Gly His Ala Trp Leu Arg Gln
770 775 780
Gln Ile
785
<210> 46
<211> 787
<212> PRT
<213> Akkermansia sp. KLE1798
<400> 46
Met Lys Cys Val Leu Ile Val Ser Ser Gly Glu Met Ala Glu Gly Ala
1 5 10 15
Ser Glu Leu His Arg Met Gly Tyr Glu Leu Glu Leu Tyr Pro Ser Thr
20 25 30
Arg Asp Leu Ser Ser Leu Lys Asp Thr Arg Glu Lys Glu Ser Ala Ala
35 40 45
Phe Ile Gly Arg Asp Pro Cys Ser Ala Glu Arg Ser His Val Arg Ser
50 55 60
Leu Arg Ala Ser Phe Ile Gln Val Leu Glu Asp Arg Arg Tyr Ala Gly
65 70 75 80
Asn Asp Leu Ile Ile Phe Gly Glu Ser Asp Ala Val Pro Met Val Ala
85 90 95
Ser Ser Arg Leu Glu Thr Ala Leu Arg Lys Glu Met Glu Glu His Pro
100 105 110
Glu Thr Asp Ile Phe Arg Leu Phe His His Ala Val Trp Ser Pro Gln
115 120 125
Gly Asn Pro Phe Glu Ser Asp Glu Leu Leu Phe Glu Asp Phe Lys Thr
130 135 140
Gly Gly Thr Asp Ser Asn Thr Ala Tyr Val Trp Gly Thr His Ala Met
145 150 155 160
Val Ile Pro Ser Cys Lys Arg Lys Lys Val Ile Gln Val Phe Ala Asp
165 170 175
Tyr Arg Leu Pro Thr Asp Val Ala Leu Glu Ala Ala Asn Ser Ser Gly
180 185 190
Glu Leu Asn Ile Arg Val Ala Arg His Asn Leu Phe Tyr Gln His Glu
195 200 205
Arg Thr Lys Lys Arg Pro Ala Cys Arg Ile Ala Ala Cys Leu Ala Ser
210 215 220
Tyr Arg Arg Leu Ala Asp Leu Gln Arg Gln Ile Trp Cys Met Met Asp
225 230 235 240
Gln Ser Tyr Glu Asn Phe His Val Phe Ala Ala Val Lys Gly Ile Pro
245 250 255
Glu Thr Thr Tyr Arg Lys Thr Val Leu Pro Leu Phe Glu His Phe Ile
260 265 270
Gln Glu Gly Arg Leu Thr Met Arg Leu Phe Pro Asn Lys Asn Gln Leu
275 280 285
Ser Asn Phe Leu Asp Thr Val Arg Gly Leu Asp Ile Ser Asn Tyr Asp
290 295 300
Leu Phe Ala Lys Ile Asp Asp Asp Asp Leu Tyr Gly Arg Asp Tyr Phe
305 310 315 320
Lys Ser Val Asn Asp Phe His Gln His Leu Pro Pro Glu Phe Ser Ser
325 330 335
Tyr Tyr Cys Gly Phe Gly Gln Tyr Leu Asn Asn Arg Gly Gly Tyr Pro
340 345 350
Leu Cys Gly Asn Gly Phe Phe Ser Cys Phe Gly Pro Thr Met Val Phe
355 360 365
Ser Lys Asp Val Leu Glu Lys Leu Ile Thr Cys Glu Gln Glu Pro Gly
370 375 380
Arg Ile Ser Glu Ile Phe Pro Arg Leu Gly His Ser Gly Tyr Gly Phe
385 390 395 400
Thr Glu Asp Asn Leu Met His Lys Leu Met Ile Asp Thr Gly Ser Cys
405 410 415
Asn Arg Ile Arg Tyr Val Gln Glu Met Ser Leu Pro Met His Leu Val
420 425 430
Ile Gln Thr Asn Asn Ala Ser Val Ile Arg Gly Gly Leu Val Pro Gly
435 440 445
Asp Phe Arg Gly Arg Asn Trp His Ile Ser Thr Ser Arg Ala Asn Ala
450 455 460
Glu Ser Leu Ile Glu Ile Ser His Pro Gln Trp Tyr Asp Ile Val Arg
465 470 475 480
Ile Phe Gly Gly Arg Ala Cys Arg Phe Gln Arg Asn Asp Trp Ala Asp
485 490 495
Val Leu Ser Leu Thr Asp Glu Glu Val Thr Leu Lys Trp Asp Gln Trp
500 505 510
Gly Thr Glu Thr Phe Arg Arg Lys Glu Asp Gly Ser Phe Phe Leu Ser
515 520 525
Glu Asn Gly Asn Gln Gln His Ser Pro Ser Ser Arg Lys Arg Lys Val
530 535 540
Ala Val Leu Tyr Ile Ser Thr Gly Arg Tyr Ile Thr Phe Trp Lys Asp
545 550 555 560
Phe Tyr Ala Ala Ser Lys Gln Tyr Phe Leu Pro Gly His Asp Val Arg
565 570 575
Tyr Phe Leu Phe Thr Asp His Asp Glu Val Lys Thr Ala Asp Asp Val
580 585 590
Thr Leu Val Ser Lys Pro Phe Tyr Pro Trp Pro Met Glu Thr Leu Arg
595 600 605
Arg Phe Glu Thr Phe Leu Ser Ile Glu Lys Glu Leu Gln Glu Tyr Asp
610 615 620
Tyr Ile Tyr Phe Met Asn Gly Thr Leu Leu Pro Val Ser Pro Ile Gly
625 630 635 640
Glu Glu Ile Phe Pro Asn Asp Arg Gln Gly Leu Ala Val Thr Leu His
645 650 655
Pro Gly Phe Tyr Glu Leu Pro Leu Ser Cys Tyr Pro Tyr Glu Lys Asn
660 665 670
Gly Met Ser Glu Ala Arg Ile Ser Pro Gly Gln Gly Glu Tyr Tyr Val
675 680 685
Ala Gly Gly Phe Asn Gly Gly Lys Ala Lys Asp Phe Leu Ser Met Cys
690 695 700
Gln Glu Leu Ala Gly Ala Val Lys Arg Asp Leu Asp Asn Gly Ile Ile
705 710 715 720
Ala Val Trp His Asp Glu Ser His Ile Asn Lys Tyr Val Ile Gly Arg
725 730 735
His Pro Leu Val Leu Gly Pro Glu Tyr Leu Phe Pro Glu Thr Leu Val
740 745 750
Phe Asn Arg Tyr His Leu Met Gly Leu Lys His Arg Val Lys Ile Leu
755 760 765
Val Lys Asp Lys Ser Leu Ser Lys Tyr Gly Gly His Ala Trp Leu Arg
770 775 780
Lys Gln Ser
785
<210> 47
<211> 232
<212> PRT
<213> Algoriphagus sp.
<400> 47
Met Lys Ile Cys Ile Leu Thr Ile Ala Thr Asn Gln Tyr Leu Gln Phe
1 5 10 15
Ile Glu Lys Leu Tyr Ser Asp Ile Ala Glu Lys Phe Ile Pro Glu Ser
20 25 30
Glu Ile Asn Cys Leu Leu Phe Thr Asp His Glu Ile Glu Glu Thr Ser
35 40 45
Asp Asn Val Lys Val His Tyr Ile Asp His Glu Pro Trp Pro Met Pro
50 55 60
Thr Leu Lys Arg Tyr Asn Tyr Phe Val Lys Glu Lys Asp Phe Ile Leu
65 70 75 80
Gln His Asp Tyr Cys Phe Tyr Met Asp Ala Asp Met Arg Ile Asp Ala
85 90 95
Pro Val Gly Gln Glu Ile Leu Gly Asp Leu Val Ala Thr Arg His Gly
100 105 110
Tyr Gln Ser Tyr His Asp Pro Lys Asn Gln Ser Phe Asp Arg Asn Pro
115 120 125
Lys Ser Leu Ala Tyr Val Asp Pro Ser Glu Lys Thr Val Thr Tyr Tyr
130 135 140
Ala Gly Gly Phe Asn Gly Gly Lys Thr Gln Asn Phe Met Lys Met Ser
145 150 155 160
Glu Val Ile Ala Asp Arg Val Asn Lys Asp Leu Glu Asn Asn Val Val
165 170 175
Ala Leu Trp His Asp Glu Ser His Met Asn Arg Tyr Leu Ile Asp Asn
180 185 190
Pro Pro Thr Leu Asp Leu Ser Pro Glu Tyr Cys Tyr Ala Glu Glu Phe
195 200 205
Ile Gly Ser Asn Tyr Pro Leu Gln Asn Pro Lys Ile Ile Ala Leu Lys
210 215 220
Lys Asn His Ala Glu Leu Arg Ser
225 230
<210> 48
<211> 263
<212> PRT
<213> 卵形拟杆菌
<400> 48
Met Arg Ile Gly Ile Leu Tyr Ile Cys Thr Gly Lys Tyr Asp Ile Phe
1 5 10 15
Trp Lys Asp Phe Tyr Leu Ser Ala Glu Arg Tyr Phe Met Gln Asp Gln
20 25 30
Ser Phe Ile Ile Glu Tyr Tyr Val Phe Thr Asp Ser Pro Lys Leu Tyr
35 40 45
Asp Glu Glu Asn Asn Lys His Ile His Arg Ile Lys Gln Lys Asn Leu
50 55 60
Gly Trp Pro Asp Asn Thr Leu Lys Arg Phe His Ile Phe Leu Arg Ile
65 70 75 80
Lys Glu Gln Leu Glu Arg Glu Thr Asp Tyr Leu Phe Phe Phe Asn Ala
85 90 95
Asn Leu Leu Phe Thr Ser Pro Ile Gly Lys Glu Ile Leu Pro Pro Ser
100 105 110
Asp Ser Asn Gly Leu Leu Gly Thr Met His Pro Gly Phe Tyr Asn Lys
115 120 125
Pro Asn Ser Glu Phe Thr Tyr Glu Arg Arg Asp Ala Ser Thr Ala Tyr
130 135 140
Ile Pro Glu Gly Glu Gly Arg Tyr Tyr Tyr Ala Gly Gly Leu Ser Gly
145 150 155 160
Gly Cys Thr Lys Ala Tyr Leu Lys Leu Cys Thr Thr Ile Cys Ser Trp
165 170 175
Val Asp Arg Asp Ala Thr Asn His Ile Ile Pro Ile Trp His Asp Glu
180 185 190
Ser Leu Ile Asn Lys Tyr Phe Leu Asp Asn Pro Pro Ala Ile Thr Leu
195 200 205
Ser Pro Ala Tyr Leu Tyr Pro Glu Gly Trp Leu Leu Pro Phe Glu Pro
210 215 220
Ile Ile Leu Ile Arg Asp Lys Asn Asn Pro Gln Tyr Gly Gly His Glu
225 230 235 240
Leu Leu Arg Arg Lys Asn Ser Leu Trp Glu Arg Ile Lys Leu Ile Cys
245 250 255
Gln Lys Phe Lys Ser Ala Asp
260
<210> 49
<211> 263
<212> PRT
<213> 卵形拟杆菌
<400> 49
Met Arg Ile Gly Ile Leu Tyr Ile Cys Thr Gly Lys Tyr Asp Ile Phe
1 5 10 15
Trp Lys Asp Phe Tyr Leu Ser Ala Glu Arg Tyr Phe Met Gln Asp Gln
20 25 30
Ser Phe Ile Ile Glu Tyr Tyr Val Phe Thr Asp Ser Pro Lys Leu Tyr
35 40 45
Asp Glu Glu Asn Asn Lys His Ile His Arg Ile Lys Gln Lys Asn Leu
50 55 60
Gly Trp Pro Asp Asn Thr Leu Lys Arg Phe His Ile Phe Leu Arg Ile
65 70 75 80
Lys Glu Gln Leu Glu Arg Glu Thr Asp Tyr Leu Phe Phe Phe Asn Ala
85 90 95
Asn Leu Leu Phe Thr Ser Pro Ile Gly Lys Glu Ile Leu Pro Pro Ser
100 105 110
Asp Ser Asn Gly Leu Leu Gly Thr Met His Pro Gly Phe Tyr Asn Lys
115 120 125
Pro Asn Ser Glu Phe Thr Tyr Glu Arg Arg Asp Ala Ser Thr Ala Tyr
130 135 140
Ile Pro Glu Gly Glu Gly Arg Tyr Tyr Tyr Ala Gly Gly Leu Ser Gly
145 150 155 160
Gly Cys Thr Lys Ala Tyr Leu Lys Leu Cys Thr Thr Ile Cys Ser Trp
165 170 175
Val Asp Arg Asp Ala Thr Asn His Ile Ile Pro Ile Trp His Asp Glu
180 185 190
Ser Leu Ile Asn Lys Tyr Phe Leu Asp Asn Pro Pro Ala Ile Thr Leu
195 200 205
Ser Pro Ala Tyr Leu Tyr Pro Glu Gly Trp Leu Leu Pro Phe Glu Pro
210 215 220
Ile Ile Leu Ile Arg Asp Lys Asn Lys Pro Gln Tyr Gly Gly His Glu
225 230 235 240
Leu Leu Arg Arg Lys Asn Ser Leu Trp Glu Arg Ile Lys Leu Ile Cys
245 250 255
Gln Lys Phe Lys Ser Ala Asp
260
<210> 50
<211> 263
<212> PRT
<213> 卵形拟杆菌
<400> 50
Met Arg Ile Gly Ile Leu Tyr Ile Cys Thr Gly Lys Tyr Asp Ile Phe
1 5 10 15
Trp Lys Asn Phe Tyr Leu Ser Ala Glu Arg Tyr Phe Leu Gln Asp Gln
20 25 30
Ser Phe Ile Leu Glu Tyr Tyr Val Phe Thr Asp Ser Pro Lys Leu Tyr
35 40 45
Asp Glu Asp Asn Asn Lys His Ile His Arg Ile Lys Gln Lys Asn Leu
50 55 60
Gly Trp Pro Asp Asn Thr Leu Lys Arg Phe His Ile Phe Leu Arg Ile
65 70 75 80
Lys Gln Gln Leu Leu Gln Glu Thr Asp Phe Leu Phe Phe Cys Asn Ala
85 90 95
Asn Leu Leu Phe Lys Gln Asn Ile Gly Pro Glu Ile Ile Pro Leu Lys
100 105 110
Thr Glu Asn Gln Leu Val Gly Thr Ile His Pro Gly Phe Tyr Asn Ser
115 120 125
Pro Asn Ser Glu Phe Thr Tyr Glu Arg Arg Tyr Asn Ser Lys Ala Tyr
130 135 140
Ile Pro Glu Gly Glu Gly Ile His Tyr Tyr Ala Gly Gly Phe Ser Gly
145 150 155 160
Gly Tyr Thr Glu Arg Tyr Leu Gln Leu Cys Glu Thr Ile Lys Ser Trp
165 170 175
Val Asp Ile Asp Asn Ser Lys Lys Ile Val Ala Ile Trp His Asp Glu
180 185 190
Ser His Ile Asn Lys Tyr Phe Leu Glu Asn Pro Pro Phe Thr Leu Ser
195 200 205
Pro Ala Tyr Leu Tyr Pro Glu Gly Trp Ser Ile Pro Phe Lys Glu Ile
210 215 220
Ile Met Ile Arg Asp Lys Ser Lys Glu Glu Tyr Gly Gly His Thr Leu
225 230 235 240
Leu Arg Lys Lys Glu Pro Trp Ser Ser Lys Leu Leu Tyr Ala Leu Lys
245 250 255
Arg Phe Phe Arg Leu Ser Glu
260
<210> 51
<211> 263
<212> PRT
<213> 卵形拟杆菌
<400> 51
Met Arg Ile Gly Ile Leu Tyr Ile Cys Thr Gly Lys Tyr Asp Ile Phe
1 5 10 15
Trp Lys Asp Phe Tyr Leu Ser Ala Glu Arg Tyr Phe Met Gln Asp Gln
20 25 30
Ser Phe Ile Ile Glu Tyr Tyr Val Phe Thr Asp Ser Pro Gln Leu Tyr
35 40 45
Asp Glu Glu Asn Asn Glu His Ile His Arg Ile Lys Gln Lys Asn Leu
50 55 60
Gly Trp Pro Asp Asn Thr Leu Lys Arg Phe His Thr Phe Leu Arg Ile
65 70 75 80
Lys Glu Gln Leu Glu Arg Glu Thr Asp Tyr Leu Phe Phe Phe Asn Ala
85 90 95
Asn Leu Leu Phe Thr Cys Pro Ile Gly Lys Glu Met Leu Pro Ser Ser
100 105 110
Asn Ser Asn Gly Leu Leu Gly Thr Ile His Pro Gly Phe Tyr Asn Lys
115 120 125
Pro Asn Ser Glu Phe Thr Tyr Glu Arg Arg Val Ala Ser Thr Ala Tyr
130 135 140
Ile Pro Glu Gly Lys Gly Leu Tyr Tyr Tyr Ala Gly Gly Leu Ser Gly
145 150 155 160
Gly Cys Thr Glu Ser Tyr Leu Gln Leu Cys Thr Thr Ile Cys Ser Trp
165 170 175
Val Asp Lys Asp Ala Ala Asn His Ile Ile Pro Ile Trp His Asp Glu
180 185 190
Ser Leu Ile Asn Lys Tyr Phe Leu Asp Asn Pro Pro Ala Ile Thr Leu
195 200 205
Pro Pro Ala Tyr Leu Tyr Pro Glu Gly Trp Ser Leu Pro Phe Lys Pro
210 215 220
Ile Ile Leu Ile Arg Asp Lys Asn Lys Pro Glu Tyr Gly Gly His Glu
225 230 235 240
Phe Leu Arg Arg Lys Asn Ser Leu Trp Val Lys Ile Lys Leu Ile Cys
245 250 255
Gln Lys Ile Lys Leu Ala Asp
260
<210> 52
<211> 257
<212> PRT
<213> 卵形拟杆菌 SD CMC 3f
<400> 52
Tyr Ile Cys Thr Gly Lys Tyr Asp Ile Phe Trp Lys Asp Phe Tyr Leu
1 5 10 15
Ser Ala Glu Arg Tyr Phe Met Gln Asp Gln Ser Phe Ile Ile Glu Tyr
20 25 30
Tyr Val Phe Thr Asp Ser Pro Lys Leu Tyr Asp Glu Glu Asn Asn Lys
35 40 45
His Ile His Arg Ile Lys Gln Lys Asn Leu Gly Trp Pro Asp Asn Thr
50 55 60
Leu Lys Arg Phe His Ile Phe Leu Arg Ile Lys Glu Gln Leu Glu Arg
65 70 75 80
Glu Thr Asp Tyr Leu Phe Phe Phe Asn Ala Asn Leu Leu Phe Thr Ser
85 90 95
Pro Ile Gly Lys Glu Ile Leu Pro Pro Ser Asp Ser Asn Gly Leu Leu
100 105 110
Gly Thr Met His Pro Gly Phe Tyr Asn Lys Pro Asn Ser Glu Phe Thr
115 120 125
Tyr Glu Arg Arg Asp Ala Ser Thr Ala Tyr Ile Pro Glu Gly Glu Gly
130 135 140
Arg Tyr Tyr Tyr Ala Gly Gly Leu Ser Gly Gly Cys Thr Lys Ala Tyr
145 150 155 160
Leu Lys Leu Cys Thr Thr Ile Cys Ser Trp Val Asp Arg Asp Ala Thr
165 170 175
Asn His Ile Ile Pro Ile Trp His Asp Glu Ser Leu Ile Asn Lys Tyr
180 185 190
Phe Leu Asp Asn Pro Pro Ala Ile Thr Leu Ser Pro Ala Tyr Leu Tyr
195 200 205
Pro Glu Gly Trp Leu Leu Pro Phe Glu Pro Ile Ile Leu Ile Arg Asp
210 215 220
Lys Asn Asn Pro Gln Tyr Gly Gly His Glu Leu Leu Arg Arg Lys Asn
225 230 235 240
Ser Leu Trp Glu Arg Ile Lys Leu Ile Cys Gln Lys Phe Lys Ser Ala
245 250 255
Asp
<210> 53
<211> 263
<212> PRT
<213> Bacteroides reticulotermitis JCM 10512
<400> 53
Met Arg Ile Gly Ile Leu Tyr Ile Cys Thr Gly Lys Tyr Ser Ile Phe
1 5 10 15
Trp Lys Asp Phe Tyr Leu Ser Ala Glu Arg Tyr Leu Met Gln Ser Pro
20 25 30
Ala Tyr Thr Arg Glu Tyr Tyr Val Phe Thr Asp Ser Leu Lys Leu Tyr
35 40 45
Asp Glu Glu Asn Asn Lys His Ile His Arg Ile Lys Gln Lys Asn Leu
50 55 60
Gly Trp Pro Asp Asn Thr Leu Lys Arg Phe His Met Phe Leu Gln Ile
65 70 75 80
Lys Gln Gln Leu Leu Gln Glu Thr Asp Phe Leu Ile Phe Cys Asn Ala
85 90 95
Asn Leu Leu Phe Lys Gln Asn Val Gly His Glu Ile Ile Pro Gln Lys
100 105 110
Gly Lys Asn Gln Phe Val Gly Thr Ile His Pro Gly Phe Tyr Asn Ser
115 120 125
His Asn Tyr Asp Phe Thr Tyr Glu Arg Arg His Asn Ser Lys Ala Tyr
130 135 140
Ile Pro Glu Gly Glu Gly Val His Tyr Tyr Ala Gly Gly Phe Ser Gly
145 150 155 160
Gly Tyr Thr Lys Ala Tyr Leu Gln Leu Cys Glu Thr Ile Lys Ser Trp
165 170 175
Val Asp Ile Asp Lys Ser Asn Lys Ile Val Ala Ile Trp His Asp Glu
180 185 190
Ser His Ile Asn Arg Tyr Phe Leu Lys Asn Pro Pro Leu Thr Leu Ser
195 200 205
Pro Gly Tyr Leu Tyr Pro Glu Gly Trp Ser Ile Pro Phe Glu Glu Ile
210 215 220
Ile Thr Ile Arg Asp Lys Asn Lys Glu Glu Tyr Gly Gly His Ile Leu
225 230 235 240
Leu Arg Lys Lys Glu Ser Trp Arg Asn Lys Ile Leu Lys Ile Ile Lys
245 250 255
Lys Thr Leu Phe Pro Leu Pro
260
<210> 54
<211> 256
<212> PRT
<213> Bacteroides sp. OM08-11
<400> 54
Met Lys Ile Gly Ile Leu Tyr Ile Cys Thr Gly Lys Tyr Asp Ile Phe
1 5 10 15
Trp Lys Asp Phe Tyr Leu Ser Ser Glu Ser His Phe Phe Ser Asp Asp
20 25 30
Pro Asn Cys Ile Arg Glu Tyr Tyr Val Phe Thr Asp Ser Lys Leu Leu
35 40 45
Phe Gly Glu Lys Glu Asn Gln His Ile His Arg Ile Tyr Gln Lys Asn
50 55 60
Leu Gly Trp Pro Asn Asn Thr Leu Lys Arg Phe His Ile Phe Leu Glu
65 70 75 80
Ile Lys Glu Arg Leu Leu Lys Glu Thr Asp Tyr Leu Phe Phe Cys Asn
85 90 95
Ala Asn Leu Leu Phe Lys Gln Thr Val Gly Leu Glu Ile Leu Pro Pro
100 105 110
Ala Ile Gly Asn Gly Leu Val Gly Thr Leu His Pro Gly Phe Phe Asn
115 120 125
Lys Asn Asn Asn Glu Phe Thr Tyr Glu Arg Ser Pro His Ser Thr Ala
130 135 140
Tyr Ile Ala Glu Gly Glu Gly Ile Tyr Tyr Tyr Ala Gly Gly Phe Ser
145 150 155 160
Gly Gly Lys Thr Lys Glu Tyr Ile Lys Leu Cys Glu Thr Ile Lys Arg
165 170 175
Arg Ile Asp Gln Asp Leu Gln Gln Arg Phe Ile Ala Val Trp His Asp
180 185 190
Glu Ser His Ile Asn Arg Tyr Phe Leu Glu Asn Pro Pro Thr Thr Leu
195 200 205
Ser Pro Ser Tyr Leu Tyr Pro Glu Gly Ser Ile Leu Pro Phe Glu Glu
210 215 220
Lys Ile Met Ile Arg Asp Lys Ser Lys Lys Glu Tyr Gly Gly His Lys
225 230 235 240
Phe Leu Arg Lys Lys Asp Ser Trp Leu His Arg Leu Ile Lys Lys Leu
245 250 255
<210> 55
<211> 263
<212> PRT
<213> Bacteroides xylanisolvens
<400> 55
Met Arg Ile Gly Ile Leu Tyr Ile Cys Thr Gly Lys Tyr Asp Ile Phe
1 5 10 15
Trp Lys Asp Phe Tyr Leu Ser Ala Glu Arg Tyr Phe Met Gln Asp Gln
20 25 30
Ser Phe Thr Ile Glu Tyr Tyr Val Phe Thr Asp Thr Ser Lys Leu Tyr
35 40 45
Asp Glu Glu Asn Asn Lys His Ile His Arg Ile Lys Gln Lys Asn Leu
50 55 60
Gly Trp Pro Asp Asn Thr Leu Lys Arg Phe His Ile Phe Leu Arg Ile
65 70 75 80
Lys Glu Gln Leu Glu Arg Glu Thr Asp Tyr Leu Phe Phe Phe Asn Ala
85 90 95
Asn Leu Leu Phe Thr Ser Ser Ile Gly Lys Glu Ile Leu Pro Pro Ser
100 105 110
Asp Ser Asn Gly Leu Leu Gly Thr Met His Pro Gly Phe Tyr Asn Lys
115 120 125
Pro Asn Ser Glu Phe Thr Tyr Glu Arg Arg Asp Ala Ser Thr Ala Tyr
130 135 140
Ile Pro Glu Gly Glu Gly Leu Tyr Tyr Tyr Ala Gly Gly Leu Ser Gly
145 150 155 160
Gly Cys Thr Lys Ala Tyr Leu Lys Leu Cys Thr Thr Ile Cys Ser Trp
165 170 175
Val Asp Arg Asp Ala Thr Asn His Ile Ile Pro Ile Trp His Asp Glu
180 185 190
Ser Leu Ile Asn Lys Tyr Phe Leu Asp Asn Pro Pro Ala Ile Thr Leu
195 200 205
Pro Pro Ala Tyr Leu Tyr Pro Glu Gly Trp Leu Leu Pro Phe Glu Pro
210 215 220
Ile Ile Leu Ile Arg Asp Lys Asn Lys Pro Lys Tyr Gly Gly His Glu
225 230 235 240
Leu Leu Arg Arg Lys Asn Ser Leu Trp Glu Arg Ile Lys Leu Ile Cys
245 250 255
Gln Lys Phe Lys Ser Ala Asp
260
<210> 56
<211> 309
<212> PRT
<213> Bisgaard taxon 44 str. 111
<400> 56
Met Gln Gln Pro Lys Val Ala Phe Leu Ser Ile Asn Thr Gly Ser Tyr
1 5 10 15
Asp Thr Phe Phe Lys Ala Val Phe Ala His Asn Gln Gln Asn Phe Leu
20 25 30
Pro Asp Cys Gln Val Gln Tyr Phe Val Phe Thr Asp Ser Glu Asp Leu
35 40 45
Ala Thr Thr Tyr Ala Asn Thr Glu Asn Val Thr Leu Ile Pro Gln Glu
50 55 60
His Leu Ala Trp Pro Gly Ala Thr Leu His Arg Phe Lys Met Phe Asn
65 70 75 80
Arg Pro Glu Val Arg Glu Leu Leu Ser Glu Tyr Asp Tyr Val Phe Phe
85 90 95
Ala Asn Ala Asn Trp Tyr Ala Lys Asn Pro Ile Leu Gly Lys Asn Phe
100 105 110
Leu Gln Pro Ala Thr Gly Asp Ala Ser Lys Asp Leu Tyr Leu Val Tyr
115 120 125
His Tyr Gly Gln Asn Ala Val Pro Glu Ala Ala Lys Ser Tyr Glu Arg
130 135 140
Asn Pro Gln Ser Leu Ala Tyr Ile Pro Glu Asn Ala Thr Thr Thr Tyr
145 150 155 160
Val Ala Gly Gly Phe Phe Gly Gly Thr Ser Ala Ala Phe Met His Met
165 170 175
Ile Ala Thr Leu Glu Arg Asn Ile Asp Phe Asp Leu Ala Lys Gly Ile
180 185 190
Ile Ala Leu Trp His Asp Glu Ser His Leu Asn His Tyr Leu Tyr Thr
195 200 205
Thr Gly Tyr Gln Ala His Ile Met Pro Pro Ile Phe Met Val Pro Gln
210 215 220
Glu Tyr His Pro Ile Ser Ser Tyr Ile Gly Glu Arg Pro Glu Trp Leu
225 230 235 240
Gly Val Cys Leu Asn Lys Asn Leu Leu Val Gln Asp Leu Asn Ala Leu
245 250 255
Arg Asn Lys Gln Val Gly Phe Ser Leu Glu Gln Ile Gln Gln Leu Leu
260 265 270
Glu His Glu Lys Asp Leu Asp Ala Ile Trp Arg Glu Gln Arg Ala Glu
275 280 285
Phe Glu Pro Tyr Trp Gln Gln Asn Leu Gly Phe Val Gly Leu Ile Tyr
290 295 300
Asn Gln Val Glu Gln
305
<210> 57
<211> 301
<212> PRT
<213> Bisgaard Taxon 44 str. B96_3
<400> 57
Met Gln Lys Pro Lys Val Ala Leu Val Ser Ile Asn Thr Gly Ala Tyr
1 5 10 15
Asp Thr Tyr Phe Lys Val Leu Phe Pro Tyr Phe Tyr Thr Asn Phe Leu
20 25 30
Pro Asp Cys Glu Leu Thr Phe Val Val Phe Thr Asp Ser Ser Glu Leu
35 40 45
Glu Glu Leu Tyr Arg Tyr Asn Pro Ile Val Lys Ile Ile Lys Thr Pro
50 55 60
Tyr Glu Ala Trp Pro Gly Ala Thr Leu Lys Arg Phe His Tyr Phe Ser
65 70 75 80
Gln Ala Ser Ser His Leu Glu Gln Phe Asp Tyr Ile Phe Phe Ala Asn
85 90 95
Ala Asn Tyr Tyr Cys Lys Asn Lys Ile Leu Ala Ser Glu Leu Leu Leu
100 105 110
Pro Glu Gly Glu Lys Gly Leu Ile Phe Val Glu His Phe Gly Gln Asn
115 120 125
His Leu Pro Glu Arg Leu Arg Ser Tyr Glu Arg Asn Pro Ala Ser Leu
130 135 140
Ala Tyr Ile Pro Glu Glu Gln Ala Thr Thr Tyr Val Ala Gly Ala Phe
145 150 155 160
Tyr Gly Gly Thr Ala Gln Glu Phe Leu Thr Met Ala Lys Thr Leu Ala
165 170 175
Gln Arg Val Asp Gln Asp Leu Ala Asn Gly Ile Ile Ala Ile Trp His
180 185 190
Asp Glu Ser His Leu Asn Cys Tyr Ala Leu Gln Ile Gly Tyr Gln Ala
195 200 205
Lys Val Leu Pro Pro Arg Tyr Leu Val Pro Gln Glu Tyr Tyr Phe Ala
210 215 220
Ser Ser Tyr Ile Gly Glu Arg Gln Asp Trp Pro Cys Val Leu Leu Asn
225 230 235 240
Lys Asn Ala Leu Pro Ile Ala Ala Gln Asp Val Arg Asp Ser Lys Ala
245 250 255
Lys Leu Asp Ala Arg Leu Val Glu Arg Leu Leu Ile Lys Glu Arg Glu
260 265 270
Leu Glu Gln Leu Trp Leu Asp Lys Arg Glu Val Tyr Leu Glu Gln Ala
275 280 285
Lys Ser Asn Pro Gly Phe Ile Val Phe Asn Trp Gln Val
290 295 300
<210> 58
<211> 303
<212> PRT
<213> Bisgaard taxon 44 str. B96_4
<400> 58
Met Lys Val Ala Phe Leu Ser Val Asn Thr Gly Ala Tyr Asp Thr Phe
1 5 10 15
Phe Lys Val Leu Phe Pro Tyr Asn Tyr Gln Asn Phe Leu Pro Asp Cys
20 25 30
Gln Val Thr Phe Phe Val Phe Thr Asp Ser Lys Asp Leu Glu Gln Ser
35 40 45
Phe Ala Leu Asn Pro Arg Val Lys Val Ile Tyr Gln Glu Tyr Glu Pro
50 55 60
Trp Pro Ala Pro Thr Leu Asp Arg Phe Ala Tyr Phe Leu Ser Gln Ala
65 70 75 80
Glu Gln Leu Gln Glu Phe Asp Tyr Ile Phe Phe Ala Asn Ala Asn Tyr
85 90 95
Tyr Cys Lys Asn Pro Ile Lys Ala Glu Gln Ile Leu Phe Ala Pro Thr
100 105 110
Gly Asp Leu Gly Lys Asp Leu Ile Met Val Glu His Phe Gly Gln Asn
115 120 125
Phe Ile Ala Glu His Leu Arg Ser Tyr Glu Arg Asn Pro Ser Ser Gln
130 135 140
Ala Tyr Ile Ala Pro Gln Pro Glu Arg Pro Thr Thr Tyr Val Ala Gly
145 150 155 160
Gly Phe Tyr Gly Gly Thr Ala Gln Ala Phe Leu Ala Leu Ala Arg Thr
165 170 175
Leu Ala Gln Arg Ile Gln Ala Asp Lys Glu Gln Gly Ile Val Ala His
180 185 190
Trp His Asp Glu Ser His Leu Asn Arg Tyr Leu Tyr Asp Leu Asn Tyr
195 200 205
Ala Cys His Phe Leu Pro Pro Cys Tyr Cys Val Pro Gln Glu Tyr Asp
210 215 220
Phe Glu Ser Arg Tyr Ile Gly Glu Arg Gln Asp Trp Pro Cys Val Leu
225 230 235 240
Leu Asn Lys Asn Ala Leu Pro Ser Pro Ala Gln Asp Ile Arg Ser Asn
245 250 255
Gln Ala Ser Tyr Asp Pro Arg Trp Ile Glu Ile Leu Ile Met Gln Glu
260 265 270
Arg Glu Leu Glu Ser Trp Trp Leu Arg Asp Arg His Ile Phe Tyr Pro
275 280 285
Asn Ala Ile Lys Asn Gln Cys Phe Asn Thr Leu Leu Trp Glu Ile
290 295 300
<210> 59
<211> 308
<212> PRT
<213> Bisgaard taxon 44 str. EEAB3T1
<400> 59
Met Ser Arg Thr Lys Val Ala Val Leu Ser Val Asn Thr Gly Ala Tyr
1 5 10 15
Ala Ser Phe Phe Lys Val Leu Phe Pro Tyr Asn Tyr Gln Asn Phe Leu
20 25 30
Pro Asp Cys Glu Val Thr Phe Phe Val Phe Thr Asp Ser Lys Glu Leu
35 40 45
Ala Gln Leu Tyr Ala Tyr Asn Pro Gln Val Lys Ile Ile Pro Leu Asp
50 55 60
Tyr Gln Pro Trp Pro Leu Pro Thr Leu Phe Arg Phe Lys Tyr Phe Leu
65 70 75 80
Glu Leu Glu Ser Thr Leu Ala Glu Phe Ala Tyr Val Phe Phe Met Asn
85 90 95
Ala Asn Phe Tyr Cys Lys Arg Pro Leu Tyr Ala Gln Asp Leu Leu Phe
100 105 110
Ala Pro Thr Gly Asn Trp Ala Gln Asp Leu Ile Val Val Glu His Phe
115 120 125
Gly Gln Asn Cys Leu Pro Glu Glu Leu Arg Ser Tyr Glu Arg Asn Pro
130 135 140
Gln Ser Gln Ala Tyr Ile Ser Pro Thr Pro Glu Lys Ala Thr Thr Tyr
145 150 155 160
Ile Ala Gly Ala Phe Asn Gly Gly Thr Ser Gln Ala Phe Leu Thr Met
165 170 175
Ser Arg Glu Leu Ala Gln Arg Thr Leu Thr Asp Tyr Gln Asn Asn Leu
180 185 190
Ile Ala Val Trp His Asp Glu Ser His Leu Asn Arg Leu Leu Tyr Asp
195 200 205
Leu Asp Tyr Gln Ala His Ile Leu Pro Pro His Tyr Val Met Pro Gln
210 215 220
Glu Tyr Asp Phe Glu Ser Arg Tyr Val Gly Glu Arg Gln Asp Trp Phe
225 230 235 240
Ala Val Leu Leu Asn Lys Asn Ala Leu Pro Phe Asp Pro Gln Leu Ala
245 250 255
Arg Asp Asn Gln Gln Glu Phe Asp Pro Arg His Leu Glu Leu Leu Val
260 265 270
Leu Gln Glu Arg Gln Leu Glu Asn Ile Trp Leu Thr Tyr Arg Asp Thr
275 280 285
Phe Tyr Pro Asn Ala Ile Lys Asn Asn Ser Phe Asn Cys Phe Ile Trp
290 295 300
Lys Ile Glu Pro
305
<210> 60
<211> 527
<212> PRT
<213> Candidatus Magasanikbacteria
<400> 60
Met Lys Ile Gly Ile Leu Tyr Ile Cys Thr Gly Lys Tyr Lys Ile Phe
1 5 10 15
Trp Lys Asp Phe Tyr Leu Ser Cys Glu Lys His Phe Ile Ser Glu Val
20 25 30
Glu Lys His Tyr Phe Val Phe Thr Asp Ser Glu Ser Ile Glu Phe Glu
35 40 45
Asn Glu Asn Ser Arg Ile His Arg Val Tyr Gln Gln Asn Leu Gly Trp
50 55 60
Pro Gly Asn Thr Leu Arg Arg Tyr Glu Met Phe Leu Lys Lys Lys Glu
65 70 75 80
Glu Leu Lys Lys Phe Asp Phe Leu Phe Phe Phe Asn Ala Asn Leu Gln
85 90 95
Phe Leu Glu Lys Ile Thr Ser Asp Glu Phe Val Pro Val Gly Gln Glu
100 105 110
Lys Leu Val Ala Cys Leu His Pro Gly Tyr Tyr Asp Lys Lys Lys Glu
115 120 125
Ser Phe Thr Tyr Glu Arg Asn Ser Lys Ser Thr Ala Phe Ile Pro Lys
130 135 140
Gly Gln Gly Val Tyr Tyr Phe Ala Gly Gly Ile Asn Gly Gly Leu Ser
145 150 155 160
Lys Asp Phe Ile Glu Ala Met Glu Val Met Asp Glu Asn Ile Lys Lys
165 170 175
Asp Phe His Asn Asn Ile Ile Ala Val Trp His Asp Glu Ser His Trp
180 185 190
Asn Tyr Phe Leu Asn Asn Asn Ile Glu Asp Ile Lys Ile Leu Asp Pro
195 200 205
Ser Tyr Leu Tyr Pro Glu Gly Gly Leu Leu Pro Phe Val Pro Lys Ile
210 215 220
Leu Val Arg Asp Lys Lys Ile Leu Gly Gly His Thr Lys Leu Arg Asp
225 230 235 240
Asn Phe Asn Phe Ile Leu Tyr Ile Asn Glu Ile Lys Ser Tyr Met Lys
245 250 255
Lys Leu Ile Cys Lys Leu Lys Phe Glu Tyr Ile Ile Lys Leu Lys Gly
260 265 270
Gly Leu Gly Asn Gln Met Phe Gln Tyr Ala His Gly Arg Ser Leu Glu
275 280 285
Phe Ser Gly Lys Lys Val Ile Phe Asp Ile Ser Phe Phe Glu Asn Asn
290 295 300
Lys Ala Lys Arg Asp Ile Ala Arg Asp Phe Lys Leu Asp Asn Phe Asn
305 310 315 320
Ile Asp Thr Arg Val Lys Phe Val Asn Lys Lys Asn Ile Tyr Leu Asp
325 330 335
Phe Val Asn Lys Ile Lys Arg Lys Ile Gly Phe Ser Leu Glu Glu Ser
340 345 350
Phe Gln Gly Glu Lys Tyr Phe Glu Asn Ile Glu Asp Ile Ile Arg Lys
355 360 365
Glu Leu Thr Leu Lys Lys Glu Leu Tyr Glu Lys Val Asp Lys Asn Leu
370 375 380
Leu Asn Lys Ile Leu Leu Ser Asn Ser Val Ser Ile His Ile Arg Arg
385 390 395 400
Thr Asp Tyr Val Thr Ser Lys Ile Ala Asn Lys Val Leu Gly Val Cys
405 410 415
Ser Leu Asp Tyr Tyr Lys Ile Ser Ile Ser Lys Ile Ala Ser Leu Leu
420 425 430
Asp Asn Pro His Phe Tyr Ile Phe Ser Asp Asp Ile Glu Trp Val Arg
435 440 445
Ser Asn Leu Phe Met Glu Tyr Pro Phe Thr Tyr Val Ser Asn Gly Val
450 455 460
Tyr Lys Asp Tyr Glu Glu Leu Val Leu Met Ser Ser Cys Lys His Asn
465 470 475 480
Ile Ile Ala Asn Ser Thr Phe Ser Trp Trp Ala Ala Trp Leu Asn Lys
485 490 495
Asn Gln Asn Lys Ile Val Val Ala Pro Ser Lys Trp Phe Asn Asp Lys
500 505 510
Thr Tyr Ser Glu Asn Asn Leu Val Pro Lys Lys Trp Ile Arg Ile
515 520 525
<210> 61
<211> 526
<212> PRT
<213> Candidatus Nomurabacteria
<400> 61
Met Arg Ile Gly Ile Leu Tyr Ile Cys Thr Gly Lys Tyr Ser Ile Phe
1 5 10 15
Trp Lys Asp Phe Tyr Leu Ser Met Glu Glu Arg Phe Ile Thr Asp Ser
20 25 30
Glu Lys Tyr Tyr Phe Val Phe Thr Asp Ser Ala Glu Leu Asp Phe Glu
35 40 45
Lys Glu Asn Pro Arg Val His Arg Ile Tyr Gln Glu Asn Leu Gly Trp
50 55 60
Pro Glu Asn Thr Leu Met Arg Phe His Val Phe Leu Asn Lys Glu Lys
65 70 75 80
Glu Leu Glu Asp Met Asn Tyr Leu Phe Phe Phe Asn Ala Asn Leu Ile
85 90 95
Val Leu Glu Lys Ile Thr Ala Asp Asn Phe Leu Pro Asn Glu Asn Glu
100 105 110
Asn Leu Val Ala Thr Leu His Pro Gly Phe Tyr Asn Lys Asn Arg Lys
115 120 125
Lys Phe Thr Tyr Glu Asn Asn Lys Lys Ser Thr Ala Phe Ile Ser Lys
130 135 140
Asp Gln Gly Gln Tyr Tyr Phe Ala Gly Gly Leu Asn Gly Gly Lys Thr
145 150 155 160
Thr Asn Phe Ile Glu Ala Met Lys Val Met Arg Asp Asn Val Asp Ile
165 170 175
Asp Lys Lys Asn Asn Ile Ile Ala Lys Trp His Asp Glu Ser His Trp
180 185 190
Asn Arg Tyr Val Leu Asn Arg Thr Asp Val Lys Ile Leu Pro Pro Ser
195 200 205
Tyr Leu Tyr Pro Glu Gly Trp Pro Leu Pro Phe Asn Pro Ile Ile Leu
210 215 220
Ile Arg Asp Lys Asn Lys Tyr Gly Gly His Ala Ile Leu Arg Ser Ile
225 230 235 240
Lys Val Asn Lys Phe Lys Val His Phe Leu Lys Met Lys Lys Ile Phe
245 250 255
His Lys Phe Tyr Asn Lys Tyr Leu Glu Phe Lys Met Val Leu Phe Glu
260 265 270
Phe Lys Lys Pro Thr Tyr Ser Asn Leu Asn Lys Phe Asn Leu Lys Asn
275 280 285
Thr Lys Phe Ile Leu Ile Thr Ile Ala Phe Asn Asn Val Glu Ile Ile
290 295 300
Lys Phe Gln Asn Glu Lys Val Met Glu Asn Leu Lys Asp Asp Phe Ser
305 310 315 320
His Ile Ile Val Asp Asn Ser Ser Thr Lys Asn Val Ser Gly Glu Ile
325 330 335
Phe Lys Tyr Cys Lys Ile Asn Asn Ile Pro Tyr Val Lys Leu Pro Asn
340 345 350
Asn Thr Phe Glu Lys Ser Pro Ser Lys Ser His Gly Lys Ala Leu Asn
355 360 365
Trp Ala Tyr Arg Asn Ile Ile Asn Lys Tyr Glu Pro Ala Tyr Phe Gly
370 375 380
Phe Ile Asp His Asp Ile Ile Pro Phe Lys Glu Thr Ser Ile Thr Asn
385 390 395 400
Tyr Ile Lys Asn Gly Ala Trp Gly Leu Ile Gln Glu Arg Glu Glu Lys
405 410 415
Trp Tyr Leu Trp Pro Gly Phe Cys Phe Phe Lys Phe Ala Glu Val Arg
420 425 430
Lys Tyr Lys Met Asn Phe Met Pro Tyr Arg Gly Leu Asp Thr Gly Gly
435 440 445
Ser Asn Tyr His Ser Leu Tyr Lys Asn Ile Asn Lys Asn Asn Ile Leu
450 455 460
Lys Ile Arg Gln Thr Tyr Phe Asp Leu Asp Lys Asn Glu Lys Val Thr
465 470 475 480
Lys Phe Asp Thr Ser Glu Asn Ile Val Glu Val Leu Asp Asp Trp Val
485 490 495
His Ile Met Arg Thr Ser Asn Trp Asn Asn Gln Val Ser Ser Lys Asn
500 505 510
Ser Lys Phe Asn Glu Ile Ile Tyr Ile Ile Lys Glu Lys Phe
515 520 525
<210> 62
<211> 231
<212> PRT
<213> Chlamydiae bacterium
<400> 62
Met Trp Cys Phe Ala His Glu Pro Thr Ile Gly Phe Cys Ile Val Ala
1 5 10 15
Thr Gly Lys Tyr Ile Asp Phe Thr Pro Pro Leu Ile Glu Ser Ala Glu
20 25 30
Lys Tyr Phe Cys Arg Gly Thr Pro Lys Arg Tyr Phe Val Phe Ser Asp
35 40 45
Arg Thr Ser Glu Leu Pro Lys Asn Ala Glu Ile Ile Glu Val Arg His
50 55 60
Phe Ser Trp Pro Phe Ser Thr Ala Met Arg Asn Thr Phe Tyr Val Leu
65 70 75 80
His Lys Glu Arg Leu Lys Glu Cys Asp Tyr Leu Phe Ala Ile Asp Ala
85 90 95
Asp Met Arg Phe Val Ser Pro Ile Ala Lys Glu Glu Val Leu Gly Thr
100 105 110
Leu Val Ala Thr Gln His Pro Gly Phe Tyr Arg Met Arg Gly Ser Tyr
115 120 125
Glu Ser Asn Ser Ile Ser Lys Ala Phe Val Ala Pro Asn Glu Gly Glu
130 135 140
Tyr Tyr Phe Cys Gly Gly Phe Phe Gly Gly Lys Arg Glu Glu Phe Ile
145 150 155 160
Lys Leu Cys Gln Lys Thr Ser Asp Asn Phe Phe Glu Asp Leu Lys Lys
165 170 175
Gly Phe Ile Ala Glu Trp His Asp Glu Ser His His Asn Arg Tyr Leu
180 185 190
Ile Asp Tyr Pro Pro Thr Lys Ile Leu Ser Pro Ala Tyr Cys Tyr Pro
195 200 205
Glu Ser Trp Lys Leu Pro Phe Glu Lys Lys Leu Leu Ala Leu Asp Lys
210 215 220
Asn His Ala Glu Phe Gln Lys
225 230
<210> 63
<211> 234
<212> PRT
<213> Chlamydiae bacterium
<400> 63
Met Gln Glu Gly Phe Ala Arg Asp Ser Thr Pro Lys Gln Ile Gly Leu
1 5 10 15
Phe Ile Val Ala Thr Gly Lys Tyr Ile Gln Phe Val Asn Pro Leu Ile
20 25 30
Thr Ser Ala Arg His Trp Phe Cys Thr Asp His His Val Val Phe Phe
35 40 45
Val Phe Thr Asp Gln Glu Met Gln Glu Glu Phe Asp Val Ile Arg Ile
50 55 60
Pro Val Arg His Leu Gly Trp Pro Tyr Ala Thr Leu Met Arg Phe His
65 70 75 80
Met Tyr Ala Glu Tyr Gln Glu Gln Phe Asp Cys Leu Asp Tyr Ile Phe
85 90 95
Ala Ile Asp Ala Asp Ala Leu Phe Val Ala Pro Val Gly Glu Glu Ile
100 105 110
Phe Ser Asp Arg Val Phe Thr Leu His Pro Gly Phe Val Asn Arg Ala
115 120 125
Gly Thr Tyr Glu Arg Asn Pro Leu Ser Ala Ala Cys Val Ala Ser His
130 135 140
Glu Gly Thr Phe Tyr Phe Ala Gly Gly Phe Tyr Gly Gly Ser Pro Lys
145 150 155 160
Glu Phe Phe Arg Phe Val Asn Thr Ala Lys Glu Lys Val Asp Gln Asp
165 170 175
Leu Ala Lys Gly Cys Ile Ala Leu Trp His Asp Glu Ser His Leu Asn
180 185 190
Arg Tyr Ala Ile Asp Tyr Pro Pro Thr Leu Ile Leu Thr Pro Ser Tyr
195 200 205
Cys Tyr Pro Glu Ser Trp Arg Leu Pro Tyr Val Lys Lys Ile Leu Val
210 215 220
Leu Asp Lys Asp His Cys Ala Met Arg Asn
225 230
<210> 64
<211> 282
<212> PRT
<213> Clostridium hathewayi CAG:224
<400> 64
Met Val Tyr Cys Asp Met Ile Arg Asn Lys Ile Gly Ile Leu Tyr Val
1 5 10 15
Cys Thr Gly Glu Tyr Asn Ile Phe Trp Glu Asp Phe Tyr Lys Ser Phe
20 25 30
Glu Glu Lys Phe Cys Thr Asn Ser Asp Lys Ile Tyr Met Val Phe Thr
35 40 45
Asp Ala Asn Ser Ile Ala Tyr Glu Glu Met Thr Asn Val Ile Lys Ile
50 55 60
Tyr Gln Asp Cys Leu Gly Trp Pro Tyr Asp Thr Leu Met Arg Tyr Ser
65 70 75 80
Met Phe Glu Lys Ile Lys Asp Ile Ile Gly Lys Cys Glu Tyr Val Phe
85 90 95
Phe Phe Asn Ala Asn Met Ile Cys Asn Leu Ala Val Tyr Glu Glu Asp
100 105 110
Ile Leu Pro Arg Arg Ser Lys Gly Glu Ser Leu Ser Val Val Leu His
115 120 125
Pro Gly Tyr Gly Gly Lys Lys Ala Arg Phe Cys Pro Leu Glu Arg Asn
130 135 140
Lys Lys Ser Leu Ala Tyr Ile Pro Tyr Asn Cys Asn Ala Lys Tyr Val
145 150 155 160
Cys Gly Gly Val Asn Gly Gly Glu Ser Gln Ala Tyr Ile Glu Leu Ile
165 170 175
Glu Glu Leu Asn Arg Arg Ile Asn Ile Asp Leu Asp Asn Ala Ile Val
180 185 190
Ala Arg Val His Asp Glu Ser His Leu Asn Lys Tyr Ile Tyr Gly Arg
195 200 205
Gln Gly Val Arg Tyr Leu Gly Pro Glu Phe Cys Asn Pro Asp Asp Leu
210 215 220
Thr Leu Met Val Glu Lys Lys Ile Arg Leu Leu Asp Lys Asn Lys Tyr
225 230 235 240
Leu Asn Ile Asn Lys Leu Lys Asn Ile Lys Asn Glu Asn Phe Phe Gln
245 250 255
Lys Trp Arg Arg Arg Phe Ala Lys Tyr Ser Val Cys Glu Ile Gly Tyr
260 265 270
Leu Lys Asp Val Phe Met Arg Lys Arg Leu
275 280
<210> 65
<211> 177
<212> PRT
<213> Coxiella sp.
<400> 65
Met Asp Lys Asn Ile Gly Lys Tyr Lys Ile Val Met Val Ser Ile Cys
1 5 10 15
Leu Asn Gln Pro Tyr Trp Gln Tyr Ile Ser Pro Met Ile Glu Ser Ala
20 25 30
Arg Lys Phe Leu Leu Lys Gly His Asp Val Asp Phe Phe Val Trp Thr
35 40 45
Asp Met Pro Glu Glu Thr Asn Leu Gly Gln Gly Val Lys Ile Phe Pro
50 55 60
Thr Ala Pro Cys Asp Trp Pro Leu Pro Thr Leu Phe Arg Tyr His Leu
65 70 75 80
Phe Leu Gln Gln Glu Glu Leu Leu Lys Gln Tyr Asp Tyr Ile Phe Tyr
85 90 95
Cys Asp Ala Asp Met Leu Phe Val Ser Arg Val Gly Asn Glu Ile Leu
100 105 110
Gly Glu Gly Leu Thr Ala Ala Ala His Pro Met Tyr Ala Leu Arg Pro
115 120 125
Glu Tyr Ile His Pro Tyr Glu Pro Asn Ser Gln Ser Thr Ala Tyr Ile
130 135 140
Pro Ser Leu Gly Arg Val Leu Glu Asn Pro Lys Arg Phe Glu Pro Phe
145 150 155 160
Tyr Ala Ala Gly Gly Phe Gln Gly Gly Arg Thr Glu Asn Phe Ile Gln
165 170 175
Ala
<210> 66
<211> 557
<212> PRT
<213> Desulfocurvibacter africanus PCS
<400> 66
Met Arg Ile Gly Ile Leu Tyr Ile Cys Thr Gly Lys Tyr Thr Val Phe
1 5 10 15
Trp Asn His Phe Phe Thr Ser Cys Glu Gln His Phe Leu Arg Glu His
20 25 30
Glu Lys His Tyr Tyr Ile Phe Thr Asp Gly Glu Ile Ala His Leu Asn
35 40 45
Cys Asn Arg Val His Arg Ile Glu Gln Gln His Leu Gly Trp Pro Asp
50 55 60
Ser Thr Leu Lys Arg Phe His Met Phe Glu Arg Ile Ala Asp Thr Leu
65 70 75 80
Arg Gln Asn Ser Asp Phe Ile Val Phe Phe Asn Ala Asn Met Val Phe
85 90 95
Leu Arg Asp Val Gly Lys Glu Phe Leu Pro Thr Arg Glu Gln Ala Leu
100 105 110
Val Phe His Arg His Pro Gly Leu Phe Arg Arg Pro Ala Trp Leu Leu
115 120 125
Pro Tyr Glu Arg Arg Pro Glu Ser Thr Ala Tyr Ile Pro Tyr Gly Ser
130 135 140
Gly Ser Ile Tyr Val Cys Gly Gly Val Asn Gly Gly Tyr Thr Gln Pro
145 150 155 160
Tyr Leu Asp Phe Val Ala Met Leu Arg Arg Asn Ile Asp Ile Asp Val
165 170 175
Glu Arg Gly Ile Ile Ala Arg Trp His Asp Glu Ser His Ile Asn Arg
180 185 190
Phe Val Ile Gly Arg His Tyr Lys Ile Gly His Pro Gly Tyr Val Tyr
195 200 205
Pro Asp Arg Arg Asn Leu Pro Phe Pro Arg Ile Ile Arg Val Ile Asp
210 215 220
Lys Ala Ser Val Gly Gly His Thr Phe Leu Arg Gly Gln Thr Pro Glu
225 230 235 240
Pro Ala Pro Glu Glu Gln Ser Lys Thr Val Ala Lys Lys Leu Arg Ser
245 250 255
Gln Leu Lys Arg Pro Cys Met Pro Arg Ala Ala Gln Asp Glu Pro Ile
260 265 270
Ile Leu Ala Arg Met Met Gly Gly Leu Gly Asn Gln Met Phe Ile Tyr
275 280 285
Ala Ala Ala Arg Val Leu Ala Glu Arg Gln Gly Ala Gln Leu His Leu
290 295 300
Asp Thr Gly Lys Leu Ser Gly Asp Ser Ile Arg Gln Tyr Asp Leu Pro
305 310 315 320
Ala Phe Ser Ile Asp Ala Pro Leu Trp His Ile Pro Cys Gly Cys Asp
325 330 335
Arg Ile Val Gln Ala Trp Phe Ala Leu Arg His Val Ala Ala Gly Cys
340 345 350
Gly Met Pro Lys Pro Thr Met Gln Val Leu Arg Ser Gly Phe His Leu
355 360 365
Asp Gln Arg Phe Phe Ser Ile Arg His Ser Ala Tyr Leu Ile Gly Tyr
370 375 380
Trp Gln Ser Pro His Tyr Trp Arg Gly His Glu Asp Arg Val Arg Ser
385 390 395 400
Ser Phe Asp Leu Thr Arg Phe Glu Arg Pro His Leu Arg Glu Ala Leu
405 410 415
Ala Ala Val Ser Gln Pro Asn Thr Ile Ser Val His Leu Arg Arg Gly
420 425 430
Asp Phe Arg Ala Pro Lys Asn Ser Asp Lys His Leu Leu Ile Asp Gly
435 440 445
Ser Tyr Tyr Glu Arg Ala Arg Lys Leu Leu Leu Glu Met Thr Pro Gln
450 455 460
Ser His Phe Tyr Ile Phe Ser Asp Glu Pro Glu Glu Ala Gln Arg Leu
465 470 475 480
Phe Ala His Trp Glu Asn Thr Ser Phe Gln Pro Arg Arg Ser Gln Glu
485 490 495
Glu Asp Leu Leu Leu Met Ser Arg Cys Ser Ala Ser Ile Ile Ala Asn
500 505 510
Ser Ser Phe Ser Trp Trp Gly Ala Trp Leu Gly Arg Pro Lys Gln His
515 520 525
Val Ile Ala Pro Arg Met Trp Phe Thr Arg Asp Val Leu Met His Thr
530 535 540
Tyr Thr Leu Asp Leu Phe Pro Glu Lys Trp Ile Leu Leu
545 550 555
<210> 67
<211> 239
<212> PRT
<213> Desulfocurvibacter africanus PCS
<400> 67
Met Arg Val Ala Val Leu Tyr Ile Cys Thr Gly Lys Tyr Thr Val Phe
1 5 10 15
Trp Asp Gly Phe Phe Arg Ser Ser Glu Leu Phe Phe Met Arg Ser His
20 25 30
Glu Lys His Tyr Phe Val Phe Thr Asp Gly His Ile Asp His Thr Asn
35 40 45
Asp Ser Arg Val His Arg Ile Gln Gln Lys Lys Leu Gly Trp Pro Tyr
50 55 60
Asp Thr Leu His Arg Phe His Met Phe Ser Cys Ile Glu Ser Glu Leu
65 70 75 80
Gln Ser Phe Asp Phe Ile Leu Tyr Ile Asn Ala Asn Ser Tyr Phe Val
85 90 95
Thr Glu Cys Gly Asp Asp Val Leu Pro Lys His Lys Asp His Leu Leu
100 105 110
Leu Thr Leu His Pro Gly Tyr Trp His Ser Lys Tyr Arg Leu Leu Arg
115 120 125
Trp Lys Leu Pro Tyr Glu Arg Asp Val Arg Ser Thr Ala Tyr Ile Pro
130 135 140
Tyr Trp Lys Gly Gly Arg Tyr Val Cys Gly Gly Leu Asn Gly Gly Trp
145 150 155 160
Arg Asp Ser Tyr Leu Arg Leu Ile Arg Glu Leu Lys Glu Ala Ile Asp
165 170 175
Val Asp Gly Ile Asn Gly Ile Val Ala Arg Trp His Asp Glu Ser His
180 185 190
Leu Asn Arg Tyr Ala Leu Glu His Pro Ala Lys Leu Leu His Pro Gly
195 200 205
Tyr Met His Pro Ala Gly Glu Lys Leu Pro Phe Pro Lys Ile Val His
210 215 220
Leu Phe His Lys Lys Asp Phe Gly Gly His Asp Phe Leu Arg Ser
225 230 235
<210> 68
<211> 282
<212> PRT
<213> Gemmiger formicilis
<400> 68
Met Lys Thr Leu Ala Ile Leu Tyr Ile Cys Thr Gly Pro Tyr Ala Val
1 5 10 15
Phe Trp His Asp Phe Tyr Pro Asn Phe Lys Ala Asn Phe Leu Pro Asp
20 25 30
Cys Asp Arg Ile Phe Tyr Val Phe Thr Asp Ala Ala His Ile Asp Tyr
35 40 45
Glu Asp Ala Pro Asp Val Arg Arg Ile Tyr Gln Lys Ala Leu Pro Trp
50 55 60
Pro Gln Ser Thr Met Leu Arg Phe Asp Ala Phe Leu Gly Gln Ala Asp
65 70 75 80
Ala Leu Gln Gly Tyr Asp Tyr Leu Phe Phe Ala Asn Ala Asn Leu His
85 90 95
Cys Thr Arg Val Ile Arg Ala Asp Glu Leu Leu Pro Asp Pro Ala Ala
100 105 110
Gly Gln Ser Leu Thr Ala Val Cys His Leu Pro Tyr Tyr Gly Lys Asn
115 120 125
Pro Ile Phe His Pro Tyr Asp Arg Ser Gly Lys Ser Arg Ala Ser Ile
130 135 140
Pro Tyr Ser Cys Gly Gln Tyr Tyr Val Ala Gly Gly Leu Asn Gly Gly
145 150 155 160
Thr Ala Ala Ala Tyr Leu Ala Leu Cys Arg Glu Leu Lys Lys Arg Thr
165 170 175
Asp Glu Asp Leu Gln Asn Asn Val Ile Ala Arg Phe His Asp Glu Ser
180 185 190
Gln Leu Asn Arg Leu Val Ala Glu Thr Pro Gly Lys Phe Arg Ile Leu
195 200 205
Pro Pro Asp Tyr Cys Thr Pro Glu Glu Thr Pro Thr Gly His Glu Ala
210 215 220
Ile Leu Val Leu Gln Lys Ser Arg Cys Ile Asn Val Glu Ser Val Lys
225 230 235 240
Gly Ala Ala Lys Pro Gln Asn Phe Val Gln Arg Lys Trp Glu Ala Phe
245 250 255
Arg Leu Asn Trp Leu Pro Tyr Leu Trp Leu Ala Arg Asp Thr Leu Leu
260 265 270
Arg Arg Arg Ile Asp Phe Lys Asn Asp Leu
275 280
<210> 69
<211> 276
<212> PRT
<213> Gemmiger formicilis
<400> 69
Met Thr Lys Val Ala Ala Leu Tyr Ile Ala Thr Gly Arg Tyr Thr Val
1 5 10 15
Phe Trp Pro Glu Phe Tyr Glu Ser Ala Glu Lys Tyr Leu Leu Lys Asp
20 25 30
Cys Glu Val His Tyr Phe Val Phe Thr Asp Thr Ala Thr Leu Pro Gly
35 40 45
Asp Asp Asn Pro Arg Val His Ile Cys Ala Gln Glu Ala Tyr Ser Trp
50 55 60
Pro Phe Ala Thr Leu Arg Arg Phe Glu Ile Phe Leu Lys Gln Glu Gln
65 70 75 80
Ala Leu Lys Ala Phe Asp Tyr Ile Phe Phe Phe Asn Ala Asn Ala Glu
85 90 95
Phe Met Gln Pro Val Thr Arg Glu Met Leu Leu Pro Arg Ala Glu Lys
100 105 110
Gly Glu His Leu Leu Val Val Gln His Pro Ser Phe Tyr Ala Lys Pro
115 120 125
Asn Tyr Glu Phe Thr Tyr Asp Arg Asn Pro Arg Ser Thr Ala Cys Ile
130 135 140
Pro Tyr Gly Leu Gly Lys Tyr Tyr Val Cys Gly Gly Val Asn Gly Gly
145 150 155 160
Glu Ala Ala Ala Phe Leu Gln Leu Cys His Thr Leu Asp Ala Arg Ile
165 170 175
Arg Arg Asp Leu Gln Arg Asn Val Ile Ala Leu Trp His Asp Glu Ser
180 185 190
Gln Ile Asn Arg Tyr Ile Leu Phe Arg Lys Asp Phe Arg Val Leu Thr
195 200 205
Pro Ala Phe Cys Tyr Pro Glu Gly Trp Asp His Leu Pro Phe Pro Cys
210 215 220
Ile Ile Arg Ile Arg Ser Lys Ala Arg Tyr Ile Asp Ile Pro Ala Leu
225 230 235 240
Arg Lys Asp Ala Pro Glu Thr Lys Leu Ser Pro Ala Val Ala Arg Trp
245 250 255
Asn His Phe Ala Met Arg Ala Ala Arg Trp Thr Gln Asn His Ile Phe
260 265 270
Lys Lys Gly Ser
275
<210> 70
<211> 437
<212> PRT
<213> Guillardia theta
<400> 70
Met Arg Arg Leu Ile Phe Phe Leu Leu Leu Leu Leu Gln Ala Arg Gly
1 5 10 15
Ala Glu Asp Arg Thr Asp Ser Gln Asp Val Ala Val Thr Ile Thr Arg
20 25 30
Pro Glu Asp Gly Glu Arg Val Arg Gly Asp Val Val Pro Leu Glu Val
35 40 45
Ser Ala Met Ser Ser Arg Arg Gly Ser Arg Val Ile Leu Tyr Met Asp
50 55 60
Gly Arg Glu Val Tyr Arg Thr Glu Glu Arg Ala Val Ser Leu Gln Met
65 70 75 80
Ser Gln Leu Gln Val Gly Tyr His Val Met Glu Val Gln Leu Thr Glu
85 90 95
Glu Asp Glu Ala Val Ala Tyr Asp Ser Val Gly Arg Thr Ala Gln Glu
100 105 110
Phe Phe Tyr Val Gly Asp Gly Met Leu Ala Pro Asp Leu Asp Asp Thr
115 120 125
Glu His Val Asn Ile Leu Ser Asn Val Thr Thr Ile Asp Asp Met Glu
130 135 140
Arg Val Ala Ile Gln His Tyr Glu Arg Gly Gln Leu Asp Leu Ser Gly
145 150 155 160
Arg Glu Met Ser Glu Gln Ser Tyr Val Arg Leu Ile Ser Ala Met Ser
165 170 175
Asn Ala Pro Gly Ala Thr Met Pro Arg Leu Leu Ala Ser Leu Gly Arg
180 185 190
Val Leu Met Ala Lys Lys Asp Tyr Ile Gly Ala Leu Gln Ala Tyr Arg
195 200 205
Gly Asp Glu Val Arg Leu Phe Glu Met His Asp Lys Thr Ser Lys Arg
210 215 220
Leu Glu Ala Arg Ala Ala Cys Pro Val Lys Ala Ile Gly Thr Pro His
225 230 235 240
Ala Pro Gln Leu Leu Lys Val Gly Ile Leu Thr Val Ala Ser Gly Arg
245 250 255
Tyr Ala Ser Phe Val Arg Ser Thr Val Ser Ser Ala Glu Ser Tyr Leu
260 265 270
Leu Arg Ile Tyr Gly Leu Leu Ser Asp Leu Cys Met Gly Arg Glu Gly
275 280 285
Lys Gly Leu Met Leu Lys Gly Pro Trp Glu Asp Gly Arg Val His Ala
290 295 300
Val Tyr Arg Lys His Asp Gly Trp Pro Ser Ala Ser Met Lys Arg Ala
305 310 315 320
His Ser Tyr Leu Glu His Ala Glu Leu Trp Gly Ala Met Asp Tyr Val
325 330 335
Phe Ala Val Asp Val Gly Glu Thr Val Gly Thr Leu His Ala Asp Asn
340 345 350
Ala Phe Tyr Asp Gly Ser Glu Val Val Gly Arg Phe Gln Lys Ala Trp
355 360 365
Ser Val Asn Ala Glu Pro Gly Thr Met Trp Arg Gln His His Gly Asn
370 375 380
Ala Ala Leu Val Thr Arg Ala Val Tyr Glu Lys Arg Glu Glu Ser Thr
385 390 395 400
Ala Gly Met Arg Ala Gly Glu Gly Arg His Tyr Phe Ala Gly Gly Phe
405 410 415
Tyr Gly Gly Arg Ser Gln Lys Val Leu Glu Met Leu Lys Glu Leu Val
420 425 430
Lys Arg Thr Asn Gln
435
<210> 71
<211> 927
<212> PRT
<213> Guillardia theta
<400> 71
Met Ala Met Trp Arg Leu Ala Met Ala Met Leu Val Val Val Ser Thr
1 5 10 15
Met Gly Gly Gly Gly Asp Ala Arg Gly Arg Arg Glu Asp Asp Glu Ile
20 25 30
Pro Ile Arg Val His Ala Thr Ser Pro Met Arg Gly Trp Val Leu Val
35 40 45
Arg Gly Lys Leu Pro Val Ser Phe Phe Leu Ser Tyr Gly Asn Ser Ser
50 55 60
Arg Ser Gly Ala Cys Arg Ala Gly Ser Gln Arg Leu Ser Met Arg Ile
65 70 75 80
Ile Val Asp Glu Glu Thr Tyr Glu Glu Val Asp Ile Ser Asn Gly Ala
85 90 95
Ala Tyr Ser Lys Val Phe Pro Ala Asp Leu Ser Pro Gly Val His Thr
100 105 110
Ile Arg Ile Glu Gly Ala Glu Ser Thr Arg Pro Phe Leu Gln Gln Glu
115 120 125
Glu Ile Ser Phe Ser Val Val Asp Ser Glu Asp Asp Phe His Asp Val
130 135 140
Arg His Tyr Asp Glu Ile Met Gly Ser Ala Pro Thr Ile Asp Asp Ser
145 150 155 160
Arg Gly Phe Thr Ser Gly Lys Pro Leu Lys Gly Val Ala Ile Leu Tyr
165 170 175
His Lys Gln Ala Arg Leu Lys Tyr Glu Asp Arg Trp Ile Glu Lys Cys
180 185 190
Ile Glu Ser Ile Leu Asn Gln Asn Tyr Pro Phe Phe Asp Ile Val Glu
195 200 205
Leu Asn Tyr Gly Gly Glu Tyr His Ser Phe Met Gln Gln Tyr Leu His
210 215 220
Arg Leu Glu Gly Lys Arg Tyr Thr Phe Phe Ser Arg Glu Phe Gln Ser
225 230 235 240
His Ala Val Ala Met Asn Phe Leu Leu Asp Trp Val Phe Ser Glu Asp
245 250 255
Tyr Asp Val Ala Phe Asn Val Asn Leu Asp Asp Tyr Tyr Ser Pro Asp
260 265 270
Arg Phe Lys Leu Gln Ala Glu Ala Val Met Glu Gly Ala Asp Leu Val
275 280 285
Ser Ser Tyr Phe Val Arg Val Val Glu Ala Gly Glu Gly Val Asp Val
290 295 300
Ile Asn Thr Lys Met Asn Pro Val Tyr Leu Thr Ala Gln Glu Leu Leu
305 310 315 320
Gly Arg Asp His Val Ser Glu Glu Asp Ile Phe Ser Gln Leu Arg Glu
325 330 335
Asp His Asn Val Ile Cys His Pro Gly Val Ala Tyr Ser Arg Ser Phe
340 345 350
Trp Lys Thr Leu Ser Ser Leu Asn Cys Lys Gln Gly Leu Ala Glu Ser
355 360 365
Ser Gln Asp Ala Gln Trp His Ala Arg Ser Asn Thr Leu His Gln His
370 375 380
Ala Arg Val Cys Ser Asp Ser Ala Asp Leu Glu Asn Leu Phe Arg Pro
385 390 395 400
Leu Arg Tyr Arg Pro Glu Leu Pro Ala Glu Asp Leu Arg Leu Trp Gln
405 410 415
Arg Ala Val Leu Met Ser Ser Val Lys Thr Val Ile Val Pro Arg Val
420 425 430
Leu Val Phe Tyr Arg Ile His Glu Ser Gln Leu Ser Pro Ser Asp Glu
435 440 445
Ala Val Asn Val Lys Tyr Arg Ala Asp Leu Thr Val Ser Gly Ala Met
450 455 460
Leu Asn Lys Met Arg Val Gly Ile Leu Thr Ile Cys Thr Gly Arg Gln
465 470 475 480
Glu Thr Tyr Ser Gly Arg Leu Arg Tyr Cys Ala Tyr Leu Pro Glu His
485 490 495
Ile Arg Thr Val Arg Glu Arg Phe Val Ser Glu His His Leu Cys Phe
500 505 510
Phe Thr Phe Thr Asp Asp Pro Arg Gly Ala Glu Glu Ile Phe Ser Arg
515 520 525
Met Pro Ser Pro Ser Glu Val Ile Pro Ile Arg Gly Arg Gly Phe Pro
530 535 540
Ala Asp Thr Leu Tyr Arg Tyr His Tyr Phe Leu Ser Gln Ser Ser Lys
545 550 555 560
Leu Lys Thr Glu Thr Asp Val Val Phe Tyr Leu Asp Val Asp Val Ile
565 570 575
Val Glu Lys Gly Ile Ala Ala Ala Pro Cys Cys His Pro Thr Tyr Asp
580 585 590
Ser Arg Arg His Gly Asn Thr Arg Asp Lys Asn Ser Phe Glu Ser Ile
595 600 605
Tyr Arg Ser Trp Ser Ser Ala Val Leu Leu Val Leu Val Leu Val Leu
610 615 620
Val Leu Val Leu Val Leu Val Leu Val Leu Val Leu Val Leu Leu Pro
625 630 635 640
Leu Cys Ile Val Ser Phe Leu Ser His Arg Asp Cys Ser Phe Ala Asn
645 650 655
Ser Tyr His Arg His Ile Leu Asp His Pro Ile Ser Glu His Leu Arg
660 665 670
Pro Cys Tyr Phe Ala Gly Gly Phe Ile Gly Gly Arg Thr Asp Glu Phe
675 680 685
Leu Gln Met Ser Ala Ala Ile Ser Glu Ala Ile Asp Arg Asp Asp Glu
690 695 700
Asn Asp Val Ile Asn Glu Ser Leu Gln Pro Arg Leu Lys Leu Ala Met
705 710 715 720
Gln Val Val Ala Leu Trp His Asp Glu Ser His Leu Asn Arg Tyr Leu
725 730 735
Ser His His Pro Gln Leu Val Arg Ile Leu Ser Pro Ser Tyr Leu Tyr
740 745 750
Pro Asp Gly Trp Asp Ile Pro Phe Pro Arg Arg Ile Ala Val Gln Lys
755 760 765
Ile Pro His Glu Ala Thr Arg Phe Ser Arg Glu Arg Phe Val Ser Val
770 775 780
Cys Ile Gln His Ala Asn Gly Val Cys Asn Met Gly Glu Ser Leu Gly
785 790 795 800
Arg Met Met Thr Ala Val Ala Ser Gly Val Ala Leu Ala Ala Ala Leu
805 810 815
Asn Asp Asp Gln Asp Glu Asp Ala Gly Arg Leu Gln Val Leu Leu Pro
820 825 830
Leu Asn Trp Cys Tyr Gly Asp Ser Lys Val Ile Cys Gly Gly Asn Arg
835 840 845
Ser Lys Glu Arg Leu Ser Tyr Arg His Ser Trp Leu Ser Asn Phe Arg
850 855 860
Arg Ser Asp Ser Ile His Glu Ile Pro Phe His Leu Leu His Thr Ser
865 870 875 880
Ser Ile Gly Ala Val Gly Gln Glu Gly Ser Phe Ala Ile Pro Glu Pro
885 890 895
Ser Met Arg Ala Val Ser Ser Gly Ile Pro Gly Gly Val Phe Leu Met
900 905 910
Glu Val Pro Leu Gln Leu Ser His Leu Arg Ser Ser His Arg Val
915 920 925
<210> 72
<211> 382
<212> PRT
<213> Helicobacter sp. 11S02629-2
<400> 72
Met Gln Asp Ile Glu Leu Glu Ser Lys Lys Asp Thr Phe Glu Ser Pro
1 5 10 15
Pro Pro Pro Ile Asn Asn Leu Ser Gln Lys Asp Ile Asp Lys Met Lys
20 25 30
Ile Ala Ile Leu Tyr Ile Ala Thr Gly Arg Tyr Asp Val Phe Phe Glu
35 40 45
Asp Phe Tyr Lys Ser Met Glu Lys Phe Phe Ile Lys Asp Ala Ser Lys
50 55 60
His Tyr Phe Val Trp Thr Asp Ser Lys Lys Ile Glu Thr Asn Gly Asn
65 70 75 80
Ile Thr Lys Ile Tyr Gln Glu Lys Leu Gly Trp Pro Tyr Asp Thr Leu
85 90 95
Leu Arg Tyr Asp Met Phe Trp Lys Ile Lys Asp Glu Leu Ser Asn Phe
100 105 110
Asp Tyr Ile Phe Phe Phe Asn Ala Asn Met Val Val Lys Gln Glu Ile
115 120 125
Phe Lys Asp Glu Phe Leu Pro Asp Thr Lys Ser Gly Leu Val Gly Cys
130 135 140
Leu His Pro Gly Phe Ile Lys Ile Gly Leu Asp Leu Lys Ile Tyr Pro
145 150 155 160
Ser Arg Asn Ala Lys Lys Phe Thr Tyr Asp Lys Asn Pro Lys Ser Leu
165 170 175
Ala Phe Ile Glu Glu Gly Arg Gly Ser Ala Tyr Tyr Ala Gly Gly Leu
180 185 190
Asn Gly Gly Ser Lys Asp Ala Tyr Leu Lys Leu Ile Lys Thr Leu Lys
195 200 205
Asp Asn Ile Gln Thr Asp Met Asp Asn Gly Val Thr Ala Leu Trp His
210 215 220
Asp Glu Ser His Ile Asn Lys Tyr Phe Leu Asp Lys Glu Ile Lys Ala
225 230 235 240
Leu Ser Ser Met Phe Leu Lys Pro Glu Gly Trp Tyr Phe Asn Ile Asp
245 250 255
Lys Ala Phe Val Met Asp Glu Glu Cys Met Gln Asp Gly Leu Lys Arg
260 265 270
Lys Glu Phe Thr Glu Asn Leu Cys Ser Lys Ala Thr Leu Ile Pro Arg
275 280 285
Asp Leu Leu Ile Lys Leu Leu Glu Lys Gln Tyr Gly Phe Lys Asn Tyr
290 295 300
Glu Ser Arg Tyr His Phe Met Lys Asp Ala Ile Asn Asp Tyr Phe Asp
305 310 315 320
Leu Glu Lys His Thr Lys Ile Leu Leu Leu Asp Lys Ala Asn Pro Lys
325 330 335
Tyr Gly Gly His Ala Tyr Leu Arg Gly Glu Lys Arg Phe Lys Ser Ile
340 345 350
Ser Ile Glu Tyr Arg Phe Lys Ser Ile Lys Thr Leu Lys Lys Ile Ala
355 360 365
Ser Ser Ile Lys Ala Lys Leu Lys Arg Phe Lys Ser Leu Arg
370 375 380
<210> 73
<211> 389
<212> PRT
<213> Helicobacter sp. 13S00401-1
<400> 73
Met Ile His Ala Ser Lys Lys Tyr Lys Ser Tyr Thr Lys Leu His Ser
1 5 10 15
Tyr Pro Pro Pro Pro Ser Asn Ile Gln Thr Leu Pro Ser Glu Asp Lys
20 25 30
Ser Lys Met Lys Ile Ala Ile Leu Tyr Ile Ser Thr Gly Arg Tyr Asp
35 40 45
Ile Phe Phe Lys Lys Phe His Lys Thr Met Gln Lys Phe Phe Ile Lys
50 55 60
Gly Ala Gln Lys His Tyr Phe Val Trp Thr Asp Ser Lys Lys Ile Lys
65 70 75 80
Asn Thr Lys Asp Ile Thr Lys Ile Tyr Gln Glu Lys Leu Gly Trp Pro
85 90 95
Tyr Asp Thr Leu Met Arg Tyr His Met Phe Tyr Glu Ile Arg Asp Arg
100 105 110
Leu Lys Glu Phe Asp Tyr Ile Tyr Phe Phe Asn Ala Asn Ile Val Ile
115 120 125
Lys Gln Glu Ile Thr Lys Asp Glu Phe Leu Pro Asn Thr Lys Ser Gly
130 135 140
Leu Val Gly Cys Leu His Pro Gly Phe Ile Asp Leu Asp Leu Glu Phe
145 150 155 160
Asn Ile Val Pro Lys Lys Asp Ala Ala Lys Phe Thr Tyr Asp Arg Asn
165 170 175
Glu Lys Ser Leu Ala Tyr Ile Lys Glu Gly Asp Gly Leu Ala Tyr Tyr
180 185 190
Ala Gly Gly Leu Asn Gly Gly Ala Lys Asp Ala Tyr Leu Lys Leu Ile
195 200 205
Lys Asp Leu Arg Asp Asn Ile Gln Gln Asp Leu Asp Lys Gly Ile Val
210 215 220
Ala Leu Trp His Asp Glu Ser His Ile Asn Lys Tyr Phe Leu Asp Lys
225 230 235 240
Glu Ile Lys Ala Leu Pro Ser Thr Phe Leu Val Pro Glu Gly Trp Glu
245 250 255
Phe Ser Ile Ser Asp Lys Phe Ile Met Asp Glu Glu Cys Met Lys Asp
260 265 270
Glu Leu Lys Lys Lys Glu Phe Thr Lys Asn Leu Leu Ser Arg Leu Asn
275 280 285
Leu Ile Pro Ser Leu Glu Leu Glu Lys Leu Leu Ala Lys Gln Ser Glu
290 295 300
Leu Lys Ser Tyr Glu Asp Arg Arg Cys Phe Met Gln Thr Ala Ile Asn
305 310 315 320
Gly Tyr Phe Asp Leu Lys Lys His Thr Lys Ile Leu Leu Leu Glu Lys
325 330 335
Ser Asn Pro Lys Tyr Gly Gly His Asp Tyr Leu Arg Gly Glu Lys Gln
340 345 350
His Lys Asn Val Ser Leu Arg Tyr Tyr Ile Ser Arg Val Asn Val Ala
355 360 365
Arg Lys Leu Ala Ser Leu Ile Lys Arg Arg Leu Lys Lys Tyr Ile Lys
370 375 380
Arg Asn Asp Lys Ile
385
<210> 74
<211> 275
<212> PRT
<213> Lachnospiraceae bacterium
<400> 74
Met Val Ser Arg Met Asp Ser Asn Leu Lys Ile Ala Ile Leu Tyr Ile
1 5 10 15
Cys Thr Gly Glu Tyr Asn Val Phe Trp Lys Asp Phe Tyr Ile Ser Phe
20 25 30
Glu Lys Phe Phe Leu Thr Ser Tyr Glu Lys His Tyr Phe Val Phe Thr
35 40 45
Asp Ala Lys Lys Ile Tyr Asn Glu Asp Cys Tyr Lys Arg Ile His Lys
50 55 60
Ile Tyr Gln Lys Asn Leu Gly Trp Pro Glu Asn Thr Leu Phe Arg Tyr
65 70 75 80
Glu Met Phe Phe Ser Ile Arg Glu Tyr Leu Lys Glu Phe Asp Tyr Thr
85 90 95
Phe Phe Phe Asn Ala Asn Val Ile Cys Lys Asp Val Ile Val Gly Glu
100 105 110
Glu Phe Leu Pro Leu Lys Glu Gly Leu Leu Val Val Gln His Pro Gly
115 120 125
Phe Phe Asp Val Pro Asn Tyr Arg Phe Pro Tyr Asp Arg Asn Lys Lys
130 135 140
Ser Ser Ala Tyr Ile Pro Tyr Gly Lys Gly Gln Val Tyr Val Cys Gly
145 150 155 160
Gly Ile Asn Gly Gly Lys Thr Asn Val Phe Leu Asp Leu Ile Lys Glu
165 170 175
Leu Lys Asn Arg Ile Glu Leu Asp Tyr Lys Lys Gly Ile Ile Ala Leu
180 185 190
Trp His Asp Glu Ser Gln Ile Asn Lys Tyr Ile Leu Glu His Ser Ala
195 200 205
Tyr Lys Leu Leu Ser Pro Ser Tyr Cys Tyr Pro Glu Gly Trp Asn Ile
210 215 220
Pro Phe Ile Pro Lys Leu Val Val Leu Asp Lys Asn Lys Phe Ile Asp
225 230 235 240
Val Ser Asn Ile Lys Lys Thr Asn Glu Arg Asn Glu Phe Ile Ile Lys
245 250 255
Ile Lys Arg Tyr Leu Ile Cys Lys Phe Tyr Asp Leu Tyr Tyr Trp Phe
260 265 270
Arg Arg Gly
275
<210> 75
<211> 258
<212> PRT
<213> Marinomonas polaris
<400> 75
Met Ser Lys Ile Gly Val Leu Tyr Ile Cys Thr Gly Lys Tyr Ala Ala
1 5 10 15
Phe Trp Asp Gly Phe Tyr Ala Ser Ala Lys Glu Asn Leu Cys Ile Asp
20 25 30
Ser Gln Leu Ile Phe Tyr Val Phe Thr Asp Cys Glu Ala Leu Leu Asn
35 40 45
Leu Gln Leu Asp Asp Val Arg Phe Ile Tyr Lys Lys Ser Glu Ser Trp
50 55 60
Pro Met Pro Thr Leu Met Arg Phe Ser Thr Phe Leu Ser Gln Glu Lys
65 70 75 80
Lys Tyr Leu Glu Val Asp Tyr Leu Leu Phe Cys Asn Ala Asn Leu Ile
85 90 95
Ile Glu Gln Pro Ile Ala Thr Ala Glu Ile Phe Phe Asp Lys Pro Tyr
100 105 110
Phe Ala Thr Ile His Pro Gly His Val Gly Lys Asp Pro Gln Lys Phe
115 120 125
Pro Tyr Glu Lys Asn Ser Asn Ser Leu Ala Tyr Ile Asn Asn Ala Ala
130 135 140
Pro Tyr Tyr Val Cys Gly Gly Phe Asn Gly Gly Arg Arg Glu Asp Phe
145 150 155 160
Val Lys Met Cys Glu Leu Leu Ser Arg Asn Ile Asp Lys Asp Leu Glu
165 170 175
Asn Asn Ile Ile Ala Val Trp His Asp Glu Thr His Phe Asn Lys Phe
180 185 190
Tyr Ser Glu Arg Leu Asn Leu Phe Asn Val Leu Pro Ala Lys Tyr Cys
195 200 205
Gln Pro Gln Gly Trp Pro Ala Lys Asp Asp Pro Ile Ile Thr Val Leu
210 215 220
Asn Lys Glu Phe Val Ile Gly Val Ser Asn Lys Gly Ala Phe Tyr Ser
225 230 235 240
Ile Arg Tyr Tyr Leu Ser Lys Leu Tyr Arg Arg Ile Arg Ser Ile Leu
245 250 255
Ile Ser
<210> 76
<211> 266
<212> PRT
<213> Marmoricola scoriae
<400> 76
Met Ser Ala Ala Thr Thr Ala Gly Pro Arg Val Ser Leu Ile Val Ile
1 5 10 15
Ala Thr Gly Arg Tyr Leu Ser Phe Leu Glu Pro Leu Leu Val Ser Ala
20 25 30
Arg Arg His Val Val Gly Leu Asp Arg Val Phe Val Leu Ser Asp Leu
35 40 45
Arg Pro Pro Asp Asp Pro Thr Val Gln Trp Leu Pro Trp Gly His Leu
50 55 60
Pro Trp Pro Tyr Pro Thr Leu Leu Arg Tyr Arg Ala Ile Ser Ala Tyr
65 70 75 80
Arg Arg Val Leu Glu Gln Thr Asp Val Leu Leu Tyr Val Asp Val Asp
85 90 95
Met Leu Phe Val Gly Thr Phe Asp Val Ser Ala Thr Ala Gly Leu Val
100 105 110
Ala Val Arg His Pro Gly Phe Ala Glu Ser Ser Arg Ala Gln Leu Pro
115 120 125
Tyr Glu Thr Asp Val Arg Ser Arg Ala Phe Val Pro Pro Glu Leu Gly
130 135 140
Thr Val Tyr Val Ala Gly Gly Val Gln Gly Gly Arg Ala Gly Asp Tyr
145 150 155 160
Leu Asp Ala Cys Glu Leu Met Ala Glu Glu Val Gln Leu Asp Leu Asp
165 170 175
Gly Gly Ile Val Pro Thr Trp His Asp Glu Ser Val Trp Asn Ala Phe
180 185 190
Cys Ala Arg Arg Pro Pro Asp Thr Leu Leu Ser Val His His Cys Thr
195 200 205
Pro Glu Lys Glu Val Gly Pro Glu Thr Leu Leu Val Ala Leu Asp Lys
210 215 220
Asp His Asp His Phe Arg Glu Val Pro His Leu Glu Arg Ala Arg Arg
225 230 235 240
Arg Leu Leu Gln Gln Leu Gln Arg Val Arg Ala Ala Val Val Arg Ala
245 250 255
Val Arg Pro Ala Val Arg Val Val Arg Arg
260 265
<210> 77
<211> 250
<212> PRT
<213> Muribaculaceae bacterium
<400> 77
Met Lys Ile Gly Met Leu Tyr Ile Gly Ile Gly Arg Tyr Ala Ala Phe
1 5 10 15
Trp Pro Glu Phe Tyr Arg Ser Ala Arg Glu Tyr Phe Leu Pro Asp Ala
20 25 30
Thr Lys His Phe Phe Val Phe Ala Asp Ala Pro Leu Glu Asp Ala Gly
35 40 45
Asp Asp Val Ser Val Phe His Asn Asp Asp Met Gly Trp Pro Leu Asn
50 55 60
Ser Leu Trp Arg Tyr His Met Phe Leu Arg Ile Ala Asp Arg Leu Lys
65 70 75 80
Glu Tyr Asp Tyr Leu Phe Phe Phe Asn Ala Asn Cys Lys Phe Val Arg
85 90 95
Arg Val Glu Pro Ser Asp Ile Leu Pro Gln Gly Asp Val Glu Tyr Cys
100 105 110
Ala Met Cys Thr Gln Thr Asp Pro Ala Lys Met Ser Leu Glu Ser Arg
115 120 125
Pro Glu Cys Ala Ser Tyr Val Ala Pro Gly Ser Val Ser Arg Tyr Trp
130 135 140
Ala Gly Gly Ile Asn Gly Gly Arg Ala Glu Ala Phe Leu Arg Leu Ala
145 150 155 160
Arg Glu Cys Ala Ala Ile Ala Glu Arg Asp Leu Ala Asn Gly Phe Met
165 170 175
Pro Val Trp His Asp Glu Ser Val Val Asn His Phe Phe Ala Asp Lys
180 185 190
Lys Val Arg Ala Leu Asp Arg Arg Met Gly Cys Pro Ser Gln Trp Lys
195 200 205
Ser Pro Ala Asp Pro Phe Val Ile Leu Arg Arg Lys Asp Asp Val Leu
210 215 220
Gly Arg Ser Trp Leu Arg Thr Tyr Lys Gly Arg Lys His Ser Ser Phe
225 230 235 240
Trp Lys Lys Leu Phe Arg Lys Leu Arg Lys
245 250
<210> 78
<211> 258
<212> PRT
<213> Neisseriaceae bacterium
<400> 78
Met Lys Ile Ala Ile Leu Tyr Ile Cys Thr Gly Lys Tyr Asp Ile Phe
1 5 10 15
Trp Ser Asp Phe Tyr Ser Thr Ser Gln Lys Tyr Phe Cys Thr Thr Glu
20 25 30
Asp Lys His Tyr Phe Val Phe Thr Asp Ser Glu Gln Ile Lys Ala Asp
35 40 45
His Asn Val Ser Val Ile Tyr Gln Asp Ser Leu Gly Trp Pro Phe Asn
50 55 60
Thr Leu Tyr Arg Tyr Arg Met Phe Leu Arg Val Gln His Lys Leu Ser
65 70 75 80
Lys Phe Asp Lys Val Ile Phe Phe Asn Gly Asn Cys Thr Phe Val Asp
85 90 95
Gln Ile Asp Tyr Glu Asn Phe Phe Gly Arg Ser Ser Thr Leu Val Ala
100 105 110
Cys Leu His Pro Gly Phe Leu Asn Lys Asn Cys Glu Glu Phe Thr Tyr
115 120 125
Glu Lys Arg Lys Asn Ser Leu Ala Phe Val Gly Ser Pro Trp Lys Tyr
130 135 140
Phe Ala Gly Gly Ile Asn Gly Gly Asn Ala Asn Glu Ile Leu Lys Ile
145 150 155 160
Phe Gln Ile Leu Ser His Asn Ile Glu Asp Asp Leu Lys Asn Gly Ile
165 170 175
Val Ala Ile Trp His Asp Glu Ser His Trp Asn Ala Tyr Leu Asn Asn
180 185 190
Asn Tyr Glu Val Leu Lys Asp Lys Leu His Ile Leu Ser Pro Glu Tyr
195 200 205
Leu Tyr Pro Glu Gly Trp Asp Leu Pro Phe Glu Lys Lys Ile Ile Leu
210 215 220
Arg Asp Lys Asn Gln Tyr Gly Gly His Asn Leu Leu Arg Gly Ala Ala
225 230 235 240
Gln His Asn Phe Pro Asn Thr Ile Lys Lys Ile Leu Lys Lys Ile Ile
245 250 255
Cys Arg
<210> 79
<211> 265
<212> PRT
<213> Nocardioides sp. PD653
<400> 79
Met Ser Ser Glu Thr Thr Arg Val Gly Leu Ile Val Ile Ala Thr Gly
1 5 10 15
Arg Tyr Val Glu Phe Val Asp Gln Leu Leu Ala Ser Ala His Glu His
20 25 30
Val Ala Gly Leu His Arg Leu Tyr Val Leu Ser Asp Arg Arg Pro Pro
35 40 45
Asp Asp Pro Arg Ile Val Trp Leu Pro Trp Gly His Ile Gly Trp Pro
50 55 60
Tyr Pro Thr Leu Leu Arg Tyr Arg Ala Ile Ala Ala His Gln Asp Ile
65 70 75 80
Leu Arg Glu Cys Asp Ile Leu Val Tyr Ser Asp Val Asp Met Arg Phe
85 90 95
Val Ala Ser Phe Asp Met Thr Gln Ile Arg Gly Ile Phe Ala Val Ser
100 105 110
His Pro Gly Tyr Val Gly Ala Thr Pro Asp Ser Leu Pro Tyr Glu Arg
115 120 125
Asn Pro Ala Ser Gln Ala Tyr Val Pro Val Gly Ser Gly Leu Glu Tyr
130 135 140
Phe Ala Gly Gly Val Gln Gly Gly Arg Ala Glu Ile Tyr Leu Asp Ala
145 150 155 160
Cys Glu Gln Met Ala Ala Arg Val Gln Glu Asp Leu Asn Ala Gly Ile
165 170 175
Val Pro Val Trp His Asp Glu Ser Ile Trp Asn Gly Trp Leu Ile Asp
180 185 190
His Pro Pro Asp Leu Val Leu Gly Ser Glu Tyr Cys Thr Pro Glu Thr
195 200 205
Ala Ala Gly Pro Gln Ser Val Leu Leu Ala Leu Asp Lys Asp His Ala
210 215 220
Arg Leu Arg Gly Thr Pro Trp Gln Val Arg Ser Val Glu Arg Leu Val
225 230 235 240
Arg Ala Arg Arg Ala Leu Arg Arg Arg Ser Arg Ala Ala Ala Arg Val
245 250 255
Ala Ala Arg Ala Trp Gly Arg Arg Arg
260 265
<210> 80
<211> 274
<212> PRT
<213> Parabacteroides goldsteinii
<400> 80
Met Arg Ile Gly Ile Leu Tyr Ile Cys Thr Gly Arg Tyr Ser Ile Phe
1 5 10 15
Trp Lys Lys Phe Tyr Gln Ser Thr Glu Lys Ser Phe Met Gln Gly Leu
20 25 30
Pro Cys Ile Arg Glu Tyr Tyr Val Phe Thr Asp Asn Pro Cys Leu Tyr
35 40 45
Gly Glu Lys Lys Asn Lys Arg Ile His Arg Ile Tyr Gln Glu Asn Leu
50 55 60
Gly Trp Pro Asp Asn Thr Leu Met Arg Phe Ser Met Phe Leu Lys Ile
65 70 75 80
Lys Glu Arg Leu Glu Lys Glu Thr Asp Tyr Leu Tyr Phe Phe Asn Ala
85 90 95
Asn Met Val Ile Arg Glu Lys Ile Gly Lys Glu Phe Leu Pro Glu Glu
100 105 110
Ser Ser Asn Gly Leu Val Gly Leu Ile His Pro Gly Gly Tyr Asp Arg
115 120 125
Glu Val Asn Glu Phe Thr Tyr Asp Arg Asn Glu Lys Ser Thr Ala Tyr
130 135 140
Ile Pro Tyr Gly Glu Gly Arg Tyr Tyr Tyr Ala Gly Gly Leu Asn Gly
145 150 155 160
Gly Arg Thr Pro Ala Phe Leu Lys Met Ser Glu Thr Leu Arg Asp Asn
165 170 175
Thr Glu Glu Asp Lys Arg Asn Gly Val Met Ala Leu Trp His Asp Glu
180 185 190
Ser His Ile Asn Arg Tyr Phe Leu Asp His Pro Pro Tyr Ser Leu Thr
195 200 205
Pro Ala Tyr Cys Tyr Pro Glu Gly Trp Asn Met Pro Phe Pro Gln Ile
210 215 220
Ile Leu Leu Leu Asp Lys Ser Phe Ile Cys Gly Gly His Lys Tyr Leu
225 230 235 240
Arg Gly Gly Lys Arg Asn Phe His Asp Tyr Thr Ser Tyr Leu Lys Arg
245 250 255
Ser Leu Val Arg Phe Ala Arg Lys Val Ile Gly Val Leu Arg Gly Phe
260 265 270
Gly Leu
<210> 81
<211> 274
<212> PRT
<213> Parabacteroides goldsteinii
<400> 81
Met Arg Ile Gly Ile Leu Tyr Ile Cys Thr Gly Arg Tyr Ser Ile Phe
1 5 10 15
Trp Lys Lys Phe Tyr Gln Ser Thr Glu Lys Ser Phe Met Gln Gly Ser
20 25 30
Pro Cys Ile Arg Glu Tyr Tyr Val Phe Thr Asp Asn Pro Cys Leu Tyr
35 40 45
Gly Glu Lys Lys Asn Lys Arg Ile His Arg Ile Tyr Gln Glu Asn Leu
50 55 60
Gly Trp Pro Asp Asn Thr Leu Met Arg Phe Ser Met Phe Leu Lys Ile
65 70 75 80
Lys Glu Arg Leu Glu Lys Glu Thr Asp Tyr Leu Tyr Phe Phe Asn Ala
85 90 95
Asn Met Val Ile Arg Glu Lys Ile Gly Lys Glu Phe Leu Pro Glu Glu
100 105 110
Ser Ser Asn Gly Leu Val Gly Leu Ile His Ser Gly Gly Tyr Asp Arg
115 120 125
Glu Val Asn Glu Phe Thr Tyr Asp Arg Asn Glu Lys Ser Thr Ala Tyr
130 135 140
Ile Pro Tyr Gly Glu Gly Arg Tyr Tyr Tyr Ala Gly Gly Leu Asn Gly
145 150 155 160
Gly Arg Thr Pro Ala Phe Leu Lys Met Ala Glu Thr Leu Arg Asp Asn
165 170 175
Thr Glu Glu Asp Lys Arg Asn Gly Val Met Ala Leu Trp His Asp Glu
180 185 190
Ser His Ile Asn Arg Tyr Phe Leu Asp His Pro Pro Tyr Ser Leu Thr
195 200 205
Pro Ala Tyr Cys Tyr Pro Glu Gly Trp Asn Met Pro Phe Pro Gln Ile
210 215 220
Ile Leu Leu Leu Asp Lys Ser Phe Ile Cys Gly Gly His Lys Tyr Leu
225 230 235 240
Arg Gly Gly Lys Arg Asn Phe His Asp Tyr Thr Ser Tyr Leu Lys Arg
245 250 255
Ser Leu Val Arg Phe Ala Arg Lys Val Ile Gly Val Leu Arg Gly Phe
260 265 270
Gly Leu
<210> 82
<211> 274
<212> PRT
<213> Parabacteroides goldsteinii
<400> 82
Met Arg Ile Gly Ile Leu Tyr Ile Cys Thr Gly Arg Tyr Ser Ile Phe
1 5 10 15
Trp Lys Lys Phe Tyr Gln Ser Thr Glu Lys Ser Phe Met Gln Gly Leu
20 25 30
Pro Cys Ile Arg Glu Tyr Tyr Val Phe Thr Asp Asn Pro Cys Leu Tyr
35 40 45
Gly Glu Lys Lys Asn Lys Arg Ile His Arg Ile Tyr Gln Glu Asn Leu
50 55 60
Gly Trp Pro Asp Asn Thr Leu Met Arg Phe Ser Met Phe Leu Lys Ile
65 70 75 80
Lys Glu Arg Leu Glu Lys Glu Thr Asp Tyr Leu Tyr Phe Phe Asn Ala
85 90 95
Asn Met Val Ile Arg Glu Lys Ile Gly Lys Glu Phe Leu Pro Glu Glu
100 105 110
Ser Ser Asn Gly Leu Val Gly Leu Ile His Ser Gly Gly Tyr Asp Arg
115 120 125
Glu Val Asn Glu Phe Thr Tyr Asp Arg Asn Glu Lys Ser Thr Ala Tyr
130 135 140
Ile Pro Tyr Gly Glu Gly Arg Tyr Tyr Tyr Ala Gly Gly Leu Asn Gly
145 150 155 160
Gly Arg Thr Pro Ala Phe Leu Lys Met Ala Glu Thr Leu Arg Asp Asn
165 170 175
Thr Glu Glu Asp Lys Arg Asn Gly Val Met Ala Leu Trp His Asp Glu
180 185 190
Ser His Ile Asn Arg Tyr Phe Leu Asp His Pro Pro Tyr Ser Leu Thr
195 200 205
Pro Ala Tyr Cys Tyr Pro Glu Gly Trp Asn Met Pro Phe Pro Gln Ile
210 215 220
Ile Leu Leu Leu Asp Lys Ser Phe Ile Cys Gly Gly His Lys Tyr Leu
225 230 235 240
Arg Gly Gly Lys Arg Asn Phe His Asp Tyr Thr Ser Tyr Leu Lys Arg
245 250 255
Ser Leu Val Arg Phe Ala Arg Lys Val Ile Gly Val Leu Arg Gly Phe
260 265 270
Gly Leu
<210> 83
<211> 272
<212> PRT
<213> Parabacteroides gordonii MS-1
<400> 83
Met Arg Ile Gly Ile Leu Tyr Ile Cys Thr Gly Lys Tyr Ser Ile Phe
1 5 10 15
Trp Lys Lys Phe Tyr Lys Ser Ala Glu Arg Tyr Leu Met Gln Gly Tyr
20 25 30
Pro Cys Ile Arg Glu Tyr Tyr Val Phe Thr Asp Ala Pro Ser Val Tyr
35 40 45
Gly Glu Lys Glu Asn Gly His Ile His Arg Ile Tyr Gln Glu Asn Leu
50 55 60
Gly Trp Pro Arg Asn Thr Leu Met Arg Phe His Met Phe Leu Arg Ile
65 70 75 80
Lys Lys Gln Leu Glu Arg Glu Thr Asp Tyr Leu Tyr Phe Phe Asn Ala
85 90 95
Asn Met Gln Phe Arg Val Pro Val Gly Lys Glu Phe Leu Pro Asp Asp
100 105 110
Phe Ser Asn Gly Leu Val Gly Cys Met Phe Pro Trp Ser Tyr Asn Glu
115 120 125
Thr Asn Leu Glu Phe Gly Tyr Asp Arg Asn Pro Met Ser Thr Ala Tyr
130 135 140
Ile Pro Glu Gly Glu Gly Asp Phe Tyr Tyr Ala Gly Ala Leu Ile Gly
145 150 155 160
Gly Lys Thr Glu Ala Phe Leu Lys Met Ser Glu Thr Ile Leu Asn Asn
165 170 175
Ile Gln Glu Asp Glu Lys Lys Gly Val Ile Ala Leu Trp His Asp Glu
180 185 190
Ser His Leu Asn Arg Tyr Phe Met Asp Asn Pro Pro Lys Cys Leu Thr
195 200 205
Pro Ala Tyr Cys Tyr Pro Glu Arg Trp Lys Ser Pro Phe Pro Glu Ile
210 215 220
Ile Arg Leu Phe Asp Lys Asn Gly Ser Trp Gly Gly Tyr Ala Tyr Leu
225 230 235 240
Arg Gly Glu Lys Ala Gly Val Lys Asp Tyr Leu Arg Ser Tyr Lys Val
245 250 255
Lys Ile Lys Tyr Met Ile Met Pro Phe Tyr Arg Phe Val Cys Arg Lys
260 265 270
<210> 84
<211> 256
<212> PRT
<213> Parachlamydia acanthamoebae
<400> 84
Met Val Thr Arg Gly Phe Cys Met Leu Thr Arg Ser Leu Lys Ile Leu
1 5 10 15
Ile Gly Leu Cys Leu Leu Phe Ser His Ala Leu Tyr Ala Ala Asn Val
20 25 30
Gly Leu Leu Val Met Ala Thr Gly Lys Tyr Val Ser Phe Val Pro Pro
35 40 45
Leu Val Lys Ser Ala Asp His Phe Phe Cys Lys Asn His Lys Val Thr
50 55 60
Tyr Phe Val Phe Thr Asp Gly Tyr Leu Glu Pro Met Pro Asn Val Val
65 70 75 80
Pro Ile Phe His Ala Lys Met Gly Trp Pro Tyr Asp Thr Met Met Arg
85 90 95
Tyr His Val Tyr Asp Met His Arg Asp Ala Phe Ala Gly Gln Asp Tyr
100 105 110
Leu Tyr Ala Cys Asp Ala Asp Met Leu Phe Val Gly Glu Val Gly Asp
115 120 125
Glu Ile Leu Gly Asn Arg Val Ala Thr Arg His Pro Gly Phe Ile Asn
130 135 140
Arg Pro Lys Ser Ser Tyr Thr Tyr Glu Arg Asn Pro Leu Ser Thr Ala
145 150 155 160
Tyr Ile Pro Gln Gly Glu Gly Asn Asp Tyr Phe Ala Gly Gly Phe Tyr
165 170 175
Gly Gly Thr Lys Asp Glu Phe Leu Asn Ile Val His Thr Asn Ala Val
180 185 190
Asn Ile Asp Gln Asp Met Gln Asn Gly Ile Ile Ala Val Trp His Asp
195 200 205
Glu Ser His Trp Asn Arg Phe Cys Ile Asn Asn Pro Pro Thr Val Ile
210 215 220
Leu Ser Pro Ser Tyr Cys Tyr Pro Gln Gly Leu Arg Ile Pro Phe Leu
225 230 235 240
Pro Lys Leu Ile Ala Leu Asp Lys Asn His Glu Glu Met Arg Lys Gly
245 250 255
<210> 85
<211> 249
<212> PRT
<213> Parachlamydia acanthamoebae
<400> 85
Met Leu Thr Arg Ser Leu Lys Ile Leu Ile Gly Leu Cys Leu Leu Phe
1 5 10 15
Ser His Ala Leu Tyr Ala Ala Asn Val Gly Leu Leu Val Met Ala Thr
20 25 30
Gly Lys Tyr Val Ser Phe Val Pro Pro Leu Val Lys Ser Ala Asp His
35 40 45
Phe Phe Cys Lys Asn His Lys Val Thr Tyr Phe Val Phe Thr Asp Gly
50 55 60
Tyr Leu Glu Pro Met Pro Asn Val Val Pro Ile Phe His Ala Lys Met
65 70 75 80
Gly Trp Pro Tyr Asp Thr Met Met Arg Tyr His Val Tyr Asp Met His
85 90 95
Arg Asp Ala Phe Ala Gly Gln Asp Tyr Leu Tyr Ala Cys Asp Ala Asp
100 105 110
Met Leu Phe Val Gly Glu Val Gly Asp Glu Ile Leu Gly Asn Arg Val
115 120 125
Ala Thr Arg His Pro Gly Phe Ile Asn Arg Pro Lys Ser Ser Tyr Thr
130 135 140
Tyr Glu Arg Asn Pro Leu Ser Thr Ala Tyr Ile Pro Gln Gly Glu Gly
145 150 155 160
Asn Asp Tyr Phe Ala Gly Gly Phe Tyr Gly Gly Thr Lys Asp Glu Phe
165 170 175
Leu Asn Ile Val His Thr Asn Ala Val Asn Ile Asp Gln Asp Met Gln
180 185 190
Asn Gly Ile Ile Ala Val Trp His Asp Glu Ser His Trp Asn Arg Phe
195 200 205
Cys Ile Asn Asn Pro Pro Thr Val Ile Leu Ser Pro Ser Tyr Cys Tyr
210 215 220
Pro Gln Gly Leu Arg Ile Pro Phe Leu Pro Lys Leu Ile Ala Leu Asp
225 230 235 240
Lys Asn His Glu Glu Met Arg Lys Gly
245
<210> 86
<211> 251
<212> PRT
<213> Parachlamydia sp.
<400> 86
Met Asn Ser Lys Cys Val Arg Ile Leu Ile Thr Leu Leu Leu Leu Ser
1 5 10 15
Ser Pro Ser Leu Tyr Ala Ala Lys Val Gly Leu Leu Val Met Ala Thr
20 25 30
Gly Lys Tyr Ile Thr Phe Val Pro Pro Leu Val Ala Ser Ala Asp Lys
35 40 45
Tyr Phe Cys Lys Asn His Asp Val Thr Tyr Phe Val Phe Thr Asp Gly
50 55 60
Gln Phe Asp Val Val Pro Asn Lys Val Val Pro Ile Phe His Pro Arg
65 70 75 80
Met Gly Trp Pro Phe Asp Thr Met Met Arg Asn His Val Tyr Glu Met
85 90 95
Asn Ser Asp Ala Phe Ala Asp Gln Asp Tyr Leu Tyr Ala Cys Asp Ala
100 105 110
Asp Met Leu Phe Val Gly Asn Val Gly Asp Glu Ile Leu Gly Lys Arg
115 120 125
Met Ala Thr Glu His Pro Gly Phe Tyr Gly Lys Asn Arg Lys Val Phe
130 135 140
Ser Phe Glu Thr Asn Pro Leu Ser Lys Ala Tyr Ile Ala Pro Asn Glu
145 150 155 160
Gly Thr Lys Tyr Phe Cys Gly Gly Phe Phe Gly Gly Glu Arg Glu Ala
165 170 175
Phe Leu Asp Ile Val Arg Thr Thr Ser Glu Arg Val Asp Glu Asp Leu
180 185 190
Ala Asn Asp Ile Val Ala Val Trp His Asp Glu Ser His Trp Asn Arg
195 200 205
Tyr Cys Ile Asp Tyr Pro Pro Thr Val Ile Leu Thr Pro Ser Tyr Cys
210 215 220
Phe Pro Gln Gly Ser Lys Leu Pro Phe Val Pro Lys Leu Ile Ala Leu
225 230 235 240
Asn Lys Asn His Gln Asp Met Arg Phe Asn Asp
245 250
<210> 87
<211> 272
<212> PRT
<213> Piromyces sp.
<400> 87
Met Lys Lys Asp Tyr Phe Val Phe Thr Asp Ser Glu Thr Ile Tyr Gly
1 5 10 15
Asp Glu Asn Pro Asn Val His Ile Ile Pro Gln Glu Asn Leu Gly Trp
20 25 30
Pro Gly Asn Thr Leu Tyr Arg Phe His Met Phe Leu Ser Gln Lys Glu
35 40 45
Glu Leu Glu Lys Phe Lys Tyr Ile Phe Phe Leu Asn Ala Asn Val Glu
50 55 60
Cys Tyr Glu Glu Ile Lys Glu Asn Asp Phe Leu Pro Lys Lys Glu Gly
65 70 75 80
Leu Leu Phe Val Lys His Phe Asn Phe His Asp Lys Gln Asn Thr Leu
85 90 95
Phe Ser Tyr Glu Arg Asn Ser Asn Ser Thr Ala Tyr Ile Pro Met Gly
100 105 110
Glu Gly Lys Tyr Tyr Val Cys Gly Gly Ala Asn Gly Gly Lys Ala Lys
115 120 125
Asn Tyr Leu Asp Met Cys Glu Glu Leu Arg Arg Arg Ile Asp Ile Asp
130 135 140
Asp Glu Asn Gly Val Thr Ala Ile Trp His Asp Glu Ser Gln Ile Asn
145 150 155 160
Arg Tyr Leu Tyr Asp Leu Asp Lys Glu Asn Lys Pro Tyr Lys Ile Leu
165 170 175
Asp Pro Gly Tyr Cys Phe Pro Glu Met Phe Leu Glu Asn Lys Leu Lys
180 185 190
Asn Pro Asp Ser Phe Pro Tyr Asp Pro Ile Leu Leu Tyr Arg Arg Lys
195 200 205
Gln Asp Tyr Ile Asn Val Asn Lys Ile Lys Gly Asp Tyr Asn Glu Met
210 215 220
Gln Gly Asn Asn Lys Asn Asn Asn Lys Lys Ile His Tyr Tyr Asn Ser
225 230 235 240
Lys Thr Asn Lys Ile Asn Lys Gly Asn Ser Thr Lys Glu Glu Ile Ser
245 250 255
Lys Glu Glu Asn Lys Glu Ser Gln Lys Lys Val Ile Lys Asn Asn Tyr
260 265 270
<210> 88
<211> 284
<212> PRT
<213> Piromyces sp.
<400> 88
Lys Ser Val Asp Ser Ala Asp Ser Ile Glu Ile Ser Glu Leu Asn Lys
1 5 10 15
Asn Thr His Glu Lys Asp Ile Ala Ile Leu Tyr Ile Cys Thr Gly Lys
20 25 30
Tyr Asp Val Phe Trp Lys Glu Phe Tyr Glu Ser Val Glu Glu Lys Phe
35 40 45
Ile Pro His Met Lys Lys Asp Tyr Phe Val Phe Thr Asp Ser Lys Asp
50 55 60
Ile Tyr Lys Lys Glu Asn Asp Asn Val His Ile Ile Lys Gln Lys Asn
65 70 75 80
Leu Gly Trp Pro Gly Asn Thr Leu Tyr Arg Phe His Met Phe Leu Ser
85 90 95
Gln Lys Glu Lys Leu Gln Asn Tyr Lys Tyr Ile Phe Phe Met Asn Ala
100 105 110
Asn Ile Ile Cys Asn Phe Gly Val Gly Glu Glu Phe Leu Pro Lys Asp
115 120 125
Glu Gly Leu Leu Phe Val Gln His His Ala Tyr Tyr Lys Ala Pro Asn
130 135 140
Thr Lys Phe Ser Tyr Glu Arg Asn Ser Asn Ser Thr Ala Tyr Ile Pro
145 150 155 160
Met Gly Gln Gly Lys Tyr Tyr Val Cys Gly Gly Val Asn Gly Gly Arg
165 170 175
Ala Lys Glu Tyr Leu His Met Cys Glu Val Leu Lys Ser Arg Ile Asp
180 185 190
Glu Asp Asp Lys Asn Asp Val Val Ala Val Trp His Asp Glu Ser His
195 200 205
Ile Asn Lys Tyr Leu Leu Glu Leu Glu Lys Ser Gln Tyr Lys Leu Leu
210 215 220
Asn Val Ser Tyr Cys Phe Pro Glu Tyr Lys Met Asn Arg Lys Ser Phe
225 230 235 240
Pro Phe Asp Pro Ile Leu Phe Phe Arg Asn Lys Lys Lys Tyr Ile Asn
245 250 255
Leu Lys Glu Ile Lys Gly Asp Ser His Glu Met Met Gly Asn Asn Lys
260 265 270
Asn Lys Asn Lys Ala Lys Asn Lys Ala Ile Ile Asn
275 280
<210> 89
<211> 250
<212> PRT
<213> Porphyromonadaceae bacterium
<400> 89
Met Lys Ile Gly Met Leu Tyr Ile Gly Ile Gly Arg Tyr Ala Ala Phe
1 5 10 15
Trp Pro Glu Phe Tyr Arg Ser Ala Arg Glu Tyr Phe Leu Pro Asp Ala
20 25 30
Thr Lys His Phe Phe Val Phe Ala Asp Ala Pro Leu Glu Asp Ala Gly
35 40 45
Asp Asp Val Ser Val Phe His Asn Asp Asp Met Gly Trp Pro Leu Asn
50 55 60
Ser Leu Trp Arg Tyr His Met Phe Leu Arg Ile Ala Asp Leu Leu Lys
65 70 75 80
Glu Tyr Asp Tyr Leu Phe Phe Phe Asn Ala Asn Cys Lys Phe Val Arg
85 90 95
Arg Val Glu Pro Ser Asp Ile Leu Pro Gln Gly Asp Val Glu Tyr Cys
100 105 110
Ala Met Cys Thr Gln Thr Asp Pro Ala Lys Met Ser Leu Glu Ser Arg
115 120 125
Pro Glu Cys Ala Ser Tyr Val Ala Pro Gly Ser Val Ser Arg Tyr Trp
130 135 140
Ala Gly Gly Ile Asn Gly Gly Arg Ala Glu Ala Phe Leu Arg Leu Ala
145 150 155 160
Arg Glu Cys Ala Ala Ile Ala Glu Arg Asp Leu Ala Asn Gly Phe Met
165 170 175
Pro Val Trp His Asp Glu Ser Val Val Asn His Phe Phe Ala Asp Lys
180 185 190
Lys Val Arg Ala Leu Asp Arg Arg Met Gly Cys Pro Ser Gln Trp Lys
195 200 205
Ser Pro Ala Asp Pro Phe Val Ile Leu Arg Arg Lys Asp Asp Val Leu
210 215 220
Gly Arg Ser Trp Leu Arg Thr Tyr Lys Gly Arg Lys His Ser Ser Phe
225 230 235 240
Trp Lys Lys Leu Phe Arg Lys Leu Arg Lys
245 250
<210> 90
<211> 231
<212> PRT
<213> Prochlorococcus phage P-SSM2
<400> 90
Met Lys Ile Cys Ile Leu Thr Ile Ala Thr Asn Lys Tyr Ile Gln Phe
1 5 10 15
Val Glu Lys Leu Tyr Asp Asn Ile Asp Asp His Phe Leu Asn Gly His
20 25 30
Glu Ile Glu Gly Ile Ile Phe Thr Asp Gln Glu Val Glu Ser Ser Asp
35 40 45
Asn Ile Lys Ile Ser Gln Ile Glu His Glu Pro Trp Pro Val Pro Thr
50 55 60
Leu Lys Arg Tyr Asn Tyr Phe Met Lys Glu Ala Glu His Ile Ser Lys
65 70 75 80
Tyr Asp Tyr Cys Phe Tyr Phe Asp Val Asp Met Gly Ile Val Asp Lys
85 90 95
Val Gly Asp Glu Val Leu Gly Asp Leu Val Ala Thr Met His Pro Tyr
100 105 110
Gln Ser Phe Ala Pro Lys Ile Gln Arg Ser Tyr Asp Arg Asn Pro Lys
115 120 125
Ser Leu Ala Tyr Val Pro Leu Tyr Asp Glu Gly Glu His Tyr Tyr Ala
130 135 140
Gly Gly Phe Asn Gly Gly Ser Thr Lys Arg Phe Leu Glu Met Ala Glu
145 150 155 160
Val Ile Ala Asp Arg Val Asn Lys Asp Leu Glu Asn Asp Val Ile Ala
165 170 175
Leu Trp His Asp Glu Ser His Leu Asn Arg Tyr Leu Ile Asp Asn Pro
180 185 190
Pro Thr Ile Ser Leu Thr Pro Ser Tyr Cys Phe Ala Glu Glu Gln Met
195 200 205
Ser Asn Leu Glu Tyr Pro Tyr Lys Pro Lys Ile Ile Ala Leu Lys Lys
210 215 220
Asp His Asn Glu Leu Arg Ser
225 230
<210> 91
<211> 269
<212> PRT
<213> 食葡糖罗斯氏菌
<400> 91
Met Asp Lys Asn Pro Arg Asn Phe Met Lys Glu Ser Asp Met Asn Lys
1 5 10 15
Val Ala Val Leu Tyr Ile Cys Thr Gly Lys Tyr Asp Val Phe Trp Lys
20 25 30
Asp Phe Tyr Ile Ser Tyr Glu Lys Tyr Phe Leu Pro Asp Cys Glu Lys
35 40 45
His Tyr Tyr Val Phe Thr Asp Ala Ala Glu Ile Tyr Met Glu Lys Glu
50 55 60
Asn Leu Arg Ile His Lys Phe Tyr Gln Glu Ser Leu Gly Trp Pro Asp
65 70 75 80
Asn Thr Leu Met Arg Phe His Met Phe Leu Arg Gln Lys Ala Glu Leu
85 90 95
Glu Lys Tyr Asp Tyr Ile Phe Phe Met Asn Ala Asn Cys Gln Ala Leu
100 105 110
Asp Thr Ile Thr Glu Glu Glu Phe Leu Pro Lys Lys Lys Asp Ile Ile
115 120 125
Val Val Gln His Pro Gly Tyr Tyr Asn Lys Thr Asn Lys Gln Phe Ala
130 135 140
Tyr Asp Arg Asn Pro Lys Ser Thr Ala Tyr Ile Pro Lys Gly Gln Gly
145 150 155 160
Lys Tyr Tyr Val Cys Gly Gly Val Asn Gly Gly Arg Ala Gln Ala Phe
165 170 175
Ile Gln Leu Met Glu Glu Leu Lys His Asn Ile Asp Val Asp Lys Lys
180 185 190
Asn Gly Glu Leu Ala Leu Trp His Asp Glu Ser His Ile Asn His Tyr
195 200 205
Val Trp Thr His Asp Asn Tyr Glu Val Leu Pro Pro Ser Tyr Cys Trp
210 215 220
Pro Glu Asp Trp Asn Leu Pro Met Pro Gly Lys Ile Leu Ile Arg Glu
225 230 235 240
Lys Ser Lys Trp Ile Phe Val Asp Met Val Lys Ser Gln Ser Leu Ser
245 250 255
Gly Lys Ile Lys Ala Val Ile Lys Lys Ile Ile Arg Arg
260 265
<210> 92
<211> 1759
<212> PRT
<213> Salpingoeca rosetta
<400> 92
Met Val Val Gly Leu Arg Cys Ser Cys Arg Arg Met Val Pro Arg Leu
1 5 10 15
Arg Arg Leu Gln Leu Leu Trp Gln Arg Arg Trp Arg Thr Ile Val Val
20 25 30
Ile Val Leu Cys Ile Thr Leu Leu Ala Ala Leu Arg Arg Asn Arg Ser
35 40 45
Ala Arg Tyr Asn Ala Ser Asp Val Pro Asp Leu Thr Lys Cys Arg Ala
50 55 60
Pro Ser Leu Glu Val Ala Pro Leu Ile Thr Ala Ser Leu Ile His Asp
65 70 75 80
Thr Ala Asp Ala Ala Ala Phe Leu Asp Leu His Arg Val Ala Glu Ala
85 90 95
Pro Phe Asn Asp Leu Ile Leu Ser Ala Ser Ser Ala Arg Ser Gly Asp
100 105 110
Ala Asn Arg Asn His Ala Arg Ala Asp Val Asp Arg Asn Ala Leu Arg
115 120 125
Pro Val Thr His Arg Gln Thr Leu Ala His Cys Ile Ala Gln His Tyr
130 135 140
Leu Gly Ala Ile Gln Gln Pro Thr Trp Ser His Pro Ser Val Trp Phe
145 150 155 160
Ala Ala Ile Gln Ala Ala Gln His Glu Gly Ala Ala Ala Gln Gln Gln
165 170 175
Arg Ala Ala Arg Ser Ala His Ala Lys Asp Ala Asn Asp Asn Ala Asp
180 185 190
Ser Ile Ser Ser Ser Ser Ser Ser Ser Glu Gly Gly Thr Ala Ala Thr
195 200 205
Met Asp Gln Val Arg Arg Lys Trp Trp Ala His Met Val Gln Leu Ala
210 215 220
Arg Leu His Ile His Gln Gln Ala Asp Gly Asp Pro Ala Ser Glu Gln
225 230 235 240
Gly Lys Val Leu Glu Val Pro Ser Gly Leu Pro Ile His Asp Glu Tyr
245 250 255
Ile Ser Ser Leu Val Ser Ala Leu Leu Met Pro Met Asp Ser Asp Ala
260 265 270
Leu Ala Tyr Ser Ala His Val Pro Lys His Ile Asn Val His Thr Thr
275 280 285
Ile Cys Gly Ala Ser Pro Ala Thr Ala Arg Arg Cys Arg Ser Gly Arg
290 295 300
Pro Met Leu Ser Pro Ser Ala Ser Leu Gln Ala Ala Thr Ala Val Phe
305 310 315 320
Ala Ser Arg Ser Leu Ala Leu Thr Asn Val Ala Asp Thr Trp Leu Leu
325 330 335
Gln Leu Ala Gln His Val Arg Ala Gly Gly Val Val Ala Phe His Asp
340 345 350
Val Tyr Phe Ala Gly Asp Asp Pro Ser Pro Cys Val Leu Ala Asn Ala
355 360 365
Leu His Ser Pro Ala Gly Asp Thr Ser Val Val Tyr Ala Thr Glu Ala
370 375 380
Thr Ile Ala Phe Phe Leu Ala His Phe Asp Val Glu Trp Tyr Arg Asp
385 390 395 400
Val Arg Val Ser Phe His Pro Ser Leu Ala Cys Glu Lys Arg Glu Val
405 410 415
Phe Ala Leu Leu Arg Arg Arg Thr Thr Leu Arg Pro Gly Ile Ala Thr
420 425 430
Pro Arg Arg Val Asp Leu Thr Ile Thr Ser Leu Arg Ala Ile Lys Thr
435 440 445
Ala Leu Ala Ala Ala Pro Ser Ser Arg His Pro Ser Gln Trp Leu Gln
450 455 460
Arg Leu Leu Asp Ala Ala Leu His His Ser Pro Asn Ala Trp Pro Asn
465 470 475 480
Leu Ala His Arg Pro His Thr Thr Asn Thr Asn Thr Asn Thr Asn Thr
485 490 495
Asn Thr Asn Thr Asn Thr Asn Ala Asn Asn Asp Gly Gly Ala Val Ser
500 505 510
Leu Phe His Glu Ala Ser Arg Pro Arg Arg Trp Ala Thr Asn Gly Leu
515 520 525
Leu His Asp Thr Met Ser Gln Leu Glu Ala Phe Asp Ala Val Glu Arg
530 535 540
Leu Leu Glu Gly Gly Val Pro Asp Gly Cys Asn Pro Thr Ser Asp Ile
545 550 555 560
Cys Asn Ile Phe Phe Val Trp Thr Ser His Arg Asp Thr Trp Ser Phe
565 570 575
Leu Asn Arg Leu Ala Val Glu Ser Ala Leu Arg Ile Phe Pro Arg Ala
580 585 590
Arg Val Ile Ile Val Ser Asn Thr Leu Pro Val Thr Phe Phe Asn Ser
595 600 605
Leu Gln Ala Ser His Arg Val Tyr Val Trp Arg Ile Val Pro Thr Arg
610 615 620
Leu Val Arg Ala Gly Val Ala Gly Gly Arg Trp Leu Arg Ala Ala Leu
625 630 635 640
Arg Glu Gln Gly Pro His Leu Pro Thr His Gln Ser Asp Phe Leu Arg
645 650 655
Tyr Val Val Leu Tyr Lys Tyr Gly Gly Leu Phe Ser Asp Thr Asp Leu
660 665 670
Val Trp Leu Asp Ala Ser Pro Leu Ala His Ala Ile Gly Arg Asn Phe
675 680 685
Leu Gly Lys Ile Asp Ser Arg Pro Ile Leu Ala Arg Cys Pro Trp Cys
690 695 700
Val Asp Ser Thr Trp Tyr Leu Ala Asn Gly Val Leu Arg Phe Gln Ala
705 710 715 720
Arg His Lys Met Leu Ala Ser Ile Leu Gly His Ile Asp Thr Leu Arg
725 730 735
Tyr Asp Pro Ser Asp Arg Leu Ala Ile Gly Pro His Leu Val Thr Lys
740 745 750
Thr Phe Asn Ala Leu Gln Asp Pro Ser Val Ile Leu Val Asp Glu His
755 760 765
Val Leu Phe Pro Met Ser Gly Pro Asp Val Leu Gln Tyr Met Asp Pro
770 775 780
Arg Pro Pro His Thr Arg Leu Ala Asp Leu Leu Thr Ser Ala Ala Val
785 790 795 800
His Val Phe Glu Ala Thr Tyr Lys Ala Ala Pro Tyr Ala Pro Thr Ser
805 810 815
Ala Met Gln Gln Leu Leu Ala Leu Thr Pro Trp Val Gln Ile Asp Pro
820 825 830
Val Cys Glu Cys Val Trp Gln Gln Asp Asp Thr Asp Thr Asp Thr Asn
835 840 845
Glu Asp Lys Gly Asp Asp Asp Ser Asn Ser Asn Ser Asn Ser Asn Ser
850 855 860
Asn Ser Gly Gly Ala Ala Val Gly Gly Asp Ser Thr Lys Arg Lys Lys
865 870 875 880
Thr Asn Leu Cys Leu Pro Tyr Ser Ala Thr Ala Arg Tyr Arg Gln Gly
885 890 895
Ser Arg Asp His Leu Val Arg Met Cys Val Lys Ile Arg Gly Ile His
900 905 910
Ser Asp Ala Asp Gln Ser Ser Thr Pro Asn Ser Asp Arg Asn Glu Arg
915 920 925
Ala Ala Gly Asp Gly Asp Asn Asp Glu Gly Ala Gly Gly Glu Glu Lys
930 935 940
Ser Arg Asp Gly Thr Ser Val Val Gly Leu Pro Glu Asp Gly Val Leu
945 950 955 960
Val Leu Glu Ala Arg Leu Gly Arg Val Gln Thr Ala Tyr Gln Ala Ala
965 970 975
Asp Lys Arg Ile Val Val Pro Leu His Arg Asp Met Thr His Thr Glu
980 985 990
Leu Leu Glu Leu Ala Gln Leu Trp Tyr Val His Gly Glu Glu Tyr Cys
995 1000 1005
Asn Asp His Val Thr Val Gln Val Val Leu Ala Ser Gly Val Val
1010 1015 1020
Tyr Ala Glu Gly Gly Val Asp Val Met Thr Pro Cys Phe Gly Val
1025 1030 1035
Ala Glu Ala Gln Gln Arg Tyr Ile Gly Pro Pro Leu Ala Lys Gly
1040 1045 1050
Thr Tyr Thr Trp Thr Asn Ala Glu His Met Leu Gln Cys Thr Arg
1055 1060 1065
Phe Ser Glu Glu Tyr Ala Gly Pro Asp Pro Leu Met Phe Trp Pro
1070 1075 1080
Arg Lys Tyr Arg Lys Leu Val Gly Asp Met Val Ser Pro Ala Thr
1085 1090 1095
Ala Lys Tyr Ala Phe Gly Tyr Thr Pro Ala Leu Thr Ala Ala Asn
1100 1105 1110
Gly Ala Gly Glu Gln Gln Gln Arg Gln Gln Pro Arg Tyr Lys Val
1115 1120 1125
Gly Leu Val Val Val Ala Thr Gly Trp Tyr Tyr Ala Phe Leu Asp
1130 1135 1140
Asp Phe Val Ala Ser Ala Glu Glu Phe Phe Met Pro Gly His Glu
1145 1150 1155
Val His Tyr Phe Val Phe Thr Asp Asn Arg Pro Phe Ala Ala Gly
1160 1165 1170
Pro Ala Asp Arg Met His Ile Leu Arg Gln Pro Val Tyr Gly Trp
1175 1180 1185
Pro Phe Asp Ser Met Phe Arg Tyr Glu Ser Ile Leu Arg Gln Arg
1190 1195 1200
His His Phe Arg Asn Met Asp Tyr Ile Phe Met Leu Asp Ser Asp
1205 1210 1215
Ile Val Phe Ser Asn Phe Val Arg Glu Glu Ile Leu Gly Glu Met
1220 1225 1230
Val Gly Val Thr Gln Ala Phe Ala Phe Gly Leu Ala Arg Ser Glu
1235 1240 1245
Tyr Pro Leu Glu Ser Asn Pro Ala Ser Val Ala Tyr Val Pro Gln
1250 1255 1260
Arg Ser Thr Pro Cys Tyr Tyr Ala Gly Gly Ile Phe Gly Gly Thr
1265 1270 1275
Val Glu Gly Ala Val Arg Phe Leu Gln His Thr Ala Trp Leu Met
1280 1285 1290
Glu Trp Asp Ile Met Gln Gln Val Ser Ala Gly His Asp Asp Glu
1295 1300 1305
Ser Tyr Leu Asn Arg Ile Phe Ala Trp Asn Pro Pro Asp Val Val
1310 1315 1320
Leu Pro Ala Ser Tyr Ile Tyr Pro Glu Pro Pro Cys Asp Arg Ala
1325 1330 1335
Trp Gln Ala Gly Gly Arg Arg Tyr Asp Gly Thr Tyr Pro Pro Arg
1340 1345 1350
Ile Leu Asn Val Gly Cys Arg Lys Val Leu Gly Leu Gln Pro Gly
1355 1360 1365
Met Gly Arg Lys Thr Arg Thr Glu Asp Ala Gly Thr Pro Lys Asp
1370 1375 1380
Phe Met Leu Arg Glu Ala Arg Ala His Ala Ala Asp Met Thr Pro
1385 1390 1395
Gly Thr Ala Asn Glu Gln Gln Gln Gln Glu Gln Gln Gln Lys Gln
1400 1405 1410
Gln His Gly Gly Glu Gly Ala Glu Asp Ala Leu Leu Ser Thr Pro
1415 1420 1425
Leu Trp Met Val Ser Cys Ile Asp Ser Leu Pro Asp Asp Leu Asp
1430 1435 1440
Asp Gly Ala His Asp Asp Met Trp Ala Asp Ser Ile Ala Ala Ala
1445 1450 1455
Pro Arg Arg Leu Ala Asn His Thr Arg His Ala Gly Val Val Tyr
1460 1465 1470
Gly Met Ser Asn Ala Leu Leu Gln Arg Phe Trp Ala Ala Arg Ala
1475 1480 1485
Ser Gln Leu His Pro Pro Thr Leu His Val Val Ala Val Ser Arg
1490 1495 1500
Cys Asp Ala Gln Ala Val Ala Ala Leu Leu Gln Leu Val Gln Ala
1505 1510 1515
Asp Val Val Leu Val Thr Asp Pro Gly Leu Thr Pro Gly Trp Gln
1520 1525 1530
Val Asn Phe Gly Val Trp Arg Arg Met Leu Gln Asp Asn Ser Arg
1535 1540 1545
Leu Trp Lys Ala Ala Gly Gln Ser Ala Gly Gly Asp Gly Ala Gly
1550 1555 1560
Asp Asp Val Thr Ala Pro Leu Arg Ile Ala Ala Ala Cys Pro Phe
1565 1570 1575
Pro Ser Ser Lys Tyr Arg Gln Met Asn Leu Gly Thr Arg Ala Val
1580 1585 1590
Gly Asn Leu Leu Cys Gly Trp Asp Thr Gln Ala Ala Ser His Pro
1595 1600 1605
Ser Asp Gly Gln Arg Glu Arg Val Leu Ala Thr Asp Phe Arg Thr
1610 1615 1620
Tyr Val Cys Arg Ala Lys Pro Leu His Asp Val Glu Asp His Gln
1625 1630 1635
Ala Phe Met Ala Leu Lys Ala Pro Leu Leu Ser Ala Met Asn Lys
1640 1645 1650
Ile Gly Ala Pro Val Val Met Glu Ala Asp Ala Arg Ser Asn Leu
1655 1660 1665
Gly Leu Pro Thr Arg Ser Gly Ile Asp Thr Gln Pro Arg Ser Arg
1670 1675 1680
Gly Gly Gly Ala Ala Gly Arg Gly Gly Asp Val Thr Gly Ser Phe
1685 1690 1695
Ala Arg Arg Thr Met Ala Ala Leu Arg Ser Leu Met Gln Ser Glu
1700 1705 1710
Gly Gly Ala Ala Val Glu Val Ala Ser Cys Phe Thr Asp Met Gln
1715 1720 1725
Pro Phe Ile Ala Ala Pro Val Val Ala Arg Thr Ser Ala Lys Met
1730 1735 1740
Cys Cys Arg Thr Arg Phe Leu Gly Met Cys Leu Ser Tyr Arg Glu
1745 1750 1755
Cys
<210> 93
<211> 282
<212> PRT
<213> Subdoligranulum sp.
<400> 93
Met Lys Thr Leu Ala Ile Leu Tyr Ile Cys Thr Gly Pro Tyr Ala Val
1 5 10 15
Phe Trp His Asp Phe Tyr Pro Asn Phe Lys Ala Asp Phe Leu Pro Asp
20 25 30
Cys Asp Arg Thr Phe Tyr Val Phe Thr Asp Ala Ala His Ile Asp Tyr
35 40 45
Glu Asp Ala Pro Asp Val Arg Arg Ile Tyr Gln Lys Ala Leu Pro Trp
50 55 60
Pro Gln Ser Thr Met Leu Arg Phe Asp Ala Phe Leu Gly Gln Ala Asp
65 70 75 80
Ala Leu Gln Gly Tyr Asp Tyr Leu Phe Phe Ala Asn Ala Asn Leu His
85 90 95
Cys Thr Arg Val Ile Arg Ala Asp Glu Leu Leu Pro Asp Pro Ala Ala
100 105 110
Gly Gln Ser Leu Thr Ala Val Cys His Leu Pro Tyr Tyr Gly Lys Asn
115 120 125
Pro Ile Phe His Pro Tyr Asp Arg Ser Gly Lys Ser Arg Ala Ser Ile
130 135 140
Pro Tyr Ser Cys Gly Gln Tyr Tyr Val Ala Gly Gly Leu Asn Gly Gly
145 150 155 160
Thr Ala Ala Ala Tyr Leu Ala Leu Cys Arg Glu Leu Lys Lys Arg Thr
165 170 175
Asp Glu Asp Leu Gln Asn Asn Val Ile Ala Arg Phe His Asp Glu Ser
180 185 190
Gln Leu Asn Arg Leu Val Ala Glu Thr Pro Gly Lys Phe Arg Ile Leu
195 200 205
Pro Pro Asp Tyr Cys Thr Pro Glu Glu Thr Pro Thr Gly His Glu Ala
210 215 220
Ile Leu Val Leu Gln Lys Ser Arg Cys Ile Asn Val Glu Ser Val Lys
225 230 235 240
Gly Thr Ala Lys Pro Gln Asn Phe Phe Gln Arg Lys Trp Glu Ala Phe
245 250 255
Arg Leu Asn Trp Leu Pro Tyr Leu Trp Leu Ala Arg Asp Thr Leu Leu
260 265 270
Arg Arg Arg Ile Asp Phe Lys Asn Asp Leu
275 280
<210> 94
<211> 276
<212> PRT
<213> Subdoligranulum sp.
<400> 94
Met Thr Lys Val Ala Ala Leu Tyr Ile Ala Thr Gly Arg Tyr Thr Val
1 5 10 15
Phe Trp Pro Glu Phe Tyr Glu Ser Ala Glu Lys Tyr Leu Leu Lys Asp
20 25 30
Cys Glu Val His Tyr Phe Val Phe Thr Asp Ala Ala Thr Leu Pro Gly
35 40 45
Gly Asp Asn Pro Arg Val His Ile Cys Ala Gln Asp Ala Tyr Ser Trp
50 55 60
Pro Phe Ala Thr Leu Arg Arg Phe Glu Ile Phe Leu Lys Gln Glu Gln
65 70 75 80
Ala Leu Lys Ala Phe Asp Tyr Ile Phe Phe Phe Asn Ala Asn Ala Glu
85 90 95
Phe Met Gln Pro Val Thr Arg Glu Met Leu Leu Pro Arg Ala Glu Lys
100 105 110
Gly Glu His Leu Leu Val Val Gln His Pro Ser Phe Tyr Ala Lys Pro
115 120 125
Asn Tyr Glu Phe Thr Tyr Asp Arg Asn Pro Arg Ser Thr Ala Cys Ile
130 135 140
Pro Tyr Gly Leu Gly Lys Tyr Tyr Val Cys Gly Gly Val Asn Gly Gly
145 150 155 160
Glu Ala Ala Ala Phe Leu Gln Leu Cys His Thr Leu Asp Ala Arg Ile
165 170 175
Arg Arg Asp Leu Gln Arg Asn Val Ile Ala Leu Trp His Asp Glu Ser
180 185 190
Gln Ile Asn Arg Tyr Ile Leu Phe Arg Lys Asp Phe Arg Val Leu Thr
195 200 205
Pro Ala Phe Cys Tyr Pro Glu Gly Trp Asp His Leu Pro Phe Pro Cys
210 215 220
Ile Ile Arg Ile Arg Ser Lys Ala Arg Tyr Ile Asp Ile Pro Ala Leu
225 230 235 240
Arg Lys Asp Ala Pro Glu Thr Lys Leu Ser Pro Ala Val Ala Arg Trp
245 250 255
Asn His Phe Ala Met Arg Ala Ala Arg Trp Thr Gln Asn His Ile Phe
260 265 270
Lys Lys Gly Ser
275
<210> 95
<211> 280
<212> PRT
<213> Subdoligranulum sp.
<400> 95
Met Lys Lys Val Ala Val Leu Tyr Ile Ala Thr Gly Lys Tyr Val Arg
1 5 10 15
Leu Trp Pro Gly Phe Leu Glu Ser Ala Glu Lys Tyr Leu Leu Lys Ser
20 25 30
Cys Glu Val Glu Tyr Phe Val Phe Thr Asp Val Asp His Leu Ala Glu
35 40 45
Glu Glu Asp Asn Pro Arg Ile His Arg Ile Phe Gln Glu Pro Met Pro
50 55 60
Trp Pro Tyr Thr Thr Leu Leu Arg Phe Glu Ile Phe Leu Lys Ala Glu
65 70 75 80
Glu Gln Leu Lys Ala Phe Asp Tyr Ile Tyr Phe Phe Asn Ala Asn Cys
85 90 95
Glu Phe Lys Gln Pro Ile Thr Glu Glu Met Leu Leu Pro Arg Pro Lys
100 105 110
Lys His Glu His Met Val Phe Val Leu His Pro Ala Phe Tyr Trp Arg
115 120 125
Tyr Asn Tyr Glu Phe Thr Tyr Asp His Asn Pro Arg Cys Lys Ala Tyr
130 135 140
Ile Pro Met Gly Leu Gly Arg Asp Tyr Val Cys Gly Gly Ile Asn Gly
145 150 155 160
Gly Asp Arg Asp Ala Tyr Leu Lys Phe Cys His Thr Leu Gln Lys Arg
165 170 175
Ile Arg Gln Asp Lys Asp Arg Gly Ile Ile Ala Leu Trp His Asp Glu
180 185 190
Ser His Ile Asn Trp Tyr Ala Phe Thr His Pro His Tyr Arg Leu Leu
195 200 205
Asp Ala Ser Phe Cys Phe Phe Pro Gly Trp Asp Thr Val Lys Pro Cys
210 215 220
Tyr Ile Tyr Ile Arg Pro Lys Glu Glu Tyr Phe Asp Val Asp Ala Phe
225 230 235 240
Lys Arg Asp Pro Pro Lys Thr Gln Leu Ser Pro Lys Val Glu Lys Tyr
245 250 255
Asn Glu Phe Met Leu Lys Ala Ala Arg Lys Ile Gln Arg His Met Pro
260 265 270
Trp Leu Pro Arg Arg Lys Arg Glu
275 280
<210> 96
<211> 282
<212> PRT
<213> Subdoligranulum sp.
<400> 96
Met Lys Thr Leu Ala Ile Leu Tyr Ile Cys Thr Gly Pro Tyr Ala Val
1 5 10 15
Phe Trp His Asp Phe Tyr Pro Asn Phe Lys Ala Asn Phe Leu Pro Asp
20 25 30
Cys Asp Arg Thr Phe Tyr Val Phe Thr Asp Ala Ala His Ile Asp Tyr
35 40 45
Glu Asp Ala Pro Asp Val Arg Arg Ile Tyr Gln Lys Ala Leu Pro Trp
50 55 60
Pro Gln Ser Thr Met Leu Arg Phe Asp Ala Phe Leu Gly Gln Ala Asp
65 70 75 80
Ala Leu Gln Gly Tyr Asp Tyr Leu Phe Phe Ala Asn Ala Asn Leu His
85 90 95
Cys Thr Arg Ile Ile Arg Ala Asp Glu Leu Leu Pro Asp Pro Ala Ala
100 105 110
Gly Gln Ser Leu Thr Ala Val Cys His Leu Pro Tyr Tyr Gly Lys Asn
115 120 125
Pro Ile Phe His Pro Tyr Asp Arg Ser Gly Lys Ser Arg Ala Ser Ile
130 135 140
Pro Tyr Asn Cys Gly Gln Tyr Tyr Val Ala Gly Gly Leu Asn Gly Gly
145 150 155 160
Thr Ala Ala Ala Tyr Leu Ala Leu Cys Arg Glu Leu Lys Lys Arg Thr
165 170 175
Asp Glu Asp Leu Gln Asn Asn Val Ile Ala Arg Phe His Asp Glu Ser
180 185 190
Gln Leu Asn Arg Leu Val Ala Glu Thr Pro Gly Lys Phe Arg Ile Leu
195 200 205
Pro Pro Asp Tyr Cys Thr Pro Glu Glu Thr Pro Thr Gly His Glu Ala
210 215 220
Ile Leu Val Leu Gln Lys Ser Arg Cys Ile Asn Val Glu Ser Val Lys
225 230 235 240
Gly Ala Ala Lys Pro Gln Asn Phe Phe Gln Arg Lys Trp Glu Ala Phe
245 250 255
Arg Leu Asn Trp Leu Pro Tyr Leu Trp Leu Val Arg Asp Thr Leu Leu
260 265 270
His Arg Arg Ile Asp Phe Lys Asn Asp Leu
275 280
<210> 97
<211> 280
<212> PRT
<213> Subdoligranulum variabile
<400> 97
Met Lys Arg Val Ala Ala Leu Tyr Ile Cys Thr Gly Glu Tyr Leu Arg
1 5 10 15
Leu Trp Pro Glu Phe Ile Ala Ser Ala Glu Lys Tyr Leu Leu Lys Gln
20 25 30
Cys Glu Ile His Tyr Phe Val Phe Thr Asp Ala Asp His Ile Glu Gly
35 40 45
Glu Glu Asn Asn Pro Arg Ile His Arg Ile Tyr Gln Lys Pro Gln Pro
50 55 60
Trp Pro Tyr Thr Thr Leu Lys Arg Phe Glu Ile Phe Leu Arg Cys Glu
65 70 75 80
Glu Gln Leu Lys Ala Phe Asp Tyr Ile Tyr Phe Phe Asn Ala Asn Cys
85 90 95
Glu Phe Thr Gln Pro Ile Thr Glu Glu Met Phe Leu Pro Arg Pro Glu
100 105 110
Lys His Glu His Met Val Phe Val Leu His Pro Ala Phe Tyr Trp Arg
115 120 125
Pro Asn Tyr Glu Phe Thr Tyr Asp Arg Asn Pro Arg Ser Lys Ala Phe
130 135 140
Ile Pro Met Gly Leu Gly Lys Asp Tyr Val Cys Gly Gly Ile Asn Gly
145 150 155 160
Gly Glu Ala Arg Ala Tyr Leu Lys Phe Cys His Leu Leu Asp Lys Arg
165 170 175
Ile Asn Gln Asp Leu Asp Arg Gly Ile Ile Ala Trp Trp His Asp Glu
180 185 190
Ser His Ile Asn Trp Tyr Ala Phe Thr His Arg Lys Tyr Arg Leu Leu
195 200 205
Asp Ala Ser Phe Cys Phe Phe Glu Gly Trp His Thr Lys Lys Pro Cys
210 215 220
Tyr Ile Leu Ile Arg Ala Lys Glu Arg Tyr Phe Asp Val Asp Thr Phe
225 230 235 240
Lys Lys Asn Ser Pro Ala Thr Gln Leu Ser Pro Arg Val Glu Lys Tyr
245 250 255
Asn His Phe Met Met Arg Val Ser Arg Tyr Leu Gln Arg Arg Met Pro
260 265 270
Trp Leu Pro Arg Arg Pro Arg Glu
275 280
<210> 98
<211> 287
<212> PRT
<213> Subdoligranulum variabile
<400> 98
Met Ser Ala Asn Arg Pro Arg Val Ala Val Leu Tyr Leu Cys Thr Gly
1 5 10 15
Ala Tyr Gln Val Phe Trp Lys Asp Phe Tyr Pro Asn Phe Arg Ala His
20 25 30
Phe Leu Pro Asp Cys Glu Arg Thr Phe Phe Val Phe Thr Asp Ala Pro
35 40 45
Ala Ile Asp Tyr Glu Asp Ala Pro Asp Val Arg Arg Ile Pro Gln Glu
50 55 60
Ala Leu Pro Trp Pro Tyr Ser Thr Met Gln Arg Phe Asp Ala Phe Leu
65 70 75 80
Gly Gln Ala Thr Ala Leu Ala Gly Tyr Asp Tyr Leu Phe Phe Ala Asn
85 90 95
Ala Asn Leu Arg Cys Leu Arg Asp Val Thr Ala Ala Glu Leu Leu Pro
100 105 110
Asp Ala Ala Ala Gly Gln Ala Leu Thr Val Val Cys His Leu Pro Tyr
115 120 125
Tyr Gly Lys Asp Pro Leu Phe His Pro Tyr Glu Arg Arg Arg Lys Ser
130 135 140
Arg Ala Cys Ile Pro Tyr Asn Cys Gly Thr Trp Tyr Val Ala Gly Gly
145 150 155 160
Leu Asn Gly Gly Gln Ser Ala Ala Tyr Leu Glu Leu Cys Arg Glu Leu
165 170 175
Lys Ala Arg Thr Asp Glu Asp Leu Arg Arg Gly Val Ile Ala Arg Phe
180 185 190
His Asp Glu Ser Gln Leu Asn Arg Leu Val Ala Glu Gln Pro Gly Arg
195 200 205
Phe Arg Val Leu Gly Pro Asp Tyr Cys Thr Pro Glu Glu Thr Pro Thr
210 215 220
Gly His Glu Ala Ile Arg Val Leu Gln Lys Ala His Tyr Ile Asp Val
225 230 235 240
Gln Ala Val Arg Gly Ala Ala Lys Pro Gln Asn Trp Val Gln Cys Lys
245 250 255
Trp Glu Ala Phe Cys Leu Asn Trp Leu Pro Tyr Leu Trp Arg Ala Arg
260 265 270
Asp Ala Leu Leu Arg Arg Arg Val Glu Pro Pro Gln Lys Met Pro
275 280 285
<210> 99
<211> 281
<212> PRT
<213> Subdoligranulum variabile
<400> 99
Met Thr Lys Val Ala Ala Leu Tyr Ile Cys Thr Gly Lys Tyr Ile Ala
1 5 10 15
Phe Trp Pro Glu Phe Tyr Asp Ser Ala Glu Gln Asn Leu Leu Pro Gly
20 25 30
Cys Glu Val His Tyr Phe Val Phe Thr Asp Ala Pro Val Leu Tyr Gly
35 40 45
Glu Glu Ala Asn Pro Arg Ile His Arg Cys Pro Gln Glu Ala Tyr Ser
50 55 60
Trp Pro Phe Ala Thr Leu Arg Arg Phe Glu Ile Phe Leu Ser Arg Glu
65 70 75 80
Glu Glu Leu Lys Ala Phe Asp Tyr Ile Phe Phe Phe Asn Ala Asn Ala
85 90 95
Gln Ile Met Thr Thr Ile Thr Pro Glu Met Phe Leu Pro Arg Ala Asp
100 105 110
Arg Gly Glu His Leu Leu Val Val Gln His Pro Ser Phe Tyr Thr Lys
115 120 125
Pro Asn Tyr Glu Phe Thr Tyr Asp Arg Asn Pro Arg Cys Arg Ala Phe
130 135 140
Ile Pro Met Gly Leu Gly Arg Tyr Tyr Val Cys Gly Gly Ile Asn Gly
145 150 155 160
Gly Glu Ala Ala Ala Phe Leu Lys Leu Cys His Thr Leu Asp Lys Arg
165 170 175
Ile Arg Lys Asp Leu Ala His Asn Val Ile Ala Gln Trp His Asp Glu
180 185 190
Ser His Ile Asn Arg Tyr Ile Leu Trp Arg Arg Asp Val Arg Val Leu
195 200 205
Ser Pro Ser Tyr Cys Trp Pro Glu Gly Trp Asn Leu Pro Leu Pro Cys
210 215 220
Arg Ile Leu Ile Arg Ser Lys Ala Arg Tyr Phe Asp Val Gln Gln Leu
225 230 235 240
Arg Lys Asp Ala Pro Ala Thr Glu Leu Pro Arg Tyr Val Val Arg Cys
245 250 255
Asn Asp Phe Met Lys Arg Ala Ala Arg Trp Leu Gln Arg Arg Leu Pro
260 265 270
Pro Lys Lys Glu Asp Ile Asn Asp Glu
275 280
<210> 100
<211> 286
<212> PRT
<213> Subdoligranulum variabile
<400> 100
Met Ser Glu Ser Arg Ile Arg Val Ala Val Leu Tyr Leu Cys Thr Gly
1 5 10 15
Ala Tyr Gln Val Phe Trp His Asp Phe Tyr Pro Asn Phe Arg Gln His
20 25 30
Phe Leu Pro Asp Cys Asp Arg Thr Phe Phe Val Phe Thr Asp Ala Ala
35 40 45
Ser Ile Asp Tyr Glu Asp Gln Pro Asp Val Arg Arg Phe Gln Gln Glu
50 55 60
Ala Leu Pro Trp Pro Tyr Ser Thr Met Gln Arg Phe Asp Ala Phe Leu
65 70 75 80
Ser Gln Ala Glu Ala Leu Ala Asp Tyr Asp Tyr Leu Phe Phe Ala Asn
85 90 95
Ala Asn Leu His Cys Leu Arg Asp Val Thr Ala Gly Glu Leu Leu Pro
100 105 110
Asp Ala Ala Lys Gly Gln Glu Leu Thr Val Val Cys His Leu Pro Tyr
115 120 125
Tyr Gly Arg Asn Pro Ile Phe His Pro Tyr Glu Arg Arg Arg Lys Cys
130 135 140
Arg Ala Gly Ile Pro Tyr Asn Cys Gly Thr Tyr Tyr Val Ala Gly Gly
145 150 155 160
Ile Asn Gly Gly Ala Ser Gly Ala Phe Leu Glu Met Cys Arg Glu Leu
165 170 175
Lys Ala Arg Thr Asp Glu Asp Leu Gln Arg Gly Ile Ile Ala Arg Cys
180 185 190
His Asp Glu Ser Gln Leu Asn Arg Leu Val Ala Glu Cys Pro Glu Arg
195 200 205
Phe Arg Ile Leu Pro Pro Glu Tyr Cys Thr Pro Glu Glu Thr Pro Thr
210 215 220
Gly Lys Glu Ala Ile Arg Val Leu Gln Lys Ser His Tyr Ile Asp Met
225 230 235 240
Ser Ala Val Arg Gln Gln Gly Arg Arg Gln Asn Tyr Leu Gln Arg Lys
245 250 255
Trp Glu Ala Phe Cys Leu Asn Trp Leu Pro Tyr Leu Trp Trp Ala Arg
260 265 270
Asp Thr Leu Leu Arg Arg Arg Val Asp Pro Pro Arg Thr Arg
275 280 285
<210> 101
<211> 258
<212> PRT
<213> Sulfurospirillum deleyianum
<400> 101
Met Asn Lys Ile Gly Ile Leu Tyr Ile Cys Thr Gly Asp Tyr Trp Lys
1 5 10 15
Phe Trp Glu Asn Phe Tyr Lys Ser Ser Glu Glu Leu Phe Leu Thr Asn
20 25 30
Glu Glu Lys His Tyr Phe Leu Phe Thr Asp Asn Arg Glu Leu Leu Asn
35 40 45
Ile Asn Asn Glu Arg Ile His Ser Phe Phe Gln Glu Lys Met Asp Trp
50 55 60
Pro Tyr Pro Thr Leu Tyr Arg Tyr Lys Thr Phe Ile Lys Tyr Lys Thr
65 70 75 80
Val Phe Gln Asp Met Asp Tyr Leu Ile Phe Cys Asn Ala Asn Leu Leu
85 90 95
Phe Asn Glu Lys Ile Ser Arg Asn Asp Leu Phe Ala Asn Lys Glu Leu
100 105 110
Phe Ala Thr Leu His Pro Gly Phe Phe Asp Lys Lys Pro Gln Lys Phe
115 120 125
Thr Tyr Glu Thr Asn Ile Lys Ser Leu Ala Tyr Thr Glu Lys Lys Val
130 135 140
Asp Ser Ile Tyr Val Cys Gly Gly Phe Asn Gly Gly Ile Lys Asn Asp
145 150 155 160
Phe Leu Lys Met Ala Glu Ile Leu Asp Asp Asn Ile Asp Lys Asp Phe
165 170 175
Ser Glu Ser Ile Ile Ala Ile Trp His Asp Glu Ser His Ile Asn Asn
180 185 190
Tyr Val Gln Asn Asn Lys Glu Lys Phe Asn Ile Leu Ser Pro Ser Phe
195 200 205
Cys Tyr Pro Gln His Tyr Ser Ile Asp Ile Asn Lys Lys Ile Ile Val
210 215 220
Gln Asp Lys Glu Lys Ile Ile Ser Ile Lys His Lys Gly Val Phe Tyr
225 230 235 240
Asn Ile Arg Phe Leu Ile Ile Lys Met Leu Lys Lys Met Phe Arg His
245 250 255
Arg Arg
<210> 102
<211> 246
<212> PRT
<213> 卵形拟杆菌
<400> 102
Met Arg Ile Gly Ile Leu Tyr Ile Cys Thr Gly Lys Tyr Asp Ile Phe
1 5 10 15
Trp Lys Asp Phe Tyr Leu Ser Ala Glu Arg Tyr Phe Met Gln Asp Gln
20 25 30
Ser Phe Ile Ile Glu Tyr Tyr Val Phe Thr Asp Ser Pro Lys Leu Tyr
35 40 45
Asp Glu Glu Asn Asn Lys His Ile His Arg Ile Lys Gln Lys Asn Leu
50 55 60
Gly Trp Pro Asp Asn Thr Leu Lys Arg Phe His Ile Phe Leu Arg Ile
65 70 75 80
Lys Glu Gln Leu Glu Arg Glu Thr Asp Tyr Leu Phe Phe Phe Asn Ala
85 90 95
Asn Leu Leu Phe Thr Ser Pro Ile Gly Lys Glu Ile Leu Pro Pro Ser
100 105 110
Asp Ser Asn Gly Leu Leu Gly Thr Met His Pro Gly Phe Tyr Asn Lys
115 120 125
Pro Asn Ser Glu Phe Thr Tyr Glu Arg Arg Asp Ala Ser Thr Ala Tyr
130 135 140
Ile Pro Glu Gly Glu Gly Arg Tyr Tyr Tyr Ala Gly Gly Leu Ser Gly
145 150 155 160
Gly Cys Thr Lys Ala Tyr Leu Lys Leu Cys Thr Thr Ile Cys Ser Trp
165 170 175
Val Asp Arg Asp Ala Thr Asn His Ile Ile Pro Ile Trp His Asp Glu
180 185 190
Ser Leu Ile Asn Lys Tyr Phe Leu Asp Asn Pro Pro Ala Ile Thr Leu
195 200 205
Ser Pro Ala Tyr Leu Tyr Pro Glu Gly Trp Leu Leu Pro Phe Glu Pro
210 215 220
Ile Ile Leu Ile Arg Asp Lys Asn Lys Pro Gln Tyr Gly Gly His Glu
225 230 235 240
Leu Leu Arg Arg Lys Asn
245

Claims (94)

1.一种藉由细胞,较佳为单一细胞产生α-1,3糖基化形式的岩藻糖-α-1,2-半乳糖-R(fucose-alpha-1,2-galactose-R,Fuc-a1,2-Gal-R)的方法,其中该α-1,3糖基化发生于岩藻糖-α-1,2-半乳糖-R(Fuc-a1,2-Gal-R)的末端“岩藻糖-a1,2-半乳糖”-基团,其中该方法包括下列步骤:
i.提供具有合成Fuc-a1,2-Gal-R的能力、表达α-1,3-糖基转移酶(alpha-1,3-glycosyltransferase),并具有合成为该α-1,3-糖基转移酶的供体的核苷酸-糖(nucleotide-sugar)的能力的细胞,与
ii.在允许合成该Fuc-a1,2-Gal-R、表达该α-1,3-糖基转移酶、合成该核苷酸-糖与合成该α-1,3糖基化形式的Fuc-a1,2-Gal-R的条件下培养该细胞,
iii.较佳为自该培养物分离该α-1,3糖基化形式的Fuc-a1,2-Gal-R。
2.如权利要求1的方法,其中于该Fuc-a1,2-Gal-R中的半乳糖(galactose,Gal)残基经由β-1,3或β-1,4糖苷键(glycosidic linkage)与R结合。
3.如权利要求1或2的方法,其中该R包括单糖(monosaccharide)、双糖(disaccharide)、寡糖(oligosaccharide)、肽、蛋白质、糖肽(glycopeptide)、糖蛋白(glycoprotein)、脂质或糖脂(glycolipid)。
4.如权利要求1至3的任一项的方法,其中该Fuc-a1,2-Gal-R为Fuc-a1,2-Gal-b1,3-R,较佳为其中该Fuc-a1,2-Gal-R为Fuc-a1,2-Gal-b1,3-GlcNAc-R。
5.如权利要求4的方法,其中于该Fuc-a1,2-Gal-b1,3-GlcNAc-R中的N-乙酰葡萄糖胺(N-acetylglucosamine,GlcNAc)残基经由β-1,3或β-1,4糖苷键与R结合。
6.如权利要求4或5的方法,其中该Fuc-a1,2-Gal-R为Fuc-a1,2-Gal-b1,3-GlcNAc-b1,3-R,较佳为,其中该Fuc-a1,2-Gal-R为Fuc-a1,2-Gal-b1,3-GlcNAc-b1,3-Gal-R,更佳为,其中该Fuc-a1,2-Gal-R为乳-N-岩藻五糖I(lacto-N-fucopentaose I,LNFP-I,Fuc-a1,2-Gal-b1,3-GlcNAc-b1,3-Gal-b1,4-Glc)。
7.如权利要求1至3的任一项的方法,其中该Fuc-a1,2-Gal-R为Fuc-a1,2-Gal-b1,4-R,较佳为其中该Fuc-a1,2-Gal-R为Fuc-a1,2-Gal-b1,4-Glc,视需要而定,其中该Fuc-a1,2-Gal-R为Fuc-a1,2-Gal-b1,4-(Fuc-a1,3)-Glc。
8.如权利要求1至7的任一项的方法,其中该α-1,3糖基化形式的Fuc-a1,2-Gal-R为组织血型抗原(histo blood group antigen,HBGA)系统的结构。
9.如权利要求1至8的任一项的方法,其中该α-1,3-糖基转移酶为α-1,3-半乳糖基转移酶(alpha-1,3-galactosyltransferase),其为具有将半乳糖(galactose,Gal)残基自UDP-半乳糖(UDP-galactose,UDP-Gal)转移至岩藻糖-a1,2-半乳糖-R(Fuc-a1,2-Gal-R)的末端“岩藻糖-a1,2-半乳糖”-基团的能力的糖基转移酶。
10.如权利要求1至6、8或9的任一项的方法,其中该α-1,3-糖基转移酶为α-1,3-半乳糖基转移酶,其为具有将半乳糖(Gal)残基自UDP-Gal转移至LNFP-I的末端“岩藻糖-a1,2-半乳糖”-基团的能力的糖基转移酶。
11.如权利要求1至3、7、9或10的任一项的方法,其中该α-1,3-糖基转移酶为α-1,3-半乳糖基转移酶,其为具有将半乳糖(Gal)残基自UDP-Gal转移至Fuc-a1,2-Gal-b1,4-Glc的末端“岩藻糖-a1,2-半乳糖”-基团的能力的糖基转移酶,视需要而定,于该Fuc-a1,2-Gal-b1,4-Glc中的葡萄糖残基为经岩藻糖基化,较佳为经α-1,3-岩藻糖基化。
12.如权利要求1至6或8至10的任一项的方法,其中该α-1,3糖基化形式的Fuc-a1,2-Gal-R为α-1,3糖基化形式的乳-N-岩藻五糖I(LNFP-I),其为Gal-a1,3-(Fuc-a1,2)-Gal-b1,3-GlcNAc-b1,3-Gal-b1,4-Glc(Gal-a1,3-LNFP-I),该α-1,3-糖基转移酶为α-1,3-半乳糖基转移酶,且该核苷酸-糖为UDP-半乳糖(UDP-galactose,UDP-Gal)。
13.如权利要求1至3、7或9至11的任一项的方法,其中该α-1,3糖基化形式的Fuc-a1,2-Gal-R为α-1,3糖基化形式的Fuc-a1,2-Gal-b1,4-Glc,其为Gal-a1,3-(Fuc-a1,2)-Gal-b1,4-Glc,视需要而定,α-1,3糖基化形式的Fuc-a1,2-Gal-b1,4-(Fuc-a1,3)-Glc,其为Gal-a1,3-(Fuc-a1,2)-Gal-b1,4-(Fuc-a1,3)-Glc,该α-1,3-糖基转移酶为一α-1,3-半乳糖基转移酶,且该核苷酸-糖为UDP-半乳糖(UDP-Gal)。
14.如权利要求9至13的任一项的方法,其中该α-1,3-半乳糖基转移酶具有PFAMPF03414结构域(domain),且
a.包括具有SEQ ID NO:01的基序(motif)YX[FHMQT]XAXX[ACG][ACG]其中X可为任何氨基酸残基,或
b.包括具有SEQ ID NO:02的基序YXQXCXX[ACG][ACG]其中X可为任何氨基酸残基,或
c.包括如SEQ ID NO:03、04、05、06、07、08、09、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36或37的任一者的多肽序列,或
d.为SEQ ID NO:03、04、05、06、07、08、09、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36或37的任一者的功能性同系物(functional homolog)、变体(variant)或衍生物(derivative),其具有与具有SEQ ID NO:03、04、05、06、07、08、09、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36或37的该a-1,3-半乳糖基转移酶多肽的任一者的全长至少80%整体序列相似度,且对岩藻糖-a1,2-半乳糖-R(fucose-a1,2-galactose-R,Fuc-a1,2-Gal-R)的末端“岩藻糖-a1,2-半乳糖”-基团具有a-1,3-半乳糖基转移酶活性,或
e.为功能性片段,包括来自SEQ ID NO:03、04、05、06、07、08、09、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36或37的任一者的至少8、9、10、11、12、13、14、15、16、17、18、19、20个连续的氨基酸残基的寡肽序列,且对岩藻糖-a1,2-半乳糖-R(Fuc-a1,2-Gal-R)的末端“岩藻糖-a1,2-半乳糖”-基团具有a-1,3-半乳糖基转移酶活性。
15.如权利要求1至8的任一项的方法,其中该α-1,3-半乳糖基转移酶为α-1,3-N-乙酰半乳糖胺转移酶(alpha-1,3-N-acetylgalactosaminyltransferase),其为具有将N-乙酰半乳糖胺(N-acetylgalactosamine,GalNAc)残基自UDP-N-乙酰半乳糖胺(UDP-N-acetylgalactosamine,UDP-GalNAc)转移至岩藻糖-a1,2-半乳糖-R(Fuc-a1,2-Gal-R)的末端“岩藻糖-a1,2-半乳糖”-基团的能力的糖基转移酶。
16.如权利要求1至6、8或15的任一项的方法,其中该α-1,3-半乳糖基转移酶为α-1,3-N-乙酰半乳糖胺转移酶,其为具有将N-乙酰半乳糖胺(GalNAc)残基自UDP-N-乙酰半乳糖胺(UDP-GalNAc)转移至LNFP-I的末端“岩藻糖-a1,2-半乳糖”-基团的能力的糖基转移酶。
17.如权利要求1至3、7或15的任一项的方法,其中该α-1,3-半乳糖基转移酶为α-1,3-N-乙酰半乳糖胺转移酶,其为具有将N-乙酰半乳糖胺(GalNAc)残基自UDP-GalNAc转移至Fuc-a1,2-Gal-b1,4-Glc的末端“岩藻糖-a1,2-半乳糖”-基团的能力的糖基转移酶,视需要而定,于该Fuc-a1,2-Gal-b1,4-Glc中的葡萄糖残基为经岩藻糖基化,较佳为经α-1,3-岩藻糖基化。
18.如权利要求1至6、8、15或16的任一项的方法,其中该α-1,3糖基化形式的Fuc-a1,2-Gal-R为α-1,3糖基化形式的乳-N-岩藻五糖I(LNFP-I),其为GalNAc-a1,3-(Fuc-a1,2)-Gal-b1,3-GlcNAc-b1,3-Gal-b1,4-Glc(GalNAc-a1,3-LNFP-I),该α-1,3-糖基转移酶为α-1,3-N-乙酰半乳糖胺转移酶,且该核苷酸-糖为UDP-N-乙酰半乳糖胺(UDP-GalNAc)。
19.如权利要求1至3、7、15或17的任一项的方法,其中该α-1,3糖基化形式的Fuc-a1,2-Gal-R为α-1,3糖基化形式的Fuc-a1,2-Gal-b1,4-Glc,其为GalNAc-a1,3-(Fuc-a1,2)-Gal-b1,4-Glc(α-四糖(alpha-tetrasaccharide)或A-四糖(A-tetrasaccharide)),视需要而定α-1,3糖基化形式的Fuc-a1,2-Gal-b1,4-(Fuc-a1,3)-Glc,其为GalNAc-a1,3-(Fuc-a1,2)-Gal-b1,4-(Fuc-a1,3)-Glc,该α-1,3-糖基转移酶为α-1,3-N-乙酰半乳糖胺转移酶,且该核苷酸-糖为UDP-N-乙酰半乳糖胺(UDP-GalNAc)。
20.如权利要求15至19的任一项的方法,其中该α-1,3-N-乙酰半乳糖胺转移酶具有PFAM PF03414结构域,且
a.包括具有SEQ ID NO:38的基序YX[ACIL]XGXX[ACG][ACG]其中X可为任何氨基酸残基,或
b.包括具有SEQ ID NO:39的基序YX[AG]XAXX[ACG][ACG]其中X可为任何氨基酸残基,或
c.包括如SEQ ID NO:40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99、100、101或102的任一者的多肽序列,或
d.为SEQ ID NO:40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99、100、101或102的任一者的功能性同系物、变体或衍生物,具有与具有SEQ ID NO:40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99、100、101或102的该a-1,3-N-乙酰半乳糖基转移酶(a-1,3-N-acetylgalactosyltransferase)多肽的任一者的全长至少80%整体序列相似度,且对岩藻糖-a1,2-半乳糖-R(Fuc-a1,2-Gal-R)的末端“岩藻糖-a1,2-半乳糖”基团具有a-1,3-N-乙酰半乳糖基转移酶活性,或
e.为一功能性片段,包括来自SEQ ID NO:40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99、100、101或102的任一者的至少8、9、10、11、12、13、14、15、16、17、18、19、20个连续的氨基酸残基的寡肽序列,且对岩藻糖-a1,2-半乳糖-R(Fuc-a1,2-Gal-R)的末端“岩藻糖-a1,2-半乳糖”基团具有a-1,3-N-乙酰半乳糖基转移酶活性。
21.如权利要求6、10、12、14、16、18或20的任一项的方法,其中藉由糖基转移酶的作用,经由将岩藻糖自GDP-岩藻糖转移到乳-N-四糖(lacto-N-tetraose,LNT,Gal-b1,3-GlcNAc-b1,3-Gal-b1,4-Glc)的末端半乳糖残基,于该细胞中合成该LNFP-I,该糖基转移酶为:
a.α-1,2-岩藻糖基转移酶(alpha-1,2-fucosyltransferase),选自包括来自具有UniProt ID A0A2N5RQ26的毛样短螺旋体(Brachyspira pilosicoli)、具有UniProt IDF8X274的Dysgonomonas mossii、具有UniProt ID G8QLF4的Dechlorosoma suillum、具有UniProt ID Q316B5的Desulfovibrio alaskensis与具有UniProt ID A0A1B8TNT0的Polaribacter vadi的多肽的列表,或
b.对LNT的末端半乳糖残基具有α-1,2-岩藻糖基转移酶活性的来自毛样短螺旋体(UniProt ID A0A2N5RQ26)的多肽、来自D.mossii(UniProt ID F8X274)的多肽、来自D.suillum(UniProt ID G8QLF4)的多肽、来自D.alaskensis(UniProt ID Q316B5)的多肽与来自P.vadi(UniProt ID A0A1B8TNT0)的多肽的任一者的功能性片段,或
c.来自具有UniProt ID A0A2N5RQ26的毛样短螺旋体、具有UniProt ID F8X274的D.mossii、具有UniProt ID G8QLF4的D.suillum、具有UniProt ID Q316B5的D.alaskensis与具有UniProt ID A0A1B8TNT0的P.vadi的多肽的任一者的功能性同系物、变体或衍生物,具有分别与来自UniProt ID A0A2N5RQ26的毛样短螺旋体、具有UniProt ID F8X274的D.mossii、具有UniProt ID G8QLF4的D.suillum、具有UniProt ID Q316B5的D.alaskensis与具有UniProt ID A0A1B8TNT0的P.vadi的该多肽的任一者的全长的至少80%整体序列相似度,且对乳-N-四糖(LNT)的末端半乳糖残基具有α-1,2-岩藻糖基转移酶活性,或
d.多肽包括氨基酸序列,或由氨基酸序列组成,该氨基酸序列具有与来自毛样短螺旋体(UniProt ID A0A2N5RQ26)的多肽、来自D.mossii(UniProt ID F8X274)的多肽、来自D.suillum(UniProt ID G8QLF4)的多肽、来自D.alaskensis(UniProt ID Q316B5)的多肽与来自P.vadi(UniProt ID A0A1B8TNT0)的多肽的任一者的全长氨基酸序列至少80%序列相似度,且对LNT的末端半乳糖残基具有α-1,2-岩藻糖基转移酶活性。
22.如权利要求1至21的任一项的方法,其中该细胞在糖基转移酶的表达或活性方面被修饰。
23.如前方权利要求的任一项的方法,其中该细胞表达膜转运蛋白(membranetransporter protein)或具有转运活性的多肽,从而将化合物转运穿过细胞壁的外膜(outer membrane)。
24.如权利要求23的方法,其中该膜转运蛋白(membrane transporter protein)或该具有转运活性的多肽选自列表,其包括运输蛋白(porter)、P-P-键-水解驱动转运蛋白(P-P-bond-hydrolysis-driven transporter)、b-桶孔蛋白(b-barrel porins)、辅助转运蛋白(auxiliary transport protein)、推定转运蛋白(putative transport protein)与磷酸转移驱动的基团转位蛋白(phosphotransfer-driven group translocator),
较佳为,该运输蛋白包括MFS转运蛋白、糖外流转运蛋白(sugar efflux transporter)与嗜铁素输出蛋白(siderophore exporters),
较佳为,该P-P-键-水解驱动转运蛋白包括ABC转运蛋白与嗜铁素输出蛋白。
25.如权利要求23或24的任一项方法,其中该膜转运蛋白或具有转运活性的多肽控制该α-1,3糖基化形式的Fuc-a1,2-Gal-R及/或用于该α-1,3糖基化形式的Fuc-a1,2-Gal-R的产生的一个或更多个的前体及/或受体的于细胞壁的外膜上的流动。
26.如权利要求23至25的任一项的方法,其中该膜转运蛋白或具有转运活性的多肽提供该α-1,3糖基化形式的Fuc-a1,2-Gal-R的经改善的产生及/或经启动及/或经增强的流出。
27.如前方权利要求的任一项的方法,其中该细胞为代谢工程化(metabolicallyengineered)的细胞。
28.如权利要求27的方法,其中该细胞是以基因表达模块(module)修饰,其特征在于,来自任何该表达模块的表达为组成型的(constitutive),或是由天然诱导物(naturalinducer)创造的。
29.如权利要求27或28的任一项的方法,其中该细胞包括编码一种蛋白质的相同编码DNA序列的多个复制(copies)。
30.如权利要求27至29的任一项的培养基,其中该细胞包括用于醋酸的经降低的产量的修饰。
31.如权利要求27至29的任一项的方法,其中该细胞包括任一或更多的蛋白质的较低或经降低的表达及/或经消除、受损、经降低或经延迟的活性,该任一或更多的蛋白质包括β-半乳糖苷酶(beta-galactosidase)、半乳糖苷O-乙酰转移酶(galactoside O-acetyltransferase)、N-乙酰葡萄糖胺-6-磷酸去乙酰酶(N-acetylglucosamine-6-phosphate deacetylase)、葡萄糖胺-6-磷酸去胺酶(glucosamine-6-phosphatedeaminase)、N-乙酰葡萄糖胺抑制蛋白(N-acetylglucosamine repressor)、核糖核苷酸单磷酸酶(ribonucleotide monophosphatase)、EIICBA-Nag、UDP-葡萄糖:十一碳烯-磷酸葡萄糖-1-磷酸转移酶(UDP-glucose:undecaprenyl-phosphate glucose-1-phosphatetransferase)、L-墨角藻糖激酶(L-fuculokinase)、L-岩藻糖异构酶(L-fucoseisomerase)、N-乙酰神经氨酸解离酶(N-acetylneuraminate lyase)、N-乙酰甘露糖胺激酶(N-acetylmannosamine kinase)、N-乙酰甘露糖胺-6-磷酸2-表异构酶(N-acetylmannosamine-6-phosphate 2-epimerase)、EIIAB-Man、EIIC-Man、EIID-Man、ushA、半乳糖-1-磷酸尿苷酸转移酶(galactose-1-phosphate uridylyltransferase)、葡萄糖-1-磷酸腺苷酸转移酶(glucose-1-phosphate adenylyltransferase)、葡萄糖-1-磷酸酶(glucose-1-phosphatase)、ATP-依赖性6-磷酸果糖激活酶同功酶1(ATP-dependent 6-phosphofructokinase isozyme 1)、ATP-依赖性6-磷酸果糖激活酶同功酶2(ATP-dependent 6-phosphofructokinase isozyme 2)、葡萄糖-6-磷酸异构酶(glucose-6-phosphate isomerase)、有氧呼吸控制蛋白(aerobic respiration control protein)、转录抑制蛋白IclR(transcriptional repressor IclR)、lon蛋白酶(lon protease)、葡萄糖特异性易位磷酸转移酶IIBC成分ptsG(glucose-specific translocatingphosphotransferase enzyme IIBC component ptsG)、葡萄糖特异性易位磷酸转移酶(PTS)酶IIBC成分malX(glucose-specific translocating phosphotransferase(PTS)enzyme IIBC component malX)、酶IIAGlc、β-葡糖苷特异性PTS酶II(beta-glucosidespecific PTS enzyme II)、果糖特异性PTS多磷酸基转移蛋白FruA与FruB(fructose-specific PTS multiphosphoryl transfer protein FruA and FruB)、乙醇脱氢酶(ethanol dehydrogenase)醛脱氢酶(aldehyde dehydrogenase)、丙酮酸甲酸裂解酶(pyruvate-formate lyase)、醋酸激酶(acetate kinase)、磷酸酰基转移酶(phosphoacyltransferase)、磷酸乙酰转移酶(phosphate acetyltransferase)、丙酮酸去羧酶(pyruvate decarboxylase)。
32.如前方权利要求的任一项的方法,其中该细胞具有产生磷酸烯醇丙酮酸盐(phosphoenolpyruvate,PEP)的能力。
33.如前方权利要求的任一项的方法,其中该细胞被修饰以增强磷酸烯醇丙酮酸盐(PEP)的产生及/或供应。
34.如前方权利要求的任一项的方法,其中该细胞包含至少部分失活的所选单糖、双糖或寡糖的分解代谢途径,该单糖、双糖或寡糖参与及/或被该α-1,3糖基化形式的Fuc-a1,2-Gal-R的该产生所需。
35.如前方权利要求的任一项的方法,其中当在于其中乳糖与一种或更多的其他碳源结合的环境中生长时,该细胞抵抗乳糖杀伤(lactose killing)现象。
36.如前方权利要求的任一项的方法,其中该细胞在全肉汤(whole broth)及/或上清液中产生90g/L或更多的该α-1,3糖基化形式的Fuc-a1,2-Gal-R,及/或其中在全肉汤及/或上清液中,该α-1,3糖基化形式的Fuc-a1,2-Gal-R依据该α-1,3糖基化形式的Fuc-a1,2-Gal-R与其前体于该全肉汤及/或上清液中的总量测量分别具有至少80%的纯度。
37.如前方权利要求的任一项的方法,其中该细胞被稳定地培养于培养基中。
38.如前方权利要求的任一项的方法,其中该条件包括:
(i)使用包含用于该α-1,3糖基化形式的Fuc-a1,2-Gal-R的产生的至少一种前体及/或受体(acceptor)的培养基,及/或
(ii)对该培养基添加用于该α-1,3糖基化形式的Fuc-a1,2-Gal-R的产生的至少一种前体及/或受体进料(feed)。
39.如前方权利要求的任一项的方法,该方法包括下列步骤的至少一者:
i)使用包括至少一种前体及/或受体的培养基;
ii)对于反应器中的该培养基添加至少一种前体及/或受体进料,其中总反应器体积在250mL(毫升)至10.000m3(立方公尺)的范围内,较佳为以连续方式,且较佳为使得该培养基的最终体积不大于三倍,较佳为不大于两倍,更佳为小于两倍的在添加该前体及/或受体进料之前的该培养基的体积;
iii)对于反应器中的该培养基添加至少一种前体及/或受体进料,其中总反应器体积在250mL(毫升)至10.000m3(立方公尺)的范围内,较佳为以连续方式,且较佳为使得该培养基的最终体积不大于三倍,较佳为不大于两倍,更佳为小于两倍的在添加该前体及/或受体进料之前的该培养基的体积,且其中较佳为该前体及/或受体进料的pH被设定为介于3与7之间,且其中较佳为该前体及/或受体进料的温度被维持在介于20℃与80℃之间;
iv)藉由进料溶液的方式,在1天、2天、3天、4天、5天的进程期间,以连续方式添加至少一种前体及/或受体进料至该培养基;
v)藉由进料溶液的方式,在1天、2天、3天、4天、5天的进程期间,以连续方式添加至少一种前体及/或受体进料至该培养基,且其中较佳为该进料溶液的pH被设定为介于3与7之间,又其中较佳为该进料溶液的温度被维持在介于20℃与80℃之间;
该方法导致在该最终培养物中具有至少50g/L,较佳为至少75g/L,更佳为至少90g/L,更佳为至少100g/L,更佳为至少125g/L,更佳为至少150g/L,更佳为至少175g/L,更佳为至少200g/L的浓度的α-1,3糖基化形式的Fuc-a1,2-Gal-R。
40.如权利要求1至38的任一项的方法,该方法包括下列步骤的至少一者:
i)使用培养基,其包括每公升的起始反应器体积至少50,更佳为至少75,更佳为至少100,更佳为至少120,更佳为至少150公克的乳糖,其中该反应器体积在250mL(毫升)至10.000m3(立方公尺)的范围内;
ii)对该培养基添加乳糖进料,其包括每公升的起始反应器体积至少50,更佳为至少75,更佳为至少100,更佳为至少120,更佳为至少150公克的乳糖,其中该反应器体积在250mL(毫升)至10.000m3(立方公尺)的范围内,较佳为以连续形式,且较佳为使得该培养基的最终体积不大于三倍,较佳为不大于两倍,更佳为小于两倍的在添加该乳糖进料之前的该培养基的体积;
iii)对该培养基添加乳糖进料,其包括每公升的起始反应器体积至少50,更佳为至少75,更佳为至少100,更佳为至少120,更佳为至少150公克的乳糖,其中该反应器体积在250mL(毫升)至10.000m3(立方公尺)的范围内,较佳为以连续形式,且较佳为使得该培养基的最终体积不大于三倍,较佳为不大于两倍,更佳为小于两倍的在添加该乳糖进料之前的该培养基的体积,且其中较佳为该乳糖进料的pH被设定为介于3与7之间,又其中较佳为该乳糖进料的温度被维持在介于20℃与80℃之间;
iv)藉由进料溶液的方式,在1天、2天、3天、4天、5天的进程期间,以连续方式添加乳糖进料至该培养基;
v)藉由进料溶液的方式,在1天、2天、3天、4天、5天的进程期间,以连续方式添加乳糖进料至该培养基,且其中该乳糖进料溶液的浓度为50g/L,较佳为75g/L,更佳为100g/L,更佳为125g/L,更佳为150g/L,更佳为175g/L,更佳为200g/L,更佳为225g/L,更佳为250g/L,更佳为275g/L,更佳为300g/L,更佳为325g/L,更佳为350g/L,更佳为375g/L,更佳为400g/L,更佳为450g/L,更佳为500g/L,还更佳为,550g/L,最佳为600g/L;且其中较佳为该进料溶液的pH被设定为介于3与7之间,又其中较佳为该进料溶液的温度被维持在介于20℃与80℃之间;
该方法导致在该培养物的最终体积中具有至少50g/L,较佳为至少75g/L,更佳为至少90g/L,更佳为至少100g/L,更佳为至少125g/L,更佳为至少150g/L,更佳为至少175g/L,更佳为至少200g/L的浓度的α-1,3糖基化形式的Fuc-a1,2-Gal-R。
41.如权利要求39的方法,其中该乳糖进料是藉由从培养开始以至少为5mM的浓度,较佳为以30、40、50、60、70、80、90、100、150mM的浓度,更佳为以>300mM的浓度添加乳糖来完成的。
42.如权利要求39或40的任一项的方法,其中该乳糖进料是藉由将乳糖以浓度添加到培养物中来实现的,使得在整个培养物的产生阶段获得至少5mM,较佳为10mM或30mM的乳糖浓度。
43.如前方权利要求的任一项的方法,其中细胞培养至少约60、80、100或约120小时或以连续方式培养。
44.如前方权利要求的任一项的方法,其中该细胞在包括包含单糖、双糖、寡糖、多糖、多元醇、甘油的碳源的培养基,包括糖蜜(molasses)、玉米浆(corn steep liquor)、蛋白胨(peptone)、胰蛋白胨(tryptone)或酵母萃取物(yeast extract)的复合培养基中培养;较佳为,其中该碳源选自包括葡萄糖、甘油、果糖、蔗糖、麦芽糖、乳糖、阿拉伯糖(arabinose)、麦芽寡糖(malto-oligosaccharides)、麦芽三糖(maltotriose)、山梨糖醇(sorbitol)、木糖(xylose)、鼠李糖(rhamnose)、半乳糖、甘露糖、甲醇、乙醇、海藻糖(trehalose)、淀粉,纤维素、半纤维素(hemi-cellulose)、糖蜜、玉米浆、高果糖糖浆(high-fructose syrup)、醋酸盐、柠檬酸盐、乳酸盐与丙酮酸盐的列表。
45.如前方权利要求的任一项的方法,其中该培养基包含至少一种前体,其系选自包括乳糖、半乳糖、岩藻糖、唾液酸、GlcNAc、GalNAc、乳-N-二糖(lacto-N-biose,LNB)、N-乙酰乳糖胺(N-acetyllactosamine,LacNAc)的群组。
46.如前方权利要求的任一项的方法,其中藉由添加碳基质(carbon-basedsubstrate),较佳为葡萄糖或蔗糖至包括前体,较佳为乳糖的培养基中来提供指数型细胞生长的第一阶段,然后是第二阶段,其中,只有碳基基质,较佳为葡萄糖或蔗糖,被添加至培养基。
47.如权利要求1至45的任一项的方法,其中藉由添加碳基质,较佳为葡萄糖或蔗糖至包括前体,较佳为乳糖的培养基中来提供指数型细胞生长的第一阶段,然后是第二阶段,其中碳基质,较佳为葡萄糖或蔗糖,与前体,较佳为乳糖被添加至该培养基。
48.如前方权利要求的任一项的方法,其中该细胞产生带电、较佳为唾液酸化(sialylated)及/或中性双糖与寡糖的混合物,其包括α-1,3糖基化形式的Fuc-a1,2-Gal-R。
49.如前方权利要求的任一项的方法,其中该细胞产生带电、较佳为唾液酸化及/或中性寡糖的混合物,其包括α-1,3糖基化形式的Fuc-a1,2-Gal-R。
50.一种代谢工程化的细胞,用以产生α-1,3糖基化形式的岩澡糖-α-1,2-半乳糖-R(fucose-alpha-1,2-galactose-R,Fuc-a1,2-Gal-R),其中该α-1,3糖基化发生于岩藻糖-α-1,2-半乳糖-R(Fuc-a1,2-Gal-R)的末端“岩藻糖-a1,2-半乳糖”-基团,且其中该细胞
-合成Fuc-a1,2-Gal-R,与
-表达α-1,3-糖基转移酶,且
-具有产生核苷酸-糖的能力,其中该核苷酸-糖为该α-1,3-糖基转移酶的供体。
51.如权利要求50的细胞,其中于该Fuc-a1,2-Gal-R中的半乳糖(galactose,Gal)残基经由β-1,3或一β-1,4糖苷键(glycosidic linkage)与R结合。
52.如权利要求50或51的任一项的细胞,其中该R包括单糖、双糖、寡糖、肽、蛋白质、糖肽、糖蛋白、脂质或糖脂(glycolipid)。
53.如权利要求50至52的任一项的细胞,其中该Fuc-a1,2-Gal-R为Fuc-a1,2-Gal-b1,3-R,较佳为该Fuc-a1,2-Gal-R为Fuc-a1,2-Gal-b1,3-GlcNAc-R。
54.如权利要求53的细胞,其中于该Fuc-a1,2-Gal-b1,3-GlcNAc-R中的N-乙酰葡萄糖胺(GlcNAc)残基经由β-1,3或一β-1,4糖苷键与R结合。
55.如权利要求53或54的任一项的细胞,其中该Fuc-a1,2-Gal-R为Fuc-a1,2-Gal-b1,3-GlcNAc-b1,3-R,较佳为,其中该Fuc-a1,2-Gal-R为Fuc-a1,2-Gal-b1,3-GlcNAc-b1,3-Gal-R,更佳为,其中Fuc-a1,2-Gal-R为乳-N-岩藻五糖I(LNFP-I,Fuc-a1,2-Gal-b1,3-GlcNAc-b1,3-Gal-b1,4-Glc)。
56.如权利要求50至52的任一项的细胞,其中该Fuc-a1,2-Gal-R为Fuc-a1,2-Gal-b1,4-R,较佳为其中该Fuc-a1,2-Gal-R为Fuc-a1,2-Gal-b1,4-Glc,视需要而定,其中该Fuc-a1,2-Gal-R为Fuc-a1,2-Gal-b1,4-(Fuc-a1,3)-Glc。
57.如权利要求50至56的任一项的细胞,其中该α-1,3糖基化形式的Fuc-a1,2-Gal-R为组织血型抗原(HBGA)系统的结构。
58.如权利要求50至57的任一项的细胞,其中该α-1,3-糖基转移酶为α-1,3-半乳糖基转移酶,其为具有将半乳糖(Gal)残基自UDP-半乳糖(UDP-Gal)转移至岩藻糖-a1,2-半乳糖-R(Fuc-a1,2-Gal-R)的末端“岩藻糖-a1,2-半乳糖”-基团的能力的糖基转移酶。
59.如权利要求50至55、57或58的任一项的细胞,其中该α-1,3-糖基转移酶为α-1,3-半乳糖基转移酶,其为具有将半乳糖(Gal)残基自UDP-Gal转移至LNFP-I的末端“岩藻糖-a1,2-半乳糖”-基团的能力的糖基转移酶。
60.如权利要求50至52、56、58或59的任一项的细胞,其中该α-1,3-糖基转移酶为α-1,3-半乳糖基转移酶,其为具有将半乳糖(Gal)残基自UDP-Gal转移至Fuc-a1,2-Gal-b1,4-Glc的末端“岩藻糖-a1,2-半乳糖”-基团的能力的糖基转移酶,视需要而定,于该Fuc-a1,2-Gal-b1,4-Glc中的葡萄糖残基为经岩藻糖基化,较佳为经α-1,3-岩藻糖基化。
61.如权利要求50至55或57至59的任一项的细胞,其中该α-1,3糖基化形式的Fuc-a1,2-Gal-R为α-1,3糖基化形式的乳-N-岩藻五糖I(LNFP-I),其为Gal-a1,3-(Fuc-a1,2)-Gal-b1,3-GlcNAc-b1,3-Gal-b1,4-Glc(Gal-a1,3-LNFP-I),该α-1,3-糖基转移酶为α-1,3-半乳糖基转移酶,且该核苷酸-糖为UDP-半乳糖(UDP-Gal)。
62.如权利要求50至52、56或58至60的任一项的细胞,其中该α-1,3糖基化形式的Fuc-a1,2-Gal-R为α-1,3糖基化形式的Fuc-a1,2-Gal-b1,4-Glc,其为Gal-a1,3-(Fuc-a1,2)-Gal-b1,4-Glc,视需要而定,α-1,3糖基化形式的Fuc-a1,2-Gal-b1,4-(Fuc-a1,3)-Glc,其为Gal-a1,3-(Fuc-a1,2)-Gal-b1,4-(Fuc-a1,3)-Glc,该α-1,3-糖基转移酶为一α-1,3-半乳糖基转移酶,且该核苷酸-糖为UDP-半乳糖(UDP-Gal)。
63.如权利要求58至62的任一项的细胞,其中该α-1,3-半乳糖基转移酶具有PFAMPF03414结构域,且
a.包括具有SEQ ID NO:01的基序(motif)YX[FHMQT]XAXX[ACG][ACG],其中X可为任何氨基酸残基,或
b.包括具有SEQ ID NO:02的基序YXQXCXX[ACG][ACG],其中X可为任何氨基酸残基,或
c.包括如SEQ ID NO:03、04、05、06、07、08、09、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36或37的任一者的多肽序列,或
d.为SEQ ID NO:03、04、05、06、07、08、09、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36或37的任一者的功能性同系物、变体或衍生物,具有与具有SEQ ID NO:03、04、05、06、07、08、09、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36或37的该a-1,3-半乳糖基转移酶多肽的任一者的全长至少80%整体序列相似度,且对岩藻糖-a1,2-半乳糖-R(Fuc-a1,2-Gal-R)的末端“岩藻糖-a1,2-半乳糖”-基团具有a-1,3-半乳糖基转移酶活性,或
e.为一功能性片段,包括来自SEQ ID NO:03、04、05、06、07、08、09、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36或37的任一者的至少8、9、10、11、12、13、14、15、16、17、18、19、20个连续的氨基酸残基的寡肽序列,且对岩藻糖-a1,2-半乳糖-R(Fuc-a1,2-Gal-R)的末端“岩藻糖-a1,2-半乳糖”-基团具有a-1,3-半乳糖基转移酶活性。
64.如权利要求50至57的任一项的细胞,其中该α-1,3-半乳糖基转移酶为一α-1,3-N-乙酰半乳糖胺转移酶,其为具有将N-乙酰半乳糖胺(GalNAc)残基自UDP-N-乙酰半乳糖胺(UDP-GalNAc)转移至岩藻糖-a1,2-半乳糖-R(Fuc-a1,2-Gal-R)的末端“岩藻糖-a1,2-半乳糖”-基团的能力的糖基转移酶。
65.如权利要求50至55、57或64的任一项的细胞,其中该α-1,3-半乳糖基转移酶为α-1,3-N-乙酰半乳糖胺转移酶,其为具有将N-乙酰半乳糖胺(GalNAc)残基自UDP-N-乙酰半乳糖胺(UDP-GalNAc)转移至LNFP-I的末端“岩藻糖-a1,2-半乳糖”-基团的能力的糖基转移酶。
66.如权利要求50至52、56或64的任一项的细胞,其中该α-1,3-半乳糖基转移酶为α-1,3-N-乙酰半乳糖胺转移酶,其为具有将N-乙酰半乳糖胺(GalNAc)残基自UDP-GalNAc转移至Fuc-a1,2-Gal-b1,4-Glc的末端“岩藻糖-a1,2-半乳糖”-基团的能力的糖基转移酶,视需要而定,于该Fuc-a1,2-Gal-b1,4-Glc中的葡萄糖残基为经岩藻糖基化,较佳为经α-1,3-岩藻糖基化。
67.如权利要求50至55、57、64或65的任一项的细胞,其中该α-1,3糖基化形式的Fuc-a1,2-Gal-R为一α-1,3糖基化形式的乳-N-岩藻五糖I(LNFP-I),其为GalNAc-a1,3-(Fuc-a1,2)-Gal-b1,3-GlcNAc-b1,3-Gal-b1,4-Glc(GalNAc-a1,3-LNFP-I),该α-1,3-糖基转移酶为α-1,3-N-乙酰半乳糖胺转移酶,且该核苷酸-糖为UDP-N-乙酰半乳糖胺(UDP-GalNAc)。
68.如权利要求50至52、56、64或66的任一项的细胞,其中该α-1,3糖基化形式的Fuc-a1,2-Gal-R为一-1,3糖基化形式的Fuc-a1,2-Gal-b1,4-Glc,其为GalNAc-a1,3-(Fuc-a1,2)-Gal-b1,4-Glc(α-四糖或A-四糖),视需要而定α-1,3糖基化形式的Fuc-a1,2-Gal-b1,4-(Fuc-a1,3)-Glc,其为GalNAc-a1,3-(Fuc-a1,2)-Gal-b1,4-(Fuc-a1,3)-Glc,该α-1,3-糖基转移酶为一α-1,3-N-乙酰半乳糖胺转移酶,且该核苷酸-糖为UDP-N-乙酰半乳糖胺(UDP-GalNAc)。
69.如权利要求64至68的任一项的细胞,其中该α-1,3-N-乙酰半乳糖胺转移酶具有PFAM PF03414结构域,且
a.包括具有SEQ ID NO:38的基序YX[ACIL]XGXX[ACG][ACG],其中X可为任何氨基酸残基,或
b.包括具有SEQ ID NO:39的基序YX[AG]XAXX[ACG][ACG],其中X可为任何氨基酸残基,或
c.包括如SEQ ID NO:40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99、100、101或102的任一者的多肽序列,或
d.为SEQ ID NO:40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99、100、101或102的任一者的功能性同系物、变体或衍生物,具有与具有SEQ ID NO:40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99、100、101或102的该a-1,3-N-乙酰半乳糖基转移酶(a-1,3-N-acetylgalactosyltransferase)多肽的任一者的全长至少80%整体序列相似度,且对岩藻糖-a1,2-半乳糖-R(Fuc-a1,2-Gal-R)的末端“岩藻糖-a1,2-半乳糖”基团具有a-1,3-N-乙酰半乳糖基转移酶活性,或
e.为功能性片段,包括来自SEQ ID NO:40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99、100、101或102的任一者的至少8、9、10、11、12、13、14、15、16、17、18、19、20个连续不断的氨基酸残基的寡肽序列,且对岩藻糖-a1,2-半乳糖-R(Fuc-a1,2-Gal-R)的末端末端“岩藻糖-a1,2-半乳糖”基团具有a-1,3-N-乙酰半乳糖基转移酶活性。
70.如权利要求55、59、61、63、65、67或69的任一项的细胞,其中藉由糖基转移酶的作用,经由将岩藻糖自GDP-岩藻糖转移到乳-N-四糖(LNT,Gal-b1,3-GlcNAc-b1,3-Gal-b1,4-Glc)的末端半乳糖残基,于该细胞中合成该LNFP-I,该糖基转移酶为
a.α-1,2-岩藻糖基转移酶(alpha-1,2-fucosyltransferase),选自包括来自具有UniProt ID A0A2N5RQ26的毛样短螺旋体、具有UniProt ID F8X274的Dysgonomonasmossii、具有UniProt ID G8QLF4的Dechlorosoma suillum、具有UniProt ID Q316B5的Desulfovibrio alaskensis与具有UniProt ID A0A1B8TNT0的Polaribacter vadi的多肽的列表,或
b.对LNT的末端半乳糖残基具有α-1,2-岩藻糖基转移酶活性的来自毛样短螺旋体(UniProt ID A0A2N5RQ26)的多肽、来自D.mossii(UniProt ID F8X274)的多肽、来自D.suillum(UniProt ID G8QLF4)的多肽、来自D.alaskensis(UniProt ID Q316B5)的多肽与来自P.vadi(UniProt ID A0A1B8TNT0)的多肽的任一者的功能性片段,或
c.来自具有UniProt ID A0A2N5RQ26的毛样短螺旋体、具有UniProt ID F8X274的D.mossii、具有UniProt ID G8QLF4的D.suillum、具有UniProt ID Q316B5的D.alaskensis与具有UniProt ID A0A1B8TNT0的P.vadi的多肽的任一者的功能性同系物、变体或衍生物,具有分别与来自UniProt ID A0A2N5RQ26的毛样短螺旋体、具有UniProt ID F8X274的D.mossii、具有UniProt ID G8QLF4的D.suillum、具有UniProt ID Q316B5的D.alaskensis与具有UniProt ID A0A1B8TNT0的P.vadi的该多肽的任一者的全长的至少80%整体序列相似度,且对乳-N-四糖(LNT)的末端半乳糖残基具有α-1,2-岩藻糖基转移酶活性,或
d.多肽包括氨基酸序列,或系由氨基酸序列组成,该氨基酸序列具有与来自毛样短螺旋体(UniProt ID A0A2N5RQ26)的多肽、来自D.mossii(UniProt ID F8X274)的多肽、来自D.suillum(UniProt ID G8QLF4)的多肽、来自D.alaskensis(UniProt ID Q316B5)的多肽与来自P.vadi(UniProt ID A0A1B8TNT0)的多肽的任一者的全长氨基酸序列至少80%序列相似度,且对LNT的末端半乳糖残基具有α-1,2-岩藻糖基转移酶活性。
71.如权利要求50至70的任一项的细胞,其中该细胞在糖基转移酶的表达或活性方面被修饰。
72.如权利要求50至71的任一项的细胞,其中该细胞表达膜转运蛋白或具有转运活性的多肽,从而将化合物转运穿过细胞壁的外膜。
73.如权利要求72的细胞,其中该膜转运蛋白或该具有转运活性的多肽系选自列表,其包括运输蛋白、P-P-键-水解驱动转运蛋白、b-桶孔蛋白、辅助转运蛋白、推定转运蛋白与磷酸转移驱动的基团转位蛋白,
较佳为,该运输蛋白包括MFS转运蛋白、糖外流转运蛋白(sugar efflux transporter)与嗜铁素输出蛋白(siderophore exporters),或
较佳为,该P-P-键-水解驱动转运蛋白包括ABC转运蛋白与嗜铁素输出蛋白。
74.如权利要求72或73的任一项的细胞,其中该膜转运蛋白或具有转运活性的多肽控制该α-1,3糖基化形式的Fuc-a1,2-Gal-R及/或用于该α-1,3糖基化形式的Fuc-a1,2-Gal-R的产生的一或更多种的前体及/或受体的于细胞壁的外膜上的流动。
75.如权利要求72至74的任一项的细胞,其中该膜转运蛋白或具有转运活性的多肽提供该α-1,3糖基化形式的Fuc-a1,2-Gal-R的经改善的产生及/或经启动及/或经增强的流出。
76.如权利要求50至75的任一项的细胞,其中该细胞系以基因表达模块修饰,其特征在于来自任何该表达模块的表达为组成型的,或是由天然诱导物创造的。
77.如权利要求50至76的任一项的细胞,其中该细胞包括编码一种蛋白质的相同编码DNA序列的多个复制。
78.如权利要求50至77的任一项的细胞,其中该细胞包括用于降低醋酸的产量的修饰。
79.如权利要求50至78的任一项的细胞,其中该细胞包括任一或更多种的蛋白质的较低或经降低的表达及/或经消除、受损、经降低或经延迟的活性,该任一或更多种的蛋白质包括β-半乳糖苷酶、半乳糖苷O-乙酰转移酶、N-乙酰葡萄糖胺-6-磷酸去乙酰酶、葡萄糖胺-6-磷酸去胺酶、N-乙酰葡萄糖胺抑制蛋白、核糖核苷酸单磷酸酶、EIICBA-Nag、UDP-葡萄糖:十一碳烯-磷酸葡萄糖-1-磷酸转移酶、L-墨角藻糖激酶、L-岩藻糖异构酶、N-乙酰神经氨酸解离酶、N-乙酰甘露糖胺激酶、N-乙酰甘露糖胺-6-磷酸2-表异构酶、EIIAB-Man、EIIC-Man、EIID-Man、ushA、半乳糖-1-磷酸尿苷酸转移酶、葡萄糖-1-磷酸腺苷酸转移酶、葡萄糖-1-磷酸酶、ATP-依赖性6-磷酸果糖激活酶同功酶1、ATP-依赖性6-磷酸果糖激活酶同功酶2、葡萄糖-6-磷酸异构酶、有氧呼吸控制蛋白、转录抑制蛋白IclR、lon蛋白酶、葡萄糖特异性易位磷酸转移酶IIBC成分ptsG、葡萄糖特异性易位磷酸转移酶(PTS)酶IIBC成分malX、酶IIAGlc、β-葡糖苷特异性PTS酶II、果糖特异性PTS多磷酸基转移蛋白FruA与FruB、乙醇脱氢酶醛脱氢酶、丙酮酸甲酸裂解酶、醋酸激酶、磷酸酰基转移酶、磷酸乙酰转移酶、丙酮酸去羧酶。
80.如权利要求50至79的任一项的细胞,其中该细胞具有产生磷酸烯醇丙酮酸盐(PEP)的能力。
81.如权利要求50至80的任一项的细胞,其中该细胞被修饰以增强磷酸烯醇丙酮酸盐(PEP)的产生及/或供应。
82.如权利要求50至81的任一项的细胞,其中该细胞包含至少部分失活的所选单糖、双糖或寡糖的分解代谢途径,该单糖、双糖或寡糖参与及/或被该α-1,3糖基化形式的Fuc-a1,2-Gal-R的该产生所需。
83.如权利要求50至82的任一项的细胞,其中当在于其中乳糖与一种或更多的其他碳源结合的环境中生长时,该细胞抵抗乳糖杀伤现象。
84.如权利要求50至83的任一项的细胞,其中该细胞在全肉汤(whole broth)及/或上清液中产生90g/L或更多的该α-1,3糖基化形式的Fuc-a1,2-Gal-R,及/或其中在全肉汤及/或上清液中,该α-1,3糖基化形式的Fuc-a1,2-Gal-R依据该α-1,3糖基化形式的Fuc-a1,2-Gal-与其前体于该全肉汤及/或上清液中的总量测量分别具有至少80%的纯度。
85.如权利要求50至84的任一项的细胞,其中该细胞产生带电、较佳为唾液酸化及/或中性双糖与寡糖的混合物,其包括α-1,3糖基化形式的Fuc-a1,2-Gal-R。
86.如权利要求50至85的任一项的细胞,其中该细胞产生带电、较佳为唾液酸化及/或中性寡糖的混合物,其包括α-1,3糖基化形式的Fuc-a1,2-Gal-R。
87.如权利要求1至49的任一项的方法或如权利要求50至86的任一项的细胞,其中该细胞为细菌、真菌、酵母菌、植物细胞、动物细胞或原生动物细胞(protozoan cell),
-较佳为,该细菌为大肠杆菌(Escherichia coli)株(strain),更佳为大肠杆菌株,其为K-12株,还更佳为,该大肠杆菌K-12株为大肠杆菌MG1655,
-较佳为,该真菌属于选自包括黑霉菌属(Rhizopus)、网柄菌属(Dictyostelium)、青霉菌属(Penicillium)、白霉菌属(Mucor)或曲菌属(Aspergillus)的群组的属,
-较佳为,该酵母菌属于选自包括酵母菌属(Saccharomyces)、接合酵母菌属(Zygosaccharomyces)、毕赤酵母菌属(Pichia)、克马格特勒酵母(Komagataella)、汉逊氏酵母菌属(Hansenula)、子囊菌酵母属(Yarrowia)、拟球酵母菌属(Starmerella)、克鲁维酵母菌属(Kluyveromyces)或德巴利酵母菌属(Debaromyces)的群组的属,
-较佳为,该植物细胞为藻类细胞(algal cell)或源自烟草(tobacco)、苜蓿(alfalfa)、水稻(rice)、西红柿、棉花、油菜籽(rapeseed)、大豆、玉蜀黍(maize)或玉米(corn)植物,
-较佳为,该动物细胞系源自非人类哺乳动物(non-human mammals)、鸟、鱼、无脊椎动物(invertebrates)、爬虫类(reptiles)、两栖类(amphibians)或昆虫(insects),或源自排除胚胎干细胞的人类细胞的基因修饰细胞系(cell line),更佳为该人类和非人类哺乳动物细胞为上皮细胞(epithelial cell)、胚胎肾细胞(embryonic kidney cell)、纤维母细胞(fibroblast cell)、COS细胞、中国仓鼠卵巢(Chinese hamster ovary,CHO)细胞、鼠骨髓瘤细胞(murine myeloma cell)、NIH-3T3细胞、非哺乳动物成人干细胞(non-mammaryadult stem cell)或其衍生物,更佳为该昆虫细胞系源自草地贪夜蛾(Spodopterafrugiperda)、家蚕(Bombyx mori)、甘蓝夜蛾(Mamestra brassicae)、粉纹夜蛾(Trichoplusia ni)或黑腹果蝇(Drosophila melanogaster),
-较佳为,该原生动物细胞为蜥蜴利什曼原虫(Leishmania tarentolae)细胞。
88.如权利要求1至49与87的任一项的方法,或如权利要求50至87的任一项的细胞,其中该细胞为细菌,较佳为大肠杆菌株,更佳为为K-12株的大肠杆菌株的细胞,还更佳为,该大肠杆菌K-12株为大肠杆菌MG1655。
89.如权利要求88的方法,或如权利要求88的细胞,其中该细胞为活革兰氏阴性细菌(Gram-negative bacterium),其包括经降低或消除的聚-N-乙酰-葡萄糖胺(poly-N-acetyl-glucosamine,PNAG)、肠杆菌共同抗原(Enterobacterial Common Antigen,ECA)、纤维素、可拉酸(colanic acid)、核心寡糖(core oligosaccharides)、渗透调节周质葡聚糖(Osmoregulated Periplasmic Glucans,OPG)、葡萄糖基甘油(Glucosylglycerol)、聚糖(glycan)、及/或海藻糖(trehalose)的合成。
90.如权利要求1至49与87的任一项的方法,或如权利要求50至87的任一项的细胞,其中该细胞为酵母菌细胞。
91.如权利要求1至49与87至90的任一项的方法,其中该分离包括下列步骤的至少一者:澄清(clarification)、超过滤(ultrafiltration)、纳米过滤(nanofiltration)、两相分配(two-phase partitioning)、逆渗透(reverse osmosis)、微过滤(microfiltration)、活性炭或碳处理(activated charcoal or carbon treatment)、以非离子界面活性剂处理(treatment with non-ionic surfactants)、酶消化(enzymatic digestion)、切向流高效过滤(tangential flow high-performance filtration)、切向流超过滤(tangentialflow ultrafiltration)、亲和层析(affinity chromatography)、离子交换层析(ionexchange chromatography)、疏水相互作用层析(hydrophobic interactionchromatography)及/或凝胶过滤(gel filtration),配体交换层析(ligand exchangechromatography)。
92.如权利要求1至49与87至91的任一项的方法,还包括来自该细胞的任一种该α-1,3糖基化形式的Fuc-a1,2-Gal-R,较佳为来自该细胞的α-1,3糖基化形式的LNFP-I的纯化。
93.如权利要求1至49与87至92的任一项的方法,其中该纯化包括下列步骤的至少一者:活性炭或碳的使用、炭(charcoal)、纳米过滤、超过滤、电泳(electrophoresis)、酶处理或离子交换的使用、醇的使用,含水醇混合物(aqueous alcohol mixtures)的使用、结晶、蒸发、沉淀、干燥、喷雾干燥(spray drying)、冷冻干燥(lyophilization)、喷雾冷冻干燥(spray freeze drying)、冷冻喷雾干燥(freeze spray drying)、条式干燥(banddrying)、带式干燥(belt drying)、真空条式干燥(vacuum band drying)、真空带式干燥(vacuum belt drying)、滚筒式干燥(drum drying)、滚筒干燥(roller drying)、真空滚筒式干燥(vacuum drum drying)或真空滚筒干燥(vacuum roller drying)。
94.一种如权利要求50至90的任一项的细胞,或如权利要求1至49或87至93的任一项的方法的用途,其用于α-1,3糖基化形式的Fuc-a1,2-Gal-R,较佳为α-1,3糖基化形式的LNFP-I的产生。
CN202180056272.1A 2020-08-10 2021-08-10 α-1,3糖基化形式的Fuc-a1,2-Gal-R的产生 Pending CN116261597A (zh)

Applications Claiming Priority (27)

Application Number Priority Date Filing Date Title
EP20190201.2 2020-08-10
EP20190204 2020-08-10
EP20190205.3 2020-08-10
EP20190205.3A EP3954769A1 (en) 2020-08-10 2020-08-10 Production of oligosaccharide mixtures by a cell
EP20190201 2020-08-10
EP20190204.6 2020-08-10
EP20190202.0 2020-08-10
EP20190198 2020-08-10
EP20190208.7 2020-08-10
EP20190203.8 2020-08-10
EP20190206 2020-08-10
EP20190198.0 2020-08-10
EP20190208 2020-08-10
EP20190207 2020-08-10
EP20190200 2020-08-10
EP20190206.1 2020-08-10
EP20190203.8A EP3954778B1 (en) 2020-08-10 2020-08-10 Production of a mixture of neutral non-fucosylated oligosaccharides by a cell
EP20190202 2020-08-10
EP20190207.9 2020-08-10
EP20190200.4 2020-08-10
EP21168997 2021-04-16
EP21168997.1 2021-04-16
EP21186203 2021-07-16
EP21186203.2 2021-07-16
EP21186202 2021-07-16
EP21186202.4 2021-07-16
PCT/EP2021/072271 WO2022034077A1 (en) 2020-08-10 2021-08-10 Production of alpha-1,3 glycosylated form of fuc-a1,2-gal-r

Publications (1)

Publication Number Publication Date
CN116261597A true CN116261597A (zh) 2023-06-13

Family

ID=80246994

Family Applications (7)

Application Number Title Priority Date Filing Date
CN202180050133.8A Pending CN116234919A (zh) 2020-08-10 2021-08-10 借由细胞制造中性岩藻糖基化寡糖的混合物
CN202180056272.1A Pending CN116261597A (zh) 2020-08-10 2021-08-10 α-1,3糖基化形式的Fuc-a1,2-Gal-R的产生
CN202180050167.7A Pending CN116323958A (zh) 2020-08-10 2021-08-10 借由细胞制造寡糖混合物
CN202180050134.2A Pending CN116348610A (zh) 2020-08-10 2021-08-10 借由细胞生产岩藻糖化的乳糖结构
CN202180056014.3A Pending CN116096911A (zh) 2020-08-10 2021-08-10 借由细胞制造寡糖混合物
CN202180055890.4A Pending CN116249781A (zh) 2020-08-10 2021-08-10 在细胞中的含有GlcNAc的生物产品的产生
CN202180056310.3A Pending CN116096912A (zh) 2020-08-10 2021-08-10 借由细胞生产中性未岩藻糖化寡糖的混合物

Family Applications Before (1)

Application Number Title Priority Date Filing Date
CN202180050133.8A Pending CN116234919A (zh) 2020-08-10 2021-08-10 借由细胞制造中性岩藻糖基化寡糖的混合物

Family Applications After (5)

Application Number Title Priority Date Filing Date
CN202180050167.7A Pending CN116323958A (zh) 2020-08-10 2021-08-10 借由细胞制造寡糖混合物
CN202180050134.2A Pending CN116348610A (zh) 2020-08-10 2021-08-10 借由细胞生产岩藻糖化的乳糖结构
CN202180056014.3A Pending CN116096911A (zh) 2020-08-10 2021-08-10 借由细胞制造寡糖混合物
CN202180055890.4A Pending CN116249781A (zh) 2020-08-10 2021-08-10 在细胞中的含有GlcNAc的生物产品的产生
CN202180056310.3A Pending CN116096912A (zh) 2020-08-10 2021-08-10 借由细胞生产中性未岩藻糖化寡糖的混合物

Country Status (8)

Country Link
US (6) US12077788B2 (zh)
EP (9) EP4192973A2 (zh)
KR (1) KR20230048380A (zh)
CN (7) CN116234919A (zh)
AU (1) AU2021324068A1 (zh)
BR (1) BR112023002410A2 (zh)
CA (1) CA3188909A1 (zh)
WO (10) WO2022034075A1 (zh)

Families Citing this family (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113652385B (zh) * 2021-08-06 2023-10-03 江南大学 一种高产乳酰-n-四糖的微生物的构建方法及应用
WO2023168441A1 (en) * 2022-03-04 2023-09-07 The Regents Of The University Of California Production of milk oligosaccharides in plants
WO2023182527A1 (ja) * 2022-03-25 2023-09-28 キリンホールディングス株式会社 ラクトジフコテトラオース(ldft)の製造法
WO2023209098A1 (en) * 2022-04-29 2023-11-02 Dsm Ip Assets B.V. Hmo producing microorganism with increased robustness towards glucose gradients
DK202200561A1 (en) * 2022-06-13 2024-02-14 Dsm Ip Assets Bv Sigma factor modifications for biosynthetic production
DK202200588A1 (en) 2022-06-20 2024-02-23 Dsm Ip Assets Bv Mixture of fucosylated HMOs
WO2024003222A1 (en) 2022-06-29 2024-01-04 Inbiose N.V. Fucosylated saccharide for use in the prevention or treatment of bacterial disease
WO2024003223A1 (en) 2022-06-29 2024-01-04 Inbiose N.V. Fucosylated saccharide for use in the prevention or treatment of parasitic disease
WO2024017987A1 (en) * 2022-07-20 2024-01-25 Inbiose N.V. Production of oligosaccharides in host cells
WO2024047096A1 (en) 2022-08-30 2024-03-07 Inbiose N.V. Process for purification of an oligosaccharide
WO2024050533A2 (en) * 2022-09-02 2024-03-07 Arzeda Corp. Compositions and methods for producing rebaudioside m
WO2024089131A1 (en) 2022-10-25 2024-05-02 Inbiose N.V. Saccharide importers for lacto-n-triose
DK202201117A1 (en) * 2022-12-09 2024-08-08 Dsm Ip Assets Bv Genetically modified udp-n-acetylgalactosamine producing cells
WO2024153786A1 (en) 2023-01-19 2024-07-25 Inbiose N.V. Purification of an oligosaccharide or oligosaccharide mixture from a fermentation broth
WO2024153787A1 (en) 2023-01-19 2024-07-25 Inbiose N.V. Purification of a saccharide from a fermentation broth
WO2024153788A1 (en) 2023-01-19 2024-07-25 Inbiose N.V. Purification of an oligosaccharide or oligosaccharide mixture
WO2024165525A1 (en) 2023-02-06 2024-08-15 Inbiose N.V. Production of a saccharide, lactobionic acid and/or glycosylated forms of lactobionic acid
WO2024165524A1 (en) 2023-02-06 2024-08-15 Inbiose N.V. Production of a saccharide by a cell with reduced synthesis of lactobionic acid
WO2024165611A1 (en) 2023-02-07 2024-08-15 Inbiose N.V. Production of a disaccharide and/or milk oligosaccharide by a cell with reduced synthesis of udp-glcnac
CN118166010B (zh) * 2024-03-19 2024-08-30 浙江熙正霖生物科技有限公司 一种n-乙酰神经氨酸的生物合成方法
CN118047820B (zh) * 2024-04-16 2024-07-19 北京三元食品股份有限公司 一种3-岩藻糖基乳糖的制备方法及制备的标准品

Family Cites Families (38)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO1991016449A1 (en) * 1990-04-16 1991-10-31 The Trustees Of The University Of Pennsylvania Saccharide compositions, methods and apparatus for their synthesis
WO1993008205A1 (en) * 1991-10-15 1993-04-29 The Scripps Research Institute Production of fucosylated carbohydrates by enzymatic fucosylation synthesis of sugar nucleotides; and in situ regeneration of gdp-fucose
CA2351022A1 (en) * 1998-11-18 2000-05-25 Neose Technologies, Inc. Low cost manufacture of oligosaccharides
FR2796082B1 (fr) 1999-07-07 2003-06-27 Centre Nat Rech Scient Procede de production d'oligosaccharides
AU2003280305B2 (en) 2002-07-01 2008-05-01 Arkion Life Sciences Llc Process and materials for production of glucosamine and N-acetylglucosamine
JP4264742B2 (ja) 2004-06-03 2009-05-20 独立行政法人農業・食品産業技術総合研究機構 ラクトnビオースホスホリラーゼ遺伝子、該遺伝子を含む組換えベクター及び該ベクターを含む形質転換体
WO2006034225A2 (en) * 2004-09-17 2006-03-30 Neose Technologies, Inc. Production of oligosaccharides by microorganisms
AU2007222375B2 (en) * 2006-03-09 2012-12-20 Centre National De La Recherche Scientifique (Cnrs) Method of producing sialylated oligosaccharides
WO2008033520A2 (en) 2006-09-15 2008-03-20 The Regents Of The University Of California Bifidobacterial gene sequences and their use
JP4915917B2 (ja) 2006-12-22 2012-04-11 独立行政法人農業・食品産業技術総合研究機構 ラクト−n−ビオースi及びガラクト−n−ビオースの製造方法
MY160680A (en) 2009-09-22 2017-03-15 Probiogen Ag Process for producing molecules containing specialized glycan structures
DK3235907T3 (da) 2010-07-12 2023-09-18 Inbiose Nv Metabolisk modificerede organismer til produktion af bioprodukter med merværdi
CA2835986A1 (en) 2011-05-13 2012-11-22 Glycom A/S Method for generating human milk oligosaccharides (hmos) or precursors thereof
CN103764835B (zh) 2011-06-07 2016-08-17 海罗公司 通过生物技术方法获取低聚糖
JP5800741B2 (ja) 2012-03-27 2015-10-28 森永乳業株式会社 ラクト−n−ビオースiの製造方法
US9029136B2 (en) 2012-07-25 2015-05-12 Glycosyn LLC Alpha (1,2) fucosyltransferases suitable for use in the production of fucosylated oligosaccharides
HUE060672T2 (hu) * 2013-03-14 2023-04-28 Glycosyn LLC Mikroorganizmusok és eljárások szialilált és N-acetilglükózamint tartalmazó oligoszacharidok elõállítására
CN105378096A (zh) 2013-03-14 2016-03-02 格里科比亚有限公司 寡糖组合物、糖蛋白以及在原核生物中产生它们的方法
US20160032344A1 (en) * 2013-03-15 2016-02-04 Glycobia, Inc. Polysialic acid, blood group antigens and glycoprotein expression in prokaryotes
EP3461890A1 (en) * 2014-03-31 2019-04-03 Jennewein Biotechnologie GmbH Total fermentation of oligosaccharides
EP3083938B1 (en) 2014-05-15 2023-11-08 Glycosyn LLC Alpha (1,2) fucosyltransferase syngenes for use in the production of fucosylated oligosaccharides
US10731193B2 (en) * 2014-06-27 2020-08-04 Glycom A/S Oligosaccharide production
CN106795545A (zh) 2014-08-08 2017-05-31 格林考瓦因有限公司 用于生物缀合物产生的修饰宿主细胞和杂合寡糖
WO2016040531A1 (en) 2014-09-09 2016-03-17 Glycosyn LLC Alpha (1,3) fucosyltransferases for use in the production of fucosylated oligosaccharides
ES2824679T5 (es) * 2014-10-24 2023-12-11 Glycom As Mezclas de oligosacáridos de la leche humana
RU2746410C2 (ru) 2014-11-14 2021-04-13 Инбиос Н.В. Мутантные микроорганизмы, устойчивые к гибели под действием лактозы
WO2016091268A2 (en) 2014-12-12 2016-06-16 University Of Copenhagen N-glycosylation
EP3390652A4 (en) 2015-12-18 2019-06-12 Glycom A/S Fermentative preparation of oligosaccharides
JP6771756B2 (ja) 2016-04-26 2020-10-21 国立大学法人 和歌山大学 β−ガラクトシダーゼ
DK3315610T3 (da) * 2016-10-29 2021-03-08 Jennewein Biotechnologie Gmbh Fremgangsmåde til fremstilling af fucosylerede oligosaccharider
CN110114469A (zh) 2016-12-27 2019-08-09 因比奥斯公司 唾液酸化化合物的体内合成
EP3425052A1 (en) * 2017-07-07 2019-01-09 Jennewein Biotechnologie GmbH Fucosyltransferases and their use in producing fucosylated oligosaccharides
JP2020528280A (ja) 2017-07-26 2020-09-24 イェネヴァイン ビオテヒノロギー ゲーエムベーハー シアリルトランスフェラーゼ及びシアリル化オリゴ糖の生産におけるその使用
EP3569713A1 (en) * 2018-05-16 2019-11-20 Jennewein Biotechnologie GmbH Use of glycosidases in the production of oligosaccharides
EP3702468A1 (en) * 2019-03-01 2020-09-02 Jennewein Biotechnologie GmbH Fermentative production of carbohydrates by microbial cells utilizing a mixed feedstock
EP3751003A1 (en) * 2019-06-12 2020-12-16 Jennewein Biotechnologie GmbH Production of fucosylated oligosaccharides in bacillus
WO2021067641A1 (en) 2019-10-03 2021-04-08 Turtletree Labs Pte. Ltd. Nutrient compositions and methods, kits, and cell compositions for producing the same
CN110527704B (zh) 2019-10-31 2020-03-13 烟台华康荣赞生物科技有限公司 一种合成乳-n-二糖的方法

Also Published As

Publication number Publication date
CN116323958A (zh) 2023-06-23
EP4192944A1 (en) 2023-06-14
WO2022034074A1 (en) 2022-02-17
US20230313253A1 (en) 2023-10-05
WO2022034073A1 (en) 2022-02-17
WO2022034068A1 (en) 2022-02-17
US20230416796A1 (en) 2023-12-28
EP4192967A1 (en) 2023-06-14
EP4192973A2 (en) 2023-06-14
WO2022034070A1 (en) 2022-02-17
EP4192972A1 (en) 2023-06-14
WO2022034075A1 (en) 2022-02-17
WO2022034067A1 (en) 2022-02-17
CN116096911A (zh) 2023-05-09
WO2022034076A3 (en) 2022-04-28
WO2022034077A1 (en) 2022-02-17
EP4192969A1 (en) 2023-06-14
US20230279403A1 (en) 2023-09-07
WO2022034076A2 (en) 2022-02-17
CN116234919A (zh) 2023-06-06
CA3188909A1 (en) 2022-02-17
KR20230048380A (ko) 2023-04-11
AU2021324068A1 (en) 2023-03-30
CN116096912A (zh) 2023-05-09
EP4192974A1 (en) 2023-06-14
EP4192970A1 (en) 2023-06-14
US12077788B2 (en) 2024-09-03
US20230265399A1 (en) 2023-08-24
EP4192968A1 (en) 2023-06-14
BR112023002410A2 (pt) 2023-03-21
CN116348610A (zh) 2023-06-27
CN116249781A (zh) 2023-06-09
US20240209405A1 (en) 2024-06-27
WO2022034069A1 (en) 2022-02-17
US20230287470A1 (en) 2023-09-14
WO2022034071A1 (en) 2022-02-17
EP4192971A1 (en) 2023-06-14

Similar Documents

Publication Publication Date Title
US20240209405A1 (en) Production of a sialylated oligosaccharide mixture by a cell
CN116323927A (zh) 双糖及/或寡糖的细胞生产
US20230313252A1 (en) Cellular production of sialylated di and/or oligosaccharides
CN117157394A (zh) 发酵生产
EP4370664A1 (en) Lacto-n-biose converting fucosyltransferases
TW202221132A (zh) 藉由細胞生產哺乳動物乳寡醣的混合物
CN117957316A (zh) 转化乳糖-n-二糖的岩藻糖基转移酶
TW202221138A (zh) 藉由細胞之唾液酸化寡醣混合物的生產
CN116472346A (zh) 借由细胞的唾液酸化寡糖混合物的生产
TW202221135A (zh) α-1,3醣化形式的Fuc-a1,2-Gal-R的產生
TW202221134A (zh) 半乳糖化雙醣與寡醣的產生
TW202212572A (zh) 藉由細胞製造中性岩藻糖基化寡醣之混合物

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination