CN116745430A - 在宿主细胞中产生包含ln3作为核心结构的寡糖 - Google Patents

在宿主细胞中产生包含ln3作为核心结构的寡糖 Download PDF

Info

Publication number
CN116745430A
CN116745430A CN202280010589.6A CN202280010589A CN116745430A CN 116745430 A CN116745430 A CN 116745430A CN 202280010589 A CN202280010589 A CN 202280010589A CN 116745430 A CN116745430 A CN 116745430A
Authority
CN
China
Prior art keywords
sequence
lactose
cell
protein
sequence identifier
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202280010589.6A
Other languages
English (en)
Inventor
苏菲·艾斯艾特
乔瑞·博普雷茲
格特·彼得斯
安妮莉丝·维考特伦
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Inbiose NV
Original Assignee
Inbiose NV
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Inbiose NV filed Critical Inbiose NV
Publication of CN116745430A publication Critical patent/CN116745430A/zh
Pending legal-status Critical Current

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/70Vectors or expression systems specially adapted for E. coli
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P19/00Preparation of compounds containing saccharide radicals
    • C12P19/26Preparation of nitrogen-containing carbohydrates
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/195Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from bacteria
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/10Transferases (2.)
    • C12N9/1048Glycosyltransferases (2.4)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/10Transferases (2.)
    • C12N9/1048Glycosyltransferases (2.4)
    • C12N9/1051Hexosyltransferases (2.4.1)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P19/00Preparation of compounds containing saccharide radicals
    • C12P19/18Preparation of compounds containing saccharide radicals produced by the action of a glycosyl transferase, e.g. alpha-, beta- or gamma-cyclodextrins
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y204/00Glycosyltransferases (2.4)
    • C12Y204/01Hexosyltransferases (2.4.1)
    • C12Y204/01094Protein N-acetylglucosaminyltransferase (2.4.1.94)

Landscapes

  • Chemical & Material Sciences (AREA)
  • Organic Chemistry (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Genetics & Genomics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • Biotechnology (AREA)
  • Microbiology (AREA)
  • Molecular Biology (AREA)
  • Medicinal Chemistry (AREA)
  • General Chemical & Material Sciences (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Physics & Mathematics (AREA)
  • Plant Pathology (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)
  • Enzymes And Modification Thereof (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Saccharide Compounds (AREA)
  • Peptides Or Proteins (AREA)

Abstract

本发明系于合成生物学及代谢工程的技术领域中。更特别是,本发明系于代谢工程之宿主细胞之培养的技术领域中。本发明系描述藉由培养基因修饰细胞,以产生包含乳糖‑N‑三糖(lacto‑N‑triose;LN3;GlcNAc‑beta1,3‑Gal‑beta1,4‑Glc)作为核心三糖的寡糖之方法,以及该方法所使用之基因修饰细胞。基因修饰细胞包括,用以编码参与包括LN3作为核心三糖的寡糖之合成的半乳糖苷‑β‑1,3‑N‑乙酰葡萄糖胺转移酶(galactoside beta‑1,3‑N‑acetylglucosaminyltransferase)及糖基转移酶(glycosyltransferase)至少一核酸序列,以及表达一膜蛋白的至少一核酸序列。再者,本发明为了培养之具有LN3作为核心三糖的寡糖提供纯化。

Description

在宿主细胞中产生包含LN3作为核心结构的寡糖
发明领域
本发明系于合成生物学及代谢工程的技术领域中。更特别是,本发明系于代谢工程之宿主细胞之培养的技术领域中。本发明系描述藉由培养基因修饰细胞,以产生包含乳糖-N-三糖(lacto-N-triose;LN3;GlcNAc-beta1,3-Gal-beta1,4-Glc)作为核心三糖的寡糖之方法,以及该方法所使用之基因修饰细胞。基因修饰细胞包括,用以编码参与包括LN3作为核心三糖的寡糖之合成的半乳糖苷-β-1,3-N-乙酰葡萄糖胺转移酶(galactosidebeta-1,3-N-acetylglucosaminyltransferase)及糖基转移酶(glycosyltransferase)至少一核酸序列,以及表达一膜蛋白的至少一核酸序列。再者,本发明为了培养之具有LN3作为核心三糖的寡糖提供纯化。.
背景
今日,已有超过80种归属于人乳寡糖(HMOs)家族之化合物被结构上辨明。此些HMOs代表一类作用为益生元(prebiotics)之复杂寡糖。再者,HMOs与上皮抗原决定位之结构同源性,说明了其抵抗细菌性病原体之特性。在婴儿肠胃道中,HMOs选择性地滋养选定之细菌株的生长,且因此在母乳哺育婴儿体内发展出独特的肠道微菌丛。一些前述HMOs需要存在具有N-乙酰葡糖胺-β-1,3-半乳糖-β-1,4-葡萄糖(GlcNAc-beta1,3-Gal-beta1,4-Glc;lacto-N-triose;LN3)之核心的特别寡糖结构,此结构很可能展现出特别的生物活性。产生上述寡糖需要半乳糖苷-β-1,3-N-乙酰葡萄糖胺转移酶的作用与其他糖基转移酶的进一步作用,半乳糖苷-β-1,3-N-乙酰葡萄糖胺转移酶自UDP-N-乙酰葡糖胺供体(UDP-GlcNAcdonor)转移N-乙酰葡糖胺残基(GlcNAc residue)至乳糖受体(lactose acceptor)上,从而合成LN3,其他糖基转移酶进一步修饰LN3核心三糖。在微生物发酵生产中,具有LN3作为核心三糖的寡糖在许多情形中系被细胞内生产于工业化生产之宿主细胞中。在此领域中,一个被认定为确实困难之问题,系产生之寡糖所造成之细胞内寡糖浓度上升,以及它们之萃取。细胞内寡糖浓度之上升,被视为系造成所欲寡糖之产物抑制效果的原因。因此,合成速度可能下降或所欲寡糖可能达到具备细胞毒性之浓度,导致代谢停滞或甚至细胞溶解。
本发明之目标,系藉由提供高效率、省时及节省成本之具有LN3作为核心三糖的寡糖之生产工具及方法,以生产大量所欲产物。
依据本发明,上述目标及其他目标系透过提供一方法及细胞来达成,以产生具有LN3作为核心三糖的寡糖,其中上述细胞经过基因修饰以产生具有LN3作为核心三糖的寡糖,且包含至少一核酸序列编码合成具有LN3作为核心三糖的寡糖所参与之酶,更具体而言,上述细胞包含核酸序列以编码半乳糖苷-β-1,3-N-乙酰葡萄糖胺转移酶,藉以形成LN3,以及至少一种其他糖基转移酶以形成具有LN3作为核心三糖的寡糖。所述细胞更表达一膜蛋白,更具体而言,此细胞更表达一过去未知之膜蛋白,依据本发明,此膜蛋白得以改善生产及/或提供及/或强化具有LN3作为核心三糖的寡糖之排出
说明
发明概要
令人惊喜地,本发明使用之膜蛋白已被发现提供了一新辨识的膜蛋白,更具体而言,本发明提供之新辨识的膜蛋白,系先前未知能够使具有LN3作为核心三糖的寡糖运输,且对于所述具有LN3作为核心三糖的寡糖之发酵生产具有正面影响,故当用于基因工程化宿主细胞以产生所述具有LN3作为核心三糖的寡糖时,提供了较佳的产量(yield)、生产力(productivity)、单位生产力(specific productivity)及/或生长速度(growth speed)。
本发明亦提供产生具有LN3作为核心三糖的寡糖之方法。所述具有LN3作为核心三糖的寡糖系获得自包括本发明膜蛋白之宿主细胞。
定义
本说明书中用以描述发明或各实施例的文字,应理解为不仅在其通常定义之涵义上有意义,而系包括在本说明书之结构、材料或步骤中超过其通常定义之涵义范围的特别定义。因此,倘一组件在本说明书之脉络下可理解为包括多于一种涵义,则其使用于权利要求应理解为泛称被说明书及该文字本身所支持之所有可能涵义。
本发明于此揭露之各方面及各方面之实施例,应理解为不仅于本说明书所具体描述之顺序及脉络,而包括任何顺序及任何上述之组合。当文义需要时,所有使用单数之文字应被视为包括复数,反之亦然。除非另有定义,所有本文使用之技术及科学用语,通常具有与本发明所属技术领域具有通常知识者所一般理解之涵义相同。一般而言,本文使用之命名及描述之实验程序中的细胞培养、分子遗传学、有机化学、及核酸化学与杂交,系该技术领域所公知且通常实行者。标准技术用于合成核酸及胜肽。一般而言,酶反应及纯化步骤系根据制造者之说明书进行。
在图示及说明书中有揭露之本发明实施例,虽然采用特定用语,但此些用语仅系用于描述意义,而目的非在于限制之后权利要求中所阐述之发明范围。应理解的是,图示实施例之目的仅系用以阐述范例,而不应被用以限制本发明。对于所属技术领域之技艺人士,其他实施例、改良、细节、及使用可以在与本发明文字及精神一致且本发明之范围内做成,并仅受包括均等论之符合专利法解释下的权利要求之限制。在后面有参照字符(referencecharacters)用以指明权利要求步骤之权利要求中,上述参考字符仅系为了描述之便利,而无暗示任何特定顺序以实行所述步骤之意图。
在本文件及其权利要求中,动词「包括(to comprise)」、「具有(to have)」及「包含(to contain)」、及其词型变化系用于非限制之意义,代表含有此些词语后方之项目,但不排除未特定提及之项目。动词「大抵由…组成(to consist essentially of)」表示除具体述及之组件外,可能存在附加组件,此些附加组件未改变本发明之独特性质。在整个申请及权利要求中,除非有另外特别叙明,动词「包括」、「具有」及「包含」、及其词型变化可能被偏好地替换为「组成(及其词型变化)」或「大抵由…组成(及其词型变化)」,反之亦然。再者,以不定冠词「一」参照组件并未排除存在多于一个组件之可能,除非文义清楚要求一个且仅有一个组件。因此,不定冠词「一」通常表示「至少一个」。
根据本发明,「多核苷酸(polynucleotide)」用语通常系指任何多核糖核苷酸或多脱氧核糖核苷酸,其可为未修饰之RNA或DNA、或修饰之RNA或DNA。「多核苷酸」包括但不限于单链DNA、双链DNA、混合单链及双链区(single-and doubled-stranded regions)之DNA、混合单链、双链及三链区(single-,double-and triple-stranded regions)之DNA、单链RNA、双链RNA、混合单链及双链区之RNA、或包括DNA及RNA之杂交分子,上述杂交分子之DNA及RNA可能为单链、双链(较常见)或三链区、或混合之单链及双链区。再者,本文使用于指涉包括RNA或DNA或RNA及DNA之三链区的「多核苷酸」,所述区域之链可源自相同分子或不同分子。所述区域可能包括一或多个分子之全部,但通常多仅涉及一些分子之部分区域。其中一种具有三链螺旋区之分子为寡糖。本文使用之「多核苷酸」用语亦包括上述包含一或多个修饰碱基之DNA或RNA。因此,依据本发明,为了稳定性或其他原因而骨架经修饰之DNA或RNA亦为「多核苷酸」。再者,DNA或RNA包括非一般碱基(如:肌核苷(inosine))或其他经修饰碱基(如:三苯甲基化碱基(tritylated bases)),应理解为涵盖于「多核苷酸」用语内。应理解的是,为了提供许多有用的目的,对于DNA及RNA所做之大量修饰,已被所属技术领域之技艺人士所知悉。本文采用之「多核苷酸」用语,涵盖如:化学上、酶上或代谢上修饰型态之多核苷酸,以及病毒及细胞(如包括:单细胞或复杂细胞)之DNA及RNA性质的化学型态。「多核苷酸」亦涵盖通常称作寡核苷酸(oligonucleotide)之短核苷酸。
「多肽(polypeptide)」系指任何包括二或多个氨基酸,且彼此藉由肽键或修饰肽键连接之胜肽或蛋白质。「多肽」系指通常称作胜肽、寡肽及寡聚体(oligomer)之短链,以及通常称作蛋白质之长链。多肽可能包含除20个基因编码之氨基酸以外之其他氨基酸。「多肽」包括藉由自然处理(如:加工及其他翻译后修饰)及化学修饰技术所修饰者。上述修饰被良好地描述于基础档及更详细的专论,以及大量研究文献中,并为技艺人士所熟知。在给定多肽中,相同种类的修饰在一些位置之修饰程度可能相同或不同。再者,给定多肽可能包含许多种类之修饰。修饰可能发生于多肽的任何位置,包括多肽骨架、氨基酸侧链、及氨基或羧基端。修饰包括如:乙酰化、酰化、ADP核糖基化、酰胺化、共价结合黄素(covalentattachment of flavin)、共价结合血红素官能基(covalent attachment of hememoeity)、共价结合核苷酸或核苷酸衍生物、共价结合脂质或脂质衍生物、共价结合磷脂酸肌醇(phosphatidylinositol)、交联(cross-linking)、环化、形成双硫键、去甲基化、形成共价交联、形成焦谷氨酸、甲酰化、γ-羧基化、糖基化、GPI锚定形成(GPI anchorformation)、羟基化、碘化、甲基化、豆蔻酰化(myristoylation)、氧化、蛋白酶解化、磷酸化、异戊二烯化(prenylation)、消旋化(racemization)、脂质附连(lipid attachment)、硫化、谷氨酸残基之γ-羧基化(gamma-carboxylation of glutamic acid residues)、羟基与ADP核糖基化、硒化(selenylation)、tRNA调节之添加氨基酸至蛋白质(transfer-RNAmediated addition of amino acids to proteins)(例如:精氨酸化(arginylation))、及泛素化(ubiquitination)。多肽可能为线型或(分枝或无分枝的)环状。环状、分枝状及分枝环状的多肽可能源自自然加工之翻译后修饰,亦可能完全由合成方法而制成。
「分离(isolated)」代表透过「人为(by the hand of man)」改变其自然状态,亦即:倘其发生于自然界,其已被改变或被移除自其原始环境,或两者皆是。举例而言,自然地存在于活体中的多核苷酸或多肽并未被「分离」,但相同的多核苷酸或多肽被从其自然状态下共存的物质分开,依本文采用之用语,系被「分离」。类似地,「合成(synthetic)」序列,如本文使用之用语,表示任何藉由合成产生之序列,而非指从自然来源中分离者。本文使用的用语「合成的(synthesized)」是指任何合成产生的序列并且不是直接从自然来源分离。
「重组(recombinant)」表示藉由移植或剪接(splicing)一物种之基因至不同物种之宿主个体的细胞,所制备而成之基因工程化DNA。上述DNA变成宿主基因组成之一部分,并且被复制。
「内源(endogenous)」用语,在本发明脉络下,表示属细胞自然的一部分,且出现在细胞染色体中自然位置的任何多核苷酸、多肽或蛋白质序列。
「异源(heterologous)」用语,当用以指涉多核苷酸、基因、核酸、多肽或酶时,系指所述多核苷酸、基因、核酸、多肽或酶系源自或衍生自宿主个体物种以外之来源。相对地,本文使用之「同源(homologous)」多核苷酸、基因、核酸、多肽或酶,系表示所述多核苷酸、基因、核酸、多肽或酶衍生自宿主个体物种。当指涉用以维持或操纵基因序列之基因调节序列或辅助核酸序列时,例如:启动子、5’非翻译区、3’非翻译区、多线苷酸添加序列(poly Aaddition sequence)、内含子序列、剪接位、核糖体结合位、内部核糖体进入序列(internalribosome entry sequence)、基因组同源区(genome homology region)、重组位等,「异源」表示所述调节序列或操纵序列并非自然地连结至所述基因,而系衔接于构建体(construct)、基因组、染色体或游离基因组(episome)。因此,启动子被可操纵地连结(operably linked)至其自然状态下不会可操纵地连结之基因时,例如:在非基因工程化个体的基因组中,本文称之为「异源启动子(heterologous promoter)」,即使所述启动子连结的基因可能衍生自相同物种(或在一些情形下为相同个体)。
本文使用之「编码多肽之多核苷酸(polynucleotide encoding a polypeptide)」用语,涵盖含有编码本发明之多肽序列的多核苷酸。此词亦涵盖含有单一连续或非连续之多肽编码区(如:被整合之噬菌体(integrated phage)或插入序列或编辑所中断),以及含有亦可能包含编码及/或非编码序列之附加区域的多核苷酸。
基因的「修饰表达(modified expression)」用语,系指在具有LN3作为核心三糖的寡糖的任何生产程序之阶段中,所述基因相较于其野生型表达的表达变化。上述「修饰表达」相较于野生型为较低或较高的表达,其中「较高的表达(higher expression)」在内源基因之情形下,亦可被定义为「过表达(overexpression)」,或在野生型菌株不存在的异源基因之情形下,被定义为「表达(expression)」。较低的表达可藉由技艺人士一般周知之技术(例如:使用siRNA、CrispR、CrispRi、重组工程(rebombineering)、同源重组(homologousrecombination)、ssDNA诱发突变(ssDNA mutagenesis)、RNAi、miRNA、asRNA、基因突变、基因剔除、转位子诱发突变…等)获得,上述技术透过使基因较无法(即:相较于功能性野生型基因之统计上显著的「较无法(less-able)」)或完全无法(如:基因剔除)产生功能性最终产物之方式改变基因。过表达或表达可藉由技艺人士一般周知之技术所获得,其中所述基因为「表达匣(expression cassette)」之一部分,所述表达匣涉及存在启动子序列、非翻译区序列(包含核糖体结合序列或Kozak序列)、编码序列(例如:膜蛋白基因序列)、及任选的转录终止子(transcription terminator)之任一序列,并导致功能性活化蛋白质之表达。所述表达为组成性(constitutive)或条件性(conditional)或调节性(regulated)或可调性(tunable)。
「组成性表达(constitutive expression)」用语,定义为在某些生长条件下,所述表达不受除了RNA聚合酶次单元(例如:细菌σ因子)外之转录因子所调节。上述转录因子之未限制范例为:大肠杆菌(E.coli)中的CRP、LacI、ArcA、Cra、IclR;酿酒酵母菌(Saccharomyces cerevisiae)中的Aft2p、Crz1p、Skn7;枯草芽孢杆菌(B.subtilis)中的DeoR、GntR、Fur。此些转录因子结合在特定序列上,且可能在某些生长条件下阻止或强化表达。RNA聚合酶透过与特定序列结合以开始转录,例如于原核生物宿主中透过σ因子。
「调节性表达(regulated expression)」用语,定义为在某些生长条件下,所述表达除了受RNA聚合酶次单元(例如:细菌σ因子)调节外,亦受其他转录因子所调节。所述转录因子之范例已于上段描述。通常表达调节可透过诱导物(inducer),例如但不限于:IPTG、阿拉伯糖、鼠李糖、岩藻糖、异乳糖(allo-lactose),或pH变化、温度变化、碳耗尽(carbondepletion)、底物或产生之产物等来获得。
「控制序列(control sequences)」用语,指所述序列被宿主细胞之转录或翻译系统辨认,并允许多核苷酸序列转录或翻译成多肽。因此,此些DNA序列在特定宿主细胞或个体中,系表达可操纵地链接之编码序列所必要。上述控制序列可为但不限于:启动子序列、核糖体结合序列、Shine Dalgarno序列、Kozak序列、转录终止子序列。适合于原核生物之上述控制序列,例如包括:启动子、任选的操纵子序列、及核糖体结合位。真核细胞已知会利用启动子、多腺苷酸化讯号(polyadnylation signals)及强化子(enhancer)。前序列(presequence)或分泌主导(secretory leader)之DNA可能可操纵地连结至一多肽之DNA,如果其系被表达为参与多肽分泌之前蛋白(preprotein);启动子或强化子可操纵地链接至一编码序列,如果其影响所述序列之转录;核糖体结合位可能可操纵地链接至一编码序列,如果其影响所述序列之转录;核糖体结合位可能可操纵地链接至一编码序列,如果其如此设置以促进翻译。上述控制序列可能再被外在化学物质控制,例如但不限于:IPTG、阿拉伯糖、乳糖、异乳糖、鼠李糖或岩藻糖,透过一可诱发的启动子(inducible promoter),或透过一基因回路,以诱发或抑制上述多核苷酸之转录或翻译至多肽。
一般而言,「可操纵地连结(operably linked)」表示被连结的DNA序列为邻接的(contiguous),及在分泌主导之情形下,邻接且在阅读阶段(reading phase)。然而,强化子不需要系邻接。
「野生型(wild type)」用语,指一般所知发生于自然界之基因型或表达型之情形。
本文使用之「变异型(variant)」用语,系指与各自对照之多核苷酸或多肽不同之多核苷酸或多肽,但其保有基本特性。一典型变异型多核苷酸的核苷酸序列与另一对照之多核苷酸不同。变异型核苷酸序列的改变,可能或可能不会改变对照之多核苷酸所编码而成之多肽的氨基酸序列。核苷酸改变可能在对照序列所编码的多肽中,导致如下讨论之氨基酸置换、添加、删除、融合及截断。一典型变异型多肽的氨基酸序列与另一对照之多肽不同。一般而言,上述差异受有限制,使得对照多肽与变异型多肽整体非常类似,且许多区域相同。变异型与对照多肽可能由于一或多个置换、添加、删除、或上述任意组合,而在氨基酸序列上有所差异。置换或插入之氨基酸残基可能或可能不会被遗传密码所编码。多核苷酸或多肽的变异型可能自然发生,如:对偶基因变异(allelic variant),或可能为未知会自然发生之变异型。非自然发生之多核苷酸及多肽变异型,可以透过突变诱发(mutagenesis)技术、直接合成(direct synthesis)、及其他所属领域技艺人士所知之重组方法而成。
在一些实施例中,本发明关注于透过修改本发明所用之膜蛋白的结构,以制作功能性之变异型。变异型可以透过氨基酸置换、删除、添加、或上述任意组合而产生。例如,可以合理预期单独置换一亮氨酸成一异亮氨酸或缬氨酸、一天门冬氨酸成一谷氨酸、一苏氨酸成一丝氨酸、或将一氨基酸类似地置换成一结构相关之氨基酸(如:保守性突变(conservative mutations),并不会对于结果分子之生物活性有主要影响。保守性替换(conservative replacement)发生于支链相关之氨基酸家族内。改变本发明多肽之氨基酸序列是否导致功能同源物(functional homolog),可以藉由分析变异型多肽在细胞中以类似于野生型多肽形成回应的能力,而被容易地判定,且在本发明之情形下,相较于没有变异型的细胞,本发明提供了更佳的生产量、生产率及/或生长速度。
本文使用之「功能同源物(functional homolog)」用语,描述此些分子具有序列相似,且亦共享至少一种功能上特质(如:生化活性)。在本发明之脉络中,根据发明之膜蛋白Z(通常以序列识别号指明)的功能同源物,如本文所描述,指涉可以运输具有LN3作为核心糖类的寡糖的一膜蛋白,即:所述功能同源物保留膜蛋白Z具有运输具有LN3作为核心糖类的寡糖之功能上特质。更具体而言,本文使用之「功能同源物」用语,描述此些蛋白质具有序列相似(换句话说,同源性),且同时具有至少一种功能上相似性,例如:生化活性(Altenhoff等人,PLoS Comput.Biol.8(2012)e1002514)。
功能同源物有时亦指涉直向同源物(orthologs),所述「直向同源物」指同源基因或蛋白质在功能上相当于另一物种之对照基因或蛋白质。功能同源物通常导致相似但不需要相同程度的相同特质。功能同源蛋白质具有相同特质,其中一个同源物的定量量测至少为原始分子之10%:更典型地,至少20%、介于约30-40%之间;例如,介于约50-60%之间;介于约70-80%之间;介于约90-95%之间;介于约98-100%之间或大于100%。因此,当所述分子具有酶活性,其功能同源物具有相较于原始酶之上述比例的酶活性。当所述分子为DNA结合分子(如:多肽),其同源物具有相较于原始分子之上述比例的结合亲和力,所述结合亲和力系藉由测量结合分子之重量所得。
一功能同源物及对照之多肽可能系自然发生之多肽,且其序列相似性可能系由于趋同或趋异之演化事件。
功能同源物可能透过核苷酸及多肽序列比对(sequence alignment)分析而被识别。举例而言,在核苷酸或多肽序列数据库上进行查询可以识别出生物量调节型多肽(biomass-modulating polypeptides)之同源物。序列分析可以透过使用生物量调节型多肽作为对照序列,并包含BLAST、Reciprocal Blast或PSI-BLAST以分析非冗余之数据库(non-redundant databases)。氨基酸序列在一些实例中,会从核苷酸序列扣除。通常,在数据库中序列一致性(sequence identity)大于40%之复数个多肽序列,为进一步评估作为生物量调节型多肽之合适度的候选对象。氨基酸序列一致性容许保守性氨基酸置换,例如:置换一个疏水性残基成另一疏水性残基或置换一个极性残基成另一个极性残基。如有需要,可以进行上述候选对象之人工检查,以缩小进一步研究之候选对象的数量。可以透过选择在生产量调节型多肽(productivity-modulating polypeptides)中呈现结构域(domains)之候选对象(如:保守功能域(conserved functional domains)),以实施人工检查。
关于多核苷酸之「片段(fragment)」,指多核苷酸分子之克隆(clone)或任一部份,尤其是保留有用性、功能性特质的多核苷酸部分。有用的片段包括可以用于杂交或放大技术,或调节复制、转录或翻译之寡核苷酸及多核苷酸。「多核苷酸片段(polynucleotidefragment)」指任何通常包含至少约9个连续多核苷酸之多核苷酸子序列,例如:本文提供之至少约30个核苷酸或至少约50个核苷酸之任一序列。示范序列(exemplary fragments)可以额外地或替换地含有片段,此片段包括、大抵组成自或组成编码多肽保守家族域(conserved family domain)之区域。
示范片段可能额外地或替换地含有包括多肽保守域之片段。
片段可能额外地或替换地含有多肽及蛋白质分子之子序列,或多肽的子序列。在一些情形中,片段或结构域为多肽之子序列,所述子序列实质上相同地展现完整多肽(intact polypeptides)之至少一种生物功能,或以类似程度展现之。举例而言,多肽片段可以包括可供辨认的结构模体(structural motif)或功能域,例如:结合DNA启动子区域之DNA结合位或结构域、活化域、或蛋白质-蛋白质互动(protein-protein interactions)结构域,且可能引发转录。片段尺寸可以变化,并可能少如3个氨基酸残基至如完整多肽之全长,例如:至少约20个氨基酸残基长、至少约30个氨基酸残基长。较佳的片段为一功能性片段,其具有至少一种来源多肽之性质或活性,例如:所述片段可能含有一多肽的功能域或保守域。因此,在本发明的脉络中,依据发明之膜蛋白Z(通常以序列识别号指明)的功能性片段,指所述片段保留膜蛋白Z具有运输具有LN3作为核心糖类的寡糖之功能上特质。结构域可以被辨明,例如透过Pfam(El-Gebali等人,Nucleic Acids Res.47(2019)D427-D432)、IPR(InterPro域)(Mitchell等人,Nucleic Acids Res.47(2019)D351-D360)、蛋白质指纹域(protein fingerprint domain,PRINTS)(Attwood等人,Nucleic Acids Res.31(2003)400-402)、SUBFAM域(Gough等人,J.Mol.Biol.313(2001)903-919)、TIGRFAM域(Selengut等人,Nucleic Acids Res.35(2007)D260-D264)、保守域数据库(Conserved DomainDatabas,CDD)(https://www.ncbi.nlm.nih.gov/cdd)(Lu等人,Nucleic Acids Res.48(2020)D265-D268)、或PTHR域(http://www.pantherdb.org)(Mi等人,NucleicAcids.Res.41(2013)D377-D386;Thomas等人,Genome Research 13(2003)2129-2141)。应理解的是,对于所属领域技艺人士而言,本文使用之数据库包括:Pfam 32.0(2018年9月发布)、CDD v3.17(2019年4月3日发布)、eggnogdb 4.5.1(2016年9月发布)、InterPro 75.0(2019年7月4日发布)、TCDB(2019年7月17日发布),上述每一数据库之内容在每一次发布即固定不变。当特定数据库更动,此特定数据库将获得新的发布版本并搭配新发布日期。每个数据库的所有发布版本及其对应的发布日期,及在这些特定发布日期加注之特定内容,对于所属领域技艺人士而言为可取得且已知的。
因此,一多肽序列识别号之片段,较佳地表示其包括或由所述多肽序列识别号之一定数量连续氨基酸序列所组成,其中所述一定数量连续氨基酸序列,较佳为所述多肽序列识别号全长的至少50.0%、60.0%、70.0%、80.0%、81.0%、82.0%、83.0%、84.0%、85.0%、86.0%、87.0%、88.0%、89.0%、90.0%、91.0%、92.0%、93.0%、94.0%、95.0%、95.5%、96.0%、96.5%、97.0%、97.5%、98.0%、98.5%、99.0%、99.5%、100%,较佳为至少80.0%,更佳为至少87.0%,甚至更佳为至少90.0%,甚至更佳为至少95.0%,最佳为至少97.0%,且其实质上相同地展现完整多肽之至少一种生物功能,或较佳地以类似或更高程度展现之,此并可被技艺人士例行性地分析。因此,在本发明脉络中,依据发明之膜蛋白Z(通常以序列识别号(SEQ ID NO)指明)的功能性片段,保留膜蛋白Z具有运输具有LN3作为核心糖类的寡糖之功能上特质。因此,一多肽序列识别号之片段,较佳地表示其包括或由所述多肽序列识别号组成之片段,其中失去一定数量连续氨基酸序列,则所述失去之一定数量,较佳为所述多肽序列识别号全长的不多于50.0%、40.0%、30.0%,较佳为不多于20.0%、15.0%、10.0%、9.0%、8.0%、7.0%、6.0%、5.0%、4.5%、4.0%、3.5%、3.0%、2.5%、2.0%、1.5%、1.0%、0.5%,较佳为不多于15.0%,更佳为不多于10.0%,甚至更佳为不多于5.0%,最佳为不多于2.5%,且其实质上相同地展现完整多肽之至少一种生物功能,或较佳地以类似或更高程度展现之,此并可被技艺人士例行性地分析。「一致(identical)」或「一致百分比(percent identity)」或「%一致(%identity)」等词,在二或多个核酸或多肽序列之脉络中,当以序列比较算法(sequence comparison algorithms)或目视检查量测比较(compare)或比对(align)最大对应(maximum correspondence)时,指所述二或多个序列或子序列为相同,或有特定百分比之核苷酸或氨基酸序列为相同。在序列比较中,一序列作为对照序列,以与测试序列比较。当使用序列比对算法时,输入测试及对照序列至计算机中,如有必要,指派子序列坐标(subsequence coordinate),以及指派序列算法程序参数。序列比较算法接着依据分派之程序参数,计算测试序列相对于对照序列之一致百分比。一致百分比可以对照序列之序列全长为全局计算,得出全局一致百分比(global percent identity)的数值。另外,一致百分比亦可以对照序列之部分序列为计算,得出部分一致百分比的数值。使用对照序列之全长于区域序列比对时,得出测试与对照序列间之全局一致百分比。
一致百分比可以透过使用不同算法而决定,例如:BLAST及PSI-BLAST(Altschul等人,1990,J Mol Biol 215:3,403-410;Altschul等人,1997,Nucleic Acids Res 25:17,3389-402)、Clustal Omega法(Sievers等人,2011,Mol.Syst.Biol.7:539)、MatGAT法(Campanella等人,2003,BMC Bioinformatics,4:29)或EMBOSS Needle法(https://galaxy-iuc.github.io/emboss-5.0-docs/needle.html)。
BLAST(Basic Local Alignment Search Tool)比对,系由美国国家生物技术信息中心(National Center for Biotechnology Information,NCBI)所提供之使用预设参数比较序列的算法。此程序将核苷酸或蛋白质序列与序列数据库比较,并计算统计显著性。PSI-BLAST(Position-Specific Iterative Basic Local Alignment Search Tool)从复数个序列比对中,使用蛋白质-蛋白质BLAST(BLASTp)侦测高于给定分数阈值者,以获得位置具体得分矩阵(position-specific scoring matrix,PSSM)或数据(profile)。BLAST法可以被用于成对的(pairwise)或复数个序列比对。成对的序列比对用以识别区域相似度,并可能指出二生物序列(蛋白质或核酸)间之功能上、结构上及/或演化上的关系。BLAST的网络接口可以于此链接取得:https://blast.ncbi.nlm.nih.gov/Blast.cgi。
Clustal Omega(ClustalΩ)为一复数个序列比对程序,其利用种子引导树(seeded guide trees)及HMM profile-profile技术产生三或多个序列间之比对结果。此程序就发散序列(divergant sequences),产生生物学上有意义的复数序列比对。ClustalΩ的网络接口可以于此链接取得:https://www.ebi.ac.uk/Tools/msa/clustalo/。使用ClustalΩ法对蛋白质序列为复数序列比对及计算一致百分比之预设参数为:enablingde-alignment of input sequences:FALSE;enabling mbed-like clustering guide-tree:TRUE;enabling mbed-like clustering iteration:TRUE;Number of(combinedguide-tree/HMM)iterations:default(0);Max Guide Tree Iterations:default[-1];Max HMM Iterations:default[-1];order:aligned。
MatGAT(Matrix Global Alignment Tool)为一种计算机应用程序,其产生DNA或蛋白质序列之相似度/一致度矩阵时,不需要数据预比对(pre-alignment)。上述程序透过运用Myers与Miller全局比对算法(Myers and Miller global alignment algorithm)计算相似度及一致度,接着将结果置于距离矩阵中,进行一系列之成对比对。使用者可以在他们的蛋白质序列检验中,特定化采用之比对矩阵种类(如:BLOSUM50、BLOSUM62及PAM250)
EMBOSS Needle(https://galaxy-iuc.github.io/emboss-5.0-docs/needle.html)当考虑到序列整体长度时,使用Needleman-Wunsch全局比对算法(Needleman-Wunsch global alignment algorithm)寻找两序列之最佳比对(包括间隙)。所述最佳比对透过探索所有可能之比对,并选择最佳者之动态程序法所确保。Needleman-Wunsch算法为一类算法之一员,所述算法可按mn步(mn steps)之顺序计算最佳得分及比对,其中n及m为两序列之长度。间隙开口惩罚值(gap open penalty)(预设为10.0)系当间隙形成时被扣除之分数。默认值系假设使用EBLOSUM62矩阵于蛋白质序列。间隙延伸惩罚值(gap extension penalty)(预设为0.5)被加至间隙中每个碱基或残基之标准间隙惩罚值中,此为惩罚间隙之长度。
如本文所述,具有对照多肽序列的全长序列之至少80%整体序列一致之氨基酸序列的多肽(或蛋白质序列具有至少80%之整体序列一致),应理解为所述序列具有对照多肽序列的全长氨基酸序列80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、100%的整体序列一致。在整个申请中,除非有另外特别叙明,多肽序列包括/组成/具有/被表示于一氨基酸序列,其具有对照多肽的全长氨基酸序列(通常以序列识别号指明)至少80%的整体序列一致,较佳为对照序列全长至少85%、90%、91%、92.00%、93.00%、94.00%、95.00%、96.00%、97.00%、98.00%或99.00%,更佳为至少85%,甚至更佳为至少90%,甚至更佳为至少95.00%,甚至更佳为至少97.00%,最佳为99.00%的整体序列一致。本发明之脉络中,具有对照膜蛋白Z(通常以序列识别号指明)氨基酸序列的全长序列例如至少80%的整体序列一致之具有氨基酸序列的多肽(或蛋白质具有例如80%的整体序列一致),系指一多肽(如:膜蛋白)如本文所述可以运输具有LN3作为核心糖类的寡糖,即:所述多肽保留了对照膜蛋白Z具有运输具有LN3作为核心糖类的寡糖之功能上特质。
为了本发明之目的,多肽的整体序列一致性较佳地藉由EMBOSS Needle 5.0(https://galaxy-iuc.github.io/emboss-5.0-docs/needle.html)程序所决定,且较佳为搭配预设参数(substitution matrix EBLOSUM62、gap opening penalty 10及gapextension penalty 0.5),及较佳为搭配成熟蛋白之序列(即:不考虑分泌讯号或转运肽)。
本文使用之「糖基转移酶(glycosyltransferase)」用语,系指一酶,其具有催化糖基从活化的供体分子转移至特定受体分子并形成糖苷键之功能。依此方法形成的寡糖可为线型或分枝状,且可包含复数个单糖构筑区块(monosaccharide building blocks)。一类使用核苷酸二磷酸糖、核苷酸单磷酸糖、磷酸化糖及相关蛋白质之独特的基于序列之糖基转移酶家族,已经被描述(Campbell等人,Biochem.J.326,929-939(1997)),且可自CAZy(CArbohydrate-Active EnZymes)网站(www.cazy.org)取得。
本文使用之糖基转移酶可以选自包括但不限于下述名单:岩藻糖基转移酶、唾液酸转移酶、半乳糖基转移酶、葡萄糖基转移酶、甘露糖基转移酶、N-乙酰葡萄糖胺转移酶、N-乙酰半乳糖胺转移酶、N-乙酰甘露糖胺转移酶、木糖基转移酶、葡萄糖醛酸转移酶、半乳糖醛酸转移酶、葡萄糖胺转移酶、N-羟乙酰神经氨酸转移酶、鼠李糖基转移酶、N-乙酰鼠李糖胺转移酶、UDP-4-氨基-4,6-二脱氧基-N-乙酰基-β-L-阿卓糖胺转氨酶(UDP-4-amino-4,6-dideoxy-N-acetyl-beta-L-altrosamine transaminases)及岩藻糖胺转移酶。
岩藻糖基转移酶为一种糖基转移酶,其自GDP-岩藻糖(GDP-Fuc)供体转移岩藻糖(Fuc)残基至多糖受体上。岩藻糖基转移酶包括α-1,2-岩藻糖基转移酶、α-1,3-岩藻糖基转移酶、α-1,4-岩藻糖基转移酶及α-1,6-岩藻糖基转移酶,以催化Fuc残基从GDP-Fuc透过α糖苷键转移至多糖受体上。岩藻糖基转移酶可被发现自但不限于GT10、GT11、GT23、GT65及GT68之CAZy家族。唾液酸转移酶为一种糖基转移酶,其自供体(如:CMP-Neu5Ac或CMP-Neu5Gc)转移唾液酸基(如:Neu5Ac或Neu5Gc)至多糖受体上。唾液酸转移酶包括α-2,3-唾液酸转移酶及α-2,6-唾液酸转移酶,以催化唾液酸基透过α糖苷键转移至多糖受体上。唾液酸转移酶可以被发现但不限于GT29、GT42、GT80及GT97之CAZy家族。半乳糖基转移酶为一种糖基转移酶,其自UDP-半乳糖(UDP-Gal)供体转移半乳糖(Gal)残基至多糖受体上。半乳糖基转移酶包括β-1,3-半乳糖基转移酶、β-1,4-半乳糖基转移酶、α-1,3-半乳糖基转移酶及α-1,4-半乳糖基转移酶,以催化Gal残基从UDP-Gal透过α糖苷键或β糖苷键转移至多糖受体上。半乳糖基转移酶可被发现自但不限于GT2、GT6、GT8、GT25及GT92之CAZy家族。葡萄糖基转移酶为一种糖基转移酶,其自UDP-葡萄糖(UDP-Glc)供体转移葡萄糖(Glc)基至多糖受体上。葡萄糖基转移酶包括α-葡萄糖基转移酶、β-葡萄糖基转移酶、β-1,2-葡萄糖基转移酶、β-1,3-葡萄糖基转移酶及β-1,4-葡萄糖基转移酶,以催化Glc残基从UDP-Glc透过α糖苷键或β糖苷键转移至多糖受体上。葡萄糖基转移酶可被发现自但不限于GT1、GT4及GT25之CAZy家族。甘露糖基转移酶为一种糖基转移酶,其自GDP-甘露糖(GDP-Man)供体转移甘露糖(Man)基至多糖受体上。甘露糖基转移酶包括α-1,2-甘露糖基转移酶、α-1,3-甘露糖基转移酶及α-1,6-甘露糖基转移酶,以催化Man残基从GDP-Man透过α糖苷键转移至多糖受体上。甘露糖基转移酶可被发现自但不限于GT22、GT39、GT62及GT69之CAZy家族。N-乙酰葡萄糖胺转移酶为一种糖基转移酶,其自UDP-N-乙酰葡萄糖胺(UDP-GlcNAc)供体转移N-乙酰葡萄糖胺(GlcNAc)基至多糖受体上。N-乙酰葡萄糖胺转移酶可被发现自但不限于GT2及GT4之CAZy家族。N-乙酰半乳糖胺转移酶为一种糖基转移酶,其自UDP-N-乙酰半乳糖胺(UDP-GalNAc)供体转移N-乙酰半乳糖胺(GalNAc)基至多糖受体上。N-乙酰半乳糖胺转移酶可被发现自但不限于GT7及GT12及GT27之CAZy家族。N-乙酰甘露糖胺转移酶为一种糖基转移酶,其自UDP-N-乙酰甘露糖胺(UDP-ManNAc)供体转移N-乙酰甘露糖胺(ManNAc)基至多糖受体上。木糖基转移酶为一种糖基转移酶,其自UDP-木糖(UDP-Xyl)供体转移木糖(Xyl)残基至多糖受体上。木糖基转移酶可被发现自但不限于GT14及GT61及GT77之CAZy家族。葡萄糖醛酸转移酶为一种糖基转移酶,其自UDP-葡萄糖醛酸盐供体透过α糖苷键或β糖苷键转移葡萄糖醛酸盐至多糖受体上。葡萄糖醛酸转移酶可被发现自但不限于GT4、GT43及GT93之CAZy家族。半乳糖醛酸转移酶为一种糖基转移酶,其自UDP-半乳糖醛酸盐供体转移半乳糖醛酸盐至多糖受体上。N-羟乙酰神经氨酸转移酶为一种糖基转移酶,其自CMP-N-羟乙酰神经氨酸(CMP-N-glycolylneuraminic acid,CMP-Neu5Gc)供体转移N-羟乙酰神经氨酸(Neu5Gc)至多糖受体上。鼠李糖基转移酶为一种糖基转移酶,其自GDP-鼠李糖供体转移鼠李糖残基至多糖受体上。鼠李糖基转移酶可被发现自但不限于GT1、GT2及GT102之CAZy家族。N-乙酰鼠李糖胺转移酶为一种糖基转移酶,其自UDP-N-乙酰基-L-鼠李糖胺供体转移N-乙酰鼠李糖胺残基至多糖受体上。UDP-4-氨基-4,6-二脱氧基-N-乙酰基-β-L-阿卓糖胺转氨酶为一种糖基转移酶,其利用UDP-2-乙酰氨基-2,6-二脱氧基-L-阿拉伯糖-4-己酮糖(UDP-2-acetamido-2,6-dideoxy--L-arabino-4-hexulose)于伪氨基酸(pseudaminic acid)生化合成中,所述伪氨基酸为一种类似唾液酸之糖类,且可用以修饰鞭毛蛋白(flagellin)。岩藻糖胺转移酶为一种糖基转移酶,其自dTDP-N-乙酰岩藻糖胺或UDP-N-乙酰岩藻糖胺供体转移N-乙酰岩藻糖胺残基至多糖受体上。
用语「半乳糖苷β-1,3-N-乙酰葡萄糖胺转移酶(galactoside beta-1,3-N-acetylglucosaminyltransferase)」,指涉一种糖基转移酶,其可以自UDP-GlcNAC透过β-1,3键结转移N-乙酰葡萄糖胺(GlcNAc)残基至乳糖末端的半乳糖残基上。
本文可以互相替换使用之「核苷酸糖(nucleotide-sugar)」、「活化糖(activatedsugar)」或「核苷(nucleoside)」等词,指涉单糖之活化型态。活化单糖之范例包括但不限于:UDP-N-乙酰葡萄糖胺(UDP-GlcNAc)、UDP-N-乙酰半乳糖胺(UDP-GalNAc)、UDP-N-乙酰甘露糖胺(UDP-ManNAc)、UDP-葡萄糖(UDP-Glc)、UDP-半乳糖(UDP-Gal)、GDP-甘露糖(GDP-Man)、UDP-葡萄糖醛酸盐、UDP-半乳糖醛酸盐、UDP-2-乙酰氨基-2,6-二脱氧基-L-阿拉伯糖-4-己酮糖、UDP-2-乙酰氨基-2,6-二脱氧基-L-木糖-4-己酮糖(UDP-2-acetamido-2,6-dideoxy-L-lyxo-4-hexulose)、UDP-N-乙酰基-L-鼠李糖胺(UDP-L-RhaNAc或UDP-2-乙酰氨基-2,6-二脱氧基-L-甘露糖(UDP-2-acetamido-2,6-dideoxy-L-mannose))、dTDP-N-乙酰岩藻糖胺、UDP-N-乙酰岩藻糖胺(UDP-L-FucNAc或UDP-2-乙酰氨基-2,6-二脱氧基-L-半乳糖)、UDP-N-乙酰-L-脱氧塔罗糖胺(UDP-N-acetyl-L-pneumosamine)(UDP-L-PneNAC或UDP-2-乙酰氨基-2,6-二脱氧基-L-塔罗糖(UDP-2-acetamido-2,6-dideoxy-L-talose))、UDP-N-乙酰胞壁酸(UDP-N-acetylmuramic acid)、UDP-N-乙酰基-L-奎诺糖胺(UDP-N-acetyl-L-quinovosamine)(UDP-L-QuiNAc或UDP-2-乙酰氨基-2,6-二脱氧基-L-葡萄糖(UDP-2-acetamido-2,6-dideoxy-L-glucose))、GDP-L-奎诺糖(GDP-L-quinovose)、CMP-唾液酸(CMP-Neu5Ac或CMP-N-乙酰神经氨酸)、CMP-N-羟乙酰神经氨酸(CMP-Neu5Gc)、GDP-岩藻糖、GDP-鼠李糖及UDP-木糖。核苷酸糖在糖化作用中作为糖基供体。糖化作用系由糖基转移酶所催化之反应。
本文使用之「单糖(monosaccharide)」用语,指涉一种无法透过水解分解为更简单的糖之糖类,且被归类为醛糖(aldose)或酮糖(ketose),其每一分子并包含一或多个羟基。单糖为仅包含一简单糖之糖类。单糖之范例包括:己糖、D-葡萄吡喃糖、D-半乳呋喃糖、D-半乳吡喃糖、L-半乳吡喃糖、D-甘露吡喃糖、D-阿洛吡喃糖(D-Allopyranose)、L-阿卓吡喃糖(L-Altropyranose)、D-古洛吡喃糖(D-Gulopyranose)、L-艾杜吡喃糖(L-Idopyranose)、D-塔罗吡喃糖(D-Talopyranose)、D-核呋喃糖(D-Ribofuranose)、D-核吡喃糖(D-Ribopyranose)、D-阿拉伯呋喃糖、D-阿拉伯吡喃糖、L-阿拉伯呋喃糖、L-阿拉伯吡喃糖、D-木吡喃糖(D-Xylopyranose)、D-来苏吡喃糖(D-Lyxopyranose)、D-赤藻呋喃糖(D-Erythrofuranose)、D-异赤藻呋喃糖(D-Threofuranose)、庚糖、L-甘油-D-甘露糖-庚吡喃糖(L-glycero-D-manno-Heptopyranose(LDmanHep))、D-甘油-D-甘露糖-庚吡喃糖(D-glycero-D-manno-Heptopyranose(DDmanHep))、6-脱氧基-L-阿卓吡喃糖、6-脱氧基-D-古洛吡喃糖、6-脱氧基-D-塔罗吡喃糖、6-脱氧基-D-半乳吡喃糖、6-脱氧基-L-半乳吡喃糖、6-脱氧基-D-甘露吡喃糖、6-脱氧基-L-甘露吡喃糖、6-脱氧基-D-葡萄吡喃糖、2-脱氧基-D-阿拉伯糖-己糖、2-脱氧基-D-赤藻糖-戊糖、2,6-二脱氧基-D-阿拉伯糖-己吡喃糖、3,6-二脱氧基-D-阿拉伯糖-己吡喃糖、3,6-二脱氧基-L-阿拉伯糖-己吡喃糖、3,6-二脱氧基-D-木糖-己吡喃糖、3,6-二脱氧基-D-核糖-己吡喃糖、2,6-二脱氧基-D-核糖-己吡喃糖、3,6-二脱氧基-L-木糖-己吡喃糖、2-氨基-2-脱氧基-D-葡萄吡喃糖、2-氨基-2-脱氧基-D-半乳吡喃糖、2-氨基-2-脱氧基-D-甘露吡喃糖、2-氨基-2-脱氧基-D-阿洛吡喃糖、2-氨基-2-脱氧基-L-阿卓吡喃糖、2-氨基-2-脱氧基-D-古洛吡喃糖、2-氨基-2-脱氧基-L-艾杜吡喃糖、2-氨基-2-脱氧基-D-塔罗吡喃糖、2-乙酰氨基-2-脱氧基-D-葡萄吡喃糖、2-乙酰氨基-2-脱氧基-D-半乳吡喃糖、2-乙酰氨基-2-脱氧基-D-甘露吡喃糖、2-乙酰氨基-2-脱氧基-D-阿洛吡喃糖、2-乙酰氨基-2-脱氧基-L-阿卓吡喃糖、2-乙酰氨基-2-脱氧基-D-古洛吡喃糖、2-乙酰氨基-2-脱氧基-L-艾杜吡喃糖、2-乙酰氨基-2-脱氧基-D-塔罗吡喃糖、2-乙酰氨基-2,6-二脱氧基-D-半乳吡喃糖、2-乙酰氨基-2,6-二脱氧基-L-半乳吡喃糖、2-乙酰氨基-2,6-二脱氧基-L-甘露吡喃糖、2-乙酰氨基-2,6-二脱氧基-D-葡萄吡喃糖、2-乙酰氨基-2,6-二脱氧基-L-阿卓吡喃糖、2-乙酰氨基-2,6-二脱氧基-D-塔罗吡喃糖、D-葡萄吡喃糖醛酸(D-Glucopyranuronic acid)、D-半乳吡喃糖醛酸、D-甘露吡喃糖醛酸、D-阿洛吡喃糖醛酸、L-阿卓吡喃糖醛酸、D-古洛吡喃糖醛酸、L-古洛吡喃糖醛酸、L-艾杜吡喃糖醛酸、D-塔罗吡喃糖醛酸、唾液酸、5-氨基-3,5-二脱氧基-D-甘油-D-半乳糖壬基-2-酮糖酸(5-Amino-3,5-dideoxy-D-glycero-D-galacto-non-2-ulosonic acid)、5-乙酰氨基-3,5-二脱氧基-D-甘油-D-半乳糖壬基-2-酮糖酸(5-Acetamido-3,5-dideoxy-D-glycero-D-galacto-non-2-ulosonic acid)、5-羟乙酰氨基-3,5-二脱氧基-D-甘油-D-半乳糖壬基-2-酮糖酸(5-Glycolylamido-3,5-dideoxy-D-glycero-D-galacto-non-2-ulosonic acid)、赤藻糖醇(Erythritol)、阿拉伯糖醇、木糖醇、核糖醇、葡萄糖醇、半乳糖醇、甘露糖醇、D-核糖己基-2-酮吡喃糖(D-ribo-Hex-2-ulopyranose)、D-阿拉伯糖己基-2-酮呋喃糖(D-arabino-Hex-2-ulofuranose(D-fructofuranose))、D-阿拉伯糖己基-2-酮吡喃糖、L-木糖己基-2-酮吡喃糖、D-木糖己基-2-酮吡喃糖、D-异赤藻糖戊基-2-酮吡喃糖、D-阿卓糖庚基-2-酮吡喃糖、3-C-(羟甲基)-D-赤藻呋喃糖(3-C-(Hydroxymethyl)-D-erythofuranose)、2,4,6-三脱氧基-2,4-二氨基-D-葡萄吡喃糖(2,4,6-Trideoxy-2,4-diamino-D-glucopyranose)、6-脱氧基-3-O-甲基-D-葡萄糖(6-Deoxy-3-O-methyl-D-glucose)、3-O-甲基-D-鼠李糖、2,6-二脱氧基-3-甲基-D-核糖-己糖(2,6-Dideoxy-3-methyl-D-ribo-hexose)、2-氨基-3-O-[(R)-1-羧乙基]-2-脱氧基-D-葡萄吡喃糖(2-Amino-3-O-[(R)-1-carboxyethyl]-2-deoxy-D-glucopyranose)、2-乙酰氨基-3-O-[(R)-羧乙基]-2-脱氧基-D-葡萄吡喃糖(2-Acetamido-3-O-[(R)-carboxyethyl]-2-deoxy-D-glucopyranose)、2-羟乙酰氨基-3-O-[(R)-羧乙基]-2-脱氧基-D-葡萄吡喃糖(2-Glycolylamido-3-O-[(R)-1-carboxyethyl]-2-deoxy-D-glucopyranose)、3-脱氧基-D-来苏糖庚基-2-酮吡喃糖酸(3-Deoxy-D-lyxo-hept-2-ulopyranosaric acid)、3-脱氧基-D-甘露糖辛基-2-酮吡喃糖酸(3-Deoxy-D-manno-oct-2-ulopyranosonic acid)、3-脱氧基-D-甘油-D-半乳糖壬基-2-酮吡喃糖酸(3-Deoxy-D-glycero-D-galacto-non-2-ulopyranosonic acid)、5,7-二氨基-3,5,7,9-四脱氧基-L-甘油-L-甘露糖壬基-2-酮吡喃糖酸(5,7-Diamino-3,5,7,9-tetradeoxy-L-glycero-L-manno-non-2-ulopyranosonic acid)、5,7-二氨基-3,5,7,9-四脱氧基-L-甘油-L-阿卓糖壬基-2-酮吡喃糖酸(5,7-Diamino-3,5,7,9-tetradeoxy-L-glycero-L-altro-non-2-ulopyranosonic acid)5,7-二氨基-3,5,7,9-四脱氧基-D-甘油-D-半乳糖壬基-2-酮吡喃糖酸(5,7-Diamino-3,5,7,9-tetradeoxy-D-glycero-D-galacto-non-2-ulopyranosonicacid)、5,7-二氨基-3,5,7,9-四脱氧基-D-甘油-D-塔罗糖壬基-2-酮吡喃糖酸(5,7-Diamino-3,5,7,9-tetradeoxy-D-glycero-D-talo-non-2-ulopyranosonic acid)、2-乙酰氨基-2,6-二脱氧基-L-阿拉伯糖-4-己酮糖、2-乙酰氨基-2,6-二脱氧基-L-来苏糖-4-己酮糖、N-乙酰基-L-鼠李糖胺、N-乙酰基-D-岩藻糖胺、N-乙酰基-L-脱氧塔罗糖胺(N-acetyl-L-pneumosamine)、N-乙酰胞壁酸(N-acetylmuramic acid)、N-乙酰基-L-奎诺糖胺、葡萄糖、半乳糖、N-乙酰葡萄糖胺、葡萄糖胺、甘露糖、木糖)、N-乙酰甘露糖胺、N-乙酰神经氨酸、N-羟乙酰神经氨酸、N-乙酰半乳糖胺、半乳糖胺、岩藻糖、鼠李糖、葡萄糖醛酸(glucuronicacid)、葡萄糖酸(gluconic acid)、果糖及多元醇(polyols)。
本文使用之「寡糖(oligosaccharide)」用语,如所属技术领域中所通常理解的,指一种糖聚合物,其包含少量(一般为3至20个)简单糖(即:单糖类)。本发明所用之寡糖可以为线型结构或包括分枝。两糖单元间之链接(例如:糖苷键、乳糖苷键、葡萄糖苷键等)可以被表示为例如:1,4、1->4或(1-4),且可互相替换使用。每一单糖可以为环型(如:吡喃糖或呋喃糖型态)。寡糖可以包含α与β糖苷键两者或只包含β糖苷键。用语「多糖(glycan)」及「聚糖(polysaccharide)」可以互相替换使用,且指涉一化合物系由大量透过糖苷键连结之单糖所组成。用语多糖常用于包含多于10个单糖残基之化合物。
本文使用之「具有LN3作为核心三糖的寡糖」用语,指乳糖-N-三糖,或包含进一步糖化之乳糖-N-三糖的寡糖。所述寡糖较佳为包含选自本文上方所列名单的单糖。本发明之寡糖范例包括但不限制于Lewis型抗原寡糖及哺乳动物乳寡糖(mammalian milkoligosaccharides,MMOs),且较佳为具有LN3作为核心三糖的人乳寡糖(HMOs)。上述范例包括:乳糖-N-三糖、乳糖-N-四糖、乳糖-N-新四糖、乳糖-N-岩藻五糖I、乳糖-N-新岩藻五糖I、乳糖-N-岩藻五糖II、乳糖-N-岩藻五糖III、乳糖-N-岩藻五糖V、乳糖-N-岩藻五糖VI、乳糖-N-新岩藻五糖V、乳糖-N-二岩藻六糖I、乳糖-N-二岩藻六糖II、乳糖-N-六糖(lacto-N-hexaose,LNH)、乳糖-N-新六糖(lacto-N-neohexaose,LNnH)、对-乳糖-N-六糖(para-lacto-N-hexaose,pLNnH)、对-乳糖-N-新六糖(para-lacto-N-neohexaose,pLNH)、二岩藻糖基-乳糖-N-六糖、二岩藻糖基-乳糖-N-新六糖、乳糖-N-五糖(lacto-N-pentaose,LNP)、乳糖-N-新五糖、对乳糖-N-五糖、对乳糖-N-新五糖、乳糖-N-novo五糖I、乳糖-N-七糖、乳糖-N-新七糖、对乳糖-N-新七糖、对乳糖-N-七糖、乳糖-N-八糖(lacto-N-octaose,LNO)、乳糖-N-新八糖、异乳糖-N-八糖、对乳糖-N-八糖、异乳糖-N-新八糖、novo乳糖-N-新八糖、对乳糖-N-新八糖、异乳糖-N-九糖、novo乳糖-N-九糖、乳糖-N-九糖、乳糖-N-十糖、异乳糖-N-十糖、novo乳糖-N-十糖、乳糖-N-新十糖、唾液酸基-乳糖-N-四糖a(Sialyl-lacto-N-tetraose a)、唾液酸基-乳糖-N-四糖b、唾液酸基-乳糖-N-四糖c、唾液酸基-乳糖-N-四糖d。本发明之寡糖(即:本文所定义之具有LN3作为核心三糖的寡糖)较佳为哺乳动物乳寡糖(MMO),更佳为人乳寡糖(HMO),甚至更佳为具有LNT或LNnT作为核心四糖的HMO或MMO,甚至更佳为具有LNT或LNnT作为核心四糖的MMO,最佳为LNT或LNnT。在本发明脉络中,本发明所述寡糖亦较佳为中性的寡糖(即:所述寡糖并无源自于羧基的负电)。
本发明所用之「LNT II」、「LNT-II」、「LN3」、「乳糖-N-三糖II」、「乳糖-N-三糖」、「乳糖-N-三糖」或「GlcNAcβ1-3Galβ1-4Glc」可以互相替换使用。
本发明所用之「LNT」、「乳糖-N-四糖」、「乳糖-N-四糖」或「Galβ1-3GlcNAcβ1-3Galβ1-4Glc」可以互相替换使用。
本发明所用之「LNnT」、「乳糖-N-新四糖」、「乳糖-N-新四糖」、「新-LNT」或「Galβ1-4GlcNAcβ1-3Galβ1-4Glc」可以互相替换使用。
本发明所用之「LSTa」、「LS-四糖a」、「唾液酸基-乳糖-N-四糖a」、「唾液酸基乳糖-N-四糖a」或「Neu5Ac-a2,3-Gal-b1,3-GlcNAc-b1,3-Gal-b1,4-Glc」可以互相替换使用。
本发明所用之「LSTb」、「LS-四糖b」、「唾液酸基-乳糖-N-四糖b」、「唾液酸基乳糖-N-四糖b」或「Gal-b1,3-(Neu5Ac-a2,6)-GlcNAc-b1,3-Gal-b1,4-Glc」可以互相替换使用。
本发明所用之「LSTc」、「LS-四糖c」、「唾液酸基-乳糖-N-四糖c」、「唾液酸基乳糖-N-四糖c」、「唾液酸基乳糖-N-新四糖c(sialyllacto-N-neotetraose c)」或「Neu5Ac-a2,6-Gal-b1,4-GlcNAc-b1,3-Gal-b1,4-Glc」可以互相替换使用。
本发明所用之「LSTd」、「LS-四糖d」、「唾液酸基-乳糖-N-四糖d」、「唾液酸基乳糖-N-四糖d」、「唾液酸基乳糖-N-新四糖d(sialyllacto-N-neotetraose d)」或「Neu5Ac-a2,3-Gal-b1,4-GlcNAc-b1,3-Gal-b1,4-Glc」可以互相替换使用。
哺乳动物乳寡糖包括在泌乳之任何阶段所发现存在于乳汁中之单糖,包括人类及哺乳动物之初乳(colostrum milk),上述哺乳动物包括但不限于:乳牛(Bos Taurus)、绵羊(Ovis aries)、家山羊(Capra aegagrus hircus)、双峰骆驼(Camelus bactrianus)、马(Equus ferus caballus)、猪(Sus scropha)、家犬(Canis lupus familiaris)、日本棕熊(Ursus arctos yesoensis)、北极熊(Ursus maritimus)、日本黑熊(Ursus thibetanusjaponicus)、臭鼬(Mephitis mephitis)、冠海豹(Cystophora cristata)、亚洲象(Elephasmaximus)、非洲象(Loxodonta africana)、大食蚁兽(Myrmecophaga tridactyla)、瓶鼻海豚(Tursiops truncates)、小须鲸(Balaenoptera acutorostrata)、尤金袋鼠(Macropuseugenii)、红大袋鼠(Macropus rufus)、刷尾负鼠(Trichosurus Vulpecula)、无尾熊(Phascolarctos cinereus)、东袋鼬(Dasyurus viverrinus)、鸭嘴兽(Ornithorhynchusanatinus)。
本文使用之「途径(pathway)」,指一生物化学途径,其组成自合成本文所定义之寡糖的酶及其各别基因。上述寡糖生产途径包括但不限于:合成核苷酸活化糖(nucleotide-activated sugar)所涉及之途径,以及转移所述核苷酸活化糖至受体以形成本发明之寡糖的途径。上述途径之范例包括但不限于:岩藻糖化、唾液酸化、半乳糖化、N-乙酰葡萄糖胺化、N-乙酰半乳糖胺化、甘露糖化、N-乙酰甘露糖胺化途径。
本文使用之「岩藻糖化途径(fucosylation pathway)」,指一生物化学途径,其组成自酶及其各别基因、甘露糖-6-磷酸异构酶(mannose-6-phosphate isomerase)、磷酸甘露糖变位酶(phosphomannomutase)、甘露糖-1-磷酸鸟苷酸转移酶(mannose-1-phosphateguanyltransferase)、GDP-甘露糖-4,6-脱水酶(GDP-mannose 4,6-dehydratase)、GDP-L-岩藻糖合成酶(GDP-L-fucose synthase)及/或再利用途径(salvage pathway)之L-岩藻糖激酶/GDP-岩藻糖焦磷酸化酶(L-fucokinase/GDP-fucose pyrophosphorylase),并结合岩藻糖基转移酶,以形成α1,2、α1,3、α1,4或α1,6之岩藻糖化寡糖。
本文使用之「唾液酸化途径(sialylation pathway)」,指一生物化学途径,其组成自酶及其各别基因、L-谷氨酸-D-果糖-6-磷酸氨基转移酶(L-glutamine—D-fructose-6-phosphate aminotransferase)、葡萄糖胺-6-磷酸去氨酶(glucosamine-6-phosphatedeaminase)、磷酸葡萄糖胺变位酶(phosphoglucosamine mutase)、N-乙酰葡萄糖胺-6-磷酸去乙酰酶(N-acetylglucosamine-6-phosphate deacetylase)、N-乙酰葡萄糖胺表异构酶(N-acetylglucosamine epimerase)、UDP-N-乙酰葡萄糖胺2-表异构酶(UDP-N-acetylglucosamine 2-epimerase)、N-乙酰葡萄糖胺-6-磷酸2-表异构酶(N-acetylglucosamine-6-phosphate 2-epimerase)、葡萄糖胺-6-磷酸N-乙酰基转移酶(Glucosamine 6-phosphate N-acetyltransferase)、N-乙酰葡萄糖胺-6-磷酸磷酸酶(N-AcetylGlucosamine-6-phosphate phosphatase)、N-乙酰甘露糖胺-6-磷酸磷酸酶(N-acetylmannosamine-6-phosphate phosphatase)、N-乙酰甘露糖胺激酶(N-acetylmannosamine kinase)、磷酸乙酰葡萄糖胺变位酶(phosphoacetylglucosaminemutase)、N-乙酰葡萄糖胺-1-磷酸尿苷酰转移酶(N-acetylglucosamine-1-phosphateuridyltransferase)、葡萄糖胺-1-磷酸乙酰基转移酶(glucosamine-1-phosphateacetyltransferase)、唾液酸合成酶(sialic acid synthase)、N-乙酰神经氨酸解离酶(N-acetylneuraminate lyase)、N-酰基神经氨酸-9-磷酸合成酶(N-acylneuraminate-9-phosphate synthase)、N-酰基神经氨酸-9-磷酸磷酸酶(N-acylneuraminate-9-phosphatephosphatase)及/或CMP-唾液酸合成酶(CMP-sialic acid synthase),并结合唾液酸转移酶,以形成α2,3、α2,6、α2,8之唾液酸化寡糖。
本文使用之「半乳糖化途径(galactosylation pathway)」,指一生物化学途径,其组成自酶及其各别基因、半乳糖-1-表异构酶(galactose-1-epimerase)、半乳糖激酶(galactokinase)、葡萄糖激酶(glucokinase)、半乳糖-1-磷酸尿苷酰转移酶(galactose-1-phosphate uridylyltransferase)、UDP-葡萄糖4-表异构酶(UDP-glucose 4-epimerase)、葡萄糖-1-磷酸尿苷酰转移酶(glucose-1-phosphate uridylyltransferase)及/或葡萄磷酸变位酶(glucophosphomutase),并结合半乳糖基转移酶,以在单、双或寡糖的2、3、4、6羟基上形成α或β键结之半乳糖。
本文使用之「N-乙酰葡萄糖胺化途径(N-acetylglucosaminylation pathway)」,指一生物化学途径,其组成自酶及其各别基因、L-谷氨酸-D-果糖-6-磷酸氨基转移酶、葡萄糖胺-6-磷酸去氨酶、磷酸葡萄糖胺变位酶、N-乙酰葡萄糖胺-6-磷酸去乙酰酶、葡萄糖胺-6-磷酸N-乙酰转移酶、N-乙酰葡萄糖胺-1-磷酸尿苷酰转移酶、葡萄糖胺-1-磷酸乙酰基转移酶及/或葡萄糖胺-1-磷酸乙酰基转移酶,并结合糖基转移酶,以在单、双或寡糖的3、4、6羟基上形成α或β键结之N-乙酰葡萄糖胺。
本文使用之「N-乙酰半乳糖胺化途径(N-acetylgalactosylation pathway)」,指一生物化学途径,其组成自酶及其各别基因、L-谷氨酸-D-果糖-6-磷酸氨基转移酶、磷酸葡萄糖胺变位酶、N-乙酰葡萄糖胺1-磷酸尿苷酰转移酶(N-acetylglucosamine 1-phosphateuridylyltransferase)、UDP-N-乙酰葡萄糖胺4-表异构酶(UDP-N-acetylglucosamine 4-epimerase)、UDP-半乳糖4-表异构酶(UDP-galactose 4-epimerase)N-乙酰半乳糖胺激酶(N-acetylgalactosamine kinase)及/或UDP-N-乙酰半乳糖胺焦磷酸化酶(UDP-GalNAcpyrophosphorylase),并结合糖基转移酶,以在单、双或寡糖上形成α或β键结之N-乙酰半乳糖胺。
本文使用之「甘露糖化途径(mannosylation pathway)」,指一生物化学途径,其组成自酶及其各别基因、甘露糖-6-磷酸异构酶、磷酸甘露糖变位酶(phosphomannomutase)及/或甘露糖-1-鸟苷酸转移酶,并结合糖基转移酶,以在单、双或寡糖上形成α或β键结之甘露糖。
本文使用之「N-乙酰甘露糖胺化途径(N-acetylmannosinylation pathway)」,指一生物化学途径,其组成自酶及其各别基因、L-谷氨酸-D-果糖-6-磷酸氨基转移酶、葡萄糖胺-6-磷酸去氨酶、磷酸葡萄糖胺变位酶、N-乙酰葡萄糖胺-6-磷酸去乙酰酶、葡萄糖胺-6-磷酸N-乙酰基转移酶、N-乙酰葡萄糖胺-1-磷酸尿苷酰转移酶、葡萄糖胺-1-磷酸乙酰基转移酶、葡萄糖胺-1-磷酸乙酰基转移酶、UDP-GlcNAc 2-表异构酶(UDP-GlcNAc 2-epimerase)及/或N-乙酰甘露糖胺激酶(ManNAc kinase),并结合糖基转移酶,以在单、双或寡糖上形成α或β键结之N-乙酰甘露糖胺。
本文使用之「膜蛋白(membrane protein)」,指一蛋白质,其为细胞膜的一部分或与细胞膜相互作用,并控制分子及讯息流过细胞。因此,膜蛋白参与了运输,不论是输入或输出细胞。
上述膜蛋白可以为转运蛋白分类数据库(Transporter ClassificationDatabase,TCDB)所定义的运输蛋白(porters)、P-P键水解驱动转运蛋白(P-P-bond-hydrolysis-driven transporters)或β-桶状孔蛋白(β-Barrel Porins),上述数据库系由Saier Lab Bioinformation Group(可得于:www.tcdb.org)所营运及规划,且其提供膜运输蛋白功能上及亲缘关系上的分类。所述转运蛋白分类数据库为膜运输蛋白叙明了一种IUBMB核准的全面分类,此分类被称为转运蛋白分类系统(Transporter classificationsystem,TC system)。本文所述之TCDB分类搜寻系由2019年6月17日所发布之TCDB.org所定义。
运输蛋白(porters)为运用载体媒介方式(carrier-mediated process)之单向运输蛋白(uniporters)、同向运输蛋白(symporters)及反向运输蛋白(antiporters)的总称(Saier等人,Nucleic Acids Res.44(2016)D372-D379)。上述运输蛋白属于电化学电位驱动转运蛋白,并亦被称作二级载体型促进者(secondary carrier-type facilitators)。膜蛋白被包含于上述分类中,当其在单一物质透过促进性扩散时,或假设溶质带电而透过细胞膜电位依赖型运输时,利用载体媒介方式催化单向运输;在二或多个物质被以紧密链接(但除化学渗透能外不以直接能量形式连结)方式往相反方向运输时,利用载体媒介方式催化反向运输;及/或在二或多个物质被以紧密链接(但除化学渗透能外不以直接能量形式连结)方式往相同方向运输时,利用载体媒介方式催化同向运输(Forrest等人,Biochim.Biophys.Acta 1807(2011)167-188)。上述运输系统通常为立体专一性(stereospecific)。溶质逆向运输(solute countertransport)为二级载体之性质特征。运输蛋白及酶之动态联结形成功能上的膜运输代谢群组(metabolons),且通常引导源自细胞外液之底物直接进入其细胞代谢中(Moraes与Reithmeier,Biochim.Biophys.Acta 1818(2012),2687-2706)。透过此运输蛋白系统运输之溶质包括但不限于:阳离子、有机阴离子、非有机阴离子、核苷、氨基酸、多元醇、磷酸糖解化之中间产物、渗透剂(osmolytes)、螯铁蛋白(siderophores)。
膜蛋白被包含于P-P键水解驱动转运蛋白分类中,倘其水解非有机焦磷酸盐、ATP或另一核苷三磷酸之双磷酸键,以驱动主动摄取或排出溶质(Saier等人,Nucleic AcidsRes.44(2016)D372-D379)。上述膜蛋白可能或可能未被短暂磷酸化,但底物未被磷酸化。透过此P-P键水解驱动转运蛋白运输之底物包括但不限于:阳离子、重金属、β-葡聚糖(β-glucan)、UDP-葡萄糖、脂多糖、磷壁酸(teichoic acid)。
源自跨膜孔之β-桶状孔蛋白通常允许溶质以能量独立之方式跨越细胞膜。此些蛋白的跨膜部分专属为行程β-桶状的β-链(β-strand)(Saier等人,Nucleic Acids Res.44(2016)D372-D379)。上述孔状蛋白被发现于革兰氏阴性菌、粒线体、质粒(plastid)的外膜,及可能于抗酸性格兰氏阳性菌的外膜。透过此β-桶状孔蛋白运输之底物包括但不限于:核苷、棉子糖(raffinose)、葡萄糖、β-葡萄糖苷(beta-glucosides)、寡糖。
「致能排出(enabled efflux)」用语,表示引发溶质跨越细胞质膜及/或细胞壁之运输活动。所述运输可能透过引发及/或提升本发明所述转运蛋白之表达而被赋予。「强化排出(enhanced efflux)」用语,表示改良底物跨越细胞膜及/或细胞壁之运输活动。所述运输可能透过引发及/或提升本发明所述之转运蛋白的表达而被强化。所述蛋白的「表达」,在编码转运蛋白的基因系内源基因时,被定义为「过表达」;在编码转运蛋白的基因系野生型菌株不存在的异源基因时,被定义为「表达」。
本文使用之「细胞生产指数(cell productivity index,CPI)」,指重组细胞所产生的产物质量除以培养所产生的重组细胞质量。
本文使用于指涉具有LN3作为核心三糖的寡糖之「非天然的(non-native)」用语,表示所述寡糖为非自然产生,或与藉由细胞自然产生的量不同,且所述细胞为经基因修饰以具有产生所述寡糖的能力,或可以产生较多所述寡糖。
「纯化的(purified)」用语,指物质实质上或基本上不含干扰生物分子活性的成分。对于细胞、糖类、核酸及多肽而言,「纯化的」指物质实质上或基本上不含于自然状态下通常被发现伴随于所述物质的成分。一般而言,本发明纯化的糖类、寡糖、蛋白质或核酸,藉由测量银染胶片(silver stained gel)之谱带强度(band intensity)或其他方法测定纯度时,具有至少约50%、55%、60%、65%、70%、75%、80%或85%之纯度,且通常具有至少约90%、91%、92%、93%、94%、95%、96%、97%、98%或99%之纯度。纯度及均质性(homogeneity)可以透过所述技术领域所熟知之复数个方式测定,例如蛋白质或核酸样本之聚丙烯酰胺胶体电泳,再透过染色可视化。为了某些需要高分辨率之目的,会运用HPLC或相似之方法进行纯化。对于寡糖,可以透过包括但不限于:薄层层析、气相层析、NMR、HPLC、毛细管电泳或质谱法等方法测定纯度。
「培养(cultivation)」用语,指细胞被培养或发酵的培养培养基、细胞本身以及细胞在整个肉汤(broth)中产生之具有LN3作为核心多糖的寡糖,即:在细胞里面(胞内)或外面(胞外)。
本文使用之「前驱物(precursor)」,指被细胞摄取或合成以用于产生依据本发明之寡糖之物质。在此情况下,前驱物可以为本文所定义之受体,但也可以为先在细胞中修改以作为生化合成寡糖路径一部分的另一物质或代谢物。所述前驱物之范例包括本文所定义之受体,及/或葡萄糖、半乳糖、果糖、甘油、唾液酸、岩藻糖、甘露糖、麦芽糖、蔗糖、乳糖、葡萄糖-1-磷酸、半乳糖-磷酸、UDP-葡萄糖、UDP-半乳糖、葡萄糖-6-磷酸、果糖-6-磷酸、果糖-1,6-二磷酸、甘油-3-磷酸、二羟丙酮、甘油醛-3-磷酸、二羟丙酮磷酸、葡萄糖胺-6-磷酸、葡萄糖胺、N-乙酰基-葡萄糖胺-6-磷酸、N-乙酰基-葡萄糖胺、N-乙酰基-甘露糖胺、N-乙酰基甘露糖胺-6-磷酸、UDP-N-乙酰葡萄糖胺、N-乙酰葡萄糖胺-1-磷酸、N-乙酰神经氨酸(唾液酸)、N-乙酰基-神经氨酸-9-磷酸、CMP-唾液酸、甘露糖-6-磷酸、甘露糖-1-磷酸、GDP-甘露糖、GDP-4-脱氢-6-脱氧基-α-D-甘露糖(GDP-4-dehydro-6-deoxy-α-D-mannose)及/或GDP-岩藻糖。
视需要而定地,细胞转化成包括至少一核酸序列,以编码选自下列所组成之蛋白群组:乳糖运输蛋白、N-乙酰神经氨酸运输蛋白、岩藻糖运输蛋白、核苷酸活化糖之运输蛋白(transporter for a nucleotide-activated sugar),其中所述运输蛋白内化于添加合成本发明之寡糖之前驱物的介质中。
本文使用之「受体(acceptor)」,指可以被糖基转移酶修饰的单、双或寡糖。此些受体的范例包括:葡萄糖、半乳糖、果糖、甘油、唾液酸、岩藻糖、甘露糖、麦芽糖、蔗糖、乳糖、乳糖-N-三糖、乳糖-N-四糖(LNT)、乳糖-N-新四糖(LNnT)、乳糖-N-五糖(LNP),乳糖-N-新五糖、对乳糖-N-五糖、对乳糖-N-新五糖、乳糖-N-novo五糖I、乳糖-N-六糖(LNH)、乳糖-N-新六糖(LNnH)、对乳糖-N-新六糖(pLNnH)、对乳糖-N-六糖(pLNH)、乳糖-N-七糖、乳糖-N-新七糖、对乳糖-N-新七糖、对乳糖-N-七糖、乳糖-N-八糖(LNO)、乳糖-N-新八糖、异乳糖-N-八糖、对乳糖-N-八糖、异乳糖-N-新八糖、novo乳糖-N-新八糖、对乳糖-N-新八糖、异乳糖-N-九糖、novo乳糖-N-九糖、乳糖-N-九糖、乳糖-N-十糖、异乳糖-N-十糖、novo乳糖-N-十糖、乳糖-N-新十糖、及包含一或多个N-乙酰乳糖胺单元及/或一或多个乳糖-N-双糖(lacto-N-biose)单元的寡糖,或寡糖的中间物,或上述之岩藻糖化或唾液酸化物。
发明详细说明
在一第一态样中,本发明提供一用于如于此所定义之包括LN3作为核心三糖之寡糖之产生之代谢工程的细胞。于此,所提供之代谢工程的细胞其包括一半乳糖苷-β-1,3-N-乙酰葡萄糖胺转移酶(galactoside beta-1,3-N-acetylglucosaminyltransferase)的至少一核酸序列,此半乳糖苷-β-1,3-N-乙酰葡萄糖胺转移酶自一UDP-GlcNAc供体转移一N-乙酰葡萄糖胺(GlcNAc)残基至一乳糖受体上,从而合成LN3,且其更包括(i)一内源膜蛋白的过表达及/或(ii)一异源膜蛋白的表达,提供一包括LN3作为一核心三糖的寡糖的经改良的生产及/或经启动及/或经提升的排出。所述细胞可更包括编码一糖基转移酶(glycosyltransferase)的至少一核酸序列,所述糖基转移酶具有修饰所述LN3成一包括LN3作为核心三糖之寡糖的能力。
根据一第二态样,本发明提供一藉由一基因修饰细胞产生一具有LN3作为一核心三糖的寡糖的方法。此方法包括步骤:
1)提供一具有产生一具有LN3作为一核心三糖的寡糖的能力的细胞,所述细胞包括一半乳糖苷-β-1,3-N-乙酰葡萄糖胺转移酶(galactoside beta-1,3-N-acetylglucosaminyltransferase)的至少一核酸序列,此半乳糖苷-β-1,3-N-乙酰葡萄糖胺转移酶自一UDP-GlcNAc供体转移一N-乙酰葡萄糖胺(GlcNAc)残基至一乳糖受体上,从而合成LN3,所述细胞更包括i)一内源膜蛋白,更特别是,一涉及一具有LN3作为一核心三糖的寡糖之生产及/或排出的内源膜蛋白,甚至更特别是,一启动及/或提升一具有LN3作为一核心三糖的寡糖的生产及/或启动及/或提升一具有LN3作为一核心三糖的寡糖的排出的内源膜蛋白的过表达,及/或ii)一异源膜蛋白的表达,更特别是,一涉及一具有LN3作为一核心三糖的寡糖之生产与排出的异源膜蛋白,甚至更特别是,一启动及/或提升一具有LN3作为一核心三糖的寡糖的生产及/或启动及/或提升一具有LN3作为一核心三糖的寡糖的排出的异源膜蛋白的表达,与
2)在允许产生所需具有LN3作为一核心三糖的寡糖之条件下,培养此细胞于一培养基中。
在整个申请中,除非另有说明,动词「培养(cultivate)」(及其动词变化形式)与「培养(culture)」在本发明的上下文中可互换使用。
在本发明的上下文中,较佳为本发明所述内源膜蛋白及/或所述异源膜蛋白不是乳糖通透酶(lactose permease)(例如由lacy基因或lac12基因所编码),较佳为其中所述乳糖通透酶系以序列识别号52呈现。然而,此较佳实施例不排除在本发明的细胞中存在乳糖渗透酶。该技术领域中具有通常知识者理解,根据本发明的所述细胞(过表达内源膜蛋白及/或表达异源膜蛋白)可以通过乳糖通透酶(例如,序列识别号52)的引入及/或过表达另外被基因修饰以将乳糖输入细胞中如于此进一步描述的。
较佳为,所述细胞更包括编码具修饰所述LN3之能力的糖基转移酶的至少一核酸序列。
较佳为,具有具有LN3作为一核心三糖的寡糖系从培养物(cultivation)被分离,如于此所解释。
在本发明的范围内,允许条件被理解为与物理或化学参数相关的条件,包括但不限于温度、pH、压力、渗透压语产物/前驱物/受体浓度。
在一特别实施例中,允许的条件可能包括30+/-20摄氏度的温度范围,7+/-3的pH范围。
在本发明的方法及/或细胞的一个较佳实施例中,代谢工程细胞以基因表达模块(modules)修饰,其中来自任何一种所述表达模块的表达是组成型(constitutive)的或可调节的(tuneable)。所述表达模块也已知为转录单元并且包括用于重组基因之表达的多核苷酸,其包括编码基因序列与可操作地连接到编码基因的适当的转录及/或翻译控制讯号。所述控制讯号包括启动子序列、非翻译区、核糖体结合位点、终止子序列。所述表达模块可以包含用于一单一重组基因之表达的要素,但也可以包含用于表达更多重组基因之表达的要素或可以被组织成用以两个或更多个重组基因之整合表达的操纵子结构(operonstructure)。所述多核苷酸可使用本领域熟知的技术藉由重组DNA技术产生。该技术领域中具有通常知识者熟知的构建表达模块的方法包括,例如,体外重组DNA技术、合成技术与体内基因重组。参见,例如于Sambrook et al.(2001)Molecular Cloning:a laboratorymanual,3rd Edition,Cold Spring Harbor Laboratory Press,CSH,New York or toCurrent Protocols in Molecular Biology,John Wiley and Sons,N.Y.(1989及每年更新)中所描述的技术。
根据本发明的一较佳实施例,以一种或更多之表达模块修饰细胞。表达模块可以整合到所述细胞的基因体中,或者可以在载体上呈递给所述细胞。所述载体可以以质粒(plasmid)、黏接质体(cosmid)、噬菌体(phage)、脂质体(liposome)或病毒(virus)的形式存在,其将被稳定地转形(transformed)/转染(transfected)到所述代谢工程细胞中。此类载体尤其包括染色体、游离基因体(episomes)与病毒衍生的载体,例如来自细菌质粒、来自噬菌体、来自转座子(transposons)、来自酵母游离基因体、来自插入要素(insertionelements)、来自酵母染色体要素(chromosomal elements)、来自病毒的载体,以及来自其组合之载体,例如衍生自质粒与噬菌体基因要素(genetic elements)的那些,例如黏接质体和噬菌粒。这些载体可以包含选择标记,例如但不限于抗生素标记、营养缺陷(auxotrophic)标记、毒素-抗毒素标记、RNA有义(sense)/反义(antisense)标记。表达系统构建体可以包含调节以及引起表达的控制区。一般而言,任何适合在宿主中维持、繁殖或表达多核苷酸和/或表达多肽的系统或载体均可用于这方面的表达。合适的DNA序列可以藉由多种周知的常规技术之的任何一种插入到表达系统中,例如Sambrook et al.所述的那些,参见上文。对于重组生产,可以对细胞进行基因修饰以引入本发明的表达系统或其部分或多核苷酸。可以藉由许多标准实验室手册例如Davis et al.,分子生物学的基本方法,(1986)与前方Sambrook et al.,1989,中描述的方法来造成多核苷酸至细胞的引入。
如于此所使用,表达模块包含用于至少一重组基因之表达的多核苷酸。所述重组基因涉及在所述糖基化产物的合成中起作用的多肽的表达;或所述重组基因与所述宿主细胞中不参与所述糖基化产物之合成的其他途径相连。所述重组基因编码具有修饰的表达或活性的内源蛋白,较佳为,所述内源蛋白是过表达的;或所述重组基因编码异源蛋白,所述异源蛋白被异源引入所述修饰细胞中并表达,较佳为过表达。内源蛋白质可以在也表达异源蛋白质的细胞中具有经修饰的表达。
根据本发明的较佳实施例,所述表达模块中的每一个的表达是组成型或可调节的,如于此所定义。
根据本发明的方法及/或细胞的一较佳实施例,细胞被代谢工程以包括用于于此所定义之具有LN3作为一核心三糖的寡糖之产生的途径。在一更进一步之较佳实施例中,细胞包括一具有将乳糖或中间体修饰成LN3之能力的重组半乳糖苷-β-1,3-N-乙酰葡萄糖胺转移酶。在一甚至更一进一步较佳实施例中,细胞包括另一具有将LN3或LN3的衍生物修饰成具有LN3作为一核心三糖的寡糖的重组糖基转移酶的能力。
在此方法及/或细胞的另一较佳实施例中,该细胞被基因修饰以表达UDP-GlcNAc的重新(de novo)合成。UDP-GlcNAc可由一细胞中表达的酶或由细胞之代谢提供。这种产生UDP-GlcNAc的细胞可以表达例如,将要添加到细胞的GlcNAc转化成UDP-GlcNAc的酶。这些酶可为来自包括智人、大肠杆菌之几个物种之一N-乙酰基-D-葡糖胺激酶(N-acetyl-D-glucosamine kinase)、一N-乙酰基葡糖胺-6-磷酸脱乙酰酶(N-acetylglucosamine-6-phosphate deacetylase)、一磷酸葡糖胺变位酶(phosphoglucosamine mutase)与一N-乙酰基葡糖胺-1-磷酸尿苷基转移酶/葡糖胺-1-磷酸乙酰转移酶(N-acetylglucosamine-1-phosphate uridyltransferase/glucosamine-1-phosphate acetyltransferase)。较佳为,细胞被修饰以产生UDP-GlcNAc。更佳为,细胞被修饰以提升UDP-GlcNAc的产生。所述修饰可为选自包括一N-乙酰葡萄糖胺-6-磷酸脱乙酰酶的敲除、一L-谷氨酰胺-D-果糖-6-磷酸氨基转移酶(L-glutamine—D-fructose-6-phosphate aminotransferase)的过表达、一磷酸葡萄糖胺变位酶(phosphoglucosamine mutase)的过表达与一N-乙酰葡萄糖胺-1-磷酸尿苷基转移酶/葡萄糖胺-1-磷酸乙酰转移酶的过表达之群组的任一种或更多种。
另外或替代地,与此使用的宿主细胞视需要而定地被基因修饰以藉由一乳糖渗透酶的引入及/或过表达将乳糖输入细胞中。所述乳糖渗透酶例如由lacY基因或lac12基因所编码。
根据本发明的方法及/或细胞,细胞表达一膜蛋白。膜蛋白是具有经修饰表达的内源蛋白,较佳为所述内源蛋白是过表达的;或者膜蛋白是异源蛋白,其可以被细胞异源表达。然后将异源表达的膜蛋白引入并表达,较佳为过表达。在另一实施例中,内源蛋白可以在也表达异源膜蛋白的细胞中具有经修饰的表达。在另一实施例中,一内源性膜蛋白的修饰表达包括在所述内源性膜蛋白的相同操纵子中定位(map)及/或共享用于表达的共同控制序列的其他蛋白的惊修饰表达。在另一实施例中,膜蛋白与共享相同调节子(regulon)的终端(conterminal)蛋白一起表达。在另一个实施方案中,当膜蛋白是内膜转运蛋白(复合物)时,膜蛋白与一种或多种外膜转运蛋白一起表达。在一替代实施例中,当膜蛋白是外膜转运蛋白时,膜蛋白与一种或多种内膜蛋白一起表达。在替代实施例中,膜蛋白与一种或多种内膜蛋白和/或一种或多种外膜蛋白一起表达。根据本发明的另一个实施例,编码膜蛋白的多核苷酸适用于各个细胞或表达系统的密码子使用。
在本发明的方法及/或细胞的更进一步较佳实施例中,膜蛋白系选自运输蛋白(porters)、P-P键水解驱动转运蛋白(P-P-bond-hydrolysis-driven transporters)、及β-桶状孔蛋白(β-Barrel Porins)之群组。
在本发明的方法及/或细胞的一较佳实施例中,当膜蛋白系选自运输蛋白之群组,膜蛋白系选自-TCDB分类2.A.1.1、2.A.1.2、2.A.1.3、2.A.1.6、2.A.2.2、2.A.7.1及2.A.66之群组。
在本发明的方法及/或细胞的一替代较佳实施例中,当膜蛋白系选自运输蛋白膜蛋白之群组,膜蛋白系选自eggnog家族05E8G、05EGZ、05JHE、07QF7、07QRN、07RBJ、0814C及08N8A之群组。
在本发明的方法及/或细胞的另一较佳实施例中,当膜蛋白系选自运输蛋白膜蛋白之群组,膜蛋白系选自PFAM列表PF00893、PF01943、PF05977、PF07690及PF13347。
在本发明的方法及/或细胞的另一较佳实施例中,当膜蛋白系选自运输蛋白膜蛋白之群组,膜蛋白系选自interpro列表IPR000390、IPR001411、IPR001927、IPR002797、IPR004638、IPR005829、IPR010290、IPR011701、IPR020846、IPR023721、IPR023722、IPR032896、IPR036259及IPR039672。
在本发明的方法及/或细胞的另一较佳实施例中,当膜蛋白系选自运输蛋白膜蛋白之群组,膜蛋白系选自源自Cronobacter muytjensii之具有序列识别号01的MdfA、源自里根斯堡预研菌(Yokenella regensburgei)(ATCC43003)之具有序列识别号02的MdfA、源自大肠杆菌(Escherichia coli)K-12MG1655之具有序列识别号03的MdfA、源自肠杆菌属(Enterobacter sp.)之具有序列识别号04的MdfA、源自克氏柠檬酸杆菌(Citrobacterkoseri)之具有序列识别号05的MFS、源自Citrobacter youngae之具有序列识别号06的MdfA、源自大肠杆菌(Escherichia coli)K-12MG1655之具有序列识别号07的YbdA、源自源自大肠杆菌(Escherichia coli)K-12MG1655之具有序列识别号08的YjhB、源自大肠杆菌(Escherichia coli)K-12MG1655之具有序列识别号09的WzxE、源自大肠杆菌(Escherichiacoli)K-12MG1655之具有序列识别号10的EmrE、源自长双歧杆菌婴儿亚种(Bifidobacterium longum subsp.Infantis)(菌株ATCC 15697)之具有序列识别号11的Blon_2331、源自长双歧杆菌婴儿亚种(Bifidobacterium longum subsp.Infantis)(菌株ATCC 15697)之具有序列识别号12的Blon_0247、源自长双歧杆菌婴儿亚种(Bifidobacterium longum subsp.Infantis)(菌株ATCC 15697)之具有序列识别号13的Blon_0345、源自肺炎克雷伯氏菌(Klebsiella pneumoniae)之具有序列识别号14的IceT、源自阪崎肠杆菌(Cronobacter sakazakii)菌株MOD1_LR753之具有序列识别号53的MdfA、源自粉末佛朗哥氏菌(Franconibacter pulveris)LMG 24059之具有序列识别号54的MdfA、源自霍氏肠杆菌(Enterobacter hormaechei)菌株017之具有序列识别号55的MdfA、源自克氏柠檬酸杆菌(Citrobacter koseri)菌株NCTC10771之具有序列识别号56的MdfA、源自肠道沙门氏菌arizonae亚种血清型41:z4,z23:-菌株TAMU30EF之具有序列识别号57的MdfA、源自副痢疾杆菌(Shigella flexneri)菌株585219之具有序列识别号58的MdfA、源自里根斯堡预研菌(Yokenella regensburgei)菌株UMB0819之具有序列识别号59的MdfA、源自大肠杆菌(Escherichia coli)菌株AMC_967之具有序列识别号60的MdfA、源自肺炎克雷伯氏菌(Klebsiella pneumoniae)VAKPC309之具有序列识别号61的MdfA、源自产酸克雷伯氏菌(Klebsiella oxytoca)菌株4928STDY7071490之具有序列识别号62的MdfA、源自密歇根克雷伯氏菌(Klebsiella michiganensis)菌株A2之具有序列识别号63的MdfA、源自Pluralibacter gergoviae菌株FDAARGOS_186之具有序列识别号64的MdfA、源自抗坏血克吕沃尔氏菌(Kluyvera ascorbata)ATCC 33433之具有序列识别号65的MdfA、神户肠杆菌(Enterobacter kobei)之具有序列识别号66的MdfA、源自莱略特菌属(Lelliottia sp.)WB101之具有序列识别号67的MdfA、源自弗氏柠檬酸杆菌(Citrobacter freundii)之具有序列识别号68的MdfA、源自肠道沙门氏菌Salamae亚种(Salmonella entericasubsp.Salamae)之具有序列识别号69的MdfA或源自副痢疾杆菌(Shigella flexneri)之具有序列识别号70的MdfA,或以上任一运输膜蛋白之功能同源物(functional homolog)或功能性片段(functional fragment),或一蛋白质序列,其分别与具有序列识别号01、02、03、04、05、06、07、08、09、10、11、12、13、14、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69或70的膜蛋白之任一个的全长序列,具有至少80%之序列一致性(sequenceidentity)。在整个说明书与申请专利范围中,术语「具有至少80%序列一致性的蛋白质序列」较佳为替换为术语「具有至少80%序列一致性的蛋白质」或「具有至少80%序列一致性的多肽」。
在本发明的方法及/或细胞的较佳实施例中,当膜蛋白系选自运输蛋白膜蛋白之群组,膜蛋白系选自(即呈现为)序列识别号01、02、04、05、06、09、10、11、12、13、14、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69或70,或以上任一所述运输蛋白膜蛋白之功能同源物或功能性片段,或一蛋白质序列,其分别与具有序列识别号01、02、04、05、06、09、10、11、12、13、14、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69或70的所述膜蛋白之任一个的全长序列,具有至少80%、较佳为至少85%、更佳为至少90%、甚至更佳为至少95.00%、最佳为至少97.00%之序列一致性。
在本发明的方法及/或细胞的甚至更佳实施例中,当膜蛋白系选自运输蛋白膜蛋白之群组,膜蛋白系选自(即呈现为)序列识别号01、02、04、05、06、09、10、11、12、13、14、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69或70,或以上任一所述运输蛋白膜蛋白之功能同源物或功能性片段,或一蛋白质序列:
-其分别与具有序列识别号09、10、11、12或13的所述膜蛋白之任一个的全长序列,具有至少80%之序列一致性,
-其分别与具有序列识别号01、02、04、14、53、54、55、59、61、62、63、64、65、66、67或69的所述膜蛋白之任一个的全长序列,具有至少90%之序列一致性,
-其分别与具有序列识别号05、06、56、57或68的所述膜蛋白之任一个的全长序列,具有至少95%之序列一致性,或
-其分别与具有序列识别号58、60或70的所述膜蛋白之任一个的全长序列,具有至少99%之序列一致性。
在本发明的方法及/或细胞的一替代实施例中,当膜蛋白系选自运输蛋白膜蛋白膜蛋白之群组,膜蛋白系选自(即呈现为)序列识别号01、02、04、09、10、11、12、13、14、53、54、55、59、61、62、63、64、65、66、67或69,或任一所述运输蛋白膜蛋白之功能同源物或功能性片段,或一蛋白质序列,其分别与具有序列识别号序列识别号01、02、04、09、10、11、12、13、14、53、54、55、59、61、62、63、64、65、66、67或69的所述膜蛋白的全长序列,具有至少80%、较佳为至少85%、更佳为至少90%、甚至更佳为至少95.00%、最佳为至少97.00%之序列一致性。更佳为膜蛋白系选自(即呈现为)序列识别号01、02、04、09、10、11、12、13、14、53、54、55、59、61、62、63、64、65、66、67或69,或任一所述运输蛋白膜蛋白之功能同源物或功能性片段,或一蛋白质序列,其分别与具有序列识别号01、02、04、09、10、11、12、13、14、53、54、55、59、61、62、63、64、65、66、67或69的所述膜蛋白的全长序列,具有至少90%、较佳为至少95.00%、更佳为至少97.00%之序列一致性。
在本发明的方法及/或细胞的另一实施例中,当膜蛋白系选自运输蛋白膜蛋白之群组,膜蛋白系选自源自Cronobacter muytjensii之具有序列识别号01的MdfA、源自里根斯堡预研菌(Yokenella regensburgei)(ATCC43003)之具有序列识别号02的MdfA、源自大肠杆菌(Escherichia coli)K-12MG1655之具有序列识别号03的MdfA、源自肠杆菌属(Enterobacter sp.)之具有序列识别号04的MdfA、源自克氏柠檬酸杆菌(Citrobacterkoseri)之具有序列识别号05的MFS、源自Citrobacter youngae之具有序列识别号06的MdfA、源自大肠杆菌(Escherichia coli)K-12MG1655之具有序列识别号07的YbdA、源自源自大肠杆菌(Escherichia coli)K-12MG1655之具有序列识别号08的YjhB、源自大肠杆菌(Escherichia coli)K-12MG1655之具有序列识别号09的WzxE、源自大肠杆菌(Escherichiacoli)K-12MG1655之具有序列识别号10的EmrE、源自长双歧杆菌婴儿亚种(Bifidobacterium longum subsp.Infantis)(菌株ATCC 15697)之具有序列识别号11的Blon_2331、源自长双歧杆菌婴儿亚种(Bifidobacterium longum subsp.Infantis)(菌株ATCC 15697)之具有序列识别号12的Blon_0247、源自长双歧杆菌婴儿亚种(Bifidobacterium longum subsp.Infantis)(菌株ATCC 15697)之具有序列识别号13的Blon_0345、源自肺炎克雷伯氏菌(Klebsiella pneumoniae)之具有序列识别号14的IceT、源自阪崎肠杆菌(Cronobacter sakazakii)菌株MOD1_LR753之具有序列识别号53的MdfA、源自粉末佛朗哥氏菌(Franconibacter pulveris)LMG 24059之具有序列识别号54的MdfA、源自霍氏肠杆菌(Enterobacter hormaechei)菌株017之具有序列识别号55的MdfA、源自克氏柠檬酸杆菌(Citrobacter koseri)菌株NCTC10771之具有序列识别号56的MdfA、源自肠道沙门氏菌arizonae亚种血清型41:z4,z23:-菌株TAMU30EF之具有序列识别号57的MdfA、源自副痢疾杆菌(Shigella flexneri)菌株585219之具有序列识别号58的MdfA、源自里根斯堡预研菌(Yokenella regensburgei)菌株UMB0819之具有序列识别号59的MdfA、源自大肠杆菌(Escherichia coli)菌株AMC_967之具有序列识别号60的MdfA、源自肺炎克雷伯氏菌(Klebsiella pneumoniae)VAKPC309之具有序列识别号61的MdfA、源自产酸克雷伯氏菌(Klebsiella oxytoca)菌株4928STDY7071490之具有序列识别号62的MdfA、源自密歇根克雷伯氏菌(Klebsiella michiganensis)菌株A2之具有序列识别号63的MdfA、源自Pluralibacter gergoviae菌株FDAARGOS_186之具有序列识别号64的MdfA或源自抗坏血克吕沃尔氏菌(Kluyvera ascorbata)ATCC 33433之具有序列识别号65的MdfA或以上任一运输蛋白膜蛋白之功能同源物或功能性片段,或一蛋白质序列,其分别与具有序列识别号01、02、03、04、05、06、07、08、09、10、11、12、13、14、53、54、55、56、57、58、59、60、61、62、63、64或65的所述膜蛋白之任一个的全长序列,具有至少80%之序列一致性。
在本发明的方法及/或细胞的一更佳实施例中,当膜蛋白系选自运输蛋白膜蛋白之群组,膜蛋白系选自(即呈现为)序列识别号01、02、04、05、06、09、10、11、12、13、14、53、54、55、56、57、58、59、60、61、62、63、64或65,或任一所述运输蛋白膜蛋白之功能同源物或功能性片段,或一蛋白质序列,其分别与具有序列识别号01、02、04、05、06、09、10、11、12、13、14、53、54、55、56、57、58、59、60、61、62、63、64或65的所述膜蛋白的全长序列,具有至少80%具有至少80%、较佳为至少85%、更佳为至少90%、甚至更佳为至少95.00%、最佳为至少97.00%之序列一致性。
在本发明的方法及/或细胞的一甚至更佳实施例中,当膜蛋白系选自运输蛋白膜蛋白之群组,膜蛋白系选自(即呈现为)序列识别号01、02、04、05、06、09、10、11、12、13、14、53、54、55、56、57、58、59、60、61、62、63、64或65,或任一所述运输蛋白膜蛋白之功能同源物或功能性片段,或一蛋白质序列:
-其分别与具有序列识别号09、10、11、12或13的所述膜蛋白之任一个的全长序列,具有至少80%之序列一致性,
-其分别与具有序列识别号01、02、04、14、53、54、55、59、61、62、63、64或65的所述膜蛋白之任一个的全长序列,具有至少90%之序列一致性,
-其分别与具有序列识别号05、06、56或57的所述膜蛋白之任一个的全长序列,具有至少95%之序列一致性,或
-其分别与具有序列识别号58或60的所述膜蛋白之任一个的全长序列,具有至少99%之序列一致性。
在本发明的方法及/或细胞的一甚至更佳实施例中,当膜蛋白系选自运输蛋白膜蛋白之群组,膜蛋白系选自(即呈现为)序列识别号01、02、04、09、10、11、12、13、14、53、54、55、59、61、62、63、64或65,或任一所述运输蛋白膜蛋白之功能同源物或功能性片段,或一蛋白质序列,其分别与具有序列识别号01、02、04、09、10、11、12、13、14、53、54、55、59、61、62、63、64或65的所述膜蛋白的全长序列,具有至少80%、较佳为至少85%、更佳为至少90%、甚至更佳为至少95.00%、最佳为至少97.00%之序列一致性。更佳为膜蛋白系选自(即呈现为)序列识别号01、02、04、09、10、11、12、13、14、53、54、55、59、61、62、63、64或65,或任一所述运输蛋白膜蛋白之功能同源物或功能性片段,或一蛋白质序列,其分别与具有序列识别号01、02、04、09、10、11、12、13、14、53、54、55、59、61、62、63、64或65的所述膜蛋白的全长序列,具有至少90%、较佳为至少95.00%、更佳为至少97.00之序列一致性。
此类运输蛋白膜蛋白之氨基酸序列可为一序列,选自所附之序列表之序列识别号01、02、03、04、05、06、07、08、09、10、11、12、13、14、15、16、17、18、19、20、21、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69或70,较佳为选自序列识别号01、02、04、05、06、09、10、11、12、13、14、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69或70,更佳为选自序列识别号01、02、04、05、06、09、10、11、12、13、14、53、54、55、56、57、58、59、60、61、62、63、64或65,甚至更佳为选自序列识别号01、02、04、05、06、55、59、66或68,最佳为选自序列识别号01、02、04、05、06、55或59,或一氨基酸序列,其分别与具有序列识别号01、02、03、04、05、06、07、08、09、10、11、12、13、14、15、16、17、18、19、20、21、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69或70之任一个之全长氨基酸序列具有至少80%之序列一致性,80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、91.50%、92.00%、92.50%、93.00%、93.50%、94.00%、94.50%、95.00%、95.50%、96.00%、96.50%、97.00%、97.50%、98.00%、98.50%、99.00%、99.50%、99、60%、99、70%、99、80%、99、90%,较佳为至少85%、更佳为至少90%、甚至更佳为至少95.00%、最佳为至少97.00%之序列一致性。
或者,此类运输蛋白膜蛋白之氨基酸序列可为一序列,选自所附之序列表之序列识别号01、02、04、09、10、11、12、13、14、53、54、55、59、61、62、63、64、65、66、67或69,较佳为选自所附之序列表之序列识别号01、02、04、09、10、11、12、13、14、53、54、55、59、61、62、63、64或65,甚至更佳为选自01、02、04、55、59、66或68,甚至更佳为选自所附之序列表之序列识别号01、02、04、55或59,最佳为选自所附之序列表之序列识别号01、02或04,甚至更佳为选自所附之序列表之序列识别号01或02,最佳为序列识别号01,或一氨基酸序列,其分别与具有序列识别号01、02、04、09、10、11、12、13、14、53、54、55、59、61、62、63、64、65、66、67或69之任一个之全长氨基酸序列具有至少80%之序列一致性,80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、91.50%、92.00%、92.50%、93.00%、93.50%、94.00%、94.50%、95.00%、95.50%、96.00%、96.50%、97.00%、97.50%、98.00%、98.50%、99.00%、99.50%、99.60%、99.70%、99.80%、99.90%,较佳为至少85%、更佳为至少90%、甚至更佳为至少95.00%、甚至更佳为至少97.00%、最佳为至少99.00%之序列一致性。
具有与具有序列识别号01、02、04、05、06、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69或70之所述膜蛋白之任一个之全长序列具有至少80%之序列一致性之一蛋白质序列的示例性与较佳膜蛋白提供于表1。
表1
/>
在本发明的方法及/或细胞的一较佳实施例中,当膜蛋白系选自P-P键水解驱动转运蛋白之群组,膜蛋白系选自TCDB分类3.A.1.1及3.A.1.2之群组。
在本发明的方法及/或细胞的另一较佳实施例中,当膜蛋白系选自P-P键水解驱动转运蛋白之群组,膜蛋白系选自eggnog家族05CJ1、05DFW、05EZD、05I1K、07HR3及08IJ9之群组。.
在本发明的方法及/或细胞的另一较佳实施例中,当膜蛋白系选自P-P键水解驱动转运蛋白之群组,膜蛋白系选自PFAM列表PF00005、PF00528、PF13407及PF17912。
在本发明的方法及/或细胞的另一较佳实施例中,当膜蛋白系选自P-P键水解驱动转运蛋白之群组,膜蛋白系选自interpro列表IPR000515、IPR003439、IPR003593、IPR005978、IPR008995、IPR013456、IPR015851、IPR017871、IPR025997、IPR027417、IPR028082、IPR035906及IPR040582。
在本发明的方法及/或细胞的另一较佳实施例中,当膜蛋白系选自P-P键水解驱动转运蛋白之群组,膜蛋白系选自源自长双歧杆菌婴儿亚种(Bifidobacterium longumsubsp.Infantis)(菌株ATCC 15697)之具有序列识别号15的Blon_2475、源自大豆慢生根瘤菌(Bradyrhizobium japonicum)USDA 110之具有序列识别号16的nodi、源自大肠杆菌(Escherichia coli)K-12MG1655之具有序列识别号17的xylF、源自长双歧杆菌婴儿亚种(Bifidobacterium longum subsp.Infantis)Bi-26之具有序列识别号18的TIC77290、源自长双歧杆菌婴儿亚种(Bifidobacterium longum subsp.Infantis)Bi-26之具有序列识别号19的TIC77291、源自长双歧杆菌婴儿亚种(Bifidobacterium longum subsp.Infantis)Bi-26之具有序列识别号20的TIC76854 TIC77291,或以上任一P-P键水解驱动转运膜蛋白之功能同源物或功能性片段,或一蛋白质序列,其分别与具有序列识别号15、16、17、18、19或20的所述膜蛋白的任一个的全长序列,具有至少80%之序列一致性。
在本发明的方法及/或细胞的另一较佳实施例中,当膜蛋白系选自β-桶状孔蛋白(β-Barrel Porins)之群组,膜蛋白系选自TCDB分类1.B.18。
在本发明的方法及/或细胞的另一较佳实施例中,当膜蛋白系选自β-桶状孔蛋白之群组,膜蛋白系选自eggnog家族05DAY。
在本发明的方法及/或细胞的另一较佳实施例中,当膜蛋白系选自β-桶状孔蛋白之群组,膜蛋白系选自PFAM列表PF02563、PF10531及PF18412。
在本发明的方法及/或细胞的另一较佳实施例中,当膜蛋白系选自β-桶状孔蛋白之群组,膜蛋白系选自interpro列表IPR003715、IPR019554及IPR040716。
在本发明的方法及/或细胞的另一较佳实施例中,当膜蛋白系选自β-桶状孔蛋白之群组,膜蛋白系为源自大肠杆菌(Escherichia coli)K-12MG1655之具有序列识别号21的Wza或其功能同源物或功能片段,或一蛋白质序列,其与具有序列识别号21的所述膜蛋白的全长序列,具有至少80%之序列一致性。
在本发明的方法及/或细胞的一替代较佳实施例中,膜蛋白系选自TCDB分类1.B.18、2.A.1.1、2.A.1.2、2.A.1.3、2.A.1.6、2.A.2.2、2.A.7.1、2.A.66、3.A.1.1与3.A.1.2之群组;eggnog家族05CJ1、05DAY、05DFW、05E8G、05EGZ、05EZD、05I1K、05JHE、07HR3、07QF7 07QRN、07RBJ、0814C、08IJ9与08N8A之群组;PFAM列表PF00005、PF00528、PF00893、PF01943、PF02563、PF05977、PF07690、PF10531、PF13347、PF13407、PF17912与PF18412;interpro列表IPR000390、IPR000515、IPR001411、IPR001927、IPR002797、IPR003439、IPR003593、IPR003715、IPR004638、IPR005829、IPR005978、IPR008995、IPR010290、IPR011701、IPR013456、IPR015851、IPR017871、IPR019554、IPR020846、IPR023721、IPR023722、IPR025997、IPR027417、IPR028082、IPR032896、IPR035906、IPR036259、IPR039672、IPR040582与IPR040716;源自Cronobacter muytjensii之具有序列识别号01的MdfA、源自里根斯堡预研菌(Yokenella regensburgei)(ATCC43003)之具有序列识别号02的MdfA、源自大肠杆菌(Escherichia coli)K-12MG1655之具有序列识别号03的MdfA、源自肠杆菌属(Enterobacter sp.)之具有序列识别号04的MdfA、源自克氏柠檬酸杆菌(Citrobacter koseri)之具有序列识别号05的MFS、源自Citrobacter youngae之具有序列识别号06的MdfA、源自大肠杆菌(Escherichia coli)K-12MG1655之具有序列识别号07的YbdA、源自源自大肠杆菌(Escherichia coli)K-12MG1655之具有序列识别号08的YjhB、源自大肠杆菌(Escherichia coli)K-12MG1655之具有序列识别号09的WzxE、源自大肠杆菌(Escherichia coli)K-12MG1655之具有序列识别号10的EmrE、源自长双歧杆菌婴儿亚种(Bifidobacterium longum subsp.Infantis)(菌株ATCC 15697)之具有序列识别号11的Blon_2331、源自长双歧杆菌婴儿亚种(Bifidobacterium longum subsp.Infantis)(菌株ATCC 15697)之具有序列识别号12的Blon_0247、源自长双歧杆菌婴儿亚种(Bifidobacterium longum subsp.Infantis)(菌株ATCC 15697)之具有序列识别号13的Blon_0345、源自肺炎克雷伯氏菌(Klebsiella pneumoniae)之具有序列识别号14的IceT、源自阪崎肠杆菌(Cronobacter sakazakii)菌株MOD1_LR753之具有序列识别号53的MdfA、源自粉末佛朗哥氏菌(Franconibacter pulveris)LMG 24059之具有序列识别号54的MdfA、源自霍氏肠杆菌(Enterobacter hormaechei)菌株017之具有序列识别号55的MdfA、源自克氏柠檬酸杆菌(Citrobacter koseri)菌株NCTC10771之具有序列识别号56的MdfA、源自肠道沙门氏菌arizonae亚种血清型41:z4,z23:-菌株TAMU30EF之具有序列识别号57的MdfA、源自副痢疾杆菌(Shigella flexneri)菌株585219之具有序列识别号58的MdfA、源自里根斯堡预研菌(Yokenella regensburgei)菌株UMB0819之具有序列识别号59的MdfA、源自大肠杆菌(Escherichia coli)菌株AMC_967之具有序列识别号60的MdfA、源自肺炎克雷伯氏菌(Klebsiella pneumoniae)VAKPC309之具有序列识别号61的MdfA、源自产酸克雷伯氏菌(Klebsiella oxytoca)菌株4928STDY7071490之具有序列识别号62的MdfA、源自密歇根克雷伯氏菌(Klebsiella michiganensis)菌株A2之具有序列识别号63的MdfA、源自Pluralibacter gergoviae菌株FDAARGOS_186之具有序列识别号64的MdfA、源自抗坏血克吕沃尔氏菌(Kluyvera ascorbata)ATCC 33433之具有序列识别号65的MdfA、神户肠杆菌(Enterobacter kobei)之具有序列识别号66的MdfA、源自莱略特菌属(Lelliottia sp.)WB101之具有序列识别号67的MdfA、源自弗氏柠檬酸杆菌(Citrobacter freundii)之具有序列识别号68的MdfA、源自肠道沙门氏菌Salamae亚种(Salmonella entericasubsp.Salamae)之具有序列识别号69的MdfA或源自副痢疾杆菌(Shigella flexneri)之具有序列识别号70的MdfA、源自长双歧杆菌婴儿亚种
(Bifidobacterium longum subsp.Infantis)(菌株ATCC 15697)之具有序列识别号15的Blon_2475、源自大豆慢生根瘤菌(Bradyrhizobium japonicum)USDA 110之具有序列识别号16的nodi、源自大肠杆菌(Escherichia coli)K-12MG1655之具有序列识别号17的xylF、源自长双歧杆菌婴儿亚种
(Bifidobacterium longum subsp.Infantis)Bi-26之具有序列识别号18的TIC77290、源自长双歧杆菌婴儿亚种(Bifidobacterium longum subsp.Infantis)Bi-26之具有序列识别号19的TIC77291、源自长双歧杆菌婴儿亚种
(Bifidobacterium longum subsp.Infantis)Bi-26之具有序列识别号20的TIC76854 TIC77291或源自大肠杆菌(Escherichia coli)K-12MG1655之具有序列识别号21的Wza;或以上任一膜蛋白之功能同源物或功能性片段,或一蛋白质序列,其分别与具有序列识别号01、02、03、04、05、06、07、08、09、10、11、12、13、14、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、15、16、17、18、19、20或21的所述膜蛋白的任一个的全长序列,具有至少80%之序列一致性。
在本发明的方法及/或细胞的一替代较佳实施例中,膜蛋白系选自TCDB分类1.B.18、2.A.1.1、2.A.1.2、2.A.1.3、2.A.1.6、2.A.2.2、2.A.7.1、2.A.66、3.A.1.1与3.A.1.2之群组;eggnog家族05CJ1、05DAY、05DFW、05E8G、05EGZ、05EZD、05I1K、05JHE、07HR3、07QF7 07QRN、07RBJ、0814C、08IJ9与08N8A之群组;PFAM列表PF00005、PF00528、PF00893、PF01943、PF02563、PF05977、PF07690、PF10531、PF13347、PF13407、PF17912与PF18412;interpro列表IPR000390、IPR000515、IPR001411、IPR001927、IPR002797、IPR003439、IPR003593、IPR003715、IPR004638、IPR005829、IPR005978、IPR008995、IPR010290、IPR011701、IPR013456、IPR015851、IPR017871、IPR019554、IPR020846、IPR023721、IPR023722、IPR025997、IPR027417、IPR028082、IPR032896、IPR035906、IPR036259、IPR039672、IPR040582与IPR040716;源自Cronobacter muytjensii之具有序列识别号01的MdfA、源自里根斯堡预研菌(Yokenella regensburgei)(ATCC43003)之具有序列识别号02的MdfA、源自大肠杆菌(Escherichia coli)K-12MG1655之具有序列识别号03的MdfA、源自肠杆菌属(Enterobacter sp.)之具有序列识别号04的MdfA、源自克氏柠檬酸杆菌(Citrobacter koseri)之具有序列识别号05的MFS、源自Citrobacter youngae之具有序列识别号06的MdfA、源自大肠杆菌(Escherichia coli)K-12MG1655之具有序列识别号07的YbdA、源自源自大肠杆菌(Escherichia coli)K-12MG1655之具有序列识别号08的YjhB、源自大肠杆菌(Escherichia coli)K-12MG1655之具有序列识别号09的WzxE、源自大肠杆菌(Escherichia coli)K-12MG1655之具有序列识别号10的EmrE、源自长双歧杆菌婴儿亚种(Bifidobacterium longum subsp.Infantis)(菌株ATCC 15697)之具有序列识别号11的Blon_2331、源自长双歧杆菌婴儿亚种(Bifidobacterium longum subsp.Infantis)(菌株ATCC 15697)之具有序列识别号12的Blon_0247、源自长双歧杆菌婴儿亚种(Bifidobacterium longum subsp.Infantis)(菌株ATCC 15697)之具有序列识别号13的Blon_0345、源自肺炎克雷伯氏菌(Klebsiella pneumoniae)之具有序列识别号14的IceT、源自阪崎肠杆菌(Cronobacter sakazakii)菌株MOD1_LR753之具有序列识别号53的MdfA、源自粉末佛朗哥氏菌(Franconibacter pulveris)LMG 24059之具有序列识别号54的MdfA、源自霍氏肠杆菌(Enterobacter hormaechei)菌株017之具有序列识别号55的MdfA、源自克氏柠檬酸杆菌(Citrobacter koseri)菌株NCTC10771之具有序列识别号56的MdfA、源自肠道沙门氏菌arizonae亚种血清型41:z4,z23:-菌株TAMU30EF之具有序列识别号57的MdfA、源自副痢疾杆菌(Shigella flexneri)菌株585219之具有序列识别号58的MdfA、源自里根斯堡预研菌(Yokenella regensburgei)菌株UMB0819之具有序列识别号59的MdfA、源自大肠杆菌(Escherichia coli)菌株AMC_967之具有序列识别号60的MdfA、源自肺炎克雷伯氏菌(Klebsiella pneumoniae)VAKPC309之具有序列识别号61的MdfA、源自产酸克雷伯氏菌(Klebsiella oxytoca)菌株4928STDY7071490之具有序列识别号62的MdfA、源自密歇根克雷伯氏菌(Klebsiella michiganensis)菌株A2之具有序列识别号63的MdfA、源自Pluralibacter gergoviae菌株FDAARGOS_186之具有序列识别号64的MdfA、源自抗坏血克吕沃尔氏菌(Kluyvera ascorbata)ATCC 33433之具有序列识别号65的MdfA、源自长双歧杆菌婴儿亚种(Bifidobacterium longum subsp.Infantis)(菌株ATCC 15697)之具有序列识别号15的Blon_2475、源自大豆慢生根瘤菌(Bradyrhizobium japonicum)USDA 110之具有序列识别号16的nodi、源自大肠杆菌(Escherichia coli)K-12MG1655之具有序列识别号17的xylF、源自长双歧杆菌婴儿亚种(Bifidobacterium longum subsp.Infantis)Bi-26之具有序列识别号18的TIC77290、源自长双歧杆菌婴儿亚种(Bifidobacterium longumsubsp.Infantis)Bi-26之具有序列识别号19的TIC77291、源自长双歧杆菌婴儿亚种(Bifidobacterium longum subsp.Infantis)Bi-26之具有序列识别号20的TIC76854TIC77291或源自大肠杆菌(Escherichia coli)K-12MG1655之具有序列识别号21的Wza;或以上任一膜蛋白之功能同源物或功能性片段,或一蛋白质序列,其分别与具有序列识别号01、02、03、04、05、06、07、08、09、10、11、12、13、14、53、54、55、56、57、58、59、60、61、62、63、64、65、15、16、17、18、19、20或21的所述膜蛋白的任一个的全长序列,具有至少80%之序列一致性。
所述TCDB分类系由2019年6月17日发布之TCDB.org所定义。所述eggnog家族系由2016年9月发布之eggnogdb 4.5.1。所述PFAM列表系由2018年9月所发布之Pfam 32.0所定义。所述interpro列表系由2019年7月4日发布之InterPro 75.0所定义。
如于此所使用,一蛋白质,其具有与任何入列之膜蛋白之全长序列具有至少80%之序列一致性,应理解为序列与分别之膜蛋白之氨基酸序列的全长具有80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、91.50%、92.00%、92.50%、93.00%、93.50%、94.00%、94.50%、95.00%、95.50%、96.00%、96.50%、97.00%、97.50%、98.00%、98.50%、99.00%、99.50%、99.60%、99.70%、99.80%、99.90%之序列一致性。在本发明的上下文中,具有与一参考膜蛋白‘Z’(通常以序列识别号表示)之全长序列具有例如至少具有80%序列一致性之一氨基酸序列(例如,具有如在整个说明书与申请专利范围中阶露之蛋白质序列的膜蛋白)的蛋白质/多肽意指,一蛋白质(即膜蛋白),其能够运输如于此所述之一具有LN3作为一核心糖的寡糖,即此蛋白质保留了参考膜蛋白‘Z’的功能特征以运输一具有LN3作为一核心糖的寡糖。同样地,具有与一参考膜蛋白‘Z’(通常以序列识别号表示)之全长序列具有例如至少具有80%序列一致性之一蛋白质序列意指,一蛋白质(即膜蛋白),其能够运输如于此所述之一具有LN3作为一核心糖的寡糖,即此蛋白质保留了参考膜蛋白‘Z’的功能特征以运输一具有LN3作为一核心糖的寡糖。技术人员可以评估膜蛋白运输如于此所述之一具有LN3作为一核心糖的寡糖的能力,例如如目前实施例中所述。
此类膜蛋白之氨基酸序列可为一序列,其选自所附序列表之序列识别号01、02、03、04、05、06、07、08、09、10、11、12、13、14、15、16、17、18、19、20、21、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69或70,较佳为选自所附序列表之序列识别号01、02、03、04、05、06、07、08、09、10、11、12、13、14、15、16、17、18、19、20、21、53、54、55、56、57、58、59、60、61、62、63、64或65,更佳为选自所附序列表之序列识别号01、02、04、05、06、09、10、11、12、13、14、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69或70,甚至更佳为选自所附序列表之序列识别号01、02、04、05、06、09、10、11、12、13、14、53、54、55、56、57、58、59、60、61、62、63、64或65,甚至更佳为选自所附序列表之01、02、04、05、06、55、59、66或68,最佳为选自所附序列表之序列识别号01、02、04、05、06、55或59,或一氨基酸序列,其分别与序列识别号01、02、03、04、05、06、07、08、09、10、11、12、13、14、15、16、17、18、19、20、21、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69或70之任一个之全长氨基酸序列具有至少80%之序列一致性,80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、91.50%、92.00%、92.50%、93.00%、93.50%、94.00%、94.50%、95.00%、95.50%、96.00%、96.50%、97.00%、97.50%、98.00%、98.50%、99.00%、99.50%、99.60%、99.70%、99.80%、99.90%,较佳为至少85%、更佳为至少90%、甚至更佳为至少95.00%、甚至更佳为至少97.00%、最佳为至少99.00%之序列一致性。
或者,此类膜蛋白之氨基酸序列可为一序列,其系选自所附序列表之序列识别号01、02、04、09、10、11、12、13、14、15、16、17、18、19、20、21、53、54、55、59、61、62、63、64、65、66、67或69,较佳为选自所附序列表之序列识别号序列识别号01、02、04、09、10、11、12、13、14、53、54、55、59、61、62、63、64、65、66、67或69,更佳为选自所附序列表之序列识别号01、02、04、09、10、11、12、13、14、53、54、55、59、61、62、63、64或65,甚至更佳为选自所附序列表之01、02、04、55、59、66或68,甚至更佳为选自序列识别号01、02、04、55或59,甚至更佳为选自所附序列表之序列识别号01、02或04,甚至更佳为选自序列识别号01或02,最佳为选自所附序列表之序列识别号01,或一氨基酸序列,其分别与序列识别号01、02、04、09、10、11、12、13、14、15、16、17、18、19、20、21、53、54、55、59、61、62、63、64、65、66、67或69之任一个之全长氨基酸序列具有至少80%之序列一致性,80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、91.50%、92.00%、92.50%、93.00%、93.50%、94.00%、94.50%、95.00%、95.50%、96.00%、96.50%、97.00%、97.50%、98.00%、98.50%、99.00%、99.50%、99.60%、99.70%、99.80%、99.90%,较佳为至少85%、更佳为至少90%、甚至更佳为至少95.00%、甚至更佳为至少97.00%、最佳为至少99.00%之序列一致性。
在本发明之方法及/或细胞之一更进一步之实施例中,宿主细胞表达一种膜蛋白,其为一转运蛋白,参与化合物跨细胞壁外膜的转运。较佳为,细胞被转形以包括至少一核酸序列,其编码一选自包括乳糖转运蛋白、葡萄糖转运蛋白、半乳糖转运蛋白或核苷酸激活糖的转运蛋白,例如UDP-GlcNAc的转运蛋白之群组的蛋白质。
根据本发明之方法及/或细胞之另一较佳实施例,细胞表达多于一个之膜蛋白。
在一更佳替代实施例中,当所述膜蛋白为源自长双歧杆菌婴儿亚种(菌株ATCC15697)之具有序列识别号10的Blon_0247,所述Blon_0247与源自长双歧杆菌婴儿亚种(菌株ATCC 15697)之Blon_0245一起被表达。
在一更佳替代实施例中,当所述膜蛋白为源自长双歧杆菌婴儿亚种(菌株ATCC15697)之具有序列识别号9的Blon2331,所述Blon2331与Blon23325一起被表达。
在一更佳替代实施例中,当所述膜蛋白为源自大豆慢生根瘤菌USDA 110之具有序列识别号15的Bjnodi,所述Bjnodi与结节因子(nodulation factor)nodj一起被表达。
在一更佳替代实施例中,当所述膜蛋白为源自大肠杆菌(Escherichia coli)K-12MG1655之具有序列识别号20的wza,所述wza与wzx、wzb及/或wzc之任一个或更多个一起被表达。
根据本发明之方法及/或细胞之另一较佳实施例,细胞表达一糖基转移酶,其选自包括岩藻糖基转移酶、唾液酸转移酶、半乳糖基转移酶、葡萄糖基转移酶、甘露糖基转移酶、N-乙酰葡萄糖氨基转移酶、N-乙酰半乳糖氨基转移酶、N-乙酰甘露糖氨基转移酶、木糖基转移酶、葡糖醛酸基转移酶、半乳糖醛酸基转移酶、葡萄糖氨基转移酶、N-羟乙酰神经氨基转移酶(N-glycolylneuraminyltransferases)、鼠李糖基转移酶、N-乙酰鼠李糖基转移酶、UDP-4-氨基-4,6-二脱氧-N-乙酰基-β-L-阿卓糖胺转氨酶(UDP-4-amino-4,6-dideoxy-N-acetyl-beta-L-altrosamine transaminases)、UDP-N-乙酰氨基葡萄糖胺烯醇丙酮基转移酶(UDP-N-acetylglucosamine enolpyruvyl transferases)与岩藻糖氨基转移酶(fucosaminyltransferases)的列表。
在本发明之方法及/或细胞之一较佳实施例中,细胞于至少一种所述糖基转移酶的表达或活性被修饰。在一较佳实施例中,所述糖基转移酶是具有经修饰的表达或活性之细胞的内源性蛋白质,较佳为,所述内源性糖基转移酶是过表达的;或者,所述所述糖基转移酶是异源蛋白,其在所述细胞中异质引入并表达,较佳为过表达。所述内源性糖基转移酶可以在也表达异源糖基转移酶之细胞中具有经修饰的表达。
在本发明之方法及/或细胞之一进一步之较佳实施例中,细胞表达一N-乙酰基葡萄糖胺β-1,3-半乳糖基转移酶,其将半乳糖(Gal)从UDP-Gal供体转移到在之LN3的末端GlcNAc残基为β-1,3键,从而产生乳糖-N-四糖(lacto-N-tetraose)(LNT;Gal-beta1,3-GlcNAc-beta1,3-Gal-beta1,4-Glc)。
在本发明之方法及/或细胞之一进一步之较佳实施例中,细胞在整个肉汤(broth)及/或上清液中,产生90g/L或更多的LNT,及/或其中所述LNT在整个肉汤及/或上清液中具有至少80%之一纯度,依据所述细胞在整个肉汤及/或上清液中产生之LNT及LN3的总量所分别测量。较佳为,细胞在上清液中,产生90g/L或更多的LNT,其中所述LNT具有至少80%之一纯度,依据所述细胞在上清液中产生之LNT及LN3的总量所测量。在本发明之方法及/或细胞之一更佳实施例中,在整个肉汤及/或上清液中之90g/L或更多的LNT系经由在一培养程序,较佳为一发酵程序中培养的所述细胞所获得。在本发明之方法及/或细胞之另一更佳实施例中,依据所述细胞在整个肉汤及/或上清液中产生之LNT及LN3的总量所测量之至少80%之LNT在整个肉汤及/或上清液中的所述纯度,系经由在一培养程序,较佳为一发酵程序中培养的所述细胞所获得。
依据在整个肉汤中或在上清液中之LNT与LN3的总量之至少百分之80的LNT的一纯度,应理解为分别在全肉汤中或在上清液中之LNT与LN3的混合物的所述LNT的量之80%或更多,包括80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、95.5、96、96.5、97、97.5、98、98.5、99或99.5%之依据细胞在整个肉汤中或在上清液中分别产生的LNT与LN3的总量所测量的LNT。
在本发明之方法及/或细胞之一额外及/或替代之进一步之较佳实施例中,细胞该细胞表达N-乙酰葡萄糖胺β-1,4-半乳糖基转移酶,其自一UDP-Gal供体透过一β-1,4键结转移一半乳糖(Gal)至LN3之末端GlcNAC残基上,从而产生乳糖-N-新四糖(LNnT;Gal-beta1,4-GlcNAc-beta1,3-Gal-beta1,4-Glc)。
在本发明之方法及/或细胞之一进一步之较佳实施例中,细胞在整个肉汤及/或上清液中,产生70g/L或更多的、较佳为90g/L或更多的LNnt及/或其中所述LNnT在整个肉汤及/或上清液中具有至少80%之一纯度,依据所述细胞在整个肉汤及/或上清液中产生之LNnT及LN3的总量所分别测量。较佳为,细胞在上清液中,产生70g/L或更多的、较佳为90g/L或更多的LNnt,其中所述LNnT具有至少80%之一纯度,依据所述细胞在上清液中产生之LNnT及LN3的总量所测量。在本发明之方法及/或细胞之一更佳实施例中,在整个肉汤及/或上清液中之70g/L或更多的、较佳为90g/L或更多的LNnT系经由在一培养程序,较佳为一发酵程序中培养的所述细胞所获得。在本发明之方法及/或细胞之另一更佳实施例中,依据所述细胞在整个肉汤及/或上清液中产生之LNT及LN3的总量所测量之至少80%之LNnT在整个肉汤及/或上清液中的所述纯度,系经由在一培养程序,较佳为一发酵程序中培养的所述细胞所获得。
依据在整个肉汤中或在上清液中之LNnT与LN3的总量之至少百分之80的LNnT的一纯度,应理解为分别在全肉汤中或在上清液中之LNnT与LN3的混合物的所述LNnT的量之80%或更多,包括80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、95.5、96、96.5、97、97.5、98、98.5、99或99.5%之依据细胞在整个肉汤中或在上清液中分别产生的LNnT与LN3的总量所测量的LNnT。
根据本发明之方法及/或细胞之另一之较佳实施例,具有合成一核苷酸活化糖脂能力的细胞,要被用于所述包括一乳糖-N-三糖(LN3;GlcNAc-beta1,3-Gal-beta1,4-Glc)作为一核心三糖的寡糖的生产。在本发明之方法及/或细胞之一较佳实施例中,所述核苷酸活化糖系选自包括下列清单:UDP-N-乙酰半乳糖胺(UDP-GalNAc)、UDP-N-乙酰甘露糖胺(UDP-ManNAc)、UDP-葡萄糖(UDP-Glc)、UDP-半乳糖(UDP-Gal)、GDP-甘露糖(GDP-Man)、UDP-葡萄糖醛酸盐、UDP-半乳糖醛酸盐、UDP-2-乙酰氨基-2,6-二脱氧基-L-阿拉伯糖-4-己酮糖、UDP-2-乙酰氨基-2,6-二脱氧基-L-木糖-4-己酮糖(UDP-2-acetamido-2,6-dideoxy-L-lyxo-4-hexulose)、UDP-N-乙酰基-L-鼠李糖胺(UDP-L-RhaNAc或UDP-2-乙酰氨基-2,6-二脱氧基-L-甘露糖(UDP-2-acetamido-2,6-dideoxy-L-mannose))、dTDP-N-乙酰岩藻糖胺、UDP-N-乙酰岩藻糖胺(UDP-L-FucNAc或UDP-2-乙酰氨基-2,6-二脱氧基-L-半乳糖)、UDP-N-乙酰-L-脱氧塔罗糖胺(UDP-N-acetyl-L-pneumosamine)(UDP-L-PneNAC或UDP-2-乙酰氨基-2,6-二脱氧基-L-塔罗糖(UDP-2-acetamido-2,6-dideoxy-L-talose))、UDP-N-乙酰胞壁酸(UDP-N-acetylmuramic acid)、UDP-N-乙酰基-L-奎诺糖胺(UDP-N-acetyl-L-quinovosamine)(UDP-L-QuiNAc或UDP-2-乙酰氨基-2,6-二脱氧基-L-葡萄糖(UDP-2-acetamido-2,6-dideoxy-L-glucose))、CMP-唾液酸(CMP-Neu5Ac)、CMP-N-羟乙酰神经氨酸(CMP-Neu5Gc)、GDP-岩藻糖(GDP-Fuc)、GDP-鼠李糖及UDP-木糖。
此外,或者,于此使用之宿主细胞视需要而定地被基因修饰以表达GDP-岩藻糖的重新合成。GDP-岩藻糖可由一细胞中表达的酶或由细胞之代谢提供。这种产生GDP-岩藻糖的细胞可以表达例如,将要添加到细胞的岩藻糖转化成GDP-岩藻糖的酶。此酶可以是例如双功能岩藻糖激酶/岩藻糖-1-磷酸鸟苷转移酶,如来自脆弱类杆菌(Bacteroidesfragilis)的Fkp,或一种单独的岩藻糖激酶与一种单独的岩藻糖-1-磷酸鸟苷酸转移酶的组合,就像它们从包括智人(Homo sapiens)、猪(Sus scrofa)与褐鼠(Rattus norvegicus)之几种物种已知的那样。较佳为,细胞被修饰以产生GDP-岩藻糖。更佳为,细胞被修饰为了经提升的GDP-岩藻糖生产。所述修饰可为选自包括一UDP-葡萄糖:十一碳二烯磷酸葡萄糖-1-磷酸转移酶(UDP-glucose:undecaprenyl-phosphate glucose-1-phosphatetransferase)编码基因的敲除、一GDP-L-岩藻糖合酶(GDP-L-fucose synthase)编码基因的过表达、一GDP-甘露糖4,6-脱水酶(GDP-mannose 4,6-dehydratase)编码基因的过表达、一甘露糖-1-磷酸鸟苷酸转移酶(mannose-1-phosphate guanylyltransferase)编码基因的过表达、一磷酸甘露变位酶(phosphomannomutase)编码基因的过表达与一甘露糖-6-磷酸异构酶(mannose-6-phosphate isomerase)编码基因的过表达之群组的任一个或更多个。
此外,或者,于此使用之宿主细胞视需要而定地被基因修饰以表达CMP-Neu5Ac的重新合成。CMP-Neu5Ac可由一细胞中表达的酶或由细胞之代谢提供。这种产生CMP-Neu5Ac的细胞可以表达例如,将要添加到细胞的唾液酸转化成CMP-Neu5Ac的酶。此酶可以是此酶可为一CMP-唾液酸合成酶,如来自包括智人、脑膜炎双球菌与多杀性巴氏杆菌(Pasteurella multocida)在的几种物种的N-酰基神经氨酸胞苷酰转移酶。较佳为,细胞被修饰以产生CMP-Neu5Ac。更佳为,细胞被修饰为了经提升的CMP-Neu5Ac生产。所述修饰可为选自包括一N-乙酰葡萄糖胺-6-磷酸脱乙酰酶(N-acetylglucosamine-6-phosphatedeacetylase)的敲除、一葡萄糖糖胺-6-磷酸脱氨酶(glucosamine-6-phosphatedeaminase)的敲除、一唾液酸合成酶(sialate synthase)编码基因的过表达与一N-乙酰-D-葡萄糖胺-2-差向异构酶(N-acetyl-D-glucosamine-2-epimerase)编码基因的过表达之群组的任一个或更多个。
此外,或者,于此使用之宿主细胞视需要而定地被基因修饰以表达UDP-Gal的重新合成。UDP-Gal可由一细胞中表达的酶或由细胞之代谢提供。这种产生UDP-Gal的细胞可以表达将例如UDP-葡萄糖转化成UDP-Gal的酶。此酶为UDP-葡萄糖-4-差向异构酶(UDP-glucose-4-epimerase)GalE,就像它们从包括智人、大肠杆菌与褐鼠之几种物种已知的那样。较佳为,细胞被修饰以产生UDP-Gal。更佳为,细胞被修饰为了经提升的UDP-Gal生产。所述修饰可为选自包括双功能5'-核苷酸酶/UDP-糖水解酶(bifunctional5’-nucleotidase/UDP-sugar hydrolase)编码基因的敲除、一半乳糖-1-磷酸尿苷酰转移酶(galactose-1-phosphate uridylyltransferase)编码基因的敲除与一UDP-葡萄糖-4-差向异构酶(UDP-glucose-4-epimerase)编码基因的过表达之群组的任一个或更多个。
通常较佳的是,细胞对选定的单糖、双糖或寡糖的分解代谢途径至少部分失活,单糖、双糖或寡糖参与及/或需要一具有LN3作为核心三糖之寡糖的合成。
根据本发明的方法及/或细胞的另一较佳实施例,包括一LN3作为核心三糖的寡糖为哺乳动物乳寡糖或包含LN3作为核心三糖的Lewis型抗原寡糖。
根据本发明的方法及/或细胞的另一较佳实施例,细胞具有合成一包括包括LN3作为核心三糖之至少一寡糖之寡糖的混合物的能力。
在一特定的示例性实施例中,本发明的方法提供以高产率之一具有LN3作为核心三糖的寡糖的生产。此方法包括在含有乳糖的水性培养或发酵培养基中培养或发酵一经基因修饰的细胞,较佳为大肠杆菌,更佳为藉由敲除基因LacZ与nagB基因而修饰的大肠杆菌细胞的步骤。甚至更佳为,另外可以将大肠杆菌lacY基因、源自运动发酵单胞菌(Zymomonasmobilis)的一果糖激酶基因(frk)与源自青春双歧杆菌(Bifidobacterium adolescentis)的一蔗糖磷酸化酶(sucrose phosphorylase SP)敲入基因组并组成型地表达。组成型启动子来源于De Mey et al.(BMC Biotechnology,2007)与Mutalik et al.(Nat.Methods2013,No.10,354-360)所描述的启动子库。此外,经修饰的大肠杆菌细胞具有编码半乳糖苷β-1,3-N-乙酰葡萄糖胺转移酶的重组基因与编码具有修饰LN3以合成本发明寡糖的糖基转移酶之能力的另一重组基因。细胞更包括一编码如于此所述之任何一膜蛋白之表达的一重组基因。
根据本发明的方法及/或细胞的另一较佳实施例,所述细胞使用前驱物来用于所述包括LN3作为核心三糖的寡糖的合成。在本发明的方法及/或细胞之一较佳实施例中,膜蛋白参与用于包含LN3作为核心三糖之所述寡糖之合成的一前驱物的摄取。在另一较佳实施例中,细胞正在产生用于包含LN3作为核心三糖之所述寡糖之合成的一前驱物。
本发明的另一实施例提供了一种方法与一种细胞,其中糖基化产物在一微生物中及/或由一微生物产生,所述微生物选自一细菌、一酵母菌或一真菌,或一植物细胞、动物细胞、一非人类哺乳动物细胞、一昆虫细胞或一原生动物。后者细菌较佳为属于变形菌(Proteobacteria)门或厚壁菌(Firmicutes)门或蓝细菌(Cyanobacteria)门或奇异球菌-栖热菌(Deinococcus-Thermus)门。属于变形菌门之后者细菌较佳为属于肠杆菌(Enterobacteriaceae)科,较佳为大肠杆菌种。后方细菌较佳为关于属于大肠杆菌种的任何菌株,例如但不限于大肠杆菌B、大肠杆菌C、大肠杆菌W、大肠杆菌K12、大肠杆菌Nissle。更具体地,后方用语关于经培养的大肠杆菌菌株-命名为大肠杆菌K12菌-其很好地适应了实验室环境,并且与野生型菌株不同,它们已经失去了在肠道中茁壮成长的能力。大肠杆菌K12菌株之周知的例子为K12野生型、W3110、MG1655、M182、MC1000、MC1060、MC1061、MC4100、JM101、NZN111与AA200。因此,较佳为,本发明具体地关于如上所指出的突变及/或转形的大肠杆菌菌株,其中所述大肠杆菌菌株是K12菌株。更具体地,本发明关于如上所指出的突变及/或转形的大肠杆菌菌株,其中所述K12菌株是大肠杆菌MG1655。属于厚壁菌门的后方细菌较佳为属于芽孢杆菌(Bacilli),较佳来自芽孢杆菌(Bacillus)种,例如枯草芽孢杆菌(Bacillus subtilis)或液化淀粉芽孢杆菌(B.amyloliquefacien)。后者的细菌属于放线菌(Actinobacteria)门,较佳为属于棒状杆菌(Corynebacteriaceae)科,具有谷氨酸棒状杆菌(Corynebacterium glutamicum)或C.afermentans成员,或属于链霉菌(Streptomycetaceae)科,具有灰色链霉菌(Streptomyces griseus)或S.fradiae成员。后方酵母较佳为属于子囊菌(Ascomycota)门或担子菌(Basidiomycota)门或半知菌(Deuteromycota)门或接合菌(Zygomycete)门。后方酵母较佳为属于酵母属(具有成员,如酿酒酵母菌、贝酵母菌(Saccharomyces bayanus)、布拉酵母(S.boulardii))、毕赤酵母菌属(Pichia)(具有成员,如嗜甲醇酵母菌(Pichia pastoris)、异常毕赤酵母(P.anomala)、克鲁弗毕赤酵母(P.kluyveri))、驹形菌属(Komagataella)、汉逊氏菌属(Hansunella)、克鲁维酵母属(Kluyveromyces)(具有成员,如乳酸克鲁维酵母(Kluyveromyces lactis)、马克斯克鲁维酵母(K.marxianus)、耐热克鲁维酵母(K.thermotolerans))、耶氏酵母属(Yarrowia)(如解脂耶氏酵母菌(Yarrowia lipolytica))、假囊酵母属(Eremothecium)、接合酵母菌属(Zygosaccharomyces)、Starmerella(如熊蜂生假丝酵母(Starmerellabombicola))或德巴利酵母属(Debaromyces)。后方酵母菌较佳为选自嗜甲醇酵母菌、解脂耶氏酵母菌、酿酒酵母菌与乳酸克鲁维酵母。后方真菌较佳为属于根霉菌属(Rhizopus)、网柄菌属(Dictyostelium)、青梅菌属(Penicillium)、白霉菌属(Mucor)或曲菌属(Aspergillus)。「植物细胞」包括开花植物与非开花植物的细胞,以及藻类细胞,例如衣藻(Chlamydomonas)、小球藻(Chlorella)等。较佳为,所述植物细胞为烟草、苜蓿、稻、棉花、油菜籽、西红柿、玉米、玉蜀黍或大豆细胞。后方动物细胞较佳为来源于非人类哺乳动物(例如牛、水牛、猪、绵羊、小鼠、大鼠)、鸟类(例如鸡、鸭、鸵鸟、火鸡、雉(pheasant))、鱼(例如箭鱼、鲑鱼、鲔鱼、鲈鱼、鳟鱼、鲶鱼)、无脊椎动物(例如龙虾、螃蟹、虾、蛤蜊、牡蛎、贻贝、海胆)、爬虫类(例如蛇、短吻鳄、龟)、两栖类(例如青蛙)或昆虫(例如苍蝇、线虫)或者是源自不包括胚胎干细胞之人类细胞的基因修饰细胞株。人类与非人类哺乳动物细胞两者均较佳选自包括一上皮细胞,如一乳腺上皮细胞、一胚胎肾细胞(例如HEK293或HEK 293T细胞)、一纤维母细胞、一COS细胞、一中国仓鼠卵巢(CHO)细胞、鼠骨髓瘤细胞,如N20、SP2/0或YB2/0细胞、一NIH-3T3细胞、一非乳腺成体干细胞或如于WO21067641中所述之其衍生物的列表。所述昆虫细胞较佳来源于草地贪夜蛾(Spodoptera frugiperda),例如,Sf9或Sf21细胞、家蚕(Bombyx mori)、甘蓝夜蛾(Mamestra brasicae)、粉纹夜蛾(Trichoplusia ni),例如BTI-TN-5B1-4细胞或黑腹果蝇,例如,果蝇S2细胞。后方原生动物细胞较佳为利什曼原虫(Leishmania tarentolae)细胞。
在一较佳实施例中,细胞为一微生物之一细胞,其中更佳为所述微生物为一细菌或一酵母菌。在一更佳实施例中,微生物为一细菌,最佳为大肠杆菌。于此叙述使用如大肠杆菌的例子。
在另一更佳实施例中,细胞为一酵母菌。
另一个实施例提供了要在一培养基中稳定培养的一细胞,其中所述培养基可为任何类型的生长培养基,包括基本培养基(minimal medium)、复合培养基(complex medium)或富含某些化合物,例如但不限于维生素、微量元素、氨基酸的生长培养基。
如于此所使用之微生物或细胞具有在一单糖、一双糖、一寡糖、一多糖、一多元醇、一复合培养基或其混合物作为主要碳源上生长的能力。用语主要是指用于感兴趣的寡糖、生物质形成、二氧化碳及/或副产物形成(例如酸及/或醇,例如乙酸盐、乳酸盐及/或乙醇)的最重要的碳源,即所有所需碳的20、30、40、50、60、70、75、80、85、90、95、98、99%来自上述碳源。在本发明之一实施例中,所述碳源是所述生物体的唯一碳源,即所有所需碳的100%来源于上述碳源。常见的主要碳源包括但不限于葡萄糖、甘油、果糖、麦芽糖、乳糖、阿拉伯糖、麦芽寡糖、麦芽三糖(maltotriose)、山梨醇、木糖、鼠李糖、蔗糖、半乳糖、甘露糖、甲醇、乙醇、海藻糖、淀粉、纤维素、半纤维素、玉米浸液(corn-steep liquor)、高果糖浆(high-fructose syrup)、乙酸盐、柠檬酸盐、乳酸盐与丙酮酸盐。用语复合培养基是指其确切组成未确定的一培养基。例子是糖蜜(molasses)、玉米浸液、蛋白胨、胰蛋白胨或酵母萃取物。
在一进一步较佳实施例中,于此叙述之微生物或细胞使用具有生产途径(production pathway)与生物质途径(biomass pathway)的分裂代谢(splitmetabolism),如WO2012/007481中所述,其通过引用并入于此。所述生物体可以例如通过改变选自磷酸葡萄糖异构酶基因、磷酸果糖激酶基因、果糖6-磷酸醛缩酶基因、果糖异构酶基因及/或果糖:PEP磷酸转移酶基因被基因修饰以累积果糖-6-磷酸。.
在一进一步较佳实施例中,如于此所述之具有LN3为一核心三糖之一寡糖的生产方法包括下列步骤之至少之一:
i)添加一乳糖给料于培养培养基,乳糖给料包括至少50、更佳为至少75、更佳为至少100、更佳为至少120、更佳为至少150克乳糖每升之初始反应器体积(initial reactorvolum),其中反应器体积介于250mL(毫升)至10.000m3(立方米)范围之间,较佳为以一连续方式,且较佳为以使培养培养基之最终体积为不多于添加乳糖给料前培养培养基之体积的3倍、较佳为不多于2倍、更佳为少于2倍;
ii)藉由一给料溶液,在1日、2日、3日、4日、5日之过程中,以一连续方式添加一乳糖给料于培养培养基;
iii)藉由一给料溶液,在1日、2日、3日、4日、5日之过程中,以一连续方式添加一乳糖给料于培养培养基,且其中乳糖给料溶液之浓度为50g/L、较佳为75g/L、更佳为100g/L、更佳为125g/L、更佳为150g/L、更佳为175g/L、更佳为200g/L、更佳为225g/L、更佳为250g/L、275g/L、更佳为300g/L、更佳为325g/L、更佳为350g/L、更佳为375g/L、更佳为400g/L、更佳为450g/L、更佳为500g/L、甚至更佳为550g/L、最佳为600g/L;以及较佳为溶液之PH值系设定于3至7之间,且
其中较佳为给料溶液之温度为保持于20℃至80℃之间;
所述方法致生一具有LN3作为一核心三糖的寡糖之于所述培养培养基之最终体积中具有至少50g/L、较佳为至少75g/L、更佳为至少90g/L、更佳为至少100g/L、更佳为至少125g/L、更佳为至少150g/L、更佳为至少175g/L、更佳为至少200g/L的浓度。
较佳为,乳糖给料,系透过自开始培养时以至少5mM的浓度、较佳为以至少30、40、50、60、70、80、90、100、150mM的浓度、更佳为以>300mM的浓度添加乳糖来达成。
在另一实施例中,乳糖给料,系透过以一浓度之添加乳糖至培养培养基来达成,以致在整个培养之生产阶段,获得浓度至少为5mM、较佳为至少10mM或30mM的一乳糖。
在于此所述之方法的一进一步实施例中,宿主细胞被培养至少约60、80、100或约120小时,或以连续方式培养。
在于此所述之方法的另一实施例中,一碳及能量来源,较佳为葡萄糖、甘油、果糖、麦芽糖、阿拉伯糖、麦芽糊精、麦芽寡糖、麦芽三糖、山梨醇、木糖、鼠李糖、蔗糖、半乳糖、甘露糖、甲醇、乙醇、海藻糖、淀粉、纤维素、半纤维素、多元醇、玉米浸液、高果糖浆、琥珀酸盐、苹果酸盐、醋酸盐、柠檬酸盐、乳酸及/或丙酮酸盐,亦被添加,较佳为持续添加至培养培养基,并较佳为搭配乳糖。
在一较佳实施例中,一碳基基质,较佳为蔗糖被提供于培养培养基中3或更多天,较佳为上至7天;及/或被提供于培养培养基中,至少100,有利地至少105,更有利地至少110,甚至更有利地至少120克之蔗糖每升初始培养体积,以连续方式,以使培养培养基之最终体积为不多于培养前培养培养基之体积的三倍、有利地为不多于两倍、更有利地少于两倍。
较佳为,当执行于此所述之方法时,在第二阶段将乳糖添加到培养基中之前,通过将碳基基质,较佳为葡萄糖或蔗糖,添加到培养基中来提供指数细胞生长的第一阶段。
在一替代较佳实施例中,在于此所述之方法中,乳糖已经在指数增长的第一阶段与碳基基质一起添加。
根据本发明,于此所述之方法较佳为包括分别从所述培养物分离所述包括LN3为一核心三糖之寡糖或包括至少一种包括LN3为一核心三糖之寡糖的寡糖混合物的一步骤。
用语「从所述培养物分离」是指从细胞及/或其生长之培养基中收获、收集或回收所述寡糖或包括至少一种包括LN3作为一核心三糖的寡糖的所述寡糖混合物。
寡糖或包括至少一种包括LN3作为一核心三糖的寡糖的寡糖混合物可以以一般方式从细胞在其中生长的水性培养基中分离。若所述寡糖或所述寡糖混合物仍存在于产生寡糖或所述寡糖混合物的细胞中,可以使用从细胞中游离或提取所述寡糖或所述寡糖混合物的一般方式,例如使用高pH、热休克(heat shock)、音振(sonication)、法式压榨(Frenchpress)、均质化、酶水解、化学水解、溶剂水解、清洁剂、水解…破坏细胞。然后可以将培养培养基及/或细胞萃取物一起与分别地进一步用于分离所述寡糖或所述寡糖混合物。
此较佳包括澄清所述寡糖或所述寡糖混合物以去除悬浮颗粒和污染物、特别是细胞、细胞组分、不溶性代谢物与培养经基因修饰之细胞所产生的碎片(debris)。在此步骤中,可以以一般方式澄清所述寡糖或所述寡糖混合物。较佳为,所述寡糖或所述寡糖混合物通过离心、絮凝(flocculation)、倾析(decantation)及/或过滤来澄清。分离所述寡糖或包括至少一种包括LN3作为一核心三糖的寡糖的寡糖混合物之一第二步骤较佳包含从所述寡糖或所述寡糖混合物中去除基本上所有的蛋白质,以及胜肽、氨基酸、RNA与DNA以及任何可能干扰后续分离步骤的内毒素与糖脂,较佳为在其已经被澄清之后。在此步骤中,蛋白质和相关杂质可以通过一般方式从所述寡糖或所述寡糖混合物中去除。较佳为,藉由超过滤、纳米过滤、逆渗透、微过滤、活性炭或碳处理、切向流高效过滤(tangential flow high-performance filtration)、切向流超滤(tangential flow ultrafiltration)、亲和层析、离子交换层析(例如但不限于阳离子交换、阴离子交换、混合床离子交换(mixed bed ionexchange))、疏水相互作用层析(hydrophobic interaction chromatography)及/或凝胶过滤(即粒径筛析层析法(size exclusion chromatography)),特别是藉由层析,更特别是藉由离子交换层析或疏水相互作用层析或配体交换层析从所述寡糖或所述寡糖混合物中去除蛋白质、盐、副产物、颜色与其他相关杂质。除粒径筛析层析法外,蛋白质与相关杂质被层析介质或所选择的膜保留。
在一进一步较佳实施例中,于此所述之方法也提供本发明之包括LN3作为核心三糖的寡糖或包括至少一种包括LN3作为核心三糖的寡糖的寡糖混合物的进一步纯化。所述寡糖或所述寡糖混合物的进一步纯化可以例如藉由(活性)炭或碳、纳米过滤、超滤或离子交换的使用以去除任何剩余的DNA、蛋白质、LPS、内毒素或其他杂质来达成。也可以使用醇,例如乙醇,与含水醇混合物。另一个纯化步骤通过所述寡糖或所述寡糖混合物的结晶、蒸发或沉淀来达成。另一个纯化步骤是干燥,例如将产生的寡糖或寡糖混合物喷雾干燥或冻干。
在一示例性实施例中,包括LN3作为核心三糖的寡糖或包括至少一种包括LN3作为核心三糖的寡糖的寡糖混合物的分离与纯化,在一程序中进行,包括以任何顺序之以下步骤:
a)将培养物或其澄清版本与具600-3500Da之截留分子量(molecular weightcut-off,MWCO)的纳米滤膜接触,确保保留所产生的寡糖或寡糖混合物,并允许至少一部分蛋白质、副产物、颜色与其他相关杂质通过,
b)使用所述膜,使用无机电解质的水溶液对来自步骤a)的渗余物(retentate)进行渗滤(diafiltration)程序,接着视需要而定地以纯水渗滤以除去过量的电解质,
c)与从所述电解质的阳离子收集富含于盐的形式之所述寡糖或所述寡糖混合物的渗余物。
在一替代示例实施例中,所述寡糖或所述寡糖混合物的分离与纯化,在一程序中进行,包括以任何顺序之以下步骤:使培养物或其澄清版本经受使用不同膜的两个膜过滤步骤,其中
-一膜具有介于约300至约500道尔顿之间的截留分子量,且
-另一膜作为介于约600至约800道尔顿之间的截留分子量。
在一替代示例实施例中,所述寡糖或所述寡糖混合物的分离与纯化,在一程序中进行,包括以任何顺序之以下步骤,其包括以一H+形式的强阳离子交换树脂与一游离碱形式的弱阴离子交换树脂处理培养物或其澄清形式的步骤。
在一替代示例实施例中,所述寡糖或所述寡糖混合物的分离与纯化,在以下方式中进行。包含所产生的寡糖、生物质、培养基成分和污染物的培养物,其中培养物中所产生的寡糖或寡糖混合物的纯度<80%,应用于以下纯化步骤:
i)从培养物分离生物质,
ii)用于带正电荷物质之去除的阳离子交换处理,
iii)用于带负电荷物质之去除的阴离子交换处理,
iv)纳米滤步骤及/或电渗析步骤,
其中提供包含纯度大于或等于百分之80之所产生的寡糖或寡糖混合物的一经纯化的溶液。视需要而定地,将经纯化的溶液喷雾干燥。
在一替代示例性实施例中,包括LN3作为核心三糖的寡糖或包括至少一种包括LN3作为核心三糖的寡糖的寡糖混合物的分离与纯化,在一程序中进行,包括以任何顺序之以下步骤:培养物的酶处理;从培养物之生物质的去除;超过滤;纳米过滤;与一管柱层析步骤。较佳为,此种柱色谱是单柱或多柱。进一步较佳为,柱层析步骤为模拟移动床层析(simulated moving bed chromatography)。这种模拟移动床层析较佳为包括i)至少4根柱,其中至少一管柱包含弱或强阳离子交换树脂;及/或ii)具有不同流速的四个区域I、II、III与IV;及/或iii)包含水的洗脱液;及/或iv)15摄氏度至60摄氏度的一工作温度。
在一特定实施例中,本发明提供所产生之包括LN3作为核心三糖的寡糖或包括至少一种包括LN3作为核心三糖的寡糖的寡糖混合物,其被喷雾干燥成粉末,其中喷雾干燥的粉末含有<百分之15-wt.的水,较佳为<百分之10-wt.的水,更佳为<百分之7-wt.的水,最佳为<百分之5-wt.的水。
本发明的另一态样提供了选自如于此所定义的膜蛋白之组的一膜蛋白在一具有LN3作为核心三糖的寡糖或一包括至少一种包括LN3作为核心三糖的寡糖的寡糖混合物之发酵生产中的用途。
在一进一步之态样中,本发明提供于此所定义之一细胞在用于一具有LN3作为核心三糖的寡糖或一包括至少一种包括LN3作为核心三糖的寡糖的寡糖混合物之生产之方法中的用途。
此外,本发明也关于根据本发明方法所获得之一具有LN3作为核心三糖的寡糖或一包括至少一种包括LN3作为核心三糖的寡糖的寡糖混合物,以及如上述之一多核苷酸、载体、宿主细胞、微生物或多胜肽的用于所述寡糖或所述寡糖混合物之生产的用途。所述寡糖或所述寡糖混合物可使用为食品添加剂、益生元(prebiotic)、共生元(symbiotic),用于婴儿食品、成人食品或饲料之补充,或使用为治疗或药学活性化合物。藉由此新颖的方法,无需复杂、耗时且费钱的合成程序,即可容易且有效地提供具有LN3作为核心三糖的寡糖或包括至少一种包括LN3作为核心三糖的寡糖的寡糖混合物。
为了如于此所述在细胞中产生的寡糖的鉴定,单体建构组元(monomericbuilding blocks)(例如单糖或聚糖单元组成)、侧链的变旋构型(anomericconfiguration)、取代基的存在与位置、聚合度/分子量及连接形态(linkage pattern),可藉由本领域已知之标准方法来鉴定,如,例如甲基化分析、还原裂解、水解、GC-MS(气相层析-质谱)、MALDI-MS(基质辅助雷射脱附/游离-质谱)、ESI-MS(电洒游离-质谱)、HPLC(带紫外或折射率检测之高效液相层析,)、HPAEC-PAD(带脉冲安培检测(Pulsed AmperometricDetection)的高效阴离子交换层析)、CE(毛细管电泳)、IR(红外)/拉曼光谱(Ramanspectroscopy)与NMR(核磁共振)光谱技术。使用例如固态NMR、FT-IR(傅立叶变换红外光谱(Fourier transform infrared spectroscopy))与WAXS(广角X射线散射(wide-angle X-ray scattering))可解析晶体结构。聚合度(DP)、DP分布与多分散性(polydispersity)可以藉由例如黏度测定法(viscosimetry)与SEC(SEC-HPLC,高效粒径筛析层析(highperformance size-exclusion chromatography))来确定。为了鉴定寡糖的单体成分,可以使用方法如,例如酸催化水解、HPLC(高效液相层析)或GLC(气液层析)(转化为糖醇乙酸酯(alditol acetates)之后)。为了确定糖苷键,寡糖以甲基碘与在DMSO中之强碱甲基化,进行水解,达成为部分甲基化的糖醇的还原,进行对甲基化之糖醇乙酸酯的乙酰化,并藉由GLC/MS(气液层析与质谱联用)来执行分析。为了确定聚糖序列,使用酸或酶进行部分解聚以确定结构。为了鉴定变旋构型,寡糖经受酶分析法(enzymatic analysis),例如其与对特定类型的连接具有特异性的酶,例如β-半乳糖苷酶或α-葡萄糖苷酶等接触,且可使用NMR以分析产物。
于此所述之经分离且较佳为也经纯化之具有LN3作为核心三糖的寡糖或一包括至少一种具有LN3作为核心三糖的寡糖的寡糖混合物被并入一食品(例如,人类食品或饲料)、膳食补充剂、药学成分、化妆品成分或药物。在一些实施例中,将寡糖或寡糖混合物与一或更多之适用于食品、饲料、膳食补充剂、药学成分、化妆品成分或药物的成分混合。
在一些实施例中,膳食补充剂包含至少一益生元成分及/或至少一益生菌(probiotic)成分。
一「益生元(prebiotic)」是一种促进对宿主有益的微生物生长的物质,尤其是胃肠道中的微生物。在一些实施例中,膳食补充剂提供多种益生元,包括为藉由本说明书中揭露的方法生产及/或纯化的益生元的寡糖或寡糖混合物,以促进一种或更多之有益微生物的生长。用于膳食补充剂的益生元成分的例子包括其他益生元分子(如HMO)与植物多糖(如菊糖(inulin)、果胶(pectin)、β-葡聚糖(b-glucan)与木质寡糖(xylooligosaccharide))。「益生菌」产品通常包含活的微生物,这些微生物可以替代或添加到胃肠微生物丛(gastrointestinal microflora)中,以使接受者受益。此类微生物的例子包括乳杆菌属(Lactobacillus)物种(例如,嗜酸乳杆菌(L.acidophilus)与保加利亚乳杆菌(L.bulgaricus))、双歧杆菌(Bifidobacterium)物种(例如,动物双歧杆菌(B.animalis)、长双歧杆菌与和婴儿双歧杆菌(例如,Bi-26))与布拉氏酵母(Saccharomyces boulardii)。在一些实施例中,本说明书之一程序所产生及/或纯化的一寡糖或寡糖混合物与此类微生物组合口服给药。
膳食补充剂的进一步成分的例子包括双糖(例如乳糖)、单糖(例如葡萄糖与半乳糖)、增稠剂(例如阿拉伯胶(gum arabic))、酸度调节剂(例如柠檬酸三钠)、水、脱脂牛奶与调味剂。
在一些实施例中,将包括LN3作为核心三糖的寡糖或一包括至少一种包括LN3作为核心三糖的寡糖的寡糖混合物并入人类婴儿食品(例如婴儿配方奶(infant formula))中。婴儿配方奶通常是用于喂养婴儿的加工食品,作为人乳的完全或部分替代品。在一些实施方案中,婴儿配方奶以粉末形式出售,并藉由与水混合而制备以瓶或杯喂给婴儿。婴儿配方奶的成分通常设计为大致模仿人乳。在一些实施例中,通过本说明书中的方法生产及/或纯化的寡糖或寡糖混合物包括在婴儿配方奶中以提供类似于人乳中的寡糖所提供的营养益处。在一些实施例中,将寡糖或寡糖混合物与婴儿配方奶的一或更多成分混合。婴儿配方奶成分包括脱脂牛奶、碳水化合物来源(例如,乳糖)、蛋白质来源(例如浓缩乳清蛋白(wheyprotein concentrate)与酪蛋白)、脂肪来源(例如,植物油—例如棕榈、高油酸红花、油菜、椰子及/或葵花油;与鱼油)、维生素(例如,维生素A、Bb、Bi2、C与D)、矿物质(例如,柠檬酸钾、柠檬酸钙、氯化镁、氯化钠、柠檬酸钠与磷酸钙)与可能的人乳寡糖(HMO)。此类HMO可包括,例如DiFL、乳糖-N-三糖II、LNT、LNnT、乳糖-N-岩藻五糖I、乳糖-N-新岩藻五糖、乳糖-N-岩藻五糖II、乳糖-N-岩藻五糖III、乳糖-N-岩藻五糖V、乳糖-N-新岩藻五糖V、乳糖-N-二岩藻六糖I、乳糖-N-二岩藻六糖II、6'-半乳糖基乳糖、3'-半乳糖基乳糖、乳糖-N-六糖与乳糖-N-新六糖。
在一些实施例中,一或更多之婴儿配方奶成分包括脱脂牛奶、一碳水化合物来源、一蛋白质来源、一脂肪来源及/或一维生素与矿物质。
在一些实施例中,一或更多之婴儿配方奶成分包括乳糖、浓缩乳清蛋白及/或高油酸红花油。
在一些实施例中,婴儿配方奶中寡糖或寡糖混合物的浓度与人乳中通常存在的寡糖浓度为大致相同的浓度。
在一些实施例中,将寡糖或寡糖混合物并入一饲料制剂中,其中所述饲料选自包括宠物食品、动物代乳品、兽医产品(veterinary product)、断奶后饲料(post weaningfeed)或教槽饲料(creep feed)的列表。
如于此的实施例中所示,当使用于此定义的膜蛋白时,本发明的方法与细胞提供至少一种之以下令人惊讶的优点:
-较佳之具有LN3为一核心三糖之寡糖的滴定量(经提升)(g/L),
-较佳的生产率r(g寡糖/L/h),
-较佳的细胞效能指数(cell performance index)CPI(g寡糖/g X),
-较佳的单位生产力(specific productivity)Qp(g寡糖/g X/h),
-较佳的蔗糖产量(yield)Ys(g寡糖/g蔗糖),
-较佳的蔗糖摄取/转化率Qs(g蔗糖/g X/h),
-较佳的乳糖转化/消耗率rs(g乳糖/h),
-经提升之具有LN3为一核心三糖之寡糖的分泌,及/或
-经提升的生产宿主之生长速度,
当将一具有LN3为一核心三糖之寡糖或一包括至少一种包括LN3作为一核心三糖的寡糖的寡糖混合物的生产宿主与相同的基因背景但缺乏异源膜蛋白之表达或内源膜蛋白的调节表达比较时。在目前内容中,「X」意指生物量、「g」意指克,「L」意指升,而「h」意指小时。所述「g寡糖」可被测量于整个肉汤中及/或于上清液中。
较佳为,当使用于此定义的膜蛋白时,本发明的方法与细胞提供至少一种之以下令人惊讶的优点:
-较佳之具有LN3为一核心三糖之寡糖的滴定量(经提升)(g/L),
-较佳的生产率r(g寡糖/L/h),
-较佳的细胞效能指数(cell performance index)CPI(g寡糖/g X),
-较佳的单位生产力(specific productivity)Qp(g寡糖/g X/h),
-较佳的蔗糖产量Ys(g寡糖/g蔗糖),
-较佳的蔗糖摄取/转化率Qs(g蔗糖/g X/h),
-较佳的乳糖转化/消耗率rs(g乳糖/h),及/或
-经提升之具有LN3为一核心三糖之寡糖的分泌,
当将一具有LN3为一核心三糖之寡糖或一包括至少一种包括LN3作为一核心三糖的寡糖的寡糖混合物的生产宿主与相同的基因背景但缺乏异源膜蛋白之表达或内源膜蛋白的调节表达比较时。
又,本发明系关于以下特定实施例:
1.一种宿主细胞,其经基因修饰以产生一包括一乳糖-N-三糖(LN3;GlcNAc-beta1,3-Gal-beta1,4-Glc)作为一核心三糖的寡糖,其中该宿主细胞包括及表达一半乳糖苷-β-1,3-N-乙酰葡萄糖胺转移酶(galactoside beta-1,3-N-acetylglucosaminyltransferase)的至少一核酸序列,该半乳糖苷-β-1,3-N-乙酰葡萄糖胺转移酶自一UDP-GlcNAc供体转移一N-乙酰葡萄糖胺(GlcNAc)残基至一乳糖受体上,从而合成LN3,
-该细胞更包括:(i)一内源膜蛋白的过表达及/或(ii)一异源膜蛋白的表达,以提供一包括LN3作为一核心三糖的寡糖的(a)经改良的生产及/或(b)经启动及/或经提升的排出,
-较佳为该细胞更包括及表达编码一糖基转移酶(glycosyltransferase)的至少一核酸序列,该糖基转移酶具有修饰该LN3之能力。
2.如实施例1之细胞,其中该膜蛋白系选自运输蛋白(porters)、P-P键水解驱动转运蛋白(P-P-bond-hydrolysis-driven transporters)、及β-桶状孔蛋白(β-BarrelPorins)之群组,其中,
a)当该膜蛋白系选自该运输蛋白之群组,该膜蛋白系选自
-TCDB分类2.A.1.1、2.A.1.2、2.A.1.3、2.A.1.6、2.A.2.2、2.A.7.1及2.A.66之群组,或
-eggnog家族05E8G、05EGZ、05JHE、07QF7、07QRN、07RBJ、0814C及08N8A之群组,或
-PFAM列表PF00893、PF01943、PF05977、PF07690及PF13347,或
-interpro列表IPR000390、IPR001411、IPR001927、IPR002797、IPR004638、IPR005829、IPR010290、IPR011701、IPR020846、IPR023721、IPR023722、IPR032896、IPR036259及IPR039672,或
-源自Cronobacter muytjensii之具有序列识别号01的MdfA、源自里根斯堡预研菌(Yokenella regensburgei)(ATCC43003)之具有序列识别号02的MdfA、源自大肠杆菌(Escherichia coli)K-12MG1655之具有序列识别号03的MdfA、源自肠杆菌属(Enterobacter sp.)之具有序列识别号04的MdfA、源自克氏柠檬酸杆菌(Citrobacterkoseri)之具有序列识别号05的MFS、源自Citrobacter youngae之具有序列识别号06的MdfA、源自大肠杆菌(Escherichia coli)K-12MG1655之具有序列识别号07的YbdA、源自源自大肠杆菌(Escherichia coli)K-12MG1655之具有序列识别号08的YjhB、源自大肠杆菌(Escherichia coli)K-12MG1655之具有序列识别号09的WzxE、源自大肠杆菌(Escherichiacoli)K-12MG1655之具有序列识别号10的EmrE、源自长双歧杆菌婴儿亚种(Bifidobacterium longum subsp.Infantis)(菌株ATCC 15697)之具有序列识别号11的Blon_2331、源自长双歧杆菌婴儿亚种(Bifidobacterium longum subsp.Infantis)(菌株ATCC 15697)之具有序列识别号12的Blon_0247、源自长双歧杆菌婴儿亚种(Bifidobacterium longum subsp.Infantis)(菌株ATCC 15697)之具有序列识别号13的Blon_0345、源自肺炎克雷伯氏菌(Klebsiella pneumoniae)之具有序列识别号14的IceT、源自阪崎肠杆菌(Cronobacter sakazakii)菌株MOD1_LR753之具有序列识别号53的MdfA、源自粉末佛朗哥氏菌(Franconibacter pulveris)LMG 24059之具有序列识别号54的MdfA、源自霍氏肠杆菌(Enterobacter hormaechei)菌株017之具有序列识别号55的MdfA、源自克氏柠檬酸杆菌(Citrobacter koseri)菌株NCTC10771之具有序列识别号56的MdfA、源自肠道沙门氏菌arizonae亚种血清型41:z4,z23:-菌株TAMU30EF之具有序列识别号57的MdfA、源自副痢疾杆菌(Shigella flexneri)菌株585219之具有序列识别号58的MdfA、源自里根斯堡预研菌(Yokenella regensburgei)菌株UMB0819之具有序列识别号59的MdfA、源自大肠杆菌(Escherichia coli)菌株AMC_967之具有序列识别号60的MdfA、源自肺炎克雷伯氏菌(Klebsiella pneumoniae)VAKPC309之具有序列识别号61的MdfA、源自产酸克雷伯氏菌(Klebsiella oxytoca)菌株4928STDY7071490之具有序列识别号62的MdfA、源自密歇根克雷伯氏菌(Klebsiella michiganensis)菌株A2之具有序列识别号63的MdfA、源自Pluralibacter gergoviae菌株FDAARGOS_186之具有序列识别号64的MdfA或源自抗坏血克吕沃尔氏菌(Kluyvera ascorbata)ATCC 33433之具有序列识别号65的MdfA或以上任一运输膜蛋白之功能同源物(functional homolog)或功能性片段(functional fragment),或一蛋白质序列,其分别与具有序列识别号01、02、03、04、05、06、07、08、09、10、11、12、13、14、53、54、55、56、57、58、59、60、61、62、63、64或65的该膜蛋白之任一个的全长序列,具有至少80%之序列一致性(sequence identity);
b)当该膜蛋白系选自该P-P键水解驱动转运蛋白之群组,该膜蛋白系选自
-TCDB分类3.A.1.1及3.A.1.2之群组,或
-eggnog家族05CJ1、05DFW、05EZD、05I1K、07HR3及08IJ9之群组,或
-PFAM列表PF00005、PF00528、PF13407及PF17912,或
-interpro列表IPR000515、IPR003439、IPR003593、IPR005978、IPR008995、IPR013456、IPR015851、IPR017871、IPR025997、IPR027417、IPR028082、IPR035906及IPR040582,或
-源自长双歧杆菌婴儿亚种(Bifidobacterium longum subsp.Infantis)(菌株ATCC 15697)之具有序列识别号15的Blon_2475、源自大豆慢生根瘤菌(Bradyrhizobiumjaponicum)USDA 110之具有序列识别号16的nodi、源自大肠杆菌(Escherichia coli)K-12MG1655之具有序列识别号17的xylF、源自长双歧杆菌婴儿亚种(Bifidobacteriumlongum subsp.Infantis)Bi-26之具有序列识别号18的TIC77290、源自长双歧杆菌婴儿亚种(Bifidobacterium longum subsp.Infantis)Bi-26之具有序列识别号19的TIC77291、源自长双歧杆菌婴儿亚种(Bifidobacterium longum subsp.Infantis)Bi-26之具有序列识别号20的TIC76854 TIC77291,或以上任一P-P键水解驱动转运膜蛋白之功能同源物或功能性片段,或一蛋白质序列,其分别与具有序列识别号15、16、17、18、19或20的该膜蛋白的任一个的全长序列,具有至少80%之序列一致性;或
c)当该膜蛋白系选自该β-桶状孔蛋白之群组,该膜蛋白系选自
-TCDB分类1.B.18,或
-eggnog家族05DAY,或
-PFAM列表PF02563、PF10531及PF18412,或
-interpro列表IPR003715、IPR019554及IPR040716,或
-源自大肠杆菌(Escherichia coli)K-12MG1655之具有序列识别号21的Wza或其功能同源物或功能片段,或一蛋白质序列,其与具有序列识别号21的该膜蛋白的全长序列,具有至少80%之序列一致性;
其中该TCDB分类系由2019年6月17日发布之TCDB.org所定义、该eggnog家族系由2016年9月发布之eggnogdb 4.5.1所定义、该PFAM列表系由2018年9月所发布之Pfam 32.0所定义、该interpro列表系由2019年7月4日发布之InterPro 75.0所定义。
3.如实施例1或2之细胞,其中该膜蛋白系选自下列膜蛋白所组成之群组
a)该运输膜蛋白源自Cronobacter muytjensii之具有序列识别号01的Mdfa、源自里根斯堡预研菌(Yokenella regensburgei)(ATCC43003)之具有序列识别号02的MdfA、源自大肠杆菌(Escherichia coli)K-12MG1655之具有序列识别号03的MdfA、源自肠杆菌属(Enterobacter sp.)之具有序列识别号04的MdfA、源自克氏柠檬酸杆菌(Citrobacterkoseri)之具有序列识别号05的MFS、源自Citrobacter youngae之具有序列识别号06的MdfA、源自大肠杆菌(Escherichia coli)K-12MG1655之具有序列识别号07的YbdA、源自源自大肠杆菌(Escherichia coli)K-12MG1655之具有序列识别号08的YjhB、源自大肠杆菌(Escherichia coli)K-12MG1655之具有序列识别号09的WzxE、源自大肠杆菌(Escherichiacoli)K-12MG1655之具有序列识别号10的EmrE、源自长双歧杆菌婴儿亚种(Bifidobacterium longum subsp.Infantis)(菌株ATCC 15697)之具有序列识别号11的Blon_2331、源自长双歧杆菌婴儿亚种(Bifidobacterium longum subsp.Infantis)(菌株ATCC 15697)之具有序列识别号12的Blon_0247、源自长双歧杆菌婴儿亚种(Bifidobacterium longum subsp.Infantis)(菌株ATCC 15697)之具有序列识别号13的Blon_0345、源自肺炎克雷伯氏菌(Klebsiella pneumoniae)之具有序列识别号14的IceT、源自阪崎肠杆菌(Cronobacter sakazakii)菌株MOD1_LR753之具有序列识别号53的MdfA、源自粉末佛朗哥氏菌(Franconibacter pulveris)LMG 24059之具有序列识别号54的MdfA、源自霍氏肠杆菌(Enterobacter hormaechei)菌株017之具有序列识别号55的MdfA、源自克氏柠檬酸杆菌(Citrobacter koseri)菌株NCTC10771之具有序列识别号56的MdfA、源自肠道沙门氏菌arizonae亚种(Salmonella enterica subsp.arizonae)血清型41:z4,z23:-菌株TAMU30EF之具有序列识别号57的MdfA、源自副痢疾杆菌(Shigella flexneri)菌株585219之具有序列识别号58的MdfA、源自里根斯堡预研菌(Yokenella regensburgei)菌株UMB0819之具有序列识别号59的MdfA、源自大肠杆菌(Escherichia coli)菌株AMC_967之具有序列识别号60的MdfA、源自肺炎克雷伯氏菌(Klebsiella pneumoniae)VAKPC309之具有序列识别号61的MdfA、源自产酸克雷伯氏菌(Klebsiella oxytoca)菌株4928STDY7071490之具有序列识别号62的MdfA、源自密歇根克雷伯氏菌(Klebsiella michiganensis)菌株A2之具有序列识别号63的MdfA、源自Pluralibacter gergoviae菌株FDAARGOS_186之具有序列识别号64的MdfA或源自抗坏血克吕沃尔氏菌(Kluyvera ascorbata)ATCC 33433之具有序列识别号65的MdfA或以上任一运输膜蛋白之功能同源物或功能性片段,或一蛋白质序列,其分别与具有序列识别号01、02、03、04、05、06、07、08、09、10、11、12、13、14、53、54、55、56、57、58、59、60、61、62、63、64或65的该膜蛋白的全长序列,具有至少80%之序列一致性;及
b)该P-P键水解驱动转运蛋白源自长双歧杆菌婴儿亚种(Bifidobacteriumlongum subsp.Infantis)(菌株ATCC 15697)之具有序列识别号15的Blon_2475、源自大豆慢生根瘤菌(Bradyrhizobium japonicum)USDA 110之具有序列识别号16的nodi、源自大肠杆菌(Escherichia coli)K-12MG1655之具有序列识别号17的xylF、源自长双歧杆菌婴儿亚种(Bifidobacterium longum subsp.Infantis)Bi-26之具有序列识别号18的TIC77290、源自长双歧杆菌婴儿亚种(Bifidobacterium longum subsp.Infantis)Bi-26之具有序列识别号19的TIC77291、源自长双歧杆菌婴儿亚种(Bifidobacterium longumsubsp.Infantis)Bi-26之具有序列识别号20的TIC76854 TIC77291,或以上任一P-P键水解驱动转运膜蛋白之功能同源物或功能性片段,或一蛋白质序列,其与任一具有序列识别号15、16、17、18、19或20的该膜蛋白的全长序列,分别具有至少80%之序列一致性;及
c)该β-桶状膜孔蛋白源自大肠杆菌(Escherichia coli)K-12MG1655之具有序列识别号21的Wza或该Wza蛋白之功能同源物或功能片段,或一蛋白质序列,其与具有序列识别号21的该膜蛋白的全长序列,具有至少80%之序列一致性。
4.如实施例1至3任一项之细胞,其中该膜蛋白系参与运输化合物跨越细胞壁外膜之一转运蛋白。
5.如前方实施例任一项之细胞,其中该糖基转移酶系选自包括下列清单:岩藻糖基转移酶、唾液酸转移酶、半乳糖基转移酶、葡萄糖基转移酶、甘露糖基转移酶、N-乙酰葡萄糖胺转移酶、N-乙酰半乳糖胺转移酶、N-乙酰甘露糖胺转移酶、木糖基转移酶、葡萄糖醛酸转移酶、半乳糖醛酸转移酶、葡萄糖胺转移酶、N-羟乙酰神经氨酸转移酶、鼠李糖基转移酶、N-乙酰鼠李糖胺转移酶、UDP-4-氨基-4,6-二脱氧基-N-乙酰基-β-L-阿卓糖胺转氨酶(UDP-4-amino-4,6-dideoxy-N-acetyl-beta-L-altrosamine transaminases)、UDP-N-乙酰氨基葡萄糖胺烯醇丙酮基转移酶(UDP-N-acetylglucosamine enolpyruvyl transferases)及岩藻糖胺转移酶,
较佳为其中该细胞被至少一个该糖基转移酶修饰表达或活性。
6.如前方实施例任一项之细胞,其中该包括一乳糖-N-三糖(LN3;GlcNAc-beta1,3-Gal-beta1,4-Glc)作为一核心三糖的寡糖系选自包括下列清单:乳糖-N-三糖、乳糖-N-四糖、乳糖-N-新四糖、乳糖-N-岩藻五糖I、乳糖-N-新岩藻五糖I、乳糖-N-岩藻五糖II、乳糖-N-岩藻五糖III、乳糖-N-岩藻五糖V、乳糖-N-岩藻五糖VI、乳糖-N-新岩藻五糖V、乳糖-N-二岩藻六糖I、乳糖-N-二岩藻六糖II、乳糖-N-六糖(lacto-N-hexaose,LNH)、乳糖-N-新六糖(lacto-N-neohexaose,LNnH)、对-乳糖-N-六糖(para-lacto-N-hexaose,pLNnH)、对-乳糖-N-新六糖(para-lacto-N-neohexaose,pLNH)、二岩藻糖基-乳糖-N-六糖、二岩藻糖基-乳糖-N-新六糖、乳糖-N-五糖(lacto-N-pentaose,LNP)、乳糖-N-新五糖、对乳糖-N-五糖、对乳糖-N-新五糖、乳糖-N-novo五糖I、乳糖-N-七糖、乳糖-N-新七糖、对乳糖-N-新七糖、对乳糖-N-七糖、乳糖-N-八糖(lacto-N-octaose,LNO)、乳糖-N-新八糖、异乳糖-N-八糖、对乳糖-N-八糖、异乳糖-N-新八糖、novo乳糖-N-新八糖、对乳糖-N-新八糖、异乳糖-N-九糖、novo乳糖-N-九糖、乳糖-N-九糖、乳糖-N-十糖、异乳糖-N-十糖、novo乳糖-N-十糖、乳糖-N-新十糖、唾液酸基-乳糖-N-四糖a(Sialyl-lacto-N-tetraose a)、唾液酸基-乳糖-N-四糖b、唾液酸基-乳糖-N-四糖c、唾液酸基-乳糖-N-四糖d。
7.如前方实施例任一项之细胞,其中该糖基转移酶系一N-乙酰葡萄糖胺β-1,3-半乳糖基转移酶或一N-乙酰葡萄糖胺β-1,4-半乳糖基转移酶,其自一UDP-Gal供体透过一β-1,3或β-1,4键结转移一半乳糖(Gal)至LN3之末端GlcNAC残基上,从而分别产生乳糖-N-四糖(LNT;Gal-beta1,3-GlcNAc-beta1,3-Gal-beta1,4-Glc)或乳糖-N-新四糖(LNnT;Gal-beta1,4-GlcNAc-beta1,3-Gal-beta1,4-Glc)。
8.如实施例7之细胞,其中该细胞在整个肉汤(broth)及/或上清液中,产生90g/L或更多的LNT,及/或其中该LNT在整个肉汤及/或上清液中具有至少80%之一纯度,依据该细胞在整个肉汤及/或上清液中产生之LNT及LN3的总量所分别测量。
9.如实施例7之细胞,其中该细胞在整个肉汤及/或上清液中,产生90g/L或更多的LNnt及/或其中该LNnT在整个肉汤及/或上清液中具有至少80%之一纯度,依据该细胞在整个肉汤及/或上清液中产生之LNnT及LN3的总量所分别测量。
10.如前方实施例任一项之细胞,其中该细胞系更能合成一核苷酸活化糖,用于生产该包括一乳糖-N-三糖(LN3;GlcNAc-beta1,3-Gal-beta1,4-Glc)作为一核心三糖的寡糖。
11.如实施例10之细胞,其中该核苷酸活化糖系选自包括下列清单:UDP-N-乙酰半乳糖胺(UDP-GalNAc)、UDP-N-乙酰甘露糖胺(UDP-ManNAc)、UDP-葡萄糖(UDP-Glc)、UDP-半乳糖(UDP-Gal)、GDP-甘露糖(GDP-Man)、UDP-葡萄糖醛酸盐、UDP-半乳糖醛酸盐、UDP-2-乙酰氨基-2,6-二脱氧基-L-阿拉伯糖-4-己酮糖、UDP-2-乙酰氨基-2,6-二脱氧基-L-木糖-4-己酮糖(UDP-2-acetamido-2,6-dideoxy-L-lyxo-4-hexulose)、UDP-N-乙酰基-L-鼠李糖胺(UDP-L-RhaNAc或UDP-2-乙酰氨基-2,6-二脱氧基-L-甘露糖(UDP-2-acetamido-2,6-dideoxy-L-mannose))、dTDP-N-乙酰岩藻糖胺、UDP-N-乙酰岩藻糖胺(UDP-L-FucNAc或UDP-2-乙酰氨基-2,6-二脱氧基-L-半乳糖)、UDP-N-乙酰-L-脱氧塔罗糖胺(UDP-N-acetyl-L-pneumosamine)(UDP-L-PneNAC或UDP-2-乙酰氨基-2,6-二脱氧基-L-塔罗糖(UDP-2-acetamido-2,6-dideoxy-L-talose))、UDP-N-乙酰胞壁酸(UDP-N-acetylmuramic acid)、UDP-N-乙酰基-L-奎诺糖胺(UDP-N-acetyl-L-quinovosamine)(UDP-L-QuiNAc或UDP-2-乙酰氨基-2,6-二脱氧基-L-葡萄糖(UDP-2-acetamido-2,6-dideoxy-L-glucose))、CMP-唾液酸(CMP-Neu5Ac)、CMP-N-羟乙酰神经氨酸(CMP-Neu5Gc)、GDP-岩藻糖、GDP-鼠李糖及UDP-木糖。
12.如前方实施例任一项之细胞,其中该细胞包括一分解代谢途径,用于经选择之至少部分未活化之单、双或寡糖,该单、双或寡糖参与及/或需要于一包括LN3作为一核心三糖的寡糖之合成。
13.如前方实施例任一项之细胞,其中该细胞利用一前驱物以合成该包括LN3作为一核心三糖的寡糖。
14.如前方实施例任一项之细胞,其中该膜蛋白参与一前驱物之摄取,以合成该包括LN3作为一核心三糖的寡糖。
15.如前方实施例任一项之细胞,其中该细胞产生一前驱物,以合成该包括LN3作为一核心三糖的寡糖。
16.如前方实施例任一项之细胞,其中该细胞系稳定地培养于培养基(medium)中。
17.如前方实施例任一项之细胞,其中该细胞系选自由微生物、植物或动物细胞所组成之群组,较佳为该微生物系一细菌、真菌或一酵母菌,较佳为该植物系一米、棉、油菜、大豆、玉蜀黍或玉米植物,较佳为该动物为昆虫、鱼、鸟或非人类之哺乳动物。
18.如实施例17之细胞,其中该细胞系一细菌,较佳为一大肠杆菌菌株,更佳为一K-12菌株之大肠杆菌菌株之细胞、甚至更佳为该大肠杆菌K-12菌株为E.coli MG1655。
19.前方实施例任一项之细胞,其中该包括LN3作为一核心三糖之寡糖为一哺乳动物乳寡糖或一或一Lewis型抗原寡糖。
20.如前方实施例任一项之细胞,其中该细胞具有合成包括至少一寡糖之一寡糖混合物的能力,该至少一寡糖包括LN3作为一核心三糖。
21.一种藉由一基因修饰细胞产生一包括一乳糖-N-三糖(LN3;GlcNAc-beta1,3-Gal-beta1,4-Glc)作为一核心三糖的寡糖的方法,包括步骤:
a)提供如实施例1至20任一项之一细胞,及
b)在允许产生该包括LN3作为一核心三糖的寡糖之条件下,培养该细胞于一培养基中,
c)将该包括LN3作为一核心三糖的寡糖或包括至少一寡糖之一寡糖混合物,分别自该培养分离,该至少一寡糖包括LN3作为一核心三糖。
22.如实施例21之方法,该方法更包括至少一下列步骤:
i)添加一乳糖给料于该培养培养基,该乳糖给料包括至少50、更佳为至少75、更佳为至少100、更佳为至少120、更佳为至少150克乳糖每升之初始反应器体积(initialreactor volum),其中该反应器体积介于250mL至10.000m3(立方米)范围之间,较佳为以一连续方式,且较佳为以使该培养培养基之最终体积为不多于添加该乳糖给料前该培养培养基之体积的三倍、较佳为不多于两倍、更佳为少于两倍;
ii)藉由一给料溶液,在1日、2日、3日、4日、5日之过程中,以一连续方式添加一乳糖给料于培养培养基;
iii)藉由一给料溶液,在1日、2日、3日、4日、5日之过程中,以一连续方式添加一乳糖给料于培养培养基,且其中该乳糖给料溶液之浓度为50g/L、较佳为75g/L、更佳为100g/L、更佳为125g/L、更佳为150g/L、更佳为175g/L、更佳为200g/L、更佳为225g/L、更佳为250g/L、275g/L、更佳为300g/L、更佳为325g/L、更佳为350g/L、更佳为375g/L、更佳为400g/L、更佳为450g/L、更佳为500g/L、甚至更佳为550g/L、最佳为600g/L;以及较佳为该溶液之PH值系设定于3至7之间,且其中较佳为该给料溶液之温度为保持于20℃至80℃之间;
该方法致生一包括一乳糖-N-三糖(LN3;GlcNAc-beta1,3-Gal-beta1,4-Glc)作为一核心三糖的寡糖,其于该培养培养基之最终体积中具有至少50g/L、较佳为至少75g/L、更佳为至少90g/L、更佳为至少100g/L、更佳为至少125g/L、更佳为至少150g/L、更佳为至少175g/L、更佳为至少200g/L的浓度。
23.如实施例22之方法,其中该乳糖给料,系透过自开始培养时以至少5mM的浓度、较佳为以至少30、40、50、60、70、80、90、100、150mM的浓度、更佳为以大于300mM的浓度添加乳糖来达成。
24.如实施例22或23任一项之方法,其中该乳糖给料,系透过以一浓度之添加乳糖至培养培养基来达成,以致在整个培养之生产阶段,获得浓度至少为5mM、较佳为至少10mM或30mM的一乳糖。
25.如实施例21至24任一项之方法,其中该宿主细胞被培养至少约60、80、100或约120小时,或以连续方式培养。
26.如实施例21至25任一项之方法,其中一碳及能量来源,较佳为葡萄糖、甘油、果糖、麦芽糖、阿拉伯糖、麦芽糊精、麦芽寡糖(malto-oligosacchraides)、麦芽三糖、山梨醇、木糖、鼠李糖、蔗糖、半乳糖、甘露糖、甲醇、乙醇、海藻糖、淀粉、纤维素、半纤维素、多元醇、玉米浸液(corn-steep liquor)、高果糖浆(high-fructose syrup)、琥珀酸盐、苹果酸盐、醋酸盐、柠檬酸盐、乳酸及丙酮酸盐,亦被添加,较佳为持续添加至培养培养基,并较佳为搭配乳糖。
27.如实施例21至26任一项之方法,其中指数细胞成长之一第一期,系藉由在第二期添加乳糖至该培养培养基之前,添加一碳基底物且较佳为葡萄糖或果糖至该培养培养基来提供。
28.如实施例21至27任一项之方法,其中该分离包括至少一下列步骤:澄清(clarification)、超过滤、纳米过滤、逆渗透、微过滤、活性炭或碳处理、切向流高效能过滤(tangential flow high-performance filtration)、切向流超过滤(tangential flowultrafiltration)、亲和力层析、离子交换层析、疏水性相互作用层析及/或凝胶过滤、配位基交换层析。
29.如实施例21至28任一项之方法,更包括分别自该细胞纯化该包括LN3作为一核心三糖的寡糖或包括至少一寡糖的寡糖混合物,该至少一寡糖包括LN3作为一核心三糖。
30.如实施例21至29任一项之方法,其中该纯化包括至少一下列步骤:利用活性炭或碳、利用木炭、纳米过滤、超过滤或离子交换、利用醇类、利用含水醇类混合物、结晶化、蒸发、沉淀、干燥、喷雾干燥或冷冻干燥。
31.一种选自如实施例1至4任一项中所定义之膜蛋白之群组的一膜蛋白于发酵生产一包括LN3作为一核心三糖的寡糖中的用途。
32.一种如实施例1至19项之一细胞用于产生一包括LN3作为一核心三糖的寡糖的用途。
33.一种如实施例20之一细胞用于产生一包括至少一寡糖之寡糖混合物的用途,该至少一寡糖包括LN3作为一核心三糖。
34.一种如实施例21至30任一项之一方法用于产生一包括LN3作为一核心三糖的寡糖的用途。
此外,本发明系关于以下较佳特定实施例:
1.一种宿主细胞,其经基因修饰以产生一包括一乳糖-N-三糖(LN3;GlcNAc-beta1,3-Gal-beta1,4-Glc)作为一核心三糖的寡糖,其中该宿主细胞包括及表达一半乳糖苷-β-1,3-N-乙酰葡萄糖胺转移酶(galactoside beta-1,3-N-acetylglucosaminyltransferase)的至少一核酸序列,该半乳糖苷-β-1,3-N-乙酰葡萄糖胺转移酶自一UDP-GlcNAc供体转移一N-乙酰葡萄糖胺(GlcNAc)残基至一乳糖受体上,从而合成LN3,
-该细胞更包括:(i)一内源膜蛋白的过表达及/或(ii)一异源膜蛋白的表达,以提供一包括LN3作为一核心三糖的寡糖的(a)经改良的生产及/或(b)经启动及/或经提升的排出,较佳为其中该经改良的生产及该经提升的排出,系相较于具有一同一基因背景但欠缺该过表达一内源膜蛋白及该表达一异源膜蛋白的宿主细胞,
-较佳为该细胞更包括及表达编码一糖基转移酶(glycosyltransferase)的至少一核酸序列,该糖基转移酶具有修饰该LN3之能力,
其中视需要而定的该经改良的生产包括:
-较佳的该寡糖滴定量(克寡糖/升),
-较佳的生产率r(克寡糖/升·小时),
-较佳的细胞效能指数(cell performance index)(克寡糖/克生物量),
-较佳的单位生产力(specific productivity)(克寡糖/克生物量·小时),
-较佳的蔗糖产量(yield)(克寡糖/克蔗糖),及/或
-较佳的蔗糖摄取/转化率(克蔗糖/克·小时),
-较佳的乳糖转化/消耗率(克乳糖/小时),及/或
-经提升的该宿主细胞之生长速度。
2.如权利要求1之细胞,其中该膜蛋白系选自运输蛋白(porters)、P-P键水解驱动转运蛋白(P-P-bond-hydrolysis-driven transporters)、及β-桶状孔蛋白(β-BarrelPorins)之群组,其中,
a)当该膜蛋白系选自该运输蛋白之群组,该膜蛋白系选自
-TCDB分类2.A.1.1、2.A.1.2、2.A.1.3、2.A.1.6、2.A.2.2、2.A.7.1及2.A.66之群组,或
-eggnog家族05E8G、05EGZ、05JHE、07QF7、07QRN、07RBJ、0814C及08N8A之群组,或
-PFAM列表PF00893、PF01943、PF05977、PF07690及PF13347,或
-interpro列表IPR000390、IPR001411、IPR001927、IPR002797、IPR004638、IPR005829、IPR010290、IPR011701、IPR020846、IPR023721、IPR023722、IPR032896、IPR036259及IPR039672,或
-源自Cronobacter muytjensii之具有序列识别号01的MdfA、源自里根斯堡预研菌(Yokenella regensburgei)(ATCC43003)之具有序列识别号02的MdfA、源自大肠杆菌(Escherichia coli)K-12MG1655之具有序列识别号03的MdfA、源自肠杆菌属(Enterobacter sp.)之具有序列识别号04的MdfA、源自克氏柠檬酸杆菌(Citrobacterkoseri)之具有序列识别号05的MFS、源自Citrobacter youngae之具有序列识别号06的MdfA、源自大肠杆菌(Escherichia coli)K-12MG1655之具有序列识别号07的YbdA、源自源自大肠杆菌(Escherichia coli)K-12MG1655之具有序列识别号08的YjhB、源自大肠杆菌(Escherichia coli)K-12MG1655之具有序列识别号09的WzxE、源自大肠杆菌(Escherichiacoli)K-12MG1655之具有序列识别号10的EmrE、源自长双歧杆菌婴儿亚种(Bifidobacterium longum subsp.Infantis)(菌株ATCC 15697)之具有序列识别号11的Blon_2331、源自长双歧杆菌婴儿亚种(Bifidobacterium longum subsp.Infantis)(菌株ATCC 15697)之具有序列识别号12的Blon_0247、源自长双歧杆菌婴儿亚种(Bifidobacterium longum subsp.Infantis)(菌株ATCC 15697)之具有序列识别号13的Blon_0345、源自肺炎克雷伯氏菌(Klebsiella pneumoniae)之具有序列识别号14的IceT、源自阪崎肠杆菌(Cronobacter sakazakii)菌株MOD1_LR753之具有序列识别号53的MdfA、源自粉末佛朗哥氏菌(Franconibacter pulveris)LMG 24059之具有序列识别号54的MdfA、源自霍氏肠杆菌(Enterobacter hormaechei)菌株017之具有序列识别号55的MdfA、源自克氏柠檬酸杆菌(Citrobacter koseri)菌株NCTC10771之具有序列识别号56的MdfA、源自Salmonella enterica subsp.arizonae血清型41:z4,z23:-菌株TAMU30EF之具有序列识别号57的MdfA、源自副痢疾杆菌(Shigella flexneri)菌株585219之具有序列识别号58的MdfA、源自里根斯堡预研菌(Yokenella regensburgei)菌株UMB0819之具有序列识别号59的MdfA、源自大肠杆菌(Escherichia coli)菌株AMC_967之具有序列识别号60的MdfA、源自肺炎克雷伯氏菌(Klebsiella pneumoniae)VAKPC309之具有序列识别号61的MdfA、源自产酸克雷伯氏菌(Klebsiella oxytoca)菌株4928STDY7071490之具有序列识别号62的MdfA、源自密歇根克雷伯氏菌(Klebsiella michiganensis)菌株A2之具有序列识别号63的MdfA、源自Pluralibacter gergoviae菌株FDAARGOS_186之具有序列识别号64的MdfA、源自抗坏血克吕沃尔氏菌(Kluyvera ascorbata)ATCC 33433之具有序列识别号65的MdfA、神户肠杆菌(Enterobacter kobei)之具有序列识别号66的MdfA、源自莱略特菌属(Lelliottia sp.)WB101之具有序列识别号67的MdfA、源自弗氏柠檬酸杆菌(Citrobacter freundii)之具有序列识别号68的MdfA、源自肠道沙门氏菌Salamae亚种(Salmonella entericasubsp.Salamae)之具有序列识别号69的MdfA或源自副痢疾杆菌(Shigella flexneri)之具有序列识别号70的MdfA,或以上任一运输膜蛋白之功能同源物(functional homolog)或功能性片段(functional fragment),或一蛋白质序列,其分别与具有序列识别号01、02、03、04、05、06、07、08、09、10、11、12、13、14、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69或70的该膜蛋白之任一个的全长序列,具有至少80%、较佳为至少85%、更佳为至少90%、甚至更佳为至少95.00%、最佳为至少97.00%之序列一致性(sequenceidentity);
b)当该膜蛋白系选自该P-P键水解驱动转运蛋白之群组,该膜蛋白系选自
-TCDB分类3.A.1.1及3.A.1.2之群组,或
-eggnog家族05CJ1、05DFW、05EZD、05I1K、07HR3及08IJ9之群组,或
-PFAM列表PF00005、PF00528、PF13407及PF17912,或
-interpro列表IPR000515、IPR003439、IPR003593、IPR005978、IPR008995、IPR013456、IPR015851、IPR017871、IPR025997、IPR027417、IPR028082、IPR035906及IPR040582,或
-源自长双歧杆菌婴儿亚种(Bifidobacterium longum subsp.Infantis)(菌株ATCC 15697)之具有序列识别号15的Blon_2475、源自大豆慢生根瘤菌(Bradyrhizobiumjaponicum)USDA 110之具有序列识别号16的nodi、源自大肠杆菌(Escherichia coli)K-12MG1655之具有序列识别号17的xylF、源自长双歧杆菌婴儿亚种(Bifidobacteriumlongum subsp.Infantis)Bi-26之具有序列识别号18的TIC77290、源自长双歧杆菌婴儿亚种(Bifidobacterium longum subsp.Infantis)Bi-26之具有序列识别号19的TIC77291、源自长双歧杆菌婴儿亚种(Bifidobacterium longum subsp.Infantis)Bi-26之具有序列识别号20的TIC76854 TIC77291,或以上任一P-P键水解驱动转运膜蛋白之功能同源物或功能性片段,或一蛋白质序列,其分别与具有序列识别号15、16、17、18、19或20的该膜蛋白的任一个的全长序列,具有至少80%、较佳为至少85%、更佳为至少90%、甚至更佳为至少95.00%、最佳为至少97.00%之序列一致性;或
c)当该膜蛋白系选自该β-桶状孔蛋白之群组,该膜蛋白系选自
-TCDB分类1.B.18,或
-eggnog家族05DAY,或
-PFAM列表PF02563、PF10531及PF18412,或
-interpro列表IPR003715、IPR019554及IPR040716,或
-源自大肠杆菌(Escherichia coli)K-12MG1655之具有序列识别号21的Wza或其功能同源物或功能片段,或一蛋白质序列,其与具有序列识别号21的该膜蛋白的全长序列,具有至少80%、较佳为至少85%、更佳为至少90%、甚至更佳为至少95.00%、最佳为至少97.00%之序列一致性;
其中该TCDB分类系由2019年6月17日发布之TCDB.org所定义、该eggnog家族系由2016年9月发布之eggnogdb 4.5.1所定义、该PFAM列表系由2018年9月所发布之Pfam 32.0所定义、该interpro列表系由2019年7月4日发布之InterPro 75.0所定义。
3.如权利要求1或2之细胞,其中该膜蛋白系选自下列膜蛋白所组成之群组
a)该运输膜蛋白源自Cronobacter muytjensii之具有序列识别号01的Mdfa、源自里根斯堡预研菌(Yokenella regensburgei)(ATCC43003)之具有序列识别号02的MdfA、源自大肠杆菌(Escherichia coli)K-12MG1655之具有序列识别号03的MdfA、源自肠杆菌属(Enterobacter sp.)之具有序列识别号04的MdfA、源自克氏柠檬酸杆菌(Citrobacterkoseri)之具有序列识别号05的MFS、源自Citrobacter youngae之具有序列识别号06的MdfA、源自大肠杆菌(Escherichia coli)K-12MG1655之具有序列识别号07的YbdA、源自源自大肠杆菌(Escherichia coli)K-12MG1655之具有序列识别号08的YjhB、源自大肠杆菌(Escherichia coli)K-12MG1655之具有序列识别号09的WzxE、源自大肠杆菌(Escherichiacoli)K-12MG1655之具有序列识别号10的EmrE、源自长双歧杆菌婴儿亚种(Bifidobacterium longum subsp.Infantis)(菌株ATCC 15697)之具有序列识别号11的Blon_2331、源自长双歧杆菌婴儿亚种(Bifidobacterium longum subsp.Infantis)(菌株ATCC 15697)之具有序列识别号12的Blon_0247、源自长双歧杆菌婴儿亚种(Bifidobacterium longum subsp.Infantis)(菌株ATCC 15697)之具有序列识别号13的Blon_0345、源自肺炎克雷伯氏菌(Klebsiella pneumoniae)之具有序列识别号14的IceT、源自阪崎肠杆菌(Cronobacter sakazakii)菌株MOD1_LR753之具有序列识别号53的MdfA、源自粉末佛朗哥氏菌(Franconibacter pulveris)LMG 24059之具有序列识别号54的MdfA、源自霍氏肠杆菌(Enterobacter hormaechei)菌株017之具有序列识别号55的MdfA、源自克氏柠檬酸杆菌(Citrobacter koseri)菌株NCTC10771之具有序列识别号56的MdfA、源自肠道沙门氏菌arizonae亚种(Salmonella enterica subsp.arizonae)血清型41:z4,z23:-菌株TAMU30EF之具有序列识别号57的MdfA、源自副痢疾杆菌(Shigella flexneri)菌株585219之具有序列识别号58的MdfA、源自里根斯堡预研菌(Yokenella regensburgei)菌株UMB0819之具有序列识别号59的MdfA、源自大肠杆菌(Escherichia coli)菌株AMC_967之具有序列识别号60的MdfA、源自肺炎克雷伯氏菌(Klebsiella pneumoniae)VAKPC309之具有序列识别号61的MdfA、源自产酸克雷伯氏菌(Klebsiella oxytoca)菌株4928STDY7071490之具有序列识别号62的MdfA、源自密歇根克雷伯氏菌(Klebsiella michiganensis)菌株A2之具有序列识别号63的MdfA、源自Pluralibacter gergoviae菌株FDAARGOS_186之具有序列识别号64的MdfA、源自抗坏血克吕沃尔氏菌(Kluyvera ascorbata)ATCC 33433之具有序列识别号65的MdfA、神户肠杆菌(Enterobacter kobei)之具有序列识别号66的MdfA、源自莱略特菌属(Lelliottia sp.)WB101之具有序列识别号67的MdfA、源自弗氏柠檬酸杆菌(Citrobacter freundii)之具有序列识别号68的MdfA、源自肠道沙门氏菌Salamae亚种(Salmonella enterica subsp.Salamae)之具有序列识别号69的MdfA或源自副痢疾杆菌(Shigella flexneri)之具有序列识别号70的MdfA,或以上任一运输膜蛋白之功能同源物或功能性片段,或一蛋白质序列,其分别与具有序列识别号01、02、03、04、05、06、07、08、09、10、11、12、13、14、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69或70的该膜蛋白的全长序列,具有至少80%、较佳为至少85%、更佳为至少90%、甚至更佳为至少95.00%、最佳为至少97.00%之序列一致性;及
b)该P-P键水解驱动转运蛋白源自长双歧杆菌婴儿亚种(Bifidobacteriumlongum subsp.Infantis)(菌株ATCC 15697)之具有序列识别号15的Blon_2475、源自大豆慢生根瘤菌(Bradyrhizobium japonicum)USDA 110之具有序列识别号16的nodi、源自大肠杆菌(Escherichia coli)K-12MG1655之具有序列识别号17的xylF、源自长双歧杆菌婴儿亚种(Bifidobacterium longum subsp.Infantis)Bi-26之具有序列识别号18的TIC77290、源自长双歧杆菌婴儿亚种(Bifidobacterium longum subsp.Infantis)Bi-26之具有序列识别号19的TIC77291、源自长双歧杆菌婴儿亚种(Bifidobacterium longumsubsp.Infantis)Bi-26之具有序列识别号20的TIC76854 TIC77291,或以上任一P-P键水解驱动转运膜蛋白之功能同源物或功能性片段,或一蛋白质序列,其与任一具有序列识别号15、16、17、18、19或20的该膜蛋白的全长序列,分别具有至少80%、较佳为至少85%、更佳为至少90%、甚至更佳为至少95.00%、最佳为至少97.00%之序列一致性;及
c)该β-桶状膜孔蛋白源自大肠杆菌(Escherichia coli)K-12MG1655之具有序列识别号21的Wza或该Wza蛋白之功能同源物或功能片段,或一蛋白质序列,其与具有序列识别号21的该膜蛋白的全长序列,具有至少80%、较佳为至少85%、更佳为至少90%、甚至更佳为至少95.00%、最佳为至少97.00%之序列一致性。
4.如权利要求1至3任一项之细胞,其中该膜蛋白系选自下列膜蛋白所组成之群组
a)以序列识别号01、02、04、05、06、09、10、11、12、13、14、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69或70表示的该运输膜蛋白,或该任一运输膜蛋白之功能同源物或功能性片段,或一蛋白质序列,其分别与具有序列识别号01、02、04、05、06、09、10、11、12、13、14、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69或70的该膜蛋白的全长序列,具有至少80%、较佳为至少85%、更佳为至少90%、甚至更佳为至少95.00%、最佳为至少97.00%之序列一致性;及
b)以序列识别号15、16、17、18、19或20表示的该P-P键水解驱动转运蛋白,或该任一P-P键水解驱动转运膜蛋白之功能同源物或功能性片段,或一蛋白质序列,其分别与具有序列识别号15、16、17、18、19或20的该膜蛋白的全长序列,具有至少80%、较佳为至少85%、更佳为至少90%、甚至更佳为至少95.00%、最佳为至少97.00%之序列一致性;及
c)以序列识别号21表示的该β-桶状膜孔蛋白,或该β-桶状膜孔蛋白之功能同源物或功能片段,或一蛋白质序列,其与具有序列识别号21的该膜蛋白的全长序列,具有至少80%、较佳为至少85%、更佳为至少90%、甚至更佳为至少95.00%、最佳为至少97.00%之序列一致性。
5.如权利要求1至4任一项之细胞,其中该膜蛋白系选自下列膜蛋白所组成之群组
a)以序列识别号01、02、04、05、06、09、10、11、12、13、14、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69或70表示的该运输膜蛋白,或该运输膜蛋白之任一个的功能同源物或功能性片段,或一蛋白质序列:
-分别与具有序列识别号09、10、11、12或13的该膜蛋白的全长序列具有至少80%之序列一致性,
-分别与具有序列识别号01、02、04、14、53、54、55、59、61、62、63、64、65、66、67或69的该膜蛋白的全长序列具有至少90%之序列一致性,
-分别与具有序列识别号05、06、56、57或68的该膜蛋白的全长序列具有至少95.00%之的序列一致性,或
-分别与具有序列识别号58、60或70的该膜蛋白的全长序列具有至少99.00%之的序列一致性,及
b)以序列识别号15、16、17、18、19或20表示的该P-P键水解驱动转运蛋白,或该任一P-P键水解驱动转运膜蛋白之功能同源物或功能性片段,或一蛋白质序列,其分别与具有序列识别号15、16、17、18、19或20的该膜蛋白的全长序列,具有至少80%、较佳为至少85%、更佳为至少90%、甚至更佳为至少95.00%、最佳为至少97.00%之序列一致性;及
c)以序列识别号21表示的该β-桶状膜孔蛋白,或该β-桶状膜孔蛋白之功能同源物或功能片段,或一蛋白质序列,其与具有序列识别号21的该膜蛋白的全长序列,具有至少80%、较佳为至少85%、更佳为至少90%、甚至更佳为至少95.00%、最佳为至少97.00%之序列一致性。
6.如权利要求1至4任一项之细胞,其中该膜蛋白系选自下列膜蛋白所组成之群组
a)以序列识别号01、02、04、09、10、11、12、13、14、53、54、55、59、61、62、63、64、65、66、67或69表示的该运输膜蛋白,或该任一运输膜蛋白之功能同源物或功能性片段,或一蛋白质序列,其分别与具有序列识别号01、02、04、09、10、11、12、13、14、53、54、55、59、61、62、63、64、65、66、67或69的该膜蛋白的全长序列,具有至少80%、较佳为至少85%、更佳为至少90%、甚至更佳为至少95.00%、最佳为至少97.00%之序列一致性;及
b)以序列识别号15、16、17、18、19或20表示的该P-P键水解驱动转运蛋白,或该任一P-P键水解驱动转运膜蛋白之功能同源物或功能性片段,或一蛋白质序列,其分别与具有序列识别号15、16、17、18、19或20的该膜蛋白的全长序列,具有至少80%、较佳为至少85%、更佳为至少90%、甚至更佳为至少95.00%、最佳为至少97.00%之序列一致性;及
c)以序列识别号21表示的该β-桶状膜孔蛋白,或该β-桶状膜孔蛋白之功能同源物或功能片段,或一蛋白质序列,其与具有序列识别号21的该膜蛋白的全长序列,具有至少80%、较佳为至少85%、更佳为至少90%、甚至更佳为至少95.00%、最佳为至少97.00%之序列一致性。
7.如权利要求1至4任一项或第6项之细胞,其中该膜蛋白系选自下列膜蛋白所组成之群组
a)以序列识别号01、02、04、09、10、11、12、13、14、53、54、55、59、61、62、63、64、65、66、67或69表示的该运输膜蛋白,或该任一运输膜蛋白之功能同源物或功能性片段,或一蛋白质序列,其分别与具有序列识别号01、02、04、09、10、11、12、13、14、53、54、55、59、61、62、63、64、65、66、67或69的该膜蛋白的全长序列,具有至少90%、较佳为至少95.00%、更佳为至少97.00%之序列一致性;及
b)以序列识别号15、16、17、18、19或20表示的该P-P键水解驱动转运蛋白,或该任一P-P键水解驱动转运膜蛋白之功能同源物或功能性片段,或一蛋白质序列,其分别与具有序列识别号15、16、17、18、19或20的该膜蛋白的全长序列,具有至少80%、较佳为至少85%、更佳为至少90%、甚至更佳为至少95.00%、最佳为至少97.00%之序列一致性;及
c)以序列识别号21表示的该β-桶状膜孔蛋白,或该β-桶状膜孔蛋白之功能同源物或功能片段,或一蛋白质序列,其与具有序列识别号21的该膜蛋白的全长序列,具有至少80%、较佳为至少85%、更佳为至少90%、甚至更佳为至少95.00%、最佳为至少97.00%之序列一致性。
8.如权利要求1至3任一项之细胞,其中该膜蛋白系选自下列膜蛋白所组成之群组
a)以序列识别号01、02、03、04、05、06、07、08、09、10、11、12、13、14、53、54、55、56、57、58、59、60、61、62、63、64或65表示的该运输膜蛋白,或该任一运输膜蛋白之功能同源物或功能性片段,或一蛋白质序列,其分别与具有序列识别号01、02、03、04、05、06、07、08、09、10、11、12、13、14、53、54、55、56、57、58、59、60、61、62、63、64或65的该膜蛋白的全长序列,具有至少80%、较佳为至少85%、更佳为至少90%、甚至更佳为至少95.00%、最佳为至少97.00%之序列一致性;及
b)以序列识别号15、16、17、18、19或20表示的该P-P键水解驱动转运蛋白,或该任一P-P键水解驱动转运膜蛋白之功能同源物或功能性片段,或一蛋白质序列,其分别与具有序列识别号15、16、17、18、19或20的该膜蛋白的全长序列,具有至少80%、较佳为至少85%、更佳为至少90%、甚至更佳为至少95.00%、最佳为至少97.00%之序列一致性;及
c)以序列识别号21表示的该β-桶状膜孔蛋白,或该β-桶状膜孔蛋白之功能同源物或功能片段,或一蛋白质序列,其与具有序列识别号21的该膜蛋白的全长序列,具有至少80%、较佳为至少85%、更佳为至少90%、甚至更佳为至少95.00%、最佳为至少97.00%之序列一致性。
9.如权利要求1至3任一项或第8项之细胞,其中该膜蛋白系选自下列膜蛋白所组成之群组
a)以序列识别号01、02、04、05、06、09、10、11、12、13、14、53、54、55、56、57、58、59、60、61、62、63、64或65表示的该运输膜蛋白,或该任一运输膜蛋白之功能同源物或功能性片段,或一蛋白质序列,其分别与具有序列识别号01、02、04、05、06、09、10、11、12、13、14、53、54、55、56、57、58、59、60、61、62、63、64或65的该膜蛋白的全长序列,具有至少80%、较佳为至少85%、更佳为至少90%、甚至更佳为至少95.00%、最佳为至少97.00%之序列一致性;及
b)以序列识别号15、16、17、18、19或20表示的该P-P键水解驱动转运蛋白,或该任一P-P键水解驱动转运膜蛋白之功能同源物或功能性片段,或一蛋白质序列,其分别与具有序列识别号15、16、17、18、19或20的该膜蛋白的全长序列,具有至少80%、较佳为至少85%、更佳为至少90%、甚至更佳为至少95.00%、最佳为至少97.00%之序列一致性;及
c)以序列识别号21表示的该β-桶状膜孔蛋白,或该β-桶状膜孔蛋白之功能同源物或功能片段,或一蛋白质序列,其与具有序列识别号21的该膜蛋白的全长序列,具有至少80%、较佳为至少85%、更佳为至少90%、甚至更佳为至少95.00%、最佳为至少97.00%之序列一致性。
10.如权利要求1至3、8或9任一项之细胞,其中该膜蛋白系选自下列膜蛋白所组成之群组
a)以序列识别号01、02、04、05、06、09、10、11、12、13、14、53、54、55、56、57、58、59、60、61、62、63、64或65表示的该运输膜蛋白,或该任一运输膜蛋白之功能同源物或功能性片段,或一蛋白质序列:
-分别与具有序列识别号09、10、11、12或13的该膜蛋白的全长序列具有至少80%之序列一致性,
-分别与具有序列识别号01、02、04、14、53、54、55、59、61、62、63、64或65的该膜蛋白的全长序列具有至少90%之序列一致性,
-分别与具有序列识别号05、06、56或57的该膜蛋白的全长序列具有至少95.00%之的序列一致性,或
-分别与具有序列识别号58或60的该膜蛋白的全长序列具有至少99.00%之的序列一致性,及
b)以序列识别号15、16、17、18、19或20表示的该P-P键水解驱动转运蛋白,或该任一P-P键水解驱动转运膜蛋白之功能同源物或功能性片段,或一蛋白质序列,其分别与具有序列识别号15、16、17、18、19或20的该膜蛋白的全长序列,具有至少80%、较佳为至少85%、更佳为至少90%、甚至更佳为至少95.00%、最佳为至少97.00%之序列一致性;及
c)以序列识别号21表示的该β-桶状膜孔蛋白,或该β-桶状膜孔蛋白之功能同源物或功能片段,或一蛋白质序列,其与具有序列识别号21的该膜蛋白的全长序列,具有至少80%、较佳为至少85%、更佳为至少90%、甚至更佳为至少95.00%、最佳为至少97.00%之序列一致性。
11.如权利要求1至3、8或9任一项之细胞,其中该膜蛋白系选自下列膜蛋白所组成之群组
a)以序列识别号01、02、04、09、10、11、12、13、14、53、54、55、59、61、62、63、64或65表示的该运输膜蛋白,或该任一运输膜蛋白之功能同源物或功能性片段,或一蛋白质序列,其分别与具有序列识别号01、02、04、09、10、11、12、13、14、53、54、55、59、61、62、63、64或65的该膜蛋白的全长序列,具有至少80%、较佳为至少85%、更佳为至少90%、甚至更佳为至少95.00%、最佳为至少97.00%之序列一致性;及
b)以序列识别号15、16、17、18、19或20表示的该P-P键水解驱动转运蛋白,或该任一P-P键水解驱动转运膜蛋白之功能同源物或功能性片段,或一蛋白质序列,其分别与序列识别号15、16、17、18、19或20的该膜蛋白的全长序列,具有至少80%、较佳为至少85%、更佳为至少90%、甚至更佳为至少95.00%、最佳为至少97.00%之序列一致性;及
c)以序列识别号21表示的该β-桶状膜孔蛋白,或该β-桶状膜孔蛋白之功能同源物或功能片段,或一蛋白质序列,其与具有序列识别号21的该膜蛋白的全长序列,具有至少80%、较佳为至少85%、更佳为至少90%、甚至更佳为至少95.00%、最佳为至少97.00%之序列一致性。
12.如权利要求1至3、8、9或11任一项之细胞,其中该膜蛋白系选自下列膜蛋白所组成之群组
a)以序列识别号01、02、04、09、10、11、12、13、14、53、54、55、59、61、62、63、64或65表示的该运输膜蛋白,或该任一运输膜蛋白之功能同源物或功能性片段,或一蛋白质序列,其分别与具有序列识别号01、02、04、09、10、11、12、13、14、53、54、55、59、61、62、63、64或65的该膜蛋白的全长序列,具有至少90%、较佳为至少95.00%、更佳为至少97.00%之序列一致性;及
b)以序列识别号15、16、17、18、19或20表示的该P-P键水解驱动转运蛋白,或该任一P-P键水解驱动转运膜蛋白之功能同源物或功能性片段,或一蛋白质序列,其分别与具有序列识别号15、16、17、18、19或20的该膜蛋白的全长序列,具有至少80%、较佳为至少85%、更佳为至少90%、甚至更佳为至少95.00%、最佳为至少97.00%之序列一致性;及
c)以序列识别号21表示的该β-桶状膜孔蛋白,或该β-桶状膜孔蛋白之功能同源物或功能片段,或一蛋白质序列,其与具有序列识别号21的该膜蛋白的全长序列,具有至少80%、较佳为至少85%、更佳为至少90%、甚至更佳为至少95.00%、最佳为至少97.00%之序列一致性。
13.如权利要求1至12任一项之细胞,其中该膜蛋白系参与运输化合物跨越细胞壁外膜之一转运蛋白。
14.如权利要求1至13任一项之细胞,其中该糖基转移酶系选自包括下列清单:岩藻糖基转移酶、唾液酸转移酶、半乳糖基转移酶、葡萄糖基转移酶、甘露糖基转移酶、N-乙酰葡萄糖胺转移酶、N-乙酰半乳糖胺转移酶、N-乙酰甘露糖胺转移酶、木糖基转移酶、葡萄糖醛酸转移酶、半乳糖醛酸转移酶、葡萄糖胺转移酶、N-羟乙酰神经氨酸转移酶、鼠李糖基转移酶、N-乙酰鼠李糖胺转移酶、UDP-4-氨基-4,6-二脱氧基-N-乙酰基-β-L-阿卓糖胺转氨酶、UDP-N-乙酰氨基葡萄糖胺烯醇丙酮基转移酶及岩藻糖胺转移酶,
较佳为其中该细胞被至少一个该糖基转移酶修饰表达或活性。
15.如权利要求1至14任一项之细胞,其中该包括一乳糖-N-三糖(LN3;GlcNAc-beta1,3-Gal-beta1,4-Glc)作为一核心三糖的寡糖系一哺乳动物乳寡糖(mammalian milkoligosaccharide)或一Lewis型抗原寡糖。
16.如权利要求1至15任一项之细胞,其中该包括一乳糖-N-三糖(LN3;GlcNAc-beta1,3-Gal-beta1,4-Glc)作为一核心三糖的寡糖系一哺乳动物乳寡糖(MMO)、较佳为一人乳寡糖(HMO)、更佳为具有一LNT或LNnT作为一核心三糖的一MMO或HMO、甚至更佳为具有一LNT或LNnT作为一核心三糖的一HMO、最佳为LNT或LNnT。
17.如权利要求1至16任一项之细胞,其中该包括一乳糖-N-三糖(LN3;GlcNAc-beta1,3-Gal-beta1,4-Glc)作为一核心三糖的寡糖系一中性寡糖。
18.如权利要求1至17任一项之细胞,其中该包括一乳糖-N-三糖(LN3;GlcNAc-beta1,3-Gal-beta1,4-Glc)作为一核心三糖的寡糖系选自包括下列清单:乳糖-N-三糖、乳糖-N-四糖、乳糖-N-新四糖、乳糖-N-岩藻五糖I、乳糖-N-新岩藻五糖I、乳糖-N-岩藻五糖II、乳糖-N-岩藻五糖III、乳糖-N-岩藻五糖V、乳糖-N-岩藻五糖VI、乳糖-N-新岩藻五糖V、乳糖-N-二岩藻六糖I、乳糖-N-二岩藻六糖II、乳糖-N-六糖(lacto-N-hexaose,LNH)、乳糖-N-新六糖(lacto-N-neohexaose,LNnH)、对-乳糖-N-六糖(para-lacto-N-hexaose,pLNnH)、对-乳糖-N-新六糖(para-lacto-N-neohexaose,pLNH)、二岩藻糖基-乳糖-N-六糖、二岩藻糖基-乳糖-N-新六糖、乳糖-N-五糖(lacto-N-pentaose,LNP)、乳糖-N-新五糖、对乳糖-N-五糖、对乳糖-N-新五糖、乳糖-N-novo五糖I、乳糖-N-七糖、乳糖-N-新七糖、对乳糖-N-新七糖、对乳糖-N-七糖、乳糖-N-八糖(lacto-N-octaose,LNO)、乳糖-N-新八糖、异乳糖-N-八糖、对乳糖-N-八糖、异乳糖-N-新八糖、novo乳糖-N-新八糖、对乳糖-N-新八糖、异乳糖-N-九糖、novo乳糖-N-九糖、乳糖-N-九糖、乳糖-N-十糖、异乳糖-N-十糖、novo乳糖-N-十糖、乳糖-N-新十糖、唾液酸基-乳糖-N-四糖a(Sialyl-lacto-N-tetraose a)、唾液酸基-乳糖-N-四糖b、唾液酸基-乳糖-N-四糖c、唾液酸基-乳糖-N-四糖d。
19.如权利要求1至18任一项之细胞,其中该糖基转移酶系一N-乙酰葡萄糖胺β-1,3-半乳糖基转移酶或一N-乙酰葡萄糖胺β-1,4-半乳糖基转移酶,其自一UDP-Gal供体透过一β-1,3或β-1,4键结转移一半乳糖(Gal)至LN3之末端GlcNAC残基上,从而分别产生乳糖-N-四糖(LNT;Gal-beta1,3-GlcNAc-beta1,3-Gal-beta1,4-Glc)或乳糖-N-新四糖(LNnT;Gal-beta1,4-GlcNAc-beta1,3-Gal-beta1,4-Glc)。
20.如权利要求19之细胞,其中该细胞在整个肉汤(broth)及/或上清液中,产生90g/L或更多的LNT,及/或其中该LNT在整个肉汤及/或上清液中具有至少80%之一纯度,依据该细胞在整个肉汤及/或上清液中产生之LNT及LN3的总量所分别测量。
21.如权利要求19之细胞,其中该细胞在整个肉汤及/或上清液中,产生70g/L或更多的、较佳为90g/L或更多的LNnt及/或其中该LNnT在整个肉汤及/或上清液中具有至少80%之一纯度,依据该细胞在整个肉汤及/或上清液中产生之LNnT及LN3的总量所分别测量。
22.如权利要求1至12任一项之细胞,其中该细胞系更能合成一核苷酸活化糖,用于生产该包括一乳糖-N-三糖(LN3;GlcNAc-beta1,3-Gal-beta1,4-Glc)作为一核心三糖的寡糖。
23.如权利要求22之细胞,其中该核苷酸活化糖系选自包括下列清单:UDP-N-乙酰半乳糖胺(UDP-GalNAc)、UDP-N-乙酰甘露糖胺(UDP-ManNAc)、UDP-葡萄糖(UDP-Glc)、UDP-半乳糖(UDP-Gal)、GDP-甘露糖(GDP-Man)、UDP-葡萄糖醛酸盐、UDP-半乳糖醛酸盐、UDP-2-乙酰氨基-2,6-二脱氧基-L-阿拉伯糖-4-己酮糖、UDP-2-乙酰氨基-2,6-二脱氧基-L-木糖-4-己酮糖(UDP-2-acetamido-2,6-dideoxy-L-lyxo-4-hexulose)、UDP-N-乙酰基-L-鼠李糖胺(UDP-L-RhaNAc或UDP-2-乙酰氨基-2,6-二脱氧基-L-甘露糖(UDP-2-acetamido-2,6-dideoxy-L-mannose))、dTDP-N-乙酰岩藻糖胺、UDP-N-乙酰岩藻糖胺(UDP-L-FucNAc或UDP-2-乙酰氨基-2,6-二脱氧基-L-半乳糖)、UDP-N-乙酰-L-脱氧塔罗糖胺(UDP-N-acetyl-L-pneumosamine)(UDP-L-PneNAC或UDP-2-乙酰氨基-2,6-二脱氧基-L-塔罗糖(UDP-2-acetamido-2,6-dideoxy-L-talose))、UDP-N-乙酰胞壁酸(UDP-N-acetylmuramic acid)、UDP-N-乙酰基-L-奎诺糖胺(UDP-N-acetyl-L-quinovosamine)(UDP-L-QuiNAc或UDP-2-乙酰氨基-2,6-二脱氧基-L-葡萄糖(UDP-2-acetamido-2,6-dideoxy-L-glucose))、CMP-唾液酸(CMP-Neu5Ac)、CMP-N-羟乙酰神经氨酸(CMP-Neu5Gc)、GDP-岩藻糖、GDP-鼠李糖及UDP-木糖。
24.如权利要求1至23任一项之细胞,其中该细胞包括一分解代谢途径,用于经选择之至少部分未活化之单、双或寡糖,该单、双或寡糖参与及/或需要于一包括LN3作为一核心三糖的寡糖之合成。
25.如权利要求1至24任一项之细胞,其中该细胞利用一前驱物以合成该包括LN3作为一核心三糖的寡糖。
26.如权利要求1至25任一项之细胞,其中该膜蛋白参与一前驱物之摄取,以合成该包括LN3作为一核心三糖的寡糖。
27.如权利要求1至26任一项之细胞,其中该细胞产生一前驱物,以合成该包括LN3作为一核心三糖的寡糖。
28.如权利要求1至27任一项之细胞,其中该细胞系稳定地培养于培养基(medium)中。
29.如权利要求1至28任一项之细胞,其中该细胞系一微生物、一植物细胞、一动物细胞、一昆虫细胞或一原生动物细胞,其中较佳为
-该微生物系一细菌、真菌或一酵母菌,
-该植物细胞系一烟草、苜蓿、米、棉、油菜、大豆、玉蜀黍或玉米,及/或细胞
-该动物细胞系源自非人类之哺乳动物、鸟类、鱼类、无脊椎动物、爬虫类或两栖类,或该动物细胞系源自排除胚胎干细胞之人类细胞的一基因修饰细胞。
30.如权利要求29之细胞,其中该细胞系一细菌,较佳为一大肠杆菌菌株,更佳为一K-12菌株之大肠杆菌菌株之细胞、甚至更佳为该大肠杆菌K-12菌株为E.coli MG1655。
31.如权利要求1至30任一项之细胞,其中该细胞具有合成包括至少一寡糖之一寡糖混合物的能力,该至少一寡糖包括LN3作为一核心三糖。
32.一种藉由一基因修饰细胞产生一包括一乳糖-N-三糖(LN3;GlcNAc-beta1,3-Gal-beta1,4-Glc)作为一核心三糖的寡糖的方法,包括步骤:
a)提供如权利要求1至31任一项之一细胞,及
b)在允许产生该包括LN3作为一核心三糖的寡糖之条件下,培养该细胞于一培养基中,及
c)较佳为将该包括LN3作为一核心三糖的寡糖或包括至少一寡糖之一寡糖混合物,分别自该培养分离,该至少一寡糖包括LN3作为一核心三糖。
33.如权利要求32之方法,该方法更包括至少一下列步骤:
i)添加一乳糖给料于该培养培养基,该乳糖给料包括至少50、更佳为至少75、更佳为至少100、更佳为至少120、更佳为至少150克乳糖每升之初始反应器体积(initialreactor volum),其中该反应器体积介于250mL至10.000m3(立方米)范围之间,较佳为以一连续方式,且较佳为以使该培养培养基之最终体积为不多于添加该乳糖给料前该培养培养基之体积的三倍、较佳为不多于两倍、更佳为少于两倍;
ii)藉由一给料溶液,在1日、2日、3日、4日、5日之过程中,以一连续方式添加一乳糖给料于培养培养基;
iii)藉由一给料溶液,在1日、2日、3日、4日、5日之过程中,以一连续方式添加一乳糖给料于培养培养基,且其中该乳糖给料溶液之浓度为50g/L、较佳为75g/L、更佳为100g/L、更佳为125g/L、更佳为150g/L、更佳为175g/L、更佳为200g/L、更佳为225g/L、更佳为250g/L、275g/L、更佳为300g/L、更佳为325g/L、更佳为350g/L、更佳为375g/L、更佳为400g/L、更佳为450g/L、更佳为500g/L、甚至更佳为550g/L、最佳为600g/L;以及较佳为该溶液之PH值系设定于3至7之间,且其中较佳为该给料溶液之温度为保持于20℃至80℃之间;
该方法致生一包括一乳糖-N-三糖(LN3;GlcNAc-beta1,3-Gal-beta1,4-Glc)作为一核心三糖的寡糖,其于该培养培养基之最终体积中具有至少50g/L、较佳为至少75g/L、更佳为至少90g/L、更佳为至少100g/L、更佳为至少125g/L、更佳为至少150g/L、更佳为至少175g/L、更佳为至少200g/L的浓度。
34.如权利要求33之方法,其中该乳糖给料,系透过自开始培养时以至少5mM的浓度、较佳为以至少30、40、50、60、70、80、90、100、150mM的浓度、更佳为以大于300mM的浓度添加乳糖来达成。
35.如权利要求33或34之方法,其中该乳糖给料,系透过以一浓度之添加乳糖至培养培养基来达成,以致在整个培养之生产阶段,获得浓度至少为5mM、较佳为至少10mM或30mM的一乳糖。
36.如权利要求32至35任一项之方法,其中该宿主细胞被培养至少约60、80、100或约120小时,或以连续方式培养。
37.如权利要求32至36任一项之方法,其中一碳及能量来源,较佳为葡萄糖、甘油、果糖、麦芽糖、阿拉伯糖、麦芽糊精、麦芽寡糖(malto-oligosacchraides)、麦芽三糖、山梨醇、木糖、鼠李糖、蔗糖、半乳糖、甘露糖、甲醇、乙醇、海藻糖、淀粉、纤维素、半纤维素、多元醇、玉米浸液(corn-steep liquor)、高果糖浆(high-fructose syrup)、琥珀酸盐、苹果酸盐、醋酸盐、柠檬酸盐、乳酸及丙酮酸盐,亦被添加,较佳为持续添加至培养培养基,并较佳为搭配乳糖。
38.如权利要求32至37任一项之方法,其中指数细胞成长之一第一期,系藉由在第二期添加乳糖至该培养培养基之前,添加一碳基底物且较佳为葡萄糖或果糖至该培养培养基来提供。
39.如权利要求32至38任一项之方法,其中该分离包括至少一下列步骤:澄清(clarification)、超过滤、纳米过滤、逆渗透、微过滤、活性炭或碳处理、切向流高效能过滤(tangential flow high-performance filtration)、切向流超过滤(tangential flowultrafiltration)、亲和力层析、离子交换层析、疏水性相互作用层析及/或凝胶过滤、配位基交换层析。
40.如权利要求32至39任一项之方法,更包括分别自该细胞纯化该包括LN3作为一核心三糖的寡糖或包括至少一寡糖的寡糖混合物,该至少一寡糖包括LN3作为一核心三糖。
41.如权利要求32至40任一项之方法,其中该纯化包括至少一下列步骤:利用活性炭或碳、利用木炭、纳米过滤、超过滤或离子交换、利用醇类、利用含水醇类混合物、结晶化、蒸发、沉淀、干燥、喷雾干燥或冷冻干燥。
42.一种选自如权利要求1至12任一项中所定义之膜蛋白之群组的一膜蛋白于发酵生产一包括LN3作为一核心三糖的寡糖中的用途。
43.一种如权利要求1至31项之一细胞用于产生一包括LN3作为一核心三糖的寡糖的用途。
44.一种如权利要求31之一细胞用于产生一包括至少一寡糖之寡糖混合物的用途,该至少一寡糖包括LN3作为一核心三糖。
45.一种如权利要求32至41任一项之一方法用于产生一包括LN3作为一核心三糖的寡糖的用途。
本发明将更详细描述于实施例中。实施例将作为本发明之更进一步说明与澄清,但不意指为被限制。
实施例
实施例1.膜蛋白家族之鉴定
HMM是一种称为轮廓隐藏马尔可夫模型(profile hidden Markov models)的机率模型(probabilistic model)。其将一组对齐之蛋白质描绘成一位置(特定评分系统position-specific scoring system)。氨基酸在序列比对中的每个位置被给予一个分数,根据它们发生的频率(Eddy,S.R.1998.Profile hidden Markovmodels.Bioinformatics.14:755-63)。HMM具有广泛的用途,从使用这种方法进行蛋白质分类之包括Pfam、InterPro、SMART、TIGRFAM、PIRSF、PANTHER、SFLD、Superfamily与Gene3D的众多数据库可以清楚地看出。
2019年6月13日发布的HMMER套件(package)3.2.1(http://hmmer.org/)中的HMMsearch可以使用此HMM来搜索序列数据库的序列同源物(sequence homologs)。可被使用之序列数据库,例如,但不限于:NCBI nr Protein Database(NR;https://www.ncbi.nlm.nih.gov/protein)、UniProt Knowledgebase(UniProtKB,https://www.uniprot.org/help/uniprotkb)与SWISS-PROT database(https://web.expasy.org/docs/swiss-prot_guideline.html)。
膜蛋白家族被分类,依据2016年9月所发布之eggNOG database 4.5.1(https://www.ncbi.nlm.nih.gov/pmc/articles/PMC6324079/;http://eggnog.embl.de/#/app/home)、2019年6月17所发布之TCDB database(http://www.tcdb.org/public/tcdb、2019年7月4日所发布之InterPro 75.0(https://www.ebi.ac.uk/interpro/)与2018年9月所发布之PFAM domains using Pfam 32.0(https://pfam.xfam.org/)。eggNOG数据库系为一直系(orthology)关系、基因进化历史(gene evolutionary histories)与功能注释(functional annotations)的公开数据库。转运蛋白分类数据库(TransporterClassification DataBase,TCDB)类似于对酶进行分类的酶学委员会(EnzymeCommission,EC)系统,并结合了功能与系统发生信息(phylogenetic information)。Pfam与InterPro数据库是蛋白质家族的大集合。也可使用其他蛋白质区域(domains),如SMART(http://smart.embl-heidelberg.de/)、TIGRFAM(https://www.jcvi.org/tigrfams)、PIRSF(https://proteininformationresource.org/pirwww/dbinfo/pirsf.shtml)、PANTHER(http://pantherdb.org/、SFLD(http://sfld.rbvi.ucsf.edu/archive/django/index.html)、Superfamily(http://supfam.org/)与Gene3D(http://gene3d.biochem.ucl.ac.uk/Gene3D/)、NCBI保守区域(NCBI Conserved Domains)(https://www.ncbi.nlm.nih.gov/Structure/cdd/wrpsb.cgi)。
藉由使用2017年11月15日所发布之独立版本的eggNOG-mapper 1.0.3(https://github.com/eggnogdb/eggnog-mapper)与基于2016年9月所发布的eggnogdb 4.5.1来进行eggNOG家族的鉴定。对于每个eggNOG家族,可以在eggNOG网站上下载HMM,并可对蛋白质数据库用于HMMsearch。
藉由对2019年6月17日发布的TCDB数据库进行序列比对(blasting,blastp)来进行TCDB家族的鉴定。所获得的家族新成员可以在网站(http://www.tcdb.org/download.php)上被检索到。Fasta档案对于蛋白质数据库可作为blastp中的输入。
藉由在于2018年9月所发布之https://pfam.xfam.org/search#tabview=tab1的一在线检索来进行PFAM区域的鉴定。所获得之家族的HMM系于‘Curation&model’中下载。使用此模型对蛋白质数据库进行HMM搜索将识别新的家庭成员。对于蛋白质数据库之伴随此模型的HMMsearches将会鉴定新的家族成员。包括InterPro hit的序列也可自PFAM网站下载。
藉由使用于https://www.ebi.ac.uk/interpro/上的在线工具或独立版本之InterProScan(https://www.ebi.ac.uk/interpro/download.html)来进行InterPro(超级)家族、区域与位点的鉴定,https://www.ebi.ac.uk/interpro/与独立版本之InterProScan(https://www.ebi.ac.uk/interpro/download.html)两者均基于2019年7月4日所发布之InterPro 75.0。InterPro系为一复合数据库,其结合了许多蛋白质基序(motifs)与区域之数据库的信息。InterPro区域及/或(超级)家族之HMM可获自InterProScan且可被使用以于蛋白质数据库中鉴定新的家族成员。包括InterPro hit之序列也可自InterPro网站(‘Protein Matched’)下载或可于UniProt网站(https://www.uniprot.org)询问。
实施例2:多肽序列之间百分比一致度(percentage identity)的计算
用于比较之序列之比对(alignment of sequences)的方法是本领域熟知的,此类方法包括GAP、BESTFIT、BLAST、FASTA与TFASTA。GAP使用Needleman与Wunsch(J.Mol.Biol.(1970)48:443-453)之算法以找出使匹配数最大化并使间隙(gap)数最小化之两个序列的全局(global)(即跨越全长序列)比对。The BLAST算法(Altschul et al.,J.Mol.Biol.(1990)215:403-10)计算全局百分比序列一致度(即,遍及(over)全长序列)并执行两序列之间之相似度(similarity)的一统计分析。执行BLAS分析的软件为经由国家生物技术信息中心(National Centre for Biotechnology Information,NCBI)可公开获得。使用例如ClustalW多重序列比对算法(版本1.83),使用默认的成对比对参数(default pairwisealignment parameter)与百分比评分方法,可以很容易地识别同源物(homolog)。也可以使用于MatGAT软件套件中可获得的方法之一来确定相似性与一致性的全局百分比((即,跨越全长序列))(Campanella et al.,BMC Bioinformatics(2003)4:29)。可以进行少量手动编辑以优化保守基序之间的比对,这对该技术领域中具有通常知识者而言是明显的。此外,不使用全长序列来鉴定同源物,也可以使用特定的区域,以确定所谓的局部序列一致性。序列一致性值可以在整个核酸或氨基酸序列(=对全长序列进行局部序列一致性检索,产生全局序列一致性分数)上或在所选区域或保守基序(=对部分序列进行局部序列一致性检索,产生局部序列一致性分数)上确定,使用上面提到的程序使用默认参数。对于局部比对,Smith-Waterman算法特别有用(Smith TF,Waterman MS(1981)J.Mol.Biol 147(1);195-7)。
实施例3:具有序列识别号01之膜蛋白之同源物的鉴定
转运蛋白基因之同源物可获自序列数据库,如PATRIC(https://www.patricbrc.org/)、Uniprot(https://www.uniprot.org/),NCBI nr或nt数据库(https://www.ncbi.nlm.nih.gov/)与其他。PATRIC(https://www.patricbrc.org/)系为支持细菌病原体研究的不同类型数据与软件工具的集成。
本实施例描述瞭如何萃取与编码序列识别号01的全长基因具有至少80%之序列一致性之编码蛋白质序列的基因。具有序列识别号01之膜蛋白属于总体家族(globalfamily)。使用PATRIC命令行接口(command-line interface)(https://docs.patricbrc.org/cli_tutorial/index.html)来萃取此家族。以如使用EMBOSS Needle以默认参数所计算之与序列识别号01具有>80%的全局序列一致性来筛选氨基酸序列。于2020年11月25日萃取了代表7002个独特序列的70477个标识符(identifiers)。使用默认参数与序列识别号01作为查询的Blastp从Uniprot中萃取序列(数据库发布数据于2020年12月2日)。以如使用EMBOSS Needle以默认参数所计算之与序列识别号01具有>80%的全局序列一致性来筛选氨基酸序列且产生1471个标识符。在这些标识符中,可以鉴定所附序列表中所列的具有序列识别号53、54、55、56、57、58、59、60、63、64、65、66、67与68的膜蛋白。
实施例4.材料与方法大肠杆菌(Escherichia coli)
培养基
Luria肉汤(Luria Broth,LB)培养基由1%胰化蛋白胨(tryptone peptone)(Difco,Erembodegem,Belgium),0.5%酵母菌萃取物(Difco)与0.5%氯化钠(VWR.Leuven,Belgium)所组成。于96孔盘或摇瓶中使用于培养实验的基本培养(minimal medium)含有2.00g/L NH4Cl、5.00g/L(NH4)2SO4、2.993g/L KH2PO4、7.315g/L K2HPO4、8.372g/L MOPS、0.5g/L NaCl、0.5g/L MgSO4.7H2O、30g/L蔗糖或实施例中指定的其他碳源、1ml/L维生素溶液、100μL/L钼酸盐(molybdate)溶液与1mL/L硒(selenium)溶液。如各个实施例中所具体指明,将20g/L乳糖额外添加于培养基中作为前驱物。以1M KOH将基本培养基的pH设为7。维生素溶液系由3.6g/L FeCl2.4H2O、5g/L CaCl2.2H2O、1.3g/L MnCl2.2H2O、0.38g/LCuCl2.2H2O、0.5g/L CoCl2.6H2O、0.94g/L ZnCl2、0.0311g/L H3BO4、0.4g/L Na2EDTA.2H2O与1.01g/L硫胺素(thiamine).HCl。钼酸盐溶液含有0.967g/L NaMoO4.2H2O。硒(selenium)溶液含有42g/L Seo2。
用于发酵的基本培养基含有6.75g/L NH4Cl、1.25g/L(NH4)2SO4、2.93g/L KH2PO4与7.31g/L KH2PO4、0.5g/L NaCl、0.5g/L MgSO4.7H2O、30g/L蔗糖、1mL/L维生素溶液、100μL/L钼酸盐溶液及1mL/L硒溶液,具有与上述相同组成。如各个实施例中所具体指明,将100g/L乳糖额外添加于培养基中作为前驱物。
复合培养基(complex medium)以高温高压蒸气灭菌法(121℃,21')来灭菌,而基本培养基藉由过滤(0.22μm Sartorius)来灭菌。必要时,藉由添加抗生素(例如,氯霉素(chloramphenicol)(20mg/L)、卡本西林(carbenicillin)(100mg/L)、奇霉素(spectinomycin)(40mg/L)及/或康霉素(kanamycin)(50mg/L))使培养基具有选择性。
质粒(Plasmid)
pKD46(Red辅助质粒,氨苄青霉素(Ampicillin)抗性)、pKD3(包含FRT侧面(FRT-flanked)氯霉素抗性(cat)基因)、pKD4(包含FRT侧面康霉素抗性(kan)基因)与pCP20(表达FLP重组酶活性)质粒为获自R.Cunin教授(比利时布鲁塞尔自由大学(Vrije UniversiteitBrussel),2007年)。质粒维持于购自Invitrogen的宿主大肠杆菌DH5alpha(F-,phi80dlacZdeltaM15,delta(lacZYAargF)U169,deoR,recA1,endA1,hsdR17(rk-,mk+),phoA,supE44,lambda-,thi-1,gyrA96,relA1)。
菌株(Strains)与突变(mutations)
大肠杆菌K12 MG1655[λ-,F-,rph-1]于2007年3月从大肠杆菌遗传储备中心(ColiGenetic Stock Center)(US),CGSC Strain#:7740获得。使用Datsenko与Wanner(PNAS 97(2000),6640-6645)发表的技术进行基因破坏(gene disruption)及基因导入(geneintroduction)。此种技术是基于藉由λRed重组酶(lambda Red recombinase)进行同源重组(homologous recombination)后的抗生素选择(antibiotic selection)。随后的内翻转酶(flippase)重组酶的催化作用确保了在最终产生菌株(final production strain)中之抗生素选择卡匣(antibiotic selection cassette)的去除。
携带Red辅助质粒pKD46的转形体(transformant)在10mL具有氨苄青霉素(100mg/L)与L-阿拉伯糖(10mM)的LB培养基中于30℃下生长至OD600nm为0.6。藉由第一次以50mL冰冷水(ice-cold water)洗涤细胞与第二次以1mL冰冷水洗涤细胞,而使细胞为电胜任的(electrocompetent)。之后,将细胞重新悬浮于50μL冰冷的水中。使用Gene PulserTM(BioRad)对50μL细胞与10-100ng线性双链DNA产物进行电穿孔(600Ω、25μFD与250伏特)。电穿孔(electroporation)后,将细胞加入到1mL LB培养基中,在37℃下培养1小时,最后涂于含有25mg/L之氯霉素或50mg/L康霉素的LB-琼脂上,以选择抗生素抗性的转形体。选择的突变株以修饰区上游与下游的引物经由PCR来验证,并在42℃于LB琼脂中生长以消除辅助质粒。测试突变株之的氨苄青霉素(ampicillin)敏感性。使用pKD3、pKD4与其衍生物作为模板,藉由PCR获得线性ds-DNA扩增子(amplicon)。所使用之引物具有与模板互补的一部分序列及与染色体DNA上需发生重组的一侧互补的另一部分。对于基因体(genomic)敲除(knock-out),同源(homology)之区域被设计在目标基因的起始与终止密码子(codon)的上游50-nt与下游50-nt。对于基因体敲入(knock-in),必须尊重转录起点(transcriptionalstarting point)(+1)。将PCR产物PCR-纯化、以DpnI消化、从琼脂糖凝胶中重新纯化,并悬浮在洗脱缓冲液(5mM Tris,pH 8.0)中。选择的突变株(氯霉素或康霉素抗性)以pCP20质粒转形,其为一种氨苄青霉素与氯霉素抗性质粒,显示出FLP合成的温度敏感复制(replication)与热诱导。在30℃选择氨苄青霉素抗性转形体,于其后在42℃在LB中纯化一些菌落,然后测试所有抗生素抗性与FLP辅助质粒的丧失。使用对照引物(controlprimers)检查基因敲除与敲入。
为了生产乳糖-N-三糖(LN3、LNT-II、GlcNAc-b1,3-Gal-b1,4-Glc)及源于此的包括乳糖-N-四糖(LNT)与乳糖-N-新四糖(LNnT)的寡糖,突变菌株来自大肠杆菌K12 MG1655,并藉由大肠杆菌LacZ与nagB基因的敲除以及具有序列识别号22之来自脑膜炎双球菌的半乳糖苷β-1,3-N-乙酰葡萄糖胺转移酶(LgtA)的组成型转录单元的基因组敲入来修饰。对于LNT或LNnT的生产,突变体菌株被进一步分别以具有序列识别号23的来自大肠杆菌O55:H7的N-乙酰葡萄糖胺β-1,3-半乳糖基转移酶(WbgO)或具有序列识别号24之来自脑膜炎双球菌的N-乙酰葡萄糖胺β-1,4-半乳糖基转移酶(LgtB)的组成型转录单元来修饰,其可以通过基因组敲入或从表达质粒传递给菌株。视需要而定,可以将LgtA、wbgO及/或LgtB基因的多个复制添加到突变的大肠杆菌菌株中。在这些菌株中,可以藉由改进UDP-GlcNAc的生产来提高LNT及/或LNnT的产量,其是藉由具有具有序列识别号25之来自大肠杆菌的突变L-谷氨酰胺-D-果糖-6-磷酸转氨酶glmS*54(以A39T、R250C与G472S突变而与野生型glmS不同)之组成型转录单元一个或多个基因组敲入的菌株的修饰。此外,这些菌株可以视需要而定用大肠杆菌ushA与galT基因的基因组敲除来增强UDP-半乳糖生产。突变的大肠杆菌菌株也可以视需要而定地以具有序列识别号26之来自大肠杆菌的UDP-葡萄糖-4-差向异构酶(galE)、具有序列识别号27之来自大肠杆菌的磷酸葡糖胺变位酶(glmM)与具有序列识别号28之来自大肠杆菌的N-乙酰葡萄糖胺-1-磷酸尿苷基转移酶/葡萄糖胺-1-磷酸乙酰转移酶(glmU)的组成型转录单元的一基因组敲入来适应。
为了生产具有LN3为核心三糖的岩藻糖化寡糖,对大肠杆菌菌株以大肠杆菌的wcaJ和thyA基因之敲除,以包含具有序列识别号29之幽门螺杆菌α-1,2-岩藻糖基转移酶(HpFutC)及/或具有序列识别号30之幽门螺杆菌α-1,3-岩藻糖基转移酶(HpFucT)之组成型转录单元的表达质粒以及以具有序列识别号31之大肠杆菌thyA的组成型转录单元作为选择性标记进行了进一步修饰。岩藻糖转移酶基因的组成转录单元也可以经由基因组敲入存在于突变的大肠杆菌菌株中。如WO2016075243与WO2012007481中所述,GDP-岩藻糖的生产可以经由包括glgC、agp、pfkA、pfkB、pgi、arcA、iclR、pgi与lon之大肠杆菌基因的基因组敲除进一步优化。GDP-岩藻糖的生产可额外地经由包括大肠杆菌具有序列识别号32之manA、具有序列识别号33之manB、具有序列识别号34之manC、具有序列识别号35之gmd与具有序列识别号36之fcl的组成型转录单元的基因组敲入而优化。藉由对大肠杆菌fucK与fucI基因的基因组敲除,以及包含具有序列识别号37之来自大肠杆菌的岩藻糖渗透酶(fucP)与具有序列识别号38之来自脆弱类杆菌的双功能岩藻糖激酶/岩藻糖-1-磷酸鸟苷酸转移酶(fkp)的组成型转录单元的基因组敲入,也可以获得GDP-岩藻糖的生产。
为了生产具有LN3为核心三糖的唾液酸化寡糖,大肠杆菌菌株被进一步修饰,以大肠杆菌的nagA基因的敲除,以及包含具有序列识别号39之来自酿酒酵母的6-磷酸葡萄糖胺N-乙酰转移酶(GNA1)、序列识别号40之来自卵形拟杆菌(Bacteroides ovatus)的N-乙酰葡糖胺2-外聚酶(AGE)、序列识别号41之来自脑膜炎双球菌的N-乙酰神经氨酸(Neu5Ac)合成酶(NeuB)、具有序列识别号42之来自多杀性巴氏杆菌的N-乙酰神经氨酸胞苷转移酶(NeuA),以及包括来自多杀性巴氏杆菌之序列识别号43(PmultST3)及/或来自脑膜炎双球菌之序列识别号44(NmeniST3)的β-半乳糖苷α-2,3-唾液酸转移酶及/或包括来自发光杆菌(Photobacterium damselae)的序列识别号45(PdST6)及/或来自发光菌(Photobacteriumsp.)JT-ISH-224的序列识别号46(P-JT-ISH-224-ST6)的β-半乳糖苷α-2,6-唾液酸转移酶的组成型转录单元的基因组敲入。PmNeuA与唾液酸转移酶的组成型转录单元可以经由基因组敲入或经由表达质粒传递给突变株。可以进一步优化突变大肠杆菌菌株中的唾液酸生产,藉由包括WO18122225中所述之包括nagC、nagD、nagE、nanA、nanE、nanK、manX、manY与manZ的大肠杆菌基因的基因组敲除,以及包括具有序列识别号25之来自大肠杆菌的L-谷氨酰胺-D-果糖-6-磷酸转氨酶(glmS*54)的一突变体(以A39T、R250C与G472S突变而与野生型大肠杆菌glmS不同)与具有序列识别号47之来自大肠杆菌的磷酸酶yqaB的组成型转录单元的基因组敲入。唾液酸生产也可藉由大肠杆菌nagA与nagB基因的敲除以及包含具有序列识别号27之来自大肠杆菌的磷酸葡萄糖胺变位酶(glmM)、具有序列识别号28之来自大肠杆菌的N-乙酰葡萄糖胺-1-磷酸尿苷转移酶/葡萄糖胺-1-磷酸乙酰转移酶(glmU)、具有序列识别号48之来自空肠弯曲杆菌(Campylobacter jejuni)的UDP-N-乙酰葡萄糖胺2-差向异构酶(NeuC)与具有序列识别号41之来自脑膜炎双球菌的N-乙酰神经氨酸合成酶(NeuB)的组成型转录单元的基因组敲入来获得。在此突变株中,唾液酸生产可以进一步藉由包括具有序列识别号25之来自大肠杆菌的突变glmS*54与具有序列识别号47之来自大肠杆菌的磷酸酶yqaB的组成型转录单元的基因组敲入来优化。
所有的突变菌株也可以视需要而定经由包含具有序列识别号49之来自大肠杆菌W的蔗糖转运体(CscB)、具有序列识别号50之来自运动发酵单胞菌(Z.mobilis)的果糖激酶(Frk)与具有序列识别号51之来青春双歧杆菌(B.adolescentis)的蔗糖磷酸酶之组成型转录单元的基因组敲入来适应在蔗糖上的生长。此外,突变株可经由具有序列识别号52之来自大肠杆菌乳糖渗透酶lacY的组成型转录单元的基因组敲入来修饰,以增强乳糖的摄取。
此外,所有突变株可以视需要而定地藉由lacZ、glk与galETKM操作子的基因组敲除,与具有序列识别号24之来自脑膜炎双球菌的lgtB与具有序列识别号26之来自大肠杆菌的UDP-葡萄糖4-外引物酶(UDP-glucose4-eprimerase)(galE)的组成型转录单元的基因组敲入一起来适应细胞内乳糖合成。
在一接下来之步骤中,如表2与表3中所列具有序列识别号01、02、03、04、05、06、07、08、09、10、11、12、13、14、15、16、17、18、19、20、21、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97与98之膜蛋白,可在上述来自大肠杆菌K12 MG1655之突变株中被评估。表2中也列举了本发明所述的其他蛋白质。膜蛋白基因可以被评估为存在于PSC101质粒上或以组成型转录单元整合在宿主的基因组中。
较佳为但非必须,糖基转移酶N端融合至MBP标签,以提高其溶解度(Fox et al.,Protein Sci.2001,10(3),622-630)。
所有组成型启动子、UTR与终止子的序列皆源自Cambray et al.(Nucleic AcidsRes.2013,41(9),5139-5148),Chen et al.(Nat.Methods 2013,10(7),659-664),De Meyet al.(BMC Biotechnol.2007,4(34),1-14),Dunn et al.(Nucleic Acids Res.1980,8(10),2119-2132),Kim and Lee(FEBS Letters 1997,407(3),353-356)与Mutalik et al.(Nat.Methods 2013,No.10,354-360)所述的数据库。所有的基因都是在Twist Bioscience(twistbioscience.com)或IDT(eu.idtdna.com)合成订购的,且使用供货商的工具来使密码子的使用适合。
所有菌株都保存在-80℃的冷冻管(cryovials)中(隔夜LB培养基与70%甘油以1:1的比例混合)。
表2–本发明中描述的序列识别号的概述
/>
/>
/>
/>
/>
/>
表3–本发明的膜蛋白的区域数据
/>
/>
培养条件
96孔微量滴定盘实验的预培养起始于一冷冻管,于150μL LB中,并在37℃下在800rpm的定轨振荡器(orbital shaker)上隔夜培养。使用此培养物用作96孔方形微量滴定盘的接种物,以稀释400x加入400μL基本培养基。然后将这些最终的96孔培养盘于37℃在定轨振荡器上以800rpm培养72小时,或更短或更长。为了在培养实验结束时测量糖浓度,从每个孔中取出全部肉汤样品,藉由在旋下细胞之前,将培养液在60℃煮15分钟(=细胞内与细胞外糖浓度的平均值)。又,对培养物进行稀释以测量600nm处的光学密度。细胞效能指数或CPI是通过将整个肉汤中测得的具有LN3为核心三糖的寡糖的浓度,除非另有规定,为除以生物量来确定的,相较于参考菌株,以相对百分比形式。根据经验,生物量约为在600nm处测量的光学密度的1/3rd。具有LN3为核心三糖的寡糖的输出率是通过将上清液中测得的具有LN3为核心三糖的寡糖的浓度除以整个肉汤中测得的具有LN3为核心三糖的寡糖的浓度来确定的,相较于参考菌株,以相对百分比形式。
生物反应器的预培养是从特定菌株的整个1mL冷冻管开始的,接种于250mL或500mL基本培养基中于1L或2.5L摇瓶中,并在37℃、以200rpm的定轨振荡器培养24小时。然后接种一个5L的生物反应器(250mL接种物在2L批次培养基中);该过程由MFCS控制软件(Sartorius Stedim Biotech,Melsungen,Germany)控制。培养条件被设定为37℃,最大限度的搅拌;压力气体流速取决于菌种与生物反应器。使用0.5M H2S04和20% NH4OH将pH值控制在6.8。排出的气体被冷却。当发酵过程中出现泡沫时,加入硅酮消泡剂(siliconeantifoaming agent)的10%溶液。
光学密度(Optical density)
藉由测量600nm的光学密度(Implen Nanophotometer NP80,Westburg,Belgium或以Spark 10M microplate reader,Tecan,Switzerland)经常监测培养物的细胞密度。
生产力
单位生产率(specific productivity)Qp是指产品(即以LN3为核心三糖的寡糖)的单位生产率(specific production rate),通常以每时间单位的每质量单位的生物质的产品质量单位表示(=g寡糖/g生物质/h)。通过测量每个阶段结束时形成的产品和生物质的数量以及每个阶段持续的时间框架,对发酵过程的每个阶段,即批处理和混合批处理阶段,确定了Qp值。
单位生产率Qs是基质,如蔗糖的单位消耗率,通常以每单位时间的生物量之每单位质量的基质之每单位质量表示(=g蔗糖/g生物量/h)。藉由在每个阶段结束以及每个阶段持续的时段(time frame)测量消耗的蔗糖总量与所形成的生物量,已经确定了发酵过程的每个阶段,即批次与馈料批次(Fed-Batch)阶段的Qs值。
蔗糖产量Ys是指由基质制成的产品的部分,通常以蔗糖之每质量单位的产物之质量单位(=g寡糖/g蔗糖)表示。藉由在每个阶段结束测量所产生之具有LN3为一核心三糖的寡糖的总量与所消耗之蔗糖的总量,确定了发酵过程的每个阶段即批次与馈料批次阶段的Ys值。
生物量产量Yx是由基质制成之生物量的部分,通常以基质之每单位质量的生物量之质量单位(=g生物量/g蔗糖)表示。藉由在每个阶段结束测量所产生之生物质的总量与所消耗之蔗糖的总量,确定了发酵过程的每个阶段即批次与馈料批次阶段的Yp值。
速率是指在发酵过程中制作产品的速度,通常以每单位时间的所制作之产品之浓度(=g寡糖/L/h)表示。速率是藉由测量在馈料批次阶段结束已经制成之具有LN3为一核心三糖的寡糖的浓度并将此浓度除以总发酵时间来确定的。
乳糖转化率是指在发酵过程中乳糖被消耗的速度,通常以每单位时间的乳糖之质量单位表示(=g消耗的乳糖/h)。乳糖转化率是藉由测量在发酵过程期间消耗的乳糖总除以总发酵时间来确定的。
生长率/速度测量
最大生长率(μMax)是根据在600nm处观察到的光学密度,使用R套装grofit计算出来的。
解析分析
标准品,如但不限于蔗糖、乳糖、乳糖-N-三糖II(LN3)、乳糖-N-四糖(LNT)、乳糖-N-新四糖(LNnT)、LNFP-I。LNFP-II、LNFP-III、LNFP-V、LNFP-VI、LSTa、LSTc与LSTd,购自Carbosynth(英国)、Elicityl(法国)与IsoSep(瑞典)。其他化合物以内部制作的标准品进行分析。
中性寡糖在具有蒸发光散射检测器(ELSD)或折射率(RI)检测之Waters AcquityH-class UPLC上进行分析。在Waters Acquity UPLC BEH Amide柱(2.1x 100mm;1.7μm与Acquity UPLC BEH Amide VanGuard柱,/>2.1x 5mm上注入0.7μL的样品。柱温为50℃。移动相由1/4的水和3/4的乙腈溶液组成,其中加入了0.2%的三乙胺。此方法是等度的,流量为0.130mL/分钟。ELS检测器具有50℃之漂移管温度,N2气体压力为50psi,增益(gain)为200,数据速率为10pps。RI检测器的温度被设定为35℃。
唾液酸化寡糖在具有折射率(RI)检测之Waters Acquity H-class UPLC上进行分析。在Waters Acquity UPLC BEH Amide柱(2.1x 100mm;1.7μm)上注入0.5μL样品。柱温为50℃。移动相由70%的乙腈、26%的乙酸铵缓冲液(150mM)与4%的甲醇的混合物组成,其中加入了0.05%的吡咯烷。此方法为等度的,流量为0.150mL/分钟。RI检测器的温度被设定在35℃。
中性糖与唾液酸化糖两者在在具有折射率(RI)检测之Waters Acquity H-classUPLC上进行分析。在Waters Acquity UPLC BEH Amide柱(2.1x 100mm;1.7μm)上注入0.5μL样品。柱温为50℃。移动相由72%的乙腈与28%的乙酸铵缓冲液(100mM)的混合物组成,其中加入了0.1%的三乙胺。此方法是等度的,流量为0.260毫升/分钟。RI检测器的温度被设定在35℃。
为了于一质谱上之分析,使用具有电喷雾离子源(Electron Spray Ionisation(ESI))之Waters Xevo TQ-MS,具有450℃之去溶剂(desolvation)温度,650L/h之氮去溶剂气流量与20V之锥电压(cone voltage)。对所有寡糖,MS在选择离子监测(selected ionmonitoring,SIM)模式为负下操作。分离在具有Thermo Hypercarb柱(2.1x 100mm;3μm)之Waters Acquity UPLC于35℃进行。使用梯度,其中洗脱液A是含0.1%甲酸的超纯水,洗脱液B是含0.1%甲酸的乙腈。使用以下梯度在55分钟内分离寡糖:在21分钟内洗脱液B从2至12%的起始增加,在11分钟内洗脱液B从12至40%的第二增加,在5分钟内洗脱液B从40至100%的地三增加。作为清洗步骤,使用100%的洗脱液B,5分钟。为了管柱平衡,在1分钟内恢复到2%洗脱液B的起始状态,并保持12分钟。
低浓度(低于50mg/L)的中性与唾液酸化糖在具有脉冲安培检测(PAD)DionexHPAEC系统上进行了分析,并采用。在Dionex CarboPac PA200柱4x250mm与DionexCarboPac PA200保护柱4x 50mm上注入5μL的样品量。柱温被设定为30℃。使用梯度,其中洗脱液A为去离子水,其中洗脱液B为200mM氢氧化钠,且其中洗脱液C为500mM乙酸钠。寡糖在60分钟内被分离,同时使用以下梯度保持25%的洗脱液B的恒定比例:75%的洗脱液A之起始等度步骤10分钟,在8分钟内洗脱液C从0至4%的起始增加,71%的洗脱液A与4%的洗脱液C之第二个等度步骤6分钟,在2.6分钟内洗脱液C从4至12%的第二次增加,63%的洗脱液A与12%的洗脱液C之第三个等度步骤3.4分钟,及在5分钟内洗脱液C从12至48%的第三次增加。作为清洗步骤,使用48%的洗脱液C,3分钟。为了管柱平衡,在1分钟内恢复到75%洗脱液A与0%洗脱液C的起始状态,并保持11分钟。应用的流量为0.5mL/分钟。
数据的标准化
对于所有类型的培养条件,从突变菌株获得的数据对在相同培养条件下以具有与突变菌株相同的基因背景但缺乏膜蛋白表达卡匣(即设定点(setpoint))之参考菌株所获得的数据进行标准化。因此,所有数据(包括表4-11中的数据)都以相对于此设定点的百分比给出。
实施例5.在补充有20g/L乳糖的基本培养基中的生长实验中,在大肠杆菌宿主中 培养72小时测试膜蛋白的LN3产量
建立了一个实验来评估具有序列识别号01、02、03、04、05、06、07、08、09、10、11、12、13、14、15、16、17、18、19、20、21、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97或98之膜蛋白其提高生长在补充有20g/L乳糖的基本培养基中的宿主细胞的LN3产生的能力。候选基因在pSC101质粒上呈现给LN3产生宿主。根据实施例4中提供的培养条件进行生长实验。在每个表达具有序列识别号22之来自脑膜炎双球菌(N.meningitidis)的半乳糖苷β-1,3-N-乙酰葡萄糖胺转移酶(galactoside beta-1,3-N-acetylglucosaminyltransferase)(LgtA)的LN3产生宿主中,评估LN3的产量。
实施例6.在补充有20g/L乳糖的基本培养基中的生长实验中,大肠杆菌宿主培养 72小时鉴定提高LN3与乳糖-N-四糖(LNT)产量的膜蛋白
建立了一个实验来评估具有序列识别号01、03、07、08、09、10、11、12、13、14、15、16、17、18、19与21之膜蛋白其提高生长在补充有20g/L乳糖的基本培养基中的宿主细胞的LN3与乳糖-N-四糖(LNT)产生的能力。候选基因在pSC101质粒上呈现给LNT产生宿主。根据实施例4中提供的培养条件进行生长实验。
表4显示相较于没有表达膜蛋白的参考菌株,表达膜蛋白的不同菌株的LN3与LNT的全肉汤测量值(whole broth measurements)。根据表4,具有序列识别号01、03、07、08、09、10、11、12、13、14、15、16、17、18、19或21之膜蛋白的表达提升了被产生于表达具有序列识别号22之来自脑膜炎双球菌(N.meningitidis)的半乳糖苷β-1,3-N-乙酰葡萄糖胺转移酶(LgtA)与具有序列识别号23之来自大肠杆菌O55:H7的N-乙酰葡萄糖胺β-1,3-半乳糖基转移酶(N-acetylglucosamine beta-1,3-galactosyltransferase)的LNT产生宿主中的LN3及LNT的产生。
表4
“SD”代表标准偏差(同一菌株的4次重复)。“参考菌株”与测试菌株相同,除了所指出的膜蛋白(序列识别号所指)不在参考菌株中表达。
此外,表5显示,相较于没有表达所述膜蛋白的参考菌株,表达如本实施例中概述的膜蛋白的不同菌株的细胞效能指数(cell performance index,CPI)较高。
表5
“SD”代表标准偏差(同一菌株的4次重复)。“参考菌株”与测试菌株相同,除了所指出的膜蛋白(序列识别号所指)不在参考菌株中表达。
实施例7在补充有20g/L乳糖的基本培养基中的生长实验中,大肠杆菌宿主培养72 小时鉴定提高乳糖-N-四糖(LNT)产量的膜蛋白
建立了一个实验来评估具有序列识别号02、04、05、66、67与68之膜蛋白其提高生长在补充有20g/L乳糖的基本培养基中的宿主细胞的乳糖-N-四糖(LNT)产生的能力。候选基因在pSC101质粒上呈现给LNT产生宿主。根据实施例4中提供的培养条件进行生长实验。因此,本实施例中的菌株与实施例6中的菌株相同,不同之处在于评估的膜蛋白。
来自上述6种不同膜蛋白的实验数据显示于表6中。
当根据实施例4提供之于培养基含有蔗糖作为碳源且乳糖作为前驱物的培养条件在生长实验中评估时,于全肉汤样品中,相较于参考菌株(不表达膜蛋白),所有6个菌株都能够产生更多的LNT并显示出较高的细胞效能指数(CPI)。此外,相较于实施例6中使用的菌株,这些菌株没有显示出更高的LN3产量(%LN3产量,相较于参考菌株,在全肉汤中测量)。本实施例7中的菌株因此特别有利于LNT的产生,其中LN3的比例应保持尽可能低,而若目标是LN3与LNT的混合物,或者当生产的寡糖部分中LN3的相对量不重要时,实施例6中的菌株是有用的。
用于此筛选的LNT产生宿主表达具有序列识别号22之来自脑膜炎双球菌的半乳糖苷β-1,3-N-乙酰葡萄糖胺转移酶(LgtA)与具有序列识别号23之来自脑膜炎双球菌的N-乙酰葡萄糖胺β-1,3-半乳糖基转移酶(wbgO)。
表6
“SD”代表标准偏差(同一菌株的4次重复)。“参考菌株”与测试菌株相同,除了所指出的膜蛋白(序列识别号所指)不在参考菌株中表达。
实施例8在补充有20g/L乳糖的基本培养基中的生长实验中,大肠杆菌宿主培养72 小时鉴定提高乳糖-N-新四糖(LNnT)产量的膜蛋白
建立了一个实验来评估具有序列识别号01、02、03、05、66与68之膜蛋白其提高生长在补充有20g/L乳糖的基本培养基中的宿主细胞的LN3及/或乳糖-N-新四糖(LNnT)产生的能力。候选基因在pSC101质粒上呈现给LNnT产生宿主。根据实施例4中提供的培养条件进行生长实验。
来自上述6种不同膜蛋白的实验数据显示于表7中。
当根据实施例4提供之于培养基含有蔗糖作为碳源且乳糖作为前驱物的培养条件在生长实验中评估时,于全肉汤样品中,相较于参考菌株(不表达膜蛋白),所有6个菌株都能够产生更多的LNnT。用于此筛选的LNnT产生宿主表达具有序列识别号22之来自脑膜炎双球菌的半乳糖苷β-1,3-N-乙酰葡萄糖胺转移酶(LgtA)与具有序列识别号24之来自脑膜炎双球菌的N-乙酰葡萄糖胺β-1,4-半乳糖基转移酶(N-acetylglucosamine beta-1,4-galactosyltransferase)(LgtB)。
表7
“SD”代表标准偏差(同一菌株的4次重复)。“参考菌株”与测试菌株相同,除了所指出的膜蛋白(序列识别号所指)不在参考菌株中表达。
实施例9.在5L发酵过程(run)中大肠杆菌LN3产生宿主中之膜蛋白的评估
于实施例4中描述的LN3产生宿主被修饰以自pSC101质粒表达具有序列识别号01、02、03、04、05、06、07、08、09、10、11、12、13、14、15、16、17、18、19、20、21、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97或98之膜蛋白。经修饰菌株于生物反应器设定(bioreactor settings)(5L发酵槽(fermenter))中被评估其生产力。根据实施例4中所提供的条件来进行发酵过程。又,一与LN3产生宿主相同但缺乏膜蛋白之基因的一参考菌株于相同之发酵设定中被分析。在发酵结束时,表达膜蛋白基因的菌株在上清液与整个肉汤样品中测得的滴定量(titre)在80g/L与125g/L之间变化。参考菌株达到在上清液与整个肉汤样品中测得的45g/L与65g/L之间的LN3滴定量,其显示具有序列识别号01、02、03、04、05、06、07、08、09、10、11、12、13、14、15、16、17、18、19、20、21、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97与98之膜蛋白对在5L发酵过程中之LN3产生的正向作用。
实施例10.在5L发酵过程中大肠杆菌LN3产生宿主中之膜蛋白的评估
于实施例4中描述的LN3产生宿主被修饰以自pSC101质粒表达具有序列识别号01、02、03、04、05、06、07、08、09、10、11、12、13、14、15、16、17、18、19、20、21、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97或98之膜蛋白。经修饰菌株于生物反应器设定(5L发酵槽)中被评估其生产力。根据实施例4中所提供的条件来进行发酵过程。又,一与LN3产生宿主相同但缺乏膜蛋白之基因的一参考菌株于相同之发酵设定中被分析。在发酵结束时,相较于参考菌株,于经修饰菌株中之LN3产生为125%至250%,支持具有序列识别号01、02、03、04、05、06、07、08、09、10、11、12、13、14、15、16、17、18、19、20、21、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97与98之膜蛋白对于在5L发酵过程中之LN3产生的正向作用。
实施例11.在5L发酵过程中大肠杆菌LNT产生宿主中之膜蛋白的评估
于实施例4中描述的LNT产生宿主被修饰以自pSC101质粒表达具有序列识别号01、02、03、04、05、06、07、08、09、10、11、12、13、14、15、16、17、18、19、20、21、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97或98之膜蛋白。经修饰菌株于生物反应器设定(5L发酵槽)中被评估其生产力。根据实施例4中所提供的条件来进行发酵过程。又,一与LNT产生宿主相同但缺乏膜蛋白之基因的一参考菌株于相同之发酵设定中被分析。在发酵结束时,表达膜蛋白基因的菌株在上清液与整个肉汤样品中测得的滴定量在90g/L与130g/L之间变化。参考菌株达到在上清液与整个肉汤样品中测得的50g/L与70g/L之间的LNT滴定量,其显示具有序列识别号01、02、03、04、05、06、07、08、09、10、11、12、13、14、15、16、17、18、19、20、21、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97与98之膜蛋白对在5L发酵过程中之LNT产生的正向作用。
实施例12.在5L发酵过程中大肠杆菌LNT产生宿主中之膜蛋白的评估
于实施例4中描述的LNT产生宿主被修饰以自pSC101质粒表达具有序列识别号01、02、03、04、05、06、07、08、09、10、11、12、13、14、15、16、17、18、19、20、21、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97或98之膜蛋白。经修饰菌株于生物反应器设定(5L发酵槽)中被评估其生产力。根据实施例4中所提供的条件来进行发酵过程。又,一与LNT产生宿主相同但缺乏膜蛋白之基因的一参考菌株于相同之发酵设定中被分析。在发酵结束时,相较于参考菌株,于经修饰菌株中之LNT产生为135%至265%,支持具有序列识别号01、02、03、04、05、06、07、08、09、10、11、12、13、14、15、16、17、18、19、20、21、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97与98之膜蛋白对于在5L发酵过程中之LNT产生的正向作用。
实施例13.在5L发酵过程中大肠杆菌LNT产生宿主中之膜蛋白的评估
于实施例4中描述的LNT产生宿主被修饰以自pSC101质粒表达具有序列识别号01之膜蛋白。经修饰菌株于生物反应器设定(5L发酵槽)中被评估其生产力。根据实施例4中所提供的条件来进行发酵过程。又,一与LNT产生宿主相同但缺乏膜蛋白之基因的一参考菌株于相同之发酵设定中被分析。来自发酵之实验数据被显示于表8与9中。
在发酵结束时,在上清液与全肉汤样品中测得的滴定量高于在参考菌株中测得的滴定量(表8)。进一步观察到,相较于参考菌株,LNT分泌提升,由于相较于参考菌株,上清液的LNT产量增加高于整个肉汤。此外,相较于参考菌株,LNT的产率、乳糖消耗率与蔗糖上的LNT产量较高(表9)。总之,这些数据显示具有序列识别号01之的膜蛋白对于在5L发酵过程中之LNT产生的正向作用。
表8
/>
“参考菌株”与测试菌株相同,除了所指出的膜蛋白(序列识别号所指)不在参考菌株中表达。
表9
“参考菌株”与测试菌株相同,除了所指出的膜蛋白(序列识别号所指)不在参考菌株中表达。
实施例14.在5L发酵过程中大肠杆菌LNnT产生宿主中之膜蛋白的评估
于实施例4中描述的LNnT产生宿主被修饰以自pSC101质粒表达具有序列识别号01、02、03、04、05、06、07、08、09、10、11、12、13、14、15、16、17、18、19、20、21、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97或98之膜蛋白。经修饰菌株于生物反应器设定(5L发酵槽)中被评估其生产力。根据实施例4中所提供的条件来进行发酵过程。又,一与LNnT产生宿主相同但缺乏膜蛋白之基因的一参考菌株于相同之发酵设定中被分析。在发酵结束时,表达膜蛋白基因的菌株在上清液与整个肉汤样品中测得的滴定量在70g/L与100g/L之间变化。参考菌株达到在上清液与整个肉汤样品中测得的40g/L与60g/L之间的LNnT滴定量,其显示具有序列识别号01、02、03、04、05、06、07、08、09、10、11、12、13、14、15、16、17、18、19、20、21、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97与98之膜蛋白对在5L发酵过程中之LNnT产生的正向作用。
实施例15.在5L发酵过程中大肠杆菌LNnT产生宿主中之膜蛋白的评估
于实施例4中描述的LNnT产生宿主被修饰以自pSC101质粒表达具有序列识别号01、02、03、04、05、06、07、08、09、10、11、12、13、14、15、16、17、18、19、20、21、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97或98之膜蛋白。经修饰菌株于生物反应器设定(5L发酵槽)中被评估其生产力。根据实施例4中所提供的条件来进行发酵过程。又,一与LNnT产生宿主相同但缺乏膜蛋白之基因的一参考菌株于相同之发酵设定中被分析。在发酵结束时,相较于参考菌株,于经修饰菌株中之LNnT产生为120%至245%,支持具有序列识别号01、02、03、04、05、06、07、08、09、10、11、12、13、14、15、16、17、18、19、20、21、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97与98之膜蛋白对于在5L发酵过程中之LNnT产生的正向作用。
实施例16.在5L发酵过程中大肠杆菌LNnT产生宿主中之膜蛋白的评估
于实施例4中描述的LNnT产生宿主被修饰以自pSC101质粒表达具有序列识别号02之膜蛋白。经修饰菌株于生物反应器设定(5L发酵槽)中被评估其生产力。根据实施例4中所提供的条件来进行发酵过程。又,一与LNnT产生宿主相同但缺乏膜蛋白之基因的一参考菌株于相同之发酵设定中被分析。来自发酵之实验数据被显示于表10与11中。
在发酵结束时,在上清液与全肉汤样品中测得的滴定量高于在参考菌株中测得的滴定量(表10)。此外,相较于参考菌株,获得一较高之细胞效能指数(CPI)。进一步观察到,相较于参考菌株,LNnT分泌提升,由于相较于参考菌株,上清液的LNnT产量增加高于整个肉汤。此外,相较于参考菌株,LNnT的产率、乳糖消耗率与蔗糖上的LNnT产量较高(表11)。总之,这些数据显示具有序列识别号02之的膜蛋白对于在5L发酵过程中之LNnT产生的正向作用。
表10
“参考菌株”与测试菌株相同,除了所指出的膜蛋白(序列识别号所指)不在参考菌株中表达。
表11
/>
“参考菌株”与测试菌株相同,除了所指出的膜蛋白(序列识别号所指)不在参考菌株中表达。
实施例17.材料与方法酿酒酵母菌(Saccharomyces cerevisiae)
培养基
菌株在具有含有6.7g/L不含氨基酸的酵母氮碱(YNB w/o AA,Difco)20g/L琼脂(Difco)(固体培养物)、22g/L葡萄糖一水合物或20g/L乳糖与0.79g/L CSM或0.77g/L CSM-Ura、0.77g/L CSM-Trp,或0.77g/L CSM-His(MP Biomedicals)的完全补充混合物(Complete Supplement Mixture)(SD CSM)或CSM drop-out(SD CSM-Ura、SD CSM-Trp、SDCSM-His)的一合成界定酵母培养基(Synthetic Defined yeast medium)上生长。
菌株
使用由Brachmann et al.(Yeast(1998)14:115-32)创建的酿酒酵母菌BY4742,可在Euroscarf培养物保藏中心获得。所有突变株均藉由同源重组或质粒转形使用Gietz的方法(Yeast 11:355-360,1995)产生。
质粒
在产生UDP-半乳糖的例子中,一酵母表达质粒可以衍生自pRS420-质粒系列(Christianson et al.,1992,Gene 110:119-122),其包含HIS3选择标记与UDP-葡萄糖-4-差向异构酶的组成型转录单元,例如,如来自大肠杆菌的galE(UniProt ID P09147)。此质粒可以进一步以乳糖通透酶,例如,如来自乳酸克鲁维酵母(UniProt ID P07921)的LAC12,与半乳糖苷β-1,3-N-乙酰葡萄糖胺转移酶活性,例如,如来自脑膜炎双球菌的lgtA(序列识别号22)的组成型转录单元修饰,以产生LN3(lacto-N-triose,LNT-II,)。为了进一步生产LN3衍生的寡糖,如LNT,突变之LN3产生菌株被进一步以N-乙酰葡萄糖胺β-1,3-半乳糖基转移酶,例如,如来自大肠杆菌O55:H7的WbgO(序列识别号23)的组成型转录单元修饰。
在一个生产LN3衍生的寡糖如乳糖-N-新四糖(LNnT,Gal-b1,4-GlcNAc-b1,3-Gal-b1,4-Glc)的例子中,突变之LN3生产菌株进一步以N-乙酰葡糖胺β-1,4-半乳糖基转移酶例如,如来自脑膜炎双球菌的LgtB(序列识别号24)的组成型转录单元修饰。
在一个生产GDP-岩藻糖的例子中,可以使用酵母表达质粒如p2a_2μ_Fuc(Chan2013,Plasmid 70,2-17)用于酿酒酵母菌中之外来基因的表达。此质粒含有一个氨苄青霉素抗性基因与一个细菌复制原点,以便在大肠杆菌中进行选择和维持,而2μ酵母ori与Ura3选择标记用于在酵母中进行选择与维持。此质粒被进一步以乳糖渗透酶例如,如来自乳酸克鲁维酵母的LAC12(UniProt ID P07921)、GDP-甘露糖4,6-脱水酶,例如,如来自大肠杆菌的gmd(序列识别号35)与GDP-L-岩藻糖合成酶,例如,如来自大肠杆菌的fcl(序列识别号36)的组成型转录单元修饰。酵母表达质粒p2a_2μ_Fuc2可作为p2a_2μ_Fuc质粒的替代表达质粒,此质粒包括与氨苄青霉素抗性基因、细菌ori、2μ酵母ori与Ura3选择相邻的乳糖渗透酶,例如,如来自乳酸克鲁维酵母的LAC12(UniProt ID P07921)、岩藻糖渗透酶,例如,如来自大肠杆菌的fucP(序列识别号37)以及具有岩藻糖激酶/岩藻糖-1-磷酸鸟苷酸转移酶活性的双功能酶,例如,如来自脆弱类杆菌的fkp(序列识别号38)的组成型转录单元。为了进一步生产具有LN3为核心三糖的岩藻糖化寡糖,p2a_2μ_Fuc及其变体p2a_2μ_Fuc2,额外含有序列识别号29之幽门螺杆菌α-1,2-岩藻糖基转移酶(HpFutC)及/或具有序列识别号30之幽门螺杆菌α-1,3-岩藻糖基转移酶(HpFucT)的组成型转录单元。
为了生产唾液酸与CMP-唾液酸,从pRS420-质粒系列(Christianson et al.,1992,Gene 110:119-122)衍生,含有TRP1选择标记与具有序列识别号25之来自大肠杆菌的突变glmS*54、具有序列识别号47之来自大肠杆菌的磷酸酶yqaB、具有序列识别号40之来自卵形拟杆菌的N-乙酰葡糖胺2-外聚酶(AGE)、具有序列识别号41之来自脑膜炎双球菌的N-乙酰神经氨酸合成酶(NeuB)具有与序列识别号42之来自多杀性巴氏杆菌的N-乙酰神经氨酸细胞酰化转移酶(NeuA)的组成型转录单元。视需要而定,也可加入具有序列识别号39之来自酿酒酵母菌的GNA1的组成型转录单元。
为了生产具有LN3为核心三糖的唾液酸化寡糖,质粒进一步包括来自乳酸克鲁维酵母(UniProt ID P07921)的乳糖渗透酶(LAC12),与一或更多之唾液酸转移酶,包括,包括来自多杀性巴氏杆菌之序列识别号43(PmultST3)及/或来自脑膜炎双球菌之序列识别号44(NmeniST3)之β-半乳糖苷α-2,3-唾液酸转移酶,及/或包括来自发光杆菌之序列识别号45(PdST6)及/或来自发光菌JT-ISH-224之序列识别号46(P-JT-ISH-224-ST6)的β-半乳糖α-2,6-醛基转移酶的组成型转录单元。
较佳为,但并非必须,任何一或更多之糖基转移酶及/或参与核苷酸启动的糖合成的蛋白质N端及/或C端地与SUMOstar标签(例如从pYSUMOstar,Life Sensors,Malvern,PA获得)融合,以提高其溶解度。
视需要而定,以编码伴侣蛋白(chaperone protein),例如,Hsp31、Hsp32、Hsp33、Sno4、Kar2、Ssb1、Sse1、Sse2、Ssa1、Ssa2、Ssa3、Ssa4、Ssb2、Ecm10、Ssc1、Ssq1、Ssz1、Lhs1、Hsp82、Hsc82、Hsp78、Hsp104、Tcp1、Cct4、Cct8、Cct2、Cct3、Cct5、Cct6或Cct7的组成型转录单元的基因组敲入来修饰突变的酵母菌株(Gong et al.,2009,Mol.Syst.Biol.5:275)。质粒维持在宿主大肠杆菌DH5alpha中(F-,phi80dlacZdeltaM15,delta(lacZYA-argF)U169,deoR,recA1,endA1,hsdR17(rk-,mk+),phoA,supE44,lambda-,thi-1,gyrA96,relA1)购自Invitrogen。
在接下来之步骤中,如表2和表3所列具有序列识别号01、02、03、04、05、06、07、08、09、10、11、12、13、14、15、16、17、18、19、20、21、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67。68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97与98之膜蛋白,可在上述突变株中进行评估。膜蛋白基因可以呈现在p2a 2μ_Fuc或p2a_2μ_Fuc2或pRS420(Christianson et al.,1992,Gene 110:119-122;有一个HIS3选择标记)质粒上,或者以组成型转录单元整合到宿主的基因组中进行评估。
如Blazeck(Biotechnology and Bioengineering,Vol.109,No.11,2012)所述,使用合成的组成型启动子来表达基因。
需要表达的基因,无论是来自质粒还是来自基因组的,都是由以下公司之一合成的。DNA2.0、Gen9、IDT或Twist Bioscience。藉由将密码子使用优化为表达宿主的密码子使用,可以进一步促进表达。基因使用供货商的工具进行了优化。
培养条件
一般来说,酵母菌株最初在SD CSM平板上生长,以获得单一菌落。这些平板在30℃下生长2-3天。从单个菌落开始,在30℃下预培养物以5mL隔夜生长,以200rpm的速度振荡。随后的125mL摇瓶实验以2%的预培养物接种在25mL的培养基中。这些摇瓶在30℃下以200rpm的定轨振荡进行培养。
解析分析
参见实施例4的这一部分。
实施例18.在酿酒酵母菌(S.cerevisiae)宿主中测试膜蛋白的LN3产量
建立了一个实验来评估具有序列识别号01、02、03、04、05、06、07、08、09、10、11、12、13、14、15、16、17、18、19、20、21、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97或98之膜蛋白其提高如实施例17所述生长在补充有20g/L乳糖的培养基中的宿主细胞的LN3产生的能力。候选基因在pRS420质粒上呈现给LN3产生宿主。根据实施例17中提供的培养条件进行生长实验。在每个表达具有序列识别号22之来自脑膜炎双球菌的半乳糖苷β-1,3-N-乙酰葡萄糖胺转移酶(LgtA)的LN3产生宿主中,评估LN3的产量。
实施例19.在酿酒酵母菌宿主中测试膜蛋白的乳糖-N-四糖(LNT)产量 Example19.Membrane proteins tested for lacto-N-tetraose(LNT)production in a S.cerevisiae host
建立了一个实验来评估具有序列识别号01、02、03、04、05、06、07、08、09、10、11、12、13、14、15、16、17、18、19、20、21、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97或98之膜蛋白其提高如实施例17所述生长在补充有20g/L乳糖的培养基中的宿主细胞的LN3及/或乳糖-N-四糖(LNT)产生的能力。候选基因在pRS420质粒上呈现给LNT产生宿主。根据实施例17中提供的培养条件进行生长实验。在每个表达具有序列识别号22之来自脑膜炎双球菌的半乳糖苷β-1,3-N-乙酰葡萄糖胺转移酶(LgtA)与具有序列识别号23之来自脑膜炎双球菌的N-乙酰葡萄糖胺β-1,3-半乳糖基转移酶(wbgO)的LNT产生宿主中,评估LN3与LNT的产量。
实施例20.酿酒酵母菌宿主中鉴定提高乳糖-N-新四糖(LNnT)产量的膜蛋白
建立了一个实验来评估具有序列识别号01、02、03、04、05、06、07、08、09、10、11、12、13、14、15、16、17、18、19、20、21、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97或98之膜蛋白其提高如实施例17所述生长在补充有20g/L乳糖的培养基中的宿主细胞的LN3及/或乳糖-N-新四糖(LNnT)产生的能力。候选基因在pRS420质粒上呈现给LNnT产生宿主。根据实施例17中提供的培养条件进行生长实验。在每个表达具有序列识别号22之来自脑膜炎双球菌的半乳糖苷β-1,3-N-乙酰葡萄糖胺转移酶(LgtA)与具有序列识别号24之来自脑膜炎双球菌的N-乙酰葡萄糖胺β-1,4-半乳糖基转移酶(LgtB)的LNnT产生宿主中,评估LN3与LNnT的产量。
实施例21.材料与方法莱茵衣藻(Chlamydomonas reinhardtii)
培养基
莱茵衣藻细胞在Tris-乙酸-磷酸盐(TAP)培养基(pH 7.0)中培养。TAP培养基使用1000x储备Hutner微量元素混合物。Hutner微量元素混合物由50g/L Na2EDTA.H2O(Titriplex III)、22g/L ZnSO4.7H2O、11.4g/L H3BO3、5g/L MnCl2.4H2O、5g/LFeSO4.7H2O、1.6g/L CoCl2.6H2O、1.6g/L CuSO4.5H2O与1.1g/L(NH4)6MoO3组成。
TAP培养基含有2.42g/L Tris(三(羟甲基)氨基甲烷)、25mg/L盐储备溶液、0.108g/L K2HPO4、0.054g/L KH2PO4与1.0mL/L冰醋酸。盐储备溶液由15g/L NH4CL、4g/LMgSO4·7H2O和2g/L CaCl2·2H2O组成。作为糖类合成的前驱物,前驱物例如,如乳糖(例如20g/L)、半乳糖、葡萄糖、果糖、岩藻糖、GlcNAc可被添加。藉由高压灭菌(121℃,21')对培养基进行灭菌。对于在斜面琼脂上的原种培养(stock cultures),使用含有1%琼脂(纯化的高强度,1000g/cm2)的TAP培养基。
藻株
莱茵衣藻野生型藻株21gr(CC-1690,野生型,mt+)、6145C(CC-1691,野生型,mt-)、CC-125(137c,野生型,mt+)、CC-124(137c,野生型,mt-)可从美国明尼苏达大学衣藻资源中心(https://www.chlamycollection.org)获得。
质粒
表达质粒来源于pSI103,可从衣藻资源中心获得。可以使用Gibson组装、GoldenGate组装、Cliva组装、LCR或限制性连接进行克隆。用于(异源)基因表达的合适启动子可以来自例如Scranton et al.(Algal Res.2016,15:135-142)。可以使用Crispr-Cas技术进行靶向基因修饰(如基因敲除或基因替换),如,例如Jiang et al.(Eukaryotic Cell 2014,13(11):1465-1469)所述。
如Wang等人所述,经由电穿孔进行转形(Biosci.Rep.2019,39:BSR2018210)。细胞在恒定通气与具有8000Lx之光照强度的连续光照下在液体TAP培养基中生长,直到细胞密度达到1.0–2.0×107个细胞/mL。然后,以1.0×106个细胞/mL的浓度将细胞接种到的新鲜液体TAP培养基中,并在连续光照下生长18-20小时,直至细胞密度达到4.0×106个细胞/mL。接下来,藉由在室温下以1250g离心5分钟收集细胞,用含有60mM山梨糖醇(Sigma,美国)的预冷液体TAP培养基洗涤并重新悬浮,并冰镇10分钟。然后,将250μL细胞悬浮液(对应于5.0×107个细胞)放入具有100ng质粒DNA(400ng/mL)之预冷的0.4cm电穿孔比色皿中。使用BTXECM830电穿孔设备(1575Ω,50μFD),以6个500V脉冲进行电穿孔,每个脉冲具有4ms的脉冲长度与100ms的脉冲间隔时间。电穿孔后,立即将比色皿置于冰上10分钟。最后,将细胞悬浮液转移到含有10mL具有60mM山梨糖醇的新鲜液体TAP培养基的50ml锥形离心管中,通过缓慢振荡在昏暗的光线下隔夜恢复。隔夜恢复后,重新收集细胞并用淀粉包埋法将其涂盘到含有氨芐青霉素(100mg/L)或氯霉素(100mg/L)的选择性1.5%(w/v)琼脂-TAP盘上。然后将盘在具有8000Lx光强度的连续照明下在23+-0.5℃下培养。5-7天后分析细胞。
在产生UDP-半乳糖的一个例子中,莱茵衣藻细胞以包含编码半乳糖激酶,例如来自阿拉伯芥(Arabidopsis thaliana)(KIN,UniProt ID Q9SEE5)与UDP-糖焦磷酸化酶,例如来自阿拉伯芥的USP(UniProt ID Q9C5I1)的基因的转录单元进行修饰。
在产生LN3的例子中,组成型转录包含半乳糖苷β-1,3-N-乙酰氨基葡糖转移酶,例如来自脑膜炎双球菌的lgtA(序列识别号22)。一个用于生产LNT的例子,将LN3生产的菌株进一步以包含N-乙酰葡萄糖胺β-1,3-半乳糖基转移酶,例如,如来自大肠杆菌O55:H7的WbgO(序列识别号23)的组成型转录单元进行修饰。在用于LNnT生产的一个例子中,LN3生产的菌株进一步以包含N-乙酰葡糖胺β-1,4-半乳糖基转移酶,例来,如自脑膜炎双球菌的lgtB(序列识别号24)的组成型转录单元进行修饰。
为了生产GDP-岩藻糖,莱茵衣藻细胞以例如,如来自阿拉伯芥(GER1,UniProt IDO49213)之GDP-岩藻糖合成酶的转录单元进行修饰。
为了进一步产生具有LN3作为核心三糖的岩藻糖基化寡糖,可以表达质粒修饰莱茵衣藻细胞,此表达质粒包括α-1,2-岩藻糖基转移酶,例如,如来自幽门螺杆菌的HpFutC(序列识别号29)及/或α-1,3-岩藻糖基转移酶,例如,如来自幽门螺杆菌的HpFucT(序列识别号30)的组成型转录单元。
在接下来之步骤中,如表2与表3所列,具有序列识别号01、02、03、04、05、06、07、08、09、10、11、12、13、14、15、16、17、18、19、20、21、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97与98之膜蛋白,可以在上述突变菌株中进行评估。膜蛋白基因可以呈现在一适合之表达质粒上,或者以组成型转录单元整合到宿主的基因组中进行评估。
需要表达的基因,无论是来自质粒还是来自基因组,由以下公司之一合成合成:DNA2.0、Gen9、Twist Biosciences或IDT。
通过优化密码子使用以适应表达宿主的密码子使用,可以进一步促进表达。使用供货商的工具优化基因。
培养条件
莱茵衣藻细胞于选择性TAP琼脂盘中,在23+/-0.5℃,在具有8000Lx之光照强度的14/10小时光照/黑暗周期下培养。培养5至7天后分析细胞。
对于高密度培养,细胞可以在封闭系统中培养,例如:Chen et al.(Bioresour.Technol.2011,102:71-81)与Johnson et al.(Biotechnol.Prog.2018,34:811-827)描述的垂直或水平管光生物反应器、搅拌槽光生物反应器或平板光生物反应器。
解析分析
参见实施例4的这一部分。
实施例22.在莱茵衣藻(C.reinhardtii)宿主中测试膜蛋白的LN3产量
建立了一个实验来评估具有序列识别号01、02、03、04、05、06、07、08、09、10、11、12、13、14、15、16、17、18、19、20、21、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97或98之膜蛋白其提高生长在补充有20g/L乳糖的培养基(参见实施例21)中的宿主细胞的LN3产生的能力。候选基因藉由包括所述膜蛋白基因之一组成型转录单元(constitutive transcriptional unit)的基因组敲入(genomic knock-in)来呈现给LN3产生宿主。根据实施例21中提供的培养条件进行生长实验。在每个表达具有序列识别号22之来自脑膜炎双球菌的半乳糖苷β-1,3-N-乙酰葡萄糖胺转移酶(LgtA)的LN3产生宿主中,评估LN3的产量。
实施例23.在莱茵衣藻宿主中测试膜蛋白的乳糖-N-四糖(LNT)产量
建立了一个实验来评估具有序列识别号01、02、03、04、05、06、07、08、09、10、11、12、13、14、15、16、17、18、19、20、21、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97或98之膜蛋白其提高生长在补充有20g/L乳糖的培养基(参见实施例21)中的宿主细胞的LN3及/或乳糖-N-四糖(LNT)产生的能力。候选基因藉由包括所述膜蛋白基因之一组成型转录单元的基因组敲入来呈现给LNT产生宿主。根据实施例21中提供的培养条件进行生长实验。在每个表达具有序列识别号22之来自脑膜炎双球菌的半乳糖苷β-1,3-N-乙酰葡萄糖胺转移酶(LgtA)与具有序列识别号23之来自脑膜炎双球菌的N-乙酰葡萄糖胺β-1,3-半乳糖基转移酶(wbgO)的LNT产生宿主中,评估LN3与LNT的产量。
实施例24.莱茵衣藻宿主中鉴定提高乳糖-N-新四糖(LNnT)产量的膜蛋白
建立了一个实验来评估具有序列识别号01、02、03、04、05、06、07、08、09、10、11、12、13、14、15、16、17、18、19、20、21、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97或98之膜蛋白其提高生长在补充有20g/L乳糖的培养基(参见实施例21)中的宿主细胞的LN3及/或乳糖-N-新四糖(LNnT)产生的能力。候选基因藉由包括所述膜蛋白基因之一组成型转录单元的基因组敲入来呈现给LNnT产生宿主。根据实施例21中提供的培养条件进行生长实验。在每个表达具有序列识别号22之来自脑膜炎双球菌的半乳糖苷β-1,3-N-乙酰葡萄糖胺转移酶(LgtA)与具有序列识别号24之来自脑膜炎双球菌的N-乙酰葡萄糖胺β-1,4-半乳糖基转移酶(LgtB)的LNnT产生宿主中,评估LN3与LNnT的产量。
实施例25.材料与方法枯草芽孢杆菌(Bacillus subtilis)
培养基
使用了两种不同的培养基,即富含Luria肉汤(LB)与用于摇瓶(MMsf)的基本培养基。基本培养基使用微量元素混合物。
微量元素混合物由0.735g/L CaCl2.2H2O、0.1g/L MnCl2.2H2O、0.033g/LCuCl2.2H2O、0.06g/L CoCl2.6H2O、0.17g/L ZnCl2、0.0311g/L H3BO4、0.4g/LNa2EDTA.2H2O与0.06g/L Na2MoO4组成。柠檬酸铁溶液含有0.135g/L FeCl3.6H2O、1g/LNa-柠檬酸盐(Hoch 1973PMC1212887)。
Luria肉汤(LB)培养基由1%胰蛋白胨(Difco,Erembodegem,Belgium)、0.5%酵母萃取物(Difco)与0.5%氯化钠(VWR.Leuven,Belgium)组成。Luria肉汤琼脂(LBA)盘由LB培养基组成,添加了12g/L琼脂(Difco,Erembodegem,Belgium)。
摇瓶(MMsf)实验的基本培养基含有2.00g/L(NH4)2SO4、7.5g/L KH2PO4、17.5g/LK2HPO4、1.25g/L柠檬酸钠、0.25g/L MgSO4.7H2O、0.05g/L色氨酸、从10上至30g/L葡萄糖或其他碳源,包括但不限于实施例中指定的果糖、麦芽糖、蔗糖、甘油与麦芽三糖、10ml/L微量元素混合物及10ml/L柠檬酸铁溶液。以1M KOH将培养基的pH值设置为7。根据实验,添加乳糖(20g/L)。
复合培养基,例如LB,藉由高压灭菌(121℃,21')来灭菌,而基本培养基藉由过滤(0.22μm Sartorius)来灭菌。必要时,藉由添加抗生素(例如zeocin(20mg/L))使培养基具有选择性。
菌株
枯草芽孢杆菌168,可在芽孢杆菌基因储备中心(Ohio,USA)获得。
质粒
使用如Popp et al.(Sci.Rep.,2017,7,15158)描述的综合载体(Integrativevectors)作为表达载体,如有必要可进一步用于基因组整合。用于表达的合适启动子可以来自部分存储库(part repository)(iGem):序列id:Bba_K143012、Bba_K823000、Bba_K823002或Bba_K823003。可以使用Gibson组装、Golden Gate组装、Cliva组装、LCR或限制性连接进行克隆。在产生LN3的一个实例中,产生枯草芽孢杆菌突变株以包含编码乳糖输入蛋白(例如具有序列识别号52的大肠杆菌lacY)的基因,并进一步包含包括半乳糖苷β-1,3-N-乙酰葡萄糖胺转移酶,例如,如来自脑膜炎双球菌的lgtA(序列识别号22)的组成型转录单元。一个用于生产LNT的例子中,LN3生产的菌株进一步以包含一N-乙酰葡萄糖胺β-1,3-半乳糖基转移酶,例如,如来自大肠杆菌O55:H7之WbgO(序列识别号23)的组成型转录单元来修饰。在LNnT生产的一个例子中,LN3生产的菌株进一步以包含N-乙酰葡糖胺β-1,4-半乳糖基转移酶,例如,如来自脑膜炎双球菌的lgtB(序列识别号24)的组成型转录单元来修饰。为了进一步产生具有LN3作为核心三糖的岩藻糖基化寡糖,可以表达质粒(或经由基因组敲入)修饰枯草芽孢杆菌细胞,该表达质粒包含α-1,2-岩藻糖基转移酶,例如,如来自幽门螺杆菌的HpFutC(序列识别号29)及/或α-1,3-岩藻糖基转移酶,例如,如来自幽门螺杆菌的HpFucT(序列识别号30)的组成型转录单元。
在接下来的步骤中,如表2与表3所列具有序列识别号01、02、03、04、05、06、07、08、09、10、11、12、13、14、15、16、17、18、19、20、21、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97与98之膜蛋白,可以在上述突变株中进行评估。膜蛋白基因可以呈现在此所述的一适合之表达质粒上,或者以组成型转录单元整合到宿主的基因组中进行评估。
需要表达的基因,无论是来自质粒还是来自基因组,均由以下公司之一合成:DNA2.0、Gen9、Twist Biosciences或IDT。
通过优化密码子使用以适应表达宿主的密码子使用,可以进一步促进表达。使用供货商的工具优化基因。
培养条件
96孔微量滴定盘实验的预培养从冷冻管或LB盘的单个菌落开始,在150μL LB中,并以800rpm于定轨振荡器上在37℃下隔夜培养。该培养物被用作96孔方形微量滴定盘的接种物,以400μL MMsf培养基稀释400x。每个菌株在96孔板的多个孔中作为生物学复制品生长。然后将这些最终的96孔培养盘在37℃在定轨振荡器上以800rpm培养72小时或更短或更长时间。
解析分析
参见实施例4的这一部分。
实施例26.在枯草芽孢杆菌(B.subtilis)宿主中测试膜蛋白的LN3产量
建立了一个实验来评估具有序列识别号01、02、03、04、05、06、07、08、09、10、11、12、13、14、15、16、17、18、19、20、21、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97或98之膜蛋白其提高生长在补充有20g/L乳糖的培养基(参见实施例25)中的宿主细胞的LN3产生的能力。候选基因藉由包括所述膜蛋白基因之一组成型转录单元的基因组敲入来呈现给LN3产生宿主。根据实施例25中提供的培养条件进行生长实验。在每个表达具有序列识别号22之来自脑膜炎双球菌的半乳糖苷β-1,3-N-乙酰葡萄糖胺转移酶(LgtA)的LN3产生宿主中,评估LN3的产量。
实施例27.在枯草杆菌宿主中测试膜蛋白的乳糖-N-四糖(LNT)产量
建立了一个实验来评估具有序列识别号01、02、03、04、05、06、07、08、09、10、11、12、13、14、15、16、17、18、19、20、21、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97或98之膜蛋白其提高生长在补充有20g/L乳糖的培养基(参见实施例25)中的宿主细胞的LN3及/或乳糖-N-四糖(LNT)产生的能力。候选基因藉由包括所述膜蛋白基因之一组成型转录单元的基因组敲入来呈现给LNT产生宿主。根据实施例25中提供的培养条件进行生长实验。在每个表达具有序列识别号22之来自脑膜炎双球菌的半乳糖苷β-1,3-N-乙酰葡萄糖胺转移酶(LgtA)与具有序列识别号23之来自脑膜炎双球菌的N-乙酰葡萄糖胺β-1,3-半乳糖基转移酶(wbgO)的LNT产生宿主中,评估LN3与LNT的产量。
实施例28.枯草杆菌宿主中鉴定提高乳糖-N-新四糖(LNnT)产量的膜蛋白
建立了一个实验来评估具有序列识别号01、02、03、04、05、06、07、08、09、10、11、12、13、14、15、16、17、18、19、20、21、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97或98之膜蛋白其提高生长在补充有20g/L乳糖的培养基(参见实施例25)中的宿主细胞的LN3及/或乳糖-N-新四糖(LNnT)产生的能力。候选基因藉由包括所述膜蛋白基因之一组成型转录单元的基因组敲入来呈现给LNnT产生宿主。根据实施例25中提供的培养条件进行生长实验。在每个表达具有序列识别号22之来自脑膜炎双球菌的半乳糖苷β-1,3-N-乙酰葡萄糖胺转移酶(LgtA)与具有序列识别号24之来自脑膜炎双球菌的N-乙酰葡萄糖胺β-1,4-半乳糖基转移酶(LgtB)的LNnT产生宿主中,评估LN3与LNnT的产量。
实施例29.材料与方法谷氨酸棒状杆菌(Corynebacterium glutamicum)
培养基
使用了两种不同的培养基,即富含胰蛋白胨-酵母萃取物(TY)培养基与摇瓶基本培养基(MMsf)。基本培养基使用1000x储备微量元素混合物。
微量元素混合物由10g/L CaCl2、10g/L FeSO4.7H2O、10g/L MnSO4.H2O、1g/LZnSO4.7H2O、0.2g/L CuSO4、0.02g/L NiCl2.6H2O、0.2g/L生物素(pH 7.0)与0.03g/L原儿茶酸组成。
摇瓶(MMsf)实验的基本培养基含有20g/L(NH4)2SO4、5g/L尿素、1g/L KH2PO4、1g/L K2HPO4、0.25g/L MgSO4.7H2O、42g/L MOPS,从10上至30g/L葡萄糖或其他碳源,包括但不限于实施例中指定的果糖、麦芽糖、蔗糖、甘油与麦芽三糖及1ml/L微量元素混合物。根据实验,将乳糖(20g/L)添加到培养基中。
TY培养基由1.6%胰蛋白胨(Difco,Erembodegem,Belgium)、1%酵母提取物(Difco)与0.5%氯化钠(VWR.Leuven,Belgium)组成。TY琼脂(TYA)盘由TY培养基组成,添加了12g/L琼脂(Difco,Erembodegem,Belgium)。
复合培养基,例如TY,通过高压灭菌(121℃,21')来灭菌,而基本培养基藉由过滤(0.22μm Sartorius)来灭菌。必要时,通过添加抗生素(例如卡那霉素、氨芐青霉素)使培养基具有选择性。
菌株
谷氨酸棒状杆菌ATCC 13032,可在美国典型培养物保藏中心获得。
质粒
如Suzuki et al.(Appl.Microbiol.Biotechnol.,2005Apr,67(2):225-33)所述基于Cre/loxP技术的综合质粒载体与如Okibe et al.(Journal of MicrobiologicalMethods 85,2011,155-163)所述的温度敏感穿梭载体(temperature-sensitive shuttlevectors)是针对基因缺失、突变和插入而构建的。用于(异源)基因表达的合适启动子可以来自Yim et al.(Biotechnol.Bioeng.,2013Nov,110(11):2959-69)。可以使用Gibson组装、Golden Gate组装、Cliva组装、LCR或限制性连接进行克隆。
在产生LN3的一个例子中,产生谷氨酸棒杆菌突变菌株以包含编码乳糖输入蛋白的基因(例如具有序列识别号52的大肠杆菌lacY),并进一步包含包括半乳糖苷β-1,3-N-乙酰葡萄糖胺转移酶,例如,如来自脑膜炎双球菌的lgtA(序列识别号22)的组成型转录单元。一个用于生产LNT的例子中,LN3生产的菌株进一步以包含一N-乙酰葡萄糖胺β-1,3-半乳糖基转移酶,例如,如来自大肠杆菌O55:H7之WbgO(序列识别号23)的组成型转录单元来修饰。在LNnT生产的一个例子中,LN3生产的菌株进一步以包含N-乙酰葡糖胺β-1,4-半乳糖基转移酶,例如,如来自脑膜炎双球菌的lgtB(序列识别号24)的组成型转录单元来修饰。为了进一步产生具有LN3作为核心三糖的岩藻糖基化寡糖,可以表达质粒(或经由基因组敲入)修饰谷氨酸棒杆菌细胞,该表达质粒包含α-1,2-岩藻糖基转移酶,例如,如来自幽门螺杆菌的HpFutC(序列识别号29)及/或α-1,3-岩藻糖基转移酶,例如,如来自幽门螺杆菌的HpFucT(序列识别号30)的组成型转录单元。
在接下来的步骤中,如表2与表3所列具有序列识别号01、02、03、04、05、06、07、08、09、10、11、12、13、14、15、16、17、18、19、20、21、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97与98之膜蛋白,可以在上述突变株中进行评估。膜蛋白基因可以呈现在于此所述的一适合之表达质粒上,或者以组成型转录单元整合到宿主的基因组中进行评估。
需要表达的基因,无论是来自质粒还是来自基因组,均由以下公司之一合成:DNA2.0、Gen9、Twist Biosciences或IDT。
通过将密码子使用优化为表达宿主的密码子使用,可以进一步促进表达。使用供货商的工具优化基因。
培养条件
96孔微量滴定盘实验的预培养从冷冻管或TY盘的单个菌落开始,在150μL TY中,并以800rpm于定轨振荡器上在37℃下隔夜培养。该培养物被用作96孔方形微量滴定盘的接种物,以400μL MMsf培养基稀释400x。每个菌株在96孔板的多个孔中作为生物学复制品生长。然后将这些最终的96孔培养盘在37℃在定轨振荡器上以800rpm培养72小时或更短或更长时间。
解析分析
参见示实施例4的这一部分。
实施例30.在谷氨酸棒状杆菌(C.glutamicum)宿主中测试膜蛋白的LN3产量
建立了一个实验来评估具有序列识别号01、02、03、04、05、06、07、08、09、10、11、12、13、14、15、16、17、18、19、20、21、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97或98之膜蛋白其提高生长在补充有20g/L乳糖的培养基(参见实施例29)中的宿主细胞的LN3产生的能力。如实施例29中所述,对每个菌株进行修饰用于LN3的产生。此外,藉由nagB、glmS与gamA基因的基因组敲除(genomic knock-out)与包括编码来自大肠杆菌的乳糖通透酶(lactose permease)(LacY)(序列识别号52)、天然果糖-6-P-氨基转移酶(native fructose-6-P-aminotransferase)(UniProt ID Q8NND3)、来自大肠杆菌W(UniProt ID E0IXR1)的蔗糖转运蛋白(sucrose transporter)(CscB)、来自运动发酵单胞菌(Z.mobilis)运动发酵单胞菌的果糖激酶(fructose kinase)(Frk)(UniProt IDQ03417)与来自青春双歧杆菌(B.adolescentis)的蔗糖磷酸化酶(sucrosephosphorylase)(BaSP)(UniProt ID A0ZZH6)之基因的一组成型转录单元的基因组敲入,每个菌株以蔗糖生长。候选基因藉由包括所述膜蛋白基因之一组成型转录单元的基因组敲入来呈现给LN3产生宿主。根据实施例29中提供的培养条件进行生长实验。在每个表达具有序列识别号22之来自脑膜炎双球菌的半乳糖苷β-1,3-N-乙酰葡萄糖胺转移酶(LgtA)的LN3产生宿主中,评估LN3的产量。
实施例31.在谷氨酸棒状杆菌宿主中测试膜蛋白的乳糖-N-四糖(LNT)产量
建立了一个实验来评估具有序列识别号01、02、03、04、05、06、07、08、09、10、11、12、13、14、15、16、17、18、19、20、21、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97或98之膜蛋白其提高生长在补充有20g/L乳糖的培养基(参见实施例29)中的宿主细胞的LN3及/或乳糖-N-四糖(LNT)产生的能力。如实施例29中所述,对每个菌株进行修饰用于LN3的产生。此外,藉由nagB、glmS与gamA基因的基因组敲除与包括编码来自大肠杆菌的乳糖通透酶(LacY)(序列识别号52)、天然果糖-6-P-氨基转移酶(UniProt IDQ8NND3)、来自大肠杆菌W(UniProt ID E0IXR1)的蔗糖转运蛋白(CscB)、来自运动发酵单胞菌运动发酵单胞菌的果糖激酶(Frk)(UniProt ID Q03417)与来自青春双歧杆菌的蔗糖磷酸化酶(BaSP)(UniProt ID A0ZZH6)之基因的一组成型转录单元的基因组敲入,每个菌株以蔗糖生长。候选基因藉由包括所述膜蛋白基因之一组成型转录单元的基因组敲入来呈现给LNT产生宿主。根据实施例29中提供的培养条件进行生长实验。在每个表达具有序列识别号22之来自脑膜炎双球菌的半乳糖苷β-1,3-N-乙酰葡萄糖胺转移酶(LgtA)与具有序列识别号23之来自脑膜炎双球菌的N-乙酰葡萄糖胺β-1,3-半乳糖基转移酶(wbgO)的LNT产生宿主中,评估LN3与LNT的产量。
实施例32.谷氨酸棒状杆菌宿主中鉴定提高乳糖-N-新四糖(LNnT)产量的膜蛋白
建立了一个实验来评估具有序列识别号01、02、03、04、05、06、07、08、09、10、11、12、13、14、15、16、17、18、19、20、21、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97或98之膜蛋白其提高生长在补充有20g/L乳糖的培养基(参见实施例29)中的宿主细胞的LN3及/或乳糖-N-新四糖(LNnT)产生的能力。如实施例29中所述,对每个菌株进行修饰用于LN3的产生。此外,藉由nagB、glmS与gamA基因的基因组敲除与包括编码来自大肠杆菌的乳糖通透酶(LacY)(序列识别号52)、天然果糖-6-P-氨基转移酶(UniProt IDQ8NND3)、来自大肠杆菌W(UniProt ID E0IXR1)的蔗糖转运蛋白(CscB)、来自运动发酵单胞菌运动发酵单胞菌的果糖激酶(Frk)(UniProt ID Q03417)与来自青春双歧杆菌的蔗糖磷酸化酶(BaSP)(UniProt ID A0ZZH6)之基因的一组成型转录单元的基因组敲入,每个菌株以蔗糖生长。候选基因藉由包括所述膜蛋白基因之一组成型转录单元的基因组敲入来呈现给LNnT产生宿主。根据实施例29中提供的培养条件进行生长实验。在每个表达具有序列识别号22之来自脑膜炎双球菌的半乳糖苷β-1,3-N-乙酰葡萄糖胺转移酶(LgtA)与具有序列识别号24之来自脑膜炎双球菌的N-乙酰葡萄糖胺β-1,4-半乳糖基转移酶(LgtB)的LNnT产生宿主中,评估LN3与LNnT的产量。
实施例33.材料与方法动物细胞
从不同哺乳动物的脂肪组织中之间充质干细胞的分离
新鲜脂肪组织取自屠宰场(例如牛、猪、羊、鸡、鸭、鲶鱼、蛇、青蛙)或吸脂术(例如,在人类的情况下,在知情同意后),并保存在补充有抗生素的磷酸盐缓冲盐水中。对脂肪组织进行酶消化,然后离心以分离间充质干细胞。将分离的间充质干细胞转移到细胞培养瓶中并在标准生长条件下生长,例如37℃,5%二氧化碳。起始培养基包括DMEM-F12、RPMI与Alpha-MEM培养基(添加15%胎牛血清)与1%抗生素。在第一次继代后,随后将培养基更换为添加了10% FBS(胎牛血清)的培养培养基。例如,为了所有目的引用全文并入于此之Ahmad与Shakoori(2013,Stem Cell Regen Med.9(2):29-36)描述了于此实施例中描述的方法的某些变化。
从乳汁之间充质干细胞的分离
该实施例说明了从在无菌条件下从人或任何其他哺乳动物,例如于此所述,收集的乳汁中分离间充质干细胞。将等体积的磷酸盐缓冲盐水加入稀释的乳汁中,然后离心20分钟。将细胞沉淀以磷酸盐缓冲盐水洗涤三次,然后在标准培养条件下将细胞接种在细胞培养瓶中在具有10%胎牛血清与1%抗生素的DMEM-F12、RPMI与Alpha-MEM培养基中。例如,为了所有目的引用全文并入于此之Hassiotou et al.(2012,Stem Cells.30(10):2164-2174)描述了于此实施例中描述的方法的某些变化。
使用2D与3D培养系统之干细胞的分化
分离的间充质细胞可以在2D与3D培养系统中分化成乳腺样上皮细胞和管腔细胞。参见,例如Huynh et al.1991.Exp Cell Res.197(2):191 -199;Gibson et al.1991,InVitro Cell Dev Biol Anim.27(7):585-594;Blatchford et al.1999;Animal CellTechnology’:Basic&Applied Aspects,Springer,Dordrecht.141-145;Williams etal.2009,Breast Cancer Res 11(3):26-43;and Arevalo et al.2015,Am J PhysiolCell Physiol.310(5):C348-C356;为了所有目的,其各个引用全文并入于此。
对于2D培养,最初将分离的细胞接种在培养板中于补充有10ng/ml上皮生长因子与5pg/ml胰岛素的生长培养基中。在汇合时,以补充有2%胎牛血清、1%青霉素-链霉素(100U/ml青霉素、100ug/ml链霉素)与5pg/ml胰岛素的生长培养基喂养细胞48小时。为了诱导分化,细胞以含有5pg/ml胰岛素、1pg/ml氢皮质酮(hydrocortisone)、0.65ng/ml三碘甲腺氨酸(triiodothyronine)、100nM地塞米松(dexamethasone)与1pg/ml泌乳素(prolactin)的完全生长培养基喂养。24小时后,从完全诱导培养基中除去血清。
对于3D培养,将分离的细胞用胰蛋白酶消化并在Matrigel、透明质酸或超低附着表面培养盘中培养6天,并通过添加补充有10ng/ml上皮生长因子与5pg/ml胰岛素的生长培养基诱导分化与乳酸。在汇合时,以补充有2%胎牛血清、1%青霉素-链霉素(100U/ml青霉素、100ug/ml链霉素)与5pg/ml胰岛素的生长培养基喂养细胞48小时。为了诱导分化,细胞以含有5pg/ml胰岛素、1pg/ml氢皮质酮、0.65ng/ml三碘甲腺氨酸、100nM地塞米松与1pg/ml泌乳素的完全生长培养基喂养。24小时后,从完全诱导培养基中除去血清。
制备乳腺样细胞的方法
通过以编码Oct4、Sox2、Klf4与c-Myc的病毒载体重新编程,哺乳动物细胞被引起以诱导多能性(pluripotency)。然后将得到的重编程细胞在Mammocult培养基(可从StemCell Technologies获得)或乳腺细胞富集培养基(DMEM、3% FBS、雌激素、孕酮、肝素、氢皮质酮、胰岛素、EGF)中培养,使它们成为乳腺样的,从中可以诱导选定乳成分的表达。或者,使用CRISPR/Cas9等重塑系统进行表观遗传重塑,以激活选择的感兴趣基因,如酪蛋白、α-乳白蛋白以为组成型地允许它们各自的蛋白质表达,及/或向下调节及/或敲除选择内源基因,例如在WO21067641所述,为了所有目的,其引用全文并入于此。
培养
完整的生长培养基包括高葡萄糖DMEM/F12、10% FBS、1% NEAA、1%pen/strep、1% ITS-X、1% F-Glu、10ng/ml EGF与5pg/ml氢皮质酮。完整的泌乳培养基包括高葡萄糖DMEM/F12、1% NEAA、1%pen/strep、1% ITS-X、1%F-Glu、10ng/ml EGF、5pg/ml氢皮质酮与1pg/ml泌乳素(Hyunh 1991中的5ug/ml)。将细胞以20,000个细胞/cm2的密度接种到胶原蛋白涂布的烧瓶中在完全生长培养基中,并在完全生长培养基中粘附与扩张48小时,然后将培养基换成完全泌乳培养基。暴露于泌乳培养基后,细胞开始分化并停止生长。在大约一周内,细胞开始将泌乳产物,如乳脂、乳糖、酪蛋白与乳清分泌到培养基中。可以藉由超过滤藉由浓缩或稀释来实现所需的泌乳培养基的浓度。可以藉由透析来实现泌乳培养基的所需盐平衡,例如,以从培养基中去除不需要的代谢产物。使用的荷尔蒙与其他生长因子可以藉由树脂纯化选择性地萃取,例如使用镍树脂去除带有His标签的生长因子,以进一步降低乳酸产品中的污染物程度。
解析分析
参见示实施例4的这一部分。
实施例34.在非乳腺成体干细胞(non-mammary adult stem cell)中测试膜蛋白 的LN3产量
建立了一个实验来评估具有序列识别号01、02、03、04、05、06、07、08、09、10、11、12、13、14、15、16、17、18、19、20、21、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97或98之膜蛋白其提高LN3产生的能力。如实施例33中所述,经分离的间充质细胞与重新编程(re-programmed)为乳腺样细胞藉由CRISPR-CAS修饰以过表达来自智人的GlcN6P合成酶(GlcN6P synthase)(UniProt ID Q06210)、来自智人的6-磷酸葡萄糖胺N-乙酰转移酶(glucosamine 6-phosphate N-acetyltransferase)(UniProt ID Q96EK6)、来自智人的磷酸乙酰氨基葡萄糖变位酶(phosphoacetylglucosamine mutase)(UniProt IDO95394)、UDP-N-乙酰己糖胺焦磷酸化酶(UDP-N-acetylhexosamine pyrophosphorylase)(UniProt ID Q16222)与具有序列识别号22之来自脑膜炎双球菌的半乳糖苷β-1,3-N-乙酰葡萄糖胺转移酶(LgtA)。所有引入的基因都对宿主细胞进行密码子优化(codon-optimized)。此外,将候选膜蛋白基因引入LN3产生宿主(CRISPR-CAS)。根据实施例33中提供的培养条件进行生长实验。在每个表达具有序列识别号22之来自脑膜炎双球菌的半乳糖苷β-1,3-N-乙酰葡萄糖胺转移酶(LgtA)的LN3产生宿主中,评估LN3的产量。
实施例35.在非乳腺成体干细胞中测试膜蛋白的乳糖-N-四糖(LNT)产量
建立了一个实验来评估具有序列识别号01、02、03、04、05、06、07、08、09、10、11、12、13、14、15、16、17、18、19、20、21、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97或98之膜蛋白其提高LN3及/或乳糖-N-四糖(LNT)产生的能力。如实施例33中所述,经分离的间充质细胞与重新编程为乳腺样细胞藉由CRISPR-CAS修饰以过表达来自智人的GlcN6P合成酶(UniProt ID Q06210)、来自智人的6-磷酸葡萄糖胺N-乙酰转移酶、来自智人的磷酸乙酰氨基葡萄糖变位酶(UniProt ID O95394)、UDP-N-乙酰己糖胺焦磷酸化酶(UniProt ID Q16222)、具有序列识别号22之来自脑膜炎双球菌的半乳糖苷β-1,3-N-乙酰葡萄糖胺转移酶(LgtA)与具有序列识别号23之来自脑膜炎双球菌的N-乙酰葡萄糖胺β-1,3-半乳糖基转移酶(wbgO)。所有引入的基因都对宿主细胞进行密码子优化。此外,将候选膜蛋白基因引入LNT产生宿主(CRISPR-CAS)。根据实施例33中提供的培养条件进行生长实验。在每个表达具有序列识别号22之来自脑膜炎双球菌的半乳糖苷β-1,3-N-乙酰葡萄糖胺转移酶(LgtA)与具有序列识别号23之来自脑膜炎双球菌的N-乙酰葡萄糖胺β-1,3-半乳糖基转移酶(wbgO)的LNT产生宿主中,评估LN3与LNT的产量。
实施例36.在非乳腺成体干细胞中鉴定提高乳糖-N-新四糖(LNnT)产量的膜蛋白
建立了一个实验来评估具有序列识别号01、02、03、04、05、06、07、08、09、10、11、12、13、14、15、16、17、18、19、20、21、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97或98之膜蛋白其提高LN3及/或乳糖-N-四糖(LNT)产生的能力。如实施例33中所述,经分离的间充质细胞与重新编程为乳腺样细胞藉由CRISPR-CAS修饰以过表达来自智人的GlcN6P合成酶(UniProt ID Q06210)、来自智人的6-磷酸葡萄糖胺N-乙酰转移酶、来自智人的磷酸乙酰氨基葡萄糖变位酶(UniProt ID O95394)、UDP-N-乙酰己糖胺焦磷酸化酶(UniProt ID Q16222)、具有序列识别号22之来自脑膜炎双球菌的半乳糖苷β-1,3-N-乙酰葡萄糖胺转移酶(LgtA)与具有序列识别号24之来自脑膜炎双球菌的N-乙酰葡萄糖胺β-1,4-半乳糖基转移酶(LgtB)。所有引入的基因都对宿主细胞进行密码子优化。此外,将候选膜蛋白基因引入LNnT产生宿主(CRISPR-CAS)。根据实施例33中提供的培养条件进行生长实验。在每个表达具有序列识别号22之来自脑膜炎双球菌的半乳糖苷β-1,3-N-乙酰葡萄糖胺转移酶(LgtA)与具有序列识别号24之来自脑膜炎双球菌的N-乙酰葡萄糖胺β-1,4-半乳糖基转移酶(LgtB)的LNnT产生宿主中,评估LN3与LNnT的产量。
序列表
<110> 因比奥斯公司
<120> 在宿主细胞中产生包含LN3作为核心结构的寡糖
<130> 035-PCT
<150> EP21152592.8
<151> 2021-01-20
<160> 98
<170> PatentIn version 3.5
<210> 1
<211> 410
<212> PRT
<213> Cronobacter muytjensii
<400> 1
Met Gln Thr His Ala Asn Arg Thr Gly Arg Leu Gly Arg Gln Ala Leu
1 5 10 15
Leu Phe Pro Leu Cys Leu Val Leu Tyr Glu Phe Ser Thr Tyr Ile Gly
20 25 30
Asn Asp Met Ile Gln Pro Gly Met Leu Ala Val Val Glu Gln Tyr Gln
35 40 45
Ala Gly Val Glu Trp Val Pro Thr Ser Met Thr Ala Tyr Leu Ala Gly
50 55 60
Gly Met Phe Leu Gln Trp Leu Leu Gly Pro Leu Ser Asp Arg Ile Gly
65 70 75 80
Arg Arg Pro Val Met Leu Ala Gly Val Val Trp Phe Ile Val Thr Cys
85 90 95
Leu Ala Thr Leu Leu Ala Gln Thr Ile Glu Gln Phe Thr Val Leu Arg
100 105 110
Phe Leu Gln Gly Ile Ser Leu Cys Phe Ile Gly Ala Val Gly Tyr Ala
115 120 125
Ala Ile Gln Glu Ser Phe Glu Glu Ala Val Cys Ile Lys Ile Thr Ala
130 135 140
Leu Met Ala Asn Val Ala Leu Ile Ala Pro Leu Leu Gly Pro Leu Val
145 150 155 160
Gly Ala Ala Trp Val His Ala Ala Pro Trp Glu Met Met Phe Val Leu
165 170 175
Phe Ala Ala Leu Ala Ala Ile Ser Phe Phe Gly Leu Trp Arg Ala Met
180 185 190
Pro Glu Thr Ala Thr Arg Leu Gly Glu Lys Leu Ser Leu Arg Glu Leu
195 200 205
Gly Arg Asp Tyr Lys Ala Val Leu Lys Asn Leu Arg Phe Val Ser Gly
210 215 220
Ala Leu Ala Ile Gly Phe Val Ser Leu Pro Leu Leu Ala Trp Ile Ala
225 230 235 240
Gln Ser Pro Val Ile Ile Ile Ser Gly Glu Gln Met Ser Thr Tyr Glu
245 250 255
Tyr Gly Leu Leu Gln Val Pro Ile Phe Gly Ala Leu Ile Leu Gly Asn
260 265 270
Leu Val Leu Ala Lys Leu Thr Ala Arg Arg Ser Val Arg Ser Leu Ile
275 280 285
Ile Met Gly Gly Trp Pro Ile Met Ala Gly Leu Ala Leu Ala Ala Phe
290 295 300
Ala Thr Leu Leu Ser Ser His Ala Tyr Leu Trp Met Thr Ala Gly Leu
305 310 315 320
Ser Ile Tyr Ala Phe Gly Ile Gly Ile Ala Asn Ala Gly Leu Val Arg
325 330 335
Leu Thr Leu Phe Ala Ser Asp Ile Ser Lys Gly Thr Val Ser Ala Ala
340 345 350
Met Gly Met Leu Gln Met Thr Ile Phe Thr Val Gly Ile Glu Val Ser
355 360 365
Lys His Ala Trp Ile Gly Gly Gly Asn Gly Leu Phe Asn Leu Phe Asn
370 375 380
Leu Ala Asn Gly Leu Leu Trp Leu Gly Leu Met Val Ile Phe Leu Lys
385 390 395 400
Asp Lys Thr Val Gly Ala Ser Arg Glu Gly
405 410
<210> 2
<211> 411
<212> PRT
<213> 里根斯堡预研菌 (Yokenella regensburgei) (ATCC43003)
<400> 2
Met Gln Asn His Thr Leu Ser Gly Lys Arg Leu Gly Arg Gln Ala Leu
1 5 10 15
Leu Phe Pro Leu Cys Leu Val Leu Tyr Glu Phe Ser Thr Tyr Ile Gly
20 25 30
Asn Asp Met Ile Gln Pro Gly Met Leu Ala Val Val Glu Gln Tyr Gln
35 40 45
Ala Gly Ile Glu Trp Val Pro Thr Ser Met Thr Ala Tyr Leu Ala Gly
50 55 60
Gly Ile Phe Leu Gln Trp Leu Leu Gly Pro Leu Ser Asp Arg Ile Gly
65 70 75 80
Arg Arg Pro Val Met Leu Thr Gly Val Val Trp Phe Ile Val Thr Cys
85 90 95
Leu Ala Thr Leu Leu Ala Gln Asn Ile Glu Gln Phe Thr Phe Leu Arg
100 105 110
Phe Leu Gln Gly Val Ser Leu Cys Phe Ile Gly Ala Val Gly Tyr Ala
115 120 125
Ala Ile Gln Glu Ser Phe Glu Glu Ala Val Cys Ile Lys Ile Thr Ala
130 135 140
Leu Met Ala Asn Val Ala Leu Ile Ala Pro Leu Leu Gly Pro Leu Val
145 150 155 160
Gly Ala Ala Trp Ile His Phe Ala Pro Trp Glu Thr Met Phe Val Leu
165 170 175
Phe Ala Ala Leu Ala Ala Ile Ser Phe Phe Gly Leu Gln Arg Ala Met
180 185 190
Pro Glu Thr Ala Thr Arg Ile Gly Glu Lys Leu Ser Leu Lys Glu Leu
195 200 205
Gly Arg Asp Tyr Ser Ala Val Leu Lys Asn Leu Arg Phe Val Ala Gly
210 215 220
Ala Leu Ala Thr Gly Phe Val Ser Leu Pro Leu Leu Ala Trp Ile Ala
225 230 235 240
Gln Ser Pro Val Ile Ile Met Ser Gly Glu His Ala Ser Ser Tyr Glu
245 250 255
Tyr Gly Met Leu Gln Val Pro Ile Phe Gly Ala Leu Ile Ile Gly Asn
260 265 270
Leu Val Leu Ala Arg Leu Thr Ser Arg Arg Ser Val Arg Ser Leu Ile
275 280 285
Ile Met Gly Gly Trp Pro Ile Val Ala Gly Leu Ile Leu Ala Ala Ala
290 295 300
Ala Thr Val Val Ser Ser His Ala Tyr Leu Trp Met Thr Ala Gly Leu
305 310 315 320
Ser Val Tyr Ala Phe Gly Ile Gly Leu Ala Asn Ala Gly Leu Val Arg
325 330 335
Leu Thr Leu Phe Ala Ser Asp Met Ser Lys Gly Thr Val Ala Ala Ala
340 345 350
Met Gly Met Leu Gln Met Met Ile Phe Thr Val Gly Ile Glu Val Ser
355 360 365
Lys His Ala Tyr Leu Leu Gly Gly Asn Gly Leu Phe Ser Leu Phe Asn
370 375 380
Leu Ala Gly Gly Leu Val Trp Leu Val Leu Ile Val Tyr Phe Leu Lys
385 390 395 400
Asp Lys Thr Val Gly Ala Ser Thr Lys Pro Asp
405 410
<210> 3
<211> 410
<212> PRT
<213> 大肠杆菌菌株K12 (MG1655)
<400> 3
Met Gln Asn Lys Leu Ala Ser Gly Ala Arg Leu Gly Arg Gln Ala Leu
1 5 10 15
Leu Phe Pro Leu Cys Leu Val Leu Tyr Glu Phe Ser Thr Tyr Ile Gly
20 25 30
Asn Asp Met Ile Gln Pro Gly Met Leu Ala Val Val Glu Gln Tyr Gln
35 40 45
Ala Gly Ile Asp Trp Val Pro Thr Ser Met Thr Ala Tyr Leu Ala Gly
50 55 60
Gly Met Phe Leu Gln Trp Leu Leu Gly Pro Leu Ser Asp Arg Ile Gly
65 70 75 80
Arg Arg Pro Val Met Leu Ala Gly Val Val Trp Phe Ile Val Thr Cys
85 90 95
Leu Ala Ile Leu Leu Ala Gln Asn Ile Glu Gln Phe Thr Leu Leu Arg
100 105 110
Phe Leu Gln Gly Ile Ser Leu Cys Phe Ile Gly Ala Val Gly Tyr Ala
115 120 125
Ala Ile Gln Glu Ser Phe Glu Glu Ala Val Cys Ile Lys Ile Thr Ala
130 135 140
Leu Met Ala Asn Val Ala Leu Ile Ala Pro Leu Leu Gly Pro Leu Val
145 150 155 160
Gly Ala Ala Trp Ile His Val Leu Pro Trp Glu Gly Met Phe Val Leu
165 170 175
Phe Ala Ala Leu Ala Ala Ile Ser Phe Phe Gly Leu Gln Arg Ala Met
180 185 190
Pro Glu Thr Ala Thr Arg Ile Gly Glu Lys Leu Ser Leu Lys Glu Leu
195 200 205
Gly Arg Asp Tyr Lys Leu Val Leu Lys Asn Gly Arg Phe Val Ala Gly
210 215 220
Ala Leu Ala Leu Gly Phe Val Ser Leu Pro Leu Leu Ala Trp Ile Ala
225 230 235 240
Gln Ser Pro Ile Ile Ile Ile Thr Gly Glu Gln Leu Ser Ser Tyr Glu
245 250 255
Tyr Gly Leu Leu Gln Val Pro Ile Phe Gly Ala Leu Ile Ala Gly Asn
260 265 270
Leu Leu Leu Ala Arg Leu Thr Ser Arg Arg Thr Val Arg Ser Leu Ile
275 280 285
Ile Met Gly Gly Trp Pro Ile Met Ile Gly Leu Leu Val Ala Ala Ala
290 295 300
Ala Thr Val Ile Ser Ser His Ala Tyr Leu Trp Met Thr Ala Gly Leu
305 310 315 320
Ser Ile Tyr Ala Phe Gly Ile Gly Leu Ala Asn Ala Gly Leu Val Arg
325 330 335
Leu Thr Leu Phe Ala Ser Asp Met Ser Lys Gly Thr Val Ser Ala Ala
340 345 350
Met Gly Met Leu Gln Met Leu Ile Phe Thr Val Gly Ile Glu Ile Ser
355 360 365
Lys His Ala Trp Leu Asn Gly Gly Asn Gly Leu Phe Asn Leu Phe Asn
370 375 380
Leu Val Asn Gly Ile Leu Trp Leu Ser Leu Met Val Ile Phe Leu Lys
385 390 395 400
Asp Lys Gln Met Gly Asn Ser His Glu Gly
405 410
<210> 4
<211> 411
<212> PRT
<213> 肠杆菌属种(Enterobacter sp.)
<400> 4
Met Leu Asn Arg Ser Ser Ser Gly Thr Arg Leu Gly Arg Gln Ala Leu
1 5 10 15
Leu Phe Pro Leu Cys Leu Val Leu Tyr Glu Phe Ser Thr Tyr Ile Gly
20 25 30
Asn Asp Met Ile Gln Pro Gly Met Leu Ala Val Val Ala Gln Tyr Asn
35 40 45
Ala Gly Ile Glu Trp Val Pro Thr Ser Met Thr Ala Tyr Leu Ala Gly
50 55 60
Gly Met Phe Leu Gln Trp Leu Leu Gly Pro Leu Ser Asp Arg Ile Gly
65 70 75 80
Arg Arg Pro Val Met Leu Thr Gly Val Ala Trp Phe Ile Val Thr Cys
85 90 95
Leu Ala Thr Leu Leu Ala Gln Thr Ile Glu Gln Phe Met Val Leu Arg
100 105 110
Phe Leu Gln Gly Val Ser Leu Cys Phe Ile Gly Ala Val Gly Tyr Ala
115 120 125
Ala Ile Gln Glu Ser Phe Glu Glu Ala Val Cys Ile Lys Ile Thr Ala
130 135 140
Leu Met Ala Asn Val Ala Leu Ile Ala Pro Leu Leu Gly Pro Leu Val
145 150 155 160
Gly Ala Ala Trp Val His Val Ala Pro Trp Glu Gly Met Phe Val Leu
165 170 175
Phe Ala Val Leu Ala Ala Ile Ser Phe Tyr Gly Leu His Arg Ala Met
180 185 190
Pro Glu Thr Ala Thr Arg Ile Gly Glu Lys Leu Ser Leu Gln Glu Leu
195 200 205
Gly Arg Asp Tyr Lys Glu Val Leu Lys Asn Gly Arg Phe Val Ala Gly
210 215 220
Ala Leu Ala Ile Gly Phe Val Cys Leu Pro Leu Leu Ala Trp Ile Ala
225 230 235 240
Gln Ser Pro Val Ile Ile Ile Ser Gly Glu Asn Leu Ser Ser Tyr Glu
245 250 255
Tyr Gly Leu Leu Gln Val Pro Ile Phe Gly Ala Leu Ile Val Gly Asn
260 265 270
Ile Val Leu Ala Arg Leu Thr Ser Arg Arg Thr Val Arg Ser Leu Ile
275 280 285
Ile Met Gly Gly Trp Pro Ile Val Ile Gly Leu Val Val Ala Ala Val
290 295 300
Ala Thr Val Val Ser Ser His Ala Tyr Leu Trp Met Thr Ala Gly Leu
305 310 315 320
Ser Ile Tyr Ala Phe Gly Ile Gly Leu Ala Asn Ala Gly Leu Val Arg
325 330 335
Leu Thr Leu Phe Ala Ser Glu Val Ser Lys Gly Thr Val Ser Ala Ala
340 345 350
Met Gly Met Leu Gln Met Leu Ile Phe Thr Val Gly Ile Glu Val Ser
355 360 365
Lys His Ala Phe Ser Ser Gly Gly Asn Gly Leu Phe Ser Leu Phe Asn
370 375 380
Leu Val Asn Gly Leu Leu Trp Leu Ala Leu Met Phe Val Phe Leu Lys
385 390 395 400
Asp Lys Arg Val Gly Ser Ser Leu Gln Pro Gly
405 410
<210> 5
<211> 410
<212> PRT
<213> 克氏柠檬酸杆菌(Citrobacter koseri)(Citrobacter diversus)
<400> 5
Met Gln Asn Leu Ser Gln Thr Gly Val Arg Leu Gly Arg Gln Ala Leu
1 5 10 15
Leu Phe Pro Leu Cys Leu Val Leu Tyr Glu Phe Ser Thr Tyr Ile Gly
20 25 30
Asn Asp Met Ile Gln Pro Gly Met Leu Ala Val Val Glu Gln Tyr Gln
35 40 45
Ala Gly Ile Asp Trp Val Pro Thr Ser Met Thr Ala Tyr Leu Ala Gly
50 55 60
Gly Met Phe Leu Gln Trp Leu Leu Gly Pro Leu Ser Asp Arg Ile Gly
65 70 75 80
Arg Arg Pro Val Met Leu Ala Gly Val Ile Trp Phe Ile Val Thr Cys
85 90 95
Leu Ala Thr Leu Leu Ala Gln Asn Ile Glu Gln Phe Thr Leu Leu Arg
100 105 110
Phe Leu Gln Gly Val Ser Leu Cys Phe Ile Gly Ala Val Gly Tyr Ala
115 120 125
Ala Ile Gln Glu Ser Phe Glu Glu Ala Val Cys Ile Lys Ile Thr Ala
130 135 140
Leu Met Ala Asn Val Ala Leu Ile Ala Pro Leu Leu Gly Pro Leu Val
145 150 155 160
Gly Ala Ala Trp Val His Val Leu Pro Trp Glu Gly Met Phe Val Leu
165 170 175
Phe Ala Val Leu Ala Ala Ile Ala Phe Val Gly Leu Gln Arg Ala Met
180 185 190
Pro Glu Thr Ala Thr Arg Leu Gly Glu Lys Leu Ser Leu Lys Glu Leu
195 200 205
Gly Arg Asp Tyr Thr Leu Val Leu Lys Asn Val Arg Phe Val Ala Gly
210 215 220
Ala Leu Ala Leu Gly Phe Val Ser Leu Pro Leu Leu Ala Trp Ile Ala
225 230 235 240
Gln Ser Pro Ile Ile Ile Ile Ser Gly Glu Gln Leu Ser Ser Tyr Glu
245 250 255
Tyr Gly Leu Leu Gln Val Pro Val Phe Gly Ala Leu Ile Ala Gly Asn
260 265 270
Leu Val Leu Ala Arg Leu Thr Ser Arg Arg Thr Val Arg Ala Leu Ile
275 280 285
Ile Met Gly Gly Trp Pro Ile Val Ala Gly Leu Leu Ile Ala Ala Ala
290 295 300
Ala Thr Val Val Ser Ser His Ala Tyr Leu Trp Met Thr Ala Gly Leu
305 310 315 320
Ser Val Tyr Ala Phe Gly Ile Gly Val Ala Asn Ala Gly Leu Val Arg
325 330 335
Leu Thr Leu Phe Ala Ser Asp Met Ser Lys Gly Thr Val Ser Ala Ala
340 345 350
Met Gly Met Leu Gln Met Leu Ile Phe Thr Val Gly Ile Glu Val Ser
355 360 365
Lys His Ala Tyr Leu Ser Gly Gly Asn Gly Leu Phe Ser Leu Phe Asn
370 375 380
Leu Ala Asn Gly Ile Leu Trp Leu Leu Leu Met Val Ile Phe Leu Lys
385 390 395 400
Asp Lys Arg Val Gly Asp Ser Arg Glu Gly
405 410
<210> 6
<211> 410
<212> PRT
<213> Citrobacter youngae ATCC 29220
<400> 6
Met Gln Asn Arg Leu Ser Ser Gly Ala Arg Leu Gly Arg Gln Ala Leu
1 5 10 15
Leu Phe Pro Leu Cys Leu Val Leu Tyr Glu Phe Ser Thr Tyr Ile Gly
20 25 30
Asn Asp Met Ile Gln Pro Gly Met Leu Ala Val Val Glu Gln Tyr Asn
35 40 45
Ala Gly Leu Asp Trp Val Pro Thr Ser Met Thr Ala Tyr Leu Ala Gly
50 55 60
Gly Met Phe Leu Gln Trp Leu Leu Gly Pro Leu Ser Asp Arg Ile Gly
65 70 75 80
Arg Arg Pro Val Met Leu Thr Gly Val Leu Trp Phe Ile Val Thr Cys
85 90 95
Leu Ala Thr Leu Leu Ala Gln Asn Ile Glu Gln Phe Thr Phe Leu Arg
100 105 110
Phe Leu Gln Gly Ile Ser Leu Cys Phe Ile Gly Ala Val Gly Tyr Ala
115 120 125
Ala Ile Gln Glu Ser Phe Glu Glu Ala Val Cys Ile Lys Ile Thr Ala
130 135 140
Leu Met Ala Asn Val Ala Leu Ile Ala Pro Leu Leu Gly Pro Leu Val
145 150 155 160
Gly Ala Ala Trp Val His Ile Leu Pro Trp Glu Gly Met Phe Ile Leu
165 170 175
Phe Ala Ala Leu Ala Ser Ile Ser Phe Phe Gly Leu Gln Arg Ala Met
180 185 190
Pro Glu Thr Ala Thr Arg Leu Gly Glu Lys Leu Ser Ile Lys Glu Leu
195 200 205
Gly Lys Asp Tyr Lys Leu Val Leu Lys Asn Gly Arg Phe Val Ala Gly
210 215 220
Ala Leu Ala Leu Gly Phe Val Ser Leu Pro Leu Leu Ala Trp Ile Ala
225 230 235 240
Gln Ser Pro Ile Ile Ile Ile Ser Gly Glu His Leu Ser Ser Tyr Glu
245 250 255
Tyr Gly Leu Leu Gln Val Pro Ile Phe Gly Ala Leu Ile Ala Gly Asn
260 265 270
Leu Ala Leu Ala Arg Leu Thr Ser Arg Lys Thr Val Arg Ser Leu Ile
275 280 285
Ile Met Gly Gly Trp Pro Ile Ala Val Gly Leu Val Ile Ala Ala Ala
290 295 300
Ala Thr Val Val Ser Ser His Ala Tyr Leu Trp Met Thr Ala Gly Leu
305 310 315 320
Ser Val Tyr Ala Phe Gly Ile Gly Leu Ala Asn Ala Gly Leu Val Arg
325 330 335
Leu Thr Leu Phe Ala Ser Glu Met Ser Lys Gly Thr Val Ser Ala Ala
340 345 350
Met Gly Met Leu Gln Met Leu Ile Phe Thr Val Gly Ile Glu Leu Ser
355 360 365
Lys His Ala Tyr Leu Leu Gly Gly Asn Gly Leu Phe Ser Leu Phe Asn
370 375 380
Leu Ala Ser Gly Val Leu Trp Leu Ile Leu Met Val Ile Phe Leu Lys
385 390 395 400
Asp Lys Arg Val Gly Asn Ser Arg Lys Ile
405 410
<210> 7
<211> 416
<212> PRT
<213> 大肠杆菌K12 MG1655
<400> 7
Met Asn Lys Gln Ser Trp Leu Leu Asn Leu Ser Leu Leu Lys Thr His
1 5 10 15
Pro Ala Phe Arg Ala Val Phe Leu Ala Arg Phe Ile Ser Ile Val Ser
20 25 30
Leu Gly Leu Leu Gly Val Ala Val Pro Val Gln Ile Gln Met Met Thr
35 40 45
His Ser Thr Trp Gln Val Gly Leu Ser Val Thr Leu Thr Gly Gly Ala
50 55 60
Met Phe Val Gly Leu Met Val Gly Gly Val Leu Ala Asp Arg Tyr Glu
65 70 75 80
Arg Lys Lys Val Ile Leu Leu Ala Arg Gly Thr Cys Gly Ile Gly Phe
85 90 95
Ile Gly Leu Cys Leu Asn Ala Leu Leu Pro Glu Pro Ser Leu Leu Ala
100 105 110
Ile Tyr Leu Leu Gly Leu Trp Asp Gly Phe Phe Ala Ser Leu Gly Val
115 120 125
Thr Ala Leu Leu Ala Ala Thr Pro Ala Leu Val Gly Arg Glu Asn Leu
130 135 140
Met Gln Ala Gly Ala Ile Thr Met Leu Thr Val Arg Leu Gly Ser Val
145 150 155 160
Ile Ser Pro Met Ile Gly Gly Leu Leu Leu Ala Thr Gly Gly Val Ala
165 170 175
Trp Asn Tyr Gly Leu Ala Ala Ala Gly Thr Phe Ile Thr Leu Leu Pro
180 185 190
Leu Leu Ser Leu Pro Ala Leu Pro Pro Pro Pro Gln Pro Arg Glu His
195 200 205
Pro Leu Lys Ser Leu Leu Ala Gly Phe Arg Phe Leu Leu Ala Ser Pro
210 215 220
Leu Val Gly Gly Ile Ala Leu Leu Gly Gly Leu Leu Thr Met Ala Ser
225 230 235 240
Ala Val Arg Val Leu Tyr Pro Ala Leu Ala Asp Asn Trp Gln Met Ser
245 250 255
Ala Ala Gln Ile Gly Phe Leu Tyr Ala Ala Ile Pro Leu Gly Ala Ala
260 265 270
Ile Gly Ala Leu Thr Ser Gly Lys Leu Ala His Ser Ala Arg Pro Gly
275 280 285
Leu Leu Met Leu Leu Ser Thr Leu Gly Ser Phe Leu Ala Ile Gly Leu
290 295 300
Phe Gly Leu Met Pro Met Trp Ile Leu Gly Val Val Cys Leu Ala Leu
305 310 315 320
Phe Gly Trp Leu Ser Ala Val Ser Ser Leu Leu Gln Tyr Thr Met Leu
325 330 335
Gln Thr Gln Thr Pro Glu Ala Met Leu Gly Arg Ile Asn Gly Leu Trp
340 345 350
Thr Ala Gln Asn Val Thr Gly Asp Ala Ile Gly Ala Ala Leu Leu Gly
355 360 365
Gly Leu Gly Ala Met Met Thr Pro Val Ala Ser Ala Ser Ala Ser Gly
370 375 380
Phe Gly Leu Leu Ile Ile Gly Val Leu Leu Leu Leu Val Leu Val Glu
385 390 395 400
Leu Arg His Phe Arg Gln Thr Pro Pro Gln Val Thr Ala Ser Asp Ser
405 410 415
<210> 8
<211> 405
<212> PRT
<213> 大肠杆菌K12 MG1655
<400> 8
Met Ala Thr Ala Trp Tyr Lys Gln Val Asn Pro Pro Gln Arg Lys Ala
1 5 10 15
Leu Phe Ser Ala Trp Leu Gly Tyr Val Phe Asp Gly Phe Asp Phe Met
20 25 30
Met Ile Phe Tyr Ile Leu His Ile Ile Lys Ala Asp Leu Gly Ile Thr
35 40 45
Asp Ile Gln Ala Thr Leu Ile Gly Thr Val Ala Phe Ile Ala Arg Pro
50 55 60
Ile Gly Gly Gly Phe Phe Gly Ala Met Ala Asp Lys Tyr Gly Arg Lys
65 70 75 80
Pro Met Met Met Trp Ala Ile Phe Ile Tyr Ser Val Gly Thr Gly Leu
85 90 95
Ser Gly Ile Ala Thr Asn Leu Tyr Met Leu Ala Val Cys Arg Phe Ile
100 105 110
Val Gly Leu Gly Met Ser Gly Glu Tyr Ala Cys Ala Ser Thr Tyr Ala
115 120 125
Val Glu Ser Trp Pro Lys Asn Leu Gln Ser Lys Ala Ser Ala Phe Leu
130 135 140
Val Ser Gly Phe Ser Val Gly Asn Ile Ile Ala Ala Gln Ile Ile Pro
145 150 155 160
Gln Phe Ala Glu Val Tyr Gly Trp Arg Asn Ser Phe Phe Ile Gly Leu
165 170 175
Leu Pro Val Leu Leu Val Leu Trp Ile Arg Lys Ser Ala Pro Glu Ser
180 185 190
Gln Glu Trp Ile Glu Asp Lys Tyr Lys Asp Lys Ser Thr Phe Leu Ser
195 200 205
Val Phe Arg Lys Pro His Leu Ser Ile Ser Met Ile Val Phe Leu Val
210 215 220
Cys Phe Cys Leu Phe Gly Ala Asn Trp Pro Ile Asn Gly Leu Leu Pro
225 230 235 240
Ser Tyr Leu Ala Asp Asn Gly Val Asn Thr Val Val Ile Ser Thr Leu
245 250 255
Met Thr Ile Ala Gly Leu Gly Thr Leu Thr Gly Thr Ile Phe Phe Gly
260 265 270
Phe Val Gly Asp Lys Ile Gly Val Lys Lys Ala Phe Val Val Gly Leu
275 280 285
Ile Thr Ser Phe Ile Phe Leu Cys Pro Leu Phe Phe Ile Ser Val Lys
290 295 300
Asn Ser Ser Leu Ile Gly Leu Cys Leu Phe Gly Leu Met Phe Thr Asn
305 310 315 320
Leu Gly Ile Ala Gly Leu Val Pro Lys Phe Ile Tyr Asp Tyr Phe Pro
325 330 335
Thr Lys Leu Arg Gly Leu Gly Thr Gly Leu Ile Tyr Asn Leu Gly Ala
340 345 350
Thr Gly Gly Met Ala Ala Pro Val Leu Ala Thr Tyr Ile Ser Gly Tyr
355 360 365
Tyr Gly Leu Gly Val Ser Leu Phe Ile Val Thr Val Ala Phe Ser Ala
370 375 380
Leu Leu Ile Leu Leu Val Gly Phe Asp Ile Pro Gly Lys Ile Tyr Lys
385 390 395 400
Leu Ser Val Ala Lys
405
<210> 9
<211> 416
<212> PRT
<213> 大肠杆菌K12 MG1655
<400> 9
Met Ser Leu Ala Lys Ala Ser Leu Trp Thr Ala Ala Ser Thr Leu Val
1 5 10 15
Lys Ile Gly Ala Gly Leu Leu Val Gly Lys Leu Leu Ala Val Ser Phe
20 25 30
Gly Pro Ala Gly Leu Gly Leu Ala Ala Asn Phe Arg Gln Leu Ile Thr
35 40 45
Val Leu Gly Val Leu Ala Gly Ala Gly Ile Phe Asn Gly Val Thr Lys
50 55 60
Tyr Val Ala Gln Tyr His Asp Asn Pro Gln Gln Leu Arg Arg Val Val
65 70 75 80
Gly Thr Ser Ser Ala Met Val Leu Gly Phe Ser Thr Leu Met Ala Leu
85 90 95
Val Phe Val Leu Ala Ala Ala Pro Ile Ser Gln Gly Leu Phe Gly Asn
100 105 110
Thr Asp Tyr Gln Gly Leu Val Arg Leu Val Ala Leu Val Gln Met Gly
115 120 125
Ile Ala Trp Gly Asn Leu Leu Leu Ala Leu Met Lys Gly Phe Arg Asp
130 135 140
Ala Ala Gly Asn Ala Leu Ser Leu Ile Val Gly Ser Leu Ile Gly Val
145 150 155 160
Leu Ala Tyr Tyr Val Ser Tyr Arg Leu Gly Gly Tyr Glu Gly Ala Leu
165 170 175
Leu Gly Leu Ala Leu Ile Pro Ala Leu Val Val Ile Pro Ala Ala Ile
180 185 190
Met Leu Ile Lys Arg Gly Val Ile Pro Leu Ser Tyr Leu Lys Pro Ser
195 200 205
Trp Asp Asn Gly Leu Ala Gly Gln Leu Ser Lys Phe Thr Leu Met Ala
210 215 220
Leu Ile Thr Ser Val Thr Leu Pro Val Ala Tyr Ile Met Met Arg Lys
225 230 235 240
Leu Leu Ala Ala Gln Tyr Ser Trp Asp Glu Val Gly Ile Trp Gln Gly
245 250 255
Val Ser Ser Ile Ser Asp Ala Tyr Leu Gln Phe Ile Thr Ala Ser Phe
260 265 270
Ser Val Tyr Leu Leu Pro Thr Leu Ser Arg Leu Thr Glu Lys Arg Asp
275 280 285
Ile Thr Arg Glu Val Val Lys Ser Leu Lys Phe Val Leu Pro Ala Val
290 295 300
Ala Ala Ala Ser Phe Thr Val Trp Leu Leu Arg Asp Phe Ala Ile Trp
305 310 315 320
Leu Leu Leu Ser Asn Lys Phe Thr Ala Met Arg Asp Leu Phe Ala Trp
325 330 335
Gln Leu Val Gly Asp Val Leu Lys Val Gly Ala Tyr Val Phe Gly Tyr
340 345 350
Leu Val Ile Ala Lys Ala Ser Leu Arg Phe Tyr Ile Leu Ala Glu Val
355 360 365
Ser Gln Phe Thr Leu Leu Met Val Phe Ala His Trp Leu Ile Pro Ala
370 375 380
His Gly Ala Leu Gly Ala Ala Gln Ala Tyr Met Ala Thr Tyr Ile Val
385 390 395 400
Tyr Phe Ser Leu Cys Cys Gly Val Phe Leu Leu Trp Arg Arg Arg Ala
405 410 415
<210> 10
<211> 110
<212> PRT
<213> 大肠杆菌K12 MG1655
<400> 10
Met Asn Pro Tyr Ile Tyr Leu Gly Gly Ala Ile Leu Ala Glu Val Ile
1 5 10 15
Gly Thr Thr Leu Met Lys Phe Ser Glu Gly Phe Thr Arg Leu Trp Pro
20 25 30
Ser Val Gly Thr Ile Ile Cys Tyr Cys Ala Ser Phe Trp Leu Leu Ala
35 40 45
Gln Thr Leu Ala Tyr Ile Pro Thr Gly Ile Ala Tyr Ala Ile Trp Ser
50 55 60
Gly Val Gly Ile Val Leu Ile Ser Leu Leu Ser Trp Gly Phe Phe Gly
65 70 75 80
Gln Arg Leu Asp Leu Pro Ala Ile Ile Gly Met Met Leu Ile Cys Ala
85 90 95
Gly Val Leu Ile Ile Asn Leu Leu Ser Arg Ser Thr Pro His
100 105 110
<210> 11
<211> 507
<212> PRT
<213> 长双歧杆菌婴儿亚种(Bifidobacterium longum subsp. Infantis) (菌株ATCC 15697)
<400> 11
Met Ser Asn Glu Asn Thr Ala Val Gly Asp Val Arg Lys Lys Gly Gly
1 5 10 15
Leu Gly Gln Arg Ile Ala Tyr Ala Cys Gly Asn Leu Gly Gln Ala Ala
20 25 30
Phe Tyr Asn Ala Met Ser Thr Tyr Phe Val Thr Tyr Val Thr Ser Cys
35 40 45
Leu Phe Val Ser Tyr Ser Lys Ala Leu Ala Ala Gln Met Ile Ala Val
50 55 60
Ile Thr Gly Leu Ile Val Val Ile Arg Ile Ala Glu Ile Phe Ile Asp
65 70 75 80
Pro Leu Leu Gly Asn Leu Val Asp Asn Thr Thr Thr Lys Trp Gly Arg
85 90 95
Phe Arg Pro Trp Gln Phe Ile Gly Gly Leu Val Ser Ser Val Leu Ile
100 105 110
Met Leu Ile Phe Ser Gly Met Phe Gly Leu Val Asn Val Asn Thr Thr
115 120 125
Leu Phe Ile Val Leu Phe Val Ile Thr Phe Ile Val Leu Asp Val Phe
130 135 140
Tyr Ser Leu Arg Asp Ile Ser Tyr Trp Gly Met Ile Pro Ala Leu Ser
145 150 155 160
Ser Asp Ser His Glu Arg Ser Thr Tyr Thr Ala Leu Gly Thr Phe Thr
165 170 175
Gly Ser Ile Gly Tyr Asn Gly Ile Thr Val Ile Val Ile Pro Ile Val
180 185 190
Ser Tyr Phe Thr Trp Thr Phe Thr Gly Ala Lys Gly Gln Gly Gln Ala
195 200 205
Gly Trp Thr Ser Phe Gly Phe Ile Val Ala Leu Leu Gly Leu Ile Thr
210 215 220
Ala Trp Ala Val Ala Phe Gly Thr Lys Glu Ser Thr Asn Ala Leu Arg
225 230 235 240
Ala Lys Ala Gln Lys Asn Gly Asn Pro Phe Glu Ala Phe Lys Ala Leu
245 250 255
Phe Gln Asn Asp Gln Leu Leu Trp Val Ala Leu Ser Tyr Leu Leu Tyr
260 265 270
Ala Ile Ala Asn Val Ile Thr Thr Gly Val Met Tyr Tyr Leu Phe Val
275 280 285
Phe Val Leu Asp Glu Pro Ala Ala Phe Ser Val Thr Gly Ile Ile Pro
290 295 300
Leu Ile Ala Gly Phe Ile Met Ala Pro Leu Tyr Pro Ile Leu Asn Arg
305 310 315 320
Trp Ile Pro Arg Arg Tyr Leu Phe Ala Gly Gly Met Val Ser Met Ile
325 330 335
Ile Gly Tyr Thr Met Leu Ala Leu Phe Ser Ser Asn Leu Pro Val Val
340 345 350
Ile Val Ala Leu Ile Phe Phe Tyr Val Pro Ala Gln Phe Ile Gln Met
355 360 365
Thr Ala Ile Leu Ser Leu Thr Asp Ser Ile Glu Tyr Gly Gln Leu Lys
370 375 380
Asn Gly Lys Arg Asn Glu Ala Val Thr Leu Ser Val Arg Pro Met Leu
385 390 395 400
Asp Lys Ile Gly Gly Ala Met Ser Asn Gly Val Val Gly Ala Val Ala
405 410 415
Leu Ala Ala Gly Met Thr Gly His Ala Thr Ala Ala Asp Met Thr Ala
420 425 430
Ser Asn Ile Thr Thr Phe Lys Thr Phe Ala Phe Tyr Ile Pro Leu Val
435 440 445
Leu Ile Ile Leu Ser Leu Val Val Phe Trp Phe Lys Val Lys Ile Asp
450 455 460
Glu Lys Met His Ala Gln Ile Val Asp Glu Leu Glu Ala Lys Leu Ala
465 470 475 480
Ser Gly Glu Ile Val Asp Asp Glu Ala Gln Thr Val Glu Ala Val Glu
485 490 495
Ala Ile Asn Glu Glu Thr Pro Ala Ala Lys Asn
500 505
<210> 12
<211> 405
<212> PRT
<213> 长双歧杆菌婴儿亚种 (菌株ATCC 15697)
<400> 12
Met Ala Leu Asp Val Gly Lys Ala Leu Lys Ser Lys Thr Leu Val Val
1 5 10 15
Gly Val Leu Ser Met Ser Leu Leu Met Ser Ala Ser Asn Ala Val Ser
20 25 30
Gly Thr Ile Pro Ala Met Lys Glu Ala Phe Ser Asp Tyr Ser Ala Ala
35 40 45
Asn Val Glu Leu Leu Thr Thr Val Pro Thr Ile Gly Ser Met Val Gly
50 55 60
Thr Ala Leu Thr Gly Leu Phe Ala Asn Ala Ile Gly Arg Lys Lys Ile
65 70 75 80
Ala Met Ala Gly Phe Leu Ile Ser Ala Val Thr Gly Val Ile Pro Ala
85 90 95
Phe Phe Pro Tyr Tyr Trp Pro Ile Leu Ile Ser Arg Met Phe Phe Gly
100 105 110
Phe Gly Ser Ala Leu Phe Val Thr Leu Ser Val Ser Tyr Ile Thr Asp
115 120 125
Leu Tyr Asp Gly Asp Met Gln Arg Lys Leu Leu Gly Trp Arg Gln Ala
130 135 140
Val Gly Asn Leu Gly Asp Val Val Leu Leu Phe Val Ala Ser Leu Leu
145 150 155 160
Ile Thr Ile Asn Trp Gln Ser Thr Tyr Leu Ile Phe Phe Leu Leu Phe
165 170 175
Val Pro Met Val Leu Val Gly Met Phe Ile Pro Lys Glu Phe Asp Asn
180 185 190
Phe Ser Ile Arg Ser Ala Leu Val Asp Asp Glu Gly His Val Val Asp
195 200 205
Lys Ser Ala Ser Gln Lys Gln Thr Thr Asn Trp Gln Val Leu Trp Leu
210 215 220
Ala Phe Ile Phe Leu Val Val Ser Met Leu Tyr Asn Val Met Ser Ile
225 230 235 240
Lys Leu Ala Ser Tyr Val Val Asp Glu Gly Ile Gly Ser Ala Ser Leu
245 250 255
Ala Thr Leu Ile Phe Ser Phe Leu Val Val Ala Thr Ile Leu Ser Gly
260 265 270
Val Leu Phe Asp Lys Val Ala Lys Val Thr Lys Arg Leu Thr Val Thr
275 280 285
Ile Ser Glu Val Val Ile Gly Ile Cys Phe Ile Ala Thr Ala Leu Thr
290 295 300
Lys Asn Val Pro Leu Met Phe Ala Leu Val Leu Ile Ala Gly Phe Ala
305 310 315 320
Trp Gly Ile Ile Asn Pro Ala Leu Thr Ala Arg Phe Val Asp Tyr Ser
325 330 335
Pro Ala His Ser Met Asn Leu Thr Thr Ser Ile Val Ile Ile Gly Ile
340 345 350
Asn Ile Gly Cys Leu Ile Ser Pro Tyr Phe Phe Ala Leu Thr Ala Ser
355 360 365
Ile Phe Gly Asn Ser Ser Ala Gly Phe Ala Ile Ile Val Gly Gly Ala
370 375 380
Leu Tyr Leu Val Met Val Val Ile Glu Leu Ile Thr Leu Lys Val Asp
385 390 395 400
Lys Lys Leu Thr Val
405
<210> 13
<211> 407
<212> PRT
<213> 长双歧杆菌婴儿亚种(菌株ATCC 15697)
<400> 13
Met Ser Lys Ile Ile Asn Tyr Ser Glu Val Leu Glu Ser Lys Arg Leu
1 5 10 15
Met Val Gly Val Leu Ser Val Ser Phe Leu Leu Ser Ala Gly Asn Ala
20 25 30
Ile Ser Gly Thr Ile Pro Ala Met Glu Glu Ala Phe Ser Asn Ile Ser
35 40 45
Lys Ala Asn Ile Glu Thr Leu Thr Thr Ile Pro Thr Ala Gly Ile Met
50 55 60
Leu Gly Thr Val Leu Ser Gly Val Phe Ser Asn Tyr Leu Gly Lys Lys
65 70 75 80
Lys Ser Val Leu Ala Gly Leu Ile Ile Ala Leu Val Gly Gly Val Ile
85 90 95
Pro Ala Phe Leu Pro Gln Tyr Trp Pro Ile Phe Ile Ser Arg Phe Leu
100 105 110
Phe Gly Val Gly Met Gly Ile Phe Asn Pro Leu Ser Val Ser Tyr Ile
115 120 125
Thr Asp Leu Tyr Val Gly Asp Arg Gln Arg Ser Leu Leu Gly Tyr Arg
130 135 140
Asn Ala Val Ser Asn Leu Gly Asp Thr Ile Met Leu Phe Val Ala Gly
145 150 155 160
Ile Leu Ile Thr Phe Gly Trp Asn Ile Thr Tyr Leu Val Phe Phe Ala
165 170 175
Leu Leu Ile Pro Ile Val Leu Ile Ile Leu Phe Val Pro Lys Glu Phe
180 185 190
Asp Asn Phe Asp Ile Arg Asn Ser Ala Leu Asp Glu Asn Gly Gln Ile
195 200 205
Ser Asp Ser Val Ser Asp Val Lys Pro Ser Thr Asn Leu Lys Val Ile
210 215 220
Glu Val Gly Val Val Phe Met Val Ile Thr Met Leu Tyr Asn Ala Ile
225 230 235 240
Pro Leu Lys Phe Ala Ser Tyr Ile Val Thr Glu His Ile Gly Thr Ala
245 250 255
Ser Thr Ala Thr Trp Ile Phe Ser Phe Leu Val Leu Ala Gly Ile Phe
260 265 270
Ser Gly Val Leu Phe Glu Lys Ile Ser Lys Val Phe Lys Arg Leu Thr
275 280 285
Val Phe Val Phe Glu Ile Val Ile Gly Val Ala Tyr Ile Thr Ile Ala
290 295 300
Phe Thr Tyr Asn Ile Pro Leu Leu Thr Ala Leu Val Leu Ile Ser Gly
305 310 315 320
Phe Gly Trp Gly Ile Ile Asn Pro Ala Leu Thr Ala Arg Leu Val Asp
325 330 335
Val Ser Pro Ile Asn Ser Met Asn Leu Ser Thr Ser Ile Ile Val Ile
340 345 350
Phe Ile Ser Val Gly Ser Leu Ile Ser Pro Tyr Phe Phe Ala Met Phe
355 360 365
Ala Gly Leu Phe Gly Asn Asp Ser Ala Ala Phe Ala Ile Val Val Gly
370 375 380
Gly Ala Leu Tyr Val Val Met Ala Val Leu Asp Phe Ile Lys Ile Lys
385 390 395 400
Lys Asn Lys Glu Leu Ser Ile
405
<210> 14
<211> 471
<212> PRT
<213> 肺炎克雷伯氏菌(Klebsiella pneumoniae)
<400> 14
Met Thr Glu Leu Pro Asp Ser Thr Arg Trp Gln Leu Trp Ile Val Ala
1 5 10 15
Phe Gly Phe Phe Met Gln Ser Leu Asp Thr Thr Ile Val Asn Thr Ala
20 25 30
Leu Pro Ser Met Ala Leu Ser Leu Gly Glu Ser Pro Leu His Met His
35 40 45
Met Val Val Val Ser Tyr Val Leu Thr Val Ala Val Met Leu Pro Ala
50 55 60
Ser Gly Trp Leu Ala Asp Lys Val Gly Val Arg Asn Ile Phe Phe Thr
65 70 75 80
Ala Ile Val Leu Phe Thr Leu Gly Ser Leu Phe Cys Ala Trp Ser Ser
85 90 95
Thr Leu Asn Glu Leu Val Leu Ala Arg Val Leu Gln Gly Val Gly Gly
100 105 110
Ala Met Met Val Pro Val Gly Arg Leu Thr Val Met Lys Ile Val Pro
115 120 125
Arg Glu Gln Tyr Met Ala Ala Met Thr Phe Val Thr Leu Pro Gly Gln
130 135 140
Val Gly Pro Leu Leu Gly Pro Ala Leu Gly Gly Ile Leu Val Glu Tyr
145 150 155 160
Ala Ser Trp His Trp Ile Phe Leu Ile Asn Ile Pro Val Gly Ile Val
165 170 175
Gly Ala Ile Ala Thr Leu Met Leu Met Pro Asn Tyr Thr Met Gln Thr
180 185 190
Arg Arg Phe Asp Leu Ser Gly Phe Leu Leu Leu Ala Val Gly Met Ala
195 200 205
Val Leu Thr Leu Ala Leu Asp Gly Ser Lys Gly Thr Gly Leu Ser Pro
210 215 220
Leu Ser Leu Gly Ala Leu Val Leu Cys Gly Ile Leu Ala Ile Ala Leu
225 230 235 240
Tyr Leu Lys His Ala Lys Asn Asn Pro Arg Ala Leu Phe Ser Leu Ala
245 250 255
Leu Phe Arg Thr His Thr Phe Ser Leu Gly Leu Ser Gly Ser Phe Ala
260 265 270
Gly Arg Val Gly Ser Gly Met Leu Pro Phe Met Thr Pro Val Phe Leu
275 280 285
Gln Ile Gly Leu Gly Phe Ser Pro Phe His Ala Gly Leu Met Met Ile
290 295 300
Pro Met Val Leu Gly Ser Met Gly Met Lys Arg Ile Val Val Gln Val
305 310 315 320
Val Asn Arg Phe Gly Tyr Arg Arg Val Leu Val Ser Thr Thr Leu Gly
325 330 335
Leu Ser Leu Val Ser Leu Leu Phe Met Ser Val Ala Met Leu Gly Trp
340 345 350
Tyr Tyr Ala Leu Pro Phe Val Leu Phe Leu Gln Gly Met Val Asn Ser
355 360 365
Thr Arg Phe Ser Ser Met Asn Thr Leu Thr Leu Lys Asp Leu Pro Asp
370 375 380
Glu Leu Ala Ser Ser Gly Asn Ser Leu Leu Ser Met Ile Met Gln Leu
385 390 395 400
Ser Met Ser Ile Gly Val Thr Ile Ala Gly Leu Leu Leu Gly Met Phe
405 410 415
Gly Gln Gln His Ile Ala Ala Asp Ser Gly Ala Ser His Thr Val Phe
420 425 430
Met Tyr Thr Trp Leu Cys Met Ala Leu Ile Ile Ala Leu Pro Ala Leu
435 440 445
Ile Phe Ala Arg Val Pro Asn Asp Thr His Lys Asn Ala Val Ile Ser
450 455 460
Arg Arg Lys Arg Ser Thr Gln
465 470
<210> 15
<211> 375
<212> PRT
<213> 长双歧杆菌婴儿亚种 (菌株ATCC 15697)
<400> 15
Met Ala Glu Val Val Phe Asp His Val Thr Arg Ile Tyr Pro Gly Asn
1 5 10 15
Asp Lys Pro Ser Val Asp Asp Leu Asn Leu Asp Ile Lys Asp Gly Glu
20 25 30
Phe Leu Val Leu Val Gly Pro Ser Gly Cys Gly Lys Ser Thr Thr Leu
35 40 45
Arg Met Leu Ala Gly Leu Glu Glu Val Asn Lys Gly Arg Ile Leu Ile
50 55 60
Gly Gly Lys Asp Val Thr Thr Met Gln Pro Lys Asp Arg Asp Ile Ala
65 70 75 80
Met Val Phe Gln Asn Tyr Ala Leu Tyr Pro His Met Thr Val Ala Asp
85 90 95
Asn Met Gly Phe Ala Leu Lys Ile Ala Gly Thr Pro Lys Asp Glu Ile
100 105 110
Arg Lys Arg Val Glu Lys Ala Ala Glu Ile Leu Asp Leu Thr Glu Tyr
115 120 125
Leu Asp Arg Lys Pro Lys Ala Leu Ser Gly Gly Gln Arg Gln Arg Val
130 135 140
Ala Met Gly Arg Ala Ile Val Arg Glu Pro Lys Val Phe Leu Met Asp
145 150 155 160
Glu Pro Leu Ser Asn Leu Asp Ala Lys Leu Arg Val Gln Thr Arg Thr
165 170 175
Gln Ile Ala Ala Leu Gln Arg Gln Leu Gly Val Thr Thr Leu Tyr Val
180 185 190
Thr His Asp Gln Thr Glu Ala Leu Thr Met Gly Asp Arg Ile Ala Val
195 200 205
Ile Lys Leu Gly Ile Leu Gln Gln Val Gly Ala Pro Thr Glu Leu Tyr
210 215 220
Asp Arg Pro Ala Asn Val Phe Val Ala Gly Phe Ile Gly Ser Pro Ser
225 230 235 240
Met Asn Leu Asn Thr His Pro Val Val Asn Gly Lys Ala Lys Ile Gly
245 250 255
Glu Asp Thr Val Asp Leu Pro Ala Glu Ala Val Asn Lys Leu Thr Ala
260 265 270
Glu Asp Asn Gly Gln Ile Val Val Gly Phe Arg Pro Glu Asp Ala Gly
275 280 285
Leu Ala Pro Val Asp Asp Pro Asn Ala Phe Ser Leu Lys Val Val Asn
290 295 300
Val Glu Asp Leu Gly Ser Asp Gly Tyr Ile Tyr Gly Thr Ile Val Thr
305 310 315 320
Asp Gly Ser Ala Ala Glu Ala Ser Gln Val Met Ser Asp Gln Asn Lys
325 330 335
Leu Thr Thr Ile Arg Val Asn Pro Arg Ala Leu Pro Lys Val Gly Ala
340 345 350
Thr Val Lys Ile Lys Ile Asp Pro Ala Lys Met His Leu Phe Ala Pro
355 360 365
Ser Thr Glu Leu Arg Leu Asn
370 375
<210> 16
<211> 306
<212> PRT
<213> 大豆慢生根瘤菌(Bradyrhizobium japonicum)USDA 110
<400> 16
Met Asn Met Ser Asn Met Ala Ile Asp Leu Val Gly Val Arg Lys Ser
1 5 10 15
Phe Gly Asp Lys Val Ile Val Asn Asp Leu Ser Phe Ser Val Ala Arg
20 25 30
Gly Glu Cys Phe Gly Leu Leu Gly Pro Asn Gly Ala Gly Lys Ser Thr
35 40 45
Ile Ala Arg Met Leu Leu Gly Met Ile Ser Pro Asp Arg Gly Lys Ile
50 55 60
Thr Val Leu Asp Glu Pro Val Pro Ser Arg Ala Arg Ala Ala Arg Val
65 70 75 80
Arg Val Gly Val Val Pro Gln Phe Asp Asn Leu Glu Pro Glu Phe Thr
85 90 95
Val Arg Glu Asn Leu Leu Val Phe Gly Arg Tyr Phe Gly Met Ser Ala
100 105 110
Arg Thr Ile Glu Ala Val Val Pro Ser Leu Leu Glu Phe Ala Arg Leu
115 120 125
Glu Ser Lys Ala Asp Val Arg Val Ser Leu Leu Ser Gly Gly Met Lys
130 135 140
Arg Arg Leu Thr Leu Ala Arg Ala Leu Ile Asn Asp Pro His Leu Leu
145 150 155 160
Val Met Asp Glu Pro Thr Thr Gly Leu Asp Pro His Ala Arg His Leu
165 170 175
Ile Trp Glu Arg Leu Arg Ala Leu Leu Ala Arg Gly Lys Thr Ile Leu
180 185 190
Leu Thr Thr His Phe Met Glu Glu Ala Glu Arg Leu Cys Asp Arg Leu
195 200 205
Cys Val Leu Glu Ser Gly Cys Lys Ile Ala Glu Gly Lys Pro Asp Ala
210 215 220
Leu Ile Asp Glu His Ile Gly Cys Asn Val Ile Glu Ile Tyr Gly Gly
225 230 235 240
Asp Leu Asp Gln Leu Arg Glu Leu Ile Arg Pro Tyr Ala Arg His Ile
245 250 255
Glu Val Ser Gly Glu Thr Leu Phe Cys Tyr Ala Arg Cys Pro Asp Glu
260 265 270
Ile Ser Val His Leu Arg Gly Arg Thr Asp Leu Arg Val Leu Gln Arg
275 280 285
Pro Pro Asn Leu Glu Asp Val Phe Leu Arg Leu Thr Gly Arg Glu Met
290 295 300
Glu Lys
305
<210> 17
<211> 330
<212> PRT
<213> 大肠杆菌K12 MG1655
<400> 17
Met Lys Ile Lys Asn Ile Leu Leu Thr Leu Cys Thr Ser Leu Leu Leu
1 5 10 15
Thr Asn Val Ala Ala His Ala Lys Glu Val Lys Ile Gly Met Ala Ile
20 25 30
Asp Asp Leu Arg Leu Glu Arg Trp Gln Lys Asp Arg Asp Ile Phe Val
35 40 45
Lys Lys Ala Glu Ser Leu Gly Ala Lys Val Phe Val Gln Ser Ala Asn
50 55 60
Gly Asn Glu Glu Thr Gln Met Ser Gln Ile Glu Asn Met Ile Asn Arg
65 70 75 80
Gly Val Asp Val Leu Val Ile Ile Pro Tyr Asn Gly Gln Val Leu Ser
85 90 95
Asn Val Val Lys Glu Ala Lys Gln Glu Gly Ile Lys Val Leu Ala Tyr
100 105 110
Asp Arg Met Ile Asn Asp Ala Asp Ile Asp Phe Tyr Ile Ser Phe Asp
115 120 125
Asn Glu Lys Val Gly Glu Leu Gln Ala Lys Ala Leu Val Asp Ile Val
130 135 140
Pro Gln Gly Asn Tyr Phe Leu Met Gly Gly Ser Pro Val Asp Asn Asn
145 150 155 160
Ala Lys Leu Phe Arg Ala Gly Gln Met Lys Val Leu Lys Pro Tyr Val
165 170 175
Asp Ser Gly Lys Ile Lys Val Val Gly Asp Gln Trp Val Asp Gly Trp
180 185 190
Leu Pro Glu Asn Ala Leu Lys Ile Met Glu Asn Ala Leu Thr Ala Asn
195 200 205
Asn Asn Lys Ile Asp Ala Val Val Ala Ser Asn Asp Ala Thr Ala Gly
210 215 220
Gly Ala Ile Gln Ala Leu Ser Ala Gln Gly Leu Ser Gly Lys Val Ala
225 230 235 240
Ile Ser Gly Gln Asp Ala Asp Leu Ala Gly Ile Lys Arg Ile Ala Ala
245 250 255
Gly Thr Gln Thr Met Thr Val Tyr Lys Pro Ile Thr Leu Leu Ala Asn
260 265 270
Thr Ala Ala Glu Ile Ala Val Glu Leu Gly Asn Gly Gln Glu Pro Lys
275 280 285
Ala Asp Thr Thr Leu Asn Asn Gly Leu Lys Asp Val Pro Ser Arg Leu
290 295 300
Leu Thr Pro Ile Asp Val Asn Lys Asn Asn Ile Lys Asp Thr Val Ile
305 310 315 320
Lys Asp Gly Phe His Lys Glu Ser Glu Leu
325 330
<210> 18
<211> 309
<212> PRT
<213> 长双歧杆菌婴儿亚种(Bifidobacterium longum infantis) Bi-26
<400> 18
Met Ser His Ala Thr Ala Thr Lys Thr Ala Ala Lys Lys Pro Ala Lys
1 5 10 15
Lys Lys Val Ser Ala Phe Ser Thr Arg Lys Val Asp Pro Ala Tyr Tyr
20 25 30
Trp Met Val Val Pro Ala Ala Ile Ile Phe Ala Phe Phe Leu Tyr Leu
35 40 45
Pro Phe Leu Asp Gly Val Lys Tyr Ser Phe Thr Asn Ser Gln Gly Tyr
50 55 60
Gly Asp Tyr Lys Phe Ile Gly Leu Lys Asn Tyr Ile Ala Leu Phe Gln
65 70 75 80
Asp Asn Arg Val Gly His Ala Tyr Leu Phe Thr Phe Leu Ile Ala Ile
85 90 95
Leu Ile Thr Val Leu Ile Asn Val Ile Ala Leu Phe Leu Ser Val Leu
100 105 110
Leu Asn Ser Lys Ile Ala Phe Lys Asn Gly Phe Arg Ala Val Phe Phe
115 120 125
Ile Pro Tyr Thr Leu Ser Val Leu Val Ile Gly Tyr Val Phe Lys Tyr
130 135 140
Ile Phe Met Asn Pro Leu Pro Glu Leu Gly Lys Ala Leu Gly Ile Lys
145 150 155 160
Trp Leu Ser Thr Ser Leu Leu Thr Asn Glu Gln Leu Ser Trp Ile Pro
165 170 175
Ile Val Phe Leu Ala Val Trp Gln Gly Ile Ala Tyr Ser Val Leu Ile
180 185 190
Tyr Leu Ala Gly Leu Gln Thr Ile Asp Asp Glu Ile Tyr Glu Ala Ala
195 200 205
Ala Ile Asp Gly Val Asn Ala Trp Gln Lys Phe Trp Lys Ile Thr Phe
210 215 220
Pro Leu Ile Gly Pro Phe Phe Thr Ile Asn Leu Val Leu Ser Met Lys
225 230 235 240
Asn Ala Leu Gly Thr Phe Asp Gln Val Val Ala Leu Thr Glu Gly Gly
245 250 255
Pro Asn Ser Ser Thr Glu Thr Val Thr Tyr Leu Ile Trp Lys Gly Gly
260 265 270
Leu Thr Gly Gly Glu Tyr Ala Tyr Gln Thr Ala Asn Ala Val Leu Phe
275 280 285
Phe Ile Val Leu Ala Ile Ile Ala Phe Val Gln Leu Arg Ile Ser Arg
290 295 300
Ser Gln Glu Gln Ile
305
<210> 19
<211> 288
<212> PRT
<213> 长双歧杆菌婴儿亚种(Bifidobacterium longum infantis)Bi-26
<400> 19
Met Thr Thr Ala Thr Val Thr Pro Ser Lys Ser Gly Lys Pro Ala Lys
1 5 10 15
Phe Arg Arg Asp His Lys Ile Asn Trp Trp Leu Thr Ala Ala Val Ala
20 25 30
Val Leu Ser Leu Thr Ile Leu Ile Pro Leu Tyr Phe Thr Ile Val Thr
35 40 45
Ala Leu Lys Thr Pro Ala Glu Ala Gly Thr Phe Ala Leu Pro Thr Ser
50 55 60
Trp Gln Trp His Asn Phe Ala Asp Ala Ser Ala Lys Val Asn Tyr Pro
65 70 75 80
Lys Ala Ala Leu Asn Ser Ala Ile Ile Thr Val Ala Ala Val Val Leu
85 90 95
Thr Leu Leu Thr Asn Thr Phe Val Ala Tyr Ala Val Ala Arg Asn Met
100 105 110
Asp Lys Arg Phe Phe Arg Phe Leu Tyr Tyr Phe Phe Ile Ala Ala Met
115 120 125
Phe Val Pro Phe Pro Val Val Met Leu Pro Ile Ala Lys Gln Met Gly
130 135 140
Ser Leu His Leu Asp Asn Gln Val Gly Leu Ile Ile Leu Tyr Thr Val
145 150 155 160
Leu Gly Leu Gly Thr Asn Leu Phe Ile Ala Thr Gly Phe Ile Arg Ser
165 170 175
Ile Pro Val Ser Leu Glu Glu Ala Ala Arg Ile Asp Gly Ala Ser Thr
180 185 190
Trp Arg Ile Phe Trp Thr Ile Ile Phe Pro Leu Met Ser Pro Ile Asn
195 200 205
Ala Thr Ile Ala Ile Leu Thr Ala Leu Trp Ala Trp Asn Asp Phe Leu
210 215 220
Leu Pro Leu Ile Ile Leu Thr Asp Gln Ser Asn Gln Thr Ile Pro Leu
225 230 235 240
Ala Gln Tyr Val Phe Ser Ser Gln Phe Ala Thr Asn Tyr Pro Met Ala
245 250 255
Phe Ser Ser Tyr Leu Met Ala Met Ala Pro Ile Leu Ile Val Tyr Ile
260 265 270
Phe Ala Gln Lys Trp Val Val Gly Gly Val Met Arg Gly Ala Val Lys
275 280 285
<210> 20
<211> 303
<212> PRT
<213> 长双歧杆菌婴儿亚种(Bifidobacterium longum infantis)Bi-26
<400> 20
Met Thr Asn Ala Thr Ala Gln Pro Asp Thr Ser Val Met Arg Lys Pro
1 5 10 15
Lys Arg Gln Tyr Ile Gly Ile Leu Tyr Cys Leu Pro Tyr Val Val Val
20 25 30
Phe Leu Phe Gly Met Ile Val Pro Met Phe Tyr Ala Leu Tyr Leu Ser
35 40 45
Phe Phe Lys Gln Ser Leu Leu Gly Gly Thr Thr Phe Ala Gly Phe Asp
50 55 60
Asn Phe Ile Arg Ala Phe Lys Asp Glu Ala Leu Trp Gly Gly Phe Lys
65 70 75 80
Asn Val Leu Ile Tyr Ala Ala Ile Gln Ile Pro Met Asn Leu Ile Leu
85 90 95
Ser Leu Val Ala Ala Leu Val Leu Asp Ser Gln Arg Ile Arg His Ile
100 105 110
Ala Val Pro Arg Ile Leu Leu Phe Leu Pro Tyr Ala Val Pro Gly Val
115 120 125
Ile Ala Ala Leu Met Trp Gly Tyr Ile Tyr Gly Asp Lys Tyr Gly Leu
130 135 140
Phe Gly Gln Ile Ala Gly Met Phe Gly Val Ala Ala Pro Asn Met Leu
145 150 155 160
Ser Lys Gln Leu Met Leu Phe Ala Ile Ala Asn Ile Cys Thr Trp Cys
165 170 175
Phe Leu Gly Tyr Asn Met Leu Ile Tyr Tyr Ser Ala Leu Ile Gly Ile
180 185 190
Pro Asn Asp Leu Tyr Glu Ser Ala Arg Ile Asp Gly Ala Ser Glu Leu
195 200 205
Arg Ile Ala Trp Ser Val Lys Ile Pro Gln Ile Lys Ser Thr Ile Val
210 215 220
Met Thr Val Leu Phe Ser Val Ile Gly Thr Leu Gln Leu Phe Asn Glu
225 230 235 240
Pro Asn Ile Leu Arg Thr Ser Ala Pro Asp Val Ile Asn Ser Ser Tyr
245 250 255
Thr Pro Asn Ile Tyr Thr Tyr Asn Leu Ala Phe Asn Gly Gln Asn Val
260 265 270
Asn Tyr Ala Ala Ala Val Ser Leu Val Ile Gly Ile Ile Val Met Ala
275 280 285
Leu Val Ala Val Val Lys Ile Ile Gly Asn Lys Trp Glu Asn Lys
290 295 300
<210> 21
<211> 379
<212> PRT
<213> 大肠杆菌K12 MG1655
<400> 21
Met Met Lys Ser Lys Met Lys Leu Met Pro Leu Leu Val Ser Val Thr
1 5 10 15
Leu Ile Ser Gly Cys Thr Val Leu Pro Gly Ser Asn Met Ser Thr Met
20 25 30
Gly Lys Asp Val Ile Lys Gln Gln Asp Ala Asp Phe Asp Leu Asp Lys
35 40 45
Met Val Asn Val Tyr Pro Leu Thr Pro Arg Leu Ile Asp Gln Leu Arg
50 55 60
Pro Arg Pro Asn Val Ala Arg Pro Asn Met Thr Leu Glu Ser Glu Ile
65 70 75 80
Ala Asn Tyr Gln Tyr Arg Val Gly Pro Gly Asp Val Leu Asn Val Thr
85 90 95
Val Trp Asp His Pro Glu Leu Thr Thr Pro Ala Gly Gln Tyr Arg Ser
100 105 110
Ser Ser Asp Thr Gly Asn Trp Val Gln Pro Asp Gly Thr Met Phe Tyr
115 120 125
Pro Tyr Ile Gly Lys Val His Val Val Gly Lys Thr Leu Ala Glu Ile
130 135 140
Arg Ser Asp Ile Thr Gly Arg Leu Ala Thr Tyr Ile Ala Asp Pro Gln
145 150 155 160
Val Asp Val Asn Ile Ala Ala Phe Arg Ser Gln Lys Ala Tyr Ile Ser
165 170 175
Gly Gln Val Asn Lys Ser Gly Gln Gln Ala Ile Thr Asn Val Pro Leu
180 185 190
Thr Ile Leu Asp Ala Ile Asn Ala Ala Gly Gly Leu Thr Asp Thr Ala
195 200 205
Asp Trp Arg Asn Val Val Leu Thr His Asn Gly Arg Glu Glu Arg Ile
210 215 220
Ser Leu Gln Ala Leu Met Gln Asn Gly Asp Leu Asn Gln Asn Arg Leu
225 230 235 240
Leu Tyr Pro Gly Asp Ile Leu Tyr Val Pro Arg Asn Asp Asp Leu Lys
245 250 255
Val Phe Val Met Gly Glu Val Lys Lys Gln Ser Thr Leu Lys Met Asp
260 265 270
Phe Ser Gly Met Thr Leu Thr Glu Ala Leu Gly Asn Ala Glu Gly Ile
275 280 285
Asp Met Thr Thr Ser Asn Ala Ser Gly Ile Phe Val Ile Arg Pro Leu
290 295 300
Lys Gly Glu Gly Gly Arg Asn Gly Lys Ile Ala Asn Ile Tyr Gln Leu
305 310 315 320
Asp Met Ser Asp Ala Thr Ser Leu Val Met Ala Thr Glu Phe Arg Leu
325 330 335
Gln Pro Tyr Asp Val Val Tyr Val Thr Thr Ala Pro Val Ser Arg Trp
340 345 350
Asn Arg Leu Ile Asn Gln Leu Leu Pro Thr Ile Ser Gly Val Arg Tyr
355 360 365
Met Thr Asp Thr Ala Ser Asp Ile His Asn Trp
370 375
<210> 22
<211> 348
<212> PRT
<213> 脑膜炎双球菌
<400> 22
Met Pro Ser Glu Ala Phe Arg Arg His Arg Ala Tyr Arg Glu Asn Lys
1 5 10 15
Leu Gln Pro Leu Val Ser Val Leu Ile Cys Ala Tyr Asn Val Glu Lys
20 25 30
Tyr Phe Ala Gln Ser Leu Ala Ala Val Val Asn Gln Thr Trp Cys Asn
35 40 45
Leu Asp Ile Leu Ile Val Asp Asp Gly Ser Thr Asp Gly Thr Leu Ala
50 55 60
Ile Ala Gln Arg Phe Gln Glu Gln Asp Gly Arg Ile Lys Ile Leu Ala
65 70 75 80
Gln Ala Gln Asn Ser Gly Leu Ile Pro Ser Leu Asn Ile Gly Leu Asp
85 90 95
Glu Leu Ala Lys Ser Gly Met Gly Glu Tyr Ile Ala Arg Thr Asp Ala
100 105 110
Asp Asp Ile Ala Ala Pro Asp Trp Ile Glu Lys Ile Val Gly Glu Met
115 120 125
Glu Lys Asp Arg Ser Ile Ile Ala Met Gly Ala Trp Leu Glu Val Leu
130 135 140
Ser Glu Glu Lys Asp Gly Asn Arg Leu Ala Arg His His Glu His Gly
145 150 155 160
Lys Ile Trp Lys Lys Pro Thr Arg His Glu Asp Ile Ala Asp Phe Phe
165 170 175
Pro Phe Gly Asn Pro Ile His Asn Asn Thr Met Ile Met Arg Arg Ser
180 185 190
Val Ile Asp Gly Gly Leu Arg Tyr Asn Thr Glu Arg Asp Trp Ala Glu
195 200 205
Asp Tyr Gln Phe Trp Tyr Asp Val Ser Lys Leu Gly Arg Leu Ala Tyr
210 215 220
Tyr Pro Glu Ala Leu Val Lys Tyr Arg Leu His Ala Asn Gln Val Ser
225 230 235 240
Ser Lys Tyr Ser Ile Arg Gln His Glu Ile Ala Gln Gly Ile Gln Lys
245 250 255
Thr Ala Arg Asn Asp Phe Leu Gln Ser Met Gly Phe Lys Thr Arg Phe
260 265 270
Asp Ser Leu Glu Tyr Arg Gln Ile Lys Ala Val Ala Tyr Glu Leu Leu
275 280 285
Glu Lys His Leu Pro Glu Glu Asp Phe Glu Arg Ala Arg Arg Phe Leu
290 295 300
Tyr Gln Cys Phe Lys Arg Thr Asp Thr Leu Pro Ala Gly Val Trp Leu
305 310 315 320
Asp Phe Ala Ala Asn Gly Arg Met Arg Arg Leu Phe Thr Leu Arg Gln
325 330 335
Tyr Phe Gly Ile Leu His Arg Leu Leu Lys Asn Arg
340 345
<210> 23
<211> 265
<212> PRT
<213> 大肠杆菌O55:H7
<400> 23
Met Ile Ile Asp Glu Ala Glu Ser Ala Glu Ser Thr His Pro Val Val
1 5 10 15
Ser Val Ile Leu Pro Val Asn Lys Lys Asn Pro Phe Leu Asp Glu Ala
20 25 30
Ile Asn Ser Ile Leu Ser Gln Thr Phe Ser Ser Phe Glu Ile Ile Ile
35 40 45
Val Ala Asn Cys Cys Thr Asp Asp Phe Tyr Asn Glu Leu Lys His Lys
50 55 60
Val Asn Asp Lys Ile Lys Leu Ile Arg Thr Asn Ile Ala Tyr Leu Pro
65 70 75 80
Tyr Ser Leu Asn Lys Ala Ile Asp Leu Ser Asn Gly Glu Phe Ile Ala
85 90 95
Arg Met Asp Ser Asp Asp Ile Ser His Pro Asp Arg Phe Thr Lys Gln
100 105 110
Val Asp Phe Leu Lys Asn Asn Pro Tyr Val Asp Val Val Gly Thr Asn
115 120 125
Ala Ile Phe Ile Asp Asp Lys Gly Arg Glu Ile Asn Lys Thr Lys Leu
130 135 140
Pro Glu Glu Asn Leu Asp Ile Val Lys Asn Leu Pro Tyr Lys Cys Cys
145 150 155 160
Ile Val His Pro Ser Val Met Phe Arg Lys Lys Val Ile Ala Ser Ile
165 170 175
Gly Gly Tyr Met Phe Ser Asn Tyr Ser Glu Asp Tyr Glu Leu Trp Asn
180 185 190
Arg Leu Ser Leu Ala Lys Ile Lys Phe Gln Asn Leu Pro Glu Tyr Leu
195 200 205
Phe Tyr Tyr Arg Leu His Glu Gly Gln Ser Thr Ala Lys Lys Asn Leu
210 215 220
Tyr Met Val Met Val Asn Asp Leu Val Ile Lys Met Lys Cys Phe Phe
225 230 235 240
Leu Thr Gly Asn Ile Asn Tyr Leu Phe Gly Gly Ile Arg Thr Ile Ala
245 250 255
Ser Phe Ile Tyr Cys Lys Tyr Ile Lys
260 265
<210> 24
<211> 275
<212> PRT
<213> 脑膜炎双球菌 MC58
<400> 24
Met Gln Asn His Val Ile Ser Leu Ala Ser Ala Ala Glu Arg Arg Ala
1 5 10 15
His Ile Ala Asp Thr Phe Gly Arg His Gly Ile Pro Phe Gln Phe Phe
20 25 30
Asp Ala Leu Met Pro Ser Glu Arg Leu Glu Gln Ala Met Ala Glu Leu
35 40 45
Val Pro Gly Leu Ser Ala His Pro Tyr Leu Ser Gly Val Glu Lys Ala
50 55 60
Cys Phe Met Ser His Ala Val Leu Trp Lys Gln Ala Leu Asp Glu Gly
65 70 75 80
Leu Pro Tyr Ile Thr Val Phe Glu Asp Asp Val Leu Leu Gly Glu Gly
85 90 95
Ala Glu Lys Phe Leu Ala Glu Asp Ala Trp Leu Gln Glu Arg Phe Asp
100 105 110
Pro Asp Thr Ala Phe Ile Val Arg Leu Glu Thr Met Phe Met His Val
115 120 125
Leu Thr Ser Pro Ser Gly Val Ala Asp Tyr Cys Gly Arg Ala Phe Pro
130 135 140
Leu Leu Glu Ser Glu His Trp Gly Thr Ala Gly Tyr Ile Ile Ser Arg
145 150 155 160
Lys Ala Met Arg Phe Phe Leu Asp Arg Phe Ala Ala Leu Pro Pro Glu
165 170 175
Gly Leu His Pro Val Asp Leu Met Met Phe Ser Asp Phe Phe Asp Arg
180 185 190
Glu Gly Met Pro Val Cys Gln Leu Asn Pro Ala Leu Cys Ala Gln Glu
195 200 205
Leu His Tyr Ala Lys Phe His Asp Gln Asn Ser Ala Leu Gly Ser Leu
210 215 220
Ile Glu His Asp Arg Leu Leu Asn Arg Lys Gln Gln Arg Arg Asp Ser
225 230 235 240
Pro Ala Asn Thr Phe Lys His Arg Leu Ile Arg Ala Leu Thr Lys Ile
245 250 255
Ser Arg Glu Arg Glu Lys Arg Arg Gln Arg Arg Glu Gln Phe Ile Val
260 265 270
Pro Phe Gln
275
<210> 25
<211> 609
<212> PRT
<213> 大肠杆菌K12 MG1655
<400> 25
Met Cys Gly Ile Val Gly Ala Ile Ala Gln Arg Asp Val Ala Glu Ile
1 5 10 15
Leu Leu Glu Gly Leu Arg Arg Leu Glu Tyr Arg Gly Tyr Asp Ser Ala
20 25 30
Gly Leu Ala Val Val Asp Thr Glu Gly His Met Thr Arg Leu Arg Arg
35 40 45
Leu Gly Lys Val Gln Met Leu Ala Gln Ala Ala Glu Glu His Pro Leu
50 55 60
His Gly Gly Thr Gly Ile Ala His Thr Arg Trp Ala Thr His Gly Glu
65 70 75 80
Pro Ser Glu Val Asn Ala His Pro His Val Ser Glu His Ile Val Val
85 90 95
Val His Asn Gly Ile Ile Glu Asn His Glu Pro Leu Arg Glu Glu Leu
100 105 110
Lys Ala Arg Gly Tyr Thr Phe Val Ser Glu Thr Asp Thr Glu Val Ile
115 120 125
Ala His Leu Val Asn Trp Glu Leu Lys Gln Gly Gly Thr Leu Arg Glu
130 135 140
Ala Val Leu Arg Ala Ile Pro Gln Leu Arg Gly Ala Tyr Gly Thr Val
145 150 155 160
Ile Met Asp Ser Arg His Pro Asp Thr Leu Leu Ala Ala Arg Ser Gly
165 170 175
Ser Pro Leu Val Ile Gly Leu Gly Met Gly Glu Asn Phe Ile Ala Ser
180 185 190
Asp Gln Leu Ala Leu Leu Pro Val Thr Arg Arg Phe Ile Phe Leu Glu
195 200 205
Glu Gly Asp Ile Ala Glu Ile Thr Arg Arg Ser Val Asn Ile Phe Asp
210 215 220
Lys Thr Gly Ala Glu Val Lys Arg Gln Asp Ile Glu Ser Asn Leu Gln
225 230 235 240
Tyr Asp Ala Gly Asp Lys Gly Ile Tyr Cys His Tyr Met Gln Lys Glu
245 250 255
Ile Tyr Glu Gln Pro Asn Ala Ile Lys Asn Thr Leu Thr Gly Arg Ile
260 265 270
Ser His Gly Gln Val Asp Leu Ser Glu Leu Gly Pro Asn Ala Asp Glu
275 280 285
Leu Leu Ser Lys Val Glu His Ile Gln Ile Leu Ala Cys Gly Thr Ser
290 295 300
Tyr Asn Ser Gly Met Val Ser Arg Tyr Trp Phe Glu Ser Leu Ala Gly
305 310 315 320
Ile Pro Cys Asp Val Glu Ile Ala Ser Glu Phe Arg Tyr Arg Lys Ser
325 330 335
Ala Val Arg Arg Asn Ser Leu Met Ile Thr Leu Ser Gln Ser Gly Glu
340 345 350
Thr Ala Asp Thr Leu Ala Gly Leu Arg Leu Ser Lys Glu Leu Gly Tyr
355 360 365
Leu Gly Ser Leu Ala Ile Cys Asn Val Pro Gly Ser Ser Leu Val Arg
370 375 380
Glu Ser Asp Leu Ala Leu Met Thr Asn Ala Gly Thr Glu Ile Gly Val
385 390 395 400
Ala Ser Thr Lys Ala Phe Thr Thr Gln Leu Thr Val Leu Leu Met Leu
405 410 415
Val Ala Lys Leu Ser Arg Leu Lys Gly Leu Asp Ala Ser Ile Glu His
420 425 430
Asp Ile Val His Gly Leu Gln Ala Leu Pro Ser Arg Ile Glu Gln Met
435 440 445
Leu Ser Gln Asp Lys Arg Ile Glu Ala Leu Ala Glu Asp Phe Ser Asp
450 455 460
Lys His His Ala Leu Phe Leu Ser Arg Gly Asp Gln Tyr Pro Ile Ala
465 470 475 480
Leu Glu Gly Ala Leu Lys Leu Lys Glu Ile Ser Tyr Ile His Ala Glu
485 490 495
Ala Tyr Ala Ala Gly Glu Leu Lys His Gly Pro Leu Ala Leu Ile Asp
500 505 510
Ala Asp Met Pro Val Ile Val Val Ala Pro Asn Asn Glu Leu Leu Glu
515 520 525
Lys Leu Lys Ser Asn Ile Glu Glu Val Arg Ala Arg Gly Gly Gln Leu
530 535 540
Tyr Val Phe Ala Asp Gln Asp Ala Gly Phe Val Ser Ser Asp Asn Met
545 550 555 560
His Ile Ile Glu Met Pro His Val Glu Glu Val Ile Ala Pro Ile Phe
565 570 575
Tyr Thr Val Pro Leu Gln Leu Leu Ala Tyr His Val Ala Leu Ile Lys
580 585 590
Gly Thr Asp Val Asp Gln Pro Arg Asn Leu Ala Lys Ser Val Thr Val
595 600 605
Glu
<210> 26
<211> 338
<212> PRT
<213> 大肠杆菌K12 MG1655
<400> 26
Met Arg Val Leu Val Thr Gly Gly Ser Gly Tyr Ile Gly Ser His Thr
1 5 10 15
Cys Val Gln Leu Leu Gln Asn Gly His Asp Val Ile Ile Leu Asp Asn
20 25 30
Leu Cys Asn Ser Lys Arg Ser Val Leu Pro Val Ile Glu Arg Leu Gly
35 40 45
Gly Lys His Pro Thr Phe Val Glu Gly Asp Ile Arg Asn Glu Ala Leu
50 55 60
Met Thr Glu Ile Leu His Asp His Ala Ile Asp Thr Val Ile His Phe
65 70 75 80
Ala Gly Leu Lys Ala Val Gly Glu Ser Val Gln Lys Pro Leu Glu Tyr
85 90 95
Tyr Asp Asn Asn Val Asn Gly Thr Leu Arg Leu Ile Ser Ala Met Arg
100 105 110
Ala Ala Asn Val Lys Asn Phe Ile Phe Ser Ser Ser Ala Thr Val Tyr
115 120 125
Gly Asp Gln Pro Lys Ile Pro Tyr Val Glu Ser Phe Pro Thr Gly Thr
130 135 140
Pro Gln Ser Pro Tyr Gly Lys Ser Lys Leu Met Val Glu Gln Ile Leu
145 150 155 160
Thr Asp Leu Gln Lys Ala Gln Pro Asp Trp Ser Ile Ala Leu Leu Arg
165 170 175
Tyr Phe Asn Pro Val Gly Ala His Pro Ser Gly Asp Met Gly Glu Asp
180 185 190
Pro Gln Gly Ile Pro Asn Asn Leu Met Pro Tyr Ile Ala Gln Val Ala
195 200 205
Val Gly Arg Arg Asp Ser Leu Ala Ile Phe Gly Asn Asp Tyr Pro Thr
210 215 220
Glu Asp Gly Thr Gly Val Arg Asp Tyr Ile His Val Met Asp Leu Ala
225 230 235 240
Asp Gly His Val Val Ala Met Glu Lys Leu Ala Asn Lys Pro Gly Val
245 250 255
His Ile Tyr Asn Leu Gly Ala Gly Val Gly Asn Ser Val Leu Asp Val
260 265 270
Val Asn Ala Phe Ser Lys Ala Cys Gly Lys Pro Val Asn Tyr His Phe
275 280 285
Ala Pro Arg Arg Glu Gly Asp Leu Pro Ala Tyr Trp Ala Asp Ala Ser
290 295 300
Lys Ala Asp Arg Glu Leu Asn Trp Arg Val Thr Arg Thr Leu Asp Glu
305 310 315 320
Met Ala Gln Asp Thr Trp His Trp Gln Ser Arg His Pro Gln Gly Tyr
325 330 335
Pro Asp
<210> 27
<211> 445
<212> PRT
<213> 大肠杆菌K12 MG1655
<400> 27
Met Ser Asn Arg Lys Tyr Phe Gly Thr Asp Gly Ile Arg Gly Arg Val
1 5 10 15
Gly Asp Ala Pro Ile Thr Pro Asp Phe Val Leu Lys Leu Gly Trp Ala
20 25 30
Ala Gly Lys Val Leu Ala Arg His Gly Ser Arg Lys Ile Ile Ile Gly
35 40 45
Lys Asp Thr Arg Ile Ser Gly Tyr Met Leu Glu Ser Ala Leu Glu Ala
50 55 60
Gly Leu Ala Ala Ala Gly Leu Ser Ala Leu Phe Thr Gly Pro Met Pro
65 70 75 80
Thr Pro Ala Val Ala Tyr Leu Thr Arg Thr Phe Arg Ala Glu Ala Gly
85 90 95
Ile Val Ile Ser Ala Ser His Asn Pro Phe Tyr Asp Asn Gly Ile Lys
100 105 110
Phe Phe Ser Ile Asp Gly Thr Lys Leu Pro Asp Ala Val Glu Glu Ala
115 120 125
Ile Glu Ala Glu Met Glu Lys Glu Ile Ser Cys Val Asp Ser Ala Glu
130 135 140
Leu Gly Lys Ala Ser Arg Ile Val Asp Ala Ala Gly Arg Tyr Ile Glu
145 150 155 160
Phe Cys Lys Ala Thr Phe Pro Asn Glu Leu Ser Leu Ser Glu Leu Lys
165 170 175
Ile Val Val Asp Cys Ala Asn Gly Ala Thr Tyr His Ile Ala Pro Asn
180 185 190
Val Leu Arg Glu Leu Gly Ala Asn Val Ile Ala Ile Gly Cys Glu Pro
195 200 205
Asn Gly Val Asn Ile Asn Ala Glu Val Gly Ala Thr Asp Val Arg Ala
210 215 220
Leu Gln Ala Arg Val Leu Ala Glu Lys Ala Asp Leu Gly Ile Ala Phe
225 230 235 240
Asp Gly Asp Gly Asp Arg Val Ile Met Val Asp His Glu Gly Asn Lys
245 250 255
Val Asp Gly Asp Gln Ile Met Tyr Ile Ile Ala Arg Glu Gly Leu Arg
260 265 270
Gln Gly Gln Leu Arg Gly Gly Ala Val Gly Thr Leu Met Ser Asn Met
275 280 285
Gly Leu Glu Leu Ala Leu Lys Gln Leu Gly Ile Pro Phe Ala Arg Ala
290 295 300
Lys Val Gly Asp Arg Tyr Val Leu Glu Lys Met Gln Glu Lys Gly Trp
305 310 315 320
Arg Ile Gly Ala Glu Asn Ser Gly His Val Ile Leu Leu Asp Lys Thr
325 330 335
Thr Thr Gly Asp Gly Ile Val Ala Gly Leu Gln Val Leu Ala Ala Met
340 345 350
Ala Arg Asn His Met Ser Leu His Asp Leu Cys Ser Gly Met Lys Met
355 360 365
Phe Pro Gln Ile Leu Val Asn Val Arg Tyr Thr Ala Gly Ser Gly Asp
370 375 380
Pro Leu Glu His Glu Ser Val Lys Ala Val Thr Ala Glu Val Glu Ala
385 390 395 400
Ala Leu Gly Asn Arg Gly Arg Val Leu Leu Arg Lys Ser Gly Thr Glu
405 410 415
Pro Leu Ile Arg Val Met Val Glu Gly Glu Asp Glu Ala Gln Val Thr
420 425 430
Glu Phe Ala His Arg Ile Ala Asp Ala Val Lys Ala Val
435 440 445
<210> 28
<211> 456
<212> PRT
<213> 大肠杆菌K12 MG1655
<400> 28
Met Leu Asn Asn Ala Met Ser Val Val Ile Leu Ala Ala Gly Lys Gly
1 5 10 15
Thr Arg Met Tyr Ser Asp Leu Pro Lys Val Leu His Thr Leu Ala Gly
20 25 30
Lys Ala Met Val Gln His Val Ile Asp Ala Ala Asn Glu Leu Gly Ala
35 40 45
Ala His Val His Leu Val Tyr Gly His Gly Gly Asp Leu Leu Lys Gln
50 55 60
Ala Leu Lys Asp Asp Asn Leu Asn Trp Val Leu Gln Ala Glu Gln Leu
65 70 75 80
Gly Thr Gly His Ala Met Gln Gln Ala Ala Pro Phe Phe Ala Asp Asp
85 90 95
Glu Asp Ile Leu Met Leu Tyr Gly Asp Val Pro Leu Ile Ser Val Glu
100 105 110
Thr Leu Gln Arg Leu Arg Asp Ala Lys Pro Gln Gly Gly Ile Gly Leu
115 120 125
Leu Thr Val Lys Leu Asp Asp Pro Thr Gly Tyr Gly Arg Ile Thr Arg
130 135 140
Glu Asn Gly Lys Val Thr Gly Ile Val Glu His Lys Asp Ala Thr Asp
145 150 155 160
Glu Gln Arg Gln Ile Gln Glu Ile Asn Thr Gly Ile Leu Ile Ala Asn
165 170 175
Gly Ala Asp Met Lys Arg Trp Leu Ala Lys Leu Thr Asn Asn Asn Ala
180 185 190
Gln Gly Glu Tyr Tyr Ile Thr Asp Ile Ile Ala Leu Ala Tyr Gln Glu
195 200 205
Gly Arg Glu Ile Val Ala Val His Pro Gln Arg Leu Ser Glu Val Glu
210 215 220
Gly Val Asn Asn Arg Leu Gln Leu Ser Arg Leu Glu Arg Val Tyr Gln
225 230 235 240
Ser Glu Gln Ala Glu Lys Leu Leu Leu Ala Gly Val Met Leu Arg Asp
245 250 255
Pro Ala Arg Phe Asp Leu Arg Gly Thr Leu Thr His Gly Arg Asp Val
260 265 270
Glu Ile Asp Thr Asn Val Ile Ile Glu Gly Asn Val Thr Leu Gly His
275 280 285
Arg Val Lys Ile Gly Thr Gly Cys Val Ile Lys Asn Ser Val Ile Gly
290 295 300
Asp Asp Cys Glu Ile Ser Pro Tyr Thr Val Val Glu Asp Ala Asn Leu
305 310 315 320
Ala Ala Ala Cys Thr Ile Gly Pro Phe Ala Arg Leu Arg Pro Gly Ala
325 330 335
Glu Leu Leu Glu Gly Ala His Val Gly Asn Phe Val Glu Met Lys Lys
340 345 350
Ala Arg Leu Gly Lys Gly Ser Lys Ala Gly His Leu Thr Tyr Leu Gly
355 360 365
Asp Ala Glu Ile Gly Asp Asn Val Asn Ile Gly Ala Gly Thr Ile Thr
370 375 380
Cys Asn Tyr Asp Gly Ala Asn Lys Phe Lys Thr Ile Ile Gly Asp Asp
385 390 395 400
Val Phe Val Gly Ser Asp Thr Gln Leu Val Ala Pro Val Thr Val Gly
405 410 415
Lys Gly Ala Thr Ile Ala Ala Gly Thr Thr Val Thr Arg Asn Val Gly
420 425 430
Glu Asn Ala Leu Ala Ile Ser Arg Val Pro Gln Thr Gln Lys Glu Gly
435 440 445
Trp Arg Arg Pro Val Lys Lys Lys
450 455
<210> 29
<211> 299
<212> PRT
<213> 幽门螺杆菌(Helicobacter pylori) UA1234
<400> 29
Met Ala Phe Lys Val Val Gln Ile Cys Gly Gly Leu Gly Asn Gln Met
1 5 10 15
Phe Gln Tyr Ala Phe Ala Lys Ser Leu Gln Lys His Ser Asn Thr Pro
20 25 30
Val Leu Leu Asp Ile Thr Ser Phe Asp Trp Ser Asn Arg Lys Met Gln
35 40 45
Leu Glu Leu Phe Pro Ile Asp Leu Pro Tyr Ala Ser Glu Lys Glu Ile
50 55 60
Ala Ile Ala Lys Met Gln His Leu Pro Lys Leu Val Arg Asn Val Leu
65 70 75 80
Lys Cys Met Gly Phe Asp Arg Val Ser Gln Glu Ile Val Phe Glu Tyr
85 90 95
Glu Pro Lys Leu Leu Lys Thr Ser Arg Leu Thr Tyr Phe Tyr Gly Tyr
100 105 110
Phe Gln Asp Pro Arg Tyr Phe Asp Ala Ile Ser Pro Leu Ile Lys Gln
115 120 125
Thr Phe Thr Leu Pro Pro Pro Pro Glu Asn Gly Asn Asn Lys Lys Lys
130 135 140
Glu Glu Glu Tyr His Arg Lys Leu Ala Leu Ile Leu Ala Ala Lys Asn
145 150 155 160
Ser Val Phe Val His Ile Arg Arg Gly Asp Tyr Val Gly Ile Gly Cys
165 170 175
Gln Leu Gly Ile Asp Tyr Gln Lys Lys Ala Leu Glu Tyr Met Ala Lys
180 185 190
Arg Val Pro Asn Met Glu Leu Phe Val Phe Cys Glu Asp Leu Glu Phe
195 200 205
Thr Gln Asn Leu Asp Leu Gly Tyr Pro Phe Met Asp Met Thr Thr Arg
210 215 220
Asp Lys Glu Glu Glu Ala Tyr Trp Asp Met Leu Leu Met Gln Ser Cys
225 230 235 240
Lys His Gly Ile Ile Ala Asn Ser Thr Tyr Ser Trp Trp Ala Ala Tyr
245 250 255
Leu Ile Asn Asn Pro Glu Lys Ile Ile Ile Gly Pro Lys His Trp Leu
260 265 270
Phe Gly His Glu Asn Ile Leu Cys Lys Glu Trp Val Lys Ile Glu Ser
275 280 285
His Phe Glu Val Lys Ser Gln Lys Tyr Asn Ala
290 295
<210> 30
<211> 478
<212> PRT
<213> 幽门螺杆菌(Helicobacter pylori) UA1234
<400> 30
Met Phe Gln Pro Leu Leu Asp Ala Tyr Val Glu Ser Ala Ser Ile Glu
1 5 10 15
Lys Met Ala Ser Lys Ser Pro Pro Pro Leu Lys Ile Ala Val Ala Asn
20 25 30
Trp Trp Gly Asp Glu Glu Ile Lys Glu Phe Lys Asn Ser Val Leu Tyr
35 40 45
Phe Ile Leu Ser Gln Arg Tyr Thr Ile Thr Leu His Gln Asn Pro Asn
50 55 60
Glu Phe Ser Asp Leu Val Phe Gly Asn Pro Leu Gly Ser Ala Arg Lys
65 70 75 80
Ile Leu Ser Tyr Gln Asn Ala Lys Arg Val Phe Tyr Thr Gly Glu Asn
85 90 95
Glu Ser Pro Asn Phe Asn Leu Phe Asp Tyr Ala Ile Gly Phe Asp Glu
100 105 110
Leu Asp Phe Asn Asp Arg Tyr Leu Arg Met Pro Leu Tyr Tyr Asp Arg
115 120 125
Leu His His Lys Ala Glu Ser Val Asn Asp Thr Thr Ala Pro Tyr Lys
130 135 140
Leu Lys Asp Asn Ser Leu Tyr Ala Leu Lys Lys Pro Ser His Cys Phe
145 150 155 160
Lys Glu Lys His Pro Asn Leu Cys Ala Val Val Asn Asp Glu Ser Asp
165 170 175
Pro Leu Lys Arg Gly Phe Ala Ser Phe Val Ala Ser Asn Pro Asn Ala
180 185 190
Pro Ile Arg Asn Ala Phe Tyr Asp Ala Leu Asn Ser Ile Glu Pro Val
195 200 205
Thr Gly Gly Gly Ser Val Arg Asn Thr Leu Gly Tyr Asn Val Lys Asn
210 215 220
Lys Asn Glu Phe Leu Ser Gln Tyr Lys Phe Asn Leu Cys Phe Glu Asn
225 230 235 240
Thr Gln Gly Tyr Gly Tyr Val Thr Glu Lys Ile Ile Asp Ala Tyr Phe
245 250 255
Ser His Thr Ile Pro Ile Tyr Trp Gly Ser Pro Ser Val Ala Lys Asp
260 265 270
Phe Asn Pro Lys Ser Phe Val Asn Val His Asp Phe Lys Asn Phe Asp
275 280 285
Glu Ala Ile Asp Tyr Ile Lys Tyr Leu His Thr His Lys Asn Ala Tyr
290 295 300
Leu Asp Met Leu Tyr Glu Asn Pro Leu Asn Thr Leu Asp Gly Lys Ala
305 310 315 320
Tyr Phe Tyr Gln Asn Leu Ser Phe Lys Lys Ile Leu Ala Phe Phe Lys
325 330 335
Thr Ile Leu Glu Asn Asp Thr Ile Tyr His Asp Asn Pro Phe Ile Phe
340 345 350
Cys Arg Asp Leu Asn Glu Pro Leu Val Thr Ile Asp Asp Leu Arg Val
355 360 365
Asn Tyr Asp Asp Leu Arg Val Asn Tyr Asp Asp Leu Arg Ile Asn Tyr
370 375 380
Asp Asp Leu Arg Val Asn Tyr Asp Asp Leu Arg Ile Asn Tyr Asp Asp
385 390 395 400
Leu Arg Val Asn Tyr Asp Asp Leu Arg Val Asn Tyr Asp Asp Leu Arg
405 410 415
Ile Asn Tyr Asp Asp Leu Arg Val Asn Tyr Asp Asp Leu Arg Val Asn
420 425 430
Tyr Glu Arg Leu Leu Ser Lys Ala Thr Pro Leu Leu Glu Leu Ser Gln
435 440 445
Asn Thr Thr Ser Lys Ile Tyr Arg Lys Ala Tyr Gln Lys Ser Leu Pro
450 455 460
Leu Leu Arg Ala Ile Arg Arg Trp Val Lys Lys Leu Gly Leu
465 470 475
<210> 31
<211> 264
<212> PRT
<213> 大肠杆菌K12 MG1655
<400> 31
Met Lys Gln Tyr Leu Glu Leu Met Gln Lys Val Leu Asp Glu Gly Thr
1 5 10 15
Gln Lys Asn Asp Arg Thr Gly Thr Gly Thr Leu Ser Ile Phe Gly His
20 25 30
Gln Met Arg Phe Asn Leu Gln Asp Gly Phe Pro Leu Val Thr Thr Lys
35 40 45
Arg Cys His Leu Arg Ser Ile Ile His Glu Leu Leu Trp Phe Leu Gln
50 55 60
Gly Asp Thr Asn Ile Ala Tyr Leu His Glu Asn Asn Val Thr Ile Trp
65 70 75 80
Asp Glu Trp Ala Asp Glu Asn Gly Asp Leu Gly Pro Val Tyr Gly Lys
85 90 95
Gln Trp Arg Ala Trp Pro Thr Pro Asp Gly Arg His Ile Asp Gln Ile
100 105 110
Thr Thr Val Leu Asn Gln Leu Lys Asn Asp Pro Asp Ser Arg Arg Ile
115 120 125
Ile Val Ser Ala Trp Asn Val Gly Glu Leu Asp Lys Met Ala Leu Ala
130 135 140
Pro Cys His Ala Phe Phe Gln Phe Tyr Val Ala Asp Gly Lys Leu Ser
145 150 155 160
Cys Gln Leu Tyr Gln Arg Ser Cys Asp Val Phe Leu Gly Leu Pro Phe
165 170 175
Asn Ile Ala Ser Tyr Ala Leu Leu Val His Met Met Ala Gln Gln Cys
180 185 190
Asp Leu Glu Val Gly Asp Phe Val Trp Thr Gly Gly Asp Thr His Leu
195 200 205
Tyr Ser Asn His Met Asp Gln Thr His Leu Gln Leu Ser Arg Glu Pro
210 215 220
Arg Pro Leu Pro Lys Leu Ile Ile Lys Arg Lys Pro Glu Ser Ile Phe
225 230 235 240
Asp Tyr Arg Phe Glu Asp Phe Glu Ile Glu Gly Tyr Asp Pro His Pro
245 250 255
Gly Ile Lys Ala Pro Val Ala Ile
260
<210> 32
<211> 391
<212> PRT
<213> 大肠杆菌K12 MG1655
<400> 32
Met Gln Lys Leu Ile Asn Ser Val Gln Asn Tyr Ala Trp Gly Ser Lys
1 5 10 15
Thr Ala Leu Thr Glu Leu Tyr Gly Met Glu Asn Pro Ser Ser Gln Pro
20 25 30
Met Ala Glu Leu Trp Met Gly Ala His Pro Lys Ser Ser Ser Arg Val
35 40 45
Gln Asn Ala Ala Gly Asp Ile Val Ser Leu Arg Asp Val Ile Glu Ser
50 55 60
Asp Lys Ser Thr Leu Leu Gly Glu Ala Val Ala Lys Arg Phe Gly Glu
65 70 75 80
Leu Pro Phe Leu Phe Lys Val Leu Cys Ala Ala Gln Pro Leu Ser Ile
85 90 95
Gln Val His Pro Asn Lys His Asn Ser Glu Ile Gly Phe Ala Lys Glu
100 105 110
Asn Ala Ala Gly Ile Pro Met Asp Ala Ala Glu Arg Asn Tyr Lys Asp
115 120 125
Pro Asn His Lys Pro Glu Leu Val Phe Ala Leu Thr Pro Phe Leu Ala
130 135 140
Met Asn Ala Phe Arg Glu Phe Ser Glu Ile Val Ser Leu Leu Gln Pro
145 150 155 160
Val Ala Gly Ala His Pro Ala Ile Ala His Phe Leu Gln Gln Pro Asp
165 170 175
Ala Glu Arg Leu Ser Glu Leu Phe Ala Ser Leu Leu Asn Met Gln Gly
180 185 190
Glu Glu Lys Ser Arg Ala Leu Ala Ile Leu Lys Ser Ala Leu Asp Ser
195 200 205
Gln Gln Gly Glu Pro Trp Gln Thr Ile Arg Leu Ile Ser Glu Phe Tyr
210 215 220
Pro Glu Asp Ser Gly Leu Phe Ser Pro Leu Leu Leu Asn Val Val Lys
225 230 235 240
Leu Asn Pro Gly Glu Ala Met Phe Leu Phe Ala Glu Thr Pro His Ala
245 250 255
Tyr Leu Gln Gly Val Ala Leu Glu Val Met Ala Asn Ser Asp Asn Val
260 265 270
Leu Arg Ala Gly Leu Thr Pro Lys Tyr Ile Asp Ile Pro Glu Leu Val
275 280 285
Ala Asn Val Lys Phe Glu Ala Lys Pro Ala Asn Gln Leu Leu Thr Gln
290 295 300
Pro Val Lys Gln Gly Ala Glu Leu Asp Phe Pro Ile Pro Val Asp Asp
305 310 315 320
Phe Ala Phe Ser Leu His Asp Leu Ser Asp Lys Glu Thr Thr Ile Ser
325 330 335
Gln Gln Ser Ala Ala Ile Leu Phe Cys Val Glu Gly Asp Ala Thr Leu
340 345 350
Trp Lys Gly Ser Gln Gln Leu Gln Leu Lys Pro Gly Glu Ser Ala Phe
355 360 365
Ile Ala Ala Asn Glu Ser Pro Val Thr Val Lys Gly His Gly Arg Leu
370 375 380
Ala Arg Val Tyr Asn Lys Leu
385 390
<210> 33
<211> 456
<212> PRT
<213> 大肠杆菌K12 MG1655
<400> 33
Met Lys Lys Leu Thr Cys Phe Lys Ala Tyr Asp Ile Arg Gly Lys Leu
1 5 10 15
Gly Glu Glu Leu Asn Glu Asp Ile Ala Trp Arg Ile Gly Arg Ala Tyr
20 25 30
Gly Glu Phe Leu Lys Pro Lys Thr Ile Val Leu Gly Gly Asp Val Arg
35 40 45
Leu Thr Ser Glu Thr Leu Lys Leu Ala Leu Ala Lys Gly Leu Gln Asp
50 55 60
Ala Gly Val Asp Val Leu Asp Ile Gly Met Ser Gly Thr Glu Glu Ile
65 70 75 80
Tyr Phe Ala Thr Phe His Leu Gly Val Asp Gly Gly Ile Glu Val Thr
85 90 95
Ala Ser His Asn Pro Met Asp Tyr Asn Gly Met Lys Leu Val Arg Glu
100 105 110
Gly Ala Arg Pro Ile Ser Gly Asp Thr Gly Leu Arg Asp Val Gln Arg
115 120 125
Leu Ala Glu Ala Asn Asp Phe Pro Pro Val Asp Glu Thr Lys Arg Gly
130 135 140
Arg Tyr Gln Gln Ile Asn Leu Arg Asp Ala Tyr Val Asp His Leu Phe
145 150 155 160
Gly Tyr Ile Asn Val Lys Asn Leu Thr Pro Leu Lys Leu Val Ile Asn
165 170 175
Ser Gly Asn Gly Ala Ala Gly Pro Val Val Asp Ala Ile Glu Ala Arg
180 185 190
Phe Lys Ala Leu Gly Ala Pro Val Glu Leu Ile Lys Val His Asn Thr
195 200 205
Pro Asp Gly Asn Phe Pro Asn Gly Ile Pro Asn Pro Leu Leu Pro Glu
210 215 220
Cys Arg Asp Asp Thr Arg Asn Ala Val Ile Lys His Gly Ala Asp Met
225 230 235 240
Gly Ile Ala Phe Asp Gly Asp Phe Asp Arg Cys Phe Leu Phe Asp Glu
245 250 255
Lys Gly Gln Phe Ile Glu Gly Tyr Tyr Ile Val Gly Leu Leu Ala Glu
260 265 270
Ala Phe Leu Glu Lys Asn Pro Gly Ala Lys Ile Ile His Asp Pro Arg
275 280 285
Leu Ser Trp Asn Thr Val Asp Val Val Thr Ala Ala Gly Gly Thr Pro
290 295 300
Val Met Ser Lys Thr Gly His Ala Phe Ile Lys Glu Arg Met Arg Lys
305 310 315 320
Glu Asp Ala Ile Tyr Gly Gly Glu Met Ser Ala His His Tyr Phe Arg
325 330 335
Asp Phe Ala Tyr Cys Asp Ser Gly Met Ile Pro Trp Leu Leu Val Ala
340 345 350
Glu Leu Val Cys Leu Lys Asp Lys Thr Leu Gly Glu Leu Val Arg Asp
355 360 365
Arg Met Ala Ala Phe Pro Ala Ser Gly Glu Ile Asn Ser Lys Leu Ala
370 375 380
Gln Pro Val Glu Ala Ile Asn Arg Val Glu Gln His Phe Ser Arg Glu
385 390 395 400
Ala Leu Ala Val Asp Arg Thr Asp Gly Ile Ser Met Thr Phe Ala Asp
405 410 415
Trp Arg Phe Asn Leu Arg Thr Ser Asn Thr Glu Pro Val Val Arg Leu
420 425 430
Asn Val Glu Ser Arg Gly Asp Val Pro Leu Met Glu Ala Arg Thr Arg
435 440 445
Thr Leu Leu Thr Leu Leu Asn Glu
450 455
<210> 34
<211> 478
<212> PRT
<213> 大肠杆菌K12 MG1655
<400> 34
Met Ala Gln Ser Lys Leu Tyr Pro Val Val Met Ala Gly Gly Ser Gly
1 5 10 15
Ser Arg Leu Trp Pro Leu Ser Arg Val Leu Tyr Pro Lys Gln Phe Leu
20 25 30
Cys Leu Lys Gly Asp Leu Thr Met Leu Gln Thr Thr Ile Cys Arg Leu
35 40 45
Asn Gly Val Glu Cys Glu Ser Pro Val Val Ile Cys Asn Glu Gln His
50 55 60
Arg Phe Ile Val Ala Glu Gln Leu Arg Gln Leu Asn Lys Leu Thr Glu
65 70 75 80
Asn Ile Ile Leu Glu Pro Ala Gly Arg Asn Thr Ala Pro Ala Ile Ala
85 90 95
Leu Ala Ala Leu Ala Ala Lys Arg His Ser Pro Glu Ser Asp Pro Leu
100 105 110
Met Leu Val Leu Ala Ala Asp His Val Ile Ala Asp Glu Asp Ala Phe
115 120 125
Arg Ala Ala Val Arg Asn Ala Met Pro Tyr Ala Glu Ala Gly Lys Leu
130 135 140
Val Thr Phe Gly Ile Val Pro Asp Leu Pro Glu Thr Gly Tyr Gly Tyr
145 150 155 160
Ile Arg Arg Gly Glu Val Ser Ala Gly Glu Gln Asp Met Val Ala Phe
165 170 175
Glu Val Ala Gln Phe Val Glu Lys Pro Asn Leu Glu Thr Ala Gln Ala
180 185 190
Tyr Val Ala Ser Gly Glu Tyr Tyr Trp Asn Ser Gly Met Phe Leu Phe
195 200 205
Arg Ala Gly Arg Tyr Leu Glu Glu Leu Lys Lys Tyr Arg Pro Asp Ile
210 215 220
Leu Asp Ala Cys Glu Lys Ala Met Ser Ala Val Asp Pro Asp Leu Asn
225 230 235 240
Phe Ile Arg Val Asp Glu Glu Ala Phe Leu Ala Cys Pro Glu Glu Ser
245 250 255
Val Asp Tyr Ala Val Met Glu Arg Thr Ala Asp Ala Val Val Val Pro
260 265 270
Met Asp Ala Gly Trp Ser Asp Val Gly Ser Trp Ser Ser Leu Trp Glu
275 280 285
Ile Ser Ala His Thr Ala Glu Gly Asn Val Cys His Gly Asp Val Ile
290 295 300
Asn His Lys Thr Glu Asn Ser Tyr Val Tyr Ala Glu Ser Gly Leu Val
305 310 315 320
Thr Thr Val Gly Val Lys Asp Leu Val Val Val Gln Thr Lys Asp Ala
325 330 335
Val Leu Ile Ala Asp Arg Asn Ala Val Gln Asp Val Lys Lys Val Val
340 345 350
Glu Gln Ile Lys Ala Asp Gly Arg His Glu His Arg Val His Arg Glu
355 360 365
Val Tyr Arg Pro Trp Gly Lys Tyr Asp Ser Ile Asp Ala Gly Asp Arg
370 375 380
Tyr Gln Val Lys Arg Ile Thr Val Lys Pro Gly Glu Gly Leu Ser Val
385 390 395 400
Gln Met His His His Arg Ala Glu His Trp Val Val Val Ala Gly Thr
405 410 415
Ala Lys Val Thr Ile Asp Gly Asp Ile Lys Leu Leu Gly Glu Asn Glu
420 425 430
Ser Ile Tyr Ile Pro Leu Gly Ala Thr His Cys Leu Glu Asn Pro Gly
435 440 445
Lys Ile Pro Leu Asp Leu Ile Glu Val Arg Ser Gly Ser Tyr Leu Glu
450 455 460
Glu Asp Asp Val Val Arg Phe Ala Asp Arg Tyr Gly Arg Val
465 470 475
<210> 35
<211> 373
<212> PRT
<213> 大肠杆菌K12 MG1655
<400> 35
Met Ser Lys Val Ala Leu Ile Thr Gly Val Thr Gly Gln Asp Gly Ser
1 5 10 15
Tyr Leu Ala Glu Phe Leu Leu Glu Lys Gly Tyr Glu Val His Gly Ile
20 25 30
Lys Arg Arg Ala Ser Ser Phe Asn Thr Glu Arg Val Asp His Ile Tyr
35 40 45
Gln Asp Pro His Thr Cys Asn Pro Lys Phe His Leu His Tyr Gly Asp
50 55 60
Leu Ser Asp Thr Ser Asn Leu Thr Arg Ile Leu Arg Glu Val Gln Pro
65 70 75 80
Asp Glu Val Tyr Asn Leu Gly Ala Met Ser His Val Ala Val Ser Phe
85 90 95
Glu Ser Pro Glu Tyr Thr Ala Asp Val Asp Ala Met Gly Thr Leu Arg
100 105 110
Leu Leu Glu Ala Ile Arg Phe Leu Gly Leu Glu Lys Lys Thr Arg Phe
115 120 125
Tyr Gln Ala Ser Thr Ser Glu Leu Tyr Gly Leu Val Gln Glu Ile Pro
130 135 140
Gln Lys Glu Thr Thr Pro Phe Tyr Pro Arg Ser Pro Tyr Ala Val Ala
145 150 155 160
Lys Leu Tyr Ala Tyr Trp Ile Thr Val Asn Tyr Arg Glu Ser Tyr Gly
165 170 175
Met Tyr Ala Cys Asn Gly Ile Leu Phe Asn His Glu Ser Pro Arg Arg
180 185 190
Gly Glu Thr Phe Val Thr Arg Lys Ile Thr Arg Ala Ile Ala Asn Ile
195 200 205
Ala Gln Gly Leu Glu Ser Cys Leu Tyr Leu Gly Asn Met Asp Ser Leu
210 215 220
Arg Asp Trp Gly His Ala Lys Asp Tyr Val Lys Met Gln Trp Met Met
225 230 235 240
Leu Gln Gln Glu Gln Pro Glu Asp Phe Val Ile Ala Thr Gly Val Gln
245 250 255
Tyr Ser Val Arg Gln Phe Val Glu Met Ala Ala Ala Gln Leu Gly Ile
260 265 270
Lys Leu Arg Phe Glu Gly Thr Gly Val Glu Glu Lys Gly Ile Val Val
275 280 285
Ser Val Thr Gly His Asp Ala Pro Gly Val Lys Pro Gly Asp Val Ile
290 295 300
Ile Ala Val Asp Pro Arg Tyr Phe Arg Pro Ala Glu Val Glu Thr Leu
305 310 315 320
Leu Gly Asp Pro Thr Lys Ala His Glu Lys Leu Gly Trp Lys Pro Glu
325 330 335
Ile Thr Leu Arg Glu Met Val Ser Glu Met Val Ala Asn Asp Leu Glu
340 345 350
Ala Ala Lys Lys His Ser Leu Leu Lys Ser His Gly Tyr Asp Val Ala
355 360 365
Ile Ala Leu Glu Ser
370
<210> 36
<211> 321
<212> PRT
<213> 大肠杆菌K12 MG1655
<400> 36
Met Ser Lys Gln Arg Val Phe Ile Ala Gly His Arg Gly Met Val Gly
1 5 10 15
Ser Ala Ile Arg Arg Gln Leu Glu Gln Arg Gly Asp Val Glu Leu Val
20 25 30
Leu Arg Thr Arg Asp Glu Leu Asn Leu Leu Asp Ser Arg Ala Val His
35 40 45
Asp Phe Phe Ala Ser Glu Arg Ile Asp Gln Val Tyr Leu Ala Ala Ala
50 55 60
Lys Val Gly Gly Ile Val Ala Asn Asn Thr Tyr Pro Ala Asp Phe Ile
65 70 75 80
Tyr Gln Asn Met Met Ile Glu Ser Asn Ile Ile His Ala Ala His Gln
85 90 95
Asn Asp Val Asn Lys Leu Leu Phe Leu Gly Ser Ser Cys Ile Tyr Pro
100 105 110
Lys Leu Ala Lys Gln Pro Met Ala Glu Ser Glu Leu Leu Gln Gly Thr
115 120 125
Leu Glu Pro Thr Asn Glu Pro Tyr Ala Ile Ala Lys Ile Ala Gly Ile
130 135 140
Lys Leu Cys Glu Ser Tyr Asn Arg Gln Tyr Gly Arg Asp Tyr Arg Ser
145 150 155 160
Val Met Pro Thr Asn Leu Tyr Gly Pro His Asp Asn Phe His Pro Ser
165 170 175
Asn Ser His Val Ile Pro Ala Leu Leu Arg Arg Phe His Glu Ala Thr
180 185 190
Ala Gln Asn Ala Pro Asp Val Val Val Trp Gly Ser Gly Thr Pro Met
195 200 205
Arg Glu Phe Leu His Val Asp Asp Met Ala Ala Ala Ser Ile His Val
210 215 220
Met Glu Leu Ala His Glu Val Trp Leu Glu Asn Thr Gln Pro Met Leu
225 230 235 240
Ser His Ile Asn Val Gly Thr Gly Val Asp Cys Thr Ile Arg Glu Leu
245 250 255
Ala Gln Thr Ile Ala Lys Val Val Gly Tyr Lys Gly Arg Val Val Phe
260 265 270
Asp Ala Ser Lys Pro Asp Gly Thr Pro Arg Lys Leu Leu Asp Val Thr
275 280 285
Arg Leu His Gln Leu Gly Trp Tyr His Glu Ile Ser Leu Glu Ala Gly
290 295 300
Leu Ala Ser Thr Tyr Gln Trp Phe Leu Glu Asn Gln Asp Arg Phe Arg
305 310 315 320
Gly
<210> 37
<211> 438
<212> PRT
<213> 大肠杆菌K12 MG1655
<400> 37
Met Gly Asn Thr Ser Ile Gln Thr Gln Ser Tyr Arg Ala Val Asp Lys
1 5 10 15
Asp Ala Gly Gln Ser Arg Ser Tyr Ile Ile Pro Phe Ala Leu Leu Cys
20 25 30
Ser Leu Phe Phe Leu Trp Ala Val Ala Asn Asn Leu Asn Asp Ile Leu
35 40 45
Leu Pro Gln Phe Gln Gln Ala Phe Thr Leu Thr Asn Phe Gln Ala Gly
50 55 60
Leu Ile Gln Ser Ala Phe Tyr Phe Gly Tyr Phe Ile Ile Pro Ile Pro
65 70 75 80
Ala Gly Ile Leu Met Lys Lys Leu Ser Tyr Lys Ala Gly Ile Ile Thr
85 90 95
Gly Leu Phe Leu Tyr Ala Leu Gly Ala Ala Leu Phe Trp Pro Ala Ala
100 105 110
Glu Ile Met Asn Tyr Thr Leu Phe Leu Val Gly Leu Phe Ile Ile Ala
115 120 125
Ala Gly Leu Gly Cys Leu Glu Thr Ala Ala Asn Pro Phe Val Thr Val
130 135 140
Leu Gly Pro Glu Ser Ser Gly His Phe Arg Leu Asn Leu Ala Gln Thr
145 150 155 160
Phe Asn Ser Phe Gly Ala Ile Ile Ala Val Val Phe Gly Gln Ser Leu
165 170 175
Ile Leu Ser Asn Val Pro His Gln Ser Gln Asp Val Leu Asp Lys Met
180 185 190
Ser Pro Glu Gln Leu Ser Ala Tyr Lys His Ser Leu Val Leu Ser Val
195 200 205
Gln Thr Pro Tyr Met Ile Ile Val Ala Ile Val Leu Leu Val Ala Leu
210 215 220
Leu Ile Met Leu Thr Lys Phe Pro Ala Leu Gln Ser Asp Asn His Ser
225 230 235 240
Asp Ala Lys Gln Gly Ser Phe Ser Ala Ser Leu Ser Arg Leu Ala Arg
245 250 255
Ile Arg His Trp Arg Trp Ala Val Leu Ala Gln Phe Cys Tyr Val Gly
260 265 270
Ala Gln Thr Ala Cys Trp Ser Tyr Leu Ile Arg Tyr Ala Val Glu Glu
275 280 285
Ile Pro Gly Met Thr Ala Gly Phe Ala Ala Asn Tyr Leu Thr Gly Thr
290 295 300
Met Val Cys Phe Phe Ile Gly Arg Phe Thr Gly Thr Trp Leu Ile Ser
305 310 315 320
Arg Phe Ala Pro His Lys Val Leu Ala Ala Tyr Ala Leu Ile Ala Met
325 330 335
Ala Leu Cys Leu Ile Ser Ala Phe Ala Gly Gly His Val Gly Leu Ile
340 345 350
Ala Leu Thr Leu Cys Ser Ala Phe Met Ser Ile Gln Tyr Pro Thr Ile
355 360 365
Phe Ser Leu Gly Ile Lys Asn Leu Gly Gln Asp Thr Lys Tyr Gly Ser
370 375 380
Ser Phe Ile Val Met Thr Ile Ile Gly Gly Gly Ile Val Thr Pro Val
385 390 395 400
Met Gly Phe Val Ser Asp Ala Ala Gly Asn Ile Pro Thr Ala Glu Leu
405 410 415
Ile Pro Ala Leu Cys Phe Ala Val Ile Phe Ile Phe Ala Arg Phe Arg
420 425 430
Ser Gln Thr Ala Thr Asn
435
<210> 38
<211> 949
<212> PRT
<213> 脆弱类杆菌(Bacteroides fragilis) NCTC 9343
<400> 38
Met Gln Lys Leu Leu Ser Leu Pro Ser Asn Leu Val Gln Ser Phe His
1 5 10 15
Glu Leu Glu Arg Val Asn Arg Thr Asp Trp Phe Cys Thr Ser Asp Pro
20 25 30
Val Gly Lys Lys Leu Gly Ser Gly Gly Gly Thr Ser Trp Leu Leu Glu
35 40 45
Glu Cys Tyr Asn Glu Tyr Ser Asp Gly Ala Thr Phe Gly Glu Trp Leu
50 55 60
Glu Lys Glu Lys Arg Ile Leu Leu His Ala Gly Gly Gln Ser Arg Arg
65 70 75 80
Leu Pro Gly Tyr Ala Pro Ser Gly Lys Ile Leu Thr Pro Val Pro Val
85 90 95
Phe Arg Trp Glu Arg Gly Gln His Leu Gly Gln Asn Leu Leu Ser Leu
100 105 110
Gln Leu Pro Leu Tyr Glu Lys Ile Met Ser Leu Ala Pro Asp Lys Leu
115 120 125
His Thr Leu Ile Ala Ser Gly Asp Val Tyr Ile Arg Ser Glu Lys Pro
130 135 140
Leu Gln Ser Ile Pro Glu Ala Asp Val Val Cys Tyr Gly Leu Trp Val
145 150 155 160
Asp Pro Ser Leu Ala Thr His His Gly Val Phe Ala Ser Asp Arg Lys
165 170 175
His Pro Glu Gln Leu Asp Phe Met Leu Gln Lys Pro Ser Leu Ala Glu
180 185 190
Leu Glu Ser Leu Ser Lys Thr His Leu Phe Leu Met Asp Ile Gly Ile
195 200 205
Trp Leu Leu Ser Asp Arg Ala Val Glu Ile Leu Met Lys Arg Ser His
210 215 220
Lys Glu Ser Ser Glu Glu Leu Lys Tyr Tyr Asp Leu Tyr Ser Asp Phe
225 230 235 240
Gly Leu Ala Leu Gly Thr His Pro Arg Ile Glu Asp Glu Glu Val Asn
245 250 255
Thr Leu Ser Val Ala Ile Leu Pro Leu Pro Gly Gly Glu Phe Tyr His
260 265 270
Tyr Gly Thr Ser Lys Glu Leu Ile Ser Ser Thr Leu Ser Val Gln Asn
275 280 285
Lys Val Tyr Asp Gln Arg Arg Ile Met His Arg Lys Val Lys Pro Asn
290 295 300
Pro Ala Met Phe Val Gln Asn Ala Val Val Arg Ile Pro Leu Cys Ala
305 310 315 320
Glu Asn Ala Asp Leu Trp Ile Glu Asn Ser His Ile Gly Pro Lys Trp
325 330 335
Lys Ile Ala Ser Arg His Ile Ile Thr Gly Val Pro Glu Asn Asp Trp
340 345 350
Ser Leu Ala Val Pro Ala Gly Val Cys Val Asp Val Val Pro Met Gly
355 360 365
Asp Lys Gly Phe Val Ala Arg Pro Tyr Gly Leu Asp Asp Val Phe Lys
370 375 380
Gly Asp Leu Arg Asp Ser Lys Thr Thr Leu Thr Gly Ile Pro Phe Gly
385 390 395 400
Glu Trp Met Ser Lys Arg Gly Leu Ser Tyr Thr Asp Leu Lys Gly Arg
405 410 415
Thr Asp Asp Leu Gln Ala Val Ser Val Phe Pro Met Val Asn Ser Val
420 425 430
Glu Glu Leu Gly Leu Val Leu Arg Trp Met Leu Ser Glu Pro Glu Leu
435 440 445
Glu Glu Gly Lys Asn Ile Trp Leu Arg Ser Glu His Phe Ser Ala Asp
450 455 460
Glu Ile Ser Ala Gly Ala Asn Leu Lys Arg Leu Tyr Ala Gln Arg Glu
465 470 475 480
Glu Phe Arg Lys Gly Asn Trp Lys Ala Leu Ala Val Asn His Glu Lys
485 490 495
Ser Val Phe Tyr Gln Leu Asp Leu Ala Asp Ala Ala Glu Asp Phe Val
500 505 510
Arg Leu Gly Leu Asp Met Pro Glu Leu Leu Pro Glu Asp Ala Leu Gln
515 520 525
Met Ser Arg Ile His Asn Arg Met Leu Arg Ala Arg Ile Leu Lys Leu
530 535 540
Asp Gly Lys Asp Tyr Arg Pro Glu Glu Gln Ala Ala Phe Asp Leu Leu
545 550 555 560
Arg Asp Gly Leu Leu Asp Gly Ile Ser Asn Arg Lys Ser Thr Pro Lys
565 570 575
Leu Asp Val Tyr Ser Asp Gln Ile Val Trp Gly Arg Ser Pro Val Arg
580 585 590
Ile Asp Met Ala Gly Gly Trp Thr Asp Thr Pro Pro Tyr Ser Leu Tyr
595 600 605
Ser Gly Gly Asn Val Val Asn Leu Ala Ile Glu Leu Asn Gly Gln Pro
610 615 620
Pro Leu Gln Val Tyr Val Lys Pro Cys Lys Asp Phe His Ile Val Leu
625 630 635 640
Arg Ser Ile Asp Met Gly Ala Met Glu Ile Val Ser Thr Phe Asp Glu
645 650 655
Leu Gln Asp Tyr Lys Lys Ile Gly Ser Pro Phe Ser Ile Pro Lys Ala
660 665 670
Ala Leu Ser Leu Ala Gly Phe Ala Pro Ala Phe Ser Ala Val Ser Tyr
675 680 685
Ala Ser Leu Glu Glu Gln Leu Lys Asp Phe Gly Ala Gly Ile Glu Val
690 695 700
Thr Leu Leu Ala Ala Ile Pro Ala Gly Ser Gly Leu Gly Thr Ser Ser
705 710 715 720
Ile Leu Ala Ser Thr Val Leu Gly Ala Ile Asn Asp Phe Cys Gly Leu
725 730 735
Ala Trp Asp Lys Asn Glu Ile Cys Gln Arg Thr Leu Val Leu Glu Gln
740 745 750
Leu Leu Thr Thr Gly Gly Gly Trp Gln Asp Gln Tyr Gly Gly Val Leu
755 760 765
Gln Gly Val Lys Leu Leu Gln Thr Glu Ala Gly Phe Ala Gln Ser Pro
770 775 780
Leu Val Arg Trp Leu Pro Asp His Leu Phe Thr His Pro Glu Tyr Lys
785 790 795 800
Asp Cys His Leu Leu Tyr Tyr Thr Gly Ile Thr Arg Thr Ala Lys Gly
805 810 815
Ile Leu Ala Glu Ile Val Ser Ser Met Phe Leu Asn Ser Ser Leu His
820 825 830
Leu Asn Leu Leu Ser Glu Met Lys Ala His Ala Leu Asp Met Asn Glu
835 840 845
Ala Ile Gln Arg Gly Ser Phe Val Glu Phe Gly Arg Leu Val Gly Lys
850 855 860
Thr Trp Glu Gln Asn Lys Ala Leu Asp Ser Gly Thr Asn Pro Pro Ala
865 870 875 880
Val Glu Ala Ile Ile Asp Leu Ile Lys Asp Tyr Thr Leu Gly Tyr Lys
885 890 895
Leu Pro Gly Ala Gly Gly Gly Gly Tyr Leu Tyr Met Val Ala Lys Asp
900 905 910
Pro Gln Ala Ala Val Arg Ile Arg Lys Ile Leu Thr Glu Asn Ala Pro
915 920 925
Asn Pro Arg Ala Arg Phe Val Glu Met Thr Leu Ser Asp Lys Gly Phe
930 935 940
Gln Val Ser Arg Ser
945
<210> 39
<211> 159
<212> PRT
<213> 酒酵母菌(Saccharomyces cerevisiae)
<400> 39
Met Ser Leu Pro Asp Gly Phe Tyr Ile Arg Arg Met Glu Glu Gly Asp
1 5 10 15
Leu Glu Gln Val Thr Glu Thr Leu Lys Val Leu Thr Thr Val Gly Thr
20 25 30
Ile Thr Pro Glu Ser Phe Ser Lys Leu Ile Lys Tyr Trp Asn Glu Ala
35 40 45
Thr Val Trp Asn Asp Asn Glu Asp Lys Lys Ile Met Gln Tyr Asn Pro
50 55 60
Met Val Ile Val Asp Lys Arg Thr Glu Thr Val Ala Ala Thr Gly Asn
65 70 75 80
Ile Ile Ile Glu Arg Lys Ile Ile His Glu Leu Gly Leu Cys Gly His
85 90 95
Ile Glu Asp Ile Ala Val Asn Ser Lys Tyr Gln Gly Gln Gly Leu Gly
100 105 110
Lys Leu Leu Ile Asp Gln Leu Val Thr Ile Gly Phe Asp Tyr Gly Cys
115 120 125
Tyr Lys Ile Ile Leu Asp Cys Asp Glu Lys Asn Val Lys Phe Tyr Glu
130 135 140
Lys Cys Gly Phe Ser Asn Ala Gly Val Glu Met Gln Ile Arg Lys
145 150 155
<210> 40
<211> 421
<212> PRT
<213> 卵形拟杆菌(Bacteroides ovatus)
<400> 40
Met Asp Ser Lys Asn Asn Ile Gly His Ser Ala Asp Ile Ser Leu Thr
1 5 10 15
Ala Glu Leu Pro Ile Pro Ile Tyr Asn Gly Asn Thr Ile Met Asp Phe
20 25 30
Lys Lys Leu Ala Ser Leu Tyr Lys Asp Glu Leu Leu Asp Asn Val Leu
35 40 45
Pro Phe Trp Leu Glu His Ser Gln Asp His Glu Tyr Gly Gly Tyr Phe
50 55 60
Thr Cys Leu Asp Arg Glu Gly Lys Val Phe Asp Thr Asp Lys Phe Ile
65 70 75 80
Trp Leu Gln Ser Arg Glu Val Trp Met Phe Ser Met Leu Tyr Asn Lys
85 90 95
Val Glu Lys Arg Gln Glu Trp Leu Asp Cys Ala Ile Gln Gly Gly Glu
100 105 110
Phe Leu Lys Lys Tyr Gly His Asp Gly Asn Tyr Asn Trp Tyr Phe Ser
115 120 125
Leu Asp Arg Ser Gly Arg Pro Leu Val Glu Pro Tyr Asn Ile Phe Ser
130 135 140
Tyr Thr Phe Ala Thr Met Ala Phe Gly Gln Leu Ser Leu Thr Thr Gly
145 150 155 160
Asn Gln Glu Tyr Ala Asp Ile Ala Lys Lys Thr Phe Asp Ile Ile Leu
165 170 175
Ser Lys Val Asp Asn Pro Lys Gly Arg Trp Asn Lys Leu His Pro Gly
180 185 190
Thr Arg Asn Leu Lys Asn Phe Ala Leu Pro Met Ile Leu Cys Asn Leu
195 200 205
Ala Leu Glu Ile Glu His Leu Leu Asp Glu Thr Tyr Leu Arg Glu Thr
210 215 220
Met Asp Thr Cys Ile His Glu Val Met Glu Val Phe Tyr Arg Pro Glu
225 230 235 240
Leu Gly Gly Ile Ile Val Glu Asn Val Asp Ile Asp Gly Asn Leu Val
245 250 255
Asp Cys Phe Glu Gly Arg Gln Val Thr Pro Gly His Ala Ile Glu Ala
260 265 270
Met Trp Phe Ile Met Asp Leu Gly Lys Arg Leu Asn Arg Pro Glu Leu
275 280 285
Ile Glu Lys Ala Lys Glu Thr Thr Leu Thr Met Leu Asn Tyr Gly Trp
290 295 300
Asp Lys Gln Tyr Gly Gly Ile Tyr Tyr Phe Met Asp Arg Asn Gly Cys
305 310 315 320
Pro Pro Gln Gln Leu Glu Trp Asp Gln Lys Leu Trp Trp Val His Ile
325 330 335
Glu Thr Leu Ile Ser Leu Leu Lys Gly Tyr Gln Leu Thr Gly Asp Lys
340 345 350
Lys Cys Leu Glu Trp Phe Glu Lys Val His Asp Tyr Thr Trp Glu His
355 360 365
Phe Lys Asp Lys Glu Tyr Pro Glu Trp Tyr Gly Tyr Leu Asn Arg Arg
370 375 380
Gly Glu Val Leu Leu Pro Leu Lys Gly Gly Lys Trp Lys Gly Cys Phe
385 390 395 400
His Val Pro Arg Gly Leu Tyr Gln Cys Trp Lys Thr Leu Glu Glu Ile
405 410 415
Lys Asn Ile Val Ser
420
<210> 41
<211> 349
<212> PRT
<213> 脑膜炎双球菌
<400> 41
Met Gln Asn Asn Asn Glu Phe Lys Ile Gly Asn Arg Ser Val Gly Tyr
1 5 10 15
Asn His Glu Pro Leu Ile Ile Cys Glu Ile Gly Ile Asn His Glu Gly
20 25 30
Ser Leu Lys Thr Ala Phe Glu Met Val Asp Ala Ala Tyr Asn Ala Gly
35 40 45
Ala Glu Val Val Lys His Gln Thr His Ile Val Glu Asp Glu Met Ser
50 55 60
Asp Glu Ala Lys Gln Val Ile Pro Gly Asn Ala Asp Val Ser Ile Tyr
65 70 75 80
Glu Ile Met Glu Arg Cys Ala Leu Asn Glu Glu Asp Glu Ile Lys Leu
85 90 95
Lys Glu Tyr Val Glu Ser Lys Gly Met Ile Phe Ile Ser Thr Pro Phe
100 105 110
Ser Arg Ala Ala Ala Leu Arg Leu Gln Arg Met Asp Ile Pro Ala Tyr
115 120 125
Lys Ile Gly Ser Gly Glu Cys Asn Asn Tyr Pro Leu Ile Lys Leu Val
130 135 140
Ala Ser Phe Gly Lys Pro Ile Ile Leu Ser Thr Gly Met Asn Ser Ile
145 150 155 160
Glu Ser Ile Lys Lys Ser Val Glu Ile Ile Arg Glu Ala Gly Val Pro
165 170 175
Tyr Ala Leu Leu His Cys Thr Asn Ile Tyr Pro Thr Pro Tyr Glu Asp
180 185 190
Val Arg Leu Gly Gly Met Asn Asp Leu Ser Glu Ala Phe Pro Asp Ala
195 200 205
Ile Ile Gly Leu Ser Asp His Thr Leu Asp Asn Tyr Ala Cys Leu Gly
210 215 220
Ala Val Ala Leu Gly Gly Ser Ile Leu Glu Arg His Phe Thr Asp Arg
225 230 235 240
Met Asp Arg Pro Gly Pro Asp Ile Val Cys Ser Met Asn Pro Asp Thr
245 250 255
Phe Lys Glu Leu Lys Gln Gly Ala His Ala Leu Lys Leu Ala Arg Gly
260 265 270
Gly Lys Lys Asp Thr Ile Ile Ala Gly Glu Lys Pro Thr Lys Asp Phe
275 280 285
Ala Phe Ala Ser Val Val Ala Asp Lys Asp Ile Lys Lys Gly Glu Leu
290 295 300
Leu Ser Gly Asp Asn Leu Trp Val Lys Arg Pro Gly Asn Gly Asp Phe
305 310 315 320
Ser Val Asn Glu Tyr Glu Thr Leu Phe Gly Lys Val Ala Ala Cys Asn
325 330 335
Ile Arg Lys Gly Ala Gln Ile Lys Lys Thr Asp Ile Glu
340 345
<210> 42
<211> 223
<212> PRT
<213> 多杀性巴氏杆菌(Pasteurella multocida)
<400> 42
Met Thr Asn Ile Ala Ile Ile Pro Ala Arg Ala Gly Ser Lys Gly Ile
1 5 10 15
Pro Asp Lys Asn Leu Gln Pro Val Gly Gly His Ser Leu Ile Gly Arg
20 25 30
Ala Ile Leu Ala Ala Lys Asn Ala Asp Val Phe Asp Met Ile Val Val
35 40 45
Thr Ser Asp Gly Asp Asn Ile Leu Arg Glu Ala Glu Lys Tyr Gly Ala
50 55 60
Leu Ala Leu Lys Arg Pro Ala Glu Leu Ala Gln Asp Asn Ser Arg Thr
65 70 75 80
Ile Asp Ala Ile Leu His Ala Leu Glu Ser Leu Asn Ile Arg Glu Gly
85 90 95
Thr Cys Thr Leu Leu Gln Pro Thr Ser Pro Leu Arg Asp His Leu Asp
100 105 110
Ile Lys Asn Ala Met Asp Met Tyr Val Asn Gly Gly Val His Ser Val
115 120 125
Val Ser Ala Cys Glu Cys Glu His His Pro Tyr Lys Ala Phe Ala Leu
130 135 140
Ser Lys Asp His Glu Val Leu Pro Val Arg Glu Ile Ala Asp Phe Glu
145 150 155 160
Ala Ala Arg Gln Thr Leu Pro Lys Met Tyr Arg Ala Asn Gly Ala Ile
165 170 175
Tyr Ile Asn Asp Ile Ala Gln Leu Leu Lys Glu Lys Tyr Phe Phe Ile
180 185 190
Pro Pro Leu Lys Phe Tyr Leu Met Pro Thr Tyr Arg Ser Val Asp Ile
195 200 205
Asp Val Lys Gln Asp Leu Glu Leu Ala Glu Ile Leu Ser Asn Lys
210 215 220
<210> 43
<211> 268
<212> PRT
<213> 多杀性巴氏杆菌(Pasteurella multocida)
<400> 43
Met Asp Lys Phe Ala Glu His Glu Ile Pro Lys Ala Val Ile Val Ala
1 5 10 15
Gly Asn Gly Glu Ser Leu Ser Gln Ile Asp Tyr Arg Leu Leu Pro Lys
20 25 30
Asn Tyr Asp Val Phe Arg Cys Asn Gln Phe Tyr Phe Glu Glu Arg Tyr
35 40 45
Phe Leu Gly Asn Lys Ile Lys Ala Val Phe Phe Thr Pro Gly Val Phe
50 55 60
Leu Glu Gln Tyr Tyr Thr Leu Tyr His Leu Lys Arg Asn Asn Glu Tyr
65 70 75 80
Phe Val Asp Asn Val Ile Leu Ser Ser Phe Asn His Pro Thr Val Asp
85 90 95
Leu Glu Lys Ser Gln Lys Ile Gln Ala Leu Phe Ile Asp Val Ile Asn
100 105 110
Gly Tyr Glu Lys Tyr Leu Ser Lys Leu Thr Ala Phe Asp Val Tyr Leu
115 120 125
Arg Tyr Lys Glu Leu Tyr Glu Asn Gln Arg Ile Thr Ser Gly Val Tyr
130 135 140
Met Cys Ala Val Ala Ile Ala Met Gly Tyr Thr Asp Ile Tyr Leu Thr
145 150 155 160
Gly Ile Asp Phe Tyr Gln Ala Ser Glu Glu Asn Tyr Ala Phe Asp Asn
165 170 175
Lys Lys Pro Asn Ile Ile Arg Leu Leu Pro Asp Phe Arg Lys Glu Lys
180 185 190
Thr Leu Phe Ser Tyr His Ser Lys Asp Ile Asp Leu Glu Ala Leu Ser
195 200 205
Phe Leu Gln Gln His Tyr His Val Asn Phe Tyr Ser Ile Ser Pro Met
210 215 220
Ser Pro Leu Ser Lys His Phe Pro Ile Pro Thr Val Glu Asp Asp Cys
225 230 235 240
Glu Thr Thr Phe Val Ala Pro Leu Lys Glu Asn Tyr Ile Asn Asp Ile
245 250 255
Leu Leu Pro Pro His Phe Val Tyr Glu Lys Leu Gly
260 265
<210> 44
<211> 371
<212> PRT
<213> 脑膜炎双球菌
<400> 44
Met Gly Leu Lys Lys Ala Cys Leu Thr Val Leu Cys Leu Ile Val Phe
1 5 10 15
Cys Phe Gly Ile Phe Tyr Thr Phe Asp Arg Val Asn Gln Gly Glu Arg
20 25 30
Asn Ala Val Ser Leu Leu Lys Glu Lys Leu Phe Asn Glu Glu Gly Glu
35 40 45
Pro Val Asn Leu Ile Phe Cys Tyr Thr Ile Leu Gln Met Lys Val Ala
50 55 60
Glu Arg Ile Met Ala Gln His Pro Gly Glu Arg Phe Tyr Val Val Leu
65 70 75 80
Met Ser Glu Asn Arg Asn Glu Lys Tyr Asp Tyr Tyr Phe Asn Gln Ile
85 90 95
Lys Asp Lys Ala Glu Arg Ala Tyr Phe Phe His Leu Pro Tyr Gly Leu
100 105 110
Asn Lys Ser Phe Asn Phe Ile Pro Thr Met Ala Glu Leu Lys Val Lys
115 120 125
Ser Met Leu Leu Pro Lys Val Lys Arg Ile Tyr Leu Ala Ser Leu Glu
130 135 140
Lys Val Ser Ile Ala Ala Phe Leu Ser Thr Tyr Pro Asp Ala Glu Ile
145 150 155 160
Lys Thr Phe Asp Asp Gly Thr Gly Asn Leu Ile Gln Ser Ser Ser Tyr
165 170 175
Leu Gly Asp Glu Phe Ser Val Asn Gly Thr Ile Lys Arg Asn Phe Ala
180 185 190
Arg Met Met Ile Gly Asp Trp Ser Ile Ala Lys Thr Arg Asn Ala Ser
195 200 205
Asp Glu His Tyr Thr Ile Phe Lys Gly Leu Lys Asn Ile Met Asp Asp
210 215 220
Gly Arg Arg Lys Met Thr Tyr Leu Pro Leu Phe Asp Ala Ser Glu Leu
225 230 235 240
Lys Thr Gly Asp Glu Thr Gly Gly Thr Val Arg Ile Leu Leu Gly Ser
245 250 255
Pro Asp Lys Glu Met Lys Glu Ile Ser Glu Lys Ala Ala Lys Asn Phe
260 265 270
Lys Ile Gln Tyr Val Ala Pro His Pro Arg Gln Thr Tyr Gly Leu Ser
275 280 285
Gly Val Thr Thr Leu Asn Ser Pro Tyr Val Ile Glu Asp Tyr Ile Leu
290 295 300
Arg Glu Ile Lys Lys Asn Pro His Thr Arg Tyr Glu Ile Tyr Thr Phe
305 310 315 320
Phe Ser Gly Ala Ala Leu Thr Met Lys Asp Phe Pro Asn Val His Val
325 330 335
Tyr Ala Leu Lys Pro Ala Ser Leu Pro Glu Asp Tyr Trp Leu Lys Pro
340 345 350
Val Tyr Ala Leu Phe Thr Gln Ser Gly Ile Pro Ile Leu Thr Phe Asp
355 360 365
Asp Lys Asn
370
<210> 45
<211> 391
<212> PRT
<213> 发光杆菌(Photobacterium damselae)
<400> 45
Met Thr Val Val Ala Pro Thr Leu Glu Val Tyr Ile Asp His Ala Ser
1 5 10 15
Leu Pro Ser Leu Gln Gln Leu Ile His Ile Ile Gln Ala Lys Asp Glu
20 25 30
Tyr Pro Ser Asn Gln Arg Phe Val Ser Trp Lys Arg Val Thr Val Asp
35 40 45
Ala Asp Asn Ala Asn Lys Leu Asn Ile His Thr Tyr Pro Leu Lys Gly
50 55 60
Asn Asn Thr Ser Pro Glu Met Val Ala Ala Ile Asp Glu Tyr Ala Gln
65 70 75 80
Ser Lys Asn Arg Leu Asn Ile Glu Phe Tyr Thr Asn Thr Ala His Val
85 90 95
Phe Asn Asn Leu Pro Pro Ile Ile Gln Pro Leu Tyr Asn Asn Glu Lys
100 105 110
Val Lys Ile Ser His Ile Ser Leu Tyr Asp Asp Gly Ser Ser Glu Tyr
115 120 125
Val Ser Leu Tyr Gln Trp Lys Asp Thr Pro Asn Lys Ile Glu Thr Leu
130 135 140
Glu Gly Glu Val Ser Leu Leu Ala Asn Tyr Leu Ala Gly Thr Ser Pro
145 150 155 160
Asp Ala Pro Lys Gly Met Gly Asn Arg Tyr Asn Trp His Lys Leu Tyr
165 170 175
Asp Thr Asp Tyr Tyr Phe Leu Arg Glu Asp Tyr Leu Asp Val Glu Ala
180 185 190
Asn Leu His Asp Leu Arg Asp Tyr Leu Gly Ser Ser Ala Lys Gln Met
195 200 205
Pro Trp Asp Glu Phe Ala Lys Leu Ser Asp Ser Gln Gln Thr Leu Phe
210 215 220
Leu Asp Ile Val Gly Phe Asp Lys Glu Gln Leu Gln Gln Gln Tyr Ser
225 230 235 240
Gln Ser Pro Leu Pro Asn Phe Ile Phe Thr Gly Thr Thr Thr Trp Ala
245 250 255
Gly Gly Glu Thr Lys Glu Tyr Tyr Ala Gln Gln Gln Val Asn Val Ile
260 265 270
Asn Asn Ala Ile Asn Glu Thr Ser Pro Tyr Tyr Leu Gly Lys Asp Tyr
275 280 285
Asp Leu Phe Phe Lys Gly His Pro Ala Gly Gly Val Ile Asn Asp Ile
290 295 300
Ile Leu Gly Ser Phe Pro Asp Met Ile Asn Ile Pro Ala Lys Ile Ser
305 310 315 320
Phe Glu Val Leu Met Met Thr Asp Met Leu Pro Asp Thr Val Ala Gly
325 330 335
Ile Ala Ser Ser Leu Tyr Phe Thr Ile Pro Ala Asp Lys Val Asn Phe
340 345 350
Ile Val Phe Thr Ser Ser Asp Thr Ile Thr Asp Arg Glu Glu Ala Leu
355 360 365
Lys Ser Pro Leu Val Gln Val Met Leu Thr Leu Gly Ile Val Lys Glu
370 375 380
Lys Asp Val Leu Phe Trp Ala
385 390
<210> 46
<211> 498
<212> PRT
<213> 发光菌(Photobacterium sp.) JT-ISH-224
<400> 46
Met Ser Glu Glu Asn Thr Gln Ser Ile Ile Lys Asn Asp Ile Asn Lys
1 5 10 15
Thr Ile Ile Asp Glu Glu Tyr Val Asn Leu Glu Pro Ile Asn Gln Ser
20 25 30
Asn Ile Ser Phe Thr Lys His Ser Trp Val Gln Thr Cys Gly Thr Gln
35 40 45
Gln Leu Leu Thr Glu Gln Asn Lys Glu Ser Ile Ser Leu Ser Val Val
50 55 60
Ala Pro Arg Leu Asp Asp Asp Glu Lys Tyr Cys Phe Asp Phe Asn Gly
65 70 75 80
Val Ser Asn Lys Gly Glu Lys Tyr Ile Thr Lys Val Thr Leu Asn Val
85 90 95
Val Ala Pro Ser Leu Glu Val Tyr Val Asp His Ala Ser Leu Pro Thr
100 105 110
Leu Gln Gln Leu Met Asp Ile Ile Lys Ser Glu Glu Glu Asn Pro Thr
115 120 125
Ala Gln Arg Tyr Ile Ala Trp Gly Arg Ile Val Pro Thr Asp Glu Gln
130 135 140
Met Lys Glu Leu Asn Ile Thr Ser Phe Ala Leu Ile Asn Asn His Thr
145 150 155 160
Pro Ala Asp Leu Val Gln Glu Ile Val Lys Gln Ala Gln Thr Lys His
165 170 175
Arg Leu Asn Val Lys Leu Ser Ser Asn Thr Ala His Ser Phe Asp Asn
180 185 190
Leu Val Pro Ile Leu Lys Glu Leu Asn Ser Phe Asn Asn Val Thr Val
195 200 205
Thr Asn Ile Asp Leu Tyr Asp Asp Gly Ser Ala Glu Tyr Val Asn Leu
210 215 220
Tyr Asn Trp Arg Asp Thr Leu Asn Lys Thr Asp Asn Leu Lys Ile Gly
225 230 235 240
Lys Asp Tyr Leu Glu Asp Val Ile Asn Gly Ile Asn Glu Asp Thr Ser
245 250 255
Asn Thr Gly Thr Ser Ser Val Tyr Asn Trp Gln Lys Leu Tyr Pro Ala
260 265 270
Asn Tyr His Phe Leu Arg Lys Asp Tyr Leu Thr Leu Glu Pro Ser Leu
275 280 285
His Glu Leu Arg Asp Tyr Ile Gly Asp Ser Leu Lys Gln Met Gln Trp
290 295 300
Asp Gly Phe Lys Lys Phe Asn Ser Lys Gln Gln Glu Leu Phe Leu Ser
305 310 315 320
Ile Val Asn Phe Asp Lys Gln Lys Leu Gln Asn Glu Tyr Asn Ser Ser
325 330 335
Asn Leu Pro Asn Phe Val Phe Thr Gly Thr Thr Val Trp Ala Gly Asn
340 345 350
His Glu Arg Glu Tyr Tyr Ala Lys Gln Gln Ile Asn Val Ile Asn Asn
355 360 365
Ala Ile Asn Glu Ser Ser Pro His Tyr Leu Gly Asn Ser Tyr Asp Leu
370 375 380
Phe Phe Lys Gly His Pro Gly Gly Gly Ile Ile Asn Thr Leu Ile Met
385 390 395 400
Gln Asn Tyr Pro Ser Met Val Asp Ile Pro Ser Lys Ile Ser Phe Glu
405 410 415
Val Leu Met Met Thr Asp Met Leu Pro Asp Ala Val Ala Gly Ile Ala
420 425 430
Ser Ser Leu Tyr Phe Thr Ile Pro Ala Glu Lys Ile Lys Phe Ile Val
435 440 445
Phe Thr Ser Thr Glu Thr Ile Thr Asp Arg Glu Thr Ala Leu Arg Ser
450 455 460
Pro Leu Val Gln Val Met Ile Lys Leu Gly Ile Val Lys Glu Glu Asn
465 470 475 480
Val Leu Phe Trp Ala Asp Leu Pro Asn Cys Glu Thr Gly Val Cys Ile
485 490 495
Ala Val
<210> 47
<211> 188
<212> PRT
<213> 大肠杆菌K12 MG1655
<400> 47
Met Tyr Glu Arg Tyr Ala Gly Leu Ile Phe Asp Met Asp Gly Thr Ile
1 5 10 15
Leu Asp Thr Glu Pro Thr His Arg Lys Ala Trp Arg Glu Val Leu Gly
20 25 30
His Tyr Gly Leu Gln Tyr Asp Ile Gln Ala Met Ile Ala Leu Asn Gly
35 40 45
Ser Pro Thr Trp Arg Ile Ala Gln Ala Ile Ile Glu Leu Asn Gln Ala
50 55 60
Asp Leu Asp Pro His Ala Leu Ala Arg Glu Lys Thr Glu Ala Val Arg
65 70 75 80
Ser Met Leu Leu Asp Ser Val Glu Pro Leu Pro Leu Val Asp Val Val
85 90 95
Lys Ser Trp His Gly Arg Arg Pro Met Ala Val Gly Thr Gly Ser Glu
100 105 110
Ser Ala Ile Ala Glu Ala Leu Leu Ala His Leu Gly Leu Arg His Tyr
115 120 125
Phe Asp Ala Val Val Ala Ala Asp His Val Lys His His Lys Pro Ala
130 135 140
Pro Asp Thr Phe Leu Leu Cys Ala Gln Arg Met Gly Val Gln Pro Thr
145 150 155 160
Gln Cys Val Val Phe Glu Asp Ala Asp Phe Gly Ile Gln Ala Ala Arg
165 170 175
Ala Ala Gly Met Asp Ala Val Asp Val Arg Leu Leu
180 185
<210> 48
<211> 373
<212> PRT
<213> 空肠弯曲杆菌(Campylobacter jejuni)
<400> 48
Met Val Lys Lys Ile Leu Phe Ile Thr Gly Ser Arg Ala Asp Tyr Ser
1 5 10 15
Lys Ile Lys Ser Leu Met Tyr Arg Val Gln Asn Ser Ser Glu Phe Glu
20 25 30
Leu Tyr Ile Phe Ala Thr Gly Met His Leu Ser Lys Asn Phe Gly Tyr
35 40 45
Thr Val Lys Glu Leu Tyr Lys Asn Gly Phe Lys Asn Ile Tyr Glu Phe
50 55 60
Ile Asn Tyr Asp Lys Tyr Tyr Gln Thr Asp Lys Ala Leu Ala Thr Thr
65 70 75 80
Ile Asp Gly Phe Ser Arg Tyr Ala Asn Glu Leu Lys Pro Asp Leu Ile
85 90 95
Val Val His Gly Asp Arg Ile Glu Pro Leu Ala Ala Ala Ile Val Gly
100 105 110
Ala Leu Asn Asn Ile Leu Val Ala His Ile Glu Gly Gly Glu Ile Ser
115 120 125
Gly Thr Ile Asp Asp Ser Leu Arg His Ala Ile Ser Lys Leu Ala His
130 135 140
Ile His Leu Val Asn Asp Glu Phe Ala Lys Arg Arg Leu Met Gln Leu
145 150 155 160
Gly Glu Asp Glu Lys Ser Ile Phe Ile Ile Gly Ser Pro Asp Leu Glu
165 170 175
Leu Leu Asn Asp Asn Lys Ile Ser Leu Ser Glu Ala Lys Lys Tyr Tyr
180 185 190
Asp Ile Asn Tyr Glu Asn Tyr Ala Leu Leu Met Phe His Pro Val Thr
195 200 205
Thr Glu Ile Thr Ser Ile Lys Asn Gln Ala Asp Asn Leu Val Lys Ala
210 215 220
Leu Ile Gln Ser Asn Lys Asn Tyr Ile Val Ile Tyr Pro Asn Asn Asp
225 230 235 240
Leu Gly Phe Glu Leu Ile Leu Gln Ser Tyr Glu Glu Phe Lys Asn Asn
245 250 255
Pro Arg Phe Lys Leu Phe Pro Ser Leu Arg Phe Glu Tyr Phe Ile Thr
260 265 270
Leu Leu Lys Asn Ala Asp Phe Ile Ile Gly Asn Ser Ser Cys Ile Leu
275 280 285
Lys Glu Ala Leu Tyr Leu Lys Thr Ala Gly Ile Leu Val Gly Ser Arg
290 295 300
Gln Asn Gly Arg Leu Gly Asn Glu Asn Thr Leu Lys Val Asn Ala Asn
305 310 315 320
Ser Asp Glu Ile Leu Lys Ala Ile Asn Thr Ile His Lys Lys Gln Asp
325 330 335
Leu Phe Ser Ala Lys Leu Glu Ile Leu Asp Ser Ser Lys Leu Phe Phe
340 345 350
Glu Tyr Leu Gln Ser Gly Asp Phe Phe Lys Leu Ser Thr Gln Lys Val
355 360 365
Phe Lys Asp Ile Lys
370
<210> 49
<211> 415
<212> PRT
<213> 大肠杆菌W
<400> 49
Met Ala Leu Asn Ile Pro Phe Arg Asn Ala Tyr Tyr Arg Phe Ala Ser
1 5 10 15
Ser Tyr Ser Phe Leu Phe Phe Ile Ser Trp Ser Leu Trp Trp Ser Leu
20 25 30
Tyr Ala Ile Trp Leu Lys Gly His Leu Gly Leu Thr Gly Thr Glu Leu
35 40 45
Gly Thr Leu Tyr Ser Val Asn Gln Phe Thr Ser Ile Leu Phe Met Met
50 55 60
Phe Tyr Gly Ile Val Gln Asp Lys Leu Gly Leu Lys Lys Pro Leu Ile
65 70 75 80
Trp Cys Met Ser Phe Ile Leu Val Leu Thr Gly Pro Phe Met Ile Tyr
85 90 95
Val Tyr Glu Pro Leu Leu Gln Ser Asn Phe Ser Val Gly Leu Ile Leu
100 105 110
Gly Ala Leu Phe Phe Gly Leu Gly Tyr Leu Ala Gly Cys Gly Leu Leu
115 120 125
Asp Ser Phe Thr Glu Lys Met Ala Arg Asn Phe His Phe Glu Tyr Gly
130 135 140
Thr Ala Arg Ala Trp Gly Ser Phe Gly Tyr Ala Ile Gly Ala Phe Phe
145 150 155 160
Ala Gly Ile Phe Phe Ser Ile Ser Pro His Ile Asn Phe Trp Leu Val
165 170 175
Ser Leu Phe Gly Ala Val Phe Met Met Ile Asn Met Arg Phe Lys Asp
180 185 190
Lys Asp His Gln Cys Val Ala Ala Asp Ala Gly Gly Val Lys Lys Glu
195 200 205
Asp Phe Ile Ala Val Phe Lys Asp Arg Asn Phe Trp Val Phe Val Ile
210 215 220
Phe Ile Val Gly Thr Trp Ser Phe Tyr Asn Ile Phe Asp Gln Gln Leu
225 230 235 240
Phe Pro Val Phe Tyr Ser Gly Leu Phe Glu Ser His Asp Val Gly Thr
245 250 255
Arg Leu Tyr Gly Tyr Leu Asn Ser Phe Gln Val Val Leu Glu Ala Leu
260 265 270
Cys Met Ala Ile Ile Pro Phe Phe Val Asn Arg Val Gly Pro Lys Asn
275 280 285
Ala Leu Leu Ile Gly Val Val Ile Met Ala Leu Arg Ile Leu Ser Cys
290 295 300
Ala Leu Phe Val Asn Pro Trp Ile Ile Ser Leu Val Lys Leu Leu His
305 310 315 320
Ala Ile Glu Val Pro Leu Cys Val Ile Ser Val Phe Lys Tyr Ser Val
325 330 335
Ala Asn Phe Asp Lys Arg Leu Ser Ser Thr Ile Phe Leu Ile Gly Phe
340 345 350
Gln Ile Ala Ser Ser Leu Gly Ile Val Leu Leu Ser Thr Pro Thr Gly
355 360 365
Ile Leu Phe Asp His Ala Gly Tyr Gln Thr Val Phe Phe Ala Ile Ser
370 375 380
Gly Ile Val Cys Leu Met Leu Leu Phe Gly Ile Phe Phe Leu Ser Lys
385 390 395 400
Lys Arg Glu Gln Ile Val Met Glu Thr Pro Val Pro Ser Ala Ile
405 410 415
<210> 50
<211> 301
<212> PRT
<213> 运动发酵单胞菌(Zymomonas mobilis)
<400> 50
Met Lys Asn Asp Lys Lys Ile Tyr Gly Cys Ile Glu Gly Gly Gly Thr
1 5 10 15
Lys Phe Met Leu Ala Leu Ile Asp Ser Asp Arg Lys Met Leu Ala Val
20 25 30
Glu Arg Val Pro Thr Thr Thr Pro Glu Glu Thr Leu Gly Lys Ser Val
35 40 45
Glu Phe Phe Lys Lys Ala Leu Pro Gln Tyr Ala Asp Ser Phe Ala Ser
50 55 60
Phe Gly Ile Ala Ser Phe Gly Pro Leu Cys Leu Asp Arg Lys Ser Pro
65 70 75 80
Lys Trp Gly Tyr Ile Thr Asn Thr Pro Lys Pro Phe Trp Pro Asn Thr
85 90 95
Asp Val Val Thr Pro Phe Lys Glu Ala Phe Gly Cys Pro Val Glu Ile
100 105 110
Asp Thr Asp Val Asn Gly Ala Ala Leu Ala Glu Asn Phe Trp Gly Ala
115 120 125
Ser Lys Gly Thr His Thr Ser Val Tyr Val Thr Val Gly Thr Gly Phe
130 135 140
Gly Gly Gly Val Leu Ile Asp Gly Lys Pro Ile His Gly Leu Ala His
145 150 155 160
Pro Glu Met Gly His Gly Ile Pro Ile Arg His Pro Asp Asp Arg Asp
165 170 175
Phe Glu Gly Cys Cys Pro Tyr His Gly Gly Cys Tyr Glu Gly Leu Ala
180 185 190
Ser Gly Thr Ala Ile Arg Lys Arg Trp Gly Lys Ala Leu Asn Glu Met
195 200 205
Glu Pro Ala Glu Phe Glu Lys Ala Arg Glu Ile Ile Ala Phe Tyr Leu
210 215 220
Ala His Phe Asn Val Thr Leu Gln Ala Phe Ile Ser Pro Glu Arg Ile
225 230 235 240
Val Phe Gly Gly Gly Val Met His Val Asp Gly Met Leu Ala Ser Val
245 250 255
Arg Arg Gln Thr Ala Glu Ile Ala Asn Ser Tyr Phe Glu Gly Ala Asp
260 265 270
Phe Glu Lys Ile Ile Val Leu Pro Gly Leu Gly Asp Gln Ala Gly Met
275 280 285
Met Gly Ala Phe Ala Leu Ala Leu Ala Ala Glu Asn Lys
290 295 300
<210> 51
<211> 504
<212> PRT
<213> 青春双歧杆菌(Bifidobacterium adolescentis)
<400> 51
Met Lys Asn Lys Val Gln Leu Ile Thr Tyr Ala Asp Arg Leu Gly Asp
1 5 10 15
Gly Thr Ile Lys Ser Met Thr Asp Ile Leu Arg Thr Arg Phe Asp Gly
20 25 30
Val Tyr Asp Gly Val His Ile Leu Pro Phe Phe Thr Pro Phe Asp Gly
35 40 45
Ala Asp Ala Gly Phe Asp Pro Ile Asp His Thr Lys Val Asp Glu Arg
50 55 60
Leu Gly Ser Trp Asp Asp Val Ala Glu Leu Ser Lys Thr His Asn Ile
65 70 75 80
Met Val Asp Ala Ile Val Asn His Met Ser Trp Glu Ser Lys Gln Phe
85 90 95
Gln Asp Val Leu Ala Lys Gly Glu Glu Ser Glu Tyr Tyr Pro Met Phe
100 105 110
Leu Thr Met Ser Ser Val Phe Pro Asn Gly Ala Thr Glu Glu Asp Leu
115 120 125
Ala Gly Ile Tyr Arg Pro Arg Pro Gly Leu Pro Phe Thr His Tyr Lys
130 135 140
Phe Ala Gly Lys Thr Arg Leu Val Trp Val Ser Phe Thr Pro Gln Gln
145 150 155 160
Val Asp Ile Asp Thr Asp Ser Asp Lys Gly Trp Glu Tyr Leu Met Ser
165 170 175
Ile Phe Asp Gln Met Ala Ala Ser His Val Ser Tyr Ile Arg Leu Asp
180 185 190
Ala Val Gly Tyr Gly Ala Lys Glu Ala Gly Thr Ser Cys Phe Met Thr
195 200 205
Pro Lys Thr Phe Lys Leu Ile Ser Arg Leu Arg Glu Glu Gly Val Lys
210 215 220
Arg Gly Leu Glu Ile Leu Ile Glu Val His Ser Tyr Tyr Lys Lys Gln
225 230 235 240
Val Glu Ile Ala Ser Lys Val Asp Arg Val Tyr Asp Phe Ala Leu Pro
245 250 255
Pro Leu Leu Leu His Ala Leu Ser Thr Gly His Val Glu Pro Val Ala
260 265 270
His Trp Thr Asp Ile Arg Pro Asn Asn Ala Val Thr Val Leu Asp Thr
275 280 285
His Asp Gly Ile Gly Val Ile Asp Ile Gly Ser Asp Gln Leu Asp Arg
290 295 300
Ser Leu Lys Gly Leu Val Pro Asp Glu Asp Val Asp Asn Leu Val Asn
305 310 315 320
Thr Ile His Ala Asn Thr His Gly Glu Ser Gln Ala Ala Thr Gly Ala
325 330 335
Ala Ala Ser Asn Leu Asp Leu Tyr Gln Val Asn Ser Thr Tyr Tyr Ser
340 345 350
Ala Leu Gly Cys Asn Asp Gln His Tyr Ile Ala Ala Arg Ala Val Gln
355 360 365
Phe Phe Leu Pro Gly Val Pro Gln Val Tyr Tyr Val Gly Ala Leu Ala
370 375 380
Gly Lys Asn Asp Met Glu Leu Leu Arg Lys Thr Asn Asn Gly Arg Asp
385 390 395 400
Ile Asn Arg His Tyr Tyr Ser Thr Ala Glu Ile Asp Glu Asn Leu Lys
405 410 415
Arg Pro Val Val Lys Ala Leu Asn Ala Leu Ala Lys Phe Arg Asn Glu
420 425 430
Leu Asp Ala Phe Asp Gly Thr Phe Ser Tyr Thr Thr Asp Asp Asp Thr
435 440 445
Ser Ile Ser Phe Thr Trp Arg Gly Glu Thr Ser Gln Ala Thr Leu Thr
450 455 460
Phe Glu Pro Lys Arg Gly Leu Gly Val Asp Asn Thr Thr Pro Val Ala
465 470 475 480
Met Leu Glu Trp Glu Asp Ser Ala Gly Asp His Arg Ser Asp Asp Leu
485 490 495
Ile Ala Asn Pro Pro Val Val Ala
500
<210> 52
<211> 417
<212> PRT
<213> 大肠杆菌K12 MG1655
<400> 52
Met Tyr Tyr Leu Lys Asn Thr Asn Phe Trp Met Phe Gly Leu Phe Phe
1 5 10 15
Phe Phe Tyr Phe Phe Ile Met Gly Ala Tyr Phe Pro Phe Phe Pro Ile
20 25 30
Trp Leu His Asp Ile Asn His Ile Ser Lys Ser Asp Thr Gly Ile Ile
35 40 45
Phe Ala Ala Ile Ser Leu Phe Ser Leu Leu Phe Gln Pro Leu Phe Gly
50 55 60
Leu Leu Ser Asp Lys Leu Gly Leu Arg Lys Tyr Leu Leu Trp Ile Ile
65 70 75 80
Thr Gly Met Leu Val Met Phe Ala Pro Phe Phe Ile Phe Ile Phe Gly
85 90 95
Pro Leu Leu Gln Tyr Asn Ile Leu Val Gly Ser Ile Val Gly Gly Ile
100 105 110
Tyr Leu Gly Phe Cys Phe Asn Ala Gly Ala Pro Ala Val Glu Ala Phe
115 120 125
Ile Glu Lys Val Ser Arg Arg Ser Asn Phe Glu Phe Gly Arg Ala Arg
130 135 140
Met Phe Gly Cys Val Gly Trp Ala Leu Cys Ala Ser Ile Val Gly Ile
145 150 155 160
Met Phe Thr Ile Asn Asn Gln Phe Val Phe Trp Leu Gly Ser Gly Cys
165 170 175
Ala Leu Ile Leu Ala Val Leu Leu Phe Phe Ala Lys Thr Asp Ala Pro
180 185 190
Ser Ser Ala Thr Val Ala Asn Ala Val Gly Ala Asn His Ser Ala Phe
195 200 205
Ser Leu Lys Leu Ala Leu Glu Leu Phe Arg Gln Pro Lys Leu Trp Phe
210 215 220
Leu Ser Leu Tyr Val Ile Gly Val Ser Cys Thr Tyr Asp Val Phe Asp
225 230 235 240
Gln Gln Phe Ala Asn Phe Phe Thr Ser Phe Phe Ala Thr Gly Glu Gln
245 250 255
Gly Thr Arg Val Phe Gly Tyr Val Thr Thr Met Gly Glu Leu Leu Asn
260 265 270
Ala Ser Ile Met Phe Phe Ala Pro Leu Ile Ile Asn Arg Ile Gly Gly
275 280 285
Lys Asn Ala Leu Leu Leu Ala Gly Thr Ile Met Ser Val Arg Ile Ile
290 295 300
Gly Ser Ser Phe Ala Thr Ser Ala Leu Glu Val Val Ile Leu Lys Thr
305 310 315 320
Leu His Met Phe Glu Val Pro Phe Leu Leu Val Gly Cys Phe Lys Tyr
325 330 335
Ile Thr Ser Gln Phe Glu Val Arg Phe Ser Ala Thr Ile Tyr Leu Val
340 345 350
Cys Phe Cys Phe Phe Lys Gln Leu Ala Met Ile Phe Met Ser Val Leu
355 360 365
Ala Gly Asn Met Tyr Glu Ser Ile Gly Phe Gln Gly Ala Tyr Leu Val
370 375 380
Leu Gly Leu Val Ala Leu Gly Phe Thr Leu Ile Ser Val Phe Thr Leu
385 390 395 400
Ser Gly Pro Gly Pro Leu Ser Leu Leu Arg Arg Gln Val Asn Glu Val
405 410 415
Ala
<210> 53
<211> 410
<212> PRT
<213> 阪崎肠杆菌(Cronobacter sakazakii)菌株MOD1_LR753
<400> 53
Met Gln Thr His Ala Asn Arg Thr Gly Arg Leu Gly Arg Gln Ala Leu
1 5 10 15
Leu Phe Pro Leu Cys Leu Val Leu Tyr Glu Phe Ser Thr Tyr Ile Gly
20 25 30
Asn Asp Met Ile Gln Pro Gly Met Leu Ala Val Val Glu Gln Tyr Gln
35 40 45
Ala Gly Val Glu Trp Val Pro Thr Ser Met Thr Ala Tyr Leu Ala Gly
50 55 60
Gly Met Phe Leu Gln Trp Leu Leu Gly Pro Leu Ser Asp Arg Ile Gly
65 70 75 80
Arg Arg Pro Val Met Leu Ala Gly Val Ala Trp Phe Ile Val Thr Cys
85 90 95
Leu Ala Thr Leu Leu Ala Arg Asp Ile Glu Gln Phe Thr Val Leu Arg
100 105 110
Phe Leu Gln Gly Ile Ser Leu Cys Phe Ile Gly Ala Val Gly Tyr Ala
115 120 125
Ala Ile Gln Glu Ser Phe Glu Glu Ala Val Cys Ile Lys Ile Thr Ala
130 135 140
Leu Met Ala Asn Val Ala Leu Ile Ala Pro Leu Leu Gly Pro Leu Val
145 150 155 160
Gly Ala Ala Trp Val His Ala Ala Pro Trp Glu Met Met Phe Val Leu
165 170 175
Phe Ala Ala Leu Ala Ala Ile Ser Phe Phe Gly Leu Trp Arg Ala Met
180 185 190
Pro Glu Thr Ala Thr Arg Leu Gly Glu Lys Leu Ser Leu Arg Glu Leu
195 200 205
Gly Arg Asp Tyr Lys Ala Val Leu Lys Asn Leu Arg Phe Val Ser Gly
210 215 220
Ala Leu Ala Ile Gly Phe Val Ser Leu Pro Leu Leu Ala Trp Ile Ala
225 230 235 240
Gln Ser Pro Val Ile Ile Ile Ser Gly Glu Gln Met Ser Thr Tyr Glu
245 250 255
Tyr Gly Leu Leu Gln Val Pro Ile Phe Gly Ala Leu Ile Ile Gly Asn
260 265 270
Leu Val Leu Ala Lys Leu Thr Ala Arg Arg Ser Val Arg Ser Leu Ile
275 280 285
Val Met Gly Gly Trp Pro Met Met Phe Gly Leu Ala Leu Ala Ala Leu
290 295 300
Ala Thr Val Ile Ser Ser His Ala Tyr Leu Trp Met Thr Ala Gly Leu
305 310 315 320
Ser Ile Tyr Ala Phe Gly Ile Gly Ile Ala Asn Ala Gly Leu Val Arg
325 330 335
Leu Thr Leu Phe Ala Ser Asp Ile Ser Lys Gly Thr Val Ser Ala Ala
340 345 350
Met Gly Met Leu Gln Met Thr Ile Phe Thr Val Gly Ile Glu Ile Ser
355 360 365
Lys His Ala Trp Leu Gly Gly Gly Asn Ala Leu Phe Asn Leu Phe Asn
370 375 380
Phe Ala Ser Gly Leu Leu Trp Leu Gly Leu Met Val Ile Phe Leu Lys
385 390 395 400
Asp Lys Thr Val Gly Thr Arg Pro Glu Ala
405 410
<210> 54
<211> 411
<212> PRT
<213> 粉末佛朗哥氏菌(Franconibacter pulveris)LMG 24059
<400> 54
Met Gln Asn Lys Thr Met Thr Lys Lys Arg Leu Gly Arg Gln Ala Leu
1 5 10 15
Leu Phe Pro Leu Cys Leu Val Leu Tyr Glu Phe Ser Thr Tyr Ile Gly
20 25 30
Asn Asp Met Ile Gln Pro Gly Met Leu Ala Val Val Glu Gln Tyr Gln
35 40 45
Ala Gly Met Glu Trp Val Pro Thr Ser Met Thr Ala Tyr Leu Ala Gly
50 55 60
Gly Met Phe Leu Gln Trp Leu Leu Gly Pro Leu Ser Asp Arg Ile Gly
65 70 75 80
Arg Arg Pro Val Met Leu Thr Gly Val Val Trp Phe Ile Val Thr Cys
85 90 95
Leu Ala Thr Leu Leu Ala Gln Asn Ile Glu Gln Phe Thr Ala Leu Arg
100 105 110
Phe Leu Gln Gly Ile Ser Leu Cys Phe Ile Gly Ala Val Gly Tyr Ala
115 120 125
Ala Ile Gln Glu Ser Phe Glu Glu Ala Val Cys Ile Lys Ile Thr Ala
130 135 140
Leu Met Ala Asn Val Ala Leu Ile Ala Pro Leu Leu Gly Pro Leu Val
145 150 155 160
Gly Ala Ala Trp Val His Met Ala Pro Trp Glu Met Met Phe Val Leu
165 170 175
Phe Ala Val Leu Ala Ala Ile Ala Tyr Tyr Gly Leu Trp Arg Ala Met
180 185 190
Pro Glu Thr Ala Thr Arg Leu Gly Glu Lys Leu Ser Leu Lys Glu Leu
195 200 205
Gly Arg Asp Tyr Lys Ala Val Met Lys Asn Ala Arg Phe Val Ala Gly
210 215 220
Ala Leu Ala Thr Gly Phe Val Ser Leu Pro Leu Leu Ala Trp Ile Ala
225 230 235 240
Gln Ser Pro Val Ile Ile Ile Ser Gly Glu Gln Leu Ser Ser Tyr Glu
245 250 255
Tyr Gly Leu Leu Gln Val Pro Ile Phe Gly Ala Leu Ile Ala Gly Asn
260 265 270
Leu Ala Leu Ala Lys Leu Thr Ser Arg Arg Thr Val Arg Ser Leu Ile
275 280 285
Ile Leu Gly Gly Trp Pro Ile Thr Leu Gly Leu Val Ile Ala Ala Leu
290 295 300
Ala Thr Leu Leu Ser Ser His Ala Tyr Leu Trp Met Thr Ala Gly Leu
305 310 315 320
Ser Val Tyr Ala Phe Gly Ile Gly Leu Ala Asn Ala Gly Leu Val Arg
325 330 335
Leu Thr Leu Phe Ala Ser Asp Ile Ser Lys Gly Thr Val Ser Ala Ala
340 345 350
Met Gly Met Leu Gln Met Leu Ile Phe Thr Val Gly Ile Glu Val Ser
355 360 365
Lys His Ala Tyr Leu Ala Gly Gly Asn Gly Leu Phe Ser Leu Phe Asn
370 375 380
Leu Leu Asn Gly Leu Leu Trp Leu Gly Met Met Val Ile Phe Leu Lys
385 390 395 400
Asp Lys Thr Val Gly Asn Ser Leu Gln Pro Gln
405 410
<210> 55
<211> 410
<212> PRT
<213> Enterobacter hormaechei 菌株017
<400> 55
Met Ile Asn Arg Ser Ser Ser Gly Asn Arg Leu Gly Arg Gln Ala Leu
1 5 10 15
Leu Phe Pro Leu Cys Leu Val Leu Tyr Glu Phe Ser Thr Tyr Ile Gly
20 25 30
Asn Asp Met Ile Gln Pro Gly Met Leu Ala Val Val Glu Gln Tyr Asn
35 40 45
Ala Gly Ile Glu Trp Val Pro Thr Ser Met Thr Ala Tyr Leu Ala Gly
50 55 60
Gly Met Phe Leu Gln Trp Leu Leu Gly Pro Leu Ser Asp Arg Ile Gly
65 70 75 80
Arg Arg Pro Val Met Leu Thr Gly Val Val Trp Phe Ile Val Thr Cys
85 90 95
Leu Ala Thr Leu Leu Ala Gln Asn Ile Glu Gln Phe Thr Leu Leu Arg
100 105 110
Phe Leu Gln Gly Val Ser Leu Cys Phe Ile Gly Ala Val Gly Tyr Ala
115 120 125
Ala Ile Gln Glu Ser Phe Glu Glu Ala Val Cys Ile Lys Ile Thr Ala
130 135 140
Leu Met Ala Asn Val Ala Leu Ile Ala Pro Leu Leu Gly Pro Leu Val
145 150 155 160
Gly Ala Ala Trp Val His Val Ala Pro Trp Glu Gly Met Phe Val Leu
165 170 175
Phe Ala Ala Leu Ala Ala Ile Ser Phe Phe Gly Leu His Arg Ala Met
180 185 190
Pro Glu Thr Ala Thr Arg Leu Gly Glu Lys Leu Ser Leu Lys Glu Leu
195 200 205
Gly Arg Asp Tyr Lys Ala Val Leu Lys Asn Gly Arg Phe Val Ala Gly
210 215 220
Ala Leu Ala Thr Gly Phe Val Ser Leu Pro Leu Leu Ala Trp Ile Ala
225 230 235 240
Gln Ser Pro Val Ile Ile Ile Ser Gly Glu Gln Leu Ser Ser Tyr Glu
245 250 255
Tyr Gly Leu Leu Gln Val Pro Ile Phe Gly Ala Leu Ile Ile Gly Asn
260 265 270
Leu Val Leu Ala Arg Leu Thr Ser Arg Arg Thr Val Arg Ser Leu Ile
275 280 285
Ile Met Gly Gly Trp Pro Ile Ala Ala Gly Leu Ile Ile Ala Ala Val
290 295 300
Ala Thr Val Ala Ser Ser His Ala Tyr Leu Trp Met Thr Ala Gly Leu
305 310 315 320
Ser Ile Tyr Ala Phe Gly Ile Gly Val Ala Asn Ala Gly Leu Val Arg
325 330 335
Leu Thr Leu Phe Ala Ser Glu Met Ser Lys Gly Thr Val Ser Ala Ala
340 345 350
Met Gly Met Leu Gln Met Leu Ile Phe Thr Val Gly Ile Glu Val Ser
355 360 365
Lys His Ala Tyr Ala Phe Gly Gly Asn Gly Leu Phe Ser Leu Phe Asn
370 375 380
Leu Ala Asn Gly Val Leu Trp Val Gly Leu Met Val Val Phe Leu Lys
385 390 395 400
Asp Lys Arg Val Gly Asn Ala Leu Gln Pro
405 410
<210> 56
<211> 410
<212> PRT
<213> 克氏柠檬酸杆菌(Citrobacter koseri)菌株NCTC10771
<400> 56
Met Gln Asn Leu Ser Gln Thr Gly Val Arg Leu Gly Arg Gln Ala Leu
1 5 10 15
Leu Phe Pro Leu Cys Leu Val Leu Tyr Glu Phe Ser Thr Tyr Ile Gly
20 25 30
Asn Asp Met Ile Gln Pro Gly Met Leu Ala Val Val Glu Gln Tyr Gln
35 40 45
Ala Gly Ile Asp Trp Val Pro Thr Ser Met Thr Ala Tyr Leu Ala Gly
50 55 60
Gly Met Phe Leu Gln Trp Leu Leu Gly Pro Leu Ser Asp Arg Ile Gly
65 70 75 80
Arg Arg Pro Val Met Leu Ala Gly Val Ile Trp Phe Ile Val Thr Cys
85 90 95
Leu Ala Thr Leu Leu Ala Gln Asn Ile Glu Gln Phe Thr Leu Leu Arg
100 105 110
Phe Leu Gln Gly Val Ser Leu Cys Phe Ile Gly Ala Val Gly Tyr Ala
115 120 125
Ala Ile Gln Glu Ser Phe Glu Glu Ala Val Cys Ile Lys Ile Thr Ala
130 135 140
Leu Met Ala Asn Val Ala Leu Ile Ala Pro Leu Leu Gly Pro Leu Val
145 150 155 160
Gly Ala Ala Trp Val His Val Leu Pro Trp Glu Glu Met Phe Val Leu
165 170 175
Phe Ala Val Leu Ala Ala Ile Ala Phe Val Gly Leu Gln Arg Ala Met
180 185 190
Pro Glu Thr Ala Thr Arg Leu Gly Glu Lys Leu Ser Leu Lys Glu Leu
195 200 205
Gly Arg Asp Tyr Lys Leu Val Leu Lys Asn Val Arg Phe Val Ala Gly
210 215 220
Ala Leu Ala Leu Gly Phe Val Ser Leu Pro Leu Leu Ala Trp Ile Ala
225 230 235 240
Gln Ser Pro Ile Ile Ile Ile Ser Gly Glu Gln Leu Ser Ser Tyr Glu
245 250 255
Tyr Gly Leu Leu Gln Val Pro Val Phe Gly Ala Leu Ile Ala Gly Asn
260 265 270
Leu Val Leu Ala Arg Leu Thr Ser Arg Arg Thr Val Arg Ala Leu Ile
275 280 285
Ile Met Gly Gly Trp Pro Ile Val Ala Gly Leu Leu Ile Ala Ala Ala
290 295 300
Ala Thr Val Val Ser Ser His Ala Tyr Leu Trp Met Thr Ala Gly Leu
305 310 315 320
Ser Val Tyr Ala Phe Gly Ile Gly Val Ala Asn Ala Gly Leu Val Arg
325 330 335
Leu Thr Leu Phe Ala Ser Asp Met Ser Lys Gly Thr Val Ser Ala Ala
340 345 350
Met Gly Met Leu Gln Met Leu Ile Phe Thr Val Gly Ile Glu Val Ser
355 360 365
Lys His Ala Tyr Leu Ser Gly Gly Asn Gly Leu Phe Ser Leu Phe Asn
370 375 380
Leu Ala Asn Gly Ile Leu Trp Leu Leu Leu Met Val Ile Phe Leu Lys
385 390 395 400
Asp Lys Arg Val Gly Asp Ser Arg Glu Gly
405 410
<210> 57
<211> 410
<212> PRT
<213> Salmonella enterica subsp. arizonae 血清型 41:z4,z23:- 菌株TAMU30EF
<400> 57
Met His Asn Arg Leu Gln Ser Gly Val Arg Leu Gly Arg Gln Ala Leu
1 5 10 15
Leu Phe Pro Leu Cys Leu Val Leu Tyr Glu Phe Ser Thr Tyr Ile Gly
20 25 30
Asn Asp Met Ile Gln Pro Gly Met Leu Ala Val Val Glu Gln Tyr Gln
35 40 45
Ala Gly Leu Asp Trp Val Pro Thr Ser Met Thr Ala Tyr Leu Ala Gly
50 55 60
Gly Met Phe Leu Gln Trp Leu Leu Gly Pro Leu Ser Asp Arg Ile Gly
65 70 75 80
Arg Arg Pro Val Met Leu Ala Gly Val Val Trp Phe Ile Val Thr Cys
85 90 95
Leu Ala Thr Leu Leu Ala Lys Asn Ile Glu Gln Phe Thr Phe Leu Arg
100 105 110
Phe Leu Gln Gly Ile Ser Leu Cys Phe Ile Gly Ala Val Gly Tyr Ala
115 120 125
Ala Ile Gln Glu Ser Phe Glu Glu Ala Val Cys Ile Lys Ile Thr Ala
130 135 140
Leu Met Ala Asn Val Ala Leu Ile Ala Pro Leu Leu Gly Pro Leu Val
145 150 155 160
Gly Ala Ala Trp Val His Val Leu Pro Trp Glu Gly Met Phe Ile Leu
165 170 175
Phe Ala Ala Leu Ala Ala Ile Ala Phe Phe Gly Leu Gln Arg Ala Met
180 185 190
Pro Glu Thr Ala Thr Arg Arg Gly Glu Thr Leu Ser Phe Lys Ala Leu
195 200 205
Gly Arg Asp Tyr Arg Leu Val Ile Lys Asn Arg Arg Phe Val Ala Gly
210 215 220
Ala Leu Ala Leu Gly Phe Val Ser Leu Pro Leu Leu Ala Trp Ile Ala
225 230 235 240
Gln Ser Pro Ile Ile Ile Ile Ser Gly Glu Gln Leu Ser Ser Tyr Glu
245 250 255
Tyr Gly Leu Leu Gln Val Pro Val Phe Gly Ala Leu Ile Ala Gly Asn
260 265 270
Leu Val Leu Ala Arg Leu Thr Ser Arg Arg Thr Val Arg Ser Leu Ile
275 280 285
Val Met Gly Gly Trp Pro Ile Val Ala Gly Leu Val Ile Ala Ala Ala
290 295 300
Ala Thr Val Val Ser Ser His Ala Tyr Leu Trp Met Thr Ala Gly Leu
305 310 315 320
Ser Val Tyr Ala Phe Gly Ile Gly Leu Ala Asn Ala Gly Leu Val Arg
325 330 335
Leu Thr Leu Phe Ser Ser Asp Met Ser Lys Gly Thr Val Ser Ala Ala
340 345 350
Met Gly Met Leu Gln Met Leu Ile Phe Thr Val Gly Ile Glu Val Ser
355 360 365
Lys His Ala Trp Leu Ser Gly Gly Asn Gly Leu Phe Ser Leu Phe Asn
370 375 380
Leu Ala Asn Gly Ile Leu Trp Leu Leu Leu Met Leu Val Phe Leu Lys
385 390 395 400
Asp Lys Arg Thr Gly Asn Leu His Thr Val
405 410
<210> 58
<211> 408
<212> PRT
<213> 副痢疾杆菌(Shigella flexneri )菌株585219
<400> 58
Met Gln Asn Lys Leu Ala Ser Gly Ala Arg Leu Gly Arg Gln Ala Leu
1 5 10 15
Leu Phe Pro Leu Cys Leu Val Leu Tyr Glu Phe Ser Thr Tyr Ile Gly
20 25 30
Asn Asp Met Ile Gln Pro Gly Met Leu Ala Val Val Glu Gln Tyr Gln
35 40 45
Ala Gly Ile Asp Trp Val Pro Thr Ser Met Thr Ala Tyr Leu Ala Gly
50 55 60
Gly Met Phe Leu Gln Trp Leu Leu Gly Pro Leu Ser Asp Arg Ile Gly
65 70 75 80
Arg Arg Pro Val Met Leu Ala Gly Val Leu Trp Phe Ile Val Thr Cys
85 90 95
Leu Ala Ile Leu Leu Ala Gln Asn Ile Glu Gln Phe Thr Met Leu Arg
100 105 110
Phe Leu Gln Gly Ile Ser Leu Cys Phe Ile Gly Ala Val Gly Tyr Ala
115 120 125
Ala Ile Gln Glu Ser Phe Glu Glu Ala Val Cys Ile Lys Ile Thr Ala
130 135 140
Leu Met Val Asn Val Ala Leu Ile Ala Pro Leu Leu Gly Pro Leu Val
145 150 155 160
Gly Ala Ala Trp Ile His Val Leu Pro Trp Glu Gly Met Phe Val Leu
165 170 175
Phe Ala Ala Leu Ala Ala Ile Ser Phe Phe Gly Leu Gln Arg Ala Met
180 185 190
Pro Glu Thr Ala Thr Arg Ile Gly Glu Lys Leu Ser Leu Lys Glu Leu
195 200 205
Gly Arg Asp Tyr Lys Leu Val Leu Lys Asn Gly Arg Phe Val Ala Gly
210 215 220
Ala Leu Gly Phe Val Ser Leu Pro Leu Leu Ala Trp Ile Ala Gln Ser
225 230 235 240
Pro Ile Ile Ile Ile Thr Gly Glu Gln Leu Ser Ser Tyr Glu Tyr Gly
245 250 255
Leu Leu Gln Val Pro Ile Phe Gly Ala Leu Ile Ala Gly Asn Leu Leu
260 265 270
Leu Ala Arg Leu Thr Ser Arg Arg Thr Val Arg Ser Leu Ile Ile Met
275 280 285
Gly Gly Trp Pro Ile Met Ile Gly Leu Leu Val Ala Ala Ala Ala Thr
290 295 300
Val Ile Ser Ser His Ala Tyr Leu Trp Met Thr Ala Gly Leu Ser Ile
305 310 315 320
Tyr Ala Phe Gly Ile Gly Leu Ala Asn Ala Gly Leu Val Arg Leu Thr
325 330 335
Leu Phe Ala Ser Asp Met Ser Lys Gly Thr Val Ser Ala Ala Met Gly
340 345 350
Met Leu Gln Met Leu Ile Phe Thr Val Gly Ile Glu Ile Ser Lys His
355 360 365
Ala Trp Leu Asn Gly Gly Asn Gly Leu Phe Asn Leu Phe Asn Leu Val
370 375 380
Asn Gly Ile Leu Trp Leu Ser Leu Met Val Ile Phe Leu Lys Asp Lys
385 390 395 400
Gln Met Gly Asn Ser His Glu Gly
405
<210> 59
<211> 410
<212> PRT
<213> 里根斯堡预研菌 (Yokenella regensburgei)菌株UMB0819
<400> 59
Met Leu Asn Arg Ser Ser Ser Gly Ser Arg Leu Gly Arg Gln Ala Leu
1 5 10 15
Leu Phe Pro Leu Cys Leu Val Leu Tyr Glu Phe Ser Thr Tyr Ile Gly
20 25 30
Asn Asp Met Ile Gln Pro Gly Met Leu Ala Val Val Ala Gln Tyr Asn
35 40 45
Ala Gly Ile Glu Trp Val Pro Thr Ser Met Thr Ala Tyr Leu Ala Gly
50 55 60
Gly Met Phe Leu Gln Trp Leu Leu Gly Pro Leu Ser Asp Arg Ile Gly
65 70 75 80
Arg Arg Pro Val Met Leu Thr Gly Val Val Trp Phe Ile Val Thr Cys
85 90 95
Leu Ala Thr Leu Leu Ala Gln Asn Ile Glu Gln Phe Thr Leu Leu Arg
100 105 110
Phe Leu Gln Gly Val Ser Leu Cys Phe Ile Gly Ala Val Gly Tyr Ala
115 120 125
Ala Ile Gln Glu Ser Phe Glu Glu Ala Val Cys Ile Lys Ile Thr Ala
130 135 140
Leu Met Ala Asn Val Ala Leu Ile Ala Pro Leu Leu Gly Pro Leu Val
145 150 155 160
Gly Ala Ala Trp Val His Val Ala Pro Trp Glu Gly Met Phe Val Leu
165 170 175
Phe Ala Val Leu Ala Ala Ile Ala Phe Phe Gly Leu His Arg Ala Met
180 185 190
Pro Glu Thr Ala Thr Arg Leu Gly Glu Lys Leu Ser Leu Lys Glu Leu
195 200 205
Gly Arg Asp Tyr Lys Ala Val Leu Gln Asn Gly Arg Phe Val Ala Gly
210 215 220
Ala Leu Ala Thr Gly Phe Val Ser Leu Pro Leu Leu Ala Trp Ile Ala
225 230 235 240
Gln Ser Pro Val Ile Ile Ile Ser Gly Glu Lys Leu Ser Ser Tyr Glu
245 250 255
Tyr Gly Leu Leu Gln Val Pro Ile Phe Gly Ala Leu Ile Ile Gly Asn
260 265 270
Leu Val Leu Ala Arg Leu Thr Ser Arg Arg Thr Val Arg Ser Leu Ile
275 280 285
Ile Met Gly Gly Trp Pro Ile Ala Ala Gly Leu Ile Leu Ala Ala Val
290 295 300
Ala Thr Val Ala Ser Ser His Ala Tyr Leu Trp Met Thr Ala Gly Leu
305 310 315 320
Ser Ile Tyr Ala Phe Gly Ile Gly Val Ala Asn Ala Gly Leu Val Arg
325 330 335
Leu Thr Leu Phe Ala Ser Glu Met Ser Lys Gly Thr Val Ser Ala Ala
340 345 350
Met Gly Met Leu Gln Met Leu Ile Phe Thr Val Gly Ile Glu Val Ser
355 360 365
Lys His Ala Tyr Ala Leu Gly Gly Asn Gly Leu Phe Ser Leu Phe Asn
370 375 380
Leu Ala Asn Gly Val Leu Trp Val Gly Leu Met Val Val Phe Leu Lys
385 390 395 400
Asp Lys Arg Val Gly Asn Ala Leu Gln Pro
405 410
<210> 60
<211> 410
<212> PRT
<213> 大肠杆菌菌株AMC_967
<400> 60
Met Gln Asn Lys Leu Ala Ser Gly Ala Arg Leu Gly Arg Gln Ala Leu
1 5 10 15
Leu Phe Pro Leu Cys Leu Val Leu Tyr Glu Phe Ser Thr Tyr Ile Gly
20 25 30
Asn Asp Met Ile Gln Pro Gly Met Leu Ala Val Val Glu Gln Tyr Gln
35 40 45
Ala Gly Ile Asp Trp Val Pro Thr Ser Met Thr Ala Tyr Leu Ala Gly
50 55 60
Gly Met Phe Leu Gln Trp Leu Leu Gly Pro Leu Ser Asp Arg Ile Gly
65 70 75 80
Arg Arg Pro Val Met Leu Ala Gly Val Val Trp Phe Ile Ile Thr Cys
85 90 95
Leu Ala Ile Leu Leu Ala Gln Asn Ile Glu Gln Phe Thr Leu Leu Arg
100 105 110
Phe Leu Gln Gly Ile Ser Leu Cys Phe Ile Gly Ala Val Gly Tyr Ala
115 120 125
Ala Ile Gln Glu Ser Phe Glu Glu Ala Val Cys Ile Lys Ile Thr Ala
130 135 140
Leu Met Ala Asn Val Ala Leu Ile Ala Pro Leu Leu Gly Pro Leu Val
145 150 155 160
Gly Ala Ala Trp Ile His Val Leu Pro Trp Glu Gly Met Phe Val Leu
165 170 175
Phe Ala Ala Leu Ala Ala Ile Ser Phe Phe Gly Leu Gln Arg Ala Met
180 185 190
Pro Glu Thr Ala Thr Arg Ile Gly Glu Lys Leu Ser Leu Lys Glu Leu
195 200 205
Gly Arg Asp Tyr Lys Leu Val Leu Lys Asn Gly Arg Phe Val Ala Gly
210 215 220
Ala Leu Ala Leu Gly Phe Val Ser Leu Pro Leu Leu Ala Trp Ile Ala
225 230 235 240
Gln Ser Pro Ile Ile Ile Ile Thr Gly Glu Gln Leu Ser Ser Tyr Glu
245 250 255
Tyr Gly Leu Leu Gln Val Pro Ile Phe Gly Ala Leu Ile Ala Gly Asn
260 265 270
Leu Leu Leu Ala Arg Leu Thr Ser Arg Arg Thr Val Arg Ser Leu Ile
275 280 285
Ile Met Gly Gly Trp Pro Ile Met Ile Gly Leu Leu Val Ala Ala Ala
290 295 300
Ala Thr Val Ile Ser Ser His Ala Tyr Leu Trp Met Ala Ala Gly Leu
305 310 315 320
Ser Leu Tyr Ala Phe Gly Ile Gly Leu Ala Asn Ala Gly Leu Val Arg
325 330 335
Leu Thr Leu Phe Ala Ser Asp Met Ser Lys Gly Thr Val Ser Ala Ala
340 345 350
Met Gly Met Leu Gln Met Leu Ile Phe Thr Val Gly Ile Glu Ile Ser
355 360 365
Lys His Ala Trp Leu Asn Gly Gly Asn Gly Leu Phe Asn Leu Phe Asn
370 375 380
Leu Val Asn Gly Ile Leu Trp Leu Leu Leu Met Val Ile Phe Leu Lys
385 390 395 400
Asp Lys Gln Met Gly Asn Ser His Glu Gly
405 410
<210> 61
<211> 410
<212> PRT
<213> 肺炎克雷伯氏菌(Klebsiella pneumoniae)VAKPC309
<400> 61
Met Gln Asn Tyr Ser Leu Ser Gly Arg Arg Leu Gly Arg Gln Ala Leu
1 5 10 15
Leu Phe Pro Leu Cys Leu Val Leu Tyr Glu Phe Ser Thr Tyr Ile Gly
20 25 30
Asn Asp Met Ile Gln Pro Gly Met Leu Ala Val Val Gln Glu Phe Gln
35 40 45
Val Gly Asn Glu Trp Val Pro Thr Ser Met Thr Ala Tyr Leu Ala Gly
50 55 60
Gly Met Phe Leu Gln Trp Leu Leu Gly Pro Leu Ser Asp Arg Ile Gly
65 70 75 80
Arg Arg Pro Val Met Leu Thr Gly Val Val Trp Phe Ile Val Thr Cys
85 90 95
Leu Ala Thr Leu Leu Ala Gln Thr Ile Glu Gln Phe Thr Leu Leu Arg
100 105 110
Phe Leu Gln Gly Ile Ser Leu Cys Phe Ile Gly Ala Val Gly Tyr Ala
115 120 125
Ala Ile Gln Glu Ser Phe Glu Glu Ala Val Cys Ile Lys Ile Thr Ala
130 135 140
Leu Met Ala Asn Val Ala Leu Ile Ala Pro Leu Leu Gly Pro Leu Val
145 150 155 160
Gly Ala Ala Trp Val His Val Leu Pro Trp Glu Met Met Phe Val Leu
165 170 175
Phe Ala Val Leu Ala Ala Ile Ser Phe Phe Gly Leu Gln Arg Ala Met
180 185 190
Pro Glu Thr Ala Thr Arg Leu Gly Glu Lys Leu Ser Val Lys Glu Leu
195 200 205
Gly Arg Asp Tyr Arg Leu Val Leu Lys Asn Leu Arg Phe Val Ala Gly
210 215 220
Ala Leu Ala Thr Gly Phe Val Ser Leu Pro Leu Leu Ala Trp Ile Ala
225 230 235 240
Gln Ser Pro Val Ile Ile Ile Ser Gly Glu Gln Ala Thr Ser Tyr Glu
245 250 255
Tyr Gly Met Leu Gln Val Pro Ile Phe Gly Ala Leu Ile Ala Gly Asn
260 265 270
Leu Val Leu Ala Arg Leu Thr Ala Arg Arg Thr Val Arg Ser Leu Ile
275 280 285
Ile Met Gly Gly Trp Pro Ile Met Phe Gly Leu Ile Leu Ser Ala Ala
290 295 300
Ala Thr Val Val Ser Ser His Ala Tyr Leu Trp Met Thr Ala Gly Leu
305 310 315 320
Ser Phe Tyr Ala Phe Gly Ile Gly Leu Ala Asn Ala Gly Leu Val Arg
325 330 335
Leu Thr Leu Phe Ala Ser Glu Met Ser Lys Gly Thr Val Ser Ala Ala
340 345 350
Met Gly Met Leu Gln Met Leu Ile Phe Thr Val Gly Ile Glu Leu Ser
355 360 365
Lys His Ala Tyr Glu Leu Gly Gly Asn Gly Leu Phe Ser Leu Phe Asn
370 375 380
Leu Leu Gly Gly Val Leu Trp Leu Gly Leu Met Ile Tyr Phe Leu Lys
385 390 395 400
Asp Lys Ser Val Gly Asn Ser Gln Gln Gly
405 410
<210> 62
<211> 411
<212> PRT
<213> 产酸克雷伯氏菌(Klebsiella oxytoca)菌株4928STDY7071490
<400> 62
Met His Asn Ser Ser Leu Ser Gly Lys Arg Leu Gly Arg Gln Ala Leu
1 5 10 15
Leu Phe Pro Leu Cys Leu Val Leu Tyr Glu Phe Ala Thr Tyr Ile Gly
20 25 30
Asn Asp Met Ile Gln Pro Gly Met Leu Ser Val Val Glu Glu Phe Gly
35 40 45
Val Gly Asn Glu Trp Val Pro Thr Ser Met Thr Ala Tyr Leu Ala Gly
50 55 60
Gly Met Phe Leu Gln Trp Leu Leu Gly Pro Leu Ser Asp Arg Ile Gly
65 70 75 80
Arg Arg Pro Val Met Leu Thr Gly Val Val Trp Phe Ile Val Thr Cys
85 90 95
Leu Ala Thr Leu Leu Ala Gln Thr Ile Glu Gln Phe Thr Leu Leu Arg
100 105 110
Phe Leu Gln Gly Ile Ser Leu Cys Phe Ile Gly Ala Val Gly Tyr Ala
115 120 125
Ala Ile Gln Glu Ser Phe Glu Glu Ala Val Cys Ile Lys Ile Thr Ala
130 135 140
Leu Met Ala Asn Val Ala Leu Ile Ala Pro Leu Leu Gly Pro Leu Val
145 150 155 160
Gly Ala Ala Trp Val His Ile Leu Pro Trp Glu Met Met Phe Val Leu
165 170 175
Phe Ala Val Leu Ala Ala Ile Ala Phe Phe Gly Leu Gln Arg Ala Met
180 185 190
Pro Glu Thr Ala Thr Arg Met Gly Glu Lys Leu Ser Val Lys Glu Leu
195 200 205
Gly Arg Asp Tyr Arg Glu Val Leu Lys Asn Leu Arg Phe Val Ala Gly
210 215 220
Ala Leu Ala Thr Gly Phe Val Ser Leu Pro Leu Leu Ala Trp Ile Ala
225 230 235 240
Gln Ser Pro Val Ile Ile Ile Ser Gly Glu Gln Ala Thr Ser Tyr Glu
245 250 255
Tyr Gly Leu Leu Gln Val Pro Ile Phe Gly Ala Leu Ile Ala Gly Asn
260 265 270
Leu Val Leu Ala Arg Gln Thr Ser Arg Lys Thr Val Arg Ser Leu Ile
275 280 285
Ile Leu Gly Gly Trp Pro Ile Met Leu Gly Leu Leu Ile Ser Ala Val
290 295 300
Ala Thr Val Ala Ser Thr His Ala Tyr Leu Trp Met Thr Ala Gly Leu
305 310 315 320
Ser Val Tyr Ala Phe Gly Ile Gly Leu Ala Asn Ala Gly Leu Val Arg
325 330 335
Leu Thr Leu Phe Ala Ser Glu Met Ser Lys Gly Thr Val Ser Ala Ala
340 345 350
Met Gly Met Leu Gln Met Leu Ile Phe Thr Val Gly Ile Glu Val Ser
355 360 365
Lys His Ala Tyr Glu Ser Gly Gly Ser Gly Leu Phe Ser Leu Leu Asn
370 375 380
Leu Leu Ser Gly Val Leu Trp Leu Ala Met Met Val Tyr Phe Leu Lys
385 390 395 400
Asp Lys Arg Val Gly Ser Ser Leu Glu Pro Gln
405 410
<210> 63
<211> 411
<212> PRT
<213> 密歇根克雷伯氏菌(Klebsiella michiganensis)菌株A2
<400> 63
Met His Asn Ser Ser Leu Ser Gly Lys Arg Leu Gly Arg Gln Ala Leu
1 5 10 15
Leu Phe Pro Leu Cys Leu Val Leu Tyr Glu Phe Ala Thr Tyr Ile Gly
20 25 30
Asn Asp Met Ile Gln Pro Gly Met Leu Ser Val Val Glu Glu Phe Gly
35 40 45
Val Gly Asn Glu Trp Val Pro Thr Ser Met Thr Ala Tyr Leu Ala Gly
50 55 60
Gly Met Phe Leu Gln Trp Leu Leu Gly Pro Leu Ser Asp Arg Ile Gly
65 70 75 80
Arg Arg Pro Val Met Leu Thr Gly Val Val Trp Phe Ile Val Thr Cys
85 90 95
Leu Ala Thr Leu Leu Ala Gln Thr Ile Glu Gln Phe Thr Leu Leu Arg
100 105 110
Phe Leu Gln Gly Ile Ser Leu Cys Phe Ile Gly Ala Val Gly Tyr Ala
115 120 125
Ala Ile Gln Glu Ser Phe Glu Glu Ala Val Cys Ile Lys Ile Thr Ala
130 135 140
Leu Met Ala Asn Val Ala Leu Ile Ala Pro Leu Leu Gly Pro Leu Val
145 150 155 160
Gly Ala Ala Trp Val His Leu Leu Leu Trp Glu Met Met Phe Val Leu
165 170 175
Phe Ala Val Leu Ala Ala Ile Ala Phe Phe Gly Leu Gln Lys Ala Met
180 185 190
Pro Glu Thr Ala Thr Arg Met Gly Glu Lys Leu Ser Val Lys Glu Leu
195 200 205
Gly Arg Asp Tyr Arg Glu Val Leu Lys Asn Leu Arg Phe Val Ala Gly
210 215 220
Ala Leu Ala Thr Gly Phe Val Ser Leu Pro Leu Leu Ala Trp Ile Ala
225 230 235 240
Gln Ser Pro Val Ile Ile Ile Ser Gly Glu Gln Ala Thr Ser Tyr Glu
245 250 255
Tyr Gly Leu Leu Gln Val Pro Ile Phe Gly Ala Leu Ile Ala Gly Asn
260 265 270
Leu Val Leu Ala Arg Gln Thr Ser Arg Lys Thr Val Arg Ser Leu Ile
275 280 285
Ile Leu Gly Gly Trp Pro Ile Met Ile Gly Leu Leu Ile Ser Ala Val
290 295 300
Ala Thr Val Ala Ser Thr His Ala Tyr Leu Trp Met Thr Ala Gly Leu
305 310 315 320
Ser Val Tyr Ala Phe Gly Ile Gly Leu Ala Asn Ala Gly Leu Val Arg
325 330 335
Leu Thr Leu Phe Ala Ser Glu Met Ser Lys Gly Thr Val Ser Ala Ala
340 345 350
Met Gly Met Leu Gln Met Leu Ile Phe Thr Val Gly Ile Glu Val Ser
355 360 365
Lys His Ala Tyr Glu Ala Gly Gly Ser Gly Leu Phe Ser Leu Leu Asn
370 375 380
Leu Leu Ser Gly Val Leu Trp Leu Ala Met Thr Val Tyr Phe Leu Lys
385 390 395 400
Asp Lys Arg Val Gly Ser Ser Leu Glu Pro Gln
405 410
<210> 64
<211> 409
<212> PRT
<213> Pluralibacter gergoviae 菌株FDAARGOS_186
<400> 64
Met Gln Asn His Ala Leu Ser Gly Lys Arg Leu Gly Arg Ser Ala Leu
1 5 10 15
Leu Phe Pro Leu Cys Leu Val Leu Tyr Glu Phe Ser Thr Tyr Ile Gly
20 25 30
Asn Asp Met Ile Gln Pro Gly Met Leu Ala Val Val Ala Glu Phe Gln
35 40 45
Ala Ser Thr Glu Trp Val Pro Thr Ser Met Thr Ala Tyr Leu Ala Gly
50 55 60
Gly Met Phe Leu Gln Trp Leu Leu Gly Pro Leu Ser Asp Arg Val Gly
65 70 75 80
Arg Arg Pro Val Met Leu Ala Gly Val Val Trp Phe Ile Leu Thr Cys
85 90 95
Leu Ala Thr Leu Leu Val Gln Asn Ile Glu Gln Phe Thr Leu Leu Arg
100 105 110
Phe Leu Gln Gly Cys Gly Leu Cys Phe Val Gly Ala Val Gly Tyr Ala
115 120 125
Ala Ile Gln Glu Ser Tyr Glu Glu Ala Val Ser Ile Lys Ile Thr Ala
130 135 140
Leu Met Ala Asn Val Ala Leu Ile Ala Pro Leu Leu Gly Pro Leu Val
145 150 155 160
Gly Ala Ala Trp Val His Ala Ala Ser Trp Glu Ser Met Phe Val Leu
165 170 175
Phe Ala Ala Leu Ala Ala Val Ala Phe Val Gly Leu Gln Arg Ala Met
180 185 190
Pro Glu Thr Ala Thr Arg Leu Gly Glu Arg Leu Ser Leu Lys Glu Leu
195 200 205
Gly His Asp Tyr Gly Leu Val Leu Lys Asn Leu Arg Phe Val Ala Gly
210 215 220
Ala Leu Ala Thr Gly Phe Ile Ser Leu Pro Leu Leu Ala Trp Ile Ala
225 230 235 240
Gln Ser Pro Val Ile Ile Ile Ser Gly Glu Gln Ala Ser Ser Tyr Glu
245 250 255
Tyr Gly Met Leu Gln Val Pro Ile Phe Gly Ala Leu Ile Ala Gly Asn
260 265 270
Leu Val Leu Ala Lys Leu Thr Ala Arg Cys Ser Val Arg Trp Leu Ile
275 280 285
Ile Ala Gly Gly Trp Pro Ala Met Thr Gly Leu Leu Val Ala Ala Leu
290 295 300
Ala Thr Val Val Ser Ser His Ala Tyr Leu Trp Met Thr Ala Gly Leu
305 310 315 320
Ser Ile Tyr Ala Phe Gly Ile Gly Ile Ser Asn Ala Gly Leu Val Arg
325 330 335
Leu Thr Leu Phe Ala Ser Glu Met Ser Lys Gly Thr Val Ser Ser Ala
340 345 350
Met Gly Val Leu Gln Met Leu Ile Phe Thr Val Gly Ile Glu Ile Ser
355 360 365
Lys His Ala Tyr Gln Leu Gly Gly Ser Gly Leu Phe Ser Leu Phe Asn
370 375 380
Leu Leu Ser Gly Ala Leu Trp Leu Gly Leu Ile Ile Tyr Phe Leu Lys
385 390 395 400
Asp Lys Arg Val Gly Ser Gly Asn Arg
405
<210> 65
<211> 410
<212> PRT
<213> 抗坏血克吕沃尔氏菌(Kluyvera ascorbata)ATCC 33433
<400> 65
Met Asp Thr Ser Ser Ser Arg Lys Arg Leu Gly Arg Lys Ala Ile Leu
1 5 10 15
Phe Pro Leu Cys Leu Val Leu Tyr Glu Phe Ser Thr Tyr Ile Gly Asn
20 25 30
Asp Met Ile Gln Pro Gly Met Leu Ala Val Val Lys Glu Phe Asn Ala
35 40 45
Gly Asn Glu Trp Val Pro Thr Ser Met Thr Ala Tyr Leu Ala Gly Gly
50 55 60
Met Phe Leu Gln Trp Leu Leu Gly Pro Leu Ser Asp Arg Ile Gly Arg
65 70 75 80
Arg Pro Val Met Leu Thr Gly Val Ile Trp Phe Ile Val Thr Cys Leu
85 90 95
Ala Thr Leu Leu Val Asn Asn Ile Glu Gln Phe Thr Phe Leu Arg Phe
100 105 110
Leu Gln Gly Val Ser Leu Cys Phe Ile Gly Ala Val Gly Tyr Ala Ala
115 120 125
Ile Gln Glu Ser Phe Asp Glu Ala Thr Cys Ile Lys Ile Thr Ala Leu
130 135 140
Met Ala Asn Val Ala Leu Ile Ala Pro Leu Leu Gly Pro Leu Val Gly
145 150 155 160
Ala Ala Trp Ile His Val Ala Arg Trp Glu Gly Met Phe Val Leu Phe
165 170 175
Ala Ala Leu Ser Ala Ile Ala Phe Val Gly Leu Phe Lys Ser Met Pro
180 185 190
Glu Thr Ala Thr Arg Ile Gly Glu Thr Leu Ser Leu Lys Ala Leu Gly
195 200 205
Arg Asp Tyr Arg Glu Val Leu Lys Asn Gly Arg Phe Val Ala Gly Ala
210 215 220
Leu Ala Thr Gly Phe Val Ser Leu Pro Leu Leu Ala Trp Ile Ala Gln
225 230 235 240
Ser Pro Val Ile Ile Ile Ser Gly Glu His Ala Ser Ser Tyr Glu Tyr
245 250 255
Gly Leu Leu Gln Val Pro Ile Phe Gly Ala Leu Ile Leu Gly Asn Leu
260 265 270
Val Leu Ala Arg Leu Thr Ser Arg Arg Thr Val Arg Ala Leu Ile Ile
275 280 285
Ala Gly Gly Tyr Pro Ile Met Phe Gly Leu Val Leu Ala Ala Ala Ala
290 295 300
Thr Val Val Ser Ser His Ala Tyr Leu Trp Met Thr Ala Gly Leu Ser
305 310 315 320
Phe Tyr Ala Phe Gly Ile Gly Leu Ala Asn Ala Gly Leu Val Arg Leu
325 330 335
Thr Leu Phe Ala Ser Asp Met Ser Lys Gly Thr Val Ser Ala Ala Met
340 345 350
Gly Met Leu Gln Met Leu Ile Phe Thr Val Gly Ile Glu Leu Ser Lys
355 360 365
His Cys Tyr Glu Leu Gly Gly Ile Gly Leu Phe Ser Leu Phe Asn Leu
370 375 380
Ala Gly Gly Leu Leu Trp Leu Gly Leu Met Thr Met Phe Leu Arg Asp
385 390 395 400
Lys Ala Val Gly Ser Gly Leu Gln Pro Gln
405 410
<210> 66
<211> 409
<212> PRT
<213> 神户肠杆菌(Enterobacter kobei)
<400> 66
Met Gln Asn His Ser Leu Pro Gly Arg Arg Leu Gly Arg Gln Ala Leu
1 5 10 15
Leu Phe Pro Leu Cys Leu Val Leu Tyr Glu Phe Ser Thr Tyr Ile Ala
20 25 30
Asn Asp Met Ile Gln Pro Gly Met Leu Ala Val Val Glu Gln Tyr Asn
35 40 45
Ala Gly Ile Glu Trp Val Pro Thr Ser Met Thr Ala Tyr Leu Ala Gly
50 55 60
Gly Met Phe Leu Gln Trp Leu Leu Gly Pro Leu Ser Asp Arg Ile Gly
65 70 75 80
Arg Arg Pro Val Met Leu Thr Gly Val Val Trp Phe Ile Val Thr Cys
85 90 95
Leu Ala Thr Leu Leu Ala Gln Asp Ile Glu Gln Phe Thr Leu Leu Arg
100 105 110
Phe Leu Gln Gly Val Ser Leu Cys Phe Ile Gly Ala Val Gly Tyr Ala
115 120 125
Ala Ile Gln Glu Ser Phe Asp Glu Ala Thr Cys Ile Lys Ile Thr Ala
130 135 140
Leu Met Ala Asn Val Ala Leu Ile Ala Pro Leu Leu Gly Pro Leu Val
145 150 155 160
Gly Ala Ala Trp Val His Ala Ala Pro Trp Glu Gly Met Phe Val Leu
165 170 175
Phe Ala Val Leu Ala Ala Ile Ala Phe Phe Gly Leu His Arg Ala Met
180 185 190
Pro Glu Thr Ala Thr Arg Leu Gly Glu Pro Leu Ser Leu Asn Ala Leu
195 200 205
Gly Arg Asp Tyr Lys Ala Val Leu Lys Asn Gly Arg Phe Val Ala Gly
210 215 220
Ala Leu Ala Thr Gly Phe Val Ser Leu Pro Leu Leu Ala Trp Ile Ala
225 230 235 240
Gln Ser Pro Ile Ile Ile Ile Ser Ala Glu Gly Met Ser Ser Tyr Glu
245 250 255
Tyr Gly Leu Leu Gln Val Pro Ile Phe Gly Ala Leu Ile Ile Gly Asn
260 265 270
Leu Val Leu Ala Arg Leu Thr Ser Arg Arg Thr Val Arg Ser Leu Ile
275 280 285
Ile Met Gly Gly Gly Pro Ile Val Ala Gly Leu Leu Val Ala Ala Val
290 295 300
Ala Thr Val Ala Ser Ser His Ala Tyr Leu Trp Met Thr Ala Gly Leu
305 310 315 320
Ser Ile Tyr Ala Phe Gly Ile Gly Leu Ala Asn Ala Gly Leu Val Arg
325 330 335
Leu Thr Leu Phe Ala Ser Asp Met Ser Lys Gly Thr Val Ser Ala Ala
340 345 350
Met Gly Met Leu Gln Met Ala Ile Phe Thr Val Gly Ile Glu Val Ser
355 360 365
Lys His Ala Phe Leu Ala Gly Gly Asn Gly Leu Phe Ser Leu Phe Asn
370 375 380
Leu Ala Asn Gly Leu Ile Trp Leu Ala Leu Met Val Val Phe Leu Lys
385 390 395 400
Asp Lys Thr Val Gly Asn Ala Leu Ser
405
<210> 67
<211> 409
<212> PRT
<213> 莱略特菌属(Lelliottia sp.)WB101
<400> 67
Met Leu Asn Arg Ser Ser Ser Gly Asn Arg Leu Gly Arg Gln Ala Leu
1 5 10 15
Leu Phe Pro Leu Cys Leu Val Leu Tyr Glu Phe Ser Thr Tyr Ile Gly
20 25 30
Asn Asp Met Ile Gln Pro Gly Met Leu Ala Val Val Glu Gln Tyr Asn
35 40 45
Ala Gly Ile Glu Trp Val Pro Thr Ser Met Thr Ala Tyr Leu Ala Gly
50 55 60
Gly Met Phe Leu Gln Trp Leu Leu Gly Pro Leu Ser Asp Arg Ile Gly
65 70 75 80
Arg Arg Pro Val Met Leu Thr Gly Val Val Trp Phe Ile Val Thr Cys
85 90 95
Leu Ala Ile Leu Leu Ala Gln Thr Ile Glu Gln Phe Thr Leu Leu Arg
100 105 110
Phe Leu Gln Gly Val Ser Leu Cys Phe Ile Gly Ala Val Gly Tyr Ala
115 120 125
Ala Ile Gln Glu Ser Phe Glu Glu Ala Val Cys Ile Lys Ile Thr Ala
130 135 140
Leu Met Ala Asn Val Ala Leu Ile Ala Pro Leu Leu Gly Pro Leu Val
145 150 155 160
Gly Ala Ala Trp Val His Val Ala Pro Trp Glu Gly Met Phe Val Leu
165 170 175
Phe Ala Ala Leu Ala Ala Ile Ser Phe Phe Gly Leu His Arg Ala Met
180 185 190
Pro Glu Thr Ala Thr Arg Leu Gly Glu Lys Leu Ser Leu Lys Glu Leu
195 200 205
Gly Arg Asp Tyr Lys Glu Val Leu Arg Asn Gly Arg Phe Val Ala Gly
210 215 220
Ala Leu Ala Thr Gly Phe Val Ser Leu Pro Leu Leu Ala Trp Ile Ala
225 230 235 240
Gln Ser Pro Val Ile Ile Ile Ser Gly Glu Lys Leu Ser Ser Tyr Glu
245 250 255
Tyr Gly Leu Leu Gln Val Pro Val Phe Gly Ala Leu Ile Ile Gly Asn
260 265 270
Leu Val Leu Ala Arg Leu Thr Ser Arg Arg Ser Val Arg Ser Leu Ile
275 280 285
Ile Met Gly Gly Trp Pro Ile Val Ala Gly Leu Val Val Ala Ala Val
290 295 300
Ala Thr Val Ala Ser Ser His Ala Tyr Leu Trp Met Thr Ala Gly Leu
305 310 315 320
Ser Ile Tyr Ala Phe Gly Ile Gly Leu Ala Asn Ala Gly Leu Val Arg
325 330 335
Leu Thr Leu Phe Ala Ser Glu Met Ser Lys Gly Thr Val Ser Ala Ala
340 345 350
Met Gly Met Leu Gln Met Leu Ile Phe Thr Val Gly Ile Glu Val Ser
355 360 365
Lys His Ala Tyr Ser Phe Gly Gly Asn Gly Leu Phe Ser Leu Phe Asn
370 375 380
Leu Ala Asn Gly Val Leu Trp Leu Gly Leu Met Val Met Phe Leu Lys
385 390 395 400
Asp Lys Arg Val Gly Ser Ala Leu Gln
405
<210> 68
<211> 410
<212> PRT
<213> 弗氏柠檬酸杆菌(Citrobacter freundii)
<400> 68
Met Gln Asn Arg Leu Ser Ser Gly Ala Arg Leu Gly Arg Gln Ala Leu
1 5 10 15
Leu Phe Pro Leu Cys Leu Val Leu Tyr Glu Phe Ser Thr Tyr Ile Gly
20 25 30
Asn Asp Met Ile Gln Pro Gly Met Leu Ala Val Val Glu Gln Tyr Gln
35 40 45
Ala Gly Leu Asp Trp Val Pro Thr Ser Met Thr Ala Tyr Leu Ala Gly
50 55 60
Gly Met Phe Leu Gln Trp Leu Leu Gly Pro Leu Ser Asp Arg Val Gly
65 70 75 80
Arg Arg Pro Val Met Leu Thr Gly Val Val Trp Phe Ile Val Thr Cys
85 90 95
Leu Ala Thr Leu Phe Ala Gln Asn Ile Glu Gln Phe Thr Phe Leu Arg
100 105 110
Phe Leu Gln Gly Ile Ser Leu Cys Phe Ile Gly Ala Val Gly Tyr Ala
115 120 125
Ala Ile Gln Glu Ser Phe Glu Glu Ala Val Cys Ile Lys Ile Thr Ala
130 135 140
Leu Met Ala Asn Val Ala Leu Ile Ala Pro Leu Leu Gly Pro Leu Val
145 150 155 160
Gly Ala Ala Trp Val His Val Leu Pro Trp Glu Gly Met Phe Val Leu
165 170 175
Phe Ala Ala Leu Ala Ala Ile Ala Phe Phe Gly Leu Gln Arg Ala Met
180 185 190
Pro Glu Thr Ala Thr Arg Leu Gly Glu Lys Leu Ser Ile Lys Glu Leu
195 200 205
Gly Lys Asp Tyr Lys Leu Val Leu Lys Asn Val Arg Phe Val Ala Gly
210 215 220
Ala Leu Ala Leu Gly Phe Val Ser Leu Pro Leu Leu Ala Trp Ile Ala
225 230 235 240
Gln Ser Pro Ile Ile Ile Ile Ser Gly Glu His Leu Ser Ser Tyr Glu
245 250 255
Tyr Gly Leu Leu Gln Val Pro Ile Phe Gly Ala Leu Ile Ala Gly Asn
260 265 270
Leu Val Leu Ala Arg Leu Thr Ser Arg Arg Thr Val Arg Ser Leu Ile
275 280 285
Ile Met Gly Gly Trp Pro Ile Ser Val Gly Leu Ile Ile Ala Ala Ala
290 295 300
Ala Thr Val Val Ser Ser His Ala Tyr Leu Trp Met Thr Ala Gly Leu
305 310 315 320
Ser Leu Tyr Ala Phe Gly Ile Gly Val Ala Asn Ala Gly Leu Val Arg
325 330 335
Leu Thr Leu Phe Ala Ser Glu Met Ser Lys Gly Thr Val Ser Ala Ala
340 345 350
Met Gly Met Leu Gln Met Leu Ile Phe Thr Val Gly Ile Glu Leu Ser
355 360 365
Lys His Ala Tyr Leu Leu Gly Gly Asn Gly Leu Phe Ser Leu Phe Asn
370 375 380
Leu Ala Ser Gly Val Leu Trp Leu Ile Leu Met Val Ile Phe Leu Lys
385 390 395 400
Asp Lys Arg Val Gly Asn Ser Arg Glu Gly
405 410
<210> 69
<211> 410
<212> PRT
<213> 肠道沙门氏菌Salamae亚种(Salmonella enterica subsp. Salamae)
<400> 69
Met His Asn Arg Leu Gln Ser Gly Gly Arg Leu Gly Arg Gln Ala Leu
1 5 10 15
Leu Phe Pro Leu Cys Leu Val Leu Tyr Glu Phe Ser Thr Tyr Ile Gly
20 25 30
Asn Asp Met Ile Gln Pro Gly Met Leu Ala Val Val Ala Gln Tyr Gln
35 40 45
Ala Ser Leu Asp Trp Val Pro Thr Ser Met Thr Ala Tyr Leu Ala Gly
50 55 60
Gly Met Phe Leu Gln Trp Leu Leu Gly Pro Leu Ser Asp Arg Ile Gly
65 70 75 80
Arg Arg Pro Val Met Leu Ala Gly Val Val Trp Phe Ile Val Thr Cys
85 90 95
Leu Ala Thr Leu Leu Ala Lys Asn Ile Glu Gln Phe Thr Phe Leu Arg
100 105 110
Phe Leu Gln Gly Ile Ser Leu Cys Phe Ile Gly Ala Val Gly Tyr Ala
115 120 125
Ala Ile Gln Glu Ser Phe Glu Glu Ala Val Cys Ile Lys Ile Thr Ala
130 135 140
Leu Met Ala Asn Val Ala Leu Ile Ala Pro Leu Leu Gly Pro Leu Val
145 150 155 160
Gly Ala Ala Trp Val His Val Leu Pro Trp Glu Gly Met Phe Ile Leu
165 170 175
Phe Ala Val Leu Ala Ala Ile Ala Phe Phe Gly Leu Gln Arg Ala Met
180 185 190
Pro Glu Thr Ala Thr Arg Arg Gly Glu Thr Leu Ser Phe Lys Val Leu
195 200 205
Gly Arg Asp Tyr Arg Leu Val Ile Lys Asn Arg Arg Phe Val Ala Gly
210 215 220
Ala Leu Ala Leu Gly Phe Val Ser Leu Pro Leu Leu Ala Trp Ile Ala
225 230 235 240
Gln Ser Pro Ile Ile Ile Ile Ser Gly Glu Gln Leu Ser Ser Tyr Glu
245 250 255
Tyr Gly Leu Leu Gln Val Pro Val Phe Gly Ala Leu Ile Ala Gly Asn
260 265 270
Leu Val Leu Ala Arg Leu Thr Ser Arg Arg Thr Val Arg Ser Leu Ile
275 280 285
Val Met Gly Gly Trp Pro Ile Val Ala Gly Leu Ile Ile Ala Ala Ala
290 295 300
Ala Thr Val Val Ser Ser His Ala Tyr Leu Trp Met Thr Ala Gly Leu
305 310 315 320
Ser Val Tyr Ala Phe Gly Ile Gly Leu Ala Asn Ala Gly Leu Val Arg
325 330 335
Leu Thr Leu Phe Ser Ser Asp Met Ser Lys Gly Thr Val Ser Ala Ala
340 345 350
Met Gly Met Leu Gln Met Leu Ile Phe Thr Val Gly Ile Glu Val Ser
355 360 365
Lys His Ala Trp Leu Ser Gly Gly Asn Gly Leu Phe Ser Leu Phe Asn
370 375 380
Leu Ala Asn Gly Ile Leu Trp Leu Leu Leu Met Leu Val Phe Leu Lys
385 390 395 400
Asp Lys Arg Thr Gly Asp Ser Gln Thr Gly
405 410
<210> 70
<211> 408
<212> PRT
<213> 副痢疾杆菌(Shigella flexneri)
<400> 70
Met Gln Asn Lys Leu Ala Ser Gly Ala Arg Leu Gly Arg Gln Ala Leu
1 5 10 15
Leu Phe Pro Leu Cys Leu Val Leu Tyr Glu Phe Ser Thr Tyr Ile Gly
20 25 30
Asn Asp Met Ile Gln Pro Gly Met Leu Ala Val Val Glu Gln Tyr Gln
35 40 45
Ala Gly Ile Asp Trp Val Pro Thr Ser Met Thr Ala Tyr Leu Ala Gly
50 55 60
Gly Met Phe Leu Gln Trp Leu Leu Gly Pro Leu Ser Asp Arg Ile Gly
65 70 75 80
Arg Arg Pro Val Met Leu Ala Gly Val Val Trp Phe Ile Val Thr Cys
85 90 95
Leu Ala Ile Leu Leu Ala Gln Asn Ile Glu Gln Phe Thr Leu Leu Arg
100 105 110
Phe Leu Gln Gly Ile Ser Phe Cys Phe Ile Gly Ala Val Gly Tyr Ala
115 120 125
Ala Ile Gln Glu Ser Phe Glu Glu Ala Val Cys Ile Lys Ile Thr Ala
130 135 140
Leu Met Ala Asn Val Ala Leu Ile Ala Pro Leu Leu Gly Pro Leu Val
145 150 155 160
Gly Ala Ala Trp Ile His Val Leu Pro Trp Glu Gly Met Phe Val Leu
165 170 175
Phe Ala Ala Leu Ala Ala Ile Ser Phe Phe Gly Leu Gln Arg Ala Met
180 185 190
Pro Glu Thr Ala Met Arg Ile Gly Glu Lys Leu Ser Leu Lys Glu Leu
195 200 205
Gly Arg Asp Tyr Lys Leu Val Leu Lys Asn Gly Arg Phe Val Ala Gly
210 215 220
Ala Leu Gly Phe Val Ser Leu Pro Leu Leu Ala Trp Ile Ala Gln Ser
225 230 235 240
Pro Ile Ile Ile Ile Thr Gly Glu Gln Leu Ser Ser Tyr Glu Tyr Gly
245 250 255
Leu Leu Gln Val Pro Ile Phe Gly Ala Leu Ile Ala Gly Asn Leu Leu
260 265 270
Leu Ala Arg Leu Thr Ser Arg Arg Thr Val Arg Ser Leu Ile Ile Met
275 280 285
Gly Gly Trp Pro Ile Met Ile Gly Leu Leu Val Ala Ala Ala Ala Thr
290 295 300
Val Ile Ser Ser His Ala Tyr Leu Trp Met Thr Ala Gly Leu Ser Ile
305 310 315 320
Tyr Ala Phe Gly Ile Gly Leu Ala Asn Ala Gly Leu Val Arg Leu Thr
325 330 335
Leu Phe Ala Ser Asp Met Ser Lys Gly Thr Val Ser Ala Ala Met Gly
340 345 350
Met Leu Gln Met Leu Ile Phe Thr Val Gly Ile Glu Ile Ser Lys His
355 360 365
Ala Trp Leu Asn Gly Gly Asn Gly Leu Phe Asn Leu Phe Asn Leu Val
370 375 380
Asn Gly Ile Leu Trp Leu Ser Leu Met Val Ile Phe Leu Lys Asp Lys
385 390 395 400
Gln Met Gly Asn Ser His Gly Gly
405
<210> 71
<211> 410
<212> PRT
<213> 阪崎肠杆菌(Cronobacter sakazakii)菌株MOD1_LR634
<400> 71
Met Gln Thr His Ala Asn Arg Thr Gly Arg Leu Gly Arg Gln Ala Leu
1 5 10 15
Leu Phe Pro Leu Cys Leu Val Leu Tyr Glu Phe Ser Thr Tyr Ile Gly
20 25 30
Asn Asp Met Ile Gln Pro Gly Met Leu Ala Val Val Glu Gln Tyr Gln
35 40 45
Ala Gly Val Glu Trp Val Pro Thr Ser Met Thr Ala Tyr Leu Ala Gly
50 55 60
Gly Met Phe Leu Gln Trp Leu Leu Gly Pro Leu Ser Asp Arg Ile Gly
65 70 75 80
Arg Arg Pro Val Met Leu Ala Gly Val Ala Trp Phe Ile Val Ala Cys
85 90 95
Leu Ala Thr Leu Leu Ala Gln Asn Ile Glu Gln Phe Thr Val Leu Arg
100 105 110
Phe Leu Gln Gly Ile Ser Leu Cys Phe Ile Gly Ala Val Gly Tyr Ala
115 120 125
Ala Ile Gln Glu Ser Phe Glu Glu Ala Val Cys Ile Lys Ile Thr Ala
130 135 140
Leu Met Ala Asn Val Ala Leu Ile Ala Pro Leu Leu Gly Pro Leu Val
145 150 155 160
Gly Ala Ala Trp Val His Ala Ala Pro Trp Glu Met Met Phe Val Leu
165 170 175
Phe Ala Val Leu Ala Thr Ile Ser Phe Phe Gly Leu Trp Arg Ala Met
180 185 190
Pro Glu Thr Ala Thr Arg Leu Gly Glu Lys Leu Ser Leu Arg Glu Leu
195 200 205
Gly Arg Asp Tyr Lys Ala Val Leu Lys Asn Leu Arg Phe Val Ser Gly
210 215 220
Ala Leu Ala Ile Gly Phe Val Ser Leu Pro Leu Leu Ala Trp Ile Ala
225 230 235 240
Gln Ser Pro Val Ile Ile Ile Ser Gly Glu Gln Met Ser Thr Tyr Glu
245 250 255
Tyr Gly Leu Leu Gln Val Pro Ile Phe Gly Ala Leu Ile Val Gly Asn
260 265 270
Leu Val Leu Ala Lys Leu Thr Ala Arg Arg Ser Val Arg Ser Leu Ile
275 280 285
Val Met Gly Gly Trp Pro Met Met Phe Gly Leu Ala Leu Ala Ala Leu
290 295 300
Ala Thr Val Ile Ser Ser His Ala Tyr Leu Trp Met Thr Ala Gly Leu
305 310 315 320
Ser Ile Tyr Ala Phe Gly Ile Gly Ile Ala Asn Ala Gly Leu Val Arg
325 330 335
Leu Thr Leu Phe Ala Ser Asp Ile Ser Lys Gly Thr Val Ser Ala Ala
340 345 350
Met Gly Met Leu Gln Met Thr Ile Phe Thr Val Gly Ile Glu Ile Ser
355 360 365
Lys His Ala Trp Leu Gly Gly Gly Asn Ala Leu Phe Asn Leu Phe Asn
370 375 380
Phe Ala Ser Gly Leu Leu Trp Leu Gly Leu Met Val Ile Phe Leu Lys
385 390 395 400
Asp Lys Thr Val Gly Thr Arg Pro Glu Ala
405 410
<210> 72
<211> 410
<212> PRT
<213> Cronobacter condimenti 菌株s37
<400> 72
Met Gln Thr His Ala Asn Arg Thr Gly Arg Leu Gly Arg Gln Ala Leu
1 5 10 15
Leu Phe Pro Leu Cys Leu Val Leu Tyr Glu Phe Ser Thr Tyr Ile Gly
20 25 30
Asn Asp Met Ile Gln Pro Gly Met Leu Ala Val Val Glu Gln Tyr Gln
35 40 45
Ala Gly Val Glu Trp Val Pro Thr Ser Met Thr Ala Tyr Leu Ala Gly
50 55 60
Gly Met Phe Leu Gln Trp Leu Leu Gly Pro Leu Ser Asp Arg Ile Gly
65 70 75 80
Arg Arg Pro Val Met Leu Ala Gly Val Val Trp Phe Ile Val Thr Cys
85 90 95
Leu Ala Thr Leu Leu Ala Gln Thr Ile Glu Gln Phe Thr Val Leu Arg
100 105 110
Phe Leu Gln Gly Ile Ser Leu Cys Phe Ile Gly Ala Val Gly Tyr Ala
115 120 125
Ala Ile Gln Glu Ser Phe Glu Glu Ala Val Cys Ile Lys Ile Thr Ala
130 135 140
Leu Met Ala Asn Val Ala Leu Ile Ala Pro Leu Leu Gly Pro Leu Val
145 150 155 160
Gly Ala Ala Trp Val His Ala Ala Pro Trp Glu Met Met Phe Val Leu
165 170 175
Phe Ala Ala Leu Ala Ala Ile Ser Phe Phe Gly Leu Trp Arg Ala Met
180 185 190
Pro Glu Thr Ala Thr Arg Leu Gly Glu Lys Leu Ser Leu Arg Glu Leu
195 200 205
Gly Arg Asp Tyr Lys Ala Val Leu Lys Asn Leu Arg Phe Val Ser Gly
210 215 220
Ala Leu Ala Ile Gly Phe Ile Ser Leu Pro Leu Leu Ala Trp Ile Ala
225 230 235 240
Gln Ser Pro Val Ile Ile Ile Ser Gly Glu Gln Met Ser Thr Tyr Glu
245 250 255
Tyr Gly Leu Leu Gln Val Pro Ile Phe Gly Ala Leu Ile Val Gly Asn
260 265 270
Leu Leu Leu Ala Lys Leu Thr Ala Arg Arg Ser Val Arg Ser Leu Ile
275 280 285
Ile Met Gly Gly Trp Pro Met Met Ile Gly Leu Ala Leu Ala Ala Leu
290 295 300
Ala Thr Val Leu Ser Ser His Ala Tyr Leu Trp Met Thr Ala Gly Leu
305 310 315 320
Ser Ile Tyr Ala Phe Gly Ile Gly Ile Ala Asn Ala Gly Leu Val Arg
325 330 335
Leu Thr Leu Phe Ala Ser Asp Ile Ser Lys Gly Thr Val Ser Ala Ala
340 345 350
Met Gly Met Leu Gln Met Thr Ile Phe Thr Val Gly Ile Glu Val Ser
355 360 365
Lys His Ala Trp Ile Ile Gly Gly Asn Ala Leu Phe Asn Leu Phe Ser
370 375 380
Phe Ala Ser Gly Leu Leu Trp Leu Gly Leu Met Val Ile Phe Leu Lys
385 390 395 400
Asp Lys Thr Val Gly Ala Ser Arg Gly Gly
405 410
<210> 73
<211> 410
<212> PRT
<213> 肠杆菌属种(Cronobacter sp.) EKM102R
<400> 73
Met Gln Thr His Ala Asn Arg Thr Gly Arg Leu Gly Arg Gln Ala Leu
1 5 10 15
Leu Phe Pro Leu Cys Leu Val Leu Tyr Glu Phe Ser Thr Tyr Ile Gly
20 25 30
Asn Asp Met Ile Gln Pro Gly Met Leu Ala Val Val Glu Gln Tyr Gln
35 40 45
Ala Gly Val Glu Trp Val Pro Thr Ser Met Thr Ala Tyr Leu Ala Gly
50 55 60
Gly Met Phe Leu Gln Trp Leu Leu Gly Pro Leu Ser Asp Arg Ile Gly
65 70 75 80
Arg Arg Pro Val Met Leu Ala Gly Val Val Trp Phe Ile Val Thr Cys
85 90 95
Leu Ala Thr Leu Leu Ala Gln Thr Ile Glu Gln Phe Thr Val Leu Arg
100 105 110
Phe Leu Gln Gly Ile Ser Leu Cys Phe Ile Gly Ala Val Gly Tyr Ala
115 120 125
Ala Ile Gln Glu Ser Phe Glu Glu Ala Val Cys Ile Lys Ile Thr Ala
130 135 140
Leu Met Ala Asn Val Ala Leu Ile Ala Pro Leu Leu Gly Pro Leu Val
145 150 155 160
Gly Ala Ala Trp Val His Ala Ala Pro Trp Glu Met Met Phe Val Leu
165 170 175
Phe Ala Ala Leu Ala Ala Ile Ser Phe Phe Gly Leu Trp Arg Ala Met
180 185 190
Pro Glu Thr Ala Thr Arg Leu Gly Glu Lys Leu Ser Leu Arg Glu Leu
195 200 205
Gly Arg Asp Tyr Lys Ala Val Leu Lys Asn Leu Arg Phe Val Ser Gly
210 215 220
Ala Leu Ala Ile Gly Phe Val Ser Leu Pro Leu Leu Ala Trp Ile Ala
225 230 235 240
Gln Ser Pro Val Ile Ile Ile Ser Gly Glu Gln Met Ser Thr Tyr Glu
245 250 255
Tyr Gly Leu Leu Gln Val Pro Ile Phe Gly Ala Leu Ile Leu Gly Asn
260 265 270
Leu Val Leu Ala Lys Leu Thr Ala Arg Arg Ala Val Arg Ser Leu Ile
275 280 285
Val Met Gly Gly Trp Pro Ile Val Ala Gly Leu Ala Leu Ala Ala Leu
290 295 300
Ala Thr Val Ile Ser Ser His Ser Tyr Leu Trp Met Thr Ala Gly Leu
305 310 315 320
Ser Ile Tyr Ala Phe Gly Ile Gly Ile Ala Asn Ala Gly Leu Val Arg
325 330 335
Leu Thr Leu Phe Ala Ser Asp Ile Ser Lys Gly Thr Val Ser Ala Ala
340 345 350
Met Gly Met Leu Gln Met Thr Ile Phe Thr Val Gly Ile Glu Val Ser
355 360 365
Lys His Ala Trp Ile Gly Gly Gly Asn Ala Leu Phe Asn Leu Phe Asn
370 375 380
Phe Ala Ser Gly Leu Leu Trp Leu Gly Leu Met Val Ile Phe Leu Lys
385 390 395 400
Asp Lys Thr Val Gly Thr Arg Pro Glu Gly
405 410
<210> 74
<211> 410
<212> PRT
<213> 广泛克罗诺杆菌(Cronobacter universalis) NCTC 9529
<400> 74
Met Gln Thr His Ala Asn Arg Thr Gly Arg Leu Gly Arg Gln Ala Leu
1 5 10 15
Leu Phe Pro Leu Cys Leu Val Leu Tyr Glu Phe Ser Thr Tyr Ile Gly
20 25 30
Asn Asp Met Ile Gln Pro Gly Met Leu Ala Val Val Glu Gln Tyr Gln
35 40 45
Ala Gly Val Glu Trp Val Pro Thr Ser Met Thr Ala Tyr Leu Ala Gly
50 55 60
Gly Met Phe Leu Gln Trp Leu Leu Gly Pro Leu Ser Asp Arg Ile Gly
65 70 75 80
Arg Arg Pro Val Met Leu Ala Gly Val Val Trp Phe Ile Val Thr Cys
85 90 95
Leu Ala Thr Leu Leu Ala Gln Thr Ile Glu Gln Phe Thr Val Leu Arg
100 105 110
Phe Leu Gln Gly Ile Ser Leu Cys Phe Ile Gly Ala Val Gly Tyr Ala
115 120 125
Ala Ile Gln Glu Ser Phe Glu Glu Ala Val Cys Ile Lys Ile Thr Ala
130 135 140
Leu Met Ala Asn Val Ala Leu Ile Ala Pro Leu Leu Gly Pro Leu Val
145 150 155 160
Gly Ala Ala Trp Val His Ala Ala Pro Trp Glu Met Met Phe Val Leu
165 170 175
Phe Ala Ala Leu Ala Ala Ile Ser Phe Phe Gly Leu Trp Arg Ala Met
180 185 190
Pro Glu Thr Ala Thr Arg Leu Gly Glu Lys Leu Ser Leu Arg Glu Leu
195 200 205
Gly Arg Asp Tyr Lys Ala Val Leu Lys Asn Leu Arg Phe Val Ser Gly
210 215 220
Ala Leu Ala Ile Gly Phe Val Ser Leu Pro Leu Leu Ala Trp Ile Ala
225 230 235 240
Gln Ser Pro Val Ile Ile Ile Ser Gly Glu Gln Met Ser Thr Tyr Glu
245 250 255
Tyr Gly Leu Leu Gln Val Pro Ile Phe Gly Ala Leu Ile Ile Gly Asn
260 265 270
Leu Val Leu Ala Lys Leu Thr Ala Arg Arg Ser Val Arg Ser Leu Ile
275 280 285
Val Met Gly Gly Trp Pro Met Met Ala Gly Leu Ala Leu Ala Ala Leu
290 295 300
Ala Thr Val Ile Ser Ser His Ala Tyr Leu Trp Met Thr Ala Gly Leu
305 310 315 320
Ser Ile Tyr Ala Phe Gly Ile Gly Ile Ala Asn Ala Gly Leu Val Arg
325 330 335
Leu Thr Leu Phe Ala Ser Asp Ile Ser Lys Gly Thr Val Ser Ala Ala
340 345 350
Met Gly Met Leu Gln Met Thr Ile Phe Thr Val Gly Ile Glu Val Ser
355 360 365
Lys His Ala Trp Leu Gly Gly Gly Asn Ala Leu Phe Asn Leu Phe Asn
370 375 380
Phe Ala Ser Gly Leu Leu Trp Leu Gly Leu Met Ala Ile Phe Leu Lys
385 390 395 400
Asp Lys Thr Val Gly Thr Arg Pro Glu Gly
405 410
<210> 75
<211> 411
<212> PRT
<213> 肠道沙门氏菌(Salmonella enterica)菌株413_SENT
<400> 75
Met Gln Asn Asn Ser Leu Thr Lys Lys Arg Leu Gly Arg Gln Ala Leu
1 5 10 15
Leu Phe Pro Leu Cys Leu Val Leu Tyr Glu Phe Ser Thr Tyr Ile Gly
20 25 30
Asn Asp Met Ile Gln Pro Gly Met Leu Ala Val Val Glu Gln Tyr Gln
35 40 45
Ala Gly Val Glu Trp Val Pro Thr Ser Met Thr Ala Tyr Leu Ala Gly
50 55 60
Gly Met Phe Leu Gln Trp Leu Leu Gly Pro Leu Ser Asp Arg Ile Gly
65 70 75 80
Arg Arg Pro Val Met Leu Thr Gly Val Val Trp Phe Ile Val Thr Cys
85 90 95
Leu Ala Thr Leu Leu Ala Gln Asn Ile Glu Gln Phe Thr Ala Leu Arg
100 105 110
Phe Leu Gln Gly Ile Ser Leu Cys Phe Ile Gly Ala Val Gly Tyr Ala
115 120 125
Ala Ile Gln Glu Ser Phe Glu Glu Ala Val Cys Ile Lys Ile Thr Ala
130 135 140
Leu Met Ala Asn Val Ala Leu Ile Ala Pro Leu Leu Gly Pro Leu Val
145 150 155 160
Gly Ala Ala Trp Val His Val Ala Pro Trp Glu Met Met Phe Val Leu
165 170 175
Phe Ala Val Leu Ala Ala Ile Ser Trp Tyr Gly Leu Trp Arg Ala Met
180 185 190
Pro Glu Thr Ala Thr Arg Leu Gly Glu Lys Leu Ser Leu Gly Glu Leu
195 200 205
Gly Arg Asp Tyr Lys Ala Val Met Lys Asn Ala Arg Phe Val Ala Gly
210 215 220
Ala Leu Ala Thr Gly Phe Val Ser Leu Pro Leu Leu Ala Trp Ile Ala
225 230 235 240
Gln Ser Pro Val Ile Ile Ile Ser Gly Glu Gln Leu Ser Ser Tyr Glu
245 250 255
Tyr Gly Leu Leu Gln Val Pro Ile Phe Gly Ala Leu Ile Ala Gly Asn
260 265 270
Leu Val Leu Ala Lys Leu Thr Ser Arg Arg Thr Val Arg Ser Leu Ile
275 280 285
Ile Leu Gly Gly Trp Pro Ile Ala Phe Gly Leu Ala Met Ala Ala Leu
290 295 300
Ala Thr Leu Phe Ser Ala His Ala Tyr Leu Trp Met Thr Ala Gly Leu
305 310 315 320
Ser Val Tyr Ala Phe Gly Ile Gly Leu Ala Asn Ala Gly Leu Val Arg
325 330 335
Leu Thr Leu Phe Ala Ser Asp Ile Ser Lys Gly Thr Val Ser Ala Ala
340 345 350
Met Gly Met Leu Gln Met Leu Ile Phe Thr Val Gly Ile Glu Val Ser
355 360 365
Lys His Ala Tyr Leu Ala Gly Gly Asn Gly Leu Phe Ser Leu Phe Asn
370 375 380
Leu Leu Asn Gly Leu Leu Trp Val Ala Met Met Val Ile Phe Leu Lys
385 390 395 400
Asp Lys Thr Val Gly Asn Ser Leu Gln Pro Gln
405 410
<210> 76
<211> 393
<212> PRT
<213> 克雷伯氏肺炎杆菌(Klebsiella pneumoniae)肺炎亚种 菌株NCTC11695
<400> 76
Met Gln Asn Tyr Ser Leu Ser Gly Arg Arg Leu Gly Arg Gln Ala Leu
1 5 10 15
Leu Phe Pro Leu Cys Leu Val Leu Tyr Glu Phe Ser Thr Tyr Ile Gly
20 25 30
Asn Asp Met Ile Gln Pro Gly Met Leu Ala Val Val Gln Glu Phe Gln
35 40 45
Val Gly Asn Glu Trp Val Pro Thr Ser Met Thr Ala Tyr Leu Ala Gly
50 55 60
Gly Met Phe Leu Gln Trp Leu Leu Gly Pro Leu Ser Asp Arg Ile Gly
65 70 75 80
Arg Arg Pro Val Met Leu Thr Gly Val Val Trp Phe Ile Val Thr Cys
85 90 95
Leu Ala Thr Leu Leu Ala Gln Thr Ile Glu Gln Phe Thr Leu Leu Arg
100 105 110
Phe Leu Gln Gly Ile Ser Leu Cys Phe Ile Gly Ala Val Gly Tyr Ala
115 120 125
Ala Ile Gln Glu Ser Phe Glu Glu Ala Val Cys Ile Lys Ile Thr Ala
130 135 140
Leu Met Ala Asn Val Ala Leu Ile Ala Pro Leu Leu Gly Pro Leu Val
145 150 155 160
Gly Ala Ala Trp Val His Val Leu Pro Trp Glu Met Met Phe Val Leu
165 170 175
Phe Ala Val Leu Ala Ala Ile Ser Phe Val Gly Leu Gln Arg Ala Met
180 185 190
Pro Glu Thr Ala Thr Arg Leu Gly Glu Lys Leu Ser Val Lys Glu Leu
195 200 205
Gly Arg Asp Tyr Arg Leu Val Leu Lys Asn Leu Arg Phe Val Ala Gly
210 215 220
Ala Leu Ala Thr Gly Phe Val Ser Leu Pro Leu Leu Ala Trp Ile Ala
225 230 235 240
Gln Ser Pro Val Ile Ile Ile Ser Gly Glu Gln Ala Thr Ser Tyr Glu
245 250 255
Tyr Gly Met Leu Gln Val Pro Ile Phe Gly Ala Leu Ile Ala Gly Asn
260 265 270
Leu Val Leu Ala Arg Leu Thr Ser Arg Arg Thr Val Arg Ser Leu Ile
275 280 285
Ile Met Gly Gly Trp Pro Ile Met Phe Gly Leu Ile Leu Ser Ala Ala
290 295 300
Ala Thr Val Val Ser Ser His Ala Tyr Leu Trp Met Thr Ala Gly Leu
305 310 315 320
Ser Phe Tyr Ala Phe Gly Ile Gly Leu Ala Asn Ala Gly Leu Val Arg
325 330 335
Leu Thr Leu Phe Ala Ser Glu Met Ser Lys Gly Thr Val Ser Ala Ala
340 345 350
Met Gly Met Leu Gln Met Leu Ile Phe Thr Val Gly Ile Glu Leu Ser
355 360 365
Lys His Ala Tyr Glu Leu Gly Ala Thr Ala Cys Ser Ala Cys Leu Thr
370 375 380
Cys Trp Ala Glu Tyr Cys Gly Trp Gly
385 390
<210> 77
<211> 410
<212> PRT
<213> Klebsiella aerogenes 菌株4928STDY7071344
<400> 77
Met Gln Asn Tyr Ser Leu Ser Gly Lys Arg Leu Gly Arg Gln Ala Leu
1 5 10 15
Leu Phe Pro Leu Cys Leu Val Leu Tyr Glu Phe Ser Thr Tyr Ile Gly
20 25 30
Asn Asp Met Ile Gln Pro Gly Met Leu Ala Val Val Gln Glu Phe Gln
35 40 45
Val Gly Asn Glu Trp Val Pro Thr Ser Met Thr Ala Tyr Leu Ala Gly
50 55 60
Gly Met Phe Leu Gln Trp Leu Leu Gly Pro Leu Ser Asp Arg Ile Gly
65 70 75 80
Arg Arg Pro Val Met Leu Thr Gly Val Val Trp Phe Ile Val Thr Cys
85 90 95
Leu Ala Thr Leu Leu Ala Gln Thr Ile Glu Gln Phe Thr Leu Leu Arg
100 105 110
Phe Leu Gln Gly Ile Ser Leu Cys Phe Ile Gly Ala Val Gly Tyr Ala
115 120 125
Ala Ile Gln Glu Ser Phe Glu Glu Ala Val Cys Ile Lys Ile Thr Ala
130 135 140
Leu Met Ala Asn Val Ala Leu Ile Ala Pro Leu Leu Gly Pro Leu Val
145 150 155 160
Gly Ala Ala Trp Val His Met Leu Pro Trp Glu Met Met Phe Val Leu
165 170 175
Phe Ala Val Leu Ala Ala Ile Ser Phe Ile Gly Leu Gln Arg Ala Met
180 185 190
Pro Glu Thr Ala Thr Arg Met Gly Glu Lys Leu Ser Val Lys Glu Leu
195 200 205
Gly Arg Asp Tyr Arg Leu Val Leu Lys Asn Leu Arg Phe Val Ala Gly
210 215 220
Ala Leu Ala Thr Gly Phe Val Ser Leu Pro Leu Leu Ala Trp Ile Ala
225 230 235 240
Gln Ser Pro Val Ile Ile Ile Ser Gly Glu Gln Ala Thr Ser Tyr Glu
245 250 255
Tyr Gly Met Leu Gln Val Pro Ile Phe Gly Ala Leu Ile Ala Gly Asn
260 265 270
Leu Val Leu Ala Arg Leu Thr Ser Arg Arg Ser Val Arg Ser Leu Ile
275 280 285
Ile Met Gly Gly Trp Pro Ile Met Phe Gly Leu Leu Leu Ser Ala Ala
290 295 300
Ala Thr Val Val Ser Ser His Ala Tyr Leu Trp Met Thr Ala Gly Leu
305 310 315 320
Ser Phe Tyr Ala Phe Gly Ile Gly Leu Ala Asn Ala Gly Leu Val Arg
325 330 335
Leu Thr Leu Phe Ala Ser Glu Met Ser Lys Gly Thr Val Ser Ala Ala
340 345 350
Met Gly Met Leu Gln Met Leu Ile Phe Thr Val Gly Ile Glu Leu Ser
355 360 365
Lys His Ala Tyr Glu Leu Gly Gly Asn Gly Leu Phe Ser Leu Phe Asn
370 375 380
Leu Leu Gly Gly Val Leu Trp Leu Gly Leu Ile Ile Tyr Phe Leu Lys
385 390 395 400
Asp Lys Ser Val Gly Ser Ser Gln Gln Ala
405 410
<210> 78
<211> 412
<212> PRT
<213> Raoultella planticola 菌株FDAARGOS_283
<400> 78
Met Gln Asn Tyr Ser Leu Ser Gly Lys Arg Leu Gly Arg Gln Ala Leu
1 5 10 15
Leu Phe Pro Leu Cys Leu Val Leu Tyr Glu Phe Ser Thr Tyr Ile Gly
20 25 30
Asn Asp Met Ile Gln Pro Gly Met Leu Ser Val Val Glu Glu Phe Gln
35 40 45
Val Gly Asn Glu Trp Val Pro Thr Ser Met Thr Ala Tyr Leu Ala Gly
50 55 60
Gly Met Phe Leu Gln Trp Leu Leu Gly Pro Leu Ser Asp Arg Ile Gly
65 70 75 80
Arg Arg Pro Val Met Leu Thr Gly Val Val Trp Phe Ile Val Thr Cys
85 90 95
Leu Ala Thr Leu Leu Ala Gln Thr Ile Glu Gln Phe Thr Leu Leu Arg
100 105 110
Phe Leu Gln Gly Ile Ser Leu Cys Phe Ile Gly Ala Val Gly Tyr Ala
115 120 125
Ala Ile Gln Glu Ser Phe Glu Glu Ala Met Cys Ile Lys Ile Thr Ala
130 135 140
Leu Met Ala Asn Val Ala Leu Ile Ala Pro Leu Leu Gly Pro Leu Val
145 150 155 160
Gly Ala Ala Trp Val His Ile Leu Pro Trp Glu Met Met Phe Val Leu
165 170 175
Phe Ala Val Leu Ala Ala Ile Ala Phe Val Gly Leu Gln Arg Ala Met
180 185 190
Pro Glu Thr Ala Thr Arg Met Gly Glu Lys Leu Ser Met Lys Glu Leu
195 200 205
Gly Arg Asp Tyr Gly Leu Val Leu Lys Asn Leu Arg Phe Val Ala Gly
210 215 220
Ala Leu Ala Thr Gly Phe Val Ser Leu Pro Leu Leu Ala Trp Ile Ala
225 230 235 240
Gln Ser Pro Val Ile Ile Ile Ser Gly Glu Lys Ala Thr Ser Tyr Glu
245 250 255
Tyr Gly Leu Leu Gln Val Pro Ile Phe Gly Ala Leu Ile Ala Gly Asn
260 265 270
Leu Val Leu Ala Arg Leu Thr Ser Arg Arg Thr Val Arg Ser Leu Ile
275 280 285
Ile Leu Gly Gly Trp Pro Ile Met Phe Gly Leu Leu Leu Ser Ala Val
290 295 300
Ala Thr Val Val Ser Thr His Ala Tyr Leu Trp Met Thr Ala Gly Leu
305 310 315 320
Ser Val Tyr Ala Phe Gly Ile Gly Leu Ala Asn Ala Gly Leu Val Arg
325 330 335
Leu Thr Leu Phe Ala Ser Asp Met Ser Lys Gly Thr Val Ser Ala Ala
340 345 350
Met Gly Met Leu Gln Met Leu Ile Phe Thr Val Gly Ile Glu Val Ser
355 360 365
Lys His Ala Tyr Glu Leu Gly Gly Ser Gly Val Phe Ser Leu Phe Asn
370 375 380
Leu Leu Ser Gly Val Met Trp Leu Ala Met Ile Val Tyr Phe Leu Lys
385 390 395 400
Asp Lys Ser Val Gly Asn Ser Asn Asp Pro Gln Ala
405 410
<210> 79
<211> 411
<212> PRT
<213> Klebsiella sp. 2680
<400> 79
Met His Asn Tyr Ser Leu Ala Gly Lys Arg Leu Gly Arg Gln Ala Leu
1 5 10 15
Leu Phe Pro Leu Cys Leu Val Leu Tyr Glu Phe Ser Thr Tyr Ile Gly
20 25 30
Asn Asp Met Ile Gln Pro Gly Met Leu Ser Val Val Asp Ala Phe Gly
35 40 45
Val Gly Asn Glu Trp Val Pro Thr Ser Met Thr Ala Tyr Leu Ala Gly
50 55 60
Gly Met Phe Leu Gln Trp Leu Leu Gly Pro Leu Ser Asp Arg Ile Gly
65 70 75 80
Arg Arg Pro Val Met Leu Thr Gly Val Val Trp Phe Ile Ala Thr Cys
85 90 95
Leu Ala Thr Leu Leu Ala Gln Thr Ile Glu Gln Phe Thr Leu Leu Arg
100 105 110
Phe Leu Gln Gly Ile Ser Leu Cys Phe Ile Gly Ala Val Gly Tyr Ala
115 120 125
Ala Ile Gln Glu Ser Phe Glu Glu Ala Val Cys Ile Lys Ile Thr Ala
130 135 140
Leu Met Ala Asn Val Ala Leu Ile Ala Pro Leu Leu Gly Pro Leu Val
145 150 155 160
Gly Ala Ala Trp Val His Phe Leu Pro Trp Glu Met Met Phe Val Leu
165 170 175
Phe Ala Val Leu Ala Thr Ile Ala Phe Val Gly Leu Gln Arg Ala Met
180 185 190
Pro Glu Thr Ala Thr Arg Gln Gly Glu Lys Leu Ser Val Lys Ala Leu
195 200 205
Gly Arg Asp Tyr Arg Asp Val Leu Lys Asn Arg Arg Phe Val Ala Gly
210 215 220
Ala Leu Ala Thr Gly Phe Val Ser Leu Pro Leu Leu Ala Trp Ile Ala
225 230 235 240
Gln Ser Pro Val Ile Ile Ile Ser Gly Glu Gln Ala Thr Ser Tyr Glu
245 250 255
Tyr Gly Leu Leu Gln Val Pro Ile Phe Gly Ala Leu Ile Ala Gly Asn
260 265 270
Leu Val Leu Ala Arg Gln Thr Ser Arg Lys Thr Val Arg Ser Leu Ile
275 280 285
Ile Leu Gly Gly Trp Pro Ile Ile Thr Gly Leu Leu Ile Ser Ala Ala
290 295 300
Ala Thr Val Val Ser Ala His Ala Tyr Leu Trp Met Thr Ala Gly Leu
305 310 315 320
Ser Val Tyr Ala Phe Gly Ile Gly Leu Ala Asn Ala Gly Leu Val Arg
325 330 335
Leu Thr Leu Phe Ala Ser Asp Met Ser Lys Gly Thr Val Ser Ala Ala
340 345 350
Met Gly Met Leu Gln Met Leu Ile Phe Thr Val Gly Ile Glu Val Ser
355 360 365
Lys His Ala Trp Glu Phe Gly Gly Ser Gly Leu Phe Ser Leu Leu Asn
370 375 380
Leu Leu Ser Gly Ala Leu Trp Leu Val Met Thr Ala Tyr Phe Leu Lys
385 390 395 400
Asp Lys Arg Ala Gly Asn Ser Arg Glu Pro Gln
405 410
<210> 80
<211> 411
<212> PRT
<213> Kluyvera georgiana 菌株HRGM_Genome_0064
<400> 80
Met Asp Thr Leu Ser Ser Ser Arg Lys Arg Leu Gly Arg Lys Ala Ile
1 5 10 15
Leu Phe Pro Leu Cys Leu Val Leu Tyr Glu Phe Ser Thr Tyr Ile Gly
20 25 30
Asn Asp Met Ile Gln Pro Gly Met Leu Ala Val Val Lys Glu Phe Asn
35 40 45
Ala Gly Asp Glu Trp Val Pro Thr Ser Met Thr Ala Tyr Leu Ala Gly
50 55 60
Gly Met Phe Leu Gln Trp Leu Leu Gly Pro Leu Ser Asp Arg Ile Gly
65 70 75 80
Arg Arg Pro Val Met Leu Thr Gly Val Val Trp Phe Ile Val Thr Cys
85 90 95
Leu Ala Thr Leu Leu Val Gln Asn Ile Glu Gln Phe Thr Phe Leu Arg
100 105 110
Phe Leu Gln Gly Val Ser Leu Cys Phe Ile Gly Ala Val Gly Tyr Ala
115 120 125
Ala Ile Gln Glu Ser Tyr Asp Glu Ala Thr Cys Ile Lys Ile Thr Ala
130 135 140
Leu Met Ala Asn Val Ala Leu Ile Ala Pro Leu Leu Gly Pro Leu Val
145 150 155 160
Gly Ala Ala Trp Ile His Val Ala Arg Trp Glu Ser Met Phe Val Leu
165 170 175
Phe Ala Ala Leu Ala Ala Leu Ala Tyr Ile Gly Leu His Lys Glu Met
180 185 190
Pro Glu Thr Ala Thr Arg Ile Gly Glu Lys Leu Ser Leu Lys Glu Leu
195 200 205
Gly Arg Asp Tyr Arg Glu Val Leu Lys Asn Gly Arg Phe Val Ala Gly
210 215 220
Ala Leu Ala Thr Gly Phe Val Ser Leu Pro Leu Leu Ala Trp Ile Ala
225 230 235 240
Gln Ser Pro Val Ile Ile Ile Ser Gly Glu Gly Ala Ser Ser Tyr Glu
245 250 255
Tyr Gly Leu Leu Gln Val Pro Ile Phe Gly Ala Leu Ile Leu Gly Asn
260 265 270
Leu Val Leu Ala Arg Leu Thr Ser Arg Arg Thr Val Arg Ala Leu Ile
275 280 285
Val Ala Gly Gly Tyr Pro Ile Met Phe Gly Leu Ile Leu Ala Ala Ala
290 295 300
Ala Thr Val Val Ser Ser His Ala Tyr Leu Trp Met Thr Ala Gly Leu
305 310 315 320
Ser Phe Tyr Ala Phe Gly Ile Gly Leu Ala Asn Ala Gly Leu Val Arg
325 330 335
Leu Thr Leu Phe Ala Ser Glu Met Ser Lys Gly Thr Val Ser Ala Ala
340 345 350
Met Gly Met Leu Gln Met Leu Ile Phe Thr Val Gly Ile Glu Leu Ser
355 360 365
Lys His Met Tyr Leu Leu Gly Gly Ile Gly Leu Phe Ser Leu Phe Asn
370 375 380
Leu Ala Gly Gly Leu Leu Trp Leu Gly Leu Met Val Met Phe Leu Arg
385 390 395 400
Asp Lys Thr Val Gly Ser Gly Leu Gln Pro Gln
405 410
<210> 81
<211> 411
<212> PRT
<213> Kluyvera intermedia 菌株NCTC12125
<400> 81
Met Asp Thr Ser Ser Ser Ser Arg Lys Arg Leu Gly Arg Lys Ala Ile
1 5 10 15
Leu Phe Pro Leu Cys Leu Val Leu Tyr Glu Phe Ser Thr Tyr Ile Ala
20 25 30
Asn Asp Met Ile Gln Pro Gly Met Leu Ala Val Val Lys Glu Phe Asn
35 40 45
Ala Gly Asp Glu Trp Val Pro Thr Ser Met Thr Ala Tyr Leu Ala Gly
50 55 60
Gly Met Phe Leu Gln Trp Leu Leu Gly Pro Leu Ser Asp Arg Ile Gly
65 70 75 80
Arg Arg Pro Val Met Leu Thr Gly Val Ile Trp Phe Ile Val Thr Cys
85 90 95
Leu Ala Thr Leu Met Val Gln Asn Ile Glu Gln Phe Thr Phe Leu Arg
100 105 110
Phe Leu Gln Gly Val Ser Leu Cys Phe Ile Gly Ala Val Gly Tyr Ala
115 120 125
Ala Ile Gln Glu Ser Phe Asp Glu Ala Thr Cys Ile Lys Ile Thr Ala
130 135 140
Leu Met Ala Asn Val Ala Leu Ile Ala Pro Leu Leu Gly Pro Leu Val
145 150 155 160
Gly Ala Ala Trp Ile His Leu Ala Arg Trp Glu Ser Met Phe Val Leu
165 170 175
Phe Ala Val Leu Ala Ala Ile Ala Tyr Val Gly Leu Phe Lys Ala Met
180 185 190
Pro Glu Thr Ala Thr Arg Leu Gly Glu Lys Leu Ser Leu Lys Thr Leu
195 200 205
Gly Gln Asp Tyr Arg Glu Val Leu Lys Asn Gly Arg Phe Val Ala Gly
210 215 220
Ala Leu Ala Thr Gly Phe Val Ser Leu Pro Leu Leu Ala Trp Ile Ala
225 230 235 240
Gln Ser Pro Val Ile Ile Ile Ser Gly Glu Asn Ala Ser Ser Tyr Glu
245 250 255
Tyr Gly Leu Leu Gln Val Pro Ile Phe Gly Ala Leu Ile Leu Gly Asn
260 265 270
Leu Val Leu Ala Arg Leu Thr Ser Arg Arg Thr Val Arg Ala Leu Ile
275 280 285
Ile Ala Gly Gly Tyr Pro Ile Met Phe Gly Leu Ile Leu Ala Ala Ala
290 295 300
Ala Thr Val Val Ser Ser His Ala Tyr Leu Trp Met Thr Ala Gly Leu
305 310 315 320
Ser Phe Tyr Ala Phe Gly Ile Gly Leu Ala Asn Ala Gly Leu Val Arg
325 330 335
Leu Thr Leu Phe Ala Ser Asp Met Ser Lys Gly Thr Val Ser Ala Ala
340 345 350
Met Gly Met Leu Gln Met Leu Ile Phe Thr Val Gly Ile Glu Leu Ser
355 360 365
Lys His Ser Tyr Gln Met Gly Gly Ile Gly Leu Phe Ser Leu Phe Asn
370 375 380
Leu Ala Gly Gly Val Leu Trp Leu Val Leu Met Val Met Phe Leu Arg
385 390 395 400
Asp Lys Thr Val Gly Ser Gly Leu Gln Pro Glu
405 410
<210> 82
<211> 431
<212> PRT
<213> 肠道沙门氏菌 菌株2014K-0203
<400> 82
Met His Asn Arg Leu Gln Ser Gly Val Arg Leu Gly Arg Gln Ala Leu
1 5 10 15
Leu Phe Pro Leu Cys Leu Val Leu Tyr Glu Phe Ser Thr Tyr Ile Gly
20 25 30
Asn Asp Met Ile Gln Pro Gly Met Leu Ala Val Val Glu Gln Tyr Gln
35 40 45
Val Ser Leu Asp Trp Val Pro Thr Ser Met Thr Ala Tyr Leu Ala Gly
50 55 60
Gly Met Phe Leu Gln Trp Leu Leu Gly Pro Leu Ser Asp Arg Ile Gly
65 70 75 80
Arg Arg Pro Val Met Leu Ala Gly Ile Val Trp Phe Ile Ala Thr Cys
85 90 95
Leu Ala Thr Leu Leu Ala Lys Asn Ile Glu Gln Phe Thr Phe Leu Arg
100 105 110
Phe Leu Gln Gly Ile Ser Leu Cys Phe Ile Gly Ala Val Gly Tyr Ala
115 120 125
Ala Ile Gln Glu Ser Phe Glu Glu Ala Val Cys Ile Lys Ile Thr Ala
130 135 140
Leu Met Ala Asn Val Ala Leu Ile Ala Pro Leu Leu Gly Pro Leu Val
145 150 155 160
Gly Ala Ala Trp Val His Val Leu Pro Trp Glu Gly Met Phe Val Leu
165 170 175
Phe Ala Ala Leu Ala Ala Ile Ala Phe Phe Gly Leu Gln Arg Ala Met
180 185 190
Pro Glu Thr Ala Thr Arg Arg Gly Glu Thr Leu Ser Leu Lys Ala Leu
195 200 205
Gly Arg Asp Tyr Arg Leu Val Ile Lys Asn Arg Arg Phe Val Ala Gly
210 215 220
Ala Leu Ala Leu Gly Phe Val Ser Leu Pro Leu Leu Ala Trp Ile Ala
225 230 235 240
Gln Ser Pro Ile Ile Ile Ile Ser Gly Glu Gln Leu Ser Ser Tyr Glu
245 250 255
Tyr Gly Leu Leu Gln Val Pro Val Phe Gly Ala Leu Ile Ala Gly Asn
260 265 270
Leu Val Leu Ala Arg Leu Thr Ser Arg Arg Thr Val Arg Ser Leu Ile
275 280 285
Val Met Gly Gly Trp Pro Ile Val Val Gly Leu Ile Ile Ala Ala Ala
290 295 300
Ala Ala Val Val Ser Ser His Ala Tyr Leu Trp Met Met Ala Gly Leu
305 310 315 320
Ser Val Tyr Ala Phe Gly Ile Gly Leu Ala Asn Ala Gly Leu Val Arg
325 330 335
Leu Thr Leu Phe Ser Ser Glu Met Ser Lys Gly Thr Val Ser Ala Ala
340 345 350
Met Gly Met Leu Gln Met Leu Ile Phe Thr Val Gly Ile Glu Val Ser
355 360 365
Lys His Ala Trp Leu Ser Gly Gly Asn Glu Leu Phe Ser Leu Phe Asn
370 375 380
Leu Ala Asn Gly Ile Leu Trp Leu Leu Leu Met Leu Val Phe Leu Lys
385 390 395 400
Asp Lys Arg Ala Gly Ile Arg Lys Gln Ala Lys Arg Ala Ala Met Pro
405 410 415
Asp Lys Pro Ser Val Ile Arg His Arg Glu Ala Ser Ala Lys Arg
420 425 430
<210> 83
<211> 416
<212> PRT
<213> 邦戈沙门氏菌(Salmonella bongori) 菌株85-0051
<400> 83
Met His Asn Arg Thr Gln Ser Gly Ala Arg Leu Gly Arg Gln Ala Leu
1 5 10 15
Leu Phe Pro Leu Cys Leu Val Leu Tyr Glu Phe Ser Thr Tyr Ile Gly
20 25 30
Asn Asp Met Ile Gln Pro Gly Met Leu Ala Val Val Glu Gln Tyr Gln
35 40 45
Ala Gly Leu Asp Trp Val Pro Thr Ser Met Thr Ala Tyr Leu Ala Gly
50 55 60
Gly Met Phe Leu Gln Trp Leu Leu Gly Pro Leu Ser Asp Arg Ile Gly
65 70 75 80
Arg Arg Pro Val Met Leu Ala Gly Val Ile Trp Phe Ile Val Thr Cys
85 90 95
Leu Ala Thr Leu Leu Ala Lys Asn Ile Glu Gln Phe Thr Phe Leu Arg
100 105 110
Phe Leu Gln Gly Ile Ser Leu Cys Phe Ile Gly Ala Val Gly Tyr Ala
115 120 125
Ala Ile Gln Glu Ser Phe Glu Glu Ala Val Cys Ile Lys Ile Thr Ala
130 135 140
Leu Met Ala Asn Val Ala Leu Ile Ala Pro Leu Leu Gly Pro Leu Val
145 150 155 160
Gly Ala Ala Trp Val His Val Leu Pro Trp Glu Gly Met Phe Ile Leu
165 170 175
Phe Ala Ala Leu Ala Ala Ile Ala Phe Phe Gly Leu Gln Arg Ala Met
180 185 190
Pro Glu Thr Ala Thr Arg Arg Gly Glu Thr Leu Ser Leu Lys Asp Leu
195 200 205
Gly Arg Asp Tyr Gln Arg Val Ile Lys Asn Arg Arg Phe Val Ala Gly
210 215 220
Ala Leu Ala Leu Gly Phe Val Ser Leu Pro Leu Leu Ala Trp Ile Ala
225 230 235 240
Gln Ser Pro Ile Ile Ile Ile Ser Gly Glu Gln Leu Ser Ser Tyr Glu
245 250 255
Tyr Gly Leu Leu Gln Val Pro Val Phe Gly Ala Leu Ile Ala Gly Asn
260 265 270
Leu Val Leu Ala Arg Leu Thr Ser Arg Arg Thr Val Arg Ser Leu Ile
275 280 285
Val Met Gly Gly Trp Pro Ile Val Ala Gly Leu Ile Ile Ala Ala Ala
290 295 300
Ala Thr Val Val Ser Ser His Ala Tyr Leu Trp Met Thr Ala Gly Leu
305 310 315 320
Ser Ile Tyr Ala Phe Gly Ile Gly Leu Ala Asn Ala Gly Leu Val Arg
325 330 335
Leu Thr Leu Phe Ala Ser Asp Met Ser Lys Gly Thr Val Ser Ala Ala
340 345 350
Met Gly Met Leu Gln Met Leu Ile Phe Thr Val Gly Ile Glu Val Ser
355 360 365
Lys His Ala Trp Leu Ser Gly Gly Asn Gly Leu Phe Ser Leu Phe Asn
370 375 380
Leu Ala Asn Gly Ile Phe Trp Leu Leu Leu Met Leu Val Phe Leu Lys
385 390 395 400
Asn Lys Arg Thr Gly Asp Ser Gln Thr Asp Pro Glu Ser Gly Tyr Ala
405 410 415
<210> 84
<211> 412
<212> PRT
<213> Salmonella enterica subsp. enterica 血清型 Hillingdon 菌株S01-0588
<400> 84
Met Val Cys Arg Ile Val Tyr Asn Gln Ala Ala Gly Trp Asp Val Arg
1 5 10 15
Arg Cys Phe Phe Leu Ser Val Trp Cys Cys Thr Ser Phe Ser Thr Tyr
20 25 30
Ile Gly Asn Asp Met Ile Gln Pro Gly Met Leu Ala Val Val Glu Gln
35 40 45
Tyr Gln Ala Gly Leu Asp Trp Val Pro Thr Ser Met Thr Ala Tyr Leu
50 55 60
Ala Gly Gly Met Phe Leu Gln Trp Leu Leu Gly Pro Leu Ser Asp Arg
65 70 75 80
Ile Gly Arg Arg Pro Val Met Leu Ala Gly Val Val Trp Phe Ile Val
85 90 95
Thr Cys Leu Ala Thr Leu Leu Ala Lys Asn Ile Glu Gln Phe Thr Phe
100 105 110
Leu Arg Phe Leu Gln Gly Ile Ser Leu Cys Phe Ile Gly Ala Val Gly
115 120 125
Tyr Ala Ala Ile Gln Glu Ser Phe Glu Glu Ala Val Cys Ile Lys Ile
130 135 140
Thr Ala Leu Met Ala Asn Val Ala Leu Ile Ala Pro Leu Leu Gly Pro
145 150 155 160
Leu Val Gly Ala Ala Trp Val His Val Leu Pro Trp Glu Gly Met Phe
165 170 175
Ile Leu Phe Ala Ala Leu Ala Ala Ile Ala Phe Phe Gly Leu Gln Arg
180 185 190
Ala Met Pro Glu Thr Ala Thr Arg Arg Gly Glu Thr Leu Ser Phe Lys
195 200 205
Ala Leu Gly Arg Asp Tyr Arg Leu Val Ile Lys Asn Arg Arg Phe Val
210 215 220
Ala Gly Ala Leu Ala Leu Gly Phe Val Ser Leu Pro Leu Leu Ala Trp
225 230 235 240
Ile Ala Gln Ser Pro Ile Ile Ile Ile Ser Gly Glu Gln Leu Ser Ser
245 250 255
Tyr Glu Tyr Gly Leu Leu Gln Val Pro Val Phe Gly Ala Leu Ile Ala
260 265 270
Gly Asn Leu Val Leu Ala Arg Leu Thr Ser Arg Arg Thr Val Arg Ser
275 280 285
Leu Ile Val Met Gly Gly Trp Pro Ile Val Ala Gly Leu Ile Ile Ala
290 295 300
Ala Ala Ala Thr Val Val Ser Ser His Ala Tyr Leu Trp Met Thr Ala
305 310 315 320
Gly Leu Ser Val Tyr Ala Phe Gly Ile Gly Leu Ala Asn Ala Gly Leu
325 330 335
Val Arg Leu Thr Leu Phe Ser Ser Asp Met Ser Lys Gly Thr Val Ser
340 345 350
Ala Ala Met Gly Met Leu Gln Met Leu Ile Phe Thr Val Gly Ile Glu
355 360 365
Val Ser Lys His Ala Trp Leu Ser Gly Gly Asn Gly Leu Phe Ser Leu
370 375 380
Phe Asn Leu Ala Asn Gly Ile Leu Trp Leu Leu Leu Met Leu Val Phe
385 390 395 400
Leu Lys Asp Lys Arg Thr Gly Asn Leu Gln Thr Val
405 410
<210> 85
<211> 410
<212> PRT
<213> Citrobacter youngae 菌株TE1
<400> 85
Met Gln Asn Arg Leu Ser Ser Gly Ala Arg Leu Gly Arg Gln Ala Leu
1 5 10 15
Leu Phe Pro Leu Cys Leu Val Leu Tyr Glu Phe Ser Thr Tyr Ile Ala
20 25 30
Asn Asp Met Ile Gln Pro Gly Met Leu Ala Val Val Glu Gln Tyr Gln
35 40 45
Ala Gly Ile Asp Trp Val Pro Thr Ser Met Thr Ala Tyr Leu Ala Gly
50 55 60
Gly Met Phe Leu Gln Trp Leu Leu Gly Pro Leu Ser Asp Arg Ile Gly
65 70 75 80
Arg Arg Pro Val Met Leu Ala Gly Val Val Trp Phe Ile Val Thr Cys
85 90 95
Leu Ala Thr Leu Leu Ala Gln Asn Ile Glu Gln Phe Thr Phe Leu Arg
100 105 110
Phe Leu Gln Gly Ile Ser Leu Cys Phe Ile Gly Ala Val Gly Tyr Ala
115 120 125
Ala Ile Gln Glu Ser Phe Glu Glu Ala Val Cys Ile Lys Ile Thr Ala
130 135 140
Leu Met Ala Asn Val Ala Leu Ile Ala Pro Leu Leu Gly Pro Leu Val
145 150 155 160
Gly Ala Ala Trp Val His Val Leu Pro Trp Glu Gly Met Phe Val Leu
165 170 175
Phe Ala Val Leu Ala Ala Phe Ala Phe Phe Gly Leu Gln Arg Ala Met
180 185 190
Pro Glu Thr Ala Thr Arg Ile Gly Glu Lys Leu Ser Leu Lys Glu Leu
195 200 205
Trp Arg Asp Tyr Lys Leu Val Leu Lys Asn Val Arg Phe Val Ala Gly
210 215 220
Ala Leu Ala Leu Gly Phe Val Ser Leu Pro Leu Leu Ala Trp Ile Ala
225 230 235 240
Gln Ser Pro Ile Ile Ile Ile Ser Gly Glu Gln Leu Ser Ser Tyr Glu
245 250 255
Tyr Gly Leu Leu Gln Val Pro Val Phe Gly Ala Leu Ile Ala Gly Asn
260 265 270
Leu Val Leu Ala Arg Leu Thr Ala Arg Arg Thr Val Arg Ser Leu Ile
275 280 285
Ile Met Gly Gly Trp Pro Ile Met Leu Gly Leu Ile Leu Ala Ala Ala
290 295 300
Ala Thr Val Ala Ser Ser His Ala Tyr Leu Trp Met Thr Ala Gly Leu
305 310 315 320
Ser Leu Tyr Ala Phe Gly Ile Gly Val Ala Asn Ala Gly Leu Val Arg
325 330 335
Leu Thr Leu Phe Ala Ser Asp Met Ser Lys Gly Thr Val Ser Ala Ala
340 345 350
Met Gly Met Leu Gln Met Leu Ile Phe Thr Val Gly Ile Glu Val Ser
355 360 365
Lys Tyr Ala Tyr Leu Gly Gly Gly Asn Gly Leu Phe Ser Leu Phe Asn
370 375 380
Leu Ala Asn Gly Ile Leu Trp Leu Leu Leu Met Phe Ile Phe Leu Lys
385 390 395 400
Asp Lys Gln Val Gly Ala Ser Arg Gly Gly
405 410
<210> 86
<211> 410
<212> PRT
<213> Citrobacter sp. RHB21-C01
<400> 86
Met Gln Asn Arg Leu Gln Gln Gly Ala Arg Leu Gly Arg Gln Ala Leu
1 5 10 15
Leu Phe Pro Leu Cys Leu Val Leu Tyr Glu Phe Ser Thr Tyr Ile Gly
20 25 30
Asn Asp Met Ile Gln Pro Gly Met Leu Ala Val Val Ala Gln Tyr Gln
35 40 45
Ala Gly Ile Asp Trp Val Pro Thr Ser Met Thr Ala Tyr Leu Ala Gly
50 55 60
Gly Met Phe Leu Gln Trp Leu Leu Gly Pro Leu Ser Asp Arg Ile Gly
65 70 75 80
Arg Arg Pro Val Met Leu Ala Gly Val Val Trp Phe Ile Val Thr Cys
85 90 95
Leu Ala Thr Leu Leu Ala Gln Thr Ile Glu Gln Phe Thr Leu Leu Arg
100 105 110
Phe Leu Gln Gly Ile Ser Leu Cys Phe Ile Gly Ala Val Gly Tyr Ala
115 120 125
Ala Ile Gln Glu Ser Phe Glu Glu Ala Val Cys Ile Lys Ile Thr Ala
130 135 140
Leu Met Ala Asn Val Ala Leu Ile Ala Pro Leu Leu Gly Pro Leu Val
145 150 155 160
Gly Ala Ala Trp Val His Val Leu Pro Trp Glu Gly Met Phe Val Leu
165 170 175
Phe Ala Val Leu Ala Ala Met Ala Phe Phe Gly Leu Gln Arg Ala Met
180 185 190
Pro Glu Thr Ala Thr Arg Ile Gly Glu Pro Leu Ser Leu Lys Ala Leu
195 200 205
Gly Arg Asp Tyr Gln Gln Val Met Lys Asn Gly Arg Phe Val Ala Gly
210 215 220
Ala Leu Ala Leu Gly Phe Val Ser Leu Pro Leu Leu Ala Trp Ile Ala
225 230 235 240
Gln Ser Pro Ile Ile Ile Ile Ser Gly Glu Gln Leu Ser Ser Tyr Gln
245 250 255
Tyr Gly Leu Leu Gln Val Pro Ile Phe Gly Ala Leu Ile Ala Gly Asn
260 265 270
Leu Val Leu Ala Arg Leu Thr Ser Arg Arg Thr Val Arg Ser Leu Ile
275 280 285
Ile Ile Gly Gly Trp Pro Ile Val Leu Gly Leu Ile Leu Ala Ala Ala
290 295 300
Ala Thr Val Val Ser Ser His Ala Tyr Leu Trp Met Thr Ala Gly Leu
305 310 315 320
Ser Val Tyr Ala Phe Gly Ile Gly Leu Ala Asn Ala Gly Leu Val Arg
325 330 335
Leu Thr Leu Phe Ala Ser Asp Met Ser Lys Gly Thr Val Ser Ala Ala
340 345 350
Met Gly Met Leu Gln Met Leu Ile Phe Thr Leu Gly Ile Glu Val Ser
355 360 365
Lys Tyr Ala Tyr Leu Ser Gly Gly Asn Gly Leu Phe Ser Leu Phe Asn
370 375 380
Leu Thr Asn Gly Ile Leu Trp Leu Leu Leu Met Val Ile Phe Leu Lys
385 390 395 400
Asp Lys Gln Val Gly Asn Thr Arg Glu Gly
405 410
<210> 87
<211> 410
<212> PRT
<213> 魏氏柠檬酸杆菌(Citrobacter werkmanii) 菌株MGYG-HGUT-02535
<400> 87
Met His Asn Arg Leu Ser Ser Gly Ala Arg Leu Gly Arg Gln Ala Leu
1 5 10 15
Leu Phe Pro Leu Cys Leu Val Leu Tyr Glu Phe Ser Thr Tyr Ile Gly
20 25 30
Asn Asp Met Ile Gln Pro Gly Met Leu Ala Val Val Glu Gln Tyr Gln
35 40 45
Ala Gly Leu Asp Trp Val Pro Thr Ser Met Thr Ala Tyr Leu Ala Gly
50 55 60
Gly Met Phe Leu Gln Trp Leu Leu Gly Pro Leu Ser Asp Arg Ile Gly
65 70 75 80
Arg Arg Pro Val Met Leu Thr Gly Val Val Trp Phe Ile Val Thr Cys
85 90 95
Leu Ala Thr Leu Phe Ala Gln Asn Ile Glu Gln Phe Thr Phe Leu Arg
100 105 110
Phe Leu Gln Gly Ile Ser Leu Cys Phe Ile Gly Ala Val Gly Tyr Ala
115 120 125
Ala Ile Gln Glu Ser Phe Glu Glu Ala Val Cys Ile Lys Ile Thr Ala
130 135 140
Leu Met Ala Asn Val Ala Leu Ile Ala Pro Leu Leu Gly Pro Leu Val
145 150 155 160
Gly Ala Ala Trp Val His Val Leu Pro Trp Glu Gly Met Phe Val Leu
165 170 175
Phe Ala Val Leu Ala Ala Ile Ala Phe Val Gly Leu Gln Arg Ala Met
180 185 190
Pro Glu Thr Ala Thr Arg Leu Gly Glu Thr Leu Ser Ile Lys Glu Leu
195 200 205
Gly Lys Asp Tyr Lys Leu Val Leu Lys Asn Val Arg Phe Val Ala Gly
210 215 220
Ala Leu Ala Leu Gly Phe Val Ser Leu Pro Leu Leu Ala Trp Ile Ala
225 230 235 240
Gln Ser Pro Ile Ile Ile Ile Ser Gly Glu Gln Leu Ser Ser Tyr Glu
245 250 255
Tyr Gly Leu Leu Gln Val Pro Ile Phe Gly Ala Leu Ile Ala Gly Asn
260 265 270
Leu Val Leu Ala Arg Leu Thr Ala Arg Arg Thr Val Arg Ser Leu Ile
275 280 285
Ile Met Gly Gly Trp Pro Ile Ala Val Gly Leu Ile Ile Ala Ala Ala
290 295 300
Ala Thr Val Val Ser Ser His Ala Tyr Leu Trp Met Thr Ala Gly Leu
305 310 315 320
Ser Val Tyr Ala Phe Gly Ile Gly Val Ala Asn Ala Gly Leu Val Arg
325 330 335
Leu Thr Leu Phe Ala Ser Asp Met Ser Lys Gly Thr Val Ser Ala Ala
340 345 350
Met Gly Met Leu Gln Met Leu Ile Phe Thr Val Gly Ile Glu Leu Ser
355 360 365
Lys His Ala Tyr Leu Leu Gly Gly Asn Gly Leu Phe Ser Leu Phe Asn
370 375 380
Leu Ala Ser Gly Ile Leu Trp Leu Ala Leu Met Phe Ile Phe Leu Lys
385 390 395 400
Asp Lys Arg Val Gly Asp Ser Arg Glu Gly
405 410
<210> 88
<211> 409
<212> PRT
<213> 肠杆菌(Enterobacteriaceae bacterium)UBA3109
<400> 88
Met Gln Asn His Ser Leu Ser Gly Gly Arg Leu Gly Arg Gln Ala Leu
1 5 10 15
Leu Phe Pro Leu Cys Leu Val Leu Tyr Glu Phe Ser Thr Tyr Ile Ala
20 25 30
Asn Asp Met Ile Gln Pro Gly Met Leu Ala Val Val Glu Gln Tyr His
35 40 45
Ala Gly Ile Glu Trp Val Pro Thr Ser Met Thr Ala Tyr Leu Ala Gly
50 55 60
Gly Met Phe Leu Gln Trp Leu Leu Gly Pro Leu Ser Asp Arg Ile Gly
65 70 75 80
Arg Arg Pro Val Met Leu Thr Gly Val Val Trp Phe Ile Leu Thr Cys
85 90 95
Leu Ala Thr Leu Leu Ala Gln Asn Ile Glu Gln Phe Thr Ile Leu Arg
100 105 110
Phe Leu Gln Gly Val Ser Leu Cys Phe Ile Gly Ala Val Gly Tyr Ala
115 120 125
Ala Ile Gln Glu Ser Phe Asp Glu Ala Thr Cys Ile Lys Ile Thr Ala
130 135 140
Leu Met Ala Asn Val Ala Leu Ile Ala Pro Leu Leu Gly Pro Leu Val
145 150 155 160
Gly Ala Ala Trp Val His Ala Ala Pro Trp Glu Gly Met Phe Ile Leu
165 170 175
Phe Ala Val Leu Ala Ala Ile Ala Phe Phe Gly Leu Gln Arg Ala Met
180 185 190
Pro Glu Thr Ala Thr Arg Leu Gly Glu Pro Leu Ser Leu Lys Ala Leu
195 200 205
Gly Arg Asp Tyr Lys Ala Val Leu Lys Asn Val Arg Phe Val Ala Gly
210 215 220
Ala Leu Ala Thr Gly Phe Val Ser Leu Pro Leu Leu Ala Trp Ile Ala
225 230 235 240
Gln Ser Pro Ile Ile Ile Ile Ser Gly Glu Gly Met Ser Ser Tyr Glu
245 250 255
Tyr Gly Leu Leu Gln Val Pro Ile Phe Gly Ala Leu Ile Ile Gly Asn
260 265 270
Leu Val Leu Ala Arg Leu Thr Ser Arg Arg Thr Val Arg Ala Leu Ile
275 280 285
Ile Phe Gly Gly Trp Pro Ile Val Phe Gly Leu Ala Leu Ala Ala Val
290 295 300
Ala Thr Val Val Ser Ser His Ala Tyr Leu Trp Met Thr Ala Gly Leu
305 310 315 320
Ser Leu Tyr Ala Phe Gly Ile Gly Leu Ala Asn Ala Gly Leu Val Arg
325 330 335
Leu Thr Leu Phe Ala Ser Asp Met Ser Lys Gly Thr Val Ser Ala Ala
340 345 350
Met Gly Met Leu Gln Met Ala Ile Phe Thr Val Gly Ile Glu Leu Ser
355 360 365
Lys His Ala Tyr Leu Ser Gly Gly Ser Gly Leu Phe Ser Leu Phe Asn
370 375 380
Leu Val Asn Gly Val Leu Trp Val Ala Leu Met Val Val Phe Leu Arg
385 390 395 400
Asp Lys Ser Val Gly Asn Ala Leu Ser
405
<210> 89
<211> 409
<212> PRT
<213> 肠杆菌(Enterobacteriaceae bacterium) UBA6698
<400> 89
Met Pro Asn His Ala Leu Pro Gly Arg Arg Leu Gly Arg Gln Ala Leu
1 5 10 15
Leu Phe Pro Leu Cys Leu Val Leu Tyr Glu Phe Ser Thr Tyr Ile Ala
20 25 30
Asn Asp Met Ile Gln Pro Gly Met Leu Ala Val Val Glu Gln Tyr Asn
35 40 45
Ala Gly Ile Glu Trp Val Pro Thr Ser Met Thr Ala Tyr Leu Ala Gly
50 55 60
Gly Met Phe Leu Gln Trp Leu Leu Gly Pro Leu Ser Asp Arg Ile Gly
65 70 75 80
Arg Arg Pro Val Met Leu Thr Gly Val Val Trp Phe Ile Val Thr Cys
85 90 95
Leu Ala Thr Leu Leu Ala Gln Asp Ile Glu Gln Phe Thr Ile Leu Arg
100 105 110
Phe Leu Gln Gly Val Ser Leu Cys Phe Ile Gly Ala Val Gly Tyr Ala
115 120 125
Ala Ile Gln Glu Ser Phe Asp Glu Ala Thr Cys Ile Lys Ile Thr Ala
130 135 140
Leu Met Ala Asn Val Ala Leu Ile Ala Pro Leu Leu Gly Pro Leu Val
145 150 155 160
Gly Ala Ala Trp Val His Ala Ala Pro Trp Glu Gly Met Phe Val Leu
165 170 175
Phe Ala Val Leu Ala Ala Ile Ala Phe Phe Gly Leu His Arg Ala Met
180 185 190
Pro Glu Thr Ala Thr Arg Leu Gly Glu Pro Leu Ser Leu Asn Ala Leu
195 200 205
Gly Arg Asp Tyr Lys Ala Val Met Lys Asn Gly Arg Phe Val Ala Gly
210 215 220
Ala Leu Ala Thr Gly Phe Val Ser Leu Pro Leu Leu Ala Trp Ile Ala
225 230 235 240
Gln Ser Pro Ile Ile Ile Ile Ser Ala Glu Gly Met Ser Ser Tyr Glu
245 250 255
Tyr Gly Leu Leu Gln Val Pro Ile Phe Gly Ala Leu Ile Ile Gly Asn
260 265 270
Leu Val Leu Ala Arg Leu Thr Ser Arg Arg Thr Val Arg Ser Leu Ile
275 280 285
Ile Met Gly Gly Gly Pro Ile Val Ala Gly Leu Leu Leu Ala Ala Val
290 295 300
Ala Thr Val Ala Ser Ser His Ala Tyr Leu Trp Met Thr Ala Gly Leu
305 310 315 320
Ser Ile Tyr Ala Phe Gly Ile Gly Leu Ala Asn Ala Gly Leu Val Arg
325 330 335
Leu Thr Leu Phe Ala Ser Asp Met Ser Lys Gly Thr Val Ser Ala Ala
340 345 350
Met Gly Met Leu Gln Met Ala Ile Phe Thr Val Gly Ile Glu Val Ser
355 360 365
Lys His Ala Phe Leu Ala Gly Gly Asn Gly Leu Phe Ser Leu Phe Asn
370 375 380
Leu Ala Asn Gly Leu Ile Trp Leu Val Leu Met Val Val Phe Leu Lys
385 390 395 400
Asp Lys Ser Val Gly Asn Ala Leu Ser
405
<210> 90
<211> 411
<212> PRT
<213> Leclercia sp. 4-9-1-25
<400> 90
Met Leu Asn Arg Ser Ser Ser Gly Asn Arg Leu Gly Arg Gln Ala Leu
1 5 10 15
Leu Phe Pro Leu Cys Leu Val Leu Tyr Glu Phe Ser Thr Tyr Ile Gly
20 25 30
Asn Asp Met Ile Gln Pro Gly Met Leu Ala Val Val Glu Gln Tyr Asn
35 40 45
Ala Gly Ile Glu Trp Val Pro Thr Ser Met Thr Ala Tyr Leu Ala Gly
50 55 60
Gly Met Phe Leu Gln Trp Leu Leu Gly Pro Leu Ser Asp Arg Ile Gly
65 70 75 80
Arg Arg Pro Val Met Leu Thr Gly Val Val Trp Phe Ile Val Thr Cys
85 90 95
Leu Ala Ile Leu Leu Ala Gln Asn Ile Glu Gln Phe Thr Phe Leu Arg
100 105 110
Phe Leu Gln Gly Val Ser Leu Cys Phe Ile Gly Ala Val Gly Tyr Ala
115 120 125
Ala Ile Gln Glu Ser Phe Glu Glu Ala Val Cys Ile Lys Ile Thr Ala
130 135 140
Leu Met Ala Asn Val Ala Leu Ile Ala Pro Leu Leu Gly Pro Leu Val
145 150 155 160
Gly Ala Ala Trp Val His Val Ala Pro Trp Glu Gly Met Phe Ile Leu
165 170 175
Phe Ala Leu Leu Ala Ala Ile Ser Phe Phe Gly Leu Trp Lys Ala Met
180 185 190
Pro Glu Thr Ala Thr Arg Leu Gly Glu Thr Leu Ser Met Arg Glu Leu
195 200 205
Gly Arg Asp Tyr Lys Ala Val Met Lys Asn Val Arg Phe Val Ala Gly
210 215 220
Ala Leu Ala Thr Gly Phe Val Ser Leu Pro Leu Leu Ala Trp Ile Ala
225 230 235 240
Gln Ser Pro Val Ile Ile Ile Ser Gly Glu Gln Leu Ser Ser Tyr Glu
245 250 255
Tyr Gly Leu Leu Gln Val Pro Ile Phe Gly Ala Leu Ile Ile Gly Asn
260 265 270
Leu Val Leu Ala Arg Leu Thr Ser Arg Arg Thr Val Arg Ser Leu Ile
275 280 285
Ile Met Gly Gly Trp Pro Ile Thr Leu Gly Leu Leu Leu Ala Ala Val
290 295 300
Ala Thr Val Val Ser Ser His Ala Tyr Leu Trp Met Thr Ala Gly Leu
305 310 315 320
Ser Leu Tyr Ala Phe Gly Ile Gly Leu Ala Asn Ala Gly Leu Val Arg
325 330 335
Leu Thr Leu Phe Ala Ser Asp Met Ser Lys Gly Thr Val Ser Ala Ala
340 345 350
Met Gly Met Leu Gln Met Leu Ile Phe Thr Val Gly Ile Glu Val Ser
355 360 365
Lys His Ala Phe Ser Phe Gly Gly Asn Gly Leu Phe Ser Leu Phe Asn
370 375 380
Leu Ala Asn Gly Leu Leu Trp Leu Val Leu Met Val Ile Phe Leu Lys
385 390 395 400
Asp Lys Arg Val Gly Asn Ala Leu Gln Pro Asp
405 410
<210> 91
<211> 411
<212> PRT
<213> 河生莱略特氏菌(Lelliottia amnigena) 菌株TZW14
<400> 91
Met Leu Asn Arg Ser Ser Ser Ser Gly His Arg Leu Gly Arg Gln Ala
1 5 10 15
Leu Leu Phe Pro Leu Cys Leu Val Leu Tyr Glu Phe Ser Thr Tyr Ile
20 25 30
Ala Asn Asp Met Ile Gln Pro Gly Met Leu Ala Val Val Ala Gln Tyr
35 40 45
Asn Ala Gly Ile Glu Trp Val Pro Thr Ser Met Thr Ala Tyr Leu Ala
50 55 60
Gly Gly Met Phe Leu Gln Trp Leu Leu Gly Pro Leu Ser Asp Arg Ile
65 70 75 80
Gly Arg Arg Pro Val Met Leu Thr Gly Val Val Trp Phe Ile Val Thr
85 90 95
Cys Leu Ala Ile Leu Leu Ala Gln Thr Ile Glu Gln Phe Met Val Leu
100 105 110
Arg Phe Leu Gln Gly Val Ser Leu Cys Phe Ile Gly Ala Val Gly Tyr
115 120 125
Ala Ala Ile Gln Glu Ser Phe Glu Glu Ala Val Cys Ile Lys Ile Thr
130 135 140
Ala Leu Met Ala Asn Val Ala Leu Ile Ala Pro Leu Leu Gly Pro Leu
145 150 155 160
Val Gly Ala Ala Trp Val His Val Ala Pro Trp Glu Gly Met Phe Ile
165 170 175
Leu Phe Ala Leu Leu Ala Ala Ile Ser Trp Tyr Gly Leu His Arg Ala
180 185 190
Met Pro Glu Thr Ala Thr Arg Leu Gly Glu Lys Leu Ser Leu Lys Glu
195 200 205
Leu Gly Arg Asp Tyr Lys Glu Val Leu Lys Asn Val Arg Phe Val Ala
210 215 220
Gly Ala Leu Ala Thr Gly Phe Val Ser Leu Pro Leu Leu Ala Trp Ile
225 230 235 240
Ala Gln Ser Pro Val Ile Ile Ile Ser Gly Glu Lys Leu Ser Ser Tyr
245 250 255
Glu Tyr Gly Leu Leu Gln Val Pro Ile Phe Gly Ala Leu Ile Ile Gly
260 265 270
Asn Leu Val Leu Ala Arg Leu Thr Ser Arg Arg Ser Val Arg Ser Leu
275 280 285
Ile Ile Leu Gly Gly Trp Pro Ile Ala Gly Gly Leu Ile Leu Ala Ala
290 295 300
Val Ala Thr Val Val Ser Ser His Ala Tyr Leu Trp Met Thr Ala Gly
305 310 315 320
Leu Ser Ile Tyr Ala Phe Gly Ile Gly Leu Ala Asn Ala Gly Leu Val
325 330 335
Arg Leu Thr Leu Phe Ala Ser Glu Met Ser Lys Gly Thr Val Ser Ala
340 345 350
Ala Met Gly Met Leu Gln Met Leu Ile Phe Thr Val Gly Ile Glu Val
355 360 365
Ser Lys His Ala Tyr Ile Ile Gly Gly Asn Gly Leu Phe Ser Leu Phe
370 375 380
Asn Leu Ala Asn Gly Val Leu Trp Val Gly Leu Met Val Ile Phe Leu
385 390 395 400
Lys Asn Lys Arg Val Gly Asn Ala Leu Gln Pro
405 410
<210> 92
<211> 409
<212> PRT
<213> Lelliottia aquatilis 菌株TZW17
<400> 92
Met Leu Asn Arg Ser Ser Ser Gly Asn Arg Leu Gly Arg Gln Ala Leu
1 5 10 15
Leu Phe Pro Leu Cys Leu Val Leu Tyr Glu Phe Ser Thr Tyr Ile Gly
20 25 30
Asn Asp Met Ile Gln Pro Gly Met Leu Ala Val Val Glu Gln Phe Asn
35 40 45
Ala Gly Ile Glu Trp Val Pro Thr Ser Met Thr Ala Tyr Leu Ala Gly
50 55 60
Gly Met Phe Leu Gln Trp Leu Leu Gly Pro Leu Ser Asp Arg Ile Gly
65 70 75 80
Arg Arg Pro Val Met Leu Thr Gly Val Val Trp Phe Ile Val Thr Cys
85 90 95
Leu Ala Ile Leu Leu Ala Gln Thr Ile Glu Gln Phe Thr Ile Leu Arg
100 105 110
Phe Leu Gln Gly Val Ser Leu Cys Phe Ile Gly Ala Val Gly Tyr Ala
115 120 125
Ala Ile Gln Glu Ser Phe Glu Glu Ala Val Cys Ile Lys Ile Thr Ala
130 135 140
Leu Met Ala Asn Val Ala Leu Ile Ala Pro Leu Leu Gly Pro Leu Val
145 150 155 160
Gly Ala Ala Trp Val His Val Ala Pro Trp Glu Gly Met Phe Val Leu
165 170 175
Phe Ala Leu Leu Ala Ala Ile Ser Phe Phe Gly Leu His Arg Ala Met
180 185 190
Pro Glu Thr Ala Thr Arg Leu Gly Glu Lys Leu Ser Leu Lys Glu Leu
195 200 205
Gly Arg Asp Tyr Lys Glu Val Leu Arg Asn Val Arg Phe Val Ala Gly
210 215 220
Ala Leu Ala Thr Gly Phe Val Ser Leu Pro Leu Leu Ala Trp Ile Ala
225 230 235 240
Gln Ser Pro Val Ile Ile Ile Ser Gly Glu Lys Leu Ser Ser Tyr Glu
245 250 255
Tyr Gly Leu Leu Gln Val Pro Ile Phe Gly Ala Leu Ile Ile Gly Asn
260 265 270
Leu Val Leu Ala Arg Leu Thr Ser Arg Arg Ser Val Arg Ser Leu Ile
275 280 285
Ile Met Gly Gly Trp Pro Ile Met Ala Gly Leu Val Val Ala Ala Val
290 295 300
Ala Thr Val Ala Ser Ser His Ala Tyr Leu Trp Met Thr Ala Gly Leu
305 310 315 320
Ser Ile Tyr Ala Phe Gly Ile Gly Leu Ala Asn Ala Gly Leu Val Arg
325 330 335
Leu Thr Leu Phe Ala Ser Glu Met Ser Lys Gly Thr Val Ser Ala Ala
340 345 350
Met Gly Met Leu Gln Met Leu Ile Phe Thr Val Gly Ile Glu Val Ser
355 360 365
Lys His Ala Tyr Ser Phe Gly Gly Asn Gly Leu Phe Ser Leu Phe Asn
370 375 380
Leu Ala Asn Gly Ile Leu Trp Leu Gly Leu Met Val Val Phe Leu Lys
385 390 395 400
Asp Lys Arg Val Gly Ser Ala Leu Gln
405
<210> 93
<211> 410
<212> PRT
<213> 肠杆菌属种(Enterobacter sp.) RHBSTW-00901
<400> 93
Met Leu Asn Arg Ser Ser Ser Gly Thr Arg Leu Gly Arg Gln Ala Leu
1 5 10 15
Leu Phe Pro Leu Cys Leu Val Leu Tyr Glu Phe Ser Thr Tyr Ile Gly
20 25 30
Asn Asp Met Ile Gln Pro Gly Met Leu Ala Val Val Glu Gln Tyr Asn
35 40 45
Ala Gly Ile Glu Trp Val Pro Thr Ser Met Thr Ala Tyr Leu Ala Gly
50 55 60
Gly Met Phe Leu Gln Trp Leu Leu Gly Pro Leu Ser Asp Arg Ile Gly
65 70 75 80
Arg Arg Pro Val Met Leu Thr Gly Val Val Trp Phe Ile Val Thr Cys
85 90 95
Leu Ala Thr Leu Leu Ala Gln Asn Ile Glu Gln Phe Thr Leu Leu Arg
100 105 110
Phe Leu Gln Gly Val Ser Leu Cys Phe Ile Gly Ala Val Gly Tyr Ala
115 120 125
Ala Ile Gln Glu Ser Phe Glu Glu Ala Met Cys Ile Lys Ile Thr Ala
130 135 140
Leu Met Ala Asn Val Ala Leu Ile Ala Pro Leu Leu Gly Pro Leu Val
145 150 155 160
Gly Ala Ala Trp Ile His Val Ala Pro Trp Glu Gly Met Phe Val Leu
165 170 175
Phe Ala Ala Phe Ala Ala Ile Ala Phe Phe Gly Leu His Arg Ala Met
180 185 190
Pro Glu Thr Ala Thr Arg Leu Gly Glu Thr Leu Ser Leu Lys Glu Leu
195 200 205
Gly Arg Asp Tyr Lys Leu Val Leu Lys Asn Val Arg Phe Val Ala Gly
210 215 220
Ala Leu Ala Leu Gly Phe Val Ser Leu Pro Leu Leu Ala Trp Ile Ala
225 230 235 240
Gln Ser Pro Val Ile Ile Ile Ser Gly Glu Lys Leu Ser Ser Tyr Glu
245 250 255
Tyr Gly Met Leu Gln Val Pro Ile Phe Gly Ala Leu Ile Ile Gly Asn
260 265 270
Leu Thr Leu Ala Arg Leu Thr Ser Arg Arg Thr Val Arg Ser Leu Ile
275 280 285
Ile Met Gly Gly Trp Pro Ile Val Ala Gly Leu Ile Met Ala Ala Val
290 295 300
Ala Thr Val Ala Ser Ser His Ala Tyr Leu Trp Met Thr Ala Gly Leu
305 310 315 320
Ser Val Tyr Ala Phe Gly Ile Gly Leu Ala Asn Ala Gly Leu Val Arg
325 330 335
Leu Thr Leu Phe Ala Ser Asp Met Ser Lys Gly Thr Val Ser Ala Ala
340 345 350
Met Gly Met Leu Gln Met Leu Ile Phe Thr Val Gly Ile Glu Val Ser
355 360 365
Lys His Ala Tyr Ala Met Gly Gly Asn Gly Leu Phe Ser Leu Phe Asn
370 375 380
Leu Ala Asn Gly Val Leu Trp Leu Gly Leu Met Val Val Phe Leu Lys
385 390 395 400
Asp Lys Arg Val Gly Asn Ala Leu Gln Pro
405 410
<210> 94
<211> 410
<212> PRT
<213> 阴沟肠杆菌(Enterobacter cloacae) dissolven亚种 菌株GN05902
<400> 94
Met Leu Asn Arg Ser Ser Ser Gly Thr Arg Leu Gly Arg Gln Ala Leu
1 5 10 15
Leu Phe Pro Leu Cys Leu Val Leu Tyr Glu Phe Ser Thr Tyr Ile Gly
20 25 30
Asn Asp Met Ile Gln Pro Gly Met Leu Ala Val Val Ala Gln Tyr Asn
35 40 45
Ala Gly Ile Glu Trp Val Pro Thr Ser Met Thr Ala Tyr Leu Ala Gly
50 55 60
Gly Met Phe Leu Gln Trp Leu Leu Gly Pro Leu Ser Asp Arg Ile Gly
65 70 75 80
Arg Arg Pro Val Met Leu Thr Gly Val Val Trp Phe Ile Val Thr Cys
85 90 95
Leu Ala Thr Leu Leu Ala Gln Asn Ile Glu Gln Phe Thr Leu Leu Arg
100 105 110
Phe Leu Gln Gly Val Ser Leu Cys Phe Ile Gly Ala Val Gly Tyr Ala
115 120 125
Ala Ile Gln Glu Ser Phe Glu Glu Ala Val Cys Ile Lys Ile Thr Ala
130 135 140
Leu Met Ala Asn Val Ala Leu Ile Ala Pro Leu Leu Gly Pro Leu Val
145 150 155 160
Gly Ala Ala Trp Val His Val Ala Pro Trp Glu Gly Met Phe Val Leu
165 170 175
Phe Ala Val Leu Ala Ala Ile Ala Phe Phe Gly Leu His Arg Ala Met
180 185 190
Pro Glu Thr Ala Thr Arg Leu Gly Glu Thr Leu Ser Leu Lys Glu Leu
195 200 205
Gly Arg Asp Tyr Lys Ala Val Leu Lys Asn Gly Arg Phe Val Ala Gly
210 215 220
Ala Leu Ala Thr Gly Phe Val Ser Leu Pro Leu Leu Ala Trp Ile Ala
225 230 235 240
Gln Ser Pro Val Ile Ile Ile Ser Gly Glu Gln Leu Ser Ser Tyr Glu
245 250 255
Tyr Gly Leu Leu Gln Val Pro Ile Phe Gly Ala Leu Ile Ile Gly Asn
260 265 270
Leu Val Leu Ala Arg Leu Thr Ser Arg Arg Thr Val Arg Ser Leu Ile
275 280 285
Ile Met Gly Gly Trp Pro Ile Ala Ala Gly Leu Thr Val Ala Ala Val
290 295 300
Ala Thr Val Val Ser Ser His Ala Tyr Leu Trp Met Thr Ala Gly Leu
305 310 315 320
Ser Ile Tyr Ala Phe Gly Ile Gly Val Ala Asn Ala Gly Leu Val Arg
325 330 335
Leu Thr Leu Phe Ala Ser Glu Met Ser Lys Gly Thr Val Ser Ala Ala
340 345 350
Met Gly Met Leu Gln Met Leu Ile Phe Thr Val Gly Ile Glu Val Ser
355 360 365
Lys His Thr Tyr Ala Leu Gly Gly Asn Gly Leu Phe Ser Leu Phe Asn
370 375 380
Leu Ala Asn Gly Val Leu Trp Val Val Leu Met Val Met Phe Leu Lys
385 390 395 400
Asp Lys Arg Val Gly Asn Ala Leu Gln Pro
405 410
<210> 95
<211> 410
<212> PRT
<213> 桑树常感菌(Enterobacter mori )菌株JGM37
<400> 95
Met Leu Asn Arg Ser Ser Ser Gly Asn Arg Leu Gly Arg Gln Ala Leu
1 5 10 15
Leu Phe Pro Leu Cys Leu Val Leu Tyr Glu Phe Ser Thr Tyr Ile Gly
20 25 30
Asn Asp Met Ile Gln Pro Gly Met Leu Ala Val Val Glu Gln Tyr Asn
35 40 45
Ala Gly Ile Glu Trp Val Pro Thr Ser Met Thr Ala Tyr Leu Ala Gly
50 55 60
Gly Met Phe Leu Gln Trp Leu Leu Gly Pro Leu Ser Asp Arg Ile Gly
65 70 75 80
Arg Arg Pro Val Met Leu Thr Gly Val Val Trp Phe Ile Val Thr Cys
85 90 95
Leu Ala Thr Leu Leu Ala Gln Asn Ile Glu Gln Phe Thr Leu Leu Arg
100 105 110
Phe Leu Gln Gly Val Ser Leu Cys Phe Ile Gly Ala Val Gly Tyr Ala
115 120 125
Ala Ile Gln Glu Ser Phe Glu Glu Ala Val Cys Ile Lys Ile Thr Ala
130 135 140
Leu Met Ala Asn Val Ala Leu Ile Ala Pro Leu Leu Gly Pro Leu Val
145 150 155 160
Gly Ala Ala Trp Val His Val Ala Pro Trp Glu Gly Met Phe Ile Leu
165 170 175
Phe Ala Ala Leu Ala Ala Ile Ser Phe Phe Gly Leu His Arg Ala Met
180 185 190
Pro Glu Thr Ala Thr Arg Leu Gly Glu Lys Leu Ser Leu Lys Glu Leu
195 200 205
Gly Arg Asp Tyr Lys Glu Val Leu Lys Asn Gly Arg Phe Val Ala Gly
210 215 220
Ala Leu Ala Thr Gly Phe Val Ser Leu Pro Leu Leu Ala Trp Ile Ala
225 230 235 240
Gln Ser Pro Val Ile Ile Ile Ser Gly Glu Lys Leu Ser Ser Tyr Glu
245 250 255
Tyr Gly Leu Leu Gln Val Pro Ile Phe Gly Ala Leu Ile Ala Gly Asn
260 265 270
Leu Val Leu Ala Arg Leu Thr Ser Arg Arg Thr Val Arg Ser Leu Ile
275 280 285
Ile Met Gly Gly Trp Pro Ile Ala Ala Gly Leu Val Met Ala Ala Val
290 295 300
Ala Thr Val Ala Ser Ser His Ala Tyr Leu Trp Met Thr Ala Gly Leu
305 310 315 320
Ser Val Tyr Ala Phe Gly Ile Gly Val Ala Asn Ala Gly Leu Val Arg
325 330 335
Leu Thr Leu Phe Ala Ser Glu Met Ser Lys Gly Thr Val Ser Ala Ala
340 345 350
Met Gly Met Leu Gln Met Leu Ile Phe Thr Val Gly Ile Glu Val Ser
355 360 365
Lys His Ala Tyr Ala Phe Gly Gly Asn Gly Leu Phe Ser Leu Phe Asn
370 375 380
Leu Ala Asn Gly Val Leu Trp Val Gly Leu Met Val Val Phe Leu Lys
385 390 395 400
Asp Lys Arg Ile Gly Ser Ala Leu Gln Pro
405 410
<210> 96
<211> 410
<212> PRT
<213> Kosakonia sacchari 菌株BO-1
<400> 96
Met Gln Asn His Thr Leu Thr Ser Gln Arg Leu Gly Arg Arg Ala Leu
1 5 10 15
Leu Phe Pro Leu Cys Leu Val Leu Tyr Glu Phe Ser Thr Tyr Ile Ala
20 25 30
Asn Asp Met Ile Gln Pro Gly Met Leu Ala Val Val Glu Gln Tyr Asn
35 40 45
Ala Gly Ile Glu Trp Val Pro Thr Ser Met Thr Ala Tyr Leu Ala Gly
50 55 60
Gly Met Phe Leu Gln Trp Leu Leu Gly Pro Leu Ser Asp Arg Ile Gly
65 70 75 80
Arg Arg Pro Val Met Leu Thr Gly Val Val Trp Phe Ile Val Thr Cys
85 90 95
Leu Ala Thr Leu Leu Ala Gln Asp Ile Glu Gln Phe Thr Leu Leu Arg
100 105 110
Phe Leu Gln Gly Ile Ser Leu Cys Phe Ile Gly Ala Val Gly Tyr Ala
115 120 125
Ala Ile Gln Glu Ser Phe Glu Glu Ala Val Cys Ile Lys Ile Thr Ala
130 135 140
Leu Met Ala Asn Val Ala Leu Ile Ala Pro Leu Leu Gly Pro Leu Val
145 150 155 160
Gly Ala Ala Trp Val His Ala Ala Pro Trp Gln Gly Met Phe Val Leu
165 170 175
Phe Ala Leu Leu Ala Ala Phe Ala Phe Phe Gly Leu Gln Arg Ala Met
180 185 190
Pro Glu Thr Ala Thr Arg Leu Gly Glu Lys Leu Ser Phe Lys Ala Leu
195 200 205
Trp Arg Asp Tyr Ala Asp Val Met Lys Asn Leu Arg Phe Val Ala Gly
210 215 220
Ala Leu Ala Thr Gly Phe Val Ser Leu Pro Leu Leu Ala Trp Ile Ala
225 230 235 240
Gln Ser Pro Ile Ile Ile Ile Ser Gly Glu Gln Leu Ser Ser Tyr Glu
245 250 255
Tyr Gly Leu Leu Gln Val Pro Ile Phe Gly Ala Leu Ile Ile Gly Asn
260 265 270
Leu Val Leu Ala Arg Leu Thr Ser Arg Arg Thr Val Arg Ala Leu Ile
275 280 285
Ile Met Gly Gly Trp Pro Ile Ala Ala Gly Leu Leu Leu Ala Ala Val
290 295 300
Ala Thr Val Ala Ser Ser His Ala Tyr Leu Trp Met Thr Ala Gly Leu
305 310 315 320
Ser Leu Tyr Ala Phe Gly Ile Gly Leu Ala Asn Ala Gly Leu Val Arg
325 330 335
Leu Thr Leu Phe Ala Ser Glu Met Ser Lys Gly Thr Val Ser Ala Ala
340 345 350
Met Gly Met Leu Gln Met Phe Ile Phe Thr Val Gly Ile Glu Ile Ser
355 360 365
Lys His Ala Trp Leu Ser Gly Gly Asn Gly Leu Phe Ser Leu Phe Asn
370 375 380
Leu Ala Asn Gly Val Leu Trp Leu Gly Leu Met Val Val Phe Leu Arg
385 390 395 400
Asp Lys Arg Val Gly Asn Ser Leu Glu Gly
405 410
<210> 97
<211> 410
<212> PRT
<213> Cronobacter malonaticus 菌株MOD1-Md25g
<400> 97
Met Gln Thr His Ala Asn Arg Thr Gly Arg Leu Gly Arg Gln Ala Leu
1 5 10 15
Leu Phe Pro Leu Cys Leu Val Leu Tyr Glu Phe Ser Thr Tyr Ile Gly
20 25 30
Asn Asp Met Ile Gln Pro Gly Met Leu Ala Val Val Glu Gln Tyr Gln
35 40 45
Ala Gly Val Glu Trp Val Pro Thr Ser Met Thr Ala Tyr Leu Ala Gly
50 55 60
Gly Met Phe Leu Gln Trp Leu Leu Gly Pro Leu Ser Asp Arg Ile Gly
65 70 75 80
Arg Arg Pro Val Met Leu Ala Gly Val Ala Trp Phe Ile Val Thr Cys
85 90 95
Leu Ala Thr Leu Leu Ala Gln Asn Ile Glu Gln Phe Thr Val Leu Arg
100 105 110
Phe Leu Gln Gly Ile Ser Leu Cys Phe Ile Gly Ala Val Gly Tyr Ala
115 120 125
Ala Ile Gln Glu Ser Phe Glu Glu Ala Val Cys Ile Lys Ile Thr Ala
130 135 140
Leu Met Ala Asn Val Ala Leu Ile Ala Pro Leu Leu Gly Pro Leu Val
145 150 155 160
Gly Ala Ala Trp Val His Ala Ala Pro Trp Glu Met Met Phe Val Leu
165 170 175
Phe Ala Val Leu Ala Ala Ile Ser Phe Phe Gly Leu Trp Arg Ala Met
180 185 190
Pro Glu Thr Ala Thr Arg Leu Gly Glu Lys Leu Ser Leu Arg Glu Leu
195 200 205
Gly Arg Asp Tyr Lys Ala Val Leu Lys Asn Leu Arg Phe Val Ser Gly
210 215 220
Ala Leu Ala Ile Gly Phe Val Ser Leu Pro Leu Leu Ala Trp Ile Ala
225 230 235 240
Gln Ser Pro Val Ile Ile Ile Ser Gly Glu Gln Met Ser Thr Tyr Glu
245 250 255
Tyr Gly Leu Leu Gln Val Pro Ile Phe Gly Ala Leu Ile Ile Gly Asn
260 265 270
Leu Val Leu Ala Lys Leu Thr Ala Arg Arg Ser Val Arg Ser Leu Ile
275 280 285
Val Met Gly Gly Trp Pro Met Met Phe Gly Leu Ala Leu Ala Ala Leu
290 295 300
Ala Thr Val Ile Ser Ser His Ala Tyr Leu Trp Met Thr Ala Gly Leu
305 310 315 320
Ser Ile Tyr Ala Phe Gly Ile Gly Ile Ala Asn Ala Gly Leu Val Arg
325 330 335
Leu Thr Leu Phe Ala Ser Asp Ile Ser Lys Gly Thr Val Ser Ala Ala
340 345 350
Met Gly Met Leu Gln Met Thr Ile Phe Thr Val Gly Ile Glu Val Ser
355 360 365
Lys His Ala Trp Ile Gly Gly Gly Asn Ala Leu Phe Asn Leu Phe Asn
370 375 380
Phe Ala Ser Gly Leu Leu Trp Leu Gly Leu Met Val Ile Phe Leu Lys
385 390 395 400
Asp Lys Thr Val Gly Thr Arg Pro Glu Ala
405 410
<210> 98
<211> 410
<212> PRT
<213> Cronobacter dublinensis 582
<400> 98
Met Gln Thr His Ala Asn Arg Thr Gly Arg Leu Gly Arg Gln Ala Leu
1 5 10 15
Leu Phe Pro Leu Cys Leu Val Leu Tyr Glu Phe Ser Thr Tyr Ile Gly
20 25 30
Asn Asp Met Ile Gln Pro Gly Met Leu Ala Val Val Glu Gln Tyr Gln
35 40 45
Ala Gly Val Glu Trp Val Pro Thr Ser Met Thr Ala Tyr Leu Ala Gly
50 55 60
Gly Met Phe Leu Gln Trp Leu Leu Gly Pro Leu Ser Asp Arg Ile Gly
65 70 75 80
Arg Arg Pro Val Met Leu Ala Gly Val Val Trp Phe Ile Val Thr Cys
85 90 95
Leu Ala Thr Leu Leu Ala Gln Asn Ile Glu Gln Phe Thr Val Leu Arg
100 105 110
Phe Leu Gln Gly Ile Ser Leu Cys Phe Ile Gly Ala Val Gly Tyr Ala
115 120 125
Ala Ile Gln Glu Ser Phe Glu Glu Ala Val Cys Ile Lys Ile Thr Ala
130 135 140
Leu Met Ala Asn Val Ala Leu Ile Ala Pro Leu Leu Gly Pro Leu Val
145 150 155 160
Gly Ala Ala Trp Val His Ala Ala Pro Trp Glu Met Met Phe Val Leu
165 170 175
Phe Ala Val Leu Ala Ala Ile Ser Phe Phe Gly Leu Trp Arg Ala Met
180 185 190
Pro Glu Thr Ala Thr Arg Leu Gly Glu Lys Leu Ser Leu Arg Glu Leu
195 200 205
Gly Arg Asp Tyr Lys Lys Val Leu Lys Asn Leu Arg Phe Val Ser Gly
210 215 220
Ala Leu Ala Ile Gly Phe Val Ser Leu Pro Leu Leu Ala Trp Ile Ala
225 230 235 240
Gln Ser Pro Val Ile Ile Ile Ser Gly Glu Gln Met Ser Thr Tyr Glu
245 250 255
Tyr Gly Leu Leu Gln Val Pro Ile Phe Gly Ala Leu Ile Ile Gly Asn
260 265 270
Leu Val Leu Ala Lys Leu Thr Ala Arg Arg Ser Val Arg Ser Leu Ile
275 280 285
Val Met Gly Gly Trp Pro Ile Met Ala Gly Leu Ala Leu Ala Ala Phe
290 295 300
Ala Thr Val Ile Ser Ser His Ala Tyr Leu Trp Met Thr Ala Gly Leu
305 310 315 320
Ser Ile Tyr Ala Phe Gly Ile Gly Ile Ala Asn Ala Gly Leu Val Arg
325 330 335
Leu Thr Leu Phe Ala Ser Asp Ile Ser Lys Gly Thr Val Ser Ala Ala
340 345 350
Met Gly Met Leu Gln Met Thr Ile Phe Thr Val Gly Ile Glu Val Ser
355 360 365
Lys His Ala Trp Thr Gly Gly Gly Asn Gly Leu Phe Asn Leu Phe Asn
370 375 380
Phe Ala Ser Gly Leu Leu Trp Leu Gly Leu Thr Val Ile Phe Leu Lys
385 390 395 400
Asp Lys Thr Val Gly Ala Ser Arg Glu Gly
405 410

Claims (45)

1.一种宿主细胞,其经基因修饰以产生包括乳糖-N-三糖(LN3;GlcNAc-beta1,3-Gal-beta1,4-Glc)作为核心三糖的寡糖,其中该宿主细胞包括及表达半乳糖苷-β-1,3-N-乙酰葡萄糖胺转移酶(galactoside beta-1,3-N-acetylglucosaminyltransferase)的至少一种核酸序列,该半乳糖苷-β-1,3-N-乙酰葡萄糖胺转移酶自UDP-GlcNAc供体转移N-乙酰葡萄糖胺(GlcNAc)残基至乳糖受体上,从而合成LN3,
-该细胞还包括:(i)内源膜蛋白的过表达及/或(ii)异源膜蛋白的表达,以提供包括LN3作为核心三糖的寡糖的(a)经改良的生产及/或(b)经启动及/或经提升的排出,较佳为其中该经改良的生产及该经提升的排出,是相较于具有同一基因背景但欠缺该过表达内源膜蛋白及该表达异源膜蛋白的宿主细胞,
-较佳为该细胞还包括及表达编码糖基转移酶(glycosyltransferase)的至少一种核酸序列,该糖基转移酶具有修饰该LN3的能力,
其中视需要而定的该经改良的生产包括:
-较佳的该寡糖滴定量(克寡糖/升),
-较佳的生产率r(克寡糖/升·小时),
-较佳的细胞效能指数(cell performance index)(克寡糖/克生物量),
-较佳的单位生产力(specific productivity)(克寡糖/克生物量·小时),
-较佳的蔗糖产量(yield)(克寡糖/克蔗糖),及/或
-较佳的蔗糖摄取/转化率(克蔗糖/克·小时),
-较佳的乳糖转化/消耗率(克乳糖/小时),及/或
-经提升的该宿主细胞的生长速度。
2.如权利要求1的细胞,其中该膜蛋白是选自运输蛋白(porters)、P-P键水解驱动转运蛋白(P-P-bond-hydrolysis-driven transporters)、及β-桶状孔蛋白(β-Barrel Porins)的群组,其中,
a)当该膜蛋白是选自该运输蛋白的群组,该膜蛋白是选自
-TCDB分类2.A.1.1、2.A.1.2、2.A.1.3、2.A.1.6、2.A.2.2、2.A.7.1及2.A.66的群组,或
-eggnog家族05E8G、05EGZ、05JHE、07QF7、07QRN、07RBJ、0814C及08N8A的群组,或
-PFAM列表PF00893、PF01943、PF05977、PF07690及PF13347,或
-interpro列表IPR000390、IPR001411、IPR001927、IPR002797、IPR004638、IPR005829、IPR010290、IPR011701、IPR020846、IPR023721、IPR023722、IPR032896、IPR036259及IPR039672,或
-源自Cronobacter muytjensii的具有序列识别号01的MdfA、源自里根斯堡预研菌(Yokenella regensburgei)(ATCC43003)的具有序列识别号02的MdfA、源自大肠杆菌(Escherichia coli)K-12 MG1655的具有序列识别号03的MdfA、源自肠杆菌属(Enterobacter sp.)的具有序列识别号04的MdfA、源自克氏柠檬酸杆菌(Citrobacterkoseri)的具有序列识别号05的MFS、源自Citrobacter youngae的具有序列识别号06的MdfA、源自大肠杆菌(Escherichia coli)K-12 MG1655的具有序列识别号07的YbdA、源自源自大肠杆菌(Escherichia coli)K-12 MG1655的具有序列识别号08的YjhB、源自大肠杆菌(Escherichia coli)K-12 MG1655的具有序列识别号09的WzxE、源自大肠杆菌(Escherichia coli)K-12 MG1655的具有序列识别号10的EmrE、源自长双歧杆菌婴儿亚种(Bifidobacterium longum subsp.Infantis)(菌株ATCC 15697)的具有序列识别号11的Blon_2331、源自长双歧杆菌婴儿亚种(Bifidobacterium longum subsp.Infantis)(菌株ATCC 15697)的具有序列识别号12的Blon_0247、源自长双歧杆菌婴儿亚种(Bifidobacterium longum subsp.Infantis)(菌株ATCC 15697)的具有序列识别号13的Blon_0345、源自肺炎克雷伯氏菌(Klebsiella pneumoniae)的具有序列识别号14的IceT、源自阪崎肠杆菌(Cronobacter sakazakii)菌株MOD1_LR753的具有序列识别号53的MdfA、源自粉末佛朗哥氏菌(Franconibacter pulveris)LMG 24059的具有序列识别号54的MdfA、源自霍氏肠杆菌(Enterobacter hormaechei)菌株017的具有序列识别号55的MdfA、源自克氏柠檬酸杆菌(Citrobacter koseri)菌株NCTC10771的具有序列识别号56的MdfA、源自Salmonella enterica subsp.arizonae血清型41:z4,z23:-菌株TAMU30EF的具有序列识别号57的MdfA、源自副痢疾杆菌(Shigella flexneri)菌株585219的具有序列识别号58的MdfA、源自里根斯堡预研菌(Yokenella regensburgei)菌株UMB0819的具有序列识别号59的MdfA、源自大肠杆菌(Escherichia coli)菌株AMC_967的具有序列识别号60的MdfA、源自肺炎克雷伯氏菌(Klebsiella pneumoniae)VAKPC309的具有序列识别号61的MdfA、源自产酸克雷伯氏菌(Klebsiella oxytoca)菌株4928STDY7071490的具有序列识别号62的MdfA、源自密歇根克雷伯氏菌(Klebsiella michiganensis)菌株A2的具有序列识别号63的MdfA、源自Pluralibacter gergoviae菌株FDAARGOS_186的具有序列识别号64的MdfA、源自抗坏血克吕沃尔氏菌(Kluyvera ascorbata)ATCC 33433的具有序列识别号65的MdfA、神户肠杆菌(Enterobacter kobei)的具有序列识别号66的MdfA、源自莱略特菌属(Lelliottia sp.)WB101的具有序列识别号67的MdfA、源自弗氏柠檬酸杆菌(Citrobacter freundii)的具有序列识别号68的MdfA、源自肠道沙门氏菌Salamae亚种(Salmonella entericasubsp.Salamae)的具有序列识别号69的MdfA或源自副痢疾杆菌(Shigella flexneri)的具有序列识别号70的MdfA,或以上任一运输膜蛋白的功能同源物(functional homolog)或功能性片段(functional fragment),或蛋白质序列,其分别与具有序列识别号01、02、03、04、05、06、07、08、09、10、11、12、13、14、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69或70的该膜蛋白的任一个的全长序列,具有至少80%、较佳为至少85%、更佳为至少90%、甚至更佳为至少95.00%、最佳为至少97.00%的序列一致性(sequence identity);
b)当该膜蛋白是选自该P-P键水解驱动转运蛋白的群组,该膜蛋白是选自
-TCDB分类3.A.1.1及3.A.1.2的群组,或
-eggnog家族05CJ1、05DFW、05EZD、05I1K、07HR3及08IJ9的群组,或
-PFAM列表PF00005、PF00528、PF13407及PF17912,或
-interpro列表IPR000515、IPR003439、IPR003593、IPR005978、IPR008995、IPR013456、IPR015851、IPR017871、IPR025997、IPR027417、IPR028082、IPR035906及IPR040582,或
-源自长双歧杆菌婴儿亚种(Bifidobacterium longum subsp.Infantis)(菌株ATCC15697)的具有序列识别号15的Blon_2475、源自大豆慢生根瘤菌(Bradyrhizobiumjaponicum)USDA 110的具有序列识别号16的nodi、源自大肠杆菌(Escherichia coli)K-12MG1655的具有序列识别号17的xylF、源自长双歧杆菌婴儿亚种(Bifidobacterium longumsubsp.Infantis)Bi-26的具有序列识别号18的TIC77290、源自长双歧杆菌婴儿亚种(Bifidobacterium longum subsp.Infantis)Bi-26的具有序列识别号19的TIC77291、源自长双歧杆菌婴儿亚种(Bifidobacterium longum subsp.Infantis)Bi-26的具有序列识别号20的TIC76854 TIC77291,或以上任一P-P键水解驱动转运膜蛋白的功能同源物或功能性片段,或蛋白质序列,其分别与具有序列识别号15、16、17、18、19或20的该膜蛋白的任一个的全长序列,具有至少80%、较佳为至少85%、更佳为至少90%、甚至更佳为至少95.00%、最佳为至少97.00%的序列一致性;或
c)当该膜蛋白是选自该β-桶状孔蛋白的群组,该膜蛋白是选自
-TCDB分类1.B.18,或
-eggnog家族05DAY,或
-PFAM列表PF02563、PF10531及PF18412,或
-interpro列表IPR003715、IPR019554及IPR040716,或
-源自大肠杆菌(Escherichia coli)K-12 MG1655的具有序列识别号21的Wza或其功能同源物或功能片段,或蛋白质序列,其与具有序列识别号21的该膜蛋白的全长序列,具有至少80%、较佳为至少85%、更佳为至少90%、甚至更佳为至少95.00%、最佳为至少97.00%的序列一致性;
其中该TCDB分类是由2019年6月17日发布的TCDB.org所定义、该eggnog家族是由2016年9月发布的eggnogdb 4.5.1所定义、该PFAM列表是由2018年9月所发布的Pfam 32.0所定义、该interpro列表是由2019年7月4日发布的InterPro 75.0所定义。
3.如权利要求1或2的细胞,其中该膜蛋白是选自下列膜蛋白所组成的群组a)该运输膜蛋白源自Cronobacter muytjensii的具有序列识别号01的Mdfa、源自里根斯堡预研菌(Yokenella regensburgei)(ATCC43003)的具有序列识别号02的MdfA、源自大肠杆菌(Escherichia coli)K-12 MG1655的具有序列识别号03的MdfA、源自肠杆菌属(Enterobacter sp.)的具有序列识别号04的MdfA、源自克氏柠檬酸杆菌(Citrobacterkoseri)的具有序列识别号05的MFS、源自Citrobacter youngae的具有序列识别号06的MdfA、源自大肠杆菌(Escherichia coli)K-12 MG1655的具有序列识别号07的YbdA、源自源自大肠杆菌(Escherichia coli)K-12 MG1655的具有序列识别号08的YjhB、源自大肠杆菌(Escherichia coli)K-12 MG1655的具有序列识别号09的WzxE、源自大肠杆菌(Escherichia coli)K-12 MG1655的具有序列识别号10的EmrE、源自长双歧杆菌婴儿亚种(Bifidobacterium longum subsp.Infantis)(菌株ATCC 15697)的具有序列识别号11的Blon_2331、源自长双歧杆菌婴儿亚种(Bifidobacterium longum subsp.Infantis)(菌株ATCC 15697)的具有序列识别号12的Blon_0247、源自长双歧杆菌婴儿亚种(Bifidobacterium longum subsp.Infantis)(菌株ATCC 15697)的具有序列识别号13的Blon_0345、源自肺炎克雷伯氏菌(Klebsiella pneumoniae)的具有序列识别号14的IceT、源自阪崎肠杆菌(Cronobacter sakazakii)菌株MOD1_LR753的具有序列识别号53的MdfA、源自粉末佛朗哥氏菌(Franconibacter pulveris)LMG 24059的具有序列识别号54的MdfA、源自霍氏肠杆菌(Enterobacter hormaechei)菌株017的具有序列识别号55的MdfA、源自克氏柠檬酸杆菌(Citrobacter koseri)菌株NCTC10771的具有序列识别号56的MdfA、源自肠道沙门氏菌arizonae亚种(Salmonella enterica subsp.arizonae)血清型41:z4,z23:-菌株TAMU30EF的具有序列识别号57的MdfA、源自副痢疾杆菌(Shigella flexneri)菌株585219的具有序列识别号58的MdfA、源自里根斯堡预研菌(Yokenella regensburgei)菌株UMB0819的具有序列识别号59的MdfA、源自大肠杆菌(Escherichia coli)菌株AMC_967的具有序列识别号60的MdfA、源自肺炎克雷伯氏菌(Klebsiella pneumoniae)VAKPC309的具有序列识别号61的MdfA、源自产酸克雷伯氏菌(Klebsiella oxytoca)菌株4928STDY7071490的具有序列识别号62的MdfA、源自密歇根克雷伯氏菌(Klebsiella michiganensis)菌株A2的具有序列识别号63的MdfA、源自Pluralibacter gergoviae菌株FDAARGOS_186的具有序列识别号64的MdfA、源自抗坏血克吕沃尔氏菌(Kluyvera ascorbata)ATCC 33433的具有序列识别号65的MdfA、神户肠杆菌(Enterobacter kobei)的具有序列识别号66的MdfA、源自莱略特菌属(Lelliottia sp.)WB101的具有序列识别号67的MdfA、源自弗氏柠檬酸杆菌(Citrobacter freundii)的具有序列识别号68的MdfA、源自肠道沙门氏菌Salamae亚种(Salmonella enterica subsp.Salamae)的具有序列识别号69的MdfA或源自副痢疾杆菌(Shigella flexneri)的具有序列识别号70的MdfA,或以上任一运输膜蛋白的功能同源物或功能性片段,或蛋白质序列,其分别与具有序列识别号01、02、03、04、05、06、07、08、09、10、11、12、13、14、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69或70的该膜蛋白的全长序列,具有至少80%、较佳为至少85%、更佳为至少90%、甚至更佳为至少95.00%、最佳为至少97.00%的序列一致性;及
b)该P-P键水解驱动转运蛋白源自长双歧杆菌婴儿亚种(Bifidobacterium longumsubsp.Infantis)(菌株ATCC 15697)的具有序列识别号15的Blon_2475、源自大豆慢生根瘤菌(Bradyrhizobium japonicum)USDA 110的具有序列识别号16的nodi、源自大肠杆菌(Escherichia coli)K-12 MG1655的具有序列识别号17的xylF、源自长双歧杆菌婴儿亚种(Bifidobacterium longum subsp.Infantis)Bi-26的具有序列识别号18的TIC77290、源自长双歧杆菌婴儿亚种(Bifidobacterium longum subsp.Infantis)Bi-26的具有序列识别号19的TIC77291、源自长双歧杆菌婴儿亚种(Bifidobacterium longum subsp.Infantis)Bi-26的具有序列识别号20的TIC76854 TIC77291,或以上任一P-P键水解驱动转运膜蛋白的功能同源物或功能性片段,或蛋白质序列,其与任一具有序列识别号15、16、17、18、19或20的该膜蛋白的全长序列,分别具有至少80%、较佳为至少85%、更佳为至少90%、甚至更佳为至少95.00%、最佳为至少97.00%的序列一致性;及
c)该β-桶状膜孔蛋白源自大肠杆菌(Escherichia coli)K-12 MG1655的具有序列识别号21的Wza或该Wza蛋白的功能同源物或功能片段,或蛋白质序列,其与具有序列识别号21的该膜蛋白的全长序列,具有至少80%、较佳为至少85%、更佳为至少90%、甚至更佳为至少95.00%、最佳为至少97.00%的序列一致性。
4.如权利要求1至3任一项的细胞,其中该膜蛋白是选自下列膜蛋白所组成的群组
a)以序列识别号01、02、04、05、06、09、10、11、12、13、14、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69或70表示的该运输膜蛋白,或该任一运输膜蛋白的功能同源物或功能性片段,或蛋白质序列,其分别与具有序列识别号01、02、04、05、06、09、10、11、12、13、14、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69或70的该膜蛋白的全长序列,具有至少80%、较佳为至少85%、更佳为至少90%、甚至更佳为至少95.00%、最佳为至少97.00%的序列一致性;及
b)以序列识别号15、16、17、18、19或20表示的该P-P键水解驱动转运蛋白,或该任一P-P键水解驱动转运膜蛋白的功能同源物或功能性片段,或蛋白质序列,其分别与具有序列识别号15、16、17、18、19或20的该膜蛋白的全长序列,具有至少80%、较佳为至少85%、更佳为至少90%、甚至更佳为至少95.00%、最佳为至少97.00%的序列一致性;及
c)以序列识别号21表示的该β-桶状膜孔蛋白,或该β-桶状膜孔蛋白的功能同源物或功能片段,或蛋白质序列,其与具有序列识别号21的该膜蛋白的全长序列,具有至少80%、较佳为至少85%、更佳为至少90%、甚至更佳为至少95.00%、最佳为至少97.00%的序列一致性。
5.如权利要求1至4任一项的细胞,其中该膜蛋白是选自下列膜蛋白所组成的群组
a)以序列识别号01、02、04、05、06、09、10、11、12、13、14、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69或70表示的该运输膜蛋白,或该运输膜蛋白的任一个的功能同源物或功能性片段,或蛋白质序列:
-分别与具有序列识别号09、10、11、12或13的该膜蛋白的全长序列具有至少80%的序列一致性,
-分别与具有序列识别号01、02、04、14、53、54、55、59、61、62、63、64、65、66、67或69的该膜蛋白的全长序列具有至少90%的序列一致性,
-分别与具有序列识别号05、06、56、57或68的该膜蛋白的全长序列具有至少95.00%的的序列一致性,或
-分别与具有序列识别号58、60或70的该膜蛋白的全长序列具有至少99.00%的的序列一致性,及
b)以序列识别号15、16、17、18、19或20表示的该P-P键水解驱动转运蛋白,或该任一P-P键水解驱动转运膜蛋白的功能同源物或功能性片段,或蛋白质序列,其分别与具有序列识别号15、16、17、18、19或20的该膜蛋白的全长序列,具有至少80%、较佳为至少85%、更佳为至少90%、甚至更佳为至少95.00%、最佳为至少97.00%的序列一致性;及
c)以序列识别号21表示的该β-桶状膜孔蛋白,或该β-桶状膜孔蛋白的功能同源物或功能片段,或蛋白质序列,其与具有序列识别号21的该膜蛋白的全长序列,具有至少80%、较佳为至少85%、更佳为至少90%、甚至更佳为至少95.00%、最佳为至少97.00%的序列一致性。
6.如权利要求1至4任一项的细胞,其中该膜蛋白是选自下列膜蛋白所组成的群组
a)以序列识别号01、02、04、09、10、11、12、13、14、53、54、55、59、61、62、63、64、65、66、67或69表示的该运输膜蛋白,或该任一运输膜蛋白的功能同源物或功能性片段,或蛋白质序列,其分别与具有序列识别号01、02、04、09、10、11、12、13、14、53、54、55、59、61、62、63、64、65、66、67或69的该膜蛋白的全长序列,具有至少80%、较佳为至少85%、更佳为至少90%、甚至更佳为至少95.00%、最佳为至少97.00%的序列一致性;及
b)以序列识别号15、16、17、18、19或20表示的该P-P键水解驱动转运蛋白,或该任一P-P键水解驱动转运膜蛋白的功能同源物或功能性片段,或蛋白质序列,其分别与具有序列识别号15、16、17、18、19或20的该膜蛋白的全长序列,具有至少80%、较佳为至少85%、更佳为至少90%、甚至更佳为至少95.00%、最佳为至少97.00%的序列一致性;及
c)以序列识别号21表示的该β-桶状膜孔蛋白,或该β-桶状膜孔蛋白的功能同源物或功能片段,或蛋白质序列,其与具有序列识别号21的该膜蛋白的全长序列,具有至少80%、较佳为至少85%、更佳为至少90%、甚至更佳为至少95.00%、最佳为至少97.00%的序列一致性。
7.如权利要求1至4任一项或第6项的细胞,其中该膜蛋白是选自下列膜蛋白所组成的群组
a)以序列识别号01、02、04、09、10、11、12、13、14、53、54、55、59、61、62、63、64、65、66、67或69表示的该运输膜蛋白,或该任一运输膜蛋白的功能同源物或功能性片段,或蛋白质序列,其分别与具有序列识别号01、02、04、09、10、11、12、13、14、53、54、55、59、61、62、63、64、65、66、67或69的该膜蛋白的全长序列,具有至少90%、较佳为至少95.00%、更佳为至少97.00%的序列一致性;及
b)以序列识别号15、16、17、18、19或20表示的该P-P键水解驱动转运蛋白,或该任一P-P键水解驱动转运膜蛋白的功能同源物或功能性片段,或蛋白质序列,其分别与具有序列识别号15、16、17、18、19或20的该膜蛋白的全长序列,具有至少80%、较佳为至少85%、更佳为至少90%、甚至更佳为至少95.00%、最佳为至少97.00%的序列一致性;及
c)以序列识别号21表示的该β-桶状膜孔蛋白,或该β-桶状膜孔蛋白的功能同源物或功能片段,或蛋白质序列,其与具有序列识别号21的该膜蛋白的全长序列,具有至少80%、较佳为至少85%、更佳为至少90%、甚至更佳为至少95.00%、最佳为至少97.00%的序列一致性。
8.如权利要求1至3任一项的细胞,其中该膜蛋白是选自下列膜蛋白所组成的群组
a)以序列识别号01、02、03、04、05、06、07、08、09、10、11、12、13、14、53、54、55、56、57、58、59、60、61、62、63、64或65表示的该运输膜蛋白,或该任一运输膜蛋白的功能同源物或功能性片段,或蛋白质序列,其分别与具有序列识别号01、02、03、04、05、06、07、08、09、10、11、12、13、14、53、54、55、56、57、58、59、60、61、62、63、64或65的该膜蛋白的全长序列,具有至少80%、较佳为至少85%、更佳为至少90%、甚至更佳为至少95.00%、最佳为至少97.00%的序列一致性;及
b)以序列识别号15、16、17、18、19或20表示的该P-P键水解驱动转运蛋白,或该任一P-P键水解驱动转运膜蛋白的功能同源物或功能性片段,或蛋白质序列,其分别与具有序列识别号15、16、17、18、19或20的该膜蛋白的全长序列,具有至少80%、较佳为至少85%、更佳为至少90%、甚至更佳为至少95.00%、最佳为至少97.00%的序列一致性;及
c)以序列识别号21表示的该β-桶状膜孔蛋白,或该β-桶状膜孔蛋白的功能同源物或功能片段,或蛋白质序列,其与具有序列识别号21的该膜蛋白的全长序列,具有至少80%、较佳为至少85%、更佳为至少90%、甚至更佳为至少95.00%、最佳为至少97.00%的序列一致性。
9.如权利要求1至3任一项或第8项的细胞,其中该膜蛋白是选自下列膜蛋白所组成的群组
a)以序列识别号01、02、04、05、06、09、10、11、12、13、14、53、54、55、56、57、58、59、60、61、62、63、64或65表示的该运输膜蛋白,或该任一运输膜蛋白的功能同源物或功能性片段,或蛋白质序列,其分别与具有序列识别号01、02、04、05、06、09、10、11、12、13、14、53、54、55、56、57、58、59、60、61、62、63、64或65的该膜蛋白的全长序列,具有至少80%、较佳为至少85%、更佳为至少90%、甚至更佳为至少95.00%、最佳为至少97.00%的序列一致性;及
b)以序列识别号15、16、17、18、19或20表示的该P-P键水解驱动转运蛋白,或该任一P-P键水解驱动转运膜蛋白的功能同源物或功能性片段,或蛋白质序列,其分别与具有序列识别号15、16、17、18、19或20的该膜蛋白的全长序列,具有至少80%、较佳为至少85%、更佳为至少90%、甚至更佳为至少95.00%、最佳为至少97.00%的序列一致性;及
c)以序列识别号21表示的该β-桶状膜孔蛋白,或该β-桶状膜孔蛋白的功能同源物或功能片段,或蛋白质序列,其与具有序列识别号21的该膜蛋白的全长序列,具有至少80%、较佳为至少85%、更佳为至少90%、甚至更佳为至少95.00%、最佳为至少97.00%的序列一致性。
10.如权利要求1至3、8或9任一项的细胞,其中该膜蛋白是选自下列膜蛋白所组成的群组
a)以序列识别号01、02、04、05、06、09、10、11、12、13、14、53、54、55、56、57、58、59、60、61、62、63、64或65表示的该运输膜蛋白,或该任一运输膜蛋白的功能同源物或功能性片段,或蛋白质序列:
-分别与具有序列识别号09、10、11、12或13的该膜蛋白的全长序列具有至少80%的序列一致性,
-分别与具有序列识别号01、02、04、14、53、54、55、59、61、62、63、64或65的该膜蛋白的全长序列具有至少90%的序列一致性,
-分别与具有序列识别号05、06、56或57的该膜蛋白的全长序列具有至少95.00%的的序列一致性,或
-分别与具有序列识别号58或60的该膜蛋白的全长序列具有至少99.00%的的序列一致性,及
b)以序列识别号15、16、17、18、19或20表示的该P-P键水解驱动转运蛋白,或该任一P-P键水解驱动转运膜蛋白的功能同源物或功能性片段,或蛋白质序列,其分别与具有序列识别号15、16、17、18、19或20的该膜蛋白的全长序列,具有至少80%、较佳为至少85%、更佳为至少90%、甚至更佳为至少95.00%、最佳为至少97.00%的序列一致性;及
c)以序列识别号21表示的该β-桶状膜孔蛋白,或该β-桶状膜孔蛋白的功能同源物或功能片段,或蛋白质序列,其与具有序列识别号21的该膜蛋白的全长序列,具有至少80%、较佳为至少85%、更佳为至少90%、甚至更佳为至少95.00%、最佳为至少97.00%的序列一致性。
11.如权利要求1至3、8或9任一项的细胞,其中该膜蛋白是选自下列膜蛋白所组成的群组
a)以序列识别号01、02、04、09、10、11、12、13、14、53、54、55、59、61、62、63、64或65表示的该运输膜蛋白,或该任一运输膜蛋白的功能同源物或功能性片段,或蛋白质序列,其分别与具有序列识别号01、02、04、09、10、11、12、13、14、53、54、55、59、61、62、63、64或65的该膜蛋白的全长序列,具有至少80%、较佳为至少85%、更佳为至少90%、甚至更佳为至少95.00%、最佳为至少97.00%的序列一致性;及
b)以序列识别号15、16、17、18、19或20表示的该P-P键水解驱动转运蛋白,或该任一P-P键水解驱动转运膜蛋白的功能同源物或功能性片段,或蛋白质序列,其分别与序列识别号15、16、17、18、19或20的该膜蛋白的全长序列,具有至少80%、较佳为至少85%、更佳为至少90%、甚至更佳为至少95.00%、最佳为至少97.00%的序列一致性;及
c)以序列识别号21表示的该β-桶状膜孔蛋白,或该β-桶状膜孔蛋白的功能同源物或功能片段,或蛋白质序列,其与具有序列识别号21的该膜蛋白的全长序列,具有至少80%、较佳为至少85%、更佳为至少90%、甚至更佳为至少95.00%、最佳为至少97.00%的序列一致性。
12.如权利要求1至3、8、9或11任一项的细胞,其中该膜蛋白是选自下列膜蛋白所组成的群组
a)以序列识别号01、02、04、09、10、11、12、13、14、53、54、55、59、61、62、63、64或65表示的该运输膜蛋白,或该任一运输膜蛋白的功能同源物或功能性片段,或蛋白质序列,其分别与具有序列识别号01、02、04、09、10、11、12、13、14、53、54、55、59、61、62、63、64或65的该膜蛋白的全长序列,具有至少90%、较佳为至少95.00%、更佳为至少97.00%的序列一致性;及
b)以序列识别号15、16、17、18、19或20表示的该P-P键水解驱动转运蛋白,或该任一P-P键水解驱动转运膜蛋白的功能同源物或功能性片段,或蛋白质序列,其分别与具有序列识别号15、16、17、18、19或20的该膜蛋白的全长序列,具有至少80%、较佳为至少85%、更佳为至少90%、甚至更佳为至少95.00%、最佳为至少97.00%的序列一致性;及
c)以序列识别号21表示的该β-桶状膜孔蛋白,或该β-桶状膜孔蛋白的功能同源物或功能片段,或蛋白质序列,其与具有序列识别号21的该膜蛋白的全长序列,具有至少80%、较佳为至少85%、更佳为至少90%、甚至更佳为至少95.00%、最佳为至少97.00%的序列一致性。
13.如权利要求1至12任一项的细胞,其中该膜蛋白是参与运输化合物跨越细胞壁外膜的转运蛋白。
14.如权利要求1至13任一项的细胞,其中该糖基转移酶是选自包括下列清单:岩藻糖基转移酶、唾液酸转移酶、半乳糖基转移酶、葡萄糖基转移酶、甘露糖基转移酶、N-乙酰葡萄糖胺转移酶、N-乙酰半乳糖胺转移酶、N-乙酰甘露糖胺转移酶、木糖基转移酶、葡萄糖醛酸转移酶、半乳糖醛酸转移酶、葡萄糖胺转移酶、N-羟乙酰神经氨酸转移酶、鼠李糖基转移酶、N-乙酰鼠李糖胺转移酶、UDP-4-氨基-4,6-二脱氧基-N-乙酰基-β-L-阿卓糖胺转氨酶、UDP-N-乙酰氨基葡萄糖胺烯醇丙酮基转移酶及岩藻糖胺转移酶,
较佳为其中该细胞被至少一个该糖基转移酶修饰表达或活性。
15.如权利要求1至14任一项的细胞,其中该包括乳糖-N-三糖(LN3;GlcNAc-beta1,3-Gal-beta1,4-Glc)作为核心三糖的寡糖是哺乳动物乳寡糖(mammalian milkoligosaccharide)或Lewis型抗原寡糖。
16.如权利要求1至15任一项的细胞,其中该包括乳糖-N-三糖(LN3;GlcNAc-beta1,3-Gal-beta1,4-Glc)作为核心三糖的寡糖是哺乳动物乳寡糖(MMO)、较佳为人乳寡糖(HMO)、更佳为具有LNT或LNnT作为核心三糖的MMO或HMO、甚至更佳为具有LNT或LNnT作为核心三糖的HMO、最佳为LNT或LNnT。
17.如权利要求1至16任一项的细胞,其中该包括乳糖-N-三糖(LN3;GlcNAc-beta1,3-Gal-beta1,4-Glc)作为核心三糖的寡糖是中性寡糖。
18.如权利要求1至17任一项的细胞,其中该包括乳糖-N-三糖(LN3;GlcNAc-beta1,3-Gal-beta1,4-Glc)作为核心三糖的寡糖是选自包括下列清单:乳糖-N-三糖、乳糖-N-四糖、乳糖-N-新四糖、乳糖-N-岩藻五糖I、乳糖-N-新岩藻五糖I、乳糖-N-岩藻五糖II、乳糖-N-岩藻五糖III、乳糖-N-岩藻五糖V、乳糖-N-岩藻五糖VI、乳糖-N-新岩藻五糖V、乳糖-N-二岩藻六糖I、乳糖-N-二岩藻六糖II、乳糖-N-六糖(lacto-N-hexaose,LNH)、乳糖-N-新六糖(lacto-N-neohexaose,LNnH)、对-乳糖-N-六糖(para-lacto-N-hexaose,pLNnH)、对-乳糖-N-新六糖(para-lacto-N-neohexaose,pLNH)、二岩藻糖基-乳糖-N-六糖、二岩藻糖基-乳糖-N-新六糖、乳糖-N-五糖(lacto-N-pentaose,LNP)、乳糖-N-新五糖、对乳糖-N-五糖、对乳糖-N-新五糖、乳糖-N-novo五糖I、乳糖-N-七糖、乳糖-N-新七糖、对乳糖-N-新七糖、对乳糖-N-七糖、乳糖-N-八糖(lacto-N-octaose,LNO)、乳糖-N-新八糖、异乳糖-N-八糖、对乳糖-N-八糖、异乳糖-N-新八糖、novo乳糖-N-新八糖、对乳糖-N-新八糖、异乳糖-N-九糖、novo乳糖-N-九糖、乳糖-N-九糖、乳糖-N-十糖、异乳糖-N-十糖、novo乳糖-N-十糖、乳糖-N-新十糖、唾液酸基-乳糖-N-四糖a(Sialyl-lacto-N-tetraose a)、唾液酸基-乳糖-N-四糖b、唾液酸基-乳糖-N-四糖c、唾液酸基-乳糖-N-四糖d。
19.如权利要求1至18任一项的细胞,其中该糖基转移酶是N-乙酰葡萄糖胺β-1,3-半乳糖基转移酶或N-乙酰葡萄糖胺β-1,4-半乳糖基转移酶,其自UDP-Gal供体透过β-1,3或β-1,4键结转移半乳糖(Gal)至LN3的末端GlcNAC残基上,从而分别产生乳糖-N-四糖(LNT;Gal-beta1,3-GlcNAc-beta1,3-Gal-beta1,4-Glc)或乳糖-N-新四糖(LNnT;Gal-beta1,4-GlcNAc-beta1,3-Gal-beta1,4-Glc)。
20.如权利要求19的细胞,其中该细胞在整个肉汤(broth)及/或上清液中,产生90g/L或更多的LNT,及/或其中该LNT在整个肉汤及/或上清液中具有至少80%的纯度,依据该细胞在整个肉汤及/或上清液中产生的LNT及LN3的总量所分别测量。
21.如权利要求19的细胞,其中该细胞在整个肉汤及/或上清液中,产生70g/L或更多的、较佳为90g/L或更多的LNnt及/或其中该LNnT在整个肉汤及/或上清液中具有至少80%的纯度,依据该细胞在整个肉汤及/或上清液中产生的LNnT及LN3的总量所分别测量。
22.如权利要求1至12任一项的细胞,其中该细胞是更能合成核苷酸活化糖,用于生产该包括乳糖-N-三糖(LN3;GlcNAc-beta1,3-Gal-beta1,4-Glc)作为核心三糖的寡糖。
23.如权利要求22的细胞,其中该核苷酸活化糖是选自包括下列清单:UDP-N-乙酰半乳糖胺(UDP-GalNAc)、UDP-N-乙酰甘露糖胺(UDP-ManNAc)、UDP-葡萄糖(UDP-Glc)、UDP-半乳糖(UDP-Gal)、GDP-甘露糖(GDP-Man)、UDP-葡萄糖醛酸盐、UDP-半乳糖醛酸盐、UDP-2-乙酰氨基-2,6-二脱氧基-L-阿拉伯糖-4-己酮糖、UDP-2-乙酰氨基-2,6-二脱氧基-L-木糖-4-己酮糖(UDP-2-acetamido-2,6-dideoxy-L-lyxo-4-hexulose)、UDP-N-乙酰基-L-鼠李糖胺(UDP-L-RhaNAc或UDP-2-乙酰氨基-2,6-二脱氧基-L-甘露糖(UDP-2-acetamido-2,6-dideoxy-L-mannose))、dTDP-N-乙酰岩藻糖胺、UDP-N-乙酰岩藻糖胺(UDP-L-FucNAc或UDP-2-乙酰氨基-2,6-二脱氧基-L-半乳糖)、UDP-N-乙酰-L-脱氧塔罗糖胺(UDP-N-acetyl-L-pneumosamine)(UDP-L-PneNAC或UDP-2-乙酰氨基-2,6-二脱氧基-L-塔罗糖(UDP-2-acetamido-2,6-dideoxy-L-talose))、UDP-N-乙酰胞壁酸(UDP-N-acetylmuramic acid)、UDP-N-乙酰基-L-奎诺糖胺(UDP-N-acetyl-L-quinovosamine)(UDP-L-QuiNAc或UDP-2-乙酰氨基-2,6-二脱氧基-L-葡萄糖(UDP-2-acetamido-2,6-dideoxy-L-glucose))、CMP-唾液酸(CMP-Neu5Ac)、CMP-N-羟乙酰神经氨酸(CMP-Neu5Gc)、GDP-岩藻糖、GDP-鼠李糖及UDP-木糖。
24.如权利要求1至23任一项的细胞,其中该细胞包括分解代谢途径,用于经选择的至少部分未活化的单、双或寡糖,该单、双或寡糖参与及/或需要于包括LN3作为核心三糖的寡糖的合成。
25.如权利要求1至24任一项的细胞,其中该细胞利用前驱物以合成该包括LN3作为核心三糖的寡糖。
26.如权利要求1至25任一项的细胞,其中该膜蛋白参与前驱物的摄取,以合成该包括LN3作为核心三糖的寡糖。
27.如权利要求1至26任一项的细胞,其中该细胞产生前驱物,以合成该包括LN3作为核心三糖的寡糖。
28.如权利要求1至27任一项的细胞,其中该细胞是稳定地培养于培养基(medium)中。
29.如权利要求1至28任一项的细胞,其中该细胞是微生物、植物细胞、动物细胞、昆虫细胞或原生动物细胞,其中较佳为
-该微生物是细菌、真菌或酵母菌,
-该植物细胞是烟草、苜蓿、米、棉、油菜、大豆、玉蜀黍或玉米,及/或细胞
-该动物细胞是源自非人类的哺乳动物、鸟类、鱼类、无脊椎动物、爬虫类或两栖类,或该动物细胞是源自排除胚胎干细胞的人类细胞的基因修饰细胞。
30.如权利要求29的细胞,其中该细胞是细菌,较佳为大肠杆菌菌株,更佳为K-12菌株的大肠杆菌菌株的细胞、甚至更佳为该大肠杆菌K-12菌株为E.coliMG1655。
31.如权利要求1至30任一项的细胞,其中该细胞具有合成包括至少寡糖的寡糖混合物的能力,该至少寡糖包括LN3作为核心三糖。
32.一种藉由基因修饰细胞产生包括乳糖-N-三糖(LN3;GlcNAc-beta1,3-Gal-beta1,4-Glc)作为核心三糖的寡糖的方法,包括步骤:
a)提供如权利要求1至31任一项的细胞,及
b)在允许产生该包括LN3作为核心三糖的寡糖的条件下,培养该细胞于培养基中,及
c)较佳为将该包括LN3作为核心三糖的寡糖或包括至少寡糖的寡糖混合物,分别自该培养分离,该至少寡糖包括LN3作为核心三糖。
33.如权利要求32的方法,该方法更包括至少一个下列步骤:
i)添加乳糖给料于该培养培养基,该乳糖给料包括至少50、更佳为至少75、更佳为至少100、更佳为至少120、更佳为至少150克乳糖每升的初始反应器体积(initial reactorvolum),其中该反应器体积介于250mL至10.000m3(立方米)范围之间,较佳为以连续方式,且较佳为以使该培养培养基的最终体积为不多于添加该乳糖给料前该培养培养基的体积的三倍、较佳为不多于两倍、更佳为少于两倍;
ii)藉由给料溶液,在1日、2日、3日、4日、5日的过程中,以连续方式添加乳糖给料于培养培养基;
iii)藉由给料溶液,在1日、2日、3日、4日、5日的过程中,以连续方式添加乳糖给料于培养培养基,且其中该乳糖给料溶液的浓度为50g/L、较佳为75g/L、更佳为100g/L、更佳为125g/L、更佳为150g/L、更佳为175g/L、更佳为200g/L、更佳为225g/L、更佳为250g/L、275g/L、更佳为300g/L、更佳为325g/L、更佳为350g/L、更佳为375g/L、更佳为400g/L、更佳为450g/L、更佳为500g/L、甚至更佳为550g/L、最佳为600g/L;以及较佳为该溶液的PH值是设定于3至7之间,且其中较佳为该给料溶液之温度为保持于20℃至80℃之间;
该方法致生包括乳糖-N-三糖(LN3;GlcNAc-beta1,3-Gal-beta1,4-Glc)作为核心三糖的寡糖,其于该培养培养基的最终体积中具有至少50g/L、较佳为至少75g/L、更佳为至少90g/L、更佳为至少100g/L、更佳为至少125g/L、更佳为至少150g/L、更佳为至少175g/L、更佳为至少200g/L的浓度。
34.如权利要求33的方法,其中该乳糖给料,是透过自开始培养时以至少5mM的浓度、较佳为以至少30、40、50、60、70、80、90、100、150mM的浓度、更佳为以大于300mM的浓度添加乳糖来达成。
35.如权利要求33或34的方法,其中该乳糖给料,是透过以一种浓度添加乳糖至培养培养基来达成,以致在整个培养的生产阶段,获得浓度至少为5mM、较佳为至少10mM或30mM的乳糖。
36.如权利要求32至35任一项的方法,其中该宿主细胞被培养至少约60、80、100或约120小时,或以连续方式培养。
37.如权利要求32至36任一项的方法,其中碳及能量来源,较佳为葡萄糖、甘油、果糖、麦芽糖、阿拉伯糖、麦芽糊精、麦芽寡糖(malto-oligosacchraides)、麦芽三糖、山梨醇、木糖、鼠李糖、蔗糖、半乳糖、甘露糖、甲醇、乙醇、海藻糖、淀粉、纤维素、半纤维素、多元醇、玉米浸液(corn-steep liquor)、高果糖浆(high-fructose syrup)、琥珀酸盐、苹果酸盐、醋酸盐、柠檬酸盐、乳酸及丙酮酸盐,亦被添加,较佳为持续添加至培养培养基,并较佳为搭配乳糖。
38.如权利要求32至37任一项的方法,其中指数细胞成长的第一期,是藉由在第二期添加乳糖至该培养培养基之前,添加碳基底物且较佳为葡萄糖或果糖至该培养培养基来提供。
39.如权利要求32至38任一项的方法,其中该分离包括至少一个下列步骤:澄清(clarification)、超过滤、纳米过滤、逆渗透、微过滤、活性炭或碳处理、切向流高效能过滤(tangential flow high-performance filtration)、切向流超过滤(tangential flowultrafiltration)、亲和力层析、离子交换层析、疏水性相互作用层析及/或凝胶过滤、配位基交换层析。
40.如权利要求32至39任一项的方法,更包括分别自该细胞纯化该包括LN3作为核心三糖的寡糖或包括至少寡糖的寡糖混合物,该至少寡糖包括LN3作为核心三糖。
41.如权利要求32至40任一项的方法,其中该纯化包括至少一个下列步骤:利用活性炭或碳、利用木炭、纳米过滤、超过滤或离子交换、利用醇类、利用含水醇类混合物、结晶化、蒸发、沉淀、干燥、喷雾干燥或冷冻干燥。
42.一种选自如权利要求1至12任一项中所定义的膜蛋白的群组的膜蛋白于发酵生产包括LN3作为核心三糖的寡糖中的用途。
43.一种如权利要求1至31项的细胞用于产生包括LN3作为核心三糖的寡糖的用途。
44.一种如权利要求31的细胞用于产生包括至少寡糖的寡糖混合物的用途,该至少寡糖包括LN3作为核心三糖。
45.一种如权利要求32至41任一项的方法用于产生包括LN3作为核心三糖的寡糖的用途。
CN202280010589.6A 2021-01-20 2022-01-20 在宿主细胞中产生包含ln3作为核心结构的寡糖 Pending CN116745430A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
EP21152592.8 2021-01-20
EP21152592 2021-01-20
PCT/EP2022/051163 WO2022157213A1 (en) 2021-01-20 2022-01-20 Production of oligosaccharides comprising ln3 as core structure in host cells

Publications (1)

Publication Number Publication Date
CN116745430A true CN116745430A (zh) 2023-09-12

Family

ID=74194595

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202280010589.6A Pending CN116745430A (zh) 2021-01-20 2022-01-20 在宿主细胞中产生包含ln3作为核心结构的寡糖

Country Status (7)

Country Link
US (1) US20240117398A1 (zh)
EP (1) EP4281577A1 (zh)
KR (1) KR20230134558A (zh)
CN (1) CN116745430A (zh)
AU (1) AU2022210808A1 (zh)
TW (1) TW202246496A (zh)
WO (1) WO2022157213A1 (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2023120615A1 (ja) * 2021-12-21 2023-06-29 協和発酵バイオ株式会社 コア3糖としてラクト-n-トリオースiiを含む糖質の製造方法および該糖質の結晶の製造方法
CN115369064B (zh) * 2022-09-30 2023-07-07 海南师范大学 一种增强生防贝莱斯芽孢杆菌根际定殖和防效的多功能复合菌剂的开发和应用
WO2024089131A1 (en) 2022-10-25 2024-05-02 Inbiose N.V. Saccharide importers for lacto-n-triose

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5998130B2 (ja) 2010-07-12 2016-09-28 ユニヴェルシテイト ヘントUniversiteit Gent 付加価値バイオ生成物の生成のための代謝操作された生物
CA2958786A1 (en) 2014-11-14 2016-05-19 Universiteit Gent Mutant microorganisms resistant to lactose killing
EP3141610A1 (en) * 2015-09-12 2017-03-15 Jennewein Biotechnologie GmbH Production of human milk oligosaccharides in microbial hosts with engineered import / export
EP3445770A4 (en) * 2016-04-19 2020-03-18 Glycom A/S SEPARATION OF OLIGOSACCHARIDES FROM A FERMENTATION BROTH
KR20190098246A (ko) 2016-12-27 2019-08-21 인바이오스 엔.브이. 시알일화 화합물의 인 비보 합성
EP3569713A1 (en) * 2018-05-16 2019-11-20 Jennewein Biotechnologie GmbH Use of glycosidases in the production of oligosaccharides
KR20210095128A (ko) * 2018-10-02 2021-07-30 지미텍, 인크. 올리고당류의 외수송을 위한 기질 내수송체의 용도
CN114787343A (zh) 2019-10-03 2022-07-22 龟树实验室私人有限公司 营养组合物以及用于生产其的方法、试剂盒和细胞组合物
BR112022014367A2 (pt) * 2020-01-23 2022-09-13 Glycom As Produção de hmo

Also Published As

Publication number Publication date
TW202246496A (zh) 2022-12-01
AU2022210808A1 (en) 2023-08-31
US20240117398A1 (en) 2024-04-11
WO2022157213A1 (en) 2022-07-28
KR20230134558A (ko) 2023-09-21
EP4281577A1 (en) 2023-11-29

Similar Documents

Publication Publication Date Title
US20230416796A1 (en) Production of galactosylated di- and oligosaccharides
CN116745430A (zh) 在宿主细胞中产生包含ln3作为核心结构的寡糖
EP4192945A1 (en) Cellular production of sialylated di- and/or oligosaccharides
EP4192946A1 (en) Cellular production of di- and/or oligosaccharides
KR20230132539A (ko) 글리코실화된 생산물의 세포 생산
TW202219275A (zh) 在細胞中之含有GlcNAc的生物產品的產生
WO2023175079A1 (en) Sialyltransferases for the production of sialylated oligosaccharides
WO2023187109A1 (en) Sialyltransferases for the production of sialylated oligosaccharides
TW202221134A (zh) 半乳糖化雙醣與寡醣的產生
WO2023111141A1 (en) Sialyltransferases for the production of sialylated oligosaccharides
AU2022312712A1 (en) Lacto-n-biose converting fucosyltransferases
TW202212572A (zh) 藉由細胞製造中性岩藻糖基化寡醣之混合物
KR20240008322A (ko) 발효 생산

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination