CN117222736A - 生物产物的细胞生产 - Google Patents

生物产物的细胞生产 Download PDF

Info

Publication number
CN117222736A
CN117222736A CN202280028738.1A CN202280028738A CN117222736A CN 117222736 A CN117222736 A CN 117222736A CN 202280028738 A CN202280028738 A CN 202280028738A CN 117222736 A CN117222736 A CN 117222736A
Authority
CN
China
Prior art keywords
cell
udp
neu
phosphate
cells
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202280028738.1A
Other languages
English (en)
Inventor
J·博普雷兹
P·库西蒙特
T·德寇内
A·瓦考特兰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Inbiose NV
Original Assignee
Inbiose NV
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Inbiose NV filed Critical Inbiose NV
Publication of CN117222736A publication Critical patent/CN117222736A/zh
Pending legal-status Critical Current

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/10Transferases (2.)
    • C12N9/1085Transferases (2.) transferring alkyl or aryl groups other than methyl groups (2.5)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/52Genes encoding for enzymes or proenzymes
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/16Hydrolases (3) acting on ester bonds (3.1)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P19/00Preparation of compounds containing saccharide radicals
    • C12P19/02Monosaccharides
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P19/00Preparation of compounds containing saccharide radicals
    • C12P19/04Polysaccharides, i.e. compounds containing more than five saccharide radicals attached to each other by glycosidic bonds
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P19/00Preparation of compounds containing saccharide radicals
    • C12P19/12Disaccharides
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P19/00Preparation of compounds containing saccharide radicals
    • C12P19/18Preparation of compounds containing saccharide radicals produced by the action of a glycosyl transferase, e.g. alpha-, beta- or gamma-cyclodextrins
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P19/00Preparation of compounds containing saccharide radicals
    • C12P19/26Preparation of nitrogen-containing carbohydrates
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P19/00Preparation of compounds containing saccharide radicals
    • C12P19/44Preparation of O-glycosides, e.g. glucosides
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P21/00Preparation of peptides or proteins
    • C12P21/005Glycopeptides, glycoproteins
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12RINDEXING SCHEME ASSOCIATED WITH SUBCLASSES C12C - C12Q, RELATING TO MICROORGANISMS
    • C12R2001/00Microorganisms ; Processes using microorganisms
    • C12R2001/01Bacteria or Actinomycetales ; using bacteria or Actinomycetales
    • C12R2001/185Escherichia
    • C12R2001/19Escherichia coli
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12RINDEXING SCHEME ASSOCIATED WITH SUBCLASSES C12C - C12Q, RELATING TO MICROORGANISMS
    • C12R2001/00Microorganisms ; Processes using microorganisms
    • C12R2001/645Fungi ; Processes using fungi
    • C12R2001/85Saccharomyces
    • C12R2001/865Saccharomyces cerevisiae

Landscapes

  • Chemical & Material Sciences (AREA)
  • Organic Chemistry (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Zoology (AREA)
  • Health & Medical Sciences (AREA)
  • Wood Science & Technology (AREA)
  • Genetics & Genomics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • Biotechnology (AREA)
  • Microbiology (AREA)
  • General Health & Medical Sciences (AREA)
  • Biochemistry (AREA)
  • General Chemical & Material Sciences (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Biomedical Technology (AREA)
  • Molecular Biology (AREA)
  • Physics & Mathematics (AREA)
  • Biophysics (AREA)
  • Plant Pathology (AREA)
  • Medicinal Chemistry (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)
  • Electrotherapy Devices (AREA)

Abstract

本发明属于合成生物学和代谢工程的技术领域。更具体地,本发明属于代谢工程改造的细胞以及所述细胞在培养、优选发酵中的用途的技术领域。本发明描述了代谢工程改造的细胞以及用所述细胞培养、优选发酵产生生物产物的方法。更具体地,本发明描述了代谢工程改造的细胞以及用所述细胞培养、优选发酵产生含有N‑乙酰神经氨酸(Neu(n)Ac)的化合物的方法,其中(n)为4、5、7、8或9或其组合。所述代谢工程改造的细胞包含用于产生所述含有Neu(n)Ac的化合物的途径,并且在本发明所述的至少一种NeuNAc合酶的表达或活性方面被修饰。此外,本发明提供了从培养物中纯化所述含有Neu(n)Ac的化合物。

Description

生物产物的细胞生产
技术领域
本发明属于合成生物学和代谢工程的技术领域。更具体地,本发明属于代谢工程改造的细胞以及所述细胞在培养、优选发酵中的用途的技术领域。本发明描述了代谢工程改造的细胞以及用所述细胞培养、优选发酵产生生物产物的方法。更具体地,本发明描述了代谢工程改造的细胞以及用所述细胞培养、优选发酵产生含有N-乙酰神经氨酸(Neu(n)Ac)的化合物的方法,其中(n)为4、5、7、8或9或其组合。所述代谢工程改造的细胞包含用于产生所述含有Neu(n)Ac的化合物的途径,并且在本发明所述的至少一种NeuNAc合酶的表达或活性方面被修饰。此外,本发明提供了从培养物中纯化所述含有Neu(n)Ac的化合物。
背景技术
生物产物,如例如含有N-乙酰神经氨酸(Neu(n)Ac)的化合物,包括唾液酸化的二糖和寡糖、糖蛋白和糖脂,参与许多重要现象诸如发育、分化、受精、胚胎发生、宿主病原体粘附和炎症。唾液酸化的寡糖还可以作为未缀合的聚糖存在于体液和人乳汁中,其中它们在重要的发育和免疫过程中作为生物活性聚糖进行调控(Bode,Early Hum.Dev.2015,91(11):619-622;Bode,Nestle Nutr.Inst.Workshop Ser.2019,90:191-201;Reily等人,Nat.Rev.Nephrol.2019,15:346-366;Varki,Glycobiology 2017,27:3-49;Walsh等人,J.Funct.Foods 2020,72:10474)。由于其广泛的功能谱,在生物产物(唾液酸化的化合物)中存在巨大的科学和商业兴趣。但是,唾液酸化的化合物(例如唾液酸化的寡糖)的利用度受到限制,因为生产依赖于化学或化学酶促合成或依赖于从天然来源(例如动物乳汁)中的纯化。化学合成方法费力且耗时,并且由于涉及大量步骤,因此它们难以扩大规模。使用糖基转移酶的酶促方案提供许多胜过化学合成的优点。糖基转移酶催化糖部分从活化的核苷酸糖供体向糖或非糖受体上的转移(Coutinho等人,J.Mol.Biol.2003,328:307-317)。这些糖基转移酶是生物技术人员合成生物产物(例如含有Neu(n)Ac的化合物)的来源,并被用于(化学)酶促方案以及基于细胞的生产系统中。但是,糖基转移酶的立体特异性和区域选择性仍然是一个艰巨的挑战。此外,化学酶促方案需要原位再生核苷酸活化的糖供体。生物产物(例如含有Neu(n)Ac的化合物)的细胞生产需要严格控制在互补糖基转移酶附近的适当水平的核苷酸活化的糖供体的时空利用度。由于这些困难,目前的方法经常导致生物产物(例如含有Neu(n)Ac的化合物)的小规模合成。
PEP或磷酸烯醇丙酮酸是细胞的合成代谢中的常见前体,并且对于次级代谢物(诸如类黄酮、芳族氨基酸以及二糖和寡糖的许多单糖亚基)的合成或二糖和寡糖修饰至关重要。这样的单糖亚基是例如Neu(n)Ac分子、军团酸(legionaminic acid)、酮脱氧辛酸酯或盐、酮-脱氧-尤罗索尼克酸(nonulonic acid)、假氨基酸、N,N'-二乙酰基-8-表军团酸(epilegionaminate)、N-乙酰基-D-胞壁酸(muramate)以及它们的核苷酸和磷酸化衍生物。为了增强这些生物产物的合成,可以借助于几种基因的过表达和缺失来增加细胞中的PEP浓度。
Zhu等人(Biotechnol.Lett.2017,39:227-234)已经证实,通过PEP合酶(EC:2.7.9.2)和PEP羧基激酶(EC:4.1.1.49)的过表达,N-乙酰神经氨酸的合成与对照相比分别增加了96.4%和61%,组合的过表达使合成与对照相比进一步增加至116.7%。Zhu等人(Biotechnol.Lett 2016,doi 10.1007/s10529-016-2215-z)已经进一步证实,底物磷酸转移酶(PTS)系统(如在大肠杆菌中由基因nagE编码的N-乙酰葡糖胺PTS系统,其使用PEP N-乙酰葡糖胺(GlcNAc)和葡糖胺(GlcN)运输进入细胞中并磷酸化,或如在大肠杆菌中由基因manX、manY和manZ编码的甘露糖PTS系统,其使用PEP甘露糖、N-乙酰甘露糖胺、葡萄糖、果糖、GlcN和GlcNAc运输进入细胞中并磷酸化)的缺失显著增加Neu5Ac合成。后来还证实,在大肠杆菌中ppsA的上调在EP3697805和EP3575404中也有效,还将ppsA过表达与manXYZ和nagE的缺失相组合。
Zhang等人(Biotech and Bioeng.2018,115(9):217-2231)以类似的方式改进了枯草芽孢杆菌(Bacillus subtilis)中的PEP合成。缺失葡萄糖PTS系统以减少在葡萄糖摄取后的PEP利用,缺失基因丙酮酸激酶(EC:2.7.1.40)以减少PEP消耗,并过表达基因PEP羧基激酶(EC:4.1.1.49)以增强通量流向。为了补偿葡萄糖PTS系统的缺失,使用葡萄糖通透酶和葡糖激酶来内化和磷酸化细胞中的葡萄糖。此外,引入苹果酸酶(EC:1.1.1.38、EC:1.1.1.39或EC:1.1.1.40)以增加从三羧酸循环(Krebs cycle)到丙酮酸盐或酯(PEP的前体)的通量。减少的糖酵解和Entner-Doudoroff途径的引入进一步增强了N-乙酰神经氨酸的产生。应当指出,这些菌株的乙酸盐或酯和乳酸盐或酯合成能力在其基础上进行了修改,这本质上提高了PEP、丙酮酸盐或酯和乙酰辅酶A的利用度。
Zhang等人(Biotech.Adv.2019,37:787-800)还回顾并描述了可以如何调控N-乙酰神经氨酸和唾液酸化的寡糖的前体。通过影响细胞中的PEP和丙酮酸盐或酯利用度,增强了通向唾液酸化的寡糖和N-乙酰神经氨酸(或如上所述的其它单糖亚基)的通量。此处还描述了缺失或敲低糖酵解途径(包含磷酸果糖激酶(pfkA基因,E.C.:2.7.1.11)和丙酮酸激酶(pyk,EC:2.7.1.40))和上调磷酸烯醇丙酮酸合酶基因(ppsA,EC:2.7.9.2)的技术。Entner-Doudoroff途径的引入或过表达以及降低的PTS活性进一步导致了合成的改进。所描述的系统不仅通过过表达或缺失来实现,而且通过生物传感器的动态控制来实现,所述生物传感器选择性地上调和下调在细胞生物化学中的反应。
发明内容
发明概述
本发明的一个目的是提供工具和方法,借助于它们可以由细胞产生生物产物(例如含有Neu(n)Ac的化合物),并且优选地以有效的、时间和成本上有效益的方式,并且产生大量的期望的生物产物。
根据本发明,该目的和其它目的通过提供用于产生生物产物的细胞和方法来实现。更具体地,本发明提供用于产生含有Neu(n)Ac的化合物的细胞和方法,其中所述细胞被代谢工程改造,优选已被代谢工程改造,具有产生所述含有Neu(n)Ac的化合物的途径,并且其中所述细胞在本文定义的至少一种Neu(n)Ac合酶的表达或活性方面被修饰、优选已被修饰。优选地,所述细胞包含并表达参与所述生物产物的产生的至少一种糖基转移酶。
本发明提供用于产生生物产物的细胞。更具体地,本发明提供用于产生含有Neu(n)Ac的化合物的细胞。现在已经发现在本发明中鉴定的Neu(n)Ac合酶提供能够进行含有Neu(n)Ac的化合物的发酵生产的酶,并且优选地具有积极效果,甚至更优选地在使用代谢工程改造的细胞产生所述含有Neu(n)Ac的化合物时,与具有相同遗传背景但缺少本发明鉴定的Neu(n)Ac合酶的细胞相比,提供更好的产率、生产率和比生产率。
本发明还提供用于产生生物产物的方法。更具体地,本发明还提供用于产生含有Neu(n)Ac的化合物的方法。所述方法包括下述步骤:提供包含产生含有Neu(n)Ac的化合物的途径的细胞,其中所述细胞在至少一种所述Neu(n)Ac合酶的表达或活性方面被修饰、优选已被修饰,并且优选地还包含并表达至少一种参与所述含有Neu(n)Ac的化合物的产生的糖基转移酶,并且在允许产生所述唾液酸化的二糖和/或果糖的条件下培养所述细胞。本发明还提供分离所述含有Neu(n)Ac的化合物的方法。
定义
在本说明书中用于描述本发明和它的各种实施方案的词语不仅应当以它们通常定义的含义来理解,而且还应当通过在本说明书中的特殊定义来包括超出通常定义的含义的范围的结构、材料或行为。因此,如果一个要素在本说明书的上下文中可以被理解为包括超过一种含义,则其在权利要求书中的使用必须被理解为对由说明书和该词语本身支持的所有可能的含义是通用的。
本文中公开的本发明的各个方面和各个方面的实施方案不仅应当按照在本说明书中具体描述的顺序和上下文来理解,而且还应当包括任何顺序及其任何组合。每当上下文需要时,所有以单数形式使用的词语都应当被视为包括复数,并且反之亦然。除非另外定义,否则在本文中使用的所有技术和科学术语通常具有与本发明所属领域的普通技术人员通常理解的相同的含义。通常,本文所用的命名法以及本文描述的细胞培养、分子遗传学、有机化学和核酸化学以及杂交中的实验室程序是本领域中众所周知的和常用的那些。将标准技术用于核酸和肽合成。通常,根据制造商的说明书进行酶促反应和纯化步骤。
在附图和本说明书中,已经公开了本发明的实施方案,并且虽然采用了特定术语,但是所述术语仅以描述性的含义使用并且不用于限制的目的,本发明的范围在所附权利要求书中阐述。必须理解,解释的实施方案仅出于示例的目的而被阐述,并且不应被视为限制本发明。本领域技术人员显而易见,与本发明的文字和精神一致并且在本发明的范围内,可以做出改变、其它实施方案、改进、细节和用途,本发明的范围仅由权利要求书限制,根据专利法(包括等同原则)解释。在所附权利要求书中,仅为了描述方便而提供用于指定权利要求步骤的索引字符,并且无意暗示执行所述步骤的任何特定顺序。
在本文件及其权利要求书中,动词“包含”、“具有”和“含有”及其变化形式以其非限制性含义使用,意指包括在该词语后面的项目,但是不排除没有特别提及的项目。动词“基本上由……组成”意指除具体鉴定的那些组分外可以存在另外的组分,所述另外的组分不改变本发明的独特特征。贯穿本申请和权利要求书,除非另外指明,动词“包含”、“具有”和“含有”及其变化形式可以优选地被“由……组成”(及其变化形式)或“基本上由……组成”(及其变化形式)替换,并且反之亦然。另外,用不定冠词“a”或“an”对要素的提及不排除存在超过一个/种要素的可能性,除非上下文明确要求存在且仅存在一个/种要素。不定冠词“a”或“an”因而经常是指“至少一个/种”。
根据本发明,术语“多核苷酸”通常表示任何多核糖核苷酸或多脱氧核糖核苷酸,其可以是未修饰的RNA或DNA或修饰的RNA或DNA。“多核苷酸”包括、而不限于:单链和双链DNA,作为单链和双链区域或单链、双链和三链区域的混合物的DNA,单链和双链RNA,以及作为单链和双链区域的混合物的RNA,杂种分子(其包含可以是单链或更一般而言双链或三链区域的DNA和RNA),或者单链和双链区域的混合物。另外,本文中使用的“多核苷酸”表示包含RNA或DNA或RNA和DNA的三链区域。这样的区域中的链可以来自相同分子或来自不同分子。所述区域可以包括所有一种或多种分子,但更通常仅涉及一些分子的区域。三螺旋区域的分子之一经常是寡核苷酸。本文中使用的术语“多核苷酸”也包括如上所述的DNA或RNA,其含有一个或多个经修饰的碱基。因此,具有为了稳定性或其它原因而被修饰的主链的DNA或RNA是根据本发明的“多核苷酸”。此外,包含罕见碱基(诸如肌苷)或经修饰的碱基(诸如三苯甲基化的碱基)的DNA或RNA应当理解为被术语“多核苷酸”涵盖。要认识到已对这样的DNA和RNA进行了大量的修饰,所述DNA和RNA用于本领域技术人员已知的许多用途目的。本文中使用的术语“多核苷酸”包括多核苷酸的这样的化学地、酶促地或代谢地修饰的形式,以及病毒和细胞(包括、例如简单的和复杂的细胞)特有的DNA和RNA的化学形式。术语“多核苷酸”还包括经常被称作寡核苷酸的短多核苷酸。
“多肽”表示包含通过肽键或修饰的肽键彼此连接的两个或更多个氨基酸的任何肽或蛋白。“多肽”表示通常被称作肽、寡肽和寡聚体的短链以及通常被称作蛋白的较长链。多肽可以含有除20种基因编码的氨基酸之外的氨基酸。“多肽”包括通过天然过程(诸如加工和其它翻译后修饰)修饰的那些,但是也包括通过化学修饰技术修饰的那些。这样的修饰在基础课本和更详细的专著以及大量研究文献中得到充分描述,并且它们是技术人员众所周知的。相同类型的修饰可以以相同或不同程度存在于给定多肽中的几个位点处。此外,给定的多肽可以含有多种类型的修饰。修饰可以发生在多肽中的任何地方,包括肽主链、氨基酸侧链以及氨基末端或羧基末端。修饰包括例如乙酰化、酰化、ADP-核糖基化、酰胺化、黄素的共价连接、血红素部分的共价连接、核苷酸或核苷酸衍生物的共价连接、脂质或脂质衍生物的共价连接、磷脂酰肌醇的共价连接、交联、环化、二硫键形成、脱甲基化、共价交联的形成、焦谷氨酸盐的形成、甲酰化、γ-羧基化、糖基化、GPI锚形成、羟基化、碘化、甲基化、肉豆蔻酰化、氧化、蛋白水解加工、磷酸化、异戊二烯化、外消旋化、脂质附着、硫酸化、谷氨酸残基的γ-羧基化、羟基化和ADP-核糖基化、硒酰化、转移RNA介导的氨基酸向蛋白的添加,诸如精氨酰化和泛素化。多肽可以是支链的或环状的,有或没有分支。环状、支链和支链环状多肽可以由翻译后天然过程产生,并且也可以通过完全合成方法制备。
“分离”是指“通过人手”从其天然状态改变,即,如果它发生在自然界中,则它已经从其原始环境改变或移出,或两者。例如,天然存在于活生物体中的多核苷酸或多肽不是“分离的”,但与其天然状态的共存材料分离的相同多核苷酸或多肽是“分离的”,作为本文所使用的术语。类似地,作为本文所使用的术语,“合成的”序列是指已经合成产生的且不是直接从天然来源分离的任何序列。作为本文所使用的术语,“合成的”是指任何合成产生的序列并且不是直接从天然来源分离。
“重组”意指通过将来自一个物种的基因移植或剪接到不同物种的宿主生物体细胞中而制备的遗传工程改造的DNA。所述DNA变成宿主遗传组成的一部分并且被复制。
在本公开内容的上下文中,术语“内源的”表示作为细胞的天然部分并且存在于其在细胞染色体中的天然位置处的任何多核苷酸、多肽或蛋白序列。
当参考多核苷酸、基因、核酸、多肽或酶使用时,术语“异源的”表示来自宿主生物体物种以外的来源或从其衍生出的多核苷酸、基因、核酸、多肽或酶。相反,“同源的”多核苷酸、基因、核酸、多肽或酶在本文中用于表示从宿主生物体物种衍生出的多核苷酸、基因、核酸、多肽或酶。当表示基因调控序列或用于维持或操纵基因序列的辅助核酸序列(例如启动子、5'非翻译区、3'非翻译区、聚腺苷酸添加序列、内含子序列、剪接位点、核糖体结合位点、内部核糖体进入序列、基因组同源区域、重组位点等)时,“异源的”是指所述调控序列或辅助序列与调控性或辅助性核酸序列在构建体、基因组、染色体或附加体中并置的基因天然不相关。因此,可操作地连接至在其天然状态中(即,在非遗传工程改造的生物体的基因组中)没有可操作地连接的基因的启动子在本文中被称作“异源启动子”,即使该启动子可以源自与其连接的基因相同的物种(或者在某些情况下,相同的生物体)。
本文中使用的术语“编码多肽的多核苷酸”涵盖包括编码本发明的多肽的序列的多核苷酸。该术语还涵盖包括编码所述多肽的单个连续区域或不连续区域(例如,被整合的噬菌体或插入序列或编辑中断)以及还可以含有编码和/或非编码序列的另外区域的多核苷酸。
术语基因的“修饰的表达”涉及在期望的含有Neu(n)Ac的化合物的生产过程的任何阶段中与所述基因的野生型表达相比表达的变化。所述修饰的表达是与野生型相比更低或更高的表达,其中术语“更高的表达”也被定义为在内源基因的情况下所述基因的“过表达”或在野生型菌株中不存在的异源基因的情况下的“表达”。如下述得到更低的表达:借助于技术人员众所周知的常见技术(诸如使用siRNA、CrispR、CrispRi、重组工程、同源重组、ssDNA诱变、RNAi、miRNA、asRNA、突变基因、敲除基因、转座子诱变、……),它们用于以使其不太能(即与功能性野生型基因相比,在统计上显著“不太能”)或完全不能(诸如敲除的基因)产生功能性终产物的方式改变基因。借助于技术人员众所周知的常见技术得到过表达或表达,其中所述基因是“表达盒”的一部分,所述“表达盒”涉及其中存在启动子序列、非翻译区序列(含有核糖体结合序列或Kozak序列)、编码序列(例如Neu(n)Ac合酶基因序列)和任选的转录终止子的任何序列,并导致功能性活性蛋白的表达。所述表达是组成性的或条件性的或受调控的或可调控的。
术语“组成型表达”被定义为在某些生长条件下不受RNA聚合酶的亚基以外的转录因子(例如细菌σ因子)调控的表达。这样的转录因子的非限制性例子是大肠杆菌中的CRP、LacI、ArcA、Cra、IclR,或酿酒酵母(Saccharomyces cerevisiae)中的Aft2p、Crz1p、Skn7,或枯草芽孢杆菌(B.subtilis)中的DeoR、GntR、Fur。这些转录因子与特定序列结合,并可能在某些生长条件下阻断或增强表达。RNA聚合酶结合特定的序列来启动转录,例如通过原核宿主中的σ因子。
术语“受调控的表达”被定义为在特定生长条件下通过除RNA聚合酶亚基(例如,细菌σ因子)之外的转录因子调控的表达。所述转录因子的实例如上文所述。通常,通过诱导剂,诸如但不限于:IPTG、阿拉伯糖、鼠李糖、岩藻糖、异乳糖(allo-lactose)或pH变化或温度变化或碳耗竭或底物或产生的产物,获得表达调控。
术语“控制序列”表示被宿主细胞转录和翻译系统识别的序列,从而允许多核苷酸序列转录和翻译为多肽。因此,这样的DNA序列对于在特定宿主细胞或生物体中表达可操作地连接的编码序列而言是必需的。这样的控制序列可以是但不限于启动子序列、核糖体结合序列、Shine Dalgarno序列、Kozak序列、转录终止子序列。适合用于原核生物的控制序列例如包括启动子、任选的操纵子序列和核糖体结合位点。已知真核细胞利用启动子、多腺苷酸化信号和增强子。前序列或分泌型前导序列的DNA可以与多肽的DNA可操作地连接,条件是其表达为参与所述多肽的分泌的前蛋白;启动子或增强子与编码序列可操作地连接,条件是其影响所述序列的转录;或者核糖体结合位点与编码序列可操作地连接,条件是其影响所述序列的转录;或核糖体结合位点与编码序列可操作地连接,条件是其被定位为促进翻译。所述控制序列还可以通过诱导型启动子或通过遗传回路(其诱导或抑制所述多核苷酸向多肽的转录或翻译)用外部化学物质(诸如,但不限于IPTG、阿拉伯糖、乳糖、异乳糖、鼠李糖或岩藻糖)控制。
通常,“可操作地连接的”是指被连接的DNA序列是连续的,且在分泌型前导序列的情况下,是连续的且在阅读相中。但是,增强子不必是连续的。
术语“野生型”表示在自然界中发生的众所周知的遗传或表型情况。
本文中使用的术语“蛋白的修饰的活性”涉及在期望生物产物的生产过程的任何阶段中所述蛋白的非天然活性。术语“非天然”在本文中关于蛋白活性使用时表示该蛋白已被修饰为相较于所述蛋白的天然活性具有消除的、受损的、减少的、延迟的、更高的、加速的或改善的活性。术语“非天然”在本文中关于产生含有Neu(n)Ac的化合物的细胞使用时表示所述含有Neu(n)Ac的化合物i)不被所述细胞天然产生,或ii)当被所述细胞天然产生时不是以相同的量产生;并且所述细胞已被遗传修饰成能够产生所述含有Neu(n)Ac的化合物或具有更高的含有Neu(n)Ac的化合物的产生。
本文中使用的术语“Neu(n)Ac合酶的修饰的表达或活性”是指i)内源Neu(n)Ac合酶的更高表达或过表达,ii)异源Neu(n)Ac合酶的表达,或iii)与野生型(即天然)Neu(n)Ac合酶蛋白相比具有更高的Neu(n)Ac合酶活性的突变Neu(n)Ac合酶的表达和/或过表达。
作为本文所使用的术语,“变体”是分别与参考多核苷酸或多肽不同、但保留基本性能的多核苷酸或多肽。多核苷酸的典型变体在核苷酸序列上与另一种参考多核苷酸不同。变体的核苷酸序列中的变化可以改变或不改变由参考多核苷酸编码的多肽的氨基酸序列。如下所讨论的,核苷酸变化可以导致由参考序列编码的多肽中的氨基酸置换、添加、缺失、融合和截短。多肽的典型变体在氨基酸序列上不同于另一种参考多肽。通常,差异是有限的,因此参考多肽和变体的序列总体上非常相似,并且在许多区域中是相同的。变体和参考多肽可以在氨基酸序列中因任意组合的一个或多个置换、添加、缺失而不同。置换或插入的氨基酸残基可以是或不是由遗传密码编码的氨基酸残基。多核苷酸或多肽的变体可以是天然存在的,诸如等位基因变体,或者它可以是未知天然存在的变体。通过诱变技术、通过直接合成以及通过本领域技术人员已知的其它重组方法,可以制备多核苷酸和多肽的非天然存在的变体。
在某些实施方案中,本发明考虑通过修饰在本发明中使用的Neu(n)Ac合酶的结构来制备功能变体。可以通过氨基酸置换、缺失、添加或其组合来产生变体。例如,合理地预期,用异亮氨酸或缬氨酸分离替换亮氨酸,用谷氨酸替换天冬氨酸,用丝氨酸替换苏氨酸,或用结构上相关的氨基酸对氨基酸的类似替换(例如,保守突变),不会对所得分子的生物活性产生重大影响。保守替换是在它们的侧链中相关的氨基酸家族内发生的那些替换。通过评估变体多肽以与野生型多肽类似的方式在细胞中产生应答,可以容易地确定本发明的多肽的氨基酸序列中的变化是否产生功能同系物。
在本发明的情形中,多肽(通常以SEQ ID NO表示)的优选“变体”是所述多肽的功能性片段,即,所述片段保留所述多肽的功能特征。如果多肽是本文所述的Neu(n)Ac合酶,则其功能性片段保留产生Neu(n)Ac的功能特征。如果多肽是N-酰基神经氨酸-9-磷酸合成酶,则其功能性片段保留产生N-酰基神经氨酸-9-磷酸的活性。本文中所用的多肽(通常以SEQ ID NO表示)的片段优选意指这样的多肽序列:其包含一定量的来自所述多肽SEQ IDNO的连续氨基酸残基或由其组成,并且其中所述连续氨基酸残基的量优选是所述多肽SEQID NO全长的至少50.0%、60.0%、70.0%、80.0%、81.0%、82.0%、83.0%、84.0%、85.0%、86.0%、87.0%、88.0%、89.0%、90.0%、91.0%、92.0%、93.0%、94.0%、95.0%、95.5%、96.0%、96.5%、97.0%、97.5%、98.0%、98.5%、99.0%、99.5%,优选至少80.0%,更优选至少87.0%,甚至更优选至少90.0%,甚至更优选至少95.0%,最优选至少97.0%,并且所述片段以与完整多肽基本相同的方式、优选以相似或更大的程度执行完整多肽的至少一种生物学功能(即,当所述多肽是Neu(n)Ac合酶时,产生Neu(n);当所述多肽是N-酰基神经氨酸-9-磷酸合成酶时,产生N-酰基神经氨酸-9-磷酸),这可由技术人员常规评估。类似地,本文中使用的多肽(通常以SEQ ID NO表示)的片段优选是指这样的多肽序列:其包含所述多肽SEQ ID NO或由其组成,其中缺失一定量的连续氨基酸残基,并且其中所述量不超过所述多肽SEQ ID NO全长的50.0%、40.0%、30.0%,优选不超过所述多肽SEQID NO全长的20.0%、15.0%、10.0%、9.0%、8.0%、7.0%、6.0%、5.0%、4.5%、4.0%、3.5%、3.0%、2.5%、2.0%、1.5%、1.0%、0.5%,更优选不超过15.0%,甚至更优选不超过10.0%,甚至更优选不超过5.0%,最优选不超过2.5%,并且所述片段以与完整多肽基本相同的方式、优选以相似或更大的程度执行完整多肽的至少一种生物学功能(即,当所述多肽是Neu(n)Ac合酶时,产生Neu(n);当所述多肽是N-酰基神经氨酸-9-磷酸合成酶时,产生N-酰基神经氨酸-9-磷酸),这可由技术人员常规评估。
本文中使用的术语“功能同系物”描述了具有序列相似性并且还共享至少一种功能特征诸如生化活性的那些分子。更具体地,本文中使用的术语“功能同系物”描述了具有序列相似性(换言之,同源性)并且同时具有至少一种功能相似性诸如生化活性的那些蛋白(Altenhoff等人,PLoS Comput.Biol.8(2012)e1002514)。在本发明的情形中,本发明所述的Neu(n)Ac合酶“Y”(通常以SEQ ID NO表示)的功能同系物是指具有Neu(n)Ac合酶活性的Neu(n)Ac合酶,即,所述功能同系物保留Neu(n)Ac合酶“Y”产生Neu(n)Ac的功能特征。在本发明的情形中,本发明所述的N-酰基神经氨酸-9-磷酸合成酶“Z”(通常以SEQ ID NO表示)的功能同系物是指具有N-酰基神经氨酸-9-磷酸合成酶活性的N-酰基神经氨酸-9-磷酸合成酶,即,所述功能同系物保留N-酰基神经氨酸-9-磷酸合成酶“Z”产生N-酰基神经氨酸-9-磷酸的功能特征。
功能同系物有时被称作直系同源物,其中“直系同源物”表示与另一个物种中的所提及的基因或蛋白在功能上等同的同源基因或蛋白。功能同系物通常会产生相似但不一定相同程度的相同特征。在功能上同源的蛋白具有相同的特征,其中一种同系物产生的定量测量结果是另一种同系物的至少10%;更一般而言,是原始分子产生的结果的至少20%、约30%至约40%;例如,约50%至约60%;约70%至约80%;或约90%与约95%;约98%至约100%,或大于100%。因此,在所述分子具有酶活性的情况下,所述功能同系物将具有与原始酶相比的上述百分比的酶活性。在所述分子是DNA结合分子(例如,多肽)的情况下,所述同系物将具有上述结合亲和力百分比,如通过与原始分子相比结合的分子的重量所测量的。
功能同系物和参考多肽可以是天然存在的多肽,并且序列相似性可以归因于趋同或趋异的进化事件。
可以通过分析核苷酸和多肽序列比对来鉴定功能同系物。例如,对核苷酸或多肽序列的数据库进行查询可以鉴定生物质调控多肽的同系物。序列分析可以包含使用生物质调控多肽的氨基酸序列作为参考序列对非冗余数据库进行BLAST、Reciprocal BLAST或PSI-BLAST分析。在某些情况下,从核苷酸序列推导出氨基酸序列。通常,在数据库中与感兴趣的多肽具有大于40%的序列同一性的那些多肽是用于进一步评价作为生物质调控多肽的适合性的候选物。氨基酸序列相似性允许保守氨基酸置换,诸如用一个疏水残基置换另一个疏水残基或用一个极性残基置换另一个极性残基。如果需要的话,可以对这样的候选物进行人工检查,以缩小需要进一步评价的候选物的数目。人工检查可以通过选择似乎具有存在于生产率调控多肽中的结构域(例如,保守功能性结构域)的那些候选物而进行。
结构域可以通过例如以下方式来表征:Pfam(El-Gebali等人,Nucleic AcidsRes.47(2019)D427-D432),IPR(InterPro结构域)(Mitchell等人,Nucleic Acids Res.47(2019)D351-D360),蛋白指纹结构域(PRINTS)(Attwood等人,Nucleic Acids Res.31(2003)400-402),SUBFAM结构域(Gough等人,J.Mol.Biol.313(2001)903-919),TIGRFAM结构域(Selengut等人,Nucleic Acids Res.35(2007)D260-D264),保守结构域数据库(CDD)命名(https://www.ncbi.nlm.nih.gov/cdd)(Lu等人,Nucleic Acids Res.48(2020)D265-D268),PTHR结构域(http://www.pantherdb.org)(Mi等人,Nucleic Acids.Res.41(2013)D377-D386;Thomas等人,Genome Research 13(2003)2129-2141)或PATRIC标识符或PATRICDB总家族结构域(https://www.patricbrc.org/)(Davis等人,Nucleic Acids Res.48(D1)(2020)D606-D612)。本领域技术人员应当理解,对于本文所使用的数据库,包含Pfam 32.0(2018年9月发布)、CDD v3.17(2019年4月3日发布)、eggnogdb 4.5.1(2016年9月发布)、InterPro 75.0(2019年7月4日发布)、TCDB(2019年6月17日发布)和PATRIC 3.6.9(2020年3月发布),每个数据库的内容在每个发布版本中都是固定的,并且不会更改。当特定数据库的内容发生更改时,该特定数据库会收到具有新发布日期的新发布版本。每个数据库的所有发布版本及其对应的发布日期和在这些特定发布日期注释的特定内容对于本领域技术人员来说是可得到的和已知的。
在两个或更多个核酸或多肽序列的上下文中,术语“相同的”或“同一性百分比”或“%同一性”表示,当对比并对齐以得到最大对应性时,相同的或具有特定百分比的相同核苷酸或氨基酸残基的两个或更多个序列或子序列,这使用序列对比算法或通过目检来测量。对于序列对比,一个序列充当参考序列,将试验序列与其进行对比。当使用序列对比算法时,将试验序列和参考序列输入计算机,指定子序列坐标(如果必要的话),并指定序列算法程序参数。序列对比算法然后基于指定的程序参数计算试验序列相对于参考序列的序列同一性百分比。可以在参考序列的全长序列上总体计算同一性百分比,从而产生总体同一性百分比评分。备选地,可以在参考序列的部分序列上计算同一性百分比,从而产生局部同一性百分比评分。在局部序列比对中使用参考序列的全长会产生试验序列和参考序列之间的总体同一性百分比评分。
使用不同的算法如例如BLAST和PSI-BLAST(Altschul等人,1990,J Mol Biol215:3,403-410;Altschul等人,1997,Nucleic Acids Res 25:17,3389-402)、ClustalOmega方法(Sievers等人,2011,Mol.Syst.Biol.7:539)、MatGAT方法(Campanella等人,2003,BMC Bioinformatics,4:29)或EMBOSS Needle,可以确定同一性百分比。
BLAST(Basic Local Alignment Search Tool)比对方法是美国国家生物技术信息中心(National Centre for Biotechnology Information,NCBI)提供的一种使用默认参数比较序列的算法。该程序将核苷酸序列或蛋白序列与序列数据库进行比较并计算统计学显著性。PSI-BLAST(Position-Specific Iterative Basic Local Alignment SearchTool)从使用蛋白-蛋白BLAST(BLASTp)高于给定分数阈值检测的序列的多序列比对演变位置特异性评分矩阵(PSSM)或模式。BLAST方法可以用于成对或多个序列比对。成对序列比对用来鉴定可能指示两个生物序列(蛋白或核酸)之间的功能、结构和/或进化关系的相似性区域。关于BLAST的互联网界面可在https://blast.ncbi.nlm.nih.gov/Blast.cgi获得。
Clustal Omega(ClustalΩ)是使用种子引导树和HMM模式-模式技术生成三个或更多个序列之间的比对的多序列比对程序。其产生多样性序列的生物学有意义的多序列比对。关于ClustalΩ的互联网界面可在https://www.ebi.ac.uk/Tools/msa/clustalo/获得。使用ClustalΩ方法进行多序列比对并计算蛋白序列的同一性百分比的默认参数为:容许输入序列的去比对:FALSE;容许mbed样聚类引导树:TRUE;容许mbed样聚类迭代:TRUE;迭代次数(组合的引导树/HMM):default(0);最大引导树迭代:default[-1];最大HMM迭代:default[-1];命令:比对。
MatGAT(Matrix Global Alignment Tool)是对DNA或蛋白序列生成相似性/同一性矩阵的计算机应用,不需要数据的预先比对。该程序使用Myers和Miller整体比对算法进行一系列成对比对,计算相似性和同一性,然后将结果置于距离矩阵。使用者可以指定哪种类型的比对矩阵(例如,BLOSUM50、BLOSUM62和PAM250)用于他们的蛋白序列检查。
EMBOSS Needle(https://galaxy-iuc.github.io/emboss-5.0-docs/ needle.html)使用Needleman-Wunsch整体算法来发现两个序列在考虑它们的全长时的最优比对(包括缺口)。通过动态程序方法探查所有可能的序列并选择最好的来确保最优比对。Needleman-Wunsch算法是能够计算最佳评分和以mn步骤的顺序(其中'n'和'm'是两个序列的长度)比对的算法类别中的一员。缺口开放罚分(default 10.0)是在产生缺口时扣除的分数。默认值假设你正在对蛋白序列使用EBLOSUM62矩阵。在标准缺口罚分中添加缺口延伸(default 0.5)罚分,用于缺口中的每个碱基或残基。这是长缺口罚分的方式。
如本文所用,具有/包含与参考多肽序列的全长序列有至少80%总体序列同一性的氨基酸序列(或具有至少80%总体序列同一性的蛋白序列)的多肽应理解为所述序列与参考多肽序列的氨基酸序列全长具有80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、100%总体序列同一性。贯穿本申请,除非另外明确指明,包含与参考多肽的全长氨基酸序列(通常以SEQ ID NO表示)具有至少80%总体序列同一性的氨基酸序列的多肽/由这样的序列组成的多肽/具有这样的序列/由这样的序列所示的多肽优选地与参考序列的全长具有至少85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%总体序列同一性,更优选具有至少85%总体序列同一性,甚至更优选具有至少90%总体序列同一性,甚至更优选具有至少95%总体序列同一性,甚至更优选具有至少97%总体序列同一性,最优选至少99%总体序列同一性。在本发明的情形中,具有与参考Neu(n)Ac合酶‘Y’或参考N-酰基神经氨酸-9-磷酸合成酶‘Z’的全长序列(通常以SEQ ID NO表示)有至少80%总体序列同一性(或例如具有至少80%总体序列同一性的蛋白序列)的多肽是指分别能够产生Neu(n)Ac或N-酰基神经氨酸-9-磷酸的多肽,如本文所述,即,所述多肽保留参考neu(n)A合酶‘Y’产生Neu(n)Ac的功能特征,或者保留参考N-酰基神经氨酸-9-磷酸合成酶‘Z’产生N-酰基神经氨酸-9-磷酸的功能特征。
为了本发明的目的,多肽的总体序列同一性百分比优选通过程序EMBOSS Needle5.0(https://galaxy-iuc.github.io/emboss-5.0-docs/needle.html)优选使用默认参数(置换阵列EBLOSUM62,缺口开放罚分10.0并且缺口延伸罚分0.5)并且优选使用成熟蛋白的序列(即,不考虑分泌信号或转移肽)确定。
本文中使用的术语“生物产物”是指包括以下各项的一组分子:单糖、磷酸化的单糖、活化的单糖、二糖、寡糖、苷元、糖脂或糖蛋白。
本文中使用的术语“含有Neu(n)Ac的化合物”是指本文定义的Neu(n)Ac以及包含一个或多个Neu(n)Ac分子的化合物,所述化合物包括二糖、寡糖、糖脂或糖蛋白。术语“唾液酸”、“(Neu(n)Ac)(其中(n)为4、5、7、8或9或其组合)”、“N-乙酰神经氨酸”、“N-酰基神经氨酸”、“N-乙酰基神经氨酸”、“Neu(n)Ac分子”、互换使用并表示具有九碳主链的酸性糖,包含但不限于Neu4Ac;Neu5Ac;Neu4,5Ac2;Neu5,7Ac2;Neu5,8Ac2;Neu5,9Ac2;Neu4,5,9Ac3;Neu5,7,9Ac3;Neu5,8,9Ac3;Neu4,5,7,9Ac4;Neu5,7,8,9Ac4和Neu4,5,7,8,9Ac5以及Neu5Gc。
Neu4Ac也被称作4-O-乙酰基-5-氨基-3,5-二脱氧-D-甘油-D-半乳-壬-2-酮吡喃糖酸或4-O-乙酰神经氨酸并具有C11H19NO9作为分子式。Neu5Ac也被称作5-乙酰氨基-3,5-二脱氧-D-甘油-D-半乳-壬-2-酮吡喃糖酸、D-甘油-5-乙酰氨基-3,5-二脱氧-D-半乳-壬-2-酮-吡喃糖酸、5-(乙酰基氨基)-3,5-二脱氧-D-甘油-D-半乳-2-壬酮吡喃糖酸、5-(乙酰基氨基)-3,5-二脱氧-D-甘油-D-半乳-2-壬酮糖酸、5-(乙酰基氨基)-3,5-二脱氧-D-甘油-D-半乳-壬-2-壬酮糖酸或5-(乙酰基氨基)-3,5-二脱氧-D-甘油-D-半乳-壬-2-酮吡喃糖酸并具有C11H19NO9作为分子式。Neu4,5Ac2也被称作N-乙酰基-4-O-乙酰神经氨酸、4-O-乙酰基-N-乙酰神经氨酸、4-O-乙酰基-N-乙酰神经氨酸、4-乙酸5-乙酰氨基-3,5-二脱氧-D-甘油-D-半乳-壬酮糖酸、4-乙酸5-(乙酰基氨基)-3,5-二脱氧-D-甘油-D-半乳-2-壬酮糖酸、4-乙酸5-乙酰氨基-3,5-二脱氧-D-甘油-D-半乳-壬酮糖酸或4-乙酸5-(乙酰基氨基)-3,5-二脱氧-D-甘油-D-半乳-2-壬酮糖酸并具有C13H21NO10作为分子式。Neu5,7Ac2也被称作7-O-乙酰基-N-乙酰神经氨酸、N-乙酰基-7-O-乙酰神经氨酸、7-O-乙酰基-N-乙酰神经氨酸、7-乙酸5-乙酰氨基-3,5-二脱氧-D-甘油-D-半乳-壬酮糖酸、7-乙酸5-(乙酰基氨基)-3,5-二脱氧-D-甘油-D-半乳-2-壬酮糖酸、7-乙酸5-乙酰氨基-3,5-二脱氧-D-甘油-D-半乳-壬酮糖酸或7-乙酸5-(乙酰基氨基)-3,5-二脱氧-D-甘油-D-半乳-2-壬酮糖酸并具有C13H21NO10作为分子式。Neu5,8Ac2也被称作5-n-乙酰基-8-o-乙酰神经氨酸并具有C13H21NO10作为分子式。Neu5,9Ac2也被称作N-乙酰基-9-O-乙酰神经氨酸、9-anana、9-O-乙酰基唾液酸、9-O-乙酰基-N-乙酰神经氨酸、5-n-乙酰基-9-O-乙酰神经氨酸、N,9-O-二乙酰神经氨酸或N,9-O-二乙酰神经氨酸并具有C13H21NO10作为分子式。Neu4,5,9Ac3也被称作5-N-乙酰基-4,9-二-O-乙酰神经氨酸。Neu5,7,9Ac3也被称作5-N-乙酰基-7,9-二-O-乙酰神经氨酸。Neu5,8,9Ac3也被称作5-N-乙酰基-8,9-二-O-乙酰神经氨酸。Neu4,5,7,9Ac4也被称作5-N-乙酰基-4,7,9-三-O-乙酰神经氨酸。Neu5,7,8,9Ac4也被称作5-N-乙酰基-7,8,9-三-O-乙酰神经氨酸。Neu4,5,7,8,9Ac5也被称作5-N-乙酰基-4,7,8,9-四-O-乙酰神经氨酸。Neu5Gc也被称作N-羟乙酰基-神经氨酸、N-羟乙酰基神经氨酸、N-羟乙酰神经氨酸、N-乙醇酰基-神经氨酸、N-乙醇酰基-神经氨酸、N-乙醇酰神经氨酸、3,5-二脱氧-5-((羟基乙酰基)氨基)-D-甘油-D-半乳-2-壬酮糖酸、3,5-二脱氧-5-(乙醇酰基氨基)-D-甘油-D-半乳-2-壬酮吡喃糖酸、3,5-二脱氧-5-(乙醇酰基氨基)-D-甘油-D-半乳-壬-2-酮吡喃糖酸、3,5-二脱氧-5-[(羟基乙酰基)氨基]-D-甘油-D-半乳-壬-2-酮吡喃糖酸、D-甘油-5-羟乙酰基酰氨基-3,5-二脱氧-D-半乳-壬-2-酮-吡喃糖酸并具有C11H19NO10作为分子式。
本文中使用的术语“Neu(n)Ac合酶”、“N-乙酰基神经氨酸合酶”、“N-乙酰神经氨酸合酶”、“唾液酸合酶”、“NeuAc合酶”、“NeuB”、“NeuB1”、“Neu(n)Ac合酶”、“NANA缩合酶”、“N-乙酰神经氨酸裂合酶合酶”、“N-乙酰神经氨酸缩合酶”互换使用并表示能够在反应中使用磷酸烯醇丙酮酸(PEP)从N-乙酰甘露糖胺(ManNAc)合成唾液酸(Neu(n)Ac)的酶。
本文中使用的术语“CMP-唾液酸合酶”、“N-酰基神经氨酸胞苷酰基转移酶”、“CMP-唾液酸的合酶”、“CMP-Neu(n)Ac合酶”、“NeuA”和“CMP-N-乙酰神经氨酸合酶”互换使用并表示能够在反应中使用CTP从N-乙酰神经氨酸合成CMP-N-乙酰神经氨酸的酶。
本文中使用的术语“N-酰基神经氨酸-9-磷酸合成酶”、“NANA合酶”、“NANAS”、“NANS”、“NmeNANAS”、“N-乙酰神经氨酸丙酮酸-裂合酶(丙酮酸磷酸化)”互换使用并表示能够使用磷酸烯醇丙酮酸(PEP)在反应中从N-乙酰甘露糖胺-6-磷酸(ManNAc-6-磷酸)合成N-酰基神经氨酸-9-磷酸的酶。
术语“N-酰基神经氨酸-9-磷酸酶”表示能够将N-酰基神经氨酸-9-磷酸去磷酸化以合成N-酰基神经氨酸的酶。
N-酰基葡糖胺2-差向异构酶是催化反应N-酰基-D-葡糖胺=N-酰基-D-甘露糖胺的酶。该酶的替代名称包括N-乙酰葡糖胺2-差向异构酶、N-乙酰基-D-葡糖胺2-差向异构酶、GlcNAc 2-差向异构酶和N-酰基-D-葡糖胺2-差向异构酶。
UDP-N-乙酰葡糖胺2-差向异构酶是催化反应N-乙酰基-D-葡糖胺=N-乙酰甘露糖胺的酶。该酶的替代名称包括UDP-N-酰基葡糖胺2-差向异构酶、UDP-GlcNAc-2-差向异构酶和UDP-N-乙酰基-D-葡糖胺2-差向异构酶。
N-乙酰甘露糖胺-6-磷酸2-差向异构酶是催化反应N-乙酰基-D-葡糖胺6-磷酸=N-乙酰基-D-甘露糖胺6-磷酸的酶。
双功能的UDP-GlcNAc 2-差向异构酶/激酶是催化反应UDP-N-乙酰基-D-葡糖胺=N-乙酰基-D-甘露糖胺和反应N-乙酰基-D-甘露糖胺+ATP=ADP+N-乙酰基-D-甘露糖胺6-磷酸的双功能酶。
术语“N-乙酰神经氨酸裂合酶”、“Neu5Ac裂合酶”、“N-乙酰神经氨酸丙酮酸-裂合酶”、“N-乙酰神经氨酸醛缩酶”、“NALase”、“唾液酸裂解酶”、“唾液酸醛缩酶”、“唾液酸裂合酶”和“nanA”互换使用并表示将N-乙酰神经氨酸降解为N-乙酰甘露糖胺(ManNAc)和丙酮酸盐或酯的酶。
术语“N-乙酰神经氨酸激酶”、“ManNAc激酶”、“N-乙酰基-D-甘露糖胺激酶”和“nanK”互换使用并表示将ManNAc磷酸化以合成N-乙酰甘露糖胺-磷酸(ManNAc-6-P)的酶。
术语“ManNAc-6-P异构酶”、“ManNAc-6-P 2-差向异构酶”和“nanE”互换使用,并且是指将ManNAc-6-P转化为N-乙酰葡糖胺-6-磷酸(GlcNAc-6-P)的酶。
术语“N-乙酰葡糖胺-6-P脱乙酰酶”和“nagA”互换使用,并且是指催化N-乙酰葡糖胺-6-磷酸(GlcNAc-6-P)的N-乙酰基基团水解产生葡糖胺-6-磷酸(GlcN6P)和乙酸盐或酯的酶。
术语“葡糖胺-6-P脱氨酶”、“GlcN6P脱氨酶”、“葡糖胺-6-P异构酶”、“glmD”和“nagB”互换使用,并且是指催化葡糖胺-6-磷酸(GlcN6P)的可逆性异构化-脱氨作用形成果糖-6-磷酸和铵离子的酶。
本文中使用的术语“糖基转移酶”表示能够催化糖部分从活化的供体分子转移至特定受体分子从而形成糖苷键的酶。已经描述了使用核苷酸二磷酸-糖、核苷酸单磷酸-糖和糖磷酸和有关的蛋白将糖基转移酶分类成不同的基于序列的家族(Campbell等人,Biochem.J.326,929-939(1997))并可在CAZy(碳水化合物-活性酶)网站(www.cazy.org)上得到。
如本文中使用的,所述糖基转移酶可以选自包含但不限于下述的列表:岩藻糖基转移酶、唾液酸转移酶、半乳糖基转移酶、葡萄糖基转移酶、甘露糖基转移酶、N-乙酰葡糖胺基转移酶、N-乙酰基半乳糖胺基转移酶、N-乙酰甘露糖胺基转移酶、木糖基转移酶、葡糖醛酸基转移酶、半乳糖醛酸转移酶、葡糖胺基转移酶、N-羟乙酰基神经氨酰基转移酶、鼠李糖基转移酶、N-乙酰基鼠李糖基转移酶、UDP-4-氨基-4,6-二脱氧-N-乙酰基-β-L-阿卓糖胺转氨酶、UDP-N-乙酰葡糖胺烯醇丙酮酰基转移酶和岩藻糖胺基转移酶。
岩藻糖基转移酶是将岩藻糖残基(Fuc)从GDP-岩藻糖(GDP-Fuc)供体转移至受体的糖基转移酶。岩藻糖基转移酶包括α-1,2-岩藻糖基转移酶、α-1,3-岩藻糖基转移酶、α-1,4-岩藻糖基转移酶和α-1,6-岩藻糖基转移酶,它们催化Fuc残基从GDP-Fuc通过α-糖苷键转移到受体上。岩藻糖基转移酶可以存在于但不限于GT10、GT11、GT23、GT65和GT68 CAZy家族中。唾液酸转移酶是将唾液酸(如Neu5Ac或Neu5Gc)从供体(如CMP-Neu5Ac或CMP-Neu5Gc)转移到受体上的糖基转移酶。唾液酸转移酶包括α-2,3-唾液酸转移酶、α-2,6-唾液酸转移酶和α-2,8-唾液酸转移酶,它们催化唾液酸通过α-糖苷键向受体上的转移。唾液酸转移酶可以存在于但不限于GT29、GT42、GT80和GT97 CAZy家族中。半乳糖基转移酶是将半乳糖基基团(Gal)从UDP-半乳糖(UDP-Gal)供体转移到受体上的糖基转移酶。半乳糖基转移酶包括β-1,3-半乳糖基转移酶、N-乙酰葡糖胺β-1,3-半乳糖基转移酶、β-1,4-半乳糖基转移酶、N-乙酰葡糖胺β-1,4-半乳糖基转移酶、α-1,3-半乳糖基转移酶和α-1,4-半乳糖基转移酶,它们将Gal残基从UDP-Gal通过α-或β-糖苷键转移到受体上。半乳糖基转移酶可以存在于但不限于GT2、GT6、GT8、GT25和GT92 CAZy家族中。葡萄糖基转移酶是将葡萄糖基基团(Glc)从UDP-葡萄糖(UDP-Glc)供体转移到受体上的糖基转移酶。葡萄糖基转移酶包括α-葡萄糖基转移酶、β-1,2-葡萄糖基转移酶、β-1,3-葡萄糖基转移酶和β-1,4-葡萄糖基转移酶,它们将Glc残基从UDP-Glc通过α-或β-糖苷键转移到受体上。葡萄糖基转移酶可以存在于但不限于GT1、GT4和GT25 CAZy家族中。甘露糖基转移酶是将甘露糖基团(Man)从GDP-甘露糖(GDP-Man)供体转移到受体上的糖基转移酶。甘露糖基转移酶包括α-1,2-甘露糖基转移酶、α-1,3-甘露糖基转移酶和α-1,6-甘露糖基转移酶,它们将Man残基从GDP-Man通过α-糖苷键转移到受体上。甘露糖基转移酶可以存在于但不限于GT22、GT39、GT62和GT69 CAZy家族中。N-乙酰葡糖胺基转移酶是将N-乙酰葡糖胺基团(GlcNAc)从UDP-N-乙酰葡糖胺(UDP-GlcNAc)供体转移到受体上的糖基转移酶。N-乙酰葡糖胺基转移酶可以存在于但不限于GT2和GT4CAZy家族中。半乳糖苷β-1,3-N-乙酰葡糖胺基转移酶是N-乙酰葡糖胺基转移酶的一部分并将GlcNAc从UDP-GlcNAc供体通过β-1,3-键转移到存在于受体中的末端半乳糖单元上。β-1,6-N-乙酰葡糖胺基转移酶是N-乙酰葡糖胺基转移酶,其将GlcNAc从UDP-GlcNAc供体通过β-1,6-键转移到受体上。N-乙酰基半乳糖胺基转移酶是将N-乙酰半乳糖胺基团(GalNAc)从UDP-N-乙酰半乳糖胺(UDP-GalNAc)供体转移到受体上的糖基转移酶。N-乙酰基半乳糖胺基转移酶可以存在于但不限于GT7、GT12和GT27 CAZy家族中。α-1,3-N-乙酰基半乳糖胺基转移酶是N-乙酰基半乳糖胺基转移酶的一部分并将GalNAc从UDP-GalNAc供体通过α-1,3-键转移至受体。N-乙酰甘露糖胺基转移酶是将N-乙酰甘露糖胺基团(ManNAc)从UDP-N-乙酰甘露糖胺(UDP-ManNAc)供体转移到受体上的糖基转移酶。木糖基转移酶是将木糖残基(Xyl)从UDP-木糖(UDP-Xyl)供体转移到受体上的糖基转移酶。木糖基转移酶可以存在于但不限于GT14、GT61和GT77 CAZy家族中。葡糖醛酸基转移酶是将葡糖醛酸从UDP-葡糖醛酸供体通过α-或β-糖苷键转移到受体上的糖基转移酶。葡糖醛酸基转移酶可以存在于但不限于GT4、GT43和GT93 CAZy家族中。半乳糖醛酸转移酶是将半乳糖醛酸从UDP-半乳糖醛酸供体转移到受体上的糖基转移酶。N-羟乙酰基神经氨酰基转移酶是将N-羟乙酰神经氨酸基团(Neu5Gc)从CMP-Neu5Gc供体转移到受体上的糖基转移酶。鼠李糖基转移酶是将鼠李糖残基从GDP-鼠李糖供体转移到受体上的糖基转移酶。鼠李糖基转移酶可以存在于但不限于GT1、GT2和GT102 CAZy家族中。N-乙酰基鼠李糖基转移酶是将N-乙酰基鼠李糖胺残基从UDP-N-乙酰基-L-鼠李糖胺供体转移到受体上的糖基转移酶。UDP-4-氨基-4,6-二脱氧-N-乙酰基-β-L-阿卓糖胺转氨酶是在假氨基酸的生物合成中使用UDP-2-乙酰氨基-2,6-二脱氧--L-阿拉伯型-4-己酮糖(其为用于修饰鞭毛蛋白的唾液酸样糖)的糖基转移酶。UDP-N-乙酰葡糖胺烯醇丙酮酰基转移酶(murA)是将烯醇丙酮酰基基团从磷酸烯醇丙酮酸(PEP)转移至UDP-N-乙酰葡糖胺(UDPAG)以形成UDP-N-乙酰葡糖胺烯醇丙酮酸的糖基转移酶。岩藻糖胺基转移酶是将N-乙酰基岩藻糖胺残基从dTDP-N-乙酰基岩藻糖胺或UDP-N-乙酰基岩藻糖胺供体转移到受体上的糖基转移酶。
本文中使用的术语“单糖”表示不可通过水解分解成更简单的糖的糖,其被分类为醛糖或酮醣,并且每个分子含有一个或多个羟基。单糖是仅含有一个简单糖的糖。单糖的例子包括己糖、D-吡喃型葡萄糖、D-呋喃型半乳糖、D-吡喃型半乳糖、L-吡喃型半乳糖、D-吡喃型甘露糖、D-吡喃型阿洛糖、L-吡喃型阿卓糖、D-吡喃型古洛糖、L-碘代吡喃糖、D-吡喃型塔罗糖、D-呋喃型核糖、D-吡喃型核糖、D-呋喃型阿拉伯糖、D-吡喃型阿拉伯糖、L-呋喃型阿拉伯糖、L-吡喃型阿拉伯糖、D-吡喃型木糖、D-吡喃型来苏糖、D-呋喃型赤藓糖、D-呋喃型苏糖、庚糖、L-甘油-D-甘露-吡喃型庚糖(LDmanHep)、D-甘油-D-甘露-吡喃型庚糖(DDmanHep)、6-脱氧-L-吡喃型阿卓糖、6-脱氧-D-吡喃型古洛糖、6-脱氧-D-吡喃型塔罗糖、6-脱氧-D-吡喃型半乳糖、6-脱氧-L-吡喃型半乳糖、6-脱氧-D-吡喃型甘露糖、6-脱氧-L-吡喃型甘露糖、6-脱氧-D-吡喃型葡萄糖、2-脱氧-D-阿拉伯型-己糖、2-脱氧-D-赤式-戊糖、2,6-二脱氧-D-阿拉伯型-吡喃型己糖、3,6-二脱氧-D-阿拉伯型-吡喃型己糖、3,6-二脱氧-L-阿拉伯型-吡喃型己糖、3,6-二脱氧-D-木式-吡喃型己糖、3,6-二脱氧-D-核式-吡喃型己糖、2,6-二脱氧-D-核式-吡喃型己糖、3,6-二脱氧-L-木式-吡喃型己糖、2-氨基-2-脱氧-D-吡喃型葡萄糖、2-氨基-2-脱氧-D-吡喃型半乳糖、2-氨基-2-脱氧-D-吡喃型甘露糖、2-氨基-2-脱氧-D-吡喃型阿洛糖、2-氨基-2-脱氧-L-吡喃型阿卓糖、2-氨基-2-脱氧-D-吡喃型古洛糖、2-氨基-2-脱氧-L-碘代吡喃糖、2-氨基-2-脱氧-D-吡喃型塔罗糖、2-乙酰氨基-2-脱氧-D-吡喃型葡萄糖、2-乙酰氨基-2-脱氧-D-吡喃型半乳糖、2-乙酰氨基-2-脱氧-D-吡喃型甘露糖、2-乙酰氨基-2-脱氧-D-吡喃型阿洛糖、2-乙酰氨基-2-脱氧-L-吡喃型阿卓糖、2-乙酰氨基-2-脱氧-D-吡喃型古洛糖、2-乙酰氨基-2-脱氧-L-碘代吡喃糖、2-乙酰氨基-2-脱氧-D-吡喃型塔罗糖、2-乙酰氨基-2,6-二脱氧-D-吡喃型半乳糖、2-乙酰氨基-2,6-二脱氧-L-吡喃型半乳糖、2-乙酰氨基-2,6-二脱氧-L-吡喃型甘露糖、2-乙酰氨基-2,6-二脱氧-D-吡喃型葡萄糖、2-乙酰氨基-2,6-二脱氧-L-吡喃型阿卓糖、2-乙酰氨基-2,6-二脱氧-D-吡喃型塔罗糖、D-吡喃葡萄糖醛酸、D-吡喃半乳糖醛酸、D-吡喃甘露糖醛酸、D-吡喃阿洛糖醛酸、L-吡喃阿卓糖醛酸、D-吡喃古洛糖醛酸、L-吡喃古洛糖醛酸、L-吡喃艾杜糖醛酸、D-吡喃塔罗糖醛酸、唾液酸、5-氨基-3,5-二脱氧-D-甘油-D-半乳-壬-2-酮糖酸、5-乙酰氨基-3,5-二脱氧-D-甘油-D-半乳-壬-2-酮糖酸、5-羟乙酰基酰氨基-3,5-二脱氧-D-甘油-D-半乳-壬-2-酮糖酸、赤藓糖醇、阿拉伯糖醇、木糖醇、核糖醇、葡糖醇、半乳糖醇、甘露醇、D-核式-己-2-酮吡喃糖、D-阿拉伯型-己-2-酮呋喃糖(D-呋喃型果糖)、D-阿拉伯型-己-2-酮吡喃糖、L-木式-己-2-酮吡喃糖、D-来苏-己-2-酮吡喃糖、D-苏式-戊-2-酮吡喃糖、D-阿卓式-庚-2-酮吡喃糖、3-C-(羟甲基)-D-呋喃型赤藓糖、2,4,6-三脱氧-2,4-二氨基-D-吡喃型葡萄糖、6-脱氧-3-O-甲基-D-葡萄糖、3-O-甲基-D-鼠李糖、2,6-二脱氧-3-甲基-D-核式-己糖、2-氨基-3-O-[(R)-1-羧基乙基]-2-脱氧-D-吡喃型葡萄糖、2-乙酰氨基-3-O-[(R)-羧基乙基]-2-脱氧-D-吡喃型葡萄糖、2-羟乙酰基酰氨基-3-O-[(R)-1-羧基乙基]-2-脱氧-D-吡喃型葡萄糖、3-脱氧-D-来苏-庚-2-酮吡喃糖酸(ulopyranosaric acid)、3-脱氧-D-甘露-辛-2-酮吡喃糖酸、3-脱氧-D-甘油-D-半乳-壬-2-酮吡喃糖酸、5,7-二氨基-3,5,7,9-四脱氧-L-甘油-L-甘露-壬-2-酮吡喃糖酸、5,7-二氨基-3,5,7,9-四脱氧-L-甘油-L-阿卓式-壬-2-酮吡喃糖酸、5,7-二氨基-3,5,7,9-四脱氧-D-甘油-D-半乳-壬-2-酮吡喃糖酸、5,7-二氨基-3,5,7,9-四脱氧-D-甘油-D-塔罗式-壬-2-酮吡喃糖酸、2-乙酰氨基-2,6-二脱氧--L-阿拉伯型-4-己酮糖、2-乙酰氨基-2,6-二脱氧--L-来苏-4-己酮糖、N-乙酰基-L-鼠李糖胺、N-乙酰基-D-岩藻糖胺、N-乙酰基-L-纽莫糖胺、N-乙酰基胞壁酸、N-乙酰基-L-奎诺糖胺、葡萄糖(Glc)、半乳糖(Gal)、N-乙酰葡糖胺(GlcNAc)、葡糖胺(Glcn)、甘露糖(Man)、木糖(Xyl)、N-乙酰甘露糖胺(ManNAc)、N-羟乙酰神经氨酸、N-乙酰半乳糖胺(GalNAc)、半乳糖胺(Galn)、岩藻糖(Fuc)、鼠李糖(Rha)、葡糖醛酸、葡糖酸、果糖(Fru)和多元醇。
本文中使用的术语“磷酸化的单糖”表示被磷酸化的上面列出的单糖之一。磷酸化的单糖的例子包括、但不限于葡萄糖-1-磷酸、葡萄糖-6-磷酸、葡萄糖-1,6-二磷酸、半乳糖-1-磷酸、果糖-6-磷酸、果糖-1,6-二磷酸、果糖-1-磷酸、葡糖胺-1-磷酸、葡糖胺-6-磷酸、N-乙酰葡糖胺-1-磷酸、甘露糖-1-磷酸、甘露糖-6-磷酸或岩藻糖-1-磷酸。这些磷酸化的单糖中的一些但并非全部是用于产生活化的单糖的前体或中间体。
术语“活化的单糖”、“核苷酸活化的糖”、“核苷酸-糖”、“活化的糖”、“核苷”或“核苷酸供体”在本文中可互换地使用并表示单糖的活化形式。活化的单糖的例子包括、但不限于UDP-N-乙酰葡糖胺(UDP-GlcNAc)、UDP-N-乙酰半乳糖胺(UDP-GalNAc)、UDP-N-乙酰甘露糖胺(UDP-ManNAc)、UDP-葡萄糖(UDP-Glc)、UDP-半乳糖(UDP-Gal)、GDP-甘露糖(GDP-Man)、UDP-葡糖醛酸、UDP-半乳糖醛酸、UDP-2-乙酰氨基-2,6-二脱氧--L-阿拉伯型-4-己酮糖、UDP-2-乙酰氨基-2,6-二脱氧--L-来苏-4-己酮糖、UDP-N-乙酰基-L-鼠李糖胺(UDP-L-RhaNAc或UDP-2-乙酰氨基-2,6-二脱氧-L-甘露糖)、dTDP-N-乙酰基岩藻糖胺、UDP-N-乙酰基岩藻糖胺(UDP-L-FucNAc或UDP-2-乙酰氨基-2,6-二脱氧-L-半乳糖)、UDP-N-乙酰基-L-纽莫糖胺(UDP-L-PneNAC或UDP-2-乙酰氨基-2,6-二脱氧-L-塔罗糖)、UDP-N-乙酰基胞壁酸、UDP-N-乙酰基-L-奎诺糖胺(UDP-L-QuiNAc或UDP-2-乙酰氨基-2,6-二脱氧-L-葡萄糖)、GDP-L-奎诺糖、CMP-唾液酸(CMP-Neu5Ac或CMP-N-乙酰神经氨酸)、CMP-N-羟乙酰神经氨酸(CMP-Neu5Gc)、CMP-Neu4Ac、CMP-Neu5Ac9N3、CMP-Neu4,5Ac2、CMP-Neu5,7Ac2、CMP-Neu5,9Ac2、CMP-Neu5,7(8,9)Ac2、GDP-岩藻糖(GDP-Fuc)、GDP-鼠李糖和UDP-木糖。核苷酸-糖在糖基化反应中充当糖基供体。糖基化反应是由糖基转移酶催化的反应。
本文中使用的术语“二糖”表示含有两个简单糖(即单糖)的糖聚合物。这样的二糖含有优选地选自上文所用单糖列表的单糖。二糖的例子包括乳糖(Gal-b1,4-Glc)、乳糖-N-二糖(Gal-b1,3-GlcNAc)、N-乙酰基乳糖胺(Gal-b1,4-GlcNAc)、LacDiNAc(GalNAc-b1,4-GlcNAc)、N-乙酰基半乳糖胺基葡萄糖(GalNAc-b1,4-Glc)、Neu5Ac-a2,3-Gal、Neu5Ac-a2,6-Gal和吡喃型岩藻糖基-(1-4)-N-羟乙酰基神经氨酸(Fuc-(1-4)-Neu5Gc)。
作为本文所使用的术语并且如现有技术中通常理解的,“寡糖”表示含有少量、通常3至20个简单糖(即单糖)的糖聚合物。优选地,本文描述的寡糖含有选自上文所用列表的单糖。在本发明中使用的寡糖可以是直链结构或可以包括支链。两个糖单元之间的键(例如糖苷键、半乳糖苷键、葡萄糖苷键等)可以表示为例如1,4、1->4或(1-4),它们在本文中互换使用。每个单糖可以以环形形式存在(例如,吡喃糖或呋喃糖形式)。寡糖可以含有α-和β-糖苷键或可以仅含有α-糖苷键或仅含有β-糖苷键。术语“多糖”表示由大量、通常超过20个经糖苷连接的单糖组成的化合物。
寡糖的例子包括、但不限于Lewis-型抗原寡糖,哺乳动物(包括人)乳寡糖(MMO)、O-抗原、在脂多糖(LPS)中存在的聚糖链、在荚膜多糖中存在的寡糖重复单位、肽聚糖(PG)和氨基糖。
本文中使用的“哺乳动物乳寡糖”表示寡糖,诸如但不限于3-岩藻糖基乳糖、2′-岩藻糖基乳糖、6-岩藻糖基乳糖、2’,3-二岩藻糖基乳糖、2’,2-二岩藻糖基乳糖、3,4-二岩藻糖基乳糖、6′-唾液酸基乳糖、3′-唾液酸基乳糖、3,6-二唾液酸基乳糖、6,6’-二唾液酸基乳糖、8,3-二唾液酸基乳糖、3,6-二唾液酸基乳糖-N-四糖、乳糖二岩藻四糖、乳糖-N-四糖、乳糖-N-新四糖、乳糖-N-岩藻五糖II、乳糖-N-岩藻五糖I、乳糖-N-岩藻五糖III、乳糖-N-岩藻五糖V、乳糖-N-岩藻五糖VI、唾液酸基乳糖-N-四糖c、唾液酸基乳糖-N-四糖b、唾液酸基乳糖-N-四糖a、乳糖-N-二岩藻六糖I、乳糖-N-二岩藻六糖II、乳糖-N-六糖、乳糖-N-新六糖、对-乳糖-N-六糖、单岩藻糖基单唾液酸基乳糖-N-四糖c、单岩藻糖基对-乳糖-N-六糖、单岩藻糖基乳糖-N-六糖III、异构的岩藻糖基化的乳糖-N-六糖III、异构的岩藻糖基化的乳糖-N-六糖I、唾液酸基乳糖-N-六糖、唾液酸基乳糖-N-新六糖II、二岩藻糖基-对-乳糖-N-六糖、二岩藻糖基乳糖-N-六糖、二岩藻糖基乳糖-N-六糖a、二岩藻糖基乳糖-N-六糖c、半乳糖基化的壳聚糖、岩藻糖基化的寡糖、中性寡糖和/或唾液酸化的寡糖。
如本文中使用的并且如现有技术中通常理解的,“岩藻糖基化的寡糖”是携带岩藻糖残基的寡糖。实例包括2'-岩藻糖基乳糖(2’FL)、3-岩藻糖基乳糖(3FL)、4-岩藻糖基乳糖(4FL)、6-岩藻糖基乳糖(6FL)、二岩藻糖基乳糖(diFL)、乳糖二岩藻四糖(LDFT)、乳糖-N-岩藻五糖I(LNF I)、乳糖-N-岩藻五糖II(LNF II)、乳糖-N-岩藻五糖III(LNF III)、乳糖-N-岩藻五糖V(LNF V)、乳糖-N-岩藻五糖VI(LNF VI)、乳糖-N-新岩藻五糖I、乳糖-N-二岩藻六糖I(LDFH I)、乳糖-N-二岩藻六糖II(LDFH II)、单岩藻糖基乳糖-N-六糖III(MFLNH III)、二岩藻糖基乳糖-N-六糖(DFLNHa)、二岩藻糖基-乳糖-N-新六糖。
本文中使用的“唾液酸化的寡糖”应当理解为含有带电荷的唾液酸的寡糖,即具有唾液酸残基的寡糖。它具有酸性性质。一些例子是3-SL(3′-唾液酸基乳糖或3’SL或Neu5Ac-a2,3-Gal-b1,4-Glc)、3'-唾液酸基乳糖胺、6-SL(6′-唾液酸基乳糖或6’SL或Neu5Ac-a2,6-Gal-b1,4-Glc)、3,6-二唾液酸基乳糖(Neu5Ac-a2,3-(Neu5Ac-a2,6)-Gal-b1,4-Glc)、6,6’-二唾液酸基乳糖(Neu5Ac-a2,6-Gal-b1,4-(Neu5Ac-a2,6)-Glc)、8,3-二唾液酸基乳糖(Neu5Ac-a2,8-Neu5Ac-a2,3-Gal-b1,4-Glc)、6'-唾液酸基乳糖胺、包含6'-唾液酸基乳糖的寡糖、SGG己糖(Neu5Acα-2,3Galβ-1,3GalNacβ-1,3Galα-1,4Galβ-1,4Gal)、唾液酸化的四糖(Neu5Acα-2,3Galβ-1,4GlcNacβ-14GlcNAc)、戊糖LSTD(Neu5Acα-2,3Galβ-1,4GlcNacβ-1,3Galβ-1,4Glc)、唾液酸化的乳糖-N-三糖、唾液酸化的乳糖-N-四糖、唾液酸基乳糖-N-新四糖、单唾液酸基乳糖-N-六糖、二唾液酸基乳糖-N-六糖I、单唾液酸基乳糖-N-新六糖I、单唾液酸基乳糖-N-新六糖II、二唾液酸基乳糖-N-新六糖、二唾液酸基乳糖-N-四糖、二唾液酸基乳糖-N-六糖II、唾液酸基乳糖-N-四糖a、二唾液酸基乳糖-N-六糖I、唾液酸基乳糖-N-四糖b、3'-唾液酸基-3-岩藻糖基乳糖、二唾液酸单岩藻糖基乳糖-N-新六糖、单岩藻糖基单唾液酸基乳糖-N-八糖(唾液酸基Lea)、唾液酸基乳糖-N-岩藻六糖II、二唾液酸基乳糖-N-岩藻五糖II、单岩藻糖基二唾液酸基乳糖-N-四糖和带有一个或几个唾液酸残基的寡糖,包括、但不限于:选自GM3(3'唾液酸基乳糖、Neu5Acα-2,3Galβ-4Glc)的神经节苷脂的寡糖部分,和包含GM3基序的寡糖、GD3 Neu5Acα-2,8Neu5Acα-2,3Galβ-1,4Glc GT3(Neu5Acα-2,8Neu5Acα-2,8Neu5Acα-2,3Galβ-1,4Glc);GM2GalNAcβ-1,4(Neu5Acα-2,3)Galβ-1,4Glc、GM1Galβ-1,3GalNAcβ-1,4(Neu5Acα-2,3)Galβ-1,4Glc、GD1aNeu5Acα-2,3Galβ-1,3GalNAcβ-1,4(Neu5Acα-2,3)Galβ-1,4Glc、GT1aNeu5Acα-2,8Neu5Acα-2,3Galβ-1,3GalNAcβ-1,4(Neu5Acα-2,3)Galβ-1,4Glc、GD2GalNAcβ-1,4(Neu5Acα-2,8Neu5Acα2,3)Galβ-1,4Glc、GT2GalNAcβ-1,4(Neu5Acα-2,8Neu5Acα-2,8Neu5Acα2,3)Galβ-1,4Glc、GD1b、Galβ-1,3GalNAcβ-1,4(Neu5Acα-2,8Neu5Acα2,3)Galβ-1,4Glc、GT1bNeu5Acα-2,3Galβ-1,3GalNAcβ-1,4(Neu5Acα-2,8Neu5Acα2,3)Galβ-1,4Glc、GQ1bNeu5Acα-2,8Neu5Acα-2,3Galβ-1,3GalNAcβ-1,4(Neu5Acα-2,8Neu5Acα2,3)Galβ-1,4Glc、GT1cGalβ-1,3GalNAcβ-1,4(Neu5Acα-2,8Neu5Acα-2,8Neu5Acα2,3)Galβ-1,4Glc、GQ1cNeu5Acα-2,3Galβ-1,3GalNAcβ-1,4(Neu5Acα-2,8Neu5Acα-2,8Neu5Acα2,3)Galβ-1,4Glc、GP1cNeu5Acα-2,8Neu5Acα-2,3Galβ-1,3GalNAcβ-1,4(Neu5Acα-2,8Neu5Acα-2,8Neu5Acα2,3)Galβ-1,4Glc、GD1aNeu5Acα-2,3Galβ-1,3(Neu5Acα-2,6)GalNAcβ-1,4Galβ-1,4Glc、岩藻糖基-GM1Fucα-1,2Galβ-1,3GalNAcβ-1,4(Neu5Acα-2,3)Galβ-1,4Glc;它们都可以扩展到通过使上述寡糖部分与神经酰胺反应或在神经酰胺上合成上述寡糖来产生相应的神经节苷脂。
如本文中使用的并且如现有技术中通常理解的,“中性寡糖”是不具有源自羧酸基团的负电荷的寡糖。这样的中性寡糖的例子是2'-岩藻糖基乳糖(2’FL)、3-岩藻糖基乳糖(3FL)、2',3-二岩藻糖基乳糖(diFL)、乳糖-N-三糖II、乳糖-N-四糖、乳糖-N-新四糖、乳糖-N-岩藻五糖I、乳糖-N-新岩藻五糖I、乳糖-N-岩藻五糖II、乳糖-N-岩藻五糖III、乳糖-N-岩藻五糖V、乳糖-N-岩藻五糖VI、乳糖-N-新岩藻五糖V、乳糖-N-二岩藻六糖I、乳糖-N-二岩藻六糖II、6'-半乳糖基乳糖、3'-半乳糖基乳糖、乳糖-N-六糖、乳糖-N-新六糖、对-乳糖-N-六糖、对-乳糖-N-新六糖、二岩藻糖基-乳糖-N-六糖和二岩藻糖基-乳糖-N-新六糖。
哺乳动物乳寡糖包含存在于在哺乳期间的任何阶段所见乳中的寡糖,包括来自人和哺乳动物的初乳,所述哺乳动物包括、但不限于:牛(欧洲牛(Bos Taurus))、绵羊(绵羊(Ovis aries))、山羊(家山羊(Capra aegagrus hircus))、双峰骆驼(双峰驼(Camelusbactrianus))、马(欧洲野马(Equus ferus caballus))、猪(野猪(Sus scropha))、犬(家犬(Canis lupus familiaris))、虾夷棕熊(ezo brown bears)(日本棕熊(Ursus arctosyesoensis))、北极熊(海熊(Ursus maritimus))、日本黑熊(日本黑熊(Ursus thibetanusjaponicus))、条纹臭鼬(条纹臭鼬(Mephitis mephitis))、冠海豹(冠海豹(Cystophoracristata))、亚洲象(亚洲象(Elephas maximus))、非洲象(非洲象(Loxodontaafricana))、巨食蚁兽(大食蚁兽(Myrmecophaga tridactyla))、瓶鼻海豚(瓶鼻海豚(Tursiops truncates))、北方小须鲸(小须鲸(Balaenoptera acutorostrata))、尤金袋鼠(尤金袋鼠(Macropus eugenii))、红袋鼠(红袋鼠(Macropus rufus))、刷尾负鼠(帚尾袋貂(Trichosurus Vulpecula))、考拉(考拉(Phascolarctos cinereus))、东袋鼬(东袋鼬(Dasyurus viverrinus))、鸭嘴兽(鸭嘴兽(Ornithorhynchus anatinus))。
本文中使用的术语“Lewis型抗原”包含下述寡糖:H1抗原,其为Fucα1-2Galβ1-3GlcNAc或缩写2'FLNB;Lewisa,其为三糖Galβ1-3[Fucα1-4]GlcNAc或缩写4-FLNB;Lewisb,其为四糖Fucα1-2Galβ1-3[Fucα1-4]GlcNAc或缩写DiF-LNB;唾液酸基Lewisa,其为5-乙酰基神经氨酰基-(2-3)-半乳糖基-(1-3)-(吡喃型岩藻糖基-(1-4))-N-乙酰葡糖胺或缩写Neu5Acα2-3Galβ1-3[Fucα1-4]GlcNAc;H2抗原,其为Fucα1-2Galβ1-4GlcNAc或另外称作2'岩藻糖基-N-乙酰基-乳糖胺,缩写2'FLacNAc;Lewisx,其为三糖Galβ1-4[Fucα1-3]GlcNAc,或另外称作3-岩藻糖基-N-乙酰基-乳糖胺,缩写3-FLacNAc;Lewisy,其为四糖Fucα1-2Galβ1-4[Fucα1-3]GlcNAc;和唾液酸基Lewisx,其为5-乙酰基神经氨酰基-(2-3)-半乳糖基-(1-4)-(吡喃型岩藻糖基-(1-3))-N-乙酰葡糖胺或缩写Neu5Acα2-3Galβ1-4[Fucα1-3]GlcNAc。
本文中使用的术语“O-抗原”表示革兰氏阴性细菌的表面脂多糖(LPS)的重复聚糖组分。术语“脂多糖”或“LPS”表示在革兰氏阴性细菌的外膜中发现的糖脂,其由脂质A、核心寡糖和O-抗原组成。术语“荚膜多糖”表示存在于细菌荚膜中的具有寡糖重复结构的长链多糖,所述荚膜是位于细胞包膜外部的多糖层。术语“肽聚糖”或“胞壁质”表示在大多数细菌的细胞壁中的必需结构元件,其由糖和氨基酸组成,其中所述糖组分由β-1,4连接的GlcNAc和N-乙酰基胞壁酸的交替残基组成。本文中使用的术语“氨基-糖”表示其中羟基已经被胺基替换的糖分子。
如在本发明中所用的术语“LNT II”、“LNT-II”、“LN3”、“乳糖-N-三糖II”、“乳糖-N-三糖II”、“乳糖-N-三糖”、“乳糖-N-三糖”或“GlcNAcβ1-3Galβ1-4Glc”互换使用。
如在本发明中所用的术语“LNT”、“乳糖-N-四糖”、“乳糖-N-四糖”或“Galβ1-3GlcNAcβ1-3Galβ1-4Glc”互换使用。
如在本发明中所用的术语“LNnT”、“乳糖-N-新四糖”、“乳糖-N-新四糖”、“新-LNT”或“Galβ1-4GlcNAcβ1-3Galβ1-4Glc”互换使用。
如在本发明中所用的术语“LSTa”、“LS-四糖a”、“唾液酸基-乳糖-N-四糖a”、“唾液酸基乳糖-N-四糖a”或“Neu5Ac-a2,3-Gal-b1,3-GlcNAc-b1,3-Gal-b1,4-Glc”互换使用。
如在本发明中所用的术语“LSTb”、“LS-四糖b”、“唾液酸基-乳糖-N-四糖b”、“唾液酸基乳糖-N-四糖b”或“Gal-b1,3-(Neu5Ac-a2,6)-GlcNAc-b1,3-Gal-b1,4-Glc”互换使用。
如在本发明中所用的术语“LSTc”、“LS-四糖c”、“唾液酸基-乳糖-N-四糖c”、“唾液酸基乳糖-N-四糖c”、“唾液酸基乳糖-N-新四糖c”或“Neu5Ac-a2,6-Gal-b1,4-GlcNAc-b1,3-Gal-b1,4-Glc”互换使用。
如在本发明中所用的术语“LSTd”、“LS-四糖d”、“唾液酸基-乳糖-N-四糖d”、“唾液酸基乳糖-N-四糖d”、“唾液酸基乳糖-N-新四糖d”或“Neu5Ac-a2,3-Gal-b1,4-GlcNAc-b1,3-Gal-b1,4-Glc”互换使用。
术语“苷元”是指糖苷的非碳水化合物基团。
如本文所用,术语“糖脂(glycolipid)”是指本领域通常已知的任何糖脂。糖脂(GL)可分为简单糖脂(SGL)和复杂糖脂(CGL)。简单GL,有时被称为糖脂(saccharolipid),是两组分(糖基和脂质部分)GL,其中糖基和脂质部分彼此直接连接。SGL的例子包括糖基化脂肪酸、脂肪醇、类胡萝卜素、藿烷类、甾醇或副康酸。细菌产生的SGL可分为鼠李糖脂、葡萄糖脂、海藻糖脂、其他糖基化(不含海藻糖)霉菌酸酯、含海藻糖的寡糖脂、糖基化脂肪醇、糖基化大环内酯和大环内酰胺、糖基化大环双内酯(糖基化的大环双内酯)、糖基化类胡萝卜素和糖萜类、以及糖基化藿烷/甾醇。然而,复杂糖脂(CGL)在结构上更具异质性,因为它们除了含有糖基和脂质部分外,还含有其他残基,如甘油(甘油脂)、肽(糖肽类脂)、酰化鞘磷脂(糖鞘脂)或其他残基(脂多糖、酚类糖脂、核苷脂)。含有Neu(n)Ac的糖脂的例子包括辛基-β-唾液酸基乳糖苷、唾液糖鞘脂和神经节脂苷。
术语“糖蛋白”是指本领域通常已知的任何糖蛋白。糖蛋白可以根据糖蛋白氨基酸残基上存在的糖基化类型分为N-糖基化、O-糖基化、P-糖基化、C-糖基化和S-糖基化的蛋白。含有Neu(n)Ac的糖蛋白的例子包括但不限于含有Neu5Gc的唾液酸基-Tn-MUC1和唾液酸基-T-MUC1糖肽、唾液酰糖多肽、唾液糖蛋白、血型糖蛋白(如血型糖蛋白A和血型糖蛋白C)、足萼糖蛋白(podocalyxin)、促性腺激素受体、平足蛋白、CD43(增白细胞蛋白(leukosialin)、唾液载体蛋白(sialophorin))和朊蛋白PrP。
本文中使用的术语“用于产生生物产物的途径”是由参与如本文中定义的生物产物的合成的酶和它们的相应基因组成的生化途径。
本文中使用的术语“用于产生含有Neu(n)Ac的化合物的途径”是由参与如本文中定义的含有Neu(n)Ac的化合物的合成的酶和它们的相应基因组成的生化途径。所述用于产生含有Neu(n)Ac的化合物的途径包含至少一种Neu(n)Ac合酶。此外,所述用于产生含有Neu(n)Ac的化合物的途径可以包括但不限于在核苷酸活化的糖的合成和所述核苷酸活化的糖转移至受体以产生本发明的含有Neu(n)Ac的化合物中涉及的途径。这样的途径的其他例子包括但不限于岩藻糖基化、唾液酸化、半乳糖基化、N-乙酰葡糖胺基化、N-乙酰基半乳糖基化、甘露糖基化、N-乙酰甘露糖胺基化途径。
本文中使用的“岩藻糖基化途径”是包含与产生α1,2、α1,3、α1,4和/或α1,6岩藻糖基化的化合物的岩藻糖基转移酶组合的选自以下列表的酶和它们的相应基因中的至少一种的生化途径,所述列表包含甘露糖-6-磷酸异构酶、磷酸甘露糖变位酶、甘露糖-1-磷酸鸟苷酰基转移酶、GDP-甘露糖4,6-脱水酶、GDP-L-岩藻糖合酶、岩藻糖通透酶、岩藻糖激酶、岩藻糖-1-磷酸鸟苷酰基转移酶。
“唾液酸化途径”是包含与产生α2,3、α2,6和/或α2,8唾液酸化的化合物的唾液酸转移酶组合的选自以下列表的酶和它们的相应基因中的至少一种的生化途径,所述列表包含N-酰基葡糖胺2-差向异构酶、UDP-N-乙酰葡糖胺2-差向异构酶、N-乙酰甘露糖胺-6-磷酸2-差向异构酶、UDP-GlcNAc 2-差向异构酶/激酶水解、N-酰基神经氨酸-9-磷酸合成酶、N-酰基神经氨酸-9-磷酸磷酸酶、Neu(n)Ac合酶和CMP唾液酸合酶。
本文中使用的“半乳糖基化途径”是包含与产生半乳糖基化的化合物的半乳糖基转移酶组合的选自以下列表的酶和它们的相应基因中的至少一种的生化途径,所述列表包含半乳糖-1-差向异构酶、半乳糖激酶、葡糖激酶、半乳糖-1-磷酸尿苷酰基转移酶、UDP-葡萄糖4-差向异构酶、葡萄糖-1-磷酸尿苷酰基转移酶、葡萄糖磷酸变位酶,所述半乳糖基化的化合物包含在所述单糖、二糖或寡糖的2、3、4和6-羟基中的任何一个或多个上具有α或β结合的半乳糖的单糖、二糖或寡糖。
本文中使用的“N-乙酰葡糖胺基化途径”是包含与产生GlcNAc修饰的化合物的糖基转移酶组合的选自以下列表的酶和它们的相应基因中的至少一种的生化途径,所述列表包含L-谷氨酰胺-D-果糖-6-磷酸氨基转移酶、N-乙酰葡糖胺-6-磷酸脱乙酰酶、磷酸葡糖胺变位酶、N-乙酰葡糖胺-1-磷酸尿苷酰基转移酶/葡糖胺-1-磷酸乙酰基转移酶,所述GlcNAc修饰的化合物包含在单糖、二糖或寡糖的3、4和6-羟基中的任何一个或多个上具有α或β结合的N-乙酰葡糖胺(GlcNAc)的单糖、二糖或寡糖。
本文中使用的N-乙酰半乳糖基化途径”是包含与产生GalNAc修饰的化合物的糖基转移酶组合的选自以下列表的酶和它们的相应基因中的至少一种的生化途径,所述列表包含L-谷氨酰胺-D-果糖-6-磷酸氨基转移酶、磷酸葡糖胺变位酶、N-乙酰葡糖胺1-磷酸尿苷酰基转移酶、UDP-N-乙酰葡糖胺4-差向异构酶、UDP-半乳糖4-差向异构酶、N-乙酰半乳糖胺激酶和/或UDP-GalNAc焦磷酸化酶,所述GalNAc修饰的化合物包含在单糖、二糖或寡糖上具有α或β结合的N-乙酰半乳糖胺的单糖、二糖或寡糖。
本文中使用的“甘露糖基化途径”是包含与产生甘露糖基化的化合物的糖基转移酶组合的选自以下列表的酶和它们的相应基因中的至少一种的生化途径,所述列表包含甘露糖-6-磷酸异构酶、磷酸甘露糖变位酶和/或甘露糖-1-磷酸鸟苷酰基转移酶,所述甘露糖基化的化合物包含在单糖、二糖或寡糖上具有α或β结合的甘露糖的单糖、二糖或寡糖。
本文中使用的“N-乙酰甘露糖胺基化途径”是包含与产生ManNAc修饰的化合物的糖基转移酶组合的选自以下列表的酶和它们的相应基因中的至少一种的生化途径,所述列表包含L-谷氨酰胺-D-果糖-6-磷酸氨基转移酶、葡糖胺-6-磷酸脱氨酶、磷酸葡糖胺变位酶、N-乙酰葡糖胺-6-磷酸脱乙酰酶、葡糖胺6-磷酸N-乙酰基转移酶、N-乙酰葡糖胺-1-磷酸尿苷酰基转移酶、葡糖胺-1-磷酸乙酰基转移酶、葡糖胺-1-磷酸乙酰基转移酶、UDP-GlcNAc2-差向异构酶和/或ManNAc激酶,所述ManNAc修饰的化合物包含在单糖、二糖或寡糖上具有α或β结合的N-乙酰甘露糖胺的单糖、二糖或寡糖。
术语“使流出”是指引导溶质跨细胞质膜和/或细胞壁运输的活性。所述运输可以通过引入本发明中描述的转运蛋白和/或增加其表达来实现。术语“增强的流出”是指改善溶质跨细胞质膜和/或细胞壁的运输活性。所述运输可以通过引入本发明所述的转运蛋白和/或增加其表达来增强。转运蛋白的“表达”被定义为编码所述转运蛋白的基因的“过表达”(在所述基因是内源基因的情况下)或“表达”(在编码所述转运蛋白的基因是在野生型菌株或细胞中不存在的异源基因的情况下)。
术语“乙酰辅酶A合成酶”、“acs”、“AcCoA合成酶”、“乙酰--CoA连接酶”、“酰基活化酶”和“yfaC”互换使用并表示在ATP依赖性的反应中催化乙酸盐转化成乙酰基-辅酶A(AcCoA)的酶。
术语“丙酮酸脱氢酶”、“丙酮酸氧化酶”、“POX”、“poxB”和“丙酮酸:泛醌-8氧化还原酶”互换使用并表示催化丙酮酸的氧化脱羧以产生乙酸盐和CO2的酶。
术语“乳酸脱氢酶”、“D-乳酸脱氢酶”、“ldhA”、“hslI”、“htpH”、“D-LDH”、“发酵乳酸脱氢酶”和“D特异性的2-羟酸脱氢酶”互换使用并表示催化乳酸转化成丙酮酸并由此产生NADH的酶。
本文中使用的术语“细胞生产指数(CPI)”表示将细胞产生的生物产物的质量除以在培养物中产生的细胞的质量。
术语“纯化的”表示实质上或基本上不含有干扰生物分子活性的组分的物质。对于细胞、糖、核酸和多肽,术语“纯化的”表示实质上或基本上不含有在该物质的天然状态下发现的通常伴随该物质的组分的物质。通常,本发明的纯化的糖、寡糖、蛋白或核酸是至少约50%、55%、60%、65%、70%、75%、80%或85%纯的,通常至少约90%、91%、92%、93%、94%、95%、96%、97%、98%或99%纯的,这通过银染凝胶上的条带强度或其它确定纯度的方法测量。通过本领域众所周知的多种方法,诸如蛋白或核酸样品的聚丙烯酰胺凝胶电泳,随后在染色后可视化,可以指示纯度或同质性。出于某些目的,将需要高分辨率并使用HPLC或类似的纯化方法。对于二糖和寡糖,使用诸如但不限于薄层色谱法、气相色谱法、NMR、HPLC、毛细管电泳或质谱法的方法,可以测定纯度。
术语“培养物”表示在其中培养或发酵细胞的培养基、细胞本身、以及由细胞在整个培养液中(即,在细胞内部(细胞内地)以及在细胞外部(细胞外地))产生的生物产物(如例如含有Neu(n)Ac的化合物)。
本文中使用的术语“前体”表示由细胞摄取或合成以特异性地产生根据本发明的生物产物(如例如含有Neu(n)Ac的化合物)的物质。在这个意义上,前体可以是本文定义的受体,但也可以是另一种物质、代谢物,其首先在细胞内被修饰作为生物产物(如例如含有Neu(n)Ac的化合物)的生化合成途径的一部分。这样的前体的例子包括如本文中定义的受体和/或葡萄糖、半乳糖、果糖、甘油、唾液酸、岩藻糖、甘露糖、麦芽糖、蔗糖、乳糖、葡萄糖-1-磷酸、半乳糖-1-磷酸、UDP-葡萄糖、UDP-半乳糖、葡萄糖-6-磷酸、果糖-6-磷酸、果糖-1,6-二磷酸、甘油-3-磷酸、二羟基丙酮、甘油醛-3-磷酸、二羟基丙酮-磷酸、葡糖胺-6-磷酸、葡糖胺、N-乙酰葡糖胺-6-磷酸、N-乙酰葡糖胺、N-乙酰甘露糖胺、N-乙酰甘露糖胺-6-磷酸、UDP-N-乙酰葡糖胺、N-乙酰葡糖胺-1-磷酸、N-乙酰神经氨酸-9-磷酸、CMP-唾液酸、甘露糖-6-磷酸、甘露糖-1-磷酸、GDP-甘露糖、GDP-4-脱氢-6-脱氧-α-D-甘露糖、和/或GDP-岩藻糖。
任选地,细胞被转化以包含和表达至少一种编码蛋白的核酸序列,所述蛋白选自乳糖转运蛋白、N-乙酰神经氨酸转运蛋白、岩藻糖转运蛋白、葡萄糖转运蛋白、半乳糖转运蛋白、核苷酸活化的糖的转运蛋白,其中所述转运蛋白内化在培养基中添加的前体用于合成本发明的生物产物(如例如含有Neu(n)Ac的化合物)。
本文中使用的术语“受体”表示可以被糖基转移酶修饰的单糖、二糖或寡糖、脂质或蛋白。这样的受体的例子包括葡萄糖、半乳糖、果糖、甘油、唾液酸、岩藻糖、甘露糖、麦芽糖、蔗糖、乳糖、乳糖-N-三糖、乳糖-N-四糖(LNT)、乳糖-N-新四糖(LNnT)、乳糖-N-五糖(LNP)、乳糖-N-新五糖、对乳糖-N-五糖、对乳糖-N-新五糖、乳糖-N-新(novo)五糖I、乳糖-N-六糖(LNH)、乳糖-N-新六糖(LNnH)、对乳糖-N-新六糖(pLNnH)、对乳糖-N-六糖(pLNH)、乳糖-N-七糖、乳糖-N-新七糖、对乳糖-N-新七糖、对乳糖-N-七糖、乳糖-N-八糖(LNO)、乳糖-N-新八糖、异乳糖-N-八糖、对乳糖-N-八糖、异乳糖-N-新八糖、新(novo)乳糖-N-新八糖、对乳糖-N-新八糖、异乳糖-N-九糖、新(novo)乳糖-N-九糖、乳糖-N-九糖、乳糖-N-十糖、异乳糖-N-十糖、新(novo)乳糖-N-十糖、乳糖-N-新十糖和含有1个或多个N-乙酰基乳糖胺单元和/或1个或多个乳糖-N-二糖单元或中间体以形成寡糖、其岩藻糖基化和唾液酸化形式、神经酰胺、N-酰基化鞘磷脂(N-acylated sphingoid)、葡萄糖神经酰胺、乳糖神经酰胺、鞘氨醇、植物鞘氨醇、鞘氨醇合成子、具有β-GlcNAc-Asn残基的肽骨架、具有末端GlcNAc和Gal残基的糖蛋白、免疫球蛋白。
发明详述
根据第一个方面,本发明提供了用于产生下述列表中的生物产物的代谢工程改造的细胞,所述列表包括单糖、活化的单糖、磷酸化的单糖、二糖、寡糖、苷元、糖脂或糖蛋白。在本发明中,提供了包含用于产生所述生物产物的途径的代谢工程改造的细胞。所述途径的实例包括但不限于:参与单糖、磷酸化的单糖、核苷酸活化的糖、脂质和/或蛋白的合成的途径,和/或糖基化途径,如例如岩藻糖基化、唾液酸化、半乳糖基化、N-乙酰葡糖胺基化、N-乙酰半乳糖基化、甘露糖基化和/或N-乙酰甘露糖胺基化途径。所述用于产生生物产物(包括二糖、寡糖、苷元、糖脂或糖蛋白)的途径优选地包含至少一种参与所述生物产物产生的糖基转移酶。
在本发明的方法和/或细胞的一个优选实施方案中,所述细胞包含一个或多个用于单糖合成的途径。所述用于单糖合成的途径包含酶,如例如羧化酶、脱羧酶、异构酶、差向异构酶、还原酶、烯醇酶、磷酸化酶、羧基激酶、激酶、磷酸酶、醛缩酶、水解酶、脱氢酶、参与一种或多种核苷三磷酸(如UTP、GTP、ATP和CTP)合成的酶、分别参与核苷单磷酸或核苷二磷酸(如例如UMP和UDP)中任意一种或多种的合成的酶以及参与磷酸烯醇丙酮酸(PEP)合成的酶。
在本发明的方法和/或细胞的另一个和/或另外优选的实施方案中,所述细胞包含一个或多个用于磷酸化的单糖合成的途径。所述用于磷酸化的单糖合成的途径包含:参与一种或多种单糖、一种或多种核苷单磷酸、二磷酸和/或三磷酸的合成的酶,以及参与磷酸烯醇丙酮酸(PEP)合成的酶,如例如但不限于:PEP合酶、羧化酶、脱羧酶、异构酶、差向异构酶、还原酶、烯醇酶、磷酸化酶、羧基激酶、激酶、磷酸酶、醛缩酶、水解酶和脱氢酶。在本发明的方法和/或细胞的另一个和/或另外优选的实施方案中,所述细胞包含一个或多个用于一种或多种核苷酸活化的糖合成的途径。所述用于核苷酸活化的糖合成的途径包含酶,如例如PEP合酶、羧化酶、脱羧酶、异构酶、差向异构酶、还原酶、烯醇酶、磷酸化酶、羧基激酶、激酶、磷酸酶、醛缩酶、水解酶、脱氢酶、甘露糖-6-磷酸异构酶、磷酸甘露糖变位酶、甘露糖-1-磷酸鸟苷酰基转移酶、GDP-甘露糖4,6-脱水酶、GDP-L-岩藻糖合酶、L-岩藻糖激酶/GDP-岩藻糖焦磷酸化酶、L-谷氨酰胺-D-果糖-6-磷酸氨基转移酶、葡糖胺-6-磷酸脱氨酶、磷酸葡糖胺变位酶、N-乙酰葡糖胺-6-磷酸脱乙酰酶、N-乙酰葡糖胺差向异构酶、UDP-N-乙酰葡糖胺2-差向异构酶、N-乙酰葡糖胺-6P 2-差向异构酶、葡糖胺6-磷酸N-乙酰基转移酶、N-乙酰葡糖胺-6-磷酸磷酸酶、N-乙酰甘露糖胺-6-磷酸磷酸酶、N-乙酰甘露糖胺激酶、磷酸乙酰葡糖胺变位酶、N-乙酰葡糖胺-1-磷酸尿苷酰基转移酶、葡糖胺-1-磷酸乙酰基转移酶、唾液酸合酶、N-乙酰神经氨酸裂合酶、N-酰基神经氨酸-9-磷酸合酶、N-酰基神经氨酸-9-磷酸磷酸酶、CMP-唾液酸合酶、半乳糖-1-差向异构酶、半乳糖激酶、葡糖激酶、半乳糖-1-磷酸尿苷酰基转移酶、UDP-葡萄糖4-差向异构酶、葡萄糖-1-磷酸尿苷酰基转移酶、葡萄糖磷酸变位酶和/或N-乙酰葡糖胺-1-磷酸尿苷酰基转移酶。
在另一个和/或另外优选的实施方案中,所述细胞包含至少一种参与所述生物产物的产生的糖基转移酶。所述糖基转移酶可以选自以下列表,所述列表包含但不限于:岩藻糖基转移酶、唾液酸转移酶、半乳糖基转移酶、葡萄糖基转移酶、甘露糖基转移酶、N-乙酰葡糖胺基转移酶、N-乙酰基半乳糖胺基转移酶、N-乙酰甘露糖胺基转移酶、木糖基转移酶、葡糖醛酸基转移酶、半乳糖醛酸转移酶、葡糖胺基转移酶、N-羟乙酰基神经氨酰基转移酶、鼠李糖基转移酶、N-乙酰基鼠李糖基转移酶、UDP-4-氨基-4,6-二脱氧-N-乙酰基-β-L-阿卓糖胺转氨酶、UDP-N-乙酰葡糖胺烯醇丙酮酰基转移酶和岩藻糖胺基转移酶。
根据第二个方面,本发明提供用于产生含有N-乙酰神经氨酸(Neu(n)Ac)的化合物的代谢工程改造的细胞,其中(n)为4、5、7、8或9或其组合。在本发明中,提供包含用于产生含有N-乙酰神经氨酸(Neu(n)Ac)的化合物的途径的代谢工程改造的微生物宿主细胞,其表达至少一种Neu(n)Ac合酶,所述Neu(n)Ac合酶具有Neu(n)Ac合酶活性,并且其具有PFAM结构域PF03102和/或PatricDB总体家族结构域PGF_06907304,并且其包含SEQ ID NO 01的序列:[ILMV][MST]XXXXX(X,非K)(X,非Q)XXXXXXXXXXXX(X,非I)XXX(X,非T)X[ACS][ST][AP][FWY]XXX(X,非G)X(X,非L)X[IL](X,非K)XXXX(X,非E)XXKXXS,其中X是任何氨基酸,或者其包含SEQ ID NO 02、03、04、05、06、07、08、09、10、11、12、13、14、15、16、17或18中任一个所述的多肽序列,或是SEQ ID NO 02、03、04、05、06、07、08、09、10、11、12、13、14、15、16、17或18中任一个的功能同系物、变体或衍生物,所述功能同系物、变体或衍生物分别与具有SEQ IDNO 02、03、04、05、06、07、08、09、10、11、12、13、14、15、16、17或18的所述多肽中任一种的全长具有至少80%总体序列同一性并且具有Neu(n)Ac合酶活性。所述细胞可以包含并表达参与所述含有Neu(n)Ac的化合物的产生的至少一种糖基转移酶。贯穿本申请,除非另外指明,表述“SEQ ID NO 02、03、04、05、06、07、08、09、10、11、12、13、14、15、16、17或18中任一个所述的多肽序列”优选地被表述“SEQ ID NO 02、04、05、06、07、08、09、10、11、12、13、14、15、16、17或18中任一个所述的多肽序列”替换。换言之,本发明所述的含有Neu(n)Ac的化合物优选地不包含SEQ ID NO 03和/或优选地不是SEQ ID NO 03的功能同系物、变体或衍生物。
根据第三个方面,本发明提供了由代谢工程改造的细胞产生本文所述的生物产物(如例如含有Neu(n)Ac的化合物,其中(n)为4、5、7、8或9或其组合)的方法。所述方法包括以下步骤:
1)提供如本文描述的细胞,和
2)在允许产生所述生物产物(如例如含有Neu(n)Ac的化合物)的条件下培养所述细胞。
优选地,从如本文中解释的培养物中分离生物产物(如例如含有Neu(n)Ac的化合物)。
在本发明的范围内,允许条件被理解为与物理或化学参数相关的条件,包括、但不限于温度、pH、压强、渗透压和产物/前体/受体浓度。
在一个特定实施方案中,允许条件可以包括30±20摄氏度的温度范围、7±3的pH范围。优选地,所述pH范围为2-10。
本发明提供了用代谢工程改造的细胞产生含有Neu(n)Ac的化合物的不同类型的细胞。
根据本发明的方法和/或细胞,所述细胞表达合成本文定义的Neu(n)Ac分子的Neu(n)Ac合酶。在所述方法和/或细胞的一个优选的实施方案中,所述细胞表达多于一种合成本文定义的任意一种或多种Neu(n)Ac分子的Neu(n)Ac合酶。
根据本发明的方法和/或细胞的一个实施方案,所述细胞优选地表达至少一种Neu(n)Ac合酶,所述Neu(n)Ac合酶具有Neu(n)Ac合酶活性,并且其具有PFAM结构域PF03102和/或PatricDB总体家族结构域PGF_06907304,并且包含SEQ ID NO 01的序列:[ILMV][MST]XXXXX(X,非K)(X,非Q)XXXXXXXXXXXX(X,非I)XXX(X,非T)X[ACS][ST][AP][FWY]XXX(X,非G)X(X,非L)X[IL](X,非K)XXXX(X,非E)XXKXXS,其中X是任何氨基酸。所述PFAM结构域按照2018年9月发布的关于Pfam 32.0的定义进行分类。所述PatricDB结构域按照2020年3月发布的关于PATRIC 3.6.9的定义进行分类。
在本发明的方法和/或细胞的另一个优选的实施方案中,在所述细胞中表达的至少一种Neu(n)Ac合酶包含SEQ ID NO 02、03、04、05、06、07、08、09、10、11、12、13、14、15、16、17或18中任一个所述的多肽序列。在本发明的方法和/或细胞的替代性优选的实施方案中,所述细胞表达至少一种Neu(n)Ac合酶,所述Neu(n)Ac合酶是SEQ ID NO 02、03、04、05、06、07、08、09、10、11、12、13、14、15、16、17或18中任一个的功能同系物、变体或衍生物,所述功能同系物、变体或衍生物分别与具有SEQ ID NO 02、03、04、05、06、07、08、09、10、11、12、13、14、15、16、17或18的所述多肽中任一种的全长具有至少80%总体序列同一性并且具有Neu(n)Ac合酶活性。在本发明的情形中,优选地,所述功能同系物、变体或衍生物包含SEQ IDNO 01的序列:[ILMV][MST]XXXXX(X,非K)(X,非Q)XXXXXXXXXXXX(X,非I)XXX(X,非T)X[ACS][ST][AP][FWY]XXX(X,非G)X(X,非L)X[IL](X,非K)XXXX(X,非E)XXKXXS,其中X是任何氨基酸。与具有SEQ ID NO 02、03、04、05、06、07、08、09、10、11、12、13、14、15、16、17或18的所述多肽中任一种的全长的至少80%总体序列同一性应该理解为分别与具有本文给出的SEQID NO 02、03、04、05、06、07、08、09、10、11、12、13、14、15、16、17或18的所述多肽中任一种的至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%总体序列同一性。
在本发明的方法和/或细胞的另一个优选的实施方案中,所述细胞被代谢工程改造成包含用于产生本文定义的含有Neu(n)Ac的化合物的途径。在发明的方法和/或细胞的一个替代性优选的实施方案中,所述细胞被代谢工程改造成包含用于产生含有Neu(n)Ac的化合物的途径并且具有本发明的Neu(n)Ac合酶的修饰的表达或活性。
在本发明的方法和/或细胞的另一个优选的实施方案中,所述细胞包含一种重组糖基转移酶,所述重组糖基转移酶能够用一种或多种Neu(n)Ac分子修饰乳糖或本文定义的另一种受体成为含有Neu(n)Ac的化合物,所述Neu(n)Ac分子由在本文所述的细胞中表达的任何一种或多种Neu(n)Ac合酶合成。
在本发明的方法和/或细胞的一个优选实施方案中,所述代谢工程改造的细胞被用基因表达模块修饰,优选地已被修饰,其中来自所述表达模块中的任何一个的表达是组成型的或可调控的。贯穿本申请和权利要求书,表述“细胞被修饰”优选地被“细胞已被修饰”替换。
所述表达模块也被称作转录单元并且包含用于表达重组基因的多核苷酸,所述重组基因包括编码基因序列和可操作地连接至编码基因的适当的转录和/或翻译控制信号。所述控制信号包含启动子序列、非翻译区、核糖体结合位点、终止子序列。所述表达模块可以含有用于表达一种单个重组基因的元件,但也可以含有用于表达多个重组基因的元件,或者可以组织在操纵子结构中以整合表达两个或更多个重组基因。所述多核苷酸可以使用本领域众所周知的技术通过重组DNA技术产生。本领域技术人员众所周知的构建表达模块的方法包括例如体外重组DNA技术、合成技术和体内基因重组。参见,例如,在以下文献中描述的技术:Sambrook等人(2001)Molecular Cloning:a laboratory manual,第3版,ColdSpring Harbor Laboratory Press,CSH,New York或Current Protocols in MolecularBiology,John Wiley and Sons,N.Y.(1989和每年更新)。
根据本发明的一个优选实施方案,将所述细胞用一种或多种表达模块修饰。所述表达模块可以整合到所述细胞的基因组中或者可以在载体上呈递给所述细胞。所述载体可以以质粒、粘粒、噬菌体、脂质体或病毒的形式存在,其将被稳定地转化/转染到所述代谢工程改造的细胞中。这样的载体尤其包括染色体、附加型和病毒衍生的载体,例如,衍生自细菌质粒、细菌噬菌体、转座子、酵母附加体、插入元件、酵母染色体元件、病毒的载体和衍生自其组合的载体,诸如衍生自质粒和细菌噬菌体遗传元件的那些,诸如粘粒和噬菌粒。这些载体可以含有选择标志物,诸如但不限于抗生素标志物、营养缺陷型标志物、毒素-抗毒素标志物、RNA有义/反义标志物。所述表达系统构建体可以含有调控以及产生表达的控制区。通常,任何适合于在宿主中维持、增殖或表达多核苷酸和/或表达多肽的系统或载体都可以用于在这方面的表达。通过多种众所周知的和常规的技术(诸如、例如Sambrook等人所述的那些,参见上文)中的任一种,可以将适当的DNA序列插入表达系统中。对于重组生产,可以对细胞进行遗传工程改造以掺入本发明的表达系统或其部分或多核苷酸。通过在许多标准实验室手册中描述的方法,诸如Davis等人,Basic Methods in Molecular Biology,(1986)和Sambrook等人,1989(出处同上),可以将多核苷酸引入细胞中。
本文中使用的表达模块包含用于表达至少一个重组基因的多核苷酸。所述重组基因参与在所述含有Neu(n)Ac的化合物的合成中发挥作用的多肽的表达;或者所述重组基因与所述宿主细胞中不参与所述含有Neu(n)Ac的化合物的合成的其它途径连接。所述重组基因编码具有修饰的表达或活性的内源蛋白,优选地所述内源蛋白被过表达;或者所述重组基因编码异源蛋白,所述异源蛋白被异源地引入并在所述经修饰的细胞中表达,优选地过表达。所述内源蛋白在也表达异源蛋白的细胞中可以具有修饰的表达。
根据本发明的一个优选方面,所述表达模块每一种的表达是组成型的或可调控的,如本文定义。
在本发明的方法和/或细胞的另一个实施方案中,所述细胞在所述至少一种Neu(n)Ac合酶的表达或活性方面被修饰。在一个优选的实施方案中,所述Neu(n)Ac合酶是所述细胞的内源蛋白但具有修饰的表达或活性,优选地所述内源性Neu(n)Ac合酶被过表达;备选地,所述Neu(n)Ac合酶是异源蛋白,其被异质地引入并在所述细胞中表达,优选地过表达。所述内源性Neu(n)Ac合酶可以在也表达异源Neu(n)Ac合酶的细胞中具有修饰的表达。
根据本发明的方法和/或细胞的一个优选的实施方案,所述细胞包含用于产生含有Neu(n)Ac的化合物的途径,所述途径包含本发明所述的至少一种Neu(n)Ac合酶。根据本发明的方法和/或细胞的另一个优选的实施方案,所述用于产生含有Neu(n)Ac的化合物的途径还包含选自以下列表的至少一种酶,所述列表包含N-酰基葡糖胺2-差向异构酶、UDP-N-乙酰葡糖胺2-差向异构酶、N-乙酰甘露糖胺-6-磷酸2-差向异构酶、双功能的UDP-GlcNAc2-差向异构酶/激酶、N-酰基神经氨酸-9-磷酸合成酶、磷酸酶、CMP-唾液酸合酶和唾液酸转移酶。
在一个优选的实施方案中,所述细胞包含用于产生含有Neu(n)Ac的化合物的途径,其中所述细胞表达至少一种选自包含以下各项的列表的酶:N-酰基葡糖胺2-差向异构酶,例如其已知来自例如几个物种,包括卵形拟杆菌(Bacteroides ovatus)、大肠杆菌(E.coli)、智人(Homo sapiens)、褐家鼠(Rattus norvegicus);本发明公开的Neu(n)Ac合酶;CMP唾液酸合酶,例如其已知来自例如脑膜炎奈瑟氏菌(Neisseria meningitidis);和唾液酸转移酶,包括α-2,3-唾液酸转移酶、α-2,6-唾液酸转移酶和/或α-2,8-唾液酸转移酶,其中所述酶如本文中定义。N-酰基-D-葡糖胺(GlcNAc)可以添加至所述细胞和/或可以通过在所述细胞中表达的酶或通过所述细胞的机制提供。这样的产生GlcNAc的细胞可以表达将GlcNAc-6-磷酸转化成GlcNAc的磷酸酶,如下述中的任何一种或多种:例如,大肠杆菌HAD样磷酸酶基因,包含aphA、Cof、HisB、OtsB、SurE、Yaed、YcjU、YedP、YfbT、YidA、YigB、YihX、YniC、YqaB、YrbL、AppA、Gph、SerB、YbhA、YbiV、YbjL、Yfb、YieH、YjgL、YjjG、YrfG和YbiU,来自恶臭假单胞菌(Pseudomonas putida)的PsMupP,来自酿酒酵母(S.cerevisiae)的ScDOG1和来自枯草芽孢杆菌(Bacillus subtilis)的BsAraL,如在WO18122225中所描述。优选地,所述细胞被修饰以产生GlcNAc。更优选地,所述细胞被修饰以增强GlcNAc产生。所述修饰可以是选自下组的任何一种或多种,该组包括:葡糖胺-6-磷酸脱氨酶、N-乙酰葡糖胺-6-磷酸脱乙酰酶和/或N-乙酰基-D-葡糖胺激酶的敲除,以及L-谷氨酰胺-D-果糖-6-磷酸氨基转移酶和/或葡糖胺6-磷酸N-乙酰基转移酶的过表达。
在一个替代性的和/或另外的优选的实施方案中,所述细胞包含用于产生含有Neu(n)Ac的化合物的途径,其中所述细胞表达至少一种选自包含以下各项的列表的酶:UDP-N-乙酰葡糖胺2-差向异构酶,例如其已知来自例如几个物种,包括空肠弯曲杆菌(Campylobacter jejuni)、大肠杆菌、脑膜炎奈瑟氏菌、枯草芽孢杆菌、鼠柠檬酸杆菌(Citrobacter rodentium);本发明公开的Neu(n)Ac合酶;CMP唾液酸合酶,例如其已知来自例如脑膜炎奈瑟氏菌;和唾液酸转移酶,包括α-2,3-唾液酸转移酶、α-2,6-唾液酸转移酶和/或α-2,8-唾液酸转移酶,其中所述酶如本文中定义。UDP-N-乙酰葡糖胺(UDP-GlcNAc)可以添加至所述细胞和/或可以通过在所述细胞中表达的酶或通过所述细胞的代谢提供。这样的产生UDP-GlcNAc的细胞可以表达将例如要添加至所述细胞的GlcNAc转化成UDP-GlcNAc的酶。这些酶可以是选自包含以下各项的列表的任何一种或多种酶:来自几个物种(包括智人、大肠杆菌)的N-乙酰基-D-葡糖胺激酶、N-乙酰葡糖胺-6-磷酸脱乙酰酶、磷酸葡糖胺变位酶和N-乙酰葡糖胺-1-磷酸尿苷酰基转移酶/葡糖胺-1-磷酸乙酰基转移酶。优选地,所述细胞被修饰以产生UDP-GlcNAc。更优选地,所述细胞被修饰以增强UDP-GlcNAc产生。所述修饰可以是选自下组的任何一种或多种,该组包括:N-乙酰葡糖胺-6-磷酸脱乙酰酶的敲除、L-谷氨酰胺-D-果糖-6-磷酸氨基转移酶的过表达、磷酸葡糖胺变位酶的过表达和N-乙酰葡糖胺-1-磷酸尿苷酰基转移酶/葡糖胺-1-磷酸乙酰基转移酶的过表达。
在一个替代性的和/或另外的优选的实施方案中,所述细胞包含用于产生含有Neu(n)Ac的化合物的途径,其中所述细胞表达至少一种选自包含以下各项的列表的酶:N-乙酰甘露糖胺-6-磷酸2-差向异构酶,例如其已知来自例如几个物种,包括大肠杆菌、流感嗜血菌、肠杆菌属种(Enterobacter sp.)、链霉菌属种(Streptomyces sp.);N-酰基神经氨酸-9-磷酸合成酶、N-酰基神经氨酸-9-磷酸磷酸酶,例如其已知来自例如趋磁假丝酵母种(Candidatus Magnetomorum sp.)HK-1或多形拟杆菌(Bacteroides thetaiotaomicron);本发明公开的Neu(n)Ac合酶;CMP唾液酸合酶,例如其已知来自例如脑膜炎奈瑟氏菌;和唾液酸转移酶,包括α-2,3-唾液酸转移酶、α-2,6-唾液酸转移酶和/或α-2,8-唾液酸转移酶,其中所述酶如本文中定义。N-乙酰基-D-葡糖胺6-磷酸(GlcNAc-6P)可以添加至所述细胞和/或可以通过在所述细胞中表达的酶或通过所述细胞的代谢提供。这样的产生GlcNAc-6P的细胞可以表达将例如要添加至所述细胞的GlcN6P转化成GlcNAc-6P的酶。该酶可以是来自几个物种(包括酿酒酵母、乳酸克鲁维酵母(Kluyveromyces lactis)、智人)的葡糖胺6-磷酸N-乙酰基转移酶。优选地,所述细胞被修饰以产生GlcNAc-6P。更优选地,所述细胞被修饰以增强GlcNAc-6P产生。所述修饰可以是选自下组的任何一种或多种,该组包括:葡糖胺-6-磷酸脱氨酶、N-乙酰葡糖胺-6-磷酸脱乙酰酶的敲除和L-谷氨酰胺-D-果糖-6-磷酸氨基转移酶和/或葡糖胺6-磷酸N-乙酰基转移酶的过表达。
在一个替代性的和/或另外的优选的实施方案中,所述细胞包含用于产生含有Neu(n)Ac的化合物的途径,其中所述细胞表达至少一种选自包含以下各项的列表的酶:双功能的UDP-GlcNAc 2-差向异构酶/激酶,例如其已知来自例如几个物种,包括智人(Homosapiens)、褐家鼠(Rattus norvegicus)和小家鼠(Mus musculus);N-酰基神经氨酸-9-磷酸合成酶、N-酰基神经氨酸-9-磷酸磷酸酶,例如其已知来自例如趋磁假丝酵母种HK-1或多形拟杆菌;本发明公开的Neu(n)Ac合酶;CMP唾液酸,例如其已知来自例如脑膜炎奈瑟氏菌;和唾液酸转移酶,包括α-2,3-唾液酸转移酶、α-2,6-唾液酸转移酶和/或α-2,8-唾液酸转移酶,其中所述酶如本文中定义。UDP-N-乙酰葡糖胺可以添加至所述细胞和/或可以通过在所述细胞中表达的酶或通过所述细胞的代谢提供。这样的产生UDP-GlcNAc的细胞可以表达将例如要添加至所述细胞的GlcNAc转化成UDP-GlcNAc的酶。这些酶可以是来自几个物种(包括智人、大肠杆菌)的N-乙酰基-D-葡糖胺激酶、N-乙酰葡糖胺-6-磷酸脱乙酰酶、磷酸葡糖胺变位酶和N-乙酰葡糖胺-1-磷酸尿苷酰基转移酶/葡糖胺-1-磷酸乙酰基转移酶。优选地,所述细胞被修饰以产生UDP-GlcNAc。更优选地,所述细胞被修饰以增强UDP-GlcNAc产生。所述修饰可以是选自下组的任何一种或多种,该组包括:N-乙酰葡糖胺-6-磷酸脱乙酰酶的敲除、L-谷氨酰胺-D-果糖-6-磷酸氨基转移酶的过表达、磷酸葡糖胺变位酶的过表达和N-乙酰葡糖胺-1-磷酸尿苷酰基转移酶/葡糖胺-1-磷酸乙酰基转移酶的过表达。
另外,或备选地,本文中使用的宿主细胞任选地被遗传修饰以在所述细胞中输入受体,这通过能够在所述细胞中输入相应受体的转运蛋白的引入和/或过表达来实现。这样的转运蛋白是例如属于主要易化子超家族(MFS)、ATP-结合盒(ABC)转运蛋白家族或参与例如单糖、二糖和/或寡糖的摄取的PTS系统的膜蛋白。
另外,或备选地,本文中使用的宿主细胞任选地被遗传修饰成产生聚类异戊二烯醇,如例如磷酸化的多萜醇,其可以作用为脂质载体。
另外,或备选地,本文中使用的宿主细胞任选地被遗传修饰成在所述细胞中输入乳糖,这通过乳糖通透酶的引入和/或过表达来实现。所述乳糖通透酶例如由lacY基因或lac12基因编码。
另外,或备选地,所述宿主细胞表达膜蛋白,其是参与化合物和/或本发明定义的生物产物的出细胞运输、优选跨细胞壁外膜运输的转运蛋白。优选地,所述细胞被转化以包含至少一种编码蛋白的核酸序列,所述蛋白选自包括以下各项的组:乳糖转运蛋白、(如例如LacY或lac12通透酶)、葡萄糖转运蛋白、半乳糖转运蛋白、核苷酸活化的糖的转运蛋白(如例如UDP-GlcNAc的转运蛋白)、参与生物产物(如例如含有Neu(n)Ac的化合物)的出细胞运输、优选跨细胞壁外膜运输的转运蛋白。优选地,所述细胞被转化以包含至少一种编码膜转运蛋白的核酸序列,所述膜转运蛋白选自包括以下各项的组:铁结合物输出蛋白、主要易化子超家族(MFS)转运蛋白、ATP-结合盒(ABC)转运蛋白或糖流出转运蛋白。
根据本发明的方法和/或细胞的另一个优选的实施方案,所述细胞能够表达N-乙酰神经氨酸-9-磷酸合成酶,所述N-乙酰神经氨酸-9-磷酸合成酶具有N-乙酰神经氨酸-9-磷酸合成酶活性,并且其具有PFAM结构域PF03102和/或PatricDB总体家族结构域PGF_06907304,并且包含SEQ ID NO 19的序列:[DE]XGXNHXGXXXXXXXMXXX[ACPS]XXXXXXXX[KR](Xa)[KR](Xb)[DE](Xc)KXXS,其中X是任何氨基酸,a是28至32,b是28至30,c是14至16。所述PFAM结构域按照2018年9月发布的关于Pfam 32.0的定义进行分类。所述PatricDB结构域按照2020年3月发布的关于PATRIC 3.6.9的定义进行分类。在本发明的方法和/或细胞的一个优选的实施方案中,所述N-酰基神经氨酸-9-磷酸合成酶具有N-酰基神经氨酸-9-磷酸合成酶活性,具有PFAM结构域PF03102和/或PatricDB总体家族结构域PGF_06907304,并且包含SEQ ID NO 20的序列:[DE]XGXNHXGXXXXXXXMXX(X,非I、L、M)[AS]XXXXXXXX[KR](Xa)[KR](Xb)[DE](Xc)KXXS,其中X是任何氨基酸,a是28至32,b是28至30,c是14至16。
在本发明的方法和/或细胞的另一个优选的实施方案中,在细胞中表达的所述N-酰基神经氨酸-9-磷酸合成酶包含SEQ ID NO 21、22、23、24、25、26、27或28中任一个所述的多肽序列。在本发明的方法和/或细胞的替代性优选的实施方案中,所述细胞表达N-酰基神经氨酸-9-磷酸合成酶,所述述N-酰基神经氨酸-9-磷酸合成酶是SEQ ID NO 21、22、23、24、25、26、27或28中任一个的功能同系物、变体或衍生物,所述功能同系物、变体或衍生物与具有SEQ ID NO 21、22、23、24、25、26、27或28的所述多肽中任一种的全长具有至少80%总体序列同一性并且具有N-酰基神经氨酸-9-磷酸合成酶活性。在本发明的情形中,优选地所述功能同系物、变体或衍生物包含SEQ ID NO 19的序列:[DE]XGXNHXGXXXXXXXMXXX[ACPS]XXXXXXXX[KR](Xa)[KR](Xb)[DE](Xc)KXXS,其中X是任何氨基酸,a是28至32,b是28至30,c是14至16,优选地包含SEQ ID NO 20的序列:[DE]XGXNHXGXXXXXXXMXX(X,非I、L、M)[AS]XXXXXXXX[KR](Xa)[KR](Xb)[DE](Xc)KXXS,其中X是任何氨基酸,a是28至32,b是28至30,c是14至16。与具有SEQ ID NO 21、22、23、24、25、26、27或28的所述多肽中任一种的全长至少80%总体序列同一性应该理解为分别与具有本文给出的SEQ ID NO 21、22、23、24、25、26、27或28的所述多肽中任一种的至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%总体序列同一性。
在本发明的方法和/或细胞的另一个实施方案中,所述细胞在所述N-酰基神经氨酸-9-磷酸合成酶中至少一种的表达或活性方面被修饰。在一个优选的实施方案中,所述N-酰基神经氨酸-9-磷酸合成酶是所述细胞的内源蛋白但具有修饰的表达或活性,优选地所述内源性N-酰基神经氨酸-9-磷酸合成酶被过表达;备选地,所述N-酰基神经氨酸-9-磷酸合成酶是异源蛋白,其被异质地引入并在所述细胞中表达,优选地过表达。所述内源性N-酰基神经氨酸-9-磷酸合成酶可以在也表达异源N-酰基神经氨酸-9-磷酸合成酶的细胞中具有修饰的表达。
根据本发明的方法和/或细胞的另一个实施方案,所述细胞能够表达磷酸酶,所述磷酸酶是具有N-酰基神经氨酸-9-磷酸酶活性的HAD样磷酸酶,并且其包含SEQ ID NO 29的序列:DXDGXXTDXXXXXXXXGXXXXXXXXXDXXXXXXXXXXXXXXX[ILV]X[ST]XXXXXXXXXRXXXL(Xa)K(Xb)GXDXXD(Xc)GXGXXR[DE],其中X是任何氨基酸,a是10至11,b是21,C是32。在一个示例性的实施方案中,所述细胞表达具有SEQ ID NO 30的HAD样磷酸酶,其具有N-酰基神经氨酸-9-磷酸酶活性。
根据本发明的方法和/或细胞的替代性实施方案,所述细胞能够表达磷酸酶,所述磷酸酶是具有N-酰基神经氨酸-9-磷酸酶活性的HAD样磷酸酶,并且其包含SEQ ID NO 31的序列:DXDXT[IL](Xa)TNGXXXXQXXK[IL](Xb)[KR]PXXX[IL][FWY](Xc)G[DN]XXXXD[ILV]XG,其中X是任何氨基酸,a是110至160,b是20至23,c是17。在一个示例性的实施方案中,所述细胞表达具有SEQ ID NO 32的HAD样磷酸酶,其具有N-酰基神经氨酸-9-磷酸酶活性。
在本发明的方法和/或细胞的另一个实施方案中,所述细胞在所述N-酰基神经氨酸-9-磷酸酶中至少一种的表达或活性方面被修饰。在一个优选的实施方案中,所述N-酰基神经氨酸-9-磷酸酶是所述细胞的内源蛋白但具有修饰的表达或活性,优选地所述内源性N-酰基神经氨酸-9-磷酸酶被过表达;备选地,所述N-酰基神经氨酸-9-磷酸酶是异源蛋白,其被异质地引入并在所述细胞中表达,优选地过表达。所述内源性N-酰基神经氨酸-9-磷酸酶可以在也表达异源N-酰基神经氨酸-9-磷酸酶的细胞中具有修饰的表达。
根据本发明的方法和/或细胞的另一个优选的实施方案,所述细胞能够合成N-乙酰甘露糖胺(ManNAc)、N-乙酰甘露糖胺-6-磷酸(ManNAc-6-磷酸)和/或磷酸烯醇丙酮酸(PEP)。
在一个优选的实施方案中,所述细胞包含用于产生本发明的生物产物的途径,其包含用于产生ManNAc的途径。ManNAc可以通过在所述细胞中表达的酶或通过所述细胞的机制来提供。这样的产生ManNAc的细胞可以表达N-酰基葡糖胺2-差向异构酶,例如其已知来自例如几个物种,包括卵形拟杆菌、大肠杆菌、智人、褐家鼠,其将GlcNAc转化成ManNAc。备选地和/或另外,产生ManNAc的细胞可以表达UDP-N-乙酰葡糖胺2-差向异构酶,例如其已知来自例如几个物种,包括空肠弯曲杆菌、大肠杆菌、脑膜炎奈瑟氏菌、枯草芽孢杆菌、鼠柠檬酸杆菌,其将UDP-GlcNAc转化成ManNAc。GlcNAc和/或UDP-GlcNAc可以添加至所述细胞和/或通过在所述细胞中表达的酶或通过如本文描述的细胞的机制来提供。
在一个更优选的实施方案中,所述细胞被修饰以增强ManNAc产生。所述修饰可以是选自下组的任何一种或多种,该组包括:N-乙酰甘露糖胺激酶的敲除、N-乙酰神经氨酸裂合酶的过表达。
在另一个优选的实施方案中,所述细胞包含用于产生本发明的生物产物的途径,其包含用于产生ManNAc-6-磷酸的途径。ManNAc-6-磷酸可以通过在所述细胞中表达的酶或通过所述细胞的机制来提供。这样的产生ManNAc-6-磷酸的细胞可以表达双功能的UDP-GlcNAc 2-差向异构酶/激酶,例如其已知来自例如几个物种,包括智人、褐家鼠和小家鼠,其将UDP-GlcNAc转化成ManNAc-6-磷酸。备选地和/或另外,所述产生ManNAc-6-磷酸的细胞可以表达N-乙酰甘露糖胺-6-磷酸2-差向异构酶,其将GlcNAc-6-磷酸转化成ManNAc-6-磷酸。UDP-GlcNAc和/或GlcNAc-6-磷酸可以添加至所述细胞和/或通过在所述细胞中表达的酶或通过如本文描述的细胞的机制来提供。在一个更优选的实施方案中,所述细胞被修饰以增强ManNAc-6-磷酸产生。所述修饰可以是选自下组的任何一种或多种,该组包括:N-乙酰葡糖胺-6-磷酸脱乙酰酶的过表达、N-乙酰基-D-葡糖胺激酶的过表达、磷酸葡糖胺变位酶的过表达、N-乙酰葡糖胺-1-磷酸尿苷酰基转移酶/葡糖胺-1-磷酸乙酰基转移酶的过表达。
在另一个优选的实施方案中,所述细胞包含用于产生本发明的生物产物的途径,其包含用于产生磷酸烯醇丙酮酸(PEP)的途径。
在另一个优选的实施方案中,所述细胞包含用于产生本发明的生物产物的途径,其包含用于增强PEP的产生和/或供应的任何一种或多种修饰。
在一个优选的实施方案中并且作为增强PEP产生和/或供应的手段,一种或多种PEP依赖性的糖转运磷酸转移酶系统被破坏,例如但不限于:1)N-乙酰基-D-葡糖胺Npi-磷酸转移酶(EC 2.7.1.193),其例如在大肠杆菌或芽孢杆菌属物种中由nagE基因(或簇nagABCD)编码,2)ManXYZ,其编码输入外源性己糖(甘露糖、葡萄糖、葡糖胺、果糖、2-脱氧葡萄糖、甘露糖胺、N-乙酰葡糖胺等)并将磷酸酯释放进细胞细胞质中的酶II Man复合物(甘露糖PTS通透酶、蛋白-Npi-磷酸组氨酸-D-甘露糖磷酸转移酶),3)葡萄糖特异性的PTS转运蛋白(例如由PtsG/Crr编码),其摄取葡萄糖并在细胞质中形成葡萄糖-6-磷酸,4)蔗糖特异性的PTS转运蛋白,其摄取蔗糖并在细胞质中形成蔗糖-6-磷酸,5)果糖特异性的PTS转运蛋白(例如由基因fruA和fruB编码,以及激酶fruK,其摄取果糖并在第一步中形成果糖-1-磷酸,并在第二步中形成果糖1,6-二磷酸,6)乳糖PTS转运蛋白(例如在干酪乳球菌(Lactococcus casei)中由lacE编码),其摄取乳糖并形成乳糖-6-磷酸,7)半乳糖醇特异性的PTS酶,其摄取半乳糖醇和/或山梨醇并分别形成半乳糖醇-1-磷酸或山梨醇-6-磷酸,8)甘露醇特异性的PTS酶,其摄取甘露醇和/或山梨醇并分别形成甘露醇-1-磷酸或山梨醇-6-磷酸,和9)海藻糖特异性的PTS酶,其摄取海藻糖并形成海藻糖-6-磷酸。
在另一个和/或另外的优选的实施方案中并且作为增强PEP产生和/或供应的手段,通过破坏PtsIH/Crr基因簇来破坏整个PTS系统。PtsI(酶I)是一种细胞质蛋白,其充当大肠杆菌K-12的磷酸烯醇丙酮酸:糖磷酸转移酶系统(PTS)的门户。PtsI是PTS的两种(PtsI和PtsH)糖非特异性蛋白组分之一,其与糖特异性的内膜通透酶一起实现磷酸转移级联,该级联导致多种碳水化合物底物的偶联磷酸化和运输。HPr(含组氨酸蛋白)是PTS的两种糖非特异性蛋白组分之一。它从磷酸化的酶I(PtsI-P)接受磷酰基基团,并然后将其转移到PTS的多种糖特异性酶(统称为酶II)中的任何一种的EIIA结构域。Crr或EIIAGlc在需要PtsH和PtsI的反应中被PEP磷酸化。
在另一个和/或另外的优选的实施方案中,通过对应的通透酶的引入和/或过表达进一步修饰细胞以补偿碳源的PTS系统的缺失。这些是例如通透酶或ABC转运蛋白,其包含但不限于:特异性地输入乳糖的转运蛋白,例如由来自大肠杆菌的LacY基因编码的转运蛋白;特异性地输入蔗糖的转运蛋白,例如由来自大肠杆菌的cscB基因编码的转运蛋白;特异性地输入葡萄糖的转运蛋白,例如由来自大肠杆菌的galP基因编码的转运蛋白;特异性地输入果糖的转运蛋白,例如由来自变异链球菌(Streptococcus mutans)的fruI基因编码的转运蛋白;或山梨醇/甘露醇ABC转运蛋白,诸如由球形红细菌(Rhodobacter sphaeroides)的SmoEFGK簇编码的转运蛋白;海藻糖/蔗糖/麦芽糖转运蛋白,诸如由苜蓿中华根瘤菌(Sinorhizobium meliloti)的基因簇ThuEFGK编码的转运蛋白;和N-乙酰葡糖胺/半乳糖/葡萄糖转运蛋白,诸如由奥奈达湖希瓦氏菌(Shewanella oneidensis)的NagP编码的转运蛋白。PTS缺失与替代性转运蛋白的过表达的组合的例子是:1)葡萄糖PTS系统(例如ptsG基因)的缺失,与葡萄糖通透酶(例如glcP的galP)的引入和/或过表达相组合;2)果糖PTS系统(例如fruB、fruA、fruK基因中的一种或多种)的缺失,与果糖通透酶(例如fruI)的引入和/或过表达相组合,3)乳糖PTS系统的缺失,与乳糖通透酶(例如LacY)的引入和/或过表达相组合,和/或4)蔗糖PTS系统的缺失,与蔗糖通透酶(例如cscB)的引入和/或过表达相组合。
在一个进一步优选的实施方案中,通过引入碳水化合物激酶,诸如葡糖激酶(EC2.7.1.1,EC 2.7.1.2,EC 2.7.1.63)、半乳糖激酶(EC 2.7.1.6)和/或果糖激酶(EC2.7.1.3,EC 2.7.1.4),所述细胞被修饰以补偿碳源的PTS系统的缺失。PTS缺失与替代性转运蛋白和激酶的过表达的组合的例子是:1)葡萄糖PTS系统(例如ptsG基因)的缺失,与葡萄糖通透酶(例如glcP的galP)的引入和/或过表达相组合,与葡糖激酶(例如glk)的引入和/或过表达相组合,和/或2)果糖PTS系统(例如fruB、fruA、fruK基因中的一种或多种)的缺失,与果糖通透酶(例如fruI)的引入和/或过表达相组合,与果糖激酶(例如frk或mak)的引入和/或过表达相组合。
在另一个和/或另外的优选的实施方案中并且作为增强PEP产生和/或供应的手段,通过以下列表中的任何一种或多种的引入或修饰来修饰所述细胞,所述列表包含磷酸烯醇丙酮酸合酶活性(EC:2.7.9.2,例如在大肠杆菌中由ppsA编码)、磷酸烯醇丙酮酸羧基激酶活性(EC 4.1.1.32或EC 4.1.1.49,例如分别在谷氨酸棒杆菌(Corynebacteriumglutamicum)中由PCK编码或在大肠杆菌中由pckA编码)、磷酸烯醇丙酮酸羧化酶活性(EC4.1.1.31,例如在大肠杆菌中由ppc编码)、草酰乙酸脱羧酶活性(EC 4.1.1.112,例如在大肠杆菌中由eda编码)、丙酮酸激酶活性(EC 2.7.1.40,例如在大肠杆菌中由pykA和pykF编码)、丙酮酸羧化酶活性(EC 6.4.1.1,例如在枯草芽孢杆菌中由pyc编码)和苹果酸脱氢酶活性(EC 1.1.1.38或EC 1.1.1.40,例如在大肠杆菌中分别由maeA或maeB编码)。
在一个更优选的实施方案中,所述细胞被修饰以过表达多肽中的任何一种或多种,所述多肽包含来自大肠杆菌的ppsA(具有SEQ ID NO 73)、来自谷氨酸棒杆菌(C.glutamicum)的PCK(具有SEQ ID NO 74)、来自大肠杆菌的pcka(具有SEQ ID NO 75)、来自大肠杆菌的eda(具有SEQ ID NO 76)、来自大肠杆菌的maeA(具有SEQ ID NO 77)和来自大肠杆菌的maeB(具有SEQ ID NO 78)。
在另一个和/或另外的优选的实施方案中,所述细胞被修饰以表达SEQ ID NO 73、74、75、76、77或78中的任一个的功能同系物、变体或衍生物中的任何一种或多种,所述功能同系物、变体或衍生物分别与具有SEQ ID NO 73、74、75、76、77或78的所述多肽中的任一种的全长具有至少80%总体序列同一性,并且分别具有磷酸烯醇丙酮酸合酶活性、磷酸烯醇丙酮酸羧基激酶活性、草酰乙酸脱羧酶活性或苹果酸脱氢酶活性。
在另一个和/或另外的优选的实施方案中并且作为增强PEP产生和/或供应的手段,通过降低的磷酸烯醇丙酮酸羧化酶活性和/或丙酮酸激酶活性,优选编码磷酸烯醇丙酮酸羧化酶、丙酮酸羧化酶活性和/或丙酮酸激酶的基因的缺失,修饰所述细胞。
在一个示例性实施方案中,通过不同的修改来遗传修饰所述细胞,诸如磷酸烯醇丙酮酸合酶的过表达与丙酮酸激酶基因的缺失相组合,磷酸烯醇丙酮酸合酶的过表达与磷酸烯醇丙酮酸羧化酶基因的缺失相组合,磷酸烯醇丙酮酸合酶的过表达与丙酮酸羧化酶基因的缺失相组合,磷酸烯醇丙酮酸羧基激酶的过表达与丙酮酸激酶基因的缺失相组合,磷酸烯醇丙酮酸羧基激酶的过表达与磷酸烯醇丙酮酸羧化酶基因的缺失相组合,磷酸烯醇丙酮酸羧基激酶的过表达与丙酮酸羧化酶基因的缺失相组合,草酰乙酸脱羧酶的过表达与丙酮酸激酶基因的缺失相组合,草酰乙酸脱羧酶的过表达与磷酸烯醇丙酮酸羧化酶基因的缺失相组合,草酰乙酸脱羧酶的过表达与丙酮酸羧化酶基因的缺失相组合,苹果酸脱氢酶的过表达与丙酮酸激酶基因的缺失相组合,苹果酸脱氢酶的过表达与磷酸烯醇丙酮酸羧化酶基因的缺失相组合,和/或苹果酸脱氢酶的过表达与丙酮酸羧化酶基因的缺失相组合。
在另一个示例性实施方案中,通过不同的修改来遗传修饰所述细胞,诸如磷酸烯醇丙酮酸合酶的过表达与磷酸烯醇丙酮酸羧基激酶的过表达相组合,磷酸烯醇丙酮酸合酶的过表达与草酰乙酸脱羧酶的过表达相组合,磷酸烯醇丙酮酸合酶的过表达与苹果酸脱氢酶的过表达相组合,磷酸烯醇丙酮酸羧基激酶的过表达与草酰乙酸脱羧酶的过表达相组合,磷酸烯醇丙酮酸羧基激酶的过表达与苹果酸脱氢酶的过表达相组合,草酰乙酸脱羧酶的过表达与苹果酸脱氢酶的过表达相组合,磷酸烯醇丙酮酸合酶的过表达与磷酸烯醇丙酮酸羧基激酶的过表达和草酰乙酸脱羧酶的过表达相组合,磷酸烯醇丙酮酸合酶的过表达与磷酸烯醇丙酮酸羧基激酶的过表达和苹果酸脱氢酶的过表达相组合,磷酸烯醇丙酮酸合酶的过表达与磷酸烯醇丙酮酸羧基激酶的过表达和草酰乙酸脱羧酶的过表达和苹果酸脱氢酶的过表达相组合,磷酸烯醇丙酮酸羧基激酶的过表达与草酰乙酸脱羧酶的过表达和苹果酸脱氢酶的过表达相组合,和/或磷酸烯醇丙酮酸合酶的过表达与草酰乙酸脱羧酶的过表达和苹果酸脱氢酶的过表达相组合。
在另一个示例性实施方案中,通过不同的修改来遗传修饰所述细胞,诸如磷酸烯醇丙酮酸合酶的过表达与磷酸烯醇丙酮酸羧基激酶的过表达相组合与丙酮酸激酶基因的缺失相组合,磷酸烯醇丙酮酸合酶的过表达与草酰乙酸脱羧酶的过表达相组合与丙酮酸激酶基因的缺失相组合,磷酸烯醇丙酮酸合酶的过表达与苹果酸脱氢酶的过表达相组合与丙酮酸激酶基因的缺失相组合,磷酸烯醇丙酮酸羧基激酶的过表达与草酰乙酸脱羧酶的过表达相组合与丙酮酸激酶基因的缺失相组合,磷酸烯醇丙酮酸羧基激酶的过表达与苹果酸脱氢酶的过表达相组合与丙酮酸激酶基因的缺失相组合,草酰乙酸脱羧酶的过表达与苹果酸脱氢酶的过表达相组合与丙酮酸激酶基因的缺失相组合,磷酸烯醇丙酮酸合酶的过表达与磷酸烯醇丙酮酸羧基激酶的过表达和草酰乙酸脱羧酶的过表达相组合与丙酮酸激酶基因的缺失相组合,磷酸烯醇丙酮酸合酶的过表达与磷酸烯醇丙酮酸羧基激酶的过表达和苹果酸脱氢酶的过表达相组合与丙酮酸激酶基因的缺失相组合,磷酸烯醇丙酮酸合酶的过表达与磷酸烯醇丙酮酸羧基激酶的过表达和草酰乙酸脱羧酶的过表达和苹果酸脱氢酶的过表达相组合与丙酮酸激酶基因的缺失相组合,磷酸烯醇丙酮酸羧基激酶的过表达与草酰乙酸脱羧酶的过表达和苹果酸脱氢酶的过表达相组合与丙酮酸激酶基因的缺失相组合,磷酸烯醇丙酮酸合酶的过表达与草酰乙酸脱羧酶的过表达和苹果酸脱氢酶的过表达相组合与丙酮酸激酶基因的缺失相组合。
在另一个示例性实施方案中,通过不同的修改来遗传修饰所述细胞,诸如磷酸烯醇丙酮酸合酶的过表达与磷酸烯醇丙酮酸羧基激酶的过表达相组合与磷酸烯醇丙酮酸羧化酶基因的缺失相组合,磷酸烯醇丙酮酸合酶的过表达与草酰乙酸脱羧酶的过表达相组合与磷酸烯醇丙酮酸羧化酶基因的缺失相组合,磷酸烯醇丙酮酸合酶的过表达与苹果酸脱氢酶的过表达相组合与磷酸烯醇丙酮酸羧化酶基因的缺失相组合,磷酸烯醇丙酮酸羧基激酶的过表达与草酰乙酸脱羧酶的过表达相组合与磷酸烯醇丙酮酸羧化酶基因的缺失相组合,磷酸烯醇丙酮酸羧基激酶的过表达与苹果酸脱氢酶的过表达相组合与磷酸烯醇丙酮酸羧化酶基因的缺失相组合,草酰乙酸脱羧酶的过表达与苹果酸脱氢酶的过表达相组合与磷酸烯醇丙酮酸羧化酶基因的缺失相组合,磷酸烯醇丙酮酸合酶的过表达与磷酸烯醇丙酮酸羧基激酶的过表达和草酰乙酸脱羧酶的过表达相组合与磷酸烯醇丙酮酸羧化酶基因的缺失相组合,磷酸烯醇丙酮酸合酶的过表达与磷酸烯醇丙酮酸羧基激酶的过表达和苹果酸脱氢酶的过表达相组合与磷酸烯醇丙酮酸羧化酶基因的缺失相组合,磷酸烯醇丙酮酸合酶的过表达与磷酸烯醇丙酮酸羧基激酶的过表达和草酰乙酸脱羧酶的过表达和苹果酸脱氢酶的过表达相组合与磷酸烯醇丙酮酸羧化酶基因的缺失相组合,磷酸烯醇丙酮酸羧基激酶的过表达与草酰乙酸脱羧酶的过表达和苹果酸脱氢酶的过表达相组合与磷酸烯醇丙酮酸羧化酶基因的缺失相组合,磷酸烯醇丙酮酸合酶的过表达与草酰乙酸脱羧酶的过表达和苹果酸脱氢酶的过表达相组合与磷酸烯醇丙酮酸羧化酶基因的缺失相组合。
在另一个示例性实施方案中,通过不同的修改来遗传修饰所述细胞,诸如磷酸烯醇丙酮酸合酶的过表达与磷酸烯醇丙酮酸羧基激酶的过表达相组合与丙酮酸羧化酶基因的缺失相组合,磷酸烯醇丙酮酸合酶的过表达与草酰乙酸脱羧酶的过表达相组合与丙酮酸羧化酶基因的缺失相组合,磷酸烯醇丙酮酸合酶的过表达与苹果酸脱氢酶的过表达相组合与丙酮酸羧化酶基因的缺失相组合,磷酸烯醇丙酮酸羧基激酶的过表达与草酰乙酸脱羧酶的过表达相组合与丙酮酸羧化酶基因的缺失相组合,磷酸烯醇丙酮酸羧基激酶的过表达与苹果酸脱氢酶的过表达相组合与丙酮酸羧化酶基因的缺失相组合,草酰乙酸脱羧酶的过表达与苹果酸脱氢酶的过表达相组合与丙酮酸羧化酶基因的缺失相组合,磷酸烯醇丙酮酸合酶的过表达与磷酸烯醇丙酮酸羧基激酶的过表达和草酰乙酸脱羧酶的过表达相组合与丙酮酸羧化酶基因的缺失相组合,磷酸烯醇丙酮酸合酶的过表达与磷酸烯醇丙酮酸羧基激酶的过表达和苹果酸脱氢酶的过表达相组合与丙酮酸羧化酶基因的缺失相组合,磷酸烯醇丙酮酸合酶的过表达与磷酸烯醇丙酮酸羧基激酶的过表达和草酰乙酸脱羧酶的过表达和苹果酸脱氢酶的过表达相组合与丙酮酸羧化酶基因的缺失相组合,磷酸烯醇丙酮酸羧基激酶的过表达与草酰乙酸脱羧酶的过表达和苹果酸脱氢酶的过表达相组合与丙酮酸羧化酶基因的缺失相组合,磷酸烯醇丙酮酸合酶的过表达与草酰乙酸脱羧酶的过表达和苹果酸脱氢酶的过表达相组合与丙酮酸羧化酶基因的缺失相组合。
在另一个示例性实施方案中,通过不同的修改来遗传修饰所述细胞,诸如磷酸烯醇丙酮酸合酶的过表达与磷酸烯醇丙酮酸羧基激酶的过表达相组合与丙酮酸激酶基因和磷酸烯醇丙酮酸羧化酶基因的缺失相组合,磷酸烯醇丙酮酸合酶的过表达与草酰乙酸脱羧酶的过表达相组合与丙酮酸激酶基因和磷酸烯醇丙酮酸羧化酶基因的缺失相组合,磷酸烯醇丙酮酸合酶的过表达与苹果酸脱氢酶的过表达相组合与丙酮酸激酶基因和磷酸烯醇丙酮酸羧化酶基因的缺失相组合,磷酸烯醇丙酮酸羧基激酶的过表达与草酰乙酸脱羧酶的过表达相组合与丙酮酸激酶基因和磷酸烯醇丙酮酸羧化酶基因的缺失相组合,磷酸烯醇丙酮酸羧基激酶的过表达与苹果酸脱氢酶的过表达相组合与丙酮酸激酶基因和磷酸烯醇丙酮酸羧化酶基因的缺失相组合,草酰乙酸脱羧酶的过表达与苹果酸脱氢酶的过表达相组合与丙酮酸激酶基因和磷酸烯醇丙酮酸羧化酶基因的缺失相组合,磷酸烯醇丙酮酸合酶的过表达与磷酸烯醇丙酮酸羧基激酶的过表达和草酰乙酸脱羧酶的过表达相组合与丙酮酸激酶基因和磷酸烯醇丙酮酸羧化酶基因的缺失相组合,磷酸烯醇丙酮酸合酶的过表达与磷酸烯醇丙酮酸羧基激酶的过表达和苹果酸脱氢酶的过表达相组合与丙酮酸激酶基因和磷酸烯醇丙酮酸羧化酶基因的缺失相组合,磷酸烯醇丙酮酸合酶的过表达与磷酸烯醇丙酮酸羧基激酶的过表达和草酰乙酸脱羧酶的过表达和苹果酸脱氢酶的过表达相组合与丙酮酸激酶基因和磷酸烯醇丙酮酸羧化酶基因的缺失相组合,磷酸烯醇丙酮酸羧基激酶的过表达与草酰乙酸脱羧酶的过表达和苹果酸脱氢酶的过表达相组合与丙酮酸激酶基因和磷酸烯醇丙酮酸羧化酶基因的缺失相组合,磷酸烯醇丙酮酸合酶的过表达与草酰乙酸脱羧酶的过表达和苹果酸脱氢酶的过表达相组合与丙酮酸激酶基因和磷酸烯醇丙酮酸羧化酶基因的缺失相组合。
在另一个示例性实施方案中,通过不同的修改来遗传修饰所述细胞,诸如磷酸烯醇丙酮酸合酶的过表达与磷酸烯醇丙酮酸羧基激酶的过表达相组合与丙酮酸激酶基因和丙酮酸羧化酶基因和磷酸烯醇丙酮酸羧化酶基因的缺失相组合,磷酸烯醇丙酮酸合酶的过表达与草酰乙酸脱羧酶的过表达相组合与丙酮酸激酶基因和丙酮酸羧化酶基因和磷酸烯醇丙酮酸羧化酶基因的缺失相组合,磷酸烯醇丙酮酸合酶的过表达与苹果酸脱氢酶的过表达相组合与丙酮酸激酶基因和丙酮酸羧化酶基因和磷酸烯醇丙酮酸羧化酶基因的缺失相组合,磷酸烯醇丙酮酸羧基激酶的过表达与草酰乙酸脱羧酶的过表达相组合与丙酮酸激酶基因和丙酮酸羧化酶基因和磷酸烯醇丙酮酸羧化酶基因的缺失相组合,磷酸烯醇丙酮酸羧基激酶的过表达与苹果酸脱氢酶的过表达相组合与丙酮酸激酶基因和丙酮酸羧化酶基因和磷酸烯醇丙酮酸羧化酶基因的缺失相组合,草酰乙酸脱羧酶的过表达与苹果酸脱氢酶的过表达相组合与丙酮酸激酶基因和丙酮酸羧化酶基因和磷酸烯醇丙酮酸羧化酶基因的缺失相组合,磷酸烯醇丙酮酸合酶的过表达与磷酸烯醇丙酮酸羧基激酶的过表达和草酰乙酸脱羧酶的过表达相组合与丙酮酸激酶基因和丙酮酸羧化酶基因和磷酸烯醇丙酮酸羧化酶基因的缺失相组合,磷酸烯醇丙酮酸合酶的过表达与磷酸烯醇丙酮酸羧基激酶的过表达和苹果酸脱氢酶的过表达相组合与丙酮酸激酶基因和丙酮酸羧化酶基因和磷酸烯醇丙酮酸羧化酶基因的缺失相组合,磷酸烯醇丙酮酸合酶的过表达与磷酸烯醇丙酮酸羧基激酶的过表达和草酰乙酸脱羧酶的过表达和苹果酸脱氢酶的过表达相组合与丙酮酸激酶基因和丙酮酸羧化酶基因和磷酸烯醇丙酮酸羧化酶基因的缺失相组合,磷酸烯醇丙酮酸羧基激酶的过表达与草酰乙酸脱羧酶的过表达和苹果酸脱氢酶的过表达相组合与丙酮酸激酶基因和丙酮酸羧化酶基因和磷酸烯醇丙酮酸羧化酶基因的缺失相组合,磷酸烯醇丙酮酸合酶的过表达与草酰乙酸脱羧酶的过表达和苹果酸脱氢酶的过表达相组合与丙酮酸激酶基因和丙酮酸羧化酶基因和磷酸烯醇丙酮酸羧化酶基因的缺失相组合。
根据本发明的方法和/或细胞的另一个实施方案,所述细胞还能够合成任何一种或多种核苷酸活化的糖。在本发明的方法和/或细胞的一个优选的实施方案中,所述细胞能够合成一种或多种选自以下列表的核苷酸活化的糖,所述列表包含UDP-N-乙酰葡糖胺(UDP-GlcNAc)、UDP-N-乙酰半乳糖胺(UDP-GalNAc)、UDP-N-乙酰甘露糖胺(UDP-ManNAc)、UDP-葡萄糖(UDP-Glc)、UDP-半乳糖(UDP-Gal)、GDP-甘露糖(GDP-Man)、UDP-葡糖醛酸、UDP-半乳糖醛酸、UDP-2-乙酰氨基-2,6-二脱氧--L-阿拉伯型-4-己酮糖、UDP-2-乙酰氨基-2,6-二脱氧--L-来苏-4-己酮糖、UDP-N-乙酰基-L-鼠李糖胺(UDP-L-RhaNAc或UDP-2-乙酰氨基-2,6-二脱氧-L-甘露糖)、dTDP-N-乙酰基岩藻糖胺、UDP-N-乙酰基岩藻糖胺(UDP-L-FucNAc或UDP-2-乙酰氨基-2,6-二脱氧-L-半乳糖)、UDP-N-乙酰基-L-纽莫糖胺(UDP-L-PneNAC或UDP-2-乙酰氨基-2,6-二脱氧-L-塔罗糖)、UDP-N-乙酰基胞壁酸、UDP-N-乙酰基-L-奎诺糖胺(UDP-L-QuiNAc或UDP-2-乙酰氨基-2,6-二脱氧-L-葡萄糖)、CMP-唾液酸(CMP-Neu5Ac)、CMP-N-羟乙酰基神经氨酸(CMP-Neu5Gc)、GDP-岩藻糖(GDP-Fuc)、GDP-鼠李糖和UDP-木糖。在本发明的方法和/或细胞的更优选的实施方案中,所述细胞能够合成至少一种衍生自Neu(n)Ac的核苷酸活化的糖,所述核苷酸活化的糖包括CMP-Neu4Ac、CMP-Neu5Ac、CMP-Neu5Ac9N3、CMP-Neu4,5Ac2、CMP-Neu5,7Ac2、CMP-Neu5,9Ac2、CMP-Neu5,7(8,9)Ac2和CMP-Neu5Gc。在本发明的方法和/或细胞的甚至更优选的实施方案中,所述细胞在产生本发明的生物产物(如例如含有Neu(n)Ac的化合物)中使用至少一种所述合成的核苷酸活化的糖。
在本文中使用的宿主细胞任选地被遗传修饰以表达UDP-GlcNAc的从头合成。UDP-GlcNAc可以通过在所述细胞中表达的酶或通过所述细胞的代谢提供。这样的产生UDP-GlcNAc的细胞可以表达将例如要添加至所述细胞的GlcNAc转化成UDP-GlcNAc的酶。这些酶可以是以下列表中的任何一种或多种,所述列表包含来自几个物种(包括智人、大肠杆菌)的N-乙酰基-D-葡糖胺激酶、N-乙酰葡糖胺-6-磷酸脱乙酰酶、磷酸葡糖胺变位酶和N-乙酰葡糖胺-1-磷酸尿苷酰基转移酶/葡糖胺-1-磷酸乙酰基转移酶。优选地,所述细胞被修饰以产生UDP-GlcNAc。更优选地,所述细胞被修饰以增强UDP-GlcNAc产生。所述修饰可以是选自下组的任何一种或多种,该组包括:N-乙酰葡糖胺-6-磷酸脱乙酰酶的敲除、L-谷氨酰胺-D-果糖-6-磷酸氨基转移酶的过表达、磷酸葡糖胺变位酶的过表达和N-乙酰葡糖胺-1-磷酸尿苷酰基转移酶/葡糖胺-1-磷酸乙酰基转移酶的过表达。
另外,或备选地,本文中使用的宿主细胞任选地被遗传修饰以表达CMP-Neu5Ac的从头合成。CMP-Neu5Ac可以通过在所述细胞中表达的酶或通过所述细胞的代谢提供。这样的产生CMP-Neu5Ac的细胞可以表达将例如唾液酸转化成CMP-Neu5Ac的酶。该酶可以是CMP-唾液酸合成酶,如来自几个物种(包括智人、脑膜炎奈瑟氏菌和多杀巴斯德氏菌)的N-酰基神经氨酸胞苷酰基转移酶。优选地,所述细胞被修饰以产生CMP-Neu5Ac。更优选地,所述细胞被修饰以增强CMP-Neu5Ac产生。所述修饰可以是选自下组的任何一种或多种,该组包括:N-乙酰葡糖胺-6-磷酸脱乙酰酶的敲除、葡糖胺-6-磷酸脱氨酶的敲除、CMP-唾液酸合成酶的过表达和N-乙酰基-D-葡糖胺2-差向异构酶编码基因的过表达。
另外,或备选地,本文中使用的宿主细胞任选地被遗传修饰以表达CMP-Neu5Gc的从头合成。CMP-Neu5Gc可以通过由脊椎动物CMP-Neu5Ac羟化酶(CMAH)酶执行的羟基化反应从CMP-Neu5Ac直接合成。优选地,所述细胞被修饰以产生CMP-Neu5Gc。更优选地,所述细胞被修饰以增强CMP-Neu5Gc产生。
另外,或备选地,本文中使用的宿主细胞任选地被遗传修饰以表达GDP-岩藻糖的从头合成。GDP-岩藻糖可以通过在所述细胞中表达的酶或通过所述细胞的代谢提供。这样的产生GDP-岩藻糖的细胞可以表达将例如要添加至所述细胞的岩藻糖转化成GDP-岩藻糖的酶。该酶可以是,例如,双功能的岩藻糖激酶/岩藻糖-1-磷酸鸟苷酰基转移酶,如来自脆弱拟杆菌(Bacteroides fragilis)的Fkp,或一种单独的岩藻糖激酶与一种单独的岩藻糖-1-磷酸鸟苷酰基转移酶在一起的组合,如已知它们来自几个物种,包括智人、野猪和褐家鼠。优选地,所述细胞被修饰以产生GDP-岩藻糖。更优选地,所述细胞被修饰以增强GDP-岩藻糖产生。所述修饰可以是选自下组的任何一种或多种,该组包括:UDP-葡萄糖:十一异戊二烯基-磷酸葡萄糖-1-磷酸转移酶编码基因的敲除、GDP-L-岩藻糖合酶编码基因的过表达、GDP-甘露糖4,6-脱水酶编码基因的过表达、甘露糖-1-磷酸鸟苷酰基转移酶编码基因的过表达、磷酸甘露糖变位酶编码基因的过表达和甘露糖-6-磷酸异构酶编码基因的过表达。
另外,或备选地,本文中使用的宿主细胞任选地被遗传修饰以表达UDP-Gal的从头合成。UDP-Gal可以通过在所述细胞中表达的酶或通过所述细胞的代谢提供。这样的产生UDP-Gal的细胞可以表达将例如UDP-葡萄糖转化成UDP-Gal的酶。该酶可以是,例如,UDP-葡萄糖4-差向异构酶GalE,例如其已知来自几个物种,包括智人、大肠杆菌和褐家鼠。优选地,所述细胞被修饰以产生UDP-Gal。更优选地,所述细胞被修饰以增强UDP-Gal产生。所述修饰可以是选自下组的任何一种或多种,该组包括:双功能的5’-核苷酸酶/UDP-糖水解酶编码基因的敲除、半乳糖-1-磷酸尿苷酰基转移酶编码基因的敲除和UDP-葡萄糖4-差向异构酶编码基因的过表达。
另外,或备选地,本文中使用的宿主细胞任选地被遗传修饰以表达UDP-GalNAc的从头合成。UDP-GalNAc可以通过单步反应的作用从UDP-GlcNAc合成,所述单步反应使用UDP-N-乙酰葡糖胺4-差向异构酶,如例如来自类志贺邻单胞菌(Plesiomonasshigelloides)的wbgU、来自小肠结肠炎耶尔森氏菌的gne或来自铜绿假单胞菌血清型O6的wbpP。优选地,所述细胞被修饰以产生UDP-GalNAc。更优选地,所述细胞被修饰以增强UDP-GalNAc产生。
另外,或备选地,本文中使用的宿主细胞任选地被遗传修饰以表达UDP-ManNAc的从头合成。UDP-ManNAc可以通过由UDP-GlcNAc 2-差向异构酶(如例如来自金黄色葡萄球菌的cap5P、来自大肠杆菌的RffE、来自肺炎链球菌的Cps19fK和来自肠道沙门氏菌的RfbC)执行的差向异构化反应从UDP-GlcNAc直接合成。优选地,所述细胞被修饰以产生UDP-ManNAc。更优选地,所述细胞被修饰以增强UDP-ManNAc产生。
根据本发明的方法和/或细胞的另一个实施方案,所述细胞表达至少一种选自以下列表的糖基转移酶,所述列表包含岩藻糖基转移酶、唾液酸转移酶、半乳糖基转移酶、葡萄糖基转移酶、甘露糖基转移酶、N-乙酰葡糖胺基转移酶、N-乙酰基半乳糖胺基转移酶、N-乙酰甘露糖胺基转移酶、木糖基转移酶、葡糖醛酸基转移酶、半乳糖醛酸转移酶、葡糖胺基转移酶、N-羟乙酰基神经氨酰基转移酶、鼠李糖基转移酶、N-乙酰基鼠李糖基转移酶、UDP-4-氨基-4,6-二脱氧-N-乙酰基-β-L-阿卓糖胺转氨酶、UDP-N-乙酰葡糖胺烯醇丙酮酰基转移酶和岩藻糖胺基转移酶。
在本发明的方法和/或细胞的一个优选的实施方案中,所述岩藻糖基转移酶选自包含以下各项的列表:α-1,2-岩藻糖基转移酶、α-1,3-岩藻糖基转移酶、α-1,4-岩藻糖基转移酶和α-1,6-岩藻糖基转移酶。
在本发明的方法和/或细胞的一个替代性的和/或另外的实施方案中,所述唾液酸转移酶选自包含α-2,3-唾液酸转移酶、α-2,6-唾液酸转移酶和α-2,8-唾液酸转移酶的列表。
在本发明的方法和/或细胞的一个替代性的和/或另外的实施方案中,所述半乳糖基转移酶选自包含以下各项的列表:β-1,3-半乳糖基转移酶、N-乙酰葡糖胺β-1,3-半乳糖基转移酶、β-1,4-半乳糖基转移酶、N-乙酰葡糖胺β-1,4-半乳糖基转移酶、α-1,3-半乳糖基转移酶和α-1,4-半乳糖基转移酶。
在本发明的方法和/或细胞的一个替代性的和/或另外的实施方案中,所述葡萄糖基转移酶选自包含以下各项的列表:α-葡萄糖基转移酶、β-1,2-葡萄糖基转移酶、β-1,3-葡萄糖基转移酶和β-1,4-葡萄糖基转移酶。
在本发明的方法和/或细胞的一个替代性的和/或另外的实施方案中,所述甘露糖基转移酶选自包含以下各项的列表:α-1,2-甘露糖基转移酶、α-1,3-甘露糖基转移酶和α-1,6-甘露糖基转移酶。
在本发明的方法和/或细胞的一个替代性的和/或另外的实施方案中,所述N-乙酰葡糖胺基转移酶选自包含以下各项的列表:半乳糖苷β-1,3-N-乙酰葡糖胺基转移酶和β-1,6-N-乙酰葡糖胺基转移酶。
在本发明的方法和/或细胞的一个替代性的和/或另外的实施方案中,所述N-乙酰基半乳糖胺基转移酶选自包含α-1,3-N-乙酰基半乳糖胺基转移酶的列表。
在本发明的方法和/或细胞的另一个实施方案中,所述细胞在所述糖基转移酶中的至少一种的表达或活性方面被修饰。在一个优选的实施方案中,所述糖基转移酶是所述细胞的内源蛋白但具有修饰的表达或活性,优选地所述内源性糖基转移酶被过表达;备选地,所述糖基转移酶是异源蛋白,其被异质地引入并在所述细胞中表达,优选地过表达。所述内源性糖基转移酶可以在也表达异源糖基转移酶的细胞中具有修饰的表达。
根据本发明的方法和/或细胞的另一个优选的实施方案,所述细胞表达至少一种具有α-2,3-唾液酸转移酶活性的α-2,3-唾液酸转移酶。
在本发明的方法和/或细胞的另一个优选的实施方案中,所述α-2,3-唾液酸转移酶是具有SEQ ID NO 80的来自多杀巴斯德氏菌(Pasteurella multocida)的多肽。
在本发明的方法和/或细胞的另一个替代性和/或另外优选的实施方案中,所述α-2,3-唾液酸转移酶是268个氨基酸残基长的多肽,所述多肽为具有SEQ ID NO 80的多肽的功能同系物、变体或衍生物,所述功能同系物、变体或衍生物与具有SEQ ID NO 80的所述多肽的全长具有至少80%总体序列同一性并且具有α-2,3-唾液酸转移酶活性。268个氨基酸残基长并且与具有SEQ ID NO 80的所述多肽的全长具有至少80%总体序列同一性的多肽应理解为该268个氨基酸残基长的多肽与本文给出的具有SEQ ID NO 80的所述多肽具有至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、100%总体序列同一性。
在本发明的方法和/或细胞的另一个替代性和/或另外优选的实施方案中,所述α-2,3-唾液酸转移酶是268个氨基酸残基长的多肽,所述多肽与具有SEQ ID NO 80的所述多肽相比具有一个或多个单点突变并且具有α-2,3-唾液酸转移酶活性。
在发明的方法和/或细胞的另一个实施方案中,所述α-2,3-唾液酸转移酶参与本发明的生物产物的产生,所述生物产物包括二糖、寡糖、糖脂和/或糖蛋白。在本发明的方法和/或细胞的一个优选的实施方案中,所述α-2,3-唾液酸转移酶参与含有Neu(n)Ac的化合物的产生,其中(n)为4、5、7、8或9或其组合。
在本发明的方法和/或细胞的另一个实施方案中,所述细胞在所述α-2,3-唾液酸转移酶中至少一种的表达或活性方面被修饰。在一个优选的实施方案中,所述α-2,3-唾液酸转移酶是所述细胞的内源蛋白但具有修饰的表达或活性,优选地所述内源性α-2,3-唾液酸转移酶被过表达;备选地,所述α-2,3-唾液酸转移酶是异源蛋白,其被异质地引入并在所述细胞中表达,优选地过表达。所述内源性α-2,3-唾液酸转移酶可以在也表达异源α-2,3-唾液酸转移酶的细胞中具有修饰的表达。
根据本发明的方法和/或细胞的另一个优选方法,所述Neu(n)Ac合酶是Neu5Ac合酶,并且所述含有Neu(n)Ac的化合物是含有Neu5Ac的唾液酸化的化合物。
根据本发明的方法和/或细胞的另一个和/或替代性优选实施方案,所述细胞包含岩藻糖基化途径,其包含至少一种选自包含以下各项的列表的酶:甘露糖-6-磷酸异构酶、磷酸甘露糖变位酶、甘露糖-1-磷酸鸟苷酰基转移酶、GDP-甘露糖4,6-脱水酶、GDP-L-岩藻糖合酶、岩藻糖通透酶、岩藻糖激酶、岩藻糖-1-磷酸鸟苷酰基转移酶、岩藻糖基转移酶。
根据本发明的方法和/或细胞的另一个和/或替代性优选实施方案,所述细胞包含半乳糖基化途径,其包含至少一种选自包含以下各项的列表的酶:半乳糖-1-差向异构酶、半乳糖激酶、葡糖激酶、半乳糖-1-磷酸尿苷酰基转移酶、UDP-葡萄糖4-差向异构酶、葡萄糖-1-磷酸尿苷酰基转移酶、葡萄糖磷酸变位酶、半乳糖基转移酶。
根据本发明的方法和/或细胞的另一个和/或替代性优选实施方案,所述细胞包含N-乙酰葡糖胺基化途径,其包含至少一种选自包含以下各项的列表的酶:L-谷氨酰胺-D-果糖-6-磷酸氨基转移酶、N-乙酰葡糖胺-6-磷酸脱乙酰酶、磷酸葡糖胺变位酶、N-乙酰葡糖胺-1-磷酸尿苷酰基转移酶/葡糖胺-1-磷酸乙酰基转移酶、N-乙酰葡糖胺基转移酶。
根据本发明的方法和/或细胞的另一个优选实施方案,所述细胞包含减少的乙酸盐或酯产生的修饰。所述修饰可以是选自下组的任何一种或多种,该组包括:乙酰辅酶A合成酶的过表达,丙酮酸脱氢酶的完全或部分敲除或被赋予更低功能性的丙酮酸脱氢酶和乳酸脱氢酶的完全或部分敲除或被赋予更低功能性的乳酸脱氢酶。
在本发明的方法和/或细胞的另一个实施方案中,所述细胞在至少一种乙酰辅酶A合成酶(如例如来自大肠杆菌、酿酒酵母、智人、小家鼠的acs)的表达或活性方面被修饰。在一个优选的实施方案中,所述乙酰辅酶A合成酶是具有修饰的表达或活性的细胞的内源蛋白,优选地所述内源性乙酰辅酶A合成酶被过表达;备选地,所述乙酰辅酶A合成酶是异源蛋白,其被异质地引入并在所述细胞中表达,优选地过表达。所述内源性乙酰辅酶A合成酶可以在也表达异源糖基转移酶的细胞中具有修饰的表达。在一个更优选的实施方案中,所述细胞在来自大肠杆菌的乙酰辅酶A合成酶acs(具有SEQ ID NO 79)的表达或活性方面被修饰。在另一个和/或另外的优选的实施方案中,所述细胞在SEQ ID NO 79的功能同系物、变体或衍生物的表达或活性方面被修饰,所述功能同系物、变体或衍生物分别与具有SEQ IDNO 79的所述多肽的全长具有至少80%总体序列同一性并且具有乙酰辅酶A合成酶活性。
在本发明的方法和/或细胞的一个替代性的和/或另外的其它实施方案中,所述细胞在至少一种丙酮酸脱氢酶(如例如来自大肠杆菌、酿酒酵母、智人和褐家鼠)的表达或活性方面被修饰。在一个优选的实施方案中,所述细胞已经通过本领域技术人员通常已知的方式被修饰成具有至少一种部分地或完全地敲除的或突变的丙酮酸脱氢酶编码基因,从而产生至少一种具有更低功能性或不具有丙酮酸脱氢酶活性的蛋白。在一个更优选的实施方案中,所述细胞具有在poxB编码基因中的完全敲除,从而产生缺乏丙酮酸脱氢酶活性的细胞。
在本发明的方法和/或细胞的一个替代性的和/或另外的其它实施方案中,所述细胞在至少一种乳酸脱氢酶(如例如来自大肠杆菌、酿酒酵母、智人和褐家鼠)的表达或活性方面被修饰。在一个优选的实施方案中,所述细胞已经通过本领域技术人员通常已知的方式被修饰成具有至少一种部分地或完全地敲除的或突变的乳酸脱氢酶编码基因,从而产生至少一种具有更低功能性或不具有乳酸脱氢酶活性的蛋白。在一个更优选的实施方案中,所述细胞具有在ldhA编码基因中的完全敲除,从而产生缺乏乳酸脱氢酶活性的细胞。
根据本发明的方法和/或细胞的另一个优选实施方案,所述细胞包含以下蛋白中的任何一种或多种的更低的或减少的表达和/或消除的、受损的、减少的或延迟的活性,所述蛋白包含β-半乳糖苷酶、半乳糖苷O-乙酰基转移酶、N-乙酰葡糖胺-6-磷酸脱乙酰酶、葡糖胺-6-磷酸脱氨酶、N-乙酰葡糖胺阻遏物、核糖核苷酸单磷酸酶、EIICBA-Nag、UDP-葡萄糖:十一异戊二烯基-磷酸葡萄糖-1-磷酸转移酶、L-墨角藻糖激酶(L-fuculokinase)、L-岩藻糖异构酶、N-乙酰神经氨酸裂合酶、N-乙酰甘露糖胺激酶、N-乙酰甘露糖胺-6-磷酸2-差向异构酶、EIIAB-Man、EIIC-Man、EIID-Man、ushA、半乳糖-1-磷酸尿苷酰基转移酶、葡萄糖-1-磷酸腺苷酰基转移酶、葡萄糖-1-磷酸酶、ATP依赖性的6-磷酸果糖激酶同工酶1、ATP依赖性的6-磷酸果糖激酶同工酶2、葡萄糖-6-磷酸异构酶、好氧性呼吸控制蛋白、转录阻遏物IclR、lon蛋白酶、葡萄糖特异性的转位磷酸转移酶IIBC组分ptsG、葡萄糖特异性的转位磷酸转移酶(PTS)酶IIBC组分malX、酶IIAGlc、β-葡萄糖苷特异性的PTS酶II、果糖特异性的PTS多磷酰基转移蛋白FruA和FruB、乙醇脱氢酶醛脱氢酶、丙酮酸-甲酸裂合酶、乙酸激酶、磷酸酰基转移酶、磷酸乙酰基转移酶、丙酮酸脱羧酶。
根据本发明的方法和/或细胞的另一个优选实施方案,所述细胞包含至少部分地灭活的所选单糖、二糖或寡糖的分解代谢途径,所述单糖、二糖或寡糖参与含有Neu(n)Ac的化合物的合成和/或是含有Neu(n)Ac的化合物的合成所必需的。
根据本发明的方法和/或细胞的另一个优选实施方案,所述细胞使用前体来合成本发明的生物产物(包含含有Neu(n)Ac的化合物)。在本文中,将所述前体从培养基供给至所述细胞。在另一个优选的实施方案中,所述细胞产生用于合成所述生物产物(包含含有Neu(n)Ac的化合物)的前体。
根据本发明的方法和/或细胞的另一个优选实施方案,所述细胞在整个培养液和/或上清液中产生90g/L或更多的本发明的生物产物(如例如含有Neu(n)Ac的化合物)。在一个更优选的实施方案中,在整个培养液和/或上清液中产生的生物产物(如例如含有Neu(n)Ac的化合物)具有至少80%的纯度,这按照分别在整个培养液和/或上清液中所述细胞产生的生物产物(如例如含有Neu(n)Ac的化合物)及其前体的总量进行测量。
根据本发明的方法和/或细胞的另一个实施方案,本发明的生物产物选自包含以下各项的列表:单糖、磷酸化的单糖、活化的单糖、二糖、寡糖、苷元、糖脂和/或糖蛋白。在一个优选的实施方案中,所述寡糖选自包含以下各项的列表:乳寡糖、O-抗原、在荚膜多糖中存在的寡糖重复单位、肽聚糖、氨基-糖和Lewis-型抗原寡糖。在一个更优选的实施方案中,所述乳寡糖是哺乳动物乳寡糖(MMO)。在一个甚至更优选的实施方案中,所述乳寡糖是人乳寡糖(HMO)。
根据本发明的方法和/或细胞的另一个实施方案,所述含有Neu(n)Ac的化合物选自包含以下各项的列表:唾液酸、二糖、寡糖、糖脂和/或糖蛋白。在本发明的方法和/或细胞的优选实施方案中,所述含有Neu(n)Ac的化合物选自由以下各项组成的列表:唾液酸、二糖、寡糖、糖脂和/或糖蛋白。在本发明的方法和/或细胞的更优选实施方案中,所述含有Neu(n)Ac的化合物选自由以下各项组成的列表:唾液酸、二糖、寡糖和/或糖脂。在本发明的方法和/或细胞的甚至更优选实施方案中,所述含有Neu(n)Ac的化合物选自由以下各项组成的列表:唾液酸、二糖和/或寡糖。在一个优选的实施方案中,所述寡糖选自包含以下各项的列表:乳寡糖、O-抗原、在荚膜多糖中存在的寡糖重复单位、肽聚糖、氨基-糖和Lewis-型抗原寡糖。在一个更优选的实施方案中,所述乳寡糖是哺乳动物乳寡糖。在一个甚至更优选的实施方案中,所述乳寡糖是人乳寡糖。
根据本发明的方法和/或细胞的另一个实施方案,所述细胞能够合成寡糖混合物。在一个替代性和/或另外的方面,所述细胞能够合成二糖和寡糖的混合物,备选地,所述细胞能够合成唾液酸、二糖和/或寡糖的混合物。
本发明的另一个实施方案提供了一种方法和一种细胞,其中在本文所述的细菌、真菌、酵母、昆虫、植物、动物或原生动物表达系统或细胞中和/或由本文所述的细菌、真菌、酵母、昆虫、植物、动物或原生动物表达系统或细胞产生本发明的生物产物(如例如含有Neu(n)Ac的化合物)。所述表达系统或细胞选自包含以下各项的列表:细菌、真菌或酵母,或是指植物、动物或原生动物细胞。后一种细菌优选属于变形菌门(Proteobacteria)或厚壁菌门(Firmicutes)或蓝细菌门(Cyanobacteria)或异常球菌-栖热菌门(Deinococcus-Thermus)。后一种属于变形菌门的细菌优选属于肠杆菌科(Enterobacteriaceae),优选属于大肠杆菌种。后一种细菌优选涉及属于大肠杆菌种的任何菌株,诸如但不限于大肠杆菌B、大肠杆菌C、大肠杆菌W、大肠杆菌K12、大肠杆菌Nissle。更具体地,后一个术语涉及培养的大肠杆菌菌株(称为大肠杆菌K12菌株),它们良好地适应实验室环境,并且与野生型菌株不同,已经丧失其在肠道中繁殖的能力。大肠杆菌K12菌株的众所周知的例子是K12野生型、W3110、MG1655、M182、MC1000、MC1060、MC1061、MC4100、JM101、NZN111和AA200。因此,优选地,本发明具体涉及如上所述的突变的和/或转化的大肠杆菌菌株,其中所述大肠杆菌菌株是K12菌株。更具体地,本发明涉及如上所述的突变的和/或转化的大肠杆菌菌株,其中所述K12菌株是大肠杆菌MG1655。后一种属于厚壁菌门的细菌优选属于芽孢杆菌(Bacilli),优选来自芽孢杆菌属(Bacillus)种,诸如枯草芽孢杆菌(Bacillus subtilis)或解淀粉芽孢杆菌(B.amyloliquefaciens)。后一种属于放线菌门(Actinobacteria)的细菌优选属于棒杆菌科(Corynebacteriaceae),具有谷氨酸棒杆菌和非发酵棒杆菌(C.afermentans)的成员,或属于链霉菌科(Streptomycetaceae),具有灰色链霉菌(Streptomyces griseus)或弗氏链霉菌(S.fradiae)的成员。后一种真菌优选属于根霉菌属(Rhizopus)、盘基网柄菌属(Dictyostelium)、青霉属(Penicillium)、毛霉菌属(Mucor)或曲霉菌属(Aspergillus)。后一种酵母优选属于子囊菌门(Ascomycota)或担子菌门(Basidiomycota)或半知菌门(Deuteromycota)或接合菌门(Zygomycetes)。后一种酵母优选属于酵母属(Saccharomyces)(具有如例如酿酒酵母(Saccharomyces cerevisiae)、贝酵母(S.bayanus)、布拉氏酵母(S.boulardii)的成员)、接合酵母属(Zygosaccharomyces)、毕赤酵母属(Pichia)(具有如例如巴斯德毕赤酵母(Pichia pastoris)、异常毕赤酵母(P.anomala)、克鲁维毕赤酵母(P.kluyveri)的成员)、驹形氏酵母(Komagataella)、汉逊酵母属(Hansenula)、耶氏酵母属(Yarrowia)(如例如解脂耶氏酵母(Yarrowialipolytica))、斯塔莫酵母(Starmerella)(如例如熊蜂生斯塔莫酵母(Starmerellabombicola))、克鲁维酵母属(Kluyveromyces)(具有如例如乳酸克鲁维酵母(Kluyveromyces lactis)、马克斯克鲁维酵母(K.marxianus)、耐热克鲁维酵母(K.thermotolerans)的成员)或德巴利酵母属(Debaromyces)。后一种酵母优选地选自巴斯德毕赤酵母、解脂耶氏酵母、酿酒酵母和乳酸克鲁维酵母。植物细胞包括有花植物和无花植物的细胞以及藻类细胞,例如衣藻(Chlamydomonas)、小球藻(Chlorella)等。优选地,所述植物是烟草、苜蓿、稻、番茄、棉花、油菜、大豆、玉蜀黍或玉米植物。后一种动物细胞优选衍生自非人哺乳动物(牛、水牛、猪、绵羊、小鼠、大鼠)、鸟类(例如鸡、鸭、鸵鸟、火鸡、野鸡)、鱼类(例如旗鱼、鲑鱼、金枪鱼、海鲈鱼、鳟鱼、鲶鱼)、无脊椎动物(例如龙虾、螃蟹、虾、蛤、牡蛎、贻贝、海胆)、爬行动物(例如蛇、短吻鳄、海龟)、两栖动物(例如青蛙)或昆虫(例如苍蝇、线虫),或是衍生自除胚胎干细胞外的人类细胞的遗传修饰的细胞系。人类和非人类哺乳动物细胞优选地从包含以下各项的列表选择:上皮细胞如乳腺上皮细胞、胚肾细胞、成纤维细胞、COS细胞、中国仓鼠卵巢(CHO)细胞、小鼠骨髓瘤细胞(如N20、SP2/0或YB2/0细胞)、NIH-3T3细胞、非乳腺成人干细胞或其衍生物,如WO21067641所述。后一种昆虫细胞优选来源于草地贪夜蛾(Spodoptera frugiperda)如Sf9或Sf21细胞、家蚕(Bombyx mori)、甘蓝夜蛾(Mamestra brassicae)、粉纹夜蛾(Trichoplusia ni)如BTI-TN-5B1-4细胞或黑腹果蝇(Drosophila melanogaster)如果蝇D3细胞。后一种原生动物细胞优选为蜥蜴利什曼原虫(Leishmania tarentolae)细胞。
在一个优选的实施方案中,所述细胞是微生物的细胞,其中更优选地所述微生物是细菌或酵母。在一个更优选的实施方案中,所述微生物是细菌,更优选是大肠杆菌。本文中描述了使用此类大肠杆菌的实施例。
另一个实施方案提供了在培养基中稳定培养的细胞,其中所述培养基可以是任何类型的生长培养基,包括基本培养基、复合培养基或富含某些化合物(如例如但不限于维生素、痕量元素、氨基酸)的生长培养基。贯穿本申请和权利要求书,除非另外指明,动词“孵育”(及其变形形式)和“培养”(及其变形形式)在本发明的情形中可互换使用。
本文中使用的细胞能够在作为主要碳源的单糖、二糖、寡糖、多糖、多元醇、甘油、复合培养基或其混合物上生长。术语“主要”是指对于用于产生感兴趣的生物产物的细胞来说最重要的碳源,即所有所需碳的20%、30%、40%、50%、60%、70%、75%、80%、85%、90%、95%、98%、99%衍生自上述碳源。在本发明的一个实施方案中,所述碳源是所述生物体的唯一碳源,即所有所需碳的100%衍生自上述碳源。常见的主要碳源包括、但不限于葡萄糖、甘油、果糖、蔗糖、麦芽糖、乳糖、阿拉伯糖、麦芽寡糖、麦芽三糖、山梨醇、木糖、鼠李糖、半乳糖、甘露糖、甲醇、乙醇、海藻糖、淀粉、纤维素、半纤维素、糖蜜、玉米浆、高果糖糖浆、乙酸盐、柠檬酸盐、乳酸盐和丙酮酸盐。如本文中使用的,本文中定义的前体不可用作用于产生本发明的生物产物的碳源。
在一个进一步优选实施方案中,用于产生本发明的生物产物(如例如本文所述的含有Neu(n)Ac的化合物)的方法包括下述步骤中的至少一个:
i)向在反应器中的培养基中加入至少一种前体和/或受体补料,其中总反应器体积的范围为250mL(毫升)至10.000m3(立方米),优选以连续方式加入,且优选使得所述培养基的终体积是在加入所述前体和/或受体补料之前培养基体积的不超过3倍、优选不超过2倍、更优选小于2倍;
ii)借助于补料溶液历时1天、2天、3天、4天、5天将至少一种前体和/或受体补料以连续方式加入所述培养基中;
iii)借助于补料溶液历时1天、2天、3天、4天、5天将至少一种前体和/或受体补料以连续方式加入所述培养基中,并且其中优选地,将所述补料溶液的pH设定在3至7,并且其中优选地,将所述补料溶液的温度保持在20℃至80℃;
所述方法产生在所述培养基的终体积中具有至少50g/L、优选至少75g/L、更优选至少90g/L、更优选至少100g/L、更优选至少125g/L、更优选至少150g/L、更优选至少175g/L、更优选至少200g/L的浓度的本发明的生物产物,如例如含有Neu(n)Ac的化合物。
在另一个和/或另外的进一步优选实施方案中,用于产生本发明的生物产物(如例如本文所述的含有Neu(n)Ac的化合物)的方法包括下述步骤中的至少一个:
i)以一次脉冲方式或以不连续(脉冲)方式向培养基中加入至少一种前体和/或受体,其中总反应器体积的范围为250mL(毫升)至10.000m3(立方米),优选使得所述培养基的终体积是在加入所述前体和/或受体补料脉冲之前培养基体积的不超过3倍、优选不超过2倍、更优选小于2倍;
ii)借助于补料溶液历时5分钟、10分钟、30分钟、1小时、2小时、4小时、10小时、12小时、1天、2天、3天、4天、5天以不连续(脉冲)方式向所述培养基中加入至少一种前体和/或受体补料;
iii)借助于补料溶液历时5分钟、10分钟、30分钟、1小时、2小时、4小时、10小时、12小时、1天、2天、3天、4天、5天以不连续(脉冲)方式向所述培养基中加入至少一种前体和/或受体补料,并且其中优选地,将所述补料溶液的pH设定在3至7,并且其中优选地,将所述补料溶液的温度保持在20℃至80℃;
所述方法产生在所述培养基的终体积中具有至少50g/L、优选至少75g/L、更优选至少90g/L、更优选至少100g/L、更优选至少125g/L、更优选至少150g/L、更优选至少175g/L、更优选至少200g/L的浓度的本发明的生物产物,如例如含有Neu(n)Ac的化合物。
在进一步优选的实施方案中,用于产生本发明的生物产物(如例如本文所述的含有Neu(n)Ac的化合物)的方法包括下述步骤中的至少一个:
i)向培养基中加入乳糖补料,其包含至少50、更优选至少75、更优选至少100、更优选至少120、更优选至少150克乳糖/升初始反应器体积,其中总反应器体积的范围为250mL(毫升)至10.000m3(立方米),优选以连续方式加入,且优选使得所述培养基的终体积是在加入所述乳糖补料之前培养基体积的不超过3倍、优选不超过2倍、更优选小于2倍;
ii)借助于补料溶液历时1天、2天、3天、4天、5天以连续方式向所述培养基中加入乳糖补料;
iii)借助于乳糖补料溶液历时1天、2天、3天、4天、5天以连续方式向所述培养基中加入乳糖补料,且其中所述乳糖补料溶液的浓度是50g/L、优选75g/L、更优选100g/L、更优选125g/L、更优选150g/L、更优选175g/L、更优选200g/L、更优选225g/L、更优选250g/L、更优选275g/L、更优选300g/L、更优选325g/L、更优选350g/L、更优选375g/L、更优选400g/L、更优选450g/L、更优选500g/L、甚至更优选550g/L、最优选600g/L;且其中优选地将所述溶液的pH设定在3至7,并且其中优选地将所述补料溶液的温度保持在20℃至80℃;
所述方法产生在所述培养基的终体积中具有至少50g/L、优选至少75g/L、更优选至少90g/L、更优选至少100g/L、更优选至少125g/L、更优选至少150g/L、更优选至少175g/L、更优选至少200g/L的浓度的本发明的生物产物,如例如Neu(n)Ac修饰的乳糖。
优选地,通过从培养开始以至少5mM的浓度、优选以30、40、50、60、70、80、90、100、150mM的浓度、更优选以>300mM的浓度添加乳糖来完成乳糖补料。
在另一个方面,通过以一定浓度将乳糖加入培养物或培养基中,使得在整个培养的生产阶段中获得至少5mM、优选10mM或30mM的乳糖浓度,完成乳糖补料。
在本文描述的方法的另一个实施方案中,将所述宿主细胞培养至少约60、80、100或约120小时或以连续方式培养。
在一个优选的实施方案中,在所述培养基中提供碳源、优选蔗糖持续3天或更多天,优选多至7天;和/或在所述培养基中以连续方式提供至少100、有利地至少105、更有利地至少110、甚至更有利地至少120克蔗糖/升初始培养体积,使得所述培养基的终体积是在培养之前培养基体积的不超过3倍、有利地不超过2倍、更有利地小于2倍。
优选地,当进行本文描述的方法时,通过向所述培养基中添加碳源(优选葡萄糖或蔗糖)来提供指数细胞生长的第一阶段,然后在第二阶段将乳糖加入所述培养基中。
在一个替代性的优选的实施方案中,在本文描述的方法中,在指数生长的第一阶段已经将乳糖与基于碳的底物一起加入。
根据本发明,如本文描述的方法优选地包括将本发明的生物产物从所述培养物分离的步骤。
术语“从所述培养物分离”是指从所述细胞和/或其生长的培养基中收获、收集或回收本发明所述的生物产物,如例如含有Neu(n)Ac的化合物。
可以以常规方式从所述细胞所生长的水性培养基中分离所述生物产物。在所述生物产物仍然存在于产生所述生物产物的细胞中的情况下,可以使用从细胞中释放或提取所述生物产物的常规方式,诸如使用高pH、热休克、声处理、弗氏压碎器、匀浆化、酶促水解、化学水解、溶剂水解、去污剂、水解等的细胞破坏。然后,所述培养基和/或细胞提取物可以一起和分开进一步用于分离所述生物产物。
这优选涉及澄清所述生物产物以除去悬浮颗粒和污染物,特别是通过培养遗传修饰的细胞产生的细胞、细胞组分、不溶性代谢物和碎片。在该步骤中,所述生物产物可以通过常规方式澄清。优选地,所述生物产物通过离心、絮凝、倾析和/或过滤来澄清。分离所述含有Neu(n)Ac的化合物的另一个步骤(优选第二步骤)优选包括从所述含有Neu(n)Ac的化合物中除去基本上所有的可能干扰后续分离步骤的最终残留的蛋白、肽、氨基酸、RNA、DNA、内毒素和糖脂,优选地在已经澄清它之后进行。在该步骤中,可以以常规方式从所述含有Neu(n)Ac的化合物中除去残留的蛋白和相关杂质。优选地,通过超滤、纳米过滤、两相分配、反渗透、微滤、活性炭或碳处理、用非离子表面活性剂处理、酶消化、切向流高效过滤、切向流超滤、电泳(例如使用平板-聚丙烯酰胺或十二烷基硫酸钠-聚丙烯酰胺凝胶电泳(PAGE))、亲和色谱法(使用亲和配体,包括例如DEAE-sepharose、聚-L-赖氨酸和多粘菌素-B、内毒素选择性的吸附剂基质)、离子交换色谱法(诸如但不限于阳离子交换、阴离子交换、混合床离子交换、内翻外配体附着(inside-out ligand attachment))、疏水相互作用色谱法和/或凝胶过滤(即,尺寸排阻色谱法),特别是通过色谱法,更特别是通过离子交换色谱法或疏水相互作用色谱法或配体交换色谱法或电渗析,从所述含有Neu(n)Ac的化合物中除去残留的蛋白、盐、副产物、颜色、内毒素和其它相关杂质。除了尺寸排阻色谱法之外,残留的蛋白和相关杂质被色谱介质或选定的膜保留。
在一个进一步优选的实施方案中,如本文描述的方法还提供本发明的生物产物的进一步纯化。所述生物产物的进一步纯化可以例如如下完成:使用(活化的)木炭或碳、纳米过滤、超滤、电泳、酶处理或离子交换,以除去任何残留的DNA、蛋白、LPS、内毒素或其它杂质。还可以使用醇(诸如乙醇)和水性醇混合物。另一个纯化步骤通过所述生物产物的结晶、蒸发或沉淀来完成。另一个纯化步骤是干燥,例如喷雾干燥或冻干所述生物产物。
在一个示例性实施方案中,在以任何顺序包括以下步骤的方法中进行所述生物产物(如例如含有Neu(n)Ac的化合物)的分离和纯化:
a)使所述培养物或其澄清形式与具有600-3500Da的分子量截止值(MWCO)的纳米过滤膜接触,确保所产生的含有Neu(n)Ac的化合物的截留,并允许蛋白、盐、副产物、颜色和其它有关的杂质的至少一部分穿过,
b)使用所述膜,用无机电解质的水溶液对来自步骤a)的渗余物进行渗滤工艺,随后任选地用纯水渗滤以除去过量的电解质,
c)并收集富含以所述电解质的阳离子的盐形式存在的所述生物产物的渗余物。
在一个替代性的示例性实施方案中,在以任何顺序包括以下步骤的方法中进行所述生物产物的分离和纯化:使所述培养物或其澄清形式经历使用不同膜的两个膜过滤步骤,其中
-一种膜具有约300至约500道尔顿的分子量截止值,且
-另一种膜具有约600至约800道尔顿的分子量截止值。
在一个替代性的示例性实施方案中,在一种方法中进行所述生物产物的分离和纯化,所述方法包括任何顺序的下述步骤:包括用H+-形式的强阳离子交换树脂和用游离碱形式的弱阴离子交换树脂处理所述培养物或其澄清形式的步骤。
在一个替代性的示例性实施方案中,按以下方式进行所述生物产物的分离和纯化。对包含所产生的生物产物、生物质、培养基组分和污染物的培养物应用下述纯化步骤,优选地其中在所述培养物中的所产生的生物产物(如例如含有Neu(n)Ac的化合物)的纯度<80%:
i)从所述培养物中分离生物质,
ii)阳离子离子交换剂处理以除去带正电荷的物质,
iii)阴离子离子交换剂处理以除去带负电荷的物质,
iv)纳米过滤步骤和/或电渗析步骤,
其中提供纯化的溶液,其包含大于或等于80%的纯度的所产生的生物产物。任选地,将纯化的溶液喷雾干燥。
在一个替代性的示例性实施方案中,在以任何顺序包括以下步骤的方法中进行所述生物产物的分离和纯化:培养物的酶处理;从培养物除去生物质;超滤;纳米过滤;和柱色谱法步骤。优选地,这样的柱色谱法是单个柱或多个柱。进一步优选地,所述柱色谱法步骤是模拟的移动床色谱法。这样的模拟的移动床色谱法优选地包含i)至少4个柱,其中至少一个柱包含弱或强阳离子交换树脂;和/或ii)具有不同流速的四个区域I、II、III和IV;和/或iii)包含水的洗脱液;和/或iv)15摄氏度至60摄氏度的操作温度。
在一个具体实施方案中,本发明提供了被喷雾干燥成粉末的所产生的生物产物,其中所述喷雾干燥的粉末含有<15重量%的水,优选地<10重量%的水,更优选地<7重量%的水,最优选地<5重量%的水。
本发明的另一个方面提供了如本文中定义的细胞在用于产生生物产物(如例如含有Neu(n)Ac的化合物)的方法中的用途。本发明的另一个方面提供了如本文中定义的方法用于产生生物产物(如例如含有Neu(n)Ac的化合物)的用途。
此外,本发明也涉及通过根据本发明的方法得到的生物产物(如例如含有Neu(n)Ac的化合物),以及如上所述的多核苷酸、载体、宿主细胞或多肽用于产生所述生物产物的用途。所述生物产物可以用作为食品添加剂、益生元、合生元(symbiotic),用于补充婴儿食品、成人食品或饲料,或作为治疗上或药学上有活性的化合物或用在化妆品应用中。利用所述新颖的方法,可以容易地且有效地提供所述生物产物,而不需要复杂的、消耗时间和成本的合成过程。
为了鉴定在如本文描述的细胞中产生的本发明的生物产物,通过本领域已知的标准方法,诸如,例如,甲基化分析、还原裂解、水解、GC-MS(气相色谱法-质谱法)、MALDI-MS(基质辅助激光解吸/电离-质谱法)、ESI-MS(电喷射电离-质谱法)、HPLC(具有紫外或折射率检测的高效液相色谱法)、HPAEC-PAD(具有脉冲电流计检测的高效阴离子交换色谱法)、CE(毛细管电泳)、IR(红外)/拉曼光谱法和NMR(核磁共振)光谱法技术,可以鉴定单糖或单体结构单元(例如单糖或聚糖单元组合物)、侧链的异头构型、取代基的存在和位置、聚合度/分子量以及连接模式。使用例如固态NMR、FT-IR(傅里叶变换红外光谱法)和WAXS(广角X射线散射)等,可以解析晶体结构。通过例如粘度测定法和SEC(SEC-HPLC,高效尺寸排阻色谱法),可以测定聚合度(DP)、DP分布和多分散性。为了鉴定所述生物产物的单体组分,可以使用下述方法,例如酸催化的水解、HPLC(高效液相色谱法)或GLC(气-液色谱法)(在转化为多羟糖醇乙酸酯(alditol acetates)之后)。为了确定糖苷键,将所述生物产物在DMSO中用碘代甲烷和强碱甲基化,进行水解,实现部分甲基化的多羟糖醇的还原,乙酰化为甲基化的多羟糖醇乙酸酯,并通过GLC/MS(气-液色谱法与质谱法联用)进行分析。为了确定聚糖序列,使用酸或酶进行部分解聚以确定结构。为了鉴定异头构型,对所述生物产物进行酶分析,例如使它与对特定类型的键具有特异性的酶(例如,β-半乳糖苷酶或α-葡萄糖苷酶等)接触,并且可以使用NMR来分析产物。
将本文描述的分离的和优选地也纯化的生物产物(如例如含有Neu(n)Ac的化合物)掺入食品(例如,人食品或饲料)、饮食添加物、药物成分、化妆品成分或药物中。在某些实施方案中,将所述生物产物与一种或多种适合用于食品、饲料、饮食添加物、药物成分、化妆成分或药物的成分混合。
在某些实施方案中,所述饮食添加物包含至少一种益生元成分和/或至少一种益生菌成分。
“益生元”是促进对宿主有益的微生物(特别是在胃肠道中的微生物)的生长的物质。在某些实施方案中,饮食添加物提供多种益生元,包括作为通过在本说明书中公开的方法产生和/或纯化的益生元的生物产物,以促进一种或多种有益微生物的生长。用于饮食添加物的益生元成分的例子包括其它益生元分子(例如HMO)和植物多糖(诸如菊粉、果胶、b-葡聚糖和低聚木糖)。“益生菌”产品通常含有活微生物,它们替代或添加至胃肠道微生物菌群,从而对接受者有益。这样的微生物的例子包括乳杆菌属种(例如,嗜酸乳杆菌(L.acidophilus)和保加利亚乳杆菌(L.bulgaricus))、双歧杆菌属种(例如、动物双歧杆菌(B.animalis)、长双歧杆菌(B.longum)和婴儿双歧杆菌(B.infantis)(例如,Bi-26))和布拉氏酵母菌(Saccharomyces boulardii)。在某些实施方案中,通过本说明书的方法产生和/或纯化的生物产物与这样的微生物组合地口服施用。
用于饮食添加物的其它成分的例子包括寡糖(诸如2’-岩藻糖基乳糖、3-岩藻糖基乳糖、3’-唾液酸基乳糖、6’-唾液酸基乳糖)、二糖(诸如乳糖)、单糖(诸如葡萄糖、半乳糖、L-岩藻糖、唾液酸、葡糖胺和N-乙酰葡糖胺)、增稠剂(诸如阿拉伯树胶)、酸度调节剂(诸如柠檬酸三钠)、水、脱脂乳和芳香剂。
在某些实施方案中,将所述生物产物(如例如含有Neu(n)Ac的寡糖)掺入人婴儿食品(例如,婴儿配方奶粉)中。婴儿配方奶粉通常是用于作为人母乳的完全或部分替代品来喂养婴儿的加工食品。在某些实施方案中,婴儿配方奶粉作为粉末出售并通过与水混合制备用于用奶瓶或杯子喂给婴儿。婴儿配方奶粉的组成通常被设计为大致模仿人母乳。在某些实施方案中,通过本说明书中的方法产生和/或纯化的生物产物(如例如含有Neu(n)Ac的寡糖)被包含在婴儿配方奶粉中以提供与人母乳中的寡糖所提供的营养益处类似的营养益处。在某些实施方案中,所述生物产物(如例如含有Neu(n)Ac的寡糖)与婴儿配方奶粉的一种或多种成分混合。婴儿配方奶粉成分的例子包括脱脂乳、碳水化合物源(例如,乳糖)、蛋白源(例如,乳清蛋白浓缩物和酪蛋白)、脂肪源(例如植物油——诸如棕榈油、高油酸红花油、菜籽油、椰子油和/或葵花籽油;和鱼油)、维生素(诸如维生素A、Bb、Bi2、C和D)、矿物质(诸如柠檬酸钾、柠檬酸钙、氯化镁、氯化钠、柠檬酸钠和磷酸钙)和可能的人乳寡糖(HMO)。这样的HMO可以包括,例如,DiFL、乳糖-N-三糖II、LNT、LNnT、乳糖-N-岩藻五糖I、乳糖-N-新岩藻五糖、乳糖-N-岩藻五糖II、乳糖-N-岩藻五糖III、乳糖-N-岩藻五糖V、乳糖-N-新岩藻五糖V、乳糖-N-二岩藻六糖I、乳糖-N-二岩藻六糖II、6’-半乳糖基乳糖、3’-半乳糖基乳糖、乳糖-N-六糖和乳糖-N-新六糖。
在某些实施方案中,所述一种或多种婴儿配方奶粉成分包含脱脂乳、碳水化合物源、蛋白源、脂肪源和/或维生素和矿物质。
在某些实施方案中,所述一种或多种婴儿配方奶粉成分包含乳糖、乳清蛋白浓缩物和/或高油酸红花油。
在某些实施方案中,在婴儿配方奶粉中的所述生物产物(如例如含有Neu(n)Ac的寡糖)的浓度与在人母乳中通常存在的生物产物的浓度大致相同。
在某些实施方案中,将所述生物产物掺入饲料制品中,其中所述饲料选自包含以下各项的列表:宠物食品、动物乳替代物、兽医产品、断奶后饲料或幼畜饲料。
如本文实施例中所示,新鉴定的Neu(n)Ac合酶已经被证实可用于所述生物产物(如例如含有Neu(n)Ac的化合物)的产生,优选发酵生产。当使用本文定义的Neu(n)Ac合酶时,本发明的方法和细胞优选地提供以下进一步惊人优点中的至少一种:
与具有相同遗传背景但缺乏同源和/或异源Neu(n)Ac合酶的表达和/或内源Neu(n)Ac合酶的(过)表达的含有Neu(n)Ac的化合物的生产宿主相比,
-高、优选更高的唾液酸化的含有Neu(n)Ac的化合物的滴度(g/L),
-高、优选更高的生产率r(g含有Neu(n)Ac的化合物/L/h),
-高、优选更高的细胞性能指标CPI(g含有Neu(n)Ac的化合物/g X),
-高、优选更高的比生产率Qp(g含有Neu(n)Ac的化合物/g X/h),
-高、优选更高的以蔗糖计算的产率Ys(g含有Neu(n)Ac的化合物/g蔗糖),
-高、优选更高的蔗糖摄取/转化率Qs(g蔗糖/g X/h),
-高、优选更高的乳糖转化/消耗率rs(g乳糖/h),
-高、优选更高的含有Neu(n)Ac的化合物的分泌,和/或
-高、优选更高的生产宿主的生长速度。
在本文中,“X”表示生物质,“g”表示克,“L”表示升,“h”表示小时。所述“g含有Neu(n)Ac的化合物”可以在整个培养液和/或上清液中测量。
除非另外定义,否则在本文中使用的所有技术和科学术语通常具有与本发明所属领域的普通技术人员通常理解的相同的含义。通常,本文使用的命名法以及在上文和在下文描述的细胞培养、分子遗传学、有机化学和核酸化学和杂交中的实验室程序是本领域中众所周知的和常用的那些。将标准技术用于核酸和肽合成。通常,根据制造商的说明书进行纯化步骤。
从具体实施方案和实施例中可以得出其它优点。不言而喻,上述特征和下文仍要解释的特征不仅可以以分别指定的组合使用,而且可以以其它组合或单独使用,而不脱离本发明的范围。
此外,本发明涉及下述具体实施方案:
1.用于产生下述列表中的生物产物的代谢工程改造的细胞,所述列表包括单糖、活化的单糖、磷酸化的单糖、二糖、寡糖、苷元、糖脂或糖蛋白,所述细胞包含用于所述生物产物的途径,
优选地,所述途径包含至少一种参与所述生物产物的产生的糖基转移酶。
2.根据实施方案1所述的细胞,其中所述生物产物是含有N-乙酰神经氨酸(Neu(n)Ac)的化合物,其中(n)为4、5、7、8或9或其组合,并且其中所述细胞在至少一种Neu(n)Ac合酶的表达或活性方面被修饰,所述Neu(n)Ac合酶具有Neu(n)Ac合酶活性,并且其具有PFAM结构域PF03102和/或PatricDB总体家族结构域PGF_06907304,并且
-其包含SEQ ID NO 01的序列:[ILMV][MST]XXXXX(X,非K)(X,非Q)XXXXXXXXXXXX(X,非I)XXX(X,非T)X[ACS][ST][AP][FWY]XXX(X,非G)X(X,非L)X[IL](X,非K)XXXX(X,非E)XXKXXS,其中X是任何氨基酸,或
-其包含SEQ ID NO 02、03、04、05、06、07、08、09、10、11、12、13、14、15、16、17或18中任一个所述的多肽序列,或
-其是SEQ ID NO 02、03、04、05、06、07、08、09、10、11、12、13、14、15、16、17或18中任一个的功能同系物、变体或衍生物,所述功能同系物、变体或衍生物分别与具有SEQ IDNO 02、03、04、05、06、07、08、09、10、11、12、13、14、15、16、17或18的所述多肽中任一种的全长具有至少80%总体序列同一性并且具有Neu(n)Ac合酶活性。
3.根据实施方案1或2中任一项所述的细胞,其中所述修饰包括过表达内源Neu(n)Ac合酶和/或引入并表达同源或异源Neu(n)Ac合酶。
4.根据实施方案1至3中任一项所述的细胞,其中所述Neu(n)Ac合酶以在一个或多个基因表达模块中被呈递给细胞,其中表达由一种或多种调控序列调节。
5.根据前述实施方案中任一项所述的细胞,其中所述表达模块整合到宿主细胞的基因组中和/或在载体上呈递给细胞,所述载体包括质粒、粘粒、噬菌体、脂质体或病毒,所述载体将被稳定地转化到所述宿主细胞中。
6.根据前述实施方案中任一项所述的细胞,其中产生所述含有Neu(n)Ac的化合物的所述途径包含至少一种选自包含以下各项的列表的酶:N-酰基葡糖胺2-差向异构酶,UDP-N-乙酰葡糖胺2-差向异构酶,N-乙酰甘露糖胺-6-磷酸2-差向异构酶,双功能的UDP-GlcNAc 2-差向异构酶/激酶,N-酰基神经氨酸-9-磷酸合成酶,磷酸酶,CMP唾液酸合酶,唾液酸转移酶。
7.根据实施方案6所述的细胞,其中所述N-酰基神经氨酸-9-磷酸合成酶是具有N-酰基神经氨酸-9-磷酸合成酶活性的多肽,并且其具有PFAM结构域PF03102和/或PatricDB总体家族结构域PGF_06907304,并且
-其包含SEQ ID NO 19的序列:[DE]XGXNHXGXXXXXXXMXXX[ACPS]XXXXXXXX[KR](Xa)[KR](Xb)[DE](Xc)KXXS,其中X是任何氨基酸,a是28至32,b是28至30,c是14至16,优选地其包含SEQ ID NO 20的序列:[DE]XGXNHXGXXXXXXXMXX(X,非I、L、M)[AS]XXXXXXXX[KR](Xa)[KR](Xb)[DE](Xc)KXXS,其中X是任何氨基酸,a是28至32,b是28至30,c是14至16,或
-其包含SEQ ID NO 21、22、23、24、25、26、27或28中任一个所述的多肽序列,或
-其是SEQ ID NO 21、22、23、24、25、26、27或28中任一个的功能同系物、变体或衍生物,所述功能同系物、变体或衍生物分别与具有SEQ ID NO 21、22、23、24、25、26、27或28的所述多肽中任一种的全长具有至少80%总体序列同一性并且具有N-酰基神经氨酸-9-磷酸合成酶活性。
8.根据实施方案6所述的细胞,其中所述磷酸酶是具有N-酰基神经氨酸-9-磷酸酶活性的HAD-样磷酸酶,并且
-包含SEQ ID NO 29的序列:DXDGXXTDXXXXXXXXGXXXXXXXXX DXXXXXXXXXXXXXXX[ILV]X[ST]XXXXXXXXXRXXXL(Xa)K(Xb)GXD XXD(Xc)GXGXXR[DE],其中X是任何氨基酸,a是10至11,b是21,c是32,或
-包含SEQ ID NO 31的序列:DXDXT[IL](Xa)TNGXXXXQXXK[IL](Xb)[KR]PXXX[IL][FWY](Xc)G[DN]XXXXD[ILV]XG,其中X是任何氨基酸,a是110至160,b是20至23,c是17。
9.根据前述实施方案中任一项所述的细胞,其中所述细胞能够合成N-乙酰甘露糖胺(ManNAc)、N-乙酰甘露糖胺-6-磷酸(ManNAc-6-磷酸)和/或磷酸烯醇丙酮酸(PEP)。
10.根据前述实施方案中任一项所述的细胞,其中所述细胞被修饰以增强PEP的合成和/或供应。
11.根据前述实施方案中任一项所述的细胞,其中所述细胞能够合成任何一种或多种核苷酸活化的糖。
12.根据实施方案11所述的细胞,其中所述核苷酸活化的糖选自包含以下各项的列表:UDP-N-乙酰葡糖胺(UDP-GlcNAc)、UDP-N-乙酰半乳糖胺(UDP-GalNAc)、UDP-N-乙酰甘露糖胺(UDP-ManNAc)、UDP-葡萄糖(UDP-Glc)、UDP-半乳糖(UDP-Gal)、GDP-甘露糖(GDP-Man)、UDP-葡糖醛酸、UDP-半乳糖醛酸、UDP-2-乙酰氨基-2,6-二脱氧--L-阿拉伯型-4-己酮糖、UDP-2-乙酰氨基-2,6-二脱氧--L-来苏-4-己酮糖、UDP-N-乙酰基-L-鼠李糖胺(UDP-L-RhaNAc或UDP-2-乙酰氨基-2,6-二脱氧-L-甘露糖)、dTDP-N-乙酰基岩藻糖胺、UDP-N-乙酰基岩藻糖胺(UDP-L-FucNAc或UDP-2-乙酰氨基-2,6-二脱氧-L-半乳糖)、UDP-N-乙酰基-L-纽莫糖胺(UDP-L-PneNAC或UDP-2-乙酰氨基-2,6-二脱氧-L-塔罗糖)、UDP-N-乙酰基胞壁酸、UDP-N-乙酰基-L-奎诺糖胺(UDP-L-QuiNAc或UDP-2-乙酰氨基-2,6-二脱氧-L-葡萄糖)、CMP-唾液酸(CMP-Neu5Ac)、CMP-N-羟乙酰神经氨酸(CMP-Neu5Gc)、GDP-岩藻糖(GDP-Fuc)、GDP-鼠李糖和UDP-木糖。
13.根据实施方案11或12所述的细胞,其中所述核苷酸活化的糖中的至少一种衍生自Neu(n)Ac,包括CMP-Neu4Ac、CMP-Neu5Ac、CMP-Neu5Ac9N3、CMP-Neu4,5Ac2、CMP-Neu5,7Ac2、CMP-Neu5,9Ac2、CMP-Neu5,7(8,9)Ac2和CMP-Neu5Gc。
14.根据实施方案11至13中任一项所述的细胞,其中所述细胞使用所述核苷酸活化的糖中的至少一种来产生所述含有Neu(n)Ac的化合物。
15.根据前述实施方案中任一项所述的细胞,其中所述糖基转移酶选自包含以下各项的列表:岩藻糖基转移酶,唾液酸转移酶,半乳糖基转移酶,葡萄糖基转移酶、甘露糖基转移酶、N-乙酰葡糖胺基转移酶、N-乙酰基半乳糖胺基转移酶、N-乙酰甘露糖胺基转移酶、木糖基转移酶、葡糖醛酸基转移酶、半乳糖醛酸转移酶、葡糖胺基转移酶、N-羟乙酰基神经氨酰基转移酶、鼠李糖基转移酶、N-乙酰基鼠李糖基转移酶、UDP-4-氨基-4,6-二脱氧-N-乙酰基-β-L-阿卓糖胺转氨酶、UDP-N-乙酰葡糖胺烯醇丙酮酰基转移酶和岩藻糖胺基转移酶,
-优选地,其中所述细胞在所述糖基转移酶中至少一种的表达或活性方面被修饰,
-优选地,所述岩藻糖基转移酶选自包含以下各项的列表:α-1,2-岩藻糖基转移酶,α-1,3-岩藻糖基转移酶,α-1,4-岩藻糖基转移酶和α-1,6-岩藻糖基转移酶,
-优选地,所述唾液酸转移酶选自包含以下各项的列表:α-2,3-唾液酸转移酶,α-2,6-唾液酸转移酶和α-2,8-唾液酸转移酶,
-优选地,所述半乳糖基转移酶选自包含以下各项的列表:β-1,3-半乳糖基转移酶,N-乙酰葡糖胺β-1,3-半乳糖基转移酶,β-1,4-半乳糖基转移酶,N-乙酰葡糖胺β-1,4-半乳糖基转移酶,α-1,3-半乳糖基转移酶和α-1,4-半乳糖基转移酶,
-优选地,所述葡糖醛酸基转移酶选自包含以下各项的列表:α-葡糖醛酸基转移酶,β-1,2-葡糖醛酸基转移酶,β-1,3-葡糖醛酸基转移酶和β-1,4-葡糖醛酸基转移酶,
-优选地,所述甘露糖基转移酶选自包含以下各项的列表:α-1,2-甘露糖基转移酶,α-1,3-甘露糖基转移酶和α-1,6-甘露糖基转移酶,
-优选地,所述N-乙酰葡糖胺基转移酶选自包含以下各项的列表:半乳糖苷β-1,3-N-乙酰葡糖胺基转移酶和β-1,6-N-乙酰葡糖胺基转移酶,
-优选地,所述N-乙酰半乳糖胺基转移酶选自包含α-1,3-N-乙酰半乳糖胺基转移酶的列表。
16.根据前述实施方案中任一项所述的细胞,其中所述细胞表达至少一种α-2,3-唾液酸转移酶,其具有α-2,3-唾液酸转移酶活性,并且
-是具有SEQ ID NO 80的来自多杀巴斯德氏菌(Pasteurella multocida)的多肽,或
-是268个氨基酸残基长的多肽,所述多肽为具有SEQ ID NO 80的多肽的功能同系物、变体或衍生物,所述功能同系物、变体或衍生物与具有SEQ ID NO 80的所述多肽的全长具有至少80%总体序列同一性并且具有α-2,3-唾液酸转移酶活性,
优选地,所述细胞在所述α-2,3-唾液酸转移酶中任一种的表达或活性方面被修饰。
17.根据前述实施方案中任一项所述的细胞,其中所述Neu(n)Ac合酶是Neu5Ac合酶,并且其中所述含有Neu(n)Ac的化合物是包含Neu5Ac的唾液酸化化合物。
18.根据前述实施方案中任一项所述的细胞,其中所述细胞包含岩藻糖基化途径,其包含至少一种选自包含以下各项的列表的酶:甘露糖-6-磷酸异构酶、磷酸甘露糖变位酶、甘露糖-1-磷酸鸟苷酰基转移酶、GDP-甘露糖4,6-脱水酶、GDP-L-岩藻糖合酶、岩藻糖通透酶、岩藻糖激酶、岩藻糖-1-磷酸鸟苷酰基转移酶、岩藻糖基转移酶。
19.根据前述实施方案中任一项所述的细胞,其中所述细胞包含半乳糖基化途径,其包含至少一种选自包含以下各项的列表的酶:半乳糖-1-差向异构酶、半乳糖激酶、葡糖激酶、半乳糖-1-磷酸尿苷酰基转移酶、UDP-葡萄糖4-差向异构酶、葡萄糖-1-磷酸尿苷酰基转移酶、磷酸葡萄糖变位酶、半乳糖基转移酶。
20.根据前述实施方案中任一项所述的细胞,其中所述细胞包含N-乙酰葡糖胺基化途径,其包含至少一种选自包含以下各项的列表的酶:L-谷氨酰胺-D-果糖-6-磷酸氨基转移酶、N-乙酰葡糖胺-6-磷酸脱乙酰酶、磷酸葡糖胺变位酶、N-乙酰葡糖胺-1-磷酸尿苷酰基转移酶/葡糖胺-1-磷酸乙酰基转移酶、N-乙酰葡糖胺基转移酶。
21.根据前述实施方案中任一项所述的细胞,其中所述细胞包含减少乙酸盐或酯产生的修饰。
22.根据前述实施方案中任一项所述的细胞,其中所述细胞还包含以下蛋白中的任何一种或多种的更低的或减少的表达和/或消除的、受损的、减少的或延迟的活性,所述蛋白包括β-半乳糖苷酶、半乳糖苷O-乙酰基转移酶、N-乙酰葡糖胺-6-磷酸脱乙酰酶、葡糖胺-6-磷酸脱氨酶、N-乙酰葡糖胺阻遏物、核糖核苷酸单磷酸酶、EIICBA-Nag、UDP-葡萄糖:十一异戊二烯基-磷酸葡萄糖-1-磷酸转移酶、L-墨角藻糖激酶、L-岩藻糖异构酶、N-乙酰神经氨酸裂合酶、N-乙酰甘露糖胺激酶、N-乙酰甘露糖胺-6-磷酸2-差向异构酶、EIIAB-Man、EIIC-Man、EIID-Man、ushA、半乳糖-1-磷酸尿苷酰基转移酶、葡萄糖-1-磷酸腺苷酰基转移酶、葡萄糖-1-磷酸酶、ATP依赖性的6-磷酸果糖激酶同工酶1、ATP依赖性的6-磷酸果糖激酶同工酶2、葡萄糖-6-磷酸异构酶、好氧性呼吸控制蛋白、转录阻遏物IclR、lon蛋白酶、葡萄糖特异性的转位磷酸转移酶IIBC组分ptsG、葡萄糖特异性的转位磷酸转移酶(PTS)酶IIBC组分malX、酶IIAGlc、β-葡萄糖苷特异性的PTS酶II、果糖特异性的PTS多磷酰基转移蛋白FruA和FruB、乙醇脱氢酶醛脱氢酶、丙酮酸-甲酸裂合酶、乙酸激酶、磷酸酰基转移酶、磷酸乙酰基转移酶、丙酮酸脱羧酶。
23.根据前述实施方案中任一项所述的细胞,其中所述细胞包含至少部分地灭活的所选单糖、二糖或寡糖的分解代谢途径,所选单糖、二糖或寡糖参与所述含有Neu(n)Ac的化合物的合成和/或是所述含有Neu(n)Ac的化合物的合成所必需的。
24.根据前述实施方案中任一项所述的细胞,其中所述细胞使用前体来合成所述生物产物,所述前体从培养基给料给所述细胞。
25.根据前述实施方案任一项所述的细胞,其中所述细胞产生用于合成所述生物产物的前体。
26.根据前述实施方案中任一项所述的细胞,其中所述细胞在整个培养液和/或上清液中产生90g/L或更多的所述生物产物,和/或其中所述含有Neu(n)Ac的化合物在整个培养液和/或上清液中具有至少80%的纯度,这按照分别在整个培养液和/或上清液中所述细胞产生的生物产物及其前体的总量进行测量。
27.根据前述实施方案中任一项所述的细胞,其中所述含有Neu(n)Ac的化合物选自由以下各项组成的列表:唾液酸、二糖、寡糖、糖脂和/或糖蛋白。
28.根据前述实施方案中任一项所述的细胞,其中所述寡糖选自包含以下各项的列表:乳寡糖、O-抗原、在荚膜多糖中存在的寡糖重复单位、肽聚糖、氨基-糖和Lewis-型抗原寡糖,优选地所述乳寡糖是哺乳动物乳寡糖,更优选地所述乳寡糖是人乳寡糖。
29.根据前述实施方案中任一项所述的细胞,其中所述细胞能够合成寡糖的混合物。
30.根据前述实施方案中任一项所述的细胞,其中所述细胞能够合成二糖和寡糖的混合物。
31.根据前述实施方案中任一项所述的细胞,其中所述细胞能够合成唾液酸、二糖和/或寡糖的混合物。
32.根据前述实施方案中任一项所述的细胞,其中所述细胞是细菌、真菌、酵母、植物细胞、动物细胞或原生动物细胞,
-优选地,所述细菌属于大肠杆菌菌株,更优选地属于作为K-12菌株的大肠杆菌菌株,甚至更优选地所述大肠杆菌K-12菌株是大肠杆菌MG1655,
-优选地,所述真菌属于选自包含以下各项的组的属:根霉菌属(Rhizopus)、盘基网柄菌属(Dictyostelium)、青霉属(Penicillium)、毛霉菌属(Mucor)或曲霉菌属(Aspergillus),
-优选地,所述酵母属于选自包含以下各项的组的属:酵母属(Saccharomyces)、接合酵母属(Zygosaccharomyces)、毕赤酵母属(Pichia)、驹形氏酵母(Komagataella)、汉逊酵母属(Hansenula)、耶氏酵母属(Yarrowia)、斯塔莫酵母(Starmerella)、克鲁维酵母属(Kluyveromyces)或德巴利酵母属(Debaromyces),
-优选地,所述植物细胞是藻类细胞或衍生自烟草、苜蓿、稻、番茄、棉花、油菜、大豆、玉蜀黍或玉米植物,
-优选地,所述动物细胞衍生自非人哺乳动物、鸟类、鱼类、无脊椎动物、爬行动物、两栖动物或昆虫,或是衍生自除胚胎干细胞外的人类细胞的遗传修饰的细胞系,更优选地,所述人和非人哺乳动物细胞是上皮细胞、胚肾细胞、成纤维细胞、COS细胞、中国仓鼠卵巢(CHO)细胞、鼠骨髓瘤细胞、NIH-3T3细胞、非乳腺成人干细胞或其衍生物,更优选地,所述昆虫细胞衍生自草地贪夜蛾(Spodoptera frugiperda)、家蚕(Bombyx mori)、甘蓝夜蛾(Mamestra brassicae)、粉纹夜蛾(Trichoplusia ni)或黑腹果蝇(Drosophilamelanogaster),
-优选地,所述原生动物细胞是蜥蜴利什曼原虫(Leishmania tarentolae)细胞。
33.根据前述实施方案中任一项所述的细胞,其中所述细胞在培养基中稳定地培养。
34.通过细胞产生生物产物的方法,所述方法包括下述步骤:
a)提供根据实施方案1至33中任一项所述的细胞,和
b)在允许产生所述生物产物的条件下培养所述细胞,
c)优选地,从培养物中分离所述生物产物,
优选地,其中所述生物产物是含有Neu(n)Ac的化合物。
35.根据实施方案34所述的方法,所述方法进一步包括下述步骤中的至少一个:
i)向在反应器中的培养基中加入至少一种前体和/或受体补料,其中总反应器体积的范围为250mL(毫升)至10.000m3(立方米),优选以连续方式加入,且优选使得所述培养基的终体积是在加入所述前体和/或受体补料之前培养基体积的不超过3倍、优选不超过2倍、更优选小于2倍;
ii)借助于补料溶液历时1天、2天、3天、4天、5天将至少一种前体和/或受体补料以连续方式加入所述培养基中;
iii)借助于补料溶液历时1天、2天、3天、4天、5天将至少一种前体和/或受体补料以连续方式加入所述培养基中,并且其中优选地,将所述补料溶液的pH设定在3至7,并且其中优选地,将所述补料溶液的温度保持在20℃至80℃;
所述方法产生在所述培养基的终体积中具有至少50g/L、优选至少75g/L、更优选至少90g/L、更优选至少100g/L、更优选至少125g/L、更优选至少150g/L、更优选至少175g/L、更优选至少200g/L的浓度的生物产物,优选地其中所述生物产物是含有Neu(n)Ac的化合物。
36.根据实施方案34所述的方法,所述方法进一步包括下述步骤中的至少一个:
i)向培养基中加入乳糖补料,其包含至少50、更优选至少75、更优选至少100、更优选至少120、更优选至少150克乳糖/升初始反应器体积,其中所述反应器体积的范围为250mL至10.000m3(立方米),优选以连续方式加入,且优选使得所述培养基的终体积是在加入所述乳糖补料之前培养基体积的不超过3倍、优选不超过2倍、更优选小于2倍;
ii)借助于补料溶液历时1天、2天、3天、4天、5天以连续方式向所述培养基中加入乳糖补料;
iii)借助于补料溶液历时1天、2天、3天、4天、5天以连续方式向所述培养基中加入乳糖补料,且其中所述乳糖补料溶液的浓度是50g/L、优选75g/L、更优选100g/L、更优选125g/L、更优选150g/L、更优选175g/L、更优选200g/L、更优选225g/L、更优选250g/L、更优选275g/L、更优选300g/L、更优选325g/L、更优选350g/L、更优选375g/L、更优选400g/L、更优选450g/L、更优选500g/L、甚至更优选550g/L、最优选600g/L;且其中优选地将所述溶液的pH设定在3至7,并且其中优选地将所述补料溶液的温度保持在20℃至80℃;
所述方法导致从所述乳糖产生的生物产物,所述生物产物在所述培养基的终体积中具有至少50g/L、优选至少75g/L、更优选至少90g/L、更优选至少100g/L、更优选至少125g/L、更优选至少150g/L、更优选至少175g/L、更优选至少200g/L的浓度,
优选地,其中从所述乳糖产生的所述生物产物包含一个或多个Neu(n)Ac分子。
37.根据实施方案36所述的方法,其中通过从培养开始以至少5mM的浓度、优选以30、40、50、60、70、80、90、100、150mM的浓度、更优选以>300mM的浓度添加乳糖来完成乳糖补料。
38.根据实施方案36或37所述的方法,其中通过以一定浓度将乳糖加入培养基中,使得在整个培养的生产阶段中获得至少5mM、优选10mM或30mM的乳糖浓度,完成所述乳糖补料。
39.根据实施方案34至38中任一项所述的方法,其中将所述宿主细胞培养至少约60、80、100或约120小时或以连续方式培养。
40.根据实施方案34至39中任一项所述的方法,其中将所述细胞在培养基中培养,所述培养基包含:碳源,其包含单糖、二糖、寡糖、多糖、多元醇、甘油;复合培养基,其包括糖蜜、玉米浆、蛋白胨、胰蛋白胨或酵母提取物;优选地,其中所述碳源选自包含以下各项的列表:葡萄糖、甘油、果糖、蔗糖、麦芽糖、乳糖、阿拉伯糖、麦芽寡糖、麦芽三糖、山梨醇、木糖、鼠李糖、半乳糖、甘露糖、甲醇、乙醇、海藻糖、淀粉、纤维素、半纤维素、糖蜜、玉米浆、高果糖糖浆、乙酸盐、柠檬酸盐、乳酸盐和丙酮酸盐。
41.根据实施方案34至40中的任一项所述的方法,其中所述细胞使用至少一种前体来合成所述生物产物,优选地所述细胞使用两种或更多种前体来合成所述生物产物。
42.根据实施方案34至41中的任一项所述的方法,其中所述培养基含有至少一种选自包括以下各项的组的化合物:乳糖、半乳糖、唾液酸、岩藻糖、GlcNAc、GalNAc、乳糖-N-二糖(LNB)、N-乙酰基乳糖胺(LacNAc)。
43.根据实施方案34至42中的任一项所述的方法,其中通过向所述培养基中添加基于碳的底物、优选葡萄糖或蔗糖来提供指数细胞生长的第一阶段,然后在第二阶段将乳糖加入所述培养基中。
44.根据实施方案34至43中的任一项所述的方法,其中所述细胞产生至少一种用于合成所述生物产物的前体。
45.根据实施方案34至44中的任一项所述的方法,其中用于合成所述生物产物的所述前体被完全转化为所述生物产物。
46.根据实施方案34至45中的任一项所述的方法,其中将所述生物产物与所述培养基和/或所述细胞分离。
47.根据实施方案34至46中的任一项所述的方法,其中所述分离包括下述步骤中的至少一个:澄清、超滤、纳米过滤、两相分配、反渗透、微滤、活性炭或碳处理、用非离子表面活性剂处理、酶消化、切向流高效过滤、切向流超滤、电泳、亲和色谱法、离子交换色谱法、疏水相互作用色谱法和/或凝胶过滤、配体交换色谱法。
48.根据实施方案34至47中的任一项所述的方法,其中所述方法进一步包括所述生物产物的纯化。
49.根据实施方案48所述的方法,其中所述纯化包括下述步骤中的至少一个:使用活性炭或碳、使用木炭、纳米过滤、超滤、电泳、酶处理或离子交换、使用醇、使用水性醇混合物、结晶、蒸发、沉淀、干燥、喷雾干燥或冻干。
50.实施方案1至33中任一项所述的细胞用于产生生物产物的用途。
51.实施方案1至33中任一项所述的细胞用于产生含有Neu(n)Ac的化合物的用途,其中(n)为4、5、7、8或9或其组合。
52.实施方案34至49中任一项所述的方法用于产生生物产物的用途。
53.实施方案34至49中任一项所述的方法用于产生含有Neu(n)Ac的化合物的用途,其中(n)为4、5、7、8或9或其组合。
此外,本发明涉及下述优选的具体实施方案:
1.用于产生下述列表中的生物产物的代谢工程改造的细胞,所述列表包括单糖、活化的单糖、磷酸化的单糖、二糖、寡糖、苷元、糖脂或糖蛋白,所述细胞包含用于所述生物产物的途径,
优选地,所述途径包含至少一种参与所述生物产物的产生的糖基转移酶。
2.根据实施方案1所述的细胞,其中所述生物产物是含有N-乙酰神经氨酸(Neu(n)Ac)的化合物,其中(n)为4、5、7、8或9或其组合,并且其中所述细胞在至少一种Neu(n)Ac合酶的表达或活性方面被修饰、优选已被修饰,并且所述Neu(n)Ac合酶具有Neu(n)Ac合酶活性,并且其具有PFAM结构域PF03102和/或PatricDB总体家族结构域PGF_06907304,并且其包含SEQ ID NO 01的序列:[ILMV][MST]XXXXX(X,非K)(X,非Q)XXXXXXXXXXXX(X,非I)XXX(X,非T)X[ACS][ST][AP][FWY]XXX(X,非G)X(X,非L)X[IL](X,非K)XXXX(X,非E)XXKXXS,其中X是任何氨基酸。
3.根据实施方案1或2所述的细胞,其中所述生物产物是含有N-乙酰神经氨酸(Neu(n)Ac)的化合物,其中(n)为4、5、7、8或9或其组合,并且其中所述细胞在至少一种Neu(n)Ac合酶的表达或活性方面被修饰、优选已被修饰,所述Neu(n)Ac合酶具有Neu(n)Ac合酶活性,并且其具有PFAM结构域PF03102和/或PatricDB总体家族结构域PGF_06907304,并且
-包含SEQ ID NO 02、03、04、05、06、07、08、09、10、11、12、13、14、15、16、17或18中任一个所述的多肽序列或由其组成,或
-是SEQ ID NO 02、03、04、05、06、07、08、09、10、11、12、13、14、15、16、17或18中任一个的功能同系物、变体、衍生物或功能片段,优选是功能同系物或功能片段,更优选是功能同系物,其分别与具有SEQ ID NO 02、03、04、05、06、07、08、09、10、11、12、13、14、15、16、17或18的所述多肽中任一种的全长具有至少80%、优选至少85%、更优选至少90%、甚至更优选至少95%、最优选至少97%总体序列同一性并且具有Neu(n)Ac合酶活性。
4.根据实施方案1至3中任一项所述的细胞,其中所述生物产物是含有N-乙酰神经氨酸(Neu(n)Ac)的化合物,其中(n)为4、5、7、8或9或其组合,并且其中所述细胞在至少一种Neu(n)Ac合酶的表达或活性方面被修饰、优选已被修饰,所述Neu(n)Ac合酶具有Neu(n)Ac合酶活性,并且其具有PFAM结构域PF03102和/或PatricDB总体家族结构域PGF_06907304,并且
-包含SEQ ID NO 02、03、04、05、06、07、08、09、10、11、12、13、14、15、16、17或18中任一个所述的多肽序列或由其组成,或
-是SEQ ID NO 02、03、04、05、06、07、08、09、10、11、12、13、14、15、16、17或18中任一个的功能同系物、变体、衍生物或功能片段,优选是功能同系物或功能片段,更优选是功能同系物,所述功能同系物、变体、衍生物或功能片段分别与具有SEQ ID NO 02、03、04、05、06、07、08、09、10、11、12、13、14、15、16、17或18的所述多肽中任一种的全长具有至少85%、优选至少90%、更优选至少95%、甚至更优选至少97%总体序列同一性并且具有Neu(n)Ac合酶活性。
5.根据实施方案1至4中任一项所述的细胞,其中所述修饰包括过表达内源Neu(n)Ac合酶和/或引入并表达同源或异源Neu(n)Ac合酶。
6.根据实施方案1至5中任一项所述的细胞,其中所述Neu(n)Ac合酶以在一个或多个基因表达模块中被呈递给细胞,其中表达由一种或多种调控序列调节。
7.根据实施方案1至6中任一项所述的细胞,其中所述表达模块整合到宿主细胞的基因组中和/或在载体上呈递给细胞,所述载体包括质粒、粘粒、噬菌体、脂质体或病毒,所述载体将被稳定地转化到所述宿主细胞中。
8.根据实施方案1至7中任一项所述的细胞,其中产生所述含有Neu(n)Ac的化合物的所述途径包含至少一种选自包含以下各项的列表的酶:N-酰基葡糖胺2-差向异构酶,UDP-N-乙酰葡糖胺2-差向异构酶,N-乙酰甘露糖胺-6-磷酸2-差向异构酶,双功能的UDP-GlcNAc 2-差向异构酶/激酶,N-酰基神经氨酸-9-磷酸合成酶,磷酸酶,CMP唾液酸合酶,唾液酸转移酶。
9.根据实施方案8所述的细胞,其中所述N-酰基神经氨酸-9-磷酸合成酶是具有N-酰基神经氨酸-9-磷酸合成酶活性的多肽,并且其具有PFAM结构域PF03102和/或PatricDB总体家族结构域PGF_06907304,并且其包含SEQ ID NO 19的序列:[DE]XGXNHXGXXXXXXXMXXX[ACPS]XXXXXXXX[KR](Xa)[KR](Xb)[DE](Xc)KXXS,其中X是任何氨基酸,a是28至32,b是28至30,c是14至16,优选地其包含SEQ ID NO 20的序列:[DE]XGXNHXGXXXXXXXMXX(X,非I、L、M)[AS]XXXXXXXX[KR](Xa)[KR](Xb)[DE](Xc)KXXS,其中X是任何氨基酸,a是28至32,b是28至30,c是14至16。
10.根据实施方案8或9所述的细胞,其中所述N-酰基神经氨酸-9-磷酸合成酶是具有N-酰基神经氨酸-9-磷酸合成酶活性的多肽,并且其具有PFAM结构域PF03102和/或PatricDB总体家族结构域PGF_06907304,并且
-包含SEQ ID NO 21、22、23、24、25、26、27或28中任一个所述的多肽序列或由其组成,或
-是SEQ ID NO 21、22、23、24、25、26、27或28中任一个的功能同系物、变体、衍生物或功能片段,优选是功能同系物或功能片段,更优选是功能同系物,所述功能同系物、变体、衍生物或功能片段分别与具有SEQ ID NO 21、22、23、24、25、26、27或28的所述多肽中任一种的全长具有至少80%、优选至少85%、更优选至少90%、甚至更优选至少95%、最优选至少97%总体序列同一性并且具有N-酰基神经氨酸-9-磷酸合成酶活性。
11.根据实施方案8所述的细胞,其中所述磷酸酶是具有N-酰基神经氨酸-9-磷酸酶活性的HAD-样磷酸酶,并且
-包含SEQ ID NO 29的序列:DXDGXXTDXXXXXXXXGXXXXXXXXX DXXXXXXXXXXXXXXX[ILV]X[ST]XXXXXXXXXRXXXL(Xa)K(Xb)GXD XXD(Xc)GXGXXR[DE],其中X是任何氨基酸,a是10至11,b是21,c是32,或
-包含SEQ ID NO 31的序列:DXDXT[IL](Xa)TNGXXXXQXXK[IL](Xb)[KR]PXXX[IL][FWY](Xc)G[DN]XXXXD[ILV]XG,其中X是任何氨基酸,a是110至160,b是20至23,c是17。
12.根据实施方案1至11中任一项所述的细胞,其中所述细胞能够合成N-乙酰甘露糖胺(ManNAc)、N-乙酰甘露糖胺-6-磷酸(ManNAc-6-磷酸)和/或磷酸烯醇丙酮酸(PEP)。
13.根据实施方案1至12中任一项所述的细胞,其中所述细胞被修饰以增强PEP的合成和/或供应。
14.根据实施方案1至13中任一项所述的细胞,其中所述细胞能够合成任何一种或多种核苷酸活化的糖。
15.根据实施方案14所述的细胞,其中所述核苷酸活化的糖选自包含以下各项的列表:UDP-N-乙酰葡糖胺(UDP-GlcNAc)、UDP-N-乙酰半乳糖胺(UDP-GalNAc)、UDP-N-乙酰甘露糖胺(UDP-ManNAc)、UDP-葡萄糖(UDP-Glc)、UDP-半乳糖(UDP-Gal)、GDP-甘露糖(GDP-Man)、UDP-葡糖醛酸、UDP-半乳糖醛酸、UDP-2-乙酰氨基-2,6-二脱氧--L-阿拉伯型-4-己酮糖、UDP-2-乙酰氨基-2,6-二脱氧--L-来苏-4-己酮糖、UDP-N-乙酰基-L-鼠李糖胺(UDP-L-RhaNAc或UDP-2-乙酰氨基-2,6-二脱氧-L-甘露糖)、dTDP-N-乙酰基岩藻糖胺、UDP-N-乙酰基岩藻糖胺(UDP-L-FucNAc或UDP-2-乙酰氨基-2,6-二脱氧-L-半乳糖)、UDP-N-乙酰基-L-纽莫糖胺(UDP-L-PneNAC或UDP-2-乙酰氨基-2,6-二脱氧-L-塔罗糖)、UDP-N-乙酰基胞壁酸、UDP-N-乙酰基-L-奎诺糖胺(UDP-L-QuiNAc或UDP-2-乙酰氨基-2,6-二脱氧-L-葡萄糖)、CMP-唾液酸(CMP-Neu5Ac)、CMP-N-羟乙酰神经氨酸(CMP-Neu5Gc)、GDP-岩藻糖(GDP-Fuc)、GDP-鼠李糖和UDP-木糖。
16.根据实施方案14或15所述的细胞,其中所述核苷酸活化的糖中的至少一种衍生自Neu(n)Ac,包括CMP-Neu4Ac、CMP-Neu5Ac、CMP-Neu5Ac9N3、CMP-Neu4,5Ac2、CMP-Neu5,7Ac2、CMP-Neu5,9Ac2、CMP-Neu5,7(8,9)Ac2和CMP-Neu5Gc。
17.根据实施方案14至16中任一项所述的细胞,其中所述细胞使用所述核苷酸活化的糖中的至少一种来产生所述含有Neu(n)Ac的化合物。
18.根据实施方案1至17中任一项所述的细胞,其中所述糖基转移酶选自包含以下各项的列表:岩藻糖基转移酶,唾液酸转移酶,半乳糖基转移酶,葡萄糖基转移酶、甘露糖基转移酶、N-乙酰葡糖胺基转移酶、N-乙酰基半乳糖胺基转移酶、N-乙酰甘露糖胺基转移酶、木糖基转移酶、葡糖醛酸基转移酶、半乳糖醛酸转移酶、葡糖胺基转移酶、N-羟乙酰基神经氨酰基转移酶、鼠李糖基转移酶、N-乙酰基鼠李糖基转移酶、UDP-4-氨基-4,6-二脱氧-N-乙酰基-β-L-阿卓糖胺转氨酶、UDP-N-乙酰葡糖胺烯醇丙酮酰基转移酶和岩藻糖胺基转移酶,
-优选地,其中所述细胞在所述糖基转移酶中至少一种的表达或活性方面被修饰,
-优选地,所述岩藻糖基转移酶选自包含以下各项的列表:α-1,2-岩藻糖基转移酶,α-1,3-岩藻糖基转移酶,α-1,4-岩藻糖基转移酶和α-1,6-岩藻糖基转移酶,
-优选地,所述唾液酸转移酶选自包含以下各项的列表:α-2,3-唾液酸转移酶,α-2,6-唾液酸转移酶和α-2,8-唾液酸转移酶,
-优选地,所述半乳糖基转移酶选自包含以下各项的列表:β-1,3-半乳糖基转移酶,N-乙酰葡糖胺β-1,3-半乳糖基转移酶,β-1,4-半乳糖基转移酶,N-乙酰葡糖胺β-1,4-半乳糖基转移酶,α-1,3-半乳糖基转移酶和α-1,4-半乳糖基转移酶,
-优选地,所述葡糖醛酸基转移酶选自包含以下各项的列表:α-葡糖醛酸基转移酶,β-1,2-葡糖醛酸基转移酶,β-1,3-葡糖醛酸基转移酶和β-1,4-葡糖醛酸基转移酶,
-优选地,所述甘露糖基转移酶选自包含以下各项的列表:α-1,2-甘露糖基转移酶,α-1,3-甘露糖基转移酶和α-1,6-甘露糖基转移酶,
-优选地,所述N-乙酰葡糖胺基转移酶选自包含以下各项的列表:半乳糖苷β-1,3-N-乙酰葡糖胺基转移酶和β-1,6-N-乙酰葡糖胺基转移酶,
-优选地,所述N-乙酰半乳糖胺基转移酶选自包含α-1,3-N-乙酰半乳糖胺基转移酶的列表。
19.根据实施方案1至18中任一项所述的细胞,其中所述细胞表达至少一种α-2,3-唾液酸转移酶,其具有α-2,3-唾液酸转移酶活性,并且
-是具有SEQ ID NO 80的来自多杀巴斯德氏菌(Pasteurella multocida)的多肽,或
-是268个氨基酸残基长的多肽,所述多肽为具有SEQ ID NO 80的多肽的功能同系物、变体、衍生物或功能片段,优选是功能同系物或功能片段,更优选是功能同系物,所述功能同系物、变体、衍生物或功能片段与具有SEQ ID NO 80的所述多肽的全长具有至少80%、优选至少85%、更优选至少90%、甚至更优选至少95%、最优选至少97%总体序列同一性并且具有α-2,3-唾液酸转移酶活性,
优选地,所述细胞在所述α-2,3-唾液酸转移酶中任一种的表达或活性方面被修饰。
20.根据实施方案1至19中任一项所述的细胞,其中所述Neu(n)Ac合酶是Neu5Ac合酶,并且其中所述含有Neu(n)Ac的化合物是包含Neu5Ac的唾液酸化化合物。
21.根据实施方案1至20中任一项所述的细胞,其中所述细胞包含岩藻糖基化途径,其包含至少一种选自包含以下各项的列表的酶:甘露糖-6-磷酸异构酶、磷酸甘露糖变位酶、甘露糖-1-磷酸鸟苷酰基转移酶、GDP-甘露糖4,6-脱水酶、GDP-L-岩藻糖合酶、岩藻糖通透酶、岩藻糖激酶、岩藻糖-1-磷酸鸟苷酰基转移酶、岩藻糖基转移酶。
22.根据实施方案1至21中任一项所述的细胞,其中所述细胞包含半乳糖基化途径,其包含至少一种选自包含以下各项的列表的酶:半乳糖-1-差向异构酶、半乳糖激酶、葡糖激酶、半乳糖-1-磷酸尿苷酰基转移酶、UDP-葡萄糖4-差向异构酶、葡萄糖-1-磷酸尿苷酰基转移酶、磷酸葡萄糖变位酶、半乳糖基转移酶。
23.根据实施方案1至22中任一项所述的细胞,其中所述细胞包含N-乙酰葡糖胺基化途径,其包含至少一种选自包含以下各项的列表的酶:L-谷氨酰胺-D-果糖-6-磷酸氨基转移酶、N-乙酰葡糖胺-6-磷酸脱乙酰酶、磷酸葡糖胺变位酶、N-乙酰葡糖胺-1-磷酸尿苷酰基转移酶/葡糖胺-1-磷酸乙酰基转移酶、N-乙酰葡糖胺基转移酶。
24.根据实施方案1至23中任一项所述的细胞,其中所述细胞包含减少乙酸盐或酯产生的修饰。
25.根据实施方案1至24中任一项所述的细胞,其中所述细胞还包含以下蛋白中的任何一种或多种的更低的或减少的表达和/或消除的、受损的、减少的或延迟的活性,所述蛋白包括β-半乳糖苷酶、半乳糖苷O-乙酰基转移酶、N-乙酰葡糖胺-6-磷酸脱乙酰酶、葡糖胺-6-磷酸脱氨酶、N-乙酰葡糖胺阻遏物、核糖核苷酸单磷酸酶、EIICBA-Nag、UDP-葡萄糖:十一异戊二烯基-磷酸葡萄糖-1-磷酸转移酶、L-墨角藻糖激酶、L-岩藻糖异构酶、N-乙酰神经氨酸裂合酶、N-乙酰甘露糖胺激酶、N-乙酰甘露糖胺-6-磷酸2-差向异构酶、EIIAB-Man、EIIC-Man、EIID-Man、ushA、半乳糖-1-磷酸尿苷酰基转移酶、葡萄糖-1-磷酸腺苷酰基转移酶、葡萄糖-1-磷酸酶、ATP依赖性的6-磷酸果糖激酶同工酶1、ATP依赖性的6-磷酸果糖激酶同工酶2、葡萄糖-6-磷酸异构酶、好氧性呼吸控制蛋白、转录阻遏物IclR、lon蛋白酶、葡萄糖特异性的转位磷酸转移酶IIBC组分ptsG、葡萄糖特异性的转位磷酸转移酶(PTS)酶IIBC组分malX、酶IIAGlc、β-葡萄糖苷特异性的PTS酶II、果糖特异性的PTS多磷酰基转移蛋白FruA和FruB、乙醇脱氢酶醛脱氢酶、丙酮酸-甲酸裂合酶、乙酸激酶、磷酸酰基转移酶、磷酸乙酰基转移酶、丙酮酸脱羧酶。
26.根据实施方案1至25中任一项所述的细胞,其中所述细胞包含至少部分地灭活的所选单糖、二糖或寡糖的分解代谢途径,所选单糖、二糖或寡糖参与所述含有Neu(n)Ac的化合物的合成和/或是所述含有Neu(n)Ac的化合物的合成所必需的。
27.根据实施方案1至26中任一项所述的细胞,其中所述细胞使用前体来合成所述生物产物,所述前体从培养基给料给所述细胞。
28.根据实施方案1至27中任一项所述的细胞,其中所述细胞产生用于合成所述生物产物的前体。
29.根据实施方案1至28中任一项所述的细胞,其中所述细胞在整个培养液和/或上清液中产生90g/L或更多的所述生物产物,和/或其中所述含有Neu(n)Ac的化合物在整个培养液和/或上清液中具有至少80%的纯度,这按照分别在整个培养液和/或上清液中所述细胞产生的生物产物及其前体的总量进行测量。
30.根据实施方案1至29中任一项所述的细胞,其中所述含有Neu(n)Ac的化合物选自由以下各项组成的列表:唾液酸、二糖、寡糖、糖脂和/或糖蛋白,优选地选自由以下各项组成的列表:唾液酸、二糖、寡糖和/或糖脂,更优选地选自由以下各项组成的列表:唾液酸、二糖和/或寡糖。
31.根据实施方案1至30中任一项所述的细胞,其中所述寡糖选自包含以下各项的列表:乳寡糖、O-抗原、在荚膜多糖中存在的寡糖重复单位、肽聚糖、氨基-糖和Lewis-型抗原寡糖,优选地所述乳寡糖是哺乳动物乳寡糖(MMO),更优选地所述乳寡糖是人乳寡糖(HMO)。
32.根据实施方案1至31中任一项所述的细胞,其中所述细胞能够合成寡糖的混合物。
33.根据实施方案1至32中任一项所述的细胞,其中所述细胞能够合成二糖和寡糖的混合物。
34.根据实施方案1至33中任一项所述的细胞,其中所述细胞能够合成唾液酸、二糖和/或寡糖的混合物。
35.根据实施方案1至34中任一项所述的细胞,其中所述细胞是细菌、真菌、酵母、植物细胞、动物细胞或原生动物细胞,
-优选地,所述细菌属于大肠杆菌菌株,更优选地属于作为K-12菌株的大肠杆菌菌株,甚至更优选地所述大肠杆菌K-12菌株是大肠杆菌MG1655,
-优选地,所述真菌属于选自包含以下各项的组的属:根霉菌属(Rhizopus)、盘基网柄菌属(Dictyostelium)、青霉属(Penicillium)、毛霉菌属(Mucor)或曲霉菌属(Aspergillus),
-优选地,所述酵母属于选自包含以下各项的组的属:酵母属(Saccharomyces)、接合酵母属(Zygosaccharomyces)、毕赤酵母属(Pichia)、驹形氏酵母(Komagataella)、汉逊酵母属(Hansenula)、耶氏酵母属(Yarrowia)、斯塔莫酵母(Starmerella)、克鲁维酵母属(Kluyveromyces)或德巴利酵母属(Debaromyces),
-优选地,所述植物细胞是藻类细胞或衍生自烟草、苜蓿、稻、番茄、棉花、油菜、大豆、玉蜀黍或玉米植物,
-优选地,所述动物细胞衍生自非人哺乳动物、鸟类、鱼类、无脊椎动物、爬行动物、两栖动物或昆虫,或是衍生自除胚胎干细胞外的人类细胞的遗传修饰的细胞系,更优选地,所述人和非人哺乳动物细胞是上皮细胞、胚肾细胞、成纤维细胞、COS细胞、中国仓鼠卵巢(CHO)细胞、鼠骨髓瘤细胞、NIH-3T3细胞、非乳腺成人干细胞或其衍生物,更优选地,所述昆虫细胞衍生自草地贪夜蛾(Spodoptera frugiperda)、家蚕(Bombyx mori)、甘蓝夜蛾(Mamestra brassicae)、粉纹夜蛾(Trichoplusia ni)或黑腹果蝇(Drosophilamelanogaster),
-优选地,所述原生动物细胞是蜥蜴利什曼原虫(Leishmania tarentolae)细胞。
36.根据实施方案1至35中任一项所述的细胞,其中所述细胞在培养基中稳定地培养。
37.通过细胞产生生物产物的方法,所述方法包括下述步骤:
a)提供根据实施方案1至36中任一项所述的细胞,和
b)在允许产生所述生物产物的条件下培养所述细胞,
c)优选地,从培养物中分离所述生物产物,
优选地,其中所述生物产物是含有Neu(n)Ac的化合物。
38.根据实施方案37所述的方法,所述方法进一步包括下述步骤中的至少一个:
i)向在反应器中的培养基中加入至少一种前体和/或受体补料,其中总反应器体积的范围为250mL(毫升)至10.000m3(立方米),优选以连续方式加入,且优选使得所述培养基的终体积是在加入所述前体和/或受体补料之前培养基体积的不超过3倍、优选不超过2倍、更优选小于2倍;
ii)借助于补料溶液历时1天、2天、3天、4天、5天将至少一种前体和/或受体补料以连续方式加入所述培养基中;
iii)借助于补料溶液历时1天、2天、3天、4天、5天将至少一种前体和/或受体补料以连续方式加入所述培养基中,并且其中优选地,将所述补料溶液的pH设定在3至7,并且其中优选地,将所述补料溶液的温度保持在20℃至80℃;
所述方法产生在所述培养基的终体积中具有至少50g/L、优选至少75g/L、更优选至少90g/L、更优选至少100g/L、更优选至少125g/L、更优选至少150g/L、更优选至少175g/L、更优选至少200g/L的浓度的生物产物,优选地其中所述生物产物是含有Neu(n)Ac的化合物。
39.根据实施方案38所述的方法,所述方法进一步包括下述步骤中的至少一个:
i)向培养基中加入乳糖补料,其包含至少50、更优选至少75、更优选至少100、更优选至少120、更优选至少150克乳糖/升初始反应器体积,其中所述反应器体积的范围为250mL至10.000m3(立方米),优选以连续方式加入,且优选使得所述培养基的终体积是在加入所述乳糖补料之前培养基体积的不超过3倍、优选不超过2倍、更优选小于2倍;
ii)借助于补料溶液历时1天、2天、3天、4天、5天以连续方式向所述培养基中加入乳糖补料;
iii)借助于补料溶液历时1天、2天、3天、4天、5天以连续方式向所述培养基中加入乳糖补料,且其中所述乳糖补料溶液的浓度是50g/L、优选75g/L、更优选100g/L、更优选125g/L、更优选150g/L、更优选175g/L、更优选200g/L、更优选225g/L、更优选250g/L、更优选275g/L、更优选300g/L、更优选325g/L、更优选350g/L、更优选375g/L、更优选400g/L、更优选450g/L、更优选500g/L、甚至更优选550g/L、最优选600g/L;且其中优选地将所述溶液的pH设定在3至7,并且其中优选地将所述补料溶液的温度保持在20℃至80℃;
所述方法导致从所述乳糖产生的生物产物,所述生物产物在所述培养基的终体积中具有至少50g/L、优选至少75g/L、更优选至少90g/L、更优选至少100g/L、更优选至少125g/L、更优选至少150g/L、更优选至少175g/L、更优选至少200g/L的浓度,
优选地,其中从所述乳糖产生的所述生物产物包含一个或多个Neu(n)Ac分子。
40.根据实施方案39所述的方法,其中通过从培养开始以至少5mM的浓度、优选以30、40、50、60、70、80、90、100、150mM的浓度、更优选以>300mM的浓度添加乳糖来完成乳糖补料。
41.根据实施方案39或40所述的方法,其中通过以一定浓度将乳糖加入培养基中,使得在整个培养的生产阶段中获得至少5mM、优选10mM或30mM的乳糖浓度,完成所述乳糖补料。
42.根据实施方案37至41中任一项所述的方法,其中将所述宿主细胞培养至少约60、80、100或约120小时或以连续方式培养。
43.根据实施方案37至42中任一项所述的方法,其中将所述细胞在培养基中培养,所述培养基包含:碳源,其包含单糖、二糖、寡糖、多糖、多元醇、甘油;复合培养基,其包括糖蜜、玉米浆、蛋白胨、胰蛋白胨或酵母提取物;优选地,其中所述碳源选自包含以下各项的列表:葡萄糖、甘油、果糖、蔗糖、麦芽糖、乳糖、阿拉伯糖、麦芽寡糖、麦芽三糖、山梨醇、木糖、鼠李糖、半乳糖、甘露糖、甲醇、乙醇、海藻糖、淀粉、纤维素、半纤维素、糖蜜、玉米浆、高果糖糖浆、乙酸盐、柠檬酸盐、乳酸盐和丙酮酸盐。
44.根据实施方案37至43中的任一项所述的方法,其中所述细胞使用至少一种前体来合成所述生物产物,优选地所述细胞使用两种或更多种前体来合成所述生物产物。
45.根据实施方案37至44中的任一项所述的方法,其中所述培养基含有至少一种选自包括以下各项的组的化合物:乳糖、半乳糖、唾液酸、岩藻糖、GlcNAc、GalNAc、乳糖-N-二糖(LNB)、N-乙酰基乳糖胺(LacNAc)。
46.根据实施方案37至45中的任一项所述的方法,其中通过向所述培养基中添加基于碳的底物、优选葡萄糖或蔗糖来提供指数细胞生长的第一阶段,然后在第二阶段将乳糖加入所述培养基中。
47.根据实施方案37至46中的任一项所述的方法,其中所述细胞产生至少一种用于合成所述生物产物的前体。
48.根据实施方案37至47中的任一项所述的方法,其中用于合成所述生物产物的所述前体被完全转化为所述生物产物。
49.根据实施方案37至48中的任一项所述的方法,其中将所述生物产物与所述培养基和/或所述细胞分离。
50.根据实施方案37至49中的任一项所述的方法,其中所述分离包括下述步骤中的至少一个:澄清、超滤、纳米过滤、两相分配、反渗透、微滤、活性炭或碳处理、用非离子表面活性剂处理、酶消化、切向流高效过滤、切向流超滤、电泳、亲和色谱法、离子交换色谱法、疏水相互作用色谱法和/或凝胶过滤、配体交换色谱法。
51.根据实施方案37至50中的任一项所述的方法,其中所述方法进一步包括所述生物产物的纯化。
52.根据实施方案51所述的方法,其中所述纯化包括下述步骤中的至少一个:使用活性炭或碳、使用木炭、纳米过滤、超滤、电泳、酶处理或离子交换、使用醇、使用水性醇混合物、结晶、蒸发、沉淀、干燥、喷雾干燥或冻干。
53.实施方案1至36中任一项所述的细胞用于产生生物产物的用途。
54.实施方案1至36中任一项所述的细胞用于产生含有Neu(n)Ac的化合物的用途,其中(n)为4、5、7、8或9或其组合。
55.实施方案37至52中任一项所述的方法用于产生生物产物的用途。
56.实施方案37至52中任一项所述的方法用于产生含有Neu(n)Ac的化合物的用途,其中(n)为4、5、7、8或9或其组合。
将在实施例中更详细地描述本发明。以下实施例将充当对本发明的进一步说明和澄清,并且无意是限制性的。
实施例
实施例1.蛋白结构域的鉴定
HMM是一种被称为轮廓隐马尔可夫模型(profile hidden Markov models)的概率模型。它将一组比对的蛋白表征为位置特异性的评分系统。根据氨基酸出现的频率,在序列比对中的每个位置处对氨基酸进行评分(Eddy,S.R.1998.Profile hidden Markovmodels.Bioinformatics.14:755-63)。HMM具有广泛的实用性,这从使用这种方法进行蛋白分类的众多数据库中可以清楚地看出,所述数据库包括Pfam、InterPro、SMART、TIGRFAM、PIRSF、PANTHER、SFLD、Superfamily和Gene3D。
在2019年6月13日发布的HMMER包3.2.1(http://hmmer.org/)中的HMMsearch可以使用该HMM来搜索序列数据库中的序列同系物。可以使用的序列数据库是例如、但不限于NCBI nr蛋白数据库(NR;https://www.ncbi.nlm.nih.gov/protein)、UniProtKnowledgebase(UniProtKB,https://www.uniprot.org/help/uniprotkb)和SWISS-PROT数据库(https://web.expasy.org/docs/swiss-prot_guideline.html)。
基于2019年7月4日发布的InterPro 75.0(https://www.ebi.ac.uk/interpro/)和使用2018年9月发布的Pfam 32.0(https://pfam.xfam.org/)的PFAM结构域对Neu(n)Ac合酶分类。Pfam和InterPro数据库是蛋白家族的大型集合。还可以使用其它蛋白结构域如SMART(http://smart.embl-heidelberg.de/)、TIGRFAM(https://www.jcvi.org/tigrfams)、PIRSF(https://proteininformationresource.org/pirwww/dbinfo/pirsf.shtml)、PANTHER(http://pantherdb.org/)、SFLD(http://sfld.rbvi.ucsf.edu/archive/django/index.html)、Superfamily(http://supfam.org/)和Gene3D(http://gene3d.biochem.ucl.ac.uk/Gene3D/)、NCBI保守结构域(https://www.ncbi.nlm.nih.gov/Structure/cdd/wrpsb.cgi)。
通过在https://pfam.xfam.org/search#tabview=tab1(2018年9月发布)上的在线搜索完成PFAM结构域的鉴定。在“Curation&model”中下载所得到的家族的HMM。使用此模型对蛋白数据库的HMMsearch将鉴定新的家族成员。也可以从PFAM网站下载包含InterPro命中的序列。
通过使用在https://www.ebi.ac.uk/interpro/上的在线工具或InterProScan的独立版本(https://www.ebi.ac.uk/interpro/download.html)(二者基于2019年7月4日发布的InterPro 75.0),完成InterPro(超)家族、结构域和位点的鉴定。InterPro是一个综合数据库,组合了蛋白基序和结构域的许多数据库的信息。InterPro结构域和/或(超)家族的HMM可以从InterProScan获得,并且可以用于鉴定蛋白数据库中的新家族成员。包含InterPro命中的序列也可以从InterPro网站(“Protein Matched”)下载,或者可以在UniProt网站(https://www.uniprot.org)上查询。
实施例2.多肽序列之间的同一性百分比的计算
用于对比的序列比对方法是本领域众所周知的,这样的方法包括GAP、BESTFIT、BLAST、FASTA和TFASTA。GAP使用Needleman和Wunsch的算法(J.Mol.Biol.(1970)48:443-453)以寻找两个序列的总体(即跨全长序列)比对,其使匹配数最大化并使缺口数最小化。BLAST算法(Altschul等人,J.Mol.Biol.(1990)215:403-10)计算总体序列同一性百分比(即在全长序列上)并执行两个序列之间的相似性的统计分析。用于执行BLAST分析的软件可以通过美国国家生物技术信息中心(National Centre for BiotechnologyInformation,NCBI)公开获得。使用例如ClustalW多序列比对算法(1.83版),使用默认逐对比对参数和百分比评分方法,可以容易地鉴定同系物。使用在MatGAT软件包(Campanella等人,BMC Bioinformatics(2003)4:29)中可得到的方法之一,也可以确定相似性和同一性的总体百分比(即跨全长序列)。如本领域技术人员会明白的,可以进行少量手动编辑以优化保守基序之间的比对。此外,代替使用全长序列来鉴定同系物,还可以使用特定结构域来确定所谓的局部序列同一性。使用上述程序并使用默认参数,可以在整个核酸或氨基酸序列上(=在全长序列上进行局部序列同一性搜索,产生总体序列同一性评分)或者在选定的结构域或保守基序上(=在部分序列上进行局部序列同一性搜索,产生局部序列同一性评分)确定序列同一性值。对于局部比对,Smith-Waterman算法是特别有用的(Smith TF,Waterman MS(1981)J.Mol.Biol 147(1);195-7)。
实施例3.Neu(n)Ac合酶的鉴定
可以从序列数据库,如PATRIC(https://www.patricbrc.org/)、Uniprot(https://www.uniprot.org/)、NCBI nr或nt数据库(https://www.ncbi.nlm.nih.gov/)以及其他数据库,获得Neu(n)Ac合酶基因。PATRIC(https://www.patricbrc.org/)是不同类型的数据和支持在细菌病原体上进行检索的软件工具的综合。
本实施例描述了怎样提取包含SEQ ID NO 01并由PatricDB总体家族结构域PGF_06907304所示的基因,所述SEQ ID NO 01为[ILMV][MST]XXXXX(X,非K)(X,非Q)XXXXXXXXXXXX(X,非I)XXX(X,非T)X[ACS][ST][AP][FWY]XXX(X,非G)X(X,非L)X[IL](X,非K)XXXX(X,非E)XXKXXS。该家族的成员使用PATRIC命令行界面(https:// docs.patricbrc.org/cli_tutorial/index.html)提取。使用python的自定义脚本(https://www.python.org/;https://docs.python.org/3/library/re.html),执行对结构域的regex检索。2021年2月23日提取到5166个标识符。关于完整性(从起始密码子到终止密码子)过滤氨基酸序列并使用CD-HIT(http://weizhongli-lab.org/cd-hit/)以80%的序列同一性阈值进行聚类。代表性序列为下述305个标识符:fig|1002804.6.peg.547,fig|100884.13.peg.450,fig|1038844.30.peg.4934,fig|1051651.3.peg.3205,fig|1055528.4.peg.829,fig|1062.16.peg.1137,fig|1063.32.peg.2,fig|1066.21.peg.3289,fig|1071054.3.peg.3038,fig|1078087.3.peg.2199,fig|1098.5.peg.1527,fig|110321.109.peg.452,fig|1120935.3.peg.6089,fig|1120965.3.peg.2870,fig|1121102.3.peg.1353,fig|1121866.8.peg.1014,fig|1122159.4.peg.3850,fig|1122938.3.peg.280,fig|1122991.5.peg.2486,fig|1123289.3.peg.1544,fig|1123490.3.peg.901,fig|1123502.3.peg.977,fig|1123755.5.peg.991,fig|1131272.3.peg.445,fig|1167006.5.peg.3367,fig|1167637.4.peg.2723,fig|1191687.11.peg.701,fig|1203593.3.peg.1211,fig|121719.18.peg.1483,fig|1230338.3.peg.604,fig|1232673.3.peg.665,fig|1236514.3.peg.5464,fig|1236959.3.peg.2826,fig|1238198.3.peg.4318,fig|123841.6.peg.11,fig|1244531.6.peg.922,fig|1249978.3.peg.2463,fig|1262761.3.peg.55,fig|1262830.3.peg.1125,fig|1263550.3.peg.3253,fig|1264.4.peg.3685,fig|1265827.4.peg.2143,fig|1278971.3.peg.967,fig|1281017.3.peg.2297,fig|128944.3.peg.1532,fig|1295392.6.peg.2032,fig|1304887.3.peg.2105,fig|1304902.6.peg.4111,fig|1307.262.peg.1750,fig|1326.4.peg.580,
fig|132932.4.peg.789,fig|1349.576.peg.1564,fig|1354263.4.peg.1545,
fig|1357398.3.peg.1891,fig|1380600.3.peg.824,fig|1404367.6.peg.3984,
fig|1408287.3.peg.210,fig|1410612.3.peg.1243,fig|1410627.3.peg.1777,
fig|1411316.19.peg.446,fig|142586.12.peg.2167,fig|142586.1785.peg.691,
fig|1429889.3.peg.2679,fig|1471452.3.peg.1260,fig|1471472.3.peg.1861,
fig|1471528.3.peg.1140,fig|1476195.3.peg.1667,fig|1499679.3.peg.1909,
fig|1500268.4.peg.2015,fig|1503961.5.peg.1771,fig|1503961.5.peg.5506,
fig|1506.455.peg.2765,fig|1520802.5.peg.758,fig|1521931.3.peg.1058,
fig|152507.1091.peg.2096,fig|152509.1038.peg.219,fig|152509.176.peg.270,
fig|152509.200.peg.499,fig|152509.254.peg.178,fig|152509.280.peg.778,
fig|152509.299.peg.128,fig|152509.317.peg.262,fig|152509.78.peg.172,
fig|1528787.3.peg.5741,fig|1529069.3.peg.771,fig|153493.10.peg.569,
fig|153809.403.peg.1128,fig|1548018.3.peg.2565,fig|158836.1033.peg.707,
fig|1612.51.peg.2241,fig|1618405.4.peg.579,fig|1618511.4.peg.1174,
fig|1618608.4.peg.701,fig|1618811.4.peg.13,fig|1629713.5.peg.5017,
fig|1632858.5.peg.2548,fig|165185.186.peg.145,fig|1651968.3.peg.1506,
fig|1660074.3.peg.176,fig|1667051.1649.peg.455,fig|1667051.2072.peg.1080,
fig|1667051.527.peg.685,fig|1667051.856.peg.326,fig|1667051.973.peg.458,
fig|1703402.5.peg.672,fig|1713224.3.peg.4337,fig|1727163.4.peg.2932,
fig|172733.1895.peg.1453,fig|1729725.3.peg.1203,fig|1735162.10.peg.921,
fig|1736373.3.peg.2598,fig|1736447.3.peg.3772,fig|1736490.3.peg.4357,
fig|1740262.3.peg.2403,fig|1758176.3.peg.527,fig|1765022.11.peg.2795,
fig|1797193.3.peg.4233,fig|1797315.3.peg.1355,fig|1797393.3.peg.2372,
fig|1797403.3.peg.835,fig|1797915.3.peg.1834,fig|1797968.3.peg.1910,
fig|1798263.3.peg.584,fig|1798268.3.peg.697,fig|1798314.3.peg.1758,
fig|1798325.3.peg.478,fig|1798417.3.peg.2202,fig|1798663.3.peg.62,
fig|1798683.3.peg.1004,fig|1801946.3.peg.1213,fig|1802304.3.peg.776,
fig|1802384.3.peg.808,fig|180441.4.peg.3020,fig|1813019.44.peg.319,
fig|181674.329.peg.984,fig|1817801.7.peg.1665,fig|1838286.3.peg.2066,
fig|1861.4.peg.2593,fig|1869227.373.peg.512,fig|1869227.456.peg.1784,
fig|1870990.3.peg.1620,fig|1871037.156.peg.940,fig|1871037.182.peg.718,
fig|1871037.218.peg.1968,fig|1871070.14.peg.4116,fig|1879010.6632.peg.434,
fig|1897043.3.peg.2266,fig|1897630.3.peg.4093,fig|1898103.33.peg.1215,
fig|1898104.528.peg.105,fig|1898203.1837.peg.1385,fig|1898203.2140.peg.2206,
fig|1898203.2142.peg.1585,fig|1898203.3.peg.3294,fig|1898203.83.peg.2892,
fig|1898205.3894.peg.1218,fig|1898207.3640.peg.188,fig|1898207.3841.peg.406,
fig|1902409.7.peg.1786,fig|1904441.117.peg.2724,fig|1904441.306.peg.2282,
fig|1904441.319.peg.1012,fig|1904441.57.peg.2253,fig|1909294.1059.peg.4719,
fig|1909294.250.peg.2233,fig|1913989.525.peg.756,fig|1917019.3.peg.1281,
fig|1926876.3.peg.2711,fig|1936995.3.peg.2504,fig|1946156.3.peg.1473,
fig|1946312.3.peg.2491,fig|1947389.3.peg.2953,fig|1948890.13.peg.1302,
fig|194923.51.peg.476,fig|195.447.peg.1271,fig|195045.59.peg.232,
fig|1951479.3.peg.1084,fig|1951543.3.peg.934,fig|1951832.3.peg.766,
fig|1961389.3.peg.1983,fig|1965557.3.peg.2146,fig|1970510.3.peg.530,
fig|1973990.3.peg.490,fig|1973999.3.peg.414,fig|1974005.3.peg.33,
fig|1974785.3.peg.457,fig|1975096.3.peg.589,fig|1978231.219.peg.3848,
fig|1978412.4.peg.3849,fig|2013726.3.peg.388,fig|2013763.3.peg.1707,
fig|2014542.3.peg.2964,fig|2015557.3.peg.1744,fig|202.12.peg.1481,
fig|2021368.19.peg.2645,fig|2024889.18.peg.1866,fig|2026724.1106.peg.3502,
fig|2026724.200.peg.6383,fig|2026734.222.peg.173,fig|2026742.89.peg.2051,
fig|2026763.159.peg.1925,fig|2026774.61.peg.261,fig|2026779.78.peg.1507,
fig|2026780.361.peg.1890,fig|2026791.71.peg.104,fig|2026887.129.peg.3163,
fig|2030927.473.peg.2108,fig|2030927.524.peg.207,fig|2030927.667.peg.2608,
fig|2035772.18.peg.1320,fig|2035772.264.peg.800,fig|2035772.275.peg.900,
fig|2040651.3.peg.68,fig|2042961.3.peg.1534,fig|2043167.3.peg.427,
fig|2044940.15.peg.1114,fig|2048255.3.peg.1736,fig|2049431.34.peg.937,
fig|2049433.30.peg.3322,fig|2049433.7.peg.3086,fig|2053044.3.peg.1515,
fig|2053617.19.peg.785,fig|2053634.101.peg.161,fig|207559.7.peg.3187,
fig|208199.4.peg.2141,fig|208549.72.peg.3116,fig|2093811.128.peg.948,
fig|2170728.3.peg.2380,fig|220137.23.peg.916,fig|2219558.3.peg.1000,
fig|243904.133.peg.1246,fig|2448778.22.peg.1348,fig|2490856.3.peg.961,
fig|2497619.14.peg.117,fig|253161.68.peg.484,fig|2569543.3.peg.4125,fig|2588536.27.peg.841,fig|2604158.3.peg.4421,fig|2607825.3.peg.11214,fig|263474.3.peg.560,fig|2656915.3.peg.5209,fig|2711156.3.peg.2713,fig|2731251.3.peg.3034,fig|2740185.3.peg.3368,fig|2750080.10.peg.516,fig|2750080.3.peg.667,fig|2750080.5.peg.124,fig|2756.14.peg.1483,fig|2760054.3.peg.2498,fig|2780076.3.peg.449,fig|281031.13.peg.1088,fig|281031.138.peg.18,fig|28200.10.peg.698,fig|29391.32.peg.1415,fig|29410.5.peg.472,fig|296218.3.peg.948,fig|310575.5.peg.2356,fig|31910.4.peg.371,fig|331630.40.peg.1600,fig|37372.27.peg.428,fig|388413.5.peg.9,fig|435880.7.peg.3933,fig|435906.4.peg.2580,fig|43657.14.peg.3706,fig|43658.6.peg.3927,fig|442714.3.peg.2766,fig|446043.5.peg.671,fig|453575.4.peg.3610,fig|46206.5.peg.2009,fig|49280.10.peg.1576,fig|51161.3.peg.1247,fig|522484.4.peg.276,fig|553385.4.peg.2463,fig|555950.3.peg.1285,fig|587909.3.peg.1713,fig|59620.1573.peg.14,fig|59620.1655.peg.3594,fig|626932.184.peg.2675,fig|648174.107.peg.900,fig|648174.118.peg.198,fig|648174.164.peg.1309,fig|648174.193.peg.631,fig|648174.208.peg.126,fig|648174.219.peg.818,fig|648174.233.peg.187,fig|648174.329.peg.501,fig|648174.387.peg.83,fig|648174.506.peg.471,fig|648174.512.peg.430,fig|648174.513.peg.458,fig|69360.3.peg.3235,fig|750.10.peg.1591,fig|797277.3.peg.2464,fig|86027.621.peg.1978,fig|86473.95.peg.552,fig|869962.3.peg.2770,fig|87012.4.peg.1660,fig|91750.123.peg.781,fig|91750.394.peg.421,fig|91750.45.peg.463,fig|932004.23.peg.1055,fig|943346.3.peg.444,fig|945543.3.peg.4068,fig|964.13.peg.4412,fig|989403.3.peg.4566。
实施例4.材料和方法
大肠杆菌
培养基
Luria Broth(LB)培养基由1%胰蛋白胨蛋白胨(Difco,Erembodegem,比利时)、0.5%酵母提取物(Difco)和0.5%氯化钠(VWR,Leuven,比利时)组成。在96-孔平板或摇瓶中的培养实验所用的基本培养基含有2.00g/L NH4Cl、5.00g/L(NH4)2SO4、2.993g/LKH2PO4、7.315g/L K2HPO4、8.372g/L MOPS、0.5g/L NaCl、0.5g/L MgSO4.7H2O、30g/L蔗糖或30g/L甘油、1ml/L维生素溶液、100μl/L钼酸盐溶液和1mL/L硒溶液。如在各个实施例中具体说明的,将0.30g/L唾液酸、20g/L乳糖、20g/L LacNAc和/或20g/L LNB作为前体另外添加至培养基中。用1M KOH将基本培养基设定至pH 7。维生素溶液由3.6g/L FeCl2.4H2O、5g/LCaCl2.2H2O、1.3g/L MnCl2.2H2O、0.38g/LCuCl2.2H2O、0.5g/L CoCl2.6H2O、0.94g/LZnCl2、0.0311g/L H3BO4、0.4g/LNa2EDTA.2H2O和1.01g/L硫胺素.HCl组成。钼酸盐溶液含有0.967g/LNaMoO4.2H2O。硒溶液含有42g/L Seo2。
用于发酵的基本培养基含有6.75g/L NH4Cl、1.25g/L(NH4)2SO4、2.93g/LKH2PO4和7.31g/L KH2PO4、0.5g/L NaCl、0.5g/L MgSO4.7H2O、30g/L蔗糖或30g/L甘油、1mL/L维生素溶液、100μL/L钼酸盐溶液和1mL/L硒溶液,具有与上述相同的组成。如在各个实施例中具体说明的,将0.30g/L唾液酸、20g/L乳糖、20g/L LacNAc和/或20g/L LNB作为前体另外添加至培养基中。
将复合培养基通过高压灭菌(121℃,21分钟)进行灭菌,并将基本培养基通过过滤(0.22μm Sartorius)进行灭菌。在必要时,通过添加抗生素来使培养基具有选择性:例如氯霉素(20mg/L)、羧苄青霉素(100mg/L)、壮观霉素(40mg/L)和/或卡那霉素(50mg/L)。
质粒
pKD46(Red辅助质粒,氨苄青霉素抗性)、pKD3(含有侧接FRT的氯霉素抗性(cat)基因)、pKD4(含有侧接FRT的卡那霉素抗性(kan)基因)和pCP20(表达FLP重组酶活性)质粒得自R.Cunin教授(比利时布鲁塞尔自由大学(Vrije Universiteit Brussel),在2007年获得)。将质粒维持在购自Invitrogen的宿主大肠杆菌DH5α(F-,phi80dlacZΔM15,Δ(lacZYA-argF)U169,deoR,recA1,endA1,hsdR17(rk-,mk+),phoA,supE44,λ-,thi-1,gyrA96,relA1)中。
菌株和突变
大肠杆菌K12 MG1655[λ-,F-,rph-1]于2007年3月得自大肠杆菌遗传保藏中心(美国),CGSC菌株#:7740。使用Datsenko和Wanner发表的技术(PNAS 97(2000),6640-6645)进行基因破坏、基因引入和基因替换。该技术是基于由λRed重组酶进行同源重组后的抗生素选择。翻转酶重组酶的后续催化会确保在最终的生产菌株中除去抗生素选择盒。使携带Red辅助质粒pKD46的转化体在10mL含有氨苄青霉素(100mg/L)和L-阿拉伯糖(10mM)的LB培养基中在30℃生长至0.6的OD600nm。通过用50mL冰冷的水洗涤细胞第一次并用1mL冰冷的水洗涤细胞第二次,使细胞呈电感受态。然后,将细胞重新悬浮于50μL冰冷的水中。使用GenePulserTM(BioRad)(600Ω、25μFD和250伏特)用50μL细胞和10-100ng直链双链-DNA产物进行电穿孔。在电穿孔以后,将细胞加入1mL LB培养基中,在37℃孵育1h,并最后铺板在含有25mg/L的氯霉素或50mg/L的卡那霉素的LB琼脂上以选出抗生素抗性的转化体。使用在修饰区域上游和下游的引物通过PCR验证所选的突变体,并在LB琼脂中在42℃生长以丢失辅助质粒。试验突变体的氨苄青霉素敏感性。使用pKD3、pKD4及其衍生物为模板,通过PCR获得直链ds-DNA扩增子。所使用的引物的序列的一部分与模板互补,并且另一部分与染色体DNA上必须发生重组的一侧互补。对于基因组敲除,将同源性区域设计在感兴趣的基因的起始密码子和终止密码子的上游50个核苷酸和下游50个核苷酸。对于基因组敲入,必须尊重转录起始点(+1)。将PCR产物进行PCR纯化,用Dpnl消化,从琼脂糖凝胶中重新纯化,并悬浮在洗脱缓冲液(5mM Tris,pH 8.0)中。用pCP20质粒转化选定的突变体,该质粒是氨苄青霉素和氯霉素抗性的质粒,显示出温度敏感的复制和FLP合成的热诱导。在30℃选择氨苄青霉素抗性的转化体,然后在42℃在LB中纯化几个菌落,然后试验所有抗生素抗性和FLP辅助质粒的丧失。使用对照引物检查基因敲除和敲入。
在唾液酸产生的一个实施例中,突变株衍生自大肠杆菌K12 MG1655,其包含组成型转录单元的基因组敲入,所述组成型转录单元含有:葡糖胺6-磷酸N-乙酰基转移酶(如例如具有SEQ ID NO 34的来自酿酒酵母的GNA1),N-酰基葡糖胺2-差向异构酶(如例如具有SEQ ID NO 35的来自卵形拟杆菌的AGE)和任意一种或多种N-乙酰神经氨酸(Neu(n)Ac)合酶(其选自包含以下各项的列表:SEQ ID NO 02、03、04、05、06、07、08、09、10、11、12、13、14、15、16、17和18)。
备选地和/或另外,通过基因组敲入包含下述的组成型转录单元:UDP-N-乙酰葡糖胺2-差向异构酶(如例如具有SEQ ID NO 39的来自空肠弯曲杆菌的NeuC)和任意一种或多种Neu(n)Ac合酶(其选自包含以下各项的列表:SEQ ID NO 02、03、04、05、06、07、08、09、10、11、12、13、14、15、16、17和18),可以获得唾液酸产生。
备选地和/或另外,通过基因组敲入包含下述的组成型转录单元:磷酸葡糖胺变位酶(如例如具有SEQ ID NO 37的来自大肠杆菌的glmM),N-乙酰葡糖胺-1-磷酸尿苷酰基转移酶/葡糖胺-1-磷酸乙酰基转移酶(如例如具有SEQ ID NO 38的来自大肠杆菌的glmU),UDP-N-乙酰葡糖胺2-差向异构酶(如例如具有SEQ ID NO 39的来自空肠弯曲杆菌的NeuC)和任意一种或多种Neu(n)Ac合酶(其选自包含以下各项的列表:SEQ ID NO 02、03、04、05、06、07、08、09、10、11、12、13、14、15、16、17和18),可以获得唾液酸生产。
备选地和/或另外,通过基因组敲入包含下述的组成型转录单元:双功能的UDP-GlcNAc 2-差向异构酶/N-乙酰甘露糖胺激酶(如例如来自小家鼠(品系C57BL/6J)(具有SEQID NO 33)),N-酰基神经氨酸-9-磷酸合成酶(选自SEQ ID NO 21、22、23、24、25、26、27和28)和N-酰基神经氨酸-9-磷酸酶(如例如来自趋磁假丝酵母种HK-1(具有SEQ ID NO 30)或来自多形拟杆菌(菌株ATCC 29148)(具有SEQ ID NO 32)),可以获得唾液酸产生。
备选地和/或另外,通过基因组敲入含有下述的组成型转录单元:磷酸葡糖胺变位酶(如例如具有SEQ ID NO 37的来自大肠杆菌的glmM),N-乙酰葡糖胺-1-磷酸尿苷酰基转移酶/葡糖胺-1-磷酸乙酰基转移酶(如例如具有SEQ ID NO 38的来自大肠杆菌的glmU),双功能的UDP-GlcNAc 2-差向异构酶/N-乙酰甘露糖胺激酶(如例如来自小家鼠(品系C57BL/6J)(具有SEQ ID NO 33)),N-酰基神经氨酸-9-磷酸合成酶(其选自包含以下各项的列表:SEQ ID NO 21、22、23、24、25、26、27和28)和N-酰基神经氨酸-9-磷酸酶(如例如来自趋磁假丝酵母种HK-1(具有SEQ ID NO 30)或来自多形拟杆菌(菌株ATCC 29148)(具有SEQ ID NO32)),可以获得唾液酸产生。
可以在大肠杆菌突变株中进一步优化唾液酸产生,所述菌株具有包括nagA、nagB、nagC、nagD、nagE、nanA、nanE、nanK、manX、manY和manZ中任何一种或多种的大肠杆菌基因的基因组敲除(如在WO18122225中所描述)和/或包括poxB、ldhA、adhE、aldB、pflA、pflC、ybiY、ackA和/或pta中的任何一种或多种的大肠杆菌基因的基因组敲除,并且具有包含以下中的任何一种或多种的组成型转录单元的基因组敲入:L-谷氨酰胺-D-果糖-6-磷酸氨基转移酶(如例如具有SEQ ID NO 36的来自大肠杆菌的突变体glmS*54(与野生型大肠杆菌glmS的差别在于A39T、R250C和G472S突变)),优选磷酸酶(如以下中的任何一种或多种:例如,包括aphA、Cof、HisB、OtsB、SurE、Yaed、YcjU、YedP、YfbT、YidA、YigB、YihX、YniC、YqaB、YrbL、AppA、Gph、SerB、YbhA、YbiV、YbjL、Yfb、YieH、YjgL、YjjG、YrfG和YbiU的大肠杆菌基因,或来自恶臭假单胞菌的PsMupP,来自酿酒酵母的ScDOG1和来自枯草芽孢杆菌的BsAraL,如在WO18122225中所描述),和乙酰辅酶A合成酶(如例如具有SEQ ID NO 79的来自大肠杆菌的acs)。
对于唾液酸化的寡糖产生,所述唾液酸生产菌株进一步需要表达一个或多个拷贝的N-酰基神经氨酸胞苷酰基转移酶(如例如具有SEQ ID NO 40的来自多杀巴斯德氏菌的NeuA、具有SEQ ID NO 64的来自空肠弯曲杆菌的NeuA或具有SEQ ID NO 65的来自流感嗜血菌的NeuA),以及一个或多个拷贝的β-半乳糖苷α-2,3-唾液酸转移酶(例如选自:来自多杀巴斯德氏菌多杀亚种Pm70菌株的SEQ ID NO 41(PmultST2),来自脑膜炎奈瑟氏菌的SEQ IDNO 42(NmeniST3)和来自多杀巴斯德氏菌的SEQ ID NO 80(PmultST3))、β-半乳糖苷α-2,6-唾液酸转移酶(如包含以下的一种:来自美人鱼发光杆菌的SEQ ID NO 43(PdST6)和来自发光杆菌属种(Photobacterium sp.)JT-ISH-224的SEQ ID NO 44(P-JT-ISH-224-ST6))和/或α-2,8-唾液酸转移酶(如例如来自小家鼠(具有SEQ ID NO 45))。N-酰基神经氨酸胞苷酰基转移酶和唾液酸转移酶的组成型转录单元可以通过基因组敲入或通过表达质粒递送至突变株。如果产生唾液酸和CMP-唾液酸的突变株旨在产生唾液酸化的乳糖结构,则利用大肠杆菌LacZ、LacY和LacA基因的基因组敲除并利用乳糖通透酶(如例如具有SEQ ID NO 46的大肠杆菌LacY)的组成型转录单元的基因组敲入另外修饰菌株。通过含有下述的组成型转录单元的基因组敲入:蔗糖转运蛋白(CscB)(如例如来自大肠杆菌W(具有SEQ ID NO47))、果糖激酶(Frk)(例如源自运动发酵单胞菌(Z.mobilis)(具有SEQ ID NO 48))和蔗糖磷酸化酶(例如源自青春双歧杆菌(B.adolescentis)(具有SEQ ID NO 49)),可以任选地修改产生唾液酸、CMP-唾液酸和/或唾液酸化的寡糖的所有突变株以在蔗糖上生长。
对于在产生唾液酸的大肠杆菌菌株中的GFP-岩藻糖产生,在这些实施例中的突变株被进一步修饰,其包含大肠杆菌wcaJ和thyA基因的敲除以及含有蔗糖转运蛋白(如例如来自大肠杆菌W的CscB(具有SEQ ID NO 47))、果糖激酶(如例如源自运动发酵单胞菌的Frk(具有SEQ ID NO 48))和蔗糖磷酸化酶(SP)(如例如来自青春双歧杆菌(具有SEQ ID NO49))的组成型转录单元的基因组敲入。为了产生岩藻糖基化的寡糖,利用表达质粒另外修饰突变体GDP-岩藻糖生产菌株,所述表达质粒包含关于α-1,2-岩藻糖基转移酶(如例如具有SEQ ID NO 50的来自幽门螺杆菌的HpFutC)和/或α-1,3-岩藻糖基转移酶(如例如具有SEQ ID NO 51的来自幽门螺杆菌的HpFucT)的组成型转录单元,并利用具有SEQ ID NO 52的大肠杆菌thyA的组成型转录单元作为选择性标志物。岩藻糖基转移酶基因的组成型转录单元也可以通过基因组敲入存在于大肠杆菌突变株中。如在WO2016075243和WO2012007481中所述,通过包含glgC、agp、pfkA、pfkB、pgi、arcA、iclR、pgi和lon的大肠杆菌基因中的任何一种或多种的基因组敲除,可以在大肠杆菌突变株中进一步优化GDP-岩藻糖产生。可以另外优化GDP-岩藻糖产生,包含甘露糖-6-磷酸异构酶(如例如具有SEQ ID NO 53的来自大肠杆菌的manA)、磷酸甘露糖变位酶(如例如具有SEQ ID NO 54的来自大肠杆菌的manB)、甘露糖-1-磷酸鸟苷酰基转移酶(如例如具有SEQ ID NO 55的来自大肠杆菌的manC)、GDP-甘露糖4,6-脱水酶(如例如具有SEQ ID NO 56的来自大肠杆菌的gmd)和GDP-L-岩藻糖合酶(如例如具有SEQ ID NO 57的来自大肠杆菌的fcl)的组成型转录单元的基因组敲入。通过大肠杆菌fucK和fucI基因的基因组敲除以及含有岩藻糖通透酶(如例如具有SEQ ID NO 58的来自大肠杆菌的fucP)和双功能的岩藻糖激酶/岩藻糖-1-磷酸鸟苷酰基转移酶(如例如具有SEQ ID NO 59的来自脆弱拟杆菌的fkp)的组成型转录单元的基因组敲入,也可以得到GDP-岩藻糖产生。如果产生唾液酸和GDP-岩藻糖的突变株旨在制备岩藻糖基化的乳糖结构,则利用大肠杆菌LacZ、LacY和LacA基因的基因组敲除以及利用乳糖通透酶(如例如具有SEQ ID NO 46的大肠杆菌LacY)的组成型转录单元的基因组敲入另外修饰菌株。此外,如果突变株也旨在制备唾液酸化的结构,则利用基因组敲入或表达质粒另外修饰菌株,所述表达质粒包含一个或多个拷贝的N-酰基神经氨酸胞苷酰基转移酶(如例如具有SEQ ID NO 40的来自多杀巴斯德氏菌的NeuA、具有SEQ ID NO 64的来自空肠弯曲杆菌的NeuA或具有SEQID NO 65的来自流感嗜血杆菌的NeuA)以及一个或多个拷贝的β-半乳糖苷α-2,3-唾液酸转移酶(如例如来自多杀巴斯德氏菌多杀亚种Pm70菌株的SEQ ID NO 41(PmultST2)、来自脑膜炎奈瑟氏菌的SEQ ID NO 42(NmeniST3)或来自多杀巴斯德氏菌的SEQ ID NO 80(PmultST3))、β-半乳糖苷α-2,6-唾液酸转移酶(如例如来自美人鱼发光杆菌的SEQ ID NO43(PdST6)和/或来自发光杆菌属种JT-ISH-224的SEQ ID NO 44(P-JT-ISH-224-ST6))和/或α-2,8-唾液酸转移酶(如例如来自小家鼠(具有SEQ ID NO 45))的组成型转录单元。
为了在产生唾液酸的大肠杆菌菌株中产生LN3(GlcNAc-b1,3-Gal-b1,4-Glc),进一步修饰在这些实施例中的突变株,其包含大肠杆菌LacZ、LacY和LacA基因的基因组敲除以及关于乳糖通透酶(如例如具有SEQ ID NO 46的大肠杆菌LacY)和半乳糖苷β-1,3-N-乙酰葡糖胺基转移酶(如例如具有SEQ ID NO 60的来自脑膜炎奈瑟氏菌的LgtA)的组成型转录单元的基因组敲入。
为了产生LN3-衍生的寡糖如乳糖-N-四糖(LNT)和乳糖-N-新四糖(LNnT),用组成型转录单元进一步修饰突变体LN3生产菌株,所述组成型转录单元通过基因组敲入递送给所述菌株或来自N-乙酰葡糖胺β-1,3-半乳糖基转移酶(如例如具有SEQ ID NO 61的来自大肠杆菌O55:H7的WbgO(以产生LNT))或N-乙酰葡糖胺β-1,4-半乳糖基转移酶(如例如具有SEQ ID NO 62的来自脑膜炎奈瑟氏菌的LgtB(以产生LNnT))的表达质粒。任选地,可以将半乳糖苷β-1,3-N-乙酰葡糖胺基转移酶、N-乙酰葡糖胺β-1,3-半乳糖基转移酶和/或N-乙酰葡糖胺β-1,4-半乳糖基转移酶编码基因的多个拷贝添加至大肠杆菌突变株中。另外,可以任选地通过大肠杆菌ushA和galT基因的基因组敲除来修饰菌株以增强UDP-半乳糖产生。还可以任选地通过UDP-葡萄糖-4-差向异构酶(如例如具有SEQ ID NO 63的来自大肠杆菌的galE)的组成型转录单元的基因组敲入来修改大肠杆菌突变株。此外,如果突变株也旨在制备唾液酸化的结构,则用基因组敲入或表达质粒另外修饰菌株,所述表达质粒包含关于一个或多个拷贝的N-酰基神经氨酸胞苷酰基转移酶(如例如具有SEQ ID NO 40的来自多杀巴斯德氏菌的NeuA、具有SEQ ID NO 64的来自空肠弯曲杆菌的NeuA或具有SEQ ID NO 65的来自流感嗜血杆菌的NeuA)、以及一个或多个拷贝的β-半乳糖苷α-2,3-唾液酸转移酶(如例如来自多杀巴斯德氏菌多杀亚种Pm70菌株的SEQ ID NO 41(PmultST2)和来自脑膜炎奈瑟氏菌的SEQ ID NO 42(NmeniST3)或来自多杀巴斯德氏菌的SEQ ID NO 80(PmultST3))、β-半乳糖苷α-2,6-唾液酸转移酶(如例如来自美人鱼发光杆菌的SEQ ID NO 43(PdST6)和/或来自发光杆菌属种JT-ISH-224的SEQ ID NO 44(P-JT-ISH-224-ST6))和/或α-2,8-唾液酸转移酶(如例如来自小家鼠(具有SEQ ID NO 45))的组成型转录单元。通过含有蔗糖转运蛋白(如例如具有SEQ ID NO 47的来自大肠杆菌W的CscB)、果糖激酶(如例如具有SEQ ID NO 48的源自运动发酵单胞菌的Frk)和蔗糖磷酸化酶(如例如来自青春双歧杆菌(具有SEQ ID NO49))的组成型转录单元的基因组敲入,也可以任选地修改大肠杆菌突变株以在蔗糖上生长。
优选地但不一定,所述糖基转移酶在N-端MBP-标签融合以增强其溶解度(Fox等人,Protein Sci.2001,10(3),622-630)。
所有组成型启动子、UTR和终止子序列源自Mutalik等人(Nat.Methods2013,No.10,354-360)和Cambray等人(Nucleic Acids Res.2013,41(9),5139-5148)描述的文库。所有基因均在Twist Bioscience(twistbioscience.com)或IDT(eu.idtdna.com)上合成订购,并使用供应商的工具修改密码子使用。
将所有菌株在冷冻小瓶中在-80℃储存(过夜LB培养物以1:1的比例与70%甘油混合)。
表1:在本发明中描述的SEQ ID NO的概述
/>
/>
培养条件
96-孔微量滴定板实验的预培养从冷冻小瓶开始,在150μL LB中,在定轨摇床上在800rpm在37℃孵育过夜。该培养物用作96孔方形微量滴定板的接种物,通过稀释400倍使用400μL基本培养基。然后将这些最终的96-孔培养板在37℃在定轨摇床上在800rpm孵育72小时或更短或更长。为了测量在培养实验结束时的糖浓度,从每个孔中取出整个培养液样品,在离心细胞之前,将培养液在60℃煮沸15分钟(=细胞内和细胞外糖浓度的平均值)。
生物反应器的预培养从特定菌株的整个1mL冷冻小瓶开始,接种于在1L或2.5L摇瓶中的250mL或500mL基本培养基中,并在37℃在定轨摇床上在200rpm孵育24h。然后接种5L生物反应器(具有5L工作容积)(在2L批次培养基中的250mL接种物);该过程由MFCS控制软件(Sartorius Stedim Biotech,Melsungen,德国)控制。将培养条件设定为37℃和最大搅拌;压力气体流速取决于菌株和生物反应器。使用0.5M H2SO4和20% NH4OH将pH控制在6.8。将排出气体冷却。当在发酵过程中产生泡沫时,添加10%有机硅消泡剂溶液。
光密度
通过测量在600nm处的光密度(Implen Nanophotometer NP80,Westburg,Belgium或用Spark 10M微量培养板读数器,Tecan,瑞士)来经常监测培养物的细胞密度。
分析性分析
标准品诸如但不限于蔗糖、乳糖、N-乙酰基乳糖胺(LacNAc,Gal-b1,4-GlcNAc)、乳糖-N-二糖(LNB,Gal-b1,3-GlcNAc)、岩藻糖基化的LacNAc(2’FLacNAc,3-FLacNAc)、唾液酸化的LacNAc,(3’SLacNAc,6’SLacNAc)、岩藻糖基化的LNB(2’FLNB,4’FLNB)、乳糖-N-三糖II(LN3)、乳糖-N-四糖(LNT)、乳糖-N-新-四糖(LNnT)、LNFP-I、LNFP-II、LNFP-III、LNFP-V、LNFP-VI、LSTa、LSTc和LSTd购自Carbosynth(英国)、Elicityl(法国)和IsoSep(瑞典)。其它化合物使用内部制备的标准品进行分析。
在具有折射率(RI)检测的Waters Acquity H-类UPLC上分析唾液酸化的寡糖。将0.5μL体积的样品注射在Waters Acquity UPLC BEH Amide柱(2.1x 100mm;1.7μm)上。柱温度为50℃。流动相由70%乙腈、26%乙酸铵缓冲液(150mM)和4%甲醇的混合物组成,其中添加了0.05%吡咯烷。该方法是等度的,流速为0.150mL/min。将RI检测器的温度设定在35℃。在具有蒸发光散射检测器(ELSD)或折射率(RI)检测的Waters Acquity H-类UPLC上分析中性寡糖。将0.7μL体积的样品注射在具有Acquity UPLC BEH Amide Van保护柱(/>2.1x 5mm)的Waters Acquity UPLC BEH Amide柱(2.1x 100mm;/>1.7μm)柱上。柱温度为50℃。流动相由1/4水和3/4乙腈溶液组成,其中添加了0.2%三乙胺。该方法是等度的,流速为0.130mL/min。ELS检测器具有50℃的漂移管温度,并且氮气压力为50psi,增益为200,并且数据速率为10pps。将RI检测器的温度设定在35℃。在具有折射率(RI)检测的Waters Acquity H-类UPLC上分析中性和唾液酸化的糖。将0.5μL体积的样品注射在WatersAcquity UPLC BEH Amide柱(2.1x 100mm;/>1.7μm)上。柱温度为50℃。流动相由72%乙腈和28%乙酸铵缓冲液(100mM)的混合物组成,其中添加了0.1%三乙胺。该方法是等度的,流速为0.260mL/min。将RI检测器的温度设定在35℃。
为了在质谱仪上进行分析,使用具有电子喷雾电离(ESI)的Waters Xevo TQ-MS,去溶剂化温度为450℃,去溶剂化氮气流量为650L/h,且锥电压为20V。对于所有寡糖,在负模式下的选择离子监测(SIM)中运行MS。在35℃在具有Thermo Hypercarb柱(2.1x 100mm;3μm)的Waters Acquity UPLC上进行分离。使用梯度,其中洗脱液A是含有0.1%甲酸的超纯水,并且其中洗脱液B是含有0.1%甲酸的乙腈。使用以下梯度在55分钟内分离寡糖:首先历时21分钟从2%增加到12%的洗脱液B,第二次历时11分钟从12%增加到40%的洗脱液B,并第三次历时5分钟从40%增加到100%的洗脱液B。作为洗涤步骤,使用100%的洗脱液B进行5分钟。对于柱平衡,在1分钟内恢复2%的洗脱液B的初始条件并维持12分钟。
在具有脉冲电流计检测(PAD)的Dionex HPAEC系统上分析低浓度(低于50mg/L)的中性和唾液酸化的糖。将5μL体积的样品注射在具有Dionex CarboPac PA200保护柱(4x50mm)的Dionex CarboPac PA200柱(4x 250mm)上。将柱温度设定为30℃。使用梯度,其中洗脱液A为去离子水,其中洗脱液B为200mM氢氧化钠,且其中洗脱液C为500mM醋酸钠。在60分钟内分离寡糖,同时使用以下梯度维持25%的洗脱液B的恒定比例:初始等度步骤维持10分钟的75%的洗脱液A,首先历时8分钟从0%增加到4%的洗脱液C,第二个等度步骤维持6分钟的71%的洗脱液A和4%的洗脱液C,第二次历时2.6分钟从4%增加至12%的洗脱液C,第三个等度步骤维持3.4分钟的63%的洗脱液A和12%的洗脱液C,并第三次历时5分钟从12%增加至48%的洗脱液C。作为洗涤步骤,使用48%的洗脱液C持续3分钟。对于柱平衡,在1分钟内恢复75%的洗脱液A和0%的洗脱液C的初始条件并维持11分钟。应用的流速为0.5mL/min。
实施例5.材料和方法
酿酒酵母
培养基
使菌株在含有完全补充混合物的Synthetic Defined酵母培养基(SD CSM)或含有6.7g/L的不含氨基酸的酵母氮源基础培养基(Yeast Nitrogen Base,不含氨基酸的YNB,Difco)、20g/L琼脂(Difco)(固体培养物)、22g/L葡萄糖一水合物或20g/L乳糖和0.79g/LCSM或0.77g/L CSM-Ura、0.77g/L CSM-Trp或0.77g/L CSM-His(MP Biomedicals)的CSM缺陷型培养基(SD CSM-Ura,SD CSM-Trp,SD CSM-His)上生长。
菌株
使用由Brachmann等人(Yeast(1998)14:115-32)建立的酿酒酵母BY4742,其可在Euroscarf培养物保藏中心获得。所有突变株都使用Gietz(Yeast11:355-360,1995)的方法通过同源重组或质粒转化而建立。
质粒
为了产生唾液酸和CMP-唾液酸,酵母表达质粒可以衍生自pRS420-质粒系列(Christianson等人,1992,Gene 110:119-122),其含有TRP1选择标志物以及以下的组成型转录单元:L-谷氨酰胺-D-果糖-6-磷酸氨基转移酶(如例如具有SEQ ID NO 36的来自大肠杆菌的突变体glmS*54)、磷酸酶(如以下中的任意一种或多种:例如,包括aphA、Cof、HisB、OtsB、SurE、Yaed、YcjU、YedP、YfbT、YidA、YigB、YihX、YniC、YqaB、YrbL、AppA、Gph、SerB、YbhA、YbiV、YbjL、Yfb、YieH、YjgL、YjjG,YrfG和YbiU的大肠杆菌基因,或来自恶臭假单胞菌(Pseudomonas putida)的PsMupP,来自酿酒酵母的ScDOG1以及来自枯草芽孢杆菌的BsAraL,如WO18122225中所描述)、N-酰基葡糖胺2-差向异构酶(如例如具有SEQ ID NO 35的来自卵形拟杆菌的AGE)、N-乙酰神经氨酸(Neu(n)Ac)合酶(选自包含以下各项的列表:SEQ ID NO 02、03、04、05、06、07、08、09、10、11、12、13、14、15、16、17和18)和N-酰基神经氨酸胞苷酰基转移酶(如例如具有SEQ ID NO 40的来自多杀巴斯德氏菌的NeuA)。任选地,还添加葡糖胺6-磷酸N-乙酰基转移酶(如例如具有SEQ ID NO 34的来自酿酒酵母的GNA1)的组成型转录单元。为了产生唾液酸化的寡糖,所述质粒进一步包含以下的组成型转录单元:乳糖通透酶(如例如具有SEQ ID NO 72的来自乳酸克鲁维酵母的LAC12)和一种或多种唾液酸转移酶(如例如SEQ ID NO 41至45或80)。
为了产生GDP-岩藻糖,酵母表达质粒如p2a_2μ_Fuc(Chan 2013,Plasmid70,2-17)可以用于在酿酒酵母中表达外来基因。该质粒含有氨苄青霉素抗性基因和细菌复制起点以便在大肠杆菌中进行选择和维持,并含有2μ酵母ori和Ura3选择标志物用于在酵母中进行选择和维持。该质粒进一步用以下的组成型转录单元修饰:乳糖通透酶(如例如具有SEQ IDNO 72的来自乳酸克鲁维酵母的LAC12)、GDP-甘露糖4,6-脱水酶(如例如具有SEQ ID NO 56的来自大肠杆菌的gmd)和GDP-L-岩藻糖合酶(如例如具有SEQ ID NO 57的来自大肠杆菌的fcl)。酵母表达质粒p2a_2μ_Fuc2可以用作p2a_2μ_Fuc质粒的替代表达质粒,其包含挨着氨苄青霉素抗性基因的细菌ori、2μ酵母ori和Ura3选择标志物、关于以下的组成型转录单元:乳糖通透酶(如例如具有SEQ ID NO 72的来自乳酸克鲁维酵母的LAC12)、岩藻糖通透酶(如例如具有SEQ ID NO 58的来自大肠杆菌的fucP)和双功能的岩藻糖激酶/岩藻糖-1-磷酸鸟苷酰基转移酶(如例如具有SEQ ID NO 59的来自脆弱拟杆菌的fkp)。为了进一步产生岩藻糖基化的寡糖,p2a_2μ_Fuc和它的变体p2a_2μ_Fuc2另外含有关于一种或多种岩藻糖基转移酶的组成型转录单元,所述岩藻糖基转移酶如例如SEQ ID NO 50和51。
为了产生UDP-半乳糖,酵母表达质粒可以衍生自pRS420-质粒系列(Christianson等人,1992,Gene 110:119-122),其含有HIS3选择标志物和UDP-葡萄糖-4-差向异构酶(如例如具有SEQ ID NO 63的来自大肠杆菌的galE)的组成型转录单元。该质粒进一步用乳糖通透酶(如例如具有SEQ ID NO 72的来自乳酸克鲁维酵母的LAC12)、半乳糖苷β-1,3-N-乙酰葡糖胺基转移酶(如例如具有SEQ ID NO 60的来自脑膜炎奈瑟氏菌的lgtA)的组成型转录单元进行修饰以产生LN3。为了进一步产生LN3-衍生的寡糖如LNT或LNnT,在质粒上还分别添加N-乙酰葡糖胺β-1,3-半乳糖基转移酶(如例如具有SEQ ID NO 61的来自大肠杆菌O55:H7的WbgO)或N-乙酰葡糖胺β-1,4-半乳糖基转移酶(如例如具有SEQ ID NO 62的来自脑膜炎奈瑟氏菌的lgtB)。
优选地但不一定,糖基转移酶在N-端融合至SUMOstar标签(例如得自pYSUMOstar,Life Sensors,Malvern,PA)以增强它们的溶解度。
将质粒维持在购自Invitrogen的宿主大肠杆菌DH5α(F-,phi80dlacZδM15,δ(lacZYA-argF)U169,deoR,recA1,endA1,hsdR17(rk-,mk+),phoA,supE44,λ-,thi-1,gyrA96,relA1)中。
异源和同源表达
需要表达的基因(无论是来自质粒还是来自基因组)由以下公司之一合成:DNA2.0、Gen9、IDT或Twist Bioscience。通过将密码子使用优化为表达宿主的密码子使用,可以进一步促进表达。使用供应商的工具优化基因。
培养条件
一般而言,酵母菌株最初在SD CSM平板上生长以获得单个菌落。这些平板在30℃生长2-3天。从单个菌落开始,使预培养物在200rpm摇动下在30℃在5mL中生长过夜。随后给125mL摇瓶实验接种在25mL培养基中的2%的该预培养物。将这些摇瓶在30℃在200rpm的轨道摇动下进行孵育。
基因表达启动子
如Blazeck(Biotechnology and Bioengineering,Vol.109,No.11,2012)所述,使用合成的组成型启动子表达基因。
实施例6.用表达具有SEQ ID NO 02的Neu(n)Ac合酶的经修饰的大肠杆菌菌株产 生唾液酸(Neu5Ac)
如在实施例4中所述修饰大肠杆菌K-12菌株MG1655用于唾液酸产生,包含大肠杆菌nagA、nagB、nanA、nanE、nanK、LacZ和LacA基因的敲除以及含有下述的组成型转录单元的基因组敲入:具有SEQ ID NO 36的来自大肠杆菌的L-谷氨酰胺-D-果糖-6-磷酸氨基转移酶glmS*54,具有SEQ ID NO 34的来自酿酒酵母的葡糖胺6-磷酸N-乙酰基转移酶GNA1,具有SEQ ID NO 35的来自卵形拟杆菌的N-酰基葡糖胺2-差向异构酶AGE,具有SEQ ID NO 02的来自索氏梭菌(Paeniclostridium sordellii)UMC1的N-乙酰神经氨酸(Neu(n)Ac)合酶,具有SEQ ID NO 47的来自大肠杆菌W的蔗糖转运蛋白CscB,具有SEQ ID NO 48的来自运动发酵单胞菌的果糖激酶(Frk)和具有SEQ ID NO 49的来自青春双歧杆菌的蔗糖磷酸化酶。根据在实施例4中提供的培养条件对新菌株进行生长实验评价,其中所述培养基含有蔗糖。每个菌株在96-孔平板中进行四个生物学重复培养。孵育72小时后,收获培养液,并在UPLC上分析糖。该实验证明所述新菌株在整个培养液样品中产生唾液酸(Neu5Ac)。
实施例7.用表达具有SEQ ID NO 02的Neu(n)Ac合酶的经修饰的大肠杆菌菌株产 生6’-唾液酸基唾液酸(6’-SL)
如在实施例6中所述的用于产生唾液酸的经修饰的大肠杆菌K-12菌株MG1655被进一步修饰:敲除大肠杆菌LacY和nanT基因,并且基因组敲入含有下述的组成型转录单元:具有SEQ ID NO 46的来自大肠杆菌的乳糖通透酶(LacY),具有SEQ ID NO 66的来自大肠杆菌的唾液酸转运蛋白(nanT),具有SEQ ID NO 64的来自空肠弯曲杆菌和具有SEQ ID NO 65的来自流感嗜血杆菌的N-酰基神经氨酸胞苷酰基转移酶,以及具有SEQ ID NO 43的来自美人鱼发光杆菌的β-半乳糖苷α-2,6-唾液酸转移酶。用表达质粒进一步修改突变株,所述表达质粒包含关于下述的组成型转录单元:具有SEQ ID NO 40的来自多杀巴斯德氏菌的N-酰基神经氨酸胞苷酰基转移酶(NeuA)和具有SEQ ID NO 43的来自美人鱼发光杆菌的β-半乳糖苷α-2,6-唾液酸转移酶。根据在实施例4中提供的培养条件对新菌株进行生长实验评价,其中所述培养基含有蔗糖和乳糖。该菌株在96-孔平板中进行四个生物学重复培养。孵育72小时后,收获培养液,并在UPLC上分析糖。该实验证明所述新菌株在整个培养液样品中产生0.19±0.08g/L唾液酸(Neu5Ac)和2.43±0.31g/L 6’-唾液酸基乳糖。
实施例8.用表达具有SEQ ID NO 02的Neu(n)Ac合酶的经修饰的大肠杆菌菌株产 生6’-唾液酸基唾液酸(6’-SL)
如在实施例6中所述的用于产生唾液酸的经修饰的大肠杆菌K-12菌株MG1655被进一步修饰:敲除大肠杆菌LacY和nanT基因,并且基因组敲入含有下述的组成型转录单元:具有SEQ ID NO 46的来自大肠杆菌的乳糖通透酶(LacY),具有SEQ ID NO 66的来自大肠杆菌的唾液酸转运蛋白(nanT),具有SEQ ID NO 64的来自空肠弯曲杆菌和具有SEQ ID NO 65的来自流感嗜血杆菌的N-酰基神经氨酸胞苷酰基转移酶,以及具有SEQ ID NO 44的来自发光杆菌属种JT-ISH-224的β-半乳糖苷α-2,6-唾液酸转移酶。用表达质粒进一步修改突变株,所述表达质粒包含关于下述的组成型转录单元:具有SEQ ID NO 40的来自多杀巴斯德氏菌的N-酰基神经氨酸胞苷酰基转移酶(NeuA)和具有SEQ ID NO 44的来自发光杆菌属种JT-ISH-224的β-半乳糖苷α-2,6-唾液酸转移酶。根据在实施例4中提供的培养条件对新菌株进行生长实验评价,其中所述培养基含有蔗糖和乳糖。该菌株在96-孔平板中进行四个生物学重复培养。孵育72小时后,收获培养液,并在UPLC上分析糖。该实验证明所述新菌株在整个培养液样品中产生6’-唾液酸基乳糖。
实施例9.用表达具有SEQ ID NO 02的Neu(n)Ac合酶的经修饰的大肠杆菌菌株产 生3’-唾液酸基乳糖(3’-SL)
如在实施例6中所述的用于产生唾液酸的经修饰的大肠杆菌K-12菌株MG1655被进一步修饰:敲除大肠杆菌LacY和nanT基因,并且基因组敲入含有下述的组成型转录单元:具有SEQ ID NO 46的来自大肠杆菌的乳糖通透酶(LacY),具有SEQ ID NO 66的来自大肠杆菌的唾液酸转运蛋白(nanT),具有SEQ ID NO 64的来自空肠弯曲杆菌和具有SEQ ID NO 65的来自流感嗜血杆菌的N-酰基神经氨酸胞苷酰基转移酶,以及具有SEQ ID NO 41的来自多杀巴斯德氏菌多杀亚种Pm70菌株的β-半乳糖苷α-2,3-唾液酸转移酶。用表达质粒进一步修改突变株,所述表达质粒包含关于下述的组成型转录单元:具有SEQ ID NO 40的来自多杀巴斯德氏菌的N-酰基神经氨酸胞苷酰基转移酶(NeuA)和具有SEQ ID NO 41的来自多杀巴斯德氏菌多杀亚种Pm70菌株的β-半乳糖苷α-2,3-唾液酸转移酶。根据在实施例4中提供的培养条件对新菌株进行生长实验评价,其中所述培养基含有蔗糖和乳糖。该菌株在96-孔平板中进行四个生物学重复培养。孵育72小时后,收获培养液,并在UPLC上分析糖。
实施例10.用表达具有SEQ ID NO 02的Neu(n)Ac合酶的经修饰的大肠杆菌菌株产 生3’-唾液酸基乳糖(3’-SL)
如在实施例6中所述的用于产生唾液酸的经修饰的大肠杆菌K-12菌株MG1655被进一步修饰:敲除大肠杆菌LacY和nanT基因,并且基因组敲入含有下述的组成型转录单元:具有SEQ ID NO 46的来自大肠杆菌的乳糖通透酶(LacY),具有SEQ ID NO 66的来自大肠杆菌的唾液酸转运蛋白(nanT),具有SEQ ID NO 64的来自空肠弯曲杆菌和具有SEQ ID NO 65的来自流感嗜血杆菌的N-酰基神经氨酸胞苷酰基转移酶,以及具有SEQ ID NO 42的来自脑膜炎奈瑟氏菌的β-半乳糖苷α-2,3-唾液酸转移酶。用表达质粒进一步修改突变株,所述表达质粒包含关于下述的组成型转录单元:具有SEQ ID NO 40的来自多杀巴斯德氏菌的N-酰基神经氨酸胞苷酰基转移酶(NeuA)和具有SEQ ID NO 42的来自脑膜炎奈瑟氏菌的β-半乳糖苷α-2,3-唾液酸转移酶。根据在实施例4中提供的培养条件对新菌株进行生长实验评价,其中所述培养基含有蔗糖和乳糖。该菌株在96-孔平板中进行四个生物学重复培养。孵育72小时后,收获培养液,并在UPLC上分析糖。该实验证明所述新菌株在整个培养液样品中产生3’-唾液酸基乳糖。
实施例11.用表达具有SEQ ID NO 02的Neu(n)Ac合酶的经修饰的大肠杆菌菌株产 生3’-唾液酸基乳糖(3’-SL)
如在实施例6中所述的用于产生唾液酸的经修饰的大肠杆菌K-12菌株MG1655被进一步修饰:敲除大肠杆菌LacY和nanT基因,并且基因组敲入含有下述的组成型转录单元:具有SEQ ID NO 46的来自大肠杆菌的乳糖通透酶(LacY),具有SEQ ID NO 66的来自大肠杆菌的唾液酸转运蛋白(nanT),具有SEQ ID NO 64的来自空肠弯曲杆菌的N-酰基神经氨酸胞苷酰基转移酶,以及具有SEQ ID NO 80的来自多杀巴斯德氏菌的β-半乳糖苷α-2,3-唾液酸转移酶。根据在实施例4中提供的培养条件对新菌株进行生长实验评价,其中所述培养基含有蔗糖和乳糖。该菌株在96-孔平板中进行四个生物学重复培养。孵育72小时后,收获培养液,并在UPLC上分析糖。
实施例12.用表达具有SEQ ID NO 02的Neu(n)Ac合酶的经修饰的大肠杆菌菌株产 生3’-唾液酸基乳糖(3’-SL)
如在实施例6中所述的用于产生唾液酸的经修饰的大肠杆菌K-12菌株MG1655被进一步修饰:敲除大肠杆菌LacY和nanT基因,并且基因组敲入含有下述的组成型转录单元:具有SEQ ID NO 46的来自大肠杆菌的乳糖通透酶(LacY),具有SEQ ID NO 66的来自大肠杆菌的唾液酸转运蛋白(nanT),具有SEQ ID NO 64的来自空肠弯曲杆菌和具有SEQ ID NO 65的来自流感嗜血杆菌的N-酰基神经氨酸胞苷酰基转移酶,以及具有SEQ ID NO 80的来自多杀巴斯德氏菌的β-半乳糖苷α-2,3-唾液酸转移酶。根据在实施例4中提供的培养条件对新菌株进行生长实验评价,其中所述培养基含有蔗糖和乳糖。该菌株在96-孔平板中进行四个生物学重复培养。孵育72小时后,收获培养液,并在UPLC上分析糖。
实施例13.用表达具有SEQ ID NO 02的Neu(n)Ac合酶的经修饰的大肠杆菌菌株产 生3’-唾液酸基乳糖(3’-SL)
如在实施例6中所述的用于产生唾液酸的经修饰的大肠杆菌K-12菌株MG1655被进一步修饰:敲除大肠杆菌LacY和nanT基因,并且基因组敲入含有下述的组成型转录单元:具有SEQ ID NO 46的来自大肠杆菌的乳糖通透酶(LacY),具有SEQ ID NO 66的来自大肠杆菌的唾液酸转运蛋白(nanT),具有SEQ ID NO 64的来自空肠弯曲杆菌和具有SEQ ID NO 65的来自流感嗜血杆菌的N-酰基神经氨酸胞苷酰基转移酶,以及具有SEQ ID NO 80的来自多杀巴斯德氏菌的β-半乳糖苷α-2,3-唾液酸转移酶。用表达质粒进一步修改突变株,所述表达质粒包含关于下述的组成型转录单元:具有SEQ ID NO 40的来自多杀巴斯德氏菌的N-酰基神经氨酸胞苷酰基转移酶(NeuA)和具有SEQ ID NO 80的来自多杀巴斯德氏菌的β-半乳糖苷α-2,3-唾液酸转移酶。根据在实施例4中提供的培养条件对新菌株进行生长实验评价,其中所述培养基含有蔗糖和乳糖。该菌株在96-孔平板中进行四个生物学重复培养。孵育72小时后,收获培养液,并在UPLC上分析糖。
实施例14.对大肠杆菌突变株使用不同Neu(n)Ac合酶产生唾液酸(Neu5Ac)进行评
在后续实施例中,在大肠杆菌突变株中关于唾液酸产生对不同Neu(n)Ac合酶进行评价。这些Neu(n)Ac合酶选自:豚鼠气单胞菌(Aeromonas caviae)(SEQ ID NO 67),Candidatus koribacter versatilis(SEQ ID NO 68),嗜肺军团菌(Legionellapneumophila)(SEQ ID NO 69),Methanocaldococcus jannaschii(SEQ ID NO 70)和粘放线菌(Moritella viscosa)(SEQ ID NO 71),并在2022年2月23日在UniProt(www.uniprot.org)注释为neuB(SEQ ID NO 67)、N-乙酰神经氨酸合酶(SEQ ID NO 68)、N-乙酰神经氨酸缩合酶(SEQ ID NO 69)、N-乙酰神经氨酸合酶(SEQ ID NO 71)或具有N-乙酰神经氨酸-9-磷酸合酶(SEQ ID NO 70)活性。
具有SEQ ID NO 02并且具有SEQ ID NO 01的序列的来自索氏梭菌UMC1的Neu(n)Ac合酶用作参考Neu(n)Ac合酶,并且在实施例6和7中证明其是参与唾液酸(Neu5Ac)合成的功能性Neu(n)Ac合酶,SEQ ID NO 01的序列为[ILMV][MST]XXXXX(X,非K)(X,非Q)XXXXXXXXXXXX(X,非I)XXX(X,非T)X[ACS][ST][AP][FWY]XXX(X,非G)X(X,非L)X[IL](X,非K)XXXX(X,非E)XXKXXS,其中X是任何氨基酸。
如实施例4所述修饰大肠杆菌K-12菌株MG1655用于唾液酸产生,包括敲除大肠杆菌nagA、nagB、nanA、nanT、nanE、nanK、LacZ和LacA基因,和基因组敲入包含下述的组成型转录单元:具有SEQ ID NO 66的来自大肠杆菌的唾液酸转运蛋白(nanT),具有SEQ ID NO 36的来自大肠杆菌的L-谷氨酰胺-D-果糖-6-磷酸氨基转移酶glmS*54,具有SEQ ID NO 34的来自酿酒酵母的葡糖胺6-磷酸N-乙酰基转移酶GNA1,具有SEQ ID NO 35的来自卵形拟杆菌的N-乙酰葡糖胺2-差向异构酶AGE,选自SEQ ID NO 02、67、68、69、70或71的N-乙酰神经氨酸(Neu(n)Ac)合酶,具有SEQ ID NO 47的来自大肠杆菌W的蔗糖转运蛋白(CscB),具有SEQID NO 48的来自运动发酵单胞菌的果糖激酶(Frk),和具有SEQ ID NO 49的来自青春双歧杆菌的蔗糖磷酸化酶。根据在实施例4中提供的培养条件对新菌株进行生长实验评价,其中所述培养基含有蔗糖。每个菌株在96-孔平板中进行四个生物学重复培养。孵育72小时后,收获培养液,并在UPLC上分析糖。该实验证明表达选自豚鼠气单胞菌(Aeromonas caviae)(SEQ ID NO 67)、Candidatus koribacter versatilis(SEQ ID NO 68)、嗜肺军团菌(Legionella pneumophila)(SEQ ID NO 69)、Methanocaldococcus jannaschii(SEQ IDNO 70)和粘放线菌(Moritella viscosa)(SEQ ID NO 71)的大肠杆菌菌株在整个培养液样品中不产生唾液酸(Neu5Ac)。与此相反,参考菌株(表达选自索氏梭菌UMC1的具有SEQ IDNO 02的Neu(n)Ac合酶)在整个培养液样品中产生唾液酸(Neu5Ac)。
实施例15.在批次给料发酵中用经修饰的大肠杆菌菌株产生唾液酸和6’-唾液酸 基乳糖
在批次给料发酵过程中进一步评价实施例7所述的大肠杆菌突变株。生物反应器规模的批次给料发酵按实施例4所述进行。在这些实施例中,蔗糖用作碳源,并在批次培养基中添加乳糖作为前体。在发酵过程中不添加唾液酸(Neu5Ac)。与在本文中描述的培养实验(其中仅在培养结束时(即本文所述的72小时)采集最终样品)不同,在发酵过程中的几个时间点采集规律的培养液样品,并且如实施例4所述,使用UPLC测量每个所述时间点处唾液酸(Neu5Ac)和6’-唾液酸基乳糖的产生。该实验证明例如在批次阶段结束时和在批次给料阶段过程中采集的培养液样品包含唾液酸产生以及6’-唾液酸基乳糖和未修饰的乳糖。在批次给料阶段结束时采集的培养液样品包含6’-唾液酸基乳糖和几乎没有或非常低浓度的Neu5Ac以及几乎没有或非常低浓度的未修饰的乳糖,这证明几乎全部或全部的前体乳糖被在产生6’-SL的突变细胞的发酵过程中产生的几乎全部或全部Neu5Ac修饰。
实施例16.在批次给料发酵中用经修饰的大肠杆菌菌株产生唾液酸和3’-唾液酸 基乳糖
在批次给料发酵过程中进一步评价实施例9至13所述的大肠杆菌突变株。生物反应器规模的批次给料发酵按实施例4所述进行。在这些实施例中,蔗糖用作碳源,并在批次培养基中添加乳糖作为前体。在发酵过程中不添加唾液酸(Neu5Ac)。与在本文中描述的培养实验(其中仅在培养结束时(即本文所述的72小时)采集最终样品)不同,在发酵过程中的几个时间点采集规律的培养液样品,并且如实施例4所述,使用UPLC测量每个所述时间点处唾液酸(Neu5Ac)和3’-唾液酸基乳糖的产生。
实施例17.使用经修饰的大肠杆菌宿主产生包含6’SL、LN3、唾液酸化的LN3、LNnT 和LSTc的寡糖混合物
实施例7和8所述的用于产生6’-唾液酸基乳糖的大肠杆菌宿主通过基因组敲入被进一步修饰,包含具有SEQ ID NO 60的来自脑膜炎奈瑟氏菌的半乳糖苷β-1,3-N-乙酰葡糖胺基转移酶LgtA(用于产生LN3)和具有SEQ ID NO 62的来自脑膜炎奈瑟氏菌的N-乙酰葡糖胺β-1,4-半乳糖基转移酶LgtB(用于产生LNnT)的组成型转录单元,如实施例4所述,以产生包含6’SL、LN3、LNnT和LSTc(Neu5Ac-a2,6-Gal-b1,4-GlcNAc-b1,3-Gal-b1,4-Glc)的寡糖混合物。根据在实施例4中提供的培养条件对新菌株进行生长实验评价,其中所述培养基含有蔗糖和乳糖。该菌株在96-孔平板中进行四个生物学重复培养。孵育72小时后,收获培养液,并在UPLC上分析糖。
实施例18.使用经修饰的大肠杆菌宿主产生包含LN3、唾液酸化的LN3、LNT、3’-SL 和LSTa的寡糖混合物
实施例13所述的用于唾液酸(Neu5Ac)产生和3’-唾液酸基乳糖的大肠杆菌宿主通过基因组敲入被进一步修饰,包含具有SEQ ID NO 60的来自脑膜炎奈瑟氏菌的半乳糖苷β-1,3-N-乙酰葡糖胺基转移酶LgtA(用于产生LN3)和具有SEQ ID NO 61的来自大肠杆菌O55:H7的N-乙酰葡糖胺β-1,3-半乳糖基转移酶WbgO(用于产生LNT)的组成型转录单元,如实施例4所述,以产生包含LN3、3’-唾液酸化的LN3(Neu5Ac-a2,3-GlcNAc-b1,3-Gal-b1,4-Glc)、LNT、3’SL和LSTa(Neu5Ac-a2,3-Gal-b1,3-GlcNAc-b1,3-Gal-b1,4-Glc)的寡糖混合物。根据在实施例4中提供的培养条件对新菌株进行生长实验评价,其中所述培养基含有蔗糖和乳糖。该菌株在96-孔平板中进行四个生物学重复培养。孵育72小时后,收获培养液,并在UPLC上分析糖。
实施例19.使用经修饰的大肠杆菌宿主产生包含LN3、唾液酸化的LN3、LNT、3’-SL 和LSTa的寡糖混合物
实施例13所述的用于唾液酸(Neu5Ac)产生和3’-唾液酸基乳糖的大肠杆菌宿主通过基因组敲入被进一步修饰,包含具有SEQ ID NO 60的来自脑膜炎奈瑟氏菌的半乳糖苷β-1,3-N-乙酰葡糖胺基转移酶LgtA(用于产生LN3)和具有SEQ ID NO 62的来自脑膜炎奈瑟氏菌的N-乙酰葡糖胺β-1,4-半乳糖基转移酶LgtB(用于产生LNnT)的组成型转录单元,如实施例4所述,以产生包含3’SL、LN3、3’-唾液酸化的LN3(Neu5Ac-a2,3-GlcNAc-b1,3-Gal-b1,4-Glc)、LNnT和LSTd(Neu5Ac-a2,3-Gal-b1,4-GlcNAc-b1,3-Gal-b1,4-Glc)的寡糖混合物。根据在实施例4中提供的培养条件对新菌株进行生长实验评价,其中所述培养基含有蔗糖和乳糖。该菌株在96-孔平板中进行四个生物学重复培养。孵育72小时后,收获培养液,并在UPLC上分析糖。
实施例20.用表达具有SEQ ID NO02的Neu(n)Ac合酶的经修饰的大肠杆菌菌株产 生唾液酸(Neu5Ac)
如在实施例4中所述修饰大肠杆菌K-12菌株MG1655用于唾液酸产生,包含大肠杆菌nagA、nagB、nanA、nanE、nanK、LacZ和LacA基因的敲除以及含有下述的组成型转录单元的基因组敲入:具有SEQ ID NO 36的来自大肠杆菌的L-谷氨酰胺-D-果糖-6-磷酸氨基转移酶glmS*54,具有SEQ ID NO 37的来自大肠杆菌的磷酸葡糖胺变位酶glmM,具有SEQ ID NO 38的来自大肠杆菌的N-乙酰葡糖胺-1-磷酸尿苷酰基转移酶/葡糖胺-1-磷酸乙酰基转移酶glmU,具有SEQ ID NO 39的来自空肠弯曲杆菌的UDP-N-乙酰葡糖胺2-差向异构酶,具有SEQID NO 02的来自索氏梭菌(Paeniclostridium sordellii)UMC1的N-乙酰神经氨酸(Neu(n)Ac)合酶,具有SEQ ID NO 47的来自大肠杆菌W的蔗糖转运蛋白CscB,具有SEQ ID NO 48的来自运动发酵单胞菌的果糖激酶Frk和具有SEQ ID NO 49的来自青春双歧杆菌的蔗糖磷酸化酶。根据在实施例4中提供的培养条件对新菌株进行生长实验评价,其中所述培养基含有蔗糖。该菌株在96-孔平板中进行四个生物学重复培养。孵育72小时后,收获培养液,并在UPLC上分析糖。
实施例21.用表达具有SEQ ID NO 02的Neu(n)Ac合酶的经修饰的大肠杆菌菌株产 生6’-唾液酸基唾液酸(6’-SL)
如在实施例20中所述的用于产生唾液酸的经修饰的突变体大肠杆菌K-12菌株MG1655被进一步修饰:敲除大肠杆菌LacZ和nanT基因,并且基因组敲入含有下述的组成型转录单元:具有SEQ ID NO 46的来自大肠杆菌的乳糖通透酶(LacY),具有SEQ ID NO 66的来自大肠杆菌的唾液酸转运蛋白(nanT),和具有SEQ ID NO 64的来自空肠弯曲杆菌的N-酰基神经氨酸胞苷酰基转移酶NeuA。用表达质粒进一步修改突变株,所述表达质粒包含关于下述的组成型转录单元:具有SEQ ID NO 40的来自多杀巴斯德氏菌的N-酰基神经氨酸胞苷酰基转移酶NeuA和具有SEQ ID NO 43的来自美人鱼发光杆菌的β-半乳糖苷α-2,6-唾液酸转移酶。根据在实施例4中提供的培养条件对新菌株进行生长实验评价,其中所述培养基含有蔗糖和乳糖。该菌株在96-孔平板中进行四个生物学重复培养。孵育72小时后,收获培养液,并在UPLC上分析糖。
实施例22.用表达N-酰基神经氨酸-9-磷酸合成酶和磷酸酶的经修饰的大肠杆菌 菌株产生唾液酸(Neu5Ac)
如在实施例4中所述修饰大肠杆菌K-12菌株MG1655用于唾液酸产生,包含大肠杆菌nagA、nagB、nanA、nanE、nanK、LacZ和LacA基因的敲除以及含有下述的组成型转录单元的基因组敲入:具有SEQ ID NO 36的来自大肠杆菌的L-谷氨酰胺-D-果糖-6-磷酸氨基转移酶glmS*54,具有SEQ ID NO 37的来自大肠杆菌的磷酸葡糖胺变位酶glmM,具有SEQ ID NO 38的来自大肠杆菌的N-乙酰葡糖胺-1-磷酸尿苷酰基转移酶/葡糖胺-1-磷酸乙酰基转移酶glmU,具有SEQ ID NO 33的来自小家鼠(品系C57BL/6J)的双功能的UDP-GlcNAc 2-差向异构酶/N-乙酰基甘露糖激酶,选自包含SEQ ID NO 21、22、23、24、25、26、27和28的列表的N-酰基神经氨酸-9-磷酸合成酶,和具有SEQ ID NO 30的来自趋磁假丝酵母种HK-1的N-酰基神经氨酸-9-磷酸酶。根据在实施例4中提供的培养条件对新菌株进行生长实验评价,其中所述培养基含有葡萄糖。每个菌株在96-孔平板中进行四个生物学重复培养。孵育72小时后,收获培养液,并在UPLC上分析糖。
实施例23.用表达N-酰基神经氨酸-9-磷酸合成酶和磷酸酶的经修饰的大肠杆菌 菌株产生唾液酸(Neu5Ac)
如在实施例4中所述修饰大肠杆菌K-12菌株MG1655用于唾液酸产生,包含大肠杆菌nagA、nagB、nanA、nanE、nanK、LacZ和LacA基因的敲除以及含有下述的组成型转录单元的基因组敲入:具有SEQ ID NO 36的来自大肠杆菌的L-谷氨酰胺-D-果糖-6-磷酸氨基转移酶glmS*54,具有SEQ ID NO 37的来自大肠杆菌的磷酸葡糖胺变位酶glmM,具有SEQ ID NO 38的来自大肠杆菌的N-乙酰葡糖胺-1-磷酸尿苷酰基转移酶/葡糖胺-1-磷酸乙酰基转移酶glmU,具有SEQ ID NO 33的来自小家鼠(品系C57BL/6J)的双功能的UDP-GlcNAc 2-差向异构酶/N-乙酰基甘露糖激酶,选自包含SEQ ID NO 21、22、23、24、25、26、27和28的列表的N-酰基神经氨酸-9-磷酸合成酶,和具有SEQ ID NO 32的来自多形拟杆菌(菌株ATCC 29148)的N-酰基神经氨酸-9-磷酸酶。根据在实施例4中提供的培养条件对新菌株进行生长实验评价,其中所述培养基含有葡萄糖。每个菌株在96-孔平板中进行四个生物学重复培养。孵育72小时后,收获培养液,并在UPLC上分析糖。
实施例24.用表达N-酰基神经氨酸-9-磷酸合成酶和磷酸酶的经修饰的大肠杆菌 菌株产生6’-唾液酸基乳糖(6’-SL)
实施例22和23所述的经修饰用于Neu5Ac产生的大肠杆菌突变株通过基因组敲入组成型转录单元而被进一步修饰,所述组成型转录单元包含具有SEQ ID NO 46的来自大肠杆菌的乳糖通透酶(LacY)和具有SEQ ID NO 64的来自空肠弯曲杆菌的N-酰基神经氨酸胞苷酰基转移酶(NeuA)。用表达质粒进一步修改突变株,所述表达质粒包含关于下述的组成型转录单元:具有SEQ ID NO 40的来自多杀巴斯德氏菌的N-酰基神经氨酸胞苷酰基转移酶(NeuA)和具有SEQ ID NO 43的来自美人鱼发光杆菌的β-半乳糖苷α-2,6-唾液酸转移酶。根据在实施例4中提供的培养条件对新菌株进行生长实验评价,其中所述培养基含有葡萄糖和乳糖。每个菌株在96-孔平板中进行四个生物学重复培养。孵育72小时后,收获培养液,并在UPLC上分析糖。
实施例25.用表达N-酰基神经氨酸-9-磷酸合成酶和磷酸酶的经修饰的大肠杆菌 菌株产生3’-唾液酸基乳糖(3’-SL)
实施例22和23所述的经修饰用于Neu5Ac产生的大肠杆菌突变株通过基因组敲入组成型转录单元而被进一步修饰,所述组成型转录单元包含具有SEQ ID NO 46的来自大肠杆菌的乳糖通透酶(LacY)和具有SEQ ID NO 64的来自空肠弯曲杆菌的N-酰基神经氨酸胞苷酰基转移酶(NeuA)。用表达质粒进一步修改突变株,所述表达质粒包含关于下述的组成型转录单元:具有SEQ ID NO 40的来自多杀巴斯德氏菌的N-酰基神经氨酸胞苷酰基转移酶(NeuA)和具有SEQ ID NO 80的来自多杀巴斯德氏菌的β-半乳糖苷α-2,3-唾液酸转移酶。根据在实施例4中提供的培养条件对新菌株进行生长实验评价,其中所述培养基含有葡萄糖和乳糖。每个菌株在96-孔平板中进行四个生物学重复培养。孵育72小时后,收获培养液,并在UPLC上分析糖。
实施例26.用表达具有SEQ ID NO 02的Neu(n)Ac合酶的经修饰的酿酒酵母菌株产 生唾液酸(Neu5Ac)
如实施例5所述,用pRS420-衍生的酵母表达质粒修改酿酒酵母用于唾液酸(Neu5Ac)产生,所述酵母表达质粒包含TRP1选择标志物和关于下述的组成型转录单元:具有SEQ ID NO 36的来自大肠杆菌的突变体glmS*54,磷酸酶(如下述中的任何一种或多种:例如,包含aphA、Cof、HisB、OtsB、SurE、Yaed、YcjU、YedP、YfbT、YidA、YigB、YihX、YniC、YqaB、YrbL、AppA、Gph、SerB、YbhA、YbiV、YbjL、Yfb、YieH、YjgL、YjjG、YrfG和YbiU的大肠杆菌基因,或来自恶臭假单胞菌的PsMupP,来自酿酒酵母的ScDOG1和来自枯草芽孢杆菌的BsAraL,如在WO18122225中所描述),具有SEQ ID NO 35的来自卵形拟杆菌的N-乙酰葡糖胺2-差向异构酶AGE,和具有SEQ ID NO 02的来自索氏梭菌UMC1的Neu(n)Ac合酶。根据在实施例5中提供的培养条件在SD CSM-Trp缺陷型培养基上对新菌株进行生长实验评价。孵育72小时后,收获培养液,并在UPLC上分析糖。
实施例27.用表达具有SEQ ID NO 02的Neu(n)Ac合酶的经修饰的酿酒酵母菌株产 生6’-唾液酸基乳糖(6’-SL)
如实施例5所述,用pRS420-衍生的酵母表达质粒修改酿酒酵母用于唾液酸(Neu5Ac)和6’-唾液酸基乳糖产生,所述酵母表达质粒包含TRP1选择标志物和关于下述的组成型转录单元:具有SEQ ID NO 36的来自大肠杆菌的突变体glmS*54,磷酸酶(如下述中的任何一种或多种:例如,包含aphA、Cof、HisB、OtsB、SurE、Yaed、YcjU、YedP、YfbT、YidA、YigB、YihX、YniC、YqaB、YrbL、AppA、Gph、SerB、YbhA、YbiV、YbjL、Yfb、YieH、YjgL、YjjG、YrfG和YbiU的大肠杆菌基因,或来自恶臭假单胞菌的PsMupP,来自酿酒酵母的ScDOG1和来自枯草芽孢杆菌的BsAraL,如在WO18122225中所描述),具有SEQ ID NO 35的来自卵形拟杆菌的N-乙酰葡糖胺2-差向异构酶AGE,具有SEQ ID NO 02的来自索氏梭菌UMC1的Neu(n)Ac合酶,具有SEQ ID NO 40的来自多杀巴斯德氏菌的N-酰基神经氨酸胞苷酰基转移酶NeuA,具有SEQ ID NO 43的来自美人鱼发光杆菌的β-半乳糖苷α-2,6-唾液酸转移酶,和具有SEQ IDNO 72的来自乳酸克鲁维酵母的乳糖通透酶LAC12。根据在实施例5中提供的培养条件在包含乳糖作为前体的SD CSM-Trp缺陷型培养基上对新菌株进行生长实验评价。孵育72小时后,收获培养液,并在UPLC上分析糖。
实施例28.用经修饰的酿酒酵母宿主产生包含6’-SL、LN3、唾液酸化的LN3、LNnT和 LSTc的乳糖混合物
实施例27所述的酿酒酵母突变株用第二pRS420-衍生的酵母表达质粒进一步修饰,所述第二pRS420-衍生的酵母表达质粒包含HIS3选择标志物和关于下述的组成型转录单元:具有SEQ ID NO 63的来自大肠杆菌的galE,具有SEQ ID NO 60的来自脑膜炎奈瑟氏菌的半乳糖苷β-1,3-N-乙酰葡糖胺基转移酶(LgtA)和具有SEQ ID NO 62的来自脑膜炎奈瑟氏菌的N-乙酰葡糖胺β-1,4-半乳糖基转移酶(LgtB),以产生包含6’-SL、LN3、LNnT和LSTc(Neu5Ac-a2,6-Gal-b1,4-GlcNAc-b1,3-Gal-b1,4-Glc)的乳糖混合物。根据在实施例5中提供的培养条件在包含乳糖作为前体的SD CSM-Trp-His缺陷型培养基上对新菌株进行生长实验评价。孵育72小时后,收获培养液,并在UPLC上分析糖。
实施例29.用表达具有SEQ ID NO02的Neu(n)Ac合酶的经修饰的酿酒酵母菌株产 生3’-唾液酸基乳糖(3’-SL)
如实施例5所述,用pRS420-衍生的酵母表达质粒修改酿酒酵母用于唾液酸(Neu5Ac)和3’-唾液酸基乳糖产生,所述酵母表达质粒包含TRP1选择标志物和关于下述的组成型转录单元:具有SEQ ID NO 36的来自大肠杆菌的突变体glmS*54,磷酸酶(如下述中的任何一种或多种:例如,包含aphA、Cof、HisB、OtsB、SurE、Yaed、YcjU、YedP、YfbT、YidA、YigB、YihX、YniC、YqaB、YrbL、AppA、Gph、SerB、YbhA、YbiV、YbjL、Yfb、YieH、YjgL、YjjG、YrfG和YbiU的大肠杆菌基因,或来自恶臭假单胞菌的PsMupP,来自酿酒酵母的ScDOG1和来自枯草芽孢杆菌的BsAraL,如在WO18122225中所描述),具有SEQ ID NO 35的来自卵形拟杆菌的N-乙酰葡糖胺2-差向异构酶AGE,具有SEQ ID NO 02的来自索氏梭菌UMC1的Neu(n)Ac合酶,具有SEQ ID NO 40的来自多杀巴斯德氏菌的N-酰基神经氨酸胞苷酰基转移酶NeuA,具有SEQ ID NO 80的来自多杀巴斯德氏菌的β-半乳糖苷α-2,3-唾液酸转移酶,和具有SEQ IDNO 72的来自乳酸克鲁维酵母的乳糖通透酶LAC12。根据在实施例5中提供的培养条件在包含乳糖作为前体的SD CSM-Trp缺陷型培养基上对新菌株进行生长实验评价。孵育72小时后,收获培养液,并在UPLC上分析糖。
实施例30.用经修饰的酿酒酵母宿主产生包含LN3、唾液酸化的LN3、LNT、3’-SL和 LSTa的寡糖混合物
实施例29所述的酿酒酵母突变株用第二pRS420-衍生的酵母表达质粒进一步修饰,所述第二pRS420-衍生的酵母表达质粒包含HIS3选择标志物和关于下述的组成型转录单元:具有SEQ ID NO 63的来自大肠杆菌的UDP-葡萄糖-4-差向异构酶galE,具有SEQ IDNO 60的来自脑膜炎奈瑟氏菌的半乳糖苷β-1,3-N-乙酰葡糖胺基转移酶LgtA和具有SEQ IDNO 61的来自大肠杆菌O55:H7的N-乙酰葡糖胺β-1,3-半乳糖基转移酶WbgO,以产生包含LN3、3’-唾液酸化的LN3(Neu5Ac-a2,3-GlcNAc-b1,3-Gal-b1,4-Glc)、LNT、3’SL和LSTa(Neu5Ac-a2,3-Gal-b1,3-GlcNAc-b1,3-Gal-b1,4-Glc)的乳糖混合物。根据在实施例5中提供的培养条件在包含乳糖作为前体的SD CSM-Trp-His缺陷型培养基上对新菌株进行生长实验评价。孵育72小时后,收获培养液,并在UPLC上分析糖。
实施例31.用经修饰的酿酒酵母宿主产生包含LN3、唾液酸化的LN3、LNnT、3’-SL和 LSTd的寡糖混合物
实施例29所述的酿酒酵母突变株用第二pRS420-衍生的酵母表达质粒进一步修饰,所述第二pRS420-衍生的酵母表达质粒包含HIS3选择标志物和关于下述的组成型转录单元:具有SEQ ID NO 63的来自大肠杆菌的UDP-葡萄糖-4-差向异构酶galE,具有SEQ IDNO 60的来自脑膜炎奈瑟氏菌的半乳糖苷β-1,3-N-乙酰葡糖胺基转移酶LgtA和具有SEQ IDNO 62的来自脑膜炎奈瑟氏菌的N-乙酰葡糖胺β-1,4-半乳糖基转移酶LgtB,以产生包含3’SL、LN3、3’-唾液酸化的LN3(Neu5Ac-a2,3-GlcNAc-b1,3-Gal-b1,4-Glc)、LNnT和LSTd(Neu5Ac-a2,3-Gal-b1,4-GlcNAc-b1,3-Gal-b1,4-Glc)的乳糖混合物。根据在实施例5中提供的培养条件在包含乳糖作为前体的SD CSM-Trp-His缺陷型培养基上对新菌株进行生长实验评价。孵育72小时后,收获培养液,并在UPLC上分析糖。
序列表
<110> 因比奥斯公司(Inbiose N.V.)
<120> 产生含有Neu(n)Ac的化合物
<130> 039-PCT
<150> EP21168995.5
<151> 2021-04-16
<160> 80
<170> PatentIn version 3.5
<210> 1
<211> 51
<212> PRT
<213> 人工序列
<220>
<223> 结构域部分1
<220>
<221> 变体
<222> (1)..(1)
<223> Xaa可以是Ile, Leu, Met或Val
<220>
<221> 变体
<222> (2)..(2)
<223> Xaa可以是Met, Ser或Thr
<220>
<221> 不确定
<222> (3)..(7)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> 不确定
<222> (8)..(8)
<223> Xaa可以是除Lys外的任何天然存在的氨基酸
<220>
<221> 不确定
<222> (9)..(9)
<223> Xaa可以是除Gln外的任何天然存在的氨基酸
<220>
<221> 不确定
<222> (10)..(21)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> 不确定
<222> (22)..(22)
<223> Xaa可以是除Ile外的任何天然存在的氨基酸
<220>
<221> 不确定
<222> (23)..(25)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> 不确定
<222> (26)..(26)
<223> Xaa可以是除Thr外的任何天然存在的氨基酸
<220>
<221> 不确定
<222> (27)..(27)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> 变体
<222> (28)..(28)
<223> Xaa可以是Ala, Cys或Ser
<220>
<221> 变体
<222> (29)..(29)
<223> Xaa可以是Ser或Thr
<220>
<221> 变体
<222> (30)..(30)
<223> Xaa可以是Ala或Pro
<220>
<221> 变体
<222> (31)..(31)
<223> Xaa可以是Phe, Trp或Tyr
<220>
<221> 不确定
<222> (32)..(34)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> 不确定
<222> (35)..(35)
<223> Xaa可以是除Gly外的任何天然存在的氨基酸
<220>
<221> 不确定
<222> (36)..(36)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> 不确定
<222> (37)..(37)
<223> Xaa可以是除Leu外的任何天然存在的氨基酸
<220>
<221> 不确定
<222> (38)..(38)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> 变体
<222> (39)..(39)
<223> Xaa可以是Ile或Leu
<220>
<221> 不确定
<222> (40)..(40)
<223> Xaa可以是除Lys外的任何天然存在的氨基酸
<220>
<221> 不确定
<222> (41)..(44)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> 不确定
<222> (45)..(45)
<223> Xaa可以是除Glu外的任何天然存在的氨基酸
<220>
<221> 不确定
<222> (46)..(47)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> 不确定
<222> (49)..(50)
<223> Xaa可以是任何天然存在的氨基酸
<400> 1
Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa
1 5 10 15
Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa
20 25 30
Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Lys
35 40 45
Xaa Xaa Ser
50
<210> 2
<211> 348
<212> PRT
<213> 索氏梭菌UMC1
<400> 2
Met Asn Lys Asn Tyr Met Gln Ile Gly Asn Arg Lys Ile Gly Glu Asp
1 5 10 15
Tyr Ala Pro Leu Val Ile Ala Glu Ile Gly Ile Asn His Glu Gly Ser
20 25 30
Leu Lys Thr Ala Leu Glu Met Val Asp Ala Ala Tyr Glu Ala Gly Ala
35 40 45
Glu Val Ile Lys His Gln Thr His Val Val Glu Asp Glu Met Ser Lys
50 55 60
Ala Ala Lys Lys Val Ile Pro Gly Asn Thr Asp Val Ser Ile Tyr Asp
65 70 75 80
Val Met Lys Arg Cys Ala Leu Asn Glu Glu Asp Glu Thr Lys Leu Lys
85 90 95
Glu Tyr Val Glu Ser Lys Gly Met Ile Phe Ile Ser Thr Pro Phe Ser
100 105 110
Arg Ser Ala Ala Asn Arg Leu Glu Arg Met Gly Val Lys Ala Tyr Lys
115 120 125
Ile Gly Ser Gly Glu Cys Asn Asn Tyr Pro Leu Ile Asp His Ile Ala
130 135 140
Ser Phe Gly Lys Pro Ile Ile Leu Ser Thr Gly Met Asn Asp Ile Glu
145 150 155 160
Ser Ile Arg Lys Ser Val Glu Ile Met Glu Lys His Gly Val Lys Tyr
165 170 175
Ser Leu Leu His Cys Thr Asn Leu Tyr Pro Thr Pro Ala Asn Leu Val
180 185 190
Arg Leu Gly Gly Met Glu Glu Leu Gln Lys Glu Phe Pro Asn Ala Ile
195 200 205
Val Gly Leu Ser Asp His Thr Val Asn Asn Asn Ala Cys Leu Ala Ala
210 215 220
Thr Ala Leu Gly Ala Ser Val Leu Glu Arg His Phe Thr Asp Ser Lys
225 230 235 240
Asp Arg Pro Gly Pro Asp Ile Val Cys Ser Met Asp Pro Lys Glu Leu
245 250 255
Lys Glu Leu Ile Glu Gly Ser Lys Glu Ile Gln Gln Met Arg Gly Gly
260 265 270
Lys Lys Val Ala Ala Lys Glu Glu Gln Val Thr Ile Asp Phe Ala Phe
275 280 285
Ala Thr Val Val Thr Thr Lys Asp Leu Lys Lys Gly Asp Val Leu Ser
290 295 300
Lys Asp Asn Ile Trp Val Lys Arg Pro Gly Thr Gly Gln Ile Lys Ala
305 310 315 320
Glu His Tyr Glu Ser Leu Ile Gly Lys Arg Ile Asn Lys Asp Ile Glu
325 330 335
Asn Asp Glu His Leu Cys Trp Ala Asp Ile Glu Glu
340 345
<210> 3
<211> 346
<212> PRT
<213> 大肠杆菌菌株MOD1-EC5561
<400> 3
Met Glu Lys Val Tyr Ile Val Ala Glu Ile Gly Cys Asn His Asn Gly
1 5 10 15
Asp Phe Leu Ile Ala Lys Lys Met Val Ser Glu Ala Lys Met Ala Gly
20 25 30
Val Asp Ala Val Lys Phe Gln Thr Phe Lys Ala Glu Leu Leu Ile Ser
35 40 45
Lys Tyr Ala Pro Lys Ala Glu Tyr Gln Lys Lys Val Thr Asp Ala Asp
50 55 60
Glu Ser Gln Leu Asp Met Thr Lys Lys Leu Glu Leu Pro Tyr Asp Arg
65 70 75 80
Tyr Ile Glu Leu Glu Asn Tyr Ala Arg Ser Leu Gly Leu Asp Val Phe
85 90 95
Ser Thr Pro Phe Asp Leu Asp Ser Ile Asp Phe Leu Tyr Ser Gln Lys
100 105 110
Gln Lys Thr Trp Lys Ile Pro Ser Gly Glu Leu Leu Asn Leu Pro Tyr
115 120 125
Ile Glu Lys Ile Ala Lys Leu Pro Ile Asp Asp Lys Arg Ile Ile Ile
130 135 140
Ser Thr Gly Met Ser Thr Ile Asp Glu Ile Lys Leu Cys Leu Ser Val
145 150 155 160
Phe Asp Asn Asn Gly Val Pro Lys Ser Asn Ile Thr Ile Leu His Cys
165 170 175
Asn Thr Glu Tyr Pro Thr Pro Phe Gly Asp Val Asn Leu Ser Val Ile
180 185 190
Ser Ser Tyr Lys Lys Ile Phe Pro Glu Tyr Asn Ile Gly Phe Ser Asp
195 200 205
His Ser Pro Gly Phe Tyr Ala Gly Ile Ala Ala Val Pro Phe Gly Ile
210 215 220
Thr Phe Ile Glu Lys His Phe Thr Leu Asp Lys Thr Leu Pro Gly Pro
225 230 235 240
Asp His Lys Ala Ser Val Thr Pro Asp Glu Leu Arg Met Leu Cys Glu
245 250 255
Gly Ile Arg Cys Val Glu Leu Ala Leu Gly Ser Pro Asp Lys Lys Val
260 265 270
Thr Asp Ser Glu Lys Lys Asn Lys Ile Val Ala Arg Lys Ser Ile Val
275 280 285
Ala Lys Thr Lys Ile Ala Lys Gly Asp Ile Phe Thr Val Asp Asn Ile
290 295 300
Thr Thr Lys Arg Pro Gly Asn Gly Ile Ser Pro Met Tyr Trp Tyr Asp
305 310 315 320
Ile Leu Gly Lys Ala Ala Glu Phe Asp Phe Glu Glu Asp Glu Leu Val
325 330 335
Val His Thr Ala Tyr Lys Pro Gln Glu Val
340 345
<210> 4
<211> 346
<212> PRT
<213> 普罗威登菌属种 wls1916
<400> 4
Met Asn Lys Ile Tyr Ile Val Ala Glu Ile Gly Cys Asn His Asn Gly
1 5 10 15
Asp Phe Gln Leu Ala Lys Ile Met Val Asp Glu Ala Lys Ala Ala Gly
20 25 30
Val Asp Ala Val Lys Phe Gln Thr Phe Lys Ala Glu Leu Leu Ile Ser
35 40 45
Lys Ile Ala Pro Lys Ala Glu Tyr Gln Ile Lys Val Thr Gly Asn Thr
50 55 60
Glu Ser Gln Leu Glu Met Thr Lys Lys Leu Glu Leu Pro Tyr Asp Gln
65 70 75 80
Phe Ile Lys Leu Glu Lys Tyr Ala Lys Glu Leu Gly Leu Asp Val Phe
85 90 95
Ser Thr Pro Phe Asp Met Asp Ser Ile Asp Phe Leu Ala Thr Arg Asn
100 105 110
Gln Lys Met Trp Lys Ile Pro Ser Gly Glu Leu Leu Asn Leu Pro Tyr
115 120 125
Leu Glu Lys Ile Ala Gln Leu Gln Ile Glu Asn Lys Glu Ile Val Leu
130 135 140
Ser Thr Gly Met Ala Thr Ile Asp Glu Ile Lys Gln Ala Leu Asn Ile
145 150 155 160
Leu Lys Gly Asn Gly Val His Ser Asn Gln Ile Thr Ile Leu His Cys
165 170 175
Asn Thr Glu Tyr Pro Thr Pro Phe Glu Asp Val Asn Leu Asn Ala Ile
180 185 190
Lys Gly Leu Lys Asn Glu Phe Pro Glu Tyr Arg Ile Gly Phe Ser Asp
195 200 205
His Ser Ser Gly Tyr Phe Ala Gly Ile Ala Ser Val Pro Tyr Gly Ile
210 215 220
Thr Phe Ile Glu Lys His Phe Thr Leu Asp Lys Asn Phe Glu Gly Pro
225 230 235 240
Asp His Lys Ala Ser Val Thr Pro Asp Glu Leu Thr Leu Leu Cys Gln
245 250 255
Gly Ile Arg Ala Val Glu Lys Ser Leu Gly Ser Glu Glu Lys Lys Val
260 265 270
Thr Glu Ser Glu Arg Lys Asn Lys Ile Val Ala Arg Lys Ser Ile Val
275 280 285
Ala Arg Val Asn Ile Lys Lys Gly Asp Thr Tyr Thr Val Glu Asn Ile
290 295 300
Thr Thr Lys Arg Pro Gly Asn Gly Ile Ser Pro Met His Trp His Glu
305 310 315 320
Ile Leu Gly Lys Thr Ala Glu Ser Asp Phe Asn Glu Asp Gln Leu Ile
325 330 335
Lys His Asn Gly Phe Asp Met Gln Glu Val
340 345
<210> 5
<211> 338
<212> PRT
<213> 反刍链球菌菌株GUT187T
<400> 5
Met Val Tyr Ile Ile Ala Glu Ile Gly Cys Asn His Asn Gly Asp Val
1 5 10 15
His Leu Ala Lys Lys Met Val Asp Val Ala Val Gln Cys Gly Val Asp
20 25 30
Ala Val Lys Phe Gln Thr Phe Lys Ala Glu Lys Leu Ile Ser Lys Tyr
35 40 45
Ala Pro Lys Ala Glu Tyr Gln Lys Glu Thr Thr Gly Glu Lys Asp Ser
50 55 60
Gln Leu Glu Met Thr Arg Arg Leu Glu Leu Ser Phe Asp Glu Tyr Leu
65 70 75 80
Glu Leu Arg Asp Tyr Cys Leu Ser Lys His Val Asp Val Phe Ser Thr
85 90 95
Pro Phe Asp Glu Glu Ser Leu Asp Phe Leu Ile Ser Thr Asn Met Pro
100 105 110
Val Tyr Lys Ile Pro Ser Gly Glu Ile Thr Asn Leu Pro Tyr Leu Glu
115 120 125
Lys Ile Gly Lys Gln Gly Lys Lys Val Ile Leu Ser Thr Gly Met Ala
130 135 140
Ala Ile Glu Glu Ile His Arg Ala Val Gly Ile Leu Arg Glu Asn Gly
145 150 155 160
Thr Thr Asp Ile Ser Ile Leu His Cys Thr Thr Glu Tyr Pro Ala Pro
165 170 175
Tyr Arg Ser Leu His Leu Asn Val Leu Thr Thr Leu Lys Lys Glu Phe
180 185 190
Pro Asn Ala Ser Ile Gly Tyr Ser Asp His Ser Ile Gly Ser Glu Val
195 200 205
Pro Ile Ala Ala Val Ala Leu Gly Ala Ser Ile Ile Glu Lys His Phe
210 215 220
Thr Leu Asp Asn Ala Met Glu Gly Pro Asp His Arg Ala Ser Ala Thr
225 230 235 240
Pro Glu Val Leu Ser Asp Leu Val Lys Gly Val Arg Ile Ile Glu Gln
245 250 255
Ala Leu Gly Arg Ser Glu Lys Ile Pro Asp Pro Val Glu Glu Lys Asn
260 265 270
Lys Ile Val Ala Arg Lys Ser Ile Val Ala Lys Lys Asp Ile Lys Lys
275 280 285
Gly Asp Ile Phe Ser Val Asp Asn Ile Thr Val Lys Arg Pro Gly Asp
290 295 300
Gly Ile Ser Pro Met Lys Trp Tyr Asp Ile Leu Gly Lys Val Ser Glu
305 310 315 320
Ala Asp Phe Glu Val Asp Gln Asn Ile Ile His Ser Asp Phe Ala Asn
325 330 335
Gln Leu
<210> 6
<211> 345
<212> PRT
<213> Helicobacter mesocricetorum 菌株87012_3
<400> 6
Met Gln Ile Gln Ile Ser His Leu Lys Ile Ser Glu Glu Val Ser Pro
1 5 10 15
Leu Val Val Pro Glu Ile Gly Ile Asn His Asn Gly Ser Leu Glu Leu
20 25 30
Ala Lys Leu Met Val Asp Ser Ala Lys Arg Ala Gly Ala Lys Ile Ile
35 40 45
Lys His Gln Thr His Ile Ile Glu Asp Glu Met Ser Ser Glu Ala Lys
50 55 60
Gln Val Ile Pro Gly Asn Ala Lys Ile Ser Ile Tyr Glu Ile Met Lys
65 70 75 80
Lys Cys Ala Leu Gly Tyr Lys Asp Glu Leu Ala Leu Lys Glu Tyr Ala
85 90 95
Glu Ser Lys Gly Leu Val Tyr Leu Ser Thr Pro Phe Ser Arg Ala Ala
100 105 110
Ala Asn Arg Leu Gln Asp Met Gly Val Ser Ala Phe Lys Ile Gly Ser
115 120 125
Gly Glu Cys Asn Asn Thr Pro Leu Leu Lys His Ile Ala Ser Phe Lys
130 135 140
Lys Pro Met Ile Leu Ser Thr Gly Met Asn Asn Leu Ala Ser Ile Lys
145 150 155 160
Glu Ser Val Lys Ile Leu Arg Asp Asn Glu Ile Pro Phe Val Leu Leu
165 170 175
His Thr Thr Asn Leu Tyr Pro Thr Pro Pro His Leu Val Arg Leu Gly
180 185 190
Ala Met Leu Glu Leu Lys Lys Ala Phe Asp Cys Leu Val Gly Leu Ser
195 200 205
Asp His Thr Leu Asp Asn Leu Ala Cys Leu Gly Ala Thr Ala Leu Gly
210 215 220
Ala Cys Val Leu Glu Arg His Phe Thr Asp Thr Met Asp Arg Glu Gly
225 230 235 240
Pro Asp Ile Val Cys Ser Met Asp Glu Lys Ala Leu Lys Glu Leu Ile
245 250 255
Ile Lys Ser Glu Gln Met Ala Ile Leu Arg Gly Leu Asn Ala Ser Lys
260 265 270
Met Ala Ala Ser Glu Glu Gln Val Thr Ile Asp Phe Ala Phe Ala Ser
275 280 285
Val Val Ser Ile Gln Ala Ile Thr Lys Gly Glu Leu Leu Ser Lys Glu
290 295 300
Asn Ile Trp Val Lys Arg Pro Gly Lys Gly Gly Ile Pro Ala Ser Glu
305 310 315 320
Phe Glu Lys Ile Leu Gly Arg Arg Ala Leu Arg Asp Ile Ser Lys Asp
325 330 335
Arg Gln Leu Ser Tyr Glu Asp Phe Glu
340 345
<210> 7
<211> 349
<212> PRT
<213> 粘膜弯曲杆菌菌株ATCC 43264
<400> 7
Met Gln Asn Pro Lys Glu Phe Lys Ile Gln Asn Arg Leu Val Gly Ile
1 5 10 15
Asn His Glu Pro Leu Ile Ile Cys Glu Ile Gly Ile Asn His Glu Gly
20 25 30
Ser Ile Lys Thr Ala Phe Glu Met Val Asp Ala Ala His Arg Ala Gly
35 40 45
Ala Glu Val Ile Lys His Gln Thr His Ile Val Glu Asp Glu Met Ser
50 55 60
Asn Glu Ala Lys Gly Val Ile Pro Gly Asn Ala Asp Val Ser Ile Tyr
65 70 75 80
Glu Ile Met Lys Arg Cys Ala Leu Asn Glu Glu Asp Glu Ile Lys Leu
85 90 95
Gln Lys Tyr Val Glu Ser Lys Gly Met Ile Phe Ile Ser Thr Pro Phe
100 105 110
Ser Arg Ala Ala Ala His Arg Leu Gln Lys Met Asn Ile Pro Ala Tyr
115 120 125
Lys Ile Gly Ser Gly Glu Cys Asn Asn Tyr Pro Leu Val Lys Leu Ile
130 135 140
Ala Ser Phe Gly Lys Pro Ile Ile Leu Ser Thr Gly Met Asn Asp Ile
145 150 155 160
Gln Ser Ile Lys Lys Thr Val Ser Ile Ile Glu Ser Ala Gly Val Pro
165 170 175
Tyr Ala Leu Leu His Cys Thr Asn Val Tyr Pro Thr Lys Tyr Ser Asp
180 185 190
Val Arg Leu Gly Ala Met Ser Glu Leu Met Arg Glu Phe Pro Asn Ala
195 200 205
Val Val Gly Leu Ser Asp His Thr Thr Asp Asn Tyr Ala Cys Met Gly
210 215 220
Ala Val Ala Leu Gly Ala Ser Ile Leu Glu Arg His Phe Thr Asp Ser
225 230 235 240
Met His Arg Val Gly Pro Asp Ile Val Cys Ser Met Asp Pro Ile Ala
245 250 255
Phe Lys Glu Leu Lys Thr Ala Ser Ser Ala Leu Ala Lys Met Arg Phe
260 265 270
Gly Gln Lys Asn Thr Leu Ile Asp Asp Glu Lys Pro Thr Lys Ala Phe
275 280 285
Ala Phe Ala Ser Val Val Ala Asp Ala Asp Ile Lys Lys Gly Asp Val
290 295 300
Leu Ser Gly Glu Asn Leu Trp Val Lys Arg Pro Ser Gly Gly Asp Phe
305 310 315 320
Gly Ala Asp Glu Tyr Glu Ser Leu Phe Gly Lys Ile Ala Lys Asn Asp
325 330 335
Ile Ala Lys Asn Ser Gln Ile Lys Lys Gln Asp Ile Tyr
340 345
<210> 8
<211> 347
<212> PRT
<213> 藤黄紫假交替单胞菌菌株IPB1
<400> 8
Met Asn Pro Glu Phe Lys Ile Glu Asn Arg Leu Val Gly Ile Glu His
1 5 10 15
Asp Pro Leu Val Ile Ala Glu Ile Gly Ile Asn His Glu Gly Ser Leu
20 25 30
Lys Val Ala Phe Glu Met Val Asp Ala Ala Ile Glu Ala Gly Ala Glu
35 40 45
Ile Ile Lys His Gln Thr His Val Val Glu Asp Glu Met Cys Gly Glu
50 55 60
Ala Lys Lys Val Ile Pro Gly Asn Ala Asp Val Ser Ile Tyr Glu Ile
65 70 75 80
Met Glu Arg Cys Ala Leu Asn Glu Glu Asp Glu Thr Lys Leu Lys Glu
85 90 95
Tyr Val Glu Ser Lys Gly Ala Ile Phe Ile Ser Thr Pro Phe Ser Arg
100 105 110
Ala Ala Ala Phe Arg Leu Glu Arg Met Gly Val Ser Ala Tyr Lys Ile
115 120 125
Gly Ser Gly Glu Cys Asn Asn Tyr Pro Leu Val Asp Leu Val Ala Ser
130 135 140
Phe Gly Lys Pro Val Ile Leu Ser Thr Gly Met Asn Asp Ile Pro Ser
145 150 155 160
Ile Lys Lys Ser Val Glu Ile Phe Glu Lys Tyr Asn Thr Pro Tyr Cys
165 170 175
Leu Leu His Cys Thr Asn Val Tyr Pro Thr Pro Asp His Leu Ile Arg
180 185 190
Leu Gly Gly Ile Thr Glu Leu Gln Glu Ala Phe Pro Asn Ala Val Val
195 200 205
Gly Leu Ser Asp His Ser Val Asp Asn Leu Ala Cys Leu Ser Ala Val
210 215 220
Ala Val Gly Ala Ser Val Leu Glu Arg His Phe Thr Asp Cys Lys Ser
225 230 235 240
Arg Pro Gly Pro Asp Ile Glu Cys Ser Met Asp Ile Lys Glu Cys Ala
245 250 255
Asp Leu Ile Glu Gln Ser Lys Arg Val Lys Ala Met Arg Gly Gly Ser
260 265 270
Lys Gly Ala Val Glu Glu Glu Gln Val Thr Ile Asp Phe Ala Tyr Ala
275 280 285
Ser Val Val Thr Thr Gln Glu Ile Lys Gln Gly Glu Leu Leu Thr Lys
290 295 300
Asp Asn Leu Trp Val Lys Arg Pro Gly Thr Gly Glu Phe Leu Ala Glu
305 310 315 320
Asp Tyr Glu Ala Leu Leu Gly Lys Val Ala Lys Val Asp Ile Ala Ser
325 330 335
Asp Thr Met Leu Ala Ser Ser His Ile Glu Lys
340 345
<210> 9
<211> 348
<212> PRT
<213> 白色瘤胃球菌菌株AR67
<400> 9
Met Lys Ser Ser Phe Tyr Ile Gly Asp Leu Lys Ile Gly Ile Gly Glu
1 5 10 15
Glu Pro Leu Val Ile Pro Glu Met Gly Ile Asn His Glu Gly Ser Leu
20 25 30
Asp Val Ala Met Ser Ile Val Asp Ala Ala Ala Arg Ala Gly Ala Lys
35 40 45
Val Ile Lys His Gln Thr His Val Val Glu Asp Glu Met Ser His Ala
50 55 60
Ala Lys Lys Val Ile Pro Gly Asn Thr Asp Val Ser Ile Tyr Glu Val
65 70 75 80
Met Glu Arg Cys Ala Leu Ser Glu Asp Glu Glu Tyr Glu Leu Met Arg
85 90 95
Tyr Val Glu Ser Lys Gly Met Ile Phe Ile Ser Thr Pro Phe Ser Arg
100 105 110
Ala Ala Ala Asp Arg Leu His Arg Phe Asn Val Lys Ala Tyr Lys Ile
115 120 125
Gly Ser Gly Glu Leu Asn Asn Tyr Pro Leu Ile Lys His Ile Ala Ser
130 135 140
Phe Gly Lys Pro Met Ile Val Ser Thr Gly Met Asn Asn Ile Glu Ser
145 150 155 160
Ile Arg Lys Ala Val Asn Ile Met Glu Asp Ala Gly Val Pro Tyr Ala
165 170 175
Leu Leu His Thr Thr Asn Leu Tyr Pro Thr Val Pro Asn Leu Val Arg
180 185 190
Leu Gly Ala Met Gln Glu Met Met Glu Thr Phe Pro Asn Ile Pro Ile
195 200 205
Gly Leu Ser Asp His Thr Leu Thr Asn Thr Ala Cys Ile Ser Ala Ile
210 215 220
Thr Leu Gly Ala Ser Ile Val Glu Arg His Phe Ile Asp Arg Lys Asp
225 230 235 240
Arg Pro Gly Pro Asp Val Ile Cys Ser Met Asp Glu Lys Glu Cys Ala
245 250 255
Glu Leu Ile Ile Ala Ala Arg Asp Val Pro Gln Met Leu Gly Gly Lys
260 265 270
Lys Glu Ala Ala Lys Glu Glu Lys Val Thr Ile Asp Phe Ala Phe Ala
275 280 285
Thr Val Val Thr Ile Lys Ser Val Lys Ala Gly Glu Met Phe Thr Lys
290 295 300
Glu Asn Leu Trp Val Lys Arg Pro Gly Thr Gly Glu Ile Leu Ala Glu
305 310 315 320
Lys Tyr Glu Ser Ile Leu Gly Lys Lys Ser Lys Val Asp Ile Asp Asn
325 330 335
Asp Thr Gln Leu Lys Trp Ser Met Ile Asp Asn Ile
340 345
<210> 10
<211> 344
<212> PRT
<213> 波茨坦短芽胞杆菌cifa_chp40
<400> 10
Met Asn Glu Leu Ile Ile Gly Asp Arg Lys Ile Gly Pro Glu His Pro
1 5 10 15
Pro Leu Val Ile Ala Glu Ile Gly Ile Asn His Glu Gly Ser Phe Asp
20 25 30
Lys Ala Ile Gln Met Ile Asp Asp Ala Ala Ser Val Gly Cys Glu Cys
35 40 45
Val Lys Phe Gln Thr His Val Val Asp Asp Glu Met Ile Pro Asn Asn
50 55 60
Val Ile Pro Gly Asn Ala Lys Glu Ser Ile Trp Glu Ile Met Asn Arg
65 70 75 80
Cys Ala Leu Thr Lys Glu Glu Glu Arg Glu Leu Lys Lys Tyr Thr Glu
85 90 95
Ala Lys Gly Met Ile Phe Leu Ser Thr Pro Phe Ser Arg Ala Ala Ala
100 105 110
Val Gln Leu Glu Glu Leu Gly Val Leu Ala Tyr Lys Ile Gly Ser Gly
115 120 125
Glu Cys Asn Asn Tyr Pro Leu Ile Glu His Ile Ala Arg Tyr Gly Lys
130 135 140
Pro Val Ile Leu Ser Thr Gly Met Asn Asn Leu Glu Ser Ile Glu Lys
145 150 155 160
Ala Val Ala Ile Leu Arg Lys His Asn Thr Pro Phe Ala Leu Leu His
165 170 175
Cys Thr Ser Ile Tyr Pro Thr Pro Tyr Asp Lys Val Arg Leu Gly Ala
180 185 190
Leu Glu Glu Leu Ala Gln Ala Phe Pro Asp Ala Val Leu Gly Leu Ser
195 200 205
Asp His Ser Leu Ser Asn Tyr Pro Ser Leu Gly Ala Val Ala Leu Gly
210 215 220
Ala Arg Ile Leu Glu Arg His Phe Thr Ser Asp Lys Ser Trp Pro Gly
225 230 235 240
Pro Asp Ile Ser Ile Ser Met Asp Pro Thr Asp Leu Lys Glu Leu Ile
245 250 255
Glu Gly Ser Arg Ala Ile Phe Gln Ala Leu Gly Gly Arg Lys Asn Val
260 265 270
Leu Lys Glu Glu Gln Pro Thr Ile Asp Phe Ala Tyr Ala Cys Val Val
275 280 285
Ala Ile Arg Asp Ile Arg Ala Gly Glu Glu Leu Ser Met Glu Asn Ile
290 295 300
Trp Val Lys Arg Pro Gly Thr Gly Glu Ile Lys Ala Glu His Phe Asp
305 310 315 320
Ser Leu Leu Gly Lys Lys Ala Leu Ser Pro Ile Lys Gln Asn Glu Gln
325 330 335
Ile Arg Trp Ala His Val Asn Gly
340
<210> 11
<211> 346
<212> PRT
<213> 酸杆菌门细菌RIFCSPLOWO2_12_FULL_67_14b
<400> 11
Met Leu Pro Glu Leu Ser Ile Gly Gly Arg Arg Val Gly Pro Ala His
1 5 10 15
Val Pro Leu Val Ile Ala Glu Ile Gly Ile Asn His Glu Gly Ser Leu
20 25 30
Asp Val Ala Arg Gln Ile Val Asp Ala Ala Lys Arg Ala Gly Val Glu
35 40 45
Val Val Lys His Gln Thr His Val Val Asp Asp Glu Met Ser Gly Ala
50 55 60
Ala Lys Lys Val Val Pro Gly Asn Ala Asp Val Ser Ile Tyr Gln Ile
65 70 75 80
Met Glu Arg Cys Ala Leu Ser Glu Asn Asp Glu Arg Arg Leu Lys Asp
85 90 95
Tyr Val Glu Ser Lys Gly Met Ile Phe Met Ser Thr Pro Phe Ser Arg
100 105 110
Ala Ala Ala Asp Arg Leu Glu Arg Met Asn Val Pro Ala Tyr Lys Ile
115 120 125
Gly Ser Gly Glu Cys Asn Asn Tyr Pro Leu Leu Lys His Ile Ala Ser
130 135 140
Phe Gly Lys Pro Ile Ile Leu Ser Thr Gly Met Asn Thr Ile Glu Ser
145 150 155 160
Val Gly Lys Ala Val Ala Ile Phe Glu Gln Gln Gly Val Pro His Ala
165 170 175
Leu Leu His Thr Thr Asn Leu Tyr Pro Thr Pro Pro His Leu Val Arg
180 185 190
Leu Gly Ala Met Val Glu Leu Gly Lys Ala Phe Pro Lys Ala Val Ile
195 200 205
Gly Leu Ser Asp His Thr Thr Asp Asn Leu Ala Cys Leu Gly Ala Val
210 215 220
Ala Leu Gly Ala Ser Ile Val Glu Arg His Phe Ile Asp Thr Met Ser
225 230 235 240
Arg Val Gly Pro Asp Ile Val Cys Ser Met Asp Glu Ala Arg Cys Arg
245 250 255
Glu Leu Ile Gln Ser Ala Lys Ile Leu His Ala Glu Ile Gly Gly Thr
260 265 270
Lys Gly Pro Val Lys Glu Glu Gln Val Thr Met Asp Phe Ala Phe Ala
275 280 285
Thr Val Val Thr Ile Thr Pro Ile Lys Ala Gly Glu Ala Leu Thr Lys
290 295 300
Asn Asn Leu Trp Val Lys Arg Pro Gly Thr Gly Ser Ile Pro Ala Glu
305 310 315 320
Arg Tyr Asp Glu Leu Leu Gly Lys Lys Ala Arg Arg Asp Leu Pro Ala
325 330 335
Asp Thr His Leu Ser Leu Asp Asp Val Glu
340 345
<210> 12
<211> 350
<212> PRT
<213> 拟杆菌门细菌GWA2_31_9b
<400> 12
Met Lys Thr Asn Pro Phe Phe Glu Ile Glu Gly Arg Lys Val Gly Ser
1 5 10 15
Glu Tyr Asp Pro Leu Val Ile Ala Glu Leu Gly Ile Asn His Asn Gly
20 25 30
Ser Leu Gln Val Ala Phe Glu Met Val Asp Ala Ala His Lys Ala Gly
35 40 45
Val Glu Ile Ile Lys His Gln Thr His Ile Val Glu Asp Glu Met Cys
50 55 60
Lys Val Ala Lys Asn Val Ile Pro Gly His Thr Arg Glu Ser Ile Tyr
65 70 75 80
Asp Ile Met Gln Ser Cys Ala Leu Ser Glu Glu Glu Glu Ile Glu Leu
85 90 95
Gln Arg Tyr Val Lys Ser Lys Gly Ile Ile Phe Ile Ser Thr Pro Phe
100 105 110
Ser Arg Ala Ala Ala Asn Arg Leu Asn Lys Met Lys Ile Pro Ala Tyr
115 120 125
Lys Ile Gly Ser Gly Glu Cys Asn Asn Tyr Pro Leu Ile Lys His Ile
130 135 140
Ala Thr Phe Gly Lys Pro Val Ile Leu Ser Thr Gly Met Asn Ser Leu
145 150 155 160
Glu Thr Ile Lys Pro Ala Val Glu Ile Leu Arg Asn Asn Lys Ile Pro
165 170 175
Phe Ala Leu Leu His Cys Thr Asn Ile Tyr Pro Thr Pro Pro Glu Leu
180 185 190
Ile Arg Leu Glu Ala Ile Thr Gln Leu Lys Lys Glu Phe Pro Asp Ala
195 200 205
Val Val Gly Leu Ser Asp His Ser Val Thr Asn Tyr Pro Cys Ile Ala
210 215 220
Ser Val Ala Leu Gly Ala Ser Ile Leu Glu Arg His Phe Thr Asp Thr
225 230 235 240
Met Asn Arg Lys Gly Pro Asp Ile Ile Cys Ser Met Asp Gln Asp Thr
245 250 255
Cys Lys Glu Leu Ile His Ala Thr Lys Ile Val Arg Phe Ala Arg Asp
260 265 270
Gly Asn Lys Glu Pro Val Asp Ala Glu Lys Pro Thr Ile Asp Phe Ala
275 280 285
Phe Ser Cys Val Val Ser Ile Lys Pro Ile Leu Ala Gly Glu Gln Phe
290 295 300
Ser Tyr Glu Asn Ile Trp Val Lys Arg Pro Gly Asn Gly Glu Ile Lys
305 310 315 320
Ala Val His Phe Glu Ser Leu Ile Gly Lys Ile Ala Ser Arg Ala Ile
325 330 335
Glu Asn Asp Thr Gln Leu Thr Trp Asp Asp Ile Lys Lys His
340 345 350
<210> 13
<211> 376
<212> PRT
<213> Flavobacterium limicola
<400> 13
Met Gln Tyr Ser Cys Pro Phe Glu Ser Phe Gly Asp Cys Ser Arg Gln
1 5 10 15
Ala Lys Leu Glu Asp Lys Ile Asp Asn Ser Gln Gln Lys Thr Met Asn
20 25 30
Pro Tyr Ile Glu Ile Ala Gly Arg Lys Ile Gly Ala Asp Tyr Pro Pro
35 40 45
Leu Val Ile Ala Glu Ile Gly Ile Asn His Glu Gly Ser Leu Ala Val
50 55 60
Ala Lys Glu Met Val Asp Ala Ala Lys Arg Ala Gly Val Glu Val Val
65 70 75 80
Lys His Gln Thr His Ile Val Ala Asp Glu Met Ser Gly Ala Ala Lys
85 90 95
Lys Val Ile Pro Gly Asn Ala Asp Val Ser Ile Tyr Glu Ile Met Glu
100 105 110
Arg Cys Ser Leu Asn Glu Ala Asp Glu Leu Asp Leu Lys Lys Tyr Val
115 120 125
Glu Ser Lys Gly Met Leu Phe Ile Ser Thr Pro Phe Ser Arg Ala Ala
130 135 140
Ala Asp Arg Leu Glu Asn Phe Asp Val Pro Ala Tyr Lys Ile Gly Ser
145 150 155 160
Gly Glu Cys Asn Asn Tyr Pro Leu Leu Glu His Ile Ala Ser Phe Gly
165 170 175
Lys Pro Val Leu Leu Ser Thr Gly Met Asn Thr Ile Ala Ser Ile Arg
180 185 190
Lys Ala Ile Ala Ile Phe Asp Lys His Lys Val Pro Val Ala Val Leu
195 200 205
His Thr Thr Asn Leu Tyr Pro Thr Pro Ile Arg Leu Val Arg Phe Gly
210 215 220
Ala Met Met Glu Met His His Ala Phe Pro Asp Lys Val Phe Gly Leu
225 230 235 240
Ser Asp His Thr Leu Asn Asn Thr Ala Cys Leu Gly Ala Val Ala Leu
245 250 255
Gly Ala Ser Ile Leu Glu Arg His Phe Thr Asp His Met Gln Arg Thr
260 265 270
Gly Pro Asp Ile Val Cys Ser Met Asp Glu Gln Thr Thr Lys Asp Leu
275 280 285
Leu Leu Ser Ser Asn Glu Met Trp Gln Met Arg Gly Gly Val Lys Glu
290 295 300
Pro Ala Leu Glu Glu Gln Val Thr Ile Asp Phe Ala Phe Ala Thr Val
305 310 315 320
Cys Ala Ile Lys Pro Ile Gln Lys Gly Asp Val Leu Thr Lys Glu Asn
325 330 335
Ile Trp Val Lys Arg Pro Gly Thr Gly Lys Ile Leu Ala Glu His Phe
340 345 350
Asn Asp Leu Ile Gly Lys Val Ala Thr Arg Thr Ile Ala Asn Asp Glu
355 360 365
Gln Leu Asp Trp Ile Asp Phe Ala
370 375
<210> 14
<211> 351
<212> PRT
<213> 未培养的甲基球菌科细菌菌株Loc080925-8-8m_bin-121
<400> 14
Met Ala Asp Phe Glu Ile Gln Gly Arg Arg Ile Gly Asp Asp Tyr Pro
1 5 10 15
Pro Val Val Ile Ala Glu Ile Gly Ile Asn His Glu Gly Ser Leu Glu
20 25 30
Thr Ala Ile Glu Met Ala Asp Ala Ala Ile Asn Ala Gly Ala Glu Ile
35 40 45
Ile Lys His Gln Thr His Ile Ile Glu Asp Glu Met Ser Asp Glu Ala
50 55 60
Lys Leu Ile Ile Pro Gly Asn Ala Asp Val Ser Ile Tyr Glu Ile Met
65 70 75 80
Lys Arg Cys Ala Leu Ser Glu Asn Asp Glu Tyr Tyr Leu Met Lys His
85 90 95
Val Gln Lys Arg Gly Ala Ile Phe Ile Ser Thr Pro Phe Ser Arg Ala
100 105 110
Ala Ala Asp Arg Leu Val Arg Phe Asn Ile Pro Ala Tyr Lys Ile Gly
115 120 125
Ser Gly Glu Cys Asn Asn Tyr Pro Leu Val Lys His Ile Ala Arg Phe
130 135 140
Gly Lys Pro Val Ile Leu Ser Thr Gly Met Asn Ser Ile Glu Ser Val
145 150 155 160
Arg Pro Ser Val Glu Ile Leu Arg Asn Ala Arg Val Pro Phe Ala Leu
165 170 175
Leu His Cys Thr Asn Val Tyr Pro Thr Pro Pro Glu Leu Val Arg Leu
180 185 190
Gly Ala Met Thr Lys Leu Lys Glu Thr Phe Gln Asp Ala Val Ile Gly
195 200 205
Leu Ser Asp His Thr Thr Ser Asn Tyr Ala Cys Leu Gly Ala Val Ala
210 215 220
Leu Gly Ala Ser Ile Leu Glu Arg His Phe Thr Asp Arg Met Asp Arg
225 230 235 240
Pro Gly Pro Asp Ile Val Cys Ser Met Asp Pro Ser Ala Leu Ser Thr
245 250 255
Leu Ile Glu Gly Ser Lys Thr Ile Phe Lys Ala Arg Gly Cys Asp Lys
260 265 270
Lys Ala Val Lys Ala Glu Ala Pro Thr Ile Ala Phe Ala Phe Ala Ser
275 280 285
Val Val Ala Ile Gln Asp Ile Leu Pro Gly Gln Leu Leu Thr Glu Glu
290 295 300
Asn Ile Trp Val Lys Arg Pro Gly Asp Gly Asp Phe Lys Ala Leu Asp
305 310 315 320
Phe Glu Asn Leu Leu Gly Arg Val Ala Val Val Pro Ile Arg Gln Gly
325 330 335
Ser Gln Ile Lys Lys Ser Asp Ile Asn Leu Thr Ser Asn Val Arg
340 345 350
<210> 15
<211> 349
<212> PRT
<213> 红杆菌科细菌HIMB11
<400> 15
Met Thr His Glu Ala Thr Met Lys Ile Gly Asn Arg Glu Ile Ser Pro
1 5 10 15
Ser His Pro Pro Leu Val Ile Ala Glu Ile Gly Ile Asn His Gly Gly
20 25 30
Asp Leu Glu Val Ala Lys Asn Met Val Arg Leu Ala Ala Leu Ser Gly
35 40 45
Cys Glu Cys Val Lys His Gln Thr His Ile Val Glu Asp Glu Met Thr
50 55 60
Asp Glu Ala Lys Gln Ile Phe Pro Pro Asn Ala Asp Val Ser Ile Trp
65 70 75 80
Asp Val Met Ala Gln Cys Ala Leu Ser Arg Glu Asp Glu Ala Glu Leu
85 90 95
Lys Arg Tyr Thr Glu Glu Leu Gly Leu Ile Tyr Ile Ser Thr Pro Phe
100 105 110
Ser Arg Ala Ala Ala Asp Phe Leu Glu Thr Leu Asp Val Pro Ala Tyr
115 120 125
Lys Ile Gly Ser Gly Glu Ala Asp Asn Leu Pro Leu Ile Arg His Ile
130 135 140
Ala Arg Lys Gly Lys Pro Val Ile Met Ser Thr Gly Met Gln Thr Ile
145 150 155 160
Glu Thr Leu Gln Glu Ser Val Gln Ile Leu Glu Asp Ala Gly Ile Glu
165 170 175
Tyr Ala Leu Leu Glu Cys Thr Asn Leu Tyr Pro Ser Pro Pro Glu Ile
180 185 190
Val Ser Leu Gln Gly Val Thr Asp Leu Lys Ser Ala Phe Pro Asn Ala
195 200 205
Val Val Gly Phe Ser Asp His Ser Ile Gly Pro Glu Met Ala Leu Ala
210 215 220
Ser Val Ala Leu Gly Ala Ser Ile Leu Glu Arg His Tyr Thr Asp Thr
225 230 235 240
Arg Tyr Arg Lys Gly Pro Asp Ile Ile Asn Ser Met Asp Pro Ala Glu
245 250 255
Leu Arg Phe Leu Ile Asp Arg Ser Arg Glu Ile His Thr Ala Leu Met
260 265 270
Asn Pro Lys Gln Arg Thr Gly Pro Glu Glu Asp Val Tyr Arg Phe Ala
275 280 285
Arg Ala Ser Val Val Ala Asp Ala Asp Leu Ala Ala Gly His Val Ile
290 295 300
Thr Glu Ser Asp Ile Trp Ala Arg Arg Pro Gly Ser Gly Glu Ile Ala
305 310 315 320
Gly Phe Glu Phe Asp Lys Val Val Gly Lys Thr Leu Thr Val Ala Val
325 330 335
Thr Arg Asn Gln Gln Leu Lys Trp Ser Asp Phe Glu Asp
340 345
<210> 16
<211> 348
<212> PRT
<213> 斯氏弓形菌菌株L405
<400> 16
Met His Asn Lys Glu Ile Gln Ile Glu Lys Arg Lys Ile Gly Leu Asn
1 5 10 15
Tyr Pro Pro Leu Val Ile Val Glu Ile Gly Ile Asn His Glu Gly Ser
20 25 30
Leu Lys Thr Ala Phe Glu Met Val Asp Ala Ala Trp Arg Ala Gly Ala
35 40 45
Glu Val Ile Lys His Gln Thr His Val Val Glu Asp Glu Met Ser Lys
50 55 60
Ala Ala Lys Lys Val Ile Pro Gly Asn Ala Ser Val Ser Ile Tyr Glu
65 70 75 80
Ile Met Glu Arg Cys Ala Leu Asn Glu Glu Asp Glu Ile Lys Leu Lys
85 90 95
Glu Tyr Val Glu Ser Lys Gly Met Ile Phe Ile Ser Thr Pro Phe Ser
100 105 110
Arg Ala Ala Ala Asp Arg Leu Glu Arg Met Gly Val Ser Ser Tyr Lys
115 120 125
Ile Gly Ser Gly Glu Cys Asn Asn Tyr Pro Leu Ile Glu His Ile Ala
130 135 140
Ser Phe Gly Lys Pro Met Ile Val Ser Thr Gly Met Asn Asp Ile Glu
145 150 155 160
Ser Val Arg Lys Thr Val Asn Ile Leu Glu Lys Tyr Asn Val Pro Tyr
165 170 175
Ala Leu Leu His Thr Thr Asn Leu Tyr Pro Thr Pro Val His Leu Val
180 185 190
Arg Leu Gly Ala Met Gln Glu Leu Gln Lys Glu Phe Pro Asn Ala Ile
195 200 205
Ile Gly Leu Ser Asp His Thr Thr Ser Asn Arg Ala Cys Phe Ala Ala
210 215 220
Thr Ala Leu Gly Ala Cys Ile Leu Glu Arg His Phe Thr Asp Lys Met
225 230 235 240
Glu Arg Ser Gly Pro Asp Ile Ile Asn Ser Met Asp Pro Ile Ala Leu
245 250 255
Gln Glu Leu Ile Tyr Gly Ser Ala Glu Ile Ala Leu Met Arg Gly Gly
260 265 270
Lys Lys Glu Ala Ala Lys Glu Glu Gln Val Thr Ile Asp Phe Ala Phe
275 280 285
Ala Thr Ile Val Thr Ile Lys Pro Ile Lys Lys Gly Glu Gln Leu Thr
290 295 300
Lys Glu Asn Ile Trp Val Lys Arg Pro Gly Thr Gly Pro Ile Lys Ala
305 310 315 320
Glu His Tyr Asn Glu Leu Leu Gly Lys Thr Ala Asn Lys Asp Ile Asp
325 330 335
Phe Asp Glu His Ile Asp Trp Ser Asp Ile Asn Glu
340 345
<210> 17
<211> 350
<212> PRT
<213> Gelidibacter algens
<400> 17
Met Leu Gln Lys Gln Gln Pro Phe Ile Glu Ile Ala Gly Arg Lys Ile
1 5 10 15
Gly Leu Asp Tyr Pro Pro Leu Val Ile Ala Glu Ile Gly Ile Asn His
20 25 30
Glu Gly Ser Leu Lys Thr Ala Lys Glu Met Val Asp Ala Ala His Arg
35 40 45
Ala Gly Ala Glu Val Val Lys His Gln Thr His Ile Val Ser Asp Glu
50 55 60
Met Ser Gly Ala Ala Lys Lys Val Ile Pro Gly Asn Ala Asp Ile Ser
65 70 75 80
Ile Tyr Glu Ile Met Glu Arg Cys Ala Leu Asp Glu Thr Asp Glu Leu
85 90 95
Ala Leu Lys Asn Tyr Val Glu Ser Lys Gly Met Ile Phe Ile Ser Thr
100 105 110
Pro Phe Ser Arg Ala Ala Ala Glu Arg Leu Glu Arg Met Gly Val Val
115 120 125
Ala Tyr Lys Ile Gly Ser Gly Glu Cys Asn Asn Tyr Pro Leu Leu Glu
130 135 140
His Ile Ala Gln Phe Gly Lys Pro Val Ile Leu Ser Thr Gly Met Asn
145 150 155 160
Thr Val Glu Ser Val Lys Lys Ala Val Ala Ile Phe Asp Ala His His
165 170 175
Val Pro Val Ala Leu Leu His Thr Thr Asn Leu Tyr Pro Thr Pro Val
180 185 190
His Leu Val Arg Phe Gly Ala Met Ile Glu Leu His Glu Ala Phe Pro
195 200 205
Glu Lys Val Phe Gly Leu Ser Asp His Thr Leu Asn Asn Asn Ala Cys
210 215 220
Leu Gly Ala Val Ala Leu Gly Ala Ser Ile Leu Glu Arg His Phe Thr
225 230 235 240
Asp His Met Gln Arg Thr Gly Pro Asp Ile Val Cys Ser Met Asp Glu
245 250 255
Gln Ala Cys Lys Asp Leu Ile His Asn Ser Ala Glu Ile Ala Gln Met
260 265 270
Arg Gly Gly Ser Lys Asn Pro Ala Lys Glu Glu Gln Val Thr Ile Asp
275 280 285
Phe Ala Phe Ala Thr Val Cys Thr Ile Ala Pro Ile Lys Lys Gly Glu
290 295 300
Tyr Phe Thr Lys Asp Asn Ile Trp Val Lys Arg Pro Gly Asn Gly Glu
305 310 315 320
Phe Leu Ala Ala His Phe Asn Thr Ile Leu Gly Lys Thr Ala Thr Thr
325 330 335
Asp Leu Asp Asn Asp Val Gln Leu Arg Leu Lys Asp Val Asn
340 345 350
<210> 18
<211> 345
<212> PRT
<213> 未培养的SAR86簇生细菌菌株菌株AG-909-A08
<400> 18
Met Asn Glu Phe Lys Leu Gly Asn Arg Met Val Gly Tyr His His Pro
1 5 10 15
Pro Leu Val Ile Ala Glu Ile Gly Ile Asn His Asn Gly Ser Leu Glu
20 25 30
Ser Ala Ile Ser Leu Ala Asp Asp Ala Ile Asp Ala Gly Ile Glu Val
35 40 45
Ile Lys His Gln Thr His Val Val Glu Asp Glu Met Thr Ser Glu Ala
50 55 60
Lys Ser Val Ile Pro Gly Asn Ser Asp Lys Ser Ile Tyr Gln Ile Met
65 70 75 80
Glu Glu Cys Ala Leu Asn Glu Glu Asp Glu Val Ser Leu Lys Glu His
85 90 95
Val Glu Ser Arg Gly Lys Ile Phe Ile Ser Thr Pro Phe Ser Arg Ala
100 105 110
Ala Ala Glu Arg Leu Glu Arg Met Gly Val Cys Gly Tyr Lys Ile Gly
115 120 125
Ser Gly Glu Cys Asn Asn Tyr Pro Leu Ile Glu His Ile Ala Ser Phe
130 135 140
Lys Lys Pro Ile Ile Leu Ser Thr Gly Met Asn Asp Leu Asp Ser Ile
145 150 155 160
Arg Pro Ala Val Glu Ile Ile Arg Lys His Gln Val Pro Phe Ala Leu
165 170 175
Leu His Thr Thr Asn Ile Tyr Pro Thr Pro Asp Arg Leu Val Arg Leu
180 185 190
Gly Ala Met Asn Glu Leu Gln Asp Thr Phe Ser Asp Ala Val Ile Gly
195 200 205
Leu Ser Asp His Thr Val Ser Asn His Ala Cys Phe Gly Ala Val Ala
210 215 220
Leu Gly Ala Ser Ile Leu Glu Arg His Phe Thr Asp Ser Met Thr Arg
225 230 235 240
Glu Gly Pro Asp Ile Ile Asn Ser Met Asp Pro Ser Ala Ala Lys Glu
245 250 255
Leu Ile Leu Gly Ala Asn Thr Ile Phe Glu Gln Arg Gly Gly Ser Lys
260 265 270
Gly Pro Val Glu Glu Glu Leu Pro Thr Ile Lys Phe Ala Phe Ala Ser
275 280 285
Ile Val Ser Ile Asn Glu Ile Lys Lys Gly Asp Val Phe Ser Lys Glu
290 295 300
Asn Leu Trp Val Lys Arg Pro Gly Thr Gly Glu Ile Leu Ala Glu Glu
305 310 315 320
Phe Glu Ser Ile Leu Gly Lys Lys Ala Lys Asn Asp Ile Ser Ser Gly
325 330 335
Gln Gln Leu Lys Arg Glu Asp Ile Gln
340 345
<210> 19
<211> 35
<212> PRT
<213> 人工序列
<220>
<223> NANS结构域
<220>
<221> 变体
<222> (1)..(1)
<223> Xaa可以是Asp或Glu
<220>
<221> 不确定
<222> (2)..(2)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> 不确定
<222> (4)..(4)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> 不确定
<222> (7)..(7)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> 不确定
<222> (9)..(15)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> 不确定
<222> (17)..(19)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> 变体
<222> (20)..(20)
<223> Xaa可以是Ala, Cys, Pro或Ser
<220>
<221> 不确定
<222> (21)..(28)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> 变体
<222> (29)..(29)
<223> Xaa可以是Lys或Arg
<220>
<221> NON_CONS
<222> (29)..(30)
<223> 位置29的Xaa残基和位置30的Xaa残基间隔28-32个中间氨基酸残基
<220>
<221> 变体
<222> (30)..(30)
<223> Xaa可以是Lys或Arg
<220>
<221> NON_CONS
<222> (30)..(31)
<223> 位置30的Xaa残基和位置31的Xaa残基间隔28-30个中间氨基酸残基
<220>
<221> 变体
<222> (31)..(31)
<223> Xaa可以是Asp或Glu
<220>
<221> NON_CONS
<222> (31)..(32)
<223> 位置31的Xaa残基和位置32的Xaa残基间隔14-16个中间氨基酸残基
<220>
<221> 不确定
<222> (33)..(34)
<223> Xaa可以是任何天然存在的氨基酸
<400> 19
Xaa Xaa Gly Xaa Asn His Xaa Gly Xaa Xaa Xaa Xaa Xaa Xaa Xaa Met
1 5 10 15
Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Lys
20 25 30
Xaa Xaa Ser
35
<210> 20
<211> 35
<212> PRT
<213> 人工序列
<220>
<223> narrow NANS结构域
<220>
<221> 变体
<222> (1)..(1)
<223> Xaa可以是Asp或Glu
<220>
<221> 不确定
<222> (2)..(2)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> 不确定
<222> (4)..(4)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> 不确定
<222> (7)..(7)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> 不确定
<222> (9)..(15)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> 不确定
<222> (17)..(18)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> 不确定
<222> (19)..(19)
<223> Xaa可以是除Ile、Leu和Met外的任何天然存在的氨基酸
<220>
<221> 变体
<222> (20)..(20)
<223> Xaa可以是Ala或Ser
<220>
<221> 不确定
<222> (21)..(28)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> 变体
<222> (29)..(29)
<223> Xaa可以是Lys或Arg
<220>
<221> NON_CONS
<222> (29)..(30)
<223> 位置29的Xaa残基和位置30的Xaa残基间隔28-32个中间氨基酸残基
<220>
<221> 变体
<222> (30)..(30)
<223> Xaa可以是Lys或Arg
<220>
<221> NON_CONS
<222> (30)..(31)
<223> 位置30的Xaa残基和位置31的Xaa残基间隔28-30个中间氨基酸残基
<220>
<221> 变体
<222> (31)..(31)
<223> Xaa可以是Asp或Glu
<220>
<221> NON_CONS
<222> (31)..(32)
<223> 位置31的Xaa残基和位置32的Xaa残基间隔14-16个中间氨基酸残基
<220>
<221> 不确定
<222> (33)..(34)
<223> Xaa可以是任何天然存在的氨基酸
<400> 20
Xaa Xaa Gly Xaa Asn His Xaa Gly Xaa Xaa Xaa Xaa Xaa Xaa Xaa Met
1 5 10 15
Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Lys
20 25 30
Xaa Xaa Ser
35
<210> 21
<211> 348
<212> PRT
<213> Syntrophorhabdus sp. PtaU1.Bin058
<400> 21
Met Glu Ser Phe Ser Phe Gly Lys Ser Thr Val Ser Lys Asn Gly Pro
1 5 10 15
Cys Tyr Ile Ile Ala Glu Ile Gly Asn Asn His Gln Gly Asp Leu Lys
20 25 30
Ile Ala Leu Lys Met Ile Lys Thr Ala Ala Gly Met Gly Val Asn Ala
35 40 45
Val Lys Phe Gln Lys Arg Asp Asn Arg Thr Leu Tyr Thr Lys Ser Met
50 55 60
Tyr Asn Lys Pro Tyr Glu Asn Glu Asn Ser Tyr Gly Ser Thr Tyr Gly
65 70 75 80
Glu His Arg Asp Tyr Leu Glu Phe Cys Trp Asp Lys Tyr Val Glu Met
85 90 95
Lys Lys Cys Ala Glu Asp Asn Asp Val Glu Phe Met Cys Thr Ala Phe
100 105 110
Asp Phe Lys Ser Val Asp Phe Leu Glu Gln Leu Gly Ile Thr Ser Tyr
115 120 125
Lys Val Ala Ser Gly Asp Val Thr Asn Thr Pro Leu Leu Glu Tyr Ile
130 135 140
Ala Gln Thr Lys Lys Pro Met Phe Val Ser Thr Gly Gly Ala Thr Leu
145 150 155 160
Glu Glu Ile Arg Val Ala Tyr Asp Thr Val Thr Lys Tyr Asn Asp Arg
165 170 175
Val Cys Leu Leu His Cys Val Ala Gly Tyr Pro Thr Glu Tyr Glu Tyr
180 185 190
Leu Asn Leu Asn Thr Ile Asn Ile Leu Lys Lys Glu Phe Pro Asp Thr
195 200 205
Leu Ile Gly Tyr Ser Gly His Asp Tyr Gly Ile Leu Ala Pro Val Val
210 215 220
Ala Tyr Met Leu Gly Ala Val Val Val Glu Lys His Phe Thr Leu Asn
225 230 235 240
Arg Ala Trp Lys Gly Thr Asp His Lys Phe Ser Leu Glu Pro Thr Gly
245 250 255
Leu Tyr Lys Met Thr Arg Asp Leu Arg Arg Val Asp Val Ser Ile Gly
260 265 270
Asn Gly Lys Lys Val Val His Ala Phe Glu Lys Asp Pro Ile Ser Lys
275 280 285
Met Ser Lys Ser Leu Tyr Ala Ser Arg Lys Leu Gln Ala Gly Arg Val
290 295 300
Leu Thr Ala Asp Asp Ile Ser Ile Lys Ser Pro Gly Gly Gly Ile Pro
305 310 315 320
Pro Tyr Lys Met Glu Glu Val Leu Gly Lys Met Leu Lys Ile Asn Leu
325 330 335
Pro Glu Glu Ala Leu Phe Ser Phe Asp Tyr Phe Glu
340 345
<210> 22
<211> 291
<212> PRT
<213> 绿弯菌门细菌ADurb.Bin344
<400> 22
Met Gly Lys Thr Val Lys Leu Gly Asn Arg Leu Val Gly Glu Gly Gln
1 5 10 15
Pro Val Tyr Val Ile Ala Glu Ile Gly Ile Asn His Asn Gly Asp Ile
20 25 30
Gly Ile Ala Lys Arg Met Ile Arg Ser Ala Tyr Ala Ala Gly Val Asp
35 40 45
Ala Val Lys Phe Gln Lys Arg Thr Pro Ala Val Cys Val Pro Leu Ser
50 55 60
Glu Gln Ser Lys Met Arg Glu Thr Pro Trp Gly Tyr Met Ser Tyr Leu
65 70 75 80
Glu Tyr Arg Glu His Val Glu Phe Trp Glu Asp Glu Tyr His Glu Ile
85 90 95
Asp Glu Leu Cys His Glu Leu Gly Ile Asp Trp Phe Ala Ser Val Trp
100 105 110
Asp Val Glu Ser Ile Asp Phe Leu Met Lys Phe Asp Pro Ile Ala Tyr
115 120 125
Lys Val Pro Ser Ala Ser Leu Thr Asp His Glu Leu Leu Asp Lys Leu
130 135 140
Leu Ser Thr Arg Lys Pro Ile Ile Leu Ser Thr Gly Met Ser Thr Met
145 150 155 160
Asp Gln Ile Arg Gln Ser Val Ser Leu Phe Gly Asn Leu Asp Asn Leu
165 170 175
Ile Ile Thr His Ala Thr Ser Ala Tyr Pro Cys Lys Pro Glu Glu Leu
180 185 190
Asn Leu Arg Met Ile Pro Lys Leu Ile Glu Glu Phe Asp Cys Pro Ile
195 200 205
Gly Tyr Ser Gly His Glu Val Gly Leu Ile Pro Ser Val Ile Ser Val
210 215 220
Ala Leu Gly Ala Cys Leu Val Glu Arg His Phe Thr Leu Asp Arg Ala
225 230 235 240
Met Trp Gly Thr Asp Gln Ala Ala Ser Val Glu Pro Gln Gly Met Glu
245 250 255
Lys Leu Val Lys Tyr Ile Arg Val Thr Glu Ala Ser Leu Gly Asp Gly
260 265 270
Ile Lys Lys Val Tyr Asp Asp Glu Leu Pro Ser Leu Lys Lys Leu Arg
275 280 285
Arg Val Gln
290
<210> 23
<211> 296
<212> PRT
<213> Ignavibacteria细菌UBA2353
<400> 23
Met Arg Lys Ser Val Leu Ile Gly Asp Lys Ala Val Gly Asp Lys His
1 5 10 15
Ser Val Tyr Val Ile Ala Glu Ile Gly Ile Asn His Asn Gly Ser Val
20 25 30
Glu Leu Ala Lys Lys Met Ile Asp Ser Ala Ala Ile Ala Gly Cys Asp
35 40 45
Ala Val Lys Phe Gln Lys Arg Thr Pro Glu Leu Cys Val Pro Arg Glu
50 55 60
Gln Trp Asp Ile Glu Arg Asp Thr Pro Trp Gly Arg Met Thr Tyr Leu
65 70 75 80
Glu Tyr Arg His Lys Val Glu Phe Gly Phe Asn Glu Phe Asp Glu Ile
85 90 95
Asp Gln Tyr Cys Lys Gln Lys Asn Ile Gln Trp Phe Ala Ser Cys Trp
100 105 110
Asp Glu Pro Ser Val Glu Phe Ile Glu Gln Phe Asn Pro Pro Cys Tyr
115 120 125
Lys Ala Ala Ser Ala Ser Leu Thr Asp Ile Pro Leu Leu Gln Thr Met
130 135 140
Gln Asn Thr Gly Lys Pro Leu Ile Ile Ser Thr Gly Met Ser Thr Met
145 150 155 160
Glu Glu Ile Thr Glu Ala Ile Asp Ser Leu Asp Thr Ser Ala Leu Leu
165 170 175
Ile Ala His Ser Thr Ser Ser Tyr Pro Cys Lys Ile Glu Glu Leu Asn
180 185 190
Leu Asn Met Ile Arg Thr Leu Arg Ser Leu Tyr Pro Asp Ile Pro Ile
195 200 205
Gly Tyr Ser Gly His Glu Val Gly Leu Ala Pro Thr Trp Ser Ala Val
210 215 220
Thr Leu Gly Ala Cys Phe Val Glu Arg His Ile Thr Leu Asp Arg Ala
225 230 235 240
Met Trp Gly Thr Asp Gln Ala Ala Ser Val Glu Met Val Gly Leu Ile
245 250 255
Arg Leu Val Ser Asn Ile Arg Asp Ile Glu Lys Ala Leu Gly Asp Gly
260 265 270
Ile Lys Arg Val Tyr Asp Ser Glu Leu Ser Ser Arg Lys Lys Leu Arg
275 280 285
Arg Val Ser Thr Glu Leu Val Ala
290 295
<210> 24
<211> 305
<212> PRT
<213> Ignavibacteria细菌UBA7675
<400> 24
Met Thr Arg Asn Ile Val Ser Ile Gly Ser Arg Lys Ile Gly Asp Gly
1 5 10 15
Lys Pro Val Phe Ile Ile Ala Glu Ile Gly Ile Asn His Asn Gly Ser
20 25 30
Val Asp Val Ala Lys Lys Met Ile Gln Ser Ala Ala Ala Ala Gly Cys
35 40 45
Asp Ala Val Lys Phe Gln Lys Arg Thr Pro Glu Leu Cys Val Pro Lys
50 55 60
Asp Gln Trp Asn Ile Glu Arg Asp Thr Pro Trp Gly Arg Met Thr Tyr
65 70 75 80
Ile Asp Tyr Arg His Lys Val Glu Phe Ser Arg Val Gln Tyr Glu Glu
85 90 95
Leu Asp Tyr Tyr Cys Arg Glu Gln Gly Ile Leu Trp Met Ala Ser Cys
100 105 110
Trp Asp Glu Glu Ala Val Asp Phe Ile Glu Asn Phe Asp Thr Pro Leu
115 120 125
Tyr Lys Ala Ala Ser Ala Ser Leu Thr Asp Ile Pro Leu Leu Lys Lys
130 135 140
Met Lys Ala Thr Gly Lys Pro Leu Met Ile Ser Thr Gly Met Ser Thr
145 150 155 160
Met Glu Asp Ile Arg Ala Ala Val Asp Ala Leu Gly Glu Asp Asn Thr
165 170 175
Leu Ile Ala His Ser Thr Ser Thr Tyr Pro Cys Lys Leu Glu Glu Leu
180 185 190
Asn Leu Arg Val Ile His Thr Leu Lys Asp Glu Tyr Arg Ala Ile Pro
195 200 205
Ile Gly Tyr Ser Gly His Glu Thr Gly Leu Ala Pro Thr Leu Ala Ala
210 215 220
Val Ala Met Gly Ala Cys Phe Val Glu Arg His Ile Thr Leu Asp Arg
225 230 235 240
Ala Met Trp Gly Thr Asp Gln Ala Ala Ser Val Glu Val Gly Gly Leu
245 250 255
Phe Arg Leu Val Ser Asn Ile Arg Asp Ile Glu Lys Ser Met Gly Asp
260 265 270
Gly Val Lys Arg Val Phe Asp Ser Glu Ile Ser Gly Met Lys Lys Leu
275 280 285
Arg Arg Val Pro Gly Ala Gln Pro Val Gln Glu Glu Arg Thr Val Leu
290 295 300
Ala
305
<210> 25
<211> 348
<212> PRT
<213> 硝化螺旋菌门细菌菌株NC_groundwater_1772_Pr3_B-0.1um_56_14
<400> 25
Met Lys Thr Ile Thr Phe Gly Arg Ser Arg Val Thr Glu Gly Gly Pro
1 5 10 15
Cys Tyr Ile Ile Ala Glu Ile Gly Asn Asn His Gln Gly Asp Leu Lys
20 25 30
Thr Ala Leu Lys Met Ile Lys Thr Ala Ala Gly Met Gly Val Asp Ala
35 40 45
Val Lys Phe Gln Lys Arg Asp Asn Lys Ser Met Phe Thr Lys Ala Met
50 55 60
Tyr Tyr Lys Pro Tyr Asp Asn Glu Asn Ser Tyr Gly Glu Thr Tyr Gly
65 70 75 80
Glu His Arg Glu Phe Leu Glu Phe Gly Trp Asp Glu Tyr Val Glu Leu
85 90 95
Lys Lys Cys Ala Asp Glu Asn Asp Val Glu Phe Met Cys Thr Ala Phe
100 105 110
Asp Phe Lys Ser Ala Asp Phe Leu Glu Lys Leu Gly Ile Gly Ser Tyr
115 120 125
Lys Ile Ala Ser Gly Asp Leu Thr Asn Thr Pro Leu Leu Glu Tyr Ile
130 135 140
Ala Lys Phe Gly Lys Pro Met Phe Val Ser Thr Gly Ala Ala Ser Met
145 150 155 160
Asp Glu Ile Arg Met Ala Tyr Glu Ala Val Leu Lys His Asn Asn Gln
165 170 175
Leu Cys Leu Leu His Cys Thr Ala Ala Tyr Pro Ala Glu Tyr Glu Asp
180 185 190
Leu Asn Leu Lys Phe Ile Asp Thr Met Arg Lys Glu Phe Pro Ala Ala
195 200 205
Leu Ile Gly Phe Ser Gly His Asp Tyr Gly Ile Leu Ala Pro Val Val
210 215 220
Ala Tyr Met Leu Gly Ala Val Val Val Glu Lys His Phe Thr Leu Asn
225 230 235 240
Arg Ala Trp Lys Gly Thr Asp His Arg Phe Ser Leu Glu Pro Thr Gly
245 250 255
Leu Tyr Lys Val Ile Arg Asp Leu Arg Arg Val Asp Lys Ala Leu Gly
260 265 270
Asp Gly Thr Lys Ile Val Lys Lys Phe Glu Arg Asp Ala Arg Asn Lys
275 280 285
Met Gly Lys Ser Leu Tyr Ala Ala Arg Asn Leu Gln Ala Gly Thr Val
290 295 300
Ile Thr Ala Asp Asp Ile Ala Ile Lys Ser Pro Asp Gly Gly Met Pro
305 310 315 320
Pro Tyr Met Phe Asn Asp Ile Val Gly Lys Thr Met Lys Ala Asp Leu
325 330 335
Ala Glu Asp Lys Gln Phe Ala Pro Glu Val Leu Ala
340 345
<210> 26
<211> 292
<212> PRT
<213> 脱硫杆菌目细菌菌株NC_groundwater_1491_Pr4_B-0.1um_43_5
<400> 26
Met Asp Lys Val Gln Lys Asn Leu Lys Leu Gly Asn Arg Ser Ile Ile
1 5 10 15
Gly Pro Gly Asn Pro Val Tyr Ile Ile Ala Glu Ile Gly Ile Asn His
20 25 30
Asn Gly Ser Ile Asp Leu Ala Lys Glu Met Ile Arg Ser Ala His Lys
35 40 45
Val Gly Val Asn Ala Val Lys Phe Gln Lys Arg Asn Pro Glu Glu Cys
50 55 60
Val Pro Leu Glu Gln Arg Asp Arg Met Arg Glu Thr Pro Trp Gly Tyr
65 70 75 80
Ile Ser Tyr Met Asp Tyr Arg Tyr Lys Val Glu Phe Gly Glu Lys Glu
85 90 95
Tyr Arg Asp Ile Asp Asn Leu Cys Lys Asn Leu Gly Ile Glu Trp Phe
100 105 110
Val Ser Cys Trp Asp Lys Thr Ser Val Asp Phe Met Glu Arg Phe Asp
115 120 125
Pro Ile Cys Tyr Lys Ile Pro Ser Ala His Ile Thr Asn Lys Glu Leu
130 135 140
Leu Leu Tyr Leu Lys Lys Thr Arg Arg Pro Leu Ile Leu Ser Thr Gly
145 150 155 160
Met Ser Thr Met Ser Glu Ile Arg Gln Ala Val Glu Leu Val Gly Thr
165 170 175
Asp Thr Leu Ala Leu Ala His Cys Thr Ser Ser Tyr Pro Ala Lys Leu
180 185 190
Glu Glu Leu Asn Leu Arg Met Ile Leu Thr Leu Arg Lys Met Tyr Asp
195 200 205
Cys Pro Ile Gly Tyr Ser Gly His Glu Val Gly Leu Ala Thr Ser Val
210 215 220
Val Ala Val Ser Leu Gly Ala Cys Phe Val Glu Arg His Phe Thr Leu
225 230 235 240
Asp Arg Ala Ser Trp Gly Ser Asp Gln Ala Ser Ser Val Glu Ile Ala
245 250 255
Gly Leu Ala Arg Leu Val Lys Asp Ile Arg Ser Val Glu Ile Ala Leu
260 265 270
Gly Asp Gly Glu Lys Val Val Tyr Glu Ser Glu Met Glu Ile Arg Glu
275 280 285
Arg Leu Arg Ala
290
<210> 27
<211> 305
<212> PRT
<213> 未培养的delta变形菌门菌株AM-lipid-02-D9_bin-1227
<400> 27
Met Ser Gly Lys Pro Phe Trp Glu Asp Phe Ile Gln Thr Glu Pro Trp
1 5 10 15
Pro Ile Val Arg Lys Pro Tyr Ile Ile Ala Glu Ile Gly Ile Asn His
20 25 30
Asn Gly Asp Ile Ile Leu Ala Lys Gln Met Ile Lys Ser Ala Tyr Gln
35 40 45
Cys Gly Cys Gln Ala Val Lys Phe Gln Lys Arg Thr Pro Glu Leu Cys
50 55 60
Val Pro Lys His Gln Arg Asp Leu Leu Arg Glu Thr Pro Trp Gly Leu
65 70 75 80
Ile Thr Tyr Met Glu Tyr Arg Lys Lys Ile Glu Phe Gly Arg Glu Glu
85 90 95
Tyr Asp Glu Ile Asp Ser Phe Cys Arg Glu Leu Gly Val Asp Trp Phe
100 105 110
Ala Ser Ala Trp Asp Ile Pro Ser Leu Glu Phe Leu Arg Lys Tyr Asn
115 120 125
Ser Pro Tyr Asn Lys Ile Ala Ser Ala Met Leu Thr His Arg Glu Leu
130 135 140
Val Arg Gln Val Ala Gln Glu Gly Lys Met Thr Phe Ile Ser Thr Gly
145 150 155 160
Met Ser Glu Tyr Ala Asp Ile Asp Tyr Ile Val Lys Leu Phe Arg Asp
165 170 175
Ile Gly Cys Pro Phe Ile Leu Met His Ser Val Ser Glu Tyr Pro Leu
180 185 190
Ile Asn Tyr Lys Val Asn Leu Arg Gln Ile Thr Ala Leu Arg Thr Arg
195 200 205
Tyr Asn Cys Pro Val Gly Asn Ser Gly His Glu Ser Thr Met Leu Pro
210 215 220
Ser Leu Leu Ala Ile Met Met Gly Ala Val Ala Ile Glu Arg His Phe
225 230 235 240
Thr Ile Asp Arg Ala Tyr Trp Gly Thr Asp Gln Ala Ala Ser Leu Glu
245 250 255
Thr Arg Gly Met Ala Thr Leu Met Asn Tyr Ile Asn Gln Ile Pro Tyr
260 265 270
Val Leu Gly Thr Gly Glu Arg Val Ile Thr Glu Val Glu Arg Ala Asn
275 280 285
Ala Lys Lys Leu Arg Phe Phe Ile Glu Glu Pro Glu Arg Asn Gln Ser
290 295 300
Lys
305
<210> 28
<211> 359
<212> PRT
<213> 厦门脱硫杆状菌
<400> 28
Met Arg Thr Val Pro Phe Ile Arg Leu Pro His Gly Ala Ala Ile Gly
1 5 10 15
His Glu Ala Pro Cys Phe Val Ile Ala Glu Ile Gly Asn Asn His Gln
20 25 30
Gly Asp Leu Asp Ile Ala Arg Ala Met Val Arg Ser Ala Ala Glu Ala
35 40 45
Gly Ala Asp Ala Val Lys Phe Gln Lys Arg Asp Asn Ala Ala Leu Phe
50 55 60
Thr Arg Glu Gly Leu Asp Ala Pro Tyr Thr Gly Pro Asn Ser Phe Gly
65 70 75 80
Pro Thr Tyr Gly Glu His Arg Arg Ala Leu Glu Leu Asp Phe Glu Gln
85 90 95
Leu Glu Gln Leu Lys Arg Gln Ala Glu Ala Leu Gly Met Val Phe Phe
100 105 110
Ala Ser Ala Trp Asp Met Pro Ser Leu Asp Gly Leu Ala Ala Met Gly
115 120 125
Val Glu Leu Phe Lys Val Ala Ser Ala Asp Leu Val Asn Val Pro Met
130 135 140
Leu Arg Arg Ile Ala Ala Leu Gly Arg Pro Val Leu Leu Ser Thr Gly
145 150 155 160
Met Ser Thr Leu Ala Glu Ile Asp Leu Ala Val Asn Glu Leu Asp Arg
165 170 175
Ser Arg Thr Val Leu Leu His Cys Asn Ser Ser Tyr Pro Cys Pro Pro
180 185 190
Glu Glu Thr Ala Ile Pro Val Met Asn Arg Leu Arg Thr Arg Tyr Gly
195 200 205
Leu Pro Val Gly Tyr Ser Gly His Glu Gly Gly Ile Ala Pro Ser Leu
210 215 220
Ala Ala Val Ala His Gly Ala Cys Val Val Glu Arg His Phe Thr Leu
225 230 235 240
Asp Arg Thr Met Arg Gly Thr Asp His Thr Ala Ser Leu Asp Pro Ala
245 250 255
Glu Phe Ala His Leu Val Leu Met Ile Arg Glu Thr Glu Ala Ala Leu
260 265 270
Arg Ile Thr Asp Lys Arg Val Phe Glu Ala Glu Ala Arg Cys Ala Ala
275 280 285
Lys Leu Arg Lys Ser Ile Val Ala Ala Arg Asn Leu Thr Ala Gly Thr
290 295 300
Met Leu Thr Glu Ser Asp Ile Thr Val Arg Cys Pro Gly Thr Gly Ile
305 310 315 320
Ser Pro Ala Ala Trp Asp Glu Val Ile Gly Arg Val Leu Val Arg Asp
325 330 335
Ile Ala Ala Asp Gly Gln Leu Ala Trp Asp Ala Met Leu Ala Lys Gln
340 345 350
Pro Leu Arg Ala Ala Ala Glu
355
<210> 29
<211> 73
<212> PRT
<213> 人工序列
<220>
<223> 结构域 1磷酸酶
<220>
<221> 不确定
<222> (2)..(2)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> 不确定
<222> (5)..(6)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> 不确定
<222> (9)..(16)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> 不确定
<222> (18)..(26)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> 不确定
<222> (28)..(42)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> 变体
<222> (43)..(43)
<223> Xaa可以是Ile, Leu或Val
<220>
<221> 不确定
<222> (44)..(44)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> 变体
<222> (45)..(45)
<223> Xaa可以是Ser或Thr
<220>
<221> 不确定
<222> (46)..(54)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> 不确定
<222> (56)..(58)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> NON_CONS
<222> (59)..(60)
<223> 位置59的Leu残基和位置60的Lys残基间隔10-11个中间氨基酸残基
<220>
<221> NON_CONS
<222> (60)..(61)
<223> 位置60的Lys残基和位置61的Gly残基间隔21个中间氨基酸残基
<220>
<221> 不确定
<222> (62)..(62)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> 不确定
<222> (64)..(65)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> NON_CONS
<222> (66)..(67)
<223> 位置66的Asp残基和位置67的Gly残基间隔32个中间氨基酸残基
<220>
<221> 不确定
<222> (68)..(68)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> 不确定
<222> (70)..(71)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> 变体
<222> (73)..(73)
<223> Xaa可以是Asp或Glu
<400> 29
Asp Xaa Asp Gly Xaa Xaa Thr Asp Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa
1 5 10 15
Gly Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Asp Xaa Xaa Xaa Xaa Xaa
20 25 30
Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa
35 40 45
Xaa Xaa Xaa Xaa Xaa Xaa Arg Xaa Xaa Xaa Leu Lys Gly Xaa Asp Xaa
50 55 60
Xaa Asp Gly Xaa Gly Xaa Xaa Arg Xaa
65 70
<210> 30
<211> 241
<212> PRT
<213> Candidatus Magnetomorum sp. HK-1
<400> 30
Met Pro Ser Leu Lys Ala Ile Phe Phe Asp Leu Asp Asn Thr Leu Val
1 5 10 15
Asp Cys Ser Thr Ala Asp Ile Arg Thr Tyr Glu Ile Leu Ala Ser Ile
20 25 30
Ala Arg Asp Lys Val Arg Gly Ile Asn Ser Pro Ala Leu Ile Asn His
35 40 45
Phe Gln Lys Gln Leu Ile Asn Val Pro Phe Asp Pro Glu Lys Gln Ile
50 55 60
Pro Val His Pro Trp Arg Thr Ile Leu Trp Thr Lys Ala Leu Lys Ser
65 70 75 80
Glu Asn Ile Asp Asp Ile Asp Leu Ala Glu Lys Leu Asn Ile Ala Phe
85 90 95
His Arg Glu Arg Leu Ala Phe Tyr Thr Phe Ile Tyr Gly Ser Gln Lys
100 105 110
Met Leu Lys Lys Leu Leu Lys Leu Tyr Thr Cys Val Ile Ile Thr Asn
115 120 125
Gly Asp Ser Glu Ile Gln Arg Pro Lys Leu Lys Ala Cys Lys Ala Gln
130 135 140
Lys Tyr Phe Ser His Ile Ile Val Gly Gly Glu Glu Pro Tyr Glu Lys
145 150 155 160
Pro His Pro Ser Ile Phe Lys Lys Ala Cys Glu Met Ala Lys Cys Lys
165 170 175
Pro Glu Ser Ala Ile Ile Ile Gly Asp Ser Leu Glu Thr Asp Ile Lys
180 185 190
Gly Gly Leu Asp Ala Gly Leu Ala Ser Thr Ile Trp Ile Asn Pro Lys
195 200 205
Asn Lys Pro Ile Pro Glu Lys Gly Pro Val Pro His Tyr Gln Ala Val
210 215 220
Ser Val Leu Glu Leu Pro Leu Ile Ile Gln His Ile Gln Gln Gln Gln
225 230 235 240
Gln
<210> 31
<211> 35
<212> PRT
<213> 人工序列
<220>
<223> 结构域 2磷酸酶
<220>
<221> 不确定
<222> (2)..(2)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> 不确定
<222> (4)..(4)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> 变体
<222> (6)..(6)
<223> Xaa可以是Ile或Leu
<220>
<221> NON_CONS
<222> (6)..(7)
<223> 位置6的Xaa残基和位置7的Thr残基间隔110-160个中间氨基酸残基
<220>
<221> 不确定
<222> (10)..(13)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> 不确定
<222> (15)..(16)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> 变体
<222> (18)..(18)
<223> Xaa可以是Ile或Leu
<220>
<221> NON_CONS
<222> (18)..(19)
<223> 位置18的Xaa残基和位置19的Xaa残基间隔20-23个中间氨基酸残基
<220>
<221> 变体
<222> (19)..(19)
<223> Xaa可以是Lys或Arg
<220>
<221> 不确定
<222> (21)..(23)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> 变体
<222> (24)..(24)
<223> Xaa可以是Ile或Leu
<220>
<221> 变体
<222> (25)..(25)
<223> Xaa可以是Phe, Trp或Tyr
<220>
<221> NON_CONS
<222> (25)..(26)
<223> 位置25的Xaa残基和位置26的Gly残基间隔17个中间氨基酸残基
<220>
<221> 变体
<222> (27)..(27)
<223> Xaa可以是Asp或Asn
<220>
<221> 不确定
<222> (28)..(31)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> 变体
<222> (33)..(33)
<223> Xaa可以是Ile, Leu或Val
<220>
<221> 不确定
<222> (34)..(34)
<223> Xaa可以是任何天然存在的氨基酸
<400> 31
Asp Xaa Asp Xaa Thr Xaa Thr Asn Gly Xaa Xaa Xaa Xaa Gln Xaa Xaa
1 5 10 15
Lys Xaa Xaa Pro Xaa Xaa Xaa Xaa Xaa Gly Xaa Xaa Xaa Xaa Xaa Asp
20 25 30
Xaa Xaa Gly
35
<210> 32
<211> 164
<212> PRT
<213> 多形拟杆菌
<400> 32
Met Lys Glu Ile Lys Leu Ile Leu Thr Asp Ile Asp Gly Val Trp Thr
1 5 10 15
Asp Gly Gly Met Phe Tyr Asp Gln Thr Gly Asn Glu Trp Lys Lys Phe
20 25 30
Asn Thr Ser Asp Ser Ala Gly Ile Phe Trp Ala His Asn Lys Gly Ile
35 40 45
Pro Val Gly Ile Leu Thr Gly Glu Lys Thr Glu Ile Val Arg Arg Arg
50 55 60
Ala Glu Lys Leu Lys Val Asp Tyr Leu Phe Gln Gly Val Val Asp Lys
65 70 75 80
Leu Ser Ala Ala Glu Glu Leu Cys Asn Glu Leu Gly Ile Asn Leu Glu
85 90 95
Gln Val Ala Tyr Ile Gly Asp Asp Leu Asn Asp Ala Lys Leu Leu Lys
100 105 110
Arg Val Gly Ile Ala Gly Val Pro Ala Ser Ala Pro Phe Tyr Ile Arg
115 120 125
Arg Leu Ser Thr Ile Phe Leu Glu Lys Arg Gly Gly Glu Gly Val Phe
130 135 140
Arg Glu Phe Val Glu Lys Val Leu Gly Ile Asn Leu Glu Asp Phe Ile
145 150 155 160
Ala Val Ile Gln
<210> 33
<211> 722
<212> PRT
<213> 小家鼠(品系C57BL/6J)
<400> 33
Met Glu Lys Asn Gly Asn Asn Arg Lys Leu Arg Val Cys Val Ala Thr
1 5 10 15
Cys Asn Arg Ala Asp Tyr Ser Lys Leu Ala Pro Ile Met Phe Gly Ile
20 25 30
Lys Thr Glu Pro Ala Phe Phe Glu Leu Asp Val Val Val Leu Gly Ser
35 40 45
His Leu Ile Asp Asp Tyr Gly Asn Thr Tyr Arg Met Ile Glu Gln Asp
50 55 60
Asp Phe Asp Ile Asn Thr Arg Leu His Thr Ile Val Arg Gly Glu Asp
65 70 75 80
Glu Ala Ala Met Val Glu Ser Val Gly Leu Ala Leu Val Lys Leu Pro
85 90 95
Asp Val Leu Asn Arg Leu Lys Pro Asp Ile Met Ile Val His Gly Asp
100 105 110
Arg Phe Asp Ala Leu Ala Leu Ala Thr Ser Ala Ala Leu Met Asn Ile
115 120 125
Arg Ile Leu His Ile Glu Gly Gly Glu Val Ser Gly Thr Ile Asp Asp
130 135 140
Ser Ile Arg His Ala Ile Thr Lys Leu Ala His Tyr His Val Cys Cys
145 150 155 160
Thr Arg Ser Ala Glu Gln His Leu Ile Ser Met Cys Glu Asp His Asp
165 170 175
Arg Ile Leu Leu Ala Gly Cys Pro Ser Tyr Asp Lys Leu Leu Ser Ala
180 185 190
Lys Asn Lys Asp Tyr Met Ser Ile Ile Arg Met Trp Leu Gly Asp Asp
195 200 205
Val Lys Cys Lys Asp Tyr Ile Val Ala Leu Gln His Pro Val Thr Thr
210 215 220
Asp Ile Lys His Ser Ile Lys Met Phe Glu Leu Thr Leu Asp Ala Leu
225 230 235 240
Ile Ser Phe Asn Lys Arg Thr Leu Val Leu Phe Pro Asn Ile Asp Ala
245 250 255
Gly Ser Lys Glu Met Val Arg Val Met Arg Lys Lys Gly Ile Glu His
260 265 270
His Pro Asn Phe Arg Ala Val Lys His Val Pro Phe Asp Gln Phe Ile
275 280 285
Gln Leu Val Ala His Ala Gly Cys Met Ile Gly Asn Ser Ser Cys Gly
290 295 300
Val Arg Glu Val Gly Ala Phe Gly Thr Pro Val Ile Asn Leu Gly Thr
305 310 315 320
Arg Gln Ile Gly Arg Glu Thr Gly Glu Asn Val Leu His Val Arg Asp
325 330 335
Ala Asp Thr Gln Asp Lys Ile Leu Gln Ala Leu His Leu Gln Phe Gly
340 345 350
Lys Gln Tyr Pro Cys Ser Lys Ile Tyr Gly Asp Gly Asn Ala Val Pro
355 360 365
Arg Ile Leu Lys Phe Leu Lys Ser Ile Asp Leu Gln Glu Pro Leu Gln
370 375 380
Lys Lys Phe Cys Phe Pro Pro Val Lys Glu Asn Ile Ser Gln Asp Ile
385 390 395 400
Asp His Ile Leu Glu Thr Leu Ser Ala Leu Ala Val Asp Leu Gly Gly
405 410 415
Thr Asn Leu Arg Val Ala Ile Val Ser Met Lys Gly Glu Ile Val Lys
420 425 430
Lys Tyr Thr Gln Phe Asn Pro Lys Thr Tyr Glu Glu Arg Ile Ser Leu
435 440 445
Ile Leu Gln Met Cys Val Glu Ala Ala Ala Glu Ala Val Lys Leu Asn
450 455 460
Cys Arg Ile Leu Gly Val Gly Ile Ser Thr Gly Gly Arg Val Asn Pro
465 470 475 480
Gln Glu Gly Val Val Leu His Ser Thr Lys Leu Ile Gln Glu Trp Asn
485 490 495
Ser Val Asp Leu Arg Thr Pro Leu Ser Asp Thr Leu His Leu Pro Val
500 505 510
Trp Val Asp Asn Asp Gly Asn Cys Ala Ala Met Ala Glu Arg Lys Phe
515 520 525
Gly Gln Gly Lys Gly Gln Glu Asn Phe Val Thr Leu Ile Thr Gly Thr
530 535 540
Gly Ile Gly Gly Gly Ile Ile His Gln His Glu Leu Ile His Gly Ser
545 550 555 560
Ser Phe Cys Ala Ala Glu Leu Gly His Leu Val Val Ser Leu Asp Gly
565 570 575
Pro Asp Cys Ser Cys Gly Ser His Gly Cys Ile Glu Ala Tyr Ala Ser
580 585 590
Gly Met Ala Leu Gln Arg Glu Ala Lys Lys Leu His Asp Glu Asp Leu
595 600 605
Leu Leu Val Glu Gly Met Ser Val Pro Lys Asp Glu Ala Val Gly Ala
610 615 620
Leu His Leu Ile Gln Ala Ala Lys Leu Gly Asn Val Lys Ala Gln Ser
625 630 635 640
Ile Leu Arg Thr Ala Gly Thr Ala Leu Gly Leu Gly Val Val Asn Ile
645 650 655
Leu His Thr Met Asn Pro Ser Leu Val Ile Leu Ser Gly Val Leu Ala
660 665 670
Ser His Tyr Ile His Ile Val Lys Asp Val Ile Arg Gln Gln Ala Leu
675 680 685
Ser Ser Val Gln Asp Val Asp Val Val Val Ser Asp Leu Val Asp Pro
690 695 700
Ala Leu Leu Gly Ala Ala Ser Met Val Leu Asp Tyr Thr Thr Arg Arg
705 710 715 720
Ile His
<210> 34
<211> 159
<212> PRT
<213> 酿酒酵母
<400> 34
Met Ser Leu Pro Asp Gly Phe Tyr Ile Arg Arg Met Glu Glu Gly Asp
1 5 10 15
Leu Glu Gln Val Thr Glu Thr Leu Lys Val Leu Thr Thr Val Gly Thr
20 25 30
Ile Thr Pro Glu Ser Phe Ser Lys Leu Ile Lys Tyr Trp Asn Glu Ala
35 40 45
Thr Val Trp Asn Asp Asn Glu Asp Lys Lys Ile Met Gln Tyr Asn Pro
50 55 60
Met Val Ile Val Asp Lys Arg Thr Glu Thr Val Ala Ala Thr Gly Asn
65 70 75 80
Ile Ile Ile Glu Arg Lys Ile Ile His Glu Leu Gly Leu Cys Gly His
85 90 95
Ile Glu Asp Ile Ala Val Asn Ser Lys Tyr Gln Gly Gln Gly Leu Gly
100 105 110
Lys Leu Leu Ile Asp Gln Leu Val Thr Ile Gly Phe Asp Tyr Gly Cys
115 120 125
Tyr Lys Ile Ile Leu Asp Cys Asp Glu Lys Asn Val Lys Phe Tyr Glu
130 135 140
Lys Cys Gly Phe Ser Asn Ala Gly Val Glu Met Gln Ile Arg Lys
145 150 155
<210> 35
<211> 421
<212> PRT
<213> 卵形拟杆菌
<400> 35
Met Asp Ser Lys Asn Asn Ile Gly His Ser Ala Asp Ile Ser Leu Thr
1 5 10 15
Ala Glu Leu Pro Ile Pro Ile Tyr Asn Gly Asn Thr Ile Met Asp Phe
20 25 30
Lys Lys Leu Ala Ser Leu Tyr Lys Asp Glu Leu Leu Asp Asn Val Leu
35 40 45
Pro Phe Trp Leu Glu His Ser Gln Asp His Glu Tyr Gly Gly Tyr Phe
50 55 60
Thr Cys Leu Asp Arg Glu Gly Lys Val Phe Asp Thr Asp Lys Phe Ile
65 70 75 80
Trp Leu Gln Ser Arg Glu Val Trp Met Phe Ser Met Leu Tyr Asn Lys
85 90 95
Val Glu Lys Arg Gln Glu Trp Leu Asp Cys Ala Ile Gln Gly Gly Glu
100 105 110
Phe Leu Lys Lys Tyr Gly His Asp Gly Asn Tyr Asn Trp Tyr Phe Ser
115 120 125
Leu Asp Arg Ser Gly Arg Pro Leu Val Glu Pro Tyr Asn Ile Phe Ser
130 135 140
Tyr Thr Phe Ala Thr Met Ala Phe Gly Gln Leu Ser Leu Thr Thr Gly
145 150 155 160
Asn Gln Glu Tyr Ala Asp Ile Ala Lys Lys Thr Phe Asp Ile Ile Leu
165 170 175
Ser Lys Val Asp Asn Pro Lys Gly Arg Trp Asn Lys Leu His Pro Gly
180 185 190
Thr Arg Asn Leu Lys Asn Phe Ala Leu Pro Met Ile Leu Cys Asn Leu
195 200 205
Ala Leu Glu Ile Glu His Leu Leu Asp Glu Thr Tyr Leu Arg Glu Thr
210 215 220
Met Asp Thr Cys Ile His Glu Val Met Glu Val Phe Tyr Arg Pro Glu
225 230 235 240
Leu Gly Gly Ile Ile Val Glu Asn Val Asp Ile Asp Gly Asn Leu Val
245 250 255
Asp Cys Phe Glu Gly Arg Gln Val Thr Pro Gly His Ala Ile Glu Ala
260 265 270
Met Trp Phe Ile Met Asp Leu Gly Lys Arg Leu Asn Arg Pro Glu Leu
275 280 285
Ile Glu Lys Ala Lys Glu Thr Thr Leu Thr Met Leu Asn Tyr Gly Trp
290 295 300
Asp Lys Gln Tyr Gly Gly Ile Tyr Tyr Phe Met Asp Arg Asn Gly Cys
305 310 315 320
Pro Pro Gln Gln Leu Glu Trp Asp Gln Lys Leu Trp Trp Val His Ile
325 330 335
Glu Thr Leu Ile Ser Leu Leu Lys Gly Tyr Gln Leu Thr Gly Asp Lys
340 345 350
Lys Cys Leu Glu Trp Phe Glu Lys Val His Asp Tyr Thr Trp Glu His
355 360 365
Phe Lys Asp Lys Glu Tyr Pro Glu Trp Tyr Gly Tyr Leu Asn Arg Arg
370 375 380
Gly Glu Val Leu Leu Pro Leu Lys Gly Gly Lys Trp Lys Gly Cys Phe
385 390 395 400
His Val Pro Arg Gly Leu Tyr Gln Cys Trp Lys Thr Leu Glu Glu Ile
405 410 415
Lys Asn Ile Val Ser
420
<210> 36
<211> 609
<212> PRT
<213> 大肠杆菌K-12 MG1655
<400> 36
Met Cys Gly Ile Val Gly Ala Ile Ala Gln Arg Asp Val Ala Glu Ile
1 5 10 15
Leu Leu Glu Gly Leu Arg Arg Leu Glu Tyr Arg Gly Tyr Asp Ser Ala
20 25 30
Gly Leu Ala Val Val Asp Thr Glu Gly His Met Thr Arg Leu Arg Arg
35 40 45
Leu Gly Lys Val Gln Met Leu Ala Gln Ala Ala Glu Glu His Pro Leu
50 55 60
His Gly Gly Thr Gly Ile Ala His Thr Arg Trp Ala Thr His Gly Glu
65 70 75 80
Pro Ser Glu Val Asn Ala His Pro His Val Ser Glu His Ile Val Val
85 90 95
Val His Asn Gly Ile Ile Glu Asn His Glu Pro Leu Arg Glu Glu Leu
100 105 110
Lys Ala Arg Gly Tyr Thr Phe Val Ser Glu Thr Asp Thr Glu Val Ile
115 120 125
Ala His Leu Val Asn Trp Glu Leu Lys Gln Gly Gly Thr Leu Arg Glu
130 135 140
Ala Val Leu Arg Ala Ile Pro Gln Leu Arg Gly Ala Tyr Gly Thr Val
145 150 155 160
Ile Met Asp Ser Arg His Pro Asp Thr Leu Leu Ala Ala Arg Ser Gly
165 170 175
Ser Pro Leu Val Ile Gly Leu Gly Met Gly Glu Asn Phe Ile Ala Ser
180 185 190
Asp Gln Leu Ala Leu Leu Pro Val Thr Arg Arg Phe Ile Phe Leu Glu
195 200 205
Glu Gly Asp Ile Ala Glu Ile Thr Arg Arg Ser Val Asn Ile Phe Asp
210 215 220
Lys Thr Gly Ala Glu Val Lys Arg Gln Asp Ile Glu Ser Asn Leu Gln
225 230 235 240
Tyr Asp Ala Gly Asp Lys Gly Ile Tyr Cys His Tyr Met Gln Lys Glu
245 250 255
Ile Tyr Glu Gln Pro Asn Ala Ile Lys Asn Thr Leu Thr Gly Arg Ile
260 265 270
Ser His Gly Gln Val Asp Leu Ser Glu Leu Gly Pro Asn Ala Asp Glu
275 280 285
Leu Leu Ser Lys Val Glu His Ile Gln Ile Leu Ala Cys Gly Thr Ser
290 295 300
Tyr Asn Ser Gly Met Val Ser Arg Tyr Trp Phe Glu Ser Leu Ala Gly
305 310 315 320
Ile Pro Cys Asp Val Glu Ile Ala Ser Glu Phe Arg Tyr Arg Lys Ser
325 330 335
Ala Val Arg Arg Asn Ser Leu Met Ile Thr Leu Ser Gln Ser Gly Glu
340 345 350
Thr Ala Asp Thr Leu Ala Gly Leu Arg Leu Ser Lys Glu Leu Gly Tyr
355 360 365
Leu Gly Ser Leu Ala Ile Cys Asn Val Pro Gly Ser Ser Leu Val Arg
370 375 380
Glu Ser Asp Leu Ala Leu Met Thr Asn Ala Gly Thr Glu Ile Gly Val
385 390 395 400
Ala Ser Thr Lys Ala Phe Thr Thr Gln Leu Thr Val Leu Leu Met Leu
405 410 415
Val Ala Lys Leu Ser Arg Leu Lys Gly Leu Asp Ala Ser Ile Glu His
420 425 430
Asp Ile Val His Gly Leu Gln Ala Leu Pro Ser Arg Ile Glu Gln Met
435 440 445
Leu Ser Gln Asp Lys Arg Ile Glu Ala Leu Ala Glu Asp Phe Ser Asp
450 455 460
Lys His His Ala Leu Phe Leu Ser Arg Gly Asp Gln Tyr Pro Ile Ala
465 470 475 480
Leu Glu Gly Ala Leu Lys Leu Lys Glu Ile Ser Tyr Ile His Ala Glu
485 490 495
Ala Tyr Ala Ala Gly Glu Leu Lys His Gly Pro Leu Ala Leu Ile Asp
500 505 510
Ala Asp Met Pro Val Ile Val Val Ala Pro Asn Asn Glu Leu Leu Glu
515 520 525
Lys Leu Lys Ser Asn Ile Glu Glu Val Arg Ala Arg Gly Gly Gln Leu
530 535 540
Tyr Val Phe Ala Asp Gln Asp Ala Gly Phe Val Ser Ser Asp Asn Met
545 550 555 560
His Ile Ile Glu Met Pro His Val Glu Glu Val Ile Ala Pro Ile Phe
565 570 575
Tyr Thr Val Pro Leu Gln Leu Leu Ala Tyr His Val Ala Leu Ile Lys
580 585 590
Gly Thr Asp Val Asp Gln Pro Arg Asn Leu Ala Lys Ser Val Thr Val
595 600 605
Glu
<210> 37
<211> 445
<212> PRT
<213> 大肠杆菌K-12 MG1655
<400> 37
Met Ser Asn Arg Lys Tyr Phe Gly Thr Asp Gly Ile Arg Gly Arg Val
1 5 10 15
Gly Asp Ala Pro Ile Thr Pro Asp Phe Val Leu Lys Leu Gly Trp Ala
20 25 30
Ala Gly Lys Val Leu Ala Arg His Gly Ser Arg Lys Ile Ile Ile Gly
35 40 45
Lys Asp Thr Arg Ile Ser Gly Tyr Met Leu Glu Ser Ala Leu Glu Ala
50 55 60
Gly Leu Ala Ala Ala Gly Leu Ser Ala Leu Phe Thr Gly Pro Met Pro
65 70 75 80
Thr Pro Ala Val Ala Tyr Leu Thr Arg Thr Phe Arg Ala Glu Ala Gly
85 90 95
Ile Val Ile Ser Ala Ser His Asn Pro Phe Tyr Asp Asn Gly Ile Lys
100 105 110
Phe Phe Ser Ile Asp Gly Thr Lys Leu Pro Asp Ala Val Glu Glu Ala
115 120 125
Ile Glu Ala Glu Met Glu Lys Glu Ile Ser Cys Val Asp Ser Ala Glu
130 135 140
Leu Gly Lys Ala Ser Arg Ile Val Asp Ala Ala Gly Arg Tyr Ile Glu
145 150 155 160
Phe Cys Lys Ala Thr Phe Pro Asn Glu Leu Ser Leu Ser Glu Leu Lys
165 170 175
Ile Val Val Asp Cys Ala Asn Gly Ala Thr Tyr His Ile Ala Pro Asn
180 185 190
Val Leu Arg Glu Leu Gly Ala Asn Val Ile Ala Ile Gly Cys Glu Pro
195 200 205
Asn Gly Val Asn Ile Asn Ala Glu Val Gly Ala Thr Asp Val Arg Ala
210 215 220
Leu Gln Ala Arg Val Leu Ala Glu Lys Ala Asp Leu Gly Ile Ala Phe
225 230 235 240
Asp Gly Asp Gly Asp Arg Val Ile Met Val Asp His Glu Gly Asn Lys
245 250 255
Val Asp Gly Asp Gln Ile Met Tyr Ile Ile Ala Arg Glu Gly Leu Arg
260 265 270
Gln Gly Gln Leu Arg Gly Gly Ala Val Gly Thr Leu Met Ser Asn Met
275 280 285
Gly Leu Glu Leu Ala Leu Lys Gln Leu Gly Ile Pro Phe Ala Arg Ala
290 295 300
Lys Val Gly Asp Arg Tyr Val Leu Glu Lys Met Gln Glu Lys Gly Trp
305 310 315 320
Arg Ile Gly Ala Glu Asn Ser Gly His Val Ile Leu Leu Asp Lys Thr
325 330 335
Thr Thr Gly Asp Gly Ile Val Ala Gly Leu Gln Val Leu Ala Ala Met
340 345 350
Ala Arg Asn His Met Ser Leu His Asp Leu Cys Ser Gly Met Lys Met
355 360 365
Phe Pro Gln Ile Leu Val Asn Val Arg Tyr Thr Ala Gly Ser Gly Asp
370 375 380
Pro Leu Glu His Glu Ser Val Lys Ala Val Thr Ala Glu Val Glu Ala
385 390 395 400
Ala Leu Gly Asn Arg Gly Arg Val Leu Leu Arg Lys Ser Gly Thr Glu
405 410 415
Pro Leu Ile Arg Val Met Val Glu Gly Glu Asp Glu Ala Gln Val Thr
420 425 430
Glu Phe Ala His Arg Ile Ala Asp Ala Val Lys Ala Val
435 440 445
<210> 38
<211> 456
<212> PRT
<213> 大肠杆菌K-12 MG1655
<400> 38
Met Leu Asn Asn Ala Met Ser Val Val Ile Leu Ala Ala Gly Lys Gly
1 5 10 15
Thr Arg Met Tyr Ser Asp Leu Pro Lys Val Leu His Thr Leu Ala Gly
20 25 30
Lys Ala Met Val Gln His Val Ile Asp Ala Ala Asn Glu Leu Gly Ala
35 40 45
Ala His Val His Leu Val Tyr Gly His Gly Gly Asp Leu Leu Lys Gln
50 55 60
Ala Leu Lys Asp Asp Asn Leu Asn Trp Val Leu Gln Ala Glu Gln Leu
65 70 75 80
Gly Thr Gly His Ala Met Gln Gln Ala Ala Pro Phe Phe Ala Asp Asp
85 90 95
Glu Asp Ile Leu Met Leu Tyr Gly Asp Val Pro Leu Ile Ser Val Glu
100 105 110
Thr Leu Gln Arg Leu Arg Asp Ala Lys Pro Gln Gly Gly Ile Gly Leu
115 120 125
Leu Thr Val Lys Leu Asp Asp Pro Thr Gly Tyr Gly Arg Ile Thr Arg
130 135 140
Glu Asn Gly Lys Val Thr Gly Ile Val Glu His Lys Asp Ala Thr Asp
145 150 155 160
Glu Gln Arg Gln Ile Gln Glu Ile Asn Thr Gly Ile Leu Ile Ala Asn
165 170 175
Gly Ala Asp Met Lys Arg Trp Leu Ala Lys Leu Thr Asn Asn Asn Ala
180 185 190
Gln Gly Glu Tyr Tyr Ile Thr Asp Ile Ile Ala Leu Ala Tyr Gln Glu
195 200 205
Gly Arg Glu Ile Val Ala Val His Pro Gln Arg Leu Ser Glu Val Glu
210 215 220
Gly Val Asn Asn Arg Leu Gln Leu Ser Arg Leu Glu Arg Val Tyr Gln
225 230 235 240
Ser Glu Gln Ala Glu Lys Leu Leu Leu Ala Gly Val Met Leu Arg Asp
245 250 255
Pro Ala Arg Phe Asp Leu Arg Gly Thr Leu Thr His Gly Arg Asp Val
260 265 270
Glu Ile Asp Thr Asn Val Ile Ile Glu Gly Asn Val Thr Leu Gly His
275 280 285
Arg Val Lys Ile Gly Thr Gly Cys Val Ile Lys Asn Ser Val Ile Gly
290 295 300
Asp Asp Cys Glu Ile Ser Pro Tyr Thr Val Val Glu Asp Ala Asn Leu
305 310 315 320
Ala Ala Ala Cys Thr Ile Gly Pro Phe Ala Arg Leu Arg Pro Gly Ala
325 330 335
Glu Leu Leu Glu Gly Ala His Val Gly Asn Phe Val Glu Met Lys Lys
340 345 350
Ala Arg Leu Gly Lys Gly Ser Lys Ala Gly His Leu Thr Tyr Leu Gly
355 360 365
Asp Ala Glu Ile Gly Asp Asn Val Asn Ile Gly Ala Gly Thr Ile Thr
370 375 380
Cys Asn Tyr Asp Gly Ala Asn Lys Phe Lys Thr Ile Ile Gly Asp Asp
385 390 395 400
Val Phe Val Gly Ser Asp Thr Gln Leu Val Ala Pro Val Thr Val Gly
405 410 415
Lys Gly Ala Thr Ile Ala Ala Gly Thr Thr Val Thr Arg Asn Val Gly
420 425 430
Glu Asn Ala Leu Ala Ile Ser Arg Val Pro Gln Thr Gln Lys Glu Gly
435 440 445
Trp Arg Arg Pro Val Lys Lys Lys
450 455
<210> 39
<211> 373
<212> PRT
<213> 弯曲空肠杆菌
<400> 39
Met Val Lys Lys Ile Leu Phe Ile Thr Gly Ser Arg Ala Asp Tyr Ser
1 5 10 15
Lys Ile Lys Ser Leu Met Tyr Arg Val Gln Asn Ser Ser Glu Phe Glu
20 25 30
Leu Tyr Ile Phe Ala Thr Gly Met His Leu Ser Lys Asn Phe Gly Tyr
35 40 45
Thr Val Lys Glu Leu Tyr Lys Asn Gly Phe Lys Asn Ile Tyr Glu Phe
50 55 60
Ile Asn Tyr Asp Lys Tyr Tyr Gln Thr Asp Lys Ala Leu Ala Thr Thr
65 70 75 80
Ile Asp Gly Phe Ser Arg Tyr Ala Asn Glu Leu Lys Pro Asp Leu Ile
85 90 95
Val Val His Gly Asp Arg Ile Glu Pro Leu Ala Ala Ala Ile Val Gly
100 105 110
Ala Leu Asn Asn Ile Leu Val Ala His Ile Glu Gly Gly Glu Ile Ser
115 120 125
Gly Thr Ile Asp Asp Ser Leu Arg His Ala Ile Ser Lys Leu Ala His
130 135 140
Ile His Leu Val Asn Asp Glu Phe Ala Lys Arg Arg Leu Met Gln Leu
145 150 155 160
Gly Glu Asp Glu Lys Ser Ile Phe Ile Ile Gly Ser Pro Asp Leu Glu
165 170 175
Leu Leu Asn Asp Asn Lys Ile Ser Leu Ser Glu Ala Lys Lys Tyr Tyr
180 185 190
Asp Ile Asn Tyr Glu Asn Tyr Ala Leu Leu Met Phe His Pro Val Thr
195 200 205
Thr Glu Ile Thr Ser Ile Lys Asn Gln Ala Asp Asn Leu Val Lys Ala
210 215 220
Leu Ile Gln Ser Asn Lys Asn Tyr Ile Val Ile Tyr Pro Asn Asn Asp
225 230 235 240
Leu Gly Phe Glu Leu Ile Leu Gln Ser Tyr Glu Glu Phe Lys Asn Asn
245 250 255
Pro Arg Phe Lys Leu Phe Pro Ser Leu Arg Phe Glu Tyr Phe Ile Thr
260 265 270
Leu Leu Lys Asn Ala Asp Phe Ile Ile Gly Asn Ser Ser Cys Ile Leu
275 280 285
Lys Glu Ala Leu Tyr Leu Lys Thr Ala Gly Ile Leu Val Gly Ser Arg
290 295 300
Gln Asn Gly Arg Leu Gly Asn Glu Asn Thr Leu Lys Val Asn Ala Asn
305 310 315 320
Ser Asp Glu Ile Leu Lys Ala Ile Asn Thr Ile His Lys Lys Gln Asp
325 330 335
Leu Phe Ser Ala Lys Leu Glu Ile Leu Asp Ser Ser Lys Leu Phe Phe
340 345 350
Glu Tyr Leu Gln Ser Gly Asp Phe Phe Lys Leu Ser Thr Gln Lys Val
355 360 365
Phe Lys Asp Ile Lys
370
<210> 40
<211> 223
<212> PRT
<213> 多杀巴斯德氏菌
<400> 40
Met Thr Asn Ile Ala Ile Ile Pro Ala Arg Ala Gly Ser Lys Gly Ile
1 5 10 15
Pro Asp Lys Asn Leu Gln Pro Val Gly Gly His Ser Leu Ile Gly Arg
20 25 30
Ala Ile Leu Ala Ala Lys Asn Ala Asp Val Phe Asp Met Ile Val Val
35 40 45
Thr Ser Asp Gly Asp Asn Ile Leu Arg Glu Ala Glu Lys Tyr Gly Ala
50 55 60
Leu Ala Leu Lys Arg Pro Ala Glu Leu Ala Gln Asp Asn Ser Arg Thr
65 70 75 80
Ile Asp Ala Ile Leu His Ala Leu Glu Ser Leu Asn Ile Arg Glu Gly
85 90 95
Thr Cys Thr Leu Leu Gln Pro Thr Ser Pro Leu Arg Asp His Leu Asp
100 105 110
Ile Lys Asn Ala Met Asp Met Tyr Val Asn Gly Gly Val His Ser Val
115 120 125
Val Ser Ala Cys Glu Cys Glu His His Pro Tyr Lys Ala Phe Ala Leu
130 135 140
Ser Lys Asp His Glu Val Leu Pro Val Arg Glu Ile Ala Asp Phe Glu
145 150 155 160
Ala Ala Arg Gln Thr Leu Pro Lys Met Tyr Arg Ala Asn Gly Ala Ile
165 170 175
Tyr Ile Asn Asp Ile Ala Gln Leu Leu Lys Glu Lys Tyr Phe Phe Ile
180 185 190
Pro Pro Leu Lys Phe Tyr Leu Met Pro Thr Tyr Arg Ser Val Asp Ile
195 200 205
Asp Val Lys Gln Asp Leu Glu Leu Ala Glu Ile Leu Ser Asn Lys
210 215 220
<210> 41
<211> 308
<212> PRT
<213> 多杀巴斯德氏菌多杀亚种Pm70菌株
<400> 41
Met Asn Leu Ile Ile Cys Cys Thr Pro Leu Gln Val Leu Ile Ala Glu
1 5 10 15
Lys Ile Ile Ala Lys Phe Pro His Met Pro Phe Tyr Gly Val Met Leu
20 25 30
Ser Thr Val Ser Asn Lys Lys Phe Asp Phe Tyr Ala Lys Arg Leu Ala
35 40 45
Gln Gln Cys Gln Gly Phe Phe Ser Met Val Gln His Lys Asp Arg Phe
50 55 60
Asn Leu Leu Lys Glu Ile Leu Tyr Leu Lys Arg Thr Phe Ser Gly Lys
65 70 75 80
His Phe Asp Gln Val Phe Val Ala Asn Ile Asn Asp Leu Gln Ile Gln
85 90 95
Phe Leu Leu Ser Ala Ile Asp Phe Asn Leu Leu Asn Thr Phe Asp Asp
100 105 110
Gly Thr Ile Asn Ile Val Pro Asn Ser Leu Phe Tyr Gln Asp Asp Pro
115 120 125
Ala Thr Leu Gln Arg Lys Leu Ile Asn Val Leu Leu Gly Asn Lys Tyr
130 135 140
Ser Ile Gln Ser Leu Arg Ala Leu Ser His Thr His Tyr Thr Ile Tyr
145 150 155 160
Lys Gly Phe Lys Asn Ile Ile Glu Arg Val Glu Pro Ile Glu Leu Val
165 170 175
Ala Ala Asp Asn Ser Glu Lys Val Thr Ser Ala Val Ile Asn Val Leu
180 185 190
Leu Gly Gln Pro Val Phe Ala Glu Asp Glu Arg Asn Ile Ala Leu Ala
195 200 205
Glu Arg Val Ile Lys Gln Phe Asn Ile His Tyr Tyr Leu Pro His Pro
210 215 220
Arg Glu Lys Tyr Arg Leu Ala Gln Val Asn Tyr Ile Asp Thr Glu Leu
225 230 235 240
Ile Phe Glu Asp Tyr Ile Leu Gln Gln Cys Gln Thr His Lys Tyr Cys
245 250 255
Val Tyr Thr Tyr Phe Ser Ser Ala Ile Ile Asn Ile Met Asn Lys Ser
260 265 270
Asp Asn Ile Glu Val Val Ala Leu Lys Ile Asp Thr Glu Asn Pro Ala
275 280 285
Tyr Asp Ala Cys Tyr Asp Leu Phe Asp Glu Leu Gly Val Asn Val Ile
290 295 300
Asp Ile Arg Glu
305
<210> 42
<211> 371
<212> PRT
<213> 脑膜炎奈瑟氏菌
<400> 42
Met Gly Leu Lys Lys Ala Cys Leu Thr Val Leu Cys Leu Ile Val Phe
1 5 10 15
Cys Phe Gly Ile Phe Tyr Thr Phe Asp Arg Val Asn Gln Gly Glu Arg
20 25 30
Asn Ala Val Ser Leu Leu Lys Glu Lys Leu Phe Asn Glu Glu Gly Glu
35 40 45
Pro Val Asn Leu Ile Phe Cys Tyr Thr Ile Leu Gln Met Lys Val Ala
50 55 60
Glu Arg Ile Met Ala Gln His Pro Gly Glu Arg Phe Tyr Val Val Leu
65 70 75 80
Met Ser Glu Asn Arg Asn Glu Lys Tyr Asp Tyr Tyr Phe Asn Gln Ile
85 90 95
Lys Asp Lys Ala Glu Arg Ala Tyr Phe Phe His Leu Pro Tyr Gly Leu
100 105 110
Asn Lys Ser Phe Asn Phe Ile Pro Thr Met Ala Glu Leu Lys Val Lys
115 120 125
Ser Met Leu Leu Pro Lys Val Lys Arg Ile Tyr Leu Ala Ser Leu Glu
130 135 140
Lys Val Ser Ile Ala Ala Phe Leu Ser Thr Tyr Pro Asp Ala Glu Ile
145 150 155 160
Lys Thr Phe Asp Asp Gly Thr Gly Asn Leu Ile Gln Ser Ser Ser Tyr
165 170 175
Leu Gly Asp Glu Phe Ser Val Asn Gly Thr Ile Lys Arg Asn Phe Ala
180 185 190
Arg Met Met Ile Gly Asp Trp Ser Ile Ala Lys Thr Arg Asn Ala Ser
195 200 205
Asp Glu His Tyr Thr Ile Phe Lys Gly Leu Lys Asn Ile Met Asp Asp
210 215 220
Gly Arg Arg Lys Met Thr Tyr Leu Pro Leu Phe Asp Ala Ser Glu Leu
225 230 235 240
Lys Thr Gly Asp Glu Thr Gly Gly Thr Val Arg Ile Leu Leu Gly Ser
245 250 255
Pro Asp Lys Glu Met Lys Glu Ile Ser Glu Lys Ala Ala Lys Asn Phe
260 265 270
Lys Ile Gln Tyr Val Ala Pro His Pro Arg Gln Thr Tyr Gly Leu Ser
275 280 285
Gly Val Thr Thr Leu Asn Ser Pro Tyr Val Ile Glu Asp Tyr Ile Leu
290 295 300
Arg Glu Ile Lys Lys Asn Pro His Thr Arg Tyr Glu Ile Tyr Thr Phe
305 310 315 320
Phe Ser Gly Ala Ala Leu Thr Met Lys Asp Phe Pro Asn Val His Val
325 330 335
Tyr Ala Leu Lys Pro Ala Ser Leu Pro Glu Asp Tyr Trp Leu Lys Pro
340 345 350
Val Tyr Ala Leu Phe Thr Gln Ser Gly Ile Pro Ile Leu Thr Phe Asp
355 360 365
Asp Lys Asn
370
<210> 43
<211> 391
<212> PRT
<213> 美人鱼发光杆菌
<400> 43
Met Thr Val Val Ala Pro Thr Leu Glu Val Tyr Ile Asp His Ala Ser
1 5 10 15
Leu Pro Ser Leu Gln Gln Leu Ile His Ile Ile Gln Ala Lys Asp Glu
20 25 30
Tyr Pro Ser Asn Gln Arg Phe Val Ser Trp Lys Arg Val Thr Val Asp
35 40 45
Ala Asp Asn Ala Asn Lys Leu Asn Ile His Thr Tyr Pro Leu Lys Gly
50 55 60
Asn Asn Thr Ser Pro Glu Met Val Ala Ala Ile Asp Glu Tyr Ala Gln
65 70 75 80
Ser Lys Asn Arg Leu Asn Ile Glu Phe Tyr Thr Asn Thr Ala His Val
85 90 95
Phe Asn Asn Leu Pro Pro Ile Ile Gln Pro Leu Tyr Asn Asn Glu Lys
100 105 110
Val Lys Ile Ser His Ile Ser Leu Tyr Asp Asp Gly Ser Ser Glu Tyr
115 120 125
Val Ser Leu Tyr Gln Trp Lys Asp Thr Pro Asn Lys Ile Glu Thr Leu
130 135 140
Glu Gly Glu Val Ser Leu Leu Ala Asn Tyr Leu Ala Gly Thr Ser Pro
145 150 155 160
Asp Ala Pro Lys Gly Met Gly Asn Arg Tyr Asn Trp His Lys Leu Tyr
165 170 175
Asp Thr Asp Tyr Tyr Phe Leu Arg Glu Asp Tyr Leu Asp Val Glu Ala
180 185 190
Asn Leu His Asp Leu Arg Asp Tyr Leu Gly Ser Ser Ala Lys Gln Met
195 200 205
Pro Trp Asp Glu Phe Ala Lys Leu Ser Asp Ser Gln Gln Thr Leu Phe
210 215 220
Leu Asp Ile Val Gly Phe Asp Lys Glu Gln Leu Gln Gln Gln Tyr Ser
225 230 235 240
Gln Ser Pro Leu Pro Asn Phe Ile Phe Thr Gly Thr Thr Thr Trp Ala
245 250 255
Gly Gly Glu Thr Lys Glu Tyr Tyr Ala Gln Gln Gln Val Asn Val Ile
260 265 270
Asn Asn Ala Ile Asn Glu Thr Ser Pro Tyr Tyr Leu Gly Lys Asp Tyr
275 280 285
Asp Leu Phe Phe Lys Gly His Pro Ala Gly Gly Val Ile Asn Asp Ile
290 295 300
Ile Leu Gly Ser Phe Pro Asp Met Ile Asn Ile Pro Ala Lys Ile Ser
305 310 315 320
Phe Glu Val Leu Met Met Thr Asp Met Leu Pro Asp Thr Val Ala Gly
325 330 335
Ile Ala Ser Ser Leu Tyr Phe Thr Ile Pro Ala Asp Lys Val Asn Phe
340 345 350
Ile Val Phe Thr Ser Ser Asp Thr Ile Thr Asp Arg Glu Glu Ala Leu
355 360 365
Lys Ser Pro Leu Val Gln Val Met Leu Thr Leu Gly Ile Val Lys Glu
370 375 380
Lys Asp Val Leu Phe Trp Ala
385 390
<210> 44
<211> 498
<212> PRT
<213> 发光杆菌属种JT-ISH-224
<400> 44
Met Ser Glu Glu Asn Thr Gln Ser Ile Ile Lys Asn Asp Ile Asn Lys
1 5 10 15
Thr Ile Ile Asp Glu Glu Tyr Val Asn Leu Glu Pro Ile Asn Gln Ser
20 25 30
Asn Ile Ser Phe Thr Lys His Ser Trp Val Gln Thr Cys Gly Thr Gln
35 40 45
Gln Leu Leu Thr Glu Gln Asn Lys Glu Ser Ile Ser Leu Ser Val Val
50 55 60
Ala Pro Arg Leu Asp Asp Asp Glu Lys Tyr Cys Phe Asp Phe Asn Gly
65 70 75 80
Val Ser Asn Lys Gly Glu Lys Tyr Ile Thr Lys Val Thr Leu Asn Val
85 90 95
Val Ala Pro Ser Leu Glu Val Tyr Val Asp His Ala Ser Leu Pro Thr
100 105 110
Leu Gln Gln Leu Met Asp Ile Ile Lys Ser Glu Glu Glu Asn Pro Thr
115 120 125
Ala Gln Arg Tyr Ile Ala Trp Gly Arg Ile Val Pro Thr Asp Glu Gln
130 135 140
Met Lys Glu Leu Asn Ile Thr Ser Phe Ala Leu Ile Asn Asn His Thr
145 150 155 160
Pro Ala Asp Leu Val Gln Glu Ile Val Lys Gln Ala Gln Thr Lys His
165 170 175
Arg Leu Asn Val Lys Leu Ser Ser Asn Thr Ala His Ser Phe Asp Asn
180 185 190
Leu Val Pro Ile Leu Lys Glu Leu Asn Ser Phe Asn Asn Val Thr Val
195 200 205
Thr Asn Ile Asp Leu Tyr Asp Asp Gly Ser Ala Glu Tyr Val Asn Leu
210 215 220
Tyr Asn Trp Arg Asp Thr Leu Asn Lys Thr Asp Asn Leu Lys Ile Gly
225 230 235 240
Lys Asp Tyr Leu Glu Asp Val Ile Asn Gly Ile Asn Glu Asp Thr Ser
245 250 255
Asn Thr Gly Thr Ser Ser Val Tyr Asn Trp Gln Lys Leu Tyr Pro Ala
260 265 270
Asn Tyr His Phe Leu Arg Lys Asp Tyr Leu Thr Leu Glu Pro Ser Leu
275 280 285
His Glu Leu Arg Asp Tyr Ile Gly Asp Ser Leu Lys Gln Met Gln Trp
290 295 300
Asp Gly Phe Lys Lys Phe Asn Ser Lys Gln Gln Glu Leu Phe Leu Ser
305 310 315 320
Ile Val Asn Phe Asp Lys Gln Lys Leu Gln Asn Glu Tyr Asn Ser Ser
325 330 335
Asn Leu Pro Asn Phe Val Phe Thr Gly Thr Thr Val Trp Ala Gly Asn
340 345 350
His Glu Arg Glu Tyr Tyr Ala Lys Gln Gln Ile Asn Val Ile Asn Asn
355 360 365
Ala Ile Asn Glu Ser Ser Pro His Tyr Leu Gly Asn Ser Tyr Asp Leu
370 375 380
Phe Phe Lys Gly His Pro Gly Gly Gly Ile Ile Asn Thr Leu Ile Met
385 390 395 400
Gln Asn Tyr Pro Ser Met Val Asp Ile Pro Ser Lys Ile Ser Phe Glu
405 410 415
Val Leu Met Met Thr Asp Met Leu Pro Asp Ala Val Ala Gly Ile Ala
420 425 430
Ser Ser Leu Tyr Phe Thr Ile Pro Ala Glu Lys Ile Lys Phe Ile Val
435 440 445
Phe Thr Ser Thr Glu Thr Ile Thr Asp Arg Glu Thr Ala Leu Arg Ser
450 455 460
Pro Leu Val Gln Val Met Ile Lys Leu Gly Ile Val Lys Glu Glu Asn
465 470 475 480
Val Leu Phe Trp Ala Asp Leu Pro Asn Cys Glu Thr Gly Val Cys Ile
485 490 495
Ala Val
<210> 45
<211> 380
<212> PRT
<213> 小家鼠
<400> 45
Met Arg Asn Cys Lys Met Ala Arg Val Ala Ser Val Leu Gly Leu Val
1 5 10 15
Met Leu Ser Val Ala Leu Leu Ile Leu Ser Leu Ile Ser Tyr Val Ser
20 25 30
Leu Lys Lys Glu Asn Ile Phe Thr Thr Pro Lys Tyr Ala Ser Pro Gly
35 40 45
Ala Pro Arg Met Tyr Met Phe His Ala Gly Phe Arg Ser Gln Phe Ala
50 55 60
Leu Lys Phe Leu Asp Gln Ser Phe Val Pro Ile Thr Asn Ser Leu Thr
65 70 75 80
His Glu Leu Gln Glu Lys Pro Ser Lys Trp Thr Phe Asn Arg Thr Ala
85 90 95
Phe Leu His Gln Arg Gln Glu Ile Leu Gln His Val Asp Val Ile Lys
100 105 110
Asn Phe Ser Leu Thr Lys Ser Ser Val Arg Ile Gly Gln Leu Met His
115 120 125
Tyr Asp Tyr Ser Ser His Lys Tyr Val Phe Ser Ile Ser Asn Asn Phe
130 135 140
Arg Ser Leu Leu Pro Asp Val Ser Pro Ile Met Asn Lys Arg Tyr Asn
145 150 155 160
Val Cys Ala Val Val Gly Asn Ser Gly Ile Leu Thr Gly Ser Gln Cys
165 170 175
Gly Gln Glu Ile Asp Lys Ser Asp Phe Val Phe Arg Cys Asn Phe Ala
180 185 190
Pro Thr Glu Ala Phe His Lys Asp Val Gly Arg Lys Thr Asn Leu Thr
195 200 205
Thr Phe Asn Pro Ser Ile Leu Glu Lys Tyr Tyr Asn Asn Leu Leu Thr
210 215 220
Ile Gln Asp Arg Asn Asn Phe Phe Leu Ser Leu Lys Lys Leu Asp Gly
225 230 235 240
Ala Ile Leu Trp Ile Pro Ala Phe Phe Phe His Thr Ser Ala Thr Val
245 250 255
Thr Arg Thr Leu Val Asp Phe Phe Val Glu His Arg Gly Gln Leu Lys
260 265 270
Val Gln Leu Ala Trp Pro Gly Asn Ile Met Gln His Val Asn Arg Tyr
275 280 285
Trp Lys Asn Lys His Leu Ser Pro Lys Arg Leu Ser Thr Gly Ile Leu
290 295 300
Met Tyr Thr Leu Ala Ser Ala Ile Cys Glu Glu Ile His Leu Tyr Gly
305 310 315 320
Phe Trp Pro Phe Gly Phe Asp Pro Asn Thr Arg Glu Asp Leu Pro Tyr
325 330 335
His Tyr Tyr Asp Lys Lys Gly Thr Lys Phe Thr Thr Lys Trp Gln Glu
340 345 350
Ser His Gln Leu Pro Ala Glu Phe Gln Leu Leu Tyr Arg Met His Gly
355 360 365
Glu Gly Leu Thr Lys Leu Thr Leu Ser His Cys Ala
370 375 380
<210> 46
<211> 417
<212> PRT
<213> 大肠杆菌K-12 MG1655
<400> 46
Met Tyr Tyr Leu Lys Asn Thr Asn Phe Trp Met Phe Gly Leu Phe Phe
1 5 10 15
Phe Phe Tyr Phe Phe Ile Met Gly Ala Tyr Phe Pro Phe Phe Pro Ile
20 25 30
Trp Leu His Asp Ile Asn His Ile Ser Lys Ser Asp Thr Gly Ile Ile
35 40 45
Phe Ala Ala Ile Ser Leu Phe Ser Leu Leu Phe Gln Pro Leu Phe Gly
50 55 60
Leu Leu Ser Asp Lys Leu Gly Leu Arg Lys Tyr Leu Leu Trp Ile Ile
65 70 75 80
Thr Gly Met Leu Val Met Phe Ala Pro Phe Phe Ile Phe Ile Phe Gly
85 90 95
Pro Leu Leu Gln Tyr Asn Ile Leu Val Gly Ser Ile Val Gly Gly Ile
100 105 110
Tyr Leu Gly Phe Cys Phe Asn Ala Gly Ala Pro Ala Val Glu Ala Phe
115 120 125
Ile Glu Lys Val Ser Arg Arg Ser Asn Phe Glu Phe Gly Arg Ala Arg
130 135 140
Met Phe Gly Cys Val Gly Trp Ala Leu Cys Ala Ser Ile Val Gly Ile
145 150 155 160
Met Phe Thr Ile Asn Asn Gln Phe Val Phe Trp Leu Gly Ser Gly Cys
165 170 175
Ala Leu Ile Leu Ala Val Leu Leu Phe Phe Ala Lys Thr Asp Ala Pro
180 185 190
Ser Ser Ala Thr Val Ala Asn Ala Val Gly Ala Asn His Ser Ala Phe
195 200 205
Ser Leu Lys Leu Ala Leu Glu Leu Phe Arg Gln Pro Lys Leu Trp Phe
210 215 220
Leu Ser Leu Tyr Val Ile Gly Val Ser Cys Thr Tyr Asp Val Phe Asp
225 230 235 240
Gln Gln Phe Ala Asn Phe Phe Thr Ser Phe Phe Ala Thr Gly Glu Gln
245 250 255
Gly Thr Arg Val Phe Gly Tyr Val Thr Thr Met Gly Glu Leu Leu Asn
260 265 270
Ala Ser Ile Met Phe Phe Ala Pro Leu Ile Ile Asn Arg Ile Gly Gly
275 280 285
Lys Asn Ala Leu Leu Leu Ala Gly Thr Ile Met Ser Val Arg Ile Ile
290 295 300
Gly Ser Ser Phe Ala Thr Ser Ala Leu Glu Val Val Ile Leu Lys Thr
305 310 315 320
Leu His Met Phe Glu Val Pro Phe Leu Leu Val Gly Cys Phe Lys Tyr
325 330 335
Ile Thr Ser Gln Phe Glu Val Arg Phe Ser Ala Thr Ile Tyr Leu Val
340 345 350
Cys Phe Cys Phe Phe Lys Gln Leu Ala Met Ile Phe Met Ser Val Leu
355 360 365
Ala Gly Asn Met Tyr Glu Ser Ile Gly Phe Gln Gly Ala Tyr Leu Val
370 375 380
Leu Gly Leu Val Ala Leu Gly Phe Thr Leu Ile Ser Val Phe Thr Leu
385 390 395 400
Ser Gly Pro Gly Pro Leu Ser Leu Leu Arg Arg Gln Val Asn Glu Val
405 410 415
Ala
<210> 47
<211> 415
<212> PRT
<213> 大肠杆菌W
<400> 47
Met Ala Leu Asn Ile Pro Phe Arg Asn Ala Tyr Tyr Arg Phe Ala Ser
1 5 10 15
Ser Tyr Ser Phe Leu Phe Phe Ile Ser Trp Ser Leu Trp Trp Ser Leu
20 25 30
Tyr Ala Ile Trp Leu Lys Gly His Leu Gly Leu Thr Gly Thr Glu Leu
35 40 45
Gly Thr Leu Tyr Ser Val Asn Gln Phe Thr Ser Ile Leu Phe Met Met
50 55 60
Phe Tyr Gly Ile Val Gln Asp Lys Leu Gly Leu Lys Lys Pro Leu Ile
65 70 75 80
Trp Cys Met Ser Phe Ile Leu Val Leu Thr Gly Pro Phe Met Ile Tyr
85 90 95
Val Tyr Glu Pro Leu Leu Gln Ser Asn Phe Ser Val Gly Leu Ile Leu
100 105 110
Gly Ala Leu Phe Phe Gly Leu Gly Tyr Leu Ala Gly Cys Gly Leu Leu
115 120 125
Asp Ser Phe Thr Glu Lys Met Ala Arg Asn Phe His Phe Glu Tyr Gly
130 135 140
Thr Ala Arg Ala Trp Gly Ser Phe Gly Tyr Ala Ile Gly Ala Phe Phe
145 150 155 160
Ala Gly Ile Phe Phe Ser Ile Ser Pro His Ile Asn Phe Trp Leu Val
165 170 175
Ser Leu Phe Gly Ala Val Phe Met Met Ile Asn Met Arg Phe Lys Asp
180 185 190
Lys Asp His Gln Cys Val Ala Ala Asp Ala Gly Gly Val Lys Lys Glu
195 200 205
Asp Phe Ile Ala Val Phe Lys Asp Arg Asn Phe Trp Val Phe Val Ile
210 215 220
Phe Ile Val Gly Thr Trp Ser Phe Tyr Asn Ile Phe Asp Gln Gln Leu
225 230 235 240
Phe Pro Val Phe Tyr Ser Gly Leu Phe Glu Ser His Asp Val Gly Thr
245 250 255
Arg Leu Tyr Gly Tyr Leu Asn Ser Phe Gln Val Val Leu Glu Ala Leu
260 265 270
Cys Met Ala Ile Ile Pro Phe Phe Val Asn Arg Val Gly Pro Lys Asn
275 280 285
Ala Leu Leu Ile Gly Val Val Ile Met Ala Leu Arg Ile Leu Ser Cys
290 295 300
Ala Leu Phe Val Asn Pro Trp Ile Ile Ser Leu Val Lys Leu Leu His
305 310 315 320
Ala Ile Glu Val Pro Leu Cys Val Ile Ser Val Phe Lys Tyr Ser Val
325 330 335
Ala Asn Phe Asp Lys Arg Leu Ser Ser Thr Ile Phe Leu Ile Gly Phe
340 345 350
Gln Ile Ala Ser Ser Leu Gly Ile Val Leu Leu Ser Thr Pro Thr Gly
355 360 365
Ile Leu Phe Asp His Ala Gly Tyr Gln Thr Val Phe Phe Ala Ile Ser
370 375 380
Gly Ile Val Cys Leu Met Leu Leu Phe Gly Ile Phe Phe Leu Ser Lys
385 390 395 400
Lys Arg Glu Gln Ile Val Met Glu Thr Pro Val Pro Ser Ala Ile
405 410 415
<210> 48
<211> 301
<212> PRT
<213> 运动发酵单胞菌
<400> 48
Met Lys Asn Asp Lys Lys Ile Tyr Gly Cys Ile Glu Gly Gly Gly Thr
1 5 10 15
Lys Phe Met Leu Ala Leu Ile Asp Ser Asp Arg Lys Met Leu Ala Val
20 25 30
Glu Arg Val Pro Thr Thr Thr Pro Glu Glu Thr Leu Gly Lys Ser Val
35 40 45
Glu Phe Phe Lys Lys Ala Leu Pro Gln Tyr Ala Asp Ser Phe Ala Ser
50 55 60
Phe Gly Ile Ala Ser Phe Gly Pro Leu Cys Leu Asp Arg Lys Ser Pro
65 70 75 80
Lys Trp Gly Tyr Ile Thr Asn Thr Pro Lys Pro Phe Trp Pro Asn Thr
85 90 95
Asp Val Val Thr Pro Phe Lys Glu Ala Phe Gly Cys Pro Val Glu Ile
100 105 110
Asp Thr Asp Val Asn Gly Ala Ala Leu Ala Glu Asn Phe Trp Gly Ala
115 120 125
Ser Lys Gly Thr His Thr Ser Val Tyr Val Thr Val Gly Thr Gly Phe
130 135 140
Gly Gly Gly Val Leu Ile Asp Gly Lys Pro Ile His Gly Leu Ala His
145 150 155 160
Pro Glu Met Gly His Gly Ile Pro Ile Arg His Pro Asp Asp Arg Asp
165 170 175
Phe Glu Gly Cys Cys Pro Tyr His Gly Gly Cys Tyr Glu Gly Leu Ala
180 185 190
Ser Gly Thr Ala Ile Arg Lys Arg Trp Gly Lys Ala Leu Asn Glu Met
195 200 205
Glu Pro Ala Glu Phe Glu Lys Ala Arg Glu Ile Ile Ala Phe Tyr Leu
210 215 220
Ala His Phe Asn Val Thr Leu Gln Ala Phe Ile Ser Pro Glu Arg Ile
225 230 235 240
Val Phe Gly Gly Gly Val Met His Val Asp Gly Met Leu Ala Ser Val
245 250 255
Arg Arg Gln Thr Ala Glu Ile Ala Asn Ser Tyr Phe Glu Gly Ala Asp
260 265 270
Phe Glu Lys Ile Ile Val Leu Pro Gly Leu Gly Asp Gln Ala Gly Met
275 280 285
Met Gly Ala Phe Ala Leu Ala Leu Ala Ala Glu Asn Lys
290 295 300
<210> 49
<211> 504
<212> PRT
<213> 青春双歧杆菌
<400> 49
Met Lys Asn Lys Val Gln Leu Ile Thr Tyr Ala Asp Arg Leu Gly Asp
1 5 10 15
Gly Thr Ile Lys Ser Met Thr Asp Ile Leu Arg Thr Arg Phe Asp Gly
20 25 30
Val Tyr Asp Gly Val His Ile Leu Pro Phe Phe Thr Pro Phe Asp Gly
35 40 45
Ala Asp Ala Gly Phe Asp Pro Ile Asp His Thr Lys Val Asp Glu Arg
50 55 60
Leu Gly Ser Trp Asp Asp Val Ala Glu Leu Ser Lys Thr His Asn Ile
65 70 75 80
Met Val Asp Ala Ile Val Asn His Met Ser Trp Glu Ser Lys Gln Phe
85 90 95
Gln Asp Val Leu Ala Lys Gly Glu Glu Ser Glu Tyr Tyr Pro Met Phe
100 105 110
Leu Thr Met Ser Ser Val Phe Pro Asn Gly Ala Thr Glu Glu Asp Leu
115 120 125
Ala Gly Ile Tyr Arg Pro Arg Pro Gly Leu Pro Phe Thr His Tyr Lys
130 135 140
Phe Ala Gly Lys Thr Arg Leu Val Trp Val Ser Phe Thr Pro Gln Gln
145 150 155 160
Val Asp Ile Asp Thr Asp Ser Asp Lys Gly Trp Glu Tyr Leu Met Ser
165 170 175
Ile Phe Asp Gln Met Ala Ala Ser His Val Ser Tyr Ile Arg Leu Asp
180 185 190
Ala Val Gly Tyr Gly Ala Lys Glu Ala Gly Thr Ser Cys Phe Met Thr
195 200 205
Pro Lys Thr Phe Lys Leu Ile Ser Arg Leu Arg Glu Glu Gly Val Lys
210 215 220
Arg Gly Leu Glu Ile Leu Ile Glu Val His Ser Tyr Tyr Lys Lys Gln
225 230 235 240
Val Glu Ile Ala Ser Lys Val Asp Arg Val Tyr Asp Phe Ala Leu Pro
245 250 255
Pro Leu Leu Leu His Ala Leu Ser Thr Gly His Val Glu Pro Val Ala
260 265 270
His Trp Thr Asp Ile Arg Pro Asn Asn Ala Val Thr Val Leu Asp Thr
275 280 285
His Asp Gly Ile Gly Val Ile Asp Ile Gly Ser Asp Gln Leu Asp Arg
290 295 300
Ser Leu Lys Gly Leu Val Pro Asp Glu Asp Val Asp Asn Leu Val Asn
305 310 315 320
Thr Ile His Ala Asn Thr His Gly Glu Ser Gln Ala Ala Thr Gly Ala
325 330 335
Ala Ala Ser Asn Leu Asp Leu Tyr Gln Val Asn Ser Thr Tyr Tyr Ser
340 345 350
Ala Leu Gly Cys Asn Asp Gln His Tyr Ile Ala Ala Arg Ala Val Gln
355 360 365
Phe Phe Leu Pro Gly Val Pro Gln Val Tyr Tyr Val Gly Ala Leu Ala
370 375 380
Gly Lys Asn Asp Met Glu Leu Leu Arg Lys Thr Asn Asn Gly Arg Asp
385 390 395 400
Ile Asn Arg His Tyr Tyr Ser Thr Ala Glu Ile Asp Glu Asn Leu Lys
405 410 415
Arg Pro Val Val Lys Ala Leu Asn Ala Leu Ala Lys Phe Arg Asn Glu
420 425 430
Leu Asp Ala Phe Asp Gly Thr Phe Ser Tyr Thr Thr Asp Asp Asp Thr
435 440 445
Ser Ile Ser Phe Thr Trp Arg Gly Glu Thr Ser Gln Ala Thr Leu Thr
450 455 460
Phe Glu Pro Lys Arg Gly Leu Gly Val Asp Asn Thr Thr Pro Val Ala
465 470 475 480
Met Leu Glu Trp Glu Asp Ser Ala Gly Asp His Arg Ser Asp Asp Leu
485 490 495
Ile Ala Asn Pro Pro Val Val Ala
500
<210> 50
<211> 299
<212> PRT
<213> 幽门螺杆菌UA1234
<400> 50
Met Ala Phe Lys Val Val Gln Ile Cys Gly Gly Leu Gly Asn Gln Met
1 5 10 15
Phe Gln Tyr Ala Phe Ala Lys Ser Leu Gln Lys His Ser Asn Thr Pro
20 25 30
Val Leu Leu Asp Ile Thr Ser Phe Asp Trp Ser Asn Arg Lys Met Gln
35 40 45
Leu Glu Leu Phe Pro Ile Asp Leu Pro Tyr Ala Ser Glu Lys Glu Ile
50 55 60
Ala Ile Ala Lys Met Gln His Leu Pro Lys Leu Val Arg Asn Val Leu
65 70 75 80
Lys Cys Met Gly Phe Asp Arg Val Ser Gln Glu Ile Val Phe Glu Tyr
85 90 95
Glu Pro Lys Leu Leu Lys Thr Ser Arg Leu Thr Tyr Phe Tyr Gly Tyr
100 105 110
Phe Gln Asp Pro Arg Tyr Phe Asp Ala Ile Ser Pro Leu Ile Lys Gln
115 120 125
Thr Phe Thr Leu Pro Pro Pro Pro Glu Asn Gly Asn Asn Lys Lys Lys
130 135 140
Glu Glu Glu Tyr His Arg Lys Leu Ala Leu Ile Leu Ala Ala Lys Asn
145 150 155 160
Ser Val Phe Val His Ile Arg Arg Gly Asp Tyr Val Gly Ile Gly Cys
165 170 175
Gln Leu Gly Ile Asp Tyr Gln Lys Lys Ala Leu Glu Tyr Met Ala Lys
180 185 190
Arg Val Pro Asn Met Glu Leu Phe Val Phe Cys Glu Asp Leu Glu Phe
195 200 205
Thr Gln Asn Leu Asp Leu Gly Tyr Pro Phe Met Asp Met Thr Thr Arg
210 215 220
Asp Lys Glu Glu Glu Ala Tyr Trp Asp Met Leu Leu Met Gln Ser Cys
225 230 235 240
Lys His Gly Ile Ile Ala Asn Ser Thr Tyr Ser Trp Trp Ala Ala Tyr
245 250 255
Leu Ile Asn Asn Pro Glu Lys Ile Ile Ile Gly Pro Lys His Trp Leu
260 265 270
Phe Gly His Glu Asn Ile Leu Cys Lys Glu Trp Val Lys Ile Glu Ser
275 280 285
His Phe Glu Val Lys Ser Gln Lys Tyr Asn Ala
290 295
<210> 51
<211> 478
<212> PRT
<213> 幽门螺杆菌UA1234
<400> 51
Met Phe Gln Pro Leu Leu Asp Ala Tyr Val Glu Ser Ala Ser Ile Glu
1 5 10 15
Lys Met Ala Ser Lys Ser Pro Pro Pro Leu Lys Ile Ala Val Ala Asn
20 25 30
Trp Trp Gly Asp Glu Glu Ile Lys Glu Phe Lys Asn Ser Val Leu Tyr
35 40 45
Phe Ile Leu Ser Gln Arg Tyr Thr Ile Thr Leu His Gln Asn Pro Asn
50 55 60
Glu Phe Ser Asp Leu Val Phe Gly Asn Pro Leu Gly Ser Ala Arg Lys
65 70 75 80
Ile Leu Ser Tyr Gln Asn Ala Lys Arg Val Phe Tyr Thr Gly Glu Asn
85 90 95
Glu Ser Pro Asn Phe Asn Leu Phe Asp Tyr Ala Ile Gly Phe Asp Glu
100 105 110
Leu Asp Phe Asn Asp Arg Tyr Leu Arg Met Pro Leu Tyr Tyr Asp Arg
115 120 125
Leu His His Lys Ala Glu Ser Val Asn Asp Thr Thr Ala Pro Tyr Lys
130 135 140
Leu Lys Asp Asn Ser Leu Tyr Ala Leu Lys Lys Pro Ser His Cys Phe
145 150 155 160
Lys Glu Lys His Pro Asn Leu Cys Ala Val Val Asn Asp Glu Ser Asp
165 170 175
Pro Leu Lys Arg Gly Phe Ala Ser Phe Val Ala Ser Asn Pro Asn Ala
180 185 190
Pro Ile Arg Asn Ala Phe Tyr Asp Ala Leu Asn Ser Ile Glu Pro Val
195 200 205
Thr Gly Gly Gly Ser Val Arg Asn Thr Leu Gly Tyr Asn Val Lys Asn
210 215 220
Lys Asn Glu Phe Leu Ser Gln Tyr Lys Phe Asn Leu Cys Phe Glu Asn
225 230 235 240
Thr Gln Gly Tyr Gly Tyr Val Thr Glu Lys Ile Ile Asp Ala Tyr Phe
245 250 255
Ser His Thr Ile Pro Ile Tyr Trp Gly Ser Pro Ser Val Ala Lys Asp
260 265 270
Phe Asn Pro Lys Ser Phe Val Asn Val His Asp Phe Lys Asn Phe Asp
275 280 285
Glu Ala Ile Asp Tyr Ile Lys Tyr Leu His Thr His Lys Asn Ala Tyr
290 295 300
Leu Asp Met Leu Tyr Glu Asn Pro Leu Asn Thr Leu Asp Gly Lys Ala
305 310 315 320
Tyr Phe Tyr Gln Asn Leu Ser Phe Lys Lys Ile Leu Ala Phe Phe Lys
325 330 335
Thr Ile Leu Glu Asn Asp Thr Ile Tyr His Asp Asn Pro Phe Ile Phe
340 345 350
Cys Arg Asp Leu Asn Glu Pro Leu Val Thr Ile Asp Asp Leu Arg Val
355 360 365
Asn Tyr Asp Asp Leu Arg Val Asn Tyr Asp Asp Leu Arg Ile Asn Tyr
370 375 380
Asp Asp Leu Arg Val Asn Tyr Asp Asp Leu Arg Ile Asn Tyr Asp Asp
385 390 395 400
Leu Arg Val Asn Tyr Asp Asp Leu Arg Val Asn Tyr Asp Asp Leu Arg
405 410 415
Ile Asn Tyr Asp Asp Leu Arg Val Asn Tyr Asp Asp Leu Arg Val Asn
420 425 430
Tyr Glu Arg Leu Leu Ser Lys Ala Thr Pro Leu Leu Glu Leu Ser Gln
435 440 445
Asn Thr Thr Ser Lys Ile Tyr Arg Lys Ala Tyr Gln Lys Ser Leu Pro
450 455 460
Leu Leu Arg Ala Ile Arg Arg Trp Val Lys Lys Leu Gly Leu
465 470 475
<210> 52
<211> 264
<212> PRT
<213> 大肠杆菌K-12 MG1655
<400> 52
Met Lys Gln Tyr Leu Glu Leu Met Gln Lys Val Leu Asp Glu Gly Thr
1 5 10 15
Gln Lys Asn Asp Arg Thr Gly Thr Gly Thr Leu Ser Ile Phe Gly His
20 25 30
Gln Met Arg Phe Asn Leu Gln Asp Gly Phe Pro Leu Val Thr Thr Lys
35 40 45
Arg Cys His Leu Arg Ser Ile Ile His Glu Leu Leu Trp Phe Leu Gln
50 55 60
Gly Asp Thr Asn Ile Ala Tyr Leu His Glu Asn Asn Val Thr Ile Trp
65 70 75 80
Asp Glu Trp Ala Asp Glu Asn Gly Asp Leu Gly Pro Val Tyr Gly Lys
85 90 95
Gln Trp Arg Ala Trp Pro Thr Pro Asp Gly Arg His Ile Asp Gln Ile
100 105 110
Thr Thr Val Leu Asn Gln Leu Lys Asn Asp Pro Asp Ser Arg Arg Ile
115 120 125
Ile Val Ser Ala Trp Asn Val Gly Glu Leu Asp Lys Met Ala Leu Ala
130 135 140
Pro Cys His Ala Phe Phe Gln Phe Tyr Val Ala Asp Gly Lys Leu Ser
145 150 155 160
Cys Gln Leu Tyr Gln Arg Ser Cys Asp Val Phe Leu Gly Leu Pro Phe
165 170 175
Asn Ile Ala Ser Tyr Ala Leu Leu Val His Met Met Ala Gln Gln Cys
180 185 190
Asp Leu Glu Val Gly Asp Phe Val Trp Thr Gly Gly Asp Thr His Leu
195 200 205
Tyr Ser Asn His Met Asp Gln Thr His Leu Gln Leu Ser Arg Glu Pro
210 215 220
Arg Pro Leu Pro Lys Leu Ile Ile Lys Arg Lys Pro Glu Ser Ile Phe
225 230 235 240
Asp Tyr Arg Phe Glu Asp Phe Glu Ile Glu Gly Tyr Asp Pro His Pro
245 250 255
Gly Ile Lys Ala Pro Val Ala Ile
260
<210> 53
<211> 391
<212> PRT
<213> 大肠杆菌K-12 MG1655
<400> 53
Met Gln Lys Leu Ile Asn Ser Val Gln Asn Tyr Ala Trp Gly Ser Lys
1 5 10 15
Thr Ala Leu Thr Glu Leu Tyr Gly Met Glu Asn Pro Ser Ser Gln Pro
20 25 30
Met Ala Glu Leu Trp Met Gly Ala His Pro Lys Ser Ser Ser Arg Val
35 40 45
Gln Asn Ala Ala Gly Asp Ile Val Ser Leu Arg Asp Val Ile Glu Ser
50 55 60
Asp Lys Ser Thr Leu Leu Gly Glu Ala Val Ala Lys Arg Phe Gly Glu
65 70 75 80
Leu Pro Phe Leu Phe Lys Val Leu Cys Ala Ala Gln Pro Leu Ser Ile
85 90 95
Gln Val His Pro Asn Lys His Asn Ser Glu Ile Gly Phe Ala Lys Glu
100 105 110
Asn Ala Ala Gly Ile Pro Met Asp Ala Ala Glu Arg Asn Tyr Lys Asp
115 120 125
Pro Asn His Lys Pro Glu Leu Val Phe Ala Leu Thr Pro Phe Leu Ala
130 135 140
Met Asn Ala Phe Arg Glu Phe Ser Glu Ile Val Ser Leu Leu Gln Pro
145 150 155 160
Val Ala Gly Ala His Pro Ala Ile Ala His Phe Leu Gln Gln Pro Asp
165 170 175
Ala Glu Arg Leu Ser Glu Leu Phe Ala Ser Leu Leu Asn Met Gln Gly
180 185 190
Glu Glu Lys Ser Arg Ala Leu Ala Ile Leu Lys Ser Ala Leu Asp Ser
195 200 205
Gln Gln Gly Glu Pro Trp Gln Thr Ile Arg Leu Ile Ser Glu Phe Tyr
210 215 220
Pro Glu Asp Ser Gly Leu Phe Ser Pro Leu Leu Leu Asn Val Val Lys
225 230 235 240
Leu Asn Pro Gly Glu Ala Met Phe Leu Phe Ala Glu Thr Pro His Ala
245 250 255
Tyr Leu Gln Gly Val Ala Leu Glu Val Met Ala Asn Ser Asp Asn Val
260 265 270
Leu Arg Ala Gly Leu Thr Pro Lys Tyr Ile Asp Ile Pro Glu Leu Val
275 280 285
Ala Asn Val Lys Phe Glu Ala Lys Pro Ala Asn Gln Leu Leu Thr Gln
290 295 300
Pro Val Lys Gln Gly Ala Glu Leu Asp Phe Pro Ile Pro Val Asp Asp
305 310 315 320
Phe Ala Phe Ser Leu His Asp Leu Ser Asp Lys Glu Thr Thr Ile Ser
325 330 335
Gln Gln Ser Ala Ala Ile Leu Phe Cys Val Glu Gly Asp Ala Thr Leu
340 345 350
Trp Lys Gly Ser Gln Gln Leu Gln Leu Lys Pro Gly Glu Ser Ala Phe
355 360 365
Ile Ala Ala Asn Glu Ser Pro Val Thr Val Lys Gly His Gly Arg Leu
370 375 380
Ala Arg Val Tyr Asn Lys Leu
385 390
<210> 54
<211> 456
<212> PRT
<213> 大肠杆菌K-12 MG1655
<400> 54
Met Lys Lys Leu Thr Cys Phe Lys Ala Tyr Asp Ile Arg Gly Lys Leu
1 5 10 15
Gly Glu Glu Leu Asn Glu Asp Ile Ala Trp Arg Ile Gly Arg Ala Tyr
20 25 30
Gly Glu Phe Leu Lys Pro Lys Thr Ile Val Leu Gly Gly Asp Val Arg
35 40 45
Leu Thr Ser Glu Thr Leu Lys Leu Ala Leu Ala Lys Gly Leu Gln Asp
50 55 60
Ala Gly Val Asp Val Leu Asp Ile Gly Met Ser Gly Thr Glu Glu Ile
65 70 75 80
Tyr Phe Ala Thr Phe His Leu Gly Val Asp Gly Gly Ile Glu Val Thr
85 90 95
Ala Ser His Asn Pro Met Asp Tyr Asn Gly Met Lys Leu Val Arg Glu
100 105 110
Gly Ala Arg Pro Ile Ser Gly Asp Thr Gly Leu Arg Asp Val Gln Arg
115 120 125
Leu Ala Glu Ala Asn Asp Phe Pro Pro Val Asp Glu Thr Lys Arg Gly
130 135 140
Arg Tyr Gln Gln Ile Asn Leu Arg Asp Ala Tyr Val Asp His Leu Phe
145 150 155 160
Gly Tyr Ile Asn Val Lys Asn Leu Thr Pro Leu Lys Leu Val Ile Asn
165 170 175
Ser Gly Asn Gly Ala Ala Gly Pro Val Val Asp Ala Ile Glu Ala Arg
180 185 190
Phe Lys Ala Leu Gly Ala Pro Val Glu Leu Ile Lys Val His Asn Thr
195 200 205
Pro Asp Gly Asn Phe Pro Asn Gly Ile Pro Asn Pro Leu Leu Pro Glu
210 215 220
Cys Arg Asp Asp Thr Arg Asn Ala Val Ile Lys His Gly Ala Asp Met
225 230 235 240
Gly Ile Ala Phe Asp Gly Asp Phe Asp Arg Cys Phe Leu Phe Asp Glu
245 250 255
Lys Gly Gln Phe Ile Glu Gly Tyr Tyr Ile Val Gly Leu Leu Ala Glu
260 265 270
Ala Phe Leu Glu Lys Asn Pro Gly Ala Lys Ile Ile His Asp Pro Arg
275 280 285
Leu Ser Trp Asn Thr Val Asp Val Val Thr Ala Ala Gly Gly Thr Pro
290 295 300
Val Met Ser Lys Thr Gly His Ala Phe Ile Lys Glu Arg Met Arg Lys
305 310 315 320
Glu Asp Ala Ile Tyr Gly Gly Glu Met Ser Ala His His Tyr Phe Arg
325 330 335
Asp Phe Ala Tyr Cys Asp Ser Gly Met Ile Pro Trp Leu Leu Val Ala
340 345 350
Glu Leu Val Cys Leu Lys Asp Lys Thr Leu Gly Glu Leu Val Arg Asp
355 360 365
Arg Met Ala Ala Phe Pro Ala Ser Gly Glu Ile Asn Ser Lys Leu Ala
370 375 380
Gln Pro Val Glu Ala Ile Asn Arg Val Glu Gln His Phe Ser Arg Glu
385 390 395 400
Ala Leu Ala Val Asp Arg Thr Asp Gly Ile Ser Met Thr Phe Ala Asp
405 410 415
Trp Arg Phe Asn Leu Arg Thr Ser Asn Thr Glu Pro Val Val Arg Leu
420 425 430
Asn Val Glu Ser Arg Gly Asp Val Pro Leu Met Glu Ala Arg Thr Arg
435 440 445
Thr Leu Leu Thr Leu Leu Asn Glu
450 455
<210> 55
<211> 478
<212> PRT
<213> 大肠杆菌K-12 MG1655
<400> 55
Met Ala Gln Ser Lys Leu Tyr Pro Val Val Met Ala Gly Gly Ser Gly
1 5 10 15
Ser Arg Leu Trp Pro Leu Ser Arg Val Leu Tyr Pro Lys Gln Phe Leu
20 25 30
Cys Leu Lys Gly Asp Leu Thr Met Leu Gln Thr Thr Ile Cys Arg Leu
35 40 45
Asn Gly Val Glu Cys Glu Ser Pro Val Val Ile Cys Asn Glu Gln His
50 55 60
Arg Phe Ile Val Ala Glu Gln Leu Arg Gln Leu Asn Lys Leu Thr Glu
65 70 75 80
Asn Ile Ile Leu Glu Pro Ala Gly Arg Asn Thr Ala Pro Ala Ile Ala
85 90 95
Leu Ala Ala Leu Ala Ala Lys Arg His Ser Pro Glu Ser Asp Pro Leu
100 105 110
Met Leu Val Leu Ala Ala Asp His Val Ile Ala Asp Glu Asp Ala Phe
115 120 125
Arg Ala Ala Val Arg Asn Ala Met Pro Tyr Ala Glu Ala Gly Lys Leu
130 135 140
Val Thr Phe Gly Ile Val Pro Asp Leu Pro Glu Thr Gly Tyr Gly Tyr
145 150 155 160
Ile Arg Arg Gly Glu Val Ser Ala Gly Glu Gln Asp Met Val Ala Phe
165 170 175
Glu Val Ala Gln Phe Val Glu Lys Pro Asn Leu Glu Thr Ala Gln Ala
180 185 190
Tyr Val Ala Ser Gly Glu Tyr Tyr Trp Asn Ser Gly Met Phe Leu Phe
195 200 205
Arg Ala Gly Arg Tyr Leu Glu Glu Leu Lys Lys Tyr Arg Pro Asp Ile
210 215 220
Leu Asp Ala Cys Glu Lys Ala Met Ser Ala Val Asp Pro Asp Leu Asn
225 230 235 240
Phe Ile Arg Val Asp Glu Glu Ala Phe Leu Ala Cys Pro Glu Glu Ser
245 250 255
Val Asp Tyr Ala Val Met Glu Arg Thr Ala Asp Ala Val Val Val Pro
260 265 270
Met Asp Ala Gly Trp Ser Asp Val Gly Ser Trp Ser Ser Leu Trp Glu
275 280 285
Ile Ser Ala His Thr Ala Glu Gly Asn Val Cys His Gly Asp Val Ile
290 295 300
Asn His Lys Thr Glu Asn Ser Tyr Val Tyr Ala Glu Ser Gly Leu Val
305 310 315 320
Thr Thr Val Gly Val Lys Asp Leu Val Val Val Gln Thr Lys Asp Ala
325 330 335
Val Leu Ile Ala Asp Arg Asn Ala Val Gln Asp Val Lys Lys Val Val
340 345 350
Glu Gln Ile Lys Ala Asp Gly Arg His Glu His Arg Val His Arg Glu
355 360 365
Val Tyr Arg Pro Trp Gly Lys Tyr Asp Ser Ile Asp Ala Gly Asp Arg
370 375 380
Tyr Gln Val Lys Arg Ile Thr Val Lys Pro Gly Glu Gly Leu Ser Val
385 390 395 400
Gln Met His His His Arg Ala Glu His Trp Val Val Val Ala Gly Thr
405 410 415
Ala Lys Val Thr Ile Asp Gly Asp Ile Lys Leu Leu Gly Glu Asn Glu
420 425 430
Ser Ile Tyr Ile Pro Leu Gly Ala Thr His Cys Leu Glu Asn Pro Gly
435 440 445
Lys Ile Pro Leu Asp Leu Ile Glu Val Arg Ser Gly Ser Tyr Leu Glu
450 455 460
Glu Asp Asp Val Val Arg Phe Ala Asp Arg Tyr Gly Arg Val
465 470 475
<210> 56
<211> 373
<212> PRT
<213> 大肠杆菌K-12 MG1655
<400> 56
Met Ser Lys Val Ala Leu Ile Thr Gly Val Thr Gly Gln Asp Gly Ser
1 5 10 15
Tyr Leu Ala Glu Phe Leu Leu Glu Lys Gly Tyr Glu Val His Gly Ile
20 25 30
Lys Arg Arg Ala Ser Ser Phe Asn Thr Glu Arg Val Asp His Ile Tyr
35 40 45
Gln Asp Pro His Thr Cys Asn Pro Lys Phe His Leu His Tyr Gly Asp
50 55 60
Leu Ser Asp Thr Ser Asn Leu Thr Arg Ile Leu Arg Glu Val Gln Pro
65 70 75 80
Asp Glu Val Tyr Asn Leu Gly Ala Met Ser His Val Ala Val Ser Phe
85 90 95
Glu Ser Pro Glu Tyr Thr Ala Asp Val Asp Ala Met Gly Thr Leu Arg
100 105 110
Leu Leu Glu Ala Ile Arg Phe Leu Gly Leu Glu Lys Lys Thr Arg Phe
115 120 125
Tyr Gln Ala Ser Thr Ser Glu Leu Tyr Gly Leu Val Gln Glu Ile Pro
130 135 140
Gln Lys Glu Thr Thr Pro Phe Tyr Pro Arg Ser Pro Tyr Ala Val Ala
145 150 155 160
Lys Leu Tyr Ala Tyr Trp Ile Thr Val Asn Tyr Arg Glu Ser Tyr Gly
165 170 175
Met Tyr Ala Cys Asn Gly Ile Leu Phe Asn His Glu Ser Pro Arg Arg
180 185 190
Gly Glu Thr Phe Val Thr Arg Lys Ile Thr Arg Ala Ile Ala Asn Ile
195 200 205
Ala Gln Gly Leu Glu Ser Cys Leu Tyr Leu Gly Asn Met Asp Ser Leu
210 215 220
Arg Asp Trp Gly His Ala Lys Asp Tyr Val Lys Met Gln Trp Met Met
225 230 235 240
Leu Gln Gln Glu Gln Pro Glu Asp Phe Val Ile Ala Thr Gly Val Gln
245 250 255
Tyr Ser Val Arg Gln Phe Val Glu Met Ala Ala Ala Gln Leu Gly Ile
260 265 270
Lys Leu Arg Phe Glu Gly Thr Gly Val Glu Glu Lys Gly Ile Val Val
275 280 285
Ser Val Thr Gly His Asp Ala Pro Gly Val Lys Pro Gly Asp Val Ile
290 295 300
Ile Ala Val Asp Pro Arg Tyr Phe Arg Pro Ala Glu Val Glu Thr Leu
305 310 315 320
Leu Gly Asp Pro Thr Lys Ala His Glu Lys Leu Gly Trp Lys Pro Glu
325 330 335
Ile Thr Leu Arg Glu Met Val Ser Glu Met Val Ala Asn Asp Leu Glu
340 345 350
Ala Ala Lys Lys His Ser Leu Leu Lys Ser His Gly Tyr Asp Val Ala
355 360 365
Ile Ala Leu Glu Ser
370
<210> 57
<211> 321
<212> PRT
<213> 大肠杆菌K-12 MG1655
<400> 57
Met Ser Lys Gln Arg Val Phe Ile Ala Gly His Arg Gly Met Val Gly
1 5 10 15
Ser Ala Ile Arg Arg Gln Leu Glu Gln Arg Gly Asp Val Glu Leu Val
20 25 30
Leu Arg Thr Arg Asp Glu Leu Asn Leu Leu Asp Ser Arg Ala Val His
35 40 45
Asp Phe Phe Ala Ser Glu Arg Ile Asp Gln Val Tyr Leu Ala Ala Ala
50 55 60
Lys Val Gly Gly Ile Val Ala Asn Asn Thr Tyr Pro Ala Asp Phe Ile
65 70 75 80
Tyr Gln Asn Met Met Ile Glu Ser Asn Ile Ile His Ala Ala His Gln
85 90 95
Asn Asp Val Asn Lys Leu Leu Phe Leu Gly Ser Ser Cys Ile Tyr Pro
100 105 110
Lys Leu Ala Lys Gln Pro Met Ala Glu Ser Glu Leu Leu Gln Gly Thr
115 120 125
Leu Glu Pro Thr Asn Glu Pro Tyr Ala Ile Ala Lys Ile Ala Gly Ile
130 135 140
Lys Leu Cys Glu Ser Tyr Asn Arg Gln Tyr Gly Arg Asp Tyr Arg Ser
145 150 155 160
Val Met Pro Thr Asn Leu Tyr Gly Pro His Asp Asn Phe His Pro Ser
165 170 175
Asn Ser His Val Ile Pro Ala Leu Leu Arg Arg Phe His Glu Ala Thr
180 185 190
Ala Gln Asn Ala Pro Asp Val Val Val Trp Gly Ser Gly Thr Pro Met
195 200 205
Arg Glu Phe Leu His Val Asp Asp Met Ala Ala Ala Ser Ile His Val
210 215 220
Met Glu Leu Ala His Glu Val Trp Leu Glu Asn Thr Gln Pro Met Leu
225 230 235 240
Ser His Ile Asn Val Gly Thr Gly Val Asp Cys Thr Ile Arg Glu Leu
245 250 255
Ala Gln Thr Ile Ala Lys Val Val Gly Tyr Lys Gly Arg Val Val Phe
260 265 270
Asp Ala Ser Lys Pro Asp Gly Thr Pro Arg Lys Leu Leu Asp Val Thr
275 280 285
Arg Leu His Gln Leu Gly Trp Tyr His Glu Ile Ser Leu Glu Ala Gly
290 295 300
Leu Ala Ser Thr Tyr Gln Trp Phe Leu Glu Asn Gln Asp Arg Phe Arg
305 310 315 320
Gly
<210> 58
<211> 438
<212> PRT
<213> 大肠杆菌K-12 MG1655
<400> 58
Met Gly Asn Thr Ser Ile Gln Thr Gln Ser Tyr Arg Ala Val Asp Lys
1 5 10 15
Asp Ala Gly Gln Ser Arg Ser Tyr Ile Ile Pro Phe Ala Leu Leu Cys
20 25 30
Ser Leu Phe Phe Leu Trp Ala Val Ala Asn Asn Leu Asn Asp Ile Leu
35 40 45
Leu Pro Gln Phe Gln Gln Ala Phe Thr Leu Thr Asn Phe Gln Ala Gly
50 55 60
Leu Ile Gln Ser Ala Phe Tyr Phe Gly Tyr Phe Ile Ile Pro Ile Pro
65 70 75 80
Ala Gly Ile Leu Met Lys Lys Leu Ser Tyr Lys Ala Gly Ile Ile Thr
85 90 95
Gly Leu Phe Leu Tyr Ala Leu Gly Ala Ala Leu Phe Trp Pro Ala Ala
100 105 110
Glu Ile Met Asn Tyr Thr Leu Phe Leu Val Gly Leu Phe Ile Ile Ala
115 120 125
Ala Gly Leu Gly Cys Leu Glu Thr Ala Ala Asn Pro Phe Val Thr Val
130 135 140
Leu Gly Pro Glu Ser Ser Gly His Phe Arg Leu Asn Leu Ala Gln Thr
145 150 155 160
Phe Asn Ser Phe Gly Ala Ile Ile Ala Val Val Phe Gly Gln Ser Leu
165 170 175
Ile Leu Ser Asn Val Pro His Gln Ser Gln Asp Val Leu Asp Lys Met
180 185 190
Ser Pro Glu Gln Leu Ser Ala Tyr Lys His Ser Leu Val Leu Ser Val
195 200 205
Gln Thr Pro Tyr Met Ile Ile Val Ala Ile Val Leu Leu Val Ala Leu
210 215 220
Leu Ile Met Leu Thr Lys Phe Pro Ala Leu Gln Ser Asp Asn His Ser
225 230 235 240
Asp Ala Lys Gln Gly Ser Phe Ser Ala Ser Leu Ser Arg Leu Ala Arg
245 250 255
Ile Arg His Trp Arg Trp Ala Val Leu Ala Gln Phe Cys Tyr Val Gly
260 265 270
Ala Gln Thr Ala Cys Trp Ser Tyr Leu Ile Arg Tyr Ala Val Glu Glu
275 280 285
Ile Pro Gly Met Thr Ala Gly Phe Ala Ala Asn Tyr Leu Thr Gly Thr
290 295 300
Met Val Cys Phe Phe Ile Gly Arg Phe Thr Gly Thr Trp Leu Ile Ser
305 310 315 320
Arg Phe Ala Pro His Lys Val Leu Ala Ala Tyr Ala Leu Ile Ala Met
325 330 335
Ala Leu Cys Leu Ile Ser Ala Phe Ala Gly Gly His Val Gly Leu Ile
340 345 350
Ala Leu Thr Leu Cys Ser Ala Phe Met Ser Ile Gln Tyr Pro Thr Ile
355 360 365
Phe Ser Leu Gly Ile Lys Asn Leu Gly Gln Asp Thr Lys Tyr Gly Ser
370 375 380
Ser Phe Ile Val Met Thr Ile Ile Gly Gly Gly Ile Val Thr Pro Val
385 390 395 400
Met Gly Phe Val Ser Asp Ala Ala Gly Asn Ile Pro Thr Ala Glu Leu
405 410 415
Ile Pro Ala Leu Cys Phe Ala Val Ile Phe Ile Phe Ala Arg Phe Arg
420 425 430
Ser Gln Thr Ala Thr Asn
435
<210> 59
<211> 949
<212> PRT
<213> 脆弱拟杆菌 NCTC 9343
<400> 59
Met Gln Lys Leu Leu Ser Leu Pro Ser Asn Leu Val Gln Ser Phe His
1 5 10 15
Glu Leu Glu Arg Val Asn Arg Thr Asp Trp Phe Cys Thr Ser Asp Pro
20 25 30
Val Gly Lys Lys Leu Gly Ser Gly Gly Gly Thr Ser Trp Leu Leu Glu
35 40 45
Glu Cys Tyr Asn Glu Tyr Ser Asp Gly Ala Thr Phe Gly Glu Trp Leu
50 55 60
Glu Lys Glu Lys Arg Ile Leu Leu His Ala Gly Gly Gln Ser Arg Arg
65 70 75 80
Leu Pro Gly Tyr Ala Pro Ser Gly Lys Ile Leu Thr Pro Val Pro Val
85 90 95
Phe Arg Trp Glu Arg Gly Gln His Leu Gly Gln Asn Leu Leu Ser Leu
100 105 110
Gln Leu Pro Leu Tyr Glu Lys Ile Met Ser Leu Ala Pro Asp Lys Leu
115 120 125
His Thr Leu Ile Ala Ser Gly Asp Val Tyr Ile Arg Ser Glu Lys Pro
130 135 140
Leu Gln Ser Ile Pro Glu Ala Asp Val Val Cys Tyr Gly Leu Trp Val
145 150 155 160
Asp Pro Ser Leu Ala Thr His His Gly Val Phe Ala Ser Asp Arg Lys
165 170 175
His Pro Glu Gln Leu Asp Phe Met Leu Gln Lys Pro Ser Leu Ala Glu
180 185 190
Leu Glu Ser Leu Ser Lys Thr His Leu Phe Leu Met Asp Ile Gly Ile
195 200 205
Trp Leu Leu Ser Asp Arg Ala Val Glu Ile Leu Met Lys Arg Ser His
210 215 220
Lys Glu Ser Ser Glu Glu Leu Lys Tyr Tyr Asp Leu Tyr Ser Asp Phe
225 230 235 240
Gly Leu Ala Leu Gly Thr His Pro Arg Ile Glu Asp Glu Glu Val Asn
245 250 255
Thr Leu Ser Val Ala Ile Leu Pro Leu Pro Gly Gly Glu Phe Tyr His
260 265 270
Tyr Gly Thr Ser Lys Glu Leu Ile Ser Ser Thr Leu Ser Val Gln Asn
275 280 285
Lys Val Tyr Asp Gln Arg Arg Ile Met His Arg Lys Val Lys Pro Asn
290 295 300
Pro Ala Met Phe Val Gln Asn Ala Val Val Arg Ile Pro Leu Cys Ala
305 310 315 320
Glu Asn Ala Asp Leu Trp Ile Glu Asn Ser His Ile Gly Pro Lys Trp
325 330 335
Lys Ile Ala Ser Arg His Ile Ile Thr Gly Val Pro Glu Asn Asp Trp
340 345 350
Ser Leu Ala Val Pro Ala Gly Val Cys Val Asp Val Val Pro Met Gly
355 360 365
Asp Lys Gly Phe Val Ala Arg Pro Tyr Gly Leu Asp Asp Val Phe Lys
370 375 380
Gly Asp Leu Arg Asp Ser Lys Thr Thr Leu Thr Gly Ile Pro Phe Gly
385 390 395 400
Glu Trp Met Ser Lys Arg Gly Leu Ser Tyr Thr Asp Leu Lys Gly Arg
405 410 415
Thr Asp Asp Leu Gln Ala Val Ser Val Phe Pro Met Val Asn Ser Val
420 425 430
Glu Glu Leu Gly Leu Val Leu Arg Trp Met Leu Ser Glu Pro Glu Leu
435 440 445
Glu Glu Gly Lys Asn Ile Trp Leu Arg Ser Glu His Phe Ser Ala Asp
450 455 460
Glu Ile Ser Ala Gly Ala Asn Leu Lys Arg Leu Tyr Ala Gln Arg Glu
465 470 475 480
Glu Phe Arg Lys Gly Asn Trp Lys Ala Leu Ala Val Asn His Glu Lys
485 490 495
Ser Val Phe Tyr Gln Leu Asp Leu Ala Asp Ala Ala Glu Asp Phe Val
500 505 510
Arg Leu Gly Leu Asp Met Pro Glu Leu Leu Pro Glu Asp Ala Leu Gln
515 520 525
Met Ser Arg Ile His Asn Arg Met Leu Arg Ala Arg Ile Leu Lys Leu
530 535 540
Asp Gly Lys Asp Tyr Arg Pro Glu Glu Gln Ala Ala Phe Asp Leu Leu
545 550 555 560
Arg Asp Gly Leu Leu Asp Gly Ile Ser Asn Arg Lys Ser Thr Pro Lys
565 570 575
Leu Asp Val Tyr Ser Asp Gln Ile Val Trp Gly Arg Ser Pro Val Arg
580 585 590
Ile Asp Met Ala Gly Gly Trp Thr Asp Thr Pro Pro Tyr Ser Leu Tyr
595 600 605
Ser Gly Gly Asn Val Val Asn Leu Ala Ile Glu Leu Asn Gly Gln Pro
610 615 620
Pro Leu Gln Val Tyr Val Lys Pro Cys Lys Asp Phe His Ile Val Leu
625 630 635 640
Arg Ser Ile Asp Met Gly Ala Met Glu Ile Val Ser Thr Phe Asp Glu
645 650 655
Leu Gln Asp Tyr Lys Lys Ile Gly Ser Pro Phe Ser Ile Pro Lys Ala
660 665 670
Ala Leu Ser Leu Ala Gly Phe Ala Pro Ala Phe Ser Ala Val Ser Tyr
675 680 685
Ala Ser Leu Glu Glu Gln Leu Lys Asp Phe Gly Ala Gly Ile Glu Val
690 695 700
Thr Leu Leu Ala Ala Ile Pro Ala Gly Ser Gly Leu Gly Thr Ser Ser
705 710 715 720
Ile Leu Ala Ser Thr Val Leu Gly Ala Ile Asn Asp Phe Cys Gly Leu
725 730 735
Ala Trp Asp Lys Asn Glu Ile Cys Gln Arg Thr Leu Val Leu Glu Gln
740 745 750
Leu Leu Thr Thr Gly Gly Gly Trp Gln Asp Gln Tyr Gly Gly Val Leu
755 760 765
Gln Gly Val Lys Leu Leu Gln Thr Glu Ala Gly Phe Ala Gln Ser Pro
770 775 780
Leu Val Arg Trp Leu Pro Asp His Leu Phe Thr His Pro Glu Tyr Lys
785 790 795 800
Asp Cys His Leu Leu Tyr Tyr Thr Gly Ile Thr Arg Thr Ala Lys Gly
805 810 815
Ile Leu Ala Glu Ile Val Ser Ser Met Phe Leu Asn Ser Ser Leu His
820 825 830
Leu Asn Leu Leu Ser Glu Met Lys Ala His Ala Leu Asp Met Asn Glu
835 840 845
Ala Ile Gln Arg Gly Ser Phe Val Glu Phe Gly Arg Leu Val Gly Lys
850 855 860
Thr Trp Glu Gln Asn Lys Ala Leu Asp Ser Gly Thr Asn Pro Pro Ala
865 870 875 880
Val Glu Ala Ile Ile Asp Leu Ile Lys Asp Tyr Thr Leu Gly Tyr Lys
885 890 895
Leu Pro Gly Ala Gly Gly Gly Gly Tyr Leu Tyr Met Val Ala Lys Asp
900 905 910
Pro Gln Ala Ala Val Arg Ile Arg Lys Ile Leu Thr Glu Asn Ala Pro
915 920 925
Asn Pro Arg Ala Arg Phe Val Glu Met Thr Leu Ser Asp Lys Gly Phe
930 935 940
Gln Val Ser Arg Ser
945
<210> 60
<211> 348
<212> PRT
<213> 脑膜炎奈瑟氏菌
<400> 60
Met Pro Ser Glu Ala Phe Arg Arg His Arg Ala Tyr Arg Glu Asn Lys
1 5 10 15
Leu Gln Pro Leu Val Ser Val Leu Ile Cys Ala Tyr Asn Val Glu Lys
20 25 30
Tyr Phe Ala Gln Ser Leu Ala Ala Val Val Asn Gln Thr Trp Cys Asn
35 40 45
Leu Asp Ile Leu Ile Val Asp Asp Gly Ser Thr Asp Gly Thr Leu Ala
50 55 60
Ile Ala Gln Arg Phe Gln Glu Gln Asp Gly Arg Ile Lys Ile Leu Ala
65 70 75 80
Gln Ala Gln Asn Ser Gly Leu Ile Pro Ser Leu Asn Ile Gly Leu Asp
85 90 95
Glu Leu Ala Lys Ser Gly Met Gly Glu Tyr Ile Ala Arg Thr Asp Ala
100 105 110
Asp Asp Ile Ala Ala Pro Asp Trp Ile Glu Lys Ile Val Gly Glu Met
115 120 125
Glu Lys Asp Arg Ser Ile Ile Ala Met Gly Ala Trp Leu Glu Val Leu
130 135 140
Ser Glu Glu Lys Asp Gly Asn Arg Leu Ala Arg His His Glu His Gly
145 150 155 160
Lys Ile Trp Lys Lys Pro Thr Arg His Glu Asp Ile Ala Asp Phe Phe
165 170 175
Pro Phe Gly Asn Pro Ile His Asn Asn Thr Met Ile Met Arg Arg Ser
180 185 190
Val Ile Asp Gly Gly Leu Arg Tyr Asn Thr Glu Arg Asp Trp Ala Glu
195 200 205
Asp Tyr Gln Phe Trp Tyr Asp Val Ser Lys Leu Gly Arg Leu Ala Tyr
210 215 220
Tyr Pro Glu Ala Leu Val Lys Tyr Arg Leu His Ala Asn Gln Val Ser
225 230 235 240
Ser Lys Tyr Ser Ile Arg Gln His Glu Ile Ala Gln Gly Ile Gln Lys
245 250 255
Thr Ala Arg Asn Asp Phe Leu Gln Ser Met Gly Phe Lys Thr Arg Phe
260 265 270
Asp Ser Leu Glu Tyr Arg Gln Ile Lys Ala Val Ala Tyr Glu Leu Leu
275 280 285
Glu Lys His Leu Pro Glu Glu Asp Phe Glu Arg Ala Arg Arg Phe Leu
290 295 300
Tyr Gln Cys Phe Lys Arg Thr Asp Thr Leu Pro Ala Gly Val Trp Leu
305 310 315 320
Asp Phe Ala Ala Asn Gly Arg Met Arg Arg Leu Phe Thr Leu Arg Gln
325 330 335
Tyr Phe Gly Ile Leu His Arg Leu Leu Lys Asn Arg
340 345
<210> 61
<211> 265
<212> PRT
<213> 大肠杆菌O55:H7
<400> 61
Met Ile Ile Asp Glu Ala Glu Ser Ala Glu Ser Thr His Pro Val Val
1 5 10 15
Ser Val Ile Leu Pro Val Asn Lys Lys Asn Pro Phe Leu Asp Glu Ala
20 25 30
Ile Asn Ser Ile Leu Ser Gln Thr Phe Ser Ser Phe Glu Ile Ile Ile
35 40 45
Val Ala Asn Cys Cys Thr Asp Asp Phe Tyr Asn Glu Leu Lys His Lys
50 55 60
Val Asn Asp Lys Ile Lys Leu Ile Arg Thr Asn Ile Ala Tyr Leu Pro
65 70 75 80
Tyr Ser Leu Asn Lys Ala Ile Asp Leu Ser Asn Gly Glu Phe Ile Ala
85 90 95
Arg Met Asp Ser Asp Asp Ile Ser His Pro Asp Arg Phe Thr Lys Gln
100 105 110
Val Asp Phe Leu Lys Asn Asn Pro Tyr Val Asp Val Val Gly Thr Asn
115 120 125
Ala Ile Phe Ile Asp Asp Lys Gly Arg Glu Ile Asn Lys Thr Lys Leu
130 135 140
Pro Glu Glu Asn Leu Asp Ile Val Lys Asn Leu Pro Tyr Lys Cys Cys
145 150 155 160
Ile Val His Pro Ser Val Met Phe Arg Lys Lys Val Ile Ala Ser Ile
165 170 175
Gly Gly Tyr Met Phe Ser Asn Tyr Ser Glu Asp Tyr Glu Leu Trp Asn
180 185 190
Arg Leu Ser Leu Ala Lys Ile Lys Phe Gln Asn Leu Pro Glu Tyr Leu
195 200 205
Phe Tyr Tyr Arg Leu His Glu Gly Gln Ser Thr Ala Lys Lys Asn Leu
210 215 220
Tyr Met Val Met Val Asn Asp Leu Val Ile Lys Met Lys Cys Phe Phe
225 230 235 240
Leu Thr Gly Asn Ile Asn Tyr Leu Phe Gly Gly Ile Arg Thr Ile Ala
245 250 255
Ser Phe Ile Tyr Cys Lys Tyr Ile Lys
260 265
<210> 62
<211> 275
<212> PRT
<213> 脑膜炎奈瑟氏菌 MC58
<400> 62
Met Gln Asn His Val Ile Ser Leu Ala Ser Ala Ala Glu Arg Arg Ala
1 5 10 15
His Ile Ala Asp Thr Phe Gly Arg His Gly Ile Pro Phe Gln Phe Phe
20 25 30
Asp Ala Leu Met Pro Ser Glu Arg Leu Glu Gln Ala Met Ala Glu Leu
35 40 45
Val Pro Gly Leu Ser Ala His Pro Tyr Leu Ser Gly Val Glu Lys Ala
50 55 60
Cys Phe Met Ser His Ala Val Leu Trp Lys Gln Ala Leu Asp Glu Gly
65 70 75 80
Leu Pro Tyr Ile Thr Val Phe Glu Asp Asp Val Leu Leu Gly Glu Gly
85 90 95
Ala Glu Lys Phe Leu Ala Glu Asp Ala Trp Leu Gln Glu Arg Phe Asp
100 105 110
Pro Asp Thr Ala Phe Ile Val Arg Leu Glu Thr Met Phe Met His Val
115 120 125
Leu Thr Ser Pro Ser Gly Val Ala Asp Tyr Cys Gly Arg Ala Phe Pro
130 135 140
Leu Leu Glu Ser Glu His Trp Gly Thr Ala Gly Tyr Ile Ile Ser Arg
145 150 155 160
Lys Ala Met Arg Phe Phe Leu Asp Arg Phe Ala Ala Leu Pro Pro Glu
165 170 175
Gly Leu His Pro Val Asp Leu Met Met Phe Ser Asp Phe Phe Asp Arg
180 185 190
Glu Gly Met Pro Val Cys Gln Leu Asn Pro Ala Leu Cys Ala Gln Glu
195 200 205
Leu His Tyr Ala Lys Phe His Asp Gln Asn Ser Ala Leu Gly Ser Leu
210 215 220
Ile Glu His Asp Arg Leu Leu Asn Arg Lys Gln Gln Arg Arg Asp Ser
225 230 235 240
Pro Ala Asn Thr Phe Lys His Arg Leu Ile Arg Ala Leu Thr Lys Ile
245 250 255
Ser Arg Glu Arg Glu Lys Arg Arg Gln Arg Arg Glu Gln Phe Ile Val
260 265 270
Pro Phe Gln
275
<210> 63
<211> 338
<212> PRT
<213> 大肠杆菌K-12 MG1655
<400> 63
Met Arg Val Leu Val Thr Gly Gly Ser Gly Tyr Ile Gly Ser His Thr
1 5 10 15
Cys Val Gln Leu Leu Gln Asn Gly His Asp Val Ile Ile Leu Asp Asn
20 25 30
Leu Cys Asn Ser Lys Arg Ser Val Leu Pro Val Ile Glu Arg Leu Gly
35 40 45
Gly Lys His Pro Thr Phe Val Glu Gly Asp Ile Arg Asn Glu Ala Leu
50 55 60
Met Thr Glu Ile Leu His Asp His Ala Ile Asp Thr Val Ile His Phe
65 70 75 80
Ala Gly Leu Lys Ala Val Gly Glu Ser Val Gln Lys Pro Leu Glu Tyr
85 90 95
Tyr Asp Asn Asn Val Asn Gly Thr Leu Arg Leu Ile Ser Ala Met Arg
100 105 110
Ala Ala Asn Val Lys Asn Phe Ile Phe Ser Ser Ser Ala Thr Val Tyr
115 120 125
Gly Asp Gln Pro Lys Ile Pro Tyr Val Glu Ser Phe Pro Thr Gly Thr
130 135 140
Pro Gln Ser Pro Tyr Gly Lys Ser Lys Leu Met Val Glu Gln Ile Leu
145 150 155 160
Thr Asp Leu Gln Lys Ala Gln Pro Asp Trp Ser Ile Ala Leu Leu Arg
165 170 175
Tyr Phe Asn Pro Val Gly Ala His Pro Ser Gly Asp Met Gly Glu Asp
180 185 190
Pro Gln Gly Ile Pro Asn Asn Leu Met Pro Tyr Ile Ala Gln Val Ala
195 200 205
Val Gly Arg Arg Asp Ser Leu Ala Ile Phe Gly Asn Asp Tyr Pro Thr
210 215 220
Glu Asp Gly Thr Gly Val Arg Asp Tyr Ile His Val Met Asp Leu Ala
225 230 235 240
Asp Gly His Val Val Ala Met Glu Lys Leu Ala Asn Lys Pro Gly Val
245 250 255
His Ile Tyr Asn Leu Gly Ala Gly Val Gly Asn Ser Val Leu Asp Val
260 265 270
Val Asn Ala Phe Ser Lys Ala Cys Gly Lys Pro Val Asn Tyr His Phe
275 280 285
Ala Pro Arg Arg Glu Gly Asp Leu Pro Ala Tyr Trp Ala Asp Ala Ser
290 295 300
Lys Ala Asp Arg Glu Leu Asn Trp Arg Val Thr Arg Thr Leu Asp Glu
305 310 315 320
Met Ala Gln Asp Thr Trp His Trp Gln Ser Arg His Pro Gln Gly Tyr
325 330 335
Pro Asp
<210> 64
<211> 221
<212> PRT
<213> 弯曲空肠杆菌
<400> 64
Met Ser Leu Ala Ile Ile Pro Ala Arg Gly Gly Ser Lys Gly Ile Lys
1 5 10 15
Asn Lys Asn Leu Val Leu Leu Asn Asn Lys Pro Leu Ile Tyr Tyr Thr
20 25 30
Ile Lys Ala Ala Leu Asn Ala Lys Ser Ile Ser Lys Val Val Val Ser
35 40 45
Ser Asp Ser Asp Glu Ile Leu Asn Tyr Ala Lys Ser Gln Asn Val Asp
50 55 60
Ile Leu Lys Arg Pro Ile Ser Leu Ala Gln Asp Asp Thr Thr Ser Asp
65 70 75 80
Lys Val Leu Leu His Ala Leu Lys Phe Tyr Lys Asp Tyr Glu Asp Val
85 90 95
Val Phe Leu Gln Pro Thr Ser Pro Leu Arg Thr Asn Ile His Ile Asn
100 105 110
Glu Ala Phe Asn Leu Tyr Lys Asn Ser Asn Ala Asn Ala Leu Ile Ser
115 120 125
Val Ser Glu Cys Asp Asn Lys Ile Leu Lys Ala Phe Val Cys Asn Asp
130 135 140
Cys Gly Asp Leu Ala Gly Ile Cys Asn Asp Glu Tyr Pro Phe Met Pro
145 150 155 160
Arg Gln Lys Leu Pro Lys Thr Tyr Met Ser Asn Gly Ala Ile Tyr Ile
165 170 175
Leu Lys Ile Lys Glu Phe Leu Asn Asn Pro Ser Phe Leu Gln Ser Lys
180 185 190
Thr Lys His Phe Leu Met Asp Glu Ser Ser Ser Leu Asp Ile Asp Cys
195 200 205
Leu Glu Asp Leu Lys Lys Val Glu Gln Ile Trp Lys Lys
210 215 220
<210> 65
<211> 224
<212> PRT
<213> 流感嗜血杆菌
<400> 65
Met Thr Arg Ile Ala Ile Ile Pro Ala Arg Ala Gly Ser Lys Gly Ile
1 5 10 15
Lys Asp Lys Asn Leu Gln Leu Val Gly Gly Val Ser Leu Val Gly Arg
20 25 30
Ala Ile Leu Ala Ala Gln Glu Ser Gly Met Phe Asp Gln Ile Val Val
35 40 45
Thr Ser Asp Gly Glu Asn Ile Leu Lys Glu Ala Thr Lys Tyr Gly Ala
50 55 60
Lys Ala Val Ala Arg Pro Glu Ser Leu Ala Gln Ser Asp Thr Arg Thr
65 70 75 80
Ile Asp Ala Ile Leu His Cys Leu Glu Thr Leu Asn Ile Ser Gln Gly
85 90 95
Thr Ala Ala Leu Leu Gln Pro Thr Ser Pro Leu Arg Asn Ala Leu Asp
100 105 110
Ile Arg Asn Ala Met Glu Ile Phe Leu Gly Gly Lys Tyr Lys Ser Val
115 120 125
Val Ser Ala Cys Glu Cys Glu His His Pro Tyr Lys Ser Phe Thr Leu
130 135 140
Glu Gly Thr Glu Val Gln Pro Ile His Glu Leu Thr Asp Phe Glu Ala
145 150 155 160
Pro Arg Gln Lys Leu Pro Lys Ser Tyr Arg Ala Asn Gly Ala Ile Tyr
165 170 175
Thr Asn Asp Ile Gln Ser Leu Phe Glu Glu Lys Arg Phe Phe Ile Ala
180 185 190
Pro Met Arg Phe Tyr Leu Met Pro Thr Tyr Arg Ser Ile Asp Ile Asp
195 200 205
Ser Thr Leu Asp Leu Gln Leu Ala Glu Ser Leu Ile Ser Lys Glu Phe
210 215 220
<210> 66
<211> 496
<212> PRT
<213> 大肠杆菌K-12 MG1655
<400> 66
Met Ser Thr Thr Thr Gln Asn Ile Pro Trp Tyr Arg His Leu Asn Arg
1 5 10 15
Ala Gln Trp Arg Ala Phe Ser Ala Ala Trp Leu Gly Tyr Leu Leu Asp
20 25 30
Gly Phe Asp Phe Val Leu Ile Ala Leu Val Leu Thr Glu Val Gln Gly
35 40 45
Glu Phe Gly Leu Thr Thr Val Gln Ala Ala Ser Leu Ile Ser Ala Ala
50 55 60
Phe Ile Ser Arg Trp Phe Gly Gly Leu Met Leu Gly Ala Met Gly Asp
65 70 75 80
Arg Tyr Gly Arg Arg Leu Ala Met Val Thr Ser Ile Val Leu Phe Ser
85 90 95
Ala Gly Thr Leu Ala Cys Gly Phe Ala Pro Gly Tyr Ile Thr Met Phe
100 105 110
Ile Ala Arg Leu Val Ile Gly Met Gly Met Ala Gly Glu Tyr Gly Ser
115 120 125
Ser Ala Thr Tyr Val Ile Glu Ser Trp Pro Lys His Leu Arg Asn Lys
130 135 140
Ala Ser Gly Phe Leu Ile Ser Gly Phe Ser Val Gly Ala Val Val Ala
145 150 155 160
Ala Gln Val Tyr Ser Leu Val Val Pro Val Trp Gly Trp Arg Ala Leu
165 170 175
Phe Phe Ile Gly Ile Leu Pro Ile Ile Phe Ala Leu Trp Leu Arg Lys
180 185 190
Asn Ile Pro Glu Ala Glu Asp Trp Lys Glu Lys His Ala Gly Lys Ala
195 200 205
Pro Val Arg Thr Met Val Asp Ile Leu Tyr Arg Gly Glu His Arg Ile
210 215 220
Ala Asn Ile Val Met Thr Leu Ala Ala Ala Thr Ala Leu Trp Phe Cys
225 230 235 240
Phe Ala Gly Asn Leu Gln Asn Ala Ala Ile Val Ala Val Leu Gly Leu
245 250 255
Leu Cys Ala Ala Ile Phe Ile Ser Phe Met Val Gln Ser Ala Gly Lys
260 265 270
Arg Trp Pro Thr Gly Val Met Leu Met Val Val Val Leu Phe Ala Phe
275 280 285
Leu Tyr Ser Trp Pro Ile Gln Ala Leu Leu Pro Thr Tyr Leu Lys Thr
290 295 300
Asp Leu Ala Tyr Asn Pro His Thr Val Ala Asn Val Leu Phe Phe Ser
305 310 315 320
Gly Phe Gly Ala Ala Val Gly Cys Cys Val Gly Gly Phe Leu Gly Asp
325 330 335
Trp Leu Gly Thr Arg Lys Ala Tyr Val Cys Ser Leu Leu Ala Ser Gln
340 345 350
Leu Leu Ile Ile Pro Val Phe Ala Ile Gly Gly Ala Asn Val Trp Val
355 360 365
Leu Gly Leu Leu Leu Phe Phe Gln Gln Met Leu Gly Gln Gly Ile Ala
370 375 380
Gly Ile Leu Pro Lys Leu Ile Gly Gly Tyr Phe Asp Thr Asp Gln Arg
385 390 395 400
Ala Ala Gly Leu Gly Phe Thr Tyr Asn Val Gly Ala Leu Gly Gly Ala
405 410 415
Leu Ala Pro Ile Ile Gly Ala Leu Ile Ala Gln Arg Leu Asp Leu Gly
420 425 430
Thr Ala Leu Ala Ser Leu Ser Phe Ser Leu Thr Phe Val Val Ile Leu
435 440 445
Leu Ile Gly Leu Asp Met Pro Ser Arg Val Gln Arg Trp Leu Arg Pro
450 455 460
Glu Ala Leu Arg Thr His Asp Ala Ile Asp Gly Lys Pro Phe Ser Gly
465 470 475 480
Ala Val Pro Phe Gly Ser Ala Lys Asn Asp Leu Val Lys Thr Lys Ser
485 490 495
<210> 67
<211> 352
<212> PRT
<213> 豚鼠气单胞菌
<400> 67
Met Asp Lys Ile Ile Lys Pro Phe Ile Thr Ile Asn Gly Arg Lys Ile
1 5 10 15
Gly Pro Asp Tyr Pro Pro Tyr Ile Ile Ala Glu Leu Ser Ala Asn His
20 25 30
Asn Gly Asp Ile Asn Arg Ala Phe Ala Ile Met Glu Glu Ala Lys Lys
35 40 45
Ala Gly Ala Asp Ala Ile Lys Leu Gln Thr Tyr Thr Ala Asp Thr Ile
50 55 60
Thr Phe Glu Cys Asp Ser Glu Glu Phe Gln Ile His Gly Gly Leu Trp
65 70 75 80
Asp Gly Lys Asn Leu Tyr Gln Leu Tyr Lys Glu Ala Gln Met Pro Trp
85 90 95
Glu Trp His Gln Pro Leu Phe Glu Lys Ala Lys Glu Leu Gly Ile Thr
100 105 110
Ile Phe Ser Ser Pro Phe Asp Phe Thr Ala Val Asp Leu Leu Glu Asp
115 120 125
Leu Asp Ala Pro Ala Tyr Lys Ile Ala Ser Phe Glu Leu Ile Asp Leu
130 135 140
Pro Leu Ile Lys Arg Val Ala Gln Thr Gly Lys Pro Met Ile Met Ser
145 150 155 160
Thr Gly Met Ala Asn Ala Glu Glu Ile Ala Glu Ala Ile Ala Thr Ala
165 170 175
Gln Ser Asn Gly Cys Gln Glu Leu Val Val Leu His Cys Val Ser Gly
180 185 190
Tyr Pro Ala Pro Ala Asp Gln Tyr Asn Leu Arg Thr Ile Ala Asp Met
195 200 205
Ala Glu Arg Phe Gly Val Leu Ser Gly Leu Ser Asp His Thr Ile Asp
210 215 220
Asn Ala Thr Ala Val Ala Ala Val Ala Leu Gly Ala Cys Leu Ile Glu
225 230 235 240
Lys His Val Thr Met Asp Arg Asn Gly Gly Gly Ala Asp Asp Ser Phe
245 250 255
Ser Leu Glu Pro His Glu Leu Ala Ala Leu Cys Lys Asp Ala Lys Thr
260 265 270
Ala Trp Ser Ala Leu Gly Ser Val Asn Tyr Thr Arg Thr Glu Ala Glu
275 280 285
Lys Gly Asn Val Lys Phe Arg Arg Ser Leu Tyr Val Ile Arg Asp Ile
290 295 300
Lys Ala Gly Asp Val Leu Ser Asn Asp Asn Val Arg Ser Ile Arg Pro
305 310 315 320
Gly Phe Gly Leu Ala Pro Lys Tyr Leu Glu Gln Val Leu Gly Lys Thr
325 330 335
Ala Ile Val Asp Ile Lys Arg Gly Thr Pro Leu Ser Phe Glu Phe Ile
340 345 350
<210> 68
<211> 300
<212> PRT
<213> Candidatus koribacter versatilis
<400> 68
Met Ala Ala Asn Asn Gly Gln Gln Gln His Pro Ala Val Arg Ile Gly
1 5 10 15
Ser Lys Met Val Gly Lys Asp Gln Pro Cys Tyr Val Ile Ala Glu Ile
20 25 30
Gly Ile Asn His Asn Gly Asp Met Asp Ile Ala Lys Arg Leu Ile Ser
35 40 45
Val Ala Val Gly Ala Gly Cys Asp Ala Val Lys Phe Gln Lys Arg Thr
50 55 60
Ile Asp Val Val Tyr Thr Ala Ala Glu Leu Ala Lys Pro Arg Glu Asn
65 70 75 80
Pro Phe Gly Ala Thr Asn Gly Asp Leu Lys Arg Gly Leu Glu Phe Gly
85 90 95
Leu Glu Glu Phe Lys Glu Ile Asp Arg Tyr Cys Arg Glu Val Arg Met
100 105 110
Pro Trp Phe Ala Ser Ala Trp Asp Glu Ala Ser Val Asp Phe Ile Ala
115 120 125
Gln Phe Asp Val Pro Cys Phe Lys Ile Ala Ser Ala Ser Leu Thr Asp
130 135 140
Asp Asn Leu Leu Arg His Thr Arg Ala Thr Gly Lys Pro Val Met Leu
145 150 155 160
Ser Thr Gly Met Ser Thr Val Glu Gln Ile Asp His Ala Val Asp Val
165 170 175
Leu Gly Lys Asp Asn Leu Ile Leu Leu Gln Ala Cys Ser Thr Tyr Pro
180 185 190
Ala Tyr Tyr Glu Glu Leu Asn Leu Lys Ala Ile His Thr Leu Met Asp
195 200 205
Arg Tyr Gly Val Pro Val Gly Tyr Ser Gly His Glu Thr Gly Leu Pro
210 215 220
Ala Ser Ile Ala Ala Ala Ala Met Gly Ala Cys Val Leu Glu Arg His
225 230 235 240
Ile Thr Leu Asp Arg Ala Met Trp Gly Ser Asp Gln Ala Ala Ser Leu
245 250 255
Glu Pro Asn Gly Ile Thr Gln Leu Val Arg Tyr Leu Arg Ile Val Glu
260 265 270
Lys Ser Met Gly Asp Gly Val Lys Arg Val Leu Glu Arg Glu Gln Pro
275 280 285
Val Ile Gln Lys Leu Arg Arg Val Gly Gly Gly Gln
290 295 300
<210> 69
<211> 338
<212> PRT
<213> 嗜肺军团菌
<400> 69
Met Thr Cys Phe Ile Ile Ala Glu Ala Gly Val Asn His Asn Gly Asp
1 5 10 15
Leu Gln Leu Ala Lys Glu Leu Val Tyr Ala Ala Lys Glu Ser Gly Ala
20 25 30
Asp Ala Val Lys Phe Gln Thr Phe Lys Ala Asp Thr Leu Val Asn Lys
35 40 45
Thr Val Glu Lys Ala Glu Tyr Gln Lys Asn Asn Ala Pro Glu Ser Ser
50 55 60
Thr Gln Tyr Glu Met Leu Lys Ala Leu Glu Leu Ser Glu Glu Asp His
65 70 75 80
Tyr Leu Leu Ser Glu Leu Ala Asn Ser Leu Gly Ile Glu Phe Met Ser
85 90 95
Thr Gly Phe Asp Glu Gln Ser Ile Asp Phe Leu Ile Ser Leu Gly Val
100 105 110
Lys Arg Leu Lys Ile Pro Ser Gly Glu Ile Thr Asn Val Pro Tyr Leu
115 120 125
Gln His Cys Ala Ser Lys Lys Leu Pro Leu Ile Ile Ser Thr Gly Met
130 135 140
Cys Asp Leu Gln Glu Val Arg Val Ala Ile Asp Thr Val Lys Pro Tyr
145 150 155 160
Tyr Gly Asn Ser Leu Ser Asp Tyr Leu Val Leu Leu His Cys Thr Ser
165 170 175
Asn Tyr Pro Ala Ser Tyr Gln Asp Val Asn Leu Lys Ala Met Gln Thr
180 185 190
Leu Ala Asp Glu Phe Gln Leu Pro Val Gly Tyr Ser Asp His Thr Leu
195 200 205
Gly Ile Leu Val Pro Thr Leu Ala Val Gly Met Gly Ala Cys Val Ile
210 215 220
Glu Lys His Phe Thr Met Asp Lys Ser Leu Pro Gly Pro Asp His Leu
225 230 235 240
Ala Ser Met Asp Pro Glu Glu Met Lys Asn Leu Val Gln Ser Ile Arg
245 250 255
Asp Ala Glu Thr Val Leu Gly Ser Gly Glu Lys Lys Pro Ser Asp Asn
260 265 270
Glu Leu Pro Ile Arg Ala Leu Val Arg Arg Ser Ile Thr Leu Arg Arg
275 280 285
Asp Leu Val Lys Gly Ala Gln Ile Ser Lys Glu Asp Leu Ile Leu Leu
290 295 300
Arg Pro Gly Thr Gly Ile Ala Pro Ser Glu Ile Ser Asn Ile Val Gly
305 310 315 320
Ser Arg Leu Ser Met Asn Leu Ser Ala Gly Thr Asn Phe Val Met Gly
325 330 335
Thr Tyr
<210> 70
<211> 337
<212> PRT
<213> Methanocaldococcus jannaschii
<400> 70
Met Glu Lys Ile Lys Ile Gly Asp Arg Tyr Val Gly Lys Gly Glu Pro
1 5 10 15
Thr Phe Ile Ile Ala Glu Gly Gly Leu Asn His Asn Gly Asp Ile Asp
20 25 30
Ile Gly Lys Glu Leu Val Lys Glu Ala Lys Lys Cys Gly Ala Asp Ala
35 40 45
Ile Lys Phe Gln Ser Tyr His Thr Glu Asp Phe Ile Ser Lys Lys Ser
50 55 60
Glu Tyr Tyr Glu Leu Phe Lys Ser Leu Glu Leu Ser Glu Glu Glu Phe
65 70 75 80
Tyr Glu Leu Lys Glu Tyr Ala Glu Lys Ile Gly Ile Met Phe Ile Ser
85 90 95
Thr Pro Leu Asp Leu Lys Tyr Val Asp Ile Leu Asn Lys Met Asn Val
100 105 110
Pro Ala Phe Lys Ile Ala Ser Gly Asp Leu Thr Phe Tyr Pro Leu Leu
115 120 125
Glu Lys Val Ala Lys Thr Gly Lys Pro Val Ile Leu Ser Thr Gly Met
130 135 140
Ser Asp Ile Gly Glu Ile Trp Glu Ala Val Lys Val Leu Glu Asn Asn
145 150 155 160
Gly Cys Arg Asp Ile Ile Leu Leu His Cys Ile Ser Ser Tyr Pro Thr
165 170 175
Pro Tyr Glu Asp Val Asn Leu Asn Ala Ile Lys Thr Leu Lys Ser Ile
180 185 190
Phe Asn Ile Pro Val Gly Tyr Ser Asp His Thr Leu Gly Ile Leu Ala
195 200 205
Pro Val Val Ser Val Ala Leu Gly Ala Asp Val Ile Glu Lys His Phe
210 215 220
Thr Leu Asp Lys Asn Met Glu Gly Pro Asp His Ala Leu Ser Ala Asp
225 230 235 240
Pro Glu Glu Phe Lys Glu Met Val Asn Asn Ile Arg Leu Val Glu Lys
245 250 255
Met Leu Gly Ser Gly Glu Lys Ile Pro Met Pro Ser Glu Arg Asp Val
260 265 270
Ile Val Glu Ala Arg Arg Ser Ile Val Ala Lys Arg Asn Ile Lys Lys
275 280 285
Gly Glu Tyr Leu Ser Val Asp Asn Ile Ser Phe Lys Arg Pro Gly Arg
290 295 300
Gly Ile Glu Thr Lys Tyr Leu Ser Ile Ile Leu Asn Arg Lys Ile Lys
305 310 315 320
Asn Asp Lys Glu Glu Asp Asp Ile Ile Tyr Trp Asp Asp Leu Leu Gly
325 330 335
Asp
<210> 71
<211> 350
<212> PRT
<213> 粘放线菌
<400> 71
Met Thr Glu Gln Tyr Ile Thr Ile Asp Gly Arg Lys Ile Gly Pro Asn
1 5 10 15
Phe Ser Pro Tyr Ile Ile Ala Glu Leu Ser Ala Asn His Asn Gly Asp
20 25 30
Ile Asn Arg Ala Phe Ala Ile Met Glu Ala Ala Lys Lys Ala Gly Ala
35 40 45
Asp Ala Ile Lys Leu Gln Thr Tyr Thr Gln Asp Thr Ile Thr Met Asp
50 55 60
Cys Asp Ser Asp Glu Phe Gln Ile Lys Gly Gly Leu Trp His Gly Gln
65 70 75 80
Ser Leu Tyr Gln Leu Tyr Thr Ser Ala His Met Pro Trp Glu Trp His
85 90 95
Gln Pro Leu Phe Ala Lys Ala Lys Glu Leu Asp Ile Thr Ile Phe Ser
100 105 110
Ser Pro Phe Asp Phe Thr Ala Val Asp Leu Leu Glu Glu Leu Asp Ala
115 120 125
Pro Ala Tyr Lys Ile Ala Ser Phe Glu Ile Val Asp Leu Pro Leu Ile
130 135 140
Lys Arg Val Ala Gln Thr Gly Lys Pro Met Ile Ile Ser Thr Gly Met
145 150 155 160
Ala Asp Gln Ser Glu Ile Glu Ile Ala Ile Gln Thr Ala Lys Asp Asn
165 170 175
Gly Cys Asp Glu Leu Val Val Leu His Cys Val Ser Gly Tyr Pro Ala
180 185 190
Pro Ala Ala Gln Tyr Asn Leu Arg Thr Ile Ala Asp Ile Gly Gln Arg
195 200 205
Phe Asp Val Leu Ala Gly Leu Ser Asp His Thr Ile Asp Asn Ala Thr
210 215 220
Ala Val Val Ser Val Ala Phe Gly Ala Cys Val Ile Glu Lys His Val
225 230 235 240
Thr Leu Asp Arg Asn Ala Gly Gly Ala Asp Asp Ser Phe Ser Leu Glu
245 250 255
Pro Asp Glu Leu Ala Arg Leu Cys Arg Asp Thr Tyr Thr Ala Trp Gln
260 265 270
Ala Met Gly Asn Val Asn Tyr Glu Arg Thr Pro Ala Glu Gln Gly Asn
275 280 285
Val Lys Phe Arg Arg Ser Leu Tyr Ala Val Lys Asp Ile Ala Ala Gly
290 295 300
Glu Leu Leu Thr Ala Asp Asn Val Arg Ser Ile Arg Pro Gly Phe Gly
305 310 315 320
Leu Glu Pro Lys Tyr Tyr Asp Gln Val Leu Gly Lys Lys Ala Asn Val
325 330 335
Ile Ile Ser Lys Gly Thr Ala Leu Ser Phe Gly Leu Ile Ser
340 345 350
<210> 72
<211> 587
<212> PRT
<213> 乳酸克鲁维酵母
<400> 72
Met Ala Asp His Ser Ser Ser Ser Ser Ser Leu Gln Lys Lys Pro Ile
1 5 10 15
Asn Thr Ile Glu His Lys Asp Thr Leu Gly Asn Asp Arg Asp His Lys
20 25 30
Glu Ala Leu Asn Ser Asp Asn Asp Asn Thr Ser Gly Leu Lys Ile Asn
35 40 45
Gly Val Pro Ile Glu Asp Ala Arg Glu Glu Val Leu Leu Pro Gly Tyr
50 55 60
Leu Ser Lys Gln Tyr Tyr Lys Leu Tyr Gly Leu Cys Phe Ile Thr Tyr
65 70 75 80
Leu Cys Ala Thr Met Gln Gly Tyr Asp Gly Ala Leu Met Gly Ser Ile
85 90 95
Tyr Thr Glu Asp Ala Tyr Leu Lys Tyr Tyr His Leu Asp Ile Asn Ser
100 105 110
Ser Ser Gly Thr Gly Leu Val Phe Ser Ile Phe Asn Val Gly Gln Ile
115 120 125
Cys Gly Ala Phe Phe Val Pro Leu Met Asp Trp Lys Gly Arg Lys Pro
130 135 140
Ala Ile Leu Ile Gly Cys Leu Gly Val Val Ile Gly Ala Ile Ile Ser
145 150 155 160
Ser Leu Thr Thr Thr Lys Ser Ala Leu Ile Gly Gly Arg Trp Phe Val
165 170 175
Ala Phe Phe Ala Thr Ile Ala Asn Ala Ala Ala Pro Thr Tyr Cys Ala
180 185 190
Glu Val Ala Pro Ala His Leu Arg Gly Lys Val Ala Gly Leu Tyr Asn
195 200 205
Thr Leu Trp Ser Val Gly Ser Ile Val Ala Ala Phe Ser Thr Tyr Gly
210 215 220
Thr Asn Lys Asn Phe Pro Asn Ser Ser Lys Ala Phe Lys Ile Pro Leu
225 230 235 240
Tyr Leu Gln Met Met Phe Pro Gly Leu Val Cys Ile Phe Gly Trp Leu
245 250 255
Ile Pro Glu Ser Pro Arg Trp Leu Val Gly Val Gly Arg Glu Glu Glu
260 265 270
Ala Arg Glu Phe Ile Ile Lys Tyr His Leu Asn Gly Asp Arg Thr His
275 280 285
Pro Leu Leu Asp Met Glu Met Ala Glu Ile Ile Glu Ser Phe His Gly
290 295 300
Thr Asp Leu Ser Asn Pro Leu Glu Met Leu Asp Val Arg Ser Leu Phe
305 310 315 320
Arg Thr Arg Ser Asp Arg Tyr Arg Ala Met Leu Val Ile Leu Met Ala
325 330 335
Trp Phe Gly Gln Phe Ser Gly Asn Asn Val Cys Ser Tyr Tyr Leu Pro
340 345 350
Thr Met Leu Arg Asn Val Gly Met Lys Ser Val Ser Leu Asn Val Leu
355 360 365
Met Asn Gly Val Tyr Ser Ile Val Thr Trp Ile Ser Ser Ile Cys Gly
370 375 380
Ala Phe Phe Ile Asp Lys Ile Gly Arg Arg Glu Gly Phe Leu Gly Ser
385 390 395 400
Ile Ser Gly Ala Ala Leu Ala Leu Thr Gly Leu Ser Ile Cys Thr Ala
405 410 415
Arg Tyr Glu Lys Thr Lys Lys Lys Ser Ala Ser Asn Gly Ala Leu Val
420 425 430
Phe Ile Tyr Leu Phe Gly Gly Ile Phe Ser Phe Ala Phe Thr Pro Met
435 440 445
Gln Ser Met Tyr Ser Thr Glu Val Ser Thr Asn Leu Thr Arg Ser Lys
450 455 460
Ala Gln Leu Leu Asn Phe Val Val Ser Gly Val Ala Gln Phe Val Asn
465 470 475 480
Gln Phe Ala Thr Pro Lys Ala Met Lys Asn Ile Lys Tyr Trp Phe Tyr
485 490 495
Val Phe Tyr Val Phe Phe Asp Ile Phe Glu Phe Ile Val Ile Tyr Phe
500 505 510
Phe Phe Val Glu Thr Lys Gly Arg Ser Leu Glu Glu Leu Glu Val Val
515 520 525
Phe Glu Ala Pro Asn Pro Arg Lys Ala Ser Val Asp Gln Ala Phe Leu
530 535 540
Ala Gln Val Arg Ala Thr Leu Val Gln Arg Asn Asp Val Arg Val Ala
545 550 555 560
Asn Ala Gln Asn Leu Lys Glu Gln Glu Pro Leu Lys Ser Asp Ala Asp
565 570 575
His Val Glu Lys Leu Ser Glu Ala Glu Ser Val
580 585
<210> 73
<211> 792
<212> PRT
<213> 大肠杆菌K-12 MG1655
<400> 73
Met Ser Asn Asn Gly Ser Ser Pro Leu Val Leu Trp Tyr Asn Gln Leu
1 5 10 15
Gly Met Asn Asp Val Asp Arg Val Gly Gly Lys Asn Ala Ser Leu Gly
20 25 30
Glu Met Ile Thr Asn Leu Ser Gly Met Gly Val Ser Val Pro Asn Gly
35 40 45
Phe Ala Thr Thr Ala Asp Ala Phe Asn Gln Phe Leu Asp Gln Ser Gly
50 55 60
Val Asn Gln Arg Ile Tyr Glu Leu Leu Asp Lys Thr Asp Ile Asp Asp
65 70 75 80
Val Thr Gln Leu Ala Lys Ala Gly Ala Gln Ile Arg Gln Trp Ile Ile
85 90 95
Asp Thr Pro Phe Gln Pro Glu Leu Glu Asn Ala Ile Arg Glu Ala Tyr
100 105 110
Ala Gln Leu Ser Ala Asp Asp Glu Asn Ala Ser Phe Ala Val Arg Ser
115 120 125
Ser Ala Thr Ala Glu Asp Met Pro Asp Ala Ser Phe Ala Gly Gln Gln
130 135 140
Glu Thr Phe Leu Asn Val Gln Gly Phe Asp Ala Val Leu Val Ala Val
145 150 155 160
Lys His Val Phe Ala Ser Leu Phe Asn Asp Arg Ala Ile Ser Tyr Arg
165 170 175
Val His Gln Gly Tyr Asp His Arg Gly Val Ala Leu Ser Ala Gly Val
180 185 190
Gln Arg Met Val Arg Ser Asp Leu Ala Ser Ser Gly Val Met Phe Ser
195 200 205
Ile Asp Thr Glu Ser Gly Phe Asp Gln Val Val Phe Ile Thr Ser Ala
210 215 220
Trp Gly Leu Gly Glu Met Val Val Gln Gly Ala Val Asn Pro Asp Glu
225 230 235 240
Phe Tyr Val His Lys Pro Thr Leu Ala Ala Asn Arg Pro Ala Ile Val
245 250 255
Arg Arg Thr Met Gly Ser Lys Lys Ile Arg Met Val Tyr Ala Pro Thr
260 265 270
Gln Glu His Gly Lys Gln Val Lys Ile Glu Asp Val Pro Gln Glu Gln
275 280 285
Arg Asp Ile Phe Ser Leu Thr Asn Glu Glu Val Gln Glu Leu Ala Lys
290 295 300
Gln Ala Val Gln Ile Glu Lys His Tyr Gly Arg Pro Met Asp Ile Glu
305 310 315 320
Trp Ala Lys Asp Gly His Thr Gly Lys Leu Phe Ile Val Gln Ala Arg
325 330 335
Pro Glu Thr Val Arg Ser Arg Gly Gln Val Met Glu Arg Tyr Thr Leu
340 345 350
His Ser Gln Gly Lys Ile Ile Ala Glu Gly Arg Ala Ile Gly His Arg
355 360 365
Ile Gly Ala Gly Pro Val Lys Val Ile His Asp Ile Ser Glu Met Asn
370 375 380
Arg Ile Glu Pro Gly Asp Val Leu Val Thr Asp Met Thr Asp Pro Asp
385 390 395 400
Trp Glu Pro Ile Met Lys Lys Ala Ser Ala Ile Val Thr Asn Arg Gly
405 410 415
Gly Arg Thr Cys His Ala Ala Ile Ile Ala Arg Glu Leu Gly Ile Pro
420 425 430
Ala Val Val Gly Cys Gly Asp Ala Thr Glu Arg Met Lys Asp Gly Glu
435 440 445
Asn Val Thr Val Ser Cys Ala Glu Gly Asp Thr Gly Tyr Val Tyr Ala
450 455 460
Glu Leu Leu Glu Phe Ser Val Lys Ser Ser Ser Val Glu Thr Met Pro
465 470 475 480
Asp Leu Pro Leu Lys Val Met Met Asn Val Gly Asn Pro Asp Arg Ala
485 490 495
Phe Asp Phe Ala Cys Leu Pro Asn Glu Gly Val Gly Leu Ala Arg Leu
500 505 510
Glu Phe Ile Ile Asn Arg Met Ile Gly Val His Pro Arg Ala Leu Leu
515 520 525
Glu Phe Asp Asp Gln Glu Pro Gln Leu Gln Asn Glu Ile Arg Glu Met
530 535 540
Met Lys Gly Phe Asp Ser Pro Arg Glu Phe Tyr Val Gly Arg Leu Thr
545 550 555 560
Glu Gly Ile Ala Thr Leu Gly Ala Ala Phe Tyr Pro Lys Arg Val Ile
565 570 575
Val Arg Leu Ser Asp Phe Lys Ser Asn Glu Tyr Ala Asn Leu Val Gly
580 585 590
Gly Glu Arg Tyr Glu Pro Asp Glu Glu Asn Pro Met Leu Gly Phe Arg
595 600 605
Gly Ala Gly Arg Tyr Val Ser Asp Ser Phe Arg Asp Cys Phe Ala Leu
610 615 620
Glu Cys Glu Ala Val Lys Arg Val Arg Asn Asp Met Gly Leu Thr Asn
625 630 635 640
Val Glu Ile Met Ile Pro Phe Val Arg Thr Val Asp Gln Ala Lys Ala
645 650 655
Val Val Glu Glu Leu Ala Arg Gln Gly Leu Lys Arg Gly Glu Asn Gly
660 665 670
Leu Lys Ile Ile Met Met Cys Glu Ile Pro Ser Asn Ala Leu Leu Ala
675 680 685
Glu Gln Phe Leu Glu Tyr Phe Asp Gly Phe Ser Ile Gly Ser Asn Asp
690 695 700
Met Thr Gln Leu Ala Leu Gly Leu Asp Arg Asp Ser Gly Val Val Ser
705 710 715 720
Glu Leu Phe Asp Glu Arg Asn Asp Ala Val Lys Ala Leu Leu Ser Met
725 730 735
Ala Ile Arg Ala Ala Lys Lys Gln Gly Lys Tyr Val Gly Ile Cys Gly
740 745 750
Gln Gly Pro Ser Asp His Glu Asp Phe Ala Ala Trp Leu Met Glu Glu
755 760 765
Gly Ile Asp Ser Leu Ser Leu Asn Pro Asp Thr Val Val Gln Thr Trp
770 775 780
Leu Ser Leu Ala Glu Leu Lys Lys
785 790
<210> 74
<211> 610
<212> PRT
<213> 谷氨酸棒杆菌
<400> 74
Met Thr Thr Ala Ala Ile Arg Gly Leu Gln Gly Glu Ala Pro Thr Lys
1 5 10 15
Asn Lys Glu Leu Leu Asn Trp Ile Ala Asp Ala Val Glu Leu Phe Gln
20 25 30
Pro Glu Ala Val Val Phe Val Asp Gly Ser Gln Ala Glu Trp Asp Arg
35 40 45
Met Ala Glu Asp Leu Val Glu Ala Gly Thr Leu Ile Lys Leu Asn Glu
50 55 60
Glu Lys Arg Pro Asn Ser Tyr Leu Ala Arg Ser Asn Pro Ser Asp Val
65 70 75 80
Ala Arg Val Glu Ser Arg Thr Phe Ile Cys Ser Glu Lys Glu Glu Asp
85 90 95
Ala Gly Pro Thr Asn Asn Trp Ala Pro Pro Gln Ala Met Lys Asp Glu
100 105 110
Met Ser Lys His Tyr Ala Gly Ser Met Lys Gly Arg Thr Met Tyr Val
115 120 125
Val Pro Phe Cys Met Gly Pro Ile Ser Asp Pro Asp Pro Lys Leu Gly
130 135 140
Val Gln Leu Thr Asp Ser Glu Tyr Val Val Met Ser Met Arg Ile Met
145 150 155 160
Thr Arg Met Gly Ile Glu Ala Leu Asp Lys Ile Gly Ala Asn Gly Ser
165 170 175
Phe Val Lys Cys Leu His Ser Val Gly Ala Pro Leu Glu Pro Gly Gln
180 185 190
Glu Asp Val Ala Trp Pro Cys Asn Asp Thr Lys Tyr Ile Thr Gln Phe
195 200 205
Pro Glu Thr Lys Glu Ile Trp Ser Tyr Gly Ser Gly Tyr Gly Gly Asn
210 215 220
Ala Ile Leu Ala Lys Lys Cys Tyr Ala Leu Arg Ile Ala Ser Val Met
225 230 235 240
Ala Arg Glu Glu Gly Trp Met Ala Glu His Met Leu Ile Leu Lys Leu
245 250 255
Ile Asn Pro Glu Gly Lys Ala Tyr His Ile Ala Ala Ala Phe Pro Ser
260 265 270
Ala Cys Gly Lys Thr Asn Leu Ala Met Ile Thr Pro Thr Ile Pro Gly
275 280 285
Trp Thr Ala Gln Val Val Gly Asp Asp Ile Ala Trp Leu Lys Leu Arg
290 295 300
Glu Asp Gly Leu Tyr Ala Val Asn Pro Glu Asn Gly Phe Phe Gly Val
305 310 315 320
Ala Pro Gly Thr Asn Tyr Ala Ser Asn Pro Ile Ala Met Lys Thr Met
325 330 335
Glu Pro Gly Asn Thr Leu Phe Thr Asn Val Ala Leu Thr Asp Asp Gly
340 345 350
Asp Ile Trp Trp Glu Gly Met Asp Gly Asp Ala Pro Ala His Leu Ile
355 360 365
Asp Trp Lys Gly Asn Asp Trp Thr Pro Glu Ser Asp Glu Asn Ala Ala
370 375 380
His Pro Asn Ser Arg Tyr Cys Val Ala Ile Asp Gln Ser Pro Ala Ala
385 390 395 400
Ala Pro Glu Phe Asn Asp Trp Glu Gly Val Lys Ile Asp Ala Ile Leu
405 410 415
Phe Gly Gly Arg Arg Ala Asp Thr Val Pro Leu Val Thr Gln Thr Tyr
420 425 430
Asp Trp Glu His Gly Thr Met Val Gly Ala Leu Leu Ala Ser Gly Gln
435 440 445
Thr Ala Ala Ser Ala Glu Ala Lys Val Gly Thr Leu Arg His Asp Pro
450 455 460
Met Ala Met Leu Pro Phe Ile Gly Tyr Asn Ala Gly Glu Tyr Leu Gln
465 470 475 480
Asn Trp Ile Asp Met Gly Asn Lys Gly Gly Asp Lys Met Pro Ser Ile
485 490 495
Phe Leu Val Asn Trp Phe Arg Arg Gly Glu Asp Gly Arg Phe Leu Trp
500 505 510
Pro Gly Phe Gly Asp Asn Ser Arg Val Leu Lys Trp Val Ile Asp Arg
515 520 525
Ile Glu Gly Arg Val Gly Ala Asp Glu Thr Val Val Gly His Thr Ala
530 535 540
Lys Ala Glu Asp Leu Asp Leu Asp Gly Leu Asp Thr Pro Ile Glu Asp
545 550 555 560
Val Lys Glu Ala Leu Thr Ala Pro Ala Glu Gln Trp Ala Asn Asp Val
565 570 575
Gln Asp Asn Ala Glu Tyr Leu Thr Phe Leu Gly Pro Arg Val Pro Ala
580 585 590
Glu Val His Ser Gln Phe Asp Ala Leu Lys Ala Arg Ile Ser Ala Ala
595 600 605
His Ala
610
<210> 75
<211> 540
<212> PRT
<213> 大肠杆菌K-12 MG1655
<400> 75
Met Arg Val Asn Asn Gly Leu Thr Pro Gln Glu Leu Glu Ala Tyr Gly
1 5 10 15
Ile Ser Asp Val His Asp Ile Val Tyr Asn Pro Ser Tyr Asp Leu Leu
20 25 30
Tyr Gln Glu Glu Leu Asp Pro Ser Leu Thr Gly Tyr Glu Arg Gly Val
35 40 45
Leu Thr Asn Leu Gly Ala Val Ala Val Asp Thr Gly Ile Phe Thr Gly
50 55 60
Arg Ser Pro Lys Asp Lys Tyr Ile Val Arg Asp Asp Thr Thr Arg Asp
65 70 75 80
Thr Phe Trp Trp Ala Asp Lys Gly Lys Gly Lys Asn Asp Asn Lys Pro
85 90 95
Leu Ser Pro Glu Thr Trp Gln His Leu Lys Gly Leu Val Thr Arg Gln
100 105 110
Leu Ser Gly Lys Arg Leu Phe Val Val Asp Ala Phe Cys Gly Ala Asn
115 120 125
Pro Asp Thr Arg Leu Ser Val Arg Phe Ile Thr Glu Val Ala Trp Gln
130 135 140
Ala His Phe Val Lys Asn Met Phe Ile Arg Pro Ser Asp Glu Glu Leu
145 150 155 160
Ala Gly Phe Lys Pro Asp Phe Ile Val Met Asn Gly Ala Lys Cys Thr
165 170 175
Asn Pro Gln Trp Lys Glu Gln Gly Leu Asn Ser Glu Asn Phe Val Ala
180 185 190
Phe Asn Leu Thr Glu Arg Met Gln Leu Ile Gly Gly Thr Trp Tyr Gly
195 200 205
Gly Glu Met Lys Lys Gly Met Phe Ser Met Met Asn Tyr Leu Leu Pro
210 215 220
Leu Lys Gly Ile Ala Ser Met His Cys Ser Ala Asn Val Gly Glu Lys
225 230 235 240
Gly Asp Val Ala Val Phe Phe Gly Leu Ser Gly Thr Gly Lys Thr Thr
245 250 255
Leu Ser Thr Asp Pro Lys Arg Arg Leu Ile Gly Asp Asp Glu His Gly
260 265 270
Trp Asp Asp Asp Gly Val Phe Asn Phe Glu Gly Gly Cys Tyr Ala Lys
275 280 285
Thr Ile Lys Leu Ser Lys Glu Ala Glu Pro Glu Ile Tyr Asn Ala Ile
290 295 300
Arg Arg Asp Ala Leu Leu Glu Asn Val Thr Val Arg Glu Asp Gly Thr
305 310 315 320
Ile Asp Phe Asp Asp Gly Ser Lys Thr Glu Asn Thr Arg Val Ser Tyr
325 330 335
Pro Ile Tyr His Ile Asp Asn Ile Val Lys Pro Val Ser Lys Ala Gly
340 345 350
His Ala Thr Lys Val Ile Phe Leu Thr Ala Asp Ala Phe Gly Val Leu
355 360 365
Pro Pro Val Ser Arg Leu Thr Ala Asp Gln Thr Gln Tyr His Phe Leu
370 375 380
Ser Gly Phe Thr Ala Lys Leu Ala Gly Thr Glu Arg Gly Ile Thr Glu
385 390 395 400
Pro Thr Pro Thr Phe Ser Ala Cys Phe Gly Ala Ala Phe Leu Ser Leu
405 410 415
His Pro Thr Gln Tyr Ala Glu Val Leu Val Lys Arg Met Gln Ala Ala
420 425 430
Gly Ala Gln Ala Tyr Leu Val Asn Thr Gly Trp Asn Gly Thr Gly Lys
435 440 445
Arg Ile Ser Ile Lys Asp Thr Arg Ala Ile Ile Asp Ala Ile Leu Asn
450 455 460
Gly Ser Leu Asp Asn Ala Glu Thr Phe Thr Leu Pro Met Phe Asn Leu
465 470 475 480
Ala Ile Pro Thr Glu Leu Pro Gly Val Asp Thr Lys Ile Leu Asp Pro
485 490 495
Arg Asn Thr Tyr Ala Ser Pro Glu Gln Trp Gln Glu Lys Ala Glu Thr
500 505 510
Leu Ala Lys Leu Phe Ile Asp Asn Phe Asp Lys Tyr Thr Asp Thr Pro
515 520 525
Ala Gly Ala Ala Leu Val Ala Ala Gly Pro Lys Leu
530 535 540
<210> 76
<211> 213
<212> PRT
<213> 大肠杆菌K-12 MG1655
<400> 76
Met Lys Asn Trp Lys Thr Ser Ala Glu Ser Ile Leu Thr Thr Gly Pro
1 5 10 15
Val Val Pro Val Ile Val Val Lys Lys Leu Glu His Ala Val Pro Met
20 25 30
Ala Lys Ala Leu Val Ala Gly Gly Val Arg Val Leu Glu Val Thr Leu
35 40 45
Arg Thr Glu Cys Ala Val Asp Ala Ile Arg Ala Ile Ala Lys Glu Val
50 55 60
Pro Glu Ala Ile Val Gly Ala Gly Thr Val Leu Asn Pro Gln Gln Leu
65 70 75 80
Ala Glu Val Thr Glu Ala Gly Ala Gln Phe Ala Ile Ser Pro Gly Leu
85 90 95
Thr Glu Pro Leu Leu Lys Ala Ala Thr Glu Gly Thr Ile Pro Leu Ile
100 105 110
Pro Gly Ile Ser Thr Val Ser Glu Leu Met Leu Gly Met Asp Tyr Gly
115 120 125
Leu Lys Glu Phe Lys Phe Phe Pro Ala Glu Ala Asn Gly Gly Val Lys
130 135 140
Ala Leu Gln Ala Ile Ala Gly Pro Phe Ser Gln Val Arg Phe Cys Pro
145 150 155 160
Thr Gly Gly Ile Ser Pro Ala Asn Tyr Arg Asp Tyr Leu Ala Leu Lys
165 170 175
Ser Val Leu Cys Ile Gly Gly Ser Trp Leu Val Pro Ala Asp Ala Leu
180 185 190
Glu Ala Gly Asp Tyr Asp Arg Ile Thr Lys Leu Ala Arg Glu Ala Val
195 200 205
Glu Gly Ala Lys Leu
210
<210> 77
<211> 565
<212> PRT
<213> 大肠杆菌K-12 MG1655
<400> 77
Met Glu Pro Lys Thr Lys Lys Gln Arg Ser Leu Tyr Ile Pro Tyr Ala
1 5 10 15
Gly Pro Val Leu Leu Glu Phe Pro Leu Leu Asn Lys Gly Ser Ala Phe
20 25 30
Ser Met Glu Glu Arg Arg Asn Phe Asn Leu Leu Gly Leu Leu Pro Glu
35 40 45
Val Val Glu Thr Ile Glu Glu Gln Ala Glu Arg Ala Trp Ile Gln Tyr
50 55 60
Gln Gly Phe Lys Thr Glu Ile Asp Lys His Ile Tyr Leu Arg Asn Ile
65 70 75 80
Gln Asp Thr Asn Glu Thr Leu Phe Tyr Arg Leu Val Asn Asn His Leu
85 90 95
Asp Glu Met Met Pro Val Ile Tyr Thr Pro Thr Val Gly Ala Ala Cys
100 105 110
Glu Arg Phe Ser Glu Ile Tyr Arg Arg Ser Arg Gly Val Phe Ile Ser
115 120 125
Tyr Gln Asn Arg His Asn Met Asp Asp Ile Leu Gln Asn Val Pro Asn
130 135 140
His Asn Ile Lys Val Ile Val Val Thr Asp Gly Glu Arg Ile Leu Gly
145 150 155 160
Leu Gly Asp Gln Gly Ile Gly Gly Met Gly Ile Pro Ile Gly Lys Leu
165 170 175
Ser Leu Tyr Thr Ala Cys Gly Gly Ile Ser Pro Ala Tyr Thr Leu Pro
180 185 190
Val Val Leu Asp Val Gly Thr Asn Asn Gln Gln Leu Leu Asn Asp Pro
195 200 205
Leu Tyr Met Gly Trp Arg Asn Pro Arg Ile Thr Asp Asp Glu Tyr Tyr
210 215 220
Glu Phe Val Asp Glu Phe Ile Gln Ala Val Lys Gln Arg Trp Pro Asp
225 230 235 240
Val Leu Leu Gln Phe Glu Asp Phe Ala Gln Lys Asn Ala Met Pro Leu
245 250 255
Leu Asn Arg Tyr Arg Asn Glu Ile Cys Ser Phe Asn Asp Asp Ile Gln
260 265 270
Gly Thr Ala Ala Val Thr Val Gly Thr Leu Ile Ala Ala Ser Arg Ala
275 280 285
Ala Gly Gly Gln Leu Ser Glu Lys Lys Ile Val Phe Leu Gly Ala Gly
290 295 300
Ser Ala Gly Cys Gly Ile Ala Glu Met Ile Ile Ser Gln Thr Gln Arg
305 310 315 320
Glu Gly Leu Ser Glu Glu Ala Ala Arg Gln Lys Val Phe Met Val Asp
325 330 335
Arg Phe Gly Leu Leu Thr Asp Lys Met Pro Asn Leu Leu Pro Phe Gln
340 345 350
Thr Lys Leu Val Gln Lys Arg Glu Asn Leu Ser Asp Trp Asp Thr Asp
355 360 365
Ser Asp Val Leu Ser Leu Leu Asp Val Val Arg Asn Val Lys Pro Asp
370 375 380
Ile Leu Ile Gly Val Ser Gly Gln Thr Gly Leu Phe Thr Glu Glu Ile
385 390 395 400
Ile Arg Glu Met His Lys His Cys Pro Arg Pro Ile Val Met Pro Leu
405 410 415
Ser Asn Pro Thr Ser Arg Val Glu Ala Thr Pro Gln Asp Ile Ile Ala
420 425 430
Trp Thr Glu Gly Asn Ala Leu Val Ala Thr Gly Ser Pro Phe Asn Pro
435 440 445
Val Val Trp Lys Asp Lys Ile Tyr Pro Ile Ala Gln Cys Asn Asn Ala
450 455 460
Phe Ile Phe Pro Gly Ile Gly Leu Gly Val Ile Ala Ser Gly Ala Ser
465 470 475 480
Arg Ile Thr Asp Glu Met Leu Met Ser Ala Ser Glu Thr Leu Ala Gln
485 490 495
Tyr Ser Pro Leu Val Leu Asn Gly Glu Gly Met Val Leu Pro Glu Leu
500 505 510
Lys Asp Ile Gln Lys Val Ser Arg Ala Ile Ala Phe Ala Val Gly Lys
515 520 525
Met Ala Gln Gln Gln Gly Val Ala Val Lys Thr Ser Ala Glu Ala Leu
530 535 540
Gln Gln Ala Ile Asp Asp Asn Phe Trp Gln Ala Glu Tyr Arg Asp Tyr
545 550 555 560
Arg Arg Thr Ser Ile
565
<210> 78
<211> 759
<212> PRT
<213> 大肠杆菌K-12 MG1655
<400> 78
Met Asp Asp Gln Leu Lys Gln Ser Ala Leu Asp Phe His Glu Phe Pro
1 5 10 15
Val Pro Gly Lys Ile Gln Val Ser Pro Thr Lys Pro Leu Ala Thr Gln
20 25 30
Arg Asp Leu Ala Leu Ala Tyr Ser Pro Gly Val Ala Ala Pro Cys Leu
35 40 45
Glu Ile Glu Lys Asp Pro Leu Lys Ala Tyr Lys Tyr Thr Ala Arg Gly
50 55 60
Asn Leu Val Ala Val Ile Ser Asn Gly Thr Ala Val Leu Gly Leu Gly
65 70 75 80
Asn Ile Gly Ala Leu Ala Gly Lys Pro Val Met Glu Gly Lys Gly Val
85 90 95
Leu Phe Lys Lys Phe Ala Gly Ile Asp Val Phe Asp Ile Glu Val Asp
100 105 110
Glu Leu Asp Pro Asp Lys Phe Ile Glu Val Val Ala Ala Leu Glu Pro
115 120 125
Thr Phe Gly Gly Ile Asn Leu Glu Asp Ile Lys Ala Pro Glu Cys Phe
130 135 140
Tyr Ile Glu Gln Lys Leu Arg Glu Arg Met Asn Ile Pro Val Phe His
145 150 155 160
Asp Asp Gln His Gly Thr Ala Ile Ile Ser Thr Ala Ala Ile Leu Asn
165 170 175
Gly Leu Arg Val Val Glu Lys Asn Ile Ser Asp Val Arg Met Val Val
180 185 190
Ser Gly Ala Gly Ala Ala Ala Ile Ala Cys Met Asn Leu Leu Val Ala
195 200 205
Leu Gly Leu Gln Lys His Asn Ile Val Val Cys Asp Ser Lys Gly Val
210 215 220
Ile Tyr Gln Gly Arg Glu Pro Asn Met Ala Glu Thr Lys Ala Ala Tyr
225 230 235 240
Ala Val Val Asp Asp Gly Lys Arg Thr Leu Asp Asp Val Ile Glu Gly
245 250 255
Ala Asp Ile Phe Leu Gly Cys Ser Gly Pro Lys Val Leu Thr Gln Glu
260 265 270
Met Val Lys Lys Met Ala Arg Ala Pro Met Ile Leu Ala Leu Ala Asn
275 280 285
Pro Glu Pro Glu Ile Leu Pro Pro Leu Ala Lys Glu Val Arg Pro Asp
290 295 300
Ala Ile Ile Cys Thr Gly Arg Ser Asp Tyr Pro Asn Gln Val Asn Asn
305 310 315 320
Val Leu Cys Phe Pro Phe Ile Phe Arg Gly Ala Leu Asp Val Gly Ala
325 330 335
Thr Ala Ile Asn Glu Glu Met Lys Leu Ala Ala Val Arg Ala Ile Ala
340 345 350
Glu Leu Ala His Ala Glu Gln Ser Glu Val Val Ala Ser Ala Tyr Gly
355 360 365
Asp Gln Asp Leu Ser Phe Gly Pro Glu Tyr Ile Ile Pro Lys Pro Phe
370 375 380
Asp Pro Arg Leu Ile Val Lys Ile Ala Pro Ala Val Ala Lys Ala Ala
385 390 395 400
Met Glu Ser Gly Val Ala Thr Arg Pro Ile Ala Asp Phe Asp Val Tyr
405 410 415
Ile Asp Lys Leu Thr Glu Phe Val Tyr Lys Thr Asn Leu Phe Met Lys
420 425 430
Pro Ile Phe Ser Gln Ala Arg Lys Ala Pro Lys Arg Val Val Leu Pro
435 440 445
Glu Gly Glu Glu Ala Arg Val Leu His Ala Thr Gln Glu Leu Val Thr
450 455 460
Leu Gly Leu Ala Lys Pro Ile Leu Ile Gly Arg Pro Asn Val Ile Glu
465 470 475 480
Met Arg Ile Gln Lys Leu Gly Leu Gln Ile Lys Ala Gly Val Asp Phe
485 490 495
Glu Ile Val Asn Asn Glu Ser Asp Pro Arg Phe Lys Glu Tyr Trp Thr
500 505 510
Glu Tyr Phe Gln Ile Met Lys Arg Arg Gly Val Thr Gln Glu Gln Ala
515 520 525
Gln Arg Ala Leu Ile Ser Asn Pro Thr Val Ile Gly Ala Ile Met Val
530 535 540
Gln Arg Gly Glu Ala Asp Ala Met Ile Cys Gly Thr Val Gly Asp Tyr
545 550 555 560
His Glu His Phe Ser Val Val Lys Asn Val Phe Gly Tyr Arg Asp Gly
565 570 575
Val His Thr Ala Gly Ala Met Asn Ala Leu Leu Leu Pro Ser Gly Asn
580 585 590
Thr Phe Ile Ala Asp Thr Tyr Val Asn Asp Glu Pro Asp Ala Glu Glu
595 600 605
Leu Ala Glu Ile Thr Leu Met Ala Ala Glu Thr Val Arg Arg Phe Gly
610 615 620
Ile Glu Pro Arg Val Ala Leu Leu Ser His Ser Asn Phe Gly Ser Ser
625 630 635 640
Asp Cys Pro Ser Ser Ser Lys Met Arg Gln Ala Leu Glu Leu Val Arg
645 650 655
Glu Arg Ala Pro Glu Leu Met Ile Asp Gly Glu Met His Gly Asp Ala
660 665 670
Ala Leu Val Glu Ala Ile Arg Asn Asp Arg Met Pro Asp Ser Ser Leu
675 680 685
Lys Gly Ser Ala Asn Ile Leu Val Met Pro Asn Met Glu Ala Ala Arg
690 695 700
Ile Ser Tyr Asn Leu Leu Arg Val Ser Ser Ser Glu Gly Val Thr Val
705 710 715 720
Gly Pro Val Leu Met Gly Val Ala Lys Pro Val His Val Leu Thr Pro
725 730 735
Ile Ala Ser Val Arg Arg Ile Val Asn Met Val Ala Leu Ala Val Val
740 745 750
Glu Ala Gln Thr Gln Pro Leu
755
<210> 79
<211> 652
<212> PRT
<213> 大肠杆菌K-12 MG1655
<400> 79
Met Ser Gln Ile His Lys His Thr Ile Pro Ala Asn Ile Ala Asp Arg
1 5 10 15
Cys Leu Ile Asn Pro Gln Gln Tyr Glu Ala Met Tyr Gln Gln Ser Ile
20 25 30
Asn Val Pro Asp Thr Phe Trp Gly Glu Gln Gly Lys Ile Leu Asp Trp
35 40 45
Ile Lys Pro Tyr Gln Lys Val Lys Asn Thr Ser Phe Ala Pro Gly Asn
50 55 60
Val Ser Ile Lys Trp Tyr Glu Asp Gly Thr Leu Asn Leu Ala Ala Asn
65 70 75 80
Cys Leu Asp Arg His Leu Gln Glu Asn Gly Asp Arg Thr Ala Ile Ile
85 90 95
Trp Glu Gly Asp Asp Ala Ser Gln Ser Lys His Ile Ser Tyr Lys Glu
100 105 110
Leu His Arg Asp Val Cys Arg Phe Ala Asn Thr Leu Leu Glu Leu Gly
115 120 125
Ile Lys Lys Gly Asp Val Val Ala Ile Tyr Met Pro Met Val Pro Glu
130 135 140
Ala Ala Val Ala Met Leu Ala Cys Ala Arg Ile Gly Ala Val His Ser
145 150 155 160
Val Ile Phe Gly Gly Phe Ser Pro Glu Ala Val Ala Gly Arg Ile Ile
165 170 175
Asp Ser Asn Ser Arg Leu Val Ile Thr Ser Asp Glu Gly Val Arg Ala
180 185 190
Gly Arg Ser Ile Pro Leu Lys Lys Asn Val Asp Asp Ala Leu Lys Asn
195 200 205
Pro Asn Val Thr Ser Val Glu His Val Val Val Leu Lys Arg Thr Gly
210 215 220
Gly Lys Ile Asp Trp Gln Glu Gly Arg Asp Leu Trp Trp His Asp Leu
225 230 235 240
Val Glu Gln Ala Ser Asp Gln His Gln Ala Glu Glu Met Asn Ala Glu
245 250 255
Asp Pro Leu Phe Ile Leu Tyr Thr Ser Gly Ser Thr Gly Lys Pro Lys
260 265 270
Gly Val Leu His Thr Thr Gly Gly Tyr Leu Val Tyr Ala Ala Leu Thr
275 280 285
Phe Lys Tyr Val Phe Asp Tyr His Pro Gly Asp Ile Tyr Trp Cys Thr
290 295 300
Ala Asp Val Gly Trp Val Thr Gly His Ser Tyr Leu Leu Tyr Gly Pro
305 310 315 320
Leu Ala Cys Gly Ala Thr Thr Leu Met Phe Glu Gly Val Pro Asn Trp
325 330 335
Pro Thr Pro Ala Arg Met Ala Gln Val Val Asp Lys His Gln Val Asn
340 345 350
Ile Leu Tyr Thr Ala Pro Thr Ala Ile Arg Ala Leu Met Ala Glu Gly
355 360 365
Asp Lys Ala Ile Glu Gly Thr Asp Arg Ser Ser Leu Arg Ile Leu Gly
370 375 380
Ser Val Gly Glu Pro Ile Asn Pro Glu Ala Trp Glu Trp Tyr Trp Lys
385 390 395 400
Lys Ile Gly Asn Glu Lys Cys Pro Val Val Asp Thr Trp Trp Gln Thr
405 410 415
Glu Thr Gly Gly Phe Met Ile Thr Pro Leu Pro Gly Ala Thr Glu Leu
420 425 430
Lys Ala Gly Ser Ala Thr Arg Pro Phe Phe Gly Val Gln Pro Ala Leu
435 440 445
Val Asp Asn Glu Gly Asn Pro Leu Glu Gly Ala Thr Glu Gly Ser Leu
450 455 460
Val Ile Thr Asp Ser Trp Pro Gly Gln Ala Arg Thr Leu Phe Gly Asp
465 470 475 480
His Glu Arg Phe Glu Gln Thr Tyr Phe Ser Thr Phe Lys Asn Met Tyr
485 490 495
Phe Ser Gly Asp Gly Ala Arg Arg Asp Glu Asp Gly Tyr Tyr Trp Ile
500 505 510
Thr Gly Arg Val Asp Asp Val Leu Asn Val Ser Gly His Arg Leu Gly
515 520 525
Thr Ala Glu Ile Glu Ser Ala Leu Val Ala His Pro Lys Ile Ala Glu
530 535 540
Ala Ala Val Val Gly Ile Pro His Asn Ile Lys Gly Gln Ala Ile Tyr
545 550 555 560
Ala Tyr Val Thr Leu Asn His Gly Glu Glu Pro Ser Pro Glu Leu Tyr
565 570 575
Ala Glu Val Arg Asn Trp Val Arg Lys Glu Ile Gly Pro Leu Ala Thr
580 585 590
Pro Asp Val Leu His Trp Thr Asp Ser Leu Pro Lys Thr Arg Ser Gly
595 600 605
Lys Ile Met Arg Arg Ile Leu Arg Lys Ile Ala Ala Gly Asp Thr Ser
610 615 620
Asn Leu Gly Asp Thr Ser Thr Leu Ala Asp Pro Gly Val Val Glu Lys
625 630 635 640
Leu Leu Glu Glu Lys Gln Ala Ile Ala Met Pro Ser
645 650
<210> 80
<211> 268
<212> PRT
<213> 多杀巴斯德氏菌
<400> 80
Met Asp Lys Phe Ala Glu His Glu Ile Pro Lys Ala Val Ile Val Ala
1 5 10 15
Gly Asn Gly Glu Ser Leu Ser Gln Ile Asp Tyr Arg Leu Leu Pro Lys
20 25 30
Asn Tyr Asp Val Phe Arg Cys Asn Gln Phe Tyr Phe Glu Glu Arg Tyr
35 40 45
Phe Leu Gly Asn Lys Ile Lys Ala Val Phe Phe Thr Pro Gly Val Phe
50 55 60
Leu Glu Gln Tyr Tyr Thr Leu Tyr His Leu Lys Arg Asn Asn Glu Tyr
65 70 75 80
Phe Val Asp Asn Val Ile Leu Ser Ser Phe Asn His Pro Thr Val Asp
85 90 95
Leu Glu Lys Ser Gln Lys Ile Gln Ala Leu Phe Ile Asp Val Ile Asn
100 105 110
Gly Tyr Glu Lys Tyr Leu Ser Lys Leu Thr Ala Phe Asp Val Tyr Leu
115 120 125
Arg Tyr Lys Glu Leu Tyr Glu Asn Gln Arg Ile Thr Ser Gly Val Tyr
130 135 140
Met Cys Ala Val Ala Ile Ala Met Gly Tyr Thr Asp Ile Tyr Leu Thr
145 150 155 160
Gly Ile Asp Phe Tyr Gln Ala Ser Glu Glu Asn Tyr Ala Phe Asp Asn
165 170 175
Lys Lys Pro Asn Ile Ile Arg Leu Leu Pro Asp Phe Arg Lys Glu Lys
180 185 190
Thr Leu Phe Ser Tyr His Ser Lys Asp Ile Asp Leu Glu Ala Leu Ser
195 200 205
Phe Leu Gln Gln His Tyr His Val Asn Phe Tyr Ser Ile Ser Pro Met
210 215 220
Ser Pro Leu Ser Lys His Phe Pro Ile Pro Thr Val Glu Asp Asp Cys
225 230 235 240
Glu Thr Thr Phe Val Ala Pro Leu Lys Glu Asn Tyr Ile Asn Asp Ile
245 250 255
Leu Leu Pro Pro His Phe Val Tyr Glu Lys Leu Gly
260 265

Claims (56)

1.用于产生下述列表中的生物产物的代谢工程改造的细胞,所述列表包括单糖、活化的单糖、磷酸化的单糖、二糖、寡糖、苷元、糖脂或糖蛋白,所述细胞包含用于所述生物产物的途径,
优选地,所述途径包含至少一种参与所述生物产物的产生的糖基转移酶。
2.根据权利要求1所述的细胞,其中所述生物产物是含有N-乙酰神经氨酸(Neu(n)Ac)的化合物,其中(n)为4、5、7、8或9或其组合,并且其中所述细胞在至少一种Neu(n)Ac合酶的表达或活性方面被修饰、优选已被修饰,并且所述Neu(n)Ac合酶具有Neu(n)Ac合酶活性,并且其具有PFAM结构域PF03102和/或PatricDB总体家族结构域PGF_06907304,并且包含SEQID NO 01的序列:[ILMV][MST]XXXXX(X,非K)(X,非Q)XXXXXXXXXXXX(X,非I)XXX(X,非T)X[ACS][ST][AP][FWY]XXX(X,非G)X(X,非L)X[IL](X,非K)XXXX(X,非E)XXKXXS,其中X是任何氨基酸。
3.根据权利要求1或2所述的细胞,其中所述生物产物是含有N-乙酰神经氨酸(Neu(n)Ac)的化合物,其中(n)为4、5、7、8或9或其组合,并且其中所述细胞在至少一种Neu(n)Ac合酶的表达或活性方面被修饰、优选已被修饰,所述Neu(n)Ac合酶具有Neu(n)Ac合酶活性,并且其具有PFAM结构域PF03102和/或PatricDB总体家族结构域PGF_06907304,并且
-包含SEQ ID NO 02、03、04、05、06、07、08、09、10、11、12、13、14、15、16、17或18中任一个所述的多肽序列或由其组成,或
-是SEQ ID NO 02、03、04、05、06、07、08、09、10、11、12、13、14、15、16、17或18中任一个的功能同系物、变体、衍生物或功能片段,优选是功能同系物或功能片段,更优选是功能同系物,所述功能同系物、变体、衍生物或功能片段分别与具有SEQ ID NO 02、03、04、05、06、07、08、09、10、11、12、13、14、15、16、17或18的所述多肽中任一种的全长具有至少80%、优选至少85%、更优选至少90%、甚至更优选至少95%、最优选至少97%总体序列同一性并且具有Neu(n)Ac合酶活性。
4.根据权利要求1至3中任一项所述的细胞,其中所述生物产物是含有N-乙酰神经氨酸(Neu(n)Ac)的化合物,其中(n)为4、5、7、8或9或其组合,并且其中所述细胞在至少一种Neu(n)Ac合酶的表达或活性方面被修饰、优选已被修饰,所述Neu(n)Ac合酶具有Neu(n)Ac合酶活性,并且其具有PFAM结构域PF03102和/或PatricDB总体家族结构域PGF_06907304,并且
-包含SEQ ID NO 02、03、04、05、06、07、08、09、10、11、12、13、14、15、16、17或18中任一个所述的多肽序列或由其组成,或
-是SEQ ID NO 02、03、04、05、06、07、08、09、10、11、12、13、14、15、16、17或18中任一个的功能同系物、变体、衍生物或功能片段,优选是功能同系物或功能片段,更优选是功能同系物,所述功能同系物、变体、衍生物或功能片段分别与具有SEQ ID NO 02、03、04、05、06、07、08、09、10、11、12、13、14、15、16、17或18的所述多肽中任一种的全长具有至少85%、优选至少90%、更优选至少95%、甚至更优选至少97%总体序列同一性并且具有Neu(n)Ac合酶活性。
5.根据权利要求1至4中任一项所述的细胞,其中所述修饰包括过表达内源Neu(n)Ac合酶和/或引入并表达同源或异源Neu(n)Ac合酶。
6.根据权利要求1至5中任一项所述的细胞,其中所述Neu(n)Ac合酶以在一个或多个基因表达模块中被呈递给细胞,其中表达由一种或多种调控序列调节。
7.根据权利要求1至6中任一项所述的细胞,其中所述表达模块整合到宿主细胞的基因组中和/或在载体上呈递给细胞,所述载体包括质粒、粘粒、噬菌体、脂质体或病毒,所述载体将被稳定地转化到所述宿主细胞中。
8.根据权利要求1至7中任一项所述的细胞,其中产生所述含有Neu(n)Ac的化合物的所述途径包含至少一种选自包含以下各项的列表的酶:N-酰基葡糖胺2-差向异构酶,UDP-N-乙酰葡糖胺2-差向异构酶,N-乙酰甘露糖胺-6-磷酸2-差向异构酶,双功能的UDP-GlcNAc2-差向异构酶/激酶,N-酰基神经氨酸-9-磷酸合成酶,磷酸酶,CMP唾液酸合酶,唾液酸转移酶。
9.根据权利要求8所述的细胞,其中所述N-酰基神经氨酸-9-磷酸合成酶是具有N-酰基神经氨酸-9-磷酸合成酶活性的多肽,并且其具有PFAM结构域PF03102和/或PatricDB总体家族结构域PGF_06907304,并且其包含SEQ ID NO 19的序列:[DE]XGXNHXGXXXXXXXMXXX[ACPS]XXXXXXXX[KR](Xa)[KR](Xb)[DE](Xc)KXXS,其中X是任何氨基酸,a是28至32,b是28至30,c是14至16,优选地其包含SEQ ID NO 20的序列:[DE]XGXNHXGXXXXXXXMXX(X,非I、L、M)[AS]XXXXXXXX[KR](Xa)[KR](Xb)[DE](Xc)KXXS,其中X是任何氨基酸,a是28至32,b是28至30,c是14至16。
10.根据权利要求8或9所述的细胞,其中所述N-酰基神经氨酸-9-磷酸合成酶是具有N-酰基神经氨酸-9-磷酸合成酶活性的多肽,并且其具有PFAM结构域PF03102和/或PatricDB总体家族结构域PGF_06907304,并且
-包含SEQ ID NO 21、22、23、24、25、26、27或28中任一个所述的多肽序列或由其组成,或
-是SEQ ID NO 21、22、23、24、25、26、27或28中任一个的功能同系物、变体、衍生物或功能片段,优选是功能同系物或功能片段,更优选是功能同系物,所述功能同系物、变体、衍生物或功能片段分别与具有SEQ ID NO 21、22、23、24、25、26、27或28的所述多肽中任一种的全长具有至少80%、优选至少85%、更优选至少90%、甚至更优选至少95%、最优选至少97%总体序列同一性并且具有N-酰基神经氨酸-9-磷酸合成酶活性。
11.根据权利要求8所述的细胞,其中所述磷酸酶是具有N-酰基神经氨酸
-9-磷酸酶活性的HAD-样磷酸酶,并且
-包含SEQ ID NO 29的序列:DXDGXXTDXXXXXXXXGXXXXXXXXX DXXXXXXXXXXXXXXX[ILV]X[ST]XXXXXXXXXRXXXL(Xa)K(Xb)GXD XXD(Xc)GXGXXR[DE],其中X是任何氨基酸,a是10至11,b是21,c是32,或
-包含SEQ ID NO 31的序列:DXDXT[IL](Xa)TNGXXXXQXXK[IL](Xb)[KR]PXXX[IL][FWY](Xc)G[DN]XXXXD[ILV]XG,其中X是任何氨基酸,a是110至160,b是20至23,c是17。
12.根据权利要求1至11中任一项所述的细胞,其中所述细胞能够合成N-乙酰甘露糖胺(ManNAc)、N-乙酰甘露糖胺-6-磷酸(ManNAc-6-磷酸)和/或磷酸烯醇丙酮酸(PEP)。
13.根据权利要求1至12中任一项所述的细胞,其中所述细胞被修饰以增强PEP的合成和/或供应。
14.根据权利要求1至13中任一项所述的细胞,其中所述细胞能够合成任何一种或多种核苷酸活化的糖。
15.根据权利要求14所述的细胞,其中所述核苷酸活化的糖选自包含以下各项的列表:UDP-N-乙酰葡糖胺(UDP-GlcNAc)、UDP-N-乙酰半乳糖胺(UDP-GalNAc)、UDP-N-乙酰甘露糖胺(UDP-ManNAc)、UDP-葡萄糖(UDP-Glc)、UDP-半乳糖(UDP-Gal)、GDP-甘露糖(GDP-Man)、UDP-葡糖醛酸、UDP-半乳糖醛酸、UDP-2-乙酰氨基-2,6-二脱氧--L-阿拉伯型-4-己酮糖、UDP-2-乙酰氨基-2,6-二脱氧--L-来苏-4-己酮糖、UDP-N-乙酰基-L-鼠李糖胺(UDP-L-RhaNAc或UDP-2-乙酰氨基-2,6-二脱氧-L-甘露糖)、dTDP-N-乙酰基岩藻糖胺、UDP-N-乙酰基岩藻糖胺(UDP-L-FucNAc或UDP-2-乙酰氨基-2,6-二脱氧-L-半乳糖)、UDP-N-乙酰基-L-纽莫糖胺(UDP-L-PneNAC或UDP-2-乙酰氨基-2,6-二脱氧-L-塔罗糖)、UDP-N-乙酰基胞壁酸、UDP-N-乙酰基-L-奎诺糖胺(UDP-L-QuiNAc或UDP-2-乙酰氨基-2,6-二脱氧-L-葡萄糖)、CMP-唾液酸(CMP-Neu5Ac)、CMP-N-羟乙酰神经氨酸(CMP-Neu5Gc)、GDP-岩藻糖(GDP-Fuc)、GDP-鼠李糖和UDP-木糖。
16.根据权利要求14或15所述的细胞,其中所述核苷酸活化的糖中的至少一种衍生自Neu(n)Ac,包括CMP-Neu4Ac、CMP-Neu5Ac、CMP-Neu5Ac9N3、CMP-Neu4,5Ac2、CMP-Neu5,7Ac2、CMP-Neu5,9Ac2、CMP-Neu5,7(8,9)Ac2和CMP-Neu5Gc。
17.根据权利要求14至16中任一项所述的细胞,其中所述细胞使用所述核苷酸活化的糖中的至少一种来产生所述含有Neu(n)Ac的化合物。
18.根据权利要求1至17中任一项所述的细胞,其中所述糖基转移酶选自包含以下各项的列表:岩藻糖基转移酶,唾液酸转移酶,半乳糖基转移酶,葡萄糖基转移酶、甘露糖基转移酶、N-乙酰葡糖胺基转移酶、N-乙酰基半乳糖胺基转移酶、N-乙酰甘露糖胺基转移酶、木糖基转移酶、葡糖醛酸基转移酶、半乳糖醛酸转移酶、葡糖胺基转移酶、N-羟乙酰基神经氨酰基转移酶、鼠李糖基转移酶、N-乙酰基鼠李糖基转移酶、UDP-4-氨基-4,6-二脱氧-N-乙酰基-β-L-阿卓糖胺转氨酶、UDP-N-乙酰葡糖胺烯醇丙酮酰基转移酶和岩藻糖胺基转移酶,
-优选地,其中所述细胞在所述糖基转移酶中至少一种的表达或活性方面被修饰,
-优选地,所述岩藻糖基转移酶选自包含以下各项的列表:α-1,2-岩藻糖基转移酶,α-1,3-岩藻糖基转移酶,α-1,4-岩藻糖基转移酶和α-1,6-岩藻糖基转移酶,
-优选地,所述唾液酸转移酶选自包含以下各项的列表:α-2,3-唾液酸转移酶,α-2,6-唾液酸转移酶和α-2,8-唾液酸转移酶,
-优选地,所述半乳糖基转移酶选自包含以下各项的列表:β-1,3-半乳糖基转移酶,N-乙酰葡糖胺β-1,3-半乳糖基转移酶,β-1,4-半乳糖基转移酶,N-乙酰葡糖胺β-1,4-半乳糖基转移酶,α-1,3-半乳糖基转移酶和α-1,4-半乳糖基转移酶,
-优选地,所述葡糖醛酸基转移酶选自包含以下各项的列表:α-葡糖醛酸基转移酶,β-1,2-葡糖醛酸基转移酶,β-1,3-葡糖醛酸基转移酶和β-1,4-葡糖醛酸基转移酶,
-优选地,所述甘露糖基转移酶选自包含以下各项的列表:α-1,2-甘露糖基转移酶,α-1,3-甘露糖基转移酶和α-1,6-甘露糖基转移酶,
-优选地,所述N-乙酰葡糖胺基转移酶选自包含以下各项的列表:半乳糖苷β-1,3-N-乙酰葡糖胺基转移酶和β-1,6-N-乙酰葡糖胺基转移酶,
-优选地,所述N-乙酰半乳糖胺基转移酶选自包含α-1,3-N-乙酰半乳糖胺基转移酶的列表。
19.根据权利要求1至18中任一项所述的细胞,其中所述细胞表达至少一种α-2,3-唾液酸转移酶,其具有α-2,3-唾液酸转移酶活性,并且
-是具有SEQ ID NO 80的来自多杀巴斯德氏菌(Pasteurella multocida)的多肽,或
-是268个氨基酸残基长的多肽,所述多肽为具有SEQ ID NO 80的多肽的功能同系物、变体、衍生物或功能片段,优选是功能同系物或功能片段,更优选是功能同系物,所述功能同系物、变体、衍生物或功能片段与具有SEQ ID NO 80的所述多肽的全长具有至少80%、优选至少85%、更优选至少90%、甚至更优选至少95%、最优选至少97%总体序列同一性并且具有α-2,3-唾液酸转移酶活性,
优选地,所述细胞在所述α-2,3-唾液酸转移酶中任一种的表达或活性方面被修饰。
20.根据权利要求1至19中任一项所述的细胞,其中所述Neu(n)Ac合酶是Neu5Ac合酶,并且其中所述含有Neu(n)Ac的化合物是包含Neu5Ac的唾液酸化化合物。
21.根据权利要求1至20中任一项所述的细胞,其中所述细胞包含岩藻糖基化途径,其包含至少一种选自包含以下各项的列表的酶:甘露糖-6-磷酸异构酶、磷酸甘露糖变位酶、甘露糖-1-磷酸鸟苷酰基转移酶、GDP-甘露糖4,6-脱水酶、GDP-L-岩藻糖合酶、岩藻糖通透酶、岩藻糖激酶、岩藻糖-1-磷酸鸟苷酰基转移酶、岩藻糖基转移酶。
22.根据权利要求1至21中任一项所述的细胞,其中所述细胞包含半乳糖基化途径,其包含至少一种选自包含以下各项的列表的酶:半乳糖-1-差向异构酶、半乳糖激酶、葡糖激酶、半乳糖-1-磷酸尿苷酰基转移酶、UDP-葡萄糖4-差向异构酶、葡萄糖-1-磷酸尿苷酰基转移酶、磷酸葡萄糖变位酶、半乳糖基转移酶。
23.根据权利要求1至22中任一项所述的细胞,其中所述细胞包含N-乙酰葡糖胺基化途径,其包含至少一种选自包含以下各项的列表的酶:L-谷氨酰胺-D-果糖-6-磷酸氨基转移酶、N-乙酰葡糖胺-6-磷酸脱乙酰酶、磷酸葡糖胺变位酶、N-乙酰葡糖胺-1-磷酸尿苷酰基转移酶/葡糖胺-1-磷酸乙酰基转移酶、N-乙酰葡糖胺基转移酶。
24.根据权利要求1至23中任一项所述的细胞,其中所述细胞包含减少乙酸盐或酯产生的修饰。
25.根据权利要求1至24中任一项所述的细胞,其中所述细胞还包含以下蛋白中的任何一种或多种的更低的或减少的表达和/或消除的、受损的、减少的或延迟的活性,所述蛋白包含β-半乳糖苷酶、半乳糖苷O-乙酰基转移酶、N-乙酰葡糖胺-6-磷酸脱乙酰酶、葡糖胺-6-磷酸脱氨酶、N-乙酰葡糖胺阻遏物、核糖核苷酸单磷酸酶、EIICBA-Nag、UDP-葡萄糖:十一异戊二烯基-磷酸葡萄糖-1-磷酸转移酶、L-墨角藻糖激酶、L-岩藻糖异构酶、N-乙酰神经氨酸裂合酶、N-乙酰甘露糖胺激酶、N-乙酰甘露糖胺-6-磷酸2-差向异构酶、EIIAB-Man、EIIC-Man、EIID-Man、ushA、半乳糖-1-磷酸尿苷酰基转移酶、葡萄糖-1-磷酸腺苷酰基转移酶、葡萄糖-1-磷酸酶、ATP依赖性的6-磷酸果糖激酶同工酶1、ATP依赖性的6-磷酸果糖激酶同工酶2、葡萄糖-6-磷酸异构酶、好氧性呼吸控制蛋白、转录阻遏物IclR、lon蛋白酶、葡萄糖特异性的转位磷酸转移酶IIBC组分ptsG、葡萄糖特异性的转位磷酸转移酶(PTS)酶IIBC组分malX、酶IIAGlc、β-葡萄糖苷特异性的PTS酶II、果糖特异性的PTS多磷酰基转移蛋白FruA和FruB、乙醇脱氢酶醛脱氢酶、丙酮酸-甲酸裂合酶、乙酸激酶、磷酸酰基转移酶、磷酸乙酰基转移酶、丙酮酸脱羧酶。
26.根据权利要求1至25中任一项所述的细胞,其中所述细胞包含至少部分地灭活的所选单糖、二糖或寡糖的分解代谢途径,所选单糖、二糖或寡糖参与所述含有Neu(n)Ac的化合物的合成和/或是所述含有Neu(n)Ac的化合物的合成所必需的。
27.根据权利要求1至26中任一项所述的细胞,其中所述细胞使用前体来合成所述生物产物,所述前体从培养基给料给所述细胞。
28.根据权利要求1至27中任一项所述的细胞,其中所述细胞产生用于合成所述生物产物的前体。
29.根据权利要求1至28中任一项所述的细胞,其中所述细胞在整个培养液和/或上清液中产生90g/L或更多的所述生物产物,和/或其中所述含有Neu(n)Ac的化合物在整个培养液和/或上清液中具有至少80%的纯度,这按照分别在整个培养液和/或上清液中所述细胞产生的生物产物及其前体的总量进行测量。
30.根据权利要求1至29中任一项所述的细胞,其中所述含有Neu(n)Ac的化合物选自由以下各项组成的列表:唾液酸、二糖、寡糖、糖脂和/或糖蛋白,优选地选自由以下各项组成的列表:唾液酸、二糖、寡糖和/或糖脂,更优选地选自由以下各项组成的列表:唾液酸、二糖和/或寡糖。
31.根据权利要求1至30中任一项所述的细胞,其中所述寡糖选自包含以下各项的列表:乳寡糖、O-抗原、在荚膜多糖中存在的寡糖重复单位、肽聚糖、氨基-糖和Lewis-型抗原寡糖,优选地所述乳寡糖是哺乳动物乳寡糖(MMO),更优选地所述乳寡糖是人乳寡糖(HMO)。
32.根据权利要求1至31中任一项所述的细胞,其中所述细胞能够合成寡糖的混合物。
33.根据权利要求1至32中任一项所述的细胞,其中所述细胞能够合成二糖和寡糖的混合物。
34.根据权利要求1至33中任一项所述的细胞,其中所述细胞能够合成唾液酸、二糖和/或寡糖的混合物。
35.根据权利要求1至34中任一项所述的细胞,其中所述细胞是细菌、真菌、酵母、植物细胞、动物细胞或原生动物细胞,
-优选地,所述细菌属于大肠杆菌菌株,更优选地属于作为K-12菌株的大肠杆菌菌株,甚至更优选地所述大肠杆菌K-12菌株是大肠杆菌MG1655,
-优选地,所述真菌属于选自包含以下各项的组的属:根霉菌属(Rhizopus)、盘基网柄菌属(Dictyostelium)、青霉属(Penicillium)、毛霉菌属(Mucor)或曲霉菌属(Aspergillus),
-优选地,所述酵母属于选自包含以下各项的组的属:酵母属(Saccharomyces)、接合酵母属(Zygosaccharomyces)、毕赤酵母属(Pichia)、驹形氏酵母(Komagataella)、汉逊酵母属(Hansenula)、耶氏酵母属(Yarrowia)、斯塔莫酵母(Starmerella)、克鲁维酵母属(Kluyveromyces)或德巴利酵母属(Debaromyces),
-优选地,所述植物细胞是藻类细胞或衍生自烟草、苜蓿、稻、番茄、棉花、油菜、大豆、玉蜀黍或玉米植物,
-优选地,所述动物细胞衍生自非人哺乳动物、鸟类、鱼类、无脊椎动物、爬行动物、两栖动物或昆虫,或是衍生自除胚胎干细胞外的人类细胞的遗传修饰的细胞系,更优选地,所述人和非人哺乳动物细胞是上皮细胞、胚肾细胞、成纤维细胞、COS细胞、中国仓鼠卵巢(CHO)细胞、鼠骨髓瘤细胞、NIH-3T3细胞、非乳腺成人干细胞或其衍生物,更优选地,所述昆虫细胞衍生自草地贪夜蛾(Spodoptera frugiperda)、家蚕(Bombyx mori)、甘蓝夜蛾(Mamestrabrassicae)、粉纹夜蛾(Trichoplusia ni)或黑腹果蝇(Drosophila melanogaster),
-优选地,所述原生动物细胞是蜥蜴利什曼原虫(Leishmania tarentolae)细胞。
36.根据权利要求1至35中任一项所述的细胞,其中所述细胞在培养基中稳定地培养。
37.通过细胞产生生物产物的方法,所述方法包括下述步骤:
a)提供根据权利要求1至36中任一项所述的细胞,和
b)在允许产生所述生物产物的条件下培养所述细胞,
c)优选地,从培养物中分离所述生物产物,
优选地,其中所述生物产物是含有Neu(n)Ac的化合物。
38.根据权利要求37所述的方法,所述方法进一步包括下述步骤中的至少一个:
i)向在反应器中的培养基中加入至少一种前体和/或受体补料,其中总反应器体积的范围为250mL(毫升)至10.000m3(立方米),优选以连续方式加入,且优选使得所述培养基的终体积是在加入所述前体和/或受体补料之前培养基体积的不超过3倍、优选不超过2倍、更优选小于2倍;
ii)借助于补料溶液历时1天、2天、3天、4天、5天将至少一种前体和/或受体补料以连续方式加入所述培养基中;
iii)借助于补料溶液历时1天、2天、3天、4天、5天将至少一种前体和/或受体补料以连续方式加入所述培养基中,并且其中优选地,将所述补料溶液的pH设定在3至7,并且其中优选地,将所述补料溶液的温度保持在20℃至80℃;
所述方法产生在所述培养基的终体积中具有至少50g/L、优选至少75g/L、更优选至少90g/L、更优选至少100g/L、更优选至少125g/L、更优选至少150g/L、更优选至少175g/L、更优选至少200g/L的浓度的生物产物,优选地其中所述生物产物是含有Neu(n)Ac的化合物。
39.根据权利要求38所述的方法,所述方法进一步包括下述步骤中的至少一个:
i)向培养基中加入乳糖补料,其包含至少50、更优选至少75、更优选至少100、更优选至少120、更优选至少150克乳糖/升初始反应器体积,其中所述反应器体积的范围为250mL至10.000m3(立方米),优选以连续方式加入,且优选使得所述培养基的终体积是在加入所述乳糖补料之前培养基体积的不超过3倍、优选不超过2倍、更优选小于2倍;
ii)借助于补料溶液历时1天、2天、3天、4天、5天以连续方式向所述培养基中加入乳糖补料;
iii)借助于补料溶液历时1天、2天、3天、4天、5天以连续方式向所述培养基中加入乳糖补料,且其中所述乳糖补料溶液的浓度是50g/L、优选75g/L、更优选100g/L、更优选125g/L、更优选150g/L、更优选175g/L、更优选200g/L、更优选225g/L、更优选250g/L、更优选275g/L、更优选300g/L、更优选325g/L、更优选350g/L、更优选375g/L、更优选400g/L、更优选450g/L、更优选500g/L、甚至更优选550g/L、最优选600g/L;且其中优选地将所述溶液的pH设定在3至7,并且其中优选地将所述补料溶液的温度保持在20℃至80℃;
所述方法导致从所述乳糖产生的生物产物,所述生物产物在所述培养基的终体积中具有至少50g/L、优选至少75g/L、更优选至少90g/L、更优选至少100g/L、更优选至少125g/L、更优选至少150g/L、更优选至少175g/L、更优选至少200g/L的浓度,
优选地,其中从所述乳糖产生的所述生物产物包含一个或多个Neu(n)Ac分子。
40.根据权利要求39所述的方法,其中通过从培养开始以至少5mM的浓度、优选以30、40、50、60、70、80、90、100、150mM的浓度、更优选以>300mM的浓度添加乳糖来完成乳糖补料。
41.根据权利要求39或40所述的方法,其中通过以一定浓度将乳糖加入培养基中,使得在整个培养的生产阶段中获得至少5mM、优选10mM或30mM的乳糖浓度,完成所述乳糖补料。
42.根据权利要求37至41中任一项所述的方法,其中将所述宿主细胞培养至少约60、80、100或约120小时或以连续方式培养。
43.根据权利要求37至42中任一项所述的方法,其中将所述细胞在培养基中培养,所述培养基包含:碳源,其包含单糖、二糖、寡糖、多糖、多元醇、甘油;复合培养基,其包括糖蜜、玉米浆、蛋白胨、胰蛋白胨或酵母提取物;优选地,其中所述碳源选自包含以下各项的列表:葡萄糖、甘油、果糖、蔗糖、麦芽糖、乳糖、阿拉伯糖、麦芽寡糖、麦芽三糖、山梨醇、木糖、鼠李糖、半乳糖、甘露糖、甲醇、乙醇、海藻糖、淀粉、纤维素、半纤维素、糖蜜、玉米浆、高果糖糖浆、乙酸盐、柠檬酸盐、乳酸盐和丙酮酸盐。
44.根据权利要求37至43中的任一项所述的方法,其中所述细胞使用至少一种前体来合成所述生物产物,优选地所述细胞使用两种或更多种前体来合成所述生物产物。
45.根据权利要求37至44中的任一项所述的方法,其中所述培养基含有至少一种选自包括以下各项的组的化合物:乳糖、半乳糖、唾液酸、岩藻糖、GlcNAc、GalNAc、乳糖-N-二糖(LNB)、N-乙酰基乳糖胺(LacNAc)。
46.根据权利要求37至45中的任一项所述的方法,其中通过向所述培养基中添加基于碳的底物、优选葡萄糖或蔗糖来提供指数细胞生长的第一阶段,然后在第二阶段将乳糖加入所述培养基中。
47.根据权利要求37至46中的任一项所述的方法,其中所述细胞产生至少一种用于合成所述生物产物的前体。
48.根据权利要求37至47中的任一项所述的方法,其中用于合成所述生物产物的所述前体被完全转化为所述生物产物。
49.根据权利要求37至48中的任一项所述的方法,其中将所述生物产物与所述培养基和/或所述细胞分离。
50.根据权利要求37至49中的任一项所述的方法,其中所述分离包括下述步骤中的至少一个:澄清、超滤、纳米过滤、两相分配、反渗透、微滤、活性炭或碳处理、用非离子表面活性剂处理、酶消化、切向流高效过滤、切向流超滤、电泳、亲和色谱法、离子交换色谱法、疏水相互作用色谱法和/或凝胶过滤、配体交换色谱法。
51.根据权利要求37至50中的任一项所述的方法,其中所述方法进一步包括所述生物产物的纯化。
52.根据权利要求51所述的方法,其中所述纯化包括下述步骤中的至少一个:使用活性炭或碳、使用木炭、纳米过滤、超滤、电泳、酶处理或离子交换、使用醇、使用水性醇混合物、结晶、蒸发、沉淀、干燥、喷雾干燥或冻干。
53.权利要求1至36中任一项所述的细胞用于产生生物产物的用途。
54.权利要求1至36中任一项所述的细胞用于产生含有Neu(n)Ac的化合物的用途,其中(n)为4、5、7、8或9或其组合。
55.权利要求37至52中任一项所述的方法用于产生生物产物的用途。
56.权利要求37至52中任一项所述的方法用于产生含有Neu(n)Ac的化合物的用途,其中(n)为4、5、7、8或9或其组合。
CN202280028738.1A 2021-04-16 2022-04-15 生物产物的细胞生产 Pending CN117222736A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
EP21168995.5 2021-04-16
EP21168995 2021-04-16
PCT/EP2022/060180 WO2022219187A1 (en) 2021-04-16 2022-04-15 Cellular production of bioproducts

Publications (1)

Publication Number Publication Date
CN117222736A true CN117222736A (zh) 2023-12-12

Family

ID=75581384

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202280028738.1A Pending CN117222736A (zh) 2021-04-16 2022-04-15 生物产物的细胞生产

Country Status (5)

Country Link
EP (1) EP4323512A1 (zh)
KR (1) KR20230172003A (zh)
CN (1) CN117222736A (zh)
AU (1) AU2022256796A1 (zh)
WO (1) WO2022219187A1 (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN118048282B (zh) * 2024-04-16 2024-06-14 云南农业大学 一株解淀粉芽孢杆菌及其应用

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2006048753A2 (en) * 2004-11-05 2006-05-11 Pharmacia & Upjohn Company Llc Anti-bacterial vaccine compositions
EP2090648A1 (en) * 2008-02-12 2009-08-19 Institut Francais de Recherche pour l'Exploitation de la Mere(Ifremer) Production of glycosylated polypeptides in microalgae
EP3235907B1 (en) 2010-07-12 2023-06-21 Inbiose N.V. Metabolically engineered organisms for the production of added value bio-products
WO2015037698A1 (ja) * 2013-09-12 2015-03-19 協和発酵バイオ株式会社 N-アセチルノイラミン酸及びn-アセチルノイラミン酸含有糖質の製造法
RU2746410C2 (ru) 2014-11-14 2021-04-13 Инбиос Н.В. Мутантные микроорганизмы, устойчивые к гибели под действием лактозы
CA3048521A1 (en) 2016-12-27 2018-07-05 Inbiose N.V. In vivo synthesis of sialylated compounds
EP3473644A1 (en) 2017-10-17 2019-04-24 Jennewein Biotechnologie GmbH Fermentative production of n-acetylneuraminic acid
WO2019118829A2 (en) * 2017-12-15 2019-06-20 Glycosyn LLC Sialyltransferases and uses thereof
PL3575404T3 (pl) 2018-05-28 2023-02-06 Chr. Hansen HMO GmbH Fermentacyjna produkcja sacharydów sialilowanych
AU2020358725A1 (en) 2019-10-03 2022-04-14 Turtletree Labs Pte. Ltd. Nutrient compositions and methods, kits, and cell compositions for producing the same

Also Published As

Publication number Publication date
KR20230172003A (ko) 2023-12-21
AU2022256796A9 (en) 2023-12-07
WO2022219187A1 (en) 2022-10-20
EP4323512A1 (en) 2024-02-21
AU2022256796A1 (en) 2023-11-30

Similar Documents

Publication Publication Date Title
US20240209405A1 (en) Production of a sialylated oligosaccharide mixture by a cell
CN116323927A (zh) 双糖及/或寡糖的细胞生产
WO2022034080A1 (en) Cellular production of sialylated di- and/or oligosaccharides
CN116710559A (zh) 变体蔗糖渗透酶多肽
CN117222736A (zh) 生物产物的细胞生产
CN117157394A (zh) 发酵生产
CN117157396A (zh) 唾液酸化的二糖和/或寡糖的细胞生产
TW202219275A (zh) 在細胞中之含有GlcNAc的生物產品的產生
CN117957316A (zh) 转化乳糖-n-二糖的岩藻糖基转移酶
WO2023285650A1 (en) Lacto-n-biose converting fucosyltransferases
TW202212572A (zh) 藉由細胞製造中性岩藻糖基化寡醣之混合物
TW202221138A (zh) 藉由細胞之唾液酸化寡醣混合物的生產
TW202221135A (zh) α-1,3醣化形式的Fuc-a1,2-Gal-R的產生

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination