CN117157396A - 唾液酸化的二糖和/或寡糖的细胞生产 - Google Patents

唾液酸化的二糖和/或寡糖的细胞生产 Download PDF

Info

Publication number
CN117157396A
CN117157396A CN202280028767.8A CN202280028767A CN117157396A CN 117157396 A CN117157396 A CN 117157396A CN 202280028767 A CN202280028767 A CN 202280028767A CN 117157396 A CN117157396 A CN 117157396A
Authority
CN
China
Prior art keywords
seq
transporter
cell
udp
sialylated
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202280028767.8A
Other languages
English (en)
Inventor
J·博普雷兹
P·库西蒙特
T·德寇内
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Inbiose NV
Original Assignee
Inbiose NV
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Inbiose NV filed Critical Inbiose NV
Publication of CN117157396A publication Critical patent/CN117157396A/zh
Pending legal-status Critical Current

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/70Vectors or expression systems specially adapted for E. coli
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N1/00Microorganisms, e.g. protozoa; Compositions thereof; Processes of propagating, maintaining or preserving microorganisms or compositions thereof; Processes of preparing or isolating a composition containing a microorganism; Culture media therefor
    • C12N1/20Bacteria; Culture media therefor
    • C12N1/205Bacterial isolates
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/195Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from bacteria
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/195Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from bacteria
    • C07K14/24Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from bacteria from Enterobacteriaceae (F), e.g. Citrobacter, Serratia, Proteus, Providencia, Morganella, Yersinia
    • C07K14/245Escherichia (G)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N1/00Microorganisms, e.g. protozoa; Compositions thereof; Processes of propagating, maintaining or preserving microorganisms or compositions thereof; Processes of preparing or isolating a composition containing a microorganism; Culture media therefor
    • C12N1/14Fungi; Culture media therefor
    • C12N1/16Yeasts; Culture media therefor
    • C12N1/18Baker's yeast; Brewer's yeast
    • C12N1/185Saccharomyces isolates
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/52Genes encoding for enzymes or proenzymes
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/10Transferases (2.)
    • C12N9/1048Glycosyltransferases (2.4)
    • C12N9/1081Glycosyltransferases (2.4) transferring other glycosyl groups (2.4.99)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P19/00Preparation of compounds containing saccharide radicals
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P19/00Preparation of compounds containing saccharide radicals
    • C12P19/04Polysaccharides, i.e. compounds containing more than five saccharide radicals attached to each other by glycosidic bonds
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P19/00Preparation of compounds containing saccharide radicals
    • C12P19/12Disaccharides
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P19/00Preparation of compounds containing saccharide radicals
    • C12P19/18Preparation of compounds containing saccharide radicals produced by the action of a glycosyl transferase, e.g. alpha-, beta- or gamma-cyclodextrins
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P19/00Preparation of compounds containing saccharide radicals
    • C12P19/26Preparation of nitrogen-containing carbohydrates
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P9/00Preparation of organic compounds containing a metal or atom other than H, N, C, O, S or halogen
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2500/00Specific components of cell culture medium
    • C12N2500/30Organic components
    • C12N2500/34Sugars
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12RINDEXING SCHEME ASSOCIATED WITH SUBCLASSES C12C - C12Q, RELATING TO MICROORGANISMS
    • C12R2001/00Microorganisms ; Processes using microorganisms
    • C12R2001/01Bacteria or Actinomycetales ; using bacteria or Actinomycetales
    • C12R2001/185Escherichia
    • C12R2001/19Escherichia coli
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12RINDEXING SCHEME ASSOCIATED WITH SUBCLASSES C12C - C12Q, RELATING TO MICROORGANISMS
    • C12R2001/00Microorganisms ; Processes using microorganisms
    • C12R2001/645Fungi ; Processes using fungi
    • C12R2001/85Saccharomyces
    • C12R2001/865Saccharomyces cerevisiae

Landscapes

  • Chemical & Material Sciences (AREA)
  • Organic Chemistry (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Wood Science & Technology (AREA)
  • Zoology (AREA)
  • Genetics & Genomics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biotechnology (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Biochemistry (AREA)
  • Microbiology (AREA)
  • General Chemical & Material Sciences (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Biomedical Technology (AREA)
  • Molecular Biology (AREA)
  • Medicinal Chemistry (AREA)
  • Biophysics (AREA)
  • Mycology (AREA)
  • Tropical Medicine & Parasitology (AREA)
  • Virology (AREA)
  • Plant Pathology (AREA)
  • Physics & Mathematics (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Botany (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)
  • Saccharide Compounds (AREA)

Abstract

本发明属于合成生物学和代谢工程的技术领域。更具体地,本发明属于代谢工程改造的微生物细胞以及所述细胞在发酵中的用途的技术领域。本发明描述了代谢工程改造的微生物细胞以及用所述细胞发酵产生唾液酸化的二糖和/或寡糖的方法。所述代谢工程改造的细胞包含用于产生所述唾液酸化的二糖和/或寡糖的途径,合成唾液酸,表达至少一种唾液酸转移酶,优选地在至少一种唾液酸转移酶的表达或活性方面被修饰,被修饰成具有完全地或部分地敲除的或功能更低的唾液酸分解代谢途径,并且被修饰用于内源性唾液酸转运蛋白的过表达和/或外源性、同源性和/或异源性唾液酸转运蛋白的表达(优选过表达)。此外,本发明提供了从培养物、优选发酵物中纯化所述唾液酸化的二糖和/或寡糖。

Description

唾液酸化的二糖和/或寡糖的细胞生产
技术领域
本发明属于合成生物学和代谢工程的技术领域。更具体地,本发明属于代谢工程改造的微生物细胞以及所述细胞在发酵中的用途的技术领域。本发明描述了代谢工程改造的微生物细胞以及用所述细胞发酵产生唾液酸化的二糖和/或寡糖的方法。所述代谢工程改造的细胞包含用于产生所述唾液酸化的二糖和/或寡糖的途径,合成唾液酸,表达至少一种唾液酸转移酶,优选地在至少一种唾液酸转移酶的表达或活性方面被修饰,被修饰成具有完全地或部分地敲除的或功能更低的唾液酸分解代谢途径,并且被修饰用于内源性唾液酸转运蛋白的过表达和/或外源性、同源性和/或异源性唾液酸转运蛋白的表达(优选过表达)。此外,本发明提供了从培养物、优选发酵物中纯化所述唾液酸化的二糖和/或寡糖。
背景技术
唾液酸化的二糖和寡糖经常以与蛋白和脂质的糖缀合形式存在,参与许多重要现象诸如发育、分化、受精、胚胎发生、宿主病原体粘附和炎症。唾液酸化的寡糖还可以作为未缀合的聚糖存在于体液和哺乳动物乳汁中,其中它们在重要的发育和免疫过程中作为生物活性聚糖进行调控(Bode,Early Hum.Dev.2015,91(11):619-622;Bode,NestleNutr.Inst.Workshop Ser.2019,90:191-201;Reily等人,Nat.Rev.Nephrol.2019,15:346-366;Varki,Glycobiology 2017,27:3-49;Walsh等人,J.Funct.Foods 2020,72:10474)。由于其广泛的功能谱,在唾液酸化的二糖和寡糖中存在巨大的科学和商业兴趣。但是,唾液酸化的二糖和/或寡糖的利用度受到限制,因为生产依赖于化学或化学酶促合成或依赖于从天然来源(例如动物乳汁)中的纯化。化学合成方法费力且耗时,并且由于涉及大量步骤,因此它们难以扩大规模。使用核苷酸活化的糖和糖基转移酶的酶促方案提供许多胜过化学合成的优点。糖基转移酶催化糖部分从核苷酸活化的糖供体向糖或非糖受体上的转移(Coutinho等人,J.Mol.Biol.2003,328:307-317)。这些糖基转移酶是生物技术人员合成唾液酸化的二糖和寡糖的来源,并被用于(化学)酶促方案以及基于细胞的生产系统中。但是,糖基转移酶的立体特异性和区域选择性仍然是一个艰巨的挑战。此外,化学酶促方案需要原位再生核苷酸活化的糖供体。唾液酸化的二糖和寡糖的细胞生产需要严格控制在互补糖基转移酶附近的适当水平的核苷酸活化的糖供体的时空利用度。由于这些困难,目前的方法经常导致唾液酸化的二糖和/或寡糖的小规模合成。
PEP或磷酸烯醇丙酮酸是细胞的合成代谢中的常见前体,并且对于次级代谢物(诸如类黄酮、芳族氨基酸以及唾液酸化的二糖和寡糖的许多单糖亚基)的合成或唾液酸化的二糖和寡糖修饰至关重要。这样的单糖亚基是例如N-乙酰神经氨酸、军团酸(legionaminicacid)、酮脱氧辛酸酯或盐、酮-脱氧-尤罗索尼克酸(nonulonic acid)、假氨基酸、N,N'-二乙酰基-8-表军团酸(epilegionaminate)、N-乙酰基-D-胞壁酸(muramate)以及它们的核苷酸和磷酸化衍生物。为了增强这些单糖亚基和唾液酸化的二糖和/或寡糖的合成,可以借助于几种基因的过表达和缺失来增加细胞中的PEP浓度。
Zhu等人(Biotechnol.Lett.2017,39:227-234)已经证实,通过PEP合酶(EC:2.7.9.2)和PEP羧基激酶(EC:4.1.1.49)的过表达,N-乙酰神经氨酸的合成与对照相比分别增加了96.4%和61%,组合的过表达使合成与对照相比进一步增加至116.7%。Zhu等人(Biotechnol.Lett 2016,doi 10.1007/s10529-016-2215-z)已经进一步证实,底物磷酸转移酶(PTS)系统(如在大肠杆菌中由基因nagE编码的N-乙酰葡糖胺PTS系统,其使用PEP N-乙酰葡糖胺(GlcNAc)和葡糖胺(GlcN)运输进入细胞中并磷酸化,或如在大肠杆菌中由基因manX、manY和manZ编码的甘露糖PTS系统,其使用PEP甘露糖、N-乙酰甘露糖胺、葡萄糖、果糖、GlcN和GlcNAc运输进入细胞中并磷酸化)的缺失显著增加Neu5Ac合成。后来还证实,在大肠杆菌中ppsA的上调在EP3697805和EP3575404中也有效,还将ppsA过表达与manXYZ和nagE的缺失相组合。
Zhang等人(Biotech and Bioeng.2018,115(9):217-2231)以类似的方式改进了枯草芽孢杆菌(Bacillus subtilis)中的PEP合成。缺失葡萄糖PTS系统以减少在葡萄糖摄取后的PEP利用,缺失基因丙酮酸激酶(EC:2.7.1.40)以减少PEP消耗,并过表达基因PEP羧基激酶(EC:4.1.1.49)以增强通量流向。为了补偿葡萄糖PTS系统的缺失,使用葡萄糖通透酶和葡糖激酶来内化和磷酸化细胞中的葡萄糖。此外,引入苹果酸酶(EC:1.1.1.38、EC:1.1.1.39或EC:1.1.1.40)以增加从三羧酸循环(Krebs cycle)到丙酮酸盐或酯(PEP的前体)的通量。减少的糖酵解和Entner-Doudoroff途径的引入进一步增强了N-乙酰神经氨酸的产生。应当指出,这些菌株的乙酸盐或酯和乳酸盐或酯合成能力在其基础上进行了修改,这本质上提高了PEP、丙酮酸盐或酯和乙酰辅酶A的利用度。
Zhang等人(Biotech.Adv.2019,37:787-800)还回顾并描述了可以如何调控N-乙酰神经氨酸和唾液酸化的寡糖的前体。通过影响细胞中的PEP和丙酮酸盐或酯利用度,增强了通向唾液酸化的寡糖和N-乙酰神经氨酸(或如上所述的其它单糖亚基)的通量。此处还描述了缺失或敲低糖酵解途径(包含磷酸果糖激酶(pfkA基因,E.C.:2.7.1.11)和丙酮酸激酶(pyk,EC:2.7.1.40))和上调磷酸烯醇丙酮酸合酶基因(ppsA,EC:2.7.9.2)的技术。Entner-Doudoroff途径的引入或过表达以及降低的PTS活性进一步导致了合成的改进。所描述的系统不仅通过过表达或缺失来实现,而且通过生物传感器的动态控制来实现,所述生物传感器选择性地上调和下调在细胞生物化学中的反应。
本发明的一个目的是提供工具和方法,借助于它们可以由微生物细胞产生唾液酸化的二糖和/或寡糖,并且优选地以有效的、时间和成本上有效益的方式,并且其产生大量的期望的唾液酸化的二糖和/或寡糖。
根据本发明,该目的和其它目的通过提供微生物细胞和用于产生唾液酸化的二糖和/或寡糖的方法来实现,其中所述细胞经过代谢工程改造用于产生所述唾液酸化的二糖和/或寡糖,并且其中所述细胞合成唾液酸,表达至少一种唾液酸转移酶,优选地在至少一种唾液酸转移酶的表达或活性方面被修饰,被修饰成具有完全地或部分地敲除的或功能更低的唾液酸分解代谢途径,并且被修饰用于内源性唾液酸转运蛋白的过表达和/或如本文中定义的外源性、同源性和/或异源性唾液酸转运蛋白的表达(优选过表达)。
发明内容
发明概述
现在已经发现,包含用于产生唾液酸化的二糖和/或寡糖的途径的微生物细胞,其中所述细胞合成唾液酸,表达至少一种唾液酸转移酶,优选地在至少一种唾液酸转移酶的表达或活性方面被修饰,被修饰成具有完全地或部分地敲除的或功能更低的唾液酸分解代谢途径,并且被修饰用于至少一种唾液酸转运蛋白的(过)表达,提供了这样的细胞:当将其用于发酵生产中和在允许产生所述唾液酸化的二糖和/或寡糖的条件下培养所述细胞时,其产生与在所述唾液酸转运蛋白的(过)表达方面没有额外修饰的相应细胞相比更多的唾液酸化的二糖和/或寡糖。本发明还提供了使用本发明的细胞产生唾液酸化的二糖和/或寡糖的方法。本发明还提供了分离所述唾液酸化的二糖和/或寡糖的方法。此外,已经发现,在本发明中鉴定的唾液酸转运蛋白提供这样的酶:其能够发酵产生唾液酸化的二糖和/或寡糖,并且优选地具有积极作用,并且甚至更优选地当用于代谢工程改造产生所述唾液酸化的二糖和/或寡糖的微生物细胞时,与具有相同遗传背景但缺乏在本发明中鉴定的唾液酸转运蛋白的细胞相比,提供更好的产量、生产率和/或比生产率。
定义
在本说明书中用于描述本发明和它的各种实施方案的词语不仅应当以它们通常定义的含义来理解,而且还应当通过在本说明书中的特殊定义来包括超出通常定义的含义的范围的结构、材料或行为。因此,如果一个要素在本说明书的上下文中可以被理解为包括超过一种含义,则其在权利要求书中的使用必须被理解为对由说明书和该词语本身支持的所有可能的含义是通用的。
本文中公开的本发明的各种实施方案和方面不仅应当按照在本说明书中具体描述的顺序和上下文来理解,而且还应当包括任何顺序及其任何组合。每当上下文需要时,所有以单数形式使用的词语都应当被视为包括复数,并且反之亦然。除非另外定义,否则在本文中使用的所有技术和科学术语通常具有与本发明所属领域的普通技术人员通常理解的相同的含义。通常,本文所用的命名法以及本文描述的细胞培养、分子遗传学、有机化学和核酸化学以及杂交中的实验室程序是本领域中众所周知的和常用的那些。将标准技术用于核酸和肽合成。通常,根据制造商的说明书进行酶促反应和纯化步骤。
在本说明书中,已经公开了本发明的实施方案,并且虽然采用了特定术语,但是所述术语仅以描述性的含义使用并且不用于限制的目的,本发明的范围在所附权利要求书中阐述。必须理解,解释的实施方案仅出于示例的目的而被阐述,并且不应被视为限制本发明。本领域技术人员显而易见,与本文公开内容的文字和精神一致并且在本公开内容的范围内,可以做出改变、其它实施方案、改进、细节和用途,本公开内容的范围仅由权利要求书限制,根据专利法(包括等同原则)解释。在所附权利要求书中,仅为了描述方便而提供用于指定权利要求步骤的索引字符,并且无意暗示执行所述步骤的任何特定顺序。
在本文件及其权利要求书中,动词“包含”及其变化形式以其非限制性含义使用,意指包括在该词语后面的项目,但是不排除没有特别提及的项目。贯穿本申请,动词“包含”可以被“由……组成”或“基本上由……组成”替换,并且反之亦然。另外,动词“由……组成”可以被“基本上由……组成”替换,这意味着本文所定义的组合物可以包含除具体鉴定的组分之外的另外组分,所述另外组分不改变本发明的独特特征。另外,用不定冠词“a”或“an”对要素的提及不排除存在超过一个/种要素的可能性,除非上下文明确要求存在且仅存在一个/种要素。不定冠词“a”或“an”因而经常是指“至少一个/种”。
贯穿本申请,除非另外明确地阐明,否则冠词“a”和“an”优选地被替换为“至少两个/种”,更优选“至少三个/种”,甚至更优选“至少四个/种”,甚至更优选“至少五个/种”,甚至更优选“至少六个/种”,最优选“至少两个/种”。
贯穿本申请,除非另外明确地阐明,否则特征“能合成”、“合成的”和“合成”分别与特征“产生”、“产生的”和“生产”互换使用。
贯穿本申请,除非另外明确地阐明,否则表述“能够……<动词>”和“能……<动词>”优选地被所述动词的主动语态替换,并且反之亦然。例如,表述“能够表达”优选地被“表达”替换,并且反之亦然,即“表达”优选地被“能够表达”替换。
除非另外指出,否则在本文中鉴定的每个实施方案可以组合在一起。在本说明书中提及的所有出版物、专利和专利申请都通过引用并入本文,其程度如同明确地且单独地指出每篇单独的出版物、专利或专利申请通过引用并入。
根据本发明,术语“多核苷酸”通常表示任何多核糖核苷酸或多脱氧核糖核苷酸,其可以是未修饰的RNA或DNA或修饰的RNA或DNA。“多核苷酸”包括、而不限于:单链和双链DNA,作为单链和双链区域或单链、双链和三链区域的混合物的DNA,单链和双链RNA,以及作为单链和双链区域的混合物的RNA,杂种分子(其包含可以是单链或更一般而言双链或三链区域的DNA和RNA),或者单链和双链区域的混合物。另外,本文中使用的“多核苷酸”表示包含RNA或DNA或RNA和DNA的三链区域。这样的区域中的链可以来自相同分子或来自不同分子。所述区域可以包括所有一种或多种分子,但更通常仅涉及一些分子的区域。三螺旋区域的分子之一经常是寡核苷酸。本文中使用的术语“多核苷酸”也包括如上所述的DNA或RNA,其含有一个或多个经修饰的碱基。因此,具有为了稳定性或其它原因而被修饰的主链的DNA或RNA是根据本发明的“多核苷酸”。此外,包含罕见碱基(诸如肌苷)或经修饰的碱基(诸如三苯甲基化的碱基)的DNA或RNA应当理解为被术语“多核苷酸”涵盖。要认识到已对这样的DNA和RNA进行了大量的修饰,所述DNA和RNA用于本领域技术人员已知的许多用途目的。本文中使用的术语“多核苷酸”包括多核苷酸的这样的化学地、酶促地或代谢地修饰的形式,以及病毒和细胞(包括、例如简单的和复杂的细胞)特有的DNA和RNA的化学形式。术语“多核苷酸”还包括经常被称作寡核苷酸的短多核苷酸。
“多肽”表示包含通过肽键或修饰的肽键彼此连接的两个或更多个氨基酸的任何肽或蛋白。“多肽”表示通常被称作肽、寡肽和寡聚体的短链以及通常被称作蛋白的较长链。多肽可以含有除20种基因编码的氨基酸之外的氨基酸。“多肽”包括通过天然过程(诸如加工和其它翻译后修饰)修饰的那些,但是也包括通过化学修饰技术修饰的那些。这样的修饰在基础课本和更详细的专著以及大量研究文献中得到充分描述,并且它们是技术人员众所周知的。相同类型的修饰可以以相同或不同程度存在于给定多肽中的几个位点处。此外,给定的多肽可以含有多种类型的修饰。修饰可以发生在多肽中的任何地方,包括肽主链、氨基酸侧链以及氨基末端或羧基末端。修饰包括例如乙酰化、酰化、ADP-核糖基化、酰胺化、黄素的共价连接、血红素部分的共价连接、核苷酸或核苷酸衍生物的共价连接、脂质或脂质衍生物的共价连接、磷脂酰肌醇的共价连接、交联、环化、二硫键形成、脱甲基化、共价交联的形成、焦谷氨酸盐的形成、甲酰化、γ-羧基化、糖基化、GPI锚形成、羟基化、碘化、甲基化、肉豆蔻酰化、氧化、蛋白水解加工、磷酸化、异戊二烯化、外消旋化、脂质附着、硫酸化、谷氨酸残基的γ-羧基化、羟基化和ADP-核糖基化、硒酰化、转移RNA介导的氨基酸向蛋白的添加,诸如精氨酰化和泛素化。多肽可以是支链的或环状的,有或没有分支。环状、支链和支链环状多肽可以由翻译后天然过程产生,并且也可以通过完全合成方法制备。
“分离”是指“通过人手”从其天然状态改变,即,如果它发生在自然界中,则它已经从其原始环境改变或移出,或两者。例如,天然存在于活生物体中的多核苷酸或多肽不是“分离的”,但与其天然状态的共存材料分离的相同多核苷酸或多肽是“分离的”,作为本文所使用的术语。类似地,作为本文所使用的术语,“合成的”序列是指已经合成产生的且不是直接从天然来源分离的任何序列。作为本文所使用的术语,“合成的”是指任何合成产生的序列并且不是直接从天然来源分离。
本文中使用的关于细胞或宿主细胞的术语“重组的”或“转基因的”或“经工程改造的”或“经过代谢工程改造的”或“遗传工程改造的”或“遗传上修饰的”互换使用,并且指示所述细胞复制异源核酸,或表达由异源核酸(即“对于所述细胞来说外来的”序列或“对于所述细胞中的所述位置或环境来说外来的”序列)编码的肽或蛋白。这样的细胞被描述为用至少一种异源或外源基因转化,或被描述为通过引入至少一种异源或外源基因而转化。经过代谢工程改造的或重组的或转基因的或遗传工程改造的细胞可以含有在细胞的天然(非重组)形式中未发现的基因。重组细胞还可以含有在细胞的天然形式中发现的基因,其中通过人工手段将所述基因重新引入细胞中。细胞的天然基因在被重新引入重组细胞中之前也可以被修饰。
该术语还涵盖含有细胞内源核酸的细胞,所述核酸已经被修饰或其表达或活性已经被修饰,但没有从细胞中除去所述核酸;这样的修饰包括通过基因替换、启动子替换、位点特异性突变及相关技术而获得的那些。因此,“重组多肽”是已经由重组细胞产生的多肽。
该术语还涵盖已经借助于技术人员公知的常见技术(如例如敲除基因)除去细胞内源核酸而修饰的细胞。
本文中使用的“异源序列”或“异源核酸”是源自特定细胞的外来来源(例如来自不同物种)的序列或核酸,或者如果来自相同来源,则从其在基因组中的原始形式或位置进行修饰。因此,可操作地连接至启动子的异源核酸来自与启动子的来源不同的来源,或者如果来自相同来源,则从其在基因组中的原始形式或位置进行修饰。可以稳定地引入异源序列,例如,通过转染、转化、缀合或转导进入宿主微生物细胞的基因组中,其中可以应用的技术将取决于细胞和要引入的序列。各种技术是本领域技术人员已知的,并且例如公开于Sambrook等人,Molecular Cloning:A Laboratory Manual,第2版,Cold Spring HarborLaboratory Press,Cold Spring Harbor,N.Y.(1989)。在本公开内容的上下文中使用的术语“突变的”或“经工程改造的”细胞或微生物表示经过遗传工程改造的细胞或微生物。
在本公开内容的上下文中,术语“内源的”表示作为细胞的天然部分并且存在于其在细胞染色体中的天然位置处的任何多核苷酸、多肽或蛋白序列。术语“外源的”表示源自所研究的细胞的外部且不是细胞的天然部分的任何多核苷酸、多肽或蛋白序列,或者源自细胞但不存在于其在细胞染色体或质粒中的天然位置处的多核苷酸、多肽或蛋白序列。
当参考多核苷酸、基因、核酸、多肽或酶使用时,术语“异源的”表示来自宿主生物体以外的来源或从其衍生出的多核苷酸、基因、核酸、多肽或酶。相反,“同源的”多核苷酸、基因、核酸、多肽或酶在本文中用于表示从宿主生物体衍生出的多核苷酸、基因、核酸、多肽或酶。当表示基因调控序列或用于维持或操纵基因序列的辅助核酸序列(例如启动子、5'非翻译区、3'非翻译区、聚腺苷酸添加序列、内含子序列、剪接位点、核糖体结合位点、内部核糖体进入序列、基因组同源区域、重组位点等)时,“异源的”是指所述调控序列或辅助序列与调控性或辅助性核酸序列在构建体、基因组、染色体或附加体中并置的基因天然不相关。因此,可操作地连接至在其天然状态中(即,在非遗传工程改造的生物体的基因组中)没有可操作地连接的基因的启动子在本文中被称作“异源启动子”,即使该启动子可以源自与其连接的基因相同的物种(或者在某些情况下,相同的生物体)。
本文中使用的术语“编码多肽的多核苷酸”涵盖包括编码本发明的多肽的序列的多核苷酸。该术语还涵盖包括编码所述多肽的单个连续区域或不连续区域(例如,被整合的噬菌体或插入序列或编辑中断)以及还可以含有编码和/或非编码序列的另外区域的多核苷酸。
术语基因的“修饰的表达”涉及在期望的唾液酸化的二糖和/或寡糖的生产过程的任何阶段中与所述基因的野生型表达相比表达的变化。所述修饰的表达是与野生型相比更低或更高的表达,其中术语“更高的表达”或“增强的表达”也被定义为在内源基因的情况下所述基因的“过表达”或在野生型菌株中不存在的异源基因的情况下的“表达”。如下得到更低的或减少的表达:借助于技术人员众所周知的常见技术(诸如使用siRNA、CrispR、CrispRi、核糖开关、重组工程、同源重组、ssDNA诱变、RNAi、miRNA、asRNA、突变基因、敲除基因、转座子诱变、……),它们用于以使其不太能(即与功能性野生型基因相比,在统计上显著“不太能”)或完全不能(诸如敲除的基因)产生功能性终产物的方式改变基因。本文中使用的术语“核糖开关”被定义为信使RNA的一部分,其折叠成通过干扰翻译来阻断表达的复杂结构。效应分子的结合会诱导构象变化,从而允许在转录后调控表达。除了以如上所述获得更低表达的方式改变感兴趣的基因之外,还可以通过改变转录单元、启动子、非翻译区、核糖体结合位点、Shine Dalgarno序列或转录终止子来获得更低的表达。更低的表达或减少的表达可以例如如下获得:突变启动子序列中的一个或多个碱基对,或将启动子序列完全改变为与野生型相比具有更低表达强度的组成型启动子或导致受调控的表达的诱导型启动子或导致受调控的表达的阻抑型启动子。过表达或表达如下得到:借助于技术人员众所周知的常见技术(诸如人工转录因子的使用、启动子序列的从头设计、核糖体工程、在常染色质处引入或重新引入表达模块、高拷贝数质粒的使用),其中所述基因是“表达盒”的一部分,所述“表达盒”涉及其中存在启动子序列、非翻译区序列(含有核糖体结合序列或Kozak序列或Shine Dalgarno序列)、编码序列(例如唾液酸转运蛋白)和任选的转录终止子的任何序列,并导致功能性活性蛋白的表达。所述表达是组成性的或条件性的或受调控的或可调控的。
术语“组成型表达”被定义为在某些生长条件下不受RNA聚合酶的亚基以外的转录因子(例如细菌σ因子如s70、s54或相关的s-因子和与RNA聚合酶核心酶共结合的酵母线粒体RNA聚合酶特异性因子MTF1)调控的表达。这样的转录因子的非限制性例子是大肠杆菌中的CRP、LacI、ArcA、Cra、IclR,或酿酒酵母(Saccharomyces cerevisiae)中的Aft2p、Crz1p、Skn7,或枯草芽孢杆菌(B.subtilis)中的DeoR、GntR、Fur。这些转录因子与特定序列结合,并可能在某些生长条件下阻断或增强表达。所述RNA聚合酶是从DNA模板合成RNA的催化机制。RNA聚合酶结合特定的DNA序列来启动转录,例如通过原核宿主中的σ因子或通过酵母中的MTF1。组成型表达会提供恒定的表达水平,无需诱导或抑制。
术语“受调控的表达”被定义为基因的兼性或调控性或可调控性表达,其仅在宿主的某种天然条件下(例如出芽酵母的接合期、细菌的静止期)表达,作为对诱导物或阻遏物诸如但不限于葡萄糖、异乳糖(allo-lactose)、乳糖、半乳糖、甘油、阿拉伯糖、鼠李糖、岩藻糖、IPTG、甲醇、乙醇、乙酸盐、甲酸盐、铝、铜、锌、氮、磷酸盐、二甲苯、碳或氮耗竭或底物或产生的产物或化学抑制的应答,作为对环境变化(例如厌氧性或好氧性生长、氧化性应激、pH变化、温度变化如例如热休克或冷休克、渗透压、光条件、饥饿)的应答,或取决于所述宿主细胞的发育阶段或细胞周期的位置,包括、但不限于细胞凋亡和自噬。受调控的表达允许控制基因何时表达。
术语“控制序列”表示被宿主细胞转录和翻译系统识别的序列,从而允许多核苷酸序列转录和翻译为多肽。因此,这样的DNA序列对于在特定宿主细胞或生物体中表达可操作地连接的编码序列而言是必需的。这样的控制序列可以是但不限于启动子序列、核糖体结合序列、Shine Dalgarno序列、Kozak序列、转录终止子序列。适合用于原核生物的控制序列例如包括启动子、任选的操纵子序列和核糖体结合位点。已知真核细胞利用启动子、多腺苷酸化信号和增强子。前序列或分泌型前导序列的DNA可以与多肽的DNA可操作地连接,条件是其表达为参与所述多肽的分泌的前蛋白;启动子或增强子与编码序列可操作地连接,条件是其影响所述序列的转录;或者核糖体结合位点与编码序列可操作地连接,条件是其影响所述序列的转录;或核糖体结合位点与编码序列可操作地连接,条件是其被定位为促进翻译。所述控制序列还可以通过诱导型启动子或通过遗传回路(其诱导或抑制所述多核苷酸向多肽的转录或翻译)用外部化学物质(诸如,但不限于IPTG、阿拉伯糖、乳糖、异乳糖、鼠李糖或岩藻糖)控制。
通常,“可操作地连接的”是指被连接的DNA序列是连续的,且在分泌型前导序列的情况下,是连续的且在阅读相中。但是,增强子不必是连续的。
术语“野生型”表示在自然界中发生的众所周知的遗传或表型情况。
本文中使用的术语“蛋白的修饰的表达或活性”表示i)内源蛋白的更高表达或过表达,ii)内源蛋白的更低的、减少的和/或消除的表达,iii)外源的、异源的或同源的蛋白的表达,或iv)与野生型(即天然)蛋白相比具有更高的、加速的或更低的活性的突变蛋白的表达和/或过表达。
本文中使用的术语“唾液酸转移酶的修饰的表达或活性”表示i)内源性唾液酸转移酶的更高表达或过表达,ii)异源性唾液酸转移酶的表达,和/或iii)与野生型(即天然)唾液酸转移酶蛋白相比具有更高的唾液酸转移酶活性的突变唾液酸转移酶的表达和/或过表达。
如在WO 00/18935、WO98/04715中所述,可以如下增强基因的表达:用更强的启动子置换表达调控序列诸如天然启动子,无论所述基因存在于染色体还是质粒上,扩增能够增加基因表达的调控元件,或者缺失或减弱降低基因表达的调控元件。已知的强启动子的例子包括lac启动子、trp启动子、trc启动子、tac启动子、λ噬菌体PR启动子、PL启动子和tet启动子。Goldstein等人(Prokaryotic promoters in biotechnology.Biotechnol.Annu.Rev.,1995,1,105-128)等描述了评价启动子强度的方法和强启动子的实例。另外,已知的是,在核糖体结合位点(RBS)和翻译起始密码子之间的间隔序列,特别是恰好在起始密码子上游的几个核苷酸,对翻译效率具有很大影响。因此,可以修饰该序列。另外,为了增强由基因编码的蛋白的活性,可以将增加活性的突变引入所述基因中。这样的突变的例子包括在启动子序列中的突变以增加所述基因的转录水平,以及在编码区中的突变以增加所述蛋白的特异性活性。
作为本文所使用的术语,“变体”是分别与参考多核苷酸或多肽不同、但保留基本性能的多核苷酸或多肽。多核苷酸的典型变体在核苷酸序列上与另一种参考多核苷酸不同。变体的核苷酸序列中的变化可以改变或不改变由参考多核苷酸编码的多肽的氨基酸序列。如下所讨论的,核苷酸变化可以导致由参考序列编码的多肽中的氨基酸置换、添加、缺失、融合和截短。多肽的典型变体在氨基酸序列上不同于另一种参考多肽。通常,差异是有限的,因此参考多肽和变体的序列总体上非常相似,并且在许多区域中是相同的。变体和参考多肽可以在氨基酸序列中因任意组合的一个或多个置换、添加、缺失而不同。置换或插入的氨基酸残基可以是或不是由遗传密码编码的氨基酸残基。多核苷酸或多肽的变体可以是天然存在的,诸如等位基因变体,或者它可以是未知天然存在的变体。通过诱变技术、通过直接合成以及通过本领域技术人员已知的其它重组方法,可以制备多核苷酸和多肽的非天然存在的变体。
本文中使用的术语多肽的“衍生物”是这样的多肽:其可以在多肽的氨基酸序列内含有氨基酸残基的缺失、添加或置换,但是其导致沉默变化,从而产生在功能上等同的多肽。氨基酸置换可以基于所涉及的残基的极性、电荷、溶解度、疏水性、亲水性和/或两亲性质的相似性来进行。例如,非极性的(疏水的)氨基酸包括丙氨酸、亮氨酸、异亮氨酸、缬氨酸、脯氨酸、苯丙氨酸、色氨酸和甲硫氨酸;平面中性氨基酸包括甘氨酸、丝氨酸、苏氨酸、半胱氨酸、酪氨酸、天冬酰胺和谷氨酰胺;带正电荷的(碱性的)氨基酸包括精氨酸、赖氨酸和组氨酸;和带负电荷的(酸性的)氨基酸包括天冬氨酸和谷氨酸。在本发明的上下文中,本文中使用的衍生多肽表示能够表现出与原始多肽基本上相似的体外和/或体内活性的多肽,这通过许多标准中的任一个来判断,包括、但不限于酶活性,并且其可以在翻译过程中或翻译之后有差别地修饰。此外,非经典的氨基酸或化学氨基酸类似物可以作为置换或添加引入到原始多肽序列中。
在某些实施方案中,本公开内容考虑通过修饰在本发明中使用的唾液酸转运蛋白的结构来制备功能变体。可以通过氨基酸置换、缺失、添加或其组合来产生变体。例如,合理地预期,用异亮氨酸或缬氨酸分离替换亮氨酸,用谷氨酸替换天冬氨酸,用丝氨酸替换苏氨酸,或用结构上相关的氨基酸对氨基酸的类似替换(例如,保守突变),不会对所得分子的生物活性产生重大影响。保守替换是在它们的侧链中相关的氨基酸家族内发生的那些替换。通过评估变体多肽以与野生型多肽类似的方式在细胞中产生应答并在某些情况下提供比没有变体的细胞更好的产量、生产率和/或生长速度的能力,可以容易地确定本公开内容的多肽的氨基酸序列中的变化是否产生功能同系物。
本文中使用的术语“功能同系物”描述了具有序列相似性并且还共享至少一种功能特征诸如生化活性的那些分子。更具体地,本文中使用的术语“功能同系物”描述了具有序列相似性(换言之,同源性)并且同时具有至少一种功能相似性诸如生化活性的那些蛋白(Altenhoff等人,PLoS Comput.Biol.8(2012)e1002514)。
功能同系物有时被称作直系同源物,其中“直系同源物”表示与另一个物种中的所提及的基因或蛋白在功能上等同的同源基因或蛋白。功能同系物通常会产生相似但不一定相同程度的相同特征。在功能上同源的蛋白具有相同的特征,其中一种同系物产生的定量测量结果是另一种同系物的至少10%;更一般而言,是原始分子产生的结果的至少20%、约30%至约40%;例如,约50%至约60%;约70%至约80%;或约90%与约95%;约98%至约100%,或大于100%。因此,在所述分子具有酶活性的情况下,所述功能同系物将具有与原始酶相比的上述百分比的酶活性。在所述分子是DNA结合分子(例如,多肽)的情况下,所述同系物将具有上述结合亲和力百分比,如通过与原始分子相比结合的分子的重量所测量的。
功能同系物和参考多肽可以是天然存在的多肽,并且序列相似性可以归因于趋同或趋异的进化事件。
可以通过分析核苷酸和多肽序列比对来鉴定功能同系物。例如,对核苷酸或多肽序列的数据库进行查询可以鉴定感兴趣的核苷酸或多肽的同系物。序列分析可以包含使用参考核苷酸或多肽序列的核苷酸或氨基酸序列对非冗余数据库进行BLAST、ReciprocalBLAST或PSI-BLAST分析。在某些情况下,从核苷酸序列推导出氨基酸序列。通常,在数据库中与感兴趣的多肽具有大于40%的序列同一性的那些多肽是用于进一步评价作为同源多肽的适合性的候选物。氨基酸序列相似性允许保守氨基酸置换,诸如用一个疏水残基置换另一个或用一个极性残基置换另一个或用一个碱性氨基酸置换另一个等。优选地,保守置换是指组合,诸如用丙氨酸置换甘氨酸,并且反之亦然;用甲硫氨酸置换缬氨酸、异亮氨酸和亮氨酸,并且反之亦然;用谷氨酸置换天冬氨酸,并且反之亦然;用谷氨酰胺置换天冬酰胺,并且反之亦然;用苏氨酸置换丝氨酸,并且反之亦然;用精氨酸置换赖氨酸,并且反之亦然;用甲硫氨酸置换半胱氨酸,并且反之亦然;和用色氨酸置换苯丙氨酸和酪氨酸,并且反之亦然。如果需要的话,可以对这样的候选物进行人工检查,以缩小需要进一步评价的候选物的数目。
结构域可以通过例如以下方式来表征:Pfam(El-Gebali等人,Nucleic AcidsRes.47(2019)D427-D432),IPR(InterPro结构域)(http://ebi.ac.uk/interpro)(Mitchell等人,Nucleic Acids Res.47(2019)D351-D360),蛋白指纹结构域(PRINTS)(Attwood等人,Nucleic Acids Res.31(2003)400-402),SUBFAM结构域(Gough等人,J.Mol.Biol.313(2001)903-919),TIGRFAM结构域(Selengut等人,Nucleic Acids Res.35(2007)D260-D264),保守结构域数据库(CDD)命名(https://www.ncbi.nlm.nih.gov/cdd)(Lu等人,Nucleic Acids Res.48(2020)D265-D268),PTHR结构域(http://www.pantherdb.org)(Mi等人,Nucleic Acids.Res.41(2013)D377-D386;Thomas等人,Genome Research 13(2003)2129-2141)或PATRIC标识符或PATRIC DB总家族结构域(https://www.patricbrc.org/)(Davis等人,Nucleic Acids Res.48(D1)(2020)D606-D612)。本领域技术人员应当理解,对于本文所使用的数据库,包含Pfam 32.0(2018年9月发布)、CDD v3.17(2019年4月3日发布)、eggnogdb 5.0.0(2018年11月发布)、InterPro 75.0(2019年7月4日发布)、TCDB(2019年6月17日发布)和PATRIC 3.6.9(2020年3月发布),每个数据库的内容在每个发布版本中都是固定的,并且不会更改。当特定数据库的内容发生更改时,该特定数据库会收到具有新发布日期的新发布版本。每个数据库的所有发布版本及其对应的发布日期和在这些特定发布日期注释的特定内容对于本领域技术人员来说是可得到的和已知的。
蛋白或多肽序列信息和功能信息可以由蛋白序列和注释数据的综合资源如例如Universal Protein Resource(UniProt)(www.uniprot.org)(Nucleic Acids Res.2021,49(D1),D480-D489)提供。UniProt包含专业且精心策划的蛋白数据库,称为UniProt知识库(UniProt Knowledgebase,UniProtKB),以及UniProt参考簇(UniProt ReferenceClusters,UniRef)和UniProt档案(UniProt Archive,UniParc)。UniProt标识符对于在数据库中存在的每种蛋白来说是唯一的,并且在本文中被定义为“UniProt ID”或“UniProtKBID”或“UniProtKB”或“UniProt KB”。本文使用的UniProt标识符是2021年4月7日发布的UniProt数据库版本2021_02中的UniProt标识符。在本文中使用在NIH遗传序列数据库(https://www.ncbi.nlm.nih.gov/genbank/)(Nucleic Acids Res.2013,41(D1),D36-D42)(在2020年2月15日的GenBank发布版本236.0下)中存在的相应GenBank登录号(GenBank No.)来引用不具有UniProt ID的蛋白。贯穿本申请,多肽的序列可以由SEQ IDNO或备选地由UniProt ID表示。因此,术语“多肽SEQ ID NO”和“多肽UniProt ID”可以互换使用,除非另外明确地阐明。
在两个或更多个核酸或多肽序列的上下文中,术语“相同的”或“同一性百分比”或“%同一性”表示,当对比并对齐以得到最大对应性时,相同的或具有特定百分比的相同核苷酸或氨基酸残基的两个或更多个序列或子序列,这使用序列对比算法或通过目检来测量。对于序列对比,一个序列充当参考序列,将试验序列与其进行对比。当使用序列对比算法时,将试验序列和参考序列输入计算机,指定子序列坐标(如果必要的话),并指定序列算法程序参数。序列对比算法然后基于指定的程序参数计算试验序列相对于参考序列的序列同一性百分比。优选地,可以如下确定序列同一性百分比:比对两个序列,并鉴定具有相同残基的位置的数目除以较短序列中的残基数目×100。可以在参考序列的全长序列上总体计算同一性百分比,从而产生总体同一性百分比评分。备选地,可以在参考序列的部分序列上计算同一性百分比,从而产生局部同一性百分比评分。部分序列优选是指全长参考序列的至少约50%、60%、70%、80%、90%或95%。在另一个优选的实施方案中,参考多肽序列的部分序列是指至少200个氨基酸残基直至参考多肽序列的氨基酸残基总数的区段。在局部序列比对中使用参考序列的全长会产生试验序列和参考序列之间的总体同一性百分比评分。使用不同的算法如例如BLAST和PSI-BLAST(Altschul等人,1990,J Mol Biol 215:3,403-410;Altschul等人,1997,Nucleic Acids Res 25:17,3389-402)、Clustal Omega方法(Sievers等人,2011,Mol.Syst.Biol.7:539)、MatGAT方法(Campanella等人,2003,BMCBioinformatics,4:29)或EMBOSS Needle,可以确定同一性百分比。
术语“唾液酸”、“N-乙酰神经氨酸”、“N-酰基神经氨酸”、“N-乙酰基神经氨酸”、“Neu(n)Ac”、“NeuAc”互换使用并表示具有九碳主链的酸性糖,包含但不限于Neu4Ac;Neu5Ac;Neu4,5Ac2;Neu5,7Ac2;Neu5,8Ac2;Neu5,9Ac2;Neu4,5,9Ac3;Neu5,7,9Ac3;Neu5,8,9Ac3;Neu4,5,7,9Ac4;Neu5,7,8,9Ac4、Neu4,5,7,8,9Ac5和Neu5Gc。
Neu4Ac也被称作4-O-乙酰基-5-氨基-3,5-二脱氧-D-甘油-D-半乳-壬-2-酮吡喃糖酸或4-O-乙酰神经氨酸并具有C11H19NO9作为分子式。Neu5Ac也被称作5-乙酰氨基-3,5-二脱氧-D-甘油-D-半乳-壬-2-酮吡喃糖酸、D-甘油-5-乙酰氨基-3,5-二脱氧-D-半乳-壬-2-酮-吡喃糖酸、5-(乙酰基氨基)-3,5-二脱氧-D-甘油-D-半乳-2-壬酮吡喃糖酸、5-(乙酰基氨基)-3,5-二脱氧-D-甘油-D-半乳-2-壬酮糖酸、5-(乙酰基氨基)-3,5-二脱氧-D-甘油-D-半乳-壬-2-壬酮糖酸或5-(乙酰基氨基)-3,5-二脱氧-D-甘油-D-半乳-壬-2-酮吡喃糖酸并具有C11H19NO9作为分子式。Neu4,5Ac2也被称作N-乙酰基-4-O-乙酰神经氨酸、4-O-乙酰基-N-乙酰神经氨酸、4-O-乙酰基-N-乙酰神经氨酸、4-乙酸5-乙酰氨基-3,5-二脱氧-D-甘油-D-半乳-壬酮糖酸、4-乙酸5-(乙酰基氨基)-3,5-二脱氧-D-甘油-D-半乳-2-壬酮糖酸、4-乙酸5-乙酰氨基-3,5-二脱氧-D-甘油-D-半乳-壬酮糖酸或4-乙酸5-(乙酰基氨基)-3,5-二脱氧-D-甘油-D-半乳-2-壬酮糖酸并具有C13H21NO10作为分子式。Neu5,7Ac2也被称作7-O-乙酰基-N-乙酰神经氨酸、N-乙酰基-7-O-乙酰神经氨酸、7-O-乙酰基-N-乙酰神经氨酸、7-乙酸5-乙酰氨基-3,5-二脱氧-D-甘油-D-半乳-壬酮糖酸、7-乙酸5-(乙酰基氨基)-3,5-二脱氧-D-甘油-D-半乳-2-壬酮糖酸、7-乙酸5-乙酰氨基-3,5-二脱氧-D-甘油-D-半乳-壬酮糖酸或7-乙酸5-(乙酰基氨基)-3,5-二脱氧-D-甘油-D-半乳-2-壬酮糖酸并具有C13H21NO10作为分子式。Neu5,8Ac2也被称作5-n-乙酰基-8-o-乙酰神经氨酸并具有C13H21NO10作为分子式。Neu5,9Ac2也被称作N-乙酰基-9-O-乙酰神经氨酸、9-anana、9-O-乙酰基唾液酸、9-O-乙酰基-N-乙酰神经氨酸、5-n-乙酰基-9-O-乙酰神经氨酸、N,9-O-二乙酰神经氨酸或N,9-O-二乙酰神经氨酸并具有C13H21NO10作为分子式。Neu4,5,9Ac3也被称作5-N-乙酰基-4,9-二-O-乙酰神经氨酸。Neu5,7,9Ac3也被称作5-N-乙酰基-7,9-二-O-乙酰神经氨酸。Neu5,8,9Ac3也被称作5-N-乙酰基-8,9-二-O-乙酰神经氨酸。Neu4,5,7,9Ac4也被称作5-N-乙酰基-4,7,9-三-O-乙酰神经氨酸。Neu5,7,8,9Ac4也被称作5-N-乙酰基-7,8,9-三-O-乙酰神经氨酸。Neu4,5,7,8,9Ac5也被称作5-N-乙酰基-4,7,8,9-四-O-乙酰神经氨酸。Neu5Gc也被称作N-羟乙酰基-神经氨酸、N-羟乙酰基神经氨酸、N-羟乙酰神经氨酸、N-乙醇酰基-神经氨酸、N-乙醇酰基-神经氨酸、N-乙醇酰神经氨酸、3,5-二脱氧-5-((羟基乙酰基)氨基)-D-甘油-D-半乳-2-壬酮糖酸、3,5-二脱氧-5-(乙醇酰基氨基)-D-甘油-D-半乳-2-壬酮吡喃糖酸、3,5-二脱氧-5-(乙醇酰基氨基)-D-甘油-D-半乳-壬-2-酮吡喃糖酸、3,5-二脱氧-5-[(羟基乙酰基)氨基]-D-甘油-D-半乳-壬-2-酮吡喃糖酸、D-甘油-5-羟乙酰基酰氨基-3,5-二脱氧-D-半乳-壬-2-酮-吡喃糖酸并具有C11H19NO10作为分子式。
本文中使用的术语“N-乙酰基神经氨酸合酶”、“N-乙酰神经氨酸合酶”、“唾液酸合酶”、“NeuAc合酶”、“NeuB”、“NeuB1”、“NeuNAc合酶”、“Neu(n)Ac合酶”、“NANA缩合酶”、“N-乙酰神经氨酸裂合酶合酶”、“N-乙酰神经氨酸缩合酶”互换使用并表示能够在反应中使用磷酸烯醇丙酮酸(PEP)从N-乙酰甘露糖胺(ManNAc)合成唾液酸的酶。
本文中使用的术语“CMP-唾液酸合酶”、“N-酰基神经氨酸胞苷酰基转移酶”、“CMP-唾液酸的合酶”、“CMP-NeuAc合酶”、“CMP-Neu(n)Ac合酶”、“NeuA”和“CMP-N-乙酰神经氨酸合酶”互换使用并表示能够在反应中使用CTP从N-乙酰神经氨酸合成CMP-N-乙酰神经氨酸的酶。
术语“L-谷氨酰胺-D-果糖-6-磷酸氨基转移酶”、“谷氨酰胺---果糖-6-磷酸转氨酶(异构化)”、“己糖磷酸氨基转移酶”、“葡糖胺-6-磷酸异构酶(形成谷氨酰胺)”、“谷氨酰胺-果糖-6-磷酸转氨酶(异构化)”、“D-果糖-6-磷酸酰氨基转移酶”、“果糖-6-磷酸氨基转移酶”、“葡糖胺磷酸异构酶”、“葡糖胺6-磷酸合酶”、“GlcN6P合酶”、“GFA”、“glms”、“glmS”和“glmS*54”互换使用并表示催化使用L-谷氨酰胺将D-果糖-6-磷酸转化为D-葡糖胺-6-磷酸的酶。
术语“葡糖胺-6-P脱氨酶”、“葡糖胺-6-磷酸脱氨酶”、“GlcN6P脱氨酶”、“葡糖胺-6-磷酸异构酶”、“glmD”和“nagB”互换使用并表示催化葡糖胺-6-磷酸(GlcN6P)的可逆异构化-脱氨以形成果糖-6-磷酸和铵离子的酶。
术语“磷酸葡糖胺变位酶”和“glmM”互换使用并表示催化葡糖胺-6-磷酸转化为葡糖胺-1-磷酸的酶。磷酸葡糖胺变位酶还可以催化从葡萄糖-1-P形成葡萄糖-6-P,尽管以低1400倍的速率。
术语“N-乙酰葡糖胺-6-P脱乙酰酶”、“N-乙酰葡糖胺-6-磷酸脱乙酰酶”和“nagA”互换使用并表示催化N-乙酰葡糖胺-6-磷酸(GlcNAc-6-P)的N-乙酰基基团的水解以产生葡糖胺-6-磷酸(GlcN6P)和乙酸盐或酯的酶。
N-酰基葡糖胺2-差向异构酶是催化反应N-酰基-D-葡糖胺=N-酰基-D-甘露糖胺的酶。该酶的替代名称包括N-乙酰葡糖胺2-差向异构酶、N-乙酰基-D-葡糖胺2-差向异构酶、GlcNAc 2-差向异构酶、N-酰基-D-葡糖胺2-差向异构酶和N-乙酰葡糖胺差向异构酶。
UDP-N-乙酰葡糖胺2-差向异构酶是催化反应N-乙酰基-D-葡糖胺=N-乙酰甘露糖胺的酶。该酶的替代名称包括UDP-N-酰基葡糖胺2-差向异构酶、UDP-GlcNAc-2-差向异构酶、“neuC”和UDP-N-乙酰基-D-葡糖胺2-差向异构酶。
双功能的UDP-GlcNAc 2-差向异构酶/激酶是催化反应UDP-N-乙酰基-D-葡糖胺=N-乙酰基-D-甘露糖胺和反应N-乙酰基-D-甘露糖胺+ATP=ADP+N-乙酰基-D-甘露糖胺6-磷酸的双功能酶。
葡糖胺6-磷酸N-乙酰基转移酶是催化乙酰基基团从乙酰辅酶A转移至D-葡糖胺-6-磷酸由此产生游离CoA和N-乙酰基-D-葡糖胺6-磷酸的酶。替代名称包括氨基脱氧葡萄糖磷酸乙酰基转移酶、D-葡糖胺-6-P N-乙酰基转移酶、葡糖胺6-磷酸乙酰化酶、葡糖胺6-磷酸N-乙酰基转移酶、葡糖胺-磷酸N-乙酰基转移酶、葡糖胺-6-磷酸乙酰化酶、N-乙酰葡糖胺-6-磷酸合酶、磷酸葡糖胺乙酰化酶、磷酸葡糖胺N-乙酰化酶(磷酸葡糖胺N-乙酰基转移酶)、磷酸葡糖胺乙酰基转移酶、GNA和GNA1。
术语“N-乙酰葡糖胺-6-磷酸磷酸酶”表示将N-乙酰葡糖胺-6-磷酸(GlcNAc-6-P)去磷酸化由此合成N-乙酰葡糖胺(GlcNAc)的酶。
术语“N-乙酰甘露糖胺-6-磷酸磷酸酶”表示将N-乙酰甘露糖胺-6-磷酸(ManNAc-6P)去磷酸化为N-乙酰甘露糖胺(ManNAc)的酶。
术语“N-乙酰神经氨酸激酶”、“ManNAc激酶”、“N-乙酰基-D-甘露糖胺激酶”和“nanK”互换使用并表示将ManNAc磷酸化以合成N-乙酰甘露糖胺-磷酸(ManNAc-6-P)的酶。
术语“N-乙酰甘露糖胺-6-磷酸2-差向异构酶”、“ManNAc-6-P异构酶”、“ManNAc-6-P 2-差向异构酶”、N-乙酰葡糖胺-6P 2-差向异构酶和“nanE”互换使用并表示催化反应ManNAc-6-P=N-乙酰葡糖胺-6-磷酸(GlcNAc-6-P)的酶。
术语“磷酸乙酰葡糖胺变位酶”、“乙酰葡糖胺磷酸变位酶”、“乙酰基氨基脱氧葡萄糖磷酸变位酶”、“磷酸-N-乙酰葡糖胺变位酶”和“N-乙酰基-D-葡糖胺1,6-磷酸变位酶”互换使用并表示催化N-乙酰基-葡糖胺1-磷酸转化为N-乙酰葡糖胺6-磷酸的酶。
术语“N-乙酰葡糖胺1-磷酸尿苷酰基转移酶”、“N-乙酰葡糖胺-1-磷酸尿苷酰转移酶”、“UDP-N-乙酰葡糖胺二磷酸化酶”、“UDP-N-乙酰葡糖胺焦磷酸化酶”、“尿苷二磷酸乙酰葡糖胺焦磷酸化酶”、“UTP:2-乙酰氨基-2-脱氧-α-D-葡萄糖-1-磷酸尿苷酰基转移酶”、“UDP-GlcNAc焦磷酸化酶”、“GlmU尿苷酰基转移酶”、“乙酰葡糖胺1-磷酸尿苷酰基转移酶”、“UDP-乙酰葡糖胺焦磷酸化酶”、“尿苷二磷酸-N-乙酰葡糖胺焦磷酸化酶”、“尿苷二磷酸乙酰葡糖胺磷酸化酶”和“乙酰葡糖胺1-磷酸尿苷酰基转移酶”互换使用并表示催化通过尿苷5-单磷酸(从尿苷5-三磷酸(UTP))的转移将N-乙酰葡糖胺1-磷酸(GlcNAc-1-P)转化为UDP-N-乙酰葡糖胺(UDP-GlcNAc)的酶。
术语葡糖胺-1-磷酸乙酰基转移酶表示催化乙酰基基团从乙酰辅酶A转移至葡糖胺-1-磷酸(GlcN-1-P)以产生N-乙酰葡糖胺-1-磷酸(GlcNAc-1-P)的酶。
术语“glmU”表示具有N-乙酰葡糖胺-1-磷酸尿苷酰基转移酶和葡糖胺-1-磷酸乙酰基转移酶活性并催化UDP-GlcNAc的从头生物合成途径中的两个连续反应的双功能酶。C-端结构域催化乙酰基基团从乙酰辅酶A转移到GlcN-1-P以产生GlcNAc-1-P,其又通过尿苷5-单磷酸的转移转化为UDP-GlcNAc,这是由N-端结构域催化的反应。
术语“N-乙酰神经氨酸裂合酶”、“Neu5Ac裂合酶”、“N-乙酰神经氨酸丙酮酸-裂合酶”、“N-乙酰神经氨酸醛缩酶”、“NALase”、“唾液酸裂解酶”、“唾液酸醛缩酶”、“唾液酸裂合酶”和“nanA”互换使用并表示将N-乙酰神经氨酸降解为N-乙酰甘露糖胺(ManNAc)和丙酮酸盐或酯的酶。
本文中使用的术语“N-酰基神经氨酸-9-磷酸合酶”、“N-酰基神经氨酸-9-磷酸合成酶”、“NANA合酶”、“NANAS”、“NANS”、“NmeNANAS”、“N-乙酰神经氨酸丙酮酸-裂合酶(丙酮酸磷酸化)”互换使用并表示能够使用磷酸烯醇丙酮酸(PEP)在反应中从N-乙酰甘露糖胺-6-磷酸(ManNAc-6-磷酸)合成N-酰基神经氨酸-9-磷酸的酶。
术语“N-酰基神经氨酸-9-磷酸酶”表示能够将N-酰基神经氨酸-9-磷酸去磷酸化以合成N-酰基神经氨酸的酶。
本文中使用的术语“糖基转移酶”表示能够催化糖部分从活化的供体分子转移至特定受体从而形成糖苷键的酶。所述供体可以是如本文中定义的前体。已经描述了使用核苷酸二磷酸-糖、核苷酸单磷酸-糖和糖磷酸和有关的蛋白将糖基转移酶分类成不同的基于序列的家族(Campbell等人,Biochem.J.326,929-939(1997))并可在CAZy(碳水化合物-活性酶)网站(www.cazy.org)上得到。
如本文中使用的,所述糖基转移酶可以选自包含但不限于下述的列表:岩藻糖基转移酶、唾液酸转移酶、半乳糖基转移酶、葡萄糖基转移酶、甘露糖基转移酶、N-乙酰葡糖胺基转移酶、N-乙酰基半乳糖胺基转移酶、N-乙酰甘露糖胺基转移酶、木糖基转移酶、葡糖醛酸基转移酶、半乳糖醛酸转移酶、葡糖胺基转移酶、N-羟乙酰基神经氨酰基转移酶、鼠李糖基转移酶、N-乙酰基鼠李糖基转移酶、UDP-4-氨基-4,6-二脱氧-N-乙酰基-β-L-阿卓糖胺转氨酶、UDP-N-乙酰葡糖胺烯醇丙酮酰基转移酶和岩藻糖胺基转移酶。
岩藻糖基转移酶是将岩藻糖残基(Fuc)从GDP-岩藻糖(GDP-Fuc)供体转移至聚糖受体的糖基转移酶。岩藻糖基转移酶包括α-1,2-岩藻糖基转移酶、α-1,3-岩藻糖基转移酶、α-1,4-岩藻糖基转移酶、α-1,3/4-岩藻糖基转移酶和α-1,6-岩藻糖基转移酶,它们催化Fuc残基从GDP-Fuc通过α-糖苷键转移到聚糖受体上。岩藻糖基转移酶可以存在于但不限于GT10、GT11、GT23、GT65和GT68CAZy家族中。唾液酸转移酶是将唾液酸(如Neu5Ac或Neu5Gc)从供体(如CMP-Neu5Ac或CMP-Neu5Gc)转移到聚糖受体上的糖基转移酶。唾液酸转移酶包括α-2,3-唾液酸转移酶、α-2,6-唾液酸转移酶和α-2,8-唾液酸转移酶,它们催化唾液酸通过α-糖苷键向聚糖受体上的转移。唾液酸转移酶可以存在于但不限于GT29、GT42、GT80和GT97CAZy家族中。半乳糖基转移酶是将半乳糖基基团(Gal)从UDP-半乳糖(UDP-Gal)供体转移到聚糖受体上的糖基转移酶。半乳糖基转移酶包括β-1,3-半乳糖基转移酶、N-乙酰葡糖胺β-1,3-半乳糖基转移酶、β-1,4-半乳糖基转移酶、N-乙酰葡糖胺β-1,4-半乳糖基转移酶、α-1,3-半乳糖基转移酶和α-1,4-半乳糖基转移酶,它们将Gal残基从UDP-Gal通过α-或β-糖苷键转移到聚糖受体上。半乳糖基转移酶可以存在于但不限于GT2、GT6、GT8、GT25和GT92 CAZy家族中。葡萄糖基转移酶是将葡萄糖基基团(Glc)从UDP-葡萄糖(UDP-Glc)供体转移到聚糖受体上的糖基转移酶。葡萄糖基转移酶包括α-葡萄糖基转移酶、β-1,2-葡萄糖基转移酶、β-1,3-葡萄糖基转移酶和β-1,4-葡萄糖基转移酶,它们将Glc残基从UDP-Glc通过α-或β-糖苷键转移到聚糖受体上。葡萄糖基转移酶可以存在于但不限于GT1、GT4和GT25CAZy家族中。甘露糖基转移酶是将甘露糖基团(Man)从GDP-甘露糖(GDP-Man)供体转移到聚糖受体上的糖基转移酶。甘露糖基转移酶包括α-1,2-甘露糖基转移酶、α-1,3-甘露糖基转移酶和α-1,6-甘露糖基转移酶,它们将Man残基从GDP-Man通过α-糖苷键转移到聚糖受体上。甘露糖基转移酶可以存在于但不限于GT22、GT39、GT62和GT69 CAZy家族中。N-乙酰葡糖胺基转移酶是将N-乙酰葡糖胺基团(GlcNAc)从UDP-N-乙酰葡糖胺(UDP-GlcNAc)供体转移到聚糖受体上的糖基转移酶。N-乙酰葡糖胺基转移酶可以存在于但不限于GT2和GT4 CAZy家族中。半乳糖苷β-1,3-N-乙酰葡糖胺基转移酶是N-乙酰葡糖胺基转移酶的一部分并将GlcNAc从UDP-GlcNAc供体通过β-1,3-键转移到存在于聚糖受体中的末端半乳糖单元上。β-1,6-N-乙酰葡糖胺基转移酶是N-乙酰葡糖胺基转移酶,其将GlcNAc从UDP-GlcNAc供体通过β-1,6-键转移到聚糖受体上。N-乙酰基半乳糖胺基转移酶是将N-乙酰半乳糖胺基团(GalNAc)从UDP-N-乙酰半乳糖胺(UDP-GalNAc)供体转移到聚糖受体上的糖基转移酶。N-乙酰基半乳糖胺基转移酶可以存在于但不限于GT7、GT12和GT27 CAZy家族中。α-1,3-N-乙酰基半乳糖胺基转移酶是N-乙酰基半乳糖胺基转移酶的一部分并将GalNAc从UDP-GalNAc供体通过α-1,3-键转移至聚糖受体。N-乙酰甘露糖胺基转移酶是将N-乙酰甘露糖胺基团(ManNAc)从UDP-N-乙酰甘露糖胺(UDP-ManNAc)供体转移到聚糖受体上的糖基转移酶。木糖基转移酶是将木糖残基(Xyl)从UDP-木糖(UDP-Xyl)供体转移到聚糖受体上的糖基转移酶。木糖基转移酶可以存在于但不限于GT14、GT61和GT77 CAZy家族中。葡糖醛酸基转移酶是将葡糖醛酸从UDP-葡糖醛酸供体通过α-或β-糖苷键转移到聚糖受体上的糖基转移酶。葡糖醛酸基转移酶可以存在于但不限于GT4、GT43和GT93 CAZy家族中。半乳糖醛酸转移酶是将半乳糖醛酸从UDP-半乳糖醛酸供体转移到聚糖受体上的糖基转移酶。N-羟乙酰基神经氨酰基转移酶是将N-羟乙酰神经氨酸基团(Neu5Gc)从CMP-Neu5Gc供体转移到聚糖受体上的糖基转移酶。鼠李糖基转移酶是将鼠李糖残基从GDP-鼠李糖供体转移到聚糖受体上的糖基转移酶。鼠李糖基转移酶可以存在于但不限于GT1、GT2和GT102CAZy家族中。N-乙酰基鼠李糖基转移酶是将N-乙酰基鼠李糖胺残基从UDP-N-乙酰基-L-鼠李糖胺供体转移到聚糖受体上的糖基转移酶。UDP-4-氨基-4,6-二脱氧-N-乙酰基-β-L-阿卓糖胺转氨酶是在假氨基酸的生物合成中使用UDP-2-乙酰氨基-2,6-二脱氧--L-阿拉伯型-4-己酮糖(其为用于修饰鞭毛蛋白的唾液酸样糖)的糖基转移酶。UDP-N-乙酰葡糖胺烯醇丙酮酰基转移酶(murA)是将烯醇丙酮酰基基团从磷酸烯醇丙酮酸(PEP)转移至UDP-N-乙酰葡糖胺(UDPAG)以形成UDP-N-乙酰葡糖胺烯醇丙酮酸的糖基转移酶。岩藻糖胺基转移酶是将N-乙酰基岩藻糖胺残基从dTDP-N-乙酰基岩藻糖胺或UDP-N-乙酰基岩藻糖胺供体转移到聚糖受体上的糖基转移酶。
术语“活化的单糖”、“核苷酸活化的糖”、“核苷酸-糖”、“活化的糖”、“核苷”或“核苷酸供体”在本文中可互换地使用并表示单糖的活化形式。活化的单糖的例子包括、但不限于UDP-N-乙酰葡糖胺(UDP-GlcNAc)、UDP-N-乙酰半乳糖胺(UDP-GalNAc)、UDP-N-乙酰甘露糖胺(UDP-ManNAc)、UDP-葡萄糖(UDP-Glc)、UDP-半乳糖(UDP-Gal)、GDP-甘露糖(GDP-Man)、UDP-葡糖醛酸、UDP-半乳糖醛酸、UDP-2-乙酰氨基-2,6-二脱氧--L-阿拉伯型-4-己酮糖、UDP-2-乙酰氨基-2,6-二脱氧--L-来苏-4-己酮糖、UDP-N-乙酰基-L-鼠李糖胺(UDP-L-RhaNAc或UDP-2-乙酰氨基-2,6-二脱氧-L-甘露糖)、dTDP-N-乙酰基岩藻糖胺、UDP-N-乙酰基岩藻糖胺(UDP-L-FucNAc或UDP-2-乙酰氨基-2,6-二脱氧-L-半乳糖)、UDP-N-乙酰基-L-纽莫糖胺(UDP-L-PneNAC或UDP-2-乙酰氨基-2,6-二脱氧-L-塔罗糖)、UDP-N-乙酰基胞壁酸、UDP-N-乙酰基-L-奎诺糖胺(UDP-L-QuiNAc或UDP-2-乙酰氨基-2,6-二脱氧-L-葡萄糖)、GDP-L-奎诺糖、CMP-唾液酸(CMP-Neu5Ac或CMP-N-乙酰神经氨酸)、CMP-N-羟乙酰神经氨酸(CMP-Neu5Gc)、CMP-Neu4Ac、CMP-Neu5Ac9N3、CMP-Neu4,5Ac2、CMP-Neu5,7Ac2、CMP-Neu5,9Ac2、CMP-Neu5,7(8,9)Ac2、GDP-岩藻糖(GDP-Fuc)、GDP-鼠李糖和UDP-木糖。核苷酸-糖在糖基化反应中充当糖基供体。糖基化反应是由糖基转移酶催化的反应。
本文中使用的术语“单糖”表示不可通过水解分解成更简单的糖的糖,其被分类为醛糖或酮醣,并且每个分子含有一个或多个羟基。单糖是仅含有一个简单糖的糖。单糖的例子包括己糖、D-吡喃型葡萄糖、D-呋喃型半乳糖、D-吡喃型半乳糖、L-吡喃型半乳糖、D-吡喃型甘露糖、D-吡喃型阿洛糖、L-吡喃型阿卓糖、D-吡喃型古洛糖、L-碘代吡喃糖、D-吡喃型塔罗糖、D-呋喃型核糖、D-吡喃型核糖、D-呋喃型阿拉伯糖、D-吡喃型阿拉伯糖、L-呋喃型阿拉伯糖、L-吡喃型阿拉伯糖、D-吡喃型木糖、D-吡喃型来苏糖、D-呋喃型赤藓糖、D-呋喃型苏糖、庚糖、L-甘油-D-甘露-吡喃型庚糖(LDmanHep)、D-甘油-D-甘露-吡喃型庚糖(DDmanHep)、6-脱氧-L-吡喃型阿卓糖、6-脱氧-D-吡喃型古洛糖、6-脱氧-D-吡喃型塔罗糖、6-脱氧-D-吡喃型半乳糖、6-脱氧-L-吡喃型半乳糖、6-脱氧-D-吡喃型甘露糖、6-脱氧-L-吡喃型甘露糖、6-脱氧-D-吡喃型葡萄糖、2-脱氧-D-阿拉伯型-己糖、2-脱氧-D-赤式-戊糖、2,6-二脱氧-D-阿拉伯型-吡喃型己糖、3,6-二脱氧-D-阿拉伯型-吡喃型己糖、3,6-二脱氧-L-阿拉伯型-吡喃型己糖、3,6-二脱氧-D-木式-吡喃型己糖、3,6-二脱氧-D-核式-吡喃型己糖、2,6-二脱氧-D-核式-吡喃型己糖、3,6-二脱氧-L-木式-吡喃型己糖、2-氨基-2-脱氧-D-吡喃型葡萄糖、2-氨基-2-脱氧-D-吡喃型半乳糖、2-氨基-2-脱氧-D-吡喃型甘露糖、2-氨基-2-脱氧-D-吡喃型阿洛糖、2-氨基-2-脱氧-L-吡喃型阿卓糖、2-氨基-2-脱氧-D-吡喃型古洛糖、2-氨基-2-脱氧-L-碘代吡喃糖、2-氨基-2-脱氧-D-吡喃型塔罗糖、2-乙酰氨基-2-脱氧-D-吡喃型葡萄糖、2-乙酰氨基-2-脱氧-D-吡喃型半乳糖、2-乙酰氨基-2-脱氧-D-吡喃型甘露糖、2-乙酰氨基-2-脱氧-D-吡喃型阿洛糖、2-乙酰氨基-2-脱氧-L-吡喃型阿卓糖、2-乙酰氨基-2-脱氧-D-吡喃型古洛糖、2-乙酰氨基-2-脱氧-L-碘代吡喃糖、2-乙酰氨基-2-脱氧-D-吡喃型塔罗糖、2-乙酰氨基-2,6-二脱氧-D-吡喃型半乳糖、2-乙酰氨基-2,6-二脱氧-L-吡喃型半乳糖、2-乙酰氨基-2,6-二脱氧-L-吡喃型甘露糖、2-乙酰氨基-2,6-二脱氧-D-吡喃型葡萄糖、2-乙酰氨基-2,6-二脱氧-L-吡喃型阿卓糖、2-乙酰氨基-2,6-二脱氧-D-吡喃型塔罗糖、D-吡喃葡萄糖醛酸、D-吡喃半乳糖醛酸、D-吡喃甘露糖醛酸、D-吡喃阿洛糖醛酸、L-吡喃阿卓糖醛酸、D-吡喃古洛糖醛酸、L-吡喃古洛糖醛酸、L-吡喃艾杜糖醛酸、D-吡喃塔罗糖醛酸、唾液酸、5-氨基-3,5-二脱氧-D-甘油-D-半乳-壬-2-酮糖酸、5-乙酰氨基-3,5-二脱氧-D-甘油-D-半乳-壬-2-酮糖酸、5-羟乙酰基酰氨基-3,5-二脱氧-D-甘油-D-半乳-壬-2-酮糖酸、赤藓糖醇、阿拉伯糖醇、木糖醇、核糖醇、葡糖醇、半乳糖醇、甘露醇、D-核式-己-2-酮吡喃糖、D-阿拉伯型-己-2-酮呋喃糖(D-呋喃型果糖)、D-阿拉伯型-己-2-酮吡喃糖、L-木式-己-2-酮吡喃糖、D-来苏-己-2-酮吡喃糖、D-苏式-戊-2-酮吡喃糖、D-阿卓式-庚-2-酮吡喃糖、3-C-(羟甲基)-D-呋喃型赤藓糖、2,4,6-三脱氧-2,4-二氨基-D-吡喃型葡萄糖、6-脱氧-3-O-甲基-D-葡萄糖、3-O-甲基-D-鼠李糖、2,6-二脱氧-3-甲基-D-核式-己糖、2-氨基-3-O-[(R)-1-羧基乙基]-2-脱氧-D-吡喃型葡萄糖、2-乙酰氨基-3-O-[(R)-羧基乙基]-2-脱氧-D-吡喃型葡萄糖、2-羟乙酰基酰氨基-3-O-[(R)-1-羧基乙基]-2-脱氧-D-吡喃型葡萄糖、3-脱氧-D-来苏-庚-2-酮吡喃糖酸(ulopyranosaric acid)、3-脱氧-D-甘露-辛-2-酮吡喃糖酸、3-脱氧-D-甘油-D-半乳-壬-2-酮吡喃糖酸、5,7-二氨基-3,5,7,9-四脱氧-L-甘油-L-甘露-壬-2-酮吡喃糖酸、5,7-二氨基-3,5,7,9-四脱氧-L-甘油-L-阿卓式-壬-2-酮吡喃糖酸、5,7-二氨基-3,5,7,9-四脱氧-D-甘油-D-半乳-壬-2-酮吡喃糖酸、5,7-二氨基-3,5,7,9-四脱氧-D-甘油-D-塔罗式-壬-2-酮吡喃糖酸、2-乙酰氨基-2,6-二脱氧--L-阿拉伯型-4-己酮糖、2-乙酰氨基-2,6-二脱氧--L-来苏-4-己酮糖、N-乙酰基-L-鼠李糖胺、N-乙酰基-D-岩藻糖胺、N-乙酰基-L-纽莫糖胺、N-乙酰基胞壁酸、N-乙酰基-L-奎诺糖胺、葡萄糖(Glc)、半乳糖(Gal)、N-乙酰葡糖胺(GlcNAc)、葡糖胺(Glcn)、甘露糖(Man)、木糖(Xyl)、N-乙酰甘露糖胺(ManNAc)、N-羟乙酰神经氨酸、N-乙酰半乳糖胺(GalNAc)、半乳糖胺(Galn)、岩藻糖(Fuc)、鼠李糖(Rha)、葡糖醛酸、葡糖酸、果糖(Fru)和多元醇。术语多元醇是指含有多个羟基的醇。例如,甘油、山梨醇或甘露醇。
本文中使用的术语“糖磷酸”表示被磷酸化的上面列出的单糖之一。糖磷酸的例子包括、但不限于葡萄糖-1-磷酸、葡萄糖-6-磷酸、葡萄糖-1,6-二磷酸、半乳糖-1-磷酸、果糖-6-磷酸、果糖-1,6-二磷酸、果糖-1-磷酸、葡糖胺-1-磷酸、葡糖胺-6-磷酸、N-乙酰葡糖胺-1-磷酸、甘露糖-1-磷酸、甘露糖-6-磷酸或岩藻糖-1-磷酸。这些糖磷酸中的一些但并非全部是用于产生活化的单糖的前体或中间体。
本文中使用的术语“二糖”表示含有两个简单糖(即单糖)的糖聚合物。这样的二糖含有优选地选自上文所用单糖列表的单糖。二糖的例子包括乳糖(Gal-b1,4-Glc)、乳糖-N-二糖(Gal-b1,3-GlcNAc)、N-乙酰基乳糖胺(Gal-b1,4-GlcNAc)、LacDiNAc(GalNAc-b1,4-GlcNAc)、N-乙酰基半乳糖胺基葡萄糖(GalNAc-b1,4-Glc)。
本文中使用的术语“唾液酸化的二糖”表示含有两个单糖的二糖,其中所述单糖之一是本文定义的唾液酸。唾液酸化的二糖的例子包括Neu5Ac-a2,3-Gal、Neu5Ac-a2,6-Gal和吡喃型岩藻糖基-(1-4)-N-羟乙酰基神经氨酸(Fuc-(1-4)-Neu5Gc)。
作为本文所使用的术语并且如现有技术中通常理解的,“寡糖”表示含有少量、通常3至10个(但本文使用3至20个)简单糖(即单糖)的糖聚合物。优选地,本文描述的寡糖含有选自上文所用列表的单糖。在本发明中使用的寡糖可以是直链结构或可以包括支链。两个糖单元之间的键(例如糖苷键、半乳糖苷键、葡萄糖苷键等)可以表示为例如1,4、1->4或(1-4),它们在本文中互换使用。例如,术语“Gal-b1,4-Glc”、“Gal-β1,4-Glc”、“b-Gal-(1->4)-Glc”、“β-Gal-(1->4)-Glc”、“Galβ1-4-Glc”、“Gal-b(1-4)-Glc”和“Gal-β(1-4)-Glc”具有相同的含义,即β-糖苷键将半乳糖(Gal)的碳-1与葡萄糖(Glc)的碳-4连接。每种单糖可以是环状形式(例如吡喃糖或呋喃糖形式)。各个单糖单元之间的连接可以包括α1->2、α1->3、α1->4、α1->6、α2->1、α2->3、α2->4、α2->6、β1->2、β1->3、β1->4、β1->6、β2->1、β2->3、β2->4和β2->6。寡糖可以含有α-和β-糖苷键或可以仅含有α-糖苷键或仅含有β-糖苷键。术语“多糖”表示由大量、通常超过20个经糖苷连接的单糖组成的化合物。
寡糖的例子包括、但不限于Lewis-型抗原寡糖,哺乳动物(包括人)乳寡糖、O-抗原、肠道细菌共同抗原(ECA)、在脂多糖(LPS)中存在的聚糖链、在荚膜多糖中存在的寡糖重复单位、肽聚糖(PG)、氨基糖和人ABO血型系统的抗原。
本文中使用的术语“聚糖受体”表示如本文中定义的单糖、二糖和寡糖。
本文中使用的“哺乳动物乳寡糖”表示寡糖,诸如但不限于3-岩藻糖基乳糖、2′-岩藻糖基乳糖、6-岩藻糖基乳糖、2’,3-二岩藻糖基乳糖、2’,2-二岩藻糖基乳糖、3,4-二岩藻糖基乳糖、6′-唾液酸基乳糖、3′-唾液酸基乳糖、3,6-二唾液酸基乳糖、6,6’-二唾液酸基乳糖、8,3-二唾液酸基乳糖、3,6-二唾液酸基乳糖-N-四糖、乳糖二岩藻四糖、乳糖-N-四糖、乳糖-N-新四糖、乳糖-N-岩藻五糖II、乳糖-N-岩藻五糖I、乳糖-N-岩藻五糖III、乳糖-N-岩藻五糖V、乳糖-N-岩藻五糖VI、唾液酸基乳糖-N-四糖c、唾液酸基乳糖-N-四糖b、唾液酸基乳糖-N-四糖a、乳糖-N-二岩藻六糖I、乳糖-N-二岩藻六糖II、乳糖-N-六糖、乳糖-N-新六糖、对-乳糖-N-六糖、单岩藻糖基单唾液酸基乳糖-N-四糖c、单岩藻糖基对-乳糖-N-六糖、单岩藻糖基乳糖-N-六糖III、异构的岩藻糖基化的乳糖-N-六糖III、异构的岩藻糖基化的乳糖-N-六糖I、唾液酸基乳糖-N-六糖、唾液酸基乳糖-N-新六糖II、二岩藻糖基-对-乳糖-N-六糖、二岩藻糖基乳糖-N-六糖、二岩藻糖基乳糖-N-六糖a、二岩藻糖基乳糖-N-六糖c、半乳糖基化的壳聚糖、岩藻糖基化的寡糖、中性寡糖和/或唾液酸化的寡糖。
如本文中使用的并且如现有技术中通常理解的,“岩藻糖基化的寡糖”是携带岩藻糖残基的寡糖。实例包括2'-岩藻糖基乳糖(2’FL)、3-岩藻糖基乳糖(3FL)、4-岩藻糖基乳糖(4FL)、6-岩藻糖基乳糖(6FL)、二岩藻糖基乳糖(diFL)、乳糖二岩藻四糖(LDFT)、乳糖-N-岩藻五糖I(LNF I)、乳糖-N-岩藻五糖II(LNF II)、乳糖-N-岩藻五糖III(LNF III)、乳糖-N-岩藻五糖V(LNF V)、乳糖-N-岩藻五糖VI(LNF VI)、乳糖-N-新岩藻五糖I、乳糖-N-二岩藻六糖I(LDFH I)、乳糖-N-二岩藻六糖II(LDFH II)、单岩藻糖基乳糖-N-六糖III(MFLNH III)、二岩藻糖基乳糖-N-六糖(DFLNHa)、二岩藻糖基-乳糖-N-新六糖。
本文中使用的“唾液酸化的寡糖”应当理解为含有带负电荷的唾液酸的寡糖,即具有唾液酸残基的寡糖。它具有酸性性质。一些例子是3-SL(3′-唾液酸基乳糖或3’SL或Neu5Ac-a2,3-Gal-b1,4-Glc)、3'-唾液酸基乳糖胺、6-SL(6′-唾液酸基乳糖或6’SL或Neu5Ac-a2,6-Gal-b1,4-Glc)、3,6-二唾液酸基乳糖(Neu5Ac-a2,3-(Neu5Ac-a2,6)-Gal-b1,4-Glc)、6,6’-二唾液酸基乳糖(Neu5Ac-a2,6-Gal-b1,4-(Neu5Ac-a2,6)-Glc)、8,3-二唾液酸基乳糖(Neu5Ac-a2,8-Neu5Ac-a2,3-Gal-b1,4-Glc)、6'-唾液酸基乳糖胺、包含6'-唾液酸基乳糖的寡糖、SGG己糖(Neu5Acα-2,3Galβ-1,3GalNacβ-1,3Galα-1,4Galβ-1,4Gal)、唾液酸化的四糖(Neu5Acα-2,3Galβ-1,4GlcNacβ-14GlcNAc)、戊糖LSTD(Neu5Acα-2,3Galβ-1,4GlcNacβ-1,3Galβ-1,4Glc)、唾液酸化的乳糖-N-三糖、唾液酸化的乳糖-N-四糖、唾液酸基乳糖-N-新四糖、单唾液酸基乳糖-N-六糖、二唾液酸基乳糖-N-六糖I、单唾液酸基乳糖-N-新六糖I、单唾液酸基乳糖-N-新六糖II、二唾液酸基乳糖-N-新六糖、二唾液酸基乳糖-N-四糖、二唾液酸基乳糖-N-六糖II、唾液酸基乳糖-N-四糖a、二唾液酸基乳糖-N-六糖I、唾液酸基乳糖-N-四糖b、3'-唾液酸基-3-岩藻糖基乳糖、二唾液酸单岩藻糖基乳糖-N-新六糖、单岩藻糖基单唾液酸基乳糖-N-八糖(唾液酸基Lea)、唾液酸基乳糖-N-岩藻六糖II、二唾液酸基乳糖-N-岩藻五糖II、单岩藻糖基二唾液酸基乳糖-N-四糖和带有一个或几个唾液酸残基的寡糖,包括、但不限于:选自GM3(3'唾液酸基乳糖、Neu5Acα-2,3Galβ-4Glc)的神经节苷脂的寡糖部分,和包含GM3基序的寡糖、GD3 Neu5Acα-2,8Neu5Acα-2,3Galβ-1,4GlcGT3(Neu5Acα-2,8Neu5Acα-2,8Neu5Acα-2,3Galβ-1,4Glc) ; GM2GalNAcβ-1,4(Neu5Acα-2,3)Galβ-1,4Glc 、 GM1Galβ-1,3GalNAcβ-1,4(Neu5Acα-2,3)Galβ-1,4Glc 、 GD1aNeu5Acα-2,3Galβ-1,3GalNAcβ-1,4(Neu5Acα-2,3)Galβ-1,4Glc 、 GT1aNeu5Acα-2,8Neu5Acα-2,3Galβ-1,3GalNAcβ-1,4(Neu5Acα-2,3)Galβ-1,4Glc、GD2GalNAcβ-1,4(Neu5Acα-2,8Neu5Acα2,3)Galβ-1,4Glc、GT2GalNAcβ-1,4(Neu5Acα-2,8Neu5Acα-2,8Neu5Acα2,3)Galβ-1,4Glc、GD1b、Galβ-1,3GalNAcβ-1,4(Neu5Acα-2,8Neu5Acα2,3)Galβ-1,4Glc、GT1bNeu5Acα-2,3Galβ-1,3GalNAcβ-1,4(Neu5Acα-2,8Neu5Acα2,3)Galβ-1,4Glc、GQ1bNeu5Acα-2,8Neu5Acα-2,3Galβ-1,3GalNAc β-1,4(Neu5Acα-2,8Neu5Acα2,3)Galβ-1,4Glc 、 GT1cGalβ-1,3GalNAcβ-1,4(Neu5Acα-2,8Neu5Acα-2,8Neu5Acα2,3)Galβ-1,4Glc、GQ1cNeu5Acα-2,3Galβ-1,3GalNAc β-1,4(Neu5Acα-2,8Neu5Acα-2,8Neu5Acα2,3)Galβ-1,4Glc 、 GP1cNeu5Acα-2,8Neu5Acα-2,3Galβ-1,3GalNAc β-1,4(Neu5Acα-2,8Neu5Acα-2,8Neu5Acα2,3)Galβ-1,4Glc、 GD1aNeu5Acα-2,3Galβ-1,3(Neu5Acα-2,6)GalNAcβ-1,4Galβ-1,4Glc、岩藻糖基-GM1Fucα-1,2Galβ-1,3GalNAcβ-1,4(Neu5Acα-2,3)Galβ-1,4Glc;它们都可以扩展到通过使上述寡糖部分与神经酰胺反应或在神经酰胺上合成上述寡糖来产生相应的神经节苷脂。
如本文中使用的并且如现有技术中通常理解的,“中性寡糖”或“不带电荷的寡糖”是不具有源自羧酸基团的负电荷的寡糖。这样的中性寡糖的例子是2'-岩藻糖基乳糖(2’FL)、3-岩藻糖基乳糖(3FL)、2',3-二岩藻糖基乳糖(diFL)、乳糖-N-三糖II、乳糖-N-四糖、乳糖-N-新四糖、乳糖-N-岩藻五糖I、乳糖-N-新岩藻五糖I、乳糖-N-岩藻五糖II、乳糖-N-岩藻五糖III、乳糖-N-岩藻五糖V、乳糖-N-岩藻五糖VI、乳糖-N-新岩藻五糖V、乳糖-N-二岩藻六糖I、乳糖-N-二岩藻六糖II、6'-半乳糖基乳糖、3'-半乳糖基乳糖、乳糖-N-六糖、乳糖-N-新六糖、对-乳糖-N-六糖、对-乳糖-N-新六糖、二岩藻糖基-乳糖-N-六糖和二岩藻糖基-乳糖-N-新六糖。
哺乳动物乳寡糖包含存在于在哺乳期间的任何阶段所见乳中的寡糖,包括来自人和哺乳动物的初乳,所述哺乳动物包括、但不限于:牛(欧洲牛(Bos Taurus))、绵羊(绵羊(Ovis aries))、山羊(家山羊(Capra aegagrus hircus))、双峰骆驼(双峰驼(Camelusbactrianus))、马(欧洲野马(Equus ferus caballus))、猪(野猪(Sus scropha))、犬(家犬(Canis lupus familiaris))、虾夷棕熊(ezo brown bears)(日本棕熊(Ursus arctosyesoensis))、北极熊(海熊(Ursus maritimus))、日本黑熊(日本黑熊(Ursus thibetanusjaponicus))、条纹臭鼬(条纹臭鼬(Mephitis mephitis))、冠海豹(冠海豹(Cystophoracristata))、亚洲象(亚洲象(Elephas maximus))、非洲象(非洲象(Loxodontaafricana))、巨食蚁兽(大食蚁兽(Myrmecophaga tridactyla))、瓶鼻海豚(瓶鼻海豚(Tursiops truncates))、北方小须鲸(小须鲸(Balaenoptera acutorostrata))、尤金袋鼠(尤金袋鼠(Macropus eugenii))、红袋鼠(红袋鼠(Macropus rufus))、刷尾负鼠(帚尾袋貂(Trichosurus Vulpecula))、考拉(考拉(Phascolarctos cinereus))、东袋鼬(东袋鼬(Dasyurus viverrinus))、鸭嘴兽(鸭嘴兽(Ornithorhynchus anatinus))。
本文中使用的术语“Lewis型抗原”包含下述寡糖:H1抗原,其为Fucα1-2Galβ1-3GlcNAc或缩写2'FLNB;Lewisa,其为三糖Galβ1-3[Fucα1-4]GlcNAc或缩写4-FLNB;Lewisb,其为四糖Fucα1-2Galβ1-3[Fucα1-4]GlcNAc或缩写DiF-LNB;唾液酸基Lewisa,其为5-乙酰基神经氨酰基-(2-3)-半乳糖基-(1-3)-(吡喃型岩藻糖基-(1-4))-N-乙酰葡糖胺或缩写Neu5Acα2-3Galβ1-3[Fucα1-4]GlcNAc;H2抗原,其为Fucα1-2Galβ1-4GlcNAc或另外称作2'岩藻糖基-N-乙酰基-乳糖胺,缩写2'FLacNAc;Lewisx,其为三糖Galβ1-4[Fucα1-3]GlcNAc,或另外称作3-岩藻糖基-N-乙酰基-乳糖胺,缩写3-FLacNAc;Lewisy,其为四糖Fucα1-2Galβ1-4[Fucα1-3]GlcNAc;和唾液酸基Lewisx,其为5-乙酰基神经氨酰基-(2-3)-半乳糖基-(1-4)-(吡喃型岩藻糖基-(1-3))-N-乙酰葡糖胺或缩写Neu5Acα2-3Galβ1-4[Fucα1-3]GlcNAc。
本文中使用的术语“O-抗原”表示革兰氏阴性细菌的表面脂多糖(LPS)的重复聚糖组分。术语“脂多糖”或“LPS”表示在革兰氏阴性细菌的外膜中发现的糖脂,其由脂质A、核心寡糖和O-抗原组成。术语“荚膜多糖”表示存在于细菌荚膜中的具有寡糖重复结构的长链多糖,所述荚膜是位于细胞包膜外部的多糖层。术语“肽聚糖”或“胞壁质”表示在大多数细菌的细胞壁中的必需结构元件,其由糖和氨基酸组成,其中所述糖组分由β-1,4连接的GlcNAc和N-乙酰基胞壁酸的交替残基组成。本文中使用的术语“氨基-糖”表示其中羟基已经被胺基替换的糖分子。本文中使用的人ABO血型系统的抗原是寡糖。人ABO血型系统的这样的抗原不限于人结构。所述结构涉及存在于二糖核心结构上的A决定簇GalNAc-α1,3(Fuc-α1,2)-Gal-、B决定簇Gal-α1,3(Fuc-α1,2)-Gal-和H决定簇Fuc-α1,2-Gal-,所述二糖核心结构包含Gal-β1,3-GlcNAc、Gal-β1,4-GlcNAc、Gal-β1,3-GalNAc和Gal-β1,4-Glc。
如在本发明中所用的术语“LNT II”、“LNT-II”、“LN3”、“乳糖-N-三糖II”、“乳糖-N-三糖II”、“乳糖-N-三糖”、“乳糖-N-三糖”或“GlcNAcβ1-3Galβ1-4Glc”互换使用。
如在本发明中所用的术语“LNT”、“乳糖-N-四糖”、“乳糖-N-四糖”或“Galβ1-3GlcNAcβ1-3Galβ1-4Glc”互换使用。
如在本发明中所用的术语“LNnT”、“乳糖-N-新四糖”、“乳糖-N-新四糖”、“新-LNT”或“Galβ1-4GlcNAcβ1-3Galβ1-4Glc”互换使用。
如在本发明中所用的术语“LSTa”、“LS-四糖a”、“唾液酸基-乳糖-N-四糖a”、“唾液酸基乳糖-N-四糖a”或“Neu5Ac-a2,3-Gal-b1,3-GlcNAc-b1,3-Gal-b1,4-Glc”互换使用。
如在本发明中所用的术语“LSTb”、“LS-四糖b”、“唾液酸基-乳糖-N-四糖b”、“唾液酸基乳糖-N-四糖b”或“Gal-b1,3-(Neu5Ac-a2,6)-GlcNAc-b1,3-Gal-b1,4-Glc”互换使用。
如在本发明中所用的术语“LSTc”、“LS-四糖c”、“唾液酸基-乳糖-N-四糖c”、“唾液酸基乳糖-N-四糖c”、“唾液酸基乳糖-N-新四糖c”或“Neu5Ac-a2,6-Gal-b1,4-GlcNAc-b1,3-Gal-b1,4-Glc”互换使用。
如在本发明中所用的术语“LSTd”、“LS-四糖d”、“唾液酸基-乳糖-N-四糖d”、“唾液酸基乳糖-N-四糖d”、“唾液酸基乳糖-N-新四糖d”或“Neu5Ac-a2,3-Gal-b1,4-GlcNAc-b1,3-Gal-b1,4-Glc”互换使用。
在本公开内容的上下文中,术语“为了产生唾液酸化的二糖和/或寡糖而遗传修饰的细胞”或“为了产生唾液酸化的二糖和/或寡糖而代谢工程改造的细胞”表示在遗传上操纵成包含与以下任何一种或多种组合的至少一种唾液酸转移酶的微生物细胞:i)编码所述唾液酸化的二糖和/或寡糖的合成所必需的糖基转移酶的基因,ii)产生适合被所述糖基转移酶转移至碳水化合物前体的核苷酸供体的生物合成途径,和/或iii)产生前体的生物合成途径或将前体从培养基中内化进细胞中的机制,其中所述前体被糖基化以产生唾液酸化的二糖和/或寡糖。
本文中使用的术语“用于产生唾液酸化的二糖和/或寡糖的途径”是由参与如本文中定义的唾液酸化的二糖和/或寡糖的合成的酶和它们的相应基因组成的生化途径。所述用于产生唾液酸化的二糖和/或寡糖的途径包含至少一种唾液酸转移酶。此外,所述用于产生唾液酸化的二糖和/或寡糖的途径可以包括但不限于在核苷酸活化的糖的合成和所述核苷酸活化的糖转移至受体以产生本发明的唾液酸化的二糖和/或寡糖中涉及的途径。这样的途径的例子包括但不限于岩藻糖基化、唾液酸化、半乳糖基化、N-乙酰葡糖胺基化、N-乙酰基半乳糖基化、甘露糖基化、N-乙酰甘露糖胺基化途径。
本文中使用的“岩藻糖基化途径”是包含与产生α1,2、α1,3、α1,4和/或α1,6岩藻糖基化的寡糖的岩藻糖基转移酶组合的选自以下列表的酶和它们的相应基因中的至少一种的生化途径,所述列表包含甘露糖-6-磷酸异构酶、磷酸甘露糖变位酶、甘露糖-1-磷酸鸟苷酰基转移酶、GDP-甘露糖4,6-脱水酶、GDP-L-岩藻糖合酶、岩藻糖通透酶、岩藻糖激酶、岩藻糖-1-磷酸鸟苷酰基转移酶、L-岩藻糖激酶/GDP-岩藻糖焦磷酸化酶。
“唾液酸化途径”是包含与产生α2,3、α2,6和/或α2,8唾液酸化的寡糖的唾液酸转移酶组合的选自以下列表的酶和它们的相应基因中的至少一种的生化途径,所述列表包含N-酰基葡糖胺2-差向异构酶、UDP-N-乙酰葡糖胺2-差向异构酶、N-乙酰甘露糖胺-6-磷酸2-差向异构酶、UDP-GlcNAc 2-差向异构酶/激酶水解、N-酰基神经氨酸-9-磷酸合成酶、磷酸酶、N-乙酰神经氨酸合酶和N-酰基神经氨酸胞苷酰基转移酶。
本文中使用的“半乳糖基化途径”是包含与产生半乳糖基化的化合物的半乳糖基转移酶组合的选自以下列表的酶和它们的相应基因中的至少一种的生化途径,所述列表包含半乳糖-1-差向异构酶、半乳糖激酶、葡糖激酶、半乳糖-1-磷酸尿苷酰基转移酶、UDP-葡萄糖4-差向异构酶、葡萄糖-1-磷酸尿苷酰基转移酶、磷酸葡萄糖变位酶,所述半乳糖基化的化合物包含在所述单糖、二糖或寡糖的2、3、4和6-羟基中的任何一个或多个上具有α或β结合的半乳糖的单糖、二糖或寡糖。
本文中使用的“N-乙酰葡糖胺基化途径”是包含与产生GlcNAc修饰的化合物的糖基转移酶组合的选自以下列表的酶和它们的相应基因中的至少一种的生化途径,所述列表包含L-谷氨酰胺-D-果糖-6-磷酸氨基转移酶、N-乙酰葡糖胺-6-磷酸脱乙酰酶、磷酸葡糖胺变位酶、N-乙酰葡糖胺-1-磷酸尿苷酰基转移酶/葡糖胺-1-磷酸乙酰基转移酶,所述GlcNAc修饰的化合物包含在单糖、二糖或寡糖的3、4和6-羟基中的任何一个或多个上具有α或β结合的N-乙酰葡糖胺(GlcNAc)的单糖、二糖或寡糖。
本文中使用的“N-乙酰半乳糖胺基化途径”是包含与产生GalNAc修饰的化合物的糖基转移酶组合的选自以下列表的酶和它们的相应基因中的至少一种的生化途径,所述列表包含L-谷氨酰胺-D-果糖-6-磷酸氨基转移酶、磷酸葡糖胺变位酶、N-乙酰葡糖胺1-磷酸尿苷酰基转移酶、葡糖胺-1-磷酸乙酰基转移酶、UDP-N-乙酰葡糖胺4-差向异构酶、UDP-葡萄糖4-差向异构酶、N-乙酰半乳糖胺激酶和UDP-GalNAc焦磷酸化酶,所述GalNAc修饰的化合物包含在单糖、二糖或寡糖上具有α或β结合的N-乙酰半乳糖胺的单糖、二糖或寡糖。
本文中使用的“甘露糖基化途径”是包含与产生甘露糖基化的化合物的糖基转移酶组合的选自以下列表的酶和它们的相应基因中的至少一种的生化途径,所述列表包含甘露糖-6-磷酸异构酶、磷酸甘露糖变位酶和甘露糖-1-磷酸鸟苷酰基转移酶,所述甘露糖基化的化合物包含在单糖、二糖或寡糖上具有α或β结合的甘露糖的单糖、二糖或寡糖。
本文中使用的“N-乙酰甘露糖胺基化途径”是包含与产生ManNAc修饰的化合物的糖基转移酶组合的选自以下列表的酶和它们的相应基因中的至少一种的生化途径,所述列表包含L-谷氨酰胺-D-果糖-6-磷酸氨基转移酶、葡糖胺-6-磷酸脱氨酶、磷酸葡糖胺变位酶、N-乙酰葡糖胺-6-磷酸脱乙酰酶、葡糖胺6-磷酸N-乙酰基转移酶、N-乙酰葡糖胺-1-磷酸尿苷酰基转移酶、葡糖胺-1-磷酸乙酰基转移酶、葡糖胺-1-磷酸乙酰基转移酶、UDP-GlcNAc2-差向异构酶和ManNAc激酶,所述ManNAc修饰的化合物包含在单糖、二糖或寡糖上具有α或β结合的N-乙酰甘露糖胺的单糖、二糖或寡糖。
本文中使用的术语“唾液酸转运蛋白”表示能够将本文定义的唾液酸运输穿过细胞质和/或细胞壁(即进入细胞和/或从细胞出来)的蛋白。所述运输可以是输入到细胞中和/或从细胞中输出。
在本发明中使用的这样的唾液酸转运蛋白可以是由转运蛋白分类数据库(Transporter Classification Database)定义的转运体(porters)或P-P-键水解驱动的转运蛋白,该数据库由Saier实验室生物信息学小组(Saier Lab Bioinformatics Group)操作和管理,可通过www.tcdb.org获得。该转运蛋白分类数据库详细介绍了IUBMB批准的转运蛋白功能和系统分类综合系统,称为转运蛋白分类(TC)系统。这里描述的TCDB分类检索是基于在2019年6月17日发布的TCDB.org而定义。
转运体是利用载体介导的过程的单输送体、共输送体和反向输送体的统称(Saier等人,Nucleic Acids Res.44(2016)D372-D379)。它们属于电化学势驱动的转运蛋白,并且也被称作第二载体型促进剂。转运蛋白在以下情况下被包括在该分类中:当它们利用载体介导的过程来催化单向运输时,此时单一物质通过促进的扩散或在膜电位依赖性的过程中(如果溶质带电)进行运输;当它们利用载体介导的过程来催化反向运输时,此时两种或更多种物质在紧密偶联的过程中沿相反方向运输,不与化学渗透能以外的直接形式的能量偶联;和/或当它们利用载体介导的过程来催化共运输时,此时两种或更多种物种在紧密偶联的过程中以相同方向一起运输,不偶联到除次级载体的化学渗透能之外的直接形式的能量(Forrest等人,Biochim.Biophys.Acta 1807(2011)167-188)。这些系统通常是立体特异性的。溶质:溶质反向运输是次级载体的特有特征。转运体和酶的动态关联产生功能性膜运输代谢物(metabolons),其将通常从细胞外区室获得的底物直接引导到其细胞代谢中(Moraes和Reithmeier,Biochim.Biophys.Acta 1818(2012),2687-2706)。通过该转运体系统运输的溶质包括、但不限于阳离子、有机阴离子、无机阴离子、核苷、氨基酸、多元醇、磷酸化的糖酵解中间体、渗透剂、铁结合物。
如果转运蛋白水解无机焦磷酸盐、ATP或其它核苷三磷酸的二磷酸键,以驱动一种或多种溶质的主动摄取和/或挤出,则所述转运蛋白被包括在P-P键水解驱动的转运蛋白类别中(Saier等人,Nucleic Acids Res.44(2016)D372-D379)。所述转运蛋白可能会或不会被瞬时磷酸化,但底物不会被磷酸化。通过P-P键水解驱动的转运蛋白类别转运的底物包括、但不限于阳离子、重金属、β-葡聚糖、UDP-葡萄糖、脂多糖、磷壁酸、唾液酸。
术语“使流出”是指引导溶质跨细胞质膜和/或细胞壁运输的活性。所述运输可以通过引入本发明中描述的转运蛋白和/或增加其表达来实现。术语“增强的流出”是指改善溶质跨细胞质膜和/或细胞壁的运输活性。所述运输可以通过引入本发明所述的转运蛋白和/或增加其表达来增强。转运蛋白的“表达”被定义为编码所述转运蛋白的基因的“过表达”(在所述基因是内源基因的情况下)或“表达”(在编码所述转运蛋白的基因是在野生型菌株中不存在的异源基因的情况下)。
术语“乙酰辅酶A合成酶”、“acs”、“AcCoA合成酶”、“乙酰--CoA连接酶”、“酰基活化酶”和“yfaC”互换使用并表示在ATP依赖性的反应中催化乙酸盐转化成乙酰基-辅酶A(AcCoA)的酶。
术语“丙酮酸脱氢酶”、“丙酮酸氧化酶”、“POX”、“poxB”和“丙酮酸:泛醌-8氧化还原酶”互换使用并表示催化丙酮酸的氧化脱羧以产生乙酸盐和CO2的酶。
术语“乳酸脱氢酶”、“D-乳酸脱氢酶”、“ldhA”、“hslI”、“htpH”、“D-LDH”、“发酵乳酸脱氢酶”和“D特异性的2-羟酸脱氢酶”互换使用并表示催化乳酸转化成丙酮酸并由此产生NADH的酶。
本文中使用的术语“细胞生产指数(CPI)”表示将细胞产生的产物的质量除以在培养物或培殖物中产生的细胞的质量。
术语“纯化的”表示实质上或基本上不含有干扰生物分子活性的组分的物质。对于细胞、糖、核酸和多肽,术语“纯化的”表示实质上或基本上不含有在该物质的天然状态下发现的通常伴随该物质的组分的物质。通常,本发明的纯化的糖、寡糖、蛋白或核酸是至少约50%、55%、60%、65%、70%、75%、80%或85%纯的,通常至少约90%、91%、92%、93%、94%、95%、96%、97%、98%或99%纯的,这通过银染凝胶上的条带强度或其它确定纯度的方法测量。通过本领域众所周知的多种方法,诸如蛋白或核酸样品的聚丙烯酰胺凝胶电泳,随后在染色后可视化,可以指示纯度或同质性。出于某些目的,将需要高分辨率并使用HPLC或类似的纯化方法。对于二糖和寡糖,使用诸如但不限于薄层色谱法、气相色谱法、NMR、HPLC、毛细管电泳或质谱法的方法,可以测定纯度。
术语“培养物”和“发酵物”互换使用并表示在其中培养或发酵细胞的培养基、细胞本身、以及由细胞在整个培养液中(即,在细胞内部(细胞内地)以及在细胞外部(细胞外地))产生的唾液酸化的二糖和/或寡糖。
术语“反应器”表示充满培养物的容器。反应器的例子包括但不限于微流控装置、孔板、试管、摇瓶、发酵罐、生物反应器、加工容器、细胞培养培养箱、CO2培养箱。
本文中使用的术语“前体”表示由细胞摄取或合成以特异性地产生根据本发明的唾液酸化的二糖和/或寡糖的物质。在这个意义上,前体可以是本文定义的受体,但也可以是另一种物质、代谢物,其首先在细胞内被修饰作为唾液酸化的二糖和/或寡糖的生化合成途径的一部分。本文中使用的术语“前体”还应理解为参与化学或酶促反应以产生另一种化合物(如例如本文中定义的中间体或受体)作为唾液酸化的二糖和/或寡糖的代谢途径的一部分的化学化合物。本文中使用的术语“前体”还应理解为供体,其被糖基转移酶用来用糖苷键中的糖部分修饰本文定义的受体,作为唾液酸化的二糖和/或寡糖的代谢途径的一部分。这样的前体的例子包括如本文中定义的受体和/或二羟基丙酮、葡糖胺、N-乙酰葡糖胺、N-乙酰甘露糖胺、半乳糖胺、N-乙酰半乳糖胺、半乳糖基乳糖、磷酸化的糖如例如但不限于葡萄糖-1-磷酸、半乳糖-1-磷酸、葡萄糖-6-磷酸、果糖-6-磷酸、果糖-1,6-二磷酸、甘露糖-6-磷酸、甘露糖-1-磷酸、甘油-3-磷酸、甘油醛-3-磷酸、二羟基丙酮-磷酸、葡糖胺-6-磷酸、N-乙酰葡糖胺-6-磷酸、N-乙酰甘露糖胺-6-磷酸、N-乙酰葡糖胺-1-磷酸、N-乙酰神经氨酸-9-磷酸和如本文中定义的核苷酸活化的糖如例如UDP-葡萄糖、UDP-半乳糖、UDP-N-乙酰葡糖胺、CMP-唾液酸、GDP-甘露糖、GDP-4-脱氢-6-脱氧-α-D-甘露糖、GDP-岩藻糖。
任选地,细胞被转化以包含和表达至少一种编码蛋白的核酸序列,所述蛋白选自乳糖转运蛋白、岩藻糖转运蛋白、核苷酸活化的糖的转运蛋白,其中所述转运蛋白内化在培养基中添加的前体用于合成本发明的唾液酸化的二糖和/或寡糖。
本文中使用的术语“受体”表示可以被糖基转移酶修饰的单糖、二糖或寡糖。这样的受体的例子包括葡萄糖、半乳糖、果糖、甘油、唾液酸、岩藻糖、甘露糖、麦芽糖、蔗糖、乳糖、乳糖-N-三糖、乳糖-N-四糖(LNT)、乳糖-N-新四糖(LNnT)、乳糖-N-五糖(LNP)、乳糖-N-新五糖、对乳糖-N-五糖、对乳糖-N-新五糖、乳糖-N-新(novo)五糖I、乳糖-N-六糖(LNH)、乳糖-N-新六糖(LNnH)、对乳糖-N-新六糖(pLNnH)、对乳糖-N-六糖(pLNH)、乳糖-N-七糖、乳糖-N-新七糖、对乳糖-N-新七糖、对乳糖-N-七糖、乳糖-N-八糖(LNO)、乳糖-N-新八糖、异乳糖-N-八糖、对乳糖-N-八糖、异乳糖-N-新八糖、新(novo)乳糖-N-新八糖、对乳糖-N-新八糖、异乳糖-N-九糖、新(novo)乳糖-N-九糖、乳糖-N-九糖、乳糖-N-十糖、异乳糖-N-十糖、新(novo)乳糖-N-十糖、乳糖-N-新十糖和含有1个或多个N-乙酰基乳糖胺单元和/或1个或多个乳糖-N-二糖单元或中间体以形成寡糖、其岩藻糖基化和唾液酸化形式。
发明详述
根据第一个实施方案,本发明提供了用于产生唾液酸化的二糖和/或寡糖的代谢工程改造的微生物细胞。在本文中,提供了包含用于产生唾液酸化的二糖和/或寡糖的途径的代谢工程改造的微生物细胞,其合成唾液酸,表达至少一种唾液酸转移酶,被修饰成具有完全地或部分地敲除的或功能更低的唾液酸分解代谢途径,并且被修饰用于内源性唾液酸转运蛋白的过表达和/或外源性、同源性和/或异源性唾液酸转运蛋白的表达。所述细胞优选地在所述唾液酸转移酶中的任一种的表达或活性方面被修饰。
根据第二个实施方案,本发明提供了由代谢工程改造的微生物细胞产生唾液酸化的二糖和/或寡糖的方法。所述方法包括以下步骤:
1)提供如本文描述的微生物细胞,和
2)在允许产生所述唾液酸化的二糖和/或寡糖的条件下培养所述细胞。
优选地,从如本文中解释的培养物中分离唾液酸化的二糖和/或寡糖。
在本发明的范围内,允许条件被理解为与物理或化学参数相关的条件,包括、但不限于温度、pH、压强、渗透压和产物/前体/受体浓度。
在一个特定实施方案中,允许条件可以包括30±20摄氏度的温度范围、2.0-10.0、优选7±3的pH范围。
本发明提供了用代谢工程改造的微生物细胞产生唾液酸化的二糖和/或寡糖的不同类型的细胞。
在本发明的方法和/或细胞的一个优选方面,用基因表达模块修饰代谢工程改造的细胞,其中来自所述表达模块中的任何一个的表达是组成型的或可调控的。
所述表达模块也被称作转录单元并且包含用于表达重组基因的多核苷酸,所述重组基因包括编码基因序列和可操作地连接至编码基因的适当的转录和/或翻译控制信号。所述控制信号包含启动子序列、非翻译区、核糖体结合位点、终止子序列。所述表达模块可以含有用于表达一种单个重组基因的元件,但也可以含有用于表达多个重组基因的元件,或者可以组织在操纵子结构中以整合表达两个或更多个重组基因。所述多核苷酸可以使用本领域众所周知的技术通过重组DNA技术产生。本领域技术人员众所周知的构建表达模块的方法包括例如体外重组DNA技术、合成技术和体内基因重组。参见,例如,在以下文献中描述的技术:Sambrook等人(2001)Molecular Cloning:a laboratory manual,第3版,ColdSpring Harbor Laboratory Press,CSH,New York或Current Protocols in MolecularBiology,John Wiley and Sons,N.Y.(1989和每年更新)。
根据本发明的一个优选方面,将所述细胞用一种或多种表达模块修饰。所述表达模块可以整合到所述细胞的基因组中或者可以在载体上呈递给所述细胞。所述载体可以以质粒、粘粒、噬菌体、脂质体或病毒的形式存在,其将被稳定地转化/转染到所述代谢工程改造的细胞中。这样的载体尤其包括染色体、附加型和病毒衍生的载体,例如,衍生自细菌质粒、细菌噬菌体、转座子、酵母附加体、插入元件、酵母染色体元件、病毒的载体和衍生自其组合的载体,诸如衍生自质粒和细菌噬菌体遗传元件的那些,诸如粘粒和噬菌粒。这些载体可以含有选择标志物,诸如但不限于抗生素标志物、营养缺陷型标志物、毒素-抗毒素标志物、RNA有义/反义标志物。所述表达系统构建体可以含有调控以及产生表达的控制区。通常,任何适合于在宿主中维持、增殖或表达多核苷酸和/或表达多肽的系统或载体都可以用于在这方面的表达。通过多种众所周知的和常规的技术(诸如、例如Sambrook等人所述的那些,参见上文)中的任一种,可以将适当的DNA序列插入表达系统中。对于重组生产,可以对细胞进行遗传工程改造以掺入本发明的表达系统或其部分或多核苷酸。通过在许多标准实验室手册中描述的方法,诸如Davis等人,Basic Methods in Molecular Biology,(1986)和Sambrook等人,1989(出处同上),可以将多核苷酸引入细胞中。
本文中使用的表达模块包含用于表达至少一个重组基因的多核苷酸。所述重组基因参与在所述唾液酸化的二糖和/或寡糖的合成中发挥作用的多肽的表达;或者所述重组基因与所述宿主细胞中不参与所述唾液酸化的二糖和/或寡糖的合成的其它途径连接。所述重组基因编码具有修饰的表达或活性的内源蛋白,优选地所述内源蛋白被过表达;或者所述重组基因编码异源蛋白,所述异源蛋白被异源地引入并在所述经修饰的细胞中表达,优选地过表达。所述内源蛋白在也表达异源蛋白的细胞中可以具有修饰的表达。
根据本发明的方法和/或细胞的一个方面,所述细胞被代谢工程改造成包含用于产生唾液酸化的二糖和/或寡糖的途径。在本发明的方法和/或细胞的一个优选的实施方案中,所述用于产生唾液酸化的二糖和/或寡糖的途径包含唾液酸化途径。在本发明的方法和/或细胞的一个更优选的实施方案中,所述唾液酸化途径包含至少一种唾液酸转移酶。在所述方法和/或细胞的一个优选的实施方案中,所述唾液酸转移酶选自包含以下各项的列表:α-2,3-唾液酸转移酶、α-2,6-唾液酸转移酶和α-2,8-唾液酸转移酶。在所述方法和/或细胞的另一个和/或另外的优选的实施方案中,所述细胞表达超过一种唾液酸转移酶,其合成如本文中定义的任何一种或多种唾液酸化的二糖和/或寡糖。根据本发明的方法和/或细胞的另一个更优选的实施方案,所述唾液酸化途径进一步包含N-酰基神经氨酸胞苷酰基转移酶。
根据本发明的方法和/或细胞,所述细胞合成如本文中定义的唾液酸。在本发明的方法和/或细胞的一个优选的实施方案中,所述细胞包含用于产生唾液酸的途径。在本发明的方法和/或细胞的一个更优选的实施方案中,所述用于产生唾液酸的途径包含选自以下列表的酶中的任何一种或多种,所述列表包含N-酰基葡糖胺2-差向异构酶、UDP-N-乙酰葡糖胺2-差向异构酶、N-乙酰甘露糖胺-6-磷酸2-差向异构酶、UDP-GlcNAc 2-差向异构酶/激酶水解、N-酰基神经氨酸-9-磷酸合成酶、磷酸酶、N-乙酰神经氨酸合酶和N-酰基神经氨酸胞苷酰基转移酶。
在本发明的方法和/或细胞的另一个和/或另外的优选的实施方案中,所述细胞使用合成的唾液酸来产生唾液酸化的二糖和/或寡糖。
在一个优选的实施方案中,所述细胞包含用于产生唾液酸化的二糖和/或寡糖的唾液酸化途径,其中所述细胞表达至少一种选自包含以下各项的列表的酶:N-酰基葡糖胺2-差向异构酶,例如其已知来自例如几个物种,包括卵形拟杆菌(Bacteroides ovatus)、大肠杆菌(E.coli)、智人(Homo sapiens)、褐家鼠(Rattus norvegicus);N-乙酰神经氨酸合酶,例如其已知来自例如脑膜炎奈瑟氏菌(Neisseria meningitidis)或空肠弯曲杆菌(Campylobacter jejuni);N-酰基神经氨酸胞苷酰基转移酶,例如其已知来自例如脑膜炎奈瑟氏菌(N.meningitidis);和唾液酸转移酶,包括α-2,3-唾液酸转移酶,α-2,6-唾液酸转移酶和/或α-2,8-唾液酸转移酶,其中所述酶如本文中定义。N-酰基-D-葡糖胺(GlcNAc)可以添加至所述细胞和/或可以通过在所述细胞中表达的酶或通过所述细胞的机制提供。这样的产生GlcNAc的细胞可以表达将GlcNAc-6-磷酸转化成GlcNAc的磷酸酶,如下述中的任何一种或多种:例如,大肠杆菌HAD样磷酸酶基因,包含aphA、Cof、HisB、OtsB、SurE、Yaed、YcjU、YedP、YfbT、YidA、YigB、YihX、YniC、YqaB、YrbL、AppA、Gph、SerB、YbhA、YbiV、YbjL、Yfb、YieH、YjgL、YjjG、YrfG和YbiU,来自恶臭假单胞菌(Pseudomonas putida)的PsMupP,来自酿酒酵母(S.cerevisiae)的ScDOG1和来自枯草芽孢杆菌(Bacillus subtilis)的BsAraL,如在WO18122225中描述。优选地,所述细胞被修饰以产生GlcNAc。更优选地,所述细胞被修饰以增强GlcNAc产生。所述修饰可以是选自下组的任何一种或多种,该组包括:葡糖胺-6-磷酸脱氨酶、N-乙酰葡糖胺-6-磷酸脱乙酰酶和/或N-乙酰基-D-葡糖胺激酶的敲除,以及L-谷氨酰胺-D-果糖-6-磷酸氨基转移酶和/或葡糖胺6-磷酸N-乙酰基转移酶的过表达。
在一个替代性的和/或另外的优选的实施方案中,所述细胞包含用于产生唾液酸化的二糖和/或寡糖的途径,其中所述细胞表达至少一种选自包含以下各项的列表的酶:UDP-N-乙酰葡糖胺2-差向异构酶,例如其已知来自例如几个物种,包括空肠弯曲杆菌、大肠杆菌、脑膜炎奈瑟氏菌、枯草芽孢杆菌、鼠柠檬酸杆菌(Citrobacter rodentium);N-乙酰神经氨酸合酶,例如其已知来自例如脑膜炎奈瑟氏菌或空肠弯曲杆菌;N-酰基神经氨酸胞苷酰基转移酶,例如其已知来自例如脑膜炎奈瑟氏菌;和唾液酸转移酶,包括α-2,3-唾液酸转移酶、α-2,6-唾液酸转移酶和/或α-2,8-唾液酸转移酶,其中所述酶如本文中定义。UDP-N-乙酰葡糖胺(UDP-GlcNAc)可以添加至所述细胞和/或可以通过在所述细胞中表达的酶或通过所述细胞的代谢提供。这样的产生UDP-GlcNAc的细胞可以表达将例如要添加至所述细胞的GlcNAc转化成UDP-GlcNAc的酶。这些酶可以是选自包含以下各项的列表的任何一种或多种酶:来自几个物种(包括智人、大肠杆菌)的N-乙酰基-D-葡糖胺激酶、N-乙酰葡糖胺-6-磷酸脱乙酰酶、磷酸葡糖胺变位酶和N-乙酰葡糖胺-1-磷酸尿苷酰基转移酶/葡糖胺-1-磷酸乙酰基转移酶。优选地,所述细胞被修饰以产生UDP-GlcNAc。更优选地,所述细胞被修饰以增强UDP-GlcNAc产生。所述修饰可以是选自下组的任何一种或多种,该组包括:N-乙酰葡糖胺-6-磷酸脱乙酰酶的敲除、L-谷氨酰胺-D-果糖-6-磷酸氨基转移酶的过表达、磷酸葡糖胺变位酶的过表达和N-乙酰葡糖胺-1-磷酸尿苷酰基转移酶/葡糖胺-1-磷酸乙酰基转移酶的过表达。
在一个替代性的和/或另外的优选的实施方案中,所述细胞包含用于产生唾液酸化的二糖和/或寡糖的途径,其中所述细胞表达至少一种选自包含以下各项的列表的酶:N-乙酰甘露糖胺-6-磷酸2-差向异构酶,例如其已知来自例如几个物种,包括大肠杆菌、流感嗜血菌、肠杆菌属种(Enterobacter sp.)、链霉菌属种(Streptomyces sp.);N-酰基神经氨酸-9-磷酸合成酶、N-酰基神经氨酸-9-磷酸酶,例如其已知来自例如趋磁假丝酵母种(Candidatus Magnetomorum sp.)HK-1或多形拟杆菌(Bacteroides thetaiotaomicron);N-乙酰神经氨酸合酶,例如其已知来自例如脑膜炎奈瑟氏菌或空肠弯曲杆菌;N-酰基神经氨酸胞苷酰基转移酶,例如其已知来自例如脑膜炎奈瑟氏菌;和唾液酸转移酶,包括α-2,3-唾液酸转移酶、α-2,6-唾液酸转移酶和/或α-2,8-唾液酸转移酶,其中所述酶如本文中定义。N-乙酰基-D-葡糖胺6-磷酸(GlcNAc-6P)可以添加至所述细胞和/或可以通过在所述细胞中表达的酶或通过所述细胞的代谢提供。这样的产生GlcNAc-6P的细胞可以表达将例如要添加至所述细胞的GlcN6P转化成GlcNAc-6P的酶。该酶可以是来自几个物种(包括酿酒酵母、乳酸克鲁维酵母(Kluyveromyces lactis)、智人)的葡糖胺6-磷酸N-乙酰基转移酶。优选地,所述细胞被修饰以产生GlcNAc-6P。更优选地,所述细胞被修饰以增强GlcNAc-6P产生。所述修饰可以是选自下组的任何一种或多种,该组包括:葡糖胺-6-磷酸脱氨酶、N-乙酰葡糖胺-6-磷酸脱乙酰酶的敲除和L-谷氨酰胺-D-果糖-6-磷酸氨基转移酶和/或葡糖胺6-磷酸N-乙酰基转移酶的过表达。
在一个替代性的和/或另外的优选的实施方案中,所述细胞包含用于产生唾液酸化的二糖和/或寡糖的途径,其中所述细胞表达至少一种选自包含以下各项的列表的酶:双功能的UDP-GlcNAc 2-差向异构酶/激酶,例如其已知来自例如几个物种,包括智人、褐家鼠和小家鼠(Mus musculus);N-酰基神经氨酸-9-磷酸合成酶、N-酰基神经氨酸-9-磷酸酶,例如其已知来自例如趋磁假丝酵母种HK-1或多形拟杆菌;N-乙酰神经氨酸合酶,例如其已知来自例如脑膜炎奈瑟氏菌或空肠弯曲杆菌;N-酰基神经氨酸胞苷酰基转移酶,例如其已知来自例如脑膜炎奈瑟氏菌;和唾液酸转移酶,包括α-2,3-唾液酸转移酶、α-2,6-唾液酸转移酶和/或α-2,8-唾液酸转移酶,其中所述酶如本文中定义。UDP-N-乙酰葡糖胺可以添加至所述细胞和/或可以通过在所述细胞中表达的酶或通过所述细胞的代谢提供。这样的产生UDP-GlcNAc的细胞可以表达将例如要添加至所述细胞的GlcNAc转化成UDP-GlcNAc的酶。这些酶可以是来自几个物种(包括智人、大肠杆菌)的N-乙酰基-D-葡糖胺激酶、N-乙酰葡糖胺-6-磷酸脱乙酰酶、磷酸葡糖胺变位酶和N-乙酰葡糖胺-1-磷酸尿苷酰基转移酶/葡糖胺-1-磷酸乙酰基转移酶。优选地,所述细胞被修饰以产生UDP-GlcNAc。更优选地,所述细胞被修饰以增强UDP-GlcNAc产生。所述修饰可以是选自下组的任何一种或多种,该组包括:N-乙酰葡糖胺-6-磷酸脱乙酰酶的敲除、L-谷氨酰胺-D-果糖-6-磷酸氨基转移酶的过表达、磷酸葡糖胺变位酶的过表达和N-乙酰葡糖胺-1-磷酸尿苷酰基转移酶/葡糖胺-1-磷酸乙酰基转移酶的过表达。
另外,或备选地,本文中使用的宿主细胞任选地被遗传工程改造以在所述细胞中输入受体,这通过能够在所述细胞中输入相应受体的转运蛋白的引入和/或过表达来实现。这样的转运蛋白是例如属于主要易化子超家族(MFS)、ATP-结合盒(ABC)转运蛋白家族或参与例如单糖、二糖和/或寡糖的摄取的PTS系统的膜蛋白。
另外,或备选地,本文中使用的宿主细胞任选地被遗传工程改造成在所述细胞中输入乳糖,这通过乳糖通透酶的引入和/或过表达来实现。所述乳糖通透酶例如由lacY基因或lac12基因编码。
根据本发明的方法和/或细胞,所述细胞被修饰成具有完全地或部分地敲除的或功能更低的唾液酸分解代谢途径。在所述方法和/或细胞的一个优选的实施方案中,所述细胞被修饰成具有任何一种或多种完全地或部分地敲除的基因,包含N-乙酰神经氨酸裂合酶、N-乙酰神经氨酸差向异构酶、N-乙酰神经氨酸激酶、N-乙酰葡糖胺-6-P脱乙酰酶和葡糖胺-6-P脱氨酶。在所述方法和/或细胞的另一个优选的实施方案中,所述细胞被修饰成具有在任何一种蛋白中的一种或多种突变,所述蛋白包括N-乙酰神经氨酸裂合酶、N-乙酰神经氨酸差向异构酶、N-乙酰神经氨酸激酶、N-乙酰葡糖胺-6-P脱乙酰酶和葡糖胺-6-P脱氨酶,其中所述一种或多种突变使得所述蛋白功能减弱或功能障碍。
根据本发明的方法和/或细胞,所述细胞表达唾液酸转运蛋白。所述唾液酸转运蛋白是具有修饰的表达的内源蛋白,优选地所述内源蛋白被过表达;或者所述唾液酸转运蛋白是外源性、同源性和/或异源性蛋白,其可以由所述细胞异源表达。然后异源表达的唾液酸转运蛋白将被引入并表达,优选地过表达。在另一个实施方案中,所述内源性唾液酸转运蛋白可以在也表达外源性、同源性和/或异源性唾液酸转运蛋白的细胞中具有修饰的表达。在另一个实施方案中,内源性唾液酸转运蛋白的修饰的表达包含映射在所述内源性唾液酸转运蛋白的相同操纵子中和/或共享共同表达控制序列的其它蛋白的修饰的表达。在另一个实施方案中,所述唾液酸转运蛋白与共享相同调控子的邻接蛋白一起表达。在另一个实施方案中,当所述唾液酸转运蛋白是内膜转运蛋白(复合物)时,所述唾液酸转运蛋白与一种或多种外膜转运蛋白一起表达。在一个替代实施方案中,当所述唾液酸转运蛋白是外膜转运蛋白时,所述唾液酸转运蛋白与一种或多种内膜蛋白一起表达。在一个替代实施方案中,所述唾液酸转运蛋白与一种或多种内唾液酸转运蛋白和/或一种或多种外唾液酸转运蛋白一起表达。根据本发明的另一个方面,编码唾液酸转运蛋白的多核苷酸适合于相应细胞或表达系统的密码子使用。
在本发明的方法和/或细胞的一个优选方面,所述唾液酸转运蛋白选自转运体和P-P-键水解驱动的转运蛋白的组。
在所述方法和/或细胞的一个优选方面,当所述唾液酸转运蛋白选自转运体的组时,所述唾液酸转运蛋白选自TCDB类别2.A.1.12、2.A.21.3和2.A.56.1的组。
在所述方法和/或细胞的一个优选方面,当所述唾液酸转运蛋白选自转运体的组时,所述唾液酸转运蛋白选自eggnog家族的组:1MU0F、1MUNB、1MVHH、1MWKH、1R4VK、1RJ8K、1RMH7、1RNAM、1RPTE、1RQFS、1RZ3Z、1SA02、1TPNU、1TPVE、1TQCK、1XTIW、1XU43、1Y733、1Y7P0、1YAT3、258Y6、25E9U、25SBT、25Y42、26G88、27G1B、2IX6M、2TQBC、2TQW5、36UQA、3788V、3F50Z、3WG4Q、3WP13、3WTAI、3WVF7、3X1B1、3XP7A、3ZJ4T、404JV、41EHH、4BDTU、4C594、4GX8Z、4GY09、4H21M、4H9KW、4H9WK、4HB5K、4IEK0、COG0477、COG0591、COG1593、COG2704、COG2814、COG3055、COG3090和COG4666。
在所述方法和/或细胞的另一个优选方面,当所述唾液酸转运蛋白选自转运体的组时,所述唾液酸转运蛋白选自PFAM列表:PF00083、PF00474、PF04290、PF06808、PF07690和PF11874。
在所述方法和/或细胞的另一个优选方面,当所述唾液酸转运蛋白选自转运体的组时,所述唾液酸转运蛋白选自interpro列表:IPR001734、IPR004681、IPR004742、IPR005828、IPR005829、IPR007387、IPR010656、IPR011701、IPR011851、IPR011853、IPR015915、IPR018212、IPR020846、IPR021814、IPR025966、IPR036259和IPR038377。
在所述方法和/或细胞的另一个优选方面,当所述唾液酸转运蛋白选自转运体的组时,所述唾液酸转运蛋白选自:具有SEQ ID NO 01的来自大肠杆菌的NanT,具有SEQ IDNO 02的来自小肠结肠炎耶尔森氏菌palearctica亚种血清型O:3(Yersiniaenterocolitica subsp.palearctica serotype O:3)的nanT,具有SEQ ID NO 03的来自布里纳氏布丘氏菌(Buttiauxella brennerae)ATCC 51605的nanT,具有SEQ ID NO 04的来自大肠杆菌KTE75的NanT,或具有SEQ ID NO 05的来自短吻鳄支原体(Mycoplasmaalligatoris)A21JP2的转运蛋白,具有SEQ ID NO 06的来自山羊支原体山羊亚种(M.capricolum subsp.capricolum)的转运蛋白,具有SEQ ID NO 07的来自金黄色葡萄球菌(Staphylococcus aureus)的转运蛋白,具有SEQ ID NO 08的来自孪生球菌属种(Gemella sp.)的转运蛋白,具有SEQ ID NO 09的来自艰难梭菌(Clostridioidesdifficile)ATCC 9689的转运蛋白,具有SEQ ID NO 10的来自罗氏消化链球菌(Peptostreptococcus russellii)的转运蛋白,具有SEQ ID NO 11的来自阻塞芽孢杆菌(Bacillus obstructivus)的转运蛋白,具有SEQ ID NO 12的来自金黄色葡萄球菌(S.aureus)(菌株MW2)的转运蛋白,具有SEQ ID NO 13的来自葡萄球菌属种(Staphylococcus sp.)HMSC070A03的转运蛋白,具有SEQ ID NO 14的来自鲸鲸杆菌(Cetobacterium ceti)的转运蛋白,具有SEQ ID NO 15的来自S.argensis的转运蛋白,具有SEQ ID NO 16的来自施氏葡萄球菌(S.schleiferi)的转运蛋白,具有SEQ ID NO 17的来自耳炎差异球菌(Alloiococcus otitis)ATCC 51267的转运蛋白,具有SEQ ID NO 18的来自蜥蜴纤细芽孢杆菌(Gracilibacillus dipsosauri)的转运蛋白,具有SEQ ID NO 19的来自费尔斯莫尔德乳杆菌(Lactobacillus versmoldensis)的转运蛋白,具有SEQ ID NO 20的来自乳杆菌属种(Lactobacillus sp.)LL6的转运蛋白,具有SEQ ID NO 21的来自Agrilactobacillus composti的转运蛋白,具有SEQ ID NO 22的来自卷曲乳杆菌(L.crispatus)的转运蛋白,具有SEQ ID NO 23的来自巴氏葡萄球菌(S.pasteuri)的转运蛋白,具有SEQ ID NO 24的来自唾液乳杆菌(L.salivarius)cp400的转运蛋白,具有SEQ IDNO 25的来自L.apodemi的转运蛋白,具有SEQ ID NO 26的来自月形单胞菌属种(Selenomonas sp.)口腔分类单元478的转运蛋白,具有SEQ ID NO 27的来自索氏梭菌(Paeniclostridium sordellii)的转运蛋白,具有SEQ ID NO 28的来自食甲基丁酸杆菌(Butyribacterium methylotrophicum)的转运蛋白,具有SEQ ID NO 29的来自假硬碱性卤杆菌(Alkalihalobacillus pseudofirmus)的转运蛋白,具有SEQ ID NO 30的来自缓症链球菌(Streptococcus mitis)(菌株B6)的转运蛋白,具有SEQ ID NO 31的来自绿色气球菌(Aerococcus viridans)的转运蛋白,具有SEQ ID NO 32的来自Anaerobiospirillumthomasii的转运蛋白,具有SEQ ID NO 33的来自溶血梭菌(Clostridium haemolyticum)NCTC 8350的转运蛋白,具有SEQ ID NO 34或SEQ ID NO 35的来自嗜热丁酸梭菌(C.thermobutyricum)的转运蛋白,具有SEQ ID NO 36的来自Romboutsia ilealis的转运蛋白,具有SEQ ID NO 37的来自单形巨单胞菌(Megamonas funiformis)YIT 11815的转运蛋白,具有SEQ ID NO 38的来自球形赖氨酸芽孢杆菌(Lysinibacillus sphaericus)的转运蛋白,具有SEQ ID NO 39的来自未培养的梭菌属种(Clostridium sp.)的转运蛋白,具有SEQ ID NO 40的来自平野梭菌(C.hiranonis)的转运蛋白,具有SEQ ID NO 41的来自C.niameyense的转运蛋白,具有SEQ ID NO 42的来自分节丝状菌SFB-土耳其种(Candidatus Arthromitus sp.SFB-turkey)的转运蛋白,具有SEQ ID NO 43的来自Suttonella ornithocola的siaT_5,具有SEQ ID NO 44的来自多杀巴斯德氏菌多杀亚种(Pasteurella multocida subsp.multocida)OH4807的转运蛋白,具有SEQ ID NO 45的来自P.skyensis的转运蛋白,具有SEQ ID NO 46的来自猫嗜血杆菌(Haemophilus felis)的转运蛋白,具有SEQ ID NO 47的来自变形菌纲(Gammaproteobacteria)细菌的转运蛋白,具有SEQ ID NO 48的来自Pasteurella mairii的转运蛋白,具有SEQ ID NO 49的来自产吲哚萨顿氏菌(Suttonella indologenes)的转运蛋白,具有SEQ ID NO 50的来自犬梭杆菌(Fusobacterium canifelinum)的转运蛋白,具有SEQ ID NO 51的来自变形梭杆菌(F.varium)的转运蛋白,具有SEQ ID NO 52的来自坏死梭杆菌(F.necrophorum)的转运蛋白,具有SEQ ID NO 53的来自人心杆菌(Cardiobacterium hominis)的转运蛋白,具有SEQID NO 54的来自伴放线放线杆菌(Aggregatibacter actinomycetemcomitans)RhAA1的转运蛋白,或具有SEQ ID NO 55的来自贝氏巴斯德氏菌(P.bettyae)CCUG 2042的转运蛋白,或SEQ ID NO 01、02、03、04、05、06、07、08、09、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54或55中的任一个的功能同系物、变体或衍生物,其分别与具有SEQ ID NO 01、02、03、04、05、06、07、08、09、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54或55的所述多肽中的任一种的全长序列具有至少80%总体序列同一性并且具有唾液酸转运蛋白活性。
在所述方法和/或细胞的一个进一步优选方面,当所述唾液酸转运蛋白选自转运体的组时,所述唾液酸转运蛋白选自以下转运体:具有SEQ ID NO 01的来自大肠杆菌的NanT,具有SEQ ID NO 02的来自小肠结肠炎耶尔森氏菌palearctica亚种血清型O:3的nanT,具有SEQ ID NO 03的来自布里纳氏布丘氏菌ATCC 51605的nanT,具有SEQ ID NO 04的来自大肠杆菌KTE75的NanT,具有SEQ ID NO 24的来自唾液乳杆菌cp400的转运蛋白,或具有SEQ ID NO 43的来自Suttonella ornithocola的siaT_5,或SEQ ID NO 01、02、03、04、24或43中的任一个的功能同系物、变体或衍生物,其分别与具有SEQ ID NO 01、02、03、04、24或43的所述优选多肽中的任一种的全长序列具有至少80%总体序列同一性并且具有唾液酸转运蛋白活性。
在所述方法和/或细胞的一个优选方面,当所述唾液酸转运蛋白选自P-P-键水解驱动的转运蛋白的组时,所述唾液酸转运蛋白选自TCDB类别3.A.1.5。
在所述方法和/或细胞的一个优选方面,当所述唾液酸转运蛋白选自P-P-键水解驱动的转运蛋白的组时,所述唾液酸转运蛋白选自eggnog家族的组:1MU8Z、1MUZH、1NU4K、1R4KB、1RNFB、1RS1R、1SKPD、1SMBI、1Y72G、1Y72H、1Y7EZ、1Y7FQ、COG0444、COG0601、COG0747、COG1173和COG4608。
在所述方法和/或细胞的另一个优选方面,当所述唾液酸转运蛋白选自P-P-键水解驱动的转运蛋白的组时,所述唾液酸转运蛋白选自PFAM列表:PF00005、PF00496、PF00528和PF08352。
在所述方法和/或细胞的另一个优选方面,当所述唾液酸转运蛋白选自P-P-键水解驱动的转运蛋白的组时,所述唾液酸转运蛋白选自interpro列表:IPR000515、IPR000914、IPR003439、IPR003593、IPR006311、IPR013563、IPR017871、IPR027417、IPR030678、IPR035906和IPR039424。
在所述方法和/或细胞的另一个优选方面,当所述唾液酸转运蛋白选自P-P-键水解驱动的转运蛋白的组时,所述唾液酸转运蛋白选自具有SEQ ID NO 56、57、58或59的来自副兔嗜血菌(Haemophilus paracuniculus)的ABC转运蛋白,或SEQ ID NO 56、57、58或59中的任一个的功能同系物、变体或衍生物,其分别与具有SEQ ID NO 56、57、58或59的多肽中的任一种的全长序列具有至少80%总体序列同一性并且具有唾液酸转运蛋白活性。
所述TCDB类别按照2019年6月17日发布的TCDB.org上的定义进行分类。所述eggnog家族按照2018年11月发布的eggnogdb 5.0.0上的定义进行分类。所述PFAM列表按照2018年9月发布的Pfam 32.0上的定义进行分类。所述interpro列表由2019年7月4日发布的InterPro 75.0定义。
如本文中使用的,其氨基酸序列与列出的唾液酸转运蛋白中的任一种的全长序列具有至少80%序列同一性的蛋白应理解为,所述序列与各种唾液酸转运蛋白的氨基酸序列的全长具有80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、91.50%、92.00%、92.50%、93.00%、93.50%、94.00%、94.50%、95.00%、95.50%、96.00%、96.50%、97.00%、97.50%、98.00%、98.50%、99.00%、99.50%、99.60%、99.70%、99.80%、99.90%序列同一性并且具有唾液酸转运蛋白活性。
这样的唾液酸转运蛋白的氨基酸序列可以是选自所附序列表的SEQ ID NO 01、02、03、04、05、06、07、08、09、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58或59的序列,或分别与SEQ ID NO 01、02、03、04、05、06、07、08、09、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58或59中的任一个的全长氨基酸序列具有至少80%序列同一性、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、91.50%、92.00%、92.50%、93.00%、93.50%、94.00%、94.50%、95.00%、95.50%、96.00%、96.50%、97.00%、97.50%、98.00%、98.50%、99.00%、99.50%、99.60%、99.70%、99.80%、99.90%序列同一性的氨基酸序列,并且具有唾液酸转运蛋白活性。
根据本发明的方法和/或细胞的另一个优选方面,所述唾液酸转运蛋白是参与唾液酸穿过细胞质膜的流入和/或流出(即进入细胞和/或从细胞出来)的转运蛋白。
根据本发明的方法和/或细胞的另一个优选方面,所述细胞表达超过一种唾液酸转运蛋白。
在一个更优选的替代实施方案中,当所述唾液酸转运蛋白是具有SEQ ID NO 56的来自副兔嗜血菌的ABC转运蛋白时,所述ABC转运蛋白与具有SEQ ID NO 57、58和59的来自副兔嗜血菌的ABC转运蛋白一起表达。
在一个更优选的替代实施方案中,当所述唾液酸转运蛋白是具有SEQ ID NO 57的来自副兔嗜血菌的ABC转运蛋白时,所述ABC转运蛋白与具有SEQ ID NO 56、58和59的来自副兔嗜血菌的ABC转运蛋白一起表达。
在一个更优选的替代实施方案中,当所述唾液酸转运蛋白是具有SEQ ID NO 58的来自副兔嗜血菌的ABC转运蛋白时,所述ABC转运蛋白与具有SEQ ID NO 56、57和59的来自副兔嗜血菌的ABC转运蛋白一起表达。
在一个更优选的替代实施方案中,当所述唾液酸转运蛋白是具有SEQ ID NO 59的来自副兔嗜血菌的ABC转运蛋白时,所述ABC转运蛋白与具有SEQ ID NO 56、57和58的来自副兔嗜血菌的ABC转运蛋白一起表达。
在本发明的方法和/或细胞的另一个方面,所述宿主细胞表达膜蛋白,其是参与化合物的跨细胞壁外膜运输的转运蛋白,这意味着进入细胞和/或从细胞出来。优选地,所述细胞被转化以包含至少一种编码蛋白的核酸序列,所述蛋白选自包括以下各项的组:乳糖转运蛋白、葡萄糖转运蛋白、半乳糖转运蛋白或核苷酸活化的糖的转运蛋白(如例如UDP-GlcNAc的转运蛋白)。
在本发明的方法和/或细胞的另一个和/或另外的其它方面,所述宿主细胞表达膜蛋白,其是参与唾液酸化的二糖和/或寡糖的跨细胞壁外膜运输的转运蛋白,这意味着从细胞出来。优选地,所述细胞被转化以包含至少一种编码膜转运蛋白的核酸序列,所述膜转运蛋白选自包括以下各项的组:铁结合物输出蛋白、主要易化子超家族(MFS)转运蛋白、ATP-结合盒(ABC)转运蛋白或糖流出转运蛋白。
根据本发明的方法和/或细胞的一个优选方面,>95%的由所述细胞合成的唾液酸被用于产生唾液酸化的二糖和/或寡糖。
根据本发明的方法和/或细胞的另一个优选方面,所述细胞能够合成N-乙酰甘露糖胺(ManNAc)、N-乙酰甘露糖胺-6-磷酸(ManNAc-6-磷酸)和/或磷酸烯醇丙酮酸(PEP)。
在一个优选的实施方案中,所述细胞包含用于产生唾液酸化的二糖和/或寡糖的途径,其包含用于产生ManNAc的途径。ManNAc可以通过在所述细胞中表达的酶或通过所述细胞的机制来提供。这样的产生ManNAc的细胞可以表达N-酰基葡糖胺2-差向异构酶,例如其已知来自例如几个物种,包括卵形拟杆菌、大肠杆菌、智人、褐家鼠,其将GlcNAc转化成ManNAc。备选地和/或另外,产生ManNAc的细胞可以表达UDP-N-乙酰葡糖胺2-差向异构酶,例如其已知来自例如几个物种,包括空肠弯曲杆菌、大肠杆菌、脑膜炎奈瑟氏菌、枯草芽孢杆菌、鼠柠檬酸杆菌,其将UDP-GlcNAc转化成ManNAc。GlcNAc和/或UDP-GlcNAc可以添加至所述细胞和/或通过在所述细胞中表达的酶或通过如本文描述的细胞的机制来提供。
在一个更优选的实施方案中,所述细胞被修饰以增强ManNAc产生。所述修饰可以是选自下组的任何一种或多种,该组包括:N-乙酰甘露糖胺激酶的敲除、N-乙酰神经氨酸裂合酶的过表达。
在另一个优选的实施方案中,所述细胞包含用于产生唾液酸化的二糖和/或寡糖的途径,其包含用于产生ManNAc-6-磷酸的途径。ManNAc-6-磷酸可以通过在所述细胞中表达的酶或通过所述细胞的机制来提供。这样的产生ManNAc-6-磷酸的细胞可以表达双功能的UDP-GlcNAc 2-差向异构酶/激酶,例如其已知来自例如几个物种,包括智人、褐家鼠和小家鼠,其将UDP-GlcNAc转化成ManNAc-6-磷酸。备选地和/或另外,所述产生ManNAc-6-磷酸的细胞可以表达N-乙酰甘露糖胺-6-磷酸2-差向异构酶,其将GlcNAc-6-磷酸转化成ManNAc-6-磷酸。UDP-GlcNAc和/或GlcNAc-6-磷酸可以添加至所述细胞和/或通过在所述细胞中表达的酶或通过如本文描述的细胞的机制来提供。在一个更优选的实施方案中,所述细胞被修饰以增强ManNAc-6-磷酸产生。所述修饰可以是选自下组的任何一种或多种,该组包括:N-乙酰葡糖胺-6-磷酸脱乙酰酶的过表达、N-乙酰基-D-葡糖胺激酶的过表达、磷酸葡糖胺变位酶的过表达、N-乙酰葡糖胺-1-磷酸尿苷酰基转移酶/葡糖胺-1-磷酸乙酰基转移酶的过表达。
在另一个优选的实施方案中,所述细胞包含用于产生唾液酸化的二糖和/或寡糖的途径,其包含用于产生磷酸烯醇丙酮酸(PEP)的途径。
在另一个优选的实施方案中,所述细胞包含用于产生唾液酸化的二糖和/或寡糖的途径,其包含用于增强PEP的产生和/或供应的任何一种或多种修饰。
在一个优选的实施方案中并且作为增强PEP产生和/或供应的手段,一种或多种PEP依赖性的糖转运磷酸转移酶系统被破坏,例如但不限于:1)N-乙酰基-D-葡糖胺Npi-磷酸转移酶(EC 2.7.1.193),其例如在大肠杆菌或芽孢杆菌属物种中由nagE基因(或簇nagABCD)编码,2)ManXYZ,其编码输入外源性己糖(甘露糖、葡萄糖、葡糖胺、果糖、2-脱氧葡萄糖、甘露糖胺、N-乙酰葡糖胺等)并将磷酸酯释放进细胞细胞质中的酶II Man复合物(甘露糖PTS通透酶、蛋白-Npi-磷酸组氨酸-D-甘露糖磷酸转移酶),3)葡萄糖特异性的PTS转运蛋白(例如由PtsG/Crr编码),其摄取葡萄糖并在细胞质中形成葡萄糖-6-磷酸,4)蔗糖特异性的PTS转运蛋白,其摄取蔗糖并在细胞质中形成蔗糖-6-磷酸,5)果糖特异性的PTS转运蛋白(例如由基因fruA和fruB编码,以及激酶fruK,其摄取果糖并在第一步中形成果糖-1-磷酸,并在第二步中形成果糖1,6-二磷酸,6)乳糖PTS转运蛋白(例如在干酪乳球菌(Lactococcus casei)中由lacE编码),其摄取乳糖并形成乳糖-6-磷酸,7)半乳糖醇特异性的PTS酶,其摄取半乳糖醇和/或山梨醇并分别形成半乳糖醇-1-磷酸或山梨醇-6-磷酸,8)甘露醇特异性的PTS酶,其摄取甘露醇和/或山梨醇并分别形成甘露醇-1-磷酸或山梨醇-6-磷酸,和9)海藻糖特异性的PTS酶,其摄取海藻糖并形成海藻糖-6-磷酸。
在另一个和/或另外的优选的实施方案中并且作为增强PEP产生和/或供应的手段,通过破坏PtsIH/Crr基因簇来破坏整个PTS系统。PtsI(酶I)是一种细胞质蛋白,其充当大肠杆菌K-12的磷酸烯醇丙酮酸:糖磷酸转移酶系统(PTS)的门户。PtsI是PTS的两种(PtsI和PtsH)糖非特异性蛋白组分之一,其与糖特异性的内膜通透酶一起实现磷酸转移级联,该级联导致多种碳水化合物底物的偶联磷酸化和运输。HPr(含组氨酸蛋白)是PTS的两种糖非特异性蛋白组分之一。它从磷酸化的酶I(PtsI-P)接受磷酰基基团,并然后将其转移到PTS的多种糖特异性酶(统称为酶II)中的任何一种的EIIA结构域。Crr或EIIAGlc在需要PtsH和PtsI的反应中被PEP磷酸化。
在另一个和/或另外的优选的实施方案中,通过对应的通透酶的引入和/或过表达进一步修饰细胞以补偿碳源的PTS系统的缺失。这些是例如通透酶或ABC转运蛋白,其包含但不限于:特异性地输入乳糖的转运蛋白,例如由来自大肠杆菌的LacY基因编码的转运蛋白;特异性地输入蔗糖的转运蛋白,例如由来自大肠杆菌的cscB基因编码的转运蛋白;特异性地输入葡萄糖的转运蛋白,例如由来自大肠杆菌的galP基因编码的转运蛋白;特异性地输入果糖的转运蛋白,例如由来自变异链球菌(Streptococcus mutans)的fruI基因编码的转运蛋白;或山梨醇/甘露醇ABC转运蛋白,诸如由球形红细菌(Rhodobacter sphaeroides)的SmoEFGK簇编码的转运蛋白;海藻糖/蔗糖/麦芽糖转运蛋白,诸如由苜蓿中华根瘤菌(Sinorhizobium meliloti)的基因簇ThuEFGK编码的转运蛋白;和N-乙酰葡糖胺/半乳糖/葡萄糖转运蛋白,诸如由奥奈达湖希瓦氏菌(Shewanella oneidensis)的NagP编码的转运蛋白。PTS缺失与替代性转运蛋白的过表达的组合的例子是:1)葡萄糖PTS系统(例如ptsG基因)的缺失,与葡萄糖通透酶(例如glcP的galP)的引入和/或过表达相组合;2)果糖PTS系统(例如fruB、fruA、fruK基因中的一种或多种)的缺失,与果糖通透酶(例如fruI)的引入和/或过表达相组合,3)乳糖PTS系统的缺失,与乳糖通透酶(例如LacY)的引入和/或过表达相组合,和/或4)蔗糖PTS系统的缺失,与蔗糖通透酶(例如cscB)的引入和/或过表达相组合。
在一个进一步优选的实施方案中,通过引入碳水化合物激酶,诸如葡糖激酶(EC2.7.1.1,EC 2.7.1.2,EC 2.7.1.63)、半乳糖激酶(EC 2.7.1.6)和/或果糖激酶(EC2.7.1.3,EC 2.7.1.4),所述细胞被修饰以补偿碳源的PTS系统的缺失。PTS缺失与替代性转运蛋白和激酶的过表达的组合的例子是:1)葡萄糖PTS系统(例如ptsG基因)的缺失,与葡萄糖通透酶(例如glcP的galP)的引入和/或过表达相组合,与葡糖激酶(例如glk)的引入和/或过表达相组合,和/或2)果糖PTS系统(例如fruB、fruA、fruK基因中的一种或多种)的缺失,与果糖通透酶(例如fruI)的引入和/或过表达相组合,与果糖激酶(例如frk或mak)的引入和/或过表达相组合。
在另一个和/或另外的优选的实施方案中并且作为增强PEP产生和/或供应的手段,通过以下列表中的任何一种或多种的引入或修饰来修饰所述细胞,所述列表包含磷酸烯醇丙酮酸合酶活性(EC:2.7.9.2,例如在大肠杆菌中由ppsA编码)、磷酸烯醇丙酮酸羧基激酶活性(EC 4.1.1.32或EC 4.1.1.49,例如分别在谷氨酸棒杆菌(Corynebacteriumglutamicum)中由PCK编码或在大肠杆菌中由pckA编码)、磷酸烯醇丙酮酸羧化酶活性(EC4.1.1.31,例如在大肠杆菌中由ppc编码)、草酰乙酸脱羧酶活性(EC 4.1.1.112,例如在大肠杆菌中由eda编码)、丙酮酸激酶活性(EC 2.7.1.40,例如在大肠杆菌中由pykA和pykF编码)、丙酮酸羧化酶活性(EC 6.4.1.1,例如在枯草芽孢杆菌中由pyc编码)和苹果酸脱氢酶活性(EC 1.1.1.38或EC 1.1.1.40,例如在大肠杆菌中分别由maeA或maeB编码)。
在一个更优选的实施方案中,所述细胞被修饰以过表达多肽中的任何一种或多种,所述多肽包含来自大肠杆菌的ppsA(UniProt ID P23538)、来自谷氨酸棒杆菌的PCK(UniProt ID Q6F5A5)、来自大肠杆菌的pcka(UniProt ID P22259)、来自大肠杆菌的eda(UniProt ID P0A955)、来自大肠杆菌的maeA(UniProt ID P26616)和来自大肠杆菌的maeB(UniProt ID P76558)。
在另一个和/或另外的优选的实施方案中,所述细胞被修饰以表达UniProt IDP23538、Q6F5A5、P22259、P0A955、P26616或P76558中的任一个的功能同系物、变体或衍生物中的任何一种或多种,其分别与具有UniProt ID P23538、Q6F5A5、P22259、P0A955、P26616或P76558的所述多肽中的任一种的全长具有至少80%总体序列同一性,并且分别具有磷酸烯醇丙酮酸合酶活性、磷酸烯醇丙酮酸羧基激酶活性、草酰乙酸脱羧酶活性或苹果酸脱氢酶活性。
在另一个和/或另外的优选的实施方案中并且作为增强PEP产生和/或供应的手段,通过降低的磷酸烯醇丙酮酸羧化酶活性和/或丙酮酸激酶活性,优选编码磷酸烯醇丙酮酸羧化酶、丙酮酸羧化酶活性和/或丙酮酸激酶的基因的缺失,修饰所述细胞。
在一个示例性实施方案中,通过不同的修改来遗传工程改造所述细胞,诸如磷酸烯醇丙酮酸合酶的过表达与丙酮酸激酶基因的缺失相组合,磷酸烯醇丙酮酸合酶的过表达与磷酸烯醇丙酮酸羧化酶基因的缺失相组合,磷酸烯醇丙酮酸合酶的过表达与丙酮酸羧化酶基因的缺失相组合,磷酸烯醇丙酮酸羧基激酶的过表达与丙酮酸激酶基因的缺失相组合,磷酸烯醇丙酮酸羧基激酶的过表达与磷酸烯醇丙酮酸羧化酶基因的缺失相组合,磷酸烯醇丙酮酸羧基激酶的过表达与丙酮酸羧化酶基因的缺失相组合,草酰乙酸脱羧酶的过表达与丙酮酸激酶基因的缺失相组合,草酰乙酸脱羧酶的过表达与磷酸烯醇丙酮酸羧化酶基因的缺失相组合,草酰乙酸脱羧酶的过表达与丙酮酸羧化酶基因的缺失相组合,苹果酸脱氢酶的过表达与丙酮酸激酶基因的缺失相组合,苹果酸脱氢酶的过表达与磷酸烯醇丙酮酸羧化酶基因的缺失相组合,和/或苹果酸脱氢酶的过表达与丙酮酸羧化酶基因的缺失相组合。
在另一个示例性实施方案中,通过不同的修改来遗传工程改造所述细胞,诸如磷酸烯醇丙酮酸合酶的过表达与磷酸烯醇丙酮酸羧基激酶的过表达相组合,磷酸烯醇丙酮酸合酶的过表达与草酰乙酸脱羧酶的过表达相组合,磷酸烯醇丙酮酸合酶的过表达与苹果酸脱氢酶的过表达相组合,磷酸烯醇丙酮酸羧基激酶的过表达与草酰乙酸脱羧酶的过表达相组合,磷酸烯醇丙酮酸羧基激酶的过表达与苹果酸脱氢酶的过表达相组合,草酰乙酸脱羧酶的过表达与苹果酸脱氢酶的过表达相组合,磷酸烯醇丙酮酸合酶的过表达与磷酸烯醇丙酮酸羧基激酶的过表达和草酰乙酸脱羧酶的过表达相组合,磷酸烯醇丙酮酸合酶的过表达与磷酸烯醇丙酮酸羧基激酶的过表达和苹果酸脱氢酶的过表达相组合,磷酸烯醇丙酮酸合酶的过表达与磷酸烯醇丙酮酸羧基激酶的过表达和草酰乙酸脱羧酶的过表达和苹果酸脱氢酶的过表达相组合,磷酸烯醇丙酮酸羧基激酶的过表达与草酰乙酸脱羧酶的过表达和苹果酸脱氢酶的过表达相组合,和/或磷酸烯醇丙酮酸合酶的过表达与草酰乙酸脱羧酶的过表达和苹果酸脱氢酶的过表达相组合。
在另一个示例性实施方案中,通过不同的修改来遗传工程改造所述细胞,诸如磷酸烯醇丙酮酸合酶的过表达与磷酸烯醇丙酮酸羧基激酶的过表达相组合与丙酮酸激酶基因的缺失相组合,磷酸烯醇丙酮酸合酶的过表达与草酰乙酸脱羧酶的过表达相组合与丙酮酸激酶基因的缺失相组合,磷酸烯醇丙酮酸合酶的过表达与苹果酸脱氢酶的过表达相组合与丙酮酸激酶基因的缺失相组合,磷酸烯醇丙酮酸羧基激酶的过表达与草酰乙酸脱羧酶的过表达相组合与丙酮酸激酶基因的缺失相组合,磷酸烯醇丙酮酸羧基激酶的过表达与苹果酸脱氢酶的过表达相组合与丙酮酸激酶基因的缺失相组合,草酰乙酸脱羧酶的过表达与苹果酸脱氢酶的过表达相组合与丙酮酸激酶基因的缺失相组合,磷酸烯醇丙酮酸合酶的过表达与磷酸烯醇丙酮酸羧基激酶的过表达和草酰乙酸脱羧酶的过表达相组合与丙酮酸激酶基因的缺失相组合,磷酸烯醇丙酮酸合酶的过表达与磷酸烯醇丙酮酸羧基激酶的过表达和苹果酸脱氢酶的过表达相组合与丙酮酸激酶基因的缺失相组合,磷酸烯醇丙酮酸合酶的过表达与磷酸烯醇丙酮酸羧基激酶的过表达和草酰乙酸脱羧酶的过表达和苹果酸脱氢酶的过表达相组合与丙酮酸激酶基因的缺失相组合,磷酸烯醇丙酮酸羧基激酶的过表达与草酰乙酸脱羧酶的过表达和苹果酸脱氢酶的过表达相组合与丙酮酸激酶基因的缺失相组合,磷酸烯醇丙酮酸合酶的过表达与草酰乙酸脱羧酶的过表达和苹果酸脱氢酶的过表达相组合与丙酮酸激酶基因的缺失相组合。
在另一个示例性实施方案中,通过不同的修改来遗传工程改造所述细胞,诸如磷酸烯醇丙酮酸合酶的过表达与磷酸烯醇丙酮酸羧基激酶的过表达相组合与磷酸烯醇丙酮酸羧化酶基因的缺失相组合,磷酸烯醇丙酮酸合酶的过表达与草酰乙酸脱羧酶的过表达相组合与磷酸烯醇丙酮酸羧化酶基因的缺失相组合,磷酸烯醇丙酮酸合酶的过表达与苹果酸脱氢酶的过表达相组合与磷酸烯醇丙酮酸羧化酶基因的缺失相组合,磷酸烯醇丙酮酸羧基激酶的过表达与草酰乙酸脱羧酶的过表达相组合与磷酸烯醇丙酮酸羧化酶基因的缺失相组合,磷酸烯醇丙酮酸羧基激酶的过表达与苹果酸脱氢酶的过表达相组合与磷酸烯醇丙酮酸羧化酶基因的缺失相组合,草酰乙酸脱羧酶的过表达与苹果酸脱氢酶的过表达相组合与磷酸烯醇丙酮酸羧化酶基因的缺失相组合,磷酸烯醇丙酮酸合酶的过表达与磷酸烯醇丙酮酸羧基激酶的过表达和草酰乙酸脱羧酶的过表达相组合与磷酸烯醇丙酮酸羧化酶基因的缺失相组合,磷酸烯醇丙酮酸合酶的过表达与磷酸烯醇丙酮酸羧基激酶的过表达和苹果酸脱氢酶的过表达相组合与磷酸烯醇丙酮酸羧化酶基因的缺失相组合,磷酸烯醇丙酮酸合酶的过表达与磷酸烯醇丙酮酸羧基激酶的过表达和草酰乙酸脱羧酶的过表达和苹果酸脱氢酶的过表达相组合与磷酸烯醇丙酮酸羧化酶基因的缺失相组合,磷酸烯醇丙酮酸羧基激酶的过表达与草酰乙酸脱羧酶的过表达和苹果酸脱氢酶的过表达相组合与磷酸烯醇丙酮酸羧化酶基因的缺失相组合,磷酸烯醇丙酮酸合酶的过表达与草酰乙酸脱羧酶的过表达和苹果酸脱氢酶的过表达相组合与磷酸烯醇丙酮酸羧化酶基因的缺失相组合。
在另一个示例性实施方案中,通过不同的修改来遗传工程改造所述细胞,诸如磷酸烯醇丙酮酸合酶的过表达与磷酸烯醇丙酮酸羧基激酶的过表达相组合与丙酮酸羧化酶基因的缺失相组合,磷酸烯醇丙酮酸合酶的过表达与草酰乙酸脱羧酶的过表达相组合与丙酮酸羧化酶基因的缺失相组合,磷酸烯醇丙酮酸合酶的过表达与苹果酸脱氢酶的过表达相组合与丙酮酸羧化酶基因的缺失相组合,磷酸烯醇丙酮酸羧基激酶的过表达与草酰乙酸脱羧酶的过表达相组合与丙酮酸羧化酶基因的缺失相组合,磷酸烯醇丙酮酸羧基激酶的过表达与苹果酸脱氢酶的过表达相组合与丙酮酸羧化酶基因的缺失相组合,草酰乙酸脱羧酶的过表达与苹果酸脱氢酶的过表达相组合与丙酮酸羧化酶基因的缺失相组合,磷酸烯醇丙酮酸合酶的过表达与磷酸烯醇丙酮酸羧基激酶的过表达和草酰乙酸脱羧酶的过表达相组合与丙酮酸羧化酶基因的缺失相组合,磷酸烯醇丙酮酸合酶的过表达与磷酸烯醇丙酮酸羧基激酶的过表达和苹果酸脱氢酶的过表达相组合与丙酮酸羧化酶基因的缺失相组合,磷酸烯醇丙酮酸合酶的过表达与磷酸烯醇丙酮酸羧基激酶的过表达和草酰乙酸脱羧酶的过表达和苹果酸脱氢酶的过表达相组合与丙酮酸羧化酶基因的缺失相组合,磷酸烯醇丙酮酸羧基激酶的过表达与草酰乙酸脱羧酶的过表达和苹果酸脱氢酶的过表达相组合与丙酮酸羧化酶基因的缺失相组合,磷酸烯醇丙酮酸合酶的过表达与草酰乙酸脱羧酶的过表达和苹果酸脱氢酶的过表达相组合与丙酮酸羧化酶基因的缺失相组合。
在另一个示例性实施方案中,通过不同的修改来遗传工程改造所述细胞,诸如磷酸烯醇丙酮酸合酶的过表达与磷酸烯醇丙酮酸羧基激酶的过表达相组合与丙酮酸激酶基因和磷酸烯醇丙酮酸羧化酶基因的缺失相组合,磷酸烯醇丙酮酸合酶的过表达与草酰乙酸脱羧酶的过表达相组合与丙酮酸激酶基因和磷酸烯醇丙酮酸羧化酶基因的缺失相组合,磷酸烯醇丙酮酸合酶的过表达与苹果酸脱氢酶的过表达相组合与丙酮酸激酶基因和磷酸烯醇丙酮酸羧化酶基因的缺失相组合,磷酸烯醇丙酮酸羧基激酶的过表达与草酰乙酸脱羧酶的过表达相组合与丙酮酸激酶基因和磷酸烯醇丙酮酸羧化酶基因的缺失相组合,磷酸烯醇丙酮酸羧基激酶的过表达与苹果酸脱氢酶的过表达相组合与丙酮酸激酶基因和磷酸烯醇丙酮酸羧化酶基因的缺失相组合,草酰乙酸脱羧酶的过表达与苹果酸脱氢酶的过表达相组合与丙酮酸激酶基因和磷酸烯醇丙酮酸羧化酶基因的缺失相组合,磷酸烯醇丙酮酸合酶的过表达与磷酸烯醇丙酮酸羧基激酶的过表达和草酰乙酸脱羧酶的过表达相组合与丙酮酸激酶基因和磷酸烯醇丙酮酸羧化酶基因的缺失相组合,磷酸烯醇丙酮酸合酶的过表达与磷酸烯醇丙酮酸羧基激酶的过表达和苹果酸脱氢酶的过表达相组合与丙酮酸激酶基因和磷酸烯醇丙酮酸羧化酶基因的缺失相组合,磷酸烯醇丙酮酸合酶的过表达与磷酸烯醇丙酮酸羧基激酶的过表达和草酰乙酸脱羧酶的过表达和苹果酸脱氢酶的过表达相组合与丙酮酸激酶基因和磷酸烯醇丙酮酸羧化酶基因的缺失相组合,磷酸烯醇丙酮酸羧基激酶的过表达与草酰乙酸脱羧酶的过表达和苹果酸脱氢酶的过表达相组合与丙酮酸激酶基因和磷酸烯醇丙酮酸羧化酶基因的缺失相组合,磷酸烯醇丙酮酸合酶的过表达与草酰乙酸脱羧酶的过表达和苹果酸脱氢酶的过表达相组合与丙酮酸激酶基因和磷酸烯醇丙酮酸羧化酶基因的缺失相组合。
在另一个示例性实施方案中,通过不同的修改来遗传工程改造所述细胞,诸如磷酸烯醇丙酮酸合酶的过表达与磷酸烯醇丙酮酸羧基激酶的过表达相组合与丙酮酸激酶基因和丙酮酸羧化酶基因和磷酸烯醇丙酮酸羧化酶基因的缺失相组合,磷酸烯醇丙酮酸合酶的过表达与草酰乙酸脱羧酶的过表达相组合与丙酮酸激酶基因和丙酮酸羧化酶基因和磷酸烯醇丙酮酸羧化酶基因的缺失相组合,磷酸烯醇丙酮酸合酶的过表达与苹果酸脱氢酶的过表达相组合与丙酮酸激酶基因和丙酮酸羧化酶基因和磷酸烯醇丙酮酸羧化酶基因的缺失相组合,磷酸烯醇丙酮酸羧基激酶的过表达与草酰乙酸脱羧酶的过表达相组合与丙酮酸激酶基因和丙酮酸羧化酶基因和磷酸烯醇丙酮酸羧化酶基因的缺失相组合,磷酸烯醇丙酮酸羧基激酶的过表达与苹果酸脱氢酶的过表达相组合与丙酮酸激酶基因和丙酮酸羧化酶基因和磷酸烯醇丙酮酸羧化酶基因的缺失相组合,草酰乙酸脱羧酶的过表达与苹果酸脱氢酶的过表达相组合与丙酮酸激酶基因和丙酮酸羧化酶基因和磷酸烯醇丙酮酸羧化酶基因的缺失相组合,磷酸烯醇丙酮酸合酶的过表达与磷酸烯醇丙酮酸羧基激酶的过表达和草酰乙酸脱羧酶的过表达相组合与丙酮酸激酶基因和丙酮酸羧化酶基因和磷酸烯醇丙酮酸羧化酶基因的缺失相组合,磷酸烯醇丙酮酸合酶的过表达与磷酸烯醇丙酮酸羧基激酶的过表达和苹果酸脱氢酶的过表达相组合与丙酮酸激酶基因和丙酮酸羧化酶基因和磷酸烯醇丙酮酸羧化酶基因的缺失相组合,磷酸烯醇丙酮酸合酶的过表达与磷酸烯醇丙酮酸羧基激酶的过表达和草酰乙酸脱羧酶的过表达和苹果酸脱氢酶的过表达相组合与丙酮酸激酶基因和丙酮酸羧化酶基因和磷酸烯醇丙酮酸羧化酶基因的缺失相组合,磷酸烯醇丙酮酸羧基激酶的过表达与草酰乙酸脱羧酶的过表达和苹果酸脱氢酶的过表达相组合与丙酮酸激酶基因和丙酮酸羧化酶基因和磷酸烯醇丙酮酸羧化酶基因的缺失相组合,磷酸烯醇丙酮酸合酶的过表达与草酰乙酸脱羧酶的过表达和苹果酸脱氢酶的过表达相组合与丙酮酸激酶基因和丙酮酸羧化酶基因和磷酸烯醇丙酮酸羧化酶基因的缺失相组合。
根据本发明的方法和/或细胞的另一个方面,所述细胞还能够合成任何一种或多种核苷酸活化的糖。在本发明的方法和/或细胞的一个优选的实施方案中,所述细胞能够合成一种或多种选自以下列表的核苷酸活化的糖,所述列表包含UDP-N-乙酰葡糖胺(UDP-GlcNAc)、UDP-N-乙酰半乳糖胺(UDP-GalNAc)、UDP-N-乙酰甘露糖胺(UDP-ManNAc)、UDP-葡萄糖(UDP-Glc)、UDP-半乳糖(UDP-Gal)、GDP-甘露糖(GDP-Man)、UDP-葡糖醛酸、UDP-半乳糖醛酸、UDP-2-乙酰氨基-2,6-二脱氧--L-阿拉伯型-4-己酮糖、UDP-2-乙酰氨基-2,6-二脱氧--L-来苏-4-己酮糖、UDP-N-乙酰基-L-鼠李糖胺(UDP-L-RhaNAc或UDP-2-乙酰氨基-2,6-二脱氧-L-甘露糖)、dTDP-N-乙酰基岩藻糖胺、UDP-N-乙酰基岩藻糖胺(UDP-L-FucNAc或UDP-2-乙酰氨基-2,6-二脱氧-L-半乳糖)、UDP-N-乙酰基-L-纽莫糖胺(UDP-L-PneNAC或UDP-2-乙酰氨基-2,6-二脱氧-L-塔罗糖)、UDP-N-乙酰基胞壁酸、UDP-N-乙酰基-L-奎诺糖胺(UDP-L-QuiNAc或UDP-2-乙酰氨基-2,6-二脱氧-L-葡萄糖)、CMP-唾液酸(CMP-Neu5Ac)、CMP-Neu4Ac、CMP-Neu5Ac9N3、CMP-Neu4,5Ac2、CMP-Neu5,7Ac2、CMP-Neu5,9Ac2、CMP-Neu5,7(8,9)Ac2、CMP-N-羟乙酰基神经氨酸(CMP-Neu5Gc)、GDP-岩藻糖(GDP-Fuc)、GDP-鼠李糖和UDP-木糖。在本发明的方法和/或细胞的一个更优选的实施方案中,所述核苷酸活化的糖在所述细胞中被至少一种选自包含以下各项的列表的酶合成:甘露糖-6-磷酸异构酶、磷酸甘露糖变位酶、甘露糖-1-磷酸鸟苷酰基转移酶、GDP-甘露糖4,6-脱水酶、GDP-L-岩藻糖合酶、L-岩藻糖激酶/GDP-岩藻糖焦磷酸化酶、L-谷氨酰胺-D-果糖-6-磷酸氨基转移酶、葡糖胺-6-磷酸脱氨酶、磷酸葡糖胺变位酶、N-乙酰葡糖胺-6-磷酸脱乙酰酶、N-酰基葡糖胺差向异构酶、UDP-N-乙酰葡糖胺2-差向异构酶、葡糖胺6-磷酸N-乙酰基转移酶、N-乙酰葡糖胺-6-磷酸磷酸酶、N-乙酰甘露糖胺-6-磷酸磷酸酶、N-乙酰甘露糖胺激酶、N-乙酰甘露糖胺-6-磷酸2-差向异构酶、磷酸乙酰葡糖胺变位酶、N-乙酰葡糖胺-1-磷酸尿苷酰基转移酶、葡糖胺-1-磷酸乙酰基转移酶、唾液酸合酶、N-乙酰神经氨酸裂合酶、N-酰基神经氨酸-9-磷酸合酶、N-酰基神经氨酸-9-磷酸酶、CMP-唾液酸合酶、半乳糖-1-差向异构酶、半乳糖激酶、葡糖激酶、半乳糖-1-磷酸尿苷酰基转移酶、UDP-葡萄糖4-差向异构酶、葡萄糖-1-磷酸尿苷酰基转移酶、磷酸葡萄糖变位酶、UDP-N-乙酰葡糖胺4-差向异构酶、N-乙酰半乳糖胺激酶和UDP-GalNAc焦磷酸化酶。
在本文中使用的宿主细胞任选地被遗传工程改造以表达UDP-GlcNAc的从头合成。UDP-GlcNAc可以通过在所述细胞中表达的酶或通过所述细胞的代谢提供。这样的产生UDP-GlcNAc的细胞可以表达将例如要添加至所述细胞的GlcNAc转化成UDP-GlcNAc的酶。这些酶可以是以下列表中的任何一种或多种,所述列表包含来自几个物种(包括智人、大肠杆菌)的N-乙酰基-D-葡糖胺激酶、N-乙酰葡糖胺-6-磷酸脱乙酰酶、磷酸葡糖胺变位酶和N-乙酰葡糖胺-1-磷酸尿苷酰基转移酶/葡糖胺-1-磷酸乙酰基转移酶。优选地,所述细胞被修饰以产生UDP-GlcNAc。更优选地,所述细胞被修饰以增强UDP-GlcNAc产生。所述修饰可以是选自下组的任何一种或多种,该组包括:N-乙酰葡糖胺-6-磷酸脱乙酰酶的敲除、L-谷氨酰胺-D-果糖-6-磷酸氨基转移酶的过表达、磷酸葡糖胺变位酶的过表达和N-乙酰葡糖胺-1-磷酸尿苷酰基转移酶/葡糖胺-1-磷酸乙酰基转移酶的过表达。
另外,或备选地,本文中使用的宿主细胞任选地被遗传工程改造以表达CMP-Neu5Ac的从头合成。CMP-Neu5Ac可以通过在所述细胞中表达的酶或通过所述细胞的代谢提供。这样的产生CMP-Neu5Ac的细胞可以表达将例如唾液酸转化成CMP-Neu5Ac的酶。该酶可以是CMP-唾液酸合酶,如来自几个物种(包括智人、脑膜炎奈瑟氏菌和多杀巴斯德氏菌)的N-酰基神经氨酸胞苷酰基转移酶。优选地,所述细胞被修饰以产生CMP-Neu5Ac。更优选地,所述细胞被修饰以增强CMP-Neu5Ac产生。所述修饰可以是选自下组的任何一种或多种,该组包括:N-乙酰葡糖胺-6-磷酸脱乙酰酶的敲除、葡糖胺-6-磷酸脱氨酶的敲除、CMP-唾液酸合酶的过表达和N-酰基-D-葡糖胺2-差向异构酶编码基因的过表达。
另外,或备选地,本文中使用的宿主细胞任选地被遗传工程改造以表达CMP-Neu5Gc的从头合成。CMP-Neu5Gc可以通过由脊椎动物CMP-Neu5Ac羟化酶(CMAH)酶执行的羟基化反应从CMP-Neu5Ac直接合成。优选地,所述细胞被修饰以产生CMP-Neu5Gc。更优选地,所述细胞被修饰以增强CMP-Neu5Gc产生。
另外,或备选地,本文中使用的宿主细胞任选地被遗传工程改造以表达GDP-岩藻糖的从头合成。GDP-岩藻糖可以通过在所述细胞中表达的酶或通过所述细胞的代谢提供。这样的产生GDP-岩藻糖的细胞可以表达将例如要添加至所述细胞的岩藻糖转化成GDP-岩藻糖的酶。该酶可以是,例如,双功能的岩藻糖激酶/岩藻糖-1-磷酸鸟苷酰基转移酶,如来自脆弱拟杆菌(Bacteroides fragilis)的Fkp,或一种单独的岩藻糖激酶与一种单独的岩藻糖-1-磷酸鸟苷酰基转移酶在一起的组合,如已知它们来自几个物种,包括智人、野猪和褐家鼠。优选地,所述细胞被修饰以产生GDP-岩藻糖。更优选地,所述细胞被修饰以增强GDP-岩藻糖产生。所述修饰可以是选自下组的任何一种或多种,该组包括:UDP-葡萄糖:十一异戊二烯基-磷酸葡萄糖-1-磷酸转移酶编码基因的敲除、GDP-L-岩藻糖合酶编码基因的过表达、GDP-甘露糖4,6-脱水酶编码基因的过表达、甘露糖-1-磷酸鸟苷酰基转移酶编码基因的过表达、磷酸甘露糖变位酶编码基因的过表达和甘露糖-6-磷酸异构酶编码基因的过表达。
另外,或备选地,本文中使用的宿主细胞任选地被遗传工程改造以表达UDP-Gal的从头合成。UDP-Gal可以通过在所述细胞中表达的酶或通过所述细胞的代谢提供。这样的产生UDP-Gal的细胞可以表达将例如UDP-葡萄糖转化成UDP-Gal的酶。该酶可以是,例如,UDP-葡萄糖4-差向异构酶GalE,例如其已知来自几个物种,包括智人、大肠杆菌和褐家鼠。优选地,所述细胞被修饰以产生UDP-Gal。更优选地,所述细胞被修饰以增强UDP-Gal产生。所述修饰可以是选自下组的任何一种或多种,该组包括:双功能的5’-核苷酸酶/UDP-糖水解酶编码基因的敲除、半乳糖-1-磷酸尿苷酰基转移酶编码基因的敲除和UDP-葡萄糖4-差向异构酶编码基因的过表达。
另外,或备选地,本文中使用的宿主细胞任选地被遗传工程改造以表达UDP-GalNAc的从头合成。UDP-GalNAc可以通过单步反应的作用从UDP-GlcNAc合成,所述单步反应使用UDP-N-乙酰葡糖胺4-差向异构酶,如例如来自类志贺邻单胞菌(Plesiomonasshigelloides)的wbgU、来自小肠结肠炎耶尔森氏菌的gne或来自铜绿假单胞菌血清型O6的wbpP。优选地,所述细胞被修饰以产生UDP-GalNAc。更优选地,所述细胞被修饰以增强UDP-GalNAc产生。
另外,或备选地,本文中使用的宿主细胞任选地被遗传工程改造以表达UDP-ManNAc的从头合成。UDP-ManNAc可以通过由UDP-GlcNAc 2-差向异构酶(如例如来自金黄色葡萄球菌的cap5P、来自大肠杆菌的RffE、来自肺炎链球菌的Cps19fK和来自肠道沙门氏菌的RfbC)执行的差向异构化反应从UDP-GlcNAc直接合成。优选地,所述细胞被修饰以产生UDP-ManNAc。更优选地,所述细胞被修饰以增强UDP-ManNAc产生。
根据本发明的方法和/或细胞的另一个方面,所述细胞表达至少一种选自以下列表的糖基转移酶,所述列表包含岩藻糖基转移酶、半乳糖基转移酶、葡萄糖基转移酶、甘露糖基转移酶、N-乙酰葡糖胺基转移酶、N-乙酰基半乳糖胺基转移酶、N-乙酰甘露糖胺基转移酶、木糖基转移酶、葡糖醛酸基转移酶、半乳糖醛酸转移酶、葡糖胺基转移酶、N-羟乙酰基神经氨酰基转移酶、鼠李糖基转移酶、N-乙酰基鼠李糖基转移酶、UDP-4-氨基-4,6-二脱氧-N-乙酰基-β-L-阿卓糖胺转氨酶、UDP-N-乙酰葡糖胺烯醇丙酮酰基转移酶和岩藻糖胺基转移酶。
在本发明的方法和/或细胞的一个优选的实施方案中,所述岩藻糖基转移酶选自包含以下各项的列表:α-1,2-岩藻糖基转移酶、α-1,3-岩藻糖基转移酶、α-1,3/4-岩藻糖基转移酶、α-1,4-岩藻糖基转移酶和α-1,6-岩藻糖基转移酶。
在本发明的方法和/或细胞的一个替代性的和/或另外的实施方案中,所述半乳糖基转移酶选自包含以下各项的列表:β-1,3-半乳糖基转移酶、N-乙酰葡糖胺β-1,3-半乳糖基转移酶、β-1,4-半乳糖基转移酶、N-乙酰葡糖胺β-1,4-半乳糖基转移酶、α-1,3-半乳糖基转移酶和α-1,4-半乳糖基转移酶。
在本发明的方法和/或细胞的一个替代性的和/或另外的实施方案中,所述葡萄糖基转移酶选自包含以下各项的列表:α-葡萄糖基转移酶、β-1,2-葡萄糖基转移酶、β-1,3-葡萄糖基转移酶和β-1,4-葡萄糖基转移酶。
在本发明的方法和/或细胞的一个替代性的和/或另外的实施方案中,所述甘露糖基转移酶选自包含以下各项的列表:α-1,2-甘露糖基转移酶、α-1,3-甘露糖基转移酶和α-1,6-甘露糖基转移酶。
在本发明的方法和/或细胞的一个替代性的和/或另外的实施方案中,所述N-乙酰葡糖胺基转移酶选自包含以下各项的列表:半乳糖苷β-1,3-N-乙酰葡糖胺基转移酶和β-1,6-N-乙酰葡糖胺基转移酶。
在本发明的方法和/或细胞的一个替代性的和/或另外的实施方案中,所述N-乙酰基半乳糖胺基转移酶选自包含α-1,3-N-乙酰基半乳糖胺基转移酶的列表。
在本发明的方法和/或细胞的另一个方面,所述细胞在所述糖基转移酶中的至少一种的表达或活性方面被修饰。在一个优选的实施方案中,所述糖基转移酶是具有修饰的表达或活性的细胞的内源蛋白,优选地所述内源性糖基转移酶被过表达;备选地,所述糖基转移酶是异源蛋白,其被异质地引入并在所述细胞中表达,优选地过表达。所述内源性糖基转移酶可以在也表达异源糖基转移酶的细胞中具有修饰的表达。
根据本发明的方法和/或细胞的另一个和/或替代性优选方面,所述细胞包含岩藻糖基化途径,其包含至少一种选自包含以下各项的列表的酶:甘露糖-6-磷酸异构酶、磷酸甘露糖变位酶、甘露糖-1-磷酸鸟苷酰基转移酶、GDP-甘露糖4,6-脱水酶、GDP-L-岩藻糖合酶、岩藻糖通透酶、岩藻糖激酶、岩藻糖-1-磷酸鸟苷酰基转移酶、L-岩藻糖激酶/GDP-岩藻糖焦磷酸化酶、岩藻糖基转移酶。
根据本发明的方法和/或细胞的另一个和/或替代性优选方面,所述细胞包含半乳糖基化途径,其包含至少一种选自包含以下各项的列表的酶:半乳糖-1-差向异构酶、半乳糖激酶、葡糖激酶、半乳糖-1-磷酸尿苷酰基转移酶、UDP-葡萄糖4-差向异构酶、葡萄糖-1-磷酸尿苷酰基转移酶、磷酸葡萄糖变位酶、半乳糖基转移酶。
根据本发明的方法和/或细胞的另一个和/或替代性优选方面,所述细胞包含N-乙酰葡糖胺基化途径,其包含至少一种选自包含以下各项的列表的酶:L-谷氨酰胺-D-果糖-6-磷酸氨基转移酶、N-乙酰葡糖胺-6-磷酸脱乙酰酶、磷酸葡糖胺变位酶、N-乙酰葡糖胺-1-磷酸尿苷酰基转移酶/葡糖胺-1-磷酸乙酰基转移酶、N-乙酰葡糖胺基转移酶。
根据本发明的方法和/或细胞的另一个优选方面,所述细胞包含减少的乙酸盐或酯产生的修饰。所述修饰可以是选自下组的任何一种或多种,该组包括:乙酰辅酶A合成酶的过表达,丙酮酸脱氢酶的完全或部分敲除或被赋予更低功能性的丙酮酸脱氢酶和乳酸脱氢酶的完全或部分敲除或被赋予更低功能性的乳酸脱氢酶。
在本发明的方法和/或细胞的另一个方面,所述细胞在至少一种乙酰辅酶A合成酶(如例如来自大肠杆菌、酿酒酵母、智人、小家鼠的acs)的表达或活性方面被修饰。在一个优选的实施方案中,所述乙酰辅酶A合成酶是具有修饰的表达或活性的细胞的内源蛋白,优选地所述内源性乙酰辅酶A合成酶被过表达;备选地,所述乙酰辅酶A合成酶是异源蛋白,其被异质地引入并在所述细胞中表达,优选地过表达。所述内源性乙酰辅酶A合成酶可以在也表达异源糖基转移酶的细胞中具有修饰的表达。在一个更优选的实施方案中,所述细胞在来自大肠杆菌的乙酰辅酶A合成酶acs(UniProt ID P27550)的表达或活性方面被修饰。在另一个和/或另外的优选的实施方案中,所述细胞在UniProt ID P27550的功能同系物、变体或衍生物的表达或活性方面被修饰,其分别与具有UniProt ID P27550的所述多肽的全长具有至少80%总体序列同一性并且具有乙酰辅酶A合成酶活性。
在本发明的方法和/或细胞的一个替代性的和/或另外的其它方面,所述细胞在至少一种丙酮酸脱氢酶(如例如来自大肠杆菌、酿酒酵母、智人和褐家鼠)的表达或活性方面被修饰。在一个优选的实施方案中,所述细胞已经通过本领域技术人员通常已知的方式被修饰成具有至少一种部分地或完全地敲除的或突变的丙酮酸脱氢酶编码基因,从而产生至少一种具有更低功能性或不具有丙酮酸脱氢酶活性的蛋白。在一个更优选的实施方案中,所述细胞具有在poxB编码基因中的完全敲除,从而产生缺乏丙酮酸脱氢酶活性的细胞。
在本发明的方法和/或细胞的一个替代性的和/或另外的其它方面,所述细胞在至少一种乳酸脱氢酶(如例如来自大肠杆菌、酿酒酵母、智人和褐家鼠)的表达或活性方面被修饰。在一个优选的实施方案中,所述细胞已经通过本领域技术人员通常已知的方式被修饰成具有至少一种部分地或完全地敲除的或突变的乳酸脱氢酶编码基因,从而产生至少一种具有更低功能性或不具有乳酸脱氢酶活性的蛋白。在一个更优选的实施方案中,所述细胞具有在ldhA编码基因中的完全敲除,从而产生缺乏乳酸脱氢酶活性的细胞。
根据本发明的方法和/或细胞的另一个优选方面,所述细胞包含以下蛋白中的任何一种或多种的更低的或减少的表达和/或消除的、受损的、减少的或延迟的活性,所述蛋白包含β-半乳糖苷酶、半乳糖苷O-乙酰基转移酶、N-乙酰葡糖胺-6-磷酸脱乙酰酶、葡糖胺-6-磷酸脱氨酶、N-乙酰葡糖胺阻遏物、核糖核苷酸单磷酸酶、EIICBA-Nag、UDP-葡萄糖:十一异戊二烯基-磷酸葡萄糖-1-磷酸转移酶、L-墨角藻糖激酶、L-岩藻糖异构酶、N-乙酰神经氨酸裂合酶、N-乙酰甘露糖胺激酶、N-乙酰甘露糖胺-6-磷酸2-差向异构酶、EIIAB-Man、EIIC-Man、EIID-Man、ushA、半乳糖-1-磷酸尿苷酰基转移酶、葡萄糖-1-磷酸腺苷酰基转移酶、葡萄糖-1-磷酸酶、ATP依赖性的6-磷酸果糖激酶同工酶1、ATP依赖性的6-磷酸果糖激酶同工酶2、葡萄糖-6-磷酸异构酶、好氧性呼吸控制蛋白、转录阻遏物IclR、lon蛋白酶、葡萄糖特异性的转位磷酸转移酶IIBC组分ptsG、葡萄糖特异性的转位磷酸转移酶(PTS)酶IIBC组分malX、酶IIAGlc、β-葡萄糖苷特异性的PTS酶II、果糖特异性的PTS多磷酰基转移蛋白FruA和FruB、乙醇脱氢酶醛脱氢酶、丙酮酸-甲酸裂合酶、乙酸激酶、磷酸酰基转移酶、磷酸乙酰基转移酶、丙酮酸脱羧酶。
根据本发明的方法和/或细胞的另一个优选方面,所述细胞包含至少部分地灭活的所选单糖、二糖或寡糖的分解代谢途径,所述单糖、二糖或寡糖参与唾液酸化的二糖和/或寡糖的合成和/或是唾液酸化的二糖和/或寡糖的合成所必需的。
根据本发明的方法和/或细胞的另一个优选方面,所述细胞使用前体来合成所述唾液酸化的二糖和/或寡糖。在本文中,将所述前体从培养基供给至所述细胞。在另一个优选的实施方案中,所述细胞产生用于合成所述唾液酸化的二糖和/或寡糖的前体。
在本发明的方法的另一个优选方面,所述细胞使用至少一种前体用于合成本发明的唾液酸化的二糖和/或寡糖。在一个更优选的实施方案中,所述细胞使用两种或更多种前体用于合成本发明的唾液酸化的二糖和/或寡糖。
根据本发明的方法和/或细胞的另一个优选方面,所述细胞在整个培养液和/或上清液中产生90g/L或更多的唾液酸化的二糖和/或寡糖。在一个更优选的实施方案中,在整个培养液和/或上清液中产生的唾液酸化的二糖和/或寡糖具有至少80%的纯度,这按照分别在整个培养液和/或上清液中所述细胞产生的唾液酸化的二糖和/或寡糖及其前体的总量进行测量。
根据本发明的方法和/或细胞的另一个方面,所述唾液酸化的二糖和/或寡糖选自包含以下各项的列表:乳寡糖、O-抗原、在荚膜多糖中存在的寡糖重复单位、肽聚糖、氨基-糖和Lewis-型抗原寡糖。在一个更优选的实施方案中,所述乳寡糖是哺乳动物乳寡糖。在一个甚至更优选的实施方案中,所述乳寡糖是人乳寡糖。
本发明的另一个方面提供了一种方法和一种细胞,其中在微生物中和/或由微生物产生唾液酸化的二糖和/或寡糖,所述微生物选自由细菌、真菌或酵母组成的列表。后一种细菌优选属于变形菌门(Proteobacteria)或厚壁菌门(Firmicutes)或蓝细菌门(Cyanobacteria)或异常球菌-栖热菌门(Deinococcus-Thermus)。后一种属于变形菌门的细菌优选属于肠杆菌科,优选属于大肠杆菌种。后一种细菌优选涉及属于大肠杆菌种的任何菌株,诸如但不限于大肠杆菌B、大肠杆菌C、大肠杆菌W、大肠杆菌K12、大肠杆菌Nissle。更具体地,后一个术语涉及培养的大肠杆菌菌株(称为大肠杆菌K12菌株),它们良好地适应实验室环境,并且与野生型菌株不同,已经丧失其在肠道中繁殖的能力。大肠杆菌K12菌株的众所周知的例子是K12野生型、W3110、MG1655、M182、MC1000、MC1060、MC1061、MC4100、JM101、NZN111和AA200。因此,优选地,本发明具体涉及如上所述的突变的和/或转化的大肠杆菌菌株,其中所述大肠杆菌菌株是K12菌株。更具体地,本发明涉及如上所述的突变的和/或转化的大肠杆菌菌株,其中所述K12菌株是大肠杆菌MG1655。后一种属于厚壁菌门的细菌优选属于芽孢杆菌,优选来自芽孢杆菌属种。后一种真菌优选属于根霉菌属(Rhizopus)、盘基网柄菌属(Dictyostelium)、青霉属(Penicillium)、毛霉菌属(Mucor)或曲霉菌属(Aspergillus)。后一种酵母优选属于子囊菌门(Ascomycota)或担子菌门(Basidiomycota)或半知菌门(Deuteromycota)或接合菌门(Zygomycetes)。后一种酵母优选属于酵母属(Saccharomyces)、接合酵母属(Zygosaccharomyces)、毕赤酵母属(Pichia)、驹形氏酵母(Komagataella)、汉逊酵母属(Hansenula)、耶氏酵母属(Yarrowia)、斯塔莫酵母(Starmerella)、克鲁维酵母属(Kluyveromyces)或德巴利酵母属(Debaromyces)。
另一个方面提供了在培养基中稳定培养的细胞,其中所述培养基可以是任何类型的生长培养基,包括基本培养基、复合培养基或富含某些化合物(如例如但不限于维生素、痕量元素、氨基酸)的生长培养基。
本文中使用的微生物或细胞能够在作为主要碳源的单糖、二糖、寡糖、多糖、多元醇、甘油、复合培养基或其混合物(如例如混合的原料,优选混合的单糖原料如例如水解的蔗糖)上生长。术语“主要”是指对于用于产生感兴趣的唾液酸化的二糖和/或寡糖、生物质形成、二氧化碳和/或副产物形成(诸如酸和/或醇,诸如乙酸盐或酯、乳酸盐或酯和/或乙醇)的微生物或细胞来说最重要的碳源,即所有所需碳的20%、30%、40%、50%、60%、70%、75%、80%、85%、90%、95%、98%、99%衍生自上述碳源。术语“复合培养基”是指其确切组成尚未确定的培养基。例子是糖蜜、玉米浆、蛋白胨、胰蛋白胨或酵母提取物。在本发明的一个实施方案中,所述碳源是所述生物体的唯一碳源,即所有所需碳的100%衍生自上述碳源。常见的主要碳源包括、但不限于葡萄糖、甘油、果糖、蔗糖、麦芽糖、乳糖、阿拉伯糖、麦芽寡糖、麦芽三糖、山梨醇、木糖、鼠李糖、半乳糖、甘露糖、甲醇、乙醇、海藻糖、淀粉、纤维素、半纤维素、糖蜜、玉米浆、高果糖糖浆、乙酸盐、柠檬酸盐、乳酸盐和丙酮酸盐。如本文中使用的,本文中定义的前体不可用作用于产生唾液酸化的二糖和/或寡糖的碳源。
根据本发明的方法和/或细胞的另一个方面,所述细胞能够合成寡糖的混合物,其包含至少一种唾液酸化的寡糖。在一个替代性的和/或另外的方面,所述细胞能够合成二糖和寡糖的混合物,其包含至少一种唾液酸化的二糖/或寡糖;备选地,所述细胞能够合成唾液酸、二糖和/或寡糖的混合物。
在一个进一步优选方面,如本文中定义的用于产生唾液酸化的二糖和/或寡糖的方法包括下述步骤中的至少一个:
i)使用包含至少一种前体和/或受体的培养基来产生所述唾液酸化的二糖和/或寡糖,和/或
ii)向所述培养基中加入至少一种用于产生所述唾液酸化的二糖和/或寡糖的前体和/或受体补料。
在另一个和/或另外的进一步优选方面,如本文描述的用于产生唾液酸化的二糖和/或寡糖的方法包括下述步骤中的至少一个:
i)使用包含至少一种前体和/或受体的培养基;
ii)向在反应器中的培养基中加入至少一种前体和/或受体补料,其中总反应器体积的范围为250mL(毫升)至10.000m3(立方米),优选以连续方式加入,且优选使得所述培养基的终体积是在加入所述前体和/或受体补料之前培养基体积的不超过3倍、优选不超过2倍、更优选小于2倍;
iii)向在反应器中的培养基中加入至少一种前体和/或受体补料,其中总反应器体积的范围为250mL(毫升)至10.000m3(立方米),优选以连续方式加入,且优选使得所述培养基的终体积是在加入所述前体和/或受体补料之前培养基体积的不超过3倍、优选不超过2倍、更优选小于2倍,并且其中优选地,将所述前体和/或受体补料的pH设定在2.0至10.0,并且其中优选地,将所述前体和/或受体补料的温度保持在20℃至80℃;
iv)借助于补料溶液历时1天、2天、3天、4天、5天将至少一种前体和/或受体补料以连续方式加入所述培养基中;
v)借助于补料溶液历时1天、2天、3天、4天、5天将至少一种前体和/或受体补料以连续方式加入所述培养基中,并且其中优选地,将所述前体和/或受体补料的pH设定在2.0至10.0,优选在3至7,并且其中优选地,将所述前体和/或受体补料的温度保持在20℃至80℃;
所述方法产生在所述培养基的终体积中具有至少50g/L、优选至少75g/L、更优选至少90g/L、更优选至少100g/L、更优选至少125g/L、更优选至少150g/L、更优选至少175g/L、更优选至少200g/L的浓度的唾液酸化的二糖和/或寡糖。
在另一个和/或另外的进一步优选方面,如本文描述的用于产生唾液酸化的二糖和/或寡糖的方法包括下述步骤中的至少一个:
i)使用包含至少一种前体和/或受体的培养基;
ii)以一次脉冲方式或以不连续(脉冲)方式向在反应器中的培养基中加入至少一种前体和/或受体,其中总反应器体积的范围为250mL(毫升)至10.000m3(立方米),优选使得所述培养基的终体积是在加入所述前体和/或受体补料脉冲之前培养基体积的不超过3倍、优选不超过2倍、更优选小于2倍;
iii)以一次脉冲方式或以不连续(脉冲)方式向在反应器中的培养基中加入至少一种前体和/或受体,其中总反应器体积的范围为250mL(毫升)至10.000m3(立方米),优选使得所述培养基的终体积是在加入所述前体和/或受体补料脉冲之前培养基体积的不超过3倍、优选不超过2倍、更优选小于2倍,并且其中优选地,将所述补料脉冲的pH设定在2.0至10.0,优选在3至7,并且其中优选地,将所述补料脉冲的温度保持在20℃至80℃;
iv)借助于补料溶液历时5分钟、10分钟、30分钟、1小时、2小时、4小时、10小时、12小时、1天、2天、3天、4天、5天以不连续(脉冲)方式向所述培养基中加入至少一种前体和/或受体补料;
v)借助于补料溶液历时5分钟、10分钟、30分钟、1小时、2小时、4小时、10小时、12小时、1天、2天、3天、4天、5天以不连续(脉冲)方式向所述培养基中加入至少一种前体和/或受体补料,并且其中优选地,将所述前体和/或受体补料的pH设定在2.0至10.0,优选在3至7,并且其中优选地,将所述前体和/或受体补料的温度保持在20℃至80℃;
所述方法产生在所述培养基的终体积中具有至少50g/L、优选至少75g/L、更优选至少90g/L、更优选至少100g/L、更优选至少125g/L、更优选至少150g/L、更优选至少175g/L、更优选至少200g/L的浓度的唾液酸化的二糖和/或寡糖。
在另一个和/或另外的进一步优选方面,如本文描述的用于产生唾液酸化的二糖和/或寡糖的方法包括下述步骤中的至少一个:
i)使用包含至少50、更优选至少75、更优选至少100、更优选至少120、更优选至少150克前体/升初始反应器体积的培养基,其中总反应器体积的范围为250mL至10.000m3(立方米);
ii)使用包含至少50、更优选至少75、更优选至少100、更优选至少120、更优选至少150克受体/升初始反应器体积的培养基,其中总反应器体积的范围为250mL至10.000m3(立方米);
iii)向在反应器中的培养基中加入前体补料,其包含至少50、更优选至少75、更优选至少100、更优选至少120、更优选至少150克前体/升初始反应器体积,其中总反应器体积的范围为250mL至10.000m3(立方米),优选以连续方式加入,且优选使得所述培养基的终体积是在加入所述前体补料之前培养基体积的不超过3倍、优选不超过2倍、更优选小于2倍;
iv)向在反应器中的培养基中加入受体补料,其包含至少50、更优选至少75、更优选至少100、更优选至少120、更优选至少150克受体/升初始反应器体积,其中总反应器体积的范围为250mL至10.000m3(立方米),优选以连续方式加入,且优选使得所述培养基的终体积是在加入所述受体补料之前培养基体积的不超过3倍、优选不超过2倍、更优选小于2倍;
v)向在反应器中的培养基中加入前体补料,其包含至少50、更优选至少75、更优选至少100、更优选至少120、更优选至少150克前体/升初始反应器体积,其中总反应器体积的范围为250mL至10.000m3(立方米),优选以连续方式加入,且优选使得所述培养基的终体积是在加入所述前体补料之前培养基体积的不超过3倍、优选不超过2倍、更优选小于2倍,并且其中优选地,将所述前体补料的pH设定在2.0至10.0,并且其中优选地,将所述前体补料的温度保持在20℃至80℃;
vi)向在反应器中的培养基中加入受体补料,其包含至少50、更优选至少75、更优选至少100、更优选至少120、更优选至少150克受体/升初始反应器体积,其中总反应器体积的范围为250mL至10.000m3(立方米),优选以连续方式加入,且优选使得所述培养基的终体积是在加入所述受体补料之前培养基体积的不超过3倍、优选不超过2倍、更优选小于2倍,并且其中优选地,将所述受体补料的pH设定在2.0至10.0,并且其中优选地,将所述受体补料的温度保持在20℃至80℃;
vii)借助于补料溶液历时1天、2天、3天、4天、5天以连续方式向所述培养基中加入前体和/或受体补料;
viii)借助于前体补料溶液历时1天、2天、3天、4天、5天以连续方式向所述培养基中加入前体补料,且其中所述前体补料溶液的浓度是50g/L、优选75g/L、更优选100g/L、更优选125g/L、更优选150g/L、更优选175g/L、更优选200g/L、更优选225g/L、更优选250g/L、更优选275g/L、更优选300g/L、更优选325g/L、更优选350g/L、更优选375g/L、更优选400g/L、更优选450g/L、更优选500g/L、甚至更优选550g/L、最优选600g/L,并且其中优选地,将所述前体补料溶液的pH设定在2.0至10.0,并且其中优选地,将所述前体补料溶液的温度保持在20℃至80℃;
ix)借助于受体补料溶液历时1天、2天、3天、4天、5天以连续方式向所述培养基中加入受体补料,且其中所述受体补料溶液的浓度是50g/L、优选75g/L、更优选100g/L、更优选125g/L、更优选150g/L、更优选175g/L、更优选200g/L、更优选225g/L、更优选250g/L、更优选275g/L、更优选300g/L、更优选325g/L、更优选350g/L、更优选375g/L、更优选400g/L、更优选450g/L、更优选500g/L、甚至更优选550g/L、最优选600g/L,并且其中优选地,将所述受体补料溶液的pH设定在2.0至10.0,并且其中优选地,将所述受体补料溶液的温度保持在20℃至80℃;
所述方法产生在所述培养基的终体积中具有至少50g/L、优选至少75g/L、更优选至少90g/L、更优选至少100g/L、更优选至少125g/L、更优选至少150g/L、更优选至少175g/L、更优选至少200g/L的浓度的唾液酸化的二糖和/或寡糖。
在另一个更优选的方面,如本文描述的用于产生唾液酸化的二糖和/或寡糖的方法包括下述步骤中的至少一个:
i)使用包含至少50、更优选至少75、更优选至少100、更优选至少120、更优选至少150克前体/升初始反应器体积的培养基,其中总反应器体积的范围为250mL至10.000m3(立方米);
ii)使用包含至少50、更优选至少75、更优选至少100、更优选至少120、更优选至少150克受体/升初始反应器体积的培养基,其中总反应器体积的范围为250mL至10.000m3(立方米);
iii)以一次脉冲方式或以不连续(脉冲)方式向在反应器中的培养基中加入至少一种前体,其包含至少50、更优选至少75、更优选至少100、更优选至少120、更优选至少150克前体/升初始反应器体积,其中总反应器体积的范围为250mL至10.000m3(立方米),且优选使得所述培养基的终体积是在加入所述前体补料脉冲之前培养基体积的不超过3倍、优选不超过2倍、更优选小于2倍;
iv)以一次脉冲方式或以不连续(脉冲)方式向在反应器中的培养基中加入至少一种受体,其包含至少50、更优选至少75、更优选至少100、更优选至少120、更优选至少150克受体/升初始反应器体积,其中总反应器体积的范围为250mL至10.000m3(立方米),且优选使得所述培养基的终体积是在加入所述受体补料脉冲之前培养基体积的不超过3倍、优选不超过2倍、更优选小于2倍;
v)以一次脉冲方式或以不连续(脉冲)方式向在反应器中的培养基中加入至少一种前体,其包含至少50、更优选至少75、更优选至少100、更优选至少120、更优选至少150克前体/升初始反应器体积,其中总反应器体积的范围为250mL至10.000m3(立方米),且优选使得所述培养基的终体积是在加入所述前体补料脉冲之前培养基体积的不超过3倍、优选不超过2倍、更优选小于2倍,并且其中优选地,将所述前体补料脉冲的pH设定在2.0至10.0,并且其中优选地,将所述前体补料脉冲的温度保持在20℃至80℃;
vi)以一次脉冲方式或以不连续(脉冲)方式向在反应器中的培养基中加入至少一种受体,其包含至少50、更优选至少75、更优选至少100、更优选至少120、更优选至少150克受体/升初始反应器体积,其中总反应器体积的范围为250mL至10.000m3(立方米),且优选使得所述培养基的终体积是在加入所述受体补料脉冲之前培养基体积的不超过3倍、优选不超过2倍、更优选小于2倍,并且其中优选地,将所述受体补料脉冲的pH设定在2.0至10.0,并且其中优选地,将所述受体补料脉冲的温度保持在20℃至80℃;
vii)借助于不连续(脉冲)补料溶液历时5分钟、10分钟、30分钟、1小时、2小时、4小时、10小时、12小时、1天、2天、3天、4天、5天以不连续(脉冲)方式向所述培养基中加入至少一种前体和/或受体补料;
viii)借助于不连续(脉冲)前体补料溶液历时5分钟、10分钟、30分钟、1小时、2小时、4小时、10小时、12小时、1天、2天、3天、4天、5天以不连续(脉冲)方式向所述培养基中加入前体补料,且其中所述不连续(脉冲)前体补料溶液的浓度是50g/L、优选75g/L、更优选100g/L、更优选125g/L、更优选150g/L、更优选175g/L、更优选200g/L、更优选225g/L、更优选250g/L、更优选275g/L、更优选300g/L、更优选325g/L、更优选350g/L、更优选375g/L、更优选400g/L、更优选450g/L、更优选500g/L、甚至更优选550g/L、最优选600g/L,并且其中优选地,将所述不连续(脉冲)前体补料溶液的pH设定在2.0至10.0,并且其中优选地,将所述不连续(脉冲)前体补料溶液的温度保持在20℃至80℃;
ix)借助于不连续(脉冲)受体补料溶液历时5分钟、10分钟、30分钟、1小时、2小时、4小时、10小时、12小时、1天、2天、3天、4天、5天以不连续(脉冲)方式向所述培养基中加入受体补料,且其中所述不连续(脉冲)受体补料溶液的浓度是50g/L、优选75g/L、更优选100g/L、更优选125g/L、更优选150g/L、更优选175g/L、更优选200g/L、更优选225g/L、更优选250g/L、更优选275g/L、更优选300g/L、更优选325g/L、更优选350g/L、更优选375g/L、更优选400g/L、更优选450g/L、更优选500g/L、甚至更优选550g/L、最优选600g/L,并且其中优选地,将所述不连续(脉冲)受体补料溶液的pH设定在2.0至10.0,并且其中优选地,将所述不连续(脉冲)受体补料溶液的温度保持在20℃至80℃;
所述方法产生在所述培养基的终体积中具有至少50g/L、优选至少75g/L、更优选至少90g/L、更优选至少100g/L、更优选至少125g/L、更优选至少150g/L、更优选至少175g/L、更优选至少200g/L的浓度的唾液酸化的二糖和/或寡糖。
在另一个更优选的方面,如本文描述的用于产生唾液酸化的二糖和/或寡糖的方法包括下述步骤中的至少一个:
i)使用包含至少50、更优选至少75、更优选至少100、更优选至少120、更优选至少150克乳糖/升初始反应器体积的培养基,其中总反应器体积的范围为250mL至10.000m3(立方米);
ii)向在反应器中的培养基中加入乳糖补料,其包含至少50、更优选至少75、更优选至少100、更优选至少120、更优选至少150克乳糖/升初始反应器体积,其中总反应器体积的范围为250mL(毫升)至10.000m3(立方米),优选以连续方式加入,且优选使得所述培养基的终体积是在加入所述乳糖补料之前培养基体积的不超过3倍、优选不超过2倍、更优选小于2倍;
iii)向在反应器中的培养基中加入乳糖补料,其包含至少50、更优选至少75、更优选至少100、更优选至少120、更优选至少150克乳糖/升初始反应器体积,其中总反应器体积的范围为250mL(毫升)至10.000m3(立方米),优选以连续方式加入,且优选使得所述培养基的终体积是在加入所述乳糖补料之前培养基体积的不超过3倍、优选不超过2倍、更优选小于2倍,并且其中优选地,将所述乳糖补料的pH设定在2.0至10.0,优选在3至7,并且其中优选地,将所述乳糖补料的温度保持在20℃至80℃;
iv)借助于补料溶液历时1天、2天、3天、4天、5天以连续方式向所述培养基中加入乳糖补料;
v)借助于乳糖补料溶液历时1天、2天、3天、4天、5天以连续方式向所述培养基中加入乳糖补料,且其中所述乳糖补料溶液的浓度是50g/L、优选75g/L、更优选100g/L、更优选125g/L、更优选150g/L、更优选175g/L、更优选200g/L、更优选225g/L、更优选250g/L、更优选275g/L、更优选300g/L、更优选325g/L、更优选350g/L、更优选375g/L、更优选400g/L、更优选450g/L、更优选500g/L、甚至更优选550g/L、最优选600g/L;且其中优选地将所述乳糖补料溶液的pH设定在2.0至10.0,优选在3至7,并且其中优选地将所述乳糖补料溶液的温度保持在20℃至80℃;
所述方法产生从所述乳糖产生的唾液酸化的寡糖,其在所述培养基的终体积中具有至少50g/L、优选至少75g/L、更优选至少90g/L、更优选至少100g/L、更优选至少125g/L、更优选至少150g/L、更优选至少175g/L、更优选至少200g/L的浓度。
优选地,通过从培养开始以至少5mM的浓度、优选以30、40、50、60、70、80、90、100、150mM的浓度、更优选以>300mM的浓度添加乳糖来完成乳糖补料。
在另一个方面,通过以一定浓度将乳糖加入培养物或培养基中,使得在整个培养的生产阶段中获得至少5mM、优选10mM或30mM的乳糖浓度,完成乳糖补料。
在本文描述的方法的另一个实施方案中,将所述宿主细胞培养至少约60、80、100或约120小时或以连续方式培养。
在一个优选的实施方案中,还向所述培养基中加入碳和能源,优选葡萄糖、甘油、果糖、麦芽糖、阿拉伯糖、麦芽糊精、麦芽寡糖、麦芽三糖、山梨醇、木糖、鼠李糖、蔗糖、半乳糖、甘露糖、甲醇、乙醇、海藻糖、淀粉、纤维素、半纤维素、多元醇、玉米浆、高果糖糖浆、琥珀酸盐、苹果酸盐、乙酸盐、柠檬酸盐、乳酸盐和丙酮酸盐,优选连续地加入,优选与前体和/或受体一起加入。
在另一个和/或另外的优选的实施方案中,在所述培养基中提供碳源、优选蔗糖持续3天或更多天,优选多至7天;和/或在所述培养基中以连续方式提供至少100、有利地至少105、更有利地至少110、甚至更有利地至少120克蔗糖/升初始培养体积,使得所述培养基的终体积是在培养之前培养基体积的不超过3倍、有利地不超过2倍、更有利地小于2倍。
优选地,当进行本文描述的方法时,通过向所述培养基中添加碳源(优选葡萄糖或蔗糖)来提供指数细胞生长的第一阶段,然后在第二阶段将前体和/或受体(优选乳糖)加入所述培养基中。
在一个替代性的优选的实施方案中,在本文描述的方法中,在指数生长的第一阶段已经将前体和/或受体(优选乳糖)与基于碳的底物一起加入。
在本发明的方法的另一个优选的实施方案中,所述培养基含有至少一种选自包括以下各项的组的分子:乳糖、半乳糖、唾液酸、岩藻糖、GlcNAc、GalNAc、乳糖-N-二糖(LNB)、N-乙酰基乳糖胺(LacNAc)。
根据本发明,如本文描述的方法优选地包括将所述唾液酸化的二糖和/或寡糖从所述培养物分离的步骤。
术语“从所述培养物分离”是指从所述细胞和/或其生长的培养基中收获、收集或回收所述唾液酸化的二糖和/或寡糖。
可以以常规方式从所述细胞所生长的水性培养基中分离唾液酸化的二糖和/或寡糖。在唾液酸化的二糖和/或寡糖仍然存在于产生所述唾液酸化的二糖和/或寡糖的细胞中的情况下,可以使用从细胞中释放或提取所述唾液酸化的二糖和/或寡糖的常规方式,诸如使用高pH、热休克、声处理、弗氏压碎器、匀浆化、酶促水解、化学水解、溶剂水解、去污剂、水解等的细胞破坏。然后,所述培养基和/或细胞提取物可以一起和分开进一步用于分离所述唾液酸化的二糖和/或寡糖。
这优选涉及澄清所述唾液酸化的二糖和/或寡糖以除去悬浮颗粒和污染物,特别是通过培养遗传工程改造的细胞产生的细胞、细胞组分、不溶性代谢物和碎片。在该步骤中,所述唾液酸化的二糖和/或寡糖可以通过常规方式澄清。优选地,所述唾液酸化的二糖和/或寡糖通过离心、絮凝、倾析和/或过滤来澄清。分离所述唾液酸化的二糖和/或寡糖的另一个步骤优选包括从所述唾液酸化的二糖和/或寡糖中除去基本上所有的可能干扰后续分离步骤的蛋白、肽、氨基酸、RNA、DNA、内毒素和糖脂,优选地在已经澄清它之后进行。在该步骤中,可以以常规方式从所述唾液酸化的二糖和/或寡糖中除去蛋白和相关杂质。优选地,通过超滤、纳米过滤、两相分配、反渗透、微滤、活性炭或碳处理、用非离子表面活性剂处理、酶消化、切向流高效过滤、切向流超滤、电泳(例如使用平板-聚丙烯酰胺或十二烷基硫酸钠-聚丙烯酰胺凝胶电泳(PAGE))、亲和色谱法(使用亲和配体,包括例如DEAE-Sepharose、聚-L-赖氨酸和多粘菌素-B、内毒素选择性的吸附剂基质)、离子交换色谱法(诸如但不限于阳离子交换、阴离子交换、混合床离子交换、内翻外配体附着)、疏水相互作用色谱法和/或凝胶过滤(即,尺寸排阻色谱法),特别是通过色谱法,更特别是通过离子交换色谱法或疏水相互作用色谱法或配体交换色谱法或电渗析,从所述唾液酸化的二糖和/或寡糖中除去蛋白、盐、副产物、颜色、内毒素和其它相关杂质。除了尺寸排阻色谱法之外,蛋白和相关杂质被色谱介质或选定的膜保留。
在一个进一步优选的实施方案中,如本文描述的方法还提供本发明的唾液酸化的二糖和/或寡糖的进一步纯化。所述唾液酸化的二糖和/或寡糖的进一步纯化可以例如如下完成:使用(活化的)木炭或碳、纳米过滤、超滤、电泳、酶处理或离子交换、温度调节、pH调节或使用碱性或酸性溶液的pH调节,以除去任何残留的DNA、蛋白、LPS、内毒素或其它杂质。还可以使用醇(诸如乙醇)和水性醇混合物。另一个纯化步骤通过所述唾液酸化的二糖和/或寡糖的结晶、蒸发或沉淀来完成。另一个纯化步骤是干燥,例如喷雾干燥、冻干、喷雾冷冻干燥、冷冻喷雾干燥、带状干燥(band dry)、带式干燥(belt dry)、真空带状干燥、真空带式干燥、转鼓式干燥(drum dry)、滚筒干燥(roller dry)、真空转鼓式干燥或真空滚筒干燥所产生的唾液酸化的二糖和/或寡糖。
在一个示例性实施方案中,在以任何顺序包括以下步骤的方法中进行唾液酸化的二糖和/或寡糖的分离和纯化:
a)使所述培养物或其澄清形式与具有600-3500Da的分子量截止值(MWCO)的纳米过滤膜接触,确保所产生的唾液酸化的二糖和/或寡糖的截留,并允许蛋白、盐、副产物、颜色和其它有关的杂质的至少一部分穿过,
b)使用所述膜,用无机电解质的水溶液对来自步骤a)的渗余物进行渗滤工艺,随后任选地用纯水渗滤以除去过量的电解质,
c)并收集富含以所述电解质的阳离子的盐形式存在的所述唾液酸化的二糖和/或寡糖的渗余物。
在一个替代性的示例性实施方案中,在以任何顺序包括以下步骤的方法中进行所述唾液酸化的二糖和/或寡糖的分离和纯化:使所述培养物或其澄清形式经历使用不同膜的两个膜过滤步骤,其中
-一种膜具有约300至约500道尔顿的分子量截止值,且
-另一种膜具有约600至约800道尔顿的分子量截止值。
在一个替代性的示例性实施方案中,在一种方法中进行所述唾液酸化的二糖和/或寡糖的分离和纯化,所述方法包括在一个步骤中用H+-形式的强阳离子交换树脂处理所述培养物或其澄清形式,并在另一个步骤中用游离碱形式的弱阴离子交换树脂处理,其中所述步骤可以以任何顺序进行。
在一个替代性的示例性实施方案中,按以下方式进行所述唾液酸化的二糖和/或寡糖的分离和纯化。对包含所产生的唾液酸化的二糖和/或寡糖、生物质、培养基组分和污染物的培养物应用下述纯化步骤,优选地其中在所述培养物中的所产生的唾液酸化的二糖和/或寡糖的纯度<80%:
i)从所述培养物中分离生物质,
ii)阳离子离子交换剂处理以除去带正电荷的物质,
iii)阴离子离子交换剂处理以除去带负电荷的物质,
iv)纳米过滤步骤和/或电渗析步骤,
其中提供纯化的溶液,其包含大于或等于80%的纯度的所产生的唾液酸化的二糖和/或寡糖。任选地,通过任何一个或多个选自以下列表的干燥步骤来干燥纯化的溶液,所述列表包括喷雾干燥、冻干、喷雾冷冻干燥、冷冻喷雾干燥、带状干燥、带式干燥、真空带状干燥、真空带式干燥、转鼓式干燥、滚筒干燥、真空转鼓式干燥和真空滚筒干燥。
在一个替代性的示例性实施方案中,在以任何顺序包括以下步骤的方法中进行所述唾液酸化的二糖和/或寡糖的分离和纯化:培养物的酶处理;从培养物除去生物质;超滤;纳米过滤;和柱色谱法步骤。优选地,这样的柱色谱法是单个柱或多个柱。进一步优选地,所述柱色谱法步骤是模拟的移动床色谱法。这样的模拟的移动床色谱法优选地包含i)至少4个柱,其中至少一个柱包含弱或强阳离子交换树脂;和/或ii)具有不同流速的四个区域I、II、III和IV;和/或iii)包含水的洗脱液;和/或iv)15摄氏度至60摄氏度的操作温度。
在一个具体实施方案中,本发明提供了被干燥成粉末的所产生的唾液酸化的二糖和/或寡糖,其中所述干燥的粉末含有<15重量%的水,优选地<10重量%的水,更优选地<7重量%的水,最优选地<5重量%的水。
在另一个具体实施方案中,本发明提供了被喷雾干燥成粉末的所产生的唾液酸化的二糖和/或寡糖,其中所述喷雾干燥的粉末含有<15重量%的水,优选地<10重量%的水,更优选地<7重量%的水,最优选地<5重量%的水。
本发明的另一个方面提供了选自SEQ ID NO 02、03、04、05、06、07、08、09、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、47、58或59的唾液酸转运蛋白在唾液酸化的二糖和/或寡糖的发酵生产中的用途。在另一个优选的实施方案中,本发明提供了具有SEQ ID NO 01、02、03、04、05、06、07、08、09、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、47、58或59的多肽中的任一个的功能同系物、变体或衍生物在唾液酸化的二糖和/或寡糖的发酵生产中的用途,所述功能同系物、变体或衍生物分别与具有SEQ ID NO 01、02、03、04、05、06、07、08、09、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、47、58或59的多肽中的任一种的全长序列具有至少80%总体序列同一性并且具有唾液酸转运蛋白活性。
本发明的另一个方面提供了如本文中定义的细胞在用于产生唾液酸化的二糖和/或寡糖的方法中的用途。本发明的另一个方面提供了如本文中定义的方法用于产生唾液酸化的二糖和/或寡糖的用途。
此外,本发明也涉及通过根据本发明的方法得到的唾液酸化的二糖和/或寡糖,以及如上所述的多核苷酸、载体、宿主细胞、微生物或多肽用于产生所述唾液酸化的二糖和/或寡糖的用途。所述唾液酸化的二糖和/或寡糖可以用于制造制品,作为食品添加剂、益生元、合生元(symbiotic),用于补充婴儿食品、成人食品、幼年动物饲料、成年动物饲料,或作为治疗上或药学上有活性的化合物或用在化妆品应用中。利用所述新颖的方法,可以容易地且有效地提供唾液酸化的二糖和/或寡糖,而不需要复杂的、消耗时间和成本的合成过程。
为了鉴定在如本文描述的细胞中产生的唾液酸化的二糖和/或寡糖,通过本领域已知的标准方法,诸如,例如,甲基化分析、还原裂解、水解、GC-MS(气相色谱法-质谱法)、MALDI-MS(基质辅助激光解吸/电离-质谱法)、ESI-MS(电喷射电离-质谱法)、HPLC(具有紫外或折射率检测的高效液相色谱法)、HPAEC-PAD(具有脉冲电流计检测的高效阴离子交换色谱法)、CE(毛细管电泳)、IR(红外)/拉曼光谱法和NMR(核磁共振)光谱法技术,可以鉴定单体结构单元(例如单糖或聚糖单元组合物)、侧链的异头构型、取代基的存在和位置、聚合度/分子量以及连接模式。使用例如固态NMR、FT-IR(傅里叶变换红外光谱法)和WAXS(广角X射线散射)等,可以解析晶体结构。通过例如粘度测定法和SEC(SEC-HPLC,高效尺寸排阻色谱法),可以测定聚合度(DP)、DP分布和多分散性。为了鉴定唾液酸化的二糖和/或寡糖的单体组分,可以使用下述方法,例如酸催化的水解、HPLC(高效液相色谱法)或GLC(气-液色谱法)(在转化为多羟糖醇乙酸酯(alditol acetates)之后)。为了确定糖苷键,将唾液酸化的二糖和/或寡糖在DMSO中用碘代甲烷和强碱甲基化,进行水解,实现部分甲基化的多羟糖醇的还原,乙酰化为甲基化的多羟糖醇乙酸酯,并通过GLC/MS(气-液色谱法与质谱法联用)进行分析。为了确定聚糖序列,使用酸或酶进行部分解聚以确定结构。为了鉴定异头构型,对唾液酸化的二糖和/或寡糖进行酶分析,例如使它与对特定类型的键具有特异性的酶(例如,β-半乳糖苷酶或α-葡萄糖苷酶等)接触,并且可以使用NMR来分析产物。
将本文描述的分离的和优选地也纯化的唾液酸化的二糖和/或寡糖掺入食品(例如,人食品或饲料)、饮食添加物、药物成分、化妆品成分或药物中。在某些实施方案中,将唾液酸化的二糖和/或寡糖与一种或多种适合用于食品、饲料、饮食添加物、药物成分、化妆成分或药物的成分混合。
在某些实施方案中,所述饮食添加物包含至少一种益生元成分和/或至少一种益生菌成分。
“益生元”是促进对宿主有益的微生物(特别是在胃肠道中的微生物)的生长的物质。在某些实施方案中,饮食添加物提供多种益生元,包括作为通过在本说明书中公开的方法产生和/或纯化的益生元的唾液酸化的二糖和/或寡糖,以促进一种或多种有益微生物的生长。用于饮食添加物的益生元成分的例子包括其它益生元分子(例如HMO)和植物多糖(诸如菊粉、果胶、b-葡聚糖和低聚木糖)。“益生菌”产品通常含有活微生物,它们替代或添加至胃肠道微生物菌群,从而对接受者有益。这样的微生物的例子包括乳杆菌属种(例如,嗜酸乳杆菌(L.acidophilus)和保加利亚乳杆菌(L.bulgaricus))、双歧杆菌属种(例如、动物双歧杆菌(B.animalis)、长双歧杆菌(B.longum)和婴儿双歧杆菌(B.infantis)(例如,Bi-26))和布拉氏酵母菌(Saccharomyces boulardii)。在某些实施方案中,通过本说明书的方法产生和/或纯化的唾液酸化的二糖和/或寡糖与这样的微生物组合地口服施用。
用于饮食添加物的其它成分的例子包括寡糖(诸如2’-岩藻糖基乳糖、3-岩藻糖基乳糖、3’-唾液酸基乳糖、6’-唾液酸基乳糖)、二糖(诸如乳糖)、单糖(诸如葡萄糖、半乳糖、L-岩藻糖、唾液酸、葡糖胺和N-乙酰葡糖胺)、增稠剂(诸如阿拉伯树胶)、酸度调节剂(诸如柠檬酸三钠)、水、脱脂乳和芳香剂。
在某些实施方案中,将唾液酸化的寡糖掺入人婴儿食品(例如,婴儿配方奶粉)中。婴儿配方奶粉通常是用于作为人母乳的完全或部分替代品来喂养婴儿的加工食品。在某些实施方案中,婴儿配方奶粉作为粉末出售并通过与水混合制备用于用奶瓶或杯子喂给婴儿。婴儿配方奶粉的组成通常被设计为大致模仿人母乳。在某些实施方案中,通过本说明书中的方法产生和/或纯化的唾液酸化的寡糖被包含在婴儿配方奶粉中以提供与人母乳中的寡糖所提供的营养益处类似的营养益处。在某些实施方案中,所述唾液酸化的寡糖与婴儿配方奶粉的一种或多种成分混合。婴儿配方奶粉成分的例子包括脱脂乳、碳水化合物源(例如,乳糖)、蛋白源(例如,乳清蛋白浓缩物和酪蛋白)、脂肪源(例如植物油——诸如棕榈油、高油酸红花油、菜籽油、椰子油和/或葵花籽油;和鱼油)、维生素(诸如维生素A、Bb、Bi2、C和D)、矿物质(诸如柠檬酸钾、柠檬酸钙、氯化镁、氯化钠、柠檬酸钠和磷酸钙)和可能的人乳寡糖(HMO)。这样的HMO可以包括,例如,DiFL、乳糖-N-三糖II、LNT、LNnT、乳糖-N-岩藻五糖I、乳糖-N-新岩藻五糖、乳糖-N-岩藻五糖II、乳糖-N-岩藻五糖III、乳糖-N-岩藻五糖V、乳糖-N-新岩藻五糖V、乳糖-N-二岩藻六糖I、乳糖-N-二岩藻六糖II、6’-半乳糖基乳糖、3’-半乳糖基乳糖、乳糖-N-六糖和乳糖-N-新六糖。
在某些实施方案中,所述一种或多种婴儿配方奶粉成分包含脱脂乳、碳水化合物源、蛋白源、脂肪源和/或维生素和矿物质。
在某些实施方案中,所述一种或多种婴儿配方奶粉成分包含乳糖、乳清蛋白浓缩物和/或高油酸红花油。
在某些实施方案中,在婴儿配方奶粉中的唾液酸化的寡糖的浓度与在人母乳中通常存在的唾液酸化的寡糖的浓度大致相同。
在某些实施方案中,将唾液酸化的寡糖掺入饲料制品中,其中所述饲料选自包含以下各项的列表:宠物食品、动物乳替代物、兽医产品、兽医饲料补充剂、营养补充剂、断奶后饲料或幼畜饲料。
如本文实施例中所示,新鉴定的唾液酸转运蛋白已经被证实可用于唾液酸化的二糖和/或寡糖的发酵生产。当使用本文定义的唾液酸转运蛋白时,本发明的方法和细胞优选地提供以下进一步惊人优点中的至少一种:
与具有相同遗传背景但缺乏同源和/或异源唾液酸转运蛋白的表达和/或内源唾液酸转运蛋白的(过)表达的唾液酸化的二糖和/或寡糖的生产宿主相比,
-高和/或更好的唾液酸化的二糖和/或寡糖的滴度(g/L),
-高和/或更好的生产率r(g唾液酸化的二糖和/或寡糖/L/h),
-高和/或更好的细胞性能指标CPI(g唾液酸化的二糖和/或寡糖/g X),
-高和/或更好的比生产率Qp(g唾液酸化的二糖和/或寡糖/g X/h),
-高和/或更好的以蔗糖计算的产率Ys(g唾液酸化的二糖和/或寡糖/g蔗糖),
-高和/或更好的蔗糖摄取/转化率Qs(g蔗糖/g X/h),
-高和/或更好的乳糖转化/消耗率rs(g乳糖/h),
-高和/或增强的唾液酸化的二糖和/或寡糖的排出或分泌,和/或
-高和/或增强的生产宿主的生长速度。
除非另外定义,否则在本文中使用的所有技术和科学术语通常具有与本发明所属领域的普通技术人员通常理解的相同的含义。通常,本文使用的命名法以及在上文和在下文描述的细胞培养、分子遗传学、有机化学和核酸化学和杂交中的实验室程序是本领域中众所周知的和常用的那些。将标准技术用于核酸和肽合成。通常,根据制造商的说明书进行纯化步骤。
从具体实施方案和实施例中可以得出其它优点。不言而喻,上述特征和下文仍要解释的特征不仅可以以分别指定的组合使用,而且可以以其它组合或单独使用,而不脱离本发明的范围。
此外,本发明涉及下述具体实施方案:
1.用于产生唾液酸化的二糖和/或寡糖的代谢工程改造的微生物细胞,所述细胞包含用于产生所述唾液酸化的二糖和/或寡糖的途径,特征在于,所述细胞:
-合成唾液酸,
-表达至少一种唾液酸转移酶,优选地在至少一种唾液酸转移酶的表达或活性方面被修饰,
-被修饰成具有完全地或部分地敲除的或功能更低的唾液酸分解代谢途径,和
-被修饰用于内源性唾液酸转运蛋白的过表达和/或外源性、同源性和/或异源性唾液酸转运蛋白的表达,
优选地,所述细胞在所述唾液酸转移酶中的任一种的表达或活性方面被修饰。
2.根据实施方案1所述的细胞,其中用于产生所述唾液酸化的二糖和/或寡糖的所述途径包含唾液酸化途径。
3.根据实施方案2的细胞,其中所述唾液酸化途径包含唾液酸转移酶与至少一种选自包含以下各项的列表的酶相组合:N-酰基葡糖胺2-差向异构酶、UDP-N-乙酰葡糖胺2-差向异构酶、N-乙酰甘露糖胺-6-磷酸2-差向异构酶、UDP-GlcNAc 2-差向异构酶/激酶水解、N-酰基神经氨酸-9-磷酸合成酶、磷酸酶、N-乙酰神经氨酸合酶和N-酰基神经氨酸胞苷酰基转移酶,
优选地,其中所述细胞在所述酶中的任何一种或多种的表达或活性方面被修饰。
4.根据前述实施方案中任一项所述的细胞,其中所述唾液酸转移酶选自包含以下各项的列表:α-2,3-唾液酸转移酶、α-2,6-唾液酸转移酶和α-2,8-唾液酸转移酶。
5.根据前述实施方案中任一项所述的细胞,其中所述唾液酸转运蛋白选自转运体(porters)和P-P-键水解驱动的转运蛋白的组,其中
a)当所述唾液酸转运蛋白选自转运体的组时,所述唾液酸转运蛋白选自-TCDB类别的组:2.A.1.12、2.A.21.3和2.A.56.1,或
-eggnog家族的组:1MU0F、1MUNB、1MVHH、1MWKH、1R4VK、1RJ8K、1RMH7、1RNAM、1RPTE、1RQFS、1RZ3Z、1SA02、1TPNU、1TPVE、1TQCK、1XTIW、1XU43、1Y733、1Y7P0、1YAT3、258Y6、25E9U、25SBT、25Y42、26G88、27G1B、2IX6M、2TQBC、2TQW5、36UQA、3788V、3F50Z、3WG4Q、3WP13、3WTAI、3WVF7、3X1B1、3XP7A、3ZJ4T、404JV、41EHH、4BDTU、4C594、4GX8Z、4GY09、4H21M、4H9KW、4H9WK、4HB5K、4IEK0、COG0477、COG0591、COG1593、COG2704、COG2814、COG3055、COG3090和COG4666,或
-PFAM列表:PF00083、PF00474、PF04290、PF06808、PF07690和PF11874,或
-interpro列表:IPR001734、IPR004681、IPR004742、IPR005828、IPR005829、IPR007387、IPR010656、IPR011701、IPR011851、IPR011853、IPR015915、IPR018212、IPR020846、IPR021814、IPR025966、IPR036259和IPR038377,或
-具有SEQ ID NO 01的来自大肠杆菌的NanT,具有SEQ ID NO 02的来自小肠结肠炎耶尔森氏菌palearctica亚种血清型O:3的nanT,具有SEQ ID NO 03的来自布里纳氏布丘氏菌ATCC 51605的nanT,具有SEQ ID NO 04的来自大肠杆菌KTE75的NanT,或具有SEQ IDNO 05的来自短吻鳄支原体A21JP2的转运蛋白,具有SEQ ID NO 06的来自山羊支原体山羊亚种的转运蛋白,具有SEQ ID NO 07的来自金黄色葡萄球菌的转运蛋白,具有SEQ ID NO08的来自孪生球菌属种的转运蛋白,具有SEQ ID NO 09的来自艰难梭菌ATCC 9689的转运蛋白,具有SEQ ID NO 10的来自罗氏消化链球菌的转运蛋白,具有SEQ ID NO 11的来自阻塞芽孢杆菌的转运蛋白,具有SEQ ID NO 12的来自金黄色葡萄球菌(菌株MW2)的转运蛋白,具有SEQ ID NO 13的来自葡萄球菌属种HMSC070A03的转运蛋白,具有SEQ ID NO 14的来自鲸鲸杆菌的转运蛋白,具有SEQ ID NO 15的来自S.argensis的转运蛋白,具有SEQ ID NO16的来自施氏葡萄球菌的转运蛋白,具有SEQ ID NO 17的来自耳炎差异球菌ATCC 51267的转运蛋白,具有SEQ ID NO 18的来自蜥蜴纤细芽孢杆菌的转运蛋白,具有SEQ ID NO 19的来自费尔斯莫尔德乳杆菌的转运蛋白,具有SEQ ID NO 20的来自乳杆菌属种LL6的转运蛋白,具有SEQ ID NO 21的来自Agrilactobacillus composti的转运蛋白,具有SEQ ID NO22的来自卷曲乳杆菌的转运蛋白,具有SEQ ID NO 23的来自巴氏葡萄球菌的转运蛋白,具有SEQ ID NO 24的来自唾液乳杆菌cp400的转运蛋白,具有SEQ ID NO 25的来自L.apodemi的转运蛋白,具有SEQ ID NO 26的来自月形单胞菌属种口腔分类单元478的转运蛋白,具有SEQ ID NO 27的来自索氏梭菌的转运蛋白,具有SEQ ID NO 28的来自食甲基丁酸杆菌的转运蛋白,具有SEQ ID NO 29的来自假硬碱性卤杆菌的转运蛋白,具有SEQ ID NO 30的来自缓症链球菌(菌株B6)的转运蛋白,具有SEQ ID NO 31的来自绿色气球菌的转运蛋白,具有SEQ ID NO 32的来自Anaerobiospirillum thomasii的转运蛋白,具有SEQ ID NO 33的来自溶血梭菌NCTC 8350的转运蛋白,具有SEQ ID NO 34或SEQ ID NO 35的来自嗜热丁酸梭菌的转运蛋白,具有SEQ ID NO 36的来自Romboutsia ilealis的转运蛋白,具有SEQ ID NO37的来自单形巨单胞菌YIT 11815的转运蛋白,具有SEQ ID NO 38的来自球形赖氨酸芽孢杆菌的转运蛋白,具有SEQ ID NO 39的来自未培养的梭菌属种的转运蛋白,具有SEQ ID NO40的来自平野梭菌的转运蛋白,具有SEQ ID NO 41的来自C.niameyense的转运蛋白,具有SEQ ID NO 42的来自分节丝状菌SFB-土耳其种的转运蛋白,具有SEQ ID NO 43的来自Suttonella ornithocola的siaT_5,具有SEQ ID NO 44的来自多杀巴斯德氏菌多杀亚种OH4807的转运蛋白,具有SEQ ID NO 45的来自P.skyensis的转运蛋白,具有SEQ ID NO 46的来自猫嗜血杆菌的转运蛋白,具有SEQ ID NO 47的来自变形菌纲细菌的转运蛋白,具有SEQ ID NO 48的来自Pasteurella mairii的转运蛋白,具有SEQ ID NO 49的来自产吲哚萨顿氏菌的转运蛋白,具有SEQ ID NO 50的来自犬梭杆菌的转运蛋白,具有SEQ ID NO 51的来自变形梭杆菌的转运蛋白,具有SEQ ID NO 52的来自坏死梭杆菌的转运蛋白,具有SEQID NO 53的来自人心杆菌的转运蛋白,具有SEQ ID NO 54的来自伴放线放线杆菌RhAA1的转运蛋白,或具有SEQ ID NO 55的来自贝氏巴斯德氏菌CCUG 2042的转运蛋白,或SEQ IDNO 01、02、03、04、05、06、07、08、09、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54或55中的任一个的功能同系物、变体或衍生物,其分别与具有SEQ ID NO01、02、03、04、05、06、07、08、09、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54或55的所述多肽中的任一种的全长序列具有至少80%总体序列同一性并且具有唾液酸转运蛋白活性;
b)当所述唾液酸转运蛋白选自P-P-键水解驱动的转运蛋白的组时,所述唾液酸转运蛋白选自
-TCDB类别3.A.1.5,或
-eggnog家族的组:1MU8Z、1MUZH、1NU4K、1R4KB、1RNFB、1RS1R、1SKPD、1SMBI、1Y72G、1Y72H、1Y7EZ、1Y7FQ、COG0444、COG0601、COG0747、COG1173和COG4608,或
-PFAM列表:PF00005、PF00496、PF00528和PF08352,或
-interpro列表:IPR000515、IPR000914、IPR003439、IPR003593、IPR006311、IPR013563、IPR017871、IPR027417、IPR030678、IPR035906和IPR039424,或
-具有SEQ ID NO 56、57、58或59的来自副兔嗜血菌的ABC转运蛋白,或SEQ ID NO56、57、58或59中的任一个的功能同系物、变体或衍生物,其分别与具有SEQ ID NO 56、57、58或59的多肽中的任一种的全长序列具有至少80%总体序列同一性并且具有唾液酸转运蛋白活性;
其中所述TCDB类别按照2019年6月17日发布的TCDB.org进行定义,所述eggnog家族按照2018年11月发布的eggnogdb 5.0.0进行定义,所述PFAM列表按照2018年9月发布的Pfam 32.0进行定义,所述interpro列表按照2019年7月4日发布的InterPro 75.0进行定义。
6.根据前述实施方案中任一项所述的细胞,其中所述唾液酸转运蛋白选自由以下成员组成的转运蛋白组:
a)具有SEQ ID NO 01的来自大肠杆菌的转运体NanT,具有SEQ ID NO 02的来自小肠结肠炎耶尔森氏菌palearctica亚种血清型O:3的nanT,具有SEQ ID NO 03的来自布里纳氏布丘氏菌ATCC 51605的nanT,具有SEQ ID NO 04的来自大肠杆菌KTE75的NanT,或具有SEQ ID NO 05的来自短吻鳄支原体A21JP2的转运蛋白,具有SEQ ID NO 06的来自山羊支原体山羊亚种的转运蛋白,具有SEQ ID NO 07的来自金黄色葡萄球菌的转运蛋白,具有SEQID NO 08的来自孪生球菌属种的转运蛋白,具有SEQ ID NO 09的来自艰难梭菌ATCC 9689的转运蛋白,具有SEQ ID NO 10的来自罗氏消化链球菌的转运蛋白,具有SEQ ID NO 11的来自阻塞芽孢杆菌的转运蛋白,具有SEQ ID NO 12的来自金黄色葡萄球菌(菌株MW2)的转运蛋白,具有SEQ ID NO 13的来自葡萄球菌属种HMSC070A03的转运蛋白,具有SEQ ID NO14的来自鲸鲸杆菌的转运蛋白,具有SEQ ID NO 15的来自S.argensis的转运蛋白,具有SEQID NO 16的来自施氏葡萄球菌的转运蛋白,具有SEQ ID NO 17的来自耳炎差异球菌ATCC51267的转运蛋白,具有SEQ ID NO 18的来自蜥蜴纤细芽孢杆菌的转运蛋白,具有SEQ IDNO 19的来自费尔斯莫尔德乳杆菌的转运蛋白,具有SEQ ID NO 20的来自乳杆菌属种LL6的转运蛋白,具有SEQ ID NO 21的来自Agrilactobacillus composti的转运蛋白,具有SEQID NO 22的来自卷曲乳杆菌的转运蛋白,具有SEQ ID NO 23的来自巴氏葡萄球菌的转运蛋白,具有SEQ ID NO 24的来自唾液乳杆菌cp400的转运蛋白,具有SEQ ID NO 25的来自L.apodemi的转运蛋白,具有SEQ ID NO 26的来自月形单胞菌属种口腔分类单元478的转运蛋白,具有SEQ ID NO 27的来自索氏梭菌的转运蛋白,具有SEQ ID NO 28的来自食甲基丁酸杆菌的转运蛋白,具有SEQ ID NO 29的来自假硬碱性卤杆菌的转运蛋白,具有SEQ ID NO30的来自缓症链球菌(菌株B6)的转运蛋白,具有SEQ ID NO 31的来自绿色气球菌的转运蛋白,具有SEQ ID NO 32的来自Anaerobiospirillum thomasii的转运蛋白,具有SEQ ID NO33的来自溶血梭菌NCTC 8350的转运蛋白,具有SEQ ID NO 34或SEQ ID NO 35的来自嗜热丁酸梭菌的转运蛋白,具有SEQ ID NO 36的来自Romboutsia ilealis的转运蛋白,具有SEQID NO 37的来自单形巨单胞菌YIT 11815的转运蛋白,具有SEQ ID NO 38的来自球形赖氨酸芽孢杆菌的转运蛋白,具有SEQ ID NO 39的来自未培养的梭菌属种的转运蛋白,具有SEQID NO 40的来自平野梭菌的转运蛋白,具有SEQ ID NO 41的来自C.niameyense的转运蛋白,具有SEQ ID NO 42的来自分节丝状菌SFB-土耳其种的转运蛋白,具有SEQ ID NO 43的来自Suttonella ornithocola的siaT_5,具有SEQ ID NO 44的来自多杀巴斯德氏菌多杀亚种OH4807的转运蛋白,具有SEQ ID NO 45的来自P.skyensis的转运蛋白,具有SEQ ID NO46的来自猫嗜血杆菌的转运蛋白,具有SEQ ID NO 47的来自变形菌纲细菌的转运蛋白,具有SEQ ID NO 48的来自Pasteurella mairii的转运蛋白,具有SEQ ID NO 49的来自产吲哚萨顿氏菌的转运蛋白,具有SEQ ID NO 50的来自犬梭杆菌的转运蛋白,具有SEQ ID NO 51的来自变形梭杆菌的转运蛋白,具有SEQ ID NO 52的来自坏死梭杆菌的转运蛋白,具有SEQID NO 53的来自人心杆菌的转运蛋白,具有SEQ ID NO 54的来自伴放线放线杆菌RhAA1的转运蛋白,或具有SEQ ID NO 55的来自贝氏巴斯德氏菌CCUG 2042的转运蛋白,或SEQ IDNO 01、02、03、04、05、06、07、08、09、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54或55中的任一个的功能同系物、变体或衍生物,其分别与具有SEQ ID NO01、02、03、04、05、06、07、08、09、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54或55的所述多肽中的任一种的全长序列具有至少80%总体序列同一性并且具有唾液酸转运蛋白活性;
优选为具有SEQ ID NO 01的来自大肠杆菌的转运体NanT,具有SEQ ID NO 02的来自小肠结肠炎耶尔森氏菌palearctica亚种血清型O:3的nanT,具有SEQ ID NO 03的来自布里纳氏布丘氏菌ATCC 51605的nanT,具有SEQ ID NO 04的来自大肠杆菌KTE75的NanT,具有SEQ ID NO 24的来自唾液乳杆菌cp400的转运蛋白,或具有SEQ ID NO 43的来自Suttonella ornithocola的siaT_5,或SEQ ID NO 01、02、03、04、24或43中的任一个的功能同系物、变体或衍生物,其分别与具有SEQ ID NO 01、02、03、04、24或43的所述优选多肽中的任一种的全长序列具有至少80%总体序列同一性并且具有唾液酸转运蛋白活性;和
b)具有SEQ ID NO 56、57、58或59的来自副兔嗜血菌的P-P-键水解驱动的转运蛋白,或SEQ ID NO 56、57、58或59中的任一个的功能同系物、变体或衍生物,其分别与具有SEQ ID NO 56、57、58或59的多肽中的任一种的全长序列具有至少80%总体序列同一性并且具有唾液酸转运蛋白活性。
7.根据前述实施方案中任一项所述的细胞,其中所述唾液酸转运蛋白是参与唾液酸穿过细胞质膜的流入和/或流出(优选进入细胞和/或从细胞出来)的转运蛋白。
8.根据前述实施方案中任一项所述的细胞,其中在用于产生所述唾液酸化的二糖和/或寡糖的所述途径中涉及的所述唾液酸转运蛋白和/或酶中的任一种以在一个或多个基因表达模块中被呈递给细胞,其中表达由一种或多种调控序列调控。
9.根据实施方案8所述的细胞,其中所述表达模块整合到宿主细胞的基因组中和/或在载体上呈递给细胞,所述载体包括质粒、粘粒、噬菌体、脂质体或病毒,所述载体将被稳定地转化到所述宿主细胞中。
10.根据前述实施方案中任一项所述的细胞,其中所述细胞能够合成N-乙酰甘露糖胺(ManNAc)、N-乙酰甘露糖胺-6-磷酸(ManNAc-6-磷酸)和/或磷酸烯醇丙酮酸(PEP)。
11.根据前述实施方案中任一项所述的细胞,其中所述细胞被修饰以增强PEP的合成和/或供应。
12.根据前述实施方案中任一项所述的细胞,其中所述细胞还能够合成任何一种或多种核苷酸活化的糖。
13.根据实施方案12所述的细胞,其中所述核苷酸活化的糖选自包含以下各项的列表:UDP-N-乙酰葡糖胺(UDP-GlcNAc)、UDP-N-乙酰半乳糖胺(UDP-GalNAc)、UDP-N-乙酰甘露糖胺(UDP-ManNAc)、UDP-葡萄糖(UDP-Glc)、UDP-半乳糖(UDP-Gal)、GDP-甘露糖(GDP-Man)、UDP-葡糖醛酸酯、UDP-半乳糖醛酸酯、UDP-2-乙酰氨基-2,6-二脱氧--L-阿拉伯型-4-己酮糖、UDP-2-乙酰氨基-2,6-二脱氧--L-来苏-4-己酮糖、UDP-N-乙酰基-L-鼠李糖胺(UDP-L-RhaNAc或UDP-2-乙酰氨基-2,6-二脱氧-L-甘露糖)、dTDP-N-乙酰基岩藻糖胺、UDP-N-乙酰基岩藻糖胺(UDP-L-FucNAc或UDP-2-乙酰氨基-2,6-二脱氧-L-半乳糖)、UDP-N-乙酰基-L-纽莫糖胺(UDP-L-PneNAC或UDP-2-乙酰氨基-2,6-二脱氧-L-塔罗糖)、UDP-N-乙酰基胞壁酸、UDP-N-乙酰基-L-奎诺糖胺(UDP-L-QuiNAc或UDP-2-乙酰氨基-2,6-二脱氧-L-葡萄糖)、CMP-唾液酸(CMP-Neu5Ac)、CMP-Neu4Ac、CMP-Neu5Ac9N3、CMP-Neu4,5Ac2、CMP-Neu5,7Ac2、CMP-Neu5,9Ac2、CMP-Neu5,7(8,9)Ac2、CMP-N-羟乙酰基神经氨酸(CMP-Neu5Gc)、GDP-岩藻糖(GDP-Fuc)、GDP-鼠李糖和UDP-木糖。
14.根据实施方案12或13中任一项所述的细胞,其中所述核苷酸活化的糖由至少一种选自包含以下各项的列表的酶合成:甘露糖-6-磷酸异构酶、磷酸甘露糖变位酶、甘露糖-1-磷酸鸟苷酰基转移酶、GDP-甘露糖4,6-脱水酶、GDP-L-岩藻糖合酶、L-岩藻糖激酶/GDP-岩藻糖焦磷酸化酶、L-谷氨酰胺-D-果糖-6-磷酸氨基转移酶、葡糖胺-6-磷酸脱氨酶、磷酸葡糖胺变位酶、N-乙酰葡糖胺-6-磷酸脱乙酰酶、N-酰基葡糖胺2-差向异构酶、UDP-N-乙酰葡糖胺2-差向异构酶、葡糖胺6-磷酸N-乙酰基转移酶、N-乙酰葡糖胺-6-磷酸磷酸酶、N-乙酰甘露糖胺-6-磷酸磷酸酶、N-乙酰甘露糖胺激酶、N-乙酰甘露糖胺-6-磷酸2-差向异构酶、磷酸乙酰葡糖胺变位酶、N-乙酰葡糖胺-1-磷酸尿苷酰基转移酶、葡糖胺-1-磷酸乙酰基转移酶、唾液酸合酶、N-乙酰神经氨酸裂合酶、N-酰基神经氨酸-9-磷酸合酶、N-酰基神经氨酸-9-磷酸酶、CMP-唾液酸合成酶、半乳糖-1-差向异构酶、半乳糖激酶、葡糖激酶、半乳糖-1-磷酸尿苷酰基转移酶、UDP-葡萄糖4-差向异构酶、葡萄糖-1-磷酸尿苷酰基转移酶、磷酸葡萄糖变位酶、UDP-N-乙酰葡糖胺4-差向异构酶、N-乙酰半乳糖胺激酶和UDP-GalNAc焦磷酸化酶。
15.根据前述实施方案中任一项所述的细胞,其中所述细胞进一步表达选自包含以下各项的列表的糖基转移酶:岩藻糖基转移酶、半乳糖基转移酶、葡萄糖基转移酶、甘露糖基转移酶、N-乙酰葡糖胺基转移酶、N-乙酰基半乳糖胺基转移酶、N-乙酰甘露糖胺基转移酶、木糖基转移酶、葡糖醛酸基转移酶、半乳糖醛酸转移酶、葡糖胺基转移酶、N-羟乙酰基神经氨酰基转移酶、鼠李糖基转移酶、N-乙酰基鼠李糖基转移酶、UDP-4-氨基-4,6-二脱氧-N-乙酰基-β-L-阿卓糖胺转氨酶、UDP-N-乙酰葡糖胺烯醇丙酮酰基转移酶和岩藻糖胺基转移酶,
-优选地,其中所述细胞在所述糖基转移酶中的至少一种的表达或活性方面被修饰,
-优选地,所述岩藻糖基转移酶选自包含以下各项的列表:α-1,2-岩藻糖基转移酶、α-1,3-岩藻糖基转移酶、α-1,4-岩藻糖基转移酶、α-1,3/4-岩藻糖基转移酶和α-1,6-岩藻糖基转移酶,
-优选地,所述半乳糖基转移酶选自包含以下各项的列表:β-1,3-半乳糖基转移酶、N-乙酰葡糖胺β-1,3-半乳糖基转移酶、β-1,4-半乳糖基转移酶、N-乙酰葡糖胺β-1,4-半乳糖基转移酶、α-1,3-半乳糖基转移酶和α-1,4-半乳糖基转移酶,
-优选地,所述葡萄糖基转移酶选自包含以下各项的列表:α-葡萄糖基转移酶、β-1,2-葡萄糖基转移酶、β-1,3-葡萄糖基转移酶和β-1,4-葡萄糖基转移酶,
-优选地,所述甘露糖基转移酶选自包含以下各项的列表:α-1,2-甘露糖基转移酶、α-1,3-甘露糖基转移酶和α-1,6-甘露糖基转移酶,
-优选地,所述N-乙酰葡糖胺基转移酶选自包含以下各项的列表:半乳糖苷β-1,3-N-乙酰葡糖胺基转移酶和β-1,6-N-乙酰葡糖胺基转移酶,
-优选地,所述N-乙酰基半乳糖胺基转移酶选自包含以下各项的列表:α-1,3-N-乙酰基半乳糖胺基转移酶。
16.根据前述实施方案中任一项所述的细胞,其中所述细胞包含岩藻糖基化途径,其包含至少一种选自包含以下各项的列表的酶:甘露糖-6-磷酸异构酶、磷酸甘露糖变位酶、甘露糖-1-磷酸鸟苷酰基转移酶、GDP-甘露糖4,6-脱水酶、GDP-L-岩藻糖合酶、岩藻糖通透酶、岩藻糖激酶、岩藻糖-1-磷酸鸟苷酰基转移酶、L-岩藻糖激酶/GDP-岩藻糖焦磷酸化酶和岩藻糖基转移酶。
17.根据前述实施方案中任一项所述的细胞,其中所述细胞包含半乳糖基化途径,其包含至少一种选自包含以下各项的列表的酶:半乳糖-1-差向异构酶、半乳糖激酶、葡糖激酶、半乳糖-1-磷酸尿苷酰基转移酶、UDP-葡萄糖4-差向异构酶、葡萄糖-1-磷酸尿苷酰基转移酶、磷酸葡萄糖变位酶和半乳糖基转移酶。
18.根据前述实施方案中的任一个的细胞,其中所述细胞包含N-乙酰葡糖胺基化途径,其包含至少一种选自包含以下各项的列表的酶:L-谷氨酰胺-D-果糖-6-磷酸氨基转移酶、N-乙酰葡糖胺-6-磷酸脱乙酰酶、磷酸葡糖胺变位酶、N-乙酰葡糖胺-1-磷酸尿苷酰基转移酶/葡糖胺-1-磷酸乙酰基转移酶、N-乙酰葡糖胺基转移酶。
19.根据前述实施方案中任一项所述的细胞,其中所述细胞包含减少的乙酸盐或酯产生的修饰。
20.根据前述实施方案中任一项所述的细胞,其中所述细胞进一步包含蛋白中的任何一种或多种的更低的或减少的表达和/或消除的、受损的、减少的或延迟的活性,所述蛋白包含β-半乳糖苷酶、半乳糖苷O-乙酰基转移酶、N-乙酰葡糖胺-6-磷酸脱乙酰酶、葡糖胺-6-磷酸脱氨酶、N-乙酰葡糖胺阻遏物、核糖核苷酸单磷酸酶、EIICBA-Nag、UDP-葡萄糖:十一异戊二烯基-磷酸葡萄糖-1-磷酸转移酶、L-墨角藻糖激酶、L-岩藻糖异构酶、EIIAB-Man、EIIC-Man、EIID-Man、ushA、半乳糖-1-磷酸尿苷酰基转移酶、葡萄糖-1-磷酸腺苷酰基转移酶、葡萄糖-1-磷酸酶、ATP依赖性的6-磷酸果糖激酶同工酶1、ATP依赖性的6-磷酸果糖激酶同工酶2、葡萄糖-6-磷酸异构酶、好氧性呼吸控制蛋白、转录阻遏物IclR、lon蛋白酶、葡萄糖特异性的转位磷酸转移酶IIBC组分ptsG、葡萄糖特异性的转位磷酸转移酶(PTS)酶IIBC组分malX、酶IIAGlc、β-葡萄糖苷特异性的PTS酶II、果糖特异性的PTS多磷酰基转移蛋白FruA和FruB、乙醇脱氢酶醛脱氢酶、丙酮酸-甲酸裂合酶、乙酸激酶、磷酸酰基转移酶、磷酸乙酰基转移酶、丙酮酸脱羧酶。
21.根据前述实施方案中任一项所述的细胞,其中所述细胞包含至少部分地灭活的所选单糖、二糖或寡糖的分解代谢途径,所选单糖、二糖或寡糖参与所述唾液酸化的二糖和/或寡糖的合成和/或是所述唾液酸化的二糖和/或寡糖的合成所必需的。
22.根据前述实施方案中任一项所述的细胞,其中所述细胞使用前体来合成所述唾液酸化的二糖和/或寡糖,所述前体从所述培养基给料给所述细胞。
23.根据前述实施方案中任一项所述的细胞,其中所述细胞产生用于合成所述唾液酸化的二糖和/或寡糖的前体。
24.根据前述实施方案中任一项所述的细胞,其中所述细胞在整个培养液和/或上清液中产生90g/L或更多的所述唾液酸化的二糖和/或寡糖,和/或其中所述唾液酸化的二糖和/或寡糖在整个培养液和/或上清液中具有至少80%的纯度,这按照分别在整个培养液和/或上清液中所述细胞产生的唾液酸化的二糖和/或寡糖及其前体的总量进行测量。
25.根据前述实施方案中任一项所述的细胞,其中所述唾液酸化的二糖和/或寡糖选自包含以下各项的列表:乳寡糖、O-抗原、在荚膜多糖中存在的寡糖重复单位、肽聚糖、氨基-糖和Lewis-型抗原寡糖,优选地所述乳寡糖是哺乳动物乳寡糖,更优选地所述乳寡糖是人乳寡糖。
26.根据前述实施方案中任一项所述的细胞,其中所述细胞是细菌、真菌或酵母,
-优选地所述细菌属于大肠杆菌菌株,更优选地属于作为K-12菌株的大肠杆菌菌株,甚至更优选地所述大肠杆菌K-12菌株是大肠杆菌MG1655,
-优选地所述真菌属于选自包括以下各项的组的属:根霉菌属、盘基网柄菌属、青霉属、毛霉菌属或曲霉菌属,
-优选地所述酵母属于选自包括以下各项的组的属:酵母属、接合酵母属、毕赤酵母属、驹形氏酵母、汉逊酵母属、耶氏酵母属、斯塔莫酵母、克鲁维酵母属或德巴利酵母属。
27.根据前述实施方案中任一项所述的细胞,其中所述细胞在培养基中稳定地培养。
28.根据前述实施方案中任一项所述的细胞,其中所述细胞能够合成寡糖的混合物,其包含至少一种唾液酸化的寡糖。
29.根据前述实施方案中任一项所述的细胞,其中所述细胞能够合成二糖和寡糖的混合物,其包含至少一种唾液酸化的二糖和/或寡糖。
30.由微生物细胞产生唾液酸化的二糖和/或寡糖的方法,所述方法包括以下步骤:
1)提供根据实施方案1至29中任一项所述的细胞,和
2)在允许产生所述唾液酸化的二糖和/或寡糖的条件下培养所述细胞,
3)优选地,从培养物中分离所述唾液酸化的二糖和/或寡糖。
31.根据实施方案30的方法,其中>95%的由所述细胞合成的所述唾液酸被用于产生所述唾液酸化的二糖和/或寡糖。
32.根据实施方案30或31中任一项所述的方法,所述方法进一步包括下述步骤中的至少一个:
i)使用包含至少一种前体和/或受体的培养基来产生所述唾液酸化的二糖和/或寡糖,和/或
ii)向所述培养基中加入至少一种用于产生所述唾液酸化的二糖和/或寡糖的前体和/或受体补料。
33.根据实施方案30至32中任一项所述的方法,所述方法进一步包括下述步骤中的至少一个:
i)使用包含至少一种前体和/或受体的培养基;
ii)向在反应器中的培养基中加入至少一种前体和/或受体补料,其中总反应器体积的范围为250mL(毫升)至10.000m3(立方米),优选以连续方式加入,且优选使得所述培养基的终体积是在加入所述前体和/或受体补料之前培养基体积的不超过3倍、优选不超过2倍、更优选小于2倍;
iii)向在反应器中的培养基中加入至少一种前体和/或受体补料,其中总反应器体积的范围为250mL(毫升)至10.000m3(立方米),优选以连续方式加入,且优选使得所述培养基的终体积是在加入所述前体和/或受体补料之前培养基体积的不超过3倍、优选不超过2倍、更优选小于2倍,并且其中优选地,将所述前体和/或受体补料的pH设定在2.0至10.0,并且其中优选地,将所述前体和/或受体补料的温度保持在20℃至80℃;
iv)借助于补料溶液历时1天、2天、3天、4天、5天将至少一种前体和/或受体补料以连续方式加入所述培养基中;
v)借助于补料溶液历时1天、2天、3天、4天、5天将至少一种前体和/或受体补料以连续方式加入所述培养基中,并且其中优选地,将所述补料溶液(优选所述前体和/或受体补料)的pH设定在2.0至10.0,优选在3至7,并且其中优选地,将所述补料溶液(优选所述前体和/或受体补料)的温度保持在20℃至80℃;
所述方法产生在所述培养基的终体积中具有至少50g/L、优选至少75g/L、更优选至少90g/L、更优选至少100g/L、更优选至少125g/L、更优选至少150g/L、更优选至少175g/L、更优选至少200g/L的浓度的唾液酸化的二糖和/或寡糖。
34.根据实施方案30至32中任一项所述的方法,所述方法进一步包括下述步骤中的至少一个:
i)使用包含至少50、更优选至少75、更优选至少100、更优选至少120、更优选至少150克前体/升初始反应器体积的培养基,其中总反应器体积的范围为250mL至10.000m3(立方米);
ii)使用包含至少50、更优选至少75、更优选至少100、更优选至少120、更优选至少150克受体/升初始反应器体积的培养基,其中总反应器体积的范围为250mL至10.000m3(立方米);
iii)向在反应器中的培养基中加入前体补料,其包含至少50、更优选至少75、更优选至少100、更优选至少120、更优选至少150克前体/升初始反应器体积,其中总反应器体积的范围为250mL至10.000m3(立方米),优选以连续方式加入,且优选使得所述培养基的终体积是在加入所述前体补料之前培养基体积的不超过3倍、优选不超过2倍、更优选小于2倍;
iv)向在反应器中的培养基中加入受体补料,其包含至少50、更优选至少75、更优选至少100、更优选至少120、更优选至少150克受体/升初始反应器体积,其中总反应器体积的范围为250mL至10.000m3(立方米),优选以连续方式加入,且优选使得所述培养基的终体积是在加入所述受体补料之前培养基体积的不超过3倍、优选不超过2倍、更优选小于2倍;
v)向在反应器中的培养基中加入前体补料,其包含至少50、更优选至少75、更优选至少100、更优选至少120、更优选至少150克前体/升初始反应器体积,其中总反应器体积的范围为250mL至10.000m3(立方米),优选以连续方式加入,且优选使得所述培养基的终体积是在加入所述前体补料之前培养基体积的不超过3倍、优选不超过2倍、更优选小于2倍,并且其中优选地,将所述前体补料的pH设定在2.0至10.0,并且其中优选地,将所述前体补料的温度保持在20℃至80℃;
vi)向在反应器中的培养基中加入受体补料,其包含至少50、更优选至少75、更优选至少100、更优选至少120、更优选至少150克受体/升初始反应器体积,其中总反应器体积的范围为250mL至10.000m3(立方米),优选以连续方式加入,且优选使得所述培养基的终体积是在加入所述受体补料之前培养基体积的不超过3倍、优选不超过2倍、更优选小于2倍,并且其中优选地,将所述受体补料的pH设定在2.0至10.0,并且其中优选地,将所述受体补料的温度保持在20℃至80℃;
vii)借助于补料溶液历时1天、2天、3天、4天、5天以连续方式向所述培养基中加入前体和/或受体补料;
viii)借助于前体补料溶液历时1天、2天、3天、4天、5天以连续方式向所述培养基中加入前体补料,且其中所述前体补料溶液的浓度是50g/L、优选75g/L、更优选100g/L、更优选125g/L、更优选150g/L、更优选175g/L、更优选200g/L、更优选225g/L、更优选250g/L、更优选275g/L、更优选300g/L、更优选325g/L、更优选350g/L、更优选375g/L、更优选400g/L、更优选450g/L、更优选500g/L、甚至更优选550g/L、最优选600g/L,并且其中优选地,将所述前体补料溶液的pH设定在2.0至10.0,并且其中优选地,将所述前体补料溶液的温度保持在20℃至80℃;
ix)借助于受体补料溶液历时1天、2天、3天、4天、5天以连续方式向所述培养基中加入受体补料,且其中所述受体补料溶液的浓度是50g/L、优选75g/L、更优选100g/L、更优选125g/L、更优选150g/L、更优选175g/L、更优选200g/L、更优选225g/L、更优选250g/L、更优选275g/L、更优选300g/L、更优选325g/L、更优选350g/L、更优选375g/L、更优选400g/L、更优选450g/L、更优选500g/L、甚至更优选550g/L、最优选600g/L,并且其中优选地,将所述受体补料溶液的pH设定在2.0至10.0,并且其中优选地,将所述受体补料溶液的温度保持在20℃至80℃;
所述方法产生在所述培养基的终体积中具有至少50g/L、优选至少75g/L、更优选至少90g/L、更优选至少100g/L、更优选至少125g/L、更优选至少150g/L、更优选至少175g/L、更优选至少200g/L的浓度的唾液酸化的二糖和/或寡糖。
35.根据实施方案30至32中任一项所述的方法,所述方法进一步包括下述步骤中的至少一个:
i)使用包含至少50、更优选至少75、更优选至少100、更优选至少120、更优选至少150克乳糖/升初始反应器体积的培养基,其中总反应器体积的范围为250mL至10.000m3(立方米);
ii)向在反应器中的培养基中加入乳糖补料,其包含至少50、更优选至少75、更优选至少100、更优选至少120、更优选至少150克乳糖/升初始反应器体积,其中所述反应器体积的范围为250mL至10.000m3(立方米),优选以连续方式加入,且优选使得所述培养基的终体积是在加入所述乳糖补料之前培养基体积的不超过3倍、优选不超过2倍、更优选小于2倍;
iii)向在反应器中的培养基中加入乳糖补料,其包含至少50、更优选至少75、更优选至少100、更优选至少120、更优选至少150克乳糖/升初始反应器体积,其中总反应器体积的范围为250mL至10.000m3(立方米),优选以连续方式加入,且优选使得所述培养基的终体积是在加入所述乳糖补料之前培养基体积的不超过3倍、优选不超过2倍、更优选小于2倍,并且其中优选地,将所述乳糖补料的pH设定在2.0至10.0,优选在3至7,并且其中优选地,将所述乳糖补料的温度保持在20℃至80℃;
iv)借助于补料溶液历时1天、2天、3天、4天、5天以连续方式向所述培养基中加入乳糖补料;
v)借助于乳糖补料溶液历时1天、2天、3天、4天、5天以连续方式向所述培养基中加入乳糖补料,且其中所述乳糖补料溶液的浓度是50g/L、优选75g/L、更优选100g/L、更优选125g/L、更优选150g/L、更优选175g/L、更优选200g/L、更优选225g/L、更优选250g/L、更优选275g/L、更优选300g/L、更优选325g/L、更优选350g/L、更优选375g/L、更优选400g/L、更优选450g/L、更优选500g/L、甚至更优选550g/L、最优选600g/L;且其中优选地将所述乳糖补料溶液的pH设定在2.0至10.0,优选在3至7,并且其中优选地将所述乳糖补料溶液的温度保持在20℃至80℃;
所述方法产生从所述乳糖产生的唾液酸化的寡糖,其在所述培养基的终体积中具有至少50g/L、优选至少75g/L、更优选至少90g/L、更优选至少100g/L、更优选至少125g/L、更优选至少150g/L、更优选至少175g/L、更优选至少200g/L的浓度。
36.根据实施方案35所述的方法,其中通过从培养开始以至少5mM的浓度、优选以30、40、50、60、70、80、90、100、150mM的浓度、更优选以>300mM的浓度添加乳糖来完成乳糖补料。
37.根据实施方案35或36中任一项所述的方法,其中通过以一定浓度将乳糖加入培养基中,使得在整个培养的生产阶段中获得至少5mM、优选10mM或30mM的乳糖浓度,完成所述乳糖补料。
38.根据实施方案30至37中任一项所述的方法,其中将所述宿主细胞培养至少约60、80、100或约120小时或以连续方式培养。
39.根据实施方案30至38中任一项所述的方法,其中将所述细胞在培养基中培养,所述培养基包含:碳源,其包含单糖、二糖、寡糖、多糖、多元醇、甘油;复合培养基,其包括糖蜜、玉米浆、蛋白胨、胰蛋白胨或酵母提取物;优选地,其中所述碳源选自包含以下各项的列表:葡萄糖、甘油、果糖、蔗糖、麦芽糖、乳糖、阿拉伯糖、麦芽寡糖、麦芽三糖、山梨醇、木糖、鼠李糖、半乳糖、甘露糖、甲醇、乙醇、海藻糖、淀粉、纤维素、半纤维素、糖蜜、玉米浆、高果糖糖浆、乙酸盐、柠檬酸盐、乳酸盐和丙酮酸盐。
40.根据实施方案30至39中任一项所述的方法,其中所述细胞使用至少一种前体来合成所述唾液酸化的二糖和/或寡糖,优选地所述细胞使用两种或更多种前体来合成所述唾液酸化的二糖和/或寡糖。
41.根据实施方案30至40中任一项所述的方法,其中所述培养基含有至少一种选自包括以下各项的组的化合物:乳糖、半乳糖、唾液酸、岩藻糖、GlcNAc、GalNAc、乳糖-N-二糖(LNB)、N-乙酰基乳糖胺(LacNAc)。
42.根据实施方案30至41中任一项所述的方法,其中通过向所述培养基中添加基于碳的底物(优选葡萄糖或蔗糖)来提供指数细胞生长的第一阶段,然后在第二阶段将前体(优选乳糖)加入所述培养基中。
43.根据实施方案30至42中任一项所述的方法,其中所述细胞产生至少一种用于合成所述唾液酸化的二糖和/或寡糖的前体。
44.根据实施方案30至43中任一项所述的方法,其中用于合成所述唾液酸化的二糖和/或寡糖的所述前体被完全转化为所述唾液酸化的二糖和/或寡糖。
45.根据实施方案30至44中任一项所述的方法,其中将所述唾液酸化的二糖和/或寡糖与所述培养基和/或所述细胞分离。
46.根据实施方案30至45中任一项所述的方法,其中所述分离包括下述步骤中的至少一个:澄清、超滤、纳米过滤、两相分配、反渗透、微滤、活性炭或碳处理、用非离子表面活性剂处理、酶消化、切向流高效过滤、切向流超滤、电泳、亲和色谱法、离子交换色谱法、疏水相互作用色谱法和/或凝胶过滤、配体交换色谱法、电渗析。
47.根据实施方案30至46中任一项所述的方法,其中所述方法进一步包括所述唾液酸化的二糖和/或寡糖的纯化。
48.根据实施方案47所述的方法,其中所述纯化包括下述步骤中的至少一个:使用活性炭或碳、使用木炭、纳米过滤、超滤、电泳、酶处理或离子交换、温度调节、pH调节、使用碱性或酸性溶液的pH调节、使用醇、使用水性醇混合物、结晶、蒸发、沉淀、干燥、喷雾干燥、冻干、喷雾冷冻干燥、冷冻喷雾干燥、带状干燥、带式干燥、真空带状干燥、真空带式干燥、转鼓式干燥、滚筒干燥、真空转鼓式干燥或真空滚筒干燥。
49.选自SEQ ID NO 02、03、04、05、06、07、08、09、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、47、58或59的唾液酸转运蛋白、或SEQ ID NO01、02、03、04、05、06、07、08、09、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、47、58或59中的任一个的功能同系物、变体或衍生物在唾液酸化的二糖和/或寡糖的发酵生产中的用途,所述功能同系物、变体或衍生物分别与具有SEQ ID NO01、02、03、04、05、06、07、08、09、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、47、58或59的所述多肽中的任一种的全长序列具有至少80%总体序列同一性并且具有唾液酸转运蛋白活性。
50.实施方案1至27中任一项所述的细胞用于产生唾液酸化的二糖和/或寡糖的用途。
51.实施方案28所述的细胞用于产生寡糖的混合物的用途,所述混合物包含至少一种唾液酸化的寡糖。
52.实施方案29所述的细胞用于产生二糖和寡糖的混合物的用途,所述混合物包含至少一种唾液酸化的二糖和/或寡糖。
53.实施方案30至48中任一项所述的方法用于产生唾液酸化的二糖和/或寡糖的用途。
将在实施例中更详细地描述本发明。以下实施例将充当对本发明的进一步说明和澄清,并且无意是限制性的。
实施例
实施例1.蛋白结构域的鉴定
HMM是一种被称为轮廓隐马尔可夫模型(profile hidden Markov models)的概率模型。它将一组比对的蛋白表征为位置特异性的评分系统。根据氨基酸出现的频率,在序列比对中的每个位置处对氨基酸进行评分(Eddy,S.R.1998.Profile hidden Markovmodels.Bioinformatics.14:755-63)。HMM具有广泛的实用性,这从使用这种方法进行蛋白分类的众多数据库中可以清楚地看出,所述数据库包括Pfam、InterPro、SMART、TIGRFAM、PIRSF、PANTHER、SFLD、Superfamily和Gene3D。
在2019年6月13日发布的HMMER包3.2.1(http://hmmer.org/)中的HMMsearch可以使用该HMM来搜索序列数据库中的序列同系物。可以使用的序列数据库是例如、但不限于NCBI nr蛋白数据库(NR;https://www.ncbi.nlm.nih.gov/protein)、UniProtKnowledgebase(UniProtKB,https://www.uniprot.org/help/uniprotkb)和SWISS-PROT数据库(https://web.expasy.org/docs/swiss-prot_guideline.html)。
基于2019年7月4日发布的InterPro 75.0(https://www.ebi.ac.uk/interpro/)和使用2018年9月发布的Pfam 32.0(https://pfam.xfam.org/)的PFAM结构域对唾液酸转运蛋白分类。Pfam和InterPro数据库是蛋白家族的大型集合。还可以使用其它蛋白结构域如SMART(http://smart.embl-heidelberg.de/)、TIGRFAM(https://www.jcvi.org/tigrfams)、PIRSF(https://proteininformationresource.org/pirwww/dbinfo/pirsf.shtml)、PANTHER(http://pantherdb.org/)、SFLD(http://sfld.rbvi.ucsf.edu/archive/django/index.html)、Superfamily(http://supfam.org/)和Gene3D(http://gene3d.biochem.ucl.ac.uk/Gene3D/)、NCBI保守结构域(https://www.ncbi.nlm.nih.gov/Structure/cdd/wrpsb.cgi)。
通过在https://pfam.xfam.org/search#tabview=tab1(2018年9月发布)上的在线搜索完成PFAM结构域的鉴定。在“Curation&model”中下载所得到的家族的HMM。使用此模型对蛋白数据库的HMMsearch将鉴定新的家族成员。也可以从PFAM网站下载包含InterPro命中的序列。
通过使用在https://www.ebi.ac.uk/interpro/上的在线工具或InterProScan的独立版本(https://www.ebi.ac.uk/interpro/download.html)(二者基于2019年7月4日发布的InterPro 75.0),完成InterPro(超)家族、结构域和位点的鉴定。InterPro是一个综合数据库,组合了蛋白基序和结构域的许多数据库的信息。InterPro结构域和/或(超)家族的HMM可以从InterProScan获得,并且可以用于鉴定蛋白数据库中的新家族成员。包含InterPro命中的序列也可以从InterPro网站(“Protein Matched”)下载,或者可以在UniProt网站(https://www.uniprot.org)上查询。
实施例2.多肽序列之间的同一性百分比的计算
用于对比的序列比对方法是本领域众所周知的,这样的方法包括GAP、BESTFIT、BLAST、FASTA和TFASTA。GAP使用Needleman和Wunsch的算法(J.Mol.Biol.(1970)48:443-453)以寻找两个序列的总体(即跨全长序列)比对,其使匹配数最大化并使缺口数最小化。BLAST算法(Altschul等人,J.Mol.Biol.(1990)215:403-10)计算总体序列同一性百分比(即在全长序列上)并执行两个序列之间的相似性的统计分析。用于执行BLAST分析的软件可以通过美国国家生物技术信息中心(National Centre for BiotechnologyInformation,NCBI)公开获得。使用例如ClustalW多序列比对算法(1.83版),使用默认逐对比对参数和百分比评分方法,可以容易地鉴定同系物。使用在MatGAT软件包(Campanella等人,BMC Bioinformatics(2003)4:29)中可得到的方法之一,也可以确定相似性和同一性的总体百分比(即跨全长序列)。如本领域技术人员会明白的,可以进行少量手动编辑以优化保守基序之间的比对。此外,代替使用全长序列来鉴定同系物,还可以使用特定结构域来确定所谓的局部序列同一性。使用上述程序并使用默认参数,可以在整个核酸或氨基酸序列上(=在全长序列上进行局部序列同一性搜索,产生总体序列同一性评分)或者在选定的结构域或保守基序上(=在部分序列上进行局部序列同一性搜索,产生局部序列同一性评分)确定序列同一性值。对于局部比对,Smith-Waterman算法是特别有用的(Smith TF,Waterman MS(1981)J.Mol.Biol 147(1);195-7)。为了本发明的目的,使用MatGAT2.01(Campanella等人,2003,BMC Bioinformatics 4:29)确定同一性百分比。采用蛋白的以下默认参数:(1)缺口成本存在:12,延伸:2;(2)采用的矩阵是BLOSUM50。
实施例3.唾液酸转运蛋白的鉴定
在2021年3月4日从Uniprot(https://www.uniprot.org)提取在含有IPR005264(N-乙酰神经氨酸裂合酶)和IPR023945(N-乙酰甘露糖胺激酶)的基因附近的基因。使用默认参数将标识符输入EFI-基因组邻域工具(GENOME NEIGHBORHOOD TOOL,https://efi.igb.illinois.edu//efi-gnt/index.php)。对氨基酸序列进行完整性过滤(从起始密码子到终止密码子),并使用CD-HIT(http://weizhongli-lab.org/cd-hit/)以80%的序列同一性阈值进行分簇。下面列出了代表性序列。唾液酸转运蛋白属于四个不同的TCDB类别。第一组是TCDB类别2.A.1.12的MFS转运蛋白:具有SEQ ID NO 01的来自大肠杆菌K12MG1655的NanT,具有SEQ ID NO 02的来自小肠结肠炎耶尔森氏菌palearctica亚种血清型O:3的A0A0H3NU41(nanT),具有SEQ ID NO 03的来自布里纳氏布丘氏菌ATCC 51605的A0A1B7IK14(nanT)和具有SEQ ID NO 04的来自大肠杆菌KTE75的L3PL77(nanT)。第二组属于TCDB类别2.A.21.3:具有SEQ ID NO 05的来自短吻鳄支原体A21JP2的D4XVE0,具有SEQ ID NO 06的来自山羊支原体山羊亚种的A0A0C2VH96,具有SEQ ID NO 07的来自金黄色葡萄球菌的A0A0D3Q460,具有SEQ ID NO 08的来自孪生球菌属种的A0A533HZC4,具有SEQ ID NO 09的来自艰难梭菌ATCC 9689的A0A125V7I6,具有SEQ ID NO 10的来自罗氏消化链球菌的A0A1H8K9Q3,具有SEQ ID NO 11的来自阻塞芽孢杆菌的A0A1L8ZSQ8,具有SEQ ID NO 12的来自金黄色葡萄球菌(菌株MW2)的A0A0H3JVD2,具有SEQ ID NO 13的来自葡萄球菌属种HMSC070A03的A0A1S1F7G7,具有SEQ ID NO 14的来自鲸鲸杆菌的A0A1T4NAC5,具有SEQ IDNO 15的来自S.argensis的A0A2K4FCH9,具有SEQ ID NO 16的来自施氏葡萄球菌的A0A0M4UEF4,具有SEQ ID NO 17的来自耳炎差异球菌ATCC 51267的K9EWT1,具有SEQ ID NO18的来自蜥蜴纤细芽孢杆菌的A0A317KV18,具有SEQ ID NO 19的来自费尔斯莫尔德乳杆菌的A0A0R1S9A9,具有SEQ ID NO 20的来自乳杆菌属种LL6的A0A556U9X1,具有SEQ ID NO 21的来自Agrilactobacillus composti的A0A0R1Y239,具有SEQ ID NO 22的来自卷曲乳杆菌的A0A2N5L0P0,具有SEQ ID NO 23的来自巴氏葡萄球菌的A0A431ZS05,具有SEQ ID NO 24的来自唾液乳杆菌cp400的LSCP400_11881,具有SEQ ID NO 25的来自L.apodemi的A0A0R1TYU7,具有SEQ ID NO 26的来自月形单胞菌属种口腔分类单元478的A0A0K1FGD7,具有SEQ ID NO 27的来自索氏梭菌的A0A0C7PUW9,具有SEQ ID NO 28的来自食甲基丁酸杆菌的A0A1E7RYL9,具有SEQ ID NO 29的来自假硬碱性卤杆菌的A0A1Q8TWT1,具有SEQ ID NO30的来自缓症链球菌(菌株B6)的D3H850,具有SEQ ID NO 31的来自绿色气球菌的A0A2X0UKU9,具有SEQ ID NO 32的来自Anaerobiospirillum thomasii的A0A2X0VQ52,具有SEQ ID NO 33的来自溶血梭菌NCTC 8350的A0A0A0II53,分别具有SEQ ID NO 34或SEQ IDNO 35的来自嗜热丁酸梭菌的A0A1V4SXX4或N9WAN6,具有SEQ ID NO 36的来自Romboutsiailealis的A0A1V1HZG9,具有SEQ ID NO 37的来自单形巨单胞菌YIT 11815的H3KA61,具有SEQ ID NO 38的来自球形赖氨酸芽孢杆菌的A0A3P6L5Y9,具有SEQ ID NO 39的来自未培养的梭菌属种的A0A1C5UWV6,具有SEQ ID NO 40的来自平野梭菌的B6FWE2,具有SEQ ID NO41的来自C.niameyense的A0A6M0RCY3和具有SEQ ID NO 42的来自分节丝状菌SFB-土耳其种的A0A1B7LK65。第三组属于TCDB类别2.A.56.1:具有SEQ ID NO 43的来自Suttonellaornithocola的A0A380MYE0(siaT_5),具有SEQ ID NO 44的来自多杀巴斯德氏菌多杀亚种OH4807的A0A0E3V465,具有SEQ ID NO 45的来自P.skyensis的A0A1H7ZQG5,具有SEQ ID NO46的来自猫嗜血杆菌的A0A1T0B8S6,具有SEQ ID NO 47的来自变形菌纲细菌的A0A2G6EKL2,具有SEQ ID NO 48的来自Pasteurella mairii的A0A379B306,具有SEQ ID NO49的来自产吲哚萨顿氏菌的A0A380MWW9,具有SEQ ID NO 50的来自犬梭杆菌的A0A3P1USS0,具有SEQ ID NO 51的来自变形梭杆菌的A0A448MCK2,具有SEQ ID NO 52的来自坏死梭杆菌的A0A4V1QY13,具有SEQ ID NO 53的来自人心杆菌的C8N6B9,具有SEQ ID NO54的来自伴放线放线杆菌RhAA1的H0KGY6和具有SEQ ID NO 55的来自贝氏巴斯德氏菌CCUG2042的I3DJD6。第四组属于ABC转运蛋白类别3.A.1.5并存在于副兔嗜血菌中:具有SEQ IDNO 56的B0187_07585、具有SEQ ID NO 57的B0187_07590、具有SEQ ID NO 58的B0187_07595和具有SEQ ID NO 59的B0187_07600。
实施例4.材料和方法
大肠杆菌
培养基
Luria Broth(LB)培养基由1%胰蛋白胨蛋白胨(Difco,Erembodegem,比利时)、0.5%酵母提取物(Difco)和0.5%氯化钠(VWR,Leuven,比利时)组成。在96-孔平板或摇瓶中的培养实验所用的基本培养基含有2.00g/L NH4Cl、5.00g/L(NH4)2SO4、2.993g/LKH2PO4、7.315g/L K2HPO4、8.372g/L MOPS、0.5g/L NaCl、0.5g/L MgSO4.7H2O、30g/L蔗糖或30g/L甘油、1ml/L维生素溶液、100μl/L钼酸盐溶液和1mL/L硒溶液。如在各个实施例中具体说明的,将20g/L乳糖、20g/L LacNAc和/或20g/L LNB作为前体另外添加至培养基中。用1M KOH将基本培养基设定至7的pH。维生素溶液由3.6g/LFeCl2.4H2O、5g/L CaCl2.2H2O、1.3g/L MnCl2.2H2O、0.38g/L CuCl2.2H2O、0.5g/L CoCl2.6H2O、0.94g/L ZnCl2、0.0311g/L H3BO4、0.4g/LNa2EDTA.2H2O和1.01g/L硫胺素.HCl组成。钼酸盐溶液含有0.967g/LNaMoO4.2H2O。硒溶液含有42g/L Seo2。用于发酵的基本培养基含有6.75g/LNH4Cl、1.25g/L(NH4)2SO4、2.93g/L KH2PO4和7.31g/L KH2PO4、0.5g/LNaCl、0.5g/L MgSO4.7H2O、30g/L蔗糖或30g/L甘油、1mL/L维生素溶液、100μL/L钼酸盐溶液和1mL/L硒溶液,具有与上述相同的组成。如在各个实施例中具体说明的,将20g/L乳糖、20g/L LacNAc和/或20g/L LNB作为前体另外添加至培养基中。将复合培养基通过高压灭菌(121℃,21分钟)进行灭菌,并将基本培养基通过过滤(0.22μm Sartorius)进行灭菌。在必要时,通过添加抗生素来使培养基具有选择性:例如氯霉素(20mg/L)、羧苄青霉素(100mg/L)、壮观霉素(40mg/L)和/或卡那霉素(50mg/L)。
质粒
pKD46(Red辅助质粒,氨苄青霉素抗性)、pKD3(含有侧接FRT的氯霉素抗性(cat)基因)、pKD4(含有侧接FRT的卡那霉素抗性(kan)基因)和pCP20(表达FLP重组酶活性)质粒得自R.Cunin教授(比利时布鲁塞尔自由大学(Vrije Universiteit Brussel),在2007年获得)。将质粒维持在购自Invitrogen的宿主大肠杆菌DH5α(F-,phi80dlacZΔM15,Δ(lacZYA-argF)U169,deoR,recA1,endA1,hsdR17(rk-,mk+),phoA,supE44,λ-,thi-1,gyrA96,relA1)中。
菌株和突变
大肠杆菌K12 MG1655[λ-,F-,rph-1]于2007年3月得自大肠杆菌遗传保藏中心(美国),CGSC菌株#:7740。使用Datsenko和Wanner发表的技术(PNAS 97(2000),6640-6645)进行基因破坏、基因引入和基因替换。该技术是基于由λRed重组酶进行同源重组后的抗生素选择。翻转酶重组酶的后续催化会确保在最终的生产菌株中除去抗生素选择盒。使携带Red辅助质粒pKD46的转化体在10mL含有氨苄青霉素(100mg/L)和L-阿拉伯糖(10mM)的LB培养基中在30℃生长至0.6的OD600nm。通过用50mL冰冷的水洗涤细胞第一次并用1mL冰冷的水洗涤细胞第二次,使细胞呈电感受态。然后,将细胞重新悬浮于50μL冰冷的水中。使用GenePulserTM(BioRad)(600Ω、25μFD和250伏特)用50μL细胞和10-100ng直链双链-DNA产物进行电穿孔。在电穿孔以后,将细胞加入1mL LB培养基中,在37℃孵育1h,并最后铺板在含有25mg/L的氯霉素或50mg/L的卡那霉素的LB琼脂上以筛选抗生素抗性的转化体。使用在修饰区域上游和下游的引物通过PCR验证所选的突变体,并在LB琼脂中在42℃生长以丢失辅助质粒。试验突变体的氨苄青霉素敏感性。使用pKD3、pKD4及其衍生物为模板,通过PCR获得直链ds-DNA扩增子。所使用的引物的序列的一部分与模板互补,并且另一部分与染色体DNA上必须发生重组的一侧互补。对于基因组敲除,将同源性区域设计在感兴趣的基因的起始密码子和终止密码子的上游50个核苷酸和下游50个核苷酸。对于基因组敲入,必须尊重转录起始点(+1)。将PCR产物进行PCR纯化,用Dpnl消化,从琼脂糖凝胶中重新纯化,并悬浮在洗脱缓冲液(5mM Tris,pH 8.0)中。用pCP20质粒转化选定的突变体,该质粒是氨苄青霉素和氯霉素抗性的质粒,显示出温度敏感的复制和FLP合成的热诱导。在30℃选择氨苄青霉素抗性的转化体,然后在42℃在LB中纯化几个菌落,然后试验所有抗生素抗性和FLP辅助质粒的丧失。使用对照引物检查基因敲除和敲入。
在唾液酸产生的一个实施例中,突变株衍生自大肠杆菌K12 MG1655,其包含:大肠杆菌nanA和nanT基因的敲除以及含有以下的组成型转录单元的基因组敲入:一种或多种选自SEQ ID NO 01、02、03、04、05、06、07、08、09、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58或59的唾液酸转运蛋白,葡糖胺6-磷酸N-乙酰基转移酶(如例如来自酿酒酵母的GNA1(UniProt ID P43577)),N-酰基葡糖胺2-差向异构酶(如例如来自卵形拟杆菌的AGE(UniProt ID A7LVG6))和N-乙酰神经氨酸合酶(如例如来自脑膜炎奈瑟氏菌(UniProt ID E0NCD4)或来自空肠弯曲杆菌(UniProt ID Q93MP9)的NeuB)。
备选地和/或另外,通过大肠杆菌nanA和nanT基因的敲除和含有以下的组成型转录单元的基因组敲入:一种或多种选自SEQ ID NO 01、02、03、04、05、06、07、08、09、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58或59的唾液酸转运蛋白,UDP-N-乙酰葡糖胺2-差向异构酶(如例如来自空肠弯曲杆菌的NeuC(UniProt IDQ93MP8))和N-乙酰神经氨酸合酶(如例如来自脑膜炎奈瑟氏菌(UniProt ID E0NCD4)或来自空肠弯曲杆菌(UniProt ID Q93MP9)的NeuB),可以获得唾液酸产生。
备选地和/或另外,通过大肠杆菌nanA和nanT基因的敲除和含有以下的组成型转录单元的基因组敲入:一种或多种选自SEQ ID NO 01、02、03、04、05、06、07、08、09、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58或59的唾液酸转运蛋白,磷酸葡糖胺变位酶(如例如来自大肠杆菌的glmM(UniProt ID P31120)),双功能的N-乙酰葡糖胺-1-磷酸尿苷酰基转移酶/葡糖胺-1-磷酸乙酰基转移酶(如例如来自大肠杆菌的glmU(UniProt ID P0ACC7)),UDP-N-乙酰葡糖胺2-差向异构酶(如例如来自空肠弯曲杆菌的NeuC(UniProt ID Q93MP8))和N-乙酰神经氨酸合酶(如例如来自脑膜炎奈瑟氏菌(UniProt ID E0NCD4)或来自空肠弯曲杆菌(UniProt ID Q93MP9)的NeuB),可以获得唾液酸生产。
备选地和/或另外,通过大肠杆菌nanA和nanT基因的敲除和含有以下的组成型转录单元的基因组敲入:一种或多种选自SEQ ID NO 01、02、03、04、05、06、07、08、09、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58或59的唾液酸转运蛋白,双功能的UDP-GlcNAc 2-差向异构酶/N-乙酰甘露糖胺激酶(如例如来自小家鼠(品系C57BL/6J)(UniProt ID Q91WG8)),N-酰基神经氨酸-9-磷酸合成酶(如例如来自Syntrophorhabdus sp.PtaU1.Bin058且具有SEQ ID NO 63)和N-酰基神经氨酸-9-磷酸酶(如例如来自趋磁假丝酵母种HK-1(UniProt ID KPA15328.1)或来自多形拟杆菌(菌株ATCC29148)(UniProt ID Q8A712)),可以获得唾液酸产生。
备选地和/或另外,通过大肠杆菌nanA和nanT基因的敲除和含有以下的组成型转录单元的基因组敲入:一种或多种选自SEQ ID NO 01、02、03、04、05、06、07、08、09、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58或59的唾液酸转运蛋白,磷酸葡糖胺变位酶(如例如来自大肠杆菌的glmM(UniProt ID P31120)),双功能的N-乙酰葡糖胺-1-磷酸尿苷酰基转移酶/葡糖胺-1-磷酸乙酰基转移酶(如例如来自大肠杆菌的glmU(UniProt ID P0ACC7)),双功能的UDP-GlcNAc 2-差向异构酶/N-乙酰甘露糖胺激酶(如例如来自小家鼠(品系C57BL/6J)(UniProt ID Q91WG8)),N-酰基神经氨酸-9-磷酸合成酶(如例如来自Syntrophorhabdus sp.PtaU1.Bin058且具有SEQ ID NO 63)和N-酰基神经氨酸-9-磷酸酶(如例如来自趋磁假丝酵母种HK-1(UniProt ID KPA15328.1)或来自多形拟杆菌(菌株ATCC 29148)(UniProt ID Q8A712)),可以获得唾液酸产生。
可以在大肠杆菌突变株中进一步优化唾液酸产生,所述菌株具有包含nagA、nagB、nagC、nagD、nagE、nanE、nanK、manX、manY和manZ的大肠杆菌基因中的任何一种或多种的基因组敲除(如在WO18122225中所描述)和/或包含poxB、ldhA、adhE、aldB、pflA、pflC、ybiY、ackA和/或pta中的任何一种或多种的大肠杆菌基因的基因组敲除,并且具有包含以下中的任何一种或多种的组成型转录单元的基因组敲入:L-谷氨酰胺-D-果糖-6-磷酸氨基转移酶(如例如来自大肠杆菌的突变体glmS*54(与具有UniProt ID P17169的野生型大肠杆菌glmS的差别在于A39T、R250C和G472S突变))和乙酰辅酶A合成酶(如例如来自大肠杆菌的acs(UniProt ID P27550))。
对于唾液酸化的寡糖产生,所述唾液酸生产菌株进一步需要表达一个或多个拷贝的N-酰基神经氨酸胞苷酰基转移酶(如例如具有SEQ ID NO 61的来自多杀巴斯德氏菌的NeuA、来自空肠弯曲杆菌的NeuA(UniProt ID Q93MP7)或具有SEQ ID NO 62的来自流感嗜血菌的NeuA),以及一个或多个拷贝的β-半乳糖苷α-2,3-唾液酸转移酶(如例如来自多杀巴斯德氏菌多杀亚种Pm70菌株的SEQ ID NO 64和来自脑膜炎奈瑟氏菌的SEQ ID NO 65(NmeniST3))、β-半乳糖苷α-2,6-唾液酸转移酶(如例如来自美人鱼发光杆菌(Photobacterium damselae)的(PdST6)(UniProt ID O66375)或具有β-半乳糖苷α-2,6-唾液酸转移酶活性的由UniProt ID O66375的氨基酸残基108至497组成的PdST6样多肽和来自发光杆菌属种(Photobacterium sp.)JT-ISH-224的P-JT-ISH-224-ST6(UniProt IDA8QYL1)或具有β-半乳糖苷α-2,6-唾液酸转移酶活性的由UniProt ID A8QYL1的氨基酸残基18至514组成的P-JT-ISH-224-ST6样多肽)和/或α-2,8-唾液酸转移酶(如例如来自小家鼠(UniProt ID Q64689))。N-酰基神经氨酸胞苷酰基转移酶和唾液酸转移酶中的任何一种或多种的组成型转录单元可以通过基因组敲入或通过表达质粒递送至突变株。如果产生唾液酸和CMP-唾液酸的突变株旨在产生唾液酸化的乳糖结构,则利用大肠杆菌LacZ、LacY和LacA基因的基因组敲除并利用乳糖通透酶(如例如大肠杆菌LacY(UniProt ID P02920))的组成型转录单元的基因组敲入另外修饰菌株。通过含有以下的组成型转录单元的基因组敲入:蔗糖转运蛋白(如例如来自大肠杆菌W的CscB(UniProt ID E0IXR1))、果糖激酶(如例如源自运动发酵单胞菌(Z.mobilis)的Frk(UniProt ID Q03417))和蔗糖磷酸化酶(如例如来自青春双歧杆菌(B.adolescentis)(UniProt ID A0ZZH6)),可以任选地修改产生唾液酸、CMP-唾液酸和/或唾液酸化的寡糖的所有突变株以在蔗糖上生长。
对于在产生唾液酸的大肠杆菌菌株中的GFP-岩藻糖产生,在这些实施例中的突变株被进一步修饰,其包含大肠杆菌wcaJ和thyA基因的敲除以及含有蔗糖转运蛋白(如例如来自大肠杆菌W的CscB(UniProt ID E0IXR1))、果糖激酶(如例如源自运动发酵单胞菌的Frk(UniProt ID Q03417))和蔗糖磷酸化酶(SP)(如例如来自青春双歧杆菌(UniProt IDA0ZZH6))的组成型转录单元的基因组敲入。为了产生岩藻糖基化的寡糖,利用表达质粒另外修饰突变体GDP-岩藻糖生产菌株,所述表达质粒包含α-1,2-岩藻糖基转移酶(如例如具有SEQ ID NO 60的来自幽门螺杆菌的HpFutC)和/或α-1,3-岩藻糖基转移酶(如例如来自幽门螺杆菌的HpFucT(UniProt ID O30511))的组成型转录单元,并利用大肠杆菌thyA(UniProt ID P0A884)的组成型转录单元作为选择性标志物。岩藻糖基转移酶基因的组成型转录单元也可以通过基因组敲入存在于大肠杆菌突变株中。如在WO2016075243和WO2012007481中所述,通过包含glgC、agp、pfkA、pfkB、pgi、arcA、iclR、pgi和lon的大肠杆菌基因中的任何一种或多种的基因组敲除,可以在大肠杆菌突变株中进一步优化GDP-岩藻糖产生。可以另外优化GDP-岩藻糖产生,包含甘露糖-6-磷酸异构酶(如例如来自大肠杆菌的manA(UniProt ID P00946))、磷酸甘露糖变位酶(如例如来自大肠杆菌的manB(UniProtID P24175))、甘露糖-1-磷酸鸟苷酰基转移酶(如例如来自大肠杆菌的manC(UniProt IDP24174))、GDP-甘露糖4,6-脱水酶(如例如来自大肠杆菌的gmd(UniProt ID P0AC88))和GDP-L-岩藻糖合酶(如例如来自大肠杆菌的fcl(UniProt ID P32055))的组成型转录单元的基因组敲入。通过大肠杆菌fucK和fucI基因的基因组敲除以及含有岩藻糖通透酶(如例如来自大肠杆菌的fucP(UniProt ID P11551))和双功能的岩藻糖激酶/岩藻糖-1-磷酸鸟苷酰基转移酶(如例如来自脆弱拟杆菌的fkp(UniProt ID SUV40286.1))的组成型转录单元的基因组敲入,也可以得到GDP-岩藻糖产生。如果产生唾液酸和GDP-岩藻糖的突变株旨在制备岩藻糖基化的乳糖结构,则利用大肠杆菌LacZ、LacY和LacA基因的基因组敲除以及利用乳糖通透酶(如例如大肠杆菌LacY(UniProt ID P02920))的组成型转录单元的基因组敲入另外修饰菌株。此外,如果突变株也旨在制备唾液酸化的结构,则利用基因组敲入或表达质粒另外修饰菌株,所述表达质粒包含一个或多个拷贝的N-酰基神经氨酸胞苷酰基转移酶(如例如具有SEQ ID NO 61的来自多杀巴斯德氏菌的NeuA、来自空肠弯曲杆菌的NeuA(UniProt ID Q93MP7)或具有SEQ ID NO 62的来自流感嗜血杆菌的NeuA)以及一个或多个拷贝的β-半乳糖苷α-2,3-唾液酸转移酶(如例如来自多杀巴斯德氏菌多杀亚种Pm70菌株的SEQ ID NO 64和来自脑膜炎奈瑟氏菌的SEQ ID NO 65(NmeniST3))、β-半乳糖苷α-2,6-唾液酸转移酶(如例如来自美人鱼发光杆菌的PdST6(UniProt ID O66375)或具有β-半乳糖苷α-2,6-唾液酸转移酶活性的由UniProt ID O66375的氨基酸残基108至497组成的PdST6样多肽和来自发光杆菌属种JT-ISH-224的P-JT-ISH-224-ST6(UniProt ID A8QYL1)或具有β-半乳糖苷α-2,6-唾液酸转移酶活性的由UniProt ID A8QYL1的氨基酸残基18至514组成的P-JT-ISH-224-ST6样多肽)和/或α-2,8-唾液酸转移酶(如例如来自小家鼠(UniProt IDQ64689))的组成型转录单元。
为了在产生唾液酸的大肠杆菌菌株中产生LN3(GlcNAc-b1,3-Gal-b1,4-Glc),进一步修饰在这些实施例中的突变株,其包含大肠杆菌LacZ、LacY和LacA基因的基因组敲除以及乳糖通透酶(如例如大肠杆菌LacY(UniProt ID P02920))和半乳糖苷β-1,3-N-乙酰葡糖胺基转移酶(如例如具有SEQ ID NO 66的来自脑膜炎奈瑟氏菌的LgtA)的组成型转录单元的基因组敲入。
为了产生LN3-衍生的寡糖如乳糖-N-四糖(LNT)和乳糖-N-新四糖(LNnT),用组成型转录单元进一步修饰突变体LN3生产菌株,所述组成型转录单元通过基因组敲入递送给所述菌株或来自N-乙酰葡糖胺β-1,3-半乳糖基转移酶(如例如来自大肠杆菌O55:H7的WbgO(UniProt ID D3QY14)(以产生LNT))或N-乙酰葡糖胺β-1,4-半乳糖基转移酶(如例如来自脑膜炎奈瑟氏菌的LgtB(UniProt ID Q51116)(以产生LNnT))的表达质粒。任选地,可以将半乳糖苷β-1,3-N-乙酰葡糖胺基转移酶、N-乙酰葡糖胺β-1,3-半乳糖基转移酶和/或N-乙酰葡糖胺β-1,4-半乳糖基转移酶编码基因的多个拷贝添加至大肠杆菌突变株中。另外,可以任选地通过大肠杆菌ushA和galT基因的基因组敲除来修饰菌株以增强UDP-半乳糖产生。还可以任选地通过UDP-葡萄糖-4-差向异构酶(如例如来自大肠杆菌的galE(UniProt IDP09147))的组成型转录单元的基因组敲入来修改大肠杆菌突变株。此外,如果突变株也旨在制备唾液酸化的结构,则用基因组敲入或表达质粒另外修饰菌株,所述表达质粒包含N-酰基神经氨酸胞苷酰基转移酶(如例如具有SEQ ID NO 61的来自多杀巴斯德氏菌的NeuA、来自空肠弯曲杆菌的NeuA(UniProt ID Q93MP7)或具有SEQ ID NO 62的来自流感嗜血杆菌的NeuA)的一个或多个拷贝、以及β-半乳糖苷α-2,3-唾液酸转移酶(如例如来自多杀巴斯德氏菌多杀亚种Pm70菌株的SEQ ID NO 64和来自脑膜炎奈瑟氏菌的SEQ ID NO 65(NmeniST3))、β-半乳糖苷α-2,6-唾液酸转移酶(如例如来自美人鱼发光杆菌的PdST6(UniProt ID O66375)或具有β-半乳糖苷α-2,6-唾液酸转移酶活性的由UniProt IDO66375的氨基酸残基108至497组成的PdST6样多肽和来自发光杆菌属种JT-ISH-224的P-JT-ISH-224-ST6(UniProt ID A8QYL1)或具有β-半乳糖苷α-2,6-唾液酸转移酶活性的由UniProt ID A8QYL1的氨基酸残基18至514组成的P-JT-ISH-224-ST6样多肽)和/或α-2,8-唾液酸转移酶(如例如来自小家鼠(UniProt ID Q64689))的一个或多个拷贝的组成型转录单元。通过含有蔗糖转运蛋白(如例如来自大肠杆菌W的CscB(UniProt ID E0IXR1))、果糖激酶(如例如源自运动发酵单胞菌的Frk(UniProt ID Q03417))和蔗糖磷酸化酶(如例如来自青春双歧杆菌(UniProt ID A0ZZH6))的组成型转录单元的基因组敲入,也可以任选地修改大肠杆菌突变株以在蔗糖上生长。
优选地但不一定,所述糖基转移酶在N-端和/或C-端与溶解度增强标签(如例如SUMO-标签、MBP-标签、His、FLAG、Strep-II、Halo-标签、NusA、硫氧还蛋白、GST和/或Fh8-标签)融合以增强其溶解度(Costa等人,Front.Microbiol.2014,https://doi.org/10.3389/fmicb.2014.00063;Fox等人,Protein Sci.2001,10(3),622-630;Jia和Jeaon,OpenBiol.2016,6:160196)。
任选地,修饰大肠杆菌突变株以产生糖最小化的大肠杆菌菌株,其包含非必需糖基转移酶基因中的任何一种或多种的基因组敲除,所述非必需糖基转移酶基因包含pgaC、pgaD、rfe、rffT、rffM、bcsA、bcsB、bcsC、wcaA、wcaC、wcaE、wcaI、wcaJ、wcaL、waaH、waaF、waaC、waaU、waaZ、waaJ、waaO、waaB、waaS、waaG、waaQ、wbbl、arnC、arnT、yfdH、wbbK、opgG、opgH、ycjM、glgA、glgB、malQ、otsA和yaiP。
所有组成型启动子、UTR和终止子序列源自Mutalik等人(Nat.Methods2013,No.10,354-360)和Cambray等人(Nucleic Acids Res.2013,41(9),5139-5148)描述的文库。所有基因均在Twist Bioscience(twistbioscience.com)或IDT(eu.idtdna.com)上合成订购,并使用供应商的工具修改密码子使用。
将所有菌株在冷冻小瓶中在-80℃储存(过夜LB培养物以1:1的比例与70%甘油混合)。
表1:在本发明中描述的具有相应SEQ ID NO或UniProt ID的多肽的概述
/>
/>
/>
/>
培养条件
96-孔微量滴定板实验的预培养从冷冻小瓶开始,在150μL LB中,在定轨摇床上在800rpm在37℃孵育过夜。该培养物用作96孔方形微量滴定板的接种物,通过稀释400倍使用400μL基本培养基。然后将这些最终的96-孔培养板在37℃在定轨摇床上在800rpm孵育72小时或更短或更长。为了测量在培养实验结束时的糖浓度,从每个孔中取出整个培养液样品,在离心细胞之前,将培养液在60℃煮沸15分钟(=细胞内和细胞外糖浓度的平均值)。
生物反应器的预培养从特定菌株的整个1mL冷冻小瓶开始,接种于在1L或2.5L摇瓶中的250mL或500mL基本培养基中,并在37℃在定轨摇床上在200rpm孵育24h。然后接种5L生物反应器(具有5L工作容积)(在2L批次培养基中的250mL接种物);该过程由MFCS控制软件(Sartorius Stedim Biotech,Melsungen,德国)控制。将培养条件设定为37℃和最大搅拌;压力气体流速取决于菌株和生物反应器。使用0.5M H2SO4和20% NH4OH将pH控制在6.8。将排出气体冷却。当在发酵过程中产生泡沫时,添加10%有机硅消泡剂溶液。
光密度
通过测量在600nm处的光密度(Implen Nanophotometer NP80,Westburg,Belgium或用Spark 10M微量培养板读数器,Tecan,瑞士)来经常监测培养物的细胞密度。
分析性分析
标准品诸如但不限于蔗糖、乳糖、N-乙酰基乳糖胺(LacNAc,Gal-b1,4-GlcNAc)、乳糖-N-二糖(LNB,Gal-b1,3-GlcNAc)、岩藻糖基化的LacNAc(2’FLacNAc,3-FLacNAc)、唾液酸化的LacNAc,(3’SLacNAc,6’SLacNAc)、岩藻糖基化的LNB(2’FLNB,4’FLNB)、乳糖-N-三糖II(LN3)、乳糖-N-四糖(LNT)、乳糖-N-新-四糖(LNnT)、LNFP-I、LNFP-II、LNFP-III、LNFP-V、LNFP-VI、LSTa、LSTc和LSTd购自Carbosynth(英国)、Elicityl(法国)和IsoSep(瑞典)。其它化合物使用内部制备的标准品进行分析。
在具有折射率(RI)检测的Waters Acquity H-类UPLC上分析唾液酸化的寡糖。将0.5μL体积的样品注射在Waters Acquity UPLC BEH Amide柱(2.1x 100mm;1.7μm)上。柱温度为50℃。流动相由70%乙腈、26%乙酸铵缓冲液(150mM)和4%甲醇的混合物组成,其中添加了0.05%吡咯烷。该方法是等度的,流速为0.150mL/min。将RI检测器的温度设定在35℃。在具有蒸发光散射检测器(ELSD)或折射率(RI)检测的Waters Acquity H-类UPLC上分析中性寡糖。将0.7μL体积的样品注射在具有Acquity UPLC BEH Amide Van保护柱(/>2.1x 5mm)的Waters Acquity UPLC BEH Amide柱(2.1x 100mm;/>1.7μm)柱上。柱温度为50℃。流动相由1/4水和3/4乙腈溶液组成,其中添加了0.2%三乙胺。该方法是等度的,流速为0.130mL/min。ELS检测器具有50℃的漂移管温度,并且氮气压力为50psi,增益为200,并且数据速率为10pps。将RI检测器的温度设定在35℃。在具有折射率(RI)检测的Waters Acquity H-类UPLC上分析中性和唾液酸化的糖。将0.5μL体积的样品注射在WatersAcquity UPLC BEH Amide柱(2.1x 100mm;/>1.7μm)上。柱温度为50℃。流动相由72%乙腈和28%乙酸铵缓冲液(100mM)的混合物组成,其中添加了0.1%三乙胺。该方法是等度的,流速为0.260mL/min。将RI检测器的温度设定在35℃。
为了在质谱仪上进行分析,使用具有电子喷雾电离(ESI)的Waters Xevo TQ-MS,去溶剂化温度为450℃,去溶剂化氮气流量为650L/h,且锥电压为20V。对于所有寡糖,在负模式下的选择离子监测(SIM)中运行MS。在35℃在具有Thermo Hypercarb柱(2.1x 100mm;3μm)的Waters Acquity UPLC上进行分离。使用梯度,其中洗脱液A是含有0.1%甲酸的超纯水,并且其中洗脱液B是含有0.1%甲酸的乙腈。使用以下梯度在55分钟内分离寡糖:首先历时21分钟从2%增加到12%的洗脱液B,第二次历时11分钟从12%增加到40%的洗脱液B,并第三次历时5分钟从40%增加到100%的洗脱液B。作为洗涤步骤,使用100%的洗脱液B进行5分钟。对于柱平衡,在1分钟内恢复2%的洗脱液B的初始条件并维持12分钟。
在具有脉冲电流计检测(PAD)的Dionex HPAEC系统上分析低浓度(低于50mg/L)的中性和唾液酸化的糖。将5μL体积的样品注射在具有Dionex CarboPac PA200保护柱(4x50mm)的Dionex CarboPac PA200柱(4x 250mm)上。将柱温度设定为30℃。使用梯度,其中洗脱液A为去离子水,其中洗脱液B为200mM氢氧化钠,且其中洗脱液C为500mM醋酸钠。在60分钟内分离寡糖,同时使用以下梯度维持25%的洗脱液B的恒定比例:初始等度步骤维持10分钟的75%的洗脱液A,首先历时8分钟从0%增加到4%的洗脱液C,第二个等度步骤维持6分钟的71%的洗脱液A和4%的洗脱液C,第二次历时2.6分钟从4%增加至12%的洗脱液C,第三个等度步骤维持3.4分钟的63%的洗脱液A和12%的洗脱液C,并第三次历时5分钟从12%增加至48%的洗脱液C。作为洗涤步骤,使用48%的洗脱液C持续3分钟。对于柱平衡,在1分钟内恢复75%的洗脱液A和0%的洗脱液C的初始条件并维持11分钟。应用的流速为0.5mL/min。
实施例5.材料和方法
酿酒酵母
培养基
使菌株在含有完全补充混合物的Synthetic Defined酵母培养基(SD CSM)或含有6.7g/L的不含氨基酸的Yeast Nitrogen Base(不含氨基酸的YNB,Difco)、20g/L琼脂(Difco)(固体培养物)、22g/L葡萄糖一水合物或20g/L乳糖和0.79g/L CSM或0.77g/L CSM-Ura、0.77g/L CSM-Trp或0.77g/L CSM-His(MP Biomedicals)的CSM缺陷型培养基(SD CSM-Ura,SD CSM-Trp,SD CSM-His)上生长。
菌株
使用由Brachmann等人(Yeast(1998)14:115-32)建立的酿酒酵母BY4742,其可在Euroscarf培养物保藏中心获得。所有突变株都使用Gietz(Yeast11:355-360,1995)的方法通过同源重组或质粒转化而建立。
质粒
在一个产生唾液酸和CMP-唾液酸的实施例中,酵母表达质粒可以衍生自pRS420-质粒系列(Christianson等人,1992,Gene 110:119-122),其含有TRP1选择标志物以及以下的组成型转录单元:一种或多种选自SEQ ID NO 01、02、03、04、05、06、07、08、09、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58或59的唾液酸转运蛋白,L-谷氨酰胺-D-果糖-6-磷酸氨基转移酶(如例如来自大肠杆菌的突变体glmS*54(与具有UniProt ID P17169的野生型大肠杆菌glmS的差别在于A39T、R250C和G472S突变))、磷酸酶(如例如大肠杆菌SurE(UniProt ID P0A840))、N-酰基葡糖胺2-差向异构酶(如例如来自卵形拟杆菌的AGE(UniProt ID A7LVG6))、N-乙酰神经氨酸合酶(如例如来自脑膜炎奈瑟氏菌(UniProt ID E0NCD4)或来自空肠弯曲杆菌(UniProt ID Q93MP9)的NeuB)和N-酰基神经氨酸胞苷酰基转移酶(如例如具有SEQ ID NO 61的来自多杀巴斯德氏菌的NeuA)。任选地,还添加葡糖胺6-磷酸N-乙酰基转移酶(如例如来自酿酒酵母的GNA1(UniProt ID P43577))的组成型转录单元。为了产生唾液酸化的寡糖,所述质粒进一步包含以下的组成型转录单元:乳糖通透酶(如例如来自乳酸克鲁维酵母的LAC12(UniProt IDP07921))和一种或多种唾液酸转移酶:如例如β-半乳糖苷α-2,3-唾液酸转移酶(如例如来自多杀巴斯德氏菌多杀亚种Pm70菌株的SEQ ID NO 64和来自脑膜炎奈瑟氏菌的SEQ ID NO65(NmeniST3))、β-半乳糖苷α-2,6-唾液酸转移酶(如例如来自美人鱼发光杆菌的PdST6(UniProt ID O66375)或具有β-半乳糖苷α-2,6-唾液酸转移酶活性的由UniProt IDO66375的氨基酸残基108至497组成的PdST6样多肽和来自发光杆菌属种JT-ISH-224的P-JT-ISH-224-ST6(UniProt ID A8QYL1)或具有β-半乳糖苷α-2,6-唾液酸转移酶活性的由UniProt ID A8QYL1的氨基酸残基18至514组成的P-JT-ISH-224-ST6样多肽)和/或α-2,8-唾液酸转移酶(如例如来自小家鼠(UniProt ID Q64689))。
在一个产生GDP-岩藻糖的实施例中,酵母表达质粒如p2a_2μ_Fuc(Chan2013,Plasmid 70,2-17)可以用于在酿酒酵母中表达外来基因。该质粒含有氨苄青霉素抗性基因和细菌复制起点以便在大肠杆菌中进行选择和维持,并含有2μ酵母ori和Ura3选择标志物用于在酵母中进行选择和维持。该质粒进一步用以下的组成型转录单元修饰:乳糖通透酶(如例如来自乳酸克鲁维酵母的LAC12(UniProt ID P07921))、GDP-甘露糖4,6-脱水酶(如例如来自大肠杆菌的gmd(UniProt ID P0AC88))和GDP-L-岩藻糖合酶(如例如来自大肠杆菌的fcl(UniProt ID P32055))。酵母表达质粒p2a_2μ_Fuc2可以用作p2a_2μ_Fuc质粒的替代表达质粒,其包含挨着氨苄青霉素抗性基因的细菌ori、2μ酵母ori和Ura3选择标志物、以下的组成型转录单元:乳糖通透酶(如例如来自乳酸克鲁维酵母的LAC12(UniProt IDP07921))、岩藻糖通透酶(如例如来自大肠杆菌的fucP(UniProt ID P11551))和双功能的岩藻糖激酶/岩藻糖-1-磷酸鸟苷酰基转移酶(如例如来自脆弱拟杆菌的fkp(UniProt IDSUV40286.1))。为了进一步产生岩藻糖基化的寡糖,p2a_2μ_Fuc和它的变体p2a_2μ_Fuc2另外含有一种或多种岩藻糖基转移酶的组成型转录单元,所述岩藻糖基转移酶如例如α-1,2-岩藻糖基转移酶(如例如具有SEQ ID NO 60的来自幽门螺杆菌的HpFutC)和/或α-1,3-岩藻糖基转移酶(如例如来自幽门螺杆菌的HpFucT(UniProt ID O30511))。
在一个产生UDP-半乳糖的实施例中,酵母表达质粒可以衍生自pRS420-质粒系列(Christianson等人,1992,Gene 110:119-122),其含有HIS3选择标志物和UDP-葡萄糖-4-差向异构酶(如例如来自大肠杆菌的galE(UniProt ID P09147))的组成型转录单元。该质粒进一步用乳糖通透酶(如例如来自乳酸克鲁维酵母的LAC12(UniProt ID P07921))、半乳糖苷β-1,3-N-乙酰葡糖胺基转移酶(如例如具有SEQ ID NO 66的来自脑膜炎奈瑟氏菌的lgtA)的组成型转录单元进行修饰以产生LN3。为了进一步产生LN3-衍生的寡糖如LNT或LNnT,在质粒上还分别添加N-乙酰葡糖胺β-1,3-半乳糖基转移酶(如例如来自大肠杆菌O55:H7的WbgO(UniProt ID D3QY14))或N-乙酰葡糖胺β-1,4-半乳糖基转移酶(如例如来自脑膜炎奈瑟氏菌的lgtB(UniProt ID Q51116))。
使用的蛋白列于表1中。
优选地但不一定,糖基转移酶和/或参与核苷酸活化的糖合成的蛋白在N-端和/或C-端融合至SUMOstar标签(例如得自pYSUMOstar,Life Sensors,Malvern,PA)以增强它们的溶解度。
任选地,用编码伴侣蛋白(如例如Hsp31、Hsp32、Hsp33、Sno4、Kar2、Ssb1、Sse1、Sse2、Ssa1、Ssa2、Ssa3、Ssa4、Ssb2、Ecm10、Ssc1、Ssq1、Ssz1、Lhs1、Hsp82、Hsc82、Hsp78、Hsp104、Tcp1、Cct4、Cct8、Cct2、Cct3、Cct5、Cct6或Cct7(Gong等人,2009,Mol.Syst.Biol.5:275))的组成型转录单元的基因组敲入来修饰突变体酵母菌株。
将质粒维持在购自Invitrogen的宿主大肠杆菌DH5α(F-,phi80dlacZδM15,δ(lacZYA-argF)U169,deoR,recA1,endA1,hsdR17(rk-,mk+),phoA,supE44,λ-,thi-1,gyrA96,relA1)中。
异源和同源表达
需要表达的基因(无论是来自质粒还是来自基因组)由以下公司之一合成:DNA2.0、Gen9、IDT或Twist Bioscience。通过将密码子使用优化为表达宿主的密码子使用,可以进一步促进表达。使用供应商的工具优化基因。
培养条件
一般而言,酵母菌株最初在SD CSM平板上生长以获得单个菌落。这些平板在30℃生长2-3天。从单个菌落开始,使预培养物在200rpm摇动下在30℃在5mL中生长过夜。随后给125mL摇瓶实验接种在25mL培养基中的2%的该预培养物。将这些摇瓶在30℃在200rpm的轨道摇动下进行孵育。
基因表达启动子
如例如Blazeck(Biotechnology and Bioengineering,Vol.109,No.11,2012)、Redden和Alper(Nat.Commun.2015,6,7810)、Liu等人(Microb.Cell Fact.2020,19,38)、Xu等人(Microb.Cell Fact.2021,20,148)、以及Lee等人(ACS Synth.Biol.2015,4(9),975-986)所述,使用合成的组成型启动子表达基因。
实施例6.用经修饰的大肠杆菌菌株产生唾液酸(Neu5Ac)
如在实施例4中所述修饰大肠杆菌K-12菌株MG1655用于唾液酸产生,包含大肠杆菌nagA、nagB、nanA、nanT、nanE、nanK、LacZ和LacA基因的敲除以及含有以下的组成型转录单元的基因组敲入:选自SEQ ID NO 02、03、04、05、06、07、08、09、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58或59的唾液酸转运蛋白,来自大肠杆菌的L-谷氨酰胺-D-果糖-6-磷酸氨基转移酶glmS*54(与具有UniProt ID P17169的野生型大肠杆菌glmS的差别在于A39T、R250C和G472S突变),来自酿酒酵母的葡糖胺6-磷酸N-乙酰基转移酶GNA1(UniProt ID P43577),来自卵形拟杆菌的N-酰基葡糖胺2-差向异构酶AGE(UniProt ID A7LVG6),来自脑膜炎奈瑟氏菌的N-乙酰神经氨酸合酶NeuB(UniProt IDE0NCD4),来自大肠杆菌W的蔗糖转运蛋白CscB(UniProt ID E0IXR1),来自运动发酵单胞菌的果糖激酶Frk(UniProt ID Q03417)和来自青春双歧杆菌的蔗糖磷酸化酶(UniProt IDA0ZZH6)。根据在实施例4中提供的培养条件对新菌株进行生长实验评价,其中所述培养基含有30g/L蔗糖。每个菌株在96-孔平板中进行四个生物重复培养。孵育72小时后,收获培养液,并在UPLC上分析糖。
实施例7.用经修饰的大肠杆菌菌株产生唾液酸(Neu5Ac)
如在实施例4中所述修饰大肠杆菌K-12菌株MG1655用于唾液酸产生,包含大肠杆菌nagA、nagB、nanA、nanT、nanE、nanK、LacZ和LacA基因的敲除、以及含有以下的组成型转录单元的基因组敲入:选自SEQ ID NO 01、02、03、04、05、06、07、08、09、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58或59的唾液酸转运蛋白,来自大肠杆菌的L-谷氨酰胺-D-果糖-6-磷酸氨基转移酶glmS*54(与具有UniProt ID P17169的野生型大肠杆菌glmS的差别在于A39T、R250C和G472S突变),来自大肠杆菌的磷酸葡糖胺变位酶glmM(UniProt ID P31120),来自大肠杆菌的双功能的N-乙酰葡糖胺-1-磷酸尿苷酰基转移酶/葡糖胺-1-磷酸乙酰基转移酶glmU(UniProt ID P0ACC7),来自小家鼠(品系C57BL/6J)的双功能的UDP-GlcNAc 2-差向异构酶/N-乙酰甘露糖胺激酶(UniProt IDQ91WG8),具有SEQ ID NO 63的来自Syntrophorhabdus sp.PtaU1.Bin058的N-酰基神经氨酸-9-磷酸合成酶和来自趋磁假丝酵母种HK-1(UniProt ID KPA15328.1)和/或来自多形拟杆菌(UniProt ID Q8A712)的N-酰基神经氨酸-9-磷酸酶,来自大肠杆菌W的蔗糖转运蛋白CscB(UniProt ID E0IXR1),来自运动发酵单胞菌的果糖激酶Frk(UniProt ID Q03417)和来自青春双歧杆菌的蔗糖磷酸化酶(UniProt ID A0ZZH6)。根据在实施例4中提供的培养条件对新菌株进行生长实验评价,其中所述培养基含有30g/L蔗糖。每个菌株在96-孔平板中进行四个生物重复培养。孵育72小时后,收获培养液,并在UPLC上分析糖。
实施例8.用经修饰的大肠杆菌菌株产生唾液酸(Neu5Ac)
如在实施例4中所述修饰大肠杆菌K-12菌株MG1655用于唾液酸产生,包含大肠杆菌nagA、nagB、nanA、nanT、nanE、nanK、LacZ和LacA基因的敲除、以及含有以下的组成型转录单元的基因组敲入:选自SEQ ID NO 01、02、03、04、05、06、07、08、09、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58或59的唾液酸转运蛋白,来自大肠杆菌的L-谷氨酰胺-D-果糖-6-磷酸氨基转移酶glmS*54(与具有UniProt ID P17169的野生型大肠杆菌glmS的差别在于A39T、R250C和G472S突变),来自大肠杆菌的磷酸葡糖胺变位酶glmM(UniProt ID P31120),来自大肠杆菌的双功能的N-乙酰葡糖胺-1-磷酸尿苷酰基转移酶/葡糖胺-1-磷酸乙酰基转移酶glmU(UniProt ID P0ACC7),来自空肠弯曲杆菌的UDP-N-乙酰葡糖胺2-差向异构酶NeuC(UniProt ID Q93MP8),来自脑膜炎奈瑟氏菌的N-乙酰神经氨酸合酶NeuB(UniProt ID E0NCD4),来自大肠杆菌W的蔗糖转运蛋白CscB(UniProtID E0IXR1),来自运动发酵单胞菌的果糖激酶Frk(UniProt ID Q03417)和来自青春双歧杆菌的蔗糖磷酸化酶(UniProt ID A0ZZH6)。根据在实施例4中提供的培养条件对新菌株进行生长实验评价,其中所述培养基含有30g/L蔗糖。每个菌株在96-孔平板中进行四个生物重复培养。孵育72小时后,收获培养液,并在UPLC上分析糖。
实施例9.用经修饰的大肠杆菌菌株产生6’-唾液酸基乳糖(6’-SL)
如在实施例4中所述修饰大肠杆菌K-12菌株MG1655用于唾液酸产生,包含大肠杆菌nagA、nagB、nanA、nanT、nanE、nanK、LacZ和LacA基因的敲除、以及含有以下的组成型转录单元的基因组敲入:具有SEQ ID NO 01的来自大肠杆菌的唾液酸转运蛋白NanT、来自大肠杆菌的L-谷氨酰胺-D-果糖-6-磷酸氨基转移酶glmS*54(与具有UniProt ID P17169的野生型大肠杆菌glmS的差别在于A39T、R250C和G472S突变)、来自酿酒酵母的葡糖胺6-磷酸N-乙酰基转移酶GNA1(UniProt ID P43577)、来自卵形拟杆菌的N-酰基葡糖胺2-差向异构酶AGE(UniProt ID A7LVG6)、来自脑膜炎奈瑟氏菌的N-乙酰神经氨酸合酶NeuB(UniProt IDE0NCD4)、来自大肠杆菌W的蔗糖转运蛋白CscB(UniProt ID E0IXR1)、来自运动发酵单胞菌的果糖激酶Frk(UniProt ID Q03417)和来自青春双歧杆菌的蔗糖磷酸化酶(UniProt IDA0ZZH6)。在本文中,建立了三种不同的菌株,其各自从不同的转录单元表达具有SEQ ID NO01的大肠杆菌nanT基因。在表2中给出了用于所述nanT表达的三种不同的转录单元。在下一步中,进一步修饰三种突变株用于6’-SL产生,包含:大肠杆菌LacY基因的敲除,含有来自大肠杆菌的乳糖通透酶LacY(UniProt ID P02920)、来自空肠弯曲杆菌(UniProt ID Q93MP7)和具有SEQ ID NO 62的来自流感嗜血杆菌的N-酰基神经氨酸胞苷酰基转移酶和具有β-半乳糖苷α-2,6-唾液酸转移酶活性的由UniProt ID O66375的氨基酸残基108至497组成的PdST6样多肽的组成型转录单元的基因组敲入,以及包含具有SEQ ID NO 61的来自多杀巴斯德氏菌的N-酰基神经氨酸胞苷酰基转移酶和具有β-半乳糖苷α-2,6-唾液酸转移酶活性的由UniProt ID O66375的氨基酸残基108至497组成的PdST6样多肽的组成型转录单元的表达质粒。根据在实施例4中提供的培养条件对三种新颖的6’SL菌株进行生长实验评价,其中所述培养基含有30g/L蔗糖和20g/L乳糖。使用的参考菌株缺乏具有SEQ ID NO 01的nanT基因。每个菌株在96-孔平板中进行四个生物重复培养。孵育72小时后,收获培养液,并在UPLC上分析糖。将突变株中唾液酸(Neu5Ac)和6’SL的平均产量针对在参考菌株的培养液中观察到的平均唾液酸(Neu5Ac)和6’SL滴度进行归一化。实验证明,与缺乏nanT的参考菌株相比,所有新菌株在培养结束时在整个培养液样品中产生少得多的Neu5Ac,但是产生类似的或更多的6’SL(表3)。在新菌株中产生的Neu5Ac滴度也低于产生的6’SL滴度的5%。此外,在新菌株中产生的Neu5Ac滴度也低于在这些新菌株中产生的总糖(Neu5Ac+6’SL)的总和的5%。最后,与参考菌株相比,具有SEQ ID NO 01的来自大肠杆菌的nanT唾液酸转运蛋白的基因组敲入没有改变突变株的生长速度(结果未显示)。
表2:在经修饰的大肠杆菌菌株中的转录单元(TU)以表达具有SEQ ID NO 01的来自大肠杆菌的唾液酸转运蛋白NanT
TU 启动子* UTR* 终止子**
TU_01 PROM0010=Mutalik_P10 UTR0044_GalE_ulaEF TER0007_ilvGEDA
TU_02 PROM0048=Mutalik_apFAB74 UTR0008_OmpC_BCD2 TER0007_ilvGEDA
TU_03 PROM0048=Mutalik_apFAB74 UTR0018_GalE_BCD18 TER0007_ilvGEDA
*启动子和UTR序列是根据Mutalik等人(Nat.Methods 2013,No.10,354-360)。
**终止子序列是根据Cambray等人(2013)(Nucleic Acids Res.2013,41(9),5139-5148)。
表3:当在含有蔗糖和乳糖的基本培养基中生长72小时时,在根据表2的转录单元(TU)中表达具有SEQ ID NO 01的来自大肠杆菌的唾液酸转运蛋白NanT的单个经修饰的大肠杆菌菌株在整个培养液样品中的Neu5Ac和6’-SL的相对产量(%)。
表4:当在含有蔗糖和乳糖的基本培养基中生长72小时时,在根据表2的转录单元(TU)中表达具有SEQ ID NO 01的来自大肠杆菌的唾液酸转运蛋白NanT的单个经修饰的大肠杆菌菌株在整个培养液样品中的Neu5Ac相对于6’-SL(%)或相对于产生的糖的总和(Neu5Ac+6’-SL)(%)的产生。
菌株 Neu5Ac/6’-SL(%) Neu5Ac/(6’-SL+Neu5Ac)(%)
SL1 0 0
SL2 1.69±0.48 1.67±0.47
SL3 1.76±0.30 1.73±0.28
参考菌株 7.20±0.50 6.72±0.43
实施例10.用经修饰的大肠杆菌菌株产生6’-唾液酸基乳糖(6’-SL)
在下一个实施例中,进一步修饰在实施例6中描述的大肠杆菌突变株用于6’-SL产生,包含:大肠杆菌LacY基因的敲除,含有来自大肠杆菌的乳糖通透酶LacY(UniProt IDP02920)、来自空肠弯曲杆菌(UniProt ID Q93MP7)和具有SEQ ID NO 62的来自流感嗜血杆菌的N-酰基神经氨酸胞苷酰基转移酶和具有β-半乳糖苷α-2,6-唾液酸转移酶活性的由UniProt ID O66375的氨基酸残基108至497组成的PdST6样多肽的组成型转录单元的基因组敲入,以及包含具有SEQ ID NO 61的来自多杀巴斯德氏菌的N-酰基神经氨酸胞苷酰基转移酶和具有β-半乳糖苷α-2,6-唾液酸转移酶活性的由UniProt ID O66375的氨基酸残基108至497组成的PdST6样多肽的组成型转录单元的表达质粒。根据在实施例4中提供的培养条件对新菌株进行生长实验评价,其中所述培养基含有30g/L蔗糖和20g/L乳糖。每个菌株在96-孔平板中进行四个生物重复培养。孵育72小时后,收获培养液,并在UPLC上分析糖。
实施例11.用经修饰的大肠杆菌菌株产生3’-唾液酸基乳糖(3’-SL)
如在实施例4中所述修饰大肠杆菌K-12菌株MG1655用于唾液酸产生,包含大肠杆菌nagA、nagB、nanA、nanT、nanE、nanK、LacZ和LacA基因的敲除、以及含有以下的组成型转录单元的基因组敲入:选自SEQ ID NO 01、02、03、04、05、06、07、08、09、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58或59的唾液酸转运蛋白,来自大肠杆菌的L-谷氨酰胺-D-果糖-6-磷酸氨基转移酶glmS*54(与具有UniProt ID P17169的野生型大肠杆菌glmS的差别在于A39T、R250C和G472S突变),来自酿酒酵母的葡糖胺6-磷酸N-乙酰基转移酶GNA1(UniProt ID P43577),来自卵形拟杆菌的N-酰基葡糖胺2-差向异构酶AGE(UniProt ID A7LVG6),来自脑膜炎奈瑟氏菌的N-乙酰神经氨酸合酶NeuB(UniProtID E0NCD4),来自大肠杆菌W的蔗糖转运蛋白CscB(UniProt ID E0IXR1),来自运动发酵单胞菌的果糖激酶Frk(UniProt ID Q03417)和来自青春双歧杆菌的蔗糖磷酸化酶(UniProtID A0ZZH6)。在下一步中,进一步修饰突变株用于3’-SL产生,包含:大肠杆菌LacY基因的敲除,含有来自大肠杆菌的乳糖通透酶LacY(UniProt ID P02920)、来自空肠弯曲杆菌(UniProt ID Q93MP7)和具有SEQ ID NO 62的来自流感嗜血杆菌的N-酰基神经氨酸胞苷酰基转移酶和具有SEQ ID NO 64的来自多杀巴斯德氏菌多杀亚种Pm70菌株的β-半乳糖苷α-2,3-唾液酸转移酶或具有SEQ ID NO 65的来自脑膜炎奈瑟氏菌的β-半乳糖苷α-2,3-唾液酸转移酶的组成型转录单元的基因组敲入,以及包含具有SEQ ID NO 61的来自多杀巴斯德氏菌的N-酰基神经氨酸胞苷酰基转移酶和具有SEQ ID NO 64的来自多杀巴斯德氏菌多杀亚种Pm70菌株的β-半乳糖苷α-2,3-唾液酸转移酶或具有SEQ ID NO 65的来自脑膜炎奈瑟氏菌的β-半乳糖苷α-2,3-唾液酸转移酶的组成型转录单元的表达质粒。根据在实施例4中提供的培养条件对新菌株进行生长实验评价,其中所述培养基含有30g/L蔗糖和20g/L乳糖。每个菌株在96-孔平板中进行四个生物重复培养。孵育72小时后,收获培养液,并在UPLC上分析糖。
实施例12.在补料分批发酵中评价经修饰的大肠杆菌菌株
如在实施例4中所述修饰大肠杆菌K-12菌株MG1655用于唾液酸产生,包含大肠杆菌nagA、nagB、nanA、nanT、nanE、nanK、LacZ和LacA基因的敲除、以及含有以下的组成型转录单元的基因组敲入:具有SEQ ID NO 01的来自大肠杆菌的唾液酸转运蛋白NanT、来自大肠杆菌的L-谷氨酰胺-D-果糖-6-磷酸氨基转移酶glmS*54(与具有UniProt ID P17169的野生型大肠杆菌glmS的差别在于A39T、R250C和G472S突变)、来自酿酒酵母的葡糖胺6-磷酸N-乙酰基转移酶GNA1(UniProt ID P43577)、来自卵形拟杆菌的N-酰基葡糖胺2-差向异构酶AGE(UniProt ID A7LVG6)、来自空肠弯曲杆菌的N-乙酰神经氨酸合酶NeuB(UniProt IDQ93MP9)、来自大肠杆菌W的蔗糖转运蛋白CscB(UniProt ID E0IXR1)、来自运动发酵单胞菌的果糖激酶Frk(UniProt ID Q03417)和来自青春双歧杆菌的蔗糖磷酸化酶(UniProt IDA0ZZH6)。将具有SEQ ID NO 01的来自大肠杆菌的nanT唾液酸转运蛋白在转录单元中呈递给菌株,所述转录单元包含启动子序列PROM0010_Mutalik_P10(Mutalik等人,Nat.Methods2013,No.10,354-360)、UTR序列UTR0044_GalE_ulaEF(Mutalik等人,Nat.Methods 2013,No.10,354-360)和终止子序列TER0007_ilvGEDA(Cambray等人,Nucleic Acids Res.2013,41(9),5139-5148)。在下一步中,进一步修饰突变株用于6’-SL产生,包含:大肠杆菌LacY基因的敲除,含有来自大肠杆菌的乳糖通透酶LacY(UniProt IDP02920)、来自空肠弯曲杆菌(UniProt ID Q93MP7)和具有SEQ ID NO 62的来自流感嗜血杆菌的N-酰基神经氨酸胞苷酰基转移酶和具有β-半乳糖苷α-2,6-唾液酸转移酶活性的由UniProt ID O66375的氨基酸残基108至497组成的PdST6样多肽的组成型转录单元的基因组敲入,以及包含具有SEQ ID NO 61的来自多杀巴斯德氏菌的N-酰基神经氨酸胞苷酰基转移酶和具有β-半乳糖苷α-2,6-唾液酸转移酶活性的由UniProt ID O66375的氨基酸残基108至497组成的PdST6样多肽的组成型转录单元的表达质粒。在补料分批发酵过程中评价突变的大肠杆菌菌株。如在实施例4中所述进行在生物反应器规模的补料分批发酵。也评价了缺乏具有SEQ ID NO 01的nanT的参考大肠杆菌菌株。将蔗糖用作碳源,并将乳糖作为前体加入批式培养基中。在发酵过程中未添加唾液酸(Neu5Ac)。与本文描述的培养实验相反且其中仅在培养结束时(即,如本文描述的72小时)采集最终样品,在发酵过程和唾液酸(Neu5Ac)生产期间的几个时间点采集常规培养液样品,并如在实施例4中所述使用UPLC测量在每个所述时间点的6’-唾液酸基乳糖。实验证实,例如在分批阶段结束时和在补料分批阶段期间采集的培养液样品包含唾液酸产生以及6’-唾液酸基乳糖和未修饰的乳糖。在补料分批阶段结束时,与参考菌株相比,新型突变株产生了少得多的唾液酸(Neu5Ac)和更高量的6’-SL(表5)。与参考菌株相比,突变株还具有更低的Neu5Ac与6’-SL比率(Neu5Ac/6’-SL)。与参考菌株相比,突变株还具有更低的产生的Neu5Ac相对于产生的6’-SL和Neu5Ac的总量的比率(Neu5Ac/(6’-SL+Neu5Ac))。
表5:在补料分批发酵中得到的参数
实施例13.在补料分批发酵中评价突变的大肠杆菌菌株
在补料分批发酵过程中进一步评价如在实施例11中所述的突变的大肠杆菌菌株。如在实施例4中所述进行在生物反应器规模的补料分批发酵。使用具有相同基因组成但缺乏唾液酸转运蛋白的参考菌株。在这些实施例中,将蔗糖用作碳源,并且将乳糖作为前体加入批式培养基中。在发酵过程中不添加唾液酸(Neu5Ac)。与本文描述的培养实验相反且其中仅在培养结束时(即,如本文描述的72小时)采集最终样品,在发酵过程和唾液酸(Neu5Ac)产生期间的几个时间点采集常规培养液样品,并如在实施例4中所述使用UPLC测量在每个所述时间点的唾液酸(Neu5Ac)和3’-唾液酸基乳糖的产生。
实施例14.用经修饰的大肠杆菌宿主产生包含6’SL、LN3、唾液酸化的LN3、LNnT和 LSTc的寡糖混合物
如在实施例9中所述,用基因组敲入进一步修饰针对唾液酸产生(Neu5Ac)和6’-唾液酸基乳糖经修饰的大肠杆菌宿主,所述基因组敲入包含具有SEQ ID NO 66的来自脑膜炎奈瑟氏菌的半乳糖苷β-1,3-N-乙酰葡糖胺基转移酶LgtA(用于产生LN3)和来自脑膜炎奈瑟氏菌的N-乙酰葡糖胺β-1,4-半乳糖基转移酶lgtB(UniProt ID Q51116)(用于产生LNnT)的组成型转录单元,如在实施例4中所述,以产生包含6’SL、LN3、LNnT和LSTc(Neu5Ac-a2,6-Gal-b1,4-GlcNAc-b1,3-Gal-b1,4-Glc)的寡糖的混合物。根据在实施例4中提供的培养条件对新菌株进行生长实验评价,其中所述培养基含有蔗糖和乳糖。菌株在96-孔平板中进行四个生物重复培养。孵育72小时后,收获培养液,并在UPLC上分析糖。
实施例15.用经修饰的大肠杆菌菌株产生6’-唾液酸基乳糖(6’-SL)
在下一个实施例中,进一步修饰如在实施例7和8中所述的大肠杆菌突变株用于6’-SL产生,包含:大肠杆菌LacY基因的敲除,含有来自大肠杆菌的乳糖通透酶LacY(UniProt ID P02920)、来自空肠弯曲杆菌(UniProt ID Q93MP7)和具有SEQ ID NO 62的来自流感嗜血杆菌的N-酰基神经氨酸胞苷酰基转移酶和具有β-半乳糖苷α-2,6-唾液酸转移酶活性的由UniProt ID O66375的氨基酸残基108至497组成的PdST6样多肽的组成型转录单元的基因组敲入,以及包含具有SEQ ID NO 61的来自多杀巴斯德氏菌的N-酰基神经氨酸胞苷酰基转移酶和具有β-半乳糖苷α-2,6-唾液酸转移酶活性的由UniProt ID O66375的氨基酸残基108至497组成的PdST6样多肽的组成型转录单元的表达质粒。根据在实施例4中提供的培养条件对新菌株进行生长实验评价,其中所述培养基含有30g/L蔗糖和20g/L乳糖。每个菌株在96-孔平板中进行四个生物重复培养。孵育72小时后,收获培养液,并在UPLC上分析糖。
实施例16.用经修饰的酿酒酵母菌株产生唾液酸(Neu5Ac)
如在实施例5中所述用pRS420-衍生的酵母表达质粒修改酿酒酵母菌株用于唾液酸(Neu5Ac)产生,所述质粒包含:TRP1选择标志物以及选自SEQ ID NO 01、02、03、04、05、06、07、08、09、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58或59的唾液酸转运蛋白、来自大肠杆菌的突变体glmS*54(与具有UniProt IDP17169的野生型大肠杆菌glmS的差别在于A39T、R250C和G472S突变)、来自大肠杆菌的磷酸酶SurE(UniProt ID P0A840)、来自卵形拟杆菌的N-酰基葡糖胺2-差向异构酶AGE(UniProtID A7LVG6)和来自脑膜炎奈瑟氏菌的N-乙酰神经氨酸合酶NeuB(UniProt ID E0NCD4)的组成型转录单元。根据在实施例5中提供的培养条件在SD CSM-Trp缺陷型培养基上对新菌株进行生长实验评价。孵育72小时后,收获培养液,并在UPLC上分析糖。
实施例17.用经修饰的酿酒酵母菌株产生6’-唾液酸基乳糖(6’-SL)
如在实施例5中所述用pRS420-衍生的酵母表达质粒修改酿酒酵母菌株用于唾液酸(Neu5Ac)和6’-SL产生,所述质粒包含TRP1选择标志物以及选自SEQ ID NO 01、02、03、04、05、06、07、08、09、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58或59的唾液酸转运蛋白、来自大肠杆菌的突变体glmS*54(与具有UniProtID P17169的野生型大肠杆菌glmS的差别在于A39T、R250C和G472S突变)、来自大肠杆菌的磷酸酶SurE(UniProt ID P0A840)、来自卵形拟杆菌的N-酰基葡糖胺2-差向异构酶AGE(UniProt ID A7LVG6)、来自脑膜炎奈瑟氏菌的N-乙酰神经氨酸合酶NeuB(UniProt IDE0NCD4)、具有SEQ ID NO 61的来自多杀巴斯德氏菌的N-酰基神经氨酸胞苷酰基转移酶NeuA、具有β-半乳糖苷α-2,6-唾液酸转移酶活性的由UniProt ID O66375的氨基酸残基108至497组成的PdST6样多肽和来自乳酸克鲁维酵母的乳糖通透酶LAC12(UniProt IDP07921)的组成型转录单元。根据在实施例5中提供的培养条件在SD CSM-Trp缺陷型培养基上对新菌株进行生长实验评价。孵育72小时后,收获培养液,并在UPLC上分析糖。
实施例18.用经修饰的酿酒酵母宿主产生包含6’SL、LN3、唾液酸化的LN3、LNnT和 LSTc的寡糖混合物
用第二种pRS420-衍生的酵母表达质粒进一步修饰在实施例17中描述的突变的酿酒酵母菌株,所述质粒包含HIS3选择标志物以及来自大肠杆菌的UDP-葡萄糖-4-差向异构酶galE(UniProt ID P09147)、具有SEQ ID NO 66的来自脑膜炎奈瑟氏菌的半乳糖苷β-1,3-N-乙酰葡糖胺基转移酶lgtA和来自脑膜炎奈瑟氏菌的N-乙酰葡糖胺β-1,4-半乳糖基转移酶lgtB(UniProt ID Q51116)的组成型转录单元,以产生包含6’SL、LN3、LNnT和LSTc(Neu5Ac-a2,6-Gal-b1,4-GlcNAc-b1,3-Gal-b1,4-Glc)的寡糖的混合物。根据在实施例5中提供的培养条件在包含乳糖作为前体的SD CSM-Trp-His缺陷型培养基上对新菌株进行生长实验评价。孵育72小时后,收获培养液,并在UPLC上分析糖。
序列表
<110> 因比奥斯公司(Inbiose N.V.)
<120> 唾液酸化的二糖和/或寡糖的细胞生产
<130> 040-PCT
<150> EP 21168996.3
<151> 2021-04-16
<160> 66
<170> PatentIn version 3.5
<210> 1
<211> 496
<212> PRT
<213> 大肠杆菌K-12 MG1655
<400> 1
Met Ser Thr Thr Thr Gln Asn Ile Pro Trp Tyr Arg His Leu Asn Arg
1 5 10 15
Ala Gln Trp Arg Ala Phe Ser Ala Ala Trp Leu Gly Tyr Leu Leu Asp
20 25 30
Gly Phe Asp Phe Val Leu Ile Ala Leu Val Leu Thr Glu Val Gln Gly
35 40 45
Glu Phe Gly Leu Thr Thr Val Gln Ala Ala Ser Leu Ile Ser Ala Ala
50 55 60
Phe Ile Ser Arg Trp Phe Gly Gly Leu Met Leu Gly Ala Met Gly Asp
65 70 75 80
Arg Tyr Gly Arg Arg Leu Ala Met Val Thr Ser Ile Val Leu Phe Ser
85 90 95
Ala Gly Thr Leu Ala Cys Gly Phe Ala Pro Gly Tyr Ile Thr Met Phe
100 105 110
Ile Ala Arg Leu Val Ile Gly Met Gly Met Ala Gly Glu Tyr Gly Ser
115 120 125
Ser Ala Thr Tyr Val Ile Glu Ser Trp Pro Lys His Leu Arg Asn Lys
130 135 140
Ala Ser Gly Phe Leu Ile Ser Gly Phe Ser Val Gly Ala Val Val Ala
145 150 155 160
Ala Gln Val Tyr Ser Leu Val Val Pro Val Trp Gly Trp Arg Ala Leu
165 170 175
Phe Phe Ile Gly Ile Leu Pro Ile Ile Phe Ala Leu Trp Leu Arg Lys
180 185 190
Asn Ile Pro Glu Ala Glu Asp Trp Lys Glu Lys His Ala Gly Lys Ala
195 200 205
Pro Val Arg Thr Met Val Asp Ile Leu Tyr Arg Gly Glu His Arg Ile
210 215 220
Ala Asn Ile Val Met Thr Leu Ala Ala Ala Thr Ala Leu Trp Phe Cys
225 230 235 240
Phe Ala Gly Asn Leu Gln Asn Ala Ala Ile Val Ala Val Leu Gly Leu
245 250 255
Leu Cys Ala Ala Ile Phe Ile Ser Phe Met Val Gln Ser Ala Gly Lys
260 265 270
Arg Trp Pro Thr Gly Val Met Leu Met Val Val Val Leu Phe Ala Phe
275 280 285
Leu Tyr Ser Trp Pro Ile Gln Ala Leu Leu Pro Thr Tyr Leu Lys Thr
290 295 300
Asp Leu Ala Tyr Asn Pro His Thr Val Ala Asn Val Leu Phe Phe Ser
305 310 315 320
Gly Phe Gly Ala Ala Val Gly Cys Cys Val Gly Gly Phe Leu Gly Asp
325 330 335
Trp Leu Gly Thr Arg Lys Ala Tyr Val Cys Ser Leu Leu Ala Ser Gln
340 345 350
Leu Leu Ile Ile Pro Val Phe Ala Ile Gly Gly Ala Asn Val Trp Val
355 360 365
Leu Gly Leu Leu Leu Phe Phe Gln Gln Met Leu Gly Gln Gly Ile Ala
370 375 380
Gly Ile Leu Pro Lys Leu Ile Gly Gly Tyr Phe Asp Thr Asp Gln Arg
385 390 395 400
Ala Ala Gly Leu Gly Phe Thr Tyr Asn Val Gly Ala Leu Gly Gly Ala
405 410 415
Leu Ala Pro Ile Ile Gly Ala Leu Ile Ala Gln Arg Leu Asp Leu Gly
420 425 430
Thr Ala Leu Ala Ser Leu Ser Phe Ser Leu Thr Phe Val Val Ile Leu
435 440 445
Leu Ile Gly Leu Asp Met Pro Ser Arg Val Gln Arg Trp Leu Arg Pro
450 455 460
Glu Ala Leu Arg Thr His Asp Ala Ile Asp Gly Lys Pro Phe Ser Gly
465 470 475 480
Ala Val Pro Phe Gly Ser Ala Lys Asn Asp Leu Val Lys Thr Lys Ser
485 490 495
<210> 2
<211> 508
<212> PRT
<213> 小肠结肠炎耶尔森氏菌palearctica亚种血清型O:3
<400> 2
Met Ser Thr Ser Val Gln Pro Gln Thr Asp Lys Pro Pro Arg Gly Asp
1 5 10 15
Lys Pro Leu Arg Trp Tyr Lys Gln Leu Thr Pro Ala Gln Trp Lys Ala
20 25 30
Phe Ile Ala Ala Trp Ile Gly Tyr Ala Leu Asp Gly Phe Asp Phe Val
35 40 45
Leu Ile Thr Leu Val Leu Thr Asp Ile Lys Gln Glu Phe Gly Leu Thr
50 55 60
Leu Ile Gln Ala Thr Ser Leu Ile Ser Ala Ala Phe Ile Ser Arg Trp
65 70 75 80
Phe Gly Gly Leu Val Leu Gly Ala Met Gly Asp Arg Tyr Gly Arg Lys
85 90 95
Leu Ala Met Ile Thr Ser Ile Val Leu Phe Ser Phe Gly Thr Leu Ala
100 105 110
Cys Gly Leu Ala Pro Gly Tyr Thr Thr Leu Phe Ile Ala Arg Leu Ile
115 120 125
Ile Gly Ile Gly Met Ala Gly Glu Tyr Gly Ser Ser Ser Thr Tyr Val
130 135 140
Met Glu Ser Trp Pro Lys Asn Met Arg Asn Lys Ala Ser Gly Phe Leu
145 150 155 160
Ile Ser Gly Phe Ser Ile Gly Ala Val Leu Ala Ala Gln Ala Tyr Ser
165 170 175
Tyr Val Val Pro Ala Phe Gly Trp Arg Met Leu Phe Tyr Ile Gly Leu
180 185 190
Leu Pro Ile Ile Phe Ala Leu Trp Leu Arg Lys Asn Leu Pro Glu Ala
195 200 205
Glu Asp Trp Glu Lys Ala Gln Ser Lys His Gln Gln Ser Lys Gln Ala
210 215 220
Lys Asp Arg Asn Met Val Asp Ile Leu Tyr Arg Ser Lys Leu Ser Tyr
225 230 235 240
Arg Asn Ile Ala Leu Thr Leu Phe Ala Ala Ala Ala Leu Tyr Ala Cys
245 250 255
Phe Thr Gly Met Val Ser Thr Pro Val Val Val Leu Leu Gly Ile Leu
260 265 270
Cys Ala Ala Val Phe Ile Tyr Phe Met Val Gln Thr Ser Gly Asp Arg
275 280 285
Trp Pro Thr Gly Val Met Leu Met Val Val Val Phe Cys Ala Phe Leu
290 295 300
Tyr Ser Trp Pro Ile Gln Ala Leu Leu Pro Thr Tyr Leu Lys Met Asp
305 310 315 320
Leu Gly Tyr Asp Pro His Thr Val Gly Asn Val Leu Phe Phe Ser Gly
325 330 335
Phe Gly Ala Ala Val Gly Cys Cys Val Gly Gly Phe Leu Gly Asp Trp
340 345 350
Leu Gly Thr Arg Lys Ala Tyr Val Thr Ser Leu Leu Ile Ser Gln Leu
355 360 365
Leu Ile Ile Pro Leu Phe Ala Ile Gln Gly Ser Ser Ile Leu Phe Leu
370 375 380
Gly Gly Leu Leu Phe Leu Gln Gln Met Leu Gly Gln Gly Ile Ala Gly
385 390 395 400
Leu Leu Pro Lys Leu Leu Gly Gly Tyr Phe Asp Thr Glu Gln Arg Ala
405 410 415
Ala Gly Leu Gly Phe Thr Tyr Asn Val Gly Ala Leu Gly Gly Ala Leu
420 425 430
Ala Pro Ile Leu Gly Ala Ser Ile Ala Gln His Leu Ser Leu Gly Thr
435 440 445
Ala Leu Gly Ser Leu Ser Phe Ser Leu Thr Phe Val Val Ile Leu Leu
450 455 460
Ile Gly Phe Asp Met Pro Ser Arg Val Gln Arg Trp Val Arg Pro Ser
465 470 475 480
Gly Leu Arg Met Val Asp Ala Ile Asp Gly Lys Pro Phe Ser Gly Ala
485 490 495
Ile Gly Pro Val Gly Ala Ser Val Val Thr Gln Lys
500 505
<210> 3
<211> 494
<212> PRT
<213> 布里纳氏布丘氏菌ATCC 51605
<400> 3
Met Asn Asn Thr Thr Gln Gln Ile Pro Trp Tyr Arg His Leu Thr Lys
1 5 10 15
Pro Gln Trp Lys Ala Phe Ser Ala Ala Trp Ile Gly Tyr Leu Leu Asp
20 25 30
Gly Phe Asp Phe Val Leu Ile Ala Leu Val Leu Thr Glu Ile Gln Ser
35 40 45
Glu Phe Gly Leu Thr Thr Ile Gln Ala Ala Ser Leu Ile Ser Ala Ala
50 55 60
Phe Ile Ser Arg Trp Phe Gly Gly Leu Val Leu Gly Ala Met Gly Asp
65 70 75 80
Arg Tyr Gly Arg Lys Leu Ala Met Ile Thr Ser Ile Val Leu Phe Ser
85 90 95
Phe Gly Thr Leu Ala Cys Gly Phe Ala Pro Gly Phe Thr Thr Met Phe
100 105 110
Phe Ala Arg Leu Leu Ile Gly Met Gly Met Ala Gly Glu Tyr Gly Ser
115 120 125
Ser Ala Thr Tyr Val Ile Glu Ser Trp Pro Lys Gln Met Arg Asn Lys
130 135 140
Ala Ser Gly Phe Leu Ile Ser Gly Phe Ser Val Gly Ala Val Ile Ala
145 150 155 160
Ala Gln Val Tyr Ser Val Val Val Pro Val Trp Gly Trp Arg Ala Leu
165 170 175
Phe Phe Ile Gly Ile Leu Pro Ile Ile Phe Ala Leu Trp Leu Arg Lys
180 185 190
Asn Ile Pro Glu Ala Glu Asp Trp Lys Glu Lys Phe Ala Asp Lys Lys
195 200 205
Pro Thr Lys Thr Met Val Asp Ile Leu Tyr Arg Gly Glu His Arg Leu
210 215 220
Ile Asn Ile Gly Leu Thr Ile Val Val Ala Ala Ala Leu Tyr Phe Cys
225 230 235 240
Phe Ala Gly Asn Leu Gly Asn Ala Leu Leu Ile Ala Val Leu Gly Leu
245 250 255
Ile Cys Ala Ala Ile Phe Ile Ser Phe Met Val Gln Ser Ser Gly Lys
260 265 270
Arg Trp Pro Thr Gly Val Thr Leu Met Ile Val Val Phe Phe Ala Phe
275 280 285
Leu Tyr Ser Trp Pro Ile Gln Ala Leu Leu Pro Thr Tyr Leu Lys Thr
290 295 300
Glu Leu Ala Tyr Asp Pro Ala Thr Val Ala His Val Leu Phe Phe Ser
305 310 315 320
Gly Phe Gly Ala Ala Val Gly Cys Cys Val Gly Gly Phe Leu Gly Asp
325 330 335
Trp Leu Gly Thr Arg Lys Ala Tyr Val Cys Ser Leu Leu Ala Ser Gln
340 345 350
Leu Leu Ile Ile Pro Val Phe Ala Ile Gly Gly Gly Asn Ile Trp Val
355 360 365
Leu Gly Leu Leu Leu Phe Leu Gln Gln Met Leu Gly Gln Gly Ile Ser
370 375 380
Gly Ile Leu Pro Lys Leu Ile Gly Gly Tyr Phe Asp Thr Glu Gln Arg
385 390 395 400
Ala Ala Gly Leu Gly Phe Thr Tyr Asn Val Gly Ala Leu Gly Gly Ala
405 410 415
Leu Ala Pro Val Ile Gly Ala Thr Ile Ala Gln Arg Leu Asp Leu Gly
420 425 430
Thr Ala Leu Ala Ser Leu Ser Phe Ser Leu Thr Phe Val Val Ile Leu
435 440 445
Leu Ile Gly Leu Asp Met Pro Ser Arg Ile Gln Arg Trp Ile His Pro
450 455 460
Glu Ala Val Arg Thr His Asp Ala Ile Asp Gly Lys Pro Phe Ser Gly
465 470 475 480
Ala Val Val Ser Gly Ser His Lys Thr Lys Leu Ile Gly Asn
485 490
<210> 4
<211> 490
<212> PRT
<213> 大肠杆菌KTE75
<400> 4
Met Asp Ser Cys Ile Gln Lys Lys Gln Val Trp Tyr Lys His Leu Ser
1 5 10 15
Pro Arg Gln Trp Lys Ile Phe Gly Ala Ala Trp Thr Gly Tyr Leu Leu
20 25 30
Asp Gly Phe Asp Phe Val Leu Ile Ser Leu Val Leu Thr Glu Val Gln
35 40 45
His Glu Phe Gly Leu Thr Thr Ile Glu Ala Ala Ser Leu Ile Ser Ala
50 55 60
Ala Phe Ile Ser Arg Trp Phe Gly Gly Leu Ala Ile Gly Ala Leu Ser
65 70 75 80
Asp Lys Met Gly Arg Arg Met Ala Met Val Leu Ser Ile Val Leu Phe
85 90 95
Ser Leu Gly Thr Leu Ala Cys Gly Leu Ala Pro Gly Tyr Ala Val Met
100 105 110
Phe Ile Ala Arg Ile Val Ile Gly Leu Gly Met Ala Gly Glu Tyr Gly
115 120 125
Ser Ser Val Thr Tyr Val Ile Glu Ser Trp Pro Val His Leu Arg Asn
130 135 140
Lys Ala Ser Gly Phe Leu Ile Ser Gly Phe Ser Ile Gly Gly Gly Leu
145 150 155 160
Ala Ala Gln Val Tyr Ser Ile Val Val Pro Leu Trp Gly Trp Arg Ser
165 170 175
Leu Phe Phe Val Gly Met Leu Pro Ile Leu Phe Ala Phe Tyr Leu Arg
180 185 190
Lys Asn Leu Pro Glu Ser Asp Asp Trp Gln Lys Arg Gln Gln Glu Asn
195 200 205
Lys Pro Val Arg Thr Met Val Asp Ile Leu Tyr Arg Glu Lys Asn Lys
210 215 220
Tyr Ile Asn Ile Leu Leu Ser Cys Ile Ala Phe Ala Cys Leu Tyr Val
225 230 235 240
Cys Phe Ser Gly Val Thr Ala Asn Ala Ala Leu Ile Thr Val Met Ala
245 250 255
Leu Cys Cys Ala Ala Val Phe Ile Ser Phe Ile Tyr Gln Gly Met Gly
260 265 270
Lys Arg Trp Pro Thr Gly Ile Met Leu Met Leu Val Val Met Phe Cys
275 280 285
Phe Leu Tyr Gly Trp Pro Leu Gln Ala Phe Leu Pro Thr Trp Leu Lys
290 295 300
Val Asp Met Gln Tyr Ser Pro Glu Thr Val Ala Leu Ile Phe Met Leu
305 310 315 320
Ala Gly Phe Gly Ser Ala Ala Gly Ser Cys Ile Gly Gly Phe Met Gly
325 330 335
Asp Trp Leu Gly Thr Arg Lys Ala Tyr Val Ile Ser Leu Leu Ile Gly
340 345 350
Gln Leu Val Ile Ile Pro Val Phe Leu Val Asp Arg Asp Tyr Val Trp
355 360 365
Leu Leu Gly Leu Leu Ile Phe Thr Gln Gln Val Phe Gly Gln Gly Ile
370 375 380
Gly Ala Leu Val Pro Lys Ile Ile Ser Gly Tyr Phe Asn Val Glu Gln
385 390 395 400
Arg Ala Ala Gly Leu Gly Phe Ile Tyr Asn Val Gly Ser Leu Gly Gly
405 410 415
Ala Cys Ala Pro Ile Leu Gly Ala Val Val Ala Ser His Thr Ser Leu
420 425 430
Gly Thr Ala Met Cys Ser Leu Ala Phe Ile Leu Thr Phe Val Val Leu
435 440 445
Val Leu Ile Gly Phe Asp Met Pro Ser Arg Val Gln Arg Trp Ile His
450 455 460
Pro Glu Ala Ala Leu Glu Tyr Asp Thr Val Asp Gly Lys Pro Phe Tyr
465 470 475 480
Gly Ala Arg Lys Lys Asn Val Ala Gly Glu
485 490
<210> 5
<211> 572
<212> PRT
<213> 短吻鳄支原体A21JP2
<400> 5
Met Val Asp Thr Ala Asn Ile Val Lys Glu Ala Ser Lys Lys Leu Ile
1 5 10 15
Ala Lys Ser Asn Phe Thr Ala Leu Asp Phe Val Val Met Ala Ala Tyr
20 25 30
Ile Leu Ala Ile Leu Gly Met Gly Ile Trp Phe Ser Ile Ala Ala Lys
35 40 45
Lys Ala Lys Glu Thr Asn Ser Asp Asp Tyr Phe Thr Gly Gly Ser Lys
50 55 60
Ile Pro Thr Trp Val Ile Gly Phe Ser Ile Trp Ala Thr Thr Leu Ser
65 70 75 80
Ala Ile Thr Phe Ile Ala Leu Pro Ala Asn Ala Tyr Asn Asn Gly Trp
85 90 95
Leu Phe Ala Phe Ser Gln Leu Thr Ile Ile Ile Phe Ala Pro Val Leu
100 105 110
Ile Lys Phe Val Ile Pro Phe Phe Arg Arg Met Lys Glu Ser Thr Ala
115 120 125
Tyr Ala Tyr Leu His Ala Arg Phe His Tyr Ala Leu Arg Ala Phe Ser
130 135 140
Ser Ile Leu Phe Ile Leu Phe His Ile Phe Arg Met Gly Ile Val Leu
145 150 155 160
Tyr Ile Pro Ala Asn Ala Leu Ser Leu Val Val Pro Leu Asp Pro Trp
165 170 175
Val Leu Val Ile Ile Met Gly Val Val Val Val Ile Thr Thr Tyr Leu
180 185 190
Gly Gly Gln Arg Gly Val Leu Trp Gln Asp Ala Ile Gln Gly Ile Ile
195 200 205
Leu Leu Leu Gly Ile Val Leu Ile Ile Val Phe Ser Leu Tyr Asn Ile
210 215 220
Phe Gly Thr Gly Asn Gly Thr Asn Gly Lys Glu Ser Ile Lys Tyr Ala
225 230 235 240
Gln Leu Leu Lys Ala Ser Asp Leu His Val Thr Leu Val Gly Ile Gly
245 250 255
Ile Pro Leu Ile Leu Val Ser Arg Tyr Ile Glu Val Ile Tyr Thr Tyr
260 265 270
Val Gly Gly Gln Asp Val Val Gln Arg Tyr Lys Ala Ser Lys Lys Thr
275 280 285
Thr Asn Ile Asn Lys Ser Ile Trp Ile Asn Ala Gly Leu Ala Leu Ile
290 295 300
Thr Ile Leu Leu Phe Tyr Gly Ala Gly Ser Ala Leu Tyr Thr Tyr Tyr
305 310 315 320
Asp Gly Met Ala Ile Thr Gln Ile Asp Pro Ala Ile Lys His Thr Asn
325 330 335
Gln Leu Val Pro Tyr Phe Ile Phe Thr Val Leu Pro Thr Gly Ile Ala
340 345 350
Gly Leu Ile Ile Ser Ala Val Phe Ala Ala Ser Gln Ser Thr Met Ser
355 360 365
Ser Ser Leu Ser Ser Leu Val Asn Ser Ile Ile Val Asp Phe Val Lys
370 375 380
Val Phe Ala Lys Lys Phe Ser Asn Asn Glu Lys Lys Leu Phe Leu Leu
385 390 395 400
Ser Lys Ile Leu Ile Gly Ala Phe Gly Ala Phe Gly Val Ile Cys Gly
405 410 415
Ile Ala Phe Thr Leu Thr Asn Leu Gly Asp Ile Ile Asn Tyr Phe Leu
420 425 430
Gly Val Val Gly Leu Phe Gly Ala Pro Thr Ala Ala Ile Phe Met Leu
435 440 445
Gly Met Phe Thr Lys Arg Thr Ser Trp Ile Ser Ala Leu Ile Gly Met
450 455 460
Val Thr Gly Phe Leu Val Gly Leu Ile Ile Trp Ile Phe Ser Thr Pro
465 470 475 480
Asp Phe Val Gly Gly Lys Glu Phe Val Lys Phe Asn Ser Gly Trp Val
485 490 495
Gly Val Phe Gly Phe Phe Val Thr Leu Leu Val Gly Tyr Leu Thr Ser
500 505 510
Phe Ile Phe Pro Asn Lys Lys Asn Ile Thr Asn Leu Ser Trp His Thr
515 520 525
Leu Thr Pro Glu Phe Lys Glu Leu Ile Ala Leu Glu Lys Thr Ile Glu
530 535 540
Lys Ala Ala Lys Lys Lys Gln Asn Ala Asp Lys Glu Ile Leu Arg Tyr
545 550 555 560
Asp Glu Leu Ile Arg Lys Leu Glu Met Ser Ala Glu
565 570
<210> 6
<211> 570
<212> PRT
<213> 山羊支原体山羊亚种
<400> 6
Met Asn Ser Leu Ile Leu Phe Thr Glu Lys Thr Thr Asn Ala Ala Ile
1 5 10 15
Lys Ser Phe His Trp Val Asp Tyr Val Val Leu Val Ile Tyr Leu Leu
20 25 30
Phe Thr Leu Ser Ile Gly Leu Tyr Phe Gln Leu Lys Ser Lys Leu Gln
35 40 45
Lys Ala Asn Asn Thr Asp Glu Tyr Phe Lys Ala Gly Gly Lys Thr Pro
50 55 60
Gly Trp Val Ala Gly Phe Ser Ile Tyr Ala Thr Thr Leu Ser Ala Ile
65 70 75 80
Thr Tyr Met Ala Thr Pro Ala Lys Ala Phe Ser Ser Asp Trp Leu Phe
85 90 95
Ala Phe Gly Asn Leu Thr Ile Phe Ile Ala Thr Pro Leu Leu Ile Arg
100 105 110
Phe Ile Ile Pro Phe Phe Lys Lys Leu Asn Asp Val Ser Gly Tyr Gly
115 120 125
Phe Leu Glu Lys Arg Phe Ser Tyr Phe Leu Arg Val Ser Ala Ser Leu
130 135 140
Met Phe Ile Leu Phe His Val Ile Arg Val Gly Leu Ile Ile Tyr Leu
145 150 155 160
Pro Thr Ile Ala Leu Thr Ala Val Thr Asn Ile Asn Pro Tyr Leu Ile
165 170 175
Ala Ile Ile Ile Gly Val Phe Cys Val Ile Ser Thr Val Leu Gly Gly
180 185 190
Leu Asn Gly Val Ile Trp Ser Asp Phe Ile Gln Ala Val Val Leu Ile
195 200 205
Gly Gly Ile Leu Leu Ala Ile Ile Phe Ala Leu Val Lys Ile Glu Asn
210 215 220
Leu Ser Glu Val Asn Asn Ile Val Ile Asn Asn His Lys Leu Leu Glu
225 230 235 240
Lys Glu Ser Ile Ile Pro Gln Asn Trp Ala Lys Pro Trp Ile Leu Val
245 250 255
Leu Phe Phe Gly Gln Leu Ile Asn Thr Phe Tyr Gln Tyr Ile Gly Ser
260 265 270
Gln Asp Val Val Gln Arg Tyr Gln Ser Asn Gln Ser Phe Lys Gln Val
275 280 285
Lys Lys Gly Leu Trp Thr Asn Ala Ile Leu Ala Leu Ile Thr Ile Leu
290 295 300
Leu Phe Tyr Gly Met Gly Thr Leu Leu Tyr Ala Phe Tyr Val Gln Lys
305 310 315 320
Thr Gly Leu Thr Asn Ile Glu Asp Ile Met Arg Ser Ile Gly Ile Lys
325 330 335
Ala Asn Asn Gln Ile Leu Pro Tyr Phe Ile Val Thr Val Leu Pro Val
340 345 350
Gly Ile Ser Gly Leu Ile Ile Ala Gly Ile Tyr Ser Ala Ser Met Ser
355 360 365
Thr Ile Ser Ser Ser Leu His Ser Ala Ala Thr Cys Ile Val Glu Asp
370 375 380
Ile Leu Val Arg Ile Lys Pro Asn Leu Lys Asp Lys Glu Lys Met Tyr
385 390 395 400
Trp Ala Lys Gly Leu Ile Leu Gly Ile Gly Leu Leu Gly Thr Ile Ala
405 410 415
Ser Ile Ile Leu Ile Ile Ser Lys Ala Asp Asn Leu Leu Asp Leu Phe
420 425 430
Ala Ala Val Ile Gly Leu Phe Gly Thr Ser Val Thr Val Ile Tyr Leu
435 440 445
Leu Gly Ile Phe Thr Lys Arg Thr Ser Asn Ile Gly Ala Ile Leu Gly
450 455 460
Ser Ile Ser Ser Phe Ile Ile Val Phe Ala Ile Phe Ile Val Asn Lys
465 470 475 480
Thr Ser Lys Thr Thr Val Val Ser Asp Phe Tyr Gly Ile Ile Leu Ala
485 490 495
Phe Ile Val Gly Leu Leu Leu Gly Tyr Leu Ser Ser Phe Ile Phe Lys
500 505 510
Asn Lys Lys Ile Asp Lys Leu Glu Gly Leu Thr Ile His Thr Phe Ser
515 520 525
Lys Gln Asp Phe Asn Lys Met Ile Glu Asp Gly Glu Lys Glu Trp Gln
530 535 540
Glu Ile Lys Ala Asn Glu Asn Gln Phe Lys Lys Asp Leu Ile Lys Lys
545 550 555 560
Ile Lys Gln Lys Lys Val Ala Lys Ser Asn
565 570
<210> 7
<211> 510
<212> PRT
<213> 金黄色葡萄球菌
<400> 7
Met Lys Glu Val Gly Phe Gly Thr Leu Asn Trp Val Ala Val Ile Ile
1 5 10 15
Tyr Leu Leu Ala Met Leu Phe Ile Gly Val Tyr Phe Thr Lys Arg Ala
20 25 30
Ser Gln Ser Thr Asn Ser Phe Phe Thr Ala Ser Gly Arg Leu Pro Ser
35 40 45
Trp Val Val Gly Phe Ser Ile Tyr Ala Thr Thr Leu Ser Ala Ile Thr
50 55 60
Phe Met Ser Thr Pro Glu Lys Ala Phe Leu Thr Asp Trp Ser Tyr Ile
65 70 75 80
Ala Gly Asn Ile Ala Ile Val Ala Ile Ile Pro Leu Leu Ile Tyr Phe
85 90 95
Tyr Val Pro Phe Phe Lys Lys Leu Lys Val Thr Ser Ala Tyr Glu Tyr
100 105 110
Leu Glu Ala Arg Phe Gly Pro Ser Ile Arg Val Ile Gly Ser Leu Leu
115 120 125
Phe Val Val Tyr His Leu Gly Arg Val Ala Ile Val Ile Tyr Leu Pro
130 135 140
Thr Leu Ala Ile Thr Ser Val Ser Asp Met Asn Pro Tyr Ile Val Ala
145 150 155 160
Ser Leu Val Gly Leu Leu Cys Ile Leu Tyr Thr Phe Leu Gly Gly Phe
165 170 175
Glu Gly Val Val Trp Ser Asp Phe Ile Gln Gly Val Ile Leu Leu Gly
180 185 190
Gly Ala Leu Val Ile Ile Ile Leu Gly Val Val Asn Ile Lys Gly Gly
195 200 205
Phe Gly Thr Val Phe Ala Asp Ala Ile Glu His Lys Lys Leu Ile Ser
210 215 220
Ala Asp Asn Trp Lys Leu Asn Thr Ala Ala Ala Ala Ile Pro Ile Ile
225 230 235 240
Phe Leu Gly Asn Ile Phe Asn Asn Leu Tyr Gln Tyr Thr Ala Ser Gln
245 250 255
Asp Val Val Gln Arg Tyr Gln Ala Ser Asp Ser Leu Lys Glu Thr Asn
260 265 270
Lys Ser Leu Trp Thr Asn Gly Ile Leu Ala Leu Ile Ser Ala Pro Leu
275 280 285
Phe Tyr Gly Met Gly Thr Met Leu Tyr Ser Phe Tyr Thr His Glu Ala
290 295 300
Val Leu Pro Lys Gly Phe Asn Thr Ser Ser Val Val Pro Tyr Phe Ile
305 310 315 320
Leu Thr Glu Met Pro Pro Phe Val Ala Gly Leu Leu Ile Ala Ala Ile
325 330 335
Phe Ala Ala Ala Gln Ser Thr Ile Ser Ser Ser Leu Asn Ser Ile Ser
340 345 350
Ala Cys Ile Ser Ile Asp Ile Lys Gln Arg Phe Phe Gly Lys Gly Ser
355 360 365
Glu Arg His Glu Val Asn Phe Ala Arg Phe Ile Ile Ile Ile Ala Gly
370 375 380
Ile Phe Gly Phe Gly Met Ser Leu Tyr Leu Ile Ala Ser Asn Ser Asn
385 390 395 400
Asp Leu Trp Asp Leu Phe Leu Phe Val Thr Gly Leu Phe Gly Val Pro
405 410 415
Leu Ala Gly Val Phe Ala Val Gly Ile Phe Thr Lys Arg Thr Asn Thr
420 425 430
Phe Gly Val Ile Cys Gly Leu Ile Leu Gly Ile Ile Phe Ala Tyr Val
435 440 445
Tyr Asn Gly Val Gly Lys Gly Asn Ser Pro Phe Tyr Val Ser Thr Ile
450 455 460
Ser Phe Thr Val Ala Phe Val Phe Ala Tyr Ile Leu Ser Phe Ile Val
465 470 475 480
Pro Ser Lys His Lys Lys Asp Ile Thr Gly Leu Thr Ile Phe Glu Lys
485 490 495
Asp Lys Pro Ser Thr Tyr Ile Ser Lys Thr Ala Thr Lys Lys
500 505 510
<210> 8
<211> 517
<212> PRT
<213> 孪生球菌属种
<400> 8
Met Asp Lys Ile Gly Phe Gly Thr Leu Asn Ser Ile Val Leu Ala Ile
1 5 10 15
Tyr Leu Ile Ala Met Leu Ala Ile Gly Val Tyr Phe Thr Lys Lys Ala
20 25 30
Gly Glu Ser Thr Asp Glu Phe Phe Lys Ala Gly Gly Asn Ile Pro Ser
35 40 45
Trp Ala Val Gly Phe Ser Ile Tyr Ala Thr Thr Leu Ser Ala Ile Thr
50 55 60
Phe Met Ala Thr Pro Glu Lys Ala Phe Asn Gly Asp Trp Thr Tyr Ala
65 70 75 80
Ala Gly Asn Phe Ser Ile Ile Ala Ile Ile Pro Ile Leu Ile His Tyr
85 90 95
Tyr Ile Pro Phe Phe Arg Lys Leu Asn Val Thr Thr Ala Tyr Glu Tyr
100 105 110
Leu Glu Glu Arg Phe Asn Pro Ser Val Arg Val Val Gly Ser Val Leu
115 120 125
Phe Ser Leu Phe His Ile Gly Arg Val Ala Ile Val Ile Tyr Leu Pro
130 135 140
Thr Val Ala Ile Thr Ser Val Ser Thr Leu Asn Pro Phe Leu Val Cys
145 150 155 160
Ala Ile Ile Gly Leu Leu Cys Val Val Tyr Ser Phe Leu Gly Gly Val
165 170 175
Glu Gly Val Ile Trp Thr Asp Val Ile Gln Gly Ile Ile Leu Leu Gly
180 185 190
Gly Ala Val Leu Val Ile Ile Leu Gly Ala Tyr His Val Gly Gly Phe
195 200 205
Gly Gln Ile Thr Gln Asp Ala Leu Ala Asn Gly Lys Ile Val Thr Ala
210 215 220
Glu Lys Phe Ser Trp Ser Leu Thr Ala Ser Thr Ile Pro Ile Ile Phe
225 230 235 240
Ile Gly Ser Val Phe Asn Ser Leu Gln Gln Tyr Thr Ala Ser Gln Asp
245 250 255
Val Val Gln Arg Tyr Ser Thr Thr Glu Ser Val Lys Glu Thr Asn Lys
260 265 270
Ser Ile Trp Thr Asn Gly Leu Leu Ala Phe Ile Ser Ile Pro Ile Phe
275 280 285
Tyr Gly Met Gly Thr Val Leu Tyr Ser Phe Tyr Lys Gly Ser His Ala
290 295 300
Val Thr Lys Leu Pro Asp Phe Met Asn Ala Glu Val Val Gly Lys Ala
305 310 315 320
Ala Asn Thr Thr Ala Leu Val Pro Tyr Phe Ile Leu Thr Ala Leu Pro
325 330 335
Ala Gly Val Ala Gly Leu Val Ile Ala Ala Ile Leu Ala Ala Ala Gln
340 345 350
Ser Thr Ile Ala Ser Ser Leu Asn Ser Ile Ser Ala Cys Ile Thr Val
355 360 365
Asp Ile Lys Gln Arg Phe Phe Gly Leu Ser Lys Asp Ala Lys Gln Asp
370 375 380
Val Leu Leu Ala Arg Ile Ile Ile Ile Ile Ala Gly Val Leu Gly Thr
385 390 395 400
Ile Ala Ala Leu Tyr Phe Val Asn Ser Asn Gln Lys Glu Thr Trp Asp
405 410 415
Leu Phe Leu Lys Tyr Ile Gly Leu Leu Gly Val Pro Leu Ala Gly Thr
420 425 430
Phe Ala Leu Gly Ile Phe Thr Lys Arg Ala Asn Gly Ala Gly Ala Leu
435 440 445
Leu Gly Leu Val Val Ala Gly Leu Val Cys Trp Tyr Ile Gln Asp Phe
450 455 460
Thr Thr Tyr Ala Lys Gln Ser Pro Phe Ile Phe Ser Gly Phe Ser Phe
465 470 475 480
Leu Ser Ala Leu Val Phe Gly Tyr Ile Cys Ser Phe Phe Phe Lys Ser
485 490 495
Thr Lys Asn Ile Thr Gly Leu Thr Ile His Thr Lys Asp Gln Glu Tyr
500 505 510
Val Lys Glu Ala Lys
515
<210> 9
<211> 500
<212> PRT
<213> 艰难梭菌ATCC 9689 = DSM 1296
<400> 9
Met Val Gly Phe Thr Trp Ile Asp Phe Ala Ile Leu Val Val Tyr Leu
1 5 10 15
Leu Ala Val Leu Phe Ala Gly Leu Leu Phe Ser Lys Lys Glu Met Lys
20 25 30
Gly Lys Glu Phe Phe Lys Gly Asp Gly Thr Ile Pro Trp Trp Val Thr
35 40 45
Ser Val Ser Ile Phe Ala Thr Leu Leu Ser Pro Ile Ser Phe Leu Ser
50 55 60
Leu Ala Gly Asn Ser Tyr Gly Gly Thr Trp Ile Leu Trp Phe Ala Gln
65 70 75 80
Leu Gly Met Phe Ile Ala Ile Pro Leu Thr Ile Lys Phe Phe Leu Pro
85 90 95
Leu Tyr Ser Arg Leu Glu Ile Asp Thr Ala Tyr Glu Tyr Leu Glu Met
100 105 110
Arg Tyr Glu Ser Lys Gly Leu Arg Val Leu Gly Ala Leu Met Phe Ile
115 120 125
Ile Tyr Gln Ile Gly Arg Met Ser Ile Ile Met Tyr Leu Pro Ser Val
130 135 140
Val Leu Ala Gly Leu Thr Gly Ile Pro Val Asn Val Leu Ile Val Val
145 150 155 160
Met Gly Val Ile Ala Ile Ile Tyr Ser Tyr Thr Gly Gly Leu Lys Ala
165 170 175
Val Leu Trp Thr Asp Phe Ile Gln Gly Met Val Leu Ile Val Gly Val
180 185 190
Thr Gly Thr Leu Phe Tyr Leu Ile Ala Ser Ile Asn Gly Gly Phe Gly
195 200 205
Thr Val Met Asp Thr Leu Thr Thr Gly His Lys Phe Leu Ala Ser Asn
210 215 220
Glu Val Met Phe Asp Lys Asn Ile Leu Ser Thr Ser Ala Phe Ile Ile
225 230 235 240
Phe Ile Gly Ala Gly Leu Asn Thr Phe Ser Ser Tyr Val Ser Ser Gln
245 250 255
Asp Ile Val Gln Arg Phe Thr Thr Thr Thr Asp Ile Lys Gln Leu Asn
260 265 270
Lys Met Thr Tyr Gly Asn Gly Val Leu Ser Met Gly Leu Ala Thr Val
275 280 285
Phe Tyr Leu Ile Gly Thr Cys Leu Phe Ile Tyr Tyr Thr Gln Asn Pro
290 295 300
Asp Leu Ala Gln Thr Val Gln Gln Asp Gln Val Phe Ala Ser Tyr Ile
305 310 315 320
Ala Tyr Glu Leu Pro Val Gly Ile Thr Gly Ile Leu Leu Ala Ala Ile
325 330 335
Tyr Ala Ala Ser Gln Ser Thr Leu Ser Thr Gly Leu Asn Ser Val Ala
340 345 350
Thr Ser Trp Thr Leu Asp Ile Gln Thr Ile Ile Thr Lys Asp Ile Ser
355 360 365
Met Glu Lys Gln Thr Lys Ile Ala Gln Tyr Ile Ser Leu Gly Val Gly
370 375 380
Ile Leu Ser Ile Ala Val Ala Ile Val Leu Ala Asn Gly Glu Ile Lys
385 390 395 400
Ser Ala Tyr Glu Trp Phe Asn Ser Phe Met Gly Leu Val Leu Gly Val
405 410 415
Leu Ala Gly Ile Phe Val Leu Gly Ala Phe Cys Lys Lys Ala Thr Lys
420 425 430
Met Gly Ala Tyr Val Gly Phe Ile Val Ser Ala Ile Leu Val Val Tyr
435 440 445
Leu Lys Tyr Arg Met Pro Glu Val Thr Ser Trp Ala Tyr Ser Leu Ile
450 455 460
Thr Ile Thr Thr Ser Val Val Val Gly Thr Ile Val Ser Ala Ile Glu
465 470 475 480
Ala Lys Val Lys Ala Lys Val Ser Leu Pro Lys Ala Glu Thr Thr Val
485 490 495
Tyr Tyr Glu Lys
500
<210> 10
<211> 513
<212> PRT
<213> 罗氏消化链球菌
<400> 10
Met Asp Lys Ile Gly Phe Gly Phe Ala Asn Gly Val Val Leu Val Leu
1 5 10 15
Tyr Leu Leu Ala Met Thr Ala Ile Gly Gly Leu Phe Ala Lys Lys Ala
20 25 30
Gly Lys Asn Thr Asp Ala Phe Phe Lys Ala Ser Gly Ser Leu Pro Ser
35 40 45
Trp Ala Val Gly Phe Ser Ile Tyr Ala Thr Thr Leu Ser Ala Ile Thr
50 55 60
Phe Met Ala Thr Pro Glu Lys Ala Phe Asn Gly Asp Trp Ala Tyr Ala
65 70 75 80
Ala Gly Asn Leu Ser Ile Ile Val Ile Ile Pro Ile Leu Ile Arg Phe
85 90 95
Tyr Val Pro Phe Phe Arg Lys Leu Asn Val Thr Thr Ala Tyr Glu Tyr
100 105 110
Leu Glu Ala Arg Phe Asn Pro Ala Met Arg Val Phe Gly Ser Val Leu
115 120 125
Phe Ser Leu Phe His Ile Gly Arg Ile Ala Ile Val Ile Tyr Leu Pro
130 135 140
Thr Val Ala Ile Thr Ser Val Ser Thr Ile Asn Pro Tyr Leu Val Cys
145 150 155 160
Gly Ala Ile Gly Ile Leu Cys Val Ile Tyr Ser Phe Leu Gly Gly Met
165 170 175
Glu Gly Val Ile Trp Thr Asp Phe Ile Gln Gly Val Ile Leu Ile Gly
180 185 190
Gly Ala Leu Leu Val Ile Ala Val Gly Val Phe Asn Val Gly Gly Phe
195 200 205
Gly Asn Val Ala Ala Asp Ala Val Ala His Lys Lys Ile Leu Ser Asn
210 215 220
Glu Thr Leu Gln Trp Ser Phe Thr Ala Ala Thr Val Pro Ile Ile Phe
225 230 235 240
Leu Gly Ser Ile Phe Asn Ser Leu Gln Gln Tyr Thr Ala Ser Gln Asp
245 250 255
Val Val Gln Arg Tyr Asn Thr Thr Lys Asn Gln Lys Glu Thr Asn Lys
260 265 270
Ser Leu Trp Thr Asn Gly Leu Leu Ala Phe Ile Thr Ile Pro Ile Phe
275 280 285
Tyr Gly Met Gly Thr Val Leu Tyr Ser Phe Tyr Lys Gly Ala His Ala
290 295 300
Ala Gly Ser Leu Pro Asn Phe Met Asn Ala Asp Val Val Gly Ala Ala
305 310 315 320
Ala Asn Thr Thr Ala Leu Val Pro Tyr Phe Ile Leu Thr Ser Leu Pro
325 330 335
Ala Gly Val Ala Gly Ile Val Ile Ala Ala Ile Leu Ala Ala Ala Gln
340 345 350
Ser Thr Ile Ser Ser Ser Leu Asn Ser Ile Ser Ala Cys Val Val Val
355 360 365
Asp Ile Lys Gln Arg Phe Phe Gly Lys Gly Asn Asp Gln Glu Asp Val
370 375 380
Arg Leu Ala Arg Leu Val Ile Ile Ala Ser Gly Leu Leu Gly Thr Ile
385 390 395 400
Ala Ala Leu Tyr Phe Ile Lys Ala Asn Gln Lys Glu Thr Trp Asp Leu
405 410 415
Phe Leu Lys Phe Ile Gly Leu Phe Gly Val Pro Ile Ala Gly Ile Phe
420 425 430
Ala Leu Gly Ile Phe Ser Lys Arg Ala Asn Gly Thr Gly Ala Leu Ile
435 440 445
Gly Leu Leu Ala Ser Ala Phe Ser Cys Tyr Trp Ile Gln Gly Asn Thr
450 455 460
Thr Trp Ala Ala Asn Pro Phe Val Phe Ser Ile Phe Ser Phe Leu Ser
465 470 475 480
Ala Val Val Phe Gly Tyr Ile Phe Ser Leu Ile Phe Lys Lys Asp Lys
485 490 495
Lys Asn Ile Asp Gly Leu Thr Ile Tyr Thr Lys Asp Gln Glu Tyr Ile
500 505 510
Gly
<210> 11
<211> 511
<212> PRT
<213> 阻塞芽孢杆菌
<400> 11
Met Glu Lys Ile Ser Phe Gly Thr Ala Asn Trp Met Val Leu Ile Leu
1 5 10 15
Tyr Leu Leu Ala Met Leu Ala Val Gly Val Tyr Phe Thr Lys Lys Ser
20 25 30
Ser Lys Asn Thr Asp Ala Phe Phe Thr Ala Gly Gly Lys Ile Pro Ala
35 40 45
Trp Ala Ala Gly Phe Ser Ile Tyr Ala Thr Thr Leu Ser Ala Ile Thr
50 55 60
Tyr Met Ser Thr Pro Glu Gln Ala Phe Leu Ser Asp Trp Ser Tyr Ser
65 70 75 80
Ala Gly Asn Leu Thr Ile Phe Ala Ile Ile Pro Ile Leu Ile Tyr Phe
85 90 95
Tyr Val Pro Phe Phe Arg Lys Leu Asn Val Thr Thr Ala Tyr Glu Tyr
100 105 110
Leu Glu Glu Arg Phe Gly Val Ser Met Arg Phe Ile Gly Ser Leu Leu
115 120 125
Phe Thr Leu Phe His Ile Gly Arg Val Ala Ile Val Ile Tyr Leu Pro
130 135 140
Thr Leu Ala Ile Thr Leu Val Ser Asp Ile Asn Pro Ile Ile Ile Ala
145 150 155 160
Thr Ala Val Gly Gly Leu Cys Ile Ile Tyr Thr Phe Leu Gly Gly Met
165 170 175
Glu Gly Val Ile Trp Ser Asp Val Ile Gln Gly Ile Ile Leu Leu Gly
180 185 190
Gly Ala Ile Leu Leu Val Val Leu Gly Ile Asn Ala Ile Asp Gly Gly
195 200 205
Phe Thr Thr Val Ile Gln Asn Ala Met Asp Asn Asp Lys Phe Leu Ser
210 215 220
Ala Lys Asn Phe Gln Phe Gly Gly Val Ala Ala Ala Ile Pro Ile Ile
225 230 235 240
Phe Leu Gly Ser Ile Phe Asn Asn Leu His Gln Tyr Thr Ala Ser Gln
245 250 255
Asp Val Val Gln Arg Tyr Gln Thr Thr Ser Ser Ile Lys Glu Thr Asn
260 265 270
Lys Ser Leu Trp Thr Asn Gly Ile Leu Ala Leu Ile Thr Ile Pro Val
275 280 285
Phe Phe Gly Leu Gly Thr Val Leu Phe Ser Tyr Tyr Thr Asn Val Glu
290 295 300
Ala Leu Pro Glu Gly Phe Asn Thr Ser Ala Leu Val Pro Tyr Phe Ile
305 310 315 320
Val Ser Ser Leu Pro Ala Gly Val Ala Gly Leu Leu Ile Ala Ala Ile
325 330 335
Phe Ala Ala Cys Gln Ser Thr Ile Ser Ser Ser Leu Asn Ser Ile Ser
340 345 350
Ala Cys Val Thr Val Asp Phe Lys Gln Arg Phe Phe Gly Lys Asp Asp
355 360 365
Lys Lys Asp Val Trp Leu Ala Arg Ile Ile Val Ile Val Ala Gly Ile
370 375 380
Leu Gly Met Ala Ala Ala Leu Tyr Leu Ile Ser Thr Asn Arg Ala Glu
385 390 395 400
Thr Trp Asn Leu Phe Leu Ser Ile Thr Gly Leu Phe Gly Val Pro Ile
405 410 415
Ala Gly Ile Phe Ala Leu Gly Ile Phe Thr Lys Arg Ala Asn Ala Pro
420 425 430
Gly Val Leu Ile Gly Leu Phe Leu Ser Ala Leu Thr Ser Tyr Phe Val
435 440 445
Gln Lys Thr Asn Leu Thr Pro Phe Thr Val Ser Ile Val Ser Phe Phe
450 455 460
Ser Ser Phe Ile Leu Gly Tyr Ile Val Ser Phe Leu Phe Pro Lys Tyr
465 470 475 480
Asn Lys Asn Ile Ile Gly Leu Thr Ile Tyr Thr Lys Asn Glu Ser Tyr
485 490 495
Thr Lys Thr Lys Gly Ser Asp Pro His Arg Ile Thr Ala Val Lys
500 505 510
<210> 12
<211> 510
<212> PRT
<213> 金黄色葡萄球菌(菌株MW2)
<400> 12
Met Lys Glu Ile Gly Phe Gly Thr Leu Asn Trp Val Ala Val Ile Ile
1 5 10 15
Tyr Leu Leu Ala Met Leu Phe Ile Gly Val Tyr Phe Thr Lys Arg Ala
20 25 30
Ser Gln Ser Thr Asn Ser Phe Phe Thr Ala Ser Gly Arg Leu Pro Ser
35 40 45
Trp Val Val Gly Phe Ser Ile Tyr Ala Thr Thr Leu Ser Ala Ile Thr
50 55 60
Phe Met Ser Thr Pro Glu Lys Ala Phe Leu Thr Asp Trp Ser Tyr Ile
65 70 75 80
Ala Gly Asn Ile Ala Ile Val Ala Ile Ile Pro Leu Leu Ile Tyr Phe
85 90 95
Tyr Val Pro Phe Phe Lys Lys Leu Lys Val Thr Ser Ala Tyr Glu Tyr
100 105 110
Leu Glu Ala Arg Phe Gly Pro Ser Ile Arg Val Ile Gly Ser Leu Leu
115 120 125
Phe Val Val Tyr His Leu Gly Arg Val Ala Ile Val Ile Tyr Leu Pro
130 135 140
Thr Leu Ala Ile Thr Ser Val Ser Asp Met Asn Pro Tyr Ile Val Ala
145 150 155 160
Ser Leu Val Gly Leu Leu Cys Ile Leu Tyr Thr Phe Leu Gly Gly Phe
165 170 175
Glu Gly Val Val Trp Ser Asp Phe Ile Gln Gly Val Ile Leu Leu Gly
180 185 190
Gly Ala Leu Val Ile Ile Ile Leu Gly Val Met Asn Ile Lys Gly Gly
195 200 205
Phe Gly Thr Val Phe Ala Asp Ala Ile Glu His Lys Lys Leu Ile Ser
210 215 220
Ala Asp Asn Trp Lys Leu Asn Thr Ala Ala Ala Ala Ile Pro Ile Ile
225 230 235 240
Phe Leu Gly Asn Ile Phe Asn Asn Leu Tyr Gln Tyr Thr Ala Ser Gln
245 250 255
Asp Val Val Gln Arg Tyr Gln Ala Ser Asp Ser Leu Lys Glu Thr Asn
260 265 270
Lys Ser Leu Trp Thr Asn Gly Ile Leu Ala Leu Ile Ser Ala Pro Leu
275 280 285
Phe Tyr Gly Met Gly Thr Met Leu Tyr Ser Phe Tyr Thr His Glu Ala
290 295 300
Val Leu Pro Lys Gly Phe Asn Thr Ser Ser Val Val Pro Tyr Phe Ile
305 310 315 320
Leu Thr Glu Met Pro Pro Phe Val Ala Gly Leu Leu Ile Ala Ala Ile
325 330 335
Phe Ala Ala Ala Gln Ser Thr Ile Ser Ser Ser Leu Asn Ser Ile Ser
340 345 350
Ala Cys Ile Ser Ile Asp Ile Lys Gln Arg Phe Phe Gly Lys Gly Ser
355 360 365
Glu Arg His Glu Val Asn Phe Ala Arg Phe Ile Ile Ile Ile Ala Gly
370 375 380
Ile Phe Gly Phe Gly Met Ser Leu Tyr Leu Ile Ala Ser Asn Ser Asn
385 390 395 400
Asp Leu Trp Asp Leu Phe Leu Phe Val Thr Gly Leu Phe Gly Val Pro
405 410 415
Leu Ala Gly Val Phe Ala Val Gly Ile Phe Thr Lys Arg Thr Asn Thr
420 425 430
Phe Gly Val Ile Cys Gly Leu Ile Leu Gly Ile Ile Phe Ala Tyr Val
435 440 445
Tyr Asn Gly Val Gly Lys Gly Asn Ser Pro Phe Tyr Val Ser Thr Ile
450 455 460
Ser Phe Thr Val Ala Phe Val Phe Ala Tyr Ile Leu Ser Phe Ile Val
465 470 475 480
Pro Ser Lys His Lys Lys Asp Ile Thr Gly Leu Thr Ile Phe Glu Lys
485 490 495
Asp Lys Pro Ser Thr Tyr Ile Ser Lys Thr Ala Thr Lys Lys
500 505 510
<210> 13
<211> 508
<212> PRT
<213> 葡萄球菌属种HMSC070A03
<400> 13
Met Gln Gln Val Gly Phe Gly Thr Trp Asn Trp Val Ala Val Ile Thr
1 5 10 15
Tyr Leu Val Val Met Leu Ile Ile Gly Ala Tyr Phe Thr Lys Arg Ala
20 25 30
Gly Gln Ser Thr Asp Ser Phe Phe Thr Ala Ser Gly Arg Leu Pro Ser
35 40 45
Trp Ala Ile Gly Phe Ser Ile Tyr Ala Thr Thr Leu Ser Ala Ile Thr
50 55 60
Phe Met Ser Thr Pro Glu Lys Ala Phe Leu Thr Asp Trp Ser Tyr Ile
65 70 75 80
Ala Gly Asn Ile Ala Ile Val Ala Ile Ile Pro Ala Leu Ile Ala Phe
85 90 95
Tyr Val Pro Phe Phe Lys Lys Leu Arg Val Thr Ser Ala Tyr Glu Tyr
100 105 110
Leu Glu Ala Arg Phe Gly Pro Ser Val Arg Val Leu Gly Ser Leu Leu
115 120 125
Phe Val Val Phe His Leu Gly Arg Ile Ala Ile Val Ile Tyr Leu Pro
130 135 140
Thr Leu Ala Ile Thr Ala Val Thr Asp Ile Asn Pro Tyr Leu Val Ala
145 150 155 160
Ser Leu Val Gly Ile Leu Cys Ile Leu Tyr Thr Phe Leu Gly Gly Phe
165 170 175
Glu Gly Val Val Trp Ser Asp Phe Ile Gln Gly Val Ile Leu Leu Gly
180 185 190
Gly Ala Leu Met Ile Ile Val Ile Gly Ala Met Glu Ile Lys Gly Gly
195 200 205
Phe Gly Thr Ile Leu His Asp Ala Leu Ala Glu Lys Lys Leu Leu Ser
210 215 220
Val Asp Asn Trp Lys Leu Asn Thr Thr Ala Ala Ala Leu Pro Ile Ile
225 230 235 240
Phe Leu Gly Asn Ile Phe Asn Asn Leu His Gln Tyr Thr Ala Ser Gln
245 250 255
Asp Val Val Gln Arg Tyr Gln Ala Ser Asp Ser Ile Asp Glu Thr Lys
260 265 270
Lys Ser Leu Trp Ile Asn Gly Leu Leu Ala Leu Ile Ser Ala Pro Ile
275 280 285
Phe Tyr Gly Met Gly Thr Met Met Tyr Ser Phe Tyr Glu His Glu Ala
290 295 300
Ala Leu Pro Gln Asp Phe Asn Thr Ser Ser Val Val Pro Phe Phe Ile
305 310 315 320
Leu Thr Gln Met Pro Pro Phe Val Gly Gly Leu Leu Ile Ala Ala Ile
325 330 335
Phe Ala Ala Ala Gln Ser Thr Ile Ser Ser Ser Leu Asn Ser Ile Ser
340 345 350
Ala Cys Ile Ser Glu Asp Ile Lys Asp Arg Phe Phe Ser Lys Gly Thr
355 360 365
Asp Lys Gly Asn Val Arg Phe Ala Arg Trp Thr Ile Ile Ile Ala Gly
370 375 380
Leu Leu Ser Tyr Gly Ile Ala Ile Tyr Leu Ile Ala Ala Asp Ser Asn
385 390 395 400
Asn Leu Trp Asp Leu Phe Leu Leu Val Thr Gly Leu Phe Gly Val Pro
405 410 415
Leu Ala Gly Ile Phe Ala Val Gly Ile Phe Thr Lys Arg Ala Asn Thr
420 425 430
Phe Gly Val Leu Val Gly Leu Phe Thr Gly Val Ile Val Ala Tyr Leu
435 440 445
Leu Lys Gly Ile Gly Gly Ala Asn Ser Pro Phe Tyr Val Ser Ile Ile
450 455 460
Ser Phe Phe Ile Ala Phe Leu Phe Gly Tyr Ile Val Ser Leu Phe Val
465 470 475 480
Pro Ala Lys Tyr Thr Lys Asp Ile Thr Gly Leu Thr Ile Tyr Asp Lys
485 490 495
Asp Lys Pro Ser Thr Tyr Ile Ser Lys Thr Arg Gln
500 505
<210> 14
<211> 509
<212> PRT
<213> 鲸鲸杆菌
<400> 14
Met Asn Trp His Trp Leu Asn Trp Val Val Leu Cys Leu Tyr Phe Leu
1 5 10 15
Gly Val Val Tyr Ile Gly Val Tyr Phe Ser Lys Lys Asn Asn Ser Ser
20 25 30
Glu Asp Tyr Phe Thr Ala Ser Gly Arg Ile Pro Ala Trp Val Thr Ala
35 40 45
Cys Ser Ile Tyr Ser Thr Ala Leu Ser Ser Ile Ser Phe Ile Ala Ile
50 55 60
Pro Ala Ser Val Tyr Lys His Gly Trp Ile Met Gly Met Ala Pro Leu
65 70 75 80
Gly Ile Ile Ile Met Ile Val Trp Ala Gly Tyr Ala Phe Val Pro Phe
85 90 95
Phe Arg Lys Val Arg Val Ile Thr Ala Tyr Glu Phe Leu Glu Lys Arg
100 105 110
Phe Asp Arg Ser Phe Arg Leu Val Gly Ser Leu Ser Phe Ile Leu Phe
115 120 125
His Val Ile Arg Ile Ala Ile Val Leu Tyr Leu Pro Thr Leu Ala Leu
130 135 140
Ile Ala Ala Leu Pro Gly Val Asn Pro Ile Leu Leu Thr Ala Ile Val
145 150 155 160
Gly Phe Leu Cys Val Val Tyr Thr Ser Met Gly Gly Ile Glu Ala Val
165 170 175
Val Trp Ser Asp Ala Ile Gln Thr Ile Val Leu Leu Phe Gly Ala Phe
180 185 190
Leu Ile Ile Ile Ile Gly Phe Met Ser Val Pro Ser Gly Val Ser Ser
195 200 205
Phe Asp Val Leu Glu Asn Ala Gly Lys Ile Phe Ala Pro Gly Thr Phe
210 215 220
Asp Phe Asn Leu Ala Gly Lys Thr Phe Trp Gly Ile Leu Ile Gly Gly
225 230 235 240
Phe Leu Asn Ser Ile Tyr Ser Tyr Val Gly Ser Gln Asp Ile Val Gln
245 250 255
Arg Tyr Asn Thr Thr Lys Asn Ile Lys Glu Ala Gln Lys Ser Leu Tyr
260 265 270
Met Asn Val Pro Leu Ala Leu Thr Ser Val Val Ile Phe Val Gly Met
275 280 285
Gly Ser Ala Leu Phe Leu Phe Phe Lys Phe His Thr Val Leu Pro Glu
290 295 300
His Ile Asp Gly Asn Ala Ile Leu Pro Tyr Phe Val Val His Asn Val
305 310 315 320
Pro Leu Gly Phe Ser Gly Leu Val Ile Ala Ala Ile Phe Ala Ala Ala
325 330 335
Gln Ser Thr Val Ser Ser Ser Leu Asn Ser Val Ala Thr Cys Ile Thr
340 345 350
Ser Asp Ile Val Lys Pro Met Met Lys Asn Leu Thr Asp Lys His Glu
355 360 365
Leu Lys Ile Ala Lys Tyr Cys Ser Trp Val Val Gly Ile Ile Ser Ser
370 375 380
Leu Leu Ser Leu Arg Phe Leu Ser Ala Gly Gln Gly Asp Met Phe Leu
385 390 395 400
Tyr Phe Gln Ala Ile Thr Gly Leu Leu Gly Gly Pro Ile Ala Gly Leu
405 410 415
Phe Leu Val Gly Ile Phe Thr Lys Arg Val Asn Gly Lys Ala Ala Trp
420 425 430
Ile Gly Phe Ile Cys Ser Val Leu Val Ala Ile Tyr Ile Gly Asn Pro
435 440 445
Ala Gly Leu Leu Thr Lys Phe Ile Pro Gly Tyr Glu Pro Pro His Ile
450 455 460
Phe Glu Ile Leu Ile Ser Leu Val Ile Ile Gly Ser Cys Val Val Pro
465 470 475 480
Ala Tyr Ile Ala Ser Phe Phe Thr Gly Arg Pro Asp Glu Asp Lys Val
485 490 495
Tyr His Leu Thr Tyr Glu Ser Thr Lys Leu Ile Asn Glu
500 505
<210> 15
<211> 509
<212> PRT
<213> Staphylococcus argensis
<400> 15
Met His Gln Val Gly Phe Gly Leu Trp Asn Trp Val Ala Val Ile Val
1 5 10 15
Tyr Leu Val Ala Met Leu Leu Ile Gly Ser Tyr Phe Thr Lys Arg Ala
20 25 30
Ser Lys Asp Thr Asp Ser Phe Phe Thr Ala Gly Gly Lys Leu Pro Ser
35 40 45
Trp Val Val Gly Phe Ser Ile Tyr Ala Thr Thr Leu Ser Ala Ile Thr
50 55 60
Phe Met Ser Thr Pro Glu Lys Ala Phe Leu Thr Asp Trp Ala Tyr Val
65 70 75 80
Ala Gly Thr Ile Thr Ile Ile Ala Ile Val Pro Ile Leu Asn Tyr Phe
85 90 95
Tyr Val Pro Phe Phe Lys Lys Leu Arg Val Thr Ser Ala Tyr Glu Tyr
100 105 110
Leu Glu Ala Arg Phe Gly Pro Ser Ile Arg Leu Ile Gly Ser Leu Leu
115 120 125
Phe Val Leu Phe His Leu Gly Arg Val Ala Ile Val Ile Tyr Leu Pro
130 135 140
Thr Leu Ala Ile Thr Ser Val Ser Asp Met Asn Pro Tyr Ile Val Ala
145 150 155 160
Thr Leu Val Gly Val Leu Cys Ile Leu Tyr Thr Phe Leu Gly Gly Phe
165 170 175
Glu Gly Val Val Trp Ser Asp Phe Ile Gln Gly Val Ile Leu Leu Gly
180 185 190
Gly Ala Phe Phe Ile Ile Leu Leu Gly Ala Leu Gln Ile His Gly Asn
195 200 205
Phe Gly Thr Ile Trp His Asp Ala Met Glu His Lys Lys Ile Leu Ser
210 215 220
Ala Asp Asn Phe Val Ile Asn Ser Ala Ser Ala Ala Phe Pro Ile Ile
225 230 235 240
Phe Ile Gly Asn Ile Phe Asn Asn Leu His Gln Tyr Thr Ala Ser Gln
245 250 255
Asp Val Val Gln Arg Tyr Gln Ala Ser Glu Ser Met Lys Glu Thr Arg
260 265 270
Lys Ser Leu Trp Thr Asn Gly Leu Leu Ala Ile Leu Ser Ala Pro Leu
275 280 285
Phe Tyr Gly Met Gly Thr Met Leu Tyr Ser Phe Tyr Gln His Ala Gly
290 295 300
Thr Leu Pro Lys Asp Phe Asn Thr Ser Ser Val Val Pro Tyr Phe Ile
305 310 315 320
Leu Thr Gln Met Pro Pro Phe Val Gly Gly Leu Leu Val Ala Ala Ile
325 330 335
Phe Ala Ala Ala Gln Ser Thr Ile Ser Ser Ser Leu Asn Ser Ile Ser
340 345 350
Ala Cys Ile Ser Val Asp Ile Lys His Arg Phe Phe Gly Lys Gly Lys
355 360 365
Glu Lys Asp Glu Val Lys Phe Ala Arg Leu Met Ile Ile Leu Ala Gly
370 375 380
Leu Phe Gly Tyr Gly Met Ser Met Tyr Leu Ile Phe Ala Lys Ser Asn
385 390 395 400
Asn Leu Trp Asp Leu Phe Leu Leu Ile Thr Gly Leu Phe Gly Val Pro
405 410 415
Leu Ala Gly Ile Phe Ala Val Gly Ile Phe Thr Lys Arg Thr Asn Thr
420 425 430
Phe Gly Val Ile Val Gly Leu Ile Ala Gly Ile Leu Val Ala Tyr Leu
435 440 445
Leu Asn Asp Lys Ser Asn Pro Ser Ala Pro Phe Tyr Val Ser Ile Met
450 455 460
Ser Phe Thr Ile Ala Phe Ile Ile Ser Tyr Val Val Ser Leu Phe Thr
465 470 475 480
Pro Val Lys Thr Lys Asp Ile Thr Gly Leu Thr Ile Tyr Asp Lys Asp
485 490 495
Lys Pro Ser Thr Tyr Ile Ser Lys Val Lys Thr Lys Gly
500 505
<210> 16
<211> 506
<212> PRT
<213> 施氏葡萄球菌
<400> 16
Met His Thr Ile Gly Phe Gly Phe Trp Asn Trp Val Ala Leu Leu Cys
1 5 10 15
Tyr Leu Leu Leu Met Leu Gly Ile Gly Ala Phe Phe Thr Lys Arg Ala
20 25 30
Gly Lys Asp Thr Asn Ser Phe Phe Thr Ala Ser Gly Arg Leu Pro Ser
35 40 45
Trp Ala Val Gly Phe Ser Ile Tyr Ala Thr Thr Leu Ser Ala Ile Thr
50 55 60
Phe Met Ser Thr Pro Glu Lys Ser Tyr Leu Thr Asp Trp Ser Tyr Ile
65 70 75 80
Ala Gly Asn Val Ala Ile Val Ala Ile Ile Pro Leu Leu Ile Tyr Phe
85 90 95
Tyr Ile Pro Phe Phe Lys Lys Leu Lys Ile Thr Ser Ala Tyr Glu Tyr
100 105 110
Leu Glu Ala Arg Phe Asn Pro Ala Val Arg Val Leu Gly Ser Leu Leu
115 120 125
Phe Val Leu Phe His Leu Gly Arg Val Ala Ile Val Ile Tyr Leu Pro
130 135 140
Thr Leu Ala Ile Thr Ala Val Ser Asp Ile Asn Pro Tyr Leu Val Ala
145 150 155 160
Ser Leu Val Gly Val Leu Cys Ile Val Tyr Thr Phe Leu Gly Gly Phe
165 170 175
Glu Gly Val Val Trp Ser Asp Phe Ile Gln Gly Val Ile Leu Leu Gly
180 185 190
Gly Ala Leu Val Ile Ile Ile Ile Gly Ile Val His Ile Asp Gly Gly
195 200 205
Trp Gly Thr Val Val Asn Glu Ala Val Asp Lys Gln Lys Leu Ile Ser
210 215 220
Ala Asp Asn Trp Lys Phe Thr Ala Ala Ser Ala Ala Ile Pro Ile Ile
225 230 235 240
Phe Leu Gly Ser Ile Phe Asn Asn Leu Gln Gln Tyr Thr Ala Ser Gln
245 250 255
Asp Val Val Gln Arg Tyr Gln Ala Ser Glu Ser Leu Lys Glu Thr Ser
260 265 270
His Ser Leu Trp Thr Asn Gly Leu Leu Ala Ile Ile Ser Ala Pro Leu
275 280 285
Phe Tyr Gly Met Gly Thr Val Leu Phe Val Phe Tyr Thr His His Thr
290 295 300
Thr Leu Gln Lys Asp Phe Asn Thr Ser Ser Ile Val Pro Tyr Phe Ile
305 310 315 320
Leu Thr Glu Met Pro Pro Phe Val Ala Gly Leu Met Ile Ala Ala Ile
325 330 335
Phe Ala Ala Ala Gln Ser Thr Ile Ser Ser Ser Leu Asn Ser Met Ala
340 345 350
Ala Cys Leu Ser Val Asp Ile Lys Gln Arg Phe Phe Gly Lys Lys Ser
355 360 365
Glu Glu Ala Glu Val Arg Phe Ala Arg Leu Ala Thr Ile Val Val Gly
370 375 380
Leu Leu Gly Met Leu Ile Ser Leu Tyr Leu Ile Ala Ala Asn Ser Asn
385 390 395 400
Asp Val Trp Asp Leu Phe Leu Leu Ile Thr Gly Leu Phe Gly Val Pro
405 410 415
Ile Ala Gly Ile Phe Ala Val Gly Ile Phe Thr Lys Arg Thr His Gly
420 425 430
Val Gly Val Ile Ile Gly Ile Ile Ile Ala Val Ile Val Ser Tyr Phe
435 440 445
Leu Gln Gly Val Gly Gly Ala Gly Ser Pro Phe Tyr Val Ser Ile Ile
450 455 460
Ala Phe Ile Thr Ala Phe Val Thr Ala Tyr Ile Ala Ser Leu Ile Ile
465 470 475 480
Pro Ala Pro Asn Lys Asp Ile Ser Gly Leu Thr Ile Phe Asp Lys Asn
485 490 495
Gly Ala Ile Thr Tyr Glu Arg Lys Val Lys
500 505
<210> 17
<211> 507
<212> PRT
<213> 耳炎差异球菌ATCC 51267
<400> 17
Met Ser Gly Gln Gly Phe Thr Trp Ile Asp Leu Val Ile Leu Ile Val
1 5 10 15
Tyr Leu Ile Phe Val Leu Phe Phe Gly Asn Tyr Phe Ala Lys Lys Glu
20 25 30
Met Ile Gly Lys Glu Phe Phe Lys Ser Asp Gly Thr Val Pro Trp Tyr
35 40 45
Val Thr Ser Val Ser Ile Phe Ala Thr Leu Leu Ser Pro Ile Ser Phe
50 55 60
Leu Ser Leu Pro Gly Asn Ser Phe Gly Gly Thr Trp Ile Leu Trp Phe
65 70 75 80
Ala Gln Leu Gly Met Ile Ile Ala Ile Pro Ile Ala Ile Ala Phe Phe
85 90 95
Leu Pro Val Phe Ala Lys Leu Asp Ile Asp Thr Ala Tyr Asp Tyr Leu
100 105 110
Glu Arg Arg Phe Asp Asn Arg Gly Leu Arg Val Val Ser Ala Ile Ile
115 120 125
Phe Ile Ile Tyr Gln Ile Gly Arg Met Ser Ile Ile Ile Tyr Leu Pro
130 135 140
Ser Ile Thr Leu Ala Glu Leu Thr Gly Leu Asn Val Asn Ile Leu Ile
145 150 155 160
Ile Ala Met Gly Ala Ile Ala Ile Phe Tyr Ser Tyr Thr Gly Gly Leu
165 170 175
Lys Ser Val Leu Phe Ser Asp Phe Val Gln Gly Ile Ile Val Leu Val
180 185 190
Gly Val Thr Leu Ser Leu Ile Ile Leu Ile Asn Gly Ile Asp Gly Gly
195 200 205
Val Gly Thr Ile Ala Glu Thr Leu Ala Asp Gly Lys Phe Ile Ala Pro
210 215 220
Asp Glu Gln Trp Phe Ser Pro Thr Ile Phe Glu Asp Thr Val Phe Leu
225 230 235 240
Val Phe Val Gly Ala Gly Met Asn Thr Leu Thr Gln Tyr Ile Ser Ser
245 250 255
Gln Asp Ile Val Gln Arg Phe Thr Thr Thr Thr Asn Thr Lys Asp Leu
260 265 270
Thr Lys Met Met Leu Thr Asn Gly Val Leu Ser Leu Phe Ile Ala Thr
275 280 285
Ile Leu Phe Leu Ile Gly Thr Gly Leu Phe Ile Phe Tyr Gly Gln Ala
290 295 300
Gly Ile Ala Ser Gly Met Asp Gln Asp Leu Ala Tyr Gly Tyr Phe Ile
305 310 315 320
Ala Tyr Gln Leu Pro Ile Gly Val Thr Gly Val Leu Leu Ala Ala Ile
325 330 335
Phe Ala Ala Ser Gln Ser Thr Leu Ser Thr Gly Leu Asn Ser Val Ala
340 345 350
Thr Ser Val Ala Leu Asp Ile Val Glu Val Phe Asp Thr Lys Gly Lys
355 360 365
Tyr Asp Tyr Lys Ser Lys Thr Lys Ile Ala Arg Gly Val Thr Ile Val
370 375 380
Val Gly Leu Phe Ala Ile Val Val Ser Met Ile Met Val Gln Ser Asn
385 390 395 400
Ile Val Ser Ala Tyr Glu Trp Phe Asn Gly Phe Val Gly Leu Val Leu
405 410 415
Gly Val Leu Gly Gly Val Phe Ala Leu Gly Ile Phe Thr Lys Arg Gly
420 425 430
Asn Ala Val Gly Ala Tyr Ile Gly Phe Leu Val Ser Ala Val Val Met
435 440 445
Ile Ile Ile Glu Phe Val Ile Pro Glu Glu Ile Asn Ile Ser Ile Trp
450 455 460
Ala Asn Ser Leu Val Ser Ile Ile Val Ala Phe Val Ala Gly Tyr Leu
465 470 475 480
Gly Ser Val Ile Tyr Ser Ala Ile Ser Ser Lys Asp Ser Lys Arg Glu
485 490 495
Asp Tyr Ser Ser Ile Leu Asp Phe Asn Lys Asn
500 505
<210> 18
<211> 507
<212> PRT
<213> 蜥蜴纤细芽孢杆菌
<400> 18
Met Asp Lys Val Gly Leu Gly Ala Ile Asn Trp Ile Val Leu Ile Val
1 5 10 15
Tyr Leu Val Ser Met Leu Gly Val Gly Val Tyr Phe Thr Lys Arg Ser
20 25 30
Ser Lys Asn Thr Asp Ala Phe Phe Thr Ala Ser Gly Lys Ile Pro Ala
35 40 45
Trp Ala Ala Gly Phe Ser Ile Tyr Ala Thr Thr Leu Ser Ala Ile Thr
50 55 60
Phe Met Ser Thr Pro Glu Gln Ala Phe Leu Ser Asp Trp Ser Tyr Ala
65 70 75 80
Ala Gly Asn Leu Ala Ile Phe Ala Ile Ile Pro Ile Leu Ile Tyr Phe
85 90 95
Tyr Ile Pro Phe Phe Arg Lys Leu Asn Val Thr Thr Ala Tyr Glu Tyr
100 105 110
Leu Glu Glu Arg Phe Gly Pro Ser Leu Arg Val Val Gly Ser Leu Leu
115 120 125
Phe Val Leu Tyr His Ile Gly Arg Val Ala Ile Val Ile Tyr Leu Pro
130 135 140
Thr Leu Ala Ile Thr Ser Val Ser Ser Ile Asn Pro Ile Ile Ile Ala
145 150 155 160
Ser Val Val Gly Gly Leu Cys Ile Ile Tyr Thr Phe Leu Gly Gly Met
165 170 175
Glu Gly Val Ile Trp Ser Asp Val Ile Gln Gly Ile Leu Leu Ile Gly
180 185 190
Gly Ala Ile Leu Val Leu Val Leu Gly Ile Leu Thr Ile Asn Gly Gly
195 200 205
Trp Ser Thr Val Ile Asn Asp Ala Leu Ala Asn Asp Lys Leu Ile Thr
210 215 220
Ala Asp Asn Phe Lys Leu Gly Thr Ala Ala Ala Ala Ile Pro Ile Ile
225 230 235 240
Phe Ile Gly Ser Ile Phe Asn Asn Leu His Gln Tyr Thr Ala Ser Gln
245 250 255
Asp Val Val Gln Arg Tyr Gln Thr Thr Lys Ser Ile Lys Glu Thr Asn
260 265 270
Arg Ser Leu Trp Thr Asn Gly Ile Leu Ala Leu Ile Thr Ile Pro Ile
275 280 285
Phe Tyr Gly Met Gly Thr Val Leu Phe Ser Tyr Tyr Ser Asn Met Glu
290 295 300
Thr Leu Pro Glu Gly Phe Asn Thr Ser Ala Ile Val Pro Tyr Phe Ile
305 310 315 320
Val Thr Thr Leu Pro Val Gly Val Ala Gly Leu Leu Ile Ala Ala Ile
325 330 335
Phe Ala Ala Cys Gln Ser Thr Ile Ser Ser Ser Leu Asn Ser Ile Ser
340 345 350
Ala Cys Ile Thr Val Asp Phe Lys Gln Arg Phe Phe Asp Lys Ala Phe
355 360 365
Arg Leu Asn Asp Val Ile Ile Ala Arg Leu Val Ile Ile Val Thr Gly
370 375 380
Thr Leu Gly Met Ile Ala Ala Leu Tyr Leu Val Ser Thr Asn Gln Ala
385 390 395 400
Glu Thr Trp Asn Leu Phe Leu Ala Met Thr Gly Leu Phe Gly Val Pro
405 410 415
Ile Ala Gly Ile Phe Ala Leu Gly Ile Phe Thr Lys Arg Ala Asn Ala
420 425 430
Pro Gly Val Leu Ile Gly Leu Ile Leu Ser Ala Ile Thr Ser Tyr Phe
435 440 445
Ile Gln Gln Thr Ser Phe Ser Pro Phe Ala Val Ser Val Met Ala Phe
450 455 460
Phe Ser Ser Tyr Ile Phe Gly Tyr Val Ala Ser Phe Phe Phe Pro Ala
465 470 475 480
Tyr Asn Lys Asn Thr Thr Gly Leu Thr Ile Tyr Thr Lys Asn Asp Asp
485 490 495
Phe Ile Lys Ser Asp Val Lys Gln Asn Ile Ser
500 505
<210> 19
<211> 502
<212> PRT
<213> 费尔斯莫尔德乳杆菌
<400> 19
Met Thr Lys Val Gly Phe Gly Thr Leu Asn Trp Val Val Leu Leu Val
1 5 10 15
Tyr Leu Val Ala Met Leu Gly Val Gly Val Tyr Phe Thr Lys Lys Ala
20 25 30
Ser Lys Asn Thr Asp Ala Phe Phe Lys Ala Lys Ser Ser Ile Pro Ala
35 40 45
Trp Ala Ala Gly Phe Ser Ile Tyr Ala Thr Thr Leu Ser Ala Ile Thr
50 55 60
Phe Met Ser Thr Pro Glu Gln Ser Phe Leu Asn Asp Trp Ala Tyr Ser
65 70 75 80
Val Gly Asn Leu Ser Ile Phe Leu Ile Ile Pro Ile Leu Ile Lys Tyr
85 90 95
Tyr Val Pro Phe Phe Arg Lys Leu Lys Val Thr Thr Ala Tyr Glu Tyr
100 105 110
Leu Glu Glu Arg Phe Ser Pro Val Met Arg Val Ile Gly Ser Leu Leu
115 120 125
Phe Ile Leu Tyr His Ile Gly Arg Val Ala Ile Val Ile Tyr Leu Pro
130 135 140
Ile Ile Ala Ile Thr Ser Val Ser Asn Ile Asn Pro Ile Leu Ile Ala
145 150 155 160
Cys Val Val Gly Gly Leu Cys Ile Ile Tyr Thr Phe Leu Gly Gly Ile
165 170 175
Glu Gly Val Ile Trp Ser Asp Val Ile Gln Gly Met Leu Leu Leu Gly
180 185 190
Gly Ala Leu Leu Ile Ile Ile Val Gly Ile Val Ser Ile Lys Gly Gly
195 200 205
Phe Gly Thr Val Val Ser Asp Ala Val Ser Gly Asp Lys Phe Phe Ser
210 215 220
Val Lys Asp Trp Asn Pro Gly Asp Leu Thr Lys Phe Ile Pro Leu Ile
225 230 235 240
Phe Ala Gly Gln Phe Phe Asn Thr Leu Tyr Gln Tyr Thr Gly Ser Gln
245 250 255
Asp Val Val Gln Arg Tyr Gln Thr Thr Ala Thr Gln Lys Glu Thr Asn
260 265 270
Lys Ser Leu Trp Thr Asn Gly Phe Leu Ala Leu Ile Thr Ile Pro Leu
275 280 285
Phe Phe Gly Met Gly Thr Val Leu Phe Ser Phe Tyr Lys Asn Val Gly
290 295 300
Thr Leu Pro His Gly Phe Asn Thr Ser Ala Ile Val Pro Tyr Phe Val
305 310 315 320
Val Thr Arg Ile Pro Ala Gly Ile Ala Gly Leu Val Ile Ala Ala Ile
325 330 335
Phe Ala Ala Ala Gln Ser Thr Ile Ala Ser Ser Leu Asn Ala Ile Ser
340 345 350
Ser Cys Val Val Thr Asp Phe Lys Gln Arg Phe Phe Asn His Arg Leu
355 360 365
Lys Ser Ile Ser Asp Val Thr Leu Ala Arg Ile Ile Ile Ile Val Thr
370 375 380
Gly Leu Phe Gly Leu Gly Met Ser Ile Tyr Leu Leu Ile Gly Asn Ala
385 390 395 400
Ser Lys Thr Trp Asp Leu Phe Leu Thr Val Thr Gly Leu Phe Gly Val
405 410 415
Pro Ile Ala Gly Ile Phe Ala Ala Gly Ile Phe Thr Lys Arg Ser Asn
420 425 430
Thr Phe Gly Ala Val Leu Gly Leu Ile Leu Ser Val Ile Ala Thr Val
435 440 445
Phe Val Gln Gln Asn Ser Asp Ser Ser Leu Ile Val Ala Thr Val Ala
450 455 460
Phe Ile Thr Ser Phe Ile Phe Thr Tyr Leu Ile Ser Phe Phe Ala Pro
465 470 475 480
Lys Lys Tyr Val His Asn Val Val Gly Leu Thr Ala Ser Thr Val Lys
485 490 495
Glu Thr Tyr Val Lys Ser
500
<210> 20
<211> 504
<212> PRT
<213> 乳杆菌属种LL6
<400> 20
Met Thr Lys Thr Gly Phe Gly Met Trp Asn Trp Ile Val Leu Cys Ala
1 5 10 15
Tyr Leu Leu Ala Met Leu Gly Val Gly Ala Tyr Phe Thr Lys Arg Ala
20 25 30
Ser Lys Ser Thr Asp Ser Phe Phe Lys Ala Asp Gly Arg Ile Pro Ala
35 40 45
Trp Ala Ala Gly Phe Ser Ile Trp Ala Thr Thr Leu Ser Ala Ile Thr
50 55 60
Phe Met Ser Thr Pro Glu Gln Ser Phe Leu Thr Asp Trp Gly Tyr Ala
65 70 75 80
Ile Gly Ser Leu Thr Ile Phe Val Ile Val Pro Ile Leu Ile Ala Tyr
85 90 95
Tyr Val Pro Phe Phe Arg Lys Leu Lys Val Thr Thr Ala Tyr Glu Tyr
100 105 110
Leu Glu Lys Arg Phe Gly Pro Val Met Arg Ala Leu Gly Ser Gly Leu
115 120 125
Phe Met Leu Tyr His Ile Gly Arg Val Ala Ile Val Ile Tyr Leu Pro
130 135 140
Ile Leu Ala Ile Thr Ser Val Ser Asn Ile Asn Pro Ile Leu Ile Ala
145 150 155 160
Val Gly Val Gly Gly Leu Cys Ile Ile Tyr Ala Phe Leu Gly Gly Ile
165 170 175
Glu Gly Val Ile Trp Thr Asp Val Ile Gln Gly Phe Leu Leu Leu Gly
180 185 190
Ser Ala Leu Leu Ile Cys Ile Met Ala Ile Ile His Thr Gly Gly Leu
195 200 205
Gly His Val Ala Asp Ile Ala Val Ala Asn His Lys Phe Phe Ser Ala
210 215 220
Ala Asp Trp Asn Pro Ser Asp Leu Ala Lys Phe Ile Pro Leu Ile Phe
225 230 235 240
Ala Gly Gln Phe Phe Asn Ser Met Tyr Gln Tyr Thr Ala Ser Gln Asp
245 250 255
Val Val Gln Arg Tyr Gln Thr Thr Pro Ser Leu Lys Ala Thr Ala Lys
260 265 270
Ser Leu Trp Thr Asn Gly Val Leu Ala Leu Ile Thr Ile Pro Leu Phe
275 280 285
Phe Gly Met Gly Thr Leu Leu Tyr Cys Phe Tyr His Thr Asn Gly Thr
290 295 300
Leu Pro Lys Gly Phe Asn Thr Ser Ala Val Val Pro Tyr Phe Val Ile
305 310 315 320
Lys Glu Ile Pro Ala Gly Leu Ala Gly Leu Ile Ile Ala Gly Ile Phe
325 330 335
Ala Ala Ala Gln Ser Thr Ile Ala Ser Ser Leu Asn Ala Ile Ser Ser
340 345 350
Cys Ala Ile Thr Asp Phe Lys Gln Arg Phe Phe Asn Asn Lys Phe Lys
355 360 365
Asn Ile Ser Asp Val Ala Leu Ala Arg Trp Ile Ile Ile Ile Ala Gly
370 375 380
Val Ile Ser Leu Ser Ile Ala Ile Tyr Leu Leu Met Gly Asp Ala Ser
385 390 395 400
Gln Thr Trp Asn Leu Phe Leu Thr Val Thr Gly Leu Phe Gly Val Pro
405 410 415
Ile Ala Gly Ile Phe Ala Ala Gly Ile Phe Thr Gln Ser Ala Asn Arg
420 425 430
Phe Ser Val Val Val Ala Val Ile Leu Ser Ala Ala Ile Thr Tyr Trp
435 440 445
Ile Gln Thr Leu Asn Val Ser Thr Phe Val Thr Pro Cys Val Ser Phe
450 455 460
Val Leu Ser Tyr Leu Ile Ser Trp Ile Val Gly Leu Met Thr Pro Gln
465 470 475 480
Tyr Asn His Asp Ile Thr Gly Leu Thr Ala Arg Thr Ile Lys Asp Lys
485 490 495
Val Ser Ala Gln Glu Glu Leu Glu
500
<210> 21
<211> 503
<212> PRT
<213> Agrilactobacillus composti
<400> 21
Met Thr Lys Ala Gly Phe Gly Met Trp Asn Trp Ile Val Leu Ile Ile
1 5 10 15
Tyr Leu Leu Ala Met Leu Gly Val Gly Val Tyr Phe Thr Lys Lys Ala
20 25 30
Ser Lys Asn Thr Asp Ala Phe Phe Lys Ala Glu Gly Lys Ile Pro Ala
35 40 45
Trp Ala Ala Gly Phe Ser Ile Tyr Ala Thr Thr Leu Ser Ala Ile Thr
50 55 60
Phe Met Ser Thr Pro Glu Gln Ala Phe Leu Asn Asp Trp Ala Tyr Ala
65 70 75 80
Ile Gly Asn Phe Ser Ile Leu Leu Ile Ile Pro Leu Leu Val Lys Phe
85 90 95
Tyr Val Pro Phe Phe Arg Lys Leu Asn Val Thr Thr Ala Tyr Glu Tyr
100 105 110
Leu Glu Glu Arg Phe Ser Pro Val Met Arg Ala Ile Ser Ser Leu Leu
115 120 125
Phe Met Leu Tyr His Ile Gly Arg Ile Ala Ile Val Ile Tyr Leu Pro
130 135 140
Ile Ile Ala Ile Thr Ser Val Ser Asn Ile Asn Pro Ile Val Ile Ala
145 150 155 160
Leu Ala Ile Gly Pro Leu Cys Ile Ile Tyr Thr Phe Leu Gly Gly Ile
165 170 175
Glu Gly Val Ile Trp Ser Asp Val Ile Gln Gly Phe Leu Leu Leu Gly
180 185 190
Gly Ala Leu Leu Val Cys Ile Leu Gly Val Thr Tyr Ile Lys Gly Gly
195 200 205
Phe Ser Thr Val Phe Gln Asp Ile Ser Thr His Gln Lys Val Leu Ser
210 215 220
Gly Ala Asp Phe Asn Val His Asp Leu Ser Lys Phe Val Pro Leu Ile
225 230 235 240
Leu Ala Gly Gln Ile Phe Asn Ser Leu Tyr Gln Tyr Thr Gly Ser Gln
245 250 255
Asp Val Val Gln Arg Tyr Gln Thr Thr Gly Ser Met Lys Glu Ala Lys
260 265 270
Lys Ser Leu Tyr Thr Asn Gly Leu Leu Ala Leu Ile Thr Ile Pro Leu
275 280 285
Phe Phe Gly Met Gly Thr Ile Leu Phe Ser Phe Tyr Gln His Ala Gly
290 295 300
Ser Leu Pro Lys Gly Phe Asn Thr Ser Ala Val Val Pro Tyr Phe Ile
305 310 315 320
Ile Thr Glu Met Pro Ala Gly Val Ala Gly Leu Val Ile Ala Gly Ile
325 330 335
Phe Ala Ala Ala Gln Ser Thr Ile Ala Ser Ser Leu Asn Ala Ile Ser
340 345 350
Ser Cys Ala Val Thr Asp Phe Lys Gln Arg Phe Phe Asp Asp Lys Leu
355 360 365
Lys Gly Leu Lys Asp Val Thr Leu Ala Arg Ile Ile Ile Ile Ile Ala
370 375 380
Gly Val Leu Ser Leu Ser Val Ala Ile Tyr Leu Leu Met Gly Asn Ala
385 390 395 400
Ser Gln Thr Trp Asn Leu Phe Leu Thr Val Thr Gly Ile Phe Gly Val
405 410 415
Pro Ile Ala Gly Ile Phe Ala Val Gly Ile Phe Thr Lys Arg Ala Asn
420 425 430
Thr Thr Gly Val Leu Ile Gly Leu Val Cys Ser Val Ala Leu Ser Phe
435 440 445
Tyr Val Gln Ser Leu Asn Ile Ser Ser Leu Leu Val Ala Cys Ser Ala
450 455 460
Phe Ile Ser Ser Phe Ile Leu Ser Tyr Gly Ile Ser Leu Leu Val Pro
465 470 475 480
Thr Gln Leu Lys Asn Ile Thr Gly Leu Thr Val Ser Thr Ile Lys Glu
485 490 495
Thr Tyr Val Arg Glu Gly Lys
500
<210> 22
<211> 502
<212> PRT
<213> 卷曲乳杆菌
<400> 22
Met Ser Lys Val Gly Phe Gly Phe Trp Asn Trp Val Val Leu Ile Ala
1 5 10 15
Tyr Leu Leu Val Met Leu Gly Ile Gly Ala Tyr Phe Thr Lys Arg Ala
20 25 30
Ser Glu Ser Thr Asp Ser Phe Phe Lys Ala Asn Gly Lys Ile Pro Ala
35 40 45
Trp Ala Ala Gly Phe Ser Ile Trp Ala Thr Thr Leu Ser Ala Ile Thr
50 55 60
Phe Met Ser Thr Pro Glu Gln Ala Phe Leu Asn Asp Trp Gly Tyr Thr
65 70 75 80
Phe Gly Thr Phe Gly Ile Phe Leu Leu Ile Pro Val Leu Ile Lys Trp
85 90 95
Tyr Val Pro Phe Phe Arg Lys Leu Lys Val Thr Thr Ala Tyr Glu Tyr
100 105 110
Leu Glu His Arg Phe Gly Pro Val Met Arg Ala Leu Gly Ser Ala Leu
115 120 125
Phe Met Leu Tyr His Ile Gly Arg Val Ala Ile Val Ile Tyr Leu Pro
130 135 140
Ile Leu Ala Ile Thr Ser Val Ser Asn Ile Asn Pro Val Leu Val Ala
145 150 155 160
Val Leu Val Gly Leu Leu Cys Ile Ile Tyr Ala Phe Leu Gly Gly Ile
165 170 175
Glu Gly Val Ile Trp Thr Asp Val Ile Gln Gly Phe Leu Leu Leu Gly
180 185 190
Ser Ala Ile Leu Ile Cys Gly Leu Ala Ile Phe Tyr Thr Gly Gly Phe
195 200 205
Gly Asn Val Phe His Ile Ala Leu Gly Ala His Lys Phe Tyr Ser Ala
210 215 220
Ala Asp Trp Asn Pro Asn Asp Leu Ala Lys Trp Ile Pro Leu Ile Phe
225 230 235 240
Ile Gly Ser Trp Phe Asn Asn Met Tyr Gln Tyr Thr Ala Ser Gln Asp
245 250 255
Val Val Gln Arg Tyr Gln Thr Thr Pro Ser Met Lys Ala Thr Ala Lys
260 265 270
Ser Leu Trp Thr Asn Gly Trp Leu Ala Leu Ser Thr Ile Pro Leu Phe
275 280 285
Phe Gly Met Gly Thr Leu Leu Tyr Cys Phe Tyr His Ser Ala Gly Ser
290 295 300
Leu Pro His Gly Phe Asn Thr Ser Ala Leu Val Pro Tyr Phe Val Ile
305 310 315 320
Thr Lys Ile Pro Ala Gly Leu Ala Gly Leu Ile Ile Ala Gly Ile Phe
325 330 335
Ala Ala Ala Gln Ser Thr Ile Ala Ser Ser Leu Asn Ala Ile Ser Ser
340 345 350
Cys Phe Val Thr Asp Phe Lys Gln Arg Phe Phe Asp Lys Lys Trp Lys
355 360 365
Ile Asn Asp Val Lys Leu Ala Arg Ile Val Ile Leu Val Ala Gly Ala
370 375 380
Ile Ser Leu Ser Ile Ala Ile Tyr Leu Leu Leu Gly Asn Ala Ser Gln
385 390 395 400
Thr Trp Asn Leu Phe Leu Thr Val Thr Gly Leu Phe Gly Val Pro Val
405 410 415
Ala Gly Ile Phe Ala Ala Gly Ile Phe Thr Lys Ser Ala Asn Arg Phe
420 425 430
Ser Val Ile Ile Gly Val Ile Ala Ser Ala Ala Leu Thr Tyr Trp Met
435 440 445
Gln Leu Gly Ser Pro Ser Pro Phe Leu Thr Ser Thr Val Ser Phe Val
450 455 460
Ser Ser Phe Leu Val Ala Trp Leu Val Gly Leu Ile Thr Pro Lys Phe
465 470 475 480
Gly His Asp Val Thr Gly Leu Thr Val Lys Thr Ile Asn Glu Lys Val
485 490 495
Asp Thr Ser Lys Asn Lys
500
<210> 23
<211> 502
<212> PRT
<213> 巴氏葡萄球菌
<400> 23
Met Asn Glu Val Gly Phe Gly Thr Gly Asn Trp Ile Ala Leu Ile Ile
1 5 10 15
Tyr Leu Leu Ala Thr Leu Leu Val Gly Val Tyr Phe Thr Lys Arg Ala
20 25 30
Gly Gln Asp Thr Glu Ser Phe Phe Lys Ala Lys Gly Arg Ile Pro Ala
35 40 45
Trp Ala Val Gly Phe Ser Ile Tyr Ala Thr Thr Leu Ser Ala Ile Thr
50 55 60
Tyr Met Gly Thr Pro Glu Arg Ala Phe Asn Thr Asp Trp Ser Tyr Ala
65 70 75 80
Ala Gly Asn Ile Ala Ile Ile Ala Ile Ile Pro Leu Leu Ile Tyr Phe
85 90 95
Tyr Ile Pro Phe Phe Arg Lys Leu Asp Val Thr Thr Ala Tyr Glu Tyr
100 105 110
Leu Glu Ala Arg Phe Gly Ile Val Leu Arg Val Ile Gly Ser Leu Ala
115 120 125
Phe Thr Leu Phe His Ile Gly Arg Val Ala Ile Val Ile Tyr Leu Pro
130 135 140
Thr Leu Ala Ile Thr Ser Val Ser Asp Ile Asn Pro Tyr Leu Ile Ala
145 150 155 160
Ala Leu Val Gly Leu Leu Cys Met Val Tyr Thr Phe Leu Gly Gly Ile
165 170 175
Glu Gly Val Ile Trp Ser Asp Val Ile Gln Gly Ile Ile Leu Ile Gly
180 185 190
Gly Ala Val Ala Val Ile Phe Leu Gly Ala Phe Gln Ile Asp Gly Asn
195 200 205
Phe Ala Thr Val Ala Gln Glu Ala Met Gln Asp Lys Lys Leu Ile Ser
210 215 220
Val Asp Asn Trp Lys Phe Gly Thr Ala Ala Ala Ala Ile Pro Ile Ile
225 230 235 240
Phe Ile Gly Ser Ile Phe Asn Asn Leu His Gln Tyr Thr Ala Ser Gln
245 250 255
Asp Ile Val Gln Arg Tyr Gln Thr Thr Gly Ser Val Ser Ser Thr Asn
260 265 270
Lys Ser Leu Trp Thr Asn Gly Ile Leu Ala Phe Ile Thr Ile Pro Ile
275 280 285
Phe Tyr Gly Met Gly Thr Val Leu Tyr Ser Phe Tyr Asn Asn Val Ser
290 295 300
Thr Leu Pro Glu Gly Phe Asn Thr Ser Ala Ile Val Pro Tyr Phe Ile
305 310 315 320
Leu Thr Gln Ile Pro Pro Phe Val Gly Gly Leu Leu Ile Ala Ala Ile
325 330 335
Phe Ala Ala Ala Gln Ser Thr Ile Ser Ser Ser Leu Asn Ser Ile Ser
340 345 350
Ala Cys Val Ile Val Asp Leu Lys Gln Arg Phe Ser Lys Asn Asn Asn
355 360 365
Ser Glu His Asp Val Leu Phe Ala Arg Ile Val Ile Ile Ile Ala Gly
370 375 380
Ile Phe Gly Thr Ile Ala Ser Leu Tyr Leu Ile Asn Gln Glu Thr Asn
385 390 395 400
Glu Thr Trp Asp Leu Phe Leu Leu Val Thr Gly Leu Phe Gly Val Pro
405 410 415
Ile Ala Gly Val Phe Ala Val Gly Ile Phe Thr Lys Arg Ala Asn Ser
420 425 430
Tyr Gly Val Ile Ile Gly Leu Ile Val Ala Ala Ile Val Ser Tyr Phe
435 440 445
Ile Gly Lys Thr Glu Ile Thr Pro Phe Thr Val Ser Val Ile Gly Phe
450 455 460
Phe Ile Ala Phe Ile Val Gly Tyr Leu Ala Ser Leu Pro Phe Ser Lys
465 470 475 480
His Asn Lys Asn Ile Val Gly Leu Thr Ile Tyr Thr Ile Asn Asp Gln
485 490 495
Tyr Val Lys Asp Thr Lys
500
<210> 24
<211> 501
<212> PRT
<213> 唾液乳杆菌cp400
<400> 24
Met Glu Lys Val Gly Phe Gly Thr Leu Asn Trp Ile Val Leu Val Leu
1 5 10 15
Tyr Leu Leu Ala Met Leu Ala Val Gly Ala Tyr Phe Thr Lys Lys Ala
20 25 30
Ser Lys Asn Thr Asp Ser Phe Phe Thr Ala Glu Gly Lys Ile Pro Ala
35 40 45
Trp Ala Ala Gly Phe Ser Ile Tyr Ala Thr Thr Leu Ser Ala Ile Thr
50 55 60
Phe Met Ser Thr Pro Glu Gln Ala Phe Leu Asn Asp Trp Ala Tyr Ser
65 70 75 80
Ile Gly Asn Leu Ala Ile Ile Ala Ile Ile Pro Ile Leu Val Lys Tyr
85 90 95
Tyr Val Pro Phe Phe Arg Lys Leu Lys Val Pro Thr Ala Tyr Gly Tyr
100 105 110
Leu Glu Glu Arg Phe Gly Pro Val Met Arg Ile Leu Gly Ser Leu Leu
115 120 125
Phe Met Leu Tyr His Ile Ala Arg Val Ala Ile Val Ile Tyr Leu Pro
130 135 140
Ile Ile Ala Ile Thr Ser Val Ser Asp Ile Asn Pro Ile Ile Ile Ala
145 150 155 160
Leu Phe Val Gly Gly Leu Cys Ile Ile Tyr Thr Phe Leu Gly Gly Ile
165 170 175
Glu Gly Val Ile Trp Ser Asp Val Ile Gln Gly Ile Leu Leu Leu Gly
180 185 190
Gly Ala Leu Leu Val Ile Ile Leu Gly Ala His Tyr Ile Asp Gly Gly
195 200 205
Trp Ala Thr Val Ala Ser Asp Ala Ile Thr His His Lys Leu Ile Ser
210 215 220
Gly Phe Asp Met Lys Ile Ser Asp Leu Ser Lys Phe Leu Pro Leu Ile
225 230 235 240
Phe Ala Gly Gln Phe Phe Asn Ser Leu Tyr Gln Tyr Thr Gly Ser Gln
245 250 255
Asp Val Val Gln Arg Tyr Gln Thr Thr Ala Thr Met Glu Glu Thr Lys
260 265 270
Lys Ser Leu Trp Thr Asn Gly Ile Leu Ala Phe Ile Thr Ile Pro Ile
275 280 285
Phe Tyr Gly Met Gly Thr Val Leu Phe Ser Phe Tyr Asn His Ala Ala
290 295 300
Met Leu Pro Lys Gly Phe Asn Thr Ser Ala Val Val Pro Tyr Phe Ile
305 310 315 320
Val Thr Lys Leu Pro Ala Gly Ile Ala Gly Leu Val Ile Ala Ala Ile
325 330 335
Phe Ala Ala Ala Gln Ser Thr Ile Ala Ser Ser Leu Asn Ala Ile Ser
340 345 350
Ser Cys Gly Ile Ile Asp Phe Lys Gln Arg Phe Phe Asn Asp Lys Phe
355 360 365
Lys Asn Val Ser Asp Val Ala Leu Ala Arg Trp Ile Ile Ile Ile Ser
370 375 380
Gly Leu Phe Ser Leu Ala Val Ala Ile Tyr Leu Leu Val Gly Asn Thr
385 390 395 400
Ser Glu Thr Trp Asn Leu Phe Leu Ala Val Thr Gly Leu Phe Gly Val
405 410 415
Pro Ile Ala Gly Ile Phe Ala Ala Gly Ile Phe Thr Glu Lys Ala Asn
420 425 430
Thr Val Ser Ala Val Ile Ala Leu Ile Val Ala Ala Gly Leu Thr Tyr
435 440 445
Tyr Val Gln Ser Leu Asn Ile Ser Pro Phe Ile Thr Ser Ser Val Ser
450 455 460
Phe Leu Thr Ser Phe Val Val Ser Tyr Leu Val Gly Leu Val Thr Pro
465 470 475 480
Gln Tyr Arg Lys Asp Val Thr Gly Leu Thr Val Arg Thr Ile Asp Val
485 490 495
Glu Tyr Thr Lys Lys
500
<210> 25
<211> 500
<212> PRT
<213> Lactobacillus apodemi
<400> 25
Met Glu Lys Val Gly Phe Gly Leu Thr Asn Trp Ile Val Val Val Leu
1 5 10 15
Tyr Leu Val Gly Met Leu Leu Val Gly Ala Tyr Phe Thr Lys Arg Ser
20 25 30
Ser Lys Asp Thr Asp Ala Phe Phe Lys Ala Gly Gly Lys Ile Pro Ala
35 40 45
Trp Ala Ala Gly Ile Ser Ile Phe Ala Thr Thr Leu Ser Ser Ile Thr
50 55 60
Phe Met Ser Val Pro Glu Arg Ala Phe Leu Ser Asp Trp Ser Tyr Ala
65 70 75 80
Ile Gly Ser Leu Val Ile Ile Pro Ile Ile Pro Ile Leu Asn His Phe
85 90 95
Tyr Val Pro Phe Phe Arg Lys Leu Lys Val Thr Thr Ala Tyr Glu Tyr
100 105 110
Leu Glu Ala Arg Phe Ser Pro Leu Ile Arg Ala Leu Ser Ser Leu Leu
115 120 125
Phe Met Ile Tyr His Ile Gly Arg Val Ala Val Val Thr Tyr Leu Pro
130 135 140
Val Leu Ala Val Ala Ser Val Thr Asp Ile Asn Pro Leu Leu Val Ala
145 150 155 160
Ala Cys Val Gly Ile Met Cys Ile Ile Tyr Thr Phe Leu Gly Gly Ile
165 170 175
Glu Gly Val Ile Trp Ser Asp Val Ile Gln Ala Phe Val Leu Ile Gly
180 185 190
Gly Ala Leu Leu Ile Ile Phe Ile Gly Ala Phe Ser Ile Asp Gly Asn
195 200 205
Phe Ala Thr Val Ala His Thr Ala Ala Ser Asn His Lys Ile Leu Ser
210 215 220
Gly Ala Asp Phe Lys Leu Ser Asp Leu Ala Asn Phe Val Pro Leu Ile
225 230 235 240
Phe Val Gly Gln Phe Val Asn Ser Leu Tyr Gln Tyr Thr Gly Ser Gln
245 250 255
Asp Val Val Gln Arg Tyr Gln Thr Thr Lys Ser Leu Lys Glu Thr Ile
260 265 270
Lys Ser Leu Trp Thr Thr Gly Phe Leu Gly Ile Leu Thr Ile Pro Leu
275 280 285
Phe Phe Gly Met Gly Thr Ile Leu Tyr Thr Phe Tyr Gln Asn Val Ala
290 295 300
Thr Leu Pro Lys Asp Phe Asn Thr Ser Ala Ile Val Pro Tyr Phe Val
305 310 315 320
Ile Thr Gln Leu Pro Ala Gly Ile Ala Gly Phe Val Ile Ala Gly Ile
325 330 335
Phe Ala Ala Ala Gln Ser Thr Ile Ala Ser Ser Leu Asn Ser Ile Ser
340 345 350
Ala Cys Phe Val Thr Asp Phe Lys Gln Arg Phe Phe Asn Asp Lys Phe
355 360 365
Thr Lys Val Ser Asp Val Ser Leu Ala Arg Ile Val Ile Ile Val Ala
370 375 380
Gly Val Ile Ser Thr Ala Ile Thr Ile Tyr Phe Thr Leu Gly Asn Thr
385 390 395 400
Ser Asp Thr Trp Asn Val Phe Leu Thr Val Ser Gly Leu Phe Gly Val
405 410 415
Pro Val Ala Gly Leu Phe Ala Leu Gly Ile Phe Thr Lys Arg Ala Asn
420 425 430
Ala Arg Gly Val Leu Leu Gly Phe Val Leu Ser Val Val Leu Ala Phe
435 440 445
Tyr Ile Asp Ser Leu Gln Ile Ser Ser Leu Leu Val Ala Thr Val Ser
450 455 460
Phe Thr Ala Ala Val Val Phe Gly Tyr Phe Ala Ser Leu Leu Phe Pro
465 470 475 480
Asn Asn Asn Lys Asp Asn Arg Gly Leu Thr Ile Tyr Thr Leu Lys Asp
485 490 495
Lys Val Asp Asp
500
<210> 26
<211> 515
<212> PRT
<213> 硒代单胞菌属种口腔分类单元478
<400> 26
Met His Glu Gly Phe Thr Trp Ile Asp Thr Ala Val Leu Ile Ile Tyr
1 5 10 15
Leu Leu Gly Val Leu Leu Ala Gly Leu Tyr Tyr Ser Lys Lys Glu Met
20 25 30
Lys Gly Lys Glu Phe Phe Lys Gly Asp Gly Thr Ile Pro Trp Tyr Val
35 40 45
Thr Cys Val Ser Ile Phe Ala Thr Leu Leu Ser Pro Ile Ser Phe Leu
50 55 60
Ala Ile Pro Gly Asn Ser Tyr His Gly Ser Trp Ile Phe Trp Trp Ala
65 70 75 80
Gln Leu Gly Met Leu Phe Ala Ile Pro Leu Thr Ile Arg Tyr Phe Leu
85 90 95
Pro Ile Tyr Ser Arg Leu Glu Ile Asp Thr Ala Tyr His Tyr Leu Gln
100 105 110
Lys Arg Phe Glu Ser Gly Lys Leu Arg Ile Leu Gly Ala Leu Met Phe
115 120 125
Ile Val Phe Gln Leu Gly Arg Met Ser Ile Ile Met Tyr Leu Pro Ser
130 135 140
Val Ala Leu Ala Glu Val Thr Gly Ile Asp Val Asn Leu Leu Ile Val
145 150 155 160
Val Met Gly Val Ile Ala Ile Ile Tyr Ser Tyr Ser Gly Gly Leu Lys
165 170 175
Ala Val Leu Tyr Thr Asp Phe Ile Gln Gly Thr Val Leu Ile Val Gly
180 185 190
Ile Ala Leu Ser Leu Val Val Met Ile Gly Ser Ile His Gly Gly Trp
195 200 205
Gly Thr Val Trp Asp Thr Leu Thr Thr Gly His Lys Phe Leu Leu Glu
210 215 220
Asn Glu Val Trp Phe Ser Pro Asp Ile Val Ser Ser Ser Val Phe Ile
225 230 235 240
Thr Phe Ile Gly Gly Gly Leu Val Thr Phe Ala Ser Tyr Val Ser Ser
245 250 255
Gln Asp Ile Val Gln Arg Phe Thr Thr Thr Thr Asp Met Asn Gln Leu
260 265 270
Arg Lys Met Thr Leu Gly Asn Gly Val Ile Ser Ile Phe Ala Ala Thr
275 280 285
Val Phe Phe Leu Val Gly Thr Ala Leu Phe Val Phe Tyr Gln Gln Asn
290 295 300
Pro Gly Leu Leu Met Thr Asp Arg Arg Asp Leu Val Leu Ala Ala Tyr
305 310 315 320
Ile Thr Tyr Glu Leu Pro Thr Gly Leu Thr Gly Ile Leu Leu Ala Ala
325 330 335
Leu Phe Ala Ala Ala Gln Ser Thr Leu Ser Thr Gly Ile Asn Ser Val
340 345 350
Ala Thr Ser Trp Val Leu Asp Ile Gln Ser Val Leu His Pro Glu Met
355 360 365
Pro Met Lys Lys Gln Thr Arg Ile Ala Gln Phe Ile Ser Leu Gly Ile
370 375 380
Gly Ile Leu Ser Ile Val Val Ala Ile Ile Met Ala Gly Ser Asp Ile
385 390 395 400
Arg Ser Ala Tyr Gln Trp Phe Asn Ser Phe Ile Gly Leu Ala Leu Gly
405 410 415
Ala Leu Ala Gly Val Phe Val Leu Gly Ala Phe Ser Arg His Ala Asn
420 425 430
Ala Ala Gly Ala Val Ala Gly Phe Leu Val Ser Thr Ala Val Val Ile
435 440 445
Tyr Leu Lys Tyr Phe Val Pro Ser Val Ser Phe Trp Ser Tyr Thr Leu
450 455 460
Ile Thr Ile Ala Leu Thr Leu Gly Val Gly Thr Ile Val Ser Arg Leu
465 470 475 480
Thr Ala Pro Gly Tyr Thr Ala Pro Ala Gly Thr Thr Val Tyr Asp Thr
485 490 495
Arg Gly Ala Ser Arg Cys Asp Gly Gln Glu Asp Ala Ala Val Cys His
500 505 510
Val His Lys
515
<210> 27
<211> 501
<212> PRT
<213> 索氏梭菌
<400> 27
Met Gly Gly Phe Thr Val Val Asp Phe Val Ile Leu Val Val Tyr Leu
1 5 10 15
Leu Ala Val Leu Leu Ala Gly Leu His Phe Ser Lys Arg Glu Met Lys
20 25 30
Gly Lys Glu Phe Phe Lys Gly Asp Gly Thr Ile Pro Trp Trp Val Thr
35 40 45
Ser Val Ser Ile Phe Ala Thr Leu Leu Ser Pro Ile Ser Phe Leu Ser
50 55 60
Leu Ala Gly Asn Ser Tyr Gly Gly Thr Trp Ile Leu Trp Phe Ala Gln
65 70 75 80
Leu Gly Ile Phe Ile Ala Ile Pro Leu Thr Ile Lys Phe Phe Leu Pro
85 90 95
Leu Tyr Ser Arg Leu Asp Leu Asp Thr Ala Tyr Gln Tyr Leu Glu Ile
100 105 110
Arg Tyr Asn Ser Lys Gly Leu Arg Val Leu Gly Ala Leu Met Phe Ile
115 120 125
Val Tyr Gln Ile Gly Arg Met Ser Ile Ile Met Tyr Leu Pro Ser Val
130 135 140
Val Leu Ala Glu Leu Thr Gly Ile Ser Val Asn Ile Leu Ile Ile Ala
145 150 155 160
Met Gly Val Ile Ala Ile Ile Tyr Ser Tyr Thr Gly Gly Leu Lys Ser
165 170 175
Val Leu Trp Thr Asp Phe Ile Gln Gly Met Val Leu Ile Val Gly Val
180 185 190
Thr Gly Thr Leu Ile Tyr Leu Ile Ala Asn Ile Asn Gly Gly Val Gly
195 200 205
Thr Val Val Glu Thr Leu Thr Ser Gly Gln Lys Phe Leu Ala Gln Lys
210 215 220
Glu Val Ile Phe Asp Pro Asn Ile Leu Lys Thr Ser Ala Phe Ile Ile
225 230 235 240
Phe Val Gly Ala Gly Leu Asn Thr Phe Ser Ser Tyr Val Ser Ser Gln
245 250 255
Asp Val Val Gln Arg Phe Thr Thr Thr Thr Asp Leu Lys Gln Leu Lys
260 265 270
Lys Met Thr Tyr Gly Asn Gly Val Leu Ser Ile Val Val Ala Thr Ile
275 280 285
Phe Tyr Leu Ile Gly Thr Cys Leu Phe Val Phe Tyr Ser Gln Asn Pro
290 295 300
Glu Leu Ala Gln Thr Val Lys Gln Asp Gln Ile Phe Ala Ser Tyr Ile
305 310 315 320
Ala Tyr Gln Leu Pro Val Gly Ile Thr Gly Ile Leu Leu Ala Ala Ile
325 330 335
Tyr Ala Ala Ser Gln Ser Thr Leu Ser Thr Gly Leu Asn Ser Val Ala
340 345 350
Thr Ser Trp Thr Leu Asp Ile Gln Thr Leu Ile Asn Lys Asp Met Ser
355 360 365
Phe Glu Arg Gln Thr Lys Ile Ala Gln Tyr Ile Ser Leu Gly Val Gly
370 375 380
Ile Leu Ser Ile Gly Val Ser Ile Val Leu Ala Asn Gly Glu Ile Lys
385 390 395 400
Ser Ala Tyr Glu Trp Phe Asn Ser Phe Met Gly Leu Val Leu Gly Val
405 410 415
Leu Ala Gly Ile Phe Val Leu Gly Ala Phe Cys Lys Lys Ala Thr Lys
420 425 430
Leu Gly Ala Tyr Ile Gly Phe Ala Val Ser Ala Val Leu Val Ile Tyr
435 440 445
Leu Lys Tyr Lys Ala Pro Glu Val Ser Ser Trp Ala Tyr Ser Leu Ile
450 455 460
Thr Ile Thr Thr Ser Val Val Val Gly Gln Ile Ser Ser Leu Ile Gln
465 470 475 480
Leu Lys Ile Thr Asn Lys Val Asn Lys Val Asp Ser Glu Ser Thr Ile
485 490 495
Tyr Tyr Glu Ser Asn
500
<210> 28
<211> 509
<212> PRT
<213> 食甲基丁酸杆菌
<400> 28
Met Gln Gly Phe Thr Thr Ile Asp Leu Ile Ile Leu Ile Val Tyr Leu
1 5 10 15
Ala Ala Val Leu Val Ile Gly Leu Ala Phe Ala Lys Lys Asp Met Gln
20 25 30
Gly Lys Glu Phe Phe Arg Gly Asp Gly Thr Ile Pro Trp Trp Val Thr
35 40 45
Ser Val Ser Ile Phe Ala Thr Leu Leu Ser Pro Ile Ser Phe Leu Ser
50 55 60
Leu Val Gly Asn Ser Tyr Ala Gly Thr Trp Ile Leu Trp Phe Ala Gln
65 70 75 80
Leu Gly Met Leu Ile Ala Ile Pro Val Thr Ile Arg Phe Phe Leu Pro
85 90 95
Met Tyr Ser Arg Leu Asn Ile Asp Thr Ala Tyr Glu Tyr Leu Gln Leu
100 105 110
Arg Phe Asp Ser Arg Gly Leu Arg Ile Leu Gly Ala Ile Met Phe Ile
115 120 125
Ile Tyr Gln Ile Gly Arg Met Ser Ile Ile Met Tyr Leu Pro Ser Met
130 135 140
Val Leu Ala Asn Leu Met Asn Ile Asn Val Asn Ile Leu Ile Ile Leu
145 150 155 160
Met Gly Ile Val Ala Ile Ala Tyr Ser Tyr Ala Gly Gly Ile Lys Ser
165 170 175
Val Leu Trp Thr Asp Phe Ile Gln Gly Cys Val Leu Ile Ala Gly Val
180 185 190
Val Phe Ala Leu Ile Phe Leu Ile Cys Ser Ile Asp Gly Gly Met Gly
195 200 205
Ala Val Met Gly Glu Leu Ala Asn Gly Lys Phe Leu Ser Asp Thr Gln
210 215 220
Met Leu Ile Asp Pro Lys Ile Trp Lys Asp Ser Val Leu Ile Ile Leu
225 230 235 240
Val Gly Ala Gly Phe Asn Thr Phe Ser Ser Tyr Ile Ser Ser Gln Asp
245 250 255
Ile Val Gln Arg Phe Thr Thr Thr Thr Asp Val Lys Lys Leu Asn Lys
260 265 270
Met Met Leu Thr Asn Gly Ala Leu Ser Ile Phe Val Ala Thr Val Phe
275 280 285
Tyr Leu Ile Gly Thr Gly Leu Tyr Val Phe Tyr Gly Gln Asn Pro Ala
290 295 300
Leu Ala Gln Thr Ala Gln Gln Asp Gln Ile Phe Gly Ser Phe Ile Ala
305 310 315 320
Tyr Gln Leu Pro Val Gly Ile Thr Gly Ile Leu Leu Ala Ala Ile Tyr
325 330 335
Ala Ala Ser Gln Ser Thr Leu Ser Thr Gly Leu Asn Ser Val Ala Thr
340 345 350
Ser Trp Thr Leu Asp Ile Gln Thr Met Val Ser Lys Lys Glu Met Ser
355 360 365
Phe Lys Asn Gln Thr Arg Ile Ala Gln Phe Ile Thr Leu Gly Val Gly
370 375 380
Ile Ile Ala Ile Val Val Ser Met Val Leu Ala Asn Gly Glu Ile Lys
385 390 395 400
Ser Ala Tyr Glu Trp Phe Asn Gly Phe Met Gly Leu Val Leu Gly Val
405 410 415
Leu Gly Gly Thr Phe Val Leu Gly Ala Phe Thr Lys Lys Ala Thr Asp
420 425 430
Ile Gly Ala Tyr Ala Ala Phe Ala Val Ser Ala Ala Val Val Ile Tyr
435 440 445
Leu Lys Tyr Asn Val Pro Glu Val Ser Ile Trp Ala Tyr Ala Ile Ile
450 455 460
Ser Ile Phe Val Ser Leu Ile Val Gly Tyr Ile Ile Ser Ala Val His
465 470 475 480
Arg Ala Val Ser Lys Lys Ser Phe Asn Tyr Asp Asp Arg Thr Thr Ile
485 490 495
Phe Phe Lys Lys Asp Lys Gln Glu Thr Gly Glu Lys Ala
500 505
<210> 29
<211> 495
<212> PRT
<213> 假硬碱性卤杆菌
<400> 29
Met Glu Gly Gln Phe Ala Ile Ile Asp Tyr Ile Ile Leu Phe Gly Tyr
1 5 10 15
Leu Leu Phe Ile Leu Tyr Val Gly Ile Ala Val Ala Lys Lys Glu Ile
20 25 30
Gln Gly Lys Glu Phe Phe Lys Gly Asp Gly Ser Ile Pro Trp Trp Val
35 40 45
Thr Ser Val Ser Leu Phe Ala Thr Leu Leu Ser Pro Ile Ser Phe Leu
50 55 60
Ser Ile Ala Gly Asn Ser Tyr Ile Gly Thr Trp Gln Leu Trp Val Ala
65 70 75 80
Gln Leu Gly Leu Leu Ile Ala Val Pro Val Ala Ile Ile Phe Phe Leu
85 90 95
Pro Val Tyr Arg Asn Leu Asn Leu Asp Thr Ala Tyr Glu Tyr Leu Glu
100 105 110
Arg Arg Phe Asp Lys Asn Leu Arg Met Leu Gly Ser Phe Leu Phe Ile
115 120 125
Ile Tyr Gln Ile Gly Arg Met Ser Ile Ile Met Tyr Leu Pro Ala Ile
130 135 140
Ala Leu Ala Tyr Val Thr Gly Leu Ser Pro Ile Leu Ile Ile Leu Phe
145 150 155 160
Met Gly Val Ile Ala Thr Ile Tyr Ser Ala Phe Gly Gly Ile Lys Ser
165 170 175
Val Leu Trp Thr Asp Phe Ile Gln Gly Val Val Leu Ile Gly Gly Gly
180 185 190
Ile Phe Ala Leu Ile Val Leu Leu Phe Ser Ile Asp Gly Gly Met Ser
195 200 205
Glu Val Phe Lys Val Gly Val Glu Asp Asn Lys Phe Phe Ser Asp Val
210 215 220
Val Val Phe Asp Pro Asn Phe Leu Lys Asp Ser Leu Phe Ile Ile Phe
225 230 235 240
Leu Gly Ala Gly Leu Ser Thr Ala Phe Ser Tyr Ile Ser Ser Gln Asp
245 250 255
Met Val Gln Arg Tyr Leu Thr Thr Asn Asn Leu Lys Glu Met Asn Lys
260 265 270
Met Thr Ile Phe Asn Gly Val Leu Ser Ile Ser Thr Ala Thr Leu Phe
275 280 285
Phe Phe Ile Gly Thr Ala Leu Tyr Val Phe Tyr Thr Gln Gln Gly Gly
290 295 300
Pro Leu Pro Thr Gly Lys Ser Asp Leu Ile Phe Ala Asn Phe Ile Val
305 310 315 320
Asn Gln Leu Pro Ala Gly Ile Ser Gly Leu Leu Ile Ala Gly Leu Phe
325 330 335
Ala Ala Gly Gln Ser Thr Leu Ser Thr Gly Leu Asn Ser Val Ala Thr
340 345 350
Ser Trp Thr Leu Asp Ile Gln Lys Val Leu Lys Pro Asp Leu Ser Asp
355 360 365
Glu Lys Gly Thr Arg Ile Ala Arg Ile Val Ser Ile Val Val Gly Val
370 375 380
Phe Ser Ile Thr Phe Ala Ile Val Leu Ala His Ser Asp Val Ser Ser
385 390 395 400
Ala Tyr Ala Trp Phe Asn Gly Leu Met Gly Leu Val Leu Gly Ile Ile
405 410 415
Gly Gly Thr Phe Thr Leu Gly Val Leu Thr Lys Lys Ala Asn Ala Lys
420 425 430
Gly Ala Met Val Gly Phe Ile Ala Thr Thr Leu Val Ala Ile Tyr Val
435 440 445
Ser Tyr Phe Thr Asp Thr Thr Phe Trp Ala Tyr Ser Leu Ile Asn Leu
450 455 460
Val Thr Ser Met Val Phe Gly Tyr Ile Phe Ser Phe Ile Phe Ser Gly
465 470 475 480
Lys Ser Lys Ala Glu Asp Gln Pro Leu Thr Tyr Tyr Asp His Lys
485 490 495
<210> 30
<211> 513
<212> PRT
<213> 缓症链球菌(菌株B6)
<400> 30
Met Gly Thr Thr Gly Phe Thr Ile Ile Asp Leu Ile Ile Leu Ile Val
1 5 10 15
Tyr Leu Leu Ala Val Leu Val Ala Gly Ile Tyr Phe Ser Lys Lys Glu
20 25 30
Met Lys Gly Lys Glu Phe Phe Lys Gly Asp Gly Ser Val Pro Trp Tyr
35 40 45
Val Thr Ser Val Ser Ile Phe Ala Thr Met Leu Ser Pro Ile Ser Phe
50 55 60
Leu Gly Leu Ala Gly Asn Ser Tyr Ala Gly Ser Trp Ile Leu Trp Phe
65 70 75 80
Ala Gln Leu Gly Met Val Val Ala Ile Pro Leu Thr Ile Arg Phe Ile
85 90 95
Leu Pro Ile Phe Ala Arg Ile Asp Ile Asp Thr Ala Tyr Asp Tyr Leu
100 105 110
Asp Lys Arg Phe Asn Ser Lys Ala Leu Arg Ile Ile Ser Ala Leu Leu
115 120 125
Phe Ile Ile Tyr Gln Leu Gly Arg Met Ser Ile Ile Met Tyr Leu Pro
130 135 140
Ser Ala Gly Leu Ser Val Leu Thr Gly Ile Asp Ile Asn Ile Leu Ile
145 150 155 160
Ile Leu Met Gly Ala Ile Ala Ile Val Tyr Ser Tyr Thr Gly Gly Leu
165 170 175
Lys Ser Val Leu Trp Thr Asp Phe Ile Gln Gly Val Val Leu Ile Ser
180 185 190
Gly Val Val Val Ala Leu Phe Val Leu Met Ala Asn Ile Lys Gly Gly
195 200 205
Phe Gly Ala Val Ala Glu Thr Leu Ala Asn Gly Lys Phe Leu Ala Ala
210 215 220
Asn Glu Lys Leu Phe Asp Pro Asn Leu Leu Ser Asn Ser Ile Phe Leu
225 230 235 240
Ile Val Met Gly Ser Gly Phe Thr Ile Leu Ser Ser Tyr Ala Ser Ser
245 250 255
Gln Asp Leu Val Gln Arg Phe Thr Thr Thr Gln Asn Ile Lys Lys Leu
260 265 270
Asn Lys Met Leu Phe Thr Asn Gly Val Leu Ser Leu Ala Thr Ala Thr
275 280 285
Val Phe Tyr Leu Ile Gly Thr Gly Leu Tyr Val Phe Tyr Gln Val Gln
290 295 300
Asn Ala Gly Ser Ala Ala Ser Asn Ile Pro Gln Asp Gln Ile Phe Met
305 310 315 320
Tyr Phe Ile Ala Tyr Gln Leu Pro Val Gly Val Thr Gly Leu Ile Leu
325 330 335
Ala Ala Ile Tyr Ala Ala Ala Gln Ser Thr Ile Ser Thr Gly Leu Asn
340 345 350
Ser Val Ala Thr Ser Trp Thr Leu Asp Val Gln Asp Val Ile Ser Lys
355 360 365
Asn Met Ser Asp Asp Arg Arg Thr Lys Ile Ala Gln Phe Val Ser Leu
370 375 380
Ala Val Gly Leu Phe Ser Ile Val Val Ser Ile Ile Met Ala His Ser
385 390 395 400
Asp Ile Lys Ser Ala Tyr Glu Trp Phe Asn Ser Phe Met Gly Leu Val
405 410 415
Leu Gly Leu Leu Gly Gly Val Phe Ile Leu Gly Phe Val Ser Lys Lys
420 425 430
Ala Asn Lys Gln Gly Ala Tyr Ala Ala Leu Ile Val Ser Thr Ile Val
435 440 445
Met Val Tyr Ile Lys Tyr Phe Leu Pro Pro Thr Ala Val Ser Tyr Trp
450 455 460
Ala Tyr Ser Leu Ile Ser Ile Ser Val Ser Val Val Ser Gly Tyr Ile
465 470 475 480
Val Ser Val Leu Thr Glu Asn Lys Val Ser Ala Pro Lys Tyr Thr Thr
485 490 495
Ile His Asp Ile Arg Glu Ile Lys Ala Asp Ser Ser Trp Glu Val Arg
500 505 510
His
<210> 31
<211> 512
<212> PRT
<213> 绿色气球菌
<400> 31
Met Ser Lys Thr Gly Phe Thr Thr Ile Asp Phe Ala Ile Leu Val Val
1 5 10 15
Tyr Leu Ile Ser Val Leu Phe Ala Gly Leu Leu Phe Ser Lys Lys Glu
20 25 30
Met Lys Gly Lys Glu Phe Phe Lys Gly Asp Gly Thr Ile Pro Trp Tyr
35 40 45
Val Thr Ser Val Ser Ile Phe Ala Thr Leu Leu Ser Pro Ile Ser Phe
50 55 60
Leu Thr Leu Pro Gly Asn Ser Phe Ala Gly Ser Trp Ile Leu Trp Phe
65 70 75 80
Ala Gln Leu Gly Met Ile Val Ala Ile Pro Ile Ala Met Arg Tyr Phe
85 90 95
Leu Pro Ile Tyr Ala Lys Leu Asp Ile Asp Thr Ala Tyr Asp Tyr Leu
100 105 110
Glu Arg Arg Phe Asp Ser Lys Gly Leu Arg Val Ile Gly Ala Leu Met
115 120 125
Phe Val Ile Phe Gln Leu Gly Arg Met Ser Ile Ile Met Tyr Leu Pro
130 135 140
Ser Ala Ala Leu Ala Thr Leu Thr Gly Ile Asp Ile Asn Ile Leu Ile
145 150 155 160
Ile Val Met Gly Ala Ile Ala Ile Val Tyr Ser Tyr Thr Gly Gly Ile
165 170 175
Lys Ser Val Leu Trp Thr Asp Phe Ile Gln Gly Val Val Leu Leu Ile
180 185 190
Gly Val Ser Ile Ser Leu Phe Phe Leu Ala Arg Asp Ile Asp Gly Gly
195 200 205
Phe Gly Glu Ile Phe Asn Thr Met Gly Asn Asn Lys Phe Leu Gly Ser
210 215 220
Glu Glu Ala Ile Phe Asn Pro Asn Phe Leu Lys Thr Ser Val Phe Met
225 230 235 240
Met Val Ile Gly Ala Gly Leu Asn Thr Cys Ser Ser Tyr Val Ser Ser
245 250 255
Gln Asp Ile Val Gln Arg Phe Thr Thr Thr Thr Asp Thr Lys Lys Leu
260 265 270
Asn Lys Met Met Val Thr Asn Gly Val Leu Ser Ile Phe Ile Ala Thr
275 280 285
Ala Phe Tyr Leu Ile Gly Thr Gly Leu Tyr Val Tyr Tyr Lys Val Gln
290 295 300
Asn Pro Ala Asp Pro Gly Ala Ser Ile Ala Gln Asp Gln Ile Tyr Ala
305 310 315 320
Tyr Phe Ile Ala Tyr Arg Leu Pro Val Gly Met Thr Gly Ile Leu Leu
325 330 335
Ala Ala Ile Tyr Ala Ala Ser Gln Ser Thr Leu Ser Thr Gly Leu Asn
340 345 350
Ser Val Ala Thr Ser Trp Thr Leu Asp Ile Gln Glu Val Ile Thr Lys
355 360 365
Asp Met Asp Asp Lys Arg Lys Thr Ala Leu Ala Arg Tyr Ile Ser Leu
370 375 380
Gly Val Gly Ile Phe Ala Ile Val Ile Ser Ile Ile Met Ala His Ser
385 390 395 400
Asn Ile Gln Ser Ala Tyr Glu Phe Phe Asn Ser Phe Met Gly Leu Ile
405 410 415
Leu Gly Val Leu Gly Gly Thr Phe Ala Leu Gly Ile Phe Thr Lys Lys
420 425 430
Gly Asn Lys Tyr Gly Ala Tyr Ala Ala Leu Ile Ser Ser Ser Ala Val
435 440 445
Met Val Phe Ile Lys Tyr Gly Leu Pro Ala Glu Ala Val Ser Ile Trp
450 455 460
Ser Tyr Ser Met Ile Ser Ile Phe Val Ser Leu Val Val Gly Tyr Ile
465 470 475 480
Val Ser Leu Leu Val Pro Val Lys Thr Thr Ala Pro Lys Tyr Thr Thr
485 490 495
Val Ser Asp Ile Ser Glu Ile Lys Ala Asp Ser Ser Thr Pro Val Asn
500 505 510
<210> 32
<211> 509
<212> PRT
<213> Anaerobiospirillum thomasii
<400> 32
Met Phe Asp Asn Leu His Gly Phe Thr Trp Ile Asp Thr Val Ile Leu
1 5 10 15
Ile Ile Tyr Met Ile Ala Val Leu Leu Ala Gly Phe Tyr Phe Ser Lys
20 25 30
Lys Glu Met Lys Gly Lys Glu Phe Phe Lys Gly Asp Gly Ser Val Pro
35 40 45
Trp Trp Val Thr Ser Val Ser Ile Phe Ala Thr Leu Leu Ser Pro Ile
50 55 60
Ser Phe Leu Ala Leu Ala Gly Asn Ser Tyr Gly Gly Thr Trp Leu Leu
65 70 75 80
Trp Phe Ala Gln Leu Gly Met Ile Ile Ala Ile Pro Leu Thr Ile Lys
85 90 95
Phe Phe Leu Pro Val Tyr Ala Asn Leu Gly Ile Asp Thr Ala Tyr His
100 105 110
Tyr Leu Glu Ile Arg Tyr Gly Ser Arg Ala Leu Arg Val Leu Gly Ala
115 120 125
Ile Met Phe Val Ile Phe Gln Met Gly Arg Met Ser Ile Val Met Tyr
130 135 140
Leu Pro Cys Leu Ala Leu Ala Lys Leu Ala Gly Ile Asp Val Asn Ile
145 150 155 160
Leu Ile Ile Gly Met Gly Ala Ile Ala Ile Val Tyr Ser Tyr Thr Gly
165 170 175
Gly Leu Lys Ala Val Leu Trp Thr Asp Phe Ile Gln Gly Val Ile Leu
180 185 190
Ile Gly Gly Ile Gly Leu Thr Leu Val Tyr Leu Ile Trp Arg Leu Asp
195 200 205
Asn Gly Leu Gly Asp Ile Thr Tyr Ser Leu Thr Glu Gly Gly Arg Phe
210 215 220
Leu Ala Asn Gly Glu Asp Trp Ile Asn Trp Ser Asn Leu Leu Gly Thr
225 230 235 240
Ser Ile Leu Leu Thr Ile Val Gly Gly Gly Leu Ser Thr Phe Cys Ser
245 250 255
Tyr Val Ser Ser Gln Asp Val Val Gln Arg Phe Thr Thr Thr Thr Asp
260 265 270
Val Lys Gln Leu Asn Lys Met Thr Ile Gly Asn Gly Val Leu Ser Ile
275 280 285
Val Cys Ala Ser Ile Phe Tyr Leu Val Gly Thr Ala Leu Phe Ile Phe
290 295 300
Tyr Glu Gln Asn Pro Glu Leu Ile Thr Asp Thr Phe Lys Gly Ser Gln
305 310 315 320
Asp Gln Val Phe Ala Tyr Phe Ile Thr Tyr Glu Leu Pro Val Gly Val
325 330 335
Thr Gly Ile Ile Leu Ala Ala Leu Tyr Ala Ala Ser Gln Ser Thr Leu
340 345 350
Ser Thr Gly Ile Asn Ser Val Ala Thr Ser Trp Val Leu Asp Ile Gln
355 360 365
Ser Gln Ile Thr Pro Asn Met Thr Ser Glu Arg Gln Thr Lys Ile Ala
370 375 380
Gln Tyr Val Ser Leu Gly Val Gly Val Phe Ala Ile Leu Val Ala Met
385 390 395 400
Tyr Leu Ala Thr Ala Ser Ile Arg Ser Ala Tyr Glu Leu Phe Asn Ser
405 410 415
Phe Leu Gly Leu Ala Leu Gly Ala Leu Ala Gly Ile Phe Val Met Gly
420 425 430
Ala Phe Thr Arg Lys Thr Ser Ala Leu Gly Ala Leu Cys Gly Phe Ala
435 440 445
Val Ser Ile Leu Val Val Leu Tyr Cys Lys Tyr Tyr Val Pro Ser Ile
450 455 460
Asn Phe Trp Ser Tyr Ala Val Ile Ala Ile Ile Ile Thr Thr Val Val
465 470 475 480
Gly Val Ile Val Ser Lys Ile Gln Ala Ala Val Thr Gln Lys Glu Tyr
485 490 495
Ile Ala Pro Glu Gly Ser Thr Phe Met Thr Ala Lys Lys
500 505
<210> 33
<211> 507
<212> PRT
<213> 溶血梭菌NCTC 8350
<400> 33
Met Lys Thr Ser Phe Glu Phe Val Asp Tyr Leu Val Leu Ile Gly Tyr
1 5 10 15
Leu Leu Phe Val Leu Ile Ile Gly Ile Lys Val Ala Lys Lys Glu Met
20 25 30
Lys Gly Lys Glu Tyr Phe Arg Gly Asp Gly Thr Ile Pro Trp Trp Val
35 40 45
Thr Ala Val Ser Leu Phe Ala Thr Met Leu Ser Pro Ile Ser Tyr Leu
50 55 60
Ala Leu Ala Gly Arg Ser Phe Lys Gly Asp Trp Ser Ser Trp Val Gly
65 70 75 80
Gln Leu Gly Ile Phe Val Ala Val Pro Leu Thr Ile Ile Phe Phe Leu
85 90 95
Pro Val Tyr Lys Lys Leu Asn Ile Asp Thr Ala Tyr Glu Tyr Leu Glu
100 105 110
Lys Arg Phe Asp Lys Arg Leu Arg Leu Leu Gly Ser Leu Met Phe Ile
115 120 125
Val Phe Gln Ile Gly Arg Met Ser Ile Val Met Tyr Leu Pro Ala Leu
130 135 140
Ala Leu Ser Ile Val Thr Lys Ile Asp Ile Asn Ile Leu Ile Val Leu
145 150 155 160
Met Gly Ile Ile Ala Ile Ile Tyr Ser Tyr Val Gly Gly Ile Lys Ser
165 170 175
Val Leu Trp Thr Asp Phe Ile Gln Gly Met Val Leu Ser Leu Gly Ala
180 185 190
Val Phe Val Val Ile Phe Leu Cys Phe Thr Val Lys Gly Gly Phe Ser
195 200 205
Glu Ile Val Ser Met Gly Ile Lys Asn Asn Lys Phe Leu Asp Leu Ser
210 215 220
Ser Met Met Asp Ile Asn Ile Phe Arg Glu Ser Phe Phe Ile Thr Leu
225 230 235 240
Ile Gly Ala Gly Phe Gly Thr Leu Ser Ser Tyr Val Ser Ser Gln Asp
245 250 255
Met Val Gln Arg Tyr Thr Thr Thr Thr Asn Ile Lys Glu Met Lys Lys
260 265 270
Met Thr Tyr Leu Asn Gly Val Leu Ser Ile Gly Val Ala Thr Leu Phe
275 280 285
Phe Phe Ile Gly Thr Gly Leu Tyr Ala Phe Tyr Thr Gln Asn Pro Ser
290 295 300
Leu Leu Leu Thr His Lys Glu Asp Gln Ile Phe Ala Ser Tyr Ile Val
305 310 315 320
Ser Gln Leu Pro Ala Gly Leu Ser Gly Leu Leu Leu Ala Gly Ile Phe
325 330 335
Ala Ala Gly Gln Ser Thr Leu Ser Ser Gly Leu Asn Ser Val Ala Thr
340 345 350
Ser Trp Thr Leu Asp Val His Lys Val Ile Lys Gly Ser Met Asp Asn
355 360 365
Asp Lys Ala Thr Asn Phe Ala Lys Phe Leu Ser Leu Ala Ile Gly Ile
370 375 380
Val Ser Ile Val Val Ser Ile Ile Leu Ala His Ser Asn Leu Asn Ser
385 390 395 400
Ala Phe Ala Trp Phe Asn Gly Phe Ile Gly Met Val Leu Gly Leu Val
405 410 415
Gly Gly Leu Phe Gly Leu Gly Val Phe Ser Lys Lys Ala Asn Ser Lys
420 425 430
Gly Ala Leu Leu Gly Phe Ser Val Ala Val Ile Val Ser Ile Gly Ile
435 440 445
Lys Tyr Tyr Thr Lys Val Asn Phe Trp Ala Tyr Ser Ile Ile Ser Ile
450 455 460
Ala Val Cys Met Ile Phe Gly Tyr Ile Phe Ser Leu Ile Phe Lys Glu
465 470 475 480
Arg Val Lys Glu Asn Ile Asn Glu Leu Thr Ile Tyr Gly Ile Ser Lys
485 490 495
Asn Asp Leu Asn Ser Glu Glu Asn Ile Lys Leu
500 505
<210> 34
<211> 503
<212> PRT
<213> 嗜热丁酸梭菌
<400> 34
Met Gln Gly Phe Thr Lys Ile Asp Leu Val Val Leu Val Ala Tyr Leu
1 5 10 15
Gly Ala Val Leu Tyr Ala Gly Leu Lys Phe Ser Lys Lys Glu Met Lys
20 25 30
Gly Lys Glu Phe Phe Lys Gly Asp Gly Thr Ile Pro Trp Trp Val Thr
35 40 45
Ser Val Ser Ile Phe Ala Thr Leu Leu Ser Pro Ile Ser Phe Leu Ser
50 55 60
Leu Ala Gly Asn Ser Tyr Lys Gly Thr Trp Ile Met Trp Phe Ala Gln
65 70 75 80
Leu Gly Met Phe Val Ala Val Pro Leu Thr Ile Lys Phe Phe Leu Pro
85 90 95
Val Tyr Ser Lys Leu Asp Ile Asp Thr Ala Tyr Glu Tyr Leu Glu Ile
100 105 110
Arg Tyr Lys Asp Lys Gly Leu Arg Ile Leu Gly Ala Ile Met Phe Ile
115 120 125
Ile Tyr Gln Ile Gly Arg Met Ala Ile Ile Met Tyr Leu Pro Ser Met
130 135 140
Val Leu Ser Asn Leu Thr Gly Ile Asn Val Tyr Leu Leu Ile Ala Val
145 150 155 160
Met Gly Ile Ile Ala Ile Ile Tyr Ser Tyr Thr Gly Gly Leu Lys Ser
165 170 175
Val Leu Trp Thr Asp Phe Ile Gln Gly Cys Val Leu Ile Ala Gly Ile
180 185 190
Val Phe Ala Leu Val Phe Leu Ile Ser Thr Ile Asn Gly Gly Phe Gly
195 200 205
Ser Ile Met Ser Glu Leu Thr Ser Gly Gly Lys Phe Leu Ser Pro Gln
210 215 220
Glu Pro Ile Phe Asp Ala Asn Ile Phe Lys Thr Ser Val Phe Leu Leu
225 230 235 240
Ile Val Gly Gly Gly Leu Asn Thr Phe Ser Ser Tyr Ile Ser Ser Gln
245 250 255
Asp Ile Val Gln Arg Phe Thr Thr Thr Thr Asp Ile Lys Gln Leu Lys
260 265 270
Lys Met Thr Tyr Gly Asn Leu Val Leu Ser Leu Phe Val Ala Thr Val
275 280 285
Phe Tyr Leu Ile Gly Thr Ala Leu Phe Val Phe Tyr Lys Gln Asn Pro
290 295 300
Glu Leu Val Gln Thr Leu Gln Gln Asp Gln Ile Phe Ala Ser Tyr Ile
305 310 315 320
Ala Phe Gln Leu Pro Val Gly Ile Thr Gly Ile Val Leu Ala Ala Ile
325 330 335
Tyr Ala Ala Ala Gln Ser Thr Leu Ser Thr Gly Leu Asn Ser Val Ala
340 345 350
Thr Ser Trp Thr Leu Asp Ile Gln Asn Phe Ile Thr Lys Asp Met Ser
355 360 365
Met Glu Lys Gln Thr Lys Ile Ala Gln Tyr Ile Ser Leu Gly Val Gly
370 375 380
Ile Ala Ser Ile Leu Met Ala Ser Ile Leu Ala Gly Gly Gly Val Asn
385 390 395 400
Ser Ala Tyr Glu Trp Phe Asn Gly Phe Met Gly Leu Val Leu Gly Val
405 410 415
Leu Ala Gly Ile Phe Val Leu Gly Val Phe Phe Lys Lys Ala Thr Lys
420 425 430
Ala Gly Ala Tyr Ala Gly Phe Ile Ala Ser Ala Ile Ala Val Ile Val
435 440 445
Cys Lys Tyr Gly Gly Phe Asp Val Ser Ile Trp Ser Tyr Ser Ile Ile
450 455 460
Ser Ile Gly Val Ser Ile Ile Val Gly Met Ile Val Ser Leu Met Thr
465 470 475 480
Gln Ser Gln Leu Pro Asp Glu Lys Thr Leu Asn Glu Ala Thr Ile Asn
485 490 495
Leu Asn Lys Lys Val Asn Val
500
<210> 35
<211> 505
<212> PRT
<213> 嗜热丁酸梭菌
<400> 35
Met Lys Ser Tyr Ser Pro Ile Asn Tyr Leu Val Ile Ile Ile Tyr Leu
1 5 10 15
Ile Ala Val Phe Leu Ile Gly Leu Gly Phe Ser Arg Lys Lys Gln Gly
20 25 30
Gly Lys Val Phe Phe Lys Gly Asn Asp Gly Ser Ile Pro Trp Trp Val
35 40 45
Ala Ala Val Ser Leu Phe Ala Thr Leu Met Ser Pro Ile Ser Phe Leu
50 55 60
Thr Leu Ala Gly Arg Ser Phe Met Thr Asn Trp Glu Asp Trp Leu Gly
65 70 75 80
Gln Leu Gly Val Phe Ile Ala Val Pro Leu Thr Ile Met Trp Phe Leu
85 90 95
Pro Val Tyr Lys Arg Met Lys Leu Asp Thr Ala Tyr Glu Tyr Leu Glu
100 105 110
Arg Arg Phe Asn Lys Lys Leu Arg Phe Leu Gly Ser Ser Met Phe Ile
115 120 125
Ile Phe Gln Ile Gly Arg Asn Ala Ile Ile Met Tyr Leu Pro Ala Ile
130 135 140
Ala Leu Ala Tyr Ile Thr His Met Asn Ile Asn Ile Leu Ile Leu Ile
145 150 155 160
Phe Gly Val Ile Ala Val Ile Tyr Ser Thr Leu Gly Gly Leu Lys Ala
165 170 175
Val Leu Trp Thr Asp Phe Ile Gln Gly Leu Val Leu Ser Val Gly Ala
180 185 190
Ile Phe Val Val Cys Tyr Leu Ile Phe Ser Val Lys Gly Gly Phe Ser
195 200 205
His Ile Val Ser Tyr Gly Leu Ser His His Lys Phe Leu Ser Thr Ser
210 215 220
Gln Met Met Ser Leu Ser Ile Phe Lys Gln Gly Leu Pro Val Val Ile
225 230 235 240
Val Gly Ala Gly Leu Ser Thr Leu Ser Ser Tyr Val Ser Ser Gln Asp
245 250 255
Met Val Gln Arg Tyr Ile Thr Thr Asp Asp Leu Gly Lys Met Lys Lys
260 265 270
Met Thr Tyr Leu Asn Gly Phe Met Ser Ile Ala Ile Ala Thr Leu Phe
275 280 285
Phe Phe Val Gly Thr Gly Met Phe Val Phe Tyr Lys Gln Asn Pro Asn
290 295 300
Leu Leu Ile His Ala His Ala Thr Glu Asp Lys Ile Phe Ala Ser Phe
305 310 315 320
Ile Val Asn Gln Leu Pro Val Gly Ile Ser Gly Leu Leu Ile Ala Ala
325 330 335
Leu Phe Ala Ile Gly Gln Ser Ser Leu Ser Ser Gly Ile Asn Gly Ile
340 345 350
Ala Ser Thr Trp Thr Leu Asp Leu Thr Lys Ser Phe Lys Lys Asn Phe
355 360 365
Ser Asp Glu Gln Ala Thr Arg Tyr Gly Lys Ile Leu Ser Leu Leu Val
370 375 380
Gly Leu Phe Ser Ile Val Leu Ala Ile Ile Phe Ala Asn Ser His Ile
385 390 395 400
Glu Ser Ile Phe Ala Phe Phe Asn Gly Phe Val Gly Ile Ile Leu Gly
405 410 415
Leu Val Gly Gly Leu Phe Val Leu Gly Ile Leu Thr Lys Lys Ala Asn
420 425 430
Thr Lys Gly Ala Ile Ile Gly Phe Ile Val Gly Leu Ile Ile Ser Ile
435 440 445
Phe Val Asn Tyr Phe Thr Ser Val Thr Phe Trp Ala Tyr Ser Ile Ile
450 455 460
Ser Ile Leu Ser Val Leu Ile Ile Gly Tyr Ile Ala Ser Phe Phe Phe
465 470 475 480
Lys Asp Glu Lys Gly Ser Glu Arg Glu Asp Leu Asp His Leu Thr Ile
485 490 495
Tyr Gly Ser Leu Lys Lys Asp Asn Lys
500 505
<210> 36
<211> 504
<212> PRT
<213> Romboutsia ilealis
<400> 36
Met Asn Asn Met Val Gly Phe Thr Lys Ile Asp Phe Ala Ile Leu Val
1 5 10 15
Leu Tyr Leu Val Ala Val Leu Phe Ala Gly Leu Phe Phe Ser Lys Lys
20 25 30
Glu Met Lys Gly Lys Glu Phe Phe Lys Gly Asp Gly Thr Ile Pro Trp
35 40 45
Trp Val Thr Ser Val Ser Ile Phe Ala Thr Leu Leu Ser Pro Ile Ser
50 55 60
Phe Leu Ser Leu Ala Gly Asn Ser Tyr Gly Gly Thr Trp Ile Leu Trp
65 70 75 80
Phe Ala Gln Leu Gly Met Phe Ile Ala Val Pro Leu Thr Ile Lys Phe
85 90 95
Phe Leu Pro Leu Tyr Ser Arg Leu Asp Leu Asp Thr Ala Tyr Gln Tyr
100 105 110
Leu Glu Ile Arg Phe Asp Ser Lys Gly Leu Arg Ile Leu Gly Ala Leu
115 120 125
Met Phe Ile Ile Tyr Gln Ile Gly Arg Met Ser Ile Ile Met Tyr Leu
130 135 140
Pro Ser Val Val Leu Ala Glu Leu Thr Gly Ile Ser Val Asn Ile Leu
145 150 155 160
Ile Ile Val Met Gly Ile Ile Ala Ile Ile Tyr Ser Tyr Thr Gly Gly
165 170 175
Leu Lys Ser Val Leu Trp Thr Asp Phe Ile Gln Gly Val Val Leu Ile
180 185 190
Val Gly Val Ile Gly Thr Leu Phe Phe Leu Ile Ala Asn Ile Asn Gly
195 200 205
Gly Val Gly Thr Ile Met Glu Thr Leu Thr Ser Gly Gln Lys Phe Ile
210 215 220
Ser Ser Asn Glu Val Ile Phe Asp Ile Asn Ile Leu Lys Ser Ser Val
225 230 235 240
Phe Ile Ile Phe Val Gly Ala Gly Leu Asn Thr Phe Ser Ser Tyr Val
245 250 255
Ser Ser Gln Asp Ile Val Gln Arg Phe Thr Thr Thr Thr Asn Leu Lys
260 265 270
Glu Leu Lys Lys Met Thr Tyr Gly Asn Gly Leu Leu Ser Ile Thr Val
275 280 285
Ala Thr Val Phe Tyr Leu Ile Gly Thr Cys Leu Phe Ile Phe Tyr Thr
290 295 300
Gln Asn Pro Glu Leu Ala Gln Thr Ala Lys Gln Asp Gln Ile Phe Ala
305 310 315 320
Ser Tyr Ile Ala Tyr Gln Leu Pro Val Gly Ile Thr Gly Ile Leu Leu
325 330 335
Ala Ala Ile Tyr Ala Ala Ser Gln Ser Thr Leu Ser Thr Gly Leu Asn
340 345 350
Ser Val Ala Thr Ser Trp Thr Leu Asp Ile Gln Thr Met Ile Ser Lys
355 360 365
Asp Met Ser Phe Glu Arg Gln Thr Lys Ile Ala Gln Tyr Ile Ser Leu
370 375 380
Gly Val Gly Ile Val Ala Ile Gly Val Ser Val Val Leu Ala Asn Gly
385 390 395 400
Glu Ile Lys Ser Ala Tyr Glu Trp Phe Asn Ser Phe Met Gly Leu Val
405 410 415
Leu Gly Val Leu Ala Gly Ile Phe Val Leu Gly Ala Phe Cys Lys Ser
420 425 430
Ala Thr Lys Phe Gly Ala Tyr Ile Gly Phe Val Val Ser Ala Ile Leu
435 440 445
Val Val Tyr Leu Lys Tyr Asn Val Pro Asp Val Thr Ser Trp Ser Tyr
450 455 460
Ser Leu Ile Thr Ile Thr Thr Ser Val Ile Val Gly Gln Ile Val Ser
465 470 475 480
Met Ile Gln Leu His Ile Thr Lys Arg Lys Asn Asn Val Arg Glu Asp
485 490 495
Ser Thr Ile Tyr Tyr Glu Val Asn
500
<210> 37
<211> 501
<212> PRT
<213> 单形巨单胞菌YIT 11815
<400> 37
Met Gln Gly Phe Thr Trp Ile Asp Thr Ala Val Leu Val Ile Tyr Leu
1 5 10 15
Leu Gly Val Leu Phe Ala Gly Leu Trp Phe Ser Asn Lys Glu His Gln
20 25 30
Gly Lys Glu Phe Phe Lys Gly Asp Gly Thr Ile Pro Trp Trp Val Thr
35 40 45
Cys Val Ser Ile Phe Ala Thr Leu Leu Ser Pro Ile Ser Phe Leu Ser
50 55 60
Leu Pro Gly Asn Ser Tyr Gly Gly Ser Trp Ile Leu Trp Trp Ala Gln
65 70 75 80
Ile Gly Met Leu Ile Ala Ile Pro Leu Thr Ile Lys Tyr Phe Leu Pro
85 90 95
Ile Tyr Ser Thr Leu Gln Ile Asp Thr Ala Tyr His Tyr Leu Glu Lys
100 105 110
Arg Phe Gly Ser Lys Gly Leu Arg Ile Leu Gly Ala Leu Met Phe Ile
115 120 125
Val Phe Gln Thr Gly Arg Met Ser Ile Ile Met Tyr Leu Pro Cys Ile
130 135 140
Ala Leu Ala Glu Leu Thr Gly Ile Asn Val Asn Ile Leu Ile Ile Val
145 150 155 160
Met Gly Ile Ile Ala Ile Ile Tyr Ser Tyr Ser Gly Gly Leu Lys Ala
165 170 175
Val Leu Trp Thr Asp Phe Ile Gln Gly Val Val Leu Ile Val Gly Ile
180 185 190
Ala Leu Thr Leu Val Val Met Ile Ala Ser Ile Asn Gly Gly Phe Gly
195 200 205
Thr Val Met Asp Thr Leu Thr Thr Gly His Lys Phe Leu Leu Glu Asn
210 215 220
Glu Val Trp Phe Ser Ser Asp Ile Leu Ser Thr Ser Val Phe Val Ile
225 230 235 240
Leu Val Gly Gly Gly Leu Thr Thr Phe Ser Ser Tyr Val Ser Ser Gln
245 250 255
Asp Ile Val Gln Arg Phe Thr Thr Thr Thr Asp Ile Lys Gln Leu Asn
260 265 270
Lys Met Thr Leu Gly Asn Gly Val Leu Ser Ile Phe Ala Ala Thr Val
275 280 285
Phe Tyr Leu Val Gly Thr Ser Leu Tyr Val Phe Tyr Thr Gln Asn Pro
290 295 300
Asp Leu Leu Met Thr Thr Arg Gln Asp Leu Val Phe Ala Thr Tyr Ile
305 310 315 320
Thr Tyr Glu Leu Pro Ala Gly Ile Thr Gly Ile Leu Leu Ala Ala Ile
325 330 335
Phe Ala Ala Ser Gln Ser Thr Leu Ser Thr Gly Ile Asn Ser Val Ala
340 345 350
Thr Ser Trp Val Leu Asp Ile Gln Ser Val Ile Asn Pro Glu Met Ser
355 360 365
Ser Glu Arg Gln Thr Lys Ile Ala Gln Tyr Ile Ser Leu Gly Ile Gly
370 375 380
Ile Leu Ala Ile Ile Val Ala Ile Phe Leu Ala Ser Gly Asp Ile Lys
385 390 395 400
Ser Ala Tyr Glu Trp Phe Asn Ser Phe Ile Gly Leu Ala Leu Gly Ala
405 410 415
Leu Val Gly Met Phe Val Leu Gly Ala Phe Ser Lys His Ala Asn Ala
420 425 430
Lys Gly Ala Val Ala Ala Phe Ile Val Ser Ser Ile Ile Val Ile Tyr
435 440 445
Leu Lys Tyr Phe Val Pro Ser Val Ser Tyr Trp Thr Tyr Thr Ile Ile
450 455 460
Thr Ile Ile Ser Ser Leu Val Val Gly Asn Ile Val Ser Tyr Leu Thr
465 470 475 480
Asp Lys Ser Phe Val Ala Pro Lys Gly Thr Thr Val Tyr Thr Ser Lys
485 490 495
Ala Pro Ser Ser Lys
500
<210> 38
<211> 497
<212> PRT
<213> 球形赖氨酸芽孢杆菌
<400> 38
Met Asp Gly Lys Phe Ala Val Ile Asp Tyr Val Ile Leu Val Ala Tyr
1 5 10 15
Leu Leu Leu Ile Leu Tyr Ile Gly Val Ala Val Ala Lys Lys Glu Met
20 25 30
Lys Gly Lys Glu Phe Phe Lys Gly Asp Gly Ser Ile Pro Trp Trp Val
35 40 45
Thr Ser Val Ser Leu Phe Ala Thr Leu Leu Ser Pro Ile Ser Phe Leu
50 55 60
Ser Leu Ala Gly Asn Ser Tyr Leu Gly Asn Trp Gln Leu Trp Ala Gly
65 70 75 80
Gln Ile Gly Leu Phe Ile Ala Val Pro Val Ala Ile Tyr Phe Phe Leu
85 90 95
Pro Val Tyr Arg Asn Leu Asn Ile Asp Thr Ala Tyr Glu Tyr Leu Glu
100 105 110
Arg Arg Phe Gly Lys Gly Leu Arg Ile Met Gly Ser Ser Leu Phe Ile
115 120 125
Val Tyr Gln Val Gly Arg Met Ser Ile Ile Met Tyr Leu Pro Ala Leu
130 135 140
Ala Leu Ser Ala Val Thr Gly Ile His Thr Val Ala Ile Ile Leu Phe
145 150 155 160
Met Gly Val Ile Ala Thr Ile Tyr Ser Ser Ile Gly Gly Ile Lys Ser
165 170 175
Val Leu Trp Thr Asp Phe Ile Gln Gly Ile Val Leu Ile Gly Gly Gly
180 185 190
Val Phe Ala Leu Ile Val Leu Ile Leu Ser Val Lys Gly Gly Phe Pro
195 200 205
Glu Ile Met Lys Val Gly Val Gln Asp Asn Lys Phe Phe Ser Glu Ala
210 215 220
Val Ile Phe Asp Pro Asn Ile Phe Asn Asp Ser Leu Phe Ile Ile Phe
225 230 235 240
Leu Gly Ala Gly Leu Ser Thr Leu Phe Ser Tyr Ile Ser Ser Gln Asp
245 250 255
Met Val Gln Arg Tyr Leu Thr Thr Thr Asp Leu Lys Gln Met Asn Lys
260 265 270
Met Thr Ile Met Asn Gly Val Leu Ser Leu Gly Thr Ala Thr Leu Phe
275 280 285
Phe Phe Ile Gly Thr Ser Leu Tyr Val Phe Tyr Lys Gln Ala Gly Gly
290 295 300
Asp Met Pro Asp Gly Ala Lys Asp Leu Ile Phe Ala Asn Phe Ile Val
305 310 315 320
Thr Glu Leu Pro Ala Gly Ile Ser Gly Leu Leu Ile Ala Gly Leu Phe
325 330 335
Ala Ala Gly Gln Ser Thr Leu Ser Thr Gly Leu Asn Ser Val Ala Thr
340 345 350
Ser Trp Thr Leu Asp Ile Gln Lys Val Leu Arg Pro Asp Met Thr Asp
355 360 365
Glu Lys Gly Thr Lys Ile Ala Lys Val Val Ser Ile Ile Val Gly Val
370 375 380
Leu Ser Ile Val Phe Ala Ile Val Leu Ala Tyr Ser Asn Val Ser Ser
385 390 395 400
Ala Tyr Glu Trp Phe Asn Gly Leu Met Gly Leu Val Leu Gly Ile Ile
405 410 415
Gly Gly Thr Phe Thr Leu Gly Val Leu Thr Lys Arg Ala Asn Thr Lys
420 425 430
Gly Ala Ile Ala Gly Phe Ile Val Thr Ser Leu Ile Ala Ile Tyr Val
435 440 445
Ser Tyr Phe Thr Asp Thr Thr Leu Trp Ala Tyr Ser Leu Ile Asn Leu
450 455 460
Val Ser Ser Leu Val Phe Gly Tyr Leu Phe Ser Leu Leu Phe Lys Glu
465 470 475 480
Lys Ser Lys Ala Glu Asp Ser Ser Ala Gly Leu Thr Tyr Tyr Asp Gln
485 490 495
Lys
<210> 39
<211> 498
<212> PRT
<213> 未培养的梭菌属种
<400> 39
Met Gly Phe Thr Thr Ile Asp Phe Ile Ile Leu Val Ala Tyr Leu Ala
1 5 10 15
Ala Val Leu Phe Ala Gly Leu His Phe Ser Lys Lys Asp Met Glu Gly
20 25 30
Lys Glu Phe Phe Lys Gly Asp Gly Thr Ile Pro Trp Trp Val Thr Ser
35 40 45
Val Ser Ile Phe Ala Thr Leu Leu Ser Pro Ile Ser Phe Leu Ser Leu
50 55 60
Ala Gly Asn Ser Tyr Gly Gly Thr Trp Ile Leu Trp Phe Ala Gln Leu
65 70 75 80
Gly Met Leu Ile Ala Ile Pro Leu Thr Ile Lys Phe Phe Leu Pro Ile
85 90 95
Tyr Ser Lys Leu Asn Ile Asp Thr Ala Tyr His Tyr Leu Glu Leu Arg
100 105 110
Phe Gly Ser Lys Ala Leu Arg Val Leu Gly Ala Leu Met Phe Ile Val
115 120 125
Tyr Gln Ile Gly Arg Met Ser Ile Ile Met Tyr Leu Pro Ser Met Val
130 135 140
Leu Ala Asn Leu Thr Gly Ile Asn Val Asn Leu Leu Ile Ile Val Met
145 150 155 160
Gly Val Ile Ala Ile Ile Tyr Ser Tyr Thr Gly Gly Leu Lys Ser Val
165 170 175
Leu Trp Thr Asp Phe Ile Gln Gly Ser Val Leu Leu Val Gly Val Thr
180 185 190
Phe Ala Leu Ile Tyr Leu Leu Ala Asn Ile Asp Gly Gly Ala Gly Ala
195 200 205
Val Leu Glu Thr Leu Arg Gln Gly Lys Phe Ile Gly Ala Glu Glu Val
210 215 220
Ile Phe Asp Ala Asn Ile Leu Lys Thr Ser Val Phe Leu Ile Val Val
225 230 235 240
Gly Ala Gly Phe Asn Thr Cys Ser Ser Tyr Ile Ser Ser Gln Asp Ile
245 250 255
Val Gln Arg Phe Thr Thr Thr Thr Asp Thr Lys Gln Leu Asn Lys Met
260 265 270
Met Leu Thr Asn Gly Ala Leu Ser Ile Phe Ile Ala Thr Val Phe Tyr
275 280 285
Leu Ile Gly Thr Gly Leu Tyr Val Phe Tyr Gly Gln Asn Pro Val Leu
290 295 300
Ala Gln Thr Ala Gln Gln Asp Gln Ile Phe Ala Ser Tyr Ile Ala Tyr
305 310 315 320
Gln Leu Pro Val Gly Val Thr Gly Ile Leu Leu Ala Ala Ile Tyr Ala
325 330 335
Ala Ser Gln Ser Thr Leu Ser Thr Gly Leu Asn Ser Val Ala Thr Ser
340 345 350
Trp Thr Leu Asp Ile Gln Glu Arg Leu Ser Lys Lys Gln Met Ser Phe
355 360 365
Lys Gln Gln Thr Arg Ile Ala Gln Tyr Val Ser Leu Leu Val Gly Val
370 375 380
Val Ala Ile Val Val Ser Met Val Leu Ala Asn Gly Glu Ile Lys Ser
385 390 395 400
Ala Tyr Glu Trp Phe Asn Gly Phe Met Gly Leu Val Leu Gly Val Leu
405 410 415
Ala Gly Thr Phe Val Leu Gly Val Phe Thr Lys Val Ala Asn Ser Thr
420 425 430
Gly Ala Phe Ala Ala Phe Ile Val Ser Ser Ile Ala Met Ile Val Ile
435 440 445
Lys Tyr Thr Met Pro Glu Val Ser Ile Trp Ser Tyr Ser Ile Ile Ser
450 455 460
Ile Gly Ile Ser Leu Ile Val Gly Ile Pro Val Ser Tyr Ala Ser Arg
465 470 475 480
Lys Ile Lys Asn Asp Val Ser Val Pro Asp Lys Asp Thr Val Ile Tyr
485 490 495
Glu Ser
<210> 40
<211> 499
<212> PRT
<213> 平野梭菌
<400> 40
Met Val Gly Phe Thr Met Ile Asp Leu Val Val Leu Val Val Tyr Leu
1 5 10 15
Leu Ala Val Leu Phe Ala Gly Leu Phe Phe Ser Lys Lys Glu Met Lys
20 25 30
Gly Lys Glu Phe Phe Lys Gly Asp Gly Thr Ile Pro Trp Trp Val Thr
35 40 45
Ser Val Ser Ile Phe Ala Thr Leu Leu Ser Pro Ile Ser Phe Leu Ser
50 55 60
Leu Ala Gly Asn Ser Tyr Ala Gly Ser Trp Ile Leu Trp Phe Ala Gln
65 70 75 80
Leu Gly Met Phe Ile Ala Ile Pro Leu Thr Ile Arg Tyr Phe Leu Pro
85 90 95
Leu Tyr Ser Arg Leu Glu Ile Asp Thr Ala Tyr Gln Tyr Leu Glu Met
100 105 110
Arg Tyr Glu Ser Lys Gly Leu Arg Ile Leu Gly Ala Leu Met Phe Ile
115 120 125
Ile Tyr Gln Ile Gly Arg Met Ser Ile Ile Met Tyr Leu Pro Ser Val
130 135 140
Val Leu Ser Thr Leu Thr Gly Ile Asn Val Asn Val Leu Ile Val Val
145 150 155 160
Met Gly Ile Ile Ala Ile Ile Tyr Ser Tyr Thr Gly Gly Leu Lys Ala
165 170 175
Val Leu Trp Thr Asp Phe Ile Gln Gly Met Val Leu Ile Ile Gly Val
180 185 190
Ser Gly Ala Leu Ile Tyr Met Ile Ser Gln Ile Asn Gly Gly Phe Gly
195 200 205
Glu Val Met Ser Thr Leu Thr Thr Gly Asn Lys Phe Leu Leu Pro Asp
210 215 220
Glu Lys Leu Phe Asp Pro Asn Phe Leu His Thr Ser Ala Phe Ile Ile
225 230 235 240
Phe Phe Gly Ala Gly Leu Asn Thr Leu Ser Ser Tyr Val Ser Ser Gln
245 250 255
Asp Val Val Gln Arg Phe Thr Thr Thr Thr Asp Ile Lys Gln Leu Asn
260 265 270
Lys Met Thr Tyr Gly Asn Gly Ile Leu Ser Met Gly Leu Ala Thr Ile
275 280 285
Phe Tyr Leu Ile Gly Thr Cys Leu Phe Val Phe Tyr Gly Gln Asn Pro
290 295 300
Glu Leu Ala Gln Thr Val Gln Gln Asp Gln Ile Phe Ala Ser Tyr Ile
305 310 315 320
Ala Tyr Glu Leu Pro Val Gly Val Thr Gly Ile Leu Leu Ala Ala Ile
325 330 335
Tyr Ala Ala Ser Gln Ser Thr Leu Ser Thr Gly Leu Asn Ser Val Ala
340 345 350
Thr Ser Trp Val Leu Asp Ile Gln Ala Leu Leu Ser Lys Glu Glu Ile
355 360 365
Pro Met Glu Arg Gln Thr Lys Ile Ala Gln Tyr Val Ser Leu Gly Val
370 375 380
Gly Ile Phe Ala Ile Ile Val Ala Ile Val Leu Ala Ser Gly Asn Ile
385 390 395 400
Lys Ser Ala Tyr Glu Trp Phe Asn Ser Phe Met Gly Leu Val Leu Gly
405 410 415
Val Leu Ala Gly Val Phe Ile Leu Gly Ala Phe Ser Lys Lys Ala Asp
420 425 430
Ser Lys Gly Ala Tyr Ala Gly Phe Ile Ala Ser Ala Ile Val Val Val
435 440 445
Tyr Leu Lys Tyr Phe Val Pro Glu Val Thr Tyr Trp Ala Tyr Ser Leu
450 455 460
Ile Thr Ile Ala Ile Cys Val Val Val Gly Leu Ile Val Ser Lys Phe
465 470 475 480
Thr Asn Lys Asp Gly Lys Glu Ala Lys Ser Glu Thr Thr Val Phe Tyr
485 490 495
Gly Lys Asn
<210> 41
<211> 495
<212> PRT
<213> Clostridium niameyense
<400> 41
Met Lys Ala Ser Phe Glu Phe Leu Asp Tyr Ile Val Leu Val Ala Tyr
1 5 10 15
Leu Leu Phe Val Leu Tyr Val Gly Val Arg Val Ala Lys Lys Glu Met
20 25 30
Lys Gly Lys Glu Tyr Phe Lys Gly Asp Gly Thr Ile Pro Trp Trp Val
35 40 45
Ser Ala Val Ser Leu Phe Ala Thr Met Leu Ser Pro Ile Ser Tyr Leu
50 55 60
Ala Leu Ala Gly Arg Ser Phe Lys Thr Asp Trp Ala Ala Trp Val Ala
65 70 75 80
Gln Leu Gly Val Phe Ile Ala Val Pro Leu Thr Ile Arg Phe Phe Leu
85 90 95
Pro Val Tyr Lys Lys Leu Asn Leu Asp Thr Ala Tyr Glu Tyr Leu Glu
100 105 110
Arg Arg Phe Asn Lys Gly Leu Arg Leu Leu Gly Ser Val Met Phe Ile
115 120 125
Val Tyr Gln Ile Gly Arg Met Ser Ile Ile Met Tyr Leu Pro Ser Leu
130 135 140
Ala Leu Ala Met Val Thr Asp Ile Asp Ile Asn Ile Leu Ile Ile Ala
145 150 155 160
Met Gly Val Ile Ala Ile Ile Tyr Ser Tyr Val Gly Gly Ile Lys Ser
165 170 175
Val Leu Trp Thr Asp Phe Ile Gln Gly Thr Val Leu Ser Leu Gly Ala
180 185 190
Ile Phe Val Val Ile Tyr Met Ala Phe Thr Ile His Gly Gly Leu Gly
195 200 205
Glu Val Val Arg Val Gly Val Glu Asn His Lys Phe Leu Gln Leu Ser
210 215 220
Ser Met Met Asn Leu Ser Ile Tyr Lys Glu Gly Phe Phe Ile Val Leu
225 230 235 240
Ile Gly Ala Gly Leu Ser Thr Leu Ala Ser Tyr Val Ser Ser Gln Asp
245 250 255
Met Val Gln Arg Tyr Thr Thr Thr Thr Asp Leu Gly Glu Met Lys Lys
260 265 270
Met Thr Tyr Leu Asn Gly Ala Leu Ser Ile Gly Ile Ala Thr Val Phe
275 280 285
Phe Phe Ile Gly Thr Gly Leu Phe Val Phe Tyr Lys Gln Asn Pro Ala
290 295 300
Leu Leu Val Ser Gly Ala Glu Asp Lys Ile Phe Ala Thr Tyr Ile Val
305 310 315 320
Lys Gln Leu Pro Ala Gly Ile Ser Gly Leu Leu Leu Ala Gly Val Phe
325 330 335
Ala Ala Gly Gln Ser Thr Leu Ser Thr Gly Leu Asn Ser Val Ala Thr
340 345 350
Ser Trp Thr Leu Asp Ile His Lys Val Ile Lys Gly Ser Met Asp Asn
355 360 365
Asp Ser Ala Thr Lys Met Ala Lys Ile Leu Ser Leu Gly Val Gly Ile
370 375 380
Val Ser Ile Ile Val Ala Ile Ile Leu Ala His Ser Asp Leu Lys Ser
385 390 395 400
Ala Tyr Asn Trp Phe Asn Gly Phe Met Gly Leu Val Leu Gly Val Val
405 410 415
Gly Gly Leu Phe Ala Leu Gly Ile Phe Thr Lys Lys Ala Asn Ser Lys
420 425 430
Gly Ala Ile Val Gly Phe Ile Val Ser Ser Ile Leu Val Val Ser Val
435 440 445
Lys Tyr Phe Thr His Val Thr Phe Trp Met Tyr Ser Val Ile Ser Ile
450 455 460
Gly Ala Cys Met Leu Phe Gly Tyr Val Phe Ser Leu Leu Phe Lys Glu
465 470 475 480
Asp Glu Arg Asp Leu Lys Asn Leu Thr Ile Tyr Asp Arg Asp Lys
485 490 495
<210> 42
<211> 491
<212> PRT
<213> 分节丝状菌SFB-土耳其种
<400> 42
Met Lys Gly Phe Ser Ser Ile Asp Phe Ile Val Leu Ile Val Tyr Leu
1 5 10 15
Ile Gly Val Leu Leu Ile Gly Leu Tyr Phe Ser Lys Lys Asp Met Glu
20 25 30
Gly Lys Glu Tyr Phe Lys Gly Asp Gly Thr Ile Pro Trp Trp Val Thr
35 40 45
Ser Val Ser Ile Phe Ala Thr Leu Leu Ser Pro Ile Ser Phe Leu Ser
50 55 60
Leu Ala Gly Asn Ser Tyr Ser Gly Thr Trp Ala Leu Trp Phe Ala Gln
65 70 75 80
Leu Gly Ile Phe Ile Ala Ile Pro Leu Thr Ile Arg Phe Phe Leu Pro
85 90 95
Val Phe Ser Lys Leu Lys Ile Asp Thr Ala Tyr His Tyr Leu Glu Ile
100 105 110
Arg Tyr Lys Ser Lys Gly Leu Arg Val Ile Gly Ala Ile Ile Phe Ile
115 120 125
Ile Tyr Gln Ile Gly Arg Met Ser Ile Ile Met Tyr Leu Pro Ser Ile
130 135 140
Val Leu Ala Arg Leu Ser Asn Ile His Val Asn Ile Phe Ile Ile Leu
145 150 155 160
Met Gly Ile Ile Ala Ile Ile Tyr Ser Tyr Thr Gly Gly Ile Lys Ser
165 170 175
Val Leu Trp Thr Asp Phe Ile Gln Gly Val Val Leu Ile Val Gly Val
180 185 190
Val Gly Thr Leu Val Phe Ile Gly Leu Lys Val Asn Gly Gly Phe Pro
195 200 205
Glu Ile Phe Asn Thr Leu Phe Glu Gln Gly Lys Phe Leu Ser Ser Asn
210 215 220
Glu Val Ile Phe Asp Pro Asn Ile Leu Lys Thr Ser Ile Phe Met Ile
225 230 235 240
Leu Val Gly Gly Gly Leu Asn Thr Phe Ser Ser Tyr Ile Ser Ser Gln
245 250 255
Asp Val Val Gln Arg Phe Thr Thr Thr Thr Asp Ile Lys Gln Leu Asn
260 265 270
Arg Met Thr Tyr Thr Asn Gly Ile Leu Ser Ile Val Val Ala Thr Leu
275 280 285
Phe Tyr Leu Ile Gly Thr Ala Leu Phe Val Phe Tyr Arg Gln Asn Pro
290 295 300
Glu Leu Leu Met Thr Ala Gln Gln Asp Gln Ile Tyr Ala Ser Phe Ile
305 310 315 320
Ala Tyr Gln Leu Pro Ala Gly Val Thr Gly Ile Leu Leu Ala Ala Ile
325 330 335
Tyr Ala Ala Ser Gln Ser Thr Leu Ser Thr Gly Leu Asn Ser Val Ala
340 345 350
Thr Ser Trp Thr Leu Asp Ile Gln Asn Phe Ile Thr Lys Asp Leu Ser
355 360 365
Phe Lys Lys Gln Thr Lys Ile Ala Gln Leu Ile Ser Leu Leu Val Gly
370 375 380
Ile Ile Ser Ile Val Val Ser Ile Ile Leu Ala Ser Ser Glu Ile Lys
385 390 395 400
Ser Ala Tyr Glu Trp Phe Asn Gly Phe Ile Gly Ala Val Leu Gly Val
405 410 415
Leu Ala Gly Ile Phe Val Leu Gly Val Val Tyr Lys Lys Ala Thr Lys
420 425 430
Leu Gly Ala Tyr Val Gly Phe Ile Val Ala Thr Ile Val Val Leu Ala
435 440 445
Leu Lys Tyr Lys Leu Leu Asn Val Asp Val Ser Ile Trp Ala Tyr Ser
450 455 460
Leu Ile Thr Ile Val Val Thr Val Val Val Gly Ile Ile Val Ser Leu
465 470 475 480
Phe Ser Lys Glu Lys Asn Glu Tyr Asn Thr Asn
485 490
<210> 43
<211> 617
<212> PRT
<213> Suttonella ornithocola
<400> 43
Met Lys Ala Ile Asn Gln Phe Glu Lys Trp Ile Gly Gly Ile Gly Phe
1 5 10 15
Leu Leu Met Phe Ile Ile Leu Ile Met Gln Ile Thr Ala Arg Tyr Ile
20 25 30
His Pro Leu Ser Trp Ser Glu Glu Leu Ala Arg Leu Ile Phe Val Tyr
35 40 45
Val Ala Met Leu Gly Val Ser Met Gly Ile Arg Ser Gln Gln His Val
50 55 60
Phe Ile Asp Phe Ile Thr Asn Arg Leu Ser Pro Arg Leu Gln Arg Ser
65 70 75 80
Val Phe Thr Leu Val Gln Leu Leu Ile Phe Ile Ser Ile Ile Leu Leu
85 90 95
Phe Tyr Phe Gly Leu Lys Leu Tyr Gln Lys Ala Ala Arg Thr Pro Asn
100 105 110
Asp Leu Ile Val Thr Leu Gly Ile Ser Val Lys Trp Leu Tyr Leu Ala
115 120 125
Leu Pro Ile Gly Ser Ala Ile Met Leu Leu Arg Phe Ile Gln Ala Gln
130 135 140
Tyr Gln Asn Thr Lys Asp Lys Leu Ser Leu Ile Pro Ser Pro Ile Tyr
145 150 155 160
Ile Ile Ala Ser Val Ile Leu Ile Ala Leu Ile Leu Trp Gln Pro Glu
165 170 175
Ile Phe Lys Ala Leu Arg Ile Ser Gln Tyr Thr Lys Leu Gly Ser Ile
180 185 190
Ala Ile Tyr Ile Val Leu Gly Leu Trp Leu Leu Met Met Phe Phe Gly
195 200 205
Val Pro Val Gly Trp Ser Leu Phe Ile Ala Thr Val Leu Tyr Phe Ser
210 215 220
Met Thr Arg Trp Gly Val Ala Asn Phe Ala Ala Ala Lys Leu Val Asp
225 230 235 240
Ser Val Asn Ser Phe Ser Leu Leu Ser Val Pro Phe Phe Ile Leu Thr
245 250 255
Gly Leu Leu Met Asn Ser Ala Gly Ile Thr Thr Arg Ile Phe Ser Phe
260 265 270
Ala Lys Thr Leu Phe Gly His Tyr Thr Gly Gly Leu Gly His Val Asn
275 280 285
Val Ser Ala Ser Leu Ile Phe Ser Gly Met Ser Gly Ser Ala Leu Ala
290 295 300
Asp Ala Gly Gly Leu Gly Gln Met Glu Ile Lys Ala Met Arg Asp Ala
305 310 315 320
Gly Tyr Glu Asp Asp Leu Cys Gly Gly Leu Thr Ala Ala Ser Cys Ile
325 330 335
Ile Gly Pro Leu Val Pro Pro Ser Ile Ala Met Ile Ile Tyr Gly Val
340 345 350
Ile Ala Asn Gln Ser Ile Ala Glu Leu Phe Leu Ala Gly Phe Ile Pro
355 360 365
Gly Val Ile Leu Thr Ile Ala Leu Met Thr Met Asn Tyr Ala Ile Cys
370 375 380
Lys Lys Arg Gly Tyr Pro Arg Ala Pro Lys Ala Ser Arg Ala Glu Arg
385 390 395 400
Ile Lys Ala Phe Arg Glu Ala Phe Trp Ala Val Leu Thr Pro Leu Leu
405 410 415
Ile Ile Gly Gly Ile Phe Ser Gly Ile Phe Thr Pro Thr Glu Ala Ala
420 425 430
Ala Phe Ala Ala Leu Tyr Ala Val Ile Leu Gly Met Phe Ile Tyr Lys
435 440 445
Glu Leu Thr Phe Ser Ala Leu Phe Ala Asn Cys Val Glu Ala Leu Ala
450 455 460
Ile Ser Gly Val Thr Val Leu Met Val Met Thr Val Thr Phe Phe Gly
465 470 475 480
Asp Met Ile Ala Arg Glu Gln Ile Ala Ile Lys Ile Ala Asn Gly Phe
485 490 495
Met Ala Phe Ala Asp Ser Pro Leu Met Val Leu Ile Met Ile Asn Leu
500 505 510
Leu Leu Leu Phe Leu Gly Met Phe Ile Asp Ala Leu Ala Leu Gln Phe
515 520 525
Leu Val Leu Pro Met Leu Ile Pro Val Ala Ala Gln Phe Asn Ile Asp
530 535 540
Leu Ile Phe Phe Gly Val Met Thr Thr Leu Asn Met Met Ile Gly Ile
545 550 555 560
Leu Thr Pro Pro Met Gly Met Ala Leu Phe Val Val Ala Arg Val Gly
565 570 575
Lys Met Pro Val Ser Thr Val Thr Lys Gly Ala Ile Pro Phe Ile Ile
580 585 590
Pro Ile Phe Ile Thr Leu Val Ile Leu Thr Ile Phe Pro Gln Ile Val
595 600 605
Thr Phe Leu Pro Asn Phe Ile Met Arg
610 615
<210> 44
<211> 627
<212> PRT
<213> 多杀巴斯德氏菌多杀亚种OH4807
<400> 44
Met Lys Ile Ile Asn Lys Leu Glu Glu Trp Ile Gly Gly Val Met Phe
1 5 10 15
Ile Gly Ile Phe Leu Ile Leu Leu Ala Gln Ile Val Ala Arg Gln Ile
20 25 30
Phe His Ser Pro Phe Ile Trp Ser Glu Glu Leu Ala Arg Leu Leu Phe
35 40 45
Ile Tyr Val Gly Leu Leu Gly Ile Ser Met Gly Ile Arg Ser Gln Gln
50 55 60
His Val Tyr Ile Asp Phe Leu Thr Asn Phe Met Pro Glu Lys Val Arg
65 70 75 80
Arg Leu Ser Asn Ser Phe Val Gln Ile Leu Ile Phe Val Ser Ile Ile
85 90 95
Ile Phe Ile His Leu Gly Phe Lys Val Trp Leu Asp Ser Ser Phe Lys
100 105 110
Met Glu Ala Leu Thr Ala Phe Val Ser Asp Leu Val Gly Ser Glu Thr
115 120 125
Ile Val Ser Glu Lys Trp Met Tyr Ala Ala Leu Pro Phe Ile Ser Cys
130 135 140
Leu Met Leu Phe Arg Phe Leu Gln Ala Gln Val Glu Asn Tyr Arg Asn
145 150 155 160
Lys Leu Ser His Ile Pro Ala Ile Val Phe Ile Ile Ser Ala Val Ile
165 170 175
Leu Phe Ala Ile Leu Phe Ile Glu Pro Asp Trp Tyr Lys Ala Leu Arg
180 185 190
Ile Ser Asn Tyr Val Lys Phe Gly Ser Asp Ala Val Tyr Leu Thr Leu
195 200 205
Ile Ile Trp Leu Val Ile Met Phe Leu Gly Thr Pro Val Gly Trp Ser
210 215 220
Leu Phe Ile Ala Thr Leu Leu Tyr Phe Ser Met Thr Arg Trp Asn Ile
225 230 235 240
Val Asn Ser Ala Ser Ser Lys Leu Thr Asp Ser Leu Asn Ser Phe Pro
245 250 255
Leu Leu Ser Val Pro Phe Phe Ile Leu Thr Gly Ile Leu Met Asn Thr
260 265 270
Gly Gly Ile Thr Glu Arg Ile Phe Asn Phe Ala Arg Ala Leu Leu Gly
275 280 285
His Tyr Arg Gly Gly Met Gly His Val Asn Ile Gly Ala Ser Leu Ile
290 295 300
Phe Ser Gly Met Ser Gly Ser Ala Leu Ala Asp Ala Gly Gly Leu Gly
305 310 315 320
Gln Leu Glu Ile Lys Ala Met Arg Asp Ala Gly Tyr Asp Asp Asp Ile
325 330 335
Cys Gly Gly Ile Thr Ala Ala Ser Cys Ile Ile Gly Pro Leu Val Pro
340 345 350
Pro Ser Ile Ala Met Ile Ile Tyr Gly Val Ile Ala Asn Gln Ser Ile
355 360 365
Ala Lys Leu Phe Ile Ala Gly Phe Val Pro Gly Val Leu Val Thr Ile
370 375 380
Ala Leu Met Val Met Asn Tyr Tyr Val Ala Lys Lys Arg Gly Tyr Pro
385 390 395 400
Arg Thr Pro Lys Ala Thr Leu Glu Gln Arg Cys Gln Ala Phe Lys Lys
405 410 415
Ala Ile Trp Ala Val Leu Thr Pro Ile Leu Ile Ile Gly Gly Ile Phe
420 425 430
Ser Gly Leu Phe Thr Pro Thr Glu Ala Ala Val Ile Ala Ala Phe Tyr
435 440 445
Ser Ile Val Val Gly Met Phe Val Tyr Lys Glu Leu Asn Phe Lys Met
450 455 460
Leu Phe Lys Ser Cys Ile Glu Ala Met Ala Ile Thr Gly Val Thr Ala
465 470 475 480
Leu Met Val Met Thr Val Thr Phe Phe Gly Asp Met Ile Ala Arg Glu
485 490 495
Gln Val Ala Met Lys Ile Ala Glu Val Phe Val Ala Val Ala Asp Ser
500 505 510
Pro Thr Thr Val Leu Val Met Ile Asn Leu Leu Leu Leu Phe Leu Gly
515 520 525
Met Phe Ile Asp Ala Leu Ala Leu Gln Phe Leu Val Leu Pro Met Leu
530 535 540
Ile Pro Ile Ala Val His Phe Gly Ile Asp Leu Ile Phe Phe Gly Val
545 550 555 560
Met Thr Thr Leu Asn Met Met Ile Gly Ile Leu Thr Pro Pro Met Gly
565 570 575
Met Ala Leu Phe Val Val Ala Arg Val Gly Asn Met Pro Val Ser Thr
580 585 590
Val Ala Lys Gly Val Leu Pro Phe Leu Val Pro Ile Phe Val Thr Leu
595 600 605
Val Leu Ile Thr Ile Phe Pro Gln Ile Ile Thr Phe Ile Pro Asn Leu
610 615 620
Leu Met Pro
625
<210> 45
<211> 614
<212> PRT
<213> Pasteurella skyensis
<400> 45
Met Asn Met Leu Lys Lys Phe Glu Glu Trp Thr Gly Gly Ala Leu Leu
1 5 10 15
Leu Ile Ile Phe Ala Ile Leu Leu Ala Gln Ile Gly Ser Arg Leu Leu
20 25 30
Asn Ser Pro Leu Ile Trp Ser Glu Glu Leu Gly Arg Leu Ile Phe Val
35 40 45
Tyr Ala Gly Leu Leu Gly Ile Ser Ile Gly Val Arg Lys Gln Gln His
50 55 60
Ile Tyr Ile Asp Phe Ile Thr Asn Met Met Ser Asp Arg Val Lys Lys
65 70 75 80
Phe Ser Asn Ser Ile Ile Gln Leu Leu Ile Leu Ile Ser Ile Leu Phe
85 90 95
Phe Ile Lys Leu Gly Leu His Val Trp Asn Asp Ala Ser Phe Glu Met
100 105 110
Val Ser Leu Asn Ile Ser Glu Lys Trp Leu Phe Ala Pro Val Pro Phe
115 120 125
Ile Ser Leu Leu Ile Leu Ile Arg Phe Phe Glu Thr Gln Lys Glu Leu
130 135 140
Tyr Asp Ala Asn Leu Ser Tyr Ile Pro Pro Ile Phe Phe Val Ile Phe
145 150 155 160
Thr Val Gly Val Phe Val Leu Leu Phe Phe Phe Pro Glu Val Phe Asn
165 170 175
Leu Leu Arg Ile Ser Lys Tyr Val Arg Leu Gly Asn Asp Ala Val Tyr
180 185 190
Val Thr Leu Ile Val Trp Leu Val Ile Met Phe Leu Gly Thr Pro Val
195 200 205
Gly Trp Ser Leu Phe Ile Ala Thr Leu Ile Tyr Phe Ser Met Thr Arg
210 215 220
Trp Gly Val Val Tyr Ser Ala Ser Glu Lys Leu Ala Arg Ser Leu Asp
225 230 235 240
Ser Phe Val Leu Leu Ser Val Pro Phe Phe Ile Leu Thr Gly Val Leu
245 250 255
Met Asn Thr Gly Gly Ile Thr Glu Arg Ile Phe Asn Phe Ala Lys Ala
260 265 270
Met Leu Gly His His Val Gly Gly Met Gly His Val Asn Ile Gly Ala
275 280 285
Ser Leu Ile Phe Ser Gly Met Ser Gly Ser Ala Leu Ala Asp Ala Gly
290 295 300
Gly Leu Gly Gln Leu Glu Ile Lys Ala Met Arg Asp Ala Gly Tyr Asp
305 310 315 320
Asp Asp Ile Cys Gly Gly Ile Thr Ala Ala Ser Cys Ile Ile Gly Pro
325 330 335
Leu Val Pro Pro Ser Ile Ala Met Ile Ile Tyr Gly Val Ile Ala Asn
340 345 350
Glu Ser Ile Ala Lys Leu Phe Val Ala Gly Phe Val Pro Gly Ile Leu
355 360 365
Ile Thr Ile Ala Leu Met Val Met Asn Tyr Phe Val Ser Lys Lys Arg
370 375 380
Gly Tyr Lys Pro Thr Pro Lys Ala Ser Lys Gln Glu Arg Trp Glu Ala
385 390 395 400
Phe Arg Lys Ala Ile Trp Ala Ile Leu Thr Pro Ile Ile Ile Ile Gly
405 410 415
Gly Ile Phe Ser Gly Val Phe Thr Pro Thr Glu Ala Ala Val Ile Ala
420 425 430
Ala Leu Tyr Ser Ile Ile Ile Gly Met Phe Val Tyr Lys Glu Leu Thr
435 440 445
Leu Glu Leu Leu Phe Lys Gly Cys Ile Glu Thr Ile Ala Ile Thr Gly
450 455 460
Val Thr Val Leu Met Val Met Thr Val Thr Phe Phe Gly Asp Met Ile
465 470 475 480
Ala Arg Glu Gln Val Ala Met Arg Ile Ala Glu Gly Phe Met Ala Phe
485 490 495
Ala Asp Ser Gln Val Ser Val Leu Val Met Ile Asn Leu Leu Leu Leu
500 505 510
Phe Leu Gly Met Phe Ile Asp Ala Leu Ala Leu Gln Phe Leu Val Leu
515 520 525
Pro Met Leu Ile Pro Ile Ala Val His Phe Gly Ile Asp Leu Val Phe
530 535 540
Phe Gly Val Leu Thr Thr Leu Asn Met Met Ile Gly Ile Leu Thr Pro
545 550 555 560
Pro Met Gly Met Ala Leu Phe Val Val Ala Arg Val Gly Asn Met Thr
565 570 575
Val Ser Thr Val Thr Lys Gly Val Ile Pro Phe Ile Ile Pro Ile Phe
580 585 590
Ile Thr Leu Val Leu Ile Thr Ile Phe Pro Gln Ile Ile Thr Phe Ile
595 600 605
Pro Asn Leu Ile Met Pro
610
<210> 46
<211> 615
<212> PRT
<213> 猫嗜血杆菌
<400> 46
Met Lys Ile Ile Asn Lys Leu Glu Glu Trp Ile Gly Gly Val Leu Phe
1 5 10 15
Ile Leu Ile Phe Leu Ile Leu Leu Ala Gln Ile Val Ser Arg Gln Phe
20 25 30
Phe Asp Ser Pro Leu Ser Trp Ser Glu Glu Leu Ala Arg Leu Leu Phe
35 40 45
Val Tyr Val Gly Met Leu Gly Ile Ser Ile Gly Ile Arg Asn Gln Gln
50 55 60
His Val Phe Ile Asp Phe Val Thr Asn Trp Leu Pro Asp Ser Ile Lys
65 70 75 80
Arg Val Thr Asn Thr Leu Val Gln Leu Leu Ile Phe Val Cys Leu Ile
85 90 95
Gly Phe Ile His Phe Gly Leu Lys Leu Val Phe Lys Ala Glu Asn Glu
100 105 110
Leu Phe Ser Leu Gly Ile Ser Glu Lys Trp Leu Tyr Ile Thr Leu Pro
115 120 125
Ile Ile Ala Cys Leu Met Leu Val Arg Phe Phe Gln Ala Gln Tyr Asp
130 135 140
Asn Phe Lys Asn Asn Thr Thr Tyr Leu Pro Ala Thr Phe Phe Ile Ile
145 150 155 160
Leu Met Ala Ile Ala Leu Ala Ile Leu Tyr Phe Ser Pro Asp Thr Tyr
165 170 175
Lys Leu Leu Arg Leu Ser Asn Tyr Ala Lys Leu Gly Ser Asn Ala Val
180 185 190
Tyr Val Thr Leu Ile Phe Trp Leu Val Ile Met Phe Ile Gly Thr Pro
195 200 205
Val Gly Trp Ser Leu Met Ile Ser Thr Leu Leu Tyr Phe Ser Met Thr
210 215 220
Arg Trp Asn Leu Ser Gln Tyr Ala Ala Glu Lys Leu Val Ser Ser Leu
225 230 235 240
Asp Ser Phe Thr Leu Leu Ser Val Pro Phe Phe Ile Leu Thr Gly Ile
245 250 255
Leu Met Asn Thr Gly Gly Ile Thr Glu Arg Ile Phe Ser Phe Ala Arg
260 265 270
Thr Leu Leu Gly His Tyr Arg Gly Gly Met Gly His Val Asn Ile Gly
275 280 285
Ala Ser Leu Ile Phe Ser Gly Met Ser Gly Ser Ala Leu Ala Asp Ala
290 295 300
Gly Gly Leu Gly Gln Leu Glu Ile Lys Ala Met Arg Asp Ala Gly Tyr
305 310 315 320
Asp Asp Asp Ile Cys Gly Gly Ile Thr Ala Ala Ser Cys Ile Ile Gly
325 330 335
Pro Leu Val Pro Pro Ser Ile Ala Met Ile Ile Tyr Gly Val Ile Ser
340 345 350
Asn Gln Ser Ile Ala Lys Leu Phe Ile Ala Gly Phe Val Pro Gly Val
355 360 365
Leu Val Thr Ala Ala Leu Met Ala Met Asn Tyr Phe Val Ala Lys Lys
370 375 380
Arg Gly Tyr Pro Arg Ser Pro Lys Ala Thr Leu Leu Glu Arg Cys Asp
385 390 395 400
Ala Phe Lys Lys Ala Ile Trp Ala Val Leu Thr Pro Val Ile Ile Ile
405 410 415
Gly Gly Ile Phe Ser Gly Ile Phe Thr Pro Thr Glu Ala Ala Val Ile
420 425 430
Ala Ala Phe Tyr Ser Ile Val Ile Gly Met Phe Val Tyr Arg Glu Leu
435 440 445
Thr Leu Val Lys Leu Phe Gln Ser Cys Val Glu Ala Met Ala Ile Thr
450 455 460
Gly Val Thr Val Leu Met Val Met Thr Val Thr Phe Phe Gly Asp Met
465 470 475 480
Ile Ala Arg Glu Gln Val Ala Met Lys Ile Ala Asn Phe Phe Val Ser
485 490 495
Val Ala Asp Ser Pro Ile Met Val Leu Val Met Ile Asn Leu Leu Leu
500 505 510
Leu Phe Leu Gly Met Phe Ile Asp Ala Leu Ala Leu Gln Phe Leu Val
515 520 525
Leu Pro Met Leu Ile Pro Ile Ala Met His Phe Gly Ile Asp Leu Ile
530 535 540
Phe Phe Gly Val Met Thr Thr Leu Asn Met Met Ile Gly Ile Leu Thr
545 550 555 560
Pro Pro Met Gly Met Ala Leu Phe Val Val Ala Arg Val Gly Asn Met
565 570 575
Pro Val Ser Thr Val Ala Lys Gly Val Leu Pro Phe Leu Val Pro Ile
580 585 590
Phe Val Thr Leu Val Leu Ile Thr Ile Phe Pro Gln Ile Ile Thr Phe
595 600 605
Ile Pro Asn Leu Leu Met Pro
610 615
<210> 47
<211> 617
<212> PRT
<213> 变形菌纲细菌
<400> 47
Met Gln Phe Leu Lys Lys Leu Asn Lys Phe Glu Glu Tyr Leu Gly Gly
1 5 10 15
Thr Leu Phe Leu Ile Leu Phe Ala Leu Leu Ile Leu Gln Ile Val Met
20 25 30
Pro Leu Leu Gly Ser Pro Leu Ala Trp Ser Asp Glu Leu Ala Arg Phe
35 40 45
Ile Phe Val Tyr Val Gly Leu Leu Gly Val Ser Gln Gly Ile Lys Thr
50 55 60
Gln Gln His Val Leu Val Asp Phe Val Cys Asp Lys Leu Pro Ser Thr
65 70 75 80
Pro Lys Lys Val Val Phe Ser Gly Val Gln Val Ile Ile Phe Thr Cys
85 90 95
Leu Leu Leu Phe Ile Tyr Phe Gly Val Lys Leu Phe Ile Lys Ala Lys
100 105 110
Phe Pro Leu Gln Ser Leu Gly Ile Ser Glu Lys Trp Leu Tyr Leu Ala
115 120 125
Leu Pro Thr Ile Ser Val Leu Met Leu Ile Arg Phe Phe Gln Val Gln
130 135 140
Gln Gln Asn Val Lys Ala Gly Leu Ser Leu Ile Pro Ala Trp Val Phe
145 150 155 160
Val Gly Val Thr Val Val Ala Thr Ala Leu Phe Phe Tyr Asp Pro Asn
165 170 175
Ile Tyr Lys Val Leu Arg Leu Ser Lys Tyr Phe His Leu Gly Asp His
180 185 190
Ala Val Tyr Val Ala Leu Leu Val Trp Leu Val Ile Met Phe Leu Gly
195 200 205
Thr Pro Val Gly Trp Ser Leu Phe Ile Ala Ser Ile Val Tyr Phe Ser
210 215 220
Leu Thr Arg Trp Lys Leu Ser Val Phe Asp Ala Phe Ser Leu Val Asp
225 230 235 240
Ser Thr Asn Asn Phe Ile Leu Leu Ala Val Pro Phe Phe Val Leu Thr
245 250 255
Gly Ile Leu Met Asn Ser Ser Gly Ile Thr Glu Arg Ile Phe Asn Phe
260 265 270
Ala Lys Ala Met Leu Gly His His Val Gly Gly Met Gly His Val Asn
275 280 285
Ile Ser Ala Ser Leu Ile Phe Ser Gly Met Ser Gly Ser Ala Leu Ala
290 295 300
Asp Ala Gly Gly Leu Gly Gln Leu Glu Ile Lys Ala Met Arg Asp Ala
305 310 315 320
Gly Tyr Asp Asp Asp Leu Cys Gly Gly Ile Thr Ala Ala Ser Cys Ile
325 330 335
Ile Gly Pro Leu Val Pro Pro Ser Ile Ala Met Ile Ile Tyr Gly Val
340 345 350
Ile Ala Asn Gln Ser Ile Ala Lys Leu Phe Leu Ala Gly Phe Val Pro
355 360 365
Gly Val Met Leu Thr Ile Thr Leu Met Met Met Asn Ala Tyr Leu Cys
370 375 380
Lys Lys Arg Ala Tyr Pro Leu Ala Pro Lys Ala Ser Ser Ala Glu Arg
385 390 395 400
Lys Val Ala Phe Lys Lys Ala Phe Leu Pro Leu Leu Thr Pro Ile Ile
405 410 415
Ile Ile Gly Gly Ile Phe Ser Gly Ile Phe Thr Pro Thr Glu Ser Ala
420 425 430
Val Val Ala Ala Leu Tyr Ser Val Val Leu Gly Phe Tyr Tyr Gly Glu
435 440 445
Leu Asn Leu Lys Lys Leu Phe Asp Asn Ala Val Glu Ala Met Ala Val
450 455 460
Ser Gly Val Ile Val Leu Met Val Met Thr Val Thr Tyr Phe Gly Lys
465 470 475 480
Met Ile Ala Arg Glu Gln Val Ala Met Gln Val Ala Glu Gly Phe Met
485 490 495
Ser Val Ala Thr Thr Thr Val Met Val Leu Ile Met Ile Asn Leu Leu
500 505 510
Leu Leu Phe Leu Gly Met Phe Ile Asp Ala Leu Ala Leu Gln Phe Leu
515 520 525
Val Leu Pro Met Leu Ile Pro Ile Ala Gln Gln Phe Asp Ile Asp Leu
530 535 540
Ile Phe Phe Gly Val Met Thr Thr Leu Asn Met Met Ile Gly Ile Leu
545 550 555 560
Thr Pro Pro Met Gly Met Ala Leu Phe Val Val Ala Arg Val Gly Asn
565 570 575
Met Thr Val Ser Thr Val Thr Lys Gly Val Ile Pro Phe Ile Ile Pro
580 585 590
Ile Phe Leu Thr Leu Val Leu Ile Thr Ile Phe Pro Glu Val Val Thr
595 600 605
Phe Ile Pro Asn Leu Val Met Gly Lys
610 615
<210> 48
<211> 615
<212> PRT
<213> Pasteurella mairii
<400> 48
Met Lys Phe Ile Asn Lys Leu Glu Glu Trp Leu Gly Gly Gly Leu Leu
1 5 10 15
Leu Ile Ile Phe Ala Ile Leu Val Ala Gln Ile Val Ala Arg Gln Ile
20 25 30
Phe Asp Ser Pro Ile Ile Trp Ser Glu Glu Leu Ala Arg Leu Leu Phe
35 40 45
Ile Tyr Ala Gly Leu Phe Gly Ile Ser Met Ala Ile Arg Ser Gln Gln
50 55 60
His Val Tyr Ile Asp Phe Ile Thr Asn Leu Met Ser Glu Arg Ile Arg
65 70 75 80
Arg Ala Ala Asn Ser Phe Val Gln Thr Leu Ile Phe Ile Ser Val Val
85 90 95
Leu Phe Val His Leu Gly Phe Lys Thr Trp Ala Asp Ala Ser Phe Glu
100 105 110
Met Val Ser Leu Gly Ile Ser Glu Lys Trp Leu Tyr Ala Gly Leu Pro
115 120 125
Phe Ile Ser Ile Leu Met Phe Tyr Arg Phe Leu Gln Ala Gln Ser Glu
130 135 140
Asn Tyr Asn Asn Lys Phe Thr Tyr Leu Pro Ala Ile Phe Tyr Val Ile
145 150 155 160
Ser Ala Val Ile Ile Phe Thr Ile Leu Phe Phe Gln Pro Asp Trp Phe
165 170 175
Lys Val Leu Arg Ile Ser Asn Tyr Met Lys Leu Gly Ser Ser Ala Val
180 185 190
Tyr Val Val Leu Ala Val Trp Leu Ile Ile Met Phe Leu Gly Thr Pro
195 200 205
Val Gly Trp Ser Leu Phe Ile Ala Thr Leu Leu Tyr Phe Ala Met Thr
210 215 220
Arg Trp Asn Val Val Asn Ser Ala Ser Asn Lys Leu Val Asp Ser Leu
225 230 235 240
Asn Ser Phe Pro Leu Leu Ser Val Pro Phe Phe Ile Leu Thr Gly Ile
245 250 255
Leu Met Asn Thr Gly Gly Ile Thr Thr Lys Ile Phe Thr Phe Ala Lys
260 265 270
Ala Leu Leu Gly His Tyr Thr Gly Gly Met Gly His Val Asn Ile Gly
275 280 285
Ala Ser Leu Ile Phe Ser Gly Met Ser Gly Ser Ala Leu Ala Asp Ala
290 295 300
Gly Gly Leu Gly Gln Leu Glu Ile Lys Ala Met Arg Asp Ala Gly Tyr
305 310 315 320
Asp Asp Asp Ile Cys Gly Gly Ile Thr Ala Ala Ser Cys Ile Ile Gly
325 330 335
Pro Leu Val Pro Pro Ser Ile Ala Met Ile Ile Tyr Gly Val Ile Ala
340 345 350
Asn Glu Ser Ile Ala Lys Leu Phe Ile Ala Gly Phe Val Pro Gly Val
355 360 365
Leu Val Thr Ile Ala Leu Met Met Met Asn Tyr Phe Val Ser Lys Lys
370 375 380
Arg Gly Tyr Pro Lys Thr Arg Lys Ala Thr Arg Glu Glu Leu Cys Lys
385 390 395 400
Ala Phe Lys Glu Ser Ile Trp Ala Ile Leu Thr Pro Ile Leu Ile Ile
405 410 415
Gly Gly Ile Phe Ser Gly Leu Phe Thr Pro Thr Glu Ala Ala Val Phe
420 425 430
Ala Ala Ala Tyr Ser Met Ile Val Gly Lys Phe Val Tyr Lys Glu Leu
435 440 445
Ser Leu Gln Ser Leu Phe Lys Ser Cys Val Glu Thr Ile Ser Ile Thr
450 455 460
Gly Val Thr Ala Leu Met Val Met Thr Val Thr Phe Phe Gly Asp Met
465 470 475 480
Ile Ala Arg Glu Gln Val Ala Met Arg Ile Gly Glu Ala Phe Val Ala
485 490 495
Ile Ala Asp Ser Pro Thr Met Val Leu Val Met Ile Asn Leu Leu Leu
500 505 510
Leu Phe Leu Gly Met Phe Ile Asp Ala Leu Ala Leu Gln Phe Leu Val
515 520 525
Leu Pro Met Leu Ile Pro Ile Ala Gln Gln Phe Gly Ile Asp Leu Val
530 535 540
Phe Phe Gly Val Met Thr Thr Leu Asn Met Met Ile Gly Ile Leu Thr
545 550 555 560
Pro Pro Met Gly Met Ala Leu Phe Val Val Ala Arg Val Gly Asn Met
565 570 575
Thr Val Ser Thr Val Thr Lys Gly Val Leu Pro Phe Leu Val Pro Ile
580 585 590
Phe Val Thr Leu Val Leu Ile Thr Leu Phe Pro Gln Ile Ile Thr Phe
595 600 605
Ile Pro Asn Leu Leu Met Pro
610 615
<210> 49
<211> 615
<212> PRT
<213> 产吲哚萨顿氏菌
<400> 49
Met Lys Ala Leu Asn Lys Leu Glu Glu Trp Ile Gly Gly Ser Leu Phe
1 5 10 15
Leu Leu Ile Phe Gly Ile Leu Ile Phe Gln Ile Ile Ala Arg Glu Ile
20 25 30
Leu Asp Ser Pro Leu Ile Trp Ser Glu Glu Ala Ala Arg Leu Ile Phe
35 40 45
Val Tyr Val Gly Met Leu Gly Ile Ser Met Gly Ile Arg Ser Gln Gln
50 55 60
His Val Gln Ile Asp Phe Ile Ser Asn Arg Leu Pro Pro Lys Ile Lys
65 70 75 80
Val Ala Val Phe Ser Ile Ile Gln Leu Leu Ile Phe Ser Cys Leu Leu
85 90 95
Leu Phe Ile His Tyr Gly Ile Val Leu Met Lys Arg Pro Pro Asp Gln
100 105 110
Leu Val Ala Leu Gly Ile Ser Thr Lys Tyr Leu Tyr Leu Gly Leu Pro
115 120 125
Leu Ile Ala Gly Leu Met Leu Leu Arg Phe Phe Gln Thr Gln Gln Glu
130 135 140
Asn Phe Ala Asn Lys Ala Ala Trp Phe Pro Ala Trp Leu Tyr Ile Ala
145 150 155 160
Leu Ala Val Ala Phe Phe Ala Ile Leu Phe Phe Ala Pro Glu Trp Phe
165 170 175
Lys Tyr Leu Arg Ile Ser Asp Tyr Val Lys Phe Gly Lys Asp Ser Val
180 185 190
Tyr Ile Val Leu Leu Ile Trp Leu Val Leu Met Phe Leu Gly Met Pro
195 200 205
Val Gly Trp Ser Leu Phe Ile Thr Thr Val Leu Phe Phe Ser Met Thr
210 215 220
Arg Trp Asn Thr Gly Asn Phe Ala Ala Ala Lys Leu Val Asp Ser Val
225 230 235 240
Asn Ser Phe Ser Leu Leu Ser Val Pro Phe Phe Ile Leu Thr Gly Ile
245 250 255
Leu Met Asn Ser Ala Gly Val Thr Thr Arg Ile Phe Asn Phe Ala Arg
260 265 270
Ala Met Leu Gly His Trp Thr Gly Gly Met Gly His Val Asn Ile Gly
275 280 285
Ala Ser Leu Ile Phe Ser Gly Met Ser Gly Ser Ala Leu Ala Asp Ala
290 295 300
Gly Gly Leu Gly Gln Leu Glu Ile Lys Ala Met Arg Asp Glu Gly Tyr
305 310 315 320
His Asp Asp Leu Cys Gly Gly Ile Thr Ala Ala Ser Cys Ile Ile Gly
325 330 335
Pro Leu Val Pro Pro Ser Ile Thr Met Ile Ile Tyr Gly Val Ile Ala
340 345 350
Asn Val Ser Ile Ala Lys Leu Phe Leu Ala Gly Phe Val Pro Gly Val
355 360 365
Leu Leu Thr Ile Ala Leu Met Leu Met Asn Ala Tyr Ile Cys Lys Lys
370 375 380
Arg Gly Tyr Arg Lys Ala Val Lys Ala Thr Arg Ser Glu Arg Ile Ser
385 390 395 400
Ser Phe Lys Ser Ser Phe Trp Ala Leu Leu Thr Pro Leu Leu Ile Ile
405 410 415
Gly Gly Ile Phe Ser Gly Phe Phe Thr Pro Thr Glu Ala Ala Val Ile
420 425 430
Ala Ala Leu Tyr Ser Thr Val Leu Gly Phe Val Tyr Arg Glu Leu Asn
435 440 445
Met Ala Gly Leu Phe Lys Ser Cys Val Glu Ala Met Ala Met Ser Gly
450 455 460
Val Thr Ile Leu Met Val Met Thr Val Thr Phe Phe Gly Asp Met Ile
465 470 475 480
Ala Arg Glu Arg Val Ala Ile Gln Val Ala Glu Gly Phe Val Ala Phe
485 490 495
Ala Asp Ser Ala Leu Met Val Leu Leu Leu Ile Asn Leu Leu Leu Leu
500 505 510
Phe Leu Gly Met Phe Ile Asp Ala Leu Ala Leu Gln Phe Leu Val Leu
515 520 525
Pro Met Leu Ile Pro Ile Ala Gln Tyr Tyr Asn Ile Asp Leu Val Phe
530 535 540
Phe Gly Val Met Thr Thr Leu Asn Met Met Ile Gly Ile Leu Thr Pro
545 550 555 560
Pro Met Gly Met Ala Leu Phe Val Val Ala Arg Ala Gly Asn Met Ser
565 570 575
Val Ser Thr Val Thr Lys Gly Val Leu Pro Phe Leu Ile Pro Ile Ala
580 585 590
Leu Thr Leu Val Leu Ile Thr Ile Phe Pro Ser Ile Ile Thr Phe Leu
595 600 605
Pro Asn Leu Ile Met Gly Glu
610 615
<210> 50
<211> 617
<212> PRT
<213> 犬梭杆菌
<400> 50
Met Lys Val Phe Asn Lys Leu Glu Glu Trp Leu Gly Gly Ser Leu Phe
1 5 10 15
Ile Gly Met Phe Val Val Leu Val Met Gln Ile Phe Ser Arg Gln Val
20 25 30
Phe Asn Ser Pro Leu Ile Trp Ser Glu Glu Leu Ser Arg Leu Ile Phe
35 40 45
Val Tyr Val Gly Leu Leu Gly Val Ser Met Gly Ile Arg Ser Gln Gln
50 55 60
His Ile Met Ile Asp Phe Leu Tyr Ala Lys Phe Pro Lys Ser Met Gln
65 70 75 80
Lys Ile Ile Phe Thr Ile Ile Gln Ile Leu Ile Leu Ala Cys Leu Ile
85 90 95
Phe Phe Leu Tyr Phe Gly Tyr Asp Leu Phe Ile Lys Lys Glu Glu Ile
100 105 110
Asp Ile Val Ser Leu Gly Ile Ser Met Lys Trp Met Tyr Leu Ala Leu
115 120 125
Pro Leu Ile Thr Leu Leu Met Leu Val Arg Phe Tyr Gln Ala Tyr Ser
130 135 140
Glu Asn Tyr Ala Gln Asn Lys Val Tyr Ile Lys Pro Ile Phe Ile Leu
145 150 155 160
Ala Leu Ile Ile Ile Leu Val Leu Ile Ala Phe Ile Arg Pro Glu Leu
165 170 175
Phe Lys Val Leu Lys Leu Ser Asn Tyr Phe Asp Phe Gly Glu Met Thr
180 185 190
Ile Tyr Tyr Val Leu Ile Ala Trp Leu Val Met Ile Phe Phe Gly Val
195 200 205
Pro Val Gly Trp Ser Leu Leu Val Ala Cys Ile Leu Tyr Phe Ala Leu
210 215 220
Thr Arg Trp Lys Val Val Tyr Phe Ala Ala Asp Lys Leu Val Tyr Ser
225 230 235 240
Leu Asp Ser Phe Ser Leu Leu Ser Val Pro Phe Phe Ile Leu Thr Gly
245 250 255
Ile Leu Met Asn Gly Ala Gly Ile Thr Glu Arg Ile Phe Asn Phe Ala
260 265 270
Lys Ala Met Leu Gly His Tyr Thr Gly Gly Met Gly His Val Asn Val
275 280 285
Ala Ala Ser Leu Ile Phe Ser Gly Met Ser Gly Ser Ala Ile Ala Asp
290 295 300
Ala Gly Gly Leu Gly Gln Leu Glu Ile Lys Ala Met Arg Asp Glu Gly
305 310 315 320
Tyr Asp Asp Asp Ile Cys Gly Gly Leu Thr Ala Ala Ser Cys Ile Ile
325 330 335
Gly Pro Leu Val Pro Pro Ser Ile Ser Met Ile Ile Tyr Gly Val Ile
340 345 350
Ala Asn Gln Ser Ile Ala Lys Leu Phe Leu Ala Gly Phe Val Pro Gly
355 360 365
Phe Leu Thr Thr Ile Ala Leu Met Val Met Asn Tyr Phe Val Cys Lys
370 375 380
Lys Arg Gly Tyr Lys Lys Thr Ala Lys Ala Ser Pro Lys Glu Arg Trp
385 390 395 400
Ile Ala Phe Lys Lys Ser Phe Trp Ala Leu Leu Thr Pro Ile Leu Ile
405 410 415
Ile Gly Gly Ile Phe Ser Gly Ile Phe Thr Pro Thr Glu Ala Ala Val
420 425 430
Ile Ala Thr Phe Tyr Ser Ile Ile Leu Gly Gly Phe Ile Tyr Lys Glu
435 440 445
Leu Thr Val Lys Ser Phe Phe Lys His Cys Val Glu Ala Val Ala Ile
450 455 460
Ser Gly Val Thr Val Leu Met Ile Met Thr Val Thr Phe Phe Gly Asp
465 470 475 480
Ile Ile Ala Arg Glu Gln Val Ala Met Arg Val Ala Glu Ile Phe Ile
485 490 495
Lys Tyr Ala Thr Ser Pro Met Met Val Leu Val Met Ile Asn Leu Leu
500 505 510
Leu Leu Phe Leu Gly Met Phe Ile Asp Ala Leu Ala Leu Gln Phe Leu
515 520 525
Val Leu Pro Met Leu Ile Pro Ile Ala Glu Gln Val Gly Ile Asp Leu
530 535 540
Val Phe Phe Gly Val Met Thr Thr Leu Asn Met Met Ile Gly Ile Leu
545 550 555 560
Thr Pro Pro Met Gly Met Ala Leu Phe Val Val Ala Gln Val Gly Lys
565 570 575
Met Asn Val Ser Thr Val Thr Lys Gly Val Phe Pro Phe Leu Leu Pro
580 585 590
Ile Phe Ile Thr Leu Val Ile Ile Thr Ile Phe Pro Gln Ile Ile Leu
595 600 605
Phe Leu Pro Asn Leu Ile Val Gly Gly
610 615
<210> 51
<211> 617
<212> PRT
<213> 变形梭杆菌
<400> 51
Met Lys Val Phe Asp Lys Leu Glu Glu Trp Ile Gly Gly Thr Leu Phe
1 5 10 15
Val Cys Met Phe Ile Ile Leu Val Met Gln Ile Val Ala Arg Gln Val
20 25 30
Leu Gly Thr Pro Leu Met Trp Ser Glu Glu Leu Ser Ser Leu Leu Phe
35 40 45
Val Tyr Val Gly Met Leu Gly Ile Ser Met Gly Ile Arg Asn Gln Gln
50 55 60
His Val Leu Ile Asp Phe Leu Cys Ser Arg Phe Ser Pro Lys Met Gln
65 70 75 80
Lys Ile Ala Phe Thr Ile Val Gln Ile Ile Ile Phe Ile Ser Ile Ile
85 90 95
Phe Met Gly Tyr Leu Gly Asn Asn Leu Tyr Lys Lys Lys Trp Ile Phe
100 105 110
Glu Leu Val Ser Leu Lys Ile Ser Ala Gly Trp Met Tyr Ile Ala Leu
115 120 125
Pro Ile Ile Ala Ile Leu Met Met Val Arg Phe Phe Gln Ala Tyr Lys
130 135 140
Glu Asn Tyr Asp Asn Lys Lys Val Ile Leu His Pro Gly Ile Phe Leu
145 150 155 160
Ala Ala Leu Val Ile Ile Ile Gly Leu Ile Ile Tyr Asp Pro Lys Ile
165 170 175
Phe Arg Leu Phe Arg Leu Ala Asn Tyr Tyr Lys Leu Gly Pro Ile Ala
180 185 190
Gly Tyr Val Thr Ile Val Val Trp Leu Val Met Ile Phe Met Gly Val
195 200 205
Pro Val Gly Trp Ser Leu Met Ala Ala Thr Ile Phe Tyr Phe Ser Ile
210 215 220
Thr Lys Trp Asn Val Ile Tyr Phe Ala Ser Ala Lys Leu Val Asp Ser
225 230 235 240
Leu Asn Ser Phe Ser Leu Leu Ser Val Pro Phe Phe Val Leu Thr Gly
245 250 255
Ile Leu Met Asn Gly Ser Gly Ile Thr Glu Arg Ile Phe Asn Phe Ala
260 265 270
Lys Ala Leu Leu Gly His Phe Thr Gly Gly Met Gly His Val Asn Val
275 280 285
Ala Ala Ser Leu Ile Phe Ser Gly Met Ser Gly Ser Ala Ile Ala Asp
290 295 300
Ala Gly Gly Leu Gly Gln Leu Glu Ile Lys Ala Met Arg Asp Ala Gly
305 310 315 320
Tyr Asp Asp Asp Ile Cys Gly Gly Ile Thr Ala Ala Ser Cys Ile Ile
325 330 335
Gly Pro Leu Val Pro Pro Ser Ile Ser Met Ile Val Tyr Gly Val Ile
340 345 350
Ala Asn Gln Ser Ile Ala Lys Leu Phe Leu Ala Gly Phe Val Pro Gly
355 360 365
Val Leu Thr Thr Ile Ala Leu Met Ile Met Asn Tyr Phe Ile Cys Lys
370 375 380
Lys Arg Gly Tyr Lys Lys Ala Lys Lys Ala Thr Phe Lys Glu Gln Val
385 390 395 400
Glu Ala Phe Lys Lys Ser Phe Trp Ala Leu Ile Thr Pro Phe Ile Ile
405 410 415
Ile Gly Gly Ile Phe Ser Gly Leu Phe Thr Pro Thr Glu Ala Ala Val
420 425 430
Val Ala Ala Ala Tyr Ser Val Phe Leu Gly Ala Phe Ile Tyr Lys Glu
435 440 445
Leu Thr Val Arg Ser Phe Phe Lys His Cys Val Glu Ala Met Ala Ile
450 455 460
Ser Gly Val Thr Val Leu Met Ile Ile Thr Val Thr Phe Phe Gly Asp
465 470 475 480
Met Ile Ala Arg Glu Gln Ile Ala Met Lys Ile Ala Ala Gly Phe Met
485 490 495
Lys Tyr Ala Ser Ser Pro Leu Thr Val Leu Val Met Ile Asn Leu Leu
500 505 510
Leu Leu Phe Leu Gly Met Phe Ile Asp Ala Leu Ala Leu Gln Phe Leu
515 520 525
Val Leu Pro Met Leu Ile Pro Val Ala Asp Lys Val Gly Ile Asp Leu
530 535 540
Val Phe Phe Gly Val Met Thr Thr Leu Asn Met Met Ile Gly Ile Leu
545 550 555 560
Thr Pro Pro Met Gly Met Ala Leu Phe Val Val Ala Gln Val Gly Lys
565 570 575
Met Ser Val Ser Thr Val Thr Lys Gly Val Leu Pro Phe Leu Ile Pro
580 585 590
Ile Phe Ile Thr Leu Val Phe Ile Thr Val Phe Pro Gly Ile Ile Thr
595 600 605
Phe Leu Pro Asn Leu Ile Met Gly Gly
610 615
<210> 52
<211> 617
<212> PRT
<213> 坏死梭杆菌
<400> 52
Met Lys Phe Phe Asn Lys Leu Glu Glu Trp Ile Gly Gly Thr Leu Phe
1 5 10 15
Val Gly Met Phe Ile Val Leu Val Leu Gln Ile Ile Ser Arg Gln Ile
20 25 30
Leu Asp Asp Pro Leu Ile Trp Ser Glu Glu Leu Ala Arg Leu Phe Phe
35 40 45
Val Tyr Val Gly Met Leu Gly Ile Ser Met Gly Ile Arg Thr Gln Ser
50 55 60
His Val Met Ile Asp Phe Val Tyr Ala Arg Leu Pro Lys Lys Leu Gln
65 70 75 80
Lys Val Ile Phe Thr Gly Ile Gln Ile Ile Ile Phe Leu Cys Ile Ser
85 90 95
Ser Phe Ser Tyr Phe Gly Tyr Leu Leu Ile Glu Lys Lys Ala Asp Ile
100 105 110
Glu Leu Val Ser Leu Gly Ile Ser Ala Lys Trp Met Tyr Ile Ala Leu
115 120 125
Pro Val Ile Ser Ile Leu Met Leu Ile Arg Phe Phe Gln Ala Tyr Gln
130 135 140
Glu Asn Trp Glu Lys Glu Lys Val Leu Ile Ser Pro Lys Ile Ile Leu
145 150 155 160
Gly Phe Met Ile Leu Phe Met Ala Leu Leu Ile Phe Gln Pro Ser Val
165 170 175
Phe Lys Ile Phe Lys Met Thr Gln Tyr Phe Lys Leu Arg Gly Asn Ser
180 185 190
Val Tyr Val Ala Leu Gly Leu Trp Leu Ile Leu Ile Phe Ala Gly Val
195 200 205
Pro Val Gly Trp Ser Leu Leu Ala Ser Ser Met Val Tyr Phe Ser Met
210 215 220
Thr Lys Trp Ala Val Ala Tyr Phe Ala Ser Ser Lys Phe Val Asp Ser
225 230 235 240
Val Asp Ser Phe Ser Leu Leu Ser Val Pro Phe Phe Ile Leu Thr Gly
245 250 255
Ile Leu Met Asn Gly Ser Gly Ile Thr Glu Arg Ile Phe Tyr Phe Ala
260 265 270
Lys Ala Ser Leu Gly His Tyr Thr Gly Gly Met Gly His Val Asn Val
275 280 285
Ala Ala Ser Leu Ile Phe Ser Gly Met Ser Gly Ser Ala Ile Ala Asp
290 295 300
Ala Gly Gly Leu Gly Gln Leu Glu Ile Lys Ala Met Arg Asp Glu Gly
305 310 315 320
Tyr Asp Asp Asp Ile Cys Gly Gly Ile Thr Ala Ala Ser Cys Ile Ile
325 330 335
Gly Pro Leu Val Pro Pro Ser Ile Ser Met Ile Ile Tyr Gly Val Ile
340 345 350
Ala Asn Gln Ser Ile Ala Lys Leu Phe Leu Ala Gly Phe Val Pro Gly
355 360 365
Val Leu Thr Thr Ile Ala Leu Met Ile Met Asn Tyr Phe Val Cys Lys
370 375 380
Lys Arg Gly Tyr Lys Lys Ala Lys Lys Cys Thr Pro Lys Glu Arg Trp
385 390 395 400
Glu Ala Phe Lys Lys Ala Phe Trp Ala Leu Leu Thr Pro Ile Ile Ile
405 410 415
Ile Gly Gly Ile Phe Ser Gly Met Phe Thr Pro Thr Glu Ala Ala Val
420 425 430
Val Ala Ala Leu Tyr Ser Val Ile Leu Gly Met Phe Ile Tyr Lys Glu
435 440 445
Leu Thr Trp Lys Gly Leu Phe Gln His Cys Val Glu Ala Met Ala Ile
450 455 460
Ser Gly Val Thr Val Leu Met Ile Ile Thr Val Thr Phe Phe Gly Asp
465 470 475 480
Met Ile Ala Arg Glu Gln Val Ala Met Lys Ile Ala Glu Leu Phe Ile
485 490 495
Gln Phe Ala Ser Ser Pro Leu Thr Val Leu Val Met Ile Asn Leu Leu
500 505 510
Leu Leu Phe Leu Gly Met Phe Ile Asp Ala Leu Ala Leu Gln Phe Leu
515 520 525
Val Leu Pro Met Leu Ile Pro Val Ala Glu Gln Val Gly Ile Asp Leu
530 535 540
Val Phe Phe Gly Val Met Thr Thr Leu Asn Met Met Ile Gly Ile Leu
545 550 555 560
Thr Pro Pro Met Gly Met Ala Leu Phe Val Val Ala Gln Val Gly Lys
565 570 575
Met Pro Val Ser Thr Val Thr Lys Gly Val Leu Pro Phe Leu Leu Pro
580 585 590
Ile Phe Ile Thr Leu Val Val Ile Thr Leu Phe Pro Gln Ile Ile Ile
595 600 605
Phe Leu Pro Asn Leu Ile Met Gly Ala
610 615
<210> 53
<211> 615
<212> PRT
<213> 人心杆菌
<400> 53
Met Lys Val Leu Asn Lys Leu Glu Glu Trp Val Gly Gly Ser Leu Phe
1 5 10 15
Leu Leu Ile Phe Val Ile Leu Val Ala Gln Ile Phe Phe Arg Gln Val
20 25 30
Leu His His Pro Leu Ile Trp Ser Glu Glu Ala Ala Arg Leu Leu Phe
35 40 45
Val Tyr Val Gly Met Leu Gly Val Ser Ile Gly Ile Arg Ser Gln Gln
50 55 60
His Val Leu Ile Asp Phe Ile Thr Ser His Leu Pro Ala Thr Leu Arg
65 70 75 80
Val Trp Val Phe Ser Leu Ala Gln Leu Ile Ile Phe Ser Ala Ile Leu
85 90 95
Leu Leu Phe Tyr Tyr Gly Val Thr Val Phe Thr Lys Ala Ser Asp Gln
100 105 110
Leu Val Ser Leu Gly Ile Ser Asn Lys Trp Leu Tyr Leu Ser Leu Pro
115 120 125
Val Cys Ala Val Leu Met Phe Phe Arg Phe Leu Gln Ala Gln Gln Glu
130 135 140
Asn Tyr Arg Lys Gly Asp Ser Arg Ile Pro Val Trp Val Tyr Met Val
145 150 155 160
Leu Ala Ala Ala Val Leu Leu Val Ala Phe Ile Glu Pro Ser Trp Phe
165 170 175
Asn Ala Leu Arg Ile Ser Glu Tyr Val Lys Phe Gly Lys Ser Ser Val
180 185 190
Tyr Val Ala Leu Ile Ile Trp Leu Val Ile Met Phe Ala Gly Val Pro
195 200 205
Val Gly Trp Ser Leu Phe Ile Ala Ala Val Leu Phe Phe Ser Met Thr
210 215 220
Arg Trp Gly Thr Gly Asn Phe Ala Ala Thr Lys Leu Val Asp Ser Val
225 230 235 240
Asn Ser Phe Gly Leu Leu Ser Val Pro Phe Phe Ile Leu Thr Gly Ile
245 250 255
Leu Met Asn Ser Ala Gly Ile Thr Thr Arg Ile Phe Asn Phe Ala Leu
260 265 270
Ala Met Leu Gly His Tyr Thr Gly Gly Met Gly His Val Asn Ile Ala
275 280 285
Ala Ser Leu Ile Phe Ser Gly Met Ser Gly Ser Ala Leu Ala Asp Ala
290 295 300
Gly Gly Leu Gly Gln Leu Glu Ile Lys Ala Met Arg Asp Ala Gly Tyr
305 310 315 320
Glu Asp Asp Leu Cys Gly Gly Ile Thr Ala Ala Ser Cys Ile Ile Gly
325 330 335
Pro Leu Val Pro Pro Ser Ile Ala Met Ile Ile Tyr Gly Val Ile Ala
340 345 350
Asp Val Ser Ile Ala Lys Leu Phe Leu Ala Gly Phe Val Pro Gly Val
355 360 365
Leu Leu Thr Ile Leu Leu Met Val Met Asn Thr Ile Val Cys Lys Lys
370 375 380
Arg Gly Tyr Gly Lys Ala Pro Lys Thr Ser Ala Ala Glu Arg Arg Arg
385 390 395 400
Ala Phe Lys Gln Ala Phe Trp Pro Leu Leu Thr Pro Ile Leu Ile Ile
405 410 415
Gly Gly Ile Phe Ser Gly Ala Phe Thr Pro Thr Glu Ala Ala Val Ile
420 425 430
Ala Ala Leu Tyr Ser Ile Ile Leu Gly Met Phe Val Tyr Arg Glu Leu
435 440 445
Thr Pro Ala Gly Leu Phe Thr Cys Cys Val Glu Ala Met Ala Ile Thr
450 455 460
Gly Val Thr Val Leu Met Val Met Thr Val Thr Phe Phe Gly Asp Met
465 470 475 480
Ile Ala Arg Glu Arg Val Ala Met Gln Val Ala Ser Gly Phe Met Thr
485 490 495
Phe Ala Asp Asn Thr Leu Met Val Leu Leu Met Ile Asn Leu Leu Leu
500 505 510
Leu Phe Leu Gly Met Phe Ile Asp Ala Leu Ala Leu Gln Phe Leu Val
515 520 525
Leu Pro Met Leu Ile Pro Ile Ala Gln Gln Phe Asn Ile Asp Leu Val
530 535 540
Phe Phe Gly Val Met Thr Thr Leu Asn Met Met Ile Gly Ile Leu Thr
545 550 555 560
Pro Pro Met Gly Met Ala Leu Phe Val Val Ala Arg Val Gly Asn Met
565 570 575
Ser Val Ser Thr Val Thr Arg Gly Val Ile Pro Phe Ile Ile Pro Ile
580 585 590
Ala Leu Cys Leu Leu Leu Ile Thr Leu Phe Pro Gly Ile Val Thr Phe
595 600 605
Leu Pro Asn Leu Ile Met Gly
610 615
<210> 54
<211> 616
<212> PRT
<213> 伴放线放线杆菌RhAA1
<400> 54
Met Lys Ile Phe Asn Lys Leu Glu Glu Trp Ile Gly Gly Val Leu Phe
1 5 10 15
Leu Val Ile Phe Cys Ile Leu Val Leu Gln Ile Leu Phe Arg Gln Ala
20 25 30
Phe His Ser Pro Leu Ile Trp Ser Glu Glu Leu Ala Lys Leu Leu Phe
35 40 45
Val Tyr Val Gly Met Leu Gly Ile Ser Val Ala Ile Arg Lys Gln Glu
50 55 60
His Val Tyr Ile Asp Phe Leu Thr Asn Leu Met Pro Pro Thr Ile Lys
65 70 75 80
Lys Val Val Asn Ser Phe Val Gln Leu Val Ile Phe Leu Gly Val Ile
85 90 95
Phe Phe Ile His Phe Gly Ile Lys Thr Phe Ala Gly Ala Gly Phe Pro
100 105 110
Ile Asp Ala Leu Gly Gly Ile Ser Glu Lys Trp Ile Tyr Ala Ser Leu
115 120 125
Pro Ile Ile Ser Val Leu Met Leu Ile Arg Phe Phe Gln Ala Gln Ala
130 135 140
Asp Asn Phe Lys Asp Asn Lys Ser Tyr Leu Pro Ala Thr Phe Phe Ile
145 150 155 160
Ile Ser Ala Val Ile Leu Leu Gly Ile Leu Phe Ala Thr Pro Glu Trp
165 170 175
Tyr Lys Ala Leu Arg Ile Thr Glu Tyr Val Lys Phe Gly Ser Asn Ala
180 185 190
Val Tyr Val Ala Leu Val Phe Trp Leu Val Ile Met Phe Leu Gly Val
195 200 205
Pro Val Gly Trp Ser Leu Phe Ile Thr Thr Leu Leu Tyr Phe Ser Met
210 215 220
Thr Arg Trp Asn Val Val Asn Ala Ala Ser Glu Lys Leu Thr Met Ser
225 230 235 240
Leu Asp Ser Phe Pro Leu Leu Ala Val Pro Phe Tyr Ile Leu Thr Gly
245 250 255
Ile Leu Met Asn Thr Gly Gly Ile Thr Thr Arg Ile Phe Asp Phe Ala
260 265 270
Lys Thr Leu Leu Gly His Tyr Thr Gly Gly Met Gly His Val Asn Ile
275 280 285
Gly Ala Ser Leu Leu Phe Ser Gly Met Ser Gly Ser Ala Leu Ala Asp
290 295 300
Ala Gly Gly Leu Gly Gln Leu Glu Ile Lys Ala Met Arg Asp Ala Gly
305 310 315 320
Tyr Asp Asp Asp Val Cys Gly Gly Ile Thr Ala Ala Ser Cys Ile Ile
325 330 335
Gly Pro Leu Val Pro Pro Ser Ile Ala Met Ile Ile Tyr Gly Val Ile
340 345 350
Ala Asn Glu Ser Ile Ala Lys Leu Phe Ile Ala Gly Phe Ile Pro Gly
355 360 365
Val Leu Val Thr Ile Ala Leu Met Gly Met Asn Tyr Tyr Ile Ala Lys
370 375 380
Lys Arg Arg Tyr Pro Lys Thr Ser Lys Thr Thr Arg Ala His Leu Cys
385 390 395 400
Thr Ser Phe Lys Gly Ala Phe Trp Ala Ile Leu Thr Pro Leu Leu Ile
405 410 415
Ile Gly Gly Ile Phe Ser Gly Leu Phe Ser Pro Thr Glu Ser Ala Val
420 425 430
Val Ala Ala Phe Tyr Ser Ile Ile Ile Gly Lys Phe Val Tyr Lys Glu
435 440 445
Leu Thr Leu Lys Met Leu Phe Asn Ser Cys Val Glu Ala Met Ala Ile
450 455 460
Thr Gly Val Val Ala Leu Met Ile Met Thr Val Thr Phe Phe Gly Asp
465 470 475 480
Met Ile Ala Arg Glu Gln Val Ala Met Arg Ile Ala Asp Val Phe Val
485 490 495
Ala Val Ala Asp Ser Pro Leu Met Val Leu Val Met Ile Asn Ala Leu
500 505 510
Leu Leu Phe Leu Gly Met Phe Ile Asp Ala Leu Ala Leu Gln Phe Leu
515 520 525
Val Leu Pro Met Leu Ile Pro Ile Ala Met Gln Phe Gly Ile Asp Leu
530 535 540
Val Phe Phe Gly Val Met Thr Thr Leu Asn Met Met Ile Gly Ile Leu
545 550 555 560
Thr Pro Pro Met Gly Met Ala Leu Phe Val Val Ala Arg Val Gly Asn
565 570 575
Met Ser Val Ser Thr Val Thr Lys Gly Val Leu Pro Phe Leu Val Pro
580 585 590
Ile Phe Ile Thr Leu Val Leu Ile Thr Ile Phe Pro Gln Ile Ile Thr
595 600 605
Phe Val Pro Asn Leu Leu Ile Pro
610 615
<210> 55
<211> 615
<212> PRT
<213> 贝氏巴斯德氏菌CCUG 2042
<400> 55
Met Lys Ile Phe Asn Lys Leu Glu Glu Trp Ile Gly Gly Val Ile Phe
1 5 10 15
Leu Val Ile Phe Ala Ile Leu Ile Ala Gln Ile Ala Ala Arg Gln Ile
20 25 30
Phe Asp Ala Pro Leu Ser Trp Ser Glu Glu Leu Ala Arg Leu Leu Phe
35 40 45
Val Tyr Ile Ser Met Leu Gly Ile Ser Met Ala Ile Arg Ser Gln Gln
50 55 60
His Val Phe Ile Asp Phe Ile Thr Asn Leu Phe Pro Thr Lys Leu Lys
65 70 75 80
Lys Val Thr Asn Ser Phe Val Gln Ile Leu Ile Phe Ile Ser Ile Leu
85 90 95
Met Leu Ala His Phe Gly Tyr Lys Asn Phe Val Glu Asn Ser Phe Glu
100 105 110
Ile Val Ser Leu Gly Ile Ser Glu Lys Trp Leu Tyr Ala Ser Leu Pro
115 120 125
Phe Ile Ser Ile Leu Met Phe Ile Arg Phe Ile Gln Ala Gln Ser Asp
130 135 140
Asn Lys Arg Glu Asn Leu Thr Tyr Leu Gly Pro Val Phe Tyr Leu Val
145 150 155 160
Leu Ala Ala Val Leu Ile Ala Ile Tyr Leu Ile Asn Pro Asp Phe Tyr
165 170 175
Lys Ile Phe Arg Ile Thr Asn Tyr Val Lys Leu Gly Ala Asp Ser Val
180 185 190
Tyr Val Val Leu Val Val Trp Leu Val Ile Met Phe Leu Gly Thr Pro
195 200 205
Val Gly Trp Ser Leu Leu Ile Ala Thr Leu Leu Tyr Phe Ala Met Thr
210 215 220
Arg Trp Asn Val Ser Asn Ser Ala Ser Ile Lys Leu Val Glu Ser Leu
225 230 235 240
Asn Ser Phe Pro Leu Leu Ser Val Pro Phe Phe Ile Leu Thr Gly Ile
245 250 255
Leu Met Asn Ser Gly Gly Ile Thr Glu Arg Ile Phe Asn Phe Ala Lys
260 265 270
Ala Leu Leu Gly His Tyr Thr Gly Gly Met Gly His Val Asn Ile Gly
275 280 285
Ala Ser Leu Ile Phe Ser Gly Met Ser Gly Ser Ala Leu Ala Asp Ala
290 295 300
Gly Gly Leu Gly Gln Leu Glu Ile Lys Ala Met Arg Asp Asn Gly Tyr
305 310 315 320
Asp Asp Asp Ile Cys Gly Gly Ile Thr Ala Ala Ser Cys Ile Ile Gly
325 330 335
Pro Leu Val Pro Pro Ser Ile Ser Met Ile Ile Tyr Gly Val Ile Ser
340 345 350
Asn Gln Ser Ile Ala Lys Leu Phe Val Ala Gly Phe Val Pro Gly Val
355 360 365
Leu Val Thr Ile Ala Leu Met Ile Met Asn His Tyr Val Ser Lys Arg
370 375 380
Arg Gly Tyr Ala Arg Thr Pro Lys Ala Thr Leu Glu Glu Arg Cys Gln
385 390 395 400
Ala Phe Lys Lys Ala Ile Trp Ala Val Leu Thr Pro Val Leu Ile Ile
405 410 415
Gly Gly Ile Phe Ser Gly Leu Phe Thr Pro Thr Glu Ala Ala Val Ile
420 425 430
Ser Ala Leu Tyr Ser Thr Ile Ile Gly Met Phe Val Tyr Lys Glu Leu
435 440 445
Asp Leu Lys Gly Leu Phe Lys Ser Cys Val Glu Ala Leu Ala Ile Thr
450 455 460
Gly Val Thr Val Leu Met Val Met Thr Val Thr Phe Phe Gly Asp Met
465 470 475 480
Ile Ala Arg Glu Gln Val Ala Met Arg Ile Gly Glu Met Phe Met Ser
485 490 495
Val Ala Asp Ser Gln Leu Met Val Leu Val Met Ile Asn Leu Leu Leu
500 505 510
Leu Phe Leu Gly Met Phe Ile Asp Ala Leu Ala Leu Gln Phe Leu Val
515 520 525
Leu Pro Met Leu Ile Pro Ile Ala Val Gln Phe Asp Ile Asp Leu Ile
530 535 540
Phe Phe Gly Val Met Thr Leu Leu Asn Met Met Ile Gly Ile Leu Thr
545 550 555 560
Pro Pro Met Gly Met Ala Leu Phe Val Val Ala Arg Val Gly Asn Met
565 570 575
Ser Val Ser Thr Val Thr Lys Gly Val Leu Pro Phe Leu Ile Pro Ile
580 585 590
Phe Ile Thr Leu Val Leu Ile Thr Leu Phe Pro Gln Ile Ile Thr Phe
595 600 605
Ile Pro Asn Leu Ile Met Pro
610 615
<210> 56
<211> 529
<212> PRT
<213> 副兔嗜血菌
<400> 56
Met Thr His Ser Phe Glu Leu Asn Glu Ser Arg Arg His Phe Met Lys
1 5 10 15
Leu Leu Ala Gly Val Gly Ala Gly Val Ala Phe Ser Gly Ser Leu Gly
20 25 30
Ala Phe Ser Ser Asn Ala Leu Ala Lys Ala Thr Ala Gly Ser Ser Ile
35 40 45
Glu Ala Gly Ile Ala Tyr Pro Ile Ser Thr Gly Phe Asp Pro Leu Thr
50 55 60
Ser Ser Gly Ala Ser Ser Leu Ala Ala Asn Leu His Ile Phe Glu Gly
65 70 75 80
Leu Val Asp Leu His Pro Ala Thr Arg Gln Pro Tyr Leu Ala Leu Ala
85 90 95
Ala Lys Glu Pro Glu Gln Lys Asp Glu Val Thr Tyr His Ile Thr Leu
100 105 110
Arg Glu Gly Ala Thr Phe His Asp Gly Lys Pro Val Thr Thr Ala Asp
115 120 125
Val Val Tyr Ser Phe Glu Arg Val Leu Asp Pro Ala Lys Ala Ser Leu
130 135 140
Phe Ser Gln Phe Ile Pro Phe Ile Glu Ser Val Lys Ala Val Asp Asp
145 150 155 160
Lys Val Val Glu Phe Lys Leu Lys Tyr Pro Phe Ala Leu Phe Lys Glu
165 170 175
Arg Leu Thr Ile Val Lys Ile Val Pro Lys His Leu Ile Glu Glu Lys
180 185 190
Gly Gln Ala Ala Phe Asp Ala Asn Pro Val Gly Ser Gly Pro Tyr Gln
195 200 205
Phe Val Ser Ala Thr Lys Asp Asp Arg Ile Val Phe Lys Ala Phe Glu
210 215 220
Ala Tyr Asn Gly Leu Tyr Pro Ala Lys Val Glu Lys Met Thr Trp Phe
225 230 235 240
Leu Leu Ser Asp Asp Ala Ala Arg Val Thr Ala Gln Glu Ser Asn Arg
245 250 255
Val Gln Ala Ile Glu Ser Val Pro Tyr Leu Asp Ala Glu Arg Leu Lys
260 265 270
Arg Arg Gln Thr Val Glu Ser Val Gln Ser Phe Gly Leu Leu Phe Leu
275 280 285
Met Phe Asn Cys Glu Lys Ala Pro Phe Asn Asn Pro Lys Val Arg Gln
290 295 300
Ala Leu His Tyr Gly Leu Asp Thr Gln Lys Leu Ile Asp Ile Val Phe
305 310 315 320
Leu Gly Asn Ala Lys Ala Ala Thr Ser Tyr Val Gln Asp Thr His Pro
325 330 335
Gly Tyr Thr Lys Ala Lys Ala Gln Tyr Asp Phe Asp Lys Ala Lys Ala
340 345 350
Glu Ala Leu Leu Lys Glu Ala Gly Val Thr Glu Leu Ser Phe Glu Leu
355 360 365
Leu Ala Thr Asp His Ser Trp Val Lys Glu Cys Ala Pro Leu Ile Leu
370 375 380
Glu Ser Trp Asn Ser Leu Asn Gly Val Lys Val Thr Leu Lys His Leu
385 390 395 400
Gln Ser Gly Ala Leu Tyr Gly Ser Phe Val Asp Thr Gly Asn Tyr Glu
405 410 415
Val Val Ile Ala Pro Gly Asp Pro Ser Val Phe Gly Asn Asp Leu Asp
420 425 430
Leu Leu Leu Ser Trp Trp Tyr Arg Gly Asp Val Trp Pro Lys Lys Arg
435 440 445
Phe Arg Trp Ser Asn Thr Pro Glu Tyr Ala Glu Val Gln Thr Ala Leu
450 455 460
Asp Asn Ala Val Arg Ala Lys Ser Asn Glu Glu Ala Lys Ala Glu Trp
465 470 475 480
Asp Lys Ala Ile Asn Ile Ile Ala Glu Gln Val Pro Leu Tyr Pro Ile
485 490 495
Leu His Arg Lys Leu Pro Ser Ala Trp Asn Asp Lys Ser Leu Thr Asp
500 505 510
Phe Gln Pro Leu Pro Thr Thr Gly Leu Ser Phe Leu Gly Val Gly Arg
515 520 525
Lys
<210> 57
<211> 317
<212> PRT
<213> 副兔嗜血菌
<400> 57
Met Glu Ile Val Leu Arg Leu Leu Leu Arg Arg Leu Met Ala Leu Pro
1 5 10 15
Val Met Met Leu Gly Val Thr Ala Leu Val Phe Ile Val Leu Gln Phe
20 25 30
Thr Pro Gly Asp Pro Ala Thr Val Ala Leu Gly Glu Ser Ala Thr Glu
35 40 45
Ala Ala Lys Ala Leu Trp Arg Glu Gln Arg Gly Leu Asn Asp Pro Leu
50 55 60
Ile Val Gln Tyr Phe Arg Phe Ile Gly Asn Leu Leu Gln Phe Asp Phe
65 70 75 80
Gly Val Thr Thr Pro Pro Glu Gln Pro Ile Val Asp Met Ile Ala Lys
85 90 95
Ala Phe Pro Leu Thr Leu Gln Leu Thr Leu Ile Gly Val Phe Leu Ala
100 105 110
Ala Ile Val Ser Phe Thr Leu Gly Val Thr Ala Ala Leu Tyr Arg Asp
115 120 125
Arg Leu Val Asp Gln Ile Ile Arg Leu Ile Ser Val Ala Ala Val Ala
130 135 140
Thr Pro Ser Phe Trp Leu Gly Ile Leu Leu Ile Gln Trp Phe Ser Leu
145 150 155 160
Asn Leu Asp Trp Phe Pro Ser Gly Gly Phe Val Pro Phe Ser Glu Ser
165 170 175
Pro Ser Glu Tyr Phe Ser Ser Met Val Leu Pro Ser Leu Ala Leu Ala
180 185 190
Val Pro Val Cys Ala Ser Leu Ile Arg Val Val Arg Thr Thr Met Val
195 200 205
Glu Glu Met Asp Lys Asp Tyr Val Arg Thr Ala Ile Gly Asn Gly Val
210 215 220
Pro Tyr Ser Thr Val Ile Arg His Asn Val Leu Arg Asn Ala Leu Ile
225 230 235 240
Thr Pro Val Thr Val Leu Gly Leu Arg Val Gly Tyr Leu Leu Gly Gly
245 250 255
Ala Val Val Ile Glu Gln Ile Phe Asp Leu Pro Gly Met Gly Lys Leu
260 265 270
Ile Phe Asn Gly Ile Val Asn His Asp Leu Asn Leu Val Gln Gly Val
275 280 285
Val Leu Thr Ile Ala Phe Thr Phe Val Val Val Asn Ile Ile Val Asp
290 295 300
Ile Leu Tyr Leu Leu Ile Asn Pro Lys Ile Arg Ser Leu
305 310 315
<210> 58
<211> 651
<212> PRT
<213> 副兔嗜血菌
<400> 58
Met Phe Arg Gln Gly Leu Ala Glu Arg Leu Ala Ser Gly Gly Ala Arg
1 5 10 15
Phe Lys Ala Leu Ser Thr Ser Ala Lys Ile Ala Leu Leu Phe Ile Leu
20 25 30
Phe Val Ala Phe Val Ala Ile Phe Ala Pro Phe Val Ala Thr Phe Asp
35 40 45
Pro Leu Gln Thr Leu Arg Pro Val Gln Ala Pro Ser Gly Glu Tyr Leu
50 55 60
Phe Gly Thr Asp Arg Leu Gly Arg Asp Ile Phe Ser Arg Met Val Trp
65 70 75 80
Gly Ala Arg Thr Ser Leu Phe Ile Gly Leu Gly Ala Val Gly Cys Ala
85 90 95
Ile Ile Phe Gly Gly Ile Leu Gly Ala Thr Ala Ala Thr Ala Gln Lys
100 105 110
Trp Gly Asn Glu Ile Ile Met Arg Leu Met Asp Ile Leu Met Ala Phe
115 120 125
Pro Gly Ile Ala Leu Ala Ala Val Leu Leu Ala Thr Phe Gly Asn Ser
130 135 140
Val Pro Val Ile Ile Ile Thr Ile Ala Val Val Tyr Thr Pro Gln Leu
145 150 155 160
Ala Arg Val Val Arg Ala Asn Val Val Ala Gln Trp Glu Glu Asp Tyr
165 170 175
Val Arg Ala Glu Arg Val Leu Gly Gly Ser Arg Thr Tyr Ile Leu Leu
180 185 190
Lys His Val Val Arg Asn Thr Ala Ala Pro Val Leu Val Phe Ala Thr
195 200 205
Val Met Val Ala Asp Ala Ile Val Phe Glu Ala Ser Leu Ser Phe Leu
210 215 220
Gly Ala Gly Val Gln Pro Pro Phe Pro Ser Trp Gly Asn Ile Leu Ser
225 230 235 240
Glu Gly Arg Asn Leu Val Leu Ser Gly Phe Trp Trp Ala Thr Thr Phe
245 250 255
Ala Gly Leu Met Ile Leu Leu Thr Val Leu Ala Leu Asn Ile Leu Ala
260 265 270
Glu Gly Leu Thr Asp Ala Leu Val Asn Pro Lys Leu Lys Arg Thr Pro
275 280 285
Gln Ser Lys Glu Asn Arg Ala Glu Lys Pro Leu Ala Thr Asp Val Gln
290 295 300
Glu Ala Met Ala Glu Ser Leu Ala Leu Lys Arg Tyr Leu Met Gln Leu
305 310 315 320
Asn Gln Arg Glu Thr Thr Arg Asn Asp Arg Met Gln Leu Asn Pro Asn
325 330 335
Ala Lys Pro Ile Leu Gln Val Lys Asn Leu Ser Ile Arg Phe Pro Asn
340 345 350
Arg Tyr Gly Glu Ile Pro Leu Val Asp Asn Ile Ser Phe Thr Val His
355 360 365
Glu Gly Glu Thr Met Gly Leu Val Gly Glu Ser Gly Cys Gly Lys Ser
370 375 380
Ile Thr Ala Phe Ser Ile Met Gly Leu Leu Pro Lys Thr Ala Lys Ile
385 390 395 400
Thr Gly Glu Ile Leu Phe Thr Asp Arg Ala Gly Asn Gln His Asp Leu
405 410 415
Leu Lys Ser Ala Asp Leu Asn Arg Leu Arg Gly His Glu Ile Ala Met
420 425 430
Ile Tyr Gln Asp Ala Leu Ser Ala Leu Asn Pro Ser Met Arg Ile Lys
435 440 445
Asp Gln Met Ala Gln Leu Ile Ser Arg Gly Gly Lys Gln Thr Ala Glu
450 455 460
Thr Leu Leu Glu Trp Val Lys Leu Asp Pro Ala Lys Thr Leu Asn Arg
465 470 475 480
Tyr Pro His Glu Leu Ser Gly Gly Gln Arg Gln Arg Val Leu Ile Ala
485 490 495
Met Ala Leu Ala Arg Glu Pro Lys Leu Leu Ile Ala Asp Glu Pro Thr
500 505 510
Thr Ala Leu Asp Val Thr Val Gln Ala Glu Val Ile Lys Leu Leu Asn
515 520 525
Glu Leu Arg Glu Lys Leu Gly Phe Ala Met Val Phe Val Ser His Asp
530 535 540
Leu Ala Leu Val Ala Gln Ile Ala His His Ile Thr Val Met Tyr Ala
545 550 555 560
Gly Gln Val Val Glu Ala Ala Pro Thr Ser Pro Leu Leu Ala Asn Pro
565 570 575
Thr His Glu Tyr Thr Arg Gly Leu Leu Gly Ser Val Leu Ser Thr Glu
580 585 590
Ala Arg Ala Lys Arg Leu Tyr Gln Ile Pro Gly Ser Val Pro Ser Pro
595 600 605
Phe Asp Phe Ala Lys Gly Asp Arg Phe Ala Ser Arg Ser Leu Arg Pro
610 615 620
Asp Ala Asn Pro Asp Lys Arg Leu Lys Leu Val Pro Thr Ala Asp His
625 630 635 640
Pro Lys His Leu Trp Ala Ser His Leu Glu Asp
645 650
<210> 59
<211> 268
<212> PRT
<213> 副兔嗜血菌
<400> 59
Met Ser Met Lys Phe Ile Gln Pro Asn Asn Ile Ile Asp Met Thr Asp
1 5 10 15
Ile Val Val Gln Phe Pro Ser Arg Asp Gly Ser Leu Phe Asn Arg Lys
20 25 30
Lys Ile Thr Ala Val Asn Gly Val Asn Phe Ser Val Ala Ala Gly Glu
35 40 45
Thr Val Gly Ile Val Gly Glu Ser Gly Cys Gly Lys Ser Thr Leu Ala
50 55 60
Ser Val Met Ile Gly Leu Gln Lys Pro Thr Ser Gly Leu Val Lys Phe
65 70 75 80
Asn Gly Leu Gln Met Gln Tyr Gly Ser Ala Glu Ala Arg Lys Gln Phe
85 90 95
Gly Arg Gln Val Ser Val Ile Phe Gln Asp Pro Ala Thr Ala Leu Asn
100 105 110
Pro Arg Met Arg Val Leu Asp Ile Leu Lys Asp Pro Leu Asp Ile His
115 120 125
Asn Ile Leu Gln Pro His Glu Arg Glu Lys Arg Val Tyr Glu Leu Leu
130 135 140
Ser Arg Val Gly Leu Pro Arg Ser Ala Ala Leu Val Glu Pro Thr Arg
145 150 155 160
Leu Ser Gly Gly Gln Lys Gln Arg Val Ala Ile Ala Arg Ala Leu Ala
165 170 175
Leu Asn Pro Lys Leu Ile Val Ala Asp Glu Pro Thr Ser Ala Leu Asp
180 185 190
Val Ser Val Arg Ala Gln Val Leu Asn Leu Leu Ala Asp Leu Lys Lys
195 200 205
Glu Leu Asn Leu Ala Met Val Phe Ile Ser His Asp Ile Gln Thr Val
210 215 220
Arg Gln Val Ser Asp Lys Ile Val Val Met Tyr Ala Gly Gln Ile Val
225 230 235 240
Glu Ser Gly Thr Val Glu Gln Ile Phe Glu Asn Pro Lys Met Asp Tyr
245 250 255
Thr Lys Arg Leu Leu Gly Ala Ala Pro Ser Leu Leu
260 265
<210> 60
<211> 299
<212> PRT
<213> 幽门螺杆菌UA1234
<400> 60
Met Ala Phe Lys Val Val Gln Ile Cys Gly Gly Leu Gly Asn Gln Met
1 5 10 15
Phe Gln Tyr Ala Phe Ala Lys Ser Leu Gln Lys His Ser Asn Thr Pro
20 25 30
Val Leu Leu Asp Ile Thr Ser Phe Asp Trp Ser Asn Arg Lys Met Gln
35 40 45
Leu Glu Leu Phe Pro Ile Asp Leu Pro Tyr Ala Ser Glu Lys Glu Ile
50 55 60
Ala Ile Ala Lys Met Gln His Leu Pro Lys Leu Val Arg Asn Val Leu
65 70 75 80
Lys Cys Met Gly Phe Asp Arg Val Ser Gln Glu Ile Val Phe Glu Tyr
85 90 95
Glu Pro Lys Leu Leu Lys Thr Ser Arg Leu Thr Tyr Phe Tyr Gly Tyr
100 105 110
Phe Gln Asp Pro Arg Tyr Phe Asp Ala Ile Ser Pro Leu Ile Lys Gln
115 120 125
Thr Phe Thr Leu Pro Pro Pro Pro Glu Asn Gly Asn Asn Lys Lys Lys
130 135 140
Glu Glu Glu Tyr His Arg Lys Leu Ala Leu Ile Leu Ala Ala Lys Asn
145 150 155 160
Ser Val Phe Val His Ile Arg Arg Gly Asp Tyr Val Gly Ile Gly Cys
165 170 175
Gln Leu Gly Ile Asp Tyr Gln Lys Lys Ala Leu Glu Tyr Met Ala Lys
180 185 190
Arg Val Pro Asn Met Glu Leu Phe Val Phe Cys Glu Asp Leu Glu Phe
195 200 205
Thr Gln Asn Leu Asp Leu Gly Tyr Pro Phe Met Asp Met Thr Thr Arg
210 215 220
Asp Lys Glu Glu Glu Ala Tyr Trp Asp Met Leu Leu Met Gln Ser Cys
225 230 235 240
Lys His Gly Ile Ile Ala Asn Ser Thr Tyr Ser Trp Trp Ala Ala Tyr
245 250 255
Leu Ile Asn Asn Pro Glu Lys Ile Ile Ile Gly Pro Lys His Trp Leu
260 265 270
Phe Gly His Glu Asn Ile Leu Cys Lys Glu Trp Val Lys Ile Glu Ser
275 280 285
His Phe Glu Val Lys Ser Gln Lys Tyr Asn Ala
290 295
<210> 61
<211> 223
<212> PRT
<213> 多杀巴斯德氏菌
<400> 61
Met Thr Asn Ile Ala Ile Ile Pro Ala Arg Ala Gly Ser Lys Gly Ile
1 5 10 15
Pro Asp Lys Asn Leu Gln Pro Val Gly Gly His Ser Leu Ile Gly Arg
20 25 30
Ala Ile Leu Ala Ala Lys Asn Ala Asp Val Phe Asp Met Ile Val Val
35 40 45
Thr Ser Asp Gly Asp Asn Ile Leu Arg Glu Ala Glu Lys Tyr Gly Ala
50 55 60
Leu Ala Leu Lys Arg Pro Ala Glu Leu Ala Gln Asp Asn Ser Arg Thr
65 70 75 80
Ile Asp Ala Ile Leu His Ala Leu Glu Ser Leu Asn Ile Arg Glu Gly
85 90 95
Thr Cys Thr Leu Leu Gln Pro Thr Ser Pro Leu Arg Asp His Leu Asp
100 105 110
Ile Lys Asn Ala Met Asp Met Tyr Val Asn Gly Gly Val His Ser Val
115 120 125
Val Ser Ala Cys Glu Cys Glu His His Pro Tyr Lys Ala Phe Ala Leu
130 135 140
Ser Lys Asp His Glu Val Leu Pro Val Arg Glu Ile Ala Asp Phe Glu
145 150 155 160
Ala Ala Arg Gln Thr Leu Pro Lys Met Tyr Arg Ala Asn Gly Ala Ile
165 170 175
Tyr Ile Asn Asp Ile Ala Gln Leu Leu Lys Glu Lys Tyr Phe Phe Ile
180 185 190
Pro Pro Leu Lys Phe Tyr Leu Met Pro Thr Tyr Arg Ser Val Asp Ile
195 200 205
Asp Val Lys Gln Asp Leu Glu Leu Ala Glu Ile Leu Ser Asn Lys
210 215 220
<210> 62
<211> 224
<212> PRT
<213> 流感嗜血菌
<400> 62
Met Thr Arg Ile Ala Ile Ile Pro Ala Arg Ala Gly Ser Lys Gly Ile
1 5 10 15
Lys Asp Lys Asn Leu Gln Leu Val Gly Gly Val Ser Leu Val Gly Arg
20 25 30
Ala Ile Leu Ala Ala Gln Glu Ser Gly Met Phe Asp Gln Ile Val Val
35 40 45
Thr Ser Asp Gly Glu Asn Ile Leu Lys Glu Ala Thr Lys Tyr Gly Ala
50 55 60
Lys Ala Val Ala Arg Pro Glu Ser Leu Ala Gln Ser Asp Thr Arg Thr
65 70 75 80
Ile Asp Ala Ile Leu His Cys Leu Glu Thr Leu Asn Ile Ser Gln Gly
85 90 95
Thr Ala Ala Leu Leu Gln Pro Thr Ser Pro Leu Arg Asn Ala Leu Asp
100 105 110
Ile Arg Asn Ala Met Glu Ile Phe Leu Gly Gly Lys Tyr Lys Ser Val
115 120 125
Val Ser Ala Cys Glu Cys Glu His His Pro Tyr Lys Ser Phe Thr Leu
130 135 140
Glu Gly Thr Glu Val Gln Pro Ile His Glu Leu Thr Asp Phe Glu Ala
145 150 155 160
Pro Arg Gln Lys Leu Pro Lys Ser Tyr Arg Ala Asn Gly Ala Ile Tyr
165 170 175
Thr Asn Asp Ile Gln Ser Leu Phe Glu Glu Lys Arg Phe Phe Ile Ala
180 185 190
Pro Met Arg Phe Tyr Leu Met Pro Thr Tyr Arg Ser Ile Asp Ile Asp
195 200 205
Ser Thr Leu Asp Leu Gln Leu Ala Glu Ser Leu Ile Ser Lys Glu Phe
210 215 220
<210> 63
<211> 348
<212> PRT
<213> Syntrophorhabdus sp. PtaU1.Bin058
<400> 63
Met Glu Ser Phe Ser Phe Gly Lys Ser Thr Val Ser Lys Asn Gly Pro
1 5 10 15
Cys Tyr Ile Ile Ala Glu Ile Gly Asn Asn His Gln Gly Asp Leu Lys
20 25 30
Ile Ala Leu Lys Met Ile Lys Thr Ala Ala Gly Met Gly Val Asn Ala
35 40 45
Val Lys Phe Gln Lys Arg Asp Asn Arg Thr Leu Tyr Thr Lys Ser Met
50 55 60
Tyr Asn Lys Pro Tyr Glu Asn Glu Asn Ser Tyr Gly Ser Thr Tyr Gly
65 70 75 80
Glu His Arg Asp Tyr Leu Glu Phe Cys Trp Asp Lys Tyr Val Glu Met
85 90 95
Lys Lys Cys Ala Glu Asp Asn Asp Val Glu Phe Met Cys Thr Ala Phe
100 105 110
Asp Phe Lys Ser Val Asp Phe Leu Glu Gln Leu Gly Ile Thr Ser Tyr
115 120 125
Lys Val Ala Ser Gly Asp Val Thr Asn Thr Pro Leu Leu Glu Tyr Ile
130 135 140
Ala Gln Thr Lys Lys Pro Met Phe Val Ser Thr Gly Gly Ala Thr Leu
145 150 155 160
Glu Glu Ile Arg Val Ala Tyr Asp Thr Val Thr Lys Tyr Asn Asp Arg
165 170 175
Val Cys Leu Leu His Cys Val Ala Gly Tyr Pro Thr Glu Tyr Glu Tyr
180 185 190
Leu Asn Leu Asn Thr Ile Asn Ile Leu Lys Lys Glu Phe Pro Asp Thr
195 200 205
Leu Ile Gly Tyr Ser Gly His Asp Tyr Gly Ile Leu Ala Pro Val Val
210 215 220
Ala Tyr Met Leu Gly Ala Val Val Val Glu Lys His Phe Thr Leu Asn
225 230 235 240
Arg Ala Trp Lys Gly Thr Asp His Lys Phe Ser Leu Glu Pro Thr Gly
245 250 255
Leu Tyr Lys Met Thr Arg Asp Leu Arg Arg Val Asp Val Ser Ile Gly
260 265 270
Asn Gly Lys Lys Val Val His Ala Phe Glu Lys Asp Pro Ile Ser Lys
275 280 285
Met Ser Lys Ser Leu Tyr Ala Ser Arg Lys Leu Gln Ala Gly Arg Val
290 295 300
Leu Thr Ala Asp Asp Ile Ser Ile Lys Ser Pro Gly Gly Gly Ile Pro
305 310 315 320
Pro Tyr Lys Met Glu Glu Val Leu Gly Lys Met Leu Lys Ile Asn Leu
325 330 335
Pro Glu Glu Ala Leu Phe Ser Phe Asp Tyr Phe Glu
340 345
<210> 64
<211> 308
<212> PRT
<213> 多杀巴斯德氏菌多杀亚种Pm70菌株
<400> 64
Met Asn Leu Ile Ile Cys Cys Thr Pro Leu Gln Val Leu Ile Ala Glu
1 5 10 15
Lys Ile Ile Ala Lys Phe Pro His Met Pro Phe Tyr Gly Val Met Leu
20 25 30
Ser Thr Val Ser Asn Lys Lys Phe Asp Phe Tyr Ala Lys Arg Leu Ala
35 40 45
Gln Gln Cys Gln Gly Phe Phe Ser Met Val Gln His Lys Asp Arg Phe
50 55 60
Asn Leu Leu Lys Glu Ile Leu Tyr Leu Lys Arg Thr Phe Ser Gly Lys
65 70 75 80
His Phe Asp Gln Val Phe Val Ala Asn Ile Asn Asp Leu Gln Ile Gln
85 90 95
Phe Leu Leu Ser Ala Ile Asp Phe Asn Leu Leu Asn Thr Phe Asp Asp
100 105 110
Gly Thr Ile Asn Ile Val Pro Asn Ser Leu Phe Tyr Gln Asp Asp Pro
115 120 125
Ala Thr Leu Gln Arg Lys Leu Ile Asn Val Leu Leu Gly Asn Lys Tyr
130 135 140
Ser Ile Gln Ser Leu Arg Ala Leu Ser His Thr His Tyr Thr Ile Tyr
145 150 155 160
Lys Gly Phe Lys Asn Ile Ile Glu Arg Val Glu Pro Ile Glu Leu Val
165 170 175
Ala Ala Asp Asn Ser Glu Lys Val Thr Ser Ala Val Ile Asn Val Leu
180 185 190
Leu Gly Gln Pro Val Phe Ala Glu Asp Glu Arg Asn Ile Ala Leu Ala
195 200 205
Glu Arg Val Ile Lys Gln Phe Asn Ile His Tyr Tyr Leu Pro His Pro
210 215 220
Arg Glu Lys Tyr Arg Leu Ala Gln Val Asn Tyr Ile Asp Thr Glu Leu
225 230 235 240
Ile Phe Glu Asp Tyr Ile Leu Gln Gln Cys Gln Thr His Lys Tyr Cys
245 250 255
Val Tyr Thr Tyr Phe Ser Ser Ala Ile Ile Asn Ile Met Asn Lys Ser
260 265 270
Asp Asn Ile Glu Val Val Ala Leu Lys Ile Asp Thr Glu Asn Pro Ala
275 280 285
Tyr Asp Ala Cys Tyr Asp Leu Phe Asp Glu Leu Gly Val Asn Val Ile
290 295 300
Asp Ile Arg Glu
305
<210> 65
<211> 371
<212> PRT
<213> 脑膜炎奈瑟氏菌
<400> 65
Met Gly Leu Lys Lys Ala Cys Leu Thr Val Leu Cys Leu Ile Val Phe
1 5 10 15
Cys Phe Gly Ile Phe Tyr Thr Phe Asp Arg Val Asn Gln Gly Glu Arg
20 25 30
Asn Ala Val Ser Leu Leu Lys Glu Lys Leu Phe Asn Glu Glu Gly Glu
35 40 45
Pro Val Asn Leu Ile Phe Cys Tyr Thr Ile Leu Gln Met Lys Val Ala
50 55 60
Glu Arg Ile Met Ala Gln His Pro Gly Glu Arg Phe Tyr Val Val Leu
65 70 75 80
Met Ser Glu Asn Arg Asn Glu Lys Tyr Asp Tyr Tyr Phe Asn Gln Ile
85 90 95
Lys Asp Lys Ala Glu Arg Ala Tyr Phe Phe His Leu Pro Tyr Gly Leu
100 105 110
Asn Lys Ser Phe Asn Phe Ile Pro Thr Met Ala Glu Leu Lys Val Lys
115 120 125
Ser Met Leu Leu Pro Lys Val Lys Arg Ile Tyr Leu Ala Ser Leu Glu
130 135 140
Lys Val Ser Ile Ala Ala Phe Leu Ser Thr Tyr Pro Asp Ala Glu Ile
145 150 155 160
Lys Thr Phe Asp Asp Gly Thr Gly Asn Leu Ile Gln Ser Ser Ser Tyr
165 170 175
Leu Gly Asp Glu Phe Ser Val Asn Gly Thr Ile Lys Arg Asn Phe Ala
180 185 190
Arg Met Met Ile Gly Asp Trp Ser Ile Ala Lys Thr Arg Asn Ala Ser
195 200 205
Asp Glu His Tyr Thr Ile Phe Lys Gly Leu Lys Asn Ile Met Asp Asp
210 215 220
Gly Arg Arg Lys Met Thr Tyr Leu Pro Leu Phe Asp Ala Ser Glu Leu
225 230 235 240
Lys Thr Gly Asp Glu Thr Gly Gly Thr Val Arg Ile Leu Leu Gly Ser
245 250 255
Pro Asp Lys Glu Met Lys Glu Ile Ser Glu Lys Ala Ala Lys Asn Phe
260 265 270
Lys Ile Gln Tyr Val Ala Pro His Pro Arg Gln Thr Tyr Gly Leu Ser
275 280 285
Gly Val Thr Thr Leu Asn Ser Pro Tyr Val Ile Glu Asp Tyr Ile Leu
290 295 300
Arg Glu Ile Lys Lys Asn Pro His Thr Arg Tyr Glu Ile Tyr Thr Phe
305 310 315 320
Phe Ser Gly Ala Ala Leu Thr Met Lys Asp Phe Pro Asn Val His Val
325 330 335
Tyr Ala Leu Lys Pro Ala Ser Leu Pro Glu Asp Tyr Trp Leu Lys Pro
340 345 350
Val Tyr Ala Leu Phe Thr Gln Ser Gly Ile Pro Ile Leu Thr Phe Asp
355 360 365
Asp Lys Asn
370
<210> 66
<211> 348
<212> PRT
<213> 脑膜炎奈瑟氏菌35E
<400> 66
Met Pro Ser Glu Ala Phe Arg Arg His Arg Ala Tyr Arg Glu Asn Lys
1 5 10 15
Leu Gln Pro Leu Val Ser Val Leu Ile Cys Ala Tyr Asn Val Glu Lys
20 25 30
Tyr Phe Ala Gln Ser Leu Ala Ala Val Val Asn Gln Thr Trp Cys Asn
35 40 45
Leu Asp Ile Leu Ile Val Asp Asp Gly Ser Thr Asp Gly Thr Leu Ala
50 55 60
Ile Ala Gln Arg Phe Gln Glu Gln Asp Gly Arg Ile Lys Ile Leu Ala
65 70 75 80
Gln Ala Gln Asn Ser Gly Leu Ile Pro Ser Leu Asn Ile Gly Leu Asp
85 90 95
Glu Leu Ala Lys Ser Gly Met Gly Glu Tyr Ile Ala Arg Thr Asp Ala
100 105 110
Asp Asp Ile Ala Ala Pro Asp Trp Ile Glu Lys Ile Val Gly Glu Met
115 120 125
Glu Lys Asp Arg Ser Ile Ile Ala Met Gly Ala Trp Leu Glu Val Leu
130 135 140
Ser Glu Glu Lys Asp Gly Asn Arg Leu Ala Arg His His Glu His Gly
145 150 155 160
Lys Ile Trp Lys Lys Pro Thr Arg His Glu Asp Ile Ala Asp Phe Phe
165 170 175
Pro Phe Gly Asn Pro Ile His Asn Asn Thr Met Ile Met Arg Arg Ser
180 185 190
Val Ile Asp Gly Gly Leu Arg Tyr Asn Thr Glu Arg Asp Trp Ala Glu
195 200 205
Asp Tyr Gln Phe Trp Tyr Asp Val Ser Lys Leu Gly Arg Leu Ala Tyr
210 215 220
Tyr Pro Glu Ala Leu Val Lys Tyr Arg Leu His Ala Asn Gln Val Ser
225 230 235 240
Ser Lys Tyr Ser Ile Arg Gln His Glu Ile Ala Gln Gly Ile Gln Lys
245 250 255
Thr Ala Arg Asn Asp Phe Leu Gln Ser Met Gly Phe Lys Thr Arg Phe
260 265 270
Asp Ser Leu Glu Tyr Arg Gln Ile Lys Ala Val Ala Tyr Glu Leu Leu
275 280 285
Glu Lys His Leu Pro Glu Glu Asp Phe Glu Arg Ala Arg Arg Phe Leu
290 295 300
Tyr Gln Cys Phe Lys Arg Thr Asp Thr Leu Pro Ala Gly Val Trp Leu
305 310 315 320
Asp Phe Ala Ala Asn Gly Arg Met Arg Arg Leu Phe Thr Leu Arg Gln
325 330 335
Tyr Phe Gly Ile Leu His Arg Leu Leu Lys Asn Arg
340 345

Claims (53)

1.用于产生唾液酸化的二糖和/或寡糖的代谢工程改造的微生物细胞,所述细胞包含用于产生所述唾液酸化的二糖和/或寡糖的途径,特征在于,所述细胞:
-合成唾液酸,
-表达至少一种唾液酸转移酶,优选地在至少一种唾液酸转移酶的表达或活性方面被修饰,
-被修饰成具有完全地或部分地敲除的或功能更低的唾液酸分解代谢途径,和
-被修饰用于内源性唾液酸转运蛋白的过表达和/或外源性唾液酸转运蛋白的表达,
优选地,所述细胞在所述唾液酸转移酶中的任一种的表达或活性方面被修饰。
2.根据权利要求1所述的细胞,其中用于产生所述唾液酸化的二糖和/或寡糖的所述途径包含唾液酸化途径。
3.根据权利要求2所述的细胞,其中所述唾液酸化途径包含唾液酸转移酶与至少一种选自包含以下各项的列表的酶相组合:N-酰基葡糖胺2-差向异构酶、UDP-N-乙酰葡糖胺2-差向异构酶、N-乙酰甘露糖胺-6-磷酸2-差向异构酶、UDP-GlcNAc 2-差向异构酶/激酶水解、N-酰基神经氨酸-9-磷酸合成酶、磷酸酶、N-乙酰神经氨酸合酶和N-酰基神经氨酸胞苷酰基转移酶,
优选地,其中所述细胞在所述酶中的任何一种或多种的表达或活性方面被修饰。
4.根据前述权利要求中任一项所述的细胞,其中所述唾液酸转移酶选自包含以下各项的列表:α-2,3-唾液酸转移酶、α-2,6-唾液酸转移酶和α-2,8-唾液酸转移酶。
5.根据前述权利要求中任一项所述的细胞,其中所述唾液酸转运蛋白选自转运体和P-P-键水解驱动的转运蛋白的组,其中
a)当所述唾液酸转运蛋白选自转运体的组时,所述唾液酸转运蛋白选自:
-eggnog家族的组:1MU0F、1MUNB、1MVHH、1MWKH、1R4VK、1RJ8K、1RMH7、1RNAM、1RPTE、1RQFS、1RZ3Z、1SA02、1TPNU、1TPVE、1TQCK、1XTIW、1XU43、1Y733、1Y7P0、1YAT3、258Y6、25E9U、25SBT、25Y42、26G88、27G1B、2IX6M、2TQBC、2TQW5、36UQA、3788V、3F50Z、3WG4Q、3WP13、3WTAI、3WVF7、3X1B1、3XP7A、3ZJ4T、404JV、41EHH、4BDTU、4C594、4GX8Z、4GY09、4H21M、4H9KW、4H9WK、4HB5K、4IEK0、COG0477、COG0591、COG1593、COG2704、COG2814、COG3055、COG3090和COG4666,或
-PFAM列表:PF00083、PF00474、PF04290、PF06808、PF07690和PF11874,或
-interpro列表:IPR001734、IPR004681、IPR004742、IPR005828、IPR005829、IPR007387、IPR010656、IPR011701、IPR011851、IPR011853、IPR015915、IPR018212、IPR020846、IPR021814、IPR025966、IPR036259和IPR038377,或
-具有SEQ ID NO 01的来自大肠杆菌(Escherichia coli)的NanT,具有SEQ ID NO 02的来自小肠结肠炎耶尔森氏菌palearctica亚种血清型O:3(Yersinia enterocoliticasubsp.palearctica serotype O:3)的nanT,具有SEQ ID NO 03的来自布里纳氏布丘氏菌(Buttiauxella brennerae)ATCC 51605的nanT,具有SEQ ID NO 04的来自大肠杆菌KTE75的NanT,或具有SEQ ID NO 05的来自短吻鳄支原体(Mycoplasma alligatoris)A21JP2的转运蛋白,具有SEQ ID NO 06的来自山羊支原体山羊亚种(M.capricolumsubsp.capricolum)的转运蛋白,具有SEQ ID NO 07的来自金黄色葡萄球菌(Staphylococcus aureus)的转运蛋白,具有SEQ ID NO 08的来自孪生球菌属种(Gemellasp.)的转运蛋白,具有SEQ ID NO 09的来自艰难梭菌(Clostridioides difficile)ATCC9689的转运蛋白,具有SEQ ID NO 10的来自罗氏消化链球菌(Peptostreptococcusrussellii)的转运蛋白,具有SEQ ID NO 11的来自阻塞芽孢杆菌(Bacillusobstructivus)的转运蛋白,具有SEQ ID NO 12的来自金黄色葡萄球菌(菌株MW2)的转运蛋白,具有SEQ ID NO 13的来自葡萄球菌属种(Staphylococcus sp.)HMSC070A03的转运蛋白,具有SEQ ID NO 14的来自鲸鲸杆菌(Cetobacterium ceti)的转运蛋白,具有SEQ ID NO15的来自S.argensis的转运蛋白,具有SEQ ID NO 16的来自施氏葡萄球菌(S.schleiferi)的转运蛋白,具有SEQ ID NO 17的来自耳炎差异球菌(Alloiococcus otitis)ATCC 51267的转运蛋白,具有SEQ ID NO 18的来自蜥蜴纤细芽孢杆菌(Gracilibacillus dipsosauri)的转运蛋白,具有SEQ ID NO 19的来自费尔斯莫尔德乳杆菌(Lactobacillusversmoldensis)的转运蛋白,具有SEQ ID NO 20的来自乳杆菌属种(Lactobacillus sp.)LL6的转运蛋白,具有SEQ ID NO 21的来自Agrilactobacillus composti的转运蛋白,具有SEQ ID NO 22的来自卷曲乳杆菌(L.crispatus)的转运蛋白,具有SEQ ID NO 23的来自巴氏葡萄球菌(S.pasteuri)的转运蛋白,具有SEQ ID NO 24的来自唾液乳杆菌(L.salivarius)cp400的转运蛋白,具有SEQ ID NO 25的来自L.apodemi的转运蛋白,具有SEQ ID NO 26的来自月形单胞菌属种(Selenomonas sp.)口腔分类单元478的转运蛋白,具有SEQ ID NO 27的来自索氏梭菌(Paeniclostridium sordellii)的转运蛋白,具有SEQ IDNO 28的来自食甲基丁酸杆菌(Butyribacterium methylotrophicum)的转运蛋白,具有SEQID NO 29的来自假硬碱性卤杆菌(Alkalihalobacillus pseudofirmus)的转运蛋白,具有SEQ ID NO 30的来自缓症链球菌(Streptococcus mitis)(菌株B6)的转运蛋白,具有SEQID NO 31的来自绿色气球菌(Aerococcus viridans)的转运蛋白,具有SEQ ID NO 32的来自Anaerobiospirillum thomasii的转运蛋白,具有SEQ ID NO 33的来自溶血梭菌(Clostridium haemolyticum)NCTC 8350的转运蛋白,具有SEQ ID NO 34或SEQ ID NO 35的来自嗜热丁酸梭菌(C.thermobutyricum)的转运蛋白,具有SEQ ID NO 36的来自Romboutsia ilealis的转运蛋白,具有SEQ ID NO 37的来自单形巨单胞菌(Megamonasfuniformis)YIT 11815的转运蛋白,具有SEQ ID NO 38的来自球形赖氨酸芽孢杆菌(Lysinibacillus sphaericus)的转运蛋白,具有SEQ ID NO 39的来自未培养的梭菌属种(Clostridium sp.)的转运蛋白,具有SEQ ID NO 40的来自平野梭菌(C.hiranonis)的转运蛋白,具有SEQ ID NO 41的来自C.niameyense的转运蛋白,具有SEQ ID NO 42的来自分节丝状菌SFB-土耳其种(Candidatus Arthromitus sp.SFB-turkey)的转运蛋白,具有SEQ IDNO 43的来自Suttonella ornithocola的siaT_5,具有SEQ ID NO 44的来自多杀巴斯德氏菌多杀亚种OH4807(Pasteurella multocida subsp.multocida OH4807)的转运蛋白,具有SEQ ID NO 45的来自P.skyensis的转运蛋白,具有SEQ ID NO 46的来自猫嗜血杆菌(Haemophilus felis)的转运蛋白,具有SEQ ID NO 47的来自变形菌纲(Gammaproteobacteria)细菌的转运蛋白,具有SEQ ID NO 48的来自Pasteurella mairii的转运蛋白,具有SEQ ID NO 49的来自产吲哚萨顿氏菌(Suttonella indologenes)的转运蛋白,具有SEQ ID NO 50的来自犬梭杆菌(Fusobacterium canifelinum)的转运蛋白,具有SEQ ID NO 51的来自变形梭杆菌(F.varium)的转运蛋白,具有SEQ ID NO 52的来自坏死梭杆菌(F.necrophorum)的转运蛋白,具有SEQ ID NO 53的来自人心杆菌(Cardiobacteriumhominis)的转运蛋白,具有SEQ ID NO 54的来自伴放线放线杆菌(Aggregatibacteractinomycetemcomitans)RhAA1的转运蛋白,或具有SEQ ID NO 55的来自贝氏巴斯德氏菌(P.bettyae)CCUG 2042的转运蛋白,或SEQ ID NO 01、02、03、04、05、06、07、08、09、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54或55中的任一个的功能同系物、变体或衍生物,其分别与具有SEQ ID NO 01、02、03、04、05、06、07、08、09、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54或55的所述多肽中的任一种的全长序列具有至少80%总体序列同一性并且具有唾液酸转运蛋白活性;
b)当所述唾液酸转运蛋白选自P-P-键水解驱动的转运蛋白的组时,所述唾液酸转运蛋白选自:
-eggnog家族的组:1MU8Z、1MUZH、1NU4K、1R4KB、1RNFB、1RS1R、1SKPD、1SMBI、1Y72G、1Y72H、1Y7EZ、1Y7FQ、COG0444、COG0601、COG0747、COG1173和COG4608,或
-PFAM列表:PF00005、PF00496、PF00528和PF08352,或
-interpro列表:IPR000515、IPR000914、IPR003439、IPR003593、IPR006311、IPR013563、IPR017871、IPR027417、IPR030678、IPR035906和IPR039424,或
-具有SEQ ID NO 56、57、58或59的来自副兔嗜血菌(Haemophilus paracuniculus)的ABC转运蛋白,或SEQ ID NO 56、57、58或59中的任一个的功能同系物、变体或衍生物,其分别与具有SEQ ID NO 56、57、58或59的多肽中的任一种的全长序列具有至少80%总体序列同一性并且具有唾液酸转运蛋白活性;
其中所述eggnog家族按照2018年11月发布的eggnogdb 5.0.0进行定义,所述PFAM列表按照2018年9月发布的Pfam 32.0进行定义,所述interpro列表按照2019年7月4日发布的InterPro 75.0进行定义。
6.根据前述权利要求中任一项所述的细胞,其中所述唾液酸转运蛋白选自由以下成员组成的转运蛋白组:
a)具有SEQ ID NO 01的来自大肠杆菌的转运体NanT,具有SEQ ID NO 02的来自小肠结肠炎耶尔森氏菌palearctica亚种血清型O:3的nanT,具有SEQ ID NO 03的来自布里纳氏布丘氏菌ATCC 51605的nanT,具有SEQ ID NO 04的来自大肠杆菌KTE75的NanT,或具有SEQ IDNO 05的来自短吻鳄支原体A21JP2的转运蛋白,具有SEQ ID NO 06的来自山羊支原体山羊亚种的转运蛋白,具有SEQ ID NO 07的来自金黄色葡萄球菌的转运蛋白,具有SEQ ID NO08的来自孪生球菌属种的转运蛋白,具有SEQ ID NO 09的来自艰难梭菌ATCC 9689的转运蛋白,具有SEQ ID NO 10的来自罗氏消化链球菌的转运蛋白,具有SEQ ID NO 11的来自阻塞芽孢杆菌的转运蛋白,具有SEQ ID NO 12的来自金黄色葡萄球菌(菌株MW2)的转运蛋白,具有SEQ ID NO 13的来自葡萄球菌属种HMSC070A03的转运蛋白,具有SEQ ID NO 14的来自鲸鲸杆菌的转运蛋白,具有SEQ ID NO 15的来自S.argensis的转运蛋白,具有SEQ ID NO16的来自施氏葡萄球菌的转运蛋白,具有SEQ ID NO 17的来自耳炎差异球菌ATCC 51267的转运蛋白,具有SEQ ID NO 18的来自蜥蜴纤细芽孢杆菌的转运蛋白,具有SEQ ID NO 19的来自费尔斯莫尔德乳杆菌的转运蛋白,具有SEQ ID NO 20的来自乳杆菌属种LL6的转运蛋白,具有SEQ ID NO 21的来自Agrilactobacillus composti的转运蛋白,具有SEQ ID NO22的来自卷曲乳杆菌的转运蛋白,具有SEQ ID NO 23的来自巴氏葡萄球菌的转运蛋白,具有SEQ ID NO 24的来自唾液乳杆菌cp400的转运蛋白,具有SEQ ID NO 25的来自L.apodemi的转运蛋白,具有SEQ ID NO 26的来自月形单胞菌属种口腔分类单元478的转运蛋白,具有SEQ ID NO 27的来自索氏梭菌的转运蛋白,具有SEQ ID NO 28的来自食甲基丁酸杆菌的转运蛋白,具有SEQ ID NO 29的来自假硬碱性卤杆菌的转运蛋白,具有SEQ ID NO 30的来自缓症链球菌(菌株B6)的转运蛋白,具有SEQ ID NO 31的来自绿色气球菌的转运蛋白,具有SEQ ID NO 32的来自Anaerobiospirillum thomasii的转运蛋白,具有SEQ ID NO 33的来自溶血梭菌NCTC 8350的转运蛋白,具有SEQ ID NO 34或SEQ ID NO 35的来自嗜热丁酸梭菌的转运蛋白,具有SEQ ID NO 36的来自Romboutsia ilealis的转运蛋白,具有SEQ ID NO37的来自单形巨单胞菌YIT 11815的转运蛋白,具有SEQ ID NO 38的来自球形赖氨酸芽孢杆菌的转运蛋白,具有SEQ ID NO 39的来自未培养的梭菌属种的转运蛋白,具有SEQ ID NO40的来自平野梭菌的转运蛋白,具有SEQ ID NO 41的来自C.niameyense的转运蛋白,具有SEQ ID NO 42的来自分节丝状菌SFB-土耳其种的转运蛋白,具有SEQ ID NO 43的来自Suttonella ornithocola的siaT_5,具有SEQ ID NO 44的来自多杀巴斯德氏菌多杀亚种OH4807的转运蛋白,具有SEQ ID NO 45的来自P.skyensis的转运蛋白,具有SEQ ID NO 46的来自猫嗜血杆菌的转运蛋白,具有SEQ ID NO 47的来自变形菌纲细菌的转运蛋白,具有SEQ ID NO 48的来自Pasteurella mairii的转运蛋白,具有SEQ ID NO 49的来自产吲哚萨顿氏菌的转运蛋白,具有SEQ ID NO 50的来自犬梭杆菌的转运蛋白,具有SEQ ID NO 51的来自变形梭杆菌的转运蛋白,具有SEQ ID NO 52的来自坏死梭杆菌的转运蛋白,具有SEQID NO 53的来自人心杆菌的转运蛋白,具有SEQ ID NO 54的来自伴放线放线杆菌RhAA1的转运蛋白,或具有SEQ ID NO 55的来自贝氏巴斯德氏菌CCUG 2042的转运蛋白,或SEQ IDNO 01、02、03、04、05、06、07、08、09、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54或55中的任一个的功能同系物、变体或衍生物,其分别与具有SEQ ID NO01、02、03、04、05、06、07、08、09、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54或55的所述多肽中的任一种的全长序列具有至少80%总体序列同一性并且具有唾液酸转运蛋白活性;
优选为具有SEQ ID NO 01的来自大肠杆菌的转运体NanT,具有SEQ ID NO 02的来自小肠结肠炎耶尔森氏菌palearctica亚种血清型O:3的nanT,具有SEQ ID NO 03的来自布里纳氏布丘氏菌ATCC 51605的nanT,具有SEQ ID NO 04的来自大肠杆菌KTE75的NanT,具有SEQID NO 24的来自唾液乳杆菌cp400的转运蛋白,或具有SEQ ID NO 43的来自Suttonellaornithocola的siaT_5,或SEQ ID NO 01、02、03、04、24或43中的任一个的功能同系物、变体或衍生物,其分别与具有SEQ ID NO 01、02、03、04、24或43的所述优选多肽中的任一种的全长序列具有至少80%总体序列同一性并且具有唾液酸转运蛋白活性;和
b)具有SEQ ID NO 56、57、58或59的来自副兔嗜血菌的P-P-键水解驱动的转运蛋白,或SEQ ID NO 56、57、58或59中的任一个的功能同系物、变体或衍生物,其分别与具有SEQ IDNO 56、57、58或59的多肽中的任一种的全长序列具有至少80%总体序列同一性并且具有唾液酸转运蛋白活性。
7.根据前述权利要求中任一项所述的细胞,其中所述唾液酸转运蛋白是参与唾液酸穿过细胞质膜的流入和/或流出、优选进入细胞和/或从细胞出来的转运蛋白。
8.根据前述权利要求中任一项所述的细胞,其中在用于产生所述唾液酸化的二糖和/或寡糖的所述途径中涉及的所述唾液酸转运蛋白和/或酶中的任一种以在一个或多个基因表达模块中被呈递给细胞,其中表达由一种或多种调控序列调控。
9.根据权利要求8所述的细胞,其中所述表达模块整合到宿主细胞的基因组中和/或在载体上呈递给细胞,所述载体包括质粒、粘粒、噬菌体、脂质体或病毒,所述载体将被稳定地转化到所述宿主细胞中。
10.根据前述权利要求中任一项所述的细胞,其中所述细胞能够合成N-乙酰甘露糖胺(ManNAc)、N-乙酰甘露糖胺-6-磷酸(ManNAc-6-磷酸)和/或磷酸烯醇丙酮酸(PEP)。
11.根据前述权利要求中任一项所述的细胞,其中所述细胞被修饰以增强PEP的合成和/或供应。
12.根据前述权利要求中任一项所述的细胞,其中所述细胞还能够合成任何一种或多种核苷酸活化的糖。
13.根据权利要求12所述的细胞,其中所述核苷酸活化的糖选自包含以下各项的列表:UDP-N-乙酰葡糖胺(UDP-GlcNAc)、UDP-N-乙酰半乳糖胺(UDP-GalNAc)、UDP-N-乙酰甘露糖胺(UDP-ManNAc)、UDP-葡萄糖(UDP-Glc)、UDP-半乳糖(UDP-Gal)、GDP-甘露糖(GDP-Man)、UDP-葡糖醛酸、UDP-半乳糖醛酸、UDP-2-乙酰氨基-2,6-二脱氧--L-阿拉伯型-4-己酮糖、UDP-2-乙酰氨基-2,6-二脱氧--L-来苏-4-己酮糖、UDP-N-乙酰基-L-鼠李糖胺(UDP-L-RhaNAc或UDP-2-乙酰氨基-2,6-二脱氧-L-甘露糖)、dTDP-N-乙酰基岩藻糖胺、UDP-N-乙酰基岩藻糖胺(UDP-L-FucNAc或UDP-2-乙酰氨基-2,6-二脱氧-L-半乳糖)、UDP-N-乙酰基-L-纽莫糖胺(UDP-L-PneNAC或UDP-2-乙酰氨基-2,6-二脱氧-L-塔罗糖)、UDP-N-乙酰基胞壁酸、UDP-N-乙酰基-L-奎诺糖胺(UDP-L-QuiNAc或UDP-2-乙酰氨基-2,6-二脱氧-L-葡萄糖)、CMP-唾液酸(CMP-Neu5Ac)、CMP-Neu4Ac、CMP-Neu5Ac9N3、CMP-Neu4,5Ac2、CMP-Neu5,7Ac2、CMP-Neu5,9Ac2、CMP-Neu5,7(8,9)Ac2、CMP-N-羟乙酰神经氨酸(CMP-Neu5Gc)、GDP-岩藻糖(GDP-Fuc)、GDP-鼠李糖和UDP-木糖。
14.根据权利要求12或13中任一项所述的细胞,其中所述核苷酸活化的糖由至少一种选自包含以下各项的列表的酶合成:甘露糖-6-磷酸异构酶、磷酸甘露糖变位酶、甘露糖-1-磷酸鸟苷酰基转移酶、GDP-甘露糖4,6-脱水酶、GDP-L-岩藻糖合酶、L-岩藻糖激酶/GDP-岩藻糖焦磷酸化酶、L-谷氨酰胺-D-果糖-6-磷酸氨基转移酶、葡糖胺-6-磷酸脱氨酶、磷酸葡糖胺变位酶、N-乙酰葡糖胺-6-磷酸脱乙酰酶、N-酰基葡糖胺2-差向异构酶、UDP-N-乙酰葡糖胺2-差向异构酶、葡糖胺6-磷酸N-乙酰基转移酶、N-乙酰葡糖胺-6-磷酸磷酸酶、N-乙酰甘露糖胺-6-磷酸磷酸酶、N-乙酰甘露糖胺激酶、N-乙酰甘露糖胺-6-磷酸2-差向异构酶、磷酸乙酰葡糖胺变位酶、N-乙酰葡糖胺-1-磷酸尿苷酰基转移酶、葡糖胺-1-磷酸乙酰基转移酶、唾液酸合酶、N-乙酰神经氨酸裂合酶、N-酰基神经氨酸-9-磷酸合酶、N-酰基神经氨酸-9-磷酸酶、CMP-唾液酸合成酶、半乳糖-1-差向异构酶、半乳糖激酶、葡糖激酶、半乳糖-1-磷酸尿苷酰基转移酶、UDP-葡萄糖4-差向异构酶、葡萄糖-1-磷酸尿苷酰基转移酶、磷酸葡萄糖变位酶、UDP-N-乙酰葡糖胺4-差向异构酶、N-乙酰半乳糖胺激酶和UDP-GalNAc焦磷酸化酶。
15.根据前述权利要求中任一项所述的细胞,其中所述细胞进一步表达选自包含以下各项的列表的糖基转移酶:岩藻糖基转移酶、半乳糖基转移酶、葡萄糖基转移酶、甘露糖基转移酶、N-乙酰葡糖胺基转移酶、N-乙酰基半乳糖胺基转移酶、N-乙酰甘露糖胺基转移酶、木糖基转移酶、葡糖醛酸基转移酶、半乳糖醛酸转移酶、葡糖胺基转移酶、N-羟乙酰基神经氨酰基转移酶、鼠李糖基转移酶、N-乙酰基鼠李糖基转移酶、UDP-4-氨基-4,6-二脱氧-N-乙酰基-β-L-阿卓糖胺转氨酶、UDP-N-乙酰葡糖胺烯醇丙酮酰基转移酶和岩藻糖胺基转移酶,
-优选地,其中所述细胞在所述糖基转移酶中的至少一种的表达或活性方面被修饰,
-优选地,所述岩藻糖基转移酶选自包含以下各项的列表:α-1,2-岩藻糖基转移酶、α-1,3-岩藻糖基转移酶、α-1,4-岩藻糖基转移酶、α-1,3/4-岩藻糖基转移酶和α-1,6-岩藻糖基转移酶,
-优选地,所述半乳糖基转移酶选自包含以下各项的列表:β-1,3-半乳糖基转移酶、N-乙酰葡糖胺β-1,3-半乳糖基转移酶、β-1,4-半乳糖基转移酶、N-乙酰葡糖胺β-1,4-半乳糖基转移酶、α-1,3-半乳糖基转移酶和α-1,4-半乳糖基转移酶,
-优选地,所述葡萄糖基转移酶选自包含以下各项的列表:α-葡萄糖基转移酶、β-1,2-葡萄糖基转移酶、β-1,3-葡萄糖基转移酶和β-1,4-葡萄糖基转移酶,
-优选地,所述甘露糖基转移酶选自包含以下各项的列表:α-1,2-甘露糖基转移酶、α-1,3-甘露糖基转移酶和α-1,6-甘露糖基转移酶,
-优选地,所述N-乙酰葡糖胺基转移酶选自包含以下各项的列表:半乳糖苷β-1,3-N-乙酰葡糖胺基转移酶和β-1,6-N-乙酰葡糖胺基转移酶,
-优选地,所述N-乙酰基半乳糖胺基转移酶选自包含以下各项的列表:α-1,3-N-乙酰基半乳糖胺基转移酶。
16.根据前述权利要求中任一项所述的细胞,其中所述细胞包含岩藻糖基化途径,其包含至少一种选自包含以下各项的列表的酶:甘露糖-6-磷酸异构酶、磷酸甘露糖变位酶、甘露糖-1-磷酸鸟苷酰基转移酶、GDP-甘露糖4,6-脱水酶、GDP-L-岩藻糖合酶、岩藻糖通透酶、岩藻糖激酶、岩藻糖-1-磷酸鸟苷酰基转移酶、L-岩藻糖激酶/GDP-岩藻糖焦磷酸化酶和岩藻糖基转移酶。
17.根据前述权利要求中任一项所述的细胞,其中所述细胞包含半乳糖基化途径,其包含至少一种选自包含以下各项的列表的酶:半乳糖-1-差向异构酶、半乳糖激酶、葡糖激酶、半乳糖-1-磷酸尿苷酰基转移酶、UDP-葡萄糖4-差向异构酶、葡萄糖-1-磷酸尿苷酰基转移酶、磷酸葡萄糖变位酶和半乳糖基转移酶。
18.根据前述权利要求中任一项所述的细胞,其中所述细胞包含N-乙酰葡糖胺基化途径,其包含至少一种选自包含以下各项的列表的酶:L-谷氨酰胺-D-果糖-6-磷酸氨基转移酶、N-乙酰葡糖胺-6-磷酸脱乙酰酶、磷酸葡糖胺变位酶、N-乙酰葡糖胺-1-磷酸尿苷酰基转移酶/葡糖胺-1-磷酸乙酰基转移酶、N-乙酰葡糖胺基转移酶。
19.根据前述权利要求中任一项所述的细胞,其中所述细胞包含用于减少乙酸盐或酯产生的修饰。
20.根据前述权利要求中任一项所述的细胞,其中所述细胞进一步包含蛋白中的任何一种或多种的更低的或减少的表达和/或消除的、受损的、减少的或延迟的活性,所述蛋白包括β-半乳糖苷酶、半乳糖苷O-乙酰基转移酶、N-乙酰葡糖胺-6-磷酸脱乙酰酶、葡糖胺-6-磷酸脱氨酶、N-乙酰葡糖胺阻遏物、核糖核苷酸单磷酸酶、EIICBA-Nag、UDP-葡萄糖:十一异戊二烯基-磷酸葡萄糖-1-磷酸转移酶、L-墨角藻糖激酶、L-岩藻糖异构酶、EIIAB-Man、EIIC-Man、EIID-Man、ushA、半乳糖-1-磷酸尿苷酰基转移酶、葡萄糖-1-磷酸腺苷酰基转移酶、葡萄糖-1-磷酸酶、ATP依赖性的6-磷酸果糖激酶同工酶1、ATP依赖性的6-磷酸果糖激酶同工酶2、葡萄糖-6-磷酸异构酶、好氧性呼吸控制蛋白、转录阻遏物IclR、lon蛋白酶、葡萄糖特异性的转位磷酸转移酶IIBC组分ptsG、葡萄糖特异性的转位磷酸转移酶(PTS)酶IIBC组分malX、酶IIAGlc、β-葡萄糖苷特异性的PTS酶II、果糖特异性的PTS多磷酰基转移蛋白FruA和FruB、乙醇脱氢酶醛脱氢酶、丙酮酸-甲酸裂合酶、乙酸激酶、磷酸酰基转移酶、磷酸乙酰基转移酶、丙酮酸脱羧酶。
21.根据前述权利要求中任一项所述的细胞,其中所述细胞包含至少部分地灭活的所选单糖、二糖或寡糖的分解代谢途径,所选单糖、二糖或寡糖参与所述唾液酸化的二糖和/或寡糖的合成和/或是所述唾液酸化的二糖和/或寡糖的合成所必需的。
22.根据前述权利要求中任一项所述的细胞,其中所述细胞使用前体来合成所述唾液酸化的二糖和/或寡糖,所述前体从培养基给料给所述细胞。
23.根据前述权利要求中任一项所述的细胞,其中所述细胞产生用于合成所述唾液酸化的二糖和/或寡糖的前体。
24.根据前述权利要求中任一项所述的细胞,其中所述细胞在整个培养液和/或上清液中产生90g/L或更多的所述唾液酸化的二糖和/或寡糖,和/或其中所述唾液酸化的二糖和/或寡糖在整个培养液和/或上清液中具有至少80%的纯度,这按照分别在整个培养液和/或上清液中所述细胞产生的唾液酸化的二糖和/或寡糖及其前体的总量进行测量。
25.根据前述权利要求中任一项所述的细胞,其中所述唾液酸化的二糖和/或寡糖选自包含以下各项的列表:乳寡糖、O-抗原、在荚膜多糖中存在的寡糖重复单位、肽聚糖、氨基-糖和Lewis-型抗原寡糖,优选地所述乳寡糖是哺乳动物乳寡糖,更优选地所述乳寡糖是人乳寡糖。
26.根据前述权利要求中任一项所述的细胞,其中所述细胞是细菌、真菌或酵母,
-优选地,所述细菌属于大肠杆菌菌株,更优选地属于作为K-12菌株的大肠杆菌菌株,甚至更优选地所述大肠杆菌K-12菌株是大肠杆菌MG1655,
-优选地,所述真菌属于选自包括以下各项的组的属:根霉菌属(Rhizopus)、盘基网柄菌属(Dictyostelium)、青霉属(Penicillium)、毛霉菌属(Mucor)或曲霉菌属(Aspergillus),
-优选地,所述酵母属于选自包括以下各项的组的属:酵母属(Saccharomyces)、接合酵母属(Zygosaccharomyces)、毕赤酵母属(Pichia)、驹形氏酵母(Komagataella)、汉逊酵母属(Hansenula)、耶氏酵母属(Yarrowia)、斯塔莫酵母(Starmerella)、克鲁维酵母属(Kluyveromyces)或德巴利酵母属(Debaromyces)。
27.根据前述权利要求中任一项所述的细胞,其中所述细胞在培养基中稳定地培养。
28.根据前述权利要求中任一项所述的细胞,其中所述细胞能够合成寡糖的混合物,其包含至少一种唾液酸化的寡糖。
29.根据前述权利要求中任一项所述的细胞,其中所述细胞能够合成二糖和寡糖的混合物,其包含至少一种唾液酸化的二糖和/或寡糖。
30.由微生物细胞产生唾液酸化的二糖和/或寡糖的方法,所述方法包括以下步骤:
1)提供根据权利要求1至29中任一项所述的细胞,和
2)在允许产生所述唾液酸化的二糖和/或寡糖的条件下培养所述细胞,
3)优选地,从培养物中分离所述唾液酸化的二糖和/或寡糖。
31.根据权利要求30所述的方法,其中>95%的由所述细胞合成的所述唾液酸被用于产生所述唾液酸化的二糖和/或寡糖。
32.根据权利要求30或31中任一项所述的方法,所述方法进一步包括下述步骤中的至少一个:
i)使用包含至少一种前体和/或受体的培养基来产生所述唾液酸化的二糖和/或寡糖,和/或
ii)向所述培养基中加入至少一种用于产生所述唾液酸化的二糖和/或寡糖的前体和/或受体补料。
33.根据权利要求30至32中任一项所述的方法,所述方法进一步包括下述步骤中的至少一个:
i)使用包含至少一种前体和/或受体的培养基;
ii)向在反应器中的培养基中加入至少一种前体和/或受体补料,其中总反应器体积的范围为250mL(毫升)至10.000m3(立方米),优选以连续方式加入,且优选使得所述培养基的终体积是在加入所述前体和/或受体补料之前培养基体积的不超过3倍、优选不超过2倍、更优选小于2倍;
iii)向在反应器中的培养基中加入至少一种前体和/或受体补料,其中总反应器体积的范围为250mL(毫升)至10.000m3(立方米),优选以连续方式加入,且优选使得所述培养基的终体积是在加入所述前体和/或受体补料之前培养基体积的不超过3倍、优选不超过2倍、更优选小于2倍,并且其中优选地,将所述前体和/或受体补料的pH设定在2.0至10.0,并且其中优选地,将所述前体和/或受体补料的温度保持在20℃至80℃;
iv)借助于补料溶液历时1天、2天、3天、4天、5天将至少一种前体和/或受体补料以连续方式加入所述培养基中;
v)借助于补料溶液历时1天、2天、3天、4天、5天将至少一种前体和/或受体补料以连续方式加入所述培养基中,并且其中优选地,将所述补料溶液、优选所述前体和/或受体补料的pH设定在2.0至10.0,优选在3至7,并且其中优选地,将所述补料溶液、优选所述前体和/或受体补料的温度保持在20℃至80℃;
所述方法产生在所述培养基的终体积中具有至少50g/L、优选至少75g/L、更优选至少90g/L、更优选至少100g/L、更优选至少125g/L、更优选至少150g/L、更优选至少175g/L、更优选至少200g/L的浓度的唾液酸化的二糖和/或寡糖。
34.根据权利要求30至32中任一项所述的方法,所述方法进一步包括下述步骤中的至少一个:
i)使用包含至少50、更优选至少75、更优选至少100、更优选至少120、更优选至少150克前体/升初始反应器体积的培养基,其中总反应器体积的范围为250mL至10.000m3(立方米);
ii)使用包含至少50、更优选至少75、更优选至少100、更优选至少120、更优选至少150克受体/升初始反应器体积的培养基,其中总反应器体积的范围为250mL至10.000m3(立方米);
iii)向在反应器中的培养基中加入前体补料,其包含至少50、更优选至少75、更优选至少100、更优选至少120、更优选至少150克前体/升初始反应器体积,其中总反应器体积的范围为250mL至10.000m3(立方米),优选以连续方式加入,且优选使得所述培养基的终体积是在加入所述前体补料之前培养基体积的不超过3倍、优选不超过2倍、更优选小于2倍;
iv)向在反应器中的培养基中加入受体补料,其包含至少50、更优选至少75、更优选至少100、更优选至少120、更优选至少150克受体/升初始反应器体积,其中总反应器体积的范围为250mL至10.000m3(立方米),优选以连续方式加入,且优选使得所述培养基的终体积是在加入所述受体补料之前培养基体积的不超过3倍、优选不超过2倍、更优选小于2倍;
v)向在反应器中的培养基中加入前体补料,其包含至少50、更优选至少75、更优选至少100、更优选至少120、更优选至少150克前体/升初始反应器体积,其中总反应器体积的范围为250mL至10.000m3(立方米),优选以连续方式加入,且优选使得所述培养基的终体积是在加入所述前体补料之前培养基体积的不超过3倍、优选不超过2倍、更优选小于2倍,并且其中优选地,将所述前体补料的pH设定在2.0至10.0,并且其中优选地,将所述前体补料的温度保持在20℃至80℃;
vi)向在反应器中的培养基中加入受体补料,其包含至少50、更优选至少75、更优选至少100、更优选至少120、更优选至少150克受体/升初始反应器体积,其中总反应器体积的范围为250mL至10.000m3(立方米),优选以连续方式加入,且优选使得所述培养基的终体积是在加入所述受体补料之前培养基体积的不超过3倍、优选不超过2倍、更优选小于2倍,并且其中优选地,将所述受体补料的pH设定在2.0至10.0,并且其中优选地,将所述受体补料的温度保持在20℃至80℃;
vii)借助于补料溶液历时1天、2天、3天、4天、5天以连续方式向所述培养基中加入前体和/或受体补料;
viii)借助于前体补料溶液历时1天、2天、3天、4天、5天以连续方式向所述培养基中加入前体补料,且其中所述前体补料溶液的浓度是50g/L,优选75g/L,更优选100g/L,更优选125g/L,更优选150g/L、更优选175g/L、更优选200g/L、更优选225g/L、更优选250g/L、更优选275g/L、更优选300g/L、更优选325g/L、更优选350g/L、更优选375g/L、更优选400g/L、更优选450g/L、更优选500g/L、甚至更优选550g/L、最优选600g/L,并且其中优选地,将所述前体补料溶液的pH设定在2.0至10.0,并且其中优选地,将所述前体补料溶液的温度保持在20℃至80℃;
ix)借助于受体补料溶液历时1天、2天、3天、4天、5天以连续方式向所述培养基中加入受体补料,且其中所述受体补料溶液的浓度是50g/L、优选75g/L、更优选100g/L、更优选125g/L、更优选150g/L、更优选175g/L、更优选200g/L、更优选225g/L、更优选250g/L、更优选275g/L、更优选300g/L、更优选325g/L、更优选350g/L、更优选375g/L、更优选400g/L、更优选450g/L、更优选500g/L、甚至更优选550g/L、最优选600g/L,并且其中优选地,将所述受体补料溶液的pH设定在2.0至10.0,并且其中优选地,将所述受体补料溶液的温度保持在20℃至80℃;
所述方法产生在所述培养基的终体积中具有至少50g/L、优选至少75g/L、更优选至少90g/L、更优选至少100g/L、更优选至少125g/L、更优选至少150g/L、更优选至少175g/L、更优选至少200g/L的浓度的唾液酸化的二糖和/或寡糖。
35.根据权利要求30至32中任一项所述的方法,所述方法进一步包括下述步骤中的至少一个:
i)使用包含至少50、更优选至少75、更优选至少100、更优选至少120、更优选至少150克乳糖/升初始反应器体积的培养基,其中总反应器体积的范围为250mL至10.000m3(立方米);
ii)向在反应器中的培养基中加入乳糖补料,其包含至少50、更优选至少75、更优选至少100、更优选至少120、更优选至少150克乳糖/升初始反应器体积,其中所述反应器体积的范围为250mL至10.000m3(立方米),优选以连续方式加入,且优选使得所述培养基的终体积是在加入所述乳糖补料之前培养基体积的不超过3倍、优选不超过2倍、更优选小于2倍;
iii)向在反应器中的培养基中加入乳糖补料,其包含至少50、更优选至少75、更优选至少100、更优选至少120、更优选至少150克乳糖/升初始反应器体积,其中总反应器体积的范围为250mL至10.000m3(立方米),优选以连续方式加入,且优选使得所述培养基的终体积是在加入所述乳糖补料之前培养基体积的不超过3倍、优选不超过2倍、更优选小于2倍,并且其中优选地,将所述乳糖补料的pH设定在2.0至10.0,优选在3至7,并且其中优选地,将所述乳糖补料的温度保持在20℃至80℃;
iv)借助于补料溶液历时1天、2天、3天、4天、5天以连续方式向所述培养基中加入乳糖补料;
v)借助于乳糖补料溶液历时1天、2天、3天、4天、5天以连续方式向所述培养基中加入乳糖补料,且其中所述乳糖补料溶液的浓度是50g/L、优选75g/L、更优选100g/L、更优选125g/L、更优选150g/L、更优选175g/L、更优选200g/L、更优选225g/L、更优选250g/L、更优选275g/L、更优选300g/L、更优选325g/L、更优选350g/L、更优选375g/L、更优选400g/L、更优选450g/L、更优选500g/L、甚至更优选550g/L、最优选600g/L;且其中优选地将所述乳糖补料溶液的pH设定在2.0至10.0,优选在3至7,并且其中优选地将所述乳糖补料溶液的温度保持在20℃至80℃;
所述方法产生从所述乳糖产生的唾液酸化的寡糖,其在所述培养基的终体积中具有至少50g/L、优选至少75g/L、更优选至少90g/L、更优选至少100g/L、更优选至少125g/L、更优选至少150g/L、更优选至少175g/L、更优选至少200g/L的浓度。
36.根据权利要求35所述的方法,其中通过从培养开始以至少5mM的浓度、优选以30、40、50、60、70、80、90、100、150mM的浓度、更优选以>300mM的浓度添加乳糖来完成乳糖补料。
37.根据权利要求35或36中任一项所述的方法,其中通过以一定浓度将乳糖加入培养基中,使得在整个培养的生产阶段中获得至少5mM、优选10mM或30mM的乳糖浓度,完成所述乳糖补料。
38.根据权利要求30至37中任一项所述的方法,其中将所述宿主细胞培养至少约60、80、100或约120小时或以连续方式培养。
39.根据权利要求30至38中任一项所述的方法,其中将所述细胞在培养基中培养,所述培养基包含:碳源,其包含单糖、二糖、寡糖、多糖、多元醇、甘油;复合培养基,其包括糖蜜、玉米浆、蛋白胨、胰蛋白胨或酵母提取物;优选地,其中所述碳源选自包含以下各项的列表:葡萄糖、甘油、果糖、蔗糖、麦芽糖、乳糖、阿拉伯糖、麦芽寡糖、麦芽三糖、山梨醇、木糖、鼠李糖、半乳糖、甘露糖、甲醇、乙醇、海藻糖、淀粉、纤维素、半纤维素、糖蜜、玉米浆、高果糖糖浆、乙酸盐、柠檬酸盐、乳酸盐和丙酮酸盐。
40.根据权利要求30至39中的任一项所述的方法,其中所述细胞使用至少一种前体来合成所述唾液酸化的二糖和/或寡糖,优选地所述细胞使用两种或更多种前体来合成所述唾液酸化的二糖和/或寡糖。
41.根据权利要求30至40中任一项所述的方法,其中所述培养基含有至少一种选自包括以下各项的组的化合物:乳糖、半乳糖、唾液酸、岩藻糖、GlcNAc、GalNAc、乳糖-N-二糖(LNB)、N-乙酰基乳糖胺(LacNAc)。
42.根据权利要求30至41中任一项所述的方法,其中通过向所述培养基中添加基于碳的底物、优选葡萄糖或蔗糖来提供指数细胞生长的第一阶段,然后在第二阶段将前体、优选乳糖加入所述培养基中。
43.根据权利要求30至42中任一项所述的方法,其中所述细胞产生至少一种用于合成所述唾液酸化的二糖和/或寡糖的前体。
44.根据权利要求30至43中任一项所述的方法,其中用于合成所述唾液酸化的二糖和/或寡糖的所述前体被完全转化为所述唾液酸化的二糖和/或寡糖。
45.根据权利要求30至44中任一项所述的方法,其中将所述唾液酸化的二糖和/或寡糖与所述培养基和/或所述细胞分离。
46.根据权利要求30至45中任一项所述的方法,其中所述分离包括下述步骤中的至少一个:澄清、超滤、纳米过滤、两相分配、反渗透、微滤、活性炭或碳处理、用非离子表面活性剂处理、酶消化、切向流高效过滤、切向流超滤、电泳、亲和色谱法、离子交换色谱法、疏水相互作用色谱法和/或凝胶过滤、配体交换色谱法、电渗析。
47.根据权利要求30至46中任一项所述的方法,其中所述方法进一步包括所述唾液酸化的二糖和/或寡糖的纯化。
48.根据权利要求47所述的方法,其中所述纯化包括下述步骤中的至少一个:使用活性炭或碳、使用木炭、纳米过滤、超滤、电泳、酶处理或离子交换、温度调节、pH调节、使用碱性或酸性溶液的pH调节、使用醇、使用水性醇混合物、结晶、蒸发、沉淀、干燥、喷雾干燥、冻干、喷雾冷冻干燥、冷冻喷雾干燥、带状干燥、带式干燥、真空带状干燥、真空带式干燥、转鼓式干燥、滚筒干燥、真空转鼓式干燥或真空滚筒干燥。
49.选自SEQ ID NO 02、03、04、05、06、07、08、09、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、47、58或59的唾液酸转运蛋白、或SEQ ID NO 01、02、03、04、05、06、07、08、09、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、47、58或59中的任一个的功能同系物、变体或衍生物在唾液酸化的二糖和/或寡糖的发酵生产中的用途,所述功能同系物、变体或衍生物分别与具有SEQ ID NO01、02、03、04、05、06、07、08、09、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、47、58或59的所述多肽中的任一种的全长序列具有至少80%总体序列同一性并且具有唾液酸转运蛋白活性。
50.权利要求1至27中任一项所述的细胞用于产生唾液酸化的二糖和/或寡糖的用途。
51.权利要求28所述的细胞用于产生寡糖的混合物的用途,所述混合物包含至少一种唾液酸化的寡糖。
52.权利要求29所述的细胞用于产生二糖和寡糖的混合物的用途,所述混合物包含至少一种唾液酸化的二糖和/或寡糖。
53.权利要求30至48中任一项所述的方法用于产生唾液酸化的二糖和/或寡糖的用途。
CN202280028767.8A 2021-04-16 2022-04-15 唾液酸化的二糖和/或寡糖的细胞生产 Pending CN117157396A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
EP21168996 2021-04-16
EP21168996.3 2021-04-16
PCT/EP2022/060181 WO2022219188A1 (en) 2021-04-16 2022-04-15 Cellular production of sialylated di- and/or oligosaccharides

Publications (1)

Publication Number Publication Date
CN117157396A true CN117157396A (zh) 2023-12-01

Family

ID=75581385

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202280028767.8A Pending CN117157396A (zh) 2021-04-16 2022-04-15 唾液酸化的二糖和/或寡糖的细胞生产

Country Status (6)

Country Link
US (1) US20240200021A1 (zh)
EP (1) EP4323510A1 (zh)
KR (1) KR20230170961A (zh)
CN (1) CN117157396A (zh)
AU (1) AU2022258874A1 (zh)
WO (1) WO2022219188A1 (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117646049B (zh) * 2024-01-26 2024-04-26 山东润德生物科技有限公司 一种微生物发酵制备n-乙酰氨基葡萄糖的方法

Family Cites Families (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5939307A (en) 1996-07-30 1999-08-17 The Archer-Daniels-Midland Company Strains of Escherichia coli, methods of preparing the same and use thereof in fermentation processes for l-threonine production
SK7702000A3 (en) 1998-09-25 2000-10-09 Ajinomoto Kk Process for preparing coryneform bacteria having an improved amino acid- or nucleic acid-productivity
US7820422B2 (en) * 2005-06-16 2010-10-26 Centre National De La Recherche Scientifique (Cnrs) Efficient production of oligosaccharides using metabolically engineered microorganisms
US8507227B2 (en) * 2006-03-09 2013-08-13 Centre National De La Recherche Scientifique (Cnrs) Method of producing sialylated oligosaccharides
EP3235907B1 (en) 2010-07-12 2023-06-21 Inbiose N.V. Metabolically engineered organisms for the production of added value bio-products
CN107075506B (zh) 2014-11-14 2022-06-03 因比奥斯公司 抵抗乳糖杀伤的突变体微生物
EP3141610A1 (en) * 2015-09-12 2017-03-15 Jennewein Biotechnologie GmbH Production of human milk oligosaccharides in microbial hosts with engineered import / export
US11535878B2 (en) 2016-12-27 2022-12-27 Inbiose N.V. In vivo synthesis of sialylated compounds
BR112020001628A2 (pt) * 2017-07-26 2020-07-21 Jennewein Biotechnologie Gmbh sialiltransferases e uso das mesmas na produção de oligossacarídeos sialilados
EP3473644A1 (en) 2017-10-17 2019-04-24 Jennewein Biotechnologie GmbH Fermentative production of n-acetylneuraminic acid
FI3575404T3 (fi) 2018-05-28 2023-01-13 Sialyloitujen sakkaridejen fermentatiivinen tuotanto
EP3789495A1 (en) * 2019-09-03 2021-03-10 Jennewein Biotechnologie GmbH Production of sialylated oligosaccharides in bacillus cells
WO2021123113A1 (en) * 2019-12-18 2021-06-24 Inbiose N.V. Production of sialylated oligosaccharide in host cells

Also Published As

Publication number Publication date
EP4323510A1 (en) 2024-02-21
AU2022258874A9 (en) 2023-12-07
KR20230170961A (ko) 2023-12-19
AU2022258874A1 (en) 2023-11-30
US20240200021A1 (en) 2024-06-20
WO2022219188A1 (en) 2022-10-20

Similar Documents

Publication Publication Date Title
US20240209405A1 (en) Production of a sialylated oligosaccharide mixture by a cell
CN116323927A (zh) 双糖及/或寡糖的细胞生产
US20230313252A1 (en) Cellular production of sialylated di and/or oligosaccharides
CN117157396A (zh) 唾液酸化的二糖和/或寡糖的细胞生产
CN117157394A (zh) 发酵生产
CN117222736A (zh) 生物产物的细胞生产
TW202219275A (zh) 在細胞中之含有GlcNAc的生物產品的產生
CN117957316A (zh) 转化乳糖-n-二糖的岩藻糖基转移酶
TW202221132A (zh) 藉由細胞生產哺乳動物乳寡醣的混合物
TW202221138A (zh) 藉由細胞之唾液酸化寡醣混合物的生產
CN116472346A (zh) 借由细胞的唾液酸化寡糖混合物的生产
WO2023285650A1 (en) Lacto-n-biose converting fucosyltransferases
TW202212572A (zh) 藉由細胞製造中性岩藻糖基化寡醣之混合物
TW202221135A (zh) α-1,3醣化形式的Fuc-a1,2-Gal-R的產生

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination