CN116802286A - 一种产生dfl的菌株 - Google Patents

一种产生dfl的菌株 Download PDF

Info

Publication number
CN116802286A
CN116802286A CN202180086444.XA CN202180086444A CN116802286A CN 116802286 A CN116802286 A CN 116802286A CN 202180086444 A CN202180086444 A CN 202180086444A CN 116802286 A CN116802286 A CN 116802286A
Authority
CN
China
Prior art keywords
leu
ala
ile
val
phe
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202180086444.XA
Other languages
English (en)
Inventor
M·彼得森
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Glycom AS
Original Assignee
Glycom AS
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Glycom AS filed Critical Glycom AS
Publication of CN116802286A publication Critical patent/CN116802286A/zh
Pending legal-status Critical Current

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/70Vectors or expression systems specially adapted for E. coli
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y204/00Glycosyltransferases (2.4)
    • C12Y204/01Hexosyltransferases (2.4.1)
    • C12Y204/010653-Galactosyl-N-acetylglucosaminide 4-alpha-L-fucosyltransferase (2.4.1.65), i.e. alpha-1-3 fucosyltransferase
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07HSUGARS; DERIVATIVES THEREOF; NUCLEOSIDES; NUCLEOTIDES; NUCLEIC ACIDS
    • C07H3/00Compounds containing only hydrogen atoms and saccharide radicals having only carbon, hydrogen, and oxygen atoms
    • C07H3/06Oligosaccharides, i.e. having three to five saccharide radicals attached to each other by glycosidic linkages
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/52Genes encoding for enzymes or proenzymes
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/10Transferases (2.)
    • C12N9/1048Glycosyltransferases (2.4)
    • C12N9/1051Hexosyltransferases (2.4.1)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P19/00Preparation of compounds containing saccharide radicals
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P19/00Preparation of compounds containing saccharide radicals
    • C12P19/04Polysaccharides, i.e. compounds containing more than five saccharide radicals attached to each other by glycosidic bonds
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P19/00Preparation of compounds containing saccharide radicals
    • C12P19/18Preparation of compounds containing saccharide radicals produced by the action of a glycosyl transferase, e.g. alpha-, beta- or gamma-cyclodextrins
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y204/00Glycosyltransferases (2.4)
    • C12Y204/01Hexosyltransferases (2.4.1)
    • C12Y204/01069Galactoside 2-alpha-L-fucosyltransferase (2.4.1.69)
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide

Landscapes

  • Chemical & Material Sciences (AREA)
  • Organic Chemistry (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Genetics & Genomics (AREA)
  • Wood Science & Technology (AREA)
  • Zoology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Biotechnology (AREA)
  • Microbiology (AREA)
  • Biomedical Technology (AREA)
  • Molecular Biology (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • General Chemical & Material Sciences (AREA)
  • Medicinal Chemistry (AREA)
  • Physics & Mathematics (AREA)
  • Biophysics (AREA)
  • Plant Pathology (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)

Abstract

本发明涉及表达α‑1,2‑岩藻糖基转移酶和α‑1,3‑岩藻糖基转移酶以及主要易化因子超家族(MFS)的转运蛋白的遗传修饰细胞以及使用所述遗传修饰细胞重组产生人乳寡糖(HMO)的方法。更具体地,本发明提供重组产生二岩藻糖基乳糖(DFL)作为最丰富的HMO,且3‑岩藻糖基乳糖(3FL)和/或2’‑岩藻糖基乳糖(2’FL)含量相对较低的方法和能够产生二岩藻糖基乳糖(DFL)作为最丰富的HMO,且3‑岩藻糖基乳糖(3FL)和/或2’‑岩藻糖基乳糖(2’FL)含量相对较低的遗传修饰细胞。

Description

一种产生DFL的菌株
技术领域
本发明涉及在宿主细胞中重组产生生物分子的领域。特别地,它涉及一种使用表达α-1,2-岩藻糖基转移酶和α-1,3-岩藻糖基转移酶以及任选的主要易化因子超家族(major facilitator superfamily)(MFS)的蛋白质的遗传修饰细胞重组产生人乳寡糖(HMO)的方法。更具体地,本发明提供一种用于重组产生主要为二岩藻糖基乳糖(DFL)且3-岩藻糖基乳糖(3FL)和2’-岩藻糖基乳糖(2’FL)含量相对较低的方法和一种能够产生主要为二岩藻糖基乳糖(DFL)且3-岩藻糖基乳糖(3FL)和2’-岩藻糖基乳糖(2’FL)含量相对较低的遗传修饰细胞。
背景技术
人乳是碳水化合物、脂肪、蛋白质、维生素、矿物质和微量元素的复杂混合物。迄今为止最主要的部分是碳水化合物,碳水化合物可进一步分为乳糖和更复杂的寡糖(人乳寡糖,HMO)。虽然乳糖被用作能量来源,但复杂的寡糖不会被婴儿代谢。复杂的寡糖的部分占总碳水化合物部分至多1/10,并且可能由150多种不同的寡糖组成。这些复杂的寡糖的存在和浓度是人类特有的,因此不能在其它哺乳动物(例如驯养奶畜)的乳汁中大量发现。
最突出的寡糖是2’-岩藻糖基乳糖和3-岩藻糖基乳糖,它们加起来占总HMO部分的1/3。人乳中存在的其它主要HMO是乳-N-四糖、乳-N-新四糖和乳-N-岩藻五糖I。除了这些中性寡糖外,人乳中还可以存在酸性HMO,例如3’-唾液酸乳糖,6’-唾液酸乳糖和3-岩藻糖基-3’-唾液酸乳糖、二唾液酸-乳-N-四糖等。这些岩藻糖基-和唾液酸-结构与上皮细胞表面糖缀合物的表位密切相关,即Lewis组织血型抗原,例如Lewis x(LeX),它们被认为是癌症发病机制的标志。HMO与上皮表位的结构同源性解释了它们免受细菌病原体侵害的保护特性。
人乳中存在复杂的寡糖已众所周知很久,这些寡糖的生理功能已进行医学研究几十年。对于一些更丰富的人乳寡糖,已经确定了特定功能。
除了在肠道中的局部作用外,HMO已被证明可以通过进入体循环引起婴儿的全身作用。此外,HMO对蛋白质-碳水化合物相互作用(例如选择素-白细胞结合)的影响可以调控免疫应答并减少炎症应答。此外,人们越来越认识到HMO是婴儿微生物组发育的关键底物。
人乳寡糖(HMO)是人乳中第三大固体成分,对酶水解具有很强的抵抗力。因此,很大一部分HMO仍然大部分未被消化和吸收,这使得它们能够通过结肠。在结肠中,HMO可作为底物通过选择性刺激特定糖分解细菌的生长来塑造肠道生态系统。这种选择性被认为对婴儿和成人都有益,因为双歧杆菌(Bifidobacterium)菌株被认为对肠道健康有积极影响(Chichlowski M.等人,(2012)J.Pediatr.Gastroenterol.Nutr.5:251-258;Elison E.等人,(2016)Brit J.Nutr,116:1356–1368)。
除了它们的益生元特性外,HMO还具有其它积极作用,这扩大了它们的应用领域(Kunz C.et al.,(2014)Food Oligosaccharides:Production,Analysis andBioactivity,第一版,p 5-20,Eds.Moreno J.和Luz Sanz M.,John Wiley&Sons,Ltd)。
HMO明显的健康益处使其能够获准用于食品,例如婴儿配方奶粉和食品,以及消费类保健品。
由于益生元寡糖,特别是HMO的有益特性已得到充分研究,但它们的可用性有限,因此非常需要有效的商业化,即大规模生产。
HMO的生物技术产生是一种具有成本效益的大规模HMO制造方式。它依靠遗传工程细菌或酵母构建,以表达合成所需寡糖所需要的糖基转移酶,并利用细菌固有的核苷酸糖库作为HMO前体。
HMO生物技术产生的最新发展使得克服细菌表达系统的某些固有局限性成为可能。例如,WO2012112777描述了可对产生HMO的细菌细胞进行遗传修饰,以通过潜在地具有α-1,2岩藻糖基转移酶和α-1,3岩藻糖基转移酶活性来产生岩藻糖基化寡糖,并增加细菌中有限的细胞内核苷酸糖库。细胞产生2’FL、3FL和DFL的混合物,但只有少量的DFL。WO2016040531公开了一种特定的α-1,3岩藻糖基转移酶,其在岩藻糖基化HMO产生中具有改进的活性。WO2010142305和WO2017042382描述了使用输出蛋白来促进合成的HMO分泌到细胞外介质中。此外,重组细胞中目的基因的表达可以通过使用特定的启动子或其它基因表达调控子来调控,例如最近在WO2019123324中描述的。
WO2010142305和WO2017042382中描述的方法的优点是它可以减少高水平重组基因表达对产生细胞造成的代谢负担,例如,使用WO2012112777、WO2016040531或WO2019123324的方法。这种方法在重组HMO产生细胞工程中引起了越来越多的关注,例如,最近描述了几种新的糖转运蛋白基因,它们可以促进重组产生的2’-岩藻糖基乳糖(2’FL)的外排。WO2018077892公开了setA和YberC,US201900323053和US201900323052涉及酵母转运蛋白。
然而,目前仍需要提供能够高效产生特定HMO的重组方法。
发明内容
本发明涉及一种能够产生HMO的遗传修饰细胞。所产生的HMO主要是DFL。优选地,DFL的产生量相当于所产生的总HMO的大于50%,例如60%。所产生的其它HMO主要选自3FL和2’FL、及其组合。
本发明的一个方面是一种遗传修饰细胞,其包括编码以下的异源、重组和/或合成核酸
a.α-1,2-岩藻糖基转移酶,和
b.α-1,3-岩藻糖基转移酶
c.选自主要易化因子超家族(MFS)的转运蛋白。
在一个实施方式中,根据本发明的遗传修饰细胞包括编码α-1,2-岩藻糖基转移酶的异源、重组和/或合成核酸,其是futC或wbgL基因,以及编码α-1,3-岩藻糖基转移酶的核酸,其选自futA基因或fucT基因或moumou基因。
通常,与没有MFS转运蛋白的相同细胞相比,具有MFS转运蛋白的遗传修饰细胞多产生至少5%w/w的DFL。通常,遗传修饰细胞产生50%w/w以上,例如60%w/w,例如65%w/w以上,或70%w/w以上的HMO(由本文所述的细胞产生)是二岩藻糖基乳糖(DFL),并且细胞中产生的总量的至多35%w/w的HMO是3-岩藻糖基乳糖(3FL)和/或2’-岩藻糖基乳糖(2’FL),例如细胞中产生的总量的至多30%,例如至多20%w/w,例如至多15%w/w,至多10%w/w,至多5%w/w,至多2.5%w/w或至多1%w/w的HMO是3-岩藻糖基乳糖。此外,细胞中产生的总量的至多30%w/w,例如至多20%w/w,例如至多15%w/w,至多10%w/w,至多5%w/w,至多2.5%w/w,或至多1%w/w的HMO是2’-岩藻糖基乳糖(2’FL)。
在本发明优选的实施方式中,遗传修饰细胞还包括编码选自主要易化因子超家族(MFS)的转运蛋白的异源、重组和/或合成核酸。转运蛋白可由SEQ ID NO:1(marc)或其功能同源物组成,其功能同源物与SEQ ID NO:1具有至少80%同一性、优选至少85%同一性、更优选至少90%同一性;或转运蛋白可由SEQ ID NO:2(nec)或其功能同源物组成,其功能同源物与SEQ ID NO:2具有至少80%同一性、优选至少85%同一性、更优选至少90%同一性;或转运蛋白可由SEQ ID NO:3(vag)或其功能同源物组成,其功能同源物与SEQ ID NO:3具有至少80%同一性、优选至少85%同一性、更优选至少90%同一性;或转运蛋白可由SEQ IDNO:42(fred)或其功能同源物组成,其功能同源物与SEQ ID NO:42具有至少80%同一性、优选至少85%同一性、更优选至少90%同一性;或转运蛋白可由SEQ ID NO:43(bad)或其功能同源物组成,其功能同源物与SEQ ID NO:43具有至少80%同一性、优选至少85%同一性、更优选至少90%同一性。
根据本发明的遗传修饰细胞是微生物细胞,优选大肠杆菌(Escherichia coli)。所述细胞还可包括异源、重组和/或合成调控元件,所述调控元件包括用于调控异源、重组和/或合成核酸表达的核酸序列,例如启动子核酸序列,例如lac启动子Plac、或mglB启动子PmglB、或glp启动子PglpF、或其任何变体。优选地,启动子核酸序列是PglpF、PmglB、或其变体。
本发明进一步涉及一种用于产生一种或多种寡糖的方法,其中所产生的主要寡糖是二岩藻糖基乳糖(DFL),该方法包括以下步骤:
(i)提供能够产生HMO的遗传修饰细胞,其中所述细胞包括编码以下的异源、重组和/或合成核酸
a.α-1,2-岩藻糖基转移酶,和
b.α-1,3-岩藻糖基转移酶,和
c.选自主要易化因子超家族(MFS)的转运蛋白
(ii)在合适的细胞培养基中培养根据(i)的细胞以产生所述HMO;和
(iii)收获步骤(ii)中产生的一种或多种HMO。
通常,所述编码α-1,2-岩藻糖基转移酶的异源、重组和/或合成核酸是futC和/或wbgL基因或其功能同源物,所述编码α-1,3-岩藻糖基转移酶的异源、重组和/或合成核酸选自futA基因和/或fucT基因或moumou基因,或futA基因和/或fucT基因或moumou基因的功能同源物。
所述遗传修饰细胞可进一步包括异源、重组和/或合成核酸,其编码选自主要易化因子超家族(MFS)的转运蛋白;例如但不限于marc、nec、vag、fred或bad。
通过本文所述的方法产生的总量的至多35%w/w的HMO是3-岩藻糖基乳糖(3FL),例如至多20%w/w、至多15%w/w、至多10%w/w、至多5%w/w、至多2.5%w/w、或至多1%w/w。一方面,本文所述的方法基本上不产生3-岩藻糖基乳糖(3FL)或仅产生非常少的3-岩藻糖基乳糖(3FL),例如基本上所产生的HMO总量的0.1-0%w/w。
此外,通过本文所述的方法产生的总量的至多35%w/w的HMO是2’-岩藻糖基乳糖(2’FL),例如至多20%w/w、至多15%w/w、至多10%w/w、至多5%w/w、至多2.5%w/w、或至多1%w/w。
一方面,步骤(ii)中的细胞的培养在低乳糖条件下进行,例如在<5g乳糖/l培养基的条件下。
本发明进一步涉及根据本发明的遗传修饰细胞用于产生一种或多种HMO的用途,其中细胞中产生的至少50%w/w、例如至少60%w/w、例如至少65%w/w、例如至少70%w/w的HMO是二岩藻糖基乳糖(DFL)。
下面通过非限制性工作实施例详细描述和说明本发明的其它方面和有利特征。
定义和缩写
在细胞生物学和蛋白质生物化学中,异源表达意味着通过实验将一种蛋白质放入通常不会产生该蛋白质的细胞中。
重组DNA分子是通过将来自多个来源的遗传物质汇集在一起的实验室基因重组方法形成的DNA分子,产生基因组中不会以其它方式存在的序列。
合成核酸,例如但不限于合成启动子,是设计和化学合成的一段DNA。合成启动子通常包括核心启动子区域和异源上游调控元件(顺式基序和/或TF结合位点)的多个重复或组合。
术语“重组细胞”、“重组细胞系”或“重组菌株”在本文中用于表示其中已稳定或瞬时地引入重组DNA(即其中发生了遗传重组)的细胞、细胞系或菌株。
在本文中,遗传修饰细胞是经过基因改造以表达异源、重组和/或合成DNA的细胞。在本文中,术语“遗传修饰的”和“遗传工程的”可互换使用。重组细胞、细胞系或菌株是遗传修饰细胞、细胞系或菌株。
如本文所用,术语“遗传工程的”和/或“遗传修饰的”是指使用分子生物学方法修饰微生物细胞的基因构成。微生物细胞的基因构成的修饰包括在物种边界内和/或跨物种边界转移基因,插入、缺失、替换和/或修饰核苷酸、三联体、基因、开放阅读框、启动子、增强子、终止子和其它介导和/或控制基因表达的核苷酸序列。微生物细胞的基因组成的修饰旨在产生具有特定所需特性的遗传修饰生物体。
遗传工程微生物细胞可以包括一种或多种基因,这些基因不存在于天然(非遗传工程)形式的细胞中。用于将外源核酸分子引入和/或将外源核酸分子(重组的、异源的)插入细胞的遗传信息以插入、缺失或改变细胞遗传信息的核苷酸序列的技术是本领域技术人员已知的。
遗传工程微生物细胞可含有一种或多种存在于细胞天然形式的基因,其中所述基因被修饰并通过人工手段重新引入微生物细胞。术语“遗传工程的”还包括微生物细胞,其含有细胞内源性的核酸分子,并且在没有从细胞中去除该核酸分子的情况下对其进行了修饰。此类修饰包括通过基因置换、位点特异性突变和相关技术获得的修饰。
术语“重组核酸序列”、“重组基因/核酸/DNA”可互换使用,指人工核酸序列(即,使用用于制备核酸序列的标准实验室方法在体外产生的)。重组核酸也可以是非编码启动子或其它调控元件。
术语“重组基因/核酸/核苷酸序列/DNA编码”或“编码核酸序列”是指人工核酸序列(即,使用用于制备核酸序列的标准实验室方法在体外产生的),其包括一组连续的、非重叠的三联体(密码子),当置于适当的控制序列(即启动子)的控制下时,这些三联体被转录成mRNA并翻译成多肽。编码序列的边界通常由恰位于mRNA的5’端开放阅读框上游的核糖体结合位点、转录起始密码子(AUG、GUG或UUG)和翻译终止密码子(UAA、UGA或UAG)决定。编码序列可包括但不限于基因组DNA、cDNA、合成和异源、重组和/或合成序列。术语“核酸”包括RNA、DNA和cDNA分子。应当理解,由于遗传密码的简并性,可以产生大量编码给定蛋白质的核苷酸序列。术语核酸可与术语“多核苷酸”互换使用。“寡核苷酸”是短链核酸分子。
术语“编码……的核苷酸序列”通常是指任何多核糖核苷酸或多聚脱氧核糖核苷酸,其可以是未修饰的RNA或DNA或修饰的RNA或DNA,并且通常代表基因中编码某种多肽或蛋白质的部分。该术语包括但不限于单链和双链DNA、由单链和双链区域或单链、双链和三链区域混合而成的DNA、单链和双链RNA,以及单链和双链区域混合而成的RNA、包括可以是单链或更典型地双链或三链区域或单链和双链区域的混合物的DNA和RNA的杂化分子。该术语还包括多核苷酸,其包括编码多肽的单个连续区域或不连续区域(例如,被整合的噬菌体或插入序列或编辑打断)以及也可能包括编码和/或非编码序列的额外区域。
如本文所用,术语“异源的”是指对于细胞或生物体而言是外来的多肽、氨基酸序列、核酸分子或核苷酸序列,即不天然存在于所述细胞或生物体中多肽、氨基酸序列、核酸分子或核苷酸序列。如本文所用,“异源序列”或“异源核酸”或“异源多肽”是源自对特定宿主细胞来说是外来的来源(例如来自不同物种),或者如果来自相同来源,则是从其原始形式修饰而来。因此,与启动子可操作地连接的异源核酸的来源与启动子的来源不同,或者,如果来源相同,则是从其原始形式修饰而来。可以稳定地将异源序列引入,例如通过转染、转化、接合或转导,进宿主微生物宿主细胞的基因组,从而作为遗传修饰的宿主细胞。可应用的技术将取决于要引入序列的宿主细胞。各种技术是本领域技术人员已知的,并且例如公开于Sambrook等人,Molecular Cloning:ALaboratory Manual,2nd Ed.,Cold SpringHarbor Laboratory Press,Cold Spring Harbor,N.Y.(1989)。
如本文所用,术语“核酸”和“多核苷酸”是指单链或双链形式的脱氧核糖核苷酸或核糖核苷酸聚合物,除非另有限制,否则包括以类似于天然存在的核苷酸的形式与核酸杂交的已知的天然核苷酸的类似物。除非另有说明,特定的核酸序列包括其互补序列。
如本文所用,术语“功能基因”是指包括编码蛋白质或多肽的核苷酸序列的核酸分子,并且还包括可操作地连接所述编码蛋白质的核苷酸序列的调控序列,使得编码蛋白质或多肽的核苷酸序列可以在携带所述功能基因的微生物细胞中表达/由其表达。因此,当在允许功能基因表达的条件下培养时,所述功能基因被表达,并且表达所述功能基因的微生物细胞通常包括由功能基因的蛋白质编码区编码的蛋白质或多肽。
术语“可操作地连接”是指两个或多个核酸(例如,DNA)片段之间的功能关系。通常,它是指转录调控序列与转录序列的功能关系。可操作地连接是指在核酸表达控制序列(例如启动子、信号序列或转录因子结合位点阵列)和第二核酸序列之间存在功能性连接,其中表达控制序列影响对应于第二序列的核酸的转录和/或翻译。例如,如果启动子序列在适当的宿主细胞或其它表达系统中刺激或调控编码序列的转录,则启动子序列可操作地连接到编码序列。通常,可操作地连接到转录序列的启动子转录调控序列与转录序列在物理上是连续的,即它们是顺式作用的。
如本文所用,术语“过表达”或“过表达的”是指酶或多肽的表达水平高于在与未被遗传改造的宿主细胞相同物种的野生型细胞中测量的水平。
在本发明的上下文中,术语“寡糖”是指含有多个单糖单元的糖聚合物。本文所用的术语“寡糖”是指由三到二十个单糖残基组成的糖分子,其中每个所述单糖残基通过糖苷键与至少一个其它所述单糖单元结合。寡糖可以是单糖残基的直链或单糖残基的支链。
在一些实施方式中,优选的寡糖是由三个或四个单糖单元组成的糖聚合物,即三糖或四糖。本发明优选的寡糖是人乳寡糖(HMO)。
本文中的术语“人乳寡糖”或“HMO”是指在人乳中存在的复杂碳水化合物(参考资料,参见Urashima等人:Milk Oligosaccharides.Nova Science Publisher(2011);或Chen,Adv.Carbohydr.Chem.Biochem.72,113(2015))。HMO具有在还原端包括乳糖单元的核心结构,该单元可以被一个或多个β-N-乙酰基-乳糖胺基和/或一个或多个β-乳-N-二糖基单元延长,并且该核心结构可被α-L-岩藻吡喃糖基和/或α-N-乙酰基-神经氨酰基(唾液酸基)部分取代。
迄今为止,已经确定了至少115种HMO的结构(参见Urashima等人:MilkOligosaccharides,Nova Biomedical Books,New York,2011,ISBN:978-1-61122-831-1),而且可能还有更多存在于人乳中。
非酸性(或中性)HMO没有唾液酸残基,酸性HMO在其结构中具有至少一个唾液酸残基。非酸性(或中性)HMO可以是岩藻糖基化的或非岩藻糖基化的。
此类中性非岩藻糖基化HMO的实例包括乳-N-三糖2(LNT-2)、乳-N-四糖(LNT)、乳-N-新四糖(LNnT)、乳-N-新六糖(LNnH)、对-乳-N-新六糖(pLNnH)、对-乳-N-六糖(pLNH)和乳-N-六糖(LNH)。
中性岩藻糖基化HMO的实例包括2’-岩藻糖基乳糖(2’FL)、乳-N-岩藻五糖I(LNFP-I)、乳-N-二岩藻六糖I(LNDFH-I)、3-岩藻糖基乳糖(3FL)、二岩藻糖基乳糖(DFL)、乳-N-岩藻五糖II(LNFP-II)、乳-N-岩藻五糖III(LNFP-III)、乳-N-二岩藻六糖III(LNDFH-III)、岩藻糖基-乳-N-六糖II(FLNH-II)、乳-N-岩藻五糖V(LNFP-V)、乳-N-二岩藻六糖II(LNDFH-II)、岩藻糖基-乳-N-六糖I(FLNH-I)、岩藻糖基-对-乳-N-六糖I(FpLNH-I)、岩藻糖基-对-乳-N-新六糖II(F-pLNnH II)和岩藻糖基-乳-N-新六糖(FLNnH)。
酸性HMO的实例包括3’-唾液酸乳糖(3’-SL)、6’-唾液酸乳糖(6’-SL)、3-岩藻糖基-3’-唾液酸乳糖(FSL)、3’-O-唾液酸乳-N-四糖a(LST a)、岩藻糖基-LST a(FLST a)、6’-O-唾液酸乳-N-四糖b(LST b)、岩藻糖基-LST b(FLST b)、6’-O-唾液酸乳-N-新四糖(LSTc)、岩藻糖基-LST c(FLST c)、3’-O-唾液酸乳-N-新四糖(LST d)、岩藻糖基-LST d(FLSTd)、唾液酸-乳-N-六糖(SLNH)、唾液酸-乳-N-新六糖I(SLNH-I)、唾液酸-乳-N-新六糖II(SLNH-II)和二唾液酸-乳-N-四糖(DSLNT)。
在本发明的上下文中,乳糖不被视为HMO种类。
本文中的术语“培养(cultivating)”(或“培养(culturing)”或“培养(cultivation)”,也称为“发酵(fermentation)”)是指在培养基中和在允许且适合产生所需寡糖的条件下培养细菌细胞。在受控生物反应器中繁殖细菌表达细胞是业界已知的方法。本领域技术人员在结合本技术人员的技术和专家背景阅读本发明的公开内容后将容易获得一对合适的细菌宿主细胞以及用于培养它们的培养基和条件。
如本文所用,术语“回收”是指从宿主微生物培养物中分离、收获、纯化、收集或以其它方式分离该宿主微生物产生的寡糖。
本文所用的术语“酶活性”是指包括任何显示酶活性,并充当催化剂以引起特定的生化反应,同时在反应中保持不变的分子,特别是蛋白质。特别地,具有酶促活性的蛋白质意在包括在该术语中,其能够将底物转化为产物。
在酶促反应中,在这个过程开始时称为底物的分子被转化为不同的被称为产物的分子。生物细胞中几乎所有的化学反应都需要酶才能以足以维持生命的速率发生。由于酶对其底物具有选择性并且仅加速许多可能性中的少数反应,因此细胞中产生的酶组决定了该细胞中发生的代谢途径。
如本文所用,术语“变体”是指分别不同于参考多核苷酸或多肽的多核苷酸或多肽,但保留参考多核苷酸或多肽的基本(酶促)特性,也称为功能变体。多核苷酸的典型变体在核苷酸序列上不同于另一个参考多核苷酸。变体核苷酸序列的变化可能会或可能不会改变由参考多核苷酸编码的多肽的氨基酸序列。如下文所讨论,核苷酸改变可导致由参考序列编码的多肽中的氨基酸取代、添加、缺失、融合和截短。
变体和参考多肽的氨基酸序列可能因任何组合中的一处或多处取代、添加、缺失而不同。通常,差异是有限的,因此参考多肽和变体的序列总体上非常相似,并且在许多区域中是相同的。取代或插入的氨基酸残基可以是也可以不是由遗传密码编码的氨基酸残基。多核苷酸或多肽的变体可以是天然存在的例如等位基因变体,或者它可以是已知不会天然存在的变体。多核苷酸和多肽的非天然存在的变体可以通过诱变技术、通过直接合成和通过本领域技术人员已知的其它重组方法制备。
因此,其中公开的任何基因/蛋白质的“功能变体”旨在指定基因/蛋白质的序列变体仍然保留各自片段所来源的基因或蛋白质的相同或稍低的活性。
在本发明的范围内,核酸/多核苷酸和多肽多态性变体、等位基因、突变体和种间同源物也包括在那些术语中,它们具有的核酸/氨基酸序列,优选在至少约25、50、100、200、500、1000以上核酸/氨基酸的区域上,具有与野生型核酸/氨基酸序列大于约60%的核酸/氨基酸序列同一性,65%、70%、75%、80%、85%、90%,优选91%、92%、93%、94%、95%、96%、97%、98%或99%或更大的核酸/氨基酸序列同一性。
在两个或多个核酸或氨基酸序列的上下文中,术语“[某个]的序列同一性%”意指当在比较窗口或指定的核酸或氨基酸序列上进行最大对应性比较和比对时,两个或多个序列以给定的百分比具有共同的核苷酸或氨基酸残基(即序列具有至少百分之90(%)同一性)。核酸或氨基酸序列的同一性百分比可使用具有默认参数的BLAST 2.0序列比较算法,或者通过人工比对和目视检查来测量(参见例如http://www.ncbi.nlm.nih.gov/BLAST/)。该定义也适用于测试序列的互补序列和具有缺失和/或添加的序列,以及具有取代的序列。适用于确定百分比同一性、序列相似性和比对的算法示例是BLAST 2.2.20+算法,其描述于Altschul等人Nucl.Acids Res.25,3389(1997)中。BLAST 2.2.20+用于确定本发明核酸和蛋白质的序列同一性百分比。用于进行BLAST分析的软件可通过国家生物技术信息中心(http://www.ncbi.nlm.nih.gov/)公开获得。常用的序列比对算法的实例是
CLUSTAL Omega(http://www.ebi.ac.uk/Tools/msa/clustalo/)、
EMBOSS Needle(http://www.ebi.ac.uk/Tools/psa/emboss_needle/)、MAFFT(http://mafft.cbrc.jp/alignment/server/)或
MUSCLE(http://www.ebi.ac.uk/Tools/msa/muscle/)。
优选地,为了本发明的目的,两个氨基酸序列之间的序列同一性使用如在EMBOSS包(EMBOSS:The European Molecular Biology Open Software Suite,Rice等人,2000,Trends Genet.16:276-277)的Needle程序中实施的Needleman-Wunsch算法(Needlemanand Wunsch,1970,J.Mo/.Biol.48:443-453)来确定,优选版本5.0.0或更高版本(可访问https://www.ebi.ac.uk/Tools/psa/emboss needle/)。使用的参数是空位开放罚分(gapopen penalty)10、空位扩展罚分(gap extension penalty)0.5和EBLOSUM62(30BLOSUM62的EMBOSS版本)替换矩阵(substitution matrix)。标记为“最长同一性”的Needle输出(使用-nobrief选项获得)用作同一性百分比,计算如下:(相同残基×100)/(比对长度-比对中空位总数)。
优选地,为了本发明的目的,两个核苷酸序列之间的序列同一性使用如在EMBOSS包(EMBOSS:The European Molecular Biology Open Software Suite,Rice等人,2000,Trends Genet.16:276-277)的Needle程序中实施的Needleman-Wunsch算法(Needlemanand Wunsch,1970如上文)来确定,10优选版本5.0.0或更高版本。使用的参数是空位开放罚分(gap open penalty)10、空位扩展罚分(gap extension penalty)0.5和DNAFULL(NCBINUC4.4的EMBOSS版本)替换矩阵。标记为“最长同一性”的Needle输出(使用-nobrief选项获得)用作同一性百分比,计算如下:(相同的脱氧核糖核苷酸×100)/(比对长度-比对中空位总数)。
除非另有说明,本文中使用的所有技术和科学术语与本发明所属领域的普通技术人员所普遍理解的含义相同。Singleton等人(1994)Dictionary of Microbiology andMolecular Biology,第二版,John Wiley and Sons(New York)为技术人员提供本发明中使用的许多术语的通用词典。尽管与本文描述的那些相似或等同的任何方法和材料都可以用于本发明的实践或测试,但是描述了优选的方法和材料。本申请中所需的大部分命名法和一般实验室程序可在Sambrook等人,Molecular Cloning:ALaboratory Manual,Vol.1-3,Cold Spring Harbor Laboratory,Cold Spring Harbor,New York(2012);WilsonK.and Walker J.,Principles and Techniques of Biochemistry and MolecularBiology(2010),Cambridge University Press;或在Maniatise等人,Molecular CloningAlaboratory Manual,Cold Spring Harbor Laboratory(2012);或在Ausubel等人,Current protocols in molecular biology,John Wiley and Sohns(2010)中找到。这些手册在下文中分别称为“Sambrook等人”、“Wilson&Walker”、“Maniatise等人”、“Ausubel等人”。
应当注意,权利要求中使用的术语“包括”不应被解释为限于其后所列的方法;它不排除其它元素或步骤。因此,它被解释为指定所提及的所述特征、整数、步骤或组件的存在,但不排除一个或多个其它特征、整数、步骤或组分、或其组的存在或添加。因此,表述“包括装置A和B的设备”的范围不应限于仅由组件A和B组成的设备。这意味着对于本发明,设备的唯一相关组件是A和B。术语“包括”还包括术语“由……组成”。
贯穿本说明书对“一个实施方式(one embodiment)”或“一个实施方式(anembodiment)”的引用意味着结合该实施方式描述的特定特征、结构或特性被包括在本发明的至少一个实施方式中。因此,贯穿本说明书各处出现的短语“在一个实施方式中(in oneembodiment)”或“在一个实施方式中(in an embodiment)”不一定都但可以指代相同的实施方式。此外,在一个或多个实施方式中,特定特征、结构或特征可以以任何合适的方式组合,正如本领域的普通技术人员从本公开中显而易见的那样。
在此处提供的描述和附图中,阐述了许多具体细节。然而,应当理解,可以在没有这些具体细节的情况下实践本发明的实施方式。在其它情况下,未详细示出众所周知的方法、结构和技术以免混淆对本描述的理解。
类似地,应当理解,在本发明的示例性实施方式的描述中,为了简化公开和帮助理解各种发明方面的一个或多个目的,有时将本发明的各种特征组合在单个实施方式、附图或其描述中。然而,这种公开方法不应被解释为反映要求保护的发明需要比每项权利要求中明确叙述的更多的特征的意图。相反,如所附权利要求所反映的,创造性方面在于少于单个前述公开实施方式的所有特征。
因此,详细描述之后的权利要求特此明确并入该详细描述中,每个权利要求独立作为本发明的单独实施方式。
具体实施方式
本发明涉及一种用于高效产生特定HMO的遗传修饰细胞以及所述遗传修饰细胞在产生HMO的方法中的用途。产生的HMO主要是DFL,其产生量相当于所产生的总HMO的大于50%w/w,例如总HMO的至少70%w/w。产生的其它HMO主要选自3FL和2’FL及其组合。
一种能够产生二岩藻糖基乳糖(DFL)且3-岩藻糖基乳糖(3FL)和/或2’-岩藻糖基乳糖(2’FL)含量相对较低的遗传修饰细胞。
特别地,本发明涉及一种能够合成寡糖,优选异源寡糖,特别是人乳寡糖(HMO)的遗传修饰细胞。因此,本发明的细胞被修饰以表达一组异源、重组和/或合成核酸,这些核酸是细胞合成一种或多种HMO所必需的并且使细胞能够合成一种或多种HMO,例如编码一种或多种具有如下所述的糖基转移酶活性的酶的基因。
可以进一步修饰本发明的产生寡糖的遗传修饰细胞以包括异源、重组和/或合成核酸序列,优选地,DNA序列,其编码推定的MFS(主要易化因子超家族)转运蛋白。
一般来说,2’FL的产生需要遗传修饰细胞表达活性α-1,2-岩藻糖基转移酶;为了产生3FL,遗传修饰细胞需要表达活性α-1,3-岩藻糖基转移酶。然而,从本文的实施例可以看出,由同时表达活性α-1,2-岩藻糖基转移酶和活性α-1,3-岩藻糖基转移酶的本发明遗传修饰细胞产生的主要HMO主要是DFL。
如实验部分所示,发现使用表达α-1,2-岩藻糖基转移酶、α-1,3-岩藻糖基转移酶和任选地选自主要易化因子超家族(MFS)的转运蛋白的产生HMO的重组细胞,导致与HMO的发酵和纯化均相关的HMO制造过程的非常明显的改进。本文公开的用于HMO产生的遗传修饰细胞和方法提供更高的HMO总产率、更低的副产物形成或副产物与产物的比率、更低的每次发酵的生物质形成并且促进了发酵液的下游加工过程中HMO的简化回收。
特别是,令人惊讶的是,编码α-1,2-岩藻糖基转移酶和α-1,3-岩藻糖基转移酶的DNA序列的组合表达在本文中被证明主要导致二岩藻糖基乳糖(DFL)的产生,且3-岩藻糖基乳糖(3FL)和/或2’-岩藻糖基乳糖(2’FL)含量相对较低。具体地,选自FutC或WgbL或其功能变体的α-1,2-岩藻糖基转移酶与选自FutA或FucT或其功能变体的α-1,3-岩藻糖基转移酶组合导致DFL的产生,其构成由遗传修饰细胞产生的总HMO的至少50%w/w。
根据发酵条件和酶的表达水平,编码α-1,2-岩藻糖基转移酶和α-1,3-岩藻糖基转移酶的DNA序列的组合表达导致主要产生二岩藻糖基乳糖(DFL),2’-岩藻糖基乳糖(2’FL)含量相对较低,且3-岩藻糖基乳糖(3FL)少于总HMO的1%w/w。
因此,在本发明的一个实施方式中,编码α-1,2-岩藻糖基转移酶和α-1,3-岩藻糖基转移酶的DNA序列的组合表达导致DFL(至少占总HMO的70%w/w)、2’FL(不大于总HMO的30%w/w)的产生,令人惊讶的是基本上没有3FL。
根据发酵条件和酶的表达水平,编码α-1,2-岩藻糖基转移酶和α-1,3-岩藻糖基转移酶的DNA序列的组合表达导致主要产生二岩藻糖基乳糖(DFL),3-岩藻糖基乳糖(3FL)含量相对较低,且2’-岩藻糖基乳糖(2’FL)少于总HMO的1%w/w。
因此,在本发明的一个实施方式中,编码α-1,2-岩藻糖基转移酶和α-1,3-岩藻糖基转移酶的DNA序列的组合表达导致DFL(至少占总HMO的70%w/w)、3FL(不大于总HMO的30%w/w)的产生,令人惊讶的是基本上没有2’FL。
在一个实施方式中,α-1,2-岩藻糖基转移酶是FutC或与SEQ ID NO:37具有至少90%同一性例如至少95%同一性的功能变体,组合α-1,3-岩藻糖基转移酶FutA或与SEQ IDNO:38或SEQ ID NO:39具有至少90%同一性例如至少95%同一性的功能变体。如果细胞中编码FutC和FutA岩藻糖基转移酶的重组核酸序列的数量在1:1、例如1:2、例如1:3的范围,则是有利的。如果细胞中活性岩藻糖基转移酶α-1,2-岩藻糖基转移酶:α-1,3-岩藻糖基转移酶的比率,例如FutC:FutA或FutC:FucT或FutC:moumou比率在1:1、例如1:2、例如1:3、例如1:4、例如1:5、例如2:3例如2:5的范围,则是特别有利的。
此外,如实验部分所公开,包括选自主要易化因子超家族(MFS)的转运蛋白的表达甚至进一步增强了DFL的选择性产生,例如至多总HMO的25%,例如5%,10%、15%、20%或25%w/w。
在本发明的一个方面,与除MFS转运蛋白外其它方面均相同的细胞(对照细胞/菌株)相比,重组或异源MFS转运蛋白的引入增加了遗传修饰细胞产生的DFL的量。在一个实施方式中,与没有MFS转运蛋白的相同遗传修饰细胞相比,包括α-1,2-岩藻糖基转移酶和α-1,3-岩藻糖基转移酶和重组MFS转运蛋白的遗传修饰细胞多产生至少5%的DFL。优选地,与没有MFS转运蛋白的对照细胞相比,重组或异源MFS转运蛋白的引入使DFL产量增加至少8%、10%、15%、20%或25%。
在一个实施方式中,编码α-1,2-岩藻糖基转移酶和α-1,3-岩藻糖基转移酶与选自主要易化因子超家族(MFS)的转运蛋白的DNA序列的组合表达导致DFL(至少占总HMO的至少55%w/w,例如65%w/w)和2’FL、3FL(不大于总HMO的45%w/w)的产生。
在一个实施方式中,编码α-1,2-岩藻糖基转移酶和α-1,3-岩藻糖基转移酶与选自主要易化因子超家族(MFS)的转运蛋白的DNA序列的组合表达导致DFL(至少占总HMO的70%w/w)和2’FL、3FL(不大于总HMO的30%w/w)的产生。
在特别优选的实施方式中,编码α-1,2-岩藻糖基转移酶和α-1,3-岩藻糖基转移酶与选自主要易化因子超家族(MFS)的转运蛋白的DNA序列的组合表达导致DFL(至少占总HMO的90%w/w)和2’FL、3FL(不大于总HMO的10%w/w)的产生。
一方面,本发明涉及能够产生一种或多种人乳寡糖(HMO)的遗传修饰细胞,其中所述细胞包括编码以下的异源、重组和/或合成核酸:
a.α-1,2-岩藻糖基转移酶,和
b.α-1,3-岩藻糖基转移酶。
优选地,由细胞产生的主要HMO是二岩藻糖基乳糖(DFL),更优选地,所产生的总HMO的大于50%w/w,例如大于65%w/w是二岩藻糖基乳糖(DFL)。
术语“主要HMO”应理解为由遗传修饰细胞产生的HMO混合物中最丰富的HMO。因此,就DFL而言,这意味着DFL比,例如,2’FL和3FL的个体的量更多,例如40%DFL和30%2’FL以及30%3FL将使DFL成为遗传修饰细胞产生的主要HMO。
在一个优选的方面,本发明涉及一种能够产生一种或多种人乳寡糖(HMO)的遗传修饰细胞,其中所述细胞包括编码以下的异源、重组和/或合成核酸:
a.α-1,2-岩藻糖基转移酶,
b.α-1,3-岩藻糖基转移酶,和
c.选自主要易化因子超家族(MFS)的转运蛋白。
优选地,具有MFS转运蛋白的遗传修饰细胞比没有MFS转运蛋白的遗传修饰细胞多产生至少5%w/w的二岩藻糖基乳糖(DFL)。
在本发明的一方面,遗传修饰细胞产生总HMO的至少45%,例如至少50%w/w DFL,例如45-99%,例如至少55、60、65、70、75、80、85、90、95或99% DFL。优选70、75、80、85、90、95或99% DFL。
在本发明的一方面,遗传修饰细胞产生总HMO的至多45%w/w的2’FL和/或3FL,例如5-10%、5-15%、5-30%、5-40%,例如至多0.5、1、5、10、5、20、25、30、35或40%2’FL和/或3FL。
在本发明的一方面,遗传修饰细胞产生总HMO的至多5%w/w,例如在0-5%之间,例如至多0.1、0.2、0.3、0.4、0.5、0.6、0.7、0.8、0.9、1、1.5、2、2.5、3、3.5、4、4.5或5%2’FL和/或3FL。
本发明的遗传修饰细胞通常是微生物细胞,优选原核细胞。合适的微生物细胞包括酵母细胞、细菌细胞、古细菌细胞、藻类细胞和真菌细胞。
遗传修饰的微生物细胞可以是细菌细胞,优选选自芽孢杆菌(Bacillus)、乳杆菌(Lactobacillus)、乳球菌(Lactococcus)、肠球菌(Enterococcus)、双歧杆菌(Bitidobacterium)、芽孢乳杆菌(Sporoiactobacillus spp.)、小单孢菌(Micromomosporaspp.)、微球菌(Micrococcus spp.)、红球菌(Rhodococcus spp.)和假单胞菌(Pseudomonas)的细菌细胞。合适的细菌种为枯草芽孢杆菌(Bacillus subtilis)、地衣芽孢杆菌(Bacillus licheniformis)、凝结芽孢杆菌(Bacillus coagulans)、嗜热芽孢杆菌(Bacillus thermophilus)、侧孢芽孢杆菌(Bacillus laterosporus)、巨大芽孢杆菌(Bacillus megaterium)、丝状芽孢杆菌(Bacillus mycoides)、短小芽孢杆菌(Bacilluspumilus)、迟缓芽孢杆菌(Bacillus lentus)、蜡样芽孢杆菌(Bacillus cereus)和环状芽孢杆菌(Bacillus circulans)、长双歧杆菌(Bifidobacterium longum)、婴儿双歧杆菌(Bifidobacterium infantis)、两岐双岐杆菌(Bifidobacterium bifidum)、弗氏枸橼酸杆菌(Citrobacter freundii)、解纤维梭菌(Clostridium cellulolyticum)、食气永达尔梭菌(Clostridium ljungdahlii)、自产乙醇梭菌(Clostridium autoethanogenum)、丙酮丁醇梭菌(Clostridium acetobutylicum)、谷氨酸棒桿菌(Corynebacterium glutamicum)、粪肠球菌(Enterococcus faecium)、肠球菌嗜热菌(Enterococcus thermophiles)、大肠杆菌(Escherichia coli)、草生欧文氏菌(Erwinia herbicola)(成团泛菌(Pantoeaagglomerans))、嗜酸乳杆菌(Lactobacillus acidophilus)、唾液乳杆菌(Lactobacillussalivarius)、植物乳杆菌(Lactobacillus plantarum)、瑞士乳杆菌(Lactobacillushelveticus)、德氏乳杆菌(Lactobacillus delbrueckii)、鼠李糖乳杆菌(Lactobacillusrhamnosus)、保加利亚乳杆菌(Lactobacillus bulgaricus)、卷曲乳杆菌(Lactobacilluscrispatus)、加氏乳杆菌(Lactobacillus gasseri)、干酪乳杆菌(Lactobacillus casei)、罗伊氏乳杆菌(Lactobacillus reuteri)、詹氏乳杆菌(Lactobacillus jensenii)和乳酸乳球菌(Lactococcus lactis)、柠檬泛菌(Pantoea citrea)、胡萝卜软腐果胶杆菌(Pectobacterium carotovorum)、费氏丙酸杆菌(Proprionibacterium freudenreichii)、荧光假单胞菌(Pseudomonas fluorescens)和绿脓假单胞菌(Pseudomonas aeruginosa)、嗜热链球菌(Streptococcus thermophiles)和野油菜黄单胞菌(Xanthomonascampestris)。当阅读本公开内容时,本领域技术人员将意识到更多的细菌菌株。
如实验部分所例示的,本发明优选的遗传修饰微生物细胞是大肠杆菌细胞。
遗传工程细胞可以是酵母细胞,优选选自酵母菌属(Saccharomycessp.)特别是酿酒酵母(Saccharomyces cerevisiae)、覆膜孢酵母属(Saccharomycopsis sp.)、毕赤酵母属(Pichia sp.)特别是巴斯德毕赤酵母菌(Pichia pastoris)、汉逊酵母菌属(Hansenulasp.)、克鲁维酵母菌属(Kluyveromyces sp.)、亚罗酵母菌属(Yarrowia sp.)、红酵母菌属(Rhodotoruta sp.)和裂殖酵母菌属(Schizosaccharomyces sp.)。
遗传工程细胞可以是丝状真菌,例如曲霉属(Aspargillus sp.)、鐮刀菌属(Fusarium sp.)或Thricoderma sp.,示例性种为黑曲霉(A.niger)、小巢状麹菌(A.nidulans)、米曲菌(A.oryzae)、腐皮镰刀菌(F.solani)、禾谷镰刀菌(F.graminearum)和里氏木霉(T.reesei)。
遗传修饰细胞可以进一步包括控制序列,使得能够控制内源或异源、重组和/或合成序列的过表达。如上文所定义,本文与表述“核酸表达控制序列”同义使用的术语“控制序列”包括启动子序列、信号序列或转录因子结合位点阵列,这些序列影响可操作地连接到控制序列的核酸序列的转录和/或翻译。
核酸序列可以置于诱导型启动子的控制之下,诱导型启动子是指导基因表达的启动子,其中表达水平可通过环境或发育因素改变,例如温度、pH、厌氧或需氧条件、光照、转录因子和化学物质。此类启动子在本文中称为“诱导型”启动子,其允许控制本发明中使用的蛋白质的表达时间。对于大肠杆菌和其它细菌宿主细胞,诱导型启动子是本领域技术人员已知的。
用于本发明的核酸序列可以例如包括在将被稳定转化/转染或以其它方式引入宿主微生物细胞中的载体中。
多种表达系统可用于产生多肽。这些载体尤其包括染色体、游离型和病毒来源的载体,例如,来自细菌质粒、来自噬菌体、来自转座子、来自酵母游离体、来自插入元件、来自酵母染色体元件、来自病毒的载体,以及来自其组合的载体,例如源自质粒和噬菌体遗传元件的那些,例如粘粒和噬菌粒。表达系统构建体可以包括调控以及引起表达的控制区。一般而言,任何适合维持、繁殖或表达多核苷酸以及在宿主中合成多肽的系统或载体都可用于在这方面的表达。合适的DNA序列可以通过多种熟知和常规技术中的任何一种插入到表达系统中,例如,Sambrook等人,同上。
本领域有大量与用于分离、合成、纯化和扩增遗传物质以用于转化选定的宿主生物的“重组DNA”方法有关的专利和文献出版物。因此,用包括选择的外源(即外来或“异源”)DNA序列的“杂交”病毒或环状质粒DNA转化宿主生物体是常识。本领域已知的程序首先涉及通过酶促切割环状病毒或质粒DNA以形成线性DNA链来产生转化载体。选定的外来DNA链通常包括编码所需蛋白质产物的序列,通过使用相同/相似的酶以线性形式制备。在存在能够影响恢复过程的连接酶的情况下,将线性病毒或质粒DNA与外来DNA一起孵育,形成“杂交”载体,其中包括“剪接”到病毒或环状DNA质粒中的所选外源DNA片段。
α-1,2-岩藻糖基转移酶、α-1,3-岩藻糖基转移酶
本发明的遗传修饰细胞包括异源、重组和/或合成核酸,使其能够表达α-1,2-岩藻糖基转移酶和α-1,3-岩藻糖基转移酶。
通常,并且贯穿本公开,术语“糖基转移酶活性”或“糖基转移酶”指代并涵盖负责二糖、寡糖和多糖的生物合成的酶的活性。这些酶催化单糖部分从活化的核苷酸单糖/糖(“糖基供体”)转移到糖基受体分子。
术语“α-1,2-岩藻糖基转移酶”或“岩藻糖基转移酶”或编码“α-1,2-岩藻糖基转移酶”或“岩藻糖基转移酶”的核酸/多核苷酸是指催化岩藻糖从供体底物例如GDP-岩藻糖以α-1,2-键转移到受体分子的糖基转移酶。
术语“α-1,3-岩藻糖基转移酶或岩藻糖基转移酶”或编码“α-1,3-岩藻糖基转移酶或岩藻糖基转移酶”的核酸/多核苷酸指催化岩藻糖从供体底物例如GDP-岩藻糖以α-1,3-键转移到受体分子的糖基转移酶。受体分子可以是例如乳糖、2’-岩藻糖基乳糖、3-岩藻糖基乳糖或更复杂的HMO结构。
α-1,2-岩藻糖基转移酶和α-1,3-岩藻糖基转移酶是本领域众所周知的。表1列出了可由核酸编码的α-1,2-岩藻糖基转移酶和α-1,3-岩藻糖基转移酶的非限制性选择。本发明还包括表1中列出的α-1,2-岩藻糖基转移酶和/或α-1,3-岩藻糖基转移酶的功能同源物,其氨基酸序列与相应蛋白质序列ID(GenBank)中给出的序列具有至少80%同一性,优选至少85%同一性,更优选至少90%,例如95%、96%、97%、98%或99%同一性。
表1-岩藻糖基转移酶
在根据本发明的遗传修饰细胞的本发明优选的实施方式中,编码α-1,2-岩藻糖基转移酶的异源核酸是futC基因或如上所定义的其功能同源物,例如编码SEQ ID NO:37的氨基酸序列或与SEQ ID NO:37具有至少90%同一性、例如至少95%同一性的氨基酸序列的核苷酸序列。通常,预期表达编码α-1,2-岩藻糖基转移酶的核酸的遗传修饰细胞主要产生2’FL。
在根据本发明的遗传修饰细胞的本发明优选的实施方式中,编码α-1,3-岩藻糖基转移酶的异源核酸选自futA基因、fucT基因或moumou基因和如上定义的其功能同源物。
在一个实施方式中,所表达的异源α1,3-岩藻糖基转移酶包括与SEQ ID NO:38相同的多肽或优选由其组成。根据SEQ ID NO:38的蛋白质是FutA的功能变体,其中128位的Ala(A)被Asn(N)取代,129位的His(H)被Glu(E)取代(Choi等人Biotechnol.Bioengin.113,1666(2016))。FutA的另一个功能变体描述于WO2020115671,其中128位的Ala(A)被Asn(N)取代,129位的His(H)被Glu(E)取代,148位的Asp(D)被Gly(G)取代,221位的Tyr(Y)被Cys(C)取代。根据WO2020115671的SEQ ID NO:7的蛋白质称为FutA_mut2。在本发明中,已标识出FutA的进一步功能变体,其中46位的Ser(S)被Phe(F)取代,128位的Ala(A)被Asn(N)取代,129位的His(H)被Glu(E)取代,132位的Tyr(Y)被Ile(I)取代,148位的Asp(D)被Gly(G)取代,221位的Tyr(Y)被Cys(C)取代。
本发明的一个实施方式涉及一种1,3-岩藻糖基转移酶,其氨基酸序列与SEQ IDNO:38具有至少90%、例如至少95%、例如至少98%的同一性,并且包括或由以下取代组成:S46F、A128N、H129E、Y132I、D148G和Y221C。具体地涉及包括SEQ ID NO:39或由其组成的蛋白质,其被称为FutA_mut4并且由SEQ ID NO:32的核苷酸序列编码。本发明进一步涉及使用FutA_mut4产生DFL或3FL。
在一个实施方式中,1,3-岩藻糖基转移酶futA基因编码包括SEQ ID NO:38或SEQID NO:39的氨基酸序列或与SEQ ID NO:38或SEQ ID NO:39具有至少90%同一性、例如至少95%同一性的氨基酸序列,或由其组成的氨基酸序列,例如WO2020115671的SEQ ID NO:7的氨基酸序列(并入本文以供参考)。
在另一个实施方式中,1,3-岩藻糖基转移酶fucT基因编码包括SEQ ID NO:40的氨基酸序列,或与SEQ ID NO:40具有至少90%同一性、例如至少95%同一性的氨基酸序列,或由其组成的氨基酸序列。
在另一个实施方式中,1,3-岩藻糖基转移酶moumou基因编码包括SEQ ID NO:54的氨基酸序列,或与SEQ ID NO:54具有至少90%同一性、例如至少95%同一性的氨基酸序列,或由其组成的氨基酸序列。
通常,预计包括编码α-1,3岩藻糖基转移酶的异源、重组和/或合成核酸的遗传修饰细胞将主要产生3FL。
因此,令人惊奇的是,由本发明的遗传修饰细胞产生的最大量的HMO是DFL。应当理解,单一HMO的主要量是DFL组分。
转运蛋白
本发明提供能够产生人乳寡糖(HMO)的重组细胞,其中细胞表达α-1,2-岩藻糖基转移酶、α-1,3-岩藻糖基转移酶和编码推定的MFS(主要易化因子超家族)转运蛋白的异源基因。所述转运蛋白基因通常源自黏质沙雷菌(Serratia marcescens)、Rosenbergiellanectarea、成团泛菌(Pantoea vagans)、耶尔森氏菌(Yersinia frederiksenii)和Rouxiella badensis。
主要易化因子超家族(MFS)转运蛋白可选自但不限于marc、nec、vag、fred或bad。在某些实施方式中,MFS转运蛋白不是setA或YberC。
更具体地,本发明涉及为产生寡糖、特别是HMO而优化的遗传修饰细胞,其中异源、重组和/或合成核酸编码与SEQ ID NO:1(MARC)或SEQ ID NO:2(NEC)或SEQ ID NO:3(VAG)或SEQ ID NO:42(FRED)或SEQ ID NO:43(BAD)的氨基酸序列具有至少80%序列同一性、例如90%、例如95%序列同一性的转运蛋白。
本文标识为SEQ ID NO:1的氨基酸序列是与具有GenBank登录号WP_060448169.1的氨基酸序列具有100%同一性的氨基酸序列。具有SEQ ID NO:1的氨基酸序列的MFS转运蛋白在本文中可互换地称为“Marc蛋白”或“Marc转运蛋白”或“marc”;编码marc蛋白的核酸序列在本文中被标识为“Marc编码核酸/DNA”或“marc基因”或“marc”。
本文标识为SEQ ID NO:2的氨基酸序列是与具有GenBank登录号WP_092672081.1
(https://www.ncbi.nlm.nih.gov/protein/WP_092672081.1)的氨基酸序列具有100%同一性的氨基酸序列。具有SEQ ID NO:2的氨基酸序列的MFS转运蛋白在本文中可互换地称为“Nec蛋白”或“Nec转运蛋白”或“Nec”;编码Nec蛋白的核酸序列在本文中被标识为“nec编码核酸/DNA”或“nec基因”或“nec”。
本文标识为SEQ ID NO:3的氨基酸序列是与具有GenBank登录号WP_048785139.1
(https://www.ncbi.nlm.nih.gov/protein/WP_048785139.1)的氨基酸序列具有100%同一性的氨基酸序列。具有SEQ ID NO:3的氨基酸序列的MFS转运蛋白在本文中可互换地称为“Vag蛋白”或“Vag转运蛋白”或“Vag”;编码Vag蛋白的核酸序列在本文中被标识为“vag编码核酸/DNA”或“vag基因”或“vag”。
本文标识为SEQ ID NO:42的氨基酸序列是与具有GenBank登录号WP_087817556.1(https://www.ncbi.nlm.nih.gov/protein/WP_087817556.1)的氨基酸序列具有100%同一性的氨基酸序列。具有SEQ ID NO:42的氨基酸序列的MFS转运蛋白在本文中可互换地称为“Fred蛋白”或“Fred转运蛋白”或“Fred”;编码Fred蛋白的核酸序列在本文中被标识为“fred编码核酸/DNA”或“fred基因”或“fred”。
本文标识为SEQ ID NO:43的氨基酸序列是与具有GenBank登录号WP_017489914.1(https://www.ncbi.nlm.nih.gov/protein/WP_017489914.1)的氨基酸序列具有100%同一性的氨基酸序列。具有SEQ ID NO:43的氨基酸序列的MFS转运蛋白在本文中可互换地标识为“Bad蛋白”或“Bad转运蛋白”或“Bad”;编码Bad蛋白的核酸序列在本文中被称为“bad编码核酸/DNA”或“bad基因”或“bad”。
本发明涉及经优化用于产生一种或多种特定寡糖,特别是一种或多种特定HMO,例如岩藻糖基化HMO,例如2’FL、3FL、DFL、或其混合物的遗传修饰细胞,其包括编码与SEQ IDNO:1(MARC)或SEQ ID NO:2(NEC)或SEQ ID NO:3(VAG)或SEQ ID NO:42(FRED)或SEQ IDNO:43(BAD)的氨基酸序列具有至少80%序列同一性、优选至少85%、更优选至少90%、甚至更优选至少95%序列同一性、或甚至100%序列同一性的蛋白质的异源、重组和/或合成核酸。
在本发明的遗传修饰细胞中表达的推定的MFS(主要易化因子超家族)转运蛋白优选转运三-HMO和四-HMO,例如三糖如2’FL、3FL和四糖如DFL。
发现编码推定的MFS(主要易化因子超家族)转运蛋白(例如Marc、Nec、Vag、Fred或Bad蛋白)的DNA序列在本文所述的HMO产生细胞中的表达与HMO总产量的增加有关,其中由细胞产生的50%w/w以上、例如65%w/w以上是二岩藻糖基乳糖(DFL)。
此外,非常出乎意料的是,推定的MFS(主要易化因子超家族)转运蛋白,例如Marc蛋白、Nec或Vag或Fred或Bad蛋白在本文所述的HMO产生细胞中的表达导致发酵过程中生物质的形成减少,并且发酵结束时死细胞数量的减少反映了更健康的细胞培养,这使得制造过程更加高效,因为每个生物质单位产生更多的产物。
术语“主要易化因子超家族(MFS)”是指二级活性转运蛋白类的一个庞大且异常多样化的家族,它负责转运一系列不同的底物,包括糖、药物、疏水分子、肽、有机离子、等。糖转运蛋白的特异性是高度不可预测的,并且对例如寡糖具有特异性的新型转运蛋白的鉴定需要减轻实验室实验的负担(有关更多详细信息,请参见Reddy V.S.等人,(2012),FEBSJ.279(11):2022–2035)。
术语“MFS转运蛋白”在本文中意指促进寡糖(优选HMO)通过细胞膜转运,优选由宿主细胞合成的HMO/寡糖从细胞胞质溶胶转运至细胞培养基的蛋白质,该HMO/寡糖优选为包括三个或四个糖单元的HMO/寡糖,特别是2’FL和/或3FL和/或DFL。此外,或替代地,MFS转运蛋白还可以促进根据本发明不被认为是HMO或寡糖的分子(例如乳糖、葡萄糖、细胞代谢物或毒素)的外排。
宿主细胞的遗传修饰
为了能够合成一种或多种HMO,本发明的遗传修饰宿主细胞包括至少一种异源、重组和/或合成核酸,其编码具有糖基转移酶活性的功能性酶,包括α-1,2-岩藻糖基转移酶和α-1,3-岩藻糖基转移酶,其可选自表1中给出的列表。优选地,糖基转移酶由单独的异源、重组和/或合成核酸编码,使得至少两个异源、重组和/或合成核酸存在于修饰的宿主细胞中以编码α-1,2-岩藻糖基转移酶和α-1,3-岩藻糖基转移酶。
糖基转移酶基因可以整合到宿主细胞的基因组中(通过染色体整合),或者,它可以包括在质粒DNA中并表达为质粒携带的。编码具有糖基转移酶活性的不同酶的两种以上的异源、重组和/或合成核酸可以整合到基因组中和/或从质粒表达,酶例如α-1,2-岩藻糖基转移酶(编码第一种糖基转移酶的第一异源、重组和/或合成核酸)与α-1,3-岩藻糖基转移酶(编码第二种糖基转移酶的第二异源、重组和/或合成核酸)组合,其中第一和第二异源、重组和/或合成核酸可以彼此独立地整合到染色体上或整合到质粒上。在一个优选的实施方式中,第一和第二异源、重组和/或合成核酸都稳定地整合到产生细胞的染色体中;在另一个实施方式中,第一和第二糖基转移酶中的至少一个是质粒携带的。
此外,推定的MFS(主要易化因子超家族)转运蛋白基因可以(通过染色体整合)整合到宿主细胞的基因组中,或者,它可以包括在质粒DNA中并以质粒携带的方式表达。第一和第二以及另外的异源、重组和/或合成核酸可以彼此独立地整合到染色体上或整合到质粒上。在一个优选的实施方式中,第一、第二和另外的异源、重组和/或合成核酸被稳定地整合到产生细胞的染色体中;在另一个实施方式中,第一、第二和另外的异源、重组和/或合成核酸中的至少一个是质粒携带的。
本发明的异源、重组和/或合成核酸序列可以是编码DNA序列,例如DNA序列,例如基因,或非编码DNA序列,例如调控DNA,例如启动子序列。本发明的一方面涉及提供一种重组细胞,其包括编码产生一种或多种HMO所必需的酶的重组DNA序列和编码糖转运蛋白的DNA序列。因此,在一个实施方式中,本发明涉及包括编码核酸序列的核酸构建体,即,目的基因的异源、重组和/或合成DNA序列,例如糖基转移酶基因或MFS基因,以及非编码DNA序列,例如启动子DNA序列,例如源自lac操纵子、mglB操纵子或glp操纵子的启动子的重组启动子序列,或源自另一基因组启动子DNA序列的启动子序列,或合成的启动子序列,其中编码序列和启动子序列可操作地连接。
在一个实施方式中,本发明的核酸构建体可以是载体DNA的一部分,在另一个实施方式中,该构建体是整合到宿主细胞基因组中的表达盒/盒。因此,术语“核酸构建体”是指人工构建的核酸片段,特别是DNA片段,旨在“移植”到靶细胞中,例如细菌细胞,以修饰基因组基因的表达或表达可包括在构建体中的基因/编码DNA序列。在本发明的上下文中,核酸构建体包括重组DNA序列,其包括两个以上的重组DNA序列:基本上,包括启动子DNA序列的非编码DNA序列和编码目的基因(例如糖转运蛋白、糖基转移酶和/或可用于在宿主细胞中产生HMO的其它基因)的编码DNA序列。
优选地,构建体包括另外的非编码DNA序列,其调控构建体的编码DNA的转录或翻译,例如,促进核糖体与转录物结合的DNA序列,稳定转录物的前导DNA序列。
构建体(表达盒)中包括的目的重组基因整合到细菌基因组中可以通过常规方法实现,例如通过使用含有与染色体上特定位点同源的侧翼序列的线性盒,如针对attTn7所述(Waddell C.S.and Craig N.L.,Genes Dev.(1988)Feb;2(2):137-49.);核酸序列的基因组整合方法,其中重组由噬菌体λ的Red重组酶功能或Rac原噬菌体的RecE/RecT重组酶功能介导(Murphy,J Bacteriol.(1998);180(8):2063-7;Zhang等人,Nature Genetics(1998)20:123-128;Muyrers等人,EMBO Rep.(2000)1(3):239–243);基于Red/ET重组的方法(Wenzel等人,Chem Biol.(2005),12(3):349-56.;Vetcher等人,Appl EnvironMicrobiol.(2005);71(4):1829-35);或阳性克隆,即携带表达盒的克隆,可以例如通过标记基因、或基因功能的丧失或获得而被选择。
根据本发明,包括目的基因的表达盒的单个拷贝可能足以确保所需HMO的产生并实现所需效果。因此,在一些优选的实施方式中,本发明涉及一种重组HMO产生细胞,其包括整合到细胞的基因组DNA中的一个、两个或三个拷贝的目的基因。在一些实施方式中,基因的单拷贝是优选的。
在一个优选的实施方式中,本发明的核酸构建体的重组编码核酸序列相对于启动子是异源的,这意味着在另一个启动子序列(即不是构建体的启动子序列)的控制下,原本物种基因组中的等价天然编码序列被转录。尽管如此,关于宿主细胞,编码DNA可以是异源的(即来自另一个生物物种或属),例如编码在大肠杆菌宿主细胞中表达的糖转运蛋白的DNA序列,或同源的(即源自宿主细胞),例如荚膜异多糖酸(colonic acid)操纵子的基因,例如gmd、wcaG、manC、manB基因也在本文中公开为SEQ ID NO:30。
术语“调控元件”或“启动子”或“启动子区域”或“启动子元件”是在转录起始期间被DNA依赖性RNA聚合酶识别和结合并为转录为mRNA提供起始位点的核酸序列。启动子连同其它转录和翻译调控核酸序列(也称为“控制序列”),对于通过结合决定转录起始(包括转录抑制)频率(或速率)的蛋白质来表达给定基因或基因的组(操纵子)是必需的。启动子元件和大多数调控元件通常位于待转录基因的“上游”(即,先于待转录基因)。编码基因下游的DNA序列可以提供终止转录成mRNA的信号,称为转录“终止子”序列。通常,转录和翻译调控序列包括但不限于启动子序列、核糖体结合位点、转录起始和终止序列、翻译起始和终止序列以及增强子或激活子序列。“转录起始位点”是指要转录的第一个核苷酸,指定为+1。起始位点下游的核苷酸编号为+2、+3、+4等,5’相反(上游)方向的核苷酸编号为-1、-2、-3等。构建体的启动子DNA序列可以源自所选物种基因组的任何基因的启动子区域,优选地,大肠杆菌基因组DNA的启动子区域。因此,任何能够结合RNA聚合酶并启动转录的启动子DNA序列都适用于实施本发明。原则上,任何启动子DNA序列都可用于控制构建体的异源、重组和/或合成目的基因的转录,不同或相同的启动子序列可用于驱动整合在宿主基因组中或在表达载体DNA中的不同目的基因的转录。为了使构建体中包括的异源、重组和/或合成基因得到最佳表达,构建体可以包括其它调控序列,例如前导DNA序列,例如源自大肠杆菌glp基因5’-非翻译区(5’UTR)的DNA序列,核糖体结合序列。后面的序列的实例描述于WO2019123324和WO2020255054(并入本文以供参考)。
在一些优选的实施方式中,用于调控包括在本发明的构建体中的重组基因的表达的调控元件是glpFKX操纵子启动子PglpF,在其它优选的实施方式中,启动子是lac操纵子启动子Plac。然而,任何能够转录和/或调控一个或多个编码一种或多种蛋白质的异源、重组和/或合成基因的转录水平的启动子(或一种或多种调控核酸),所述蛋白质对实现宿主细胞中一种或多种HMO的最佳生物合成产生水平是必要或有益的,例如涉及HMO或HMO前体跨膜转运、HMO产生的副产物的降解的蛋白质,基因表达调控蛋白质等,并且允许实现根据本发明的期望效果,都适合于实施本发明。
根据本发明的岩藻糖基转移酶基因和/或糖转运蛋白基因也可以可操作地连接到PglpF启动子元件并从相应的整合到基因组的盒中表达,它可以在glp启动子、mglB启动子的控制下表达,或在适合表达系统的任何其它启动子的控制下,例如Plac。
在本发明优选的方面,根据本发明的岩藻糖基转移酶基因和/或MFS转运蛋白基因可操作地连接至PmglB-启动子并从相应的整合到基因组的盒中表达。具体地,所述启动子可以是SEQ ID NO:4所示的PmglB_70UTR_SD4。
优选地,包括与HMO的生物合成产生相关的基因、启动子DNA序列和其它调控序列,例如核糖体结合位点序列(例如Shine-Dalgarno序列)的本发明的构建体,在宿主细胞中表达使得能够产生1升包括宿主细胞悬浮液的发酵培养基的至少0.03g/OD(光密度)水平的HMO,例如约0.05g/l/OD至约0.1g/l/OD的水平。为了本发明的目的,后期的HMO产生水平被认为是“足够的”并且能够产生这种水平的所需HMO的宿主细胞被认为是“合适的宿主细胞”,即可以进一步修饰细胞以表达MFS转运蛋白,例如Marc、或Nec、或Vag、或Fred或Bad,以实现本文所述的至少一种有利于HMO产生的效果。
可以使用本领域的标准方法提供本发明的遗传修饰细胞,例如Sambrook等人、Wilson&Walker、Maniatise等人和Ausubel等人的手册中描述的内容。
适用于HMO产生的宿主细胞,例如大肠杆菌,可包括内源性β-半乳糖苷酶基因或外源性β-半乳糖苷酶基因,例如大肠杆菌包括内源性lacZ基因(例如,GenBank登录号V00296(GI:41901))。为了本发明的目的,对HMO产生细胞进行遗传操作以包括失活的基因。lacZ基因可以通过从细菌基因组中完全或部分缺失相应的核酸序列而失活,或者基因序列以它被转录的方式发生突变,或者,如果被转录,则转录物不被翻译或被翻译为不具有相应的酶活性的蛋白质(即β-半乳糖苷酶)。以这种方式,产生HMO的细菌积累了增加的细胞内乳糖池,这有利于HMO的产生。
一种或多种HMO的产生方法
本发明的另一方面涉及一种或多种寡糖的产生方法,其中细胞中产生的45%、例如50%w/w、例如65%w/w以上的HMO是二岩藻糖基乳糖(DFL),该方法包括以下步骤:
(i)提供能够产生HMO的遗传修饰细胞,其中所述细胞包括编码以下的异源、重组和/或合成的核酸
a.α-1,2-岩藻糖基转移酶,和
b.α-1,3-岩藻糖基转移酶,和
(ii)在合适的细胞培养基中培养根据(i)的细胞以产生所述HMO;和
(iii)收获步骤(ii)中产生的一种或多种HMO。
在本发明优选的方面,所述遗传修饰细胞进一步包括异源、重组和/或合成核酸,其进一步编码选自主要易化因子超家族(MFS)的转运蛋白。
优选地,与其中遗传修饰细胞不表达重组MFS转运蛋白的相同方法相比,使用包括重组MFS转运蛋白的遗传修饰细胞的方法多产生至少5%w/w的DFL。
特别地,根据本发明的方法促进细胞中产生的总量的至多45%w/w的HMO是3-岩藻糖基乳糖(3FL)、2’-岩藻糖基乳糖(2’FL)和/或乳糖,例如至多占细胞中产生的HMO总量的30%w/w。
本文证明本发明的方法主要导致产生二岩藻糖基乳糖(DFL),3-岩藻糖基乳糖(3FL)和/或2’-岩藻糖基乳糖(2’FL)含量相对较低。
根据发酵条件和酶的表达水平,本发明的方法主要导致产生二岩藻糖基乳糖(DFL),2’-岩藻糖基乳糖(2’FL)含量相对较低,且3-岩藻糖基乳糖(3FL)少于总HMO的1%w/w。
因此,在本发明的一方面,本发明的方法导致产生DFL(总HMO的至少60%w/w,例如至少65%w/w,例如至少70%w/w)、2’FL(不大于总HMO的35%w/w,例如少于总HMO的30%w/w),并且令人惊讶地基本上没有3FL。
根据发酵条件和酶的表达水平,本发明的方法主要导致产生二岩藻糖基乳糖(DFL),3-岩藻糖基乳糖(3FL)含量相对较低,且2’-岩藻糖基乳糖(2’FL)少于总HMO的1%w/w。
因此,在本发明的一方面,本发明的方法导致产生DFL(总HMO的至少60%w/w,例如至少65%w/w,例如至少70%w/w)、3FL(不大于总HMO的35%w/w,例如少于总HMO的30%w/w),且令人惊讶地基本上没有2’FL。
此外,如实验部分所公开的,本发明的方法包括表达选自主要易化因子超家族(MFS)的转运蛋白,甚至进一步增强了DFL的选择性产生,例如至多25%,例如总HMO的5%、10%、15%、20%或25%w/w。
因此,一方面,本发明的方法导致产生DFL(总HMO的至少55%w/w、60%w/w,例如至少,例如至少65%w/w)和2’FL、3FL(不大于总HMO的45%w/w,例如不大于35%)。
因此,一方面,本发明的方法导致产生DFL(总HMO的至少65%w/w)和2’FL、3FL(不大于总HMO的35%w/w)。
因此,一方面,本发明的方法导致产生DFL(总HMO的至少70%w/w)和2’FL、3FL(不大于总HMO的30%w/w)。
在一个特别优选的方面,在一个方面,本发明的方法导致产生DFL(总HMO的至少90%w/w)和2’FL、3FL(不大于总HMO的10%w/w)。
因此,本发明涉及产生一种或多种人乳寡糖(HMO)的方法,其中细胞产生的50%w/w,例如65%w/w以上的HMO是二岩藻糖基乳糖(DFL)。
在本发明优选的方面,本发明涉及其中由细胞产生的55%w/w以上的HMO是二岩藻糖基乳糖(DFL)的方法。
在本发明的一方面,本发明的方法产生总HMO的至少50%w/w,例如50-99%,例如至少55、60、65、70、75、80、85、90、95或99%DFL。优选70、75、80、85、90、95或99% DFL。
在本发明的一方面,本发明的方法产生总HMO的至多45%w/w,例如在5-10、5-15、5-30、10-30%之间,例如至多0.5、1、5、10、5、20、25、30、35%2’FL和/或3FL。
在本发明的一方面,本发明的方法产生总HMO的至多5%w/w,例如在0-5%之间,例如至多0.1、0.2、0.3、0.4、0.5、0.6、0.7、0.8、0.9、1、1.5、2、2.5、3、3.5、4、4.5或5%2’FL和/或3FL。
根据本发明的方法包括乳糖。发酵中乳糖的量取决于发酵条件和酶的表达水平以及选择和所表达的可选糖转运蛋白。产生的2’FL、3FL与乳糖的总量将不大于通过细胞和/或本文描述的方法产生的总寡糖的49%,例如45%w/w,例如小于35%w/w。
当前公开的方法包括(i)提供一种能够产生HMO的遗传修饰细胞,其中所述细胞包括编码以下的异源、重组和/或合成核酸:α-1,2-岩藻糖基转移酶和α-1,3-岩藻糖基转移酶,和任选的选自主要易化因子超家族(MFS)的转运蛋白,例如但不限于SEQ ID NO:1或2或3或42或43的蛋白质,或其功能同源物,该功能同源物的氨基酸序列与SEQ ID NO:1或2或3或42或43具有至少80%同一性、优选至少85%同一性、更优选至少90%同一性;(ii)在合适的细胞培养基中培养(i)的细胞和(iii)收获步骤(ii)中产生的HMO。
为了产生一种或多种HMO,根据本领域已知的程序在合适的碳源存在下培养如本文所述的HMO产生细菌。通常,碳源选自甘油、葡萄糖、蔗糖及其混合物。替代碳源可以选自糖蜜、玉米糖浆、半乳糖、琥珀酸盐、苹果酸盐、丙酮酸盐、乳酸盐、乙醇、甲醇、柠檬酸盐和棉子糖。所产生的HMO是从培养基和培养过程中形成的微生物生物质中收获的。此后,根据本领域已知的程序纯化HMO,例如例如在WO2015188834、WO2017182965或WO2017152918中描述的,并且纯化的HMO用作保健品、药物或用于任何其它目的,例如用于研究。
HMO的制造通常通过进行更大量的培养来完成。本发明含义中的术语“制造”和“制造规模”定义最小体积为100L、例如1000L、例如10000L、例如100000L、例如200000L培养液的发酵。通常,“制造规模”过程的定义是能够处理大量目的HMO制剂,并且产生的目的HMO数量能够满足毒性测试、临床试验以及市场供应的需求。除了大体积之外,与摇瓶培养等简单的实验室规模方法不同,制造规模方法的特点是使用生物反应器(发酵罐)的技术系统,该系统配备了搅拌、通气、营养物投料、工艺参数(pH、温度、溶解氧张力、背压等)的监测和控制。在很大程度上,表达系统在实验室规模方法(例如本公开实施例中描述的摇瓶、台式生物反应器或深孔形式)中的特性确实允许预测该系统在生物反应器的复杂环境中的特性。
对于发酵过程中使用的合适的细胞培养基没有限制。培养基可以是半确定的,即含有复杂的培养基化合物(例如酵母提取物、大豆蛋白胨、酪蛋白氨基酸等),或者它可以是化学确定的,不含任何复杂化合物。
一方面,本文所述的方法包括在低乳糖条件下培养步骤(ii)中的细胞。在本文中,低乳糖条件通常被认为是具有小于5g乳糖/l培养基的条件,例如小于4g乳糖/l培养基、小于3g乳糖/l培养基、小于2g乳糖/l培养基,小于1g乳糖/l培养基。在一个特定的方面,步骤(ii)中的细胞在基本上无乳糖的条件下进行培养,或者至少在除了由遗传修饰细胞自身产生的乳糖之外没有向培养基中添加乳糖的条件下进行。
本发明上下文中的术语“收获”涉及在发酵终止后收集产生的HMO。在不同的实施方式中,它可以包括收集包括在生物质(即宿主细胞内)和培养基(上清液/发酵液)中的HMO,即在发酵液与生物质分离之前/不分离之前。在其它实施方式中,所产生的HMO可从生物质和发酵液中单独收集,即在生物质与培养基(即发酵液)分离之后/以后。可以用本领域技术人员熟知的任何方法,例如任何合适类型的离心或过滤从培养基中分离细胞。从培养基中分离细胞可在收获发酵液后立即进行,或在将发酵液储存在适当条件后的稍后阶段进行。从剩余生物质(或总发酵液)中回收产生的HMO包括从生物质(即产生细胞)中提取HMO。它可以通过本领域任何合适的方法来完成,例如通过超声处理、煮沸、均质化、使用溶菌酶进行酶促裂解或冷冻和研磨。
从发酵中回收后,HMO可用于进一步加工和纯化。
由本发明的重组细胞产生的HMO可以使用本领域可用的合适程序来纯化,例如如图7所示或如WO2016095924、WO2015188834、WO2017152918、WO2017182965、WO2017152918或US20190119314(均并入以供参考)中所述。
本文所述的用于HMO产生的细胞和方法允许控制产生具有确定的HMO属性的HMO产物,例如在产生的HMO混合物中,与其它HMO(即混合物的3FL和2’FL(副产物))相比,DFL是主要的HMO(产物)。因此,DFL的产量远高于其它副产物HMO(3FL和/或2’FL)。使用本发明的遗传修饰细胞,DFL产物中的3FL和/或2’FL水平可以显著降低。
有利地,本发明提供降低的副产物与产物的比率,即降低的2’FL/3FL/DFL的比率,以及增加的总HMO(和/或总的HMO)的总产率。与产物形成相关的副产物形成减少促进了产物形成并提高了产生和产物回收过程的效率,提供HMO的卓越制造程序,特别是对于DFL产生。
在一个优选的实施方式中,产物是DFL并且副产物是3FL。在另一个优选的实施方式中,产物是DFL并且副产物是2’FL。在另一个优选实施方式中,产物是DFL,副产物是3FL和2’FL。
本发明通过以下非限制性实施例和实施方式进一步说明。
附图说明
图1
在分别产生2’FL、3FL或DFL的修饰大肠杆菌菌株中,2’FL、3FL和DFL的相对产量。修饰的大肠杆菌DFL菌株过表达α-1,2-岩藻糖基转移酶基因futC和α-1,3-岩藻糖基转移酶基因futA。给出了相对于菌株1产生的2’FL的HMO水平。数据获自深孔补料分批测定。
图2
在菌株4中过表达同源糖外排转运蛋白A基因(setA),或在菌株5-7中分别过表达异源MFS转运蛋白基因marc、nec或vag的修饰的大肠杆菌DFL产生菌株中总HMO的相对产量。显示了相对于菌株3中产生的总HMO的HMO水平。数据获自深孔补料分批测定。
图3
在菌株4中过表达同源糖外排转运蛋白A基因(setA),或在菌株5-7中分别过表达异源MFS转运蛋白基因marc、nec或vag的修饰的大肠杆菌DFL产生菌株中2’FL和DFL的相对分布。显示了DFL和2’FL相对于每个菌株产生的HMO总量的相对比率。数据获自深孔补料分批测定。
图4
使用DFL产生菌株8在高乳糖(方法1,实线)或低乳糖(方法2,虚线)条件下进行的两次运行中发酵液中乳糖一水合物浓度的时间曲线。
图5
使用菌株8在高乳糖条件(方法1,实线)或低乳糖条件(方法2,虚线)的两次运行中,发酵液中DFL/(2’FL+DFL)质量%比率的时间曲线(按质量百分比计)。3FL在所有情况下都低于HMO总和的1%,因此可以忽略不计。
图6
使用菌株8的高乳糖条件(方法1,实线)或低乳糖条件(方法2,虚线)的两次运行中,发酵液中DFL滴度相对形成的时间曲线。DFL滴度显示为相对于菌株8方法2(低乳糖水平)的终点测量值。
图7
发酵液的纯化步骤以获得结晶DFL。超滤(UF)用于从发酵液中分离生物质,纳滤(NF)用于浓缩发酵液,离子交换树脂(IEX)用于去除盐分,活性炭(AC)用于去除颜色。选择性DFL结晶作为最后的步骤提供非常高纯度的DFL。
项目
1.一种能够产生一种或多种人乳寡糖(HMO)的遗传修饰细胞,其中所述细胞包括编码以下的异源、重组和/或合成核酸
a.α-1,2-岩藻糖基转移酶,和
b.α-1,3-岩藻糖基转移酶,
其中由细胞产生的50%w/w以上、例如大于60%的HMO是二岩藻糖基乳糖(DFL)。
2.根据第1项的遗传修饰细胞,其中细胞进一步包括
c.编码选自主要易化因子超家族(MFS)的转运蛋白的异源、重组和/或合成核酸。
3.根据第1项或第2项的遗传修饰细胞,其中MFS转运蛋白来源于选自黏质沙雷菌(Serratia marcescens)、Rosenbergiella nectarea、成团泛菌(Pantoea vagans)、耶尔森氏菌(Yersinia frederiksenii)和Rouxiella badensis的细菌。
4.根据前述项中任一项的遗传修饰细胞,其中转运蛋白选自SEQ ID NO:1(Marc)、SEQ ID NO:2(Nec)、SEQ ID NO:3(Vag)、SEQ ID NO:42(fred)和SEQ ID NO:43(bad)或氨基酸序列与SEQ ID NO:1(Marc)、SEQ ID NO:2(Nec)、SEQ ID NO:3(Vag)、SEQ ID NO:42(fred)或SEQ ID NO:43(bad)具有至少80%、例如至少85%或至少90%的同一性的功能同源物。
5.根据前述项中任一项的遗传修饰细胞,其中与没有MFS转运蛋白的相同细胞相比,具有MFS转运蛋白的遗传修饰细胞多产生至少5%w/w的DFL。
6.根据前述项中任一项的遗传修饰细胞,其中由该细胞产生的65%、例如70%w/w以上的HMO是二岩藻糖基乳糖(DFL)。
7.根据前述项中任一项的遗传修饰细胞,其中所述编码α-1,2-岩藻糖基转移酶的异源、重组和/或合成核酸是futC基因或wbgL A基因,或其功能同源物。
8.根据第7项的遗传修饰细胞,其中futC基因编码包括SEQ ID NO:37的氨基酸序列或其与SEQ ID NO:37的氨基酸序列具有至少90%同一性的功能同源物,或由其组成的氨基酸序列,并且wbgL基因编码包括NCBI登录号ADN43847的氨基酸序列或其与NCBI登录号ADN43847的氨基酸序列具有至少90%同一性的功能同源物,或由其组成的氨基酸序列。
9.根据前述项中任一项的遗传修饰细胞,其中所述编码α-1,3-岩藻糖基转移酶的异源、重组和/或合成核酸是futA基因或fucT基因或moumou基因,或其功能同源物。
10.根据第9项的遗传修饰细胞,其中futA基因编码包括SEQ ID NO:38或SEQ IDNO:39的氨基酸序列或其与SEQ ID NO:38或SEQ ID NO:39的氨基酸序列具有至少90%同一性的功能同源物,或由其组成的氨基酸序列,并且fucT基因编码包括SEQ ID NO:40的氨基酸序列或其与SEQ ID NO:40的氨基酸序列具有至少90%同一性的功能同源物,或由其组成的氨基酸序列,并且moumou基因编码包括SEQ ID NO:54的氨基酸序列或其与SEQ ID NO:54的氨基酸序列具有至少90%同一性的功能同源物,或由其组成的氨基酸序列。
11.根据前述项中任一项的遗传修饰细胞,其中编码α-1,3-岩藻糖基转移酶的异源、重组和/或合成核酸是编码SEQ ID NO:40的氨基酸序列的fucT基因或其与SEQ ID NO:40的氨基酸序列具有至少90%同一性的功能同源物。
12.根据前述项中任一项的遗传修饰细胞,其中编码α-1,3-岩藻糖基转移酶的异源、重组和/或合成核酸是编码SEQ ID NO:38或SEQ ID NO:39的氨基酸序列的futA基因或其与SEQ ID NO:38或SEQ ID NO:39的氨基酸序列具有至少90%同一性的功能同源物。
13.根据前述项中任一项的遗传修饰细胞,活性岩藻糖基转移酶α-1,2-岩藻糖基转移酶与α-1,3-岩藻糖基转移酶的比率在1:1至2:5的范围内,例如1:1、1:2、1:3、1:4、1:5、2:3或2:5。
14.根据第13项的遗传修饰细胞,其中FutC:FutA的比率为1:3或2:3。
15.根据第12项的遗传修饰细胞,其中细胞进一步包括编码α-1,2-岩藻糖基转移酶FutC的异源、重组和/或合成核酸和编码MFS转运蛋白或其选自第4项的功能同源物的异源、重组和/或合成核酸。
16.根据第11项的遗传修饰细胞,其中细胞进一步包括编码α-1,2-岩藻糖基转移酶FutC的异源、重组和/或合成核酸和编码nec或marc MFS转运蛋白或其选自第4项的功能同源物的异源、重组和/或合成核酸。
17.根据前述项中任一项的遗传修饰细胞,其中细胞中产生的总量的至多45%、例如至多35%w/w的HMO是3-岩藻糖基乳糖(3FL)或2’-岩藻糖基乳糖(2’FL)。
18.根据前述项中任一项的遗传修饰细胞,其中细胞中产生的总量的至多30%w/w、例如至多20%w/w、至多15%w/w、至多10%w/w、至多5%w/w、至多2.5%w/w、或至多1%w/w的HMO是3-岩藻糖基乳糖(3FL)。
19.根据前述项中任一项的遗传修饰细胞,其中所述细胞中产生的总量的至多30%w/w、例如至多20%w/w、至多15%w/w、至多10%w/w、至多5%w/w、至多2.5%w/w、或至多1%w/w的HMO是2’-岩藻糖基乳糖(2’FL)。
20.根据前述项中任一项的遗传修饰细胞,其中遗传修饰细胞是微生物细胞。
21.根据前述项中任一项的遗传修饰细胞,其中遗传修饰细胞是大肠杆菌。
22.根据前述项中任一项的遗传修饰细胞,其中细胞进一步包括异源、重组和/或合成调控元件,其包括用于调控异源、重组和/或合成核酸表达的核酸序列。
23.根据第22项的遗传修饰细胞,其中用于调控异源、重组和/或合成核酸表达的调控元件包括启动子核酸序列,例如lac启动子Plac,或mglB启动子PmglB,或glp启动子PglpF,或其任何变体。
24.根据第23项的遗传修饰细胞,其中异源、重组和/或合成核酸中的用于调控α-1,2-岩藻糖基转移酶表达的调控元件包括启动子核酸序列,其是PglpF或其变体。
25.根据第24项的遗传修饰细胞,其中PglpF启动子包括SEQ ID NO:29的核酸序列或与SEQ ID NO:29具有至少90%、例如95%同一性的核酸序列,或由其组成。
26.根据第22或23项的遗传修饰细胞,其中异源、重组和/或合成核酸中的用于调控α-1,3-岩藻糖基转移酶表达的调控元件包括启动子核酸序列,其是PmglB或其变体。
27.根据第26项的遗传修饰细胞,其中PmglB启动子是变体,其包括SEQ ID NO:4的核酸序列或与SEQ ID NO:4具有至少90%、例如95%同一性的核酸序列,或由其组成。
28.一种用于产生一种或多种寡糖的方法,其中细胞中产生的50%w/w、例如70%w/w以上的HMO是二岩藻糖基乳糖(DFL),该方法包括以下步骤:
(i)提供能够产生HMO的遗传修饰细胞,其中所述细胞包括编码以下的异源、重组和/或合成核酸
a.α-1,2-岩藻糖基转移酶,和
b.α-1,3-岩藻糖基转移酶,和
(ii)在合适的细胞培养基中培养根据(i)的细胞以产生所述HMO;和
(iii)收获步骤(ii)中产生的一种或多种HMO。
29.根据第28项的方法,其中所述细胞进一步包括编码选自主要易化因子超家族(MFS)的转运蛋白的异源、重组和/或合成核酸。
30.根据第29项的方法,其中与没有MFS转运蛋白的相同细胞相比,具有编码MFS转运蛋白的异源、重组和/或合成核酸的遗传修饰细胞多产生至少5%w/w的DFL。
31.根据第28至30项的方法,其中由细胞产生的65%、例如70%w/w以上的HMO是二岩藻糖基乳糖(DFL)。
32.根据第28至31项的方法,其中所述编码α-1,2-岩藻糖基转移酶的异源、重组和/或合成核酸是futC基因或wbgL基因,或其功能同源物。
33.根据第32项的方法,其中futC基因编码包括SEQ ID NO:37的氨基酸序列或其与SEQ ID NO:37的氨基酸序列具有至少90%同一性的功能同源物,或由其组成的氨基酸序列,并且wbgL基因编码包括NCBI登录号ADN43847的氨基酸序列或其与NCBI登录号ADN43847的氨基酸序列具有至少90%同一性的功能同源物,或由其组成的氨基酸序列。
34.根据第28至33项的方法,其中所述编码α-1,3-岩藻糖基转移酶的异源、重组和/或合成核酸是futA基因或fucT基因或moumou基因,或其功能同源物。
35.根据第34项的方法,其中futA基因编码包括SEQ ID NO:38或SEQ ID NO:39的氨基酸序列或其与SEQ ID NO:38或SEQ ID NO:39的氨基酸序列具有至少90%同一性的功能同源物,或由其组成的氨基酸序列,并且fucT基因编码包括SEQ ID NO:40的氨基酸序列或其与SEQ ID NO:40的氨基酸序列具有至少90%同一性的功能同源物,或由其组成的氨基酸序列,并且moumou基因编码包括SEQ ID NO:54的氨基酸序列或其与SEQ ID NO:54的氨基酸序列具有至少90%同一性的功能同源物,或由其组成的氨基酸序列。
36.根据第28至35项中任一项的方法,其中细胞中产生的总量的至多30%w/w的HMO是3-岩藻糖基乳糖(3FL)或2’-岩藻糖基乳糖(2’FL)。
37.根据第28至36项中任一项的方法,其中细胞中产生的总量的至多30%,例如至多20%w/w、至多15%w/w、至多10%w/w、至多5%w/w、至多2.5%w/w或至多1%w/w的HMO是3-岩藻糖基乳糖(3FL)。
38.根据第28至37项中任一项的方法,其中细胞中产生的总量的至多30%,例如至多20%w/w、至多15%w/w、至多10%w/w、至多5%w/w、至多2.5%w/w、或至多1%w/w的HMO是2’-岩藻糖基乳糖(2’FL)。
39.根据第28至38项中任一项的方法,其中步骤(ii)中的细胞的培养在低乳糖条件下进行。
40.根据第39项的方法,其中步骤(ii)中的细胞的培养在具有<5g乳糖/l培养基的条件下进行。
41.根据第1至27项中任一项的遗传修饰细胞用于产生一种或多种HMO的用途,其中细胞中所产生的至少65%w/w、例如70%w/w以上的HMO是二岩藻糖基乳糖(DFL)。
42.一种1,3-岩藻糖基转移酶,其氨基酸序列与SEQ ID NO:38具有至少90%、例如至少95%、例如至少98%同一性,并且包括以下取代或由以下取代组成:S46F、A128N、H129E、Y132I、D148G和Y221C。
43.根据第42项的1,3-岩藻糖基转移酶,其中氨基酸序列包括SEQ ID NO:39或由其组成。
44.根据第42或43项的1,3-岩藻糖基转移酶,其中1,3-岩藻糖基转移酶由SEQ IDNO:32的核苷酸序列编码。
实施例
材料和方法
除非另有说明,否则分子生物学领域已知的标准技术、载体、控制序列元件和其它表达系统元件用于核酸操作、转化和表达。这样的标准技术、载体和元件可以在例如:Ausubel等人(eds.),Current Protocols in Molecular Biology(1995)(John Wiley&Sons);Sambrook,Fritsch,&Maniatis(eds.),Molecular Cloning(1989)(Cold SpringHarbor Laboratory Press,NY);Berger&Kimmel,Methods in Enzymology 152:Guide toMolecular Cloning Techniques(1987)(Academic Press);Bukhari et al.(eds.),DNAInsertion Elements,Plasmids and Episomes(1977)(Cold Spring Harbor LaboratoryPress,NY);Miller,J.H.Experiments in molecular genetics(1972.)(Cold springHarbor Laboratory Press,NY)中找到。
选择以下描述的实施方式来说明本发明,而不以任何方式限制本发明。
培养基
Luria Broth(LB)培养基使用LB Broth Powder,Millers(Fisher Scientific)制备,LB琼脂平板使用LB Agar Powder,Millers(Fisher Scientific)制备。适当时加入氨苄青霉素((100μg/mL)或任何适当的抗生素)和/或氯霉素(20μg/mL)。
基础基本培养基具有以下组成:NaOH(1g/L)、KOH(2.5g/L)、KH2PO4(7g/L)、NH4H2PO4(7g/L)、柠檬酸(0.5g/L)、微量矿物溶液(5mL/L)。微量矿物质储备溶液含有:ZnSO4*7H2O0.82g/L、柠檬酸20g/L、MnSO4*H2O 0.98g/L、FeSO4*7H2O 3.925g/L、CuSO4*5H2O 0.2g/L。用5N NaOH将基础基本培养基的pH调控至7.0并高压灭菌。接种前,基础基本培养基中加入1mMMgSO4、4μg/mL硫胺素和0.5%给定碳源(葡萄糖或甘油(Carbosynth))。硫胺素和抗生素通过过滤进行灭菌。甘油的所有百分比浓度表示为v/v,葡萄糖的所有百分比浓度表示为w/v。
含有2-脱氧半乳糖的M9板具有以下组分:15g/L琼脂(Fisher Scientific)、2.26g/L 5x M9 Minimal Salt(Sigma-Aldrich)、2mM MgSO4、4μg/mL硫胺素、0.2%甘油和0.2%2-脱氧-D-半乳糖(Carbosynth)。
MacConkey指示板具有以下组分:40g/L MacConkey琼脂基质(BD DifcoTM)和终浓度为1%的碳源。
培养
除非另有说明,在37℃将大肠杆菌菌株在含有0.2%葡萄糖的Luria-Bertani(LB)培养基中搅拌繁殖。在37℃将琼脂平板孵育过夜。
化学感受态细胞和转化
将大肠杆菌从LB平板接种到含有0.2%葡萄糖的5mL LB中,在37℃振荡直至OD600~0.4。通过以13000g离心25秒收获2mL培养物。去除上清液,将细胞沉淀重悬于600μL冷TB溶液(10mM PIPES、15mM CaCl2、250mM KCl)中。将细胞在冰上孵育20分钟,然后以13000g沉淀15秒。去除上清液,将细胞沉淀重悬于100μL冷TB溶液中。使用100μL感受态细胞和1至10ng质粒DNA进行质粒转化。细胞和DNA在冰上孵育20分钟,然后在42℃下热击45秒。在冰上孵育2分钟后,加入400μL SOC(20g/L胰蛋白胨、5g/L酵母提取物、0.5g/L NaCl、0.186g/LKCl、10mM MgCl2、10mM MgSO4和20mM葡萄糖)并在37℃将细胞培养物振荡孵育1小时,然后接种到选择性平板上。
在供应商(Thermo Fisher Scientific)推荐的条件下,将质粒转化到TOP10化学感受态细胞中。
DNA技术
使用QIAprep Spin Miniprep试剂盒(Qiagen)分离来自大肠杆菌的质粒DNA。使用QIAmp DNAMini Kit(Qiagen)分离来自大肠杆菌的染色体DNA。使用QIAquick PCR纯化试剂盒(Qiagen)纯化PCR产物。按照供应商的推荐使用DreamTaq PCR Master Mix(Thermofisher)、Phusion U热启动PCR master mix(Thermofisher)、USER Enzym(NewEngland Biolab)。引物由德国Eurofins Genomics提供。PCR片段和质粒由EurofinsGenomics测序。在T100TM热循环仪(Bio-Rad)中使用DreamTaq PCR Master Mix完成菌落PCR。
表2:用于扩增质粒主链、启动子元件和目的基因的寡核苷酸(荚膜异多糖酸基因futA_mut4、futC、setA、marc、nec和vag)
表3:HMO产生细胞中表达的异源蛋白
*本文所用的FutC在C端具有额外的氨基酸(LG)
**futA_mut4具有6个氨基酸修饰:S46F A128N H129E Y132I D148G Y221C(SEQID NO:39)。
可替代的α1,2-岩藻糖基转移酶是来自大肠杆菌O126的wbgL(NCBI登录号ADN43847,公开于WO 2016/120448,将其并入本文以供参考)或来自幽门螺杆菌的fucT2(NCBI编号AAC99764,将其并入本文以供参考)。
表4:HMO产生细胞中使用的合成DNA
/>
质粒的构建
合成含有两个I-SceI核酸内切酶位点和T1转录终止子序列的质粒主链,该两个位点由两个适合同源重组到大肠杆菌基因组中的DNA片段分开。例如,在一个质粒主链中,合成了gal操纵子(galK中同源重组所必需的)和T1转录终止子序列(pUC57::gal)(GeneScript)。gal操纵子中用于同源重组的DNA序列覆盖了序列大肠杆菌K-12MG155完整基因组GenBank号CP014225.1中的碱基对3628621-3628720和3627572-3627671。通过同源重组插入将导致galK的949个碱基对缺失和galK-表型。以类似的方式,可以合成基于pUC57(GeneScript)的含有两个I-SceI核酸内切酶位点和T1转录终止子序列的主链或任何其它适当载体,该两个位点由两个适合同源重组到大肠杆菌基因组中的DNA片段分开。分子生物学领域众所周知的标准技术用于设计引物和扩增大肠杆菌K-12DH1染色体DNA的特定DNA序列。
使用寡核苷酸O261和O262(表2),使用从大肠杆菌K-12DH1获得的染色体DNA扩增含有启动子PglpF的300bp DNA片段(描述于WO2019123324)。
通过将mglB启动子与PglpF_SD4的70UTR_SD4序列融合来构建合成启动子元件,产生203bp启动子元件PmglB_70UTR_SD4(表3,描述于PCT/IB2020/055773)。使用寡核苷酸O364和O459扩增该启动子元件(表2)。
使用寡核苷酸O342和O126(表2),使用从大肠杆菌K-12DH1获得的染色体DNA扩增含有荚膜异多糖酸基因gmd-wcaG-wcaH-wcaI-manC-manB(表3)的6706bp DNA片段。
通过GeneScript合成一个909bp的DNA片段,其中含有来自幽门螺杆菌26695的futC基因的密码子优化版本(表4)。使用寡核苷酸O123和O124(表2)通过PCR扩增futC基因。
通过GeneScript合成一个1278bp的DNA片段,其中含有包括八个修饰的碱基对的futA基因的密码子优化版本(表4)。使用寡核苷酸KABY528和KABY568(表2)通过PCR扩增futA_mut4。futA基因来源于幽门螺杆菌26695。
使用来自大肠杆菌K-12DH1的染色体DNA和寡核苷酸O499和O450(表2),通过PCR扩增含有源自大肠杆菌K-12DH1的setA的1179bp DNA片段(表4)。
通过GeneScript合成一个1197bp的DNA片段,其中含有源自黏质沙雷菌的marc基因的密码子优化版本(表4)。使用寡核苷酸O737和O738(表2)通过PCR扩增marc基因。
通过GeneScript合成一个1185bp的DNA片段,其中含有源自Rosenbergiellanectarea的nec基因的密码子优化版本(表4)。使用寡核苷酸O741和O742(表2)通过PCR扩增nec基因。
通过GeneScript合成一个1179bp的DNA片段,其中含有源自成团泛菌(Pantoeavagans)的vag基因的密码子优化版本(表4)。使用寡核苷酸KABY745和KABY746(表2)通过PCR扩增vag基因。
通过Genescript合成一个1182bp的DNA片段,其中含有源自耶尔森氏菌的fred基因的密码子优化版本(表4)。使用寡核苷酸KABY733和KABY734(表2)扩增fred基因。
通过Genescript合成一个1182bp的DNA片段,其中含有源自Rouxiella badensis的bad基因的密码子优化版本(表4)。使用寡核苷酸KABY729和KABY730(表2)扩增bad基因。
通过GeneScript合成一个1185bp的DNA片段,其中含有源自伯氏耶尔森菌的yberC基因的密码子优化版本(表4)。使用寡核苷酸KABY721和KABY722(表2)通过PCR扩增yberC基因。
纯化所有PCR片段(质粒主链、启动子元件和目的基因),并组装质粒主链、启动子元件和目的基因。通过标准USER克隆来克隆质粒。可以使用任何标准DNA克隆技术克隆任何适当的质粒。将质粒转化入TOP10细胞,在含有100μg/mL氨苄青霉素(或任何合适的抗生素)和0.2%葡萄糖的LB平板上进行选择。纯化构建的质粒,将启动子序列和目的基因的5’端通过DNA测序(MWG Eurofins Genomics)验证。通过这种方式,构建含有与任何目的基因融合的任何目的启动子的基因盒,并用于通过同源重组工程进行染色体整合。
菌株构建
使用的细菌菌株MDO由大肠杆菌K-12DH1构建。大肠杆菌K-12DH1基因型为:Fˉ、gyrA96、recA1、relA1、endA1、thi-1、hsdR17、supE44。除了大肠杆菌K-12DH1基因型MDO有以下修饰:lacZ:缺失1.5kbp,lacA:缺失0.5kbp,nanKETA:缺失3.3kbp,melA:缺失0.9kbp,wcaJ:缺失0.5kbp,mdoH:缺失0.5kbp,在gmd基因上游插入Plac启动子。以下是对本实施例中使用的菌株构建的描述。菌株的总结可在表5中找到。
包括以下表达盒的质粒,PglpF-gmd-wcaG-wcaH-wcaI-manC-manB、PglpF-futC、PglpF-futA_mut4、PmglB_70UTR_SD4-futC、PglpF-setA、PglpF-marc、PglpF-nec、或PglpF-vag,如WO2019123324中所述,通过同源重组工程整合到染色体DNA中。简而言之,为了整合到染色体DNA中,将辅助质粒、pACBSR和含有表达盒(如上所述)的供体质粒共转化到MDO中,并在含有0.2%葡萄糖、氨苄青霉素(100pg/ml)或卡那霉素(50mg/mL)和氯霉素(20pg/ml)的LB平板上进行选择。将单个菌落接种到含有氯霉素(20pg/ml)和10μl 20% L-阿拉伯糖的1ml LB中,并在37℃振荡孵育7-8小时。通过在M9-DOG平板上铺板并在37℃孵育48小时来选择galK基因座的插入。在MM-DOG平板上形成的单个菌落在含有0.2%葡萄糖的LB平板上重新划线,并在37℃孵育24小时。在MacConkey-半乳糖琼脂平板上呈现白色并且对氨苄青霉素和氯霉素敏感的菌落预计已经失去供体和辅助质粒,并且在galK基因座中包括插入。使用位于galK基因座外的引物048和049通过菌落PCR鉴定galK位点中的插入。纯化染色体DNA,使用引物048和049扩增galK基因座,并通过测序(Eurofins Genomics,德国)验证插入的DNA。使用位于目标整合位点上游和下游的同源DNA,将许多基因盒整合到染色体DNA中的几个特定位点。
通过将一个含有与荚膜异多糖酸操纵子gmd-wcaG-wcaH-wcaI-manC-manB融合的PglpF基因表达盒插入并将两个含有与futC融合的PglpF基因表达盒插入菌株MDO的染色体DNA来构建菌株1。通过同源重组工程将lacI基因替换为标记基因。通过同源重组再次去除lacI中的标记基因,导致lacI基因的无痕去除。
通过用PglpF替换位于gmd上游的Plac来构建菌株2。首先,标记基因通过同源重组工程替换Plac元件,其次标记基因通过使用dsDNA片段通过同源重组工程被PglpF替换,该dsDNA片段为使用寡核苷酸OL-0550和OL-0511通过PCR在含有PglpF的DNA片段上构建。此外,三个含有与futA_mut4融合的PglpF基因表达盒和一个含有与marc融合的PglpF基因表达盒被插入菌株MDO染色体DNA的特定位点。通过同源重组工程将lacI基因替换为标记基因。通过同源重组再次去除lacI中的标记基因,导致lacI基因的无痕去除。
除了将与futC融合的PmglB_70UTR_SD4而不是PglpF-marc插入菌株MDO的染色体DNA之外,菌株3与菌株2一样构建。
通过将一个含有与setA融合的PglpF基因表达盒插入到菌株3的染色体中来构建菌株4。
通过将一个含有与marc融合的PglpF基因表达盒插入到菌株3的染色体中来构建菌株5。
通过将一个含有与nec融合的PglpF基因表达盒插入到菌株3的染色体中来构建菌株6。
通过将一个含有与vag融合的PglpF基因表达盒插入到菌株3的染色体中来构建菌株7。
通过将一个含有与futC融合的PglpF基因表达盒插入到菌株2的染色体中来构建菌株8。
通过将一个含有与fred融合的PglpF基因表达盒插入到菌株3的染色体中来构建菌株9。
通过将一个含有与bad融合的PglpF基因表达盒插入到菌株3的染色体中来构建菌株10。
通过将一个含有与YberC融合的PglpF基因表达盒插入到菌株3的染色体中来构建菌株11。
通过将包括在PglpF启动子和转录终止子控制下的1,3-岩藻糖基转移酶futA的卡那霉素抗性pTOPO质粒构建体(pl-futA-mut4)转化到菌株1A(具有nec转运蛋白的2’-FL菌株)中来构建菌株12。
通过将包括在PglpF启动子和转录终止子的控制下的1,3-岩藻糖基转移酶fucT的卡那霉素抗性pTOPO质粒构建体(pl-fucT)转化到菌株1A(具有nec转运蛋白的2’-FL菌株)中来构建菌株13。
通过将包括在PglpF启动子和转录终止子的控制下的1,3-岩藻糖基转移酶moumou(表1)的卡那霉素抗性pTOPO质粒构建体(pl-moumou)转化到菌株1A(具有nec转运蛋白的2’-FL菌株)中来构建菌株14。
通过将包括在PglpF启动子和转录终止子的控制下的1,3-岩藻糖基转移酶fucT的卡那霉素抗性pTOPO质粒构建体(pl-fucT)转化到菌株1B(具有marc转运蛋白的2’-FL菌株)中来构建菌株15。
表5菌株构建
深孔测定(DWA)
DWA如Lv等人(Bioprocess Biosyst Eng(2016)39:1737–1747)最初描述的那样进行,并针对本发明的目的进行优化。
更具体地,使用4天方案在24个深孔板中筛选实施例中公开的菌株。在最初的24小时内,细胞生长到高密度,而在接下来的48小时内,细胞被转移到能够诱导基因表达和产物形成的培养基中。具体而言,在第1天,使用补充有硫酸镁、硫胺素和葡萄糖的基础基本培养基制备新鲜接种物。在34℃将准备好的培养物以700rpm振荡孵育24小时后,将细胞转移到补充有硫酸镁和硫胺素的新基础基本培养基(2ml)中,其中初始推注20%葡萄糖溶液(1μl)和10%乳糖溶液(0.1ml),然后向细胞提供50%蔗糖溶液作为碳源,同时加入蔗糖水解酶(转化酶,4μl 0.1g/L溶液)通过转化酶裂解蔗糖以缓慢的速度提供葡萄糖用于生长。接种新培养基后,在28℃将细胞以700rpm振荡48小时。变性和随后离心后,通过HPLC分析上清液。
发酵
发酵在200mL DasBox生物反应器(Eppendorf,德国)或2L Biostat B生物反应器(Sartorius,德国)中进行。起始体积分别为100mL或1L。培养基为确定的基本培养基,由25g/kg碳源(葡萄糖)、MgSO4x 7H2O、KOH、NaOH、NH4H2PO4、KH2PO4、微量元素溶液、柠檬酸、消泡剂和硫胺素组成。微量元素溶液(TMS)含有硫酸盐形式的Mn、Cu、Fe、Zn和柠檬酸。通过接种在确定的基本培养基中生长的2%(v/v)预培养物开始发酵。在耗尽分批培养基中所含的碳源后,使用预定的线性曲线以葡萄糖限制的方式连续补料含有葡萄糖、MgSO4 x 7H2O、TMS、H3PO4、消泡剂和乳糖的无菌补料溶液。进料溶液中的乳糖浓度为120g/kg(方法DFL1)或60g/kg(方法DFL2),以便在发酵过程中获得高或低的乳糖浓度。因此,低乳糖条件被定义为在大部分发酵过程中具有<5g/l,而高乳糖条件被定义为在大部分发酵过程中具有10-25g/L。图4描述了使用HPLC在发酵液中测量的所得乳糖浓度。
通过用NH4OH溶液滴定将整个发酵过程中的pH控制在6.8。使用空气将通气控制在1vvm,溶解氧保持在空气饱和度的20%以上,由搅拌器速率控制。在葡萄糖补料开始后3小时,发酵温度设定点从33℃降至30℃。这种温度下降是立即进行的,或者以1小时的线性斜坡进行。
在整个发酵过程中,取样以使用HPLC确定2’FL、3FL、DFL、乳糖和其它次要副产物的浓度。将总发酵液样品在去离子水中稀释三倍并煮沸20分钟。随后以17000g离心3分钟,然后通过HPLC分析所得上清液。
实施例1.通过过表达α-1,2-岩藻糖基转移酶和α-1,3-岩藻糖基转移酶对大肠杆菌进行改造以产生HMO。
构建产生2’FL、3FL或DFL作为主要产物的三种菌株。菌株1是2’FL产生菌株,过表达荚膜异多糖酸基因(gmd-wcaG-wcaH-wcaI-manC-manB)和α-1,2-岩藻糖基转移酶基因futC。菌株2是3FL产生菌株,过表达荚膜异多糖酸基因(gmd-wcaG-wcaH-wcaI-manC-manB)、α-1,3-岩藻糖基转移酶基因futA_mut4和MFS基因marc。菌株3是DFL产生菌株,过表达荚膜异多糖酸基因(gmd-wcaG-wcaH-wcaI-manC-manB)、α-1,3-岩藻糖基转移酶基因futA_mut4和α-1,2-岩藻糖基转移酶基因futC。
如材料和方法部分所述,使用深孔测定法培养菌株,并使用HPLC测量2’FL、3FL和DFL的含量。结果如图1所示。
令人惊讶的是,在3FL产生菌株中过表达α-1,2-岩藻糖基转移酶基因futC可将3FL转化为DFL。菌株3产生的总HMO的大于70%是DFL,几乎消除了3FL的产生。
如图1所示,菌株3产生的总HMO的大于70%是DFL,几乎消除了3FL的产生。
实施例2.通过异源MFS蛋白的过表达来改造大肠杆菌以产生DFL。
菌株3产生的主要HMO是DFL。菌株3过表达荚膜异多糖酸基因(gmd-wcaG-wcaH-wcaI-manC-manB)、α-1,2-岩藻糖基转移酶基因futC和α-1,3-岩藻糖基转移酶futA_mut4。
在本实施例中,研究了同源糖外排转运蛋白SetA(菌株4)或三种异源MFS转运蛋白之一Marc(菌株5)、Nec(菌株6)或Vag(菌株7)的过表达,与菌株3相比,输出蛋白对总HMO表达和DFL/2’FL比率有影响。
如材料和方法部分所述,使用深孔测定法培养菌株,并使用HPLC测量2’FL、3FL和DFL的含量。结果如图2和图3所示。
setA基因(菌株4)的过表达并未增加产生的HMO总量(图2)。marc基因(菌株5)的过表达使产生的HMO总量增加了25%(图2)。nec或vag基因的过表达,菌株6或7分别使产生的HMO总量增加了80%(图2)。此外,marc、nec或vag的过表达使DFL与HMO总量的比率增加了25%(图3),并使2’FL与HMO总量的比率降低了大于30%(图3)。在过表达α-1,2-岩藻糖基转移酶基因futC、α-1,3-岩藻糖基转移酶futA_mut4并过表达marc、nec或vag的菌株中,大于70%的HMO是DFL。
实施例3.通过发酵获得高比率的DFL:2’FL。
乳糖是参与DFL形成的α-1,2-岩藻糖基转移酶和α-1,3-岩藻糖基转移酶进行岩藻糖基化的底物。在本实施例中,研究了发酵过程中进料中乳糖的浓度是否影响DFL的形成。
DFL产生菌株,菌株8,能够产生2’FL和DFL的混合物,其中DFL是主要的HMO,而2’FL通常占总HMO的30%或更少,这取决于发酵条件,如下面所描述。令人惊讶的是,即使表达了α-1,3岩藻糖基转移酶基因futA_mut4,在这些菌株的发酵中几乎没有检测到3FL。如材料和方法部分所述,平行进行两种具有不同乳糖供应的发酵。两种发酵过程在培养基组成、葡萄糖进料属性和发酵过程参数如温度、pH和溶解氧方面是相同的。在发酵过程的大部分时间里,通过HPLC在发酵液中测量得到的乳糖浓度在方法DFL1中高于15g/L,在方法DFL2中低于5g/L(图4)。低乳糖方法导致最高DFL/(2’FL+DFL)比率>80%,该比率稳定至发酵结束时(图5)。对于高乳糖方法(DFL1),DFL/(2’FL+DFL)比率略低,但仍>70%,这意味着在所有情况下DFL是迄今为止产生的最丰富的HMO(图6)。令人惊讶的是,在所有情况下,3FL都被确定为小于HMO总量的1%,因此对于最终产物质量而言可以忽略不计(表6)。
表6.在发酵结束时间点总发酵液样品中的HMO组分。HMO=2’FL和DFL之和,而3FL在所有样品中<1%可忽略不计
实施例4.从发酵液中纯化和结晶DFL
发酵后,通过超滤去除细胞和蛋白质,并将获得的溶液通过纳滤浓缩。溶液通过强阳离子交换树脂(H+形式)和弱阴离子交换树脂(游离碱形式)洗脱以脱矿质。然后用木炭处理该溶液以使其脱色。随后,将溶液在减压下浓缩至结晶步骤所需的浓度。为了DFL的结晶,将乙醇(~1.3体积)添加到浓缩溶液中。将溶液接种并在室温下搅拌18小时。随后,在室温下经3小时连续添加乙醇(~1.3体积)。滤出晶体并用乙醇(~0.4体积)洗涤。将晶体在空气中干燥直至恒重。DFL含量(无水)>90%w/w%。
图7显示发酵液的纯化步骤以获得结晶DFL。
超滤(UF)用于从发酵液中分离生物质,纳滤(NF)用于浓缩发酵液,离子吸收步骤用于去除盐分,活性炭(AC)用于去除颜色。选择性DFL结晶作为最后一步可提供非常高纯度的DFL。
实施例5-不同异源转运蛋白的比较研究。
在实施例2中,测试了三种MFS转运蛋白Marc、Nec或Vag以及糖外排转运蛋白SetA在插入菌株3时增加DFL表达的能力。在本实施例中,另外三个MFS转运蛋白Fred、Bad和YberC在产生DFL的菌株(菌株3)中过表达,分别产生菌株9-11。
如材料和方法部分所述,使用深孔测定法培养菌株,并使用HPLC测量2’FL、3FL和DFL的含量。
DFL、2FL和3FL占HMO总产量的百分比如表7所示。
表7具有不同MFS转运蛋白的DFL、2’FL和3FL占产生的总HMO的%水平
正如在实施例2中观察到的,setA基因(菌株4)的过表达并未增加产生的DFL量,新的输出蛋白YberC(菌株11)也是如此。如在实施例2中,marc、nec或vag(菌株5-7)的过表达使DFL与HMO总量的比率增加7-12%。对于新的转运蛋白fred和bad(菌株9和10)也观察到了同样的情况。过表达α-1,2-岩藻糖基转移酶基因futC、α-1,3-岩藻糖基转移酶futA_mut4的具有marc、nec、vag、fred或bad转运蛋白菌株产生的大于65%的HMO是DFL。
实施例6-用于DFL形成的替代α-1,3-岩藻糖基转移酶。
α-1,3-岩藻糖基转移酶负责将岩藻糖基添加到乳糖底物的葡萄糖部分。在以下实施例中,测试了其它替代α-1,3-岩藻糖基转移酶与MFS转运蛋白nec的组合。
简而言之,通过过表达nec MFS转运蛋白生成菌株1A,对染色体上含有FutCα-1,2-岩藻糖基转移酶的2’-FL产生菌株菌株1进行了修饰。用含有不同α-1,3-岩藻糖基转移酶的质粒转染细胞以将此2’FL表达菌株转化为不同的DFL表达菌株。
如材料和方法部分所述,使用深孔测定法培养菌株,并使用HPLC测量2’FL、3FL和DFL的含量。结果如表8所示。
表8使用nec MFS转运蛋白和不同的α-1,3-岩藻糖基转移酶的DFL、2’FL或3FL占产生的总HMO的%水平。
由此可见,当与nec MFS转运蛋白结合时,三种不同的α-1,3-岩藻糖基转移酶能够产生DFL,作为细胞产生的HMO混合物中最丰富的HMO。moumouα-1,3-岩藻糖基转移酶(菌株14)产生几乎等量的DFL和3FL,通过调整moumouα-1,3-岩藻糖基转移酶和α-1,2-岩藻糖基转移酶FutC之间的比率,该比率可能会向DFL改变,由于moumou转移酶由高表达质粒表达,而FutC由基因组上的2个拷贝表达,因此预计减少moumou转移酶的拷贝数将使HMO产生转向更多DFL和更少的3FL。对于FutA_mut4α-1,3-岩藻糖基转移酶(菌株12),在包括两个FutC拷贝的菌株中,来自高拷贝数质粒的FutA_mut4的高过表达导致总HMO的61% DFL。然而,当与实施例5中仅存在3个FutA_mut4拷贝和1个futC拷贝的菌株6相比时,菌株12产生的3FL产量增加,DFL产量减少。这表明岩藻糖基转移酶比率的优化可有利于增加培养物中DFL的数量。
实施例7-FucTα-1,3-岩藻糖基转移酶与marc MFS转运蛋白组合用于DFL形成。
在以下实施例中,测试了实施例6中的表现最佳的α-1,3-岩藻糖基转移酶FucT与marc MFS转运蛋白的组合。
简而言之,通过过表达marc MFS转运蛋白生成菌株1B,对染色体上含有FutCα-1,2-岩藻糖基转移酶的2’-FL产生菌株菌株1进行修饰。用含有FucTα-1,3-岩藻糖基转移酶的质粒转染该菌株以将此2’FL表达菌株转化为DFL表达菌株。
如材料和方法部分所述,使用深孔测定法培养菌株,并使用HPLC测量2’FL、3FL和DFL的含量。结果如表9所示。
表9使用FucTα-1,3-岩藻糖基转移酶的DFL、2’FL或3FL占产生的总HMO的%水平
*来自实施例6的结果
从这些数据可以看出,当FucTα-1,3-岩藻糖基转移酶与α-1,2-岩藻糖基转移酶FutC和marc MFS转运蛋白组合时,在产生DFL方面非常有效。DFL占细胞产生的HMO混合物的76%,而64% DFL是使用FucT和nec MFS转运蛋白产生的(来自表8的数据包括在表9中)。
序列表
<110> 格礼卡姆股份公司(Glycom A/S)
<120> 一种产生DFL的菌株
<130> 34157-WO-PCT
<150> PA 2020 01450
<151> 2020-12-22
<160> 54
<170> PatentIn版本3.5
<210> 1
<211> 396
<212> PRT
<213> Serratia marcescens
<400> 1
Met Gln Arg Leu Ser Arg Leu Ser Leu Arg Ile Asn Pro Ile Phe Ala
1 5 10 15
Ala Phe Leu Leu Ile Ala Phe Leu Ser Gly Ile Ala Gly Ala Leu Leu
20 25 30
Thr Pro Thr Leu Ser Leu Phe Leu Thr Thr Glu Val Lys Val Arg Pro
35 40 45
Leu Trp Val Gly Leu Phe Tyr Thr Ala Asn Ala Val Ala Gly Ile Val
50 55 60
Val Ser Phe Leu Leu Ala Lys Arg Ser Asp Thr Arg Gly Asp Arg Arg
65 70 75 80
Arg Leu Ile Leu Leu Cys Cys Leu Met Ala Val Gly Asn Cys Leu Leu
85 90 95
Phe Ala Phe Asn Arg Asp Tyr Leu Thr Leu Ile Thr Ala Gly Val Leu
100 105 110
Met Ser Ala Val Ala Asn Thr Ala Met Pro Gln Ile Phe Ala Leu Ala
115 120 125
Arg Glu Tyr Ala Asp Ser Glu Ala Arg Glu Val Val Met Phe Ser Ser
130 135 140
Val Met Arg Ala Gln Leu Ser Leu Ala Trp Val Ile Gly Pro Pro Leu
145 150 155 160
Ser Phe Ala Leu Ala Leu Asn Tyr Gly Phe Thr Val Met Phe Leu Ile
165 170 175
Ala Ala Val Thr Phe Ala Val Cys Val Leu Leu Val Gly Phe Met Leu
180 185 190
Pro Ser Val Pro Arg Ala Ala Glu Asn Glu Gly Leu Gln Gly Gly Val
195 200 205
Ser Ala Pro Ile Ala Pro Ala Ser Ala Trp Arg Asn Arg Asp Val Arg
210 215 220
Leu Leu Phe Ile Ala Ser Met Leu Met Trp Thr Cys Asn Thr Leu Tyr
225 230 235 240
Ile Ile Asp Met Pro Leu Tyr Ile Thr Ala Asp Leu Gly Leu Pro Glu
245 250 255
Gly Leu Ala Gly Val Leu Met Gly Thr Ala Ala Gly Leu Glu Ile Pro
260 265 270
Ala Met Leu Leu Ala Gly Tyr Tyr Val Lys Arg Phe Gly Lys Arg Asn
275 280 285
Met Met Leu Leu Ala Val Val Ala Gly Val Leu Phe Tyr Leu Gly Leu
290 295 300
Thr Val Leu Glu Ser Lys Pro Ala Leu Ile Ala Leu Gln Leu Leu Asn
305 310 315 320
Ala Val Phe Ile Gly Ile Val Ala Gly Ile Gly Met Leu Tyr Phe Gln
325 330 335
Asp Leu Met Pro Gly Arg Pro Gly Ala Ala Thr Thr Leu Phe Thr Asn
340 345 350
Ser Ile Ser Thr Gly Val Ile Leu Ala Gly Val Leu Gln Gly Ala Leu
355 360 365
Val Glu Asn Leu Gly His Gly Ser Val Tyr Trp Met Ala Ala Leu Leu
370 375 380
Ala Leu Ala Ala Leu Gly Met Ser Ala Lys Val Arg
385 390 395
<210> 2
<211> 394
<212> PRT
<213> Rosenbergiella nectarea
<400> 2
Met Gln Ser Phe Thr Pro Pro Ala Pro Lys Gly Gly Asn Pro Val Phe
1 5 10 15
Met Met Phe Met Leu Val Thr Phe Phe Val Ser Ile Ala Gly Ala Leu
20 25 30
Gln Ala Pro Thr Leu Ser Leu Tyr Leu Ser Gln Glu Leu Ala Ala Lys
35 40 45
Pro Phe Met Val Gly Leu Phe Phe Thr Ile Asn Ala Val Thr Gly Ile
50 55 60
Ile Ile Ser Phe Ile Leu Ala Lys Arg Ser Asp Arg Lys Gly Asp Arg
65 70 75 80
Arg Arg Leu Leu Met Phe Cys Cys Ala Met Ala Ile Ala Asn Ala Leu
85 90 95
Met Phe Ala Phe Val Arg Gln Tyr Val Val Leu Ile Thr Leu Gly Leu
100 105 110
Ile Leu Ser Ala Leu Thr Ser Val Val Met Pro Gln Leu Phe Ala Leu
115 120 125
Ala Arg Glu Tyr Ala Asp Arg Thr Gly Arg Glu Val Val Met Phe Ser
130 135 140
Ser Val Met Arg Thr Gln Met Ser Leu Ala Trp Val Ile Gly Pro Pro
145 150 155 160
Ile Ser Phe Ala Leu Ala Leu Asn Tyr Gly Phe Ile Thr Leu Tyr Leu
165 170 175
Val Ala Ala Ala Leu Phe Leu Leu Ser Leu Ile Leu Ile Lys Thr Thr
180 185 190
Leu Pro Ser Val Pro Arg Leu Tyr Pro Ala Glu Asp Leu Ala Lys Ser
195 200 205
Ala Ala Ser Gly Trp Lys Arg Thr Asp Val Arg Phe Leu Phe Ala Ala
210 215 220
Ser Val Leu Met Trp Val Cys Asn Leu Met Tyr Ile Ile Asp Met Pro
225 230 235 240
Leu Tyr Ile Ser Lys Ser Leu Gly Met Pro Glu Ser Phe Ala Gly Val
245 250 255
Leu Met Gly Thr Ala Ala Gly Leu Glu Ile Pro Val Met Leu Leu Ala
260 265 270
Gly Tyr Leu Ala Lys Arg Val Gly Lys Arg Pro Leu Val Ile Val Ala
275 280 285
Ala Val Cys Gly Leu Ala Phe Tyr Pro Ala Met Leu Val Phe His Gln
290 295 300
Gln Thr Gly Leu Leu Ile Ile Gln Leu Leu Asn Ala Val Phe Ile Gly
305 310 315 320
Ile Val Ala Gly Leu Val Met Leu Trp Phe Gln Asp Leu Met Pro Gly
325 330 335
Lys Ala Gly Ala Ala Thr Thr Leu Phe Thr Asn Ser Val Ser Thr Gly
340 345 350
Met Ile Phe Ala Gly Leu Cys Gln Gly Leu Leu Ser Asp Leu Leu Gly
355 360 365
His Gln Ala Ile Tyr Val Leu Ala Thr Val Leu Met Val Ile Ala Leu
370 375 380
Leu Leu Leu Leu Arg Val Lys Glu Gln Ala
385 390
<210> 3
<211> 392
<212> PRT
<213> Pantoea vagans
<400> 3
Met Lys Ser Leu Leu Thr Arg Lys Arg Arg Ile Asn Pro Val Phe Leu
1 5 10 15
Ala Phe Met Ala Ala Ser Phe Met Ile Gly Val Ala Gly Ala Leu Gln
20 25 30
Ala Pro Thr Leu Ser Leu Phe Leu Thr Arg Glu Val Gln Ala Arg Pro
35 40 45
Leu Trp Val Gly Leu Phe Phe Thr Val Asn Ala Ile Ala Gly Ile Val
50 55 60
Val Ser Met Leu Val Ala Lys Arg Ser Asp Ser Arg Gly Asp Arg Arg
65 70 75 80
Thr Leu Ile Leu Phe Cys Cys Ala Met Ala Phe Cys Asn Ala Leu Leu
85 90 95
Phe Ala Phe Thr Arg His Tyr Leu Thr Leu Ile Thr Leu Gly Val Leu
100 105 110
Leu Ser Ala Leu Ala Ser Val Ser Met Pro Gln Ile Phe Ala Leu Ala
115 120 125
Arg Glu Tyr Ala Asp Gln Ser Ala Arg Glu Ala Val Met Phe Ser Ser
130 135 140
Val Met Arg Ala Gln Leu Ser Leu Ala Trp Val Ile Gly Pro Pro Leu
145 150 155 160
Ser Phe Ala Leu Ala Leu Asn Phe Gly Phe Val Thr Leu Phe Leu Val
165 170 175
Ala Ala Ala Leu Phe Leu Val Cys Ile Leu Leu Ile Lys Phe Thr Leu
180 185 190
Pro Ser Val Pro Arg Ala Glu Pro Leu Met Arg Ser Gly Gly Met Pro
195 200 205
Leu Ser Gly Trp Arg Asp Arg Asp Val Arg Leu Leu Phe Ile Ala Ser
210 215 220
Val Thr Met Trp Thr Cys Asn Thr Met Tyr Ile Ile Asp Met Pro Leu
225 230 235 240
Tyr Ile Ser Val Thr Leu Gly Leu Pro Glu Lys Leu Ala Gly Leu Leu
245 250 255
Met Gly Thr Ala Ala Gly Leu Glu Ile Pro Val Met Leu Leu Ala Gly
260 265 270
His Tyr Ala Lys Arg Val Gly Lys Arg Asn Leu Met Leu Ile Ala Val
275 280 285
Ala Ala Gly Val Leu Phe Tyr Ala Gly Leu Ala Met Phe Ala Ser Gln
290 295 300
Thr Ala Leu Met Ala Leu Gln Leu Phe Asn Ala Val Phe Ile Gly Ile
305 310 315 320
Ile Ala Gly Ile Gly Met Leu Trp Phe Gln Asp Leu Met Pro Gly Arg
325 330 335
Pro Gly Ala Ala Thr Thr Met Phe Thr Asn Ser Ile Ser Thr Gly Met
340 345 350
Ile Leu Ala Gly Val Ile Gln Gly Thr Leu Ser Glu Arg Phe Gly His
355 360 365
Ile Ala Val Tyr Trp Leu Ala Leu Gly Leu Ala Val Ala Ala Phe Ala
370 375 380
Met Ser Ala Arg Val Lys Asn Val
385 390
<210> 4
<211> 203
<212> DNA
<213> Artificial Sequence
<220>
<223> PmglB_70UTR_SD4 203-nucleotide DNA expression element
<400> 4
tgcgtcgcca ttctgtcgca acacgccaga atgcggcggc gatcactaac tcaacaaatc 60
aggcgatgta accgctttca atctgtgagt gatttcacag tatcttaaca atgtgatagc 120
tatgattgca ccgtgcctac aagcatcgtg gaggtccgtg actttcacgc atacaacaaa 180
cattaaccaa ctaggaaaca gct 203
<210> 5
<211> 24
<212> DNA
<213> Artificial Sequence
<220>
<223> O48_galK.for
<400> 5
cccagcgaga cctgaccgca gaac 24
<210> 6
<211> 24
<212> DNA
<213> Artificial Sequence
<220>
<223> O49_galK.rev
<400> 6
ccccagtcca tcagcgtgac tacc 24
<210> 7
<211> 34
<212> DNA
<213> Artificial Sequence
<220>
<223> O40_backbone.for
<220>
<221> misc_RNA
<222> (9)..(9)
<223> /standard_name="uracil"
<400> 7
attaacccuc caggcatcaa ataaaacgaa aggc 34
<210> 8
<211> 32
<212> DNA
<213> Artificial Sequence
<220>
<223> O79_Backbone.rev
<220>
<221> misc_RNA
<222> (10)..(10)
<223> /standard_name="uracil"
<400> 8
atttgcgcau caccaatcaa attcacgcgg cc 32
<210> 9
<211> 107
<212> DNA
<213> Artificial Sequence
<220>
<223> OL-0550_wcaJ::PglpF.for
<400> 9
tccccgcgcg ttggccgatt cattaatgca gctggcacga caggtttccc gactggaaag 60
cgggcagtga gcgcaatgcg caaatgcggc acgccttgca gattacg 107
<210> 10
<211> 111
<212> DNA
<213> Artificial Sequence
<220>
<223> OL-0511_wcaJ::PglpF.rev
<400> 10
tttttccagc agaaactctg ccaggtaaga accgtcttgt ccggttacac cggtgatgag 60
agcgactttt gacatagctg tttcctcctt ggttaatgtt tgttgtatgc g 111
<210> 11
<211> 32
<212> DNA
<213> Artificial Sequence
<220>
<223> O261_PglpF.for
<220>
<221> misc_RNA
<222> (10)..(10)
<223> /standard_name="uracil"
<400> 11
atgcgcaaau gcggcacgcc ttgcagatta cg 32
<210> 12
<211> 36
<212> DNA
<213> Artificial Sequence
<220>
<223> O262_PglpF.rev
<220>
<221> misc_RNA
<222> (8)..(8)
<223> /standard_name="uracil"
<400> 12
agctgttucc tccttggtta atgtttgttg tatgcg 36
<210> 13
<211> 37
<212> DNA
<213> Artificial Sequence
<220>
<223> O364_PmglB_70UTR_SD4.for
<220>
<221> misc_RNA
<222> (10)..(10)
<223> /standard_name="uracil"
<400> 13
atgcgcaaau tgcgtcgcca ttctgtcgca acacgcc 37
<210> 14
<211> 36
<212> DNA
<213> Artificial Sequence
<220>
<223> O459_PmglB_70UTR_SD4.rev
<220>
<221> misc_RNA
<222> (8)..(8)
<223> /standard_name="uracil"
<400> 14
agctgttucc tagttggtta atgtttgttg tatgcg 36
<210> 15
<211> 34
<212> DNA
<213> Artificial Sequence
<220>
<223> O342_CA.for
<220>
<221> misc_RNA
<222> (8)..(8)
<223> /standard_name="uracil"
<400> 15
aaacagcuat gtcaaaagtc gctctcatca ccgg 34
<210> 16
<211> 37
<212> DNA
<213> Artificial Sequence
<220>
<223> O126_CA.rev
<220>
<221> misc_RNA
<222> (9)..(9)
<223> /standard_name="uracil"
<400> 16
agggttaaut gcgcgttact cgttcagcaa cgtcagc 37
<210> 17
<211> 32
<212> DNA
<213> Artificial Sequence
<220>
<223> O123_futC.for
<220>
<221> misc_RNA
<222> (8)..(8)
<223> /standard_name="uracil"
<400> 17
aaacagcuat ggcgttcaaa gtggtccaaa tc 32
<210> 18
<211> 39
<212> DNA
<213> Artificial Sequence
<220>
<223> O124_futC.rev
<220>
<221> misc_RNA
<222> (9)..(9)
<223> /standard_name="uracil"
<400> 18
agggttaaut gcgcgttagc ccagcgcgtt atatttctg 39
<210> 19
<211> 30
<212> DNA
<213> Artificial Sequence
<220>
<223> KABY528_futA_mut4.for
<220>
<221> misc_RNA
<222> (8)..(8)
<223> /standard_name="uracil"
<400> 19
aaacagcuat gttccaaccg ctgctggacg 30
<210> 20
<211> 39
<212> DNA
<213> Artificial Sequence
<220>
<223> KABY568_futA_mut4.rev
<220>
<221> misc_RNA
<222> (9)..(9)
<223> /standard_name="uracil"
<400> 20
agggttaaut tacagaccca gttttttgac cagtttacg 39
<210> 21
<211> 28
<212> DNA
<213> Artificial Sequence
<220>
<223> O449_setA.for
<220>
<221> misc_RNA
<222> (8)..(8)
<223> /standard_name="uracil"
<400> 21
aaacagcuat gatctggata atgacgat 28
<210> 22
<211> 32
<212> DNA
<213> Artificial Sequence
<220>
<223> O450_setA.rev
<220>
<221> misc_RNA
<222> (9)..(9)
<223> /standard_name="uracil"
<400> 22
agggttaaut caaacgtctt taacctttgc gg 32
<210> 23
<211> 31
<212> DNA
<213> Artificial Sequence
<220>
<223> O737_marc.for
<220>
<221> misc_RNA
<222> (8)..(8)
<223> /standard_name="uracil"
<400> 23
aaacagcuat gcagcgtctg agccgtctga g 31
<210> 24
<211> 32
<212> DNA
<213> Artificial Sequence
<220>
<223> O738_marc.rev
<220>
<221> misc_RNA
<222> (9)..(9)
<223> /standard_name="uracil"
<400> 24
agggttaaut taaacttcac gcactttcgc gc 32
<210> 25
<211> 28
<212> DNA
<213> Artificial Sequence
<220>
<223> O741_nec.for
<220>
<221> misc_RNA
<222> (8)..(8)
<223> /standard_name="uracil"
<400> 25
aaacagcuat gcagagcttc accccgcc 28
<210> 26
<211> 34
<212> DNA
<213> Artificial Sequence
<220>
<223> O742_nec.rev
<220>
<221> misc_RNA
<222> (9)..(9)
<223> /standard_name="uracil"
<400> 26
agggttaaut tacgcctgct ctttaacacg cagc 34
<210> 27
<211> 33
<212> DNA
<213> Artificial Sequence
<220>
<223> KABY745_vag.for
<220>
<221> misc_RNA
<222> (8)..(8)
<223> /standard_name="uracil"
<400> 27
aaacagcuat gaagagcctg ctgacccgta aac 33
<210> 28
<211> 31
<212> DNA
<213> Artificial Sequence
<220>
<223> KABY746_vag.rev
<220>
<221> misc_RNA
<222> (9)..(9)
<223> /standard_name="uracil"
<400> 28
agggttaaut taaacgtttt tcacacgcgc g 31
<210> 29
<211> 300
<212> DNA
<213> Artificial Sequence
<220>
<223> 300-nucleotide DNA expression element (PglpF)
<400> 29
gcggcacgcc ttgcagatta cggtttgcca cacttttcat ccttctcctg gtgacataat 60
ccacatcaat cgaaaatgtt aataaatttg ttgcgcgaat gatctaacaa acatgcatca 120
tgtacaatca gatggaataa atggcgcgat aacgctcatt ttatgacgag gcacacacat 180
tttaagttcg atatttctcg tttttgctcg ttaacgataa gtttacagca tgcctacaag 240
catcgtggag gtccgtgact ttcacgcata caacaaacat taaccaagga ggaaacagct 300
<210> 30
<211> 6706
<212> DNA
<213> Escherichia coli
<400> 30
atgtcaaaag tcgctctcat caccggtgta accggacaag acggttctta cctggcagag 60
tttctgctgg aaaaaggtta cgaggtgcat ggtattaagc gtcgcgcatc gtcattcaac 120
accgagcgcg tggatcacat ttatcaggat ccgcacacct gcaacccgaa attccatctg 180
cattatggcg acctgagtga tacctctaac ctgacgcgca ttttgcgtga agtacagccg 240
gatgaagtgt acaacctggg cgcaatgagc cacgttgcgg tctcttttga gtcaccagaa 300
tataccgctg acgtcgacgc gatgggtacg ctgcgcctgc tggaggcgat ccgcttcctc 360
ggtctggaaa agaaaactcg tttctatcag gcttccacct ctgaactgta tggtctggtg 420
caggaaattc cgcagaaaga gaccacgccg ttctacccgc gatctccgta tgcggtcgcc 480
aaactgtacg cctactggat caccgttaac taccgtgaat cctacggcat gtacgcctgt 540
aacggaattc tcttcaacca tgaatccccg cgccgcggcg aaaccttcgt tacccgcaaa 600
atcacccgcg caatcgccaa catcgcccag gggctggagt cgtgcctgta cctcggcaat 660
atggattccc tgcgtgactg gggccacgcc aaagactacg taaaaatgca gtggatgatg 720
ctgcagcagg aacagccgga agatttcgtt atcgcgaccg gcgttcagta ctccgtgcgt 780
cagttcgtgg aaatggcggc agcacagctg ggcatcaaac tgcgctttga aggcacgggc 840
gttgaagaga agggcattgt ggtttccgtc accgggcatg acgcgccggg cgttaaaccg 900
ggtgatgtga ttatcgctgt tgacccgcgt tacttccgtc cggctgaagt tgaaacgctg 960
ctcggcgacc cgaccaaagc gcacgaaaaa ctgggctgga aaccggaaat caccctcaga 1020
gagatggtgt ctgaaatggt ggctaatgac ctcgaagcgg cgaaaaaaca ctctctgctg 1080
aaatctcacg gctacgacgt ggcgatcgcg ctggagtcat aagcatgagt aaacaacgag 1140
tttttattgc tggtcatcgc gggatggtcg gttccgccat caggcggcag ctcgaacagc 1200
gcggtgatgt ggaactggta ttacgcaccc gcgacgagct gaacctgctg gacagccgcg 1260
ccgtgcatga tttctttgcc agcgaacgta ttgaccaggt ctatctggcg gcggcgaaag 1320
tgggcggcat tgttgccaac aacacctatc cggcggattt catctaccag aacatgatga 1380
ttgagagcaa catcattcac gccgcgcatc agaacgacgt gaacaaactg ctgtttctcg 1440
gatcgtcctg catctacccg aaactggcaa aacagccgat ggcagaaagc gagttgttgc 1500
agggcacgct ggagccgact aacgagcctt atgctattgc caaaatcgcc gggatcaaac 1560
tgtgcgaatc atacaaccgc cagtacggac gcgattaccg ctcagtcatg ccgaccaacc 1620
tgtacgggcc acacgacaac ttccacccga gtaattcgca tgtgatccca gcattgctgc 1680
gtcgcttcca cgaggcgacg gcacagaatg cgccggacgt ggtggtatgg ggcagcggta 1740
caccgatgcg cgaatttctg cacgtcgatg atatggcggc ggcgagcatt catgtcatgg 1800
agctggcgca tgaagtctgg ctggagaaca cccagccgat gttgtcgcac attaacgtcg 1860
gcacgggcgt tgactgcact atccgcgagc tggcgcaaac catcgccaaa gtggtgggtt 1920
acaaaggccg ggtggttttt gatgccagca aaccggatgg cacgccgcgc aaactgctgg 1980
atgtgacgcg cctgcatcag cttggctggt atcacgaaat ctcactggaa gcggggcttg 2040
ccagcactta ccagtggttc cttgagaatc aagaccgctt tcgggggtaa tgatgttttt 2100
acgtcaggaa gactttgcca cggtagtgcg ctccactccg cttgtctctc tcgactttat 2160
tgtcgagaac agtcgcggcg agtttctgct tggcaaaaga accaaccgcc cggcgcaggg 2220
ttactggttt gtgccgggag ggcgcgtgca gaaagacgaa acgctggaag ccgcatttga 2280
gcggctgacg atggcggaac tggggctgcg tttgccgata acagcaggcc agttttacgg 2340
tgtctggcag cacttttatg acgataactt ctctggcacg gatttcacca ctcactatgt 2400
ggtgctcggt tttcgcttca gagtatcgga agaagagctg ttactgccgg atgagcagca 2460
tgacgattac cgctggctga cgtcggacgc gctgctcgcc agtgataatg ttcatgctaa 2520
cagccgcgcc tattttctcg ctgagaagcg taccggagta cccggattat gaaaatactg 2580
gtctacggca ttaactactc gccggagtta accggcatcg gcaaatacac cggcgagatg 2640
gtggaatggc tggcggcaca aggtcatgag gtgcgggtca ttaccgcacc gccttactac 2700
ccgcaatggc aggtgggcga gaactattcc gcctggcgct acaaacgaga agagggggcc 2760
gccacggtgt ggcgctgccc gctgtatgtg ccaaaacagc cgagcaccct gaaacgcctg 2820
ttgcatctgg gcagttttgc cgtcagcagt ttctttccgc tgatggcgca acgtcgctgg 2880
aagccggatc gcattattgg cgtggtgcca acgctgtttt gcgcgccggg aatgcgcctg 2940
ctggcgaaac tctctggtgc gcgtaccgtg ctgcatattc aggattacga agtggacgcc 3000
atgctggggc tgggccttgc cggaaaaggc aaaggcggca aagtggcaca gctggcaacg 3060
gcgttcgaac gtagcggact gcataacgtc gataacgtct ccacgatttc gcgttcgatg 3120
atgaataaag ccatcgaaaa aggcgtggcg gcggaaaacg tcatcttctt ccccaactgg 3180
tcggaaattg cccgttttca gcatgttgca gatgccgatg ttgatgccct tcgtaaccag 3240
cttgacctgc cggataacaa aaaaatcatt ctttactccg gcaatattgg tgaaaagcag 3300
gggctggaaa acgttattga agctgccgat cgtctgcgcg atgaaccgct gatttttgcc 3360
attgtcgggc agggcggcgg caaagcgcgg ctggaaaaaa tggcgcagca gcgtggactg 3420
cgcaacatgc aatttttccc gctgcaatcg tatgacgctt tacccgcact gctgaagatg 3480
ggcgattgcc atctggtggt gcaaaaacgc ggcgcggcag atgccgtatt gccgtcgaaa 3540
ctgaccaata ttctggcagt aggcggtaac gcggtgatta ctgctgaagc ctacacagaa 3600
ctggggcagc tttgcgaaac ctttccgggc attgcggttt gcgttgaacc ggaatcggtc 3660
gaggcgctgg tggcggggat ccgtcaggcg ctcctgctgc ccaaacacaa cacggtggca 3720
cgtgaatatg ccgaacgcac gctcgataaa gagaacgtgt tacgtcaatt tataaatgat 3780
attcggggat aattatggcg cagtcgaaac tctatccagt tgtgatggca ggtggctccg 3840
gtagccgctt atggccgctt tcccgcgtac tttatcccaa gcagttttta tgcctgaaag 3900
gcgatctcac catgctgcaa accaccatct gccgcctgaa cggcgtggag tgcgaaagcc 3960
cggtggtgat ttgcaatgag cagcaccgct ttattgtcgc ggaacagctg cgtcaactga 4020
acaaacttac cgagaacatt attctcgaac cggcagggcg aaacacggca cctgccattg 4080
cgctggcggc gctggcggca aaacgtcata gcccggagag cgacccgtta atgctggtat 4140
tggcggcgga tcatgtgatt gccgatgaag acgcgttccg tgccgccgtg cgtaatgcca 4200
tgccatatgc cgaagcgggc aagctggtga ccttcggcat tgtgccggat ctaccagaaa 4260
ccggttatgg ctatattcgt cgcggtgaag tgtctgcggg tgagcaggat atggtggcct 4320
ttgaagtggc gcagtttgtc gaaaaaccga atctggaaac cgctcaggcc tatgtggcaa 4380
gcggcgaata ttactggaac agcggtatgt tcctgttccg cgccggacgc tatctcgaag 4440
aactgaaaaa atatcgcccg gatatcctcg atgcctgtga aaaagcgatg agcgccgtcg 4500
atccggatct caattttatt cgcgtggatg aagaagcgtt tctcgcctgc ccggaagagt 4560
cggtggatta cgcggtcatg gaacgtacgg cagatgctgt tgtggtgccg atggatgcgg 4620
gctggagcga tgttggctcc tggtcttcat tatgggagat cagcgcccac accgccgagg 4680
gcaacgtttg ccacggcgat gtgattaatc acaaaactga aaacagctat gtgtatgctg 4740
aatctggcct ggtcaccacc gtcggggtga aagatctggt agtggtgcag accaaagatg 4800
cggtgctgat tgccgaccgt aacgcggtac aggatgtgaa aaaagtggtc gagcagatca 4860
aagccgatgg tcgccatgag catcgggtgc atcgcgaagt gtatcgtccg tggggcaaat 4920
atgactctat cgacgcgggc gaccgctacc aggtgaaacg catcaccgtg aaaccgggcg 4980
agggcttgtc ggtacagatg caccatcacc gcgcggaaca ctgggtggtt gtcgcgggaa 5040
cggcaaaagt caccattgat ggtgatatca aactgcttgg tgaaaacgag tccatttata 5100
ttccgctggg ggcgacgcat tgcctggaaa acccggggaa aattccgctc gatttaattg 5160
aagtgcgctc cggctcttat ctcgaagagg atgatgtggt gcgtttcgcg gatcgctacg 5220
gacgggtgta aacgtcgcat caggcaatga atgcgaaacc gcggtgtaaa taacgacaaa 5280
aataaaattg gccgcttcgg tcagggccaa ctattgcctg aaaaagggta acgatatgaa 5340
aaaattaacc tgctttaaag cctatgatat tcgcgggaaa ttaggcgaag aactgaatga 5400
agatatcgcc tggcgcattg gtcgcgccta tggcgaattt ctcaaaccga aaaccattgt 5460
gttaggcggt gatgtccgcc tcaccagcga aaccttaaaa ctggcgctgg cgaaaggttt 5520
acaggatgcg ggcgttgacg tgctggatat tggtatgtcc ggcaccgaag agatctattt 5580
cgccacgttc catctcggcg tggatggcgg cattgaagtt accgccagcc ataatccgat 5640
ggattataac ggcatgaagc tggttcgcga gggggctcgc ccgatcagcg gagataccgg 5700
actgcgcgac gtccagcgtc tggctgaagc caacgacttt cctcccgtcg atgaaaccaa 5760
acgcggtcgc tatcagcaaa tcaacctgcg tgacgcttac gttgatcacc tgttcggtta 5820
tatcaatgtc aaaaacctca cgccgctcaa gctggtgatc aactccggga acggcgcagc 5880
gggtccggtg gtggacgcca ttgaagcccg ctttaaagcc ctcggcgcgc ccgtggaatt 5940
aatcaaagtg cacaacacgc cggacggcaa tttccccaac ggtattccta acccactact 6000
gccggaatgc cgcgacgaca cccgcaatgc ggtcatcaaa cacggcgcgg atatgggcat 6060
tgcttttgat ggcgattttg accgctgttt cctgtttgac gaaaaagggc agtttattga 6120
gggctactac attgtcggcc tgttggcaga agcattcctc gaaaaaaatc ccggcgcgaa 6180
gatcatccac gatccacgtc tctcctggaa caccgttgat gtggtgactg ccgcaggtgg 6240
cacgccggta atgtcgaaaa ccggacacgc ctttattaaa gaacgtatgc gcaaggaaga 6300
cgccatctat ggtggcgaaa tgagcgccca ccattacttc cgtgatttcg cttactgcga 6360
cagcggcatg atcccgtggc tgctggtcgc cgaactggtg tgcctgaaag ataaaacgct 6420
gggcgaactg gtacgcgacc ggatggcggc gtttccggca agcggtgaga tcaacagcaa 6480
actggcgcaa cccgttgagg cgattaaccg cgtggaacag cattttagcc gtgaggcgct 6540
ggcggtggat cgcaccgatg gcatcagcat gacctttgcc gactggcgct ttaacctgcg 6600
cacctccaat accgaaccgg tggtgcgcct gaatgtggaa tcgcgcggtg atgtgccgct 6660
gatggaagcg cgaacgcgaa ctctgctgac gttgctgaac gagtaa 6706
<210> 31
<211> 909
<212> DNA
<213> Helicobacter pylori 26695
<400> 31
atggcgttca aagtggtcca aatctgcggt ggtctgggta atcaaatgtt ccaatatgcc 60
ttcgctaaat cgctgcaaaa acacagtaat accccggtcc tgctggatat tacgagtttt 120
gattggtccg accgtaaaat gcagctggaa ctgttcccga ttgatctgcc gtatgcgagc 180
gccaaagaaa tcgcaattgc taaaatgcag catctgccga aactggttcg tgatgcgctg 240
aaatgcatgg gctttgaccg cgtcagtcaa gaaatcgtgt tcgaatatga accgaaactg 300
ctgaaaccgt cccgtctgac ctatttcttt ggttactttc aggacccgcg ttacttcgac 360
gccatctctc cgctgattaa acaaaccttt acgctgccgc cgccgccgga aaacaacaaa 420
aacaacaaca aaaaagaaga agaatatcag tgcaaactga gcctgatcct ggcggccaaa 480
aactctgtgt ttgttcacat tcgtcgcggc gattacgtgg gcatcggttg tcagctgggt 540
attgactatc agaaaaaagc gctggaatac atggccaaac gtgttccgaa tatggaactg 600
tttgtcttct gcgaagatct ggaatttacc caaaacctgg acctgggcta tccgttcatg 660
gatatgacca cgcgcgacaa agaagaagaa gcgtattggg atatgctgct gatgcagagc 720
tgtcaacatg gtattatcgc taatagcacg tattcttggt gggcagctta cctgattgaa 780
aacccggaaa aaattatcat tggcccgaaa cattggctgt ttggtcacga aaatatcctg 840
tgtaaagaat gggtgaaaat cgaatcacac ttcgaagtta aatcgcagaa atataacgcg 900
ctgggctaa 909
<210> 32
<211> 1278
<212> DNA
<213> Helicobacter pylori 26695
<400> 32
atgttccaac cgctgctgga cgcgttcatc gaatctgcct ctattgaaaa aatggcctcg 60
aaatcgccgc cgccgccgct gaaaatcgca gtggctaatt ggtggggtga tgaagaaatc 120
aaagaattta aaaaatttgt gctgtatttc attctgtctc agcgttacgc aatcaccctg 180
catcaaaacc cgaatgaatt tagtgacctg gtcttctcca acccgctggg tgcagcacgt 240
aaaattctga gctatcagaa taccaaacgc gtgttttaca cgggtgaaaa cgaatctccg 300
aactttaacc tgtttgatta tgccatcggc tttgatgaac tggacttcaa tgatcgttat 360
ctgcgcatgc cgctgtatta caatgagctg cacattaaag ctgaactggt taatgatacc 420
acggcgccgt ataaactgaa gggtaacagt ctgtacgccc tgaaaaaacc gtcccatcac 480
tttaaagaaa accacccgaa tctgtgcgcg gtggttaacg acgaaagcga tctgctgaaa 540
cgtggctttg catcattcgt tgcttcgaac gcgaatgccc cgatgcgcaa cgcgttttat 600
gatgccctga acagcattga accggttacc ggcggtggct cggtccgtaa tacgctgggt 660
tgcaaagtgg gcaacaaaag cgaatttctg tctcagtaca aattcaacct gtgtttcgaa 720
aatagtcaag gttatggcta cgttaccgaa aaaatcctgg atgcgtattt ctcccatacg 780
attccgatct actggggtag cccgtctgtc gccaaagatt ttaacccgaa atctttcgtc 840
aatgtgcacg acttcaacaa cttcgacgaa gcaatcgatt acatcaaata cctgcatacc 900
cacccgaatg cttatctgga tatgctgtac gaaaacccgc tgaatacgct ggacggcaaa 960
gcctattttt accaggatct gagtttcaag aaaattctgg atttctttaa aaccattctg 1020
gaaaacgata cgatctacca taaattcagt accagcttta tgtgggaata cgacctgcac 1080
aaaccgctgg ttagcatcga tgacctgcgt gttaactatg atgacctgcg tgtcaattac 1140
gatcgcctgc tgcagaacgc atcaccgctg ctggaactgt cgcaaaatac cacgtttaaa 1200
atctatcgca aagcgtatca aaaatcactg ccgctgctgc gtgctgtccg taaactggtc 1260
aaaaaactgg gtctgtaa 1278
<210> 33
<211> 1179
<212> DNA
<213> Escherichia coli
<400> 33
atgatctgga taatgacgat ggctcgccgt atgaacggtg tttacgcggc atttatgctg 60
gtcgctttta tgatgggggt ggccggggcg ctacaggctc ctacattgag cttatttctg 120
agtcgtgagg ttggcgcgca acctttctgg atcggcctct tttatacggt gaatgctatt 180
gctgggatcg gcgtaagcct ctggttggca aaacgttctg acagtcaggg cgatcggcga 240
aaactgatta tattttgctg tttgatggct atcggcaatg cgctattgtt tgcatttaat 300
cgtcattatc tgacgcttat cacctgtggt gtgcttctgg catctctggc caatacggca 360
atgccacagt tatttgctct ggcgcgggaa tatgcggata actcggcgcg agaagtggtg 420
atgtttagct cggtgatgcg tgcgcagctt tctctggcat gggttatcgg tccaccgttg 480
gcctttatgc tggcgttgaa ttacggcttt acggtgatgt tttcgattgc cgccgggata 540
ttcacactca gtctggtatt gattgcattt atgcttccgt ctgtggcgcg ggtagaactg 600
ccgtcggaaa atgctttatc aatgcaaggt ggctggcagg atagtaacgt acggatgtta 660
tttgtcgcct cgacgttaat gtggacctgc aacaccatgt acattattga tatgccgttg 720
tggatcagta gcgagttagg attgccagac aaactggcgg gtttcctgat ggggacggca 780
gctggactgg aaataccagc aatgattctg gctggctact atgtcaaacg ttatggtaag 840
cggcgaatga tggtcatagc agtggcggca ggagtactgt tttacaccgg attgattttc 900
tttaatagcc gtatggcgtt gatgacgctg caacttttta acgctgtatt tatcggcatt 960
gttgcgggta ttgggatgct atggtttcag gatttaatgc ctggaagagc gggggcagct 1020
accaccttat ttactaacag tatttctacc ggggtaattc tggctggcgt tattcaggga 1080
gcaattgcac aaagttgggg gcactttgct gtctactggg taattgcggt tatttctgtt 1140
gtcgcattat ttttaaccgc aaaggttaaa gacgtttga 1179
<210> 34
<211> 1197
<212> DNA
<213> Serratia marcescens
<400> 34
atgcagcgtc tgagccgtct gagcctgcgt atcaacccga ttttcgcggc gtttctgctg 60
atcgcgttcc tgagcggtat tgcgggtgcg ctgctgaccc cgaccctgag cctgtttctg 120
accaccgagg tgaaggttcg tccgctgtgg gtgggtctgt tctacaccgc gaacgcggtt 180
gcgggcatcg tggttagctt tctgctggcg aaacgtagcg acacccgtgg tgaccgtcgt 240
cgtctgattc tgctgtgctg cctgatggcg gtgggcaact gcctgctgtt cgcgtttaac 300
cgtgactacc tgaccctgat caccgcgggt gtgctgatga gcgcggttgc gaacaccgcg 360
atgccgcaga ttttcgcgct ggcgcgtgaa tatgcggata gcgaggcgcg tgaagtggtt 420
atgtttagca gcgtgatgcg tgcgcaactg agcctggcgt gggttattgg tccgccgctg 480
agcttcgcgc tggcgctgaa ctatggcttc accgtgatgt ttctgattgc ggcggttacc 540
ttcgcggtgt gcgttctgct ggttggtttt atgctgccga gcgttccgcg tgcggcggag 600
aacgaaggcc tgcagggtgg cgtgagcgcg ccgattgcgc cggcgagcgc gtggcgtaac 660
cgtgacgttc gtctgctgtt tattgcgagc atgctgatgt ggacctgcaa caccctgtac 720
atcattgaca tgccgctgta tatcaccgcg gatctgggtc tgccggaggg tctggcgggc 780
gtgctgatgg gcaccgcggc gggcctggaa atcccggcga tgctgctggc gggttactat 840
gttaagcgtt tcggcaaacg taacatgatg ctgctggcgg tggttgcggg tgtgctgttt 900
tacctgggcc tgaccgttct ggagagcaaa ccggcgctga ttgcgctgca gctgctgaac 960
gcggtgttca tcggtattgt tgcgggtatt ggcatgctgt attttcagga cctgatgccg 1020
ggtcgtccgg gtgcggcgac caccctgttc accaacagca tcagcaccgg cgtgattctg 1080
gcgggtgttc tgcaaggcgc gctggttgag aacctgggtc acggcagcgt ttactggatg 1140
gcggcgctgc tggcgctggc ggcgctgggt atgagcgcga aagtgcgtga agtttaa 1197
<210> 35
<211> 1185
<212> DNA
<213> Rosenbergiella nectarea
<400> 35
atgcagagct tcaccccgcc ggcgccgaag ggtggcaacc cggtgttcat gatgtttatg 60
ctggtgacct tctttgtgag cattgcgggt gcgctgcagg cgccgaccct gagcctgtac 120
ctgagccaag agctggcggc gaaaccgttc atggtgggcc tgttctttac cattaacgcg 180
gttaccggta tcattatcag ctttatcctg gcgaagcgta gcgaccgtaa aggtgaccgt 240
cgtcgtctgc tgatgttctg ctgcgcgatg gcgatcgcga acgcgctgat gttcgcgttt 300
gttcgtcagt acgtggttct gattaccctg ggcctgatcc tgagcgcgct gaccagcgtg 360
gttatgccgc aactgttcgc gctggcgcgt gagtatgcgg accgtaccgg tcgtgaagtg 420
gttatgttta gcagcgtgat gcgtacccaa atgagcctgg cgtgggttat tggcccgccg 480
atcagcttcg cgctggcgct gaactacggt tttattaccc tgtatctggt ggctgcggcg 540
ctgtttctgc tgagcctgat tctgatcaag accaccctgc cgagcgttcc gcgtctgtat 600
ccggcggaag acctggcgaa gagcgcggcg agcggttgga aacgtaccga tgtgcgtttc 660
ctgtttgcgg cgagcgtgct gatgtgggtt tgcaacctga tgtacattat cgatatgccg 720
ctgtatatca gcaaaagcct gggtatgccg gagagcttcg cgggtgttct gatgggcacc 780
gcggcgggtc tggaaattcc ggtgatgctg ctggcgggct acctggcgaa gcgtgttggt 840
aaacgtccgc tggtgattgt tgcggcggtg tgcggcctgg cgttctatcc ggcgatgctg 900
gtttttcacc agcaaaccgg tctgctgatt atccagctgc tgaacgcggt gttcattggc 960
atcgtggcgg gtctggttat gctgtggttt caagacctga tgccgggtaa agcgggtgcg 1020
gcgaccaccc tgttcaccaa cagcgttagc accggcatga tctttgcggg cctgtgccag 1080
ggtctgctga gcgatctgct gggtcaccaa gcgatttacg tgctggcgac cgtgctgatg 1140
gttatcgcgc tgctgctgct gctgcgtgtt aaagagcagg cgtaa 1185
<210> 36
<211> 1179
<212> DNA
<213> Pantoea vagans
<400> 36
atgaagagcc tgctgacccg taaacgtcgt attaacccgg tgttcctggc gtttatggcg 60
gcgagcttca tgatcggtgt tgcgggtgcg ctgcaggcgc cgaccctgag cctgtttctg 120
acccgtgagg tgcaagcgcg tccgctgtgg gtgggcctgt tctttaccgt taacgcgatc 180
gcgggtattg tggttagcat gctggttgcg aagcgtagcg acagccgtgg cgatcgtcgt 240
accctgattc tgttctgctg cgcgatggcg ttttgcaacg cgctgctgtt cgcgtttacc 300
cgtcactacc tgaccctgat taccctgggt gtgctgctga gcgcgctggc gagcgttagc 360
atgccgcaga ttttcgcgct ggcgcgtgag tatgcggacc aaagcgcgcg tgaagcggtg 420
atgtttagca gcgttatgcg tgcgcagctg agcctggcgt gggtgattgg cccgccgctg 480
agcttcgcgc tggcgctgaa cttcggtttt gtgaccctgt tcctggttgc tgcggcgctg 540
tttctggtgt gcatcctgct gattaagttt accctgccga gcgttccgcg tgcggaaccg 600
ctgatgcgta gcggtggcat gccgctgagc ggttggcgtg accgtgatgt gcgtctgctg 660
ttcattgcga gcgttaccat gtggacctgc aacaccatgt acatcattga catgccgctg 720
tatatcagcg ttaccctggg tctgccggag aaactggcgg gtctgctgat gggcaccgcg 780
gcgggtctgg aaattccggt gatgctgctg gcgggtcact atgcgaagcg tgttggtaaa 840
cgtaacctga tgctgattgc ggtggcggcg ggcgttctgt tctatgcggg tctggcgatg 900
tttgcgagcc agaccgcgct gatggcgctg caactgttca acgcggtgtt tattggcatc 960
attgcgggta tcggcatgct gtggttccag gatctgatgc cgggtcgtcc gggtgcggcg 1020
accaccatgt ttaccaacag catcagcacc ggtatgattc tggcgggcgt tatccaaggc 1080
accctgagcg agcgtttcgg ccacattgcg gtgtattggc tggcgctggg tctggcggtt 1140
gcggcgtttg cgatgagcgc gcgtgtgaaa aacgtttaa 1179
<210> 37
<211> 302
<212> PRT
<213> Helicobacter pylori 26695
<400> 37
Met Ala Phe Lys Val Val Gln Ile Cys Gly Gly Leu Gly Asn Gln Met
1 5 10 15
Phe Gln Tyr Ala Phe Ala Lys Ser Leu Gln Lys His Ser Asn Thr Pro
20 25 30
Val Leu Leu Asp Ile Thr Ser Phe Asp Trp Ser Asp Arg Lys Met Gln
35 40 45
Leu Glu Leu Phe Pro Ile Asp Leu Pro Tyr Ala Ser Ala Lys Glu Ile
50 55 60
Ala Ile Ala Lys Met Gln His Leu Pro Lys Leu Val Arg Asp Ala Leu
65 70 75 80
Lys Cys Met Gly Phe Asp Arg Val Ser Gln Glu Ile Val Phe Glu Tyr
85 90 95
Glu Pro Lys Leu Leu Lys Pro Ser Arg Leu Thr Tyr Phe Phe Gly Tyr
100 105 110
Phe Gln Asp Pro Arg Tyr Phe Asp Ala Ile Ser Pro Leu Ile Lys Gln
115 120 125
Thr Phe Thr Leu Pro Pro Pro Pro Glu Asn Asn Lys Asn Asn Asn Lys
130 135 140
Lys Glu Glu Glu Tyr Gln Cys Lys Leu Ser Leu Ile Leu Ala Ala Lys
145 150 155 160
Asn Ser Val Phe Val His Ile Arg Arg Gly Asp Tyr Val Gly Ile Gly
165 170 175
Cys Gln Leu Gly Ile Asp Tyr Gln Lys Lys Ala Leu Glu Tyr Met Ala
180 185 190
Lys Arg Val Pro Asn Met Glu Leu Phe Val Phe Cys Glu Asp Leu Glu
195 200 205
Phe Thr Gln Asn Leu Asp Leu Gly Tyr Pro Phe Met Asp Met Thr Thr
210 215 220
Arg Asp Lys Glu Glu Glu Ala Tyr Trp Asp Met Leu Leu Met Gln Ser
225 230 235 240
Cys Gln His Gly Ile Ile Ala Asn Ser Thr Tyr Ser Trp Trp Ala Ala
245 250 255
Tyr Leu Ile Glu Asn Pro Glu Lys Ile Ile Ile Gly Pro Lys His Trp
260 265 270
Leu Phe Gly His Glu Asn Ile Leu Cys Lys Glu Trp Val Lys Ile Glu
275 280 285
Ser His Phe Glu Val Lys Ser Gln Lys Tyr Asn Ala Leu Gly
290 295 300
<210> 38
<211> 425
<212> PRT
<213> Helicobacter pylori 26695
<400> 38
Met Phe Gln Pro Leu Leu Asp Ala Phe Ile Glu Ser Ala Ser Ile Glu
1 5 10 15
Lys Met Ala Ser Lys Ser Pro Pro Pro Pro Leu Lys Ile Ala Val Ala
20 25 30
Asn Trp Trp Gly Asp Glu Glu Ile Lys Glu Phe Lys Lys Ser Val Leu
35 40 45
Tyr Phe Ile Leu Ser Gln Arg Tyr Ala Ile Thr Leu His Gln Asn Pro
50 55 60
Asn Glu Phe Ser Asp Leu Val Phe Ser Asn Pro Leu Gly Ala Ala Arg
65 70 75 80
Lys Ile Leu Ser Tyr Gln Asn Thr Lys Arg Val Phe Tyr Thr Gly Glu
85 90 95
Asn Glu Ser Pro Asn Phe Asn Leu Phe Asp Tyr Ala Ile Gly Phe Asp
100 105 110
Glu Leu Asp Phe Asn Asp Arg Tyr Leu Arg Met Pro Leu Tyr Tyr Ala
115 120 125
His Leu His Tyr Lys Ala Glu Leu Val Asn Asp Thr Thr Ala Pro Tyr
130 135 140
Lys Leu Lys Asp Asn Ser Leu Tyr Ala Leu Lys Lys Pro Ser His His
145 150 155 160
Phe Lys Glu Asn His Pro Asn Leu Cys Ala Val Val Asn Asp Glu Ser
165 170 175
Asp Leu Leu Lys Arg Gly Phe Ala Ser Phe Val Ala Ser Asn Ala Asn
180 185 190
Ala Pro Met Arg Asn Ala Phe Tyr Asp Ala Leu Asn Ser Ile Glu Pro
195 200 205
Val Thr Gly Gly Gly Ser Val Arg Asn Thr Leu Gly Tyr Lys Val Gly
210 215 220
Asn Lys Ser Glu Phe Leu Ser Gln Tyr Lys Phe Asn Leu Cys Phe Glu
225 230 235 240
Asn Ser Gln Gly Tyr Gly Tyr Val Thr Glu Lys Ile Leu Asp Ala Tyr
245 250 255
Phe Ser His Thr Ile Pro Ile Tyr Trp Gly Ser Pro Ser Val Ala Lys
260 265 270
Asp Phe Asn Pro Lys Ser Phe Val Asn Val His Asp Phe Asn Asn Phe
275 280 285
Asp Glu Ala Ile Asp Tyr Ile Lys Tyr Leu His Thr His Pro Asn Ala
290 295 300
Tyr Leu Asp Met Leu Tyr Glu Asn Pro Leu Asn Thr Leu Asp Gly Lys
305 310 315 320
Ala Tyr Phe Tyr Gln Asp Leu Ser Phe Lys Lys Ile Leu Asp Phe Phe
325 330 335
Lys Thr Ile Leu Glu Asn Asp Thr Ile Tyr His Lys Phe Ser Thr Ser
340 345 350
Phe Met Trp Glu Tyr Asp Leu His Lys Pro Leu Val Ser Ile Asp Asp
355 360 365
Leu Arg Val Asn Tyr Asp Asp Leu Arg Val Asn Tyr Asp Arg Leu Leu
370 375 380
Gln Asn Ala Ser Pro Leu Leu Glu Leu Ser Gln Asn Thr Thr Phe Lys
385 390 395 400
Ile Tyr Arg Lys Ala Tyr Gln Lys Ser Leu Pro Leu Leu Arg Ala Val
405 410 415
Arg Lys Leu Val Lys Lys Leu Gly Leu
420 425
<210> 39
<211> 425
<212> PRT
<213> Artificial
<220>
<223> FutA_mut4
<400> 39
Met Phe Gln Pro Leu Leu Asp Ala Phe Ile Glu Ser Ala Ser Ile Glu
1 5 10 15
Lys Met Ala Ser Lys Ser Pro Pro Pro Pro Leu Lys Ile Ala Val Ala
20 25 30
Asn Trp Trp Gly Asp Glu Glu Ile Lys Glu Phe Lys Lys Phe Val Leu
35 40 45
Tyr Phe Ile Leu Ser Gln Arg Tyr Ala Ile Thr Leu His Gln Asn Pro
50 55 60
Asn Glu Phe Ser Asp Leu Val Phe Ser Asn Pro Leu Gly Ala Ala Arg
65 70 75 80
Lys Ile Leu Ser Tyr Gln Asn Thr Lys Arg Val Phe Tyr Thr Gly Glu
85 90 95
Asn Glu Ser Pro Asn Phe Asn Leu Phe Asp Tyr Ala Ile Gly Phe Asp
100 105 110
Glu Leu Asp Phe Asn Asp Arg Tyr Leu Arg Met Pro Leu Tyr Tyr Asn
115 120 125
Glu Leu His Ile Lys Ala Glu Leu Val Asn Asp Thr Thr Ala Pro Tyr
130 135 140
Lys Leu Lys Gly Asn Ser Leu Tyr Ala Leu Lys Lys Pro Ser His His
145 150 155 160
Phe Lys Glu Asn His Pro Asn Leu Cys Ala Val Val Asn Asp Glu Ser
165 170 175
Asp Leu Leu Lys Arg Gly Phe Ala Ser Phe Val Ala Ser Asn Ala Asn
180 185 190
Ala Pro Met Arg Asn Ala Phe Tyr Asp Ala Leu Asn Ser Ile Glu Pro
195 200 205
Val Thr Gly Gly Gly Ser Val Arg Asn Thr Leu Gly Cys Lys Val Gly
210 215 220
Asn Lys Ser Glu Phe Leu Ser Gln Tyr Lys Phe Asn Leu Cys Phe Glu
225 230 235 240
Asn Ser Gln Gly Tyr Gly Tyr Val Thr Glu Lys Ile Leu Asp Ala Tyr
245 250 255
Phe Ser His Thr Ile Pro Ile Tyr Trp Gly Ser Pro Ser Val Ala Lys
260 265 270
Asp Phe Asn Pro Lys Ser Phe Val Asn Val His Asp Phe Asn Asn Phe
275 280 285
Asp Glu Ala Ile Asp Tyr Ile Lys Tyr Leu His Thr His Pro Asn Ala
290 295 300
Tyr Leu Asp Met Leu Tyr Glu Asn Pro Leu Asn Thr Leu Asp Gly Lys
305 310 315 320
Ala Tyr Phe Tyr Gln Asp Leu Ser Phe Lys Lys Ile Leu Asp Phe Phe
325 330 335
Lys Thr Ile Leu Glu Asn Asp Thr Ile Tyr His Lys Phe Ser Thr Ser
340 345 350
Phe Met Trp Glu Tyr Asp Leu His Lys Pro Leu Val Ser Ile Asp Asp
355 360 365
Leu Arg Val Asn Tyr Asp Asp Leu Arg Val Asn Tyr Asp Arg Leu Leu
370 375 380
Gln Asn Ala Ser Pro Leu Leu Glu Leu Ser Gln Asn Thr Thr Phe Lys
385 390 395 400
Ile Tyr Arg Lys Ala Tyr Gln Lys Ser Leu Pro Leu Leu Arg Ala Val
405 410 415
Arg Lys Leu Val Lys Lys Leu Gly Leu
420 425
<210> 40
<211> 478
<212> PRT
<213> Helicobacter pylori NCTC 11639
<400> 40
Met Phe Gln Pro Leu Leu Asp Ala Tyr Val Glu Ser Ala Ser Ile Glu
1 5 10 15
Lys Met Ala Ser Lys Ser Pro Pro Pro Leu Lys Ile Ala Val Ala Asn
20 25 30
Trp Trp Gly Asp Glu Glu Ile Lys Glu Phe Lys Asn Ser Val Leu Tyr
35 40 45
Phe Ile Leu Ser Gln Arg Tyr Thr Ile Thr Leu His Gln Asn Pro Asn
50 55 60
Glu Phe Ser Asp Leu Val Phe Gly Asn Pro Leu Gly Ser Ala Arg Lys
65 70 75 80
Ile Leu Ser Tyr Gln Asn Ala Lys Arg Val Phe Tyr Thr Gly Glu Asn
85 90 95
Glu Ser Pro Asn Phe Asn Leu Phe Asp Tyr Ala Ile Gly Phe Asp Glu
100 105 110
Leu Asp Phe Asn Asp Arg Tyr Leu Arg Met Pro Leu Tyr Tyr Asp Arg
115 120 125
Leu His His Lys Ala Glu Ser Val Asn Asp Thr Thr Ala Pro Tyr Lys
130 135 140
Leu Lys Asp Asn Ser Leu Tyr Ala Leu Lys Lys Pro Ser His Cys Phe
145 150 155 160
Lys Glu Lys His Pro Asn Leu Cys Ala Val Val Asn Asp Glu Ser Asp
165 170 175
Pro Leu Lys Arg Gly Phe Ala Ser Phe Val Ala Ser Asn Pro Asn Ala
180 185 190
Pro Ile Arg Asn Ala Phe Tyr Asp Ala Leu Asn Ser Ile Glu Pro Val
195 200 205
Thr Gly Gly Gly Ser Val Arg Asn Thr Leu Gly Tyr Asn Val Lys Asn
210 215 220
Lys Asn Glu Phe Leu Ser Gln Tyr Lys Phe Asn Leu Cys Phe Glu Asn
225 230 235 240
Thr Gln Gly Tyr Gly Tyr Val Thr Glu Lys Ile Ile Asp Ala Tyr Phe
245 250 255
Ser His Thr Ile Pro Ile Tyr Trp Gly Ser Pro Ser Val Ala Lys Asp
260 265 270
Phe Asn Pro Lys Ser Phe Val Asn Val His Asp Phe Lys Asn Phe Asp
275 280 285
Glu Ala Ile Asp Tyr Ile Lys Tyr Leu His Thr His Lys Asn Ala Tyr
290 295 300
Leu Asp Met Leu Tyr Glu Asn Pro Leu Asn Thr Leu Asp Gly Lys Ala
305 310 315 320
Tyr Phe Tyr Gln Asn Leu Ser Phe Lys Lys Ile Leu Ala Phe Phe Lys
325 330 335
Thr Ile Leu Glu Asn Asp Thr Ile Tyr His Asp Asn Pro Phe Ile Phe
340 345 350
Cys Arg Asp Leu Asn Glu Pro Leu Val Thr Ile Asp Asp Leu Arg Val
355 360 365
Asn Tyr Asp Asp Leu Arg Val Asn Tyr Asp Asp Leu Arg Ile Asn Tyr
370 375 380
Asp Asp Leu Arg Val Asn Tyr Asp Asp Leu Arg Ile Asn Tyr Asp Asp
385 390 395 400
Leu Arg Val Asn Tyr Asp Asp Leu Arg Val Asn Tyr Asp Asp Leu Arg
405 410 415
Ile Asn Tyr Asp Asp Leu Arg Val Asn Tyr Asp Asp Leu Arg Val Asn
420 425 430
Tyr Glu Arg Leu Leu Ser Lys Ala Thr Pro Leu Leu Glu Leu Ser Gln
435 440 445
Asn Thr Thr Ser Lys Ile Tyr Arg Lys Ala Tyr Gln Lys Ser Leu Pro
450 455 460
Leu Leu Arg Ala Ile Arg Arg Trp Val Lys Lys Leu Gly Leu
465 470 475
<210> 41
<211> 392
<212> PRT
<213> Escherichia coli
<400> 41
Met Ile Trp Ile Met Thr Met Ala Arg Arg Met Asn Gly Val Tyr Ala
1 5 10 15
Ala Phe Met Leu Val Ala Phe Met Met Gly Val Ala Gly Ala Leu Gln
20 25 30
Ala Pro Thr Leu Ser Leu Phe Leu Ser Arg Glu Val Gly Ala Gln Pro
35 40 45
Phe Trp Ile Gly Leu Phe Tyr Thr Val Asn Ala Ile Ala Gly Ile Gly
50 55 60
Val Ser Leu Trp Leu Ala Lys Arg Ser Asp Ser Gln Gly Asp Arg Arg
65 70 75 80
Lys Leu Ile Ile Phe Cys Cys Leu Met Ala Ile Gly Asn Ala Leu Leu
85 90 95
Phe Ala Phe Asn Arg His Tyr Leu Thr Leu Ile Thr Cys Gly Val Leu
100 105 110
Leu Ala Ser Leu Ala Asn Thr Ala Met Pro Gln Leu Phe Ala Leu Ala
115 120 125
Arg Glu Tyr Ala Asp Asn Ser Ala Arg Glu Val Val Met Phe Ser Ser
130 135 140
Val Met Arg Ala Gln Leu Ser Leu Ala Trp Val Ile Gly Pro Pro Leu
145 150 155 160
Ala Phe Met Leu Ala Leu Asn Tyr Gly Phe Thr Val Met Phe Ser Ile
165 170 175
Ala Ala Gly Ile Phe Thr Leu Ser Leu Val Leu Ile Ala Phe Met Leu
180 185 190
Pro Ser Val Ala Arg Val Glu Leu Pro Ser Glu Asn Ala Leu Ser Met
195 200 205
Gln Gly Gly Trp Gln Asp Ser Asn Val Arg Met Leu Phe Val Ala Ser
210 215 220
Thr Leu Met Trp Thr Cys Asn Thr Met Tyr Ile Ile Asp Met Pro Leu
225 230 235 240
Trp Ile Ser Ser Glu Leu Gly Leu Pro Asp Lys Leu Ala Gly Phe Leu
245 250 255
Met Gly Thr Ala Ala Gly Leu Glu Ile Pro Ala Met Ile Leu Ala Gly
260 265 270
Tyr Tyr Val Lys Arg Tyr Gly Lys Arg Arg Met Met Val Ile Ala Val
275 280 285
Ala Ala Gly Val Leu Phe Tyr Thr Gly Leu Ile Phe Phe Asn Ser Arg
290 295 300
Met Ala Leu Met Thr Leu Gln Leu Phe Asn Ala Val Phe Ile Gly Ile
305 310 315 320
Val Ala Gly Ile Gly Met Leu Trp Phe Gln Asp Leu Met Pro Gly Arg
325 330 335
Ala Gly Ala Ala Thr Thr Leu Phe Thr Asn Ser Ile Ser Thr Gly Val
340 345 350
Ile Leu Ala Gly Val Ile Gln Gly Ala Ile Ala Gln Ser Trp Gly His
355 360 365
Phe Ala Val Tyr Trp Val Ile Ala Val Ile Ser Val Val Ala Leu Phe
370 375 380
Leu Thr Ala Lys Val Lys Asp Val
385 390
<210> 42
<211> 393
<212> PRT
<213> Yersinia frederiksenii
<400> 42
Met Lys Ser Ala Leu Thr Phe Ser Arg Arg Ile Asn Pro Val Phe Leu
1 5 10 15
Ala Phe Phe Val Val Ala Phe Leu Ser Gly Ile Ala Gly Ala Leu Gln
20 25 30
Ala Pro Thr Leu Ser Leu Phe Leu Ser Thr Glu Val Lys Val Arg Pro
35 40 45
Leu Trp Val Gly Leu Phe Tyr Thr Val Asn Ala Ile Ala Gly Ile Thr
50 55 60
Val Ser Phe Val Leu Ala Lys Arg Ser Asp Leu Arg Gly Asp Arg Arg
65 70 75 80
Lys Leu Ile Leu Val Cys Tyr Leu Met Ala Val Gly Asn Cys Leu Leu
85 90 95
Phe Ala Phe Asn Arg Asp Tyr Leu Thr Leu Ile Thr Ala Gly Val Leu
100 105 110
Leu Ala Ala Val Ala Asn Thr Ala Met Pro Gln Ile Phe Ala Leu Ala
115 120 125
Arg Glu Tyr Ala Asp Asn Ser Ala Arg Glu Val Val Met Phe Ser Ser
130 135 140
Ile Met Arg Ala Gln Leu Ser Leu Ala Trp Val Ile Gly Pro Pro Leu
145 150 155 160
Ser Phe Met Leu Ala Leu Asn Tyr Gly Phe Thr Leu Met Phe Cys Ile
165 170 175
Ala Ala Gly Ile Phe Val Leu Ser Ala Leu Val Val Trp Phe Ile Leu
180 185 190
Pro Ser Val Gln Arg Ala Glu Pro Val Met Asp Ala Pro Thr Val Ala
195 200 205
Gln Gly Ser Leu Phe Ala Asp Lys Asp Val Leu Leu Leu Phe Ile Ala
210 215 220
Ser Met Leu Met Trp Thr Cys Asn Thr Met Tyr Ile Ile Asp Met Pro
225 230 235 240
Leu Tyr Ile Thr Ala Ser Leu Gly Leu Pro Glu Arg Leu Ala Gly Leu
245 250 255
Leu Met Gly Thr Ala Ala Gly Leu Glu Ile Pro Ile Met Leu Leu Ala
260 265 270
Gly Tyr Ser Val Arg Arg Phe Gly Lys Arg Lys Ile Met Leu Phe Ala
275 280 285
Val Leu Ala Gly Val Leu Phe Tyr Thr Gly Leu Val Leu Phe Lys Phe
290 295 300
Lys Ser Ala Leu Met Leu Leu Gln Ile Phe Asn Ala Ile Phe Ile Gly
305 310 315 320
Ile Val Ala Gly Ile Gly Met Leu Tyr Phe Gln Asp Leu Met Pro Gly
325 330 335
Arg Ala Gly Ala Ala Thr Thr Leu Phe Thr Asn Ser Ile Ser Thr Gly
340 345 350
Val Ile Leu Ala Gly Val Leu Gln Gly Val Leu Thr Glu Thr Trp Gly
355 360 365
His Asn Ser Val Tyr Val Met Ala Met Ile Leu Ala Ile Leu Ser Leu
370 375 380
Ile Ile Cys Ala Arg Val Arg Glu Ala
385 390
<210> 43
<211> 387
<212> PRT
<213> Rouxiella badensis
<400> 43
Met Ser Ser Arg Arg Leu Ser Ile Ile Phe Ala Thr Phe Leu Leu Val
1 5 10 15
Ser Phe Leu Thr Gly Ile Ala Gly Ala Leu Gln Ala Pro Thr Leu Ser
20 25 30
Leu Phe Leu Thr Asn Glu Val Lys Val Arg Pro Leu Trp Val Gly Leu
35 40 45
Phe Tyr Thr Val Asn Ala Leu Gly Gly Ile Val Ile Ser Phe Leu Leu
50 55 60
Ala Asn Tyr Ser Asp Lys Lys Gly Asp Arg Arg Lys Leu Leu Phe Phe
65 70 75 80
Cys Thr Leu Met Ala Ile Gly Asn Ser Leu Ile Phe Ala Tyr Ser Arg
85 90 95
Asp Tyr Leu Val Leu Ile Ser Val Gly Val Leu Leu Ala Ala Ile Gly
100 105 110
Asn Ala Ser Met Pro Gln Leu Phe Ala Leu Ala Arg Glu Tyr Ala Asp
115 120 125
Arg Ser Ala His Glu Val Val Met Phe Ser Ser Met Met Arg Ala Thr
130 135 140
Leu Ser Leu Ala Trp Val Leu Gly Pro Pro Ile Ser Phe Thr Leu Ala
145 150 155 160
Leu Asn Tyr Gly Phe Thr Leu Met Tyr Leu Cys Ala Ala Gly Val Phe
165 170 175
Ile Phe Ser Ala Leu Met Val Trp Phe Phe Leu Pro Ser Val Gly Arg
180 185 190
Ile Glu Gln Pro Val Asp Lys Val Val Val His Val Ser Ala Trp Lys
195 200 205
Asn Arg Asp Val Arg Leu Leu Phe Phe Ala Ser Leu Leu Met Trp Thr
210 215 220
Cys Asn Ile Met Tyr Ile Ile Asp Met Pro Leu Tyr Ile Thr Ser Asp
225 230 235 240
Leu Gly Leu Pro Glu Gly Leu Ala Gly Leu Leu Met Gly Ala Ala Ala
245 250 255
Gly Leu Glu Ile Pro Val Met Leu Ile Ala Gly Tyr Leu Val Lys Arg
260 265 270
Thr Gly Lys Arg Arg Leu Met Leu Cys Ala Ala Val Phe Gly Ile Leu
275 280 285
Phe Tyr Leu Gly Leu Val Leu Phe Gln Phe Lys Ala Ala Leu Met Ile
290 295 300
Leu Gln Leu Phe Asn Ala Ile Phe Ile Gly Ile Ile Ala Gly Ile Gly
305 310 315 320
Met Leu Tyr Phe Gln Asp Leu Met Pro Gly Arg Ala Gly Ser Ala Thr
325 330 335
Thr Leu Phe Thr Asn Ser Ile Ser Thr Gly Ala Ile Leu Ala Gly Val
340 345 350
Ile Gln Gly Thr Ile Val Gln Asn Phe Gly His Tyr Gln Val Tyr Trp
355 360 365
Met Ala Leu Ala Leu Ala Val Gly Ala Leu Val Leu Met Thr Arg Val
370 375 380
Lys Asn Val
385
<210> 44
<211> 394
<212> PRT
<213> Yersinia bercovieri
<400> 44
Met Gln Ser Phe Thr Pro Pro Ala Pro Lys Gly Gly Asn Pro Val Phe
1 5 10 15
Met Met Phe Met Leu Val Thr Phe Phe Val Ser Ile Ala Gly Ala Leu
20 25 30
Gln Ala Pro Thr Leu Ser Leu Tyr Leu Ser Gln Glu Leu Ala Ala Lys
35 40 45
Pro Phe Met Val Gly Leu Phe Phe Thr Ile Asn Ala Val Thr Gly Ile
50 55 60
Ile Ile Ser Phe Ile Leu Ala Lys Arg Ser Asp Arg Lys Gly Asp Arg
65 70 75 80
Arg Arg Leu Leu Met Phe Cys Cys Ala Met Ala Ile Ala Asn Ala Leu
85 90 95
Met Phe Ala Phe Val Arg Gln Tyr Val Val Leu Ile Thr Leu Gly Leu
100 105 110
Ile Leu Ser Ala Leu Thr Ser Val Val Met Pro Gln Leu Phe Ala Leu
115 120 125
Ala Arg Glu Tyr Ala Asp Arg Thr Gly Arg Glu Val Val Met Phe Ser
130 135 140
Ser Val Met Arg Thr Gln Met Ser Leu Ala Trp Val Ile Gly Pro Pro
145 150 155 160
Ile Ser Phe Ala Leu Ala Leu Asn Tyr Gly Phe Ile Thr Leu Tyr Leu
165 170 175
Val Ala Ala Ala Leu Phe Leu Leu Ser Leu Ile Leu Ile Lys Thr Thr
180 185 190
Leu Pro Ser Val Pro Arg Leu Tyr Pro Ala Glu Asp Leu Ala Lys Ser
195 200 205
Ala Ala Ser Gly Trp Lys Arg Thr Asp Val Arg Phe Leu Phe Ala Ala
210 215 220
Ser Val Leu Met Trp Val Cys Asn Leu Met Tyr Ile Ile Asp Met Pro
225 230 235 240
Leu Tyr Ile Ser Lys Ser Leu Gly Met Pro Glu Ser Phe Ala Gly Val
245 250 255
Leu Met Gly Thr Ala Ala Gly Leu Glu Ile Pro Val Met Leu Leu Ala
260 265 270
Gly Tyr Leu Ala Lys Arg Val Gly Lys Arg Pro Leu Val Ile Val Ala
275 280 285
Ala Val Cys Gly Leu Ala Phe Tyr Pro Ala Met Leu Val Phe His Gln
290 295 300
Gln Thr Gly Leu Leu Ile Ile Gln Leu Leu Asn Ala Val Phe Ile Gly
305 310 315 320
Ile Val Ala Gly Leu Val Met Leu Trp Phe Gln Asp Leu Met Pro Gly
325 330 335
Lys Ala Gly Ala Ala Thr Thr Leu Phe Thr Asn Ser Val Ser Thr Gly
340 345 350
Met Ile Phe Ala Gly Leu Cys Gln Gly Leu Leu Ser Asp Leu Leu Gly
355 360 365
His Gln Ala Ile Tyr Val Leu Ala Thr Val Leu Met Val Ile Ala Leu
370 375 380
Leu Leu Leu Leu Arg Val Lys Glu Gln Ala
385 390
<210> 45
<211> 1182
<212> DNA
<213> Yersinia frederiksenii
<400> 45
atgaagagcg cgctgacctt cagccgtcgt attaacccgg tttttctggc gttctttgtg 60
gttgcgttcc tgagcggtat tgcgggtgcg ctgcaggcgc cgaccctgag cctgttcctg 120
agcaccgagg tgaaagttcg tccgctgtgg gtgggcctgt tctacaccgt taacgcgatt 180
gcgggtatca ccgtgagctt tgttctggcg aagcgtagcg acctgcgtgg cgatcgtcgt 240
aaactgatcc tggtgtgcta cctgatggcg gttggtaact gcctgctgtt cgcgtttaac 300
cgtgactatc tgaccctgat taccgcgggc gtgctgctgg cggcggttgc gaacaccgcg 360
atgccgcaga ttttcgcgct ggcgcgtgag tacgcggata acagcgcgcg tgaagtggtt 420
atgtttagca gcattatgcg tgcgcaactg agcctggcgt gggttatcgg tccgccgctg 480
agcttcatgc tggcgctgaa ctatggcttc accctgatgt tttgcattgc ggcgggtatc 540
ttcgtgctga gcgcgctggt tgtgtggttt attctgccga gcgtgcagcg tgcggaaccg 600
gttatggatg cgccgaccgt ggcgcaaggc agcctgttcg cggacaagga tgttctgctg 660
ctgtttattg cgagcatgct gatgtggacc tgcaacacca tgtacatcat tgatatgccg 720
ctgtatatca ccgcgagcct gggtctgccg gagcgtctgg cgggtctgct gatgggcacc 780
gcggcgggtc tggaaatccc gattatgctg ctggcgggct acagcgtgcg tcgttttggc 840
aagcgtaaaa tcatgctgtt cgcggtgctg gcgggcgttc tgttttatac cggtctggtt 900
ctgttcaagt ttaaaagcgc gctgatgctg ctgcagattt tcaacgcgat ctttattggt 960
atcgtggcgg gtatcggcat gctgtacttc caagacctga tgccgggtcg tgcgggtgcg 1020
gcgaccaccc tgtttaccaa cagcattagc accggcgtta tcctggcggg cgtgctgcaa 1080
ggtgttctga ccgaaacctg gggtcacaac agcgtgtatg ttatggcgat gattctggcg 1140
atcctgagcc tgatcatttg cgcgcgtgtg cgtgaagcgt aa 1182
<210> 46
<211> 1164
<212> DNA
<213> Rouxiella badensis
<400> 46
atgagcagcc gtcgtctgag catcattttc gcgacctttc tgctggttag cttcctgacc 60
ggtattgcgg gtgcgctgca ggcgccgacc ctgagcctgt ttctgaccaa cgaggttaaa 120
gtgcgtccgc tgtgggttgg tctgttctac accgtgaacg cgctgggtgg catcgttatt 180
agctttctgc tggcgaacta tagcgacaag aaaggtgatc gtcgtaaact gctgttcttt 240
tgcaccctga tggcgatcgg caacagcctg attttcgcgt acagccgtga ctatctggtg 300
ctgatcagcg ttggtgtgct gctggcggcg attggcaacg cgagcatgcc gcagctgttt 360
gcgctggcgc gtgagtacgc ggatcgtagc gcgcacgaag tggttatgtt tagcagcatg 420
atgcgtgcga ccctgagcct ggcgtgggtt ctgggtccgc cgatcagctt caccctggcg 480
ctgaactacg gttttaccct gatgtatctg tgcgcggcgg gcgtgttcat ctttagcgcg 540
ctgatggttt ggttctttct gccgagcgtg ggccgtattg aacaaccggt tgacaaggtg 600
gttgtgcacg tgagcgcgtg gaaaaaccgt gatgttcgtc tgctgttctt tgcgagcctg 660
ctgatgtgga cctgcaacat catgtacatc attgacatgc cgctgtatat taccagcgat 720
ctgggtctgc cggagggtct ggcgggcctg ctgatgggtg ctgcggcggg cctggaaatc 780
ccggttatgc tgattgcggg ttacctggtg aagcgtaccg gcaaacgtcg tctgatgctg 840
tgcgcggcgg ttttcggtat cctgttttat ctgggcctgg tgctgttcca gtttaaggcg 900
gcgctgatga tcctgcaact gttcaacgcg atctttattg gtatcattgc gggtattggc 960
atgctgtatt tccaggacct gatgccgggt cgtgcgggca gcgcgaccac cctgtttacc 1020
aacagcatca gcaccggcgc gattctggcg ggtgttatcc agggcaccat tgtgcaaaac 1080
ttcggtcact accaagtgta ttggatggcg ctggcgctgg cggttggtgc gctggtgctg 1140
atgacccgtg ttaaaaacgt gtaa 1164
<210> 47
<211> 1185
<212> DNA
<213> Yersinia bercovieri
<400> 47
atgcagagct tcaccccgcc ggcgccgaag ggtggcaacc cggtgttcat gatgtttatg 60
ctggtgacct tctttgtgag cattgcgggt gcgctgcagg cgccgaccct gagcctgtac 120
ctgagccaag agctggcggc gaaaccgttc atggtgggcc tgttctttac cattaacgcg 180
gttaccggta tcattatcag ctttatcctg gcgaagcgta gcgaccgtaa aggtgaccgt 240
cgtcgtctgc tgatgttctg ctgcgcgatg gcgatcgcga acgcgctgat gttcgcgttt 300
gttcgtcagt acgtggttct gattaccctg ggcctgatcc tgagcgcgct gaccagcgtg 360
gttatgccgc aactgttcgc gctggcgcgt gagtatgcgg accgtaccgg tcgtgaagtg 420
gttatgttta gcagcgtgat gcgtacccaa atgagcctgg cgtgggttat tggcccgccg 480
atcagcttcg cgctggcgct gaactacggt tttattaccc tgtatctggt ggctgcggcg 540
ctgtttctgc tgagcctgat tctgatcaag accaccctgc cgagcgttcc gcgtctgtat 600
ccggcggaag acctggcgaa gagcgcggcg agcggttgga aacgtaccga tgtgcgtttc 660
ctgtttgcgg cgagcgtgct gatgtgggtt tgcaacctga tgtacattat cgatatgccg 720
ctgtatatca gcaaaagcct gggtatgccg gagagcttcg cgggtgttct gatgggcacc 780
gcggcgggtc tggaaattcc ggtgatgctg ctggcgggct acctggcgaa gcgtgttggt 840
aaacgtccgc tggtgattgt tgcggcggtg tgcggcctgg cgttctatcc ggcgatgctg 900
gtttttcacc agcaaaccgg tctgctgatt atccagctgc tgaacgcggt gttcattggc 960
atcgtggcgg gtctggttat gctgtggttt caagacctga tgccgggtaa agcgggtgcg 1020
gcgaccaccc tgttcaccaa cagcgttagc accggcatga tctttgcggg cctgtgccag 1080
ggtctgctga gcgatctgct gggtcaccaa gcgatttacg tgctggcgac cgtgctgatg 1140
gttatcgcgc tgctgctgct gctgcgtgtt aaagagcagg cgtaa 1185
<210> 48
<211> 31
<212> DNA
<213> Artificial Sequence
<220>
<223> KABY733 fred.for
<400> 48
aaacagcuat gaagagcgcg ctgaccttca g 31
<210> 49
<211> 29
<212> DNA
<213> Artificial
<220>
<223> KABY734 fred.rev
<400> 49
agggttaaut tacgcttcac gcacacgcg 29
<210> 50
<211> 29
<212> DNA
<213> Artificial
<220>
<223> KABY729 bad.for
<400> 50
aaacagcuat gagcagccgt cgtctgagc 29
<210> 51
<211> 36
<212> DNA
<213> Artificial
<220>
<223> KABY730 bad.rev
<400> 51
agggttaaut tacacgtttt taacacgggt catcag 36
<210> 52
<211> 32
<212> DNA
<213> Artificial
<220>
<223> KABY721 yberc.for
<400> 52
aaacagcuat gaagagcgcg ctgaccttta gc 32
<210> 53
<211> 29
<212> DNA
<213> artificial
<220>
<223> KABY722 yberc.rev
<400> 53
agggttaaut tacgcctcac gcacacgcg 29
<210> 54
<211> 608
<212> PRT
<213> Acanthamoeba polyphaga moumouvirus
<400> 54
Met Asp Lys Phe Lys Ile Val Cys Ile Asn Leu Glu Arg Arg Lys Asp
1 5 10 15
Arg Lys Asp Leu Ile Thr Asn Lys Leu Ile Asn Gln Asn Ile Asn Asn
20 25 30
Phe Glu Phe Phe Glu Ala Ile Asp Gly Ser Lys Ile Asp Pro Asp Asp
35 40 45
Glu Arg Leu Asn Leu Phe Lys His Ser Val Ser Gly Leu Leu Arg Arg
50 55 60
Gly Val Thr Gly Cys Ala Leu Ser His Tyr Thr Ile Trp Lys Lys Leu
65 70 75 80
Ile Asn Asp Pro Asp Tyr Asn Thr Tyr Leu Val Ile Glu Asp Asp Ile
85 90 95
Asn Phe Gly Asn Asp Phe Lys Ser Ala Leu Glu Lys Ile Leu Asp Lys
100 105 110
Ser Pro Gly His Gly Ile Val Leu Leu Gly Met Thr Leu Glu Leu Glu
115 120 125
Lys Arg Ala Glu Thr Lys His Leu Tyr Gln Tyr Asp Thr Ser Tyr Ser
130 135 140
Val His Asn Leu Ser Arg Asp Leu Tyr Cys Gly Gly Ala Phe Gly Tyr
145 150 155 160
Ile Ile Thr Lys Ser Ala Ala Glu Tyr Leu Val Gly Tyr Ile Ser Cys
165 170 175
Asn Gly Ile Arg Ile Val Ile Asp Tyr Leu Met Phe Arg Ser Gly Val
180 185 190
Pro Met Tyr Glu Ser His Pro His Leu Val Phe Thr Asp Ala Val Gln
195 200 205
His Ser Ile His Tyr Val Asp Ser Asp Ile Gln His Asp Tyr Glu Arg
210 215 220
Ile Lys Tyr Asn Lys Leu Leu Asn Asn Tyr Gln Tyr Asp Asp Tyr Val
225 230 235 240
Phe Leu Ser Asn Arg Asp Ser Val Tyr Gly Asp Ile Arg Glu Val Cys
245 250 255
Ala Asp Ile Pro Thr Leu Lys Arg Ala Ala Asp Met Thr Pro Glu Cys
260 265 270
Val Ala Phe Asn Thr Tyr Gly Trp Leu Lys Asn Thr Leu Thr Asp Phe
275 280 285
Asp Lys Phe Ile Val Leu His Asp Lys Tyr Tyr Thr His Asp Gly Ile
290 295 300
Tyr Ile Lys Lys Ser Tyr Phe Ser Leu Glu Asn Lys Leu Lys Asn Leu
305 310 315 320
Arg Leu Leu Glu Arg Pro Ile Arg Ile Phe Leu Asn Asn Asn Thr Ile
325 330 335
Asn Tyr Ser Glu His Leu Val Asn Ile Ile Leu Lys Asn Ile Pro Asn
340 345 350
Tyr Asp Ile Val Lys Asp Asn Asn Asp Ala Asp Ile Ile Ile Asp Asn
355 360 365
Ile Asn Asp Gly Lys Leu Phe Tyr Asp Ile Thr Lys Leu Asn Ile Ile
370 375 380
Ile Ser Gly Glu Pro Phe Asn Arg Lys Gln Lys Tyr Asp Ile Ala Ile
385 390 395 400
Asp Thr Lys Lys Asn Ser Asn Ala Glu Tyr Thr Ile Tyr His Pro Phe
405 410 415
Leu Phe Ser Ser Leu His Glu His Lys Lys Ser Ile Asn Tyr Leu Asp
420 425 430
Tyr Val Ile Pro Lys Thr Lys Phe Cys Ala Tyr Met Tyr His Met Ser
435 440 445
Tyr Pro His Arg Ile Asn Tyr Phe Asn Ile Ile Ser Ser Tyr Lys His
450 455 460
Val Asp Ala Leu Gly Lys Cys Cys Asn Asn Val Glu Ile Lys Asn Thr
465 470 475 480
Arg Tyr Val Leu Asn Asn Lys Glu Thr Tyr Asn Asp Ile Ala Val Glu
485 490 495
Tyr Phe Thr Gln Tyr Lys Phe Val Leu Ala Ile Glu Asn Asn Met Ile
500 505 510
Pro Gly Tyr Asn Thr Glu Lys Leu Ile Asn Pro Met Ile Ala Asn Ser
515 520 525
Ile Pro Ile Tyr Trp Gly Asp Ser Glu Ile Phe Lys Tyr Ile Asn Lys
530 535 540
Arg Arg Leu Val Tyr Ile Pro Asp Phe Ala Thr Asn Glu Asp Leu Ile
545 550 555 560
Asn His Ile Lys Tyr Ile Asp Glu His Asp Asp Val Tyr Glu Asn Ile
565 570 575
Ile Lys Glu Ser Ile Phe Thr Asp Pro Asn Phe Thr Leu Asp Val Ile
580 585 590
Glu Gln His Leu Ser Lys Glu Ile Asp Asn Leu Phe Gly Leu Lys Asn
595 600 605

Claims (20)

1.一种能够产生一种或多种人乳寡糖(HMO)的遗传修饰细胞,其中所述细胞包括编码以下的异源、重组和/或合成核酸
a.α-1,2-岩藻糖基转移酶,和
b.α-1,3-岩藻糖基转移酶,和
c.选自主要易化因子超家族(MFS)的重组转运蛋白。
2.根据权利要求1所述的遗传修饰细胞,其中与没有所述MFS转运蛋白的相同细胞相比,具有所述MFS转运蛋白的所述遗传修饰细胞多产生至少5%w/w的DFL。
3.根据权利要求1或2所述的遗传修饰细胞,其中由所述遗传修饰细胞产生的最丰富的HMO是二岩藻糖基乳糖(DFL)。
4.根据前述权利要求中任一项所述的遗传修饰细胞,其中由所述细胞产生的多于60%w/w的HMO是二岩藻糖基乳糖(DFL)。
5.根据前述权利要求中任一项所述的遗传修饰细胞,其中所述编码α-1,2-岩藻糖基转移酶的异源、重组和/或合成核酸是futC基因或wbgL A基因,或其功能同源物。
6.根据前述权利要求中任一项所述的遗传修饰细胞,其中所述编码α-1,3-岩藻糖基转移酶的异源、重组和/或合成核酸是futA基因或fucT基因或moumou基因,或其功能同源物。
7.根据前述权利要求中任一项所述的遗传修饰细胞,其中所述细胞中产生的总量的至多35%w/w的HMO是3-岩藻糖基乳糖(3FL),或2’-岩藻糖基乳糖(2’FL)。
8.根据前述权利要求中任一项所述的遗传修饰细胞,其中所述MFS转运蛋白源自选自黏质沙雷菌Serratia marcescens、Rosenbergiella nectarea、成团泛菌Pantoea vagans、耶尔森氏菌Yersinia frederiksenii和Rouxiella badensis的细菌。
9.根据前述权利要求中任一项所述的遗传修饰细胞,其中所述转运蛋白选自SEQ IDNO:1(Marc)、SEQ ID NO:2(Nec)、SEQ ID NO:3(Vag)、SEQ ID NO:37(fred)和SEQ ID NO:38(bad)、或它们的功能同源物,所述功能同源物的氨基酸序列与SEQ ID NO:1(Marc)、SEQ IDNO:2(Nec)、SEQ ID NO:3(Vag)、SEQ ID NO:42(fred)或SEQ ID NO:43(bad)具有至少80%、例如至少85%或至少90%的同一性。
10.根据前述权利要求中任一项所述的遗传修饰细胞,其中所述遗传修饰细胞是微生物细胞,例如大肠杆菌。
11.根据前述权利要求中任一项所述的遗传修饰细胞,其中所述细胞还包括异源、重组和/或合成调控元件,其选自Plac启动子、PmglB启动子、和Pglp启动子例如PglpF、或其任何变体的启动子核酸序列。
12.根据权利要求11所述的遗传修饰细胞,其中用于调控α-1,2-岩藻糖基转移酶表达的调控元件包括启动子核酸序列,其为PglpF或其变体。
13.根据权利要求11或12所述的遗传修饰细胞,其中用于调控α-1,3-岩藻糖基转移酶表达的调控元件包括启动子核酸序列,其为PmglB或其变体。
14.一种用于产生一种或多种HMO的方法,其中所产生的HMO主要是二岩藻糖基乳糖(DFL),所述方法包括以下步骤:
(i)提供根据权利要求1至13中任一项所述的遗传修饰细胞
(ii)在合适的细胞培养基中培养根据(i)所述的细胞以产生所述HMO;和
(iii)收获步骤(ii)中产生的一种或多种HMO。
15.根据权利要求14所述的方法,其中与步骤(i)中的所述遗传修饰细胞不表达重组MFS转运蛋白的相同方法相比,所述细胞表达所述重组MFS转运蛋白的所述方法多产生至少5%w/w的DFL。
16.根据权利要求14或15所述的方法,其中所述细胞中产生的总量的至多45%、例如至多30%w/w的HMO是3-岩藻糖基乳糖(3FL)和/或2’-岩藻糖基乳糖(2’FL)。
17.根据权利要求14至16中任一项所述的方法,其中步骤(ii)中的所述细胞的培养在低乳糖条件下进行,例如具有小于5g乳糖/l培养基的条件。
18.根据权利要求1至17中任一项所述的遗传修饰细胞用于产生一种或多种HMO的用途,其中所产生的HMO主要是二岩藻糖基乳糖(DFL)。
19.一种1,3-岩藻糖基转移酶,其氨基酸序列与SEQ ID NO:38具有至少90%、例如至少95%、例如至少98%的同一性,并且包括以下取代S46F、A128N、H129E、Y132I、D148G和Y221C,或由其组成。
20.根据权利要求19所述的1,3-岩藻糖基转移酶,其中所述氨基酸序列包括SEQ IDNO:39,或由其组成。
CN202180086444.XA 2020-12-22 2021-12-21 一种产生dfl的菌株 Pending CN116802286A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
DKPA202001450 2020-12-22
DKPA202001450A DK180952B1 (en) 2020-12-22 2020-12-22 A dfl-producing strain
PCT/EP2021/086932 WO2022136337A2 (en) 2020-12-22 2021-12-21 A dfl-producing strain

Publications (1)

Publication Number Publication Date
CN116802286A true CN116802286A (zh) 2023-09-22

Family

ID=80034821

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202180086444.XA Pending CN116802286A (zh) 2020-12-22 2021-12-21 一种产生dfl的菌株

Country Status (6)

Country Link
US (1) US20240043891A1 (zh)
EP (1) EP4267729A2 (zh)
JP (1) JP2024500025A (zh)
CN (1) CN116802286A (zh)
DK (1) DK180952B1 (zh)
WO (1) WO2022136337A2 (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117089503B (zh) * 2023-10-17 2024-01-02 保龄宝生物股份有限公司 一种大肠杆菌k-12 mg1655 blbyzt6及其应用

Family Cites Families (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
RU2517602C2 (ru) 2009-06-08 2014-05-27 Йенневайн Биотехнологи Гмбх Синтез нмо
DE12746649T1 (de) * 2011-02-16 2016-09-29 Glycosyn LLC Biosynthese menschlicher milcholigosaccaride in manipulierten Bakterien
EP3154995B1 (en) 2014-06-11 2023-11-01 Glycom A/S Separation of 2'-o-fucosyllactose from fermentation broth
KR101718681B1 (ko) * 2014-06-23 2017-03-22 서울대학교산학협력단 가용성 단백질 발현량 및 활성이 증대된 헬리코박터 파일로리 유래 α-1,3 푸코실 전달효소의 유전자와 단백질 및 α-1,3 푸코실올리고당 생산에의 응용
AU2015315110B2 (en) * 2014-09-09 2021-04-08 Glycosyn LLC Alpha (1,3) fucosyltransferases for use in the production of fucosylated oligosaccharides
WO2016095924A1 (en) 2014-12-16 2016-06-23 Glycom A/S Separation of 2'-fl from a fermentation broth
EP3050973A1 (en) 2015-01-30 2016-08-03 Jennewein Biotechnologie GmbH Fermentation process for producing monosaccharides in free form from nucleotide-activated sugars
EP3141610A1 (en) 2015-09-12 2017-03-15 Jennewein Biotechnologie GmbH Production of human milk oligosaccharides in microbial hosts with engineered import / export
DE202017007249U1 (de) 2016-03-07 2020-04-23 Glycom A/S Abtrennung von Oligosacchariden aus der Fermentationsbrühe
WO2017182965A1 (en) 2016-04-19 2017-10-26 Glycom A/S Separation of oligosaccharides from fermentation broth
DK3315610T3 (da) * 2016-10-29 2021-03-08 Jennewein Biotechnologie Gmbh Fremgangsmåde til fremstilling af fucosylerede oligosaccharider
US11608504B2 (en) * 2017-12-21 2023-03-21 Glycom A/S Nucleic acid construct for in vitro and in vivo gene expression
US20190323052A1 (en) 2018-04-23 2019-10-24 Dupont Nutrition Biosciences Aps Increasing export of 2? fucosyllactose from microbial cells through the expression of a heterologous nucleic acid
US20190323053A1 (en) 2018-04-23 2019-10-24 Dupont Nutrition Biosciences Aps Increasing activity of 2? fucosyllactose transporters endogenous to microbial cells
JP2022517903A (ja) * 2018-12-04 2022-03-11 グリコム・アクティーゼルスカブ フコシル化オリゴ糖の合成
WO2020255054A1 (en) 2019-06-21 2020-12-24 Glycom A/S Nucleic acid construct comprising 5' utr stem-loop for in vitro and in vivo gene expression
EP4093878A1 (en) * 2020-01-23 2022-11-30 Glycom A/S New major facilitator superfamily (mfs) protein (bad) in hmo production
BR112022014414A2 (pt) * 2020-01-23 2022-09-13 Glycom As Produção de hmo
WO2021148614A1 (en) * 2020-01-23 2021-07-29 Glycom A/S Hmo production

Also Published As

Publication number Publication date
US20240043891A1 (en) 2024-02-08
DK202001450A9 (en) 2022-08-10
JP2024500025A (ja) 2024-01-04
DK202001450A1 (en) 2022-07-05
EP4267729A2 (en) 2023-11-01
WO2022136337A2 (en) 2022-06-30
WO2022136337A3 (en) 2022-10-06
DK180952B1 (en) 2022-08-10

Similar Documents

Publication Publication Date Title
US20230072639A1 (en) New major facilitator superfamily (mfs) protein (bad) in hmo production
JP2023511527A (ja) Hmoの産生
US20230109661A1 (en) Hmo production
JP2023511522A (ja) Hmoの産生
EP4341417A1 (en) Identification of an alpha -1,2-fucosyltransferase for the in vivo production of pure lnfp-i
CN116802286A (zh) 一种产生dfl的菌株
US20240102063A1 (en) New major facilitator superfamily (mfs) protein (fred) in production of sialylated hmos
JP2024516207A (ja) インベルターゼ/スクロースヒドロラーゼを発現する微生物株
EP4093876A1 (en) New major facilitator superfamily (mfs) protein (fred) in hmo production
CN116802302A (zh) 唾液酸化hmo生产中的新主要易化子超家族(mfs)蛋白(fred)
DK202200591A1 (en) New sialyltransferases for in vivo synthesis of lst-c
EA046005B1 (ru) НОВЫЙ БЕЛОК СУПЕРСЕМЕЙСТВА ОСНОВНЫХ ПЕРЕНОСЧИКОВ (MFS) (Fred) В ПРОИЗВОДСТВЕ ОГМ
EA046260B1 (ru) Получение огм
CN117355613A (zh) 产生以lnfp-i和2’-fl作为主要化合物的hmo共混物分布的方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination