CN117321210A - 产生以lnfp-i和lnt作为主要化合物的hmo共混物的方法 - Google Patents

产生以lnfp-i和lnt作为主要化合物的hmo共混物的方法 Download PDF

Info

Publication number
CN117321210A
CN117321210A CN202280035349.1A CN202280035349A CN117321210A CN 117321210 A CN117321210 A CN 117321210A CN 202280035349 A CN202280035349 A CN 202280035349A CN 117321210 A CN117321210 A CN 117321210A
Authority
CN
China
Prior art keywords
leu
seq
ala
gly
val
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202280035349.1A
Other languages
English (en)
Inventor
M·帕帕扎基斯
T·约翰松
P·贝克尔
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
DSM IP Assets BV
Original Assignee
DSM IP Assets BV
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by DSM IP Assets BV filed Critical DSM IP Assets BV
Publication of CN117321210A publication Critical patent/CN117321210A/zh
Pending legal-status Critical Current

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/70Vectors or expression systems specially adapted for E. coli
    • AHUMAN NECESSITIES
    • A23FOODS OR FOODSTUFFS; TREATMENT THEREOF, NOT COVERED BY OTHER CLASSES
    • A23LFOODS, FOODSTUFFS, OR NON-ALCOHOLIC BEVERAGES, NOT COVERED BY SUBCLASSES A21D OR A23B-A23J; THEIR PREPARATION OR TREATMENT, e.g. COOKING, MODIFICATION OF NUTRITIVE QUALITIES, PHYSICAL TREATMENT; PRESERVATION OF FOODS OR FOODSTUFFS, IN GENERAL
    • A23L33/00Modifying nutritive qualities of foods; Dietetic products; Preparation or treatment thereof
    • A23L33/10Modifying nutritive qualities of foods; Dietetic products; Preparation or treatment thereof using additives
    • A23L33/125Modifying nutritive qualities of foods; Dietetic products; Preparation or treatment thereof using additives containing carbohydrate syrups; containing sugars; containing sugar alcohols; containing starch hydrolysates
    • AHUMAN NECESSITIES
    • A23FOODS OR FOODSTUFFS; TREATMENT THEREOF, NOT COVERED BY OTHER CLASSES
    • A23LFOODS, FOODSTUFFS, OR NON-ALCOHOLIC BEVERAGES, NOT COVERED BY SUBCLASSES A21D OR A23B-A23J; THEIR PREPARATION OR TREATMENT, e.g. COOKING, MODIFICATION OF NUTRITIVE QUALITIES, PHYSICAL TREATMENT; PRESERVATION OF FOODS OR FOODSTUFFS, IN GENERAL
    • A23L33/00Modifying nutritive qualities of foods; Dietetic products; Preparation or treatment thereof
    • A23L33/40Complete food formulations for specific consumer groups or specific purposes, e.g. infant formula
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/195Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from bacteria
    • C07K14/24Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from bacteria from Enterobacteriaceae (F), e.g. Citrobacter, Serratia, Proteus, Providencia, Morganella, Yersinia
    • C07K14/245Escherichia (G)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/52Genes encoding for enzymes or proenzymes
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/67General methods for enhancing the expression
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/10Transferases (2.)
    • C12N9/1048Glycosyltransferases (2.4)
    • C12N9/1051Hexosyltransferases (2.4.1)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P19/00Preparation of compounds containing saccharide radicals
    • C12P19/18Preparation of compounds containing saccharide radicals produced by the action of a glycosyl transferase, e.g. alpha-, beta- or gamma-cyclodextrins
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y204/00Glycosyltransferases (2.4)
    • C12Y204/01Hexosyltransferases (2.4.1)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y204/00Glycosyltransferases (2.4)
    • C12Y204/01Hexosyltransferases (2.4.1)
    • C12Y204/01069Galactoside 2-alpha-L-fucosyltransferase (2.4.1.69)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y204/00Glycosyltransferases (2.4)
    • C12Y204/01Hexosyltransferases (2.4.1)
    • C12Y204/01086Glucosaminylgalactosylglucosylceramide beta-galactosyltransferase (2.4.1.86)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y204/00Glycosyltransferases (2.4)
    • C12Y204/01Hexosyltransferases (2.4.1)
    • C12Y204/01135Galactosylgalactosylxylosylprotein 3-beta-glucuronosyltransferase (2.4.1.135)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12RINDEXING SCHEME ASSOCIATED WITH SUBCLASSES C12C - C12Q, RELATING TO MICROORGANISMS
    • C12R2001/00Microorganisms ; Processes using microorganisms
    • C12R2001/01Bacteria or Actinomycetales ; using bacteria or Actinomycetales
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12RINDEXING SCHEME ASSOCIATED WITH SUBCLASSES C12C - C12Q, RELATING TO MICROORGANISMS
    • C12R2001/00Microorganisms ; Processes using microorganisms
    • C12R2001/01Bacteria or Actinomycetales ; using bacteria or Actinomycetales
    • C12R2001/185Escherichia
    • C12R2001/19Escherichia coli
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12RINDEXING SCHEME ASSOCIATED WITH SUBCLASSES C12C - C12Q, RELATING TO MICROORGANISMS
    • C12R2001/00Microorganisms ; Processes using microorganisms
    • C12R2001/01Bacteria or Actinomycetales ; using bacteria or Actinomycetales
    • C12R2001/36Neisseria

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Organic Chemistry (AREA)
  • Genetics & Genomics (AREA)
  • Engineering & Computer Science (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Biochemistry (AREA)
  • Biotechnology (AREA)
  • Biomedical Technology (AREA)
  • Molecular Biology (AREA)
  • Microbiology (AREA)
  • Biophysics (AREA)
  • Physics & Mathematics (AREA)
  • Plant Pathology (AREA)
  • Medicinal Chemistry (AREA)
  • Polymers & Plastics (AREA)
  • Food Science & Technology (AREA)
  • Nutrition Science (AREA)
  • Mycology (AREA)
  • Pediatric Medicine (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • General Chemical & Material Sciences (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Enzymes And Modification Thereof (AREA)

Abstract

本发明涉及一种产生具有独特的HMO共混分布的各种人乳寡糖(HMO)的混合物的方法,该混合物主要由LNFP‑I和LNT以及不太显著量的其他HMO组成。不太丰富的HMO可以是2’‑FL、LNT‑II或DFL。实现特定HMO共混物的策略包括菌株工程和发酵方法。

Description

产生以LNFP-I和LNT作为主要化合物的HMO共混物的方法
技术领域
本发明涉及一种产生具有独特的HMO共混特性的各种人乳寡糖(HMO)的混合物的方法,该混合物主要由LNFP-I和LNT以及不太显著量的其他HMO组成。不太丰富的HMO可以是2’-FL、LNT-II或DFL。几种遗传工程方法已应用于改变细胞产生的不同HMO的丰度,这些细胞过表达荚膜异多糖酸(colanic acid)基因簇并表达异源β-1,3-N-乙酰基-葡糖胺基转移酶、β-1,3-半乳糖基转移酶和α-1,2-岩藻糖基岩藻糖基转移酶。实现这一目标的菌株工程策略取决于在宿主中引入的α-1,2-岩藻糖基岩藻糖基转移酶,并包括编码乳糖通透酶LacY的天然基因lacY的过表达和编码DNA结合转录阻遏物GlpR的glpR调节因子的缺失,以及发酵液中乳糖水平的调节。
背景技术
人乳是碳水化合物、脂肪、蛋白质、维生素、矿物质和微量元素的复杂混合物。迄今为止最主要的部分是碳水化合物,它可以进一步分为乳糖和更复杂的寡糖(人乳寡糖,HMO)。虽然乳糖被用作能量来源,但复杂的寡糖不被婴儿代谢。复杂的寡糖的分数占总碳水化合物分数的至多1/10,并且可能由150多种不同的寡糖组成。这些复杂的寡糖的出现和浓度是人类特有的,因此在其他哺乳动物(例如驯养的乳畜)的乳汁中不能大量发现。
迄今为止,至少115种HMO的结构已确定,而且人乳中可能存在更多的HMO。由于发现了HMO在人类发育中的重要功能,因此在过去十年中HMO引起了人们的极大兴趣。除了其益生元特性外,HMO还具有其他积极作用,这扩大了其应用领域。HMO的健康益处使其被批准用于食品(例如婴儿配方奶粉和食品)以及消费者保健产品。
为了克服与HMO化学合成相关的缺点,已经开发了几种酶促方法和发酵方法。通常,基于发酵的工艺是针对单个HMO开发的,例如2’-岩藻糖基乳糖(2’-FL)、3-岩藻糖基乳糖(3-FL)、乳-N-四糖(LNT)、乳-N-新四糖(LNnT)、3’-唾液酸乳糖(3’-SL)和6’-唾液酸乳糖(6’-SL)。基于发酵的工艺通常利用遗传工程细菌菌株,例如重组大肠杆菌(E.coli)或酵母,例如酿酒酵母(S.cerevisiae)(参见例如Bych等人Current Opinion inBiotechnology 56:130-137和Lu等人2021ACS Synth.Biol.10:923-938)。
HMO的生物技术产生(例如发酵工艺)是一种有价值的、具有成本效益的大规模HMO制造方法。它依赖于构建的遗传工程细菌,以表达合成期望寡糖所需的糖基转移酶,并利用细菌固有的核苷酸糖库作为HMO前体。目前,关于如何制备含有乳-N-岩藻五糖I(LNFP-I)的共混物(blend)组成以及如何通过遗传工程或调整发酵参数来微调所获得的共混物中不同HMO的水平的知识还不存在,因为用于HMO制造的商业发酵工艺参数通常是保密的,因此尚未描述例如发酵参数对LNFP-I共混物组成或任何其他HMO共混物的影响。
WO 2019/0011133描述了可以岩藻糖基化LNT或LNnT以产生LNFP-I、LNFP-II、LNFP-III和LNFP-VI的岩藻糖基转移酶的鉴定。具体地,描述了使用FucT岩藻糖基转移酶产生LNFP-I。
WO 2019/123324描述了LNFP-I的形成,然而没有表明LNFP-I或2’FL在形成的HMO总量中所占的摩尔%。
发明内容
本公开的目标是生物合成产生共混物中具有目的HMO的特定比率的HMO共混物,而工业焦点通常是产生纯HMO,即,通常是最小化HMO副产物水平以及下游工艺中纯化目的HMO的随之而来的需求。
几种遗传工程方法已应用于改变细胞产生的不同HMO的丰度,这些细胞过表达荚膜异多糖酸基因簇并表达异源β-1,3-N-乙酰基-葡糖胺基转移酶、β-1,3-半乳糖基转移酶和α-1,2-岩藻糖基岩藻糖基转移酶。
然而,我们观察到大多数遗传操作都影响LNFP-I和2’-FL之间的比率,并在较小程度上影响最终HMO共混物中前体寡糖(例如LNT和LNT-II)的相对丰度。对于表达来自幽门螺杆菌(Helicobacter pylori)的α-1,2-岩藻糖基转移酶FutC(GenBank ID:WP_080473865.1,但在C末端有两个额外的氨基酸(LG))的细胞尤其如此,其中没有遗传变化可以导致其中LNFP-I是最丰富且LNT是第二丰富的HMO的最终共混物。相反,这些细胞中的任何遗传修饰细胞仅导致LNFP-I与2’-FL比率发生微小或明显的变化。
本发明强调了实现以LNFP-I和LNT作为主要HMO的独特且多样化的HMO共混物的两种主要方法,即菌株工程策略和发酵工艺策略。实现这一目标的菌株工程策略包括操纵HMO生产细胞的以下遗传性状:
1.在表达来自运动性硫曲霉菌(Sulfuriflexus mobilis)的α-1,2-岩藻糖基岩藻糖基转移酶Smob的细胞中过表达编码乳糖通透酶LacY的天然基因lacY
2.表达来自运动性硫曲霉菌的α-1,2-岩藻糖基岩藻糖基转移酶Smob的菌株中细胞调控环境的变化(编码GlpR调节因子的基因缺失)。
本公开使得技术人员能够从广泛多样的可能的共混物组成中产生以LNFP-I和LNT作为主要HMO的特定HMO共混物,并针对特定市场、客户定制它们并实现特定的生物学效果,同时对特定HMO和HMO混合物的生物学活性和功能的了解正在迅速显现。
优点是共混物由一种生产菌株制造并纯化为HMO的混合物,因此,不是由几种生产菌株产生的单独纯化的HMO混合而成。这提供了更可持续的制造工艺;有价值的HMO在纯化工艺中未被丢弃,因此在发酵过程中从碳源到HMO产物的转化以高得多的总产率完成。
本公开中的发酵工艺策略包括调节发酵液中的乳糖水平,以高度可预测的方式实现源自菌株工程的给定菌株的特定的HMO共混特性。
在其最广泛的方面,本公开涉及用于产生以LNFP-I和/或LNT作为主要HMO的人乳寡糖(HMO)共混物的方法,该方法包括以下步骤:
(a)提供能够产生HMO的遗传工程细胞,其中所述细胞表达
i)如SEQ ID NO:1[LgtA]所示的异源β-1,3-N-乙酰基-葡糖胺基-转移酶蛋白质或其氨基酸序列与SEQ ID NO:1[LgtA]具有至少80%同一性的功能同源物;和
ii)如SEQ ID NO:2[GalTK]所示的异源β-1,3-半乳糖基转移酶蛋白质或其氨基酸序列与SEQ ID NO:2[GalTK]具有至少80%同一性的功能同源物;和
iii)如SEQ ID NO:3[Smob]或8[FutC]所示的异源α-1,2-岩藻糖基转移酶蛋白质或其氨基酸序列与SEQ ID NO:3[Smob]或8[FutC]中任一个具有至少80%同一性的功能同源物,和
iv)如SEQ ID NO:4所示的乳糖通透酶蛋白质,或其氨基酸序列与SEQ ID NO:4具有至少80%同一性的功能同源物,和
并且还包含
v)功能性荚膜异多糖酸基因簇,和
vi)用于控制i)ii)iii)和v)的表达的天然或异源调控元件,其任选地以附加型元件的形式,和
vii)用于增加iv)的表达的天然或异源调控元件,其任选地以附加型元件的形式,和/或
viii)非功能性(或缺乏)基因产物,所述基因产物在正常情况下结合并抑制由vi)-vii)驱动的表达
(b)在合适的细胞培养基中培养根据(a)的细胞以表达所述核酸序列;和
(c)收获步骤(b)中产生的HMO共混物。
在本文中,术语“非功能性(或缺乏)基因产物,所述基因产物在正常情况下结合并抑制由vi)-vii)驱动的表达”涉及目的基因的编码序列上游的DNA结合位点,特别是在该基因的启动子区域。
vi-vii)中的调控元件,例如启动子,控制所提及的糖基转移酶(i-iii)和/或乳糖通透酶(iv)以及荚膜异多糖酸基因簇(v)的表达,并且该调控元件应当独立地位于构建体的i-v编码序列(启动子/调控元件+编码序列)之前。构建体可以整合到基因组中,或者可以以质粒或另一种附加型元件的形式引入细胞中。
在另一方面,本公开涉及遗传工程细胞,其包含:
a)一种或多种核酸序列,其编码如SEQ ID NO:1所示的异源β-1,3-N-乙酰基-葡糖胺基-转移酶蛋白质或其氨基酸序列与SEQ ID NO:1具有至少80%同一性的功能同源物;和
b)一种或多种核酸序列,其编码如SEQ ID NO:2所示的异源β-1,3-半乳糖基转移酶蛋白质或其氨基酸序列与SEQ ID NO:2具有至少80%同一性的功能同源物;和
c)一种或多种核酸序列,其编码如SEQ ID NO:3所示的异源α-1,2-岩藻糖基转移酶蛋白质或其氨基酸序列与SEQ ID NO:3具有至少80%同一性的功能同源物,和
d)一种或多种核酸序列,其编码一种或多种核酸序列,其编码如SEQ ID NO:4所示的乳糖通透酶蛋白质或其氨基酸序列与SEQ ID NO:4具有至少80%同一性的功能同源物,和
e)多于一种的核酸序列,其编码荚膜异多糖酸基因簇的蛋白质。
在另一方面,本公开涉及根据本公开的遗传工程细胞或核酸构建体用于生物合成产生一种或多种人乳寡糖(HMO)、特别是以LNFP-I和LNT作为主要HMO的人乳寡糖(HMO)共混物的用途。
具体实施方式
下文中在相关时参考附图和序列来描述各种示例性实施方式和细节。还应当注意的是,附图仅旨在便于描述实施方式。它们并不旨在作为本公开的详尽描述或作为对本公开的范围的限制。另外,所示实施方式不需要具有所示的所有方面或优点。结合特定实施方式描述的方面或优点不一定限于该实施方式,并且可以在任何其他实施方式中实践,即使没有如此示出或者如果没有如此明确地描述。
本发明使得技术人员能够产生特定的HMO共混物,其中LNFP-I和/或LNT作为主要的HMO。市场需要更广泛多样化的可能共混物组成,因此可以将他们定制为特定的生物学效果,因为对特定HMO和HMO混合物的生物学活性和功能的了解正在迅速显现。
此处的优点是,共混物是由单一菌株制造的,并作为HMO混合物进行纯化,因此,不是由单独纯化的HMO混合而成。这提供了更可持续的制造工艺;有价值的HMO在纯化工艺中未被丢弃,因此在发酵过程中从碳源到HMO产物的转化以更高的总产率完成。
在一个或多个示例性实施方式中,本文描述的方法涉及以LNFP-I和LNT作为主要HMO的人乳寡糖(HMO)共混物的生产。
LNFP-I和/或LNT酶
为了产生以LNFP-I和/或LNT作为主要HMO的人乳寡糖(HMO)共混物,遗传工程细胞包含所有必需的酶,以促进以LNFP-I和/或LNT作为主要的HMO的人乳寡糖(HMO)共混物的产生。这些酶可以是例如
i)如SEQ ID NO:1所示的异源β-1,3-N-乙酰基-葡糖胺基-转移酶蛋白质或其氨基酸序列与SEQ ID NO:1具有至少80%同一性的功能同源物;和
ii)如SEQ ID NO:2所示的异源β-1,3-半乳糖基转移酶蛋白质或其氨基酸序列与SEQ ID NO:2具有至少80%同一性的功能同源物;和
iii)如SEQ ID NO:3所示的异源α-1,2-岩藻糖基转移酶蛋白质或其氨基酸序列与SEQ ID NO:3中任一个具有至少80%同一性的功能同源物,和
iv)如SEQ ID NO:4所示的乳糖通透酶蛋白质,或其氨基酸序列与SEQ ID NO:4具有至少80%同一性的功能同源物。
上述酶可以替换为具有类似功能的其他酶。特别地,SEQ ID NO:3可以与SEQ IDNO:8交换。当使用SEQ ID NO:8时,培养期间的乳糖水平成为重要的发酵参数,如实施例3所示。
在本发明的一个优选实施方式中,当遗传工程细胞包含SEQ ID NO:8所示的异源α-1,2-岩藻糖基转移酶或其氨基酸序列与SEQ ID NO:8中任一个具有至少80%同一性的功能同源物时,步骤(b)中的遗传工程细胞培养期间发酵培养基中的乳糖水平低于15g/L。
在一个或多个示例性实施方式中,i)-iv)中蛋白质的任一种的过表达通过增加编码所述蛋白质的基因的拷贝数来提供。
异源β-1,3-N-乙酰基-葡糖胺基-转移酶
异源β-1,3-N-乙酰基-葡糖胺基-转移酶是包含将UDP-N-乙酰基-葡糖胺的N-乙酰基-葡糖胺转移至乳糖的能力的任何蛋白质。本文使用的β-1,3-N-乙酰基-葡糖胺基-转移酶并非起源于遗传工程细胞的物种,即,编码β-1,3-半乳糖基转移酶的基因为异源来源。以下实例使用名为LgtA的异源β-1,3-N-乙酰基-葡糖胺基转移酶。
lgtA基因
lgtA基因是编码β-1,3-N-乙酰基-葡糖胺基-转移酶的基因,并且在多种细菌物种中发现该基因的同源物,其中该基因参与细菌脂寡糖的乳-N-新-四糖结构元件的合成。
在一个或多个示例性实施方式中,lgtA基因是如SEQ ID NO:5中所示的核酸序列或其核酸序列与SEQ ID NO:5具有至少70%同一性、例如至少80%、例如至少85%、例如至少90%、例如至少95%或例如至少99%同一性的功能同源物。
在一个或多个示例性实施方式中,LgtA是具有SEQ ID NO:1的氨基酸序列的蛋白质,或其氨基酸序列与SEQ ID NO:1具有至少80%、例如至少85%、例如至少90%、例如至少95%或例如至少99%同一性的功能同源物。
β-1,3-N-乙酰基-葡糖胺基-转移酶LgtA的表达可以例如通过改变编码β-1,3-N-乙酰基-葡糖胺基-转移酶LgtA的基因的拷贝数来调节,这反过来可能导致产生的HMO共混物中LNT/LNFP-I比率发生变化。这在实施例4中得到例证,其中LgtA基因的额外拷贝(总共3个拷贝,在强启动子下)导致LNT水平增强和LNFP-I水平降低(产生的HMO共混物中LNT/LNFP-I比率更高)。
在一个或多个示例性实施方式中,至少两个拷贝、例如至少3个拷贝的编码氨基酸序列为SEQ ID NO:1的LgtA蛋白质或其氨基酸序列与SEQ ID NO:1具有至少80%、例如至少85%、例如至少90%、例如至少95%或例如至少99%同一性的功能同源物的核酸存在于遗传工程细胞中。
异源β-1,3-半乳糖基转移酶
异源β-1,3-半乳糖基转移酶是包括将UDP-Gal的Gal转移至N-乙酰基-葡糖胺基部分的能力的任何蛋白质。本文使用的β-1,3-半乳糖基转移酶并非源自遗传工程细胞的物种,即编码β-1,3-半乳糖基转移酶的基因是异源来源。以下实例使用名为GalTK的异源β-1,3-半乳糖基转移酶。
在一个或多个示例性实施方式中,GalTK是氨基酸序列为SEQ ID NO:2的蛋白质,或其氨基酸序列与SEQ ID NO:2具有至少80%、例如至少85%、例如至少90%、例如至少95%或例如至少99%同一性的功能同源物。
galTK基因
在一个或多个示例性实施方式中,galTK基因是如SEQ ID NO:6所示的核酸序列或其核酸序列与SEQ ID NO:6具有至少70%同一性、例如至少80%、例如至少85%、例如至少90%、例如至少95%或例如至少99%同一性的功能同源物。
异源α-1,2-岩藻糖基转移酶
α-1,2-岩藻糖基转移酶负责通过α-1,2键将岩藻糖添加到O-抗原重复单元的半乳糖残基上。
在一个或多个示例性实施方式中,异源α-1,2-岩藻糖基转移酶是来自运动性硫曲霉菌的Smobα-1,2-岩藻糖基转移酶(GenBank ID:WP_126455392.1)或其氨基酸序列具有至少80%同一性的功能同源物。
在一个或多个示例性实施方式中,异源α-1,2-岩藻糖基转移酶是来自运动性硫曲霉菌的氨基酸序列为SEQ ID NO:3的Smobα-1,2-岩藻糖基转移酶,或其氨基酸序列与SEQID NO:3具有至少80%、例如至少85%、例如至少90%、例如至少95%或例如至少99%同一性的功能同源物。
在另一个示例性实施方式中,异源α-1,2-岩藻糖基转移酶是来自幽门螺杆菌的具有根据SEQ ID NO:8的氨基酸序列(GenBank ID:WP_080473865.1)的FutCα-1,2-岩藻糖基转移酶,或其氨基酸序列与SEQ ID NO:8具有至少80%同一性的功能同源物。
在一个或多个示例性实施方式中,异源α-1,2-岩藻糖基转移酶是来自幽门螺杆菌的氨基酸序列为SEQ ID NO:3的FutCα-1,2-岩藻糖基转移酶,或其氨基酸序列与SEQ IDNO:3具有至少80%、例如至少85%、例如至少90%、例如至少95%或例如至少99%同一性的功能同源物。
α-1,2-岩藻糖基转移酶Smob基因
本文公开的表达来自运动性硫曲霉菌的α-1,2-岩藻糖基转移酶Smob(GenBankID:WP_126455392.1)的遗传工程细胞产生共混物,其中LNFP-I是主要的HMO,LNT是第二丰富的HMO。具体地,如实施例中所示,通过本公开,本领域技术人员能够查明导致最终HMO混合物中同时LNT增加和2’-FL浓度降低的两种特定遗传操作,同时LNFP-I浓度受到正面或负面影响,但程度有限。
在一个或多个示例性实施方式中,smob基因是如SEQ ID NO:7所示的核酸序列或其核酸序列与SEQ ID NO:7具有至少70%同一性、例如至少80%、例如至少85%、例如至少90%、例如至少95%或例如至少99%同一性的功能同源物。
α-1,2-岩藻糖基转移酶futC基因
在一个或多个示例性实施方式中,futC基因是如SEQ ID NO:9所示的核酸序列或其核酸序列与SEQ ID NO:9具有至少70%同一性、例如至少80%、例如至少85%、例如至少90%、例如至少95%或例如至少99%同一性的功能同源物。
乳糖通透酶
乳糖通透酶是一种膜蛋白质,是主要促进子超家族的成员,可归类为同向转运蛋白,它利用朝向细胞的质子梯度将β-半乳糖苷(例如乳糖)以相同方向转运到细胞中。在HMO产生中,乳糖是被修饰以产生任何目的HMO的分子,并且生物转化发生在细胞内部。因此,存在能够将乳糖导入细胞中的需要,这主要可以通过乳糖通透酶的某种活性来完成,例如在启动子控制下的天然lacY拷贝。
在一个或多个示例性实施方式中,乳糖通透酶蛋白质为如SEQ ID NO:4所示,或其氨基酸序列与SEQ ID NO:4具有至少80%同一性、例如至少85%、例如至少90%、例如至少95%或例如至少99%同一性的功能同源物。
在一个或多个示例性实施方式中,乳糖通透酶基因是如SEQ ID NO:10所示的核酸序列或其核酸序列与SEQ ID NO:10具有至少70%同一性、例如至少80%、例如至少85%、例如至少90%、例如至少95%或例如至少99%同一性的功能同源物。
乳糖通透酶过表达
如实施例1所示,将编码乳糖通透酶的lacY基因的过表达用作遗传工具以获得HMO混合物的特定目标组成,该HMO混合物包含至多四种HMO,包括LNFP-I、LNT、2’-FL和LNT-II(按丰度排序)。
本文公开的遗传工程细胞可以包含用于增加天然乳糖通透酶蛋白质的表达的调控元件,例如但不限于核糖体结合位点(RBS)。例如,RBS可以是Shine-Dalgarno(SD)序列。Shine-Dalgarno序列的突变可以减少或增加原核生物的翻译。这种变化是由于mRNA-核糖体配对效率降低或增加所致,如通过3’端16S rRNA序列中的补偿突变可以恢复翻译这一事实所证明。
用于增加天然乳糖通透酶蛋白质表达的调控元件也可以是启动子。
本文公开的遗传工程细胞还可包含用于增加天然乳糖通透酶蛋白质的表达的异源附加型元件。例如,这可以是质粒携带的LacY基因。
乳糖通透酶表达的增加可以通过将lacY基因的拷贝直接整合到基因组中来实现。
乳糖通透酶表达的增加可以通过缺失乳糖操纵子的阻遏物来实现。例如lacI基因-UniProtKB-P03023(LACI_ECOLI)。
本文公开的遗传工程细胞可包含非功能性或缺乏基因产物,该基因产物在正常情况下结合并抑制所需酶的表达以促进以LNFP-I和LNT作为主要HMO的人乳寡糖(HMO)共混物的产生。
如实施例所示,将编码乳糖通透酶的lacY基因的额外拷贝引入到表达smob的细胞中,导致LNT浓度显著增加,同时2’-FL浓度降低。通过这种方式,表达smob的细胞中lacY基因的过表达极大地改变了最终HMO共混物的分布,LNT(而不是2’-FL)成为混合物中第二丰富的HMO。无论lacY表达水平如何,LNFP-I仍然是表达smob的细胞产生的共混物中的主要HMO。
荚膜异多糖酸基因簇
大肠杆菌K-12的荚膜异多糖酸基因簇负责产生细胞外多糖荚膜异多糖酸,这是细菌细胞壁的主要寡糖。
在一个或多个示例性实施方式中,本文公开的方法中的遗传修饰细胞可以从其天然基因组基因座表达荚膜异多糖酸基因簇。表达可以被主动调节。可以通过用感兴趣的启动子交换天然启动子、和/或通过从另一个基因组基因座表达基因簇(例如SEQ ID NO:45或其同源序列)来增加编码所述蛋白质的荚膜异多糖酸基因的拷贝数、或附加型表达荚膜异多糖酸基因簇来调节表达。
因此,在一个实施方式中,荚膜异多糖酸基因簇可以是本文使用的产生HMO的遗传修饰细胞的天然遗传元件。
还可以将荚膜异多糖酸基因簇以及编码β-1,3-N-乙酰基-葡糖胺基-转移酶、β-1,3-半乳糖基转移酶和α-1,2-岩藻糖基转移酶的异源基因,以PglpF-驱动的表达盒的形式,引入本文使用的遗传修饰细胞中。
glpR基因(编码DNA结合转录阻遏物GlpR)的缺失可以消除细胞中GlpR对所有PglpF启动子施加的转录抑制,并以这种方式增强所有基于PglpF的盒的基因表达。因此,最终共混物的HMO含量可能受到多种方式的影响。在本公开的框架中,观察到从表达futC的细胞(SEQ ID NO:8)的遗传背景中缺失glpR基因可以增加LNFP-I与2’-FL的比率,并且对于本公开更重要地,还有最终HMO共混物中LNT与2’-FL的比率。
在一个或多个示例性实施方式中,本发明(v)的遗传修饰细胞中的荚膜异多糖酸基因簇可以功能性表达。
功能性表达
在本上下文中,与荚膜异多糖酸基因簇有关的术语“功能性表达”应理解如下:荚膜异多糖酸(CA)基因簇的表达应提供功能性GDP-岩藻糖生物合成通路所需的酶。
可以通过用感兴趣的启动子交换天然启动子来调节表达。还可以通过增加编码所述蛋白质的荚膜异多糖酸基因的拷贝数来调节表达。附加型表达荚膜异多糖酸基因簇也影响表达。
因此,在一个或多个示例性实施方式中,v)中荚膜异多糖酸基因簇的表达通过用感兴趣的启动子交换天然启动子、和/或增加编码所述蛋白质的荚膜异多糖酸基因的拷贝数、或附加型表达荚膜异多糖酸基因簇来调节。
在一个或多个示例性实施方式中,对荚膜异多糖酸基因簇的表达的控制通过用感兴趣的启动子交换天然启动子、和/或通过表达来自染色体上不同基因座的簇来增加编码所述蛋白质的荚膜异多糖酸基因的拷贝数、或附加型表达荚膜异多糖酸基因簇来调节。CA基因簇中的各个基因描述如下。
Gmd
gmd基因编码蛋白质GDP-甘露糖-4,6-脱水酶(UniProt登录号P0AC88),其催化GDP-D-甘露糖转化为GDP-4-脱氢-6-脱氧-D-甘露糖。该蛋白质参与从GDP-α-D-甘露糖合成GDP-L-岩藻糖的反应。
在一个或多个示例性实施方式中,gmd基因过表达。
wcaG
wcaG基因,也称为fcl,编码蛋白质GDP-L-岩藻糖合酶(EC 1.1.1.271,UniProt登录号P32055),催化GDP-4-脱氢-6-脱氧-D-甘露糖转化为GDP-岩藻糖的两步NADP-依赖性转化,涉及差向异构酶和还原酶反应。
在一个或多个示例性实施方式中,wcaG基因过表达。
wcaH
wcaH基因编码蛋白质GDP-甘露糖甘露糖基水解酶(EC 3.6.1.-,UniProt登录号P32056),其水解GDP-甘露糖和GDP-葡萄糖。
在一个或多个示例性实施方式中,wcaH基因过表达。
wcaI
wcaI基因编码荚膜异多糖酸生物合成糖基转移酶WcaI(UniProt登录号P32057),它催化未修饰的岩藻糖向UPP-Glc(α-D-吡喃葡萄糖基-二磷十一碳烯醇-葡萄糖)的转移。
在一个或多个示例性实施方式中,wcaI基因过表达。
manB
manB基因编码蛋白质磷酸甘露糖变位酶(EC 5.4.2.8,UniProt登录号P24175),其通过催化α-D-甘露糖-1-磷酸转化为D-甘露糖-6-磷酸参与GDP-甘露糖的生物合成。因此,manB的表达水平调节GDP-甘露糖的形成。
在一个或多个示例性实施方式中,manB基因过表达。
manC
manC基因编码蛋白质甘露糖-1-磷酸鸟苷基转移酶(EC:2.7.7.13,UniProt登录号P24174),其通过从GTP和α-D-甘露糖-1-磷酸合成GDP-甘露糖来参与GDP-甘露糖的生物合成。
在一个或多个示例性实施方式中,manC基因过表达。
天然基因组基因座
关于本公开,与荚膜异多糖酸基因簇相关的术语“天然基因组基因座”涉及遗传工程细胞的天然基因组中的基因簇的原始和天然位置。
控制表达
在本文中,术语“控制表达”涉及其中基因转录成mRNA及其随后翻译成蛋白质的基因表达受到控制。基因表达主要在转录水平上受到控制,很大程度上是由于蛋白质与DNA上特定位点(例如但不限于调控元件)结合的结果。
如上所述,工程策略可以通过以下多种方式应用:
1)拷贝数
2)在转录或翻译水平控制这些基因的任何拷贝的表达
3)使HMO生产过程中抑制关键基因表达的调节因子缺失
4)过表达激活和/或增强HMO生产过程中关键基因表达的调节因子
期望增加基因拷贝数和/或编码直接参与LNFP-I和2’-FL生物合成通路的酶的基因的表达,包括活化糖GDP-岩藻糖、UDP-N-乙酰基-葡糖氨基和UDP-Gal(供体糖)的合成以及乳糖、LNT-II和LNT(受体糖)的修饰以分别形成LNT-II或2’-FL、LNT和LNFP-I。
过表达
多种分子机制确保基因在与应用生产过程相关的条件下以适当的水平表达。例如,转录的调节可归纳为以下影响途径:遗传(控制因子与目的基因的直接相互作用)、控制因子与转录机制的调节和/或相互作用以及表观遗传(影响转录的DNA结构的非序列变化)。
众所周知,任何基因的基因表达减少到低于临界阈值都会导致突变表型,因为这种缺陷本质上模拟了靶基因功能的部分或完全丧失,而天然基因的表达增加可以对细胞或生物体既有益又有害。
基因的过表达可以通过与关键基因调节序列结合以促进转录的转录激活剂或构成积极影响转录的序列元件(也称为如下所述的调控元件)的增强子直接实现。类似地,基因的直接过表达可以通过以下方式来实现:简单地增加其在基因组中的拷贝数,或用更高强度的启动子替换其天然启动子,或甚至修饰控制相应mRNA与核糖体结合的序列,即存在于该基因编码序列上游的Shine-Dalgarno序列。
此外,基因的过表达也可以通过转录阻遏物的部分或完全失活来间接实现,转录阻遏物在正常情况下结合目的基因的编码序列周围的关键调节序列,从而抑制其转录。
在实施方式中,内源或异源蛋白质和/或基因过表达和/或具有增加的表达,这通过增加编码所述蛋白质的基因的拷贝数来获得。
因此,在实施方式中,荚膜异多糖酸基因簇的表达通过将天然启动子与感兴趣的启动子交换,和/或通过增加编码所述蛋白质的荚膜异多糖酸基因的拷贝数、或附加型表达荚膜异多糖酸基因簇或从染色体上的不同基因座表达它来调节。
因此,在一个或多个示例性实施方式中,i)、ii)和iii)中的蛋白质的过表达通过以下来提供:增加编码所述蛋白质的基因的拷贝数、和/或通过选择iv)和/或v)的适当元件或添加额外的基因组拷贝、和/或赋予非功能性(或缺乏)基因产物,该基因产物在正常情况下结合并抑制i)-v)中任一个的表达。
增加拷贝数
拷贝数变异是一种结构变异:具体地,它是一种相当数量的碱基对的重复或倍增,如果代表蛋白质编码基因,将导致编码相同蛋白质的基因数量增加。这种变异可以在许多物种中自然发生,但也可以通过对宿主细胞进行遗传修饰而引入。
在一个或多个示例性实施方式中,通过增加所需基因的拷贝数来控制表达。可以通过在细胞中引入具有高拷贝数的质粒或通过将基因的额外拷贝引入宿主细胞的基因组来增加拷贝数。例如,实施例4表明,与仅包含两个LgtA基因拷贝的菌株相比,在HMO共混物生产菌株中将β-1,3-N-乙酰基-葡糖胺基-转移酶LgtA的拷贝数从两个拷贝增加到三个拷贝,增加了所产生的HMO共混物中LNT的量。
因此,在一个或多个示例性实施方式中,本公开涉及一种方法,其中β-1,3-N-乙酰基-葡糖胺基转移酶(i))和β-1,3-半乳糖基转移酶(ii))(举例说明,例如通过lgtA和galTK)与SEQ ID NO:3[Smob]或SEQ ID NO:[FutC]或其同源物的α-1,2-岩藻糖基转移酶(iii))组合的过表达,通过增加拷贝编码所述蛋白质的基因的拷贝数和/或通过选择乳糖通透酶的适当调控元件(iv))来提供。
调控元件
根据本文所述方法的遗传工程细胞可以包含能够控制内源或异源和/或合成(重组)核酸序列的过表达的调控元件。
在一个或多个示例性实施方式中,上述方法中用于控制和增加i)-v)的表达的异源调控元件是启动子。
术语“调控元件”包括启动子序列、信号序列、和/或转录因子结合位点阵列,其影响与调控元件可操作地连接的核酸序列的转录和/或翻译。
调控元件在转录和转录后水平建立,并进一步在这些水平上启用分子网络。例如,在转录后水平,控制mRNA稳定性、翻译和亚细胞定位的生化信号由调控元件处理。RNA结合蛋白是另一类转录后调控元件,并进一步分类为序列元件或结构元件。可作为调控元件的特定序列基序也与mRNA修饰相关。多种DNA调控元件参与基因表达的调控,并依赖于涉及DNA、构成染色质的细胞蛋白、基因激活剂和阻遏物以及转录因子的生化相互作用。
一般地,转录和翻译调控序列包括但不限于启动子序列、核糖体结合位点、转录起始和终止序列、翻译起始和终止序列、基因调节子和增强子序列的结合位点。
启动子和增强子是基因表达的主要基因组调控元件。启动子是基因转录起始位点(TSS)1-2千碱基(kb)范围内的DNA区域;它们含有组装RNA聚合酶转录机制所必需的短调控元件(DNA基序)。在细菌和古细菌物种中,启动子下游通常有Shine-Dalgarno序列,通常距起始密码子约8个碱基。此外,位于TSS更远端的DNA调控元件可以显著促进转录。这些区域通常被称为增强子,是位置无关的DNA调控元件,它们与位点特异性转录因子相互作用,以建立细胞类型识别并调节基因表达。增强子可以通过称为成环(looping)的过程独立于其序列背景并在距其靶基因数个至数百kb的距离处发挥作用。由于这些特征,仅根据DNA序列很难识别合适的增强子并将其与其靶基因连接起来。
启动子与其他转录和翻译调控核酸序列(也称为“控制序列”)一起是表达给定基因或一组基因(操纵子)所必需的。
鉴定促进特定目的基因表达的合适启动子序列是一项繁琐的任务,在许多情况下需要费力的工作。就本公开而言,调控元件可以是或可以不是翻译后调节因子,或者它可以是或可以不是翻译调节因子。
通过选择适当的调控元件(例如启动子、增强子和/或Shine-Dalgarno序列),有可能影响异源基因的表达。调控元件(例如启动子或Shine-Dalgarno序列)的强度可以使用lacZ酶测定进行评估,其中如前所述测定β-半乳糖苷酶活性(参见例如MillerJ.H.Experiments in molecular genetics,Cold spring Harbor Laboratory Press,NY,1972)。简而言之,将细胞在Z缓冲液中稀释并用十二烷基硫酸钠(0.1%)和氯仿进行透化。测定在30℃进行。预热样品,通过添加200μl邻硝基苯基-β-半乳糖苷酶(4mg/ml)启动测定,并在样品变成微黄色时通过添加500μl的1M Na2CO3停止测定。随后将邻硝基苯酚的释放确定为420nm处光密度的变化。具体活性以米勒单位(MU)[A420/(min*ml*A600)]报告。活性高于10000MU的调控元件被认为是强调控元件,而活性低于3000MU的调控元件被认为是弱调控元件,介于两者之间的调控元件具有中等强度。强调控元件的一个实例是具有大约14000MU活性的PglpF启动子,而弱启动子的一个实例是Plac,当用IPTG诱导时,其具有大约2300MU的活性。
因此,在本发明的一个实施方式中,调控元件包括一种或多种能够增强表达(即根据本发明的一种或多种异源核酸序列的过表达)的元件。本文公开的遗传工程细胞可以包含用于控制异源β-1,3-N-乙酰基-葡糖胺基-转移酶、β-1,3-半乳糖基转移酶和/或α-1,2-岩藻糖基转移酶蛋白质的表达的异源调控元件。
特别是,编码蛋白质表达水平的调节可以影响共混物中不同HMO的形成。在一个实施方式中,大于10000MU、例如大于12000MU、例如大于15000MU的调控元件控制1,3-N-乙酰基-葡糖胺基转移酶和/或β-1,3-半乳糖基转移酶和/或α-1,2-岩藻糖基转移酶和/或乳糖通透酶和/或荚膜异多糖酸基因簇的表达。使用强启动子控制LacY的表达导致共混物中LNT的摩尔%增加,而抑制PglpF启动子的GlpR基因的缺失也提高共混物中LNT的摩尔%(见图1和2)。
在本发明的另一个实施方式中,调控元件包含允许适当控制根据本发明的一个或多个异源核酸序列的表达的一个或多个元件。在一个实施方式中,小于10000MU、例如小于8000MU、例如小于6000MU、例如小于4000MU、例如小于2000MU的调控元件控制1,3-N-乙酰基-葡糖胺基转移酶和/或β-1,3-半乳糖基转移酶和/或α-1,2-岩藻糖基转移酶和/或乳糖通透酶和/或荚膜异多糖酸基因簇的表达。
在这方面,调控编码一种或多种糖基转移酶和/或蔗糖水解酶、和/或PTS依赖性蔗糖利用系统和/或根据本发明的一种或多种天然或异源MFS转运蛋白的核酸序列和/或基因的表达的调控元件,可以是启动子序列。
在进行本文所公开的方法时,可以使用不同或相同的启动子序列来驱动整合在宿主细胞基因组中或附加型DNA上的不同目的基因的转录。
天然
关于本公开,术语“天然”是指源自根据本发明的方法的遗传工程细胞的基因组的核酸序列。在这方面,如果核酸序列源自大肠杆菌K-12菌株,对于遗传工程细胞来说不是异源来源且不是重组核酸序列,则可以认为它是天然的。
异源表达
在本公开中,术语“异源”是指编码蛋白质的核酸已被引入正常情况下不产生(即表达)该蛋白质的细胞中,使得该细胞能够表达该蛋白质而被称为遗传修饰细胞。因此,异源是指所表达的蛋白质最初是从与受体/宿主细胞不同的细胞类型或物种克隆或衍生的。编码所需蛋白质的核酸必须采用能够促进受体细胞将cDNA表达为蛋白质的格式(即,将其放入表达载体中)。将外源遗传材料转移到受体细胞中的方法包括转染和转导以及crisper/cas。受体细胞类型的选择通常基于详细检查蛋白质功能的实验需要,通常选择最常见的受体(称为异源表达系统),因为它们容易将DNA转移到其中,或者因为它们允许更简单地评估蛋白质的功能。
异源调控元件
调控元件可以是内源的或异源的,和/或重组的和/或合成的核酸序列。在本文中,术语“异源调控元件”应理解为不是内源性地发现于该基因组基因座中或与本文所述的原始遗传工程细胞异源的调控元件。因此,根据本发明,取代天然Plac启动子,控制异源基因或内源基因(例如lacY)表达的内源PglpF启动子被认为是异源调控元件/启动子。异源调控元件还可以是重组调控元件,其中两个或更多个非可操作地连接的天然调控元件重组为异源和/或合成调控元件,重组调控元件的实例是PmglB_70UTR,其将大肠杆菌PmglB启动子与大肠杆菌PglpF启动子的70_UTR序列组合。可以使用本领域技术人员已知的方法将异源调控元件引入遗传工程细胞中。
启动子序列
调控元件或调控基因和/或核酸序列的表达的元件可以包括一个或多个启动子序列,其中启动子序列可操作地连接至目的基因的核酸序列,从这个意义上,调控目的基因的核酸序列的表达。
在一个或多个示例性实施方式中,调控元件是启动子序列。
在实施方式中,用于控制和增加内源或异源蛋白质和/或基因的表达的调控元件是启动子序列。
一般地,启动子可以包含天然的、异源的和/或合成的核酸序列,并且可以是重组核酸序列,重组两个或更多个核酸序列或者如上所述的相同或不同来源,从而产生同源、异源或合成的核酸启动子序列,和/或同源、异源或合成的核酸调控元件。
在一个或多个示例性实施方式中,遗传工程细胞的基因和/或异源核酸序列的调控元件包括多于一个天然或异源启动子序列。
在一个或多个示例性实施方式中,遗传工程细胞的调控元件包括单一启动子序列。
在一个或多个示例性实施方式中,遗传工程细胞的基因和/或异源核酸序列的调控元件包括两个或更多个具有相同启动子序列的调控元件。
在一个或多个示例性实施方式中,遗传工程细胞的基因和/或异源核酸序列的调控元件包括两个或更多个具有不相同的启动子序列的调控元件。
调节架构,即转录因子结合位点的逐个基因分布以及结合这些位点的转录因子的识别,可以在多种不同的生长条件下使用,并且大肠杆菌基因组中有超过100个基因,作为调控元件。因此,能够转录和/或调控编码本文所述的一种或多种蛋白质的一种或多种异源或天然核酸序列的转录水平的任何启动子序列可能是合适的。
在一个或多个示例性实施方式中,调控元件选自PBAD、Pxyl、PsacB、PxylA、PrpR、PnitA、PT7、Ptac、PL、PR、PnisA、Pb、Pscr、Pscr_SD1、Pscr_SD7、PgatY_70UTR、PglpF、PglpF_SD1、PglpF_SD10、PglpF_SD2、PglpF_SD3、PglpF_SD4、PglpF_SD5、PglpF_SD6、PglpF_SD7、PglpF_SD8、PglpF_SD9、PglpF_B28、PglpF_B29、Plac_16UTR、Plac、PmglB_70UTR和PmglB_70UTR_SD4。WO2019/123324(并入本文以供参考)中描述了许多这些调控元件。
在一个或多个示例性实施方式中,调控元件选自Pscr、PgatY_70UTR、PglpF、PglpF_SD1、PglpF_SD2、PglpF_SD3、PglpF_SD4、PglpF_SD5、PglpF_SD6、PglpF_SD7、PglpF_SD8、PglpF_SD9、PglpF_SD10、PglpF_B28、PglpF_B29、Plac和Plac_16UTR。
WO2019123324和WO2020255054(并入本文以供参考)详细描述了衍生自PglpF、PlgpA、PlgpT、PgatY、PmglB和Plac启动子系统的多种启动子序列。
在一个或多个示例性实施方式中,调控元件是选自以下的启动子:SEQ ID NO:13(PglpF)、SEQ ID NO:12(PgatY_70UTR)、SEQ ID NO:27(Plac)、SEQ ID NO:28(Pmg1B_70UTR)、SEQ ID NO:11(Pscr)、或其变体。具体地,需要如WO2019123324中所述的PglpF或Plac的变体或如WO2020255054中所述的PmglB_70UTR的变体。
在一个或多个示例性实施方式中,异源β-1,3-N-乙酰基-葡糖胺基转移酶和/或异源β-1,3-半乳糖基转移酶的表达获自单拷贝和/或用于异源β-1,3-N-乙酰基-葡糖胺基转移酶和/或异源β-1,3-半乳糖基转移酶表达的调控元件具有低或中等强度。中或低强度的调控元件可以选自:PglpF_SD9(SEQ ID NO:23)、PglpF_SD7(SEQ ID NO:21)、PglpF_SD6(SEQ ID NO:20)、PglpF_B28(SEQ ID NO:24)、PglpF_B29(SEQ ID NO:25)、Pscr(SEQ IDNO:11)和Plac(SEQ ID NO:27)。
在一个或多个示例性实施方式中,异源β-1,3-N-乙酰基-葡糖胺基转移酶和/或异源β-1,3-半乳糖基转移酶的表达获自两个或更多个拷贝和/或用于表达异源β-1,3-N-乙酰基-葡糖胺基转移酶和/或异源β-1,3-半乳糖基转移酶的调控元件具有高强度。高强度的调控元件可以选自:PglpF(SEQ ID NO:13)、PglpF_SD10(SEQ ID NO:15)、PglpF_SD8(SEQ IDNO:22)、PglpF_SD5(SEQ ID NO:19)、PglpF_SD4(SEQ ID NO:18)、PgatY_70UTR(SEQ ID NO:12)、PmglB_70UTR(SEQ ID NO:9)和PmglB_70UTR_SD4(SEQ ID NO:9)。
在优选的实施方式中,启动子序列选自PglpF、Plac、PglpF_B29、PglpF_B28和PmglB_70UTR。
在一个或多个示例性实施方式中,调控元件选自PglpF、PglpF_B29和PglpF_B28。
在一个或多个示例性实施方式中,调控元件选自PglpF、Pscr、Plac和PglpF_B28。
在进一步优选的实施方式中,启动子序列选自PglpF和PglpF_B28。在一个实施方式中,启动子序列是PglpF。在另一个实施方式中,启动子序列是PglpF_B28。
在优选的示例性实施方式中,包括在用于调控遗传工程细胞的基因和/或异源核酸序列的表达的调控元件中的启动子序列,包括glpFKX操纵子启动子序列PglpF。
在一个或多个示例性实施方式中,调控元件选自:PglpF(SEQ ID NO:13)或其选自以下的变体:PglpF_SD10(SEQ ID NO:15)、PglpF_SD9(SEQ ID NO:23)、PglpF_SD8(SEQ IDNO:22)、PglpF_SD7(SEQ ID NO:21)、PglpF_SD6(SEQ ID NO:20)、PglpF_SD5(SEQ ID NO:19)、PglpF_SD4(SEQ ID NO:18)、PglpF_B28(SEQ ID NO:24)和PglpF_B29(SEQ ID NO:25)。
在一个或多个示例性实施方式中,包括在用于调控遗传工程细胞的基因和/或异源核酸序列的表达的调控元件中的启动子序列,涵盖lac操纵子启动子序列Plac。
在一个或多个示例性实施方式中,遗传工程细胞源自MDO菌株(参见“材料和方法”)并且通过在天然荚膜异多糖酸基因座前的简单启动子交换,和/或在不同的基因组位点引入该基因簇的第二个拷贝[Plac(CA)::PglpF_B28(CA)],来过表达编码荚膜异多糖酸基因簇的核酸。
在一个或多个示例性实施方式中,用于调控包含在本公开的构建体中的重组基因的表达的调控元件是mglBAC;半乳糖/甲基-半乳糖苷ABC转运蛋白周质结合蛋白启动子PmglB或其变体,例如但不限于PmglB_70UTR或PmglB_70UTR_SD4。另外的PmglB变体如WO2020255054中所述进行描述。
在一个或多个示例性实施方式中,用于调控包含在本公开的构建体中的重组基因的表达的调控元件是gatYZABCD;塔格糖-1,6-双P醛缩酶启动子PgatY或其变体。
Pscr
在一个或多个示例性实施方式中,异源调控元件是Pscr或其变体,例如但不限于SEQ ID NO:11。
Pscr_SD1
在一个或多个示例性实施方式中,异源调控元件是Pscr_SD1或其变体,例如但不限于SEQ ID NO:36。
Pscr_SD7
在一个或多个示例性实施方式中,异源调控元件是Pscr_SD7或其变体,例如但不限于SEQ ID NO:37。
PgatY_70UTR
在一个或多个示例性实施方式中,异源调控元件是PgatY_70UTR或其变体,例如但不限于SEQ ID NO:12。
PglpF
在一个或多个示例性实施方式中,异源调控元件是PglpF或其变体,例如但不限于SEQ ID NO:13。
PglpF_SD1
在一个或多个示例性实施方式中,异源调控元件是PglpF_SD1或其变体,例如但不限于SEQ ID NO:14。
PglpF_SD10
在一个或多个示例性实施方式中,异源调控元件是PglpF_SD10或其变体,例如但不限于SEQ ID NO:15。
PglpF_SD2
在一个或多个示例性实施方式中,异源调控元件是PglpF_SD2或其变体,例如但不限于SEQ ID NO:16。
PglpF_SD3
在一个或多个示例性实施方式中,异源调控元件是PglpF_SD3或其变体,例如但不限于SEQ ID NO:17。
PglpF_SD4
在一个或多个示例性实施方式中,异源调控元件是PglpF_SD4或其变体,例如但不限于SEQ ID NO:18。
PglpF_SD5
在一个或多个示例性实施方式中,异源调控元件是PglpF_SD5或其变体,例如但不限于SEQ ID NO:19。
PglpF_SD6
在一个或多个示例性实施方式中,异源调控元件是PglpF_SD6或其变体,例如但不限于SEQ ID NO:20。
PglpF_SD7
在一个或多个示例性实施方式中,异源调控元件是PglpF_SD7或其变体,例如但不限于SEQ ID NO:21。
PglpF_SD8
在一个或多个示例性实施方式中,异源调控元件是PglpF_SD8或其变体,例如但不限于SEQ ID NO:22。
PglpF_SD9
在一个或多个示例性实施方式中,异源调控元件是PglpF_SD9或其变体,例如但不限于SEQ ID NO:23。
PglpF_B28
在一个或多个示例性实施方式中,异源调控元件是PglpF_B28或其变体,例如但不限于SEQ ID NO:24。
PglpF_B29
在一个或多个示例性实施方式中,异源调控元件是PglpF_B29或其变体,例如但不限于SEQ ID NO:25。
Plac_16UTR
在一个或多个示例性实施方式中,异源调控元件是Plac_16UTR或其变体,例如但不限于SEQ ID NO:26。
Plac
在一个或多个示例性实施方式中,异源调控元件是Plac或其变体,例如但不限于SEQ ID NO:27。
PmglB_70UTR
在一个或多个示例性实施方式中,异源调控元件是PmglB_70UTR或其变体,例如但不限于SEQ ID NO:28。
PmglB_70UTR_SD4
在一个或多个示例性实施方式中,异源调控元件是PmglB_70UTR_SD4或其变体,例如但不限于SEQ ID NO:29。
附加型元件
术语“附加型元件”是指染色体外核酸序列,其可以自主复制或整合到遗传工程细胞的基因组中。因此,附加型核酸序列可以是能够整合到遗传工程细胞的染色体中的质粒,即并非所有质粒都是附加型元件。
在一个或多个示例性实施方式中,附加型核酸序列可以是未整合到染色体中的质粒。在本上下文中,附加型元件是指携带目的表达盒的质粒DNA序列,该表达盒由启动子序列、目的基因的编码序列和终止子序列组成。
在一个或多个示例性实施方式中,附加型核酸序列可以是仅其一部分整合到染色体中的质粒。在本上下文中,表达盒类似于上述表达盒,但其还包含与待整合目的基因的基因座上游和下游的DNA区域同源的两个DNA片段。
激活剂
在一个或多个示例性实施方式中,本文公开的遗传工程细胞包含过表达的基因产物,其增强编码促进产生人乳寡糖(HMO)例如但不限于LNFP-I、LNT、LNT-II和2’-FL所需的酶的基因的表达。
在一个或多个示例性实施方式中,本公开的细胞可以包含过表达的基因产物,其结合控制β-1,3-N-乙酰基-葡糖胺基转移酶、β-1,3-半乳糖基转移酶和/或α-1,2-岩藻糖基转移酶或CA簇(vi))或乳糖通透酶(vii))的表达的调控元件,或vi)或vii)的调控元件上游的区域并增强蛋白质β-1,3-N-乙酰基-葡糖胺基转移酶、β-1,3-半乳糖基转移酶和/或α-1,2-岩藻糖基转移酶和乳糖通透酶(i)至iv))或荚膜异多糖酸基因簇(v))的表达。
在一个或多个示例性实施方式中,本公开的细胞可以包含过表达的基因产物,其结合vi)或vii)的调控元件或vi)或vii)的调控元件上游的区域并增强i)至iv)的蛋白质或v)的荚膜异多糖酸基因簇的表达,并且其中异源α-1,2-岩藻糖基转移酶蛋白质是SEQ IDNO:3的Smob。
此外,在HMO生物合成过程中增强关键基因表达的调节因子的过表达是对于改善最终产生细胞中HMO滴度或改变给定共混物中不同HMO的相对浓度的另一种可能途径。因此,CRP强加的PglpF-驱动基因表达(编码催化不同HMO生物合成关键步骤的酶基因的表达)的增强的过表达不仅可以导致更高的总HMO滴度,而且导致包含LNFPI的HMO共混物中存在的不同HMO的相对浓度发生多重变化。
在一个或多个示例性实施方式中,本公开的细胞可以包含过表达的基因产物,其结合并增强β-1,3-N-乙酰基-葡糖胺基转移酶、β-1,3-半乳糖基转移酶和/或α-1,2-岩藻糖基转移酶、乳糖通透酶和/或CA簇(i)-v))中任一个的表达,并且其中异源α-1,2-岩藻糖基转移酶蛋白质是SEQ ID NO:3[Smob]或其功能同源物。
在一个或多个示例性实施方式中,所述基因产物是cAMP DNA结合转录双调节因子CRP。
CRP
CRP属于转录因子CRP-FNR超家族。CRP调节几种大肠杆菌基因的表达,其中许多基因参与次级碳源的分解代谢。由环磷酸腺苷(cAMP)激活后,CRP直接与特定的启动子序列结合,这种结合通过直接相互作用招募RNA聚合酶,进而激活启动子序列后的核酸序列的转录,从而导致目的基因的表达。因此,CRP的过表达可导致目的基因/核酸序列的表达增强。除其他功能外,CRP对PglpF启动子发挥其功能,与阻遏物GlpR相反,它激活PglpF家族的启动子序列。以此方式,CRP在本公开的遗传工程细胞中的过表达促进受PglpF家族启动子调节的基因的表达。
如上所述,根据本公开的方法涉及添加编码i)异源β-1,3-N-乙酰基-葡糖胺基-转移酶蛋白质和ii)异源β-1,3-半乳糖基转移酶蛋白质;iii)异源α-1,2-岩藻糖基转移酶蛋白质、和iv)乳糖通透酶蛋白质的核酸。这些蛋白质可以通过结合并增强i)-iv)的表达的基因产物来调节。
因此,在一个或多个示例性实施方式中,crp基因过表达。crp基因可以编码与氨基酸序列为GenBank登录ID NP_417816具有100%同一性的蛋白质或其与GenBank登录ID NP_417816具有至少70%同一性、例如80%、例如90%、例如95%、例如98%同一性的功能同源物。
如本公开中所建议的在产生HMO共混物的菌株中的GlpR和/或CRP的遗传工程对于这些菌株的LNT的总体产生是有益的。
阻遏物
如实施例2所示,将编码DNA结合转录阻遏物GlpR的glpR基因的缺失用作遗传工具以获得HMO混合物的特定目标组成,该HMO混合物包含至多四种HMO,包括LNFP-I、LNT、LNT-II和2’-FL(按丰度顺序)。
在一个或多个示例性实施方式中,细胞可以具有非功能性(或缺乏)基因产物,该基因产物在正常情况下结合并抑制i)-v)或vi-viii)上游区域中任一个的表达,并且抑制i)至v)的表达。
在一个或多个示例性实施方式中,荚膜异多糖酸基因簇可以由整合在非天然基因座处并在PglpF启动子或其变体的控制下的额外拷贝表达。
此外,抑制HMO生物合成过程中关键基因表达的调节因子的缺失是对于改善最终产生细胞中HMO滴度或改变给定共混物中不同HMO的相对浓度的另一种可能途径。因此,消除GlpR对PglpF-驱动的编码酶基因的基因表达的抑制(这些酶催化不同HMO生物合成中的关键步骤),不仅可以导致更高的总HMO滴度,而且可以导致包含LNFPI的HMO共混物中存在的不同HMO的相对浓度的多重变化。
在一个或多个示例性优选实施方式中,根据本公开的方法包括:细胞还包含非功能性(或缺乏)基因产物,该基因产物结合并抑制i)-v)中任一个的表达,并且其中异源α-1,2-岩藻糖基转移酶蛋白质是SEQ ID NO:3[Smob]。
在一个或多个示例性优选实施方式中,根据本公开的方法包括:细胞还包含非功能性(或缺乏)基因产物,该基因产物结合并抑制i)-v)中任一个的表达,并且其中异源α-1,2-岩藻糖基转移酶蛋白质是SEQ ID NO:8[FutC]。
在一个或多个示例性实施方式中,所述基因产物是DNA结合转录阻遏物GlpR。
GlpR
GlpR属于DeoR转录调控因子家族,并充当由不同的操纵子组成的甘油-3-磷酸调节子的阻遏物。该调节因子是glpEGR操纵子的一部分,但它也可以组成型表达为独立(glpR)转录单元。此外,当大肠杆菌在诱导物、甘油或磷酸-3-甘油(G3P)存在且缺乏葡萄糖的情况下生长时,受调节的操纵子受到诱导。在没有诱导物的情况下,该阻遏物与由20个核酸长的DNA靶位点组成的反向重复序列串联结合。
与glpR基因相关的术语“非功能性或缺乏”是指通过从细菌基因组中完全或部分缺失相应的核酸序列(例如,SEQ ID NO:44或其编码能够下调glpF衍生的启动子的glpR的变体)而使glpR基因失活。还可以通过在编码序列中引入突变来使glpR基因失去功能,突变引入终止密码子、移码或影响DNA与调控元件结合的氨基酸突变。glpR基因编码DNA结合转录阻遏物GlpR。通过这种方式,由于阻遏物基因的缺失,PglpF家族的启动子序列在遗传工程细胞中上调,反之将下调PglpF启动子。
如上所述,根据本公开的方法涉及添加编码i)异源β-1,3-N-乙酰基-葡糖胺基-转移酶蛋白质和ii)异源β-1,3-半乳糖基转移酶蛋白质、和iii)异源α-1,2-岩藻糖基转移酶蛋白质、和iv)乳糖通透酶蛋白质的核酸。这些蛋白质可以通过在正常情况下结合并抑制i)-iv)的表达的基因产物来调控。
在一个或多个示例性实施方式中,基因产物是转录阻遏物GlpR。
在本发明的实施方式中,本发明的遗传修饰细胞包含非功能性(或缺乏)基因,该基因编码转录阻遏物GlpR,其一旦功能性地结合就抑制由前述调控元件驱动的表达,例如但不限于PglpF启动子序列。
在一个或多个示例性实施方式中,glpR基因缺失。
从表达smob的细胞的遗传背景中缺失glpR基因具有与lacY基因的过表达类似的效果,LNT成为继LNFP-I之后第二丰富的HMO。将荚膜异多糖酸基因簇以及编码β-1,3-N-乙酰基-葡糖胺基-转移酶、β-1,3-半乳糖基转移酶和α-1,2-岩藻糖基转移酶的异源基因以表达盒形式引入大肠杆菌宿主,该表达盒使基因表达能够在已知被GlpR调节因子抑制的PglpF启动子的控制下进行。因此,glpR基因的缺失可以消除细胞中GlpR对所有PglpF启动子施加的转录抑制,并以这种方式增强所有基于PglpF的盒的基因表达。
在glpR缺失的情况下观察到的最终共混物中LNT浓度的增加和2’-FL滴度的降低是令人惊讶的,因为荚膜异多糖酸基因簇和所有3个异源基因的表达是PglpF-驱动的,因此缺乏GlpR调节因子也受到类似的影响是预期的。然而,考虑到LNT的形成较高以及观察到的2’-FL和LNFP-I滴度较低,glpR缺失似乎对β-1,3-N-乙酰基-葡糖胺基-转移酶和β-1,3-半乳糖基转移酶的表达,而不是α-1,2-岩藻糖基转移酶或荚膜异多糖酸基因簇的表达产生更积极的影响。或者,对于在缺乏glpR基因的细胞产生的最终共混物中观察到的LNT增加而非2’-FL和LNFP-I浓度增加的合理解释在于以下事实:LgtA(β-1,3-N-乙酰基-葡糖胺基-转移酶)和GalTK(β-1,3-半乳糖基转移酶)的表达水平-而非Smob(α-1,2-岩藻糖基转移酶)或荚膜异多糖酸基因簇(负责GDP-岩藻糖合成)-限制了实现更高HMO滴度。但可以通过缺失glpR基因来克服这一限制。
糖流出转运蛋白
在过去的十年中,已经鉴定了几种新的、有效的糖流出转运蛋白,每种蛋白质对不同的重组产生的HMO具有特异性,并且表达所述蛋白质的重组细胞的开发有利于大规模工业HMO制造。糖转运涉及糖的转运,例如但不限于寡糖。
在实施例4中,显示了通过引入一些选定的糖流出转运蛋白以及增加岩藻糖基转移酶或β-1,3-N-乙酰基-葡糖胺基-转移酶的表达水平来工程化表达Smob的细胞,是如何被证明是两种有效的遗传修饰的,其可以显著调节最终HMO共混物中第一和第二丰富的HMO的丰度顺序从LNFP-I>LNT到LNT>LNFP-1。
因此,本文所述的遗传工程细胞还可以包含编码糖流出转运蛋白的重组核酸。糖流出转运蛋白可以例如在本文所述的方法中增强HMO的水平。
公开了一种/或多种HMO从本文所述的遗传工程细胞的细胞质或周质至生产培养基和/或从生产培养基至细胞质或周质的流入和/或流出转运。在一个或多个示例性实施方式中,遗传工程细胞进一步包含充当糖流出转运蛋白的基因产物。
在本文公开的遗传工程细胞中表达的、能够将一种或多种HMO从遗传工程细胞的细胞质或周质转运至生产培养基和/或从生产培养基转运至遗传工程细胞的细胞质或周质的多肽是能够糖转运的多肽。
因此,在本文中,糖转运可以意指糖的流出和/或流入转运,所述糖例如但不限于HMO。
因此,在一个或多个示例性实施方式中,根据本文描述的方法的遗传工程细胞还包含充当糖流出转运蛋白的基因产物。充当糖流出转运蛋白的基因产物可以由在遗传工程细胞中表达的重组核酸序列编码。编码糖流出转运蛋白的重组核酸序列可以整合到遗传工程细胞的基因组中。
MFS转运蛋白
示例性的糖流出转运蛋白是主要促进子超家族蛋白质的一个亚种。MFS转运蛋白促进分子(例如但不限于糖,如寡糖)穿过细胞膜的转运。
术语“主要促进子超家族(MFS)”是指次级主动转运蛋白类的一个大且极其多样化的家族,其负责转运一系列不同的底物,包括糖、药物、疏水性分子、肽、有机离子等。
术语“MFS转运蛋白”在本文中意指促进寡糖、优选HMO穿过细胞膜的转运,优选由本文所述的遗传工程细胞合成的HMO/寡糖从细胞质到细胞培养基的转运的蛋白质。另外或替代地,MFS转运蛋白还可以促进不被认为是HMO或寡糖的分子例如乳糖、葡萄糖、细胞代谢物和/或毒素的流出。
如实施例4所示,严格地通过并入一种或多种MFS转运蛋白,可以相当显著地重新设计LNT和LNFP-I共混物组成的丰度。实施例4证明了单独包含MFS转运蛋白Nec或与YberC组合包含如何提高共混物中LNT的水平,使其成为共混物中最主要的HMO。YberC的包含略微增加了共混物中LNT的水平,而LNFP-I水平保持在与对照菌株相同的水平。因此,额外的遗传修饰可用于调节两端之间的LNT:LNFP-I摩尔比。
在一个或多个示例性实施方式中,遗传工程细胞还包含编码一种或多种糖转运蛋白和/或MFS转运蛋白的重组核酸。
在一个或多个示例性实施方式中,糖流出转运蛋白和/或MFS转运蛋白选自Bad、Nec、YberC、Fred、Vag和Marc。
在一个或多个目前优选的示例性实施方式中,遗传糖流出转运蛋白是YberC和/或Nec。
Bad
本文中可互换地识别为“Bad蛋白质”或“Bad转运蛋白”或“Bad”的MFS转运蛋白的氨基酸序列为SEQ ID NO:38;本文中识别为SEQ ID NO:38的氨基酸序列是与具有GenBank登录ID WP_017489914.1的氨基酸序列具有100%同一性的氨基酸序列。
在一个或多个示例性实施方式中,糖外流转运蛋白和/或MFS转运蛋白是Bad。在进一步的实施方式中,糖流出转运蛋白的氨基酸序列为SEQ ID NO:38或者是氨基酸序列与SEQ ID NO:38中的任一个具有至少70%同一性、例如至少80%同一性、例如至少85%同一性、例如至少90%同一性、例如至少95%同一性或例如至少99%同一性的功能同源物。
Nec
氨基酸序列为SEQ ID NO:39的MFS转运蛋白在本文中可互换地识别为“Nec蛋白质”或“Nec转运蛋白”或“Nec”;编码Nec蛋白质的核酸序列在本文中识别为“Nec编码核酸/DNA”或“nec基因”或“nec”;本文中识别为SEQ ID NO:39的氨基酸序列是与具有GenBank登录ID WP_092672081.1的氨基酸序列具有100%同一性的氨基酸序列。
在一个或多个示例性实施方式中,糖流出转运蛋白和/或MFS转运蛋白是Nec。在另一个实施方式中,糖流出转运蛋白的氨基酸序列为SEQ ID NO:39,或者是氨基酸序列与SEQID NO:39中的任一个具有至少70%同一性、例如至少80%同一性、例如至少85%同一性、例如至少90%同一性、例如至少95%同一性或例如至少99%同一性的功能同源物。
如实施例4所示,与不表达Nec的细胞相比,Nec的表达与α-1,2-岩藻糖基转移酶Smob组合导致LNT产生增加。另外,实施例4显示,当将Nec和Smob的表达与β-1,3-N-乙酰基-葡糖胺基-转移酶LgtA的增强表达组合时,LNT的水平可进一步增强。
在一个或多个本发明优选的示例性实施方式中,糖流出转运蛋白是Nec。
YberC
氨基酸序列为SEQ ID NO:40的MFS转运蛋白在本文中可互换地识别为“YberC蛋白质”或“YberC转运蛋白”或“YberC”;编码YberC蛋白质的核酸序列在本文中识别为“YberC编码核酸/DNA”或“yberC基因”或“yberC”;本文中识别为SEQ ID NO:40的氨基酸序列是与具有GenBank登录ID EEQ08298.1的氨基酸序列具有100%同一性的氨基酸序列。
在一个或多个示例性实施方式中,糖流出转运蛋白和/或MFS转运蛋白是YberC。在另一个实施方式中,糖流出转运蛋白的氨基酸序列为SEQ ID NO:40,或者是氨基酸序列与SEQ ID NO:40中的任一个具有至少70%同一性、例如至少80%同一性、例如至少85%同一性、例如至少90%同一性、例如至少95%同一性或例如至少99%同一性的功能同源物。
如实施例4所示,YberC的表达与MFS转运蛋白Nec和α-1,2-岩藻糖基转移酶Smob组合,导致具有LNT和LNFP-I两者的HMO共混物。
在一个或多个本发明优选的示例性实施方式中,细胞包含编码糖转运蛋白YberC和/或Nec的重组核酸序列。
Fred
氨基酸序列为SEQ ID NO:41的MFS转运蛋白在本文中可互换地识别为“Fred蛋白质”或“Fred转运蛋白”或“Fred”;编码Fred蛋白质的核酸序列在本文中识别为“Fred编码核酸/DNA”或“fred基因”或“fred”;本文中识别为SEQ ID NO:41的氨基酸序列是与具有GenBank登录ID WP_087817556.1的氨基酸序列具有100%同一性的氨基酸序列。
在一个或多个示例性实施方式中,糖流出转运蛋白和/或MFS转运蛋白是Fred。在进一步的实施方式中,糖流出转运蛋白的氨基酸序列为SEQ ID NO:41,或者是氨基酸序列与SEQ ID NO:41中的任一个具有至少70%同一性、例如至少80%同一性、例如至少85%同一性、例如至少90%同一性、例如至少95%同一性或例如至少99%同一性的功能同源物。
Vag
氨基酸序列为SEQ ID NO:42的MFS转运蛋白在本文中可互换地识别为“Vag蛋白质”或“Vag转运蛋白”或“Vag”;编码Vag蛋白质的核酸序列在本文中识别为“Vag编码核酸/DNA”或“vag基因”或“vag”;本文中识别为SEQ ID NO:42的氨基酸序列是与具有GenBank登录ID WP_048785139.1的氨基酸序列具有100%同一性的氨基酸序列。
在一个或多个示例性实施方式中,糖流出转运蛋白和/或MFS转运蛋白是Vag。在另一个实施方式中,糖流出转运蛋白的氨基酸序列为SEQ ID NO:42,或者是氨基酸序列与SEQID NO:42中的任一个具有至少70%同一性、例如至少80%同一性、例如至少85%同一性、例如至少90%同一性、例如至少95%同一性或例如至少99%同一性的功能同源物。
Marc
氨基酸序列为SEQ ID NO:43的MFS转运蛋白在本文中可互换地识别为“Marc蛋白质”或“Marc转运蛋白”或“Marc”;编码marc蛋白质的核酸序列在本文中识别为“Marc编码核酸/DNA”或“marc基因”或“Marc”;本文中识别为SEQ ID NO:43的氨基酸序列是与具有GenBank登录ID WP_060448169.1的氨基酸序列具有100%同一性的氨基酸序列。
在一个或多个示例性实施方式中,糖流出转运蛋白和/或MFS转运蛋白是Marc。在另一个实施方式中,糖流出转运蛋白的氨基酸序列为SEQ ID NO:43,或者是氨基酸序列与SEQ ID NO:43中的任一个具有至少70%同一性、例如至少80%同一性、例如至少85%同一性、例如至少90%同一性、例如至少95%同一性或例如至少99%同一性的功能同源物。
在一个或多个示例性实施方式中,糖流出转运蛋白功能同源物的氨基酸序列与SEQ ID NO:38至43中的任一个具有至少70%同一性、例如至少80%同一性、例如至少85%同一性、例如至少90%同一性、例如至少95%同一性或例如至少99%同一性。
本公开的一个实施方式涉及一种遗传工程细胞,其包含:
a)一种或多种核酸序列,其编码如SEQ ID NO:1所示的异源β-1,3-N-乙酰基-葡糖胺基-转移酶蛋白质或其氨基酸序列与SEQ ID NO:1具有至少80%同一性的功能同源物;和
b)一种或多种核酸序列,其编码如SEQ ID NO:2所示的异源β-1,3-半乳糖基转移酶蛋白质或其氨基酸序列与SEQ ID NO:2具有至少80%同一性的功能同源物;和
c)一种或多种核酸序列,其编码如SEQ ID NO:3所示的异源α-1,2-岩藻糖基转移酶蛋白质或其氨基酸序列与SEQ ID NO:3具有至少80%同一性的功能同源物,和
d)一种或多种核酸序列,其编码一种或多种核酸序列,其编码如SEQ ID NO:4所示的乳糖通透酶蛋白质或其氨基酸序列与SEQ ID NO:4具有至少80%同一性的功能同源物,和
e)多于一种的核酸序列,其编码荚膜异多糖酸基因簇的蛋白质;和
f)编码选自以下的MFS转运蛋白的一种或多种核酸序列
i)Nec,其氨基酸序列为SEQ ID NO:39,或者是氨基酸序列与SEQ ID NO:39中的任一个具有至少70%同一性、例如至少80%同一性、例如至少85%同一性、例如至少90%同一性、例如至少95%同一性或例如至少99%同一性的功能同源物,和/或
ii)YberC,其氨基酸序列为SEQ ID NO:40,或者是氨基酸序列与SEQ ID NO:40中的任一个具有至少70%同一性、例如至少80%同一性、例如至少85%同一性、例如至少90%同一性、例如至少95%同一性或例如至少99%同一性的功能同源物。
本公开的一个实施方式涉及一种遗传工程细胞,其包含:
a)一种或多种核酸序列,其编码如SEQ ID NO:1所示的异源β-1,3-N-乙酰基-葡糖胺基-转移酶蛋白质或其氨基酸序列与SEQ ID NO:1具有至少80%同一性的功能同源物;和
b)一种或多种核酸序列,其编码如SEQ ID NO:2所示的异源β-1,3-半乳糖基转移酶蛋白质或其氨基酸序列与SEQ ID NO:2具有至少80%同一性的功能同源物;和
c)一种或多种核酸序列,其编码如SEQ ID NO:3所示的异源α-1,2-岩藻糖基转移酶蛋白质或其氨基酸序列与SEQ ID NO:3具有至少80%同一性的功能同源物,和
d)一种或多种核酸序列,其编码一种或多种核酸序列,其编码如SEQ ID NO:4所示的乳糖通透酶蛋白质或其氨基酸序列与SEQ ID NO:4具有至少80%同一性的功能同源物,和
e)多于一种的核酸序列,其编码荚膜异多糖酸基因簇的蛋白质;和
f)编码选自以下的MFS转运蛋白的一种或多种核酸序列
i)Nec,其氨基酸序列为SEQ ID NO:39,或者是氨基酸序列与SEQ ID NO:39中的任一个具有至少70%同一性、例如至少80%同一性、例如至少85%同一性、例如至少90%同一性、例如至少95%同一性或例如至少99%同一性的功能同源物,和/或
ii)YberC,其氨基酸序列为SEQ ID NO:40,或者是氨基酸序列为与SEQ ID NO:40中的任一个具有至少70%同一性、例如至少80%同一性、例如至少85%同一性、例如至少90%同一性、例如至少95%同一性或例如至少99%同一性的功能同源物;和
g)非功能性(或缺乏)基因,该基因编码转录阻遏物GlpR。
遗传修饰细胞细胞还可包含:
i)用于控制a)、b)、c)、e)和f)的表达的天然或异源调控-任选附加型-元件,和
ii)用于增加d)的表达的天然或异源调控-任选附加型-元件,其中调控元件与i)中的元件相同或不同,和/或
优选地,遗传工程细胞包含a)中的β-1,3-N-乙酰基-葡糖胺基-转移酶基因的两个或三个拷贝。
核酸构建体
本公开的一个方面是提供核酸构建体。核酸构建体可包含至少编码以下的核酸序列
i)如SEQ ID NO:1所示的异源β-1,3-N-乙酰基-葡糖胺基-转移酶蛋白质或其氨基酸序列与SEQ ID NO:1具有至少80%同一性的功能同源物;和
ii)如SEQ ID NO:2所示的异源β-1,3-半乳糖基转移酶蛋白质或其氨基酸序列与SEQ ID NO:2具有至少80%同一性的功能同源物;和
iii)如SEQ ID NO:3或8所示的异源α-1,2-岩藻糖基转移酶蛋白质或其氨基酸序列与SEQ ID NO:3或8中任一个具有至少80%同一性的功能同源物,和
核酸构建体还包含至少编码以下的核酸序列
i)如SEQ ID NO:1所示的异源β-1,3-N-乙酰基-葡糖胺基-转移酶蛋白质或其氨基酸序列与SEQ ID NO:1具有至少80%同一性的功能同源物;和
ii)如SEQ ID NO:2所示的异源β-1,3-半乳糖基转移酶蛋白质或其氨基酸序列与SEQ ID NO:2具有至少80%同一性的功能同源物;和
iii)如SEQ ID NO:3或8所示的异源α-1,2-岩藻糖基转移酶蛋白质或其氨基酸序列与SEQ ID NO:3或8中任一个具有至少80%同一性的功能同源物,和
iv)如SEQ ID NO:4所示的乳糖通透酶蛋白质,或其氨基酸序列与SEQ ID NO:4具有至少80%同一性的功能同源物。
核酸构建体可包含至少一个调控元件,其促进荚膜异多糖酸基因簇从其天然基因组基因座的功能性表达。
核酸构建体还可包含用于控制i)-iii)的表达的一个或多个调控元件。调控元件还可以控制荚膜异多糖酸基因簇的表达。调控元件可以是天然的或异源的或附加型的。
核酸构建体还可包含异源调控或附加型元件,用于增加iv)如SEQ ID NO:4所示的乳糖通透酶蛋白质或其氨基酸序列与SEQ ID NO:4具有至少80%同一性的功能同源物的表达。
核酸构建体还可包含非功能性(或缺乏)基因产物,所述基因产物在正常情况下结合并抑制调控元件的表达。
核酸构建体可以是重组核酸序列。可互换使用的术语“重组核酸序列”、“重组基因/核酸/DNA编码”或“编码核酸序列”是指人工核酸序列(即,使用用于制备核酸序列的标准实验室方法在体外产生的),其包括一组连续的、非重叠的三联体(密码子),当在适当的控制序列(即启动子序列)的控制下时,这些三联体被转录成mRNA并翻译成蛋白质。
编码序列的边界通常由恰位于mRNA的5’端开放阅读框上游的核糖体结合位点、转录起始密码子(AUG、GUG或UUG)和翻译终止密码子(UAA、UGA或UAG)决定。编码序列可包括但不限于基因组DNA、cDNA、合成和重组的核酸序列。
术语“核酸”包括RNA、DNA和cDNA分子。应当理解,由于遗传密码的简并性,可以产生编码给定蛋白质的大量核酸序列。
重组核酸序列
重组核酸序列可以是编码DNA序列例如基因,或非编码DNA序列例如调控DNA,例如启动子序列。
因此,在一个示例性实施方式中,本发明涉及一种核酸构建体,其包含编码核酸序列,即目的基因的重组DNA序列,例如岩藻糖基转移酶基因,和非编码调控DNA序列,例如启动子DNA序列,例如衍生自lac操纵子或glp操纵子的启动子序列的重组启动子序列,或衍生自另一基因组启动子DNA序列的启动子序列,或合成的启动子序列,其中编码序列和启动子序列可操作地连接。
术语“可操作地连接”是指两个或更多个核酸(例如,DNA)片段之间的功能关系。可操作地连接是指转录调控序列与转录序列的功能关系。例如,如果启动子序列刺激或调节编码序列在适当的宿主细胞或其他表达系统中的转录,则该启动子序列与编码序列可操作地连接。
一般地,可操作地连接至转录序列的启动子序列与转录序列物理上连续,即,它们是顺式作用的。
在一个示例性实施方式中,本发明的核酸构建体可以是载体DNA的一部分,在另一个实施方式中,该构建体是整合到宿主细胞基因组中的表达盒/盒。
因此,术语“核酸构建体”是指人工构建的核酸片段,特别是DNA片段,其旨在被“移植”至靶细胞,例如细菌细胞中,以修饰基因组的基因的表达,或表达可包含在构建体中的基因/编码DNA序列。
包含在构建体(表达盒)中的目的核酸构建体整合到细菌基因组中可以通过常规方法实现,例如,例如通过使用含有与染色体上特定位点同源的侧翼序列的线性盒,如针对attTn7位点所述(Waddell C.S.和Craig N.L.,Genes Dev.(1988)Feb;2(2):137-49.);核酸序列的基因组整合方法,其中重组由噬菌体λ的Red重组酶功能或Rac原噬菌体的RecE/RecT重组酶功能介导(Murphy,J Bacteriol.(1998);180(8):2063-7;Zhang等人,NatureGenetics(1998)20:123-128;Muyrers等人,EMBO Rep.(2000)1(3):239-243);基于Red/ET重组的方法(Wenzel等人,Chem Biol.(2005),12(3):349-56.;Vetcher等人,Appl EnvironMicrobiol.(2005);71(4):1829-35);或阳性克隆,即携带表达盒的克隆,可以例如通过标志物基因、或基因功能的丧失或获得而被选择。
整合可以发生在宿主细胞基因组中的一个或多个位点。如果整合在宿主细胞中的一个基因组位点,则重组核酸可以处于形成操纵子的单一调控元件的控制下或处于单独的调控元件的控制下。或者,重组核酸可以在单独的调控元件的控制下整合到宿主细胞基因组中的几个位置。
在一个或多个示例性实施方式中,本发明涉及SEQ ID NO:5-7或9-10所示的重组核酸,或其序列与SEQ ID NO:5-7或9-10具有至少70%同一性、例如至少71%同一性、至少72%同一性、至少73%同一性、至少74%同一性、至少75%同一性、至少76%同一性、至少77%同一性、至少78%同一性、至少79%同一性、至少80%同一性、至少75%同一性、至少75%同一性、至少75%同一性、至少75%同一性、至少85%同一性、至少86%同一性、至少87%同一性、至少88%同一性、至少89%同一性、至少90%同一性、至少91%同一性、至少92%同一性、至少93%同一性、至少94%同一性、至少95%同一性、至少96%同一性、至少97%同一性、至少98%同一性或至少99%同一性的功能同源物。
序列同一性
在两个或多个核酸或氨基酸序列的上下文中,术语“[某个]的序列同一性%”意指当在比较窗口或指定的核酸或氨基酸序列上进行最大对应性比较和比对时,两个或多个序列以给定的百分比具有共同的核苷酸或氨基酸残基(即序列具有至少百分之90(%)同一性)。核酸或氨基酸序列的同一性百分比可使用具有默认参数的BLAST 2.0序列比较算法,或者通过人工比对和目视检查来测量(参见例如http://www.ncbi.nlm.nih.gov/BLAST/)。该定义也适用于测试序列的互补序列和具有缺失和/或添加的序列,以及具有取代的序列。适用于确定百分比同一性、序列相似性和比对的算法示例是BLAST 2.2.20+算法,其描述于Altschul等人Nucl.Acids Res.25,3389(1997)中。BLAST 2.2.20+用于确定本公开核酸和蛋白质的序列同一性百分比。用于进行BLAST分析的软件可通过国家生物技术信息中心(http://www.ncbi.nlm.nih.gov/)公开获得。常用的序列比对算法的实例是
CLUSTAL Omega(http://www.ebi.ac.uk/Tools/msa/clustalo/)、
EMBOSS Needle(http://www.ebi.ac.uk/Tools/psa/emboss_needle/)、MAFFT(http://mafft.cbrc.jp/alignment/server/)或
MUSCLE(http://www.ebi.ac.uk/Tools/msa/muscle/)。
优选地,两个氨基酸序列之间的序列同一性使用如在EMBOSS包(EMBOSS:TheEuropean Molecular Biology Open Software Suite,Rice等人,2000,Trends Genet.16:276-277)的Needle程序中实施的Needleman-Wunsch算法(Needleman and Wunsch,1970,J.Mo/.Biol.48:443-453)来确定,优选版本5.0.0或更高版本(可访问https://www.ebi.ac.uk/Tools/psa/emboss needle/)。使用的参数是空位开放罚分(gap openpenalty)10、空位扩展罚分(gap extension penalty)0.5和EBLOSUM62(30BLOSUM62的EMBOSS版本)替换矩阵(substitution matrix)。标记为“最长同一性”的Needle输出(使用-nobrief选项获得)用作同一性百分比,计算如下:(相同残基×100)/(比对长度-比对中空位总数)。
优选地,两个核苷酸序列之间的序列同一性使用如在EMBOSS包(EMBOSS:TheEuropean Molecular Biology Open Software Suite,Rice等人,2000,Trends Genet.16:276-277)的Needle程序中实施的Needleman-Wunsch算法(Needleman and Wunsch,1970如上文)来确定,10优选版本5.0.0或更高版本。使用的参数是空位开放罚分(gap openpenalty)10、空位扩展罚分(gap extension penalty)0.5和DNAFULL(NCBI NUC4.4的EMBOSS版本)替换矩阵。标记为“最长同一性”的Needle输出(使用-nobrief选项获得)用作同一性百分比,计算如下:(相同的脱氧核糖核苷酸×100)/(比对长度-比对中空位总数)。
功能同源物
本文所述的蛋白质/核酸序列的功能同源物是遗传密码发生改变但保留其原始功能的蛋白质/核酸序列。功能同源物可以通过诱变获得。与蛋白质/核酸序列的功能性相比,功能性同源物应具有至少50%例如60%、70%、80%、90%或100%的剩余功能性。
所公开的氨基酸或核酸序列的任一个的功能同源物也可以具有更高的功能性。就HMO产量、纯度、生物质形成的减少、遗传工程细胞的活力、根据本公开的遗传工程细胞的稳健性、或消耗品的减少而言,SEQ ID NO:1-10或30-45中任一个的功能同源物应当理想地能够参与HMO产生。
遗传工程细胞
本公开还涉及一种遗传工程细胞,其包含
a)一种或多种核酸序列,其编码根据SEQ ID NO:1-3、或8的异源β-1,3-N-乙酰基-葡糖胺基-转移酶、β-1,3-半乳糖基转移酶和α-1,2-岩藻糖基转移酶蛋白质或其氨基酸序列与SEQ ID NO:1-3、或8具有至少70%同一性的功能同源物
b)一种或多种核酸序列,其编码如SEQ ID NO:4所示的乳糖通透酶蛋白质,或其氨基酸序列与SEQ ID NO:4具有至少80%同一性的功能同源物。
c)多于一种的核酸序列,其编码荚膜异多糖酸基因簇的蛋白质。
在本发明的一个方面,遗传工程细胞包含:
a)一种或多种核酸序列,其编码如SEQ ID NO:1所示的异源β-1,3-N-乙酰基-葡糖胺基-转移酶蛋白质或其氨基酸序列与SEQ ID NO:1氨基酸序列至少80%同一性的功能同源物;和
b)一种或多种核酸序列,其编码如SEQ ID NO:2所示的异源β-1,3-半乳糖基转移酶蛋白质或其氨基酸序列与SEQ ID NO:2具有至少80%同一性的功能同源物;和
c)一种或多种核酸序列,其编码如SEQ ID NO:3所示的异源α-1,2-岩藻糖基转移酶蛋白质或其氨基酸序列与SEQ ID NO:3具有至少80%同一性的功能同源物,和
d)一种或多种核酸序列,其编码一种或多种核酸序列,其编码如SEQ ID NO:4所示的乳糖通透酶蛋白质或其氨基酸序列与SEQ ID NO:4具有至少80%同一性的功能同源物,和
e)多于一种的核酸序列,其编码荚膜异多糖酸基因簇的蛋白质。
遗传工程细胞还可以包含
i)天然或异源调控元件-用于控制a)、b)和/或c)的表达,和
ii)用于增加d)的表达的天然或异源调控元件,和/或
iii)非功能性(或缺乏)基因产物,该基因产物在正常情况下结合并抑制i)和/或ii)驱动的表达。
iv)
在一个实施方式中,ii)的调控元件不同于i)的调控元件。这可用于促进底物、乳糖和糖基转移酶的表达水平之间的平衡。
优选地,遗传工程细胞还包含编码能够改变LNFP-I和LNT比率的糖流出转运蛋白的重组核酸序列。
本文使用的“遗传工程细胞”理解为已经被重组核酸序列转化或转染的细胞。因此,“遗传工程细胞”在本文中理解为已经被重组核酸序列转化或转染的宿主细胞。
根据本发明的遗传工程细胞可以对酶、转运蛋白、调控元件、激活剂和阻遏物进行修饰,如上文部分所述。
在一个或多个示例性实施方式中,细胞能够产生一种或多种选自2’-FL、LNT-II、LNT、LNFP-I和DFL的HMO。
在一个或多个示例性实施方式中,遗传工程细胞能够产生一种或多种选自2’-FL、LNT-II、LNT和LNFP-I的HMO。
在一个或多个示例性实施方式中,由遗传工程细胞产生的主要HMO是LNFP-I和/或LNT。优选地,LNT和LNFP-I组合的摩尔%高于总HMO的75%,例如高于80%,其中HMO共混物具有LNT占总HMO的10%至70%且LNFP-I占30%至95%的摩尔百分比。
遗传工程细胞可以是可用于HMO生产的任何细胞,包括哺乳动物细胞系。优选地,宿主细胞是真核或原核来源的单细胞微生物。
可充当宿主细胞的合适的微生物细胞包括酵母细胞、细菌细胞、古细菌细胞、藻类细胞和真菌细胞。
遗传工程细胞(宿主细胞)可以是例如细菌或酵母细胞。在一个优选的实施方式中,遗传工程细胞优选为原核细胞,例如细菌细胞。
细菌宿主细胞
对于细菌宿主细胞,原则上没有限制;它们可以是真细菌(革兰氏阳性或革兰氏阴性)或古细菌,只要它们允许进行基因操作以插入目的基因并且可以在制造规模上培养。优选地,宿主细胞具有允许培养至高细胞密度的特性。
适于重组工业生产根据本发明的HMO的细菌宿主细胞的非限制性实例可以是草生欧文氏菌(Erwinia herbicola)(成团泛菌(Pantoea agglomerans))、弗氏柠檬酸杆菌(Citrobacter freundii)、柠檬泛菌(Pantoea citrea)、胡萝卜软腐病果胶杆菌(Pectobacteriumcarotovorum)或野油菜黄单胞菌(Xanthomonas campestris)。也可以使用芽孢杆菌(Bacillus)属的细菌,包括枯草芽孢杆菌(Bacillus subtilis)、地衣芽孢杆菌(Bacillus licheniformis)、凝结芽孢杆菌(Bacillus coagulans)、嗜热芽孢杆菌(Bacillus thermophilus)、侧孢芽孢杆菌(Bacillus laterosporus)、巨大芽孢杆菌(Bacillus megaterium)、蕈状芽孢杆菌(Bacillus mycoides)、短小芽孢杆菌(Bacilluspumilus)、迟缓芽孢杆菌(Bacillus lentus)、蜡样芽孢杆菌(Bacillus cereus)和环状芽孢杆菌(Bacillus circulans)。类似地,可以使用本发明的方法工程化乳杆菌(Lactobacillus)属和乳球菌(Lactococcus)属的细菌,包括但不限于嗜酸乳杆菌(Lactobacillus acidophilus)、唾液乳杆菌(Lactobacillus salivarius)、植物乳杆菌(Lactobacillus plantarum)、瑞士乳杆菌(Lactobacillus helveticus)、德氏乳杆菌(Lactobacillus delbrueckii)、鼠李糖乳杆菌(Lactobacillus rhamnosus)、保加利亚乳杆菌(Lactobacillus bulgaricus)、卷曲乳杆菌(Lactobacillus crispatus)、加氏乳杆菌(Lactobacillus gasseri)、干酪乳杆菌(Lactobacillus casei)、罗伊氏乳杆菌(Lactobacillus reuteri)、詹氏乳杆菌(Lactobacillus jensenii)和乳酸乳球菌(Lactococcus lactis)。嗜热链球菌(Streptococcus thermophiles)和费氏丙酸杆菌(Proprionibacterium freudenreichii)也是本文所述发明的合适细菌种类。作为本发明的一部分,还包括如本文所述工程化的菌株,其来自肠球菌(Enterococcus)属(例如,屎肠球菌(Enterococcus faecium)和嗜热肠球菌(Enterococcus thermophiles))、双歧杆菌(Bifidobacterium)属(例如,长双歧杆菌(Bifidobacterium longum)、婴儿双歧杆菌(Bifidobacteriuminfantis)和两岐双岐杆菌(Bifidobacterium bifidum))、芽孢乳杆菌属(Sporolactobacillus spp.)、小单孢菌属(Micromomospora spp.)、微球菌属(Micrococcus spp.)、红球菌属(Rhodococcus spp.)和假单胞菌(Pseudomonas)属(例如荧光假单胞菌(Pseudomonas fluorescens)和绿脓假单胞菌(Pseudomonas aeruginosa))。
适于重组工业生产根据本发明的HMO的真菌宿主细胞的非限制性实例可以是酵母细胞,例如法夫驹形氏酵母(Komagataella phaffii)、乳酸克鲁维酵母(Kluyveromyceslactis)、解脂耶氏酵母(Yarrowia lipolytica)、巴斯德毕赤酵母(Pichia pastoris)和酿酒酵母(Saccharomyces cerevisiae),或丝状真菌,例如曲霉属(Aspargillus sp)、镰刀菌属(Fusarium sp)或木霉属(Thricoderma sp),示例性物种为黑曲霉(A.niger)、构巢曲霉(A.nidulans)、米曲霉(A.oryzae)、茄病镰刀菌(F.solani)、禾谷镰刀菌(F.graminearum)和瑞氏木霉(T.reesei)。
在一个或多个示例性实施方式中,遗传工程细胞是酿酒酵母或巴斯德毕赤酵母。
在一个或多个示例性实施方式中,遗传工程细胞是巴斯德毕赤酵母。
在一个或多个示例性实施方式中,遗传工程细胞是酿酒酵母。
在一个或多个示例性实施方式中,遗传工程细胞选自大肠杆菌、谷氨酸棒杆菌(C.glutamicum)、乳酸乳球菌、枯草芽孢杆菌、变铅青链霉菌(S.lividans)、巴斯德毕赤酵母和酿酒酵母。
在一个或多个示例性实施方式中,遗传工程细胞选自枯草芽孢杆菌、酿酒酵母和大肠杆菌。
在一个或多个示例性实施方式中,遗传工程细胞是枯草芽孢杆菌。
在一个或多个示例性实施方式中,遗传工程细胞是大肠杆菌。
在一个或多个示例性实施方式中,本发明涉及一种遗传工程细胞,其中该细胞源自大肠杆菌K-12或DE3菌株。
培养
在本上下文中,培养是指细胞在受控条件下生长的过程,通常在其自然环境之外,因此是用于培养、繁殖和生长大量细胞的方法。
术语培养和发酵可互换使用。
本公开的另一方面涉及一种用于产生以LNFP-I和LNT作为主要HMO的人乳寡糖(HMO)共混物的方法,该方法包括以下步骤:
(a)提供能够产生HMO的遗传工程细胞,其中所述细胞表达
i)如SEQ ID NO:1[LgtA]所示的异源β-1,3-N-乙酰基-葡糖胺基-转移酶蛋白质或其氨基酸序列与SEQ ID NO:1[LgtA]具有至少80%同一性的功能同源物;和
ii)如SEQ ID NO:2[GalTK]所示的异源β-1,3-半乳糖基转移酶蛋白质或其氨基酸序列与SEQ ID NO:2[GalTK]具有至少80%同一性的功能同源物;和
iii)如SEQ ID NO:3[Smob]所示的异源α-1,2-岩藻糖基转移酶蛋白质或其氨基酸序列与SEQ ID NO:3[Smob]具有至少80%同一性的功能同源物,和
iv)如SEQ ID NO:4所示的乳糖通透酶蛋白质,或其氨基酸序列与SEQ ID NO:4具有至少80%同一性的功能同源物,
并且还包含,
v)功能性荚膜异多糖酸基因簇,和
vi)用于控制i)ii)iii)和v)的表达的天然或异源调控元件,任选地以附加型元件的形式,和
vii)用于增加iv)的表达的天然或异源调控元件,任选地以附加型元件的形式,和/或
viii)非功能性(或缺乏)基因产物,该基因产物在正常情况下结合并抑制由vi)-vii)驱动的表达
(b)在合适的细胞培养基中培养根据(a)的细胞以表达所述核酸序列;和
(c)收获步骤(b)中产生的HMO共混物。
在一个替代实施方式中,用如SEQ ID NO:8[FutC]所示的异源α-1,2-岩藻糖基转移酶或其氨基酸序列与SEQ ID NO:8[FutC]具有至少80%同一性的功能同源物,交换iii)中的异源α-1,2-岩藻糖基转移酶蛋白质。
细胞培养基
在本文中,生长培养基或培养基是设计用于支持微生物、细胞或小植物生长的液体或凝胶。培养基包含适当的能源并且可以包含调节细胞周期的化合物。培养基可以是半限定的,即含有复杂的培养基化合物(例如,酵母提取物、大豆蛋白质胨、酪蛋白质氨基酸等),或者它可以是化学限定的,不含任何复杂的化合物。实验实施例中提供了示例性的合适培养基。
在一个或多个示例性实施方式中,培养基是基本培养基。
在一个或多个示例性实施方式中,培养基补充有选自甘油、蔗糖、葡萄糖和果糖的一种或多种能源和碳源。
在一个或多个示例性实施方式中,培养基补充有选自甘油、蔗糖和葡萄糖的一种或多种能源和碳源。
在一个或多个示例性实施方式中,培养基补充有甘油、蔗糖和/或葡萄糖。
在一个或多个示例性实施方式中,培养基补充有甘油和/或葡萄糖。
在一个或多个示例性实施方式中,培养基补充有蔗糖和/或葡萄糖。
在一个或多个示例性实施方式中,培养基补充有甘油和/或蔗糖。
在一个或多个示例性实施方式中,培养基仅补充有蔗糖。
在一个或多个示例性实施方式中,培养基含有蔗糖作为唯一的碳源和能源。
蔗糖发酵
在一个或多个示例性实施方式中,遗传工程细胞可以包含PTS依赖性蔗糖利用转运系统和/或编码能够将蔗糖水解成果糖和葡萄糖的异源多肽的重组核酸序列。
此类细胞能够利用蔗糖作为碳源和能源。例如,根据本文公开的方法的步骤b)的培养步骤包括两步蔗糖进料,其中第二进料阶段是通过向培养物中连续添加一定量的蔗糖,该蔗糖的量少于在第一进料阶段中连续添加的量,以减缓细胞生长并增加高细胞密度培养物中产生的产物的含量。
在第二进料阶段期间连续添加至细胞培养物的蔗糖的进料速率可以比在第一进料阶段期间连续添加的蔗糖的进料速率低约30-40%。
在两个进料阶段期间,可以连续添加乳糖,优选与蔗糖一起添加在同一进料溶液中,或依次添加。
任选地,培养还包括第三进料阶段,此时在第二阶段之后细胞外级分中剩余大量未使用的受体。
然后继续添加蔗糖而不添加受体,优选以与第二进料阶段设定的大致相同的进料速率直至受体耗尽。
在一个或多个示例性实施方式中,遗传工程细胞包含编码一种或多种异源多肽的一种或多种异源核酸序列,该异源多肽使得能够利用蔗糖作为所述遗传工程细胞的唯一碳源和能源。
在一个或多个示例性实施方式中,遗传工程细胞包含PTS依赖性蔗糖利用系统,还包含scrYA和scrBR操纵子。
在一个或多个示例性实施方式中,由scrYA操纵子编码的多肽是具有根据SEQ IDNO:30-31[scrY和scrA]的氨基酸序列或SEQ ID NO:30-31[scrY和scrA]中任一个的功能同源物(其氨基酸序列与SEQ ID NO:30-31[scrY和scrA]中的任一个具有至少80%同一性)的多肽。
在一个或多个示例性实施方式中,由scrBR操纵子编码的多肽是具有根据SEQ IDNO:32-33[scrB和scrR]的氨基酸序列的多肽或SEQ ID NO:32-33[scrB和scrR]中任一个的功能同源物(其氨基酸序列与SEQ ID NO:32-33[scrB和scrR]中的任一个具有至少80%同一性)的多肽。
在一个或多个示例性实施方式中,能够将蔗糖水解成果糖和葡萄糖的多肽选自SEQ ID NO:34-35[SacC_Agal和Bff]、或SEQ ID NO:34-35[SacC_Agal和Bff]中任一个的功能同源物,其氨基酸序列与SEQ ID NO:34-35[SacC_Agal和Bff]中的任一个具有至少80%同一性。
培养期间的乳糖水平
对于通过上述菌株工程策略衍生的许多LNFP-I生产菌株,发现一个单一主要发酵参数以可预测和独特的方式显著影响所得HMO共混物分布(profile)的组成。
发酵参数的调节可以使共混物中所含的每种HMO的分布在狭窄的范围内具有预定的组成。因此,发现发酵期间的乳糖水平对产生LNFP-I的菌株的一个家族的4-HMO共混物的组成具有非常大的影响(参见实施例3)。
如实施例3所示,仅通过乳糖水平从低到高的变化,就可以非常显著地从2’-FL>LNT>LNT-II至LNT>LNT-II>2’-FL重新设计LNFP-I共混物中第二、第三和第四最丰富的HMO的丰度顺序。实施例3证明了在发酵期间如何调节乳糖水平来获得HMO混合物的特定目标组成,该混合物以显著量包含LNFP-I、2’-FL、LNT和LNT-II至多四种HMO。
因此,本公开显示了在发酵期间如何可以有利地使用乳糖添加来调节由菌株MP5和MP6产生的HMO共混物的组成。
在一个或多个示例性实施方式中,调节培养基中的乳糖水平。
因此,在一个或多个示例性实施方式中,在遗传工程细胞培养期间,将乳糖水平从低调节至高。在本上下文中,如图3所示,这导致了以下乳糖浓度范围:高乳糖工艺30-80g/L,低乳糖工艺0-15g/L。
因此,在一个或多个示例性实施方式中,高水平的乳糖水平涉及30-80g/L,例如但不限于30-40g/L、30-50g/L、30-60g/L、30-70g/L、40-50g/L、40-60g/L、40-70g/L、40-80g/L、50-60g/L、50-70g/L、50-80g/L、60-70g/L、60-80g/L、35-50g/L、35-60g/L、35-70g/L、35-75g/L、35-80g/L、45-55g/L、45-75g/L、55-65g/L、55-75g/L、55-80g/L、65-75g/L或65-80g/L。
在本发明的一个实施方式中,在步骤(b)中培养遗传工程细胞期间,发酵培养基中的乳糖水平在30-80g/L之间。其优点是与2’-FL相比,LNFP-I共混物含有更多的LNT(见表4)。
因此,在一个或多个示例性实施方式中,低水平的乳糖水平涉及0-15g/L,例如但不限于0-5g/L、0-7.5g/L、0-10g/L、0-12.5g/L、2.5-5g/L、2.5-7.5g/L、2.5-10g/L、2.5-12.5g/L、2.5-15g/L、5-7.5g/L、5-10g/L、5-12.5g/L、5-15g/L、7.5-10g/L、7.5-12.5g/L、7.5-15g/L、10-12.5g/L、10-15g/L、或12.5-15g/L。
在本发明的一个实施方式中,在步骤(b)中培养遗传工程细胞期间,发酵培养基中的乳糖水平低于15g/L。这将导致具有2’-FL和LNT的LNFP-I共混物,其中2’-FL比LNT更普遍(见表4)。
除了乳糖浓度之外,没有发现其他发酵参数对产生LNFP-I的菌株的HMO共混物组成有如此大的影响。
由于期望将大肠杆菌宿主转化为用于HMO生产的细胞工厂,因此我们在应用合理遗传工程计划中的两个主要重点领域是a)增加乳糖进入到细胞中和b)增加表达直接参与不同HMO生物合成通路的酶。这是一个相当合理的假设,增加乳糖(即HMO合成的主要底物)进入到细胞中可以促进LNT-II的生物合成和/或HMO 2’-FL的合成,LNT-II是LNT和LNFP-I合成的前体糖。因此,增加乳糖通透酶的mRNA水平和可能的蛋白质水平可以导致细胞的质膜中出现更多的LacY分子,这反过来又可以增加细胞内乳糖的浓度,乳糖是HMO合成的主要底物。
细胞内部更多的底物可以通过多种方式影响不同HMO的相对丰度,这主要取决于表达的糖基转移酶的活性和动力学。因此,lacY基因的过表达是一种强大的遗传工具,可以扩大可产生的HMO共混物的范围。
收获
本上下文中的术语“收获”涉及在发酵终止后收集产生的HMO。在一个或多个示例性实施方式中,其可以包括收集包含在生物质(即,宿主细胞)和培养基两者中的HMO,即,在发酵液与生物质分离之前/未分离。在其他实施方式中,产生的HMO可以与生物质和发酵液分开收集,即,在生物质与培养基(即发酵液)分离后/之后。
细胞与培养基的分离可以用本领域技术人员熟知的任何方法进行,例如任何合适类型的离心或过滤。细胞与培养基的分离可以在收获发酵液后立即进行,或者在适当条件下储存发酵液后的稍后阶段进行。从剩余生物质(或总发酵)中回收产生的HMO包括从生物质(即生产细胞)中提取HMO。
从发酵中回收后,HMO可用于进一步加工和纯化。
人乳寡糖(HMO)
在本公开的上下文中,术语“寡糖”是指含有多个单糖单元的糖聚合物。单糖单元的数量在3至15的范围内,例如在3至10的范围内,例如在3至6的范围内。在一些实施方式中,优选的寡糖是由三个或四个单糖单元组成的糖聚合物,即,三糖或四糖或五糖或六糖。本公开的优选寡糖是人乳寡糖(HMO)。
本上下文中的术语“人乳寡糖”或“HMO”是指人乳中发现的复杂碳水化合物。HMO具有核心结构,其在还原端包含乳糖单元,可由一个或多个β-N-乙酰基-乳糖胺基和/或一个或多个β-乳-N-二糖基单元拉长,并且该核心结构可由α-L-岩藻吡喃基和/或a-N-乙酰基-神经氨酸基(唾液酸基)部分取代。
在这方面,非酸性(或中性)HMO不含唾液酸残基,并且酸性HMO在其结构中具有至少一个唾液酸残基。非酸性(或中性)HMO可以是岩藻糖基化或非岩藻糖基化。此类中性非岩藻糖基化HMO的实例包括乳-N-三糖2(LNT-2)、乳-N-四糖(LNT)、乳-N-新四糖(LNnT)、乳-N-新六糖(LNnH)、对-乳-N-新六糖(pLNnH)、对-乳-N-六糖(pLNH)和乳-N-六糖(LNH)。中性岩藻糖基化HMO的实例包括2’-岩藻糖基乳糖(2’-FL)、乳-N-岩藻五糖I(LNFP-I)、乳-N-二岩藻六糖I(LNDFH-I)、3-岩藻糖基乳糖(3’-FL)、二岩藻糖基乳糖(DFL)、乳-N-岩藻五糖II(LNFP-II)、乳-N-岩藻五糖III(LNFP-III)、乳-N-二岩藻六糖III(LNDFH-III)、岩藻糖基-乳-N-六糖II(FLNH-II)、乳-N-岩藻五糖V(LNFP-V)、乳-N-二岩藻六糖II(LNDFH-II)、岩藻糖基-乳-N-六糖I(FLNH-I)、岩藻糖基-对-乳-N-六糖I(FpLNH-I)、岩藻糖基-对-乳-N-新六糖II(F-pLNnH II)和岩藻糖基-乳-N-新六糖(FLNnH)。酸性HMO的实例包括3’-唾液酸基乳糖(3’-SL)、6’-唾液酸基乳糖(6’-SL)、3-岩藻糖基-3’-唾液酸基乳糖(FSL)、3’-O-唾液酸基乳-N-四糖a(LST a)、岩藻糖基-LST a(FLST a)、6’-O-唾液酸基乳-N-四糖b(LST b)、岩藻糖基-LST b(FLST b)、6’-O-唾液酸基乳-N-新四糖(LST c)、岩藻糖基-LST c(FLST c)、3’-O-唾液酸基乳-N-新四糖(LST d)、岩藻糖基-LST d(FLST d)、唾液酸-乳-N-六糖(SLNH)、唾液酸-乳-N-新六糖I(SLNH-I)、唾液酸-乳-N-新六糖II(SLNH-II)和二唾液酸-乳-N-四糖(DSLNT)。
在本公开的上下文中,乳糖不被视为HMO种类。
特定HMO共混物
术语“共混物”或“HMO共混物”是指两种或更多种HMO和/或HMO前体的混合物,例如但不限于选自LNT、LNnT、LNH、LNT-II、LNnH、对-LNH、对-LNnH、2’-FL、3FL、DFL、LNFP I、LNDFH-I、LNFP II、LNFP III、LNFP V、F-LNnH、DF-LNH I、DF-LNH II、DF-LNH I、DF-对-LNH、DF-对-LNnH、3’-SL、6’-SL、FSL、F-LST a、F-LST b、F-LST c、LST a、LST b、LST c和DS-LNT的HMO。本文所述的HMO共混物是在发酵结束时获得的,而不是通过混合纯化的HMO或由不同发酵批次产生的HMO而获得。HMO共混物是发酵期间或发酵结束时产生的HMO的组合物,发酵结束时的HMO共混物也可称为最终HMO共混物。HMO共混物可进行下游纯化,但目的是保持HMO共混物具有与发酵后获得的HMO共混物相似的比率。预计纯化后不会向混合物中添加额外的HMO。
在一个或多个示例性实施方式中,本文提及的“HMO共混物”涉及选自LNT、LNT-II、LNnH、对-LNH、2’-FL、DFL和LNFP I的两种或更多种HMO和/或HMO前体的混合物。优选地,HMO共混物或HMO共混物的主要组分产自单一生产菌株。
本公开强调了实现以LNFP-I和LNT作为主要HMO的独特且多样化的HMO共混物的两种主要方式,即菌株工程策略和发酵工艺策略。实现这一目标的菌株工程策略包括操纵HMO生产细胞的以下遗传性状
1.引入的α-1,2-岩藻糖基转移酶的选择
2.荚膜异多糖酸基因簇的表达程度
3.β-1,3-N-乙酰基-葡糖胺基转移酶的表达程度或拷贝数
4.主要促进子超家族(MFS)的一种或多种糖转运蛋白的引入
5.细胞调控环境的变化,例如glpR调节因子缺失
本公开中的发酵工艺策略包括调节发酵液中的乳糖水平,以高度可预测的方式实现源自菌株工程的给定菌株的特定的HMO共混分布。
通过本文公开的方法产生的HMO产物也可以以比率给出。本文所述的“比率”应理解为两种HMO量之间的比率,例如但不限于一种量除以另一种量。如表4所示,对于高乳糖工艺可以发现以摩尔%计的以下范围:LNFP-I/HMO[60-68]、LNT/HMO[21-27]、LNT-II/HMO[6-9]、2’-FL/HMO[4-6]。并且对于低乳糖工艺可以发现以摩尔%计的以下范围:LNFP-I/HMO[66-70]、2’-FL/HMO[25-30]、LNT/HMO[3-4]、LNT-II/HMO[1-1.5]。
因此,乳糖浓度可以成为强大的控制工具,在含有主要为LNFP-I的HMO共混物的生产期间实现3-4种主要HMO的预定、所需分布。
主要HMO
本文使用术语“主要”来定义大于收获的HMO总量的70摩尔%的单一HMO种类,例如但不限于大于总HMO的71摩尔%、72摩尔%、73摩尔%、74摩尔%、75摩尔%、76摩尔%、77摩尔%、78摩尔%、79摩尔%、80摩尔%、81摩尔%、82摩尔%、83摩尔%、84摩尔%、85摩尔%、86摩尔%、87摩尔%、88摩尔%、89摩尔%、90摩尔%、91摩尔%、92摩尔%、93摩尔%、94摩尔%、95摩尔%、96摩尔%、97摩尔%、98摩尔%、99摩尔%、或99.5摩尔%。
相同的定义适用于HMO的共混物,这意味着当共混物大于收获的HMO总量的70摩尔%时,例如两种HMO的共混物是“主要”的。
在本发明的一个实施方式中,LNT和LNFP-I的组合的摩尔%高于总HMO的75%,例如高于80%。
在本发明的一个实施方式中,用本文所述的菌株发酵后,HMO共混物具有LNFP-I占总HMO的65摩尔%至95摩尔%且LNT占总HMO的2.4摩尔%至35摩尔%的摩尔百分比。优选地,本发明的HMO共混物具有LNT占总HMO的10%至70%且LNFP-I占30%至95%的摩尔百分比。
比率
因此,在一个或多个示例性实施方式中,步骤c)中收获的LNFP-I:LNT的比率在25:1-1:3的范围内,例如25:1-1:1,例如但不限于至22:1、18:1、15:1、12:1、10:1、7:1、5:1、4:1、3:1、2:1、1:1、2:3或1:3。在替代实施方式中,所述产品中不存在LNT。
在一个或多个示例性实施方式中,步骤c)中收获的LNFP-I:LNT的比率在10:1至1:3的范围内,例如10:1至1:1,例如但不限于9:1、8:1、7:1、6:1、5:1、4:1、3:1、2:1、1:1、2:3或1:3。
在一个或多个本发明优选的示例性实施方式中,收获的HMO中LNFP-I:LNT的比率为10:1、5:1、3:1、5:2、2:3或1:3、2:3或1:3。
不存在的HMO
在一个或多个示例性实施方式中,收获的HMO中缺乏(不存在)LNT-II。
在一个或多个示例性实施方式中,收获的HMO中缺乏(不存在)2’-FL。
当HMO构成的量小于收获的HMO总量的1摩尔%时,例如但不限于小于收获的HMO总量的0.9摩尔%、小于0.1摩尔%、小于0.01摩尔%、小于0.001摩尔%时,在本文所述的方法的步骤c)中收获的HMO中,认为所述HMO不存在。
遗传工程细胞的用途
本公开还涉及本文公开的遗传工程细胞或核酸构建体的任何商业用途。遗传工程细胞或核酸构建体包含编码至少3种不同异源蛋白质的核酸序列,例如但不限于
i)如SEQ ID NO:1所示的异源β-1,3-N-乙酰基-葡糖胺基-转移酶蛋白质或其氨基酸序列与SEQ ID NO:1具有至少80%同一性的功能同源物;和
ii)如SEQ ID NO:2所示的异源β-1,3-半乳糖基转移酶蛋白质或其氨基酸序列与SEQ ID NO:2具有至少80%同一性的功能同源物;和
iii)如SEQ ID NO:3或8所示的异源α-1,2-岩藻糖基转移酶蛋白质或其氨基酸序列与SEQ ID NO:3或8中任一个具有至少80%同一性的功能同源物。
遗传工程细胞或核酸构建体还可包含编码如SEQ ID NO:4所示的乳糖通透酶蛋白质或其氨基酸序列与SEQ ID NO:4具有至少80%同一性的功能同源物的核酸。
遗传工程细胞或核酸构建体还可以从其天然的或任何其他基因组基因座主动表达荚膜异多糖酸基因簇。
遗传工程细胞或核酸构建体可以包含用于控制i)、ii)和iii)的表达的异源调控元件。
遗传工程细胞或核酸构建体还可以包含用于增加乳糖通透酶的表达的(异源)调控或附加型元件。
遗传工程细胞或核酸构建体可以包含非功能性(或缺乏)基因产物,该基因产物在正常情况下结合并抑制β-1,3-N-乙酰基-葡糖胺基-转移酶、β-1,3-半乳糖基转移酶、α-1,2-岩藻糖基转移酶和/或乳糖通透酶的表达。
在一个或多个示例性实施方式中,遗传工程细胞或核酸构建体用于制造一种或多种HMO。一种或多种HMO可以选自2’-FL、LNT-II、LNT、LNnT、LNFP-I和DFL。在本发明优选的实施方式中,一种或多种HMO选自2’-FL、LNT-II、LNT和LNFP-I。
在一个或多个示例性实施方式中,遗传工程细胞和/或核酸构建体用于制造多于一种HMO,其中一种或多种HMO选自LNT-II、LNT和LNFP-I。
在另一个示例性实施方式中,根据本发明的遗传工程细胞和/或核酸构建体用于制造多于一种HMO,其中HMO主要是LNFP-I和LNT。
在一个或多个示例性实施方式中,遗传工程细胞和/或核酸构建体用于制造由LNFP-I和LNT组成的HMO共混物。
HMO的制造
为了产生一种或多种HMO,根据本领域已知的程序在合适的碳源和能源例如葡萄糖、甘油或蔗糖以及合适的受体例如乳糖或任何HMO的存在下培养本文所述的遗传工程细胞,并且从培养基和培养工艺期间形成的微生物质中收获产生的HMO共混物。此后,根据本领域已知的程序,例如WO2015188834、WO2017182965或WO2017152918中描述的程序纯化HMO,并且将纯化的HMO用作营养制品、药物或用于任何其他目的,例如用于研究。
HMO的制造通常是通过进行大体积培养来完成的。术语“制造”和“制造规模”在本发明的含义中定义了最小体积为5L培养液的发酵。通常,“制造规模”工艺定义为能够处理大体积的含有目的产物的制剂并产生一定量的目的HMO产物,例如,在治疗化合物或组合物的情况下,满足临床试验的需求以及市场供应。除了大体积之外,与摇瓶培养等简单的实验室规模方法相比,制造规模方法的特点是使用生物反应器(发酵罐)的技术系统,该系统配备有搅拌、通气、营养进料、过程参数(pH、温度、溶解氧张力、背压等)的监测和控制的装置。在很大程度上,实验室规模方法中表达系统的行为,例如本公开实施例中描述的摇瓶、台式生物反应器或深孔形式,确实允许预测该系统在生物反应器的复杂环境中的行为。
对于发酵工艺中使用的合适的细胞培养基没有限制。培养基可以是半限定的,即含有复杂的培养基化合物(例如,酵母提取物、大豆蛋白质胨、酪蛋白质氨基酸等),或者它可以是化学限定的,不含任何复杂的化合物。当蔗糖用作碳源和能源时,基本培养基可能是优选的。
产生LNT和LNFP-I的特定共混物的方法
在一个实施方式中,本发明涉及一种用于产生以LNFP-I和LNT作为主要HMO的人乳寡糖(HMO)共混物的方法,该方法包括以下步骤:a.提供能够产生HMO的遗传工程细胞,b.在合适的细胞培养基中培养根据(a)的细胞以表达所述核酸序列,和c.收获步骤b中产生的HMO共混物,其中调控培养基中乳糖的水平以调节产生的共混物中LNFP-I和LNT的相对水平。
在这方面,该方法的步骤a中的所述细胞包含至少一种异源β-1,3-N-乙酰基-葡糖胺基-转移酶蛋白质,如SEQ ID NO:1所示的来自脑膜炎奈瑟菌(Neisseria meningitidis)的LgtA或其氨基酸序列与SEQ ID NO:1具有至少80%同一性的功能同源物。所述细胞还包含至少一种异源β-1,3-半乳糖基转移酶蛋白质,如SEQ ID NO:2所示的来自幽门螺杆菌的GalTK或其氨基酸序列与SEQ ID NO:2具有至少80%同一性的功能同源物。所述细胞另外包含至少一种异源α-1,2-岩藻糖基转移酶蛋白质,其为如SEQ ID NO:8所示的来自幽门螺杆菌的FutC或其氨基酸序列与SEQ ID NO:8中的任一个具有至少80%同一性的功能同源物。所述细胞还过表达荚膜异多糖酸基因簇。此外,细胞还包含用于控制异源蛋白质的表达的天然或异源调控元件(任选地以附加型元件的形式)以及用于增加天然基因和/或蛋白质的表达的天然或异源调控元件(任选地以附加型元件的形式)。另外,细胞还可以过表达编码如SEQ ID NO:4所示的天然乳糖通透酶蛋白质LacY或其氨基酸序列与SEQ ID NO:4具有至少80%同一性的功能同源物的基因,并且细胞还可以包含DNA结合转录阻遏物GlpR的非功能性(或缺乏)基因产物,该基因产物在正常情况下结合并抑制由前述调控元件驱动的表达。
如实施例3和图3至7所示,包含上述遗传修饰的细胞培养中调节乳糖水平调节了产生的LNT的水平,而发酵40小时后,LNFP-I的水平保持在大约收获的总HMO的约60%至70%的相同水平。在低乳糖水平的发酵中,收获的共混物中的LNT水平降低至约0%至约15%之间,而高乳糖水平将产生的共混物中的LNT量增加至约15%至约35%之间。
因此,在本发明方法的实施方式中,调节了该方法步骤b中培养基中的乳糖水平。在该方法步骤b中的遗传工程细胞培养期间的乳糖水平高于30g/L的实施方式中,所产生的共混物中LNT的摩尔百分比占总HMO的15%至35%。
在该方法步骤b中的遗传工程细胞培养期间的乳糖水平低于15g/L的实施方式中,所产生的共混物中LNT的摩尔百分比占总HMO的0%至15%。
因此,在实施方式中,如该方法步骤b中所述的细胞培养中乳糖水平低于15g/L,例如低于10g/L、例如低于5g/L或例如低于0.5g/L,收获的HMO中LNFP-I:LNT的比率在60:1至5:1的范围内。
在优选的实施方式中,如本发明步骤b中所述的细胞培养中乳糖水平高于30g/L,但低于100g/L,例如高于40g/L、例如高于50g/L或例如高于60g/L,但低于100g/L,收获的HMO中LNFP-I:LNT的比率在4:1至2:1的范围内。
制造的产物
根据遗传工程细胞或核酸构建体的用途的术语“制造的产物”是指旨在作为一种或多种产物HMO的一种或多种HMO。上文描述了各种产物。
有利地,本文公开的方法提供副产物与产物的降低的比率和产物(和/或总共的HMO)的增加的总产率。与产物形成相关的副产物形成较少,有利于提高产物产量,并增加生产和产物回收工艺的效率,从而提供优异的HMO制造程序。
制造的产物可以是包含一种或多种HMO的粉末、组合物、悬浮液或凝胶。
表格
表1.MP1和MP2菌株的基因型
1GlcNAcT:编码SEQ ID NO:1的β-1,3-N-乙酰基葡糖胺转移酶LgtA的lgtA基因(SEQ ID NO:5)。
2GalTK:编码SEQ ID NO:2的β-1,3-半乳糖基转移酶GalTK的基因(SEQ ID NO:6)。
3CA:在与天然基因座不同的基因座处的额外的荚膜异多糖酸基因簇(gmd-wcaG-wcaH-wcaI-manC-manB SEQ ID NO:45)
4smob:(SEQ ID NO:7)编码SEQ ID NO:3的α-1,2-岩藻糖基转移酶
5BD182026.1(修饰的):与BD182026.1相比,应用的β-1,3-半乳糖基转移酶序列具有12个和30个氨基酸的两个缺失,并在同源区具有90%同一性
表2.MP3和MP4菌株的基因型
1GlcNAcT:编码SEQ ID NO:1的β-1,3-N-乙酰基葡糖胺转移酶LgtA的lgtA基因(SEQ ID NO:5)。
2GalTK:编码SEQ ID NO:2的β-1,3-半乳糖基转移酶GalTK的基因。
3CA:在与天然基因座不同的基因座处的额外的荚膜异多糖酸基因簇(gmd-wcaG-wcaH-wcaI-manC-manB SEQ ID NO:45)
4Plac(CA):MDO平台菌株的天然CA基因簇(即Plac)前面的启动子。在MP3和MP4菌株中,Plac被PglpF_B28取代。
5smob:编码SEQ ID NO:3的α-1,2-岩藻糖基转移酶的基因(SEQ ID NO:7)
6BD182026.1(修饰的):与BD182026.1相比,应用的β-1,3-半乳糖基转移酶序列具有12个和30个氨基酸的两个缺失,并在同源区具有90%同一性
表3-MP5和MP6菌株的基因型
1GlcNAcT:编码β-1,3-N-乙酰基葡糖胺转移酶(SEQ ID NO:1)的lgtA基因(SEQ IDNO:5)
2GalTK:编码β-1,3-半乳糖基转移酶(SEQ ID NO:2)的基因(SEQ ID NO:6)
3CA:在与天然基因座不同的基因座处的额外的荚膜异多糖酸基因簇(gmd-wcaG-wcaH-wcaI-manC-manB SEQ ID NO:45)
4futC:编码α-1,2-岩藻糖基转移酶(SEQ ID NO:8)的基因(SEQ ID NO:9)
5BD182026.1(修饰的):与BD182026.1相比,应用的β-1,3-半乳糖基转移酶序列具有12个和30个氨基酸的两个缺失,并在同源区具有90%同一性
6WP_080473865.1(修饰的):与WP_080473865.1相比,应用的α-1,2-岩藻糖基转移酶在C端具有两个额外的氨基酸(LG)
表4发酵时间点68.7小时总发酵液样品中的HMO共混物组成。
*高/低乳糖浓度范围分别是指高乳糖工艺L2F20的浓度范围为30-80g/L,低乳糖工艺L2F21的浓度范围为0-15g/L。HMO=包括LNFP-I、2’-FL、LNT、LNT-II和DFL的HMO的总和。所有比率均以摩尔%给出。
表5.MP7、MP8、MP9、MP10和MP11菌株的基因型
/>
1GlcNAcT:在PglpF启动子控制下编码β-1,3-N-乙酰基葡糖胺转移酶(SEQ ID NO:1)的LgtA基因(SEQ ID NO:5)。
2GalTK:在PglpF启动子控制下编码β-1,3-半乳糖基转移酶(SEQ ID NO:2)的基因(SEQ ID NO:6)。
3CA:插入在与天然基因座不同的基因座的PglpF启动子控制下的额外的荚膜异多糖酸基因簇(gmd-wcaG-wcaH-wcaI-manC-manB,SEQ ID NO:45)
4smob:在PglpF启动子控制下编码α-1,2-岩藻糖基转移酶(SEQ ID NO:3)的基因(SEQ ID NO:7)
5BD182026.1(修饰的):与BD182026.1相比,应用的β-1,3-半乳糖基转移酶序列具有12个和30个氨基酸的两个缺失,并在同源区具有90%同一性
6YberC:Plac启动子控制下的MFS转运蛋白,GenBank登录ID EEQ08298.1
7nec:PglpF启动子控制下的MFS转运蛋白,GenBank登录号WP_092672081.1
8LacY:插入与天然基因座不同的基因座的天然LacY基因的额外拷贝
9ScrBR:来自鼠伤寒沙门氏菌(Salmonella thyphimurium)的在PglpF启动子控制下的scrBR操纵子,表达编码SEQ ID NO:32和33的PTS依赖性蔗糖利用转运系统的两个基因
10ScrYA:来自肺炎克雷伯菌(Klebsiella pneumoniae)的在PglpF启动子控制下的scrYA操纵子,表达编码SEQ ID NO:30和32的PTS依赖性蔗糖利用转运系统的两个基因
一般的
应当理解,上文结合根据本发明的方法讨论的任何特征和/或方面通过类推适用于本文描述的工程化细胞、核酸构建体和/或用途。
术语“发酵”和“培养”可以互换使用。
术语乳-N-三糖、LNT-II、LNT II、LNT2和LNT 2可互换使用。
术语“遗传工程”和“遗传修饰”可以互换使用。
整个说明书中提及的i)、ii)、iii)、iv)、v)、vi)、vii)和viii)是指权利要求1的组分。
如实施例3所示,本文提出的发酵策略对于产生以LNFP-I和LNT作为主要HMO的共混物是有效的,不仅使用SEQ ID NO:3中公开的Smobα-1,2-岩藻糖基转移酶,而且还适用例如当乳糖水平受到调节时,futC作为α-1,2-岩藻糖基转移酶。因此,应当理解,上文讨论的与根据本公开的Smobα-1,2-岩藻糖基转移酶相关的任何特征和/或方面通过类推结合如实施例3中所公开的调节乳糖水平而适用于futCα-1,2-岩藻糖基转移酶。在本上下文中,异源α-1,2-岩藻糖基转移酶futC蛋白质为如SEQ ID NO:8所示或其氨基酸序列与SEQ ID NO:8中的任一个具有至少80%同一性的功能同源物。
下文提供附图和实施例来说明本公开。它们旨在是说明性的并且不应解释为以任何方式进行限制。
附图说明
图1
lacY表达水平对菌株(a)MP1和(b)MP2产生的最终共混物的HMO含量(以%mM计)的影响。
图2
glpR+/-表型对菌株(a)MP3和(b)MP4产生的最终共混物的HMO含量(以%mM计)的影响。
图3
使用两种菌株MP5和MP6在高乳糖(工艺L2F20)或低乳糖(工艺L2F21)条件下进行的四次运行中,发酵液中乳糖一水合物浓度的时间曲线。
图4
使用两种菌株MP5和MP6在高乳糖(工艺L2F20)或低乳糖(工艺L2F21)条件下进行的四次运行中,发酵液中LNFP-I/HMO比率的时间曲线。HMO=包括LNFP-I、2’-FL、LNT、LNT-II和DFL的HMO的总和。DFL<0.3g/L。
图5
使用两种菌株MP5和MP6在高乳糖(工艺L2F20)或低乳糖(工艺L2F21)条件下进行的四次运行中,发酵液中2’-FL/HMO摩尔比的时间曲线。HMO=包括LNFP-I、2’-FL、LNT、LNT-II和DFL的HMO的总和。DFL<0.3g/L。
图6
使用两种菌株MP5和MP6在高乳糖(工艺L2F20)或低乳糖(工艺L2F21)条件下进行的四次运行中,发酵液中LNT/HMO摩尔比的时间曲线。HMO=包括LNFP-I、2’-FL、LNT、LNT-II和DFL的HMO的总和。DFL<0.3g/L。
图7
使用两种菌株MP5和MP6在高乳糖(工艺L2F20)或低乳糖(工艺L2F21)条件下进行的四次运行中,发酵液中LNT-II/HMO摩尔比的时间曲线。HMO=包括LNFP-I、2’-FL、LNT、LNT-II和DFL的HMO的总和。DFL<0.3g/L。
图8
在含有蔗糖作为表达smob菌株的碳源的细胞培养物中达到的LNFP-I和LNT滴度,相对于不表达MFS转运蛋白的细胞(菌株MP7),这些菌株携带yberC基因(菌株MP8)或nec基因(菌株MP9)或两者(菌株11)的基因组拷贝。图中还描述了相对于菌株MP7中的HMO,带有nec-表达盒和额外的lgtA-表达盒的菌株(MP10)的相对HMO滴度。滴度以相对于每个菌株的总HMO的百分比显示。
序列ID
正如优先权申请DK PA 2021 70251中的校正序列表中列出的序列一样,本申请包含文本格式和电子格式的序列表,其并入本文以供参考。下文是本申请中包含的序列的总结。
SEQ ID NO:1[LgtA蛋白质]
SEQ ID NO:2[GalTK蛋白质]
SEQ ID NO:3[Smob蛋白质]
SEQ ID NO:4[LacY蛋白质]
SEQ ID NO:5[lgta基因]
SEQ ID NO:6[galTK基因]
SEQ ID NO:7[smob基因]
SEQ ID NO:8[futC蛋白质]
SEQ ID NO:9[futC基因]
SEQ ID NO:10[lacY基因]
SEQ ID NO:11[Pscr]
SEQ ID NO:12[pgatY_70UTR]
SEQ ID NO:13[PglpF]
SEQ ID NO:14[PglpF_SD1]
SEQ ID NO:15[PglpF_SD10]
SEQ ID NO:16[PglpF_SD2]
SEQ ID NO:17[PglpF_SD3]
SEQ ID NO:18[PglpF_SD4]
SEQ ID NO:19[PglpF_SD5]
SEQ ID NO:20[PglpF_SD6]
SEQ ID NO:21[PglpF_SD7]
SEQ ID NO:22[PglpF_SD8]
SEQ ID NO:23[PglpF_SD9]
SEQ ID NO:24[PglpF_B28]
SEQ ID NO:25[PglpF_B29]
SEQ ID NO:26[Plac_16UTR]
SEQ ID NO:27[Plac]
SEQ ID NO:28[PmglB_70UTR]
SEQ ID NO:29[PmglB_70UTR_SD4]
SEQ ID NO:30[scrY]
SEQ ID NO:31[scrA]
SEQ ID NO:32[scrB]
SEQ ID NO:33[scrR]
SEQ ID NO:34[SacC_AgaI]
SEQ ID NO:35[Bff]
SEQ ID NO:36[Pscr_SD1]
SEQ ID NO:37[Pscr_SD7]
SEQ ID NO:38[Bad]
SEQ ID NO:39[Nec]
SEQ ID NO:40[YberC]
SEQ ID NO:41[Fred]
SEQ ID NO:42[Vag]
SEQ ID NO:43[Marc]
SEQ ID NO:44[glpR基因]
SEQ ID NO:45[荚膜异多糖酸基因簇]
实施例
实施例1-通过增加编码乳糖通透酶的基因的表达来产生LNFP-I、2’-FL和LNT的HMO共混物的变体
深孔试验(deep well assay)中测试的菌株MP1和MP2基因型的描述
使用细菌菌株MDO作为菌株的背景菌株。MDO由大肠杆菌K-12DH1构建。大肠杆菌K-12DH1基因型为:Fˉ、gyrA96、recA1、relA1、endA1、thi-1、hsdR17、supE44。除大肠杆菌K-12DH1基因型外,MDO还具有以下修饰:lacZ:缺失1.5kbp,lacA:缺失0.5kbp,nanKETA:缺失3.3kbp,melA:缺失0.9kbp,wcaJ:缺失0.5kbp,mdoH:缺失0.5kbp,并在gmd基因上游插入Plac启动子(WO2019/123324A1)。
基于平台菌株(“MDO”),进行表1中总结的修饰,以获得本研究中使用的LNFP-I生产菌株MP1和MP2,两者均为全染色体菌株。该菌株可产生四糖HMO LNT,并进一步岩藻糖基化LNT,得到五糖HMO LNFP-I。
用于该反应的岩藻糖基转移酶,即Smob酶(α-1,2-岩藻糖基转移酶),源自运动性硫曲霉菌,发现其能够以非凡的特异性岩藻糖基化LNT,产生LNFP-I作为最终HMO共混物中的主要产物。同样,其他HMO,例如2’-FL、LNT和LNT-II也存在于最终HMO共混物中,但浓度低得多。
在本实施例中,证明了如何使用编码乳糖通透酶LacY的lacY基因的过表达作为遗传工具来获得HMO混合物的特定目标组成,该HMO混合物包含至多四种HMO,包括LNFP-I、LNT、2’-FL和LNT-II(按丰度排列)。
本发明证明了如何可以有利地使用lacY基因的过表达来调节由菌株MP1和MP2产生的HMO共混物的组成。如下表所示,两种菌株之间的唯一区别是通过在编码非必需基因的基因座插入PglpF-lacY表达盒来敲除该基因座。lacY的基因产物是乳糖通透酶LacY,它能够将乳糖从细胞外部输入到细胞质中。因此,lacY基因的过表达被认为可以增强乳糖输入到细胞中,从而以多种方式增强HMO的产生。
用于菌株表征的深孔试验方案的描述。
使用4天方案在96个深孔板中筛选本实施例中公开的菌株。在最初的24小时内,将预培养物生长到高密度,然后转移到能够诱导基因表达和产物形成的培养基中。更具体地,在第1天期间,使用补充有硫酸镁、硫胺素和葡萄糖的基础基本培养基(basal minimalmedium)制备新鲜预培养物。将预培养物在34℃和1000rpm摇动下孵育24小时,然后进一步转移到新的基础基本培养基(BMM,pH 7.5)中,以便开始主培养。新的BMM补充了硫酸镁、硫胺素、一剂20%葡萄糖溶液(50μl/100mL)和一剂10%乳糖溶液(5ml/100mL)。此外,提供50%的蔗糖溶液作为碳源,同时添加蔗糖水解酶(转化酶),从而以适合C-限制生长的速率释放葡萄糖。将主培养物在28℃和1000rpm摇动下孵育72小时。
为了分析总发酵液,在100℃下将96孔板煮沸,随后离心,最后用HPLC分析上清液。对于上清液样品,首先离心微量滴定板,然后移除0.1mL上清液用于HPLC直接分析。对于沉淀样品,首先洗涤细胞,然后溶解在去离子水中并离心。离心后,再悬浮、煮沸、离心并分析最终上清液后,分析沉淀的细胞内部HMO含量。
深孔试验结果
在深孔试验中对菌株进行表征,并按照上述72小时方案通过HPLC分析总样品的HMO含量。根据报告的分析数据计算每个样品中检测到的HMO的毫摩尔含量(mM),并计算最终共混物中每种HMO的mM百分比(%),以便轻松比较由每个菌株产生的HMO共混物中的定量差异。
如图1所示,单一遗传修饰,即lacY基因的过表达,导致获得的HMO共混物发生显著变化。lacY表达水平的增加明显减少了LNFP-I和2’-FL的形成,并显著增加了LNT和LNT-II的形成。具体地,具有lacY基因野生型表达水平的菌株MP1产生由86% LNFP-I和10%2’-FL组成的共混物,而与MP1相比,过表达lacY的菌株MP2则提供LNFP-I减少20%和LNT增加20%的共混物。
值得注意的是,菌株MP1和MP2产生的相应最终HMO共混物中的总HMO浓度是相同的(数据未显示)。
总之,lacY基因的过表达改变了相关的HMO丰度,使得最终共混物主要由LNFP-I和LNT组成(MP2),而不是LNFP-I和2’-FL(MP1)。
实施例2–通过缺失glpR基因(其抑制PglpF-驱动的基因表达),产生LNFP-I、2’-FL和LNT的HMO共混物变体
深孔试验中MP3和MP4菌株基因型的描述
基于实施例1中描述的平台菌株(“MDO”),进行表2中总结的修饰,以获得本研究中使用的LNFP-I生产菌株MP3和MP4,两者均为全染色体菌株。该菌株能够产生四糖HMO LNT,并进一步岩藻糖基化LNT,得到五糖HMO LNFP-I。用于该反应的岩藻糖基转移酶,即Smob酶(α-1,2-岩藻糖基转移酶),源自运动性硫曲霉菌,发现其能够以非凡的特异性岩藻糖基化LNT,产生LNFP-I作为最终HMO共混物中的主要产物。同样,其他HMO,例如2’-FL、LNT和LNT-II也存在于最终HMO共混物中,但浓度低得多。在本实施例中,证明了如何使用编码DNA结合转录阻遏物GlpR的glpR基因的缺失作为遗传工具来获得HMO混合物的特定目标组成,该HMO混合物包含至多四种HMO,包括LNFP-I、LNT、LNT-II和2’-FL(按丰度排列)。
本发明证明了如何能够有利地使用glpR基因的缺失来调节由菌株MP3和MP4产生的HMO共混物的组成。如下表所示,两种菌株之间的唯一区别是glpR基因的敲除。glpR的基因产物是DNA结合转录阻遏物GlpR,它充当甘油-3-磷酸调节子的阻遏物,该调节子构成在不同的操纵子中。其靶标之一是PglpF启动子,最初发现于天然大肠杆菌基因glpF的前面,该基因编码甘油促进子GlpF。由于荚膜异多糖酸基因簇和编码用于HMO合成的糖基转移酶的异源基因处于PglpF启动子的控制之下,因此glpR基因的缺失消除了细胞中GlpR对所有PglpF启动子施加的转录抑制,并以这种方式可以增强宿主基因组中存在的所有基于PglpF的盒的基因表达。
用于菌株表征的深孔试验方案的描述。
使用4天方案在96个深孔板中筛选本实施例中公开的菌株。在最初的24小时内,将预培养物生长到高密度,然后转移到能够诱导基因表达和产物形成的培养基中。更具体地,在第1天期间,使用补充有硫酸镁、硫胺素和葡萄糖的基础基本培养基制备新鲜预培养物。将预培养物在34℃和1000rpm摇动下孵育24小时,然后进一步转移到新的基础基本培养基(BMM,pH 7.5)中,以便开始主培养。新的BMM补充了硫酸镁、硫胺素、一剂20%葡萄糖溶液(50μl/100mL)和一剂10%乳糖溶液(5ml/100mL)。此外,提供50%的蔗糖溶液作为碳源,同时添加蔗糖水解酶(转化酶),从而以适合C-限制生长的速率释放葡萄糖。将主培养物在28℃和1000rpm摇动下孵育72小时。
为了分析总发酵液,在100℃下将96孔板煮沸,随后离心,最后用HPLC分析上清液。对于上清液样品,首先离心微量滴定板,然后移除0.1mL上清液用于HPLC直接分析。对于沉淀物样品,首先洗涤细胞,然后溶解在去离子水中并离心。离心后,再悬浮、煮沸、离心并分析最终上清液后,分析沉淀物的细胞内部HMO含量。
深孔试验结果
在深孔试验中对菌株进行表征,并按照上述72小时方案通过HPLC分析总样品的HMO含量。根据报告的分析数据计算每个样品中检测到的HMO的毫摩尔含量(mM),并计算最终共混物中每种HMO的mM百分比(%),以便轻松比较由每个菌株获得的HMO分布中的定量差异。
如图2所示,单一遗传修饰,即glpR基因的缺失,导致获得的HMO共混物发生显著变化。glpR基因的缺失在一定程度上减少了LNFP-I的形成,并增加了LNT和LNT-II的形成(这些HMO各个的丰度变化约10%)。具体地,glpR+菌株MP3产生由84% LNFP-I和10%2’-FL组成的共混物,而与MP3相比,glpR-菌株MP4则提供LNFP-I减少10%和LNT增加8%的共混物。
值得注意的是,与菌株MP3产生的共混物相比,glpR基因的缺失导致菌株MP4获得的共混物中的总HMO浓度约10%更高(数据未显示)。
总之,glpR基因的缺失以以下方式改变了相关的HMO丰度,LNFP-I和2’FL的丰度分别减少了11%和2%,而观察到LNT增加了8%且LNT2增加了5%。
实施例3-通过发酵期间乳糖浓度调节产生LNFP-I、2’-FL和LNT的HMO共混物的变体
在高或低乳糖工艺发酵中测试的菌株MP5和MP6基因型的描述
基于实施例1中描述的平台菌株(“MDO”),进行表3中总结的修饰以获得本研究中使用的LNFP-I生产菌株MP5和MP6,两者都是全染色体菌株。该菌株能够产生四糖HMO LNT,并进一步岩藻糖基化LNT,获得五糖HMO LNFP-I。用于该反应的岩藻糖基转移酶,即FutC酶(α-1,2-岩藻糖基转移酶),源自幽门螺杆菌(GenBank ID:WP_080473865.1,但在C末端具有两个额外的氨基酸(LG)),发现其能够将LNT岩藻糖基化以产生LNFP-I,作为这些菌株的主要产物。同样,其他HMO也被产生,其中2’-FL、LNT和LNT-II是不同浓度的主要副产物,具体取决于发酵中的生长条件,特别是发酵期间受体乳糖的浓度。
在本实施例中,证明了在发酵期间如何使用乳糖水平的调节来获得HMO混合物的特定目标组成,该HMO混合物包含显著量的LNFP-I、2’-FL、LNT和LNT-II的至多四种HMO。因此,本发明涉及在发酵期间如何可以有利地使用乳糖添加来调节由菌株MP5和MP6产生的HMO共混物的组成。两种菌株之间的唯一区别在于选择用于整合异源糖基转移酶的基因组位点
高乳糖水平和低乳糖水平的发酵工艺的描述
发酵在200mL DasBox生物反应器(Eppendorf,德国)中进行,从100mL限定的矿物培养基开始,该培养基由30g/kg碳源(葡萄糖)、MgSO4 x 7H2O、KOH、NaOH、NH4H2PO4、KH2PO4、微量元素溶液、柠檬酸、消泡剂和硫胺素组成。微量金属溶液(TMS)含有硫酸盐形式的Mn、Cu、Fe、Zn和柠檬酸。通过接种限定的基本培养基中生长的2%(v/v)预培养物来开始发酵。在耗尽批次培养基中所含的碳源后,使用预定的线性曲线以碳限制方式连续供给含有葡萄糖、MgSO4x 7H2O、TMS和H3PO4的无菌进料溶液。
乳糖添加以两种不同的方式完成,具体取决于选择高乳糖工艺还是低乳糖工艺。在高乳糖工艺(“L2F20”)中,乳糖一水合物溶液通过两次推注添加,第一次添加在开始进料后约10小时,第二次添加在约70小时EFT。在低乳糖工艺(“L2F21”)中,乳糖作为葡萄糖进料溶液的一部分连续进料,无需推注添加。如图3所示,这导致了以下乳糖浓度范围:高乳糖工艺30-80g/L,低乳糖工艺0-15g/L。
通过用14% NH4OH溶液滴定将整个发酵过程的pH控制在6.8。使用空气将通气控制在1vvm,并且通过搅拌器速率控制溶解氧保持在大于空气饱和度的23%。葡萄糖进料开始后15分钟,发酵温度设定值从33℃降低至25℃。这种温度下降是立即进行的,没有斜坡。进行发酵直至观察到过度起泡方面的不稳定,或直至最长持续时间几乎为140小时,如表4所示。
在整个发酵中,取样以使用HPLC测定LNFP-I、2’-FL、LNT、LNT-II、DFL、乳糖和其他少量副产物的浓度。将总发酵液样品在去离子水中稀释三倍并煮沸20分钟。随后以17000g离心3分钟,然后通过HPLC分析所得上清液。上述测量用于准确计算每种HMO相对于包括LNFP-I、2’-FL、LNT、LNT-II和DFL的HMO总和(“HMO”)的比率。
发酵运行结果
四次发酵稳定运行至少68.7小时。在三个实例中,发酵后期出现了过度起泡,而GDF17265则非常稳定地运行了138.3小时。为了便于比较,表4描述了时间点在68.7小时时发酵样品中的HMO组成。这些数字代表单个HMO LNFP-I、2’-FL、LNT和LNT-II与包括DFL的这四种HMO(“HMO”)总和的比率,以摩尔%表示。未显示DFL数字,因为该HMO仅以至多0.3g/L的痕量出现。如图3所示,这两种工艺可将高乳糖工艺L2F20的乳糖水平维持在30-80g/L,将低乳糖工艺L2F21的乳糖水平维持在0-15g/L。两种发酵工艺在培养基组成、葡萄糖进料曲线和发酵工艺参数(例如温度、pH值和溶解氧)方面均相同。
此外,如图4所示,所有发酵中主要的HMO产物是LNFP-I,其范围在产生的总HMO的约60%至70%之间(以摩尔%计)。该水平在发酵早期(即从约40小时)就已达到,并且始终几乎保持不变。此外,LNFP-I/HMO比率几乎与乳糖水平无关,即,对于所测试的两种菌株来说,在低乳糖工艺中,LNFP-I/HMO比率仅略高。
最后,图5、图6和图7描述了四次运行中发酵液中三种产物比率2’-FL/HMO、LNT/HMO和LNT-II/HMO的时间曲线。数据揭示了两种主要产物组成,它们高度依赖于乳糖浓度。在高乳糖工艺(L2F20)中,HMO产物分布为(按降序排列)LNFP-I>2’-FL>LNT>LNT-II。在低乳糖工艺(L2F21)中,HMO产物分布为LNFP-I>LNT>LNT-II>=2’-FL。这同样适用于所研究的两种菌株。因此,如表4所示,对于高乳糖工艺可以发现以摩尔%计的以下范围:LNFP-I/HMO[60-68]、LNT/HMO[21-27]、LNT-II/HMO[6 -9]、2’-FL/HMO[4-6]。并且对于低乳糖工艺可以发现以摩尔%计的以下范围:LNFP-I/HMO[66-70]、2’-FL/HMO[25-30]、LNT/HMO[3-4]、LNT-II/HMO[1-1.5]。因此,乳糖浓度可以成为强大的控制工具,在含有主要为LNFP-I的HMO共混物的生产期间实现3-4种主要HMO的预定、所需分布。
实施例4-通过增加β-1,3GlcNAc转移酶的表达和/或引入编码主要促进子超家族(MFS)转运蛋白的异源基因来产生LNFP-I和LNT的HMO共混物的变体
深孔试验中测试的MP7、MP8、MP9、MP10和MP11菌株基因型的描述
基于实施例1中描述的平台菌株(“MDO”),进行表5中总结的修饰,以获得全染色体菌株MP7、MP8、MP9、MP10和MP11。该菌株可产生五糖HMO LNFP-I和四糖HMO LNT。来自脑膜炎奈瑟菌(N.meningitidis)的糖基转移酶LgtA(β-1,3-N-乙酰基葡糖胺转移酶,SEQ ID NO:1)、来自幽门螺杆菌的GalTK(β-1,3-半乳糖基转移酶,SEQ ID NO:2)和来自运动性硫曲霉菌的Smob(α-1,2-岩藻糖基转移酶,SEQ ID NO:3)存在于所有五种菌株中。此外,所有菌株都拥有编码乳糖通透酶的天然大肠杆菌基因lacY(SEQ ID NO:10)的额外拷贝。菌株MP7-MP11都能够利用蔗糖作为碳源和能源,因为来自鼠伤寒沙门氏菌质粒pUR400的操纵子scrBR和来自肺炎克雷伯菌的scrYA被整合到它们的基因组上。此外,菌株MP8表达来自伯氏耶尔森菌(Yersinia bercovieri)的主要促进子超家族(MFS)YberC的异源转运蛋白,而菌株MP9和MP10表达来自Rosenbergiella nectarea的异源MFS转运蛋白Nec。此外,菌株MP10具有三个PglpF-驱动的lgtA基因拷贝,而其余菌株只有两个。最后,菌株MP11携带上述每种转运蛋白编码基因的一个拷贝。驱动yberC和nec基因表达的启动子的强度不同,即菌株MP9、MP10和MP11中存在PglpF-驱动的nec拷贝,而菌株MP8和MP11在Plac启动子的控制下表达yberC基因。
本发明证明了异源MFS转运蛋白的引入,其可能与选定的β-1,3GlcNAc转移酶的表达水平的增加相结合,可以如何有利地用于调节由菌株MP7产生的HMO共混物的组成。如下表所示,MP7和MP8-MP11菌株之间的唯一区别是将乳糖转化至LNT-II的β-1,3GlcNAc转移酶的拷贝数和/或被整合到菌株MP7中预先存在的修饰之上的菌株基因组中的MFS编码表达盒的存在。
在高产LNFP-I/LNT生产细胞的基因组上引入yberC和/或nec基因的相关表达盒预计将调节细胞内部和外部的可用前体和最终糖产物的平衡。因此,MFS编码盒的引入是一个完美的遗传工具,可以通过多种方式调整发酵工艺结束时产生的HMO分布。另一方面,增加给定β-1,3GlcNAc转移酶的表达可以有利于LNT和/或LNFP-I滴度的增加,从而有利于最终HMO分布(共混物)中LNT或LNFP-I的普遍。
用于菌株表征的深孔试验方案的描述
使用4天方案在96个深孔板中筛选本实施例中公开的菌株。在最初的24小时内,将预培养物生长到高密度,然后转移到能够诱导基因表达和产物形成的培养基中。更具体地,在第1天期间,使用补充有硫酸镁、硫胺素和葡萄糖的基础基本培养基(BMM)制备新鲜预培养物。将预培养物在34℃和1000rpm摇动下孵育24小时,然后进一步转移到新的BMM(pH7.5)中,开始主培养。新的BMM补充了硫酸镁、硫胺素、一剂20%葡萄糖溶液(每mL 0.5μL)和一剂20%乳糖溶液(每μL 0.1μL)。此外,提供20%的特定多糖原液作为碳源,同时添加特定的水解酶,使得葡萄糖以适合碳-限制生长的速率释放,并且与通常的进料-分批发酵工艺相似。将主培养物在28℃和1000rpm摇动下孵育72小时。为了分析总发酵液,在100℃下将96孔板煮沸,随后离心,最后用HPLC分析上清液。样品重复进行三到四次。
深孔试验结果
本实施例研究了进一步的遗传工具,以将HMO比率调整至客户或特定生物学研究所需的水平,该生物学研究将使用涉及遗传工程细胞的发酵工艺产生的最终材料。
糖输出蛋白(exporter)的识别及其表达的精细平衡可能是HMO生产系统成功的关键。然而,这项任务可能充满挑战性,因为只有目的HMO(而不是其前体或延长版本)才应由所选糖输出蛋白结合和输出。无论通过在HMO生产细胞中引入一种或多种糖转运蛋白来调节最终HMO分布的方式如何,转运蛋白都构成了在发酵工艺结束时获得所需HMO分布的理想遗传工具。
糖转运蛋白被证明能够主要将LNT以及较小程度的LNFP-I产物输出到细胞外部,即将Nec和YberC引入至LNFP-I蔗糖菌株MP7中。如前几节所述,在深孔试验中构建并表征了相关菌株。从培养物的总发酵液中收集样品。按照上述72小时方案,通过HPLC分析所有样品的HMO含量。每个样品中检测到的HMO浓度(滴度)用于根据测试菌株的总HMO含量计算不同的摩尔%。
对深孔培养物中总样品的分析表明,在菌株MP7的遗传背景中引入Plac-驱动的编码YberC MFS转运蛋白的基因拷贝以创建菌株MP8,略微增加了LNT滴度(图8),而LNFP-I滴度仍保持在MP7的原始水平。在菌株MP7的遗传背景中,编码Nec MFS转运蛋白的基因的单个PglpF-驱动拷贝可创建菌株MP9,使菌株MP9与菌株MP7相比,最终LNT滴度增加一倍以上,并且其LNFP-I滴度显著降低至一半(图8)。此外,两种修饰的组合,即在MP7的遗传背景中进一步增加lgtA表达和引入含有nec的盒以创建菌株MP10,增强了针对菌株MP9观察到的上述HMO分布,即,LNT滴度达到非常高的水平(高于菌株MP9,其中在菌株MP7中单独引入了nec基因)并且LNFP-I滴度甚至进一步下降(图8)。
鉴于包含MFS的构建体的上述结果,感兴趣的是将yberC-和nec-构建体组合在单个菌株中并注意LNFP-I和LNT滴度如何受到影响。在菌株MP7的遗传背景中引入两种构建体以创建菌株MP11,保留了其原始LNFP-I滴度的3/4,同时与菌株MP7和MP8中观察到的相比,它导致形成更高的LNT滴度。值得注意的是,但菌株MP11的LNT滴度低于菌株MP9观察到的LNT滴度。
总之,本文提出的用于调节蔗糖利用高产菌株获得的LNFP-I和LNT滴度的遗传工具对于构建定制的LNFP-I/LNT分布(共混物)非常强大。如上所示,通过引入包含nec和/或额外lgtA的盒可以在很大程度上有利于LNT的产生。相反,如果期望LNFP-I作为修饰细胞获得的最终HMO共混物中最普遍的HMO,则应将含有yberC的盒与nec盒一起引入细胞中。
序列表
<110> 帝斯曼知识产权资产管理有限公司
<120> 产生以LNFP-I和LNT作为主要化合物的HMO共混物的方法
<130> 34031-WO-PCT
<150> DK202170251
<151> 2021-05-17
<160> 45
<170> BiSSAP 1.3.6
<210> 1
<211> 332
<212> PRT
<213> 脑膜炎奈瑟菌
<220>
<223> LgtA, β-1,3-N-乙酰基-葡糖胺基转移酶, GeneBank ID:
WP_033911473.1
<400> 1
Met Gln Pro Leu Val Ser Val Leu Ile Cys Ala Tyr Asn Val Glu Lys
1 5 10 15
Tyr Phe Ala Gln Ser Leu Ala Ala Val Val Asn Gln Thr Trp Arg Asn
20 25 30
Leu Glu Ile Leu Ile Val Asp Asp Gly Ser Thr Asp Gly Thr Leu Ala
35 40 45
Ile Ala Lys Asp Phe Gln Lys Arg Asp Ser Arg Ile Lys Ile Leu Ala
50 55 60
Gln Ala Gln Asn Ser Gly Leu Ile Pro Ser Leu Asn Ile Gly Leu Asp
65 70 75 80
Glu Leu Ala Lys Ser Gly Met Gly Glu Tyr Ile Ala Arg Thr Asp Ala
85 90 95
Asp Asp Ile Ala Ala Pro Asp Trp Ile Glu Lys Ile Val Gly Glu Met
100 105 110
Glu Lys Asp Arg Ser Ile Ile Ala Met Gly Ala Trp Leu Glu Val Leu
115 120 125
Ser Glu Glu Lys Asp Gly Asn Arg Leu Ala Arg His His Arg His Gly
130 135 140
Lys Ile Trp Lys Lys Pro Thr Arg Pro Glu Asp Ile Ala Asp Phe Phe
145 150 155 160
Pro Phe Gly Asn Pro Ile His Asn Asn Thr Met Ile Met Arg Arg Ser
165 170 175
Val Ile Asp Gly Gly Leu Arg Tyr Asn Thr Glu Arg Asp Trp Ala Glu
180 185 190
Asp Tyr Gln Phe Trp Tyr Asp Val Ser Lys Leu Gly Arg Leu Ala Tyr
195 200 205
Tyr Pro Glu Ala Leu Val Lys Tyr Arg Leu His Ala Asn Gln Val Ser
210 215 220
Ser Lys Tyr Ser Ile Arg Gln His Glu Ile Ala Gln Gly Ile Gln Lys
225 230 235 240
Thr Ala Arg Asn Asp Phe Leu Gln Ser Met Gly Phe Lys Thr Arg Phe
245 250 255
Asp Ser Leu Glu Tyr Arg Gln Ile Lys Ala Val Ala Tyr Glu Leu Leu
260 265 270
Glu Lys His Leu Pro Glu Glu Asp Phe Glu Arg Ala Arg Arg Phe Leu
275 280 285
Tyr Gln Cys Phe Lys Arg Thr Asp Thr Leu Pro Ala Gly Ala Trp Leu
290 295 300
Asp Phe Ala Ala Asp Gly Arg Met Arg Arg Leu Phe Thr Leu Arg Gln
305 310 315 320
Tyr Phe Gly Ile Leu His Arg Leu Leu Lys Asn Arg
325 330
<210> 2
<211> 439
<212> PRT
<213> 人工序列
<220>
<223> galTK, β-1,3-半乳糖基转移酶, 与GeneBank ID:
BD182026.1同源
<400> 2
Met Ile Ser Val Tyr Ile Ile Ser Leu Lys Glu Ser Gln Arg Arg Leu
1 5 10 15
Asp Thr Glu Lys Leu Val Leu Glu Ser Asn Glu Lys Phe Lys Gly Arg
20 25 30
Cys Val Phe Gln Ile Phe Asp Ala Ile Ser Pro Lys His Glu Asp Phe
35 40 45
Glu Lys Phe Val Gln Glu Leu Tyr Asp Ser Ser Ser Leu Leu Lys Ser
50 55 60
Asp Trp Phe His Ser Asp Tyr Cys Tyr Gln Glu Leu Leu Pro Gln Glu
65 70 75 80
Phe Gly Cys Tyr Leu Ser His Tyr Leu Leu Trp Lys Glu Cys Val Lys
85 90 95
Leu Asn Gln Pro Val Val Ile Leu Glu Asp Asp Val Ala Leu Glu Ser
100 105 110
Asn Phe Met Gln Ala Leu Glu Asp Cys Leu Lys Ser Pro Phe Asp Phe
115 120 125
Val Arg Leu Tyr Gly His Tyr Trp Gly Gly His Lys Thr Asn Leu Cys
130 135 140
Ala Leu Pro Val Tyr Thr Glu Thr Glu Glu Ala Glu Ala Ser Ile Glu
145 150 155 160
Lys Thr Pro Ile Glu Asn Tyr Glu Val Thr Ser Pro Pro Pro Pro Asn
165 170 175
Pro Thr Arg Asp Thr Gln Gln Asp Phe Ile Thr Glu Thr Gln Gln Asp
180 185 190
Pro Lys Glu Leu Ser Glu Pro Cys Lys Ile Ala Pro Gln Lys Ile Ser
195 200 205
Phe Asn Gln Val Val Phe Lys Lys Ile Lys Arg Lys Leu Asn Arg Phe
210 215 220
Ile Gly Ser Ile Leu Ala Arg Thr Glu Val Tyr Lys Asn Ile Val Ala
225 230 235 240
Lys Tyr Asp Asp Leu Thr Thr Lys Tyr Asp Asp Leu Thr Thr Lys Tyr
245 250 255
Asp Asp Leu Thr Thr Lys Tyr Asp Asp Leu Thr Thr Lys Tyr Asp Asp
260 265 270
Leu Asn Lys Asn Ile Ala Glu Lys Tyr Asp Glu Leu Met Gly Lys Tyr
275 280 285
Glu Ser Leu Leu Ala Lys Glu Val Asn Ile Lys Glu Thr Phe Trp Glu
290 295 300
Ser Arg Ala Asp Ser Glu Lys Glu Ala Leu Phe Leu Asp His Phe Tyr
305 310 315 320
Leu Thr Ser Val Tyr Val Ala Thr Thr Ala Gly Tyr Tyr Leu Thr Pro
325 330 335
Lys Gly Ala Lys Thr Phe Ile Glu Ala Thr Glu Arg Phe Lys Ile Ile
340 345 350
Glu Pro Val Asp Met Phe Ile Asn Asn Pro Thr Tyr His Asp Ile Ala
355 360 365
Asn Phe Thr Tyr Val Pro Cys Pro Val Ser Leu Asn Lys His Ala Phe
370 375 380
Asn Ser Thr Ile Gln Asn Ala Lys Lys Pro Asp Ile Ser Leu Lys Pro
385 390 395 400
Pro Lys Lys Ser Tyr Phe Asp Asn Leu Phe Tyr His Lys Phe Asn Ala
405 410 415
Arg Lys Cys Leu Lys Ala Phe Asn Lys Tyr Ser Lys Gln Tyr Ala Pro
420 425 430
Leu Lys Thr Pro Lys Glu Val
435
<210> 3
<211> 292
<212> PRT
<213> 运动性硫曲霉菌
<220>
<223> Smob, β-1,2-岩藻糖基转移酶, GeneBank ID: WP_126455392.1
<400> 3
Met Ile Ile Ser Gln Ile Ile Gly Gly Leu Gly Asn Gln Met Phe Gln
1 5 10 15
Tyr Ala Ala Gly Arg Ala Leu Ser Leu Val Arg Gly Gln Pro Leu Leu
20 25 30
Leu Asp Val Thr Gly Phe Ala Gly Tyr Gly Leu His Gln Gly Phe Glu
35 40 45
Leu Gln Arg Val Phe Asp Cys Pro Ile Gly Ile Ala Thr Glu Glu Asp
50 55 60
Val Arg Gly Ile Leu Gly Trp Gln Phe Ser Ala Gly Ile Arg Arg Ile
65 70 75 80
Val Ala Arg Pro Gly Met Ala Ala Phe Arg Arg Lys Gly Phe Ile Val
85 90 95
Glu Pro His Phe His Tyr Trp Pro Glu Ile Lys Asn Val Pro Arg Asp
100 105 110
Cys Tyr Leu Leu Gly Tyr Trp Gln Ser Glu Arg Tyr Phe Arg Ala Ala
115 120 125
Thr Ala Asp Ile Arg Ala Asp Phe Ser Phe Lys Ser Pro Leu Val Asn
130 135 140
Arg Asn Ala Glu Thr Ala Ala Gln Ile Asp Gln Val Asn Ala Ile Ser
145 150 155 160
Leu His Met Arg Arg Gly Asp Tyr Val Asn Asn Pro Lys Thr Ser Ala
165 170 175
Thr His Gly Leu Cys Ser Leu Asp Tyr Tyr Gln Ala Ala Ile Lys Phe
180 185 190
Val Ser Glu Arg Val Glu Glu Pro Phe Phe Phe Ile Phe Ser Asp Asp
195 200 205
Ile Ala Trp Val Lys Ala Asn Leu Lys Leu Asp Phe Pro Cys Gln Tyr
210 215 220
Val Asp His Asn His Gly Ala Glu Ser Phe Asn Asp Met His Leu Met
225 230 235 240
Ser Leu Cys Gln His His Ile Ile Ala Asn Ser Ser Phe Ser Trp Trp
245 250 255
Gly Ala Trp Leu Asn Ser Asp Pro Lys Lys Ile Val Leu Ala Pro Lys
260 265 270
Lys Trp Phe Ala Asn Lys Asn Asn Ile Lys Asp Leu Phe Pro Pro Gly
275 280 285
Trp Val Ser Leu
290
<210> 4
<211> 10
<212> PRT
<213> 大肠杆菌
<220>
<223> 乳糖渗透酶蛋白质, GeneBank ID:
<400> 4
Ala Ala Ala Ala Ala Ala Ala Ala Ala Ala
1 5 10
<210> 5
<211> 999
<212> DNA
<213> 人工序列
<220>
<223> lgta 编码核苷酸序列
<400> 5
atgcaaccgc tggtctccgt gctgatctgt gcttacaatg tggaaaaata cttcgcccaa 60
tcgctggccg cagtcgtgaa tcaaacgtgg cgcaacctgg aaattctgat cgtggatgac 120
ggcagtaccg atggtacgct ggcgatcgcc aaagattttc agaaacgtga ctcccgcatt 180
aaaatcctgg cacaggctca aaacagtggc ctgattccgt ccctgaatat cggtctggat 240
gaactggcga aaagtggcat gggtgaatat atcgcacgca ccgatgctga tgacattgcg 300
gccccggact ggattgaaaa aatcgtcggc gaaatggaaa aagatcgtag cattatcgcg 360
atgggtgcct ggctggaagt gctgtctgaa gaaaaagatg gcaatcgtct ggcacgccat 420
caccgtcatg gtaaaatctg gaaaaaaccg acgcgtccgg aagatattgc cgactttttc 480
ccgtttggca acccgattca caacaatacc atgatcatgc gtcgctcagt tattgatggc 540
ggtctgcgct ataatacgga acgtgattgg gcggaagact atcagttctg gtacgatgtc 600
tcgaaactgg gtcgcctggc gtattacccg gaagccctgg tgaaatatcg tctgcatgcc 660
aaccaagtta gctctaaata ctctatccgc caacacgaaa ttgcacaggg catccaaaaa 720
accgctcgta atgattttct gcagtcaatg ggttttaaaa cgcgcttcga ctcgctggaa 780
tatcgtcaaa ttaaagcggt tgcctacgaa ctgctggaaa aacatctgcc ggaagaagat 840
tttgaacgcg cgcgtcgctt tctgtatcag tgcttcaaac gtaccgacac gctgccggca 900
ggtgcttggc tggatttcgc agctgacggt cgcatgcgtc gcctgtttac cctgcgtcaa 960
tacttcggca ttctgcaccg cctgctgaaa aaccgttaa 999
<210> 6
<211> 1320
<212> DNA
<213> 人工序列
<220>
<223> GalTK 编码核苷酸
<400> 6
atgatctctg tctacatcat cagtctgaaa gaatcgcagc gtcgtctgga tacggaaaaa 60
ctggttctgg aatcgaacga aaaatttaaa ggccgttgtg tgtttcagat tttcgatgcg 120
atctctccga aacatgaaga cttcgaaaaa ttcgttcaag aactgtacga tagctctagt 180
ctgctgaaat cggattggtt ccatagcgac tattgctacc aggaactgct gccgcaagaa 240
tttggttgtt atctgagcca ctacctgctg tggaaagaat gcgttaaact gaatcagccg 300
gtggttattc tggaagatga cgtcgcgctg gaatctaact ttatgcaggc cctggaagat 360
tgtctgaaaa gtccgtttga cttcgtccgt ctgtatggcc attactgggg cggtcacaaa 420
accaatctgt gcgcgctgcc ggtttatacc gaaacggaag aagcggaagc ctccattgaa 480
aaaaccccga tcgaaaatta tgaagtgacc agcccgccgc cgccgaaccc gacccgcgat 540
acgcagcaag acttcatcac cgaaacgcag caagatccga aagaactgtc ggaaccgtgc 600
aaaattgccc cgcagaaaat cagcttcaac caagtcgtgt tcaagaaaat taaacgtaaa 660
ctgaaccgct tcatcggtag catcctggcg cgtaccgaag tctataaaaa tatcgtggcc 720
aaatacgatg acctgaccac gaaatatgac gatctgacca cgaaatatga tgatctgacg 780
accaaatatg acgacctgac gacgaaatac gatgacctga acaaaaacat cgcagaaaaa 840
tacgatgaac tgatgggcaa atacgaatcg ctgctggcta aagaagtgaa catcaaagaa 900
accttctggg aatcccgtgc ggattcagaa aaagaagccc tgtttctgga ccatttctat 960
ctgaccagcg tttacgtcgc aaccacggct ggctattacc tgaccccgaa aggtgcaaaa 1020
accttcattg aagctacgga acgctttaaa attatcgaac cggttgatat gttcattaac 1080
aatccgacct atcatgatat tgccaacttt acgtacgtgc cgtgtccggt ttccctgaac 1140
aaacacgcat tcaactcaac catccagaac gctaaaaaac cggatattag cctgaaaccg 1200
ccgaaaaaat cttacttcga taacctgttt tatcacaaat ttaacgcacg caaatgcctg 1260
aaagcattca ataaatacag taaacagtac gccccgctga aaaccccgaa agaagtctaa 1320
<210> 7
<211> 879
<212> DNA
<213> 人工序列
<220>
<223> smob 编码核苷酸序列
<400> 7
atgatcatca gccagattat tggtggtctg ggtaatcaga tgtttcagta tgcagcaggt 60
cgtgcactga gcctggttcg tggtcagccg ctgctgctgg atgttaccgg ttttgcaggt 120
tatggtctgc atcagggttt tgaactgcag cgtgtttttg attgtccgat tggtattgca 180
accgaagaag atgttcgcgg tattttaggt tggcagttta gcgcaggtat tcgtcgtatt 240
gttgcacgtc ctggtatggc agcatttcgt cgtaaaggtt ttattgtgga accgcacttt 300
cattattggc ctgagattaa aaacgttccg cgtgattgtt atctgcttgg ttattggcag 360
agcgaacgtt attttcgtgc agcaaccgca gatattcgtg cagatttttc atttaaaagt 420
ccgctggtta atcgcaatgc cgaaaccgca gcacagattg atcaggttaa tgcaattagc 480
ctgcatatgc gtcgtggtga ttatgtgaat aatccgaaaa ccagcgcaac ccatggtctg 540
tgtagcctgg attattatca ggcagcaatc aaatttgtta gcgaacgtgt tgaagaaccg 600
tttttcttta tcttctccga tgatattgca tgggtgaaag caaatctgaa actggatttt 660
ccgtgccagt atgtggatca taatcatggt gcagaaagct tcaatgatat gcatctgatg 720
agcctgtgtc agcatcatat tattgcaaac agcagcttta gttggtgggg tgcatggctg 780
aatagcgatc cgaaaaaaat cgttctggca ccgaaaaaat ggttcgccaa caaaaacaac 840
atcaaagacc tgtttccgcc tggttgggtt agcctgtaa 879
<210> 8
<211> 302
<212> PRT
<213> 人工序列
<220>
<223> FutC, β-1,2-岩藻糖基转移酶, 与 GeneBank ID:
WP_080473865.1同源
<400> 8
Met Ala Phe Lys Val Val Gln Ile Cys Gly Gly Leu Gly Asn Gln Met
1 5 10 15
Phe Gln Tyr Ala Phe Ala Lys Ser Leu Gln Lys His Ser Asn Thr Pro
20 25 30
Val Leu Leu Asp Ile Thr Ser Phe Asp Trp Ser Asp Arg Lys Met Gln
35 40 45
Leu Glu Leu Phe Pro Ile Asp Leu Pro Tyr Ala Ser Ala Lys Glu Ile
50 55 60
Ala Ile Ala Lys Met Gln His Leu Pro Lys Leu Val Arg Asp Ala Leu
65 70 75 80
Lys Cys Met Gly Phe Asp Arg Val Ser Gln Glu Ile Val Phe Glu Tyr
85 90 95
Glu Pro Lys Leu Leu Lys Pro Ser Arg Leu Thr Tyr Phe Phe Gly Tyr
100 105 110
Phe Gln Asp Pro Arg Tyr Phe Asp Ala Ile Ser Pro Leu Ile Lys Gln
115 120 125
Thr Phe Thr Leu Pro Pro Pro Pro Glu Asn Asn Lys Asn Asn Asn Lys
130 135 140
Lys Glu Glu Glu Tyr Gln Cys Lys Leu Ser Leu Ile Leu Ala Ala Lys
145 150 155 160
Asn Ser Val Phe Val His Ile Arg Arg Gly Asp Tyr Val Gly Ile Gly
165 170 175
Cys Gln Leu Gly Ile Asp Tyr Gln Lys Lys Ala Leu Glu Tyr Met Ala
180 185 190
Lys Arg Val Pro Asn Met Glu Leu Phe Val Phe Cys Glu Asp Leu Glu
195 200 205
Phe Thr Gln Asn Leu Asp Leu Gly Tyr Pro Phe Met Asp Met Thr Thr
210 215 220
Arg Asp Lys Glu Glu Glu Ala Tyr Trp Asp Met Leu Leu Met Gln Ser
225 230 235 240
Cys Gln His Gly Ile Ile Ala Asn Ser Thr Tyr Ser Trp Trp Ala Ala
245 250 255
Tyr Leu Ile Glu Asn Pro Glu Lys Ile Ile Ile Gly Pro Lys His Trp
260 265 270
Leu Phe Gly His Glu Asn Ile Leu Cys Lys Glu Trp Val Lys Ile Glu
275 280 285
Ser His Phe Glu Val Lys Ser Gln Lys Tyr Asn Ala Leu Gly
290 295 300
<210> 9
<211> 909
<212> DNA
<213> 人工序列
<220>
<223> futC 编码核苷酸序列
<400> 9
atggcgttca aagtggtcca aatctgcggt ggtctgggta atcaaatgtt ccaatatgcc 60
ttcgctaaat cgctgcaaaa acacagtaat accccggtcc tgctggatat tacgagtttt 120
gattggtccg accgtaaaat gcagctggaa ctgttcccga ttgatctgcc gtatgcgagc 180
gccaaagaaa tcgcaattgc taaaatgcag catctgccga aactggttcg tgatgcgctg 240
aaatgcatgg gctttgaccg cgtcagtcaa gaaatcgtgt tcgaatatga accgaaactg 300
ctgaaaccgt cccgtctgac ctatttcttt ggttactttc aggacccgcg ttacttcgac 360
gccatctctc cgctgattaa acaaaccttt acgctgccgc cgccgccgga aaacaacaaa 420
aacaacaaca aaaaagaaga agaatatcag tgcaaactga gcctgatcct ggcggccaaa 480
aactctgtgt ttgttcacat tcgtcgcggc gattacgtgg gcatcggttg tcagctgggt 540
attgactatc agaaaaaagc gctggaatac atggccaaac gtgttccgaa tatggaactg 600
tttgtcttct gcgaagatct ggaatttacc caaaacctgg acctgggcta tccgttcatg 660
gatatgacca cgcgcgacaa agaagaagaa gcgtattggg atatgctgct gatgcagagc 720
tgtcaacatg gtattatcgc taatagcacg tattcttggt gggcagctta cctgattgaa 780
aacccggaaa aaattatcat tggcccgaaa cattggctgt ttggtcacga aaatatcctg 840
tgtaaagaat gggtgaaaat cgaatcacac ttcgaagtta aatcgcagaa atataacgcg 900
ctgggctaa 909
<210> 10
<211> 1254
<212> DNA
<213> 大肠杆菌
<220>
<223> 编码LacY的核苷酸序列
<400> 10
atgtactatt taaaaaacac aaacttttgg atgttcggtt tattcttttt cttttacttt 60
tttatcatgg gagcctactt cccgtttttc ccgatttggc tacatgacat caaccatatc 120
agcaaaagtg atacgggtat tatttttgcc gctatttctc tgttctcgct attattccaa 180
ccgctgtttg gtctgctttc tgacaaactc gggctgcgca aatacctgct gtggattatt 240
accggcatgt tagtgatgtt tgcgccgttc tttattttta tcttcgggcc actgttacaa 300
tacaacattt tagtaggatc gattgttggt ggtatttatc taggcttttg ttttaacgcc 360
ggtgcgccag cagtagaggc atttattgag aaagtcagcc gtcgcagtaa tttcgaattt 420
ggtcgcgcgc ggatgtttgg ctgtgttggc tgggcgctgt gtgcctcgat tgtcggcatc 480
atgttcacca tcaataatca gtttgttttc tggctgggct ctggctgtgc actcatcctc 540
gccgttttac tctttttcgc caaaacggat gcgccctctt ctgccacggt tgccaatgcg 600
gtaggtgcca accattcggc atttagcctt aagctggcac tggaactgtt cagacagcca 660
aaactgtggt ttttgtcact gtatgttatt ggcgtttcct gcacctacga tgtttttgac 720
caacagtttg ctaatttctt tacttcgttc tttgctaccg gtgaacaggg tacgcgggta 780
tttggctacg taacgacaat gggcgaatta cttaacgcct cgattatgtt ctttgcgcca 840
ctgatcatta atcgcatcgg tgggaaaaac gccctgctgc tggctggcac tattatgtct 900
gtacgtatta ttggctcatc gttcgccacc tcagcgctgg aagtggttat tctgaaaacg 960
ctgcatatgt ttgaagtacc gttcctgctg gtgggctgct ttaaatatat taccagccag 1020
tttgaagtgc gtttttcagc gacgatttat ctggtctgtt tctgcttctt taagcaactg 1080
gcgatgattt ttatgtctgt actggcgggc aatatgtatg aaagcatcgg tttccagggc 1140
gcttatctgg tgctgggtct ggtggcgctg ggcttcacct taatttccgt gttcacgctt 1200
agcggccccg gcccgctttc cctgctgcgt cgtcaggtga atgaagtcgc ttaa 1254
<210> 11
<211> 152
<212> DNA
<213> 肺炎克雷伯菌
<220>
<223> 用于scrYA 蔗糖基因的启动子
<400> 11
ggttaacggc ccactttgct ggcgacatca caattcttaa accggtttag caatttttat 60
tttcaccgcg ttaccgacat gtttaccata tcaactaaac cggtttagca aacattagca 120
cactcactga tttacctttg gatgtcacca ac 152
<210> 12
<211> 291
<212> DNA
<213> 人工序列
<220>
<223> PgatY_70UTR,用于gatYZABCD的大肠杆菌启动子的变体;
塔格糖-1,6-双P醛缩酶
<400> 12
cggcaaccta tgcctgatgc gacgctgaag cgtcttatca tgcctacata gcactgccac 60
gtatgtttac accgcatccg gcataaaaac acgcgcactt tgctacggct tccctatcgg 120
gaggccgttt ttttgccttt cactcctcga ataattttca tattgtcgtt tttgtgatcg 180
ttatctcgat atttaaaaac aaataatttc attatatttt gtgcctacaa gcatcgtgga 240
ggtccgtgac tttcacgcat acaacaaaca ttaaccaagg aggaaacagc t 291
<210> 13
<211> 300
<212> DNA
<213> 大肠杆菌
<220>
<223> PglpF, glpFKX 操纵子的大肠杆菌启动子序列
<400> 13
gcggcacgcc ttgcagatta cggtttgcca cacttttcat ccttctcctg gtgacataat 60
ccacatcaat cgaaaatgtt aataaatttg ttgcgcgaat gatctaacaa acatgcatca 120
tgtacaatca gatggaataa atggcgcgat aacgctcatt ttatgacgag gcacacacat 180
tttaagttcg atatttctcg tttttgctcg ttaacgataa gtttacagca tgcctacaag 240
catcgtggag gtccgtgact ttcacgcata caacaaacat taaccaagga ggaaacagct 300
<210> 14
<211> 300
<212> DNA
<213> 人工序列
<220>
<223> PglpF_SD1, glpFKX 操纵子的大肠杆菌启动子序列PglpF的变体
<400> 14
gcggcacgcc ttgcagatta cggtttgcca cacttttcat ccttctcctg gtgacataat 60
ccacatcaat cgaaaatgtt aataaatttg ttgcgcgaat gatctaacaa acatgcatca 120
tgtacaatca gatggaataa atggcgcgat aacgctcatt ttatgacgag gcacacacat 180
tttaagttcg atatttctcg tttttgctcg ttaacgataa gtttacagca tgcctacaag 240
catcgtggag gtccgtgact ttcacgcata caacaaacat taaccaaatt cgaaacagct 300
<210> 15
<211> 300
<212> DNA
<213> 人工序列
<220>
<223> PglpF_SD10, glpFKX 操纵子的大肠杆菌启动子序列PglpF的变体
<400> 15
gcggcacgcc ttgcagatta cggtttgcca cacttttcat ccttctcctg gtgacataat 60
ccacatcaat cgaaaatgtt aataaatttg ttgcgcgaat gatctaacaa acatgcatca 120
tgtacaatca gatggaataa atggcgcgat aacgctcatt ttatgacgag gcacacacat 180
tttaagttcg atatttctcg tttttgctcg ttaacgataa gtttacagca tgcctacaag 240
catcgtggag gtccgtgact ttcacgcata caacaaacat taaccaactg agaaacagct 300
<210> 16
<211> 300
<212> DNA
<213> 人工序列
<220>
<223> PglpF_SD2, glpFKX 操纵子的大肠杆菌启动子序列PglpF的变体
<400> 16
gcggcacgcc ttgcagatta cggtttgcca cacttttcat ccttctcctg gtgacataat 60
ccacatcaat cgaaaatgtt aataaatttg ttgcgcgaat gatctaacaa acatgcatca 120
tgtacaatca gatggaataa atggcgcgat aacgctcatt ttatgacgag gcacacacat 180
tttaagttcg atatttctcg tttttgctcg ttaacgataa gtttacagca tgcctacaag 240
catcgtggag gtccgtgact ttcacgcata caacaaacat taaccaagcg caaaacagct 300
<210> 17
<211> 300
<212> DNA
<213> 人工序列
<220>
<223> PglpF_SD3, glpFKX 操纵子的大肠杆菌启动子序列PglpF的变体
<400> 17
gcggcacgcc ttgcagatta cggtttgcca cacttttcat ccttctcctg gtgacataat 60
ccacatcaat cgaaaatgtt aataaatttg ttgcgcgaat gatctaacaa acatgcatca 120
tgtacaatca gatggaataa atggcgcgat aacgctcatt ttatgacgag gcacacacat 180
tttaagttcg atatttctcg tttttgctcg ttaacgataa gtttacagca tgcctacaag 240
catcgtggag gtccgtgact ttcacgcata caacaaacat taaccaagaa caaaacagct 300
<210> 18
<211> 300
<212> DNA
<213> 人工序列
<220>
<223> PglpF_SD4, glpFKX 操纵子的大肠杆菌启动子序列 PglpF 的变体
<400> 18
gcggcacgcc ttgcagatta cggtttgcca cacttttcat ccttctcctg gtgacataat 60
ccacatcaat cgaaaatgtt aataaatttg ttgcgcgaat gatctaacaa acatgcatca 120
tgtacaatca gatggaataa atggcgcgat aacgctcatt ttatgacgag gcacacacat 180
tttaagttcg atatttctcg tttttgctcg ttaacgataa gtttacagca tgcctacaag 240
catcgtggag gtccgtgact ttcacgcata caacaaacat taaccaacta ggaaacagct 300
<210> 19
<211> 300
<212> DNA
<213> 人工序列
<220>
<223> PglpF_SD5, glpFKX 操纵子的大肠杆菌启动子序列 PglpF 的变体
<400> 19
gcggcacgcc ttgcagatta cggtttgcca cacttttcat ccttctcctg gtgacataat 60
ccacatcaat cgaaaatgtt aataaatttg ttgcgcgaat gatctaacaa acatgcatca 120
tgtacaatca gatggaataa atggcgcgat aacgctcatt ttatgacgag gcacacacat 180
tttaagttcg atatttctcg tttttgctcg ttaacgataa gtttacagca tgcctacaag 240
catcgtggag gtccgtgact ttcacgcata caacaaacat taaccaaccg agaaacagct 300
<210> 20
<211> 300
<212> DNA
<213> 人工序列
<220>
<223> PglpF_SD6, glpFKX 操纵子的大肠杆菌启动子序列PglpF的变体
<400> 20
gcggcacgcc ttgcagatta cggtttgcca cacttttcat ccttctcctg gtgacataat 60
ccacatcaat cgaaaatgtt aataaatttg ttgcgcgaat gatctaacaa acatgcatca 120
tgtacaatca gatggaataa atggcgcgat aacgctcatt ttatgacgag gcacacacat 180
tttaagttcg atatttctcg tttttgctcg ttaacgataa gtttacagca tgcctacaag 240
catcgtggag gtccgtgact ttcacgcata caacaaacat taaccaagag ctaaacagct 300
<210> 21
<211> 300
<212> DNA
<213> 人工序列
<220>
<223> PglpF_SD7, glpFKX 操纵子的大肠杆菌启动子序列 PglpF 的变体
<400> 21
gcggcacgcc ttgcagatta cggtttgcca cacttttcat ccttctcctg gtgacataat 60
ccacatcaat cgaaaatgtt aataaatttg ttgcgcgaat gatctaacaa acatgcatca 120
tgtacaatca gatggaataa atggcgcgat aacgctcatt ttatgacgag gcacacacat 180
tttaagttcg atatttctcg tttttgctcg ttaacgataa gtttacagca tgcctacaag 240
catcgtggag gtccgtgact ttcacgcata caacaaacat taaccaagag caaaacagct 300
<210> 22
<211> 300
<212> DNA
<213> 人工序列
<220>
<223> PglpF_SD8, glpFKX 操纵子的大肠杆菌启动子序列 PglpF 的变体
<400> 22
gcggcacgcc ttgcagatta cggtttgcca cacttttcat ccttctcctg gtgacataat 60
ccacatcaat cgaaaatgtt aataaatttg ttgcgcgaat gatctaacaa acatgcatca 120
tgtacaatca gatggaataa atggcgcgat aacgctcatt ttatgacgag gcacacacat 180
tttaagttcg atatttctcg tttttgctcg ttaacgataa gtttacagca tgcctacaag 240
catcgtggag gtccgtgact ttcacgcata caacaaacat taaccaagag aaaaacagct 300
<210> 23
<211> 300
<212> DNA
<213> 人工序列
<220>
<223> PglpF_SD9, glpFKX 操纵子的大肠杆菌启动子序列 PglpF 的变体
<400> 23
gcggcacgcc ttgcagatta cggtttgcca cacttttcat ccttctcctg gtgacataat 60
ccacatcaat cgaaaatgtt aataaatttg ttgcgcgaat gatctaacaa acatgcatca 120
tgtacaatca gatggaataa atggcgcgat aacgctcatt ttatgacgag gcacacacat 180
tttaagttcg atatttctcg tttttgctcg ttaacgataa gtttacagca tgcctacaag 240
catcgtggag gtccgtgact ttcacgcata caacaaacat taaccaaagg aaaaacagct 300
<210> 24
<211> 300
<212> DNA
<213> 人工序列
<220>
<223> PglpF_B29, glpFKX 操纵子的大肠杆菌启动子序列 PglpF 的变体
<400> 24
gcggcacgcc ttgcagatta cggtttgcca cacttttcat ccttctcctg gtgacataat 60
ccacatcaat cgaaaatgtt aataaatttg ttgcgcgaat gatctaacaa acatgcatca 120
tgtacaatca gatggaataa atggcgcgat aacgctcatt ttatgacgag gcacacacat 180
tttaagttcg atatttctcg tttttgctcg ttaacgattt aattacagca tgcctacaag 240
catcgtggag gtccgtgact ttcacgcata caacaaacat taaccaagga ggaaacagct 300
<210> 25
<211> 300
<212> DNA
<213> 人工序列
<220>
<223> PglpF_B29, glpFKX 操纵子的大肠杆菌启动子序列 PglpF 的变体
<400> 25
gcggcacgcc ttgcagatta cggtttgcca cacttttcat ccttctcctg gtgacataat 60
ccacatcaat cgaaaatgtt aataaatttg ttgcgcgaat gatctaacaa acatgcatca 120
tgtacaatca gatggaataa atggcgcgat aacgctcatt ttatgacgag gcacacacat 180
tttaagttcg atatttctcg tttttgctcg ttaacgatca gaatacagca tgcctacaag 240
catcgtggag gtccgtgact ttcacgcata caacaaacat taaccaagga ggaaacagct 300
<210> 26
<211> 107
<212> DNA
<213> 人工序列
<220>
<223> Plac_16UTR, 大肠杆菌 lac 操纵子启动子的变体
<400> 26
tgtgagttag ctcactcatt aggcacccca ggctttacac tttatgcttc cggctcgtat 60
gttgtgtgga attgtgagcg gataacaatt tcaaggagga aacagct 107
<210> 27
<211> 107
<212> DNA
<213> 大肠杆菌
<220>
<223> Plac, lac 操纵子启动子
<400> 27
tgtgagttag ctcactcatt aggcacccca ggctttacac tttatgcttc cggctcgtat 60
gttgtgtgga attgtgagcg gataacaatt tcacacagga aacagct 107
<210> 28
<211> 203
<212> DNA
<213> 人工序列
<220>
<223> PmglB_70UTR, 用于 mglBAC 的大肠杆菌启动子的变体
半乳糖/甲基-半乳糖苷酶转运蛋白
<400> 28
tgcgtcgcca ttctgtcgca acacgccaga atgcggcggc gatcactaac tcaacaaatc 60
aggcgatgta accgctttca atctgtgagt gatttcacag tatcttaaca atgtgatagc 120
tatgattgca ccgtgcctac aagcatcgtg gaggtccgtg actttcacgc atacaacaaa 180
cattaaccaa ggaggaaaca gct 203
<210> 29
<211> 203
<212> DNA
<213> 人工序列
<220>
<223> PmglB_70UTR_SD4,用于 mglBAC 的大肠杆菌启动子的变体;
半乳糖/甲基-半乳糖苷酶转运蛋白
<400> 29
tgcgtcgcca ttctgtcgca acacgccaga atgcggcggc gatcactaac tcaacaaatc 60
aggcgatgta accgctttca atctgtgagt gatttcacag tatcttaaca atgtgatagc 120
tatgattgca ccgtgcctac aagcatcgtg gaggtccgtg actttcacgc atacaacaaa 180
cattaaccaa ctaggaaaca gct 203
<210> 30
<211> 505
<212> PRT
<213> 肺炎克雷伯菌
<220>
<223> ScrY, 蔗糖孔蛋白, GeneBank ID CAA40657.1
<400> 30
Met Tyr Lys Lys Arg Lys Leu Ala Ile Leu Ile Ala Leu Leu Thr Gly
1 5 10 15
Thr Ala Ala Ala His Gly Gln Thr Asp Leu Asn Ser Ile Glu Ala Arg
20 25 30
Leu Ala Ala Leu Glu Lys Arg Leu Gln Asp Ala Glu Thr Arg Ala Ser
35 40 45
Thr Ala Glu Ser Arg Ala Ala Ser Ala Glu Gln Lys Val Gln Gln Leu
50 55 60
Thr Gln Gln Gln Gln Gln Thr Gln Ala Thr Thr Gln Gln Val Ala Arg
65 70 75 80
Arg Thr Thr Gln Leu Glu Glu Lys Ala Glu Arg Pro Gly Gly Phe Glu
85 90 95
Phe His Gly Tyr Ala Arg Ser Gly Val Ile Met Asn Asp Ser Ala Ala
100 105 110
Ser Thr Lys Ser Gly Ala Tyr Met Thr Pro Ala Gly Glu Thr Gly Gly
115 120 125
Ala Ile Gly Arg Leu Gly Asn Gln Ala Asp Thr Tyr Val Glu Met Asn
130 135 140
Leu Glu His Lys Gln Thr Leu Asp Asn Gly Ala Thr Thr Arg Phe Lys
145 150 155 160
Val Met Val Ala Asp Gly Gln Thr Thr Tyr Asn Asp Trp Thr Ala Ser
165 170 175
Ser Ser Asp Leu Asn Val Arg Gln Ala Phe Val Glu Leu Gly Asn Leu
180 185 190
Pro Thr Phe Glu Gly Pro Phe Lys Gly Ser Thr Leu Trp Ala Gly Lys
195 200 205
Arg Phe Asp Arg Asp Asn Phe Asp Ile His Trp Ile Asp Ser Asp Val
210 215 220
Val Phe Leu Ala Gly Thr Gly Gly Gly Ile Tyr Asp Val Lys Trp Asn
225 230 235 240
Asp Ser Leu Arg Ser Asn Phe Ser Leu Tyr Gly Arg Asn Phe Gly Asp
245 250 255
Ile Ala Asp Ser Ser Asn Ser Val Gln Asn Tyr Ile Val Ser Met Asn
260 265 270
Asn Phe Ala Gly Pro Val Gln Met Met Val Ser Gly Met Arg Ala Lys
275 280 285
Asp Asn Asp Asp Arg Gln Asp Ala Asn Gly Asn Leu Val Lys Gly Asp
290 295 300
Ala Ala Asn Thr Gly Val His Ala Leu Leu Gly Leu His Asn Glu Ser
305 310 315 320
Phe Tyr Gly Leu Arg Asp Gly Thr Ser Lys Thr Ala Leu Leu Tyr Gly
325 330 335
His Gly Leu Gly Ala Glu Val Lys Gly Ile Gly Ser Asp Gly Ala Leu
340 345 350
Arg Pro Gly Ala Asn Thr Trp Arg Phe Ala Ser Tyr Gly Thr Thr Pro
355 360 365
Leu Ser Asp Arg Trp Phe Ile Ala Pro Ala Val Leu Ala Gln Ser Ser
370 375 380
Lys Asp Arg Tyr Val Asp Gly Asp Ser Tyr Gln Trp Ala Thr Leu Asn
385 390 395 400
Leu Arg Leu Ile Gln Glu Val Thr Gln Asn Phe Ala Leu Ala Trp Glu
405 410 415
Gly Ser Tyr Gln Tyr Met Asp Leu Gln Pro Glu Gly Tyr Asn Asp Arg
420 425 430
His Ala Val Asn Gly Ser Phe Tyr Lys Leu Thr Phe Ala Pro Thr Phe
435 440 445
Lys Val Gly Ser Ile Gly Asp Phe Phe Ser Arg Pro Glu Ile Arg Phe
450 455 460
Tyr Thr Ser Trp Met Asp Trp Ser Lys Lys Leu Asp Asn Tyr Ala Asn
465 470 475 480
Asp Asp Ala Leu Gly Ser Asn Gly Phe Lys Ser Gly Gly Glu Trp Ser
485 490 495
Phe Gly Met Gln Met Glu Thr Trp Phe
500 505
<210> 31
<211> 456
<212> PRT
<213> 肺炎克雷伯菌
<220>
<223> ScrA, 蔗糖特异性酶 II, GeneBank ID: CAA40658.1
<400> 31
Met Asp Phe Glu Gln Ile Ser Arg Ser Leu Leu Pro Leu Leu Gly Gly
1 5 10 15
Lys Glu Asn Ile Ala Ser Ala Ala His Cys Ala Thr Arg Leu Arg Leu
20 25 30
Val Leu Val Asp Asp Ala Leu Ala Asp Gln Gln Ala Ile Gly Lys Ile
35 40 45
Asp Gly Val Lys Gly Cys Phe Arg Asn Ala Gly Gln Met Gln Ile Ile
50 55 60
Phe Gly Thr Gly Val Val Asn Lys Val Tyr Ala Ala Phe Ile Gln Ala
65 70 75 80
Ala Gly Ile Ser Glu Ser Ser Lys Ser Glu Ala Ala Asp Leu Ala Ala
85 90 95
Lys Lys Leu Asn Pro Phe Gln Arg Ile Ala Arg Leu Leu Ser Asn Ile
100 105 110
Phe Val Pro Ile Ile Pro Ala Ile Val Ala Ser Gly Leu Leu Met Gly
115 120 125
Leu Leu Gly Met Val Lys Thr Tyr Gly Trp Val Asp Pro Ser Asn Ala
130 135 140
Leu Tyr Ile Met Leu Asp Met Cys Ser Ser Ala Ala Phe Ile Ile Leu
145 150 155 160
Pro Ile Leu Ile Gly Phe Thr Ala Ala Arg Glu Phe Gly Gly Asn Pro
165 170 175
Tyr Leu Gly Ala Thr Leu Gly Gly Ile Leu Thr His Pro Ala Leu Thr
180 185 190
Asn Ala Trp Gly Val Ala Ala Gly Phe His Thr Met Asn Phe Phe Gly
195 200 205
Ile Glu Val Ala Met Ile Gly Tyr Gln Gly Thr Val Phe Pro Val Leu
210 215 220
Leu Ala Val Trp Phe Met Ser Met Val Glu Lys Arg Leu Arg Arg Val
225 230 235 240
Ile Pro Asp Ala Leu Asp Leu Ile Leu Thr Pro Phe Leu Thr Val Ile
245 250 255
Ile Ser Gly Phe Ile Ala Leu Leu Leu Ile Gly Pro Ala Gly Arg Ala
260 265 270
Leu Gly Asp Gly Ile Ser Phe Ile Leu Ser Thr Leu Ile Ser His Ala
275 280 285
Gly Trp Leu Ala Gly Leu Leu Phe Gly Gly Leu Tyr Ser Val Ile Val
290 295 300
Ile Thr Gly Ile His His Ser Phe His Ala Ile Glu Ala Gly Leu Leu
305 310 315 320
Gly Asn Pro Ser Ile Gly Val Asn Phe Leu Leu Pro Ile Trp Ala Met
325 330 335
Ala Asn Val Ala Gln Gly Gly Ala Cys Phe Ala Val Trp Phe Lys Thr
340 345 350
Lys Asp Ala Lys Ile Lys Ala Ile Thr Leu Pro Ser Ala Phe Ser Ala
355 360 365
Met Leu Gly Ile Thr Glu Ala Ala Ile Phe Gly Ile Asn Leu Arg Phe
370 375 380
Val Lys Pro Phe Ile Ala Ala Leu Val Gly Gly Ala Ala Gly Gly Ala
385 390 395 400
Trp Val Val Ser Met His Val Tyr Met Thr Ala Val Gly Leu Thr Ala
405 410 415
Ile Pro Gly Met Ala Ile Val Gln Ala Ser Ser Leu Leu Asn Tyr Ile
420 425 430
Ile Gly Met Ala Ile Ala Phe Ala Val Ala Phe Ala Leu Ser Leu Thr
435 440 445
Leu Lys Tyr Lys Thr Asp Ala Glu
450 455
<210> 32
<211> 466
<212> PRT
<213> 肠道沙门菌亚种肠型鼠伤寒血清型
Salmonella enterica subsp. enterica serovar Typhimurium
<220>
<223> ScrB, β-呋喃果糖苷酶, GeneBank ID: CAA47974.1
<400> 32
Met Ser Leu Pro Ser Arg Leu Pro Ala Ile Leu Gln Ala Val Met Gln
1 5 10 15
Gly Gln Pro Arg Ala Leu Ala Asp Ser His Tyr Pro Arg Trp His His
20 25 30
Ala Pro Val Thr Gly Leu Met Asn Asp Pro Asn Gly Phe Ile Glu Phe
35 40 45
Ala Gly Arg Tyr His Leu Phe Tyr Gln Trp Asn Pro Leu Ala Cys Asp
50 55 60
His Thr Phe Lys Cys Trp Ala His Trp Ser Ser Ile Asp Leu Leu His
65 70 75 80
Trp Gln His Glu Pro Ile Ala Leu Met Pro Asp Glu Glu Tyr Asp Arg
85 90 95
Asn Gly Cys Tyr Ser Gly Ser Ala Val Asp Asn Asn Gly Thr Leu Thr
100 105 110
Leu Cys Tyr Thr Gly Asn Val Lys Phe Ala Glu Gly Gly Arg Thr Ala
115 120 125
Trp Gln Cys Leu Ala Thr Glu Asn Ala Asp Gly Thr Phe Arg Lys Ile
130 135 140
Gly Pro Val Leu Pro Leu Pro Glu Gly Tyr Thr Gly His Val Arg Asp
145 150 155 160
Pro Lys Val Trp Arg His Glu Asp Leu Trp Tyr Met Val Leu Gly Ala
165 170 175
Gln Asp Arg Gln Lys Arg Gly Lys Val Leu Leu Phe Ser Ser Ala Asp
180 185 190
Leu His Gln Trp Thr Ser Met Gly Glu Ile Ala Gly His Gly Ile Asn
195 200 205
Gly Leu Asp Asp Val Gly Tyr Met Trp Glu Cys Pro Asp Leu Phe Pro
210 215 220
Leu Gly Asp Gln His Ile Leu Ile Cys Cys Pro Gln Gly Ile Ala Arg
225 230 235 240
Glu Glu Glu Cys Tyr Leu Asn Thr Tyr Pro Ala Val Trp Met Ala Gly
245 250 255
Glu Phe Asp Tyr Ala Ala Gly Ala Phe Arg His Gly Glu Leu His Glu
260 265 270
Leu Asp Ala Gly Phe Glu Phe Tyr Ala Pro Gln Thr Met Leu Thr Ser
275 280 285
Asp Gly Arg Arg Leu Leu Val Gly Trp Met Gly Val Pro Glu Gly Glu
290 295 300
Glu Met Leu Gln Pro Thr Leu Asn Asn Gly Trp Ile His Gln Met Thr
305 310 315 320
Cys Leu Arg Glu Leu Glu Phe Ile Asn Gly Gln Leu Tyr Gln Arg Pro
325 330 335
Leu Arg Glu Leu Ser Ala Leu Arg Gly Glu Ala Asn Gly Trp Ser Gly
340 345 350
Asn Ala Leu Pro Leu Ala Pro Met Glu Ile Asp Leu Gln Thr Arg Gly
355 360 365
Gly Asp Met Leu Ser Leu Asp Phe Gly Gly Val Leu Thr Leu Glu Cys
370 375 380
Asp Ala Ser Gly Leu Arg Leu Ala Arg Arg Ser Leu Ala Ser Asp Glu
385 390 395 400
Met His Tyr Arg Tyr Trp Arg Gly Asn Val Arg Ser Leu Arg Val Phe
405 410 415
Ile Asp Gln Ser Ser Val Glu Ile Phe Ile Asn Gly Gly Glu Gly Val
420 425 430
Met Ser Ser Arg Tyr Phe Pro Ala Cys Ser Gly Gln Leu Thr Phe Ser
435 440 445
Gly Ile Thr Pro Asp Ala Phe Cys Tyr Trp Pro Leu Arg Thr Cys Met
450 455 460
Val Glu
465
<210> 33
<211> 334
<212> PRT
<213> 肠道沙门菌亚种肠型鼠伤寒血清型
Salmonella enterica subsp. enterica serovar Typhimurium
<220>
<223> ScrR, 蔗糖抑制因子, GeneBank ID: CAA47975.1
<400> 33
Met Lys Thr Lys Arg Val Thr Ile Lys Asp Ile Ala Glu Gln Ala Gly
1 5 10 15
Val Ser Lys Ala Thr Ala Ser Leu Val Leu Asn Gly Arg Gly Lys Glu
20 25 30
Leu Arg Val Ala Gln Glu Thr Arg Glu Arg Val Leu Ser Ile Ala Arg
35 40 45
Lys His His Tyr Gln Pro Ser Ile His Ala Arg Ser Leu Arg Asn Asn
50 55 60
Arg Ser His Thr Ile Gly Leu Val Val Pro Glu Ile Thr Asn His Gly
65 70 75 80
Phe Ala Val Phe Ala His Glu Leu Glu Met Leu Cys Arg Glu Ala Gly
85 90 95
Val Gln Leu Leu Ile Ser Cys Thr Asp Glu Asn Pro Gly Gln Glu Ser
100 105 110
Val Val Val Asn Asn Met Ile Ala Arg Gln Val Asp Gly Met Ile Val
115 120 125
Ala Ser Cys Met His Asn Asp Ala Asp Tyr Leu Lys Leu Ser Gln Gln
130 135 140
Leu Pro Val Val Leu Phe Asp Arg Cys Pro Asn Glu Ser Ala Leu Pro
145 150 155 160
Leu Val Met Thr Asp Ser Ile Thr Pro Thr Ala Glu Leu Ile Ser Arg
165 170 175
Ile Ala Pro Gln His Ser Asp Glu Phe Trp Phe Leu Gly Gly Gln Ala
180 185 190
Arg Leu Ser Pro Ser Arg Asp Arg Leu Thr Gly Phe Thr Gln Gly Leu
195 200 205
Ala Gln Ala Gly Ile Ala Leu Arg Pro Glu Trp Val Ile Asn Gly Asn
210 215 220
Tyr His Pro Ser Ser Gly Tyr Glu Met Phe Ala Ala Leu Cys Ala Arg
225 230 235 240
Leu Gly Arg Pro Pro Lys Ala Leu Phe Thr Ala Ala Cys Gly Leu Leu
245 250 255
Glu Gly Val Leu Arg Tyr Met Ser Gln His His Leu Leu Asp Ser Asp
260 265 270
Ile His Leu Thr Ser Phe Asp Asp His Tyr Leu Tyr Asp Ser Leu Ser
275 280 285
Leu Arg Ile Asp Thr Val Gln Gln Asp Asn Arg Gln Leu Ala Trp His
290 295 300
Cys Tyr Asp Leu Ile Ser Gln Leu Ile Glu Gly Asp Thr Pro Glu Thr
305 310 315 320
Leu Gln Arg Tyr Leu Pro Ala Thr Leu Gln Phe Arg His Gln
325 330
<210> 34
<211> 483
<212> PRT
<213> 鸡禽杆菌 Avibacterium gallinarum
<220>
<223> SacC_AgaI, 糖苷水解酶家族 32 蛋白, GeneBank ID:
WP_103853210.1
<400> 34
Met Ile Ile Phe Asn Glu Gly Lys Tyr Lys Ser Leu Tyr Ala Ala Glu
1 5 10 15
Gln Gly Glu Leu Glu Lys Ile Ala Gln Thr Val Ala Gln Asp Gln Asp
20 25 30
Phe Arg Pro Val Tyr His Leu Ala Pro Pro Thr Gly Leu Leu Asn Asp
35 40 45
Pro Asn Gly Leu Ile Phe Asp Gly Glu Lys Tyr His Leu Phe Tyr Gln
50 55 60
Trp Tyr Pro Phe Asp Ala Leu His Gly Met Lys His Trp Gln His Phe
65 70 75 80
Ile Thr Gln Asp Phe Lys Gln Phe Ser Gln Ala Asp Leu Leu Val Pro
85 90 95
Cys Glu Leu Tyr Glu Ser His Gly Cys Tyr Ser Gly Gly Ala Val Lys
100 105 110
Ile Gly Asp Gln Ile Ala Val Phe Tyr Thr Gly Asn Thr Arg Arg Pro
115 120 125
Ser Asp Asn Gln Arg Val Pro Tyr Gln Asn Leu Ala Ile Phe Ser Lys
130 135 140
Asp Gly Lys Leu Leu Ser Lys Arg Pro Leu Ile Glu Gln Ala Pro Gln
145 150 155 160
Gly Tyr Thr Glu His Val Arg Asp Pro Lys Pro Phe Leu Thr Lys Asp
165 170 175
Gly Lys Ile Arg Phe Ile Cys Gly Ala Gln Arg Glu Asn Leu Thr Gly
180 185 190
Thr Ala Leu Val Phe Glu Met Asp Asn Leu Ala Asp Thr Pro Arg Leu
195 200 205
Leu Gly Glu Leu Ala Leu Pro Ala Phe Asp Asn Gln Gly Val Phe Met
210 215 220
Trp Glu Cys Pro Asp Leu Ser Gln Met Gly Asp Lys Ser Leu Phe Ile
225 230 235 240
Trp Ser Pro Gln Gly Lys Ala Arg Glu Leu Glu Gln Tyr Gln Asn Asn
245 250 255
Tyr His Ala Val Tyr Ala Leu Gly Glu Leu Ala Asp Arg Gln Phe His
260 265 270
Ala Glu Gln Ile Ala Glu Leu Asp Gln Gly Phe Asp Phe Tyr Ala Pro
275 280 285
Gln Thr Phe Ser Gly Thr Gln Thr Met Leu Leu Gly Trp Val Gly Leu
290 295 300
Pro Asp Leu Ser Tyr Pro Thr Asp Leu Tyr Lys Trp His Ser Met Leu
305 310 315 320
Ser Met Pro Arg Gln Leu Arg Leu Gln Asp Gly Lys Ile Tyr Gln Gln
325 330 335
Pro Ile Glu Asn Ile Tyr Lys Asn Leu Thr Ala Leu Gln Ser Ile Thr
340 345 350
Val Glu Lys Glu Ala Glu Ile Ala Asp Leu Asp Arg Ala Tyr Leu Lys
355 360 365
Phe Asp Ala Asn Ala Gln Pro Phe Ser Leu Lys Phe Phe Asn Asn Ala
370 375 380
Gln Asn Gln Arg Leu Ile Leu Ser Tyr Asp Gly Glu Met Leu Cys Leu
385 390 395 400
Asp Arg Ser Gln Thr Glu Gln Thr Asp Ser Met Lys Ser Phe Gly Asp
405 410 415
Lys Arg Tyr Cys Arg Ile Glu Asp Leu Arg Gln Val Glu Ile Phe Phe
420 425 430
Asp Arg Ser Val Ala Glu Ile Phe Leu Asn Gln Gly Glu Lys Ala Met
435 440 445
Thr Ser Arg Phe Phe Ile Cys Ala Arg Glu Asn Gln Leu Cys Thr Asp
450 455 460
Lys Pro Leu Thr Leu Gln Val Gly Tyr Pro Lys Lys Ile Glu Val Asp
465 470 475 480
Tyr Thr Lys
<210> 35
<211> 548
<212> PRT
<213> 球形节杆菌Arthrobacter globiformis
<220>
<223> Bff, β-呋喃果糖苷酶蛋白, GeneBank ID: BAD18121.1
<400> 35
Met Glu Arg Thr Cys Ile Thr Val Arg Ala Ile Val Arg Phe His Ile
1 5 10 15
Glu Gln Arg Gln Thr Ile Val Asn Lys Gln Arg Thr Lys Arg Gly Ile
20 25 30
Leu Thr Ala Ala Leu Ser Ile Gly Ala Leu Gly Ala Thr Leu Ile Ser
35 40 45
Gly Pro Ala Val Ala Ala Thr Asp Ala Ala Pro Gly Phe Pro Gln Pro
50 55 60
Thr Glu His Thr Gln Lys Ala Tyr Ser Pro Thr Asp Asn Phe Thr Ser
65 70 75 80
Arg Trp Thr Arg Ala Asp Ala Lys Gln Leu Lys Ala Met Ser Asp Pro
85 90 95
Asp Ala Gly Ser Arg Glu Asn Ser Met Pro Thr Glu Tyr Thr Met Pro
100 105 110
Thr Val Ser Gln Asp Phe Pro Asp Met Ser Asn Glu Lys Val Trp Val
115 120 125
Trp Asp Thr Trp Pro Leu Ile Asp Glu Asn Ala Asn Gln Tyr Ser Val
130 135 140
Asn Gly Gln Glu Ile Ile Phe Ser Leu Val Ala Asp Arg Lys Leu Gly
145 150 155 160
Phe Asp Glu Arg His Gln Tyr Ala Arg Ile Gly Tyr Phe Tyr Arg Pro
165 170 175
Ala Gly Ile Pro Ala Asp Glu Arg Pro Glu Asp Gly Gly Trp Thr Tyr
180 185 190
Gly Gly Gln Val Phe Asp Glu Gly Val Thr Gly Lys Ile Phe Glu Asp
195 200 205
Gln Ser Phe Thr His Gln Thr Gln Trp Ser Gly Ser Ala Arg Val Ser
210 215 220
Lys Asn Gly Glu Ile Lys Leu Phe Phe Thr Asp Val Ala Phe Tyr Arg
225 230 235 240
Asp Lys Asp Gly Gln Asp Val Lys Pro Tyr Asp Ser Arg Ile Ala Leu
245 250 255
Ser Val Gly His Val His Ser Asn Lys Lys Gly Val Lys Leu Thr Gly
260 265 270
Phe Asn Lys Val Lys Glu Leu Leu Gln Ala Asp Gly Lys Asn Tyr Gln
275 280 285
Asn Ala Ala Gln Asn Ser Tyr Tyr Asn Phe Arg Asp Pro Phe Thr Phe
290 295 300
Val Asp Pro Ala His Pro Gly Glu Thr Tyr Met Val Phe Glu Gly Asn
305 310 315 320
Ser Ala Met Asp Arg Asp Glu Ala Lys Cys Thr Ala Glu Asp Leu Gly
325 330 335
Tyr Arg Glu Gly Glu Thr Asn Gly Glu Thr Val Glu Gln Val Asn Asn
340 345 350
Ser Gly Ala Thr Tyr Gln Ile Gly Asn Val Gly Leu Ala Arg Ala Lys
355 360 365
Asn Lys Ala Leu Thr Glu Trp Glu Phe Leu Pro Pro Ile Leu Ser Ala
370 375 380
Asn Cys Val Thr Asp Gln Thr Glu Arg Pro Gln Ile Tyr Met Gln Asp
385 390 395 400
Gly Lys Tyr Tyr Leu Phe Thr Ile Ser His Arg Ser Thr Phe Ala Thr
405 410 415
Gly Ile Asp Gly Pro Glu Gly Val Tyr Gly Phe Val Gly Asn Gly Ile
420 425 430
Arg Ser Asp Tyr Gln Pro Leu Asn Arg Gly Ser Gly Leu Ala Leu Gly
435 440 445
Ser Pro Thr Asn Leu Asn Phe Ala Ala Gly Thr Pro Phe Ala Pro Asp
450 455 460
Tyr Asn Gln His Pro Gly Gln Phe Gln Ala Tyr Ser His Tyr Val Met
465 470 475 480
Pro Gly Gly Leu Val Gln Ser Phe Ile Asp Thr Ile Gly Thr Lys Asp
485 490 495
Asn Phe Val Arg Gly Gly Thr Leu Gly Pro Thr Val Lys Leu Asn Ile
500 505 510
Lys Gly Asp Ser Ala Thr Val Asp Tyr Asn Tyr Gly Asp Asn Gly Leu
515 520 525
Gly Gly Trp Ala Asp Ile Pro Ala Asn Arg Glu Leu Lys Asn Ser Lys
530 535 540
Ala Val Ala Lys
545
<210> 36
<211> 152
<212> DNA
<213> 人工序列
<220>
<223> Pscr_SD1 启动子序列,肺炎克雷伯菌 Pscr 启动子的变体
<400> 36
ggttaacggc ccactttgct ggcgacatca caattcttaa accggtttag caatttttat 60
tttcaccgcg ttaccgacat gtttaccata tcaactaaac cggtttagca aacattagca 120
cactcactga tttacccaaa ttcgaaacag ct 152
<210> 37
<211> 152
<212> DNA
<213> 人工序列
<220>
<223> Pscr_SD7 启动子序列,肺炎克雷伯菌 Pscr 启动子的变体
<400> 37
ggttaacggc ccactttgct ggcgacatca caattcttaa accggtttag caatttttat 60
tttcaccgcg ttaccgacat gtttaccata tcaactaaac cggtttagca aacattagca 120
cactcactga tttacccaag agcaaaacag ct 152
<210> 38
<211> 387
<212> PRT
<213> 巴登鲁希拉菌Rouxiella badensis
<220>
<223> Bad MFS 转运蛋白
<400> 38
Met Ser Ser Arg Arg Leu Ser Ile Ile Phe Ala Thr Phe Leu Leu Val
1 5 10 15
Ser Phe Leu Thr Gly Ile Ala Gly Ala Leu Gln Ala Pro Thr Leu Ser
20 25 30
Leu Phe Leu Thr Asn Glu Val Lys Val Arg Pro Leu Trp Val Gly Leu
35 40 45
Phe Tyr Thr Val Asn Ala Leu Gly Gly Ile Val Ile Ser Phe Leu Leu
50 55 60
Ala Asn Tyr Ser Asp Lys Lys Gly Asp Arg Arg Lys Leu Leu Phe Phe
65 70 75 80
Cys Thr Leu Met Ala Ile Gly Asn Ser Leu Ile Phe Ala Tyr Ser Arg
85 90 95
Asp Tyr Leu Val Leu Ile Ser Val Gly Val Leu Leu Ala Ala Ile Gly
100 105 110
Asn Ala Ser Met Pro Gln Leu Phe Ala Leu Ala Arg Glu Tyr Ala Asp
115 120 125
Arg Ser Ala His Glu Val Val Met Phe Ser Ser Met Met Arg Ala Thr
130 135 140
Leu Ser Leu Ala Trp Val Leu Gly Pro Pro Ile Ser Phe Thr Leu Ala
145 150 155 160
Leu Asn Tyr Gly Phe Thr Leu Met Tyr Leu Cys Ala Ala Gly Val Phe
165 170 175
Ile Phe Ser Ala Leu Met Val Trp Phe Phe Leu Pro Ser Val Gly Arg
180 185 190
Ile Glu Gln Pro Val Asp Lys Val Val Val His Val Ser Ala Trp Lys
195 200 205
Asn Arg Asp Val Arg Leu Leu Phe Phe Ala Ser Leu Leu Met Trp Thr
210 215 220
Cys Asn Ile Met Tyr Ile Ile Asp Met Pro Leu Tyr Ile Thr Ser Asp
225 230 235 240
Leu Gly Leu Pro Glu Gly Leu Ala Gly Leu Leu Met Gly Ala Ala Ala
245 250 255
Gly Leu Glu Ile Pro Val Met Leu Ile Ala Gly Tyr Leu Val Lys Arg
260 265 270
Thr Gly Lys Arg Arg Leu Met Leu Cys Ala Ala Val Phe Gly Ile Leu
275 280 285
Phe Tyr Leu Gly Leu Val Leu Phe Gln Phe Lys Ala Ala Leu Met Ile
290 295 300
Leu Gln Leu Phe Asn Ala Ile Phe Ile Gly Ile Ile Ala Gly Ile Gly
305 310 315 320
Met Leu Tyr Phe Gln Asp Leu Met Pro Gly Arg Ala Gly Ser Ala Thr
325 330 335
Thr Leu Phe Thr Asn Ser Ile Ser Thr Gly Ala Ile Leu Ala Gly Val
340 345 350
Ile Gln Gly Thr Ile Val Gln Asn Phe Gly His Tyr Gln Val Tyr Trp
355 360 365
Met Ala Leu Ala Leu Ala Val Gly Ala Leu Val Leu Met Thr Arg Val
370 375 380
Lys Asn Val
385
<210> 39
<211> 394
<212> PRT
<213> Rosenbergiella nectarea
<220>
<223> Nec MFS 转运蛋白
<400> 39
Met Gln Ser Phe Thr Pro Pro Ala Pro Lys Gly Gly Asn Pro Val Phe
1 5 10 15
Met Met Phe Met Leu Val Thr Phe Phe Val Ser Ile Ala Gly Ala Leu
20 25 30
Gln Ala Pro Thr Leu Ser Leu Tyr Leu Ser Gln Glu Leu Ala Ala Lys
35 40 45
Pro Phe Met Val Gly Leu Phe Phe Thr Ile Asn Ala Val Thr Gly Ile
50 55 60
Ile Ile Ser Phe Ile Leu Ala Lys Arg Ser Asp Arg Lys Gly Asp Arg
65 70 75 80
Arg Arg Leu Leu Met Phe Cys Cys Ala Met Ala Ile Ala Asn Ala Leu
85 90 95
Met Phe Ala Phe Val Arg Gln Tyr Val Val Leu Ile Thr Leu Gly Leu
100 105 110
Ile Leu Ser Ala Leu Thr Ser Val Val Met Pro Gln Leu Phe Ala Leu
115 120 125
Ala Arg Glu Tyr Ala Asp Arg Thr Gly Arg Glu Val Val Met Phe Ser
130 135 140
Ser Val Met Arg Thr Gln Met Ser Leu Ala Trp Val Ile Gly Pro Pro
145 150 155 160
Ile Ser Phe Ala Leu Ala Leu Asn Tyr Gly Phe Ile Thr Leu Tyr Leu
165 170 175
Val Ala Ala Ala Leu Phe Leu Leu Ser Leu Ile Leu Ile Lys Thr Thr
180 185 190
Leu Pro Ser Val Pro Arg Leu Tyr Pro Ala Glu Asp Leu Ala Lys Ser
195 200 205
Ala Ala Ser Gly Trp Lys Arg Thr Asp Val Arg Phe Leu Phe Ala Ala
210 215 220
Ser Val Leu Met Trp Val Cys Asn Leu Met Tyr Ile Ile Asp Met Pro
225 230 235 240
Leu Tyr Ile Ser Lys Ser Leu Gly Met Pro Glu Ser Phe Ala Gly Val
245 250 255
Leu Met Gly Thr Ala Ala Gly Leu Glu Ile Pro Val Met Leu Leu Ala
260 265 270
Gly Tyr Leu Ala Lys Arg Val Gly Lys Arg Pro Leu Val Ile Val Ala
275 280 285
Ala Val Cys Gly Leu Ala Phe Tyr Pro Ala Met Leu Val Phe His Gln
290 295 300
Gln Thr Gly Leu Leu Ile Ile Gln Leu Leu Asn Ala Val Phe Ile Gly
305 310 315 320
Ile Val Ala Gly Leu Val Met Leu Trp Phe Gln Asp Leu Met Pro Gly
325 330 335
Lys Ala Gly Ala Ala Thr Thr Leu Phe Thr Asn Ser Val Ser Thr Gly
340 345 350
Met Ile Phe Ala Gly Leu Cys Gln Gly Leu Leu Ser Asp Leu Leu Gly
355 360 365
His Gln Ala Ile Tyr Val Leu Ala Thr Val Leu Met Val Ile Ala Leu
370 375 380
Leu Leu Leu Leu Arg Val Lys Glu Gln Ala
385 390
<210> 40
<211> 393
<212> PRT
<213> 伯氏耶尔森菌
<220>
<223> YberC MFS 转运蛋白
<400> 40
Met Lys Ser Ala Leu Thr Phe Ser Arg Arg Ile Asn Pro Val Phe Leu
1 5 10 15
Ala Phe Phe Val Val Ala Phe Leu Ser Gly Ile Ala Gly Ala Leu Gln
20 25 30
Ala Pro Thr Leu Ser Leu Phe Leu Ser Thr Glu Val Lys Val Arg Pro
35 40 45
Leu Trp Val Gly Leu Phe Tyr Thr Val Asn Ala Ile Ala Gly Ile Thr
50 55 60
Val Ser Phe Ile Leu Ala Lys Arg Ser Asp Ser Arg Gly Asp Arg Arg
65 70 75 80
Lys Leu Ile Met Val Cys Tyr Leu Met Ala Val Gly Asn Cys Leu Leu
85 90 95
Phe Ala Phe Asn Arg Asp Tyr Leu Thr Leu Ile Thr Ala Gly Val Leu
100 105 110
Leu Ala Ser Val Ala Asn Thr Ala Met Pro Gln Ile Phe Ala Leu Ala
115 120 125
Arg Glu Tyr Ala Asp Ser Ser Ala Arg Glu Val Val Met Phe Ser Ser
130 135 140
Ile Met Arg Ala Gln Leu Ser Leu Ala Trp Val Ile Gly Pro Pro Leu
145 150 155 160
Ser Phe Met Leu Ala Leu Asn Tyr Gly Phe Thr Leu Met Phe Ser Ile
165 170 175
Ala Ala Gly Ile Phe Val Leu Ser Ala Leu Val Val Trp Phe Ile Leu
180 185 190
Pro Ser Val Pro Arg Ala Glu Pro Val Val Asp Ala Pro Val Val Val
195 200 205
Gln Gly Ser Leu Phe Ala Asp Lys Asn Val Leu Leu Leu Phe Ile Ala
210 215 220
Ser Met Leu Met Trp Thr Cys Asn Thr Met Tyr Ile Ile Asp Met Pro
225 230 235 240
Leu Tyr Ile Thr Ala Ser Leu Gly Leu Pro Glu Arg Leu Ala Gly Leu
245 250 255
Leu Met Gly Thr Ala Ala Gly Leu Glu Ile Pro Ile Met Leu Leu Ala
260 265 270
Gly Tyr Ser Val Arg Tyr Phe Gly Lys Arg Lys Ile Met Leu Phe Ala
275 280 285
Val Leu Ala Gly Val Leu Phe Tyr Thr Gly Leu Val Leu Phe Lys Phe
290 295 300
Lys Thr Ala Leu Met Leu Leu Gln Ile Phe Asn Ala Ile Phe Ile Gly
305 310 315 320
Ile Val Ala Gly Ile Gly Met Leu Tyr Phe Gln Asp Leu Met Pro Gly
325 330 335
Arg Ala Gly Ala Ala Thr Thr Leu Phe Thr Asn Ser Ile Ser Thr Gly
340 345 350
Val Ile Leu Ala Gly Val Leu Gln Gly Gly Leu Thr Glu Thr Trp Gly
355 360 365
His Asp Ser Val Tyr Val Met Ala Met Val Leu Ser Ile Leu Ala Leu
370 375 380
Ile Ile Cys Ala Arg Val Arg Glu Ala
385 390
<210> 41
<211> 393
<212> PRT
<213> 弗氏耶尔森菌Yersinia frederiksenii
<220>
<223> Fred MFS 转运蛋白
<400> 41
Met Lys Ser Ala Leu Thr Phe Ser Arg Arg Ile Asn Pro Val Phe Leu
1 5 10 15
Ala Phe Phe Val Val Ala Phe Leu Ser Gly Ile Ala Gly Ala Leu Gln
20 25 30
Ala Pro Thr Leu Ser Leu Phe Leu Ser Thr Glu Val Lys Val Arg Pro
35 40 45
Leu Trp Val Gly Leu Phe Tyr Thr Val Asn Ala Ile Ala Gly Ile Thr
50 55 60
Val Ser Phe Val Leu Ala Lys Arg Ser Asp Leu Arg Gly Asp Arg Arg
65 70 75 80
Lys Leu Ile Leu Val Cys Tyr Leu Met Ala Val Gly Asn Cys Leu Leu
85 90 95
Phe Ala Phe Asn Arg Asp Tyr Leu Thr Leu Ile Thr Ala Gly Val Leu
100 105 110
Leu Ala Ala Val Ala Asn Thr Ala Met Pro Gln Ile Phe Ala Leu Ala
115 120 125
Arg Glu Tyr Ala Asp Asn Ser Ala Arg Glu Val Val Met Phe Ser Ser
130 135 140
Ile Met Arg Ala Gln Leu Ser Leu Ala Trp Val Ile Gly Pro Pro Leu
145 150 155 160
Ser Phe Met Leu Ala Leu Asn Tyr Gly Phe Thr Leu Met Phe Cys Ile
165 170 175
Ala Ala Gly Ile Phe Val Leu Ser Ala Leu Val Val Trp Phe Ile Leu
180 185 190
Pro Ser Val Gln Arg Ala Glu Pro Val Met Asp Ala Pro Thr Val Ala
195 200 205
Gln Gly Ser Leu Phe Ala Asp Lys Asp Val Leu Leu Leu Phe Ile Ala
210 215 220
Ser Met Leu Met Trp Thr Cys Asn Thr Met Tyr Ile Ile Asp Met Pro
225 230 235 240
Leu Tyr Ile Thr Ala Ser Leu Gly Leu Pro Glu Arg Leu Ala Gly Leu
245 250 255
Leu Met Gly Thr Ala Ala Gly Leu Glu Ile Pro Ile Met Leu Leu Ala
260 265 270
Gly Tyr Ser Val Arg Arg Phe Gly Lys Arg Lys Ile Met Leu Phe Ala
275 280 285
Val Leu Ala Gly Val Leu Phe Tyr Thr Gly Leu Val Leu Phe Lys Phe
290 295 300
Lys Ser Ala Leu Met Leu Leu Gln Ile Phe Asn Ala Ile Phe Ile Gly
305 310 315 320
Ile Val Ala Gly Ile Gly Met Leu Tyr Phe Gln Asp Leu Met Pro Gly
325 330 335
Arg Ala Gly Ala Ala Thr Thr Leu Phe Thr Asn Ser Ile Ser Thr Gly
340 345 350
Val Ile Leu Ala Gly Val Leu Gln Gly Val Leu Thr Glu Thr Trp Gly
355 360 365
His Asn Ser Val Tyr Val Met Ala Met Ile Leu Ala Ile Leu Ser Leu
370 375 380
Ile Ile Cys Ala Arg Val Arg Glu Ala
385 390
<210> 42
<211> 392
<212> PRT
<213> 泛菌 Pantoea vagans
<220>
<223> Vag MFS 转运蛋白
<400> 42
Met Lys Ser Leu Leu Thr Arg Lys Arg Arg Ile Asn Pro Val Phe Leu
1 5 10 15
Ala Phe Met Ala Ala Ser Phe Met Ile Gly Val Ala Gly Ala Leu Gln
20 25 30
Ala Pro Thr Leu Ser Leu Phe Leu Thr Arg Glu Val Gln Ala Arg Pro
35 40 45
Leu Trp Val Gly Leu Phe Phe Thr Val Asn Ala Ile Ala Gly Ile Val
50 55 60
Val Ser Met Leu Val Ala Lys Arg Ser Asp Ser Arg Gly Asp Arg Arg
65 70 75 80
Thr Leu Ile Leu Phe Cys Cys Ala Met Ala Phe Cys Asn Ala Leu Leu
85 90 95
Phe Ala Phe Thr Arg His Tyr Leu Thr Leu Ile Thr Leu Gly Val Leu
100 105 110
Leu Ser Ala Leu Ala Ser Val Ser Met Pro Gln Ile Phe Ala Leu Ala
115 120 125
Arg Glu Tyr Ala Asp Gln Ser Ala Arg Glu Ala Val Met Phe Ser Ser
130 135 140
Val Met Arg Ala Gln Leu Ser Leu Ala Trp Val Ile Gly Pro Pro Leu
145 150 155 160
Ser Phe Ala Leu Ala Leu Asn Phe Gly Phe Val Thr Leu Phe Leu Val
165 170 175
Ala Ala Ala Leu Phe Leu Val Cys Ile Leu Leu Ile Lys Phe Thr Leu
180 185 190
Pro Ser Val Pro Arg Ala Glu Pro Leu Met Arg Ser Gly Gly Met Pro
195 200 205
Leu Ser Gly Trp Arg Asp Arg Asp Val Arg Leu Leu Phe Ile Ala Ser
210 215 220
Val Thr Met Trp Thr Cys Asn Thr Met Tyr Ile Ile Asp Met Pro Leu
225 230 235 240
Tyr Ile Ser Val Thr Leu Gly Leu Pro Glu Lys Leu Ala Gly Leu Leu
245 250 255
Met Gly Thr Ala Ala Gly Leu Glu Ile Pro Val Met Leu Leu Ala Gly
260 265 270
His Tyr Ala Lys Arg Val Gly Lys Arg Asn Leu Met Leu Ile Ala Val
275 280 285
Ala Ala Gly Val Leu Phe Tyr Ala Gly Leu Ala Met Phe Ala Ser Gln
290 295 300
Thr Ala Leu Met Ala Leu Gln Leu Phe Asn Ala Val Phe Ile Gly Ile
305 310 315 320
Ile Ala Gly Ile Gly Met Leu Trp Phe Gln Asp Leu Met Pro Gly Arg
325 330 335
Pro Gly Ala Ala Thr Thr Met Phe Thr Asn Ser Ile Ser Thr Gly Met
340 345 350
Ile Leu Ala Gly Val Ile Gln Gly Thr Leu Ser Glu Arg Phe Gly His
355 360 365
Ile Ala Val Tyr Trp Leu Ala Leu Gly Leu Ala Val Ala Ala Phe Ala
370 375 380
Met Ser Ala Arg Val Lys Asn Val
385 390
<210> 43
<211> 398
<212> PRT
<213> 粘质沙雷氏菌 Serratia marcescens
<220>
<223> Marc MFS 转运蛋白
<400> 43
Met Gln Arg Leu Ser Arg Leu Ser Leu Arg Ile Asn Pro Ile Phe Ala
1 5 10 15
Ala Phe Leu Leu Ile Ala Phe Leu Ser Gly Ile Ala Gly Ala Leu Leu
20 25 30
Thr Pro Thr Leu Ser Leu Phe Leu Thr Thr Glu Val Lys Val Arg Pro
35 40 45
Leu Trp Val Gly Leu Phe Tyr Thr Ala Asn Ala Val Ala Gly Ile Val
50 55 60
Val Ser Phe Leu Leu Ala Lys Arg Ser Asp Thr Arg Gly Asp Arg Arg
65 70 75 80
Arg Leu Ile Leu Leu Cys Cys Leu Met Ala Val Gly Asn Cys Leu Leu
85 90 95
Phe Ala Phe Asn Arg Asp Tyr Leu Thr Leu Ile Thr Ala Gly Val Leu
100 105 110
Met Ser Ala Val Ala Asn Thr Ala Met Pro Gln Ile Phe Ala Leu Ala
115 120 125
Arg Glu Tyr Ala Asp Ser Glu Ala Arg Glu Val Val Met Phe Ser Ser
130 135 140
Val Met Arg Ala Gln Leu Ser Leu Ala Trp Val Ile Gly Pro Pro Leu
145 150 155 160
Ser Phe Ala Leu Ala Leu Asn Tyr Gly Phe Thr Val Met Phe Leu Ile
165 170 175
Ala Ala Val Thr Phe Ala Val Cys Val Leu Leu Val Gly Phe Met Leu
180 185 190
Pro Ser Val Pro Arg Ala Ala Glu Asn Glu Gly Leu Gln Gly Gly Val
195 200 205
Ser Ala Pro Ile Ala Pro Ala Ser Ala Trp Arg Asn Arg Asp Val Arg
210 215 220
Leu Leu Phe Ile Ala Ser Met Leu Met Trp Thr Cys Asn Thr Leu Tyr
225 230 235 240
Ile Ile Asp Met Pro Leu Tyr Ile Thr Ala Asp Leu Gly Leu Pro Glu
245 250 255
Gly Leu Ala Gly Val Leu Met Gly Thr Ala Ala Gly Leu Glu Ile Pro
260 265 270
Ala Met Leu Leu Ala Gly Tyr Tyr Val Lys Arg Phe Gly Lys Arg Asn
275 280 285
Met Met Leu Leu Ala Val Val Ala Gly Val Leu Phe Tyr Leu Gly Leu
290 295 300
Thr Val Leu Glu Ser Lys Pro Ala Leu Ile Ala Leu Gln Leu Leu Asn
305 310 315 320
Ala Val Phe Ile Gly Ile Val Ala Gly Ile Gly Met Leu Tyr Phe Gln
325 330 335
Asp Leu Met Pro Gly Arg Pro Gly Ala Ala Thr Thr Leu Phe Thr Asn
340 345 350
Ser Ile Ser Thr Gly Val Ile Leu Ala Gly Val Leu Gln Gly Ala Leu
355 360 365
Val Glu Asn Leu Gly His Gly Ser Val Tyr Trp Met Ala Ala Leu Leu
370 375 380
Ala Leu Ala Ala Leu Gly Met Ser Ala Lys Val Arg Glu Val
385 390 395
<210> 44
<211> 759
<212> DNA
<213> 大肠杆菌
<220>
<223> glpR 基因
<400> 44
atgaaacaaa cacaacgtca caacggtatt atcgaactgg ttaaacagca gggttatgtc 60
agtaccgaag agctggtaga gcatttctcc gtcagcccgc agactattcg ccgcgacctc 120
aatgagctgg cggagcaaaa cctgatcctg cgccatcatg gcggtgcggc gctgccttcc 180
agttcggtta acacgccgtg gcacgatcgc aaggccaccc agaccgaaga aaaagagcgc 240
atcgcccgca aagtggcgga gcaaatcccc aatggctcga cgctgtttat cgatatcggc 300
accacgccgg aagcggtagc gcacgcactg ctcaatcaca gcaatttgcg cattgtcacc 360
aacaatctca acgttgctaa cacgttgatg gtaaaagaag attttcgcat cattctcgcc 420
ggtggcgaat tacgcagccg cgatggcggg atcattggcg aagcgacgct cgattttatc 480
tcccagtccc gccttgattt cggcattctg gggataagcg gcatcgatag cgacggctcg 540
ctgctggagt tcgattacca cgaagttcgc accaaacgcg ccattattga gaactcgcgc 600
cacgttatgc tggttgtcga tcactcgaaa tttggccgta acgcgatggt caatatgggc 660
agcatcagca tggtagatgc cgtctacacc gacgccccgc cgccagtaag cgtgatgcag 720
gtgctgacgg accaccatat tcaactggag ctgtgctga 759
<210> 45
<211> 6706
<212> DNA
<213> 大肠杆菌
<220>
<223> CA 基因簇
atgtcaaaag tcgctctcat caccggtgta accggacaag acggttctta cctggcagag 60
tttctgctgg aaaaaggtta cgaggtgcat ggtattaagc gtcgcgcatc gtcattcaac 120
accgagcgcg tggatcacat ttatcaggat ccgcacacct gcaacccgaa attccatctg 180
cattatggcg acctgagtga tacctctaac ctgacgcgca ttttgcgtga agtacagccg 240
gatgaagtgt acaacctggg cgcaatgagc cacgttgcgg tctcttttga gtcaccagaa 300
tataccgctg acgtcgacgc gatgggtacg ctgcgcctgc tggaggcgat ccgcttcctc 360
ggtctggaaa agaaaactcg tttctatcag gcttccacct ctgaactgta tggtctggtg 420
caggaaattc cgcagaaaga gaccacgccg ttctacccgc gatctccgta tgcggtcgcc 480
aaactgtacg cctactggat caccgttaac taccgtgaat cctacggcat gtacgcctgt 540
aacggaattc tcttcaacca tgaatccccg cgccgcggcg aaaccttcgt tacccgcaaa 600
atcacccgcg caatcgccaa catcgcccag gggctggagt cgtgcctgta cctcggcaat 660
atggattccc tgcgtgactg gggccacgcc aaagactacg taaaaatgca gtggatgatg 720
ctgcagcagg aacagccgga agatttcgtt atcgcgaccg gcgttcagta ctccgtgcgt 780
cagttcgtgg aaatggcggc agcacagctg ggcatcaaac tgcgctttga aggcacgggc 840
gttgaagaga agggcattgt ggtttccgtc accgggcatg acgcgccggg cgttaaaccg 900
ggtgatgtga ttatcgctgt tgacccgcgt tacttccgtc cggctgaagt tgaaacgctg 960
ctcggcgacc cgaccaaagc gcacgaaaaa ctgggctgga aaccggaaat caccctcaga 1020
gagatggtgt ctgaaatggt ggctaatgac ctcgaagcgg cgaaaaaaca ctctctgctg 1080
aaatctcacg gctacgacgt ggcgatcgcg ctggagtcat aagcatgagt aaacaacgag 1140
tttttattgc tggtcatcgc gggatggtcg gttccgccat caggcggcag ctcgaacagc 1200
gcggtgatgt ggaactggta ttacgcaccc gcgacgagct gaacctgctg gacagccgcg 1260
ccgtgcatga tttctttgcc agcgaacgta ttgaccaggt ctatctggcg gcggcgaaag 1320
tgggcggcat tgttgccaac aacacctatc cggcggattt catctaccag aacatgatga 1380
ttgagagcaa catcattcac gccgcgcatc agaacgacgt gaacaaactg ctgtttctcg 1440
gatcgtcctg catctacccg aaactggcaa aacagccgat ggcagaaagc gagttgttgc 1500
agggcacgct ggagccgact aacgagcctt atgctattgc caaaatcgcc gggatcaaac 1560
tgtgcgaatc atacaaccgc cagtacggac gcgattaccg ctcagtcatg ccgaccaacc 1620
tgtacgggcc acacgacaac ttccacccga gtaattcgca tgtgatccca gcattgctgc 1680
gtcgcttcca cgaggcgacg gcacagaatg cgccggacgt ggtggtatgg ggcagcggta 1740
caccgatgcg cgaatttctg cacgtcgatg atatggcggc ggcgagcatt catgtcatgg 1800
agctggcgca tgaagtctgg ctggagaaca cccagccgat gttgtcgcac attaacgtcg 1860
gcacgggcgt tgactgcact atccgcgagc tggcgcaaac catcgccaaa gtggtgggtt 1920
acaaaggccg ggtggttttt gatgccagca aaccggatgg cacgccgcgc aaactgctgg 1980
atgtgacgcg cctgcatcag cttggctggt atcacgaaat ctcactggaa gcggggcttg 2040
ccagcactta ccagtggttc cttgagaatc aagaccgctt tcgggggtaa tgatgttttt 2100
acgtcaggaa gactttgcca cggtagtgcg ctccactccg cttgtctctc tcgactttat 2160
tgtcgagaac agtcgcggcg agtttctgct tggcaaaaga accaaccgcc cggcgcaggg 2220
ttactggttt gtgccgggag ggcgcgtgca gaaagacgaa acgctggaag ccgcatttga 2280
gcggctgacg atggcggaac tggggctgcg tttgccgata acagcaggcc agttttacgg 2340
tgtctggcag cacttttatg acgataactt ctctggcacg gatttcacca ctcactatgt 2400
ggtgctcggt tttcgcttca gagtatcgga agaagagctg ttactgccgg atgagcagca 2460
tgacgattac cgctggctga cgtcggacgc gctgctcgcc agtgataatg ttcatgctaa 2520
cagccgcgcc tattttctcg ctgagaagcg taccggagta cccggattat gaaaatactg 2580
gtctacggca ttaactactc gccggagtta accggcatcg gcaaatacac cggcgagatg 2640
gtggaatggc tggcggcaca aggtcatgag gtgcgggtca ttaccgcacc gccttactac 2700
ccgcaatggc aggtgggcga gaactattcc gcctggcgct acaaacgaga agagggggcc 2760
gccacggtgt ggcgctgccc gctgtatgtg ccaaaacagc cgagcaccct gaaacgcctg 2820
ttgcatctgg gcagttttgc cgtcagcagt ttctttccgc tgatggcgca acgtcgctgg 2880
aagccggatc gcattattgg cgtggtgcca acgctgtttt gcgcgccggg aatgcgcctg 2940
ctggcgaaac tctctggtgc gcgtaccgtg ctgcatattc aggattacga agtggacgcc 3000
atgctggggc tgggccttgc cggaaaaggc aaaggcggca aagtggcaca gctggcaacg 3060
gcgttcgaac gtagcggact gcataacgtc gataacgtct ccacgatttc gcgttcgatg 3120
atgaataaag ccatcgaaaa aggcgtggcg gcggaaaacg tcatcttctt ccccaactgg 3180
tcggaaattg cccgttttca gcatgttgca gatgccgatg ttgatgccct tcgtaaccag 3240
cttgacctgc cggataacaa aaaaatcatt ctttactccg gcaatattgg tgaaaagcag 3300
gggctggaaa acgttattga agctgccgat cgtctgcgcg atgaaccgct gatttttgcc 3360
attgtcgggc agggcggcgg caaagcgcgg ctggaaaaaa tggcgcagca gcgtggactg 3420
cgcaacatgc aatttttccc gctgcaatcg tatgacgctt tacccgcact gctgaagatg 3480
ggcgattgcc atctggtggt gcaaaaacgc ggcgcggcag atgccgtatt gccgtcgaaa 3540
ctgaccaata ttctggcagt aggcggtaac gcggtgatta ctgctgaagc ctacacagaa 3600
ctggggcagc tttgcgaaac ctttccgggc attgcggttt gcgttgaacc ggaatcggtc 3660
gaggcgctgg tggcggggat ccgtcaggcg ctcctgctgc ccaaacacaa cacggtggca 3720
cgtgaatatg ccgaacgcac gctcgataaa gagaacgtgt tacgtcaatt tataaatgat 3780
attcggggat aattatggcg cagtcgaaac tctatccagt tgtgatggca ggtggctccg 3840
gtagccgctt atggccgctt tcccgcgtac tttatcccaa gcagttttta tgcctgaaag 3900
gcgatctcac catgctgcaa accaccatct gccgcctgaa cggcgtggag tgcgaaagcc 3960
cggtggtgat ttgcaatgag cagcaccgct ttattgtcgc ggaacagctg cgtcaactga 4020
acaaacttac cgagaacatt attctcgaac cggcagggcg aaacacggca cctgccattg 4080
cgctggcggc gctggcggca aaacgtcata gcccggagag cgacccgtta atgctggtat 4140
tggcggcgga tcatgtgatt gccgatgaag acgcgttccg tgccgccgtg cgtaatgcca 4200
tgccatatgc cgaagcgggc aagctggtga ccttcggcat tgtgccggat ctaccagaaa 4260
ccggttatgg ctatattcgt cgcggtgaag tgtctgcggg tgagcaggat atggtggcct 4320
ttgaagtggc gcagtttgtc gaaaaaccga atctggaaac cgctcaggcc tatgtggcaa 4380
gcggcgaata ttactggaac agcggtatgt tcctgttccg cgccggacgc tatctcgaag 4440
aactgaaaaa atatcgcccg gatatcctcg atgcctgtga aaaagcgatg agcgccgtcg 4500
atccggatct caattttatt cgcgtggatg aagaagcgtt tctcgcctgc ccggaagagt 4560
cggtggatta cgcggtcatg gaacgtacgg cagatgctgt tgtggtgccg atggatgcgg 4620
gctggagcga tgttggctcc tggtcttcat tatgggagat cagcgcccac accgccgagg 4680
gcaacgtttg ccacggcgat gtgattaatc acaaaactga aaacagctat gtgtatgctg 4740
aatctggcct ggtcaccacc gtcggggtga aagatctggt agtggtgcag accaaagatg 4800
cggtgctgat tgccgaccgt aacgcggtac aggatgtgaa aaaagtggtc gagcagatca 4860
aagccgatgg tcgccatgag catcgggtgc atcgcgaagt gtatcgtccg tggggcaaat 4920
atgactctat cgacgcgggc gaccgctacc aggtgaaacg catcaccgtg aaaccgggcg 4980
agggcttgtc ggtacagatg caccatcacc gcgcggaaca ctgggtggtt gtcgcgggaa 5040
cggcaaaagt caccattgat ggtgatatca aactgcttgg tgaaaacgag tccatttata 5100
ttccgctggg ggcgacgcat tgcctggaaa acccggggaa aattccgctc gatttaattg 5160
aagtgcgctc cggctcttat ctcgaagagg atgatgtggt gcgtttcgcg gatcgctacg 5220
gacgggtgta aacgtcgcat caggcaatga atgcgaaacc gcggtgtaaa taacgacaaa 5280
aataaaattg gccgcttcgg tcagggccaa ctattgcctg aaaaagggta acgatatgaa 5340
aaaattaacc tgctttaaag cctatgatat tcgcgggaaa ttaggcgaag aactgaatga 5400
agatatcgcc tggcgcattg gtcgcgccta tggcgaattt ctcaaaccga aaaccattgt 5460
gttaggcggt gatgtccgcc tcaccagcga aaccttaaaa ctggcgctgg cgaaaggttt 5520
acaggatgcg ggcgttgacg tgctggatat tggtatgtcc ggcaccgaag agatctattt 5580
cgccacgttc catctcggcg tggatggcgg cattgaagtt accgccagcc ataatccgat 5640
ggattataac ggcatgaagc tggttcgcga gggggctcgc ccgatcagcg gagataccgg 5700
actgcgcgac gtccagcgtc tggctgaagc caacgacttt cctcccgtcg atgaaaccaa 5760
acgcggtcgc tatcagcaaa tcaacctgcg tgacgcttac gttgatcacc tgttcggtta 5820
tatcaatgtc aaaaacctca cgccgctcaa gctggtgatc aactccggga acggcgcagc 5880
gggtccggtg gtggacgcca ttgaagcccg ctttaaagcc ctcggcgcgc ccgtggaatt 5940
aatcaaagtg cacaacacgc cggacggcaa tttccccaac ggtattccta acccactact 6000
gccggaatgc cgcgacgaca cccgcaatgc ggtcatcaaa cacggcgcgg atatgggcat 6060
tgcttttgat ggcgattttg accgctgttt cctgtttgac gaaaaagggc agtttattga 6120
gggctactac attgtcggcc tgttggcaga agcattcctc gaaaaaaatc ccggcgcgaa 6180
gatcatccac gatccacgtc tctcctggaa caccgttgat gtggtgactg ccgcaggtgg 6240
cacgccggta atgtcgaaaa ccggacacgc ctttattaaa gaacgtatgc gcaaggaaga 6300
cgccatctat ggtggcgaaa tgagcgccca ccattacttc cgtgatttcg cttactgcga 6360
cagcggcatg atcccgtggc tgctggtcgc cgaactggtg tgcctgaaag ataaaacgct 6420
gggcgaactg gtacgcgacc ggatggcggc gtttccggca agcggtgaga tcaacagcaa 6480
actggcgcaa cccgttgagg cgattaaccg cgtggaacag cattttagcc gtgaggcgct 6540
ggcggtggat cgcaccgatg gcatcagcat gacctttgcc gactggcgct ttaacctgcg 6600
cacctccaat accgaaccgg tggtgcgcct gaatgtggaa tcgcgcggtg atgtgccgct 6660
gatggaagcg cgaacgcgaa ctctgctgac gttgctgaac gagtaa

Claims (25)

1.一种用于产生以LNFP-I和LNT为主要HMO的人乳寡糖(HMO)共混物的方法,所述方法包括以下步骤:
a)提供能够产生HMO的遗传工程细胞,其中所述细胞表达
i)如SEQ ID NO:1所示的异源β-1,3-N-乙酰基-葡糖胺基-转移酶蛋白质或其氨基酸序列与SEQ ID NO:1具有至少80%同一性的功能同源物;和
ii)如SEQ ID NO:2所示的异源β-1,3-半乳糖基转移酶蛋白质或其氨基酸序列与SEQID NO:2具有至少80%同一性的功能同源物;和
iii)如SEQ ID NO:3或8所示的异源α-1,2-岩藻糖基转移酶蛋白质或其氨基酸序列与SEQ ID NO:3或8中任一个具有至少80%同一性的功能同源物,和
iv)如SEQ ID NO:4所示的乳糖通透酶蛋白质,或其氨基酸序列与SEQ ID NO:4具有至少80%同一性的功能同源物,和
v)功能性荚膜异多糖酸基因簇,
并且还包含
vi)用于控制i)、ii)、iii)和v)的表达的天然或异源调控元件,和
vii)用于增加iv)的表达的天然或异源调控元件,和/或
viii)非功能性或缺乏基因产物,所述基因产物在正常情况下结合并抑制由vi)-vii)驱动的表达
b)在合适的细胞培养基中培养根据(a)的细胞以产生所述HMO共混物;和
c)收获步骤(b)中产生的HMO共混物。
2.根据权利要求1所述的方法,其中iii)中的异源α-1,2-岩藻糖基转移酶对应于SEQID NO:3或其氨基酸序列与SEQ ID NO:3任一个具有至少80%同一性的功能同源物。
3.根据权利要求1或2所述的方法,其中i)-iv)中蛋白质的任一种的过表达通过增加编码所述蛋白质的基因的拷贝数来提供。
4.根据前述权利要求中任一项所述的方法,其中通过用感兴趣的启动子交换天然启动子和/或增加编码所述蛋白质的荚膜异多糖酸基因的拷贝数,或附加型表达荚膜异多糖酸基因簇或从染色体上的不同基因座表达它,来调节所述荚膜异多糖酸基因簇的表达。
5.根据前述权利要求中任一项所述的方法,其中用于控制和增加i)-v)的表达的调控元件是启动子。
6.根据前述权利要求中任一项所述的方法,其中启动子序列选自SEQ ID NO:13[PglpF]、SEQ ID NO:12[PgatY_70UTR]、SEQ ID NO:27[Plac]、SEQ ID NO:28[PmglB_70UTR]、SEQ ID NO:11[Pscr]、或其变体。
7.根据前述权利要求中任一项所述的方法,其中启动子序列选自PglpF(SEQ ID NO:13)、PglpF_SD10(SEQ ID NO:15)、PglpF_SD8(SEQ ID NO:22)、PglpF_SD5(SEQ ID NO:19)、PglpF_SD4(SEQ ID NO:18)、PgatY_70UTR(SEQ ID NO:12)、PmglB_70UTR(SEQ ID NO:9)和PmglB_70UTR_SD4(SEQ ID NO:9)。
8.根据前述权利要求中任一项所述的方法,其中vii)中的基因产物是转录阻遏物GlpR。
9.根据前述权利要求中任一项所述的方法,其中细胞还包含编码糖转运蛋白YberC和/或Nec的重组核酸序列。
10.根据前述权利要求中任一项所述的方法,其中在步骤(b)中培养遗传工程细胞期间发酵培养基中的乳糖水平为30g/L至80g/L。
11.根据前述权利要求中任一项所述的方法,其中LNFP-I和LNT是主要的HMO,其中LNT和LNFP-I组合的摩尔%高于总HMO的75%。
12.根据前述权利要求中任一项所述的方法,其中HMO共混物具有LNT占总HMO的10%至70%且LNFP-I占30%至95%的摩尔百分比。
13.根据前述权利要求中任一项所述的方法,其中收获的HMO中LNFP-I:LNT的比率为10:1、5:1、3:1、5:2、2:3或1:3。
14.一种遗传工程细胞,其包含
a)一种或多种核酸序列,其编码如SEQ ID NO:1所示的异源β-1,3-N-乙酰基-葡糖胺基-转移酶蛋白质或其氨基酸序列与SEQ ID NO:1具有至少80%同一性的功能同源物;和
b)一种或多种核酸序列,其编码如SEQ ID NO:2所示的异源β-1,3-半乳糖基转移酶蛋白质或其氨基酸序列与SEQ ID NO:2具有至少80%同一性的功能同源物;和
c)一种或多种核酸序列,其编码如SEQ ID NO:3所示的异源α-1,2-岩藻糖基转移酶蛋白质或其氨基酸序列与SEQ ID NO:3中任一个具有至少80%同一性的功能同源物,和
d)一种或多种核酸序列,其编码一种或多种核酸序列,其编码如SEQ ID NO:4所示的乳糖通透酶蛋白质或其氨基酸序列与SEQ ID NO:4具有至少80%同一性的功能同源物,和
e)多于一种的核酸序列,其编码荚膜异多糖酸基因簇的蛋白质。
15.根据权利要求14所述的遗传工程细胞,其还包含
i)用于控制a)、b)和/或c)的表达的天然或异源调控元件,和
ii)用于增加d)的表达的天然或异源调控元件,和/或
iii)非功能性(或缺乏)基因产物,所述基因产物在正常情况下结合并抑制i)和/或ii)驱动的表达。
16.根据权利要求14或15中任一项所述的遗传工程细胞,其中d)的乳糖通透酶蛋白质过表达。
17.根据权利要求14至16中任一项所述的遗传工程细胞,其中细胞包含i)的异源β-1,3-N-乙酰基-葡糖胺基-转移酶的至少两个拷贝,例如至少三个拷贝。
18.根据权利要求14至17中任一项所述的遗传工程细胞,其中i)和ii)的用于控制和增加表达的调控元件是启动子。
19.根据权利要求14-18中任一项所述的遗传工程细胞,其中启动子序列选自SEQ IDNO:13(PglpF)、SEQ ID NO:12(PgatY_70UTR)、SEQ ID NO:27(Plac)、SEQ ID NO:28(PmglB_70UTR)、SEQ ID NO:11(Pscr)、或其变体。
根据权利要求14-19中任一项所述的遗传工程细胞,其中启动子序列选自PglpF(SEQID NO:13)、PglpF_SD10(SEQ ID NO:15)、PglpF_SD8(SEQ ID NO:22)、PglpF_SD5(SEQ IDNO:19)、PglpF_SD4(SEQ ID NO:18)、PgatY_70UTR(SEQ ID NO:12)、PmglB_70UTR(SEQ IDNO:9)和PmglB_70UTR_SD4(SEQ ID NO:9)。
20.根据权利要求14-0中任一项所述的遗传工程细胞,其中iii)中的基因产物是转录阻遏物GlpR。
21.根据权利要求14-20中任一项所述的遗传工程细胞,其中遗传工程细胞的编码DNA结合转录阻遏物GlpR的glpR基因缺失。
22.21.根据权利要求14-21中任一项所述的遗传工程细胞,其中细胞还包含编码糖转运蛋白YberC和/或Nec的重组核酸序列。
23.根据权利要求14-22中任一项所述的遗传工程细胞,其中细胞选自大肠杆菌(E.coli)、谷氨酸棒杆菌(C.glutamicum)、乳酸乳球菌(L.lactis)、枯草芽孢杆菌(B.subtilis)、变铅青链霉菌(S.lividans)、巴斯德毕赤酵母(P.pastoris)和酿酒酵母(S.cerevisiae)。
24.根据权利要求14-23中任一项所述的遗传工程细胞,其能够产生一种或多种选自2’-FL、LNT-II、LNT、LNFP-I和DFL的HMO。
25.根据权利要求14-24中任一项所述的遗传工程细胞的用途,其中LNFP-I和/或LNT是产生的主要HMO。
CN202280035349.1A 2021-05-17 2022-05-17 产生以lnfp-i和lnt作为主要化合物的hmo共混物的方法 Pending CN117321210A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
DKPA202170251 2021-05-17
DKPA202170251 2021-05-17
PCT/EP2022/063316 WO2022243313A1 (en) 2021-05-17 2022-05-17 Methods of producing hmo blend profiles with lnfp-i and lnt as the predominant compounds

Publications (1)

Publication Number Publication Date
CN117321210A true CN117321210A (zh) 2023-12-29

Family

ID=82058453

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202280035349.1A Pending CN117321210A (zh) 2021-05-17 2022-05-17 产生以lnfp-i和lnt作为主要化合物的hmo共混物的方法

Country Status (3)

Country Link
EP (1) EP4341408A1 (zh)
CN (1) CN117321210A (zh)
WO (1) WO2022243313A1 (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN118050982B (zh) * 2024-04-16 2024-06-14 山东黄海智能装备有限公司 一种基于改进同核子算法的小儿针灸仪微刺控制方法

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1382680A4 (en) * 2001-04-23 2004-07-14 Kyowa Hakko Kogyo Kk BETA 1,3-GALACTOSE TRANSFERASE AND DNA ENCODING THIS ENZYME
WO2015188834A1 (en) 2014-06-11 2015-12-17 Glycom A/S Separation of 2'-o-fucosyllactose from fermentation broth
EP3426670A4 (en) 2016-03-07 2019-11-13 Glycom A/S SEPARATION OF OLIGOSACCHARIDES FROM A FERMENTATION BROTH
EP3445770A4 (en) 2016-04-19 2020-03-18 Glycom A/S SEPARATION OF OLIGOSACCHARIDES FROM A FERMENTATION BROTH
CN109246435B (zh) 2017-07-10 2022-03-15 中兴通讯股份有限公司 Usb设备重定向数据传输方法及装置、本地装置和远程服务器
CN111727253A (zh) 2017-12-21 2020-09-29 格礼卡姆股份公司 用于体外和体内基因表达的核酸构建体
CN114008202A (zh) 2019-06-21 2022-02-01 格礼卡姆股份公司 用于体外和体内基因表达的包含5’utr茎环的核酸构建体

Also Published As

Publication number Publication date
EP4341408A1 (en) 2024-03-27
WO2022243313A1 (en) 2022-11-24

Similar Documents

Publication Publication Date Title
CN111727253A (zh) 用于体外和体内基因表达的核酸构建体
CN113166789A (zh) 岩藻糖基化寡糖lnfp-v的合成
CN115003812A (zh) Hmo生产中的新的主要易化因子超家族(mfs)蛋白质(bad)
JP2024517696A (ja) 純粋なLNFP-Iのインビボ産生のためのα-1,2-フコシルトランスフェラーゼの同定
WO2023099680A1 (en) Cells with tri-, tetra- or pentasaccharide importers useful in oligosaccharide production
CN117321210A (zh) 产生以lnfp-i和lnt作为主要化合物的hmo共混物的方法
JP2024516207A (ja) インベルターゼ/スクロースヒドロラーゼを発現する微生物株
JP2024505126A (ja) シアル酸付加hmoの産生における新規の主要ファシリテータースーパーファミリー(mfs)タンパク質(fred)
CN116802286A (zh) 一种产生dfl的菌株
CN115003813A (zh) Hmo生产中的新的主要易化因子超家族(mfs)蛋白质(fred)
CN117355613A (zh) 产生以lnfp-i和2’-fl作为主要化合物的hmo共混物分布的方法
DK181442B1 (en) Cells capable of producing one or more human milk oligosaccharides (hmos) comprising expression of an invertase, method comprising said cells for biosynthetic production and use of said cells for biosynthetic production; use of an invertase in a biosynthetic production
JP7331278B1 (ja) 3’slのインビボ合成のための新規なシアリルトランスフェラーゼ
DK202200591A1 (en) New sialyltransferases for in vivo synthesis of lst-c
JP2024521548A (ja) 主要な化合物としてlnfp-i及び2’-flを有するhmoブレンドプロファイルを生成する方法
CN117321071A (zh) 表达转化酶/蔗糖水解酶的微生物菌株
WO2023166034A1 (en) New sialyltransferases for in vivo synthesis of lst-a
WO2023166035A2 (en) New sialyltransferases for in vivo synthesis of 3&#39;sl and 6&#39;sl
CN116802302A (zh) 唾液酸化hmo生产中的新主要易化子超家族(mfs)蛋白(fred)
WO2023209098A1 (en) Hmo producing microorganism with increased robustness towards glucose gradients
JP2024517144A (ja) 細胞中のラクトース取り込みを改変することによるhmoの形成の増強
DK202200689A1 (en) New fucosyltransferases for in vivo synthesis of lnfp-iii
WO2024013348A1 (en) New fucosyltransferases for in vivo synthesis of complex fucosylated human milk oligosaccharides
BR102023003679A2 (pt) Sialiltransferases para síntese in vivo de 3&#39;sl
DK202201203A1 (en) New fucosyltransferases for in vivo synthesis of complex fucosylated human milk oligosaccharides

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination