CN115003813A - Hmo生产中的新的主要易化因子超家族(mfs)蛋白质(fred) - Google Patents

Hmo生产中的新的主要易化因子超家族(mfs)蛋白质(fred) Download PDF

Info

Publication number
CN115003813A
CN115003813A CN202180010227.2A CN202180010227A CN115003813A CN 115003813 A CN115003813 A CN 115003813A CN 202180010227 A CN202180010227 A CN 202180010227A CN 115003813 A CN115003813 A CN 115003813A
Authority
CN
China
Prior art keywords
nucleic acid
genetically modified
seq
hmos
gene
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202180010227.2A
Other languages
English (en)
Inventor
M·彼得森
I·达里戈
K·B·坎普曼
M·帕帕扎基斯
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Glycom AS
Original Assignee
Glycom AS
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Glycom AS filed Critical Glycom AS
Priority claimed from PCT/EP2021/051479 external-priority patent/WO2021148620A1/en
Publication of CN115003813A publication Critical patent/CN115003813A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/70Vectors or expression systems specially adapted for E. coli
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07HSUGARS; DERIVATIVES THEREOF; NUCLEOSIDES; NUCLEOTIDES; NUCLEIC ACIDS
    • C07H3/00Compounds containing only hydrogen atoms and saccharide radicals having only carbon, hydrogen, and oxygen atoms
    • C07H3/06Oligosaccharides, i.e. having three to five saccharide radicals attached to each other by glycosidic linkages
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/195Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from bacteria
    • C07K14/24Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from bacteria from Enterobacteriaceae (F), e.g. Citrobacter, Serratia, Proteus, Providencia, Morganella, Yersinia
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N1/00Microorganisms, e.g. protozoa; Compositions thereof; Processes of propagating, maintaining or preserving microorganisms or compositions thereof; Processes of preparing or isolating a composition containing a microorganism; Culture media therefor
    • C12N1/20Bacteria; Culture media therefor
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/52Genes encoding for enzymes or proenzymes
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P19/00Preparation of compounds containing saccharide radicals
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P19/00Preparation of compounds containing saccharide radicals
    • C12P19/18Preparation of compounds containing saccharide radicals produced by the action of a glycosyl transferase, e.g. alpha-, beta- or gamma-cyclodextrins
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P19/00Preparation of compounds containing saccharide radicals
    • C12P19/26Preparation of nitrogen-containing carbohydrates
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12RINDEXING SCHEME ASSOCIATED WITH SUBCLASSES C12C - C12Q, RELATING TO MICROORGANISMS
    • C12R2001/00Microorganisms ; Processes using microorganisms
    • C12R2001/01Bacteria or Actinomycetales ; using bacteria or Actinomycetales
    • C12R2001/185Escherichia
    • C12R2001/19Escherichia coli
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A50/00TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE in human health protection, e.g. against extreme weather
    • Y02A50/30Against vector-borne diseases, e.g. mosquito-borne, fly-borne, tick-borne or waterborne diseases whose impact is exacerbated by climate change

Landscapes

  • Chemical & Material Sciences (AREA)
  • Organic Chemistry (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Genetics & Genomics (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Biotechnology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Biochemistry (AREA)
  • Biomedical Technology (AREA)
  • Microbiology (AREA)
  • Molecular Biology (AREA)
  • Biophysics (AREA)
  • General Chemical & Material Sciences (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Physics & Mathematics (AREA)
  • Plant Pathology (AREA)
  • Medicinal Chemistry (AREA)
  • Tropical Medicine & Parasitology (AREA)
  • Virology (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)
  • Peptides Or Proteins (AREA)

Abstract

本发明涉及在遗传修饰细胞中生物分子的重组生产的领域。更具体地,它涉及一种使用表达主要易化因子超家族(MFS)的蛋白质的遗传修饰细胞重组生产人乳寡糖(HMO)的方法,所表达的蛋白质为Fred。

Description

HMO生产中的新的主要易化因子超家族(MFS)蛋白质(FRED)
技术领域
本发明涉及在遗传修饰细胞中生物分子的重组生产的领域。更具体地,本发明涉及使用表达主要易化因子超家族(MFS)的蛋白质的遗传修饰细胞重组生产人乳寡糖(HMO)的方法,所表达的蛋白质为Fred。
背景技术
人乳是碳水化合物、脂肪、蛋白质、维生素、矿物质和微量元素的复杂混合物。到目前为止,最主要的部分是碳水化合物,它可以进一步分为乳糖和更复杂的寡糖(人乳寡糖,HMO)。然而乳糖用作能量来源,复杂的寡糖不被婴儿代谢。复杂寡糖部分至多占总碳水化合物部分的1/10,可能由超过150种不同的寡糖组成。这些复杂寡糖的存在和浓度是人特有的,因此不能在其他哺乳动物例如驯养的乳畜的乳汁中大量发现。
迄今为止,已经确定了至少115个HMO的结构(参见Urashima等:MilkOligosaccharides,Nova Biomedical Books,New York,2011,ISBN:978-1-61122-831-1),而且相当更多地可能存在于人乳中。(Kunz C.等,(2014)Food Oligosaccharides:Production,Analysis and Bioactivity,1st Edition,p 5-20,Eds.Moreno J.and LuzSanz M.,John Wiley&Sons,Ltd)。
由于发现了HMO在人类发展中的重要功能,在过去十年中HMO引起了极大的兴趣。除了它们的益生元属性外,HMO还具有附加的积极作用,这扩展了它们的应用领域(Kunz C.等,(2014)Food Oligosaccharides:Production,Analysis and Bioactivity,1stEdition,p5-20,Eds.Moreno J.and Luz Sanz M.,John Wiley&Sons,Ltd)。HMO明显的健康益处使其被批准用于食品,如婴儿配方奶粉和食品,以及消费者健康产品。
由于HMO的有限可用性,因此非常需要有效的商业,即大规模生产。已经开发了一些到HMO的化学路线。然而,通过化学合成、酶促合成或发酵生产HMO已被证明具有挑战性。尚未提供通过化学合成的食品和医疗应用所需的大规模数量和质量的制造。此外,HMO的化学合成路线涉及几种有毒化学物质,这些化学物质会对最终产品造成污染风险。
为了绕过与HMO化学合成相关的缺点,已经开发了几种酶促方法和发酵方法。对于几种HMO,例如2’-岩藻糖基乳糖、3-岩藻糖基乳糖、乳-N-四糖、乳-N-新四糖、3’-唾液酸乳糖和6’-唾液酸乳糖,已经开发了基于发酵的工艺。基于发酵的工艺通常使用遗传修饰细菌菌株,如重组大肠杆菌(Escherichia coli)(E.coli)。
HMO的生物技术生产比如发酵工艺是有价值的成本效益高的大规模HMO制造方式。它依赖于构建的遗传修饰细菌,以表达合成所需寡糖所需的糖基转移酶,并且利用细菌固有的核苷酸糖库作为HMO前体。
HMO生物技术生产的最新发展使得克服细菌表达系统的某些固有限制成为可能。例如,可对生产HMO的细菌细胞进行遗传修饰,以增加细菌中有限的细胞内核苷酸糖库(WO2012112777),以提高HMO生产中涉及的酶的活性(WO2016040531),或促进合成的HMO分泌到细胞外培养基中(WO2010142305、WO2017042382)。另外,重组细胞中目的基因的表达可通过使用特定启动子或其它基因表达调控因子来调控,例如最近在WO2019123324中所描述的。
W02010142305和WO2017042382中所描述的方法的优点在于,它允许通过高水平的重组基因表达,例如使用WO2012112777、W0201604531或WO2019123324的方法,减少对生产细胞造成的代谢负担。这种方法在重组HMO生产细胞工程化中引起了越来越多的关注,例如最近描述了若干种新的糖转运蛋白基因,其编码可促进重组产生的2’-岩藻糖基乳糖(2’-FL)(人乳中含量最丰富的HMO)流出的蛋白和发酵工艺(WO2018077892、US201900323053、US201900323052)。
然而,目前,由于定义糖转运体底物特异性的结构-功能关系仍然没有得到很好的研究,并且高度不可预测,没有一种算法能够在多个蛋白质数据库(例如UniProt)中的具有预测的转运体功能的众多细菌蛋白质中为不同重组产生的HMO结构的流出准确确定正确的转运蛋白。
发明内容
本公开显示在生产HMO的菌株中过表达编码来自主要易化因子超家族(MFS)的Fred蛋白的异源基因fred,增加了该细胞产生的HMO的量。鉴定对不同重组产生的HMO具有特异性的新的有效糖外排转运蛋白和开发表达所述蛋白质的重组细胞有利于大规模工业HMO制造。
因此,在其最广泛的方面,本发明涉及能够生产一种或多种人乳寡糖(HMO)的遗传修饰细胞,其中所述遗传修饰细胞包含编码SEQID NO:1所示的主要易化因子超家族(MFS)多肽或其功能性同源物的异源核酸序列,该功能性同源物的氨基酸序列与SEQ ID NO:1具有大于95.4%同一性,比如与SEQ ID NO:1具有至少95.5%、比如至少96%同一性。
根据本发明的遗传修饰细胞还可以包含核酸序列,所述核酸序列包含用于调控异源核酸序列表达的调控元件。一方面,所述调控元件调控SEQ ID NO:1所示的MFS多肽或其功能性同源物的表达,所述功能性同源物的氨基酸序列与SEQ ID NO:1具有大于95.4%同一性。
本文中标识为SEQ ID NO:1的氨基酸序列是与具有GenBank登录ID WP_087817556.1的氨基酸序列具有100%同一性的氨基酸序列。具有SEQ ID NO:1的氨基酸序列的MFS转运蛋白在本文中可互换地被标识为“Fred蛋白”或“Fred转运体”或“Fred”;编码Fred蛋白的核酸序列在本文中被标识为SEQ ID NO:2“Fred编码核酸/DNA”或“fred基因”或“fred”。
本发明表明,使用表达Fred蛋白的生产HMO的重组细胞导致与HMO的发酵和纯化相关的HMO制造过程的非常明显的改进。本文所公开的用于HMO生产的重组细胞和方法提供了总产生的HMO的较高产率、较低的副产物形成或副产物与产物的比率以及在发酵液的下游加工期间促进HMO的回收。
令人惊讶的是,发现编码Fred的DNA序列在不同HMO生产细胞中的表达与某些特定HMO在细胞外培养基和生产细胞内部的其它HMO中的积累以及HMO总产量的增加有关。令人惊讶的是,发现所产生的HMO的外排增加是由三或四个单糖单元组成的HMO的特征,即HMO是三糖和四糖,例如2’-岩藻糖基乳糖(2’-FL)、3-岩藻糖基乳糖(3-FL)、3-唾液酸乳糖(3’-SL)、6’-唾液酸乳糖(6’-SL)、乳-N-三糖2(LNT-2)、乳-N-新四糖(LNnT)和乳-N-四糖(LNT),特别是对于本文的实施例所见的2’-岩藻糖基乳糖(2’-FL)、3-岩藻糖基乳糖(3-FL)和乳-N-四糖(LNT),但不适用于较大的寡糖结构,如积累在生产细胞内部的五糖和六糖。
令人惊讶的是,还发现在表达fred基因的对应HMO生产细胞中,主要HMO,例如2’-岩藻糖基乳糖(2’-FL)、3-岩藻糖基乳糖(3-FL)和乳-N-四糖(LNT)的总产量也增加,而在这些细胞中,副产物,例如二岩藻糖基乳糖(DFL)、乳-N-岩藻五糖V(LNFP V)或对乳-新六糖-I(pLNH-I)的产量对应地通常减少,并且所述副产物寡糖通常积聚在生产细胞内。
根据本发明的遗传修饰细胞通常还包含:包含调控元件的核酸序列。所述调控元件可以调控编码主要易化因子超家族(MFS)多肽的核酸的表达,并且所述调控元件可以选自PglpF、PglpF_SD4和PglpF_SD7。
本发明还涉及包含编码主要易化因子超家族(MFS)多肽的核酸序列的核酸构建体,其中所述编码主要易化因子超家族(MFS)多肽的核酸序列与SEQ ID NO:2具有至少70%、更优选至少80%、更优选至少90%、更优选至少95%、甚至更优选至少99%序列同一性,本发明还涉及包含所述核酸构建体的遗传修饰细胞,其为大肠杆菌。
一方面,所述核酸构建体包含编码主要易化因子超家族(MFS)的多肽的核酸序列,其中所述核酸序列与SEQ ID NO:2具有至少70%同一性。
本发明还提供一种用于生物合成生产一种或多种人乳寡糖(HMO)的方法,所述方法包括以下步骤:
(i)提供根据本发明的遗传修饰细胞;
(ii)在合适的细胞培养基中培养根据(i)的所述遗传修饰细胞以表达能够外排糖转运的所述多肽并产生一种或多种人乳寡糖(HMO),和;
(iii)收获步骤(ii)中产生的一种或多种HMO。
本发明还涉及包含编码主要易化因子超家族(MFS)多肽的异源核酸序列的遗传修饰细胞或核酸构建体用于生物合成生产一种或多种人乳寡糖(HMO)的用途,所述核酸序列与SEQ ID NO:2具有至少70%的序列同一性。
如上所述,在培养能够生产一种或多种HMO的遗传修饰细胞期间,该细胞包含编码Fred转运蛋白的核酸序列,令人惊讶的是发现,对应的一种或多种HMO以高产率产生,同时副产物和生物量的形成减少。这有助于在下游过程期间回收HMO,例如整体回收和纯化过程可包含较少的步骤,并且可缩短整体纯化时间。
提高产物产率和促进产物回收的效果使得本发明优于现有技术的公开内容。
本发明的其它方面和有利特征将在下面通过非限制性的实施方式详细描述和说明。
附图说明
图1显示具有和没有整合根据SEQ ID NO:2的fred基因(编码根据SEQ ID NO:1的Fred MFS转运蛋白的表达)的修饰的大肠杆菌菌株(菌株1)分别为菌株2和菌株1的相对2’-FL生产。数据获自深孔进料批次试验(deep-well feedbatch assay)。
图2显示2’-FL在具有和没有整合根据SEQ ID NO:2的fred基因(编码根据SEQ IDNO:1的Fred MFS转运蛋白的表达)的修饰的大肠杆菌菌株(菌株1)分别为菌株2和菌株1的细胞内外的相对分布。数据获自深孔进料批次试验。
图3显示具有和没有整合根据SEQ ID NO:2的fred基因(编码根据SEQ ID NO:1的Fred MFS转运蛋白的表达)的修饰的大肠杆菌菌株(菌株3)分别为菌株4和菌株3的相对3-FL生产。数据获自深孔进料批次试验。
图4显示3-FL在具有和没有整合根据SEQ ID NO:2的fred基因(编码根据SEQ IDNO:1的Fred MFS转运蛋白的表达)的修饰的大肠杆菌菌株(菌株3)分别为菌株4和菌株3的细胞内外的相对分布。数据获自深孔进料批次试验。
图5显示具有和没有整合根据SEQ ID NO:2的fred基因(编码根据SEQ ID NO:1的Fred MFS转运蛋白的表达)的修饰的大肠杆菌菌株(菌株5)分别为菌株6与7,相比菌株5的相对LNT生产。数据获自深孔进料批次试验。
图6显示LNT在具有和没有整合根据SEQ ID NO:2的fred基因(编码根据SEQ IDNO:1的Fred MFS转运蛋白的表达)的修饰的大肠杆菌菌株(菌株5)分别为菌株6与7,相比菌株5的细胞内外的相对分布。数据获自深孔进料批次试验。
图7显示七种菌株在总样品中的相对LNnT浓度百分比(%),这些菌株表达GlcNacT和Gal4T基因以及相应的异源转运体基因yberC0001_9420、bad、fred、marc、vag、nec或yabM。菌株MP3672表达糖基转移酶基因,不表达转运体基因;
图8显示表达vag或yabM的细胞上清液中相对LNnT浓度的百分比(%)。
具体实施方式
在下文中,将进一步详细描述本发明的实施方式。除非另有明确说明,否则特征的每个具体变化可应用于本发明的其它实施方式。
一般而言,除非明确定义或另有说明,否则本文中使用的所有术语应根据其在技术领域中的普通含义进行解释,并且适用于本发明的所有方面和实施方式。
除非另有明确说明,否则对“一种/一个/该(a/an/the)[细胞、序列、基因、转运体、步骤等]的引用应公开解释为指所述细胞、序列、基因、转运体、步骤等的至少一个实例。
除非明确说明,否则本文所公开的任何方法的步骤不必按照所公开的确切顺序执行。
本发明总体上涉及用于高效生产寡糖的遗传修饰细胞以及所述遗传修饰细胞在生产寡糖的方法中的用途。具体地,本发明涉及能够合成寡糖,优选异源寡糖,特别是人乳寡糖(HMO)的遗传修饰细胞。
因此,本发明的遗传修饰细胞经修饰以表达细胞合成一种或多种HMO所必需的一组重组核酸(其使宿主细胞能够合成一种或多种HMO),诸如编码具有下述糖基转移酶活性的一种或多种酶的基因。本发明的寡糖生产重组细胞进一步经修饰以包含异源重组核酸序列,优选地,编码推定的MFS(主要易化因子超家族)转运蛋白的DNA序列,其源自细菌弗氏耶尔森菌(Yersiniafrederiksenii)。
具体地,本发明涉及优化用于生产一种或多种特定寡糖,特别是一种或多种特定HMO的遗传修饰细胞,其包含编码Fred蛋白的重组核酸。
编码具有SEQ ID NO:2的核酸序列的Fred蛋白的核酸序列在本文中称为“Fred编码核酸/DNA”或“fred基因”或“fred”。
本文可互换地标识为“Fred蛋白”或“Fred转运体”或“Fred”的MFS转运蛋白具有SEQ ID NO:1的氨基酸序列;本文标识为SEQID NO:1的氨基酸序列是与具有GenBank登录号WP_087817556.1的氨基酸序列具有100%同一性的氨基酸序列。
因此,本发明的一方面涉及能够生产一种或多种人乳寡糖(HMO)的遗传修饰细胞,其中所述遗传修饰细胞包含编码能够进行糖转运的多肽的异源核酸序列,所述核酸序列与SEQ ID NO:2具有至少70%、更优选至少80%、更优选至少90%、更优选至少95%、甚至更优选至少99%的序列同一性。
此外,本发明涉及为生产一种或多种特定寡糖,特别是一种或多种特定HMO而优化的遗传修饰细胞,其包含编码与SEQ ID NO:1的氨基酸序列具有大于95.4%,比如至少95.5%序列同一性、优选至少96%、更优选至少97%、更优选至少98%、甚至更优选至少99%序列同一性的蛋白的重组核酸。
因此,本发明的一方面涉及能够生产一种或多种人乳寡糖(HMO)的遗传修饰细胞,其中所述遗传修饰细胞包含编码能够进行糖转运的多肽的异源核酸序列,所述核酸序列与SEQ ID NO:2具有至少70%、更优选至少75%、更优选至少80%、更优选至少90%、甚至更优选至少95%,比如99%的序列同一性。
因此,本发明的另一方面涉及能够生产一种或多种HMO的遗传修饰细胞,其中所述细胞包含编码SEQ ID NO:1的蛋白质或其功能性同源物的重组核酸,该功能性同源物的氨基酸序列与SEQ ID NO:1具有至少95.4%同一性,优选具有至少96%、更优选至少97%、更优选至少99%同一性。
在本上下文中,术语“功能性同源物”意指与SEQ ID NO:1具有大于95.4%,比如95.5%-99.9%同一性的氨基酸序列的蛋白,并且具有有益于实现本发明的至少一种有益效果的功能,例如增加遗传修饰细胞的总HMO生产或HMO的选择,促进所产生HMO(一种或多种)的回收,HMO生产效率和/或HMO生产细胞的活力。
术语“主要易化因子超家族(MFS)”意指次级活性转运体类的一个大且异常多样的家族,其负责转运一系列不同的底物,包括糖、药物、疏水分子、肽、有机离子等。糖转运蛋白的特异性高度不可预测,并且对例如寡糖具有特异性的新型转运蛋白的鉴定需要无负担的实验室实验(更多详细信息请参阅Reddy V.S.等人的综述,(2012),FEBS J.279(11):2022-2035)。术语“MFS转运体”在本上下文中意指促进寡糖(优选HMO)转运穿过细胞膜的蛋白,优选将由遗传修饰细胞合成的HMO/寡糖从细胞胞质溶胶转运至细胞培养基,优选包含三个或四个糖单元(例如2’-FL、3-FL、LNT-2、LNT、LNnT、3’-SL或6’-SL)的HMO/寡糖。附加地,或另选地,MFS转运体也可促进不被视为HMO或根据本发明的寡糖的分子的流出,诸如乳糖、葡萄糖、细胞代谢物或毒素。
在两种或多种核酸或氨基酸序列的上下文中,术语“[某一]%的序列同一性”意指当在比较窗口或指定的核酸或氨基酸序列上进行最大对应性比较和比对时,两种或多种序列在给定的百分比中具有共同的核苷酸或氨基酸残基(即序列具有至少百分之90(%)同一性)。核酸或氨基酸序列的同一性百分比可使用具有默认参数的BLAST 2.0序列比较算法,或者通过人工比对和目视检查来测量(参见例如http://www.ncbi.nlm.nih.gov/BLAST/)。该定义也适用于测试序列的互补序列和具有缺失和/或添加的序列,以及具有取代的序列。适用于确定百分比同一性、序列同一性和比对的算法示例是BLAST 2.2.20+算法,其描述于Altschul等人的《核酸研究(Nucl.AcidsRes.)》25,3389(1997)中。BLAST 2.2.20+用于确定本发明核酸和蛋白的序列同一性百分比。用于进行BLAST分析的软件可通过国家生物技术信息中心(http://www.ncbi.nlm.nih.gov/)公开获得。序列比对算法的实例是CLUSTALOmega(http://www.ebi.ac.uk/Tools/msa/clustalo/)、EMBOSSNeedle(http://www.ebi.ac.uk/Tools/psa/emboss_needle/)、MAFFT(http://mafft.cbrc.jp/alignment/server/)或MUSCLE(http://www.ebi.ac.uk/Tools/msa/muscle/)。
在本发明的上下文中,术语“寡糖”意指含有多个单糖单元的糖聚合物。在一些实施方式中,优选寡糖是由三个或四个单糖单元组成的糖聚合物,即三糖或四糖。本发明的优选寡糖为人乳寡糖(HMO)。
HMO
本文中的术语“人乳寡糖”或“HMO”意指人乳中发现的复杂碳水化合物(参见Urashima等人:《乳寡糖(MilkOligosaccharides.)》,诺瓦生物医学图书,2011年;Chen《碳水化合物化学和生物化学进展》72,113(2015))。HMO具有在还原端包含乳糖单元的核心结构,该乳糖单元可由一个或多个β-N-乙酰基-乳糖胺基和/或一个或多个β-乳-N-二糖基单元延长,并且该核心结构可由α-L-岩藻吡喃基和/或α-N-乙酰基神经氨酰(唾液酸)部分取代。在这方面,非酸性(或中性)HMO不含唾液酸残基,而酸性HMO在其结构中具有至少一个唾液酸残基。非酸性(或中性)HMO可为岩藻糖基化或非岩藻糖基化的。此类中性非岩藻糖基化HMO的实例包括乳-N-三糖2(LNT-2)、乳-N-四糖(LNT)、乳-N-新四糖(LNnT)、乳-N-新六糖(LNnH)、对-乳-N-新六糖(pLNnH)、对-乳-N-六糖(pLNH)和乳-N-六糖(LNH)。中性岩藻糖基化HMO的实例包括2’-岩藻糖基乳糖(2’-FL)、乳-N-岩藻五糖I(LNFP-I)、乳-N-二岩藻六糖I(LNDFH-I)、3-岩藻糖基乳糖(3-FL)、二岩藻糖基乳糖(DFL)、乳-N-岩藻五糖II(LNFP-II)、乳-N-岩藻五糖III(LNFP-III)、乳-N-二岩藻六糖III(LNDFH-III)、岩藻糖基-乳-N-六糖II(FLNH-II)、乳-N-岩藻五糖V(LNFP-V)、乳-N-二岩藻六糖II(LNDFH-II)、岩藻糖基-乳-N-六糖I(FLNH-I)、岩藻糖基-对-乳-N-六糖I(FpLNH-I)、岩藻糖基-对-乳-N-新六糖II(F-pLNnHII)和岩藻糖基-乳-N-新六糖(FLNnH)。酸性HMO的实例包括3’-唾液酸乳糖(3’-SL)、6’-唾液酸乳糖(6’-SL)、3-岩藻糖基-3’-唾液酸乳糖(FSL)、3’-O-唾液酸乳-N-四糖a(LST a)、岩藻糖基-LST a(FLST a)、6’-O-唾液酸乳-N-四糖b(LST b)、岩藻糖基-LST b(FLST b)、6’-O-唾液酸乳-N-新四糖(LST c)、岩藻糖基-LST c(FLST c)、3’-O-唾液酸乳-N-新四糖(LSTd)、岩藻糖基-LSTd(FLST d)、唾液酸-乳-N-六糖(SLNH)、唾液酸-乳-N-新六糖I(SLNH-I)、唾液酸-乳-N-新六糖II(SLNH-II)和二唾液酸-乳-N-四糖(DSLNT)。在本发明的上下文中,乳糖不被视为HMO种类。
在本发明的一些实施方式中,三-HMO和四-HMO可为优选的,例如三糖2’-FL、3-FL、LNT-2、3’-SL、6’-SL和四糖DFL、LNT、LNnT、FSL。
在本发明目前优选的方面,优选三-HMO,特别是选自2’-FL和3-FL的三糖,和选自DFL和LNT的四糖。
2’-FL
2’-岩藻糖基乳糖(2’-FL或2’O-岩藻糖基乳糖)是一种三糖,更准确地说,是由L-岩藻糖、D-半乳糖和D-葡萄糖单元(Fucα1-2Galβ1-4Glc)组成的岩藻糖基化的中性三糖。它是人乳中天然存在的最普遍的人乳寡糖(HMO),约占所有HMO的30%。在遗传修饰细胞或酶促反应中,2’-FL主要通过α-1,2-岩藻糖基转移酶与乳糖和岩藻糖基供体的酶促反应产生。
3-FL
3-岩藻糖基乳糖(3-FL)是一种三糖,更准确地说,是由D-半乳糖、L-岩藻糖和D-葡萄糖(Galβ1-4(Fucα1-3)Glc)组成的岩藻糖基化的中性三糖。它天然存在于人乳中。在遗传修饰细胞或酶促反应中,3-FL主要通过α-1,3-岩藻糖基转移酶或α-1,3/4-岩藻糖基转移酶与乳糖和岩藻糖基供体的酶促反应产生。
LNT
乳-N-四糖(LNT)是一种四糖,更准确地说,是由半乳糖、N-乙酰氨基葡萄糖、半乳糖和葡萄糖(GlcNAcβ1-3Galβ1-4Glc)组成的中性四糖。它天然存在于人乳中。
DEL
二岩藻糖基乳糖(DFL或2’,3-二-O-岩藻糖基乳糖)是一种寡糖,更准确地说,是由L-岩藻糖、D-半乳糖、L-岩藻糖和D-葡萄糖(Fucα1-2Galβ1-4(Fucα1-3)Glc)组成的岩藻糖基化的中性四糖。它天然存在于人乳中。在遗传修饰细胞或酶促反应中,DFL主要由α-1,2-岩藻糖基转移酶、α-1,3-岩藻糖基转移酶和/或α-1,3/4-岩藻糖基转移酶与乳糖和两种岩藻糖基供体的酶促反应产生。
功能性酶
为了能够合成一种或多种HMO,本发明的重组细胞包含至少一种编码具有糖基转移酶活性的功能性酶的重组核酸。半乳糖基转移酶基因可(通过染色体整合)整合到遗传修饰细胞的基因组中,或者另选地,它可包含在质粒DNA中并表达为质粒携带的。如果产生HMO例如LNT或LNnT,需要两种或多种糖基转移酶,则编码具有糖基转移酶活性的不同酶的两种或多种重组核酸可整合在基因组中和/或从质粒中表达,例如用于生产LNT的β-1,3-N-乙酰氨基葡萄糖基转移酶(编码第一糖基转移酶的第一重组核酸)与β-1,3-半乳糖基转移酶(编码第二糖基转移酶的第二重组核酸)组合,其中第一和第二重组核酸可彼此独立地进行染色体整合或整合在质粒上。
在一个优选实施方式中,第一和第二重组核酸均稳定整合到生产细胞的染色体中;在另一实施方式中,第一和第二糖基转移酶中的至少一种是质粒携带的。具有糖基转移酶活性的蛋白/酶(糖基转移酶)可在不同实施方式中选自具有以下项的活性的酶:α-1,2-岩藻糖基转移酶、α-1,3-岩藻糖基转移酶、α-1,3/4-岩藻糖基转移酶、α-1,4-岩藻糖基转移酶α-2,3-唾液酸转移酶、α-2,6-唾液酸转移酶、β-1,3-N-乙酰氨基葡萄糖基转移酶、β-1,6-N-乙酰氨基葡萄糖基转移酶、β-1,3-半乳糖基转移酶和β-1,4-半乳糖基转移酶。例如,2’-FL的生产需要经修饰细胞表达活性α-1,2-岩藻糖基转移酶;为了生产3-FL,经修饰细胞需要表达活性α-1,3-岩藻糖基转移酶;为了生产LNT,经修饰细胞需要表达至少两种糖基转移酶,一种β-1,3-N-乙酰氨基葡萄糖基转移酶和一种β-1,3-半乳糖基转移酶;为了生产6’-SL,经修饰细胞必须表达活性α-2,6-唾液酸转移酶和CMP-唾液酸合成途径;为了生产3’SL,经修饰细胞必须表达活性α-2,3-唾液酸转移酶和CMP-唾液酸合成途径。可由生产细胞包含的重组基因编码的具有糖基转移酶活性的蛋白的一些非限制性实施方式可选自表1的非限制性示例。
表1
Figure BDA0003758073950000121
Figure BDA0003758073950000131
Figure BDA0003758073950000141
异源核酸序列
本发明的一方面是提供一种核酸构建体,其包含编码能够进行糖转运的多肽的异源核酸序列(一种或多种),该多肽是如SEQ ID NO:1所示的主要易化因子超家族(MFS)多肽或其功能性同源物,该功能性同源物的氨基酸序列与SEQ ID NO:1具有大于95.4%同一性,其中编码糖转运多肽的核酸序列与SEQ ID NO:2具有至少70%的序列同一性。
术语“异源核酸序列”、“重组基因/核酸/DNA编码”或“编码核酸序列”意指人工核酸序列(即,使用标准实验室方法在体外制备核酸序列),其包含一组连续、非重叠的三联体(密码子),当在适当的控制序列(即启动子)的控制下时,它被转录成mRNA并翻译成多肽。编码序列的边界一般由位于由mRNA 5’端开放阅读框上游的核糖体结合位点、转录起始密码子(AUG、GUG或UUG)和翻译终止密码子(UAA、UGA或UAG)确定。编码序列可包括但不限于基因组DNA、cDNA、合成和重组核酸序列。
术语“核酸”包括RNA、DNA和cDNA分子。应理解,由于遗传密码的简并性,可产生编码给定蛋白的大量核苷酸序列。术语核酸可与术语“多核苷酸”互换使用。
“寡核苷酸”是一种短链核酸分子。
“引物”是一种寡核苷酸,无论是天然存在的如在纯化的限制性内切酶消化物中还是合成产生的,当置于诱导与核酸链互补的引物延伸产物合成的条件下(即在核苷酸和诱导剂如DNA聚合酶的存在下和在合适的温度和pH下)时,其能够作为合成的起点。为了扩增的最大效率,引物优选是单链的,但也可为双链的。如果引物是双链的,则在用于制备延伸产物之前,首先对其进行处理以分离其链。优选地,引物是脱氧核糖核酸序列。引物必须足够长,以便在存在诱导剂的情况下引发延伸产物的合成。引物的确切长度取决于许多因素,包括温度、引物来源和方法的使用。
本发明的重组核酸序列可为编码DNA序列,例如基因,或非编码DNA序列,例如调控DNA,例如启动子序列。本发明的一方面涉及提供一种重组细胞,其包含编码生产一种或多种HMO所需酶的重组DNA序列和编码Fred转运体的DNA序列。因此,在一个实施方式中,本发明涉及一种核酸构建体,其包含编码核酸序列,即目的基因(例如糖基转移酶基因或fred基因)的重组DNA序列,以及非编码DNA序列,例如启动子DNA序列,例如衍生自lac操纵子或glp操纵子的启动子的重组启动子序列,或衍生自另一基因组启动子DNA序列的启动子序列,或合成启动子序列,其中编码序列和启动子序列可操作地连接。术语“可操作连接”是指两种或多种核酸(例如DNA)之间的功能性关系部分。通常,它是指转录调控序列与转录序列之间的功能性关系。例如,如果启动子序列在合适的宿主细胞或其它表达系统中刺激或调控编码序列的转录,则该启动子序列与编码序列可操作地连接。与转录序列可操作连接的启动子转录调控序列与转录序列物理上相邻,即它们是顺式作用的。
在一个实施方式中,本发明的核酸构建体可为载体DNA的一部分,在另一个实施方式中,构建体是整合在宿主细胞基因组中的表达盒/盒。因此,术语“核酸结构”意指人工构建的核酸片段,特别是DNA片段,其旨在“移植”到靶细胞,例如细菌细胞中,以修饰基因组基因的表达或表达可包括在构建体中的基因/编码DNA序列。在本发明的上下文中,核酸构建体包含含有两个或多个重组DNA序列的重组DNA序列:基本上,非编码DNA序列包含启动子DNA序列和编码目的基因的编码DNA序列,该目的基因例如Fred蛋白、糖基转移酶或用于在宿主细胞中生产HMO的另一基因。优选地,该构建体进一步包含调控构建体编码DNA的转录或翻译的非编码DNA序列,例如促进核糖体结合到转录物的DNA序列,稳定转录物的前导DNA序列。
包含在构建体(表达盒)中的目的重组核酸整合到细菌基因组中可以通过常规方法实现,例如通过使用含有与染色体上特定位点同源的侧翼序列的线性盒,如针对attTn7-位点所述(Waddell C.S.和CraigN.L.,Genes Dev.(1988)Feb;2(2):137-49.);核酸序列的基因组整合方法,其中重组由噬菌体λ的Red重组酶功能或Rac原噬菌体的RecE/RecT重组酶功能介导(Murphy,J Bacteriol.(1998);180(8):2063-7;Zhang等,Nature Genetics(1998)20:123-128;Muyrers等,EMBO Rep.(2000)1(3):239–243);基于Red/ET重组的方法(Wenzel等,Chem Biol.(2005),12(3):349-56.;Vetcher等,Appl Environ Microbiol.(2005);71(4):1829-35);或阳性克隆,即携带表达盒的克隆,可例如通过标记基因或基因功能的丧失或获得来选择。
根据本发明,包含目的基因的表达盒的单个拷贝足以确保所需HMO的生产并实现所需效果。因此,在一些优选实施方式中,本发明涉及重组HMO生产细胞,其包含整合在细胞基因组DNA中的目的基因的一个、两个或三个拷贝。在一些实施方式中,优选基因的单拷贝。
在一个优选实施方式中,本发明核酸构建体的重组编码核酸序列相对于启动子是异源的,这意指在起源物种基因组中的等效天然编码序列中在另一启动子序列(即,不是构建体的启动子序列)的控制下转录。然而,就宿主细胞而言,编码DNA可为异源的(即源自另一生物物种或属),例如编码在大肠杆菌宿主细胞中表达的Fred蛋白的DNA序列,或者是同源的(即源自宿主细胞),例如结肠酸操纵子的基因、wca基因。
优选地,本发明的构建体包含与HMO生物合成生产相关的基因、启动子DNA序列和在遗传修饰细胞中表达的其它调控序列,诸如核糖体结合位点序列(例如Shine-Dalgarno序列),使得能够以至少0.03g/OD(光密度)的水平产生1升包含遗传修饰细胞悬浮液的发酵培养基中的HMO,例如约0.05g/l/OD至约0.5g/l/OD的水平。就本发明而言,后一水平的HMO生产被视为“足够”,并且能够生产该水平的所需HMO的遗传修饰细胞被视为“合适的遗传修饰细胞”,即该细胞可以被进一步修饰以表达HMO转运蛋白,例如Fred,以实现本文所描述的至少一种有利于HMO生产的效果。
本发明的遗传修饰细胞或核酸构建体包含核酸序列,诸如编码推定MFS(主要易化因子超家族)转运蛋白的异源基因。
本发明中特别目的MFS转运蛋白是Fred蛋白。因此,本发明的核酸构建体包含与基因fred,SEQ ID NO:2具有至少70%序列同一性的核酸序列。
包含在遗传修饰细胞或核酸结构中的核酸序列编码SEQ ID NO:1的蛋白或其功能性同源物,所述功能性同源物的氨基酸序列与SEQ IDNO:1具有大于95.4%同一性。
SEQ ID NO:1的蛋白的功能性同源物可通过诱变获得。与SEQ IDNO:1的氨基酸序列的功能性相比,功能性同源物应具有至少50%,诸如60%、70%、80%、90%或100%的剩余功能性。与SEQ ID NO:1的氨基酸序列的功能性相比,功能性同源物可具有更高的功能性。SEQID NO:1的功能性同源物应能够增强根据本发明的遗传修饰细胞的HMO产量。
遗传修饰细胞
如本文所用的“遗传修饰细胞”理解为已经被异源多核苷酸序列转化或转染的细胞。在本文中,术语“遗传修饰细胞”和“宿主细胞”可互换使用。
因此,“遗传修饰细胞”或“遗传修饰的细胞”在本文中理解为已经被外源多核苷酸序列转化或转染的宿主细胞。
遗传修饰细胞优选是原核细胞。可用作宿主细胞的适当微生物细胞包括酵母细胞、细菌细胞、古细菌细胞、藻类细胞和真菌细胞。
宿主细胞
遗传修饰细胞(宿主细胞或重组细胞)可为例如细菌或酵母细胞。在一个优选实施方式中,遗传修饰细胞是细菌细胞。
关于细菌宿主细胞,原则上没有限制;它们可为真细菌(革兰氏阳性或革兰氏阴性)或古细菌,只要它们允许插入目的基因的基因操作,并且可在制造规模上培养。优选地,宿主细胞具有允许培养至高细胞密度的属性。适于重组工业生产根据本发明的HMO(一种或多种)的细菌宿主细胞的非限制性示例可为草生欧文氏菌(Erwinia herbicola)(成团泛菌(Pantoea agglomerans))、弗劳地枸橼酸杆菌(Citrobacter freundii)、柠檬泛菌(Pantoea citrea)、胡萝卜软腐果胶杆菌(Pectobacterium carotovorum)或野油菜黄单胞菌(Xanthomonas campestris)。也可使用芽孢杆菌(Bacillus)属的细菌,包括枯草芽孢杆菌(Bacillus subtilis)、地衣芽孢杆菌(Bacillus licheniformis)、凝结芽孢杆菌(Bacillus coagulans)、嗜热芽孢杆菌(Bacillus thermophilus)、侧孢芽孢杆菌(Bacillus laterosporus)、巨大芽孢杆菌(Bacillus megaterium)、丝状芽孢杆菌(Bacillus mycoides)、短小芽孢杆菌(Bacillus pumilus)、迟缓芽孢杆菌(Bacilluslentus)、蜡样芽孢杆菌(Bacillus cereus)和环状芽孢杆菌(Bacillus circulans)。类似地,可使用本发明的方法修饰乳杆菌(Lactobacillus)属和乳球菌(Lactococcus)属的细菌,包括但不限于嗜酸乳杆菌(Lactobacillus acidophilus)、唾液乳杆菌(Lactobacillussalivarius)、植物乳杆菌(Lactobacillus plantarum)、瑞士乳杆菌(Lactobacillushelveticus)、德氏乳杆菌(Lactobacillus delbrueckii)、鼠李糖乳杆菌(Lactobacillusrhamnosus)、保加利亚乳杆菌(Lactobacillus bulgaricus)、卷曲乳杆菌(Lactobacilluscrispatus)、加氏乳杆菌(Lactobacillus gasseri)、干酪乳杆菌(Lactobacillus casei)、罗伊氏乳杆菌(Lactobacillus reuteri)、詹氏乳杆菌(Lactobacillus jensenii)和乳酸乳球菌(Lactococcus lactis)。嗜热链球菌(Streptococcus thermophiles)和费氏丙酸杆菌(Proprionibacterium freudenreichii)也是本文所述发明的合适细菌种类。作为本发明的一部分,还包括如本文所述修饰的菌株,其来自肠球菌(Enterococcus)属(例如,屎肠球菌(Enterococcus faecium)和嗜热肠球菌(Enterococcus thermophiles))、双歧杆菌(Bifidobacterium)属(例如,长双歧杆菌(Bifidobacterium longum)、婴儿双歧杆菌(Bifidobacterium infantis)和两岐双岐杆菌(Bifidobacterium bifidum))、芽孢乳杆菌(Sporolactobacillus spp.)、小单孢菌(Micromomospora spp.)、微球菌(Micrococcusspp.)、红球菌(Rhodococcus spp.)和假单胞菌(Pseudomonas)属(例如荧光假单胞菌(Pseudomonas fluorescens)和绿脓假单胞菌(Pseudomonas aeruginosa))。在乳糖存在下培养包含本文所述特征的细菌,并且从细菌本身或细菌培养上清液中提取由细胞产生的寡糖,诸如HMO。在一个优选实施方式中,本发明的遗传修饰细胞是大肠杆菌细胞。
在另一优选实施方式中,宿主细胞是酵母细胞,例如酿酒酵母(Saccharomycescerevisiae)、粟酒裂殖酵母(Schizosaccharomyces pombe)、巴斯德毕赤酵母(Pichiapastoris)、乳酸克鲁维酵母(Kluveromyces lactis)、马克斯克鲁维酵母(Kluveromycesmarxianus)等。
本发明的遗传修饰细胞可使用本领域的标准方法提供,例如Sambrook等人,Wilson&Walker,Maniatise等人和Ausubel等人在手册中所述的方法。
适用于HMO生产的宿主,例如大肠杆菌,可包含内源性β-半乳糖苷酶基因或外源性β-半乳糖苷酶基因,例如大肠杆菌包含内源性lacZ基因(例如GenBank登录号V00296(GI:41901))。出于本发明的目的,对生产HMO的宿主细胞进行遗传操作,使其包含任何β-半乳糖苷酶基因或包含失活的基因。该基因可通过从细菌基因组中完全或部分缺失对应的核酸序列而失活,或者该基因序列以其转录的方式发生突变,或者如果被转录,则转录物不被翻译,或者如果翻译为蛋白(即β-半乳糖苷酶),则该蛋白不具有对应的酶活性。通过这种方式,HMO生产菌积累了更多的细胞内乳糖库,这有利于HMO的生产。
在一些实施方式中,工程细胞(例如细菌)包含缺陷唾液酸分解代谢途径。“唾液酸分解代谢途径”意指通常由酶控制和催化的导致唾液酸降解的一系列反应。本文所描述的实例性唾液酸分解代谢途径为大肠杆菌途径。在该途径中,唾液酸(Neu5Ac;N-乙酰神经氨酸)由NanA(N-乙酰神经氨酸裂解酶)和NanK(N-乙酰甘露糖胺激酶)和NanE(N-乙酰甘露糖胺-6-磷酸差向异构酶)降解,这些酶均由nanATEK-yhcH操纵子编码,并且由NanR抑制(http://ecocyc.org/ECOLI)。通过在内源性nanA(N-乙酰神经氨酸裂解酶)(例如GenBank登录号D00067.1(GL216588))和/或nanK(N-乙酰甘露糖胺激酶)基因(例如GenBank登录号(氨基酸)BAE77265.1(GL85676015))和/或nanE(N-乙酰甘露糖胺-6-磷酸差异构酶,GI:947745,通过引用并入本文)中引入突变,在大肠杆菌宿主中呈现缺陷唾液酸分解代谢途径。任选地,nanT(N-乙酰神经氨酸转运体)基因也失活或突变。唾液酸代谢的其它中间产物包括:(ManNAc-6-P)N-乙酰甘露糖胺-6-磷酸;(GlcNAc-6-P)N-乙酰氨基葡萄糖-6-磷酸;(GlcN-6-P)氨基葡萄糖-6-磷酸和(Fruc-6-P)果糖-6-磷酸。在一些优选实施方式中,nanA被突变。在其它优选实施方式中,nanA和nanK被突变,而nanE保持功能性。在另一优选实施方式中,nanA和nanE被突变,而nanK未被突变、失活或缺失。突变是编码nanA、nanK、nanE和/或nanT基因产物的核酸序列中的一种或多种变化。例如,核酸序列中的突变可为1、2、至多5、至多10、至多25、至多50或至多100个变化。例如,nanA、nanK、nanE和/或nanT基因通过无效突变而突变。本文所描述的无效突变包含氨基酸替换、添加、缺失或插入,其要么导致酶功能丧失(即活性降低或无活性)要么导致酶丧失(即无基因产物)。“缺失”意指完全或部分缺失编码区,从而不产生(功能性)基因产物。失活是指编码序列已被改变,使得所得基因产物在功能上无活性,或者编码的基因产物的活性低于天然、天然存在的内源基因产物的100%,例如90%、80%、70%、60%、50%、40%、30%或20%。“未突变的”基因或蛋白与天然、天然发生或内源性编码序列没有1、2、至多5、至多10、至多20、至多50、至多100、至多200或至多500个或更多密码子的不同,或与对应的编码氨基酸序列的不同。
此外,该细菌(例如大肠杆菌)还可包含唾液酸合成能力。例如,该细菌通过提供外源性UDP-GlcNAc 2-差异构酶(例如空肠弯曲杆菌(Campylobacter jejuni)的neuC(GenBank AAK91727.1)或等效物(例如GenBank CAR04561.1)、Neu5Ac合酶(例如空肠弯曲杆菌的neuB(GenBank AAK91726.1)或等效物(例如黄杆菌利姆诺西氏(Flavobacteriumlimnosediminis)唾液酸合酶,GenBank WP_023580510.1)和/或CMP-Neu5Ac合酶(例如空肠弯曲菌的neuA(GenBank AAK91728.1)或等效物(例如巴西弧菌(Vibrio brasiliensis)CMP-唾液酸合酶,GenBank WP_006881452.1)而具有唾液酸合成能力。
在修饰的细菌中生产含中性N-乙酰氨基葡萄糖的HMO在本领域也是已知的(参见例如Gebus C等.(2012)Carbohydrate Research 363 83-90)。
用于生产含N-乙酰氨基葡萄糖的HMO,诸如乳-N-三糖2(LNT-2)、乳-N-四糖(LNT)、乳-N-新四糖(LNnT)、乳-N-岩藻五糖I(LNFP-I)、乳-N-岩藻五糖II(LNFP-II)、乳-N-岩藻五糖III(LNFP-III)、乳-N-岩藻五糖V(LNFP-V)、乳-N-二岩藻六糖I(LDFH-I)、乳-N-二岩藻六糖II(LDFH-II)和乳-N-新二岩藻六糖II(LNDFH-III),如上文所述,并且经修饰处理以包含外源性UDP-GlcNAc:Galα/β-Rβ-3-N-乙酰氨基葡萄糖基转移酶基因或其功能性变体或片段。这种外源性UDP-GlcNAc:Galα/β-Rβ-3-N-乙酰氨基葡萄糖基转移酶基因可从多种来源中的任何一种获得,例如从脑膜炎奈瑟菌(N.meningitidis)(Genbank蛋白登录号AAF42258.1)或淋病奈瑟菌(N.gonorrhoeae)(Genbank蛋白登录号ACF31229.1)中描述的lgtA基因。任选地,附加的外源性糖基转移酶基因可在包含外源性UDP-GlcNAc:Galα/β-Rβ-3-N-乙酰氨基葡萄糖基转移酶的细菌中共表达。例如,β-1,4-半乳糖基转移酶基因与UDP-GlcNAc:Galα/β-Rβ-3-N-乙酰氨基葡萄糖基转移酶基因共表达。这种外源性β-1,4-半乳糖基转移酶基因可从多种来源中的任何一种获得,例如来自于脑膜炎奈瑟菌的lgtB基因(Genbank蛋白登录号AAF42257.1)或来自于幽门螺杆菌(H.pylori)的HP0826/galT基因(Genbank蛋白登录号NP_207619.1)中描述的基因。任选地,在包含外源性UDP-GlcNAc:Galα/β-Rβ-3-N-乙酰氨基葡萄糖基转移酶基因的细菌中共表达的附加外源性糖基转移酶基因是P-1,3-半乳糖基转移酶基因,例如描述的来自于大肠杆菌055:H7的wbgO基因(Genbank蛋白登录号WP_000582563.1)或来自于幽门螺杆菌的jhp0563基因(Genbank蛋白登录号AEZ55696.1),或来自于无乳链球菌(Streptococcus agalactiae)lb OI2型的cpslBJ基因(Genbank蛋白登录号AB050723)。上述任何酶的功能变体和片段也涵盖在本发明中。
N-乙酰氨基葡萄糖基转移酶基因和/或半乳糖基转移酶基因也可操作地连接到Pglp,并且从对应的基因组整合盒表达。在一个实施方式中,基因组整合的基因是编码半乳糖基转移酶的基因,例如编码来自幽门螺杆菌的HP0826/galT基因(Genbank蛋白登录号NP_207619.1);在另一个实施方式中,基因组整合的基因是编码β-1,3-N-乙酰氨基葡萄糖基转移酶的基因,例如来自脑膜炎奈瑟菌的lgtA基因(Genbank蛋白登录AAF42258.1)。在这些实施方式中,第二个基因,即编码β-1,3-N-乙酰氨基葡萄糖基转移酶或半乳糖基转移酶的基因,相应地,可从基因组整合盒或质粒载体盒表达。第二个基因任选地在glp启动子的控制下或在适用于表达系统的任何其它启动子(例如Plac)的控制下表达。
HMO生产宿主细胞通常包含有功能的lacY和功能失调的lacZ基因。
由本发明的重组细胞生产的HMO可以使用本领域可用的合适方法纯化(例如,如WO2015188834、WO2017182965或WO2017152918中所述)。
能够糖转运的编码的多肽
糖转运涉及糖例如但不限于寡糖的转运,并且就本发明而言,涉及一种/或多种HMO流入和/或流出转运,从遗传修饰细胞的细胞质或周质至生产培养基和/或从生产培养基至遗传修饰细胞的细胞质或周质。因此,在遗传修饰细胞中表达的能够将HMO从细胞质或周质转运至生产培养基和/或从生产培养基转运至遗传修饰细胞的细胞质或周质的多肽是能够进行糖转运的多肽。因此,在本发明中,糖转运可以指糖例如但不限于寡糖的流出和/或流入转运。
在这方面,能够进行糖转运的多肽是属于主要易化因子超家族(MFS)的多肽。特别地,该多肽与SEQ ID NO:1具有大于95.4%,比如至少95.5%,比如至少96%、97%、98%或99%的序列同一性,或者它是本文所述的其功能性变体。SEQ ID NO:1是Fred蛋白的氨基酸序列。
本发明的遗传修饰细胞或核酸构建体包含核酸序列,比如编码Fred蛋白的异源基因。所述核酸序列与如SEQ ID No:2所示的fred基因具有至少70%的序列同一性,比如至少75%、80%、85%、90%、95%或99%。
核酸序列构建体编码SEQ ID NO:1的蛋白质或其功能性同源物,所述功能性同源物的氨基酸序列与SEQ ID NO:1具有大于95.4%、比如至少95.5%、96%、97%、98%或99%同一性。
可以通过诱变获得SEQ ID NO:1的蛋白质的功能性同源物。与SEQ ID NO:1的氨基酸序列的功能性相比,功能性同源物应具有至少50%,比如60%、70%、80%、90%或100%的剩余功能性。与SEQ ID NO:1的氨基酸序列的功能性相比,功能性同源物可以具有更高的功能性。SEQ ID NO:1的功能性同源物应该能够增强根据本发明的遗传修饰细胞的HMO生产。
遗传修饰细胞或核酸构建体可以含有一种或多种编码能够进行糖转运的多肽的核酸序列。更常见的是,本发明的遗传修饰细胞或核酸构建体编码能够糖转运的多肽的单拷贝。
包含目的基因的表达盒的单拷贝可足以确保所需HMO的生产并实现根据本发明的所需效果。因此,在一些优选实施方式中,本发明涉及重组HMO生产细胞,其包含整合在细胞基因组DNA中的一个或多个目的基因的一个、两个或三个拷贝。在一些实施方式中,优选一个或多个基因的单拷贝。
遗传修饰细胞或核酸构建体还可以含有一个或多个调控元件,用于调控编码糖转运多肽的核酸序列的表达,并且其中所述核酸序列与SEQ ID NO:2具有至少70%的序列同一性。
调控元件
如上所述,遗传修饰细胞或核酸构建体还可包含核酸序列,该核酸序列包含调控元件,其用于调控与SEQ ID NO:2具有至少70%序列同一性的核酸序列的表达。调控区的核酸序列可以是异源的或同源的。
术语,“调控元件”或“启动子”或“启动子区”或“启动子元件”是在转录启动期间被DNA依赖性RNA聚合酶标识和结合的核酸序列。启动子以及其它转录和翻译调控核酸序列(也称为“控制序列”)是表达给定基因或基因的组(操纵子)所必需的。一般而言,转录和翻译调控序列包括但不限于启动子序列、核糖体结合位点、转录起始和终止序列、翻译起始和终止序列以及增强子或激活子序列。“转录起始位点”意指第一个被转录的核苷酸,被指定为+1。起始位点下游的核苷酸编号为+2、+3、+4等,而5’相反(上游)的核苷酸编号为-1、-2、-3等。构建体的启动子可以来源于物种基因组中编码的任何基因的启动子区。优选地,大肠杆菌基因组DNA的启动子区。因此,任何能够与RNA聚合酶结合并启动转录的启动子都适用于实施本发明。原则上,任何启动子都可用于控制重组基因例如本发明的MFS转运蛋白或糖基转移酶的转录。在实施本发明时,可以使用不同或相同的启动子序列来驱动整合至宿主细胞基因组或表达载体DNA中的不同目的基因的转录。在一个实例中,启动子序列A启动MFS转运蛋白的表达,而另一启动子序列B或相同的启动子序列A启动糖基转移酶的表达。
为了使构建体中包含的重组基因得到最佳表达,构建体还可以包含调控序列,例如:前导DNA序列,例如源自大肠杆菌的glp基因的5’-非翻译区(5’UTR)的DNA序列,核糖体结合的序列。后面序列的实例在WO2019123324(并入本文以供参考)中进行了描述,并且在本文的非限制性工作实施例中进行了说明。
在本发明的一方面,可以将一种或多种调控元件插入至编码根据SEQ ID NO:2的fred基因的DNA构建体中和/或插入至编码根据本发明的一种或多种糖基转移酶的DNA构建体中。在本发明的另一方面,根据本发明,可以将根据SEQ ID NO:2的fred基因的一个或多个拷贝插入至DNA构建体中。在本发明的又一方面,根据本发明,可以将根据SEQ ID NO:2的fred基因插入至一个或多个相同或不同的DNA构建体中。
在本发明的一方面,本发明构建体中包含的用于调控重组基因表达的调控元件是glpFKX操纵子启动子PglpF。在本发明的另一方面,启动子是lac操纵子启动子Plac。并且在本发明的又一方面,调控元件是PglpF_SD4和/或PglpF_SD7,它们是PglpF序列的修饰后版本,包含启动子序列下游的经修饰的核糖体结合位点序列。然而,任何能够转录和/或调控一种或多种根据本发明的多肽的重组核酸的转录水平的启动子都适用于实施本发明。
通常,用于根据本发明表达异源基因的启动子选自表2。
表2.
Figure BDA0003758073950000241
Figure BDA0003758073950000251
本发明的遗传修饰细胞或核酸构建体中存在的优选调控元件选自PgatY_70UTR、PglpF、PglpF_SD1、PglpF_SD10、PglpF_SD2、PglpF_SD3、PglpF_SD4、PglpF_SD5、PglpF_SD6、PglpF_SD7、PglpF_SD8、PglpF_SD9、Plac_16UTR、Plac、PmglB_70UTR和PmglB_70UTR_SD4。
本发明的遗传修饰细胞或核酸构建体中存在的特别优选的调控元件选自PglpF、PglpF_SD4和PglpF_SD7。
用于生物合成生产的遗传修饰细胞
在本发明中,启动子对于在遗传修饰细胞中实现一种或多种HMO的最佳生物合成生产的水平和允许实现根据本发明的期望效果可能是必需的或有益的。因此,本发明的启动子序列能够转录和/或调控能够进行糖转运的多肽和/或本发明的糖基转移酶的表达,导致优化的HMO或HMO前体的生物合成和转运和/或降解HMO生产的副产物。
在本发明的遗传修饰细胞中,核酸构建体包含在遗传修饰细胞中,其编码与生物合成生产一种或多种HMO相关的至少一种基因、启动子DNA序列和其他调控序列,比如核糖体结合位点序列(例如Shine-Dalgarno序列)。在遗传修饰细胞中表达与生物合成生产一种或多种HMO相关的一个或多个基因能够生产HMO,从而使宿主细胞成为实施所述发明的“合适的宿主细胞”。在遗传修饰细胞中,如上所述,与生物合成生产HMO相关的一个或多个基因的表达,能够从1升包含遗传修饰细胞悬浮液的发酵培养基中以0.03g/l/OD(光密度)的水平生产一种或多种HMO。因此,HMO水平可以为约0.05g/l/OD至约0.5g/l/OD,比如至少0.4g/L/OD。为了本发明的目的,认为HMO生产的水平是“足够的”,并且认为能够生产该水平的所需HMO或HMO混合物的遗传修饰细胞是用于实施本发明的合适的遗传修饰细胞。
因此,根据本发明,“合适的遗传修饰细胞”可以进一步修饰,如上所述,以表达MFS家族的能够进行糖转运的糖多肽,例如fred,以一种或另一种方式实现有利的HMO生产,例如但不限于生物合成生产中更高的HMO水平、生物合成生产中更高水平的纯度、更快的生产时间和/或HMO的更高效生物合成生产。
生产方法
本发明的第二方面涉及一种生产一种或多种HMO的方法,该方法包括以下步骤:
(i)提供能够生产HMO的遗传修饰细胞,其中所述细胞包含编码SEQ ID NO:1的蛋白或其功能性同源物的重组核酸,所述功能性同源物的氨基酸序列与SEQ ID NO:1具有大于95.4%、比如至少95.5%同一性,优选至少96%同一性,更优选至少99.9%同一性;
(ii)在合适的细胞培养基中培养根据(i)的细胞,以允许HMO生产和DNA序列的表达,从而产生具有SEQ ID NO:1的氨基酸序列的蛋白,或其功能性同源物,所述功能性同源物的氨基酸序列与SEQID NO:1具有大于95.4%,比如至少95.5%同一性,优选至少96%同一性,更优选至少99.9%同一性;
(iii)收获步骤(ii)中生产的一种或多种HMO。
根据本发明,术语“培养(culturing)”(或“培养(cultivating)”或“培养(cultivation)”,也称为“发酵”)涉及根据业内已知方法在受控生物反应器中繁殖细菌表达细胞。
为了生产一种或多种HMO,根据本领域已知的程序,在合适的碳源(例如葡萄糖、甘油、乳糖等)存在下培养本文所描述的HMO生产菌,并且从培养基和培养过程期间形成的微生物生物量中收获产生的HMO。此后,根据本领域已知的程序(例如WO2015188834、WO2017182965或WO2017152918中所述)纯化HMO,并且纯化的HMO用作营养食品、药物或任何其它目的,例如用于研究。
HMO的制造通常通过大量培养来完成。本发明含义中的术语“制造”和“制造规模”定义了最小体积为5L培养液的发酵。经常地,“制造规模”工艺的定义是能够处理大量含有目的产品的制剂,并且产生一定量的目的蛋白,例如在治疗化合物或组合物的情况下,满足临床试验以及市场供应的需求。除了大体积之外,与简单的实验室规模方法如摇瓶培养相反,制造规模方法的特征在于使用生物反应器(发酵罐)的技术系统,该系统配备有用于搅拌、通气、营养补料、监测和控制工艺参数(pH、温度、溶解氧张力、背压等)的装置。在很大程度上,表达系统在实验室规模方法中的行为,例如摇瓶、台式生物反应器或本公开实施例中描述的深孔形式,确实允许预测该系统在生物反应器的复杂环境中的行为。
关于发酵过程中使用的合适细胞培养基,没有限制。培养基可为半定义的,即含有复杂培养基化合物(例如酵母提取物、大豆蛋白胨、酪氨酸氨基酸等),也可为化学定义的,不含任何复杂化合物。
术语“一种或多种HMO”意指HMO生产细胞可生产单个HMO结构(第一HMO)或多个HMO结构(第二、第三HMO等)。在一些实施方式中,可优选生产单个HMO的遗传修饰细胞,在其它优选实施方式中,可优选生产多个HMO结构的遗传修饰细胞。生产单HMO结构的遗传修饰细胞的非限制性示例为2’-FL、3-FL、3’-SL、6’-SL或LNT-2生产细胞。能够生产多种HMO结构的遗传修饰细胞的非限制性示例可为DFL、FSL、LNT、LNnT、LNFP I、LNFP II、LNFP III、LNFPIV、LNFP V、pLNnH、pLNH2生产细胞。
具体地,本发明涉及生产一种或多种单一HMO结构的遗传修饰细胞,其选自2’-FL、3-FL、DFL和LNT生产细胞。
本发明上下文中的术语“收获”涉及在终止要约后收集生产的HMO(一种或多种)。在不同实施方式中,其可包括收集生物量(即遗传修饰细胞)和培养基中包括的HMO(一种或多种),即在从生物量中分离发酵液之前/不从生物量中分离发酵液。在其它实施方式中,可从生物量和发酵液中分别收集所产生的HMO,即在从培养基(即发酵液)分离生物量之后。可使用本领域技术人员熟知的任何方法,诸如任何合适类型的离心或过滤,从培养基中分离细胞。从培养基中分离细胞可在收获发酵液后立即进行,或者在适当条件下储存发酵液后的稍后阶段进行。从剩余生物量(或总发酵)中回收产生的HMO,包括从生物量(生产细胞)中提取HMO。它可通过本领域任何合适的方法来完成,例如通过超声处理、煮沸、均质化、使用溶菌酶的酶促裂解或冷冻和研磨。
发酵回收后,HMO(一种或多种)可用于进一步加工和纯化。
发酵产生的HMO可使用WO2016095924、WO2015188834、WO2017152918、WO2017182965、US20190119314(全部通过引用并入)中所描述的适当程序来纯化。
在本发明的一些实施方式中,遗传修饰细胞可产生多种HMO,其中一种HMO是“产物”HMO,而一些/所有其它HMO是“副产物”HMO。通常,副产物HMO是主要HMO前体或主要HMO进一步改性的产物。在一些实施方式中,可能需要大量产生产物HMO和少量副产物HMO。本文所描述的用于HMO生产的细胞和方法允许控制生产具有定义的HMO分布的HMO产物,例如,在一个实施方式中,生产的HMO混合物,其中产物HMO是与混合物的其它HMO(即副产物HMO)相比的主要HMO,即产物HMO的产量高于其它副产物HMO;在其它实施方式中,生产相同HMO混合物的细胞可经调控以生产比产物HMO更多的一种或多种副产物HMO。例如,在2’-FL和/或3-FL的生产期间,产生了产物HMO,通常是大量的DFL,即副产物HMO。使用本发明的遗传修饰细胞,2’-FL和/或3-FL产物中的DFL水平可显著降低。
有利的是,本发明提供了降低的副产物与产物的比率和增加的产物(和/或HMO总量)的总产率。这种相对于产物形成而言较少的副产物形成促进了产物产量的提高,并且提高生产和产物回收过程的效率,提供优质的HMO制造程序。
在不同的优选实施方式中,可选择生产2’-FL、3-FL、DFL和/或LNT作为产物或副产物HMO的不同遗传修饰细胞。在一个优选实施方式中,产物为3-FL。在另一优选实施方式中,产物为2’-FL,而副产物为DFL。在另一优选实施方式中,产物为LNT-2,而副产物为LNT和LNFP I。
所述的本发明优选的HMO产物为2’-FL、LNT和3-FL。
用途
本发明还涉及如本文所述的宿主细胞用于生产一种或多种人乳寡糖(HMO)的用途。特别地,本发明涉及如本文所述的宿主细胞用于生产特定HMO的用途,其中选择宿主细胞的目的是生产大多数的一种特定HMO,优选选自2’-FL、3-FL和LNT,目前最优选3-FL。
一般性
应当理解,以上结合所述发明讨论的任何特征和/或方面通过类推方式适用于本文所述的方法。
下文提供以下附图和实施例来说明本发明。它们旨在说明并且不应解释为以任何方式进行限制。
实施例
材料和方法
除非另有说明,分子生物学领域中已知的标准技术、载体、控制序列元件和其它表达系统元件用于核酸操纵、转化和表达。此类标准技术、载体和元件可在以下内容中找到:Ausubel等(著),Current Protocols in Molecular Biology(1995)(John Wiley&Sons);Sambrook,Fritsch,&Maniatis(著),Molecular Cloning(1989)(Cold Spring HarborLaboratory Press,NY);Berger&Kimmel,Methods in Enzymology 152:Guide toMolecular Cloning Techniques(1987)(Academic Press);Bukhari等(著),DNAInsertion Elements,Plasmids and Episomes(1977)(Cold Spring Harbor LaboratoryPress,NY);Miller,J.H.Experiments in molecular genetics(1972.)(Cold springHarbor Laboratory Press,NY)。
选择以下描述的实施例来说明本发明并且不以任何方式限制本发明。
菌株
本实施例中使用的菌株在以下表3中描述。
表3.
Figure BDA0003758073950000301
CA=gmd-wcaG-wcaH-wcaI-manC-manB
*菌株MP3672和MP3020具有相同的异源GlcNAcT和Gal4T,但相应GlcNAcT编码基因的拷贝数不同
**菌株MP3994和MP4065具有相同的异源GlcNAcT和Gal4T,但相应GlcNAcT编码基因的拷贝数不同
培养
除非另有说明,否则大肠杆菌菌株在37℃下在含有0.2%葡萄糖的基本最低培养基中通过搅拌进行繁殖。琼脂板在37℃下孵育过夜。
基本最低培养基的组成如下:NaOH(1g/L)、KOH(2.5g/L)、KH2PO4(7g/L)、NH4H2PO4(7g/L)、柠檬酸(0.5g/L)、微量矿物质溶液(5mL/L)。微量矿物质储备液包含:ZnSO4*7H2O0.82g/L、柠檬酸20g/L、MnSO4*H2O 0.98g/L、FeSO4*7H2O 3.925g/L、CuSO4*5H2O 0.2g/L。用5N NaOH将基本最低培养基的pH值调整为7.0并高压灭菌。在接种之前,向基本最低培养基提供1mM MgSO4、4μg/mL硫胺素、0.5%的给定碳源(甘油(Carbosynth))。硫胺素和抗生素通过过滤灭菌。甘油的所有百分比浓度表示为v/v,葡萄糖的所有百分比浓度表示为w/v。
化学感受态细胞与转化
将大肠杆菌在37℃下从LB平板接种到含有0.2%葡萄糖的5mLLB中,摇动直至OD600~0.4。通过在13.000g下离心25秒获得2mL培养物。去除上清液,并且将细胞沉淀重新悬浮在600μL冷TB溶液中(10mM PIPES、15mM CaCl2、250mM KCl)。将细胞在冰上培养20分钟,随后在13000g下沉淀15秒。去除上清液,将细胞沉淀重新悬浮在100μL冷TB溶液中。使用100μL感受态细胞和1至10ng质粒DNA进行质粒转化。细胞和DNA在冰上孵育20分钟,然后在42℃下热击45秒。在冰上孵育2分钟后,加入400μL SOC(20g/L胰蛋白胨、5g/L酵母抽提物、0.5g/L NaCl、0.186g/L KCl、10mM MgCl2、10mM MgSO4和20mM葡萄糖),细胞培养物在37℃下振荡培养1小时,然后涂布在选择性平板上。
在供应商(ThermoFisher Scientific)推荐的条件下,将质粒转化进TOP10化学感受态细胞。
DNA技术
使用QIAprep Spin-Miniprep试剂盒(Qiagen)从大肠杆菌中分离质粒DNA。使用QIAmp DNA Mini试剂盒(Qiagen)从大肠杆菌中分离染色体DNA。使用QIAquick PCR纯化试剂盒(Qiagen)纯化PCR产物。按照供应商的建议使用DreamTaq PCR master mix(Thermofisher)、Phusion U热启动PCR mastermix(Thermofisher)、USEREnzym(新英格兰生物实验室)。引物由德国Eurofins Genomics公司提供。PCR片段和质粒通过EurofinsGenomics进行测序。菌群PCR使用DreamTaq PCR MasterMix在T100TM热循环仪(Bio-Rad)中进行。
在本发明的遗传修饰的HMO生产细胞中表达的异源蛋白在表4中描述,用于本发明以下示例的启动子元件在表5中描述,用于扩增质粒主链、启动子、元件和fred的寡核苷酸在表6中描述。
表4:遗传修饰的HMO生产细胞中表达的异源蛋白
Figure BDA0003758073950000321
Figure BDA0003758073950000331
*为了本发明的目的,给出基因名称以鉴定编码具有相应GenBank登录号的氨基酸序列的蛋白质的核酸。
表5:用于表达fred的合成DNA元件
Figure BDA0003758073950000332
Figure BDA0003758073950000341
Figure BDA0003758073950000351
表6:用于扩增质粒主链、启动子、元件和包括fred的目的基因的寡核苷酸
Figure BDA0003758073950000352
Figure BDA0003758073950000361
质粒的构建
合成了含有两个I-SceI内切酶位点的质粒主链,这两个位点被适于同源重组到大肠杆菌基因组中的两个DNA片段和T1转录终止子序列分开。例如,在一个质粒主链(pUC57::gal)中合成了gal操纵子(galK中同源重组所需)和T1转录终止子序列(GeneScript)。gal操纵子中用于同源重组的DNA序列包括序列大肠杆菌K-12MG155完整基因组GenBank:ID:CP014225.1中的碱基对3.628.621-3.628.720和3.627.572-3.627.671。通过同源重组插入将导致galK的949个碱基对缺失和galK-表型。以类似的方式,可合成基于pUC57(GeneScript)或含有两个I-SceI核酸内切酶位点的任何其它合适载体的主链,所述位点被适于同源重组到大肠杆菌基因组中的两个DNA片段和T1转录终止子序列分开。分子生物学领域中众所周知的标准技术用于设计引物和扩增大肠杆菌K-12DH1染色体DNA的特定DNA序列。例如,可在以下内容中找到此类标准技术、载体和元件:Ausubel等人(编辑),《分子生物学当前协议》(1995)(John Wiley&Sons);Sambrook,Fritsch和Maniatis(编辑),《分子克隆》(1989)(纽约冷泉港实验室出版社);Berger和Kimmel,《酶学方法》152:《分子克隆技术指南》(1987)(学术出版社);Bukhari等人(编辑)。
获自大肠杆菌DH1的染色体DNA被用于使用寡核苷酸O261和O262扩增包含启动子PglpF的300bp DNA片段,使用寡核苷酸O261和O459扩增PglpF_SD4,使用寡核苷酸O261和O462扩增PglpF_SD7(表6)。
通过Genescript合成一个1182bp的DNA片段,该片段含有源自弗氏耶尔森菌(Yersinia frederiksenii)的fred基因的密码子优化形式SEQ ID NO:2(表4)。使用寡核苷酸KABY733和KABY734扩增fred基因。
纯化所有PCR片段(质粒主链、包含启动子的元件和fred基因),组装质粒主链、启动子元件(Plac、PglpF、PglpF_SD4或PglpF_SD7)和含有fred(或其他目的基因,参见表4)的DNA片段。通过标准USER克隆法克隆质粒。可使用任何标准的DNA克隆技术在任何适当的质粒中进行克隆。将质粒转化到TOP10细胞中,并且在含有100μg/mL氨苄青霉素(或任何合适的抗生素)和0.2%葡萄糖的LB板上进行选择。纯化构建的质粒,并且通过DNA测序(MWGEurofins Genomics)验证启动子序列和fred基因的5’端。通过这种方式,构建了含有与fred(或其他目的基因,参见表4)基因相连的任何目的启动子的基因盒。
菌株的构建
使用的细菌菌株MDO是由大肠杆菌K-12DH1构建的。大肠杆菌K-12DH1基因型为:F-、λ-、gyrA96、recA1、relA1、endA1、thi-1、hsdR17、supE44。除了大肠杆菌K-12DH1基因型外,MDO还有以下修饰:lacZ:缺失1.5kbp;lacA:缺失0.5kbp;nanKETA:缺失3.3kbp;melA:缺失0.9kbp;wcaJ:缺失0.5kbp;mdoH:缺失0.5kbp,以及在gmd基因上游插入Plac启动子。
如Herring等人(Herring,C.D.,Glasner,J.D.和Blattner,F.R.(2003).Gene(311).153-163)所述,基本通过Gene Gorging进行包含与fred基因和T1转录终止子序列相连的启动子的表达盒的插入在大肠杆菌K-12DH1 MDO的染色体DNA中。简而言之,将供体质粒和辅助质粒共转化到MDO中,并且在含有0.2%葡萄糖、氨苄青霉素(100μg/mL)或卡那霉素(50mg/mL)和氯霉素(20μg/mL)的LB板上进行选择。将单个菌落接种在1mL含有氯霉素(20μg/mL)的和10μL的20%L-阿拉伯糖的LB中,并且在37℃下振荡培养7至8小时。为了整合到大肠杆菌细胞的galK位点上,然后将其接种在M9-DOG平板上,并且在37℃下孵育48小时。在含有0.2%葡萄糖的LB平板上重新划线在MM-DOG平板上形成的单个菌群,并且在37℃下培养24小时。在MacConkey半乳糖琼脂平板上显示白色并且对氨苄青霉素和氯霉素均敏感的菌落预计已失去供体和辅助质粒,并且在galK位点中具有插入。使用引物O48(SEQ ID NO:17)和O49(SEQ ID NO:18)通过菌落PCR鉴定galK位点的插入,并且通过测序(EurofinsGenomics,德国)验证插入的DNA。
使用不同的选择标记基因和不同的筛选方法以类似的方式在大肠杆菌染色体DNA的其它位点插入遗传盒。
深孔试验
深孔试验如Lv等人(Bioprocess Biosyst Eng(2016)39:1737–1747)最初所述进行,并针对本发明的目的进行优化。
更具体地,实施例中公开的菌株使用4天方案在24个深孔板中筛选。在最初的24小时内,在34℃下摇床培养细胞以700rpm振荡生长至高密度,而在接下来,48小时用于2’-FL和3-FL生产细胞,72小时用于LNT生产细胞,将细胞转移至允许诱导基因表达和产物形成的培养基中。具体地,在第1天,使用补充有硫酸镁、硫胺素和葡萄糖的基础最低培养基制备新鲜接种物。孵育24小时后,将细胞转移至补充有硫酸镁和硫胺素的新的基础最低培养基(2ml)中并添加由20%葡萄糖溶液(1μl)和10%乳糖溶液(0.1ml)组成的初始大剂量加入,然后将50%蔗糖溶液(0.04ml)作为碳源提供至细胞,同时加入蔗糖水解酶(转化酶,5μl的0.1g/L溶液),通过由转化酶裂解蔗糖从而以缓慢的速率提供葡萄糖用于生长。接种新培养基后,在28℃下将细胞以700rpm振荡48小时。在变性和随后的离心之后,通过HPLC分析上清液。对于总样品的分析,通过在4,700rpm下离心10分钟使煮沸制备的细胞裂解物沉淀。上清液中的HMO浓度通过HPLC或HPAC方法测定。
实施例1–2’-FL的生产
表达fred基因的用于2’-FL生产的大肠杆菌的工程化
可以操纵大肠杆菌K-12(DH1)MDO菌株来表达目的异源基因。例如,菌株1是一种2’-FL生产菌株,其过表达α1,2-岩藻糖基转移酶基因futC和结肠酸基因(gmd-wcaG-wcaH-wcaI-manC-manB)。将单拷贝的含有连接至fred的启动子元件(PglpF)的表达盒插入到菌株1背景中,从而产生菌株2。深孔试验的结果表明,使用PglpF表达fred基因i)使2’-FL生产增加1.15倍(总2’-FL产生增加15%),ii)通过降低细胞级分中2’-FL的量和增加培养基中2’-FL的量改善2’-FL产物分布。
实施例2–3-FL的生产
表达fred基因的用于3-FL生产的大肠杆菌的工程化
可以操纵大肠杆菌K-12(DH1)MDO菌株来表达目的异源基因。例如,菌株3是一种3-FL生产菌株,其过表达α-1,3-岩藻糖基转移酶基因futA和结肠酸基因(gmd-wcaG-wcaH-wcaI-manC-manB)。将单拷贝的含有连接至fred的启动子元件(PglpF)的表达盒插入到菌株3背景中,从而产生菌株4。深孔试验的结果表明,使用PglpF表达fred基因i)使3-FL生产增加几乎2倍(总3-FL生产增加90%),ii)通过降低细胞级分中3-FL的量和增加培养基中3-FL的量改善3-FL产物分布。
实施例3–LNT的生产
表达fred基因的用于LNT生产的大肠杆菌的工程化
可以操纵大肠杆菌K-12(DH1)MDO菌株来表达目的异源基因。例如,菌株5是一种LNT生产菌株,其过表达β-1,3-N-乙酰氨基葡萄糖基转移酶lgtA和β-1,3-半乳糖基转移酶galTK。将包含与单拷贝的fred连接的启动子元件(PglpF_SD4)的表达盒插入菌株5背景中,产生菌株6。将包含与单拷贝的fred连接的启动子元件(PglpF_SD7)的表达盒插入菌株5背景中,产生菌株7。深孔试验的结果表明,使用PglpF_SD4或PglpF_SD7表达fred基因i)使LNT生产增加1.2-1.3倍(总LNT生产增加20-30%),ii)通过降低细胞级分中LNT的量和增加培养基中LNT的量略微改善LNT产物分布。
实施例1-3总结
在2’-FL、LNT或3-FL生产菌株中,fred的染色体表达增加了HMO生产,而在2’-FL和3-FL的情况下,fred的表达降低了细胞内HMO的量(沉淀物级分)。
因此,主要易化因子超家族蛋白fred的HMO输出增加了生产菌株的HMO生产能力。
表7.
Figure BDA0003758073950000401
*HMO生产的菌株背景
实施例4-Vag转运体是对LNnT具有高选择性的新型LNT-2-核心转运体
表6:用于菌株构建的辅助和供体质粒的实例
质粒 相关基因型 标记基因
pACBSR Para-I-SceI-λRed,p15A ori,cam* cam
pUC57 pMB1,bla bla
pUC57::ga, pUC57::galTK’/T1-galKM’ bla
编码目的转运蛋白或糖基转移酶的异源基因的DNA序列由GenScript进行密码子优化和合成。使用合适的覆盖基因(表3)的起始密码子ATG和终止密码子TAA的引物,通过PCR扩增表4中所示的编码转运蛋白的目的基因。为了构建具有任何目的异源基因的供体质粒,使用标准USER克隆来组合相关质粒主链、启动子元件和目的基因的纯化PCR片段。可以使用任何标准的DNA克隆技术在适当的质粒中进行克隆。克隆后,将DNA转化至TOP10细胞并在含有100μg/mL氨苄青霉素(或50mg/mL卡那霉素,取决于所应用的主链)和0.2%葡萄糖的LB板上进行选择。纯化构建的质粒,并通过DNA测序(MWG Eurofins Genomics)验证启动子序列和目的基因的5’端。
菌株的构建
使用的细菌菌株MDO由大肠杆菌K-12DH1构建。大肠杆菌K-12DH1基因型为:Fˉ、λ-、gyrA96、recA1、relA1、endA1、thi-1、hsdR17、supE44。除了大肠杆菌K-12DH1基因型,MDO有以下修饰:lacZ:缺失1.5kbp、lacA缺失0.5kbp、nanKETA:缺失3.3kbp、melA:缺失0.9kbp、wcaJ:缺失0.5kbp、mdoH:缺失0.5kbp、并在gmd基因上游插入Plac启动子。
基本上如Herring等人(Herring,C.D.,Glasner,J.D.和Blattner,F.R.(2003).Gene(311).153-163)所述,通过Gene Gorging插入包含与vag基因和T1转录终止子序列连接的启动子的表达盒,用于构建本申请中呈现的菌株的辅助和供体质粒的实例在表6中提供。简言之,将供体质粒和辅助质粒共转化至MDO并在含有0.2%葡萄糖、氨苄青霉素(100μg/mL)或卡那霉素(50mg/mL)和氯霉素(20μg/mL)的LB平板上选择。将单个菌落接种在含有氯霉素(20μg/mL)和10μL 20%L-阿拉伯糖的1mL LB中,并在37℃振荡培养7至8小时。然后为了整合至大肠杆菌的galK位点中,将细胞涂布在M9-DOG板上,并在37℃孵育48小时。在MM-DOG板上形成的单个菌落在含有0.2%葡萄糖的LB板上重新划线,并在37℃孵育24小时。MacConkey-半乳糖琼脂平板上出现白色且对氨苄青霉素和氯霉素均敏感的菌落预计已丢失供体和辅助质粒并在galK位点中包含插入。使用引物O48(SEQ ID NO:17)和O49(SEQ IDNO:18)通过菌落PCR鉴定galK位点中的插入,并且通过测序(Eurofins Genomics,Germany)验证插入的DNA。
使用不同的选择标记基因以类似的方式在大肠杆菌染色体DNA的其他位点插入遗传盒。
序列比对
如在NCBI数据库(http://www.ncbi.nlm.nih.gov)上在BLAST 2.1.2(BasicLocal Alignment Search Tool)(Altschul等.1990)中所实施的,进行启发式成对序列比对,以测试本发明所述的转运蛋白序列中的同源性。对于每个BLAST比对,所有参数都保持在其默认值。
在本发明中,我们使用参考菌株,即MP3672,测试了选定的异源MFS转运体将LNnT输出宿主细胞的能力。该菌株具有产物形成所需的每种异源糖基转移酶的一个PglpF驱动拷贝。
将每个选定的异源转运体基因,即vag、yberC0001_9420、marc、bad、nec、yabM和fred(表4)的一个拷贝,在Plac启动子的控制下单独整合到菌株MP3672的基因组中,该启动子已知提供中等转录水平。Plac启动子的核糖体结合位点(即翻译起始位点上游16bp)已被修改(参见表5)以加强核糖体与合成的转录物的结合,并以这种方式正向调控Plac驱动的翻译水平的表达。
遵循上述菌株工程化方法并在DWA中测试菌株性能,我们在此报告,与参考菌株相比,只有表达Vag的LNnT生产细胞在产生的LNnT的流出和LNnT总产量方面都显示出相对增加。
如图7所示,大多数转运体基因(marc、fred、bad、nec、yabM、yberC0001_9420)的Plac驱动表达要么没有显著影响,要么减少LNnT的产生(低至45%)。相反,在MP3672菌株的遗传背景中引入vag基因导致LNnT滴度显著增加(图7)。
七个测试的推定MSF转运蛋白的氨基酸序列比对显示,Vag转运蛋白与本发明中测试的其余六种转运蛋白具有非常高的序列覆盖率(99%至100%),序列同一性范围为65%至75%。Vag序列和yabM基因编码的MFS转运体序列的序列同一性得分最高(75%)(表8)。有趣的是,MFS转运体YabM,在WO2017042382中描述为LNT的推定有效输出者,对最终的总LNnT滴度和LNnT流出都没有显示出任何显著影响(图7、8)。因此,与其与Vag相对较高的蛋白质序列相似性相反,YabM转运体似乎对LNnT转运无效,这清楚地反映在相应宿主细胞培养物的细胞外的级分中检测到的产物浓度上(图8)。具体地,正如对细菌培养物上清液的级分的分析所揭示的,菌株MP3994(表达vag的细胞)的细胞外LNnT浓度远高于菌株MP4362(表达yabM的细胞)和MP3672(不表达异源转运蛋白的参考细胞)(图8)。
总之,这些数据表明Vag转运体是LNnT的有效转运体。这一结论源于在相同参考菌株、相同培养条件和相同启动子Plac的控制下基因组表达的七种转运蛋白基因的筛选程序的结果,也源于对转运蛋白序列的分析,揭示了与Vag同源性较高的转运蛋白,如YabM和Marc(75%和71%),根本不输出LNnT,或者如果输出,效率非常低。
表8:本发明的不同异源转运体之间的同源性:
Figure BDA0003758073950000431
序列表
<110> 格礼卡姆股份公司
<120> HMO生产中的新的主要易化因子超家族(MFS)蛋白质(FRED)
<130> P2876WO00
<150> DK202000087
<151> 2020-01-23
<160> 33
<170> BiSSAP 1.3.6
<210> 1
<211> 393
<212> PRT
<213> 弗氏耶尔森菌
<220>
<223> fred_WP_087817556.1\优化后的翻译:
<400> 1
Met Lys Ser Ala Leu Thr Phe Ser Arg Arg Ile Asn Pro Val Phe Leu
1 5 10 15
Ala Phe Phe Val Val Ala Phe Leu Ser Gly Ile Ala Gly Ala Leu Gln
20 25 30
Ala Pro Thr Leu Ser Leu Phe Leu Ser Thr Glu Val Lys Val Arg Pro
35 40 45
Leu Trp Val Gly Leu Phe Tyr Thr Val Asn Ala Ile Ala Gly Ile Thr
50 55 60
Val Ser Phe Val Leu Ala Lys Arg Ser Asp Leu Arg Gly Asp Arg Arg
65 70 75 80
Lys Leu Ile Leu Val Cys Tyr Leu Met Ala Val Gly Asn Cys Leu Leu
85 90 95
Phe Ala Phe Asn Arg Asp Tyr Leu Thr Leu Ile Thr Ala Gly Val Leu
100 105 110
Leu Ala Ala Val Ala Asn Thr Ala Met Pro Gln Ile Phe Ala Leu Ala
115 120 125
Arg Glu Tyr Ala Asp Asn Ser Ala Arg Glu Val Val Met Phe Ser Ser
130 135 140
Ile Met Arg Ala Gln Leu Ser Leu Ala Trp Val Ile Gly Pro Pro Leu
145 150 155 160
Ser Phe Met Leu Ala Leu Asn Tyr Gly Phe Thr Leu Met Phe Cys Ile
165 170 175
Ala Ala Gly Ile Phe Val Leu Ser Ala Leu Val Val Trp Phe Ile Leu
180 185 190
Pro Ser Val Gln Arg Ala Glu Pro Val Met Asp Ala Pro Thr Val Ala
195 200 205
Gln Gly Ser Leu Phe Ala Asp Lys Asp Val Leu Leu Leu Phe Ile Ala
210 215 220
Ser Met Leu Met Trp Thr Cys Asn Thr Met Tyr Ile Ile Asp Met Pro
225 230 235 240
Leu Tyr Ile Thr Ala Ser Leu Gly Leu Pro Glu Arg Leu Ala Gly Leu
245 250 255
Leu Met Gly Thr Ala Ala Gly Leu Glu Ile Pro Ile Met Leu Leu Ala
260 265 270
Gly Tyr Ser Val Arg Arg Phe Gly Lys Arg Lys Ile Met Leu Phe Ala
275 280 285
Val Leu Ala Gly Val Leu Phe Tyr Thr Gly Leu Val Leu Phe Lys Phe
290 295 300
Lys Ser Ala Leu Met Leu Leu Gln Ile Phe Asn Ala Ile Phe Ile Gly
305 310 315 320
Ile Val Ala Gly Ile Gly Met Leu Tyr Phe Gln Asp Leu Met Pro Gly
325 330 335
Arg Ala Gly Ala Ala Thr Thr Leu Phe Thr Asn Ser Ile Ser Thr Gly
340 345 350
Val Ile Leu Ala Gly Val Leu Gln Gly Val Leu Thr Glu Thr Trp Gly
355 360 365
His Asn Ser Val Tyr Val Met Ala Met Ile Leu Ala Ile Leu Ser Leu
370 375 380
Ile Ile Cys Ala Arg Val Arg Glu Ala
385 390
<210> 2
<211> 1182
<212> DNA
<213> 弗氏耶尔森菌
<220>
<223> fred 核苷酸序列
<400> 2
atgaagagcg cgctgacctt cagccgtcgt attaacccgg tttttctggc gttctttgtg 60
gttgcgttcc tgagcggtat tgcgggtgcg ctgcaggcgc cgaccctgag cctgttcctg 120
agcaccgagg tgaaagttcg tccgctgtgg gtgggcctgt tctacaccgt taacgcgatt 180
gcgggtatca ccgtgagctt tgttctggcg aagcgtagcg acctgcgtgg cgatcgtcgt 240
aaactgatcc tggtgtgcta cctgatggcg gttggtaact gcctgctgtt cgcgtttaac 300
cgtgactatc tgaccctgat taccgcgggc gtgctgctgg cggcggttgc gaacaccgcg 360
atgccgcaga ttttcgcgct ggcgcgtgag tacgcggata acagcgcgcg tgaagtggtt 420
atgtttagca gcattatgcg tgcgcaactg agcctggcgt gggttatcgg tccgccgctg 480
agcttcatgc tggcgctgaa ctatggcttc accctgatgt tttgcattgc ggcgggtatc 540
ttcgtgctga gcgcgctggt tgtgtggttt attctgccga gcgtgcagcg tgcggaaccg 600
gttatggatg cgccgaccgt ggcgcaaggc agcctgttcg cggacaagga tgttctgctg 660
ctgtttattg cgagcatgct gatgtggacc tgcaacacca tgtacatcat tgatatgccg 720
ctgtatatca ccgcgagcct gggtctgccg gagcgtctgg cgggtctgct gatgggcacc 780
gcggcgggtc tggaaatccc gattatgctg ctggcgggct acagcgtgcg tcgttttggc 840
aagcgtaaaa tcatgctgtt cgcggtgctg gcgggcgttc tgttttatac cggtctggtt 900
ctgttcaagt ttaaaagcgc gctgatgctg ctgcagattt tcaacgcgat ctttattggt 960
atcgtggcgg gtatcggcat gctgtacttc caagacctga tgccgggtcg tgcgggtgcg 1020
gcgaccaccc tgtttaccaa cagcattagc accggcgtta tcctggcggg cgtgctgcaa 1080
ggtgttctga ccgaaacctg gggtcacaac agcgtgtatg ttatggcgat gattctggcg 1140
atcctgagcc tgatcatttg cgcgcgtgtg cgtgaagcgt aa 1182
<210> 3
<211> 291
<212> DNA
<213> 人工序列
<220>
<223> 启动子序列 PgatY_70UTR
<400> 3
cggcaaccta tgcctgatgc gacgctgaag cgtcttatca tgcctacata gcactgccac 60
gtatgtttac accgcatccg gcataaaaac acgcgcactt tgctacggct tccctatcgg 120
gaggccgttt ttttgccttt cactcctcga ataattttca tattgtcgtt tttgtgatcg 180
ttatctcgat atttaaaaac aaataatttc attatatttt gtgcctacaa gcatcgtgga 240
ggtccgtgac tttcacgcat acaacaaaca ttaaccaagg aggaaacagc t 291
<210> 4
<211> 300
<212> DNA
<213> 人工序列
<220>
<223> PglpF 调控序列
<300>
<310> WO2019123324
<311> 19.12.2018
<312> 27.06.2019
<313> 1-300
<400> 4
gcggcacgcc ttgcagatta cggtttgcca cacttttcat ccttctcctg gtgacataat 60
ccacatcaat cgaaaatgtt aataaatttg ttgcgcgaat gatctaacaa acatgcatca 120
tgtacaatca gatggaataa atggcgcgat aacgctcatt ttatgacgag gcacacacat 180
tttaagttcg atatttctcg tttttgctcg ttaacgataa gtttacagca tgcctacaag 240
catcgtggag gtccgtgact ttcacgcata caacaaacat taaccaagga ggaaacagct 300
<210> 5
<211> 300
<212> DNA
<213> 人工序列
<220>
<223> PglpF_SD4 调控序列
<300>
<310> WO2019123324
<311> 19.12.2018
<312> 27.06.2019
<313> 1-300
<400> 5
gcggcacgcc ttgcagatta cggtttgcca cacttttcat ccttctcctg gtgacataat 60
ccacatcaat cgaaaatgtt aataaatttg ttgcgcgaat gatctaacaa acatgcatca 120
tgtacaatca gatggaataa atggcgcgat aacgctcatt ttatgacgag gcacacacat 180
tttaagttcg atatttctcg tttttgctcg ttaacgataa gtttacagca tgcctacaag 240
catcgtggag gtccgtgact ttcacgcata caacaaacat taaccaacta ggaaacagct 300
<210> 6
<211> 300
<212> DNA
<213> 人工序列
<220>
<223> PglpF_SD7 调控序列
<300>
<310> WO2019123324
<311> 19.12.2018
<312> 27.06.2019
<313> 1-300
<400> 6
gcggcacgcc ttgcagatta cggtttgcca cacttttcat ccttctcctg gtgacataat 60
ccacatcaat cgaaaatgtt aataaatttg ttgcgcgaat gatctaacaa acatgcatca 120
tgtacaatca gatggaataa atggcgcgat aacgctcatt ttatgacgag gcacacacat 180
tttaagttcg atatttctcg tttttgctcg ttaacgataa gtttacagca tgcctacaag 240
catcgtggag gtccgtgact ttcacgcata caacaaacat taaccaagag caaaacagct 300
<210> 7
<211> 203
<212> DNA
<213> 人工序列
<220>
<223> 启动子序列 PmglB_70UTR
<400> 7
tgcgtcgcca ttctgtcgca acacgccaga atgcggcggc gatcactaac tcaacaaatc 60
aggcgatgta accgctttca atctgtgagt gatttcacag tatcttaaca atgtgatagc 120
tatgattgca ccgtgcctac aagcatcgtg gaggtccgtg actttcacgc atacaacaaa 180
cattaaccaa ggaggaaaca gct 203
<210> 8
<211> 203
<212> DNA
<213> 人工序列
<220>
<223> 启动子序列 PmglB_70UTR_SD4
<400> 8
tgcgtcgcca ttctgtcgca acacgccaga atgcggcggc gatcactaac tcaacaaatc 60
aggcgatgta accgctttca atctgtgagt gatttcacag tatcttaaca atgtgatagc 120
tatgattgca ccgtgcctac aagcatcgtg gaggtccgtg actttcacgc atacaacaaa 180
cattaaccaa ctaggaaaca gct 203
<210> 9
<211> 34
<212> DNA
<213> 人工序列
<220>
<223> 引物 O40 主链.for
<220>
<221> misc_RNA
<222> 9
<400> 9
attaacccuc caggcatcaa ataaaacgaa aggc 34
<210> 10
<211> 32
<212> DNA
<213> 人工序列
<220>
<223> 引物 O79 主链.rev
<220>
<221> misc_RNA
<222> 10
<400> 10
atttgcgcau caccaatcaa attcacgcgg cc 32
<210> 11
<211> 32
<212> DNA
<213> 人工序列
<220>
<223> 引物 O261, PglpF.for
<220>
<221> misc_RNA
<222> 10
<400> 11
atgcgcaaau gcggcacgcc ttgcagatta cg 32
<210> 12
<211> 36
<212> DNA
<213> 人工序列
<220>
<223> 引物 O262, PglpF.rev
<220>
<221> misc_RNA
<222> 8
<400> 12
agctgttucc tccttggtta atgtttgttg tatgcg 36
<210> 13
<211> 36
<212> DNA
<213> 人工序列
<220>
<223> 引物 O459, PglpF_SD4
<220>
<221> misc_RNA
<222> 8
<400> 13
agctgttucc tagttggtta atgtttgttg tatgcg 36
<210> 14
<211> 36
<212> DNA
<213> 人工序列
<220>
<223> 引物 O462, PglpF_SD7
<220>
<221> misc_RNA
<222> 8
<400> 14
agctgttutg ctcttggtta atgtttgttg tatgcg 36
<210> 15
<211> 31
<212> DNA
<213> 人工序列
<220>
<223> 引物 KABY733, fred.for
<220>
<221> misc_RNA
<222> 8
<400> 15
aaacagcuat gaagagcgcg ctgaccttca g 31
<210> 16
<211> 29
<212> DNA
<213> 人工序列
<220>
<223> 引物 KABY734, fred.rev
<220>
<221> misc_RNA
<222> 9
<400> 16
agggttaaut tacgcttcac gcacacgcg 29
<210> 17
<211> 24
<212> DNA
<213> 人工序列
<220>
<223> 引物 O48, galK.for
<400> 17
cccagcgaga cctgaccgca gaac 24
<210> 18
<211> 24
<212> DNA
<213> 人工序列
<220>
<223> 引物 O49, glaK.rev
<400> 18
ccccagtcca tcagcgtgac tacc 24
<210> 19
<211> 195
<212> DNA
<213> 人工序列
<220>
<223> Plac 表达元件
<300>
<310> WO2019123324
<311> 19.12.2018
<312> 27.06.2019
<400> 19
atgcgcaaat tgtgagttag ctcactcatt aggcacccca ggctttacac tttatgcttc 60
cggctcgtat gttgtgtgga attgtgagcg gataacaatt tcacacagga aacagctatg 120
accatgatta cgccaagcgc gcaattaacc ctcactaaag ggaacaaaag ctgggtacct 180
aaggaggaaa cagct 195
<210> 20
<211> 32
<212> DNA
<213> 人工序列
<220>
<223> 引物 O68, Plac.for
<220>
<221> misc_RNA
<222> 10
<400> 20
atgcgcaaau tgtgagttag ctcactcatt ag 32
<210> 21
<211> 36
<212> DNA
<213> 人工序列
<220>
<223> 引物 O133, Plac.rev
<220>
<221> misc_RNA
<222> 8
<400> 21
agctgttucc tccttaggta cccagctttt gttccc 36
<210> 22
<211> 33
<212> DNA
<213> 人工序列
<220>
<223> 引物 KABY745, vag.for
<400> 22
aaacagcuat gaagagcctg ctgacccgta aac 33
<210> 23
<211> 31
<212> DNA
<213> 人工序列
<220>
<223> 引物 KABY746, vag.rev
<220>
<221> misc_RNA
<222> 9
<400> 23
agggttaaut taaacgtttt tcacacgcgc g 31
<210> 24
<211> 32
<212> DNA
<213> 人工序列
<220>
<223> 引物 KABY721, yberC0001_9420.for
<220>
<221> misc_RNA
<222> 8
<400> 24
aaacagcuat gaagagcgcg ctgaccttta gc 32
<210> 25
<211> 29
<212> DNA
<213> 人工序列
<220>
<223> 引物 KABY722, yberC0001_9420.rev
<220>
<221> misc_RNA
<222> 9
<400> 25
agggttaaut tacgcctcac gcacacgcg 29
<210> 26
<211> 29
<212> DNA
<213> 人工序列
<220>
<223> 引物 KABY729, bad.for
<220>
<221> misc_RNA
<222> 8
<400> 26
aaacagcuat gagcagccgt cgtctgagc 29
<210> 27
<211> 36
<212> DNA
<213> 人工序列
<220>
<223> 引物 KABY730, bad.rev
<220>
<221> misc_RNA
<222> 9
<400> 27
agggttaaut tacacgtttt taacacgggt catcag 36
<210> 28
<211> 28
<212> DNA
<213> 人工序列
<220>
<223> 引物 KABY741, nec.for
<220>
<221> misc_RNA
<222> 8
<400> 28
aaacagcuat gcagagcttc accccgcc 28
<210> 29
<211> 34
<212> DNA
<213> 人工序列
<220>
<223> 引物 KABY742, nec.rev
<220>
<221> misc_RNA
<222> 9
<400> 29
agggttaaut tacgcctgct ctttaacacg cagc 34
<210> 30
<211> 31
<212> DNA
<213> 人工序列
<220>
<223> 引物 KABY737, marc.for
<220>
<221> misc_RNA
<222> 8
<400> 30
aaacagcuat gcagcgtctg agccgtctga g 31
<210> 31
<211> 32
<212> DNA
<213> 人工序列
<220>
<223> 引物 KABY738, marc.rev
<220>
<221> misc_RNA
<222> 9
<400> 31
agggttaaut taaacttcac gcactttcgc gc 32
<210> 32
<211> 31
<212> DNA
<213> 人工序列
<220>
<223> 引物 MP1217, yabM.for
<220>
<221> misc_RNA
<222> 8
<400> 32
aaacagcuat gaaggcgctg tggagccgtc g 31
<210> 33
<211> 31
<212> DNA
<213> 人工序列
<220>
<223> 引物 MP1218, yabM.rev
<220>
<221> misc_RNA
<222> 9
<400> 33
agggttaauc gccagcggaa cgctcttcac g 31

Claims (14)

1.一种能够生产一种或多种人乳寡糖(HMO)的遗传修饰细胞,其中所述遗传修饰细胞包含编码SEQ ID NO:1所示的主要易化因子超家族(MFS)多肽或其功能性同源物的异源核酸序列,所述功能性同源物的氨基酸序列与SEQ ID NO:1具有大于95.4%同一性。
2.根据权利要求1所述的遗传修饰细胞,其中所述功能性同源物与SEQ ID NO:1具有至少96%同一性。
3.根据权利要求1所述的遗传修饰细胞,其中所述细胞还包含核酸序列,所述核酸序列包含用于调控所述异源核酸序列的表达的调控元件。
4.根据权利要求3所述的遗传修饰细胞,其中所述调控元件调控SEQ ID NO:1所示的MFS多肽或其功能性同源物的表达,所述功能性同源物的氨基酸序列与SEQ ID NO:1具有大于95.4%同一性。
5.根据权利要求3或4所述的遗传修饰细胞,其中所述调控元件选自PglpF、PglpF_SD4和PglpF_SD7。
6.根据前述权利要求中任一项所述的遗传修饰细胞,其中所述遗传修饰细胞是大肠杆菌(Escherichia coli)。
7.根据前述权利要求中任一项所述的遗传修饰细胞,其中所述人乳寡糖选自2’-岩藻糖基乳糖(2’-FL)、3-岩藻糖基乳糖(3-FL)、二岩藻糖基乳糖(DFL)和乳-N-四糖(LNT)。
8.一种核酸构建体,其包含编码根据SEQ ID NO:1的MFS多肽或其功能性同源物的核酸序列,所述功能性同源物与SEQ ID NO:1具有大于95.4%的序列同一性,其中编码MFS多肽的所述核酸序列与SEQ ID NO:2具有至少70%的序列同一性。
9.根据权利要求8所述的核酸构建体,其中所述构建体还包含:包含调控元件的核酸序列。
10.根据权利要求9所述的核酸构建体,其中所述调控元件调控与SEQ ID NO:2具有至少70%序列同一性的所述核酸序列的表达。
11.根据权利要求9-10中任一项所述的核酸构建体,其中所述调控元件选自PglpF、PglpF_SD4和PglpF_SD7。
12.一种生物合成生产一种或多种人乳寡糖(HMO)的方法,所述方法包括以下步骤:
(i)提供根据权利要求1-7中任一项所述的遗传修饰细胞;
(ii)在合适的细胞培养基中培养根据(i)的所述遗传修饰细胞以表达能够外排糖转运的所述多肽并生产一种或多种人乳寡糖(HMO),和;
(iii)收获步骤(ii)中产生的一种或多种HMO。
13.根据权利要求1-7中任一项所述的遗传修饰细胞或根据权利要求8-11中任一项所述的核酸构建体用于生物合成生产一种或多种人乳寡糖(HMO)的用途。
14.根据权利要求13所述的遗传修饰细胞或核酸构建体的用途,用于生物合成生产选自2’-FL、3-FL、DFL和LNT的特定HMO。
CN202180010227.2A 2020-01-23 2021-01-22 Hmo生产中的新的主要易化因子超家族(mfs)蛋白质(fred) Pending CN115003813A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
DKPA202000087 2020-01-23
DKPA202000087 2020-01-23
PCT/EP2021/051479 WO2021148620A1 (en) 2020-01-23 2021-01-22 New major facilitator superfamily (mfs) protein (fred) in hmo production

Publications (1)

Publication Number Publication Date
CN115003813A true CN115003813A (zh) 2022-09-02

Family

ID=83023792

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202180010227.2A Pending CN115003813A (zh) 2020-01-23 2021-01-22 Hmo生产中的新的主要易化因子超家族(mfs)蛋白质(fred)

Country Status (5)

Country Link
US (1) US20230109937A1 (zh)
EP (1) EP4093876A1 (zh)
JP (1) JP2023511525A (zh)
CN (1) CN115003813A (zh)
BR (1) BR112022014376A2 (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN118056902A (zh) * 2022-11-21 2024-05-21 山东恒鲁生物科技有限公司 合成HMOs的成熟多肽序列及应用

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2015150328A1 (en) * 2014-03-31 2015-10-08 Jennewein Biotechnologie Gmbh Total fermentation of oligosaccharides
CN107108677A (zh) * 2014-10-24 2017-08-29 格礼卡姆股份公司 Hmo的混合物
CN108026556A (zh) * 2015-09-12 2018-05-11 詹尼温生物技术有限责任公司 在具有经改造的输入/输出的微生物宿主中人乳寡糖的产生
CN109609422A (zh) * 2018-11-20 2019-04-12 安徽天凯生物科技有限公司 一种可以产2’-岩藻基乳糖菌株的构建方法
WO2019123324A1 (en) * 2017-12-21 2019-06-27 Glycom A/S Nucleic acid construct for in vitro and in vivo gene expression

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2015150328A1 (en) * 2014-03-31 2015-10-08 Jennewein Biotechnologie Gmbh Total fermentation of oligosaccharides
CN107108677A (zh) * 2014-10-24 2017-08-29 格礼卡姆股份公司 Hmo的混合物
CN108026556A (zh) * 2015-09-12 2018-05-11 詹尼温生物技术有限责任公司 在具有经改造的输入/输出的微生物宿主中人乳寡糖的产生
WO2019123324A1 (en) * 2017-12-21 2019-06-27 Glycom A/S Nucleic acid construct for in vitro and in vivo gene expression
CN109609422A (zh) * 2018-11-20 2019-04-12 安徽天凯生物科技有限公司 一种可以产2’-岩藻基乳糖菌株的构建方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
BRYAN ZABEL等: "Novel Genes and Metabolite Trends in Bifidobacterium longum subsp. infantis Bi-26 Metabolism of Human Milk Oligosaccharide 2′-fucosyllactose", SCIENTIFIC REPORTS, vol. 9, pages 1 - 11 *
WP_087817556.1: "MFS transporter [Yersinia frederiksenii]", GENBANK *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN118056902A (zh) * 2022-11-21 2024-05-21 山东恒鲁生物科技有限公司 合成HMOs的成熟多肽序列及应用
WO2024109169A1 (zh) * 2022-11-21 2024-05-30 山东恒鲁生物科技有限公司 合成HMOs的成熟多肽序列及应用

Also Published As

Publication number Publication date
JP2023511525A (ja) 2023-03-20
BR112022014376A2 (pt) 2022-10-04
US20230109937A1 (en) 2023-04-13
EP4093876A1 (en) 2022-11-30

Similar Documents

Publication Publication Date Title
US20230072639A1 (en) New major facilitator superfamily (mfs) protein (bad) in hmo production
US20230193335A1 (en) Hmo production
US20230227876A1 (en) Hmo production
US20230109661A1 (en) Hmo production
US20240102063A1 (en) New major facilitator superfamily (mfs) protein (fred) in production of sialylated hmos
US20230109937A1 (en) New major facilitator superfamily (mfs) protein (fred) in hmo production
US20240043891A1 (en) A dfl-producing strain
CN116802302A (zh) 唾液酸化hmo生产中的新主要易化子超家族(mfs)蛋白(fred)
EA046005B1 (ru) НОВЫЙ БЕЛОК СУПЕРСЕМЕЙСТВА ОСНОВНЫХ ПЕРЕНОСЧИКОВ (MFS) (Fred) В ПРОИЗВОДСТВЕ ОГМ
EA046260B1 (ru) Получение огм
EA046248B1 (ru) Получение огм
EA046241B1 (ru) Получение огм

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination