CN114008202A - 用于体外和体内基因表达的包含5’utr茎环的核酸构建体 - Google Patents

用于体外和体内基因表达的包含5’utr茎环的核酸构建体 Download PDF

Info

Publication number
CN114008202A
CN114008202A CN202080044707.6A CN202080044707A CN114008202A CN 114008202 A CN114008202 A CN 114008202A CN 202080044707 A CN202080044707 A CN 202080044707A CN 114008202 A CN114008202 A CN 114008202A
Authority
CN
China
Prior art keywords
dna sequence
nucleic acid
sequence
seq
dna
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202080044707.6A
Other languages
English (en)
Inventor
M·彼得森
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Glycom AS
Original Assignee
Glycom AS
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Glycom AS filed Critical Glycom AS
Publication of CN114008202A publication Critical patent/CN114008202A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/70Vectors or expression systems specially adapted for E. coli
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/113Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/67General methods for enhancing the expression
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/50Physical structure
    • C12N2310/53Physical structure partially self-complementary or closed
    • C12N2310/531Stem-loop; Hairpin

Landscapes

  • Genetics & Genomics (AREA)
  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Biomedical Technology (AREA)
  • Chemical & Material Sciences (AREA)
  • Wood Science & Technology (AREA)
  • Biotechnology (AREA)
  • General Engineering & Computer Science (AREA)
  • Organic Chemistry (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Zoology (AREA)
  • Molecular Biology (AREA)
  • Microbiology (AREA)
  • Biophysics (AREA)
  • Physics & Mathematics (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Plant Pathology (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)

Abstract

本发明涉及在宿主细胞中重组产生生物分子的领域。本发明提供核酸构建体,其允许使用体外和体内基因表达系统在所述基因的5'UTR中具有优化的茎环结构来修饰所需基因的表达。构建体可有利地用于以工业规模重组产生多种生物分子,例如人乳寡糖(HMO)。

Description

用于体外和体内基因表达的包含5’UTR茎环的核酸构建体
技术领域
本发明涉及在宿主细胞中重组产生生物分子的领域。本发明提供允许使用体外和体内基因表达系统来修饰所需基因的表达的核酸构建体。构建体可有利地用于以工业规模重组产生多种生物分子,例如人乳寡糖(HMO)。
背景技术
重组微生物产生生物分子的商业重要性正在增加。目前,在细菌宿主,特别是大肠杆菌(E.coli)中产生重组蛋白,主要使用质粒携带的表达系统。由于这些系统提供高基因剂量并且可用的克隆方案易于处理,因此它们已被广泛接受。然而,使用基于质粒的表达系统,尤其是在制造规模上,也有很多缺点。
与基于质粒的表达系统相比,基于基因组的表达系统似乎具有确保重组基因稳定和无选择标志物表达的巨大潜力。然而,通常只有通过将染色体中的基因剂量增加到质粒水平才能实现重组基因在制造规模上的表达,因为基因的单拷贝通常无法在制造规模上提供令人满意的表达。此外,基因整合位点的选择是一个挑战,表达的调控往往很复杂和/或不适合工业生产。因此,目前可用于工业化生产重组多肽的简单、稳健且有效的基于基因组的细菌表达系统并不多。
克服异源多肽的基于基因组的细菌表达的生产水平不足和复杂调控问题的一种方法是使用强诱导型启动子来控制整合重组基因的转录。许多不同的诱导型启动子已经被描述和检查作为常用IPTG诱导型启动子的替代品,如lac,例如高温诱导的启动子,如λPR和λPL,色氨酸缺乏,如trp1,阿拉伯糖,如araBAD,甘露醇,如mtsE,磷酸盐缺乏,如phoA,萘啶酸如recA,渗透压如proU,葡萄糖缺乏,如cst-1等。然而,使用这些诱导型启动子存在许多问题,例如诱导条件可能对细胞、产生的分子和/或设备有害,或者它们使纯化更加昂贵和困难。
使用重组碳源调节启动子可能是在工业环境中控制靶基因表达的最有吸引力的选择。这样做的原因是这些启动子受碳源的可利用性调节,允许在受控环境中进行重组基因表达,这使以其它方式由诱导剂引入的宿主细胞上代谢应激的扩展得以减少。然而,目前这类启动子的选择还比较有限,大多数可用的已被用于质粒载体表达。尽管如此,细菌细胞的基因组,例如大肠杆菌包含数以千计的启动子,其中许多启动子受碳源变化的调控,从而允许环境中的碳可用性影响其控制下基因的表达模式。已经提出,在葡萄糖受限时形成的全局转录调节因子cAMP-CRP或CRP调节细菌细胞的最少378个启动子(Shimada T.等,PloSOne 6(6):e20081,(2011)),然而,没有数据表明哪些启动子适合在工业环境中驱动基于基因组的稳定可控的重组生物分子的高产生产。此外,尽管启动子具有高效和高活性,但由这些启动子控制的重组基因的高水平表达(即RNA和/或多肽的产生)并不总是能够实现,因为转录和/或翻译水平上的其它调控机制在基因表达的调控上也起到重要作用。
最近,已经描述一种新的重组细菌表达系统,其包含核酸构建体,其中启动子元件与包含人工核糖体结合位点的合成DNA序列融合(WO2019/123324)。所描述的表达系统允许在体内和体外调节基因的表达水平。该系统利用包含glp启动子元件的重组核酸构建体,该元件可操作地连接至合成DNA序列,该合成DNA序列包含源自位于大肠杆菌glpF基因上游的基因组5’UTR序列的片段和包含核糖体结合位点的特定重组DNA序列。
发明内容
本发明的第一方面涉及一种分离的核酸,其由SEQ ID NO:1、或其变体、或其互补核酸序列组成,其中所述变体是与SEQ ID NO:1具有至少80%、优选大于80%序列同一性的核酸序列。
本发明的第二方面涉及一种连续合成核酸,其包含DNA序列(i)和可操作地连接至所述DNA序列(i)的启动子元件,
其中
(a)DNA序列(i)具有至少23个核碱基的长度并且包含SEQ ID NO:1、或其变体;其中所述变体与SEQ ID NO:1具有至少80%的序列同一性;并且
(b)启动子元件是分离的DNA序列,其包含环AMP受体蛋白(CRP)的单个结合位点,其中所述位点以转录起点上游约-41位置为中心。
在不同的实施方式中,构建体还可包含DNA序列(ii),其中所述DNA序列(ii)可操作地连接至DNA序列(i)并位于DNA序列(i)的下游。在一些实施方式中,DNA序列(ii)可以是非编码DNA序列,而在其它实施方式中,它可以是编码DNA序列。在一些实施方式中,DNA构建体可以包含另外的编码DNA序列。
本发明的第三方面涉及一种包含连续合成核酸的核酸构建体,该连续合成核酸包含两个DNA序列(i)和(ii),其中序列可操作地连接并且DNA序列(ii)位于DNA序列(i)的下游,并且
其中
(a)DNA序列(i)具有至少23个核碱基的长度并且包含SEQ ID NO:1、或其变体;
(b)DNA序列(ii)不包含SEQ ID NO:3至SEQ ID NO:18中任一个的序列;
在一个实施方式中,第三方面的构建体还包含可操作连接的启动子元件。在一个实施方式中,启动子元件包含DNA序列,该DNA序列包含环AMP受体蛋白(CRP)的单个结合位点,该位点以转录起始点上游约-41位置为中心。
在一些实施方式中,第二和/或第三方面的构建体可以包含编码DNA序列,其编码功能性多肽,比如酶、转运蛋白、抗原、调节蛋白或小的非编码RNA分子,例如调节性microRNA(miRNA)或小干扰RNA(siRNA)。
在第四方面,本发明涉及一种载体,其包含第一方面的分离的核酸序列或第二或第三方面的核酸构建体。
在第五方面,本发明涉及一种表达盒,其包含第一方面的分离的核酸序列或第二和/或第三方面的核酸构建体。
在第六方面,本发明涉及一种表达系统,其包含第一方面的分离的核酸序列、第二和/或第三方面的核酸构建体、第四方面的载体和/或第五方面的表达盒。
在第七方面,本发明涉及一种重组细胞,优选细菌重组细胞,其包含第一、第二、第三、第四、第五方面相应的合成核酸、核酸构建体、载体和/或表达盒。
在第八方面,本发明涉及一种重组产生一种或多种生物分子的方法,该生物分子为例如蛋白质、核酸、寡糖,比如人乳寡糖(HMO)等,该方法使用本发明第一、第二、第三、第四、第五、第六、第七方面的合成核酸和/或构建体和/或载体和/或表达系统和/或重组细胞。
本发明的这些和另外的方面在下文详细描述。
附图说明
图1是本发明核酸构建体的一个实施方式的示意图。
图2示出来自包含合成启动子元件的核酸构建体的报告基因(lacZ)的表达水平,合成启动子元件源自操纵子gatYZABCDR和mglBAC,即PgatY_org和PmglB_org,与无启动子的lacZ报告基因融合并以单拷贝形式整合到染色体DNA中(空心柱)。通过用SEQ ID NO:2替换位于转录起始位点和翻译起始密码子上游第16个核苷酸之间的原始5’UTR DNA序列来修饰基因表达控制元件。测量来自不同表达盒的lacZ的表达水平。数据示出宿主细胞中表达的β-半乳糖苷酶的活性水平。活性以米勒单位(U/OD/ml/min)测量。
图3示出来自包含八种不同基因表达控制元件的核酸构建体的报告基因(lacZ)的表达水平。合成启动子元件源自操纵子mglBAC,即PmglB_org。数据示出宿主细胞中表达的β--半乳糖苷酶的活性水平,该宿主细胞来自包含RBS序列的八种变体的八个不同构建体。活性以米勒单位(U/OD/ml/min)测量。八个构建体包含具有如下序列的基因表达控制元件:SEQ ID:22(PmglB_org);SEQ ID NO:25(PmglB_16UTR);SEQ ID NO:29(PmglB_70UTR_SD7);SEQ ID NO:28(PmglB_70UTR_SD5);SEQ ID NO:26(PmglB_70UTR);SEQ ID NO:31(PmglB_70UTR_SD9);SEQ ID NO:30(PmglB_70UTR_SD8);SEQ ID NO:27(PmglB_70UTR_SD4)。
图4示出使用RNAfold WebServer(http://rna.tbi.univie.ac.at/cgi-bin/RNAWebSuite/RNAfold.cgi)预测的SEQ ID NO:2转录物的二级结构。概述了由SEQ ID NO:1形成的茎环结构。
具体实施方式
本发明涉及合成核酸、DNA构建体和包含其的表达系统,其可用于在体内和体外调节基因表达和生物分子的重组产生。根据本发明,本文所述的重组核酸、构建体和细菌表达系统能够在体外和体内调节基因的表达,比如增加或减少目标基因组或重组DNA序列的表达。“基因的表达”是指在包含本发明的核酸或构建体的重组细胞或无细胞表达系统中产生基因产物,即RNA或多肽分子。具体而言,本发明涉及重组核酸序列,例如核酸构建体,其包含由SEQ ID NO:1组成的分离核酸、或其变体,其中所述变体与SEQ ID NO:1具有至少80%、优选大于80%的序列同一性。发现SEQ ID NO:1的DNA序列的转录物能够形成茎环(pin)结构,该结构与包含该结构的RNA分子的稳定性增加有关。包含本发明的这种DNA序列的核酸构建体可以通过增加基因转录物(即mRNA)的寿命并因此增加转录物的翻译循环数来显著增加重组细胞中与构建体可操作连接的基因的表达效率。有利地,本发明的构建体可以包含受碳源调节的启动子,其在-41位置具有CRP的单个结合位点,这有助于构建体中连接或包含的基因表达的调节。
本发明的核酸和构建体的实施方式描述如下。
除非另有说明,本文使用的所有技术和科学术语与本发明所属领域的普通技术人员通常理解的含义相同。Singleton等(1994)微生物学和分子生物学词典(Dictionary ofMicrobiology and Molecular Biology),第二版,John Wiley and Sons(New York)提供了一本本发明中使用的许多术语的通用词典。尽管在本发明的实践或测试中可以使用与本文描述的那些相似或等效的任何方法和材料,但是描述了优选的方法和材料。本应用中所需的大多数命名法和一般实验室程序都可以在Sambrook等,Molecular Cloning:ALaboratory Manual,Vol.1-3,Cold Spring Harbor Laboratory,Cold Spring Harbor,New York(2012);Wilson K.和Walker J.,Principles and Techniques of Biochemistryand Molecular Biology(2010),Cambridge University Press;或在Maniatise等,Molecular Cloning A laboratory Manual,Cold Spring Harbor Laboratory(2012);或在Ausubel等,Current protocols in molecular biology,John Wiley and Sohns(2010)中找到。这些手册在下文中相应地称为“Sambrook等人”、“Wilson&Walker”、“Maniatise等人”、“Ausubel等人”。
如果没有另外说明,贯穿说明书定义的术语涉及本发明的所有方面和实施方式。说明书和工作实施例中描述的所有实施方式涉及本发明的所有和任何方面。
术语“核酸构建体”是指人工构建的核酸片段,特别是DNA片段,其旨在用于在体内或体内表达重组基因或非编码调控RNA分子,如miRMA或siRNA分子。在体外,或用于修饰编码调节性RNA分子的基因或DNA序列的表达,这些调节性RNA分子天然包含在要“移植”核酸构建体的靶标生物的基因组DNA中。因此,在不同的实施方式中,本发明的构建体可以包含或不包含编码DNA序列,即编码多肽的DNA序列,或编码调节性RNA分子(例如siRNA或miRNA分子)的DNA序列。
在一些优选的实施方式中,核酸构建体包含连续的DNA序列,该序列包含两个可操作地连接在一起的不同片段:启动子DNA序列、包含SEQ ID NO:1的合成DNA序列。在不同的实施方式中,合成DNA序列可以包含一个DNA序列,DNA序列(i),其中DNA序列(i)包含SEQ IDNO:1,或者它可以包含两个连接的DNA序列:DNA序列(i)和不包含SEQ ID NO:1的DNA序列(ii)。在其它优选的实施方式中,核酸构建体可以包含合成的DNA序列,该序列包含DNA序列(i)和任选的未连接到启动子DNA序列的DNA序列(ii)(即缺少启动子的构建体)。然而,在一些其它优选实施方式中,构建体可包含合成DNA序列,其仅包含与启动子DNA序列可操作连接的DNA序列(i)。这些实施方式可用于调节表达靶基因组序列,例如宿主微生物基因组中的一个基因。这种构建体可并入宿主基因组中任何基因或其它基因组序列的转录位点上游。在其它优选的实施方式中,构建体可以还包含启动子DNA序列和本发明的合成DNA序列,并且还包含一个或多个编码DNA序列,其可操作地连接至控制构建体基因表达的DNA序列(即启动子序列和包含SEQ ID NO:1的合成DNA)。这些构建体的不同实施方式在整个说明书中描述如下,并通过非限制性工作实施例说明。
本文所用的术语“核酸”包括RNA、DNA和cDNA分子。应理解,由于遗传密码的简并性,可以产生编码给定蛋白质的许多核苷酸序列。编码功能性生物分子例如肽、多肽或核酸,例如sRNA的核酸序列,称为“编码DNA序列”。不编码功能性生物分子的核酸称为“非编码DNA序列”。术语核酸与术语“多核苷酸”可互换使用。术语“寡核苷酸”是指短核酸分子,例如引物。术语“引物”是指寡核苷酸,无论是在纯化的限制性消化中天然存在还是合成产生,当置于合成引物延伸产物(与被诱导核酸链互补(即在核苷酸和诱导剂如DNA聚合酶的存在下并且在合适的温度和pH下))的条件下时,其能够作为合成起始点。引物优选是单链的,以获得最大的扩增效率,但也可以是双链。如果是双链,引物在用于制备延伸产物之前首先对其处理以分离其链。优选地,引物是脱氧核糖核苷酸。引物必须足够长以在诱导剂存在下引发延伸产物的合成。引物的确切长度取决于许多因素,包括温度、引物来源和方法的使用。
术语“合成DNA序列”是指人造DNA序列,即人工制造的DNA序列。在一个优选的实施方式中,本发明的合成DNA序列是构成DNA分子的连续核苷酸序列,该DNA分子包含DNA序列(i)和任选的DNA序列(ii),其中将这两个DNA序列连接,使得DNA序列(i)位于DNA序列(ii)的上游。在另一个优选的实施方式中,本发明的合成连续DNA序列包含在核酸构建体中,其中所述合成DNA序列与转录起始下游的至少一个启动子元件DNA序列可操作地连接。在构建体的连续DNA序列包含两个DNA序列:DNA序列(i)和DNA序列(ii)的实施方式中,DNA(i)和(ii)序列连接使得DNA序列(i)位于DNA序列(ii)上游,并且启动子DNA与转录起始上游的DNA序列(i)可操作地连接。术语“合成DNA序列”在本文中与术语“重组/人工DNA序列”可互换使用。
不同实施方式中的DNA序列(i)和DNA序列(ii)可以二者/或一者是基因组DNA的分离片段,即源自基因组DNA,例如大肠杆菌的基因组DNA,和/或人工DNA序列(即并非源自基因组DNA序列)。术语“分离的DNA序列”是指DNA序列不是基因组DNA的整合片段,而是人工/重组DNA片段。因此,术语“分离的DNA序列”在本文中与术语“人工/重组DNA序列”可互换使用。在本发明的一些实施方式中,分离的DNA序列可以与基因组DNA序列相同或同源,在其它实施方式中,它可以具有与基因组DNA序列几乎没有或没有同源性的核苷酸序列。术语“同源”是指重组/分离的DNA片段与基因组DNA序列的组成部分的核苷酸序列具有一定百分比的同源性(即序列同一性),比如约65-70%,优选至少80%,比如81%至89%,比如约90%到约99%。本发明还包括与本发明的核酸构建体中包括的不同分离/重组DNA序列具有所示同源性百分比的重组DNA序列,例如启动子序列、DNA序列(i)或DNA序列(ii)。这些DNA序列在本文中称为包括在本发明的构建体中的参考DNA序列的“变体”。优选地,本发明的构建体的参考序列的变体是与该特定参考序列具有约70-99%序列同一性的人工核酸序列。术语“变体”的范围还包括与本文所述的DNA序列互补的核苷酸序列、mRNA序列和合成寡核苷酸序列,例如PCR引物。通常,所比较的核酸序列的同一性百分比表示具有相同核苷酸组成的序列部分。在一个优选的实施方式中,变体是本发明的构建体的参考序列,具有大约70-99%的核苷酸序列同一性和相同或相似的功能,例如它是或可以用作核糖体结合位点(RBS),或用作调节蛋白或酶等的结合位点。如上所述,本发明的范围还包括与本发明的DNA序列互补的核酸序列和与其变体互补的核酸序列,例如RNA序列。根据本发明,与参考DNA序列变体的DNA序列互补的RNA序列保留与参考DNA序列互补的RNA序列的相同的结构和功能特征,例如茎环结构。用于本发明目的的序列同一性/同源性的百分比可以通过使用本领域公知的任何方法来测定,例如BLAST。
在一个优选实施方式中,DNA序列(i)是基因组5’-非翻译前导DNA序列(5’UTRDNA)的分离的DNA片段,其与大肠杆菌的glpF基因的基因组5’UTR DNA片段具有至少80%,优选大于80%的序列同一性,比如90-100%的序列同一性。优选地,该片段包含至少23个核碱基的序列,例如23-54个核碱基,在glpF基因的转录起点(从+2个核苷酸开始)下游,或者它是至少23个核苷酸的所述序列的变体。优选地,23-核碱基DNA序列(i)由SEQ ID NO:1、或其变体组成,或包含SEQ ID NO:1、或其变体。在一个优选的实施方式中,DNA序列(i)由SEQID NO:2或SEQ ID NO:2的片段或变体组成,其中所述片段或变体具有大于23个核碱基的长度并包含SEQ ID NO:1、或SEQ ID NO:1的变体。优选地,SEQ ID NO:1或SEQ ID:2的两个变体与参考序列具有至少80%的同源性。
根据本发明,DNA序列(ii)可以是包含至少6个连续核碱基的任何DNA序列。在一个优选的实施方式中,DNA序列(ii)是非编码DNA序列并且包含优选地具有至少6个核碱基的长度的核糖体结合位点。术语“核糖体结合位点”(RBS)是指包含约4-16个核碱基、优选6-16个核碱基的核苷酸序列,其通过将核糖体定位在mRNA分子上以翻译编码的多肽而起作用。在一个优选的实施方式中,包含RBS的DNA序列(ii)是具有16个核碱基长度的分离的DNA片段。在一个优选的实施方式中,包含RBS的DNA序列(ii)与包含基因组RBS的DNA序列,例如SEQ ID NO:14-SEQ ID NO:20中鉴定的序列相同或同源;在另一个实施方式中,含有RBS的DNA序列(ii)可以是人工DNA序列。这种DNA序列(ii)的非限制性实施方式是鉴定为SEQ IDNO:3-SEQ ID NO:13的序列。在一些优选的实施方式中,DNA序列(ii)的RBS不包含SEQ IDNO:3-SEQ ID NO:18中任一个的序列。在一些优选的实施方式中,包含RBS的DNA序列(ii)包含SEQ ID NO:20或SEQ ID NO:19,优选地,RBS具有SEQ ID NO:20或SEQ ID NO:19的序列。在一些优选的实施方式中,包含在本发明构建体中的RBS DNA序列是选自SEQ ID NO:4-SEQID NO:13中任一个的序列。本发明还涉及合成DNA,其包含与鉴定为SEQ ID NO:3-SEQ IDNO:20中任一个的序列不同或者是其变体的DNA(ii)序列。
在另一个优选的实施方式中,本发明的DNA序列(ii)是编码DNA序列,其编码功能性RNA分子,比如调节性RNA分子,例如小干扰RNA或microRNA(miRNA)分子。小干扰RNA(siRNA),有时也称为短干扰RNA或沉默RNA,是一类双链RNA非编码RNA分子,长度为20-25个碱基对,与miRNA相似,在RNA干扰(RNAi)通路内起作用。它通过在转录后降解mRNA来干扰具有互补核苷酸序列的特定基因的表达,从而阻止翻译。microRNA(缩写为miRNA)是一种在植物、动物和一些病毒中发现的非编码小RNA分子(包含约22个核苷酸),在RNA沉默和基因表达的转录后调控中起作用。miRNA通过与mRNA分子内的互补序列碱基配对发挥作用。结果,这些mRNA分子通过以下一个或多个过程被沉默:(1)将mRNA链切割成两部分,(2)通过缩短poly(A)尾巴使mRNA不稳定,以及(3)核糖体将mRNA翻译成蛋白质的效率较低。miRNA类似于siRNA,不同之处在于miRNA来源于RNA转录物的区域,这些区域自身折叠形成短发夹,而siRNA来源于较长的双链RNA区域。
如上所述,在一些优选实施方式中,本发明的核酸构建体包含启动子DNA序列,该序列与合成DNA序列可操作地连接,该合成DNA序列包含上述DNA序列(i)和任选的DNA序列(ii)。
术语“启动子”或“启动子区域”或“启动子元件”是指在转录起始期间被DNA依赖性RNA聚合酶识别和结合的核酸序列。启动子与其它转录和翻译调控核酸序列(也称为“控制序列”)一起是表达给定基因或基因组(操纵子)以产生基因编码分子所必需的。“转录起始位点”是指待转录的第一个核苷酸,它被指定为+1。起始位点下游的核苷酸编号为+2、+3、+4等,5’相反(上游)方向的核苷酸编号为-1、-2、-3等。本发明的启动子是分离的DNA序列。本发明的启动子DNA优选源自或同源于包含在基因启动子区域中的基因组DNA序列。根据本发明,能够结合DNA依赖性RNA聚合酶并启动转录的任何启动子DNA序列都适用于实施本发明。
如上所述,本发明的启动子DNA序列可以源自任何基因的基因组启动子区域,优选地,包括在大肠杆菌的基因组DNA中的基因。在优选的实施方式中,本发明的启动子DNA序列源自基因的启动子区,其表达受碳源调节。“碳源”通常是指可以被细菌细胞吸收和代谢的碳水化合物分子。启动子的活性可以通过培养基中碳源分子例如甘油、葡萄糖、阿拉伯糖等的存在或不存在来控制。在一个优选的实施方式中,本发明的构建体的启动子的活性是碳源可调节的。在一个优选的实施方式中,本发明的碳源可调节启动子的DNA序列包含CRP的单个结合位点,其中所述单个CRP结合位点以约-41位置为中心。术语“约”、和“大约”通常表示指示值的1-10%偏差,或不影响相关特征的微小偏差。在本文中,术语“约”是指在启动子DNA序列中-39、-39.5、-40、-40.5、-41.5、-42、-42.5或-43处的位置,例如位置-40.5或-41.5。优选地,所述CRP结合位点具有至少15个核碱基的长度并且包含共有DNA序列5’-TGTGA-N6-TCA(T)C-3’,其中N6是6个(任何)核碱基的序列。在一个优选实施方式中,启动子的CRP结合位点具有SEQ ID NO:51的序列。在另一个优选实施方式中,CRP的单个结合位点具有SEQ ID NO:52的序列。
如上所述,在一些实施方式中,构建体的启动子DNA的核苷酸序列可以与被认为是单个基因或操纵子的启动子区域的基因组DNA序列、优选细菌基因组DNA序列、例如大肠杆菌基因组DNA的片段的核苷酸序列相同,或具有一定百分比的同一性,例如约65-70%,优选至少80%同一性,优选约90%至约99%的同一性。这种启动子DNA序列的一个非限制性实例可以是控制大肠杆菌gatYZABCDR操纵子基因表达的启动子DNA序列,特别是gatY启动子DNA序列的全长或片段(本文缩写为PgatY);或控制大肠杆菌mglBAC操纵子基因表达的启动子的DNA序列,特别是mglB启动子元件的全长或片段(本文缩写为PmglB)。大肠杆菌基因组在本文中是指大肠杆菌K-12MG1655(GenBank ID:U00096.3)的完整基因组DNA序列。本发明的启动子DNA序列的优选但非限制性的实施方式是SEQ ID NO:21和SEQ ID NO:22。可以分离并包括在本发明的构建体中的其它合适的实例基因组启动子DNA序列可以在以下文献中找到:Shimada T.等,PloS One6(6):e20081,(2011)。在一些实施方式中,启动子DNA可以是人工DNA序列,即不是源自基因组启动子序列的DNA序列。
构建体的启动子DNA序列可以包含各种结构特征/元件,例如能够影响(促进或抑制)RNA聚合酶在细胞中的结合和启动下游(3’-方向)编码序列转录的调控区,例如转录激活蛋白或转录阻遏蛋白的结合位点。本发明启动子的调控区包含负责RNA聚合酶结合的特定蛋白质结合结构域(共有序列),例如-35框和-10框(Pribnow框)。构建体的启动子DNA的所有提到的调控序列可以与所选启动子的相应基因组序列具有一定百分比的同一性,即本发明考虑原始(天然/野生型)DNA序列或其变体。
本发明的启动子序列优选地包含至少50个核苷酸,更优选地至少60个核苷酸,比如从约65个到约100个、从约75个到约115个核苷酸、从约85个到约125个,例如90个至115个、110-120个、120-130个、130-140个、140-150个或超过150个核苷酸,比如155-165个、165-175个、175-185个、185-195个、195-205个、205-215个、215-225个、225-235个、235-245个、245-255个、255-265个、250-350个。在一些实施方式中,启动子序列可以至多500-1000个核苷酸。在一些实施方式中,选择的启动子序列也可以短于50个核苷酸。在一个优选的实施方式中,启动子DNA序列的长度为至少50个核碱基并且包含单个CRP结合位点,该结合位点以约-41位置为中心。在一些实施方式中,其中DNA序列(ii)不包含鉴定为SEQ ID NO:3-SEQ ID NO:18中任一个的序列,启动子DNA长度可以是长于或短于50个核碱基的序列,并且它可以包含CRP的几个结合位点或不包含任何CRP结合位点。本发明构建体的启动子DNA序列的长度不是一般限制因素。能够结合RNA聚合酶并启动基因的异位或原位转录的任何启动子DNA序列都适用于本发明的目的。在一个优选的实施方式中,构建体的启动子DNA具有鉴定为SEQ ID NO:21的序列,或具有SEQ ID NO:21的变体序列;在另一个优选的实施方式中,构建体的启动子DNA具有鉴定为SEQ ID NO:22的序列,或具有SEQ ID NO:22变体的序列。
本发明的一些实施方式可能涉及不可调节的启动子,即启动子的活性不需要引发,即所谓的组成型启动子。
本发明的核酸构建体还可包含重组编码DNA序列,其与构建体的其它序列可操作地连接。“可操作地连接”是指其中将控制序列(即启动子序列)和包含DNA序列(i)和任选的DNA序列(ii)的合成DNA适当地相对于彼此以及相对于编码DNA序列放置,如果编码DNA包括在构建体中,即所有序列都按顺序放置,即启动子和合成的DNA序列指导编码序列的转录和编码DNA编码的mRNA的翻译。在构建体包含编码DNA序列的实施方式中,优选地,编码DNA编码至少一种蛋白质或RNA分子,其具有直接或间接参与宿主细胞中一种或多种HMO产生的活性(即分子的活性对于生产一种或多种HMO是必需的或有益的)。这种活性的非限制性实例可以是酶促、调节、分子伴侣活性。在一些实施方式中,本发明的DNA构建体可包含多于一种编码DNA序列,其可编码不同的生物分子。优选地,构建体(含有一个或多个编码DNA序列)包含启动子DNA序列的单拷贝和与启动子可操作连接的合成DNA序列的单拷贝。本发明的DNA构建体可以插入到质粒DNA/载体中,移植到靶/宿主细胞中并以质粒和/或染色体携带的形式表达。DNA构建体可以是线性的或环状的。整合到宿主细菌基因组或表达质粒中的线性或环状DNA构建体在本文中可互换地称为“表达盒”或“盒”。在一个实施方式中,表达盒是包含三个DMA序列的线性DNA构建体:启动子DNA序列、启动子下游的合成DNA序列(如上所述)和编码目标生物分子的编码DNA序列。构建体还可以包含其它核苷酸序列,例如转录终止子序列和两个末端侧翼区域,它们与基因组区域同源并能够进行同源重组,和/或其它序列。盒可以通过本领域公知的方法制造,例如使用Wilson&Walker中描述的标准方法。线性表达盒的使用可以提供这样的优点,即基因组整合位点可以通过盒的侧翼同源区域的相应设计自由选择。因此,线性表达盒的整合允许关于基因组区域的更大可变性。本发明的优选实施方式中包括线性盒。
根据本发明,编码DNA序列是分离的DNA序列,其与包含编码生物分子例如蛋白质或RNA的基因的基因组DNA片段具有大约70-100%的序列同一性。构建体的编码DNA可以与启动子DNA序列同源或异源。本上下文中的“异源”是指相应基因组编码DNA序列的表达自然地由不同于构建体启动子的另一个启动子控制。因此,本文中的“同源”是指启动子DNA序列和编码DNA序列的相应基因组序列在物种起源的基因组中自然连接。
在一个优选的实施方式中,本发明构建体的编码核酸序列相对于启动子是异源的。对于将在其中表达编码DNA的宿主细胞,所述DNA可以是异源的(即源自另一生物物种或属)或同源的(即源自宿主细胞)。例如,在一个实施方式中,构建体的编码DNA序列可以编码生物分子,例如对宿主来说是外来的蛋白质,即编码DNA的核酸序列与宿主物种是异源的,因为它源自与宿主生物体不同的供体物种,或者编码DNA的核酸序列包含导致表达的多肽与由宿主的相应未修饰DNA序列表达的多肽不同的修饰,即认为最初源自宿主的人工修饰的编码DNA序列在本文中是异源的。在宿主是特定原核物种的情况下,异源核酸序列可以源自不同的科属、不同的目或纲、不同的门(门)或不同的生物体结构域(领域(empire))。源自与宿主不同的供体的异源核酸序列可以在将其引入宿主细胞之前通过单个核酸或异源核酸序列的一部分的突变、插入、缺失或取代进行修饰,只要这种修饰序列表现出与参考序列相同的功能(功能等效)。如本文所指,异源核酸序列也包括源自生物体的不同结构域(域)的核酸序列,例如源自真核生物(真核生物起源),例如参与人乳寡糖(HMO)合成或降解的酶。此外,在本发明的其它实施方式中,编码核酸可以与宿主细胞同源。在本上下文中,术语“同源核酸序列”(本文同义地用作“宿主天然的核酸序列”或“源自宿主的核酸序列”)是指核酸序列源自(或衍生)自相同生物体,或与宿主生物体相同的科属,或相同的目或纲、相同的门(门)或相同的生物体结构域(领域)。在一个实施方式中,本文所述构建体的编码DNA可编码通常由宿主细菌细胞表达的酶或糖转运蛋白,其基因组中天然包含编码所述酶或糖转运蛋白的基因。
通常,本发明考虑任何编码DNA,因为任何编码DNA都可以包含在本发明的构建体中并且从构建体中包含的启动子转录。在一些优选的实施方式中,编码DNA编码蛋白质,例如酶、转运蛋白、调节蛋白、分子伴侣等。术语“蛋白质”在本文中可互换地称为“多肽”。在其它优选的实施方式中,编码DNA可能编码调节(非编码)RNA分子(ncRNA),例如功能重要的RNA类型,如转运RNA(tRNA)和核糖体RNA(rRNA),以及小RNA,如microRNA、siRNA和长ncRNA。优选地,编码DNA可以编码调节性(非编码)RNA分子,其是小RNA,例如microRNA、siRNA。在这些实施方式中,构建体优选包含与合成DNA序列可操作连接的启动子元件,该合成DNA序列包含DNA序列(i)但不包含DNA序列(ii)。合成DNA(i)与编码调节(非编码)RNA分子(ncRNA)的编码DNA直接相连。
在一个优选的实施方式中,本发明的构建体的至少一个编码DNA编码与人乳寡糖、其前体或衍生物的合成、降解或转运相关的蛋白质或RNA。“至少一个”是指不同实施方式中的构建体可以包含多于一个编码DNA序列,例如两个编码序列,例如第一和第二编码序列;三个编码序列,例如第一、第二和第三编码序列等。优选地,在这些实施方式中,多个编码DNA序列串联表达,并且转录由构建体的启动子DNA的单拷贝控制。在不同的实施方式中,第一、第二、第三等编码DNA序列可以编码不同的酶或其它蛋白质,其功能对于通过宿主细胞例如酶、转运蛋白、调节蛋白、分子伴侣等产生HMO是必需的或有益的。本文中的“必需”是指蛋白质直接参与HMO合成,例如它是一种有助于从HMO前体制备HMO的过程的酶,例如一种具有葡萄糖基转移酶活性的酶。在本上下文中,“有益”是指蛋白质不直接参与HMO合成,但它有助于有利于宿主细胞产生HMO的过程,例如它是一种帮助HMO或HMO前体运输(进出宿主细胞)的蛋白质。在本文中被认为对于宿主细胞产生一种或多种HMO必需的蛋白质的一些非限制性实施方式可以在现有技术中找到,例如,在WO20191233324中(见表2和表3,并入本文以供参考)。
本上下文中的术语“人乳寡糖”或“HMO”是指在人乳中发现的复合碳水化合物(参考文献参见Urashima等:Milk Oligosaccharides.Nova Science Publisher(2011);或Chen,Adv.Carbohydr.Chem.Biochem.72,113(2015))。HMO具有在还原端包含乳糖单元的核心结构,该单元可以被一个或多个β-N-乙酰基-乳糖胺基和/或一个或多个β-乳糖-N-二糖基单元,并且该核心结构可以被α-L-吡喃岩藻糖基和/或α-N-乙酰基-神经氨酰(唾液酸)部分取代。在这方面,没有非酸性(或中性)HMO唾液酸残基,并且酸性HMO在其结构中具有至少一个唾液酸残基。非酸性(或中性)HMO可以是岩藻糖基化的或非岩藻糖基化的。这种中性非岩藻糖基化的HMO的实例包括乳-N-四糖(LNT)、乳-N-新四糖(LNnT)、乳-N-新六糖(LNnH)、对-乳-N-新六糖(pLNnH)、对-乳-N-六糖(pLNH)和乳-N-六糖(LNH)。中性岩藻糖基化HMO的实例包括2’-岩藻糖基乳糖(2’-FL)、乳-N-岩藻糖基五糖I(LNFP-I)、乳-N-二岩藻糖基六糖I(LNDFH-I)、3-岩藻糖基乳糖(3-FL)、二岩藻糖基乳糖(DFL)、乳-N-岩藻糖基五糖II(LNFP-II)、乳-N-岩藻糖基五糖III(LNFP-III)、乳-N-二岩藻糖基六糖III(LNDFH-III)、岩藻糖基-乳-N-六糖II(FLNH-II)、乳-N-岩藻糖基五糖V(LNFP-V)、乳-N-二岩藻糖基六糖II(LNDFH-II)、岩藻糖基-乳-N-六糖I(FLNH-I)、岩藻糖基-对-乳-N-六糖I(FpLNH-I)、岩藻糖基-对-乳-N-新六糖II(F-pLNnHII)和岩藻糖基-乳-N-新六糖(FLNnH)。酸性HMO的实例包括3’-唾液酸乳糖(3’-SL)、6’-唾液酸乳糖(6’-SL)、3-岩藻糖基-3’-唾液酸乳糖(FSL)、3’-O-唾液酸乳糖-N-四糖a(LST a)、岩藻糖基-LST a(FLST a)、6’-O-唾液酸-N-四糖b(LST b),岩藻糖基-LST b(FLST b)、6’-O-唾液酸-N-新四糖(LST c)、岩藻糖基-LST c(FLST c)、3’-O-唾液酸乳-N-新四糖(LST d)、岩藻糖基-LST d(FLST d)、唾液酸-乳-N-六糖(SLNH)、唾液酸-乳-N-新六糖I(SLNH-I)、唾液酸-乳-N-新六糖II(SLNH-II)和二唾液酸-乳-N-四糖(DSLNT)。在本发明的上下文中,认为乳糖是一种FIMO。
本上下文中的术语“FIMO前体”是指参与一种或多种根据本发明的FIMO的生物合成通路的化合物,其产生并天然存在于宿主细胞中或从细胞外培养基输入到细胞中。下面列出了FIMO前体的一些非限制性实例:
Figure BDA0003417269140000161
术语“FIMO转运蛋白”是指生物分子,例如蛋白质,其促进宿主细胞合成的FIMO通过细胞膜转运/输出,例如到细胞培养基中,或将FIMO从细胞培养基中转运/导入到细胞胞质溶胶中。
术语“FIMO衍生物”是指衍生自FIMO分子或包含FIMO部分的分子,例如神经节苷脂分子,包含FIMO部分的人工碳水化合物/蛋白质结构。
本发明的表达盒可用于重组产生一种或多种作为基因组整合或质粒携带的HMO,或者,在一些实施方式中,宿主细胞可包含基因组整合和质粒携带的表达盒,其中至少一种或两种表达盒包含一种或多种对产生一种或多种HMO必需的和/或有益的基因,并且其中至少一种所述基因的表达受本发明启动子的控制,例如PmglB或PgatY。优选地,基因组整合盒包含至少一个(或第一组)编码DNA序列,并且质粒携带的盒包含至少一个第二编码DNA(或第二组编码DNA序列),其中至少一个第一和/或至少一个第二编码DNA序列与本发明的启动子可操作地连接。在一些优选的实施方式中,至少一个表达盒在PmglB或PgatY的控制下表达,例如基因组整合盒的编码序列可操作地连接到本发明的启动子,例如PmglB或PgatY,以及质粒携带的编码序列与另一个启动子可操作地连接,例如lac启动子或其它启动子。在一些实施方式中,基因组整合的和质粒携带的盒都可以在本发明的相同或不同启动子的控制下表达,例如基因组整合盒的启动子是PmglB,质粒携带的启动子是PgatY。在其它实施方式中,宿主细胞中包含的所有表达盒可包含相同的启动子。在一个优选的实施方式中,宿主细胞包含本发明的基因组整合的表达盒的至少一个拷贝,该表达盒包含PmglB或PgatY。优选地,宿主细胞基因组包含单个或少量拷贝的基因组整合表达盒,例如两个或三个拷贝。此外,在一些实施方式中,宿主可包含表达质粒的多个拷贝,其中每个质粒包含本发明的表达盒的单个拷贝。在一些实施方式中,宿主细胞可包含本发明的几种不同的核酸构建体,基因组整合的和/或质粒携带的。几种不同的核酸构建体中的每一种都可以以单拷贝或多拷贝整合到宿主细胞的基因组中或整合到质粒中。在一些实施方式中,优选构建体以单拷贝或低拷贝数整合。
根据本发明,包含在宿主细胞中作为基因组整合的或质粒携带的本发明的表达盒的单拷贝可以提供一定量的由编码DNA序列编码的生物分子(优选地,在PmglB或PgatY的控制下)),这足以确保宿主细胞对一种或多种HMO的高产生水平。令人惊讶的是,本发明表达盒的单个基因组整合拷贝可以提供与使用相同盒的大量质粒携带表达(100-500个拷贝)实现的产生水平相当或更高(例如高2-10倍)的HMO产生水平。在一些实施方式中,在宿主细胞中表达与HMO产生相关的两个或更多个基因可能是有利的。HMO相关基因可以包含在一个构建体中,并以基因组或质粒携带的形式从单个(或多个)拷贝中串联表达;或者基因可以包含在本发明的不同构建体中,一个基因从基因组整合盒表达,另一个基因从质粒携带。在其它实施方式中,可以考虑表达盒的其它表达模式、组成或拷贝数。优选地,包含在后表达盒中的至少一个基因编码具有酶活性的蛋白质,该酶活性对于宿主细胞中HMO的合成是必需的。可有利地在PmglB或PgatY的控制下表达的基因的非限制性实施方式描述于WO2019123321(并入本文以供参考)。
根据上文,本发明的一个方面涉及包含如上述任一项的本发明的核酸构建体的重组细胞。重组细胞在本文中可互换地称为“宿主细胞”。优选地,宿主细胞是细菌细胞。术语“宿主细菌物种”、“宿主细菌细胞”可互换使用,以表示已转化为含有本发明的DNA构建体并能够表达由构建体的相应异源编码DNA序列编码的异源多肽的细菌细胞。术语“转化”、“转化的”和“移植的”是同义词,表示细胞外核酸,如包含本发明构建体的载体,有或没有伴随材料,进入宿主细胞的过程。用例如表达载体转化合适的宿主细胞可以通过公知的方法例如电穿孔、缀合或通过化学方法例如磷酸钙介导的转化和通过天然转化系统来完成,例如在Maniatis等人中或在Ausubel等人中所描述。
对于细菌宿主细胞,原则上没有限制;它们可以是真细菌(革兰氏阳性或革兰氏阴性)或古细菌,只要它们允许基因操作以插入目标基因并且可以在制造规模上培养。优选地,宿主细胞具有允许培养至高细胞密度的特性。适用于根据本发明的HMO的重组工业生产的细菌宿主细胞的非限制性实例可以是草生欧文菌(Erwinia herbicola(Pantoeaagglomerans))、弗氏柠檬酸杆菌(Citrobacter freundii)、柠檬泛菌(Pantoea citrea)、果胶杆菌(Pectobacterium carotovorum)或油菜黄单胞菌(Xanthomonas campestris)。也可使用芽孢杆菌(Bacillus)属的细菌,包括枯草芽孢杆菌(Bacillus subtilis)、地衣芽孢杆菌(Bacillus licheniformis)、凝结芽孢杆菌(Bacillus coagulans)、嗜热芽孢杆菌(Bacillus thermophilus)、侧孢芽孢杆菌(Bacillus laterosporus)、巨大芽孢杆菌(Bacillus megaterium)、丝状芽孢杆菌(Bacillus mycoides)、短小芽孢杆菌(Bacilluspumilus)、迟缓芽孢杆菌(Bacillus lentus)、蜡样芽孢杆菌(Bacillus cereus)和圆环芽孢杆菌(Bacillus circulans)。类似地,可以使用本发明的方法修饰乳杆菌(Lactobacillus)属和乳球菌(Lactococcus)属的细菌,包括但不限于嗜酸乳杆菌(Lactobacillus acidophilus)、唾液乳杆菌(Lactobacillus salivarius)、植物乳杆菌(Lactobacillus plantarum)、瑞士乳杆菌(Lactobacillus helveticus)、德氏乳杆菌(Lactobacillus delbrueckii)、鼠李糖乳杆菌(Lactobacillus rhamnosus)、保加利亚乳杆菌(Lactobacillus bulgaricus)、卷曲乳杆菌(Lactobacillus crispatus)、加氏乳杆菌(Lactobacillus gasseri)、干酪乳杆菌(Lactobacillus casei)、罗伊乳杆菌(Lactobacillus reuteri)詹氏乳杆菌(Lactobacillus jensenii)和乳酸乳球菌(Lactococcus lactis)。嗜热链球菌(Streptococcus thermophiles)和费氏丙酸杆菌(Proprionibacterium freudenreichii)也是适用于本文所述的发明的细菌种类。作为本发明的一部分,还包括如本文所述修饰的来自肠球菌(Enterococcus)属(例如,屎肠球菌(Enterococcus faecium)和嗜热肠球菌(Enterococcus thermophiles))、双歧杆菌(Bifidobacterium)(例如,长双歧杆菌(Bifidobacterium longum)、婴儿双歧杆菌(Bifidobacterium infantis)和两岐双岐杆菌(Bifidobacterium bifidum))、孢子乳杆菌(Sporolactobacillus)属、小孢子菌(Micromomospora)属、微球菌(Micrococcus)属、红球菌(Rhodococcus)属和假单胞菌(Pseudomonas)(例如荧光假单胞菌(Pseudomonasfluorescens)和铜绿假单胞菌(Pseudomonas aeruginosa))的菌株。在乳糖存在下培养包含本文所述特征的细菌,并从细菌本身或从细菌的培养上清液中回收由细胞产生的HMO。HMO使用本领域可用的合适程序(例如,如WO2015188834、WO2017182965或WO2017152918中所述)纯化。
在一个优选的实施方式中,宿主细胞是大肠杆菌。然而,如上所述,多种宿主细胞可用于本发明的目的。
对宿主细胞的一个要求是它含有一种功能性的DNA依赖性RNA聚合酶,它可以与启动子结合并启动构建体DNA的转录。RNA聚合酶对于宿主细胞可以是内源的(天然的)、同源的(重组的)或外源的/异源的(重组的)。
转化到选定的细菌宿主中的本发明的构建体可以表达为基因组整合的表达盒或克隆到合适的表达载体中并以质粒携带的形式表达。在不同的实施方式中,可能优选利用基于基因组的表达系统,在其它实施方式中,可能优选质粒携带的表达。然而,在基于基因组的表达系统中使用本发明的构建体是有利的,因为出人意料的是,整合到基因组中并从基因组表达的构建体的单个拷贝可以提供整合基因产物的高且稳定的表达水平。另一个优点是基因组表达可以长期持续。出于本发明的目的,可以使用标准方法将本发明的构建体整合到宿主细胞基因组或表达质粒中,例如Sambrook等、Wilson&Walker、Maniatise等和Ausubel等。
对于基于基因组的表达,对宿主细胞有要求—细胞应该能够进行同源重组(这与表达盒整合到基因组中有关)。因此,宿主细胞优选具有重组蛋白RecA的功能。然而,由于RecA可能在培养过程中引起不希望的重组事件,因此宿主细胞优选在其基因组recA位点具有基因组突变(使其功能失调),但具有由辅助质粒上的recA序列提供的RecA功能,其可以通过利用辅助质粒的温度敏感复制子而在重组后去除(治愈)(Datsenko K.A.和WannerB.L.,(2000)Proc Natl Acad Sci U S A.97(12):6640-5)。考虑到重组,除了RecA之外,宿主细胞优选包含编码重组蛋白(例如Exo、Beta和Gam)的DNA序列。在这种情况下,可以选择已经具有该特征的宿主细胞,或者通过基因工程从头生成宿主细胞以插入这些序列。
关于整合基因座,本发明中使用的表达系统允许广泛的可变性。原则上,可以选择具有已知序列的任何基因座,条件是该序列的功能是可有可无的,或者如果必要,可以补充(例如在营养缺陷型的情况下)。现有技术中描述了许多适用于本发明目的的整合基因座(参见例如Francia VM&Lobo JMG(1996),J.Bacteriol v178 p.894–898;Juhas M等(2014)doi.org/10.1371/journal.pone.0111451;Juhas M&Aijoka FW(2015)MicrobalBiothechnol v.8:617-748;Sabi A等(2013)Microbial Cell Factories 12:60)。
将目标基因整合到细菌基因组中可以通过如下实现:常规方法,例如通过使用包含与染色体上特定位点同源的侧翼序列的线性盒,如对于attTn7-位点所述(Waddell C.S.和Craig N.L.,Genes Dev.(1988)Feb;2(2):137-49.);用于核酸序列基因组整合的方法,其中重组由噬菌体λ的Red重组酶功能或Rac原噬菌体的RecE/RecT重组酶功能介导(Murphy,J Bacteriol.(1998);180(8):2063-7;Zhang等,Nature Genetics(1998)20:123-128;Muyrers等,EMBO Rep.(2000)1(3):239–243);基于Red/ET重组的方法(Wenzel等,ChemBiol.(2005),12(3):349-56.;Vetcher等,Appl Environ Microbiol.(2005);71(4):1829-35)。
DNA构建体也可以被定点插入。鉴于位点特异性基因插入,对宿主细胞的另一个要求是它包含至少一个由其序列已知的基因组区域(编码或任何功能或非功能区域或功能未知的区域)并且它可以被破坏或以其它方式操纵以允许插入异源序列,而不会对细胞有害。
在某些实施方式中,考虑到选择,宿主细胞在其基因组中携带标志物基因。
在选择整合基因座时,需要考虑到所谓的“适应性进化”导致的DNA突变频率在整个大肠杆菌基因组中各不相同,并且染色体编码的重组基因表达引发的代谢负荷可能导致整合位点的突变频率增加。为了获得稳健且稳定的表达宿主细胞,优选选择导致降低的突变频率的高度保守的基因组区域作为整合位点。大肠杆菌基因组的这种高度保守区域是例如编码核糖体组分的基因或参与肽聚糖生物合成的基因,并且可以优选地选择这些区域用于整合表达盒。从而以这样一种方式选择准确的整合基因座,即功能基因既不会被破坏也不会受到损害,整合位点应该位于非功能区域。
可选择用于整合盒的序列已知的基因组区域可以选自非必需基因的编码区或其一部分;来自可有可无的功能区(即启动子、转座子等),来自缺失可能对产生特定目的蛋白质具有有利影响的基因,例如某些蛋白酶、外膜蛋白、产品的潜在污染物、编码代谢蛋白的基因(例如,与给定宿主菌株和/或发酵过程不希望或可有可无的糖分子代谢相关)或应激信号传导通路,例如那些发生在严格反应中的,原核生物的翻译控制机制,在氨基酸缺乏期间抑制tRNA和rRNA合成。或者,整合位点可以是标志物基因,其允许选择整合后所述标志物表型的消失。或者,用于选择整合的位点是一种功能,当缺失时,会提供营养缺陷,即生物体无法合成其生长所需的特定有机化合物。在这种情况下,整合位点可能是参与生物合成或代谢通路的酶,这种酶的缺失会导致营养缺陷型菌株。可以选择阳性克隆,即携带表达盒的那些,用于所述酶的底物或前体分子的营养缺陷型。或者,整合位点可以是营养缺陷型标志物(无功能的,即有缺陷的基因),其被表达盒上存在的相应原养型标志物(即互补或替换有缺陷的序列的序列)替换/补充,因此允许原养选择。
一方面,该区域是非必需基因。根据一方面,这可以是对于细胞本身不是必需的基因。非必需细菌基因从文献中已知,例如来自PEC(分析大肠杆菌染色体)数据库http://www.shigen.nig.ac.jp/ecoli/pec/genes.jsp)或来自所谓的“Keio集合”(Baba等,Molecular Systems Biology(2006)2,2006.0008)。非必需基因的一个实例是RecA。在该位点整合表达盒提供了上文中描述的基因组突变以及对宿主细胞的要求。
合适的整合位点,例如可以在初步筛选中确定易于访问和/或预计会产生更高表达率的位点。这种筛选可以通过根据Keio集合(Baba等,2006年)生成一系列单突变体缺失来进行,其中整合盒的特征是作为可变元件的各种重组序列,这些重组序列已鉴于特定整合位点预先选择,以及作为恒定元件的用于整合和选择的基本序列,包括作为替代“目标基因”的DNA序列,在诱导型启动子的控制下编码易于检测的蛋白质,例如绿色荧光蛋白。由此产生的单基因缺失突变体的表达水平可以很容易地通过荧光测量进行量化。基于该过程的结果,可以通过整合位点和/或整合盒的数量的变化来实现所需目标蛋白质的定制表达水平。
在宿主细胞含有编码重组蛋白(例如Exo、Beta和Gam—作为起始细胞的特征或通过基因工程获得)的DNA序列的实施方式中—整合可以发生在这些重组蛋白序列所在的基因组位点。通过整合表达盒,编码重组蛋白的序列被破坏或去除,因此不需要像质粒编码的辅助蛋白那样在单独的步骤中去除。
可以例如通过标志物基因,或基因功能的丧失或获得选择阳性克隆,即携带表达盒的克隆。
在一些实施方式中,使用已经包含整合到它们的基因组中的标志物基因的宿主细胞,例如抗生素抗性基因或编码荧光蛋白的基因,例如绿色荧光蛋白。在这种情况下,不包含选择标志物的表达盒被整合在染色体标志物基因的基因座上,并且针对相应表型的丢失/消失选择阳性克隆,例如选择它们用于抗生素敏感性或荧光消失,可以直接在培养板上可视化。这些实施方式的优点是标志物被表达盒中断或完全替换,因此在整合后不存在功能标志物序列并且不需要去除,如果不希望,如在抗生素抗性基因的情况下。
或者,标志物基因是表达盒的一部分。如果用于选择的标志物是赋予抗生素抗性的基因(例如卡那霉素或氯霉素),则选择抗生素抗性(即在相应抗生素存在下生长)的阳性克隆。标志物基因(无论它是存在于宿主细胞的基因组上还是已通过表达盒引入)可以在整合盒后消除。
在某些实施方式中,表达细胞可以被工程化以携带有缺陷的选择标志物基因,例如抗生素抗性基因,如氯霉素或卡那霉素,荧光标志物或参与糖或氨基酸代谢通路的基因。在这种情况下,带有目标基因的盒携带标志物基因的缺失部分,并且通过整合标志物基因恢复其功能。举例来说,盒在其一端携带标志物基因的缺失部分,并直接与基因组中整合的缺陷标志物基因整合,使得两个片段的融合使标志物基因完整并允许其功能表达。在抗生素抗性基因的情况下,携带表达盒的细胞对特定抗生素具有抗性,在荧光标志物的情况下,细胞可以通过荧光可视化,而在代谢通路基因的情况下,细胞获得代谢相应的成分的能力。该实施方式的优点是仅需要合成盒的一小部分标志物基因,与现有技术相比能够实现更短或更小的插入盒。
在某些实施方式中,阳性克隆(即携带表达盒的克隆)的选择可以通过宿主细胞的营养缺陷型的校正(即互补)来进行。在这种实施方式中,所使用的宿主细胞具有经选择以允许以简单的方式选择阳性转化体菌落的突变,例如具有缺失或突变的菌株,使其无法合成对其生长必需的化合物(这种突变称为“营养缺陷型标志物”)。例如,脯氨酸合成通路基因失活的细菌突变体是脯氨酸营养缺陷型。这种菌株不能合成脯氨酸,因此只有在脯氨酸可以从环境中摄取的情况下才能生长,而脯氨酸原养菌可以在没有脯氨酸的情况下生长。
可以使用具有营养缺陷型标志物的任何宿主细胞。优选地,氨基酸合成所需的基因突变用作营养缺陷型标志物,例如与脯氨酸、亮氨酸或苏氨酸合成相关的基因突变,或与硫胺素等辅助因子相关的基因突变。根据本发明,宿主细胞的营养缺陷通过将作为表达盒的组分的缺失/缺陷基因整合到基因组中连同目标基因的整合来校正。如此获得的原养细胞可以很容易地通过在所谓的“最低培养基”(原养选择)上培养它们来选择,该培养基不含原始宿主细胞营养缺陷型的化合物,因此只允许阳性克隆生长。
原养选择与整合基因座无关。原养选择的整合位点可以是基因组中或携带营养缺陷型标志物的基因座处的任何基因。原养选择的特殊优势在于,在成功整合后,基因组中没有抗生素抗性标志物或任何其它对宿主来说是外来的标志物。因此,不需要去除所述标志物基因,提供快速且简单的克隆和选择程序。另一个优点是恢复基因功能对细胞有益,并提供更高的系统稳定性。
或者,与表达盒一起插入基因组的标志物基因可以是允许特定选择模式的代谢基因。这种代谢基因可以使细胞在特定的(不寻常的)糖或其它碳源上生长,并且可以通过在作为唯一碳源的所述糖上生长细胞来实现阳性克隆的选择。
如上所述,在细菌的长期培养过程中,适应性进化可能会在染色体编码的重组蛋白的表达过程中导致整合位点的突变频率增加。将营养缺陷型基因缺失突变株与表达盒结合使用,以补充突变株缺乏的功能(从而从营养缺陷型突变体产生原养型菌株)具有额外的优势,即恢复的基因为细胞提供益处,细胞通过获得竞争优势,从而抑制发生适应性进化的细胞。因此,提供了一种对突变克隆进行负选择的方法。
在一些实施方式中(在目标蛋白质允许在单细胞或单菌落基础上进行检测的情况下,例如通过FACS分析或免疫学(ELISA)),不需要标志物基因,因为可以通过以下方式确定阳性克隆直接检测目标蛋白质。
获得表达宿主细胞的整合方法不限于将一种目标基因整合到基因组的一个位点;它们允许整合位点和表达盒的可变性。举例来说,可以插入不止一种目标基因,即可以将在相同或不同启动子控制下的两个或多个相同或不同序列整合到基因组上的一个或多个不同基因座中。例如,它允许表达形成异二聚体复合物的两种不同蛋白质。异二聚体蛋白质由两个单独表达的蛋白质亚基组成。这种蛋白质的一个实例是抗体分子,例如单克隆抗体或抗体片段的重链和轻链;异二聚体蛋白的其它实例是CapZ、Ras人DNA解旋酶II等。编码单体的这两个序列可以存在于插入到一个整合基因座中的一个表达盒上。或者,这两个序列也可以存在于两个不同的表达盒上,它们彼此独立地插入两个不同的整合位点。在任何情况下,启动子和诱导模式可以相同也可以不同。
尽管本发明允许并且可以有利地用于无质粒生产由本发明的构建体的基因编码的目标生物分子,但不排除在本发明的表达系统中包含携带待表达的序列而不是目的基因的质粒,例如辅助蛋白和/或上述重组蛋白。自然地,应注意在这种实施方式中,本发明的优点不应因质粒的存在而被否决,即优选地,这种质粒应以低拷贝数存在并且不应对细胞施加代谢负担。
可用于本发明方法中的表达系统可以设计成基本上或完全没有噬菌体功能。
总结以上实施方式,本发明表达盒的基于基因组的表达提供以下主要优点:
就表达宿主的构建过程而言,其优点是(i)线性插入盒的合成和扩增方法简单,(ii)在整合位点方面具有高度的灵活性(即无限制),(iii)在选择标志物和选择原则方面的高度灵活性,(iv)随后去除选择标志物的选项,(v)插入的表达盒的离散和定义数量(通常是一个或两个)。
将一个或多个重组基因整合到基因组中会导致每个细胞产生离散和定义数量的目标基因。在插入基因的一个拷贝的本发明的实施方式中,与基于质粒的表达(伴随有多达数百个的拷贝数)相比,该数目通常是一个(除非细胞包含一个以上的基因组,因为它在细胞分裂过程中短暂发生)。在本发明方法中使用的表达系统中,通过从质粒复制中解除宿主代谢,细胞合成能力的增加部分用于重组蛋白生产。构建体的强表达元件,例如PmglB或PgatY可以通过减少基因剂量应用而不会对宿主代谢产生不利影响。
如上所述,基于质粒的表达系统的缺点是,在细胞分裂过程中,细胞可能会丢失质粒,从而丢失目标基因。质粒的这种丢失取决于几个外部因素,并且随着细胞分裂(世代)的数量而增加。这意味着基于质粒的发酵在代数方面是有限的(在传统发酵中,这个数量大约在20代到50代之间)。相比之下,本发明方法中使用的基于基因组的表达系统确保了稳定的、预定义的基因剂量,实际上无限代数,因此在受控条件下理论上无限培养时间(没有细胞发生的缺点,不产生目标蛋白质,并且唯一的限制是潜在发生的自然突变,因为它们可能发生在任何基因中)。
在化学诱导型启动子的情况下,本发明提供的特别优势在于诱导剂分子的量,例如,当例如以连续模式添加,与每个细胞的基因剂量成正比,在整个培养过程中保持不变,或在预定义值随培养时间变化。从而可以实现对重组表达率的控制,这对调整基因表达率具有重要意义。
由于基于基因组的表达系统允许精确控制蛋白质表达,因此与取决于或依赖于良好控制表达的表达靶向通路相结合尤其有利。
如上所述,本发明允许设计简化的过程、改进的过程可预测性和从发酵到发酵的高再现性。使用上述表达系统的本发明方法可以以分批进料或半连续或连续模式进行,从而最佳地利用基因组编码的表达系统的优点。除了由宿主细胞的要求所定义和由所选启动子预先定义之外,对工艺参数(例如生长速率、温度和培养基成分)没有限制。
另一个优势与诱导分子的选择有关:大多数可用于在大肠杆菌中高水平表达重组基因的可用系统是IPTG可诱导的基于lac的启动子-操纵子系统。本发明中使用的表达系统允许碳源限制培养,碳源例如乳糖连续或脉冲供应,并能够通过广泛的非膨胀碳源诱导剂(如甘油、岩藻糖、乳糖、葡萄糖)实现严格的表达率控制。
重要的是,本发明中使用的表达系统具有提供重组产生的生物分子的高产量的优点,无论是关于每体积培养基的分子浓度(即滴度)还是关于获得的生物质中的分子含量。与现有技术的表达系统相比,该特征使得本发明中使用的表达系统更优越。
此外,本发明提供的优势在于可以在初步筛选测试中容易地实现表达宿主细胞的选择和/或表达盒的优化设计。举例来说,在这样的初步筛选中,构建一系列线性表达盒,其相对于以下而变化:至少一个对目标蛋白质的表达特性(表达水平或定性特征等生物活性)有影响的元件,即控制元件(例如启动子和/或聚合酶结合位点)和/或目的基因的序列(即不同的密码子使用变体)和/或用于重组的靶向序列和/或盒上的任何其它元件,如分泌前导序列。将盒变体整合到预选宿主细胞的基因组中,并在受控条件下培养产生的表达宿主变体,包括诱导蛋白质表达。通过比较蛋白质表达,选择在工业制造过程中显示出最有利结果的宿主细胞变体。在这种预筛选方法的变体中,不是确定最佳表达盒,而是可以通过将相同的盒集成到一组不同的宿主细胞中来鉴定最佳细菌菌株。由于整合策略的优点是允许将离散数量的基因拷贝(例如只有一个)整合到基因组中,因此可以在不受质粒复制或质粒拷贝数变化干扰的情况下进行各种参数的预筛选。
根据本发明,术语“培养”(或“培养”,也称为“发酵”)涉及根据行业中已知的方法在受控生物反应器中繁殖细菌表达细胞。
重组蛋白的制造通常通过进行更大体积的培养来完成。本发明含义中的术语“制造”和“制造规模”定义了具有最小体积5L培养液的发酵。通常,“制造规模”过程定义为能够处理大量含有目标重组蛋白的制剂并产生满足例如对于治疗性蛋白质,用于临床试验和市场供应的需求。除了大体积外,与摇瓶培养等简单的实验室规模方法不同,制造规模方法的特点是使用生物反应器(发酵罐)技术系统,该技术系统配备有搅拌、曝气、营养进料、监测和控制工艺参数(pH、温度、溶解氧张力、背压等)。实验室规模方法中表达系统的行为不允许预测该系统在生物反应器的复杂环境中的行为。
本发明的表达系统可以有利地用于以制造规模(就体积和技术系统而言)结合基于营养物进料的培养模式,特别是分批进料过程的重组产生或连续或半连续过程。
在某些实施方式中,本发明的方法是分批进料工艺。
鉴于分批过程是一种培养模式,其中细胞培养所需的所有营养物质都包含在初始培养基中,在发酵过程中无需额外供应其它营养物质,而在分批进料过程中,在分批阶段之后,进料阶段发生在该阶段,通过进料向培养物提供一种或多种营养物质。营养进料的目的是增加生物量(所谓的“高细胞密度培养过程”或“HCDC”),以增加重组蛋白的数量。尽管在大多数培养过程中,进料模式是关键和重要的,但本发明不限于特定进料模式。
营养物的进料可以根据本领域已知的方法以连续或不连续的方式进行。进料模式可以是预定义的(即独立于实际工艺参数添加进料),例如线性常数、线性增加、逐步增加或遵循数学函数,例如指数进料。
在优选的实施方式中,本发明的方法是分批进料过程,其中进料模式根据指数函数预先确定。通过应用指数进料模式,细胞群体的特定生长速率μ可以预先定义在一个恒定水平,并针对最大重组蛋白表达进行优化。进料速率的控制基于所需的特定生长速率μ。当使用如下所述的限定培养基时,可以通过计算基于提供的底物单元形成的生物质等分试样来准确预测和预先限定生长。
在另一个优选的实施方式中,在培养的最后阶段,可以遵循指数进料模式,通过线性恒定进料。
在分批进料工艺的另一个实施方式中,应用线性恒定进料。线性恒定进料的特征在于进料速率(每单位时间的进料量)在某些培养阶段是恒定的(即不变的)。
在进料分批工艺的另一个实施方式中,应用线性递增进料。线性递增进料的特点是进料培养基的进料速度服从线性函数。根据线性递增函数的进料的特征在于,每限定的时间增量进料速度的限定增加。
在本发明的分批进料方法的另一个实施方式中,将反馈控制算法应用于进料(与预定义的进料模式相反)。在反馈控制的分批进料过程中,进料速度取决于某个培养参数的实际水平。适用于反馈控制进料的培养参数例如是生物量(及其衍生的化学或物理参数)、溶解氧、呼吸系数、pH值或温度。反馈控制进料模式的另一个实例是基于生物反应器中的实际葡萄糖浓度。
在另一个实施方式中,携带根据本发明的基于基因组的表达盒的细菌细胞以连续模式培养。连续发酵过程的特征在于将新鲜培养基以限定的、恒定的和连续的速率供给到生物反应器中,由此同时以相同的限定的、恒定的和连续的去除速率从生物反应器中去除培养液。通过将培养基、进料率和去除率保持在相同的恒定水平,生物反应器中的培养参数和条件保持恒定(所谓的“稳态”)。比生长速率μ可以预先定义并且完全是生物反应器中的进料速率和培养基体积的结果。由于具有一个或多个基于基因组的表达盒的细胞在遗传上非常稳定(与结构和分离不稳定的基于质粒的表达系统或基因组插入的表达盒依赖于基因组扩增的表达系统相反),根据本发明的细胞世代数(细胞倍增)在理论上是无限的,因此,培养时间也是无限的。与遗传不稳定的现有技术系统相比,以连续模式培养遗传稳定的基于基因组的表达系统的优势在于每个时间段可以获得更高总量的重组蛋白。此外,由于理论上无限的培养时间,甚至与进料分批培养过程相比,根据本发明的细胞的连续培养可导致每个时间段更高的总蛋白量。
另一个优选的实施方式是指细胞的半连续培养。本发明意义上的半连续培养过程是在其第一阶段作为进料分批过程(即分批阶段之后是进料阶段)操作的过程。在获得一定体积或生物质后(即通常在获得发酵罐体积的上限时),从生物反应器中去除大部分含有目标重组蛋白的细胞培养液。随后,再次开始进料,直到培养液的生物量或体积再次达到特定值。这种方法(培养液的排出和通过进料重新填充)可以进行至少一次,理论上是无限次的。
对于发酵过程中使用的培养基类型,没有限制。培养基可以是半限定的,即含有复杂的培养基化合物(例如酵母提取物、大豆蛋白胨、酪蛋白氨基酸等),或者它可以是化学限定的,没有任何复杂的化合物。
优选地,使用“限定培养基”。“限定”培养基(也称为“最小”或“合成”培养基)仅由化学限定物质组成,即碳源,如葡萄糖或甘油、盐、维生素,以及考虑到可能的菌株营养缺陷,特定氨基酸或其它物质,如硫胺素。最优选地,葡萄糖用作碳源。通常,进料培养基的碳源作为控制比生长速率的生长限制组分。
在本发明的方法中,获得了显著更高的产量,因为在整个生产过程中可以保持细菌的生长和高的但生理上可耐受的重组基因表达率。
用于产生HMO的重组细菌和方法是公知的(参见例如Priem B等,(2002)Glycobiology;12(4):235-40;Drouillard S等,(2006)Angew.Chem.Int.Ed.45:1778–1780;Fierfort N&Samain E(2008)J Biotechnol134:261-265;Drouillard S.等(2010)Carbohydrate Research 3451394–1399;Gebus C等(2012)Carbohydrate Research 36383-90;WO2019123324)。
为了生产HMO,在合适的碳源例如葡萄糖、甘油、乳糖等存在下根据本领域已知的程序培养如本文所述的产生HMO的细菌,并且产生的HMO从培养基和培养过程中形成的微生物生物质中收获。此后,根据本领域已知的程序,例如在WO2015188834、WO2017182965或WO2017152918中所述,纯化HMO,并且纯化的HMO用作营养品、药物或用于任何其它目的,例如用于研究。
本发明的其它特征和优点将从以下工作实施例的描述和权利要求中显而易见。除非另有定义,本文使用的所有技术和科学术语与本发明所属领域的普通技术人员通常理解的含义相同。尽管在本发明的实践或测试中可以使用与本文所述的那些方法和材料相似或等效的方法和材料,但下文描述了合适的方法和材料。此外,材料、方法和实施例仅是说明性的,因此不限制本发明的范围。
本发明的选定实施方式
以下是本发明的一些选定但非限制性的实施方式。
在一个实施方式中,本发明涉及一种分离的核酸序列,其鉴定为SEQ ID NO:1。在另一个实施方式中,本发明涉及SEQ ID NO:1的变体,其中所述变体与SEQ ID NO:1具有至少80%的序列同一性。
优选地,鉴定为SEQ ID NO:1的分离的核酸序列包含在核酸构建体中。
在一个实施方式中,构建体包含启动子DNA序列,其可操作地连接至连续合成DNA序列(i),
其中
a)DNA序列(i)具有至少23个核碱基的长度并且包含SEQ ID NO:1、或其变体;其中所述变体与SEQ ID NO:1具有至少80%的序列同一性;
b)启动子是分离的DNA序列,它包含环AMP受体蛋白(CRP)的单一结合位点,该结合位点以转录开始后约-41位置为中心。
在一些实施方式中,CRP结合位点包含SEQ ID NO:51或SEQ ID NO:52、或其变体。在一些实施方式中,启动子DNA序列由SEQ ID NO:21或SEQ ID NO:22、或其变体或片段组成,或包含SEQ ID NO:21或SEQ ID NO:22、或其变体或片段。在一些实施方式中,构建体还包含DNA序列(ii),其中所述DNA序列(ii)可操作地连接在DNA序列(i)的下游。在一个实施方式中,DNA序列(ii)是非编码DNA序列。优选地,非编码DNA序列包含核糖体结合位点(RBS)。非编码DNA序列的RBS结合位点可以包含选自SEQ ID NO:3-SEQ ID NO:20中任一个的DNA序列。包含RNA序列的构建体还可包含与非编码DNA序列(ii)可操作地连接的编码DNA序列。优选地,这种构建体的编码DNA序列编码多肽。多肽可以是酶、转运蛋白、抗原、调节蛋白。
在上述核酸构建体的一些实施方式中,DNA序列(ii)是编码DNA序列。编码DNA序列(ii)优选包含编码非编码小RNA分子例如调节性microRNA(miRNA)或小干扰RNA(siRNA)分子的DNA序列。
在另一个实施方式中,核酸构建体包含连续合成核酸,该核酸包含两个DNA序列(i)和(ii),其中DNA序列(ii)可操作地连接在DNA序列(i)的下游,并且
其中
a)DNA序列(i)具有至少23个核碱基的长度并包含SEQ ID NO:1、或其变体,其中所述变体与SEQ ID NO:1具有至少80%的序列同一性;
b)DNA序列(ii)不包含SEQ ID NO:3-SEQ ID NO:18中任一个序列;
该核酸构建体还可包含与DNA序列(i)可操作连接的启动子。这种核酸构建体的启动子包含分离的DNA序列,在一个优选实施方式中,其可包含环AMP受体蛋白(CRP)的单一结合位点,其以转录起点上游约-41位置为中心。在一些优选的实施方式中,CRP结合位点包含SEQ ID NO:51或SEQ ID NO:52、或其变体。启动子DNA序列可以具有SEQ ID NO:21或SEQ IDNO:22的序列、或其变体或片段,或包含所述序列。核酸构建体还可包含编码DNA序列,其编码功能性多肽,例如酶、转运蛋白、抗原、调节蛋白或小的非编码RNA分子,例如调节性microRNA(miRNA)或小干扰RNA(siRNA)分子。后面的构建体优选包含DNA序列(ii),其包含核糖体结合位点。在一些优选的实施方式中,核糖体结合位点可包含SEQ ID NO:19或SEQID NO:20。
在一个实施方式中,本发明涉及一种载体,其包含SEQ ID NO:1、或其变体的核酸序列,其中所述变体与SEQ ID NO:1具有至少80%的序列同一性。在另一个实施方式中,本发明涉及一种载体,其包含如上述任一项的核酸构建体。
在一个实施方式中,本发明涉及一种表达盒,其包含SEQ ID NO:1的核酸序列、或其变体,其中所述变体与SEQ ID NO:1具有至少80%的序列同一性。在另一个实施方式中,本发明涉及一种表达盒,其包含如上述任一项的构建体。
在一个实施方式中,本发明涉及一种重组细胞,其在不同的实施方式中可包含上述任一种的核酸构建体、载体、表达盒。优选地,细胞是细菌细胞。
在一个实施方式中,本发明涉及一种表达系统,其在不同的实施方式中可以包含核酸序列、构建体和/或重组细胞以及上述任一种。
在一个实施方式中,本发明涉及一种重组产生生物分子的方法,生物分子优选蛋白质,例如酶、转运蛋白、调节蛋白、结构蛋白或小的非编码RNA分子,例如调节性microRNA(miRNA)或小干扰RNA(siRNA)分子,或寡糖,例如人乳寡糖,该方法包括
(a)提供如上所述的核酸或构建体,
(b)提供如上所述的重组细胞或表达系统;
(c)在(b)的细胞或表达系统中产生生物分子。
实施例
材料和方法
除非另有说明,否则将分子生物学领域中已知的标准技术、载体、控制序列元件和其它表达系统元件用于核酸操作、转化和表达。这种标准技术、载体和元件可以在例如以下中找到:Ausubel等(著),Current Protocols in Molecular Biology(1995)(John Wiley&Sons);Sambrook,Fritsch,&Maniatis(著),Molecular Cloning(1989)(Cold SpringHarbor Laboratory Press,NY);Berger&Kimmel,Methods in Enzymology 152:Guide toMolecular Cloning Techniques(1987)(Academic Press);Bukhari等(著),DNAInsertion Elements,Plasmids and Episomes(1977)(Cold Spring Harbor LaboratoryPress,NY);Miller,J.H.Experiments in molecular genetics(1972.)(Cold springHarbor Laboratory Press,NY)。
菌株和质粒
使用的细菌菌株MDO从大肠杆菌K12 DH1构建。大肠杆菌K12DH1基因型为:Fˉ、λ-、gyrA96、recA1、relA1、endA1、thi-1、hsdR17、supE44。除了大肠杆菌K12 DH1基因型MDO还具有以下修饰:lacZ:缺失1,5kbp,lacA:缺失0,5kbp,nanKETA:缺失3,3kbp,melA:缺失0,9kbp,wcaJ:缺失0.5kbp,mdoH:缺失0.5kbp,以及在gmd基因上游插入Plac启动子。
本实施例中使用的菌株在表5中描述。用于构建这些菌株的供体和辅助质粒列于表6中。用于构建质粒的引物列于表7中。
Figure BDA0003417269140000331
表5
质粒ID 描述
pACBSR Para-l-Scel-λRed,p15A ori,cam*
pUC57 pMB1,bla
pUC57::gal pUC57::galTK’/T1-galKM’
pMAP409 pUC57::galTK’-PmglB_16UTR-lacZ-T1-galKM’
pMAP1030 pUC57::galTK’-PmgIB_70UTR-lacZ-T1-galKM’
pMAP1069 pUC57::galTK’-PmglB_70UTR_SD4-lacZ-T1-galKM’
pMAP1070 pUC57::galTK’-PmglB_70UTR_SD5-lacZ-T1-galKM’
pMAP1071 pUC57::galTK’-PmglB_70UTR_SD7-lacZ-T1-galKM’
pMAP1072 pUC57::galTK’-PmglB_70UTR_SD8-lacZ-T1-galKM’
pMAP1073 pUC57::galTK’-PmglB_70UTR_SD9-lacZ-T1-galKM’
pMAP1226 pUC57-galTK’-PmglB_org-lacZ-T1-galKM’
pMAP1227 pUC57-galTK’-PgatY_org-lacZ-T1-galKM’
pMAP1229 pUC57-galTK’-PmgIB_54UTR-lacZ-T1-galKM’
pMAP1230 pUC57-galTK’-PgatY_54UTR-lacZ-T1-galKM’
表6
培养基
LB培养基使用LB Broth Powder,Millers(Fisher Scientific)制成,LB琼脂平板使用LB Agar Powder,Millers(Fisher Scientific)制成。使用40μg/ml浓度的X-gal,在含有5-溴-4-氯-3-碘-β-D-吡喃半乳糖苷(X-gal)的LB平板上筛选菌株。适当时加入氨苄青霉素(100μg/ml)和/或氯霉素(20μg/ml)。
基础最低培养基的组成如下:NaOH(1g/L)、KOH(2.5g/L)、KH2PO4(7g/L)、NH4H2PO4(7g/L)、柠檬酸(0.5g/l)、微量矿物质溶液(5ml/L)。微量矿物质储备溶液包含:ZnSO4·7H2O0.82g/L、柠檬酸20g/L、MnSO4·H2O 0.98g/L、FeSO4·7H2O 3.925g/L、CuSO4·5H2O 0.2g/L。用5N NaOH将基础最低培养基的pH值调至7.0并高压灭菌。接种前,向基础最低培养基提供1mM MnSO4、4μg/ml硫胺素、0.5%的给定碳源(葡萄糖或甘油(Carbosynth)),并在适当时加入氨苄青霉素(100μg/ml)和/或氯霉素(20μg/ml)。硫胺素和抗生素通过过滤灭菌。甘油的所有百分比浓度均表示为v/v,而葡萄糖的所有百分比浓度均表示为w/v。含有2-脱氧半乳糖的M9板具有以下组成:15g/L琼脂(Fisher Scientific)、2.26g/L 5x M9最低盐(Sigma-Aldrich)、2mM MnSO4、4μg/ml硫胺素、0.2%甘油和0.2%2-脱氧-D-半乳糖(Carbosynth)。
含有半乳糖的MacConkey指示板具有以下组成:40g/LMacConkey琼脂培养基(BDDifcoTM)。高压灭菌并冷却至50℃后,加入D-半乳糖(Carbosynth)至终浓度为1%。
培养
除非另有说明,在37℃搅拌下,大肠杆菌菌株在含有0.2%葡萄糖的LB培养基中繁殖。
为β-半乳糖苷酶测定收集的培养物按以下方式制备:在10ml 24深孔板(Axygen)中,在1ml含有葡萄糖(0.5%)的基础最低培养基中预培养来自LB板的单个菌落。在培养之前用Hydrophobic Gas Permeable Adhesive Seal(Axygen)将板密封,并在34℃下在定轨振荡器(Edmund Bühler GmbH)中以700rpm的速度孵育24小时。使用S-20分光光度计(Boeco,Germany)在600nm处监测培养物的细胞密度。将20μl过夜培养物用于接种24深孔板中含有葡萄糖或其它碳源(0.5%)的2ml LB或基础最低培养基。深孔板用密封箔覆盖并在28℃下以700rpm的轨道振荡孵育24小时。孵育后,测量OD600并通过离心收集0.5ml细胞培养物用于预形成β-半乳糖苷酶测定。
化学感受态细胞和转化
将大肠杆菌从LB平板接种到5ml含有0.2%葡萄糖的LB中,在37℃下振荡直至OD600约为0.4。通过以13.000g离心25秒收集2ml培养物。去除上清液,将细胞团重悬于600μl冷TB溶液(10mM PIPES、15mM CaCl2、250mM KCl)中。将细胞在冰上孵育20分钟,然后以13.000g沉淀15秒。去除上清液,将细胞沉淀重悬于100μl冷TB溶液中。使用100μl感受态细胞和1-10ng质粒DNA进行质粒转化。细胞和DNA在冰上孵育20分钟,然后在42℃下热激45秒。在冰上孵育2分钟后,加入400μl SOC(20g/L胰蛋白胨、5g/L酵母提取物、0.5g/LNaCl、0.186g/L KCl、10mM MgCl2、10mM MgSO4和20mM葡萄糖)并将细胞培养物在37℃下振荡孵育1小时,然后铺在选择性平板上。
在供应商(Thermo Fisher Scientific)推荐的条件下,将质粒连接物转化到TOP10化学感受态细胞中。
DNA技术
使用QIAprep Spin Miniprep试剂盒(Qiagen)从大肠杆菌中分离质粒DNA。使用QIAmp DNAMini试剂盒(Qiagen)从大肠杆菌中分离染色体DNA。PCR产物使用QIAquick PCR纯化试剂盒(Qiagen)纯化。使用供应商推荐的DreamTaq PCR Master Mix(Thermofisher)、Phusion U热启动PCR Master Mix(Thermofisher)、USEREnzym(New England Biolab)。引物由德国Eurofins Genomics提供。PCR片段和质粒由Eurofins Genomics测序。
在供应商(Thermofisher)推荐的条件下,在T100TM热循环仪(Bio-Rad)中使用DreamTaq PCR Master Mix进行菌落PCR。例如,在构建表达来自galK基因座的报告基因或重组基因的菌株期间,引物O48和O49用于菌落PCR反应,旨在确认预期修饰的有效性。
Figure BDA0003417269140000361
表7
质粒的构建
合成一个包含两个I-SceI核酸内切酶位点的质粒,由gal操纵子的两个DNA片段(在galK中进行同源重组所需)和一个T1转录终止子序列(pUC57::gal)分开(GeneScript)。gal操纵子中用于同源重组的DNA序列覆盖大肠杆菌K12 MG155完整基因组GenBank:ID:CP014225.1中的碱基对3.628.621-3.628.720和3.627.572-3.627.671。通过同源重组插入将导致galK的949个碱基对和galK-表型的缺失。
分子生物学领域公知的标准技术用于设计引物和扩增大肠杆菌K-12DH1染色体DNA的特定DNA序列。这种标准技术、载体和元件可以在例如以下中找到:Ausubel等(著),Current Protocols in Molecular Biology(1995)(John Wiley&Sons);Sambrook,Fritsch,&Maniatis(著),Molecular Cloning(1989)(Cold Spring Harbor LaboratoryPress,NY);Berger&Kimmel,Methods in Enzymology 152:Guide to Molecular CloningTechniques(1987)(Academic Press);Bukhari等(著)。
使用引物O40和O79扩增含有pUC57-sceI-galTK-T1-galKM-sceI的3.5kbp质粒主链,并使用引物和O78从分离自大肠杆菌K-12DH1的染色体DNA扩增含有lacZ的3.3kbp DNA片段。
从大肠杆菌DH1获得的染色体DNA或构建的质粒用于扩增含有启动子元件的DNA片段。包含启动子PgatY_org(SEQ ID NO:21)的DNA片段使用O362和OL-091扩增;PgatY_54UTR(SEQ ID NO:24)使用O362和OL-093并且pMAP1227作为DNA模板;PmglB_org(SEQ ID NO:22)使用O364和OL-090;PmglB_16UTR(SEQ ID NO:25)使用O364和O365;PmglB_54UTR(SEQ IDNO:24)使用O364和OL-092并且pMAP1226作为DNA模板;PmglB_70UTR(SEQ ID NO:26)使用O364和O990并且pMAP409作为DNA模板;PmglB_70UTR_SD4(SEQ ID NO:27)使用O364和O459并且pMAP1030作为DNA模板,mglB_70UTR_SD5(SEQ ID NO:28)使用O364和O460并且pMAP1030作为DNA模板;PmglB_70UTR_SD7(SEQ ID NO:29)使用O364和O462并且pMAP1030作为DNA模板;PmglB_70UTR_SD8(SEQ ID NO:30)使用O364和O463并且pMAP1030作为DNA模板;PmglB_70UTR_SD9(SEQ ID NO:31)使用O364和O464并且pMAP1030作为DNA模板。
纯化所有PCR片段,克隆质粒主链、启动子元件和lacZ,转化到TOP10细胞中,并在含有100μl/ml氨苄青霉素和0.2%葡萄糖的LB平板上进行筛选。对构建的质粒(见表6)进行纯化。启动子序列和lacZ基因的5’端通过DNA测序(MWG Eurofins Genomics)进行验证。
构建的所有质粒主链都包含两个特定DNA片段,与用于同源重组的大肠杆菌K-12DH1同源。以这种方式,将包含任何目标启动子构建体、lacZ和T1转录终止子的遗传盒特异地插入到大肠杆菌基因组中。用于重组工程的质粒的构建使用标准克隆技术完成。表达元件的DNA序列见表8。
Figure BDA0003417269140000381
Figure BDA0003417269140000391
表8
菌株的构建
与报告基因或重组基因融合的启动子表达元件的插入基本上如Herring等人所述(Herring,C.D.,Glasner,J.D.和Blattner,F.R.(2003).Gene(311).153-163)通过GeneGorging进行。简而言之,将供体质粒和辅助质粒共转化为MDO并在含有0.2%葡萄糖、氨苄青霉素(100μg/ml)或卡那霉素(50mg/mL)和氯霉素(20μg/ml)的LB平板上进行选择。将单个菌落接种到含有氯霉素(20μg/ml)和10μl 20%L-阿拉伯糖的1ml LB中,并在37℃下振荡培养7-8小时。然后将细胞接种在M9-DOG平板上,并在37℃下培养48小时。在MM-DOG平板上形成的单菌落重新划线到含有0.2%葡萄糖的LB平板上,并在37℃下培养24小时。
对于在galK基因座处的插入,在MacConkey-半乳糖琼脂平板上出现白色并对氨苄青霉素和氯霉素敏感的菌落预计会丢失供体和辅助质粒,并在galK基因座中包含插入。galK位点中的插入使用位于galK基因座外部的引物O48和O49通过菌落PCR鉴定。纯化染色体DNA,使用引物O48和O49扩增galK基因座,并通过测序验证插入的DNA(EurofinsGenomics,德国)。
分别使用供体质粒pMAP409、pMAP1030、pMAP1069、pMAP1070、pMAP1071、pMAP1072、pMAP1073、pMAP1226、pMAP1227、pMAP1229和pMAP1230构建菌株MAP1021、MAP1730、MAP1739、MAP1740、MAP1741、MAP1742、MAP1743、MAP1918、MAP1919、MAP1920和MAP1921。
酶检测:lacZ
如前所述测定β-半乳糖苷酶活性(参见例如Miller J.H.Experiments inmolecular genetics,Cold spring Harbor Laboratory Press,NY,1972)。简而言之,将细胞在Z缓冲液中稀释并用十二烷基硫酸钠(0.1%)和氯仿进行透化。测定在30℃下进行。样品预热,通过添加200μl邻硝基苯基-β-半乳糖苷酶(4mg/ml)开始分析,并在样品变成微黄色时通过添加500μl 1M Na2CO3停止。随后将邻硝基苯酚的释放确定为420nm处光密度的变化。比活性以米勒单位[A420/(min*ml*A600)]报告。活性是来自至少两个独立实验的平均值。
实施例1-通过分别在表达元件PgatY_org和PmglB_org中用包含54UTR-glpF的合成DNA替换部分5’UTR来调节基因表达
使用含有无启动子lacZ基因的启动子-探针质粒克隆包含各种启动子元件的四个DNA片段。lacZ的表达水平在启动子元件与lacZ融合后将启动子-lacZ元件以单拷贝形式整合到染色体DNA中后测定。大肠杆菌MDO中lacZ基因中的AlacZM15缺失使其无法产生活性β-半乳糖苷酶,因此被用作筛选中的菌株背景。包含源自操纵子gatYZABCDR和mglBAC的基因组启动子序列的两个重组核酸序列与无启动子lacZ报告基因融合,并以单拷贝形式插入到染色体DNA中。测量克隆片段的表达水平(图1,白条)。通过用54个核苷酸长片段54UTR-glpF(SEQ ID NO:2)替换转录起始位点和翻译起始位点上游16bp之间的5’UTR来修饰表达元件PgatY_org(SEQ ID NO:21)和PmglB_org(SEQ ID NO:22)中的5’UTR区域,即产生gatY-54UTR-glpF(SEQ ID NO:23)和mglB-54UTR-glpF(SEQ ID NO:24)。令人惊讶的是,用54UTR-glpF替换PgatY_org和PmglB_org的5’UTR区域增加了表达(图2,灰色条),表明glpF-54UTR(SEQ ID NO:2)可用作调节来自各种(如果不是任何)启动子和来自任何构建体的基因表达。
实施例2-使用合成的PmglB表达元件调节重组核酸序列的表达
我们之前已经证明16UTR/Rec UTR(SEQ ID NO:3)序列的修饰对来自包含该序列的PglpF_70UTR和PglpT_70UTR构建体的基因表达的影响(PCT/IB2018/060355)。在此,我们确认PCT/IB2018/060355中描述的16UTR变体与54UTR-glpF组合具有相似的lacZ基因从包含PmglB的构建体表达的效果。用合成DNA片段(16UTR,SEQ ID NO:3)改变位于mglB翻译起始位点正上游的mglB-5’URT的16个核苷酸DNA片段,使表达增加2倍。用glpF-70UTR序列替换位于转录起始位点和翻译起始密码子之间的整个mglB 5’UTR区域,产生PmglB_70UTR(SEQ ID NO:25),与原始启动子元件PmglB_org相比,表达水平增加近5倍。此外,包含核糖体结合位点(RBS或Shine Dalgarno序列)的16UTR核苷酸序列的微小变化对来自PmglB_70UTR的表达水平有显著影响,产生表达水平变化高达7倍的表达文库。(图3)。
实施例3
使用RNAfold WebServer(http://rna.tbi.univie.ac.at/cgi-bin/RNAWebSuite/RNAfold.cgi)和RNAstructure Predict(http://rna.urmc.rochester.edu/RNAstructure.html)分析SEQ ID NO:2的5’RNA转录物的二级结构。发现该序列(SEQ IDNO:1)的二十三个核苷酸片段形成如图4所示的pin结构。不受理论的束缚,我们在本文中建议SEQ ID NO:1的转录物稳定了包含其的RNA分子。
实施例4
在菌株背景中,其中结肠酸基因gmd、wcaJ(fcl)、cpsB(manC)和cpsG(manB)从Plac过表达,futC的单拷贝从Plac启动子(菌株MAP292)或PmglB_70UTR_SD4启动子(SEQ ID NO:27)(菌株MAP1994)表达。在分批进料条件下对2’-FL产生的分析表明,当futC从PmglB_70UTR_SD4表达时,2’-FL滴度增加3-7倍(数据未显示)。
序列表
<110> 格礼卡姆股份公司
<120> 核酸构建体
<130> 141WO00
<150> DK 2019 00756
<151> 2019-06-21
<160> 52
<170> BiSSAP 1.3.6
<210> 1
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> 23 nb 5'UTR-glpF (pin结构)
<400> 1
cgtggaggtc cgtgactttc acg 23
<210> 2
<211> 54
<212> DNA
<213> 人工序列
<220>
<223> 54nb 5'UTR-glpF
<400> 2
tgcctacaag catcgtggag gtccgtgact ttcacgcata caacaaacat taac 54
<210> 3
<211> 16
<212> DNA
<213> 人工序列
<220>
<223> Rec RBS (!6UTR)
<400> 3
caaggaggaa acagct 16
<210> 4
<211> 16
<212> DNA
<213> 人工序列
<220>
<223> recRBS_v1 (SD1)
<400> 4
caaattcgaa acagct 16
<210> 5
<211> 16
<212> DNA
<213> 人工序列
<220>
<223> recRBS_v2 (SD2)
<400> 5
caagcgcaaa acagct 16
<210> 6
<211> 16
<212> DNA
<213> 人工序列
<220>
<223> recRBS_v3 (SD3)
<400> 6
caagaacaaa acagct 16
<210> 7
<211> 16
<212> DNA
<213> 人工序列
<220>
<223> recRBS_v4 (SD4)
<400> 7
caactaggaa acagct 16
<210> 8
<211> 16
<212> DNA
<213> 人工序列
<220>
<223> recRBS_v5 (SD5)
<400> 8
caaccgagaa acagct 16
<210> 9
<211> 16
<212> DNA
<213> 人工序列
<220>
<223> recRBS_v6 (SD6)
<400> 9
caagagctaa acagct 16
<210> 10
<211> 16
<212> DNA
<213> 人工序列
<220>
<223> recRBS_v7 (SD7)
<400> 10
caagagcaaa acagct 16
<210> 11
<211> 16
<212> DNA
<213> 人工序列
<220>
<223> recRBS_v8 (SD8)
<400> 11
caagagaaaa acagct 16
<210> 12
<211> 16
<212> DNA
<213> 人工序列
<220>
<223> recRBS_v9 (SD9)
<400> 12
caaaggaaaa acagct 16
<210> 13
<211> 16
<212> DNA
<213> 人工序列
<220>
<223> recRBS_v10 (SD10)
<400> 13
caactgagaa acagct 16
<210> 14
<211> 16
<212> DNA
<213> 人工序列
<220>
<223> 16 nb lacZ RBS
<400> 14
cacacaggaa acagct 16
<210> 15
<211> 16
<212> DNA
<213> 人工序列
<220>
<223> 16 nb glpF RBS
<400> 15
tcttcaggat ccgatt 16
<210> 16
<211> 16
<212> DNA
<213> 人工序列
<220>
<223> 16 nb glpA RBS
<400> 16
cttcagaggg ataaca 16
<210> 17
<211> 16
<212> DNA
<213> 人工序列
<220>
<223> 16 nb glpA RBS
<400> 17
gccacggagg ctatca 16
<210> 18
<211> 16
<212> DNA
<213> 人工序列
<220>
<223> glpD RBS
<400> 18
agtgaatgag ggcagc 16
<210> 19
<211> 16
<212> DNA
<213> 人工序列
<220>
<223> 16 nb gatY RBS
<400> 19
acgacaggat atgaaa 16
<210> 20
<211> 16
<212> DNA
<213> 人工序列
<220>
<223> 16 nb mglB RBS
<400> 20
aaaaaccgga gatacc 16
<210> 21
<211> 250
<212> DNA
<213> 人工序列
<220>
<223> PgatY_org
<400> 21
cggcaaccta tgcctgatgc gacgctgaag cgtcttatca tgcctacata gcactgccac 60
gtatgtttac accgcatccg gcataaaaac acgcgcactt tgctacggct tccctatcgg 120
gaggccgttt ttttgccttt cactcctcga ataattttca tattgtcgtt tttgtgatcg 180
ttatctcgat atttaaaaac aaataatttc attatatttt gaaatcgaaa acaaacgaca 240
ggatatgaaa 250
<210> 22
<211> 350
<212> DNA
<213> 人工序列
<220>
<223> PmglB_org
<400> 22
tgcgtcgcca ttctgtcgca acacgccaga atgcggcggc gatcactaac tcaacaaatc 60
aggcgatgta accgctttca atctgtgagt gatttcacag tatcttaaca atgtgatagc 120
tatgattgca ccgttttaac gttgtaaccc gtatgtaaca gtgaataatc acttttgccg 180
aggtaacagc gtcataacaa caattaaagc cgttttctgg agcgttaccg ggcatggaag 240
aacgaatttt aaaaagtgag cttcggcgtt cagtaacact tcattaactc tactgccccg 300
ccgagcattt atctcaagca ctaccctgca taagaaaaac cggagatacc 350
<210> 23
<211> 291
<212> DNA
<213> 人工序列
<220>
<223> PgatY_54UTR
<400> 23
cggcaaccta tgcctgatgc gacgctgaag cgtcttatca tgcctacata gcactgccac 60
gtatgtttac accgcatccg gcataaaaac acgcgcactt tgctacggct tccctatcgg 120
gaggccgttt ttttgccttt cactcctcga ataattttca tattgtcgtt tttgtgatcg 180
ttatctcgat atttaaaaac aaataatttc attatatttt gtgcctacaa gcatcgtgga 240
ggtccgtgac tttcacgcat acaacaaaca ttaacacgac aggatatgaa a 291
<210> 24
<211> 203
<212> DNA
<213> 人工序列
<220>
<223> PmglB_54UTR
<400> 24
tgcgtcgcca ttctgtcgca acacgccaga atgcggcggc gatcactaac tcaacaaatc 60
aggcgatgta accgctttca atctgtgagt gatttcacag tatcttaaca atgtgatagc 120
tatgattgca ccgtgcctac aagcatcgtg gaggtccgtg actttcacgc atacaacaaa 180
cattaacaaa aaccggagat acc 203
<210> 25
<211> 350
<212> DNA
<213> 人工序列
<220>
<223> PmglB_16UTR
<400> 25
tgcgtcgcca ttctgtcgca acacgccaga atgcggcggc gatcactaac tcaacaaatc 60
aggcgatgta accgctttca atctgtgagt gatttcacag tatcttaaca atgtgatagc 120
tatgattgca ccgttttaac gttgtaaccc gtatgtaaca gtgaataatc acttttgccg 180
aggtaacagc gtcataacaa caattaaagc cgttttctgg agcgttaccg ggcatggaag 240
aacgaatttt aaaaagtgag cttcggcgtt cagtaacact tcattaactc tactgccccg 300
ccgagcattt atctcaagca ctaccctgca taagcaagga ggaaacagct 350
<210> 26
<211> 203
<212> DNA
<213> 人工序列
<220>
<223> PmglB_70UTR
<400> 26
tgcgtcgcca ttctgtcgca acacgccaga atgcggcggc gatcactaac tcaacaaatc 60
aggcgatgta accgctttca atctgtgagt gatttcacag tatcttaaca atgtgatagc 120
tatgattgca ccgtgcctac aagcatcgtg gaggtccgtg actttcacgc atacaacaaa 180
cattaaccaa ggaggaaaca gct 203
<210> 27
<211> 203
<212> DNA
<213> 人工序列
<220>
<223> PmglB_70UTR_SD4
<400> 27
tgcgtcgcca ttctgtcgca acacgccaga atgcggcggc gatcactaac tcaacaaatc 60
aggcgatgta accgctttca atctgtgagt gatttcacag tatcttaaca atgtgatagc 120
tatgattgca ccgtgcctac aagcatcgtg gaggtccgtg actttcacgc atacaacaaa 180
cattaaccaa ctaggaaaca gct 203
<210> 28
<211> 203
<212> DNA
<213> 人工序列
<220>
<223> PmglB_70UTR_SD5
<400> 28
tgcgtcgcca ttctgtcgca acacgccaga atgcggcggc gatcactaac tcaacaaatc 60
aggcgatgta accgctttca atctgtgagt gatttcacag tatcttaaca atgtgatagc 120
tatgattgca ccgtgcctac aagcatcgtg gaggtccgtg actttcacgc atacaacaaa 180
cattaaccaa ccgagaaaca gct 203
<210> 29
<211> 203
<212> DNA
<213> 人工序列
<220>
<223> PmglB_70UTR_SD7
<400> 29
tgcgtcgcca ttctgtcgca acacgccaga atgcggcggc gatcactaac tcaacaaatc 60
aggcgatgta accgctttca atctgtgagt gatttcacag tatcttaaca atgtgatagc 120
tatgattgca ccgtgcctac aagcatcgtg gaggtccgtg actttcacgc atacaacaaa 180
cattaaccaa gagcaaaaca gct 203
<210> 30
<211> 203
<212> DNA
<213> 人工序列
<220>
<223> PmglB_70UTR_SD8
<400> 30
tgcgtcgcca ttctgtcgca acacgccaga atgcggcggc gatcactaac tcaacaaatc 60
aggcgatgta accgctttca atctgtgagt gatttcacag tatcttaaca atgtgatagc 120
tatgattgca ccgtgcctac aagcatcgtg gaggtccgtg actttcacgc atacaacaaa 180
cattaaccaa gagaaaaaca gct 203
<210> 31
<211> 203
<212> DNA
<213> 人工序列
<220>
<223> PmglB_70UTR_SD9
<400> 31
tgcgtcgcca ttctgtcgca acacgccaga atgcggcggc gatcactaac tcaacaaatc 60
aggcgatgta accgctttca atctgtgagt gatttcacag tatcttaaca atgtgatagc 120
tatgattgca ccgtgcctac aagcatcgtg gaggtccgtg actttcacgc atacaacaaa 180
cattaaccaa aggaaaaaca gct 203
<210> 32
<211> 34
<212> DNA
<213> 人工序列
<220>
<223> 用于质粒主链扩增的寡核苷酸(正向)
<400> 32
attaacccuc caggcatcaa ataaaacgaa aggc 34
<210> 33
<211> 24
<212> DNA
<213> 人工序列
<220>
<223> 用于galK位点中的插入的扩增的寡核苷酸(正向)
<400> 33
cccagcgaga cctgaccgca gaac 24
<210> 34
<211> 24
<212> DNA
<213> 人工序列
<220>
<223> 用于galK位点中的插入的扩增的寡核苷酸(反向)
<400> 34
ccccagtcca tcagcgtgac tacc 24
<210> 35
<211> 28
<212> DNA
<213> 人工序列
<220>
<223> 用于lacZ扩增的寡核苷酸(正向)
<400> 35
aaacagcuat gaccatgatt acggattc 28
<210> 36
<211> 40
<212> DNA
<213> 人工序列
<220>
<223> 用于lacZ扩增的寡核苷酸(反向)
<400> 36
agggttaaut gcgcgttatt tttgacacca gaccaactgg 40
<210> 37
<211> 32
<212> DNA
<213> 人工序列
<220>
<223> 用于质粒主链扩增的寡核苷酸(反向)
<400> 37
atttgcgcau caccaatcaa attcacgcgg cc 32
<210> 38
<211> 35
<212> DNA
<213> 人工序列
<220>
<223> 用于PgatY-启动子元件扩增的寡核苷酸(正向)
<400> 38
atgcgcaaau cggcaaccta tgcctgatgc gacgc 35
<210> 39
<211> 37
<212> DNA
<213> 人工序列
<220>
<223> 用于PmglB-启动子元件扩增的寡核苷酸(正向)
<400> 39
atgcgcaaau tgcgtcgcca ttctgtcgca acacgcc 37
<210> 40
<211> 45
<212> DNA
<213> 人工序列
<220>
<223> 用于PmglB_16UTR启动子元件扩增的寡核苷酸(反向)
<400> 40
agctgttucc tccttgctta tgcagggtag tgcttgagat aaatg 45
<210> 41
<211> 36
<212> DNA
<213> 人工序列
<220>
<223> 用于PmglB_70UTR_SD4启动子元件扩增的寡核苷酸(反向)
<400> 41
agctgttucc tagttggtta atgtttgttg tatgcg 36
<210> 42
<211> 36
<212> DNA
<213> 人工序列
<220>
<223> 用于PmglB_70UTR_SD5启动子元件扩增的寡核苷酸(反向)
<400> 42
agctgttuct cggttggtta atgtttgttg tatgcg 36
<210> 43
<211> 36
<212> DNA
<213> 人工序列
<220>
<223> 用于PmglB_70UTR_SD7启动子元件扩增的寡核苷酸(反向)
<400> 43
agctgttutg ctcttggtta atgtttgttg tatgcg 36
<210> 44
<211> 36
<212> DNA
<213> 人工序列
<220>
<223> 用于PmglB_70UTR_SD8启动子元件扩增的寡核苷酸(反向)
<400> 44
agctgttutt ctcttggtta atgtttgttg tatgcg 36
<210> 45
<211> 36
<212> DNA
<213> 人工序列
<220>
<223> 用于PmglB_70UTR_SD9启动子元件扩增的寡核苷酸(反向)
<400> 45
agctgttutt cctttggtta atgtttgttg tatgcg 36
<210> 46
<211> 95
<212> DNA
<213> 人工序列
<220>
<223> 用于PmglB_70UTR启动子元件扩增的寡核苷酸(反向)
<400> 46
agctgttucc tccttggtta atgtttgttg tatgcgtgaa agtcacggac ctccacgatg 60
cttgtaggca cggtgcaatc atagctatca cattg 95
<210> 47
<211> 35
<212> DNA
<213> 人工序列
<220>
<223> 用于PmglB_org启动子元件扩增的寡核苷酸(反向)
<400> 47
atggtcaugg tatctccggt ttttcttatg caggg 35
<210> 48
<211> 33
<212> DNA
<213> 人工序列
<220>
<223> 用于PgatY_org启动子元件扩增的寡核苷酸(反向)
<400> 48
atggtcautt tcatatcctg tcgtttgttt tcg 33
<210> 49
<211> 103
<212> DNA
<213> 人工序列
<220>
<223> 用于PmglB_54UTR启动子元件扩增的寡核苷酸(反向)
<400> 49
atggtcaugg tatctccggt ttttgttaat gtttgttgta tgcgtgaaag tcacggacct 60
ccacgatgct tgtaggcacg gtgcaatcat agctatcaca ttg 103
<210> 50
<211> 100
<212> DNA
<213> 人工序列
<220>
<223> 用于PgatY_54UTR启动子元件扩增的寡核苷酸(反向)
<400> 50
atggtcautt tcatatcctg tcgtgttaat gtttgttgta tgcgtgaaag tcacggacct 60
ccacgatgct tgtaggcaca aaatataatg aaattatttg 100
<210> 51
<211> 22
<212> DNA
<213> 人工序列
<220>
<223> CRP__gatY
<400> 51
ttttgtgatc gttatctcga ta 22
<210> 52
<211> 22
<212> DNA
<213> 人工序列
<220>
<223> CRP__mglB
<400> 52
atctgtgagt gatttcacag ta 22

Claims (28)

1.一种分离的核酸序列,其鉴定为SEQ ID NO:1、或其变体,其中所述变体与SEQ IDNO:1具有至少80%的序列同一性。
2.一种核酸构建体,其包含可操作地连接至连续合成DNA序列(i)的启动子DNA序列,
其中
a)所述DNA序列(i)具有至少23个核碱基的长度并且包含SEQ ID NO:1、或其变体;其中所述变体与SEQ ID NO:1具有至少80%的序列同一性;并且
b)所述启动子是分离的DNA序列,其包含环AMP受体蛋白(CRP)的单个结合位点,所述单个结合位点以约-41位置为中心。
3.根据权利要求2所述的核酸构建体,其中所述CRP结合位点包含SEQ ID NO:51或SEQID NO:52、或其变体。
4.根据权利要求2或3所述的核酸构建体,其中所述启动子DNA序列由SEQ ID NO:21或SEQ ID NO:22、或其变体或片段组成,或包含SEQ ID NO:21或SEQ ID NO:22、或其变体或片段。
5.根据权利要求2至4中任一项所述的核酸构建体,其中所述构建体还包含DNA序列(ii),其中所述DNA序列(ii)可操作地连接至所述DNA序列(i)。
6.根据权利要求5所述的核酸构建体,其中所述DNA序列(ii)包含非编码DNA序列。
7.根据权利要求6所述的核酸构建体,其中所述非编码DNA序列包含核糖体结合位点。
8.根据权利要求7所述的核酸构建体,其中所述非编码DNA序列包含选自SEQ ID NO:3至SEQ ID NO:20中任一个的序列。
9.根据权利要求7或8所述的核酸构建体,其中所述构建体还包含与所述DNA序列(ii)可操作地连接的编码DNA序列。
10.根据权利要求9所述的核酸构建体,其中所述编码DNA序列编码多肽。
11.根据权利要求10所述的核酸构建体,其中所述多肽是酶、转运蛋白、抗原或调节蛋白。
12.根据权利要求5的核酸构建体,其中所述DNA序列(ii)包含编码DNA序列。
13.根据权利要求12所述的核酸构建体,其中所述编码DNA序列编码小的非编码RNA分子,如调节性microRNA(miRNA)或小干扰RNA(siRNA)分子。
14.一种核酸构建体,其包含连续合成核酸,所述连续合成核酸包含两个DNA序列(i)和(ii),其中所述DNA序列(i)可操作地连接至所述DNA序列(ii),并且其中
(a)所述DNA序列(i)具有至少23个核碱基的长度并包含SEQ ID NO:1、或其变体,其中所述变体与SEQ ID NO:1具有至少80%的序列同一性;并且
(b)所述DNA序列(ii)不包含SEQ ID NO:3至SEQ ID NO:18中任一个的序列。
15.根据权利要求14所述的核酸构建体,其中所述构建体还包含与所述DNA序列(i)可操作地连接的启动子。
16.根据权利要求15所述的核酸构建体,其中所述启动子是分离的DNA序列,其包含环AMP受体蛋白(CRP)的单个结合位点,所述单个结合位点以约-41位置为中心。
17.根据权利要求16所述的核酸构建体,其中所述CRP结合位点包含SEQ ID NO:51或SEQ ID NO:52、或其变体。
18.根据权利要求16或17所述的核酸构建体,其中所述启动子DNA序列包含SEQ ID NO:21或SEQ ID NO:22、或其变体或片段。
19.根据权利要求15至18中任一项所述的核酸构建体,其中所述核酸构建体还包含与所述DNA序列(ii)可操作地连接的编码DNA序列,其中所述编码DNA是小的非编码RNA分子,如调节性microRNA(miRNA)或小干扰RNA(siRNA)分子。
20.根据权利要求15至18中任一项所述的核酸构建体,其中所述构建体包含与所述DNA序列(ii)可操作地连接的编码DNA序列,其中所述编码DNA编码功能性多肽,如酶、转运蛋白、抗原或调节蛋白,并且其中所述DNA序列(ii)包含核糖体结合位点。
21.根据权利要求20所述的核酸构建体,其中所述核糖体结合位点包含SEQ ID NO:19或SEQ ID NO:20、或其变体。
22.一种载体,其包含权利要求1所述的核酸序列或权利要求2至21中任一项所述的核酸构建体。
23.一种表达盒,其包含权利要求1所述的核酸序列或权利要求2至21中任一项所述的构建体。
24.一种重组细胞,其包含权利要求23所述的载体和/或权利要求23所述的表达盒。
25.根据权利要求24所述的重组细胞,其中所述细胞是细菌细胞。
26.一种表达系统,其包含权利要求1所述的核酸序列和/或权利要求2至21中任一项所述的构建体和/或权利要求22所述的载体和/或权利要求24或25所述的重组细胞。
27.一种重组产生一种或多种生物分子的方法,其包括
(a)提供权利要求1所述的核酸或权利要求2至21中任一项所述的构建体或权利要求22所述的载体或权利要求23所述的表达盒;
(b)提供权利要求24或25所述的重组细胞或权利要求26所述的表达系统;
(c)在(b)的细胞或表达系统中产生生物分子。
28.根据权利要求27所述的方法,其中所述生物分子是
-蛋白质,如酶、转运蛋白、调节蛋白或结构蛋白,或
-小的非编码RNA分子,如调节性microRNA(miRNA)或小干扰RNA(siRNA)分子,或
-寡糖,如人乳寡糖。
CN202080044707.6A 2019-06-21 2020-06-19 用于体外和体内基因表达的包含5’utr茎环的核酸构建体 Pending CN114008202A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
DKPA201900756 2019-06-21
DKPA201900756 2019-06-21
PCT/IB2020/055773 WO2020255054A1 (en) 2019-06-21 2020-06-19 Nucleic acid construct comprising 5' utr stem-loop for in vitro and in vivo gene expression

Publications (1)

Publication Number Publication Date
CN114008202A true CN114008202A (zh) 2022-02-01

Family

ID=74037419

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202080044707.6A Pending CN114008202A (zh) 2019-06-21 2020-06-19 用于体外和体内基因表达的包含5’utr茎环的核酸构建体

Country Status (4)

Country Link
US (1) US20220267782A1 (zh)
EP (1) EP3987031A4 (zh)
CN (1) CN114008202A (zh)
WO (1) WO2020255054A1 (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114645049A (zh) * 2022-04-29 2022-06-21 湖北大学 一种基于核心区二级结构改造提高启动子活性的方法和应用

Families Citing this family (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DK180952B1 (en) 2020-12-22 2022-08-10 Glycom As A dfl-producing strain
DK181497B1 (en) 2021-05-17 2024-03-12 Dsm Ip Assets Bv ENHANCING FORMATION OF THE HMOS LNT AND/OR LNnT BY MODIFYING LACTOSE IMPORT IN THE CELL
CN117321210A (zh) 2021-05-17 2023-12-29 帝斯曼知识产权资产管理有限公司 产生以lnfp-i和lnt作为主要化合物的hmo共混物的方法
EP4341277A1 (en) 2021-05-17 2024-03-27 DSM IP Assets B.V. Microbial strain expressing an invertase/sucrose hydrolase
DK181242B1 (en) 2021-05-17 2023-05-30 Dsm Ip Assets Bv GENETICALLY ENGINEERED CELLS COMPRISING A RECOMBINANT NUCLEIC ACID SEQUNCE ENCODING AN α-1,2-FUCOSYLTRANSFERASE CAPABLE OF PRODUCING LNFP-I, NUCLEIC ACID SEQUENCES ENCODING SAME AND METHODS FOR USE OF SAME
WO2022243314A2 (en) 2021-05-17 2022-11-24 Dsm Ip Assets B.V. Methods of producing hmo blend profiles with lnfp-i and 2'-fl as the predominant compounds
DK202170552A1 (en) 2021-11-11 2023-09-01 Dsm Ip Assets Bv Combined fermentation process for producing one or more human milk oligosaccharide(s) (hmo(s))
WO2023099680A1 (en) 2021-12-01 2023-06-08 Dsm Ip Assets B.V. Cells with tri-, tetra- or pentasaccharide importers useful in oligosaccharide production
WO2023166035A2 (en) 2022-03-02 2023-09-07 Dsm Ip Assets B.V. New sialyltransferases for in vivo synthesis of 3'sl and 6'sl
DK202270078A1 (en) 2022-03-02 2023-12-04 Dsm Ip Assets Bv New sialyltransferases for in vivo synthesis of lst-a
DK181319B1 (en) 2022-03-02 2023-08-10 Dsm Ip Assets Bv Genetically engineered cells and methods comprising use of a sialyltransferase for in vivo synthesis of 3’sl
WO2023209098A1 (en) 2022-04-29 2023-11-02 Dsm Ip Assets B.V. Hmo producing microorganism with increased robustness towards glucose gradients
DK202200561A1 (en) 2022-06-13 2024-02-14 Dsm Ip Assets Bv Sigma factor modifications for biosynthetic production
DK202200591A1 (en) 2022-06-20 2024-02-15 Dsm Ip Assets Bv New sialyltransferases for in vivo synthesis of lst-c
DK202200689A1 (en) 2022-07-15 2024-02-27 Dsm Ip Assets Bv New fucosyltransferases for in vivo synthesis of lnfp-iii
DK202200688A1 (en) 2022-07-15 2024-02-16 Dsm Ip Assets Bv New fucosyltransferase for in vivo synthesis of complex fucosylated human milk oligosaccharides
WO2024013348A1 (en) 2022-07-15 2024-01-18 Dsm Ip Assets B.V. New fucosyltransferases for in vivo synthesis of complex fucosylated human milk oligosaccharides
WO2024133701A1 (en) 2022-12-22 2024-06-27 Dsm Ip Assets B.V. New fucosyltransferases for in vivo synthesis of complex fucosylated human milk oligosaccharides mixtures comprising lndfh-iii
WO2024133702A2 (en) 2022-12-22 2024-06-27 Dsm Ip Assets B.V. New fucosyltransferases for production of 3fl

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2018226880A1 (en) * 2017-06-06 2018-12-13 Zymergen Inc. A htp genomic engineering platform for improving escherichia coli
WO2019123324A1 (en) * 2017-12-21 2019-06-27 Glycom A/S Nucleic acid construct for in vitro and in vivo gene expression

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2007013695A1 (ja) * 2005-07-29 2007-02-01 Nippon Shokubai Co., Ltd. 細菌にグリセリン資化能を付与する方法
JP2022517903A (ja) * 2018-12-04 2022-03-11 グリコム・アクティーゼルスカブ フコシル化オリゴ糖の合成

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2018226880A1 (en) * 2017-06-06 2018-12-13 Zymergen Inc. A htp genomic engineering platform for improving escherichia coli
WO2019123324A1 (en) * 2017-12-21 2019-06-27 Glycom A/S Nucleic acid construct for in vitro and in vivo gene expression

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
D.L. WEISSENBORN ET AL.: "Structure and regulation of the glpFK operon encoding glycerol diffusion facilitator and glycerol kinase of Escherichia coli K-12.", JOURNAL OF BIOLOGICAL CHEMISTRY, vol. 267, no. 9, 25 March 1992 (1992-03-25), pages 6122 - 6131, XP003003126 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114645049A (zh) * 2022-04-29 2022-06-21 湖北大学 一种基于核心区二级结构改造提高启动子活性的方法和应用
CN114645049B (zh) * 2022-04-29 2024-01-23 湖北大学 一种基于核心区二级结构改造提高启动子活性的方法和应用

Also Published As

Publication number Publication date
EP3987031A4 (en) 2023-06-07
WO2020255054A1 (en) 2020-12-24
EP3987031A1 (en) 2022-04-27
US20220267782A1 (en) 2022-08-25

Similar Documents

Publication Publication Date Title
US20220267782A1 (en) Nucleic acid construct comprising 5&#39; utr stem-loop for in vitro and in vivo gene expression
US11608504B2 (en) Nucleic acid construct for in vitro and in vivo gene expression
US20230227876A1 (en) Hmo production
US8178338B2 (en) Inducible expression vectors and methods of use thereof
US20230109661A1 (en) Hmo production
WO2021148611A1 (en) Hmo production
AU2021209394A1 (en) HMO production
US20230287439A1 (en) Pathway integration and expression in host cells
US20240043891A1 (en) A dfl-producing strain
US20230109937A1 (en) New major facilitator superfamily (mfs) protein (fred) in hmo production
US20240026280A1 (en) Plasmid addiction systems
EA044676B1 (ru) Конструкция нуклеиновой кислоты для экспрессии генов in vitro и in vivo
EA046241B1 (ru) Получение огм
US20110269184A1 (en) Method for controlling plasmid copy number in e.coli
EA046260B1 (ru) Получение огм
CN116802302A (zh) 唾液酸化hmo生产中的新主要易化子超家族(mfs)蛋白(fred)
EA046005B1 (ru) НОВЫЙ БЕЛОК СУПЕРСЕМЕЙСТВА ОСНОВНЫХ ПЕРЕНОСЧИКОВ (MFS) (Fred) В ПРОИЗВОДСТВЕ ОГМ
MXPA99004331A (es) Vectores de expresion mejorados

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination