CN108138188A - 用于体外和体内表达的多核苷酸构建体 - Google Patents

用于体外和体内表达的多核苷酸构建体 Download PDF

Info

Publication number
CN108138188A
CN108138188A CN201680055929.1A CN201680055929A CN108138188A CN 108138188 A CN108138188 A CN 108138188A CN 201680055929 A CN201680055929 A CN 201680055929A CN 108138188 A CN108138188 A CN 108138188A
Authority
CN
China
Prior art keywords
host cell
cell
polynucleotides
aspergillus
signal peptide
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201680055929.1A
Other languages
English (en)
Inventor
C·埃姆里克
J·维恩
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Novo Nordisk AS
Original Assignee
Novo Nordisk AS
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Novo Nordisk AS filed Critical Novo Nordisk AS
Publication of CN108138188A publication Critical patent/CN108138188A/zh
Pending legal-status Critical Current

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/52Genes encoding for enzymes or proenzymes
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/74Vectors or expression systems specially adapted for prokaryotic hosts other than E. coli, e.g. Lactobacillus, Micromonospora
    • C12N15/75Vectors or expression systems specially adapted for prokaryotic hosts other than E. coli, e.g. Lactobacillus, Micromonospora for Bacillus
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/80Vectors or expression systems specially adapted for eukaryotic hosts for fungi
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/0004Oxidoreductases (1.)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/10Transferases (2.)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/24Hydrolases (3) acting on glycosyl compounds (3.2)
    • C12N9/2402Hydrolases (3) acting on glycosyl compounds (3.2) hydrolysing O- and S- glycosyl compounds (3.2.1)
    • C12N9/2405Glucanases
    • C12N9/2408Glucanases acting on alpha -1,4-glucosidic bonds
    • C12N9/2411Amylases
    • C12N9/2428Glucan 1,4-alpha-glucosidase (3.2.1.3), i.e. glucoamylase
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/24Hydrolases (3) acting on glycosyl compounds (3.2)
    • C12N9/2402Hydrolases (3) acting on glycosyl compounds (3.2) hydrolysing O- and S- glycosyl compounds (3.2.1)
    • C12N9/2405Glucanases
    • C12N9/2408Glucanases acting on alpha -1,4-glucosidic bonds
    • C12N9/2431Beta-fructofuranosidase (3.2.1.26), i.e. invertase
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/24Hydrolases (3) acting on glycosyl compounds (3.2)
    • C12N9/2402Hydrolases (3) acting on glycosyl compounds (3.2) hydrolysing O- and S- glycosyl compounds (3.2.1)
    • C12N9/2405Glucanases
    • C12N9/2434Glucanases acting on beta-1,4-glucosidic bonds
    • C12N9/2437Cellulases (3.2.1.4; 3.2.1.74; 3.2.1.91; 3.2.1.150)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/24Hydrolases (3) acting on glycosyl compounds (3.2)
    • C12N9/2402Hydrolases (3) acting on glycosyl compounds (3.2) hydrolysing O- and S- glycosyl compounds (3.2.1)
    • C12N9/2465Hydrolases (3) acting on glycosyl compounds (3.2) hydrolysing O- and S- glycosyl compounds (3.2.1) acting on alpha-galactose-glycoside bonds, e.g. alpha-galactosidase (3.2.1.22)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/24Hydrolases (3) acting on glycosyl compounds (3.2)
    • C12N9/2402Hydrolases (3) acting on glycosyl compounds (3.2) hydrolysing O- and S- glycosyl compounds (3.2.1)
    • C12N9/2468Hydrolases (3) acting on glycosyl compounds (3.2) hydrolysing O- and S- glycosyl compounds (3.2.1) acting on beta-galactose-glycoside bonds, e.g. carrageenases (3.2.1.83; 3.2.1.157); beta-agarase (3.2.1.81)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/48Hydrolases (3) acting on peptide bonds (3.4)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/88Lyases (4.)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/90Isomerases (5.)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/93Ligases (6)

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Engineering & Computer Science (AREA)
  • Organic Chemistry (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Wood Science & Technology (AREA)
  • Zoology (AREA)
  • Biomedical Technology (AREA)
  • Biotechnology (AREA)
  • General Engineering & Computer Science (AREA)
  • Molecular Biology (AREA)
  • Microbiology (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Medicinal Chemistry (AREA)
  • Physics & Mathematics (AREA)
  • Biophysics (AREA)
  • Plant Pathology (AREA)
  • Mycology (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)

Abstract

本发明涉及用于感兴趣的基因或感兴趣的基因的变体的体外和体内转录/翻译的多核苷酸构建体,连同包含此类构建体的微生物宿主细胞,以及用于在此类微生物宿主细胞中产生感兴趣的多肽的方法。

Description

用于体外和体内表达的多核苷酸构建体
序列表的引用
本申请包含一个处于计算机可读形式的序列表,将其通过引用结合在此。
技术领域
本发明涉及用于感兴趣的基因或感兴趣的基因的变体的体外和体内转录/翻译的多核苷酸构建体,连同包含此类构建体的微生物宿主细胞,以及用于在此类微生物宿主细胞中产生感兴趣的多肽的方法。本发明的构建体允许编码的所希望的一种或多种蛋白质的体外转录/翻译(IVTT)产生,连同将这些构建体直接转化到真菌宿主细胞中用于体内产生一种或多种分泌蛋白。
驱动体外转录的启动子正好位于编码感兴趣的成熟蛋白的基因上游的内含子中。内含子的上游是编码在体内从真菌启动子表达的分泌信号肽的多核苷酸。
背景技术
在具有分泌机制的微生物中成功体内生产感兴趣的分泌多肽通常取决于与多肽处于翻译融合的信号肽的表达。
但是,在一些情况下,优选体外表达感兴趣的多肽。这典型地是用无细胞的细胞提取物完成的,所述无细胞的细胞提取物包含DNA转录和翻译的所有先决条件。显然,在体外转录翻译(IVTT)系统中产生的感兴趣的多肽不需要信号肽,因为它将直接在无细胞培养基中产生。因此,如果正常地在体内产生了多肽的原或前-原形式,则将仅需要在IVTT系统中表达成熟多肽编码多核苷酸以产生成熟多肽。
如果信号肽被包括在体外表达构建体中,它将可能不会像在体内分泌过程中那样被切割掉,并且与成熟多肽相比,信号肽的存在会改变多肽的特征。因此,信号肽的存在对筛选体外表达的多肽也可能具有不希望的影响。
这当然意味着似乎需要单独的多核苷酸构建体来提供体内抑或体外的转录和翻译以产生感兴趣的多肽。
本发明基于以下事实:许多微生物(包括细菌和真菌宿主细胞)能够加工所谓的内含子。内含子是在最终信使RNA产物成熟期间通过RNA剪接去除的基因内的任何核苷酸序列。当蛋白质由包含内含子的基因编码时,RNA剪接作为在转录之后和翻译之前的RNA加工途径的一部分发生。
发明内容
本发明人成功地将一种人工内含子引入包含与编码信号肽的多核苷酸可操作连接的真菌启动子的多核苷酸构建体,所述信号肽与成熟脂肪酶处于翻译融合。
将人工内含子引入信号肽编码序列和成熟脂肪酶编码序列之间的多核苷酸构建体,这样使得其在真菌宿主细胞中的mRNA成熟过程中从转录的RNA中切除以产生编码信号肽的mRNA,所述信号肽与成熟脂肪酶处于正确的翻译融合。
当所得到的包含内含子的多核苷酸构建体转化到真菌宿主中时,产生并且分泌成熟脂肪酶。该结果表明,真菌宿主细胞已经转录了完整的RNA序列,然后在mRNA成熟过程中从RNA中去除内含子,并且将mRNA翻译成与脂肪酶处于正确融合的编码信号肽,而反过来所述脂肪酶又为细胞所分泌。
在将其整合到构建体中之前,将人工内含子工程化以包含已知在体外转录翻译(IVTT)系统中有活性的启动子,这样使得一旦内含子已经被引入到构建体,所述启动子将与成熟脂肪酶编码序列可操作地连接。
当所得到的包含内含子的多核苷酸构建体与IVTT系统混合时,直接在体外产生活性成熟脂肪酶。
通过这种方式,本发明人令人惊讶地提供了概念证据,即可以巧妙地将单个多核苷酸构建体放在一起以允许产生活性多肽,而不管它是直接在IVTT系统中产生还是由微生物宿主细胞体内分泌。
因此,在第一个方面,本发明涉及分离的多核苷酸构建体,其以5'至3'的顺序包含以下元件:
(a)在能够加工内含子的微生物宿主细胞中具有启动子活性的第一多核苷酸,其中该第一多核苷酸与信号肽编码多核苷酸可操作地连接;
(b)包含在体外转录/翻译(IVTT)系统中具有启动子活性的第二多核苷酸的内含子;和
(c)编码与(a)和(b)的第一和第二多核苷酸可操作地连接的感兴趣的多肽的第三多核苷酸;
由此第一多核苷酸确保与感兴趣的多肽处于翻译融合的信号肽在微生物宿主细胞中的表达;和
由此第二多核苷酸确保在IVTT系统中没有信号肽的感兴趣的多肽的表达。
在第二个方面,本发明涉及包含如第一方面所定义的多核苷酸构建体的微生物宿主细胞。
在最后一个方面,本发明涉及用于产生感兴趣的多肽的方法,所述方法包括以下步骤:
a)培养如前述方面中所定义的微生物宿主细胞;并且,可任选地
b)回收该感兴趣的多肽。
附图说明
图1示出载体pDAu703的示意图。
图2示出以下项的示意图:
-顶端部分:在米曲霉宿主菌株DAu716中的染色体的amy2区域,其中两个FRT-位点已被插入;
-中间部分:线性化的载体pDAu724;以及
-底部部分:通过各自的FRT-位点之间的双同源重组的pDAu724的FLP介导的整合后,米曲霉宿主菌株DAu716中的染色体的amy2区域。
图3示出了用T7噬菌体启动子作为体外转录翻译系统的启动子描绘的本发明的多核苷酸构建体的示意概述图。
定义
编码序列:术语“编码序列”意指直接指定多肽的氨基酸序列的多核苷酸。编码序列的边界一般由开放阅读框决定,该开放阅读框架从起始密码子(如ATG、GTG或TTG)开始并且以终止密码子(如TAA、TAG或TGA)结束。编码序列可为基因组DNA、cDNA、合成DNA或其组合。
控制序列:术语“控制序列”意指对于表达编码本发明的成熟多肽的多核苷酸所必需的核酸序列。每个控制序列对于编码该多肽的多核苷酸来说可以是天然的(即来自相同基因)或外源的(即来自不同基因),或相对于彼此是天然的或外源的。此类控制序列包括但不限于前导序列、聚腺苷酸化序列、前肽序列、启动子、信号肽序列和转录终止子。最少,控制序列包括启动子、以及转录和翻译终止信号。出于引入有利于将这些控制序列与编码多肽的多核苷酸的编码区连接的特异性限制性酶切位点的目的,这些控制序列可以提供有多个接头。
表达:术语“表达”包括涉及生产多肽的任何步骤,包括但不限于,转录、转录后修饰、翻译、翻译后修饰、和分泌。
表达载体:术语“表达载体”意指线状或环状DNA分子,该分子包含编码多肽的多核苷酸并且该多核苷酸可操作地连接于供用于其表达的控制序列。
宿主细胞:术语“宿主细胞”意指易于用包含本发明的多核苷酸的核酸构建体或表达载体转化、转染、转导等的任何细胞类型。术语“宿主细胞”涵盖亲本细胞的任何后代,其由于复制期间发生的突变而与亲本细胞不同。
分离的:术语“分离的”意指处于自然界中不存在的形式或环境中的物质。分离的物质的非限制性实例包括(1)任何非天然存在的物质;(2)包括但不限于任何酶、变体、核酸、蛋白质、肽或辅因子的任何物质,该物质至少部分地从与其本质相关的一种或多种或所有天然存在的成分中去除;(3)相对于在自然界中发现的物质通过人工修饰的任何物质;或(4)通过相对于与其天然相关的其他组分增加物质的量而修饰的任何物质(例如,宿主细胞中的重组产生;编码该物质的基因的多个拷贝;以及使用比与编码该物质的基因天然相关的启动子更强的启动子)。
成熟多肽:术语“成熟多肽”意指在翻译和任何翻译后修饰如N-末端加工、C-末端截短、糖基化作用、磷酸化作用等之后处于其最终形式的多肽。
核酸构建体:术语“核酸构建体”意指单链-或双链的核酸分子,该核酸分子是从天然存在的基因中分离的,或以本来不存在于自然界中的方式被修饰成包含核酸的区段,或是合成的,该核酸分子包含一个或多个控制序列。
可操作地连接:术语“可操作地连接”意指将控制序列相对于多核苷酸的编码序列安置在适当位置这样使得该控制序列指导该编码序列的表达的构型。
序列一致性:两个氨基酸序列之间或两个核苷酸序列之间的相关性由参数“序列一致性”描述。出于本发明的目的,使用如在EMBOSS包(EMBOSS:欧洲分子生物学开放软件套件,Rice等人,2000,Trends Genet.[遗传学趋势]16:276-277)(优选5.0.0版或更新版本)的Needle程序中所实施的Needleman-Wunsch算法(Needleman和Wunsch,1970,J.Mol.Biol.[分子生物学杂志]48:443-453)来确定两个氨基酸序列之间的序列一致性。使用的参数是缺口开放罚分10、缺口扩展罚分0.5以及EBLOSUM62(BLOSUM62的EMBOSS版本)取代矩阵。将标记为“最长一致性”的Needle的输出(使用–nobrief选项获得)用作百分比一致性并且计算如下:
(一致的残基x 100)/(比对长度-比对中的空位总数)
出于本发明的目的,使用如在EMBOSS包(EMBOSS:欧洲分子生物学开放软件套件,Rice等人,2000,同上)(优选5.0.0版或更新版本)的Needle程序中所实施的Needleman-Wunsch算法(Needleman和Wunsch,1970,同上)来确定两个脱氧核糖核苷酸序列之间的序列一致性。所使用的参数是空位开放罚分10,空位延伸罚分0.5和EDNAFULL(NCBI NUC4.4的EMBOSS版本)取代矩阵。将标记为“最长一致性”的Needle的输出(使用–nobrief选项获得)用作百分比一致性并且计算如下:
(一致的脱氧核糖核苷酸x 100)/(比对长度-比对中的空位总数)
发明详细说明
多核苷酸构建体
在第一个方面,本发明涉及分离的多核苷酸构建体,其以5’至3’的顺序包含以下元件:
(a)在能够加工内含子的微生物宿主细胞中具有启动子活性的第一多核苷酸,其中该第一多核苷酸与信号肽编码多核苷酸可操作地连接;
(b)包含在体外转录/翻译(IVTT)系统中具有启动子活性的第二多核苷酸的内含子;和
(c)编码与(a)和(b)的第一和第二多核苷酸可操作地连接的感兴趣的多肽的第三多核苷酸;
由此第一多核苷酸确保与感兴趣的多肽处于翻译融合的信号肽在微生物宿主细胞中的表达;以及
由此第二多核苷酸确保在IVTT系统中没有信号肽的感兴趣的多肽的表达。
可用许多方式操作所述多核苷酸以提供多肽的表达。取决于表达载体,在多核苷酸插入载体之前对其进行操作可为合意的或必需的。用于利用重组DNA方法修饰多核苷酸的技术是本领域已知的。
该控制序列可为启动子,即,被宿主细胞识别用于表达编码本发明多肽的多核苷酸的多核苷酸。该启动子包含转录控制序列,其介导该多肽的表达。该启动子可以是在宿主细胞中显示出转录活性的任何多核苷酸,包括突变型、截短型及杂合型启动子,并且可以是由编码与该宿主细胞同源或异源的细胞外或细胞内多肽的基因获得。
用于在细菌宿主细胞中指导本发明核酸构建体的转录的适合启动子的实例是从以下基因中获得的启动子:解淀粉芽孢杆菌α-淀粉酶基因(amyQ)、地衣芽孢杆菌α-淀粉酶基因(amyL)、地衣芽孢杆菌青霉素酶基因(penP)、嗜热脂肪芽孢杆菌产麦芽糖淀粉酶基因(amyM)、枯草芽孢杆菌果聚糖蔗糖酶基因(sacB)、枯草芽孢杆菌xylA和xylB基因、苏云金芽孢杆菌cryIIIA基因(Agaisse和Lereclus,1994,Molecular Microbiology[分子微生物学]13:97-107)、大肠杆菌lac操纵子、大肠杆菌trc启动子(Egon等人,1988,Gene[基因]69:301-315)、天蓝链霉菌琼脂水解酶基因(dagA)和原核β-内酰胺酶基因(Villa-Kamaroff等人,1978,Proc.Natl.Acad.Sci.USA[美国国家科学院院刊]75:3727-3731)以及tac启动子(DeBoer等人,1983,Proc.Natl.Acad.Sci.USA[美国国家科学院院刊]80:21-25)。其他启动子描述于Gilbert等,1980,Scientific American 242:74-94的“来自重组细菌的有用蛋白质(Useful proteins from recombinant bacteria)”中;和Sambrook等,1989,见上文中。串联启动子的实例披露于WO 99/43835中。
在丝状真菌宿主细胞中,用于指导本发明的核酸构建体的转录的适合启动子的实例是获得自以下酶的基因的启动子:构巢曲霉(Aspergillus nidulans)乙酰胺酶、黑曲霉(Aspergillus niger)中性α-淀粉酶、黑曲霉酸稳定性α-淀粉酶、黑曲霉或泡盛曲霉(Aspergillus awamori)葡萄糖淀粉酶(glaA)、米曲霉(Aspergillus oryzae)TAKA淀粉酶、米曲霉碱性蛋白酶、米曲霉丙糖磷酸异构酶、尖镰孢(Fusarium oxysporum)胰蛋白酶-样蛋白酶(WO 96/00787)、镶片镰孢(Fusarium venenatum)淀粉葡糖苷酶(WO 00/56900)、镶片镰孢Daria(WO 00/56900)、镶片镰孢菌Quinn(WO 00/56900)、米黑)(Rhizomucor miehei)脂肪酶、米黑根毛霉天冬氨酸蛋白酶、里氏木霉(Trichoderma reesei)β-葡糖苷酶、里氏木霉纤维二糖水解酶I、里氏木霉纤维二糖水解酶II、里氏木霉内切葡聚糖酶I、里氏木霉内切葡聚糖酶II、里氏木霉内切葡聚糖酶III、里氏木霉内切葡聚糖酶V、里氏木霉木聚糖酶I、里氏木霉木聚糖酶II、里氏木霉木聚糖酶III、里氏木霉β-木糖苷酶,以及里氏木霉翻译延长因子,以及NA2-tpi启动子(来自曲霉属中性α-淀粉酶基因的经修饰的启动子,其中未翻译的前导序列已经用来自曲霉属丙糖磷酸异构酶基因的未翻译的前导序列替换;非限制性实例包括来自黑曲霉中性α-淀粉酶的基因的经修饰的启动子,其中未翻译的前导序列已经用来自构巢曲霉或米曲霉丙糖磷酸异构酶基因的未翻译的前导序列替换);及其突变型、截短型及杂合型启动子。其他启动子在美国专利号6,011,147中描述。
在酵母宿主中,从以下酶的基因获得有用的启动子:酿酒酵母(Saccharomycescerevisiae)烯醇化酶(ENO-1)、酿酒酵母半乳糖激酶(GAL1)、酿酒酵母乙醇脱氢酶/甘油醛-3-磷酸脱氢酶(ADH1,ADH2/GAP)、酿酒酵母磷酸丙糖异构酶(TPI)、酿酒酵母金属硫蛋白(CUP1)、和酿酒酵母3-磷酸甘油酸激酶。Romanos等人,1992,Yeast[酵母]8:423-488描述了酵母宿主细胞的其他有用的启动子。
控制序列也可为由宿主细胞识别以终止转录的转录终止子。终止子与编码该多肽的多核苷酸的3’-末端可操作地连接。在宿主细胞中有功能的任何终止子可用于本发明中。
细菌宿主细胞的优选终止子从以下酶的基因获得:克劳氏芽孢杆菌(Bacillusclausii)碱性蛋白酶(aprH)、地衣芽孢杆菌α-淀粉酶(amyL)、和大肠杆菌核糖体RNA(rrnB)。
用于丝状真菌宿主细胞的优选终止子从以下酶的基因获得:构巢曲霉乙酰胺酶、构巢曲霉邻氨基苯甲酸合酶、黑曲霉葡糖淀粉酶、黑曲霉α-葡糖苷酶、米曲霉TAKA淀粉酶、尖镰孢胰蛋白酶-样蛋白酶、里氏木霉β-葡糖苷酶、里氏木霉纤维二糖水解酶I、里氏木霉纤维二糖水解酶II、里氏木霉内切葡聚糖酶I、里氏木霉内切葡聚糖酶II、里氏木霉内切葡聚糖酶III、里氏木霉内切葡聚糖酶V、里氏木霉木聚糖酶I、里氏木霉木聚糖酶II、里氏木霉木聚糖酶III、里氏木霉β-木糖苷酶以及里氏木霉翻译延长因子。
用于酵母宿主细胞的优选终止子从以下酶的基因获得:酿酒酵母烯醇化酶、酿酒酵母细胞色素C(CYC1)、以及酿酒酵母甘油醛-3-磷酸脱氢酶。酵母宿主细胞的其他有用终止子在Romanos等,1992,见上文中描述。
控制序列还可为启动子下游和基因的编码序列上游的mRNA稳定子区,其增加该基因的表达。
适合的mRNA稳定子区的实例是从以下获得的:苏云金芽孢杆菌cryIIIA基因(WO94/25612)和枯草芽孢杆菌SP82基因(Hue等,1995,Journal of Bacteriology177:3465-3471)。
该控制序列还可为前导序列,对宿主细胞翻译重要的mRNA的非翻译区。该前导序列可操作地连接到编码该多肽的多核苷酸的5’末端。可以使用在宿主细胞中有功能的任何前导序列。
用于丝状真菌宿主细胞的优选前导序列是从米曲霉TAKA淀粉酶和构巢曲霉丙糖磷酸异构酶的基因获得的。
对于酵母宿主细胞适合的前导序列从以下酶的基因获得:酿酒酵母烯醇化酶(ENO-1)、酿酒酵母3-磷酸甘油酸激酶、酿酒酵母α因子、和酿酒酵母醇脱氢酶/甘油醛-3-磷酸脱氢酶(ADH2/GAP)。
控制序列也可以是多聚腺苷化序列,一种与多核苷酸3’-末端可操作地连接并在转录时由宿主细胞识别为向转录的mRNA添加聚腺苷酸残基的信号序列。可以使用在宿主细胞中起作用的任何聚腺苷酸化序列。
用于丝状真菌宿主细胞的优选聚腺苷酸化序列是从以下酶的基因获得的:构巢曲霉邻氨基苯甲酸合酶、黑曲霉葡糖淀粉酶、黑曲霉α-葡糖苷酶、米曲霉TAKA淀粉酶和尖镰孢胰蛋白酶-样蛋白酶。
对于酵母宿主细胞有用的聚腺苷酸化序列在Guo和Sherman,1995,Mol.CellularBiol.[分子细胞生物学]15:5983-5990中得以描述。
控制序列也可为编码与多肽的N-末端连接的信号肽并指导多肽进入细胞的分泌途径的信号肽编码区。多核苷酸的编码序列的5’-端可固有地包含在翻译阅读框中与编码多肽的编码序列的区段天然地连接的信号肽编码序列。可替代地,编码序列的5’-末端可包含对于编码序列为外源的信号肽编码序列。在编码序列不天然地包含信号肽编码序列的情况下,可需要外来的信号肽编码序列。可替代地,外源信号肽编码序列可以单纯地替代天然信号肽编码序列以便增强多肽的分泌。然而,可以使用指导已表达多肽进入宿主细胞的分泌途径的任何信号肽编码序列。
用于细菌宿主细胞的有效信号肽编码序列是从芽孢杆菌NCIB 11837生麦芽糖淀粉酶、地衣芽孢杆菌枯草杆菌蛋白酶、地衣芽孢杆菌β-内酰胺酶、嗜热脂肪芽孢杆菌α-淀粉酶、嗜热脂肪芽孢杆菌中性蛋白酶(nprT、nprS、nprM)和枯草芽孢杆菌prsA的基因获得的信号肽编码序列。另外的信号肽由Simonen和Palva,1993,Microbiological Reviews[微生物评论]57:109-137描述。
用于丝状真菌宿主细胞的有效的信号肽编码序列是从以下酶的基因获得的信号肽编码序列:黑曲霉中性淀粉酶、黑曲霉葡糖淀粉酶、米曲霉TAKA淀粉酶、特异腐质霉(Humicola insolens)纤维素酶、特异腐质霉内切葡聚糖酶V、疏棉状腐质霉(Humicolalanuginosa)脂肪酶和米黑根毛霉天冬氨酸蛋白酶。
用于酵母宿主细胞的有用的信号肽从酿酒酵母α-因子和酿酒酵母转化酶的基因获得。其他的有用的信号肽编码序列由Romanos等,1992,见上文描述。
控制序列也可为编码处于多肽的N-末端的前肽的前肽编码序列。所得的多肽被称为前体酶(proenzyme)或多肽原(或在一些情况下被称为酶原(zymogen))。多肽原通常是无活性的并且可通过催化切割或自身催化切割来自多肽原的前肽而转化为活性多肽。前肽编码序列可从以下酶的基因获得:枯草芽孢杆菌碱性蛋白酶(aprE)、枯草芽孢杆菌中性蛋白酶(nprT)、嗜热毁丝霉漆酶(WO 95/33836)、米黑根毛霉天冬氨酸蛋白酶和酿酒酵母α-因子。
在信号肽序列和前肽序列二者都存在的情况下,该前肽序列位于紧邻多肽的N-末端且该信号肽序列位于紧邻该前肽序列的N-末端。
也可为合意的是添加调节序列,所述调节序列调节相对于宿主细胞的生长的多肽的表达。调节序列的实例是引起基因的表达响应于化学或物理刺激(包括调节化合物的存在)而开启或关闭的那些。原核系统中的调节序列包括lac、tac以及trp操纵基因系统。在酵母中,可以使用ADH2系统或GAL1系统。在丝状真菌中,可以使用黑曲霉葡糖淀粉酶启动子、米曲霉TAKA α-淀粉酶启动子和米曲霉葡糖淀粉酶启动子、里氏木霉纤维二糖水解酶I启动子以及里氏木霉纤维二糖水解酶II启动子。调节序列的其他实例是允许基因扩增的那些。在真核系统中,这些调节序列包括在甲氨蝶呤存在下扩增的二氢叶酸还原酶基因以及用重金属扩增的金属硫蛋白基因。在这些情况中,编码多肽的多核苷酸会与调控序列可操作地连接。
表达载体
本发明还涉及包含本发明的多核苷酸、启动子、以及转录和翻译终止信号的重组表达载体。多个核苷酸和控制序列可连接在一起以产生重组表达载体,其可包括一个或多个便利的限制位点以允许编码该多肽的多核苷酸在这些位点处的插入或取代。可替代地,多核苷酸可通过将该多核苷酸或包含该多核苷酸的核酸构建体插入用于表达的适当载体中来表达。在产生该表达载体时,该编码序列位于该载体中,这样使得该编码序列与该用于表达的适当控制序列可操作地连接。
重组表达载体可以是任何载体(例如,质粒或病毒),其能够方便地进行重组DNA程序,并且能够引起多核苷酸的表达。载体的选择将典型地取决于该载体与有待引入该载体的宿主细胞的相容性。该载体可以是线状或闭合的环状质粒。
载体可以是自主复制载体,即,作为染色体外实体存在的载体,其复制独立于染色体复制,例如,质粒、染色体外元件、微染色体或人工染色体。该载体可包含用于确保自我复制的任何装置。可替代地,载体可以是这样的载体,当它引入宿主细胞中时整合入基因组中并与其中已整合了它的染色体一起复制。此外,可以使用单独的载体或质粒或两个或更多个载体或质粒,其共同包含待引入宿主细胞基因组的总DNA,或可以使用转座子。
载体优选地包含一个或多个选择性标记,所述标记容许容易地选择转化细胞、转染细胞、转导细胞等。选择性标记是这样的基因,其产物提供了杀生物剂抗性或病毒抗性、重金属抗性、营养缺陷型的原养型等。
细菌选择性标记的实例是地衣芽孢杆菌或枯草芽孢杆菌dal基因,或赋予抗生素抗性(如氨苄青霉素、氯霉素、卡那霉素、新霉素、大观霉素或四环素抗性)的标记。用于酵母宿主细胞的适合的标记包括但不限于ADE2、HIS3、LEU2、LYS2、MET3、TRP1和URA3。用于丝状真菌宿主细胞中的选择性标记包括但不限于:adeA(磷酸核糖酰氨基咪唑-琥珀酸甲酰胺合酶)、adeB(磷酸核糖酰-氨基咪唑合酶)、amdS(乙酰胺酶)、argB(鸟氨酸氨甲酰基转移酶)、bar(草丁膦乙酰转移酶)、hph(潮霉素磷酸转移酶)、niaD(硝酸还原酶)、pyrG(乳清酸核苷-5’-磷酸脱羧酶)、sC(硫酸腺苷酰基转移酶)、以及trpC(邻氨基苯甲酸合酶)、以及其等效物。优选用于曲霉属细胞中的是构巢曲霉或米曲霉amdS和pyrG基因和吸水链霉菌(Streptomyces hygroscopicus)bar基因。优选用于木霉属细胞中的是adeA、adeB、amdS、hph和pyrG基因。
选择性标记可为双选择性标记系统,如WO 2010/039889中描述的。在一方面中,双选择性标记是hph-tk双选择性标记系统。
载体优选包含允许载体整合到宿主细胞的基因组中或载体在细胞中独立于基因组自主复制的一个或多个元件。
对于整合到该宿主细胞基因组中,该载体可以依靠编码该多肽的多核苷酸序列或者用于通过同源或非同源重组整合到该基因组中的该载体的任何其他元件。可替代地,该载体可包含用于指导通过同源重组而整合入宿主细胞基因组中的染色体中的精确位置处的另外的多核苷酸。为了增加在精确位置整合的可能性,整合的元件应包含足够数量的核酸,如100至10,000个碱基对、400至10,000个碱基对、以及800至10,000个碱基对,其与相应的靶序列具有高度的序列一致性以增强同源重组的可能性。这些整合元件可为与宿主细胞基因组中的靶序列同源的任何序列。此外,这些整合元件可为非编码多核苷酸或编码多核苷酸。另一方面,载体可通过非同源重组整合入宿主细胞的基因组中。
对于自主复制,载体可以进一步包含使该载体能够在所讨论的宿主细胞中自主地进行复制的复制起点。复制起点可为在细胞中有功能的介导自主复制的任何质粒复制子。术语“复制起点”或“质粒复制子”意指使质粒或载体能够在体内复制的多核苷酸。
细菌复制起点的实例是允许在大肠杆菌中复制的质粒pBR322、pUC19、pACYC177、以及pACYC184的复制起点,以及允许在芽孢杆菌属中复制的质粒pUB110、pE194、pTA1060、以及pAMβ1的复制起点。
用于酵母宿主细胞中的复制起点的实例是2微米复制起点、ARS1、ARS4、ARS1和CEN3的组合、以及ARS4和CEN6的组合。
在丝状真菌细胞中有用的复制起点的实例是AMA1和ANS1(Gems等人,1991,Gene[基因]98:61-67;Cullen等人,1987,Nucleic Acids Res.[核酸研究]15:9163-9175;WO00/24883)。可根据WO 00/24883中公开的方法完成AMA1基因的分离和包含该基因的质粒或载体的构建。
可以将本发明多核苷酸的一个以上的拷贝插入宿主细胞以增加多肽的产生。多核苷酸拷贝数的增加可通过如下获得:将序列的至少一个额外拷贝整合入宿主细胞基因组,或包括与多核苷酸一起的可扩增的选择性标记基因,其中可通过在适合的选择剂(selectable agent)存在下培养细胞来选择包含选择性标记基因的扩增拷贝,且由此包含多核苷酸的额外拷贝的细胞。
用于连接以上所描述的元件以构建本发明的重组表达载体的程序是本领域的普通技术人员熟知的(参见,例如,Sambrook等人,1989,同上)。
在本发明的优选实施例中,第一多核苷酸在细菌宿主细胞中具有启动子活性;优选地在原核宿主细胞;更优选地在革兰氏阳性或革兰氏阴性菌;更优选地在芽孢杆菌宿主细胞;甚至更优选地在嗜碱芽孢杆菌、解淀粉芽孢杆菌、短芽孢杆菌、环状芽孢杆菌、克劳氏芽孢杆菌、凝结芽孢杆菌、坚强芽孢杆菌、灿烂芽孢杆菌、迟缓芽孢杆菌、地衣芽孢杆菌、巨大芽孢杆菌、短小芽孢杆菌、嗜热脂肪芽孢杆菌、枯草芽孢杆菌或苏云金芽孢杆菌细胞;最优选地在枯草芽孢杆菌或地衣芽孢杆菌细胞中具有启动子活性。
在另一个优选的实施例中,第一多核苷酸在真菌宿主细胞中具有启动子活性。优选地,真菌宿主细胞可为酵母细胞。如在此所用的“酵母”包括产子囊酵母(ascosporogenous yeast)(内孢霉目(Endomycetales))、产担子酵母(basidiosporogenous yeast)和属于半知菌类(Fungi Imperfecti)(芽孢纲(Blastomycetes))的酵母。由于酵母的分类可能在将来变化,出于本发明的目的,酵母应当如酵母的生物学与活性(Skinner、Passmore和Davenport编辑,Soc.App.Bacteriol.Symposium Series No.9[应用细菌学学会专题论文集系列9],1980)所描述那样定义。
酵母宿主细胞可以是假丝酵母属、汉逊酵母属、克鲁弗酵母属、毕赤酵母属、酵母属、裂殖酵母属、或耶氏酵母属细胞,如乳酸克鲁维酵母(Kluyveromyces lactis)、卡尔酵母、酿酒酵母、糖化酵母、道格拉氏酵母、克鲁弗酵母、诺地酵母、卵形酵母或解脂耶氏酵母(Yarrowia lipolytica)细胞。
真菌宿主细胞优选地可为丝状真菌细胞。“丝状真菌”包括真菌门(Eumycota)和卵菌门(Oomycota)亚类的所有丝状形式(如由Hawksworth等人,1995(见上文)所定义的)。丝状真菌通常的特征在于由几丁质、纤维素、葡聚糖、壳多糖、甘露聚糖、以及其他复杂多糖构成的菌丝体壁。营养生长是通过菌丝延长,而碳分解代谢是专性需氧的。相反,酵母(如酿酒酵母)的营养生长是通过单细胞菌体的出芽(budding),且碳分解代谢可以是发酵性的。
优选的丝状真菌宿主细胞是枝顶孢霉属、曲霉属、短梗霉属、烟管霉属(Bjerkandera)、拟腊菌属、金孢子菌属、鬼伞属、革盖菌属(Coriolus)、隐球菌属、线黑粉菌科(Filibasidium)、镰孢属、腐质霉属、梨孢菌属、毛霉属、毁丝霉属、新美鞭菌属、链孢菌属、拟青霉属、青霉属、平革菌属、射脉菌属(Phlebia)、瘤胃壶菌属、侧耳属(Pleurotus)、裂褶菌属、篮状菌属、嗜热子囊菌属、梭孢壳属、弯颈霉属、栓菌属(Trametes)、或木霉属细胞。
最优选地,丝状真菌宿主细胞是泡盛曲霉、臭曲霉、烟曲霉、日本曲霉、构巢曲霉、黑曲霉、米曲霉、黑刺烟管菌(Bjerkandera adusta)、干拟蜡菌(Ceriporiopsisaneirina)、卡内基拟蜡菌(Ceriporiopsis caregiea)、浅黄拟蜡孔菌(Ceriporiopsisgilvescens)、潘诺希塔拟蜡菌(Ceriporiopsis pannocinta)、环带拟蜡菌(Ceriporiopsisrivulosa)、微红拟蜡菌(Ceriporiopsis subrufa)、虫拟蜡菌(Ceriporiopsissubvermispora)、狭边金孢子菌(Chrysosporium inops)、嗜角质金孢子菌、卢克诺文思金孢子菌(Chrysosporium lucknowense)、粪状金孢子菌(Chrysosporium merdarium)、租金孢子菌、女王杜香金孢子菌(Chrysosporium queenslandicum)、热带金孢子菌、褐薄金孢子菌(Chrysosporium zonatum)、灰盖鬼伞(Coprinus cinereus)、毛革盖菌(Coriolushirsutus)、杆孢状镰孢、谷类镰孢、库威镰孢、大刀镰孢、禾谷镰孢、禾赤镰孢、异孢镰孢、合欢木镰孢、尖镰孢、多枝镰孢、粉红镰孢、接骨木镰孢、肤色镰孢、拟分枝孢镰孢、硫色镰孢、圆镰孢、拟丝孢镰孢、镶片镰孢、特异腐质霉、柔毛腐质霉、米黑毛霉、嗜热毁丝霉、粗糙链孢菌、产紫青霉、黄孢平革菌(Phanerochaete chrysosporium)、射脉菌(Phlebia radiata)、刺芹侧耳(Pleurotus eryngii)、土生梭孢壳霉、长域毛栓菌(Trametes villosa)、变色栓菌(Trametes versicolor)、哈茨木霉、康宁木霉、长枝木霉、里氏木霉、或绿色木霉细胞。
在优选的实施例中,真菌宿主细胞是丝状真菌宿主细胞,更优选地是曲霉属或木霉属宿主细胞;最优选地是米曲霉(Aspergillus oryzae)、黑曲霉(Aspergillus niger)或里氏木霉(Trichoderma reesei)细胞。
在本发明的优选实施例中,第一多核苷酸在真菌宿主细胞中具有启动子活性,并且包含源自曲霉属或木霉属细胞的启动子或由其组成;更优选地,第一多核苷酸包含源自米曲霉、黑曲霉或里氏木霉细胞的启动子或由其组成;甚至更优选地,第一多核苷酸包含米曲霉、黑曲霉或里氏木霉细胞的真菌丙糖-磷酸盐异构酶启动子或由其组成;最优选地,第一多核苷酸包含SEQ ID NO:3的位置219-位置838中所示的启动子或由其组成。
在另一个优选的实施例中,信号肽源自细菌信号肽;优选地,信号肽源自原核细胞;更优选地,信号肽源自芽孢杆菌细胞。
在一个可替代的优选实施例中,信号肽源自真菌细胞;优选地,信号肽源自丝状真菌细胞;甚至更优选地,信号肽源自曲霉属或木霉属细胞;最优选地,信号肽源自米曲霉、黑曲霉或里氏木霉细胞。
优选地,第二多核苷酸包含细菌启动子或由其组成,优选地第二多核苷酸包含来自噬菌体的启动子或由其组成,最优选地第二多核苷酸包含SEQ ID NO:3的位置949-位置1021所示的T7启动子或由其组成。
如下面用脂肪酶所举例说明的,优选的是,第三多核苷酸编码酶;优选地是水解酶、异构酶、连接酶、裂解酶、氧化还原酶或转移酶;甚至更优选地是α-半乳糖苷酶、α-葡糖苷酶、氨肽酶、淀粉酶、β-半乳糖苷酶、β-葡糖苷酶、β-木糖苷酶、糖酶、羧肽酶、过氧化氢酶、纤维二糖水解酶、纤维素酶、壳多糖酶、角质酶、环糊精糖基转移酶、脱氧核糖核酸酶、内切葡聚糖酶、酯酶、葡糖淀粉酶、转化酶、漆酶、脂肪酶、甘露糖苷酶、变聚糖酶、氧化酶、果胶分解酶、过氧化物酶、植酸酶、多酚氧化酶、蛋白水解酶、核糖核酸酶、转谷氨酰胺酶、或木聚糖酶;优选地,该第三多核苷酸编码该酶的成熟形式。
宿主细胞
在第二个方面,本发明涉及包含如第一方面所定义的多核苷酸构建体的微生物宿主细胞。
将包含多核苷酸的构建体或载体引入宿主细胞中,这样使得该构建体或载体作为染色体整合体或作为自主复制的染色体外载体维持,如较早前所述。术语“宿主细胞”涵盖由于复制过程中发生的突变而与亲本细胞不同的亲本细胞的任何后代。宿主细胞的选择会在很大程度上取决于编码该多肽的基因及其来源。
宿主细胞可为在本发明的多肽的重组产生中有用的任何细胞,例如原核细胞或真核细胞。
原核宿主细胞可为任何革兰氏阳性或革兰氏阴性细菌。革兰氏阳性细菌包括但不限于:芽孢杆菌属、梭菌属、肠球菌属、土芽孢杆菌属、乳杆菌属、乳球菌属、海洋芽孢杆菌属、葡萄球菌属、链球菌属、和链霉菌属。革兰氏阴性细菌包括但不限于:弯曲杆菌属、大肠杆菌、黄杆菌属、梭杆菌属、螺杆菌属、泥杆菌属、奈瑟氏菌属、假单胞菌属、沙门氏菌属、以及脲原体属。
细菌宿主细胞可以是任何芽孢杆菌属细胞,包括但不限于:嗜碱芽孢杆菌、解淀粉芽孢杆菌、短芽孢杆菌、环状芽孢杆菌、克劳氏芽孢杆菌、凝结芽孢杆菌、坚硬芽孢杆菌、灿烂芽孢杆菌、迟缓芽孢杆菌、地衣芽孢杆菌、巨大芽孢杆菌、短小芽孢杆菌、嗜热脂肪芽孢杆菌、枯草芽孢杆菌以及苏云金芽孢杆菌细胞。
细菌宿主细胞还可以是任何链球菌属细胞,包括但不限于:类马链球菌、化脓性链球菌、乳房链球菌以及马链球菌兽疫亚种细胞。
细菌宿主细胞还可以是任何链霉菌属细胞,包括但不限于:不产色链霉菌、阿维链霉菌、天蓝色链霉菌、灰色链霉菌以及变铅青链霉菌细胞。
将DNA引入芽孢杆菌属细胞中可以通过以下来实现:原生质体转化(参见例如,Chang和Cohen,1979,Mol.Gen.Genet.[分子遗传学与基因组学]168:111-115)、感受态细胞转化(参见例如,Young和Spizizen,1961,J.Bacteriol.[细菌学杂志]81:823-829,或Dubnau和Davidoff-Abelson,1971,J.Mol.Biol.[分子生物学杂志]56:209-221)、电穿孔(参见例如,Shigekawa和Dower,1988,Biotechniques[生物技术]6:742-751)或接合(参见例如,Koehler和Thorne,1987,J.Bacteriol.[细菌学杂志]169:5271-5278)。将DNA引入大肠杆菌细胞中可以通过以下来实现:原生质体转化(参见例如,Hanahan,1983,J.Mol.Biol.[分子生物学杂志]166:557-580)或电穿孔(参见例如,Dower等人,1988,Nucleic AcidsRes.[核酸研究]16:6127-6145)。将DNA引入链霉菌属细胞中可通过以下来实现:原生质体转化、电穿孔(参见,例如,Gong等人,2004,Folia Microbiol.[叶线形微生物学](布拉格(Praha))49:399-405)、接合(参见例如,Mazodier等人,1989,J.Bacteriol.[细菌学杂志]171:3583-3585)、或转导(参见例如,Burke等人,2001,Proc.Natl.Acad.Sci.USA[美国国家科学院院刊]98:6289-6294)。将DNA引入假单孢菌属细胞中可以通过以下来实现:电穿孔(参见例如,Choi等人,2006,J.Microbiol.Methods[微生物学方法杂志]64:391-397)或接合(参见例如,Pinedo和Smets,2005,Appl.Environ.Microbiol.[应用与环境微生物学]71:51-57)。将DNA引入链球菌属细胞中可以通过以下来实现:天然感受态(参见例如,Perry和Kuramitsu,1981,Infect.Immun.[感染与免疫]32:1295-1297)、原生质体转化(参见例如,Catt和Jollick,1991,Microbios[微生物学]68:189-207)、电穿孔(参见例如,Buckley等人,1999,Appl.Environ.Microbiol.[应用与环境微生物学]65:3800-3804)或接合(参见例如,Clewell,1981,Microbiol.Rev.[微生物学评论]45:409-436)。然而,可以使用本领域已知的将DNA引入宿主细胞的任何方法。
宿主细胞还可为真核生物,如哺乳动物、昆虫、植物或真菌细胞。
宿主细胞可为真菌细胞。如在此使用的“真菌”包括子囊菌门(Ascomycota)、担子菌门(Basidiomycota)、壶菌门(Chytridiomycota)和接合菌门(Zygomycota)以及卵菌门(Oomycota)和所有有丝分裂孢子真菌(如由Hawksworth等人所定义的,在:Ainsworth andBisby’s Dictionary of The Fungi[Ainsworth和Bisby的真菌大词典],第8版,1995,国际CAB,大学出版社,剑桥,英国)。
真菌宿主细胞可以是酵母细胞。如在此所使用的“酵母”包括产子囊酵母(酵母目)、产担子酵母及属于不完全真菌的酵母(芽生菌目)。由于酵母的分类可能在将来变化,出于本发明的目的,酵母应当如酵母的生物学与活性(Skinner、Passmore和Davenport编辑,Soc.App.Bacteriol.Symposium Series No.9[应用细菌学学会专题论文集系列9],1980)所描述那样定义。
酵母宿主细胞可以是假丝酵母属、汉逊酵母属、克鲁弗酵母属、毕赤酵母属、酵母属、裂殖酵母属、或耶氏酵母属细胞,如乳酸克鲁维酵母(Kluyveromyces lactis)、卡尔酵母、酿酒酵母、糖化酵母、道格拉氏酵母、克鲁弗酵母、诺地酵母、卵形酵母或解脂耶氏酵母(Yarrowia lipolytica)细胞。
真菌宿主细胞可以是丝状真菌细胞。“丝状真菌”包括真菌门(Eumycota)和卵菌门(Oomycota)亚类的所有丝状形式(如由Hawksworth等人,1995(见上文)所定义的)。通常,丝状真菌的特征在于由几丁质、纤维素、葡聚糖、壳聚糖、甘露聚糖、以及其他复杂多糖构成的菌丝体壁。营养生长是通过菌丝延伸,而碳分解代谢是专性需氧的。相反,酵母(如酿酒酵母)的营养生长是通过单细胞菌体的出芽(budding),且碳分解代谢可以是发酵性的。
丝状真菌宿主细胞可以是枝顶孢属、曲霉属、短梗霉属、烟管霉属(Bjerkandera)、拟腊菌属、金孢子菌属、鬼伞属、革盖菌属(Coriolus)、隐球菌属、线黑粉菌科(Filibasidium)、镰孢属、腐质霉属、梨孢菌属、毛霉属、毁丝霉属、新美鞭菌属、链孢菌属、拟青霉属、青霉属、平革菌属、射脉菌属(Phlebia)、瘤胃壶菌属、侧耳属(Pleurotus)、裂褶菌属、篮状菌属、嗜热子囊菌属、梭孢壳属、弯颈霉属、栓菌属(Trametes)或木霉属细胞。
例如,丝状真菌宿主细胞可以是泡盛曲霉、臭曲霉、烟曲霉、日本曲霉、构巢曲霉、黑曲霉、米曲霉、黑刺烟管菌(Bjerkandera adusta)、干拟蜡菌(Ceriporiopsisaneirina)、卡内基拟蜡菌(Ceriporiopsis caregiea)、浅黄拟蜡孔菌(Ceriporiopsisgilvescens)、潘诺希塔拟蜡菌(Ceriporiopsis pannocinta)、环带拟蜡菌(Ceriporiopsisrivulosa)、微红拟蜡菌(Ceriporiopsis subrufa)、虫拟蜡菌(Ceriporiopsissubvermispora)、狭边金孢子菌(Chrysosporium inops)、嗜角质金孢子菌、卢克诺文思金孢子菌(Chrysosporium lucknowense)、粪状金孢子菌(Chrysosporium merdarium)、租金孢子菌、昆士兰金孢子菌(Chrysosporium queenslandicum)、热带金孢子菌、褐薄金孢子菌(Chrysosporium zonatum)、灰盖鬼伞(Coprinus cinereus)、毛革盖菌(Coriolushirsutus)、杆孢状镰孢、谷类镰孢、库威镰孢、大刀镰孢、禾谷镰孢、禾赤镰孢、异孢镰孢、合欢木镰孢、尖镰孢、多枝镰孢、粉红镰孢、接骨木镰孢、肤色镰孢、拟分枝孢镰孢、硫色镰孢、圆镰孢、拟丝孢镰孢、镶片镰孢、特异腐质霉、柔毛腐质霉、米黑毛霉、嗜热毁丝霉、粗糙链孢菌、产紫青霉、黄孢平革菌(Phanerochaete chrysosporium)、射脉菌(Phlebia radiata)、刺芹侧耳(Pleurotus eryngii)、土生梭孢壳霉、长域毛栓菌(Trametes villosa)、变色栓菌(Trametes versicolor)、哈茨木霉、康宁木霉、长枝木霉、里氏木霉、或绿色木霉细胞。
真菌细胞可以通过下述过程转化,所述过程涉及原生质体形成、原生质体的转化、以及以本身已知的方式的细胞壁的再生。用于转化曲霉属和木霉属宿主细胞的适合程序描述于以下文献中:EP 238023,Yelton等人,1984,Proc.Natl.Acad.Sci.USA[美国国家科学院院刊]81:1470-1474以及Christensen等人,1988,Bio/Technology[生物/技术]6:1419-1422。用于转化镰刀菌属物种的适合方法由Malardier等人,1989,Gene[基因]78:147-156、以及WO 96/00787描述。可以使用由如以下文献描述的程序转化酵母:Becker和Guarente,在Abelson,J.N.和Simon,M.I.编,Guide to Yeast Genetics and Molecular Biology[酵母遗传学与分子生物学指南],Methods in Enzymology[酶学方法],第194卷,第182-187页,学术出版社有限公司(Academic Press,Inc.),纽约;Ito等人,1983,J.Bacteriol.[细菌学杂志]153:163;以及Hinnen等人,1978,Proc.Natl.Acad.Sci.USA[美国国家科学院院刊]75:1920。
在优选的实施例中,微生物宿主细胞是细菌宿主细胞;优选地是原核生物宿主细胞;更优选地是芽孢杆菌宿主细胞;最优选地是枯草芽孢杆菌或地衣芽孢杆菌细胞。
在可替代的实施例中,微生物宿主细胞是真菌宿主细胞,优选地是丝状真菌宿主细胞,更优选地是曲霉属或木霉属宿主细胞;最优选地是米曲霉、黑曲霉或里氏木霉细胞。
产生方法
本发明的最后一个方面涉及用于产生感兴趣的多肽的方法,所述方法包括以下步骤:
a)培养如前述方面中所定义的微生物宿主细胞;并且,可任选地
b)回收该感兴趣的多肽。
这些宿主细胞是在适合于使用本领域中已知的方法产生该多肽的营养介质中培养的。例如,可通过摇瓶培养、或在实验室或工业发酵器中小规模或大规模发酵(包括连续、分批、补料分批或固态发酵)培养细胞,所述培养在适合的培养基中并且在允许表达和/或分离多肽的条件下进行。该培养是使用本领域中已知的程序,在一种适合营养介质基中发生,该介质包含碳和氮来源及无机盐。适合的培养基可以从商业供应商获得或可以根据公开的组成(例如,在美国典型培养物保藏中心(American Type Culture Collection)的目录中)制备。如果多肽被分泌到营养介质中,那么可直接从介质中回收多肽。如果多肽不分泌,那么其可从细胞裂解液中进行回收。
可以使用针对该多肽具有特异性的本领域已知的方法检测该多肽。这些检测方法包括但不限于:特异性抗体的使用、酶产物的形成或酶底物的消失。例如,可以使用酶测定法来确定多肽的活性。
可以使用本领域已知的方法来回收多肽。例如,可通过常规方法,包括但不限于:收集、离心、过滤、提取、喷雾干燥、蒸发或沉淀,从营养介质回收多肽。在一方面,回收包含多肽的发酵液。
可通过本领域已知的多种方法纯化多肽以获得基本上纯的多肽,所述方法包括但不限于层析(例如,离子交换、亲和、疏水、层析聚焦和大小排阻)、电泳方法(例如,制备型等电聚焦)、差示溶解度(例如,硫酸铵沉淀)、SDS-PAGE或提取(参见,例如,ProteinPurification,Janson和Ryden编,VCH Publishers,纽约,1989)。
在一个替代的方面,不回收多肽,而是将表达该多肽的本发明的宿主细胞用作多肽的来源。
实例
实例1.分裂标记米曲霉的宿主/载体系统的构建
当通过翻转酶介导的位点特异性重组将表达载体整合到适合的真菌宿主细胞时,确保正确的方向的一种方式是采用分裂选择标记,其中标记的一个非功能部分存在于宿主染色体中,并且标记的另一非功能部分是在进来的载体上。然后只有正确定向的整合生成功能第二选择标记。该分裂标记原理在此实例中说明;在此第二选择标记被定向在一个方向上,但它刚好也可以已经按其他方式被定向。
曲霉原生质体转化和重组细胞的选择所必需的培养基和溶液:
痕量金属
盐溶液
COVE培养基
20ml盐溶液
20g琼脂
218g山梨醇
H2O补足1l
高压灭菌并且然后添加:
50ml 20%葡萄糖
10ml 1M尿素。
Cove-N-甘氨酸斜面
蔗糖培养基
20ml 盐溶液。
342g 蔗糖。
H2O补足1l
高压灭菌并且然后添加:
10mM NaNO3
ST 0.6M山梨醇
100mM Tris/HCl pH 7.0
STC 1.2M山梨醇
10mM CaCl2
10mM Tris/HCl pH 7.5。
PEG 60%(W/V)PEG 4000(BDH)(6g PEG+~5ml无菌水,置于60-65℃)
10mM CaCl2(50μl的2M CaCl2)
10mM Tris/HCl pH7.5。(100μl的1M的Tris)
蔗糖琼脂平板
10g琼脂
10ml盐溶液
1M蔗糖补足至500ml
高压灭菌器灭菌
乙酰胺平板
10ml盐溶液
10g琼脂
1M蔗糖补足至500ml 1
高压灭菌。
冷却至大约65℃,添加10mM乙酰胺和15mM CsCl。
对于500毫升,Triton X-10050μl(仅在复制平板中)
在米曲霉DAu716的AMYamy2基因座的FRT位点的引入
质粒pJAl1258(在WO12160097A1中描述)被改良生成由pDAu703表示的质粒。
质粒pDAu703按顺序包含以下元件(图1;SEQ ID No:1):
●amy2-3’侧翼区(490bp);SEQ ID NO:1的位置449-938;
●pyrG启动子可操作地与包含pyrG CDS的5’端(第一外显子及其第一内含子的5’端)的部分的pyrG基因连接;
●FRT-F3位点(50bp);SEQ ID NO:1的位置1452-1501;
●黑曲霉AMG终止子(Tamg)可操作地与AmdS编码基因,SEQ ID NO:1的位置1511-位置2200连接;
●构巢曲霉乙酰胺酶基因(AmdS),SEQ ID NO:1的位置2232-位置4131;
●强磷酸丙糖异构酶启动子(Ptpi)可操作地与Amds编码基因连接;这允许在乙酰胺和ClCs上生长,即使按照预期基因组中仅存在AmdS选择盒的一个拷贝,如果质粒pDAU703被整合到位于FRT位点的amy2基因座的一个拷贝中。SEQ ID NO:1的位置4140-4894;
●FRT-F位点(49bp);SEQ ID NO:1的位置4903-4951;
●amy2-5’侧翼区(1114bp);SEQ ID NO:1的位置4964-6077;
●质粒的其余部分是由对于维持质粒作为细菌宿主细胞大肠杆菌中的复制质粒所必需的一部分DNA(大肠杆菌复制起点和氨苄青霉素抗性盒)构成。
质粒DNA pDAu703用NotI限制性内切酶消化,以从质粒的现在不相干大肠杆菌部分分离包含整合盒的DNA。
将线性化质粒pDAu703使用描述的标准程序(例如在WO98/01470中)转化进入米曲霉菌株Jal1338的原生质体(在WO12160097A1中披露),但是因为该菌株是的pyrG负型,需要补充10mM尿苷至培养基,因此其在没有尿苷下不能生长。在AmdS选择平板上选择转化体
所得重组宿主菌株已经具有两个FRT位点连同分裂pyrG标记(第一外显子和天然内含子的一部分)的5’端,该标记通过同源重组在amy2基因座与其自己的整合的启动子可操作地连接,如在图2中的顶部小图中所示。在amy2基因座上的正确整合通过Southern印迹分析使用退火到amy2的3’端的探针检查(图2)。FRT盒的整合分别在EcoRI和XhoI消化物中的5114bp和2637bp处产生杂交信号(未示出)。该模式与Jal1338宿主不同,其中该amy2基因座不被破坏。选择正确的菌株并用米曲霉DAu716表示(图2,上图)。
用携带脂肪酶编码基因的pDAU724载体的DAu716的转化
这个实例展示了FRT/FLP重组和分裂pyrG标记可以如何被用于可操作地使表达盒的单拷贝插入以高频存在于米曲霉中。我们使用来自绵毛嗜热丝孢菌的脂肪酶基因(例如在WO2008008950中披露)作为报告基因来测量在转化的宿主中产生的脂肪酶的水平。
像在先前实例中,构建表达载体,这样使得其一部分可以使用翻转酶作为位点特异性重组介质,在FRT-位点被整合到宿主细胞的染色体中。要被整合到基因组中的质粒的一部分携带可操作地与NA2/TPi启动子和黑曲霉AMG基因的终止子连接的脂肪酶基因。为了能够选择经由FRT位点已经成功整合表达盒的重组细胞,pyrG选择标记的剩余部分也被包括在FRT位点之间。启动子和第一外显子存在于DAu716宿主中并且pyrG标记的剩余部分存在于进来的质粒上。当位点特异性重组时,pyrG标记将被重构为完整基因(其中其第一内含子内的FRT序列,将当然,从mRNA拼接出)并且重组细胞将能够表达PyrG和生长在NaNO3作为单一氮源的平板上。
质粒pDAU724(图2,中间;SEQ ID NO:2)由以下组成:
要被整合到曲霉属宿主细胞的基因组DNA中的的部分-I,并且它由具有有表达盒的两个FRT位点和分裂pyrG标记的一部分组成;
将不被整合到宿主细胞的基因组中的部分-II,并且它包含FLP酶表达盒连同大肠杆菌选择标记和复制起点。
菌株DAu716生长在Cove-N-甘氨酸介质的斜面上直至可以看见孢子。
将10-20毫升的蔗糖培养基或YPD培养基添加至该斜面,并且通过漩涡振荡斜面悬浮孢子。孢子悬浮液转移到包含100ml蔗糖培养基和10mM硝酸钠(或其它氮源)的聚碳酸酯摇瓶(500毫升)中。在30℃下孵育烧瓶24hr(200rpm)。
通过神奇滤布(miracloth)过滤收集菌丝体,并且使用200ml 0.6M MgSO4洗涤。
从菌丝体吸出剩余液体,例如使用塑料移液器。
1-2g的菌丝体被转移到小的(100ml)聚碳酸酯烧瓶中,瓶中包含:
75-150mg Glucanex
10ml 1.2M MgSO4
100ul 1M NaH2PO4pH 5.8
并且悬浮该菌丝体,添加1ml的12mg/ml BSA(经灭菌过滤的)。
在37℃孵育悬浮液1/2-2hr,并且经常通过显微术监测原生质体形成。
将原生质体悬浮液通过神奇滤布(miracloth)过滤到25毫升离心管中,并且将悬浮液用5ml ST(小心不要与下层混合)覆盖。将所得原生质体,通过离心(2500rpm/1350g,15min,缓慢加速)分带。回收原生质体的界面带,并且转移到新鲜的管中。
用两体积的STC稀释原生质体,随后离心(2500rpm/1350g,5min)。然后用5ml STC洗涤原生质体两次(使用再悬浮和离心),并且然后在STC中再悬浮至大约5x 107个原生质体/ml的浓度。
对于每次转化,将正在转化的DNA添加至例如14ml管的底部,并且添加100μl的原生质体。添加300μl的PEG,并且将该管用手轻轻混合。孵育20分钟(室温)后,在50℃的温度下添加6ml顶层琼脂,并立即将该悬浮液倒在具有10mM的NaNO3的选择性蔗糖琼脂平板上。
将平板在37℃孵育,直至转化体清晰可见并且开始形成孢子。20个转化体复制到具有Triton的新选择平板上,以分离菌落,可以通过发酵,Southern印迹分析或酶活性测定进一步分析这些菌落。
确认染色体中存在的amdS标记已经通过在包含CsCl(内源乙酰胺酶的抑制剂)和作为唯一氮源的乙酰胺的平板上将转化体划线,在转化体中被引进的脂肪酶基因替换。正确的转化体不应该能够在这些平板上生长。我们测试了20个重组细胞,这些重组细胞是pDAu724的转化成DAu716后获得的,并与亲本宿主菌株DAu716相比,仅观察到轻微的生长表型,其中AmdS选择标记仍然存在。
证实所有20个转化体均包含正确插入在FRT位点的脂肪酶表达盒的一个插入的拷贝。
将20个转化体接种至3ml YPD在10ml 24深孔板(沃特曼(Whatman)公司)中,用Airpore胶带(Quiagen公司)密封,并且在200rpm的搅拌下30摄氏度孵育4天。收集上清液用于进一步分析(脂肪酶测定和SDS-page),并收集菌丝体用于基因组提取和Southern分析。
20个转化体在脂肪酶测定中示出可比较脂肪酶活性,连同在SDS-PAGE凝胶上示出可比较脂肪酶蛋白水平(未示出)。此外,Southern印迹证实,所有20个转化体仅具有正确地整合到染色体中的预期单一脂肪酶基因拷贝(未示出)。
实例2.质粒pBac7000的构建
使用包含疏棉状嗜热丝孢菌(Thermomyces lanuginosus)脂肪酶作为报道基因的质粒pDau724作为载体。如上面的实例所示,质粒已被构建成使得包含翻转酶基因,该基因确保使用位于感兴趣的基因的侧翼的Frt位点的同源重组至宿主基因组中。
在真菌分泌的脂肪酶编码基因中包含T7启动子的内含子被排列作为合成多核苷酸构建体,并使用标准分子生物学技术使用限制酶BamHI和XhoI将其克隆到pDau724中,从而产生质粒pBac7000(SEQ ID NO:3)。
实例3.编码脂肪酶的基因的体外转录/翻译
使用来自Biolabs的标准试剂盒(PURExpres体外蛋白质合成试剂盒E6800S),在IVTT反应中使用pBac7000和pDau724。从pDau724未观察到脂肪酶表达,但使用pBac7000作为模板观察到了脂肪酶的良好表达。在使用PNP-戊酸酯作为底物的活性测定中测试表达(细节公开于WO 200024883)。
实例4.用编码脂肪酶的基因在真菌宿主中转化和表达
分别将pBac7000和pDau724各自转化到菌株Dau716细胞中。将转化体接种到各包含200微升YPM培养基的96孔微量滴定板(MTP)孔中。使MTP在带有湿纸的小盒子中在34℃不摇荡下生长3天,以确保高湿度。使用前面实例中提到的PNP-戊酸酯测定法测定来自每个孔的10微升生长培养基的脂肪酶活性。两种菌株都给出了相当水平的脂肪酶活性(数据未显示)。
序列表
<110> 诺维信公司(Novozymes A/S)
<120> 用于体外和体内表达的多核苷酸构建体
<130> 13095-WO-PCT
<160> 5
<170> PatentIn版本3.5
<210> 1
<211> 8299
<212> DNA
<213> 人工序列
<220>
<223> 质粒pDAu703
<400> 1
taggcgtatc acgaggccct ttcgtctcgc gcgtttcggt gatgacggtg aaaacctctg 60
acacatgcag ctcccggaga cggtcacagc ttgtctgtaa gcggatgccg ggagcagaca 120
agcccgtcag ggcgcgtcag cgggtgttgg cgggtgtcgg ggctggctta actatgcggc 180
atcagagcag attgtactga gagtgcacca tatgcggtgt gaaataccgc acagatgcgt 240
aaggagaaaa taccgcatca ggcgccattc gccattcagg ctgcgcaact gttgggaagg 300
gcgatcggtg cgggcctctt cgctattacg ccagctggcg aaagggggat gtgctgcaag 360
gcgattaagt tgggtaacgc cagggttttc ccagtcacga cgttgtaaaa cgacggccag 420
tgaattggcc tccatggccg cggccgcgct ttgctaaaac tttggttgat ggaaggtatc 480
tggcgataaa ctccgacgac gtctagaagc aacaatctta tgcaaacgct cattggttct 540
tttcgaccgc aacatccatc atgaaactgg tattttgtct gtgtcagcag tctagaaccc 600
cttgccgggt attttagcat ttcatttttc tataaaaagg taccagcatg tatggatcgt 660
atcttccgta ccgtggttat taaatcccag cagaggccga taggcttaag aagtgaacat 720
ggcatggtta aggaagaagc cattactgag tatatatggc tagaataatc gctgggaaag 780
atttatgctt ccaagaggcg taggacggta taccatacag tacggtattt atgaacaatt 840
cgataatacc actccccaaa gcgggagata ggacacccgc ctcaggcacc aaccaccccc 900
tttttcaact gtcagtggtg cacgtttcca tcgagcataa gcttggtacc ctaaggatag 960
gccctaatct tatctacatg tgactgcatc gatgtgtttg gtcaaaatga ggcatgtggc 1020
tcaccccaca ggcggagaaa cgtgtggcta gtgcatgaca gtcccctcca tagattcaat 1080
ttaatttttc gcggcaattg tcgtgcagtt tgtatctaca tttcattcca tatatcaaga 1140
gttagtagtt ggacatcctg attattttgt ctaattactg aaaactcgaa gtactaacct 1200
actaataagc cagtttcaac cactaagtgc tcatttatac aatatttgca gaaccccgcg 1260
ctacccctcc atcgccaaca tgtcttccaa gtcgcaattg acctacagcg cacgcgctag 1320
caagcacccc aatgcgctcg taaagaagct cttcgaggtt gccgaggcca agaaaaccaa 1380
tgtcaccgtt tccgccgacg tgacaaccac caaagagctg ctggatttgg ctgaccgtat 1440
gcgcaccggg gttgaagttc ctattccgag ttcctattct tcaaatagta taggaacttc 1500
attaattaaa ggagagagtt gaacctggac gccgcgcaaa aagcaaagac gcgcctcgtg 1560
ggcggtggat caatgatcgg atttagtggc agatggcatc acaggcggcc aatgaccacc 1620
gggccaactg gccccgacat tccagcaata ctgcctaatt gactccacca tgcatctcgg 1680
ctattattga actgggtttg atggatgggg accctcttgg aattgtcaaa gattttgaag 1740
cgaagacgat ctattggacg gtagagatat actcttgatt tagtcgttgg gaggcccctg 1800
gggaaagcaa tgatggggaa tgttgctgct ccactgtgga cctcggctat ggaattacgt 1860
gcttggatct aagatgagct catggctatg cattgaatga cagtgatatc agcagagcaa 1920
gcagagaagg atggaatgct aattttctag tgctttgtgc aagggtaaat cagggactgt 1980
ctgtctggtc ttctacacga aggaaagacc atggctttca cggtgtctgt atttccggat 2040
atcctcaatt ccgtcggtcg attacaatca catgacttgg cttccatttc actactatta 2100
tgcacaccca ctacatacat gatcatataa ccaattgccc tcatccccat cctttaacta 2160
tagcgaaatg gattgattgt ctaccgccag gtgtcagtca ccctctagat ctcgagctcg 2220
ctagagtcga cctatggagt caccacattt cccagcaact tccccacttc ctctgcaatc 2280
gccaacgtcc tctcttcact gagtctccgt ccgataacct gcactgcaac cggtgcccca 2340
tggtacgcct ccggatcata ctcttcctgc acgagggcat caagctcact aaccgccttg 2400
aaactctcat tcttcttatc gatgttctta tccgcaaagg taaccggaac aaccacgctc 2460
gtgaaatcca gcaggttgat cacagaggca tacccatagt accggaactg gtcatgccgt 2520
accgcagcgg taggcgtaat cggcgcgatg atggcgtcca gttccttccc ggccttttct 2580
tcagcctccc gccatttctc aaggtactcc atctggtaat tccacttctg gagatgcgtg 2640
tcccagagct cgttcatgtt aacagctttg atgttcgggt tcagtaggtc tttgatattt 2700
ggaatcgccg gctcgccgga tgcactgata tcgcgcatta cgtcggcgct gccgtcagcc 2760
gcgtagatat gggagatgag atcgtggccg aaatcgtgct tgtatggcgt ccacggggtc 2820
acggtgtgac cggctttggc gagtgcggcg acggtggttt ccacgccgcg caggatagga 2880
gggtgtggaa ggacattgcc gtcgaagttg tagtagccga tattgagccc gccgttcttg 2940
atcttggagg caataatgtc cgactcggac tggcgccagg gcatggggat gaccttggag 3000
tcgtatttcc atggctcctg accgaggacg gatttggtga agaggcggag gtctaacata 3060
cttcatcagt gactgccggt ctcgtatata gtataaaaag caagaaagga ggacagtgga 3120
ggcctggtat agagcaggaa aagaaggaag aggcgaagga ctcaccctca acagagtgcg 3180
taatcggccc gacaacgctg tgcaccgtct cctgaccctc catgctgttc gccatctttg 3240
catacggcag ccgcccatga ctcggcctta gaccgtacag gaagttgaac gcggccggca 3300
ctcgaatcga gccaccgata tccgttccta caccgatgac gccaccacga atcccaacga 3360
tcgcaccctc accaccagaa ctgccgccgc acgaccagtt cttgttgcgt gggttgacgg 3420
tgcgcccgat gatgttgttg actgtctcgc agaccatcag ggtctgcggg acagaggtct 3480
tgacgtagaa gacggcaccg gctttgcgga gcatggttgt cagaaccgag tccccttcgt 3540
cgtacttgtt tagccatgag atgtagccca ttgatgtttc gtagccctgg tggcatatgt 3600
tagctgacaa aaagggacat ctaacgactt aggggcaacg gtgtaccttg actcgaagct 3660
ggtctttgag agagatgggg aggccatgga gtggaccaac gggtctcttg tgctttgcgt 3720
agtattcatc gagttccctt gcctgcgcga gagcggcgtc agggaagaac tcgtgggcgc 3780
agtttgtctg cacagaagcc agcgtcagct tgatagtccc ataaggtggc gttgttacat 3840
ctccctgaga ggtagagggg accctactaa ctgctgggcg attgctgccc gtttacagaa 3900
tgctagcgta acttccaccg aggtcaactc tccggccgcc agcttggaca caagatctgc 3960
agcggaggcc tctgtgatct tcagttcggc ctctgaaagg atcaccgatt tctttgggaa 4020
atcaataacg ctgtcttccg caggcagcgt ctggactttc cattcatcag ggatggtttt 4080
tgcgaggcgg gcgcgcttat cagcggccag ttcttcccag gattgaggca tgtgcatgca 4140
atgtgtgttt atgtggaagt aagatacgac gagtttgatt gagaaaagac agggtgattg 4200
tcaagttcag tatggaagaa agagtagaag aagatcagac gacagggaag agcgatgaca 4260
taaaaggtgg aagacggaag aaaaacgaac caaatcaatc ccactctatg gcgggggttg 4320
gactgcctga ggccggcact ggtggggctt atcgataagt tctcgtcacc ggatgcaatg 4380
cgctgtcaac tgctgacttg gccctgaaca tcctgtcctc tacagatcca tactatacaa 4440
tgatcccagt tatagtgcgg taaggtgcat atcatatctc attctcatga ctcattcgac 4500
ttttttttag agaaagtaca tacgtggaac atacactaaa cgcaacaggt cgcgacaaca 4560
ctggtataca aaacggtccc cggtgaatga cgttattagt gtctatcccc cactcacacc 4620
cgaaaagaat aatagaaact aacagaaaaa gcggcccgag gataagagga acattcaaac 4680
agaaggggaa tcataaaaac cgaaaaatgc aaggaaaaga gaactcaaat caataatttt 4740
cataatactg tcgagagtaa tacggaccag cgtctctcag ggacatgcgt cggcgcaagg 4800
catcatccaa tctctcatct aacacatcca gcattcgtgt tcgatagtct aactgcttct 4860
ctcggcgctc aagtcttgct tcccgatcat cgagttaatt aagaagttcc tatactttct 4920
agagaatagg aactcggaat aggaacttca aggtaccgag ctctatcctc aataccctat 4980
tttccacgat tccattgtca tatccaattc cgttttcttt tcttgttttc ccctcatcca 5040
atcccgtcca tcatttactc ctttttcttg tgaatgcaag tggcactaag aaatccaacc 5100
cccagacaaa ttttcctact caggaacaca aaaacctcgt ttctgctccc ttctcgtact 5160
tcattcctat cgtctcggaa tttcctcaac aaccctttcc gactttgcga cagcgtcgcg 5220
attccagact tatgtgttct cgttcctact gtcgttacca gtctatttat tccgaaacct 5280
ctgatcgctg aatttcacac acaacacccc cccgttgatg ctggtggaga atccgtagcg 5340
tcaagagttg aattcactcc atgttgtaac gaagtccacg aattgagacg attgatgatt 5400
acaaccccgc gatcgcctat cgacgattcg acgagatgcc attctcatcc tcctcatcct 5460
cctccacccc cgaggtgtct accaccccgc tcgcagatta cttctggatc gcaggtgtcg 5520
atggcgcgga aatcttagag actttccaaa gactcggcga cgaatacagg gcaaacagtg 5580
ccaccgctcc tggccccgct cttgcggaca cgatcgagga agatgcggac gcggaggagg 5640
cacacgaccc ccgtctggac tccctctctc gacccaattc catggctggg ggccgcaatt 5700
ccttccagcg gttctcaatg cgctcaggag actccagtga gtccagtggg aatggtacca 5760
gcagcaaccg gagcagtctg accatcaagg gtaatcagtc gcccagaggg tcgtcgtttc 5820
tagaagattt cgactttgac aaggccctgt tcaagtttgc aaacgagcgg gagtcgttcc 5880
tgtcggatct gagtctcagt gccggagcaa tcactcccac ctcccgtcct aggtccaggt 5940
tacgtacaca gaagattgtc tccgaggaaa gtccctccca gccatccagc ttgcttcgat 6000
caggcattgg tagtgtgcgg cgtcatatgg cattcagaga catgaatagt atgaaacggc 6060
agccgtcagt tgctcgtcgc ggccgcagct tggcgtaatc atggtcatag ctgtttcctg 6120
tgtgaaattg ttatccgctc acaattccac acaacatacg agccggaagc ataaagtgta 6180
aagcctgggg tgcctaatga gtgagctaac tcacattaat tgcgttgcgc tcactgcccg 6240
ctttccagtc gggaaacctg tcgtgccagc tgcattaatg aatcggccaa cgcgcgggga 6300
gaggcggttt gcgtattggg cgctcttccg cttcctcgct cactgactcg ctgcgctcgg 6360
tcgttcggct gcggcgagcg gtatcagctc actcaaaggc ggtaatacgg ttatccacag 6420
aatcagggga taacgcagga aagaacatgt gagcaaaagg ccagcaaaag gccaggaacc 6480
gtaaaaaggc cgcgttgctg gcgtttttcc ataggctccg cccccctgac gagcatcaca 6540
aaaatcgacg ctcaagtcag aggtggcgaa acccgacagg actataaaga taccaggcgt 6600
ttccccctgg aagctccctc gtgcgctctc ctgttccgac cctgccgctt accggatacc 6660
tgtccgcctt tttcccttcg ggaagcgtgg cgctttctca tagctcacgc tgtaggtatc 6720
tcagttcggt gtaggtcgtt cgctccaagc tgggctgtgt gcacgaaccc cccgttcagc 6780
ccgaccgctg cgccttatcc ggtaactatc gtcttgagtc caacccggta agacacgact 6840
tatcgccact ggcagcagcc actggtaaca ggattagcag agcgaggtat gtaggcggtg 6900
ctacagagtt cttgaagtgg tggcctaact acggctacac tagaagaaca gtatttggta 6960
tctgcgctct gctgaagcca gttaccttcg gaaaaagagt tggtagctct tgatccggca 7020
aacaaaccac cgctggtagc ggtggttttt ttgtttgcaa gcagcagatt acgcgcagaa 7080
aaaaaggatc tcaagaagat cctttgatct tttctacggg gtctgacgct cagtggaacg 7140
aaaactcacg ttaagggatt ttggtcatga gattatcaaa aaggatcttc acctagatcc 7200
ttttaaatta aaaatgaagt tttaaatcaa tctaaagtat atatgagtaa acttggtctg 7260
acagttacca atgcttaatc agtgaggcac ctatctcagc gatctgtcta tttcgttcat 7320
ccatagttgc ctgactcccc gtcgtgtaga taactacgat acgggagggc ttaccatctg 7380
gccccagtgc tgcaatgata ccgcgagacc cacgctcacc ggctccagat ttatcagcaa 7440
taaaccagcc agccggaagg gccgagcgca gaagtggtcc tgcaacttta tccgcctcca 7500
tccagtctat taattgttgc cgggaagcta gagtaagtag ttcgccagtt aatagtttgc 7560
gcaacgttgt tgccattgct acaggcatcg tggtgtcacg ctcgtcgttt ggtatggctt 7620
cattcagctc cggttcccaa cgatcaaggc gagttacatg atcccccatg ttgtgcaaaa 7680
aagcggttag ctccttcggt cctccgatcg ttgtcagaag taagttggcc gcagtgttat 7740
cactcatggt tatggcagca ctgcataatt ctcttactgt catgccatcc gtaagatgct 7800
tttctgtgac tggtgagtac tcaaccaagt cattctgaga atagtgtatg cggcgaccga 7860
gttgctcttg cccggcgtca atacgggata ataccgcgcc acatagcaga actttaaaag 7920
tgctcatcat tggaaaacgt tcttcggggc gaaaactctc aaggatctta ccgctgttga 7980
gatccagttc gatgtaaccc actcgtgcac ccaactgatc ttcagcatct tttactttca 8040
ccagcgtttc tgggtgagca aaaacaggaa ggcaaaatgc cgcaaaaaag ggaataaggg 8100
cgacacggaa atgttgaata ctcatactct tcctttttca atattattga agcatttatc 8160
agggttattg tctcatgagc ggatacatat ttgaatgtat ttagaaaaat aaacaaatag 8220
gggttccgcg cacatttccc cgaaaagtgc cacctgacgt ctaagaaacc attattatca 8280
tgacattaac ctataaaaa 8299
<210> 2
<211> 8614
<212> DNA
<213> 人工序列
<220>
<223> 质粒pDAU724
<400> 2
gaattcgagc tcggtacctt gaagttccta ttccgagttc ctattctcta gaaagtatag 60
gaacttcagt acccgggtat aagctagctt ccgttaaatt gccgtcgtca gccgttaaat 120
taccgattaa tcccgataaa tttccgagat ctccgttaaa ttgccgttcg cagccgttaa 180
attaccgggg acgaccgata aatttccgcg atgaattcat ggtgttttga tcattttaaa 240
tttttatatg gcgggtggtg ggcaactcgc ttgcgcgggc aactcgctta ccgattacgt 300
tagggctgat atttacgtaa aaatcgtcaa gggatgcaag accaaaccgt taaatttccg 360
gagtcaacag catccaagcc caagtccttc acggagaaac cccagcgtcc acatcacgag 420
cgaaggacca cctctaggca tcggacgcac catccaatta gaagcagcaa agcgaaacag 480
cccaagaaaa aggtcggccc gtcggccttt tctgcaacgc tgatcacggg cagcgatcca 540
accaacaccc tccagagtga ctaggggcgg aaatttatcg ggattaattt ccactcaacc 600
acaaatcaca gtcgtccccg gtaatttaac ggctgcagac ggcaatttaa cggcttctgc 660
gaatcgcttg gattccccgc ccctggccgt agagcttaaa gtatgtccct tgtcgatgcg 720
atgtatcaca acatataaat actggcaagg gatgccatgc ttggagtttc caactcaatt 780
tacctctatc cacacttctc ttccttcctc aatcctctat atacacaact ggggatccac 840
catgaggagc tcccttgtgc tgttctttgt ctctgcgtgg acggccttgg ccagtcctat 900
tcgtcgagag gtctcgcagg atctgtttaa ccagttcaat ctctttgcac agtattctgc 960
agccgcatac tgcggaaaaa acaatgatgc cccagctggt acaaacatta cgtgcacggg 1020
aaatgcctgc cccgaggtag agaaggcgga tgcaacgttt ctctactcgt ttgaagactc 1080
tggagtgggc gatgtcaccg gcttccttgc tctcgacaac acgaacaaat tgatcgtcct 1140
ctctttccgt ggctctcgtt ccatagagaa ctggatcggg aatcttaact tcgacttgaa 1200
agaaataaat gacatttgct ccggctgcag gggacatgac ggcttcactt cgtcctggag 1260
gtctgtagcc gatacgttaa ggcagaaggt ggaggatgct gtgagggagc atcccgacta 1320
tcgcgtggtg tttaccggac atagcttggg tggtgcattg gcaactgttg ccggagcaga 1380
cctgcgtgga aatgggtatg atatcgacgt gttttcatat ggcgcccccc gagtcggaaa 1440
cagggctttt gcagaattcc tgaccgtaca gaccggcgga acactctacc gcattaccca 1500
caccaatgat attgtcccta gactcccgcc gcgcgaattc ggttacagcc attctagccc 1560
agagtactgg atcaaatctg gaacccttgt ccccgtcacc cgaaacgata tcgtgaagat 1620
agaaggcatc gatgccaccg gcggcaataa ccagcctaac attccggata tccctgcgca 1680
cctatggtac ttcgggttaa ttgggacatg tctttagtgg ccggcgcggc tgggtcgact 1740
ctagcgagct cgagatctag agggtgactg acacctggcg gtagacaatc aatccatttc 1800
gctatagtta aaggatgggg atgagggcaa ttggttatat gatcatgtat gtagtgggtg 1860
tgcataatag tagtgaaatg gaagccaagt catgtgattg taatcgaccg acggaattga 1920
ggatatccgg aaatacagac accgtgaaag ccatggtctt tccttcgtgt agaagaccag 1980
acagacagtc cctgatttac ccttgcacaa agcactagaa aattagcatt ccatccttct 2040
ctgcttgctc tgctgatatc actgtcattc aatgcatagc catgagctca tcttagatcc 2100
aagcacgtaa ttccatagcc gaggtccaca gtggagcagc aacattcccc atcattgctt 2160
tccccagggg cctcccaacg actaaatcaa gagtatatct ctaccgtcca atagatcgtc 2220
ttcgcttcaa aatctttgac aattccaaga gggtccccat ccatcaaacc cagttcaata 2280
atagccgaga tgcatggtgg agtcaattag gcagtattgc tggaatgtcg gggccagttg 2340
gccgggtggt cattggccgc ctgtgatgcc atctgccact aaatccgatc attgatccac 2400
cgcccacgag gcgcgtcttt gctttttgcg cggcgtccag gttcaactct ctcttaatta 2460
atgtacatta gtgatacccc actctaagaa aatagaccaa tctccagctg caccttcaga 2520
cactccggta caaattctcg tctatgttgg agattgttgt gactttgaaa catgaccctt 2580
gaccctgatt ttgaatttgt ccatatatcg aggcaggtgt cttattcgta cggagagggt 2640
atctgtcgta gacacatagt agtagtcatt tcgagtgctg aatttataaa tcgcatcata 2700
cttgcgacat actgccataa aaggagtacg tatccaccac tacttattgc gcaccaacac 2760
gcttcaggta tgcatcccat ccctccttct ggtactgctt cgccgcctcc acgggatcag 2820
gagcagcata aattccacgg ccagcaataa taaagtcggc accgcgtcca acagccgact 2880
caggagtttg gtactgctgt cccagcttgt cacccttcga ggagaggttg acacctgtcg 2940
tgaagacgac aaaatcttcc tcctccgaag gcgagctaac ttcagactga acctcgccaa 3000
ggtgacgtgt cgagacgaat cccatcacaa acttcttata cttccgagca tagtcaacag 3060
aagaagtagt atattgaccg gtagccaaag atcccttgga ggtcatctcc gcaaggatca 3120
aaaggcccct ctcggagccg taggggaagt cctcggccga agcagtctgg gccagagcct 3180
cgacgatacc ctcaccgggc agaatactgc agttgatgat gtgggcccac tcagagatac 3240
gcagagtgcc gccatggtac tgcttttgga ctgtgtttcc gatatcgatg aacttgcgat 3300
cttcgaagat gaggaaattg tgcttctctg caagggcctt cagaccggtg atggtttctt 3360
cgctgaaatc ggagaggata tcgatgtgag ttttgatcac ggcaatgtac ggaccgagtc 3420
ctgttatata atccaccatt aaccattact agatcacatg taagtggcat tgaagttcct 3480
atactatttg aagaatagga actcggaata ggaacttcaa cgtacgattt tgacatttgc 3540
tccattgtcg aggatggatg gaacgagcgg cgtgcgccac gaaagtgagg ctattgccta 3600
tcagctcttt gctacattcc ggaaacaaac atcccttttt gtgaattatc tacgcaactt 3660
agatggcgtg aacgcatctt caaagtcttt cggcaggtcc ggcacgactt ttgcatccag 3720
agaagcgcct acatgtgtat tcgaccacct cctagcgcgc ttggatatga ggaaatatta 3780
ctgagagtcg aaaacaagct ccaccgcacc agctcttctt ggagttttat attaaagaat 3840
attcccagct cgttgtatta ttctttttct accgtgctaa tgtatcaagg actttggtac 3900
ctattaacgt tattattcgt gtgctattcc caaacataac cctgtatatg tttcgaacgc 3960
cgttatgacc catgtcttac atactcatta agtcattccc ttggataatc tcgactcaga 4020
tgcggcggtt gatgtaggag gagaggtaat cgaggacctc ctgggagatg atgccgttcc 4080
aggcggggta gcggatggag ccctcggcgg agcccttgag ctgctcgata tgctgccact 4140
cctcgatggg gttggtctca tccttgaggg cgatcatctc cttggagatg ggatcgtagg 4200
cgtagtagcg ggagactagt gcgaagtaat gatcggggat ggcggtgatc tgatgggtgt 4260
aggtggtgcg ggcgacggcg gaggcgcgct tatcggacca gttgccgacg acgttggtga 4320
gctcggtgag gcccttcatg gagaggaagg aggtcatgag atggcggccg atatgggact 4380
tggggccgtt cttgatggcg aagatggagt agggggcgtt cttcttgagg gccttgttgt 4440
aggagcggac gaggttatcc ttgaggagct ggtactcctg cttgttggag gaggagttgc 4500
cggtgcggtt gacgcgcttg aggacgggct cggagttgcg gaggaactca tcgaggtaga 4560
cgaggggatc gatgcggccg cgggcggaga agaagtagat atggcgggag acggaggtct 4620
tggtctcggt gacgaggcac tggatgatga cgccgaggta cttgttctgg acgagcttga 4680
aggacttggg atcgacgttc ttgatatcgg agaagcggcc gcagttgatg aaggtggcga 4740
ggaagaggaa ctggtagagg gtcttggtct tggtgaagcg ggaggtgtac tcgaaggagt 4800
tgaggatctt ctcggtgatc tcccagatgg actcgccctc ggagaggagg gccttgagca 4860
tcttcttgga atgggagttg cccttatcgg cctcctcgga ggactcgaac tggagctgga 4920
gggaggagac gatatcggtg atatcggact gatgcttctg gccgtagtag gggatgatgg 4980
tgaactccca ggcggggatg agcttcttga gggaggcctc caggatggtg gccttctggg 5040
tcttgtactt gaactggagg gacttgttga cgatatcgaa ggagagggag ttggagatga 5100
tggtgttgta ggacatgaag gtggcgcgct tgatggcggt gccgttatgg gtgatcatcc 5160
agcagaggta ggtgagctcg gcggcgcaga gggcgatctt ctcgccggag gggcgctcga 5220
agcgctcgac gaactggcgg acgaggacct tggggggggt cttgcagagg atatcgaact 5280
ggggcatggt gctcagatac tacggctgat cgcgtagagg tactgagcaa aacagatgtc 5340
agtaaggaga agagttgaat gaatggaaga agagtaggaa aggaggtatg ggggaaagat 5400
atacgtactg atgcggacga agagagaaag aaggaaaaaa gttgtgggag gggaaggagg 5460
gggaatcctt atatggaggg gcaagcgaga aggcgaatta gtgggcgggc ttaagccctc 5520
gaccgccgcc cttatcattg gacatggagg ggtaatgccc ccaccacgca tgtgcgggac 5580
cgacgcagaa tctgcacggc ggagtctctt ccagactgtt gacttttggg cgatgactct 5640
tgttgctgcg gccttttggg tacaccaacc tcgttgatct tgtttccttg gttctctttc 5700
gctcggagac ccgaccatga ccccaccatc agtcactatc ctgcctcgtc gataaaaatt 5760
ttttcttccc tctgattgtt acatagtatg tttccacctt tccggtggat ttcggacagt 5820
caaactgggc atcaacgcag tggtgggctg cttcgtttgc tgcgtgttgt acttgtttgc 5880
atttgaaccc cgcggtcgtt cgagtcctta attggtccgc tcccggtcaa cacccaagca 5940
gctgtggccc ggccgagtgg cgcctgtctg gtccacagta agcttggcgt aatcatggtc 6000
atagctgttt cctgtgtgaa attgttatcc gctcacaatt ccacacaaca tacgagccgg 6060
aagcataaag tgtaaagcct ggggtgccta atgagtgagc taactcacat taattgcgtt 6120
gcgctcactg cccgctttcc agtcgggaaa cctgtcgtgc cagctgcatt aatgaatcgg 6180
ccaacgcgcg gggagaggcg gtttgcgtat tgggcgctct tccgcttcct cgctcactga 6240
ctcgctgcgc tcggtcgttc ggctgcggcg agcggtatca gctcactcaa aggcggtaat 6300
acggttatcc acagaatcag gggataacgc aggaaagaac atgtgagcaa aaggccagca 6360
aaaggccagg aaccgtaaaa aggccgcgtt gctggcgttt ttccataggc tccgcccccc 6420
tgacgagcat cacaaaaatc gacgctcaag tcagaggtgg cgaaacccga caggactata 6480
aagataccag gcgtttcccc ctggaagctc cctcgtgcgc tctcctgttc cgaccctgcc 6540
gcttaccgga tacctgtccg cctttttccc ttcgggaagc gtggcgcttt ctcatagctc 6600
acgctgtagg tatctcagtt cggtgtaggt cgttcgctcc aagctgggct gtgtgcacga 6660
accccccgtt cagcccgacc gctgcgcctt atccggtaac tatcgtcttg agtccaaccc 6720
ggtaagacac gacttatcgc cactggcagc agccactggt aacaggatta gcagagcgag 6780
gtatgtaggc ggtgctacag agttcttgaa gtggtggcct aactacggct acactagaag 6840
aacagtattt ggtatctgcg ctctgctgaa gccagttacc ttcggaaaaa gagttggtag 6900
ctcttgatcc ggcaaacaaa ccaccgctgg tagcggtggt ttttttgttt gcaagcagca 6960
gattacgcgc agaaaaaaag gatctcaaga agatcctttg atcttttcta cggggtctga 7020
cgctcagtgg aacgaaaact cacgttaagg gattttggtc atgagattat caaaaaggat 7080
cttcacctag atccttttaa attaaaaatg aagttttaaa tcaatctaaa gtatatatga 7140
gtaaacttgg tctgacagtt accaatgctt aatcagtgag gcacctatct cagcgatctg 7200
tctatttcgt tcatccatag ttgcctgact ccccgtcgtg tagataacta cgatacggga 7260
gggcttacca tctggcccca gtgctgcaat gataccgcga gacccacgct caccggctcc 7320
agatttatca gcaataaacc agccagccgg aagggccgag cgcagaagtg gtcctgcaac 7380
tttatccgcc tccatccagt ctattaattg ttgccgggaa gctagagtaa gtagttcgcc 7440
agttaatagt ttgcgcaacg ttgttgccat tgctacaggc atcgtggtgt cacgctcgtc 7500
gtttggtatg gcttcattca gctccggttc ccaacgatca aggcgagtta catgatcccc 7560
catgttgtgc aaaaaagcgg ttagctcctt cggtcctccg atcgttgtca gaagtaagtt 7620
ggccgcagtg ttatcactca tggttatggc agcactgcat aattctctta ctgtcatgcc 7680
atccgtaaga tgcttttctg tgactggtga gtactcaacc aagtcattct gagaatagtg 7740
tatgcggcga ccgagttgct cttgcccggc gtcaatacgg gataataccg cgccacatag 7800
cagaacttta aaagtgctca tcattggaaa acgttcttcg gggcgaaaac tctcaaggat 7860
cttaccgctg ttgagatcca gttcgatgta acccactcgt gcacccaact gatcttcagc 7920
atcttttact ttcaccagcg tttctgggtg agcaaaaaca ggaaggcaaa atgccgcaaa 7980
aaagggaata agggcgacac ggaaatgttg aatactcata ctcttccttt ttcaatatta 8040
ttgaagcatt tatcagggtt attgtctcat gagcggatac atatttgaat gtatttagaa 8100
aaataaacaa ataggggttc cgcgcacatt tccccgaaaa gtgccacctg acgtctaaga 8160
aaccattatt atcatgacat taacctataa aaataggcgt atcacgaggc cctttcgtct 8220
cgcgcgtttc ggtgatgacg gtgaaaacct ctgacacatg cagctcccgg agacggtcac 8280
agcttgtctg taagcggatg ccgggagcag acaagcccgt cagggcgcgt cagcgggtgt 8340
tggcgggtgt cggggctggc ttaactatgc ggcatcagag cagattgtac tgagagtgca 8400
ccatatgcgg tgtgaaatac cgcacagatg cgtaaggaga aaataccgca tcaggcgcca 8460
ttcgccattc aggctgcgca actgttggga agggcgatcg gtgcgggcct cttcgctatt 8520
acgccagctg gcgaaagggg gatgtgctgc aaggcgatta agttgggtaa cgccagggtt 8580
ttcccagtca cgacgttgta aaacgacggc cagt 8614
<210> 3
<211> 8712
<212> DNA
<213> 人工序列
<220>
<223> 质粒pBac7000
<220>
<221> 尚未归类的重组事件
<222> (19)..(67)
<223> FRT-F
<220>
<221> 尚未归类的结合
<222> (91)..(104)
<223> amyR
<220>
<221> 尚未归类的结合
<222> (112)..(125)
<223> amyR
<220>
<221> 尚未归类的结合
<222> (133)..(146)
<223> amyR
<220>
<221> 尚未归类的结合
<222> (153)..(166)
<223> amyR
<220>
<221> 尚未归类的结合
<222> (174)..(187)
<223> amyR
<220>
<221> 尚未归类的结合
<222> (195)..(208)
<223> amyR
<220>
<221> 启动子
<222> (219)..(832)
<223> 体内启动子
<220>
<221> 尚未归类的结合
<222> (347)..(360)
<223> amyR
<220>
<221> 尚未归类的结合
<222> (568)..(581)
<223> amyR
<220>
<221> 尚未归类的结合
<222> (619)..(632)
<223> amyR
<220>
<221> 尚未归类的结合
<222> (640)..(653)
<223> amyR
<220>
<221> misc_RNA
<222> (767)..(860)
<223> 5’非翻译区
<220>
<221> CDS
<222> (845)..(913)
<223> 信号肽
<220>
<221> 内含子
<222> (914)..(1029)
<223> 具有T7启动子的内含子
<220>
<221> 启动子
<222> (949)..(1021)
<223> 具有Shine-Dalgarno序列的T7启动子
<220>
<221> RBS
<222> (1016)..(1021)
<223> Shine-Dalgarno序列
<220>
<221> CDS
<222> (1030)..(1845)
<223> 脂肪酶成熟肽编码区
<220>
<221> 终止子
<222> (1861)..(2551)
<220>
<221> 尚未归类的重组事件
<222> (3569)..(3618)
<223> 互补链上的RT-F3
<400> 3
gaattcgagc tcggtacctt gaagttccta ttccgagttc ctattctcta gaaagtatag 60
gaacttcagt acccgggtat aagctagctt ccgttaaatt gccgtcgtca gccgttaaat 120
taccgattaa tcccgataaa tttccgagat ctccgttaaa ttgccgttcg cagccgttaa 180
attaccgggg acgaccgata aatttccgcg atgaattcat ggtgttttga tcattttaaa 240
tttttatatg gcgggtggtg ggcaactcgc ttgcgcgggc aactcgctta ccgattacgt 300
tagggctgat atttacgtaa aaatcgtcaa gggatgcaag accaaaccgt taaatttccg 360
gagtcaacag catccaagcc caagtccttc acggagaaac cccagcgtcc acatcacgag 420
cgaaggacca cctctaggca tcggacgcac catccaatta gaagcagcaa agcgaaacag 480
cccaagaaaa aggtcggccc gtcggccttt tctgcaacgc tgatcacggg cagcgatcca 540
accaacaccc tccagagtga ctaggggcgg aaatttatcg ggattaattt ccactcaacc 600
acaaatcaca gtcgtccccg gtaatttaac ggctgcagac ggcaatttaa cggcttctgc 660
gaatcgcttg gattccccgc ccctggccgt agagcttaaa gtatgtccct tgtcgatgcg 720
atgtatcaca acatataaat actggcaagg gatgccatgc ttggagtttc caactcaatt 780
tacctctatc cacacttctc ttccttcctc aatcctctat atacacaact ggggatccac 840
catg atg agg agc tcc ctt gtg ctg ttc ttt gtc tct gcg tgg acg gcc 889
Met Arg Ser Ser Leu Val Leu Phe Phe Val Ser Ala Trp Thr Ala
1 5 10 15
ttg gcc agt cct att cgt cga gag gtatgtacac cacccccttg cgtctgatct 943
Leu Ala Ser Pro Ile Arg Arg Glu
20
gtgactaata cgactcacta tagggagacc acaacggttt ccctctagaa ataattttgt 1003
ttaactttaa gaaggagaag ctgact atg gag gtc tcg cag gat ctg ttt aac 1056
Met Glu Val Ser Gln Asp Leu Phe Asn
25 30
cag ttc aat ctc ttt gca cag tat tct gca gcc gca tac tgc gga aaa 1104
Gln Phe Asn Leu Phe Ala Gln Tyr Ser Ala Ala Ala Tyr Cys Gly Lys
35 40 45
aac aat gat gcc cca gct ggt aca aac att acg tgc acg gga aat gcc 1152
Asn Asn Asp Ala Pro Ala Gly Thr Asn Ile Thr Cys Thr Gly Asn Ala
50 55 60
tgc ccc gag gta gag aag gcg gat gca acg ttt ctc tac tcg ttt gaa 1200
Cys Pro Glu Val Glu Lys Ala Asp Ala Thr Phe Leu Tyr Ser Phe Glu
65 70 75 80
gac tct gga gtg ggc gat gtc acc ggc ttc ctt gct ctc gac aac acg 1248
Asp Ser Gly Val Gly Asp Val Thr Gly Phe Leu Ala Leu Asp Asn Thr
85 90 95
aac aaa ttg atc gtc ctc tct ttc cgt ggc tct cgt tcc ata gag aac 1296
Asn Lys Leu Ile Val Leu Ser Phe Arg Gly Ser Arg Ser Ile Glu Asn
100 105 110
tgg atc ggg aat ctt aac ttc gac ttg aaa gaa ata aat gac att tgc 1344
Trp Ile Gly Asn Leu Asn Phe Asp Leu Lys Glu Ile Asn Asp Ile Cys
115 120 125
tcc ggc tgc agg gga cat gac ggc ttc act tcg tcc tgg agg tct gta 1392
Ser Gly Cys Arg Gly His Asp Gly Phe Thr Ser Ser Trp Arg Ser Val
130 135 140
gcc gat acg tta agg cag aag gtg gag gat gct gtg agg gag cat ccc 1440
Ala Asp Thr Leu Arg Gln Lys Val Glu Asp Ala Val Arg Glu His Pro
145 150 155 160
gac tat cgc gtg gtg ttt acc gga cat agc ttg ggt ggt gca ttg gca 1488
Asp Tyr Arg Val Val Phe Thr Gly His Ser Leu Gly Gly Ala Leu Ala
165 170 175
act gtt gcc gga gca gac ctg cgt gga aat ggg tat gat atc gac gtg 1536
Thr Val Ala Gly Ala Asp Leu Arg Gly Asn Gly Tyr Asp Ile Asp Val
180 185 190
ttt tca tat ggc gcc ccc cga gtc gga aac agg gct ttt gca gaa ttc 1584
Phe Ser Tyr Gly Ala Pro Arg Val Gly Asn Arg Ala Phe Ala Glu Phe
195 200 205
ctg acc gta cag acc ggc gga aca ctc tac cgc att acc cac acc aat 1632
Leu Thr Val Gln Thr Gly Gly Thr Leu Tyr Arg Ile Thr His Thr Asn
210 215 220
gat att gtc cct aga ctc ccg ccg cgc gaa ttc ggt tac agc cat tct 1680
Asp Ile Val Pro Arg Leu Pro Pro Arg Glu Phe Gly Tyr Ser His Ser
225 230 235 240
agc cca gag tac tgg atc aaa tct gga acc ctt gtc ccc gtc acc cga 1728
Ser Pro Glu Tyr Trp Ile Lys Ser Gly Thr Leu Val Pro Val Thr Arg
245 250 255
aac gat atc gtg aag ata gaa ggc atc gat gcc acc ggc ggc aat aac 1776
Asn Asp Ile Val Lys Ile Glu Gly Ile Asp Ala Thr Gly Gly Asn Asn
260 265 270
cag cct aac att ccg gat atc cct gcg cac cta tgg tac ttc ggg tta 1824
Gln Pro Asn Ile Pro Asp Ile Pro Ala His Leu Trp Tyr Phe Gly Leu
275 280 285
att ggg aca tgt ctt tag tag tctcgagatc tagagggtga ctgacacctg 1875
Ile Gly Thr Cys Leu
290
gcggtagaca atcaatccat ttcgctatag ttaaaggatg gggatgaggg caattggtta 1935
tatgatcatg tatgtagtgg gtgtgcataa tagtagtgaa atggaagcca agtcatgtga 1995
ttgtaatcga ccgacggaat tgaggatatc cggaaataca gacaccgtga aagccatggt 2055
ctttccttcg tgtagaagac cagacagaca gtccctgatt tacccttgca caaagcacta 2115
gaaaattagc attccatcct tctctgcttg ctctgctgat atcactgtca ttcaatgcat 2175
agccatgagc tcatcttaga tccaagcacg taattccata gccgaggtcc acagtggagc 2235
agcaacattc cccatcattg ctttccccag gggcctccca acgactaaat caagagtata 2295
tctctaccgt ccaatagatc gtcttcgctt caaaatcttt gacaattcca agagggtccc 2355
catccatcaa acccagttca ataatagccg agatgcatgg tggagtcaat taggcagtat 2415
tgctggaatg tcggggccag ttggccgggt ggtcattggc cgcctgtgat gccatctgcc 2475
actaaatccg atcattgatc caccgcccac gaggcgcgtc tttgcttttt gcgcggcgtc 2535
caggttcaac tctctcttaa ttaatgtaca ttagtgatac cccactctaa gaaaatagac 2595
caatctccag ctgcaccttc agacactccg gtacaaattc tcgtctatgt tggagattgt 2655
tgtgactttg aaacatgacc cttgaccctg attttgaatt tgtccatata tcgaggcagg 2715
tgtcttattc gtacggagag ggtatctgtc gtagacacat agtagtagtc atttcgagtg 2775
ctgaatttat aaatcgcatc atacttgcga catactgcca taaaaggagt acgtatccac 2835
cactacttat tgcgcaccaa cacgcttcag gtatgcatcc catccctcct tctggtactg 2895
cttcgccgcc tccacgggat caggagcagc ataaattcca cggccagcaa taataaagtc 2955
ggcaccgcgt ccaacagccg actcaggagt ttggtactgc tgtcccagct tgtcaccctt 3015
cgaggagagg ttgacacctg tcgtgaagac gacaaaatct tcctcctccg aaggcgagct 3075
aacttcagac tgaacctcgc caaggtgacg tgtcgagacg aatcccatca caaacttctt 3135
atacttccga gcatagtcaa cagaagaagt agtatattga ccggtagcca aagatccctt 3195
ggaggtcatc tccgcaagga tcaaaaggcc cctctcggag ccgtagggga agtcctcggc 3255
cgaagcagtc tgggccagag cctcgacgat accctcaccg ggcagaatac tgcagttgat 3315
gatgtgggcc cactcagaga tacgcagagt gccgccatgg tactgctttt ggactgtgtt 3375
tccgatatcg atgaacttgc gatcttcgaa gatgaggaaa ttgtgcttct ctgcaagggc 3435
cttcagaccg gtgatggttt cttcgctgaa atcggagagg atatcgatgt gagttttgat 3495
cacggcaatg tacggaccga gtcctgttat ataatccacc attaaccatt actagatcac 3555
atgtaagtgg cattgaagtt cctatactat ttgaagaata ggaactcgga ataggaactt 3615
caacgtacga ttttgacatt tgctccattg tcgaggatgg atggaacgag cggcgtgcgc 3675
cacgaaagtg aggctattgc ctatcagctc tttgctacat tccggaaaca aacatccctt 3735
tttgtgaatt atctacgcaa cttagatggc gtgaacgcat cttcaaagtc tttcggcagg 3795
tccggcacga cttttgcatc cagagaagcg cctacatgtg tattcgacca cctcctagcg 3855
cgcttggata tgaggaaata ttactgagag tcgaaaacaa gctccaccgc accagctctt 3915
cttggagttt tatattaaag aatattccca gctcgttgta ttattctttt tctaccgtgc 3975
taatgtatca aggactttgg tacctattaa cgttattatt cgtgtgctat tcccaaacat 4035
aaccctgtat atgtttcgaa cgccgttatg acccatgtct tacatactca ttaagtcatt 4095
cccttggata atctcgactc agatgcggcg gttgatgtag gaggagaggt aatcgaggac 4155
ctcctgggag atgatgccgt tccaggcggg gtagcggatg gagccctcgg cggagccctt 4215
gagctgctcg atatgctgcc actcctcgat ggggttggtc tcatccttga gggcgatcat 4275
ctccttggag atgggatcgt aggcgtagta gcgggagact agtgcgaagt aatgatcggg 4335
gatggcggtg atctgatggg tgtaggtggt gcgggcgacg gcggaggcgc gcttatcgga 4395
ccagttgccg acgacgttgg tgagctcggt gaggcccttc atggagagga aggaggtcat 4455
gagatggcgg ccgatatggg acttggggcc gttcttgatg gcgaagatgg agtagggggc 4515
gttcttcttg agggccttgt tgtaggagcg gacgaggtta tccttgagga gctggtactc 4575
ctgcttgttg gaggaggagt tgccggtgcg gttgacgcgc ttgaggacgg gctcggagtt 4635
gcggaggaac tcatcgaggt agacgagggg atcgatgcgg ccgcgggcgg agaagaagta 4695
gatatggcgg gagacggagg tcttggtctc ggtgacgagg cactggatga tgacgccgag 4755
gtacttgttc tggacgagct tgaaggactt gggatcgacg ttcttgatat cggagaagcg 4815
gccgcagttg atgaaggtgg cgaggaagag gaactggtag agggtcttgg tcttggtgaa 4875
gcgggaggtg tactcgaagg agttgaggat cttctcggtg atctcccaga tggactcgcc 4935
ctcggagagg agggccttga gcatcttctt ggaatgggag ttgcccttat cggcctcctc 4995
ggaggactcg aactggagct ggagggagga gacgatatcg gtgatatcgg actgatgctt 5055
ctggccgtag taggggatga tggtgaactc ccaggcgggg atgagcttct tgagggaggc 5115
ctccaggatg gtggccttct gggtcttgta cttgaactgg agggacttgt tgacgatatc 5175
gaaggagagg gagttggaga tgatggtgtt gtaggacatg aaggtggcgc gcttgatggc 5235
ggtgccgtta tgggtgatca tccagcagag gtaggtgagc tcggcggcgc agagggcgat 5295
cttctcgccg gaggggcgct cgaagcgctc gacgaactgg cggacgagga ccttgggggg 5355
ggtcttgcag aggatatcga actggggcat ggtgctcaga tactacggct gatcgcgtag 5415
aggtactgag caaaacagat gtcagtaagg agaagagttg aatgaatgga agaagagtag 5475
gaaaggaggt atgggggaaa gatatacgta ctgatgcgga cgaagagaga aagaaggaaa 5535
aaagttgtgg gaggggaagg agggggaatc cttatatgga ggggcaagcg agaaggcgaa 5595
ttagtgggcg ggcttaagcc ctcgaccgcc gcccttatca ttggacatgg aggggtaatg 5655
cccccaccac gcatgtgcgg gaccgacgca gaatctgcac ggcggagtct cttccagact 5715
gttgactttt gggcgatgac tcttgttgct gcggcctttt gggtacacca acctcgttga 5775
tcttgtttcc ttggttctct ttcgctcgga gacccgacca tgaccccacc atcagtcact 5835
atcctgcctc gtcgataaaa attttttctt ccctctgatt gttacatagt atgtttccac 5895
ctttccggtg gatttcggac agtcaaactg ggcatcaacg cagtggtggg ctgcttcgtt 5955
tgctgcgtgt tgtacttgtt tgcatttgaa ccccgcggtc gttcgagtcc ttaattggtc 6015
cgctcccggt caacacccaa gcagctgtgg cccggccgag tggcgcctgt ctggtccaca 6075
gtaagcttgg cgtaatcatg gtcatagctg tttcctgtgt gaaattgtta tccgctcaca 6135
attccacaca acatacgagc cggaagcata aagtgtaaag cctggggtgc ctaatgagtg 6195
agctaactca cattaattgc gttgcgctca ctgcccgctt tccagtcggg aaacctgtcg 6255
tgccagctgc attaatgaat cggccaacgc gcggggagag gcggtttgcg tattgggcgc 6315
tcttccgctt cctcgctcac tgactcgctg cgctcggtcg ttcggctgcg gcgagcggta 6375
tcagctcact caaaggcggt aatacggtta tccacagaat caggggataa cgcaggaaag 6435
aacatgtgag caaaaggcca gcaaaaggcc aggaaccgta aaaaggccgc gttgctggcg 6495
tttttccata ggctccgccc ccctgacgag catcacaaaa atcgacgctc aagtcagagg 6555
tggcgaaacc cgacaggact ataaagatac caggcgtttc cccctggaag ctccctcgtg 6615
cgctctcctg ttccgaccct gccgcttacc ggatacctgt ccgccttttt cccttcggga 6675
agcgtggcgc tttctcatag ctcacgctgt aggtatctca gttcggtgta ggtcgttcgc 6735
tccaagctgg gctgtgtgca cgaacccccc gttcagcccg accgctgcgc cttatccggt 6795
aactatcgtc ttgagtccaa cccggtaaga cacgacttat cgccactggc agcagccact 6855
ggtaacagga ttagcagagc gaggtatgta ggcggtgcta cagagttctt gaagtggtgg 6915
cctaactacg gctacactag aagaacagta tttggtatct gcgctctgct gaagccagtt 6975
accttcggaa aaagagttgg tagctcttga tccggcaaac aaaccaccgc tggtagcggt 7035
ggtttttttg tttgcaagca gcagattacg cgcagaaaaa aaggatctca agaagatcct 7095
ttgatctttt ctacggggtc tgacgctcag tggaacgaaa actcacgtta agggattttg 7155
gtcatgagat tatcaaaaag gatcttcacc tagatccttt taaattaaaa atgaagtttt 7215
aaatcaatct aaagtatata tgagtaaact tggtctgaca gttaccaatg cttaatcagt 7275
gaggcaccta tctcagcgat ctgtctattt cgttcatcca tagttgcctg actccccgtc 7335
gtgtagataa ctacgatacg ggagggctta ccatctggcc ccagtgctgc aatgataccg 7395
cgagacccac gctcaccggc tccagattta tcagcaataa accagccagc cggaagggcc 7455
gagcgcagaa gtggtcctgc aactttatcc gcctccatcc agtctattaa ttgttgccgg 7515
gaagctagag taagtagttc gccagttaat agtttgcgca acgttgttgc cattgctaca 7575
ggcatcgtgg tgtcacgctc gtcgtttggt atggcttcat tcagctccgg ttcccaacga 7635
tcaaggcgag ttacatgatc ccccatgttg tgcaaaaaag cggttagctc cttcggtcct 7695
ccgatcgttg tcagaagtaa gttggccgca gtgttatcac tcatggttat ggcagcactg 7755
cataattctc ttactgtcat gccatccgta agatgctttt ctgtgactgg tgagtactca 7815
accaagtcat tctgagaata gtgtatgcgg cgaccgagtt gctcttgccc ggcgtcaata 7875
cgggataata ccgcgccaca tagcagaact ttaaaagtgc tcatcattgg aaaacgttct 7935
tcggggcgaa aactctcaag gatcttaccg ctgttgagat ccagttcgat gtaacccact 7995
cgtgcaccca actgatcttc agcatctttt actttcacca gcgtttctgg gtgagcaaaa 8055
acaggaaggc aaaatgccgc aaaaaaggga ataagggcga cacggaaatg ttgaatactc 8115
atactcttcc tttttcaata ttattgaagc atttatcagg gttattgtct catgagcgga 8175
tacatatttg aatgtattta gaaaaataaa caaatagggg ttccgcgcac atttccccga 8235
aaagtgccac ctgacgtcta agaaaccatt attatcatga cattaaccta taaaaatagg 8295
cgtatcacga ggccctttcg tctcgcgcgt ttcggtgatg acggtgaaaa cctctgacac 8355
atgcagctcc cggagacggt cacagcttgt ctgtaagcgg atgccgggag cagacaagcc 8415
cgtcagggcg cgtcagcggg tgttggcggg tgtcggggct ggcttaacta tgcggcatca 8475
gagcagattg tactgagagt gcaccatatg cggtgtgaaa taccgcacag atgcgtaagg 8535
agaaaatacc gcatcaggcg ccattcgcca ttcaggctgc gcaactgttg ggaagggcga 8595
tcggtgcggg cctcttcgct attacgccag ctggcgaaag ggggatgtgc tgcaaggcga 8655
ttaagttggg taacgccagg gttttcccag tcacgacgtt gtaaaacgac ggccagt 8712
<210> 4
<211> 23
<212> PRT
<213> 人工序列
<220>
<223> 合成构建体
<400> 4
Met Arg Ser Ser Leu Val Leu Phe Phe Val Ser Ala Trp Thr Ala Leu
1 5 10 15
Ala Ser Pro Ile Arg Arg Glu
20
<210> 5
<211> 270
<212> PRT
<213> 人工序列
<220>
<223> 合成构建体
<400> 5
Met Glu Val Ser Gln Asp Leu Phe Asn Gln Phe Asn Leu Phe Ala Gln
1 5 10 15
Tyr Ser Ala Ala Ala Tyr Cys Gly Lys Asn Asn Asp Ala Pro Ala Gly
20 25 30
Thr Asn Ile Thr Cys Thr Gly Asn Ala Cys Pro Glu Val Glu Lys Ala
35 40 45
Asp Ala Thr Phe Leu Tyr Ser Phe Glu Asp Ser Gly Val Gly Asp Val
50 55 60
Thr Gly Phe Leu Ala Leu Asp Asn Thr Asn Lys Leu Ile Val Leu Ser
65 70 75 80
Phe Arg Gly Ser Arg Ser Ile Glu Asn Trp Ile Gly Asn Leu Asn Phe
85 90 95
Asp Leu Lys Glu Ile Asn Asp Ile Cys Ser Gly Cys Arg Gly His Asp
100 105 110
Gly Phe Thr Ser Ser Trp Arg Ser Val Ala Asp Thr Leu Arg Gln Lys
115 120 125
Val Glu Asp Ala Val Arg Glu His Pro Asp Tyr Arg Val Val Phe Thr
130 135 140
Gly His Ser Leu Gly Gly Ala Leu Ala Thr Val Ala Gly Ala Asp Leu
145 150 155 160
Arg Gly Asn Gly Tyr Asp Ile Asp Val Phe Ser Tyr Gly Ala Pro Arg
165 170 175
Val Gly Asn Arg Ala Phe Ala Glu Phe Leu Thr Val Gln Thr Gly Gly
180 185 190
Thr Leu Tyr Arg Ile Thr His Thr Asn Asp Ile Val Pro Arg Leu Pro
195 200 205
Pro Arg Glu Phe Gly Tyr Ser His Ser Ser Pro Glu Tyr Trp Ile Lys
210 215 220
Ser Gly Thr Leu Val Pro Val Thr Arg Asn Asp Ile Val Lys Ile Glu
225 230 235 240
Gly Ile Asp Ala Thr Gly Gly Asn Asn Gln Pro Asn Ile Pro Asp Ile
245 250 255
Pro Ala His Leu Trp Tyr Phe Gly Leu Ile Gly Thr Cys Leu
260 265 270

Claims (13)

1.一种分离的多核苷酸构建体,其以5’至3’的顺序包含以下元件:
(a)在能够加工内含子的微生物宿主细胞中具有启动子活性的第一多核苷酸,其中该第一多核苷酸与信号肽编码多核苷酸可操作地连接;
(b)包含在体外转录/翻译(IVTT)系统中具有启动子活性的第二多核苷酸的内含子;和
(c)编码与(a)和(b)的第一和第二多核苷酸可操作地连接的感兴趣的多肽的第三多核苷酸;
由此第一多核苷酸确保与感兴趣的多肽处于翻译融合的信号肽在微生物宿主细胞中的表达;和
由此第二多核苷酸确保在IVTT系统中没有信号肽的感兴趣的多肽的表达。
2.如权利要求1所述的多核苷酸构建体,其中第一多核苷酸在细菌宿主细胞中具有启动子活性;优选地在原核生物宿主细胞中;更优选地在芽孢杆菌(Bacillus)宿主细胞中;最优选地在枯草芽孢杆菌(Bacillus subtilis)或地衣芽孢杆菌(Bacilluslicheniformis)细胞中具有启动子活性。
3.如权利要求1所述的多核苷酸构建体,其中第一多核苷酸在真菌宿主细胞中具有启动子活性;优选地在丝状真菌宿主细胞中,更优选地在曲霉属(Aspergillus)或木霉属(Trichoderma)宿主细胞中;最优选地在米曲霉(Aspergillus oryzae)、黑曲霉(Aspergillus niger)或里氏木霉(Trichoderma reesei)细胞中具有启动子活性。
4.如权利要求1所述的多核苷酸构建体,其中第一多核苷酸在真菌宿主细胞中具有启动子活性并且包含源自曲霉属或木霉属细胞的启动子或由其组成;更优选地,第一多核苷酸包含源自米曲霉、黑曲霉或里氏木霉细胞的启动子或由其组成;甚至更优选地,第一多核苷酸包含米曲霉、黑曲霉或里氏木霉细胞的真菌丙糖-磷酸盐异构酶启动子或由其组成;最优选地,第一多核苷酸包含SEQ ID NO:3的位置219-位置838中所示的启动子或由其组成。
5.如权利要求1-4中任一项所述的多核苷酸构建体,其中所述信号肽源自细菌信号肽;优选地,所述信号肽源自原核细胞;更优选地,所述信号肽源自芽孢杆菌细胞。
6.如权利要求1至4中任一项所述的多核苷酸构建体,其中所述信号肽源自真菌细胞;优选地,所述信号肽源自丝状真菌细胞;甚至更优选地,所述信号肽源自曲霉属或木霉属细胞;最优选地,所述信号肽源自米曲霉、黑曲霉或里氏木霉细胞。
7.如权利要求1-6中任一项所述的多核苷酸构建体,其中第二多核苷酸包含细菌启动子或由其组成,优选地第二多核苷酸包含来自噬菌体的启动子或由其组成,最优选地第二多核苷酸包含SEQ ID NO:3的位置949-位置1021所示的T7启动子或由其组成。
8.如权利要求1-7中任一项所述的多核苷酸构建体,其中第三多核苷酸编码酶;优选地是水解酶、异构酶、连接酶、裂解酶、氧化还原酶或转移酶;甚至更优选地是α-半乳糖苷酶、α-葡糖苷酶、氨肽酶、淀粉酶、β-半乳糖苷酶、β-葡糖苷酶、β-木糖苷酶、糖酶、羧肽酶、过氧化氢酶、纤维二糖水解酶、纤维素酶、壳多糖酶、角质酶、环糊精糖基转移酶、脱氧核糖核酸酶、内切葡聚糖酶、酯酶、葡糖淀粉酶、转化酶、漆酶、脂肪酶、甘露糖苷酶、变聚糖酶、氧化酶、果胶分解酶、过氧化物酶、植酸酶、多酚氧化酶、蛋白水解酶、核糖核酸酶、转谷氨酰胺酶、或木聚糖酶。
9.如权利要求8所述的多核苷酸构建体,其中所述第三多核苷酸编码酶的成熟形式。
10.一种微生物宿主细胞,其包含如权利要求1-9中任一项所定义的多核苷酸构建体。
11.如权利要求10所述的微生物宿主细胞,其是细菌宿主细胞;优选地是原核生物宿主细胞;更优选地是芽孢杆菌宿主细胞;最优选地是枯草芽孢杆菌或地衣芽孢杆菌细胞。
12.如权利要求10所述的微生物宿主细胞,其是真菌宿主细胞;优选地是丝状真菌宿主细胞,更优选地是曲霉属或木霉属宿主细胞;最优选地是米曲霉、黑曲霉或里氏木霉细胞。
13.生产感兴趣的多肽的方法,所述方法包含如下步骤:
c)培养如权利要求10-13中任一项所定义的微生物宿主细胞;并且,可任选地
d)回收该感兴趣的多肽。
CN201680055929.1A 2015-10-30 2016-10-28 用于体外和体内表达的多核苷酸构建体 Pending CN108138188A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201562248553P 2015-10-30 2015-10-30
US62/248,553 2015-10-30
PCT/US2016/059427 WO2017075426A1 (en) 2015-10-30 2016-10-28 Polynucleotide constructs for in vitro and in vivo expression

Publications (1)

Publication Number Publication Date
CN108138188A true CN108138188A (zh) 2018-06-08

Family

ID=57406329

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201680055929.1A Pending CN108138188A (zh) 2015-10-30 2016-10-28 用于体外和体内表达的多核苷酸构建体

Country Status (4)

Country Link
US (1) US20190078097A1 (zh)
EP (1) EP3368674A1 (zh)
CN (1) CN108138188A (zh)
WO (1) WO2017075426A1 (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112585267A (zh) * 2018-08-02 2021-03-30 诺维信公司 使用内含子制备dna构建体的组合文库

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20230193337A1 (en) * 2017-10-19 2023-06-22 Synvitrobio, Inc. Anaerobic Cell-Free Systems and Environments and Methods for Making and Using Same

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2003031630A1 (en) * 2001-10-12 2003-04-17 Keryos Spa Multi-cistronic vectors for gene transfer protocols
WO2004043335A2 (en) * 2001-09-13 2004-05-27 Genesoft, Inc. Methods of treating infection by drug resistant bacteria

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DK122686D0 (da) 1986-03-17 1986-03-17 Novo Industri As Fremstilling af proteiner
US5989870A (en) 1986-04-30 1999-11-23 Rohm Enzyme Finland Oy Method for cloning active promoters
FR2704860B1 (fr) 1993-05-05 1995-07-13 Pasteur Institut Sequences de nucleotides du locus cryiiia pour le controle de l'expression de sequences d'adn dans un hote cellulaire.
AU694954B2 (en) 1994-06-03 1998-08-06 Novo Nordisk A/S Purified myceliophthora laccases and nucleic acids encoding same
CN1151762A (zh) 1994-06-30 1997-06-11 诺沃诺尔迪斯克生物技术有限公司 非毒性、非产毒性、非致病性镰孢属表达系统及所用启动子和终止子
ATE373493T1 (de) 1996-07-05 2007-10-15 Novozymes As Alpha-amylase transkriptionsfaktor
US5955310A (en) 1998-02-26 1999-09-21 Novo Nordisk Biotech, Inc. Methods for producing a polypeptide in a bacillus cell
CN1197965C (zh) 1998-10-26 2005-04-20 诺维信公司 在丝状真菌细胞内构建和筛选目的dna文库
JP4620253B2 (ja) 1999-03-22 2011-01-26 ノボザイムス,インコーポレイティド 菌類細胞中で遺伝子を発現させるためのプロモーター
US8586330B2 (en) 2006-07-14 2013-11-19 Novozymes A/S Methods for producing secreted polypeptides having biological activity
WO2010039889A2 (en) 2008-09-30 2010-04-08 Novozymes, Inc. Methods for using positively and negatively selectable genes in a filamentous fungal cell
EP2527432A1 (en) 2011-05-23 2012-11-28 Novozymes A/S Bi-directional cytosine deaminase-encoding selection marker

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2004043335A2 (en) * 2001-09-13 2004-05-27 Genesoft, Inc. Methods of treating infection by drug resistant bacteria
WO2003031630A1 (en) * 2001-10-12 2003-04-17 Keryos Spa Multi-cistronic vectors for gene transfer protocols

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
MARTIN FUSSENEGGER ET AL.,: "Regulated multicistronic expression technology for mammalian metabolic engineering", 《CYTOTECHNOLOGY》 *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112585267A (zh) * 2018-08-02 2021-03-30 诺维信公司 使用内含子制备dna构建体的组合文库

Also Published As

Publication number Publication date
EP3368674A1 (en) 2018-09-05
US20190078097A1 (en) 2019-03-14
WO2017075426A1 (en) 2017-05-04

Similar Documents

Publication Publication Date Title
AU2020207840B2 (en) Rna-guided targeting of genetic and epigenomic regulatory proteins to specific genomic loci
CN106916852B (zh) 一种碱基编辑系统及其构建和应用方法
CN108368490A (zh) 真菌产生fdca
CN108138121B (zh) 用微生物高水平生产长链二羧酸
CN109863243B (zh) 用于治疗粘多糖症的腺相关病毒载体
CN101842479A (zh) 用于改良宿主细胞内蛋白质生产的信号序列和共表达的分子伴侣
CN105274141B (zh) 一种用于原始生殖细胞靶向突变的转基因载体及制备方法和用途
CN107090441A (zh) 用于获得高产量重组蛋白表达的基于mgmt的方法
KR20150042856A (ko) 클라빈-유형 알칼로이드의 생산을 위한 유전자 및 방법
CN108753778A (zh) 利用碱基编辑修复fbn1t7498c突变的试剂和方法
CN111088176B (zh) 产β-胡萝卜素的基因工程菌及其应用
AU2016378480A1 (en) Endothelium-specific nucleic acid regulatory elements and methods and use thereof
CN108138188A (zh) 用于体外和体内表达的多核苷酸构建体
CN112280802A (zh) 基于piggyBac转座子系统制备稳定表达BE4蛋白的猪肾上皮细胞系的方法
US20040172667A1 (en) Administration of transposon-based vectors to reproductive organs
CN109762846B (zh) 利用碱基编辑修复与克拉伯病相关的galcc1586t突变的试剂和方法
CN114134141B (zh) 一种引入非天然氨基酸的嵌合体苯丙氨酸翻译系统及其构建方法
KR102224580B1 (ko) 유전자 발현 및 억제가 동시에 가능한 핵산 구조체
US20040161756A1 (en) Substrate linked directed evolution (slide)
CN110484517A (zh) 一种用于制备弱毒的裂谷热病毒的组合物及制备方法,rvfv减毒疫苗
CN113088529B (zh) 一种新型β-葡聚糖基因HG278及其应用
KR20060063738A (ko) 번역반응 촉진 dna 단편 및 그것을 사용한 무세포계단백질 합성방법
KR102061251B1 (ko) 내인성 폴리펩타이드 생산을 위한 재조합 세포 및 방법
CN113736824B (zh) 一种重组载体及其制备方法和应用
CN116472057A (zh) 表达流感血凝素的重组hvt载体和免疫原性组合物,以及其生产和用途

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20180608