CN108138188A

CN108138188A - 用于体外和体内表达的多核苷酸构建体

Info

Publication number: CN108138188A
Application number: CN201680055929.1A
Authority: CN
Inventors: C·埃姆里克; J·维恩
Original assignee: Novo Nordisk AS
Current assignee: Novo Nordisk AS
Priority date: 2015-10-30
Filing date: 2016-10-28
Publication date: 2018-06-08
Also published as: EP3368674A1; US20190078097A1; WO2017075426A1

Abstract

本发明涉及用于感兴趣的基因或感兴趣的基因的变体的体外和体内转录/翻译的多核苷酸构建体，连同包含此类构建体的微生物宿主细胞，以及用于在此类微生物宿主细胞中产生感兴趣的多肽的方法。

Description

用于体外和体内表达的多核苷酸构建体

序列表的引用

本申请包含一个处于计算机可读形式的序列表，将其通过引用结合在此。

技术领域

本发明涉及用于感兴趣的基因或感兴趣的基因的变体的体外和体内转录/翻译的多核苷酸构建体，连同包含此类构建体的微生物宿主细胞，以及用于在此类微生物宿主细胞中产生感兴趣的多肽的方法。本发明的构建体允许编码的所希望的一种或多种蛋白质的体外转录/翻译(IVTT)产生，连同将这些构建体直接转化到真菌宿主细胞中用于体内产生一种或多种分泌蛋白。

驱动体外转录的启动子正好位于编码感兴趣的成熟蛋白的基因上游的内含子中。内含子的上游是编码在体内从真菌启动子表达的分泌信号肽的多核苷酸。

背景技术

在具有分泌机制的微生物中成功体内生产感兴趣的分泌多肽通常取决于与多肽处于翻译融合的信号肽的表达。

但是，在一些情况下，优选体外表达感兴趣的多肽。这典型地是用无细胞的细胞提取物完成的，所述无细胞的细胞提取物包含DNA转录和翻译的所有先决条件。显然，在体外转录翻译(IVTT)系统中产生的感兴趣的多肽不需要信号肽，因为它将直接在无细胞培养基中产生。因此，如果正常地在体内产生了多肽的原或前-原形式，则将仅需要在IVTT系统中表达成熟多肽编码多核苷酸以产生成熟多肽。

如果信号肽被包括在体外表达构建体中，它将可能不会像在体内分泌过程中那样被切割掉，并且与成熟多肽相比，信号肽的存在会改变多肽的特征。因此，信号肽的存在对筛选体外表达的多肽也可能具有不希望的影响。

这当然意味着似乎需要单独的多核苷酸构建体来提供体内抑或体外的转录和翻译以产生感兴趣的多肽。

本发明基于以下事实：许多微生物(包括细菌和真菌宿主细胞)能够加工所谓的内含子。内含子是在最终信使RNA产物成熟期间通过RNA剪接去除的基因内的任何核苷酸序列。当蛋白质由包含内含子的基因编码时，RNA剪接作为在转录之后和翻译之前的RNA加工途径的一部分发生。

发明内容

本发明人成功地将一种人工内含子引入包含与编码信号肽的多核苷酸可操作连接的真菌启动子的多核苷酸构建体，所述信号肽与成熟脂肪酶处于翻译融合。

将人工内含子引入信号肽编码序列和成熟脂肪酶编码序列之间的多核苷酸构建体，这样使得其在真菌宿主细胞中的mRNA成熟过程中从转录的RNA中切除以产生编码信号肽的mRNA，所述信号肽与成熟脂肪酶处于正确的翻译融合。

当所得到的包含内含子的多核苷酸构建体转化到真菌宿主中时，产生并且分泌成熟脂肪酶。该结果表明，真菌宿主细胞已经转录了完整的RNA序列，然后在mRNA成熟过程中从RNA中去除内含子，并且将mRNA翻译成与脂肪酶处于正确融合的编码信号肽，而反过来所述脂肪酶又为细胞所分泌。

在将其整合到构建体中之前，将人工内含子工程化以包含已知在体外转录翻译(IVTT)系统中有活性的启动子，这样使得一旦内含子已经被引入到构建体，所述启动子将与成熟脂肪酶编码序列可操作地连接。

当所得到的包含内含子的多核苷酸构建体与IVTT系统混合时，直接在体外产生活性成熟脂肪酶。

通过这种方式，本发明人令人惊讶地提供了概念证据，即可以巧妙地将单个多核苷酸构建体放在一起以允许产生活性多肽，而不管它是直接在IVTT系统中产生还是由微生物宿主细胞体内分泌。

因此，在第一个方面，本发明涉及分离的多核苷酸构建体，其以5'至3'的顺序包含以下元件：

(a)在能够加工内含子的微生物宿主细胞中具有启动子活性的第一多核苷酸，其中该第一多核苷酸与信号肽编码多核苷酸可操作地连接；

(b)包含在体外转录/翻译(IVTT)系统中具有启动子活性的第二多核苷酸的内含子；和

(c)编码与(a)和(b)的第一和第二多核苷酸可操作地连接的感兴趣的多肽的第三多核苷酸；

由此第一多核苷酸确保与感兴趣的多肽处于翻译融合的信号肽在微生物宿主细胞中的表达；和

由此第二多核苷酸确保在IVTT系统中没有信号肽的感兴趣的多肽的表达。

在第二个方面，本发明涉及包含如第一方面所定义的多核苷酸构建体的微生物宿主细胞。

在最后一个方面，本发明涉及用于产生感兴趣的多肽的方法，所述方法包括以下步骤：

a)培养如前述方面中所定义的微生物宿主细胞；并且，可任选地

b)回收该感兴趣的多肽。

附图说明

图1示出载体pDAu703的示意图。

图2示出以下项的示意图：

-顶端部分：在米曲霉宿主菌株DAu716中的染色体的amy2区域，其中两个FRT-位点已被插入；

-中间部分：线性化的载体pDAu724；以及

-底部部分：通过各自的FRT-位点之间的双同源重组的pDAu724的FLP介导的整合后，米曲霉宿主菌株DAu716中的染色体的amy2区域。

图3示出了用T7噬菌体启动子作为体外转录翻译系统的启动子描绘的本发明的多核苷酸构建体的示意概述图。

定义

编码序列：术语“编码序列”意指直接指定多肽的氨基酸序列的多核苷酸。编码序列的边界一般由开放阅读框决定，该开放阅读框架从起始密码子(如ATG、GTG或TTG)开始并且以终止密码子(如TAA、TAG或TGA)结束。编码序列可为基因组DNA、cDNA、合成DNA或其组合。

控制序列：术语“控制序列”意指对于表达编码本发明的成熟多肽的多核苷酸所必需的核酸序列。每个控制序列对于编码该多肽的多核苷酸来说可以是天然的(即来自相同基因)或外源的(即来自不同基因)，或相对于彼此是天然的或外源的。此类控制序列包括但不限于前导序列、聚腺苷酸化序列、前肽序列、启动子、信号肽序列和转录终止子。最少，控制序列包括启动子、以及转录和翻译终止信号。出于引入有利于将这些控制序列与编码多肽的多核苷酸的编码区连接的特异性限制性酶切位点的目的，这些控制序列可以提供有多个接头。

表达：术语“表达”包括涉及生产多肽的任何步骤，包括但不限于，转录、转录后修饰、翻译、翻译后修饰、和分泌。

表达载体：术语“表达载体”意指线状或环状DNA分子，该分子包含编码多肽的多核苷酸并且该多核苷酸可操作地连接于供用于其表达的控制序列。

宿主细胞：术语“宿主细胞”意指易于用包含本发明的多核苷酸的核酸构建体或表达载体转化、转染、转导等的任何细胞类型。术语“宿主细胞”涵盖亲本细胞的任何后代，其由于复制期间发生的突变而与亲本细胞不同。

分离的：术语“分离的”意指处于自然界中不存在的形式或环境中的物质。分离的物质的非限制性实例包括(1)任何非天然存在的物质；(2)包括但不限于任何酶、变体、核酸、蛋白质、肽或辅因子的任何物质，该物质至少部分地从与其本质相关的一种或多种或所有天然存在的成分中去除；(3)相对于在自然界中发现的物质通过人工修饰的任何物质；或(4)通过相对于与其天然相关的其他组分增加物质的量而修饰的任何物质(例如，宿主细胞中的重组产生；编码该物质的基因的多个拷贝；以及使用比与编码该物质的基因天然相关的启动子更强的启动子)。

成熟多肽：术语“成熟多肽”意指在翻译和任何翻译后修饰如N-末端加工、C-末端截短、糖基化作用、磷酸化作用等之后处于其最终形式的多肽。

核酸构建体：术语“核酸构建体”意指单链-或双链的核酸分子，该核酸分子是从天然存在的基因中分离的，或以本来不存在于自然界中的方式被修饰成包含核酸的区段，或是合成的，该核酸分子包含一个或多个控制序列。

可操作地连接：术语“可操作地连接”意指将控制序列相对于多核苷酸的编码序列安置在适当位置这样使得该控制序列指导该编码序列的表达的构型。

序列一致性：两个氨基酸序列之间或两个核苷酸序列之间的相关性由参数“序列一致性”描述。出于本发明的目的，使用如在EMBOSS包(EMBOSS：欧洲分子生物学开放软件套件，Rice等人,2000,Trends Genet.[遗传学趋势]16:276-277)(优选5.0.0版或更新版本)的Needle程序中所实施的Needleman-Wunsch算法(Needleman和Wunsch,1970,J.Mol.Biol.[分子生物学杂志]48:443-453)来确定两个氨基酸序列之间的序列一致性。使用的参数是缺口开放罚分10、缺口扩展罚分0.5以及EBLOSUM62(BLOSUM62的EMBOSS版本)取代矩阵。将标记为“最长一致性”的Needle的输出(使用–nobrief选项获得)用作百分比一致性并且计算如下：

(一致的残基x 100)/(比对长度-比对中的空位总数)

出于本发明的目的，使用如在EMBOSS包(EMBOSS：欧洲分子生物学开放软件套件，Rice等人，2000，同上)(优选5.0.0版或更新版本)的Needle程序中所实施的Needleman-Wunsch算法(Needleman和Wunsch，1970，同上)来确定两个脱氧核糖核苷酸序列之间的序列一致性。所使用的参数是空位开放罚分10，空位延伸罚分0.5和EDNAFULL(NCBI NUC4.4的EMBOSS版本)取代矩阵。将标记为“最长一致性”的Needle的输出(使用–nobrief选项获得)用作百分比一致性并且计算如下：

(一致的脱氧核糖核苷酸x 100)/(比对长度-比对中的空位总数)

发明详细说明

多核苷酸构建体

在第一个方面，本发明涉及分离的多核苷酸构建体，其以5’至3’的顺序包含以下元件：

由此第一多核苷酸确保与感兴趣的多肽处于翻译融合的信号肽在微生物宿主细胞中的表达；以及

可用许多方式操作所述多核苷酸以提供多肽的表达。取决于表达载体，在多核苷酸插入载体之前对其进行操作可为合意的或必需的。用于利用重组DNA方法修饰多核苷酸的技术是本领域已知的。

该控制序列可为启动子，即，被宿主细胞识别用于表达编码本发明多肽的多核苷酸的多核苷酸。该启动子包含转录控制序列，其介导该多肽的表达。该启动子可以是在宿主细胞中显示出转录活性的任何多核苷酸，包括突变型、截短型及杂合型启动子，并且可以是由编码与该宿主细胞同源或异源的细胞外或细胞内多肽的基因获得。

用于在细菌宿主细胞中指导本发明核酸构建体的转录的适合启动子的实例是从以下基因中获得的启动子：解淀粉芽孢杆菌α-淀粉酶基因(amyQ)、地衣芽孢杆菌α-淀粉酶基因(amyL)、地衣芽孢杆菌青霉素酶基因(penP)、嗜热脂肪芽孢杆菌产麦芽糖淀粉酶基因(amyM)、枯草芽孢杆菌果聚糖蔗糖酶基因(sacB)、枯草芽孢杆菌xylA和xylB基因、苏云金芽孢杆菌cryIIIA基因(Agaisse和Lereclus，1994，Molecular Microbiology[分子微生物学]13:97-107)、大肠杆菌lac操纵子、大肠杆菌trc启动子(Egon等人，1988，Gene[基因]69:301-315)、天蓝链霉菌琼脂水解酶基因(dagA)和原核β-内酰胺酶基因(Villa-Kamaroff等人，1978，Proc.Natl.Acad.Sci.USA[美国国家科学院院刊]75:3727-3731)以及tac启动子(DeBoer等人，1983，Proc.Natl.Acad.Sci.USA[美国国家科学院院刊]80:21-25)。其他启动子描述于Gilbert等，1980，Scientific American 242:74-94的“来自重组细菌的有用蛋白质(Useful proteins from recombinant bacteria)”中；和Sambrook等，1989，见上文中。串联启动子的实例披露于WO 99/43835中。

在丝状真菌宿主细胞中，用于指导本发明的核酸构建体的转录的适合启动子的实例是获得自以下酶的基因的启动子：构巢曲霉(Aspergillus nidulans)乙酰胺酶、黑曲霉(Aspergillus niger)中性α-淀粉酶、黑曲霉酸稳定性α-淀粉酶、黑曲霉或泡盛曲霉(Aspergillus awamori)葡萄糖淀粉酶(glaA)、米曲霉(Aspergillus oryzae)TAKA淀粉酶、米曲霉碱性蛋白酶、米曲霉丙糖磷酸异构酶、尖镰孢(Fusarium oxysporum)胰蛋白酶-样蛋白酶(WO 96/00787)、镶片镰孢(Fusarium venenatum)淀粉葡糖苷酶(WO 00/56900)、镶片镰孢Daria(WO 00/56900)、镶片镰孢菌Quinn(WO 00/56900)、米黑)(Rhizomucor miehei)脂肪酶、米黑根毛霉天冬氨酸蛋白酶、里氏木霉(Trichoderma reesei)β-葡糖苷酶、里氏木霉纤维二糖水解酶I、里氏木霉纤维二糖水解酶II、里氏木霉内切葡聚糖酶I、里氏木霉内切葡聚糖酶II、里氏木霉内切葡聚糖酶III、里氏木霉内切葡聚糖酶V、里氏木霉木聚糖酶I、里氏木霉木聚糖酶II、里氏木霉木聚糖酶III、里氏木霉β-木糖苷酶，以及里氏木霉翻译延长因子，以及NA2-tpi启动子(来自曲霉属中性α-淀粉酶基因的经修饰的启动子，其中未翻译的前导序列已经用来自曲霉属丙糖磷酸异构酶基因的未翻译的前导序列替换；非限制性实例包括来自黑曲霉中性α-淀粉酶的基因的经修饰的启动子，其中未翻译的前导序列已经用来自构巢曲霉或米曲霉丙糖磷酸异构酶基因的未翻译的前导序列替换)；及其突变型、截短型及杂合型启动子。其他启动子在美国专利号6,011,147中描述。

在酵母宿主中，从以下酶的基因获得有用的启动子：酿酒酵母(Saccharomycescerevisiae)烯醇化酶(ENO-1)、酿酒酵母半乳糖激酶(GAL1)、酿酒酵母乙醇脱氢酶/甘油醛-3-磷酸脱氢酶(ADH1，ADH2/GAP)、酿酒酵母磷酸丙糖异构酶(TPI)、酿酒酵母金属硫蛋白(CUP1)、和酿酒酵母3-磷酸甘油酸激酶。Romanos等人，1992，Yeast[酵母]8:423-488描述了酵母宿主细胞的其他有用的启动子。

控制序列也可为由宿主细胞识别以终止转录的转录终止子。终止子与编码该多肽的多核苷酸的3’-末端可操作地连接。在宿主细胞中有功能的任何终止子可用于本发明中。

细菌宿主细胞的优选终止子从以下酶的基因获得：克劳氏芽孢杆菌(Bacillusclausii)碱性蛋白酶(aprH)、地衣芽孢杆菌α-淀粉酶(amyL)、和大肠杆菌核糖体RNA(rrnB)。

用于丝状真菌宿主细胞的优选终止子从以下酶的基因获得：构巢曲霉乙酰胺酶、构巢曲霉邻氨基苯甲酸合酶、黑曲霉葡糖淀粉酶、黑曲霉α-葡糖苷酶、米曲霉TAKA淀粉酶、尖镰孢胰蛋白酶-样蛋白酶、里氏木霉β-葡糖苷酶、里氏木霉纤维二糖水解酶I、里氏木霉纤维二糖水解酶II、里氏木霉内切葡聚糖酶I、里氏木霉内切葡聚糖酶II、里氏木霉内切葡聚糖酶III、里氏木霉内切葡聚糖酶V、里氏木霉木聚糖酶I、里氏木霉木聚糖酶II、里氏木霉木聚糖酶III、里氏木霉β-木糖苷酶以及里氏木霉翻译延长因子。

用于酵母宿主细胞的优选终止子从以下酶的基因获得：酿酒酵母烯醇化酶、酿酒酵母细胞色素C(CYC1)、以及酿酒酵母甘油醛-3-磷酸脱氢酶。酵母宿主细胞的其他有用终止子在Romanos等，1992，见上文中描述。

控制序列还可为启动子下游和基因的编码序列上游的mRNA稳定子区，其增加该基因的表达。

适合的mRNA稳定子区的实例是从以下获得的：苏云金芽孢杆菌cryIIIA基因(WO94/25612)和枯草芽孢杆菌SP82基因(Hue等，1995，Journal of Bacteriology177:3465-3471)。

该控制序列还可为前导序列，对宿主细胞翻译重要的mRNA的非翻译区。该前导序列可操作地连接到编码该多肽的多核苷酸的5’末端。可以使用在宿主细胞中有功能的任何前导序列。

用于丝状真菌宿主细胞的优选前导序列是从米曲霉TAKA淀粉酶和构巢曲霉丙糖磷酸异构酶的基因获得的。

对于酵母宿主细胞适合的前导序列从以下酶的基因获得：酿酒酵母烯醇化酶(ENO-1)、酿酒酵母3-磷酸甘油酸激酶、酿酒酵母α因子、和酿酒酵母醇脱氢酶/甘油醛-3-磷酸脱氢酶(ADH2/GAP)。

控制序列也可以是多聚腺苷化序列，一种与多核苷酸3’-末端可操作地连接并在转录时由宿主细胞识别为向转录的mRNA添加聚腺苷酸残基的信号序列。可以使用在宿主细胞中起作用的任何聚腺苷酸化序列。

用于丝状真菌宿主细胞的优选聚腺苷酸化序列是从以下酶的基因获得的：构巢曲霉邻氨基苯甲酸合酶、黑曲霉葡糖淀粉酶、黑曲霉α-葡糖苷酶、米曲霉TAKA淀粉酶和尖镰孢胰蛋白酶-样蛋白酶。

对于酵母宿主细胞有用的聚腺苷酸化序列在Guo和Sherman，1995，Mol.CellularBiol.[分子细胞生物学]15:5983-5990中得以描述。

控制序列也可为编码与多肽的N-末端连接的信号肽并指导多肽进入细胞的分泌途径的信号肽编码区。多核苷酸的编码序列的5’-端可固有地包含在翻译阅读框中与编码多肽的编码序列的区段天然地连接的信号肽编码序列。可替代地，编码序列的5’-末端可包含对于编码序列为外源的信号肽编码序列。在编码序列不天然地包含信号肽编码序列的情况下，可需要外来的信号肽编码序列。可替代地，外源信号肽编码序列可以单纯地替代天然信号肽编码序列以便增强多肽的分泌。然而，可以使用指导已表达多肽进入宿主细胞的分泌途径的任何信号肽编码序列。

用于细菌宿主细胞的有效信号肽编码序列是从芽孢杆菌NCIB 11837生麦芽糖淀粉酶、地衣芽孢杆菌枯草杆菌蛋白酶、地衣芽孢杆菌β-内酰胺酶、嗜热脂肪芽孢杆菌α-淀粉酶、嗜热脂肪芽孢杆菌中性蛋白酶(nprT、nprS、nprM)和枯草芽孢杆菌prsA的基因获得的信号肽编码序列。另外的信号肽由Simonen和Palva，1993，Microbiological Reviews[微生物评论]57:109-137描述。

用于丝状真菌宿主细胞的有效的信号肽编码序列是从以下酶的基因获得的信号肽编码序列：黑曲霉中性淀粉酶、黑曲霉葡糖淀粉酶、米曲霉TAKA淀粉酶、特异腐质霉(Humicola insolens)纤维素酶、特异腐质霉内切葡聚糖酶V、疏棉状腐质霉(Humicolalanuginosa)脂肪酶和米黑根毛霉天冬氨酸蛋白酶。

用于酵母宿主细胞的有用的信号肽从酿酒酵母α-因子和酿酒酵母转化酶的基因获得。其他的有用的信号肽编码序列由Romanos等，1992，见上文描述。

控制序列也可为编码处于多肽的N-末端的前肽的前肽编码序列。所得的多肽被称为前体酶(proenzyme)或多肽原(或在一些情况下被称为酶原(zymogen))。多肽原通常是无活性的并且可通过催化切割或自身催化切割来自多肽原的前肽而转化为活性多肽。前肽编码序列可从以下酶的基因获得：枯草芽孢杆菌碱性蛋白酶(aprE)、枯草芽孢杆菌中性蛋白酶(nprT)、嗜热毁丝霉漆酶(WO 95/33836)、米黑根毛霉天冬氨酸蛋白酶和酿酒酵母α-因子。

在信号肽序列和前肽序列二者都存在的情况下，该前肽序列位于紧邻多肽的N-末端且该信号肽序列位于紧邻该前肽序列的N-末端。

也可为合意的是添加调节序列，所述调节序列调节相对于宿主细胞的生长的多肽的表达。调节序列的实例是引起基因的表达响应于化学或物理刺激(包括调节化合物的存在)而开启或关闭的那些。原核系统中的调节序列包括lac、tac以及trp操纵基因系统。在酵母中，可以使用ADH2系统或GAL1系统。在丝状真菌中，可以使用黑曲霉葡糖淀粉酶启动子、米曲霉TAKA α-淀粉酶启动子和米曲霉葡糖淀粉酶启动子、里氏木霉纤维二糖水解酶I启动子以及里氏木霉纤维二糖水解酶II启动子。调节序列的其他实例是允许基因扩增的那些。在真核系统中，这些调节序列包括在甲氨蝶呤存在下扩增的二氢叶酸还原酶基因以及用重金属扩增的金属硫蛋白基因。在这些情况中，编码多肽的多核苷酸会与调控序列可操作地连接。

表达载体

本发明还涉及包含本发明的多核苷酸、启动子、以及转录和翻译终止信号的重组表达载体。多个核苷酸和控制序列可连接在一起以产生重组表达载体，其可包括一个或多个便利的限制位点以允许编码该多肽的多核苷酸在这些位点处的插入或取代。可替代地，多核苷酸可通过将该多核苷酸或包含该多核苷酸的核酸构建体插入用于表达的适当载体中来表达。在产生该表达载体时，该编码序列位于该载体中，这样使得该编码序列与该用于表达的适当控制序列可操作地连接。

重组表达载体可以是任何载体(例如，质粒或病毒)，其能够方便地进行重组DNA程序，并且能够引起多核苷酸的表达。载体的选择将典型地取决于该载体与有待引入该载体的宿主细胞的相容性。该载体可以是线状或闭合的环状质粒。

载体可以是自主复制载体，即，作为染色体外实体存在的载体，其复制独立于染色体复制，例如，质粒、染色体外元件、微染色体或人工染色体。该载体可包含用于确保自我复制的任何装置。可替代地，载体可以是这样的载体，当它引入宿主细胞中时整合入基因组中并与其中已整合了它的染色体一起复制。此外，可以使用单独的载体或质粒或两个或更多个载体或质粒，其共同包含待引入宿主细胞基因组的总DNA，或可以使用转座子。

载体优选地包含一个或多个选择性标记，所述标记容许容易地选择转化细胞、转染细胞、转导细胞等。选择性标记是这样的基因，其产物提供了杀生物剂抗性或病毒抗性、重金属抗性、营养缺陷型的原养型等。

细菌选择性标记的实例是地衣芽孢杆菌或枯草芽孢杆菌dal基因，或赋予抗生素抗性(如氨苄青霉素、氯霉素、卡那霉素、新霉素、大观霉素或四环素抗性)的标记。用于酵母宿主细胞的适合的标记包括但不限于ADE2、HIS3、LEU2、LYS2、MET3、TRP1和URA3。用于丝状真菌宿主细胞中的选择性标记包括但不限于：adeA(磷酸核糖酰氨基咪唑-琥珀酸甲酰胺合酶)、adeB(磷酸核糖酰-氨基咪唑合酶)、amdS(乙酰胺酶)、argB(鸟氨酸氨甲酰基转移酶)、bar(草丁膦乙酰转移酶)、hph(潮霉素磷酸转移酶)、niaD(硝酸还原酶)、pyrG(乳清酸核苷-5’-磷酸脱羧酶)、sC(硫酸腺苷酰基转移酶)、以及trpC(邻氨基苯甲酸合酶)、以及其等效物。优选用于曲霉属细胞中的是构巢曲霉或米曲霉amdS和pyrG基因和吸水链霉菌(Streptomyces hygroscopicus)bar基因。优选用于木霉属细胞中的是adeA、adeB、amdS、hph和pyrG基因。

选择性标记可为双选择性标记系统，如WO 2010/039889中描述的。在一方面中，双选择性标记是hph-tk双选择性标记系统。

载体优选包含允许载体整合到宿主细胞的基因组中或载体在细胞中独立于基因组自主复制的一个或多个元件。

对于整合到该宿主细胞基因组中，该载体可以依靠编码该多肽的多核苷酸序列或者用于通过同源或非同源重组整合到该基因组中的该载体的任何其他元件。可替代地，该载体可包含用于指导通过同源重组而整合入宿主细胞基因组中的染色体中的精确位置处的另外的多核苷酸。为了增加在精确位置整合的可能性，整合的元件应包含足够数量的核酸，如100至10,000个碱基对、400至10,000个碱基对、以及800至10,000个碱基对，其与相应的靶序列具有高度的序列一致性以增强同源重组的可能性。这些整合元件可为与宿主细胞基因组中的靶序列同源的任何序列。此外，这些整合元件可为非编码多核苷酸或编码多核苷酸。另一方面，载体可通过非同源重组整合入宿主细胞的基因组中。

对于自主复制，载体可以进一步包含使该载体能够在所讨论的宿主细胞中自主地进行复制的复制起点。复制起点可为在细胞中有功能的介导自主复制的任何质粒复制子。术语“复制起点”或“质粒复制子”意指使质粒或载体能够在体内复制的多核苷酸。

细菌复制起点的实例是允许在大肠杆菌中复制的质粒pBR322、pUC19、pACYC177、以及pACYC184的复制起点，以及允许在芽孢杆菌属中复制的质粒pUB110、pE194、pTA1060、以及pAMβ1的复制起点。

用于酵母宿主细胞中的复制起点的实例是2微米复制起点、ARS1、ARS4、ARS1和CEN3的组合、以及ARS4和CEN6的组合。

在丝状真菌细胞中有用的复制起点的实例是AMA1和ANS1(Gems等人，1991，Gene[基因]98：61-67；Cullen等人，1987，Nucleic Acids Res.[核酸研究]15:9163-9175；WO00/24883)。可根据WO 00/24883中公开的方法完成AMA1基因的分离和包含该基因的质粒或载体的构建。

可以将本发明多核苷酸的一个以上的拷贝插入宿主细胞以增加多肽的产生。多核苷酸拷贝数的增加可通过如下获得：将序列的至少一个额外拷贝整合入宿主细胞基因组，或包括与多核苷酸一起的可扩增的选择性标记基因，其中可通过在适合的选择剂(selectable agent)存在下培养细胞来选择包含选择性标记基因的扩增拷贝，且由此包含多核苷酸的额外拷贝的细胞。

用于连接以上所描述的元件以构建本发明的重组表达载体的程序是本领域的普通技术人员熟知的(参见，例如，Sambrook等人，1989，同上)。

在本发明的优选实施例中，第一多核苷酸在细菌宿主细胞中具有启动子活性；优选地在原核宿主细胞；更优选地在革兰氏阳性或革兰氏阴性菌；更优选地在芽孢杆菌宿主细胞；甚至更优选地在嗜碱芽孢杆菌、解淀粉芽孢杆菌、短芽孢杆菌、环状芽孢杆菌、克劳氏芽孢杆菌、凝结芽孢杆菌、坚强芽孢杆菌、灿烂芽孢杆菌、迟缓芽孢杆菌、地衣芽孢杆菌、巨大芽孢杆菌、短小芽孢杆菌、嗜热脂肪芽孢杆菌、枯草芽孢杆菌或苏云金芽孢杆菌细胞；最优选地在枯草芽孢杆菌或地衣芽孢杆菌细胞中具有启动子活性。

在另一个优选的实施例中，第一多核苷酸在真菌宿主细胞中具有启动子活性。优选地，真菌宿主细胞可为酵母细胞。如在此所用的“酵母”包括产子囊酵母(ascosporogenous yeast)(内孢霉目(Endomycetales))、产担子酵母(basidiosporogenous yeast)和属于半知菌类(Fungi Imperfecti)(芽孢纲(Blastomycetes))的酵母。由于酵母的分类可能在将来变化，出于本发明的目的，酵母应当如酵母的生物学与活性(Skinner、Passmore和Davenport编辑，Soc.App.Bacteriol.Symposium Series No.9[应用细菌学学会专题论文集系列9]，1980)所描述那样定义。

酵母宿主细胞可以是假丝酵母属、汉逊酵母属、克鲁弗酵母属、毕赤酵母属、酵母属、裂殖酵母属、或耶氏酵母属细胞，如乳酸克鲁维酵母(Kluyveromyces lactis)、卡尔酵母、酿酒酵母、糖化酵母、道格拉氏酵母、克鲁弗酵母、诺地酵母、卵形酵母或解脂耶氏酵母(Yarrowia lipolytica)细胞。

真菌宿主细胞优选地可为丝状真菌细胞。“丝状真菌”包括真菌门(Eumycota)和卵菌门(Oomycota)亚类的所有丝状形式(如由Hawksworth等人，1995(见上文)所定义的)。丝状真菌通常的特征在于由几丁质、纤维素、葡聚糖、壳多糖、甘露聚糖、以及其他复杂多糖构成的菌丝体壁。营养生长是通过菌丝延长，而碳分解代谢是专性需氧的。相反，酵母(如酿酒酵母)的营养生长是通过单细胞菌体的出芽(budding)，且碳分解代谢可以是发酵性的。

优选的丝状真菌宿主细胞是枝顶孢霉属、曲霉属、短梗霉属、烟管霉属(Bjerkandera)、拟腊菌属、金孢子菌属、鬼伞属、革盖菌属(Coriolus)、隐球菌属、线黑粉菌科(Filibasidium)、镰孢属、腐质霉属、梨孢菌属、毛霉属、毁丝霉属、新美鞭菌属、链孢菌属、拟青霉属、青霉属、平革菌属、射脉菌属(Phlebia)、瘤胃壶菌属、侧耳属(Pleurotus)、裂褶菌属、篮状菌属、嗜热子囊菌属、梭孢壳属、弯颈霉属、栓菌属(Trametes)、或木霉属细胞。

最优选地，丝状真菌宿主细胞是泡盛曲霉、臭曲霉、烟曲霉、日本曲霉、构巢曲霉、黑曲霉、米曲霉、黑刺烟管菌(Bjerkandera adusta)、干拟蜡菌(Ceriporiopsisaneirina)、卡内基拟蜡菌(Ceriporiopsis caregiea)、浅黄拟蜡孔菌(Ceriporiopsisgilvescens)、潘诺希塔拟蜡菌(Ceriporiopsis pannocinta)、环带拟蜡菌(Ceriporiopsisrivulosa)、微红拟蜡菌(Ceriporiopsis subrufa)、虫拟蜡菌(Ceriporiopsissubvermispora)、狭边金孢子菌(Chrysosporium inops)、嗜角质金孢子菌、卢克诺文思金孢子菌(Chrysosporium lucknowense)、粪状金孢子菌(Chrysosporium merdarium)、租金孢子菌、女王杜香金孢子菌(Chrysosporium queenslandicum)、热带金孢子菌、褐薄金孢子菌(Chrysosporium zonatum)、灰盖鬼伞(Coprinus cinereus)、毛革盖菌(Coriolushirsutus)、杆孢状镰孢、谷类镰孢、库威镰孢、大刀镰孢、禾谷镰孢、禾赤镰孢、异孢镰孢、合欢木镰孢、尖镰孢、多枝镰孢、粉红镰孢、接骨木镰孢、肤色镰孢、拟分枝孢镰孢、硫色镰孢、圆镰孢、拟丝孢镰孢、镶片镰孢、特异腐质霉、柔毛腐质霉、米黑毛霉、嗜热毁丝霉、粗糙链孢菌、产紫青霉、黄孢平革菌(Phanerochaete chrysosporium)、射脉菌(Phlebia radiata)、刺芹侧耳(Pleurotus eryngii)、土生梭孢壳霉、长域毛栓菌(Trametes villosa)、变色栓菌(Trametes versicolor)、哈茨木霉、康宁木霉、长枝木霉、里氏木霉、或绿色木霉细胞。

在优选的实施例中，真菌宿主细胞是丝状真菌宿主细胞，更优选地是曲霉属或木霉属宿主细胞；最优选地是米曲霉(Aspergillus oryzae)、黑曲霉(Aspergillus niger)或里氏木霉(Trichoderma reesei)细胞。

在本发明的优选实施例中，第一多核苷酸在真菌宿主细胞中具有启动子活性，并且包含源自曲霉属或木霉属细胞的启动子或由其组成；更优选地，第一多核苷酸包含源自米曲霉、黑曲霉或里氏木霉细胞的启动子或由其组成；甚至更优选地，第一多核苷酸包含米曲霉、黑曲霉或里氏木霉细胞的真菌丙糖-磷酸盐异构酶启动子或由其组成；最优选地，第一多核苷酸包含SEQ ID NO:3的位置219-位置838中所示的启动子或由其组成。

在另一个优选的实施例中，信号肽源自细菌信号肽；优选地，信号肽源自原核细胞；更优选地，信号肽源自芽孢杆菌细胞。

在一个可替代的优选实施例中，信号肽源自真菌细胞；优选地，信号肽源自丝状真菌细胞；甚至更优选地，信号肽源自曲霉属或木霉属细胞；最优选地，信号肽源自米曲霉、黑曲霉或里氏木霉细胞。

优选地，第二多核苷酸包含细菌启动子或由其组成，优选地第二多核苷酸包含来自噬菌体的启动子或由其组成，最优选地第二多核苷酸包含SEQ ID NO:3的位置949-位置1021所示的T7启动子或由其组成。

如下面用脂肪酶所举例说明的，优选的是，第三多核苷酸编码酶；优选地是水解酶、异构酶、连接酶、裂解酶、氧化还原酶或转移酶；甚至更优选地是α-半乳糖苷酶、α-葡糖苷酶、氨肽酶、淀粉酶、β-半乳糖苷酶、β-葡糖苷酶、β-木糖苷酶、糖酶、羧肽酶、过氧化氢酶、纤维二糖水解酶、纤维素酶、壳多糖酶、角质酶、环糊精糖基转移酶、脱氧核糖核酸酶、内切葡聚糖酶、酯酶、葡糖淀粉酶、转化酶、漆酶、脂肪酶、甘露糖苷酶、变聚糖酶、氧化酶、果胶分解酶、过氧化物酶、植酸酶、多酚氧化酶、蛋白水解酶、核糖核酸酶、转谷氨酰胺酶、或木聚糖酶；优选地，该第三多核苷酸编码该酶的成熟形式。

宿主细胞

将包含多核苷酸的构建体或载体引入宿主细胞中，这样使得该构建体或载体作为染色体整合体或作为自主复制的染色体外载体维持，如较早前所述。术语“宿主细胞”涵盖由于复制过程中发生的突变而与亲本细胞不同的亲本细胞的任何后代。宿主细胞的选择会在很大程度上取决于编码该多肽的基因及其来源。

宿主细胞可为在本发明的多肽的重组产生中有用的任何细胞，例如原核细胞或真核细胞。

原核宿主细胞可为任何革兰氏阳性或革兰氏阴性细菌。革兰氏阳性细菌包括但不限于：芽孢杆菌属、梭菌属、肠球菌属、土芽孢杆菌属、乳杆菌属、乳球菌属、海洋芽孢杆菌属、葡萄球菌属、链球菌属、和链霉菌属。革兰氏阴性细菌包括但不限于：弯曲杆菌属、大肠杆菌、黄杆菌属、梭杆菌属、螺杆菌属、泥杆菌属、奈瑟氏菌属、假单胞菌属、沙门氏菌属、以及脲原体属。

细菌宿主细胞可以是任何芽孢杆菌属细胞，包括但不限于：嗜碱芽孢杆菌、解淀粉芽孢杆菌、短芽孢杆菌、环状芽孢杆菌、克劳氏芽孢杆菌、凝结芽孢杆菌、坚硬芽孢杆菌、灿烂芽孢杆菌、迟缓芽孢杆菌、地衣芽孢杆菌、巨大芽孢杆菌、短小芽孢杆菌、嗜热脂肪芽孢杆菌、枯草芽孢杆菌以及苏云金芽孢杆菌细胞。

细菌宿主细胞还可以是任何链球菌属细胞，包括但不限于：类马链球菌、化脓性链球菌、乳房链球菌以及马链球菌兽疫亚种细胞。

细菌宿主细胞还可以是任何链霉菌属细胞，包括但不限于：不产色链霉菌、阿维链霉菌、天蓝色链霉菌、灰色链霉菌以及变铅青链霉菌细胞。

将DNA引入芽孢杆菌属细胞中可以通过以下来实现：原生质体转化(参见例如，Chang和Cohen，1979，Mol.Gen.Genet.[分子遗传学与基因组学]168:111-115)、感受态细胞转化(参见例如，Young和Spizizen，1961，J.Bacteriol.[细菌学杂志]81:823-829，或Dubnau和Davidoff-Abelson，1971，J.Mol.Biol.[分子生物学杂志]56:209-221)、电穿孔(参见例如，Shigekawa和Dower，1988，Biotechniques[生物技术]6:742-751)或接合(参见例如，Koehler和Thorne，1987，J.Bacteriol.[细菌学杂志]169:5271-5278)。将DNA引入大肠杆菌细胞中可以通过以下来实现：原生质体转化(参见例如，Hanahan，1983，J.Mol.Biol.[分子生物学杂志]166:557-580)或电穿孔(参见例如，Dower等人，1988，Nucleic AcidsRes.[核酸研究]16:6127-6145)。将DNA引入链霉菌属细胞中可通过以下来实现：原生质体转化、电穿孔(参见，例如，Gong等人，2004，Folia Microbiol.[叶线形微生物学](布拉格(Praha))49:399-405)、接合(参见例如，Mazodier等人，1989，J.Bacteriol.[细菌学杂志]171:3583-3585)、或转导(参见例如，Burke等人，2001，Proc.Natl.Acad.Sci.USA[美国国家科学院院刊]98:6289-6294)。将DNA引入假单孢菌属细胞中可以通过以下来实现：电穿孔(参见例如，Choi等人，2006，J.Microbiol.Methods[微生物学方法杂志]64:391-397)或接合(参见例如，Pinedo和Smets，2005，Appl.Environ.Microbiol.[应用与环境微生物学]71:51-57)。将DNA引入链球菌属细胞中可以通过以下来实现：天然感受态(参见例如，Perry和Kuramitsu，1981，Infect.Immun.[感染与免疫]32:1295-1297)、原生质体转化(参见例如，Catt和Jollick，1991，Microbios[微生物学]68:189-207)、电穿孔(参见例如，Buckley等人，1999，Appl.Environ.Microbiol.[应用与环境微生物学]65:3800-3804)或接合(参见例如，Clewell，1981，Microbiol.Rev.[微生物学评论]45:409-436)。然而，可以使用本领域已知的将DNA引入宿主细胞的任何方法。

宿主细胞还可为真核生物，如哺乳动物、昆虫、植物或真菌细胞。

宿主细胞可为真菌细胞。如在此使用的“真菌”包括子囊菌门(Ascomycota)、担子菌门(Basidiomycota)、壶菌门(Chytridiomycota)和接合菌门(Zygomycota)以及卵菌门(Oomycota)和所有有丝分裂孢子真菌(如由Hawksworth等人所定义的，在：Ainsworth andBisby’s Dictionary of The Fungi[Ainsworth和Bisby的真菌大词典]，第8版，1995，国际CAB，大学出版社，剑桥，英国)。

真菌宿主细胞可以是酵母细胞。如在此所使用的“酵母”包括产子囊酵母(酵母目)、产担子酵母及属于不完全真菌的酵母(芽生菌目)。由于酵母的分类可能在将来变化，出于本发明的目的，酵母应当如酵母的生物学与活性(Skinner、Passmore和Davenport编辑，Soc.App.Bacteriol.Symposium Series No.9[应用细菌学学会专题论文集系列9]，1980)所描述那样定义。

真菌宿主细胞可以是丝状真菌细胞。“丝状真菌”包括真菌门(Eumycota)和卵菌门(Oomycota)亚类的所有丝状形式(如由Hawksworth等人，1995(见上文)所定义的)。通常，丝状真菌的特征在于由几丁质、纤维素、葡聚糖、壳聚糖、甘露聚糖、以及其他复杂多糖构成的菌丝体壁。营养生长是通过菌丝延伸，而碳分解代谢是专性需氧的。相反，酵母(如酿酒酵母)的营养生长是通过单细胞菌体的出芽(budding)，且碳分解代谢可以是发酵性的。

丝状真菌宿主细胞可以是枝顶孢属、曲霉属、短梗霉属、烟管霉属(Bjerkandera)、拟腊菌属、金孢子菌属、鬼伞属、革盖菌属(Coriolus)、隐球菌属、线黑粉菌科(Filibasidium)、镰孢属、腐质霉属、梨孢菌属、毛霉属、毁丝霉属、新美鞭菌属、链孢菌属、拟青霉属、青霉属、平革菌属、射脉菌属(Phlebia)、瘤胃壶菌属、侧耳属(Pleurotus)、裂褶菌属、篮状菌属、嗜热子囊菌属、梭孢壳属、弯颈霉属、栓菌属(Trametes)或木霉属细胞。

例如，丝状真菌宿主细胞可以是泡盛曲霉、臭曲霉、烟曲霉、日本曲霉、构巢曲霉、黑曲霉、米曲霉、黑刺烟管菌(Bjerkandera adusta)、干拟蜡菌(Ceriporiopsisaneirina)、卡内基拟蜡菌(Ceriporiopsis caregiea)、浅黄拟蜡孔菌(Ceriporiopsisgilvescens)、潘诺希塔拟蜡菌(Ceriporiopsis pannocinta)、环带拟蜡菌(Ceriporiopsisrivulosa)、微红拟蜡菌(Ceriporiopsis subrufa)、虫拟蜡菌(Ceriporiopsissubvermispora)、狭边金孢子菌(Chrysosporium inops)、嗜角质金孢子菌、卢克诺文思金孢子菌(Chrysosporium lucknowense)、粪状金孢子菌(Chrysosporium merdarium)、租金孢子菌、昆士兰金孢子菌(Chrysosporium queenslandicum)、热带金孢子菌、褐薄金孢子菌(Chrysosporium zonatum)、灰盖鬼伞(Coprinus cinereus)、毛革盖菌(Coriolushirsutus)、杆孢状镰孢、谷类镰孢、库威镰孢、大刀镰孢、禾谷镰孢、禾赤镰孢、异孢镰孢、合欢木镰孢、尖镰孢、多枝镰孢、粉红镰孢、接骨木镰孢、肤色镰孢、拟分枝孢镰孢、硫色镰孢、圆镰孢、拟丝孢镰孢、镶片镰孢、特异腐质霉、柔毛腐质霉、米黑毛霉、嗜热毁丝霉、粗糙链孢菌、产紫青霉、黄孢平革菌(Phanerochaete chrysosporium)、射脉菌(Phlebia radiata)、刺芹侧耳(Pleurotus eryngii)、土生梭孢壳霉、长域毛栓菌(Trametes villosa)、变色栓菌(Trametes versicolor)、哈茨木霉、康宁木霉、长枝木霉、里氏木霉、或绿色木霉细胞。

真菌细胞可以通过下述过程转化，所述过程涉及原生质体形成、原生质体的转化、以及以本身已知的方式的细胞壁的再生。用于转化曲霉属和木霉属宿主细胞的适合程序描述于以下文献中：EP 238023，Yelton等人，1984，Proc.Natl.Acad.Sci.USA[美国国家科学院院刊]81:1470-1474以及Christensen等人，1988，Bio/Technology[生物/技术]6:1419-1422。用于转化镰刀菌属物种的适合方法由Malardier等人，1989，Gene[基因]78:147-156、以及WO 96/00787描述。可以使用由如以下文献描述的程序转化酵母：Becker和Guarente，在Abelson，J.N.和Simon，M.I.编，Guide to Yeast Genetics and Molecular Biology[酵母遗传学与分子生物学指南]，Methods in Enzymology[酶学方法]，第194卷，第182-187页，学术出版社有限公司(Academic Press,Inc.)，纽约；Ito等人，1983，J.Bacteriol.[细菌学杂志]153:163；以及Hinnen等人，1978，Proc.Natl.Acad.Sci.USA[美国国家科学院院刊]75:1920。

在优选的实施例中，微生物宿主细胞是细菌宿主细胞；优选地是原核生物宿主细胞；更优选地是芽孢杆菌宿主细胞；最优选地是枯草芽孢杆菌或地衣芽孢杆菌细胞。

在可替代的实施例中，微生物宿主细胞是真菌宿主细胞，优选地是丝状真菌宿主细胞，更优选地是曲霉属或木霉属宿主细胞；最优选地是米曲霉、黑曲霉或里氏木霉细胞。

产生方法

本发明的最后一个方面涉及用于产生感兴趣的多肽的方法，所述方法包括以下步骤：

b)回收该感兴趣的多肽。

这些宿主细胞是在适合于使用本领域中已知的方法产生该多肽的营养介质中培养的。例如，可通过摇瓶培养、或在实验室或工业发酵器中小规模或大规模发酵(包括连续、分批、补料分批或固态发酵)培养细胞，所述培养在适合的培养基中并且在允许表达和/或分离多肽的条件下进行。该培养是使用本领域中已知的程序，在一种适合营养介质基中发生，该介质包含碳和氮来源及无机盐。适合的培养基可以从商业供应商获得或可以根据公开的组成(例如，在美国典型培养物保藏中心(American Type Culture Collection)的目录中)制备。如果多肽被分泌到营养介质中，那么可直接从介质中回收多肽。如果多肽不分泌，那么其可从细胞裂解液中进行回收。

可以使用针对该多肽具有特异性的本领域已知的方法检测该多肽。这些检测方法包括但不限于：特异性抗体的使用、酶产物的形成或酶底物的消失。例如，可以使用酶测定法来确定多肽的活性。

可以使用本领域已知的方法来回收多肽。例如，可通过常规方法，包括但不限于：收集、离心、过滤、提取、喷雾干燥、蒸发或沉淀，从营养介质回收多肽。在一方面，回收包含多肽的发酵液。

可通过本领域已知的多种方法纯化多肽以获得基本上纯的多肽，所述方法包括但不限于层析(例如，离子交换、亲和、疏水、层析聚焦和大小排阻)、电泳方法(例如，制备型等电聚焦)、差示溶解度(例如，硫酸铵沉淀)、SDS-PAGE或提取(参见，例如，ProteinPurification，Janson和Ryden编,VCH Publishers，纽约，1989)。

在一个替代的方面，不回收多肽，而是将表达该多肽的本发明的宿主细胞用作多肽的来源。

实例

实例1.分裂标记米曲霉的宿主/载体系统的构建

当通过翻转酶介导的位点特异性重组将表达载体整合到适合的真菌宿主细胞时，确保正确的方向的一种方式是采用分裂选择标记，其中标记的一个非功能部分存在于宿主染色体中，并且标记的另一非功能部分是在进来的载体上。然后只有正确定向的整合生成功能第二选择标记。该分裂标记原理在此实例中说明；在此第二选择标记被定向在一个方向上，但它刚好也可以已经按其他方式被定向。

曲霉原生质体转化和重组细胞的选择所必需的培养基和溶液：

痕量金属

盐溶液

COVE培养基

20ml盐溶液

20g琼脂

218g山梨醇

H₂O补足1l

高压灭菌并且然后添加：

50ml 20％葡萄糖

10ml 1M尿素。

Cove-N-甘氨酸斜面

蔗糖培养基

20ml 盐溶液。

342g 蔗糖。

H₂O补足1l

高压灭菌并且然后添加：

10mM NaNO3

ST 0.6M山梨醇

100mM Tris/HCl pH 7.0

STC 1.2M山梨醇

10mM CaCl₂

10mM Tris/HCl pH 7.5。

PEG 60％(W/V)PEG 4000(BDH)(6g PEG+～5ml无菌水，置于60-65℃)

10mM CaCl₂(50μl的2M CaCl₂)

10mM Tris/HCl pH7.5。(100μl的1M的Tris)

蔗糖琼脂平板

10g琼脂

10ml盐溶液

1M蔗糖补足至500ml

高压灭菌器灭菌

乙酰胺平板

10ml盐溶液

10g琼脂

1M蔗糖补足至500ml ¹。

高压灭菌。

冷却至大约65℃，添加10mM乙酰胺和15mM CsCl。

对于500毫升，Triton X-10050μl(仅在复制平板中)

在米曲霉DAu716的AMYamy2基因座的FRT位点的引入

质粒pJAl1258(在WO12160097A1中描述)被改良生成由pDAu703表示的质粒。

质粒pDAu703按顺序包含以下元件(图1；SEQ ID No:1)：

●amy2-3’侧翼区(490bp)；SEQ ID NO:1的位置449-938；

●pyrG启动子可操作地与包含pyrG CDS的5’端(第一外显子及其第一内含子的5’端)的部分的pyrG基因连接；

●FRT-F3位点(50bp)；SEQ ID NO:1的位置1452-1501；

●黑曲霉AMG终止子(Tamg)可操作地与AmdS编码基因，SEQ ID NO:1的位置1511-位置2200连接；

●构巢曲霉乙酰胺酶基因(AmdS)，SEQ ID NO:1的位置2232-位置4131；

●强磷酸丙糖异构酶启动子(Ptpi)可操作地与Amds编码基因连接；这允许在乙酰胺和ClCs上生长，即使按照预期基因组中仅存在AmdS选择盒的一个拷贝，如果质粒pDAU703被整合到位于FRT位点的amy2基因座的一个拷贝中。SEQ ID NO:1的位置4140-4894；

●FRT-F位点(49bp)；SEQ ID NO:1的位置4903-4951；

●amy2-5’侧翼区(1114bp)；SEQ ID NO:1的位置4964-6077；

●质粒的其余部分是由对于维持质粒作为细菌宿主细胞大肠杆菌中的复制质粒所必需的一部分DNA(大肠杆菌复制起点和氨苄青霉素抗性盒)构成。

质粒DNA pDAu703用NotI限制性内切酶消化，以从质粒的现在不相干大肠杆菌部分分离包含整合盒的DNA。

将线性化质粒pDAu703使用描述的标准程序(例如在WO98/01470中)转化进入米曲霉菌株Jal1338的原生质体(在WO12160097A1中披露)，但是因为该菌株是的pyrG负型，需要补充10mM尿苷至培养基，因此其在没有尿苷下不能生长。在AmdS选择平板上选择转化体

所得重组宿主菌株已经具有两个FRT位点连同分裂pyrG标记(第一外显子和天然内含子的一部分)的5’端，该标记通过同源重组在amy2基因座与其自己的整合的启动子可操作地连接，如在图2中的顶部小图中所示。在amy2基因座上的正确整合通过Southern印迹分析使用退火到amy2的3’端的探针检查(图2)。FRT盒的整合分别在EcoRI和XhoI消化物中的5114bp和2637bp处产生杂交信号(未示出)。该模式与Jal1338宿主不同，其中该amy2基因座不被破坏。选择正确的菌株并用米曲霉DAu716表示(图2，上图)。

用携带脂肪酶编码基因的pDAU724载体的DAu716的转化

这个实例展示了FRT/FLP重组和分裂pyrG标记可以如何被用于可操作地使表达盒的单拷贝插入以高频存在于米曲霉中。我们使用来自绵毛嗜热丝孢菌的脂肪酶基因(例如在WO2008008950中披露)作为报告基因来测量在转化的宿主中产生的脂肪酶的水平。

像在先前实例中，构建表达载体，这样使得其一部分可以使用翻转酶作为位点特异性重组介质，在FRT-位点被整合到宿主细胞的染色体中。要被整合到基因组中的质粒的一部分携带可操作地与NA2/TPi启动子和黑曲霉AMG基因的终止子连接的脂肪酶基因。为了能够选择经由FRT位点已经成功整合表达盒的重组细胞，pyrG选择标记的剩余部分也被包括在FRT位点之间。启动子和第一外显子存在于DAu716宿主中并且pyrG标记的剩余部分存在于进来的质粒上。当位点特异性重组时，pyrG标记将被重构为完整基因(其中其第一内含子内的FRT序列，将当然，从mRNA拼接出)并且重组细胞将能够表达PyrG和生长在NaNO₃作为单一氮源的平板上。

质粒pDAU724(图2，中间；SEQ ID NO：2)由以下组成：

要被整合到曲霉属宿主细胞的基因组DNA中的的部分-I，并且它由具有有表达盒的两个FRT位点和分裂pyrG标记的一部分组成；

将不被整合到宿主细胞的基因组中的部分-II，并且它包含FLP酶表达盒连同大肠杆菌选择标记和复制起点。

菌株DAu716生长在Cove-N-甘氨酸介质的斜面上直至可以看见孢子。

将10-20毫升的蔗糖培养基或YPD培养基添加至该斜面，并且通过漩涡振荡斜面悬浮孢子。孢子悬浮液转移到包含100ml蔗糖培养基和10mM硝酸钠(或其它氮源)的聚碳酸酯摇瓶(500毫升)中。在30℃下孵育烧瓶24hr(200rpm)。

通过神奇滤布(miracloth)过滤收集菌丝体，并且使用200ml 0.6M MgSO₄洗涤。

从菌丝体吸出剩余液体，例如使用塑料移液器。

1-2g的菌丝体被转移到小的(100ml)聚碳酸酯烧瓶中，瓶中包含：

75-150mg Glucanex

10ml 1.2M MgSO₄

100ul 1M NaH₂PO₄pH 5.8

并且悬浮该菌丝体，添加1ml的12mg/ml BSA(经灭菌过滤的)。

在37℃孵育悬浮液1/2-2hr，并且经常通过显微术监测原生质体形成。

将原生质体悬浮液通过神奇滤布(miracloth)过滤到25毫升离心管中，并且将悬浮液用5ml ST(小心不要与下层混合)覆盖。将所得原生质体，通过离心(2500rpm/1350g，15min，缓慢加速)分带。回收原生质体的界面带，并且转移到新鲜的管中。

用两体积的STC稀释原生质体，随后离心(2500rpm/1350g，5min)。然后用5ml STC洗涤原生质体两次(使用再悬浮和离心)，并且然后在STC中再悬浮至大约5x 10⁷个原生质体/ml的浓度。

对于每次转化，将正在转化的DNA添加至例如14ml管的底部，并且添加100μl的原生质体。添加300μl的PEG，并且将该管用手轻轻混合。孵育20分钟(室温)后，在50℃的温度下添加6ml顶层琼脂，并立即将该悬浮液倒在具有10mM的NaNO₃的选择性蔗糖琼脂平板上。

将平板在37℃孵育，直至转化体清晰可见并且开始形成孢子。20个转化体复制到具有Triton的新选择平板上，以分离菌落，可以通过发酵，Southern印迹分析或酶活性测定进一步分析这些菌落。

确认染色体中存在的amdS标记已经通过在包含CsCl(内源乙酰胺酶的抑制剂)和作为唯一氮源的乙酰胺的平板上将转化体划线，在转化体中被引进的脂肪酶基因替换。正确的转化体不应该能够在这些平板上生长。我们测试了20个重组细胞，这些重组细胞是pDAu724的转化成DAu716后获得的，并与亲本宿主菌株DAu716相比，仅观察到轻微的生长表型，其中AmdS选择标记仍然存在。

证实所有20个转化体均包含正确插入在FRT位点的脂肪酶表达盒的一个插入的拷贝。

将20个转化体接种至3ml YPD在10ml 24深孔板(沃特曼(Whatman)公司)中，用Airpore胶带(Quiagen公司)密封，并且在200rpm的搅拌下30摄氏度孵育4天。收集上清液用于进一步分析(脂肪酶测定和SDS-page)，并收集菌丝体用于基因组提取和Southern分析。

20个转化体在脂肪酶测定中示出可比较脂肪酶活性，连同在SDS-PAGE凝胶上示出可比较脂肪酶蛋白水平(未示出)。此外，Southern印迹证实，所有20个转化体仅具有正确地整合到染色体中的预期单一脂肪酶基因拷贝(未示出)。

实例2.质粒pBac7000的构建

使用包含疏棉状嗜热丝孢菌(Thermomyces lanuginosus)脂肪酶作为报道基因的质粒pDau724作为载体。如上面的实例所示，质粒已被构建成使得包含翻转酶基因，该基因确保使用位于感兴趣的基因的侧翼的Frt位点的同源重组至宿主基因组中。

在真菌分泌的脂肪酶编码基因中包含T7启动子的内含子被排列作为合成多核苷酸构建体，并使用标准分子生物学技术使用限制酶BamHI和XhoI将其克隆到pDau724中，从而产生质粒pBac7000(SEQ ID NO:3)。

实例3.编码脂肪酶的基因的体外转录/翻译

使用来自Biolabs的标准试剂盒(PURExpres体外蛋白质合成试剂盒E6800S)，在IVTT反应中使用pBac7000和pDau724。从pDau724未观察到脂肪酶表达，但使用pBac7000作为模板观察到了脂肪酶的良好表达。在使用PNP-戊酸酯作为底物的活性测定中测试表达(细节公开于WO 200024883)。

实例4.用编码脂肪酶的基因在真菌宿主中转化和表达

分别将pBac7000和pDau724各自转化到菌株Dau716细胞中。将转化体接种到各包含200微升YPM培养基的96孔微量滴定板(MTP)孔中。使MTP在带有湿纸的小盒子中在34℃不摇荡下生长3天，以确保高湿度。使用前面实例中提到的PNP-戊酸酯测定法测定来自每个孔的10微升生长培养基的脂肪酶活性。两种菌株都给出了相当水平的脂肪酶活性(数据未显示)。

序列表

<110> 诺维信公司（Novozymes A/S）

<120> 用于体外和体内表达的多核苷酸构建体

<130> 13095-WO-PCT

<160> 5

<170> PatentIn版本3.5

<210> 1

<211> 8299

<212> DNA

<213> 人工序列

<220>

<223> 质粒pDAu703

<400> 1

taggcgtatc acgaggccct ttcgtctcgc gcgtttcggt gatgacggtg aaaacctctg 60

acacatgcag ctcccggaga cggtcacagc ttgtctgtaa gcggatgccg ggagcagaca 120

agcccgtcag ggcgcgtcag cgggtgttgg cgggtgtcgg ggctggctta actatgcggc 180

atcagagcag attgtactga gagtgcacca tatgcggtgt gaaataccgc acagatgcgt 240

aaggagaaaa taccgcatca ggcgccattc gccattcagg ctgcgcaact gttgggaagg 300

gcgatcggtg cgggcctctt cgctattacg ccagctggcg aaagggggat gtgctgcaag 360

gcgattaagt tgggtaacgc cagggttttc ccagtcacga cgttgtaaaa cgacggccag 420

tgaattggcc tccatggccg cggccgcgct ttgctaaaac tttggttgat ggaaggtatc 480

tggcgataaa ctccgacgac gtctagaagc aacaatctta tgcaaacgct cattggttct 540

tttcgaccgc aacatccatc atgaaactgg tattttgtct gtgtcagcag tctagaaccc 600

cttgccgggt attttagcat ttcatttttc tataaaaagg taccagcatg tatggatcgt 660

atcttccgta ccgtggttat taaatcccag cagaggccga taggcttaag aagtgaacat 720

ggcatggtta aggaagaagc cattactgag tatatatggc tagaataatc gctgggaaag 780

atttatgctt ccaagaggcg taggacggta taccatacag tacggtattt atgaacaatt 840

cgataatacc actccccaaa gcgggagata ggacacccgc ctcaggcacc aaccaccccc 900

tttttcaact gtcagtggtg cacgtttcca tcgagcataa gcttggtacc ctaaggatag 960

gccctaatct tatctacatg tgactgcatc gatgtgtttg gtcaaaatga ggcatgtggc 1020

tcaccccaca ggcggagaaa cgtgtggcta gtgcatgaca gtcccctcca tagattcaat 1080

ttaatttttc gcggcaattg tcgtgcagtt tgtatctaca tttcattcca tatatcaaga 1140

gttagtagtt ggacatcctg attattttgt ctaattactg aaaactcgaa gtactaacct 1200

actaataagc cagtttcaac cactaagtgc tcatttatac aatatttgca gaaccccgcg 1260

ctacccctcc atcgccaaca tgtcttccaa gtcgcaattg acctacagcg cacgcgctag 1320

caagcacccc aatgcgctcg taaagaagct cttcgaggtt gccgaggcca agaaaaccaa 1380

tgtcaccgtt tccgccgacg tgacaaccac caaagagctg ctggatttgg ctgaccgtat 1440

gcgcaccggg gttgaagttc ctattccgag ttcctattct tcaaatagta taggaacttc 1500

attaattaaa ggagagagtt gaacctggac gccgcgcaaa aagcaaagac gcgcctcgtg 1560

ggcggtggat caatgatcgg atttagtggc agatggcatc acaggcggcc aatgaccacc 1620

gggccaactg gccccgacat tccagcaata ctgcctaatt gactccacca tgcatctcgg 1680

ctattattga actgggtttg atggatgggg accctcttgg aattgtcaaa gattttgaag 1740

cgaagacgat ctattggacg gtagagatat actcttgatt tagtcgttgg gaggcccctg 1800

gggaaagcaa tgatggggaa tgttgctgct ccactgtgga cctcggctat ggaattacgt 1860

gcttggatct aagatgagct catggctatg cattgaatga cagtgatatc agcagagcaa 1920

gcagagaagg atggaatgct aattttctag tgctttgtgc aagggtaaat cagggactgt 1980

ctgtctggtc ttctacacga aggaaagacc atggctttca cggtgtctgt atttccggat 2040

atcctcaatt ccgtcggtcg attacaatca catgacttgg cttccatttc actactatta 2100

tgcacaccca ctacatacat gatcatataa ccaattgccc tcatccccat cctttaacta 2160

tagcgaaatg gattgattgt ctaccgccag gtgtcagtca ccctctagat ctcgagctcg 2220

ctagagtcga cctatggagt caccacattt cccagcaact tccccacttc ctctgcaatc 2280

gccaacgtcc tctcttcact gagtctccgt ccgataacct gcactgcaac cggtgcccca 2340

tggtacgcct ccggatcata ctcttcctgc acgagggcat caagctcact aaccgccttg 2400

aaactctcat tcttcttatc gatgttctta tccgcaaagg taaccggaac aaccacgctc 2460

gtgaaatcca gcaggttgat cacagaggca tacccatagt accggaactg gtcatgccgt 2520

accgcagcgg taggcgtaat cggcgcgatg atggcgtcca gttccttccc ggccttttct 2580

tcagcctccc gccatttctc aaggtactcc atctggtaat tccacttctg gagatgcgtg 2640

tcccagagct cgttcatgtt aacagctttg atgttcgggt tcagtaggtc tttgatattt 2700

ggaatcgccg gctcgccgga tgcactgata tcgcgcatta cgtcggcgct gccgtcagcc 2760

gcgtagatat gggagatgag atcgtggccg aaatcgtgct tgtatggcgt ccacggggtc 2820

acggtgtgac cggctttggc gagtgcggcg acggtggttt ccacgccgcg caggatagga 2880

gggtgtggaa ggacattgcc gtcgaagttg tagtagccga tattgagccc gccgttcttg 2940

atcttggagg caataatgtc cgactcggac tggcgccagg gcatggggat gaccttggag 3000

tcgtatttcc atggctcctg accgaggacg gatttggtga agaggcggag gtctaacata 3060

cttcatcagt gactgccggt ctcgtatata gtataaaaag caagaaagga ggacagtgga 3120

ggcctggtat agagcaggaa aagaaggaag aggcgaagga ctcaccctca acagagtgcg 3180

taatcggccc gacaacgctg tgcaccgtct cctgaccctc catgctgttc gccatctttg 3240

catacggcag ccgcccatga ctcggcctta gaccgtacag gaagttgaac gcggccggca 3300

ctcgaatcga gccaccgata tccgttccta caccgatgac gccaccacga atcccaacga 3360

tcgcaccctc accaccagaa ctgccgccgc acgaccagtt cttgttgcgt gggttgacgg 3420

tgcgcccgat gatgttgttg actgtctcgc agaccatcag ggtctgcggg acagaggtct 3480

tgacgtagaa gacggcaccg gctttgcgga gcatggttgt cagaaccgag tccccttcgt 3540

cgtacttgtt tagccatgag atgtagccca ttgatgtttc gtagccctgg tggcatatgt 3600

tagctgacaa aaagggacat ctaacgactt aggggcaacg gtgtaccttg actcgaagct 3660

ggtctttgag agagatgggg aggccatgga gtggaccaac gggtctcttg tgctttgcgt 3720

agtattcatc gagttccctt gcctgcgcga gagcggcgtc agggaagaac tcgtgggcgc 3780

agtttgtctg cacagaagcc agcgtcagct tgatagtccc ataaggtggc gttgttacat 3840

ctccctgaga ggtagagggg accctactaa ctgctgggcg attgctgccc gtttacagaa 3900

tgctagcgta acttccaccg aggtcaactc tccggccgcc agcttggaca caagatctgc 3960

agcggaggcc tctgtgatct tcagttcggc ctctgaaagg atcaccgatt tctttgggaa 4020

atcaataacg ctgtcttccg caggcagcgt ctggactttc cattcatcag ggatggtttt 4080

tgcgaggcgg gcgcgcttat cagcggccag ttcttcccag gattgaggca tgtgcatgca 4140

atgtgtgttt atgtggaagt aagatacgac gagtttgatt gagaaaagac agggtgattg 4200

tcaagttcag tatggaagaa agagtagaag aagatcagac gacagggaag agcgatgaca 4260

taaaaggtgg aagacggaag aaaaacgaac caaatcaatc ccactctatg gcgggggttg 4320

gactgcctga ggccggcact ggtggggctt atcgataagt tctcgtcacc ggatgcaatg 4380

cgctgtcaac tgctgacttg gccctgaaca tcctgtcctc tacagatcca tactatacaa 4440

tgatcccagt tatagtgcgg taaggtgcat atcatatctc attctcatga ctcattcgac 4500

ttttttttag agaaagtaca tacgtggaac atacactaaa cgcaacaggt cgcgacaaca 4560

ctggtataca aaacggtccc cggtgaatga cgttattagt gtctatcccc cactcacacc 4620

cgaaaagaat aatagaaact aacagaaaaa gcggcccgag gataagagga acattcaaac 4680

agaaggggaa tcataaaaac cgaaaaatgc aaggaaaaga gaactcaaat caataatttt 4740

cataatactg tcgagagtaa tacggaccag cgtctctcag ggacatgcgt cggcgcaagg 4800

catcatccaa tctctcatct aacacatcca gcattcgtgt tcgatagtct aactgcttct 4860

ctcggcgctc aagtcttgct tcccgatcat cgagttaatt aagaagttcc tatactttct 4920

agagaatagg aactcggaat aggaacttca aggtaccgag ctctatcctc aataccctat 4980

tttccacgat tccattgtca tatccaattc cgttttcttt tcttgttttc ccctcatcca 5040

atcccgtcca tcatttactc ctttttcttg tgaatgcaag tggcactaag aaatccaacc 5100

cccagacaaa ttttcctact caggaacaca aaaacctcgt ttctgctccc ttctcgtact 5160

tcattcctat cgtctcggaa tttcctcaac aaccctttcc gactttgcga cagcgtcgcg 5220

attccagact tatgtgttct cgttcctact gtcgttacca gtctatttat tccgaaacct 5280

ctgatcgctg aatttcacac acaacacccc cccgttgatg ctggtggaga atccgtagcg 5340

tcaagagttg aattcactcc atgttgtaac gaagtccacg aattgagacg attgatgatt 5400

acaaccccgc gatcgcctat cgacgattcg acgagatgcc attctcatcc tcctcatcct 5460

cctccacccc cgaggtgtct accaccccgc tcgcagatta cttctggatc gcaggtgtcg 5520

atggcgcgga aatcttagag actttccaaa gactcggcga cgaatacagg gcaaacagtg 5580

ccaccgctcc tggccccgct cttgcggaca cgatcgagga agatgcggac gcggaggagg 5640

cacacgaccc ccgtctggac tccctctctc gacccaattc catggctggg ggccgcaatt 5700

ccttccagcg gttctcaatg cgctcaggag actccagtga gtccagtggg aatggtacca 5760

gcagcaaccg gagcagtctg accatcaagg gtaatcagtc gcccagaggg tcgtcgtttc 5820

tagaagattt cgactttgac aaggccctgt tcaagtttgc aaacgagcgg gagtcgttcc 5880

tgtcggatct gagtctcagt gccggagcaa tcactcccac ctcccgtcct aggtccaggt 5940

tacgtacaca gaagattgtc tccgaggaaa gtccctccca gccatccagc ttgcttcgat 6000

caggcattgg tagtgtgcgg cgtcatatgg cattcagaga catgaatagt atgaaacggc 6060

agccgtcagt tgctcgtcgc ggccgcagct tggcgtaatc atggtcatag ctgtttcctg 6120

tgtgaaattg ttatccgctc acaattccac acaacatacg agccggaagc ataaagtgta 6180

aagcctgggg tgcctaatga gtgagctaac tcacattaat tgcgttgcgc tcactgcccg 6240

ctttccagtc gggaaacctg tcgtgccagc tgcattaatg aatcggccaa cgcgcgggga 6300

gaggcggttt gcgtattggg cgctcttccg cttcctcgct cactgactcg ctgcgctcgg 6360

tcgttcggct gcggcgagcg gtatcagctc actcaaaggc ggtaatacgg ttatccacag 6420

aatcagggga taacgcagga aagaacatgt gagcaaaagg ccagcaaaag gccaggaacc 6480

gtaaaaaggc cgcgttgctg gcgtttttcc ataggctccg cccccctgac gagcatcaca 6540

aaaatcgacg ctcaagtcag aggtggcgaa acccgacagg actataaaga taccaggcgt 6600

ttccccctgg aagctccctc gtgcgctctc ctgttccgac cctgccgctt accggatacc 6660

tgtccgcctt tttcccttcg ggaagcgtgg cgctttctca tagctcacgc tgtaggtatc 6720

tcagttcggt gtaggtcgtt cgctccaagc tgggctgtgt gcacgaaccc cccgttcagc 6780

ccgaccgctg cgccttatcc ggtaactatc gtcttgagtc caacccggta agacacgact 6840

tatcgccact ggcagcagcc actggtaaca ggattagcag agcgaggtat gtaggcggtg 6900

ctacagagtt cttgaagtgg tggcctaact acggctacac tagaagaaca gtatttggta 6960

tctgcgctct gctgaagcca gttaccttcg gaaaaagagt tggtagctct tgatccggca 7020

aacaaaccac cgctggtagc ggtggttttt ttgtttgcaa gcagcagatt acgcgcagaa 7080

aaaaaggatc tcaagaagat cctttgatct tttctacggg gtctgacgct cagtggaacg 7140

aaaactcacg ttaagggatt ttggtcatga gattatcaaa aaggatcttc acctagatcc 7200

ttttaaatta aaaatgaagt tttaaatcaa tctaaagtat atatgagtaa acttggtctg 7260

acagttacca atgcttaatc agtgaggcac ctatctcagc gatctgtcta tttcgttcat 7320

ccatagttgc ctgactcccc gtcgtgtaga taactacgat acgggagggc ttaccatctg 7380

gccccagtgc tgcaatgata ccgcgagacc cacgctcacc ggctccagat ttatcagcaa 7440

taaaccagcc agccggaagg gccgagcgca gaagtggtcc tgcaacttta tccgcctcca 7500

tccagtctat taattgttgc cgggaagcta gagtaagtag ttcgccagtt aatagtttgc 7560

gcaacgttgt tgccattgct acaggcatcg tggtgtcacg ctcgtcgttt ggtatggctt 7620

cattcagctc cggttcccaa cgatcaaggc gagttacatg atcccccatg ttgtgcaaaa 7680

aagcggttag ctccttcggt cctccgatcg ttgtcagaag taagttggcc gcagtgttat 7740

cactcatggt tatggcagca ctgcataatt ctcttactgt catgccatcc gtaagatgct 7800

tttctgtgac tggtgagtac tcaaccaagt cattctgaga atagtgtatg cggcgaccga 7860

gttgctcttg cccggcgtca atacgggata ataccgcgcc acatagcaga actttaaaag 7920

tgctcatcat tggaaaacgt tcttcggggc gaaaactctc aaggatctta ccgctgttga 7980

gatccagttc gatgtaaccc actcgtgcac ccaactgatc ttcagcatct tttactttca 8040

ccagcgtttc tgggtgagca aaaacaggaa ggcaaaatgc cgcaaaaaag ggaataaggg 8100

cgacacggaa atgttgaata ctcatactct tcctttttca atattattga agcatttatc 8160

agggttattg tctcatgagc ggatacatat ttgaatgtat ttagaaaaat aaacaaatag 8220

gggttccgcg cacatttccc cgaaaagtgc cacctgacgt ctaagaaacc attattatca 8280

tgacattaac ctataaaaa 8299

<210> 2

<211> 8614

<212> DNA

<213> 人工序列

<220>

<223> 质粒pDAU724

<400> 2

gaattcgagc tcggtacctt gaagttccta ttccgagttc ctattctcta gaaagtatag 60

gaacttcagt acccgggtat aagctagctt ccgttaaatt gccgtcgtca gccgttaaat 120

taccgattaa tcccgataaa tttccgagat ctccgttaaa ttgccgttcg cagccgttaa 180

attaccgggg acgaccgata aatttccgcg atgaattcat ggtgttttga tcattttaaa 240

tttttatatg gcgggtggtg ggcaactcgc ttgcgcgggc aactcgctta ccgattacgt 300

tagggctgat atttacgtaa aaatcgtcaa gggatgcaag accaaaccgt taaatttccg 360

gagtcaacag catccaagcc caagtccttc acggagaaac cccagcgtcc acatcacgag 420

cgaaggacca cctctaggca tcggacgcac catccaatta gaagcagcaa agcgaaacag 480

cccaagaaaa aggtcggccc gtcggccttt tctgcaacgc tgatcacggg cagcgatcca 540

accaacaccc tccagagtga ctaggggcgg aaatttatcg ggattaattt ccactcaacc 600

acaaatcaca gtcgtccccg gtaatttaac ggctgcagac ggcaatttaa cggcttctgc 660

gaatcgcttg gattccccgc ccctggccgt agagcttaaa gtatgtccct tgtcgatgcg 720

atgtatcaca acatataaat actggcaagg gatgccatgc ttggagtttc caactcaatt 780

tacctctatc cacacttctc ttccttcctc aatcctctat atacacaact ggggatccac 840

catgaggagc tcccttgtgc tgttctttgt ctctgcgtgg acggccttgg ccagtcctat 900

tcgtcgagag gtctcgcagg atctgtttaa ccagttcaat ctctttgcac agtattctgc 960

agccgcatac tgcggaaaaa acaatgatgc cccagctggt acaaacatta cgtgcacggg 1020

aaatgcctgc cccgaggtag agaaggcgga tgcaacgttt ctctactcgt ttgaagactc 1080

tggagtgggc gatgtcaccg gcttccttgc tctcgacaac acgaacaaat tgatcgtcct 1140

ctctttccgt ggctctcgtt ccatagagaa ctggatcggg aatcttaact tcgacttgaa 1200

agaaataaat gacatttgct ccggctgcag gggacatgac ggcttcactt cgtcctggag 1260

gtctgtagcc gatacgttaa ggcagaaggt ggaggatgct gtgagggagc atcccgacta 1320

tcgcgtggtg tttaccggac atagcttggg tggtgcattg gcaactgttg ccggagcaga 1380

cctgcgtgga aatgggtatg atatcgacgt gttttcatat ggcgcccccc gagtcggaaa 1440

cagggctttt gcagaattcc tgaccgtaca gaccggcgga acactctacc gcattaccca 1500

caccaatgat attgtcccta gactcccgcc gcgcgaattc ggttacagcc attctagccc 1560

agagtactgg atcaaatctg gaacccttgt ccccgtcacc cgaaacgata tcgtgaagat 1620

agaaggcatc gatgccaccg gcggcaataa ccagcctaac attccggata tccctgcgca 1680

cctatggtac ttcgggttaa ttgggacatg tctttagtgg ccggcgcggc tgggtcgact 1740

ctagcgagct cgagatctag agggtgactg acacctggcg gtagacaatc aatccatttc 1800

gctatagtta aaggatgggg atgagggcaa ttggttatat gatcatgtat gtagtgggtg 1860

tgcataatag tagtgaaatg gaagccaagt catgtgattg taatcgaccg acggaattga 1920

ggatatccgg aaatacagac accgtgaaag ccatggtctt tccttcgtgt agaagaccag 1980

acagacagtc cctgatttac ccttgcacaa agcactagaa aattagcatt ccatccttct 2040

ctgcttgctc tgctgatatc actgtcattc aatgcatagc catgagctca tcttagatcc 2100

aagcacgtaa ttccatagcc gaggtccaca gtggagcagc aacattcccc atcattgctt 2160

tccccagggg cctcccaacg actaaatcaa gagtatatct ctaccgtcca atagatcgtc 2220

ttcgcttcaa aatctttgac aattccaaga gggtccccat ccatcaaacc cagttcaata 2280

atagccgaga tgcatggtgg agtcaattag gcagtattgc tggaatgtcg gggccagttg 2340

gccgggtggt cattggccgc ctgtgatgcc atctgccact aaatccgatc attgatccac 2400

cgcccacgag gcgcgtcttt gctttttgcg cggcgtccag gttcaactct ctcttaatta 2460

atgtacatta gtgatacccc actctaagaa aatagaccaa tctccagctg caccttcaga 2520

cactccggta caaattctcg tctatgttgg agattgttgt gactttgaaa catgaccctt 2580

gaccctgatt ttgaatttgt ccatatatcg aggcaggtgt cttattcgta cggagagggt 2640

atctgtcgta gacacatagt agtagtcatt tcgagtgctg aatttataaa tcgcatcata 2700

cttgcgacat actgccataa aaggagtacg tatccaccac tacttattgc gcaccaacac 2760

gcttcaggta tgcatcccat ccctccttct ggtactgctt cgccgcctcc acgggatcag 2820

gagcagcata aattccacgg ccagcaataa taaagtcggc accgcgtcca acagccgact 2880

caggagtttg gtactgctgt cccagcttgt cacccttcga ggagaggttg acacctgtcg 2940

tgaagacgac aaaatcttcc tcctccgaag gcgagctaac ttcagactga acctcgccaa 3000

ggtgacgtgt cgagacgaat cccatcacaa acttcttata cttccgagca tagtcaacag 3060

aagaagtagt atattgaccg gtagccaaag atcccttgga ggtcatctcc gcaaggatca 3120

aaaggcccct ctcggagccg taggggaagt cctcggccga agcagtctgg gccagagcct 3180

cgacgatacc ctcaccgggc agaatactgc agttgatgat gtgggcccac tcagagatac 3240

gcagagtgcc gccatggtac tgcttttgga ctgtgtttcc gatatcgatg aacttgcgat 3300

cttcgaagat gaggaaattg tgcttctctg caagggcctt cagaccggtg atggtttctt 3360

cgctgaaatc ggagaggata tcgatgtgag ttttgatcac ggcaatgtac ggaccgagtc 3420

ctgttatata atccaccatt aaccattact agatcacatg taagtggcat tgaagttcct 3480

atactatttg aagaatagga actcggaata ggaacttcaa cgtacgattt tgacatttgc 3540

tccattgtcg aggatggatg gaacgagcgg cgtgcgccac gaaagtgagg ctattgccta 3600

tcagctcttt gctacattcc ggaaacaaac atcccttttt gtgaattatc tacgcaactt 3660

agatggcgtg aacgcatctt caaagtcttt cggcaggtcc ggcacgactt ttgcatccag 3720

agaagcgcct acatgtgtat tcgaccacct cctagcgcgc ttggatatga ggaaatatta 3780

ctgagagtcg aaaacaagct ccaccgcacc agctcttctt ggagttttat attaaagaat 3840

attcccagct cgttgtatta ttctttttct accgtgctaa tgtatcaagg actttggtac 3900

ctattaacgt tattattcgt gtgctattcc caaacataac cctgtatatg tttcgaacgc 3960

cgttatgacc catgtcttac atactcatta agtcattccc ttggataatc tcgactcaga 4020

tgcggcggtt gatgtaggag gagaggtaat cgaggacctc ctgggagatg atgccgttcc 4080

aggcggggta gcggatggag ccctcggcgg agcccttgag ctgctcgata tgctgccact 4140

cctcgatggg gttggtctca tccttgaggg cgatcatctc cttggagatg ggatcgtagg 4200

cgtagtagcg ggagactagt gcgaagtaat gatcggggat ggcggtgatc tgatgggtgt 4260

aggtggtgcg ggcgacggcg gaggcgcgct tatcggacca gttgccgacg acgttggtga 4320

gctcggtgag gcccttcatg gagaggaagg aggtcatgag atggcggccg atatgggact 4380

tggggccgtt cttgatggcg aagatggagt agggggcgtt cttcttgagg gccttgttgt 4440

aggagcggac gaggttatcc ttgaggagct ggtactcctg cttgttggag gaggagttgc 4500

cggtgcggtt gacgcgcttg aggacgggct cggagttgcg gaggaactca tcgaggtaga 4560

cgaggggatc gatgcggccg cgggcggaga agaagtagat atggcgggag acggaggtct 4620

tggtctcggt gacgaggcac tggatgatga cgccgaggta cttgttctgg acgagcttga 4680

aggacttggg atcgacgttc ttgatatcgg agaagcggcc gcagttgatg aaggtggcga 4740

ggaagaggaa ctggtagagg gtcttggtct tggtgaagcg ggaggtgtac tcgaaggagt 4800

tgaggatctt ctcggtgatc tcccagatgg actcgccctc ggagaggagg gccttgagca 4860

tcttcttgga atgggagttg cccttatcgg cctcctcgga ggactcgaac tggagctgga 4920

gggaggagac gatatcggtg atatcggact gatgcttctg gccgtagtag gggatgatgg 4980

tgaactccca ggcggggatg agcttcttga gggaggcctc caggatggtg gccttctggg 5040

tcttgtactt gaactggagg gacttgttga cgatatcgaa ggagagggag ttggagatga 5100

tggtgttgta ggacatgaag gtggcgcgct tgatggcggt gccgttatgg gtgatcatcc 5160

agcagaggta ggtgagctcg gcggcgcaga gggcgatctt ctcgccggag gggcgctcga 5220

agcgctcgac gaactggcgg acgaggacct tggggggggt cttgcagagg atatcgaact 5280

ggggcatggt gctcagatac tacggctgat cgcgtagagg tactgagcaa aacagatgtc 5340

agtaaggaga agagttgaat gaatggaaga agagtaggaa aggaggtatg ggggaaagat 5400

atacgtactg atgcggacga agagagaaag aaggaaaaaa gttgtgggag gggaaggagg 5460

gggaatcctt atatggaggg gcaagcgaga aggcgaatta gtgggcgggc ttaagccctc 5520

gaccgccgcc cttatcattg gacatggagg ggtaatgccc ccaccacgca tgtgcgggac 5580

cgacgcagaa tctgcacggc ggagtctctt ccagactgtt gacttttggg cgatgactct 5640

tgttgctgcg gccttttggg tacaccaacc tcgttgatct tgtttccttg gttctctttc 5700

gctcggagac ccgaccatga ccccaccatc agtcactatc ctgcctcgtc gataaaaatt 5760

ttttcttccc tctgattgtt acatagtatg tttccacctt tccggtggat ttcggacagt 5820

caaactgggc atcaacgcag tggtgggctg cttcgtttgc tgcgtgttgt acttgtttgc 5880

atttgaaccc cgcggtcgtt cgagtcctta attggtccgc tcccggtcaa cacccaagca 5940

gctgtggccc ggccgagtgg cgcctgtctg gtccacagta agcttggcgt aatcatggtc 6000

atagctgttt cctgtgtgaa attgttatcc gctcacaatt ccacacaaca tacgagccgg 6060

aagcataaag tgtaaagcct ggggtgccta atgagtgagc taactcacat taattgcgtt 6120

gcgctcactg cccgctttcc agtcgggaaa cctgtcgtgc cagctgcatt aatgaatcgg 6180

ccaacgcgcg gggagaggcg gtttgcgtat tgggcgctct tccgcttcct cgctcactga 6240

ctcgctgcgc tcggtcgttc ggctgcggcg agcggtatca gctcactcaa aggcggtaat 6300

acggttatcc acagaatcag gggataacgc aggaaagaac atgtgagcaa aaggccagca 6360

aaaggccagg aaccgtaaaa aggccgcgtt gctggcgttt ttccataggc tccgcccccc 6420

tgacgagcat cacaaaaatc gacgctcaag tcagaggtgg cgaaacccga caggactata 6480

aagataccag gcgtttcccc ctggaagctc cctcgtgcgc tctcctgttc cgaccctgcc 6540

gcttaccgga tacctgtccg cctttttccc ttcgggaagc gtggcgcttt ctcatagctc 6600

acgctgtagg tatctcagtt cggtgtaggt cgttcgctcc aagctgggct gtgtgcacga 6660

accccccgtt cagcccgacc gctgcgcctt atccggtaac tatcgtcttg agtccaaccc 6720

ggtaagacac gacttatcgc cactggcagc agccactggt aacaggatta gcagagcgag 6780

gtatgtaggc ggtgctacag agttcttgaa gtggtggcct aactacggct acactagaag 6840

aacagtattt ggtatctgcg ctctgctgaa gccagttacc ttcggaaaaa gagttggtag 6900

ctcttgatcc ggcaaacaaa ccaccgctgg tagcggtggt ttttttgttt gcaagcagca 6960

gattacgcgc agaaaaaaag gatctcaaga agatcctttg atcttttcta cggggtctga 7020

cgctcagtgg aacgaaaact cacgttaagg gattttggtc atgagattat caaaaaggat 7080

cttcacctag atccttttaa attaaaaatg aagttttaaa tcaatctaaa gtatatatga 7140

gtaaacttgg tctgacagtt accaatgctt aatcagtgag gcacctatct cagcgatctg 7200

tctatttcgt tcatccatag ttgcctgact ccccgtcgtg tagataacta cgatacggga 7260

gggcttacca tctggcccca gtgctgcaat gataccgcga gacccacgct caccggctcc 7320

agatttatca gcaataaacc agccagccgg aagggccgag cgcagaagtg gtcctgcaac 7380

tttatccgcc tccatccagt ctattaattg ttgccgggaa gctagagtaa gtagttcgcc 7440

agttaatagt ttgcgcaacg ttgttgccat tgctacaggc atcgtggtgt cacgctcgtc 7500

gtttggtatg gcttcattca gctccggttc ccaacgatca aggcgagtta catgatcccc 7560

catgttgtgc aaaaaagcgg ttagctcctt cggtcctccg atcgttgtca gaagtaagtt 7620

ggccgcagtg ttatcactca tggttatggc agcactgcat aattctctta ctgtcatgcc 7680

atccgtaaga tgcttttctg tgactggtga gtactcaacc aagtcattct gagaatagtg 7740

tatgcggcga ccgagttgct cttgcccggc gtcaatacgg gataataccg cgccacatag 7800

cagaacttta aaagtgctca tcattggaaa acgttcttcg gggcgaaaac tctcaaggat 7860

cttaccgctg ttgagatcca gttcgatgta acccactcgt gcacccaact gatcttcagc 7920

atcttttact ttcaccagcg tttctgggtg agcaaaaaca ggaaggcaaa atgccgcaaa 7980

aaagggaata agggcgacac ggaaatgttg aatactcata ctcttccttt ttcaatatta 8040

ttgaagcatt tatcagggtt attgtctcat gagcggatac atatttgaat gtatttagaa 8100

aaataaacaa ataggggttc cgcgcacatt tccccgaaaa gtgccacctg acgtctaaga 8160

aaccattatt atcatgacat taacctataa aaataggcgt atcacgaggc cctttcgtct 8220

cgcgcgtttc ggtgatgacg gtgaaaacct ctgacacatg cagctcccgg agacggtcac 8280

agcttgtctg taagcggatg ccgggagcag acaagcccgt cagggcgcgt cagcgggtgt 8340

tggcgggtgt cggggctggc ttaactatgc ggcatcagag cagattgtac tgagagtgca 8400

ccatatgcgg tgtgaaatac cgcacagatg cgtaaggaga aaataccgca tcaggcgcca 8460

ttcgccattc aggctgcgca actgttggga agggcgatcg gtgcgggcct cttcgctatt 8520

acgccagctg gcgaaagggg gatgtgctgc aaggcgatta agttgggtaa cgccagggtt 8580

ttcccagtca cgacgttgta aaacgacggc cagt 8614

<210> 3

<211> 8712

<212> DNA

<213> 人工序列

<220>

<223> 质粒pBac7000

<220>

<221> 尚未归类的重组事件

<222> (19)..(67)

<223> FRT-F

<220>

<221> 尚未归类的结合

<222> (91)..(104)

<223> amyR

<220>

<221> 尚未归类的结合

<222> (112)..(125)

<223> amyR

<220>

<221> 尚未归类的结合

<222> (133)..(146)

<223> amyR

<220>

<221> 尚未归类的结合

<222> (153)..(166)

<223> amyR

<220>

<221> 尚未归类的结合

<222> (174)..(187)

<223> amyR

<220>

<221> 尚未归类的结合

<222> (195)..(208)

<223> amyR

<220>

<221> 启动子

<222> (219)..(832)

<223> 体内启动子

<220>

<221> 尚未归类的结合

<222> (347)..(360)

<223> amyR

<220>

<221> 尚未归类的结合

<222> (568)..(581)

<223> amyR

<220>

<221> 尚未归类的结合

<222> (619)..(632)

<223> amyR

<220>

<221> 尚未归类的结合

<222> (640)..(653)

<223> amyR

<220>

<221> misc_RNA

<222> (767)..(860)

<223> 5’非翻译区

<220>

<221> CDS

<222> (845)..(913)

<223> 信号肽

<220>

<221> 内含子

<222> (914)..(1029)

<223> 具有T7启动子的内含子

<220>

<221> 启动子

<222> (949)..(1021)

<223> 具有Shine-Dalgarno序列的T7启动子

<220>

<221> RBS

<222> (1016)..(1021)

<223> Shine-Dalgarno序列

<220>

<221> CDS

<222> (1030)..(1845)

<223> 脂肪酶成熟肽编码区

<220>

<221> 终止子

<222> (1861)..(2551)

<220>

<221> 尚未归类的重组事件

<222> (3569)..(3618)

<223> 互补链上的RT-F3

<400> 3

gaattcgagc tcggtacctt gaagttccta ttccgagttc ctattctcta gaaagtatag 60

gaacttcagt acccgggtat aagctagctt ccgttaaatt gccgtcgtca gccgttaaat 120

taccgattaa tcccgataaa tttccgagat ctccgttaaa ttgccgttcg cagccgttaa 180

attaccgggg acgaccgata aatttccgcg atgaattcat ggtgttttga tcattttaaa 240

tttttatatg gcgggtggtg ggcaactcgc ttgcgcgggc aactcgctta ccgattacgt 300

tagggctgat atttacgtaa aaatcgtcaa gggatgcaag accaaaccgt taaatttccg 360

gagtcaacag catccaagcc caagtccttc acggagaaac cccagcgtcc acatcacgag 420

cgaaggacca cctctaggca tcggacgcac catccaatta gaagcagcaa agcgaaacag 480

cccaagaaaa aggtcggccc gtcggccttt tctgcaacgc tgatcacggg cagcgatcca 540

accaacaccc tccagagtga ctaggggcgg aaatttatcg ggattaattt ccactcaacc 600

acaaatcaca gtcgtccccg gtaatttaac ggctgcagac ggcaatttaa cggcttctgc 660

gaatcgcttg gattccccgc ccctggccgt agagcttaaa gtatgtccct tgtcgatgcg 720

atgtatcaca acatataaat actggcaagg gatgccatgc ttggagtttc caactcaatt 780

tacctctatc cacacttctc ttccttcctc aatcctctat atacacaact ggggatccac 840

catg atg agg agc tcc ctt gtg ctg ttc ttt gtc tct gcg tgg acg gcc 889

Met Arg Ser Ser Leu Val Leu Phe Phe Val Ser Ala Trp Thr Ala

1 5 10 15

ttg gcc agt cct att cgt cga gag gtatgtacac cacccccttg cgtctgatct 943

Leu Ala Ser Pro Ile Arg Arg Glu

20

gtgactaata cgactcacta tagggagacc acaacggttt ccctctagaa ataattttgt 1003

ttaactttaa gaaggagaag ctgact atg gag gtc tcg cag gat ctg ttt aac 1056

Met Glu Val Ser Gln Asp Leu Phe Asn

25 30

cag ttc aat ctc ttt gca cag tat tct gca gcc gca tac tgc gga aaa 1104

Gln Phe Asn Leu Phe Ala Gln Tyr Ser Ala Ala Ala Tyr Cys Gly Lys

35 40 45

aac aat gat gcc cca gct ggt aca aac att acg tgc acg gga aat gcc 1152

Asn Asn Asp Ala Pro Ala Gly Thr Asn Ile Thr Cys Thr Gly Asn Ala

50 55 60

tgc ccc gag gta gag aag gcg gat gca acg ttt ctc tac tcg ttt gaa 1200

Cys Pro Glu Val Glu Lys Ala Asp Ala Thr Phe Leu Tyr Ser Phe Glu

65 70 75 80

gac tct gga gtg ggc gat gtc acc ggc ttc ctt gct ctc gac aac acg 1248

Asp Ser Gly Val Gly Asp Val Thr Gly Phe Leu Ala Leu Asp Asn Thr

85 90 95

aac aaa ttg atc gtc ctc tct ttc cgt ggc tct cgt tcc ata gag aac 1296

Asn Lys Leu Ile Val Leu Ser Phe Arg Gly Ser Arg Ser Ile Glu Asn

100 105 110

tgg atc ggg aat ctt aac ttc gac ttg aaa gaa ata aat gac att tgc 1344

Trp Ile Gly Asn Leu Asn Phe Asp Leu Lys Glu Ile Asn Asp Ile Cys

115 120 125

tcc ggc tgc agg gga cat gac ggc ttc act tcg tcc tgg agg tct gta 1392

Ser Gly Cys Arg Gly His Asp Gly Phe Thr Ser Ser Trp Arg Ser Val

130 135 140

gcc gat acg tta agg cag aag gtg gag gat gct gtg agg gag cat ccc 1440

Ala Asp Thr Leu Arg Gln Lys Val Glu Asp Ala Val Arg Glu His Pro

145 150 155 160

gac tat cgc gtg gtg ttt acc gga cat agc ttg ggt ggt gca ttg gca 1488

Asp Tyr Arg Val Val Phe Thr Gly His Ser Leu Gly Gly Ala Leu Ala

165 170 175

act gtt gcc gga gca gac ctg cgt gga aat ggg tat gat atc gac gtg 1536

Thr Val Ala Gly Ala Asp Leu Arg Gly Asn Gly Tyr Asp Ile Asp Val

180 185 190

ttt tca tat ggc gcc ccc cga gtc gga aac agg gct ttt gca gaa ttc 1584

Phe Ser Tyr Gly Ala Pro Arg Val Gly Asn Arg Ala Phe Ala Glu Phe

195 200 205

ctg acc gta cag acc ggc gga aca ctc tac cgc att acc cac acc aat 1632

Leu Thr Val Gln Thr Gly Gly Thr Leu Tyr Arg Ile Thr His Thr Asn

210 215 220

gat att gtc cct aga ctc ccg ccg cgc gaa ttc ggt tac agc cat tct 1680

Asp Ile Val Pro Arg Leu Pro Pro Arg Glu Phe Gly Tyr Ser His Ser

225 230 235 240

agc cca gag tac tgg atc aaa tct gga acc ctt gtc ccc gtc acc cga 1728

Ser Pro Glu Tyr Trp Ile Lys Ser Gly Thr Leu Val Pro Val Thr Arg

245 250 255

aac gat atc gtg aag ata gaa ggc atc gat gcc acc ggc ggc aat aac 1776

Asn Asp Ile Val Lys Ile Glu Gly Ile Asp Ala Thr Gly Gly Asn Asn

260 265 270

cag cct aac att ccg gat atc cct gcg cac cta tgg tac ttc ggg tta 1824

Gln Pro Asn Ile Pro Asp Ile Pro Ala His Leu Trp Tyr Phe Gly Leu

275 280 285

att ggg aca tgt ctt tag tag tctcgagatc tagagggtga ctgacacctg 1875

Ile Gly Thr Cys Leu

290

gcggtagaca atcaatccat ttcgctatag ttaaaggatg gggatgaggg caattggtta 1935

tatgatcatg tatgtagtgg gtgtgcataa tagtagtgaa atggaagcca agtcatgtga 1995

ttgtaatcga ccgacggaat tgaggatatc cggaaataca gacaccgtga aagccatggt 2055

ctttccttcg tgtagaagac cagacagaca gtccctgatt tacccttgca caaagcacta 2115

gaaaattagc attccatcct tctctgcttg ctctgctgat atcactgtca ttcaatgcat 2175

agccatgagc tcatcttaga tccaagcacg taattccata gccgaggtcc acagtggagc 2235

agcaacattc cccatcattg ctttccccag gggcctccca acgactaaat caagagtata 2295

tctctaccgt ccaatagatc gtcttcgctt caaaatcttt gacaattcca agagggtccc 2355

catccatcaa acccagttca ataatagccg agatgcatgg tggagtcaat taggcagtat 2415

tgctggaatg tcggggccag ttggccgggt ggtcattggc cgcctgtgat gccatctgcc 2475

actaaatccg atcattgatc caccgcccac gaggcgcgtc tttgcttttt gcgcggcgtc 2535

caggttcaac tctctcttaa ttaatgtaca ttagtgatac cccactctaa gaaaatagac 2595

caatctccag ctgcaccttc agacactccg gtacaaattc tcgtctatgt tggagattgt 2655

tgtgactttg aaacatgacc cttgaccctg attttgaatt tgtccatata tcgaggcagg 2715

tgtcttattc gtacggagag ggtatctgtc gtagacacat agtagtagtc atttcgagtg 2775

ctgaatttat aaatcgcatc atacttgcga catactgcca taaaaggagt acgtatccac 2835

cactacttat tgcgcaccaa cacgcttcag gtatgcatcc catccctcct tctggtactg 2895

cttcgccgcc tccacgggat caggagcagc ataaattcca cggccagcaa taataaagtc 2955

ggcaccgcgt ccaacagccg actcaggagt ttggtactgc tgtcccagct tgtcaccctt 3015

cgaggagagg ttgacacctg tcgtgaagac gacaaaatct tcctcctccg aaggcgagct 3075

aacttcagac tgaacctcgc caaggtgacg tgtcgagacg aatcccatca caaacttctt 3135

atacttccga gcatagtcaa cagaagaagt agtatattga ccggtagcca aagatccctt 3195

ggaggtcatc tccgcaagga tcaaaaggcc cctctcggag ccgtagggga agtcctcggc 3255

cgaagcagtc tgggccagag cctcgacgat accctcaccg ggcagaatac tgcagttgat 3315

gatgtgggcc cactcagaga tacgcagagt gccgccatgg tactgctttt ggactgtgtt 3375

tccgatatcg atgaacttgc gatcttcgaa gatgaggaaa ttgtgcttct ctgcaagggc 3435

cttcagaccg gtgatggttt cttcgctgaa atcggagagg atatcgatgt gagttttgat 3495

cacggcaatg tacggaccga gtcctgttat ataatccacc attaaccatt actagatcac 3555

atgtaagtgg cattgaagtt cctatactat ttgaagaata ggaactcgga ataggaactt 3615

caacgtacga ttttgacatt tgctccattg tcgaggatgg atggaacgag cggcgtgcgc 3675

cacgaaagtg aggctattgc ctatcagctc tttgctacat tccggaaaca aacatccctt 3735

tttgtgaatt atctacgcaa cttagatggc gtgaacgcat cttcaaagtc tttcggcagg 3795

tccggcacga cttttgcatc cagagaagcg cctacatgtg tattcgacca cctcctagcg 3855

cgcttggata tgaggaaata ttactgagag tcgaaaacaa gctccaccgc accagctctt 3915

cttggagttt tatattaaag aatattccca gctcgttgta ttattctttt tctaccgtgc 3975

taatgtatca aggactttgg tacctattaa cgttattatt cgtgtgctat tcccaaacat 4035

aaccctgtat atgtttcgaa cgccgttatg acccatgtct tacatactca ttaagtcatt 4095

cccttggata atctcgactc agatgcggcg gttgatgtag gaggagaggt aatcgaggac 4155

ctcctgggag atgatgccgt tccaggcggg gtagcggatg gagccctcgg cggagccctt 4215

gagctgctcg atatgctgcc actcctcgat ggggttggtc tcatccttga gggcgatcat 4275

ctccttggag atgggatcgt aggcgtagta gcgggagact agtgcgaagt aatgatcggg 4335

gatggcggtg atctgatggg tgtaggtggt gcgggcgacg gcggaggcgc gcttatcgga 4395

ccagttgccg acgacgttgg tgagctcggt gaggcccttc atggagagga aggaggtcat 4455

gagatggcgg ccgatatggg acttggggcc gttcttgatg gcgaagatgg agtagggggc 4515

gttcttcttg agggccttgt tgtaggagcg gacgaggtta tccttgagga gctggtactc 4575

ctgcttgttg gaggaggagt tgccggtgcg gttgacgcgc ttgaggacgg gctcggagtt 4635

gcggaggaac tcatcgaggt agacgagggg atcgatgcgg ccgcgggcgg agaagaagta 4695

gatatggcgg gagacggagg tcttggtctc ggtgacgagg cactggatga tgacgccgag 4755

gtacttgttc tggacgagct tgaaggactt gggatcgacg ttcttgatat cggagaagcg 4815

gccgcagttg atgaaggtgg cgaggaagag gaactggtag agggtcttgg tcttggtgaa 4875

gcgggaggtg tactcgaagg agttgaggat cttctcggtg atctcccaga tggactcgcc 4935

ctcggagagg agggccttga gcatcttctt ggaatgggag ttgcccttat cggcctcctc 4995

ggaggactcg aactggagct ggagggagga gacgatatcg gtgatatcgg actgatgctt 5055

ctggccgtag taggggatga tggtgaactc ccaggcgggg atgagcttct tgagggaggc 5115

ctccaggatg gtggccttct gggtcttgta cttgaactgg agggacttgt tgacgatatc 5175

gaaggagagg gagttggaga tgatggtgtt gtaggacatg aaggtggcgc gcttgatggc 5235

ggtgccgtta tgggtgatca tccagcagag gtaggtgagc tcggcggcgc agagggcgat 5295

cttctcgccg gaggggcgct cgaagcgctc gacgaactgg cggacgagga ccttgggggg 5355

ggtcttgcag aggatatcga actggggcat ggtgctcaga tactacggct gatcgcgtag 5415

aggtactgag caaaacagat gtcagtaagg agaagagttg aatgaatgga agaagagtag 5475

gaaaggaggt atgggggaaa gatatacgta ctgatgcgga cgaagagaga aagaaggaaa 5535

aaagttgtgg gaggggaagg agggggaatc cttatatgga ggggcaagcg agaaggcgaa 5595

ttagtgggcg ggcttaagcc ctcgaccgcc gcccttatca ttggacatgg aggggtaatg 5655

cccccaccac gcatgtgcgg gaccgacgca gaatctgcac ggcggagtct cttccagact 5715

gttgactttt gggcgatgac tcttgttgct gcggcctttt gggtacacca acctcgttga 5775

tcttgtttcc ttggttctct ttcgctcgga gacccgacca tgaccccacc atcagtcact 5835

atcctgcctc gtcgataaaa attttttctt ccctctgatt gttacatagt atgtttccac 5895

ctttccggtg gatttcggac agtcaaactg ggcatcaacg cagtggtggg ctgcttcgtt 5955

tgctgcgtgt tgtacttgtt tgcatttgaa ccccgcggtc gttcgagtcc ttaattggtc 6015

cgctcccggt caacacccaa gcagctgtgg cccggccgag tggcgcctgt ctggtccaca 6075

gtaagcttgg cgtaatcatg gtcatagctg tttcctgtgt gaaattgtta tccgctcaca 6135

attccacaca acatacgagc cggaagcata aagtgtaaag cctggggtgc ctaatgagtg 6195

agctaactca cattaattgc gttgcgctca ctgcccgctt tccagtcggg aaacctgtcg 6255

tgccagctgc attaatgaat cggccaacgc gcggggagag gcggtttgcg tattgggcgc 6315

tcttccgctt cctcgctcac tgactcgctg cgctcggtcg ttcggctgcg gcgagcggta 6375

tcagctcact caaaggcggt aatacggtta tccacagaat caggggataa cgcaggaaag 6435

aacatgtgag caaaaggcca gcaaaaggcc aggaaccgta aaaaggccgc gttgctggcg 6495

tttttccata ggctccgccc ccctgacgag catcacaaaa atcgacgctc aagtcagagg 6555

tggcgaaacc cgacaggact ataaagatac caggcgtttc cccctggaag ctccctcgtg 6615

cgctctcctg ttccgaccct gccgcttacc ggatacctgt ccgccttttt cccttcggga 6675

agcgtggcgc tttctcatag ctcacgctgt aggtatctca gttcggtgta ggtcgttcgc 6735

tccaagctgg gctgtgtgca cgaacccccc gttcagcccg accgctgcgc cttatccggt 6795

aactatcgtc ttgagtccaa cccggtaaga cacgacttat cgccactggc agcagccact 6855

ggtaacagga ttagcagagc gaggtatgta ggcggtgcta cagagttctt gaagtggtgg 6915

cctaactacg gctacactag aagaacagta tttggtatct gcgctctgct gaagccagtt 6975

accttcggaa aaagagttgg tagctcttga tccggcaaac aaaccaccgc tggtagcggt 7035

ggtttttttg tttgcaagca gcagattacg cgcagaaaaa aaggatctca agaagatcct 7095

ttgatctttt ctacggggtc tgacgctcag tggaacgaaa actcacgtta agggattttg 7155

gtcatgagat tatcaaaaag gatcttcacc tagatccttt taaattaaaa atgaagtttt 7215

aaatcaatct aaagtatata tgagtaaact tggtctgaca gttaccaatg cttaatcagt 7275

gaggcaccta tctcagcgat ctgtctattt cgttcatcca tagttgcctg actccccgtc 7335

gtgtagataa ctacgatacg ggagggctta ccatctggcc ccagtgctgc aatgataccg 7395

cgagacccac gctcaccggc tccagattta tcagcaataa accagccagc cggaagggcc 7455

gagcgcagaa gtggtcctgc aactttatcc gcctccatcc agtctattaa ttgttgccgg 7515

gaagctagag taagtagttc gccagttaat agtttgcgca acgttgttgc cattgctaca 7575

ggcatcgtgg tgtcacgctc gtcgtttggt atggcttcat tcagctccgg ttcccaacga 7635

tcaaggcgag ttacatgatc ccccatgttg tgcaaaaaag cggttagctc cttcggtcct 7695

ccgatcgttg tcagaagtaa gttggccgca gtgttatcac tcatggttat ggcagcactg 7755

cataattctc ttactgtcat gccatccgta agatgctttt ctgtgactgg tgagtactca 7815

accaagtcat tctgagaata gtgtatgcgg cgaccgagtt gctcttgccc ggcgtcaata 7875

cgggataata ccgcgccaca tagcagaact ttaaaagtgc tcatcattgg aaaacgttct 7935

tcggggcgaa aactctcaag gatcttaccg ctgttgagat ccagttcgat gtaacccact 7995

cgtgcaccca actgatcttc agcatctttt actttcacca gcgtttctgg gtgagcaaaa 8055

acaggaaggc aaaatgccgc aaaaaaggga ataagggcga cacggaaatg ttgaatactc 8115

atactcttcc tttttcaata ttattgaagc atttatcagg gttattgtct catgagcgga 8175

tacatatttg aatgtattta gaaaaataaa caaatagggg ttccgcgcac atttccccga 8235

aaagtgccac ctgacgtcta agaaaccatt attatcatga cattaaccta taaaaatagg 8295

cgtatcacga ggccctttcg tctcgcgcgt ttcggtgatg acggtgaaaa cctctgacac 8355

atgcagctcc cggagacggt cacagcttgt ctgtaagcgg atgccgggag cagacaagcc 8415

cgtcagggcg cgtcagcggg tgttggcggg tgtcggggct ggcttaacta tgcggcatca 8475

gagcagattg tactgagagt gcaccatatg cggtgtgaaa taccgcacag atgcgtaagg 8535

agaaaatacc gcatcaggcg ccattcgcca ttcaggctgc gcaactgttg ggaagggcga 8595

tcggtgcggg cctcttcgct attacgccag ctggcgaaag ggggatgtgc tgcaaggcga 8655

ttaagttggg taacgccagg gttttcccag tcacgacgtt gtaaaacgac ggccagt 8712

<210> 4

<211> 23

<212> PRT

<213> 人工序列

<220>

<223> 合成构建体

<400> 4

Met Arg Ser Ser Leu Val Leu Phe Phe Val Ser Ala Trp Thr Ala Leu

1 5 10 15

Ala Ser Pro Ile Arg Arg Glu

20

<210> 5

<211> 270

<212> PRT

<213> 人工序列

<220>

<223> 合成构建体

<400> 5

Met Glu Val Ser Gln Asp Leu Phe Asn Gln Phe Asn Leu Phe Ala Gln

1 5 10 15

Tyr Ser Ala Ala Ala Tyr Cys Gly Lys Asn Asn Asp Ala Pro Ala Gly

20 25 30

Thr Asn Ile Thr Cys Thr Gly Asn Ala Cys Pro Glu Val Glu Lys Ala

35 40 45

Asp Ala Thr Phe Leu Tyr Ser Phe Glu Asp Ser Gly Val Gly Asp Val

50 55 60

Thr Gly Phe Leu Ala Leu Asp Asn Thr Asn Lys Leu Ile Val Leu Ser

65 70 75 80

Phe Arg Gly Ser Arg Ser Ile Glu Asn Trp Ile Gly Asn Leu Asn Phe

85 90 95

Asp Leu Lys Glu Ile Asn Asp Ile Cys Ser Gly Cys Arg Gly His Asp

100 105 110

Gly Phe Thr Ser Ser Trp Arg Ser Val Ala Asp Thr Leu Arg Gln Lys

115 120 125

Val Glu Asp Ala Val Arg Glu His Pro Asp Tyr Arg Val Val Phe Thr

130 135 140

Gly His Ser Leu Gly Gly Ala Leu Ala Thr Val Ala Gly Ala Asp Leu

145 150 155 160

Arg Gly Asn Gly Tyr Asp Ile Asp Val Phe Ser Tyr Gly Ala Pro Arg

165 170 175

Val Gly Asn Arg Ala Phe Ala Glu Phe Leu Thr Val Gln Thr Gly Gly

180 185 190

Thr Leu Tyr Arg Ile Thr His Thr Asn Asp Ile Val Pro Arg Leu Pro

195 200 205

Pro Arg Glu Phe Gly Tyr Ser His Ser Ser Pro Glu Tyr Trp Ile Lys

210 215 220

Ser Gly Thr Leu Val Pro Val Thr Arg Asn Asp Ile Val Lys Ile Glu

225 230 235 240

Gly Ile Asp Ala Thr Gly Gly Asn Asn Gln Pro Asn Ile Pro Asp Ile

245 250 255

Pro Ala His Leu Trp Tyr Phe Gly Leu Ile Gly Thr Cys Leu

260 265 270

Claims

1.一种分离的多核苷酸构建体，其以5’至3’的顺序包含以下元件：

2.如权利要求1所述的多核苷酸构建体，其中第一多核苷酸在细菌宿主细胞中具有启动子活性；优选地在原核生物宿主细胞中；更优选地在芽孢杆菌(Bacillus)宿主细胞中；最优选地在枯草芽孢杆菌(Bacillus subtilis)或地衣芽孢杆菌(Bacilluslicheniformis)细胞中具有启动子活性。

3.如权利要求1所述的多核苷酸构建体，其中第一多核苷酸在真菌宿主细胞中具有启动子活性；优选地在丝状真菌宿主细胞中，更优选地在曲霉属(Aspergillus)或木霉属(Trichoderma)宿主细胞中；最优选地在米曲霉(Aspergillus oryzae)、黑曲霉(Aspergillus niger)或里氏木霉(Trichoderma reesei)细胞中具有启动子活性。

4.如权利要求1所述的多核苷酸构建体，其中第一多核苷酸在真菌宿主细胞中具有启动子活性并且包含源自曲霉属或木霉属细胞的启动子或由其组成；更优选地，第一多核苷酸包含源自米曲霉、黑曲霉或里氏木霉细胞的启动子或由其组成；甚至更优选地，第一多核苷酸包含米曲霉、黑曲霉或里氏木霉细胞的真菌丙糖-磷酸盐异构酶启动子或由其组成；最优选地，第一多核苷酸包含SEQ ID NO:3的位置219-位置838中所示的启动子或由其组成。

5.如权利要求1-4中任一项所述的多核苷酸构建体，其中所述信号肽源自细菌信号肽；优选地，所述信号肽源自原核细胞；更优选地，所述信号肽源自芽孢杆菌细胞。

6.如权利要求1至4中任一项所述的多核苷酸构建体，其中所述信号肽源自真菌细胞；优选地，所述信号肽源自丝状真菌细胞；甚至更优选地，所述信号肽源自曲霉属或木霉属细胞；最优选地，所述信号肽源自米曲霉、黑曲霉或里氏木霉细胞。

7.如权利要求1-6中任一项所述的多核苷酸构建体，其中第二多核苷酸包含细菌启动子或由其组成，优选地第二多核苷酸包含来自噬菌体的启动子或由其组成，最优选地第二多核苷酸包含SEQ ID NO:3的位置949-位置1021所示的T7启动子或由其组成。

8.如权利要求1-7中任一项所述的多核苷酸构建体，其中第三多核苷酸编码酶；优选地是水解酶、异构酶、连接酶、裂解酶、氧化还原酶或转移酶；甚至更优选地是α-半乳糖苷酶、α-葡糖苷酶、氨肽酶、淀粉酶、β-半乳糖苷酶、β-葡糖苷酶、β-木糖苷酶、糖酶、羧肽酶、过氧化氢酶、纤维二糖水解酶、纤维素酶、壳多糖酶、角质酶、环糊精糖基转移酶、脱氧核糖核酸酶、内切葡聚糖酶、酯酶、葡糖淀粉酶、转化酶、漆酶、脂肪酶、甘露糖苷酶、变聚糖酶、氧化酶、果胶分解酶、过氧化物酶、植酸酶、多酚氧化酶、蛋白水解酶、核糖核酸酶、转谷氨酰胺酶、或木聚糖酶。

9.如权利要求8所述的多核苷酸构建体，其中所述第三多核苷酸编码酶的成熟形式。

10.一种微生物宿主细胞，其包含如权利要求1-9中任一项所定义的多核苷酸构建体。

11.如权利要求10所述的微生物宿主细胞，其是细菌宿主细胞；优选地是原核生物宿主细胞；更优选地是芽孢杆菌宿主细胞；最优选地是枯草芽孢杆菌或地衣芽孢杆菌细胞。

12.如权利要求10所述的微生物宿主细胞，其是真菌宿主细胞；优选地是丝状真菌宿主细胞，更优选地是曲霉属或木霉属宿主细胞；最优选地是米曲霉、黑曲霉或里氏木霉细胞。

13.生产感兴趣的多肽的方法，所述方法包含如下步骤：

c)培养如权利要求10-13中任一项所定义的微生物宿主细胞；并且，可任选地

d)回收该感兴趣的多肽。