CN1938427A

CN1938427A - 纤溶酶原和微纤溶酶原在浮萍中的表达

Info

Publication number: CN1938427A
Application number: CNA2005800101459A
Authority: CN
Inventors: D·斯潘塞; L·F·迪基; J·R·加斯达斯卡; X·王; K·M·考克斯; C·G·皮尔
Original assignee: Biolex Inc
Current assignee: Biolex Therapeutics Inc
Priority date: 2004-02-11
Filing date: 2005-02-11
Publication date: 2007-03-28
Also published as: BRPI0507613A; US20050262592A1; RU2006132394A; WO2005078109A2; WO2005078109A3; IL177435A0; NZ549537A; AU2005212431A1; US7659445B2; JP2007521834A; CA2555609A1; US8017836B2; EP1713921A2; KR20070004706A; US20100186126A1; AU2005212431B2; RU2394103C2

Abstract

本发明提供了在浮萍表达系统中生产重组纤溶酶原、微纤溶酶原(microplasminogen)及其片段的方法和组合物。浮萍表达系统可以用于生产高水平纤溶酶原和微纤溶酶原是本发明的新发现。浮萍产生的纤溶酶原和微纤溶酶原可以被活化产生具有蛋白酶活性的多肽。因此，本发明包括在浮萍中表达纤溶酶原、微纤溶酶原及其片段的方法，用表达纤溶酶原、微纤溶酶原及其片段的表达盒转化的浮萍植物，和包含编码纤溶酶原、微纤溶酶原及其片段的核苷酸序列的核酸，其中这些核苷酸序列被修饰以提高它们在浮萍中的表达。

Description

纤溶酶原和微纤溶酶原在浮萍中的表达

发明领域

本发明涉及重组蛋白生产系统。更具体地说，本发明涉及用于在浮萍中表达重组纤溶酶原和重组微纤溶酶原(microplasminogen)的方法和组合物。

发明背景

浮萍(duckweeds)是单子叶植物浮萍科(Lemnaceae)的唯一成员。五个属和38个种都是小的自由漂浮淡水植物，它们的地理范围跨越整个地球(Landolt(1986)Biosystematic Investigation on the Familyof Duckweeds：The Family of Lemnaceae-A Monograph StudyGeobatanischen Institut ETH，Stiftung Rubel，Zurich)。尽管是已知形态上最缩小的植物，但是大多数浮萍种具有大得多的植物的全部组织和器官，包括包括根、茎、花、种子和叶状体(fronds)。

各浮萍种已被广泛研究并存在大量文献详细描述它们的生态学、分类学、生活周期、新陈代谢、病害和虫害易感性、它们的生殖生物学、遗传结构和细胞生物学。(Hillman(1961)Bot.Review 27：221；Landolt(1986)Biosystematic Investigation on the Family ofDuckweeds：The Family of Lemnaceae-A Monograph StudyGeobatanischen Institut ETH，Stiftung Rubel，Zurich)。

浮萍的生长习性对于微生物培养方法来说是理想的。该植物通过新叶状体的无性出芽以类似于酵母中无性繁殖的肉眼可见方式迅速增殖。这种增殖通过从分生细胞无性出芽而发生。分生组织区小，且发现在叶状体的腹面表面上。分生细胞存在于两个叶窝(pockets)中，叶状体中脉的每个侧面一个。小的中脉区也是根起源和茎产生的部位，其将每个叶状体与其亲本叶状体连接。分生叶窝被组织瓣保护。叶状体从这些叶窝交替出芽。倍增时间依据种而变化，短至20-24小时。(Landolt(1957)Ber.Schweiz.Bot.Ges.67：271；Chang etal.(1977)Bull.Inst.Claern.Acad.Sin.24：19；Datko and Mudd(1970)Plant Physiol.65：16；Venkataraman et al.(1970)Z.Pflafzzenphysiol.62：316)。

浮萍的集约栽培产生最高的每单位时间生物量蓄积速度(LandoltandKandeler(1987)The Family of Lemrzaceae-A MonographicStudyVol.2：Phytochemistry，Physiology，Application，Bibliography，Veroffentlichungen des Geobotanischen InstitutesETH，Stiftung Rubel，Zurich)，干重蓄积范围是鲜重的6-15％(Tillberg et al.(1979)Physiol.Plant.46：5；Landolt(1957)Ber.Schweiz.Bot.Ges.67：271；Stomp，unpublished data)。已报道在变化条件下生长的许多浮萍种的蛋白含量范围是干重的15-45％(Chang et al(1977)Bull.Inst.Chem.Acad.Sin.24：19；Changand Chui(1978)Z.Pflalilzenpllysiol.89：9l；Porath et al.(1979)Aquatic Botany 7：272；Appenrothet al.(1982)Biochem.Physiol.Pflanz.177：251)。使用这些值，在浮萍中每升培养基的蛋白生产水平与酵母基因表达系统处于相同的数量级。

通过很多方法中的任何一种，用含有感兴趣核苷酸序列的表达盒可以有效转化浮萍植物或浮萍结节培养物，包括土壤杆菌介导的基因转移、弹道轰击或电穿孔。稳定的浮萍转化体可以通过用感兴趣的核苷酸序列和对选择剂提供抗性的基因转化浮萍细胞，随后在含有选择剂的培养基中培养该转化细胞而分离。参见授予Stomp等的美国专利6,040,498。

浮萍基因表达系统提供将对许多研究和商业应用有用的关键技术。对于植物分子生物学研究总体上，可以和酵母一样在实验室方便地操纵的分化植物系统提供了在其中分析分离基因的发育和生理作用的很快系统。对于有价值多肽的商品化生产，基于浮萍的系统具有许多优于现存微生物或细胞培养系统的优点。植物显示出与哺乳动物细胞相似的翻译后加工，克服了与微生物细胞生产有生物学活性的哺乳动物多肽相关的一个主要问题，而且其他人(Hiatt(1990)Nature 334：469)已经表明植物系统具有装配多亚单位蛋白的能力，这是微生物系统常常缺乏的能力。浮萍生物量扩大至重组蛋白商品化生产所需的水平比哺乳动物的相似扩大更快和更具成本效率，而且与其它建议的植物生产系统例如大豆和烟草不同，浮萍可以在完全限制和控制的生物量生产容器中生长，使得该系统整合入现有蛋白生产工业基础结构中容易得多。

因此，还有用于在浮萍中表达感兴趣蛋白的优化方法和组合物的需要。

发明概述

本发明提供了在浮萍表达系统中生产重组纤溶酶原、微纤溶酶原及其片段的方法和组合物。本发明的浮萍表达系统被优化生产高水平纤溶酶原和微纤溶酶原及其片段。浮萍产生的纤溶酶原和微纤溶酶原可以被活化产生具有蛋白酶活性的多肽。因此，本发明包括在浮萍中表达纤溶酶原和微纤溶酶原的方法，用表达纤溶酶原和微纤溶酶原的表达盒转化的浮萍植物，和包含编码纤溶酶原、微纤溶酶原的核苷酸序列的核酸，其中这些核苷酸序列被修饰以提高它们在浮萍中的表达。

因此，在一个实施方案中，本发明提供了一种在浮萍中生产纤溶酶原的方法，其中所述方法包括步骤：培养浮萍植物或浮萍植物细胞，其中浮萍植物或浮萍植物细胞被包含编码纤溶酶原的核苷酸序列的核酸分子稳定转化；和从所述浮萍植物或浮萍植物细胞收集纤溶酶原。在一些实施方案中，编码纤溶酶原的核苷酸序列与编码信号肽的核苷酸序列可操作地连接。

在另一个实施方案中，本发明提供了一种在浮萍中生产微纤溶酶原的方法，其中该方法包括步骤：在浮萍培养基内培养浮萍植物培养物或浮萍结节(nodule)培养物，其中浮萍植物培养物或浮萍结节培养物被核酸分子稳定转化，该核酸分子包含编码微纤溶酶原的核苷酸序列和可操作地连接的指导微纤溶酶原分泌到培养基的信号肽的编码序列；和从浮萍培养基中收集微纤溶酶原。

本发明也包括用能够在浮萍中表达纤溶酶原或微纤溶酶原的表达盒转化的浮萍植物、浮萍结节和浮萍植物细胞。也提供的是包含编码纤溶酶原或微纤溶酶原的核苷酸序列的核酸分子，其中核苷酸序列包含对浮萍优化的密码子。

如下给出的本发明说明中更详细公开了本发明的这些和其它方面。

附图简述

图1显示了用ELISA测定的用纤溶酶原表达构建体BAP01转化的56个浮萍系的组织匀浆中的纤溶酶原水平。纤溶酶原水平用匀浆中总可溶蛋白的百分比表示。其它细节参见实验部分的实施例1。

图2显示了通过用tPA活化浮萍产生的纤溶酶原而产生的纤溶酶的活性。其它细节参见实验部分的实施例1。

图3显示了与链激酶活化后纤溶酶活性相比，用ELISA定量的纤溶酶原。对于被测的系，用ELISA定量和链激酶活性试验给出了相当的值，表明浮萍属(Lemna)产生的纤溶酶原具有与对照蛋白相似的比活性。其它细节参见实验部分的实施例1。

图4显示了掺入浮萍属组织提取物的人纤溶酶原的稳定性。其它细节参见实验部分的实施例1。

图5显示了冷冻/融化后，用活性试验测定的组织提取物中浮萍属纤溶酶原的稳定性。其它细节参见实验部分的实施例1。

图6显示了尿激酶或tPA活化浮萍属产生的纤溶酶原后，纤溶酶的形成。“BAP”指浮萍属产生的纤溶酶原。左图显示了用组织纤溶酶原激活物(tPA)活化，右图显示了用尿激酶(uK)活化。其它细节参见实验部分的实施例1。

图7显示了用ELISA测定的培养基中来自用微纤溶酶原表达构建体BAMP01转化的79个浮萍系的微纤溶酶原浓度。其它细节参见实验部分的实施例2。

图8显示了以tPA活化后，浮萍属产生的微纤溶酶原的酶谱分析。该图显示了有活性蛋白水解条带的存在，它在浓缩对照培养基中不存在。其它细节参见实验部分的实施例2。

发明详述

本发明描述了在浮萍表达系统中生产重组纤溶酶原、微纤溶酶原及其片段的方法和组合物。浮萍表达系统可以用于生产高水平纤溶酶原和微纤溶酶原是本发明的新发现。浮萍产生的纤溶酶原和微纤溶酶原可以被活化产生具有蛋白酶活性的多肽。

纤溶酶原是纤溶酶的无活性前体形式，纤溶酶是哺乳动物中主要的纤维蛋白溶酶。纤溶酶在细胞迁移、组织重塑和细菌侵入中也起重要作用。纤溶酶是优先切割Lys-|-Xaa和Arg-|-Xaa键的丝氨酸蛋白酶，比胰蛋白酶具有更高的选择性。纤溶酶原激活物如组织纤溶酶原激活物(tPA)或尿激酶在人纤溶酶原分子的Arg₅₆₀-Val₅₆₁键处切割，产生有活性的纤溶酶。两个所产生的纤溶酶链通过两个链间二硫桥结合在一起。轻链(25kDa)携带催化中心(包含催化三单元组(triad))和与胰蛋白酶和其它丝氨酸蛋白酶享有序列相似性。重链(60kDa)由五个非常相似的被称为kringles的三环结构组成。一些kringles含有调节纤溶酶原/纤溶酶与纤维蛋白相互作用的赖氨酸结合部位。纤溶酶属于肽酶S1家族。

微纤溶酶原(microplasminogen)由纤溶酶原的酶原结构域组成，其N-末端连接了一段连接肽和kringle 5的一些残基。它是在纤溶酶对纤溶酶原的作用下产生的。参见例如Shi et al.(1980)J.BioL.Chem.263：17071-5。如同纤溶酶原一样，微纤溶酶原被tPA和尿激酶活化形成蛋白水解活性分子。人微纤溶酶(microplasmin)具有大约29kDa的分子量，与纤溶酶相比时对纤维蛋白的亲合力较低。

建议纤溶酶和微纤溶酶用于许多应用中的溶血栓疗法，包括治疗心肌梗塞、闭塞性中风(occlusive stroke)、深静脉血栓形成和外周动脉病变。参见例如美国专利5,407,673、美国专利6,355,243、美国专利申请号20030175264、Lapchak et al.(2002)Stroke 33：2279-2284和Nagai et al.(2003)J.Thromb.Haemost.1：307-13，每篇的全部内容在此引入作为参考。在这种治疗中使用纤溶酶和微纤溶酶的一个目的是避免使用纤溶酶原激活物如tPA、尿激酶和链激酶治疗的副作用。这种副作用包括胃肠和颅内出血。然而，纤溶酶和微纤溶酶作为治疗剂的用途已经部分受到难以产生大量稳定纤溶酶原和微纤溶酶原前体蛋白的限制。

尽管在重组系统中大量表达纤溶酶原是获得用于溶栓疗法的纤溶酶原的方便方法，但是由于在哺乳动物细胞类型中几乎普遍存在胞内纤溶酶原激活物，因而在表达系统中表达完整人纤溶酶原存在巨大困难。这些活化剂的存在导致产生的纤溶酶原降解。参见例如Busy etal.(1988)Fibrinolysis 2：64。

本发明通过提供能够表达高水平稳定纤溶酶原和微纤溶酶原的表达系统，解决了这个问题。因此，在一个实施方案中，本发明提供了一种在浮萍中生产纤溶酶原的方法，其中所述方法包括步骤：培养浮萍植物或浮萍植物细胞，其中浮萍植物或浮萍植物细胞被包含编码纤溶酶原的核苷酸序列的核酸分子稳定转化；和从所述浮萍植物或浮萍植物细胞收集纤溶酶原。编码纤溶酶原的核苷酸序列可以与编码信号肽的核苷酸序列可操作地连接。

本发明的方法可以用于在浮萍中表达高水平纤溶酶原。因此，在该方法的一些实施方案中浮萍植物或浮萍植物细胞中至少约1％、至少约2％、至少约3％、至少约4％、至少约5％、至少约6％、至少约7％或至少约8％的可溶蛋白是纤溶酶原。

本发明还提供了在浮萍中生产稳定的纤溶酶原的方法的改进，其中改进包括在浮萍中生产该纤溶酶原。浮萍属生产的纤溶酶原是稳定的且当在浮萍属组织提取物中贮藏过夜时，其活性丧失小于10％。浮萍属生产的纤溶酶原在浮萍属组织提取物中在冻融循环后也经历小于10％的降解。

在另一个实施方案中，本发明提供了一种在浮萍中生产微纤溶酶原的方法，其中该方法包括步骤：在浮萍培养基内培养浮萍植物培养物或浮萍结节培养物，其中浮萍植物培养物或浮萍结节培养物被核酸分子稳定转化，该核酸分子包含编码微纤溶酶原的核苷酸序列和可操作地连接的指导微纤溶酶原分泌到培养基中的信号肽的编码序列；和从浮萍培养基中收集微纤溶酶原。

本发明的方法可以用于在浮萍中表达高水平微纤溶酶原。因此，在该方法的一些实施方案中，用定量Western印迹测定，浮萍培养基含有至少约1mg/L、至少约2mg/L、至少约5mg/L微纤溶酶原、至少约10mg/L微纤溶酶原、至少约15mg/L微纤溶酶原、至少约20mg/L微纤溶酶原。

本发明提供了一种在浮萍中生产纤溶酶原片段的方法，其中所述方法包括步骤：培养浮萍植物或浮萍植物细胞，其中浮萍植物或浮萍植物细胞被包含编码纤溶酶原片段的核苷酸序列的核酸分子稳定转化；和从所述浮萍植物、浮萍植物细胞或浮萍培养基收集纤溶酶原片段。编码纤溶酶原的核苷酸序列可以与编码信号肽的核苷酸序列可操作地连接。

在本发明方法的一些实施方案中，包含编码纤溶酶原、微纤溶酶原或其片段的核苷酸序列的核酸分子被修饰以提高它在浮萍中的表达。这种修饰的实例包括在纤溶酶原、微纤溶酶原的编码序列中使用浮萍优选的密码子，使用包含插入在编码序列上游的植物内含子的可操作地连接核苷酸序列；和使用增加编码纤溶酶原或微纤溶酶原的核苷酸序列翻译的前导序列。在一些实施方案中，两个或更多这些修饰联合使用。在编码纤溶酶原的核苷酸序列与编码信号肽的核苷酸序列可操作地连接的情况下，编码信号肽的核苷酸序列也可以包含浮萍优选密码子。

本发明还包括能够在浮萍中表达纤溶酶原或微纤溶酶原的表达盒转化的浮萍植物、浮萍结节和浮萍植物细胞。也提供的是包含编码纤溶酶原或微纤溶酶原的核苷酸序列的核酸分子，其中核苷酸序列包含对浮萍优化的密码子。

定义：

“多肽”是指任何单体或多体蛋白质或肽。

“生物学活性多肽”是指具有执行一种或多种生物学功能的能力或具有在生物背景中正常归因于该多肽的一组活性的多肽。在蛋白酶前体如纤溶酶原或微纤溶酶原的上下文中，生物学活性包括多肽被活化产生有蛋白水解活性的分子的能力。纤溶酶原或微纤溶酶原活化后的蛋白水解活性可以通过本领域已知的任何试验来测定，包括在本文其它地方描述的基于使用显色底物的试验。

术语“表达”或“生产”是指基因产物的生物合成，包括所述基因产物的转录、翻译和装配。

术语“浮萍”是指浮萍科成员。这个科目前被分成如下五个属和38个种的浮萍：浮萍属(Lemna)(L.aequinoctialis，L.disperma，L.ecuadorierasis，L.gibba，L.japonica，L.minor，L.miniscula，L.obscura，L.perpusilla，L.tenera，L.trisulca，L.turionifera，L.valdiviana)；紫萍属(Spirodela)(S.intermedia，S.polyrrhiza，S.punctata)；无根萍属(Wolffia)(Wa.angusta，Wa.arrhiza，Wa.australina，Wa.borealis，Wa.brasiiliensis，Wa.columbiana，Wa.elongata，Wa.globosa，Wa.microscopica，Wa.neglecta)；Wolfiella属(Wl.caudata，Wl.denticulata，Wl.gladiata，Wl.hyalina，Wl.lingulata，Wl.repunda，Wl.rotunda和Wl.neotropica)和Landoltia属(L.punctata)。浮萍科的任何其它属或种，如果它们存在，也是本发明的方面。可以使用Landolt(1986)Biosystematic Investigation onthe Family of Duckweeds：The family of Lemnaceae-A MonographStudy Geobatanischen Institut ETH，Stiftung Rubel，Zurich描述的分类系统对浮萍属的种进行分类。

在此使用的术语“浮萍结节培养物(duckweed nodule culture)”是指包含浮萍细胞的培养物，其中至少约50％、55％、60％、65％、70％、75％、80％、85％、90％、95％或100％的细胞是分化细胞。在此使用的“分化细胞”是具有将它与未分化细胞或在其它组织类型中发现的细胞区别开来的至少一个表型特征(例如与众不同的细胞形态或标志核酸或蛋白表达)的细胞。在此描述的浮萍结节培养物的分化细胞形成在它们相邻细胞壁融合的互连细胞的覆瓦状平滑表面，结节已开始组织成叶状体原基散布于整个组织。结节培养物组织的表面具有通过plasmadesmata彼此连接的表皮细胞。

在此使用的“浮萍优选的密码子”是指浮萍中的密码子使用频率大于17％的密码子。

在此使用的“浮萍属优选的密码子”是指浮萍属中的密码子使用频率大于17％的密码子。

在此使用的“Lemna gibba优选的密码子”是指Lemna gibba中的密码子使用频率大于17％的密码子。

“翻译起始密码子”是指启始从感兴趣核苷酸序列转录的mRNA翻译的密码子。

在此使用的“翻译起始邻近核苷酸序列(translation initiationcontext nucleotide sequences)”是指在翻译起始密码子5′紧挨着的三个核苷酸的身份。

在此使用的“分泌”是指多肽穿过宿主植物细胞质膜的转运。在本发明的一些实施方案中，多肽保留在质外体内，质外体是质膜和细胞壁之间的区域。在其它实施方案中，多肽转运穿过植物宿主细胞的细胞壁。

在此使用的关于核苷酸序列的“可操作地连接”是指被置于相互具有功能关系的位置的多个核苷酸序列。通常，可操作地连接的DNA序列是连续的，在必要时以符合阅读框的方式连接两个蛋白编码区。

A.表达盒

根据本发明，稳定转化的浮萍是通过用包含编码纤溶酶原的核苷酸序列或编码微纤溶酶原的核苷酸序列的表达盒转化获得的。该表达盒包含与感兴趣核酸或基因连接的转录起始区。这种表达盒具备用于在调节区转录调节下插入编码感兴趣蛋白的核苷酸序列的多个限制性酶切位点。该表达盒可以编码感兴趣的单个基因。在本发明的特定实施方案中，待转移的核酸含有两个或更多表达盒，每个表达盒编码至少一个感兴趣的基因。

转录起始区(例如启动子)可以是对宿主是天然的或同源的或外来的或异源的，或可以是天然序列或合成序列。对于外来的，其意思是在转录起始区引入其中的野生型宿主中没有发现该转录起始区。在此使用的嵌合基因包含可操作地连接与编码序列异源的转录起始区的编码序列。

根据本发明可以使用本领域已知的任何合适启动子(包括细菌、酵母、真菌、昆虫、哺乳动物和植物启动子)。例如，可以使用植物启动子，包括浮萍启动子。示例启动子包括但不限于花椰菜花叶病毒35S启动子、冠瘿碱合成酶启动子(例如nos、mas、ocs等等)、泛素启动子、肌动蛋白启动子、核酮糖二磷酸(RubP)羧化酶小亚基启动子和醇脱氢酶启动子。浮萍RubP羧化酶小亚基启动子是本领域已知的(Silverthorne et al.(1990)Plant Mol.Biol.15：49)。感染植物优选浮萍的其它病毒启动子也合适，包括但不限于从芋花叶病毒、小球藻病毒(例如小球藻病毒腺嘌呤甲基转移酶启动子；Mitra et al.(1994)Plant Mol.Biol.26：85)、番茄斑萎病毒、烟草脆裂病毒、烟草坏死病毒、烟草环斑病毒、番茄环斑病毒、黄瓜花叶病毒、花生残干病毒、苜蓿花叶病毒、甘蔗baciliform badnavirus等分离的启动子。

最后，可以选择给出期望水平调节的启动子。例如，在有些情况下，使用给予组成型表达(例如来自根癌土壤杆菌(Agrobacteriumtumefaciens)的甘露碱合酶启动子)的启动子可能有利。可供选择地，在其它情况下，使用对具体环境刺激(例如热休克基因启动子、干旱诱导型基因启动子、病原体诱导型基因启动子、创伤诱导型基因启动剂和明/暗诱导型基因的启动子)或植物生长调节剂(例如脱落酸、生长素、细胞分裂素和赤霉酸诱导的基因的启动子)或其它化合物如乙醇或乙烯应答而活化的启动子可能有利。作为进一步的选择，可以选择给予组织特异性表达的启动子(例如根、叶和花特异性启动子)。

给定启动子的总强度可受顺式作用核苷酸序列如上游活化序列的联合和空间组织的影响。例如，来源于根癌土壤杆菌章鱼碱合酶基因的活化核苷酸序列可以提高从根癌土壤杆菌甘露碱合酶启动子转录(参见授予Gelvin等的美国专利5,955,646)。在本发明中，表达盒可以含有插入在启动子序列上游的活化核苷酸序列以提高感兴趣核苷酸序列的表达。在一个实施方案中，表达盒包含来源于根癌土壤杆菌章鱼碱合酶基因的三个上游活化序列，其与来源于根癌土壤杆菌甘露碱合酶基因的启动子可操作地连接(参见美国专利5,955,646，在此引入作为参考)。

转录盒从5′-3′转录方向包括转录和翻译起始区、感兴趣核苷酸序列和在植物中起作用的转录和翻译终止区。根据本发明可以使用本领域已知的任何合适终止序列。终止区可以是转录起始区天然的，可以是感兴趣核苷酸序列天然的，或可以来源于另一个来源。方便的终止区可以从根癌土壤杆菌的Ti质粒获得，如章鱼碱合成酶和胭脂碱合成酶终止区。也参见Guerineau et al.(1991)Mol.Gen.Genet.262：141；Proudfoot(1991)Cell 64：671；Sanfacon et al.(1991)GenesDev.5：141；Mogen et al.(1990)Plant Cell 2：1261；Munroe etal.(1990)Gene 91：151；Ballas et al.(1989)Nucleic Acids Res.17：7891；和Joslzi et al.(1987)Nucleic Acids Res.15：9627。另外的示例终止序列是豌豆RubP羧化酶小亚基终止序列和花椰菜花叶病毒35S终止序列和来自很多植物种的泛素终止子。其它合适的终止序列对本领域技术人员来说是显而易见的。

表达盒可以含有一个以上待转移和在转化植物中表达的基因或核酸序列。因此，每个核酸序列将与5′和3′调节序列可操作地连接。可供选择地，可以提供多个表达盒。

通常，表达盒将包含用于选择转化细胞或组织的选择性标记基因。选择性标记基因包括编码抗生素抗性的基因，如编码新霉素磷酸转移酶II(NEO)、新霉素磷酸转移酶III和潮霉素磷酸转移酶(HPT)的基因，以及赋予除草剂化合物抗性的基因。除草剂抗性基因通常编码对除草剂不敏感的修饰靶蛋白或在除草剂可作用前在植物中降解除草剂或使其解毒的酶。参见DeBlock et al.(1987)EMBO J.6：2513；DeBlock et al.(19，89)Plant Physio.91：691；Fromm et al.(1990)Bio Technology 8：833；Gordon-Kamm et al.(1990)PlantCell 2：603；和Frisch et al.(1995)Plant Mol.Biol.27：405-9。例如，使用编码突变靶酶5-烯醇式丙酮酰莽草酸-3-磷酸合成酶(EPSPS)和乙酰乳酸合酶(ALS)的基因已经获得了对glyphosphate或磺酰脲类除草剂的抗性。通过使用编码使各自的除草剂脱毒的膦丝菌素乙酰转移酶、腈水解酶或2，4-二氯苯氧乙酸单加氧酶的细菌基因已经获得了对草铵膦、boromoxynil和2，4-二氯苯氧乙酸(2，4-D)的抗性。

为了本发明目的，选择性标记基因包括但不限于编码新霉素磷酸转移酶II的基因(Fraley et al.(1986)CRC Critical Reviews inPlant Science 4：1)、新霉素磷酸转移酶III(Frisch et al.(1995)Plant Mol.Biol.27：405-9)、氰酰胺水合酶(Maier-Greineret al.(1991)Proc.Natl.Acad.Sci.USA 88：4250)；天冬氨酸激酶；二氢吡啶二羧酸合酶(Perl et al.(1993)BioTechnology 11：715)；bar基因(Toki et al.(1992)Plant Physiol.100：1503；Meagher et al.(1996)Crop Sci.36：1367)；色氨酸脱羧酶(Goddijnet al.(1993)Plant Mol.Biol.22：907)；新霉素磷酸转移酶(NEO；Southern et al.(1982)J.Mol.Appl.Gen.1：327)；潮霉素磷酸转移酶(HPT or HYG；Shimizu et al.(1986)Mol.Cell.Biol.6：1074)；二氢叶酸还原酶(DHFR；Kwok et al.(1986)Proc.Natl.Acad.Sci.USA 83：4552)；膦丝菌素乙酰转移酶(DeBlock et al.(1987)EMBO J.6：2513)；2，2-二氯丙酸脱卤素酶(Buchanan-Wollatron et al.(1989)J.Cell.Biochem.13D：330)；乙酰羟酸合酶(授予Anderson等的美国专利4,761,373；Haufhn et al.(1988)Mol.Gen.Genet.221：266)；5-烯醇式丙酮酰莽草酸-3-磷酸合酶(aroA；Comai et al.(1985)Nature 317：741)；卤代芳基腈水解酶(haloarylnitrilase)(Stalker等的WO 87/04181)；乙酰辅酶A羧化酶(Parker et al.(1990)Plant Physiol.92：1220)；二氢蝶酸合酶(sulI；Guerineau et al.(1990)Plant Mol.Biol.15：127)；和32kDa光系统II多肽(psbA；Hirschberg et al.(1983)Science 222：1346(1983)。

也包括编码庆大霉素(例如aacCl，Wohlleben et al.(1989)Mol.Gen.Genet.217：202-208)；氯霉素(Herrera-Estrella et al.(1983)EMBOJ.2：987)；氨甲蝶呤(Herrera-Estrella et al.(1983)Nature 303：209；Meijer et al.(1991)Plant Mol.Biol.16：807)；潮霉素(Waldron et al.(1985)Plant Mol.Biol.5：103；Zhijian et al.(1995)Plant Science 108：219；Meijer et al.(1991)Plant Mol.Bio.16：807)；链霉素(Jones et al.(1987)Mol.Gen.Genet.210：86)；壮观霉素(Bretagne-Sagnard et al.(1996)Transgenic Res.5：131)；博莱霉素(Hille etal.(1986)PlantMol.Biol.7：171)；磺胺(Guerineauetal.(1990)Plant MoL Bio.15：127)；溴苯腈(Stalkeretal.(1988)Science 242：419)；2，4-D(Streber et al.(1989)BioTechnology 7：811)；膦丝菌素(DeBlock etal.(1987)EMBO J.6：2513)；壮观霉素(Bretagne-Sagnard and Chupeau，TransgenicResearch 5：131)抗性的基因。

bar基因赋予对草铵膦型除草剂，如膦丝菌素(PPT)或双丙氨酰膦的除草剂抗性。如上所述，可用于载体构建体的其它选择性标记包括但不限于pat基因，也是提供双丙氨酰膦和膦丝菌素抗性、ALS基因提供咪唑啉酮类抗性、HPH或HYG提供潮霉素抗性、EPSP合酶基因提供草甘膦抗性、Hm1基因提供Hc-毒素抗性和常规使用和本领域普通技术人员已知的其它选择剂。参见Yarranton (1992)Curr.Opina.Biotech.3：506；Chistopherson et al.(1992)Proc.Natl.Acad.Sci.USA 89：6314；Yao et al.(1992)Cell 71：63；Reznikoff(1992)Mol.Microbiol.6：2419；Barkley et al.(1980)The Operon177-220；Hu et al.(1987)Cell 48：555；Brown etal.(1987)Cell49：603；Figge et al.(1988)Cell 52：713；Deuschle et al.(1989)Proc.Natl.Acad.Sci.USA 86：5400；Fuerst et al.(1989)Proc.Natl.Acad.Sci.USA 86：2549；Deuschle et al.(1990)Science 248：480；Labow et al.(1990)Mol.Cell.Biol.10：3343；Zambretti et al.(1992)Proc.Natl.Acad.Sci.USA 89：3952；Baim et al.(1991)Proc.Natl.Acad.Sci.USA 88：5072；Wyborskiet al.(1991)Nuc.Acids Res.19：4647；Hillenand-Wissman(1989)Topics in Mol.And Struc.Biol.10：143；Degenkolb et al.(1991)Antifyticrob.Agents Chemother.35：1591；Kleinsclmidtet al.(1988)Biochemistry 27：1094；Gatz et al.(1992)Plant J.2：397；Gossenetal.(1992)Proc.Natl.Acad.Sci.USA 89：5547；Oliva et al.(1992)Antimicrob.Agents Chemother.36：913；Hlavlca et al.(1985)Handbook of Experimental Pharmacology78；和Gillet al.(1988)Nature 334：721。这些公开物在此引入作为参考。

选择性标记基因的上述明细表不意指限制。本发明可以使用任何致死或非致死选择性标记基因。

B.纤溶酶原和微纤溶酶原

本发明涉及在浮萍中表达纤溶酶原、微纤溶酶原及其片段的方法和组合物。待在浮萍中表达的纤溶酶原可以来自任何哺乳动物来源。在一些实施方案中，纤溶酶原是人或猪的。在特殊实施方案中，纤溶酶原具有SEQ ID NO：4所示的人纤溶酶原的氨基酸序列。在其它实施方案中，纤溶酶原是SEQ ID NO：4所示氨基酸序列的生物学活性变异体。

类似地，待在浮萍中表达的微纤溶酶原可以来自任何哺乳动物来源。在一些实施方案中，微纤溶酶原是人或猪的。在特殊实施方案中，微纤溶酶原具有SEQ ID NO：6所示的人微纤溶酶原的氨基酸序列。在其它实施方案中，纤溶酶原是SEQ ID NO 6所示氨基酸序列的生物学活性变异体。

可以根据本发明生产纤溶酶原或微纤溶酶原的片段。这种片段可以包含纤溶酶原蛋白的至少50、至少60、至少70、至少80、至少90、至少95、至少101、至少150、至少200、至少250、至少300、至少350、至少377、至少400、至少450、至少500、至少550、至少600、至少650、至少700或至少750个连续氨基酸。根据本发明可以生产的片段实例包括小纤溶酶原(miniplasminogen)和制管张素。O′Reillyet al.(1994)Cell 79：315-28；Sim et al.(1997)Cancer Res.57：1329-34；美国专利5,972,896和美国专利出版物20020164717、20020037847和20010016644中给出了纤溶酶原或微纤溶酶原片段的非限制性实例；每篇文献的全部内容在此引入作为参考。在一些实施方案中，该片段保持纤溶酶原或微纤溶酶原的酶活性，例如蛋白酶活性。

纤溶酶原或微纤溶酶原的“生物学活性变异体”是通过以下修饰由这些多肽获得的多肽：在天然蛋白N-末端和/或C-末端缺失(所谓的截短)或添加一个或多个氨基酸；在该蛋白中一个或多个位点缺失或添加一个或多个氨基酸；或在该蛋白中一个或多个位点置换一个或多个氨基酸。本发明包括的生物学活性变异体纤溶酶原和微纤溶酶原多肽具有生物学活性，也就是说它们能够被活化产生具有纤溶酶家族蛋白酶(酶分类3.4.21.7)的蛋白酶活性的蛋白。这种生物学活性变异体可以由例如遗传多态性或人操作产生。根据本发明的纤溶酶原或微纤溶酶原的生物学活性变异体将与SEQ ID NO：4或SEQ ID NO：6所示氨基酸序列具有至少约50％、60％、65％、70％，通常至少约75％、80％、85％，优选至少约90％、91％、92％、93％、94％、95％、96％、97％，如至少约98％、99％或更高的序列同一性。因此，本发明纤溶酶原或微纤溶酶原的生物学活性变异体可以和SEQ ID NO：4和SEQ ID NO：6所示氨基酸序列相差少至1-15个氨基酸残基，少至1-10个氨基酸残基，如6-10个氨基酸残基，少至5个氨基酸残基，或少如4、3、2，或甚至1个氨基酸残基。纤溶酶原生物学活性变异体的实例是本领域已知的并且在例如美国专利5,190,756中描述。为了保持生物学活性，任何置换将优选在性质上保守，截短和置换通常将在不是蛋白酶活性所需的残基中进行。作为纤溶酶/纤溶酶原和微纤溶酶/微纤溶酶原活性基础的残基和结构域是本领域已知的并且例如Kolev et al(1997)J.Biol.Chem.272：13666-675；de los Santos et al.(1997)CibaFound.Symp.212：66-76，Peisach et al.(1999)Biocheinistry 38：11180-11188，和Turner et al.(2002)J.Biol.Chem.277：33-68-74)中已描述；每篇的全部内容在此引入作为参考。

序列的比较和两个序列之间同一性百分比和相似性百分比的测定可以使用数学算法完成。在优选实施方案中，使用Needleman andWunsch(1970)J.mol.bol 48：444-453算法测定两个氨基酸序列之间同一性百分比，其合并在GCG软件包的GAP程序中(可从www.accelrys.com得到)，使用BLOSSUM62矩阵或PAM250矩阵，和16、14、12、10、8、6或4的缺口权重和1、2、3、4、5或6的长度权重。在又一个优选实施方案中，使用GCG软件包中的GAP程序，使用BLOSUM62记分矩阵(参见Henikoff et al.(1989)Proc.Natl.Acad.Sci.USA 89：10915)和40、50、60、70或80的缺口权重和1、2、3、4、5或6的长度权重测定两个核苷酸序列之间的同一性百分比。特别优选的参数组(和如果实施人员不能断定应该应用什么参数来测定分子是否在本发明序列同一性限度内的话，应该使用的参数组)是使用60的缺口权重和3的长度权重的BLOSUM62记分矩阵。

还可以使用E.Meyers and W.Miller(1989)CABIOS 4：11-17的算法测定两个氨基酸或核苷酸序列之间的同一性百分比，其已经合并在ALIGN程序(2.0版本)中，使用PAM120权重残基表、12的缺口长度罚分和4的缺口罚分。

C.用于提高在浮萍中表达的核苷酸序列修饰

在一些实施方案中，本发明提供了所表达核苷酸序列的修饰以提高其在浮萍中的表达。一个这种修饰是使用浮萍优选密码子合成编码纤溶酶原或微纤溶酶原的核苷酸序列。可以利用本领域合成具有植物优选密码子的核苷酸序列的方法。参见例如美国专利5,380,831和5,436,391；Perlak et al.(1991)Proc.Natl.Acad.Sci.USA 15：3324；Iannacome et al.(1997)Plant Mol.Biol.34：485；和Murrayet al.，(1989)Nucleic Acids.Res.17：477，在此引入作为参考。优选密码子可以由浮萍中表达的蛋白的最高频率密码子来确定。因此，浮萍中特定密码子的使用频率可以通过分析一组浮萍编码序列中的密码子使用来测定。许多浮萍编码序列是本领域技术人员已知的；参见例如，GenBank_数据库中所含序列，该数据库可以通过位于马里兰州Bethesda的国立医学图书馆分部，国立生物技术信息中心的网址进入。显示基于最近GenBank_发布中所含序列的密码子使用频率的表可以在日本千叶的Kazusa DNA Research Institute网址找到；参见www.kazusa.orjp/codon/。Nakamura et al.(2000)Nucl.Acids Res.28：292中描述了这个数据库。

可以认识到，为在浮萍及其他单子叶植物中表达已优化的基因可以用在本发明的方法中。参见例如EP 0 359 472、EP 0 385 962、WO91/16432；Perlak et al.(1991)Proc.Natl.Acad.Sci.USA 88：3324；Iamlacome et al.(1997)Plant Mol.Biol.34：485和Murrayet al.(1989)Nuc.Acids Res.17：477等等，在此引入作为参考。可以进一步认识到，全部或部分基因序列可以被优化或合成。换言之，也可以使用完全优化或部分优化的序列。例如，40％、45％、50％、55％、60％、65％、70％、75％、80％、85％、87％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或100％的密码子可以是浮萍优选密码子。例如，在一些实施方案中，编码纤溶酶原或微纤溶酶原的核苷酸序列包含50-100％的浮萍优选密码子或70-100％的浮萍优选密码子。在一个实施方案中，90至96％的密码子是浮萍优选密码子。感兴趣核苷酸序列的编码序列可以包含在浮萍中以至少17％的频率使用的密码子。Lemna gibba(表1)和Lemna minor(表2)的密码子使用显示如下。在一些实施方案中，表1或表2用于选择浮萍优选密码子。在特定实施方案中，浮萍密码子优化的编码纤溶酶原的序列是SEQ ID NO：3所示的序列，浮萍密码子优化的编码微纤溶酶原的序列是SEQ ID NO：5所示的核苷酸序列。

表1：来自GenBank_ Release 139*的Lemna gibba密码子使用

氨基酸密码子数量 /1000 分数

Gly GGG 57.00 28.89 0.35

Gly GGA 8.00 4.05 0.05

Gly GGT 3.00 1.52 0.02

Gly GGC 93.00 47.14 0.58

Glu GAG 123.00 62.34 0.95

Glu GAA 6.00 3.04 0.05

Asp GAT 6.00 3.04 0.08

Asp GAC 72.00 36.49 0.92

Val GTG 62.00 31.42 0.47

Val GTA 0.00 0.00 0.00

Val GTT 18.00 9.12 0.14

Val GTC 51.00 25.85 0.39

Ala GCG 44.00 22.30 0.21

Ala GCA 14.00 7.10 0.07

Ala GCT 14.00 7.10 0.07

Ala GCC 139.00 70.45 0.66

Arg AGG 16.00 8.11 0.15

Arg AGA 11.00 5.58 0.10

Ser AGT 1.00 0.51 0.01

Ser AGC 44.00 22.30 0.31

Lys AAG 116.00 58.79 1.00

Lys AAA 0.00 0.00 0.00

Asn AAT 2.00 1.01 0.03

Asn AAC 70.00 35.48 0.97

Met ATG 67.00 33.96 1.00

Ile ATA 4.00 2.03 0.06

Ile ATT 0.00 0.00 0.00

Ile ATC 63.00 31.93 0.94

Thr ACG 19.00 9.63 0.25

Thr ACA 1.00 0.51 0.01

Thr ACT 6.00 3.04 0.08

Thr ACC 50.00 25.34 0.66

Trp TGG 45.00 22.81 1.00

End TGA 4.00 2.03 0.36

Cys TGT 0.00 0.00 0.00

Cys TGC 34.00 17.23 1.00

End TAG 0.00 0.00 0.00

End TAA 7.00 3.55 0.64

Tyr TAT 4.00 2.03 0.05

Tyr TAC 76.00 38.52 0.95

Leu TTG 5.00 2.53 0.04

Leu TTA 0.00 0.00 0.00

Phe TTT 4.00 2.03 0.04

Phe TTC 92.00 46.63 0.96

Ser TCG 34.00 17.23 0.24

Ser TCA 2.00 1.01 0.01

Ser TCT 1.00 0.51 0.01

Ser TCC 59.00 29.90 0.42

Arg CGG 23.00 11.66 0.22

Arg CGA 3.00 1.52 0.03

Arg CGT 2.00 1.01 0.02

Arg CGC 50.00 25.34 0.48

Gln CAG 59.00 29.90 0.86

Gln CAA 10.00 5.07 0.14

His CAT 5.00 2.53 0.26

His CAC 14.00 7.10 0.74

Leu CTG 43.00 21.79 0.35

Leu CTA 2.00 1.01 0.02

Leu CTT 1.00 0.51 0.01

Leu CTC 71.00 35.99 0.58

Pro CCG 44.00 22.30 0.31

Pro CCA 6.00 3.04 0.04

Pro CCT 13.00 6.59 0.09

Pro CCC 80.00 40.55 0.56

表2：来自GenBank_ Release 139*的Lemna minor密码子使用

氨基酸密码子数量 /1000 分数

Gly GGG 8.00 17.39 0.22

Gly GGA 11.00 23.91 0.31

Gly GGT 1.00 2.17 0.03

Gly GGC 16.00 34.78 0.44

Glu GAG 25.00 54.35 0.78

Glu GAA 7.00 15.22 0.22

Asp GAT 8.00 17.39 0.33

Asp GAC 16.00 34.78 0.67

Val GTG 21.00 45.65 0.53

Val GTA 3.00 6.52 0.07

Val GTT 6.00 13.04 0.15

Val GTC 10.00 21.74 0.25

Ala GCG 13.00 28.26 0.32

Ala GCA 8.00 17.39 0.20

Ala GCT 6.00 13.04 0.15

Ala GCC 14.00 30.43 0.34

Arg AGG 9.00 19.57 0 24

Arg AGA 11.00 23.91 0.30

Ser AGT 2.00 4.35 0.05

Ser AGC 11.00 23.91 0.26

Lys AAG 13.00 28.26 0.68

Lys AAA 6.00 13.04 0.32

Asn AAT 0.00 0.00 0.00

Asn AAC 12.00 26.09 1.00

Met ATG 9.00 19.57 1.00

Ile ATA 1.00 2.17 0.08

Ile ATT 2.00 4.35 0.15

Ile ATC 10.00 21.74 0.77

Thr ACG 5.00 10.87 0.28

Thr ACA 2.00 4.35 0.11

Thr ACT 2.00 4.35 0.11

Thr ACC 9.00 19.57 0.50

Trp TGG 8.00 17.39 1.00

End TGA 1.00 2.17 1.00

Cys TGT 1.00 2.17 0.12

Cys TGC 7.00 15.22 0.88

End TAG 0.00 0.00 0.00

End TAA 0.00 0.00 0.00

Tyr TAT 1.00 2.17 0.12

Tyr TAC 7.00 15.22 0.88

Leu TTG 3.00 6.52 0.08

Leu TTA 1.00 2.17 0.03

Phe TTT 6.00 13.04 0.25

Phe TTC 18.00 39.13 0.75

Ser TCG 11.00 23.91 0.26

Ser TCA 4.00 8.70 0.09

Ser TCT 6.00 13.04 0.14

Ser TCC 9.00 19.57 0.21

Arg CGG 4.00 8.70 0.11

Arg CGA 4.00 8.70 0.11

Arg CGT 0.00 0.00 0.00

Arg CGC 9.00 19.57 0.24

Gln CAG 11.00 23.91 0.73

Gln CAA 4.00 8.70 0.27

His CAT 0.00 0.00 0.00

His CAC 6.00 13.04 1.00

Leu CTG 9.00 19.57 0.24

Leu CTA 4.00 8.70 0.11

Leu CTT 4.00 8.70 0.11

Leu CTC 17.00 36.96 0.45

Pro CCG 8.00 17.39 0.29

Pro CCA 7.00 15.22 0.25

Pro CCT 5.00 10.87 0.18

Pro CCC 8.00 17.39 0.29

也可以对感兴趣的核苷酸序列进行其它修饰以提高其在浮萍中的表达。这些修饰包括但不限于消除编码假聚腺苷酸化信号序列、外显子-内含子剪接位点信号、转座子样重复，和可能对基因表达有害的其它这类很好表征的序列。序列的G-C含量可以调至给定细胞宿主的平均水平，这参照宿主细胞中表达的已知基因计算。当可能时，可以修饰序列以避免预测的发夹二级mRNA结构。

动物和植物中翻译起始密码子的最佳翻译起始邻近核苷酸序列之间存在已知差异，这些翻译起始邻近核苷酸序列的组成可以影响翻译起始效率。参见例如Lukaszewicz et al.(2000)Plant Science 154：89-98；和Joshi et al.(1997)；Plarat Mol.Biol.35：993-1001。在本发明中，感兴趣核苷酸序列的翻译起始密码子的翻译起始邻近核苷酸序列可以被修饰以提高在浮萍中的表达。在一个实施方案中，该核苷酸序列被修饰以致在感兴趣核苷酸序列的翻译起始密码子上游紧接着的的三个核苷酸是“ACC”。在第二个实施方案中，这些核苷酸是“ACA”。

使用5′前导序列也可以提高转基因在浮萍中的表达。这种前导序列可以作用以提高翻译。一个或多个前导序列可以组合使用以提高靶核苷酸序列的表达。翻译前导序列是本领域已知的，且包括但不限于微小RNA病毒前导序列，例如EMCV前导序列(脑心肌炎5′非编码区；Elroy-Stein et al.(1989)Proc.Natl.Acad.Sci USA 86：6126)、马铃薯Y病毒组前导序列，例如TEV前导序列(烟草蚀刻病毒；Allisonet al.(1986)Virology 154：9)；人免疫球蛋白重链结合蛋白(BiP；Macajak and Sarnow(1991)Nature 353：90)；来自苜蓿花叶病毒外壳蛋白mRNA的非翻译前导序列(AMV RNA 4；Jobling and Gehrke(1987)Nature 325：622)；烟草花叶病毒前导序列(TMV；Gallie(1989)Molecular Biologyof RNA，23：56)；马铃薯蚀刻病毒前导序列(Tomashevskaya et al.(1993)J.Geyz.Virol.74：2717-2724)；Fed-15′非翻译区(Dickey (1992)EMBO J 11：2311-2317)；RbcS 5′非翻译区(Silverthorne et al.(1990)J.Plant.Mol.Biol.15：49-58)；和玉米萎黄病斑点病毒前导序列(MCMV；Lommel et al.(1991)Virology 81：382)。也参见Della-Cioppa et al.(1987)PlantPhysiology 84：965。包含植物内含子序列，包括来自玉米脱氢酶1基因，蓖麻子过氧化氢酶基因或Arabidosis色氨酸途径基因PAT1的内含子序列的前导序列也已显示出增加植物中的翻译效率(Calliset al.(1987)Genes Dev.1：1183-1200；Mascarenhas et al.(1990)Plant Mol.Biol.15：913-920)。在本发明的一个实施方案中，相当于玉米醇脱氢酶1基因的核苷酸1222-1775的核苷酸序列(GenBank登录号X04049)，如SEQ ID NO：1所示，被插入感兴趣核苷酸序列上游以提高其翻译的效率。在另一个实施方案中，该表达载体含有来自Lemna gibba核酮糖二磷酸羧化酶小亚基5B基因的前导序列(Buzby et al.(1990)Plant Cell 2：805-814)。

可以认识到本发明可以使用如上所述的任何提高浮萍表达的核苷酸序列修饰，包括任何单一修饰或任何可能组合的修饰。在此使用的短语“提高在浮萍中表达的修饰”是指含有这些修饰的任何一个或任何组合的核苷酸序列。

D.信号肽

分泌蛋白通常由包括“信号肽”的前体多肽翻译而来，该信号肽与内质网(ER)膜上的受体蛋白相互作用以指导生长中的多肽链为从细胞分泌而转运穿过该膜和进入内质网。这个信号肽常常被从前体多肽切割而产生缺乏信号肽的“成熟”多肽。在本发明的一个实施方案中，生物学活性多肽在浮萍中由与编码信号肽的核苷酸序列可操作地连接的核苷酸序列表达，该信号肽指导多肽分泌到培养基中。将蛋白转运靶向内质网(为分泌到细胞外)的植物信号肽是本领域已知的。参见例如授予Lee等的美国专利6,020,169。在本发明中，任何植物信号肽可以将多肽表达靶向ER。在一些实施方案中，信号肽是拟南芥碱性内切几丁质酶信号肽、伸展蛋白信号肽(Stiefel et al.(1990)PlantCell 2：785-793)或稻α-淀粉酶信号肽(SEQ ID NO：8；NCBI蛋白登录号AAA33885的氨基酸1-31)。在另一个实施方案中，信号肽对应于分泌浮萍蛋白的信号肽。

可供选择地，可使用哺乳动物信号肽靶向基因工程改造的浮萍中表达的重组多肽的分泌。已经证明植物细胞识别靶向内质网的哺乳动物信号肽，这些信号肽不仅可以指导多肽通过质膜而且通过植物细胞壁来分泌。参见授予Hiatt等的美国专利5,202,422和5,639,947。

在一些实施方案中，为提高在浮萍中的表达，利用上面B节为感兴趣核苷酸序列公开的任何修饰或修饰组合来修饰编码信号肽的核苷酸序列。例如，编码稻α-淀粉酶的信号肽的浮萍优化序列在SEQ ID NO：7中示出。这个序列含有大约93％的浮萍优选密码子。

可以通过本领域已知的任何传统方法从培养基收获分泌多肽和用层析、电泳、渗析、溶剂-溶剂萃取等等纯化。

E.转化的浮萍植物和浮萍结节培养物

本发明中使用的稳定转化浮萍可以通过本领域已知的方法获得。在一个实施方案中，稳定转化浮萍是通过美国专利6,040,498或美国专利申请号20030115640、20030033630中公开的基因转移方法之一获得的；每一篇文献在此引入作为参考。这些方法包括通过包裹包含感兴趣核苷酸序列的核酸的微弹轰击进行基因转移，通过电穿孔进行基因转移和包含含有感兴趣核苷酸序列的载体的土壤杆菌介导的基因转移。在一些实施方案中，稳定转化的浮萍是通过授予Stomp等的美国专利6,040,498中公开的任何一种土壤杆菌介导的方法获得的。使用的土壤杆菌是根癌土壤杆菌或毛根土壤杆菌(Agrobacteriumrhizogenes)。

稳定转化的浮萍植物也可以通过叶绿体转化而获得。参见例如2003年8月1日申请的美国临时专利申请号60/492,179，名称为“浮萍的叶绿体转化”。稳定转化的浮萍系也可以使用植物病毒表达载体产生。参见例如美国专利号6,632,980和Koprowski and Yusibov(2001)Vaccine 19：2735-2741。

优选这些方法中使用的稳定转化浮萍植物显示正常的形态学和可通过有性生殖来繁殖。优选，本发明的转化植物含有单一拷贝的被转移核酸，被转移核酸在其中没有显著的重排。也优选的是其中被转移核酸以低拷贝数(即每个转化细胞至多十二个拷贝、至多八个拷贝、至多五个拷贝，可供选择地，至多三个拷贝，作为进一步可选择地，少于三个拷贝的核酸)存在的浮萍植物。

实验

下列实施例是为了例证的目的而提供，不作为限制。

用于在浮萍中生产纤溶酶原和微纤溶酶原的表达构建体

该实施例中使用的表达载体是改良形式的pBMSP-1，其在美国专利5,955,646中描述，在此引入作为参考。该载体的转录盒含有三个拷贝来源于根癌土壤杆菌章鱼碱合酶的转录活化核苷酸序列、以及来源于根癌土壤杆菌甘露碱合酶基因的另外的转录活化核苷酸序列、来源于根癌土壤杆菌甘露碱合酶的启动子区、用于插入编码感兴趣多肽的核苷酸序列的多接头位点和来源于根癌土壤杆菌胭脂碱合酶基因的终止序列(参见van Engelen et al (1995)4：288-290；Ni et al.(1995)Plant J.7：661-76；和Luehrsen et al.(1991)Mol.Gen.Genet.225：81-93，每篇在此引入作为参考)。

该表达载体还含有编码庆大霉素乙酰转移酶-3-I，aacC1，Wohlleben et al.(1989)Mol.Gen.Genet.217：202-208)，编码庆大霉素抗性的核苷酸序列作为选择性标记。该选择性标记序列的转录由来源于根癌土壤杆菌胭脂碱合酶II基因启动子驱动。

该表达载体另外含有插入在启动子和多接头之间的来自Lemnagibba核酮糖二磷酸羧化酶小亚基5B基因的前导序列(NCBI登录号S45167的689-751位核苷酸，Buzby et al.(1990)Plant Cell2：805-814)和对应于玉米醇脱氢酶基因1222-1775位核苷酸的核苷酸序列(GenBank登录号X04049)。这个内含子序列在SEQ ID NO：1示出，前导序列在SEQ ID NO：2示出。

浮萍的转化

用如上所述的表达构建体使用土壤杆菌介导的转化方法转化浮萍叶状体或浮萍结节培养物(在这些实施例中来源于Lemna minor株8627)。根癌土壤杆菌菌株C58Z707(一种disarmed宽宿主范围C58菌株)(Hepburn et al.(1985)J.Gen.Microbiol.131：2961-2969)在这些实施例中用来转化。如上所述的表达构建体通过电穿孔，或使用含有转移质粒(mobilizing plasmid)pRK2013的大肠杆菌MM294通过三亲交配程序，转移至根癌土壤杆菌(Hoekema et al.(1983)Nature 303：179-180；Ditta et al.(1980)Proc.Natl.Acad.Sci.USA 77：7347-7350)。包含如上所述表达构建体的C58Z707菌株划线于含有500mg/L链霉素、50mg/L壮观霉素和50mg/L卡那霉素硫酸盐的AB基本培养基(Chilton et al.，(1974)Proc.Nat.Acad.Sci.USA 71：3672-3676)或YEB或LB培养基(1g/L酵母浸膏、5g/L牛肉浸膏、5g/L蛋白胨、5g/L蔗糖、0.5g/L MgSO₄)中，并在28℃过夜生长。

用于转化的浮萍结节培养物产生如下。分离浮萍叶状体，用无菌解剖刀切断根，并将叶状体腹面向下置于Murashige和Skoog培养基(catalog number M-5519；Sigma Chemical Corporation，St.Louis，MO)pH5.6上，其中补充5μM 2，4-二氯苯氧乙酸、0.5μM 1-苯基-3(1，2，3-噻二唑-5-基)脲thidiazuron(Sigma P6186)、3％蔗糖、0.4 DifcoBacto-琼脂(Fisher Scientific)和0.15％ Gelrite(Sigma)。叶状体生长5-6周。将在这时候，出现结节(小的、淡黄细胞块)，通常来自腹面的中心部分。这个结节组织从母叶状体处分开并在补充3％蔗糖、0.4％Difco Bacto琼脂、0.15％ Gelrite、1μM 2，4-二氯苯氧乙酸和2μM苄基腺嘌呤的Murashige和Skoog培养基中培养。

浮萍结节培养物转化如下。适当的根癌土壤杆菌菌株在含50mg/L卡那霉素和100μM乙酰丁香酮的马铃薯葡萄糖琼脂或YEB或LB琼脂上生长，然后重悬于补充0.6M甘露醇和100μM乙酰丁香酮的Murashige和Skoog培养基中。结节培养组织通过浸入重悬细菌溶液1-2分钟来接种，吸干以除去过量液体，铺在由补充优化促进结节生长的生长素和细胞分裂素和100μM乙酰丁香酮的Murashige和Skoog培养基组成的共培养培养基上。参见Yamamoto et al.(2001)In VitroCell Dev.Biol.Plant 37：349-353。

对于选择，结节培养组织转入再生培养基-补充1％蔗糖、0.4％Difco Bacto琼脂、0.15％ Gelrite、500mg/L头孢噻肟和6mg/L遗传霉素的0.5 X Schenk和Hildebrandt培养基，并在连续光照(20-40μM/m²·秒)下培养大约6-8周。每7天将结节组织转移至新鲜的培养基。当结节组织显示在选择剂上旺盛生长时，选择完成。

下列实施例证明生物学活性纤溶酶原和微纤溶酶原在浮萍中表达。

实施例1：纤溶酶原的生产

人纤溶酶原在浮萍中表达如下。将合成的编码人纤溶酶原的浮萍密码子优化序列插入如上所述的表达载体中。所编码的纤溶酶原的氨基酸序列在SEQ ID NO：4中给出，浮萍优化编码序列在SEQ ID NO：3中给出。该表达载体还含有插入在纤溶酶原编码序列5′的编码稻α淀粉酶信号肽的浮萍优化编码序列。编码信号肽的核苷酸序列与编码人纤溶酶原的核苷酸序列可操作地连接，使得两个编码序列作为一个蛋白被翻译。编码稻α淀粉酶信号肽的浮萍优化编码序列在SEQ ID NO：7中给出，和所编码的肽在SEQ ID NO：8中给出。在这个实施例中，这个纤溶酶原表达载体被称为BAP01。

如上所述产生BAP01表达载体转化的浮萍系。由于纤溶酶原大小很大，转基因系的初始筛选包括培养基和组织匀浆的分析。大多数表达蛋白保留在组织中。产生了总共81个系和纤溶酶原占植物提取物中总可溶蛋白的多至6％(用ELISA测定)。图1表示56个转基因系中测定的纤溶酶原水平。这些水平是从在研究容器中生长2周的植物中获得的。市场上可买到的纤溶酶原在这个试验中用作标准品。

测定来自7个不同的独立转基因系的组织提取物中浮萍表达的纤溶酶原的活性。用链激酶活化浮萍表达的纤溶酶原以产生活性复合体。用链激酶进行的活化不包括纤溶酶形成，但是通过链激酶/纤溶酶原复合体形成引起的构象转换发生。然后通过检测SEQ ID NO：9(pNA＝p-Nitroanilide)所示的显色底物Glu-Phe-Lys-pNA(可以从Chromgenix Instrumentation Laboratory SpA，意大利米兰获得)在405nm的切割，测定所产生复合体的活性(Gram J.and Jespersen J.Thromb.Haemost.53，255-259(1985)and Robbins，K.C.Semin.Thromb.Haemost.13(2)，131-138(1987))。对于测试的七个转基因系的每一个，活性水平与ELISA测定的蛋白表达水平紧密相关，表明浮萍属中产生的纤溶酶原与市场上可买到的对照蛋白具有类似的比活性。

注意到被工程改造而过表达纤溶酶原的很多浮萍系遭受快速衰老。然而，确定了通过增加植物培养过程中的通气和培养基体积，可以降低这些系的衰老。此外，改变接种密度也可以影响植物健康。按比例扩充八个转基因浮萍系的培养物，选择这些系中的一个BAP01-B1-95进行进一步分析。基于生物量蓄积、纤溶酶原表达水平(ELISA测定为粗植物提取物中总可溶蛋白水平的3.3％)和植物总体健康，选择这个系。

从BAP01-B1-95系收获纤溶酶原如下。将浮萍组织块匀浆，离心澄清，通过0.22μM过滤器过滤，通过Dowex离子交换树脂柱(可以从Dow Chemical，Midland，Mich.获得)，然后通过赖氨酸Sepharose层析亲合纯化。用ε-氨基己酸从亲和柱洗脱结合物质。从这些植物获得的粗组织提取物含有用ELISA测定的占总可溶蛋白3.3％的纤溶酶原。

也测定tPA尿激酶和链激酶活化后浮萍产生的纤溶酶原的活性。tPA或尿激酶活化的纤溶酶原活性产生活化的纤溶酶，如图2所示。Western印迹分析表明活化浮萍产生的纤溶酶原所产生的纤溶酶重链和轻链与用作对照的市场上可买到的纤溶酶共同迁移(图6)。用链激酶活化也产生活化的SEQ ID NO：3所示的纤溶酶原。在这个试验中，链激酶活化纤溶酶原产生活化复合体，然后其切割显色底物(Coamatic_牌纤溶酶原试剂盒，DiaPharma，West Chester，OH)。图3表明对于试验的系，用ELISA定量和链激酶活性试验给出了相当的值，表明浮萍属产生的纤溶酶原具有与对照蛋白相似的比活性。

使用可从美国Diagnostica Inc.Greenwich，CT获得的抗纤溶酶原抗体，通过Western印迹测定浮萍产生的纤溶酶原的大小。这个分析表明浮萍中产生的60％纤溶酶原是全长的，浮萍产生的纤溶酶原的N-末端测序表明进一步加工产生的多肽缺少前74个氨基酸。在人血清中，纤溶酶原作为未加工的′glu-纤溶酶原′和除去69、77或78个N-末端氨基酸的定义为′lys-纤溶酶原′的几个加工形式的混合物而分离。这种切割对活性没有影响。

因为现有技术中的参考文献已经报道在重组系统中生产稳定纤溶酶原的困难，所以试验了在浮萍属系统中生产的纤溶酶原的稳定性。图4显示了添加到浮萍属组织提取物中的人纤溶酶原的稳定性。该图证明甚至在浮萍属提取物中孵育过夜之后人纤溶酶原保留了几乎所有的活性。图5显示了浮萍属组织提取物中的浮萍属产生的纤溶酶原在冻融循环后的稳定性。该图证明浮萍属产生的蛋白在冻融循环后是稳定的。

实施例2：在浮萍中生产微纤溶酶原

人微纤溶酶原在浮萍中表达如下。将合成的编码人微纤溶酶原的浮萍密码子优化序列插入如上所述的表达载体中。所编码的微纤溶酶原的氨基酸序列在SEQ ID NO：6中给出，浮萍优化编码序列在SEQ IDNO：5中给出。该表达载体还含有插入在纤溶酶原编码序列5′的编码稻α淀粉酶信号肽的浮萍优化编码序列。编码信号肽的核苷酸序列与编码人微纤溶酶原的核苷酸序列可操作地连接，使得两个编码序列作为一个蛋白被翻译。编码稻α淀粉酶信号肽的浮萍优化编码序列在SEQ ID NO：7给出，所编码的肽在SEQ ID NO：8给出。在这个实施例中，这个微纤溶酶原表达载体被称为BAMP01。

如上所述产生BAMP01表达载体转化的浮萍系。大多数表达的微纤溶酶原分泌到培养基中。筛选79个转基因系以测定微纤溶酶原表达水平。图7显示在这些系中表达的微纤溶酶原水平。42个系的第一组生长7天，而37个系的第二组生长六天。应当注意，浮萍是独特的，因为它在蛋白含量很低的非常稀的水性介质无机培养基中生长，使它与基于类型发酵的系统和基于哺乳动物细胞的表达系统区分开来。浮萍生长培养基典型地含有仅30mg/L的宿主植物蛋白。这个低水平宿主植物蛋白为分泌性蛋白下游纯化提供优点。

选择BAMP01转化浮萍系之一BAMP01-B1-58进行进一步研究。从BAMP01-B1-58系培养基收获微纤溶酶原如下。通过超滤和渗滤处理培养基，然后通过Dowex离子交换树脂柱(可从Dow Chemical，Midland，Mich.获得)除去低分子量植物代谢物。浓缩粗含水培养基中的微纤溶酶原之前的浓度是大约20mg/L，这通过定量Western印迹测定。

使用可从(美国Diagnostica Inc.Greenwich，CT)获得的抗纤溶酶原抗体，通过Western印迹测定浮萍产生的微纤溶酶原的大小。这个分析表明浮萍中产生的微纤溶酶原大多数是全长的。还通过N-末端测序证实了完整的N-末端。

如上文对于纤溶酶原所述的测定链激酶活化产生活性复合体后BAMP01-B1-58转基因系中浮萍表达的微纤溶酶原的活性。浮萍产生的微纤溶酶原在缺少链激酶情况下显示出一些活性水平，而链激酶活化后活性显著增加。

如同纤溶酶原一样，微纤溶酶原可以被尿激酶和tPA活化；然而，仅仅产生B链。蛋白质印迹分析证实了用尿激酶或tPA活化浮萍产生的微纤溶酶原后产生纤溶酶B链。

为证实来自浮萍属产生的微纤溶酶原的纤溶酶活性，tPA活化后，在浓缩培养基上运行明胶酶谱。图8显示了有活性的蛋白水解条带的存在，该条带在浓缩对照培养基中不存在。

说明书中提及的所有出版物和专利申请表示本发明所属领域技术人员的水平。所有出版物和专利申请在此引入作为参考，达到如同每个单独的出版物或专利申请具体和逐一地指出被引入作为参考的程度。

尽管为了理解的清晰，已经通过附图和实施例较详细地描述了上述发明，但是在附及的实施方案范围内可以实施某些改变和改进是显而易见的。

序列表

<110>Biolex，Inc.

Spencer，David

Dickey，Lynn F.

Gasdaska，John R.

Wang，Xiaowei

Cox，Kevin M.

Peele，Charles G.

<120>纤溶酶原和微纤溶酶原在浮萍中的表达

<130>40989/288596

<150>US 60/543,487

<151>2004-02-11

<160>9

<170>FastSEQ for Windows Version 4.0

<210>1

<211>554

<212>DNA

<213>玉米

<400>1

gatcaagtgc aaaggtccgc cttgtttctc ctctgtctct tgatctgact aatcttggtt 60

tatgattcgt tgagtaattt tggggaaagc ttcgtccaca gttttttttt cgatgaacag 120

tgccgcagtg gcgctgatct tgtatgctat cctgcaatcg tggtgaactt atgtctttta 180

tatccttcac taccatgaaa agactagtaa tctttctcga tgtaacatcg tccagcactg 240

ctattaccgt gtggtccatc cgacagtctg gctgaacaca tcatacgata ttgagcaaag 300

atctatcttc cctgttcttt aatgaaagac gtcattttca tcagtatgat ctaagaatgt 360

tgcaacttgc aaggaggcgt ttctttcttt gaatttaact aactcgttga gtggccctgt 420

ttctcggacg taaggccttt gctgctccac acatgtccat tcgaatttta ccgtgtttag 480

caagggcgaa aagtttgcat cttgatgatt tagcttgact atgcgattgc tttcctggac 540

ccgtgcagct gcgg 554

<210>2

<211>63

<212>DNA

<213>Lemna gibba

<400>2

gaaactcccg aggtgagcaa ggatccggag tcgagcgcga agaagagaaa gagggaaagc 60

gcg 63

<210>3

<211>2376

<212>DNA

<213>人工序列

<220>

<223>编码人纤溶酶原的浮萍密码子优化序列

<221>CDS

<222>(1)...(2376)

<400>3

gag ccc ctg gac gac tac gtg aac acg cag ggc gcc tcc ctg ttc agc 48

Glu Pro Leu Asp Asp Tyr Val Asn Thr Gln Gly Ala Ser Leu Phe Ser

1 5 10 15

gtc acc aag aag cag ctc ggc gcc ggc agc atc gag gag tgc gcg gcc 96

Val Thr Lys Lys Gln Leu Gly Ala Gly Ser Ile Glu Glu Cys Ala Ala

20 25 30

aag tgc gag gag gac gag gag ttc acg tgc cgc gcc ttc cag tac cac 144

Lys Cys Glu Glu Asp Glu Glu Phe Thr Cys Arg Ala Phe Gln Tyr His

35 40 45

agc aag gag cag cag tgc gtg atc atg gcc gag aac cgc aag tcc tcc 192

Ser Lys Glu Gln Gln Cys Val Ile Met Ala Glu Asn Arg Lys Ser Ser

50 55 60

atc atc atc cgc atg cgc gac gtg gtc ctc ttc gag aag aag gtg tat 240

Ile Ile Ile Arg Met Arg Asp Val Val Leu Phe Glu Lys Lys Val Tyr

65 70 75 80

ctg tcc gag tgc aag acg ggc aac ggg aag aac tac cgc ggg acg atg 288

Leu Ser Glu Cys Lys Thr Gly Asn Gly Lys Asn Tyr Arg Gly Thr Met

85 90 95

tcc aag acc aag aac ggc atc acc tgc caa aag tgg tct tcc acg agc 336

Ser Lys Thr Lys Asn Gly Ile Thr Cys Gln Lys Trp Ser Ser Thr Ser

100 105 110

ccg cac cgc ccg cgc ttc tcc cct gcc acg cac ccc tcc gag gga ctc 384

Pro His Arg Pro Arg Phe Ser Pro Ala Thr His Pro Ser Glu Gly Leu

115 120 125

gaa gag aac tac tgc cgc aac ccc gac aac gac ccg cag ggc ccg tgg 432

Glu Glu Asn Tyr Cys Arg Asn Pro Asp Asn Asp Pro Gln Gly Pro Trp

130 135 140

tgc tac acg acc gac ccg gag aaa cgg tac gac tac tgc gac att ctc 480

Cys Tyr Thr Thr Asp Pro Glu Lys Arg Tyr Asp Tyr Cys Asp Ile Leu

145 150 155 160

gag tgc gag gag gag tgc atg cac tgc agc ggc gag aat tac gac ggc 528

Glu Cys Glu Glu Glu Cys Met His Cys Ser Gly Glu Asn Tyr Asp Gly

165 170 175

aag atc tcc aag act atg tcc ggc ctg gag tgc cag gcc tgg gac tcc 576

Lys Ile Ser Lys Thr Met Ser Gly Leu Glu Cys Gln Ala Trp Asp Ser

180 185 190

cag agc ccg cac gcc cat ggg tac atc ccg tcc aag ttc ccc aac aag 624

Gln Ser Pro His Ala His Gly Tyr Ile Pro Ser Lys Phe Pro Asn Lys

195 200 205

aac ctg aag aag aac tac tgc agg aac ccc gac cgc gag ctt cgc ccg 672

Asn Leu Lys Lys Asn Tyr Cys Arg Asn Pro Asp Arg Glu Leu Arg Pro

210 215 220

tgg tgc ttc acg acc gac ccg aac aag cgc tgg gag ttg tgc gac atc 720

Trp Cys Phe Thr Thr Asp Pro Asn Lys Arg Trp Glu Leu Cys Asp Ile

225 230 235 240

ccg cgt tgc acc acg cct ccg ccc tcc agc ggg ccg acc tat cag tgc 768

Pro Arg Cys Thr Thr Pro Pro Pro Ser Ser Gly Pro Thr Tyr Gln Cys

245 250 255

ctg aaa ggc acg ggc gag aac tac cgc gga aac gtg gcg gtc acc gtg 816

Leu Lys Gly Thr Gly Glu Asn Tyr Arg Gly Asn Val Ala Val Thr Val

260 265 270

tcc ggg cac acc tgc caa cac tgg agc gcg cag acc ccg cac acc cac 864

Ser Gly His Thr Cys Gln His Trp Ser Ala Gln Thr Pro His Thr His

275 280 285

aac cgg acg ccg gag aac ttc ccc tgc aag aac ctg gac gag aac tac 912

Asn Arg Thr Pro Glu Asn Phe Pro Cys Lys Asn Leu Asp Glu Asn Tyr

290 295 300

tgc cgc aac ccg gac ggg aag cgt gcc ccg tgg tgc cac acc acc aac 960

Cys Arg Asn Pro Asp Gly Lys Arg Ala Pro Trp Cys His Thr Thr Asn

305 310 315 320

agc cag gtt cgc tgg gag tac tgc aag atc ccg tcc tgc gat tcc tct 1008

Ser Gln Val Arg Trp Glu Tyr Cys Lys Ile Pro Ser Cys Asp Ser Ser

325 330 335

ccg gtc tcc act gag cag ctg gcg ccc acc gcg ccg ccc gaa ctc acg 1056

Pro Val Ser Thr Glu Gln Leu Ala Pro Thr Ala Pro Pro Glu Leu Thr

340 345 350

ccg gtg gtc cag gac tgc tat cac ggc gac ggg cag agc tac cgc ggc 1104

Pro Val Val Gln Asp Cys Tyr His Gly Asp Gly Gln Ser Tyr Arg Gly

355 360 365

acc tct tcc acc act acc acg ggc aag aag tgc cag tcc tgg tcc agc 1152

Thr Ser Ser Thr Thr Thr Thr Gly Lys Lys Cys Gln Ser Trp Ser Ser

370 375 380

atg acc cct cac cgg cac cag aag acc ccg gag aac tac ccg aac gcc 1200

Met Thr Pro His Arg His Gln Lys Thr Pro Glu Asn Tyr Pro Asn Ala

385 390 395 400

ggc ctg acc atg aac tac tgc agg aac ccg gac gcc gac aaa ggc ccc 1248

Gly Leu Thr Met Asn Tyr Cys Arg Asn Pro Asp Ala Asp Lys Gly Pro

405 410 415

tgg tgc ttc acc acc gat ccc agc gtc cgc tgg gag tac tgc aac ctg 1296

Trp Cys Phe Thr Thr Asp Pro Ser Val Arg Trp Glu Tyr Cys Asn Leu

420 425 430

aag aaa tgc tcc ggc acc gag gcg agc gtc gtc gcg ccg cca ccc gtg 1344

Lys Lys Cys Ser Gly Thr Glu Ala Ser Val Val Ala Pro Pro Pro Val

435 440 445

gtc ctg ctt ccg gac gtc gag acc ccg tcc gag gag gac tgc atg ttc 1392

Val Leu Leu Pro Asp Val Glu Thr Pro Ser Glu Glu Asp Cys Met Phe

450 455 460

ggg aac ggg aag ggc tac cgc ggc aag cgc gcg acc act gtc acc ggg 1440

Gly Asn Gly Lys Gly Tyr Arg Gly Lys Arg Ala Thr Thr Val Thr Gly

465 470 475 480

acc ccg tgc cag gac tgg gcc gct cag gag ccc cac agg cac agc atc 1488

Thr Pro Cys Gln Asp Trp Ala Ala Gln Glu Pro His Arg His Ser Ile

485 490 495

ttc acc ccg gag acc aac ccg cgc gcg ggc ctg gag aag aac tac tgc 1536

Phe Thr Pro Glu Thr Asn Pro Arg Ala Gly Lau Glu Lys Asn Tyr Cys

500 505 510

cgc aac ccg gac ggc gac gtt gga ggc ccc tgg tgc tac act acc aac 1584

Arg Asn Pro Asp Gly Asp Val Gly Gly Pro Trp Cys Tyr Thr Thr Asn

515 520 525

ccg cgt aag ctc tac gac tac tgc gac gtc ccg cag tgc gcg gct ccg 1632

Pro Arg Lys Leu Tyr Asp Tyr Cys Asp Val Pro Gln Cys Ala Ala Pro

530 535 540

tcc ttc gac tgc ggg aag cca cag gtg gaa ccg aag aag tgc cct ggc 1680

Ser Phe Asp Cys Gly Lys Pro Gln Val Glu Pro Lys Lys Cys Pro Gly

545 550 555 560

cgc gtg gtc gga ggg tgc gtg gcc cac ccg cac tcc tgg ccc tgg caa 1728

Arg Val Val Gly Gly Cys Val Ala His Pro His Ser Trp Pro Trp Gln

565 570 575

gtc agc ctg cgc acc cgc ttc ggc atg cac ttc tgc ggc ggc acc ctc 1776

Val Ser Leu Arg Thr Arg Phe Gly Met His Phe Cys Gly Gly Thr Leu

580 585 590

atc tcc ccg gag tgg gtt ctg acc gcc gct cac tgc ctc gag aag tcc 1824

Ile Ser Pro Glu Trp Val Leu Thr Ala Ala His Cys Leu Glu Lys Ser

595 600 605

ccg agg ccc tcc tcc tac aag gtc atc ctg ggc gcc cac cag gag gtg 1872

Pro Arg Pro Ser Ser Tyr Lys Val Ile Leu Gly Ala His Gln Glu Val

610 615 620

aac ctc gag ccg cac gtt cag gag atc gag gtg tcc cgc ttg ttc ctg 1920

Asn Leu Glu Pro His Val Gln Glu Ile Glu Val Ser Arg Leu Phe Leu

625 630 635 640

gag ccc acg cgc aag gat atc gcc ctg ctc aag ctc tct agc ccg gcc 1968

Glu Pro Thr Arg Lys Asp Ile Ala Leu Leu Lys Leu Ser Ser Pro Ala

645 650 655

gtc atc acc gac aag gtt atc ccg gcc tgc ctt ccc tcc ccg aac tac 2016

Val Ile Thr Asp Lys Val Ile Pro Ala Cys Leu Pro Ser Pro Asn Tyr

660 665 670

gtg gtc gct gac cgc acc gag tgc ttc gtt acc ggc tgg ggc gag acc 2064

Val Val Ala Asp Arg Thr Glu Cys Phe Val Thr Gly Trp Gly Glu Thr

675 680 685

cag gga acg ttc ggc gcg ggc ctc ctc aag gag gcc cag ctc ccg gtg 2112

Gln Gly Thr Phe Gly Ala Gly Leu Leu Lys Glu Ala Gln Leu Pro Val

690 695 700

att gag aac aag gtg tgc aac cgt tac gag ttc ctg aac ggg cgc gtc 2160

Ile Glu Asn Lys Val Cys Asn Arg Tyr Glu Phe Leu Asn Gly Arg Val

705 710 715 720

cag tcc acc gaa ctc tgc gcc ggg cac ttg gcc ggc ggc acc gac agc 2208

Gln Ser Thr Glu Leu Cys Ala Gly His Leu Ala Gly Gly Thr Asp Ser

725 730 735

tgc cag ggc gac agc ggc ggg ccg ctg gtg tgc ttc gag aag gac aag 2256

Cys Gln Gly Asp Ser Gly Gly Pro Leu Val Cys Phe Glu Lys Asp Lys

740 745 750

tac atc ctc caa ggc gtc acg tcc tgg ggc ctc ggc tgc gca cgc cct 2304

Tyr Ile Leu Gln Gly Val Thr Ser Trp Gly Leu Gly Cys Ala Arg Pro

755 760 765

aac aag ccg ggc gtc tat gtg cgc gtg tcc cgc ttc gtg acc tgg atc 2352

Asn Lys Pro Gly Val Tyr Val Arg Val Ser Arg Phe Val Thr Trp Ile

770 775 780

gag ggc gtg atg cgc aac aac taa 2376

Glu Gly Val Met Arg Asn Asn *

785 790

<210>4

<211>791

<212>PRT

<213>人工序列

<220>

<223>成熟人纤溶酶原序列

<400>4

Glu Pro Leu Asp Asp Tyr Val Asn Thr Gln Gly Ala Ser Lau Phe Ser

1 5 10 15

Val Thr Lys Lys Gln Leu Gly Ala Gly Ser Ile Glu Glu Cys Ala Ala

20 25 30

Lys Cys Glu Glu Asp Glu Glu Phe Thr Cys Arg Ala Phe Gln Tyr His

35 40 45

Ser Lys Glu Gln Gln Cys Val Ile Met Ala Glu Asn Arg Lys Ser Ser

50 55 60

Ile Ile Ile Arg Met Arg Asp Val Val Leu Phe Glu Lys Lys Val Tyr

65 70 75 80

Leu Ser Glu Cys Lys Thr Gly Asn Gly Lys Asn Tyr Arg Gly Thr Met

85 90 95

Ser Lys Thr Lys Asn Gly Ile Thr Cys Gln Lys Trp Ser Ser Thr Ser

100 105 110

Pro His Arg Pro Arg Phe Ser Pro Ala Thr His Pro Ser Glu Gly Leu

115 120 125

Glu Glu Asn Tyr Cys Arg Asn Pro Asp Asn Asp Pro Gln Gly Pro Trp

130 135 140

Cys Tyr Thr Thr Asp Pro Glu Lys Arg Tyr Asp Tyr Cys Asp Ile Leu

145 150 155 160

Glu Cys Glu Glu Glu Cys Met His Cys Ser Gly Glu Asn Tyr Asp Gly

165 170 175

Lys Ile Ser Lys Thr Met Ser Gly Leu Glu Cys Gln Ala Trp Asp Ser

180 185 19O

Gln Ser Pro His Ala His Gly Tyr Ile Pro Ser Lys Phe Pro Asn Lys

195 200 205

Asn Leu Lys Lys Asn Tyr Cys Arg Asn Pro Asp Arg Glu Leu Arg Pro

210 215 220

Trp Cys Phe Thr Thr Asp Pro Asn Lys Arg Trp Glu Leu Cys Asp Ile

225 230 235 240

Pro Arg Cys Thr Thr Pro Pro Pro Ser Ser Gly Pro Thr Tyr Gln Cys

245 250 255

Leu Lys Gly Thr Gly Glu Asn Tyr Arg Gly Asn Val Ala Val Thr Val

260 265 270

Ser Gly His Thr Cys Gln His Trp ger Ala Gln Thr Pro His Thr His

275 280 285

Asn Arg Thr Pro Glu Asn Phe Pro Cys Lys Asn Leu Asp Glu Asn Tyr

290 295 300

Cys Arg Asn Pro Asp Gly Lys Arg Ala Pro Trp Cys His Thr Thr Asn

305 310 315 320

Ser Gln Val Arg Trp Glu Tyr Cys Lys Ile Pro Ser Cys Asp Ser Ser

325 330 335

Pro Val Ser Thr Glu Gln Leu Ala Pro Thr Ala Pro Pro Glu Leu Thr

340 345 350

Pro Val Val Gln Asp Cys Tyr His Gly Asp Gly Gln Ser Tyr Arg Gly

355 360 365

Thr Ser Ser Thr Thr Thr Thr Gly Lys Lys Cys Gln Ser Trp Ser Ser

370 375 380

Met Thr Pro His Arg His Gln Lys Thr Pro Glu Asn Tyr Pro Asn Ala

385 390 395 400

Gly Leu Thr Met Asn Tyr Cys Arg Asn Pro Asp Ala Asp Lys Gly Pro

405 410 415

Trp Cys Phe Thr Thr Asp Pro Ser Val Arg Trp Glu Tyr Cys Asn Leu

420 425 430

Lys Lys Cys Ser Gly Thr Glu Ala Ser Val Val Ala Pro Pro Pro Val

435 440 445

Val Leu Leu Pro Asp Val Glu Thr Pro Ser Glu Glu Asp Cys Met Phe

450 455 460

Gly Asn Gly Lys Gly Tyr Arg Gly Lys Arg Ala Thr Thr Val Thr Gly

465 470 475 480

Thr Pro Cys Gln Asp Trp Ala Ala Gln Glu Pro His Arg His Ser Ile

485 490 495

Phe Thr Pro Glu Thr Asn Pro Arg Ala Gly Leu Glu Lys Asn Tyr Cys

500 505 510

Arg Asn Pro Asp Gly Asp Val Gly Gly Pro Trp Cys Tyr Thr Thr Asn

515 520 525

Pro Arg Lys Leu Tyr Asp Tyr Cys Asp Val Pro Gln Cys Ala Ala Pro

530 535 540

Ser Phe Asp Cys Gly Lys Pro Gln Val Glu Pro Lys Lys Cys Pro Gly

545 550 555 560

Arg Val Val Gly Gly Cys Val Ala His Pro His Ser Trp Pro Trp Gln

565 570 575

Val Ser Leu Arg Thr Arg Phe Gly Met His Phe Cys Gly Gly Thr Leu

580 585 590

Ile Ser Pro Glu Trp Val Leu Thr Ala Ala His Cys Leu Glu Lys Ser

595 600 605

Pro Arg Pro Ser Ser Tyr Lys Val Ile Leu Gly Ala His Gln Glu Val

610 615 620

Asn Leu Glu Pro His Val Gln Glu Ile Glu Val Ser Arg Leu Phe Leu

625 630 635 640

Glu Pro Thr Arg Lys Asp Ile Ala Leu Leu Lys Leu Ser Ser Pro Ala

645 650 655

Val Ile Thr Asp Lys Val Ile Pro Ala Cys Leu Pro Ser Pro Asn Tyr

660 665 670

Val Val Ala Asp Arg Thr Glu Cys Phe Val Thr Gly Trp Gly Glu Thr

675 680 685

Gln Gly Thr Phe Gly Ala Gly Leu Leu Lys Glu Ala Gln Leu Pro Val

690 695 700

Ile Glu Asn Lys Val Cys Asn Arg Tyr Glu Phe Leu Asn Gly Arg Val

705 710 715 720

Gln Ser Thr Glu Leu Cys Ala Gly His Leu Ala Gly Gly Thr Asp Ser

725 730 735

Cys Gln Gly Asp Ser Gly Gly Pro Leu Val Cys Phe Glu Lys Asp Lys

740 745 750

Tyr Ile Leu Gln Gly Val Thr Ser Trp Gly Leu Gly Cys Ala Arg Pro

755 760 765

Asn Lys Pro Gly Val Tyr Val Arg Val Ser Arg Phe Val Thr Trp Ile

770 775 780

Glu Gly Val Met Arg Asn Asn

785 790

<210>5

<211>780

<212>DNA

<213>人工序列

<220>

<223>编码人微纤溶酶原的浮萍密码子优化序列

<221>CDS

<222>(1)...(780)

<400>5

gag ccc ctg gac gac tac gtg aac acg cag ggc ccg tcc ttc gac tgc 48

Glu Pro Leu Asp Asp Tyr Val Asn Thr Gln Gly Pro Ser Phe Asp Cys

1 5 10 15

ggg aag cca cag gtg gaa ccg aag aag tgc cct ggc cgc gtg gtc gga 96

Gly Lys Pro Gln Val Glu Pro Lys Lys Cys Pro Gly Arg Val Val Gly

20 25 30

ggg tgc gtg gcc cac ccg cac tcc tgg ccc tgg caa gtc agc ctg cgc 144

Gly Cys Val Ala His Pro His Ser Trp Pro Trp Gln Val Ser Leu Arg

35 40 45

acc cgc ttc ggc atg cac ttc tgc ggc ggc acc ctc atc tcc ccg gag 192

Thr Arg Phe Gly Met His Phe Cys Gly Gly Thr Leu Ile Ser Pro Glu

50 55 60

tgg gtt ctg acc gcc gctcac tgc ctc gag aag tcc ccg agg ccc tcc 240

Trp Val Leu Thr Ala Ala His Cys Leu Glu Lys Ser Pro Arg Pro Ser

65 70 75 80

tcc tac aag gtc atc ctg ggc gcc cac cag gag gtg aac ctc gag ccg 288

Ser Tyr Lys Val Ile Leu Gly Ala His Gln Glu Val Asn Leu Glu Pro

85 90 95

cac gtt cag gag atc gag gtg tcc cgc ttg ttc ctg gag ccc acg cgc 336

His Val Gln Glu Ile Glu Val Ser Arg Leu Phe Leu Glu Pro Thr Arg

100 105 110

aag gat atc gcc ctg ctc aag ctc tct agc ccg gcc gtc atc acc gac 384

Lys Asp Ile Ala Leu Leu Lys Leu Ser Ser Pro Ala Val Ile Thr Asp

115 120 125

aag gtt atc ccg gcc tgc ctt ccc tcc ccg aac tac gtg gtc gct gac 432

Lys Val Ile Pro Ala Cys Leu Pro Ser Pro Asn Tyr Val Val Ala Asp

130 135 140

cgc acc gag tgc ttc gtt acc ggc tgg ggc gag acc cag gga acg ttc 480

Arg Thr Glu Cys Phe Val Thr Gly Trp Gly Glu Thr Gln Gly Thr Phe

145 150 155 160

ggc gcg ggc ctc ctc aag gag gcc cag ctc ccg gtg att gag aac aag 528

Gly Ala Gly Leu Leu Lys Glu Ala Gln Leu Pro Val Ile Glu Asn Lys

165 170 175

gtg tgc aac cgt tac gag ttc ctg aac ggg cgc gtc cag tcc acc gaa 576

Val Cys Asn Arg Tyr Glu Phe Leu Asn Gly Arg Val Gln Ser Thr Glu

180 185 190

ctc tgc gcc ggg cac ttg gcc ggc ggc acc gac agc tgc cag ggc gac 624

Leu Cys Ala Gly His Leu Ala Gly Gly Thr Asp Ser Cys Gln Gly Asp

195 200 205

agc ggc ggg ccg ctg gtg tgc ttc gag aag gac aag tac atc ctc caa 672

Ser Gly Gly Pro Leu Val Cys Phe Glu Lys Asp Lys Tyr Ile Leu Gln

210 215 220

ggc gtc acg tcc tgg ggc ctc ggc tgc gca cgc cct aac aag ccg ggc 720

Gly Val Thr Ser Trp Gly Leu Gly Cys Ala Arg Pro Asn Lys Pro Gly

225 230 235 240

gtc tat gtg cgc gtg tcc cgc ttc gtg acc tgg atc gag ggc gtg atg 768

Val Tyr Val Arg Val Ser Arg Phe Val Thr Trp Ile Glu Gly Val Met

245 250 255

cgc aac aac taa 780

Arg Asn Asn *

<210>6

<211>259

<212>PRT

<213>人工序列

<220>

<223>成熟人微纤溶酶原的序列

<400>6

Glu Pro Leu Asp Asp Tyr Val Asn Thr Gln Gly Pro Ser Phe Asp Cys

1 5 10 15

Gly Lys Pro Gln Val Glu Pro Lys Lys Cys Pro Gly Arg Val Val Gly

20 25 30

Gly Cys Val Ala His Pro His Ser Trp Pro Trp Gln Val Ser Leu Arg

35 40 45

Thr Arg Phe Gly Met His Phe Cys Gly Gly Thr Leu Ile Ser Pro Glu

50 55 60

Trp Val Leu Thr Ala Ala His Cys Leu Glu Lys Ser Pro Arg Pro Ser

65 70 75 80

Ser Tyr Lys Val Ile Leu Gly Ala His Gln Glu Val Asn Leu Glu Pro

85 90 95

His Val Gln Glu Ile Glu Val Ser Arg Leu Phe Leu Glu Pro Thr Arg

100 105 110

Lys Asp Ile Ala Leu Leu Lys Leu Ser Ser Pro Ala Val Ile Thr Asp

115 120 125

Lys Val Ile Pro Ala Cys Leu Pro Ser Pro Asn Tyr Val Val Ala Asp

130 135 140

Arg Thr Glu Cys Phe Val Thr Gly Trp Gly Glu Thr Gln Gly Thr Phe

145 150 155 160

Gly Ala Gly Leu Leu Lys Glu Ala Gln Leu Pro Val Ile Glu Asn Lys

165 170 175

Val Cys Asn Arg Tyr Glu Phe Leu Asn Gly Arg Val Gln Ser Thr Glu

180 185 190

Leu Cys Ala Gly His Leu Ala Gly Gly Thr Asp Ser Cys Gln Gly Asp

195 200 205

Ser Gly Gly Pro Leu Val Cys Phe Glu Lys Asp Lys Tyr Ile Leu Gln

210 215 220

Gly Val Thr Ser Trp Gly Leu Gly Cys Ala Arg Pro Asn Lys Pro Gly

225 230 235 240

Val Tyr Val Arg Val Ser Arg Phe Val Thr Trp Ile Glu Gly Val Met

245 250 255

Arg Asn Asn

<210>7

<211>96

<212>DNA

<213>稻

<220>

<221>CDS

<222>(4)...(96)

<400>7

acc atg cag gtc ctg aac acg atg gtc aac aag cac ttc ctc tcc ctg 48

Met Gln Val Leu Asn Thr Met Val Asn Lys His Phe Leu Ser Leu

1 5 10 15

tcc gtc ctc atc gtc ctc ctc ggg ctg agc agc aac ctc acc gcc ggc 96

Ser Val Leu Ile Val Leu Leu Gly Leu Ser Ser Asn Leu Thr Ala Gly

20 25 30

<210>8

<211>31

<212>PRT

<213>稻

<400>8

Met Gln Val Leu Asn Thr Met Val Asn Lys His Phe Leu Ser Leu Ser

1 5 10 15

Val Leu Ile Val Leu Leu Gly Leu Ser Ser Asn Leu Thr Ala Gly

20 25 30

<210>9

<211>3

<212>PRT

<213>人工序列

<220>

<223>纤溶酶的底物

<400>9

Glu Phe Lys

1

Claims

1.一种在浮萍中生产纤溶酶原的方法，其中所述方法包括步骤：

(a)培养浮萍植物或浮萍植物细胞或结节，其中所述浮萍植物或浮萍植物细胞或结节被包含编码纤溶酶原的核苷酸序列的核酸分子稳定转化；和

(b)从所述浮萍植物或浮萍植物细胞或结节收集所述纤溶酶原。

2.权利要求1的方法，其中所述编码纤溶酶原的核苷酸序列与指导该微纤溶酶原分泌到培养基中的信号肽的编码序列可操作地连接。

3.权利要求1的方法，其中所述编码纤溶酶原的核苷酸序列具有选自下组的至少一个属性：

(a)所述纤溶酶原编码序列中具有浮萍优选的密码子；

(b)包含插入在该编码序列上游的植物内含子的可操作地连接的核苷酸序列；和

(c)包含增加所述编码纤溶酶原的核苷酸序列翻译的前导序列的可操作地连接的核苷酸序列。

4.根据权利要求3的方法，其中编码纤溶酶原的核苷酸序列包含70-100％的浮萍优选的密码子。

5.根据权利要求3的方法，其中所述植物内含子来源于玉米醇脱氢酶1基因。

6.根据权利要求5的方法，其中所述植物内含子基本上由SEQ IDNO：1所示序列组成。

7.根据权利要求3的方法，其中所述前导序列来源于Lemna gibba的核酮糖二磷酸羧化酶小亚基5B基因。

8.根据权利要求7的方法，其中所述前导序列基本上由SEQ ID NO：2所示核苷酸序列组成。

9.根据权利要求3的方法，其中所述编码纤溶酶原的核苷酸序列是SEQ ID NO：3所示的核苷酸序列。

10.根据权利要求1的方法，其中所述纤溶酶原是人纤溶酶原。

11.根据权利要求10的方法，其中所述纤溶酶原与SEQ ID NO：4所示氨基酸序列具有至少95％的序列同一性。

12.根据权利要求1的方法，其中浮萍植物或浮萍植物细胞中至少2％的可溶性蛋白是纤溶酶原。

13.根据权利要求12的方法，其中浮萍植物或浮萍植物细胞中至少3％的可溶性蛋白是纤溶酶原。

14.根据权利要求13的方法，其中浮萍植物或浮萍植物细胞中至少4％的可溶性蛋白是纤溶酶原。

15.一种在浮萍中生产微纤溶酶原的方法，所述方法包括步骤：

(a)在浮萍培养基内培养浮萍植物培养物、浮萍植物细胞或浮萍结节培养物，或其中所述浮萍植物培养物、植物细胞或结节培养物被核酸分子稳定转化，该核酸分子包含编码微纤溶酶原的核苷酸序列和可操作地连接的指导微纤溶酶原分泌到培养基中的信号肽的编码序列；和

(b)从浮萍培养基中收集所述微纤溶酶原。

16.权利要求15的方法，其中所述微纤溶酶原分泌到浮萍培养基中。

17.权利要求16的方法，其中通过定量Western印迹测定，所述浮萍培养基含有至少1mg/L微纤溶酶原。

18.权利要求16的方法，其中通过定量Western印迹测定，所述浮萍培养基含有至少2mg/L微纤溶酶原。

19.权利要求16的方法，其中通过定量Western印迹测定，所述浮萍培养基含有至少5mg/L微纤溶酶原。

20.权利要求19的方法，其中通过定量Western印迹测定，所述浮萍培养基含有至少10mg/L微纤溶酶原。

21.权利要求15的方法，其中所述编码微纤溶酶原的核苷酸序列和可操作地连接的信号肽编码序列具有选自下组的至少一个属性：

(a)所述微纤溶酶原的编码序列中具有浮萍优选的密码子；

(b)所述信号肽的编码序列中具有浮萍优选的密码子；

(c)包含插入在微纤溶酶原编码序列上游的植物内含子的可操作地连接的核苷酸序列；和

(d)包含增加所述编码纤溶酶原的核苷酸序列翻译的前导序列的可操作地连接的核苷酸序列。

22.根据权利要求21的方法，其中编码纤溶酶原的核苷酸序列包含70-100％的浮萍优选的密码子。

23.根据权利要求22的方法，其中编码信号肽的核苷酸序列包含70-100％的浮萍优选的密码子。

24.根据权利要求21的方法，其中所述植物内含子来源于玉米醇脱氢酶1基因。

25.根据权利要求24的方法，其中所述植物内含子基本上由SEQ IDNO：1所示序列组成。

26.根据权利要求21的方法，其中所述前导序列来源于Lemnagibba的核酮糖二磷酸羧化酶小亚基5B基因。

27.根据权利要求26的方法，其中所述前导序列基本上由SEQ IDNO：2所示核苷酸序列组成。

28.根据权利要求21的方法，其中所述编码微纤溶酶原的核苷酸序列是SEQ ID NO：5所示的核苷酸序列。

29.根据权利要求15的方法，其中所述微纤溶酶原是人微纤溶酶原。

30.根据权利要求29的方法，其中所述微纤溶酶原与SEQ ID NO：4所述氨基酸序列具有至少95％的序列同一性。

31.根据权利要求15的方法，其中所述信号肽是稻α淀粉酶多肽。

32.根据权利要求31的方法，其中信号肽的编码序列包含SEQ IDNO：7所示核苷酸序列。

33.根据权利要求15的方法，其中所述信号肽序列具有SEQ ID NO：8所示氨基酸序列。

34.根据权利要求1的方法，其中所述浮萍植物或浮萍植物细胞来自选自下组的属：紫萍属、无根萍属、Wolfiella属、Landoltia属和浮萍属。

35.根据权利要求15的方法，其中所述浮萍植物或浮萍植物细胞属于选自下组的属：紫萍属、无根萍属、Wolfiella属、Landoltia属和浮萍属。

36.生产稳定纤溶酶原的方法的改进，其中改进包括根据权利要求1的方法生产纤溶酶原。

37.一种在浮萍中生产纤溶酶原片段的方法，其中所述方法包括步骤：

(a)在浮萍培养基内培养浮萍植物或浮萍植物细胞或结节，其中所述浮萍植物或浮萍植物细胞或结节被包含编码纤溶酶原片段的核苷酸序列的核酸分子稳定转化；和

(b)从选自下组的至少一个来源收集所述纤溶酶原片段：所述浮萍植物、所述浮萍植物细胞、所述浮萍结节或所述浮萍培养基。

38.权利要求37的方法，其中所述编码纤溶酶原片段的核苷酸序列与指导该微纤溶酶原分泌到培养基中的信号肽的编码序列可操作地连接。

39.权利要求37的方法，其中所述编码纤溶酶原片段的核苷酸序列具有选自下组的至少一个属性：

(a)所述纤溶酶原片段编码序列中具有浮萍优选的密码子；

(b)包含插入在所述编码序列上游的植物内含子的可操作地连接的核苷酸序列；和

(c)包含增加所述编码纤溶酶原片段的核苷酸序列翻译的前导序列的可操作地连接的核苷酸序列。

40.根据权利要求39的方法，其中编码纤溶酶原片段的核苷酸序列包含70-100％的浮萍优选的密码子。

41.根据权利要求39的方法，其中所述植物内含子来源于玉米醇脱氢酶1基因。

42.根据权利要求37的方法，其中所述纤溶酶原片段包含成熟纤溶酶原氨基酸序列的至少80个连续氨基酸。

43.根据权利要求1稳定转化的浮萍植物、浮萍植物细胞或结节。

44.根据权利要求43的稳定转化的浮萍植物、浮萍植物细胞或结节，其中所述浮萍植物、浮萍植物细胞或浮萍结节来自选自下组的属：紫萍属、无根萍属、Wolfiella属、Landoltia属和浮萍属。

45.根据权利要求44的稳定转化的浮萍植物、浮萍植物细胞或浮萍结节，其中所述浮萍植物、浮萍植物细胞或浮萍结节是选自下组的种的成员：Lemna minor、Lemna miniscula、Lemna aequinoctialis和Lemna gibba。

46.根据权利要求15稳定转化的浮萍植物、浮萍植物细胞或浮萍结节。

47.根据权利要求46的稳定转化的浮萍植物、浮萍植物细胞或浮萍结节，其中所述浮萍植物、浮萍植物细胞或浮萍结节来自选自下组的属：紫萍属、无根萍属、Wolfiella属、Landoltia属和浮萍属。

48.根据权利要求47的稳定转化的浮萍植物或浮萍植物细胞，其中所述浮萍植物或浮萍结节是选自下组的种的成员：Lemna minor、Lemna miniscula、Lemna aequinoctialis和Lemna gibba。

49.根据权利要求37稳定转化的浮萍植物、浮萍植物细胞或浮萍结节。

50.根据权利要求49的稳定转化的浮萍植物、浮萍植物细胞或浮萍结节，其中所述浮萍植物、浮萍植物细胞或浮萍结节来自选自下组的属：紫萍属、无根萍属、Wolfiella属、Landoltia属和浮萍属。

51.根据权利要求50的稳定转化的浮萍植物或浮萍植物细胞，其中所述浮萍植物或浮萍结节是选自下组的种的成员：Lemna minor、Lemna miniscula、Lemna aequinoctialis和Lemna gibba。

52.分离的核酸分子，包含编码选自下组的氨基酸序列的核苷酸序列：

(a)SEQ ID NO：4所示氨基酸序列；

(b)SEQ ID NO：4所示纤溶酶原序列的变异体的氨基酸序列，其中所述变异体与SEQ ID NO：6所示氨基酸序列具有至少95％的序列同一性；

(c)SEQ ID NO：6所示氨基酸序列；和

(d)SEQ ID NO：6所示微纤溶酶原序列的变异体的氨基酸序列，其中所述变异体与SEQ ID NO：6所示氨基酸序列具有至少95％的序列同一性；

其中所述核苷酸序列包含70-100％的浮萍优选的密码子。

53.权利要求49的核酸分子，其中所述核酸分子包含选自下组的核苷酸序列：

(a)SEQ ID NO：3所示核苷酸序列；和

(b)SEQ ID NO：5所示核苷酸序列。

54.稳定转化的浮萍植物，其中所述浮萍包含含有下列可操作地连接的元件的DNA构建体：前导序列、启动子序列、编码纤溶酶原的核苷酸序列和转录终止序列，其中所述前导序列、所述启动子序列和所述终止序列都在浮萍中起作用。

55.权利要求54的方法，其中所述前导序列是SEQ ID NO：2所示序列，而编码纤溶酶原的序列是SEQ ID NO：3所示序列。