CN1780914A

CN1780914A - 用于提高种子中选定的氨基酸含量的方法或构建体

Info

Publication number: CN1780914A
Application number: CN 200480011135
Authority: CN
Inventors: T·瓦尔罗斯; J·阿塔贝科夫; Y·多罗克霍夫; P·苏西; M·梅克莱; T·科尔佩拉
Original assignee: BOREAL PLANT BREEDING Ltd
Current assignee: BOREAL PLANT BREEDING Ltd
Priority date: 2003-02-28
Filing date: 2004-02-27
Publication date: 2006-05-31
Also published as: EP1597375A1; RU2344174C2; RU2005130158A; FI20030315A0; CA2516373A1; WO2004076673A1; AU2004215201A1

Abstract

本发明提供了用于提高选定的氨基酸含量的构建体和方法，这是通过富含氨基酸序列的蛋白的定向表达或积累，使所述蛋白积累在植物物种或植物组织或器官中。所述提高了的含量是通过用编码载体蛋白的重组核苷酸序列构建体稳定转化植物获得的，在所述构建体的3′－末端具有多氨基酸延伸部分，并且可操作地连接在组织或器官特异性调控序列上。在植物组织，特别是种子的膜状油体和细胞壁中的提高的氨基酸含量，提供了可用作动物饲料的组分。

Description

用于提高种子中选定的氨基酸含量的方法或构建体

发明领域

本发明总体上涉及植物生物技术。具体地讲，本发明涉及用于提高植物物种或植物组织或器官，包括细胞壁，细胞膜，油体，特别是种子中选定的氨基酸含量的方法和构建体。所述较高的含量是通过提供编码载体蛋白的重组核苷酸序列构建体获得的，所述载体蛋白在它的3′-末端具有多氨基酸延伸部分。披露了通过所述方法获得的组合物，以及所述氨基酸富集的组合物和用一种或多种所述构建体转化过的植物，植物细胞和细胞系的用途。

发明背景

人类和牲畜的饮食中需要八种必需氨基酸。主要以单一谷物或豆类物种为基础的食物会导致氨基酸的缺乏，这是因为种子蛋白的营养限制，它对人类和动物的饮食需求具有负面影响。例如，谷物种子中的蛋白缺乏赖氨酸和色氨酸，而豆类种子包括缺少含硫氨基酸，即甲硫氨酸和半胱氨酸的蛋白。将种子蛋白用于牲畜饲料必须使所述食物具有预定的氨基酸组成，以便改善动物的健康，有效生长和肉类和乳的良好质量。因此，改良现有的植物蛋白资源是有利的，特别是，改良必需氨基酸的组成，以便更好地适应选定的动物的要求。

业已作出了努力，以便使植物氨基酸的组成满足人类和动物的饮食要求，不过，只取得了有限的成功。不过，营养出色的植物突变体和它们的组织的使用受到了负面多效性作用的损害。这些问题包括较差的种子发芽，缓慢的干燥速度，较低的产量，较高的微生物和昆虫易感性，和不良的研磨特征。

遗传工程提供了改变植物和植物组织中的必需或任何氨基酸组成的替代方法。为了提高甲硫氨酸或赖氨酸含量，业已对生物合成途径进行了操作，或高-甲硫氨酸/赖氨酸业已在转基因种子中表达(WO96/38574；WO 96/01905；WO 95/31554；WO 95/15392；WO 93/19190；EP 485 970，WO99/40209)。原则上讲，业已采用了三种方法：1)改变内源蛋白的氨基酸序列；2)将来自其他植物物种的天然存在的蛋白用于异源表达；和3)表达含有高水平甲硫氨酸/赖氨酸的合成基因。

使用来自其他植物的高-甲硫氨酸/赖氨酸蛋白的方法业已披露在US 5,633,436，US 5,580,782和WO94/16078中。为了提高重要豆科粮食作物的营养价值，将决定富硫的向日葵种子白蛋白的种子特异性表达的嵌合基因稳定地转入狭叶羽扇豆(Lupinus angustifoliusL.)中。在包括转入DNA的单一串联插入片段的品系中，向日葵种子白蛋白占可提取种子蛋白的5％。与非转基因的亲本系相比，所述转基因种子包括更少的硫酸盐和更多的总的氨基酸硫；与它相关的是甲硫氨酸含量提高了94％，而半胱氨酸含量降低了12％。种子的其他氨基酸或总氮或总硫含量不存在统计学上的显著改变。

第一和第二种方法(上述)的组合业已披露于US 5,850,016中。为了提高马铃薯块茎的甲硫氨酸含量，对编码巴西坚果2S白蛋白的cDNA克隆进行诱变，以便通过2-7个额外的甲硫氨酸残基提高它的甲硫氨酸含量，并且转入马铃薯植物。无论是否突变，叶片中的蛋白含量是低的，占总蛋白含量＜0.01％-0.2％。

合成蛋白的使用业已披露于FR 2,744,134，US 5,559,223和WO 92/14822中。为了提高种子中赖氨酸和甲硫氨酸含量，根据α-螺旋-螺旋结构设计了含有31％赖氨酸和20％甲硫氨酸的合成蛋白(CP3-5)。通过菜豆蛋白或β-conglycinin启动子驱动，适当含量的合成蛋白积累在从转基因烟草植物中收获的种子中。在WO 99/15004中，披露了用于改变植物储存器官中的组成的嵌合构建体。编码富硫蛋白的基因具有C-末端KDEL延伸部分，它能够使所述构建体定向进入内质网和高尔基体。

上述方法具有某些缺陷，当对于宿主植物来说没有功能性作用的大量外源蛋白表达时，可能导致很多与种子的生理学异常相关的继发性问题，正如在通过传统育种方法产生的等同类型的突变体中所观察到的。

本发明的首要目的是提供一种方法，包括重组核苷酸序列构建体，使得能够选择用于有效转化任何具有定向表达的需要的植物物种的构建体，所述定向表达使得能够积累富集了一种或多种选定的氨基酸的稳定蛋白，使所述蛋白存在于任何选定的植物组织中。在使用所述构建体时，可以避免表达大量的对宿主植物来说没有功能性作用的外源蛋白的有害作用。本发明的第二个目的是提供包括与相容性配方辅助添加剂组合的稳定的氨基酸富集的蛋白的组合物，所述蛋白业已积累在选定的植物组织中。提出所述组合物适合作为来自选定的植物的用于人类的直接的食物来源以及饲料，特别是动物饲料，和作为食品补充物。

发明概述

本发明涉及通过一种方法改善植物蛋白的质量，它通过富含形成所述植物蛋白的氨基酸序列的蛋白的定向表达或积累提高了一种或多种选定的氨基酸含量。该方法包括用至少一种重组核苷酸序列构建体转化植物的步骤。所述构建体包括组织或器官特异性调控序列，它能在形态发生的选定的阶段驱动转录。所述调控序列可操作地连接在嵌合核苷酸序列上。用于转化植物，特别是作物的所述嵌合核苷酸序列包括两个关键因子-编码与天然载体蛋白相比具有完整的功能特性的载体蛋白的核苷酸序列，和包括编码具有四-八十个氨基酸残基，并且包括构成所述功能上完整的载体蛋白的一种或多种选定的氨基酸的组合的氨基酸序列的密码子的核苷酸序列。编码载体蛋白的核苷酸序列选自编码植物特异性蛋白的核苷酸序列，所述植物特异性蛋白使得所述氨基酸富集的蛋白能够在植物的选定的组织或器官中定向表达或积累。

编码载体蛋白的核苷酸序列缺少终止密码子，并且在它的3′-末端与编码一种或多种氨基酸残基的选定的组合的选定数量的密码子的核苷酸序列框内融合。所述构建体使得氨基酸富集的具有多氨基酸延伸部分的载体蛋白能够在选定的植物组织或器官中进行稳定的定向表达或积累。

上述所谓的转化构建体，是通过选择使得能够进行多氨基酸延伸部分的稳定的蛋白翻译和稳定的定向表达或积累的构建体获得的。所述选择是通过体外翻译系统(IVT)和/或瞬时表达系统完成的，并且随后用其他可应用的方法验证。

所述IVT系统主要被用于确定最佳数量的密码子，它能够在框内与编码载体蛋白的核苷酸序列框内融合的，而不破坏氨基酸富集的必需的载体蛋白的翻译效力。

所述瞬时表达系统包括与编码报道蛋白的核苷酸序列框内融合的上述构建体。将该瞬时表达构建体导入植物细胞，优选采用微粒子轰击方法。然后，选择提供所述报道基因在所述植物细胞中稳定的定向表达的构建体，并且去除来自所选构建体的编码所述报道蛋白的核苷酸序列。将所述构建体用于生产目的，通过用缺少上述报道基因的构建体转化植物，优选使用农杆菌属介导的转化系统。

所述方法能够生产氨基酸富集的蛋白，即具有多氨基酸延伸部分的载体蛋白，包括四-八十个氨基酸残基的选定的组合。所述氨基酸有利地是组氨酸，半胱氨酸，甲硫氨酸，甘氨酸，赖氨酸，色氨酸，丙氨酸，缬氨酸，亮氨酸，异亮氨酸，脯氨酸，苯丙氨酸，酪氨酸，丝氨酸，苏氨酸，精氨酸，天冬氨酸，谷氨酸，天冬酰胺，谷氨酰胺或它们的任意组合。

使得能够在植物组织或器官中进行稳定的定向表达或积累的载体蛋白可以从在植物的细胞内交通途径起作用的蛋白中选择。所述载体蛋白优选是细胞壁蛋白或植物病毒蛋白。例如，有用的载体蛋白是油质蛋白，caleosin，steroleosin，cruciferin，napin或植物病毒运动蛋白。

所述调控序列有利地是在胚胎发生期间表达的启动子。有用的调控序列包括启动子，如napin(NAP)，35S，嵌合杂合体(HYB)，19S，胭脂氨酸，菜豆蛋白，steroleosin，caleosin，cruciferin，苜蓿花叶病毒(AMV)，热激，白蛋白2S或油质蛋白启动子。

所述报道蛋白有利地是可检测的蛋白。荧光蛋白，如绿色荧光蛋白(GFP)，红色荧光蛋白，β-葡糖醛酸酶，obelin或荧光素酶是特别优选的。

本发明的方法特别适用于生产在包括细胞壁碎片在内的植物材料中含有氨基酸富集的具有多氨基酸延伸部分的载体蛋白的组合物，其中，通过该方法获得的植物材料中的选定的氨基酸含量与相应的未修饰过的野生型植物中的氨基酸含量相比至少为2∶1。所述组合物可用于生产油渣饼的氨基酸富集的饲料，油渣饼是通过从植物中回收油之后获得的。

本发明还披露了用瞬时表达构建体或转化构建体转化过的植物，植物细胞和植物细胞系。

本发明的特有特征如权利要求书所限定。

附图的简要说明

图1表示十八种表达质粒，其中pRT表示在质粒载体pRT100中包括花椰菜花叶病毒的35S启动子的构建体(Tpfer等，Nucleic AcidRes.15(14)：5890，1987)。所述十八种质粒是使用两种载体蛋白，即油质蛋白(OLE)或烟草花叶病毒运动蛋白(MP)中的任意一个的基因构建的，三个转录启动子中的一个用箭头表示(NAP＝napin启动子，35S＝花椰菜花叶病毒35S启动子，HYB＝杂合启动子，即来自CaMV 35S启动子的增强子区，它与启动子融合)以及内部组氨酸(His)或半胱氨酸-甲硫氨酸(Cys-Met)密码子富集的核苷酸序列区(″盒″；有关盒的细节参见图3)具有用灰色框表示的各种长度(2x包括两个盒，4x包括四个盒，6x包括六个盒)。绿色荧光蛋白(GFP)编码区与富含His或Cys-Met密码子的序列框内融合。箭头表示启动子，而标有“t”的小框表示转录终止序列。在附图中示出了若干限制位点的位置。

图2表示四种表达质粒，它们是根据瞬时表达测定数据选择的，用于稳定转化到芸薹植物中。NAP＝napin启动子，HYB＝杂合启动子，即来自CaMV 35S启动子的增强子区，它与napin启动子融合，OLE＝油质蛋白，MP＝烟草花叶病毒30K运动蛋白基因，GFP＝绿色荧光蛋白基因，4x＝四个氨基酸富集的核苷酸序列区(盒)。箭头表示启动子，而标有“t”的小框表示转录终止序列。在附图中示出了若干限制位点的位置。

图3表示组氨酸密码子富集的序列的核苷酸序列(A)，半胱氨酸-甲硫氨酸密码子富集的序列的核苷酸序列(B)，甘氨酸密码子富集的序列的核苷酸序列(C)和赖氨酸密码子富集的序列的核苷酸序列(D)。在核苷酸序列下面示出了蛋白翻译序列。K，赖氨酸；H，组氨酸；R，精氨酸；V，缬氨酸；G，甘氨酸；L，亮氨酸；C，胱氨酸；S，丝氨酸；M，甲硫氨酸。星号表示转录终止密码子。用于克隆的限制位点用粗体表示，并且表示在所述序列上面。

图4表示具有与TMV 30KMP基因融合的不同长度的组氨酸或半胱氨酸-甲硫氨酸密码子富集的DNA序列的融合体的质粒的构建方法(空心框″MP″)。pGEM-7Zf(+)(Promega Corporation，USA；产品目录号P2251)被用于构建组氨酸密码子富集的核苷酸序列。克隆pGEM-His-24包括编码含有14个His残基的19个氨基酸长的肽的DNA片段(图3A)。该DNA片段的旁侧是XhoI和BamHI位点，并且还包括SalI限制位点，被设计用于随后的克隆步骤(图3A)。组氨酸或半胱氨酸-甲硫氨酸密码子富集的DNA序列通过不同长度的灰色框表示。pGEM-His-24被用作用于将组氨酸富集的DNA序列与TMV 30K MP基因融合的例子(实施例11)。可以将相同的构建方法用于执行半胱氨酸-甲硫氨酸密码子富集的DNA序列与TMV 30K MP基因的融合(实施例12)。在附图中示出了若干限制位点的位置。

图5A表示表达质粒pNAP和pHYB的构建，其中RT表示所述构建体包括来自质粒载体pRT100的花椰菜花叶病毒的35S启动子(CaMV35S启动子)(Tpfer等，Nucleic Acid Res.15(14)：5890，1987)。所述表达质粒包括napin启动子(NAP)或嵌合启动子(HYB)，它由与花椰菜花叶病毒(CaMV)35S启动子的增强子区偶联的完整的napin启动子组成(例16)。箭头表示启动子，而标有“t”的小框表示转录终止序列。在附图中示出了若干限制位点的位置。

图5B表示将绿色荧光蛋白(GFP)基因克隆到基于35S CaMV和napin启动子的质粒中，其中RT表示所述构建体包括来自质粒载体pRT100的花椰菜花叶病毒的35S启动子(CaMV 35S启动子)(Tpfer等，Nucleic Acid Res.15(14)：5890，1987)。所述表达质粒包括napin启动子(NAP)或嵌合启动子(HYB)，它由与花椰菜花叶病毒(CaMV)35S启动子的增强子区偶联的完整的napin启动子组成(实施例16)。箭头表示启动子，而标有“t”的小框表示转录终止序列。在附图中示出了若干限制位点的位置。

图6表示使用35S CaMV(a)和HYB(b)启动子在构建体pRT-OLE-4x-GFP和pHYB-OLE-4x-GFP中分别获得的相对GFP表达(参见图1)，所述表达是在将构建体粒子轰击进Nicotiana benthamiana的表皮细胞中之后测定的(实施例8)。

图7表示植物表达载体的构建，所述表达载体由受35S CaMV启动子控制的、与GFP编码区融合的TMV 30K MP基因(MP)，即，具有不同长度的His-或Cys-Met富集的序列盒(灰色框)组成。RT表示所述构建体包括来自质粒载体pRT101的花椰菜花叶病毒的35S启动子(CaMV 35S启动子)(Tpfer等，Nucleic Acid Res.15(14)：5890，1987)。箭头表示启动子，而标有“t”的小框表示转录终止序列。在附图中示出了若干限制位点的位置。

图8表示植物表达载体的构建，所述表达载体由受napin(NAP)启动子控制的、与GFP编码区融合的TMV 30K MP基因(MP)，即，具有不同长度的His-或Cys-Met富集的序列盒(灰色框)组成。RT表示所述构建体包括来自质粒载体pRT100的花椰菜花叶病毒的35S启动子(CaMV 35S启动子)(Tpfer等，Nucleic Acid Res.15(14)：5890，1987)。pGEM-30K包括来自pGEM-7Z(+)质粒中的TMV的30K运动蛋白基因(Promega Corporation USA)(实施例7)。箭头表示启动子，而标有“t”的小框表示转录终止序列。在附图中示出了若干限制位点的位置。

图9表示植物表达载体的构建，所述表达载体由受杂合(HYB)启动子控制的、与GFP编码区融合的TMV 30K MP基因(MP)，即，具有不同长度的His-或Cys-Met富集的序列盒(灰色框)组成。RT表示所述构建体包括来自质粒载体pRT100的花椰菜花叶病毒的35S启动子(CaMV 35S启动子)(Tpfer等，Nucleic Acid Res.15(14)：5890，1987)。pGEM-30K包括来自pGEM-7Z(+)质粒中的TMV的30K运动蛋白基因(Promega Corporation USA)(实施例7)。箭头表示启动子，而标有“t”的小框表示转录终止序列。在附图中示出了若干限制位点的位置。

图10表示植物表达载体(pRT)的构建，所述表达载体由受35S CaMV启动子控制的、与GFP编码区融合的油质蛋白基因(OLE)，即，具有不同长度的His-或Cys-Met富集的序列盒(灰色框)组成。RT表示所述构建体包括来自质粒载体pRT100的花椰菜花叶病毒的35S启动子(CaMV 35S启动子)(Tpfer等，Nucleic Acid Res.15(14)：5890，1987)。有关pOLE4/11的细节，参见实施例6。箭头表示启动子，而标有“t”的小框表示转录终止序列。在附图中示出了若干限制位点的位置。

图11表示植物表达载体的构建，所述表达载体由受napin(NAP)启动子控制的、与GFP编码区融合的油质蛋白基因(OLE)，即，具有不同长度的His-或Cys-Met富集的序列盒(灰色框)组成。有关pOLE4/11的细节，参见实施例6。箭头表示启动子，而标有“t”的小框表示转录终止序列。在附图中示出了若干限制位点的位置。

图12表示植物表达载体的构建，所述表达载体由受杂合(HYB)启动子控制的、与GFP编码区融合的油质蛋白基因(OLE)，即，具有不同长度的His-或Cys-Met富集的序列盒(灰色框)组成。有关pOLE4/11的细节，参见实施例6.箭头表示启动子，而标有“t”的小框表示转录终止序列。在附图中示出了若干限制位点的位置。

图13表示表达pNAP-MP-4xHis-GFP(参见图2)的芸薹植物的Western印迹。泳道1，2和3相当于三个独立的pNAP-MP-4xHis-GFP转化体(分别为品系5.1A7，5.1A11和5.1A18)。分子量标记(在右侧的斑点)为50kDa(上斑点)和40kDa(下斑点)。将His抗体用作探针。

图14表示表达pHYB-OLE-4xHis-GFP(参见图2)的芸薹植物的Western印迹。泳道1，2，3，5，6和7相当于六个独立的pHYB-OLE-4xHis-GFP转化体(分别为品系17.1237，17.1238，17.1240，17.20c8，17.20c11和17.20c20)；泳道4相当于野生型(未转化过的)对照植物，分子量标记(泳道8，在右侧的斑点)为50kDa(上斑点)和40kDa(下斑点)。将His抗体用作探针。

图15表示表达pNAP-OLE-4xHis-GFP(参见图2)的芸薹植物的Western印迹。泳道2，3，5，6，7和8相当于六个独立的pNAP-OLE-4xHis-GFP转化体；泳道4相当于野生型(未转化过的)的对照植物。分子量标记(泳道1和9)为50kDa(上斑点)和40kDa(下斑点)。将His抗体用作探针。

发明的详细说明

定义

用于本发明的术语具有它们在植物生物技术，蛋白质化学和饲料配制领域常用的含义。不过，本发明中的某些术语是以更广义或某种程度上不同的方式使用的。因此，在下面对某些术语作更详细的定义。

″重组核苷酸序列构建体″或简称为″构建体″表示DNA构建体，瞬时表达盒或载体或转化盒或载体。所述构建体可以包括线性或环状末端连接在一起的核苷酸序列，它任选地插入质粒中。为了制备有效的，稳定的转化构建体，设计了表达报道蛋白的瞬时或中间构建体，并且鉴定和选择稳定的性能良好的瞬时或中间构建体，以便提供有效的，稳定的转化构建体用于生产目的。随后从所述选择的，有效的构建体中除去报道序列，以便提供用于转化选定的植物物种的转化构建体，它被最终用于生产目的。在本发明中，所述转化构建体包括调控序列和编码载体蛋白的核苷酸序列，它与编码选定的氨基酸残基的密码子框内融合。所述瞬时构建体还包括编码可检测报道蛋白的核苷酸序列。在所述瞬时或中间构建体上，包括至少一个核苷酸序列盒，不过，优选更多，例如，二-六个盒。每一个盒包括至少两个，优选五个或更多个编码选定的氨基酸残基的密码子。包括最多达十个或十五个选定的氨基酸密码子的盒可以融合在编码所述载体和所述报道蛋白的核苷酸序列之间。应当指出的是，将编码所述报道蛋白的核苷酸序列从构建体上除去，业已发现它们是稳定的和有效的，即，它们如所预期的表现出定向表达。这些缺少报道基因的插入的构建体被用作转化构建体。通常，在稳定构建体中的氨基酸密码子的数量为四-八十个。

″核苷酸序列的盒″或″核苷酸序列盒″包括一组密码子，它编码多氨基酸序列，即所谓的″氨基酸盒″。在本发明中，盒表示包括连续的核苷酸序列的插入片段，它具有至少两个，优选四个和任何数量的，最多达大约八十个密码子或三联体。在设计不同的构建体并且用于检查它们的性能，特别是它们在翻译中的性能时所述盒是特别方便的。不过，所述盒不是本发明的先决条件。最终目标是提供编码具有多氨基酸延伸部分，不过仍然具有与相应的天然载体蛋白相同的功能上完整的特性的载体蛋白的构建体。所述最佳数量的密码子优选是能提供稳定的具有多氨基酸延伸部分，并因此富集了选定的氨基酸残基的载体蛋白的密码子。通常，能够作为延伸部分稳定连接的氨基酸残基的数量为四个-大约八十个氨基酸残基或它们之间的任意数量。术语″氨基酸盒″还被用于编码多氨基酸序列链的核苷酸序列或密码子，它可以包括大量的一种或多种选定的氨基酸，并且所述链是与所述载体蛋白稳定地连接的。可以与载体蛋白连接的氨基酸残基的数量可以通过将包括不同数量的氨基酸密码子的核苷酸序列盒随机插入所述构建体，并且通过在无细胞翻译系统中筛选以验证正确的密码子翻译而测定。

″稳定构建体″的选择通常是用″无细胞翻译系统″进行的，它表示体外翻译(IVT)系统，其中，在没有细胞的情况下重建了正常的细胞反应，包括，例如，可以使用例如兔网状细胞或小麦胚芽的裂解物由mRNA合成蛋白的IVT系统。特别优选的系统是可以获得的小麦胚芽无细胞翻译系统，例如(TNTT7/SP6偶联的小麦胚芽提取系统L5030，Promega corporation)。

″定向表达或积累″表示氨基酸富集的蛋白是在特殊的，选定的植物组织或器官中表达的，或者被转运到所述选定的组织或器官中。这一目的可以通过选择载体蛋白实现，该蛋白参与了″细胞内交通途径″。所述途径是膜成分-特异性交通途径，细胞器特异性交通途径等。所述植物中的细胞内交通途径将表达的蛋白转运到选定的器官和组织中，并因此使得表达的产物能够积累在，例如，种子的细胞壁或细胞膜中。当氨基酸富集的载体蛋白在转基因芸薹物种的种子中的表达被定向于种子细胞的细胞壁时，它能够将氨基酸富集的蛋白固定在将油榨出之后残留的油渣饼中。所述油渣饼具有改善了的特性，即较高的氨基酸含量，它是用于饲料行业的组合物的有用成分。所述氨基酸富集的蛋白能够以类似的方式在莴苣的叶肉组织中表达，并且直接用作人类营养来源。

″选定的氨基酸″可以是任何氨基酸，不过，优选的氨基酸是人类或牲畜需要的八种必需氨基酸中的一种或多种。选定的氨基酸可以是，例如，组氨酸，半胱氨酸，甲硫氨酸，甘氨酸，色氨酸，赖氨酸，丙氨酸，缬氨酸，亮氨酸，异亮氨酸，脯氨酸，苯丙氨酸，酪氨酸，丝氨酸，苏氨酸，精氨酸，天冬氨酸，谷氨酸，天冬酰胺或谷氨酰胺。任何氨基酸富集的蛋白都可以通过本发明的方法制备，特别是以组氨酸富集的蛋白的制备为例。所述氨基酸富集的蛋白是通过提供包括编码载体蛋白的核苷酸序列的构建体获得的，所述载体蛋白含有具有最佳数量的一个或多个密码子盒的延伸部分，所述密码子盒编码需要的氨基酸，例如，His，Met-Cys，His-Met-Cys等。在本发明的优选的中间或瞬时构建体上，所述氨基酸密码子融合(位于或放置)在编码所述载体和所述报道蛋白的核苷酸序列之间，其融合方式使得额外的氨基酸残基不会通过抑制它参与分泌性细胞内交通途径而破坏所述载体蛋白的正常生物学功能。

本发明的″载体蛋白″表示一种蛋白，它可以通过多氨基酸序列或肽稳定地延伸。编码功能上完整的载体蛋白的核苷酸序列是与包括一个或多个选定的编码氨基酸残基的密码子的核苷酸盒框内融合的。与相应的天然未修饰过的蛋白相比，编码需要的氨基酸残基的插入密码子不会干扰所述载体蛋白的正常生物学功能。编码用于本发明的载体蛋白的核苷酸序列选自植物特异性蛋白。所述植物特异性蛋白利用分泌性细胞内交通途径，它使得所述氨基酸富集的蛋白能够积累在细胞壁或细胞膜中。特别有用的是选定的植物组织或器官，包括种子，叶片，根和块茎等的油体膜，细胞质膜，液泡膜，质体膜。在本发明中，载体蛋白来自编码三种主要种子蛋白的基因。所述基因是用于使用种子蛋白，特别是来自十字花科的种子蛋白进行遗传工程化的有用的模型蛋白。另外，类似的遗传工程化可应用于任何其他植物物种。被用于本发明的所述三种典型的蛋白是种子蛋白cruciferin(500个氨基酸残基)，napin(165个氨基酸)和油质蛋白(165个氨基酸)，不过，其他蛋白，如caleosin和steroleosin也可以使用。上述所有蛋白存在于芸薹的天然种子中，并且组氨酸含量较低。Cruciferin在每500个氨基酸中只包括9个His残基。Napin在每165个氨基酸中只包括2个His残基，而油质蛋白根本不包含His。Cruciferin，油质蛋白，napin，caleosin和steroleosin可应用在用于饲料用途的种子中。

在本发明中，油质蛋白(OLE)业已被用作模型载体蛋白，不过其他载体蛋白也能够以类似方式使用。例如，上面所提到的两种相关的蛋白caleosin和steroleosin被暗示为潜在有用的，因为它们在种子的油体和细胞壁中的积累方式相似。例如，油质蛋白在以下文献中进行了综述(i)Murphy 1996.TIBTECH 14.206-213；(ii)Methodsin Mol.Biol.vol.44：Agrobacterium protocol.Eds.K.M.A.Gartland和(iii)M.R.Daey，Humamana Press Inc.Totowa，NJ；和Brassica Oilseeds：Production and Utilization.Eds D.S.Kimber和D.I.McGregor.Cab International.1995。油质蛋白被证实是有用的载体蛋白，因为它是疏水性蛋白，具有较小的尺寸，并且是环绕芸薹种子的储存油体的膜的成分。

在将来自选定的植物的核苷酸序列转移到另一种选定的植物中时，存在转录后基因沉默的潜在危险，特别是当所述植物是密切相关或高度同源时更是如此。通过使用具有尽可能小的同源性的编码载体蛋白的核苷酸序列，可以避免由于转基因和内源基因之间的核苷酸序列同源性造成在转基因植物中诱导转录后基因沉默的危险。例如，在本发明中，来自拟南芥，而不是来自芸薹的载体蛋白(由Ole基因编码)被成功地用于避免在转化芸薹时出现的问题。使用编码运动蛋白(MP)的基因的优点是，该基因与芸薹的内源基因没有序列同源性。

本发明的″载体蛋白″包括异构体，即在某些氨基酸残基上具有微小修饰的氨基酸序列。所述载体蛋白可以是天然载体蛋白的缩短形式。编码″载体蛋白″的核苷酸序列还可以在某种程度上改变。例如，它们可以是截短的。唯一的前提是，编码载体蛋白的基因具有完整的功能特性或基本上与天然载体蛋白相同的生物学功能，这意味着在选定的植物组织或器官中的定向表达。

″完整的功能特性″表示所述载体蛋白的表达可以定向到植物的选定的组织或器官或区室中。换句话说，具有多氨基酸延伸部分的载体蛋白必须在植物的选定的组织，器官或区室中积累。

″调控序列″表示核苷酸序列，它能通过下调或上调转录和表达而调控结构核苷酸序列的转录和表达。调控序列包括启动子，增强子，信号序列，终止子等。优选的启动子是相对短的器官或组织特异性转录启动子，能够在在形态发生的不同阶段，特别是在胚胎发生期间驱动所述所述嵌合核苷酸序列的转录。其他潜在有用的启动子是来自苜蓿花叶病毒(AMV)或花椰菜花叶病毒(CaMV)19S的植物病毒衍生的启动子，以及可以通过环境作用(例如加热)或在选定的的非生物(例如水杨酸反应)或生物(病原体)胁迫条件下调控的启动子。

本发明优选的和典型的″转录启动子″是napin(NAP)启动子，特别是来自拟南芥的启动子，35S CaMV启动子或嵌合″杂合″(HYB)启动子，它包括与CaMV 35S启动子的增强子序列偶联的完整的napin启动子。当然，启动子可以包括任何其他操纵调控序列，特别是使得能够在选定的组织中积累氨基酸富集的蛋白的启动子。优选的组织是种子的油体和细胞壁。

控制napin(NAP)基因表达的napin启动子是在胚胎发生期间调控的，并且在开花之后启动。业已报道了来自拟南芥的NAP启动子的核苷酸序列(Rask等1998.J.Plant.Physiol.152，595-599)。本发明的napin(NAP)启动子的重要优点是，与长度为2.1kb的Ole基因相比，它是相当短的(152bp)。

业已证实花椰菜花叶病毒的35S启动子(CaMV)在芸薹细胞中有活性(Harpster等，1988.Mol.Gen.Genet.212，182-190)。所述35S启动子在胚胎中也有活性，并且通过检测开花之前成熟叶片中氨基酸富集的重组蛋白(OLE或MP)的产物，有利于检测转基因芸薹植物。

″报道序列″或″编码报道蛋白的核苷酸序列″表示用于设计中间或瞬时构建体的核苷酸序列，它使得能够选择这样的构建体，该构建体使得具有完整的生物学功能的稳定的氨基酸富集的蛋白能够在植物的选定的组织或器官中进行稳定的定向表达或积累。在这种情况下，编码所述报道蛋白的核苷酸序列使得能够方便，准确而又明确地鉴定合适的构建体。所述报道序列使得能够证实所述启动子被活化的组织或器官，以及所述启动子有活性的条件。在本发明的优选实施方案中，所述报道蛋白是肉眼可见的或可检测的蛋白，优选荧光蛋白。优选绿色荧光蛋白，β-葡糖醛酸酶，obelin或荧光素酶。具有所述报道序列的构建体是中间或瞬时构建体，因为一旦证实了所述载体蛋白包括适当表达的选定的多氨基酸序列延伸部分，就可以将所述报道序列除去。除去了所述报道基因，因为它们可能不存在于实际的转化构建体中，所述构建体被用于生产饲料或食品。

在本发明中，将两种不同的系统用于加快有用的，稳定的构建体的选择。将无细胞体外翻译(IVT)系统和瞬时表达系统和瞬时表达系统用于选择合适的转化构建体，它允许不干扰载体蛋白和氨基酸盒的表达。所述无细胞体外翻译(IVT)系统使得能够鉴定并因此选择可以不出现任何问题而正确翻译的最佳数量的密码子。

将瞬时表达测定用于确保蛋白表达，并且表达的蛋白与天然未修饰过的蛋白相比具有完整的生物学功能，并且是在植物的靶定组织或器官中表达和积累的。这一目的是通过对所述报道蛋白的肉眼观察实现的。共焦激光扫描显微技术是特别有用的，因为它允许对表达与编码所述报道蛋白的核苷酸序列框内融合的氨基酸富集的蛋白的转基因植物进行早期检测。可以将基于抗体的测定方法(例如，酶联免疫吸附测定)和直接氨基酸分析用作检测表达与编码所述报道蛋白的核苷酸序列框内融合的氨基酸富集的蛋白的转基因植物的替代系统。

发明的一般说明

本发明的主要目的是详细说明提供用于提高植物细胞组织，如油体和细胞壁，特别是十字花科的种子中选定的氨基酸含量的措施的方法。通过本发明的方法，在转基因芸薹植物的胚胎发生期间成功地表达了稳定的氨基酸富集的蛋白，并且表达的氨基酸富集的蛋白积累在种子中。通过本发明的方法和构建体，种子细胞中的重组氨基酸富集的蛋白紧密结合在细胞膜或细胞壁(CW)上，并因此可以保留在种子残留物中，在将油榨出之后锚定在油渣饼上。这使得能够用随后的回收方法回收油，并且具有改善了的特性，即增加的氨基酸残余物，即油渣饼的使用提供了用于动物饲料制备的氨基酸富集的组合物的有用成分。当在牛饲料中存在额外氨基酸，例如，组氨酸，并且与本发明的正常的天然蛋白结合时，它起着天然氨基酸来源的作用，并且可以在牛代谢中正常利用。因此，氨基酸富集的，例如，组氨酸富集的蛋白是牛饲料中的有用成分，它起着牛奶生产的促进剂的作用。其他有用氨基酸的富集，例如，在可食用莴苣叶片中的富集，使得可以将所述氨基酸富集的蛋白用作直接的人类食物来源，而不需要进一步的加工。

位于选定的所需氨基酸-密码子富集的序列下游的编码报道蛋白的核苷酸序列，例如肉眼可检测的绿色荧光蛋白(GFP)，允许方便地检测基因表达和表达蛋白在转基因植物中的细胞内定位。来自各种报道融合构建体的报道蛋白的表达以GFP为例，并且在图1示出，如图6所示，它示出了选定的报道融合构建体在单细胞，例如烟草表皮细胞中的瞬时表达。

因此，本发明涉及用于生产转化过的植物，植物细胞，或细胞系的方法，它们能够表达高水平的氨基酸富集的具有稳定的多氨基酸延伸部分的载体蛋白，它们具体位于选定的植物组织或植物器官或植物细胞区室，包括种子膜性油体或细胞壁中。

本发明的方法包括用能够在植物的靶定组织或器官中表达具有多氨基酸序列或延伸部分的载体蛋白的构建体转化植物或植物细胞。所述用于稳定转化的构建体包括调控序列，包括器官-和/或组织特异性转录启动子，它能够在形态发生的不同阶段，特别是在胚胎发生期间驱动编码载体蛋白的感兴趣的基因转录。所述调控序列可操作地与以下部分连接：(a)编码载体蛋白，没有终止密码子的核苷酸序列；和(b)包括至少一个盒的核苷酸序列，所述盒包括编码需要的氨基酸残基的至少两个密码子，是与编码载体蛋白的核苷酸序列框内融合的。

可以制备有或没有报道基因的各种构建体。可以通过利用体外翻译(IVT)系统分析编码氨基酸的受包括选定的启动子在内的调控序列控制的构建体，所述系统允许观察具有不同氨基酸盒的质粒的稳定性。报道构建体还可以使用瞬时测定方法分析。

包括编码在3’-末端具有氨基酸盒的载体蛋白的核苷酸序列的稳定的构建体是使用IVT-系统选择的，这是通过为构建体提供随机选择数量的氨基酸密码子，例如至少两个氨基酸密码子，作为至少一个盒，不过优选多个，例如两个，四个，六个或八个盒插入，并且分析获得的结果而进行的。例如，如果所述盒包括14个氨基酸密码子(14x)，这会得到在编码功能上完整的载体蛋白(Ole或MP)下游具有28(2x)，56(4x)和112(8x)个氨基酸密码子的氨基酸富集的载体蛋白。初步试验表明8x(112个氨基酸)是不稳定的，能产生缺失变体(微型质粒)。另外，6x(84aa)个克隆的某一些不稳定。因此，为了进一步研究，将克隆2x，4x和6x与3′-近端报道基因，如具有3′-终止序列的GFP基因融合。采用完全相同的方式可以确定任何氨基酸密码子的优化数量，这是通过将不同数量的氨基酸密码子插入包括编码载体蛋白的核苷酸序列的构建体，并且选择提供稳定结果的构建体而进行的。

对若干植物品系进行的Western印迹分析(表1)证实了针对所有类型的载体蛋白，氨基酸，或报道蛋白，例如组氨酸序列，MP，油质蛋白或GFP(图13-15)产生的抗体可用于检测具有已知分子量(MWs)的蛋白。油质蛋白，MP，GFP和4X His-盒(在每一个盒中具有14个His密码子)的推测的MWs分别为18.5，30，30，和2.5kDa。融合蛋白的合适的分子量可以作为组合的每一种融合成分的分子量的总和的值计算。在通过SDS-PAGE凝胶电泳和Western印迹分析时证实了所述融合蛋白的大小与预期的分子量相同。通过Western印迹分析研究了转基因编码的蛋白产物(油质蛋白-His和MP-His)的稳定性。在转化之后对(自交)植物后代(第三代)进行的分析明确表明了在后续世代中，转基因表达是稳定的。另外对检查的转化过的植物的Western印迹分析进一步发现，无论植物世代如何，蛋白产物的大小保持不变。以上分析还证实了，融合蛋白产物的含量在植物世代之间是相对稳定的，它是获得的相对其他植物蛋白的稳定表达水平的指标。

可以分别使用抗载体蛋白，报道蛋白或氨基酸的抗体分析转化过的植物，任意一个都可用于获得理想的结果。可以直接分析某些种子的选定的氨基酸含量。一般，发生了一系列事件，其中，分析了前一组试验，并且仅选择了对以后的研究有作用和合适的构建体，用于随后的步骤。因此，在用于生产目的的最终植物转化之前，通过常规方法本身分析并且检查了很多方面，以便获得需要的结果。具有所需特性的构建体，包括稳定转化能表达稳定的氨基酸富集的蛋白的植物，可以通过本文所披露的方法获得。

所述报道蛋白使得能够在无细胞体外翻译(IVT)系统中方便而且准确选择一种构建体，该构建体提供了稳定的氨基酸富集的载体蛋白的可靠表达，该蛋白具有与瞬时表达系统组合的可检测的报道蛋白。所述瞬时表达系统使得能够验证所述载体蛋白的生物学功能没有受到破坏。对于油质蛋白来说，完整的生物学功能意味着所述报道蛋白是在种子的油体中表达的，特别是在种子细胞的细胞膜和细胞壁中表达。

选择通过所述报道蛋白观察到的具有载体蛋白的正常生物学功能的构建体，并且除去编码所述报道蛋白的核苷酸序列。因此，编码载体蛋白的核苷酸序列和编码需要的氨基酸的密码子是框内融合的。

选择令人满意的构建体，并且转入农杆菌属，并且通过合适的常规方法选择阳性(含有构建体)的克隆，例如，通过斑点印迹分析，Southern印迹杂交，并且用于转化植物，优选作物，特别是十字花科作物。所述转化过的作物能表达稳定的氨基酸富集的蛋白，并且将所述蛋白积累在靶定的或选定的植物组织中。

包括转录启动子在内的调控序列是从包括组织或器官特异性转录启动子的调控序列中选择的，它使得能够在叶片，种子或其他需要的或选定的植物器官中进行mRNA的定向合成，以便提供氨基酸富集的蛋白在所述器官中的定向积累。为了能够选择令人满意的构建体，将编码选定的所需氨基酸残基的氨基酸密码子富集的序列放置在载体蛋白基因和编码可检测的报道基因的核苷酸序列之间的盒内，所述报道基因优选荧光报道蛋白，例如，绿色荧光蛋白(GFP)，β-葡糖醛酸酶或荧光素酶。

本发明的优选作物属于十字花科，其中，氨基酸富集的，特别是组氨酸富集的蛋白，根据它们在表达之后锚定并且定位在油体膜上的能力，提供了定向积累。根据相同的原理，可以获得使得能够在任何其他需要的植物物种和它们的组织中积累任何其他氨基酸富集的蛋白的构建体。

上述目的是通过用包括编码载体蛋白的核苷酸的构建体转化植物实现的，所述蛋白选自能够在选定的分泌性细胞内交通途径中起作用的较小的植物蛋白，它能够积累在选定的，靶定向的植物器官中，例如叶膜，种子膜，叶片或种子细胞的细胞壁。例如，在本发明中的例子是两种不同的载体蛋白，油质蛋白和TMV MP蛋白，包括与所述天然载体蛋白框内融合，随后积累在所述转基因植物的选定的目标组织中的多氨基酸尾。编码所述载体蛋白的特别优选的核苷酸序列是能够在叶片或种子膜中积累的油质蛋白和运动蛋白，如TMV MP，在通过合适的启动子驱动转录时，它可以积累在叶片或种子细胞的细胞壁中。编码所述载体蛋白的核苷酸序列优选是从植物物种中获得的，该蛋白对于转化过的植物宿主来说不是内源的。

编码一种或多种氨基酸的核苷酸序列通常是作为一个或多个盒提供的，它们具有选定的氨基酸密码子，所述密码子编码形成所述载体蛋白的选定的肽。包括编码氨基酸残基的核苷酸序列的盒优选是这样定位的，它不会破坏所述载体蛋白的正常生物学功能，即，所述载体蛋白的3′-末端。如果氨基酸密码子位于所述载体蛋白的N-末端或中间的某处的话，所述氨基酸富集的蛋白不能够根据需要积累在目标器官中。编码所述报道蛋白的核苷酸序列与富集了选定的氨基酸密码子，但缺少终止密码子的延长的核苷酸序列融合在相同的翻译框内。氨基酸密码子的最佳数量大约为10-80个，并且是通过在无细胞翻译系统中检查正确的蛋白翻译确定的。

因此，在本发明的优选的典型实施方案中，编码载体蛋白的核苷酸序列位于核苷酸序列的5′-近端，而报道核苷酸序列位于3′-末端。在本发明中感兴趣的优选载体蛋白或核苷酸序列是OLE或TMV 30KMP。

用于本发明实施例中的OLE是相当于编码种子蛋白油质蛋白(Ole)的拟南芥的染色体基因，油质蛋白是十字花科成员的油体膜的成分。TMV 30K MP是来自烟草花叶病毒U1(TMVU1)基因组RNA的核苷酸序列。该基因编码非结构性疏水30K蛋白，它负责病毒基因组在受感染的植物中通过胞间连丝(PD)在细胞之间运动(运动蛋白，MP)。30KMP定向于并且积累在细胞壁中和PD中，并且是在MP基因的转基因植物中表达的。

氨基酸密码子的最佳数量是通过将包含编码具有不同大小的延伸部分的载体蛋白的核苷酸序列的构建体随机转化入植物并且选择与天然未修饰过的蛋白相比能表达具有未受干扰的生物学功能的蛋白的转基因植物确定的，所述构建体包括不同数量的氨基酸密码子，所述方法通过瞬时表达测定进行评估。功能构建体和成功的转化可以通过表达的蛋白，特别是所述报道蛋白在转基因植物中的表达和细胞内定位方便地验证。

在本发明中，使用了遗传工程方法，所述方法允许快速鉴定和选择具有最佳密码子含量的嵌合构建体，使得氨基酸富集的蛋白能够在目标植物组织中稳定地积累。

在本发明中，用于在转基因植物生产氨基酸富集的蛋白的方法涉及制备上述一种或多种构建体。优选的选择方法包括在无细胞翻译系统中，由诸如(Ole-多氨基酸-GFP或TMV MP-多氨基酸-GFP)的构建体表达荧光重组氨基酸富集的载体蛋白。用于本发明的无细胞翻译系统是这样一种方法，它能够明确地鉴定正确的构建体和重组氨基酸富集的蛋白的表达。除了常规检测方法之外，通过GFP，或其他报道蛋白提供的荧光检测可以使用种子和/或叶片的共焦激光扫描显微技术进行。共焦激光扫描显微技术的应用，提供了对表达与所述报道蛋白框内融合的氨基酸富集的蛋白的早期检测和筛选的便捷工具。

使用报道核苷酸序列插入片段的原因是，该蛋白可以用作标记，用于证实所述构建体和氨基酸富集的载体蛋白，例如来自重组序列的油质蛋白-多氨基酸-GFP或TMV MP-多氨基酸-GFP的表达是正确的。荧光，特别是GFP-荧光可以通过共焦激光扫描显微技术监测，它允许检测Ole-多氨基酸和MP-多氨基酸的体内表达，以及测定它们的表达水平。

植物表达载体包括编码载体蛋白的核苷酸序列，如与各种长度并且携带报道基因，例如，位于3′-末端的GFP基因的多氨基酸编码序列融合的Ole和TMV MP。为了构建所述植物表达载体，所述构建体与各种长度的富集了需要的氨基酸密码子的序列融合，例如对于组氨酸来说，包括密码子CAC和CAU，对于半胱氨酸和甲硫氨酸来说，包括密码子TGT，TGC和ATG，对于甘氨酸来说，包括密码子GGA，GGT，GGC，和GGG，而对于赖氨酸来说，包括密码子AAA和AAG。所述构建体缺少终止密码子。合适的构建体可以通过提供具有随机选择数量的氨基酸密码子进行选择，例如，至少两个氨基酸密码子，将它作为至少一个盒插入，不过优选多个，例如两个，四个，六个，八个盒，并且分析所获得的结果。例如，如果所述盒包括14个组氨酸密码子(14x)，它会产生位于编码载体蛋白的基因(Ole或MP)下游的具有28(2x)，56(4x)和112(8x)His-密码子的氨基酸富集的载体蛋白。初步测试表明，8x(112个氨基酸)是不稳定的，能产生缺失变体(微型质粒)。另外，6x(84aa)个克隆中的某些是不稳定的。因此，为了进一步研究，将克隆2x，4x和6x与具有3′-终止序列的3′-近端GFP基因融合。采用完全相同的方法，可以测定任何氨基酸密码子的最优数量，这是通过将各种数量的氨基酸密码子插入包括编码载体蛋白的核苷酸序列的构建体，并且选择提供稳定结果的构建体。

构建体，如图1所示的构建体包括调控序列，特别是启动子，如napin启动子NAP，35S CaMV启动子或杂合HYB启动子，它们可操作地连接在载体蛋白，特别是Ole和/或TMV MP上。所有构建体都包括编码报道蛋白的核苷酸序列，特别优选的是绿色荧光蛋白(GFP)，作为选择的标记。GFP基因与氨基酸尾框内融合，所述氨基酸尾具有不同的长度，包括一个或多个盒，这些盒包括编码需要的氨基酸的至少两个氨基酸密码子。具体地讲，使用多个盒(2x，4x，6x)。将所述报道蛋白在瞬时表达测定中的荧光用于初步实验，用来鉴定和筛选最佳的功能性构建体。所述瞬时表达测定包括作物胚胎的微粒子轰击，例如涉及芸薹胚胎和Nicotiana benthamiana叶片的粒子轰击的实验，并且如表1所示。所述实验证实了NAP启动子在胚胎中是有活性的，而HYB启动子在胚胎和叶片表皮细胞中都是有效的。以上数据构成了选择四种(在十八种可利用的构建体中，图1)用于随后的转化研究的数据(图2)。

优选的转化系统是农杆菌属介导的转化。将上文所披露的每一种基因构建体转入根癌农杆菌；通过Southern印迹杂交选择转化的克隆，然后将农杆菌属的每一种转化的菌株用于转化油菜籽春油菜(芸薹)。表达氨基酸富集的载体蛋白(Ole-多氨基酸或MP-多氨基酸)的转基因植物的后续选择是通过以下步骤进行的：

(a)PCR，使用对含有选定的氨基酸密码子的Ole和TMV MP基因特异的引物

(b)用抗油质蛋白和30K TMV MP的抗体进行Western印迹分析

(c)检测叶片，花，胚胎中的GFP荧光。

使用上述实验方法，当业已发现了表达具有未受干扰的功能的蛋白克隆时，可以将报道核苷酸序列从相应的构建体中除去，并且用所述功能验证过的构建体转化实际作物。

本发明的目的是提供在植物材料中包括具有稳定的氨基酸盒的氨基酸富集的载体蛋白的组合物，特别是锚定在细胞壁上和在从油用植物中回收油之后获得的油渣饼中的那些。在本发明的实施方案中，可以验证种子蛋白中稳定的氨基酸富集。

本发明的原理可以通过多种已知的重组DNA技术实现，这些技术是当今可以获得的。因此，本发明的以下概述披露了优选实施方案。

在下面的实施例中将对本发明作更详细的说明。氨基酸富集的蛋白的生产以组氨酸，甲硫氨酸，半胱氨酸，甘氨酸和赖氨酸为例，不过，本发明所披露的原理可应用于任何其他需要的氨基酸，这是通过插入包含用于任何选定的目的选定数量的所需氨基酸密码子的盒而实现的。

实施例1

染色体DNA分离和PCR

按以下方法分离染色体DNA。用研钵在液氮中将300μg的拟南芥叶片组织匀浆成细粉。然后添加3ml的100mM Tris-HCl；pH 8.0，500mM NaCl，50mM EDTA，在添加600μl的10％SDS和500μl的20％聚乙烯吡咯烷酮(平均分子量为360,000)之后进一步研磨。将混合物转移到聚丙烯试管中，并且在65℃下孵育10分钟。然后将450μl的冰冷的乙酸钾添加到该溶液中，并且通过颠倒试管轻柔摇晃所述混合物，在冰上孵育30分钟，并且在4℃下8000rpm的速度离心10分钟。用苯酚/氯仿(1∶1)提取上清液，并且用异丙醇使DNA沉淀。用70％乙醇洗涤沉淀的DNA，并且风干，然后溶解到10mMTris-HCl；pH 8.0中。所述PCR反应混合物在25μl的反应体积中包括1xPCR缓冲液(10x缓冲液：500mM KCl，100mM Tris-HCl；pH 9.0，25℃和Triton X-100)，1.5mM MgCl₂，1μl的Taq聚合酶(5U/μl)，0.2mM的每一种dNTP，0.4μM的引物和3μg的拟南芥基因组DNA。通过在95℃下加热3分钟使模板变性，并且用iCycler^TM(Bio-Rad)热循环仪进行30轮PCR，在95℃下变性1分钟，引物在65℃下退火1.5分钟，在72℃下进行引物延伸2分钟，在30轮之后在72℃下进行最终的延伸步骤10分钟。具有预期大小(776bp)的PCR产物是在对最终的PCR反应混合物进行电泳之后从1％琼脂糖凝胶中分离的，用凝胶切片试剂盒(Qiagen)纯化，然后用1个单位的T4 DNA聚合酶在补充了100mM dNTP的1X T4 DNA聚合酶反应缓冲液(50mM NaCl，10mM Tris-HCl；pH 7.9，10mM MgCl₂，1mM二硫苏糖醇)中在14℃下处理15分钟，然后克隆。

实施例2

组氨酸密码子富集的DNA序列的合成和克隆

为了构建组氨酸密码子富集的DNA片段，使用了三种化学合成的ssDNA片段：

H-P-1(SEQ ID NO：1)

5′-GCGCCTCGAGTTCACCATCACCATCACCATCACGGGCACCATCAC，

H-P-2(SEQ ID NO：2)5′-CATCACCATCACCATGG和

H-M(SEQ ID NO：3)

5′-CCGGATCCTAAAGTCGACCATGGTGATGGTGATGGTGATGGTGCC。

为了获得具有His密码子富集的序列的dsDNA片段，让寡核苷酸H-M和H-P-2在1X AMV逆转录酶(RT)反应缓冲液(50mM Tris-HCl；pH8.3，50mM KCl，10mM MgCl₂，0.5mM亚精胺，10mM DTT)中，在室温下退火30分钟，并且链延伸反应是在存在1X AMV RT缓冲液，1mMdNTPs和1单位的AMV RT的条件下在37℃下进行45分钟。通过琼脂糖凝胶电泳从未退火的寡核苷酸中分离反应产物，纯化，并且在1X DNA聚合酶I大(Klenow)片段缓冲液(50mM Tris-HCl；pH 7.2，10mM MgSO₄，0.1mM DTT)中在室温下与寡核苷酸H-P-1退火30分钟。链延伸反应是使用5单位的Klenow聚合酶在存在25mM每一种dNTPs的条件下，在1X Klenow缓冲液中在37℃下进行30分钟。将预期大小(79bp)的dsDNA片段从琼脂糖凝胶上切除(在适当的电泳分离之后)，纯化，用XhoI和BamHI消化，并且克隆到以类似方法消化的克隆载体pGEM-7Zf(+)(Promega Corporation，USA；产品目录号P2251)中。在限制性分析和测序之后，选择克隆pGEM-His-24进行进一步操作。该克隆包括的DNA片段有可能编码包括14个His残基的19个氨基酸长的肽图3a)。该DNA片段的序列的旁侧是XhoI和BamHI位点，并且还包括被设计用于随后的克隆步骤的SalI限制位点(图3a)。

实施例3

半胱氨酸和甲硫氨酸密码子富集的DNA序列合成和克隆

为了构建半胱氨酸和甲硫氨酸密码子富集的DNA片段，使用了两种化学合成的ssDNA片段：

C-M-P-1(SEQ ID NO：4)

5′CACCTCGAGTATGTTGTTGCATGTGCATGTGCTGTTGCATGTCGACAAAC 3′

和C-M-P-2(SEQ ID NO：5)

5′GTTTGTCGACATGCAACAGCACATGCACATGCAACAACATACTCGAGGTG 3′

为了获得具有Cys/Met密码子富集的序列的dsDNA片段，让寡核苷酸C-M-P-1和C-M-P-2在1X DNA聚合酶I大(Klenow)片段缓冲液(50mM Tris-HCl；pH 7.2，10mM MgSO₄，0.1mM DTT)中在室温下退火30分钟。将预期大小(50bp)的dsDNA片段从琼脂糖凝胶上切除(在适当的电泳分离之后)，纯化，用XhoI和BamHI消化，并且克隆到以类似方法消化的克隆载体pGEM-7Zf(+)(Promega Corporation，USA；产品目录号P2251)中。在限制性分析和测序之后，选择克隆pGEM-Cys/Met-10作进一步的操作。该克隆包括的DNA片段可能编码包括10个Cys/Met-氨基酸残基的16个氨基酸长的肽(图3b)。该DNA片段的序列的旁侧是XhoI和BamHI位点，并且还包括被设计用于随后的克隆步骤的SalI限制位点(图3b)。

实施例4

甘氨酸密码子富集的DNA序列的合成和克隆

为了构建甘氨酸密码子富集的DNA片段，使用了两种化学合成的ssDNA片段：

GL-P-1(SEQ ID NO：6)

5′-GCGCCTCGAGTTGGTGGAGGTGGAGGCGGTGGAGGTGGCGTCGACAAAT

GGATCCCC-3′和

GL-P-2(SEQ ID NO：7)

5′-GGGGATCCATTTGTAGACGCCACCTCCTCCACCGCCTCCACCTCCACC

AACTCGAGGCGC-3′

为了获得具有甘氨酸密码子富集的序列的dsDNA片段，让寡核苷酸GL-P-1和GL-P-2在1X DNA聚合酶I大(Klenow)片段缓冲液(50mMTris-HCl；pH 7.2，10mM MgSO₄，0.1mM DTT)中在室温下退火30分钟。将预期大小(60bp)的dsDNA片段从琼脂糖凝胶上切除(在适当的电泳分离之后)，纯化，用XhoI和BamHI消化，并且克隆到以类似方法消化的克隆载体pGEM-7Zf(+)(Promega Corporation，USA；产品目录号P2251)中。在限制性分析和测序之后，选择克隆pGEM-Gly-9作进一步操作。该克隆所包括的DNA片段有可能编码包括9个Gly-氨基酸残基的19个氨基酸长的肽(图3c)。该DNA片段的序列的旁侧是XhoI和BamHI位点，并且还包括被设计用于随后的克隆步骤的SaI限制位点(图3c)。

实施例5

赖氨酸密码子富集的DNA序列的合成和构建

为了构建赖氨酸密码子富集的DNA片段，使用了两种化学合成的ssDNA片段：

L-P-1(SEQ ID NO：8)

5′-GCGCCTCGAGTTAAAAAGAAAAAGAAAAAGAAAAAGAAAAAGAAAAAGGTCGACAAATGGATCCCC-3′和

L-P-2(SEQ ID NO：9)

5′-GGGGATCCATTTGTCGACCTTTTTCTTTTTCTTTTTCTTTTTCTTTTTCTTTTTAA CTCGAGGCGC-3′

为了获得具有赖氨酸密码子富集的序列的dsDNA片段，让寡核苷酸L-P-1和L-P-2在1X DNA聚合酶I大(Klenow)片段缓冲液(50mMTris-HCl；pH 7.2，10mM MgSO4，0.1mM DTT)中在室温下退火30分钟。将预期大小(66bp)的dsDNA片段从琼脂糖凝胶上切除(在适当的电泳分离之后)，纯化，用XhoI和BamHI消化，并且克隆到以类似方法消化的克隆载体pGEM-7Zf(+)(Promega Corporation，USA；产品目录号P2251)中。在限制性分析和测序之后，选择克隆pGEM-Lys-12作进一步操作。该克隆所包括的DNA片段有可能编码包括12赖氨酸氨基酸残基的22个氨基酸长的肽(图3d)。该DNA片段的序列的旁侧是XhoI和BamHI位点，并且还包括被设计用于随后的克隆步骤的SaI限制位点(图3d)。

实施例6

通过PCR从拟南芥染色体DNA中分离油质蛋白(ole)基因以及随后进行克隆

为了克隆来自拟南芥染色体DNA的油质蛋白基因，化学合成了两种寡核苷酸引物：

OLE-P(SEQ ID NO：10)5′-AAAACCATGGCGGATACAGCTAGAGGAACCCATC和

OLE-M(SEQ ID NO：11)5′-GGGGCCATGGGAGTAGTGTGCTGGCCACCACGAGTAC.

将OLE-P和OLE-M用作来自拟南芥的基因组DNA的PCR的引物(实施例1)。所获得的PCR片段是平端的，并且克隆到pGEM-3Zf(+)(PromegaCorporation，USA；产品目录号P2271)的SmaI位点上。

通过限制性分析和测序验证重组克隆。为了进行随后的研究，选择克隆pOLE4H。与公开的油质蛋白序列(X62353)相比，克隆pOLE4H的序列包括位于基因内含子上的一个核苷酸取代(所编码的氨基酸序列没有变化)，即与公开序列(X62353)相比在pOLE4H序列的513号位置上的G→A取代。

化学合成了OLE-3′XhoI(SEQ ID NO：12)5′-GCGCCTCGAGAAGTAGTGTGCTGGCCACCAC，并且用作PCR引物，扩增来自质粒pOLE4H的油质蛋白编码区；将所述PCR产物克隆到pGEM7Zf(+)(Promega Corporation，USA；产品目录号P2251)的XhoI位点上。在用该引物克隆pOLE4H序列之后，通过测序验证所得到的克隆的序列，以便确保保留了所有油质蛋白基因的编码特性。根据这一分析，选择克隆pOLE4/11。pOLE4/11包括缺少终止密码子的野生型油质蛋白基因，其旁侧是适合后续克隆步骤的NcoI和XhoI限制位点。

实施例7

使用RT-PCR从烟草花叶病毒(TMV 30K MP)基因组RNA中分离30K运动蛋白基因以及随后进行克隆

为了克隆来自TMV基因组RNA的30K基因，化学合成了两种特异性寡核苷酸引物：

寡核苷酸引物N30K(SEQ ID NO：13)

5′-GCGGAATTCCCATGGCTCTAGTTGTTAAAGG)和

寡核苷酸引物C30K(SEQ ID NO：14)

5′-AGACCTCGAGGAAACGAATCCGATTCGGCGAC；

所述引物分别包括EcoRI限制位点和XhoI限制位点。第一条cDNA链是由TMV基因组RNA合成的，使用了20nM的C30K引物，1mM dNTPs和1单位的AMV，在1X AMV逆转录酶(RT)反应缓冲液(50mM Tris-HCl；8.3，50mMKCl，10mM MgCl₂，0.5mM亚精胺，10mM DTT)中在37℃下进行45分钟。此后将5μl的反应混合物放在1xPCR缓冲液(10x缓冲液：500mM KCl，100mM Tris-HCl；pH 9.0，25℃和Triton X-100)中进行PCR反应，所述缓冲液具有1.5mM MgCl₂，21μl的Taq聚合酶(5U/μl)，0.2mM每一种dNTP，浓度为0.4μM的引物，反应体积为25μl。通过在95℃下加热3分钟使模板变性，并且用iCycler(Bio-Rad)热循环仪进行28轮PCR，在95℃下变性1分钟，引物在68℃下退火1.5分钟，在72℃进行引物延伸2分钟，在30轮之后进行的最终的延伸步骤是在72℃下进行10分钟。通过EcoRI和XhoI裂解所得到的DNA产物，并且克隆到EcoRI-XhoI-消化的pGEM-7Zf(+)(Promega Corporation，USA；产品目录号P2251)中。然后对重组克隆进行限制性分析和测序，选择质粒pGEM-30K作进一步研究。在该质粒中，TMV 30K MP基因的终止密码子被XhoI位点所取代，以便随后与His，Cys/Met，Gly和Lys密码子富集的序列融合(实施例2-5；图3a-d)。

实施例8

微粒子轰击

微粒子(颗粒)轰击是使用高压的基于氦气的装置PDS-1000(Bio-Rad)通过盘破裂方法进行的，正如Morozov等所披露的(1997)。通过在70％乙醇中对60mg的钨进行涡旋搅拌3-5分钟制备钨颗粒，然后在工作台上孵育15分钟。通过短时间离心对混合物进行沉淀，并且去掉上清液。将无菌水添加到颗粒上，并且涡旋搅拌1分钟。让颗粒沉降1分钟，并且离心2秒钟。去掉上清液。重复这一过程三次。添加无菌50％的甘油，使颗粒浓度达到60mg/ml。对每一次粒子轰击来说，将DNA沉淀在具有氯化钙和乙醇的钨颗粒上(M-20，1.3μ)。将5-10μg的质粒DNA，50μl的CaCl₂(2.5M)和20μl的亚精胺(0.1M)混合，并且涡旋搅拌2-3分钟，使它沉降，并且离心2秒钟。去掉上清液，并且将140μl的70％乙醇添加到沉淀的表面，去掉所述乙醇，并且添加100％乙醇，并且去掉乙醇，而不干扰沉淀，并且重复。将6μl的悬浮液用吸液管转移到大型载体上，并且用于轰击。将Nicotiana benthamiana的分离的叶片(15-30mm大)放置在塑料Petri培养皿的中央，并且在固体支持物上轰击，靶标距离为7cm。轰击是使用1350kPa的氦气脉冲在真空室中进行的。在粒子轰击24小时之后分析接种的叶片。使用共焦激光扫描显像系统MRC-1024(Bio-Rad)监测GFP荧光。

实施例9

构建超量表达油质蛋白C-末端亲水性末端的大肠杆菌菌株用于随后的兔免疫并且获得油质蛋白-特异性抗体

大部分油质蛋白N-末端区是疏水性的，而由油质蛋白基因的第二个外显子编码的油质蛋白C-末端部分的氨基酸序列是亲水性序列，它适合在大肠杆菌中表达，并且用作免疫抗原。因此，选择C-末端油质蛋白区(aa 120-173)用于这一目的。通过PCR反应扩增油质蛋白基因的第二个外显子，使用质粒pOLE4/11(实施例6)作模板和寡核苷酸引物：

OLE-EX-B(SEQ ID NO：15)

(5′-TGTGGGATCCTACGCAACGGGAGAGCACCCA)和

OLE-3′XhoI(SEQ ID NO：12)

(5′-GCGCCTCGAGAAGTAGTGTGCTGGCCACCAC)

分别包括BamHI限制位点和XhoI限制位点。所得到的PCR产物用BamHl和XhoI消化，并且克隆到XhoI-和BamHI-消化的pGEM-7Zf(+)(Promega Corporation，USA；产品目录号P2251)中。在对所得到的克隆进行限制性分析和测序之后，选择克隆pGEM-OLE2EX用于随后的克隆步骤。为了获得表达构建体，通过用BamHI和XhoI消化将油质蛋白第二外显子的区从pGEM-OLE2EX上去掉，并且克隆到(BamHI和SalI消化的)表达载体pQE30(QIAGEN)中。在所得到的pQE-OLE2EX中，油质蛋白基因的3′-末端部分与包括6xHis标记的前导序列翻译融合，这使得它能够亲和纯化表达的产物。将质粒pQE-OLE2EX转入大肠杆菌菌株M15[pREP4](QIAGEN)。重组蛋白表达的诱导是在Luria培养液中通过添加最终浓度为1mM的IPTG，然后在旋转摇床上在37℃下以220rpm的速度培养2-4小时而进行的。从诱导过的和未诱导过的对照培养物中收集大肠杆菌细胞，并且通过SDS-PAGE分析重组蛋白的表达。对于SDS-PAGE来说，制备了12.5％的丙烯酰胺凝胶。凝胶在100V/500mA的条件下电泳451h，并且随后在CBB(0.05％考马斯亮蓝，50％甲醇，7％冰醋酸)中染色，并且在7％甲醇/5％乙酸中脱染色。在诱导培养物中，出现的主要的带在未诱导过的培养物中缺乏。该带的迁移率相当于油质蛋白基因的His-标记的C-末端部分的预期的迁移率(8.3kDa)。

实施例10

体外翻译系统

无细胞体外翻译(IVT)系统使得能够选择/鉴定可正确翻译的最佳数量的密码子。该IVT系统由小麦胚芽提取物组成，该提取物包括在存在低浓度的双链RNA(dsRNA)或氧化硫醇的条件下翻译外源RNA所必需的所有成分(例如，70S或80S核糖体，tRNAs，氨酰基-tRNA合成酶，起始，延伸和终止因子)。所述提取物还包括必需氨基酸，能源(ATP，GTP)，能量再生系统(磷酸肌酸和肌酸磷酸激酶)和其他必需的辅因子(Mg²⁺，K⁺等)。

选择具有2，4和6个His密码子富集的序列重复的克隆用于IVT分析。质粒pMP-1x，pMP-2x，pMP-4x，和pMP-6x包括与具有不同重复长度的His-编码序列融合的30K MP基因，它受T7启动子的控制。用BamHI将质粒线性化，并且用作使用T7 RNA聚合酶的IVT模板。在小麦胚芽无细胞系统(TNTTT7/SP6偶联的小麦胚芽提取系统L5030，Promega corporation)中翻译等量的所得到的转录物。结果一致地观察到了相当于具有一个，两个和四个重复的His富集的序列(MP-1x，MP-2x，和MP-4x)的克隆的转录物，产生了预期分子量的产物，而有可能编码具有6个重复的His-富集序列(MP-6x)的蛋白的转录物是以低效率翻译的，并且导致了低分子量的污染的产物。这种用于克隆筛选/鉴定的方法在实施例11-14中说明。

实施例11

组氨酸密码子富集的DNA序列与TMV 30K MP基因的融合，并且使用体外翻译系统检测His密码子富集的基因的正确翻译

His密码子富集的序列和TMV 30K MP基因之间的融合是通过适当克隆包括编码14个His残基(＝一个盒)(图3a)的序列的pGEM-His-24(实施例2)，和包括缺少天然终止密码子的TMV 30KMP基因的质粒pGEM-30K(实施例7)的组合获得的。为了获得与MP基因融合的具有不同长度的His密码子-富集的序列，采用了逐步克隆方法(图4)。在第一个步骤中，用EcoRI和XhoI将30K MP基因从pGEM-30K上切除，并且用XhoI和BamHI将来自pGEM-His-24的His密码子富集的序列切除。将这两种DNA片段连接到用EcoRI和BamHI(图4)消化过的pGEM-3Zf(+)(Promega Corporation，USA；产品目录号P2271)上。所得到的克隆被命名为pMP-1x，它具有来自pGEM-His-24的与TMV 30K MP基因融合的一个组氨酸-编码序列单位(盒)。

为了增加MP融合体上His-编码″尾″的长度进行的额外的逐步克隆步骤是以pMP-1x质粒为基础的。所述克隆使用了限制位点XhoI和SalI，这些位点业已被设计在pGEM-His-24的His密码子富集的序列上，以便位于所编码的多肽的读框上。综合用XhoI和SalI消化能产生相同的粘端这一事实，这保存了在下面所披露的其他克隆步骤中所得到的添加-放大的含有His序列的读框。为了获得具有来自pGEM-His-24，pMP-2x的两个组氨酸-编码序列单位的质粒，将来自pMP-1x的EcoRI-SalI-片段克隆到用EcoRI和XhoI消化过的pMP-1x上，导致了组氨酸-编码序列单位的加倍。因此，所得到的pMP-2x包括位于MP C-末端″尾″上的24个组氨酸残基。然后，为了获得pMP-4x，将来自pMP-2x的EcoRI-SalI-片段克隆到用EcoRI和XhoI消化过的pMP-2x上；为了获得pMP-6x，将来自pMP-4x的EcoRI-SalI-片段克隆到用EcoRI和XhoI消化过的pMP-2x上；以及为了获得pMP-8x，将来自pMP-4x的EcoRI-SalI-片段克隆到用EcoRI和XhoI消化过的pMP-4x上。具体地讲，重复类似的克隆，以便获得在MP C-末端″尾″(图4)上具有56，84和112个组氨酸残基(4x，6x和8x盒)的质粒。

在C-末端″尾″具有112个His密码子的克隆(pMP-8x系列)是不稳定的，并且在液体培养基中生长时产生缺失变体(微型质粒)。在液体培养基中反复生长时的较低的稳定性还出现在具有84个组氨酸的某些克隆(pMP-6x系列)中。因此，对于其他实验来说，只选择了具有2，4和6个重复的His密码子富集的序列克隆，pMP-2x，pMP-4x，和pMP-6x(图4)。

在质粒pMP-1x，pMP-2x，pMP-4x，和pMP-6x上，与不同长度的His-编码序列融合的30K MP基因受T7启动子的控制。用BamHI将所述质粒线性化，然后用T7 RNA聚合酶体外转录。在小麦胚芽无细胞系统(TNTT7/SP6偶联的小麦胚芽提取系统L5030 Promegacorporation，参见实施例10)中翻译等量的所得到的转录物。发现具有一个，两个和四个重复的His富集的序列(trMP-1x，trMP-2x，和trMP-4x)的克隆的转录物产生了分子量逐渐增加的预期的产物，而有可能编码具有6个重复的His富集的序列(trMP-6x)的蛋白的转录物翻译效率低下，并且产生了低分子量的污染的产物。该实验证实了植物核糖体翻译超过56个残基的His密码子富集的序列时出现了错误，例如，His密码子可能表示“饥饿”密码子，此时，核糖体终止和堵塞。根据该实验仅选择了具有2和4个重复的克隆用于进一步的体内研究。

实施例12

半胱氨酸/甲硫氨酸密码子富集的DNA序列与TMV 30K MP基因的融合和利用体外翻译系统检验Cys/Met密码子富集的基因的正确翻译

Cys/Met密码子富集的序列和TMV 30K MP基因的融合，是通过适当克隆包括编码10个Cys/Met残基(＝一个盒)(图3b)的序列的pGEM-Cys/Met-10(实施例3)，和包括缺少天然终止密码子的TMV 30KMP基因的质粒pGEM-30K的组合获得的(实施例7)，如实施例10所述。为了获得具有不同长度的与MP基因融合的Cys/Met密码子富集的序列，进行了逐步克隆过程(图4)。在第一个步骤中，用EcoRI和XhoI将30K MP基因从pGEM-30K上切除，并且用XhoI和BamHI将Cys/Met-密码子富集的序列从pGEM-Cys/Met-10上切除。将这两个DNA片段连接在用EcoRI和BamHI(图4)消化过的pGEM-3Zf(+)(Promega Corporation，USA；产品目录号P2271)上。所得到的克隆被命名为pMP-Cys/Met-1x，它具有来自pGEM-Cys/Met-10的与TMV30K MP基因融合的一个半胱氨酸/甲硫氨酸-编码序列单位(盒)。

为了获得具有来自pGEM-Cys/Met-10，pMP-Cys/Met-2x的两个半胱氨酸/甲硫氨酸-编码序列单位的质粒，将来自pMP-Cys/Met-1x的EcoRI-SalI-片段克隆到用EcoRI和XhoI消化过的pMP-Cys/Met-1x上，导致了半胱氨酸/甲硫氨酸-编码序列单位的加倍。因此，所得到的pMP-Cys/Met-2x质粒在MP C-末端″尾″包括20个半胱氨酸/甲硫氨酸残基。然后，为了获得pMP-Cys/Met-4x，将来自pMP-Cys/Met-2x的EcoRI-SalI-片段克隆到用EcoRI和XhoI消化过的pMP-Cys/Met-2x上；为了获得pMP-Cys/Met-6x，将来自pMP-Cys/Met-4x的EcoRI-SaII-片段克隆到用EcoRI和XhoI消化过的pMP-Cys/Met-2x上；以及为了获得pMP-Cys/Met-8x，将来自pMP-Cys/Met-4x的EcoRI-SalI-片段克隆到用EcoRI和XhoI消化过的pMP-Cys/Met-4x上。

在质粒pMP-Cys/Met-1x，pMP-Cys/Met-2x，pMP-CYs/Met-4x，和pMP-Cys/Met-6x上，与不同长度的Cys/Met-编码序列融合的30K MP基因受T7启动子的控制。用BamHI将质粒线性化，并且用T7 RNA聚合酶进行体外转录。在小麦胚芽无细胞系统(TNTT7/SP6结合的小麦胚芽提取系统L5030 Promega corporation)中对等量的所得到的转录物进行翻译。发现具有Cys/Met富集的序列的一个，两个和四个盒(MP-Cys/Met-1x，MP-Cys/Met-2x，和MP-Cys/Met-4x)的克隆的转录物产生了分子量逐渐增加的预期的产物。正如在实施例11中所披露的，多氨基酸序列长度的增加，导致了转录物稳定性的降低。对于其他实验来说，仅选择了具有Cys/Met密码子富集的序列的2，4和6个盒(MP-Cys/Met-2x，MP-Cys/Met-4x和MP-Cys/Met-6x)的克隆。

实施例13

甘氨酸密码子富集的DNA序列与TMV 30K MP基因的融合以及使用体外翻译系统检测Gly密码子富集的基因的正确翻译

甘氨酸密码子富集的序列和TMV 30K MP基因之间的融合是通过适当克隆包括编码9个Gly残基(＝一个盒)(图3c)的序列的pGEM-Gly-9(实施例4)，和包括缺少天然终止密码子的TMV 30K MP基因的质粒pGEM-30K的组合获得的，如实施例10所披露的。为了获得与MP基因融合的具有不同长度的甘氨酸密码子富集的序列，按实施例11和实施例12所述，并且如图4所示进行了逐步克隆方法。

所得到的第一个克隆被命名为pMP-Gly-1x，它具有来自pGEM-Gly-9的与TMV 30K MP基因融合的一个甘氨酸-编码序列单位(盒)。然后，按实施例11和12所述方法对该盒进行“加倍”，以便产生克隆pMP-Gly-2x，pMP-Gly-4x，pMP-Gly-6x，和pMP-Gly-8x。为了获得来自pGEM-Gly-9，pMP-Gly-2x的两个甘氨酸-编码序列单位的质粒，将来自pMP-Gly-1x的EcoRI-SaII-片段克隆到用EcoRI和XhoI消化过的pMP-Gly-1x上，导致了甘氨酸-编码序列单位的加倍。然后，为了获得pMP-Gly-4x，将来自pMP-Gly-2x的EcoRI-SalI-片段克隆到用EcoRI和XhoI消化过的pMP-Gly-2x上；为了获得pMP-Gly-6x，将来自pMP-Gly-4x的EcoRI-SalI-片段克隆到用EcoRI和XhoI消化过的pMP-Gly-2x上；以及为了获得pMP-Gly-8x，将来自pMP-Gly-4x的EcoRI-SalI-片段克隆到用EcoRI和XhoI消化过的pMP-Gly-4x上。用BamHI将质粒线性化，并且用T7 RNA聚合酶进行体外转录，并且在小麦胚芽无细胞系统(TNTT7/SP6偶联的小麦胚芽提取系统L5030 Promega corporation，参见实施例10)中翻译。正如实施例11所披露的，多氨基酸序列长度的增加，导致了转录物稳定性的降低。对于其他实验来说，仅选择了具有甘氨酸密码子富集的序列的2和4个盒(MP-Gly-2x，和MP-Gly-4x)的克隆。

实施例14

赖氨酸密码子富集的DNA序列与TMV 30K MP基因的融合以及利用体外翻译系统检查Lys密码子富集的基因的正确翻译

赖氨酸密码子富集的序列和TMV 30K MP基因之间的融合是通过适当克隆包括编码12个Lys残基(＝一个盒)(图3d)的序列的pGEM-Lys-12(实施例5)，和包括缺少天然终止密码子的TMV 30K MP基因的质粒pGEM-30K的组合获得的，如实施例11-13所述。为了获得与MP基因融合的具有不同长度的赖氨酸密码子富集的序列，按实施例11，12和13所述以及如图4所示进行逐步克隆方法。

所得到的第一种克隆被命名为pMP-Lys-1x，它具有来自pGEM-Lys-12的与TMV 30K MP基因融合的一个赖氨酸-编码序列单位(盒)。然后，该盒按实施例11，12和13所述进行“加倍”；为了产生克隆pMP-Lys-2x，pMP-Lys-4x，pMP-Lys-6x，和pMP-Lys-8x，将来自pMP-Lys-4x的EcoRI-SaII-片段克隆到用EcoRI和XhoI消化过的pMP-Lys-4x上。为了获得具有来自pGEM-Lys-12，pMP-Lys-2x的两个赖氨酸-编码序列单位的质粒，将来自pMP-Lys-1x的EcoRI-SaII-片段克隆到用EcoRI和XhoI消化过的pMP-Lys-1x上，导致了赖氨酸-编码序列单位的加倍。然后，为了获得pMP-Lys-4x，将来自pMP-Lys-2x的EcoRI-SalI-片段克隆到用EcoRI和XhoI消化过的pMP-Lys-2x上；为了获得pMP-Lys-6x，将来自pMP-Lys-4x的EcoRI-SaII-片段克隆到用EcoRI和XhoI消化过的pMP-Lys-2x上；以及为了获得pMP-Lys-8x，将来自pMP-Lys-4x的EcoRI-SalI-片段克隆到用EcoRI和XhoI消化过的pMP-Lys-4x上。用BamHI将质粒线性化，并且用T7RNA聚合酶进行体外转录，并且在小麦胚芽无细胞系统(TNTT7/SP6偶联的小麦胚芽提取系统L5030 Promega corporation，参见实施例10)中翻译。如实施例10-12所述，多氨基酸序列长度的增加，导致了转录物稳定性的降低。对于其他实验来说，仅选择了具有赖氨酸密码子富集的序列的2和4个盒(MP-Lys-2x，和MP-Lys-4x)的克隆。

实施例15

通过PCR从拟南芥染色体DNA中分离napin启动子并且随后克隆

为了克隆来自拟南芥染色体DNA的napin启动子，化学合成了两种寡核苷酸引物：

NAP-P(SEQ ID NO：16)5′-TCTTACTCGAGTGAAACCAAATTAAC和

NAP-M(SEQ ID NO：17)5′-CTTGTTAGCCATGGTTTGCTATTTGTG。

为了方便随后的克隆，引物序列包括XhoI和NcoI限制位点。拟南芥染色体DNA是按照在分离(实施例1)和克隆油质蛋白基因(实施例6)部分所披露的方法分离的。PCR反应是按照上文对油质蛋白基因(实施例6)所述方法进行的，所不同的是，MgCl₂在反应混合物中的浓度为1.5mM。在电泳之后，将预期大小(369bp)的PCR产物从1％琼脂糖凝胶中分离出来。纯化所述PCR产物，并且用T4 DNA聚合酶在存在dNTP的条件下，在14℃下按实施例1所述方法处理，并且克隆到SmaI-消化过的pGEM-3Zf(+)(Promega Corporation，USA；产品目录号P2271)上。在测序之后，选择克隆pGEM-NAP4和pGEM-NAP9作后续研究。

实施例16

构建包括napin启动子(NAP)或嵌合启动子(HYB)的表达质粒，它包括花椰菜花叶病毒35S启动子的完整的napin启动子和增强子区

使用质粒pRT100构建包括napin启动子的植物表达载体(Tpfer等，Nucleic Acid Res.15(14)：5890，1987)。将一组植物表达载体用于转录和翻译融合。Nucleic Acids Res.15(14)：5890，1987)。在图7中示出了制备具有2x-Gly的MP和GFP的融合体(即MP-Gly-2x-GFP)的基本方法。该方法利用了XhoI/SalI限制位点，它们具有不同的裂解位点，但是具有类似的产生4个碱基的DNA末端。将GFP基因作为XhoI-BamHI-片段从pRT-GFP上切除，并且将两种DNA片段连接到pRT101上(Tpfer等，Nucleic Acids Res.15(14)：5890，1987)。用EcoRI和BamHI消化以便得到构建体pRT-MP-2x-GFP。pRT100包括花椰菜花叶病毒的35S启动子(CaMV 35S启动子)。为了构建pNAP(其中去掉了完整的CaMV 35S启动子序列，并且用napin启动子的序列取代)，用Hind II和NcoI将napin启动子区从质粒pGEM-NAP4上切除(实施例15)，并且连接到用Hind II和NcoI消化过的pRT100上(图5)。为了构建其中用napin启动子序列取代了35S启动子的启动子区的pHYB(所述35S启动子保留了位于插入的napin启动子序列上游的35S增强子)，用XhoI消化pGEM-NAP9(实施例15)，用Klenow酶形成平端，并且用NcoI消化。所得到的片段连接到用EcoRV和NcoI消化过的pRT100上。

实施例17

将His富集的油质蛋白和TMV 30K MP基因克隆到包括CaMV 35S，napin，和嵌合启动子的表达质粒上。

在图7-12中披露了详细的构建细节。

首先，获得一组构建体，其中，表示融合蛋白的基因包括TMV MP，His富集的序列，和GFP，它们受35S CaMV启动子的控制(图7)。选择具有三种不同长度的His富集的序列(即具有两个，四个，和六个重复的His-编码序列单位的序列，实施例11)。用EcoRI和SalI将与两个His-编码单位融合的MP基因从pMP-2x上切除(图4)，将GFP基因作为XhoI-BamHI-片段从pRT-GFP上切除，并且将这两种DNA片段连接到用EcoRI和BamHI消化过的pRT101上，以便得到构建体pRT-MP-2x-GFP。类似地，为了获得pRT-MP-4x-GFP，用EcoRI和SalI将与四个His-编码单位融合的MP基因从pMP-4x上切除(图4)，将GFP基因作为XhoI-BamHI-片段从pRT-GFP上切除(有关细节参见图7)，并且将两种DNA片段连接到用EcoRI和BamHI消化过的pRT101。为了获得pRT-MP-6x-GFP，用EcoRI和SalI将与六个His-编码单位融合的MP基因从pMP-6x上切除(图4)，将GFP基因作为XhoI-BamHI-片段从pRT-GFP上切除，并且将两种DNA片段连接到用EcoRI和BamHI消化过的pRT101上(图7)。

为了获得受napin启动子控制的相同的构建体(取代CaMV 35S启动子)，进行了以下克隆步骤。将TMV 30K MP基因的N-末端部分作为NcoI-Hind III-片段从pGEM-30K上切除；用HindIII和XbaI将包括与两个His-编码单位融合的MP基因的其余部分和GFP基因的片段从pRT-MP-2x-GFP上切除，并且将两种片段连接到用NcoI和BamHI消化过的pNAP上，以便得到pNAP-MP-2x-GFP。通过类似方法，为了获得pNAP-MP-4x-GFP，将TMV 30K MP基因的N-末端部分作为NcoI-HindIII-片段从pGEM-30K上切除，并且用HindIII和XbaI将包括与四个His-编码单位融合的MP基因的其余部分和GFP基因从pRT-MP-6x-GFP上切除，并且将两种片段连接到用NcoI和BamHI消化过的pNAP上。最后，为了构建pNAP-MP-6x-GFP，将TMV 30K MP基因的N-末端部分作为NcoI-HindIII-片段从pGEM-30K上切除，并且用HindIII和XbaI将包括与六个His-编码单位融合的MP基因的其余部分和GFP基因从pRT-MP-6x-GFP上切除，并且将两种片段连接到用NcoI和BamHI消化过的pNAP上(图8)。

用类似克隆，以便获得其中的MP-His-GFP融合基因受杂合启动子控制的构建体。将TMV MP基因的N-末端部分作为NcoI-HindIII-片段从pGEM-30K上切除；用HindIII和XbaI将包括与两个His-编码单位融合的MP基因的其余部分和GFP基因的片段从pRT-MP-2x-GFP上切除，并且将两种片段连接到用NcoI和BamHI消化过的pHYB上，以便得到pHYB-MP-2x-GFP。为了获得pHYB-MP-4x-GFP，将TMV MP基因的N-末端部分作为NcoI-HindIII-片段从pGEM-30K上切除，并且用HindIII和XbaI将包括与四个His-编码单位融合的MP基因的其余部分和GFP基因的片段从pRT-MP-6x-GFP上切除，并且将两种片段连接到用NcoI和BamHI消化过的pHYB(图8)上。为了构建pHYB-MP-6x-GFP，将TMV MP基因的N-末端部分作为NcoI-HindIII-片段从pGEM-30K上切除，并且用HindIII和XbaI将包括与六个His-编码单位融合的MP基因的其余部分和GFP基因的片段从pRT-MP-6x-GFP上切除，并且将两种片段连接到用NcoI和BamHI消化过的pHYB上。根据来自pOLE4/11的油质蛋白基因，构建了三组表达载体，它们具有CaMV35S，napin，或杂合启动子，每一组包括三种不同长度的His-编码区(图9)。

为了构建基于CaMV 35S启动子的表达载体，进行了以下克隆方法。将油质蛋白基因作为NcoI-XhoI-片段从pOLE4/11上切除，用XhoI和BamHI将包括与GFP基因融合的两个His-编码序列单位从pHYB-MP-2x-GFP上切除，并且将两种DNA片段连接到用NcoI和BamHI消化过的pRT100上，得到了构建体pRT-OLE-2x-GFP。为了获得pRT-OLE-4x-GFP，将油质蛋白基因作为NcoI-XhoI-片段从pOLE4/11上切除，用XhoI和BamHI将包括与GFP基因融合的四个His-编码序列单位的片段从pHYB-MP-4x-GFP上切除，并且将两种DNA片段连接到用NcoI和BamHI消化过的pRT100上。为了获得pRT-OLE-6x-GFP，将油质蛋白基因作为NcoI-XhoI-片段从pOLE4/11上切除，用XhoI和BamHI将包括与GFP基因融合的六个His-编码序列单位的片段从pHYB-MP-6x-GFP上切除，然后将两种DNA片段连接到用NcoI和BamHI消化过的pRT100上(图10)。

将类似的克隆方法应用于构建基于napin启动子的表达载体。将油质蛋白基因作为NcoI-XhoI-片段从pOLE4/11上切除，用XhoI和BamHI将包括与GFP基因融合的两个His-编码序列单位从pHYB-MP-2x-GFP上切除，并且将两种DNA片段连接到用Ncol和BamHI消化过的pNAP上，得到了构建体pNAP-OLE-2x-GFP。为了获得pNAP-OLE-4x-GFP，将油质蛋白基因作为NcoI-XhoI-片段从pOLE4/11上切除，用XhoI和BamHI将包括与GFP基因融合的四个His-编码序列单位从pHYB-MP-4x-GFP质粒上切除，并且将两种DNA片段连接到用Ncol和BamHI消化过的pNAP上。为了获得pNAP-OLE-6x-GFP，将油质蛋白基因作为NcoI-XhoI-片段从pOLE4/11上切除，用XhoI和BamHI将包括与GFP基因融合的六个His-编码序列单位从pHYB-MP-6x-GFP质粒上切除，并且将两种DNA片段连接到用Ncol和BamHI消化过的pNAP上(图11)。

用类似方法构建了基于杂合启动子的表达载体系列。将油质蛋白基因作为NcoI-XhoI-片段从pOLE4/11上切除，用XhoI和BamHI将包括与GFP基因融合的两个His-编码序列单位从pHYB-MP-2x-GFP上切除，并且将两种DNA片段连接到用Ncol和BamHI消化过的pHYB上，得到了构建体pHYB-OLE-2x-GFP。为了获得pHYB-OLE-4x-GFP，将油质蛋白基因作为NcoI-XhoI-片段从pOLE4/11上切除，用XhoI和BamHI将包括与GFP基因融合的四个His-编码序列单位从pHYB-MP-4x-GFP上切除，并且将两种DNA片段连接到用Ncol和BamHI消化过的pHYB上。为了获得pHYB-OLE-6x-GFP，将油质蛋白基因作为NcoI-XhoI-片段从pOLE4/11上切除，用XhoI和BamHI将包括与GFP基因融合的六个His-编码序列单位从pHYB-MP-6x-GFP上切除，并且将两种DNA片段连接到用Ncol和BamHI消化过的pHYB上(图12)。

实施例18

将Cys/Met富集的油质蛋白和TMV 30K MP基因克隆到包括CaM35S，napin，和嵌合启动子的表达质粒上。

选择三种不同长度的Cys/Met富集的序列(具有两个，四个和六个重复的Cys/Met-编码序列单位，实施例12)。用EcoRI和SalI将与两个Cys/Met-编码单位融合的MP基因从pMP-Cys/Met-2x上切除，将GFP基因作为XhoI-BamHI-片段从pRT-GFP上切除，并且将两种DNA片段连接到用EcoRI和BamHI消化过的pRT101上，以便得到构建体pRT-MP-Cys/Met-2x-GFP。用EcoRI和SalI将与四个Cys/Met-编码单位融合的MP基因从pMP-Cys/Met-4x上切除，将GFP基因作为XhoI-BamHI-片段从pRT-GFP上切除，并且将两种DNA片段连接到用EcoRI和BamHI消化过的pRT101上，以便得到构建体pRT-MP-Cys/Met-4x-GFP(图7)。

为了获得受napin启动子控制的等同的构建体(取代CaMV 35S启动子)，执行以下克隆步骤。将TMV MP基因的N-末端部分作为NcoI-HindIII-片段从pGEM-30K上切除；用HindIII和XbaI将包括与两个Cys/Met-编码单位融合的MP基因的其余部分和GFP基因的片段从pRT-MP-Cys/Met-2x-GFP上切除，并且将两种片段连接到用NcoI和BamHI消化过的pNAP上，以便得到pNAP-MP-Cys/Met-2x-GFP。为了获得pNAP-MP-Cys/Met-4x-GFP，通过类似方法将TMV 30KMP基因的N-末端部分作为NcoI-HindIII-片段从pGEM-30K上切除，并且用Hind III和XbaI将包括与四个Cys/Met-编码单位融合的MP基因的其余部分和GFP基因的片段从pRT-MP-Cys/Met-2x-GFP上切除，并且将两种片段连接到用NcoI和BamHI消化过的pNAP上。最后，为了构建pNAP-MP-Cys/Met-6x-GFP，将TMV MP基因的N-末端部分作为NcoI-HindIII-片段从pGEM-30K上切除，并且用HindIII和XbaI将包括与六个Cys/Met-编码单位融合的MP基因的其余部分和GFP基因的片段从pRT-MP-Cys/Met-6x-GFP上切除，并且将两种片段连接到用NcoI和BamHI消化过的pNAP上(图8)。

为了获得其中的MP-Cys/Met-GFP融合基因受杂合启动子(HYB)控制的构建体，采用了类似的克隆方法。将TMV MP基因的N-末端部分作为NcoI-HindIII-片段从pGEM-30K上切除，用HindIII和XbaI将包括与两个Cys/Met-编码单位融合的MP基因的其余部分和GFP基因的片段从pRT-MP-Cys/Met-2x-GFP上切除，并且将两种片段连接到用Ncol和BamHI消化过的pHYB上，以便得到pHYB-MP-Cys/Met-2x-GFP。为了获得pHYB-MP-Cys/Met-4x-GFP，将TMV MP基因的N-末端部分作为NcoI-HindIII-片段从pGEM-30K上切除，用HindlI和XbaI将包括与四个Cys/Met-编码单位融合的MP基因的其余部分和GFP基因的片段从pRT-MP-Cys/Met-4x-GFP上切除，并且将两种片段连接到用NcoI和BamHI消化过的pHYB上。为了构建pHYB-MP-Cys/Met-6x-GFP，将TMV MP基因的N-末端部分作为NcoI-HindIII-片段从pGEM-30K上切除，用HindIII和XbaI将包括与六个Cys/Met-编码单位融合的MP基因的其余部分和GFP基因的片段从pRT-MP-Cys/Met-4x-GFP上切除，并且将两种片段连接到用Ncol和BamHI消化过的pHYB上。根据来自pOLE4/11的油质蛋白基因，构建了三组表达载体，它们具有CaMV 35S，napin，或杂合启动子，每一组包括两种不同长度的Gly-编码区，如实施例16所述(图9)。

为了构建基于CaMV 35S启动子的表达载体，将油质蛋白基因作为NcoI-XhoI-片段从pOLE4/11上切除，用XhoI和BamHI将包括与GFP基因融合的两个Cys/Met-编码单位的片段从pHYB-MP-Cys/Met-2x-GFP上切除，并且将两种DNA片段连接到用NcoI和BamHI消化过的pRT100上，得到了构建体pRT-OLE-Cys/Met-2x-GFP。为了获得pRT-OLE-Cys/Met-4x-GFP，将油质蛋白基因作为NcoI-XhoI-片段从pOLE4/11上切除，用XhoI和BamHI将包括与GFP基因融合的四个Cys/Met-编码单位的片段从pHYB-MP-Gly-4x-GFP上切除，并且将两种DNA片段连接到用NcoI和BamHI消化过的pRT100上。为了获得pRT-OLE-Cys/Met-6x-GFP，将油质蛋白基因作为NcoI-XhoI-片段从pOLE4/11上切除，用XhoI和BamHI将包括与GFP基因融合的六个Cys/Met-编码单位的片段从pHYB-MP-Cys/Met-6x-GFP上切除，并且将两种DNA片段连接到用NcoI和BamHI消化过的pRT100上(图10)。

类似地，为了构建基于napin启动子的表达载体，将油质蛋白基因作为NcoI-XhoI-片段从pOLE4/11上切除，用XhoI和BamHI将包括与GFP基因融合的两个Cys/Met-编码单位的片段从pHYB-MP-Cys/Met-2x-GFP上切除，并且将两种DNA片段连接到用NcoI和BamHI消化过的pNAP上，得到了构建体pNAP-OLE-Cys/Met-2x-GFP。为了获得pNAP-OLE-Cys/Met-4x-GFP，将油质蛋白基因作为NcoI-XhoI-片段从pOLE4/11上切除，用XhoI和BamHI将包括与GFP基因融合的四个Cys/Met-编码单位的片段从pHYB-MP-Cys/Met-4x-GFP质粒上切除，并且将两种DNA片段连接到用Ncol和BamHI消化过的pNAP上。为了获得pNAP-OLE-Cys/Met-6x-GFP，将油质蛋白基因作为NcoI-XhoI-片段从pOLE4/11上切除，用XhoI和BamHI将包括与GFP基因融合的六个Cys/Met-编码单位的片段从pHYB-MP-Cys/Met-6x-GFP质粒上切除，并且将两种DNA片段连接到用Ncol和BamHI消化过的pNAP上(图11)。

基于杂合启动子的表达载体是以类似方式构建的。将油质蛋白基因作为NcoI-XhoI-片段从pOLE4/11上切除，并且用XhoI和BamHI将包括与GFP基因融合的两个Cys/Met-编码单位的片段从pHYB-MP-Gly-2x-GFP上切除，并且将两种DNA片段连接到用Ncol和BamHI消化过的pHYB上，得到了构建体pHYB-OLE-Cys/Met-2x-GFP。为了获得pHYB-OLE-Cys/Met-4x-GFP，将油质蛋白基因作为NcoI-XhoI-片段从pOLE4/11上切除，用XhoI和BamHI将包括与GFP基因融合的四个Cys/Met-编码单位的片段从pHYB-MP-Gly-4x-GFP上切除，并且将两种DNA片段连接到用Ncol和BamHI消化过的pHYB上。为了获得pHYB-OLE-Cys/Met-6x-GFP，将油质蛋白基因作为NcoI-XhoI-片段从pOLE4/11上切除，用XhoI和BamHI将包括与GFP基因融合的四个Cys/Met-编码单位的片段从pHYB-MP-Gly-6x-GFP上切除，并且将两种DNA片段连接到用Ncol和BamHI消化过的pHYB上(图12)。

实施例19

将甘氨酸富集的TMV 30K MP和油质蛋白基因克隆到包括CaMV35S，napin，和嵌合启动子的表达质粒上

选择具有两种不同长度的甘氨酸富集的序列(具有两个和四个重复的Gly-编码序列单位)(实施例13)。用EcoRI和SalI将与两个Gly-编码单位融合的MP基因从pMP-Gly-2x上切除，将GFP基因作为XhoI-BamHI-片段从pRT-GFP上切除(有关细节参见图7)，并且将两种DNA片段连接到用EcoRI和BamHI消化过的pRT101上，以便得到构建体pRT-MP-Gly-2x-GFP。用EcoRI和SalI将与四个Gly-编码单位融合的MP基因从pMP-Gly-4x上切除，将GFP基因作为XhoI-BamHI-片段从pRT-GFP上切除，并且将两种DNA片段连接到用EcoRI和BamHI消化过的pRT101上，以便获得pRT-MP-Gly-4x-GFP(图7)。

为了获得为了获得受napin启动子控制的等同构建体(取代CaMV35S启动子)，将TMV MP基因的NcoI-HindIII-片段从pGEM-30K上切除(所述片段包括与两个Gly-编码单位融合的MP基因融合的其余部分)，并且用HindIII和XbaI将GFP基因从pRT-MP-Gly-2x-GF上切除，并且将两种片段连接到用NcoI和BamHI消化过的pNAP上，以便得到pNAP-MP-Gly-2x-GFP。为了获得pNAP-MP-Gly-4x-GFP，将TMV30K MP基因的N-末端部分作为EcoI-HindIII-片段从pGEM-30K上切除，并且用HindIII和XbaI将包括与四个Gly-编码单位融合的MP基因的其余部分和GFP基因的片段从pNAP-MP-Gly-2x-GFP上切除，并且将两种片段连接到用NcoI和BamHI消化过的pNAP上(图8)。

为了获得杂合启动子构建体(HYB)，将TMV MP基因的N末端部分作为NcoI-HindIII-片段从pGEM-30K上切除，并且用HindIII和XbaI将GFP基因从pRT-MP-Gly-2x-GFP上切除，并且将两种片段连接到用NcoI和BamHI消化过的pNAP上，以便得到pHYB-MP-Gly-2x-GFP。为了获得pHYB-MP-Gly-4x-GFP，将TMV 30K MP基因的N-末端部分作为NcoI-HindIII-片段从pGEM-30K上切除，并且用HindIII和XbaI将包括与四个Gly-编码单位融合的MP基因的其余部分和GFP基因的片段从pRT-MP-Gly-2x-GFP上切除，并且将两种片段连接到用Ncol和BamHI消化过的pHYB上(图9)。

根据来自pOLE4/11的油质蛋白基因，构建了三组表达载体，它们具有CaMV 35S，napin，或杂合启动子，每一组包括两种不同长度的Gly-编码区，如实施例16所述。为了构建基于CaMV 35S启动子的表达载体，将油质蛋白基因作为NcoI-XhoI-片段从pOLE4/11上切除，用XhoI和BamHI将包括与GFP基因融合的两个Gly-编码序列单位的区域从pHYB-MP-Gly-2x-GFP上切除，并且将两种DNA片段连接到用NcoI和BamHI消化过的pRT100上，得到了构建体pRT-OLE-Gly-2x-GFP。为了获得pRT-OLE-Gly-4x-GFP，将油质蛋白基因作为NcoI-XlzoI-片段从pOLE4/11上切除，用XhoI和BamHI将包括与GFP基因融合的四个Gly-编码序列单位的区域从pHYB-MP-Gly-2x-GFP上切除，并且将两种DNA片段连接到用NcoI和BamHI消化过的pRT100上(图10)。

类似地，对于基于napin启动子的表达载体来说，将油质蛋白基因作为NcoI-XhoI-片段从pOLE4/11上切除，用XhoI和BamHI将包括与GFP基因融合的两个Gly-编码序列单位的区域从pHYB-MP-Gly-2x-GFP上切除，并且将两种DNA片段连接到用NcoI和BamHI消化过的pNAP上，得到了构建体pNAP-OLE-Gly-2x-GFP。为了获得pNAP-OLE-Gly-4x-GFP，将油质蛋白基因作为NcoI-XhoI-片段从pOLE4/11上切除，用XhoI和BamHI将包括与GFP基因融合的四个Gly-编码序列单位的区域从pHYB-MP-Gly-4x-GFP质粒上切除，并且将两种DNA片段连接到用Ncol和BamHI消化过的pNAP上(图11)。

基于杂合启动子类型的表达载体是用类似方式构建的。将油质蛋白基因作为NcoI-XhoI-片段从pOLE4/11上切除，并且用XhoI和BamHI将包括与GFP基因融合的两个Gly-编码序列单位的区域从pHYB-MP-Gly-2x-GFP上切除，并且将两种DNA片段连接到用Ncol和BamHI消化过的pHYB上，得到了构建体pHYB-OLE-Gly-2x-GFP。为了获得pHYB-OLE-Gly-4x-GFP，将油质蛋白基因作为NcoI-XhoI-片段从pOLE4/11上切除，用XhoI和BamHI将包括与GFP基因融合的四个Gly-编码序列单位的区域从pHYB-MP-Gly-4x-GFP上切除，并且将两种DNA片段连接到用Ncol和BamHI消化过的pHYB上(图12)。

实施例20

将赖氨酸富集的TMV 30K MP和油质蛋白基因克隆到包括CaMV35S，napin，和嵌合启动子的表达质粒上。

选择具有两种不同长度的赖氨酸富集的序列(具有两个和四个重复的Lys-编码序列单位)(实施例14)。用EcoRI和SalI将与两个Lys-编码单位融合的MP基因从pMP-Lys-2x上切除，将GFP基因作为XhoI-BamHI-片段从pRT-GFP上切除，并且将两种DNA片段连接到用EcoRI和BamHI消化过的pRT101上，得到了构建体pRT-MP-Lys-2x-GFP。用EcoRI和SalI将与四个Lys-编码单位融合的MP基因从pMP-Lys-4x上切除，将GFP基因从作为XhoI-BamHI-片段pRT-GFP上切除，并且将两种DNA片段连接到用EcoRI和BamHI消化过的pRT101上，以便获得pRT-MP-Lys-4x-GFP，如在实施例17-19及在图7中所披露的。

为了获得受napin和杂合(HYB)启动子控制的构建体(取代CaMV35S启动子)，将TMV MP基因的NcoI-HindIII-片段从pGEM-30K上切除(包括与两个Lys-编码单位融合的MP基因的其余部分的片段)，并且用HindIII和XbaI将GFP基因从pRT-MP-Lys-2x-GFP上切除，并且将两种片段连接到用NcoI和BamHI消化过的pNAP或pHYB上，以便分别得到pNAP-MP-Lys-2x-GFP和pHYB-MP-Lys-2x-GFP。为了获得pNAP-MP-Lys-4x-GFP和pHYB-MP-Lys-4x-GFP，将TMV 30K MP基因的N-末端部分作为NcoI-HindIII-片段从pGEM-30K上切除，并且用Hind III和XbaI将包括与四个Lys-编码单位融合的MP基因的其余部分和GFP基因的片段从pRT-MP-Lys-2x-GFP上切除，并且将两种片段连接到分别用NcoI和BamHI-消化过的pNAP和pHYB上(如图8和9)。

根据来自pOLE4/11的油质蛋白基因，构建了三组表达载体，它们具有CaMV 35S，napin，或杂合启动子，每一组包括具有两种不同长度的Lys-编码区，如实施例19所述。为了构建基于CaMV 35S，napin或HYB启动子的表达载体，将油质蛋白基因作为NcoI-XhoI-片段从pOLE4/11上切除，用XhoI和BamHI将包括与GFP基因融合的两个Lys-编码序列单位的片段从pHYB-MP-Lys-2x-GFP上切除，并且将两种DNA片段连接到用NcoI和BamHI消化过的pRT100上，得到了构建体pRT-OLE-Lys-2x-GFP，pNAP-OLE-Lys-2x-GFP和pHYB-OLE-Lys-2x-GFP。为了获得pRT-OLE-Lys-4x-GFP，pNAP-OLE-Lys-4x-GFP，和pHYB-OLE-Lys-4x-GFP，将油质蛋白基因作为NcoI-XhoI-片段从pOLE4/11上切除，用XhoI和BamHI将包括与GFP基因融合的四个Lys-编码序列单位的片段从pHYB-MP-Lys-2x-GFP上切除，并且将两种DNA片段连接到用NcoI和BamHI消化过的pRT100上。

实施例21

瞬时表达系统

将瞬时表达测定用于确保蛋白表达，并且所表达的蛋白与天然未修饰过的蛋白相比具有完整的生物学功能，并且积累在目标器官中，这一目的是通过肉眼观察所述报道蛋白实现的。共焦激光扫描显微技术是特别有用的，因为它能够早期检测能表达与编码所述报道蛋白的核苷酸序列框内融合的氨基酸富集的蛋白的转基因植物。基于抗体的测定方法(例如，酶联免疫吸附测定)和直接氨基酸分析可用作替代系统，用于检测能表达与编码所述报道蛋白的核苷酸序列框内融合的氨基酸富集的蛋白的转基因植物。

实施例22

利用GFP基因在通过粒子轰击转化的植物细胞中的瞬时表达检测napin和嵌合启动子的活性

为了分析由pNAP中的napin启动子提供的相对转录水平，将pHYB上的杂合启动子，和pRT1009上的CaMV 35S启动子，所述报道蛋白的编码区GFP克隆到所述质粒上。为了构建包括GFP的克隆，使用了用于红色迁移GFP突变体(S65T)的基因。将GFP编码区作为NcoI-BamHI-片段克隆到用类似方法消化过的pRT100，pNAP和pHYB中。

用pHYB-GFP(包括受杂合启动子控制的GFP编码区)进行粒子轰击(实施例8)瞬时转化的Nicotiana benthamiana表皮细胞能明确表达GFP。观察到的GFP表达水平与对照pRT-GFP相当，对照中GFP表达受CaMV 35S启动子的控制。以上实验表明，pHYB-GFP表达盒在活植物细胞中具有完整的功能(图6表示pRT-OLE-4x-GFP和pHYB-OLE-4x-GFP)。pNAP-GFP在种子胚胎的早期阶段表达，并且所述胚胎业已检测出能发出荧光。

实施例23

将表达盒克隆到二元载体上，并且将相应的二元载体转化入农杆菌属

在农杆菌属转化之前，将受来自pRT-衍生物的CaMV 35S，napin和嵌合启动子控制的包括GFP-标记的组氨酸，半胱氨酸/甲硫氨酸，甘氨酸和赖氨酸-富集的油质蛋白(ole)和TMV MP基因的基因盒克隆到所述植物转化二元载体pBin19的T-DNA-所在的HindIII位点上。

具有超强毒力的，减毒的肿瘤诱导质粒pTi Bo542的根癌农杆菌AGLI(Lazo等，1991.Biotechnology 3，963-967)通过进行过某些改进的Holsters方法进行冻-溶转化(Holsters等，1978.Mol.Gen.Genet.163，181-187)。在26℃下将农杆菌属在补充了0.5gl^-1MgSO₄的LB-琼脂平板上培养两天，然后在补充了50μg/ml利福平的液体2XYT培养基上培养到指数中期，然后用150mM NaCl洗涤，并且在转化之前以大约1010cfu ml^-1重新悬浮在20mM CaCl₂中。在添加甘油至15％的最终浓度之后，将细胞悬浮液的等份样品放在液氮中冷冻。在向细胞中添加5μg的DNA之后对所述细胞进行解冻，并且在冰上孵育15分钟，然后在37℃下热激5分钟。用新鲜的2X YT培养基稀释细胞，并且在28℃下进行剧烈通气培养2小时，然后转移到含有50gμg ml^-1利福平和100μgml^-1卡那霉素的1％琼脂平板上。通过PCR分析重组构建体的存在或缺乏，从而筛选卡那霉素抗性菌落。

实施例24

农杆菌属介导的芸薹转化

芸薹植物的转化基本上是按照公开方法进行的(Moloney等，植物细胞报道8，238-272，1989)。在22℃下在具有培养基I(MurashigeMinimal Organics(MMO)，具有3％蔗糖，4mg/1 BAP，0.7％Phytoagar)的1％琼脂上将子叶与合适的农杆菌属细胞悬浮液一起培养2-3天。用蒸馏水洗涤子叶三次，然后转移到装有培养基II(MMO，具有4mg/LBAP，3％蔗糖，300mg/l羧噻吩青霉素(DUCHEFA)和0.7％Phytoagar)的petri培养皿上。再过7-10天之后，将外植体转移到培养基III中(MMO，具有4mg/L BAP，3％蔗糖，300mg/l羧噻吩青霉素，25mg/l卡那霉素和0.7％Phytoagar)。再培养2-3周之后，将具有绿色愈伤组织或未成熟的绿色枝条的外植体转移到新的培养基中。为了形成枝条，将愈伤组织和未成熟的绿色枝条转移到培养基IV(MMO，具有3％蔗糖，300mg/l羧噻吩青霉素，25mg/l卡那霉素和0.7％Phytoagar)。将完全形成的枝条转移到培养基V中(MMO，具有0.2mg/lIBA，3％蔗糖，300mg/l羧噻吩青霉素和0.7％Phytoagar)用于生根。一旦形成了完善的根系统，将具有根的枝条从琼脂上取出，转移到潮湿的盆栽土壤中，并且在22℃下，用16小时光照/8小时黑暗的光周期生长，光照强度为12.1μmolm^-2s^-1。

实施例25

在芸薹中避免基因沉默

在使用来自芸薹的Ole编码核苷酸序列时，存在转录后基因沉默的危险。在用Ole基因转化芸薹时在转基因植物中由于转基因和内源基因之间的核苷酸序列同源性导致了诱导转录后基因沉默的危险，在本发明中通过使用来自拟南芥而不是来自芸薹的Ole基因得到了成功地避免。一个基因与另一个基因的长度和同源性程度影响基因的沉默。如果导入的基因与内源基因具有100％的序列同源性的话，基因沉默是可能的。根据哪一种芸薹油质蛋白与拟南芥油质蛋白相比(目前存在于NCBI数据库中)，在DNA水平上的序列同源性在大约74％-87％范围内。因此，在DNA水平上拥有的同源性程度是明显不同的，假定所产生的转基因植物似乎不会发生基因沉默。筛选了稳定表达了4xHis-盒的第三代植物(根据抗体检测和斑点印迹)。

实施例26

具有各种长度的组氨酸，半胱氨酸/甲硫氨酸，甘氨酸和赖氨酸的构建体在烟草表皮细胞中的表达

工程化多氨基酸序列的长度被认为对于His，Cys/Met，Gly和Lys-构建体的表达来说是关键的，这是由于两种原因，包括在细胞生产能力方面的稳定性和遗传限制。

长的多氨基酸序列，例如8xHis-系列中的序列在体外翻译系统(TNTT7/SP6偶联的小麦胚芽提取系统L5030，Promegacorporation)中是不稳定的，而6xHis-系列局限于大肠杆菌在液体培养基中的生长，正如实施例11所披露的。所述细胞产生大量多氨基酸序列而又不对其他蛋白及其合成产生影响的固有限制对于所述表达来说同样是重要的。

因此，在植物中检验了所有CaMV 35S启动子-驱动的构建体，以便检查所述大多氨基酸序列在植物细胞中的限制。尽管存在所述推测的限制，所有构建体(如在实施例11-14所制备的)是在烟草表皮细胞中表达的。不过，与较短的多氨基酸序列相比，包括较长多氨基酸序列的构建体表达水平较低，因此，选择具有四个His，Cys/Met，Gly和Lys-盒的构建体用于稳定转化实验。

对若干植物品系进行的Western印迹分析(表1)表明，抗组氨酸序列，MP，油质蛋白或GFP(图13-15)的抗体可用于检测具有已知分子量(MWs)的蛋白。油质蛋白，MP，GFP和4X His-盒(在每一个盒中具有14个His密码子)分子量分别为18.5，30，30，和2.5kDa。融合蛋白的合适的MWs可以根据上述值以组合的每一种融合成分的MWs的总和形式计算。通过SDS-PAGE凝胶电泳和通过Western印迹分析检查，证实了所述融合蛋白的大小与它们的预测的分子量相同。通过Western印迹分析研究了转基因编码蛋白产物(油质蛋白-His和MP-His)的稳定性。在转化之后进行的(自交)植物世代(第三代)分析(表1)明确表明了转基因表达在连续世代中是稳定的。另外，检查了所述转化过的植物的Western印迹分析，进一步揭示了蛋白产物的大小无论植物世代如何均保持稳定。以上分析还证实了融合蛋白产物的量在植物世代之间是相对稳定的，表明了相对其他植物蛋白的可获得的稳定表达水平。

实施例27

油质蛋白-组氨酸和MP-组氨酸融合蛋白的植物内生产

分析了四个系列的转基因芸薹品系(代码：5，8，14和17)。以上系列包括以下构建体：5-系列：pNAP-MP-4x-His-GFP；8-系列：pHYB-MP-4x-His-GFP；14-系列：pNAP-OLE-4x-His-GFP；17-系列：pHYB-0LE-4x-His-GFP。

对若干植物品系进行的Western印迹分析(Sambrook等，Molecular cloning：A laboratory manual，2nd edn.，Cold SpringHarbor，NY 1989)(表1)表明了抗体(抗His序列，MP，油质蛋白或GFP)(图13-15)可用于检测具有已知分子量(MWs)的蛋白。MP，油质蛋白和GFP抗体来自Atabekov′s实验室。Poly-His抗体是商业化的(Pierce，Rocford US)。油质蛋白，MP，GFP和4X His-盒(每一个盒具有14个His密码子)的预测的MWs分别为18.5，30，30，和2.5kDa。融合蛋白的合适的MWs可以根据所述值以组合的每一种融合成分的MWs的总和形式计算，即OLE-4xHis-GFP的MW为62.5。

在通过SDS-PAGE凝胶电泳和通过Western印迹分析检查时，证实了融合蛋白OLE-4XHis-GFP和MP-4xHis-GFP的大小与推测的分子量相同。通过Western印迹分析研究了转基因编码蛋白产物(油质蛋白-His和MP-His)的稳定性。在转化之后对(自交)植物世代(第三代)进行的分析明确表明了转基因表达在后续世代中是稳定的。另外，对转化过的植物的Western印迹分析检查进一步揭示了所述蛋白产物的大小保持稳定，而与植物世代无关。以上分析还表明了融合蛋白产物的量在植物世代之间是稳定的，表明了相对其他植物蛋白而言获得了稳定的表达水平。

在使用His，MP和OLE抗体时，MP或OLE，和GFP可以在合适的植物品系中检测到。这表明了所述表达是稳定的，并且如果载体存在并且表达，His序列不可能是“被退化掉的”。

表1.转基因芸薹植物品系对针对由合适的转基因编码的蛋白产物产生的特异性抗体的反应。针对所述蛋白的C-末端部分制备的多克隆OLE和针对细菌产生的MP产生的poly-MP是在Atabekov′s实验室制备的。抗-His可以从Pierce，Rocford US.购买。

转基因植物品系	融合蛋白	抗体反应
		抗体反应			油质蛋白	His	MP
		5.1A115.1A188.268.2914.17C214.5C814.12A10	MPMPMPMP油质蛋白油质蛋白油质蛋白	NDNDNDND++++++	油质蛋白	His	MP	++++++++++++++	++++++++NDNDND

ND＝未检测，+＝弱反应，++＝良好反应 +++＝强反应。

5和14系列的转基因植物品系包含NAP启动子，而8和17系列的转基因植物品系包含YB启动子。

实施例28

能表达四种组氨酸盒的转基因芸薹植物品系的种子的氨基酸分析

用于氨基酸分析的种子的重复样品是从能表达四种组氨酸盒的转基因芸薹品系(T2)中获得的(品系5和8具有MP作为载体，品系14和17具有OLE作为载体；参见图3和实施例27)。对从种子中获得的总蛋白样品进行氨基酸分析(表2)。所述分析是在Animal Nutrition Sectionin Agricultural Research Centre，Jokioinen，Finland，按照European Commission Directive 98/64/EC(1998)进行的。

表2.用于氨基酸分析的种子。

植物品系	种子数量	种子重量(mg)	蛋白重量(mg)
植物品系	种子数量	种子重量(mg)	蛋白重量(mg)	WT14.5C814.12A10	1089	3311.530.9	11.37.219.4

WT＝野生型

与野生型植物相比，转基因芸薹植物品系14.12A10包括多出30％的组氨酸(表3)。增加的组氨酸含量不会以牺牲其他氨基酸为代价积累，而是改变了总蛋白的量。

表3.组氨酸在转基因芸薹种子中的相对提高

植物品系	组氨酸量(g)/蛋白(kg)	组氨酸增加％
植物品系	组氨酸量(g)/蛋白(kg)	组氨酸增加％	WT14.5C814.12A10	3.203.204.74	0032

WT＝野生型

在另一种分析中，使用了四种转基因品系(8.23，8.6A1，14.121)和17.20C20和一种野生型品系(称之为WT)。这些品系相当于用8-系列，或14-系列或17-系列组氨酸盒转化过的植物(参见实施例27)。在表4中组氨酸的含量是以克(组氨酸)/Kg(总蛋白)形式表示的。

表4.芸薹种子中的组氨酸含量。

植物品系	组氨酸量(g)/蛋白(kg)
植物品系	组氨酸量(g)/蛋白(kg)	WT8.238.6A114.12117.20C20	6.954.927.197.376.76

WT＝野生型

在排除了其他氨基酸含量增加时，组氨酸的增加在3-9％之间。

序列表

<110>Boreal Plant Breeding Ltd

<120>用于提高种子中选定的氨基酸含量的方法或构建体

<130>A2436PC

<140>

<141>

<150>FI 20030315

<151>2003-02-28

<160>17

<170>PatentIn Ver.2.1

<210>1

<211>45

<212>DNA

<213>人工序列

<220>

<223>人工序列说明：合成的

<220>

<223>H-P-1

<400>1

gcgcctcgag ttcaccatca ccatcaccat cacgggcacc atcac 45

<210>2

<211>17

<212>DNA

<213>人工序列

<220>

<223>人工序列说明：合成的

<220>

<223>H-P-2

<400>2

catcaccatc accatgg 17

<210>3

<211>45

<212>DNA

<213>人工序列

<220>

<223>人工序列说明：合成的

<220>

<223>H-M

<400>3

ccggatccta aagtcgacca tggtgatggt gatggtgatg gtgcc 45

<210>4

<211>50

<212>DNA

<213>人工序列

<220>

<223>人工序列说明：合成的

<220>

<223>C-M-P-1

<400>4

cacctcgagt atgttgttgc atgtgcatgt gctgttgcat gtcgacaaac 50

<210>5

<211>50

<212>DNA

<213>人工序列

<220>

<223>人工序列说明：合成的

<220>

<223>C-M-P-2

<400>5

gtttgtcgac atgcaacagc acatgcacat gcaacaacat actcgaggtg 50

<210>6

<211>57

<212>DNA

<213>人工序列

<220>

<223>人工序列说明：合成的

<220>

<223>GL-P-1

<400>6

gcgcctcgag ttggtggagg tggaggcggt ggaggtggcg tcgacaaatg gatcccc 57

<210>7

<211>60

<212>DNA

<213>人工序列

<220>

<223>人工序列说明：合成的

<220>

<223>GL-P-2

<400>7

ggggatccat ttgtagacgc cacctcctcc accgcctcca cctccaccaa ctcgaggcgc 60

<210>8

<211>66

<212>DNA

<213>人工序列

<220>

<223>人工序列说明：合成的

<220>

<223>L-P-1

<400>8

gcgcctcgag ttaaaaagaa aaagaaaaag aaaaagaaaa agaaaaaggt cgacaaatgg 60

atcccc 66

<210>9

<211>66

<212>DNA

<213>人工序列

<220>

<223>人工序列说明：合成的

<220>

<223>L-P-2

<400>9

ggggatccat ttgtcgacct ttttcttttt ctttttcttt ttctttttct ttttaactcg 60

aggcgc 66

<210>10

<211>34

<212>DNA

<213>人工序列

<220>

<223>人工序列说明：合成的

<220>

<223>OLE-P

<400>10

aaaaccatgg cggatacagc tagaggaacc catc 34

<210>11

<211>37

<212>DNA

<213>人工序列

<220>

<223>人工序列说明：合成的

<220>

<223>OLE-M

<400>11

ggggccatgg gagtagtgtg ctggccacca cgagtac 37

<210>12

<211>31

<212>DNA

<213>人工序列

<220>

<223>人工序列说明：合成的

<220>

<223>OLE-3′XhoI

<400>12

gcgcctcgag aagtagtgtg ctggccacca c 31

<210>13

<211>31

<212>DNA

<213>人工序列

<220>

<223>人工序列说明：合成的

<220>

<223>N30K

<400>13

gcggaattcc catggctcta gttgttaaag g 31

<210>14

<211>32

<212>DNA

<213>人工序列

<220>

<223>人工序列说明：合成的

<220>

<223>C30K

<400>14

agacctcgag gaaacgaatc cgattcggcg ac 32

<210>15

<211>31

<212>DNA

<213>人工序列

<220>

<223>人工序列说明：合成的

<220>

<223>OLE-EX-B

<400>15

tgtgggatcc tacgcaacgg gagagcaccc a 31

<210>16

<211>27

<212>DNA

<213>人工序列

<220>

<223>人工序列说明：合成的

<220>

<223>NAP-P

<400>16

cttgttagcc atggtttgct atttgtg 27

<210>17

<211>26

<212>DNA

<213>人工序列

<220>

<223>人工序列说明：合成的

<220>

<223>NAP-M

<400>17

tcttactcga gtgaaaccaa attaac 26

Claims

1.一种提高在植物的选定的组织或器官中的一种或多种选定的氨基酸含量的方法，包括用至少一种重组核苷酸序列构建体转化植物，所述构建体包括在形态发生的选定的阶段驱动转录的组织或器官特异性调控序列，所述构建体可操作地连接在嵌合核苷酸序列上，该嵌合核苷酸序列包括：

(i)编码载体蛋白的核苷酸序列，所述载体蛋白包括植物特异性蛋白，该蛋白使得氨基酸富集的蛋白能够在植物的选定的组织或器官中定向表达；所述核苷酸序列缺少终止密码子，并且是与以下部分框内融合的

(ii)包括选定的最佳数量的密码子的至少一个核苷酸序列，它所编码的氨基酸序列包括一个或多个氨基酸残基的选定的组合，其中，所述最佳数量的密码子是通过确定允许稳定翻译的数量确定的；

所述重组核苷酸序列构建体使得选定的氨基酸富集的具有稳定的多氨基酸延伸部分的载体蛋白在植物的选定的组织或器官中能够进行稳定的定向表达。

2.如权利要求1的方法，其中，所述允许多氨基酸延伸部分稳定翻译的具有最佳数量的密码子的构建体是使用无细胞体外翻译(IVT)系统选择的。

3.如权利要求1的方法，其中，所述在植物的选定的组织或器官中的定向表达是通过具有稳定的多氨基酸延伸部分，并且与相应的未修饰过的载体蛋白相比具有完整的生物学功能的载体蛋白实现的。

4.如权利要求1的方法，其中，所述使得具有多氨基酸延伸部分的载体蛋白能够进行稳定的定向表达的构建体是通过瞬时表达测定选择，包括编码报道蛋白的核苷酸序列，它是与权利要求1所述的构建体框内融合的。

5.如权利要求1的方法，其中，所述使得具有多氨基酸延伸部分的载体蛋白能够进行稳定的定向表达的构建体是通过检测报道蛋白在植物细胞中的表达而选择的。

6.如权利要求1的方法，其中，所述使得具有多氨基酸延伸部分的载体蛋白能够在植物的选定的组织或器官中进行稳定的定向表达的构建体是通过包括以下步骤的方法获得的：

(a)使权利要求1的重组核苷酸序列构建体与编码报道蛋白的核苷酸序列框内融合；

(b)在无细胞翻译(IVT)系统中选择使得多氨基酸延伸部分能够稳定翻译的具有最佳数量的密码子的构建体；

(c)将在步骤(b)中获得的所述构建体导入植物细胞；

(d)通过瞬时表达测定选择能够使得具有多氨基酸延伸部分的载体蛋白进行稳定的定向表达的构建体，这是通过检测所述报道蛋白在植物细胞中的表达而进行的；

(e)从在步骤(d)中选择的构建体上除去编码报道基因的核苷酸序列，以便获得缺少编码所述报道蛋白的核苷酸序列的构建体；

(f)用在步骤(e)中获得的所述构建体转化植物。

7.如权利要求6的方法，其中，所述在步骤(b)中获得的并且包括编码报道蛋白的核苷酸序列的构建体是通过微粒子轰击导入植物细胞的。

8.如权利要求6的方法，其中，选择提供所述报道蛋白的稳定的定向表达的构建体，并且在除去编码所述报道蛋白的核苷酸序列之后，通过农杆菌属介导的转化导入植物。

9.如权利要求1的方法，其中，编码多氨基酸延伸部分的密码子包括组氨酸，半胱氨酸，甲硫氨酸，甘氨酸，赖氨酸，色氨酸，丙氨酸，缬氨酸，亮氨酸，异亮氨酸，脯氨酸，苯丙氨酸，酪氨酸，丝氨酸，苏氨酸，精氨酸，天冬氨酸，谷氨酸，天冬酰胺，谷氨酰胺编码密码子或它们的任意组合。

10.如权利要求1的方法，其中，所述编码选定的多氨基酸延伸部分的密码子的数量为4-80个。

11.如权利要求1的方法，其中，所述植物的选定的组织或器官是种子。

12.如权利要求1的方法，其中，所述植物的选定的组织或器官是细胞壁或细胞膜。

13.如权利要求1的方法，其中，所述植物的选定的组织或器官是油体。

14.如权利要求1的方法，其中，所述使得能够在植物组织或器官中进行稳定的定向表达的植物特异性载体蛋白是在植物的细胞内交通途径中起作用的蛋白。

15.如权利要求14的方法，其中，所述载体蛋白是细胞壁蛋白或植物病毒蛋白。

16.如权利要求15的方法，其中，所述载体蛋白包括油质蛋白，caleosin，steroleosin，cruciferin，napin或植物病毒运动蛋白。

17.如权利要求16的方法，其中，所述载体蛋白是烟草花叶病毒(TMV MP)的运动蛋白。

18.如权利要求1的方法，其中，所述调控序列是在胚胎发生期间表达的启动子。

19.如权利要求1的方法，其中，所述调控序列包括napin(NAP)，花椰菜花叶病毒35S(35S)，嵌合杂合体(HYB)，19S，胭脂氨酸，菜豆蛋白，steroleosin，caleosin，cruciferin，苜蓿花叶病毒(AMV)，热激，白蛋白2S或油质蛋白启动子。

20.如权利要求19的方法，其中，所述napin(NAP)启动子是拟南芥的napin(NAP)启动子。

21.如权利要求19的方法，其中，所述杂合(HYB)启动子是嵌合启动子，它包括CaMV 35S启动子的增强子序列和完整的napin(NAP)启动子。

22.如权利要求1的方法，其中，具有多氨基酸延伸部分的载体蛋白的稳定的定向表达是通过使用在napin(NAP)启动子的控制下表达的运动蛋白提供的。

23.如权利要求6的方法，其中，所述报道蛋白是编码可检测的蛋白的核苷酸序列。

24.如权利要求6的方法，其中，所述报道蛋白是荧光蛋白。

25.如权利要求6的方法，其中，所述报道蛋白是绿色荧光蛋白((GFP)，红色荧光蛋白，β-葡糖醛酸酶，obelin或荧光素酶。

26.一种用于提高在植物的选定的组织或器官中的一种或多种选定的氨基酸含量的重组核苷酸序列构建体，其中，所述使得具有多氨基酸延伸部分的氨基酸富集的蛋白能够在植物的选定的组织或器官中进行稳定的定向表达的构建体包括可操作地连接在嵌合核苷酸序列上的组织或器官特异性调控序列，它能在形态发生的选定的阶段驱动转录，所述嵌合核苷酸序列包括：

(a)编码载体蛋白的核苷酸序列，所述载体蛋白包括使得能够在植物的选定的组织或器官中进行稳定的定向表达的植物特异性蛋白；所述核苷酸序列缺少终止密码子并且是与以下部分框内融合的

(ii)包括允许稳定翻译所述多氨基酸延伸部分的选定的最佳数量的密码子，并且编码包括一个或多个氨基酸残基的选定的组合的氨基酸序列的至少一个核苷酸序列。

27.如权利要求26的构建体，其中，所述使得能够在植物的选定的组织或器官中进行稳定的定向表达的构建体包括编码具有多氨基酸延伸部分，并且与相应的未修饰过的载体蛋白相比具有完整的生物学功能的载体蛋白的核苷酸序列。

28.如权利要求26的构建体，其中，所述使得能够选择允许具有多氨基酸延伸部分的载体蛋白定向表达的构建体的构建体包括了与权利要求26的嵌合核苷酸序列框内融合的编码报道蛋白的核苷酸序列。

29.如权利要求26的构建体，其中，所述使得能够在植物组织或器官中进行稳定的定向积累的植物特异性载体蛋白包括在分泌性细胞内交通途径中发挥作用的蛋白。

30.如权利要求26的构建体，其中，所述载体蛋白是植物细胞壁蛋白或植物病毒蛋白。

31.如权利要求26的构建体，其中，所述载体蛋白是油质蛋白，caleosin，steroleosin，cruciferin，napin或植物病毒运动蛋白。

32.如权利要求26的构建体，其中，所述载体蛋白是烟草花叶病毒(TMVMP)的运动蛋白。

33.如权利要求26的构建体，其中，所述密码子包括组氨酸，半胱氨酸，甲硫氨酸，甘氨酸，赖氨酸，色氨酸，丙氨酸，缬氨酸，亮氨酸，异亮氨酸，脯氨酸，苯丙氨酸，酪氨酸，丝氨酸，苏氨酸，精氨酸，天冬氨酸，谷氨酸，天冬酰胺，谷氨酰胺编码密码子或它们的任意组合。

34.如权利要求26的构建体，其中，所述最佳数量的密码子为4-80个。

35.如权利要求26的构建体，其中，所述调控序列是在胚胎发生期间表达的启动子。

36.如权利要求26的构建体，其中，所述调控序列包括napin(NAP)，花椰菜花叶病毒(CMV 35S)，嵌合杂合体(HYB)，19S，胭脂氨酸，菜豆蛋白，steroleosin，caleosin，cruciferin，苜蓿花叶病毒(AMV)，热激，白蛋白2S或油质蛋白启动子。

37.如权利要求26的构建体，其中，所述启动子是拟南芥的napin(NAP)启动子。

38.如权利要求36的构建体，其中，所述嵌合杂合体(HYB)启动子包括CaMV 35S启动子的增强子序列和完整的napin(NAP)启动子。

39.如权利要求28的构建体，其中，所述报道蛋白是可检测的蛋白。

40.如权利要求28的构建体，其中，所述报道蛋白是荧光蛋白。

41.如权利要求28的构建体，其中，所述报道蛋白是绿色荧光蛋白(GFP)，红色荧光蛋白，β-葡糖醛酸酶，obelin或荧光素酶。

42.如权利要求28的构建体，其中，所述构建体包括编码具有组氨酸富集的延伸部分的载体蛋白和绿色荧光蛋白(GFP)的核酸序列。

43.如权利要求1的方法，用于生产在植物材料中包括氨基酸富集的具有多氨基酸延伸部分的载体蛋白的组合物，其中，在通过所述方法获得的植物材料中氨基酸的含量与相应的未修饰过的野生型植物中的氨基酸含量相比至少为2∶1。

44.如权利要求43的方法，用于生产油渣饼的氨基酸富集的饲料，所述油渣饼是在从植物中回收油之后获得的。

45.如权利要求26的构建体，用于生产在植物材料中包括氨基酸富集的具有多氨基酸延伸部分的载体蛋白的组合物，其中，在通过所述方法获得的植物材料中氨基酸的含量与相应的未修饰过的野生型植物中的氨基酸含量相比至少为2∶1。

46.用权利要求26的构建体转化过的植物。

47.用权利要求28的构建体转化过的植物。

48.用权利要求26的构建体转化过的植物细胞。

49.用权利要求28的构建体转化过的植物细胞。

50.用权利要求26的构建体转化过的植物细胞系。

51.用权利要求28的构建体转化过的植物细胞系。

52.通过权利要求1的方法获得的组合物，该组合物在植物材料中包括具有多氨基酸延伸部分的氨基酸富集的载体蛋白，在该组合物中，在通过所述方法获得的植物材料中氨基酸的含量与相应的未修饰过的野生型植物中的氨基酸含量相比至少为2∶1。