CN101431888A - 编码wrinkled1样多肽的核酸分子及在植物中的使用方法 - Google Patents

编码wrinkled1样多肽的核酸分子及在植物中的使用方法 Download PDF

Info

Publication number
CN101431888A
CN101431888A CNA200580026790XA CN200580026790A CN101431888A CN 101431888 A CN101431888 A CN 101431888A CN A200580026790X A CNA200580026790X A CN A200580026790XA CN 200580026790 A CN200580026790 A CN 200580026790A CN 101431888 A CN101431888 A CN 101431888A
Authority
CN
China
Prior art keywords
seq
nucleic acid
lmp
plant
polynucleotide sequence
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CNA200580026790XA
Other languages
English (en)
Inventor
H·黑特尔
G·巴特
V·米腾多夫
K·尚克
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
BASF Plant Science GmbH
Original Assignee
BASF Plant Science GmbH
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by BASF Plant Science GmbH filed Critical BASF Plant Science GmbH
Publication of CN101431888A publication Critical patent/CN101431888A/zh
Pending legal-status Critical Current

Links

Images

Abstract

提供了与脂类和糖代谢调节相关的分离的核酸和蛋白质。具体而言,提供了来源于拟南芥、欧洲油菜、大豆、稻和普通小麦的脂类代谢蛋白(LMP)和编码核酸。该核酸和蛋白质用于产生转基因植物和调节种子贮藏化合物水平的方法。种子贮藏化合物优选为脂类、脂肪酸、淀粉或种子贮藏蛋白质。该核酸和蛋白质还用于调节植物种子大小、种子数、种子重量、根长度和叶大小的方法。

Description

编码WRINKLED1样多肽的核酸分子及在植物中的使用方法
发明背景
技术领域
本文所述为植物遗传工程领域的发明,包括编码改善农学、园艺和品质性状的多肽的分离的核酸分子。本发明一般涉及编码与植物中种子贮藏化合物的存在相关的蛋白质的核酸序列。更具体地,本发明涉及编码糖和脂类代谢调节蛋白的WRINKLED1样(WRI1样)核酸序列以及这些序列在转基因植物中的用途。尤其是本发明涉及操作糖相关化合物以在植物和种子中提高油水平和改变脂肪酸组成的方法。本发明还涉及使用这些新的植物多肽刺激植物生长和/或提高种子贮藏化合物的产量和/或组成的方法。
背景技术
植物的研究和遗传操作有很长的历史,甚至早在Gregor Mendel的著名研究之前就已经开始了。在这门学科的完善过程中,科学家已经实现了对植物中特定性状的修饰,范围从具有提高的淀粉含量的马铃薯块茎到具有提高或改变的脂肪酸含量的油料种子作物(如芸苔和向日葵)。随着植物油消费和使用的增长,对种子油含量和种子油水平的修饰日益广泛(如
Figure A200580026790D00091
等,1995,Science 268:681-686)。对转基因植物中生物合成途径的操作为分子生物学家和植物生物化学家提供了许多机会,产生具有较高价值的特定产品。已经在许多传统种子油植物(如大豆(美国专利号5,955,650)、芸苔(美国专利号5,955,650)、向日葵(美国专利号6,084,164)和油菜(
Figure A200580026790D0009173012QIETU
等,1995,Science 268:681-686))和非常规种子油植物(如烟草(Cahoon等,1992,Proc.Natl.Acad.Sci.USA 89:11184-11188))中改变了种子油产生或组成。
植物种子油包含中性和极性脂类(见表1)。中性脂类主要包括三酰甘油,它是种子油体中累积的主要贮藏脂类。极性脂类主要可见于种子细胞的多种膜中,如内质网、微粒体膜和细胞膜。中性和极性脂类含有若干常见脂肪酸(见表2)和一系列较不常见的脂肪酸。表2中用星号标出的脂类一般不存在于植物种子油中,但它们在转基因植物种子油中的产生在植物生物技术中是重要的。膜脂的脂肪酸组成是高度受控的,在膜脂中只可见到选定数目的脂肪酸。另一方面,在许多植物物种的种子中,多种非常见脂肪酸可以掺入中性贮藏脂类中(Van de Loo等,1993,Unusual Fatty Acidsin Lipid Metabolism in Plants 91-126页,TS Moore Jr编辑。CRC Press;Millar等,2000,Trends Plant Sci.5:95-101)。
表1
植物脂类类别
 
中性脂类 三酰甘油(TAG)
二酰甘油(DAG)
单酰甘油(MAG)
极性脂类 单半乳糖基二酰甘油(MGDG)
二半乳糖基二酰甘油(DGDG)
磷脂酰甘油(PG)
磷脂酰胆碱(PC)
磷脂酰乙醇胺(PE)
磷脂酰肌醇(PI)
磷脂酰丝氨酸(PS)
硫代异鼠李糖二酰甘油
表2
常见植物脂肪酸
 
16:0 棕榈酸
16:1 棕榈油酸
16:3 Palmitolenic acid
 
18:0 硬脂酸
18:1 油酸
18:2 亚油酸
18:3 亚麻酸
γ-18:3 γ-亚麻酸
20:0 花生酸
20:1 二十烯酸
22:6 二十二碳六烯酸(DHA)
20:2 二十碳二烯酸
20:4 花生四烯酸(AA)
20:5 二十碳五烯酸(EPA)
22:1 芥子酸
脂类合成自脂肪酸,其合成可以分成两个部分:原核途径和真核途径(Browse等,1986,Biochemical J.235:25-31;Ohlrogge & Browse,1995,Plant Cell 7:957-970)。原核途径位于质体中,质体是脂肪酸生物合成的主要场所。脂肪酸合成开始于通过乙酰辅酶A羧化酶(ACCase)将乙酰辅酶A转化为丙二酸单酰辅酶A。通过丙二酸单酰辅酶A:ACP转酰基酶将丙二酸单酰辅酶A转化为丙二酰酰基载体蛋白(ACP)。β-酮-酰基-ACP合酶III(KAS III)催化缩合反应,其中来自乙酰辅酶A的酰基基团转移到丙二酰-ACP以形成3-酮丁酰-ACP。在其后的一系列缩合、还原和脱水反应中,通过丙二酰-ACP提供的二个碳原子的逐步加入(缩合)延长ACP辅因子上的新生脂肪酸链,直至形成16或18碳的饱和脂肪酸链。质体Δ-9酰基-ACP去饱和酶在脂肪酸中引入第一个不饱和双键。硫酯酶从ACP辅因子上切下脂肪酸,游离的脂肪酸运出至胞质,在胞质中它们作为脂肪酰基辅酶A酯参与真核途径。在此途径中,分别通过甘油-3-磷酸酰基转移酶和溶血磷脂酸酰基转移酶将脂肪酸酯化到甘油-3-磷酸的sn-1和sn-2位置,以得到磷脂酸(PA)。PA是其他极性和中性脂类的前体,中性脂类形成于肯尼迪途径(Voelker,1996,Genetic Engineering Setlow编辑18:111-113;Shanklin &Cahoon,1998,Annu.Rev.Plant Physiol.Plant MoI.Biol.49:611-641;Frentzen,1998,Lipids 100:161-166;Millar等,2000,Trends Plant Sci.5:95-101)。
种子中的贮藏脂类合成自碳水化合物衍生的前体。植物在胞质溶胶中具有完整的糖酵解途径(Plaxton,1996,Annu.Rev.Plant Physiol.PlantMoI.Biol.47:185-214),并且已经显示在油菜籽的质体中也存在完整的途径(Kang & Rawsthorne,1994,Plant J.6:795-805)。蔗糖是碳和能量的主要来源,从叶转运到正发育种子。在种子的贮藏期中,在胞质溶胶中转化蔗糖以提供代谢前体葡萄糖-6-磷酸和丙酮酸。它们转运到质体中并转化成乙酰辅酶A,其作为脂肪酸合成的主要前体。质体中的乙酰辅酶A是脂类生物合成的中心前体。可以通过不同的反应在质体中形成乙酰辅酶A,但每个反应的确切贡献仍有争议(Ohlrogge & Browse,1995,Plant Cell7:957-970)。然而,公认大部分的乙酰辅酶A来自于从胞质运入质体的葡萄糖-6-磷酸和丙酮酸。蔗糖在源器官(叶或发生光合作用的任何地方)中产生并转运至发育的种子(也称为库器官)。在发育的种子中,蔗糖是所有贮藏化合物(即淀粉、脂类和部分种子贮藏蛋白)的前体。因此,蔗糖发挥中心作用的碳水化合物代谢对于种子贮藏化合物的累积是很重要的。
贮藏化合物如三酰甘油(种子油)作为幼苗萌发和生长中所使用的碳和能量的储备。种子(植物)油也是人类饮食的必要成分和提供化工原料的有价值的商品。影响种子贮藏化合物代谢的拟南芥突变体为wrinkled1(wri1)(Focks和Benning,1998)。该突变体特征在于种子油含量降低80%。此外,看来也影响了糖代谢中相关基因的表达。
尽管可以通过植物育种的传统方法修饰种子油中脂类和脂肪酸的含量和/或组成,但重组DNA技术的到来使对植物种子油含量的操作更为简单,而且在一些情况下允许以单靠育种无法实现的方式改变种子油(参阅如
Figure A200580026790D0009173012QIETU
等,1995,Science 268:681-686)。例如,在转基因烟草中引入Δ12-羟化酶核酸序列导致在烟草种子油中引入新的脂肪酸——蓖麻油酸(Van deLoo等,1995,Proc.Natl.Acad.Sci USA 92:6743-6747)。还改造了烟草植物以通过引入并表达来自芫荽的酰基-ACP去饱和酶来产生低水平的岩芹酸(Cahoon等,1992,Proc.Natl.Acad.Sci USA 89:11184-11188)。
对植物中种子油含量的修饰具有重要的医学、营养学和经济分支。就医学分支而言,已经将可见于许多种子油的长链脂肪酸(C18及更长)和与冠心病相关的高胆固醇血症和其他临床病症的减少相联系(Brenner,1976,Adv.Exp.Med.Biol.83:85-101)。因此,消费具有提高水平的这些类型脂肪酸的植物可以降低心脏病的风险。种子油含量的提高的水平还提高了种子油的大规模生产,从而降低这些油的费用。
为了提高或改变植物中化合物如种子油的水平,必须鉴定调节脂类和脂肪酸代谢的核酸序列和蛋白质。如上文所提到的,已经克隆了若干去饱和酶核酸如Δ6-去饱和酶核酸、Δ12-去饱和酶核酸和酰基-ACP去饱和酶核酸,并已证明其编码多种植物物种中脂肪酸合成所需的酶。还已经克隆了来自不同物种如芸苔、大豆、胡萝卜、松和拟南芥的油质蛋白核酸序列,并已确定其编码与这些植物中油体的磷脂单层膜结合的蛋白质。
还已经确定两种植物激素赤霉酸(GA)和脱落酸(ABA)与种子发育的总体调节过程相关(如Ritchie & Gilroy,1998,Plant Physiol.116:765-776;Arenas-Huertero等,2000,Genes Dev.14:2085-2096)。GA和ABA途径都受蛋白质磷酸酶抑制剂冈田酸的影响(Kuo等,1996,Plant Cell.8:259-269)。通过激酶和磷酸酶调节蛋白质磷酸化已被公认是细胞控制的普遍机制(Cohen,1992,Trends Biochem.Sci.17:408-413)。同样,植物激素乙烯(参阅如Zhou等,1998,Proc.Natl.Acad.Sci.USA 95:10294-10299;Beaudoin等,2000,Plant Cell 2000:1103-1115)和生长素(如Colon-Carmona等,2000,Plant Physiol.124:1728-1738)也与植物发育的控制相关。
尽管已知普遍影响植物和种子发育的若干化合物,但仍明确需要具体鉴定对于贮藏化合物累积的发育调节更具特异性的因子和鉴定具有赋予其宿主植物及其他植物物种改变或提高的油产生能力的基因。本发明公开了来自拟南芥(Arabidopsis thaliana)、欧洲油菜(Brassica napus)、大豆(Glycine max)、稻(Oryza sativa)或普通小麦(Triticum aestivum)的核酸序列。这些核酸序列可用于改变或提高植物中种子贮藏化合物如蛋白质、糖和油的水平,所述植物包括转基因植物,如油菜、亚麻子、大豆、向日葵、玉米、燕麦、黑麦、大麦、小麦、稻、胡椒、万寿菊、棉花、油椰、椰树、亚麻、蓖麻和花生,它们是含有大量脂类化合物的油料种子植物。
发明概述
本发明提供与植物中种子贮藏化合物的代谢相关,特别是与WRI1样序列相关的新的分离的核酸和氨基酸序列。
本发明还提供来自拟南芥、欧洲油菜、大豆、稻和普通小麦的编码脂类代谢蛋白(LMP)或其部分的分离的核酸。这些序列可用于修饰或增加微生物和植物中的脂类和脂肪酸、辅因子和酶。
已知拟南芥植物产生大量的脂肪酸如亚油酸和亚麻酸(见表2),并且其在许多方面(基因同源性等)与油料作物植物芸苔属十分相似。因此,来源于植物如拟南芥、欧洲油菜、大豆、稻或普通小麦或相关生物的核酸分子特别适用于修饰宿主(特别是微生物和植物)中的脂类和脂肪酸代谢。另外,来自拟南芥、欧洲油菜、大豆、稻或普通小麦的核酸可用于鉴定其他物种中的DNA序列和酶,所述DNA序列和酶可用于修饰各自生物中脂肪酸前体的生物合成。
本发明还提供分离的核酸,所述核酸含有来自植物(拟南芥、欧洲油菜、大豆、稻或普通小麦)的编码脂类代谢蛋白(LMP)或其部分的核酸的至少15个核苷酸的片段。
本发明还提供该核酸编码的多肽、含有该核酸编码的多肽的异源多肽和这些多肽的抗体。
此外,本发明涉及并提供LMP核酸在产生具有修饰水平或组成的种子贮藏化合物的转基因植物中的用途。就改变的组成而言,本发明可用于例如提高油酸相对于其他植物油的百分比。产生具有修饰水平或组成的种子贮藏化合物的转基因植物的方法包括以下步骤:用含有LMP核酸的表达载体转化植物细胞和从该植物细胞产生具有修饰水平或组成的种子贮藏化合物的植物。在一个实施方案中,植物为高产油物种,如Kinney等(1994,Current Opin.in Biotech.5:144-151)、
Figure A200580026790D0009173012QIETU
等(1995,Science268:681-686)和《Oil Crops of the World-Their Breeding and Utilization》(1989,
Figure A200580026790D0015180628QIETU
,Downey和Ashri编辑)中所述。在优选的实施方案中,植物为选自例如油菜、亚麻子、大豆、向日葵、玉米、燕麦、黑麦、大麦、小麦、稻、胡椒、万寿菊、棉花、油棕榈、椰树、亚麻、蓖麻和花生的高产油物种。
根据本发明,本文所述的组合物和方法可用于改变转基因植物中LMP的组成和用于提高或降低转基因植物中LMP的水平,包括提高或降低植物中LMP核酸的表达。可以通过LMP核酸的转基因过表达、共抑制、反义抑制或体内诱变来实现LMP核酸表达的提高或降低。本发明还可用于提高或降低种子油中脂类的水平、用于提高或降低种子油中脂肪酸的水平或用于提高或降低种子或植物中淀粉的水平。
在一个实施方案中,本发明包括并提供用于增加种子中总油含量的方法,所述方法包括用核酸构建体转化植物并培养植物,其中所述核酸构建体含有作为有效连接组分的启动子和能调节WRI1样mRNA或WRI1样蛋白质水平的核酸序列。另外,本发明包括并提供用于提高种子中油酸水平的方法,所述方法包括用核酸构建体转化植物并培养植物,其中所述核酸构建体含有作为有效连接组分的启动子和能提高油酸水平的结构核酸序列。
本发明提供具有修饰水平的种子贮藏化合物,特别是修饰水平的脂类、脂肪酸或糖的转基因植物。本文还包括由转化了LMP DNA序列的转基因植物产生的种子,其中种子含有LMP DNA序列,并且其中植物对于修饰水平的种子贮藏化合物是不分离的。本发明还包括上述种子产生的种子油。本发明还提供含有所述核酸的载体、含有所述载体的宿主细胞和通过用核酸和/或载体转化细胞并培养植物产生的植物的后代植物材料。
根据本发明,本文所述的化合物、组合物和方法可用于提高或降低脂类在种子油中的相对百分比、用于提高或降低脂类在种子油中的水平、用于提高或降低脂肪酸在种子油中的水平、用于提高或降低淀粉或其他碳水化合物在种子或植物中的水平或用于提高或降低蛋白质在种子或植物中的水平。本文所述的操作还可用于提高种子萌发和幼苗和植物的生长以及增强种子贮藏化合物的植物产量。
本发明还提供在表达来自拟南芥、欧洲油菜、大豆、稻或普通小麦的LMP核酸的转基因植物中产生高于或低于正常或典型水平的贮藏化合物的方法,其中所述转基因植物为拟南芥、欧洲油菜、大豆、稻、玉蜀黍(Zeamays)、普通小麦、向日葵(Helianthus anuus)或甜菜(Beta vulgaris)或不同于拟南芥、欧洲油菜、大豆、稻或普通小麦的物种。本文还包括修饰种子贮藏化合物的产生效率的组合物和方法。本文使用的语句拟南芥、欧洲油菜、大豆、稻、玉蜀黍、普通小麦、向日葵或甜菜还指拟南芥和/或欧洲油菜和/或大豆和/或稻和/或普通小麦和/或玉蜀黍和/或向日葵和/或甜菜。
因此,本发明提供来自拟南芥、欧洲油菜、大豆、稻或普通小麦的新的分离的LMP核酸和分离的LMP氨基酸序列及其活性片段、类似物和直向同源物。本领域技术人员会认识到,其他植物物种也含有这些核酸或相关核酸,因此这些活性片段、类似物和直向同源物也可以来自不同的植物物种。
本发明的多核苷酸和多肽(包括其激动剂和/或片段)可具有包括调节植物生长和潜在植物产量,优选提供不利条件(干旱、寒冷、光、UV)下增加植物生长的用途。此外,本发明的拮抗剂可具有包括调节植物生长和/或产量(优选通过提高植物生长和产量)的用途。在另一实施方案中,使用组成型启动子过表达本发明多肽可用于通过调节光利用效率而在胁迫条件(干旱、光、寒冷、UV)下提高植物产量。另外,本发明的多核苷酸和多肽可改善种子萌发和种子休眠,因而可改善植物生长和/或种子贮藏化合物的产量。
本发明的分离的核酸分子还可以含有有效连接的启动子或部分启动子区。在一个实施方案中,启动子可以是组成型启动子、诱导型启动子或组织特异性启动子。组成型启动子可以是例如超级启动子(Ni等,Plant J.7:661-676,1995;美国专利号5,955,646)或PtxA启动子(PF 55368-2 US,Song等,2004,参阅实施例11)。组织特异性启动子可以在营养组织或生殖组织中具有活性。在生殖组织中具有活性的组织特异性启动子可以是种子特异性启动子。在营养组织中具有活性的组织特异性启动子可以是根特异性、枝条特异性、分生组织特异性或叶特异性启动子。本发明的分离的核酸分子还可以含有5’非翻译序列、3’非翻译序列、内含子或其组合。
本发明还提供通过在植物中表达编码脂类代谢蛋白(LMP)或其部分的分离核酸来提高一种或多种植物器官的数目和/或大小的方法,所述脂类代谢蛋白来自拟南芥、欧洲油菜、大豆、稻或普通小麦。更具体地,操作种子大小、种子数和/或种子重量。还可以增加根的长度,这可以减轻土壤缺水的影响、改善植物支撑/稳定性从而减少倒伏,覆盖更大体积的土壤,从而改善养分摄取。改变的根结构的所有这些优点都具有提高作物产量的潜力。此外,可以通过此申请提供的核酸序列提高叶的数目和大小,通过提高光合成的光捕获能力和光合效率来提高光合成的光利用效率。
在参考下文公开实施方案的详细描述和附带的权利要求书之后,本发明的这些和其他特征和优点将变得显而易见的。
附图简述
图1为用于将Bn WRI01和其他WRI样基因转化进拟南芥或作物植物的双元载体T-DNA的概图。缩写定义如下:LB,左边界;pAHAS,拟南芥AHAS启动子;3’AHAS,AHAS终止信号;PtxA,PtxA启动子;Bn WRI01,Bn WRI01的cDNA;3’NOS,终止信号,RB,右边界。
图2为ptxA启动子::Zm Ubiquitin内含子::Bn WRI01嵌合构建体(PtxAZmUbi内含子-Bn WRI01)的图。质粒包含表达构建体,其含有与玉米泛蛋白内含子(Zm Ubi内含子)有效连接的ptxA启动子(ptxA)、欧洲油菜WRINKLED1(Bn WRI01)和来自胭脂碱合酶基因的3’非翻译区和终止(NOS)。SM盒代表选择标记盒。
图3为显示过表达WRI的拟南芥植物中T2和T3种子世代中油总量的图。每个圆代表用一株植物得到的值,显示了独立的转基因事件。通过t检验进行统计学分析。缩写定义如下:C24,Columbia 24;Col-2,Columbia2。
图4为显示过表达WRI的拟南芥植物中T2和T3种子世代中油酸(C18:1)水平的图。Col2,野生型Columbia-2;GB007,Columbia 2遗传背景下的空载体对照;C24,Columbia 24;WriRT,PtxA::WRI1过表达子的独立转基因事件。每个条线显示各得自20株植物的平均值。
图5为显示过表达WRI的纯合拟南芥中T2和T3种子世代中亚油酸和亚麻酸水平的图。每个条线显示得自20株植物的平均值。过表达WRI的T3种子世代的纯合拟南芥植物中C18:2含量减少95%,C18:3含量减少80%。使用的缩写定义如下:Col2,拟南芥Columbia-2生态型;WRI1-8、10、11,PtxA::WRI1的独立转基因事件。
图6为显示过表达WRI的纯合拟南芥中饱和脂肪酸水平的图。WRI1过表达子中纯合T3种子显示饱和脂肪酸减少30%。使用的缩写定义如下:Col2,拟南芥Columbia-2生态型;WRI1-8、10、11,PtxA::WRI1的独立转基因事件。
图7为显示拟南芥wri1突变体和T2种子世代的PtxA::WRI1过表达子的独立转基因株系中种子重量的图。图中显示的值代表得自单个植物的种子的种子重量平均值。使用的缩写定义如下:Col2,拟南芥Columbia-2生态型;GB007,空载体对照。
图8为显示与wri1突变体相比,拟南芥野生型Columbia-2在琼脂平板上生长14天后根长度的照片。使用的缩写定义如下:WT,野生型Columbia 2;wri1,wrinkled1突变体。
发明详述
通过参考下文本发明优选实施方案及其包括的实施例的详细描述可以更易于理解本发明。
在公开和描述本发明的化合物、组合物和方法之前,应该理解本发明不限于具体的核酸、具体的多肽、具体的细胞类型、具体的宿主细胞、具体条件或具体方法等,因为这些当然可以改变,并且其多种修饰和变化对本领域技术人员而言是显而易见的。还应该理解,本文使用的术语仅用于描述具体实施方案的目的,而不是限制性的。取决于所用的上下文,说明书和权利要求书中使用的“一个”指一个或多个。从而,例如,“一个细胞”可以指可以利用的至少一个细胞。
本发明部分基于编码WRI1样LMP的核酸分子的分离和表征,所述核酸分子来自拟南芥、欧洲油菜、大豆、稻和小麦及其相关作物物种如玉米、大麦、亚麻子、甜菜或向日葵。
根据本文具体化或描述的本发明的目的,本发明的一个方面提供来自植物(拟南芥、欧洲油菜、大豆、稻或普通小麦)的编码脂类代谢蛋白(LMP)或其部分的分离的核酸。
本发明的一个方面涉及编码LMP多肽或其生物活性部分的分离的核酸分子,以及足以作为杂交探针或引物用于鉴定或扩增LMP编码核酸(如LMP DNA)的核酸片段。本文使用的术语“核酸分子”旨在包括DNA分子(如cDNA或基因组DNA)和RNA分子(如mRNA)和使用核苷酸类似物产生的DNA或RNA类似物。此术语还包括位于基因编码区3’和5’末端的非翻译序列:从编码区5’末端起上游序列的至少约1000个核苷酸和从基因编码区3’末端起下游序列的至少约200个核苷酸。核酸分子可以是单链或双链的,但优选双链DNA。“分离的”核酸分子是与该核酸天然来源中存在的其他核酸分子基本分开的核酸分子。优选的“分离的”核酸基本不含有该核酸来源生物的基因组DNA中天然存在于该核酸侧翼的序列(即序列位于该核酸5’和3’末端的序列)。例如,在多个实施方案中,分离的LMP核酸分子可以含有该核酸来源细胞(如拟南芥、欧洲油菜、大豆、稻或普通小麦细胞)的基因组DNA中天然存在于该核酸侧翼的少于约5kb、4kb、3kb、2kb、1kb、0.5kb或0.1kb的核苷酸序列。另外,“分离的”核酸分子如cDNA分子可以基本不含有其他细胞材料或培养基(通过重组技术产生时)或化学前体或其他化学品(化学合成时)。
可以使用标准分子生物学技术和本文提供的序列信息分离本发明的核酸分子,如具有附录中所示核苷酸序列的核酸分子,或者其部分。例如,可以使用附录中所示序列之一的全部或部分作为杂交探针以及标准杂交技术(如Sambrook等,1989,《Molecular Cloning:A Laboratory Manual》.第二版,Cold Spring Harbor Laboratory,Cold Spring Harbor LaboratoryPress,Cold Spring Harbor,NY所述)从拟南芥、欧洲油菜、大豆、稻或普通小麦文库中分离拟南芥、欧洲油菜、大豆、稻或普通小麦LMP cDNA。另外,含有附录中所示序列之一的全部或部分的核酸分子可以使用基于此序列设计的寡核苷酸引物通过聚合酶链式反应进行分离(如含有附录中所示序列之一的全部或部分的核酸分子可以使用基于附录中所示的此相同序列设计的寡核苷酸引物通过聚合酶链式反应进行分离)。例如,可以从植物细胞中分离mRNA(例如通过Chirgwin等,1979,Biochemistry18:5294-5299的硫氰酸胍提取方案)并使用逆转录酶(如可得自Gibco/BRL,Bethesda,MD的Moloney MLV逆转录酶或可得自Seikagaku America,Inc.,St.Petersburg,FL的AMV逆转录酶)制备cDNA。可以基于附录中所示核苷酸序列之一设计用于聚合酶链式反应扩增的合成寡核苷酸引物。可以使用作为模板的cDNA或备选的基因组DNA和适当的寡核苷酸引物按照标准PCR扩增技术扩增本发明的核酸。这样扩增的核酸可以克隆进适当的载体并通过DNA序列分析进行表征。此外,可以通过标准合成技术(如使用自动化DNA合成仪)制备对应于LMP核苷酸序列的寡核苷酸。
在优选的实施方案中,本发明的分离的核酸含有附录中所示核苷酸序列之一。附录中显示的序列对应于本发明的拟南芥、欧洲油菜、大豆、稻或普通小麦LMP cDNA。这些cDNA含有编码LMP的序列(即“编码区”)以及5’非翻译序列和3’非翻译序列。或者,核酸分子可以仅含有附录中任一序列的编码区或者可以含有分离自基因组DNA的完整基因组片段。
就本申请而言,应该理解,附录中公开的每个序列都已指定了标识登录号(如BnWRI01)。这些序列的每一个可以一般含有三个部分:5’上游区、编码区和下游区。这些序列的编码区标明为“ORF位置”(表3)。
在另一优选的实施方案中,本发明的分离核酸分子含有与附录中所示核苷酸序列之一互补的核酸分子或其部分。与附录中所示核苷酸序列之一互补的核酸分子是与附录中所示核苷酸序列之一足够互补,使得它可以与附录中所示核苷酸序列之一杂交从而形成稳定双链体的核酸分子。
在另一优选的实施方案中,本发明的分离的核酸分子含有与附录中所示核苷酸序列具有至少约50-60%、优选至少约60-70%、更优选至少约70-80%、80-90%或90-95%、甚至更优选至少约95%、96%、97%、98%、99%或者更高同源性的核苷酸序列。在其他优选的实施方案中,本发明的分离的核酸分子含有与附录中所示核苷酸序列之一或其部分杂交(如在严格条件下杂交)的核苷酸序列。这些杂交条件包括在约60℃用盐浓度约0.02摩尔/升的pH7的溶液进行洗涤。
此外,本发明的核酸分子可以仅含有附录中所示序列之一的编码区的部分,例如可用作探针或引物的片段或编码LMP生物活性部分的片段。从来自拟南芥、欧洲油菜、大豆、稻或普通小麦LMP基因的克隆确定的核苷酸序列使得可以产生探针和引物,所述探针和引物设计用于鉴定和/或克隆其他细胞类型和生物中的LMP同源物和来自其他植物或相关物种的LMP同源物。因此本发明还提供含有本文公开的核酸或其片段的化合物。这些化合物包括附着到部分上的核酸。这些部分包括但不仅限于检测部分、杂交部分、纯化部分、递送部分、反应部分、结合部分等。探针/引物一般含有基本纯化的寡核苷酸。寡核苷酸一般含有在严格条件下与附录中公开的核苷酸序列之一的有义链、附录中公开的核苷酸序列之一的反义链或其天然存在的突变体的至少约12个、优选约25个、更优选约40、50或75个连续核苷酸杂交的核苷酸序列区。可以在PCR反应中使用基于附录中所示核苷酸序列的引物克隆LMP同源物。基于LMP核苷酸序列的探针可用于检测编码相同或同源的蛋白质的转录物或基因组序列。在优选的实施方案中,探针还含有附着于其上的标记基团,如标记基团可以是放射性同位素、荧光化合物、酶或酶辅因子。这些探针可用作基因组标记物测试试剂盒的部分,所述试剂盒用于鉴定表达LMP的细胞(例如通过测量细胞样品中LMP编码核酸的水平,如检测LMP mRNA水平)或确定基因组LMP基因是否突变或缺失。
在一个实施方案中,本发明的核酸分子编码蛋白质或其部分,所述蛋白质或其部分包含与附录中所示序列编码的氨基酸足够同源的氨基酸序列,从而所述蛋白质或其部分保持与野生型蛋白质相同或相似的功能。本文使用的用语“足够同源”指这样的蛋白质或其片段:其氨基酸序列具有最少数目的与氨基酸序列相同或等价的氨基酸残基(例如与附录中所示序列的ORF之一的氨基酸残基具有相似侧链的氨基酸残基),从而该蛋白质或其部分能参与植物中种子贮藏化合物的产生所必需的化合物的代谢、微生物或植物细胞膜的构建或分子穿过这些膜的转运。调节蛋白质(如DNA结合蛋白、转录因子、激酶、磷酸酶或代谢途径如脂类、淀粉和蛋白质生物合成途径的蛋白质成员或膜转运系统的蛋白质成员)可能在种子贮藏化合物的生物合成中发挥作用。这些活性的实例在本文中描述(见表3的推定注释)。附录中公开了LMP编码核酸序列的实例。
由于改变或提高的糖和/或脂肪酸产生是希望遗传到多种植物的一般性状,因此这些作物植物也是本发明另一实施方案的遗传改造的优选靶植物,所述植物如玉米、普通小麦、黑麦、燕麦、黑普通小麦、稻、大麦、大豆、花生、棉花、油菜、木薯、胡椒、向日葵、甜菜和万寿菊、茄科植物如马铃薯、烟草、茄子和番茄、叶豌豆物种、豌豆、苜蓿、灌木植物(咖啡、可可、茶)、柳属物种、树木(油椰、椰子)和多年生草本和饲料作物。
由本发明的LMP核酸分子编码的蛋白质部分优选是LMP之一的生物活性部分。本文使用的术语“LMP的生物活性部分”旨在包括参与种子贮藏脂类生物合成所必需的化合物的代谢或微生物或植物细胞膜的构建或分子跨越这些膜的转运或具有表3公开的活性的LMP的部分,如结构域/基序。为测定LMP或其生物活性部分是否能参与种子贮藏化合物和细胞膜的产生所必需的化合物的代谢,可以进行酶活性测定。这些测定方法是本领域技术人员所熟知的,并描述于实施例14。
LMP的生物活性部分包括含有来自LMP的氨基酸序列的氨基酸序列(如由附录中所示核酸编码的氨基酸序列或与LMP同源的蛋白质的氨基酸序列,其包含比全长LMP或与LMP同源的全长蛋白质更少的氨基酸)的肽,并表现LMP的至少一种活性。生物活性部分(肽,如长度为5、10、15、20、30、35、36、37、38、39、40、50、100或更多氨基酸的肽)一般含有具有LMP的至少一种活性的结构域或基序。此外,可以通过重组技术制备缺失了蛋白质的其他区域的其他生物活性部分,并对其评估本文所述的一种或多种活性。优选地,LMP的生物活性部分包含具有生物活性的一个或多个选定的结构域/基序或其部分。
可以通过分离序列之一的部分、表达所编码的LMP部分或肽(如通过体外重组表达)并评估所编码的LMP部分或肽的活性来制备编码LMP生物活性部分的其他核酸片段。
本发明还包括由于遗传密码的简并性而区别于附录中所示核苷酸序列之一(及其部分),并且与附录中所示核苷酸序列编码相同的LMP的核酸分子。在其他实施方案中,本发明的核酸分子编码与附录中所示可读框所编码的多肽的氨基酸序列基本同源的全长蛋白质。在一个实施方案中,全长核酸或蛋白质或核酸或蛋白质的片段来自拟南芥、欧洲油菜、大豆、稻或普通小麦。
除了附录中所示的拟南芥、欧洲油菜、大豆、稻或普通小麦LMP核苷酸序列以外,本领域技术人员还应该理解,种群(如拟南芥、欧洲油菜、大豆、稻或普通小麦种群)内可能存在引起LMP氨基酸序列变化的DNA序列多态性。由于天然变异,这些LMP基因中的遗传多态性可存在于种群的个体中。本文使用的术语“基因”和“重组基因”指含有编码LMP(优选拟南芥、欧洲油菜、大豆、稻或普通小麦LMP)的可读框的核酸分子。这些天然变异一般可引起LMP基因的核苷酸序列1-40%的变异。作为天然变异的结果并且不改变LMP功能活性的任一或全部这些核苷酸改变和所导致的LMP中氨基酸多态性都意在包括在本发明的范围内。
可以基于与本文公开的拟南芥、欧洲油菜、大豆、稻或普通小麦LMP核酸的同源性,使用拟南芥、欧洲油菜、大豆、稻或普通小麦cDNA或其部分作为杂交探针,在严格杂交条件下按照标准杂交技术分离对应于本发明拟南芥、欧洲油菜、大豆、稻或普通小麦LMP cDNA的天然变体和非拟南芥、非欧洲油菜、非大豆、非稻或非普通小麦直向同源物的核酸分子。本文使用的术语“直向同源物”指来自不同物种,但由共同的祖先基因由物种形成进化而来的两种核酸。直向同源物一般编码具有相同或相似功能的蛋白质。因此,在另一实施方案中,本发明的分离的核酸分子长度至少为15个核苷酸,并在严格条件下与含有附录中所示核苷酸序列的核酸分子杂交。在其他实施方案中,核酸长度至少为30、50、100、250或更多个核苷酸。本文使用的术语“在严格条件下杂交”旨在描述用于杂交和洗涤的条件,在所述条件下彼此至少60%同源的核苷酸序列保持彼此杂交。优选地,所述条件使彼此至少约65%、更优选至少约70%、甚至更优选至少约75%或更高同源性的序列保持彼此杂交。这些严格条件是本领域技术人员所已知的,并可见于《Current Protocols in Molecular Biology》,John Wiley &Sons,N.Y.,1989:6.3.1-6.3.6。严格杂交条件的优选的非限制性实例为在约45℃在6×氯化钠/柠檬酸钠(SSC)中杂交,其后在50-65℃在0.2×SSC、0.1%SDS中洗涤一次或多次。严格杂交条件的另一优选实例为在65℃在6×SSC中杂交。优选地,在严格杂交条件下与附录中所示序列杂交的本发明的分离的核酸分子对应于天然存在的核酸分子。本文使用的“天然存在的”核酸分子指具有在自然界中存在(如编码天然蛋白质)的核苷酸序列的RNA或DNA分子。在一个实施方案中,核酸编码天然的拟南芥、欧洲油菜、大豆、稻或普通小麦LMP。
除了种群中可能存在的LMP序列的天然存在的变体以外,本领域技术人员还会理解,可以通过在附录中所示核苷酸序列的突变引入变化,从而引起所编码LMP的氨基酸序列的变化而不改变LMP的功能能力。例如,可以在附录中所示序列内产生引起“非必需”氨基酸残基处的氨基酸替换的核苷酸替换。“非必需”氨基酸残基是可以从LMP之一的野生型序列(附录)改变而不改变所述LMP活性的残基,而“必需”氨基酸残基是LMP活性所需要的。然而,其他氨基酸残基(如在具有LMP活性的结构域中不保守或仅半保守的残基)可能对于活性不是必需的,因此可能适于进行改变而不改变LMP活性。
因此,本发明的另一方面涉及编码LMP的核酸分子,所述LMP含有LMP活性非必需的氨基酸残基的改变。这些LMP在氨基酸序列上与序列不同,但仍保持至少一种本文所述的LMP活性。在一个实施方案中,分离的核酸分子含有编码蛋白质的核苷酸序列,其中所述蛋白质含有与附录中所示核酸编码的氨基酸序列至少50%同源的氨基酸序列,并能够参与拟南芥、欧洲油菜、大豆、稻或普通小麦中种子贮藏化合物的产生所必需的化合物或细胞膜的代谢,或者具有一种或多种表3公开的活性。优选地,核酸分子编码的蛋白质与附录中所示核酸编码的序列之一至少约50-60%同源,更优选与附录中所示核酸编码的序列之一至少约60-70%同源,甚至更优选与附录中所示核酸编码的序列之一至少约70-80%、80-90%、90-95%同源,并且最优选与附录中所示核酸编码的序列之一至少约96%、97%、98%或99%同源。
为确定两个氨基酸序列(如附录中所示核酸编码的序列之一及其突变体形式)或两个核酸之间的同源性百分比,以最佳比较的目的将序列进行比对(例如为了与一个蛋白质或核酸的最佳的比对,可以在另一个蛋白质或核酸的序列中引入缺口)。接着比较相应氨基酸位置或核苷酸位置的氨基酸残基或核苷酸。当一个序列(例如附录中所示核酸编码的序列之一)中的位置被与另一序列(例如选自附录中所示核酸编码的多肽的序列的突变体形式)相应位置上相同的氨基酸残基或核苷酸占据时,则两分子在该位置上是同源的(即,本文使用的氨基酸或核酸“同源性”等价于氨基酸或核酸“同一性”)。两序列的同源性百分比是序列间共享的相同位置的数目的函数(即同源性百分比=相同位置的数目/位置总数×100)。
可以通过向附录中所示核苷酸序列中引入一个或多个核苷酸的替换、添加或缺失,并因而向编码的蛋白质中引入一个或多个氨基酸替换、添加或缺失而产生编码与附录中所示核酸编码的蛋白质序列同源的LMP的分离的核酸分子。可以通过标准技术(如位点定向诱变和PCR介导的诱变)向附录中所示序列中引入突变。优选地,在一个或多个预测的非必需氨基酸残基处进行保守性氨基酸替换。“保守性氨基酸替换”是将氨基酸残基用具有相似侧链的氨基酸残基替代的替换。本领域已经定义了具有相似侧链的氨基酸残基家族。这些家族包括具有碱性侧链的氨基酸(例如赖氨酸、精氨酸、组氨酸)、具有酸性侧链的氨基酸(例如天冬氨酸、谷氨酸)、具有不带电荷的极性侧链的氨基酸(例如甘氨酸、天冬酰胺、谷氨酰胺、丝氨酸、苏氨酸、酪氨酸、半胱氨酸)、具有非极性侧链的氨基酸(例如丙氨酸、缬氨酸、亮氨酸、异亮氨酸、脯氨酸、苯丙氨酸、甲硫氨酸、色氨酸)、具有β分支侧链的氨基酸(例如苏氨酸、缬氨酸、异亮氨酸)和具有芳香侧链的氨基酸(例如酪氨酸、苯丙氨酸、色氨酸、组氨酸)。因此,LMP中预测的非必需氨基酸残基优选被来自同一侧链家族的另一氨基酸替代。另外,在另一实施方案中,可以如通过饱和诱变在全部或部分的LMP编码序列中随机引入突变,可以筛选所得突变体的本文所述的LMP活性以鉴定保留LMP活性的突变体。对附录中所示序列之一进行诱变后,可以重组表达编码的蛋白质并可以使用如本文所述的测定(参阅实施例14-15和17-18)来测定蛋白质的活性。
优选通过重组DNA技术产生LMP。例如,将编码蛋白质的核酸分子克隆进表达载体(如上文所述),将表达载体引入宿主细胞(如上文所述)并在宿主细胞中表达LMP。接着可以使用标准蛋白质纯化技术通过适当的纯化方案分离LMP。除了重组表达以外,可以使用标准肽合成技术化学合成LMP或其肽。此外,可以使用如抗LMP抗体从细胞中分离天然LMP,所述抗体可以利用本发明的LMP或其片段通过标准技术产生。
本发明还提供LMP嵌合或融合蛋白。本文使用的LMP“嵌合蛋白”或“融合蛋白”含有与非LMP多肽有效连接的LMP多肽。“LMP多肽”指具有与LMP相对应的氨基酸序列的多肽,而“非LMP多肽”指具有与LMP基本不同源的蛋白质相对应的氨基酸序列的多肽,例如与LMP不同并来自相同或不同生物的蛋白质。就融合蛋白而言,术语“有效连接”旨在表示LMP多肽和非LMP多肽彼此相互融合,使得两个序列都发挥对所使用序列期望的功能。可将非LMP多肽融合在LMP多肽的N端或C端。例如,在一个实施方案中,融合蛋白为GST-LMP(谷胱甘肽S-转移酶)融合蛋白,其中LMP序列与GST序列的C端融合。这样的融合蛋白可方便重组LMP的纯化。在另一实施方案中,融合蛋白是在其N端含有异源信号序列的LMP。在某些宿主细胞(如哺乳动物宿主细胞中),可以通过使用异源信号序列提高LMP的表达和/或分泌。
优选通过标准重组DNA技术产生本发明的LMP嵌合或融合蛋白。例如,根据常规技术将编码不同多肽序列的DNA片段符合读框地连接在一起,例如通过使用平末端或粘末端用于连接、限制酶消化以产生合适的末端、适当补平粘性末端、碱性磷酸酶处理以避免不希望的连接,和酶促连接。在另一实施方案中,可通过常规技术包括自动化DNA合成仪合成融合基因。或者,可使用锚定引物进行基因片段的PCR扩增,这产生两个连续基因片段之间的互补突出端,其可随后退火并再扩增以产生嵌合基因序列(参阅如《Current Protocols in Molecular Biology》,Ausubel等编辑,John Wiley & Sons:1992)。此外,许多已经编码融合部分(例如GST多肽)的表达载体是市售的。可将LMP编码核酸克隆进这样的表达载体从而将融合部分与LMP框内连接。
除了上述编码LMP的核酸分子以外,本发明的另一方面涉及与其反义的分离的核酸分子。“反义”核酸含有与编码蛋白质的“有义”核酸互补的核苷酸序列,如与双链cDNA分子的编码链互补或与mRNA序列互补的核苷酸序列。因此,反义核酸可以通过氢键与有义核酸结合。反义核酸可与完整的LMP编码链互补,或者只与其部分互补。在一个实施方案中,反义核酸分子与编码LMP的核苷酸序列的编码链的“编码区”反义。术语“编码区”指含有翻译成氨基酸残基的密码子的核苷酸序列区(如BnWRI01的完整编码区包括核苷酸1至1245)。在另一实施方案中,反义核酸分子与编码LMP的核苷酸序列的编码链的“非编码区”反义。术语“非编码区”指编码区侧翼的不翻译成氨基酸的5’和3’序列(即也称为5’和3’非翻译区)。
已知编码本文公开的LMP的编码链序列(如附录中公开的序列),可根据Watson和Crick碱基配对原则设计本发明的反义核酸。反义核酸分子可以与LMP mRNA的完整编码区互补,但更优选为只与LMP mRNA编码区或非编码区的一部分反义的寡核苷酸。例如,反义寡核苷酸可以与LMP mRNA翻译起始位点周围的区域互补。反义寡核苷酸的长度可以为例如约5、10、15、20、25、30、35、40、45或50个核苷酸。可以使用本领域已知的方法,利用化学合成和酶连接反应构建本发明的反义或有义核酸。例如,可以使用天然存在的核苷酸或各种修饰的核苷酸化学合成反义核酸(例如反义寡核苷酸),所述修饰的核苷酸设计用于提高分子的生物稳定性或提高反义和有义核酸间形成的双链体的物理稳定性,例如可以使用硫代磷酸酯衍生物和吖啶取代的核苷酸。可以用于产生反义核酸的修饰的核苷酸的实例包括5-氟尿嘧啶、5-溴尿嘧啶、5-氯尿嘧啶、5-碘尿嘧啶、次黄嘌呤、黄嘌呤、4-乙酰胞嘧啶、5-(羧基羟基甲基)尿嘧啶、5-羧基甲基氨基-甲基-2-硫尿苷、5-羧基甲基氨基甲基尿嘧啶、二氢尿嘧啶、β-D-半乳糖基queosine、次黄苷、N-6-异戊烯腺嘌呤、1-甲基鸟嘌呤、1-甲基次黄苷、2,2-二甲基鸟嘌呤、2-甲基腺嘌呤、2-甲基鸟嘌呤、3-甲基胞嘧啶、5-甲基胞嘧啶、N-6-腺嘌呤、7-甲基鸟嘌呤、5-甲基-氨基甲基尿嘧啶、5-甲氧基氨基-甲基-2-硫尿嘧啶、β-D-甘露糖基queosine、5’-甲氧基羧基甲基尿嘧啶、5-甲氧基尿嘧啶、2-甲硫基-N-6-异戊烯腺嘌呤、尿嘧啶-5-羟基乙酸(v)、wybutoxosine、假尿嘧啶、queosine、2-硫代胞嘧啶、5-甲基-2-硫脲嘧啶、2-硫脲嘧啶、4-硫脲嘧啶、5-甲基尿嘧啶、尿嘧啶-5-羟基乙酸甲酯、尿嘧啶-5-羟基乙酸(v)、5-甲基-2-硫脲嘧啶、3-(3-氨基-3-N-2-羧基丙基)尿嘧啶、(acp3)w及2,6-二氨基嘌呤。另外,可以使用表达载体来生物产生反义核酸,在表达载体中已经亚克隆了反义方向的核酸(即从插入的核酸转录产生的RNA将为目的靶核酸的反义方向,下文另有描述)。
在反义技术的另一种变通方案中,可以使用双链干扰RNA构建体引起转基因植物中LMP mRNA水平和LMP活性的下调。这需要用嵌合构建体转化植物,所述嵌合构建体含有有义方向的LMP序列部分与LMP序列相同部分的反义序列的融合。可以使用不同长度的DNA接头区分开构建体中LMP序列的有义和反义片段。
一般对细胞施用或原位产生本发明的反义核酸分子,以使它们与编码LMP的细胞mRNA和/或基因组DNA杂交或结合,从而(如通过抑制转录和/或翻译)抑制蛋白质的表达。可以通过常规核苷酸互补性形成稳定双链体进行杂交,或者在与DNA双链体结合的反义核酸分子的情况下,通过双螺旋大沟中的特异性相互作用进行杂交。可以修饰反义分子以使其与表达于选定的细胞表面的受体或抗原结合,例如通过将反义核酸分子和与细胞表面受体或抗原结合的肽或抗体连接。还可以使用本文所述的载体将反义核酸分子递送到细胞。为得到反义分子足够的胞内浓度,优选将反义核酸分子置于强原核、病毒或真核(包括植物)启动子控制下的载体构建体。
在另一实施方案中,本发明的反义核酸分子为α-端基异构核酸分子。α-端基异构核酸分子与互补RNA形成特异双链杂合体,其中与常见的单位相反,两条链为互相平行(Gautier等,1987,Nucleic Acids Res 15:6625-6641)。反义核酸分子也可以包含2’-O-甲基-核糖核苷酸(Inoue等,1987,Nucleic Acids Res 15:6131-6148)或嵌合RNA-DNA类似物(Inoue等,1987,FEBS Lett 215:327-330)。
在另一实施方案中,本发明反义核酸为核酶。“核酶”是指具有核糖核酸酶活性的催化性RNA分子,它能够切割具有其互补区的单链核酸(如mRNA)。因此,核酶(如Haselhoff和Gerlach,1988,Nature 334:585-591中描述的锤头状核酶)可用于催化性切割LMP mRNA转录物以抑制LMPmRNA的翻译。可以基于本文公开的LMP cDNA的核苷酸序列(例如,附录中的Bn01)或基于在根据本发明教导的方法分离的异源序列来设计对LMP编码核酸具有特异性的核酶。例如,可以构建四膜虫(Tetrahymena)L-19IVS RNA的衍生物,其中活性位点的核苷酸序列与LMP编码mRNA中待切割的核苷酸序列互补(参阅如Cech等,美国专利号4,987,071和5,116,742)。或者,LMP mRNA可以用于从RNA分子库中选出具有特异的核酸酶活性的催化性RNA(参阅如Bartel,和Szostak,J.W.,1993,Science261:1411-1418)。
或者,可以通过靶向与LMP核苷酸序列的调节区(如LMP启动子和/或增强子)互补的核苷酸序列以形成阻止靶细胞中LMP基因转录的三螺旋结构来抑制LMP基因表达(参阅如Helene,1991,Anticancer Drug Des.6:569-84;Helene等,1992,Ann.N.Y.Acad.Sci.660:27-36;和Maher,1992,Bioassays 14:807-15)。
本发明的另一方面涉及含有编码LMP(或其部分)的核酸的载体,优选表达载体。本文使用的术语“载体”是指能够转运其所连接的另一核酸的核酸分子。一种类型的载体是“质粒”,是指可以连接额外DNA区段的环状双链DNA环。另一种类型的载体是病毒载体,其中额外的DNA片段可以被连接进病毒基因组。某些载体能够在其引入的宿主细胞中自主复制(例如具有细菌复制起始点的细菌载体和附加型哺乳动物载体)。其他载体(如非附加型哺乳动物载体)在引入宿主细胞后整合在宿主细胞基因组中,从而随着宿主基因组一起复制。此外,某些载体可以指导与其有效连接的基因的表达。这些载体在本文中称为“表达载体”。通常用于DNA重组技术的表达载体常为质粒形式。由于质粒是最常用的载体形式,本说明书中“质粒”和“载体”可互换使用。然而,本发明意在包括发挥等同功能的其他形式的表达载体,例如病毒载体(如复制缺陷型逆转录病毒、腺病毒和腺伴随病毒)。
本发明的重组表达载体含有适于核酸在宿主细胞中表达的形式的本发明核酸,即重组表达载体含有一个或多个基于用于表达的宿主细胞而选择并与待表达的核酸序列有效连接的调节序列。就重组表达载体而言,“有效连接”指目的核苷酸序列以允许该核苷酸序列表达的方式与调节序列连接,并且两个序列彼此融合以使每个序列都(例如在体外转录/翻译体系中或当载体引入宿主细胞时在宿主细胞中)完成其预计功能。术语“调节序列”旨在包括启动子、增强子以及其他表达控制元件(如多腺苷酸化信号)。这些调节序列描述于例如Goeddel,《Gene Expression Technology:Methods inEnzymology 185》,Academic Press,San Diego,CA(1990)及Gruber和Crosby,《Methods in Plant Molecular Biology and Biotechnology》,Glick和Thompson编辑,第7章,89-108,CRC Press:Boca Raton,Florida(包括其中的参考文献)。调节序列包括指导核苷酸序列在多种类型宿主细胞中组成型表达的序列以及只在某些宿主细胞中或某些条件下指导核苷酸序列表达的序列。本领域技术人员会理解,表达载体的设计取决于以下因素,如待转化宿主细胞的选择、需要的蛋白质的表达水平等。可以将本发明的表达载体引入宿主细胞从而产生本文所述的核酸编码的蛋白质或肽,包括融合蛋白或肽(如LMP、LMP的突变体形式、融合蛋白等)。
可以设计本发明的重组表达载体,以在原核或真核细胞中表达LMP。例如,LMP基因可以在细菌细胞、昆虫细胞(使用杆状病毒表达载体)、酵母和其他真菌细胞(参阅Romanos等,1992,Foreign gene expression inyeast:a review,Yeast 8:423-488;van den Hondel,(1991),《More GeneManipulations in Fungi》,van den Hondel,C.A.M.J.J.等1991,AppliedMolecular Genetics of Fungi,Peberdy,《More Gene Manipulations inFungi》,Bennet & Lasure编辑,396-428页:Academic Press:an Diego和van den Hondel & Punt 1991,Gene transfer systems and vectordevelopment for filamentous fungi,《Applied Molecular Genetics ofFungi》,Peberdy等编辑,1-28页,Cambridge University Press:Cambridge)、藻类(Falciatore等,1999,Marine Biotechnology 1:239-251)、全毛亚纲、缘毛亚纲、旋毛亚纲、吸管亚纲、四膜虫属、草履虫、豆形虫属、瞬目虫(Glaucoma)、匙口虫(Platyophrya)、Potomacus、Pseudocohnilembus、游仆虫(Euplotes)、Engelmaniella和棘尾虫(Stylonychia)类别的纤毛虫,特别是Stylonychia lemnae属使用WO98/01572中所述转化方法和载体表达,在多细胞植物细胞(参阅Schmidt,和Willmitzer,1988,Plant Cell Rep.583-586;《Plant Molecular Biology andBiotechnology》,C Press,Boca Raton,Florida,6/7章,71-119页(1993);White等,Techniques for Gene Transfer,《Transgenic Plants》,第1卷,“Engineering and Utilization”,Kung和R.Wu编辑,Academic Press 1993,128-43;Potrykus,Annu.Rev.Plant Physiol.Plant Molec.Biol.42(1991),205-225(及其中引用的参考文献))或哺乳动物细胞中表达。合适的宿主细胞在Goeddel,《Gene Expression Technology:Methods in Enzymology》185,Academic Press:San Diego,CA(1990)中进一步讨论。或者,可以体外转录和翻译重组表达载体,例如使用T7启动子调节序列和T7聚合酶。
最经常使用含有指导融合或非融合蛋白表达的组成型或诱导型启动子的载体进行原核生物中的蛋白质表达。融合载体在其编码的蛋白质中加入大量氨基酸,所述氨基酸通常加入到重组蛋白的氨基端,但也可以加入到C端或融合进蛋白质的适当区域内。这些融合载体一般用于一种或多种以下目的:1)提高重组蛋白质的表达;2)提高重组蛋白质的溶解度;和3)通过在亲和纯化中发挥配体作用来辅助重组蛋白质的纯化。在融合表达载体中,经常在融合部分和重组蛋白质的结合处引入蛋白水解切割位点,以使在纯化融合蛋白之后可以将重组蛋白质与融合部分分开。这些酶及其同族识别序列包括因子Xa、凝血酶和肠激酶。
典型融合表达载体包括pGEX(Pharmacia Biotech Inc;Smith和Johnson,1988,Gene 67:31-40)、pMAL(New England Biolabs,Beverly,MA)和pRIT5(Pharmacia,Piscataway,NJ),其分别将谷胱甘肽S-转移酶(GST)、麦芽糖-E-结合蛋白和蛋白A融合到靶重组蛋白。在一个实施方案中,将LMP的编码序列克隆进pGEX表达载体以产生编码融合蛋白的载体,所述融合蛋白从N端至C端含有GST-凝血酶切割位点-X蛋白。可以使用谷胱甘肽-琼脂糖树脂通过亲和层析纯化融合蛋白。可以通过用凝血酶切割融合蛋白回收与融合GST的重组LMP。
合适的诱导型非融合蛋白大肠杆菌表达载体的实例包括pTrc(Amann等,1988,Gene 69:301-315)和pET11d(Studier等,《Gene ExpressionTechnology:Methods in Enzymology》185,Academic Press,San Diego,California 60-89)。pTrc载体的靶基因表达依赖于从杂合trp-lac融合启动子的宿主RNA聚合酶转录。pET11d载体表达靶基因依赖于由共表达的病毒RNA聚合酶(T7 gn1)介导的从T7-gn10-lac融合启动子转录。该病毒聚合酶由宿主菌株BL21(DE3)或HMS174(DE3)从定居原噬菌体提供,所述原噬菌体携带lacUV5启动子转录控制下的T7 gn1基因。
使重组蛋白表达最大化的一种策略是在蛋白酶剪切重组蛋白的能力有缺陷的宿主细菌中表达蛋白质(Gottesman,1990,《Gene ExpressionTechnology:Methods in Enzymology》185:119-128,Academic Press,SanDiego,California)。另一策略是改变待插入表达载体的核酸的核酸序列,以使每个氨基酸的个体密码子都是在选择用于表达的细菌中优先使用的(Wada等,1992,Nucleic Acids Res.20:2111-2118)。可以通过标准DNA合成技术实施本发明核酸序列的这些改变。
在另一实施方案中,LMP表达载体为酵母表达载体。用于酿酒酵母中表达的载体实例包括pYepSec1(Baldari等,1987,Embo J.6:229-234)、pMFa(Kurjan & Herskowitz,1982,Cell 30:933-943)、pJRY88(Schultz等,1987,Gene 54:113-123)和pYES2(Invitrogen Corporation,San Diego,CA)。用于构建适用于其他真菌(如丝状真菌)的载体和方法包括van den Hondel& Punt,1991,《Applied Molecular Genetics of Fungi》,Peberdy等编辑,1-28页,Cambridge University Press:Cambridge中详细描述的那些。
或者,可以使用杆状病毒表达载体在昆虫细胞中表达本发明的LMP。可用于在培养的昆虫细胞(如Sf9细胞)中表达蛋白质的杆状病毒载体包括pAc系列(Smith等,1983,Mol.Cell Biol.3:2156-2165)和pVL系列(Lucklow和Summers,1989,Virology 170:31-39)。
在另一实施方案中,使用哺乳动物表达载体在哺乳动物细胞中表达本发明的核酸。哺乳动物表达载体的实例包括pCDM8(Seed,1987,Nature329:840)和pMT2PC(Kaufman等,1987,EMBO J.6:187-195)。在哺乳动物细胞中使用时,经常由病毒调节元件提供表达载体的控制功能。例如,通常使用的启动子来自多瘤、腺病毒2、巨细胞病毒和猿猴病毒40。用于原核和真核细胞的其他合适的表达载体参阅Sambrook,Fritsh和Maniatis,《Molecular Cloning:A Laboratory Manual》第二版,Cold SpringHarbor Laboratory,Cold Spring Harbor Laboratory Press,Cold SpringHarbor,NY,1989的16和17章。
在另一实施方案中,可以在单细胞植物细胞(如藻类,参阅Falciatore等,1999,Marine Biotechnology 1:239-251及其中的参考文献)和来自高等植物(如种子植物,如作物植物)的植物细胞中表达本发明的LMP。植物表达载体的实例包括在Becker等,1992,Plant MoI.Biol.20:1195-1197;Bevan,1984,Nucleic Acids Res.12:8711-8721和Vectors for Gene Transferin Higher Plants;《Transgenic Plants》,第1卷,Engineering andUtilization,Kung和R.Wu编辑,Academic Press,1993,S.15-38中详细描述的那些表达载体。
植物表达盒优选含有能够在植物细胞中驱动基因表达的调节序列,这些调节序列有效连接以使每个序列可以实现其功能,如转录终止,包括多腺苷酸化信号。优选的多腺苷酸化信号为源于根癌农杆菌T-DNA的序列,例如已知为Ti-质粒pTiACH5的章鱼碱合酶的基因3(Gielen等,1984,EMBO J.3:835)或其功能等同物,但是所有其他在植物中有功能活性的终止子也是合适的。
由于植物基因表达常常不仅限于转录水平,因此植物表达盒优选含有其他有效连接的序列,如翻译增强子,例如含有烟草花叶病毒5’-非翻译前导序列的超驱动序列,其提高蛋白质/RNA比率(Gallie等,1987,Nucleic.Acids Res.15:8693-8711)。
植物基因表达必须与当启动子有效连接,所述启动子赋予基因以适时的、细胞或组织特异性的方式表达。优选驱动组成型表达的启动子(Benfey等,1989EMBO J.8:2195-2202),例如来源于植物病毒,如35SCAMV(Franck等,1980,Cell 21 285-294)、19SCaMV(参阅US 5352605和WO 84/02913)的启动子、植物启动子,如U.S 4,962,028中所述的核酮糖二磷酸羧化酶-加氧酶小亚基的启动子。甚至更优选驱动LMP蛋白在种子发育的全部阶段或选定阶段表达的种子特异性启动子。种子特异性植物启动子是本领域普通技术人员所已知的,并使用种子特异性mRNA文库和表达概况分析技术鉴定和表征。种子特异性启动子包括油菜籽的油菜籽蛋白基因启动子(美国专利号5,608,152)、蚕豆的USP启动子(Baeumlein等,1991,Mol Gen Genet,1991,225:459-67)、拟南芥的油质蛋白启动子(WO98/45461)、菜豆的菜豆蛋白启动子(美国专利号5,504,200)、芸苔的Bce4启动子(WO 91/13980)或豆球蛋白B4启动子(LeB4;Baeumlein等,1992,Plant Journal,2:233-9)以及在单子叶植物(如玉米、大麦、普通小麦、黑麦、稻等)中赋予种子特异性表达的启动子。应该提到的合适的启动子为来自大麦的lpt2或lpt1基因启动子(WO 95/15389和WO 95/23230)和WO99/16890中所述的启动子(大麦的大麦醇溶蛋白基因、稻谷蛋白基因、稻水稻素基因、稻谷醇溶蛋白基因、普通小麦醇溶蛋白基因、小麦谷蛋白基因、玉米醇溶蛋白基因、燕麦谷蛋白基因、高梁kasirin基因和黑麦醇溶蛋白基因的启动子)。
还可以通过诱导型启动子促进植物基因表达(综述参阅Gatz 1997,Annu.Rev.Plant Physiol.Plant Mol.Biol.48:89-108)。当需要以时间特异性的方式表达基因时,化学诱导型启动子尤其合适。这些启动子的实例为水杨酸诱导型启动子(WO 95/19443)、四环素诱导型启动子(Gatz等(1992)Plant J.2,397-404)和乙醇诱导型启动子(WO 93/21334)。
应答于生物或非生物胁迫条件的启动子也是合适的启动子,例如病原体可诱导的PRP1基因启动子(Ward等,1993,Plant.Mol.Biol.22361-366)、来自番茄的热可诱导的hsp80启动子(US 5,187,267)、来自马铃薯的冷可诱导的α淀粉酶启动子(WO 96/12814)或创伤可诱导的pinII启动子(EP 375091)。
用于植物基因表达盒的其他优选序列为将基因产物靶向合适的细胞区室所需的靶向序列(综述参阅Kermode,Crit.Rev.Plant Sci.15,4(1996)285-423及其引用的参考文献),所述区室为例如液泡、细胞核、所有类型的质体(如造粉体、叶绿体、色质体)、胞外空间、线粒体、内质网、油粒、过氧化物酶体和植物细胞的其他区室。由于质体是脂类生物合成前体和一些终产物在其中合成的区室,因此特别合适的还有赋予质体特异性基因表达的启动子。合适的启动子为描述于WO 95/16783和WO 97/06250的病毒RNA聚合酶启动子和描述于WO 99/46394的来自拟南芥的clpP启动子。
本发明还提供含有以反义方向克隆进表达载体的本发明DNA分子的重组表达载体。即DNA分子以允许(通过DNA分子的转录)表达与LMPmRNA反义的RNA分子的方式有效连接调节序列。可以选择与反义方向克隆的核酸有效连接的调节序列,其指导反义RNA分子在多种细胞类型中持续表达,如病毒启动子和/或增强子,或者可以选择指导反义RNA的组成型、组织特异性或细胞类型特异性表达的调节序列。反义表达载体可以是重组质粒、噬菌粒或减毒病毒的形式,其中产生的反义核酸处于高效调节区的控制下,可以通过载体所引入的细胞类型来测定所述高效调节区的活性。关于使用反义基因进行基因表达调节的讨论参阅Weintraub等(1986,Antisense RNA as a molecular tool for genetic analysis,Reviews-Trends in Genetics,第1卷)和Mol等(1990,FEBS Lett.268:427-430)。
本发明的另一方面涉及引入了本发明重组表达载体的宿主细胞。术语“宿主细胞”和“重组宿主细胞”在本文中可互换使用。应该理解,这些术语不仅指特定的受试细胞,而且指这些细胞的后代或潜在后代。由于突变或环境影响,在连续世代中可能出现某些修饰,因此事实上这些后代不一定与亲本细胞完全相同,但仍包含在本文使用的该术语的范围内。宿主细胞可以是任何原核或真核细胞。例如,可以在细菌细胞、昆虫细胞、真菌细胞、哺乳动物细胞(如中国仓鼠卵巢细胞(CHO)或COS细胞)、藻类、纤毛虫或植物细胞中表达LMP。其他合适的宿主细胞是本领域技术人员所已知的。
可通过常规转化或转染技术将载体DNA引入原核或真核细胞。本文使用的术语“转化”、“转染”、“缀合”和“转导”旨在表示多种用于向宿主细胞中引入外源核酸(例如DNA)的现有技术,包括磷酸钙共沉淀或氯化钙共沉淀、DEAE-葡聚糖介导的转染、脂质转染法、天然感受态、化学方法介导的转移或电穿孔法。用于转化或转染宿主细胞(包括植物细胞)的适当方法可见于Sambrook等(1989,《Molecular Cloning:A LaboratoryManual.》,第2版,Cold Spring Harbor Laboratory,Cold Spring HarborLaboratory Press,Cold Spring Harbor,NY)以及其他实验室手册如《Methods in Molecular Biology》,1995,第44卷,Agrobacteriumprotocols,Gartland和Davey编辑,Humana Press,Totowa,New Jersey。
就哺乳动物和植物细胞的稳定转染而言,已知取决于使用的表达载体和转染技术,只有少部分细胞可将外源DNA整合进其基因组。为鉴定和选择这些整合体,一般将编码选择性标记(如对抗生素的抗性)的基因与目的基因一起引入宿主细胞。优选的选择性标记包括赋予对药物(如G418、潮霉素、卡那霉素和氨甲喋呤)的抗性或者在植物中赋予对除草剂(如草甘膦或草铵膦(glufosinate))的抗性的选择性标记。编码选择性标记的核酸可以在编码LMP的同一载体上引入宿主细胞,或者可以在分开的载体上引入。可以通过如药物选择(如整合选择性标记基因的细胞存活而其他细胞死亡)来鉴定稳定转染所引入核酸的细胞。
为产生同源重组的微生物,制备含有至少部分LMP基因的载体,其中引入了缺失、添加或替换以改变(如功能性破坏)LMP基因。LMP基因优选为拟南芥、欧洲油菜、大豆、稻或普通小麦LMP基因,但也可以是来自相关植物或甚至来自哺乳动物、酵母或昆虫来源的同源物。在优选的实施方案中,设计载体以通过同源重组功能性破坏内源LMP基因(即不再编码功能性蛋白质,也称为敲除载体)。或者,可以设计载体使得同源重组时突变或以其他方式改变内源LMP基因,但仍编码功能性蛋白质(如可以改变上游调节区,从而改变内源LMP的表达)。为通过同源重组产生点突变,可以在称为嵌合修复术(chimeraplasty)的技术中使用DNA-RNA杂交分子(Cole-Strauss等,1999,Nucleic Acids Res.27:1323-1330和Kmiec,1999,American Scientist 87:240-247)。拟南芥或其他作物中的同源重组方法也是本领域技术人员所熟知的,并考虑在本文中使用。
在同源重组载体中,LMP基因改变的部分的5’和3’末端两侧是LMP的其他核酸,它们允许在载体携带的外源LMP基因和微生物或植物中的内源LMP基因之间发生同源重组。其他侧翼LMP核酸的长度足以与内源基因成功地进行同源重组。一般地,载体内包含数百碱基对至数千碱基对的侧翼DNA(5’和3’末端)(同源重组载体的描述参阅如Thomas & Capecchi,1987,Cell 51:503)。(例如通过聚乙二醇介导的DNA)将载体引入微生物或植物细胞。使用本领域已知的技术选择其中引入的LMP基因与内源LMP基因已同源重组的细胞。
在另一实施方案中,可以产生含有所选择系统的重组微生物,所述所选择的系统允许所引入基因的受控表达。例如,包含将LMP基因置于载体上lac操纵子控制下允许LMP基因只在IPTG存在下表达。这些调节系统是本领域所熟知的。
可以使用本发明的宿主细胞(如培养物中的原核或真核细胞)产生(如表达)LMP。因此,本发明还提供了使用本发明宿主细胞产生LMP的方法。在一个实施方案中,方法包括在合适的培养基中培养(引入了编码LMP的重组表达载体或基因组中含有野生型或改变的LMP基因的)本发明的宿主细胞直至产生LMP。在另一实施方案中,方法还包括从培养基或宿主细胞中分离LMP。
本发明的另一方面涉及分离的LMP及其生物活性部分。“分离的”或“纯化的”蛋白质或其生物活性部分在通过重组DNA技术产生时基本不含细胞物质,或在化学合成时基本不含化学前体或其他化学物质。“基本不含细胞物质”一语包括LMP制备物,其中蛋白质从其天然或重组产生的细胞的细胞组分中分离。在一个实施方案中,“基本不含细胞物质”一语包括含有低于约30%(按干重计)非LMP(也称为“污染蛋白质”),更优选低于约20%的非LMP、更优选低于约10%的非LMP,最优选低于约5%的非LMP的LMP制备物。重组产生LMP或其生物活性部分时,还优选基本不含有培养基,即培养基小于蛋白质制备物总体积的约20%、更优选小于约10%并最优选小于约5%。术语“基本不含有化学前体或其他化学物质”包括LMP制剂,其中蛋白质从蛋白质合成中相关的化学前体或其他化学物质中分离。在一个实施方案中,术语“基本不含有化学前体或其他化学物质”包括含有低于约30%(按干重计)的化学前体或非LMP化学物质,优选低于约20%的化学前体或非LMP化学物质、更优选低于约10%的化学前体或LMP化学物质,最优选低于约5%的化学前体或非LMP化学物质的制备物。在优选的实施方案中,分离的蛋白质或其生物活性部分中没有来源于产生LMP的同一生物的污染蛋白质。一般通过在除拟南芥、欧洲油菜、大豆、稻或普通小麦的其他植物或微生物、藻类或真菌中重组表达例如拟南芥、欧洲油菜、大豆、稻或普通小麦LMP来产生这些蛋白质。
本发明的分离的LMP或其部分能参与在拟南芥、欧洲油菜、大豆、稻或普通小麦中产生种子贮藏化合物所必需的化合物的代谢或细胞膜的代谢,或者具有表3公开的一种或多种活性。在优选的实施方案中,蛋白质或其部分含有与附录中所示核酸编码的氨基酸序列足够同源的氨基酸序列,以使蛋白质或其部分保持参与拟南芥、欧洲油菜、大豆、稻或普通小麦中细胞膜构建所必需化合物的代谢的能力或参与分子跨这些膜转运的能力。蛋白质的部分优选为本文所述的生物活性部分。在优选的实施方案中,本发明的LMP具有附录中所示核酸所编码的氨基酸序列。在另一优选的实施方案中,LMP具有与附录中所示核苷酸序列杂交(如在严格条件下杂交)的核苷酸序列所编码的氨基酸序列。在另一优选的实施方案中,LMP具有与附录中所示核酸编码的氨基酸序列至少约50-60%、优选至少约60-70%、更优选至少约70-80%、80-90%、90-95%并甚至更优选至少约96%、97%、98%、99%或更高同源性的氨基酸序列。本发明的优选LMP还优选具有至少一种本文所述的LMP活性。例如,本发明的优选LMP包含与附录中所示核苷酸序列杂交(如在严格条件下杂交)的核苷酸序列所编码的氨基酸序列并且其参与拟南芥、欧洲油菜、大豆、稻或普通小麦中细胞膜构建所必需化合物的代谢或参与分子跨越这些膜的转运或具有表3公开的一种或多种活性。
在其他实施方案中,LMP与附录中所示核酸编码的氨基酸序列基本同源并保留附录中所示核酸编码的序列之一的蛋白质的功能活性,但由于上文详细描述的天然变异或诱变而在氨基酸序列上存在差异。因此,在另一实施方案中,LMP是含有与完整氨基酸序列至少约50-60%、优选至少约60-70%、更优选至少约70-80%、80-90%、90-95%并甚至更优选至少约96%、97%、98%、99%同源的氨基酸序列,并具有本文所述的至少一种LMP活性的蛋白质。在另一实施方案中,本发明涉及与附录中所示核酸编码的完整氨基酸序列基本同源的完全的拟南芥、欧洲油菜、大豆、稻或普通小麦蛋白质。
可以使用显性失活突变或反式显性抑制降低转基因种子中LMP的活性,以改变种子贮藏化合物的水平。为实现该目的,产生使LMP失去活性的突变,并在转基因植物中过表达失活的无功能LMP基因。失活的反式显性LMP蛋白与活性内源LMP蛋白竞争底物或与其他蛋白质的相互作用并稀释活性LMP的活性。以这种方式可以不实际修饰内源LMP基因的表达而降低LMP的生物活性。Pontier等使用这一策略调节植物转录因子的活性(Pontier等,Plant J 2001 27(6):529-38)。
可以通过诱变(如离散点突变)或截短LMP来产生LMP的同源物。本文使用的术语“同源物”指发挥LMP活性的激动剂或拮抗剂作用的LMP变体形式。LMP的激动剂可以保留与LMP基本相同的生物活性或部分活性。LMP的拮抗剂可以抑制天然存在形式的LMP的一种或多种活性,例如通过竞争性结合细胞膜组分代谢级联的下游或上游成员(包括LMP),或者通过结合介导化合物穿过这些膜转运的LMP实现所述抑制,从而防止转运发生。
在备选实施方案中,可以通过筛选LMP突变体(如截短突变体)组合文库的LMP激动剂或拮抗剂活性来鉴定LMP同源物。在一个实施方案中,LMP变体的多变文库(variegated library)通过核酸水平的组合诱变产生,并由多变基因文库编码。LMP变体的多变文库的产生可以通过例如将合成的寡核苷酸混合物酶促连接进基因序列从而使潜在LMP序列的简并集可作为单个多肽表达,或另外作为含有LMP序列集的较大的融合蛋白表达(例如噬菌体展示)。可以使用多种方法从简并寡核苷酸序列产生潜在LMP同源物的文库。可以在自动DNA合成仪中进行简并基因序列的化学合成,然后将合成的基因连接进合适的表达载体。使用基因的简并集允许在一个混合物中提供编码需要的潜在LMP序列集的全部序列。合成简并寡核苷酸的方法为本领域技术人员所已知(参阅如Narang,1983,Tetrahedron 39:3;Itakura等,1984,Annu.Rev.Biochem.53:323;Itakura等,1984,Science198:1056;Ike等,1983,Nucleic Acid Res.11:477)。
此外,LMP编码序列片段的文库可用于产生LMP片段的多变群体,用于LMP同源物的筛选及其后的选择。在一个实施方案中,可以如下产生编码序列片段的文库:在每个分子只出现约一个切口的条件下用核酸酶处理LMP编码序列的双链PCR片段,变性双链DNA,复性DNA形成可包括来自不同切口产物的有义/反义对的双链DNA,通过用S1核酸酶处理从再形成的双链体中去除单链部分,并将得到的片段文库连接进表达载体。通过这种方法,可以产生编码LMP的N端、C端和多种大小的内部片段的表达文库。
用于筛选点突变或截短产生的组合文库的基因产物以及从DNA文库筛选具有所选特性的基因产物的几种技术为本领域所已知。这些技术适于快速筛选通过LMP同源物的组合诱变产生的基因文库。用于筛选大基因文库的适于高通量分析的最广泛使用的技术一般包括将基因文库克隆进可复制的表达载体,用得到的载体文库转化合适的细胞,并在一定条件下表达组合基因,在所述条件下所需活性的检测便于分离编码所检测产物的基因的载体。一种用于提高文库中功能突变体频率的技术——循环总体诱变(Recursive ensemble mutagenesis,REM)可以与筛选测定法组合使用以鉴定LMP同源物(Arkin & Yourvan,1992,Proc.Natl.Acad.Sci.USA89:7811-7815;Delgrave et al.,1993,Protein Engineering 6:327-331)。在另一实施方案中,可以使用本领域公知的方法开发基于细胞的测定法以分析多变LMP文库。
可以在一种或多种以下方法中使用本文公开的核酸分子、蛋白质、蛋白质同源物、融合蛋白、引物、载体和宿主细胞:拟南芥、欧洲油菜、大豆、稻或普通小麦以及相关生物的鉴定;拟南芥、欧洲油菜、大豆、稻或普通小麦相关生物的基因组作图;拟南芥、欧洲油菜、大豆、稻或普通小麦目的序列的鉴定和定位;进化研究;功能所需LMP区域的确定;LMP活性的调节;一种或多种细胞功能代谢的调节;一种或多种化合物跨膜转运的调节;种子贮藏化合物累积的调节;植物器官数目和/大小的调节;种子大小、数目或重量的调节;根长度的调节和叶大小的调节。
拟南芥植物代表高等(或种子)植物的一个成员。它与需要光来驱动光合作用和生长的其他植物如欧洲油菜、大豆、稻和普通小麦相关。如拟南芥、欧洲油菜、大豆、稻或普通小麦等植物在DNA序列和多肽水平共享高度同源性,这允许使用来自其他植物或生物的探针异源筛选DNA分子,从而使得可以衍生适于异源筛选或在第三个物种中功能注释和预测基因功能的共有序列。因此鉴定这些功能的能力可具有显著的关联性,如预测酶的底物特异性。另外,这些核酸分子可作为拟南芥基因组或相关生物基因组作图的参考点。
本发明的LMP核酸分子具有多种用途。首先,本发明的核酸和蛋白质分子可作为基因组特定区域的标记物。这不仅可用于基因组作图,还可用于拟南芥、欧洲油菜、大豆、稻或普通小麦蛋白质的功能研究。例如,为鉴定特定拟南芥、欧洲油菜、大豆、稻或普通小麦DNA结合蛋白结合的基因组区域,可以消化拟南芥、欧洲油菜、大豆、稻或普通小麦基因组并将片段与DNA结合蛋白温育。可以用本发明的核酸分子(优选用容易检测的标记)另外检测与蛋白质结合的片段,这种核酸分子与基因组片段的结合使得可以将片段定位到拟南芥、欧洲油菜、大豆、稻或普通小麦的基因组图上,并且在用不同的酶进行多次时,便于快速确定蛋白质结合的核酸序列。另外,本发明的核酸分子可以与相关物种的序列足够同源,以使这些核酸分子可以作为标记用于构建相关植物的基因组图。
本发明的LMP核酸分子还可用于进化和蛋白质结构研究。本发明分子参与的代谢和转运过程被多种原核和真核细胞利用;通过将本发明核酸分子的序列与编码来自其他生物的类似酶的序列进行比较,可以评估生物的进化亲缘关系。同样,这种比较可以评估序列中哪些区域是保守的而哪些则不是,这可以辅助确定酶功能所必需的蛋白质区域。这种确定在蛋白质工程研究中是有价值的,并可以指示就诱变而言蛋白质可以耐受什么而不丧失功能。
对本发明的LMP核酸分子的操作可以导致产生与野生型LMP具有功能性差异的LMP。这些蛋白质可能提高了效率或活性、可能以多于通常情况的数目存在于细胞中或者可以降低了效率或活性。
存在多种机制,通过所述机制,改变本发明的LMP可以直接影响种子贮藏化合物的累积和/或组成。对于表达LMP的植物的情况,转运的提高可以引起植物组织和器官内改变的化合物累积和/或溶质分配,最终可用于影响种子发育中一种或多种种子贮藏化合物的累积。Mitsukawa等(1997,Proc.Natl.Acad.Sci.USA 94:7098-7102)提供了实例,其中在烟草培养细胞中过表达拟南芥高亲和力磷酸盐转运蛋白基因增强了磷酸盐受限情况下的细胞生长。磷酸盐可用性还显著影响糖和代谢中间体的产生(Hurry等,2000,Plant J.24:383-396)以及叶和根中的脂类组成(
Figure A200580026790D0043080152QIETU
等,2000,Proc.Natl.Acad.Sci.USA 97:10649-10654)。同样,已经证明植物ACCase活性受磷酸化的调节(Savage & Ohlrogge,1999,Plant J.18:521-527),并且作用于ACCase的激酶和磷酸酶(LMP)活性的改变可引起种子脂类累积水平的提高或降低。此外,叶绿体被膜中存在脂类激酶活性提示被膜中存在信号转导途径和/或膜蛋白调节(参阅如Müiller等,2000,J.Biol.Chem.275:19475-19481及其引用的文献)。ABI1和ABI2基因编码两种蛋白质丝氨酸/苏氨酸磷酸酶2C,它们是脱落酸信号途径中的调节子,因而是早期和晚期种子发育中的调节子(如Merlot等,2001,Plant J.25:295-303)。
本发明还提供与本文公开的核酸所编码或本文所述的LMP多肽或其片段特异性结合的抗体。可以通过多种熟知的方法(参阅如Harlow和Lane,"Antibodies;A Laboratory Manual"Cold Spring Harbor Laboratory,Cold Spring Harbor,New York,1988)制备抗体。简言之,可以用足以引发免疫应答的量和时间间隔将纯化的抗原注射进动物中。可以直接纯化抗体,或者可以从动物获得脾细胞。接着将细胞与永生化细胞系融合并筛选抗体分泌。抗体可用于筛选核酸克隆文库中分泌抗原的细胞。接着可以对阳性克隆测序(参阅如Kelly等1992,Bio/Technology 10:163-167;Bebbington等,1992,·Bio/Technology 10:169-175)。
与多肽“选择性结合”一语指结合反应,其确定由蛋白质和其他生物产品的异源群体中所述蛋白质的存在。因此,在指定的免疫测定条件下,与特定蛋白质结合的指定抗体不以显著的量与样品中存在的其他蛋白质结合。在这种条件下与抗体的选择性结合可以需要选择具有对特定蛋白质的特异性的抗体。可以使用多种形式的免疫测定来选择与特定蛋白质选择性结合的抗体。例如,通常使用固相ELISA免疫测定来选择与蛋白质选择性免疫相互作用的抗体。关于可用于测定选择性结合的免疫测定形式和条件的描述,参阅Harlow和Lane."Antibodies,A Laboratory Manual"ColdSpring Harbor Publications,New York(1988)。在一些条件下,需要制备来自多种宿主的单克隆抗体。用于制备这些单克隆抗体的技术的描述可见于Stites等编辑,"Basic and Clinical Immunology,"(Lange MedicalPublications,Los Altos,Calif,第四版)及其引用的参考文献和Harlow和Lane("Antibodies,A Laboratory Manual"Cold Spring HarborPublications,New York,1988)。
在此申请中引用了多种出版物。所有这些出版物的公开内容以及这些出版物中引用的参考文献都以其整体引入本申请作为参考,以更完全的描述本发明所述技术领域的现状。
对本领域技术人员显而易见的是,可以在不背离本发明的范围或精神的情况下,在本发明中做出多种修饰和改变。考虑本文公开的本发明的说明书和实践之后,本发明的其他实施方案对本领域技术人员而言是显而易见的。说明书和实施例旨在仅用于示例,本发明的真正范围和精神由本文包含的权利要求指出。
实施例
实施例1
一般方法
a)一般克隆方法:
如Sambrook等(1989,Cold Spring Harbor Laboratory Press:ISBN0-87969-309-6)或Kaiser,Michaelis和Mitchell(1994,"Methods in YeastGenetics,"Cold Spring Harbor Laboratory Press:ISBN 0-87969-451-3中所述实施克隆方法,如限制性切割、琼脂糖电泳、DNA片段纯化、转移核酸至硝酸纤维素和尼龙膜、连接DNA片段、转化大肠杆菌和酵母细胞、培养细菌和重组DNA的序列分析。
b)化学品:
除非文中另有说明,p.a.质量的化学品来自Fluka(Neu-Ulm)、Merck(Darmstadt)、Roth(Karlsruhe)、Serva(Heidelberg)和Sigma(Deisenhofen)公司。使用来自Milli-Q水系统净水装置(Millipore,Eschborn)的纯化的、无致热原水(在下文中称为H2O)制备溶液。限制性内切核酸酶、DNA修饰酶和分子生物学试剂盒得自AGS(Heidelberg)、Amersham(Braunschweig)、Biometra(
Figure A200580026790D0045080808QIETU
)、Boehringer(Mannheim)、Genomed(Bad Oeynnhausen)、New England Biolabs(Schwalbach/Taunus)、Novagen(Madison,Wisconsin,USA)、Perkin-Elmer(Weiterstadt)、Pharmacia(Freiburg)、Qiagen(Hilden)和Stratagene(Amsterdam,Netherlands)公司。除非另有说明,否则均按照生产商的说明使用。
c)植物材料和培养:
拟南芥植物
为进行此研究,使用拟南芥的野生型和突变型植物的根材料、叶、长角果和种子。如所述从Columbia生态型的甲磺酸乙酯诱变的种群中分离wri1突变体(Benning等1998,Plant Physiol.118:91-101)。在4℃将野生型和wri1拟南芥种子在黑暗中预温育3天,之后将其置于60-80μmol m-2s-1光子通量密度和16小时(22℃)光照期和8小时(18℃)黑暗期的培养箱(AR-75,Percival Scientific,Boone,IA)中。在半浓度MS培养基(Murashige& Skoog,1962,Physiol.Plant.15,473-497),pH6.2,2%蔗糖和1.2%琼脂上起始所有植物。在20%漂白剂、0.5% triton X-100中灭菌20分钟并用过量的无菌水洗涤6次。如上述培养植物或如Focks & Benning(1998,PlantPhysiol.118:91-101)中所述在标准条件下在土壤中培养植物。
欧洲油菜
此研究中使用欧洲油菜AC Excel和Cresor品种产生cDNA文库。从黑暗处理、盐处理、热处理和干旱处理的植物收集种子、种荚、花、叶和根组织。然而,此研究着眼于将种子和种荚用于cDNA文库。标记植物以在以下两个时间点收获种植后60-75天收集的种子:开花后1-15天和15-25天。在71℉、14小时光周期下在Metromix(Scotts,Marysville,OH)中培养植物。在此研究中收集6个目的种子及种荚以产生以下cDNA文库:未成熟种子、成熟种子、未成熟种荚、成熟种荚、夜间收获的种荚和Cresor品种(高芥子酸)种子。在指定的时间点收集每种发育组织的组织样品,合并一个时帧内的多个样品用于最终提取总RNA。在开花后1-25天(daa)取得未成熟种子样品。在25-50daa之间取得成熟种子样品、在1-15daa取得未成熟种荚样品,在15-50daa之间取得成熟种荚样品,在1-50daa之间取得夜间收获的种荚样品,在5-25daa之间取得Cresor种子。
大豆
此研究中使用大豆cv.Resnick产生cDNA文库。从黑暗处理、盐处理、热处理和干旱处理的植物收集种子、种荚、花、叶、茎和根组织。在一些情况下植物还被线虫感染。然而,此研究主要着眼于将种子和种荚组织用于cDNA文库。标记植物以在开花后设定的天数:5-15、15-25、25-35和33-50天收获种子。
此研究中使用稻Japonica cv.Nippon-barre亚种产生cDNA文库。从黑暗处理、盐处理、热处理和干旱处理的植物收集种子、种荚、花、叶、茎和根组织。此研究着眼于将种子胚组织用于cDNA文库。由于胚乳组织可以干扰RNA提取,因此分别收集胚和胚乳。在温室中在14小时光周期下以85℉在Wisconsin土(含高有机物质)上培养植物。从发育种子中切下稻胚。
普通小麦
此研究中使用稻cv.Galeon亚种产生cDNA文库。从黑暗处理、盐处理、热处理和干旱处理的植物收集种子、花、果实、叶、茎和根组织。以光照期72℉、黑暗期65℉的12小时光周期在温室中的metromix上培养植物。
实施例2
从植物中分离总DNA
分离总DNA的细节涉及1克鲜重植物材料的详细研究。
CTAB缓冲液:2%(重量/体积)溴化N-十六烷基-N,N,N-三甲基铵(CTAB)、100mM Tris HCl pH8.0、1.4M NaCl、20mM EDTA。N-十二烷基肌氨酸缓冲液:10%(重量/体积)N-十二烷基肌氨酸、100mM Tris HClpH8.0、20mM EDTA。
在研钵中的液氮中研磨植物材料以得到细粉并转移到2ml Eppendorf容器中。用一层1ml的分解缓冲液(1ml CTAB缓冲液、100μl N-十二烷基肌氨酸缓冲液、20μl β-巯基乙醇和10μl蛋白酶K溶液,10mg/ml)覆盖冰冻植物材料并在60℃持续摇动下温育1小时。将得到的匀浆分配到两个Eppendorf容器(2ml)中并用同样体积的氯仿/异戊醇(24:1)摇动萃取两次。为使相分开,每次在室温下以8000g离心15分钟。接着使用冰预冷的异丙醇在-70℃沉淀DNA 30分钟。4℃下以10000g使沉淀的DNA沉积30分钟并重悬于180μl TE缓冲液中(Sambrook等,1989,Cold Spring HarborLaboratory Press:ISBN 0-87969-309-6)。为进一步纯化,用NaCl(1.2M终浓度)处理DNA并使用两倍体积的无水乙醇在-70℃再次沉淀30分钟。在使用70%乙醇的洗涤步骤之后,干燥DNA并用50μl H2O+RN Ase(50mg/ml终浓度)吸收。4℃过夜使DNA溶解并接着在37℃进行RNAse消化1小时。DNA储存于4℃。
实施例3
从植物中分离总RNA和聚腺苷酸+RNA。
拟南芥
为研究转录物,分离了总RNA和聚腺苷酸+RNA。按照以下步骤从拟南芥植物的长角果中分离RNA:
从拟南芥种子制备RNA——“热”提取:
1.缓冲液、酶和溶液
-2M KCI
-蛋白酶K
-苯酚(用于RNA)
-氯仿:异戊醇(氯仿:异戊醇1:1,调整pH用于RNA)
-4M LiCl,经DEPC处理
-经DEPC处理的水
-3M NaOAc、pH5,经DEPC处理的
-异丙醇
-70%乙醇(用经DEPC处理的水配制)
-重悬缓冲液:0.5% SDS、10mM Tris pH7.5、1mM EDTA,用经DEPC处理的水配制(因为此溶液不能用DEPC处理)
-提取缓冲液:
0.2M硼酸钠
30mM EDTA
30mM EGTA
1% SDS(250μl 10% SDS溶液用于配制2.5ml缓冲液)
1%脱氧胆酸(25mg用于2.5ml缓冲液)
2% PVPP(不溶,50mg用于2.5ml缓冲液)
2% PVP 40K(50mg用于2.5ml缓冲液)
10mM DTT
100mM β-巯基乙醇(现配制,在通风橱中操作,35μl 14.3M溶液用于5ml缓冲液)
2.提取
将提取缓冲液加热至80℃。在用液氮冷却的研钵中磨碎组织,将组织粉末转移到1.5ml管。由于组织在加入缓冲液前都应保持冰冻,因此用预冷的刮勺转移样品,并将管总是保持在液氮中。接着在管中加入350μl预热的提取缓冲液(用于100mg组织,对于较大的样品,缓冲液体积可多至500μl)、涡旋、加热至80℃约1分钟并接着置于冰上。涡旋样品,接着用电子研钵再研磨。
3.消化
加入蛋白酶K(0.15mg/100mg组织)。接着涡旋样品并置于37℃1小时。
第一次纯化
首先加入27μl 2M KCl,接着在冰上使样品冷却10分钟。接着室温下以12000转/分钟(rpm)离心样品10分钟,将上清液转移到新的无RNA酶的管中。进行一次酚萃取,其后是氯仿:异戊醇萃取。在上清液中加入1倍体积的异丙醇,将混合物在冰上冷却10分钟。离心(室温,7000rpm10分钟)沉淀RNA。涡旋10至15分钟使RNA沉淀溶解于1ml 4M LiCl中,接着离心5分钟沉淀RNA。
第二次纯化
将沉淀重悬于500μl重悬缓冲液。接着加入500μl苯酚,涡旋样品。接着加入250μl氯仿:异戊醇,涡旋样品并离心5分钟。将上清液转移到新管,重复进行氯仿:异戊醇萃取直至界面清晰。将上清液转移到新管,加入1/10体积的3M NaOAc,pH5和600μl异丙醇。将样品置于-20℃ 20分钟或更长。离心10分钟沉淀RNA。用70%乙醇洗涤沉淀一次。去除所有剩余的乙醇,再将沉淀溶于10至20μl经DEPC处理的水。通过测量1:200稀释液在260nm和280nm的吸光度确定数量和质量。40μg RNA/ml=1OD260。
如所述从拟南芥的野生型和wri1突变体分离RNA(Hosein,2001,PlantMol.Biol.Rep.,19:65a-65e;Ruuska等,2002,Plant Cell,14:1191-1206)。使用利用寡脱氧胸苷酸-纤维素柱的Amersham Pharmacia Biotech mRNA纯化试剂盒从总RNA制备mRNA。
按照生产商的说明使用Dyna 
Figure A200580026790D00501
(Dynal,Oslo,Norway)分离聚腺苷酸+RNA。测定RNA或聚腺苷酸+RNA的浓度之后,加入1/10体积的3M乙酸钠pH4.6和2倍体积的乙醇来沉淀RNA并将其保存于-70℃。
欧洲油菜、大豆、稻和普通小麦
从荚中分离欧洲油菜和大豆种子,以产生用于种子和种荚cDNA文库的同质材料。使用研钵和研杵在液氮中将组织研磨成细粉并转移到50ml管。将组织样品保存于-80℃至进行提取。
对于稻的情况,通过解剖分离5K-10K胚和胚乳。解剖过程中将组织置于冰上的小管或培养皿中。将容器置于干冰上,接着保存于-80℃。
对于普通小麦的情况,在20"x 12"平板中的metromix中以2"深度种植Galeon普通小麦种子的种子萌发样品。用水浸透土壤,其后每天浇水两次。接着3-4天后,当胚芽鞘(coleopiles)约为1cm时,用水洗涤苗并吸干。为产生花cDNA文库,每隔一天从叶鞘收集头状花序出现率为30%、60%和100%的相等数目的头状花序。花药尚未显现。为产生种子组织cDNA文库,籽粒为水熟期或乳熟期(取决于籽粒在头状花序中的位置),对于较晚的种子发育阶段,仅收获种子头状花序。对于根文库,仅收获根。植物具有一个主茎和三个强分蘖。在盆中培养植物,洗去培养基并保存此样品的根。植物未经处理。
按照生产商的方案使用RNeasy Maxi试剂盒(Qiagen)从组织中提取总RNA,使用Oligotex mRNA Purification System试剂盒(Qiagen)(也按照生产商的说明)从总RNA处理mRNA。接着将mRNA送至HyseqPharmaceuticals Incorporated(Sunnyville,CA)以将每种组织类型的mRNA进一步加工成cDNA文库并用于其专有方法,其中基于杂交模式将质粒中类似的插入片段聚类。
实施例4
cDNA文库构建
就cDNA文库构建而言,使用鼠白血病病毒逆转录酶(Roche,Mannheim,Germany)和寡脱氧腺苷酸引物实现第一链的合成,通过与在12℃与DNA聚合酶I温育(2小时)、16℃与Klonow酶温育(1小时)和22℃用RNA酶H消化(1小时)实现第二链的合成。通过在65℃温育(10分钟)终止反应,接着转移到冰上。在37℃通过T4-DNA-聚合酶(Roche,Mannheim)切平双链DNA分子(30分钟)。通过酚/氯仿萃取和SephadexG50自旋柱除去核苷酸。通过T4-DNA-连接酶(Roche,12℃,过夜)将EcoRI接头(Pharmacia,Freiburg,Germany)与cDNA末端连接,通过与多核苷酸激酶温育(Roche,37℃,30分钟)磷酸化。将此混合物在低熔点琼脂糖凝胶上分离。从凝胶上洗脱大于300碱基对的DNA分子,酚萃取、在Elutip-D-柱(Schleicher and Schuell,Dassel,Germany)上浓缩,与载体臂连接并按照生产商的说明使用生产商提供的材料用Gigapack Gold试剂盒(Stratagene,Amsterdam,Netherlands)包装进入λ ZAP II噬菌体或λ ZAP-Express噬菌体。
在Hyseq Pharmaceuticals Incorporated(Sunnyville,CA)产生欧洲油菜、大豆、稻和普通小麦cDNA文库。文库产生中未使用扩增步骤,以保留表达信息。Hyseq的基因组方法涉及将基因聚类,并对每个类的代表性成员测序。从寡脱氧腺苷酸柱纯化的mRNA产生cDNA文库。随机挑取cDNA文库转化进大肠杆菌得到的菌落,通过PCR扩增cDNA插入片段并印迹到尼龙膜上。用一组33P放射性标记的寡核苷酸与克隆杂交,得到的杂交模式决定具体的克隆属于哪个类。获得cDNA克隆及其DNA序列以用于在转基因植物中过表达以及本文所述的其他分子生物学方法。
实施例5
鉴定WRI1样的目的LMP基因
拟南芥wri1突变体
wri1拟南芥突变体用于鉴定LMP编码基因。wri1突变体特征在于种子贮藏脂类减少80%(Focks & Benning,1998,Plant Physiol.118:91-101)。已经克隆并描述了WRI1基因(Benning & Cernac,2002,WO 02/072775A2)。
欧洲油菜、大豆、稻和普通小麦
此实施例展示如何鉴定和分离编码欧洲油菜、大豆、稻和普通小麦WRI1样多肽的cDNA克隆。
为鉴定WRI1样基因,使用BLAST软件(Basic Local Alignment SearchTool,Altschul等,1990,J.MoI.Biol.215:403-410)进行相似性分析。使用TBLASTN算法,用拟南芥WRI1多肽的氨基酸序列作为查询序列来搜索并比对来自欧洲油菜、大豆、稻和普通小麦的翻译全部6个阅读框的DNA数据库。这种专有数据库的相似性分析可引起鉴定多种EST和cDNA重叠群。
使用得自Hyseq聚类方法的RNA表达概况数据确定器官特异性。选择与其他组织文库相比在种子文库中显示较高表达的克隆作为LMP候选基因。基于表达概况选择欧洲油菜、大豆、稻和普通小麦克隆用于在拟南芥中过表达。
实施例6
全长cDNA的克隆和已鉴定的LMP基因的直向同源物。
已经在专有数据库中鉴定了与来自拟南芥、欧洲油菜、大豆、稻和普通小麦的全长序列和部分cDNA对应的克隆。使用ABI 377板凝胶测序仪和BigDye Terminator Ready Reaction试剂盒(PE Biosystems,Foster City,CA)测序克隆。进行序列比对以确定克隆是全长还是部分克隆。对于克隆鉴定为部分cDNA的情况,使用以下方法分离全长序列。使用来自Clontech的SMART RACE cDNA扩增试剂盒通过RACE PCR分离全长cDNA,所述试剂盒允许cDNA末端的5’和3’快速扩增(RACE)。基于克隆序列设计RACE PCR引物。全长cDNA的分离和使用的RACE PCR方案基于生产商的条件。按照生产商的说明用QIAquick Gel Extraction试剂盒(Qiagen)从琼脂糖凝胶中提取RACE产物片段并连接进TOPO pCR 2.1载体(Invitrogen)。使用标准条件(Sambrook等,1989)将重组载体转化进TOP10细胞(Invitrogen)。在含有50μg/ml卡那霉素的LB琼脂上37℃下过夜培养转化的细胞,并涂布40μl 40mg/ml二甲基甲酰胺中的X-gal储备溶液进行蓝白斑选择。选择单个白色菌落并用于接种3ml含有50μg/ml卡那霉素的液体LB,37℃培养过夜。按照生产商的说明使用QIAprep Spin Miniprep试剂盒(Qiagen)提取质粒DNA。接着按照标准分子生物学技术(Sambrook等,1989)进行克隆的随后分析和限制性作图。
使用以下方法分离全长cDNA并克隆进双元载体:使用得自克隆或其后RACE扩增产物的全长序列设计基因特异性引物。利用克隆或cDNA文库作为DNA模板,使用递降PCR扩增全长序列和基因。在一些情况下,设计引物以在紧靠基因起始密码子上游加入“AACA”Kozak样序列,并在一些情况下将下游两个碱基变成GC以便于提高基因表达水平(Chandrashekhar等,1997,Plant Molecular Biology 35:993-1001)。PCR反应循环为:94℃ 5分钟;94℃ 1分钟、65℃ 1分钟、72℃ 4分钟的9个循环,其中每个循环的退火温度降低1℃;94℃ 1分钟、55℃ 1分钟、72℃ 4分钟的20个循环;PCR循环以72℃ 10分钟结束。使用GenElute-EtBr自旋柱(Sigma)从1%琼脂糖凝胶中凝胶纯化扩增的PCR产物,并在标准酶消化后连接进植物双元载体pBPS-GB1用于拟南芥转化。通过在LB和适当的抗生素中过夜培养大肠杆菌DH5来扩增双元载体,使用QiagenMiniPrep DNA制备试剂盒制备质粒用于下游步骤。在多个克隆步骤全程中均通过限制性消化测定其大小来验证插入片段,测序插入片段以保证在拟南芥转化中使用预期的基因。
基因序列可用于从cDNA或基因组文库中鉴定同源或异源基因(直向同源物,来自另一植物的同一LMP基因)。这可以通过设计针对保守序列的PCR引物实现,通过多重序列比对鉴定所述保守序列。经常通过设计针对目的基因全长或部分序列的简并引物来鉴定直向同源物。
基因序列可用于从cDNA或基因组文库中鉴定同源物或直向同源物。可以使用如cDNA文库通过核酸杂交分离同源基因(如全长cDNA克隆):取决于目的基因的丰度,平板接种100,000至多达1,000,000个重组噬菌体并转移至尼龙膜。用碱变性后,通过如UV交联将DNA固定在膜上。在高严格条件下进行杂交。在1M NaCl离子强度和68℃的温度下进行水溶液杂交和洗涤。通过如放射性(32P)切口转录标记(High Prime,Roche,Mannheim,Germany)产生杂交探针。通过放射自显影检测信号。
可以在与上述方法类似的方法中,使用低严格杂交条件和洗涤条件鉴定相关但不相同的部分同源或异源基因。就水溶液杂交而言,离子强度一般保持为1M NaCl,而温度从68℃逐渐降到42℃。
可以通过使用合成的放射性标记的寡核苷酸探针分离仅在(如10-20个氨基酸)特殊结构域中具有同源性(或序列同一性/相似性)的基因序列。优选通过用T4多核苷酸激酶磷酸化两个互补寡核苷酸的5’末端来制备放射性标记的寡核苷酸。互补寡核苷酸退火并连接以形成多联体。接着通过如切口转录来放射性标记双链多联体。一般使用高寡核苷酸浓度在低严格条件下进行杂交。
寡核苷酸杂交溶液:
6×SSC
0.01M磷酸钠
1mM EDTA(pH8)
0.5% SDS
100μg/ml变性鲑精DNA
0.1%脱脂奶粉
在杂交中,温度逐步降低至预计的寡核苷酸Tm以下5-10℃或降至室温,然后进行洗涤步骤和放射自显影。以低严格度进行洗涤,如用4×SSC洗涤3次。其他细节描述于Sambrook等(1989,"Molecular Cloning:ALaboratory Manual",Cold Spring Harbor Laboratory Press)或Ausubel等(1994,"Current Protocols in Molecular Biology",John Wiley & Sons)。
表3
WRI1样LMP的推定功能
(全长核酸序列可见附录,使用表3的序列码)
 
SeqID 序列名 物种 功能 ORF位置
1 AtWR01 拟南芥 糖酵解/油生物合成相关的WRINKLED1转录因子 117-1406
4 BnWRI22743-1 欧洲油菜 Ap2结构域转录因子 6-1340
7 pcw4-1 欧洲油菜 糖酵解/油生物合成相关的WRINKLED1转录因子 3-1241
10 pcw5a-1 欧洲油菜 糖酵解/油生物合成相关的WRINKLED1转录因子 3-1232
13 pcw5b-1 欧洲油菜 糖酵解/油生物合成相关的WRINKLED1转录因子 3-1250
16 BnWRI01 欧洲油菜 糖酵解/油生物合成相关的WRINKLED1转录因子 62-1306
19 BnWRI08 欧洲油菜 胚珠发育蛋白 126-1235
22 psw2 大豆 胚珠发育蛋白 206-1753
25 pcw6 大豆 Aintegumenta样蛋白 85-1668
28 GmWRI02 大豆 胚珠发育蛋白 142-1680
31 GmWRI03 大豆 Aintegumenta样蛋白 235-2385
34 GmWRI05 大豆 Aintegumenta样蛋白 1-1995
37 GmWRI08 大豆 Aintegumenta样蛋白 1-1989
40 OsWRI01 Ap2/EREBP转录因子 49-1386
43 OsWRI07 Aintegumenta样蛋白 478-1578
46 OsWRI03 胚珠发育蛋白aintegumen 71-1996
49 Ta WRI01 普通小麦 胚珠发育蛋白 603-1727
52 Gm WRI01-1 大豆 胚珠发育蛋白 175-1764
55 Gm WRI11 大豆 胚珠发育蛋白 120-2027
实施例7
通过用抗体筛选表达文库来鉴定目的基因
cDNA克隆可用于例如在大肠杆菌(如Qiagen QIAexpress pQE系统)中产生重组蛋白。其后一般通过Ni-NTA亲和层析(Qiagen)正常纯化重组蛋白。重组蛋白可用于例如通过使用兔免疫的标准技术产生特异性抗体。如Gu等(1994,BioTechniques 17:257-262)所述,使用用重组抗原饱和的Ni-NTA柱亲和纯化抗体。接着可通过免疫筛选(Sambrook等1989,Molecular Cloning:A Laboratory Manual",Cold Spring HarborLaboratory Press or Ausubel等1994,"Current Protocols in MolecularBiology",John Wiley & Sons)使用抗体筛选表达cDNA文库,以鉴定同源或异源基因。
实施例8
Northern杂交
就RNA杂交而言,如Amasino(1986,Anal.Biochem.152:304)所述使用甲醛通过在1.25%琼脂糖凝胶中凝胶电泳分离20μg总RNA或1μg聚腺苷酸+RNA,使用10×SSC通过毛细管吸引将其转移至带正电的尼龙膜(Hybond N+,Amersham,Braunschweig),通过紫外线固定并使用杂交缓冲液(10%硫酸葡聚糖(重量/体积)、1M NaCl、1% SDS、100μg/ml鲱精DNA)在68℃预杂交3小时。在预杂交期间使用Highprime DNA标记试剂盒(Roche,Mannheim,Germany)用α-32P dCTP(Amersham,Braunschweig,Germany)标记DNA探针。在加入标记的DNA探针后在相同的缓冲液中在68℃杂交过夜。在68℃使用2×SSC洗涤两次,每次15分钟,用1×SCC、1% SDS洗涤两次,每次30分钟。在-70℃将密封的滤色片曝光1天至14天。
实施例9
DNA测序和计算机功能分析
可以按照标准方法将cDNA文库用于DNA测序,特别是通过使用ABIPRISM Big Dye Terminator Cycle Sequencing Ready Reaction试剂盒(Perkin-Elmer,Weiterstadt,Germany)的链终止法。在通过体内大量切除、再转化并将DH10B接种在琼脂平板上(材料和方案细节来自Stratagene,Amsterdam,Netherlands)从cDNA文库回收制备的质粒之后可以进行随机测序。可以从含有氨苄青霉素的Luria-Broth培养基中过夜培养的大肠杆菌培养物制备质粒DNA(参阅Sambrook等(1989,Cold Spring HarborLaboratory Press:ISBN 0-87969-309-6),按照生产商的方案在QiageneDNA制备机器人(Qiagen,Hilden)上进行。使用Bio-Max(Munich,Germany)销售的软件包EST-MAX处理和注释序列。该程序整合了对蛋白质序列的功能和结构表征重要的生物信息学方法。参考文献参阅http://pedant.mips.biochem.mpg.de。
Genomax和Pedant Pro中整合的最重要的算法为:FASTA:预期统计学显著的非常灵敏的蛋白质序列数据库检索(Pearson W.R.,1990,Rapidand sensitive seq uence comparison with FASTP and FASTA.MethodsEnzymol.183:63-98);BLAST:预期统计学显著的非常灵敏的蛋白质序列数据库检索(Altschul S.F.等,Basic local alignment search tool.J.MoI.Biol.215:403-410);PREDATOR:从单个和多个序列高精确度地预测二级结构(Frishman & Argos 1997,75% accuracy in protein secondary structureprediction.Proteins 27:329-335);CLUSTALW:多序列比对(Thompson,J.D.等,1994,CLUSTAL W:improving the sensitivity of progressivemultiple sequence alignment through sequence weighting,positions-specific gap penalties and weight matrix choice,Nucleic AcidsRes.22:4673-4680);TMAP:由多重比对序列预测跨膜区(Persson B.&Argos P.1994,Prediction of transmembrane segments in proteins utilizingmultiple sequence alignments,J.MoI.Biol.237:182-192);ALOM2:由单个序列预测跨膜区(Klein P.,Kanehisa M.,and DeLisi C.1984,Prediction ofprotein function from sequence properties:A discriminant analysis of adatabase.Biochim.Biophys.Acta 787:221-226.Version 2 by Dr.K.Nakai);PROSEARCH:检测PROSITE蛋白质序列模式(Kolakowski L.F.Jr.等,1992,ProSearch:fast searching of protein sequences with regularexpression patterns related to protein structure and function.Biotechniques 13:919-921);BLIMPS:对无缺口区段数据库进行相似性检索(Wallace & Henikoff 1992,PATMAT:A searching and extractionprogram for sequence,pattern and block queries and databases,CABIOS8:249-254.Written by Bill Alford);PFAM和BLOCKS检索蛋白质基序和结构域。
实施例10
用于植物转化的质粒
就植物转化而言,可以使用双元载体如pBinAR(
Figure A200580026790D0058084001QIETU
 & Willmitzer,1990,Plant Sci.66:221-230)。可以通过将cDNA以有义或反义方向连接进T-DNA来进行双元载体的构建。植物启动子在cDNA 5’激活cDNA的转录。聚腺苷酸化序列位于cDNA的3’。可以使用组织特异性启动子实现组织特异性表达。例如,可以通过在cDNA 5’克隆油菜籽蛋白或LeB4或USP启动子实现种子特异性表达。还可以使用任何其他种子特异性启动子元件。就整株植物内的组成型表达而言,可以使用CaMV 35S启动子。可以使用信号肽将表达的蛋白质靶向细胞区室,如质体、线粒体或内质网(Kermode,1996,Crit.Rev.Plant Sci.15:285-423)。将信号肽符合读框地克隆到cDNA的5’以实现融合蛋白的亚细胞定位。
植物双元载体的其他实例为克隆了LMP基因候选者的pBPS-GB1、pSUN2-GW或pBPS-GB047载体。这些双元载体含有AtAct2-1启动子控制下驱动的抗生素抗性基因和候选基因前的USP种子特异性启动子或PtxA启动子(序列见附录)以及NOSpA终止子或OCS终止子。在USP种子特异性启动子或PtxA启动子后面将部分或全长LMP cDNA以有义或反义方向克隆进植物双元载体的多个克隆位点。使用标准条件将含有目的基因的重组载体转化进Top 10细胞(Invitrogen)。在含有50μg/ml卡那霉素的LB琼脂上37℃培养过夜来筛选转化的细胞。按照生产商的说明使用QIAprep Spin Miniprep试剂盒(Qiagen)提取质粒DNA。按照标准分子生物学技术进行其后的克隆分析和限制性作图(Sambrook等,1989,Molecular Cloning,A Laboratory Manual.第二版.Cold Spring HarborLaboratory Press.Cold Spring Harbor,NY)。
实施例11
农杆菌介导的植物转化
可以使用标准转化和再生技术使用本文所述LMP核酸进行农杆菌介导的植物转化(Gelvin & Schilperoort,《Plant Molecular Biology Manual》,第二版Kluwer Academic Publ.,Dordrecht 1995 in Sect.,RingbucZentrale Signatuur:BT11-P;Glick,Bernard R.和Thompson,John E.《Methods in Plant Molecular Biology and Biotechnology》,S.360,CRCPress,Boca Raton 1993)。例如,可以使用GV3(pMP90)(Koncz & Schell,1986,Mol.Gen.Genet.204:383-396)或LBA4404(Clontech)根癌农杆菌菌株进行农杆菌介导的转化。
可以按照标准条件培养和转化拟南芥(Bechtold,1993,Acad.Sci.Paris.316:1194-1199;Bent等,1994,Science 265:1856-1860)。此外,可以通过子叶或下胚轴转化用本发明的LMP核酸转化油菜(Moloney等,1989,PlantCell Report 8:238-242;De Block等1989,Plant Physiol.91:694-701)。用于农杆菌和植物选择的抗生素取决于转化使用的双元载体和农杆菌菌株。通常使用选择性植物标记进行油菜选择。此外,可以使用如Mlynarova等(1994,Plant Cell Report 13:282-285)所述的技术实施农杆菌介导的基因向亚麻的转移。
将拟南芥WRI1或WRI1样基因克隆进双元载体并在PtxA启动子(豌豆PtsA基因启动子,见附录)下表达,PtxA启动子几乎在所有植物组织中都具有活性。然而,在种子和花中,通过GUS染色检测不到表达活性,用更灵敏的RP-PCR方法检测到低表达活性(Song等,2004,PF 55368-2 US)。仅在含有转基因ptxA启动子/GUS表达构建体的多个拷贝的植物株系中可在部分花和长角果中检测到一定的表达(更多细节参阅Song等,2004,PF55368-2US)。或者,使用超级启动子,其为组成型启动子(Stanton B.Gelvin,美国专利号5,428,147和5,217,903))或种子特异性启动子,如来自蚕豆的USP(未知种子蛋白质)(Baeumlein等,1991,Mol.Gen.Genetics 225:459-67)或豆球蛋白B4启动子(LeB4;Baeumlein等,1992,Plant J.2:233-239)或者赋予单子叶植物(如玉米、大麦、普通小麦、黑麦和稻等)中种子特异性表达的启动子。使用拟南芥AHAS(AtAHAS)作为这些构建体中的选择性标记。图1显示了含有来自欧洲油菜的拟南芥WRI1样序列的双元载体构建体的方案。
可以使用如EP 0424 047、美国专利号5,322,783(Pioneer Hi-BredInternational)或EP 0397 687、美国专利号5,376,543或美国专利号5,169,770(University Toledo)中所述技术或本领域已知的多种其他转化方法的任一种进行大豆的转化。室温下用70%乙醇持续摇动4分钟,其后用补充了0.05%(体积/体积)TWEEN的20%(体积/体积)CLOROX持续摇动20分钟对大豆种子表面消毒。接着用蒸馏水洗涤种子4次,在室温下置于培养皿中润湿的无菌滤纸上6至39小时。剥去种皮,从胚轴分离子叶。检查胚轴以确认未损伤分生组织区。将剪下的胚轴收集到半开的无菌培养皿并风干至含湿量小于20%(鲜重),置于封口的培养皿中待用。
植物转化方法还可应用于欧洲油菜和其他作物。具体而言,室温下用70%乙醇持续摇动4分钟,其后用补充了0.05%(体积/体积)TWEEN的20%(体积/体积)CLOROX持续摇动20分钟将油菜种子表面消毒。接着用蒸馏水洗涤种子4次,在室温下置于培养皿中润湿的无菌滤纸上18小时。除去种皮,将种子在半开的无菌培养皿中风干过夜。这期间种子失去约85%的含水量。然后将种子室温保存于在封口的培养皿中待用。
从LM固体培养基加适当抗生素(如100mg/l链霉素、50mg/l卡那霉素)的单菌落制备根癌农杆菌培养物,接着在液体LB培养基中培养单菌落至600nm的光密度为0.8。接着,室温下7000rpm沉淀细菌培养物7分钟并重悬于补充了100mM乙酰丁香酮的MS(Murashige & Skoog,1962,Physiol.Plant.15:473-497)培养基。使用前在此预诱导培养基中室温温育细菌培养物2小时。室温下用预诱导的农杆菌悬浮培养物吸涨含湿量约44%的大豆合子种子胚轴2小时。(用农杆菌培养物吸涨干燥胚也适用于玉米胚轴)。从吸涨培养物除去胚并转移至含有补充了2%蔗糖的固体MS培养基的培养皿中,在黑暗中室温温育2天。或者,将胚置于培养皿中润湿(液体MS培养基)的无菌滤纸上并在与上述相同的条件下温育。这一期间过后,将胚转移到补充了500mg/l羧苄青霉素或300mg/l头孢噻肟的固体或液体MS培养基以杀死农杆菌。使用液体培养基润湿无菌滤纸。在440μmolm-2s-1和12小时光周期下25℃温育胚4周。当苗产生根时,将其转移至无菌metromix土壤中。将植物转移到土壤前,洗除体外植物的培养基。将植物置于塑料盖下1周,以帮助顺应过程。接着将植物转移至生长室中,在440μmolm-2s-1光密度和12小时光周期下25℃温育约80天。
通过PCR分析原代转基因植物(T0)的样品以确认T-DNA的存在。通过Southern杂交确认这些结果,其中将DNA在1%琼脂糖凝胶上电泳并转移至带正电的尼龙膜(Roche Diagnostics)。如生产商的推荐使用PCRDIG Probe Synthesis试剂盒(Roche Diagnostics)通过PCR制备洋地黄毒苷标记的探针。
作为单子叶植物转化的实例,描述了构建ptxA启动子与玉米泛蛋白内含子和WRI1或WRI1样核酸分子的组合。用PacI和XmaI消化pUC中的PtxA-WRI1直向同源物基因构建体。用PacI和XmaI消化pBPSMM348以分离玉米泛蛋白内含子(ZmUbi内含子),接着电泳并使用QIAEX II Gel Extraction试剂盒(目录号20021)。将ZmUbi内含子连接进pUC中的PtxA-WRI1或WRI1样核酸分子,以产生基于pUC的PtxA-ZmUbi内含子-WRI1或WRI1样核酸分子构建体,接着用AfeI和PmeI限制酶消化。电泳后从Seaplaque低熔解温度琼脂糖凝胶(
Figure A200580026790D0061141114QIETU
Figure A200580026790D0061141129QIETU
琼脂糖目录号50110)切下PtxA-ZmUbi内含子WRI1或WRI1样基因盒。用PmeI消化含有选择性标记盒的单子叶植物的基础载体(单子叶植物基础载体)。将含有ptxA启动子-ZmUbi内含子的WRI1或WRI1样核酸分子表达盒连接进单子叶植物基础载体以产生PtxA-ZmUbi内含子-BnWRI01构建体(图2)。其后,按照本领域的通用方案使用电穿孔将PtxA-ZmUbi内含子-WRI1或WRI1样核酸分子构建体转化进含有pSB1(超级vir质粒)的重组LBA4404菌株中。按照美国专利号5,591,616中所述方案使用未成熟胚进行玉米中农杆菌介导的转化。应用咪唑啉酮除草剂选择以获得转基因玉米株系。在玉米中使用ptxA启动子::ZmUbi内含子的GUS表达实验中,描述了在胚胎发生愈伤组织和根中的强表达(Song等,2004,PF 55368-2US)。
一般而言,可以将植物启动子如PtxA下的稻(或其他单子叶植物)WRI1基因或WRI1样基因转化进玉米或其他作物植物,以产生单子叶植物WRI1基因在其他单子叶植物中的效应,或双子叶植物WRI1基因在其他双子叶植物中的效应,或单子叶植物基因在双子叶植物中的效应,反之亦然。应以与本文所述其他质粒的构建相似的方式构建含有这些WRI1或WRI1样编码序列、5’启动子和3’终止子的质粒
实施例12
体内诱变
可以通过将质粒(或其他载体)DNA掺入到维持自身遗传信息的能力受损的大肠杆菌或其他微生物(如芽孢杆菌属或酵母如酿酒酵母)中并传代来实现微生物的体内诱变。通常,增变株在DNA修复系统的基因中含有突变(如mutHLS、mutD、mutT等;参考文献见Rupp,1996,DNA repairmchanisms,《Escherichia coli and Salmonella》,2277-2294页,ASM:Washington)。这些菌株为本领域技术人员所熟知。这些菌株的使用在例如Greener和Callahan,M.,1994,Strategies 7:32-34中有所说明。优选在微生物中进行选择和测试后将突变的DNA分子转移进植物。按照此文献示例内的多个实例产生转基因植物。
实施例13
转化的生物中mRNA表达和重组基因产物活性的评估
可以在转录和/或翻译水平测量转化的宿主生物中重组基因产物的活性。确定基因转录水平(可供翻译成基因产物使用的mRNA量的指示)的有用方法是进行Northern印迹(参考文献见如Ausubel等,1988,CurrentProtocols in Molecular Biology,Wiley:New York),其中用可检测标签(通常为放射性或化学发光)标记设计与目的基因结合的引物,从而在提取微生物培养物的总RNA、在凝胶上电泳、转移至稳定基质并与此探针温育时,探针的结合和结合的量指示此基因mRNA的存在和量。此信息至少部分证明了转化基因的转录程度。可以通过本领域熟知的若干方法,如Bormann等(1992,MoI.Microbiol.6:317-326)中所述的方法从植物细胞、组织或器官制备总细胞RNA。
为评估从此mRNA翻译的蛋白质的存在或相对量,可以使用标准技术如Western印迹(参阅如Ausubel等,1988,《Current Protocols inMolecular Biology》,Wiley:New York)。在此方法中,提取细胞总蛋白、通过凝胶电泳分离、转移至基质如硝酸纤维素并与探针(如与目的蛋白质特异性结合的抗体)温育。用便于检测的探针,其通常用化学发光或比色法标记来标记。观察到的标记的存在和量指示细胞中目的突变蛋白质的存在和量。
可以通过若干成熟的方法测量与DNA结合的LMP的活性,如DNA条带移位分析(也称为凝胶阻滞测定)。可以使用报道基因测定(如Kolmar H.等,1995,EMBO J.14:3895-3904 and references cited therein及其引用的参考文献中所述)测量此类LMP对其他分子表达的影响。使用如β-半乳糖苷酶等酶、绿色荧光蛋白等的报道基因测试系统是熟知的,并已确立用于原核和真核细胞。
可以按照如Gennis R.B.(1989 Pores,Channels and Transporters,inBiomembranes,Molecular Structure and Function,Springer:Heidelberg,85-137、199-234和270-322页)中所述的技术进行脂类代谢膜转运蛋白的活性测定。
实施例14
拟南芥、欧洲油菜、大豆、稻或普通小麦WRI1和WRI1样基因在转基因植物中功能的体外分析
酶活性和动力学参数的测定是本领域中成熟的。必须使用于测定任一给定的改变的酶活性的实验适用于野生型的比活性,这在本领域技术人员的能力之内。关于酶总体的以及结构、动力学、原理、方法、应用和实例的具体细节的概述可见于例如以下参考文献:Dixon & Webb,1979,《Enzymes》.Longmans:London;Fersht,(1985)《Enzyme Structure andMechanism》.Freeman:New York;Walsh(1979)《Enzymatic ReactionMechanisms》.Freeman:San Francisco;Price,N.C.,Stevens,L.(1982)《Fundamentals of Enzymology》.Oxford Univ.Press:Oxford;Boyer,P.D.编辑(1983)《The Enzymes》,第三版.Academic Press:New York;Bisswanger,H.,(1994)《Enzymkinetik》,第二版.VCH:Weinheim(ISBN3527300325);Bergmeyer,H.U.,Bergmeyer,J.,GraBl,M.编辑(1983-1986)《Methods of Enzymatic Analysis》,第三版,第I-XII卷,Verlag Chemie:Weinheim和《Ullmann′s Encyclopedia of Industrial Chemistry》(1987)A9卷,Enzymes.VCH:Weinheim,352-363页。
实施例15
分析重组蛋白对目的种子贮藏化合物的产生的影响
通过气相层析(GC)分析来自转化的拟南芥植物的种子的总油含量和脂肪酸谱。GC分析显示,与Columbia-2相比,在分离T2和纯合T3种子世代中转化了pBPS-GB047的拟南芥植物显示出总种子油含量提高10-15%(图3),所述pBPS-GB047含有驱动拟南芥WRI1基因的Ptxa启动子和作为选择性标记的AHAS基因。总种子蛋白质水平与对照植物相比几乎相同(数据未显示)。拟南芥PtxA::WRI1过表达子(AtWRI01)显示总种子油含量百分比从Columbia野生型和PtxA空载体对照中的约35%提高至转基因株系T2和T3种子中的约40%。图4显示PtxA::WRI1对种子中油酸(18:1)含量的影响。与Columbia-2(遗传背景)、GB007(空载体对照)和Columbia-24(实验中使用的高油对照)相比,在一些转基因株系中存在显著的提高。油酸的相对量从对照中的约18%提高到一些转基因WRI1过表达子中的63-65%。油酸提高的效应看来在T2和T3种子世代中非常稳定。我们从图3和图4所示T2和T3种子世代中总种子油含量的提高和油酸百分比的提高之间的相关性得出结论:该性状是可遗传的。
种子中油酸百分比的提高伴随着亚油酸和亚麻酸相对量的显著降低(图5)。转基因种子中亚油酸低于野生型含量的5%,亚麻酸是野生型含量的20%或更低。与此同时,与野生型相比,转基因种子中饱和脂肪酸(16:0、18:0、20:0的总和)的相对量至少降低20%(图6).
测试了其他启动子/WRI1基因组合的效应。表达处于种子特异性启动子LeB4控制下的WRI1的转基因植物在种子脂肪酸组成上未显示任何可检测的效应。结果提示用如PtxA的启动子过表达WRI1允许操作总种子油含量和脂肪酸组成,特别是油酸、亚油酸和亚麻酸。
可以通过在合适的条件下培养修饰的植物并分析种子或任何其他植物器官中目的产物(即脂类或脂肪酸)提高的产量来评估植物中遗传修饰对目的种子贮藏化合物(如糖、脂类或脂肪酸)的影响。这些分析技术为本领域技术人员所熟知,包括分光术、薄层层析法、多种类型的染色方法、酶学和微生物方法以及分析型层析如高效液相层析(参阅如Ullman,1985,《Encyclopedia of Industrial Chemistry》,A2卷,89-90和443-613页,VCH:Weinheim;Fallon等,1987,Applications of HPLCin Biochemistry《Laboratory Techniq ues in Biochemistry and Molecular Biology》,第17卷;Rehm等,1993,Product recovery and purification,《Biotechnology》,第3卷,第III章,469-714页,VCH:Weinheim;Belter,P.A.等,1988《Bioseparations:downstream processing for biotechnology》,John Wiley& Sons;Kennedy & Cabral,1992,《Recovery processes for biologicalmaterials》,John Wiley and Sons;Shaeiwitz & Henry,1988,Biochemicalseparations《Ulmann′s Encyclopedia of Industrial Chemistry,Separationand purification techniques in biotechnology》,B3卷,第11章,1-27页,VCH:Weinheim和Dechow FJ.1989)。
除了上述方法以外,如Cahoon等(1999,Proc.Natl.Acad.Sci.USA 96,22:12935-12940)和Browse等(1986,Anal.Biochemistry 442:141-145)所述从植物材料提取植物脂类。定性和定量的脂类或脂肪酸分析描述于Christie,William W.,《Advances in Lipid Methodology》.Ayr/Scotland:Oily Press.-(Oily Press Lipid Library;Christie,William W.,Gas Chromatographyand Lipids.A Practical Guide-Ayr,Scotland:Oily Press,1989 Repr.1992.-IX,307 S.-(Oily Press Lipid Library和"Progress in Lipid Research,Oxford:Pergamon Press,1(1952)-16(1977)Progress in the Chemistry ofFats and Other Lipids CODEN。
可以按照如Christie及其中的参考文献(1997《Advances on LipidMethodology》第四版:Christie,Oily Press,Dundee,119-169页;1998)中所述的标准分析方法:GC、GC-MS或TLC来分析转基因植物以获得脂肪酸产物存在的明确证据。用于叶的详细方法描述于Lemieux等(1990,Theor.Appl.Genet.80:234-240),用于种子的详细方法描述于Focks&Benning(1998,Plant Physiol.118:91-101)。
通过脂肪酶消化确定甘油骨架的sn-1、sn-2或sn-3位置上脂肪酸组成的位置分析(参阅如Siebertz & Heinz,1977,Z.Naturforsch.32c:193-205和Christie 1987,《Lipid Analysis》第二版,Pergamon Press,Exeter,ISBN0-08-023791-6)。
可以通过适当的方法测定总种子油水平。通常用常规方法定量种子油含量,如近红外分析(NIR)或核磁共振成像(NMR)。只要目的样品适用于此技术,NIR光谱法已经成为筛选种子样品的标准方法。研究的样品包括油菜、大豆、玉米、普通小麦、稻等。可以使用单个种子的NIR分析(参阅如Velasco等,′Estimation of seed weight,oil content and fatty acidcomposition in intact single seeds of rapeseed(Brassica napus L.)bynear-infrared reflectance spectroscopy,′Euphytica,Vol.106,1999,pp.79-85)。NMR也已用于分析种子的含油量(参阅如Robertson & Morrison,Journal of the American Oil Chemists Society,1979,第56卷,1979,961-964页,将其完整引入本文作为参考)。
收集关于提高或降低的蛋白质活性对脂类和糖生物合成途径的影响的信息的典型方法为例如通过使用14C-乙酸或14C-丙酮酸标记叶或种子的标记研究来分析碳通量(参阅如Focks & Benning,1998,Plant Physiol.118:91-101;Eccleston & Ohlrogge,1998,Plant Cell 10:613-621)。可以通过各自分离(例如在TLC平板上)后包括标准品如14C-蔗糖和14C-苹果酸的液体闪烁计数来测定14C向脂类和水溶性组分中的分布(Eccleston &Ohlrogge,1998,Plant Cell 10:613-621)。
可以通过超声处理、玻璃研磨、液氮和研磨或通过其他适用的方法崩解待分析的材料。崩解后必须离心材料。将沉淀物重悬于蒸馏水,100℃加热10分钟,在冰上冷却并再次离心,其后在90℃用含有2%二甲氧基丙烷的甲醇中的0.5M硫酸萃取1小时,引起油和脂类化合物水解,得到转甲基脂类。用石油醚(petrolether)萃取这些脂肪酸甲酯,最后进行GC分析,所述分析使用毛细管柱(Chrompack,WCOT Fused Silica,CP-Wax-52 CB,25m,0.32mm),温度梯度在170℃和240℃之间20分钟,其后240℃ 5分钟。通过使用商业来源(即Sigma)的标准品来定义得到的脂肪酸甲酯的身份。对于脂肪酸没有可用的标准品的情况,通过衍生和其后的GC-MS分析证明分子身份。例如,在通过4,4-二甲氧基-噁唑啉-Derivaten衍生之后通过GC-MS显示三键脂肪酸的位置(Christie,Oily Press,Dundee,1998)。
用于分析糖(特别是淀粉)的通用标准方法公开于Stitt等(1989,Methods Enzymol.174:518-552)。关于其他方法,还参阅H
Figure A200580026790D0067085710QIETU
rtel等(1998,Plant Physiol.Biochem.36:407-417)和Focks & Benning(1998,PlantPhysiol.118:91-101)。
为提取可溶性糖和淀粉,将50粒种子在1.5ml聚丙烯试管中500μl80%(体积/体积)乙醇中匀浆并在70℃温育90分钟。以16000g离心5分钟后,将上清液转移至新试管中。用500μl 80%乙醇提取沉淀两次。室温下将合并的上清液的溶剂真空蒸发。将残渣溶于50μl水中,代表可溶性碳水化合物级分。在200μl 0.2N KOH中将乙醇提取后剩下的沉淀(含有不溶性碳水化合物,包括淀粉)匀浆,将上清液在95℃温育1小时以溶解淀粉。加入35μl1N乙酸并以16000g离心5分钟后,将上清液用于淀粉定量。
为定量不溶性糖,将10μl糖提取物加入990μl含有100mM咪唑,pH6.9、5mM MgCl2、2mM NADP、1mM ATP和2单位2ml-1葡萄糖-6-磷酸-脱氢酶的反应缓冲液中。对于葡萄糖、果糖和蔗糖的酶测定,连续加入4.5单位己糖激酶、1单位葡糖磷酸异构酶和2μl饱和果糖苷酶溶液。在波长340nm处用光度计监测NADPH的产生。同样,用来自BoehringerMannheim的试剂盒测定30μl不溶性碳水化合物级分中的淀粉。
分析叶和种子中蛋白质含量的实例可见于Bradford(1976,Anal.Biochem.72:248-254)。对于总种子蛋白质的定量,在1.5ml聚丙烯试管中的250μl丙酮中将15-20粒种子匀浆。以16000g离心后,弃去上清液,将真空干燥的沉淀重悬于250μl含有50mM Tris-HCl,pH8.0、250mMNaCl、1mM EDTA和1%(重量/体积)SDS的提取缓冲液中。在25℃温育2小时后,将匀浆以16000g离心5分钟,将200ml上清液用于蛋白质测定。测定中,用γ-球蛋白校准。对于蛋白质测定,使用Lowry DC蛋白质测定(Bio-Rad)或Bradford测定(Bio-Rad)。
根据Renz等(1993,Planta 190:156-165)用分光光度法进行己糖激酶和果糖激酶的酶测定,根据Burrell等(1994,Planta 194:95-101)进行葡糖磷酸异构酶、依赖ATP的6-果糖磷酸激酶、依赖焦磷酸的6-磷酸果糖激酶、果糖-1,6-二磷酸醛缩酶、磷酸丙糖异构酶、甘油-3-磷酸脱氢酶、磷酸甘油酸激酶、磷酸甘油酸变位酶、烯醇化酶、和丙酮酸激酶的酶测定,根据Zrenner等(1995,Plant J.7:97-107)进行UDP-葡萄糖-焦磷酸化酶的酶测定。
Figure A200580026790D00691
等(1998,Plant Physiol.Biochem.36:407-417)所述测定碳水化合物代谢中间体,如葡萄糖-1-磷酸、葡萄糖-6-磷酸、果糖-6-磷酸、磷酸烯醇丙酮酸、丙酮酸和ATP,如Jelitto等(1992,Planta 188:238-244)所述测定代谢物。
除了测定最终种子贮藏化合物(即脂类、淀粉或贮藏蛋白质)之外,还可以分析目的种子贮藏化合物的产生所利用的代谢途径的其他组分(如中间体和副产物),以测定化合物产生的总效率(Fiehn等,2000,NatureBiotech.18:1447-1161)。例如,可以构建含有本文公开的核酸或其片段的酵母表达载体并使用标准方案转化进酿酒酵母。接着可以测定得到的转基因细胞中糖、油、脂类或脂肪酸含量的改变。同样,可以构建含有本文所述核酸或其片段的植物表达载体并使用标准方案转化进合适的植物细胞,如拟南芥、大豆、油菜、稻、玉米、普通小麦、Medicago truncatula等。接着可以测定得到的转基因细胞和/或由其产生的植物中糖、油、脂类或脂肪酸含量的改变。
此外,本文公开的序列或其片段可用于在多种生物(如细菌、哺乳动物细胞、酵母细胞和植物细胞)的基因组中产生敲除突变(Girke等,1998,PlantJ.15:39-48)。接着可以对得到的敲除细胞评估其种子贮藏化合物的组成和含量以及突变对表型和/或基因型的影响。基因失活的其他方法包括美国专利号6,004,804和Puttaraju等(1999,Nature Biotech.17:246-252)中所述的方法。
实施例16
从转化的生物中纯化目的产物
可以通过多种本领域熟知的方法从植物材料中回收LMP。植物器官可以与其他组织或器官机械分离,接着从该植物器官分离种子贮藏化合物。组织匀浆之后,通过离心除去细胞碎片,保留含有可溶性蛋白质的上清液级分用于进一步纯化目的化合物。如果产物由培养基中生长的细胞分泌,则通过低速离心从培养物中除去细胞,保留上清液级分用于进一步纯化。
用合适的树脂层析来自任一纯化方法的上清液级分,其中目的分子留在层析树脂上而样品中的许多杂质则不能,或者杂质留在树脂上,而样品则不然。必要时可以使用相同或不同的层析树脂重复这些层析步骤。本领域技术人员能熟练的为待纯化的具体分子选择合适的层析树脂及其最有效的应用。可以通过过滤或超滤浓缩纯化产物,并在产物的稳定性最大的温度下保存。
本领域已知多种纯化方法,前面的纯化方法并不是限制性的。这些纯化技术描述于例如Bailey & Ollis,1986,Biochemical EngineeringFundamentals,McGraw-Hill:New York。
可以通过本领域的标准技术评估分离化合物的身份和纯度。这些技术包括高效液相层析(HPLC)、光谱方法、染色方法、薄层层析、分析型层析如高效液相层析、NIRS、酶测定或微生物方法。这些分析方法综述于Patek等(1994,Appl.Environ.Microbiol.60:133-140)、Malakhova等(1996,Biotekhnologiya 11:27-32)、Schmidt等(1998,Bioprocess Engineer19:67-70)、《Ulmann′s Encyclopedia of Industrial Chemistry》(1996,A27卷,VCH:Weinheim,89-90页、521-540页、540-547页、559-566页、575-581页和581-587页)和Michal G.(1999,Biochemical Pathways:An Atlas ofBiochemistry and Molecular Biology,John Wiley and Sons;Fallon,A.等1987,Applications of HPLC in Biochemistry in:Laboratory Techniques inBiochemistry and Molecular Biology,17卷)。
实施例17
筛选增加的种子大小
与植物野生型品种相比,条件表达WRI1或作物WRI1样基因引起转基因植物增加的种子大小。如实施例11所述产生表达PtxA启动子控制下的WRI1的转基因拟南芥植物,发现其产生比野生型植物的种子更大的种子。一般使用显微镜观察这种大小的增加。此外,发现在PtxA::WRI1过表达株中种子重量提高。例如,与野生型相比,wri1突变体种子在种子重量上显示20%的降低(图7)。在独立转基因株系pWriRT-7和pWriRT-5的分离T2种子世代中,100粒种子的重量分别提高30%和40%(图7)。与空载体对照相比,在纯合T3种子中,种子重量提高多达60%(数据未显示)。WRI1或WRI1样基因过表达株种子大小的增加反映了提高的种子重量。在许多经济上重要的作物植物中,提高的种子大小引起更高的产量。因此,增加的种子大小是使用本申请所述WRI1或WRI1样核酸分子进行遗传改造和选择的一个目标。
实施例18
增加的根长度的筛选
体外根分析
在体外根分析中,使用尺寸为12cm×12cm的方形平板。每个平板使用52ml无选择的MS培养基(0.5×MS盐、0.5%蔗糖、0.5g/L MES缓冲液、1% Phytagar)。使平板在无菌通风厨中干燥1小时以减少将来的凝聚。
用乙醇在玻璃瓶中使种子等分试样消毒5分钟,除去乙醇,使种子在无菌通风厨中干燥1小时。使用Vacuseed Device(Lehle)将种子点样在平板上。将种子点样在平板上之后,用Ventwrap包住平板并竖直置于黑暗中4℃的架子上使种子分层。将平板转移至C5 Percival培养箱(GrowthChamber)并竖直放置。培养箱条件为白天23℃/夜晚21℃和16小时白天/8小时夜晚。
为收集数据,使用高分辨率平板扫描仪。使用WinRhizo软件包进行根的分析。对得自拟南芥野生型和wri1突变体的根长度的比较表明wri1突变体中根长度减少50%。发现这种根长度的减少和与野生型相比延迟的萌发和确定的发育时间点的叶片数减少有关(图8)。在野生型背景下过表达WRI1或WRI1样基因可以提高种子萌发、增加根长度并提高叶发育速度和叶片数。后者可以提高植物的光合性能,引起生物量产量提高和种子数量和/或大小增加,伴随着种子贮藏化合物(如油、蛋白质和糖)量的提高。
土壤根分析
对于土壤根分析,可以使种子在水中4℃吸涨2天并无选择地直接播种。使用底部为饱和泥炭团粒(Jiffy 727)并装满水饱和Metromix的Deepot(Hummert D40)。播种后,用塑料套覆盖盆以防止干燥。可以仅使用培养基制备物中存在的水培养植物,因为这些大盆中土壤内的水足以培养3周,并促进根的快速生长。在12天后从盆上除去塑料套,记录形态学数据。在第17天,收获植物的气生部分、干燥(65℃2天)并测量干重。为检查根,将泥炭团粒挤到盆顶以将土壤和根作为整体移出。接着在盘中将土壤和根分开并测量最大根长度。取所有转基因株系的所有植物的根长度的平均值并与野生型植物的平均值进行比较。
仅使用常规实验,本领域技术人员会认识到或能够确定本文所述本发明的具体实施方案的许多等同方案。这些等同方案旨在包含于本文公开并要求保护的本发明权利要求书中。
附录
SEQ ID NO:1-AtWRI01的核酸序列
AAACCACTCTGCTTCCTCTTCCTCTGAGAAATCAAATCACTCACACTCCAAAAAAAAATCTAAACTT
TCTCAGAGTTTACGCCCTTGGTACCAAATCTAAACTTTCTCAGAGTTTAATGAAGAAGCGCTTAACC
ACTTCCACTTGTTCTTCTTCTCCATCTTCCTCTGTTTCTTCTTCTACTACTACTTCCTCTCCTATTCAGT
CGGAGGCTCCAAGGCCTAAACGAGCCAAAAGGGCTAAGAAATCTTCTCCTTCTGGTGATAAATCTCA
TAACCCGACAAGCCCTGCTTCTACCCGACGCAGCTCTATCTACAGAGGAGTCACTAGACATAGATGG
ACTGGGAGATTCGAGGCTCATCTTTGGGACAAAAGCTCTTGGAATTCGATTCAGAACAAGAAAGGC
AAACAAGTTTATCTGGGAGCATATGACAGTGAAGAAGCAGCAGCACATACGTACGATCTGGCTGCT
CTCAAGTACTGGGGACCCGACACCATCTTGAATTTTCCGGCAGAGACGTACACAAAGGAATTGGAA
GAAATGCAGAGAGTGACAAAGGAAGAATATTTGGCTTCTCTCCGCCGCCAGAGCAGTGGTTTCTCCA
GAGGCGTCTCTAAATATCGCGGCGTCGCTAGGCATCACCACAACGGAAGATGGGAGGCTCGGATCG
GAAGAGTGTTTGGGAACAAGTACTTGTACCTCGGCACCTATAATACGCAGGAGGAAGCTGCTGCAG
CATATGACATGGCTGCGATTGAGTATCGAGGCGCAAACGCGGTTACTAATTTCGACATTAGTAATTA
CATTGACCGGTTAAAGAAGAAAGGTGTTTTCCCGTTCCCTGTGAACCAAGCTAACCATCAAGAGGGT
ATTCTTGTTGAAGCCAAACAAGAAGTTGAAACGAGAGAAGCGAAGGAAGAGCCTAGAGAAGAAGT
GAAACAACAGTACGTGGAAGAACCACCGCAAGAAGAAGAAGAGAAGGAAGAAGAGAAAGCAGAG
CAACAAGAAGCAGAGATTGTAGGATATTCAGAAGAAGCAGCAGTGGTCAATTGCTGCATAGACTCT
TCAACCATAATGGAAATGGATCGTTGTGGGGACAACAATGAGCTGGCTTGGAACTTCTGTATGATGG
ATACAGGGTTTTCTCCGTTTTTGACTGATCAGAATCTCGCGAATGAGAATCCCATAGAGTATCCGGA
GCTATTCAATGAGTTAGCATTTGAGGACAACATCGACTTCATGTTCGATGATGGGAAGCACGAGTGC
TTGAACTTGGAAAATCTGGATTGTTGCGTGGTGGGAAGAGAGAGCCCACCCTCTTCTTCTTCACCAT
TGTCTTGCTTATCTACTGACTCTGCTTCATCAACAACAACAACAACAACCTCGGTTTCTTGTAACTAT
TTGGTCTGAGAGAGAGAGCTTTGCCTTCTAGTTTGAATTTCTATTTCTTCCGCTTCTTCTTCTTTTTTTT
CTTTTGTTGGGTTCTGCTTAGGGTTTGTATTTCAGTTTCAGGGCTTGTTCGTTGGTTCTGAATAATCAA
TGTCTTTGCCCCTTTTCTAATGGGTACCTGAAGGGCGA
SEQ ID NO:2-AtWRI01的可读框的核酸序列
ATGAAGAAGCGCTTAACCACTTCCACTTGTTCTTCTTCTCCATCTTCCTCTGTTTCTTCTTCTACT
ACTACTTCCTCTCCTATTCAGTCGGAGGCTCCAAGGCCTAAACGAGCCAAAAGGGCTAAGAAAT
CTTCTCCTTCTGGTGATAAATCTCATAACCCGACAAGCCCTGCTTCTACCCGACGCAGCTCTATC
TACAGAGGAGTCACTAGACATAGATGGACTGGGAGATTCGAGGCTCATCTTTGGGACAAAAGC
TCTTGGAATTCGATTCAGAACAAGAAAGGCAAACAAGTTTATCTGGGAGCATATGACAGTGAA
GAAGCAGCAGCACATACGTACGATCTGGCTGCTCTCAAGTACTGGGGACCCGACACCATCTTG
AATTTTCCGGCAGAGACGTACACAAAGGAATTGGAAGAAATGCAGAGAGTGACAAAGGAAGA
ATATTTGGCTTCTCTCCGCCGCCAGAGCAGTGGTTTCTCCAGAGGCGTCTCTAAATATCGCGGC
GTCGCTAGGCATCACCACAACGGAAGATGGGAGGCTCGGATCGGAAGAGTGTTTGGGAACAAG
TACTTGTACCTCGGCACCTATAATACGCAGGAGGAAGCTGCTGCAGCATATGACATGGCTGCGA
TTGAGTATCGAGGCGCAAACGCGGTTACTAATTTCGACATTAGTAATTACATTGACCGGTTAAA
GAAGAAAGGTGTTTTCCCGTTCCCTGTGAACCAAGCTAACCATCAAGAGGGTATTCTTGTTGAA
GCCAAACAAGAAGTTGAAACGAGAGAAGCGAAGGAAGAGCCTAGAGAAGAAGTGAAACAAC
AGTACGTGGAAGAACCACCGCAAGAAGAAGAAGAGAAGGAAGAAGAGAAAGCAGAGCAACA
AGAAGCAGAGATTGTAGGATATTCAGAAGAAGCAGCAGTGGTCAATTGCTGCATAGACTCTTC
AACCATAATGGAAATGGATCGTTGTGGGGACAACAATGAGCTGGCTTGGAACTTCTGTATGAT
GGATACAGGGTTTTCTCCGTTTTTGACTGATCAGAATCTCGCGAATGAGAATCCCATAGAGTAT
CCGGAGCTATTCAATGAGTTAGCATTTGAGGACAACATCGACTTCATGTTCGATGATGGGAAGC
ACGAGTGCTTGAACTTGGAAAATCTGGATTGTTGCGTGGTGGGAAGAGAGAGCCCACCCTCTTC
TTCTTCACCATTGTCTTGCTTATCTACTGACTCTGCTTCATCAACAACAACAACAACAACCTCGG
TTTCTTGTAACTATTTGGTCTGA
SEQ ID NO:3-AtWRI01的可读框的氨基酸序列
MKKRLTTSTCSSSPSSSVSSSTTTSSPIQSEAPRPKRAKRAKKSSPSGDKSHNPTSPASTRRSSIYRGVTRHR
WTGRFEAHLWDKSSWNSIQNKKGKQVYLGAYDSEEAAAHTYDLAALKYWGPDTILNFPAETYTKELEE
MQRVTKEEYLASLRRQSSGFSRGVSKYRGVARHHHNGRWEARIGRVFGNKYLYLGTYNTQEEAAAAY
DMAAIEYRGANAVTNFDISNYIDRLKKKGVFPFPVNQANHQEGILVEAKQEVETREAKEEPREEVKQQY
VEEPPQEEEEKEEEKAEQQEAEIVGYSEEAAVVNCCIDSSTIMEMDRCGDNNELAWNFCMMDTGFSPFL
TDQNLANENPIEYPELFNELAFEDNIDFMFDDGKHECLNLENLDCCVVGRESPPSSSSPLSCLSTDSASSTT
TTTTSVSCNYLV
SEQ ID NO:4-Bn22743-1的核酸序列
CTTGCACACAGTGCGTCTTTGGTTTTCTCTTTCCTAGGGTTTGTGTTTTGGTTCTGATCATGGCGTCGA
TGTCGTCGCCGGATCAGGGGCCTAAGACAGAGGCGGGAGGAGGAGGAGAGAGCTCGGAGAATGTG
TCGGCGAGTGATCAGATGTTGCTGTATAGAAGTTTTAAGAAGGCGAAGAAGGAGAGAGGATGCACA
GCTAAGGAGCGTATCAGTAAAATGCCGCCCTGCACAGCTGGCAAAAGGAGTTCTATTTACCGTGGA
GTCACCAGACATAGATGGACAGGTCGGTACGAAGCTCACCTTTGGGACAAGAGTACTTGGAACCAA
AACCAGAACAAGAAGGGCAAACAAGTTTATCTAGGAGCATATGATGATGAAGAGGCTGCTGCTAGA
GCCTACGACCTTGCTGCCTTGAAATACTGGGGACCTGGAACACTTATCAATTTTCCGGTGACTGATT
ACTCTAGGGATTTAGAAGAAATGCAAAGTCTCTCAAGGGAAGAATACCTTGCAACTCTACGTAGAA
AAAGCAGCGGTTTCTCAAGGGGAATAGCCAAATATCGTGGCCTTCAAAGCCGATGGGAAGCATCAG
CCAGTCGGATGCCTGGACCTGAATACTTCGGTAGCCTTCATTACGGTGATGAACGAGGAGCAGAAG
GTGACTTTCTTGGCAGCTTTTGTCTGGAAAGAAAGATTGATCTAACGGGATACATAAAGTGGTGGGG
AGTCAACAAACCCGGTCAACCAGAATCTTCATCAAAGGCATCAGAGGATGCAAAGGTAGAAGATGC
AGGTACTGAGCTTAAGACACTGGAACACGCTTCCCAGGCAACAGAGCCATACAAAGCACCAAACTT
TGGCGTTCATCATGGCACTCAGAGGAAAGGAAAACAAATAACATCGCCGTCCTCCACCTCTTCTGCT
TTAAGCATTTTGTCTGCGTCACCTGCTTACAAGAGTCTGGAGGAGAAAGTGATGAAGATCCAAGAAA
GTAGCAGCACTAGAGAAAACGATGAGAATGCAAACCGTAACATCAATAGTATTGAGAAGAGTCACG
GTAAGGAAATAGAGAAACCACCGGTCGTGAGTCATGGAGTTTCTCTAGGCAGTGGTGGTGGTGTTG
CTCCTGCTGCTGCTGCTTTGTCTCTTCAGAAAAGCATGTACCCACTTGCCTCTCTCTTAACTGCTCCAC
TGCTCAGCAATTACAATACATTGGATCCCCTTGGAGAGCCTATTCTCTGGACACCGTTCCTTCACCCA
GGATCTTCTCATACTTTAGAGGTGACAAAGACAGAGACAAGTTGTTCCACATACAGTTACCTCCCAC
AAGAGAAGTGAGCCGTTCCCCTTTAGACTGTTTGTGAAAATGATCTGAAGCAGGAATGTACAGGTTT
TTGTCAGTGTTTTATGTGTATTTTCAGTGTGGAATATATATAGAATCATTATACTTAAATGTAAAACA
GGCAAAATTTATGATTATACAGTAGTATAAAGGTTTGCTCTT
SEQ ID NO:5-BnWRI22743-1可读框的核酸序列
ATGGCGTCGATGTCGTCGCCGGATCAGGGGCCTAAGACAGAGGCGGGAGGAGGAGGAGAGAG
CTCGGAGAATGTGTCGGCGAGTGATCAGATGTTGCTGTATAGAAGTTTTAAGAAGGCGAAGAA
GGAGAGAGGATGCACAGCTAAGGAGCGTATCAGTAAAATGCCGCCCTGCACAGCTGGCAAAA
GGAGTTCTATTTACCGTGGAGTCACCAGACATAGATGGACAGGTCGGTACGAAGCTCACCTTTG
GGACAAGAGTACTTGGAACCAAAACCAGAACAAGAAGGGCAAACAAGTTTATCTAGGAGCAT
ATGATGATGAAGAGGCTGCTGCTAGAGCCTACGACCTTGCTGCCTTGAAATACTGGGGACCTGG
AACACTTATCAATTTTCCGGTGACTGATTACTCTAGGGATTTAGAAGAAATGCAAAGTCTCTCA
AGGGAAGAATACCTTGCAACTCTACGTAGAAAAAGCAGCGGTTTCTCAAGGGGAATAGCCAAA
TATCGTGGCCTTCAAAGCCGATGGGAAGCATCAGCCAGTCGGATGCCTGGACCTGAATACTTCG
GTAGCCTTCATTACGGTGATGAACGAGGAGCAGAAGGTGACTTTCTTGGCAGCTTTTGTCTGGA
AAGAAAGATTGATCTAACGGGATACATAAAGTGGTGGGGAGTCAACAAACCCGGTCAACCAGA
ATCTTCATCAAAGGCATCAGAGGATGCAAAGGTAGAAGATGCAGGTACTGAGCTTAAGACACT
GGAACACGCTTCCCAGGCAACAGAGCCATACAAAGCACCAAACTTTGGCGTTCATCATGGCAC
TCAGAGGAAAGGAAAACAAATAACATCGCCGTCCTCCACCTCTTCTGCTTTAAGCATTTTGTCT
GCGTCACCTGCTTACAAGAGTCTGGAGGAGAAAGTGATGAAGATCCAAGAAAGTAGCAGCACT
AGAGAAAACGATGAGAATGCAAACCGTAACATCAATAGTATTGAGAAGAGTCACGGTAAGGA
AATAGAGAAACCACCGGTCGTGAGTCATGGAGTTTCTCTAGGCAGTGGTGGTGGTGTTGCTCCT
GCTGCTGCTGCTTTGTCTCTTCAGAAAAGCATGTACCCACTTGCCTCTCTCTTAACTGCTCCACT
GCTCAGCAATTACAATACATTGGATCCCCTTGGAGAGCCTATTCTCTGGACACCGTTCCTTCACC
CAGGATCTTCTCATACTTTAGAGGTGACAAAGACAGAGACAAGTTGTTCCACATACAGTTACCT
CCCACAAGAGAAGTGA
SEQ ID NO:6-Bn22743-1可读框的氨基酸序列
MASMSSPDQGPKTEAGGGGESSENVSASDQMLLYRSFKKAKKERGCTAKERISKMPPCTAGKRSSIYRG
VTRHRWTGRYEAHLWDKSTWNQNQNKKGKQVYLGAYDDEEAAARAYDLAALKYWGPGTLINFPVTD
YSRDLEEMQSLSREEYLATLRRKSSGFSRGIAKYRGLQSRWEASASRMPGPEYFGSLHYGDERGAEGDF
LGSFCLERKIDLTGYIKWWGVNKPGQPESSSKASEDAKVEDAGTELKTLEHASQATEPYKAPNFGVHHG
TQRKGKQITSPSSTSSALSILSASPAYKSLEEKVMKIQESSSTRENDENANRNINSIEKSHGKEIEKPPVVSH
GVSLGSGGGVAPAAAALSLQKSMYPLASLLTAPLLSNYNTLDPLGEPILWTPFLHPGSSHTLEVTKTETSC
STYSYLPQEK
SEQ ID NO:7-pcw4-1的核酸序列
TAATGAAGAGACCCTTAACCACTTCTCCTTCTTCCTCCTCTTCTACTTCTTCTTCGGCCTGTATACTTC
CGACTCAATCAGAGACTCCAAGGCCCAAACGAGCCAAAAGGGCTAAGAAATCTTCTCTGCGTTCTG
ATGTTAAACCACAGAATCCCACCAGTCCTGCCTCCACCAGACGCAGCTCTATCTACAGAGGAGTCAC
TAGACATAGATGGACAGGGAGATACGAAGCTCATCTATGGGACAAAAGCTCGTGGAATTCGATTCA
GAACAAGAAAGGCAAACAAGTTTATCTGGGAGCATATGACAGCGAGGAAGCAGCAGCACATACGT
ACGATCTAGCTGCTCTCAAGTACTGGGGTCCCAACACCATCTTGAACTTTCCGGTTGAGACGTACAC
AAAGGAGCTGGAGGAGATGCAGAGATGTACAAAGGAAGAGTATTTGGCTTCTCTCCGCCGCCAGAG
CAGTGGTTTCTCTAGAGGCGTCTCTAAATATCGCGGCGTCGCCAGGCATCACCATAACGGAAGATGG
GAAGCTCGGATTGGAAGGGTGTTTGGAAACAAGTACTTGTACCTCGGCACCTATAATACGCAGGAG
GAAGCTGCAGCTGCATATGACATGGCGGCTATAGAGTACAGAGGTGCAAACGCAGTGACCAACTTC
GACATTAGTAACTACATCGACCGGTTAAAGAAAAAAGGTGTCTTCCCGTTCCCCGTGAGCCAAGCTA
ATCATCAAGAAGCTGTTCTTGCTGAAACCAAACAAGAAGTGGAAGCTAAAGAAGAGCCTACAGAAG
AAGTGAAGCAGTGTGTCGAAAAAGAAGAAGCTAAAGAAGAGAAGACTGAGAAAAAACAACAACAA
GAAGTGGAGGAGGCGGTGATCACTTGCTGCATTGATTCTTCAGAGAGCAATGAGCTGGCTTGGGACT
TCTGTATGATGGATTCAGGGTTTGCTCCGTTTTTGACTGATTCAAATCTCTCGAGTGAGAATCCCATT
GAGTATCCTGAGCTTTTCAATGAGATGGGTTTTGAGGATAACATTGACTTCATGTTCGAGGAAGGGA
AGCAAGACTGCTTGAGCTTGGAGAATCTTGATTGTTGCGATGGTGTTGTTGTGGTGGGAAGAGAGAG
CCCAACTTCATTGTCGTCTTCTCCGTTGTCCTGCTTGTCTACTGACTCTGCTTCATCAACAACAACAA
CAGCAACAACAGTAACCTCTGTTTCTTGTAACTATTCTGTCTGAGGGGGGAGAGCTTTGCATTTCTAG
GTTGAATTTTCTATTTCTTTTGCTTCTTTTTTTTTTGTTGAGTTCTGCTAGGGTTTGTATTCTGTTTCAG
GGCTTACTCATTGGTTCTGACAGTCAATGTTTAGCTCTCTTTTCCGCTCGTCTA
SEQ ID NO:8-pcw4-1可读框的核酸序列
ATGAAGAGACCCTTAACCACTTCTCCTTCTTCCTCCTCTTCTACTTCTTCTTCGGCCTGTATACTTCCG
ACTCAATCAGAGACTCCAAGGCCCAAACGAGCCAAAAGGGCTAAGAAATCTTCTCTGCGTTCTGAT
GTTAAACCACAGAATCCCACCAGTCCTGCCTCCACCAGACGCAGCTCTATCTACAGAGGAGTCACTA
GACATAGATGGACAGGGAGATACGAAGCTCATCTATGGGACAAAAGCTCGTGGAATTCGATTCAGA
ACAAGAAAGGCAAACAAGTTTATCTGGGAGCATATGACAGCGAGGAAGCAGCAGCACATACGTAC
GATCTAGCTGCTCTCAAGTACTGGGGTCCCAACACCATCTTGAACTTTCCGGTTGAGACGTACACAA
AGGAGCTGGAGGAGATGCAGAGATGTACAAAGGAAGAGTATTTGGCTTCTCTCCGCCGCCAGAGCA
GTGGTTTCTCTAGAGGCGTCTCTAAATATCGCGGCGTCGCCAGGCATCACCATAACGGAAGATGGGA
AGCTCGGATTGGAAGGGTGTTTGGAAACAAGTACTTGTACCTCGGCACCTATAATACGCAGGAGGA
AGCTGCAGCTGCATATGACATGGCGGCTATAGAGTACAGAGGTGCAAACGCAGTGACCAACTTCGA
CATTAGTAACTACATCGACCGGTTAAAGAAAAAAGGTGTCTTCCCGTTCCCCGTGAGCCAAGCTAAT
CATCAAGAAGCTGTTCTTGCTGAAACCAAACAAGAAGTGGAAGCTAAAGAAGAGCCTACAGAAGAA
GTGAAGCAGTGTGTCGAAAAAGAAGAAGCTAAAGAAGAGAAGACTGAGAAAAAACAACAACAAGA
AGTGGAGGAGGCGGTGATCACTTGCTGCATTGATTCTTCAGAGAGCAATGAGCTGGCTTGGGACTTC
TGTATGATGGATTCAGGGTTTGCTCCGTTTTTGACTGATTCAAATCTCTCGAGTGAGAATCCCATTGA
GTATCCTGAGCTTTTCAATGAGATGGGTTTTGAGGATAACATTGACTTCATGTTCGAGGAAGGGAAG
CAAGACTGCTTGAGCTTGGAGAATCTTGATTGTTGCGATGGTGTTGTTGTGGTGGGAAGAGAGAGCC
CAACTTCATTGTCGTCTTCTCCGTTGTCCTGCTTGTCTACTGACTCTGCTTCATCAACAACAACAACA
GCAACAACAGTAACCTCTGTTTCTTGTAACTATTCTGTCTGA
SEQ ID NO:9-pcw4-1可读框的氨基酸序列
MKRPLTTSPSSSSSTSSSACILPTQSETPRPKRAKRAKKSSLRSDVKPQNPTSPASTRRSSIYRGVTRHRWT
GRYEAHLWDKSSWNSIQNKKGKQVYLGAYDSEEAAAHTYDLAALKYWGPNTILNFPVETYTKELEEM
QRCTKEEYLASLRRQSSGFSRGVSKYRGVARHHHNGRWEARIGRVFGNKYLYLGTYNTQEEAAAAYD
MAAIEYRGANAVTNFDISNYIDRLKKKGVFPFPVSQANHQEAVLAETKQEVEAKEEPTEEVKQCVEKEE
AKEEKTEKKQQQEVEEAVITCCIDSSESNELAWDFCMMDSGFAPFLTDSNLSSENPIEYPELFNEMGFED
NIDFMFEEGKQDCLSLENLDCCDGVVVVGRESPTSLSSSPLSCLSTDSASSTTTTATTVTSVSCNYSV
SEQ ID NQ:10-pcw5a-1的核酸序列
TAATGAAGAGACCCTTAACCACTTGTACATCTTCTTCTACATCATCTTCTACTTCTTCATCTTGTATCC
TTCGGAACCAACCAGAGACTCCAAGGCCTAAACGAGCCAAAAGGGCTAAGAAATCATCGCCCCCTT
GTGATGTAAAACCACAGAACCCGACCAGTCCTGCCTCTGCCAGACGCAGCTCTATCTACAGAGGAGT
CACCAGACATAGATGGACTGGGAGATTTGAGGCTCATCTATGGGATAAAAGCTCTTGGAATTCGATT
CAGAACAAGAAAGGCAAACAAGTTTATTTGGGAGCATATGACAGCGAGGAAGCAGCTGCACATACG
TACGATCTAGCTGCTCTCAAGTACTGGGGTCCCGACACCATCTTGAATTTTCCGGTTGAGACGTACA
AAAAGGAGTTGGATGAAATGCAGAGAGGCACAAAAGAAGAGTATTTGGGTTCTCTCCGCCGCCAGA
GCAGTGGTTTCTCCAGAGGCGTCTCTAAATATCGCGGCGTCGCCAGGCATCACCATAACGGAAGATG
GGAGGCTCGGATTGGAAGAGTTTTCGGAAACAAGTACTTATACCTCGGCACCTATAATACGCAGGA
GGAAGCTGCAGAAGCATATGACATGGCTGCGATTGAATATAGAGGTGCAAACGCTGTTACCAATTTT
GACATTAGTAATTACATCGACCGGCTAAAGAAAAAAGGCGTTTTCCCGTTCCGTGTGGACCAAGCTA
ACCATCAAGAGGCTGTTCTTGCTGAAGCCAAACAAGAAGCTAAGAAAGAAGTGAAAGAGCACGTGG
AAGAAGAACATCAAGAAGAGAAAACAGAGCAGCATCAAGAAGTGGAGGCGGTCACTTGCGGCATA
GATGCTTCAGGCATTATGGAGATGGAACGTTCTTCAGACAGCAATGAGTTGGCTTGGAACTTCTGTA
TGATGGATTCAGGGTTTGCTCCGTTCTTGACAGATCAAAACCTCTCGAATGAGAATCCCATAGAGTA
TCCTGAGCTTTTCAACGAGATGATGGGTTTTGAGGATAACGACATAGACTTCATGTTTGAGGAAGCC
AAGAACGAATGCTTGAGCTTGGAGAATCTGGATTGTTGTGATGTCGTTGTGGTGGGAAGAGAAAGC
CCAGCTTCTTTATCGTCTTCTCCGTTGTCTTGCTTTTCTACTGACTCTGCTTCATCAACAACAACAACA
ACAAACTCTGTTTCTTGTAACTATTCTGTCTGAGGGAGAGAGCTTTGCATTATAGGGTTGAGTTTTCT
ATTTCTTTTGCTTCTTGATCTTGTCCTTGTTGAGTTCCGCTAGGGTTTTTGTTTTTCGTTTCAGGGCTTA
CTCGTTGGTTCTGAACAATCAATGTCTTCGCCTCA
SEQ ID NO:11-pcw5a-1可读框的核酸序列
ATGAAGAGACCCTTAACCACTTGTACATCTTCTTCTACATCATCTTCTACTTCTTCATCTTGTATCCTT
CGGAACCAACCAGAGACTCCAAGGCCTAAACGAGCCAAAAGGGCTAAGAAATCATCGCCCCCTTGT
GATGTAAAACCACAGAACCCGACCAGTCCTGCCTCTGCCAGACGCAGCTCTATCTACAGAGGAGTC
ACCAGACATAGATGGACTGGGAGATTTGAGGCTCATCTATGGGATAAAAGCTCTTGGAATTCGATTC
AGAACAAGAAAGGCAAACAAGTTTATTTGGGAGCATATGACAGCGAGGAAGCAGCTGCACATACGT
ACGATCTAGCTGCTCTCAAGTACTGGGGTCCCGACACCATCTTGAATTTTCCGGTTGAGACGTACAA
AAAGGAGTTGGATGAAATGCAGAGAGGCACAAAAGAAGAGTATTTGGGTTCTCTCCGCCGCCAGAG
CAGTGGTTTCTCCAGAGGCGTCTCTAAATATCGCGGCGTCGCCAGGCATCACCATAACGGAAGATGG
GAGGCTCGGATTGGAAGAGTTTTCGGAAACAAGTACTTATACCTCGGCACCTATAATACGCAGGAG
GAAGCTGCAGAAGCATATGACATGGCTGCGATTGAATATAGAGGTGCAAACGCTGTTACCAATTTTG
ACATTAGTAATTACATCGACCGGCTAAAGAAAAAAGGCGTTTTCCCGTTCCGTGTGGACCAAGCTAA
CCATCAAGAGGCTGTTCTTGCTGAAGCCAAACAAGAAGCTAAGAAAGAAGTGAAAGAGCACGTGGA
AGAAGAACATCAAGAAGAGAAAACAGAGCAGCATCAAGAAGTGGAGGCGGTCACTTGCGGCATAG
ATGCTTCAGGCATTATGGAGATGGAACGTTCTTCAGACAGCAATGAGTTGGCTTGGAACTTCTGTAT
GATGGATTCAGGGTTTGCTCCGTTCTTGACAGATCAAAACCTCTCGAATGAGAATCCCATAGAGTAT
CCTGAGCTTTTCAACGAGATGATGGGTTTTGAGGATAACGACATAGACTTCATGTTTGAGGAAGCCA
AGAACGAATGCTTGAGCTTGGAGAATCTGGATTGTTGTGATGTCGTTGTGGTGGGAAGAGAAAGCC
CAGCTTCTTTATCGTCTTCTCCGTTGTCTTGCTTTTCTACTGACTCTGCTTCATCAACAACAACAACAA
CAAACTCTGTTTCTTGTAACTATTCTGTCTGA
SEQ ID NO:12-pcw5a-1可读框的氨基酸序列
MKRPLTTCTSSSTSSSTSSSCILRNQPETPRPKRAKRAKKSSPPCDVKPQNPTSPASARRSSIYRGVTRHRW
TGRFEAHLWDKSSWNSIQNKKGKQVYLGAYDSEEAAAHTYDLAALKYWGPDTILNFPVETYKKELDE
MQRGTKEEYLGSLRRQSSGFSRGVSKYRGVARHHHNGRWEARIGRVFGNKYLYLGTYNTQEEAAEAY
DMAAIEYRGANAVTNFDISNYIDRLKKKGVFPFRVDQANHQEAVLAEAKQEAKKEVKEHVEEEHQEEK
TEQHQEVEAVTCGIDASGIMEMERSSDSNELAWNFCMMDSGFAPFLTDQNLSNENPIEYPELFNEMMGF
EDNDIDFMFEEAKNECLSLENLDCCDVVVVGRESPASLSSSPLSCFSTDSASSTTTTTNSVSCNYSV
SEQ ID NO:13-pcw5b-1的核酸序列
TAATGAAGAGACCCTTAACCACTTGTACATCTTCTTCTACATCATCCTCTACTTCTTCATCTTGTATCC
TTCCGAACCAACCAGAGACTCCAAGGCCTAAACGAGCCAAAAGGGCTAAGAAATCATCTCCCCCTT
GTGATGTAAAACCACAGAACCCGACCAGTCCTGCCTCTGCCAGACGCAGCTCTATCTACAGAGGAGT
CACCAGACATAGATGGACTGGGAGATTTGAGGCTCATCTATGGGATAAAAGCTCTTGGAATTCGATT
CAGAACAAGAAAGGCAAACAAGTTTATCTGGGAGCATATGACAGCGAGGAAGCAGCTGCACATAC
GTACGATCTAGCTGCTCTCAAGTACTGGGGTCCCGACACCATCTTGAATTTTCCGGTTGAGACGTAC
ACAAAGGAGTTGGATGAAATGCAGAGAGGCACAAAAGAAGAGTATTTGGCTTCTCTCCGCCGCCAG
AGCAGTGGTTTCTCCAGAGGCGTCTCTAAATATCGCGGCGTCGCCAGGCATCACCATAACGGAAGAT
GGGAGGCTCGGATTGGAAGAGTTTTCGGAAACAAGTACTTATACCTCGGCACCTATAATACGCAGG
AGGAAGCTGCTGAAGCTTATGATATGGCTGCGATTGAATATAGAGGTGCAAACGCTGTTACCAATTT
CGACATTAGTAATTACATCGACCGTTTAAAGAAAAAAGGCGTTTTCCCGTTCCGTGTGGAGCAAGCC
ACTCATCAAGAGGCTGTTCTTGCTGAAGCCAAACAAGAAGCCAAGGAAGAAGTGAAAGAGCACGTG
GAAGAAGAACATCAAGAAGCGAGGGAAGAGACAACAGAGCAGAAACAAGAAGTGGAGGCGGTCA
CTTGCGGCGTAGATGCTTCAGGCATTATGGAGATGGAACGTTCTTCAGACAGCAATGAGTTGGCTTG
GAACTTCTGTATGATGGATTCAGGGTTTGCTCCGTTCTTGACAGATCAAAACCTCTCGAATGAGAAT
CCCATAGAGTATCCTGAACTTTTCAACGAGATGATGGGTTTTGAGGATAACGACATAGACTTCATGT
TCGAGGAAGCCAAGAACGAATGCTTGAGCTTGGAGAATCTGGATTGTTGTGATGTCGTTGTGGTGGG
AAGAGAAAGCCCAACTTCTTTGTCGTCTTCTCCGTTGTCTTGCTTTTCTACTGACTCTGCTTCATCAAC
AACAATAACAACAACAACAACAACCTCTGTTTCTTGTAACTATTCTGTCTGAGGGAGAGAGCTTTGC
ATTATAGGGTTGAGTTTTCTATTTCTTTTGCTTCTTGATCTTGTCCTTGTTGAGTTCCGCTAGGGTTTTT
GTTTTTCGTTTCAGGGCTTACTCGTTGGTTCTGAACAATCAATGTCTTCGCCTC
SEQ ID NO:14-pcw5b-1可读框的核酸序列
ATGAAGAGACCCTTAACCACTTGTACATCTTCTTCTACATCATCCTCTACTTCTTCATCTTGTATCCTT
CCGAACCAACCAGAGACTCCAAGGCCTAAACGAGCCAAAAGGGCTAAGAAATCATCTCCCCCTTGT
GATGTAAAACCACAGAACCCGACCAGTCCTGCCTCTGCCAGACGCAGCTCTATCTACAGAGGAGTC
ACCAGACATAGATGGACTGGGAGATTTGAGGCTCATCTATGGGATAAAAGCTCTTGGAATTCGATTC
AGAACAAGAAAGGCAAACAAGTTTATCTGGGAGCATATGACAGCGAGGAAGCAGCTGCACATACGT
ACGATCTAGCTGCTCTCAAGTACTGGGGTCCCGACACCATCTTGAATTTTCCGGTTGAGACGTACAC
AAAGGAGTTGGATGAAATGCAGAGAGGCACAAAAGAAGAGTATTTGGCTTCTCTCCGCCGCCAGAG
CAGTGGTTTCTCCAGAGGCGTCTCTAAATATCGCGGCGTCGCCAGGCATCACCATAACGGAAGATGG
GAGGCTCGGATTGGAAGAGTTTTCGGAAACAAGTACTTATACCTCGGCACCTATAATACGCAGGAG
GAAGCTGCTGAAGCTTATGATATGGCTGCGATTGAATATAGAGGTGCAAACGCTGTTACCAATTTCG
ACATTAGTAATTACATCGACCGTTTAAAGAAAAAAGGCGTTTTCCCGTTCCGTGTGGAGCAAGCCAC
TCATCAAGAGGCTGTTCTTGCTGAAGCCAAACAAGAAGCCAAGGAAGAAGTGAAAGAGCACGTGGA
AGAAGAACATCAAGAAGCGAGGGAAGAGACAACAGAGCAGAAACAAGAAGTGGAGGCGGTCACTT
GCGGCGTAGATGCTTCAGGCATTATGGAGATGGAACGTTCTTCAGACAGCAATGAGTTGGCTTGGAA
CTTCTGTATGATGGATTCAGGGTTTGCTCCGTTCTTGACAGATCAAAACCTCTCGAATGAGAATCCCA
TAGAGTATCCTGAACTTTTCAACGAGATGATGGGTTTTGAGGATAACGACATAGACTTCATGTTCGA
GGAAGCCAAGAACGAATGCTTGAGCTTGGAGAATCTGGATTGTTGTGATGTCGTTGTGGTGGGAAG
AGAAAGCCCAACTTCTTTGTCGTCTTCTCCGTTGTCTTGCTTTTCTACTGACTCTGCTTCATCAACAAC
AATAACAACAACAACAACAACCTCTGTTTCTTGTAACTATTCTGTCTGA
SEQ ID NO:15-pcw5b-1可读框的氨基酸序列
MKRPLTTCTSSSTSSSTSSSCILPNQPETPRPKRAKRAKKSSPPCDVKPQNPTSPASARRSSIYRGVTRHRW
TGRFEAHLWDKSSWNSIQNKKGKQVYLGAYDSEEAAAHTYDLAALKYWGPDTILNFPVETYTKELDEM
QRGTKEEYLASLRRQSSGFSRGVSKYRGVARHHHNGRWEARIGRVFGNKYLYLGTYNTQEEAAEAYD
MAAIEYRGANAVTNFDISNYIDRLKKKGVFPFRVEQATHQEAVLAEAKQEAKEEVKEHVEEEHQEAREE
TTEQKQEVEAVTCGVDASGIMEMERSSDSNELAWNFCMMDSGFAPFLTDQNLSNENPIEYPELFNEMM
GFEDNDIDFMFEEAKNECLSLENLDCCDVVVVGRESPTSLSSSPLSCFSTDSASSTTITTTTTTSVSCNYSV
SEQ ID NO:16-BnWRI01的核酸序列
GATTTCGTATTCCCCCAAACACACAAAATCTCATTCTCTTTTTTTCTCATAGTTTTTTTTAATGAAGAG
ACCCTTAACCACTTCTCCTTCTACCTCCTCTTCTACTTCTTCTTCGGCTTGTATACTTCCGACTCAACC
AGAGACTCCAAGGCCCAAACGAGCCAAAAGGGCTAAGAAATCTTCTATTCCTACTGATGTTAAACC
ACAGAATCCCACCAGTCCTGCCTCCACCAGACGCAGCTCTATCTACAGAGGAGTCACTAGACATAGA
TGGACAGGGAGATACGAGGCTCATCTATGGGACAAAAGCTCGTGGAATTCGATTCAGAACAAGAAA
GGCAAACAAGTTTATCTGGGAGCATATGACAGCGAGGAAGCAGCAGCGCATACGTACGATCTAGCT
GCTCTCAAGTACTGGGGTCCCGACACCATCTTGAACTTTCCGGCTGAGACGTACACAAAGGAGTTGG
AGGAGATGCAGAGATGTACAAAGGAAGAGTATTTGGCTTCTCTCCGCCGCCAGAGCAGTGGTTTCTC
TAGAGGCGTCTCTAAATATCGCGGCGTCGCCAGGCATCACCATAACGGAAGATGGGAAGCTAGGAT
TGGAAGGGTGTTTGGAAACAAGTACTTGTACCTCGGCACTTATAATACGCAGGAGGAAGCTGCAGC
TGCATATGACATGGCGGCTATAGAGTACAGAGGCGCAAACGCAGTGACCAACTTCGACATTAGTAA
CTACATCGACCGGTTAAAGAAAAAAGGTGTCTTCCCATTCCCTGTGAGCCAAGCCAATCATCAAGAA
GCTGTTCTTGCTGAAGCCAAACAAGAAGTGGAAGCTAAAGAAGAGCCTACAGAAGAAGTGAAGCA
GTGTGTCGAAAAAGAAGAACCGCAAGAAGCTAAAGAAGAGAAGACTGAGAAAAAACAACAACAAC
AAGAAGTGGAGGAGGCGGTGGTCACTTGCTGCATTGATTCTTCGGAGAGCAATGAGCTGGCTTGGG
ACTTCTGTATGATGGATTCAGGGTTTGCTCCGTTTTTGACGGATTCAAATCTCTCGAGTGAGAATCCC
ATTGAGTATCCTGAGCTTTTCAATGAGATGGGGTTTGAGGATAACATTGACTTCATGTTCGAGGAAG
GGAAGCAAGACTGCTTGAGCTTGGAGAATCTGGATTGTTGCGATGGTGTTGTTGTGGTGGGAAGAG
AGAGCCCAACTTCATTGTCGTCTTCACCGTTGTCTTGCTTGTCTACTGACTCTGCTTCATCAACAACA
ACAACAACAATAACCTCTGTTTCTTGTAACTATTCTGTCTGAGGGGGGAGAGCTTTGCATTTCTAGGT
TGAATTTTCTATTTCTTTTGCTTCTTTTTTTTTTGTTGAGTTCTGCTAGGGTTTGTATTCTGTTTCAGGG
CTTACTCATTGGTTCTGACAGTCAATGTTTAGCTCTCTTTTCCGCTCGTCTA
SEQ ID NO:17-BnWRI01可读框的核酸序列
ATGAAGAGACCCTTAACCACTTCTCCTTCTACCTCCTCTTCTACTTCTTCTTCGGCTTGTATACTTCCG
ACTCAACCAGAGACTCCAAGGCCCAAACGAGCCAAAAGGGCTAAGAAATCTTCTATTCCTACTGAT
GTTAAACCACAGAATCCCACCAGTCCTGCCTCCACCAGACGCAGCTCTATCTACAGAGGAGTCACTA
GACATAGATGGACAGGGAGATACGAGGCTCATCTATGGGACAAAAGCTCGTGGAATTCGATTCAGA
ACAAGAAAGGCAAACAAGTTTATCTGGGAGCATATGACAGCGAGGAAGCAGCAGCGCATACGTAC
GATCTAGCTGCTCTCAAGTACTGGGGTCCCGACACCATCTTGAACTTTCCGGCTGAGACGTACACAA
AGGAGTTGGAGGAGATGCAGAGATGTACAAAGGAAGAGTATTTGGCTTCTCTCCGCCGCCAGAGCA
GTGGTTTCTCTAGAGGCGTCTCTAAATATCGCGGCGTCGCCAGGCATCACCATAACGGAAGATGGGA
AGCTAGGATTGGAAGGGTGTTTGGAAACAAGTACTTGTACCTCGGCACTTATAATACGCAGGAGGA
AGCTGCAGCTGCATATGACATGGCGGCTATAGAGTACAGAGGCGCAAACGCAGTGACCAACTTCGA
CATTAGTAACTACATCGACCGGTTAAAGAAAAAAGGTGTCTTCCCATTCCCTGTGAGCCAAGCCAAT
CATCAAGAAGCTGTTCTTGCTGAAGCCAAACAAGAAGTGGAAGCTAAAGAAGAGCCTACAGAAGAA
GTGAAGCAGTGTGTCGAAAAAGAAGAACCGCAAGAAGCTAAAGAAGAGAAGACTGAGAAAAAACA
ACAACAACAAGAAGTGGAGGAGGCGGTGGTCACTTGCTGCATTGATTCTTCGGAGAGCAATGAGCT
GGCTTGGGACTTCTGTATGATGGATTCAGGGTTTGCTCCGTTTTTGACGGATTCAAATCTCTCGAGTG
AGAATCCCATTGAGTATCCTGAGCTTTTCAATGAGATGGGGTTTGAGGATAACATTGACTTCATGTT
CGAGGAAGGGAAGCAAGACTGCTTGAGCTTGGAGAATCTGGATTGTTGCGATGGTGTTGTTGTGGTG
GGAAGAGAGAGCCCAACTTCATTGTCGTCTTCACCGTTGTCTTGCTTGTCTACTGACTCTGCTTCATC
AACAACAACAACAACAATAACCTCTGTTTCTTGTAACTATTCTGTCTGA
SEQ ID NO:18-BnWRI01可读框的氨基酸序列
MKRPLTTSPSTSSSTSSSACILPTQPETPRPKRAKRAKKSSIPTDVKPQNPTSPASTRRSSIYRGVTRHRWTG
RYEAHLWDKSSWNSIQNKKGKQVYLGAYDSEEAAAHTYDLAALKYWGPDTILNFPAETYTKELEEMQ
RCTKEEYLASLRRQSSGFSRGVSKYRGVARHHHNGRWEARIGRVFGNKYLYLGTYNTQEEAAAAYDM
AAIEYRGANAVTNFDISNYIDRLKKKGVFPFPVSQANHQEAVLAEAKQEVEAKEEPTEEVKQCVEKEEP
QEAKEEKTEKKQQQQEVEEAVVTCCIDSSESNELAWDFCMMDSGFAPFLTDSNLSSENPIEYPELFNEMG
FEDNIDFMFEEGKQDCLSLENLDCCDGVVVVGRESPTSLSSSPLSCLSTDSASSTTTTTITSVSCNYSV
SEQ ID NO:19-BnWRI08的核酸序列
AGAGTATTTGGGACACGTGGTGGAATCTTCCGGTGGTCCGGAGCTTGGTTTTCACGGTGGAGCTAAC
AACGGAGGAGCTTTGTCACTTGGTGTTAACGTTAACAACTCTAATCACAGGACTAGTGATGATCATA
CTCAGATCACTGAGTATCATTACCGAGGAAATAACAATGGTGAAAGAACCAACAACGAGAAGACGG
TTTCTGAGAAGGAGAAGCCTGTTGTGGCTGTGGAGACATCAGATTGTTCTAACAAGAAGATCGCTGA
TACGTTTGGACAAAGGACTTCCATCTACAGAGGAGTTACAAGACATAGATGGACGGGAAGATATGA
AGCTCATCTATGGGATAATAGCTGTAGGCGAGAAGGTCAAGCCAGGAAAGGACGTCAAGTATACTT
GGGTGGATATGACAAAGAAGACAAGGCAGCTCGAGCTTATGATTATAGCAGCTCTTAAGTACTGGA
ATGCTACTGCTACCACCAATTTCCCTATTACAAACTACTCAAAAGAACTAGAGGAAATGAAGCACAT
GACCAAACAAGAGTTCATTGCTTCCCTTAGGAGGAAGAGTAGCGGATTCTCTAGAGGAGCCTCAAT
ATACAGAGGTGTGACAAGGCATCATCAACAAGGACGTTGGCAAGCAAGGATAGGCCGTGTAGCCGG
GAACAAAGATCTTTACCTAGGAACATTTGCAACGGAAGAGGAAGCAGCCGAGGCATACGACATAGC
AGCGATCAAATTCAGGGGAATAAACGCTGTAACAAACTTTGAGATGAACCGTTACGACGTTGAGGC
CATCATGAAGAGTGCACTTCCCATTGGTGGTGCAGCAAAACGTCTTAAGCTCTCTTTAGAAGCTGCA
GAGCAGAAACCAATCCTCGGTCATCAACATCAACTCCACCACTTCCAGCAACAACAGCAGCAACAG
ATTCAGTCCTCTCCGAACCACAGTAGCATTAACTTCGCTCAATCTCAGATGATTCCTGTGGGATCCCT
TTTGAAGCTGCTGCTCTCTACCATCATCAACAGCAACAACAGCAGCAGCAGCAACAGAACTTCTTCC
AGCATTTTCCGGCGAATGTTCGAGCTACTGACTCGACCGGTTCTAATAATAACTCCAACGTTCAAGG
TTCAATGGGACTTATGGTGCCGAATCAGGCTGAGTTCTTCCTCTGGCCTAACCAGTCTTACTAGAATC
AATCATGTTATGTTTTTTGTTTTTTTTTTTTTGTTTTAGTTTTTAATGGTTTTTAAGGGATAACAACTTC
TTTCTAATGTTCAACTTCTTGATTCTAGCTAACCCCATAAGCTGACTANAAGGATATGAAAATCTCAC
TTGTNCCGNGTTACTCNGTTTCCATTTAATGAAATGNGTTTCTGTTTANGTA
SEQ ID NO:20-BnWRI08可读框的核酸序列
ATGATCATACTCAGATCACTGAGTATCATTACCGAGGAAATAACAATGGTGAAAGAACCAACAACG
AGAAGACGGTTTCTGAGAAGGAGAAGCCTGTTGTGGCTGTGGAGACATCAGATTGTTCTAACAAGA
AGATCGCTGATACGTTTGGACAAAGGACTTCCATCTACAGAGGAGTTACAAGACATAGATGGACGG
GAAGATATGAAGCTCATCTATGGGATAATAGCTGTAGGCGAGAAGGTCAAGCCAGGAAAGGACGTC
AAGTATACTTGGGTGGATATGACAAAGAAGACAAGGCAGCTCGAGCTTATGATTATAGCAGCTCTT
AAGTACTGGAATGCTACTGCTACCACCAATTTCCCTATTACAAACTACTCAAAAGAACTAGAGGAAA
TGAAGCACATGACCAAACAAGAGTTCATTGCTTCCCTTAGGAGGAAGAGTAGCGGATTCTCTAGAG
GAGCCTCAATATACAGAGGTGTGACAAGGCATCATCAACAAGGACGTTGGCAAGCAAGGATAGGCC
GTGTAGCCGGGAACAAAGATCTTTACCTAGGAACATTTGCAACGGAAGAGGAAGCAGCCGAGGCAT
ACGACATAGCAGCGATCAAATTCAGGGGAATAAACGCTGTAACAAACTTTGAGATGAACCGTTACG
ACGTTGAGGCCATCATGAAGAGTGCACTTCCCATTGGTGGTGCAGCAAAACGTCTTAAGCTCTCTTT
AGAAGCTGCAGAGCAGAAACCAATCCTCGGTCATCAACATCAACTCCACCACTTCCAGCAACAACA
GCAGCAACAGATTCAGTCCTCTCCGAACCACAGTAGCATTAACTTCGCTCAATCTCAGATGATTCCT
GTGGGATCCCTTTTGAAGCTGCTGCTCTCTACCATCATCAACAGCAACAACAGCAGCAGCAGCAACA
GAACTTCTTCCAGCATTTTCCGGCGAATGTTCGAGCTACTGACTCGACCGGTTCTAATAATAACTCCA
ACGTTCAAGGTTCAATGGGACTTATGGTGCCGAATCAGGCTGAGTTCTTCCTCTGGCCTAACCAGTC
TTACTAGAATCAATCATGTTATGTTTTTTGTTTTTTTTTTTTTGTTTTAG
SEQ ID NO:21-BnWRI08可读框的氨基酸序列
MIILRSLSIITEEITMVKEPTTRRRFLRRRSLLWLWRHQIVLTRRSLIRLDKGLPSTEELQDIDGREDMKLIY
GIIAVGEKVKPGKDVKYTWVDMTKKTRQLELMIIAALKYWNATATTNFPITNYSKELEEMKHMTKQEFI
ASLRRKSSGFSRGASIYRGVTRHHQQGRWQARIGRVAGNKDLYLGTFATEEEAAEAYDIAAIKFRGINAV
TNFEMNRYDVEAIMKSALPIGGAAKRLKLSLEAAEQKPILGHQHQLHHFQQQQQQQIQSSPNHSSINFAQ
SQMIPVGSLLKLLLSTIINSNNSSSSNRTSSSIFRRMFELLTRPVLIITPTFKVQWDLWCRIRLSSSSGLTSLTR
INHVMFFVFFFLF
SEQ ID NO:22-psw2的核酸序列
AAGCAGTGGTAACAACGCAGAGTACGCGGGATTCAAGTACTTCTTCTTTGTAACCAAACTAAAACCT
CTTGATTTATTGTTTCATTTAATCAAATAGTAGTAATAATATCACCACCGCACCGACATGGAGTAGA
AGTAGCTCTTCATTCAAAGAGTAACGCCTCTCCAGAGACTAGTACTTCATTTTGCACCATTGATATCT
CAAATGGCTCGTGCTTCGACTAACTGGCTATCGTTCTCTCTCTCCCCCATGGAAATGCTCCGAACCCC
CGAACCTCAGTTCGTTCAATACGACGCCGCTTCCGACACTTCCTCGCATCACTACTACCTCGACAACT
TGTACACCAACGGGTGGGGGAACGGGAGCCTCAAGTTTGAGCAGAATCTGAACCACAGCGACGTGA
GTTTCGTTGAATCGTCGTCGCAGAGCGTCAGCCACGCGCCGCCGAAGCTGGAGGATTTTCTCGGCGA
CTCCTCCGCTGTTATGCGTTACTCCGACAGCCAGACGGAGACGCAGGACTCGTCGCTGACGCACATC
TACGACCACCACCACCACCACCACCACCACCACCACCACGGTTCTTCTGCGTACTTCGGCGGTGACC
ACCAGGATCTCAAGGCCATTACTGGATTCCAAGCTTTTTCGACTAACTCTGGCTCCGAGGTTGATGA
TTCTGCATCGATCGGAAAGGCGCAGGGCAGCGAGTTCGGGACTCACTCTATTGAGTCCTCCGTCAAC
GAGTTCGCCGCGTTCTCCGGTGGCACCAACACCGGTGGAACCTTGTCGCTCGCCGTCGCGCAGAGCT
CCGAGAAGGCCGTCGCTGCTGCGGCGGAGTCCGATCGCTCGAAGAAGGTTGTGGATACCTTCGGCC
AGCGGACTTCTATATACAGAGGTGTCACTAGGCACCGATGGACAGGAAGATATGAAGCGCATCTAT
GGGACAATAGTTGCAGAAGGGAGGGTCAAGCTAGAAAAGGGCGTCAAGTTTATTTGGGTGGATATG
ATAAGGAAGAAAAGGCCGCTAGATCTTATGATTTGGCAGCTCTGAAGTACTGGGGTCCCACTGCTAC
CACCAACTTCCCTGTTTCCAATTATTCAAAGGAAGTGGAGGAGATGAAACATGTAACAAAGCAGGA
ATTTATCGCATCATTGCGAAGGAAAAGTAGTGGTTTCTCCAGGGGAGCTTCCATATACAGAGGTGTT
ACAAGGCATCATCAACAGGGTAGGTGGCAAGCAAGAATTGGCCGTGTAGCTGGAAACAAAGATCTT
TACTTGGGAACATTCGCAACCGAGGAGGAAGCAGCAGAGGCATATGATATTGCAGCCATTAAGTTC
AGAGGTGCAAACGCGGTAACCAACTTTGAGATGAATAGATATGATGTGGAAGCTATAATGAAGAGT
TCTCTTCCAGTGGGTGGGGCAGCAAAGCGCTTGAAGCTTTCCCTTGAATCAGAGCAGAAAGCTCTTC
CTGTGAGCAGCAGCAGCAGCAGCAATCAACAGCAGAATCCACAGTGTGGAAACGTGAGTGCCAGCA
TCAATTTCTCATCCATTCATCAGCCAATTGCTTCTATCCCTTGTGGAATTCCCTTTGATTCAACAACA
GCATATTATCATCACAACCTTTTCCAACATTTTCACCCTACCAACGCTGGCACAGCAGCGTCTGCTGT
TACTTCTGCCAATGCAAATGCACTAACTGCACTGCCACCAACAGCAGCAGCTGAGTTCTTTATTTGG
CCTCATCAGTCTTATTGAAAAAAGAAAAAGAAAAAAAAGAGGAGGTTTTTGAGTTGGCTAGTCTTG
GTTACAGTAGGAAGCTGGATATGTAACTAACTGCTTAAGAAATGAGAAATATTTCGTGCATCATAAT
TTTGCACAAGAAAAAAAAAGA
SEQ ID NO:23-psw2可读框的核酸序列
ATGGCTCGTGCTTCGACTAACTGGCTATCGTTCTCTCTCTCCCCCATGGAAATGCTCCGAACCCCCGA
ACCTCAGTTCGTTCAATACGACGCCGCTTCCGACACTTCCTCGCATCACTACTACCTCGACAACTTGT
ACACCAACGGGTGGGGGAACGGGAGCCTCAAGTTTGAGCAGAATCTGAACCACAGCGACGTGAGTT
TCGTTGAATCGTCGTCGCAGAGCGTCAGCCACGCGCCGCCGAAGCTGGAGGATTTTCTCGGCGACTC
CTCCGCTGTTATGCGTTACTCCGACAGCCAGACGGAGACGCAGGACTCGTCGCTGACGCACATCTAC
GACCACCACCACCACCACCACCACCACCACCACCACGGTTCTTCTGCGTACTTCGGCGGTGACCACC
AGGATCTCAAGGCCATTACTGGATTCCAAGCTTTTTCGACTAACTCTGGCTCCGAGGTTGATGATTCT
GCATCGATCGGAAAGGCGCAGGGCAGCGAGTTCGGGACTCACTCTATTGAGTCCTCCGTCAACGAG
TTCGCCGCGTTCTCCGGTGGCACCAACACCGGTGGAACCTTGTCGCTCGCCGTCGCGCAGAGCTCCG
AGAAGGCCGTCGCTGCTGCGGCGGAGTCCGATCGCTCGAAGAAGGTTGTGGATACCTTCGGCCAGC
GGACTTCTATATACAGAGGTGTCACTAGGCACCGATGGACAGGAAGATATGAAGCGCATCTATGGG
ACAATAGTTGCAGAAGGGAGGGTCAAGCTAGAAAAGGGCGTCAAGTTTATTTGGGTGGATATGATA
AGGAAGAAAAGGCCGCTAGATCTTATGATTTGGCAGCTCTGAAGTACTGGGGTCCCACTGCTACCAC
CAACTTCCCTGTTTCCAATTATTCAAAGGAAGTGGAGGAGATGAAACATGTAACAAAGCAGGAATTT
ATCGCATCATTGCGAAGGAAAAGTAGTGGTTTCTCCAGGGGAGCTTCCATATACAGAGGTGTTACAA
GGCATCATCAACAGGGTAGGTGGCAAGCAAGAATTGGCCGTGTAGCTGGAAACAAAGATCTTTACT
TGGGAACATTCGCAACCGAGGAGGAAGCAGCAGAGGCATATGATATTGCAGCCATTAAGTTCAGAG
GTGCAAACGCGGTAACCAACTTTGAGATGAATAGATATGATGTGGAAGCTATAATGAAGAGTTCTCT
TCCAGTGGGTGGGGCAGCAAAGCGCTTGAAGCTTTCCCTTGAATCAGAGCAGAAAGCTCTTCCTGTG
AGCAGCAGCAGCAGCAGCAATCAACAGCAGAATCCACAGTGTGGAAACGTGAGTGCCAGCATCAAT
TTCTCATCCATTCATCAGCCAATTGCTTCTATCCCTTGTGGAATTCCCTTTGATTCAACAACAGCATA
TTATCATCACAACCTTTTCCAACATTTTCACCCTACCAACGCTGGCACAGCAGCGTCTGCTGTTACTT
CTGCCAATGCAAATGCACTAACTGCACTGCCACCAACAGCAGCAGCTGAGTTCTTTATTTGGCCTCA
TCAGTCTTATTGA
SEQ ID NO:24-psw2可读框的氨基酸序列
MARASTNWLSFSLSPMEMLRTPEPQFVQYDAASDTSSHHYYLDNLYTNGWGNGSLKFEQNLNHSDVSF
VESSSQSVSHAPPKLEDFLGDSSAVMRYSDSQTETQDSSLTHIYDHHHHHHHHHHHGSSAYFGGDHQDL
KAITGFQAFSTNSGSEVDDSASIGKAQGSEFGTHSIESSVNEFAAFSGGTNTGGTLSLAVAQSSEKAVAAA
AESDRSKKVVDTFGQRTSIYRGVTRHRWTGRYEAHLWDNSCRREGQARKGRQVYLGGYDKEEKAARS
YDLAALKYWGPTATTNFPVSNYSKEVEEMKHVTKQEFIASLRRKSSGFSRGASIYRGVTRHHQQGRWQ
ARIGRVAGNKDLYLGTFATEEEAAEAYDIAAIKFRGANAVTNFEMNRYDVEAIMKSSLPVGGAAKRLKL
SLESEQKALPVSSSSSSNQQQNPQCGNVSASINFSSIHQPIASIPCGIPFDSTTAYYHHNLFQHFHPTNAGTA
ASAVTSANANALTALPPTAAAEFFIWPHQSY
SEQ ID NO:25-psw6的核酸序列
GATAGATTGCAGTTTCCAAAGAACCCAACTCAACTTCAAAACCCCATAATAATCTCTCTTTGACATT
CATAAAAAACACACACCATGGACTCTTGTTCATCACCGCCAAACAACAACTCCCTCGCTTTCTCTCTT
TCCAATCACTTTCCCAACCCTTCCTCCTCTCCCCTCTCCCTTTTCCACTCCTTCACCTATCCATCTCTCT
CTCTCACAGGAAGCCACACGGCGGATGCACCTCCTGAGCCCATCGCCGGCGGAGGAGCGACCAACC
TCTCCATATTCACCGGCGCCCCCAAGTTCGAGGACTTTCTGGGCGGTTCCTCCGCAACAGCCACCGC
CACCACGTGTGCACCGCCACAGCTTCCGCAGTTCTCCACCGACAACAACAACCACCTGTACGATTCG
GAGCTGAAGACAACAATAGCCGCGTGCTTCCCTCGCGCCTTTGCCGCCGAACCAACCACCGAACCTC
AGAAACCCTCTCCAAAGAAAACCGTCGACACCTTCGGCCAACGCACCTCCATCTACCGCGGCGTCAC
CCGACATAGATGGACGGGAAGATACGAAGCTCATCTATGGGACAATAGTTGTAGAAGAGAAGGCCA
AAGCAGGAAAGGAAGACAAGTTTACCTGGGTGGTTATGACAAGGAAGATAAGGCAGCCAGGGCTT
ACGATCTCGCAGCTCTCAAGTACTGGGGTCCAACTACCACCACCAACTTTCCCATTTCCAACTATGA
GAAGGAACTGGAGGAGATGAAGAACATGACCAGGCAAGAGTTTGTTGCTTCTCTACGAAGGAAGAG
CAGTGGTTTCTCTAGGGGGGCCTCTATATACAGAGGAGTGACGAGACACCACCAGCATGGCCGATG
GCAGGCGAGAATAGGCAGAGTTGCCGGAAACAAAGACCTCTACCTTGGAACTTTCAGCACCCAAGA
AGAAGCTGCTGAGGCCTATGACATTGCTGCTATCAAATTCAGGGGATTAAATGCAGTCACAAACTTT
GACATGAGTCGCTACGATGTAAAGAGCATTGCAAATAGCACTCTTCCAATTGGAGGTTTATCTGGCA
AGAACAAGAACTCCACAGATTCTGCATCTGAGAGCAAGAGCCACGAGGCAAGCCGATCCGACGAAC
GAGATCCATCAGCGGCTTCATCCGTGACCTTTGCATCACAGCAACAGCCTTCGAGCTCCACCTTAAG
CTTTGCCATACCCATTAAGCAAGACCCTTCAGATTACTGGTCCATCCTGGGGTACCATAATTCTCCCC
TTGACAACACTGGCATCAGGAACACTACTAGTGTTACTGCAACTTCTTTTCCATCCTCCAACAATGGC
ACTACTAGTAGTTTGACACCCTTCCACATGGAATTCTCAAATGCCCCCACAAGTACCGGCAGTGATA
ACGATGCCGCGTTTTTCAGTGGAGGAGGCATCTTTGTTCAGCAACAAAGTGGTCATGGTAATGGTCA
TGGAAGTGGAAGCAGTGGTTCCTCCTCTTCTTCTTTAAGCTGTTCAATCCCATTCGCCACGCCCATCT
TTTCTCTAAATAGCAATACTAGTTATGAGAACAGTGCTGGTTATGGAAACTGGATTGGACCTACCCT
GCACACATTCCAATCCCATGCAAAACCAAGTCTCTTTCAAACGCCAATATTTGGAATGGAATGAGCT
CATGCACGAGGTGGGATGAGAATCTGTGCATATAATGATGAAAGGGGAAGGGCAATAGTGGTGATG
GTGTTTTAGCATGCAAAAGAAGCAAGGACGAACTAGTACCTTTAGCTGATGCAGTATTTGAATGAGT
TGGACTGACAGTCATAATTTCATGAGAAGCGTAGCTATACCTAGCAGCAGCTGACACTGTACTAACT
CAAAGTTCCTTTGTTATGTTTTGGATGAATTTTCTTTTTTTTCTTTTTCGCCCCCTTTTTAGCTTTTTGT
CCCTGTTAATATACTGACATCATTTCAAATGAGTATAATGGGAAGAAAAAAGAAAATCCTTTTGTAA
TCCCCTTTCATCTCATTTTTGTTAGTATTAAAAACTTGCTATATCTATGCGAAAGGCATTCAATGCCT
ATATATAGA
SEQ ID NO:26-psw6可读框的核酸序列
ATGGACTCTTGTTCATCACCGCCAAACAACAACTCCCTCGCTTTCTCTCTTTCCAATCACTTTCCCAA
CCCTTCCTCCTCTCCCCTCTCCCTTTTCCACTCCTTCACCTATCCATCTCTCTCTCTCACAGGAAGCCA
CACGGCGGATGCACCTCCTGAGCCCATCGCCGGCGGAGGAGCGACCAACCTCTCCATATTCACCGGC
GCCCCCAAGTTCGAGGACTTTCTGGGCGGTTCCTCCGCAACAGCCACCGCCACCACGTGTGCACCGC
CACAGCTTCCGCAGTTCTCCACCGACAACAACAACCACCTGTACGATTCGGAGCTGAAGACAACAAT
AGCCGCGTGCTTCCCTCGCGCCTTTGCCGCCGAACCAACCACCGAACCTCAGAAACCCTCTCCAAAG
AAAACCGTCGACACCTTCGGCCAACGCACCTCCATCTACCGCGGCGTCACCCGACATAGATGGACG
GGAAGATACGAAGCTCATCTATGGGACAATAGTTGTAGAAGAGAAGGCCAAAGCAGGAAAGGAAG
ACAAGTTTACCTGGGTGGTTATGACAAGGAAGATAAGGCAGCCAGGGCTTACGATCTCGCAGCTCTC
AAGTACTGGGGTCCAACTACCACCACCAACTTTCCCATTTCCAACTATGAGAAGGAACTGGAGGAG
ATGAAGAACATGACCAGGCAAGAGTTTGTTGCTTCTCTACGAAGGAAGAGCAGTGGTTTCTCTAGGG
GGGCCTCTATATACAGAGGAGTGACGAGACACCACCAGCATGGCCGATGGCAGGCGAGAATAGGCA
GAGTTGCCGGAAACAAAGACCTCTACCTTGGAACTTTCAGCACCCAAGAAGAAGCTGCTGAGGCCT
ATGACATTGCTGCTATCAAATTCAGGGGATTAAATGCAGTCACAAACTTTGACATGAGTCGCTACGA
TGTAAAGAGCATTGCAAATAGCACTCTTCCAATTGGAGGTTTATCTGGCAAGAACAAGAACTCCACA
GATTCTGCATCTGAGAGCAAGAGCCACGAGGCAAGCCGATCCGACGAACGAGATCCATCAGCGGCT
TCATCCGTGACCTTTGCATCACAGCAACAGCCTTCGAGCTCCACCTTAAGCTTTGCCATACCCATTAA
GCAAGACCCTTCAGATTACTGGTCCATCCTGGGGTACCATAATTCTCCCCTTGACAACACTGGCATC
AGGAACACTACTAGTGTTACTGCAACTTCTTTTCCATCCTCCAACAATGGCACTACTAGTAGTTTGAC
ACCCTTCCACATGGAATTCTCAAATGCCCCCACAAGTACCGGCAGTGATAACGATGCCGCGTTTTTC
AGTGGAGGAGGCATCTTTGTTCAGCAACAAAGTGGTCATGGTAATGGTCATGGAAGTGGAAGCAGT
GGTTCCTCCTCTTCTTCTTTAAGCTGTTCAATCCCATTCGCCACGCCCATCTTTTCTCTAAATAGCAAT
ACTAGTTATGAGAACAGTGCTGGTTATGGAAACTGGATTGGACCTACCCTGCACACATTCCAATCCC
ATGCAAAACCAAGTCTCTTTCAAACGCCAATATTTGGAATGGAATGA
SEQ ID NO:27-psw6可读框的氨基酸序列
MDSCSSPPNNNSLAFSLSNHFPNPSSSPLSLFHSFTYPSLSLTGSHTADAPPEPIAGGGATNLSIFTGAPKFE
DFLGGSSATATATTCAPPQLPQFSTDNNNHLYDSELKTTIAACFPRAFAAEPTTEPQKPSPKKTVDTFGQR
TSIYRGVTRHRWTGRYEAHLWDNSCRREGQSRKGRQVYLGGYDKEDKAARAYDLAALKYWGPTTTTN
FPISNYEKELEEMKNMTRQEFVASLRRKSSGFSRGASIYRGVTRHHQHGRWQARIGRVAGNKDLYLGTF
STQEEAAEAYDIAAIKFRGLNAVTNFDMSRYDVKSIANSTLPIGGLSGKNKNSTDSASESKSHEASRSDER
DPSAASSVTFASQQQPSSSTLSFAIPIKQDPSDYWSILGYHNSPLDNTGIRNTTSVTATSFPSSNNGTTSSLT
PFHMEFSNAPTSTGSDNDAAFFSGGGIFVQQQSGHGNGHGSGSSGSSSSSLSCSIPFATPIFSLNSNTSYENS
AGYGNWIGPTLHTFQSHAKPSLFQTPIFGME
SEQ ID NO:28-GmWRI02的核酸序列
CCTCTTGATTTATTGTTTCATTTAATCAAATAGTAGTAATAATATCACCACCGCGCCGACATGGAGTA
GAAGTAGCTCTTCATTCAAAGAGTAACGCCTCTCCAGAGACTAGTACTTCATTTTGCACCATTGATAT
CTCAAATGGCTCGTGCTTCGACTAACTGGCTATCGTTCTCTCTCTCCCCCATGGAAATGCTCCGAACC
CCCGAACCTCAGTTCGTTCAATACGACGCCGCTTCCGACACTTCCTCGCATCACTACTACCTCGACAA
CTTGTACACCAACGGGTGGGGGAACGGGAGCCTCAAGTTTGAGCAGAATCTGAACCACAGCGACGT
GAGTTTCGTTGAATCGTCGTCGCAGAGCGTCAGCCACGCGCCGCCGAAGCTGGAGGATTTTCTCGGC
GACTCCTCCGCTGTTATGCGTTACTCCGACAGCCAGACGGAGACGCAGGACTCGTCGCTGACGCACA
TCTACGACCACCACCACCACCACCACCACCACCACCACCACGGTTCTTCTGCGTACTTCGGCGGTGA
CCACCAGGATCTCAAGGCCATTACTGGATTCCAAGCTTTTTCGACTAACTCTGGCTCCGAGGTTGAT
GATTCTGCATCGATCGGAAAGGCGCAGGGCAGCGAGTTCGGGACTCACTCTATTGAGTCCTCCGTCA
ACGAGTTCGCCGCGTTCTCCGGTGGCACCAACACCGGTGGAACCTTGTCGCTCGCCGTCGCGCAGAG
CTCCGAGAAGGCCGTCGCTGCTGCGGCGGAGTCCGATCGCTCGAAGAAGGTTGTGGATACCTTCGGC
CAGCGGACTTCTATATACAGAGGTGTCACTAGGCACCGATGGACAGGAAGATATGAAGCGCATCTA
TGGGACAATAGTTGCAGAAGGGAGGGTCAAGCCAGAAAAGGGCGTCAAGTTTATTTGGGTGGATAT
GATAAGGAAGAAAAGGCCGCGAGAGCTTATGATTTGGCAGCTCTAAAGTACTGGGGTCCCACTGCT
ACCACCAACTTCCCTGTTTCCAATTATTCGAAGGAAGTGGAGGAGATGAAACATGTAACAAAGCAA
GAATTTATTGCATCATTGCGGAGGAAAAGTAGTGGTTTCTCCAGGGGAGCTTCCATATACAGAGGTG
TTACAAGGCATCATCAACAGGGTAGGTGGCAAGCAAGAATTGGCCGTGTAGCTGGAAACAAAGATT
TATACTTGGGAACATTCGCAACCGAGGAGGAAGCAGCAGAGGCATATGATATTGCAGCCATAAAGT
TCAGAGGTGCAAACGCGGTAACCAACTTTGAGATGAATAGATATGATGTGGAAGCTATAATGAAGA
GTTCTCTTCCAGTGGGTGGGGCAGCAAAACGCTTGAGGCTTTCCCTTGAATCAGAGCAGAAAGCTCC
TCCTGTGAACAGCAGCAGTCAGCAGCAGAATCCACAGTGTGGTAACGTGAGTGGTAGCATCAATTTC
TCAGCCATTCATCAGCCAATTGCTTCAATCCCTTGTGGAATTCCGTTTGATTCAACAACAGCATATTA
TCCTCACAACCTTTTCCAACATTTTCACCCTACCAACGCTGGTGCAGCAGCGTCTGCTGTTACTTCTG
CCAATGCAACCGCACTAACTGCACTGCCAGCATCAGCAGCAACTGAGTTCTTTATTTGGCCTCATCA
GTCTTATTGA
SEQ ID NO:29-GmWRI02可读框的核酸序列
ATGGCTCGTGCTTCGACTAACTGGCTATCGTTCTCTCTCTCCCCCATGGAAATGCTCCGAACCCCCGA
ACCTCAGTTCGTTCAATACGACGCCGCTTCCGACACTTCCTCGCATCACTACTACCTCGACAACTTGT
ACACCAACGGGTGGGGGAACGGGAGCCTCAAGTTTGAGCAGAATCTGAACCACAGCGACGTGAGTT
TCGTTGAATCGTCGTCGCAGAGCGTCAGCCACGCGCCGCCGAAGCTGGAGGATTTTCTCGGCGACTC
CTCCGCTGTTATGCGTTACTCCGACAGCCAGACGGAGACGCAGGACTCGTCGCTGACGCACATCTAC
GACCACCACCACCACCACCACCACCACCACCACCACGGTTCTTCTGCGTACTTCGGCGGTGACCACC
AGGATCTCAAGGCCATTACTGGATTCCAAGCTTTTTCGACTAACTCTGGCTCCGAGGTTGATGATTCT
GCATCGATCGGAAAGGCGCAGGGCAGCGAGTTCGGGACTCACTCTATTGAGTCCTCCGTCAACGAG
TTCGCCGCGTTCTCCGGTGGCACCAACACCGGTGGAACCTTGTCGCTCGCCGTCGCGCAGAGCTCCG
AGAAGGCCGTCGCTGCTGCGGCGGAGTCCGATCGCTCGAAGAAGGTTGTGGATACCTTCGGCCAGC
GGACTTCTATATACAGAGGTGTCACTAGGCACCGATGGACAGGAAGATATGAAGCGCATCTATGGG
ACAATAGTTGCAGAAGGGAGGGTCAAGCCAGAAAAGGGCGTCAAGTTTATTTGGGTGGATATGATA
AGGAAGAAAAGGCCGCGAGAGCTTATGATTTGGCAGCTCTAAAGTACTGGGGTCCCACTGCTACCA
CCAACTTCCCTGTTTCCAATTATTCGAAGGAAGTGGAGGAGATGAAACATGTAACAAAGCAAGAAT
TTATTGCATCATTGCGGAGGAAAAGTAGTGGTTTCTCCAGGGGAGCTTCCATATACAGAGGTGTTAC
AAGGCATCATCAACAGGGTAGGTGGCAAGCAAGAATTGGCCGTGTAGCTGGAAACAAAGATTTATA
CTTGGGAACATTCGCAACCGAGGAGGAAGCAGCAGAGGCATATGATATTGCAGCCATAAAGTTCAG
AGGTGCAAACGCGGTAACCAACTTTGAGATGAATAGATATGATGTGGAAGCTATAATGAAGAGTTC
TCTTCCAGTGGGTGGGGCAGCAAAACGCTTGAGGCTTTCCCTTGAATCAGAGCAGAAAGCTCCTCCT
GTGAACAGCAGCAGTCAGCAGCAGAATCCACAGTGTGGTAACGTGAGTGGTAGCATCAATTTCTCA
GCCATTCATCAGCCAATTGCTTCAATCCCTTGTGGAATTCCGTTTGATTCAACAACAGCATATTATCC
TCACAACCTTTTCCAACATTTTCACCCTACCAACGCTGGTGCAGCAGCGTCTGCTGTTACTTCTGCCA
ATGCAACCGCACTAACTGCACTGCCAGCATCAGCAGCAACTGAGTTCTTTATTTGGCCTCATCAGTC
TTATTGA
SEQ ID NO:30-GmWRI02可读框的氨基酸序列
MARASTNWLSFSLSPMEMLRTPEPQFVQYDAASDTSSHHYYLDNLYTNGWGNGSLKFEQNLNHSD
VSFVESSSQSVSHAPPKLEDFLGDSSAVMRYSDSQTETQDSSLTHIYDHHHHHHHHHHHGSSAYFG
GDHQDLKAITGFQAFSTNSGSEVDDSASIGKAQGSEFGTHSIESSVNEFAAFSGGTNTGGTLSLAVA
QSSEKAVAAAAESDRSKKVVDTFGQRTSIYRGVTRHRWTGRYEAHLWDNSCRREGQARKGRQVY
LGGYDKEEKAARAYDLAALKYWGPTATTNFPVSNYSKEVEEMKHVTKQEFIASLRRKSSGFSRGA
SIYRGVTRHHQQGRWQARIGRVAGNKDLYLGTFATEEEAAEAYDIAAIKFRGANAVTNFEMNRYD
VEAIMKSSLPVGGAAKRLRLSLESEQKAPPVNSSSQQQNPQCGNVSGSINFSAIHQPIASIPCGIPFDST
TAYYPHNLFQHFHPTNAGAAASAVTSANATALTALPASAATEFFIWPHQSY
SEQ ID NO:31-GmWRI03的核酸序列
CCTTGCTGTAGCTAAACAACAAAAACCAAGTCTTCATTGGTAACAAGAAGATTATTATTTTTATATG
ATTTGTTTATTTATCACCCAATGATTGACTTTGCCTAGCTGCAGCTGCTACGAGAGAAGATACTGCTG
GTGGTGGTGCTAGCAATAGCAAGTTTAAAGTTCAAACCTTTTTCAAGTAATTTATAAGTTGAGAAAG
AAAAGAAAAAACCAAGAAAAAAAGAAGCAAAGATGAAGTCCATGAATGATAGTAACACCGTTGAT
GATGGGAACAATCATAATAACTGGTTGGGATTCTCTCTCTCACCCCACATGAAAATGGATGTTGTTA
CTTCTTCTACTACCACTGGTCCTCATCATCCCCACCAACACCATCATCATCATCACTACTATCATCAC
CCTCACGAGGCTTCTGCTGCAGCTTGCAACAACAACAACAACACTGTTCCCACTAACTTCTATATGT
CACCCTCGCACCTCAACACCTCTGGAATATGTTATGGTGTTGGAGAAAACAGTGCCTTTCACACTCC
TTTGGCCATGATGCCTCTCAAGTCAGATGGGTCACTTTGCATTATGGAGGCTCTAACAAGATCACAA
ACCCAAATGATGGTGCCAACTTCATCTCCAAAACTTGAGGACTTCCTAGGTGGTGCAACTATGGGGG
CTCAAGACTATGGAACCCATGAGAGAGAAGCAATGGCTCTAAGCCTAGACAGTATCTACTACAGCA
ACCAGAATGCTGAACCTGAAACCAACAGGGACCATTCATCTTCTCTTGACCTTCTTTCTGACCATTTC
AGGCACCAAACCCATCATCACCCATATTACTCAGGACTTGGGATTTACCAAGTGGAGGAAGAAGAA
ACCAAGGAACAACCACACGTTGCAGTTTGCAGCTCCCAAATGCCTCAAGTGGTTGAAGGCAGCATT
GCTTGCTTCAAAAACTGGGTGCCAACAAGGGAATACTCTTCTTCTTCCACTCAGCAGAATCTGGAGC
AGCATCAAGTGAATAGTAGTAGCAGTGGTGGCCTTGGAGAGGATAATAATGTAGCTTATGGGAATG
TTGGTGTTGGTAGTAGTGTTGGTTGTGGTGAGTTACAGTCTTTGAGTTTGTCTATGAGTCCTGGTTCT
CAATCAAGCTGTGTCACTGTTCCAACTCAGATCTCATCTTCTGGAACTGACTCAGTTGCTGTGGATGC
CAAAAAGAGAGGCTCTTCTAAGCTTGGACAGAAGCAACCTGTGCATAGGAAATCCATCGACACATT
TGGTCAAAGAACTTCTCAGTATAGAGGTGTCACAAGGCATAGATGGACTGGTAGATATGAAGCACA
TTTGTGGGATAACAGTTGCAAGAAGGAAGGGCAAACAAGGAAAGGACGACAAGTGTATTTGGGTGG
TTATGATATGGAAGAGAAAGCTGCAAGGGCTTATGATCTTGCGGCTCTCAAGTATTGGGGACCTTCA
ACACACATAAACTTCCCGCTAGAAAATTACCAAACTCAACTTGAAGAAATGAAGAATATGAGTAGG
CAGGAATACGTGGCCCACTTGAGAAGAAAGAGTAGTGGGTTTTCAAGGGGTGCCTCAATGTACAGA
GGAGTGACAAGGCACCACCAACATGGCAGGTGGCAAGCAAGGATAGGCAGAGTTGCAGGAAATAA
GGACCTTTATCTTGGGACATTCAGCACTCAAGAGGAAGCAGCTGAAGCATATGATGTAGCTGCAATC
AAATTTCGTGGGGTGAATGCTGTCACCAACTTTGACATATCAAGATACGACGTTGAGAGAATAATGG
CCAGCAACACCCTTCTAGCTGGAGAGCTAGCTAGAAGAAACAAGAACAGTGAGCCAAGAACCGAG
GCCATAGAGTACAATGTTGTGTCAAGCCAACAAGTCATAAGCAACAGGGAAGAAGTTCACGAGACT
GTGAACAACAACAACAATAATAATAGTGAAAATGGTTCATCATCAGATTGGAAGATGAGTTTGTAT
CATCATCAGCAACAGTCAAACAACTGTGACCAGAAAACCATCAAGTGTGAAAATTATAATAGAGGT
GGTGCTGCTTTCTCTGTGTCCCTACAAGATCTCATTGGGATTGACTCAGTAGGATCTAGCCAAGGCAT
GATGGATGAGTCTACTAAGATAGGGACTCATTTTTCAAACCCTTCCTCGCTGGTCACCAGTTTAAGC
AGCTCAAGGGAAGGTAGCCCTGATAAAATGGGCCCCACTTTGCTCATTCCAAAGCCTCCAATGGGGT
CAAAGATTGTTACTAGCCCTACTGTTGCCAATGGTGTCACTGTTGGCTCTTGGTTTCCCTCTCAAATG
AGGCCAGTCTCAATGTCTCACTTGCCAGTTTTTGCTGCTTGGAGTGATGCCTAG
SEQ ID NO:32-GmWRI03可读框的核酸序列
ATGAAGTCCATGAATGATAGTAACACCGTTGATGATGGGAACAATCATAATAACTGGTTGGGATTCT
CTCTCTCACCCCACATGAAAATGGATGTTGTTACTTCTTCTACTACCACTGGTCCTCATCATCCCCAC
CAACACCATCATCATCATCACTACTATCATCACCCTCACGAGGCTTCTGCTGCAGCTTGCAACAACA
ACAACAACACTGTTCCCACTAACTTCTATATGTCACCCTCGCACCTCAACACCTCTGGAATATGTTAT
GGTGTTGGAGAAAACAGTGCCTTTCACACTCCTTTGGCCATGATGCCTCTCAAGTCAGATGGGTCAC
TTTGCATTATGGAGGCTCTAACAAGATCACAAACCCAAATGATGGTGCCAACTTCATCTCCAAAACT
TGAGGACTTCCTAGGTGGTGCAACTATGGGGGCTCAAGACTATGGAACCCATGAGAGAGAAGCAAT
GGCTCTAAGCCTAGACAGTATCTACTACAGCAACCAGAATGCTGAACCTGAAACCAACAGGGACCA
TTCATCTTCTCTTGACCTTCTTTCTGACCATTTCAGGCACCAAACCCATCATCACCCATATTACTCAG
GACTTGGGATTTACCAAGTGGAGGAAGAAGAAACCAAGGAACAACCACACGTTGCAGTTTGCAGCT
CCCAAATGCCTCAAGTGGTTGAAGGCAGCATTGCTTGCTTCAAAAACTGGGTGCCAACAAGGGAAT
ACTCTTCTTCTTCCACTCAGCAGAATCTGGAGCAGCATCAAGTGAATAGTAGTAGCAGTGGTGGCCT
TGGAGAGGATAATAATGTAGCTTATGGGAATGTTGGTGTTGGTAGTAGTGTTGGTTGTGGTGAGTTA
CAGTCTTTGAGTTTGTCTATGAGTCCTGGTTCTCAATCAAGCTGTGTCACTGTTCCAACTCAGATCTC
ATCTTCTGGAACTGACTCAGTTGCTGTGGATGCCAAAAAGAGAGGCTCTTCTAAGCTTGGACAGAAG
CAACCTGTGCATAGGAAATCCATCGACACATTTGGTCAAAGAACTTCTCAGTATAGAGGTGTCACAA
GGCATAGATGGACTGGTAGATATGAAGCACATTTGTGGGATAACAGTTGCAAGAAGGAAGGGCAAA
CAAGGAAAGGACGACAAGTGTATTTGGGTGGTTATGATATGGAAGAGAAAGCTGCAAGGGCTTATG
ATCTTGCGGCTCTCAAGTATTGGGGACCTTCAACACACATAAACTTCCCGCTAGAAAATTACCAAAC
TCAACTTGAAGAAATGAAGAATATGAGTAGGCAGGAATACGTGGCCCACTTGAGAAGAAAGAGTAG
TGGGTTTTCAAGGGGTGCCTCAATGTACAGAGGAGTGACAAGGCACCACCAACATGGCAGGTGGCA
AGCAAGGATAGGCAGAGTTGCAGGAAATAAGGACCTTTATCTTGGGACATTCAGCACTCAAGAGGA
AGCAGCTGAAGCATATGATGTAGCTGCAATCAAATTTCGTGGGGTGAATGCTGTCACCAACTTTGAC
ATATCAAGATACGACGTTGAGAGAATAATGGCCAGCAACACCCTTCTAGCTGGAGAGCTAGCTAGA
AGAAACAAGAACAGTGAGCCAAGAACCGAGGCCATAGAGTACAATGTTGTGTCAAGCCAACAAGTC
ATAAGCAACAGGGAAGAAGTTCACGAGACTGTGAACAACAACAACAATAATAATAGTGAAAATGG
TTCATCATCAGATTGGAAGATGAGTTTGTATCATCATCAGCAACAGTCAAACAACTGTGACCAGAAA
ACCATCAAGTGTGAAAATTATAATAGAGGTGGTGCTGCTTTCTCTGTGTCCCTACAAGATCTCATTG
GGATTGACTCAGTAGGATCTAGCCAAGGCATGATGGATGAGTCTACTAAGATAGGGACTCATTTTTC
AAACCCTTCCTCGCTGGTCACCAGTTTAAGCAGCTCAAGGGAAGGTAGCCCTGATAAAATGGGCCCC
ACTTTGCTCATTCCAAAGCCTCCAATGGGGTCAAAGATTGTTACTAGCCCTACTGTTGCCAATGGTGT
CACTGTTGGCTCTTGGTTTCCCTCTCAAATGAGGCCAGTCTCAATGTCTCACTTGCCAGTTTTTGCTG
CTTGGAGTGATGCCTAG
SEQ ID NO:33-GmWRI03可读框的氨基酸序列
MKSMNDSNTVDDGNNHNNWLGFSLSPHMKMDVVTSSTTTGPHHPHQHHHHHHYYHHPHEASAAACN
NNNNTVPTNFYMSPSHLNTSGICYGVGENSAFHTPLAMMPLKSDGSLCIMEALTRSQTQMMVPTSSPKL
EDFLGGATMGAQDYGTHEREAMALSLDSIYYSNQNAEPETNRDHSSSLDLLSDHFRHQTHHHPYYSGLG
IYQVEEEETKEQPHVAVCSSQMPQVVEGSIACFKNWVPTREYSSSSTQQNLEQHQVNSSSSGGLGEDNN
VAYGNVGVGSSVGCGELQSLSLSMSPGSQSSCVTVPTQISSSGTDSVAVDAKKRGSSKLGQKQPVHRKSI
DTFGQRTSQYRGVTRHRWTGRYEAHLWDNSCKKEGQTRKGRQVYLGGYDMEEKAARAYDLAALKY
WGPSTHINFPLENYQTQLEEMKNMSRQEYVAHLRRKSSGFSRGASMYRGVTRHHQHGRWQARIGRVA
GNKDLYLGTFSTQEEAAEAYDVAAIKFRGVNAVTNFDISRYDVERIMASNTLLAGELARRNKNSEPRTE
AIEYNVVSSQQVISNREEVHETVNNNNNNNSENGSSSDWKMSLYHHQQQSNNCDQKTIKCENYNRGGA
AFSVSLQDLIGIDSVGSSQGMMDESTKIGTHFSNPSSLVTSLSSSREGSPDKMGPTLLIPKPPMGSKIVTSPT
VANGVTVGSWFPSQMRPVSMSHLPVFAAWSDA
SEQ ID NO:34-GmWRI05的核酸序列
ATGAAGAGTATGGAAAATGATGACAATGCTGACCTTAATAATCAAAACAATTGGTTGGGTTTCTCAC
TCTCTCCTCAAATGCATAATATAGGAGTTTCTTCACACTCACAACCTTCCTCTGCTGCTGAAGTGGTT
CCTACAAGCTTTTACCACCACACTGCTCCACTTAGTAGCTATGGTTTCTACTATGGACTTGAAGCTGA
AAATGTTGGATTGTATTCAGCTTTGCCAATCATGCCCCTCAAATCTGATGGCTCTCTCTATGGATTGG
AAACTTTAAGCAGGTCACAAGCACAAGCAATGGCTACTACTTCAACACCAAAACTGGAGAACTTCTT
AGGTGGGGAAGCCATGGGGACCCCTCATCACTACGAATGTAGTGCCACAGAAACAATGCCTCTGAG
CTTAGACAGTGTTTTTTACATCCAACCCTCACGCCGTGACCCAAATAATAACCAAACCTACCAAAAC
CATGTTCAACACATTAGCACCAACCAACAACAACAACAGCAAGAGCTTCAAGCATATTACTCTACCT
TGAGAAACCATGATATGATATTAGAAGGGTCAAAGCAAAGCCAAACTTCTGACAACAACAATCTTC
ATGTTCAAAACATGGGTGGTGATGATGCCGTTCCTGTTCCTGGCCTCAAGAGTTGGGAAGTGAGGAA
CTTCCAAGCTAGCCATGCACATGAGTCAAAGATGATTGTTCCTCATGTGGAGGAAAATGCTGGTGAA
TCAGGGTCCATTGGATCAATGGCTTATGGTGACTTGCAATCGTTGAGCTTGTCCATGAGTCCTAGCTC
TCAGTCTAGCAGTGTCACAAGTTCTCACCGTGCTTCACCTGCTGTCGTTGATTCTGTTGCCATGGATA
CTAAGAAAAGGGGGCCTGAAAAGGTTGACCAGAAGCAAATTGTTCATAGGAAGTCCATTGACACCT
TTGGACAAAGAACCTCCCAGTATAGAGGAGTAACAAGGCATAGGTGGACTGGGAGATATGAAGCTC
ATCTTTGGGACAACAGCTGCAAGAAAGAGGGGCAAAGCAGGAAAGGAAGACAAGTTTATCTAGGG
GGTTATGATATGGAAGAAAAAGCTGCGAGAGCTTATGATCTAGCGGCACTCAAGTATTGGGGACCC
TCCACTCACATAAACTTTCCTTTGGAAAATTATCAAAATGAACTTGAGGAAATGAAGAACATGACTA
GACAAGAGTATGTTGCTCATTTGAGAAGAAAAAGCAGCGGATTCTCAAGAGGGGCTTCCATGTACA
GAGGAGTAACAAGACACCACCAACATGGAAGGTGGCAAGCTCGAATTGGTAGAGTGGCTGGAAAC
AAAGATCTATATCTTGGAACCTTTAGTACACAAGAGGAAGCAGCTGAAGCCTATGATATTGCTGCTA
TAAAATTCCGAGGAGCGAATGCTGTAACCAACTTTGACATCACAAGATATGATGTGGAGAAAATCA
TGGCAAGCAGCAACCTCCTTAGCAGTGAGCTAGCTAGGCGCAACCGAGAGACGGACAATGAAACTC
AGTGCATTGATCAAAATCACAATAAGCCTTCTGCATATGAGGACACTCAAGAAGCTATTCTAATGCA
CCAGAAGAGCTGTGAGAGCGAAAATGATCAGTGGAAGATGGTTCTCTACCAATCCTCTCAGCAACTT
GAGCAGAATCCACCAACAATTGAGAGTGACAGAACTAACCAGTCCTTCGCAGTGGCTTTGGACAAC
ATGTTTCATCAGGAAGTAGAGGAATCAAGTAAGGCGAGGACGCATGTGTCAAATCCTTCTTCATTGG
CCACAAGTTTGAGCAGCTCAAGAGAAGGTAGCCCTGATAGGACAAGCTTGCCAATGCTCTCTGGAA
TGCCTTCAACTGCATCAAAACTATTGGCTACTAATCCAAATAACGTGAATTCTTGGGACCCTTCACCC
CATTTGAGGCCAGCACTTACTTTGCCTCAAATGCCAGTTTTTGCAGCTTGGACAGATGCATAGTTCAT
AGCTCAATAGTCCTTTTAATTTTTTGTTCTCTCAAGTGAAATTTCAATCCTTTTTTATTGTCTTTTTTTG
CATGCATGAACAACACAAGAGGAAGGGGTTGTAGCTAGTCAAATGGAGGGTCTAAATATTATATCA
TCACATCACTGTCAGCAAGTTTAATTTAAACTTTCAAATCATCCGACACGCAGCGGCCGCTCTAGAG
GATCCAAGCTTACGTACGCGTGCATGCGACGTCATAGCTCTTCTATAGGCACC
SEQ ID NO:35-GmWRI05可读框的核酸序列
ATGAAGAGTATGGAAAATGATGACAATGCTGACCTTAATAATCAAAACAATTGGTTGGGTTTCT
CACTCTCTCCTCAAATGCATAATATAGGAGTTTCTTCACACTCACAACCTTCCTCTGCTGCTGAA
GTGGTTCCTACAAGCTTTTACCACCACACTGCTCCACTTAGTAGCTATGGTTTCTACTATGGACT
TGAAGCTGAAAATGTTGGATTGTATTCAGCTTTGCCAATCATGCCCCTCAAATCTGATGGCTCTC
TCTATGGATTGGAAACTTTAAGCAGGTCACAAGCACAAGCAATGGCTACTACTTCAACACCAA
AACTGGAGAACTTCTTAGGTGGGGAAGCCATGGGGACCCCTCATCACTACGAATGTAGTGCCA
CAGAAACAATGCCTCTGAGCTTAGACAGTGTTTTTTACATCCAACCCTCACGCCGTGACCCAAA
TAATAACCAAACCTACCAAAACCATGTTCAACACATTAGCACCAACCAACAACAACAACAGCA
AGAGCTTCAAGCATATTACTCTACCTTGAGAAACCATGATATGATATTAGAAGGGTCAAAGCA
AAGCCAAACTTCTGACAACAACAATCTTCATGTTCAAAACATGGGTGGTGATGATGCCGTTCCT
GTTCCTGGCCTCAAGAGTTGGGAAGTGAGGAACTTCCAAGCTAGCCATGCACATGAGTCAAAG
ATGATTGTTCCTCATGTGGAGGAAAATGCTGGTGAATCAGGGTCCATTGGATCAATGGCTTATG
GTGACTTGCAATCGTTGAGCTTGTCCATGAGTCCTAGCTCTCAGTCTAGCAGTGTCACAAGTTCT
CACCGTGCTTCACCTGCTGTCGTTGATTCTGTTGCCATGGATACTAAGAAAAGGGGGCCTGAAA
AGGTTGACCAGAAGCAAATTGTTCATAGGAAGTCCATTGACACCTTTGGACAAAGAACCTCCC
AGTATAGAGGAGTAACAAGGCATAGGTGGACTGGGAGATATGAAGCTCATCTTTGGGACAACA
GCTGCAAGAAAGAGGGGCAAAGCAGGAAAGGAAGACAAGTTTATCTAGGGGGTTATGATATG
GAAGAAAAAGCTGCGAGAGCTTATGATCTAGCGGCACTCAAGTATTGGGGACCCTCCACTCAC
ATAAACTTTCCTTTGGAAAATTATCAAAATGAACTTGAGGAAATGAAGAACATGACTAGACAA
GAGTATGTTGCTCATTTGAGAAGAAAAAGCAGCGGATTCTCAAGAGGGGCTTCCATGTACAGA
GGAGTAACAAGACACCACCAACATGGAAGGTGGCAAGCTCGAATTGGTAGAGTGGCTGGAAA
CAAAGATCTATATCTTGGAACCTTTAGTACACAAGAGGAAGCAGCTGAAGCCTATGATATTGCT
GCTATAAAATTCCGAGGAGCGAATGCTGTAACCAACTTTGACATCACAAGATATGATGTGGAG
AAAATCATGGCAAGCAGCAACCTCCTTAGCAGTGAGCTAGCTAGGCGCAACCGAGAGACGGAC
AATGAAACTCAGTGCATTGATCAAAATCACAATAAGCCTTCTGCATATGAGGACACTCAAGAA
GCTATTCTAATGCACCAGAAGAGCTGTGAGAGCGAAAATGATCAGTGGAAGATGGTTCTCTAC
CAATCCTCTCAGCAACTTGAGCAGAATCCACCAACAATTGAGAGTGACAGAACTAACCAGTCC
TTCGCAGTGGCTTTGGACAACATGTTTCATCAGGAAGTAGAGGAATCAAGTAAGGCGAGGACG
CATGTGTCAAATCCTTCTTCATTGGCCACAAGTTTGAGCAGCTCAAGAGAAGGTAGCCCTGATA
GGACAAGCTTGCCAATGCTCTCTGGAATGCCTTCAACTGCATCAAAACTATTGGCTACTAATCC
AAATAACGTGAATTCTTGGGACCCTTCACCCCATTTGAGGCCAGCACTTACTTTGCCTCAAATG
CCAGTTTTTGCAGCTTGGACAGATGCATAG
SEQ ID NO:36-GmWRI05可读框的氨基酸序列
MKSMENDDNADLNNQNNWLGFSLSPQMHNIGVSSHSQPSSAAEVVPTSFYHHTAPLSSYGFYYGL
EAENVGLYSALPIMPLKSDGSLYGLETLSRSQAQAMATTSTPKLENFLGGEAMGTPHHYECSATET
MPLSLDSVFYIQPSRRDPNNNQTYQNHVQHISTNQQQQQQELQAYYSTLRNHDMILEGSKQSQTSD
NNNLHVQNMGGDDAVPVPGLKSWEVRNFQASHAHESKMIVPHVEENAGESGSIGSMAYGDLQSL
SLSMSPSSQSSSVTSSHRASPAVVDSVAMDTKKRGPEKVDQKQIVHRKSIDTFGQRTSQYRGVTRHR
WTGRYEAHLWDNSCKKEGQSRKGRQVYLGGYDMEEKAARAYDLAALKYWGPSTHINFPLENYQ
NELEEMKNMTRQEYVAHLRRKSSGFSRGASMYRGVTRHHQHGRWQARIGRVAGNKDLYLGTFST
QEEAAEAYDIAAIKFRGANAVTNFDITRYDVEKIMASSNLLSSELARRNRETDNETQCIDQNHNKPS
AYEDTQEAILMHQKSCESENDQWKMVLYQSSQQLEQNPPTIESDRTNQSFAVALDNMFHQEVEESS
KARTHVSNPSSLATSLSSSREGSPDRTSLPMLSGMPSTASKLLATNPNNVNSWDPSPHLRPALTLPQ
MPVFAAWTDA
SEQ ID NO:37-GmWRI08的核酸序列
ATGAAGCGCATAAATGAGAGTAACAACACCGATGATGGAAACAATCATAACTGGTTGGGGTTCTCT
CTCTCACCCCACATGAAAATGGAGGCTACTTCAGCAGCCACTGTTCCGACAACCTTCTACATGTCCC
CTTCTCAATCTCACTTGTCCAACTTCGGAATGTGTTACGGTGTCGGAGAAAATGGTAACTTCCATTCT
CCACTTACGGTTATGCCTCTCAAGTCTGATGGGTCACTTTGTATCTTGGAAGCTCTCAAAAGATCACA
AACGCAAGTGATGGTGCCAACTTCGTCTCCGAAATTGGAGGACTTTCTAGGTGGTGCAACTATGGGA
ACTCACGAATATGGAAGCCACGAGAGAGGTTTGAGCCTAGACAGCATCTATTATAACTCCCAAAAC
GCAGAGGCTCAACCCAACAGAGACCTTCTTTCACAACCCTTCAGGCAACAAGGTCATATGAGTGTCC
AAACACACCCTTATTACTCAGGCCTTGCTTGCCATGGTTTATATCAAGCACCGTTGGAGGAAGAAAC
AACAAAGGAAACGCACGTGTCGGATTGCAGCTCCCTAATGCCTCAAATGACAGAAGGCTTGAAAAA
CTGGGTGGCTCCAACAAGGGAGTTTTCAACTCACCAGCAGGTTTTGGAGCAGCAAATGAATTGTGGC
ATGGGGAATGAGAGAAATGGTGTGTCTTTAGGATCTGTGGGGTGTGGAGAGTTACAGTCTCTAAGCT
TATCTATGAGTCCTGGTTCTCAGTCTAGTTGTGTCACTGCTCCTTCTGGAACAGATTCTGTTGCTGTG
GATGCAAAGAAGAGAGGGCATGCTAAACTTGGTCAGAAGCAGCCTGTGCATAGAAAATCTATCGAC
ACATTTGGGCAAAGAACCTCGCAGTATAGAGGTGTCACAAGGCATAGATGGACTGGTAGGTATGAA
GCGCATTTGTGGGATAATAGTTGCAAGAAGGAAGGGCAAACTAGGAAAGGACGACAAGTGTATTTG
GGGGGTTATGATATGGAGGAGAAAGCTGCAAGAGCCTATGATCTCGCGGCCCTTAAGTACTGGGGA
CCTTCAACGCATATAAACTTTTCGATAGAGAATTACCAAGTTCAACTTGAGGAAATGAAGAACATGA
GCAGACAGGAATACGTTGCACACTTGAGAAGAAAAAGCAGCGGGTTTTCTAGAGGTGCTTCAATAT
ACAGAGGGGTCACAAGGCATCACCAACATGGAAGATGGCAAGCGAGGATAGGCAGAGTTGCTGGG
AACAAAGACCTTTACCTTGGGACGTTCAGCACCCAAGAGGAAGCAGCAGAAGCATACGATGTAGCG
GCGATCAAATTTCGCGGCGCAAATGCAGTCACAAACTTTGACATTTCAAGATACGATGTGGAGAGA
ATCATGGCCAGTAGCAATCTCCTCGCTGGGGAGCTTGCAAGGCGTAAGAAAGATAACGATCCTAGA
AACAAGGACATAGACTACAACAAGAGTGTAGTAACAAGTGTGAACAATGAGGAAACGGTTCAAGTT
CAAGCAGGAAACAACAATAATGAAAACGACTCAGAGTGGAAGATGGTTTTATTTAACCACCCTTCA
CAGCAGCAACAGGCAAATGGCAATGGCAGTGACCAAAAAATAATGAACTGTGGAAATTACAGAAA
CAGTGCATTTTCTATGGCCCTACAAGATCTTATTGGGATTGATTCGGTGGGTTCTGGGCAGCATAATA
TGCTGGACGAGTCTAGCAAAATTGGGACTCATTTTTCAAACACGTCATCGCTGGTGACAAGTTTAAG
CAGCTCAAGAGAGGCTAGTCCTGAGAAAAGGGGTCCCTCGCTTCTGTTCCCAATGCCTCCAATGGAA
ACAAAGATTGTGAACCCCATTGGTACCAGTGTTACCTCTTGGCTACCCTCACCAACGGTTCAAATGA
GGCCTTCTCCTGCTATCTCTTTGTCTCACTTGCCAGTTTTTGCTTCTTGGACTGATACTTAAATGGAGA
TAGGCACGGTCCATTTTTCATGTTATGTTATGTAACTAAAATTTACTTTTTTCCTTCATCTTTTATTTCT
AATTTGATTTCCTAAGTTTAAAAGCTTTAAATAAAAAAAAAAAAAAAACCGAACCA
SEQ ID NO:38-GmWRI08可读框的核酸序列
ATGAAGCGCATAAATGAGAGTAACAACACCGATGATGGAAACAATCATAACTGGTTGGGGTTCTCT
CTCTCACCCCACATGAAAATGGAGGCTACTTCAGCAGCCACTGTTCCGACAACCTTCTACATGTCCC
CTTCTCAATCTCACTTGTCCAACTTCGGAATGTGTTACGGTGTCGGAGAAAATGGTAACTTCCATTCT
CCACTTACGGTTATGCCTCTCAAGTCTGATGGGTCACTTTGTATCTTGGAAGCTCTCAAAAGATCACA
AACGCAAGTGATGGTGCCAACTTCGTCTCCGAAATTGGAGGACTTTCTAGGTGGTGCAACTATGGGA
ACTCACGAATATGGAAGCCACGAGAGAGGTTTGAGCCTAGACAGCATCTATTATAACTCCCAAAAC
GCAGAGGCTCAACCCAACAGAGACCTTCTTTCACAACCCTTCAGGCAACAAGGTCATATGAGTGTCC
AAACACACCCTTATTACTCAGGCCTTGCTTGCCATGGTTTATATCAAGCACCGTTGGAGGAAGAAAC
AACAAAGGAAACGCACGTGTCGGATTGCAGCTCCCTAATGCCTCAAATGACAGAAGGCTTGAAAAA
CTGGGTGGCTCCAACAAGGGAGTTTTCAACTCACCAGCAGGTTTTGGAGCAGCAAATGAATTGTGGC
ATGGGGAATGAGAGAAATGGTGTGTCTTTAGGATCTGTGGGGTGTGGAGAGTTACAGTCTCTAAGCT
TATCTATGAGTCCTGGTTCTCAGTCTAGTTGTGTCACTGCTCCTTCTGGAACAGATTCTGTTGCTGTG
GATGCAAAGAAGAGAGGGCATGCTAAACTTGGTCAGAAGCAGCCTGTGCATAGAAAATCTATCGAC
ACATTTGGGCAAAGAACCTCGCAGTATAGAGGTGTCACAAGGCATAGATGGACTGGTAGGTATGAA
GCGCATTTGTGGGATAATAGTTGCAAGAAGGAAGGGCAAACTAGGAAAGGACGACAAGTGTATTTG
GGGGGTTATGATATGGAGGAGAAAGCTGCAAGAGCCTATGATCTCGCGGCCCTTAAGTACTGGGGA
CCTTCAACGCATATAAACTTTTCGATAGAGAATTACCAAGTTCAACTTGAGGAAATGAAGAACATGA
GCAGACAGGAATACGTTGCACACTTGAGAAGAAAAAGCAGCGGGTTTTCTAGAGGTGCTTCAATAT
ACAGAGGGGTCACAAGGCATCACCAACATGGAAGATGGCAAGCGAGGATAGGCAGAGTTGCTGGG
AACAAAGACCTTTACCTTGGGACGTTCAGCACCCAAGAGGAAGCAGCAGAAGCATACGATGTAGCG
GCGATCAAATTTCGCGGCGCAAATGCAGTCACAAACTTTGACATTTCAAGATACGATGTGGAGAGA
ATCATGGCCAGTAGCAATCTCCTCGCTGGGGAGCTTGCAAGGCGTAAGAAAGATAACGATCCTAGA
AACAAGGACATAGACTACAACAAGAGTGTAGTAACAAGTGTGAACAATGAGGAAACGGTTCAAGTT
CAAGCAGGAAACAACAATAATGAAAACGACTCAGAGTGGAAGATGGTTTTATTTAACCACCCTTCA
CAGCAGCAACAGGCAAATGGCAATGGCAGTGACCAAAAAATAATGAACTGTGGAAATTACAGAAA
CAGTGCATTTTCTATGGCCCTACAAGATCTTATTGGGATTGATTCGGTGGGTTCTGGGCAGCATAATA
TGCTGGACGAGTCTAGCAAAATTGGGACTCATTTTTCAAACACGTCATCGCTGGTGACAAGTTTAAG
CAGCTCAAGAGAGGCTAGTCCTGAGAAAAGGGGTCCCTCGCTTCTGTTCCCAATGCCTCCAATGGAA
ACAAAGATTGTGAACCCCATTGGTACCAGTGTTACCTCTTGGCTACCCTCACCAACGGTTCAAATGA
GGCCTTCTCCTGCTATCTCTTTGTCTCACTTGCCAGTTTTTGCTTCTTGGACTGATACTTAA
SEQ ID NO:39-GmWRI08可读框的氨基酸序列
MKRINESNNTDDGNNHNWLGFSLSPHMKMEATSAATVPTTFYMSPSQSHLSNFGMCYGVGENGNFHSP
LTVMPLKSDGSLCILEALKRSQTQVMVPTSSPKLEDFLGGATMGTHEYGSHERGLSLDSIYYNSQNAEAQ
PNRDLLSQPFRQQGHMSVQTHPYYSGLACHGLYQAPLEEETTKETHVSDCSSLMPQMTEGLKNWVAPT
REFSTHQQVLEQQMNCGMGNERNGVSLGSVGCGELQSLSLSMSPGSQSSCVTAPSGTDSVAVDAKKRG
HAKLGQKQPVHRKSIDTFGQRTSQYRGVTRHRWTGRYEAHLWDNSCKKEGQTRKGRQVYLGGYDME
EKAARAYDLAALKYWGPSTHINFSIENYQVQLEEMKNMSRQEYVAHLRRKSSGFSRGASIYRGVTRHH
QHGRWQARIGRVAGNKDLYLGTFSTQEEAAEAYDVAAIKFRGANAVTNFDISRYDVERIMASSNLLAGE
LARRKKDNDPRNKDIDYNKSVVTSVNNEETVQVQAGNNNNENDSEWKMVLFNHPSQQQQANGNGSD
QKIMNCGNYRNSAFSMALQDLIGIDSVGSGQHNMLDESSKIGTHFSNTSSLVTSLSSSREASPEKRGPSLL
FPMPPMETKIVNPIGTSVTSWLPSPTVQMRPSPAISLSHLPVFASWTDT
SEQ ID NO:40-OsWRI01的核酸序列
GGCCTCTCCTCCTCCTCCTCACCTGCACCTGCACCAACGCGAGAGATCATGGCGAAGAGATCGTCTC
CTGATCCTGCATCATCTTCTCCATCTGCATCATCCTCGCCGTCGTCTCCTTCCTCCTCTTCCTCCGAGG
ATTCCTCTTCGCCCATGTCGATGCCCTGCAAGAGGAGGGCGAGGCCGAGGACGGAGAAGAGCACCG
GCAAGGCCAAGAGGCCCAAGAAGGAGAGCAAGGAGGTGGCTGATCCTTCTTCCAATGGCGGCGGCG
GCGGCAAGAGGAGTTCTATCTACAGGGGAGTCACCAGGCATCGGTGGACTGGCAGATTTGAGGCCC
ATCTGTGGGACAAGAATTGCTCCACTTCACTTCAGAACAAGAAGAAAGGGAGGCAAGTCTATTTGG
GGGCTTATGATAGTGAGGAAGCAGCTGCTCGTGCATATGACCTTGCAGCTCTTAAGTACTGGGGTCC
TGAGACAGTGCTCAATTTCCCACTGGAGGAATATGAGAAGGAGAGGTCGGAGATGGAGGGCGTGTC
GAGGGAGGAGTACCTGGCCTCCCTCCGCCGCCGGAGCAGCGGTTTCTCCAGGGGTGTCTCCAAGTAC
AGAGGCGTTGCCAGGCATCACCACAATGGGCGGTGGGAGGCACGGATAGGGCGGGTCCTGGGGAA
CAAGTACCTCTACCTGGGTACTTTCGATACTCAAGAGGAGGCAGCCAAGGCCTATGATCTTGCTGCA
ATTGAATACCGAGGTGCCAATGCGGTAACCAACTTCGACATCAGCTGCTACCTGGACCAGCCACAGT
TACTGGCACAGCTGCAACAGGAACCACAGTTACTGGCACAACTGCAACAAGAGCTACAGGTGGTGC
CAGCATTACATGAAGAGCCTCAAGATGATGACCGAAGTGAGAATGCAGTCCAAGAGCTCAGTTCCA
GTGAAGCAAATACATCAAGTGACAACAATGAGCCACTTGCAGCCGATGACAGCGCTGAATGCATGA
ATGAACCCCTTCCAATTGTTGATGGCATTGAAGAAAGCCTCTGGAGCCCTTGCTTGGATTATGAATT
GGATACAATGCCTGGGGCTTACTTCAGCAACTCGATGAATTTCAGTGAATGGTTCAATGATGAGGCT
TTCGAAGGCGGCATGGAGTACCTATTTGAAGGGTGCTCCAGTATAACTGAAGGCGGCAACAGCATG
GATAACTCAGGTGTGACAGAATACAATTTGTTTGAGGAATGCAATATGTTGGAGAAGGACATTTCAG
ATTTTTTAGACAAGGACATTTCAGATTTTTTAGATAAGGACATTTCAATTTCAGATAGGGAGCGAAT
ATCTCCTCAAGCAAACAATATCTCCTGCCCTCAAAAAATGATCAGTGTGTGCAACTGAATTCTCTCT
GTGTGCGTGTTTCTGGGTGTTGAAAATCTTGAGATATACAGGGAAGTTTTCAGGTTTTTA
SEQ ID NO:41-OsWRI01可读框的核酸序列
ATGGCGAAGAGATCGTCTCCTGATCCTGCATCATCTTCTCCATCTGCATCATCCTCGCCGTCGTCTCC
TTCCTCCTCTTCCTCCGAGGATTCCTCTTCGCCCATGTCGATGCCCTGCAAGAGGAGGGCGAGGCCG
AGGACGGAGAAGAGCACCGGCAAGGCCAAGAGGCCCAAGAAGGAGAGCAAGGAGGTGGCTGATCC
TTCTTCCAATGGCGGCGGCGGCGGCAAGAGGAGTTCTATCTACAGGGGAGTCACCAGGCATCGGTG
GACTGGCAGATTTGAGGCCCATCTGTGGGACAAGAATTGCTCCACTTCACTTCAGAACAAGAAGAA
AGGGAGGCAAGTCTATTTGGGGGCTTATGATAGTGAGGAAGCAGCTGCTCGTGCATATGACCTTGCA
GCTCTTAAGTACTGGGGTCCTGAGACAGTGCTCAATTTCCCACTGGAGGAATATGAGAAGGAGAGG
TCGGAGATGGAGGGCGTGTCGAGGGAGGAGTACCTGGCCTCCCTCCGCCGCCGGAGCAGCGGTTTC
TCCAGGGGTGTCTCCAAGTACAGAGGCGTTGCCAGGCATCACCACAATGGGCGGTGGGAGGCACGG
ATAGGGCGGGTCCTGGGGAACAAGTACCTCTACCTGGGTACTTTCGATACTCAAGAGGAGGCAGCC
AAGGCCTATGATCTTGCTGCAATTGAATACCGAGGTGCCAATGCGGTAACCAACTTCGACATCAGCT
GCTACCTGGACCAGCCACAGTTACTGGCACAGCTGCAACAGGAACCACAGTTACTGGCACAACTGC
AACAAGAGCTACAGGTGGTGCCAGCATTACATGAAGAGCCTCAAGATGATGACCGAAGTGAGAATG
CAGTCCAAGAGCTCAGTTCCAGTGAAGCAAATACATCAAGTGACAACAATGAGCCACTTGCAGCCG
ATGACAGCGCTGAATGCATGAATGAACCCCTTCCAATTGTTGATGGCATTGAAGAAAGCCTCTGGAG
CCCTTGCTTGGATTATGAATTGGATACAATGCCTGGGGCTTACTTCAGCAACTCGATGAATTTCAGTG
AATGGTTCAATGATGAGGCTTTCGAAGGCGGCATGGAGTACCTATTTGAAGGGTGCTCCAGTATAAC
TGAAGGCGGCAACAGCATGGATAACTCAGGTGTGACAGAATACAATTTGTTTGAGGAATGCAATAT
GTTGGAGAAGGACATTTCAGATTTTTTAGACAAGGACATTTCAGATTTTTTAGATAAGGACATTTCA
ATTTCAGATAGGGAGCGAATATCTCCTCAAGCAAACAATATCTCCTGCCCTCAAAAAATGATCAGTG
TGTGCAACTGA
SEQ ID NO:42-OsWRI01可读框的氨基酸序列
MAKRSSPDPASSSPSASSSPSSPSSSSSEDSSSPMSMPCKRRARPRTEKSTGKAKRPKKESKEVADPSSNGG
GGGKRSSIYRGVTRHRWTGRFEAHLWDKNCSTSLQNKKKGRQVYLGAYDSEEAAARAYDLAALKYW
GPETVLNFPLEEYEKERSEMEGVSREEYLASLRRRSSGFSRGVSKYRGVARHHHNGRWEARIGRVLGNK
YLYLGTFDTQEEAAKAYDLAAIEYRGANAVTNFDISCYLDQPQLLAQLQQEPQLLAQLQQELQVVPALH
EEPQDDDRSENAVQELSSSEANTSSDNNEPLAADDSAECMNEPLPIVDGIEESLWSPCLDYELDTMPGAY
FSNSMNFSEWFNDEAFEGGMEYLFEGCSSITEGGNSMDNSGVTEYNLFEECNMLEKDISDFLDKDISDFL
DKDISISDRERISPQANNISCPQKMISVCN
SEQ ID NO:43-OsWRI07的核酸序列
CGAGCTCGGATCCACTAGTAACGGCCGCCAGTGTGCTGGAATTCGCCCTTAAGCAGTGGTAACAACG
CAGAGTACGCGGGGAGAAAATAATAATAAGAAGAACAGATTGTATAATCTGGGGTATTTTTCTCCC
CAACTTTCCTCTCTCGGTTTCCCCGAGAAATTTCTTGTTGTTTCCCGCATCACTCCCCACTGAGCCGCC
TCCTTGCTCGCCGCTCGCGTTCGTCGTCGTCTCGTCGTTTCCACAATCAATTTGACGTCGCCCCTATTT
ATGTCCTGCCTCGGTAGTTGATTCCTCCCCATTTCTGTTGCCTCTCGCGGTTGTGGTAATCGACGCTG
TAGGATTTTTTTCTTCTTCTTCTTTTGGGTCTTCGGAGGAGGCGTCCGGATCTTTCGTCCCCATCGATC
CCTTCCGGCCACGGACATTTCGTGGGTAGAGCGATTGATTGGTGGCTTAGGGTTAATATTGGGCAGG
AAATGGAGAGCTCTTTGAAAGAGGAGAAGGCTGCGGGCGAATCAGGGGATGATGAGAAGGCGGAG
AGGAGCTCCCCTATCAATCTGAATTCGTTGCCAGCAACTGCGGCGTGTGCGGCGACCGCCCCGGATG
AGGATGGCTTGCACTCTGCAGTGGAGTCAGGAGCTAAGGATTCGAACACCACGAAGGGAGTTGAGT
CTCTTGGTACTGGTCACAAGAAGATCCCGAAACGTGAGGTAGTTGATGAAGTTGATGTTCAGACCTG
TGCCGAAGGAAAGAACGATTCAGTGGTCCCTTCAAGCAGCAAGAACCCTATCAATGATAAGAATGC
AAAGGCAAATGTGGCAGAGAATGGACAGTCTGCTGATGGTATCCCTGAGGATCAGAGAGTTACTAT
TCTTAGTGTTGTCAAGAAGGATGAGCCTGCTGATGATGTTAGAGATTCAGTTAATCCTGTAACAGTC
GTAGGTTATAGAGATGAGAAGGGTGGAACTAGTGGTACTGCTGGAACTACGGCTGTGCGACCTGCA
GGCACCCGGTCATCTAGTTTCCATGGTGTGACCAGGCATAGATGGAGTGGAAAATATGAAGCTCATC
TGTGGGACAGTTCGTGCAGAATGGAAGGGCGGAGAAGAAAGGGAAGGCAAGTTTATTTAGGAAGTT
ATGATACCGAGGAAAAAGCTGCCAGGTCATATGATGTTGCAGCTCTTAAATACTGGGGCCAAAATA
CAAAGCTGAATTTCTCGGTTTCAGAATACGAAAGGGAACTGGAGGACATAAGGGACATGTCTCGAG
AGGAATGCGTAACATACCTAAGAAGAAGAAGTAGCTGCTTCTCAAGAGGGGCTTCTATTTATAGAG
GAGTTACTAGAAGGCAGAAAGATGGGAGGTGGCAGGCACGCATAGGACTGGTTGCTGGAACAAGA
GACATTTACCTGGGAACTTTCAAAACTGAGGAAGAAGCAGCGGAGGCTTACGACATTGCTGCTATTG
AGATCCGTGGCAAAAATGCGGTGACCAACTTTGATCGAAGCAACTACATGGAGAAGGGTATGCACT
GTATAGAAGGGGCAGGCTTGAAGCTGCTTGCGTCTAAGCCAGAATGAAAACTTGACTTGGTGGAGC
CGCATCGCATATTAGGGTTGTTTCAGTCATATTTGGAGCTTANTGGTACATACAGATACAACTGGTT
GCAGCTTGTTAATATCTCTGCGTTATAATCTACAAATTACAGCTCAATTTTCGATTGACTAGCAAATT
CGTCTCAGCAAGAAAGATTTTGAGCATGTATTATAGGTTGAGTAGGGTAGATCTGTACAACACCTGA
GCAACTCAATATTTATGTTCTGCTCAATATAACCTATCATTCC
SEQ ID NO:44-OsWRI07可读框的核酸序列
ATGGAGAGCTCTTTGAAAGAGGAGAAGGCTGCGGGCGAATCAGGGGATGATGAGAAGGCGGAGAG
GAGCTCCCCTATCAATCTGAATTCGTTGCCAGCAACTGCGGCGTGTGCGGCGACCGCCCCGGATGAG
GATGGCTTGCACTCTGCAGTGGAGTCAGGAGCTAAGGATTCGAACACCACGAAGGGAGTTGAGTCT
CTTGGTACTGGTCACAAGAAGATCCCGAAACGTGAGGTAGTTGATGAAGTTGATGTTCAGACCTGTG
CCGAAGGAAAGAACGATTCAGTGGTCCCTTCAAGCAGCAAGAACCCTATCAATGATAAGAATGCAA
AGGCAAATGTGGCAGAGAATGGACAGTCTGCTGATGGTATCCCTGAGGATCAGAGAGTTACTATTCT
TAGTGTTGTCAAGAAGGATGAGCCTGCTGATGATGTTAGAGATTCAGTTAATCCTGTAACAGTCGTA
GGTTATAGAGATGAGAAGGGTGGAACTAGTGGTACTGCTGGAACTACGGCTGTGCGACCTGCAGGC
ACCCGGTCATCTAGTTTCCATGGTGTGACCAGGCATAGATGGAGTGGAAAATATGAAGCTCATCTGT
GGGACAGTTCGTGCAGAATGGAAGGGCGGAGAAGAAAGGGAAGGCAAGTTTATTTAGGAAGTTAT
GATACCGAGGAAAAAGCTGCCAGGTCATATGATGTTGCAGCTCTTAAATACTGGGGCCAAAATACA
AAGCTGAATTTCTCGGTTTCAGAATACGAAAGGGAACTGGAGGACATAAGGGACATGTCTCGAGAG
GAATGCGTAACATACCTAAGAAGAAGAAGTAGCTGCTTCTCAAGAGGGGCTTCTATTTATAGAGGA
GTTACTAGAAGGCAGAAAGATGGGAGGTGGCAGGCACGCATAGGACTGGTTGCTGGAACAAGAGA
CATTTACCTGGGAACTTTCAAAACTGAGGAAGAAGCAGCGGAGGCTTACGACATTGCTGCTATTGAG
ATCCGTGGCAAAAATGCGGTGACCAACTTTGATCGAAGCAACTACATGGAGAAGGGTATGCACTGT
ATAGAAGGGGCAGGCTTGAAGCTGCTTGCGTCTAAGCCAGAATGA
SEQ ID NO:45-OsWRI07可读框的氨基酸序列
MESSLKEEKAAGESGDDEKAERSSPINLNSLPATAACAATAPDEDGLHSAVESGAKDSNTTKGVESLGT
GHKKIPKREVVDEVDVQTCAEGKNDSVVPSSSKNPINDKNAKANVAENGQSADGIPEDQRVTILSVVKK
DEPADDVRDSVNPVTVVGYRDEKGGTSGTAGTTAVRPAGTRSSSFHGVTRHRWSGKYEAHLWDSSCR
MEGRRRKGRQVYLGSYDTEEKAARSYDVAALKYWGQNTKLNFSVSEYERELEDIRDMSREECVTYLRR
RSSCFSRGASIYRGVTRRQKDGRWQARIGLVAGTRDIYLGTFKTEEEAAEAYDIAAIEIRGKNAVTNFDRS
NYMEKGMHCIEGAGLKLLASKPE
SEQ ID NO:46-OsWRI03的核酸序列
GGAGAGAGCAACGCAAGAACGGCACGAGAGGCTGGCAGCGAGCGAGCGTGTGCATGGTTGGTGCG
AGCAAATGGCCAGCGGCGGCGGCAGCAGCAACTGGTTAGGCTTCTCGCTCTCCCCGCACATGCCGG
CCATGGAGGTGCCGTCCTCCTCTGAGCCATCGACTGCTGCTCATCATCATCATCATCATCATCCACCT
GCTGCTGCTGCTGCTGCCGGAGCCATGTCGTCTCCTCCCGACAGCGCCACGACCTGCAACTTCCTCTT
CTCCCCTCCTGCAGCACAGATGGTCGCTCCTTCACCTGGCTACTACTACGTCGGCGGCGCCTACGGA
GACGGGACCAGCACCGCCGGCGTCTACTACTCGCACCTCCCTGTCATGCCTATCAAGTCCGATGGCT
CCCTCTGCATCATGGAAGGCATGATGCCGTCGTCATCGCCAAAGCTCGAGGACTTCTTGGGGTGTGG
CAATGGCAGTGGCCATGACCCGGCCACCTACTATAGCCAGGGCCAAGAAGCAGAGGATGCAAGCAG
GGCGGCCTACCAGCACCACCAGCTAGTCCCCTACAACTACCAGCCATTGACGGAAGCAGAGATGCT
GCAAGAGGCCGCAGCGGCGCCAATGGAGGACGCAATGGCGGCGGCCAAGAACTTCCTCGTCACCAG
CTACGGCGCCTGCTACGGCAACCAGGAGATGCCGCAGCCGCTCAGCCTCTCCATGAGCCCAGGGTCC
CAGTCCAGCAGCTGCGTCAGTGCAGCTCCCCAGCAGCATCAGCAGATGGCGGTGGTCGCTGCAGCT
GCTGCTGCTGGTGATGGCCAGGGAAGCAACAGTAATGACGGTGGCGAGCAGCGTGTCGGGAAGAAG
AGGGGCACCGGGAAAGGGGGCCAAAAGCAGCCTGTTCACCGGAAGTCCATTGACACGTTTGGGCAG
AGGACATCGCAGTATAGGGGCGTCACCAGGCACAGGTGGACTGGAAGATATGAAGCCCACCTCTGG
GATAACAGTTGCAAAAAGGATGGACAGACAAGGNAAGGGAAGGCAAGTATATCTAGGTGGTTAGA
CACTGAAGATAAAGCTGCGAGGGCTTATGATCTGGCTGCGCTGAAATACTGGGGGCTATCTACGCAT
ATAAATTTCCCGTTAGAAAACTACCGAGATGAGATCGAGGAGATGGAAAGGATGACAAGGCAAGA
ATATGTTGCGCACTTGAGAAGGAGAAGCAGCGGGTTCTCTCGCGGTGCTTCCATCTACCGGGGAGTA
ACAAGGCATCACCAGCATGGAAGATGGCAAGCTCGGATTGGCAGGGTTGCTGGCAACAAGGACTTG
TATCTCGGCACTTTCAGCACTCAAGAAGAAGCAGCAGAGGCATACGACATTGCTGCCATCAAGTTCC
GTGGCCTGAACGCGGTGACGAACTTTGACATCACAAGGTACGACGTGGACAAGATCATGGAGAGCA
GCTCGCTGCTGCCTGGTGAGGCAGCGCGTAAGGTGAAGGCGATCGAGGCAGCGCCGGACCATGTGC
CAATAGGCCGCGAGCTCGGTGCGACCGAGGAAGCGAGCGCTGCTACTGTCACGGGCACCGACTGGA
GAATGGTGCTCCATGGATCACAGCAGCAGCAAGCTGCAGCGTGCACCGAAGCAACGGCAGATCTTC
AGAAGGGCTTCATGGGTGACGCGCACTCGGCTCTCCACGGCATTGTCGGGTTCGACGTCGAGTCGGC
GGCAGCTGACGAGATCGATGTCCCGGGAGGGAAGATCAGTGGCATCAACTTCTCGAACTCGTCTTCG
CTGGTGACTAGCCTGAGCAACTCGAGGGAGGGGAGCCCTGAGAGGCTTGGCCTCGCCATGCTCTAC
GCCAAGCATCATCCCACCGCCGTCAGCCTCGCCGCCATGAACCCCTGGATGCCGATGCCGGCGCCGG
CCGCAGCTCACGTGATGAGGCCGCCGAGTGCCATTGCTCATCTCCCTGTTTTTGCAGCCTGGACAGA
TGCTTAATTAGAGCCATGTTGCTGCTTGCTCGATCTTGCTTTTGATCGGCTCTTTTTGTAAACTAAAG
CAAGATCAGCAGCAATCAGGTGCTTATGGTACTTAAATTAGCTGGAAGCCTGGAGTAGCATACTTGG
TTATGATGGTAAGCACTAGGCTGGTGGTGTAAGTGTTTAACCAGTAAACCCATAGGTAGGACATTCA
AGCA
SEQ ID NO:47-OsWRI03可读框的核酸序列
ATGGCCAGCGGCGGCGGCAGCAGCAACTGGTTAGGCTTCTCGCTCTCCCCGCACATGCCGGCCATGG
AGGTGCCGTCCTCCTCTGAGCCATCGACTGCTGCTCATCATCATCATCATCATCATCCACCTGCTGCT
GCTGCTGCTGCCGGAGCCATGTCGTCTCCTCCCGACAGCGCCACGACCTGCAACTTCCTCTTCTCCCC
TCCTGCAGCACAGATGGTCGCTCCTTCACCTGGCTACTACTACGTCGGCGGCGCCTACGGAGACGGG
ACCAGCACCGCCGGCGTCTACTACTCGCACCTCCCTGTCATGCCTATCAAGTCCGATGGCTCCCTCTG
CATCATGGAAGGCATGATGCCGTCGTCATCGCCAAAGCTCGAGGACTTCTTGGGGTGTGGCAATGGC
AGTGGCCATGACCCGGCCACCTACTATAGCCAGGGCCAAGAAGCAGAGGATGCAAGCAGGGCGGCC
TACCAGCACCACCAGCTAGTCCCCTACAACTACCAGCCATTGACGGAAGCAGAGATGCTGCAAGAG
GCCGCAGCGGCGCCAATGGAGGACGCAATGGCGGCGGCCAAGAACTTCCTCGTCACCAGCTACGGC
GCCTGCTACGGCAACCAGGAGATGCCGCAGCCGCTCAGCCTCTCCATGAGCCCAGGGTCCCAGTCCA
GCAGCTGCGTCAGTGCAGCTCCCCAGCAGCATCAGCAGATGGCGGTGGTCGCTGCAGCTGCTGCTGC
TGGTGATGGCCAGGGAAGCAACAGTAATGACGGTGGCGAGCAGCGTGTCGGGAAGAAGAGGGGCA
CCGGGAAAGGGGGCCAAAAGCAGCCTGTTCACCGGAAGTCCATTGACACGTTTGGGCAGAGGACAT
CGCAGTATAGGGGCGTCACCAGGCACAGGTGGACTGGAAGATATGAAGCCCACCTCTGGGATAACA
GTTGCAAAAAGGATGGACAGACAAGGNAAGGGAAGGCAAGTATATCTAGGTGGTTAGACACTGAA
GATAAAGCTGCGAGGGCTTATGATCTGGCTGCGCTGAAATACTGGGGGCTATCTACGCATATAAATT
TCCCGTTAGAAAACTACCGAGATGAGATCGAGGAGATGGAAAGGATGACAAGGCAAGAATATGTTG
CGCACTTGAGAAGGAGAAGCAGCGGGTTCTCTCGCGGTGCTTCCATCTACCGGGGAGTAACAAGGC
ATCACCAGCATGGAAGATGGCAAGCTCGGATTGGCAGGGTTGCTGGCAACAAGGACTTGTATCTCG
GCACTTTCAGCACTCAAGAAGAAGCAGCAGAGGCATACGACATTGCTGCCATCAAGTTCCGTGGCCT
GAACGCGGTGACGAACTTTGACATCACAAGGTACGACGTGGACAAGATCATGGAGAGCAGCTCGCT
GCTGCCTGGTGAGGCAGCGCGTAAGGTGAAGGCGATCGAGGCAGCGCCGGACCATGTGCCAATAGG
CCGCGAGCTCGGTGCGACCGAGGAAGCGAGCGCTGCTACTGTCACGGGCACCGACTGGAGAATGGT
GCTCCATGGATCACAGCAGCAGCAAGCTGCAGCGTGCACCGAAGCAACGGCAGATCTTCAGAAGGG
CTTCATGGGTGACGCGCACTCGGCTCTCCACGGCATTGTCGGGTTCGACGTCGAGTCGGCGGCAGCT
GACGAGATCGATGTCCCGGGAGGGAAGATCAGTGGCATCAACTTCTCGAACTCGTCTTCGCTGGTGA
CTAGCCTGAGCAACTCGAGGGAGGGGAGCCCTGAGAGGCTTGGCCTCGCCATGCTCTACGCCAAGC
ATCATCCCACCGCCGTCAGCCTCGCCGCCATGAACCCCTGGATGCCGATGCCGGCGCCGGCCGCAGC
TCACGTGATGAGGCCGCCGAGTGCCATTGCTCATCTCCCTGTTTTTGCAGCCTGGACAGATGCTTAA
SEQ ID NO:48-OsWRI03可读框的氨基酸序列
MASGGGSSNWLGFSLSPHMPAMEVPSSSEPSTAAHHHHHHHPPAAAAAAGAMSSPPDSATTCNFLFSPP
AAQMVAPSPGYYYVGGAYGDGTSTAGVYYSHLPVMPIKSDGSLCIMEGMMPSSSPKLEDFLGCGNGSG
HDPATYYSQGQEAEDASRAAYQHHQLVPYNYQPLTEAEMLQEAAAAPMEDAMAAAKNFLVTSYGAC
YGNQEMPQPLSLSMSPGSQSSSCVSAAPQQHQQMAVVAAAAAAGDGQGSNSNDGGEQRVGKKRGTGK
GGQKQPVHRKSIDTFGQRTSQYRGVTRHRWTGRYEAHLWDNSCKKDGQTRXGKASISRWLDTEDKAA
RAYDLAALKYWGLSTHINFPLENYRDEIEEMERMTRQEYVAHLRRRSSGFSRGASIYRGVTRHHQHGR
WQARIGRVAGNKDLYLGTFSTQEEAAEAYDIAAIKFRGLNAVTNFDITRYDVDKIMESSSLLPGEAARKV
KAIEAAPDHVPIGRELGATEEASAATVTGTDWRMVLHGSQQQQAAACTEATADLQKGFMGDAHSALH
GIVGFDVESAAADEIDVPGGKISGINFSNSSSLVTSLSNSREGSPERLGLAMLYAKHHPTAVSLAAMNPW
MPMPAPAAAHVMRPPSAIAHLPVFAAWTDA
SEQ ID NO:49-TaWRI01的核酸序列
ATTTCGTATTAATAAAACGAGCACTATTTTATTTTTCTACTGTATTTTACTCCTGGTGTAGTGCTGCCA
GAAACCGCTGCAGGTGGTAGCAGTAAAAGATCCAGCAAATATCCGATGGTTTCAGAGCGCCAGTGC
GGCGGCGCCCTGTCAAGCGCGAGATAAAATCCGCCGGACCCCCGCGATTTCCCCCACTCCGCGTTTC
CTCTCTCGATTTGTCCAAATCTTTTGTTCTCCTTCTCCACCGGCGATTAGTTTGTTGTTTCCGGCATCA
CTCCGCACTAGGCCGCCCCTCGCCCGCGCTGGCCTCGTCGTTTCCTTCCCCAATTCCGCCGCCCCACC
CCGCCCGATATTTATTTCCTGCCTCGGTATCCATTTCCGTTGATAGATTTTTCCAGCTTTCGCTGCCTC
GCCGTTGCTGCTAATATCCGCGCTGGGATATTTCTTCTTTTGCTTTCTTGGCCGCGCGGCTCGGCCCG
TCCCCCTGGAGGCCTCCGGATCTTTCGATCGCGGCGAGCAGGCGGCTCAAGATAGTTCGTGAATAGG
AAGGCTGATAGGTAGGTTAGGGTTTTGGGAGTTGTTTTTGTCTCTGCTCCAGTACATAGATGATGAA
ATCCGGGGAGGAAGTTAGTCAGGGTCAGCAAATGAACGGTTTTGTGGAGGAGAAAGCTGCTGGGGA
ATCTGGGGATGGTCGGAAGATCGAGAGGAGCCCTTCCATCAATCTGAATTCCTTGCCTGCAATTGCC
CCTGCCACTACGGAGATTGGTGTCTTGCACTGTGCAGTGGAGTCAGAGGCCAACGATGCAAGCACTC
AGAAGGGAGATGAGTCCAGTGGCACTGATCAGAAGAAGGTCCCGAAGAATGAGGAGGTTGATGAA
GGTGAAGTTCAGGCCTGTGCAGATGTGAAGAGCCACTCGGTTGACCCTTTGAATAGCGAGAACCAT
GCCGGGGAGAAGGATGCTTTGGTAACTGTGCCAGAAAATGAGGGTTGTGCGGATGGTGGCGATAAT
TATAAGGGAGTTCAAGTTCTCAGCATTGTCAAAAAGGACGAGTCTGAGGAAATTGTTGATTCTATTA
ATCCTGTGACGGTTGCGGAGTATAGAGAGGAGAAGGGCACCGCCGGTTCTACTTCTGCAATTACTGC
GGTGCGAGCACCTGGCTCCCGCTCATCTTGTTTCCATGGTGTGACCAGGCATAGGTGGAGTGGGAAA
TATGAAGCTCATTTGTGGGACAGTACTTGCAGAGTAGAAGGACGGAGAAGGAAAGGAAAGCAAGTT
TATTTAGGAAGTTATGATACTGAGCAAAAAGCTGCCAGGGCATATGATGTTGCAGCTCTTAAATTCT
TTGGACTAAATACAAAGCTGAACTTCTCAATTTCGGAATATGAGAAGGAACTGGCGGACATACAAG
ACATGTCTCCAGAGGAATGTGTGACATACTGGGAAGGGGGGAGTAGTTGCTTCTCAAGAGGGGCGT
CTATTTACAGAGGAGTTACAAGGAGGCAGAAAGATGGTCGATGGCAGGCACGCATAGGACTGATTG
CTGGAACTAGAGACATTTACCTTGGAACTTTCAAAACTGAGGAAGAAGCCGCAGAAGCTTATGATA
TTGCTGCCATCGAGATACGCGGCAAAAATGCGGTGACCAACTTTGACAGAAGCAACTACATGGACA
GGGGCATGCATTGTATAGAAGGCGCAGGGTTGAAGCTGCTTGCAACCAAGCCAGAATAGTACCTGA
TTTGGCATCGTATATTGAACAGATTTGGTTGGCCGTATTTTGGAGCCTAGTGGTACATACAGATAGA
AGAACTGGTCGCAGCCTGTCATTATCCGCTGCTGTATGATTCTTCAGATTATATATAGTTCTTTCAGA
TAGAATTTCAGTAATTTAGCATGCTTTGTGTCCAGACAAGATTTTGACCATGCATTACTGTTATAGTG
TTTGTAGGCTAGAGTTGCAGTGGAAGATGTTGCTTCATTTCACATGTCTAAATCGGAGAATACGTTTT
ACTTCTAAGTTTTGATGCTTGGTTTAATGAAATATTCAAGTGTATGTTCCAAAAAAAAAAAAAAAAA
AGCGGCCGC
SEQ ID NO:50-TaWRI01可读框的核酸序列
ATGATGAAATCCGGGGAGGAAGTTAGTCAGGGTCAGCAAATGAACGGTTTTGTGGAGGAGAAAGCT
GCTGGGGAATCTGGGGATGGTCGGAAGATCGAGAGGAGCCCTTCCATCAATCTGAATTCCTTGCCTG
CAATTGCCCCTGCCACTACGGAGATTGGTGTCTTGCACTGTGCAGTGGAGTCAGAGGCCAACGATGC
AAGCACTCAGAAGGGAGATGAGTCCAGTGGCACTGATCAGAAGAAGGTCCCGAAGAATGAGGAGG
TTGATGAAGGTGAAGTTCAGGCCTGTGCAGATGTGAAGAGCCACTCGGTTGACCCTTTGAATAGCGA
GAACCATGCCGGGGAGAAGGATGCTTTGGTAACTGTGCCAGAAAATGAGGGTTGTGCGGATGGTGG
CGATAATTATAAGGGAGTTCAAGTTCTCAGCATTGTCAAAAAGGACGAGTCTGAGGAAATTGTTGAT
TCTATTAATCCTGTGACGGTTGCGGAGTATAGAGAGGAGAAGGGCACCGCCGGTTCTACTTCTGCAA
TTACTGCGGTGCGAGCACCTGGCTCCCGCTCATCTTGTTTCCATGGTGTGACCAGGCATAGGTGGAG
TGGGAAATATGAAGCTCATTTGTGGGACAGTACTTGCAGAGTAGAAGGACGGAGAAGGAAAGGAA
AGCAAGTTTATTTAGGAAGTTATGATACTGAGCAAAAAGCTGCCAGGGCATATGATGTTGCAGCTCT
TAAATTCTTTGGACTAAATACAAAGCTGAACTTCTCAATTTCGGAATATGAGAAGGAACTGGCGGAC
ATACAAGACATGTCTCCAGAGGAATGTGTGACATACTTGAGAAGGAGGAGTAGTTGCTTCTCAAGA
GGGGCGTCTATTTACAGAGGAGTTACAAGGAGGCAGAAAGATGGTCGATGGCAGGCACGCATAGGA
CTGATTGCTGGAACTAGAGACATTTACCTTGGAACTTTCAAAACTGAGGAAGAAGCCGCAGAAGCTT
ATGATATTGCTGCCATCGAGATACGCGGCAAAAATGCGGTGACCAACTTTGACAGAAGCAACTACA
TGGACAGGGGCATGCATTGTATAGAAGGCGCAGGGTTGAAGCTGCTTGCAACCAAGCCAGAATAG
SEQ ID NO:51-TaWRI01可读框的氨基酸序列
MMKSGEEVSQGQQMNGFVEEKAAGESGDGRKIERSPSINLNSLPAIAPATTEIGVLHCAVESEANDASTQ
KGDESSGTDQKKVPKNEEVDEGEVQACADVKSHSVDPLNSENHAGEKDALVTVPENEGCADGGDNYK
GVQVLSIVKKDESEEIVDSINPVTVAEYREEKGTAGSTSAITAVRAPGSRSSCFHGVTRHRWSGKYEAHL
WDSTCRVEGRRRKGKQVYLGSYDTEQKAARAYDVAALKFFGLNTKLNFSISEYEKELADIQDMSPEECV
TYLRRRSSCFSRGASIYRGVTRRQKDGRWQARIGLIAGTRDIYLGTFKTEEEAAEAYDIAAIEIRGKNAVT
NFDRSNYMDRGMHCIEGAGLKLLATKPE
SEQ ID NO:52-GmWRI01-1的核酸序列
GCCCTTAAGCAGTGGTAACAACGCAGAGTACGCGGGGATTCATTTTCATTCAACCCTTCTCTCT
CTCTCTCTCAGATAGATTCTATAAGATCGCAGTTTCCAAAGAAGCTAACTGAAGTTCAAACCCC
CATAACCTCTCTTTCACGTTCCTCAACGACACATAAAACACACACCATGGACTCTTCTTCTTCAT
CACCGCCAAACAGCACCAACAACAACTCCCTCGCTTTCTCTCTTTCCAATCACTTTCCCAACCCT
TCTTCCTCTCCCCTTTCTCTCTTCCACTCCTTCACCTATCCATCTCTCTCTCTCACAGGCAGCAAC
ACGGTGGACGCACCGCCTGAGCCCACCGCTGGAGCAGGACCGACCAACCTCTCCATATTCACC
GGCGGCCCCAAGTTCGAGGACTTTCTGGGCGGTTCCGCCGCAACAGCCACCACCGTCGCGTGTG
CACCGCCACAGCTTCCGCAGTTCTCCACCGACAACAACAACCACCTATACGATTCGGAGCTGAA
GTCAACAATAGCCGCGTGCTTCCCTCGCGCCTTGGCCGCCGAACAAAGCACCGAACCGCAAAA
ACCATCCCCCAAGAAAACCGTCGACACCTTCGGGCAACGCACCTCCATCTACCGCGGCGTGACC
CGACATAGATGGACTGGGAGATACGAAGCTCATCTATGGGACAATAGTTGCAGAAGGGAAGGT
CAAAGCAGGAAAGGAAGGCAAGTTTACTTGGGTGGTTATGACAAGGAGGATAAGGCAGCCAG
AGCTTATGATCTCGCAGCTCTCAAGTACTGGGGTCCAACTACCACCACTAACTTTCCTATTTCCA
ACTATGAGAAGGAACTGGAGGAGATGAAGAACATGACTAGGCAAGAGTTTGTTGCTTCTCTTC
GTAGGAAGAGCAGTGGTTTCTCTAGAGGGGCCTCTATATACAGAGGAGTAACGAGACACCACC
AGCATGGCCGATGGCAGGCGAGAATAGGCAGAGTTGCCGGAAACAAAGACCTCTACCTTGGCA
CTTTCAGCACCCAAGAAGAAGCTGCTGAGGCCTATGACATTGCTGCTATCAAATTCAGGGGATT
AAATGCAGTAACAAACTTTGACATGAGTCGCTACGACGTGAAGAGCATTGCAAATAGTACTCTT
CCTATTGGTGGTTTATCTGGCAAGAACAAGAACTCCACAGATTCTGCATCTGAGAGCAAAAGCC
ATGAGCCAAGCCAATCCGATGGAGATCCATCATCGGCTTCATCGGTGACCTTTGCATCACAGCA
ACAACCTTCAAGCTCCAACTTAAGCTTTGCCATACCCATTAAGCAAGACCCTTCAGATTACTGG
TCCATCTTGGGGTACCATAATACTCCCCTTGACAACAGTGGCATCAGGAACACTACTAGTACTG
TTACTACAACTACTTTTCCATCCTCCAACAATGGCACTGCTAGTAGTTTGACACCCTTCAACATG
GAGTTCTCAAGTGCCCCCTCAAGTACCGGCAGCGATAACAATGCCGCGTTTTTCAGTGGAGGAG
GCATCTTTGTTCAGCAACAAACTAGTCATGGTCATGGAAATGCAAGCAGTGGTTCCTCCTCTTC
TTCTTTAAGCTGTTCAATCCCATTCGCCACGCCCATATTTTCTCTAAATAGCAATACTAGTTATG
AGAGCAGTGCTGGTTATGGAAACTGGATTGGACCTACCCTGCACACATTCCAATCCCATGCAAA
ACCAAGTCTCTTTCAAACGCCAATATTTGGAATGGAATGAGCTCATGCACGAGCTGGGATGAG
AATCTGTGCATATAATGATGAAAGGGGAAGAAGGACAATAGTGGTGATGGTGTTTTAGCATGC
AAAGAAGCAAAGGACGGACTAGTCCCTTTAGCTGATGCAGTATTTGAATGAGTTGGACTGACA
GTCATAATTTCATGAGAATCGTAGCTATACCTAGCAGCTGACACTGTACTAACTCAAACTTCCT
TTGTTATGTTTTGAATGAATTTTCCTTTTTCTTTTTCGCCCCTTTATTAGCTTTTTGGTCCTGTTAA
TATACTGACATTATATCAAATGAGGATAATGGGAAGAAAAAAAAAATCCTTTTGTT
SEQ ID NO:53-GmWRI01-1可读框的核酸序列
ATGGACTCTTCTTCTTCATCACCGCCAAACAGCACCAACAACAACTCCCTCGCTTTCTCTCTTTC
CAATCACTTTCCCAACCCTTCTTCCTCTCCCCTTTCTCTCTTCCACTCCTTCACCTATCCATCTCTC
TCTCTCACAGGCAGCAACACGGTGGACGCACCGCCTGAGCCCACCGCTGGAGCAGGACCGACC
AACCTCTCCATATTCACCGGCGGCCCCAAGTTCGAGGACTTTCTGGGCGGTTCCGCCGCAACAG
CCACCACCGTCGCGTGTGCACCGCCACAGCTTCCGCAGTTCTCCACCGACAACAACAACCACCT
ATACGATTCGGAGCTGAAGTCAACAATAGCCGCGTGCTTCCCTCGCGCCTTGGCCGCCGAACAA
AGCACCGAACCGCAAAAACCATCCCCCAAGAAAACCGTCGACACCTTCGGGCAACGCACCTCC
ATCTACCGCGGCGTGACCCGACATAGATGGACTGGGAGATACGAAGCTCATCTATGGGACAAT
AGTTGCAGAAGGGAAGGTCAAAGCAGGAAAGGAAGGCAAGTTTACTTGGGTGGTTATGACAA
GGAGGATAAGGCAGCCAGAGCTTATGATCTCGCAGCTCTCAAGTACTGGGGTCCAACTACCAC
CACTAACTTTCCTATTTCCAACTATGAGAAGGAACTGGAGGAGATGAAGAACATGACTAGGCA
AGAGTTTGTTGCTTCTCTTCGTAGGAAGAGCAGTGGTTTCTCTAGAGGGGCCTCTATATACAGA
GGAGTAACGAGACACCACCAGCATGGCCGATGGCAGGCGAGAATAGGCAGAGTTGCCGGAAA
CAAAGACCTCTACCTTGGCACTTTCAGCACCCAAGAAGAAGCTGCTGAGGCCTATGACATTGCT
GCTATCAAATTCAGGGGATTAAATGCAGTAACAAACTTTGACATGAGTCGCTACGACGTGAAG
AGCATTGCAAATAGTACTCTTCCTATTGGTGGTTTATCTGGCAAGAACAAGAACTCCACAGATT
CTGCATCTGAGAGCAAAAGCCATGAGCCAAGCCAATCCGATGGAGATCCATCATCGGCTTCAT
CGGTGACCTTTGCATCACAGCAACAACCTTCAAGCTCCAACTTAAGCTTTGCCATACCCATTAA
GCAAGACCCTTCAGATTACTGGTCCATCTTGGGGTACCATAATACTCCCCTTGACAACAGTGGC
ATCAGGAACACTACTAGTACTGTTACTACAACTACTTTTCCATCCTCCAACAATGGCACTGCTA
GTAGTTTGACACCCTTCAACATGGAGTTCTCAAGTGCCCCCTCAAGTACCGGCAGCGATAACAA
TGCCGCGTTTTTCAGTGGAGGAGGCATCTTTGTTCAGCAACAAACTAGTCATGGTCATGGAAAT
GCAAGCAGTGGTTCCTCCTCTTCTTCTTTAAGCTGTTCAATCCCATTCGCCACGCCCATATTTTCT
CTAAATAGCAATACTAGTTATGAGAGCAGTGCTGGTTATGGAAACTGGATTGGACCTACCCTGC
ACACATTCCAATCCCATGCAAAACCAAGTCTCTTTCAAACGCCAATATTTGGAATGGAATGA
SEQ ID NO:54-GmWRI01-1可读框的氨基酸序列
MDSSSSSPPNSTNNNSLAFSLSNHFPNPSSSPLSLFHSFTYPSLSLTGSNTVDAPPEPTAGAGPTNLSIF
TGGPKFEDFLGGSAATATTVACAPPQLPQFSTDNNNHLYDSELKSTIAACFPRALAAEQSTEPQKPSP
KKTVDTFGQRTSIYRGVTRHRWTGRYEAHLWDNSCRREGQSRKGRQVYLGGYDKEDKAARAYDL
AALKYWGPTTTTNFPISNYEKELEEMKNMTRQEFVASLRRKSSGFSRGASIYRGVTRHHQHGRWQ
ARIGRVAGNKDLYLGTFSTQEEAAEAYDIAAIKFRGLNAVTNFDMSRYDVKSIANSTLPIGGLSGKN
KNSTDSASESKSHEPSQSDGDPSSASSVTFASQQQPSSSNLSFAIPIKQDPSDYWSILGYHNTPLDNSG
IRNTTSTVTTTTFPSSNNGTASSLTPFNMEFSSAPSSTGSDNNAAFFSGGGIFVQQQTSHGHGNASSGS
SSSSLSCSIPFATPIFSLNSNTSYESSAGYGNWIGPTLHTFQSHAKPSLFQTPIFGME
SEQ ID NO:55-GmWri11的核酸序列
GGGCTGTTTCCGTCGATGAGACCACAACTCGACTGTGTAACAGGGTAATCAAAATAGATAAAA
TAAAAAATATACTTCCTTTGACCGGTGACCGTGCGAACCGGTTCGAAGTTGGAACCATGAGAG
AGATAATGTTTATATATTCCATCATCTGTTCCGTTTGGATCCTCTCACCTCTCTCTCTCTCTCTCT
CTCTGGTGCCATGGAATCCGGTAGTGCCCGATGTTTATATTCTCTCTGGTTCTGAAATCATCGCC
GAGGAAATAACAAATGCAGCCTCCAAACCTCGCGAAGCTTCCTTCACACACTTCCTTCTATTCC
TTGTTCGTCGAACAAGCTCTTTAACATTCCATCACCACAACTTCCTACCTACACCTTCCGATATT
GCATCTTCAACTGTTTGGTTACATTTCACACGTAATAATTATTGTTTCTTTCGATTGGATCGGTC
GGAACCATCGCTCGAAGAGAATCTCCGGAGACGTAGAAGCAATATCAGTTTACTGTATGTATTG
GTTCGGATTAATAATAATAACGAAAAAATAGAAAGAAAATCAGAGTTGAAAATAGCCAGAAG
AAGATTAAGCGCGATGTTGGATCTTAATCTGAATGCCGAGTCGACTCAGAACAACGAGTCGCT
GGTGCTGTTGGACAAGTTTCCCGAAGCTTCGTTGGGAACTTCGAATTCCTCCGTCGTGAATGCG
GAGGGATCGAGCAACGAGGACTCGTGCTCCACACGCGCCGGCGACGTGTTCGCCTTCAGTTTCG
GAATCCTTAAGGTGGAAGGCGCGAACGAAGTCGTCGCCACGGCGACGAAGGAGCTGTTTCCGG
TGAGCTCGGAGAATTGGCAGGGGCAGAGTTCGACGTCGTCGTCTCAGGCGAGGAAGAATTTAA
TGGATCTCCCGCTGGATCATCAAAACGGTGAGGTGAAGGTGGTTCAGGTTCAGCCACAGCCTCA
GGTGAAGAAGAGTAGGAGAGGTCCAAGGTCTCGGAGCTCTCAGTACAGAGGAGTCACTTTCTA
CAGAAGGACCGGAAGATGGGAATCGCATATCTGGGATTGCGGGAAGCAAGTCTATTTGGGTGG
ATTTGACACCGCTCATATTGCTGCTAGGGCCTATGATCGAACTGCTATTAAGTTCAGGGGACTT
GATGCTGATATCAATTTTGATCTCGTTGATTATGAGGAGGATCTAAAACAGATGAAGAATCTTT
CAAGCAGGAGTTCGTGCACATACTTCGCCGCCACAGTACCGGTTCTCANGGGCAGTTCGAAATA
CCNGGGATACACTTCACAAGTGGCCTTGGGAACTCGATGGGNATTCCTGGCAGAAGCTATACA
GGCACTTCAGTGCATAAANAAGNTGTCCTACTTNACCATTNTTGNACGNAGAACNGAGCTTCAT
CCTGGANAGGTAGCAGGCGTTTCANGCAAGAGNAGGTNCCCTATTGAGCCAGAATNGGGAGGA
GAGAACCGGAGTNTNAAGAAGNGGCNTCCGGCCTGGNCTCAATTGGGCNAGCAACCCNAGAC
ATGTCCCAAAGAAAATAGGGNCNTTTTCAGTTCCAGTCCATCCNTTACAACATGCATCCGGGAA
GAAGTTCAAGNATGGAGACTAATGTTAATTCGGTTATTGGTGATCCTTCTTNGAAAAGGCTGGT
TGTACGAAGAGCGTCCTTCTGTATATTCCACTTTCTTTCCCAATCTGGAAAGAGCAGAGAGAAT
GGGCATAGATCCTTCAAAAGGAGTTCCAAACTGGGCGTGGCAGACAAATGGCCAGGTTAATGC
CACCCCAGTACCACCGTTCTCTACTGCAGCATCATCAGGATTCTCAATTTCAGCTACTTTTCCAT
CAACTGCCATCTTTCCAACAAAATCCATGAACCCAATTCCCCAGAGCTTCTGTTTCACTTCACAC
AGCACACCAGGTAGCAATGCACCTCAATTCTATTACGAGGTCAAGTCCTCGCAGGCACCATCCC
AGCCTCTATCTTGTAATACAAGTATAAATGGTAGCCCACCACACAAGTTCTGAAGTTCAATTCT
CAAAACGACAGTTAAAACTTTTTTTTTTTTTTTTCCTGTTTGCATGATTTAGGGATCGGTACAAT
GTTGTTGCTCATGGTATGTTTGTATGTGATGAAAAGATTTTTTTCTTCAGAGAGAAAGTGAAAA
GAAAAAATGCATGATGTGTTTTA
SEQ ID NO:56-GmWRI11可读框的核酸序列
ATGAGAGAGATAATGTTTATATATTCCATCATCTGTTCCGTTTGGATCCTCTCACCTCTCTCTCT
CTCTCTCTCTCTGGTGCCATGGAATCCGGTAGTGCCCGATGTTTATATTCTCTCTGGTTCTGAAA
TCATCGCCGAGGAAATAACAAATGCAGCCTCCAAACCTCGCGAAGCTTCCTTCACACACTTCCT
TCTATTCCTTGTTCGTCGAACAAGCTCTTTAACATTCCATCACCACAACTTCCTACCTACACCTT
CCGATATTGCATCTTCAACTGTTTGGTTACATTTCACACGTAATAATTATTGTTTCTTTCGATTGG
ATCGGTCGGAACCATCGCTCGAAGAGAATCTCCGGAGACGTAGAAGCAATATCAGTTTACTGT
ATGTATTGGTTCGGATTAATAATAATAACGAAAAAATAGAAAGAAAATCAGAGTTGAAAATAG
CCAGAAGAAGATTAAGCGCGATGTTGGATCTTAATCTGAATGCCGAGTCGACTCAGAACAACG
AGTCGCTGGTGCTGTTGGACAAGTTTCCCGAAGCTTCGTTGGGAACTTCGAATTCCTCCGTCGT
GAATGCGGAGGGATCGAGCAACGAGGACTCGTGCTCCACACGCGCCGGCGACGTGTTCGCCTT
CAGTTTCGGAATCCTTAAGGTGGAAGGCGCGAACGAAGTCGTCGCCACGGCGACGAAGGAGCT
GTTTCCGGTGAGCTCGGAGAATTGGCAGGGGCAGAGTTCGACGTCGTCGTCTCAGGCGAGGAA
GAATTTAATGGATCTCCCGCTGGATCATCAAAACGGTGAGGTGAAGGTGGTTCAGGTTCAGCCA
CAGCCTCAGGTGAAGAAGAGTAGGAGAGGTCCAAGGTCTCGGAGCTCTCAGTACAGAGGAGTC
ACTTTCTACAGAAGGACCGGAAGATGGGAATCGCATATCTGGGATTGCGGGAAGCAAGTCTAT
TTGGGTGGATTTGACACCGCTCATATTGCTGCTAGGGCCTATGATCGAACTGCTATTAAGTTCA
GGGGACTTGATGCTGATATCAATTTTGATCTCGTTGATTATGAGGAGGATCTAAAACAGATGAA
GAATCTTTCAAGCAGGAGTTCGTGCACATACTTCGCCGCCACAGTACCGGTTCTCANGGGCAGT
TCGAAATACCNGGGATACACTTCACAAGTGGCCTTGGGAACTCGATGGGNATTCCTGGCAGAA
GCTATACAGGCACTTCAGTGCATAAANAAGNTGTCCTACTTNACCATTNTTGNACGNAGAACN
GAGCTTCATCCTGGANAGGTAGCAGGCGTTTCANGCAAGAGNAGGTNCCCTATTGAGCCAGAA
TNGGGAGGAGAGAACCGGAGTNTNAAGAAGNGGCNTCCGGCCTGGNCTCAATTGGGCNAGCA
ACCCNAGACATGTCCCAAAGAAAATAGGGNCNTTTTCAGTTCCAGTCCATCCNTTACAACATGC
ATCCGGGAAGAAGTTCAAGNATGGAGACTAATGTTAATTCGGTTATTGGTGATCCTTCTTNGAA
AAGGCTGGTTGTACGAAGAGCGTCCTTCTGTATATTCCACTTTCTTTCCCAATCTGGAAAGAGC
AGAGAGAATGGGCATAGATCCTTCAAAAGGAGTTCCAAACTGGGCGTGGCAGACAAATGGCCA
GGTTAATGCCACCCCAGTACCACCGTTCTCTACTGCAGCATCATCAGGATTCTCAATTTCAGCTA
CTTTTCCATCAACTGCCATCTTTCCAACAAAATCCATGAACCCAATTCCCCAGAGCTTCTGTTTC
ACTTCACACAGCACACCAGGTAGCAATGCACCTCAATTCTATTACGAGGTCAAGTCCTCGCAGG
CACCATCCCAGCCTCTATCTTGTAATACAAGTATAAATGGTAGCCCACCACACAAGTTCTGA
SEQ ID NO:57-GmWRI11可读框的氨基酸序列
MREIMFIYSIICSVWILSPLSLSLSLVPWNPVVPDVYILSGSEIIAEEITNAASKPREASFTHFLLFLVRR
TSSLTFHHHNFLPTPSDIASSTVWLHFTRNNYCFFRLDRSEPSLEENLRRRRSNISLLYVLVRINNNNE
KIERKSELKIARRRLSAMLDLNLNAESTQNNESLVLLDKFPEASLGTSNSSVVNAEGSSNEDSCSTRA
GDVFAFSFGILKVEGANEVVATATKELFPVSSENWQGQSSTSSSQARKNLMDLPLDHQNGEVKVV
QVQPQPQVKKSRRGPRSRSSQYRGVTFYRRTGRWESHIWDCGKQVYLGGFDTAHIAARAYDRTAI
KFRGLDADINFDLVDYEEDLKQMKNLSSRSSCTYFAATVPVLXGSSKYXGYTSQVALGTRWXFLA
EAIQALQCIXKXSYXTIXXRRTELHPGXVAGVSXKXRXPIEPEXGGENRSXKKXXPAWXQLGXQPX
TCPKENRXXFSSSPSXTTCIREEVQXWRLMLIRLLVILLXKGWLYEERPSVYSTFFPNLERAERMGID
PSKGVPNWAWQTNGQVNATPVPPFSTAASSGFSISATFPSTAIFPTKSMNPIPQSFCFTSHSTPGSNAP
QFYYEVKSSQAPSQPLSCNTSINGSPPHKF
SEQ ID NO:58-PtxA启动子的核酸序列
CGCAATTTTTTGTGAAGCTGAGGGAGGATTGGATTTTACACCTATTCAAAAGTCATTCAAAGTTTGTCCCTCCATT
CAAGGATGAATGTAGATTTTTCAAGCATCAAACACAAGAATCACTAGCATAACATGCTTTGAAACCCACACACTTAAA
TTAATGTTAGGAATATCAAATCCAATATAAAATCATAGTTGTCAATTACATACTCAATCAAGTCCCTTTCTTTTACCCA
ATAAACATCAACATATTGCTTCTTCCATTAAGCATATAAACATCAAAGTCTAAAACTAGCAAAATGTTGTTTTTAGGAT
GACACATTTCATACATAGTTTAAAAGATACTTGATTCGATTACAAAAAGAAATTACCAATAGTTTAGCACAAAGTCTA
AAGCATAATTAAAGCATCACATGTGCAGATTTATGAAAAAAAGATTAAGATTGCCCCTTTCATCACGGGTCGAATAAT
AGCACTACTTGTCACTACATGTTAAAAAAATGTCCTCTAGTACATCAAACTTTTTCCATTGATTCCCCTTATCCATGAA
AAAAATAAACAAATTCTTAAGACACAAAAAAATGGCCCCACATCCTTTTTTCTGGCCTAGTTTGTTTGAATTCATTCTA
ACTCTTGAATATGTAACGAGGCCCACTAAAAATCAATCAATGATTTAACATAAAAAATGAATAGTTTAATTCCAATTT
GCTGCAACATGGTCCGTGAATATGACTCACGAGAAAGATATATCAAAATATCAAAATTTCATAGTTTTTTTCACCATAT
AAACCTCATCACTCATTCTATTTTTTTAAGTGCAAAGCTTCATAGTTA
序列表
<110>巴斯福植物科学有限公司
<120>编码WRINKLED1样多肽的核酸分子及在植物中的使用方法
<130>16313-0369
<140>PCT/US05/021500
<141>2004-06-16
<150>60/580,334
<151>2004-06-16
<150>60/600,466
<151>2004-11-08
<160>58
<170>PatentIn版本3.3
<210>1
<211>1577
<212>DNA
<213>拟南芥(Arabidopsis thaliana)
<400>1
Figure A200580026790D01031
<210>2
<211>1293
<212>DNA
<213>拟南芥
<400>2
<210>3
<211>430
<212>PRT
<213>拟南芥
<400>3
Figure A200580026790D01051
Figure A200580026790D01061
<210>4
<211>1509
<212>DNA
<213>欧洲油菜(Brassica napus)
<400>4
Figure A200580026790D01071
<210>5
<211>1284
<212>DNA
<213>欧洲油菜
<400>5
Figure A200580026790D01072
Figure A200580026790D01081
<210>6
<211>427
<212>PRT
<213>欧洲油菜
<400>6
Figure A200580026790D01082
Figure A200580026790D01091
Figure A200580026790D01101
<210>7
<211>1392
<212>DNA
<213>欧洲油菜
<400>7
Figure A200580026790D01111
<210>8
<211>1242
<212>DNA
<213>欧洲油菜
<400>8
<210>9
<211>413
<212>PRT
<213>欧洲油菜
<400>9
Figure A200580026790D01113
Figure A200580026790D01121
Figure A200580026790D01131
<210>10
<211>1375
<212>DNA
<213>欧洲油菜
<400>10
Figure A200580026790D01132
Figure A200580026790D01141
<210>11
<211>1233
<212>DNA
<213>欧洲油菜
<400>11
Figure A200580026790D01142
Figure A200580026790D01151
<210>12
<211>410
<212>PRT
<213>欧洲油菜
<400>12
Figure A200580026790D01152
<210>13
<211>1392
<212>DNA
<213>欧洲油菜
<400>13
Figure A200580026790D01171
<210>14
<211>1251
<212>DNA
<213>欧洲油菜
<400>14
Figure A200580026790D01172
Figure A200580026790D01181
<210>15
<211>416
<212>PRT
<213>欧洲油菜
<400>15
Figure A200580026790D01182
Figure A200580026790D01191
Figure A200580026790D01201
<210>16
<211>1457
<212>DNA
<213>欧洲油菜
<400>16
Figure A200580026790D01202
Figure A200580026790D01211
<210>17
<211>1248
<212>DNA
<213>欧洲油菜
<400>17
Figure A200580026790D01212
<210>18
<211>415
<212>PRT
<213>欧洲油菜
<400>18
Figure A200580026790D01213
<210>19
<211>1389
<212>DNA
<213>欧洲油菜
<220>
<221>modified_base
<222>(1318)
<223>a,c,g,t,未知的或其他
<220>
<221>modified_base
<222>(1342)
<223>a,c,g,t,未知的或其他
<220>
<221>modified_base
<222>(1346)
<223>a,c,g,t,未知的或其他
<220>
<221>modified_base
<222>(1354)
<223>a,c,g,t,未知的或其他
<220>
<221>modified_base
<222>(1374)
<223>a,c,g,t,未知的或其他
<220>
<221>modified_base
<222>(1386)
<223>a,c,g,t,未知的或其他
<400>19
Figure A200580026790D01251
<210>20
<211>1113
<212>DNA
<213>欧洲油菜
<400>20
Figure A200580026790D01252
<210>21
<211>370
<212>PRT
<213>欧洲油菜
<400>21
Figure A200580026790D01261
Figure A200580026790D01271
<210>22
<211>1892
<212>DNA
<213>大豆(Glycine max)
<400>22
Figure A200580026790D01272
<210>23
<211>1551
<212>DNA
<213>大豆
<400>23
Figure A200580026790D01282
Figure A200580026790D01291
<210>24
<211>516
<212>PRT
<213>大豆
<400>24
Figure A200580026790D01292
Figure A200580026790D01301
Figure A200580026790D01311
<210>25
<211>2088
<212>DNA
<213>大豆
<400>25
Figure A200580026790D01312
Figure A200580026790D01321
<210>26
<211>1587
<212>DNA
<213>大豆
<400>26
Figure A200580026790D01322
<210>27
<211>528
<212>PRT
<213>大豆
<400>27
Figure A200580026790D01332
Figure A200580026790D01341
Figure A200580026790D01351
<210>28
<211>1683
<212>DNA
<213>大豆
<400>28
Figure A200580026790D01352
<210>29
<211>1542
<212>DNA
<213>大豆
<400>29
Figure A200580026790D01362
Figure A200580026790D01371
<210>30
<211>513
<212>PRT
<213>大豆
<400>30
Figure A200580026790D01372
Figure A200580026790D01381
Figure A200580026790D01391
<210>31
<211>2388
<212>DNA
<213>大豆
<400>31
Figure A200580026790D01401
<210>32
<211>2154
<212>DNA
<213>大豆
<400>32
Figure A200580026790D01411
<210>33
<211>717
<212>PRT
<213>大豆
<400>33
Figure A200580026790D01421
Figure A200580026790D01431
Figure A200580026790D01441
<210>34
<211>2259
<212>DNA
<213>大豆
<400>34
Figure A200580026790D01461
<210>35
<211>1998
<212>DNA
<213>大豆
<400>35
Figure A200580026790D01471
<210>36
<211>665
<212>PRT
<213>大豆
<400>36
Figure A200580026790D01472
Figure A200580026790D01481
Figure A200580026790D01501
<210>37
<211>2125
<212>DNA
<213>大豆
<400>37
Figure A200580026790D01502
Figure A200580026790D01511
<210>38
<211>1992
<212>DNA
<213>大豆
<400>38
<210>39
<211>663
<212>PRT
<213>大豆
<400>39
Figure A200580026790D01522
Figure A200580026790D01531
Figure A200580026790D01551
<210>40
<211>1458
<212>DNA
<213>稻(Oryza sativa)
<400>40
Figure A200580026790D01552
<210>41
<211>1341
<212>DNA
<213>稻
<400>41
Figure A200580026790D01561
<210>42
<211>446
<212>PRT
<213>稻
<400>42
Figure A200580026790D01562
Figure A200580026790D01571
Figure A200580026790D01581
<210>43
<211>1845
<212>DNA
<213>稻
<220>
<221>modified_base
<222>(1643)
<223>a,c,g,t,未知的或其他
<400>43
Figure A200580026790D01591
<210>44
<211>1104
<212>DNA
<213>稻
<400>44
Figure A200580026790D01592
Figure A200580026790D01601
<210>45
<211>367
<212>PRT
<213>稻
<400>45
Figure A200580026790D01602
Figure A200580026790D01611
<210>46
<211>2198
<212>DNA
<213>稻
<220>
<221>modified_base
<222>(1031)
<223>a,c,g,t,未知的或其他
<400>46
Figure A200580026790D01621
Figure A200580026790D01631
<210>47
<211>1929
<212>DNA
<213>稻
<220>
<221>modified_base
<222>(961)
<223>a,c,g,t,未知的或其他
<400>47
Figure A200580026790D01641
<210>48
<211>642
<212>PRT
<213>稻
<220>
<221>MOD_RES
<222>(321)
<223>可变氨基酸
<400>48
Figure A200580026790D01642
Figure A200580026790D01651
Figure A200580026790D01661
<210>49
<211>2084
<212>DNA
<213>普通小麦(Triticum aestivum)
<400>49
Figure A200580026790D01681
<210>50
<211>1128
<212>DNA
<213>普通小麦
<400>50
Figure A200580026790D01682
<210>51
<211>375
<212>PRT
<213>普通小麦
<400>51
Figure A200580026790D01683
Figure A200580026790D01691
Figure A200580026790D01701
<210>52
<211>2103
<212>DNA
<213>大豆
<400>52
Figure A200580026790D01702
Figure A200580026790D01711
<210>53
<211>1593
<212>DNA
<213>大豆
<400>53
Figure A200580026790D01712
Figure A200580026790D01721
<210>54
<211>530
<212>PRT
<213>大豆
<400>54
Figure A200580026790D01722
Figure A200580026790D01731
Figure A200580026790D01741
<210>55
<211>2193
<212>DNA
<213>大豆
<220>
<221>modified_base
<222>(1261)
<223>a,c,g,t,未知的或其他
<220>
<221>modified_base
<222>(1279)
<223>a,c,g,t,未知的或其他
<220>
<221>modified_base
<222>(1318)
<223>a,c,g,t,未知的或其他
<220>
<221>modified_base
<222>(1358)
<223>a,c,g,t,未知的或其他
<220>
<221>modified_base
<222>(1362)
<223>a,c,g,t,未知的或其他
<220>
<221>modified_base
<222>(1373)
<223>a,c,g,t,未知的或其他
<220>
<221>modified_base
<222>(1380)
<223>a,c,g,t,未知的或其他
<220>
<221>modified_base
<222>(1384)
<223>a,c,g,t,未知的或其他
<220>
<221>modified_base
<222>(1388)
<223>a,c,g,t,未知的或其他
<220>
<221>modified_base
<222>(1394)
<223>a,c,g,t,未知的或其他
<220>
<221>modified_base
<222>(1410)
<223>a,c,g,t,未知的或其他
<220>
<221>modified_base
<222>(1428)
<223>a,c,g,t,未知的或其他
<220>
<221>modified_base
<222>(1436)
<223>a,c,g,t,未知的或其他
<220>
<221>modified_base
<222>(1441)
<223>a,c,g,t,未知的或其他
<220>
<221>modified_base
<222>(1459)
<223>a,c,g,t,未知的或其他
<220>
<221>modified_base
<222>(1479)
<223>a,c,g,t,未知的或其他
<220>
<221>modified_base
<222>(1481)
<223>a,c,g,t,未知的或其他
<220>
<221>modified_base
<222>(1488)
<223>a,c,g,t,未知的或其他
<220>
<221>modified_base
<222>(1492)
<223>a,c,g,t,未知的或其他
<220>
<221>modified_base
<222>(1503)
<223>a,c,g,t,未知的或其他
<220>
<221>modified_base
<222>(1515)
<223>a,c,g,t,未知的或其他
<220>
<221>modified_base
<222>(1524)
<223>a,c,g,t,未知的或其他
<220>
<221>modified_base
<222>(1549)
<223>a,c,g,t,未知的或其他
<220>
<221>modified_base
<222>(1551)
<223>a,c,g,t,未知的或其他
<220>
<221>modified_base
<222>(1572)
<223>a,c,g,t,未知的或其他
<220>
<221>modified_base
<222>(1603)
<223>a,c,g,t,未知的或其他
<220>
<221>modified_base
<222>(1644)
<223>a,c,g,t,未知的或其他
<400>55
Figure A200580026790D01781
<210>56
<211>1911
<212>DNA
<213>大豆
<220>
<221>modified_base
<222>(1142)
<223>a,c,g,t,未知的或其他
<220>
<221>modified_base
<222>(1160)
<223>a,c,g,t,未知的或其他
<220>
<221>modified_base
<222>(1199)
<223>a,c,g,t,未知的或其他
<220>
<221>modified_base
<222>(1239)
<223>a,c,g,t,未知的或其他
<220>
<221>modified_base
<222>(1243)
<223>a,c,g,t,未知的或其他
<220>
<221>modified_base
<222>(1254)
<223>a,c,g,t,未知的或其他
<220>
<221>modified_base
<222>(1261)
<223>a,c,g,t,未知的或其他
<220>
<221>modified_base
<222>(1265)
<223>a,c,g,t,未知的或其他
<220>
<221>modified_base
<222>(1269)
<223>a,c,g,t,未知的或其他
<220>
<221>modified_base
<222>(1275)
<223>a,c,g,t,未知的或其他
<220>
<221>modified_base
<222>(1291)
<223>a,c,g,t,未知的或其他
<220>
<221>modified_base
<222>(1309)
<223>a,c,g,t,未知的或其他
<220>
<221>modified_base
<222>(1317)
<223>a,c,g,t,未知的或其他
<220>
<221>modified_base
<222>(1322)
<223>a,c,g,t,未知的或其他
<220>
<221>modified_base
<222>(1340)
<223>a,c,g,t,未知的或其他
<220>
<221>modified_base
<222>(1360)
<223>a,c,g,t,未知的或其他
<220>
<221>modified_base
<222>(1362)
<223>a,c,g,t,未知的或其他
<220>
<221>modified_base
<222>(1369)
<223>a,c,g,t,未知的或其他
<220>
<221>modified_base
<222>(1373)
<223>a,c,g,t,未知的或其他
<220>
<221>modified_base
<222>(1384)
<223>a,c,g,t,未知的或其他
<220>
<221>modified_base
<222>(1396)
<223>a,c,g,t,未知的或其他
<220>
<221>modified_base
<222>(1405)
<223>a,c,g,t,未知的或其他
<220>
<221>modified_base
<222>(1430)
<223>a,c,g,t,未知的或其他
<220>
<221>modified_base
<222>(1432)
<223>a,c,g,t,未知的或其他
<220>
<221>modified_base
<222>(1453)
<223>a,c,g,t,未知的或其他
<220>
<221>modified_base
<222>(1484)
<223>a,c,g,t,未知的或其他
<220>
<221>modified_base
<222>(1525)
<223>a,c,g,t,未知的或其他
<400>56
Figure A200580026790D01821
<210>57
<211>636
<212>PRT
<213>大豆
<220>
<221>MOD_RES
<222>(381)
<223>可变氨基酸
<220>
<221>MOD_RES
<222>(385)
<223>可变氨基酸
<220>
<221>MOD_RES
<222>(400)
<223>可变氨基酸
<220>
<221>MOD_RES
<222>(413)
<223>可变氨基酸
<220>
<221>MOD_RES
<222>(415)
<223>可变氨基酸
<220>
<221>MOD_RES
<222>(418)
<223>可变氨基酸
<220>
<221>MOD_RES
<222>(421)..(422)
<223>可变氨基酸
<220>
<221>MOD_RES
<222>(431)
<223>可变氨基酸
<220>
<221>MOD_RES
<222>(437)
<223>可变氨基酸
<220>
<221>MOD_RES
<222>(439)
<223>可变氨基酸
<220>
<221>MOD_RES
<222>(441)
<223>可变氨基酸
<220>
<221>MOD_RES
<222>(447)
<223>可变氨基酸
<220>
<221>MOD_RES
<222>(454)
<223>可变氨基酸
<220>
<221>MOD_RES
<222>(457)..(458)
<223>可变氨基酸
<220>
<221>MOD_RES
<222>(462)
<223>可变氨基酸
<220>
<221>MOD_RES
<222>(466)
<223>可变氨基酸
<220>
<221>MOD_RES
<222>(469)
<223>可变氨基酸
<220>
<221>MOD_RES
<222>(477)..(478)
<223>可变氨基酸
<220>
<221>MOD_RES
<222>(485)
<223>可变氨基酸
<220>
<221>MOD_RES
<222>(495)
<223>可变氨基酸
<220>
<221>MOD_RES
<222>(509)
<223>可变氨基酸
<400>57
Figure A200580026790D01851
Figure A200580026790D01871
Figure A200580026790D01881
<210>58
<211>831
<212>DNA
<213>豌豆(Pisum sativum)
<400>58
Figure A200580026790D01882

Claims (34)

1.分离的脂类代谢蛋白(LMP)核酸,所述核酸含有选自以下的多核苷酸序列:
a)SEQ ID NO:4、SEQ ID NO:5、SEQ ID NO:7、SEQ ID NO:8、SEQ ID NO:10、SEQ ID NO:11、SEQ ID NO:13、SEQ ID NO:14、SEQ IDNO:16、SEQ ID NO:17、SEQ ID NO:19、SEQ ID NO:20、SEQ ID NO:22、SEQ ID NO:23、SEQ ID NO:25、SEQ ID NO:26、SEQ ID NO:28、SEQ IDNO:29、SEQ ID NO:31、SEQ ID NO:32、SEQ ID NO:34、SEQ ID NO:35、SEQ ID NO:37、SEQ ID NO:38、SEQ ID NO:40、SEQ ID NO:41、SEQ IDNO:43、SEQ ID NO:44、SEQ ID NO:46、SEQ ID NO:47、SEQ ID NO:49、SEQ ID NO:50、SEQ ID NO:52、SEQ ID NO:53、SEQ ID NO:55或SEQID NO:56中定义的多核苷酸序列;
b)编码SEQ ID NO:6、SEQ ID NO:9、SEQ ID NO:12、SEQ IDNO:15、SEQ ID NO:18、SEQ ID NO:21、SEQ ID NO:24、SEQ ID NO:27、SEQ ID NO:30、SEQ ID NO:33、SEQ ID NO:36、SEQ ID NO:39、SEQ IDNO:42、SEQ ID NO:45、SEQ ID NO:48、SEQ ID NO:51、SEQ ID NO:54或SEQ ID NO:57中定义的多肽的多核苷酸序列;
c)与上面的a)或b)的全长LMP核酸具有至少70%序列同一性的多核苷酸序列;
d)与上面的a)或b)的全长LMP核酸互补的多核苷酸序列;和
e)在严格条件下与上面的a)或b)的全长LMP核酸杂交的多核苷酸序列。
2.权利要求1的分离的LMP核酸,其中所述多核苷酸序列编码SEQID NO:6、SEQ ID NO:9、SEQ ID NO:12、SEQ ID NO:15、SEQ ID NO:18、SEQ ID NO:21、SEQ ID NO:24、SEQ ID NO:27、SEQ ID NO:30、SEQ IDNO:33、SEQ ID NO:36、SEQ ID NO:39、SEQ ID NO:42、SEQ ID NO:45、SEQ ID NO:48、SEQ ID NO:51、SEQ ID NO:54或SEQ ID NO:57的多肽序列。
3.权利要求1的分离的LMP核酸,其中所述多核苷酸序列在SEQID NO:4、SEQ ID NO:5、SEQ ID NO:7、SEQ ID NO:8、SEQ ID NO:10、SEQ ID NO:11、SEQ ID NO:13、SEQ ID NO:14、SEQ ID NO:16、SEQ IDNO:17、SEQ ID NO:19、SEQ ID NO:20、SEQ ID NO:22、SEQ ID NO:23、SEQ ID NO:25、SEQ ID NO:26、SEQ ID NO:28、SEQ ID NO:29、SEQ IDNO:31、SEQ ID NO:32、SEQ ID NO:34、SEQ ID NO:35、SEQ ID NO:37、SEQ ID NO:38、SEQ ID NO:40、SEQ ID NO:41、SEQ ID NO:43、SEQ IDNO:44、SEQ ID NO:46、SEQ ID NO:47、SEQ ID NO:49、SEQ ID NO:50、SEQ ID NO:52、SEQ ID NO:53、SEQ ID NO:55、或SEQ ID NO:56中定义。
4.权利要求1的分离的LMP核酸,其中所述多核苷酸序列与权利要求1的a)或b)的全长LMP核酸具有至少90%的序列同一性,且其中所述分离的LMP核酸编码在植物中发挥种子贮藏化合物的调节剂功能的多肽。
5.权利要求1的分离的LMP核酸,其中所述多核苷酸序列与权利要求1的a)或b)的全长LMP核酸互补,且其中所述分离的LMP核酸编码在植物中发挥种子贮藏化合物的调节剂功能的多肽。
6.权利要求1的分离的LMP核酸,其中所述多核苷酸序列在严格条件下与权利要求1的a)或b)的LMP核酸杂交,且其中该分离的LMP核酸编码在植物中发挥种子贮藏化合物的调节剂功能的多肽。
7.权利要求1的分离的LMP核酸,其中该核酸位于表达载体中。
8.权利要求7的表达载体,其中所述LMP核酸与选自种子特异性启动子、根特异性启动子和非组织特异性启动子的异源启动子有效连接。
9.权利要求7的表达载体,其中LMP核酸与ptxA启动子有效连接。
10.产生具有修饰水平的种子贮藏化合物的转基因植物的方法,所述方法包括用包含脂类代谢蛋白(LMP)核酸的表达载体转化植物细胞并从植物细胞产生转基因植物,其中所述核酸编码在植物中发挥种子贮藏化合物的调节剂功能的多肽,且其中所述核酸包含选自以下的多核苷酸序列:
a)SEQ ID NO:1、SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:5、SEQ ID NO:7、SEQ ID NO:8、SEQ ID NO:10、SEQ ID NO:11、SEQ IDNO:13、SEQ ID NO:14、SEQ ID NO:16、SEQ ID NO:17、SEQ ID NO:19、SEQ ID NO:20、SEQ ID NO:22、SEQ ID NO:23、SEQ ID NO:25、SEQ IDNO:26、SEQ ID NO:28、SEQ ID NO:29、SEQ ID NO:31、SEQ ID NO:32、SEQ ID NO:34、SEQ ID NO:35、SEQ ID NO:37、SEQ ID NO:38、SEQ IDNO:40、SEQ ID NO:41、SEQ ID NO:43、SEQ ID NO:44、SEQ ID NO:46、SEQ ID NO:47、SEQ ID NO:49、SEQ ID NO:50、SEQ ID NO:52、SEQ IDNO:53、SEQ ID NO:55或SEQ ID NO:56中定义的多核苷酸序列;
b)编码SEQ ID NO:3、SEQ ID NO:6、SEQ ID NO:9、SEQ IDNO:12、SEQ ID NO:15、SEQ ID NO:18、SEQ ID NO:21、SEQ ID NO:24、SEQ ID NO:27、SEQ ID NO:30、SEQ ID NO:33、SEQ ID NO:36、SEQ IDNO:39、SEQ ID NO:42、SEQ ID NO:45、SEQ ID NO:48、SEQ ID NO:51、SEQ ID NO:54或SEQ ID NO:57中定义的多肽的多核苷酸序列;
c)与上面的a)或b)的全长LMP核酸具有至少70%序列同一性的多核苷酸序列;
d)与上面的a)或b)的全长LMP核酸互补的多核苷酸序列;和
e)在严格条件下与上面的a)或b)的全长LMP核酸杂交的多核苷酸序列。
11.权利要求10的方法,其中所述LMP核酸包含SEQ ID NO:1、SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:5、SEQ ID NO:7、SEQ IDNO:8、SEQ ID NO:10、SEQ ID NO:11、SEQ ID NO:13、SEQ ID NO:14、SEQ ID NO:16、SEQ ID NO:17、SEQ ID NO:19、SEQ ID NO:20、SEQ IDNO:22、SEQ ID NO:23、SEQ ID NO:25、SEQ ID NO:26、SEQ ID NO:28、SEQ ID NO:29、SEQ ID NO:31、SEQ ID NO:32、SEQ ID NO:34、SEQ IDNO:35、SEQ ID NO:37、SEQ ID NO:38、SEQ ID NO:40、SEQ ID NO:41、SEQ ID NO:43、SEQ ID NO:44、SEQ ID NO:46、SEQ ID NO:47、SEQ IDNO:49、SEQ ID NO:50、SEQ ID NO:52、SEQ ID NO:53、SEQ ID NO:55,或SEQ ID NO:56的多核苷酸序列。
12.权利要求10的方法,其中所述LMP核酸包含编码SEQ ID NO:3、SEQ ID NO:6、SEQ ID NO:9、SEQ ID NO:12、SEQ ID NO:15、SEQ IDNO:18、SEQ ID NO:21、SEQ ID NO:24、SEQ ID NO:27、SEQ ID NO:30、SEQ ID NO:33、SEQ ID NO:36、SEQ ID NO:39、SEQ ID NO:42、SEQ IDNO:45、SEQ ID NO:48、SEQ ID NO:51、SEQ ID NO:54、或SEQ ID NO:57的多肽的多核苷酸序列。
13.权利要求10的方法,其中所述LMP核酸包含与权利要求9的a)或b)的多核苷酸序列具有至少90%的序列同一性的多核苷酸序列。
14.权利要求10的方法,其中LMP核酸在严格条件下与权利要求10的a)或b)的LMP核酸杂交。
15.权利要求10的方法,其中所述LMP核酸包含与权利要求10的a)或b)的LMP核酸互补的多核苷酸序列。
16.权利要求10的方法,其中种子中的总油含量水平受到修饰。
17.权利要求10的方法,其中种子中的油酸水平受到修饰。
18.权利要求10的方法,其中与未转化的野生型植物品种相比,转基因植物中的种子贮藏化合物的水平提高。
19.权利要求10的方法,其中所述LMP核酸与选自种子特异性启动子、根特异性启动子和非组织特异性启动子的异源启动子有效连接。
20.权利要求10的方法,其中所述LMP核酸与ptxA启动子有效连接。
21.调节植物中种子贮藏化合物水平的方法,所述方法包括修饰植物中脂类代谢蛋白(LMP)核酸的表达,其中LMP核酸包含选自以下的多核苷酸序列:
a)SEQ ID NO:1、SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:5、SEQ ID NO:7、SEQ ID NO:8、SEQ ID NO:10、SEQ ID NO:11、SEQ IDNO:13、SEQ ID NO:14、SEQ ID NO:16、SEQ ID NO:17、SEQ ID NO:19、SEQ ID NO:20、SEQ ID NO:22、SEQ ID NO:23、SEQ ID NO:25、SEQ IDNO:26、SEQ ID NO:28、SEQ ID NO:29、SEQ ID NO:31、SEQ ID NO:32、SEQ ID NO:34、SEQ ID NO:35、SEQ ID NO:37、SEQ ID NO:38、SEQ IDNO:40、SEQ ID NO:41、SEQ ID NO:43、SEQ ID NO:44、SEQ ID NO:46、SEQ ID NO:47、SEQ ID NO:49、SEQ ID NO:50、SEQ ID NO:52、SEQ IDNO:53、SEQ ID NO:55或SEQ ID NO:56中定义的多核苷酸序列;
b)编码SEQ ID NO:3、SEQ ID NO:6、SEQ ID NO:9、SEQ IDNO:12、SEQ ID NO:15、SEQ ID NO:18、SEQ ID NO:21、SEQ ID NO:24、SEQ ID NO:27、SEQ ID NO:30、SEQ ID NO:33、SEQ ID NO:36、SEQ IDNO:39、SEQ ID NO:42、SEQ ID NO:45、SEQ ID NO:48、SEQ ID NO:51、SEQ ID NO:54或SEQ ID NO:57中定义的多肽的多核苷酸序列;
c)与上面的a)或b)的全长LMP核酸具有至少70%序列同一性的多核苷酸序列;
d)与上面的a)或b)的全长LMP核酸互补的多核苷酸序列;和
e)在严格条件下与上面的a)或b)的全长LMP核酸杂交的多核苷酸序列。
22.权利要求21的方法,其中种子中的总油含量水平受到修饰。
23.权利要求21的方法,其中种子中的油酸水平受到修饰。
24.调节植物中一种或多种植物器官的数目和/或大小的方法,所述方法包括修饰植物中脂类代谢蛋白(LMP)核酸的表达,其中所述LMP核酸包含选自以下的多核苷酸序列:
a)SEQ ID NO:1、SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:5、SEQ ID NO:7、SEQ ID NO:8、SEQ ID NO:10、SEQ ID NO:11、SEQ IDNO:13、SEQ ID NO:14、SEQ ID NO:16、SEQ ID NO:17、SEQ ID NO:19、SEQ ID NO:20、SEQ ID NO:22、SEQ ID NO:23、SEQ ID NO:25、SEQ IDNO:26、SEQ ID NO:28、SEQ ID NO:29、SEQ ID NO:31、SEQ ID NO:32、SEQ ID NO:34、SEQ ID NO:35、SEQ ID NO:37、SEQ ID NO:38、SEQ IDNO:40、SEQ ID NO:41、SEQ ID NO:43、SEQ ID NO:44、SEQ ID NO:46、SEQ ID NO:47、SEQ ID NO:49、SEQ ID NO:50、SEQ ID NO:52、SEQ IDNO:53、SEQ ID NO:55或SEQ ID NO:56中定义的多核苷酸序列;
b)编码SEQ ID NO:3、SEQ ID NO:6、SEQ ID NO:9、SEQ IDNO:12、SEQ ID NO:15、SEQ ID NO:18、SEQ ID NO:21、SEQ ID NO:24、SEQ ID NO:27、SEQ ID NO:30、SEQ ID NO:33、SEQ ID NO:36、SEQ IDNO:39、SEQ ID NO:42、SEQ ID NO:45、SEQ ID NO:48、SEQ ID NO:51、SEQ ID NO:54或SEQ ID NO:57中定义的多肽的多核苷酸序列;
c)与上面的a)或b)的全长LMP核酸具有至少70%序列同一性的多核苷酸序列;
d)与上面的a)或b)的全长LMP核酸互补的多核苷酸序列;和
e)在严格条件下与上面的a)或b)的全长LMP核酸杂交的多核苷酸序列。
25.权利要求24的方法,其中调节种子大小、种子数目和/或种子重量。
26.权利要求24的方法,其中植物根长度增加。
27.权利要求24的方法,其中叶子的数目/大小增加。
28.通过一种方法产生的转基因植物,所述方法包括用包含脂类代谢蛋白(LMP)核酸的表达载体转化植物细胞,并从植物细胞产生转基因植物,其中所述核酸编码在植物中发挥种子贮藏化合物的调节剂功能的多肽,且其中所述核酸包含选自以下的多核苷酸序列:
a)SEQ ID NO:1、SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:5、SEQ ID NO:7、SEQ ID NO:8、SEQ ID NO:10、SEQ ID NO:11、SEQ IDNO:13、SEQ ID NO:14、SEQ ID NO:16、SEQ ID NO:17、SEQ ID NO:19、SEQ ID NO:20、SEQ ID NO:22、SEQ ID NO:23、SEQ ID NO:25、SEQ IDNO:26、SEQ ID NO:28、SEQ ID NO:29、SEQ ID NO:31、SEQ ID NO:32、SEQ ID NO:34、SEQ ID NO:35、SEQ ID NO:37、SEQ ID NO:38、SEQ IDNO:40、SEQ ID NO:41、SEQ ID NO:43、SEQ ID NO:44、SEQ ID NO:46、SEQ ID NO:47、SEQ ID NO:49、SEQ ID NO:50、SEQ ID NO:52、SEQ IDNO:53、SEQ ID NO:55或SEQ ID NO:56中定义的多核苷酸序列;
b)编码SEQ ID NO:3、SEQ ID NO:6、SEQ ID NO:9、SEQ IDNO:12、SEQ ID NO:15、SEQ ID NO:18、SEQ ID NO:21、SEQ ID NO:24、SEQ ID NO:27、SEQ ID NO:30、SEQ ID NO:33、SEQ ID NO:36、SEQ IDNO:39、SEQ ID NO:42、SEQ ID NO:45、SEQ ID NO:48、SEQ ID NO:51、SEQ ID NO:54或SEQ ID NO:57中定义的多肽的多核苷酸序列;
c)与上面的a)或b)的全长LMP核酸具有至少70%序列同一性的多核苷酸序列;
d)与上面的a)或b)的全长LMP核酸互补的多核苷酸序列;和
e)在严格条件下与上面的a)或b)的全长LMP核酸杂交的多核苷酸序列。
29.权利要求28的转基因植物,其中种子中的总油含量水平受到修饰。
30.权利要求28的转基因植物,其中种子中的油酸水平受到修饰。
31.权利要求28的转基因植物,其中所述植物为双子叶植物。
32.权利要求28的转基因植物,其中所述植物为单子叶植物。
33.权利要求28的转基因植物,其中所述植物为高产油植物。
34.权利要求28的转基因植物,其中与未转化的野生型植物品种相比,转基因植物中种子贮藏化合物的水平提高。
CNA200580026790XA 2004-06-16 2005-06-16 编码wrinkled1样多肽的核酸分子及在植物中的使用方法 Pending CN101431888A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US58033404P 2004-06-16 2004-06-16
US60/580,334 2004-06-16
US60/600,466 2004-08-11

Publications (1)

Publication Number Publication Date
CN101431888A true CN101431888A (zh) 2009-05-13

Family

ID=40646967

Family Applications (1)

Application Number Title Priority Date Filing Date
CNA200580026790XA Pending CN101431888A (zh) 2004-06-16 2005-06-16 编码wrinkled1样多肽的核酸分子及在植物中的使用方法

Country Status (2)

Country Link
CN (1) CN101431888A (zh)
UA (1) UA89960C2 (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102786587A (zh) * 2012-06-18 2012-11-21 中国农业大学 一种提高植物种子脂肪酸含量的转录因子及其应用
CN108070603A (zh) * 2017-12-28 2018-05-25 河南健特生物科技集团有限公司 一种提高油用牡丹籽含油率的转基因方法
CN110951769A (zh) * 2011-12-27 2020-04-03 联邦科学技术研究组织 产生脂质的方法
CN111574603A (zh) * 2020-05-14 2020-08-25 安徽农业大学 一种与脂肪酸合成有关的转录因子及其dna分子、提高油料作物油脂含量的方法、及应用
CN116254290A (zh) * 2022-08-03 2023-06-13 西南大学 PtoPLT5a基因在提高毛白杨生物量和纤维细胞长度中的应用

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110951769A (zh) * 2011-12-27 2020-04-03 联邦科学技术研究组织 产生脂质的方法
CN102786587A (zh) * 2012-06-18 2012-11-21 中国农业大学 一种提高植物种子脂肪酸含量的转录因子及其应用
CN102786587B (zh) * 2012-06-18 2014-01-01 中国农业大学 一种提高植物种子脂肪酸含量的转录因子及其应用
CN108070603A (zh) * 2017-12-28 2018-05-25 河南健特生物科技集团有限公司 一种提高油用牡丹籽含油率的转基因方法
CN111574603A (zh) * 2020-05-14 2020-08-25 安徽农业大学 一种与脂肪酸合成有关的转录因子及其dna分子、提高油料作物油脂含量的方法、及应用
CN116254290A (zh) * 2022-08-03 2023-06-13 西南大学 PtoPLT5a基因在提高毛白杨生物量和纤维细胞长度中的应用
CN116254290B (zh) * 2022-08-03 2024-05-07 西南大学 PtoPLT5a基因在提高毛白杨生物量和纤维细胞长度中的应用

Also Published As

Publication number Publication date
UA89960C2 (ru) 2010-03-25

Similar Documents

Publication Publication Date Title
US8217223B2 (en) Nucleic acid molecules encoding WRINKLED1-like polypeptides and methods of use in plants
US8916748B2 (en) Nucleic acid molecules encoding polypeptides involved in regulation of sugar and lipid metabolism and methods of use VIII
US8362319B2 (en) Arabidopsis genes encoding proteins involved in sugar and lipid metabolism and methods of use
US20090276921A1 (en) Nucleic Acid Molecules Encoding Fatty Acid Desaturase Genes from Plants and Methods of Use
CN101431888A (zh) 编码wrinkled1样多肽的核酸分子及在植物中的使用方法
US20100088783A1 (en) Nucleic acid molecules encoding sucrose synthase-like polypeptides and methods of use
WO2007048780A2 (en) Nucleic acid molecules encoding phosphatidate cytidylyl-transferase-like polypeptides and methods of use
US20070261132A1 (en) Nucleic Acids Conferring Lipid and Sugar Alterations in Plants ll
US20080127369A1 (en) Arabidopsis And Brassica Nucleic Acid Sequences Conferring Lipid And Sugar Alterations In Plants And Methods Of Use
US8513490B2 (en) Nucleic acid molecules encoding constitutive triple Response1-like polypeptides and methods of use thereof
US20110041215A1 (en) Lipid Metabolism Protein And Uses Thereof I (BZIP Transcription Factor)
US20090235389A1 (en) Nucleic acid molecules encoding echi-like polypeptides and methods of use
US20080120748A1 (en) Nucleic Acid Molecules Encoding Kcs-Like Polypeptides And Methods Of Use
US20100287665A1 (en) Lipid Metabolism Protein and Uses Thereof III (Pyruvate-Orthophosphate-Dikinase)

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C12 Rejection of a patent application after its publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20090513