CN101605902A - 具有增强的产量相关性状和/或提高的非生物胁迫抗性的植物和制备该植物的方法 - Google Patents
具有增强的产量相关性状和/或提高的非生物胁迫抗性的植物和制备该植物的方法 Download PDFInfo
- Publication number
- CN101605902A CN101605902A CNA2008800037051A CN200880003705A CN101605902A CN 101605902 A CN101605902 A CN 101605902A CN A2008800037051 A CNA2008800037051 A CN A2008800037051A CN 200880003705 A CN200880003705 A CN 200880003705A CN 101605902 A CN101605902 A CN 101605902A
- Authority
- CN
- China
- Prior art keywords
- seq
- plant
- nucleic acid
- sequence
- polypeptide
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
- C12N15/82—Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
- C12N15/8241—Phenotypically and genetically modified plants via recombinant DNA technology
- C12N15/8261—Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/415—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from plants
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02A—TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
- Y02A40/00—Adaptation technologies in agriculture, forestry, livestock or agroalimentary production
- Y02A40/10—Adaptation technologies in agriculture, forestry, livestock or agroalimentary production in agriculture
- Y02A40/146—Genetically Modified [GMO] plants, e.g. transgenic plants
Landscapes
- Health & Medical Sciences (AREA)
- Genetics & Genomics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Chemical & Material Sciences (AREA)
- Organic Chemistry (AREA)
- Engineering & Computer Science (AREA)
- Molecular Biology (AREA)
- Biophysics (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Zoology (AREA)
- Biochemistry (AREA)
- Wood Science & Technology (AREA)
- General Health & Medical Sciences (AREA)
- General Engineering & Computer Science (AREA)
- Biotechnology (AREA)
- Biomedical Technology (AREA)
- Botany (AREA)
- Physics & Mathematics (AREA)
- Cell Biology (AREA)
- Plant Pathology (AREA)
- Gastroenterology & Hepatology (AREA)
- Microbiology (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Medicinal Chemistry (AREA)
- Breeding Of Plants And Reproduction By Means Of Culturing (AREA)
- Peptides Or Proteins (AREA)
Abstract
本发明总体上涉及分子生物学领域并且涉及用于增强植物中多种经济重要的产量相关性状的方法。更具体地,本发明涉及用于在植物中通过调节植物中编码产量增加蛋白(YEP)的核酸表达而增强产量相关性状的方法。所述YEP选自核小体装配蛋白1样多肽(NAP1样)、Sm样多肽(Lsm蛋白)、截短的细胞周期蛋白H(CycHTr)多肽、Remorin多肽和DREB蛋白。本发明也涉及具有编码此种YEP的核酸受调节地表达的植物,其中所述植物相对于对照植物具有增强的产量相关性状。本发明也提供了在实施本发明方法中有用的迄今未知的YEP编码核酸和包含所述核酸的构建体。
Description
本发明总体上涉及分子生物学领域并且涉及用于增强植物中多种经济重要的产量相关性状和/或提高非生物胁迫抗性的方法。更具体地,本发明涉及用于通过调节植物中编码产量增加蛋白(Yield Enhancing Protein;YEP)的核酸表达而增强植物中产量相关性状的方法。所述YEP选自核小体装配蛋白1样多肽(NAP1样)、Sm样多肽(Lsm蛋白)、截短的细胞周期蛋白H(CycHTr)多肽、Remorin多肽和DREB蛋白。本发明还涉及具有编码这种YEP的核酸的受调节表达的植物,其中所述植物相对于对照植物具有增强的产量相关性状。本发明也提供了在实施本发明方法中有用的迄今未知的编码YEP的核酸和包含该核酸的构建体。
世界人口持续增长和农业用可耕地供应萎缩刺激了有关提高农业效率的研究。作物和园艺学改良的常规手段利用选择性育种技术来鉴定具有受欢迎特征的植物。然而,此类选择育种技术具有几个缺陷,即这些技术一般耗费巨大的劳动并且导致经常含有异源性遗传成分的植物,其中所述的异源性遗传成分可能不总是导致从亲代植物传递下去的受欢迎性状。分子生物学的进展已经允许人类改良动物和植物的种质。植物的遗传工程引起遗传物质(一般处于DNA或RNA形式)的分离和操作并且随后导入该遗传物质至植物中。此类技术具有能力产生具备多种改良的经济学、农学或园艺学性状的作物或植物。
一个具有特殊经济意义的性状是提高的产量。产量通常定义为可测量的来自作物的经济价值产生。这可以就数量和/或品质方面进行定义。产量直接取决于几个因素,例如器官数目和大小、植物构造(例如枝条的数目)、种子产生、叶衰老和更多因素。根发育、营养摄取、胁迫耐受性和早期生长势也可能是决定产量的重要因素。优化上述因素因而可以有助于作物产量提高。
种子产量是一个特别重要的性状,因为多种植物的种子对于人和动物营养是重要的。作物如谷物(corn)、稻、小麦、卡诺拉油菜(canola)和大豆占超过一半的人类总热量摄入,无论通过直接消费种子自身或通过消费基于加工的种子所产生的肉产品。作物也是糖、油和工业过程中所用多种类型代谢物的来源。种子含有胚(新苗和新根的起源)和胚乳(萌发期间和籽苗早期生长期间用于胚生长的营养来源)。种子发育涉及多种基因并且需要将代谢物从根、叶和茎转移至正在生长的种子中。胚乳尤其同化糖类、油和蛋白质的代谢前体并且将它们合成贮藏大分子以灌满籽粒。
植物生物量是饲料作物如苜蓿(alfalfa)、青贮谷物和干草的产量。产量的多种代用物已经在谷类作物中使用。这些代用物中主要是植物大小的估计。植物大小可以根据物种和发育阶段以多种方式测量,不过包括植物总干重、地上部分干重、地上部分鲜重、叶面积、茎体积、植物高度、莲座丛直径、叶长度、根长度、根质量、分蘖数目和叶数目。众多物种在给定发育阶段处维持植物不同部分的尺寸之间的保守性比率。这些异速生长关系用来从这些大小测量值之一外推出另一种大小测量值(例如Tittonell等2005 Agric Ecosys & Environ 105:213)。在早期发育阶段的植物大小一般与发育后期的植物大小相关。具有较大叶面积的较大植物一般可以比较小植物吸收更多光线和二氧化碳,并且因而将可能在相同期间获得更大重量(Fasoula和Tollenaar 2005 Maydica 50:39)。这还是该植物拥有的微观环境优势或遗传优势的潜在延续以初始地实现更大的大小。存在对应于植物大小和生长速率的强遗传成分(例如ter Steege等2005 Plant Physiology139:1078),并且因而对于一系列不同基因型,在一种环境条件下的植物大小有可能与另一种环境条件下的大小关联(Hittalmani等2003 TheoreticalApplied Genetics 107:679)。以这种方式,使用标准环境作为田间作物在不同位置和时间所遭遇的多样和动态环境的代表。
收获指数,即种子产量与地上部分干重比,在多种环境条件下是相对稳定的,并且因此经常可以获得植物大小与谷类产量之间的强烈关联(例如Rebetzke等2002 Crop Science 42:739)。这些过程是内在联系的,因为大部分谷类生物量依赖于植物叶和茎的当前或贮备光合生产力(Gardener等1985 Physiology of Crop plants.Iowa State University Press,第68-73页)。因此,已经选择植物大小甚至选择发育早期的植物大小用作将来潜在产量的指示物(例如Tittonell等2005 Agric Ecosys & Environ 105:213)。当检验遗传差异对胁迫耐受性的影响时,与田间相比,土壤特性、温度、水和营养的可获得性和光强度能够标准化是温室或植物生长箱环境的固有优势。然而,因不良授粉而对产量的人为限制可能限制这些受控环境用于检验产量差异的用途,其中所述的不良授粉因缺乏风或昆虫或成熟根或冠部生长的空间不足引起。因此,测量在生长箱或温室中标准条件下早期发育的植物大小是提供潜在遗传性产量优势指示的标准实践操作。
众多作物的另一个重要性状是早期生长势。改进早期生长势是现代稻育种计划在温带和热带稻品种上的重要目标。长根在水栽稻中对于正确土壤固定是重要的。在稻直接播种至淹水田地,以及植物必须穿过水迅速出苗的情况下,较长的苗与生长势相关。在实施条播的情况下,较长的中胚轴和胚芽鞘对于优异的籽苗出苗是重要的。在农业中将早期生长势设计至植物内是极其重要的。例如,早期生长势不良已经限制在欧洲大西洋地区引种基于玉米带种质(Corn Belt germplasm)的玉米(Zea mayes L.)杂交种。
又一个重要性状是改善的非生物胁迫耐受性。非生物胁迫是世界范围作物损失的主要原因,平均产量对于大多数主要作物植物而言降低超过50%(Wang等,Planta(2003)218:1-14)。非生物胁迫可以由干旱、盐度、极端温度、化学毒性和氧化胁迫引起。改善植物对非生物胁迫耐受的能力将在世界范围对农民提供大的经济优势,并且将允许在不利条件期间和在本来也许不可能栽培作物的土地上栽培作物。
作物产量因而可以通过优化上述因素之一提高。
取决于最终用途,对某些产量性状的改良可能优先于其他产量性状。例如对于应用如饲料或木材生产或生物燃料资源而言,增加植物营养体部分可能是受欢迎的,而对于应用如面粉、淀粉或油生产而言,种子参数的提高尤其可能是受欢迎的。即便在种子参数当中,取决于应用,某些参数可以更优先于其他参数。多种机制可以有助于提高种子产量,无论其形式为提高的种子大小或提高的种子数目。
提高植物中产量(种子产量和/或生物量)的一种方法可以是通过调节植物的内在生长机制如细胞周期或多种参与植物生长或参与防御机制的信号途径。
出人意料地,现在已发现:调节植物中编码产量增加多肽(YieldEnhancing Polypeptide;YEP)的核酸表达产生了相对于对照植物而言,具有增强的产量相关性状和/或提高的非生物胁迫抗性的植物,其中所述的产量增加多肽(YEP)选自核小体装配蛋白1样多肽(NAP1样)、Sm样多肽(Lsm蛋白)、截短的细胞周期蛋白H(CycHTr)多肽、Remorin多肽和DREB蛋白。
发明背景
I.核小体装配蛋白1样多肽(NAP1样)
NAP蛋白构成了在动物中已知并且据报道参与染色质相关活性的相关蛋白质家族。NAP蛋白质家族以存在称作NAP结构域的保守序列为特征。NAP结构域在Pfam(登录号PF00956)和Interpro数据库(登录号IPR002164)中描述。NAP是介导DNA包装至核小体内的多因子复合体的一种组分(Krude,T.和Keller,C.(2001)Cell.Mol.Life Sci.58,665-672)。在真核细胞分裂周期的S期期间,新复制的DNA迅速装配入染色质。这个过程需要几种因子的协调作用。在初始阶段,CAF1(染色质装配因子1)结合组蛋白H3和H4并且通过PCNA结合作用将它们导向复制叉。由NAP1蛋白介导组蛋白H2A和H2B的随后沉积。NAP1首先在HeLA细胞中描述(von Lindern等(1992)Mol.Cell.Biol.12,3346-3355)并且后来发现在全部真核生物中是保守的。此外,认为NAP蛋白调节基因转录并可以影响细胞分化和发育。
SET蛋白与NAP蛋白高度相关并且在人类的多个细胞过程中发挥作用。在人细胞中,已经显示SET在细胞周期调节(如G2/M转换)期间与多种CDK-细胞周期蛋白复合体结合。SET是参与几条信号途径的蛋白磷酸酶2A(PP2A)的强力抑制物。SET的抑制活性可归因于酸性羧基端结构域(Canela等(2003)J.Biol.Chem.278,1158-1164)。其他报告显示SET参与DNA修复和转录。SET是具有染色质相关蛋白HMG2介导的DNA结合和弯曲活性的复合体的部分。HMG2通过使DNA弯曲和成环或通过使低缠绕的DNA稳定而促进核蛋白高级结构的装配。HMG2与SET共沉淀(Fan等(2002)Mol.Cell.Biol.22,2810-2820)。还报道SET抑制活性DNA去甲基化(Cervoni等(2002)J.Biol.Chem.277,25026-25031)。参与抑制组蛋白乙酰化的癌蛋白Set/TAF-I也抑制可导致基因沉默的异位方式甲基化的DNA去甲基化。有人提出Set/TAF-I在基因调节中,在集成组蛋白和DNA的外遗传状态方面发挥作用。
NAP1蛋白的活性部分地通过磷酸化作用调节。已经证实NAP1在果蝇(Drosophila)中的亚细胞定位取决于其磷酸化状态,而所述磷酸化状态可受酪蛋白激酶II控制(Rodriguez等(2000)J.Mol.Biol.298,225-238)。据报道哺乳动物拥有几种NAP1蛋白,而在酵母中仅有一种已知的NAP1蛋白。
植物NAP1直向同源物(orthologues)很大程度上仍是未知的,尽管报道了来自大豆(Yoon等(1995)Mol.Gen.Genet.249,465-473)、拟南芥属(Arabidopsis)、烟草、玉米、和稻(Dong等(2003)Planta 216,561-570)的NAP1蛋白。植物NAP1样基因的系统发生分析已经揭示存在两个亚组,一个亚组与NAP1相关而另一个亚组与SET蛋白相关(图1)。最可能地,后来可能已经发生了序列趋异性,因为两个拟南芥属序列、两个玉米序列和两个烟草序列簇集在一起,指向一个更为新近的基因重复作用。酿酒酵母(Saccharomyces cerevisiae)基因组仅含有一个NAP编码基因,其组合了NAP1和SET这两个亚组的功能特性。类似地,NAP1的一个同源物-模板激活因子1(TAF-I)组合了PP2a抑制活性(Saito等,Biochem.Biophys.Res.Comm.259,471-475,1999)和染色质再塑造活性(Kawase等,GenesCells 1,1045-1056,1996)。因此可能的是NAP/SET家族的植物蛋白很大程度在功能上是冗余的,尤其在SET蛋白的组中,其中与NAP组相比,观察到较低程度的趋异性。此外,存在NAP和SET蛋白属于相同家族的结构证据,因为这两种蛋白质共有后接有羧基端酸性区域的NAP结构域。
对NAP1样蛋白在植物中的功能知之甚少,虽然已经提出其在有丝分裂和胞质分裂中的作用(Dong等2003)。NAP1蛋白的植物直向同源物最有可能发挥异于其动物对应物的不同作用。基于其核定位并基于与哺乳动物SET蛋白的序列相似性,可以预期该植物蛋白在染色质再塑造方面的作用。此外,植物NAP/SET蛋白组可能参与调节植物中的PP2A。PP2A是植物中的主要磷酸酶之一,很大程度地作用于转录因子和蛋白激酶,并且据称调节参与多种细胞过程的蛋白质的活性,所述的细胞过程包括细胞周期(Ayaydin等(2000)Plant J.23,85-96),激素作用如ABA介导的气孔运动,萌发(Kwak等(2002)Plant Cell 14,2849-2861)或者植物生长素运输和根发育(Garbers等1996 EMBO J.15,2115-2124)。还报道PP2A参与光合作用和光信号传导作用(Sheen(1993)EMBO J.12,3497-3505)和参与氮同化(Hirose和Yamaya(1999)Plant Physiology 121,805-812)。WO 2005/094562公开了NAP1样蛋白用于提高产量的用途,但是仍没有提到在受非生物胁迫的植物中NAP1样蛋白被调节的表达的作用。
II.Lsm(Sm样)蛋白
核糖核酸(RNA),一种由核糖核苷酸单体组成的核酸聚合物,是活生物中的关键成分。它在必需的细胞功能中发挥重要作用。RNA充当将基因翻译成蛋白质的模版、转运氨基酸至核糖体以合成蛋白质。一些RNA分子如核酶也具有催化活性并且RNA分子作为基因表达的主要调节物的作用最近已经确立。
细胞中信使RNA(mRNA)的合成和功能需要一系列事件,包括转录、加工、运输、翻译和降解。RNA加工指转录后修饰RNA的事件。在真核生物中,绝大部分新生的前mRNA含有内含子,所述的内含子被剪接除去,导致外显子的精确连接以产生成熟的mRNA,即由核糖体使用以翻译成蛋白质的RNA形式。RNA的转录后修饰也包括在5’端加帽和在3’端聚腺苷酸化,其影响稳定性和翻译效率。mRNA翻译与周转之间的关系对于基因表达的调节和细胞发挥正常功能是重要的。在高等真核生物中,几百种蛋白质参与RNA代谢。此类蛋白质的实例是Lsm蛋白(Sm样蛋白)。
Lsm(Like Sm;Sm样)蛋白质如此得名的原因是与之前描述的Sm蛋白的结构相似性。Lsm蛋白是与核心剪接体snRNA(小的核RNA)和snRNP(小的核核糖核蛋白)结合的小蛋白。Lsm蛋白含有长度各异、一般长50-70个氨基酸的Lsm结构域,其包括由可变区隔开的两个短的保守氨基酸段。与Sm蛋白相比,已经提出Lsm蛋白形成异七聚体或异六聚体复合体,其中七个或六个Lsm蛋白排列在具有一个中心小孔的环中(Kambach C等Cell 1999;96:375-387;Khusial P等Trends Biochem Sci.2005年9月;30(9):522-8;Zaric B等J Biol Chem.2005年4月22日;280(16):16066-75)。
Sm样蛋白家族已经在进化期间扩展,产生了具有不同底物特异性的蛋白质复合体。所述多种蛋白质复合体的共有特性是它们与RNA相互作用,保护这些RNA免遭不适宜的核酸酶活性作用和/或修饰它们的结构,在多种情况下影响这些RNA与其他RNA或与蛋白质的相互作用。发现编码Lsm蛋白的基因不仅存在于真核生物中,还存在于细菌以及甚至在没有任何剪接装置的古细菌中存在。
在酵母中,已经描述了Lsm蛋白在胞核和胞浆中形成影响前mRNA剪接和降解、小的核RNA、tRNA和rRNA加工和mRNA降解的复合体。这些活性暗示了影响RNA-RNA和/或RNA-蛋白质相互作用的Lsm蛋白的RNA伴侣样作用。核Lsm蛋白在维持前-rRNA加工事件的秩序方面发挥额外作用,它们与核糖体装配有关并且可能促进核糖体装配。Lsm6p、Lsm7p和Lsm1p蛋白质中的突变仅对核RNA的稳定性影响甚微,表明其他有活性的Lsm或Sm蛋白可替代这些非必需的Lsm蛋白。(Beggs JD.等Biochem Soc Trans.2005年6月;33(Pt 3):433-8)。因此,尽管Lsm蛋白结合以形成具有不同底物特异性的不同蛋白质复合体,然而Lsm蛋白之间存在功能性冗余,从而允许具有不同Lsm组分的备选蛋白质复合体履行相同的功能。已经使用异源系统证实Lsm蛋白在物种之间的功能保守性。例如,酵母Lsm1p促进植物RNA病毒在酵母中的复制(Noueiry AO等Mol Cell Biol.2003年6月;23(12):4094-106)。
提出了Lsm1与涉及mRNA脱帽的蛋白质的相互作用和Lsm蛋白在胞浆mRNA降解中的额外作用(Tharun S等Genetics.2005年5月;170(1):33-46)。还描述了在保护snoRNA(小的核仁RNAs)以及snRNA抵抗3’末端剪裁和ARE-mRNA(含有AU丰富元件的信使RNA)降解中的其它不同作用(Beggs JD.Lsm蛋白和RNA加工(Lsm proteins and RNAprocessing).Biochem Soc Trans.2005年6月;33(Pt 3):433-8;StoecklinG,Mayo T,Anderson P.ARE-mRNA降解需要5′-3′降解途径(ARE-mRNAdegradation requires the 5′-3′decay pathway).EMBO Rep.2006年1月;7(1):72-7)。Stoecklin G,Mayo T,Anderson P.ARE-mRNA降解需要5′-3′降解途径(ARE-mRNA degradation requires the 5′-3′decay pathway).EMBO Rep.2006年1月;7(1):72-7)。
在酵母中,LSM蛋白分成8类,Lsm1至Lsm8(Wang和BrendelGenome Biology 2004,5:R102)。全部酵母Lsm蛋白具有在植物中的同源物。在拟南芥(Arabidopsis thaliana)中,存在11种鉴定的Lsm蛋白,它们属于酵母中存在的相同8个类。4种Lsm蛋白在拟南芥中有两份。这些基因有可能作为单个拷贝存在于动物和植物的祖先中,但是在植物品系中有两个拷贝。
在植物中,已经实验地表征了11个Lsm基因中的一个基因(LSM5,At5g48870)。已经分离了Lsm5p缺陷的拟南芥突变体并证实了在调节脱落酸信号转导中发挥作用。因此,该突变植物显示SAD(对ABA和干旱处理超敏感)表型(Xiong L等Dev Cell.2001年12月;1(6):771-81)。
III.截短的细胞周期蛋白H
细胞周期蛋白是在细胞周期进程中发挥作用的蛋白质。它们在细胞周期期间合成和降解,并且它们大部分通过结合至并因此激活细胞周期蛋白依赖性激酶而展现其功能。细胞周期蛋白可以分组成有丝分裂细胞周期蛋白(在高等真核生物中称为A-和B-型细胞周期蛋白并且在芽殖酵母中称为CLB)和G1特异性细胞周期蛋白(在哺乳动物中称为D-型细胞周期蛋白并且在芽殖酵母中称为CLN)。细胞周期蛋白B例如是有丝分裂促进因子(MPF)的大蛋白质亚基;细胞周期蛋白B在细胞周期期间合成和降解以调节MPF活性。细胞周期蛋白B和细胞周期蛋白依赖性激酶1(cdk1、akacdc2、aka p34激酶)共同形成活性MPF蛋白。其他细胞周期蛋白包括细胞从G1至S期转移所需要的细胞周期蛋白E(与G1期Cdk结合);和细胞周期蛋白A,其中所述的细胞周期蛋白A与S期Cdk2结合并且是细胞推进经过S期所需的。H-型细胞周期蛋白调节CAKs(CDK-激活激酶)的活性。植物中已知的全部四种类型的细胞周期蛋白主要通过类推至它们的人类对应物而鉴定。在拟南芥属中,已经描述了10种A-型、9种B-型、10种D-型和1种H-型细胞周期蛋白(Vandepoele等,2002)。细胞周期蛋白一般具有所谓的细胞周期蛋白盒,是一种为结合并激活细胞周期蛋白依赖性激酶所需的保守序列。
细胞周期蛋白H也是细胞周期的调节物(Fisher等Cell 78,713-724,1994;Makela等Nature 371,254-257,1994;Yamaguchi等Plant J.24,11-20,2000)。在动物细胞中,它是CDK7/细胞周期蛋白H/MAT1复合体的一部分。这种复合体实际上是一种“细胞周期蛋白激活复合体”,该复合体通过磷酸化细胞周期蛋白而调节激活级联中其他细胞周期蛋白/CDK复合体的活性。细胞周期蛋白H也参与转录和DNA修复。CDK7和CDK7在其他生物中的对应物如稻中的R2或裂殖酵母属(Schizosaccharomyces)中的Mcs6/Crk1/Mop1称作细胞周期蛋白依赖性激酶激活激酶(CDK激活激酶或CAK)。
CDK激活激酶(CAK)活化了细胞周期蛋白依赖性激酶(cdks),通过磷酸化cdks中保守的苏氨酸残基而控制细胞周期进程。来自人的CAK复合体包括p40MO15(cdk7)、细胞周期蛋白H和MAT1,它们也是使RNA聚合酶II大亚基的羧基端结构域磷酸化的转录因子IIH的亚基。
IV.Remorin
Remorin(又称作pp34或dbp)形成胞浆膜/脂筏相关蛋白超家族(Alliotte等(1989)Plant Physiol 89:743-752;Reymond等(1996)Plant Cell8:2265-2276;Bariola等(2004)Plant Molec Biol 55:579-594;Mongrand等(2004)J Biol Chem 279(35):36277-36286)。该植物特异的超家族存在于被子植物、裸子植物和苔藓植物中。在拟南芥属中找到至少15种密切相关的Remorin,并且其他植物中Remorin家族具有相似丰度。
Remorin多肽以其羧基端半部分存在卷曲螺旋结构域为特征。卷曲螺旋结构域常常参与蛋白质-蛋白质相互作用,尤其在寡聚化中。与此相符,已经发现Remorin在体外寡聚化并形成丝状结构,并且作为寡聚结构存在于植物胞浆膜制备物中(Bariola等,参见上文)。
尽管与胞浆膜强结合,不过Remorin多肽不具有典型膜结合蛋白的结构。相反,Remorin是小的亲水性多肽。尤其,Remorin的羧基端半部分富含带电荷的氨基酸(Lys(K)、Arg(R)、Asp(D)和Glu(E)。最后,大部分的Remorin于包含在该多肽羧基末端处最后10个氨基酸残基中至少包含半胱氨酸(Cys或C)和/或苯丙氨酸(Phe或F)。
Remorin可以在体外非特异性地与聚阴离子如寡半乳糖醛酸(OGA;Reymond等,参见上文)、多聚半乳糖醛酸(PGA;Farmer等(1991)J BiolChem 266(5):3140-5)结合,并且也可以结合双链DNA(Alliotte等,参见上文)。作为参与众多信号途径的活性胞外基质成分的OGA也刺激Remorin的体外磷酸化,主要在苏氨酸残基处磷酸化。
还不可能重获过量表达编码Remorin多肽的核酸序列的健康拟南芥属品系,并且反义品系不表现明显表型,可能原因是Remorin由庞大的多基因家族代表(Bariola等,参见上文)。国际专利申请WO 02/16655描述了作为SEQ ID NO:2621的编码Remorin多肽的核酸序列。美国专利7,071,380描述了作为SEQ ID NO:379和SEQ ID NO:380的编码Remorin多肽的两种核酸序列。美国专利7,135,616描述了作为SEQ ID NO:133的编码Remorin多肽的核酸序列。
V.DREB
转录因子通常定义为显示序列特异性DNA结合作用和能够激活和/或抑制转录的蛋白质。拟南芥属基因组编码至少1533种转录调节物,这占据估计基因总数的约5.9%。据报道这些转录因子的约45%来自植物专属家族(Riechmann等,2000(Science第290卷,2105-2109))。
AP2/EREBPs(APETALA2/乙烯应答元件结合蛋白)是植物独有的转录因子的原型家族,所述转录因子的区别性特征是它们含有所谓AP2DNA-结合结构域,其与乙烯应答启动子中的GCC盒直接相互作用。然而,含有AP2结构域的蛋白质也在病毒、蓝细菌和纤毛虫的基因组中编码,其中认为它们作为核酸内切酶发挥作用(Magnani等Plant Cell.2004年9月;16(9):2265-77)。
AP2/EREBP家族成员基于AP2结构域的数目和其他保守基序的存在而分成3个不同组。AP2结构域的共有序列显示组间的轻微差异。称作APETALA 2亚家族的第一个性质不同的组由含有两个重复AP2结构域的成员组成。称作ERF亚家族的第二组的成员含有单个AP2结构域,并且也称作RAV蛋白的第三组由含有B3结构域和单个AP2结构域的蛋白质组成。虽然已经报道显示具有两个AP2结构域的蛋白质发挥发育作用,但大部分含有单个AP2结构域的蛋白质相对于生物胁迫和非生物胁迫在进行研究。
DREB或CBF蛋白构成参与非生物胁迫应答的含有单个AP2结构域的蛋白质的亚组(Yamaguchi-Shinozaki等1994.Plant Cell.6,251-264)。已经报道了DREB或CBF结合称作DRE(干旱应答元件)和/或CRT(C重复)的基因启动子中的特异性顺式作用元件并激活与寒冷、干旱和高盐度相关的下游基因转录(Baker等(1994)Plant Mol.Biol.24,710-713);Stockinger等(1997)Proc.Natl.Acad.Sci.94,1035-1040;Liu等Plant Cell 10,1391-1406)。
DREB蛋白的基因表达在植物中受到高度调节。根据不同胁迫条件下的差异表达,可以在拟南芥属中区分两个亚组的DREBS,为DREB1和DREB2。然而在结构和功能方面,这两个亚组通过结合至DRE/CRT顺式作用元件并调节胁迫基因的表达而类似地运作。此外,这种结合作用可以导致下游基因的反式激活或反式失活(Zhao等2006,JBC 218,10752-10759)。
已经广泛报道DREB基因在植物中的过量表达导致胁迫诱导型基因的强表达,并且转基因植物获得较高的非生物胁迫耐受性(Jaglo-Ottosen等(1998)Science 280:104-106;Sakuma Y等(2006)Plant Cell18:1292-1309;Jaglo KR等(2001),Plant Physiol 127:910-917;Shen等(2003)Theor Appl Genet 106:923-930,Dubouzet JG等(2003)Plant J33:751-763)。也已经在CBF2基因表达受损的拟南芥中报道了CBF2突变体的非生物胁迫耐受性。有趣的是,CBF1/DREB1B和CBF3/DREB1A在CBF2敲除植物中的表达水平提高。这些结果显示在拟南芥属植物中,CBF2/DREB1C负向地调节CBF1/DREB1B和CBF3/DREB1A基因的表达(Novillo等2004,101,3985-3990)。
出人意料地,已经发现调节植物中编码产量增加多肽(YEP)的核酸表达产生相对于对照植物而言具有增强的产量相关性状和/或提高的非生物胁迫抗性的植物,其中所述的产量增加多肽(YEP)选自核小体装配蛋白1样多肽(NAP1样)、Sm样多肽(Lsm蛋白)、截短的细胞周期蛋白H(CycHTr)多肽、Remorin多肽和DREB蛋白。
定义
多肽/蛋白质
术语“多肽”和“蛋白质”在本文中可相互交换地使用并且指由肽键连接起来的任意长度聚合物形式的氨基酸。
多核苷酸/核酸/核酸序列/核苷酸序列
术语“多核苷酸”、“核酸序列”、“核苷酸序列”、“核酸”、“核酸分子”在本文中可相互交换地使用并且指任意长度聚合的非分支形式的核苷酸,即核糖核苷酸或脱氧核糖核苷酸或这二者的组合。
对照植物
选择合适的对照植物是实验设计的例行部分并且可以包括相应的野生型植物或无目的基因的相应植物。对照植物一般是相同的植物物种或甚至是与待评估植物相同的品种。对照植物也可以是待评估植物的失效合子。如本文中所用的“对照植物”不仅指完整植物,也指植物部分,包括种子和种子部分。
同源物
蛋白质的“同源物”包括这样的肽、寡肽、多肽、蛋白质和酶,它们相对于非修饰的所讨论蛋白质具有氨基酸替换、缺失和/或插入并且与它们衍生自的所述非修饰蛋白质具有相似的生物学活性和功能活性。
缺失指从蛋白质中移除一个或多个氨基酸。
插入指一个或多个氨基酸残基被导入蛋白质中的预定位点。插入可以包含氨基端融合和/或羧基端融合以及序列内插入单个或多个氨基酸。通常,在氨基酸序列内部的插入物比氨基端融合物或羧基端融合物小约1-10个残基级别。氨基端或羧基端融合蛋白或融合肽的实例包括如酵母双杂交系统中所用的转录激活物的结合结构域或激活结构域、噬菌体外壳蛋白、(组氨酸)-6-标签、谷胱甘肽S-转移酶-标签、蛋白A、麦芽糖结合蛋白、二氢叶酸还原酶、Tag·100表位、c-myc表位、-表位、lacZ、CMP(钙调蛋白结合肽)、HA表位、蛋白C表位和VSV表位。
替换指以具有相似特性(如相似的疏水性、亲水性、抗原性、形成或破坏α-螺旋结构或β-折叠结构的倾向性)的其他氨基酸替换蛋白质的氨基酸。氨基酸替换一般是单个残基的,不过根据给予多肽的功能性约束条件,可以是簇集的;插入通常是约1-10个氨基酸残基级别。氨基酸替换优选地是保守性氨基酸替换。保守性替换表是本领域熟知的(见例如Creighton(1984)Proteins.W.H.Freeman and Company(编著)和下表1)。
表1:保守性氨基酸替换的实例
残基 | 保守性替换 | 残基 | 保守性替换 |
Ala | Ser | Leu | Ile;Val |
Arg | Lys | Lys | Arg;Gln |
Asn | Gln;His | Met | Leu;Ile |
Asp | Glu | Phe | Met;Leu;Tyr |
Gln | Asn | Ser | Thr;Gly |
Cys | Ser | Thr | Ser;Val |
Glu | Asp | Trp | Tyr |
Gly | Pro | Tyr | Trp;Phe |
His | Asn;Gln | Val | Ile;Leu |
Ile | Leu,Val |
氨基酸替换、缺失和/或插入可以使用本领域熟知的肽合成技术如固相肽合成法等或通过重组DNA操作轻易地进行。用于操作DNA序列以产生蛋白质的替换、插入或缺失变体的方法是本领域熟知的。例如,用于在DNA的预定位点处产生替换突变的技术是本领域技术人员熟知的并且包括M13诱变法、T7-Gen体外诱变法(USB,Cleveland,OH)、QuickChange位点定向诱变法(Stratagene,San Diego,CA)、PCR介导的位点定向诱变或其他位点定向诱变法。
衍生物
“衍生物”包括这样的肽、寡肽、多肽,其中与天然存在形式蛋白质(如目的蛋白)的氨基酸序列相比较,它们包含非天然存在的氨基酸残基对氨基酸的替换或非天然存在的氨基酸残基的添加。蛋白质的“衍生物”也包括这样的肽、寡肽、多肽,其中与所述多肽天然存在形式的氨基酸序列相比,它们包含天然存在改变(糖基化、酰化、异戊二烯化、磷酸化、肉豆蔻酰化、硫酸化等)的氨基酸残基或非天然存在改变的氨基酸残基。与衍生出衍生物的氨基酸序列相比较,该衍生物可以也包含与所述氨基酸序列共价或非共价结合的一个或多个非氨基酸的取代基或添加物(例如报道分子或其他配体),如所结合旨在促进检测该衍生物的报道分子,和相对于天然存在的蛋白质的氨基酸序列而言,包含非天然存在的氨基酸残基。此外,“衍生物”也包括天然存在形式蛋白质与标签肽如FLAG、HIS6或硫氧还蛋白(对于标签肽的综述,见Terpe,Appl.Microbiol.Biotechnol.60,523-533,2003)的融合物。
直向同源物/旁系同源物
直向同源物和旁系同源物包括用来描述基因祖先关系的进化概念。旁系同源物是相同物种内起源于祖先基因复制的基因;而直向同源物是来自不同生物的因物种形成而起源的基因,并且也来源于共同的祖先基因。
结构域
术语“结构域”指在进化相关性蛋白质的序列比对结果上的特定位置处保守的一组氨基酸。尽管在其他位置处的氨基酸可以在同源物之间不同,然而在特定位置处高度保守的氨基酸指示了很可能在蛋白质结构、稳定性或功能方面是必需的氨基酸。结构域因其在蛋白质同源物家族的比对序列中高保守程度而鉴定,故它们可以作为鉴定物用来确定所讨论的任意多肽是否属于先前已鉴定的多肽家族。
基序/共有序列/标签
术语“基序”或“共有序列”或“标签”指在进化相关蛋白质的序列中短的保守区域。基序往往是结构域的高度保守部分,不过也可以仅包括结构域的部分,或可以位于保守结构域之外(若基序的全部氨基酸位于定义的结构域之外)。
杂交
如本文中所定义的术语“杂交”是其中基本上同源互补的核苷酸序列相互复性的过程。杂交过程可以完全在溶液中进行,即两种互补核酸均处于溶液中。杂交过程也可以用固定至基质如磁珠、琼脂糖凝胶(Sepharose)珠或任何其他树脂的互补核酸之一进行。杂交过程也可以用固定至固体支持物如硝酸纤维素膜或尼龙膜上或通过例如照相平版印刷术固定至例如硅玻璃支持物(后者称作核酸阵列或微阵列或称作核酸芯片)的互补核酸之一进行。为使杂交发生,核酸分子通常受到热变性或化学变性,以使双链解链成两条单链和/或去除来自单链核酸的发夹或其他二级结构。
术语“严格性”指进行杂交的条件。杂交的严格性受诸条件如温度、盐浓度、离子强度和杂交缓冲液组成的影响。通常,低严格条件选择为在定义的离子强度和pH处,低于特定序列的热解链温度(Tm)约30℃。中等严格条件是所述温度低于Tm 20℃并且高严格条件是所述温度低于Tm 10℃。高严格杂交条件一般用于分离与靶核酸序列具有高序列相似性的杂交序列。然而,核酸可以在序列上偏离且依旧编码基本上相同的多肽,原因是遗传密码的简并性。因而,有时候可能需要中等严格杂交条件以鉴定此类核酸分子。
Tm是在定义的离子强度和pH处的下述温度,其中50%的靶序列在所述温度与完全匹配的探针杂交。Tm取决于溶液条件和探针的碱基组成及长度。例如,较长的序列在更高温度上特异性地杂交。最大杂交速率在低于Tm约16℃直至32℃上获得。杂交溶液中一价阳离子的存在降低了两条核酸链之间的静电排斥作用,因而促进杂交体形成;这种作用对于高达0.4M的钠浓度是显而易见的(对于更高的浓度而言,可以忽略这种作用)。甲酰胺降低了DNA-DNA和DNA-RNA双链体的解链温度,每百分数的甲酰胺降低0.6-0.7℃,且添加50%甲酰胺允许在30-45℃杂交,尽管杂交速率将降低。碱基对错配降低了杂交速率和双链体的热稳定性。平均而言和对于大探针而言,Tm下降约1℃/每%碱基错配。根据杂交体的类型,Tm可以使用以下等式计算:
1)DNA-DNA杂交体(Meinkoth和Wahl,Anal.Biochem.,138:267-284,1984):
Tm=81.5℃+16.6×log10[Na+]a+0.41×%[G/Cb]-500×Lc]-1-0.61×%甲酰胺
2)DNA-RNA杂交体或RNA-RNA杂交体
Tm=79.8+18.5(log10[Na+]a)+0.58(%G/Cb)+11.8(%G/Cb)2-820/Lc
3)寡DNA或寡RNAd杂交体:
对少于20个核苷酸而言:Tm=2(ln)
对20至35个核苷酸而言:Tm=22+1.46(ln)
a或者用于其他一价阳离子,但是仅在0.01至0.4M范围内是精确的。
b仅对于在30%-75%范围内的%GC是精确的。
cL=双链体的碱基对长度。
dOligo,寡核苷酸;ln,=引物的有效长度=2×(G/C数)+(A/T数)。
可以众多已知技术中任意一种技术控制非特异性结合,例如将膜以含有蛋白质的溶液封闭、添加异源RNA、异源DNA、和SDS至杂交缓冲液、和用RNA酶处理。对于非同源性探针,可以通过变换以下条件之一:(i)渐进地降低复性温度(例如从68℃至42℃)或(ii)渐进地降低甲酰胺浓度(例如从50%至0%)进行一系列杂交。技术人员了解可以在杂交期间变更和维持或改变所述严格条件的多个参数。
除了杂交条件之外,杂交特异性一般还取决于杂交后洗液的功能。为除去因非特异性杂交引起的背景,样品用稀释的盐溶液洗涤。此类洗液的关键因素包括最终洗涤溶液的离子强度和温度:盐浓度越低且洗涤温度越高,则洗涤的严格性越高。洗涤条件一般在杂交严格性处或低于所述杂交严格性而进行。阳性杂交产生至少两倍于背景信号的信号。通常,用于核酸杂交测定法或基因扩增检测方法的适宜严格条件如上所述。也可以选择严格性更高或更低的条件。技术人员了解可以在杂交期间变更和维持或改变所述严格条件的多个参数。
例如,用于长度大于50个核苷酸的DNA杂交体的典型高严格杂交条件包括在65℃于1×SSC中或在42℃于1×SSC和50%甲酰胺中杂交,随后在65℃于0.3×SSC中洗涤。用于长度大于50个核苷酸的DNA杂交体的中等严格杂交条件的实例包括在50℃于4×SSC或在40℃于6×SSC和50%甲酰胺中杂交,随后在50℃于2×SSC中洗涤。杂交体的长度是杂交核酸的预期长度。当杂交序列已知的核酸时,可以通过将序列比对并鉴定本文中所述的保守区而确定杂交体长度。1×SSC是0.15M NaCl和15mM柠檬酸钠;杂交溶液和洗涤溶液可以额外地包括5×Denhardt试剂、0.5-1.0%SDS、100μg/ml变性的片段化鲑精DNA、0.5%磷酸钠。
出于定义严格性的水平的目的,可以参考Sambrook等(2001)Molecular Cloning:a laboratory manual,第三版Cold Spring HarborLaboratory Press,CSH,New York或参考Current Protocols in MolecularBiology,John Wiley & Sons,N.Y.(1989和年度更新版)。
剪接变体
如本文中所用的术语“剪接变体”包括其中所选内含子和/或外显子已经被切除、替换、置换或添加或其中内含子已经被缩短或加长的核酸序列的变体。此类变体将是其中基本上保留了蛋白质生物学活性的一类变体;这可以通过选择性地保留蛋白质的功能性片段实现。此类剪接变体可以在自然界中找到或可以人工制备。用于预测和分离此类剪接变体的方法是本领域熟知的(见例如Foissac和Schiex,BMC Bioinformatics.2005;6:25)。
等位变体
等位基因或等位变体是给定基因位于相同染色体位置处的备选形式。等位变体包含单核苷酸多态性(SNP)和小的插入/缺失多态性(INDEL)。INDEL的大小通常小于100bp。SNP和INDEL形成大部分生物的天然存在多态性株系中的序列变体的最大集合。
基因改组/定向进化
基因改组或定向进化由反复DNA改组,随后适当筛选和/或选择以产生编码具有改良生物学活性的蛋白质的核酸或其部分的变体而组成(Castle等,(2004)Science 304(5674):1151-4;美国专利5,811,238和6,395,547)。
调节元件/调控序列/启动子
术语“调节元件”、“调控序列”和“启动子”均在本文中可相互交换地使用并且在广泛含义上意指能够实现与它们相连接的序列表达的调节性核酸序列。术语“启动子”一般指位于基因转录起点上游并参与识别和结合RNA聚合酶和其他蛋白质,因而指导有效连接的核酸转录的核酸调控序列。前述术语包括从经典真核基因组基因(包括对于精确转录启动所需的TATA盒,具有或没有CCAAT盒序列)衍生的转录调节序列和应答发育性刺激和/或外部刺激或以组织特异性方式而改变基因表达的其它调节元件(即上游激活序列、增强子和沉默子)。本术语还包括经典原核基因的转录调节序列,在此情况下它可以包括一个-35盒序列和/或一个-10盒转录调节序列。术语“调节元件”也包含赋予、激活或增强细胞、组织或器官中核酸分子表达的人工融合分子或衍生物。
“植物启动子”包含介导植物细胞中编码序列节段表达的调节元件。因此,植物启动子不需要源自植物,而是可以源自病毒或微生物,例如来自侵袭植物细胞的病毒。“植物启动子”也可以源自植物细胞,例如来自待于本发明方法中表达并在本文中描述的核酸序列转化的植物。这也适用于其他“植物”调节信号,如“植物”终止子。在本发明方法中有用的核苷酸序列上游的启动子可以通过一个或多个核苷酸替换、插入和/或缺失进行修饰,但不影响启动子、可读框(ORF)或3′调节区如终止子或远离ORF存在的其他3′调节区的功能性或活性。还有可能的是:所述启动子的活性因其序列的修饰或被更活跃的启动子、甚至来自异源生物的启动子彻底替换而提高。为了在植物中表达,如上所述,核酸分子必须有效地连接至或包含在正确时间点处和以所需空间表达模式表达基因的合适启动子。
为鉴定功能性等效启动子,候选启动子的启动子强度和/或表达模式可以例如通过将此启动子有效地与报道基因连接并分析该报道基因在植物多种组织中的表达水平和模式进行分析。熟知的合适报道基因包括例如β-葡糖苷酸酶或β-半乳糖苷酶。启动子活性通过测量β-葡糖苷酸酶或β-半乳糖苷酶的酶活性进行分析。启动子强度和/或表达模式随后可以与参考启动子(如在本发明方法中使用的一种启动子)的启动子强度和/或表达模式比较。或者,启动子强度可以使用本领域已知方法如RNA印迹法及放射自显影图的密度计分析法、定量实时PCR或RT-PCR(Heid等,1996 GenomeMethods 6:986-994),通过量化mRNA水平或通过将本发明方法中所用核酸的mRNA水平与持家基因(如18S rRNA)的mRNA水平比较进行分析。通常“弱启动子”意指驱动编码序列在低水平上表达的启动子。“低水平”意指在每个细胞约1/10,000转录物至约1/100,000转录物、至约1/500,0000转录物的水平上。相反,“强启动子”驱动编码序列在高水平、或在每个细胞约1/10转录物至约1/100转录物、至约1/1,000转录物上表达。
有效地连接
如本文中所用的术语“有效地连接”指启动子序列与目的基因之间的功能性连接,从而该启动子序列能够起始此目的基因转录。
组成型启动子
“组成型启动子”指在生长和发育的大部分期间而不必需是所有期间和在大多数环境条件下在至少一种细胞、组织或器官中有转录活性的启动子。下表2a给出组成型启动子的例子。
表2a:组成型启动子的例子
基因来源 | 参考文献 |
肌动蛋白 | McElroy等,Plant Cell,2:163-171,1990 |
HMGP | WO 2004/070039 |
CAMV 35S | Odell等,Nature,313:810-812,1985 |
CaMV 19S | Nilsson等,Physiol.Plant.100:456-462,1997 |
GOS2 | de Pater等,Plant J Nov;2(6):837-44,1992,WO 2004/065596 |
遍在蛋白 | Christensen等,Plant Mol.Biol.18:675-689,1992 |
稻亲环蛋白 | Buchholz等,Plant Mol Biol.25(5):837-43,1994 |
玉米H3组蛋白 | Lepetit等,Mol.Gen.Genet.231:276-285,1992 |
苜蓿H3组蛋白 | Wu等Plant Mol.Biol.11:641-649,1988 |
肌动蛋白2 | An等,Plant J.10(1);107-121,1996 |
34S FMV | Sanger等,Plant.Mol.Biol.,14,1990:433-443 |
核酮糖二磷酸羧化酶-加氧酶小亚基 | US 4,962,028 |
OCS | Leisner(1988)Proc Natl Acad Sci USA 85(5):2553 |
SAD1 | Jain等,Crop Science,39(6),1999:1696 |
SAD2 | Jain等,Crop Science,39(6),1999:1696 |
nos | Shaw等(1984)Nucleic Acids Res.12(20): |
7831-7846 | |
V-ATP酶 | WO 01/14572 |
超级启动子 | WO 95/14098 |
G盒蛋白质 | WO 94/12015 |
遍在启动子
遍在启动子基本上在生物全部组织或细胞中有活性。
发育调节型启动子
发育调节型启动子在某些发育阶段期间或在经历发育变化的植物的部分中有活性。
诱导型启动子
诱导型启动子在应答化学刺激(综述见Gatz 1997,Annu.Rev.PlantPhysiol.Plant Mol.Biol.,48:89-108)、环境刺激或物理刺激时具有诱导型或提高的转录启动作用,或可以是“胁迫诱导的”,即当植物暴露于多种胁迫条件时被激活,或是“病原体诱导的”,即当植物暴露于多种病原体时被激活。
器官特异性/组织特异性启动子
器官特异性或组织特异性启动子是能够偏好性地启动在某些器官或组织如叶、根、种子组织等中转录的启动子。例如,“根特异性启动子”是这样的启动子,该启动子优势地在植物根中具有转录活性的启动子,基本上在植物任何其他部分中无活性,尽管在所述的植物其他部分中仍允许任意泄露表达。能够仅在某些细胞中启动转录的启动子在本文中称作“细胞特异性的”。
种子特异性启动子是能够优势地在种子组织中有转录活性的启动子,但不是必需排他性地在种子组织中有转录活性(在泄露表达的情况下)。种子特异性启动子可以在种子发育期间和/或萌发期间有活性。种子特异性启动子可以是胚乳/糊粉/胚特异性的。种子特异性启动子的实例示于下文表2b、2c、2d和2e中。种子特异性启动子的其他实例在Qing Qu和Takaiwa(Plant Biotechnol.J.2,113-125,2004)中给出,所述文献的公开内容如完整所述那样通过引用方式并入本文。
表2b:种子特异性启动子的例子
基因来源 | 参考文献 |
种子特异性基因 | Simon等,Plant Mol.Biol.5:191,1985; |
Scofield等,J.Biol.Chem.262:12202,1987.; | |
Baszczynski等,Plant Mol.Biol.14:633,1990. | |
巴西坚果(Brazil Nut)白蛋白 | Pearson等,Plant Mol.Biol.18:235-245,1992. |
豆球蛋白 | Ellis等,Plant Mol.Biol.10:203-214,1988. |
谷蛋白(稻) | Takaiwa等,Mol.Gen.Genet.208:15-22,1986; |
Takaiwa等,FEBS Letts.221:43-47,1987. | |
玉米醇溶蛋白 | Matzke等Plant Mol Biol,14(3):323-321990 |
napA | Stalberg等,Planta 199:515-519,1996. |
小麦LMW和HMW麦谷蛋白-1 | Mol Gen Genet 216:81-90,1989;NAR17:461-2,1989 |
小麦SPA | Albani等,Plant Cell,9:171-184,1997 |
小麦α,β,γ-麦醇溶蛋白 | EMBO J.3:1409-15,1984 |
大麦Itr1启动子 | Diaz等(1995)Mol Gen Genet248(5):592-8 |
大麦B1、C、D、大麦醇溶蛋白 | Theor Appl Gen 98:1253-62,1999;PlantJ 4:343-55,1993;Mol Gen Genet250:750-60,1996 |
大麦DOF | Mena等,The Plant Journal,116(1):53-62,1998 |
blz2 | EP99106056.7 |
合成的启动子 | Vicente-Carbajosa等,Plant J.13:629-640,1998. |
稻谷醇溶蛋白NRP33 | Wu等,Plant Cell Physiology 39(8)885-889,1998 |
稻α-球蛋白Glb-1 | Wu等,Plant Cell Physiology 39(8)885-889,1998 |
稻OSH1 | Sato等,Proc.Natl.Acad.Sci.USA,93:8117-8122,1996 |
稻α-球蛋白REB/OHP-1 | Nakase等Plant Mol.Biol.33:513-522,1997 |
稻ADP-葡萄糖焦磷酸酶 | Trans Res 6:157-68,1997 |
玉米ESR基因家族 | Plant J 12:235-46,1997 |
高粱α-高粱醇溶蛋白 | DeRose等,Plant Mol.Biol 32:1029-35,1996 |
KNOX | Postma-Haarsma等,Plant Mol.Biol.39:257-71,1999 |
稻油质蛋白 | Wu等,J.Biochem.123:386,1998 |
向日葵油质蛋白 | Cummins等,Plant Mol.Biol.19:873-876,1992 |
PRO0117,推定的稻40S核糖体蛋白 | WO 2004/070039 |
PRO0136,稻丙氨酸氨基转移酶 | 未公开 |
PRO0147,酪氨酸抑制物ITR1(大麦) | 未公开 |
PRO0151,稻WSI18 | WO 2004/070039 |
PRO0175,稻RAB21 | WO 2004/070039 |
PRO005 | WO 2004/070039 |
PRO0095 | WO 2004/070039 |
α-淀粉酶(Amy32b) | Lanahan等,Plant Cell 4:203-211,1992; |
Skriver等,Proc Natl Acad Sci USA88:7266-7270,1991 | |
组织蛋白酶β样基因 | Cejudo等,Plant Mol Biol 20:849-856,1992 |
大麦Ltp2 | Kalla等,Plant J.6:849-60,1994 |
Chi26 | Leah等,Plant J.4:579-89,1994 |
玉米B-Peru | Selinger等,Genetics 149;1125-38,1998 |
表2c:胚乳特异性启动子的例子
基因来源 | 参考文献 |
谷蛋白(稻) | Takaiwa等(1986)Mol Gen Genet208:15-22;Takaiwa等(1987)FEBS Letts.221:43-47 |
玉米醇溶蛋白 | Matzke等,(1990)Plant Mol Biol 14(3):323-32 |
小麦LMW和HMW麦谷蛋白-1 | Colot等(1989)Mol Gen Genet 216:81-90,Anderson等(1989)NAR 17:461-2 |
小麦SPA | Albani等(1997)Plant Cell 9:171-184 |
小麦麦醇溶蛋白 | Rafalski等(1984)EMBO 3:1409-15 |
大麦Itr1启动子 | Diaz等(1995)Mol Gen Genet248(5):592-8 |
大麦B1、C、D、大麦醇溶蛋白 | Cho等(1999)Theor Appl Genet98:1253-62;Muller等(1993)Plant J4:343-55;Sorenson等(1996)Mol GenGenet 250:750-60 |
大麦DOF | Mena等,(1998)Plant J 116(1):53-62 |
blz2 | Onate等(1999)J Biol Chem274(14):9175-82 |
合成的启动子 | Vicente-Carbajosa等(1998)Plant J13:629-640 |
稻谷醇溶蛋白NRP33 | Wu等,(1998)Plant Cell Physiol 39(8) |
885-889 | |
稻球蛋白Glb-1 | Wu等(1998)Plant Cell Physiol 39(8)885-889 |
稻球蛋白REB/OHP-1 | Nakase等(1997)Plant Molec Biol 33:513-522 |
稻ADP-葡萄糖焦磷酸酶 | Russell等(1997)Trans Res 6:157-68 |
玉米ESR基因家族 | Opsahl-Ferstad等(1997)Plant J12:235-46 |
高粱的高粱醇溶蛋白 | DeRose等(1996)Plant Mol Biol32:1029-35 |
表2d:胚特异性启动子的例子:
基因来源 | 参考文献 |
稻OSH1 | Sato等,Proc.Natl.Acad.Sci.USA,93:8117-8122,1996 |
KNOX | Postma-Haarsma等,Plant Mol.Biol.39:257-71,1999 |
PRO0151 | WO 2004/070039 |
PRO0175 | WO 2004/070039 |
PRO005 | WO 2004/070039 |
PRO0095 | WO 2004/070039 |
表2e:糊粉特异性启动子的例子:
基因来源 | 参考文献 |
α-淀粉酶(Amy32b) | Lanahan等,Plant Cell 4:203-211,1992;Skriver等,Proc Natl Acad Sci USA 88:7266-7270,1991 |
组织蛋白酶β样基因 | Cejudo等,Plant Mol Biol 20:849-856,1992 |
大麦Ltp2 | Kalla等,Plant J.6:849-60,1994 |
Chi26 | Leah等,Plant J.4:579-89,1994 |
玉米B-Peru | Selinger等,Genetics 149;1125-38,1998 |
如本文中所定义的绿色组织特异性启动子是优势地在绿色组织中具有转录活性的启动子,在植物的任何其他部分中基本上无活性,尽管依旧允许在所述的植物其他部分中的任何泄露表达。
组织特异性启动子的另一个实例是分生组织特异性启动子,其优势地在分生组织中具有转录活性,在植物的任何其他部分中基本上无活性,尽管依旧允许在所述的植物其他部分中的任何泄露表达。
终止子
术语“终止子”包括作为转录单元末端处DNA序列的调控序列,所述的DNA序列产生初级转录物的3’加工和多聚腺苷化的信号和转录终止信号。所述终止子可以从天然基因、从多种其他植物基因或从T-DNA衍生。待添加的终止子可以从例如胭脂碱合酶或章鱼碱合酶基因或备选地从另一种植物基因或较不优选地从任何其他真核基因衍生。
调节
就表达或基因表达而言,术语“调节”意指这样的过程,在所述过程中与对照植物相比较,表达水平因所述基因的表达而改变,优选地,表达水平可以提高或降低。原始、未调节的表达可以是结构性RNA(rRNA、tRNA)或mRNA的任何类型的表达,随后是翻译。术语“对活性的调节”应当意指本发明核酸序列或所编码蛋白质的表达的任何改变,这导致植物产量提高和/或生长增加。
表达
术语“表达”或“基因表达”意指某个特定基因或多个特定基因或特定基因构建体的转录。术语“表达”或“基因表达”尤其意指某个基因或诸基因或基因构建体转录成结构性RNA(rRNA,tRNA)或mRNA,而所述RNA随后翻译或不翻译成蛋白质。该过程包括DNA的转录和所得mRNA产物的加工。
提高的表达/过量表达
如本文中所用的术语“提高的表达”或“过量表达”意指相对于原有野生型表达水平为额外的任何形式的表达。
在本领域内充分记载了用于提高基因或基因产物表达的方法并且这些方法包括例如由适宜启动子驱动的过量表达、使用转录增强子或翻译增强子。充当启动子或增强子元件的分离核酸可以导入多核苷酸的非异源形式的适宜位置(一般在上游)中,从而上调编码目的多肽的核酸表达。例如,内源性启动子可以在体内通过突变、缺失和/或替换加以改变(见Kmiec,US 5,565,350;Zarling等,WO9322443),或可以将分离的启动子以相对于本发明基因的恰当方向及距离导入植物细胞,从而控制该基因的表达。
若需要多肽表达,通常希望的是在多核苷酸编码区的3’末端处包括多聚腺苷化区。多聚腺苷化区可以从天然基因、从多种其他植物基因或从T-DNA衍生。待添加的3’末端序列可以从例如胭脂碱合酶或章鱼碱合酶基因或备选地从另一种植物基因或较不优选地从任何其他真核基因衍生。
内含子序列也可以添加至5′非翻译区(UTR)或部分编码序列的编码序列以提高胞浆内聚集的成熟信使的量。已经证实在植物和动物表达构建体的转录单位中包含可剪接内含子提高了mRNA水平及蛋白质水平上的基因表达高达1000倍(Buchman和Berg(1988)Mol.Cell biol.8:4395-4405;Callis等(1987)Gens Dev 1:1183-1200)。此类内含子增强基因表达的作用一般在所述内含子位于转录单位的5′末端附近时最强烈。玉米内含子Adh1-S内含子1、2和6、Bronze-1内含子的用途是本领域已知的。对于总体信息,见:《玉米手册》,第116章,编者Freeling和Walbot,Springer,N.Y.(1994)。
内源基因
本文中对“内源性”基因的称谓不仅仅指如植物中以其天然形式(即没有人类任何干预)存在的所讨论基因,还指处于分离形式下的随后(再)导入植物(转基因)的相同基因(或基本上同源的核酸/基因)。例如,含有这种转基因的转基因植物可以出现转基因表达的大幅降低和/或内源基因表达的大幅降低。所述的分离基因可以从生物分离或可以是人造的,例如通过化学合成法人工制造。
降低的表达
本文中提及的“降低的表达”或“降低或基本消除表达”意指内源基因表达和/或多肽水平和/或多肽活性相对于对照植物的下降。与对照植物相比较,所述降低或基本上消除以递增优选顺序是至少10%、20%、30%、40%或50%、60%、70%、80%、85%、90%或95%、96%、97%、98%、99%或更多降低。
为了降低或基本消除植物中内源基因的表达,需要核酸序列的基本上连续的核苷酸的足够长度。为了进行基因沉默,这个长度可以是短至20、19、18、17、16、15、14、13、12、11、10个或更少的核苷酸,或者该长度可以长至完整基因(包括5’和/或3’UTR,部分或全部)。基本上连续的核苷酸片段可以从编码目的蛋白的核酸(靶基因)或从能够编码目的蛋白的直向同源物、旁系同源物或同源物的任何核酸衍生。优选地,基本上连续的核苷酸的片段能够与靶基因(有义链或反义链)形成氢键,更优选地,基本上连续的核苷酸片段以递增优选顺序与靶基因(有义链或反义链)具有50%、60%、70%、80%、85%、90%、95%、96%、97%、98%、99%、100%的序列同一性。编码(功能性)多肽的核酸序列不是用于降低或基本消除内源基因表达的本文中所讨论多种方法的条件。
表达的这种降低或基本消除可以使用常规方法和技术完成。用于降低或基本消除内源基因表达的优选方法是在植物中导入并表达基因构建体,其中将核酸(在此情况下,从目的基因或从能够编码任何一种目的蛋白的直向同源物、旁系同源物或同源物的任何核酸中衍生的一段基本上连续的核苷酸)克隆至所述基因构建体,作为被间隔序列(非编码性DNA)隔开的(部分或完全)反向重复序列。
在这种优选的方法中,使用核酸或其部分(在此情况下,所述部分是从目的基因或从能够编码目的蛋白的直向同源物、旁系同源物或同源物的任何核酸中衍生的一段基本上连续的核苷酸)的反向重复序列(其优选能够形成发夹结构),通过RNA介导的沉默作用降低或基本上消除内源基因的表达。在包含调控序列的表达载体中克隆所述反向重复序列。非编码性DNA核酸序列(间隔序列,例如基质附着区片段(MAR)、内含子、多接头等)位于形成所述反向重复序列的两个反向核酸之间。在反向重复序列转录后,形成具有(部分或完全)自我互补结构的嵌合RNA。这种双链RNA结构称作发夹RNA(hpRNA)。hpRNA由植物加工成siRNA,该siRNA掺入RNA诱导的沉默复合体(RISC)。RISC进一步切开所述mRNA转录物,从而大幅度地降低待翻译成多肽的mRNA转录物的数目。对于其他一般细节,见例如Grierson等(1998)WO 98/53083;Waterhouse等(1999)WO99/53050)。
本发明方法的实施不依赖在植物中导入并表达所述核酸作为反向重复序列克隆入其中的基因构建体,不过几种众知“基因沉默”方法的任何一种或多种方法可以用来实现相同的作用。
用于降低内源基因表达的这样一种方法是RNA介导的基因表达沉默(下调)。在这种情况下,沉默作用由基本上与内源性靶基因相似的双链RNA序列(dsRNA)在植物中触发。这种dsRNA进一步由植物加工成约20个-约26个核苷酸,称作短干扰RNA(siRNA)。siRNA掺入RNA诱导的沉默复合体(RISC)中,其中所述的RISC切割内源性靶基的mRNA转录物,从而极大降低待翻译成多肽的mRNA转录物的数目。优选地,所述双链RNA序列对应于靶基因。
RNA沉默方法的另一个实例包括将核酸序列或其部分(在此情况下是从目的基因或从能够编码目的蛋白的直向同源物、旁系同源物或同源物的任何核酸中衍生的一段基本上连续的核苷酸)以有义方向导入植物。“有义方向”指与其mRNA转录物同源的DNA序列。因而,将所述核酸序列的至少一个拷贝导入植物。这种额外的核酸序列会降低内源基因表达,产生称为共抑制作用的现象。当一种核酸序列的几个额外拷贝导入植物时,基因表达的降低将更明显,因为高转录物水平与触发共抑制作用之间存在正相关。
RNA沉默方法的另一个实例包括使用反义核酸序列。″反义″核酸序列包含与编码蛋白质的″有义″核酸序列互补,即与双链cDNA分子的编码链互补,或与mRNA转录物序列互补的核苷酸序列。所述反义核酸序列优选地与待沉默的内源基因互补。互补性可以位于基因的“编码区”和/或在其“非编码区”。术语“编码区”指包含被翻译成氨基酸残基的密码子的核苷酸序列的区域。术语“非编码区”指被转录但不被翻译成氨基酸的分布在编码区侧翼的5’和3’序列(也称作5′和3′非翻译区)。
反义核酸序列可以根据Watson和Crick碱基对规则设计。反义核酸序列可以与全部核酸序列(在此情况下是从目的基因或从能够编码目的蛋白的直向同源物、旁系同源物或同源物的任何核酸中衍生的一段基本上连续的核苷酸)互补,不过也可以是仅与所述核酸序列的一部分(包括mRNA5’和3’UTR)互补的寡核苷酸。例如,所述反义寡核苷酸序列可以与编码多肽的mRNA转录物的翻译起点周围的区域互补。合适反义寡核苷酸序列的长度是本领域已知的并且可以从长度约50、45、40、35、30、25、20、15或10个核苷酸或更少的核苷酸开始。本发明的反义核酸序列可以使用化学合成和酶连接反应,利用本领域已知方法构建。例如,反义核酸序列(例如反义寡核苷酸序列)可以使用天然存在的核苷酸或多种修饰的核苷酸化学地合成,设计为旨在提高分子的生物学稳定性或提高反义核酸序列与有义核酸序列之间所形成双链体的物理稳定性,例如,可以使用硫代磷酸酯衍生物和吖啶取代的核苷酸。可以用来产生反义核酸序列的修饰核苷酸的实例是本领域熟知的。已知的核苷酸修饰包括甲基化、环化和′加帽′及用类似物(如肌苷)替换一个或多个天然存在的核苷酸。其他的核苷酸修饰是本领域熟知的。
所述反义核酸序列可以使用表达载体以生物学方式产生,其中将一种核酸序列以反义方向亚克隆(即从所插入核酸转录出的RNA将与目的靶核酸呈反义方向)至所述表达载体。优选地,植物中反义核酸序列的产生借助稳定整合的核酸构建体进行,其中所述的核酸构建体包含启动子、有效连接的反义寡核苷酸和终止子。
本发明方法中用于沉默作用的核酸分子(无论向植物导入或原位(insitu)产生)与mRNA转录物和/或编码多肽的基因组DNA杂交或结合,因此抑制蛋白质的表达,例如通过抑制转录和/或翻译而做到这一点。杂交可以通过常规核苷酸互补性以形成稳定双链体引起,或例如与DNA双链体结合的反义核酸序列的情形下,因双螺旋大沟内的特异性相互作用引起。反义核酸序列可以通过转化法或在特定组织部位处的直接注射法导入植物。或者,反义核酸序列可以受到修饰以靶向所选的细胞并且随后全身性施用。例如,对于全身性施用,可以修饰反义核酸序列,从而它们与表达在所选细胞表面上的受体或抗原特异性地结合,例如通过将所述反义核酸序列连接至与细胞表面受体或抗原结合的肽或抗体连接而做到这一点。所述反义核酸序列也可以使用本文中所述的载体递送至细胞。
根据又一个方面,反义核酸序列是α-端基异构核酸序列。α端基异构核酸序列与互补RNA形成特定的双链杂交体,在所述双链杂交体中与常见的b-单元相反,所述链彼此平行(Gaultier等(1987)Nucl Ac Res 15:6625-6641)。反义核酸序列也可以包含2′-O-甲基核糖核苷酸(Inoue等(1987)Nucl Ac Res 15,6131-6148)或嵌合RNA-DNA类似物(Inoue等(1987)FEBS Lett.215,327-330)。
内源基因表达的降低或基本上消除也可以使用核酶进行。核酶是具有核糖核酸酶活性的催化性RNA分子,能够切割与其具有互补区域的单链核酸序列,如mRNA。因此,核酶(例如锤头状核酶(在Haselhoff和Gerlach(1988)Nature 334,585-591中描述)可以用来催化性地切割编码多肽的mRNA转录物,因而极大降低待翻译成多肽的mRNA转录物的数目。可以设计对核酸序列呈特异性的核酶(见例如:Cech等美国专利号4,987,071;和Cech等美国专利号5,116,742)。或者,与核酸序列相对应的mRNA转录物可以用来从RNA分子汇集物中选出具有特异核糖核酸酶活性的催化性RNA(Bartel和Szostak(1993)Science 261,1411-1418)。核酶用于植物中基因沉默的用途是本领域已知的(例如Atkins等(1994)WO94/00012;Lenne等(1995)WO 95/03404;Lutziger等(2000)WO 00/00619;Prinsen等(1997)WO 97/13865和Scott等(1997)WO 97/38116)。
基因沉默也可以通过插入诱变(例如T-DNA插入或转座子插入)或通过如Angell和Baulcombe((1999)Plant J.20(3):357-62)、(Amplicon VIGSWO 98/36083)或Baulcombe(WO 99/15682)及其他人描述的策略而实现。
当内源基因中存在突变和/或在随后导入植物的分离的基因/核酸中存在突变时,基因沉默也可以发生。所述降低或基本上消除可以由无功能的多肽引起。例如,多肽可以与多种相互作用性蛋白质结合;一种或多种突变和/或截短因而可以产生仍能够结合相互作用性蛋白质(如受体蛋白)但不能表现其正常功能的多肽(如信号配体)。
基因沉默的又一种方法是靶向与基因的调节区(例如启动子和/或增强子)互补的核酸序列以形成可阻止靶细胞中基因转录的三重螺旋结构。见Helene,C.,Anticancer Drug Res.6,569-84,1991;Helene等,Ann.N.Y.Acad.Sci.660,27-361992;和Maher,L.J.Bioassays 14,807-15,1992。
技术人员熟知其他方法,如使用针对内源性多肽的抗体以抑制其在植物中的功能,或干扰其中涉及某多肽的信号途径。尤其,可以考虑人造分子可用于抑制靶多肽的生物学功能,或用于干扰其中涉及所述靶多肽的信号途径。
或者,可以建立筛选程序以鉴定植物群体中基因的天然变体,其中所述的变体编码活性降低的多肽。也可以使用此类天然变体,例如用于开展同源重组。
人工和/或天然的微RNA(miRNA)可以用来敲除基因表达和/或mRNA翻译。内源性miRNA是通常长19-24个核苷酸的单链小RNA。它们主要发挥调节基因表达和/或mRNA翻译的功能。大多数的植物微RNA(miRNA)与其靶序列完全互补或接近完全互补。然而,存在具有多达5个错配的天然靶。它们由Dicer家族的双链特异性RNA酶从具有特征性折返结构的较长非编码性RNA加工而来。加工后,它们通过与RNA诱导的沉默复合体(RISC)的主要成分-Argonaute蛋白结合被掺入该复合体。miRNA充当RISC的特异性成分,因为它们与胞浆内的靶核酸(大多是mRNA)发生碱基配对。后续调节事件包括靶mRNA切割和摧毁和/或翻译抑制。miRNA过量表达的作用因此往往反映为靶基因的mRNA水平降低。
可以按照遗传工程方式专门设计通常长21个核苷酸的人工微RNA(amiRNA)以负向调节单个或多个目的基因的基因表达。选择植物的微RNA靶的决定因素是本领域熟知的。已经定义了用于靶识别的经验参数和可以使用它们来辅助设计特定的amiRNA(Schwab等,Dev.Cell 8,517-527,2005)。用于设计并产生amiRNA及其前体的便利工具也是公众可获得的(Schwab等,2006 Plant Cell.200618(5):1121-33)。
为了最佳性能,用于降低植物中内源基因表达的基因沉默技术需要使用来自单子叶植物的核酸序列以转化单子叶植物,和使用来自双子叶植物的核酸序列以转化双子叶植物。优选地,来自任何给定植物物种的核酸序列导入相同物种。例如,来自稻的核酸序列转化至稻植物。然而,并非绝对要求待导入的核酸序列源自与该核酸序列待导入的植物相同的植物物种。只要内源性靶基因与待导入的核酸之间存在实质的同源性即可。
本文描述的是用于降低或基本上消除植物中内源基因表达的多种方法的实例。例如,本领域技术人员会轻易地能够调整前述用于沉默的方法以至于通过利用合适启动子,实现降低完整植物或在其部分中内源基因的表达。
选择标记(基因)/报道基因
“选择标记”、“选择标记基因”或“报道基因”包括对细胞赋予表型的任何基因,其中所述″选择标记″、″选择标记基因″或“报道基因”在所述细胞中表达旨在促进鉴定和/或选择用本发明的核酸构建体转染或转化的细胞。这些标记基因能够通过一系列不同原理而鉴定核酸分子的成功转移。合适的标记可以选自赋予抗生素抗性或除草剂抗性、导入新代谢性状或允许目视选择的标记。选择标记基因的实例包括赋予抗生素抗性的基因(如使新霉素和卡那霉素磷酸化的nptII或使潮霉素磷酸化的hpt或赋予针对例如博来霉素、链霉素、四环素、氯霉素、氨苄青霉素、庆大霉素、遗传霉素(Geneticin)(G418)、壮观霉素或杀稻瘟菌素的抗性的基因)、赋予除草剂抗性的基因(例如提供抗性的bar;提供草甘膦抗性的aroA或gox或赋予针对例如咪唑啉酮、膦丝菌素或磺脲类的抗性的基因)或提供代谢性状的基因(如允许植物使用甘露糖作为唯一碳源的manA,或利用木糖的木糖异构酶,或抗营养性标记如2-脱氧葡萄糖抗性)。目视标记基因的表达导致颜色(例如β-葡糖苷酸酶、GUS或β-半乳糖苷酶与其有色底物例如X-Gal)、发光(如萤光素/萤光素酶系统)或荧光(绿色荧光蛋白GFP和其衍生物)的形成。这个名单仅代表少数的可能标记。技术人员熟悉此类标记。取决于生物和选择方法,优选不同的标记。
已知当核酸稳定或瞬时地整合至植物细胞时,仅少数细胞摄取了外来DNA,并且根据需要,将其整合至细胞的基因组中,这取决于所用的表达载体和所用的转染技术。为鉴定并选择这些整合子,编码选择标记的基因(如上文所述的基因)通常连同目的基因一起导入宿主细胞。这些标记可以在其中这些基因例如因常规方法引起的缺失而无功能的突变体中使用。此外,编码选择标记的核酸分子可以在包含编码本发明多肽或在本发明方法中所用多肽的序列的相同载体上,或在独立的载体上导入宿主细胞。已经用所导入核酸稳定转染的细胞可以通过选择进行鉴定(例如具有整合的选择标记的细胞存活而其他细胞死亡)。
因为所述标记基因,尤其抗生素抗性基因和除草剂抗性基因一旦成功地导入,则在转基因宿主细胞中是不再需要或不想要的,故而,用于导入核酸的本发明方法有利地使用能够去掉或切除这些标记基因的技术。一种这样的方法称作共转化法。共转化法同时使用两种载体用于转化,一种载体携带本发明的核酸而第二种载体携带标记基因。大比例的转化体接受或在植物情况下包含(多达40%或更多的转化体)这两种载体。在用农杆菌(Agrobacterium)转化的情况下,转化体通常仅接受载体的一部分,即侧翼存在T-DNA的序列,该序列通常代表表达盒。标记基因随后可以通过开展杂交从转化植物中除去。在另一种方法中,整合至转座子的标记基因用来与目的核酸一起进行转化(称作Ac/Ds技术)。转化体可以与转座酶来源杂交,或该转化体用导致转座酶表达的核酸构建体瞬时或稳定地转化。在一些情况下(大约10%),一旦转化已经成功发生,则转座子从宿主细胞基因组中跳出并丢失。在其他更多情况下,转座子跳至不同位置。在这些情况下,标记基因必须通过开展杂交消除。在微生物学中,开发了有可能或促进检测这类事件的技术。又一个有利的方法依赖于所谓重组系统;此方法的优势在于杂交消除作用可以用所述的重组系统实行。最知名的该类型系统称作Cre/lox系统。Cre1是除去位于loxP序列之间序列的重组酶。若所述标记基因整合在loxP序列之间,则它在转化已经成功发生时因重组酶表达而被除去。其他重组系统是HIN/HIX、FLP/FRT和REP/STB系统(Tribble等,J.Biol.Chem.,275,2000:22255-22267;Velmurugan等,J.Cell Biol.,149,2000:553-566)。有可能将本发明核酸序列以位点特异性方式整合至植物基因组。这些方法自然也可以应用至微生物如酵母、真菌或细菌。
转基因的/转基因/重组
为本发明的目的,“转基因的”、“转基因”或“重组”例如就核酸序列而言,意指包含所述核酸序列的表达盒、基因构建体或载体,或用本发明核酸序列、表达盒或载体转化的生物,这些构建体均通过重组方法产生,其中
(a)编码在本发明方法中有用的蛋白质的核酸序列,或
(b)与本发明核酸序列有效连接的基因调控序列,例如启动子,或
(c)a)和b)
不位于其天然遗传环境中或已经通过遗传操作方法被修饰,所述的修饰有可能采取例如替换、添加、倒位或插入一个或多个核苷酸残基的形式。天然遗传环境理解为意指原初植物中的天然基因组位点或染色体位点或存在于基因组文库中。在基因组文库的情况下,核酸序列的天然遗传环境优选地保留,至少部分保留。该环境分布在所述核酸序列的至少一侧并且具有至少50bp,优选至少500bp,特别优选至少1000bp,最优选至少5000bp序列长度。当天然存在的表达盒受非天然的合成(“人工”)方法(如诱变处理)被修饰时,天然存在的表达盒-例如所述核酸序列的天然启动子与编码在本发明方法中有用的多肽的相应核酸序列的天然存在组合,如上文所定义-变成转基因表达盒。合适方法例如在US 5,565,350或WO00/15815中描述。
为本发明目的,如上所述,将转基因植物因此理解为意指在本发明方法中有用的核酸不处于所述植物基因组中所述核酸的天然基因座处,所述核酸有可能同源或异源地表达。然而如所提及,转基因的还意指尽管本发明的或在本发明方法中有用的核酸处于植物基因组中所述核酸的天然位置处,然而其序列相对于天然序列而言已经被修饰,和/或所述天然序列的调节序列已经被修饰。转基因的优选地理解为意指本发明核酸在基因组的非天然基因座处表达,即所述核酸的同源表达或优选异源表达发生。优选的转基因植物在本文中提及。
转化
如本文中提及的术语“导入”或“转化”包括外源性多核苷酸转移至宿主细胞,无论转化所用的方法是什么方法。能够后续克隆性增殖(无论通过器官发生或胚发生)的植物组织可以用本发明的基因构建体转化并且完整植物可以从中再生。所选的具体组织根据可用于并且最适于正在进行转化的具体物种的克隆性增殖系统变化。示例性靶组织包括叶盘、花粉、胚、子叶、下胚轴、大配子体、愈伤组织、现存分生组织(例如顶端分生组织、腋芽和根分生组织)和诱导性分生组织(例如子叶分生组织和下胚轴分生组织)。多核苷酸可以瞬时或稳定地导入宿主细胞并且可以非整合地维持,例如作为质粒。备选地,它可以整合至宿主基因组。所得的转化植物细胞随后可以用来按照本领域技术人员已知的方式再生出转化植物。
将外来基因转移至植物基因组的过程称作转化。转化植物物种现在是极为常规的技术。有利地,几种转化方法中的任一种方法可以用来将目的基因导入合适的祖先细胞。用于转化并从植物组织或植物细胞再生出植物的方法可以用于瞬时转化或稳定转化。转化方法包括使用脂质体、电穿孔法、提高游离DNA摄入的化学品、DNA直接注射至植物、粒子枪轰击法、使用病毒或花粉的转化法和显微投射法(microprojection)。转化方法可以选自用于原生质体的钙/聚乙二醇法(Krens,F.A.等,(1982)Nature 296,72-74;Negrutiu I等(1987)Plant Mol Biol 8:363-373);原生质体的电穿孔法(Shillito R.D.等(1985)Bio/Technol 3,1099-1102);对植物材料的微注射法(Crossway A等,(1986)Mol.Gen Genet 202:179-185);DNA或RNA包被的粒子轰击法(Klein TM等,(1987)Nature 327:70)、(非整合性)病毒感染法等。包括转基因作物植物在内的转基因植物优选通过农杆菌介导的转化法产生。有利的转化方法是植物内(in planta)转化法。为此目的,例如有可能将农杆菌作用在植物种子上或有可能用农杆菌接种植物的分生组织。根据本发明,已经证明特别有利的是将转化的农杆菌悬液作用于完整植物或至少作用于花原基。随后继续培育植物直至获得处理的植物的种子(Clough和Bent,Plant J.(1998)16,735-743)。用于农杆菌介导稻转化的方法包括用于稻转化的众知方法,如在以下任意文献中描述的那些方法:欧洲专利申请EP 1198985A1,Aldemita和Hodges(Planta 199:612-617,1996);Chan等(Plant Mol Bioi 22(3):491-506,1993),Hiei等(Plant J 6(2):271-282,1994),其公开内容如充分所述那样通过引用的方式并入本文。在玉米转化的情况下,优选的方法如Ishida等(Nat.Biotechnol14(6):745-50,1996)或Frame等(Plant Physiol 129(1):13-22,2002)描述,其公开内容如充分所述那样通过引用的方式并入本文。所述方法还例如由B.Jenes等,Techniques for Gene Transfer,在:Transgenic Plants,第1卷,Engineering and Utilization,编者S.D.Kung和R.Wu,AcademicPress(1993)128-143及在Potrykus Annu.Rev.Plant Physiol.Plant Molec.Biol.42(1991)205-225)描述。待表达的核酸或构建体优选地克隆至适于转化根癌农杆菌(Agrobacterium tumefaciens)的载体,例如pBin19(Bevan等,Nucl.Acids Res.12(1984)8711)。通过这种载体转化的农杆菌随后可以按照已知方式用于转化植物,例如作为模型使用的植物如拟南芥属植物(拟南芥属于本发明的范围,不视为作物植物),或作物植物,例如烟草植物,所述方式例如是通过将擦伤的叶或切碎的叶浸泡在农杆菌溶液中并随后将它们在合适培养基中培育。植物的根癌农杆菌转化法例如由和Willmitzer在Nucl.Acid Res.(1988)16,9877中描述或尤其从F.F.White,Vectors for Gene Transfer in Higher Plants;在Transgenic Plants,第1卷,Engineering and Utilization,编者S.D.Kung和R.Wu,AcademicPress,1993,第15-38页中获知。
除了转化随后必需再生成完整植物的体细胞之外,还可转化植物分生组织的细胞,并且尤其是发育成配子的那些细胞。在这种情况下,转化的配子遵循天然植物发育过程,从而产生转基因植物。因此,例如用农杆菌处理拟南芥属植物的种子并且从发育植物中获得种子,其中一定比例的所述发育植物被转化并且因此是转基因的[Feldman,KA和Marks MD(1987)Mol Gen Genet 208:274-289;Feldmann K(1992)。在:编者C Koncz,N-H Chua和J Shell,Methods in Arabidopsis Research.Word Scientific,Singapore,第274-289页]。替代方法基于反复除去花序并使莲座丛中心的切除部位与转化的农杆菌温育,因而同样可以在较晚的时间点上获得转化的种子(Chang(1994)Plant J.5:551-558;Katavic(1994)Mol Gen Genet,245:363-370)。然而,特别有效的方法是改良真空渗入法,如“花器浸蘸”法。在拟南芥属植物真空渗入法的情况下,在减压下用农杆菌悬液处理完整植物[Bechthold,N(1993)。C R Acad Sci Paris Life Sci,316:1194-1199],而在”花器浸蘸法”的情况下,将正在发育的花组织与经表面活性剂处理的农杆菌悬液短暂温育[Clough,SJ和Bent,AF(1998)The Plant J.16,735-743]。在这两种情况下均收获某个比例的转基因种子,并且这些种子可以通过在如上所述的选择条件下培育与非转基因种子区分。此外,质体的稳定转化是有利的,因为质体在大部分作物中母系地遗传,这降低或消除了转基因经花粉的流动风险。叶绿体基因组的转化一般通过在Klaus等,2004[Nature Biotechnology 22(2),225-229]中已示意性展示的方法实现。简而言之,将待转化的序列连同选择标记基因一起克隆至同源于叶绿体基因组的侧翼序列之间。这些同源侧翼序列指导进入原质体的位点特异性整合。已经对众多不同植物物种描述了质体转化并且Bock(2001)基础研究和植物生物技术中的转基因质体(Transgenic plastids in basic research andplant biotechnology)。J Mol Biol.2001年9月21日;312(3):425-38或Maliga,P(2003)质体转化技术商业化进展(Progress towardscommercialization of plastid transformation technology),TrendsBiotechnol.21,20-28进行了综述。其他生物技术进展最近已经以无标记质体转化体的形式进行报道,其中所述的无标记质体转化体可以通过瞬时共整合性标记基因产生(Klaus等,2004,Nature Biotechnology 22(2),225-229)。
T-DNA活化标签技术(T-DNA activation tagging)
T-DNA活化标签技术(Hayashi等Science(1992)1350-1353)涉及通常含有启动子(也可以是翻译增强子或内含子)的T-DNA在目的基因的基因组区域内或基因的编码区上游或下游10kb处以这样的方式插入,使得启动子指导靶向的基因表达。一般,靶向基因的天然启动子对该靶向基因表达的调节被破坏,并且所述基因处于新导入的启动子控制下。该启动子一般嵌入T-DNA中。这种T-DNA随机地插入植物基因组,例如借助农杆菌感染,并且导致在插入的T-DNA附近的基因表达受到调节。所得的转基因植物因在导入的启动子附近的基因表达受到调节而显示显性表型。
TILLING
术语“TILLING”是基因组中定向诱导的局部损伤法的缩写并且指用于产生和/或鉴定核酸的诱变技术,其中所述的核酸编码具有改良表达和/或活性的蛋白质。TILLING还允许选择携带此类突变变体的植物。这些突变变体可以表现在强度或在位置或在时间方面改良的表达(例如若所述突变影响启动子)。这些突变变体可以显示比其天然形式基因所表现活性更高的活性。TILLING将高密度诱变与高通量筛选方法组合。在TILLING中一般遵循的步骤是:(a)EMS诱变(Redei GP和Koncz C(1992)在Methodsin Arabidopsis Research,Koncz C,Chua NH,Schell J,Singapore编辑,World Scientific Publishing Co,第16-82页;Feldmann等,(1994)在Meyerowitz EM,Somerville CR编辑,Arabidopsis.Cold Spring HarborLaboratory Press,Cold Spring Harbor,NY,第137-172页;Lightner J和Caspar T(1998)在J Martinez-Zapater,J Salinas编者,Methods onMolecular Biology第82卷.Humana Press,Totowa,NJ,第91-104页);(b)个体的DNA制备和汇集;(c)目的区域的PCR扩增;(d)变性和复性以使得异双链体形成;(e)DHPLC,其中异双链体在汇集物中的存在作为色谱图中一个额外的峰被检测到;(f)鉴定突变个体;和(g)对突变PCR产物的测序。用于TILLING的方法是本领域熟知的(McCallum等,(2000)NatBiotechnol 18:455-457;综述见Stemple(2004)Nat Rev Genet 5(2):145-50)。
同源重组
同源重组允许在基因组中限定的选择位置处导入选择的核酸。同源重组是在生物科学中例行用于低等生物如酵母或小立碗藓属(Physcomitrella)苔藓的标准技术。已经对模式植物(Offringa等(1990)EMBO J 9(10):3077-84)和作物植物例如稻(Terada等(2002)NatBiotech 20(10):1030-4;Iida和Terada(2004)Curr Opin Biotech 15(2):132-8)描述了用于开展植物中同源重组的方法,并且存在与靶生物无关而通常适用的方法(Miller等,Nature Biotechnol.25,778-785,2007)。
产量
术语“产量”通常意指经济价值的可测量结果,一般与特定作物、与面积并与时间段有关。单个植物部分基于它们的数目、大小和/或重量而直接有助于对产量,或实际产量是对于某种作物和一年的每平方米产量,这通过总产量(包括收获的和评估的产量)除以种植的平方米数而确定。术语植物的“产量”可以涉及该植物的营养生物量(根和/或苗生物量)、涉及繁殖器官和/或涉及繁殖体(如种子)。
早期生长势
“早期生长势”指活跃、健康、充分平衡的生长,尤其是植物生长早期期间,并且可以因植物适应性提高引起,其中所述的植物适应性提高原因在于例如该植物更好地适应环境(即优化能量来源利用和苗与根之间的分配)。具有早期生长势的植物也显示籽苗存活提高和作物建立更佳,这往往产生高度均一的田块(作物以均一方式生长,即大多数植物在基本上相同的时间达到各个发育期)和往往形成更好及更高的产量。因而,早期生长势可以通过测量多种因子如千粒核重(Thousand Kernel Weight)、萌发百分数、出苗百分数、籽苗生长、籽苗高度、根长度、根和苗生物量和众多其他因素等确定。
提高/改善/增强
术语“提高”、“改善”或“增强”是相互可交换的并且在应用含义上应当意指与如本文中定义的对照植物相比较,至少3%、4%、5%、6%、7%、8%、9%或10%、优选至少15%或20%、更优选地25%、30%、35%或40%更多的产量和/或生长。
种子产量
提高的种子产量自身可以表现为以下一个或多个指标:a)种子生物量(种子总重量)增加,这可以基于单粒种子基础和/或每株植物和/或每平方米;b)提高的每株植物花数目;c)提高的(充实)种子数;d)提高的种子充实率(其表述为充实种子数与种子总数之间的比率);e)提高的收获指数,其表述为可收获部分(如种子)产量与总生物量的比率;和f)提高的千粒核重(TKW),这从计数的充实种子数及其总重量中外推出来。提高的TKW可以因提高的种子大小和/或种子重量所致,并且也可以因胚和/或胚乳大小的提高所致。
种子产量的提高也可以表现为种子大小和/或种子体积的增长。此外,种子产量的提高自身也可以表现为种子面积和/或种子长度和/或种子宽度和/或种子周长的提高。提高的产量也可以产生改良的构造,或可以因改良的构造而出现。
绿度指数(greenness index)
从植物的数字图像计算如本文中所用的“绿度指数”。对属于图像上植物目标的每个像素计算绿色值与红色值的比率(在编码颜色的RGB模式中)。绿度指数表述为绿色/红色比超过给定阈值的像素百分数。在正常生长条件下,在盐胁迫生长条件下和在营养可用性降低的生长条件下,在开花前的最后成像中测量植物的绿度指数。相反,在干旱胁迫生长条件下,在干旱后的首次成像中测量植物的绿度指数。
植物
如本文中所用的术语“植物”包括完整植物、植物的祖先及后代和包括种子、苗、茎、叶、根(包括块茎)、花和组织、器官在内的植物部分,其中每种前述对象包含目的基因/核酸。术语“植物”也包括植物细胞、悬浮培养物、愈伤组织、胚、分生组织区、配子体、孢子体、花粉和小孢子,同样每种前述对象包含目的基因/核酸。
在本发明方法中特别有用的植物包括属于植物界(Viridiplantae)超家族、尤其单子叶和双子叶植物的全部植物,包括饲用或饲料豆科植物、观赏植物、粮食作物、树或灌木,其中所述植物选自包含以下物种的名单:槭树属物种(Acer spp.)、猕猴桃属物种(Actinidia spp.)、秋葵属物种(Abelmoschus spp.)、剑麻(Agave sisalana)、冰草属物种(Agropyron spp.)、匍匐剪股颖(Agrostis stolonifera)、葱属物种(Allium spp.)、苋属物种(Amaranthus spp.)、欧洲海滨草(Ammophila arenaria)、风梨(Ananascomosus)、番荔枝属物种(Annona spp.)、旱芹(Apium graveolens)、蜘蛛兰属物种(Arachis spp.)、木波罗属物种(Artocarpus spp.)、石刁柏(Asparagusofficinalis)、燕麦属物种(Avena spp.)(例如燕麦(燕麦])、野燕麦(Avenafatua)、比赞燕麦(Avena byzantina)、Avena fatua var.sativa、杂种燕麦(Avenahybrida)、阳桃(Averrhoa carambola)、箣竹属(Bambusa sp.)、冬瓜(Benincasahispida)、巴西栗(Bertholletia excelsea)、甜菜(Beta vulgaris)、芸苔属物种(Brassica spp.)(例如欧洲油菜(欧洲油菜)、芜青物种(Brassica rapa ssp.)[卡诺拉油菜、油菜(oilseed rape)、蔓青(turnip rape)])、Cadaba.farinosa、茶(Camellia sinensis)、美人蕉(Canna indica)、大麻(Cannabis sativa)、辣椒属物种(Capsicum spp.)、Carex elata、番木瓜(Carica papaya)、大果假虎刺(Carissa macrocarpa)、山核桃属物种(Carya spp.)、红花(Carthamustinctorius)、栗属物种(Castanea spp.)、美洲木棉(Ceiba pentandra)、苦苣(Cichorium endivia)、樟属物种(Cinnamomum spp.)、西瓜(Citrullus lanatus)、柑桔属物种(Citrus spp.)、椰子属物种(Cocos spp.)、咖啡属物种(Coffea spp.)、芋头(Colocasia esculenta)、非洲梧桐属物种(Cola spp.)、黄麻属(Corchorussp.)、芫荽(Coriandrum sativum)、榛属物种(Corylus spp.)、山楂属物种(Crataegus spp.)、番红花(Crocus sativus)、南瓜属物种(Cucurbita spp.)、香瓜属物种(Cucumis spp.)、菜蓟属物种(Cynara spp.)、胡萝卜(Daucus carota)、山马蝗属物种(Desmodium spp.)、龙眼(Dimocarpus longan)、薯蓣属物种(Dioscorea spp.)、柿树属物种(Diospyros spp.)、稗属物种(Echinochloa spp.)、油棕属(Elaeis)(例如油棕(油棕)、美洲油棕Elaeis(oleifera))、穇子(Eleusinecoracana)、蔗茅属物种(Erianthus sp.)、枇杷(Eriobotrya japonica)、桉属物种(Eucalyptus sp.)、红仔果(Eugenia uniflora)、荞麦属物种(Fagopyrumspp.)、水青冈属物种(Fagus spp.)、苇状羊茅(Festuca arundinacea)、无花果(Ficus carica)、金桔属物种(Fortunella spp.)、草莓属物种(Fragaria spp.)、银杏(Ginkgo biloba)、大豆属(Glycine spp.)(例如大豆、大豆(Soja hispida)或大豆(Soja max))、陆地棉(Gossypium hirstum)、向日葵属(Helianthusspp.)(例如向日葵(Helianthus annuus))、长管萱草(Hemerocallis fulva)、木槿属物种(Hibiscus spp.)、大麦属(Hordeum spp.)(例如大麦(Hordeumvulgare))、甘薯(Ipomoea batatas)、核桃属物种(Juglans spp.)、莴苣(Lactucasativa)、山黧豆属物种(Lathyrus spp.)、兵豆(Lens culinaris)、亚麻(Linumusitatissimum)、荔枝(Litchi chinensis)、百脉根属物种(Lotus spp.)、棱角丝瓜(Luffa acutangula)、羽扇豆属物种(Lupinus spp.)、Luzula sylvatica、番茄属(Lycopersicon spp.)(例如番茄(Lycopersicon esculentum、Lycopersiconlycopersicum、Lycopersicon pyriforme))、硬皮豆属物种(Macrotyloma spp.)、苹果属物种(Malus spp.)、凹缘金虎尾(Malpighia emarginata)、牛油果(Mammea americana)、芒果(Mangifera indica)、木薯属物种(Manihot spp.)、人心果(Manilkara zapota)、苜蓿(Medicago sativa)、草木樨属物种(Melilotusspp.)、薄荷属物种(Mentha spp.)、芒(Miscanthus sinensis)、苦瓜属物种(Momordica spp.)、黑桑(Morus nigra)、芭蕉属物种(Musa spp.)、烟草属物种(Nicotiana spp.)、木犀榄属物种(Olea spp.)、仙人掌属物种(Opuntia spp.)、鸟足豆属物种(Ornithopus spp.)、稻属(Oryza spp.)(例如稻、阔叶稻(Oryzalatifolia))、稷(Panicum miliaceum)、柳枝稷(Panicum virgatum)、鸡蛋果(Passiflora edulis)、欧防风(Pastinaca sativa)、狼尾草属物种(Pennisetumsp.)、鳄梨属物种(Persea spp.)、欧芹(Petroselinum crispum)、虉草(Phalarisarundinacea)、菜豆属物种(Phaseolus spp.)、猫尾草(Phleum pratense)、刺葵属物种(Phoenix spp.)、南方芦苇(Phragmites australis)、酸浆属物种(Physalis spp.)、松属物种(Pinus spp.)、阿月浑子(Pistacia vera)、豌豆属物种(Pisum spp.)、早熟禾属物种(Poa spp.)、杨属物种(Populus spp.)、牧豆草属物种(Prosopis spp.)、李属物种(Prunus spp.)、番石榴属物种(Psidiumspp.)、石榴(Punica granatum)、西洋梨(Pyrus communis)、栎属物种(Quercusspp.)、萝卜(Raphanus sativus)、波叶大黄(Rheum rhabarbarum)、茶蔗子属物种(Ribes spp.)、蓖麻(Ricinus communis)、悬钩子属物种(Rubus spp.)、甘蔗属物种(Saccharum spp.)、柳属物种(Salix sp.)、接骨木属物种(Sambucusspp.)、黑麦(Secale cereale)、胡麻属物种(Sesamum spp.)、白芥属物种(Sinapissp.)、茄属(Solanum spp.)(例如马铃薯(Solanum tuberosum)、红茄(Solanumintegrifolium)或番茄(Solanum lycopersicum))、两色蜀黍(Sorghum bicolor)、菠菜属物种(spinacia spp.)、蒲桃属物种(Syzygium spp.)、万寿菊属物种(Tagetes spp.)、酸豆(Tamarindus indica)、可可树(Theobroma cacao)、车轴草属物种(Trifolium spp.)、鸭茅状摩擦禾(Tripsacum dactyloides)、Triticosecale rimpaui、小麦属(Triticum spp.)(例如普通小麦(Triticumaestivum)、硬粒小麦(Triticum durum)、圆柱小麦(Triticum turgidum)、Triticum hybernum、马卡小麦(Triticum macha)、普通小麦(Triticumsativum)或普通小麦(Triticum vulgare))、小金莲花(Tropaeolum minus)、金莲花(Tropaeolum majus)、越桔属物种(Vaccinium spp.)、野碗豆属物种(Viciaspp.)、豇豆属物种(Vigna spp.)、香堇(Viola odorata)、葡萄属物种(Vitis spp.)、玉米(Zea mays)、Zizania palustris、枣属物种(Ziziphus spp.)及其他。
发明详述
I.NAP
根据第一个实施方案,本发明提供了相对于对照植物用于提高植物中非生物胁迫耐受性的方法,包括调节植物中编码NAP1样多肽的核酸表达。
用于调节(优选提高)编码NAP1样多肽的核酸表达的优选方法是在植物中导入并表达编码NAP1样多肽的核酸。
下文任一谈及的“在本发明方法中使用的蛋白质”意指如本文中定义的NAP1样多肽,任一谈及的“在本发明方法中使用的核酸”意指能够编码这种NAP1样多肽的核酸。待导入植物(并且因而在实施本发明方法中使用)的核酸是编码现在所描述的蛋白质类型的任意核酸,下文也称作“NAP1样核酸”或“NAP1样基因”。
如本文中定义的术语“NAP1样蛋白”指包含NAP结构域和酸性羧基端区域的任意蛋白质。如本文中所用的术语“NAP结构域”是如Pfam数据库中登录号PF00956定义的(英国Sanger研究所维护的数据库;Bateman等,Nucleic Acids Research 30(1):276-280(2002),例如见表3)。优选地,在本发明中使用的NAP1样蛋白序列具有NAP结构域,该结构域包含(T/S)FF(T/N/S/E/D)(W/F)(L/F)标签(SEQ ID NO:33)和/或SEQ ID NO:34中给出的保守氨基酸序列。优选地,SEQ ID NO:33的标签是SFF(T/N/S)(W/F)F。优选地,在本发明方法中使用的NAP1样蛋白的NAP结构域以增加的优选顺序与SEQ ID NO:32具有至少20%、25%、30%、35%、40%、45%序列同一性。更优选地,在本发明方法中使用的NAP1样蛋白的NAP结构域以增加的优选顺序与SEQ ID NO:32具有至少50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%、99%序列同一性。最优选地,该NAP结构域是如SEQ ID NO:32所描述。如本文中所用的术语“酸性羧基端区域”或“酸性羧基端”指蛋白质的羧基末端,其中所述的羧基末端长约20-25个氨基酸,这些氨基酸中至少13个残基是谷氨酸和/或天冬氨酸。
表3:拟南芥属植物的包含NAP1结构域的蛋白质的实例
基因ID | Pfam的描述 | 位置 | 评分 | e-值 | SEQ ID NO: |
at1g18800 | PF00956 | 27-224 | 147.7 | 2e-40 | 20,21 |
at1g74560 | PF00956 | 31-229 | 135.0 | 1.3e-36 | 1,2 |
at2g19480 | PF00956 | 52-300 | 457.4 | 1.2e-133 | 26,27 |
at5g56950 | PF00956 | 52-300 | 473.2 | 2.2e-138 | 28,29 |
at4g26110 | PF00956 | 52-301 | 503.4 | 1.7e-147 | 24,25 |
at3g13782 | PF00956 | 69-311 | 300.7 | 1.7e-86 | 30,31 |
此外,NAP1样多肽(至少在其天然形式中)具有PP2a磷酸酶抑制活性。用于测量PP2a磷酸酶抑制活性的手段和技术是本领域熟知的,例如见Li等,J.Biol.Chem.271,11059-11062和其中参考文献。可以按照几种方式分析染色质再塑造活性,如在凝胶滞留分析法中测量DNA结合活性(Fan等,2002)或如使用ELISA测量组蛋白结合活性(Rodriguez等(1997)Genomics 44,253-265)。可以在连接酶介导的环化测定法(Fan等,2002)或超级螺旋测定法(Fujii-Nakata等(1992)J.Biol.Chem.267,20980-20986;Yoon等(1995),Mol.Gen.Gen.249,465-473)中确定DNA弯曲活性。实施例6中提供了表征NAP1样蛋白质的进一步指南。
优选地,在构建系统发生树如图4中所绘制的系统发生树时使用的多肽序列与包含由SEQ ID NO:2所代表的氨基酸序列的NAP1样多肽组而不与任何其他组聚类。
术语“结构域”和“基序”在本文中的“定义”部分定义。存在用于鉴定结构域的专业数据库,例如,SMART(Schultz等(1998)Proc.Natl.Acad.Sci.USA 95,5857-5864;Letunic等(2002)Nucleic Acids Res 30,242-244)、InterPro(Mulder等,(2003)Nucl.Acids.Res.31,315-318)、Prosite(Bucher和Bairoch(1994),用于生物分子序列基序的概括特征结构及其在自动化序列解读中的功能(A generalized profile syntax for biomolecular sequencesmotifs and its function in automatic sequence interpretation).(在)ISMB-94;第二届分子生物学智能系统国际会议文集.Altman R.,BrutlagD.,Karp P.,Lathrop R.,Searls D.编辑,第53-61页,AAAIPress,MenloPark;Hulo等,Nucl.Acids.Res.32:D134-D137,(2004)或Pfam(Bateman等,Nucleic Acids Research 30(1):276-280(2002))。一组用于计算机方式分析蛋白质序列的工具可在ExPASY蛋白质组服务器上获得(瑞士生物信息研究所维护(Gasteiger等,ExPASy:深入认识和分析蛋白质的蛋白质组服务器,Nucleic Acids Res.31:3784-3788(2003))。结构域也可以使用常规技术如通过序列比对进行鉴定。
分析SMART数据库中SEQ ID NO:2的多肽序列,揭示存在NAP结构域(PFAM登录号PF0059,图1)。这个结构域是NAP蛋白特有的,其中所述的NAP蛋白推测参与移动组蛋白至胞核、核小体装配和染色质流动性。通过SEQ ID NO:2的序列与其他NAP1样蛋白的序列比对,可以确定NAP结构域的定位。
用于比对序列以进行比较的方法是本领域熟知的,此类方法包括GAP、BESTFIT、BLAST、FASTA和TFASTA。GAP使用Needleman和Wunsch算法((1970)J Mol Biol 48:443-453)以找到使匹配数最大化并使空位数最小化的两个序列的总体(即覆盖完整序列的)比对结果。BLAST算法(Altschul等(1990)J Mol Biol 215:403-10)计算序列同一性百分数并在两个序列之间开展相似性的统计分析。用于执行BLAST分析的软件是通过国家生物技术信息中心(NCBI)可公开获得的。同源物可以使用例如ClustalW多重序列比对算法(1.83版本),以默认配对比对参数和百分数评分方法轻易地鉴定。相似性和同一性的总体百分数也可以使用MatGAT软件包中的可用方法之一确定(Campanella等,BMC Bioinformatics.2003年7月10日;4:29.MatGAT:使用蛋白质序列或DNA序列产生相似性/同一性矩阵的一种应用)。如本领域技术人员显而易见,可以进行少许手工编辑以优化保守基序之间的比对结果。此外,作为使用全长序列以鉴定同源物的替代,也可以使用特定结构域。对于局部比对,Smith-Waterman算法是特别有用的(Smith TF,Waterman MS(1981)J.Mol.Biol 147(1);195-7)。在下文实施例3中表述为百分数的序列同一性值利用上文提及的程序,使用默认参数在完整核酸或氨基酸序列范围和/或在所选择的结构域或保守基序范围内确定。
本发明通过用SEQ ID NO:1所代表的核酸序列转化植物进行说明,其中所述的核酸序列编码SEQ ID NO:2的多肽序列。然而,本发明的实施不限于这些序列;本发明的方法可以有利地使用编码NAP1样的任意核酸或如本文中定义的NAP1样多肽实施。
编码NAP1样多肽的核酸的实例在本文实施例1的表A中给出。此类核酸用于实施本发明的方法中。在实施例1的表A中给出的氨基酸序列是由SEQ ID NO:2所代表的NAP1样多肽的直向同源物和旁系同源物的示例序列,术语“直向同源物”和“旁系同源物”如本文中定义。其他直向同源物和旁系同源物可以通过开展所谓交互性blast搜索轻易地鉴定。通常,这包括第一BLAST,其中所述的第一BLAST包括将查询序列(例如使用实施例1的表A中列出的任意序列)针对任意序列数据库,如可公开获得的NCBI数据库进行BLAST。当从核苷酸序列开始时,一般使用BLASTN或TBLASTX(使用标准默认值),并且当从蛋白质序列开始时,使用BLASTP或TBLASTN(使用标准默认值)。可以任选地筛选BLAST结果。随后提交筛选结果或非筛选结果的全长序列以针对来自生物的序列进行反向BLAST搜索(第二BLAST),其中查询序列从所述的生物中衍生。筛选结果或非筛选结果的全长序列随后针对来自生物的序列进行反向BLAST(第二BLAST),其中所述查询序列从所述生物衍生(在查询序列是SEQ ID NO:1或SEQ ID NO:2的情况下,所述第二BLAST因而将针对拟南芥属植物的序列进行)。随后比较第一BLAST和第二BLAST的结果。若来自第一blast的高阶位命中源自与衍生查询序列的物种相同的物种,则鉴定到旁系同源物,反向BLAST随后理想地在最高命中当中产生该查询序列;若高阶位命中不是源自与衍生查询序列的物种相同的物种,则鉴定到直向同源物,并且优选地在反向BLAST时,在最高命中当中产生该查询序列。
高阶位命中是具有低E-值的那些命中。E-值越低,评分越显著(或换句话说,偶然发现该命中的几率越低)。E-值的计算是本领域熟知的。除了E-值外,也通过同一性百分数评分来进行比较。同一性百分数指两个所比较的核酸(或多肽)序列之间特定长度范围内相同的核苷酸(或氨基酸)的数目。在大型家族的情况下,可以使用ClustalW,随后使用邻接树法,以帮助观察相关基因的聚集和鉴定直向同源物和旁系同源物。
核酸变体也可以用于实施本发明的方法中。此类变体的实例包括编码在实施例1的表A中所给出任一氨基酸序列的同源物和衍生物的核酸,术语“同源物”和“衍生物”如本文中定义。还在本发明方法中使用的是这样的核酸,其编码在实施例1的表A中所给出任一氨基酸序列的直向同源物或旁系同源物的同源物和衍生物。在本发明方法中使用的同源物和衍生物与衍生它们的未修饰蛋白质具有基本上相同的生物学活性和功能活性。
在实施本发明方法中有用的其他核酸变体包括编码NAP1样多肽的核酸的部分、与编码NAP1样多肽的核酸杂交的核酸、编码NAP1样多肽的核酸的剪接变体、编码NAP1样多肽的核酸的等位变体和通过基因改组获得的编码NAP1样多肽的核酸的变体。术语“杂交序列”、“剪接变体”、“等位变体”和“基因改组作用”如本文中所述。
编码NAP1样多肽的核酸无需是全长核酸,因为实施本发明方法不依赖于使用全长核酸序列。根据本发明,提供了用于提高植物中非生物胁迫抗性的方法,包括在植物中导入并表达实施例1的表A中给出的任一核酸序列的一部分或编码在实施例1表A中所给出任一氨基酸序列的直向同源物、旁系同源物或同源物的核酸的一部分。
核酸的一部分可以例如通过对所述核酸产生一个或多个缺失而制备。所述部分可以以分离的形式使用或它们可以与其他编码(或非编码)序列融合,例如旨在产生联合几种活性的蛋白质。与其他编码序列融合时,在翻译时所产生的所得多肽可以比对于该蛋白质部分所预测的多肽更大。
在本发明方法中使用的部分编码如本文中定义的NAP1样多肽,并且基本上具有如实施例1的表A中所给出氨基酸序列相同的生物学活性。优选地,此部分是在实施例1的表A中给出的任一核酸的一部分,或是编码在实施例1的表A中所给出任一氨基酸序列的直向同源物或旁系同源物的核酸的一部分。优选地,所述部分的长度以增加的优选顺序是至少400,500,600或700个连续核苷酸,所述连续核苷酸为实施例1的表A中给出的任一核酸序列或为编码在实施例1的表A中所给出任一氨基酸序列的直向同源物或旁系同源物的核酸。最优选地,所述部分是SEQ ID NO:1的核酸的一部分。优选地,所述部分编码包含(本文所定义的任意一个或多个结构域或基序)的氨基酸序列。优选地,所述部分编码这样的氨基酸序列,当在构建系统发生树中使用时,所述氨基酸序列总是与包含由SEQ ID NO:2所代表的氨基酸序列的NAP1样多肽组而不与任何其他组聚类。
在本发明方法中使用的另一种核酸变体是能够在降低的严格条件下、优选在严格条件下与编码如本文中定义的NAP1样多肽的核酸或与如本文中定义的部分杂交的核酸。
根据本发明,提供了用于提高植物的非生物胁迫抗性的方法,包括在植物中导入并表达能够与实施例1的表A中给出的任一核酸杂交的核酸,或包括在植物中导入并表达这样的核酸,其中所述核酸能够与编码在实施例1的表A中给出的任意核酸序列的直向同源物、旁系同源物或同源物的核酸杂交。
在本发明方法中使用的杂交序列编码如本文中定义的NAP1样多肽,并且基本上具有如实施例1的表A中所给出氨基酸序列相同的生物学活性。优选地,所述杂交序列能够与实施例1的表A中给出的任一核酸或与这些序列中任意序列的一部分杂交,所述的一部分如上文定义,或其中所述杂交序列能够与编码在实施例1的表A中给出的任一氨基酸序列的直向同源物或旁系同源物的核酸杂交。最优选地,所述杂交序列能够与如SEQID NO:1所代表的核酸或与其一部分杂交。优选地,所述杂交序列编码了包含如本文定义的任意一个或多个基序或结构域的氨基酸序列。优选地,所述杂交序列编码这样的氨基酸序列,当在构建系统发生树中使用时,所述氨基酸序列总是与包含由SEQ ID NO:2所代表的氨基酸序列的NAP1样多肽组而不与任何其他组聚类。
在本发明方法中使用的另一种核酸变体是编码如上文所定义的NAP1样多肽的剪接变体,剪接变体如本文中定义。
根据本发明,提供了用于提高植物的非生物胁迫抗性的方法,包括在植物中导入并表达在实施例1的表A中给出的任一核酸序列的剪接变体,或导入并表达编码在实施例1的表A中所给出任一氨基酸序列的直向同源物、旁系同源物或同源物的核酸的剪接变体。
优选的剪接变体是由SEQ ID NO:1所代表的核酸的剪接变体,或是编码SEQ ID NO:2的直向同源物或旁系同源物的核酸的剪接变体。优选地,由所述剪接变体编码的氨基酸序列包含如本文中定义的任意一个或多个基序或结构域。优选地,由所述剪接变体编码的氨基酸序列在构建系统发生树中使用时,总是与包含由SEQ ID NO:2所代表的氨基酸序列的NAP1样多肽组而不与任何其他组聚类。
在本发明方法中使用的另一种核酸变体是编码如上文所定义的NAP1样多肽的核酸的等位变体,等位变体如本文中定义。
根据本发明,提供了用于提高植物的非生物胁迫抗性的方法,包括在植物中导入并表达在实施例1的表A中给出的任一核酸的等位变体,或包括在植物中导入并表达编码在实施例1的表A中所给出任一氨基酸序列的直向同源物、旁系同源物或同源物的核酸的等位变体。
在本发明方法中使用的等位变体基本上具有如SEQ ID NO:2的NAP1样多肽和实施例1的表A中所述任意氨基酸序列相同的生物学活性。等位变体天然存在,并且在本发明的方法中包括这些天然等位基因的用途。优选地,所述等位变体是SEQ ID NO:1的等位变体或编码SEQ ID NO:2的直向同源物或旁系同源物的核酸的等位变体。优选地,由所述等位变体编码的氨基酸序列包含如本文中定义的任意一个或多个基序或结构域。优选地,由所述等位变体编码的氨基酸序列在构建系统发生树中使用时,总是与包含由SEQ ID NO:2所代表的氨基酸序列的NAP1样多肽组而不与任何其他组聚类。
基因改组或定向进化也可以用来产生编码如上文定义的NAP1样多肽的核酸的变体;术语“基因改组”如本文中定义。
根据本发明,提供了用于提高植物的非生物胁迫抗性的方法,包括在植物中导入并表达在实施例1的表A中给出的任一核酸序列的变体,或包括在植物中导入并表达核酸的变体,所述的核酸编码在实施例1的表A中给出的任一氨基酸序列的直向同源物、旁系同源物或同源物,其中所述的变异核酸通过基因改组获得。
优选地,通过基因改组获得的变异核酸编码了包含如本文定义的任意一个或多个基序或结构域的氨基酸序列。优选地,由通过基因改组获得的变异核酸所编码的氨基酸序列在构建系统发生树中使用时,总是与包含由SEQ ID NO:2所代表的氨基酸序列的NAP1样多肽组而不与任何其他组聚类。
另外,核酸变体也可以通过位点定向诱变获得。几种方法可用于实现位点定向诱变,最常见的是基于PCR的方法(Current Protocols inMolecular Biology.Wiley编辑)。
编码NAP1样多肽的核酸可以衍生自任何天然来源或人工来源。该核酸可以通过人类有意操作,在组成和/或基因组环境方面从其天然形式中修饰而来。优选地,编码NAP1样多肽的核酸来自植物,还优选来自双子叶植物,更优选来自十字花科(Brassicaceae)、更优选来自拟南芥属,最优选地来自拟南芥。
本发明方法的实施产生了与非生物胁迫下培育时的对照植物相比较,具有提高的非生物胁迫抗性(或非生物胁迫耐受性,所述术语可相互交换地使用)的植物,所述提高的非生物胁迫抗性作为增强的产量相关性状实现。尤其,本发明方法的实施产生了相对于对照植物而言,具有提高的产量、尤其提高的种子产量的植物。术语“产量”和“种子产量”在本文的“定义”部分中更详细地描述。然而,应当指出术语“产量相关性状”不包括植物细胞的代谢物含量并且增强的产量相关性状是提高的胁迫抗性的结果。
本文谈及的增强的产量相关性状意指植物的一个或多个部分的生物量(重量)增加,所述的部分可以包括地上(可收获的)部分和/或(可收获的)地下部分。尤其,此类可收获部分是种子,并且本发明方法的实施产生了相对于合适对照植物的种子产量而言,具有提高的种子产量的植物。
以谷物(corn)为例,产量提高可以表现为以下一个或多个指标:每公顷或英亩已建立的植物数目增加,每株植物花序数的提高,行数、每行核粒数、核粒重、千粒核重、花序长度/直径的提高,种子充实率(即充实种子数除以种子总数并乘以100)提高,及其他。以稻为例,产量提高可以自身表现为下列一种或多种指标的提高:每公顷或英亩植物数、每株植物的花序数、每花序的小穗数、每花序的花(小花)数目(其表达为充实种子数对原发花序数的比)、种子充实率的提高(其中种子充实率是充实种子数除以种子总数并乘以100)、千粒核重提高及其他。
本发明提供用于提高植物的非生物胁迫抗性的方法,从而导致提高的产量,尤其植物的种子产量,相对于非生物胁迫条件下培育的对照植物,所述方法包括调节植物中编码如本文中定义的NAP1样多肽的核酸表达,优选地增加该核酸表达。
由于本发明的转基因植物具有提高的产量,故相对于对照植物的生长速率,这些植物有可能在其生活周期的对应阶段上表现提高的生长速率(在其生活周期的至少部分期间)。除了提高的产量能力之外,提高的营养摄取效率也可能有助于产量提高。观察到本发明的植物在营养摄取方面显示较高的效率。提高的营养摄取效率允许植物在胁迫下较好地生长。
提高的生长速率可以是植物的一个或多个部分(包括种子)特异的,或可以基本上遍及整个植物。生长速率提高的植物可以具备较短的生活周期。植物的生活周期可以意指从干燥成熟种子成长至植物已经产生与起始材料相似的干燥成熟种子的阶段所需要的时间。这个生活周期可以受以下因素影响,如早期生长势、生长速率、绿度指数、开花时间和种子成熟速度。生长速率的提高可以在植物生活周期的一个或多个阶段上或在整个植物生活周期期间发生。植物生活周期早期中提高的生长速率在可以反映增强的生长势。生长速率的提高可以改变植物的收获周期,从而导致植物较晚播种和/或较早收获,而这本来是不可能的(相似效果可以随较早的开花时间获得)。若生长速率充分提高,则可以允许进一步播种相同植物物种的种子(例如播种并收获稻植物,随后播种并收获其他稻植物,全部稻植物均出于一个常规生长时期中)。类似地,若生长速率充分地提高,可以允许进一步播种不同植物物种的种子(例如播种并收获谷物植物,随后例如播种并任选收获大豆、马铃薯或任何其他合适植物)。在一些作物植物的例子中,来自相同根状茎的额外收获次数也可以是可能的。改变植物的收获周期可以导致每英亩一年生物量生产提高(原因在于可以培育并收获任何具体植物的次数(即在一年中)提高)。生长速率的提高也可以允许转基因植物在比其野生型对应物更广泛的地理区域内培育,因为培育作物的地域限制往往由栽种时节(早季)或在收获时期(晚季)的不利环境条件所决定。这类不利条件可以避开,若缩短收获周期。生长速率可以通过从生长曲线获得多个参数而确定,此类参数可以是:T-Mid(植物达到其50%最大尺寸所花费的时间)和T-90(植物达到其50%最大尺寸所花费的时间),以及其他。
根据本发明的优选特征,本发明方法的实施产生了相对于非生物胁迫下培育时的对照植物而言,具有提高的生长速率的植物。因此,根据本发明,提供了用于提高非生物胁迫条件下植物生长速率的方法,所述方法包括在植物中调节、优选提高如本文中定义的编码NAP1样多肽的核酸的表达。
与对照植物相比较,当所述植物暴露于多种非生物胁迫时,是否出现产量和/或生长速率的提高。植物一般通过生长得更慢而应答于胁迫暴露。在严重胁迫条件下,植物甚至可以完全停止生长。另一方面,轻度胁迫在本文中定义为植物所暴露的任何下述胁迫,其中所述的胁迫未导致植物完全停止生长,但同时不能恢复生长。与非胁迫条件下的对照植物相比较,轻度胁迫在本发明意义中导致受胁迫植物的生长降低小于40%、35%或30%、优选地小于25%、20%或15%、更优选地小于14%、13%、12%、11%或10%或更低。由于农业实践(灌溉、施肥、杀虫剂处理)的进步,在栽培作物植物中并不经常遇到严重胁迫。因此,由轻度胁迫诱导的受损生长对于农业往往是不受欢迎的特征。(如本文中所用的)轻度胁迫是植物所暴露的常见非生物性(环境)胁迫。非生物胁迫可以因干旱或过量的水、缺氧胁迫、盐胁迫、化学毒性、氧化胁迫和热、寒冷或冰冻温度所致。非生物胁迫可以是因水胁迫(尤其因为干旱)、盐胁迫、氧化胁迫或离子胁迫引起的渗透胁迫。
非生物性环境胁迫的另一个实例是需要由所述植物同化以生长和发育的一种或多种营养的可获量降低。因为营养可获量强烈地影响植物产量和产品品质,故将大量肥料倾注至田中以优化植物产量和产品品质。植物的生产量通常受三种主要营养素,即磷、钾和氮限制,这三种营养素中,氮通常是是植物生长的限速性元素。因此,植物生长所需的主要营养元素是氮(N)。氮是活细胞中存在的众多重要化合物的组成成分,所述的重要化合物包括氨基酸、蛋白质(酶)、核酸和叶绿素。植物干物质的1.5%-2%是氮和植物总蛋白的大约16%是氮。因此,氮可获量是作物植物生长和生产的主要限制性因素(Frink等(1999)Proc Natl Acad Sci USA 96(4):1175-1180),并且也对蛋白质聚集和氨基酸组成也有明显影响。因此,在氮限制性条件下培育时具有提高产量的植物是具有重大意义的。
生物胁迫一般是由病原体如细菌、病毒、线虫、真菌和昆虫引起的那些胁迫。
尤其,本发明的方法可以在胁迫条件下开展以产生相对于对照植物具有提高的产量的植物。如Wang等(Planta(2003)218:1-14)中报道,非生物胁迫导致一系列不利地影响植物生长及生产量的形态学、生理学、生物化学和分子变化。干旱、盐度、极端温度和氧化胁迫已知是相互联系的并可以通过相似机制诱导生长损害及细胞损害。Rabbani等(PlantPhysiol(2003)133:1755-1767)描述了干旱胁迫与高盐度胁迫间极高程度的“交互作用”。例如,干旱和/或盐化作用主要地表现为渗透胁迫,从而导致细胞内稳态和离子分布的破坏。经常伴随高温或低温、盐度或干旱胁迫的氧化胁迫可以造成功能性蛋白和结构蛋白变性。因此,这些多样的环境胁迫常常激活相似的细胞信号途径和细胞应答,如产生胁迫蛋白、上调抗氧化物质、积累兼容性溶质和生长停滞。如本文中所用的术语“非胁迫”条件是允许植物最佳生长的环境条件。本领域技术人员清楚对于给定地点的正常土壤条件和气候条件。
本发明方法的实施产生了在非生物胁迫条件下生长的植物,其相对于可比较条件下生长的合适对照植物而言,具有提高的产量。因而,根据本发明,提供了用于提高在非生物胁迫条件下培育的植物中产量的方法,所述的方法包括在植物中提高编码NAP1样多肽的核酸表达。在一个具体实施方案中,提高的非生物胁迫耐受性是对降低的营养可获量具有提高的耐受性。
本发明包括可由本发明方法获得的植物或其部分(包括种子)。所述植物或其部分包含编码如上文定义的NAP1样多肽的核酸转基因。
本发明也提供基因构建体和载体以促进在植物中导入和/或表达编码NAP1样多肽的核酸。所述基因构建体可以插入适于转化至植物并适于在转化细胞中表达目的基因的载体,所述载体可以是市售的。本发明也提供如本文中定义的基因构建体在本发明方法中的用途。
更具体地,本发明提供构建体,其包含:
(a)编码如上文定义的NAP1样多肽的核酸;
(b)能够驱动(a)的核酸序列表达的一个或多个调控序列;和任选地
(c)转录终止序列。
优选地,编码NAP1样多肽的核酸是如上文定义的。术语“调控序列”和“终止序列”如本文中的定义。
植物用包含任一上述核酸的载体转化。技术人员非常了解必须存在于所述载体上以便成功转化、选择和增殖含有目的序列的宿主细胞的遗传元件。所述目的序列有效地与一个或多个调控序列(至少与启动子)连接。
有利地,任意类型的启动子可以用来驱动所述核酸序列的表达。组成型启动子在本发明方法中是特别有用的,优选地,所述组成型启动子是组成型强启动子。应当明白本发明的应用不限于由SEQ ID NO:1代表的编码NAP1样多肽的核酸,本发明的应用也不限于编码NAP1样多肽的核酸在受组成型启动子驱动时的表达。
所述组成型启动子优选地是GOS2启动子,更优选地是稻GOS2启动子,最优选地如SEQ ID NO:39中描述的启动子。对于组成型启动子的其他实例,见本文中“定义”部分的表2。优选地,所述构建体包含如SEQ IDNO:3代表的表达盒。
任选地,可以在导入植物的构建体中导入一个或多个终止子序列。其它的调节元件可以包括转录增强子和翻译增强子。本领域技术人员将知道可能适用于实施本发明的终止子和增强子序列。此类序列将是已知的或可以由本领域技术人员轻易获得。
如定义部分中描述,内含子序列也可以添加至5′非翻译区(UTR)或编码序列中,以增加聚集在细胞质内的成熟信使的量。
(除启动子、增强子、沉默子、内含子序列、3′UTR和/或5′UTR区域之外的)其他调控序列可以是蛋白质/或RNA稳定元件。此类序列将是已知的或可以由本领域技术人员轻易获得。
本发明的基因构建体还可以包括为在特定细胞类型中维持和/或复制所需要的复制起点序列。一个实例是当基因构建体需要作为游离型遗传元件(例如质粒或粘粒分子)维持在细菌细胞中时的复制起点。优选的复制起点包括但不限于f1-ori和colE1。
为检测如在本发明方法中使用的核酸序列的成功转移和/或选择包含这些核酸的转基因植物,有利的是使用标记基因(或报道基因)。因此,所述基因构建体可以任选地包含选择标记基因。选择标记在本文的“定义”部分中更详细地描述。一旦不再需要所述标记基因时,它们可以从转基因细胞中移出或切除。用于移出标记的技术是本领域已知的,有用技术在上文定义部分中描述。
已知当核酸稳定或瞬时地整合至植物细胞时,仅少数细胞摄取了外来DNA,并且根据需要,将其整合至细胞的基因组中,这取决于所用的表达载体和所用的转染技术。为鉴定并选择这些整合子,编码选择标记的基因(如上文所述的基因)通常连同目的基因一起导入宿主细胞。这些标记可以例如在突变体中使用,在所述突变体中这些基因例如因常规方法缺失而没有功能。此外,编码选择标记的核酸分子可以在相同的载体或在分别的载体上导入宿主细胞,其中所述相同的载体包含编码本发明多肽的或在本发明方法使用的序列。已经用所导入核酸稳定转染的细胞可以例如通过选择加以鉴定(例如,已经整合了所述标记的细胞存活而其余细胞死亡)。
本发明也提供用于产生转基因植物的方法,所述转基因植物在非生物胁迫条件下培育时相对于对照植物而言,具有增强的产量相关性状,其中所述方法包括在植物中导入并表达编码如上文所定义的NAP1样多肽的任意核酸。
更具体地,本发明提供用于产生具有增加了产量的转基因植物的方法,所述方法包括:
(i)在植物或植物细胞中导入并表达编码NAP1样多肽的核酸;和
(ii)在促进植物生长和发育的条件下培养植物细胞。
所述核酸可以直接导入植物细胞或导入植物自身(包括导入组织、器官或植物的任何其他部分)。根据本发明的优选特征,该核酸优选地通过转化作用导入植物。术语“转化”在本文的“定义”部分中更详细地描述。
经遗传修饰的植物细胞可以通过技术人员熟悉的所有方法再生。合适的方法可以在上文提及的S.D.Kung和R.Wu,Potrykus或和Willmitzer的出版物中找到。
通常在转化后,对植物细胞或细胞群体选择一个或多个标记的存在性,其中所述标记由随同目的基因一起共转移的植物可表达基因编码,随后将转化材料再生成完整植物。为了选择转化植物,在所述转化中获得的植物材料原则上经历选择性条件,从而转化植物可以与非转化植物区分。例如,可以将以上述方式获得的种子播种,并且在初始培育时间后,通过喷洒进行合适的选择。另一种可能性在于根据需要消毒后,在使用合适选择剂的琼脂板上培育种子,从而仅转化的种子可以长成植物。或者,对所述转化植物筛选选择标记(如上文所述的选择标记)的存在性。
在DNA转移和再生后,推定转化的植物也可以例如使用DNA印迹分析对目的基因的存在性、拷贝数和/或基因组构造进行评价。备选地或额外地,新导入的DNA的表达水平可以使用RNA印迹分析和/或蛋白质印迹分析或这两种分析法监测,这两项技术均是本领域普通技术人员熟知的。
产生的转化植物可以通过多种方法繁殖,如通过克隆繁殖法或经典育种技术。例如,第一世代(或T1)转化植物可以进行自交并且选择纯合的第二世代(或T2)转化体,并且T2植物随后可以通过经典育种技术进一步繁殖。
产生的转化生物可以采取多种形式。例如,它们可以是转化细胞和非转化细胞的嵌合体;克隆性转化体(例如,被转化以含有表达盒的全部细胞);转化组织和非转化组织的移植体(例如在植物中,与未转化接穗嫁接的转化根状茎)。
本发明明确地扩展至由本文中所述的任意方法产生的任意植物细胞或植物,并扩展至全部植物部分及其繁殖体。本发明进一步扩展以包括已经由前述任意方法产生的原代转化或转染细胞、组织、器官或完整植物的后代,唯一要求是后代表现与如本发明方法中的亲代相同的基因型和/或表型特征。
本发明也包括含有编码NAP1样多肽的分离核酸的宿主细胞。本发明的优选宿主细胞是植物细胞。在本发明方法中所用核酸或载体、表达盒或构建体或载体的宿主植物原则上有利地是能够合成在本发明方法中所使用多肽的全部植物。
本发明的方法有利地适用于任意植物。
在本发明方法中特别有用的植物包括属于植物界(Viridiplantae)超家族、尤其单子叶和双子叶植物的全部植物,包括饲用或饲料豆科植物、观赏植物、粮食作物、树或灌木。根据本发明的一个优选实施方案,所述植物是作物植物。作物植物的实例包括大豆、向日葵、卡诺拉油菜、苜蓿、油菜籽、棉花、番茄、马铃薯和烟草。更优选地,所述植物是单子叶植物。单子叶植物的实例包括甘蔗。更优选地,所述植物是谷物植物。谷物植物的实例包括稻、玉米、小麦、大麦、谷子、黑麦、小黑麦属(triticale)、高粱、二粒小麦、斯卑尔脱小麦、黑麦属(secale)、单粒小麦、埃塞俄比亚画眉草(teff)、买罗高粱和燕麦。
本发明也扩展至植物的可收获部分如,但不限于种子、叶、果实、花、茎、根状茎、块茎和球茎。本发明进一步涉及了衍生自、优选直接衍生自此种植物的可收获部分的产品,如干燥颗粒或粉末、油、脂肪和脂肪酸、淀粉或蛋白质。
根据本发明的优选特征,受调节的表达是提高的表达。提高的表达或过量表达应当理解为额外于原初野生型表达水平的任意表达。本领域充分记录了用于提高核酸或基因或基因产物表达的方法并且在定义部分中提供了例子。
如上所述,用于调节(优选地提高)编码NAP1样多肽的核酸表达的优选方法是通过在植物中导入并表达编码NAP1样多肽的核酸;然而,实施本方法的效果,即增强产量相关性状,也可以使用其他熟知技术实现。下文现在将描述这些技术中的某些技术。
这样的一种技术是T-DNA活化标签技术(Hayashi等Science(1992)1350-1353),其包括通常含有启动子(也可以是翻译增强子或内含子)的T-DNA在目的基因的基因组区或基因的编码区上游或下游10kb以这样的方式插入,从而该启动子指导靶向的基因表达。一般,靶向基因的天然启动子对该靶向基因表达的调节被破坏,并且所述基因处于新导入的启动子控制下。该启动子一般嵌入T-DNA中。这种T-DNA随机地插入植物基因组,例如借助农杆菌感染,并且导致在插入的T-DNA附近的基因表达受到调节。所得的转基因植物因在导入的启动子附近的基因表达受到调节而显示显性表型。
本发明的作用也可以使用TILLING技术(基因组中定向诱导的局部损伤)重复;对TILLING技术的描述见“定义”部分。
对该技术的描述见“定义”部分。本发明的作用也可以使用同源重组法重复;对同源重组的描述见“定义”部分。
本发明也包括编码如本文中所述NAP1样多肽的核酸的用途,和这种NAP1样多肽的用途,用于增强在非生物胁迫条件下培育时植物中任意的前述产量相关性状。
编码本文中所述NAP1样多肽的核酸或NAP1样多肽自身可以用于育种程序中,在所述育种程序中鉴定到可以遗传地与编码NAP1样多肽的基因连接的DNA标记。所述核酸/基因或NAP1样多肽自身可以用来定义分子标记。这种DNA或蛋白质标记随后可以在育种程序中用来在本发明的方法中选择具有如上文所定义的增强的产量相关性状的植物。
编码NAP1样多肽的核酸/基因的等位变体也可以用于标记辅助的育种程序中。这种育种程序有时需要使用例如EMS诱变法通过对植物进行诱变处理而导入等位变异;备选地,该程序可以从收集并非故意造成的所谓“自然”源性等位变体开始。随后进行等位变体的鉴定,例如通过PCR法。此后是步骤:选择所讨论和导致产量提高的序列的优异等位变体。选择一般通过监测含有所讨论序列的不同等位变体的植物的生长性能而实施。生长性能可以在温室或在田间监测。其他任选步骤包括使其中鉴定到优异等位变体的植物与另一种植物杂交。这可能用来例如产生感兴趣的表型特征组合。
编码NAP1样多肽的核酸也可以作为探针用于遗传地或物理地绘制所述探针构成其一部分的基因并且作为标记用于与这些基因连锁的性状。此类信息可以用于植物育种,旨在开发具有所希望表型的品系。编码NAP1样多肽的核酸的这种用途仅需要具有至少15个核苷酸长度的核酸序列。编码NAP1样多肽的核酸可以用作限制性片段长度多态性(RFLP)标记。限制性消化的植物基因组DNA的DNA印迹物(Sambrook J,Fritsch EF和Maniatis T(1989)Molecular Cloning,A Laboratory Manual)可以用编码NAP1样多肽的核酸探测。所得的结合图式随后可以使用计算机程序如MapMaker(Lander等(1987)Genomics 1:174-181)进行遗传分析以构建遗传图。此外,该核酸可以用来探测含有一组个体的限制性核酸内切酶处理的基因组DNA的DNA印迹物,其中所述的一组个体代表具有定义的遗传杂交的亲代和后代。标出DNA多态性的分离并用来计算编码NAP1样多肽的核酸在先前使用这个群体获得的遗传图中的位置(Botstein等(1980)Am.J.Hum.Genet.32:314-331)。
在Bernatzky和Tanksley(1986)Plant Mol.Biol.Reporter 4:37-41中描述了植物基因来源的探针的产生及其在遗传作图中的用途。众多出版物描述了使用以上所提及的方法学或其改良法对特定cDNA克隆的遗传作图。例如,F2互交群、回交群、随机交配群、邻近纯合系和其他个体群体可以用于作图。此类方法学是本领域技术人员熟知的。
所述核酸探针也可以用于物理作图(即序列在物理图上的排列;见Hoheisel等在:Non-mammalian Genomic Analyasis:A Practical Guide,Academic press 1996,第319-346页及其中引用的参考文献)。
在另一实施方案中,核酸探针可以在直接荧光原位杂交(FISH)作图法(Trask(1991)Trends Genet.7:149-154)中使用。尽管当前的FISH作图法支持使用大的克隆(几个kb至几百个kb;见Laan等(1995)Genome Res.5:13-20),然而灵敏度的改善可以允许使用更短探针进行FISH作图。
用于遗传作图及物理作图的多种基于核酸扩增的方法可以使用所述核酸而实施。方法实例包括等位基因特异性扩增法(Kazazian(1989)J.Lab.Clin.Med 11:95-96)、PCR扩增片段的多态性(CAPS;Sheffield等(1993)Genomics 16:325-332)、等位基因特异性连接(Landegren等(1988)Science241:1077-1080)、核苷酸延伸反应(Sokolov(1990)Nucleic Acid Res.18:3671)、放射杂交作图(Walter等(1997)Nat.Genet.7:22-28)和Happy作图法(Dear和Cook(1989)Nucleic Acid Res.17:6795-6807)。对于这些方法,使用一种核酸的序列来设计并产生在扩增反应或在引物延伸反应中使用的引物对。此类引物的设计是本领域技术人员熟知的。在使用基于PCR遗传作图的方法中,可能需要在对应于当前核酸序列的区域中鉴定作图交叉的亲代之间的DNA序列差异。然而,这通常对作图法而言不是必需的。
本发明方法产生了具有如前文所述提高的产量的植物。这些性状也可以与经济上有利的其他性状组合,如其他的产量增强性状、针对其他非生物胁迫和生物胁迫的耐受性、调节多种构造性特征和/或生物化学特征和/或生理学特征的性状。
II.Lsm
出人意料地,现在已经发现调节在植物中编码Lsm多肽的核酸表达产生了相对于对照植物而言具有增强的产量相关性状的植物。下文详细描述适用于增强植物中产量相关性状的具体类别的Lsm多肽。
本发明提供相对于对照植物用于增强植物中产量相关性状的方法,包括调节植物中编码Lsm多肽的核酸的表达。
下文任一谈及的“在本发明方法中使用的蛋白质”意指如本文中定义的Lsm多肽。下文任一谈及的“在本发明方法中使用的核酸”意指能够编码这种Lsm多肽的核酸。
用于调节(优选地提高)编码在本发明方法中使用的蛋白质的核酸表达的优选方法是通过在植物中导入并表达编码如下文定义的在本发明方法中使用的蛋白质的核酸。
待导入植物(并且因而在实施本发明的方法中使用)的核酸是编码现在将描述的蛋白质类型的任意核酸,下文也称作“Lsm核酸”或“Lsm基因”。如本文中定义的“Lsm”多肽指具有包含Lsm结构域的氨基酸序列的任意分子。
SEQ ID Nos 120、121、122、123、124、125、126、127、128、129和130是在如SEQ ID Nos 41、43、45、47、49、51、53、55、57、59和61中提供的代表性Lsm蛋白中所发现的Lsm结构域的实例。通常,Lsm蛋白中的Lsm结构域具有这样的氨基酸序列,其以增加的优选顺序与选自SEQ ID Nos 120、121、122、123、124、125、126、127、128、129和130的序列具有至少50%、60%、70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性。
Lsm结构域在多肽中的存在可以通过该多肽序列与已经充分描述的Lsm蛋白比较并在Lsm结构域中建立同源性而轻易确定。开展序列比较的方法是本领域熟知的并且在下文描述。或者,Lsm结构域可以如实施例14中所述,通过在含有保守蛋白质结构域的适宜数据库中搜索而轻易鉴定。
通常,Lsm蛋白包含以增加的优选顺序与选自SEQ ID Nos 41、43、45、47、49、51、53、55、57、59和61的序列具有至少50%、60%、70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列。
还优选地,在本发明方法中使用的蛋白质的Lsm序列包含任意一个或多个以下保守基序:
基序I:GTLXSFDQFANVVLXGACERVIVGELYCDVPLGLYVIRGENVVLIG或以增加的优选顺序与基序I的序列具有至少70%、80%或90%序列同一性的基序,其中允许任何保守性变化并且其中‘X’取为任意氨基酸。
基序II:KAEREARDLKGTMRKRMEFLDFD或以增加的优选顺序与基序II的序列具有至少70%、80%或90%序列同一性的基序,其中允许任何保守性变化并且其中‘X’取为任意氨基酸。
基序I和/或基序II可以按照优选顺序包含0、1、2、3、4、5、6或7个氨基酸的缺失和/或替换和/或插入。
还优选地,在本发明方法中使用的Lsm蛋白是Lsm1类蛋白质。如本文中提到的Lsm1类蛋白质是酿酒酵母Lsm1蛋白的任意直向同源物或如SEQ ID No.41和SEQ ID No.43中所提供的拟南芥Lsm1a或Lsm1b蛋白的任意直向同源物。
鉴定直向同源蛋白质的方法是本领域熟知的并且在本文中描述。代表性Lsm1类蛋白的实例在表G中给出。
在本发明方法中使用的Lsm蛋白优选地包含具有下述氨基酸序列的Lsm结构域,所述的氨基酸序列以增加的优选顺序与选自SEQ ID Nos.120、121、131、132、133、140、142、143、144、152、154和157的序列具有至少70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性。
甚至更优选地,以上提及的Lsm1类蛋白包含以增加的优选顺序与SEQ ID No 41、43、73、75、77、81、85、87、89、105、109和115中任意序列具有70%、75%、80%、82%、84%、86%、88%、90%、92%、94%、96%、98%或99%序列同一性的氨基酸序列。最优选地,Lsm1蛋白是SEQ ID No 41、43、73、75、77、81、85、87、89、105、109和115中的任一序列。
在本发明方法中使用的蛋白质和编码该蛋白质的核酸的实例在如下文实施例11的表G中给出。
还在本发明方法中使用的是在实施例11的表G中给出的任一Lsm氨基酸序列的同源物。
还在本发明方法中使用的是在实施例11的表G中给出的任一多肽的衍生物或者任意前述SEQ ID NOs的直向同源物或旁系同源物的衍生物。
本发明通过用SEQ ID NO:40所代表的拟南芥核酸序列转化植物进行说明,其中所述的核酸序列编码SEQ ID NO:41的多肽序列。然而,本发明的实施不限于这些序列;本发明的方法可以有利地使用编码如本文中定义的在本发明方法中使用的蛋白质(包括同源物、直向同源物和旁系同源物)的任意核酸(如实施例11的表G中给出的任意核酸序列)实施。
在实施例11的表G中给出的氨基酸序列可以视为由SEQ ID Nos 41、43、45、47、49、51、53、55、57、59和61中任一序列所代表的Lsm多肽的直向同源物和旁系同源物,术语“直向同源物”和“旁系同源物”如本文中定义。
直向同源物和旁系同源物可以通过开展所谓交互式blast搜索而轻易找到。通常,这包括第一BLAST,其中所述的第一BLAST包括将查询序列(例如使用实施例11的表G中列出的任意序列)针对任意序列数据库(如可公开获得的NCBI数据库)进行BLAST。当从核苷酸序列开始时,一般使用BLASTN或TBLASTX(使用标准默认值),并且当从蛋白质序列开始时,使用BLASTP或TBLASTN(使用标准默认值)。可以任选地筛选BLAST结果。筛选结果或非筛选结果的全长序列随后针对来自生物的序列进行反向BLAST(第二BLAST),其中所述查询序列从所述生物衍生(在查询序列是SEQ ID NO:40或SEQ ID NO:41的情况下,所述第二BLAST因而将针对拟南芥序列进行)。随后比较第一BLAST和第二BLAST的结果。若来自第一blast的高阶位命中源自与衍生查询序列的物种相同的物种,则鉴定到旁系同源物,反向BLAST随后理想地在最高命中当中产生该查询序列;若高阶位命中不是源自与衍生查询序列的物种相同的物种,则鉴定到直向同源物,并且优选地在反向BLAST时,在最高命中当中产生该查询序列。
高阶位命中是具有低E-值的那些命中。E-值越低,评分越显著(或换句话说,偶然发现该命中的几率越低)。E-值的计算是本领域熟知的。除了E-值外,也通过同一性百分数评分来进行比较。同一性百分数指两个所比较的核酸(或多肽)序列之间特定长度范围内相同的核苷酸(或氨基酸)的数目。在大型家族的情况下,可以使用ClustalW,随后使用邻接树法,以帮助观察相关基因的聚集和鉴定直向同源物和旁系同源物。
实施例11的表G给出了由SEQ ID NO 41代表的Lsm蛋白的直向同源物和旁系同源物的实例。其他直向同源物和旁系同源物可以使用上文所述的BLAST方法轻易地鉴定到。
本发明的蛋白质因存在(例如图9中显示的)保守Lsm结构域而是可鉴定的。
优选地,在构建系统发生树时使用的多肽序列(如图9中所描述的那种多肽序列)与包含由SEQ ID NO:41所代表的氨基酸序列的Lsm多肽组而不与任何其他组聚类。
术语“结构域”、“标签”和“基序”在本文中的“定义”部分定义。也存在用于鉴定结构域的专业数据库,例如,SMART(Schultz等(1998)Proc.Natl.Acad.Sci.USA 95,5857-5864;Letunic等(2002)Nucleic Acids Res 30,242-244)、InterPro(Mulder等,(2003)Nucl.Acids.Res.31,315-318)、Prosite(Bucher和Bairoch(1994),用于生物分子序列基序的概括特征结构及其在自动化序列解读中的功能(在)ISMB-94;第二届分子生物学智能系统国际会议文集.Altman R.,Brutlag D.,Karp P.,Lathrop R.,Searls D.编辑,第53-61页,AAAIPress,Menlo Park;Hulo等,Nucl.Acids.Res.32:D134-D137,(2004)或Pfam(Bateman等,Nucleic Acids Research 30(1):276-280(2002))。一组用于计算机方式分析蛋白质序列的工具可在ExPASY蛋白质组服务器上获得(瑞士生物信息研究所维护(Gasteiger等,ExPASy:深入认识和分析蛋白质的蛋白质组服务器,Nucleic Acids Res.31:3784-3788(2003))。
结构域也可以使用常规技术如通过序列比对进行鉴定。用于比对序列以进行比较的方法是本领域熟知的,此类方法包括GAP、BESTFIT、BLAST、FASTA和TFASTA。GAP使用Needleman和Wunsch算法((1970)J Mol Biol 48:443-453)以找到使匹配数最大化并使空位数最小化的两个序列的总体(即覆盖完整序列的)比对结果。BLAST算法(Altschul等(1990)J Mol Biol 215:403-10)计算序列同一性百分数并在两个序列之间开展相似性的统计分析。用于执行BLAST分析的软件是通过国家生物技术信息中心(NCBI)可公开获得的。同源物可以使用例如ClustalW多重序列比对算法(1.83版本),以默认配对比对参数和百分数评分方法轻易地鉴定。相似性和同一性的总体百分数也可以使用MatGAT软件包中的可用方法之一确定(Campanella等,BMC Bioinformatics.2003年7月10日;4:29.MatGAT:使用蛋白质序列或DNA序列产生相似性/同一性矩阵的一种应用)。如本领域技术人员显而易见,可以进行少许手工编辑以优化保守基序之间的比对结果。此外,作为使用全长序列以鉴定同源物,也可以使用特定结构域(如Lsm结构域或如上所定义的基序之一)。对于局部比对,Smith-Waterman算法是特别有用的(Smith TF,Waterman MS(1981)J.Mol.Biol 147(1);195-7)。在下文实施例13中表述为百分数的序列同一性值利用上文提及的程序,使用默认参数在完整核酸或氨基酸序列范围和/或在所选择的结构域或保守基序范围内确定。
此外,已经描述了Lsm蛋白(至少在其天然形式中)的活性。活性测定法通常基于Lsm蛋白属性的生物化学或生物学功能,这包括它们结合其他Lsm蛋白、调节剪接、胞质mRNA降解、rRNA加工的能力和它们在翻译效率中的作用。酵母双杂和体外共沉淀实验可以用来检测与snRNA和snRNP的结合(Mayes AE等EMBO J.1999Aug 2;18(15):4321-31)。已经使用toeprinting、体外翻译和电泳迁移率移动测定法(electromobility shiftassays)报道了因Lsm蛋白所致的蛋白质翻译干扰(Vytvytska O等GenesDev.2000年5月1日;14(9):1109-18;Zaric B等J Biol Chem.2005年4月22日;280(16):16066-75)。Lsm活性还通过测定受脱腺苷酰作用依赖性脱帽过程影响的特定基因积累的相对水平(Tharum等2005)或通过总体mRNA基因表达变化(Fraser MM,Watson PM,Fraig MM,Kelley JR,Nelson PS,Boylan AM,Cole DJ,Watson DK.CaSm介导的细胞转化与基因表达改变和信使RNA稳定性相关(CaSm-mediated cellulartransformation is associated with altered gene expression and messengerRNA stability).Cancer Res.2005年7月15日;65(14):6228-36)揭示。
编码在本发明方法中使用的蛋白质的核酸无需是全长核酸,因为实施本发明方法不依赖于使用全长核酸序列。在实施本发明方法中适用的核酸的实例包括在实施例11的表G中给出的核酸序列,但不限于这些序列。核酸变体也可以用于实施本发明的方法中。此类核酸变体的实例包括编码在本发明方法中使用的蛋白质的核酸的部分、与编码在本发明方法中使用的蛋白质的核酸杂交的核酸、编码在本发明方法中使用的蛋白质的核酸的剪接变体、编码在本发明方法中使用的蛋白质的核酸的等位变体,和通过基因改组获得的编码在本发明方法中使用的蛋白质的核酸的变体,术语“杂交序列”、“剪接变体”、“等位变体”和“基因改组作用”如本文中所述。
根据本发明,提供了用于增强植物中产量相关性状的方法,包括在植物中导入并表达在实施例11的表G中给出的任一核酸序列的一部分,或下述核酸的一部分,其中所述的核酸编码在实施例11的表G中给出的任一氨基酸序列的直向同源物、旁系同源物或同源物。
优选地,在本发明方法中使用的核酸包含任一以下核酸:
(i)SEQ ID NO:82、SEQ ID NO:84、SEQ ID NO:86、SEQ ID NO:88、SEQ ID NO:90、SEQ ID NO:92、SEQ ID NO:94、SEQ ID NO:96、SEQID NO:98、SEQ ID NO:100、SEQ ID NO:102、SEQ lD NO:104、SEQ IDNO:106、SEQ ID NO:108、SEQ ID NO:110、SEQ ID NO:112、SEQ IDNO:114和SEQ ID NO:116;
(ii)编码Lsm蛋白的核酸,其中所述的Lsm蛋白以增加的优选顺序与SEQ ID NO:83、SEQ ID NO:85、SEQ ID NO:87、SEQ ID NO:89、SEQID NO:91、SEQ ID NO:93、SEQ ID NO:95、SEQ ID NO:97、SEQ ID NO:99、SEQ ID NO:101、SEQ ID NO:103、SEQ ID NO:105、SEQ ID NO:107、SEQ ID NO:109、SEQ ID NO:111、SEQ ID NO:113、SEQ ID NO:115、SEQ ID NO:117中给出的任一氨基酸序列具有至少80%、85%、90%、95%、96%、97%、98%、99%或100%的序列同一性;
(iii)能够在严格条件下与上文(i)或(ii)中给出的任一核酸杂交的核酸。
在本发明方法中使用的部分编码这样的多肽,所述多肽属于编码如本文中定义的在本发明方法中使用的蛋白质的核酸的定义范围并且基本上具有如实施例11的表G中给出的氨基酸序列相同的生物学活性。优选地,所述部分是在实施例11的表G中给出的任一核酸的一部分。该部分一般是至少100个连续核苷酸长度,优选至少150个连续核苷酸长度,更优选至少180个连续核苷酸长度和最优选至少350个连续核苷酸长度,所述连续核苷酸来源于实施例11的表G中给出的任一核酸序列。最优选地,所述部分是SEQ ID NO:40的核酸的一部分。优选地,所述部分编码如本文中所定义的任意一个或多个Lsm结构域的氨基酸序列。优选地,所述部分编码这样的氨基酸序列,当在构建Lsm系统发生树(如图10中所绘制的一个系统发生树)中使用时,所述氨基酸序列倾向于与包含由SEQ ID Nos 41、43、45、47、49、51、53、55、57、59和61所代表的氨基酸序列的任意代表性Lsm蛋白聚类,而不偏离于前述SEQ ID Nos聚类。
编码如本文中定义的Lsm蛋白的核酸的一部分可以例如通过对所述核酸产生一个或多个缺失而制备。所述部分可以以分离的形式使用或它们可以与其他编码(或非编码)序列融合,例如旨在产生联合几种活性的蛋白质。与其他编码序列融合时,在翻译时所产生的所得多肽可以比对于Lsm蛋白部分所预测的多肽更大。
在本发明方法中使用的另一种核酸变体是能够在降低的严格条件下、优选在严格条件下与编码如本文中定义的Lsm蛋白的核酸或与如本文中定义的部分杂交的核酸。
在本发明方法中使用的杂交序列编码这样的多肽,所述的多肽具有Lsm结构域(见图10的比对结果)并且基本上具有与由实施例11的表G中给出的任一氨基酸序列所代表的Lsm蛋白的相同生物学活性。优选地,所述杂交序列一般是至少100个连续核苷酸长度,优选至少150个连续核苷酸长度,更优选至少180个连续核苷酸长度和最优选至少350个连续核苷酸长度,所述连续核苷酸来源于实施例11的表G中给出的任一核酸序列。优选地,所述杂交序列是能够与实施例11的表G中给出的任意核酸或与这些序列中任意序列的一部分杂交的序列,其中所述的一部分如上文定义。最优选地,所述杂交序列能够与如SEQ ID NO:40所代表的核酸或与其一部分杂交。优选地,所述杂交序列编码了包含如本文定义的任意一个或多个基序或结构域的氨基酸序列。优选地,所述杂交序列编码这样的氨基酸序列,当在构建Lsm系统发生树(如图10中所绘制的一个系统发生树)中使用时,所述氨基酸序列倾向于与包含由SEQ ID Nos 41、43、45、47、49、51、53、55、57、59和61所代表的氨基酸序列的任意代表性Lsm蛋白聚类,而不偏离于前述SEQ ID Nos聚类。
根据本发明,提供了用于增强植物中产量相关性状的方法,包括在植物中导入并表达能够与实施例11的表G中给出的任一核酸杂交的核酸,或包括在植物中导入并表达这样的核酸,其中所述的核酸能够与编码实施例11的表G中给出的任意核酸序列的直向同源物、旁系同源物或同源物的核酸杂交。
在本发明方法中使用的另一种核酸变体是编码如上文所定义的Lsm蛋白的剪接变体。
根据本发明,提供了用于增强植物中产量相关性状的方法,包括在植物中导入并表达在实施例11的表G中给出的任一核酸序列的剪接变体,或导入并表达编码在实施例11的表G中所给出任一氨基酸序列的直向同源物、旁系同源物或同源物的核酸的剪接变体。
优选的剪接变体是由SEQ ID NO:40所代表的核酸的剪接变体,或是编码SEQ ID NO:41的直向同源物或旁系同源物的核酸的剪接变体。优选地,由所述剪接变体编码的氨基酸序列包含如本文中定义的任意一个或多个基序或结构域。优选地,由所述剪接变体编码的氨基酸序列编码这样的氨基酸序列,当在构建Lsm系统发生树(如图10中所绘制的一个系统发生树)中使用时,所述氨基酸序列倾向于在与1类至8类进化支中任意类进化支对应的进化支内聚类,或备选地,该氨基酸序列倾向于与包含由SEQ IDNos 41、43、45、47、49、51、53、55、57、59和61所代表的氨基酸序列的任意代表性Lsm蛋白聚类,而不偏离于前述SEQ ID Nos聚类。
在本发明方法中使用的另一种核酸变体是编码如上文所定义的Lsm蛋白的等位变体。等位变体天然存在,并且在本发明的方法中包括这些天然等位基因的用途。在本发明方法中使用的等位变体基本上具有与表G中给出的任意Lsm蛋白的相同生物学活性。在SEQ ID NO:80中提供作为SEQ ID NO:40的等位变体的实例。
根据本发明,提供了用于增强植物中产量相关性状的方法,包括在植物中导入并表达在实施例11的表G中给出的任一核酸序列的等位变体,或包括在植物中导入并表达编码在实施例11的表G中所给出任一氨基酸序列的直向同源物、旁系同源物或同源物的核酸的等位变体。
优选地,所述等位变体是SEQ ID NO:40的等位变体,或是编码SEQID NO:41的直向同源物或旁系同源物的核酸的等位变体。优选地,由所述等位变体编码的氨基酸序列包含如本文中定义的任意一个或多个基序或结构域。优选地,由所述等位变体编码的氨基酸序列为这样的氨基酸序列,当在构建Lsm系统发生树(如图10中所绘制的一个系统发生树)中使用时,所述氨基酸序列倾向于在与1类至8类进化支中任意类进化支对应的进化支内聚类,或备选地,该氨基酸序列倾向于与包含由SEQ ID Nos41、43、45、47、49、51、53、55、57、59和61所代表的氨基酸序列的任意代表性Lsm蛋白聚类,而不偏离于前述SEQ ID Nos聚类。
在本发明方法中使用的其他核酸变体是通过基因改组获得的核酸变体。基因改组或定向进化也可以用来产生编码如上文定义的Lsm蛋白的核酸的变体。
根据本发明,提供了用于增强植物中产量相关性状的方法,包括在植物中导入并表达在实施例11的表G中给出的任一核酸序列的变体,或包括在植物中导入并表达核酸的变体,所述的核酸编码在实施例11的表G中给出的任一氨基酸序列的直向同源物、旁系同源物或同源物,其中所述的变异核酸通过基因改组获得。
优选地,通过基因改组获得的变异核酸编码了包含如本文定义的任意一个或多个基序或结构域的氨基酸序列。优选地,由通过基因改组获得的变异核酸所编码的氨基酸序列在构建Lsm系统发生树(如图10中描述的系统发生树)中使用时,倾向于在与1类至8类进化支中任意类进化支对应的进化支内聚类,或备选地,该氨基酸序列倾向于与包含由SEQ ID Nos41、43、45、47、49、51、53、55、57、59和61所代表的氨基酸序列的任意代表性Lsm蛋白聚类,而不偏离于前述SEQ ID Nos聚类。
另外,核酸变体也可以通过位点定向诱变获得。几种方法可用于实现位点定向诱变,最常见的是基于PCR的方法(Current Protocols inMolecular Biology.Wiley编辑)。
编码Lsm蛋白的核酸可以衍生自任何天然来源或人工来源。该核酸可以通过人类有意操作,在组成和/或基因组环境方面从其天然形式中修饰而来。优选地,编码Lsm蛋白的核酸来自植物,进一步优选来自双子叶植物,更优选来自十字花科(Brassicaceae),所述核酸最优选地来自拟南芥。
本文中任一谈及的Lsm蛋白因此意指如上定义的Lsm蛋白,编码这种Lsm蛋白的任意核酸适用于实施本发明的方法。
本发明也包括可由本发明方法获得的植物或其部分(包括种子)。所述植物或其部分包含编码如上文定义的Lsm蛋白的核酸转基因。
本发明也提供基因构建体和载体以促进在植物中导入和/或表达在本发明方法中使用的核酸序列。所述基因构建体可以插入适于转化至植物并适于在转化细胞中表达目的基因的载体,所述载体可以是市售的。本发明也提供如本文中定义的基因构建体在本发明方法中的用途。
更具体地,本发明提供构建体,其包含
(a)编码如上文定义的Lsm蛋白的核酸;
(b)能够驱动(a)的核酸序列表达的一个或多个调控序列;和任选地
(c)转录终止序列。
由以上(a)的核酸编码的Lsm蛋白具有这样的氨基酸序列,所述氨基酸序列以增加的优选顺序与选自SEQ ID Nos 120,121,122,123,124,125,126,127,128,129和130的序列具有至少50%、60%、70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性。
优选地,以上(a)的核酸是:
(a)SEQ ID No.:82,84,86,88,90,92,94,96,98,100,102,104,106,108,110,112,114和116的任意核酸或
(b)核酸,其能够在严格条件下与(i)中给出的任一核酸或具有在(i)中给出的任意核酸的互补序列的核酸杂交。
植物用包含目的序列(即编码如本文中定义的Lsm多肽的核酸)的载体转化。技术人员非常了解必须存在于所述载体上以便成功转化、选择和增殖含有目的序列的宿主细胞的遗传元件。所述目的序列有效地与一个或多个调控序列(至少与启动子)连接。
有利地,任意类型的启动子可以用来驱动所述核酸序列的表达。
所述启动子可以是组成型启动子或器官特异性或组织特异性启动子或细胞特异性启动子。
优选地,Lsm核酸或其变体有效地与种子特异性启动子连接。优选地,所述种子特异性启动子是WSI18启动子,或功能等效的启动子。更优选地,所述启动子序列如SEQ ID NO:161或SEQ ID NO:164所代表。应当明白本发明的应用不限于由SEQ ID NO:40代表的Lsm核酸,本发明的应用也不限于Lsm核酸在受种子特异性启动子驱动时的表达。也可以用来驱动Lsm核酸表达的其他种子特异性启动子的实例在定义部分显示。
其它的调节元件可以包括转录增强子和翻译增强子。本领域技术人员将知道可能适用于实施本发明的终止子和增强子序列。如定义部分中描述,内含子序列也可以添加至5′非翻译区(UTR)或编码序列中,以增加聚集在细胞质内的成熟信使的量。(除启动子、增强子、沉默子、内含子序列、3’UTR和/或5’UTR区域之外的)其他调控序列可以是蛋白质/或RNA稳定元件。此类序列将是已知的或可以由本领域技术人员轻易获得。
本发明的基因构建体还可以包括为在特定细胞类型中维持和/或复制所需要的复制起点序列。一个实例是当基因构建体需要作为游离型遗传元件(例如质粒或粘粒分子)维持在细菌细胞中时的复制起点。优选的复制起点包括但不限于f1-ori和colE1。
为检测如在本发明方法中使用的核酸序列的成功转移和/或选择包含这些核酸的转基因植物,有利的是使用标记基因(或报道基因)。因此,所述基因构建体可以任选地包含选择标记基因。选择标记在本文的“定义”部分中更详细地描述。一旦不再需要所述标记基因时,它们可以从转基因细胞中移出或切除。用于移出标记的技术是本领域已知的,有用技术在上文定义部分中描述。
本发明也提供用于产生转基因植物的方法,所述转基因植物相对于对照植物而言,具有增强的产量相关性状,其中所述方法包括在植物中导入并表达编码如上文所定义的Lsm蛋白的任意核酸。
更具体地,本发明提供用于产生具有增强的产量相关性状的转基因植物的方法,所述方法包括:
(a)在植物或植物细胞中导入并表达Lsm核酸或其变体;和
(b)在促进植物生长和发育的条件下培养植物细胞。
所述核酸可以直接导入植物细胞或导入植物自身(包括导入组织、器官或植物的任何其他部分)。根据本发明的优选特征,该核酸优选地通过转化作用导入植物。术语“转化”在本文的“定义”部分中更详细地描述。
通常在转化后,对植物细胞或细胞群体选择一个或多个标记的存在性,其中所述标记由随同目的基因一起共转移的植物可表达基因编码,随后将转化材料再生成完整植物。为了选择转化植物,在所述转化中获得的植物材料原则上经历选择性条件,从而转化植物可以与非转化植物区分。例如,可以将以上述方式获得的种子播种,并且在初始培育时间后,通过喷洒进行合适的选择。另一种可能性在于(根据需要)消毒后,在使用合适选择剂的琼脂板上培育种子,从而仅转化的种子可以长成植物。或者,对所述转化植物筛选选择标记(如上文所述的选择标记)的存在性。
在DNA转移和再生后,推定转化的植物也可以例如使用DNA印迹分析对目的基因的存在性、拷贝数和/或基因组构造进行评价。备选地或额外地,新导入的DNA的表达水平可以使用RNA印迹分析和/或蛋白质印迹分析或这两种分析法监测,这两项技术均是本领域普通技术人员熟知的。
产生的转化植物可以通过多种方法繁殖,如通过克隆繁殖法或经典育种技术。例如,第一世代(或T1)转化植物可以进行自交并且选择纯合的第二世代(或T2)转化体,并且T2植物随后可以通过经典育种技术进一步繁殖。
产生的转化生物可以采取多种形式。例如,它们可以是转化细胞和非转化细胞的嵌合体;克隆性转化体(例如,被转化以含有表达盒的全部细胞);转化组织和非转化组织的移植体(例如在植物中,与未转化接穗嫁接的转化根状茎)。
本发明明确地扩展至由本文中所述的任意方法产生的任意植物细胞或植物,并扩展至全部植物部分及其繁殖体。本发明进一步扩展以包括已经由前述任意方法产生的原代转化或转染细胞、组织、器官或完整植物的后代,唯一要求是后代表现与如本发明方法中的亲代相同的基因型和/或表型特征。
本发明也包括含有编码如上文所定义的Lsm蛋白的分离核酸的宿主细胞。本发明的优选宿主细胞是植物细胞。
在本发明方法中所用核酸或载体、表达盒或构建体或载体的宿主植物原则上有利地是能够合成在本发明方法中所使用多肽的全部植物。
本发明也扩展至植物的可收获部分如,但不限于种子、叶、果实、花、茎、根状茎、块茎和球茎。本发明进一步涉及了衍生自、优选直接衍生自此种植物的可收获部分的产品,如干燥颗粒或粉末、油、脂肪和脂肪酸、淀粉或蛋白质。
根据本发明的优选特征,受调节的表达是提高的表达。
如上所述,用于调节(优选地提高)编码Lsm蛋白的核酸表达的优选方法是通过在植物中导入并表达编码Lsm蛋白的核酸;然而,实施本方法的效果,即增强产量相关性状,也可以使用其他熟知技术实现,并且在定义部分中提供了例子。
如上所述,用于调节(优选地提高)编码Lsm多肽的核酸表达的优选方法是通过在植物中导入并表达编码Lsm多肽的核酸;然而,实施本方法的效果,即增强产量相关性状,也可以使用其他熟知技术实现,所述的其他熟知技术包括但不限于T-DNA活化标签技术、TILLING、同源重组法。在定义部分中提供了对这些技术的描述。
本发明方法的实施产生了具有增强的产量相关性状的植物。本文谈及的增强的产量相关性状意指植物的一个或多个部分的生物量(重量)增加,所述的部分可以包括地上(可收获的)部分和/或(可收获的)地下部分。
尤其,此类可收获部分是种子,并且本发明方法的实施产生了相对于合适对照植物的种子产量而言,具有提高的种子产量的植物。
以谷物(corn)为例,产量提高可以表现为以下一个或多个指标:每公顷或英亩已建立的植物数目增加,每株植物穗(ear)数的提高,行数、每行核粒数、核粒重、千粒核重、穗长度/直径的提高,种子充实率(即充实种子数除以种子总数并乘以100)提高,及其他。以稻为例,产量提高可以自身表现为下列一种或多种指标的提高:每公顷或英亩植物数、每株植物的花序(panicle)数、每花序的小穗数、每花序的花(小花)数目(其表达为充实种子数对原发花序(primary panicle)数的比)、种子充实率的提高(其中种子充实率是充实种子数除以种子总数并乘以100)、千粒核重提高及其他。
由于本发明的转基因植物具有提高的产量,故相对于对照植物的生长速率,这些植物有可能在其生活周期的对应阶段上表现提高的生长速率(在其生活周期的至少部分期间)。提高的生长速率可以是植物的一个或多个部分(包括种子)特异的,或可以基本上遍及整个植物。生长速率提高的植物可以具备较短的生活周期。植物的生活周期可以意指从干燥成熟种子成长至植物已经产生与起始材料相似的干燥成熟种子的阶段所需要的时间。这个生活周期可以受以下因素影响,如早期生长势、生长速率、绿度指数、开花时间和种子成熟速度。生长速率的提高可以在植物生活周期的一个或多个阶段上或在整个植物生活周期期间发生。植物生活周期早期中提高的生长速率在可以反映增强的生长势。生长速率的提高可以改变植物的收获周期,从而导致植物较晚播种和/或较早收获,而这本来是不可能的(相似效果可以随较早的开花时间获得)。若生长速率充分提高,则可以允许进一步播种相同植物物种的种子(例如播种并收获稻植物,随后播种并收获其他稻植物,全部稻植物均出于一个常规生长时期中)。类似地,若生长速率充分地提高,可以允许进一步播种不同植物物种的种子(例如播种并收获谷物植物,随后例如播种并任选收获大豆、马铃薯或任何其他合适植物)。在一些作物植物的例子中,来自相同根状茎的额外收获次数也可以是可能的。改变植物的收获周期可以导致每英亩一年生物量生产提高(原因在于可以培育并收获任何具体植物的次数(即在一年中)提高)。生长速率的提高也可以允许转基因植物在比其野生型对应物更广泛的地理区域内培育,因为培育作物的地域限制往往由栽种时节(早季)或在收获时期(晚季)的不利环境条件所决定。这类不利条件可以避开,若缩短收获周期。生长速率可以通过从生长曲线获得多个参数而确定,此类参数可以是:T-Mid(植物达到其50%最大尺寸所花费的时间)和T-90(植物达到其50%最大尺寸所花费的时间),以及其他。
根据本发明的优选特征,本发明方法的实施产生了相对于对照植物而言,具有提高的生长速率的植物。因此,根据本发明,提供了用于提高植物生长速率的方法,所述方法包括调节、优选提高植物中编码如本文中定义的Lsm蛋白的核酸表达。
与对照植物相比较,当所述植物处于非胁迫条件下或当植物暴露于多种胁迫时,是否出现产量和/或生长速率的提高。植物一般通过生长得更慢而应答于胁迫暴露。在严重胁迫条件下,植物甚至可以完全停止生长。另一方面,轻度胁迫在本文中定义为植物所暴露的任何下述胁迫,其中所述的胁迫未导致植物完全停止生长,且没有再继续生长的能力。与非胁迫条件下的对照植物相比较,轻度胁迫在本发明意义中导致受胁迫植物的生长降低小于40%、35%或30%、优选地小于25%、20%或15%、更优选地小于14%、13%、12%、11%或10%或更低。由于农业实践(灌溉、施肥、杀虫剂处理)的进步,在栽培作物植物中并不经常遇到严重胁迫。因此,由轻度胁迫诱导的受损生长对于农业往往是不受欢迎的特征。轻度胁迫是植物所暴露的常见生物和/或非生物性(环境)胁迫。非生物胁迫可以因干旱或过量的水、缺氧胁迫、盐胁迫、化学毒性、氧化胁迫和热、寒冷或冰冻温度所致。非生物胁迫可以是因水胁迫(尤其因为干旱)、盐胁迫、氧化胁迫或离子胁迫引起的渗透胁迫。生物胁迫一般是由病原体如细菌、病毒、线虫、真菌和昆虫引起的那些胁迫。
尤其,本发明的方法可以在非胁迫条件或轻微干旱条件下开展以产生相对于对照植物具有提高的产量的植物。如Wang等(Planta(2003)218:1-14)中报道,非生物胁迫导致一系列不利地影响植物生长及生产量的形态学、生理学、生物化学和分子变化。干旱、盐度、极端温度和氧化胁迫已知是相互联系的并可以通过相似机制诱导生长损害及细胞损害。Rabbani等(Plant Physiol(2003)133:1755-1767)描述了干旱胁迫与高盐度胁迫间极高程度的“交互作用”。例如,干旱和/或盐化作用主要地表现为渗透胁迫,从而导致细胞内稳态和离子分布的破坏。经常伴随高温或低温、盐度或干旱胁迫的氧化胁迫可以造成功能性蛋白和结构蛋白变性。因此,这些多样的环境胁迫常常激活相似的细胞信号途径和细胞应答,如产生胁迫蛋白、上调抗氧化物质、积累兼容性溶质和生长停滞。如本文中所用的术语“非胁迫”条件是允许植物最佳生长的环境条件。本领域技术人员清楚对于给定地点的正常土壤条件和气候条件。
本发明方法的实施产生了相对于在可比较条件下生长的合适对照植物,在非胁迫条件或轻微干旱条件下生长的提高了产量的植物。因此,根据本发明,提供了用于在非胁迫条件或轻微干旱条件下生长的植物中提高产量的方法,所述方法包括提高植物中编码Lsm多肽的核酸的表达。
本发明方法的实施产生了相对于在可比较条件下生长的对照植物而言,在营养素缺乏条件下、尤其在氮缺乏条件下培育的具有提高产量的植物。因此,根据本发明,提供了用于在营养缺乏条件下培育的植物中提高产量的方法,所述方法包括调节植物中编码Lsm多肽的核酸表达。营养缺乏可以因营养素如氮、磷酸盐和其他含磷化合物、钾、钙、镉、镁、锰、铁和硼及其他元素缺少所致。
在本发明的一个优选实施方案中,产量和/或生长速率的提高在非胁迫条件下发生。
在本发明的另一个优选实施方案中,在轻微干旱条件下观察到增强的产量相关性状,最优选地,所述干旱条件是根据实施例18中描述的浇水方案2。
本发明的方法有利地适用于任意植物。
如本文中所用的术语“植物”包括完整植物、植物的祖先及后代和包括种子、苗、茎、叶、根(包括块茎)、花和组织与器官在内的植物部分,其中每种前述对象包含目的基因/核酸。术语“植物”也包括植物细胞、悬浮培养物、愈伤组织、胚、分生组织区、配子体、孢子体、花粉和小孢子,同样每种前述对象包含目的基因/核酸。
在本发明方法中特别有用的植物包括属于植物界(Viridiplantae)超家族、尤其单子叶和双子叶植物的全部植物,包括饲用或饲料豆科植物、观赏植物、粮食作物、树或灌木。根据本发明的一个优选实施方案,所述植物是作物植物。作物植物的实例包括大豆、向日葵、卡诺拉油菜、苜蓿、油菜、棉花、番茄、马铃薯和烟草。还优选地,所述植物是单子叶植物。单子叶植物的实例包括甘蔗。更优选地,所述植物是谷物植物。谷物植物的实例包括稻、玉米、小麦、大麦、谷子、黑麦、高粱、二粒小麦、斯卑尔脱小麦、黑麦属、单粒小麦、埃塞俄比亚画眉草、买罗高粱和燕麦。
本发明也扩展至植物的可收获部分如,但不限于种子、叶、果实、花、茎、根状茎、块茎和球茎。本发明进一步涉及了衍生自、优选直接衍生自此种植物的可收获部分的产品,如干燥颗粒或粉末、油、脂肪和脂肪酸、淀粉或蛋白质。
本发明也提供了迄今未知的Lsm核酸和Lsm蛋白,这些序列也在实施本发明方法中使用。
根据本发明的又一实施方案,提供了分离的核酸分子,其包含:
(i)由SEQ ID NO:82,SEQ ID NO:84,SEQ ID NO:86 SEQ ID NO:88,SEQ ID NO:90,SEQ ID NO:92,SEQ ID NO:94,SEQ ID NO:96,SEQ ID NO:98,SEQ ID NO:100,SEQ ID NO:102,SEQ ID NO:104,SEQ ID NO:106,SEQ ID NO:108,SEQ ID NO:110,SEQ ID NO:112,SEQ ID NO:114或SEQ ID NO:116所代表的核酸;
(ii)在(i)中给出的任一SEQ ID NO的互补物;
(iii)编码Lsm蛋白的核酸,所述的Lsm蛋白以增加的优选顺序与SEQID NO:83,SEQ ID NO:85,SEQ ID NO:87,SEQ ID NO:89,SEQ ID NO:91,SEQ lD NO:93,SEQ ID NO:95,SEQ ID NO:97,SEQ ID NO:99,SEQ ID NO:101,SEQ ID NO:103,SEQ ID NO:105,SEQ ID NO:107,SEQ ID NO:109,SEQ ID NO:111,SEQ ID NO:113,SEQ ID NO:115,SEQ ID NO:117中给出的任一氨基酸序列具有至少80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性;
(iv)能够在严格条件下与以上(i),(ii)或(iii)中给出的任一核酸杂交的核酸。
根据本发明的又一实施方案,提供了分离的多肽,其包含:
(i)由SEQ ID NO:83,SEQ ID NO:85,SEQ ID NO:87,SEQ ID NO:89,SEQ ID NO:91,SEQ ID NO:93,SEQ ID NO:95,SEQ ID NO:97,SEQ ID NO:99,SEQ ID NO:101,SEQ ID NO:103,SEQ ID NO:105,SEQ ID NO:107,SEQ ID NO:109,SEQ ID NO:111,SEQ ID NO:113,SEQ ID NO:115,SEQ ID NO:117任一序列所代表的氨基酸序列;
(ii)氨基酸序列,其以增加的优选顺序与SEQ ID NO:83,SEQ ID NO:85,SEQ ID NO:87,SEQ ID NO:89,SEQ ID NO:91,SEQ ID NO:93,SEQ ID NO:95,SEQ ID NO:97,SEQ ID NO:99,SEQ ID NO:101,SEQID NO:103,SEQ ID NO:105,SEQ ID NO:107,SEQ ID NO:109,SEQ IDNO:111,SEQ ID NO:113,SEQ ID NO:115,SEQ ID NO:117中给出的任一氨基酸序列具有至少80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性;
(iii)以上(i)或(ii)中给出的任一氨基酸序列的衍生物。
本发明也包括编码本文中所述的Lsm蛋白的核酸和这些Lsm蛋白在增强植物中产量相关性状中的用途。
编码本文中所述的Lsm蛋白的核酸或Lsm蛋白自身可以用于育种程序中,在所述育种程序中鉴定到可以遗传地与编码Lsm蛋白的基因连接的DNA标记。所述核酸/基因或Lsm蛋白自身可以用来定义分子标记。这种DNA或蛋白质标记随后可以在育种程序中用来在本发明的方法中选择具有如上文所定义的增强的产量相关性状的植物。
编码Lsm蛋白的核酸/基因的等位变体也可以用于标记辅助的育种程序中。这种育种程序有时需要使用例如EMS诱变法通过对植物进行诱变处理而导入等位变异;备选地,该程序可以从收集并非故意造成的所谓“自然”源性等位变体开始。随后进行等位变体的鉴定,例如通过PCR法。此后是步骤:选择所讨论和导致产量提高的序列的优异等位变体。选择一般通过监测含有所讨论序列的不同等位变体的植物的生长性能而实施。生长性能可以在温室或在田间监测。其他任选步骤包括使其中鉴定到优异等位变体的植物与另一种植物杂交。这可能用来例如产生感兴趣的表型特征组合。
编码Lsm蛋白的核酸也可以作为探针用于遗传地或物理地绘制所述探针构成其一部分的基因并且作为标记用于与这些基因连锁的性状。此类信息可以用于植物育种,旨在开发具有所希望表型的品系。编码Lsm蛋白的核酸的这种用途仅需要具有至少15个核苷酸长度的核酸序列。编码Lsm蛋白的核酸可以用作限制性片段长度多态性(RFLP)标记。限制性消化的植物基因组DNA的DNA印迹物(Sambrook J,Fritsch EF和Maniatis T(1989)Molecular Cloning,A Laboratory Manual)可以用编码Lsm蛋白的核酸探测。所得的结合图式随后可以使用计算机程序如MapMaker(Lander等(1987)Genomics 1:174-181)进行遗传分析以构建遗传图。此外,该核酸可以用来探测含有一组个体的限制性核酸内切酶处理的基因组DNA的DNA印迹物,其中所述的一组个体代表具有定义的遗传杂交的亲代和后代。标出DNA多态性的分离并用来计算编码Lsm蛋白的核酸在先前使用这个群体获得的遗传图中的位置(Botstein等(1980)Am.J.Hum.Genet.32:314-331)。
在Bernatzky和Tanksley(1986)Plant Mol.Biol.Reporter 4:37-41中描述了植物基因来源的探针的产生及其在遗传作图中的用途。众多出版物描述了使用以上所提及的方法学或其改良法对特定cDNA克隆的遗传作图。例如,F2互交群、回交群、随机交配群、邻近纯合系和其他个体群体可以用于作图。此类方法学是本领域技术人员熟知的。
所述核酸探针也可以用于物理作图(即序列在物理图上的排列;见Hoheisel等在:Non-mammalian Genomic Analyasis:A Practical Guide,Academic press 1996,第319-346页及其中引用的参考文献)。
在另一实施方案中,核酸探针可以在直接荧光原位杂交(FISH)作图法(Trask(1991)Trends Genet.7:149-154)中使用。尽管当前的FISH作图法支持使用大的克隆(几个kb至几百个kb;见Laan等(1995)Genome Res.5:13-20),然而灵敏度的改善可以允许使用更短探针进行FISH作图。
用于遗传作图及物理作图的多种基于核酸扩增的方法可以使用所述核酸而实施。方法实例包括等位基因特异性扩增法(Kazazian(1989)J.Lab.Clin.Med 11:95-96)、PCR扩增片段的多态性(CAPS;Sheffield等(1993)Genomics 16:325-332)、等位基因特异性连接(Landegren等(1988)Science241:1077-1080)、核苷酸延伸反应(Sokolov(1990)Nucleic Acid Res.18:3671)、放射杂交作图(Walter等(1997)Nat.Genet.7:22-28)和Happy作图法(Dear和Cook(1989)Nucleic Acid Res.17:6795-6807)。对于这些方法,使用一种核酸的序列来设计并产生用于扩增反应或引物延伸反应中的引物对。此类引物的设计是本领域技术人员熟知的。在使用基于PCR遗传作图的方法中,可能需要在对应于当前核酸序列的区域中鉴定作图交叉的亲代之间的DNA序列差异。然而,这通常对作图法而言不是必需的。
本发明方法产生了具有如前文所述提高的产量的植物。这些性状也可以与经济上有利的其他性状组合,如其他的产量增强性状、针对其他非生物胁迫和生物胁迫的耐受性、调节多种构造性特征和/或生物化学特征和/或生理学特征的性状。
III.截短的细胞周期蛋白H
根据第一实施方案,本发明提供相对于对照植物用于增强植物中产量相关性状的方法,包括调节植物中编码截短的细胞周期蛋白H多肽(此后也称作CycHTr)的核酸表达。
用于调节(优选提高)编码CycHTr多肽的核酸表达的优选方法是在植物中导入并表达编码CycHTr多肽的核酸。
下文任一谈及的“在本发明方法中使用的蛋白质”意指如本文中定义的CYCHTR多肽。该术语也包括为产生如下所述截短形式所使用的细胞周期蛋白H多肽。下文任一谈及的“在本发明方法中使用的核酸”意指这样的核酸,所述核酸能够编码这种CYCHTR多肽或编码为产生如下所述截短形式所使用的细胞周期蛋白H多肽。待导入植物(并且因而在实施本发明方法中使用)的核酸是编码现在所描述的蛋白质类型的任意核酸,此后也称作“CycHTR核酸”或“CycHTR基因”。
细胞周期蛋白H多肽是一般结合并活化CDK-激活激酶(CAK)的蛋白质。据报道细胞周期蛋白H包含2个特征性α螺旋结构域,每个α螺旋结构域含有5个螺旋(称作H1-H5和H1’-H5’)和氨基端和羧基端螺旋(Hn和Hc,见图13)(Andersen等,EMBO Journal 16,958-967,1997)。细胞周期蛋白H包含特征性细胞周期蛋白盒(图13)、存在于全部细胞周期蛋白中的结构域;另外,CycH优选地还包含保守的基序1(L/V/I)(Q/R)(E/D)VCXAF(SEQ ID NO:169)。
“CycH多肽”也可以定义为与SEQ ID NO:173以增加的优选顺序具有至少20%、25%、30%、35%、40%、45%、50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%,89%、90%、91%、92%、93%、94%、95%96%、97%、98%、99%或更大序列同一性的细胞周期蛋白。
此外,细胞周期蛋白(至少在其天然形式中)可以具有CDK-结合活性。据报道CycH尤其结合并活化CAK蛋白。用于测量蛋白质-蛋白质相互作用(包括双杂交测定法)和用于测量激酶活性(尤其CAK活性)的手段和技术是本领域熟知的,其他细节见实施例25。
本发明的方法使用截短的细胞周期蛋白H。cycH的有用截短形式是仍能够与CAK结合但不能激活CAK的那些截短形式。测量cycH结合作用和CAK激活作用的指南可以在Andersen等(1997)中找到。优选地,截短的细胞周期蛋白H至少缺少Hc螺旋结构域,截短的细胞周期蛋白H进一步优选还缺少H5’螺旋结构域,更优选地,截短的细胞周期蛋白H缺少Hc、H5’和H4’螺旋。在具体实施方案中,与全长细胞周期蛋白H蛋白质序列相比较,截短的细胞周期蛋白H以缺少螺旋H3’、H4’、H5’和Hc为特征。优选地,截短的cycH是如SEQ ID NO:166所代表。然而,如Andersen等(1997)所概述,缺失其他螺旋结构域也导致CAK激活活性丧失。术语“截短的细胞周期蛋白H”或“CycHTr”也包括这些缺失变体并且在本发明方法中同等地使用。
优选地,在构建系统发生树(如图15中所绘制的系统发生树)时使用的多肽序列与包含由SEQ ID NO:166或SEQ ID NO:173所代表的氨基酸序列的CycH多肽组而不与任何其他组聚类。
术语“结构域”和“基序”在本文中的“定义”部分定义。存在用于鉴定结构域的专业数据库,例如,SMART(Schultz等(1998)Proc.Natl.Acad.Sci.USA 95,5857-5864;Letunic等(2002)Nucleic Acids Res 30,242-244)、InterPro(Mulder等,(2003)Nucl.Acids.Res.31,315-318)、Prosite(Bucher和Bairoch(1994),用于生物分子序列基序的概括特征结构及其在自动化序列解读中的功能(A generalized profile syntax for biomolecular sequencesmotifs and its function in automatic sequence interpretation).(在)ISMB-94;第二届分子生物学智能系统国际会议文集.Altman R.,BrutlagD.,Karp P.,Lathrop R.,Searls D.编辑,第53-61页,AAAIPress,MenloPark;Hulo等,Nucl.Acids.Res.32:D134-D137,(2004)或Pfam(Bateman等,Nucleic Acids Research 30(1):276-280(2002))。一组用于计算机方式分析蛋白质序列的工具可在ExPASY蛋白质组服务器上获得(瑞士生物信息研究所维护(Gasteiger等,ExPASy:深入认识和分析蛋白质的蛋白质组服务器,Nucleic Acids Res.31:3784-3788(2003))。结构域也可以使用常规技术如通过序列比对进行鉴定。
分析SMART数据库中SEQ ID NO:166的多肽序列,揭示存在细胞周期蛋白盒,SMART登录号为SM00385(见图13)。
用于比对序列以进行比较的方法是本领域熟知的,此类方法包括GAP、BESTFIT、BLAST、FASTA和TFASTA。GAP使用Needleman和Wunsch算法((1970)J Mol Biol 48:443-453)以找到使匹配数最大化并使空位数最小化的两个序列的总体(即覆盖完整序列的)比对结果。BLAST算法(Altschul等(1990)J Mol Biol 215:403-10)计算序列同一性百分数并在两个序列之间开展相似性的统计分析。用于执行BLAST分析的软件是通过国家生物技术信息中心(NCBI)可公开获得的。同源物可以使用例如ClustalW多重序列比对算法(1.83版本),以默认配对比对参数和百分数评分方法轻易地鉴定。相似性和同一性的总体百分数也可以使用MatGAT软件包中的可用方法之一确定(Campanella等,BMC Bioinformatics.2003年7月10日;4:29.MatGAT:使用蛋白质序列或DNA序列产生相似性/同一性矩阵的一种应用)。如本领域技术人员显而易见,可以进行少许手工编辑以优化保守基序之间的比对结果。此外,作为使用全长序列以鉴定同源物的替代,也可以使用特定结构域。对于局部比对,Smith-Waterman算法是特别有用的(Smith TF,Waterman MS(1981)J.Mol.Biol 147(1);195-7)。在下文实施例3中表述为百分数的序列同一性值利用上文提及的程序,使用默认参数在完整核酸或氨基酸序列范围和/或在所选择的结构域或保守基序范围内确定。
本发明通过用核酸序列转化植物进行说明,其中所述的核酸序列由编码SEQ ID NO:166的多肽序列的SEQ ID NO:165代表。然而,本发明的实施不限于这些序列;本发明的方法可以有利地使用如本文中定义的编码CycH的任意核酸的截短形式或CycH多肽实施。
编码CycH多肽的核酸的实例在本文实施例20的表K中给出。此类核酸在实施本发明方法中用于产生截短形式的细胞周期蛋白H。在实施例20的表K中给出的氨基酸序列是由SEQ ID NO:173所代表的CycH多肽的直向同源物和旁系同源物的示例序列,术语“直向同源物”和“旁系同源物”如本文中定义。其他直向同源物和旁系同源物可以通过开展所谓交互性blast搜索轻易地鉴定。通常,这包括第一BLAST,其中所述的第一BLAST包括将查询序列进行BLAST(例如使用实施例20的表K中列出的任意序列)针对任意序列数据库,如可公开获得的NCBI数据库进行BLAST。当从核苷酸序列开始时,一般使用BLASTN或TBLASTX(使用标准默认值),并且当从蛋白质序列开始时,使用BLASTP或TBLASTN(使用标准默认值)。可以任选地筛选BLAST结果。筛选结果或非筛选结果的全长序列随后针对来自生物的序列进行反向BLAST(第二BLAST),其中所述查询序列从所述生物衍生(在查询序列是SEQ ID NO:172或SEQ ID NO:173的情况下,所述第二BLAST因而将针对拟南芥属植物的序列进行)。随后比较第一BLAST和第二BLAST的结果。若来自第一blast的高阶位命中源自与衍生查询序列的物种相同的物种,则鉴定到旁系同源物,反向BLAST随后理想地在最高命中当中产生该查询序列;若高阶位命中不是源自与衍生查询序列的物种相同的物种,则鉴定到直向同源物,并且优选地在反向BLAST时,在最高命中当中产生该查询序列。
高阶位命中是具有低E-值的那些命中。E-值越低,评分越显著(或换句话说,偶然发现该命中的几率越低)。E-值的计算是本领域熟知的。除了E-值外,也通过同一性百分数评分来进行比较。同一性百分数指两个所比较的核酸(或多肽)序列之间特定长度范围内相同的核苷酸(或氨基酸)的数目。在大型家族的情况下,可以使用ClustalW,随后使用邻接树法,以帮助观察相关基因的聚集和鉴定直向同源物和旁系同源物。
核酸变体也可以用于实施本发明的方法中。术语“同源物”和“衍生物”如本文中定义。此类变体的实例包括编码在实施例20的表K中所给出任一氨基酸序列的同源物和衍生物的核酸,术语“同源物”和“衍生物”如本文中定义。还在本发明方法中使用的是这样的核酸,其编码在实施例20的表K中所给出任一氨基酸序列的直向同源物或旁系同源物的同源物和衍生物。在本发明方法中使用的同源物和衍生物与衍生它们的未修饰蛋白质具有基本上相同的生物学活性和功能活性。
在实施本发明方法中有用的其他核酸变体包括编码CycH多肽的核酸的部分、与编码CycH多肽的核酸杂交的核酸、编码CycH多肽的核酸的剪接变体、编码CycH多肽的核酸的等位变体和通过基因改组获得的编码CycH多肽的核酸的变体。全部这些核酸及其变体可以用来产生编码如上文所述的cycHTr多肽的核酸。术语“杂交序列”、“剪接变体”、“等位变体”和“基因改组作用”如本文中所述。
编码CycH多肽的核酸无需是全长核酸,因为实施本发明方法不依赖于使用全长核酸序列。根据本发明,提供了用于增强植物中产量相关性状的方法,包括在植物中导入并表达实施例20的表K中给出的任一核酸序列的一部分或编码在实施例20的表K中所给出任一氨基酸序列的直向同源物、旁系同源物或同源物的核酸的一部分。优选地,所述部分编码如上文所述的截短的细胞周期蛋白H多肽。
核酸的一部分可以例如通过对所述核酸产生一个或多个缺失而制备。所述部分可以以分离的形式使用或它们可以与其他编码(或非编码)序列融合,例如旨在产生联合几种活性的蛋白质。与其他编码序列融合时,在翻译时所产生的所得多肽可以比对于该蛋白质部分所预测的多肽更大。
在本发明方法中使用的部分编码如本文中定义的CycHTr多肽,并且基本上具有如SEQ ID NO:166的氨基酸序列相同的生物学活性。优选地,此部分是在实施例20的表K中给出的任一核酸的一部分,或是编码在实施例20的表K中所给出任一氨基酸序列的直向同源物或旁系同源物的核酸的一部分。优选地,所述部分的长度以增加的优选顺序是至少100,150,200,250或300个连续核苷酸,所述连续核苷酸是实施例20的表K中给出的任一核酸序列或是编码在实施例20的表K中所给出任一氨基酸序列的直向同源物或旁系同源物的核酸。更优选地,所述部分是SEQ ID NO:172的核酸的一部分,最优选地,所述部分是由SEQ ID NO:165代表的核酸。优选地,所述部分编码包含(本文所定义的任意一个或多个结构域或基序)的氨基酸序列。优选地,所述部分编码这样的氨基酸序列,当在构建系统发生树(如图15中所绘制的一个系统发生树)中使用时,所述氨基酸序列倾向于与包含由SEQ ID NO:166或SEQ ID NO:173所代表的氨基酸序列的CycHTr多肽组而不与任何其他组聚类。
在本发明方法中使用的另一种核酸变体是能够在降低的严格条件下、优选在严格条件下与编码如本文中定义的CycH多肽的核酸或与如本文中定义的部分杂交的核酸。
根据本发明,提供了用于增强植物中产量相关性状的方法,包括在植物中导入并表达能够与实施例20的表K中给出的任一核酸杂交的核酸,或包括在植物中导入并表达这样的核酸,其中所述核酸能够与编码在实施例20的表K中给出的任意核酸序列的直向同源物、旁系同源物或同源物的核酸杂交。优选地,杂交核酸编码如上文所述的截短的细胞周期蛋白H。
在本发明方法中使用的杂交序列编码如本文中定义的CycHTr多肽,并且基本上具有如SEQ ID NO:166的氨基酸序列相同的生物学活性。优选地,所述杂交序列能够与实施例20的表K中给出的任一核酸或与这些序列中任意序列的一部分杂交,所述的一部分如上文定义,或其中所述杂交序列能够与编码在实施例20的表K中给出的任一氨基酸序列的直向同源物或旁系同源物的核酸杂交。最优选地,所述杂交序列能够与如SEQ IDNO:165所代表的核酸或与其一部分杂交。优选地,所述杂交序列编码了包含如本文定义的任意一个或多个基序或结构域的氨基酸序列。优选地,所述杂交序列编码这样的氨基酸序列,当在构建系统发生树(如图15中所绘制的一个系统发生树)中使用时,所述氨基酸序列倾向于与包含由SEQID NO:166或SEQ ID NO:173所代表的氨基酸序列的CycHTr多肽组而不与任何其他组聚类。
在本发明方法中使用的另一种核酸变体是编码如上文所定义的CycH多肽的剪接变体,剪接变体如本文中定义。优选地,所述剪接变体或其部分编码如上文所述的CycHTr多肽。
根据本发明,提供了用于增强植物中产量相关性状的方法,包括在植物中导入并表达在实施例20的表K中给出的任一核酸序列的剪接变体,或导入并表达编码在实施例20的表K中所给出任一氨基酸序列的直向同源物、旁系同源物或同源物的核酸的剪接变体。优选地,所述剪接变体编码如上文所述的如上文所述的截短的细胞周期蛋白H。
优选的剪接变体是编码CycH多肽的截短形式的任一核酸的剪接变体,所述的CycH多肽在实施例20的表K中给出,或下述核酸的剪接变体,所述的核酸编码实施例20的表K中所给出的任一氨基酸序列的截短的直向同源物、旁系同源物或同源物。优选地,由所述剪接变体编码的氨基酸序列包含如本文中定义的CycHTr的任意一个或多个基序或结构域。优选地,由所述剪接变体编码的氨基酸序列在构建系统发生树(如图15中所绘制的一个系统发生树)中使用时,倾向于与包含由SEQ ID NO:166或SEQ ID NO:173所代表的氨基酸序列的CycH多肽组而不与任何其他组聚类。
在本发明方法中使用的另一种核酸变体是编码如上文所定义的CycH多肽的核酸的等位变体,等位变体如本文中定义。优选地,所述等位变体编码如上文所述的截短形式的细胞周期蛋白H。
根据本发明,提供了用于增强植物中产量相关性状的方法,包括在植物中导入并表达编码CycH多肽的截短形式的任一核酸的等位变体,所述的CycH多肽在实施例20的表K中给出,或在植物中导入并表达编码在实施例20的表K中所给出任一氨基酸序列的直向同源物、旁系同源物或同源物的核酸的等位变体。优选地,所述等位变体编码如上文所述的截短的细胞周期蛋白H。
由本发明方法中使用的等位变体编码的多肽基本上具有如SEQ IDNO:166的CycHTr多肽和在实施例20的表K中所述任一氨基酸序列的如上文所述截短形式那样的相同生物学活性。等位变体天然存在,并且在本发明的方法中包括这些天然等位基因的用途。优选地,所述等位变体是SEQ ID NO:165或SEQ ID NO:172的等位变体或编码SEQ ID NO:166或SEQ ID NO:173的直向同源物或旁系同源物的核酸的等位变体。优选地,由所述等位变体编码的氨基酸序列包含如本文中定义的CycHTr的任意一个或多个基序或结构域。优选地,由所述等位变体编码的氨基酸序列在构建系统发生树(如图15中所绘制的一个系统发生树)中使用时,倾向于与包含由SEQ ID NO:166或SEQ ID NO:173所代表的氨基酸序列的CycHTr多肽组而不与任何其他组聚类。
基因改组或定向进化也可以用来产生编码如上文定义的CycHTr多肽的核酸的变体;术语“基因改组”如本文中定义。
根据本发明,提供了用于增强植物中产量相关性状的方法,包括在植物中导入并表达在实施例20的表K中给出的任一核酸序列或其变体的一部分,或包括在植物中导入并表达下述核酸的一部分,其中所述的核酸编码在实施例20的表K中给出的任一氨基酸序列的直向同源物、旁系同源物或同源物,其中所述的核酸通过基因改组获得。优选地,所述部分编码如上文定义的截短的细胞周期蛋白H。
优选地,通过基因改组获得的变异核酸编码了包含如本文定义的任意一个或多个基序或结构域的氨基酸序列。优选地,由通过基因改组获得的变异核酸所编码的氨基酸序列在构建系统发生树(如图15中所绘制的一个系统发生树)中使用时,倾向于与包含由SEQ ID NO:166或SEQ ID NO:173所代表的氨基酸序列的CycH多肽组而不与任何其他组聚类。
另外,核酸变体也可以通过位点定向诱变获得。几种方法可用于实现位点定向诱变,最常见的是基于PCR的方法(Current Protocols inMolecular Biology.Wiley编辑)。
编码CycHTr多肽的核酸可以衍生自任何天然来源或人工来源。该核酸可以通过人类有意操作,在组成和/或基因组环境方面从其天然形式中修饰而来。优选地,编码CycHTr多肽的核酸来自植物,还优选来自双子叶植物,更优选来自十字花科、更优选来自拟南芥属,最优选地来自拟南芥。
本发明方法的实施产生了具有增强的产量相关性状的植物。尤其,本发明方法的实施产生这样的植物,该植物与对照植物相比较,具有提高的产量,尤其增加的生物量和/或提高的种子产量。术语“产量”和“种子产量”在本文的“定义”部分中更详细地描述。
本文谈及的增强的产量相关性状意指植物的一个或多个部分的生物量(重量)增加,所述的部分可以包括地上(可收获的)部分和/或(可收获的)地下部分。尤其,此类可收获部分是种子和/或(营养性)生物量,并且本发明方法的实施产生了相对于对照植物的生物量和种子产量,具有增加的生物量和/或提高的种子产量的植物。
以谷物(corn)为例,产量提高可以表现为以下一个或多个指标:每公顷或英亩已建立的植物数目增加,每株植物穗数的提高,行数、每行核粒数、核粒重、千粒核重、穗长度/直径的提高,种子充实率(即充实种子数除以种子总数并乘以100)提高,及其他。以稻为例,产量提高可以自身表现为下列一种或多种指标的提高:每公顷或英亩植物数、每株植物的花序数、每花序的小穗数、每花序的花(小花)数目(其表达为充实种子数对原发花序数的比)、种子充实率的提高(其中种子充实率是充实种子数除以种子总数并乘以100)、千粒核重提高及其他。
本发明提供相对于对照植物,用于提高植物的产量、尤其是植物的种子产量的方法,所述方法包括调节、优选提高植物中编码如本文中定义的CycHTr多肽的核酸的表达。
由于本发明的转基因植物具有提高的产量,故相对于对照植物的生长速率,这些植物有可能在其生活周期的对应阶段上表现提高的生长速率(在其生活周期的至少部分期间)。除了提高的产量能力之外,提高的营养摄取效率也可能有助于产量提高。观察到本发明的植物在营养摄取方面显示较高的效率。提高的营养摄取效率允许植物在胁迫下较好地生长。
提高的生长速率可以是植物的一个或多个部分(包括种子)特异的,或可以基本上遍及整个植物。生长速率提高的植物可以具备较短的生活周期。植物的生活周期可以意指从干燥成熟种子成长至植物已经产生与起始材料相似的干燥成熟种子的阶段所需要的时间。这个生活周期可以受以下因素影响,如早期生长势、生长速率、绿度指数、开花时间和种子成熟速度。生长速率的提高可以在植物生活周期的一个或多个阶段上或在整个植物生活周期期间发生。植物生活周期早期中提高的生长速率在可以反映增强的生长势。生长速率的提高可以改变植物的收获周期,从而导致植物较晚播种和/或较早收获,而这本来是不可能的(相似效果可以随较早的开花时间获得)。若生长速率充分提高,则可以允许进一步播种相同植物物种的种子(例如播种并收获稻植物,随后播种并收获其他稻植物,全部稻植物均出于一个常规生长时期中)。类似地,若生长速率充分地提高,可以允许进一步播种不同植物物种的种子(例如播种并收获谷物植物,随后例如播种并任选收获大豆、马铃薯或任何其他合适植物)。在一些作物植物的例子中,来自相同根状茎的额外收获次数也可以是可能的。改变植物的收获周期可以导致每英亩一年生物量生产提高(原因在于可以培育并收获任何具体植物的次数(即在一年中)提高)。生长速率的提高也可以允许转基因植物在比其野生型对应物更广泛的地理区域内培育,因为培育作物的地域限制往往由栽种时节(早季)或在收获时期(晚季)的不利环境条件所决定。这类不利条件可以避开,若缩短收获周期。生长速率可以通过从生长曲线获得多个参数而确定,此类参数可以是:T-Mid(植物达到其50%最大尺寸所花费的时间)和T-90(植物达到其50%最大尺寸所花费的时间),以及其他。
根据本发明的优选特征,本发明方法的实施产生了相对于对照植物而言,具有提高的生长速率的植物。因此,根据本发明,提供了用于提高植物生长速率的方法,所述方法包括在植物中调节、优选提高如本文中定义的编码CycHTr多肽的核酸的表达。
与对照植物相比较,当所述植物处于非胁迫条件下或当植物暴露于多种胁迫时,是否出现产量和/或生长速率的提高。植物一般通过生长得更慢而应答于胁迫暴露。在严重胁迫条件下,植物甚至可以完全停止生长。另一方面,轻度胁迫在本文中定义为植物所暴露的任何下述胁迫,其中所述的胁迫未导致植物完全停止生长,且没有再继续生长的能力。与非胁迫条件下的对照植物相比较,轻度胁迫在本发明意义中导致受胁迫植物的生长降低小于40%、35%或30%、优选地小于25%、20%或15%、更优选地小于14%、13%、12%、11%或10%或更低。由于农业实践(灌溉、施肥、杀虫剂处理)的进步,在栽培作物植物中并不经常遇到严重胁迫。因此,由轻度胁迫诱导的受损生长对于农业往往是不受欢迎的特征。轻度胁迫是植物所暴露的常见非生物性(环境)胁迫。非生物胁迫可以因干旱或过量的水、缺氧胁迫、盐胁迫、化学毒性、氧化胁迫和热、寒冷或冰冻温度所致。非生物胁迫可以是因水胁迫(尤其因为干旱)、盐胁迫、氧化胁迫或离子胁迫引起的渗透胁迫。
非生物性环境胁迫的另一个实例是需要由所述植物同化以生长和发育的一种或多种营养的可获量降低。因为营养可获量强烈地影响植物产量和产品品质,故将大量肥料倾注至田中以优化植物产量和产品品质。植物的生产量通常受三种主要营养素,即磷、钾和氮限制,这三种营养素中,氮通常是是植物生长的限速性元素。因此,植物生长所需的主要营养元素是氮(N)。氮是活细胞中存在的众多重要化合物的组成成分,所述的重要化合物包括氨基酸、蛋白质(酶)、核酸和叶绿素。植物干物质的1.5%-2%是氮和植物总蛋白的大约16%是氮。因此,氮可获量是作物植物生长和生产的主要限制性因素(Frink等(1999)Proc Natl Acad Sci USA 96(4):1175-1180),并且也对蛋白质聚集和氨基酸组成也有明显影响。因此,在氮限制性条件下培育时具有提高产量的植物是具有重大意义的。
生物胁迫一般是由病原体如细菌、病毒、线虫、真菌和昆虫引起的那些胁迫。
尤其,本发明的方法可以在非胁迫条件或轻微干旱条件下开展以产生相对于对照植物具有提高的产量的植物。如Wang等(Planta(2003)218:1-14)中报道,非生物胁迫导致一系列不利地影响植物生长及生产量的形态学、生理学、生物化学和分子变化。干旱、盐度、极端温度和氧化胁迫已知是相互联系的并可以通过相似机制诱导生长损害及细胞损害。Rabbani等(Plant Physiol(2003)133:1755-1767)描述了干旱胁迫与高盐度胁迫间极高程度的“交互作用”。例如,干旱和/或盐化作用主要地表现为渗透胁迫,从而导致细胞内稳态和离子分布的破坏。经常伴随高温或低温、盐度或干旱胁迫的氧化胁迫可以造成功能性蛋白和结构蛋白变性。因此,这些多样的环境胁迫常常激活相似的细胞信号途径和细胞应答,如产生胁迫蛋白、上调抗氧化物质、积累兼容性溶质和生长停滞。如本文中所用的术语“非胁迫”条件是允许植物最佳生长的环境条件。本领域技术人员清楚对于给定地点的正常土壤条件和气候条件。
本发明方法的实施产生了在非胁迫条件或轻微干旱条件下生长的植物,其相对于可比较条件下生长的合适对照植物而言,具有提高的产量。因而,根据本发明,提供了用于在非胁迫条件或轻微干旱条件下培育的植物中提高产量的方法,所述的方法包括在植物中提高编码CycHTr多肽的核酸表达。
本发明包括可由本发明方法获得的植物或其部分(包括种子)。所述植物或其部分包含编码如上文定义的CycHTr多肽的核酸转基因。
本发明也提供基因构建体和载体以促进在植物中导入和/或表达编码CycHTr多肽的核酸。所述基因构建体可以插入适于转化至植物并适于在转化细胞中表达目的基因的载体,所述载体可以是市售的。本发明也提供如本文中定义的基因构建体在本发明方法中的用途。
更具体地,本发明提供构建体,其包含
(a)如上文定义的编码CycHTr多肽的核酸;
(b)能够驱动(a)的核酸序列表达的一个或多个调控序列;和任选地
(c)转录终止序列。
优选地,编码CycHTr多肽的核酸是如上文定义的。术语“调控序列”和“终止序列”如本文中的定义。
植物用包含上文所述的任意核酸的载体转化。技术人员非常了解必须存在于所述载体上以便成功转化、选择和增殖含有目的序列的宿主细胞的遗传元件。所述目的序列有效地与一个或多个调控序列(至少与启动子)连接。
有利地,任意类型的启动子可以用来驱动所述核酸序列的表达。优选地,CycHTr核酸或其变体有效地与种子特异性启动子连接。种子特异性启动子在种子组织中优势地具有转录活性,但不是必需排他地在种子组织中具有转录活性(在泄露表达的情况下)。种子特异性启动子可以在种子发育和/或在萌发期间有活性。种子特异性启动子是本领域熟知的。优选地,所述种子特异性启动子是油质蛋白启动子或WSI18启动子,或功能等效的启动子。更优选地,所述启动子序列如SEQ ID NO:170,SEQ ID NO:171和SEQ ID NO:164之一所代表。应当明白本发明的应用不限于由SEQ IDNO:165代表的CycHTr核酸,本发明的应用也不限于CycHTr核酸在受种子特异性启动子驱动时的表达。也可以用来驱动CycHTr核酸表达的其他种子特异性启动子的实例在定义部分显示。
任选地,可以在导入植物的构建体中使用一个或多个终止子序列。其它的调节元件可以包括转录增强子和翻译增强子。本领域技术人员将知道可能适用于实施本发明的终止子和增强子序列。如定义部分中描述,内含子序列也可以添加至5′非翻译区(UTR)或编码序列中,以增加聚集在细胞质内的成熟信使的量。(除启动子、增强子、沉默子、内含子序列、3’UTR和/或5’UTR区域之外的)其他调控序列可以是蛋白质/或RNA稳定元件。此类序列将是已知的或可以由本领域技术人员轻易获得。
本发明的基因构建体还可以包括为在特定细胞类型中维持和/或复制所需要的复制起点序列。一个实例是当基因构建体需要作为游离型遗传元件(例如质粒或粘粒分子)维持在细菌细胞中时的复制起点。优选的复制起点包括但不限于f1-ori和colE1。
为检测如在本发明方法中使用的核酸序列的成功转移和/或选择包含这些核酸的转基因植物,有利的是使用标记基因(或报道基因)。因此,所述基因构建体可以任选地包含选择标记基因。选择标记在本文的“定义”部分中更详细地描述。一旦不再需要所述标记基因时,它们可以从转基因细胞中移出或切除。用于移出标记的技术是本领域已知的,有用技术在上文定义部分中描述。
本发明也提供用于产生转基因植物的方法,所述转基因植物相对于对照植物而言,具有增强的产量相关性状,其中所述方法包括在植物中导入并表达编码如上文所定义的CycHTr多肽的任意核酸。
更具体地,本发明提供用于产生具有增加的产量的转基因植物的方法,所述方法包括:
(a)在植物或植物细胞中导入并表达编码CycHTr多肽的核酸;和
(b)在促进植物生长和发育的条件下培养植物细胞。
所述核酸可以直接导入植物细胞或导入植物自身(包括导入组织、器官或植物的任何其他部分)。根据本发明的优选特征,该核酸优选地通过转化作用导入植物。术语“转化”在本文的“定义”部分中更详细地描述。
通常在转化后,对植物细胞或细胞群体选择一个或多个标记的存在性,其中所述标记由随同目的基因一起共转移的植物可表达基因编码,随后将转化材料再生成完整植物。为了选择转化植物,在所述转化中获得的植物材料原则上经历选择性条件,从而转化植物可以与非转化植物区分。例如,可以将以上述方式获得的种子播种,并且在初始培育时间后,通过喷洒进行合适的选择。另一种可能性在于(根据需要)消毒后,在使用合适选择剂的琼脂板上培育种子,从而仅转化的种子可以长成植物。或者,对所述转化植物筛选选择标记(如上文所述的选择标记)的存在性。
在DNA转移和再生后,推定转化的植物也可以例如使用DNA印迹分析对目的基因的存在性、拷贝数和/或基因组构造进行评价。备选地或额外地,新导入的DNA的表达水平可以使用RNA印迹分析和/或蛋白质印迹分析或这两种分析法监测,这两项技术均是本领域普通技术人员熟知的。
产生的转化植物可以通过多种方法繁殖,如通过克隆繁殖法或经典育种技术。例如,第一世代(或T1)转化植物可以进行自交并且选择纯合的第二世代(或T2)转化体,并且T2植物随后可以通过经典育种技术进一步繁殖。
产生的转化生物可以采取多种形式。例如,它们可以是转化细胞和非转化细胞的嵌合体;克隆性转化体(例如,被转化以含有表达盒的全部细胞);转化组织和非转化组织的移植体(例如在植物中,与未转化接穗嫁接的转化根状茎)。
本发明明确地扩展至由本文中所述的任意方法产生的任意植物细胞或植物,并扩展至全部植物部分及其繁殖体。本发明进一步扩展以包括已经由前述任意方法产生的原代转化或转染细胞、组织、器官或完整植物的后代,唯一要求是后代表现与如本发明方法中的亲代相同的基因型和/或表型特征。
本发明也包括含有编码如上文所定义的CycHTr多肽的分离核酸的宿主细胞。本发明的优选宿主细胞是植物细胞。在本发明方法中所用核酸或载体、表达盒或构建体或载体的宿主植物原则上有利地是能够合成在本发明方法中所使用多肽的全部植物。
本发明的方法有利地适用于任意植物。
在本发明方法中特别有用的植物包括属于植物界(Viridiplantae)超家族、尤其单子叶和双子叶植物的全部植物,包括饲用或饲料豆科植物、观赏植物、粮食作物、树或灌木。根据本发明的一个优选实施方案,所述植物是作物植物。作物植物的实例包括大豆、向日葵、卡诺拉油菜、苜蓿、油菜籽、棉花、番茄、马铃薯和烟草。更优选地,所述植物是单子叶植物。单子叶植物的实例包括甘蔗。更优选地,所述植物是谷物植物。谷物植物的实例包括稻、玉米、小麦、大麦、谷子、黑麦、高粱、二粒小麦、斯卑尔脱小麦、黑麦属、单粒小麦、埃塞俄比亚画眉草、买罗高粱和燕麦。
本发明也扩展至植物的可收获部分如,但不限于种子、叶、果实、花、茎、根状茎、块茎和球茎。本发明进一步涉及了衍生自、优选直接衍生自此种植物的可收获部分的产品,如干燥颗粒或粉末、油、脂肪和脂肪酸、淀粉或蛋白质。
根据本发明的优选特征,受调节的表达是提高的表达。本领域充分记录了用于提高核酸或基因或基因产物表达的方法并且在定义部分中提供了例子。
如上所述,用于调节(优选地提高)编码CycHTr多肽的核酸表达的优选方法是通过在植物中导入并表达编码CycHTr多肽的核酸;然而,实施本方法的效果,即增强产量相关性状,也可以使用其他熟知技术实现,所述的其他熟知技术包括但不限于T-DNA活化标签技术、TILLING、同源重组法。在定义部分中提供了对这些技术中某些技术的描述。
另外,EMS诱变或使用T-DNA或转座子的插入诱变可以用于在内源性CycH基因中产生突变,从而导致形成编码CycHTR的序列。这些技术是本领域熟知的。
本发明也包括编码如本文中所述CycHTr多肽的核酸的用途,和这些CycHTr多肽在植物中增强任意的前述产量相关性状的用途。
编码本文中所述CycHTr多肽的核酸或CycHTr多肽自身可以用于育种程序中,在所述育种程序中鉴定到可以遗传地与编码CycHTr多肽的基因连接的DNA标记。所述核酸/基因或CycHTr多肽自身可以用来定义分子标记。这种DNA或蛋白质标记随后可以在育种程序中用来在本发明的方法中选择具有如上文所定义的增强的产量相关性状的植物。
编码CycHTr多肽的核酸/基因的等位变体也可以用于标记辅助的育种程序中。这种育种程序有时需要使用例如EMS诱变法通过对植物进行诱变处理而导入等位变异;备选地,该程序可以从收集并非故意造成的所谓“自然”源性等位变体开始。随后进行等位变体的鉴定,例如通过PCR法。此后是步骤:选择所讨论和导致产量提高的序列的优异等位变体。选择一般通过监测含有所讨论序列的不同等位变体的植物的生长性能而实施。生长性能可以在温室或在田间监测。其他任选步骤包括使其中鉴定到优异等位变体的植物与另一种植物杂交。这可能用来例如产生感兴趣的表型特征组合。
编码CycHTr多肽的核酸也可以作为探针用于遗传地或物理地绘制所述探针构成其一部分的基因并且作为标记用于与这些基因连锁的性状。此类信息可以用于植物育种,旨在开发具有所希望表型的品系。编码CycHTr多肽的核酸的这种用途仅需要具有至少15个核苷酸长度的核酸序列。编码CycHTr多肽的核酸可以用作限制性片段长度多态性(RFLP)标记。限制性消化的植物基因组DNA的DNA印迹物(Sambrook J,Fritsch EF和Maniatis T(1989)Molecular Cloning,A Laboratory Manual)可以用编码CycHTr多肽的核酸探测。所得的结合图式随后可以使用计算机程序如MapMaker(Lander等(1987)Genomics 1:174-181)进行遗传分析以构建遗传图。此外,该核酸可以用来探测含有一组个体的限制性核酸内切酶处理的基因组DNA的DNA印迹物,其中所述的一组个体代表具有定义的遗传杂交的亲代和后代。标出DNA多态性的分离并用来计算编码CycHTr多肽的核酸在先前使用这个群体获得的遗传图中的位置(Botstein等(1980)Am.J.Hum.Genet.32:314-331)。
在Bernatzky和Tanksley(1986)Plant Mol.Biol.Reporter 4:37-41中描述了植物基因来源的探针的产生及其在遗传作图中的用途。众多出版物描述了使用以上所提及的方法学或其改良法对特定cDNA克隆的遗传作图。例如,F2互交群、回交群、随机交配群、邻近纯合系和其他个体群体可以用于作图。此类方法学是本领域技术人员熟知的。
所述核酸探针也可以用于物理作图(即序列在物理图上的排列;见Hoheisel等在:Non-mammalian Genomic Analyasis:A Practical Guide,Academic press 1996,第319-346页及其中引用的参考文献)。
在另一实施方案中,核酸探针可以在直接荧光原位杂交(FISH)作图法(Trask(1991)Trends Genet.7:149-154)中使用。尽管当前的FISH作图法支持使用大的克隆(几个kb至几百个kb;见Laan等(1995)Genome Res.5:13-20),然而灵敏度的改善可以允许使用更短探针进行FISH作图。
用于遗传作图及物理作图的多种基于核酸扩增的方法可以使用所述核酸而实施。方法实例包括等位基因特异性扩增法(Kazazian(1989)J.Lab.Clin.Med 11:95-96)、PCR扩增片段的多态性(CAPS;Sheffield等(1993)Genomics 16:325-332)、等位基因特异性连接(Landegren等(1988)Science241:1077-1080)、核苷酸延伸反应(Sokolov(1990)Nucleic Acid Res.18:3671)、放射杂交作图(Walter等(1997)Nat.Genet.7:22-28)和Happy作图法(Dear和Cook(1989)Nucleic Acid Res.17:6795-6807)。对于这些方法,使用一种核酸的序列来设计并产生用于扩增反应或引物延伸反应中的引物对。这类引物的设计是本领域技术人员熟知的。在使用基于PCR遗传作图的方法中,可能需要在对应于当前核酸序列的区域中鉴定作图交叉的亲代之间的DNA序列差异。然而,这通常对作图法而言不是必需的。
本发明方法产生了具有如前文所述提高的产量的植物。这些性状也可以与经济上有利的其他性状组合,如其他的产量增强性状、针对其他非生物胁迫和生物胁迫的耐受性、调节多种构造性特征和/或生物化学特征和/或生理学特征的性状。
IV.Remorin
根据第一实施方案,本发明提供相对于对照植物用于增强植物中产量相关性状的方法,包括提高植物中编码Remorin多肽的核酸序列的表达。
用于提高编码Remorin多肽的核酸序列表达的优选方法是在植物中导入并表达编码Remorin多肽的核酸序列。
下文任一谈及的“在本发明方法中使用的蛋白质”意指如本文中定义的Remorin多肽。下文任一谈及的“在本发明方法中使用的核酸”意指能够编码这种Remorin多肽的核酸,待导入植物(并且因而在实施本发明方法中使用)的核酸是编码现在所描述的蛋白质类型的任意核酸,下文也称作“Remorin核酸序列”或“Remorin基因”。
如本文中定义的术语Remorin多肽”指包含(i)羧基端Remorin结构域(对应于Pfam家族登录号PF03763);和(ii)预测的羧基端卷曲螺旋结构域的任意多肽。
此外,如本文中定义的“Remorin多肽”额外地包含以下项之一或这两者:(i)富含带电荷氨基酸的羧基端Remorin结构域;(ii)在所述多肽的羧基端的最后10个氨基酸残基中包含至少一个Cys和/或一个Phe。
备选地或额外地,如本文中定义的“Remorin多肽”指包含如此羧基端Remorin结构域的任意多肽,所述的羧基端Remorin结构域以增加的优选顺序与如SEQ ID NO:326所代表的羧基端Remorin结构域具有至少15%、20%、25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、98%、99%或更大的序列同一性。
备选地或额外地,如本文中定义的“Remorin多肽”指如下的任意多肽,所述多肽以增加的优选顺序与如SEQ ID NO:199所代表的Remorin多肽具有至少10%、15%、20%、25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、98%、99%或更大的序列同一性。
术语“结构域”和“基序”在本文中的“定义”部分定义。存在用于鉴定结构域的专业数据库,例如,SMART(Schultz等(1998)Proc.Natl.Acad.Sci.USA 95,5857-5864;Letunic等(2002)Nucleic Acids Res 30,242-244)、InterPro(Mulder等,(2003)Nucl.Acids.Res.31,315-318)、Prosite(Bucher和Bairoch(1994),用于生物分子序列基序的概括特征结构及其在自动化序列解读中的功能(A generalized profile syntax for biomolecular sequencesmotifs and its function in automatic sequence interpretation).(在)ISMB-94;第二届分子生物学智能系统国际会议文集.Altman R.,BrutlagD.,Karp P.,Lathrop R.,Searls D.编辑,第53-61页,AAAIPress,MenloPark;Hulo等,Nucl.Acids.Res.32:D134-D137,(2004)或Pfam(Bateman等,Nucleic Acids Research 30(1):276-280(2002))。一组用于计算机方式分析蛋白质序列的工具可在ExPASY蛋白质组服务器上获得(瑞士生物信息研究所维护(Gasteiger等,ExPASy:深入认识和分析蛋白质的蛋白质组服务器,Nucleic Acids Res.31:3784-3788(2003))。结构域也可以使用常规技术如通过序列比对进行鉴定。结构域也可以使用常规技术如通过序列比对进行鉴定。对SEQ ID NO:199的多肽序列的分析在下文实施例32和34中描述。羧基端Remorin结构域在Pfam数据库中鉴定为Pfam家族登录号PF03763,在Prodom数据库中鉴定为登录号PD350442。在Pfam数据库中鉴定的SEQ ID NO:199的羧基端Remorin结构域是如SEQ ID NO:326代表的。因为Remorin多肽的羧基端Remorin结构域之间的同一性百分数是众所周知的,因而使用专业化数据库(如Pfam)的算法鉴定此类结构域是特别有用的。
“N端”(又称作“氨基末端”或“氨基端”)在本文中意指以带有游离氨基(-NH2)的氨基酸为结尾的蛋白质或多肽或肽的末端。蛋白质或多肽或肽的“C端”(又称作“羧基末端”或“羧基端”)是以游离羧基(-COOH)结尾的氨基酸链的末端。“羧基端的半部分(C-terminus half)”在本文中意指包含所述羧基端的半部分多肽。“羧基端结构域”在本文中意指在包含所述羧基端的半部分多肽中包含的结构域。可以单纯地通过目视检验法确定在Remorin多肽的羧基端最后10个氨基酸残基中存在至少一个Cys和/或一个Phe。一旦确定Remorin多肽的羧基端,则检验该羧基端上游的10个氨基酸残基(从氨基端的方向)至少一个Cys和/或一个Phe的存在。
用于比对序列以进行比较的方法是本领域熟知的,此类方法包括GAP、BESTFIT、BLAST、FASTA和TFASTA。GAP使用Needleman和Wunsch算法((1970)J Mol Biol 48:443-453)以找到使匹配数最大化并使空位数最小化的两个序列的总体(即覆盖完整序列的)比对结果。BLAST算法(Altschul等(1990)J Mol Biol 215:403-10)计算序列同一性百分数并在两个序列之间开展相似性的统计分析。用于执行BLAST分析的软件是通过国家生物技术信息中心(NCBI)可公开获得的。同源物可以使用例如ClustalW多重序列比对算法(1.83版本),以默认配对比对参数和百分数评分方法轻易地鉴定。相似性和同一性的总体百分数也可以使用MatGAT软件包中的可用方法之一确定(Campanella等,BMC Bioinformatics.2003年7月10日;4:29.MatGAT:使用蛋白质序列或DNA序列产生相似性/同一性矩阵的一种应用)。如本领域技术人员显而易见,可以进行少许手工编辑以优化保守基序之间的比对结果。此外,作为使用全长序列以鉴定同源物的替代,也可以使用特定结构域。对于局部比对,Smith-Waterman算法是特别有用的(Smith TF,Waterman MS(1981)J.Mol.Biol 147(1);195-7)。利用上文提及的程序,使用默认参数在完整核酸序列或多肽序列(本文中表Q)范围和/或在所选择的结构域(如由SEQ ID NO:326所代表的羧基端Remorin结构域;本文中表Q1)或保守基序范围内确定在下文实施例33中表述为百分数的序列同一性值。Remorin多肽之间的同一性百分数据称是低的(低至10%),Remorin多肽的羧基端Remorin结构域之间的同一性百分数据称略高(15%或更大)。
此外,可以使用计算机算法或单纯地通过目视检验法确定富含特定氨基酸的区域(如富含带电荷氨基酸的结构域)的存在。对于前者,可以使用来自ExPASy服务器的软件程序、尤其ProtParam工具Gasteiger E等(2003)ExPASy:深入认识和分析蛋白质的蛋白质组服务器.Nucleic AcidsRes 31:3784-3788)来计算某个多肽区域的主要氨基酸组成(%),以确定某个多肽区域是否富含特定氨基酸。目的多肽的组成随后可以与Swiss-Prot蛋白质序列数据库中的平均氨基酸组成(%)比较。在所述数据库中,带电荷的氨基酸(Asp、Glu、Lys和Arg)的平均%是23%(本文中表F)。如本文中定义的,假如Remorin结构域的带电荷氨基酸残基的百分数高于Swiss-Prot蛋白质序列数据库中带电荷氨基酸的百分数,则Remorin多肽的羧基端Remorin结构域富含带电荷的氨基酸。优选地,Remorin多肽的羧基端Remorin结构域中带电荷氨基酸残基的百分数比Swiss-Prot蛋白质序列数据库中带电荷氨基酸的百分数高1%、2%、3%、4%、5%、6%、7%、8%、9%、10%、11%、12%、13%、14%、15%、16%、17%、18%、19%、20%、21%、22%、23%、24%、25%、26%、27%、28%、29%、30%或更大。例如,如SEQ ID NO:326所代表的羧基端Remorin结构域包含40%的带电荷的氨基酸,尤其Lys、Arg和Glu,如实施例36中所述。
卷曲螺旋对于鉴定相同蛋白质、相同家族的蛋白质和不相关蛋白质的蛋白质-蛋白质相互作用(如寡聚化)是重要的。Remorin多肽可以与自身相互作用,或与Remorin直向同源物或旁系同源物相互作用。最近在从序列数据计算性预测卷曲螺旋方面取得长足进展。本领域技术人员熟知的算法可自瑞士生物信息研究所维护的ExPASy蛋白质组工具COILS,PAIRCOIL,PAIRCOIL2,MULTICOIL或MARCOIL获得。在实施例36和图19中分别显示如通过COILS算法分析所产生的SEQ ID NO:199的数字结果和图形结果。在如SEQ ID NO:199所代表的Remorin多肽序列中鉴定到预测的羧基端卷曲螺旋结构域。
本发明通过用SEQ ID NO:198所代表的核酸序列转化植物进行说明,其中所述的核酸序列编码SEQ ID NO:199的多肽序列。然而,本发明的实施不限于这些序列;本发明的方法可以有利地使用编码Remorin的任意核酸序列或如本文中定义的Remorin多肽实施。
编码植物Remorin多肽的核酸序列的实例在本文实施例31的表P中给出。此类核酸序列用于实施本发明的方法中。在实施例31的表P中列出的多肽序列是由SEQ ID NO:199所代表的Remorin多肽的直向同源物和旁系同源物的示例序列,术语“直向同源物”和“旁系同源物”如本文中定义。其他直向同源物和旁系同源物可以通过开展所谓交互性blast搜索轻易地鉴定。通常,这包括第一BLAST,其中所述的第一BLAST包括将查询序列进行BLAST(例如使用实施例31的表P中列出的任意序列)针对任意序列数据库,如可公开获得的NCBI数据库。当从核苷酸序列开始时,一般使用BLASTN或TBLASTX(使用标准默认值),并且当从蛋白质序列开始时,使用BLASTP或TBLASTN(使用标准默认值)。可以任选地筛选BLAST结果。筛选结果或非筛选结果的全长序列随后针对来自生物的序列进行反向BLAST(第二BLAST),其中所述查询序列从所述生物衍生(在查询序列是SEQ ID NO:198或SEQ ID NO:199的情况下,所述第二BLAST因而将针对拟南芥属植物的序列进行)。随后比较第一BLAST和第二BLAST的结果。若来自第一blast的高阶位命中源自与衍生查询序列的物种相同的物种,则鉴定到旁系同源物,反向BLAST随后理想地在最高命中当中产生该查询序列;若高阶位命中不是源自与衍生查询序列的物种相同的物种,则鉴定到直向同源物,并且优选地在反向BLAST时,在最高命中当中产生该查询序列。
高阶位命中是具有低E-值的那些命中。E-值越低,评分越显著(或换句话说,偶然发现该命中的几率越低)。E-值的计算是本领域熟知的。除了E-值外,也通过同一性百分数评分来进行比较。同一性百分数指两个所比较的核酸(或多肽)序列之间特定长度范围内相同的核苷酸(或氨基酸)的数目。在大型家族的情况下,可以使用ClustalW,随后使用邻接树法,以帮助观察相关基因的聚集和鉴定直向同源物和旁系同源物。
核酸变体也可以用于实施本发明的方法中。术语“同源物”和“衍生物”如本文中定义。此类变体的实例包括编码在实施例31的表P中所列出任一多肽序列的同源物和衍生物的核酸序列,术语“同源物”和“衍生物”如本文中定义。还在本发明方法中使用的是这样的核酸序列,其编码在实施例31的表P所列出任一多肽序列的直向同源物或旁系同源物的同源物和衍生物。在本发明方法中使用的同源物和衍生物与衍生它们的未修饰蛋白质具有基本上相同的生物学活性和功能活性。
在实施本发明方法中有用的其他核酸变体包括编码Remorin多肽的核酸序列的部分、与编码Remorin多肽的核酸序列杂交的核酸序列、编码Remorin多肽的核酸序列的剪接变体、编码Remorin多肽的核酸序列的等位变体和通过基因改组获得的编码Remorin多肽的核酸序列的变体。全部这些核酸序列及其变体可以用来产生编码如上文所述的Remorin多肽的核酸序列。术语“部分”、“杂交序列”、“剪接变体”、“等位变体”和“基因改组作用”如本文中所述。
编码Remorin多肽的核酸无需是全长核酸序列,因为实施本发明方法不依赖于使用全长核酸序列。根据本发明,提供了用于增强植物中产量相关性状的方法,包括在植物中导入并表达实施例31的表P中列出的任一核酸序列的一部分或编码在实施例31的表P中所列出的任意多肽序列的直向同源物、旁系同源物或同源物的核酸序列的一部分。
核酸序列的一部分可以例如通过对所述核酸序列进行一个或多个缺失而制备。所述部分可以以分离的形式使用或它们可以与其他编码(或非编码)序列融合,例如旨在产生联合几种活性的蛋白质。与其他编码序列融合时,在翻译时所产生的所得多肽可以比对于该蛋白质部分所预测的多肽更大。
在本发明方法中使用的部分编码如本文中定义的Remorin多肽,并且基本上具有如实施例31的表P中所列出多肽序列那样的相同生物学活性。优选地,此部分是在实施例31的表P中列出的任一核酸序列的一部分,或是编码在实施例31的表P中所列出任一多肽序列的直向同源物或旁系同源物的核酸序列的一部分。优选地,所述部分的长度以增加的优选顺序是至少200,300,400,500或600个连续核苷酸,所述连续核苷酸是实施例31的表P中列出的任一核酸序列或是编码在实施例31的表P中所列出任一多肽序列的直向同源物或旁系同源物的核酸序列。优选地,所述部分编码包含本文所定义的任意一个或多个结构域或基序的多肽序列。最优选地,所述部分是SEQ ID NO:198的核酸序列的一部分。
在本发明方法中使用的另一种核酸变体是能够在降低的严格条件下、优选在严格条件下与编码如本文中定义的Remorin多肽的核酸序列或与如本文中定义的部分杂交的核酸序列。
根据本发明,提供了用于增强植物中产量相关性状的方法,包括在植物中导入并表达能够与实施例31的表P中列出的任一核酸序列杂交的核酸序列,或包括在植物中导入并表达这样的核酸序列,其中所述核酸序列能够与编码在实施例31的表P中所列出任意核酸序列的直向同源物、旁系同源物或同源物的核酸序列杂交。
在本发明方法中使用的杂交序列编码如本文中定义的Remorin多肽,并且基本上具有如实施例31的表P中所列出多肽序列那样的相同生物学活性。优选地,所述杂交序列能够与实施例31的表P中列出的任一核酸序列或与这些序列中任意序列的一部分杂交,所述的一部分如上文定义,或其中所述杂交序列能够与编码在实施例31的表P中所列出任一多肽序列的直向同源物或旁系同源物的核酸序列杂交。优选地,所述杂交序列编码了包含如本文定义的任意一个或多个基序或结构域的多肽序列。最优选地,所述杂交序列能够与如SEQ ID NO:198所代表的核酸序列或与其一部分杂交。
在本发明方法中使用的另一种核酸变体是编码如上文所定义的Remorin多肽的剪接变体,剪接变体如本文中定义。
根据本发明,提供了用于增强植物中产量相关性状的方法,包括在植物中导入并表达在实施例31的表P中列出的任一核酸序列的剪接变体,或导入并表达编码在实施例31的表P中所列出的任意多肽序列的直向同源物、旁系同源物或同源物的核酸序列的剪接变体。
在本发明方法中使用的剪接变体基本上具有如SEQ ID NO:199的Remorin多肽和实施例31的表P中所列出的任意多肽序列那样的相同生物学活性。优选地,由所述剪接变体编码的多肽序列包含如本文中定义的任意一个或多个基序或结构域。最优选地,所述剪接变体是SEQ ID NO:198的核酸序列的剪接变体或是编码SEQ ID NO:199的直向同源物或旁系同源物的核酸序列的剪接变体。
在本发明方法中使用的另一种核酸变体是编码如上文所定义的Remorin多肽的核酸序列的等位变体,等位变体如本文中定义。
根据本发明,提供了用于增强植物中产量相关性状的方法,包括在植物中导入并表达在实施例31的表P中列出的任一核酸序列的等位变体,或导入并表达编码在实施例31的表P中所列出的任意多肽序列的直向同源物、旁系同源物或同源物的核酸序列的等位变体。
在本发明方法中使用的等位变体基本上具有如SEQ ID NO:199的Remorin多肽和实施例31的表P中所列出的任意多肽序列那样的相同生物学活性。等位变体天然存在,并且在本发明的方法中包括这些天然等位基因的用途。优选地,由所述等位变体编码的多肽序列包含如本文中定义的任意一个或多个基序或结构域。最优选地,所述等位变体是SEQ ID NO:198的等位变体或是编码SEQ ID NO:199的直向同源物或旁系同源物的核酸序列的等位变体。
基因改组或定向进化也可以用来产生编码如上文定义的Remorin多肽的核酸序列的变体;术语“基因改组”如本文中定义。
根据本发明,提供了用于增强植物中产量相关性状的方法,包括在植物中导入并表达在实施例31的表P中列出的任一核酸序列的变体,或包括在植物中导入并表达下述核酸序列的变体,所述的核酸序列编码在实施例31的表P中列出的任意多肽序列的直向同源物、旁系同源物或同源物,其中所述的变异核酸序列通过基因改组获得。
通过基因改组获得的在本发明方法中使用的变异核酸序列基本上具有如SEQ ID NO:199的Remorin多肽和实施例31的表P中所述任意多肽序列那样的相同生物学活性。优选地,通过基因改组获得的变异核酸序列编码了包含如本文定义的任意一个或多个基序或结构域的多肽序列。
另外,核酸变体也可以通过位点定向诱变获得。几种方法可用于实现位点定向诱变,最常见的是基于PCR的方法(Current Protocols inMolecular Biology.Wiley编辑)。
编码Remorin多肽的核酸序列可以衍生自任何天然来源或人工来源。该核酸序列可以通过人类有意操作,在组成和/或基因组环境方面从其天然形式中修饰而来。优选地,编码Remorin多肽的核酸序列来自植物,还优选来自双子叶植物,更优选来自十字花科,最优选地来自拟南芥。
本发明方法的实施产生了相对于对照植物而言,具有增强的产量相关性状的植物。尤其,本发明方法的实施产生了相对于对照植物而言,具有提高的产量、尤其提高的种子产量的植物。术语“产量”和“种子产量”在本文的“定义”部分中更详细地描述
本文谈及的增强的产量相关性状意指植物的一个或多个部分的生物量(重量)增加,所述的部分可以包括地上(可收获的)部分和/或(可收获的)地下部分。尤其,此类可收获部分是种子,并且本发明方法的实施产生了相对于合适对照植物,具有增强的产量相关性状的植物
以谷物(corn)为例,产量提高可以表现为以下一个或多个指标:每公顷或英亩已建立的植物数目增加,每株植物穗数的提高,行数、每行核粒数、核粒重、千粒核重、穗长度/直径的提高,种子充实率(即充实种子数除以种子总数并乘以100)提高,及其他。以稻为例,产量提高可以自身表现为下列一种或多种指标的提高:每公顷或英亩植物数、每株植物的花序数、每花序的小穗数、每花序的花(小花)数目(其表达为充实种子数对原发花序数的比)、种子充实率的提高(其中种子充实率是充实种子数除以种子总数并乘以100)、千粒核重提高及其他。
本发明提供相对于对照植物,用于增强植物的产量相关性状的方法,所述方法包括提高植物中编码如本文中定义的Remorin多肽的核酸序列的表达。优选地,增强的产量相关性状是以下一项或多项:(i)提高的种子充实率;(ii)提高的每株植物种子总产量;(iii)增加的充实种子数;(iv)增加的种子总数;(v)提高的千粒核重(TKW)或(vi)提高的收获指数。
由于本发明的转基因植物具有增强的产量相关性状,故相对于对照植物的生长速率,这些植物有可能在其生活周期的对应阶段上表现提高的生长速率(在其生活周期的至少部分期间)。
提高的生长速率可以是植物的一个或多个部分(包括种子)特异的,或可以基本上遍及整个植物。生长速率提高的植物可以具备较短的生活周期。植物的生活周期可以意指从干燥成熟种子成长至植物已经产生与起始材料相似的干燥成熟种子的阶段所需要的时间。这个生活周期可以受以下因素影响,如早期生长势、生长速率、绿度指数、开花时间和种子成熟速度。生长速率的提高可以在植物生活周期的一个或多个阶段上或在整个植物生活周期期间发生。植物生活周期早期中提高的生长速率在可以反映增强的生长势。生长速率的提高可以改变植物的收获周期,从而导致植物较晚播种和/或较早收获,而这本来是不可能的(相似效果可以随较早的开花时间获得)。若生长速率充分提高,则可以允许进一步播种相同植物物种的种子(例如播种并收获稻植物,随后播种并收获其他稻植物,全部稻植物均出于一个常规生长时期中)。类似地,若生长速率充分地提高,可以允许进一步播种不同植物物种的种子(例如播种并收获谷物植物,随后例如播种并任选收获大豆、马铃薯或任何其他合适植物)。在一些作物植物的例子中,来自相同根状茎的额外收获次数也可以是可能的。改变植物的收获周期可以导致每英亩一年生物量生产提高(原因在于可以培育并收获任何具体植物的次数(即在一年中)提高)。生长速率的提高也可以允许转基因植物在比其野生型对应物更广泛的地理区域内培育,因为培育作物的地域限制往往由栽种时节(早季)或在收获时期(晚季)的不利环境条件所决定。这类不利条件可以避开,若缩短收获周期。生长速率可以通过从生长曲线获得多个参数而确定,此类参数可以是:T-Mid(植物达到其50%最大尺寸所花费的时间)和T-90(植物达到其50%最大尺寸所花费的时间),以及其他。
根据本发明的优选特征,本发明方法的实施产生了相对于对照植物而言,具有提高的生长速率的植物。因此,根据本发明,提供了用于提高植物生长速率的方法,所述方法包括提高植物中编码如本文中定义的Remorin多肽的核酸序列的表达。
与可比较条件下生长的对照植物相比较,当所述植物处于非胁迫条件下或当植物暴露于多种胁迫时,是否出现产量和/或生长速率的提高。植物一般通过生长得更慢而应答于胁迫暴露。在严重胁迫条件下,植物甚至可以完全停止生长。另一方面,轻度胁迫在本文中定义为植物所暴露的任何下述胁迫,其中所述的胁迫未导致植物完全停止生长,且没有再继续生长的能力。与非胁迫条件下的对照植物相比较,轻度胁迫在本发明意义中导致受胁迫植物的生长降低小于40%、35%或30%、优选地小于25%、20%或15%、更优选地小于14%、13%、12%、11%或10%或更低。由于农业实践(灌溉、施肥、杀虫剂处理)的进步,在栽培作物植物中并不经常遇到严重胁迫。因此,由轻度胁迫诱导的受损生长对于农业往往是不受欢迎的特征。轻度胁迫是植物所暴露的常见非生物性(环境)胁迫。非生物胁迫可以因干旱或过量的水、缺氧胁迫、盐胁迫、化学毒性、氧化胁迫和热、寒冷或冰冻温度所致。非生物胁迫可以是因水胁迫(尤其因为干旱)、盐胁迫、氧化胁迫或离子胁迫引起的渗透胁迫。生物胁迫一般是由病原体如细菌、病毒、线虫、真菌和昆虫引起的那些胁迫。
尤其,本发明的方法可以在非胁迫条件或轻微干旱条件下开展以产生相对于对照植物具有增强的产量相关性状的植物。如Wang等(Planta(2003)218:1-14)中报道,非生物胁迫导致一系列不利地影响植物生长及生产量的形态学、生理学、生物化学和分子变化。干旱、盐度、极端温度和氧化胁迫已知是相互联系的并可以通过相似机制诱导生长损害及细胞损害。Rabbani等(Plant Physiol(2003)133:1755-1767)描述了干旱胁迫与高盐度胁迫间极高程度的“交互作用”。例如,干旱和/或盐化作用主要地表现为渗透胁迫,从而导致细胞内稳态和离子分布的破坏。经常伴随高温或低温、盐度或干旱胁迫的氧化胁迫可以造成功能性蛋白和结构蛋白变性。因此,这些多样的环境胁迫常常激活相似的细胞信号途径和细胞应答,如产生胁迫蛋白、上调抗氧化物质、积累兼容性溶质和生长停滞。如本文中所用的术语“非胁迫”条件是允许植物最佳生长的环境条件。本领域技术人员清楚对于给定地点的正常土壤条件和气候条件。
本发明方法的实施产生了相对于在可比较条件下生长的对照植物而言,在非胁迫条件或轻微干旱条件下生长的具有增强的产量相关性状的植物。因此,根据本发明,提供了用于在非胁迫条件或轻微干旱条件下的植物中增强产量相关性状的方法,所述方法包括提高植物中编码如上文定义的Remorin多肽的核酸序列的表达。
本发明方法的实施产生了相对于在可比较条件下生长的对照植物而言,在营养素缺乏条件下、尤其在氮缺乏条件下培育的具有提高产量的植物。因此,根据本发明,提供了用于在营养缺乏条件下培育的植物中提高产量的方法,所述方法包括调节植物中编码Remorin多肽的核酸的表达。营养缺乏可以因营养素如氮、磷酸盐和其他含磷化合物、钾、钙、镉、镁、锰、铁和硼及其他元素缺少所致。
本发明包括可由本发明方法获得的植物、植物部分(包括种子)和植物细胞。所述的植物、植物部分或植物细胞包含编码如上文定义的Remorin多肽的核酸转基因。
本发明也提供基因构建体和载体以促进在植物中导入和/或表达编码Remorin多肽的核酸序列。所述基因构建体可以插入适于转化至植物并适于在转化细胞中表达目的基因的载体,所述载体可以是市售的。本发明也提供如本文中定义的基因构建体在本发明方法中的用途。
更具体地,本发明提供构建体,其包含
(a)编码如上文定义的Remorin多肽的核酸序列;
(b)能够驱动(a)的核酸序列表达的一个或多个调控序列;和任选地
(c)转录终止序列。
术语“调控序列”和“终止序列”如本文中的定义。在一个实施方案中,所述调控序列是组成型启动子,优选地(i)GOS2启动子;或(ii)高速泳动族B(HMGB)启动子之一。
植物用包含上文所述的任意核酸序列的载体转化。技术人员非常了解必须存在于所述载体上以便成功转化、选择和增殖含有目的序列的宿主细胞的遗传元件。所述目的序列有效地与一个或多个调控序列(至少与启动子)连接。
有利地,任意类型的启动子可以用来驱动所述核酸序列的表达。组成型启动子在本发明方法中特别有用。应当明白本发明的应用不限于编码如由SEQ ID NO:198所代表的Remorin多肽的核酸序列,本发明的应用也不限于编码Remorin多肽的核酸序列在受组成型启动子驱动时的表达。
组成型启动子优选地是(i)GOS2启动子;或(ii)高速泳动族B(HMGB)启动子之一。对于组成型启动子的其他实例,见本文“定义”部分中的表2。还优选地,GOS2启动子来自稻,更优选地基本上与如SEQ ID NO:329所代表的GOS2启动子相似,最优选地,所述GOS2启动子是如SEQ IDNO:329或SEQ ID NO:39所代表。还优选地,HMGB启动子来自稻,更优选地基本上与如SEQ ID NO:330所代表的HMGB启动子相似,最优选地,所述HMGB启动子是如SEQ ID NO:330或SEQ ID NO:331所代表。
任选地,可以在导入植物的构建体中使用一个或多个终止子序列。其它的调节元件可以包括转录增强子和翻译增强子。本领域技术人员将知道可能适用于实施本发明的终止子和增强子序列。如定义部分中描述,内含子序列也可以添加至5′非翻译区(UTR)或编码序列中,以增加聚集在细胞质内的成熟信使的量。(除启动子、增强子、沉默子、内含子序列、3’UTR和/或5’UTR区域之外的)其他调控序列可以是蛋白质/或RNA稳定元件。此类序列将是已知的或可以由本领域技术人员轻易获得。
本发明的基因构建体还可以包括为在特定细胞类型中维持和/或复制所需要的复制起点序列。一个实例是当基因构建体需要作为游离型遗传元件(例如质粒或粘粒分子)维持在细菌细胞中时的复制起点。优选的复制起点包括但不限于f1-ori和colE1。
为检测如在本发明方法中使用的核酸序列的成功转移和/或选择包含这些核酸序列的转基因植物,有利的是使用标记基因(或报道基因)。因此,所述基因构建体可以任选地包含选择标记基因。选择标记在本文的“定义”部分中更详细地描述。一旦不再需要所述标记基因时,它们可以从转基因细胞中移出或切除。用于移出标记的技术是本领域已知的,有用技术在上文定义部分中描述
本发明也提供用于产生转基因植物的方法,所述转基因植物相对于对照植物而言,具有增强的产量相关性状,其中所述方法包括在植物中导入并表达编码如上文所定义的Remorin多肽的任意核酸序列。
更具体地,本发明提供相对于对照植物,用于产生具有增强的产量相关性状的转基因植物的方法,所述方法包括:
(i)在植物、植物部分或植物细胞中导入并表达编码Remorin多肽的核酸序列;和
(ii)在促进植物生长和发育的条件下培养植物细胞。
(i)的核酸可以是能够编码如本文中定义的Remorin多肽的任意核酸。
所述核酸序列可以直接导入植物细胞或导入植物自身(包括导入组织、器官或植物的任何其他部分)。根据本发明的优选特征,该核酸序列优选地通过转化作用导入植物。术语“转化”在本文的“定义”部分中更详细地描述。
通常在转化后,对植物细胞或细胞群体选择一个或多个标记的存在性,其中所述标记由随同目的基因一起共转移的植物可表达基因编码,随后将转化材料再生成完整植物。为了选择转化植物,在所述转化中获得的植物材料原则上经历选择性条件,从而转化植物可以与非转化植物区分。例如,可以将以上述方式获得的种子播种,并且在初始培育时间后,通过喷洒进行合适的选择。另一种可能性在于(根据需要)消毒后,在使用合适选择剂的琼脂板上培育种子,从而仅转化的种子可以长成植物。或者,对所述转化植物筛选选择标记(如上文所述的选择标记)的存在性。
在DNA转移和再生后,推定转化的植物也可以例如使用DNA印迹分析对目的基因的存在性、拷贝数和/或基因组构造进行评价。备选地或额外地,新导入的DNA的表达水平可以使用RNA印迹分析和/或蛋白质印迹分析或这两种分析法监测,这两项技术均是本领域普通技术人员熟知的。
产生的转化植物可以通过多种方法繁殖,如通过克隆繁殖法或经典育种技术。例如,第一世代(或T1)转化植物可以进行自交并且选择纯合的第二世代(或T2)转化体,并且T2植物随后可以通过经典育种技术进一步繁殖。
产生的转化生物可以采取多种形式。例如,它们可以是转化细胞和非转化细胞的嵌合体;克隆性转化体(例如,被转化以含有表达盒的全部细胞);转化组织和非转化组织的移植体(例如在植物中,与未转化接穗嫁接的转化根状茎)。
本发明明确地扩展至由本文中所述的任意方法产生的任意植物细胞或植物,并扩展至全部植物部分及其繁殖体。本发明进一步扩展以包括已经由前述任意方法产生的原代转化或转染细胞、组织、器官或完整植物的后代,唯一要求是后代表现与如本发明方法中的亲代相同的基因型和/或表型特征。
本发明也包括含有编码如上文所定义的Remorin多肽的分离核酸序列的宿主细胞。本发明的优选宿主细胞是植物细胞。在本发明方法中所用的核酸序列或载体、表达盒或构建体或载体的宿主植物原则上有利地是能够合成在本发明方法中所使用多肽的全部植物。
本发明的方法有利地适用于任意植物。在本发明方法中特别有用的植物包括属于植物界(Viridiplantae)超家族、尤其单子叶和双子叶植物的全部植物,包括饲用或饲料豆科植物、观赏植物、粮食作物、树或灌木。根据本发明的一个优选实施方案,所述植物是作物植物。作物植物的实例包括大豆、向日葵、卡诺拉油菜、苜蓿、油菜、棉花、番茄、马铃薯和烟草.更优选地,所述植物是单子叶植物。单子叶植物的实例包括甘蔗。更优选地,所述植物是谷物植物。谷物植物的实例包括稻、玉米、小麦、大麦、谷子、黑麦、小黑麦属、高粱、二粒小麦、斯卑尔脱小麦、黑麦属、单粒小麦、埃塞俄比亚画眉草、买罗高粱和燕麦。
本发明也扩展至植物的可收获部分如,但不限于种子、叶、果实、花、茎、根状茎、块茎和球茎。本发明进一步涉及了衍生自、优选直接衍生自此种植物的可收获部分的产品,如干燥颗粒或粉末、油、脂肪和脂肪酸、淀粉或蛋白质。
本领域充分记录了用于提高核酸序列或基因或基因产物表达的方法并且在定义部分中提供了例子。
如上所述,用于调节(优选地提高)编码Remorin多肽的核酸序列表达的优选方法是通过在植物中导入并表达编码Remorin多肽的核酸序列;然而,实施本方法的效果,即增强产量相关性状,也可以使用其他熟知技术实现,所述的其他熟知技术包括但不限于T-DNA活化标签技术、TILLING、同源重组法。在定义部分中提供了对这些技术的描述。
本发明也包括编码如本文中所述Remorin多肽的核酸序列的用途,和这些Remorin多肽在植物中相对于对照植物而增强产量相关性状的用途。优选地,增强的产量相关性状是提高的产量。更优选地是提高的种子产量,最优选地,所述提高的种子产量包括以下一项或多项:(i)提高的种子充实率;(ii)提高的每株植物种子总产量;(iii)增加的充实种子数;(iv)增加的种子总数;(v)提高的千粒核重(TKW)或(vi)提高的收获指数。
本发明也提供迄今未知的编码Remorin的核酸和Remorin多肽。
根据本发明的又一实施方案,提供了分离的核酸分子,其选自:
(i)由SEQ ID NO:332所代表的核酸;
(ii)由SEQ ID NO:332所代表的核酸的互补物;
(iii)编码下述Remorin多肽的核酸,所述Remorin多肽以增加的优选顺序与SEQ ID NO:333所代表的氨基酸序列具有至少50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或更大的序列同一性、和以增加的优选顺序与SEQ ID NO:334(VKKEEVETKVTAWQTAEVAKINNRFKREDVVINGWETEQVEKASAWLKKIERKLDEQRAKALEKTQNDIAKARRKAEEKRASAEAKRGLKLAKVLELANFMKAVGRVPTKR具有至少50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或更大的序列同一性,所述的SEQ ID NO:334与SEQ ID NO:326的羧基端区域匹配。
根据本发明的又一实施方案,还提供分离的多肽,其选自:
(i)由SEQ ID NO:333所代表的氨基酸序列;
(ii)下述氨基酸序列,其以增加的优选顺序与SEQ ID NO:333所代表的氨基酸序列具有至少50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或更大的序列同一性、和以增加的优选顺序与SEQ ID NO:
334(VKKEEVETKVTAWQTAEVAKINNRFKREDVVINGWETEQVEKASAWLKKIERKLDEQRAKALEKTQNDIAKARRKAEEKRASAEAKRGLKLAKVLELANFMKAVGRVPTKR具有至少50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或更大的序列同一性,所述的SEQ ID NO:334与SEQ ID NO:326的羧基端区域匹配;
(iii)以上(i)或(ii)中所给出的任一氨基酸序列的衍生物。
编码本文中所述Remorin多肽的核酸序列或Remorin多肽自身可以用于育种程序中,在所述育种程序中鉴定到可以遗传地与编码Remorin多肽的基因连接的DNA标记。所述基因/核酸序列或Remorin多肽自身可以用来定义分子标记。这种DNA或蛋白质标记随后可以在育种程序中用来在本发明的方法中选择具有如上文所定义的增强的产量相关性状的植物。
编码Remorin样多肽的基因/核酸序列的等位变体也可以用于标记辅助的育种程序中。这种育种程序有时需要使用例如EMS诱变法通过对植物进行诱变处理而导入等位变异;备选地,该程序可以从收集并非故意造成的所谓“自然”源性等位变体开始。随后进行等位变体的鉴定,例如通过PCR法。此后是步骤:选择所讨论和导致产量提高的序列的优异等位变体。选择一般通过监测含有所讨论序列的不同等位变体的植物的生长性能而实施。生长性能可以在温室或在田间监测。其他任选步骤包括使其中鉴定到优异等位变体的植物与另一种植物杂交。这可能用来例如产生感兴趣的表型特征组合。
编码Remorin多肽的核酸序列也可以作为探针用于遗传地或物理地绘制所述探针构成其一部分的基因并且作为标记用于与这些基因连锁的性状。此类信息可以用于植物育种,旨在开发具有所希望表型的品系。编码Remorin多肽的核酸序列的这种用途仅需要具有至少15个核苷酸长度的核酸序列。编码Remorin多肽的核酸序列可以用作限制性片段长度多态性(RFLP)标记。限制性消化的植物基因组DNA的DNA印迹物(SambrookJ,Fritsch EF和Maniatis T(1989)Molecular Cloning,A LaboratoryManual)可以用编码Remorin多肽的核酸序列探测。所得的结合图式随后可以使用计算机程序如MapMaker(Lander等(1987)Genomics 1:174-181)进行遗传分析以构建遗传图。此外,该核酸序列可以用来探测含有一组个体的限制性核酸内切酶处理的基因组DNA的DNA印迹物,其中所述的一组个体代表具有定义的遗传杂交的亲代和后代。标出DNA多态性的分离并用来计算编码Remorin多肽的核酸序列在先前使用这个群体获得的遗传图中的位置(Botstein等(1980)Am.J.Hum.Genet.32:314-331)。
在Bernatzky和Tanksley(1986)Plant Mol.Biol.Reporter 4:37-41中描述了植物基因来源的探针的产生及其在遗传作图中的用途。众多出版物描述了使用以上所提及的方法学或其改良法对特定cDNA克隆的遗传作图。例如,F2互交群、回交群、随机交配群、邻近纯合系和其他个体群体可以用于作图。此类方法学是本领域技术人员熟知的。
所述核酸探针也可以用于物理作图(即序列在物理图上的排列;见Hoheisel等在:Non-mammalian Genomic Analyasis:A Practical Guide,Academic press 1996,第319-346页及其中引用的参考文献)。
在另一实施方案中,核酸探针可以在直接荧光原位杂交(FISH)作图法(Trask(1991)Trends Genet.7:149-154)中使用。尽管当前的FISH作图法支持使用大的克隆(几个kb至几百个kb;见Laan等(1995)Genome Res.5:13-20),然而灵敏度的改善可以允许使用更短探针进行FISH作图。
用于遗传作图及物理作图的多种基于核酸扩增的方法可以使用所述核酸序列而实施。方法实例包括等位基因特异性扩增法(Kazazian(1989)J.Lab.Clin.Med 11:95-96)、PCR扩增片段的多态性(CAPS;Sheffield等(1993)Genomics 16:325-332)、等位基因特异性连接(Landegren等(1988)Science 241:1077-1080)、核苷酸延伸反应(Sokolov(1990)Nucleic Acid Res.18:3671)、放射杂交作图(Walter等(1997)Nat.Genet.7:22-28)和Happy作图法(Dear和Cook(1989)Nucleic Acid Res.17:6795-6807)。对于这些方法,使用一种核酸的序列来设计并产生用于扩增反应或引物延伸反应中的引物对。这类引物的设计是本领域技术人员熟知的。在使用基于PCR遗传作图的方法中,可能需要在对应于当前核酸序列的区域中鉴定作图交叉的亲代之间的DNA序列差异。然而,这通常对作图法而言不是必需的。
本发明方法产生了相对于对照植物而言,具有如前文所述增强的产量相关性状的植物。这种性状也可以与经济上有利的其他性状组合,如其他的产量增强性状、针对其他非生物胁迫和生物胁迫的耐受性、调节多种构造性特征和/或生物化学特征和/或生理学特征的性状。
V.DREB
出人意料地,现在已经发现通过降低或基本上消除植物中内源性DREB基因的表达和/或DREB蛋白的水平和/或活性产生了与对照植物相比较,具有提高的产量的植物。本发明因而提供相对于对照植物而言,用于提高植物产量的方法,包括降低或基本上消除内源性DREB基因的表达和/或DREB蛋白的水平和/或活性。
选择对照植物是实验设置的例行部分并且可以包括相应的野生型植物和其中没有对内源性DREB基因的表达和/或DREB蛋白的水平和/或活性进行(由人类干预介导的)调节的相应植物。
有利地,本发明方法的实施产生了相对于对照植物具有提高的产量的植物。尤其,本发明方法的实施产生了相对于对照植物而言,具有提高的产量、尤其提高的种子产量的植物。术语“产量”和“种子产量”在本文的“定义”部分中更详细地描述。
如本文中定义的术语“提高的产量”意指植物的一个或多个可收获部分(在量上)增加,其中所述的可收获部分可以包括生物量(重量),无论是地上部分和/或地下部分。
尤其,此类可收获部分包括营养生物量和/或种子,并且本发明方法的实施产生了相对于对照植物的产量,具有提高的产量(营养生物量和/或种子)的植物。
种子数的提高可以是具有每株植物更多分蘖和/或每个分蘖或每株植物具有更多花簇(花序)和/或每个花序或每株植物具有更多花的结果。所述提高可以是因较低的花/胚败育和/或受精效率提高所致和/或因种子充实改善所致。
种子产量的提高也可以表现为种子大小和/或种子体积增加。这可以增加种子中物质的量或改变种子中物质(如油、蛋白质和糖类)的组成。此外,种子产量的提高自身可以表现为种子面积和/或种子长度和/或种子宽度和/或种子周长增加。提高的产量也可以导致改良的结构或可以因改良的结构而出现。
以谷物(corn)为例,产量提高可以表现为以下一个或多个指标:每公顷或英亩植物数目增加,每株植物穗数的提高,行数、每行核粒数、核粒重、千粒核重、穗长度/直径的提高,种子充实率(即充实种子数除以种子总数并乘以100)提高,及其他。以稻为例,产量提高可以自身表现为下列一种或多种指标的提高:每公顷或英亩植物数、每株植物的花序数、每花序的小穗数、每花序的花(小花)数目(其表达为充实种子数对原发花序数的比)、种子充实率的提高(其中种子充实率是充实种子数除以种子总数并乘以100)、千粒核重提高及其他。
根据优选的特征,本发明方法的实施导致提高的产量、尤其提高的花序数和/或种子产量的植物。因此,根据本发明,提供了用于提高植物种子产量和/或提高花序数的方法,所述方法包括降低或基本上消除DREB蛋白的活性水平,优选地通过下调DREB基因的表达进行。
由于本发明的转基因植物具有提高的产量,故相对于对照植物的生长速率而言,这些植物有可能在其生活周期的对应阶段上表现提高的生长速率(在其生活周期的至少部分期间)。提高的生长速率可以是植物的一个或多个部分(包括种子)特异的,或可以基本上遍及整个植物。生长速率提高的植物可以具备较短的生活周期。植物的生活周期可以意指从干燥成熟种子成长至植物已经产生与起始材料相似的干燥成熟种子的阶段所需要的时间。这个生活周期可以受以下因素影响,如早期(籽苗)生长势、生长速率、开花时间和种子成熟速度。生长速率的提高可以在植物生活周期的一个或多个阶段上或基本上在整个植物生活周期期间发生。提高的生长速率在植物生活周期的早期期间可以反映增强的(籽苗)生长势。生长速率的提高可以改变植物的收获周期,从而导致植物较晚播种和/或较早收获,而这本来是不可能的(相似效果可以随较早的开花时间获得)。若生长速率充分提高,则可以允许进一步播种相同植物物种的种子(例如播种并收获稻植物,随后播种并收获其他稻植物,全部稻植物均出于一个常规生长时期中)。类似地,若生长速率充分地提高,可以允许进一步播种不同植物物种的种子(例如播种并收获谷物植物,随后例如播种并任选收获大豆、马铃薯或任何其他合适植物)。在一些作物植物的例子中,来自相同根状茎的额外收获次数也可以是可能的。改变植物的收获周期可以导致每英亩一年生物量生产提高(原因在于可以培育并收获任何具体植物的次数(即在一年中)提高)。生长速率的提高也可以允许转基因植物在比其野生型对应物更广泛的地理区域内培育,因为培育作物的地域限制往往由栽种时节(早季)或在收获时期(晚季)的不利环境条件所决定。这类不利条件可以避开,若缩短收获周期。生长速率可以通过从生长曲线获得多个参数而确定,此类参数可以是:T-Mid(植物达到其50%最大尺寸所花费的时间)和T-90(植物达到其50%最大尺寸所花费的时间),以及其他。
本发明方法的实施产生了具有提高的生长速率和/或提高的籽苗生长势的植物。因此,根据本发明,提供了相对于对照植物而言提高植物生长速率和/或籽苗生长势的方法,所述方法包括优选地降低和/或基本上消除植物中内源性DREB基因的表达和/或内源性DREB基因的水平和/或活性。
与对照植物相比较,当所述植物处于非胁迫条件下或当植物暴露于多种胁迫时,是否出现产量和/或生长速率的提高。植物一般通过生长得更慢而应答于胁迫暴露。在严重胁迫条件下,植物甚至可以完全停止生长。另一方面,轻度胁迫在本文中定义为植物所暴露的任何下述胁迫,其中所述的胁迫未导致植物完全停止生长,且没有再继续生长的能力。与非胁迫条件下的对照植物相比较,轻度胁迫在本发明意义中导致受胁迫植物的生长降低小于40%、35%或30%、优选地小于25%、20%或15%、更优选地小于14%、13%、12%、11%或10%或更低。由于农业实践(灌溉、施肥、杀虫剂处理)的进步,在栽培作物植物中并不经常遇到严重胁迫。因此,由轻度胁迫诱导的受损生长对于农业往往是不受欢迎的特征。轻度胁迫是植物所暴露的常见非生物性(环境)胁迫。非生物胁迫可以因干旱或过量的水、缺氧胁迫、盐胁迫、化学毒性、氧化胁迫和热、寒冷或冰冻温度所致。非生物胁迫可以是因水胁迫(尤其因为干旱)、盐胁迫、氧化胁迫或离子胁迫引起的渗透胁迫。生物胁迫一般是由病原体如细菌、病毒、线虫、真菌和昆虫引起的那些胁迫。
尤其,本发明的方法可以在非胁迫条件或轻微干旱条件下开展以产生相对于对照植物具有提高的产量的植物。如Wang等(Planta(2003)218:1-14)中报道,非生物胁迫导致一系列不利地影响植物生长及生产量的形态学、生理学、生物化学和分子变化。干旱、盐度、极端温度和氧化胁迫已知是相互联系的并可以通过相似机制诱导生长损害及细胞损害。Rabbani等(Plant Physiol(2003)133:1755-1767)描述了干旱胁迫与高盐度胁迫间极高程度的“交互作用”。例如,干旱和/或盐化作用主要地表现为渗透胁迫,从而导致细胞内稳态和离子分布的破坏。经常伴随高温或低温、盐度或干旱胁迫的氧化胁迫可以造成功能性蛋白和结构蛋白变性。因此,这些多样的环境胁迫常常激活相似的细胞信号途径和细胞应答,如产生胁迫蛋白、上调抗氧化物质、积累兼容性溶质和生长停滞。如本文中所用的术语“非胁迫”条件是允许植物最佳生长的环境条件。本领域技术人员清楚对于给定地点的正常土壤条件和气候条件。
本发明方法的实施产生了这样的在非胁迫条件下或在轻微干旱条件下生长的植物,其相对于可比较条件下生长的对照植物而言,具有提高的产量。因而,根据本发明,提供了用于提高在非胁迫条件下或在轻微干旱条件下生长的植物中产量的方法,所述的方法包括在植物中调节编码DREB多肽的核酸表达。
本发明方法的实施产生了在营养缺乏条件下、尤其在氮缺乏条件下培育的植物,其相对于可比较条件下培育的合适对照植物而言,具有提高的产量。因而,根据本发明,提供了用于提高在营养缺乏条件下培育的植物中产量的方法,所述的方法包括在植物中调节编码DREB多肽的核酸表达。营养缺乏可以因营养素如氮、磷酸盐和其他含磷化合物、钾、钙、镉、镁、锰、铁和硼及其他元素缺少所致。
以上提及的生长特征可以有利地在任意植物中进行调节。
如本文中所用的术语“植物”包括完整植物、植物的祖先及后代和包括种子、苗、茎、叶、根(包括块茎)、花和组织与器官在内的植物部分,其中每种前述对象包含目的基因/核酸。术语“植物”也包括植物细胞、悬浮培养物、愈伤组织、胚、分生组织区、配子体、孢子体、花粉和小孢子,同样每种前述对象包含目的基因/核酸。
根据本发明的一个优选实施方案,所述植物是作物植物。作物植物的实例包括大豆、向日葵、卡诺拉油菜、苜蓿、油菜、棉花、番茄、马铃薯和烟草。还优选地,所述植物是单子叶植物。单子叶植物的实例包括甘蔗。更优选地,所述植物是谷物植物。谷物植物的实例包括稻、玉米、小麦、大麦、谷子、小黑麦属、黑麦、高粱、二粒小麦、斯卑尔脱小麦、黑麦属、单粒小麦、埃塞俄比亚画眉草、买罗高粱和燕麦。
与本发明有关的内源性DREB蛋白指包含单个AP2结构域的蛋白质,其中所述的AP2结构域能够与启动子中所包含的DRE(脱水应答元件)元件或其片段结合。
通常,除AP2结构域之外,所述DREB蛋白也包含众多特征性保守基序,也即CMIII-1至CMIII-4和/或CMIV-1与CMIV-2,如Sakuma等2002年描述(Biochemical and Biophysical ResearchCommunications(2002),290,3,998-1009)。此外,所述DREB蛋白可以含有其功能是指导该蛋白质进入细胞核的核定位信号。核定位作用已经对例如OsDREB1L蛋白(与SEQ ID NO:336相同)进行描述(Chen等2003Theor.Appl.Genet.107:972-979)。
另外,在AP2蛋白的系统发生树中分析时,DREB蛋白倾向于在与属于其他亚家族(如Apetala 2,RAV或ERF亚家族)的包含AP2蛋白的进化支的一个独特的进化支内聚类。已经广泛地报道了AP2蛋白之间的系统发生关系(Shigyo等Gene 366(2006)256-265;Nakano等2006;Dubouzet等2003)。开展DREB蛋白系统发生关系分析的方法是本领域熟知的。通常,使用众多可获得的方法之一(如CLUSTAL X或在VectorNTI(Invitrogen)的Align AlignX中提供的方法)进行蛋白质序列的比对。将比对序列输入,使用算法如在Vector NTI(Invitrogen)或在PHYLIP软件包或在MOLPHY版本2.3b3(Adachi和Hasegawa,1996)中提供的那些算法,构建系统发生树。构建了最大或然性树。所述树的或然性可以使用例如ProtML程序在JTT模式下计算,和所述树可以根据其Akaike信息标准(AIC)值(Adachi和Hasegawa,1996)进行分类。每个分支的局部引导(bootstrap)概率可以使用再采样-评估对数-或然性(RELL)方法(Kishino等,1990;Hasegawa和Kishino,1994)进行评估。在图25中显示AP2蛋白的系统发生树的实例,该系统发生树显示了其中DRE蛋白质聚类的所述独特进化支。优选地,在本发明方法中使用的DREB蛋白聚集在NP_567719组内。
AP2结构域是本领域技术人员熟知的,并且在数据库例如pfam、interpro和smart中广泛描述(Bateman等,Nucleic Acids Research 30(1):276-280(2002);Mulder等,(2003)Nucl.Acids.Res.31,315-318;Letunic等(2006)Nucleic Acids Res 34,D257-D260)。序列“.a+GVp.+.hG.+W.ucItcs..........ttclaLGoFsot-tAAhAYD.AAhhhhG..pAhhNFs....tt”(SEQ ID NO:340)代表如在SMART数据库提供的AP2结构域的共有序列。AP2结构域在SMART数据库中的登录号是SM00380。在缩写中使用的氨基酸分组在表4中给出。可以允许空位和插入,其中所述空位和插入一般至多到5个氨基酸。AP2结构域长大约60-70个氨基酸并且具有DNA结合活性(Ohme-takagi和Shinshi;Plant Cell 1995;7:173-182)。它例如与发病机理相关蛋白的启动子中存在的GCC盒结合(Liu等2006.FEBS Lett.580(5):1303-8)。
表4.在AP2共有序列(SEQ ID NO:340)中使用的氨基酸分组的代码。“类”指氨基酸分类,“关键码”指对某类所用的代码。“残基”指属于给定类别的氨基酸。
类 | 关键码 | 残基 |
醇 | o | S、T |
脂族的 | l | I、L、V |
任意 | · | A、C、D、E、F、G、H、I、K、L、M、N、P、Q、R、S、T、V、W、Y |
芳族的 | a | F、H、W、Y |
带电荷的 | c | D、E、H、K、R |
疏水的 | h | A、C、F、G、H、I、K、L、M、R、T、V、W、Y |
带负电荷的 | - | D、E |
极性的 | p | C、D、E、H、K、N、Q、R、S、T |
带正电荷的 | + | H、K、R |
小的 | s | A、C、D、G、N、P、S、T、V |
微小的 | u | A、G、S |
转角样的 | t | A、C、D、E、G、H、K、N、Q、R、S、T |
鉴定AP2结构域的方法在本文中描述,实施例49还提供了此类方法的细节。与本发明相关的DREB蛋白包含这样的AP2(DNA-结合)结构域,其以增加的优选顺序与如SEQ ID NO:340或SEQ ID NO:341代表的结构域具有至少50%、55%、60%、65%、70%、75%、80%、85%、90%、95%或更大的序列同一性。
DREB蛋白可以与胁迫应答基因的启动子中存在的由DRE(脱水应答元件)、CRT(C-重复序列)和LTRE(低温应答元件)元件代表的顺式元件结合。核酸序列TACCGACAT代表DRE元件,其中CCGAC核心基序也包含在如拟南芥胁迫基因启动子中存在的CRT和LTRE基序。DREB蛋白特异性地与DRE元件中由(G/a)(C/t)CGAC(SEQ ID NO:342)所代表的6核苷酸结合。本领域技术人员将能够使用标准生物信息学手段和分子手段轻易地鉴定多核苷酸序列中的DRE/CRT/LTRE基序。DREB蛋白与DRE/CRT/LTRE基序的蛋白质-DNA结合作用可以在体内例如在单杂交筛选中或在体外使用凝胶迁移率测定法分析。这些方法是本领域熟知的并且在本领域中描述(Xue,Biochim Biophys Acta.(2002)1577(1):63-72;HaoD等Biochemistry.2002年4月2日;41(13):4202-8;Dubouzet等2003;Qin等.2004 Aug;45(8):1042-52)。
与本发明有关的DREB蛋白能够与包含如SEQ ID NO:342代表的DRE元件的DNA分子结合。
AP2/ERF蛋白已经基于其氨基酸序列中存在的保守基序进行分类。本发明方法中使用的DREB蛋白属于如Sakuma等2002(Biochemical和Biophysical Research Communications,290,998-1009)定义的AP2/ERF转录因子的亚组A-1和A-2或备选地属于根据Nakano等,2006(PlantPhys.140,411-432)分类的组IIIc、IVa和IVb内。
根据Nakamo等2006,除AP2结构域之外,IIIc组中的拟南芥DREB蛋白还包含众多保守基序,即CMII-1-CMIII-4;CMIII-1可以由序列PELAWSLPRPESTSPKDIQAAAAEAAAMF(SEQ ID NO:343)代表。CMII-2可以由序列QSCGAFFMDEEAMLGMPNLLANMAEGMLLPPP(SEQ ID NO:344)代表,CMIII-3可以由序列DYDPTLAESCPKKPAGRKKFR(SEQ ID NO:345)代表并且CMIII-4可以由序列LWSY(SEQ IDNO:346;从Nakano等2006改编)代表。基序CMIII-2和CMIII-4一般位于羧基端区域。基序CMIII-2和CMIII-4包含在拟南芥CBF1/DREB1B蛋白的羧基端98个氨基酸部分,其中报道证实所述的羧基端氨基酸部分发挥反式激活结构域作用(Wang等,2005,Plant Mol Biol 58:543-559)。
CMIII-3基序指存在于AP2/ERF两侧的高度保守区域。在这两个区域PKK/RPAGRxKFxETRHP(区域I)(其中X代表任意氨基酸(SEQ ID NO:347))和DSAWR(区域II)(SEQ ID NO:348)中保守序列的存在是在几个植物物种的DREB蛋白中保守(Jaglo等,2001,Plant Physiol 127:910-917;Haake等,2002 Plant Physiol 130:639-648)。
属于根据Nakano等2006的IV组的DREB蛋白包含如分别由保守序列K/RGKGGPxN(SEQ ID NO:349)和KKRKRRGGRDVAEILKKWKEYNEQVEADSCIDGGGPKKIRK(SEQ ID NO:350)代表的基序CMIV-1和CMIV-2,其中X可以是任意氨基酸。CMIV-2基序包括推定的核定位信号(Liu等,1998)。
一般地,在包含AP2结构域的多肽中存在与基序CMIII-1至CMIII-4、区域I和II、基序CMIV-1和CMIV-2相同或充分同源的至少一个保守基序应当足以将任意查询序列鉴定为DREB蛋白,但是,优选的是存在至少PKK/RPAGRxKFxETRHP(区域I)和DSAWR(区域II)。
作为保守基序提供的共有序列主要基于拟南芥DREB蛋白的序列。本领域技术人员将会充分认识到所述共有序列可以某种程度地变化,包括因缺失或插入氨基酸而变化,如果使用其他或不同的序列(例如来自其他生物的序列)进行比较。优选地,CMIII-1至CMIII-4和基序CMIV-1和CMIV-2的保守序列以增加的优选顺序与任意保守基序CMIII-1至CMIII-4、CMIV-1和CMIV-1至少50%、55%.60%、65%、70%、75%、80%、85%、90%或95%相同。最优选地,所述保守基序是在稻蛋白OsDREB1A或Os09g0522200中存在的那些保守基序,如图23中描述。
优选地,与本发明有关的DREB蛋白包含:
(i)以增加的优选顺序与SEQ ID NO:340或SEQ ID NO:341具有至少50%、55%、60%、65%、70%、75%、80%、85%、90%、95%或更大序列同一性的AP2DNA-结合结构域,和
(ii)以增加的优选顺序与SEQ ID NO:343至SEQ ID NO:350的任意序列具有至少50%、55%、60%、65%、70%、75%、80%、85%、90%、95%或更大序列同一性的一个或多个保守基序。
甚至更优选地,用于本发明方法的DREB蛋白包含:
(i)以增加的优选顺序与SEQ ID NO:340或SEQ ID NO:341具有至少50%、55%、60%、65%、70%、75%、80%、85%、90%、95%或更大序列同一性的AP2DNA-结合结构域,和
(ii)以增加的优选顺序与SEQ ID NO:343至SEQ ID NO:348的任意序列具有至少50%、55%、60%、65%、70%、75%、80%、85%、90%、95%或更大序列同一性的一个或多个保守基序。
本发明方法中使用的DREB蛋白和DREB基因的实例在实施例46中提供。
进一步优选的与本发明有关的DREB蛋白包含这样的序列,其以增加的优选顺序与实施例46中给出的任一氨基酸序列具有至少50%、55%、60%、65%、70%、75%、80%、85%、90%、95%或更大的序列同一性。最优选地,所述DREB蛋白具有实施例46中给出的任意序列,最优选地具有如SEQ ID NO:336中给出的任意序列。
本文中谈及的植物中内源性DREB基因表达的“降低或基本上消除”意指与对照植物相比时,DREB基因转录和/或DREB mRNA的水平和/或浓度降低或减少。这种降低或基本上消除可以导致降低或减少或基本上消除植物中DREB mRNA活性。与对照植物相比较,减少、降低或基本上消除为以增加的优选顺序至少10%、20%、30%、40%或50%、60%、70%、80%、85%、90%或95%、96%、97%、98%、99%或更多。
本文中谈及的植物中内源性DREB蛋白的水平“降低”意指相对于对照植物存在的内源性DREB蛋白水平而言,DREB蛋白水平和/或蛋白质浓度降低或减少,或基本上消除内源性DREB蛋白。这种降低或基本上消除可以导致降低或基本上消除植物中的DREB蛋白活性。相对于对照植物,所述减少、降低或基本上消除为以增加的优选顺序降低至少10%、20%、30%、40%或50%、60%、70%、80%、85%、90%或95%、96%、97%、98%、99%或更多。
本文中谈及的植物中内源性DREB蛋白的活性“降低”意指相对于对照植物存在的内源性DREB蛋白活性水平,DREB蛋白活性降低或减少和/或内源性DREB蛋白的活性基本上消除。相对于对照植物,所述减少、降低或基本上消除是以增加的优选顺序降低至少10%、20%、30%、40%或50%、60%、70%、80%、85%、90%或95%、96%、97%、98%、99%或更多。
优选地,内源性DREB蛋白水平和/或活性的降低通过下调内源性DREB基因的表达获得。
本文中对“内源的”DREB基因的称谓指如植物中以其天然形式(即没有任何人工介入)存在的DREB基因。“降低或基本上消除”DREB基因的表达和/或与本发明有关的DREB蛋白的水平和/或活性也可以影响DREB转基因,即随后导入植物的分离的DREB基因。与对照植物相比较,本发明方法在含有DREB转基因的转基因植物上的开展导致降低或基本上消除DREB内源基因和/或转基因表达和/或导致降低或基本上消除DREB蛋白的水平和/或活性。
在一个优选的实施方案中,降低或基本上消除内源性DREB基因表达和/或DREB蛋白的水平和/或活性通过导入DREB核酸或与DREB基因基本上同源的片段获得,更优选地,所述分离的核酸能够形成发夹结构,进一步优选地,所述分离的核酸处于组成型启动子的控制下。
为降低或基本上消除植物中内源基因的表达,需要核酸序列的基本上连续核苷酸的足够长度。为了开展基因沉默,该长度可以是短至20、19、18、17、16、15、14、13、12、11、10或更少个核苷酸,或者,或者该长度可以长至完整基因(包括部分或完整的内含子、5’和/或3’UTR(非翻译区))。基本上连续的核苷酸的片段可以从SEQ ID NO:335或从实施例1中给出的任意核酸序列或从能够编码实施例46中给出的任一氨基酸序列的同源物(直向同源物或旁系同源物,术语“直向同源物”和“旁系同源物”如本文中定义)的任何核酸衍生。对于本文中讨论的多种方法而言,降低或基本上消除内源基因的表达不要求编码(功能性)多肽的核酸序列。
内源性DREB基因表达的这种降低(或基本上消除)可以使用熟知基因沉默方法中的任意一种或多个几种方法实现。如本文中所用的“基因沉默”或表达“下调”指DREB基因表达和/或DREB蛋白水平和/或DREB蛋白活性的降低或基本上消除。对于下调表达的技术的描述可以在定义部分中找到。
用于降低或基本上消除内源性DREB基因表达的这样一种方法是RNA介导的基因表达下调(RNA沉默)。在这种情况下,沉默作用在植物中由与靶DREB基因基本上同源的双链RNA分子(dsRNA)触发。这种dsRNA进一步由植物加工成长约21至约26个核苷酸的所谓短干扰性RNA(siRNA)。该siRNA被掺入RNA诱导的沉默复合体(RISC)中,其中所述的RISC切割DREB靶基因的mRNA,因而降低或基本上消除待翻译成DREB蛋白的DREB mRNA的数目和/或降低其浓度。本发明的siRNA具有这样的序列,其与贯穿靶基因完整序列的约21个基本上连续核苷酸的片段相对应。优选地,如SEQ ID NO:335中所述的靶基因衍生的本发明中有用的siRNA可以包括多个RNA分子,所述的RNA分子选自与SEQ IDNO:335中任意给出的18-26个连续核苷酸基本上相同的寡核苷酸。
优选含有与靶基因的一部分相同或基本上同源的核苷酸序列的dsRNA以实现DREB基因表达的降低或基本上消除。然而,本发明具有能够容忍序列变异的优势,其中所述的序列变异可以预计因遗传突变、株多态性或进化趋异所致。相对于靶序列具有插入、缺失和单个点突变的RNA序列也可以用于降低。优选所述siRNA与所述DREB基因之间大于90%、92%、94%、96%、98%序列同一性或甚至达100%的序列同一性。或者,可以功能性地将所述RNA的双链体区域定义为能够与靶基因转录物的一部分在严格条件(例如400mM NaCl,40mM PIPES pH 6.4,1mM EDTA,在60摄氏度持续12-16小时;随后洗涤)下杂交的核苷酸序列。基本上相同的双链核苷酸序列的长度可以是所靶向DREB基因的至少约21(包括至少15),25,50,100,200,300,400,500个核苷酸或更多个核苷酸长,直至所靶向DREB基因的全部长度。在一个优选的实施方案中,双链核苷酸序列的长度是从约21(至少15)至约400或500个核苷酸长,且它与所靶向DREB基因的全部长度相等或较之短。
RNA沉默方法的一个实例涉及将基因序列或其部分以有义方向导入植物。“有义方向”指与其mRNA转录物同源或相对应的DNA。因而将已经存在于宿主植物内的DREB基因的至少一个(完整或部分)额外拷贝导入植物。所述额外基因或其部分将使内源性DREB基因沉默,产生所谓共抑制现象。若将几个额外拷贝导入植物,将更明显地降低DREB基因表达,原因是存在高转录物水平和触发共抑制作用之间的正相关。
RNA沉默方法的另一个实例包括使用反义DREB核酸序列。″反义″核酸包含与编码蛋白质的″有义″核酸互补(例如与双链cDNA分子的编码链互补或与mRNA序列互补)的核苷酸序列。因此,反义核酸可以与有义核酸杂交。所述反义核酸可以与DREB完整编码链或仅与其一部分互补。反义核酸可以根据Watson和Crick碱基配对原则设计。所述反义核酸分子可以反义于″编码区″或反义于DREB基因的已转录mRNA或前mRNA的″非编码区″。术语″编码区″指核苷酸序列中包含待翻译成氨基酸残基的密码子的区域。术语″非编码区″指基因中或其已转录的RNA中位于所述编码区之外的序列。此类非编码区可以至少部分地包含5’前导序列、3’UTR(非翻译区)和内含子中的任一种。
反义核酸分子可以与DREB mRNA的完整编码区互补,但是它优选地是仅反义于DREB mRNA的编码区或非编码区中一部分的寡核苷酸。例如,反义寡核苷酸可以与DREB mRNA的翻译起始位点周围的区域互补。合适反义寡核苷酸的长度是本领域已知的并且可以从约20个核苷酸长度或更短开始。本发明的反义核酸可以利用化学合成和酶连接反应,使用本领域已知方法构建。例如,反义核酸可以使用天然存在的核苷酸或多种修饰的核苷酸化学地合成,其中所述修饰的核苷酸设计旨在提高分子的生物学稳定性或提高反义核酸序列与有义核酸序列之间形成的双链体的物理稳定性,例如,可以使用硫代磷酸酯衍生物和吖啶取代的核苷酸。可以用来产生所述反义核酸的修饰核苷酸的实例是本领域熟知的。
已知的核苷酸修饰包括甲基化、环化和′加帽′和用类似物(如肌苷)替换一个或多个天然存在的核苷酸。核苷酸的其他修饰作用是本领域技术人员熟知的。
备选地,所述反义核酸可以使用表达载体以生物学方式产生,其中已经将一种核酸以反义方向亚克隆(即从所插入核酸转录出的RNA将与目的靶核酸为反义方向,这在下文的子部分中进一步描述)至所述表达载体。优选地,植物中反义核酸的产生借助稳定整合的转基因进行,其中所述的转基因包含对植物胚乳组织中优先表达有效的启动子、反义寡核苷酸和终止子。
表达的这种降低或基本上消除可以使用例行手段和技术实现。用于降低或基本上消除植物中内源基因表达的优选方法是通过在植物中导入并表达这样的基因构建体,其中已经将本发明方法中使用的核酸克隆为被间隔序列(非编码的DNA)分开的反向重复序列(部分或完全地)至所述基因构建体内。
在这种的优选方法中,使用在本发明方法中使用的核酸或其部分的反向重复序列(其优选能够形成发夹结构),通过RNA介导的沉默作用降低或基本上消除所述内源基因的表达。在包含调控序列的表达载体中克隆所述反向重复序列。非编码性DNA核酸序列(间隔序列,例如基质附着区片段(MAR)、内含子、多接头等)位于形成所述反向重复序列的两个反向核酸之间。在该反向重复序列转录后,形成具有自身(部分或完全)互补结构的嵌合DREB RNA。这种双链RNA结构称作发夹RNA(hpRNA)。这种hpRNA由植物加工成掺入RISC中的siRNA。所述RISC进一步切割DREB靶基因的mRNA,因而降低或基本上消除待翻译成DREB蛋白的DREB mRNA的数目。参见例如Grierson等(1998)WO 98/53083;Waterhouse等(1999)WO 99/53050)
本发明方法中用于沉默作用的核酸分子(无论向植物导入或原位(insitu)产生)与包含DREB基因的细胞mRNA和/或基因组DNA区域杂交或结合,旨在因此抑制蛋白质的表达,例如通过抑制转录和/或翻译而做到这一点。杂交可以因常规核苷酸互补性以形成稳定双链体引起,或例如在与DNA双链体结合的反义核酸分子的情形下,通过在双螺旋大沟内的特异性相互作用引起。反义核酸序列可以通过转化法或在特定组织部位处的直接注射法导入植物。或者,反义核酸分子可以受到修饰以靶向所选的细胞并然后全身性施用。例如,对于全身性施用,可以修饰反义核酸分子,从而它们与表达在所选细胞表面上的受体或抗原特异性地结合,例如通过将所述反义核酸分子连接至与细胞表面受体或抗原结合的肽或抗体连接而做到这一点。所述反义核酸分子也可以使用本文中所述的载体递送至细胞。
根据又一个方面,反义核酸是α-端基异构核酸分子。α端基异构核酸分子形成具有互补RNA的特定双链杂交体,在所述双链杂交体中与常见的b-单元相反,所述链彼此平行地分布(Gaultier等(1987)Nucl Ac Res 15:6625-6641)。反义核酸分子也可以包含2′-O-甲基核糖核苷酸(Inoue等(1987)Nucl Ac Res 15,6131-6148)或嵌合RNA-DNA类似物(Inoue等(1987)FEBS Lett.215,327-330)。
人工和/或天然微RNA(miRNA)可以用来减少基因表达和/或mRNA翻译。内源性miRNA是通常长19-24个核苷酸的单链小RNA。它们主要发挥调节基因表达和/或mRNA翻译的功能。大多数的植物微RNA(miRNA)与其靶序列完全互补或接近完全互补。然而,存在具有多达5个错配的天然靶。它们由Dicer家族的双链特异性RNA酶从具有特征性折返结构的较长非编码性RNA加工而来。加工后,它们通过与RNA诱导的沉默复合体(RISC)的主要成分-Argonaute蛋白结合被掺入该复合体。miRNA充当RISC的特异性成分,因为它们与胞浆内的靶核酸(大多是mRNA)发生碱基配对。后续调节事件包括靶mRNA切割和破坏和/或翻译抑制。miRNA过量表达的作用因此往往反映为靶基因的mRNA水平降低。
天然miRNA存在于自然界中。不过人工微RNA(amiRNA)同等地用于本发明的方法中。可以按照遗传工程方式专门设计通常长21或24个核苷酸的amiRNA以负向调节单个或多个目的基因的基因表达。选择植物的微RNA靶的决定因素是本领域熟知的。已经定义了用于靶识别的经验参数并且可以使用它们来辅助设计特定的amiRNA,Schwab R等,2005(DevCell.(2005)8(4):517-27)。用于设计并产生amiRNA及其前体的便利手段也是公众可获得的(Schwab等,2006 Plant Cell.2006 18(5):1121-33)。
根据本发明的另一个特征,所述降低或基本上消除优选地通过使用微RNA(天然或人工miRNA)实现。
在又一个实施方案中,在本发明方法中使用的反义核酸是核酶。核酶是具有核糖核酸酶活性的催化性RNA分子,能够切割与其具有互补区域的单链核酸,如mRNA。因此,核酶(例如锤头状核酶(其在Haselhoff和Gerlach(1988)Nature 334,585-591,1988中描述)可以用来催化性地切割DREB mRNA转录物,以因而抑制DREB mRNA翻译。基于DREB cDNA的核苷酸序列,可以设计具有针对编码DREB的核酸特异性的核酶。例如,可以构建四膜虫(Tetrahymena)L-19 IVS RNA的衍生物,在衍生物中活性部位的核苷酸序列与编码DREB的mRNA中待切割的核苷酸序列互补。参见Cech等美国专利号4,987,071;和Cech等美国专利号5,116,742。或者,DREB mRNA可以用来从RNA分子汇集物中选出具有特异性核糖核酸酶活性的催化性RNA。见例如Bartel和Szostak(1993)Science 261,1411-1418,1993)。核酶用于植物中基因沉默的用途是本领域已知的(例如Atkins等(1994)WO 94/00012;Lenne等(1995)WO 95/03404;Lutziger等(2000)WO 00/00619;Prinsen等(1997)WO 97/13865和Scott等(1997)WO97/38116)。
基因沉默作用也可以通过插入诱变(例如T-DNA插入或转座子插入)或通过如Angell和Baulcombe 1998(Amplicon VIGS WO 98/36083);Baulcombe(WO 99/15682)及其他人描述的基因沉默策略而实现。
当内源性DREB基因中存在突变和/或在随后导入植物的分离的DREB基因中存在突变时,基因沉默也可以出现。例如,导入此类突变的方法可以是EMS(甲磺酸乙酯)处理法。DREB蛋白活性的降低或基本上消除可以由无功能的DREB蛋白引起。例如,DREB可以与多种相互作用蛋白结合;一个或多个突变因而可以产生仍能够结合至相互作用蛋白但不能表现其作为转录因子的正常功能的DREB蛋白。
基因沉默的又一种方法是靶向与DREB基因调节区(例如,DREB启动子和/或增强子)互补的核苷酸序列以形成阻止靶细胞中DREB基因转录的三股螺旋结构。见Helene,C.,Anticancer Drug Res.6,569-84,1991;Helene等,Ann.N.Y.Acad.Sci.660,27-361992和Maher,L.J.Bioassays14,807-15,1992。
技术人员熟知其他方法,如使用针对内源性多肽的抗体以抑制其在植物中的功能,或干扰多肽参与其中的信号途径。尤其,可以构思人造分子用于抑制靶多肽的生物学功能,或用于干扰所述靶多肽参与的信号途径。
备选地,可以建立筛选程序以鉴定植物群体中基因的天然变体,其中所述的变体编码活性降低的多肽。也可以使用此类天然变体例如旨在开展同源重组。
Hiratsu等(Plant J.34,733-739,2003)描述了基因沉默的又一种方法。此方法不依赖与靶向基因的序列同源性,但是涉及使用转录性基因融合物中的抑制序列结构域,并且该方法已经用来改良有农学意义的性状(Fuiita等,Plant Cell 17,3470-3488,2005和Mitsuda等,Plant Cell 17,2993-3006,2005)。通常,在编码能够正向影响靶向基因表达的蛋白质(如转录激活蛋白)的基因与编码抑制结构域的核苷酸片段之间产生核苷酸嵌合融合物。在表达所述嵌合基因融合物后,靶向基因的表达被抑制,通常以显性阴性方式被抑制,从而降低和消除该转录因子的活性。抑制结构域是本领域熟知的,例如存在于一些AP2和锌指转录因子中的EAR基序。基于抑制结构域的方法非常适于克服所选植物物种中靶向基因的基因冗余性(Hiratsu等Plant J.2003年6月;34(5):733-9.)。
上文所述是用于基因沉默(用于降低或基本消除内源性DREB基因表达和该蛋白质活性)的多种方法的实例。本发明方法取决于降低植物中内源性DREB基因的表达。例如,本领域技术人员将轻易地能够调整用于基因沉默的前述方法,从而例如通过使用适宜的启动子在整株植物或在其部分中实现基因沉默。
应当指出本发明的实质在于降低或基本上消除植物中内源性DREB基因表达后发现的有利且出人意料的结果,并且不限于用于这样降低或基本消除内源性DREB蛋白活性的任何具体方法。也可以通过导入遗传修饰(优选地在DREB基因的基因座内)降低或消除DREB蛋白的活性。如本文中定义的基因的基因座意指包括目的基因和编码区上游或下游10kb的基因组区域。
所述遗传修饰可以例如通过以下方法中任意一种(或多种)方法导入:T-DNA失活法、TILLING、位点定向诱变法、定向进化法、同源重组法。导入该遗传修饰后,随后是选择活性降低的DREB蛋白的步骤,其中活性的降低产生具有提高的产量的植物。
T-DNA失活标签法涉及T-DNA在目的基因的基因组区域中或基因的编码区上游或下游10kb以这样的方式插入,从而此T-DNA抑制靶基因的表达。通常,所述靶基因的天然启动子对所述靶基因表达的调节作用被破坏。T-DNA随机地插入植物基因组,例如通过农杆菌感染,并且导致在插入的T-DNA附近的基因表达下调。所得的转基因植物表现出因在导入的T-DNA附近的基因表达受抑制所致的表型。
也可以使用TILLING(基因组中定向诱导的局部损伤)技术将遗传修饰导入DREB基因的基因座内。这种诱变技术用来产生、鉴定和分离不能够表现DREB活性的DREB核酸的诱变变体。TILLING还允许选择携带此类突变变体的植物。这些突变变体可以彻底缺少DREB活性。TILLING的原理在定义部分中描述。
位点定向诱变和随机诱变可以用来产生DREB核酸的变体。几种方法可用于实现位点定向诱变,最常见的方法是基于PCR的方法(CurrentProtocols in Molecular Biology.Wiley编辑)。
定向进化也可以用来产生DREB核酸的变体。这由以下内容组成:反复DNA改组,随后合适地筛选和/或选择以产生DREB核酸的变体或所述变体的编码具有改良(此处是降低或消除的)生物学活性的DREB蛋白的变体(Castle等,(2004)Science 304(5674):1151-4;美国专利5,811,238和6,395,547)。
T-DNA激活法、TILLING、位点定向诱变法和定向进化法是能够产生新等位基因和DREB变体的技术的实例。
同源重组允许在基因组中导入所选择的核酸于定义的所选位置处,优选地导入至DREB基因的基因座。
技术人员熟知其他方法,如使用针对内源性DREB的抗体以抑制其在植物中的功能,或干扰DREB参与的信号途径。备选地,可以建立筛选程序以鉴定DREB基因的天然变体,其中所述的变体具有降低的DREB活性,或根本没有DREB活性。此类天然变体也可以用于本发明的方法中。
为了最佳性能,用于降低或基本消除内源性DREB基因表达的基因沉默技术需要使用来自单子叶植物的DREB基因序列以转化至单子叶植物。优选地,将来自给定植物物种的DREB基因序列导入相同的物种。例如,来自稻的DREB基因序列(是全长DREB序列或片段)转化至稻植物。DREB基因序列不需要导入相同的植物品种。
“DREB基因”或“DREB核酸”指这样的脱氧核糖核苷酸聚合物或核糖核苷酸聚合物,其包含与编码DREB蛋白的基因的转录区域同源或相对应的序列。以上提及的聚合物可以是任意长度,为单链或双链,或是其类似物,它们具有天然核糖核苷酸的本质特征,因为它们可以类似于天然存在的多核苷酸的方式与核酸杂交。
在本发明方法中使用的核酸指一般从编码DREB蛋白的基因衍生的足够长度的基本上连续的核苷酸,以使得编码DREB蛋白的基因发生沉默;这种核酸可以短至20个或更少核苷酸。编码(功能性)蛋白质的基因不是以上讨论的用于降低或基本消除DREB内源基因表达和/或DREB蛋白水平和/或活性的多种方法所需的条件。
本发明方法可以使用DREB基因/核酸中足够长度的基本上连续的核苷酸进行,其中所述的基本上连续的核苷酸可以由21个或更少(一般至少10个)核苷酸组成,可以来自DREB基因/核酸的任意部分,如在DREB基因家族中非常保守的AP2编码区或来自DREB基因中非编码区的任意部分。
编码DREB蛋白的基因是本领域熟知的,并且在本发明方法中使用的是所述植物DREB基因/核酸的基本上连续的核苷酸(Qin等Plant CellPhysiol.2004年8月;45(8):1042-52;Li等Theor Appl Genet.2005年5月;110(8):1355-62;Nakano等Plant Physiol.140,411-432,2006 Badawi等.Mol Genet Genomics.2007年2月7日;Huang等J Plant Physiol.2007年1月13日)。
其他DREB基因/核酸衍生性序列也可以在本发明的方法中使用,并且可以由本领域技术人员轻易地鉴定。DREB蛋白可以通过存在的几个熟知特征(见上文)中的一个或多个特征而鉴定。在鉴定DREB蛋白后,本领域技术人员可以使用常规技术轻易衍生相应的编码性核酸序列,并且使用该核酸序列的足够长度的连续核苷酸开展任何一种或多种上文所述的基因沉默方法。
植物DREB蛋白也可以通过某些保守基序的存在而被鉴定。可以使用如上文中所述比较的序列比对方法鉴定这些保守基序的存在。在一些情况下,可以调整默认参数以调节搜索的严格性。例如使用BLAST,可以提高用于报告针对数据库序列的匹配的统计显著性阈值(称作“期望”值)以显示严格性较低的匹配。当使用基序CMIII-1至CMIII-4或基序CMIV-1和CMIV-2时,对于鉴定DREB蛋白的匹配的预期值一般低于e-07,更一般地低于e-10、e-15、e-20、e-25、e-30、e-35、e-40、e-45、e-50或e-100。以这种方式,可以鉴定几乎精确的短匹配。一旦通过这些基序的存在鉴定到DREB蛋白,本领域技术人员可以容易地衍生相应的核酸,所述核酸编码包含相关基序的多肽,并且使用所述核酸的足够长度的连续核苷酸来开展上文所述基因沉默方法中任何一种或多种方法(用于降低或基本上消除内源性DREB基因表达和/或DREB蛋白的水平和/或活性)。
如上文定义的同源物可以使用本领域熟知的常规技术,如通过序列比对法轻易地鉴定;DREB蛋白的同源物可以已经在多种植物物种中以不同名称命名,因此,基因/蛋白质名称不应当用于鉴定直向同源物或旁系同源物。用于比对序列以进行比较的方法是本领域熟知的,此类方法包括GAP、BESTFIT、BLAST、FASTA和TFASTA。GAP使用Needleman和Wunsch算法((1970)J Mol Biol 48:443-453)以找到使匹配数最大化并使空位数最小化的两个完整序列的比对。BLAST算法(Altschul等(1990)JMol Biol 215:403-10)计算序列同一性百分数并在两个序列之间开展相似性的统计分析。用于开展BLAST分析的软件是通过国家生物技术信息中心可公开获得的。同源序列可以使用例如具有默认配对比对参数的ClustalW多重序列比对算法(版本1.83)和百分数评分方法轻易地鉴定。如本领域技术人员显而易见,可以进行少许手工编辑以优化保守基序之间的比对结果(见下文)。此外,作为使用全长序列以鉴定同源物的替代,也可以使用特定结构域。利用上文提及的程序,使用默认参数,可以在完整核酸或氨基酸序列范围内或所选结构域或保守基序范围内确定序列同一性值。对于局部比对,Smith-Waterman算法是特别有用的(Smith TF,WatermanMS(1981)J.Mol.Biol 147(1);195-7)。
术语“结构域”、“标签”和“基序”在本文中的“定义”部分定义。DREB蛋白中的多种结构性结构域可以使用专业数据库例如SMART(Schultz等(1998)Proc.Natl.Acad.Sci.USA 95,5857-5864;Letunic等(2002)NucleicAcids Res 30,242-244;InterPro(Mulder等,(2003)Nucl.Acids.Res.31,315-318;Prosite(Bucher和Bairoch(1994)。用于生物分子序列基序的概括特征结构及其在自动化序列解读中的功能(在)ISMB-94;第二届分子生物学智能系统国际会议文集。Altman R.,Brutlag D.,Karp P.,Lathrop R.,Searls D.编辑,第53-61页,AAAIPress,Menlo Park;Hulo等,Nucl.Acids.Res.32:D134-D137,(2004)或Pfam(Bateman等,Nucleic AcidsResearch 30(1):276-280(2002))鉴定。一组用于计算机方式分析蛋白质序列的工具可在ExPASY蛋白质组服务器上获得(瑞士生物信息研究所维护(Gasteiger等,ExPASy:深入认识和分析蛋白质的蛋白质组服务器,Nucleic Acids Res.31:3784-3788(2003))。也可以使用常规技术如通过序列比对鉴定结构域或基序。
另外,DREB蛋白也可以因其结合DNA和与其他蛋白质相互作用的能力而可鉴定。DNA结合活性和蛋白质-蛋白质相互作用可以使用本领域熟知的技术在体外或在体外轻易地确定。用于DNA结合活性的体外测定法的实例包括:使用已知DREB DNA结合结构域的凝胶阻滞分析(Sakuma等2002)或酵母单杂交测定法(Qin等2004)。备选地,DREB蛋白的活性可以通过测量反式激活其中含有DRE的启动子驱动报道基因表达的报道构建体表达的能力确定,例如通过测定所产生报道分子产物的量或活性进行测量。一个这样的实例是原生质体系统,该系统基于包含偶联于UidA基因的拟南芥rd29A启动子的报道构建体和随后测定GUS活性(Dubouzet等2003)。用于蛋白质-蛋白质相互作用的体外测定法的实例是酵母双杂交分析(Fields和Song(1989)Nature 340:245-6)。已知与DREB相互作用的蛋白质包括ADA2和GCN5,Stockinger等(Nucleic Acids Res.2001;29(7):1524-33)。已知与DREB基因启动子结合并且因此影响其基因表达的蛋白质包括ICE1(Chinnusamy等Genes Dev.2003年4月15日;17(8):1043-54)。
因而在使用上文所述的一个或几个特征鉴定DREB蛋白后,本领域技术人员可以容易地衍生编码所述多肽的相应核酸,并且使用所述核酸的足够长度的连续核苷酸来开展上文所述基因沉默方法中任何一种或多种方法(以降低或基本上消除内源性DREB基因表达)。
优选用于本发明方法中的是SEQ ID NO:335(OsDREB1A)的足够长度的基本上连续核苷酸,或使用编码OsDREB1A(SEQ ID NO:335)的直向同源物或旁系同源物的核酸序列的足够长度的基本上连续的核苷酸。在实施例46中提供OsDREB1A蛋白的此类直向同源物和旁系同源物的实例。OsDREB1A的优选同源物是由表Y2中列出的蛋白质序列所代表的蛋白质。
例如单子叶植物物种中的直向同源物可以通过开展所谓交互性blast搜索轻易地找到。这可以通过第一blast进行,所述的第一blast包括将查询序列(例如,SEQ ID NO:335或SEQ ID NO:336)针对任意序列数据库,如可公开获得的NCBI数据库进行BLAST。当从核苷酸序列开始时,一般使用BLASTN或TBLASTX(使用标准默认值),并且当从蛋白质序列开始时,使用BLASTP或TBLASTN(使用标准默认值)。可以任选地筛选BLAST结果。筛选结果或非筛选结果的全长序列随后针对来自生物的序列进行反向BLAST(第二BLAST),其中所述查询序列从所述生物衍生(在查询序列是SEQ ID NO:335或SEQ ID NO:336的情况下,所述第二blast因而将针对稻序列进行)。随后比较第一BLAST和第二BLAST的结果。若来自第二blast的高阶位命中源自与衍生查询序列的物种相同的物种,则鉴定到旁系同源物;若高阶位命中不是源自与衍生查询序列的物种相同的物种,则鉴定到直向同源物。高阶位命中是具有低E-值的那些命中。E-值越低,评分越显著(或换句话说,偶然发现该命中的几率越低)。同一性百分数指两个所比较的核酸(或多肽)序列之间特定长度范围内相同的核苷酸(或氨基酸)的数目。E-值的计算是本领域熟知的。在大型家族的情况下,可以使用ClustalW,随后使用邻接树法,以帮助观察相关基因的聚集和鉴定直向同源物和旁系同源物。
DREB基因/核酸的基本上连续的核苷酸的来源可以是任意植物来源或人工来源。为了最佳性能,用于降低或基本消除内源性DREB基因表达的基因沉默技术需要使用来自单子叶植物的DREB序列以转化至单子叶植物。优选地,来自禾本科(Poaceae)的DREB序列转化至禾本科植物。还优选地,来自稻的DREB基因(是全长DREB序列或片段)转化至稻植物。DREB核酸不需要导入相同的植物品种。最优选地,来自稻的DREB核酸是SEQ ID NO:335(OsDREB1A)的足够长度的基本上连续的核苷酸或是下述核酸序列的足够长度的基本上连续的核苷酸,其中所述的核酸序列编码OsDREB1A(SEQ ID NO:335)的直向同源物或旁系同源物。如上文提及,本领域技术人员将十分清楚何种核苷酸将构成足够长度的基本上连续的核苷酸以开展上文定义的任意基因沉默方法,在一些情况下,这可以是短至20个或更少的基本上连续的核苷酸。
本发明也提供促进导入和/或表达在本发明方法中使用的核苷酸序列的基因构建体和载体。
因而,提供这样的基因构建体,其包含能够驱动植物中有义和/或反义DREB核酸序列表达,从而使植物中内源性DREB基因沉默的一个或多个调控序列;和任选地转录终止序列。优选地,所述调控序列是组成型和遍在性启动子。
用于基因沉默的优选构建体是包含DREB基因或其片段的反向重复序列(此反向重复序列优选能够形成发夹结构)的构建体,其中所述的反向重复序列处在组成型启动子控制下。本发明方法也可以使用可降低蛋白质水平和/或活性的其他策略进行。此类技术是本领域已知的。
在本发明方法中使用的构建体可以使用本领域技术人员熟知的重组DNA技术产生。所述基因构建体可以插入适于转化至植物并适于在转化细胞中表达目的基因的载体,所述载体可以是市售的。本发明因而提供如上文所定义的基因构建体在本发明方法中的用途。
所述目的序列有效地与能够提高植物中表达的一个或多个调控序列(至少与启动子)连接,术语“调控序列”和“启动子”如本文中定义。
有利地,任何类型的启动子可以用来驱动核酸序列的表达。优选地,DREB核酸或其功能变体有效连接至组成型启动子。优选地,能够优先地在整个植物各处表达核酸的组成型启动子具有与GOS2启动子可比较的表达谱。更优选地,组成型启动子具有与稻GOS2启动子相同的表达谱,最优选地,能够优先地在整个植物各处表达核酸的启动子是来自稻的GOS2启动子(SEQ ID NO:339或SEQ ID NO:39)。应当明白本发明的应用不限于SEQ ID NO:335所代表的DREB核酸,同时本发明的应用也不限于由GOS2启动子驱动时DREB核酸的表达。在本发明方法中使用的备选组成型启动子是高速泳动族蛋白启动子(WO2004070039中的SEQ ID NO:40)。也可以用来驱动DREB核酸表达的其他组成型启动子的实例在定义部分中显示。
任选地,可以在导入植物内的构建体中使用一个或多个终止子序列。其它的调节元件可以包括转录增强子以及翻译增强子。本领域技术人员将知道可能适用于实施本发明的终止子序列和增强子序列。如定义部分中描述,内含子序列也可以添加至5′非翻译区(UTR)或编码序列中,以增加聚集在细胞质内的成熟信使的量。(除启动子、增强子、沉默子、内含子序列、3’UTR和/或5’UTR区域之外的)其他调控序列可以是蛋白质/或RNA稳定元件。此类序列将是已知的或可以由本领域技术人员轻易获得。
基因构建体还可以包括为在特定细胞类型中维持和/或复制所需要的复制起点序列。一个实例是当基因构建体需要作为游离型遗传元件(例如质粒或粘粒分子)维持在细菌细胞中时的复制起点。优选的复制起点包括但不限于f1-ori和colE1。
为检测如在本发明方法中使用的核酸序列的成功转移和/或选择包含这些核酸的转基因植物,有利的是使用标记基因(或报道基因)。因此,所述基因构建体可以任选地包含选择标记基因。选择标记在本文的“定义”部分中更详细地描述。一旦不再需要所述标记基因时,它们可以从转基因细胞中移出或切除。用于移出标记的技术是本领域已知的,有用技术在上文定义部分中描述。
本发明也包括通过本发明方法可获得的植物,包括植物部分,其中所述的植物相对于对照植物具有提高的产量并且具有降低的或基本上消除的内源性DREB基因表达。宿主细胞和宿主植物意指作为本发明基因构建体的受体的细胞、完整植物或其部分,其中所述的本发明基因构建体一般使用转化技术导入。
本发明也提供用于产生相对于对照植物具有提高的产量的转基因植物的方法,其中所述转基因植物具有降低的或基本上消除的内源性DREB基因表达和/或DREB蛋白的水平和/或活性。
更具体地,本发明提供用于产生具有提高的种子产量的转基因植物的方法,所述方法包括:
(i)在植物、植物部分或植物细胞中导入并表达基因构建体,所述基因构建体包含能够优先地驱动有义和/或反义DREB核酸序列在植物中表达,从而使植物中内源性DREB基因表达沉默的一个或多个调控序列;和
(ii)在促进植物生长和发育的条件下培育植物、植物部分或植物细胞。
优选地,导入植物的构建体是包含DREB基因或其片段的(部分或完全)反向重复序列的构建体,所述的反向重复序列优选能够形成发夹结构。
根据本发明的优选特征,所述构建体通过转化导入植物。术语“转化”在本文的“定义”部分中更详细地描述。
通常在转化后,对植物细胞或细胞群体选择一个或多个标记的存在性,其中所述标记由随同目的基因一起共转移的植物可表达基因编码,随后将转化材料再生成完整植物。为了选择转化植物,在所述转化中获得的植物材料原则上经历选择性条件,从而转化植物可以与非转化植物区分。例如,可以将以上述方式获得的种子播种,并且在初始培育时间后,通过喷洒进行合适的选择。另一种可能性在于(根据需要)消毒后,在使用合适选择剂的琼脂板上培育种子,从而仅转化的种子可以长成植物。或者,对所述转化植物筛选选择标记(如上文所述的选择标记)的存在性。
在DNA转移和再生后,推定转化的植物也可以例如使用DNA印迹分析对目的基因的存在性、拷贝数和/或基因组构造进行评价。备选地或额外地,新导入的DNA的表达水平可以使用RNA印迹分析和/或蛋白质印迹分析或或定量PCR监测,全部技术均是本领域普通技术人员熟知的。
产生的转化植物可以通过多种方法繁殖,如通过克隆繁殖法或经典育种技术。例如,第一世代(或T1)转化植物可以进行自交并且选择纯合的第二世代(或T2)转化体,并且T2植物随后可以通过经典育种技术进一步繁殖。
产生的转化生物可以采取多种形式。例如,它们可以是转化细胞和非转化细胞的嵌合体;克隆性转化体(例如,被转化以含有表达盒的全部细胞);转化组织和非转化组织的移植体(例如在植物中,与未转化接穗嫁接的转化根状茎)。
本发明明确地扩展至由本文中所述的任意方法产生的任意植物细胞或植物,并扩展至全部植物部分及其繁殖体。本发明进一步扩展以包括已经由前述任意方法产生的原代转化或转染细胞、组织、器官或完整植物的后代,唯一要求是后代表现与如本发明方法中的亲代相同的基因型和/或表型特征。
本发明也扩展至植物的可收获部分,如种子和衍生、优选直接衍生自这种植物的可收获部分的产品,如干燥颗粒或粉末、油、脂肪和脂肪酸、淀粉或蛋白质。
本发明也包含DREB核酸用于降低或基本上消除植物中内源性DREB基因表达和/或DREB蛋白的水平和/或活性,以提高如上文所定义的植物种子产量的用途。
附图简述
本发明现在将参考以下附图进行描述,其中:
图1显示SEQ ID NO:2(A)和SEQ ID NO:27(B)的序列,NAP1结构域以粗体和下划线标出。
图2显示用于稻中在GOS2启动子的控制下增加编码拟南芥属植物NAP1样蛋白的核酸表达的双元载体。
图3显示来自多个植物物种的NAP1样多肽的CLUSTAL W多重序列比对结果。SEQ ID NO:2(AtNAP1样,At1g74560)以粗体显示并且对保守的NAP结构域加下划线。
图4是描述来自酵母、人和植物的NAP和SET蛋白之间关系的系统发生树。在这个系统发生树中标出的参考标识是所述序列的GenBank和MIPS(对于拟南芥)登录号。At:拟南芥,Gm:大豆,Nt:烟草(源自WO03/085115的序列),Os:稻,Ps:豌豆,Zm:玉米,Hs:智人,Sc:酿酒酵母。
图5苜蓿属植物NAP1样蛋白在大肠杆菌中表达并且通过亲和层析法借助6xHIS-标签从粗制细胞提取物纯化。从镍琼脂糖树脂以不同咪唑浓度洗脱的34kD蛋白的洗脱物使用抗6xHIS抗体(Sigma,St Louis,USA)通过蛋白质印迹法显现。
图6NAP1样蛋白在植物中具有核定位作用。A)已经使用针对纯化蛋白所产生的抗体通过间接免疫荧光法证实了苜蓿属植物NAP1样蛋白定位在培养的苜蓿细胞的细胞核中(图A的左图)。为了证实这种核定位作用,将细胞核平行地用荧光染料DAPI染色(图A的右图)。在插图中,箭头指向分裂中期细胞。微弱荧光显示在无核区室的分裂中期细胞中染色体周围的NAP1样蛋白的低丰度。B)PEG介导的基因构建体摄取至原生质体后,瞬时表达的与GFP融合的拟南芥属植物NAP1样蛋白位于拟南芥属植物细胞的细胞核内。
图7纯化的苜蓿属植物NAP1样蛋白抑制(从兔骨骼肌纯化的)PP2A的体外磷酸组蛋白H2B脱磷酸活性,但是不影响由相同酶所致的糖原磷酸化酶脱磷酸。
图8在实施本发明方法中有用的序列的实例。
图9显示SEQ ID No.41的结构域结构。加阴影的长方形表示Lsm结构域的位置。
图10显示Lsm蛋白的比对结果(图10A)和相应的系统发生树(图10B)。保守结构域的位置显示为:虚线表示α螺旋的位置;Lms基序I和II分别以单下划线和双下划线表示;对如SEQ ID No.159和SEQ ID No.160所代表的基序I和基序II加框。
图11显示用于稻中在WSI18启动子的控制下增加编码拟南芥Lsm蛋白的核酸表达的双元载体。
图12详述在实施本发明方法中有用的序列的实例。
图13示出了具有以粗体显示的细胞周期蛋白盒的SEQ ID NO:173的序列。显示了如Andersen等(1997)所区分的多种螺旋结构域(Hn、H1、H2、H3、H4、H5、H1’、H2’、H3’、H4’、H5’和Hc)。
图14显示来自多个物种的CycH多肽的CLUSTAL W多重序列比对结果。所用参数是:缓慢比对,空位开口10,空位延伸:0.1,BLOSUM矩阵。保守的氨基酸以星号显示,保守性替换由冒号显示,保守性较低的替换由小点显示。这种多重序列比对用于定义其他细胞周期蛋白H蛋白中的螺旋结构域和用于定义合适的截短以产生在本发明方法中使用的CycHTr多肽。
图15显示包含多种细胞周期蛋白多肽序列(Yamaguchi等,Plant J.24,11-20,2000)的系统发生树。与细胞周期蛋白H(如SEQ ID NO:166或SEQID NO:173的序列)聚类的序列可以用于实施本发明的方法。
图16显示用于稻中在种子特异性启动子的控制下增加编码拟南芥CycHTr蛋白的核酸表达的双元载体。
图17详述在实施本发明方法中有用的序列的实例。
图18显示了描述Remorin结构的示意图。显示了羧基端Remorin结构域(其对应于Pfam家族登录号PF03763),显示了氨基端结构域(从氨基端至羧基端包含从氨基端至羧基端Remorin结构域上游最末尾氨基酸残基处的氨基酸残基),和显示了在该多肽羧基端处包含至少一个Cys和/或一个Phe的最后10个氨基酸残基。
图19显示了预测如SEQ ID NO:199所代表的多肽的羧基端半部分中卷曲螺旋结构域的COILS算法的图形输出结果。X轴代表氨基酸残基位置,Y轴代表卷曲螺旋结构域存在的概率(范围从0至1),并且三条线代表所检验的三个窗口(14、21、28)。
图20显示了来自多个来源物种的Remorin多肽羧基端Remorin结构域和Remorin多肽羧基端末端氨基酸残基的CLUSTAL W(1;83)多重序列比对。SEQ ID NO:199的Remorin结构域由所述多肽序列上方的黑色框代表并且如此进行显示。SEQ ID NO:199的预测卷曲螺旋结构域加双下划线显示并且将推定的苏素化位点加框显示,另外,在该比对中对Remorin多肽通常包含至少一个Cys和/或一个Phe的羧基端氨基酸残基加框显示。
图21显示用于稻中在组成型启动子GOS2或HMGB的控制下增加编码拟南芥Remorin多肽的核酸序列表达的双元载体。
图22详述在实施本发明方法中有用的序列的实例。
图23是OsDREB1A(SEQ ID NO:336)蛋白的全长序列的代表。显示了保守基序CMIII-1至CMIII-4以及CMIV-1和CMIV-2的位置。推定的定位信号加双下划线显示。对应于AP2结构域的区域以粗体标记。
图24显示来自稻和拟南芥的DREB蛋白的氨基酸序列的比对结果。显示了共有序列。
图25显示了如Shigyo等2006发表的AP2/EREBP多基因家族系统发生树的无根最大或然性树。显示了其中AP2转录因子归属的不同亚家族和组,包括DREB GROUP。
图26显示用于稻中使用组成型启动子(OsGOS2)控制下的发夹构建体沉默OsDREB1A RNA的双元载体。
图27显示在实施本发明方法中有用的序列实例或用于分离这类序列的序列实例。序列可以从公开的EST集合(public EST assemblies)中产生,测序质量较低。因此,可以预期有一些核酸替换。起始密码子(ATG)和终止密码子在这些核酸序列编码全长DREB蛋白时对核酸序列进行了限定。然而,5’UTR和3’UTR也均可以用于实施本发明的方法。
实施例
本发明现在参考如下实施例进行描述,所述实施例仅是示意性的。以下实施例不意图完全限定或限制本发明的范围。
DNA操作:除非另外说明,重组DNA技术根据(Sambrook(2001)Molecular Cloning:a laboratory manual,第3版Cold Spring HarborLaboratory Press,CSH,New York)或Ausubel等(1994),Current Protocolsin Molecular Biology,Current Protocols第1卷和第2卷中描述的标准方案进行。用于植物分子研究工作的标准材料和方法在BIOS科学出版有限责任公司(BIOS Scientific Publications Ltd(英国))和Blackwell科学出版社(Blackwell Scientific Publications(英国))出版的R.D.D.Croy的PlantMolecular Biology Labfax(1993)中描述。
实施例1:与SEQ ID NO:1和SEQ ID NO:2相关的序列的鉴定
使用数据库搜索工具如基本局部比对工具(BLAST)(Altschul等(1990)J.Mol.Biol.215:403-410;和Altschul等(1997)Nucleic Acids Res.25:3389-3402),在国家生物技术信息中心(NCBI)的Entrez核苷酸数据库中维护的那些序列中鉴定到与SEQ ID NO:1相关的(全长cDNA、EST或基因组)序列和/或与SEQ ID NO:2相关的蛋白质序列。使用该程序通过将核酸序列或多肽序列与序列数据库比较并且计算匹配的统计显著性来找到序列之间的局部相似性区域。由SEQ ID NO:1编码的多肽用于TBLASTN算法,采用默认设置和过滤程序以忽略低复杂性序列启动(setoff)。这种分析的结果通过配对比较进行观察,并根据概率评分(E-值)进行评级,其中所述的评分反映特定比对结果因偶然发生的概率(E-值越低,命中的显著性越高)。除了E-值外,比较过程也可以通过同一性百分数评分。同一性百分数指两个比较的核酸(或多肽)序列之间在特定长度范围内相同核苷酸(或氨基酸)的数目。在一些情况下,可以调整默认参数以修改所述搜索的严格性。
表A提供与如SEQ ID NO:1所代表的核酸序列和SEQ ID NO:2所代表的蛋白质序列相关的核酸序列和蛋白质序列名单。
表A:编码NAP1样多肽的核酸序列和NAP1样多肽。
名称/代号 | 来源生物 | 核酸SEQ ID NO: | 多肽SEQ ID NO: |
AtNAP1 | 拟南芥 | 1 | 2 |
NtNAP1a | 烟草 | 6 | 7 |
NtNAP1b | 烟草 | 8 | 9 |
Ms10.1 | 苜蓿 | 10 | 11 |
nfa104 | 玉米 | 12 | 13 |
OsNAP1a | 稻 | 14 | 15 |
OsNAP1b | 稻 | 16 | 17 |
nfa103 | 玉米 | 18 | 19 |
NAP1样 | 拟南芥 | 20 | 21 |
LeNAP1 | 番茄 | 22 | 23 |
NAP1样 | 拟南芥 | 24 | 25 |
NAP1样 | 拟南芥 | 26 | 27 |
NAP1样 | 拟南芥 | 28 | 29 |
NAP1样 | 拟南芥 | 30 | 31 |
NAP1Ps | 豌豆 | 35 | 36 |
SNAP-1 | 大豆 | 37 | 38 |
实施例2:NAP1样多肽序列的比对
多肽序列的比对使用来自Vector NTI(Invitrogen)的Alignment X程序进行,其中所述Alignment X程序基于受欢迎的累进比对Clustal算法(Thompson等(1997)Nucleic Acids Res 25:4876-4882;Chenna等(2003),Nucleic Acids Res 31:3497-3500)。空位开口罚分的默认值是10,空位延伸罚分0.1并且所选的权重矩阵是Blosum 62(若比对多肽)。图3中的结果显示NAP1样多肽共享序列高度保守的区域。
描述来自酵母、人类和植物的NAP和SET蛋白之间关系的系统发生树在图4中给出。该系统发生树由VNTI软件包5.5(Informax)的AlignmentX程序建立。用来产生多重比对结果的矩阵是Blosum62并且所用比对参数是:空位开口罚分,10;空位延伸罚分,0.5;空位分离罚分范围,8;比对延迟的同一性百分数40。该系统发生树使用Saitou和Nei邻接法建立。
实施例3:在实施本发明方法中有用的多肽序列之间总体同一性百分数的计算
使用现有技术领域可获得的方法之一,即MatGAT(矩阵总体比对工具)软件(BMC Bioinformatics.20034:29.MatGAT:使用蛋白质序列或DNA序列产生相似性/同一性矩阵的一项应用,Campanella JJ,Bitincka L,Smalley J)确定在实施本发明方法中有用的全长多肽序列之间的总体相似性和同一性百分数。MatGAT软件对DNA序列或蛋白质序列产生相似性/同一性矩阵,无需数据的预先比对。该程序使用Myers和Miller总体比对算法(空位开口罚分12和空位延伸罚分2)进行一系列配对比对,使用例如Blosum 62(对于多肽而言)计算相似性和同一性并且随后将结果置于距离矩阵内。在分割线下半部分显示序列相似性,和在对角分割线的上半部分显示序列同一性。
比较中使用的参数是:
评分矩阵:Blosum62
第一空位:12
延伸空位:2
表B中显示在多肽序列的全长范围(不包括部分多肽序列)中的总体相似性和同一性的软件分析结果。同一性百分数在对角线上方给出而相似性百分数在对角线下方给出。
与SEQ ID NO:2相比较,在实施本发明方法中有用的全长多肽序列之间的同一性百分数可以低至22%氨基酸同一性。因为NAP结构域覆盖了所述蛋白质序列的最大部分,因而当比较NAP结构域时,序列同一性仅略微较高。
实施例4:在实施本发明方法中有用的多肽序列中所包含的结构域的鉴定
蛋白质家族、结构域和位点的集成资源(InterPro)数据库是针对基于文本及基于序列的搜索法的常用特征标识数据库的集成界面。InterPro数据库合并了这些数据库,所述数据库使用不同方法学及不同程度的有关充分表征的蛋白质的生物学信息以获得蛋白质特征标识(protein signatures)。合作数据库包括SWISS-PROT、PROSITE、TrEMBL、PRINTS、ProDom和Pfam,Smart和TIGRFAMs。Interpro由英国欧洲生物信息学研究所维护。
如SEQ ID NO:2所代表的多肽序列的InterPro扫描结果呈现于表C。
表C:如SEQ ID NO:2所代表多肽序列的InterPro扫描结果
数据库 | 登录号 | 登录名称 |
PANTHER | PTHR11875 | NAP_家族 |
PANTHER | PTHR11875:SF9 | PTHR11875:SF9 |
PFAM | PF00956 | NAP |
实施例5:在实施本发明方法中有用的多肽序列的拓扑结构预测(亚细胞定位、跨膜...)
TargetP 1.1预测真核生物蛋白的亚细胞定位。基于任何氨基端前序列的预测存在进行定位指派:叶绿体转运肽(cTP),线粒体靶向肽(mTP)或分泌途径信号肽(SP)。作为最终预测基础的评分并不真正是概率,并且它们不是必需地加合成一体。然而,根据TargetP,具有最高评分的定位是最可能的,并且评分之间的关系(可靠性级别)可以指示该预测具有多大确定性。可靠性级别(RC)范围从1至5,其中1表示最可靠的预测。TargetP在丹麦技术大学(Technical University of Denmark)的服务器上维护。
对于预测含有氨基端前序列的序列而言,也可以预测潜在的切割位点。
可以选择许多参数,如生物组别(非植物或植物),临界值集合(无、预定的临界值集合或用户指定的临界值集合)和切割位点预测的计算(是或否)。
对SEQ ID NO:2所代表的多肽序列的TargetP 1.1分析的结果在表D中显示。选择“植物”生物组别,未定义临界值,并且对转运肽的预测长度提出要求。SEQ ID NO:2所代表多肽序列的亚细胞定位可以是细胞质或细胞核,没有预测到转运肽。
表D:对如SEQ ID NO:2所代表的多肽序列的TargetP 1.1分析
长度(AA) | 256 |
叶绿体转运肽 | 0.108 |
线粒体转运肽 | 0.079 |
分泌途径信号肽 | 0.134 |
其他亚细胞定位 | 0.908 |
预测位置 | / |
可靠性级别 | 2 |
预测的转运肽长度 | / |
众多其他算法可以用来进行此类分析,包括:
·在丹麦技术大学服务器上维护的ChloroP 1.1;
·在澳大利亚布里斯班昆士兰大学生物科学研究所的服务器上维护的Protein Prowler亚细胞定位预测者1.2版;
·在加拿大阿伯特省埃德蒙顿市阿尔伯塔大学的服务器上维护的PENCE蛋白组分析专家PA-GOSUB 2.5;
·在丹麦技术大学服务器上维护的TMHMM
实施例6:苜蓿NAP1样蛋白的表征:
材料和方法
推定的苜蓿PP2A抑制物的全长cDNA克隆的分离
已经使用编码推定的苜蓿(Medicago sativa)NAP1样蛋白的一部分的分离cDNA片段从苜蓿根瘤λ-ZAP噬菌体cDNA文库(Savoure等PlantMol.Biol.27,1059-1070;1995),利用如制造商(Stratagene)所述的标准筛选方法分离全长克隆。筛选了400000个蚀斑,留下20个克隆,其中18个克隆在第二轮杂交筛选中为阳性。选择这些克隆中的8个克隆用于进一步研究并从各个噬菌体转化至噬菌粒内。对四个克隆测序,并且证明其中两个克隆是推定NAP1样蛋白的全长cDNA克隆。这两个克隆之一(Ms10.1)用于进一步研究(SEQ ID NO:10,编码蛋白质SEQ ID NO:11)。
苜蓿属植物NAP1样蛋白的产生和纯化
将编码苜蓿NAP1样蛋白的cDNA序列插入pENTRY4载体(Invitrogen)的NcoI/XhoI位点并随后导入pDEST17细菌表达载体。pDEST17载体允许NAP1样蛋白在BL21大肠杆菌细胞内表达为加6xHIS标签的蛋白质。34kDa的NAP1样蛋白通过使用镍琼脂糖树脂(Sigma)的亲和层析法纯化(图5)。
磷酸酶活性测量
苜蓿NAP1样蛋白的潜在磷酸酶抑制活性根据Ulloa等(1993)使用32P-同位素标记的糖原磷酸化酶和组蛋白H2A蛋白作为底物,在纯化自兔骨骼肌的蛋白磷酸酶2A(PP2A)催化亚基上体外测试。
MsNAP1样蛋白和AtNAP1样蛋白的胞内定位
使用标准免疫方案在兔中产生针对加6xHIS标签的纯化蛋白的抗MsNAP1样多克隆抗体。
从悬浮培养的苜蓿(Medicago sativa)细胞分离并用6%甲醛固定原生质体。随后将细胞附着至聚L-赖氨酸涂覆的载玻片上并暴露于抗MsNAP1样抗血清(在PBS中稀释200倍)、洗涤并暴露于FITC缀合的山羊抗兔第二抗体(SIGMA,100x稀释度)。细胞核平行地用DAPI(0.02mg/ml)染色并用Nikon TE300荧光显微镜和SPOT II彩色CCD照相机拍照。
苜蓿NAP1样蛋白的拟南芥直向同源物的编码区(SEQ ID NO:1)以符合绿色荧光蛋白(GFP)的可读框方式插入-相容性植物表达载体(pK7WGF2)。使用标准方法分离原生质体并以纯化的质粒DNA转染。在转染后1日或2日通过荧光显微镜记录瞬时表达。
结果
拟南芥属植物NAP1样蛋白和苜蓿属植物NAP1样蛋白定位于细胞核
内
使用抗MsNAP1样抗体,间接免疫荧光法显示抗体识别位于悬浮培养的苜蓿细胞胞核内的蛋白质。这种定位通过胞核染色DAPI验证。微弱荧光与分裂中期细胞中的染色体相关联(图6.A,插图)。
加GFP标签的拟南芥属植物NAP1样蛋白也排他性地位于位于悬浮培养的拟南芥属植物细胞胞核内(图6.B)。
苜蓿NAP1样蛋白体外抑制PP2A磷酸酶在磷酸组蛋白底物上的活性
将纯化的苜蓿NAP1样蛋白以多种浓度添加至反应混合物,其中所述的反应混合物含有兔骨骼肌PP2A的催化亚基和作为底物的磷酸化组蛋白H2A或糖原磷酸化酶。观察到所述NAP1样蛋白不影响糖原磷酸化酶的脱磷酸,即便在500mM浓度上也是如此,但是仅2.5mM浓度的NAP1样蛋白有效地抑制PP2A在磷酸组蛋白H2A底物上的活性(活性的50%降低)(图7)。
结论
苜蓿NAP1样蛋白和拟南芥NAP1样蛋白显示在结构和功能方面的相似性。植物NAP1样蛋白体外抑制磷酸酶(PP2A)对组蛋白底物的活性,这提示在染色质组织和基因转录方面可能的体内功能。
实施例7:使用如SEQ ID NO:1所代表的核酸序列构建表达载体
除非另外说明,重组DNA技术根据(Sambrook(2001)MolecularCloning:a laboratory manual,第3版Cold Spring Harbor LaboratoryPress,CSH,New York)或Ausubel等(1994),Current Protocols inMolecular Biology,Current Protocols第1卷和第2卷中描述的标准方案进行。用于植物分子研究工作的标准材料和方法在BIOS科学出版有限责任公司(BIOS Scientific Publications Ltd(英国))和Blackwell科学出版社(Blackwell Scientific Publications(英国))出版的R.D.D.Croy的PlantMolecular Biology Labfax(1993)中描述。
使用拟南芥籽苗cDNA文库(Invitrogen,Paisley,UK)作为模板,通过PCR扩增拟南芥NAP1样核酸。在逆转录从籽苗提取的RNA后,将cDNA克隆至pCMV Sport 6.0内。文库插入物的平均大小是1.5kb,并且原始克隆数是1.59x107cfu。6x1011cfu/ml的第一轮扩增后,测定原始滴度是9.6x105cfu/ml。在提取质粒后,将200ng模板用于50μl PCR混合物中。将包含用于Gateway重组的AttB位点的引物prm1505(SEQ ID NO:4)和prm1506(SEQ ID NO:5)用于PCR扩增。使用Hifi Taq DNA聚合酶在标准条件开展PCR。也使用标准方法扩增并纯化771bp的PCR片段。随后进行Gateway方法的第一步骤,即BP反应,在此期间该PCR片段在体内与pDONR201质粒重组以产生根据Gateway术语称作“进入克隆”的pNAP1样。质粒pDONR201从Invitrogen作为技术的一部分购买。
进入克隆pNAP1样随后与用于稻转化的目的载体一起用于LR反应中,其中所述的目的载体在T-DNA边界内包含植物选择标记;目视标记表达盒和意图用于LR与已经克隆在所述进入克隆内的目的序列体内重组的Gateway盒作为功能性元件。用于组成型表达的GOS2启动子位于这个Gateway盒上游。在LR重组步骤后,将所得表达载体pGOS2::NAP1样(图2)转化至农杆菌菌株LBA4404内并随后使用本领域熟知的方法转化至稻植物内。
实施例8:植物转化
稻转化
使用含有所述表达载体的农杆菌来转化稻植物。将稻粳型栽培品种Nipponbare的成熟干燥种子脱壳。通过如下方式实施消毒:在70%乙醇中孵育1分钟,随后在0.2%HgCl2中孵育30分钟,随后用无菌蒸馏水洗涤6次15分钟。无菌的种子随后在含有2,4-D的培养基(愈伤组织诱导培养基)上萌发。在黑暗中孵育4周后,将盾片衍生的胚发生的愈伤组织切下并在相同的培养基上增殖。2周后,将愈伤组织通过在同一种培养基上传代培养另外2周进行繁殖或增殖。胚发生的愈伤组织片在新鲜培养基上传代培养3日,随后共培育(以助长细胞分裂活性)。
将含有所述表达载体的农杆菌菌株LBA4404用于共培育。农杆菌接种在含有适宜抗生素的AB培养基上并在28℃培养3日。随后收集细菌并在液体共培育培养基中悬浮至密度(OD600)约1。该悬液随后转移至培养皿内并将所述愈伤组织浸没于此悬液内15分钟。该愈伤组织随后在滤纸上蘸干并转移至固化的共培育培养基,并在25℃于黑暗中孵育3日。共培育的愈伤组织在含2,4-D的培养基上在28℃于黑暗中在选择剂存在下培育4周。在此期间,迅速生长的抗性愈伤组织团发育。将这种材料转移至再生培养基并在光照下孵育后,胚发生潜能得到释放并且苗在随后4至5周内发育。将苗从愈伤组织上切下并且在含有植物生长素的培养基上孵育2至3周,将苗从所述培养基转移至土壤。硬化的苗在温室中于高湿度和短日照下培育。
对于一个构建体,产生大约35个独立的T0稻转化体。将原代转化体从组织培养箱转移至温室。在定量PCR分析验证T-DNA插入物的拷贝数后,仅保留针对所述选择剂显示抗性的单拷贝转基因植物用于收获T1种子。种子随后在移栽后3至5个月收获。该方法以超过50%的比例产生单基因座转化体(Aldemita和Hodges1996,Chan等1993,Hiei等1994)。
谷物转化
玉米(Zea mays)的转化用Ishida等(1996.Nature Biotech 14(6):745-50)所述方法的改良方法进行。在谷物中,转化是基因型依赖的并且仅特定基因型对于转化和再生是服从的。杂交系A188(明尼苏达大学)或以A188作为亲本的杂交体是用于转化的供体材料的良好来源,不过其他基因型也可以成功地使用。谷穗在授粉后大约11日(DAP)从谷物植物收获,此时不成熟胚的长度是大约1-1.2mm。不成熟的胚与含有所述表达载体的根癌农杆菌共培育,并且转基因植物通过器官发生过程回收。切下的胚在愈伤组织诱导培养基上、随后在玉米再生培养基上生长,其中所述的培养基含有选择剂(例如咪唑啉酮,不过可以使用不同的选择标记)。培养板在25℃于光照下孵育2-3周,或直至苗发育。将源自每个胚的绿色苗转移至玉米生根培养基并在25℃孵育2-3周,直至根发育。将生根的苗移植至温室中的土壤内。从针对所述选择剂显示耐受性并且含有单拷贝T-DNA插入物的植物产生T1种子。
小麦转化
小麦的转化用Ishida等(1996)Nature Biotech 14(6):745-50描述的方法进行。栽培品种Bobwhite(可从墨西哥CIMMYT获得)通常在转化中使用。不成熟的胚与含有所述表达载体的根癌农杆菌共培育,并且转基因植物通过器官发生过程回收。与农杆菌孵育后,所述胚在愈伤组织诱导培养基上、随后在再生培养基上体外培育,其中所述的培养基含有选择剂(例如咪唑啉酮,不过可以使用多种选择标记)。培养板在25℃于光照下孵育2-3周,或直至苗发育。将源自每个胚的绿色苗转移至生根培养基并在25℃孵育2-3周,直至根发育。将生根的苗移植至温室中的土壤内。从针对所述选择剂显示耐受性并且含有单拷贝T-DNA插入物的植物产生T1种子。
大豆转化
根据对Texas A&M美国专利5,164,310中所述方法的改良方法转化大豆。几个商业大豆品种对于通过这种方法的转化是可操作的。栽培品种Jack(从Illinois种子基金会可获得)通常用于转化。对大豆种子消毒以便体外播种。下胚轴、胚根和一片子叶从7日龄年幼籽苗中切下。进一步培育上胚轴和剩余子叶以使辅助节发育。将这些辅助节切下并与含有所述表达载体的根癌农杆菌孵育。在共培育处理之后,洗涤外植体并转移至选择培养基。切下再生的苗并置于苗伸长培养基上。将长度不超过1cm的苗置于生根培养基上直至根发育。生根的苗移植至温室中的土壤内。从针对所述选择剂显示耐受性并且含有单拷贝T-DNA插入物的植物产生T1种子。
油菜籽/卡诺拉油菜转化
使用5-6日龄年幼籽苗的子叶柄和下胚轴作为用于组织培养的外植体并且根据Babic等(1998,Plant Cell Rep 17:183-188)进行转化。商业栽培品种Westar(Agriculture Canada)是用于转化的标准品种,不过其他品种也可以使用。对卡诺拉油菜种子进行表面消毒以体外播种。从所述体外籽苗切下附带子叶的子叶叶柄外植体,并且通过将此叶柄外植体的切口末端浸入细菌悬液以(含有所述表达载体的)农杆菌接种。该外植体随后在23℃,16小时光照下于含有3mg/l BAP、3%蔗糖、0.7%植物琼脂的MSBAP-3培养基上培养2日。与农杆菌共培育2日后,将所述叶柄外植体转移至含有3mg/l BAP、头孢噻肟、羧苄青霉素或特美汀(300mg/l)的MSBAP-3培养基上培养7日,并且随后在含有头孢噻肟、羧苄青霉素或特美汀和选择剂的MSBAP-3培养基上培养,直至苗再生。当苗长度是5-10mm时,切下这些苗并转移至苗伸长培养基(MSBAP-0.5,含有0.5mg/l BAP)。将长度大约2cm的苗转移至生根培养基(MS0)用于根诱导。生根的苗移植至温室中的土壤内。从针对所述选择剂显示耐受性并且含有单拷贝T-DNA插入物的植物产生T1种子。
苜蓿转化
使用(McKersie等,1999 Plant Physiol 119:839-847)的方法转化苜蓿的再生性克隆。苜蓿的再生和转化是基因型依赖性的并且因而需要再生性植物。已经描述了获得再生性植物的方法。例如,这些再生性植物可以选自栽培品种Rangelander(Agriculture Canada)或如Brown DCW和AAtanassov(1985.Plant Cell Tissue Culture 4:111-112)所述的任何其他商业苜蓿品种。备选地,已经选择RA3品种(威斯康星大学)用于组织培养(Walker等,1978 Am J Bot 65:654-659)。叶柄外植体与含有所述表达载体的根癌农杆菌C58C1 pMP90(McKersie等,1999Plant Physiol119:839-847)或LBA4404的过夜培养物共培育。所述外植体在黑暗中于含有288mg/L Pro、53mg/L硫代脯氨酸、4.35g/L K2SO4和100μm乙酰丁香酮的SH诱导培养基上共培育3日。所述外植体在浓度减半的Murashige-Skoog培养基(Murashige和Skoog,1962)中洗涤并铺种在不含乙酰丁香酮而含有合适选择剂和抑止农杆菌生长的合适抗生素的相同SH诱导培养基上。几周后,将体细胞胚转移至不含生长调节剂、不含抗生素和含有50g/L蔗糖的BOi2Y发育培养基中。体细胞胚随后在浓度减半的Murashige-Skoog培养基上萌发。生根的籽苗移植至花钵内并且在温室中培育。从针对所述选择剂显示耐受性并且含有单拷贝T-DNA插入物的植物产生T1种子。
棉花转化
使用根癌农杆菌,根据US 5,159,135中所述的方法转化棉花。棉花种子在3%次氯酸钠溶液中持续20分钟进行表面消毒并且在含有500μg/ml头孢噻肟的蒸馏水中洗涤。随后将种子转移至含有50μg/ml苯菌灵的SH-培养基以萌发。将4-6日龄籽苗的下胚轴取出、切成0.5cm的小段并置于0.8%琼脂上。农杆菌悬液(约108个细胞/ml,从用目的基因和合适选择标记转化的过夜培养物稀释)用于接种所述下胚轴外植体。在室温和光照下3日后,将组织转移至含有Murashige和Skoog盐的固体培养基(1.6g/l脱乙酰吉兰糖胶),其中所述的Murashige和Skoog盐含有B5维生素(Gamborg等,Exp.Cell Res.50:151-158(1968))、0.1mg/l 2,4-D、0.1mg/l 6-糠氨基嘌呤和750μg/ml MgCL2并含有50-100μg/ml头孢噻肟和400-500μg/ml羧苄青霉素以杀死残余细菌。各个细胞系在2-3个月后分离(每隔4-6周传代培养)并且在用于组织扩增的选择性培养基上进一步培育(30℃,16小时光周期)。转化的组织随后在非选择性培养基上进一步培育2-3月以产生体细胞胚。将长度至少4mm的外观健康胚转移至细蛭石中的含有SH培养基的管内,其中所述的SH培养基补充有0.1mg/l吲哚乙酸、6-糠氨基嘌呤和赤霉酸。所述胚在30℃以16小时光周期培育,并且将2-3叶期的小植株转移至具有蛭石和营养物的花钵内。使植物硬化并随后移至温室以进一步培育。
实施例9:表型评价方法
9.1评价建立
产生大约35个独立的T0稻转化体。原代转化体从组织培养箱转移至温室以生长并收获T1种子。留下下述6个事件,其中所述事件的T1后代对所述转基因的存在/不存在以3∶1比例分离。对于这些事件中的每一个,通过监测目视标记表达而选出大约10株含有该转基因的T1籽苗(杂合子和纯合子)和大约10株缺少该转基因的T1籽苗(失效合子)。转基因植物和对应的失效合子于随机位置并排培育。稻植物在盆栽土壤中正常条件下培育,除了营养液之外。花钵从移植至成熟一直用氮(N)含量降低、通常降低7-8倍的特定营养液浇灌。其余培育过程(植物成熟、种子收获)与不在非生物胁迫下培育的植物相同。温室条件是短日照(12小时光照),在光照下28℃和在黑暗中22℃以及相对湿度70%。随后测量种子相关参数。
4个T1事件在T2世代中按照如对T1世代相同的评价方法进一步评估,不过每个事件采用更多个体。从播种期直至成熟期,将所述植物数次通过数字成像室。在每一时间点上,从至少6个不同角度拍摄每株植物的数字图像(2048x1536像素,1600万颜色)。
盐胁迫筛选
植物在由椰子纤维和Argex(比率3∶1)组成的基质上培育。在移植小植物至温室后头2周期间使用正常的营养液。在头两周之后,向所述营养液添加25mM盐(NaCl),直至收获植物。随后测量种子相关参数。
9.2统计分析:F-检验
使用两因素ANOVA(变量分析)作为整体评价植物表型特征的统计模型。对于用本发明基因转化的全部事件的全部植物的全部所测量参数实施F检验。实施F检验以检查该基因对全部转化事件的影响并验证该基因的整体作用(又称作基因总体作用)。真实基因总体作用显著性的阈值对于F检验设置在5%概率水平上。显著性F检验值指出基因作用,意指不仅仅是基因的存在或位置才造成表型上的差异。
9.3测量的参数
生物量相关的参数测量
植物从播种期至成熟期数次通过数字成像室。在每个时间点上,从至少6个不同角度拍摄每株植物的数字图像(2048x1536像素,1600万颜色)。
植物地上部分面积(或叶生物量,areamax)通过计数来自植物地上部分的数字图像上区别于背景的像素总数而确定。该值对相同时间点上从不同角度拍摄的画面进行平均化并且转化成通过校正以平方mm表述的物理表面值(physical surface value)。实验证实以这种方式测量的地上部分植物面积与地上植物部分的生物量相关。地上部分面积是植物已经实现其最大叶生物量的时间点上所测量的面积。早期生长势是萌发后3周的植物(籽苗)地上部分的面积。根生物量的增加表述为根总生物量的增加(测量为植物寿命期间观察到的根最大生物量);或表述为根/冠比增加(测量为根和苗的活跃生长期间根质量与苗质量之间的比例)。
种子相关参数测量
将成熟的原发花序收获、计数、装袋、加条形码标记并且随后在干燥箱内于37°干燥3日。随后将所述花序脱粒,并且收集和计数全部种子。充实粒使用吹气装置与空粒分开。弃去空粒并且再次计数剩余部分。充实粒在分析天平上称重。充实种子数通过计数所述分离步骤后充实粒数目加以确定。种子总产量通过称量从一株植物收获的全部充实粒而测量。每株植物的种子总数通过计数从一株植物收获的壳数目测量。从计数的充实种子数及其总重量外推出千粒核重(TKW)。收获指数(HI)在本发明中定义为种子总产量与地上部分面积(mm2)之间的比率,乘以系数106。如本发明中定义的每花序的总花数是种子总数与成熟原发花序数目之间的比率。如本发明中定义的种子充实率是充实种子数对种子(或小花)总数的比例(表述为%)。
实施例10:转基因植物的表型评价的结果
如表F中所示,与对应的失效合子(对照)相比较,观察到转基因植物的生物量和种子产量增加,在每种情况下,p-值低于0.05。
参数 | 提高(%) |
Areamax(生物量) | 17.0 |
种子总重 | 35.9 |
充实种子数 | 34.7 |
种子充实率 | 11.6 |
收获指数 | 17.1 |
实施例11:鉴定与SEQ ID NO:40和SEQ ID NO:41相关的序列使用数据库搜索工具如基本局部比对工具(BLAST)(Altschul等(1990)J.Mol.Biol.215:403-410;和Altschul等(1997)Nucleic Acids Res.25:3389-3402),从国家生物技术信息中心(NCBI)的Entrez核苷酸数据库中维护的那些序列当中鉴定到与SEQ ID NO:40相关的(全长cDNA、EST或基因组)序列和/或与SEQ ID NO:41相关的蛋白质序列。使用该程序通过核酸序列或多肽序列与序列数据库比较并且通过计算匹配的统计显著性来找到序列之间的局部相似性区域。由SEQ ID NO:40编码的多肽用于TBLASTN算法,采用默认设置和过滤程序以忽略低复杂性序列启动。这种分析的结果通过配对比较进行观察,并根据概率评分(E-值)进行评级,其中所述的评分反映特定比对结果因偶然发生的概率(E-值越低,命中的显著性越高)。除了E-值外,比较过程也可以由同一性百分数评分。同一性百分数指两个比较的核酸(或多肽)序列之间在特定长度范围内相同核苷酸(或氨基酸)的数目。在一些情况下,可以调整默认参数以修改所述搜索的严格性。
除了在NCBI可获得的公开可用的核酸序列之外,也按照如上文所述的相同方法检索专利序列数据库。
表G提供与如SEQ ID NO:40所代表的核酸序列和SEQ ID NO:41所代表的蛋白质序列相关的核酸序列和蛋白质序列名单。
Lsm蛋白分成8个组或类别。表G中题头为“Lsm类”的列显示Lsm蛋白或编码该蛋白质的相应核酸所属的类别。
SEQ ID No.41的同源序列、直向同源序列和旁系同源序列在题头为“与SEQ ID No.41的进化关系”的列中显示。
表G:与在本发明方法中使用的核酸序列(SEQ ID NO:40)相关的核酸序列和相应的推导多肽。
名称 | 登录号* | 来源生物 | 核酸SEQIDNO: | 多肽SEQID NO: | Lsm类别 | 与SEQ ID No.41的进化关系 | 状态 |
AtLSM1a | AT1G19120 | 拟南芥 | 1 | 2 | Lsm1 | NA | 全长 |
AtLSM1b | AT3G14080 | 拟南芥 | 3 | 4 | Lsm1 | 旁系同源物 | 全长 |
AtLMS2 | At1g03330 | 拟南芥 | 5 | 6 | Lsm2 | 同源物 | 全长 |
AtLSM3a | AT1G21190 | 拟南芥 | 7 | 8 | Lsm3 | 同源物 | 全长 |
AtLSM3b | At1g76860 | 拟南芥 | 9 | 10 | Lsm3 | 同源物 | 全长 |
AtLMS4 | AT5G27720 | 拟南芥 | 1l | 12 | Lsm4 | 同源物 | 全长 |
AtLMS5 | AT5G48870 | 拟南芥 | 13 | 14 | Lsm5 | 同源物 | 全长 |
AtLMS6a | AT3G59810 | 拟南芥 | 15 | 16 | Lsm6 | 同源物 | 全长 |
AtLMS6b | AT2G43810 | 拟南芥 | 17 | 18 | Lsm6 | 同源物 | 全长 |
AtLMS7 | AT2G03870 | 拟南芥 | 19 | 20 | Lsm7 | 同源物 | 全长 |
AtLMS8 | ATlG65700 | 拟南芥 | 21 | 22 | Lsm8 | 同源物 | 全长 |
MsABE78228 | ABE78228 | 蒺藜苜蓿(Medicagotruncatula) | 23 | 24 | Lsm1 | 直向同源物 | 全长 |
PpLSM1 | scaffold_158 | 毛果杨(Populustrichocarpa) | 25 | 26 | Lsm1 | 直向同源物 | 全长 |
OsLSM1 | Os04g0445800 | 稻(粳型栽培品种组) | 27 | 28 | Lsm1 | 直向同源物 | 全长 |
OsLSM3 | Os01g0866700 | 稻(粳型栽培品种组) | 29 | 30 | Lsm3 | 同源物 | 全长 |
OsLMS4 | Os01g0256900 | 稻(粳型栽培品种组) | 31 | 32 | Lsm4 | 同源物 | 全长 |
OsLSM5 | Os05g0389300 | 稻(粳型栽培品种组) | 33 | 34 | Lsm5 | 同源物 | 全长 |
OsLSM6 | Os04g0388900 | 稻(粳型栽培品种组) | 35 | 36 | Lsm6 | 同源物 | 全长 |
OsLSM7 | Os08g0177700 | 稻(粳型栽培品种组) | 37 | 38 | Lsm7 | 同源物 | 全长 |
OsLSM8 | Os05g0594900 | 稻(粳型栽培品种组) | 39 | 40 | Lsm8 | 同源物 | 全长 |
Os_LSM | CAH67241 | 稻(籼型栽培品种组(indica | 41 | 42 | Lsm1 | 直向同源物 | 全长 |
cultivar-group)) | |||||||
LuLSM8LU04FL@62341874 | NA | 亚麻 | 43 | 44 | Lsm8 | 同源物 | 全长 |
BnLSM1aBNM01@BN04MC02973 | NA | 欧洲油菜 | 45 | 46 | Lsm1 | 直向同源物 | 全长 |
BnLSM1bBN0204@contig12290 | NA | 欧洲油菜 | 47 | 48 | Lsm1 | 直向同源物 | 全长 |
BnLSM1cBN0204@contig30411 | NA | 欧洲油菜 | 49 | 50 | Lsm1 | 直向同源物 | 全长 |
BnLSM4aBN04FL@41982578 | NA | 欧洲油菜 | 51 | 52 | Lsm4 | 同源物 | 全长 |
BnLSM4bBN04FL@42120216 | NA | 欧洲油菜 | 53 | 54 | 同源物 | 全长 | |
BnLSM4cBN04FL@42952553 | NA | 欧洲油莱 | 55 | 56 | Lsm4 | 同源物 | 全长 |
GmLSM4aGM04FL@GM06LC725 | NA | 大豆 | 57 | 58 | Lsm4 | 同源物 | 全长 |
GmLSM4bGM04FL@GM06LC5469 | NA | 大豆 | 59 | 60 | Lsm4 | 同源物 | 全长 |
GmLSM4c | NA | 大豆 | 61 | 62 | Lsm4 | 同源物 | 全长 |
GM04FL@GM06MC03669 | |||||||
Gm_LSM5GM04FL@GM02LC15807 | NA | 大豆 | 63 | 64 | Lsm5 | 同源物 | 全长 |
HvLSM1HV04FL@63122459 | NA | 大麦 | 65 | 66 | Lsm1 | 直向同源物 | 全长 |
HvLSM4HV04FL@62658793 | NA | 大麦 | 67 | 68 | Lsm4 | 同源物 | 全长 |
TaLSM1TA0704@contig16414 | NA | 普通小麦 | 69 | 70 | Lsm1 | 直向同源物 | 全长 |
TaLSM4aTA04FL@TA02LC45139 | NA | 普通小麦 | 71 | 72 | Lsm4 | 同源物 | 全长 |
TaLSM4bTA04FL@TA02LC24263 | NA | 普通小麦 | 73 | 74 | Lsm4 | 同源物 | 全长 |
ZmLSM1ZM0404@contig12257 | NA | 玉米 | 75 | 76 | Lsm1 | 直向同源物 | 全长 |
ZmLSM4aZM04FL@ZM06LC6366 | NA | 玉米 | 77 | 78 | Lsm4 | 同源物 | 全长 |
*登录号指基因库数据库,杨树(populus)序列数据库在DOE联合基因组研究所。NA:没有进行。
实施例12:相关多肽序列的比对结果和系统发生树
来自Vector NTI(Invitrogen)的Alignment X用于Lsm蛋白序列的比对,其中所述Alignment X基于受欢迎的累进比对Clustal算法(Thompson等(1997)Nucleic Acids Res 25:4876-4882;Chenna等(2003),Nucleic AcidsRes 31:3497-3500)。使用邻接聚类算法建立系统发生树。对于空位开口罚分使用默认值10,对空位延伸罚分使用默认值0.1并且所选的权重矩阵是Blosum 62。
在图10A中显示使用默认参数,以来自Vector NTI(Invitrogen)的Alignment X所开展的多重序列比对结果。使用设置为默认参数的来自Vector NTI(Invitrogen)的Alignment X开展Lsm蛋白的多重序列比对并建立相应的系统发生树(图10B)。Lsm多肽落入包括下述组中至少一种Lsm蛋白的聚类中,其中所述组由来自拟南芥的代表性Lsm蛋白定义,如SEQID Nos 41、43、45、47、49、51、53、55、57、59和61所代表的拟南芥Lsm蛋白,而不是偏离前述代表性序列聚类。Lsm1蛋白簇集于AtLsm1和AtLsm2周围。
处于不同分类组中的Lsm蛋白簇集在明显不同的进化支中。显示了Lsm类别1-8的进化支。
多重比对显示在Lsm多肽当中的最高序列同源性位于该蛋白质的氨基端。在共有序列中显示了保守残基。显示了保守基序I和基序II的位置。还显示了Lsm蛋白家族的特征性基序:α-螺旋、Lsm-I基序和Lsm-II基序。
实施例13:计算在实施本发明方法中有用的多肽序列之间的总体同一性百分数
使用现有技术领域可获得的方法之一,即MatGAT(矩阵总体比对工具)软件(BMC Bioinformatics.20034:29.MatGAT:使用蛋白质序列或DNA序列产生相似性/同一性矩阵的一项应用,Campanella JJ,Bitincka L.Smalley J;软件由Ledion Bitincka维护)确定在实施本发明方法中有用的全长多肽序列之间的总体相似性和同一性百分数。MatGAT软件对DNA序列或蛋白质序列产生相似性/同一性矩阵,无需数据的预先比对。该程序使用Myers和Miller总体比对算法(空位开口罚分12和空位延伸罚分2)进行一系列配对比对,使用例如Blosum 62(对于多肽而言)计算相似性和同一性并且随后将结果置于距离矩阵内。在分割线下半部分显示序列相似性,和在对角分割线的上半部分显示序列同一性。
比较过程中使用的参数是:
评分矩阵:Blosum62
第一空位:12
延伸空位:2
表B中显示在多肽序列的全长范围(不包括部分多肽序列)内的总体相似性和同一性的该软件分析的结果。同一性百分数在对角线以上给出而相似性百分数在对角线以下给出。
与SEQ ID NO:41相比较,全长拟南芥Lsm蛋白之间的同一性百分数从约17%氨基酸同一性开始。同SEQ ID NO:41最接近的旁系同源序列与SEQ ID NO:41是79.7%同一的(表H1)。
与SEQ ID NO:41相比较,拟南芥Lsm蛋白Lsm结构域之间的同一性百分数从约19%氨基酸同一性开始。SEQ ID NO:41的Lsm结构域与其最接近的旁系同源物AtLsm1b的Lsm结构域之间的同一性是84.3%(表H2)。
表H3中所示直向同源Lsm蛋白的序列之间的同一性百分数从约55%开始。表H3中同SEQ ID NO:41最接近的直向同源蛋白与SEQ ID NO:41是84.3%同一的。
表H1:在拟南芥Lsm多肽序列范围内的总体相似性和同一性的MatGAT结果。
表H2:在拟南芥Lsm多肽序列中存在的Lsm结构域范围内的总体相似性和同一性的MatGAT结果
表H3:属于Lsm 1类的Lsm蛋白之间的总体相似性和同一性的MatGAT结果
1 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | 11 | 12 | |
1.AtLSM1a | 79.7 | 84.4 | 76 | 72.1 | 70.3 | 77.3 | 77.3 | 76.6 | 76.6 | 76.6 | |
3.MsABE78228Lsm1 | 88.3 | 85.9 | 84.5 | 80.1 | 57 | 77.3 | 77.3 | 85.2 | 85.2 | 84.4 | |
4.PpLSM1 | 90.6 | 93.8 | 80.6 | 76.5 | 60.9 | 85.9 | 85.9 | 81.3 | 81.3 | 79.7 | |
5.OsLSM1 | 86.8 | 92.2 | 91.5 | 94.9 | 55 | 75.2 | 75.2 | 95.3 | 95.3 | 92.2 | |
6.OsLSM | 82.4 | 87.5 | 86.8 | 94.9 | 52.2 | 71.3 | 71.3 | 90.4 | 90.4 | 87.5 | |
7.BnLSM1a | 71.9 | 64.1 | 66.4 | 62.8 | 59.6 | 56.3 | 56.3 | 55.5 | 55.5 | 53.9 | |
8.BnLSM1b | 88.3 | 91.4 | 93.8 | 90.7 | 86 | 63.3 | 100 | 75.8 | 75.8 | 75 | |
9.BnLSM1c | 88.3 | 91.4 | 93.8 | 90.7 | 86 | 63.3 | 100 | 75.8 | 75.8 | 75 | |
10.HvLSM1 | 85.9 | 93 | 90.6 | 97.7 | 92.6 | 62.5 | 89.8 | 89.8 | 100 | 92.2 | |
11.TaLSM1 | 85.9 | 93 | 90.6 | 97.7 | 92.6 | 62.5 | 89.8 | 89.8 | 100 | 92.2 | |
12.ZmLSM1 | 85.9 | 92.2 | 88.3 | 94.6 | 89.7 | 60.9 | 89.1 | 89.1 | 95.3 | 95.3 |
实施例14:鉴定在实施本发明方法中有用的多肽序列中所包含的结构域
蛋白质家族、结构域和位点的集成资源(InterPro)数据库是针对基于文本及基于序列的搜索法的常用特征标识数据库的集成界面。InterPro数据库合并了这些数据库,所述数据库使用不同方法学及不同程度的有关充分表征的蛋白质的生物学信息以获得蛋白质特征标识。合作数据库包括SWISS-PROT、PROSITE、TrEMBL、PRINTS、ProDom和Pfam,Smart和TIGRFAMs。Interpro由英国欧洲生物信息学研究所维护。
如SEQ ID NO:2所代表的多肽序列的InterPro扫描结果呈现于表I1。
表I1:如SEQ ID NO:2所代表多肽序列的InterPro扫描结果
数据库 | 登录号 | 登录名称 |
Interpro | IPR006649 | LSM_core |
Interpro | IPR010920 | LSM_related_core. |
Interpro | IPR001163 | LSM_snRNP_core. |
Pfam | PF01423 | LSM |
ProDom | PD020287 | snRNP |
SMART | SM00651 | Sm.1 |
表I2:与存在于表G内所列Lsm蛋白中的Lsm结构域的序列相对应的SEQ ID No.
名称 | SEQ IDNo. | 参考Lsm蛋白的名称 | 参考Lsm蛋白的SEQ ID NO. |
AtLSM1a_结构域 | 120 | AtLSM1a | 41 |
AtLSM1b_结构域 | 121 | AtLSM1b | 43 |
AtLMS2_结构域 | 122 | AtLMS2 | 45 |
AtLSM3a_结构域 | 123 | AtLSM3a | 47 |
AtLSM3b_结构域 | 124 | AtLSM3b | 49 |
AtLMS4_结构域 | 125 | AtLMS4 | 51 |
AtLMS5_结构域 | 126 | AtLMS5 | 53 |
AtLMS6a_结构域 | 127 | AtLMS6a | 55 |
AtLMS6b_结构域 | 128 | AtLMS6b | 57 |
AtLMS7_结构域 | 129 | AtLMS7 | 59 |
AtLMS8_结构域 | 130 | AtLMS8 | 61 |
MsABE78228_结构域 | 131 | MsABE78228 | 63 |
PpLSM1_结构域 | 132 | PpLSM1 | 65 |
OsLSM1_结构域 | 133 | OsLSM1 | 67 |
OsLSM3_结构域 | 134 | OsLSM3 | 69 |
OsLMS4_结构域 | 135 | OsLMS4 | 71 |
OsLSM5_结构域 | 136 | OsLSM5 | 73 |
OsLSM6_结构域 | 137 | OsLSM6 | 75 |
OsLSM7_结构域 | 138 | OsLSM7 | 77 |
OsLSM8_结构域 | 139 | OsLSM8 | 79 |
Os_LSM_结构域 | 140 | Os_LSM | 81 |
LuLSM8_结构域 | 141 | LuLSM8 | 83 |
BnLSM1a_结构域 | 142 | BnLSM1a | 85 |
BnLSM1b_结构域 | 143 | BnLSM1b | 87 |
BnLSM1c_结构域 | 144 | BnLSM1c | 89 |
BnLSM4a_结构域 | 145 | BnLSM4a | 91 |
BnLSM4b_结构域 | 146 | BnLSM4b | 93 |
BnLSM4c_结构域 | 147 | BnLSM4c | 95 |
GmLSM4a_结构域 | 148 | GmLSM4a | 97 |
GmLSM4b_结构域 | 149 | GmLSM4b | 99 |
GmLSM4c_结构域 | 150 | GmLSM4c | 101 |
Gm_LSM5_结构域 | 151 | Gm_LSM5 | 103 |
HvLSM1_结构域 | 152 | HvLSM1 | 105 |
HvLSM4_结构域 | 153 | HvLSM4 | 107 |
TaLSM1_结构域 | 154 | TaLSM1 | 109 |
TaLSM4a_结构域 | 155 | TaLSM4a | 111 |
TaLSM4b_结构域 | 156 | TaLSM4b | 113 |
ZmLSM1_结构域 | 157 | ZmLSM1 | 115 |
ZmLSM4a_结构域 | 158 | ZmLSM4a | 116 |
实施例15:克隆如SEQ ID NO:40所代表的核酸序列
除非另外说明,重组DNA技术根据(Sambrook(2001)MolecularCloning:a laboratory manual,第3版Cold Spring Harbor LaboratoryPress,CSH,New York)或Ausubel等(1994),Current Protocols inMolecular Biology,Current Protocols第1卷和第2卷中描述的标准方案进行。用于植物分子研究工作的标准材料和方法在BIOS科学出版有限责任公司(BIOS Scientific Publications Ltd(英国))和Blackwell科学出版社(Blackwell Scientific Publications(英国))出版的R.D.D.Croy的PlantMolecular Biology Labfax(1993)中描述。
使用拟南芥籽苗cDNA文库(Invitrogen,Paisley,UK)作为模板通过PCR扩增拟南芥Lsm基因。包含用于Gateway重组的AttB位点的有义引物5’-ggggacaagtttgt acaaaaaagcaggcttaaacaatgtcttgggctgctcct-3’(SEQ IDNO:162)和反义引物5’-ggggaccactttgtacaagaaagctgggttttctacaatgctgcaacaca-3’(SEQ ID NO:163)用于PCR扩增。使用Hifi Taq DNA聚合酶在标准条件下进行PCR。随后进行Gateway方法的第一步骤,即BP反应,在该步骤期间PCR片段与pDONR201质粒发生体内重组,以产生根据Gateway命名的“进入克隆”pLsm。质粒pDONR201作为技术的部分从Invitrogen购买。
实施例16:使用如SEQ ID NO:40所代表的核酸序列构建表达载体
进入克隆pLsm随后与pWSI18(一种用于稻转化的终端载体)在LR反应中一起使用。这种载体在T-DNA边界内含有植物选择标记;可筛选的标记表达盒和旨在使LR与已克隆入所述进入克隆的目的核酸序列体内重组的Gateway盒作为功能性元件。用于组成型表达的稻WSI18启动子(SEQ ID NO:157)位于这种Gateway盒上游。
在LR重组步骤后,所得表达载体pWSI18::Lsm(图11)根据本领域熟知的方法转化至农杆菌菌株LBA4044。
实施例17:植物转化
稻转化
使用含有所述表达载体的农杆菌来转化稻植物。将稻粳型栽培品种Nipponbare的成熟干燥种子脱壳。通过如下方式实施消毒:在70%乙醇中孵育1分钟,随后在0.2%HgCl2中孵育30分钟,随后用无菌蒸馏水洗涤6次15分钟。无菌的种子随后在含有2,4-D的培养基(愈伤组织诱导培养基)上萌发。在黑暗中孵育4周后,将小盾片衍生的胚发生的愈伤组织切下并在相同的培养基上增殖。2周后,将愈伤组织通过在同一种培养基上传代培养另外2周进行繁殖或增殖。胚发生的愈伤组织片在新鲜培养基上传代培养3日,随后共培育(以助长细胞分裂活性)。
将含有所述表达载体的农杆菌菌株LBA4404用于共培育。农杆菌接种在含有适宜抗生素的AB培养基上并在28℃培养3日。随后收集细菌并在液体共培育培养基中悬浮至密度(OD600)约1。该悬液随后转移至培养皿内并将所述愈伤组织浸没于此悬液内15分钟。该愈伤组织随后在滤纸上蘸干并转移至固化的共培育培养基,并在25℃于黑暗中孵育3日。共培育的愈伤组织在含2,4-D的培养基上在28℃于黑暗中在选择剂存在下培育4周。在此期间,迅速生长的抗性愈伤组织团发育。将这种材料转移至再生培养基并在光照下孵育后,胚发生潜能得到释放并且苗在随后4至5周内发育。将苗从愈伤组织上切下并且在含有植物生长素的培养基上孵育2至3周,将苗从所述培养基转移至土壤。在温室中于高湿度和短日照下生长硬化的苗。
对于一个构建体,产生大约35个独立的T0稻转化体。将原代转化体从组织培养箱转移至温室。在定量PCR分析验证T-DNA插入物的拷贝数后,仅保留针对所述选择剂显示抗性的单拷贝转基因植物用于收获T1种子。种子随后在移栽后3至5个月收获。该方法以超过50%的比例产生单基因座转化体(Aldemita和Hodges1996,Chan等1993,Hiei等1994)
谷物转化
玉米(Zea mays)的转化用Ishida等(1996.Nature Biotech 14(6):745-50)所述方法的改良方法进行。在谷物中,转化是基因型依赖的并且仅特定基因型对于转化和再生是服从的。杂交系A188(明尼苏达大学)或以A188作为亲本的杂交体是用于转化的供体材料的良好来源,不过其他基因型也可以成功地使用。谷穗在授粉后大约11日(DAP)从谷物植物收获,此时不成熟胚的长度是大约1-1.2mm。不成熟的胚与含有所述表达载体的根癌农杆菌共培育,并且转基因植物通过器官发生过程回收。切下的胚在愈伤组织诱导培养基上、随后在玉米再生培养基上生长,其中所述的培养基含有选择剂(例如咪唑啉酮,不过可以使用不同的选择标记)。培养板在25℃于光照下孵育2-3周,或直至苗发育。将源自每个胚的绿色苗转移至玉米生根培养基并在25℃孵育2-3周,直至根发育。将生根的苗移植至温室中的土壤内。从针对所述选择剂显示耐受性并且含有单拷贝T-DNA插入物的植物产生T1种子。
小麦转化
小麦的转化用Ishida等(1996)Nature Biotech 14(6):745-50描述的方法进行。栽培品种Bobwhite(可从墨西哥CIMMYT获得)通常在转化中使用。不成熟的胚与含有所述表达载体的根癌农杆菌共培育,并且转基因植物通过器官发生过程回收。与农杆菌孵育后,所述胚在愈伤组织诱导培养基上、随后在再生培养基上体外培育,其中所述的培养基含有选择剂(例如咪唑啉酮,不过可以使用多种选择标记)。培养板在25℃于光照下孵育2-3周,或直至苗发育。将源自每个胚的绿色苗转移至生根培养基并在25℃孵育2-3周,直至根发育。将生根的苗移植至温室中的土壤内。从针对所述选择剂显示耐受性并且含有单拷贝T-DNA插入物的植物产生T1种子。
大豆转化
大豆根据对Texas A&M美国专利5,164,310中所述方法的改良方法转化。几个商业大豆品种对于通过这种方法的转化是可操作的。栽培品种Jack(从Illinois种子基金会可获得)通常用于转化。对大豆种子消毒以便体外播种。下胚轴、胚根和一片子叶从7日龄年幼籽苗中切下。进一步培育上胚轴和剩余子叶以使辅助节发育。将这些辅助节切下并与含有所述表达载体的根癌农杆菌孵育。在共培育处理之后,洗涤外植体并转移至选择培养基。切下再生的苗并置于苗伸长培养基上。将长度不超过1cm的苗置于生根培养基上直至根发育。生根的苗移植至温室中的土壤内。从针对所述选择剂显示耐受性并且含有单拷贝T-DNA插入物的植物产生T1种子。
油菜籽/卡诺拉油菜转化
使用5-6日龄年幼籽苗的子叶柄和下胚轴作为用于组织培养的外植体并且根据Babic等(1998,Plant Cell Rep 17:183-188)进行转化。商业栽培品种Westar(Agriculture Canada)是用于转化的标准品种,不过其他品种也可以使用。对卡诺拉油菜种子进行表面消毒以体外播种。从所述体外籽苗切下附带子叶的子叶叶柄外植体,并且通过将此叶柄外植体的切口末端浸入细菌悬液以(含有所述表达载体的)农杆菌接种。该外植体随后在23℃,16小时光照下于含有3mg/l BAP、3%蔗糖、0.7%植物琼脂的MSBAP-3培养基上培养2日。与农杆菌共培育2日后,将所述叶柄外植体转移至含有3mg/l BAP、头孢噻肟、羧苄青霉素或特美汀(300mg/1)的MSBAP-3培养基上培养7日,并且随后在含有头孢噻肟、羧苄青霉素或特美汀和选择剂的MSBAP-3培养基上培养,直至苗再生。当苗长度是5-10mm时,切下这些苗并转移至苗伸长培养基(MSBAP-0.5,含有0.5mg/l BAP)。将长度大约2cm的苗转移至生根培养基(MS0)用于根诱导。生根的苗移植至温室中的土壤内。从针对所述选择剂显示耐受性并且含有单拷贝T-DNA插入物的植物产生T1种子。
苜蓿转化
使用(McKersie等,1999 Plant Physiol 119:839-847)的方法转化苜蓿的再生性克隆。苜蓿的再生和转化是基因型依赖性的并且因而需要再生性植物。已经描述了获得再生性植物的方法。例如,这些再生性植物可以选自栽培品种Rangelander(Agriculture Canada)或如Brown DCW和AAtanassov(1985.Plant Cell Tissue Culture 4:111-112)所述的任何其他商业苜蓿品种。备选地,已经选择RA3品种(威斯康星大学)用于组织培养(Walker等,1978 Am J Bot 65:654-659)。叶柄外植体与含有所述表达载体的根癌农杆菌C58C1 pMP90(McKersie等,1999 Plant Physiol119:839-847)或LBA4404的过夜培养物共培育。所述外植体在黑暗中于含有288mg/L Pro、53mg/L硫代脯氨酸、4.35g/L K2SO4和100μm乙酰丁香酮的SH诱导培养基上共培育3日。所述外植体在浓度减半的Murashige-Skoog培养基(Murashige和Skoog,1962)中洗涤并铺种在不含乙酰丁香酮而含有合适选择剂和抑止农杆菌生长的合适抗生素的相同SH诱导培养基上。几周后,将体细胞胚转移至不含生长调节剂、不含抗生素和含有50g/L蔗糖的BOi2Y发育培养基中。体细胞胚随后在浓度减半的Murashige-Skoog培养基上萌发。生根的籽苗移植至花钵内并且在温室中培育。从针对所述选择剂显示耐受性并且含有单拷贝T-DNA插入物的植物产生T1种子。
棉花转化
使用根癌农杆菌,根据US 5,159,135中所述的方法转化棉花。棉花种子在3%次氯酸钠溶液中持续20分钟进行表面消毒并且在含有500μg/ml头孢噻肟的蒸馏水中洗涤。随后将种子转移至含有50μg/ml苯菌灵的SH-培养基以萌发。将4-6日龄籽苗的下胚轴取出、切成0.5cm的小段并置于0.8%琼脂上。农杆菌悬液(约108个细胞/ml,从用目的基因和合适选择标记转化的过夜培养物稀释)用于接种所述下胚轴外植体。在室温和光照下3日后,将组织转移至含有Murashige和Skoog盐的固体培养基(1.6g/l脱乙酰吉兰糖胶),其中所述的Murashige和Skoog盐含有B5维生素(Gamborg等,Exp.Cell Res.50:151-158(1968))、0.1mg/l 2,4-D、0.1mg/l 6-糠氨基嘌呤和750μg/ml MgCL2并含有50-100μg/ml头孢噻肟和400-500μg/ml羧苄青霉素以杀死残余细菌。各个细胞系在2-3个月后分离(每隔4-6周传代培养)并且在用于组织扩增的选择性培养基上进一步培育(30℃,16小时光周期)。转化的组织随后在非选择性培养基上进一步培育2-3月以产生体细胞胚。将长度至少4mm的外观健康胚转移至细蛭石中的含有SH培养基的管内,其中所述的SH培养基补充有0.1mg/I吲哚乙酸、6-糠氨基嘌呤和赤霉酸。所述胚在30℃以16小时光周期培育,并且将2-3叶期的小植株转移至具有蛭石和营养物的花钵内。使植物硬化并随后移至温室以进一步培育。
实施例18:表型评价方法
18.1评价建立
产生大约35个独立的T0稻转化体。原代转化体从组织培养箱转移至温室以生长并收获T1种子。留下下述5个事件,其中所述事件的T1后代对所述转基因的存在/不存在以3∶1比例分离。对于这些事件中的每一个,通过监测目视标记表达而选出大约10株含有该转基因的T1籽苗(杂合子和纯合子)和大约10株缺少该转基因的T1籽苗(失效合子)。转基因植物和对应的失效合子于随机位置并排培育。温室条件是短日照(12小时光照),在光照下28℃和在黑暗中22℃以及相对湿度70%。在不同灌溉方案中评估植物。在方案1中,灌溉以日为基础进行,提供足够的水以满足植物实现最佳生长的需要而不造成任何水缺乏症状以够方案序列。在方案2中,在抽穗时期短暂地减少灌溉,直至在对照植物中看到表现为叶卷曲的可眼观的水缺乏症状。在后一个条件下,土壤中的水含量下降至20%以下。在观在T2世代中按照如对T1世代相同的评价方法进一步评估4个T1事件,不过每个事件采用更多个体。从播种期直至成熟期,将所述植物数次通过数字成像室。在每一时间点上,从至少6个不同角度拍摄每株植物的数字图像(2048x1536像素,1600万颜色)。
氮使用效率筛选
来自T2种子的稻植物在盆栽土壤中在正常条件下生长,除了营养液不是正常条件之外。花钵从移植至成熟一直用氮(N)含量降低、通常降低7-8倍的特定营养液浇灌。其余培育过程(植物成熟、种子收获)与不在非生物胁迫下培育的植物相同。生长和产量参数如对正常条件下生长所述那样记录。
盐胁迫筛选
植物在由椰子纤维和Argex(比率3∶1)组成的基质上培育。在移植小植物至温室后头2周期间使用正常的营养液。在头两周之后,向所述营养液添加25mM盐(NaCl),直至收获植物。随后测量种子相关参数。
18.2统计分析:F-检验
使用两因素ANOVA(变量分析)作为整体评价植物表型特征的统计模型。对于用本发明基因转化的全部事件的全部植物的全部所测量参数实施F检验。实施F检验以检查该基因对全部转化事件的影响并验证该基因的整体作用(又称作基因总体作用)。真实基因总体作用显著性的阈值对于F检验设置在5%概率水平上。显著性F检验值指出基因作用,意指不仅仅是基因的存在或位置才造成表型上的差异。
18.3测量的参数
生物量相关的参数测量
植物从播种期至成熟期数次通过数字成像室。在每个时间点上,从至少6个不同角度拍摄每株植物的数字图像(2048x1536像素,1600万颜色)。
植物地上部分面积(或叶生物量)通过计数来自植物地上部分的数字图像上区别于背景的像素总数而确定。该值对相同时间点上从不同角度拍摄的画面进行平均化并且转化成通过校正以平方mm表述的物理表面值。实验显示以这种方式测量的植物地上部分面积与植物地上部分的生物量相关。地上部分面积是植物已经实现其最大叶生物量的时间点上所测量的面积。早期生长势是萌发后3周的植物(籽苗)地上部分的面积。
种子相关参数测量
将成熟的原发花序收获、计数、装袋、加条形码标记并且随后在干燥箱内于37°干燥3日。随后将所述花序脱粒,并且收集和计数全部种子。充实粒使用吹气装置与空粒分开。弃去空粒并且再次计数剩余部分。充实粒在分析天平上称重。充实种子数通过计数所述分离步骤后充实粒数目加以确定。种子总产量通过称量从一株植物收获的全部充实粒而测量。每株植物的种子总数通过计数从一株植物收获的壳数目测量。从计数的充实种子数及其总重量外推出千粒核重(TKW)。收获指数(HI)在本发明中定义为种子总产量与地上部分面积(mm2)之间的比率,乘以系数106。如本发明中定义的每花序的总花数是种子总数与成熟原发花序数目之间的比率。如本发明中定义的种子充实率是充实种子数对种子(或小花)总数的比例(表述为%)。
实施例19:转基因植物的表型评价的结果
在表J中显示评价表达在实施本发明方法中有用的核酸序列的转基因稻植物的结果。还显示了所述转基因植物与相应失效合子之间的差异。
与对照植物(在本例中,是失效合子)相比较,种子总产量、充实种子数、种子充实率和收获指数在表达实施本发明方法中有用的核酸序列的转基因植物中显著提高。
表J:评价在表达实施本发明方法中有用的核酸序列的转基因稻植物的结果。
性状 | 在灌溉方案1下的提高% | 在灌溉方案2下的提高% |
种子总产量 | 27 | 27 |
充实种子数 | 25 | 25 |
充实率 | 27 | 14 |
生物量 | 1 | 5 |
收获指数 | 25 | 21 |
在灌溉方案2下生长用编码蛋白质SEQ ID NO:47并在稻GOS2启动子控制下的核酸所转化的稻植物。至少一个事件显示以下一个或多个指标的提高:营养生物量、早期生长势、种子总重量、充实种子数、种子总数。
实施例20:鉴定与SEQ ID NO:165和SEQ ID NO:166相关的序列
使用数据库搜索工具如基本局部比对工具(BLAST)(Altschul等(1990)J.Mol.Biol.215:403-410;和Altschul等(1997)Nucleic Acids Res.25:3389-3402),从国家生物技术信息中心(NCBI)的Entrez核苷酸数据库中维护的那些序列当中鉴定到与SEQ ID NO:165相关的(全长cDNA、EST或基因组)序列和/或与SEQ ID NO:166相关的蛋白质序列。使用该程序通过核酸序列或多肽序列与序列数据库比较并且通过计算匹配的统计显著性来找到序列之间的局部相似性区域。由SEQ ID NO:173编码的多肽用于TBLASTN算法,采用默认设置和过滤程序以忽略低复杂性序列启动。这种分析的结果通过配对比较进行观察,并根据概率评分(E-值)进行评级,其中所述的评分反映特定比对结果因偶然发生的概率(E-值越低,命中的显著性越高)。除了E-值外,比较过程也可以由同一性百分数评分。同一性百分数指两个比较的核酸(或多肽)序列之间在特定长度范围内相同核苷酸(或氨基酸)的数目。在一些情况下,可以调整默认参数以修改所述搜索的严格性。
表K提供与如SEQ ID NO:165所代表的核酸序列和SEQ ID NO:166所代表的蛋白质序列相关的核酸序列和蛋白质序列名单。
表K:编码CycHTr多肽的核酸序列和CycHTr多肽。
名称 | 来源生物 | 核酸SEQ ID NO: | 多肽SEQ ID NO: |
AtCycHTr | 拟南芥 | 1 | 2 |
AtCycH1 | 拟南芥 | 8 | 9 |
CAK相关的细胞周期蛋白H同源物 | 欧美杂种山杨(Populustremula x Populus tremuloides) | 10 | 11 |
cycH-1 | 稻 | 12 | 13 |
CycH | 番茄 | 14 | 15 |
CycH | 玉米 | 16 | 17 |
CycH | 普通小麦 | 18 | 19 |
CycH | 红花耧斗菜(Aquilegiaformosa) | 20 | 21 |
CycH | 马铃薯 | 22 | 23 |
CycH | 甘蔗(Saccharum officinarum) | 24 | 25 |
CycH | Ostreococcus tauri | 26 | 27 |
CycH | 黑腹果蝇(Drosophilamelanogaster) | 28 | 29 |
CycH | 智人(Homo sapiens) | 30 | 31 |
CycH | 三角褐指藻(Phaeodactylumtricorn utum) | 32 | 33 |
实施例21:CycH多肽序列的比对
使用ClustalW(1.83)算法进行多肽序列的比对。备选地,可以使用来自Vector NTI(Invitrogen)的Align X程序进行比对,其中所述Align X也基于受欢迎的累进比对Clustal算法(Thompson等(1997)Nucleic Acids Res25:4876-4882;Chenna等(2003),Nucleic Acids Res 31:3497-3500)。空位开口罚分的默认值是10,空位延伸罚分的默认值是0.1并且所选的权重矩阵是Blosum 62(若比对多肽)。图14中的结果显示CycH多肽共享序列高度保守的区域。
使用标准技术构建CycHTr多肽的系统发生树。图15显示CycH多肽如何簇集在一起。
实施例22:计算在实施本发明方法中有用的多肽序列之间的总体同一性百分数
使用现有技术领域可获得的方法之一,即MatGAT(矩阵总体比对工具)软件(Campanella等,BMC Bioinformatics.20034:29.MatGAT:使用蛋白质序列或DNA序列产生相似性/同一性矩阵的一项应用)确定在实施本发明方法中有用的全长多肽序列之间的总体相似性和同一性百分数。MatGAT软件对DNA序列或蛋白质序列产生相似性/同一性矩阵,无需数据的预先比对。该程序使用Myers和Miller总体比对算法(空位开口罚分12和空位延伸罚分2)进行一系列配对比对,使用例如Blosum 62(对于多肽而言)计算相似性和同一性并且随后将结果置于距离矩阵内。在分割线下半部分显示序列相似性,和在对角分割线的上半部分显示序列同一性。
比较过程中使用的参数是:
评分矩阵:Blosum62
第一空位:12
延伸空位:2
表L中显示在多肽序列的全长范围(不包括部分多肽序列)内的总体相似性和同一性的该软件分析的结果。同一性百分数在对角线之上以粗体给出,且相似性百分数在对角线以下给出(正常体)。
与SEQ ID NO:173相比较,在实施本发明方法中有用的CycH多肽序列之间的同一性百分数可以低至22%氨基酸同一性。
表L:在多肽序列的全长范围内的总体相似性和同一性的MatGAT结果
1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | 11 | 12 | 13 | 14 | |
1.SEQID166 | 61.3 | 44.0 | 39.9 | 40.5 | 38.5 | 38.4 | 41.8 | 44.3 | 42.4 | 20.2 | 19.9 | 23.7 | 14.2 | |
2. | 63.1 | 64.2 | 56.4 | 56.5 | 54.9 | 54.1 | 59.8 | 53.1 | 51.9 | 31.2 | 25.4 | 29.3 | 22.7 |
SEQID173 | ||||||||||||||
3.SEQID175 | 54.2 | 82.1 | 58.6 | 58.2 | 57.3 | 55.6 | 64.0 | 57.7 | 53.0 | 30.5 | 23.4 | 29.0 | 21.9 | |
4.SEQID177 | 51.5 | 75.0 | 78.9 | 57.3 | 83.1 | 81.3 | 64.4 | 54.5 | 78.2 | 31.0 | 25.9 | 30.9 | 22.5 | |
5.SEQID179 | 51.5 | 72.0 | 74.7 | 72.4 | 55.7 | 54.6 | 60.5 | 84.8 | 52.3 | 31.3 | 27.7 | 30.6 | 21.6 | |
6.SEQID181 | 51.4 | 73.2 | 78.3 | 91.2 | 69.6 | 78.7 | 60.7 | 53.8 | 89.1 | 32.0 | 26.9 | 30.1 | 23.9 | |
7.SEQID183 | 50.6 | 74.4 | 76.5 | 90.7 | 71.1 | 87.7 | 61.7 | 52.7 | 72.9 | 30.1 | 24.6 | 30.6 | 22.0 | |
8.SEQID185 | 53.9 | 77.7 | 79.6 | 82.3 | 75.4 | 78.1 | 78.7 | 58.3 | 57.4 | 31.5 | 25.6 | 29.3 | 20.6 | |
9.SEQID187 | 54.8 | 66.7 | 71.1 | 67.3 | 88.7 | 64.7 | 66.9 | 70.4 | 55.8 | 29.6 | 24.2 | 28.7 | 20.4 | |
10.SEQID189 | 54.5 | 68.5 | 72.3 | 86.4 | 66.2 | 90.3 | 81.6 | 73.4 | 68.8 | 29.9 | 26.6 | 28.4 | 22.2 | |
11.SEQID191 | 36.3 | 53.3 | 53.0 | 53.3 | 53.0 | 54.1 | 50.9 | 54.5 | 50.3 | 50.9 | 25.1 | 27.9 | 22.7 | |
12.SEQID193 | 34.6 | 45.5 | 46.1 | 50.3 | 48.2 | 48.9 | 49.7 | 49.1 | 44.1 | 46.6 | 46.6 | 43.2 | 19.3 | |
13.SEQID195 | 38.1 | 50.9 | 52.4 | 54.2 | 51.8 | 51.4 | 53.9 | 51.5 | 48.9 | 50.2 | 48.9 | 63.3 | 22.0 | |
14.SEQID197 | 24.8 | 38.8 | 38.5 | 39.7 | 35.8 | 39.9 | 36.9 | 37.6 | 33.7 | 36.7 | 36.2 | 32.8 | 36.2 |
实施例23:鉴定在实施本发明方法中有用的多肽序列中包含的结构域
蛋白质家族、结构域和位点的集成资源(InterPro)数据库是针对基于文本及基于序列的搜索法的常用特征标识数据库的集成界面。InterPro数据库合并了这些数据库,所述数据库使用不同方法学及不同程度的有关充分表征的蛋白质的生物学信息以获得蛋白质特征标识。合作数据库包括SWISS-PROT、PROSITE、TrEMBL、PRINTS、ProDom和Pfam、Smart和TIGRFAMs。Interpro由英国欧洲生物信息学研究所维护。
如SEQ ID NO:173所代表的多肽序列的InterPro扫描结果呈现于表M。
表M:如SEQ ID NO:173所代表的多肽序列的InterPro扫描结果
数据库 | 登录号 | 登录名称 |
Interpro | IPR006670 | 细胞周期蛋白 |
Interpro | IPR011028 | 细胞周期蛋白样 |
SMART | SM00385 | 细胞周期蛋白 |
PANTHER | PTHR10026 | SF8细胞周期蛋白H |
超家族 | SSF47954 | 细胞周期蛋白样 |
实施例24:在实施本发明方法中有用的多肽序列的拓扑结构预测(亚细胞定位、跨膜...)
TargetP 1.1预测真核生物蛋白的亚细胞定位。定位指派基于预测任何氨基端前序列的存在:叶绿体转运肽(cTP)、线粒体定位肽(mTP)或分泌途径信号肽(SP)。作为最终预测基础的评分并不真正是概率,并且它们不是必需地加合成一体。然而,根据TargetP,具有最高评分的定位是最可能的,并且评分之间的关系(可靠性级别)可以指示该预测具有多大确定性。可靠性级别(RC)范围从1至5,其中1表示最可靠的预测。TargetP在丹麦技术大学(Technical University of Denmark)的服务器上维护。
对于预测含有氨基端前序列的序列而言,也可以预测潜在的切割位点。
可以选择许多参数,如生物组别(非植物或植物),临界值集合(无、预定的临界值集合或用户指定的临界值集合)和切割位点预测的计算(是或否)。
对如SEQ ID NO:173所代表的多肽序列的TargetP 1.1分析的结果在表N中显示。选择“植物”生物组别,未定义临界值,并且对转运肽的预测长度提出要求。如SEQ ID NO:173所代表多肽序列的亚细胞定位可能是细胞质或细胞核。然而,应当指出如本申请中所述的对产量所观察到的影响不是所述蛋白质特定定位的结果。
表N:对如SEQ ID NO:173所代表的多肽序列的TargetP 1.1分析
长度(AA) | 336 |
叶绿体转运肽 | 0.109 |
线粒体转运肽 | 0.416 |
分泌途径信号肽 | 0.083 |
其他亚细胞定位 | 0.551 |
预测位置 | 其它 |
可靠性级别 | 5 |
预测的转运肽长度 | / |
众多其他算法可以用来进行此类分析,包括:
·在丹麦技术大学服务器上维护的ChloroP 1.1;
·在澳大利亚布里斯班昆士兰大学生物科学研究所的服务器上维护的Protein Prowler亚细胞定位预测者1.2版;
·在加拿大阿伯特省埃德蒙顿市阿尔伯塔大学的服务器上维护的PENCE蛋白组分析专家PA-GOSUB 2.5;
·在丹麦技术大学服务器上维护的TMHMM
实施例25:与实施本发明方法中有用的多肽序列相关的测定法
使用酵母双杂系统确定CycHTr蛋白与CAK蛋白之间的相互作用(Yamaguchi等,2000)。简而言之,在酿酒酵母Y190株中产生与GAL4-DNA结合结构域(DNA-BD)融合的CAK和融合于GAL4-反式激活结构域(AD)的CycHTr,其中所述酿酒酵母Y190株具有在GAL4结合位点的共有序列下的HIS3和LacZ报道基因。CAK或CycHTr的表达不诱导报道基因表达,而表达CAK融合蛋白及CycHTr融合蛋白这两者的细胞可以在不含组氨酸的培养基上生长并表达LacZ蛋白。
如Yamaguchi(2000)所述测量CycH激活CAK。在芽殖酵母中,Civ1/Cak1具有体内CAK活性,但没有体内CTD-激酶活性。已经证实:稻CAK(R2)的过量表达能够在芽殖酵母株GF2351中弥补CAK突变,其中所述的芽殖酵母株GF2351在civ1/cak1基因中携带一个温度敏感突变。当CAK(克隆至含有半乳糖诱导型GAL1启动子的表达载体pYES2)、CycH(克隆至组成型表达载体pGAD-GL,其中所述的表达载体含有截短的adh启动子并表达与CycH融合的GAL4反式激活结构域)或这两者导入GF2351细胞,随后表达CAK的细胞在34℃生长于含有半乳糖的基本培养基(MVGS)上,但在含有葡萄糖的基本培养基(MVD)上不生长。仅表达CycH的细胞在34℃不生长。相反,表达CAK和CycH这两者的细胞在36℃生长于MVGS上,然而在这个温度上,仅表达CAK的那些细胞不能够生长。这表明CycH的表达增强了芽殖酵母细胞中CAK对civ1/cak1突变的抑制性活性。相反,当使用CycHTr替代CycH时,没有观察到活性。
此外,CycHTr蛋白在植物中的过量表达导致如下文所述的提高的种子产量。
实施例26:克隆如SEQ ID NO:165所代表的核酸序列
除非另外说明,重组DNA技术根据(Sambrook(2001)MolecularCloning:a laboratory manual,第3版Cold Spring Harbor LaboratoryPress,CSH,New York)或Ausubel等(1994),Current Protocols inMolecular Biology,Current Protocols第1卷和第2卷中描述的标准方案进行。用于植物分子研究工作的标准材料和方法在BIOS科学出版有限责任公司(BIOS Scientific Publications Ltd(英国))和Blackwell科学出版社(Blackwell Scientific Publications(英国))出版的R.D.D.Croy的PlantMolecular Biology Labfax(1993)中描述。
使用拟南芥cDNA文库(Invitrogen,Paisley,UK)作为模板通过PCR扩增拟南芥CycHTr基因。包含用于Gateway重组的AttB位点的引物(SEQID NO:167;有义引物:5’-ggggacaagtttgtacaaaaaagcaggcttcacaatggcggattttcagacatc-3’)和SEQ ID NO:168;反义互补引物:5’-ggggaccactttgtacaagaaagctgggtaaactcaacctatgggtggc-3’)用于PCR扩增。使用Hifi TaqDNA聚合酶在标准条件下进行PCR。还使用标准方法扩增并纯化预期长度的PCR片段(包括attB位点)。随后进行Gateway方法的第一步骤,即BP反应,在该步骤期间PCR片段与pDONR201质粒发生体内重组,以产生根据Gateway命名的“进入克隆”。质粒pDONR201作为技术的部分从Invitrogen购买。
实施例27:使用如SEQ ID NO:165所代表的核酸序列构建表达载体
包含SEQ ID NO:165的进入克隆随后与用于稻转化的一种终端载体在LR反应中一起使用。这种载体在T-DNA边界内含有植物选择标记;可筛选的标记表达盒和旨在使LR与已克隆入所述进入克隆的目的核酸序列体内重组的Gateway盒作为功能性元件。用于种子特异性表达的稻油质蛋白或WSI18启动子(SEQ ID NO:170或SEQ ID NO:171)位于这种Gateway盒上游。
在LR重组步骤后,所得表达载体pSeed::CycHTr(图16)根据本领域熟知的方法转化至农杆菌菌株LBA4044。
实施例28:植物转化
稻转化
使用含有所述表达载体的农杆菌来转化稻植物。将稻粳型栽培品种Nipponbare的成熟干燥种子脱壳。通过如下方式实施消毒:在70%乙醇中孵育1分钟,随后在0.2%HgCl2中孵育30分钟,随后用无菌蒸馏水洗涤6次15分钟。无菌的种子随后在含有2,4-D的培养基(愈伤组织诱导培养基)上萌发。在黑暗中孵育4周后,将小盾片衍生的胚发生的愈伤组织切下并在相同的培养基上增殖。2周后,将愈伤组织通过在同一种培养基上传代培养另外2周进行繁殖或增殖。胚发生的愈伤组织片在新鲜培养基上传代培养3日,随后共培育(以助长细胞分裂活性)
将含有所述表达载体的农杆菌菌株LBA4404用于共培育。农杆菌接种在含有适宜抗生素的AB培养基上并在28℃培养3日。随后收集细菌并在液体共培育培养基中悬浮至密度(OD600)约1。该悬液随后转移至培养皿内并将所述愈伤组织浸没于此悬液内15分钟。该愈伤组织随后在滤纸上蘸干并转移至固化的共培育培养基,并在25℃于黑暗中孵育3日。共培育的愈伤组织在含2,4-D的培养基上在28℃于黑暗中在选择剂存在下培育4周。在此期间,迅速生长的抗性愈伤组织团发育。将这种材料转移至再生培养基并在光照下孵育后,胚发生潜能得到释放并且苗在随后4至5周内发育。将苗从愈伤组织上切下并且在含有植物生长素的培养基上孵育2至3周,将苗从所述培养基转移至土壤。在温室中于高湿度和短日照下生长硬化的苗。
对于一个构建体,产生大约35个独立的T0稻转化体。将原代转化体从组织培养箱转移至温室。在定量PCR分析验证T-DNA插入物的拷贝数后,仅保留针对所述选择剂显示抗性的单拷贝转基因植物用于收获T1种子。种子随后在移栽后3至5个月收获。该方法以超过50%的比例产生单基因座转化体(Aldemita和Hodges1996,Chan等1993,Hiei等1994)。
谷物转化
玉米(Zea mays)的转化用Ishida等(1996.Nature Biotech 14(6):745-50)所述方法的改良方法进行。在谷物中,转化是基因型依赖的并且仅特定基因型对于转化和再生是服从的。杂交系A188(明尼苏达大学)或以A188作为亲本的杂交体是用于转化的供体材料的良好来源,不过其他基因型也可以成功地使用。谷穗在授粉后大约11日(DAP)从谷物植物收获,此时不成熟胚的长度是大约1-1.2mm。不成熟的胚与含有所述表达载体的根癌农杆菌共培育,并且转基因植物通过器官发生过程回收。切下的胚在愈伤组织诱导培养基上、随后在玉米再生培养基上生长,其中所述的培养基含有选择剂(例如咪唑啉酮,不过可以使用不同的选择标记)。培养板在25℃于光照下孵育2-3周,或直至苗发育。将源自每个胚的绿色苗转移至玉米生根培养基并在25℃孵育2-3周,直至根发育。将生根的苗移植至温室中的土壤内。从针对所述选择剂显示耐受性并且含有单拷贝T-DNA插入物的植物产生T1种子。
小麦转化
小麦的转化用Ishida等(1996)Nature Biotech 14(6):745-50描述的方法进行。栽培品种Bobwhite(可从墨西哥CIMMYT获得)通常在转化中使用。不成熟的胚与含有所述表达载体的根癌农杆菌共培育,并且转基因植物通过器官发生过程回收。与农杆菌孵育后,所述胚在愈伤组织诱导培养基上、随后在再生培养基上体外培育,其中所述的培养基含有选择剂(例如咪唑啉酮,不过可以使用多种选择标记)。培养板在25℃于光照下孵育2-3周,或直至苗发育。将源自每个胚的绿色苗转移至生根培养基并在25℃孵育2-3周,直至根发育。将生根的苗移植至温室中的土壤内。从针对所述选择剂显示耐受性并且含有单拷贝T-DNA插入物的植物产生T1种子。
大豆转化
大豆根据对Texas A&M美国专利5,164,310中所述方法的改良方法转化。几个商业大豆品种对于通过这种方法的转化是可操作的。栽培品种Jack(从Illinois种子基金会可获得)通常用于转化。对大豆种子消毒以便体外播种。下胚轴、胚根和一片子叶从7日龄年幼籽苗中切下。进一步培育上胚轴和剩余子叶以使辅助节发育。将这些辅助节切下并与含有所述表达载体的根癌农杆菌孵育。在共培育处理之后,洗涤外植体并转移至选择培养基。切下再生的苗并置于苗伸长培养基上。将长度不超过1cm的苗置于生根培养基上直至根发育。生根的苗移植至温室中的土壤内。从针对所述选择剂显示耐受性并且含有单拷贝T-DNA插入物的植物产生T1种子。
油菜籽/卡诺拉油菜转化
使用5-6日龄年幼籽苗的子叶柄和下胚轴作为用于组织培养的外植体并且根据Babic等(1998,Plant Cell Rep 17:183-188)进行转化。商业栽培品种Westar(Agriculture Canada)是用于转化的标准品种,不过其他品种也可以使用。对卡诺拉油菜种子进行表面消毒以体外播种。从所述体外籽苗切下附带子叶的子叶叶柄外植体,并且通过将此叶柄外植体的切口末端浸入细菌悬液以(含有所述表达载体的)农杆菌接种。该外植体随后在23℃,16小时光照下于含有3mg/l BAP、3%蔗糖、0.7%植物琼脂的MSBAP-3培养基上培养2日。与农杆菌共培育2日后,将所述叶柄外植体转移至含有3mg/l BAP、头孢噻肟、羧苄青霉素或特美汀(300mg/l)的MSBAP-3培养基上培养7日,并且随后在含有头孢噻肟、羧苄青霉素或特美汀和选择剂的MSBAP-3培养基上培养,直至苗再生。当苗长度是5-10mm时,切下这些苗并转移至苗伸长培养基(MSBAP-0.5,含有0.5mg/l BAP)。将长度大约2cm的苗转移至生根培养基(MS0)用于根诱导。生根的苗移植至温室中的土壤内。从针对所述选择剂显示耐受性并且含有单拷贝T-DNA插入物的植物产生T1种子。
苜蓿转化
使用(McKersie等,1999 Plant Physiol 119:839-847)的方法转化苜蓿的再生性克隆。苜蓿的再生和转化是基因型依赖性的并且因而需要再生性植物。已经描述了获得再生性植物的方法。例如,这些再生性植物可以选自栽培品种Rangelander(Agriculture Canada)或如Brown DCW和AAtanassov(1985.Plant Cell Tissue Culture 4:111-112)所述的任何其他商业苜蓿品种。备选地,已经选择RA3品种(威斯康星大学)用于组织培养(Walker等,1978 Am J Bot 65:654-659)。叶柄外植体与含有所述表达载体的根癌农杆菌C58C1 pMP90(McKersie等,1999 Plant Physiol119:839-847)或LBA4404的过夜培养物共培育。所述外植体在黑暗中于含有288mg/L Pro、53mg/L硫代脯氨酸、4.35g/L K2SO4和100μm乙酰丁香酮的SH诱导培养基上共培育3日。所述外植体在浓度减半的Murashige-Skoog培养基(Murashige和Skoog,1962)中洗涤并铺种在不含乙酰丁香酮而含有合适选择剂和抑止农杆菌生长的合适抗生素的相同SH诱导培养基上。几周后,将体细胞胚转移至不含生长调节剂、不含抗生素和含有50g/L蔗糖的BOi2Y发育培养基中。体细胞胚随后在浓度减半的Murashige-Skoog培养基上萌发。生根的籽苗移植至花钵内并且在温室中培育。从针对所述选择剂显示耐受性并且含有单拷贝T-DNA插入物的植物产生T1种子。
棉花转化
使用根癌农杆菌,根据US 5,159,135中所述的方法转化棉花。棉花种子在3%次氯酸钠溶液中持续20分钟进行表面消毒并且在含有500μg/ml头孢噻肟的蒸馏水中洗涤。随后将种子转移至含有50μg/ml苯菌灵的SH-培养基以萌发。将4-6日龄籽苗的下胚轴取出、切成0.5cm的小段并置于0.8%琼脂上。农杆菌悬液(约108个细胞/ml,从用目的基因和合适选择标记转化的过夜培养物稀释)用于接种所述下胚轴外植体。在室温和光照下3日后,将组织转移至含有Murashige和Skoog盐的固体培养基(1.6g/l脱乙酰吉兰糖胶),其中所述的Murashige和Skoog盐含有B5维生素(Gamborg等,Exp.Cell Res.50:151-158(1968))、0.1mg/l 2,4-D、0.1mg/l 6-糠氨基嘌呤和750μg/ml MgCL2并含有50-100μg/ml头孢噻肟和400-500μg/ml羧苄青霉素以杀死残余细菌。各个细胞系在2-3个月后分离(每隔4-6周传代培养)并且在用于组织扩增的选择性培养基上进一步培育(30℃,16小时光周期)。转化的组织随后在非选择性培养基上进一步培育2-3月以产生体细胞胚。将长度至少4mm的外观健康胚转移至细蛭石中的含有SH培养基的管内,其中所述的SH培养基补充有0.1mg/l吲哚乙酸、6-糠氨基嘌呤和赤霉酸。所述胚在30℃以16小时光周期培育,并且将2-3叶期的小植株转移至具有蛭石和营养物的花钵内。使植物硬化并随后移至温室以进一步培育。
实施例29:表型评价方法
29.1评价建立
产生大约35个独立的T0稻转化体。原代转化体从组织培养箱转移至温室以生长并收获T1种子。留下下述7个事件,其中所述事件的T1后代对所述转基因的存在/不存在以3∶1比例分离。对于这些事件中的每一个,通过监测目视标记表达而选出大约10株含有该转基因的T1籽苗(杂合子和纯合子)和大约10株缺少该转基因的T1籽苗(失效合子)。转基因植物和对应的失效合子于随机位置并排培育。温室条件是短日照(12小时光照),在光照下28℃和在黑暗中22℃以及相对湿度70%。
4个T1事件在T2世代中按照如对T1世代相同的评价方法进一步评估,不过每个事件采用更多个体。从播种期直至成熟期,将所述植物数次通过数字成像室。在每一时间点上,从至少6个不同角度拍摄每株植物的数字图像(2048x1536像素,1600万颜色)。
干旱筛选
来自T2种子的植物在盆栽土壤中在正常条件下培育直至它们达到抽穗期。随后将它们转移至其中减少灌溉的“干燥”区域。湿度探针插入随机选择的花钵内,以监测土壤水分含量(SWC)。当SWC下降低于某个阈值时,自动地对植物连续再灌溉直至再次达到正常水平。随后植物再次转移至正常条件正常条件。其余培育过程(植物成熟、种子收获)与不在非生物胁迫下培育的植物相同。生长和产量参数如对正常条件下生长所述那样记录。
氮使用效率筛选
来自T2种子的稻植物在盆栽土壤中在正常条件下培育,除了营养液不是正常条件之外。花钵从移植至成熟一直用氮(N)含量降低、通常降低7-8倍的特定营养液浇灌。其余培育过程(植物成熟、种子收获)与不在非生物胁迫下培育的植物相同。生长和产量参数如对正常条件下生长所述那样记录。
29.2统计分析:F-检验
使用两因素ANOVA(变量分析)作为整体评价植物表型特征的统计模型。对于用本发明基因转化的全部事件的全部植物的全部所测量参数实施F检验。实施F检验以检查该基因对全部转化事件的影响并验证该基因的整体作用(又称作基因总体作用)。真实基因总体作用显著性的阈值对于F检验设置在5%概率水平上。显著性F检验值指出基因作用,意指不仅仅是基因的存在或位置才造成表型上的差异。
因为实施了具有重叠事件的两个实验,故而进行联合分析。这用于检验对这两个实验影响的一致性,并且若是一致的,则用于积累来自两个实验的证据以提高结论的可信度。所用方法是考虑数据的多重水平结构的混合模型法(即实验-事件-分离子)。通过比较针对卡方分布(chi squaredistribution)的似然比检验而获得P-值。
29.3测量的参数
生物量相关的参数测量
植物从播种期至成熟期数次通过数字成像室。在每个时间点上,从至少6个不同角度拍摄每株植物的数字图像(2048x1536像素,1600万颜色)。
植物地上部分面积(或叶生物量)通过计数来自植物地上部分的数字图像上区别于背景的像素总数而确定。该值对相同时间点上从不同角度拍摄的画面进行平均化并且转化成通过校正以平方mm表述的物理表面值。实验显示以这种方式测量的植物地上部分面积与植物地上部分的生物量相关。地上部分面积是植物已经实现其最大叶生物量的时间点上所测量的面积。早期生长势是萌发后3周的植物(籽苗)地上部分的面积。根生物量的增加表述为根总生物量的增加(测量为植物寿命期间观察到的根最大生物量);或表述为根/冠比增加(测量为根和苗的活跃生长期间根质量与苗质量之间的比例)。
种子相关参数测量
将成熟的原发花序收获、计数、装袋、加条形码标记并且随后在干燥箱内于37°干燥3日。随后将所述花序脱粒,并且收集和计数全部种子。充实粒使用吹气装置与空粒分开。弃去空粒并且再次计数剩余部分。充实粒在分析天平上称重。充实种子数通过计数所述分离步骤后充实粒数目加以确定。种子总产量通过称量从一株植物收获的全部充实粒而测量。每株植物的种子总数通过计数从一株植物收获的壳数目测量。从计数的充实种子数及其总重量外推出千粒核重(TKW)。收获指数(HI)在本发明中定义为种子总产量与地上部分面积(mm2)之间的比率,乘以系数106。如本发明中定义的每花序的总花数是种子总数与成熟原发花序数目之间的比率。如本发明中定义的种子充实率是充实种子数对种子(或小花)总数的比例(表述为%)。
实施例30:转基因植物的表型评价的结果
评价在种子特异性启动子控制下表达CycHTr核酸的转基因稻植物的结果显示,与对照植物相比较,以下一种或多种参数提高:营养生物量(AreaMax)、根冠比、种子总重量(totwgseeds)、充实种子数(nrfilledseeds)、充实率(fillrate)、每穗花数目(flowperpan)、收获指数(HI)、千粒核重(TKW)、种子总数(nrtotalseed)。
对于带油质蛋白启动子的构建体,提高的参数包括在表O中给出的参数。
表O:在T1和T2阶段的植物的提高的种子产量参数,其中所述植物携带在油质蛋白启动子控制下的CycHTr转基因。
实施例31:鉴定与SEQ ID NO:198和SEQ ID NO:199相关的序列
使用数据库搜索工具如基本局部比对工具(BLAST)(Altschul等(1990)J.Mol.Biol.215:403-410;和Altschul等(1997)Nucleic Acids Res.25:3389-3402),从国家生物技术信息中心(NCBI)的Entrez核苷酸数据库中维护的那些序列当中鉴定到与SEQ ID NO:198相关的(全长eDNA、EST或基因组)序列和/或与SEQ ID NO:199相关的蛋白质序列。使用该程序通过核酸序列或多肽序列与序列数据库比较并且计算匹配的统计显著性来找到序列之间的局部相似性区域。由SEQ ID NO:199编码的多肽用于TBLASTN算法,采用默认设置和过滤程序以忽略低复杂性序列启动。这种分析的结果通过配对比较进行观察,并根据概率评分(E-值)进行评级,其中所述的评分反映特定比对结果因偶然发生的概率(E-值越低,命中的显著性越高)。除了E-值外,比较过程也可以由同一性百分数评分。同一性百分数指两个比较的核酸(或多肽)序列之间在特定长度范围内相同核苷酸(或氨基酸)的数目。在一些情况下,可以调整默认参数以修改所述搜索的严格性。
表P提供与如SEQ ID NO:198所代表的核酸序列和SEQ ID NO:199所代表的蛋白质序列相关的核酸序列和多肽序列名单。
表P:编码Remorin多肽的核酸序列和Remorin多肽
名称 | 来源生物 | 核酸SEQIDNO: | 多肽SEQIDNO: | 数据库登录号 | 数据库登录号 |
Remorin | 拟南芥 | 198 | 199 | NM_115614.2 | NP_567050.1 |
remorin | 拟南芥 | 200 | 201 | AY086863.1 | AAM63910.1 |
Remorin | 拟南芥 | 202 | 203 | NM_115990.3 | NP_191685.1 |
remorin | 拟南芥 | 204 | 205 | M25268.1 | AAA57124.1 |
remorin | 拟南芥 | 206 | 207 | BT000016.1 | AAN15335.1 |
remorin | 拟南芥 | 208 | 209 | AF387006_1 | AAK62451.1 |
remorin | 拟南芥 | 210 | 211 | NM_203095.1 | NP_974824.1 |
remorin | 拟南芥 | 212 | 213 | NM_122280.2 | NP_197764.1 |
remorin | 拟南芥 | 214 | 215 | NM_114753.1 | NP_190463.1 |
Remorin | 拟南芥 | 216 | 217 | NM_130145.3 | NP_182106.1 |
假定的 | 拟南芥 | 218 | 219 | gi|7267383 | CAB80876.1 |
未命名 | 拟南芥 | 220 | 221 | gi|10176838 | BAB10048.1 |
remorin | 拟南芥 | 222 | 223 | NM_116292.2 | NP_191976.2 |
remorin | 拟南芥 | 224 | 225 | NM_179535.1 | NP_849866.1 |
Remorin | 拟南芥 | 226 | 227 | NM_001036171.1 | NP_001031248.1 |
Remorin | 拟南芥 | 228 | 229 | NM_105426.2 | NP_564900.1 |
remorin | 拟南芥 | 230 | 231 | NM_125521.1 | NP_200936.1 |
Remorin | 拟南芥 | 232 | 233 | NM_129751.1 | NP_181718.1 |
remorin | 拟南芥 | 234 | 235 | NM_101258.1 | NP_172845.1 |
remorin | 拟南芥 | 236 | 237 | gi|7270623 | CAB80363.1 |
remorin | 拟南芥 | 238 | 239 | NM_104263.3 | NP_175789.2 |
Remorin | 拟南芥 | 240 | 241 | NM_102770.3 | NP_174322.1 |
remorin | 拟南芥 | 242 | 243 | NM_202247.1 | NP_973976.1 |
remorin | 拟南芥 | 244 | 245 | NM_126277.1 | AAO23587.1 |
remorin | 拟南芥 | 246 | 247 | gi|6382042 | AAC13631.1 |
remorin | 拟南芥 | 248 | 249 | gi|12597777 | AAG60092.1 |
remorin | 拟南芥 | 250 | 251 | gi|12325073 | AAG52495.1 |
remorin | 拟南芥 | 252 | 253 | gi|6850877 | CAB71056.1 |
remorin | 拟南芥 | 254 | 255 | gi|6434255 | CAB62016.1 |
remorin | 拟南芥 | 256 | 257 | gi|6491703 | CAB66111.1 |
remorin | 拟南芥 | 258 | 259 | gi|12324670 | AAG52296 |
remorin | 拟南芥 | 260 | 261 | gi|20198316 | AAB63554 |
remorin | 拟南芥 | 262 | 263 | gi|7940274 | AAF79398 |
remorin | 稻 | 264 | 265 | Os02g0824500 | NP_001048576.1 |
remorin | 稻 | 266 | 267 | Os02g0642200 | NP_001047554.1 |
remorin | 稻 | 268 | 269 | Os04g0533300 | NP_001053409.1 |
remorin | 稻 | 270 | 271 | Os10g0503800 | BAF26915.1 |
remorin | 稻 | 272 | 273 | Os07g0208600 | BAF21077.1 |
remorin | 稻 | 274 | 275 | Os03g0111200 | BAF10636.1 |
remorin | 稻 | 276 | 277 | Os07g0569100 | NP_001060036.1 |
remorin | 稻 | 278 | 279 | Os03g0808300 | NP_001051650.1 |
remorin | 稻 | 280 | 281 | Os03g0211500 | NP_001049348.1 |
remorin | 稻 | 282 | 283 | Os02g0602000 | BAF09268.1 |
remorin | 稻 | 284 | 285 | Os02g0658400 | BAF09549.1 |
remorin | 稻 | 286 | 287 | Os03g0120200 | BAF10700.1 |
remorin | 稻 | 288 | 289 | Os02g0116800 | NP_001045682.1 |
remorin | 稻 | 290 | 291 | Os04g0620200 | NP_001053905.1 |
remorin | 稻 | 292 | 293 | Os12g0613600 | BAF30284.1 |
remorin | 稻 | 294 | 295 | Os11g0616300 | BAF28646.1 |
remorin | 稻 | 296 | 297 | Os10g0325400 | BAF26266.1 |
remorin | 稻 | 298 | 299 | Os09g0456100 | BAF25275.1 |
remorin | 稻 | 300 | 301 | Os08g0471800 | NP_001062016.1 |
remorin | 稻 | 302 | 303 | Os02g0767000 | NP_001048227.1 |
假定的 | 玉米 | 304 | 305 | gi|23928433 | AAN40027.1 |
remorin | 马铃薯 | 306 | 307 | gi|1881584 | AAB49425.1 |
remorin | 大豆 | 308 | 309 | gi|83853825 | ABC47866.1 |
remorin | 蒺藜苜蓿 | 310 | 311 | gi|61097833 | ABN08208.1 |
remorin | 蒺藜苜蓿 | 312 | 313 | gi|62629912 | ABE89592.1 |
remorin | 蒺藜苜蓿 | 314 | 315 | gi|84662897 | ABE87162.1 |
rem-1 | 番茄 | 316 | 317 | gi|4731572 | AAD28506.1 |
rem-2 | 番茄 | 318 | 319 | gi|4883529 | AAD28507.2 |
remorin | 蒺藜苜蓿 | 320 | 321 | gi|49170172 | ABE84731.1 |
remorin | 小果野蕉(Musaacuminata) | 322 | 323 | gi|102140012 | ABF70164.1 |
remorin | 蒺藜苜蓿 | 324 | 325 | gi|52694025 | ABE86981.1 |
实施例32:多肽序列的比对
多肽序列的比对使用来自Vector NTI(Invitrogen)的Alignment X程序进行,其中所述AlignX程序基于受欢迎的累进比对Clustal算法(Thompson等(1997)Nucleic Acids Res 25:4876-4882;Chenna等(2003),Nucleic Acids Res 31:3497-3500)。空位开口罚分的默认值是10,空位延伸罚分的默认值是0.1并且所选的权重矩阵是Blosum 62(若比对多肽)。Remorin之间的序列保守性基本上位于多肽的羧基端Remorin结构域内,氨基端结构域通常在序列长度和组成上更多变。Remorin多肽的羧基端Remorin结构域在图20中比对。SEQ ID NO:199的羧基端Remorin结构域(且如SEQ ID NO:326中所代表)中包含的氨基酸残基以粗体标记并且上方为黑色框。绝大部分Remorin多肽在羧基端10个氨基酸残基内包含至少一个Cys和/或一个Phe,在图20中以框示出。将预测的卷曲螺旋区域加双下划线显示并且将推定的苏素化位点加框显示。
实施例33:计算在实施本发明方法中有用的多肽序列之间总体同一性百分数
使用现有技术领域可获得的方法之一,即MatGAT(矩阵总体比对工具)软件(BMC Bioinformatics.20034:29.MatGAT:使用蛋白质序列或DNA序列产生相似性/同一性矩阵的一项应用,Campanella JJ,Bitincka L,Smalley J;软件由Ledion Bitincka维护)确定在实施本发明方法中有用的全长多肽序列之间的总体相似性和同一性百分数。MatGAT软件对DNA序列或蛋白质序列产生相似性/同一性矩阵,无需数据的预先比对。该程序使用Myers和Miller总体比对算法(空位开口罚分12和空位延伸罚分2)进行一系列配对比对,使用例如Blosum 62(对于多肽而言)计算相似性和同一性并且随后将结果置于距离矩阵内。在分割线下半部分显示序列相似性,和在对角分割线的上半部分显示序列同一性。
比较过程中使用的参数是:
评分矩阵:Blosum62
第一空位:12
延伸空位:2
表Q中显示在例如来自拟南芥属植物的多肽序列全长范围(不包括部分多肽序列)内的总体相似性和同一性的该软件分析的结果。同一性百分数在对角线以上给出而相似性百分数在对角线以下给出。
与SEQ ID NO:199相比较,在实施本发明方法中有用的拟南芥多肽序列之间的同一性百分数可以低至11%氨基酸同一性。
表Q1显示了拟南芥Remorin多肽的羧基端Remorin结构域之间的同一性百分数,如SEQ ID NO:326所代表的SEQ ID NO:199的羧基端Remorin结构域。Remorin结构域SEQ ID NO:326和其它拟南芥Remorin羧基端Remorin结构域之间的同一性百分数提高至16%氨基酸同一性。
实施例34:鉴定在实施本发明方法中有用的多肽序列中包含的结构域
蛋白质家族、结构域和位点的集成资源(InterPro)数据库是针对基于文本及基于序列的搜索法的常用特征标识数据库的集成界面。InterPro数据库合并了这些数据库,所述数据库使用不同方法学及不同程度的有关充分表征的蛋白质的生物学信息以获得蛋白质特征标识。合作数据库包括SWISS-PROT、PROSITE、TrEMBL、PRINTS、ProDom和Pfam,Smart和TIGRFAMs。Interpro由英国欧洲生物信息学研究所维护。
如SEQ ID NO:199所代表多肽序列的InterPro扫描结果呈现于表R和图20中。
表R:如SEQ ID NO:199所代表多肽序列的InterPro扫描结果(主要登录号)。
数据库 | 登录号 | 登录名称 | 在SEQ ID NO 199上的氨基酸位置 |
InterPro | IPR005516 | Remorin,羧基端区域 | 180-291 |
Pfam | PF03763 | Remorin_C | 180-291 |
Prodom | PD350442 | Remorin_C | 180-291 |
Pfam是包括众多常见蛋白质结构域和家族的多重序列比对和隐匿马尔科夫模型的庞大数据集合。Pfam由英国Sanger研究所服务器维护。
实施例35:预测在实施本发明方法中有用的多肽序列的二级结构特征
卷曲螺旋通常含有重复的七氨基酸残基模式,称作七氨基酸重复序列。卷曲螺旋对于鉴定蛋白质-蛋白质相互作用如寡聚化是重要的,其中所述的蛋白质是同一个蛋白质家族的相同蛋白或相关的蛋白质。Remorin多肽可以与自身相互作用,或与Remorin直向同源物或旁系同源物相互作用。最近在从序列数据计算性预测卷曲螺旋方面取得长足进展。在ExPASy蛋白质组工具网站可获得本领域技术人员熟知的众多算法。其中之一是COILS,这是将序列与已知的平行双链卷曲螺旋的数据库比较并获得相似性评分的程序。此程序通过将该评分与球状蛋白和卷曲螺旋蛋白中的评分分布比较,随后计算该序列采取卷曲螺旋构象的概率。
如SEQ ID NO:199所代表的Remorin多肽以高概率在检验的全部三个窗口(14,21和28)中具有预测的羧基端卷曲螺旋结构域。在表S中显示了残基位置、残基、所述3个窗口和相应的概率值。在图2中是COILS算法对如SEQ ID NO:2所代表多肽的图形输出结果,其中在该多肽的羧基端半部分中,在全部三个窗口(如三条线所代表)中清楚地可见到预测的卷曲螺旋。
表S:COILS算法对如SEQ ID NO:199所代表多肽的数字输出结果。显示了残基位置(#)、残基、所述三个窗口和相应的概率值。高于0.09的概率以灰色显示。
# | 残基 | 窗口=14 | 概率 | 窗口=21 | 概率 | 窗口=28 | |
213 | G | c | 0.003 | C | 0.014 | b | 0.004 |
214 | W | d | 0.002 | C | 0.069 | c | 0.013 |
215 | L | d | 0.014 | D | 0.821 | d | 0.626 |
216 | N | e | 0.014 | E | 0.821 | e | 0.626 |
217 | E | f | 0.014 | F | 0.821 | f | 0.626 |
218 | Q | g | 0.014 | G | 0.821 | g | 0.626 |
219 | V | a | 0.014 | A | 0.821 | a | 0.626 |
220 | H | b | 0.014 | B | 0.821 | b | 0.626 |
221 | R | c | 0.066 | C | 0.821 | c | 0.626 |
222 | A | d | 0.066 | D | 0.821 | d | 0.626 |
223 | N | e | 0.066 | E | 0.821 | e | 0.626 |
224 | S | f | 0.066 | F | 0.821 | f | 0.626 |
225 | W | g | 0.066 | G | 0.821 | g | 0.626 |
226 | M | a | 0.642 | A | 0.821 | a | 0.626 |
227 | K | b | 0.642 | B | 0.821 | b | 0.626 |
228 | K | c | 0.642 | C | 0.821 | c | 0.626 |
229 | I | d | 0.642 | D | 0.821 | d | 0.626 |
230 | E | e | 0.642 | E | 0.821 | d | 0.746 |
231 | R | f | 0.642 | F | 0.821 | b | 0.819 |
232 | K | g | 0.642 | G | 0.821 | c | 0.819 |
233 | L | a | 0.642 | A | 0.821 | d | 0.819 |
234 | E | b | 0.642 | B | 0.821 | e | 0.819 |
235 | D | c | 0.642 | C | 0.821 | f | 0.819 |
236 | R | d | 0.642 | D | 0.789 | f | 0.889 |
237 | R | e | 0.642 | D | 0.871 | g | 0.889 |
238 | A | f | 0.642 | E | 0.871 | a | 0.889 |
239 | K | f | 0.908 | F | 0.976 | f | 0.967 |
240 | A | g | 0.930 | G | 0.976 | g | 0.967 |
241 | M | a | 0.982 | A | 0.976 | a | 0.967 |
242 | E | b | 0.982 | B | 0.976 | b | 0.967 |
243 | K | c | 0.982 | C | 0.976 | c | 0.967 |
244 | T | d | 0.982 | D | 0.976 | d | 0.967 |
245 | Q | e | 0.982 | E | 0.976 | e | 0.967 |
246 | N | f | 0.982 | F | 0.976 | f | 0.967 |
247 | K | g | 0.982 | G | 0.976 | g | 0.967 |
248 | V | a | 0.982 | A | 0.976 | a | 0.967 |
249 | A | b | 0.982 | B | 0.976 | b | 0.967 |
250 | K | c | 0.982 | C | 0.976 | c | 0.967 |
251 | A | d | 0.982 | D | 0.976 | d | 0.967 |
252 | Q | e | 0.982 | E | 0.976 | e | 0.967 |
253 | R | f | 0.982 | F | 0.976 | f | 0.967 |
254 | K | g | 0.982 | G | 0.976 | g | 0.967 |
255 | A | a | 0.981 | A | 0.976 | a | 0.967 |
256 | E | b | 0.981 | B | 0.976 | b | 0.967 |
257 | E | c | 0.981 | C | 0.976 | c | 0.967 |
258 | R | d | 0.727 | D | 0.976 | d | 0.967 |
259 | R | e | 0.578 | E | 0.976 | e | 0.967 |
260 | A | b | 0.577 | F | 0.964 | f | 0.967 |
261 | T | c | 0.577 | G | 0.958 | g | 0.967 |
262 | A | d | 0.577 | A | 0.913 | a | 0.967 |
263 | E | e | 0.577 | B | 0.913 | b | 0.967 |
264 | G | f | 0.577 | C | 0.585 | c | 0.967 |
265 | K | g | 0.577 | D | 0.550 | d | 0.967 |
266 | R | a | 0.577 | E | 0.407 | e | 0.967 |
267 | G | b | 0.092 | F | 0.064 | f | 0.769 |
268 | T | c | 0.029 | G | 0.024 | g | 0.741 |
269 | E | d | 0.010 | D | 0.023 | a | 0.159 |
270 | V | a | 0.007 | E | 0.023 | b | 0.017 |
271 | A | b | 0.007 | F | 0.023 | c | 0.009 |
272 | R | c | 0.007 | G | 0.023 | g | 0.007 |
273 | V | d | 0.007 | A | 0.023 | a | 0.007 |
274 | L | e | 0.007 | B | 0.007 | b | 0.007 |
其他重要二级结构可以使用需要如SEQ ID NO:199所示序列信息的算法来预测。众多可用算法在瑞士生物信息研究所(Swiss BioinformaticsInstitute)维护的ExPaSy站点上再分组。例如,Jpred是这样的网服务器,其采集蛋白质序列或蛋白质序列的多重比对结果并使用称作Jnet的神经网络获得二级结构。预测是对每个残基在α螺旋(H)中、β折叠(E)中或无规卷曲(C)二级结构中的定义。下文是该预测程序对如SEQ ID NO:199所代表的Remorin多肽的输出结果:
MLTLYGQERSPENSTTSTTDASDRRDETPSSEIVVRDIHAMTTTTELTRPQQRGSGGGYLSP
-------------------------------EEEEEEEE-----------------------
SRSIAFSDGTTSSGENFTTVSREFNALVIAGSSMDNNSNGTNQSGGHRDVIRDERNELTRIG
------------------EEHHHHHHHHHH-----------------EEEEEE---------
ENDDVGDHGQVPEEDSNPWAIVPDDYNNRDGSENNIVLASSGGQNRMVTTASVQRVKREEVE
-------------------EEE---------------------------EEEEEEEHHHHHH
AKITAWQTAKVAKINNRFKRQDAVINGWLNEQVHRANSWMKKIERKLEDRRAKAMEKTQNKV
HHHHHHHHHHHHHH-------EEE----HHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHH
AKAQRKAEERRATAEGKRGTEVARVLEVANLMRAVGRPPAKRSFFSLS
HHHHHHHHHHHHHHHHH--HHHHHHHHHHHHHHH---------EE---
实施例36:如SEQ ID NO:199所代表的多肽序列的氨基酸组成
可以使用来自ExPASy服务器的软件程序、尤其ProtParam工具,计算确定多肽结构域是否富含特定氨基酸的一级氨基酸组成(%)(Gasteiger等(2003)ExPASy:用于详细了解并分析蛋白质的蛋白质组服务器.NucleicAcids Res 31:3784-3788)。随后可以将目的蛋白质的组成与UniProtKB/Swiss-Prot蛋白质序列数据库(2007年3月6日发布的52.0版本,含有260175序列条目,包含从152564个参考物中抽取的95002661个氨基酸)中的平均氨基酸组成(%)比较。
已经对如SEQ ID NO:199所代表的多肽、SEQ ID NO:199的Remorin结构域和SEQ ID NO:199的氨基端结构域分析其氨基酸组成。结果在下表T和U中显示。
表T:与UniProtKB/Swiss-Prot蛋白质序列数据库(2007年3月6日发布的52.0版本)相比较,如SEQ ID NO:199所代表的多肽、SEQ ID NO:199的羧基端Remorin结构域和SEQ ID NO:199的氨基端结构域(从氨基端至羧基端计数为羧基端Remorin结构域上游的氨基酸残基)的氨基酸组成(以%表示)
表U:如SEQ ID NO:199所代表的多肽、SEQ ID NO:199的Remorin结构域和SEQ ID NO:199的氨基端结构域中带正电荷和带负电荷的残基的数目。
SEQ IDNO:199 | Remorin结构域(180-290) | 氨基端结构域(1-179) | Swiss-Prot52.0百分数 |
带负电荷的残基(Asp+Glu)的总数: | 42 | 14 | 28 | 12% |
带正电荷的残基(Arg+Lys)的总数: | 45 | 30 | 15 | 11.3% |
带电荷的氨基酸的总计百分数 | 29% | 40% | 24% | 23.33% |
Remorin结构域富含带电荷的氨基酸,尤其是Lys,Arg和Glu。
实施例37预测在实施本发明方法中有用的多肽中包含的丝氨酸/苏氨酸蛋白激酶磷酸化位点
多肽的磷酸化状态通常与激活或失活相关或与激活/失活该多肽的中间水平相关。OGA和/或PGA增强的Remorin磷酸化是在一个或多个苏氨酸残基处进行,作为丝氨酸/苏氨酸蛋白激酶的产物。虽然所有丝氨酸/苏氨酸激酶均使它们底物中的丝氨酸或苏氨酸残基磷酸化,但它们基于分布于磷酸受体位点侧翼的残基选择特定的残基以磷酸化,所述的残基在一起包含共有序列。如本领域熟知,已经开发了几种算法以基于给定多肽序列预测此类磷酸化位点。维护于丹麦技术大学的NetPhos 2.0服务器对真核生物蛋白中的丝氨酸、苏氨酸和酪氨酸磷酸化位点进行神经网络预测。
NetPhos 2.0服务器-预测结果
MLTLYGQERSPENSTTSTTDASDRRDETPSSEIVVRDIHAMTTTTELTRPQQRGSGGGYLSPSRSIAFSDGTTSSGENFT 80
.........S...S..ST...S.....T.SS..........TT..........S.....S.......S....33S..... 80
TVGREFNALVIAGSSMDNNSNGTNQSGGHRDVIRDERNELTRIGENDDVGDHGQVPEEDSNPWAIVPDDYNNRDGSENNI 160
...........................................................................3.... 160
VLASSGGQNRMVTTASVQRVKREEVEAKITAWQTAKVAKINNRFKRQDAVINGWLNEQVHRANSWMKKIERKLEDRRAKA 240
....3.......T....................T.............................3................ 240
MEKTQNKVAKAQRKAEERRATAEGKRGTEVARVLEVANLMRAVGRPPAKRGFFGLG 320
....................T......T............................ 320
预测的磷酸化位点:Ser:14 Thr:8
丝氨酸预测
名称 位置 上下关系 分值 预测
序列 10 GQERSPENS 0.986 *S*
序列 14 SPENSTTST 0.974 *S*
序列 17 NSTTSTTDA 0.997 *S*
序列 22 TTDASDRRD 0.995 *S*
序列 30 DETPSSEIV 0.730 *S*
序列 31 ETPSSEIVV 0.677 *S*
序列 55 QQRGSGGGY 0.972 *S*
序列 61 GGYLSPSRS 0.979 *S*
序列 63 YLSPSRSIA 0.395 .
序列 65 SPSRSIAFS 0.415 .
序列 69 SIAFSDGTT 0.942 *S*
序列 74 DGTTSSGEN 0.990 *S*
序列 75 GTTSSGENF 0.845 *S*
序列 83 FTTVSREFN 0.237 .
序列 94 VIAGSSMDN 0.417 .
序列 95 IAGSSMDNN 0.311 .
序列 100 MDNNSNGTN 0.026 .
序列 106 GTNQSGGHR 0.014 .
序列 140 PEEDSNPWA 0.023 .
序列 156 NRDGSENNI 0.951 *S*
序列 164 IVLASSGGQ 0.014 .
序列 165 VLASSGGQN 0.960 *S*
序列 176 VTTASVQRV 0.164 .
序列 224 HRANSWMKK 0.895 *S*
序列 291 PAKRSFFSL 0.039 .
序列 294 RSFFSLS-- 0.121 .
序列 296 FFSLS---- 0.019 .
苏氨酸预测
名称 位置 上下关系 分值 预测
序列 3 --MLTLYGQ 0.176 .
序列 15 PENSTTSTT 0.122 .
序列 16 ENSTTSTTD 0.059 .
序列 18 STTSTTDAS 0.526 *T*
序列 19 TTSTTDASD 0.038 .
序列 28 RRDETPSSE 0.983 *T*
序列 42 IHAMTTTTE 0.165 .
序列 43 HAMTTTTEL 0.918 *T*
序列 44 AMTTTTELT 0.673 *T*
序列 45 MTTTTELTR 0.069 .
序列 48 TTELTRPQQ 0.061 .
序列 72 FSDGTTSSG 0.118 .
序列 73 SDGTTSSGE 0.491 .
序列 80 GENFTTVSR 0.055 .
序列 81 ENFTTVSRE 0.331 .
序列 103 NSNGTNQSG 0.010 .
序列 121 RNELTRIGE 0.280 .
序列 173 NRMVTTASV 0.528 *T*
序列 174 RMVTTASVQ 0.484 .
序列 190 EAKITAWQT 0.138 .
序列 194 TAWQTAKVA 0.936 *T*
序列 244 AMEKTQNKV 0.497 .
序列 261 ERRATAEGK 0.951 *T*
序列 268 GKRGTEVAR 0.769 *T*
实施例38:鉴定用于修饰如SEQ ID NO:199所代表的多肽序列的预测位点
多肽的翻译后修饰,通常在特定位点上的多肽的翻译后修饰一般是重要的,但不是必需的对这些多肽的生物学功能的绝对要求。然而,鉴定预测的翻译后修饰位点可以有助于更好地理解目的多肽参与细胞的生物学。
38.1SUMO基序的鉴定
苏素化是类似于遍在蛋白化的蛋白质翻译后修饰作用,SUMO(小型遍 在蛋白样调节物)与底物蛋白中赖氨酸残基的可逆共价结合改变了与SUMO缀合的蛋白质的特性。然而,与遍在蛋白相反,SUMO缀合作用一般不导致底物降解;反而,苏素化协调对众多不同生物学过程的一系列不同影响,所述的生物学过程包括蛋白质定位和稳定性、转录活性、胞核-胞质信号作用和运输、以及基因组复制,以及基因表达的调节和病毒繁殖。
可以使用特定算法如ExPASy服务器上的SUMOplot预测推定的苏素化位点。大部分SUMO修饰的蛋白质含有四肽基序B-K-x-D/E,其中B是疏水性残基,K是与SUMO缀合的赖氨酸,x是任意氨基酸(aa),D或E是酸性残基。
将SEQ ID NO:199的Remorin多肽提交至SUMOplot算法时,预测到苏素化位点位于181位置处的Lys(或K),如下文所示。
编号 | 位置 | 组 | 评分 |
1 | K181 | ASVQR VKRE EVEAK | 0.93 |
1 MLTLYGQERS PENSTTSTTD ASDRRDETPS SEIVVRDIHA MTTTTELTRP
51 QQRGSGGGYL SPSRSIAFSD GTTSSGENFT TVSREFNALV IAGSSMDNNS
101 NGTNQSGGHR DVIRDERNEL TRIGENDDVG DHGQVPEEDS NPWAIVPDDY
151 NNRDGSENNI VLASSGGQNR MVTTASVQRV KREEVEAKIT AWQTAKVAKI
201 NNRFKRQDAV INGWLNEQVH RANSWMKKIE RKLEDRRAKA MEKTQNKVAK
251 AQRKAEERRA TAEGKRGTEV ARVLEVANLM RAVGRPPAKR SFFSLS
38.2 PEST基序的鉴定
PEST序列存在于众多迅速降解的蛋白质中。已经提出这些序列起到蛋白水解性降解的信号作用。算法PESTFind(维护于EmbNet)搜索12个或更多个氨基酸的亲水区,其中所述亲水区含有至少一个P(脯氨酸)、一个E(谷氨酸)或D(天冬氨酸)和一个S(丝氨酸)或T(苏氨酸),侧翼分布有K(赖氨酸),R(精氨酸)或H(组氨酸)残基。该算法对发现的每个可能PEST序列赋予一个评分。评分的范围是-50至+50,大于零的评分指示可能的PEST区,而大于+5的值具有特殊意义。使用该算法,发现在氨基酸位置9-24处的预测PEST基序,疏水指数是28.64。低疏水性提示该区域可能是蛋白酶可接近的表面或提示用于与其他蛋白质(如分子伴侣、运输蛋白或蛋白水解体系的组分)的蛋白质-蛋白质相互作用。
MLTLYGQERSPENSTTSTTDASDRRDETPSSEIVVRDIHAMTTTTELTRP 50
+++++++++++++++ -----------
QQRGSGGGYLSPSRSIAFSDGTTSSGENFTTVSREFNALVIAGSSMDNNS 100
NGTNQSGGHRDVIRDERNELTRTGENDDVGDHGQVPEEDSNPWAIVPDDY 150
-------------------
NNRDGSENNIVLASSGGQNRMVTTASVQRVKREEVEAKITAWQTAKVAKI 200
--
NNRFKRQDAVINGWLNEQVHRANSWMKKIERKLEDRRAKAMEKTQNKVAK 250
AQRKAEERRATAEGKRGTEVARVLEVANLMRAVGRPPAKRSFFSLS 296
++++++可能的PEST序列
------差的PEST序列
潜在的PEST序列:
----------------------------------------------------------
9 RSPENSTTSTTDASDR 24
PEDST的摩尔份数:63.24
疏水指数 :28.64
PEST-FIND评分 :+20.46
------------------------------------------------
实施例39:克隆如SEQ ID NO:198所代表的核酸序列
除非另外说明,重组DNA技术根据(Sambrook(2001)MolecularCloning:a laboratory manual,第3版Cold Spring Harbor LaboratoryPress,CSH,New York)或Ausubel等(1994),Current Protocols inMolecular Biology,Current Protocols第1卷和第2卷中描述的标准方案进行。用于植物分子研究工作的标准材料和方法在BIOS科学出版有限责任公司(BIOS Scientific Publications Ltd(英国))和Blackwell科学出版社(Blackwell Scientific Publications(英国))出版的R.D.D.Croy的PlantMolecular Biology Labfax(1993)中描述。
使用从mRNA合成的拟南芥属植物cDNA库作为模板通过PCR扩增拟南芥Remorin基因,其中所述mRNA从混合的植物组织提取。包含用于Gateway重组的AttB位点的引物prm09186(SEQ ID NO:327;有义:5’-GGGGACAAGTTTGTACAAAAAAGCAGGCTTAAACAATGTTGACTTTGTACGGTCAA-3’)和引物prm09187SEQ ID NO:328;反义互补的:
5’-GGGGACCACTTTGTACAAGAAAGCTGGGTAGCTTAGCTAGGAAAGAGAGAA-3’)用于PCR扩增。使用Hifi Taq DNA聚合酶在标准条件下进行PCR。还使用标准方法扩增并纯化预期长度的PCR片段(包括attB位点)。随后进行Gateway方法的第一步骤,即BP反应,在该步骤期间PCR片段与pDONR201质粒发生体内重组,以产生根据Gateway命名的“进入克隆”。质粒pDONR201作为技术的部分从Invitrogen购买。
实施例40:使用如SEQ ID NO:198所代表的核酸序列构建表达载体
包含SEQ ID NO:198的进入克隆随后与用于稻转化的一种终端载体在LR反应中一起使用。这种载体在T-DNA边界内含有植物选择标记;可筛选的标记表达盒和旨在使LR与已克隆入所述进入克隆的目的核酸序列体内重组的Gateway盒作为功能性元件。用于组成型表达的稻GOS2启动子(SEQ ID NO:329)位于这种Gateway盒上游。也用于组成型表达的另一种启动子-高速泳动族B(HMGB;SEQ ID NO:330)位于该Gateway盒上游。
在LR重组步骤后,所得表达载体pGOS2::Remorin和pHMGB::Remorin(图21)根据本领域熟知的方法转化至农杆菌菌株LBA4044。
实施例41:植物转化
稻转化
独立地使用含有所述表达载体的农杆菌来转化稻植物。将稻粳型栽培品种Nipponbare的成熟干燥种子脱壳。通过如下方式实施消毒:在70%乙醇中孵育1分钟,随后在0.2%HgCl2中孵育30分钟,随后用无菌蒸馏水洗涤6次15分钟。无菌的种子随后在含有2,4-D的培养基(愈伤组织诱导培养基)上萌发。在黑暗中孵育4周后,将小盾片衍生的胚发生的愈伤组织切下并在相同的培养基上增殖。2周后,将愈伤组织通过在同一种培养基上传代培养另外2周进行繁殖或增殖。胚发生的愈伤组织片在新鲜培养基上传代培养3日,随后共培育(以助长细胞分裂活性)。
将含有每一种表达载体的农杆菌菌株LBA4404独立地用于共培育。农杆菌接种在含有适宜抗生素的AB培养基上并在28℃培养3日。随后收集细菌并在液体共培育培养基中悬浮至密度(OD600)约1。该悬液随后转移至培养皿内并将所述愈伤组织浸没于此悬液内15分钟。该愈伤组织随后在滤纸上蘸干并转移至固化的共培育培养基,并在25℃于黑暗中孵育3日。共培育的愈伤组织在含2,4-D的培养基上在28℃于黑暗中在选择剂存在下培育4周。在此期间,迅速生长的抗性愈伤组织团发育。将这种材料转移至再生培养基并在光照下孵育后,胚发生潜能得到释放并且苗在随后4至5周内发育。将苗从愈伤组织上切下并且在含有植物生长素的培养基上孵育2至3周,将苗从所述培养基转移至土壤。在温室中于高湿度和短日照下生长硬化的苗。
对于每一构建体,产生大约35个独立的T0稻转化体。将原代转化体从组织培养箱转移至温室。在定量PCR分析验证T-DNA插入物的拷贝数后,仅保留针对所述选择剂显示抗性的单拷贝转基因植物用于收获T1种子。种子随后在移栽后3至5个月收获。该方法以超过50%的比例产生单基因座转化体(Aldemita和Hodges1996,Chan等1993,Hiei等1994)。
实施例42:表型评价方法
42.1评价建立
产生大约35个独立的T0稻转化体。原代转化体从组织培养箱转移至温室以生长并收获T1种子。留下下述6个事件,其中所述事件的T1后代对所述转基因的存在/不存在以3∶1比例分离。对于这些事件中的每一个,通过监测目视标记表达而选出大约10株含有该转基因的T1籽苗(杂合子和纯合子)和大约10株缺少该转基因的T1籽苗(失效合子)。转基因植物和对应的失效合子于随机位置并排培育。温室条件是短日照(12小时光照),在光照下28℃和在黑暗中22℃以及相对湿度70%。
植物从播种期至成熟期数次通过数字成像室。在每个时间点上,从至少6个不同角度拍摄每株植物的数字图像(2048x1536像素,1600万颜色)。
氮使用效率筛选
来自T2种子的稻植物在盆栽土壤中在正常条件下培育,除了营养液不是正常条件之外。花钵从移植至成熟一直用氮(N)含量降低、通常降低7-8倍的特定营养液浇灌。其余培育过程(植物成熟、种子收获)与不在非生物胁迫下培育的植物相同。生长和产量参数如对正常条件下生长所述那样记录。
盐胁迫筛选
植物在由椰子纤维和Argex(比率3∶1)组成的基质上培育。在移植小植物至温室后头2周期间使用正常的营养液。在头两周之后,向所述营养液添加25mM盐(NaCl),直至收获植物。随后测量种子相关参数。
42.2统计分析:F-检验
使用两因素ANOVA(变量分析)作为整体评价植物表型特征的统计模型。对于用本发明基因转化的全部事件的全部植物的全部所测量参数实施F检验。实施F检验以检查该基因对全部转化事件的影响并验证该基因的整体作用(又称作基因总体作用)。真实基因总体作用显著性的阈值对于F检验设置在5%概率水平上。显著性F检验值指出基因作用,意指不仅仅是基因的存在或位置才造成表型上的差异。
42.3测量的参数
生物量相关的参数测量
植物从播种期至成熟期数次通过数字成像室。在每个时间点上,从至少6个不同角度拍摄每株植物的数字图像(2048x1536像素,1600万颜色)。
植物地上部分面积(或叶生物量)通过计数来自植物地上部分的数字图像上区别于背景的像素总数而确定。该值对相同时间点上从不同角度拍摄的画面进行平均化并且转化成通过校正以平方mm表述的物理表面值。实验显示以这种方式测量的植物地上部分面积与植物地上部分的生物量相关。T地上部分面积是植物已经实现其最大叶生物量的时间点上所测量的面积。早期生长势是萌发后3周的植物(籽苗)地上部分的面积。根生物量的增加表述为根总生物量的增加(测量为植物寿命期间观察到的根最大生物量);或根生物量的增加表述为根总生物量的增加(测量为植物寿命期间观察到的根最大生物量)。
种子相关参数测量
将成熟的原发花序收获、计数、装袋、加条形码标记并且随后在干燥箱内于37°干燥3日。随后将所述花序脱粒,并且收集和计数全部种子。充实粒使用吹气装置与空粒分开。弃去空粒并且再次计数剩余部分。充实粒在分析天平上称重。充实种子数通过计数所述分离步骤后保留的充实粒数目加以确定。每株植物的种子总重量通过称量从一株植物收获的全部充实粒而测量。每株植物的种子总数通过计数从一株植物收获的壳数目测量。从计数的充实种子数及其总重量外推出千粒核重(TKW)。收获指数(HI)在本发明中定义为种子总产量与地上部分面积(mm2)之间的比率,乘以系数106。如本发明中定义的每花序的总花数是种子总数与成熟原发花序数目之间的比率。如本发明中定义的种子充实率是充实种子数对种子(或小花)总数的比例(表述为%)。
实施例43:转基因稻植物的表型评价的结果
下文描述评价表达如SEQ ID NO:199所代表的Remorin核酸序列的转基因稻植物的结果,其中所述的Remorin核酸序列处在用于组成型表达的GOS2启动子控制下。
如表V中所示,与相应的失效合子(对照)相比较,转基因植物的种子充实率、每株植物的种子总产量、充实种子总数、种子总数、千粒核重(TKW)和收获指数显著提高。
表V:评价在GOS2启动子控制下表达如SEQ ID NO:199所代表的Remorin核酸序列的转基因稻植物的结果。
T1世代的平均提高率% | |
种子充实率 | 10% |
每株植物的种子总产量 | 19% |
充实种子总数 | 15% |
种子总数 | 5% |
TKW | 3% |
收获指数 | 21% |
下文描述评价表达如SEQ ID NO:199所代表的Remorin核酸序列的转基因稻植物的结果,其中所述的Remorin核酸序列处在用于组成型表达的HMGB启动子控制下。
如表W中所示,与相应的失效合子(对照)相比较,转基因植物的种子充实率、每株植物的种子总产量、充实种子总数、种子总数、千粒核重(TKW)和收获指数显著提高。
表W:评价在HMGB启动子控制下表达如SEQ ID NO:199所代表的Remorin核酸序列的转基因稻植物的结果。
T1世代的平均提高率% | |
种子充实率 | 6% |
每株植物的种子总产量 | 14% |
充实种子总数 | 14% |
种子总数 | 7% |
TKW | 1% |
收获指数 | 12% |
实施例44:转基因稻植物的表型评价的结果
编码如SEQ ID NO:203,SEQ ID NO:217,SEQ ID NO:227,SEQ IDNO:229,SEQ ID NO:233和SEQ ID NO:241所代表的Remorin多肽的核酸序列置于组成型启动子控制下,并转化至稻内。相对于对照植物,在转基因稻植物中观察到增强的产量相关性状,如下表X中所示。
表X:在转基因植物中观察到的增强的产量相关性状总结,其中所述转基因植物表达在组成型启动子控制下的编码Remorin多肽的核酸序列。
转基因稻植物显示千粒核重的显著提高(整体提高超过5%、p-值0.0000),其中所述的转基因稻植物在用于组成型表达的GOS2启动子控制下表达如SEQ ID NO:233所代表的Remorin核酸序列并且在氮含量降低的营养液上生长。此外,在几个事件中,观察到以下一个或多个指标提高:种子总数、充实种子数、种子总重、根冠比和早期生长势。
实施例45:转化其他作物的例子
谷物转化
玉米(Zea mays)的转化用Ishida等(1996.Nature Biotech 14(6):745-50)所述方法的改良方法进行。在谷物中,转化是基因型依赖的并且仅特定基因型对于转化和再生是服从的。杂交系A188(明尼苏达大学)或以A188作为亲本的杂交体是用于转化的供体材料的良好来源,不过其他基因型也可以成功地使用。谷穗在授粉后大约11日(DAP)从谷物植物收获,此时不成熟胚的长度是大约1-1.2mm。不成熟的胚与含有所述表达载体的根癌农杆菌共培育,并且转基因植物通过器官发生过程回收。切下的胚在愈伤组织诱导培养基上、随后在玉米再生培养基上生长,其中所述的培养基含有选择剂(例如咪唑啉酮,不过可以使用不同的选择标记)。培养板在25℃于光照下孵育2-3周,或直至苗发育。将源自每个胚的绿色苗转移至玉米生根培养基并在25℃孵育2-3周,直至根发育。将生根的苗移植至温室中的土壤内。从针对所述选择剂显示耐受性并且含有单拷贝T-DNA插入物的植物产生T1种子。
小麦转化
小麦的转化用Ishida等(1996)Nature Biotech 14(6):745-50描述的方法进行。栽培品种Bobwhite(可从墨西哥CIMMYT获得)通常在转化中使用。不成熟的胚与含有所述表达载体的根癌农杆菌共培育,并且转基因植物通过器官发生过程回收。与农杆菌孵育后,所述胚在愈伤组织诱导培养基上、随后在再生培养基上体外培育,其中所述的培养基含有选择剂(例如咪唑啉酮,不过可以使用多种选择标记)。培养板在25℃于光照下孵育2-3周,或直至苗发育。将源自每个胚的绿色苗转移至生根培养基并在25℃孵育2-3周,直至根发育。将生根的苗移植至温室中的土壤内。从针对所述选择剂显示耐受性并且含有单拷贝T-DNA插入物的植物产生T1种子。
大豆转化
大豆根据对Texas A&M美国专利5,164,310中所述方法的改良方法转化。几个商业大豆品种对于通过这种方法的转化是可操作的。栽培品种Jack(从Illinois种子基金会可获得)通常用于转化。对大豆种子消毒以便体外播种。下胚轴、胚根和一片子叶从7日龄年幼籽苗中切下。进一步培育上胚轴和剩余子叶以使辅助节发育。将这些辅助节切下并与含有所述表达载体的根癌农杆菌孵育。在共培育处理之后,洗涤外植体并转移至选择培养基。切下再生的苗并置于苗伸长培养基上。将长度不超过1cm的苗置于生根培养基上直至根发育。生根的苗移植至温室中的土壤内。从针对所述选择剂显示耐受性并且含有单拷贝T-DNA插入物的植物产生T1种子。
油菜籽/卡诺拉油菜转化
使用5-6日龄年幼籽苗的子叶柄和下胚轴作为用于组织培养的外植体并且根据Babic等(1998,Plant Cell Rep 17:183-188)进行转化。商业栽培品种Westar(Agriculture Canada)是用于转化的标准品种,不过其他品种也可以使用。对卡诺拉油菜种子进行表面消毒以体外播种。从所述体外籽苗切下附带子叶的子叶叶柄外植体,并且通过将此叶柄外植体的切口末端浸入细菌悬液以(含有所述表达载体的)农杆菌接种。该外植体随后在23℃,16小时光照下于含有3mg/lBAP、3%蔗糖、0.7%植物琼脂的MSBAP-3培养基上培养2日。与农杆菌共培育2日后,将所述叶柄外植体转移至含有3mg/l BAP、头孢噻肟、羧苄青霉素或特美汀(300mg/l)的MSBAP-3培养基上培养7日,并且随后在含有头孢噻肟、羧苄青霉素或特美汀和选择剂的MSBAP-3培养基上培养,直至苗再生。当苗长度是5-10mm时,切下这些苗并转移至苗伸长培养基(MSBAP-0.5,含有0.5mg/l BAP)。将长度大约2cm的苗转移至生根培养基(MS0)用于根诱导。生根的苗移植至温室中的土壤内。从针对所述选择剂显示耐受性并且含有单拷贝T-DNA插入物的植物产生T1种子。
苜蓿转化
使用(McKersie等,1999 Plant Physiol 119:839-847)的方法转化苜蓿的再生性克隆。苜蓿的再生和转化是基因型依赖性的并且因而需要再生性植物。已经描述了获得再生性植物的方法。例如,这些再生性植物可以选自栽培品种Rangelander(Agriculture Canada)或如Brown DCW和AAtanassov(1985.Plant Cell Tissue Culture 4:111-112)所述的任何其他商业苜蓿品种。备选地,已经选择RA3品种(威斯康星大学)用于组织培养(Walker等,1978 Am J Bot 65:654-659)。叶柄外植体与含有所述表达载体的根癌农杆菌C58C1 pMP90(McKersie等,1999 Plant Physiol119:839-847)或LBA4404的过夜培养物共培育。所述外植体在黑暗中于含有288mg/L Pro、53mg/L硫代脯氨酸、4.35g/L K2S04和100μm乙酰丁香酮的SH诱导培养基上共培育3日。所述外植体在浓度减半的Murashige-Skoog培养基(Murashige和Skoog,1962)中洗涤并铺种在不含乙酰丁香酮而含有合适选择剂和抑止农杆菌生长的合适抗生素的相同SH诱导培养基上。几周后,将体细胞胚转移至不含生长调节剂、不含抗生素和含有50g/L蔗糖的BOi2Y发育培养基中。体细胞胚随后在浓度减半的Murashige-Skoog培养基上萌发。生根的籽苗移植至花钵内并且在温室中培育。从针对所述选择剂显示耐受性并且含有单拷贝T-DNA插入物的植物产生T1种子。
棉花转化
使用根癌农杆菌,根据US 5,159,135中所述的方法转化棉花。棉花种子在3%次氯酸钠溶液中持续20分钟进行表面消毒并且在含有500ug/ml头孢噻肟的蒸馏水中洗涤。随后将种子转移至含有50μg/ml苯菌灵的SH-培养基以萌发。将4-6日龄籽苗的下胚轴取出、切成0.5cm的小段并置于0.8%琼脂上。农杆菌悬液(约108个细胞/ml,从用目的基因和合适选择标记转化的过夜培养物稀释)用于接种所述下胚轴外植体。在室温和光照下3日后,将组织转移至含有Murashige和Skoog盐的固体培养基(1.6g/l脱乙酰吉兰糖胶),其中所述的Murashige和Skoog盐含有B5维生素(Gamborg等,Exp.Cell Res.50:151-158(1968))、0.1mg/l 2,4-D、0.1mg/l 6-糠氨基嘌呤和750μg/ml MgCL2并含有50-100μg/ml头孢噻肟和400-500μg/ml羧苄青霉素以杀死残余细菌。各个细胞系在2-3个月后分离(每隔4-6周传代培养)并且在用于组织扩增的选择性培养基上进一步培育(30℃,16小时光周期)。转化的组织随后在非选择性培养基上进一步培育2-3月以产生体细胞胚。将长度至少4mm的外观健康胚转移至细蛭石中的含有SH培养基的管内,其中所述的SH培养基补充有0.1mg/l吲哚乙酸、6-糠氨基嘌呤和赤霉酸。所述胚在30℃以16小时光周期培育,并且将2-3叶期的小植株转移至具有蛭石和营养物的花钵内。使植物硬化并随后移至温室以进一步培育。
实施例46:DREB基因和DREB蛋白的鉴定
使用数据库搜索工具如基本局部比对工具(BLAST)(Altschul等(1990)J.Mol.Biol.215:403-410;和Altschul等(1997)Nucleic Acids Res.25:3389-3402),从国家生物技术信息中心(NCBI)的Entrez核苷酸数据库中维护的那些序列当中鉴定到与SEQ ID NO:335相关的(全长cDNA、EST或基因组)序列和/或与SEQ ID NO:336相关的蛋白质序列。使用该程序通过核酸序列或多肽序列与序列数据库比较并且计算匹配的统计显著性来找到序列之间的局部相似性区域。由SEQ ID NO:335编码的多肽用于TBLASTN算法,采用默认设置和过滤程序以忽略低复杂性序列启动。这种分析的结果通过配对比较进行观察,并根据概率评分(E-值)进行评级,其中所述的评分反映特定比对结果因偶然发生的概率(E-值越低,命中的显著性越高)。除了E-值外,比较过程也可以由同一性百分数评分。同一性百分数指两个比较的核酸(或多肽)序列之间在特定长度范围内相同核苷酸(或氨基酸)的数目。在Genbank(是通过NCBI-国家生物技术信息中心可用的NIH遗传序列数据库)中鉴定到的DREB蛋白的例子在表Y1中给出。优选的一组与本发明相关的DREB基因和DREB蛋白在表Y2中给出。显示了GenBank登录号和来源生物。
表Y1.源自不同生物的DREB蛋白序列。
GenBank登录号 | 来源生物 |
AAQ23983 | [稻] |
AAX28960 | [两色蜀黍(Sorghum bicolor)] |
AAX23703 | [多棱大麦(Hordeum vulgare subsp.vulgare)] |
AAX28953 | [多棱大麦] |
ABK55358 | [普通小麦] |
CAG30550 | [苇状羊茅] |
ABK55359 | [普通小麦] |
ABK55360 | [普通小麦] |
AAX57275 | [黑麦草(Lolium perenne)] |
ABK32848 | [黑麦草] |
ABK32847 | [黑麦草] |
NP_001115477639 | (粳型栽培品种组)] |
BAD09739 | [稻(粳型栽培品种组)] |
BAD46703 | [稻(粳型栽培品种组)] |
EAZ09799 | [稻(籼型栽培品种组)] |
AAY32555 | [一粒小麦(Triticum monococcum)] |
AAY32550 | [一粒小麦] |
ABK55363 | [普通小麦] |
AAX14175 | [野生二稜大麦(Hordeum vulgare subsp.spontaneu)] |
AAX23694 | [多棱大麦] |
AAX14155 | [野生二稜大麦] |
AAG59618 | [多棱大麦] |
AAX14163 | [野生二稜大麦] |
AAX14173 | [野生二稜大麦] |
AAX23693 | [多棱大麦] |
AAY32553 | [一粒小麦] |
AAX14165 | [野生二稜大麦] |
BAF36841 | [黑麦草] |
ABK55361 | [普通小麦] |
ABK55362 | [普通小麦] |
AAX14170 | [野生二稜大麦] |
AAX14169 | [野生二造稜大麦] |
AAX14171 | [野生二稜大麦] |
CAJ21277 | [燕麦] |
BAF36837 | [黑麦草] |
BAF36838 | [黑麦草] |
BAF36842 | [黑麦草] |
AAX23712 | [多棱大麦] |
AAY32558 | [一粒小麦] |
AAX23710 | [多棱大麦] |
AAX23713 | [多棱大麦] |
AAY32564 | [一粒小麦] |
AAX23716 | [多棱大麦] |
AAX28956 | [多棱大麦] |
BAF36839 | [黑麦草] |
AAY32554 | [一粒小麦] |
ABK55364 | [普通小麦] |
Os09g0522000 | [稻(粳型栽培品种组)] |
BAF36840 | [黑麦草] |
EAZ09798 | [稻(籼型栽培品种组)] |
BAD09738 | [稻(粳型栽培品种组)] |
Os08g0545400 | [稻(粳型栽培品种组)] |
ABK55369 | [普通小麦] |
ABK55370 | [普通小麦] |
EAZ07868 | [稻(籼型栽培品种组)] |
AAY33832 | [玉米] |
AAY32556 | [一粒小麦] |
AAX23715 | [多棱大麦] |
AAN02488 | [稻] |
ABK55371 | [普通小麦] |
ABA01492 | [多棱大麦] |
AAP83888 | [稻] |
CAJ21278 | [燕麦] |
ABK55367 | [普通小麦] |
ABK55368 | [普通小麦] |
ABK55365 | [普通小麦] |
ABK55366 | [普通小麦] |
ABA01491 | [多棱大麦] |
AAQ98965 | [Schedonorus arundinaceus] |
ABA25904 | [多棱大麦] |
AAY32557 | [一粒小麦] |
BAD66926 | [普通小麦] |
ABK55375 | [普通小麦] |
BAF36843 | [黑麦草] |
CAG23919 | [苇状羊茅] |
ABK55377 | [普通小麦] |
ABK55376 | [普通小麦] |
BAD66925 | [普通小麦] |
AAL35759 | [黑麦] |
CAJ21276 | [燕麦] |
ABK55381 | [普通小麦] |
ABK55382 | [普通小麦] |
BAF36844 | [黑麦草] |
ABK55384 | [普通小麦] |
AAY32552 | [一粒小麦] |
ABA25905 | [多棱大麦] |
ABK55383 | [普通小麦] |
AAY32562 | [一粒小麦] |
ABK55380 | [普通小麦] |
AAX23696 | [多棱大麦] |
AAX28951 | [多棱大麦] |
BAF36846 | [黑麦草] |
ABF59742 | [油棕(Elaeis guineensis)] |
AAX23690 | [多棱大麦] |
ABF59744 | [散尾葵(Dypsis lutescens)] |
ABA01494 | [多棱大麦] |
AAX23689 | [多棱大麦] |
AAL35760 | [黑麦] |
ABK55378 | [普通小麦] |
ABB54457 | [啤酒大麦(Hordeum brevisubulatum)] |
ABF59745 | [椰子(Cocos nucifera)] |
ABB84399 | [普通小麦] |
ABK55387 | [普通小麦] |
ABF59739 | [国王椰子(Ravenea rivularis)] |
ABF59738 | [棕榈(Trachycarpus fortunei)] |
AAX28959 | [两色蜀黍] |
ABF59749 | [针棕榈(Rhapidophyllum hystrix)] |
ABK55390 | [普通小麦] |
ABK55388 | [普通小麦] |
ABK55379 | [普通小麦] |
ABF59737 | [小箬棕(Sabal minor)] |
ABF59736 | [箬棕(Sabal palmetto)] |
ABK55355 | [普通小麦] |
AAX28966 | [普通小麦] |
EAZ24170 | [稻(粳型栽培品种组)] |
ABF59748 | [针棕榈] |
AAX28961 | [普通小麦] |
ABK55385 | [普通小麦] |
ABK55372 | [普通小麦] |
ABK55386 | [普通小麦] |
EAY87059 | [稻(籼型栽培品种组)] |
AAX23709 | [多棱大麦] |
AAX28955 | [多棱大麦] |
AAY32560 | [一粒小麦] |
BAE17131 | [多毛番茄(Lycopersicon hirsutum)] |
EAZ35676 | [稻(粳型栽培品种组)] |
AAX28952 | [多棱大麦] |
AAL35761 | [黑麦] |
AAS00621 | [小盐芥(Thellungiella salsuginea)] |
AAZ22480 | [Capsicum annuum var.annuum] |
ABK55373 | [普通小麦] |
AAX23698 | [多棱大麦] |
AAR88363 | [牛角椒(Capsicum annuum)] |
AAX23700 | [多棱大麦] |
AAR35030 | [荠菜(Capsella bursa-pastoris)] |
AAX28963 | [普通小麦] |
AAR26658 | [荠菜] |
AAZ20446 | [Malusxdomestica] |
AAR20499 | [欧洲油菜] |
ABK55356 | [普通小麦] |
ABK55357 | [普通小麦] |
ABE96792 | [葡萄(Vitis vinifera)] |
AAX23686 | [多棱大麦] |
ABK55354 | [普通小麦] |
ABC86564 | [普通小麦] |
EAY95226 | [稻(籼型栽培品种组)] |
AAS77819 | [番茄] |
ABD63908 | [白菜型油菜(Brassica rapa subsp.chinensis)] |
AAX23720 | [多棱大麦] |
ABK55389 | [普通小麦] |
AAW58104 | [河岸葡萄(Vitis riparia)] |
AAY32551 | [一粒小麦] |
AAY43213 | [巴西橡胶树(Hevea brasiliensis)] |
AAC99369 | [拟南芥] |
AAZ57434 | [马兰(Iris lactea var.chinensis)] |
ABG38530 | [黄瓜(Cucumis sativus)] |
AAC99371 | [拟南芥] |
AAS77820 | [番茄] |
AAP83325 | [稻(粳型栽培品种组)] |
AAR20500 | [欧洲油菜] |
AAD45623 | [欧洲油菜] |
AAM18960 | [欧洲油菜] |
ABE66241 | [拟南芥] |
CAH10191 | [苇状羊茅] |
ABK28752 | [拟南芥] |
AAV80413 | [拟南芥] |
AAG43549 | [烟草(烟草)] |
ABI93900 | [拟南芥] |
AAP83936 | [陆地棉(Gossypium hirsutum)] |
ABD14412 | [拟南芥] |
AAM18959 | [欧洲油菜] |
ABD42992 | [拟南芥] |
AAR20498 | [欧洲油菜] |
AAS77821 | [番茄] |
AAY43345 | [大白菜(Brassica rapa subsp.pekinensis)] |
ABD65969 | [烟草] |
ABM21468 | [荠菜] |
AAR11858 | [欧洲油菜] |
ABA42927 | [Arabis pumila] |
AAM18958 | [欧洲油菜] |
ABC79627 | [毛白杨(Populus tomentosa)] |
AAR20497 | [欧洲油菜] |
AAV80414 | [拟南芥] |
AAV80415 | [拟南芥] |
ABD65473 | [陆地棉] |
AAY21899 | [拟南芥] |
CAA18178 | [拟南芥] |
CAB81358 | [拟南芥] |
AAQ98869 | [陆地棉] |
ABK55374 | [普通小麦] |
AAQ02702 | [甘蓝(Brassica oleracea)] |
AAG43548 | [烟草] |
Os06g0165600 | [稻(粳型栽培品种组)] |
BAD27123 | [甜樱桃(Prunus avium)] |
AAL38242 | [欧洲油菜] |
ABB51638 | [冈尼桉(Eucalyptus gunnii)] |
表Y2.本发明相关的优选DREB基因和DREB蛋白
描述 | 核苷酸(Nt)/蛋白质 | 来源物种 | SEQ ID NO: |
(PROT) | |||
Os09g0522200 | Nt | [稻(粳型栽培品种组)] | 335 |
Os09g0522200 | PROT | [稻(粳型栽培品种组)] | 336 |
Os08g0545500 | Nt | [稻(粳型栽培品种组)] | 351 |
Os08g0545500 | PROT | [稻(粳型栽培品种组)] | 352 |
Os09g0522100 | Nt | [稻(粳型栽培品种组)] | 353 |
Os09g0522100 | PROT | [稻(粳型栽培品种组)] | 354 |
Os08g0545400 | Nt | [稻(粳型栽培品种组)] | 355 |
Os08g0545400 | PROT | [稻(粳型栽培品种组)] | 356 |
Os06g0165600 | Nt | [稻(粳型栽培品种组)] | 357 |
Os06g0165600 | PROT | [稻(粳型栽培品种组)] | 358 |
Os09g0522000 | Nt | [稻(粳型栽培品种组)] | 359 |
Os09g0522000 | PROT | [稻(粳型栽培品种组)] | 360 |
Os02g0677300 | Nt | [稻(粳型栽培品种组)] | 361 |
Os02g0677300 | PROT | [稻(粳型栽培品种组)] | 362 |
Os06g0127100 | Nt | [稻(粳型栽培品种组)] | 363 |
Os06g0127100 | PROT | [稻(粳型栽培品种组)] | 364 |
OsDREB1B | Nt | [稻(籼型栽培品种组)] | 365 |
OsDREB1B | PROT | [稻(籼型栽培品种组)] | 366 |
ZmCBF1 | Nt | [玉米] | 367 |
ZmCBF1 | PROT | [玉米] | 368 |
ZmCBF2 | Nt | [玉米] | 369 |
ZmCBF2 | PROT | [玉米] | 370 |
ZmCBF3 | Nt | [玉米] | 371 |
ZmCBF3 | PROT | [玉米] | 372 |
ZmDREB1 | Nt | [玉米] | 373 |
ZmDREB1 | PROT | [玉米] | 374 |
ZmDREB1B | Nt | [玉米] | 375 |
ZmDREB1B | PROT | [玉米] | 376 |
TaCBF1 | Nt | [普通小麦] | 377 |
TaCBF1 | PROT | [普通小麦] | 378 |
TaCBF2 | Nt | [普通小麦] | 379 |
TaCBF2 | PROT | [普通小麦] | 380 |
TaCBF3 | Nt | [一粒小麦] | 381 |
TaCBF3 | PROT | [一粒小麦] | 382 |
TaCBF4 | Nt | [一粒小麦] | 383 |
TaCBF4 | PROT | [一粒小麦] | 384 |
TaCBF5 | Nt | [一粒小麦] | 385 |
TaCBF5 | PROT | [一粒小麦] | 386 |
DBP3b | Nt | [陆地棉] | 387 |
DBP3b | PROT | [陆地棉] | 388 |
DBP3a | Nt | [陆地棉] | 389 |
DBP3a | PROT | [陆地棉] | 390 |
DREB1A | Nt | [陆地棉] | 391 |
DREB1A | PROT | [陆地棉] | 392 |
DREB1 | Nt | [陆地棉] | 393 |
DREB1 | PROT | [陆地棉] | 394 |
DREB1L | Nt | [陆地棉] | 395 |
DREB1L | PROT | [陆地棉] | 396 |
DREB2a | Nt | [大豆] | 397 |
DREB2a | PROT | [大豆] | 398 |
DREBa | Nt | [大豆] | 399 |
DREBa | PROT | [大豆] | 400 |
DREB2b | Nt | [大豆] | 401 |
DREB2b | PROT | [大豆] | 402 |
DREB3 | Nt | [大豆] | 403 |
DREB3 | PROT | [大豆] | 404 |
DREB | Nt | [大豆] | 405 |
DREB | PROT | [大豆] | 406 |
CBF17 | Nt | [欧洲油菜] | 407 |
CBF16 | PROT | [欧洲油菜] | 408 |
CBF7 | Nt | [欧洲油菜] | 409 |
CBF16 | PROT | [欧洲油菜] | 410 |
CBF7 | Nt | [欧洲油菜] | 411 |
CBF7 | PROT | [欧洲油菜] | 412 |
CBF5 | Nt | [欧洲油菜] | 413 |
CBF5 | PROT | [欧洲油菜] | 414 |
CBF样蛋白 | Nt | [甘蓝] | 415 |
CBF样蛋白 | PROT | [甘蓝] | 416 |
实施例47:相关DREB蛋白的比对
使用来自Vector NTI(Invitrogen)的AlignX进行图24中所示的DREB蛋白的多重比对,其中所述的AlignX基于受欢迎的累进比对Clustal算法(Thompson等(1997)Nucleic Acids Res 25:4876-4882;Chenna等(2003),Nucleic Acids Res 31:3497-3500)。
使用与本发明相关的多肽进行多重序列比对的结果在图24中显示。稻和拟南芥DREB蛋白之间的保守氨基酸在共有序列中显示。相似性最高的区域是对应于AP2结构域和CMIII-4基序的区域。
实施例48:DREB蛋白之间总体同一性百分数的计算
使用现有技术领域可获得的方法之一,即MatGAT(矩阵总体比对工具)软件(BMC Bioinformatics.2003 4:29.MatGAT:使用蛋白质序列或DNA序列产生相似性/同一性矩阵的一项应用,Campanella JJ,Bitincka L,Smalley J;软件由Ledion Bitincka维护)确定在实施本发明方法中有用的全长多肽序列之间的总体相似性和同一性百分数。MatGAT软件对DNA序列或蛋白质序列产生相似性/同一性矩阵,无需数据的预先比对。该程序使用Myers和Miller总体比对算法(空位开口罚分12和空位延伸罚分2)进行一系列配对比对,使用例如Blosum 62(对于多肽而言)计算相似性和同一性并且随后将结果置于距离矩阵内。在分割线下半部分显示序列相似性,和在对角分割线的上半部分显示序列同一性。
比较过程中使用的参数是:
评分矩阵:Blosum62
第一空位:12
延伸空位:2
表Z2中显示在多肽序列的全长范围(不包括部分多肽序列)内的总体相似性和同一性的该软件分析的结果。同一性百分数在对角线以上给出而相似性百分数在对角线以下给出。
拟南芥的旁系同源DREB蛋白之间在完整氨基酸序列范围内的同一性百分数在18.5至86.9%之间变化。在稻旁系同源DREB蛋白之间存在相似范围的序列同一性。拟南芥和稻的DREB蛋白之间的同一性在18.5%至44.5%之间变化。
表Z1:表Z2中蛋白质的描述
DREB蛋白 | 染色体基因座 |
1 | At4g25470 |
2 | At4g36900 |
3 | At5g25810 |
4 | At1g46768 |
5 | At4g25480 |
6 | At3g11020 |
7 | At2g40220 |
8 | At5g05410 |
9 | AT4G25490 |
10 | AT1G7808 |
11 | Os09g0522200 |
12 | Os09g0522100 |
13 | Os09g0522000 |
14 | Os08g0545500 |
15 | Os08g0545400 |
16 | Os06g0165600 |
17 | Os06g0127100 |
18 | Os02g0677300 |
19 | Os01g0968800 |
表Z2:表Z1中所述DREB蛋白的全长范围内的总体相似性和同一性的MatGAT结果
DREB蛋白 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | 11 | 12 | 13 | 14 | 15 | 16 | 17 | 18 | 19 |
1 | 26.9 | 33.5 | 27.3 | 87.1 | 21.5 | 20.7 | 24.2 | 86.6 | 22.8 | 38.6 | 37 | 38.4 | 36 | 35 | 27.3 | 42 | 44.7 | 41.3 | |
2 | 40.3 | 25.8 | 45 | 26.1 | 20 | 20.4 | 22.8 | 25.4 | 18.9 | 21.8 | 25.2 | 25.9 | 20.9 | 24.2 | 19.4 | 29.8 | 24.4 | 26.5 | |
3 | 50 | 40.8 | 25.7 | 34.9 | 25.5 | 23.7 | 22.5 | 33.5 | 23.6 | 31.3 | 28.9 | 32.6 | 29.5 | 28.4 | 24.3 | 33.3 | 29.8 | 32.5 | |
4 | 37.5 | 53.1 | 42.7 | 30.1 | 18.5 | 19.2 | 19.9 | 28.6 | 20.1 | 23.5 | 25.2 | 27.4 | 25.5 | 22.3 | 20.6 | 29.4 | 24.6 | 28.8 | |
5 | 92.6 | 39.8 | 50 | 38.9 | 22.2 | 20.4 | 22.8 | 86.2 | 20.7 | 39.2 | 36.5 | 42 | 37.7 | 35.4 | 30.6 | 44.7 | 45.8 | 42.7 | |
6 | 31.5 | 31.8 | 35.8 | 26.4 | 32.1 | 24 | 52.3 | 23.3 | 20.5 | 19.9 | 19.9 | 22.2 | 20.7 | 20.8 | 19.4 | 20.5 | 19.4 | 19.6 | |
7 | 32 | 29.3 | 35.7 | 25.9 | 32.6 | 37.6 | 24.6 | 21.9 | 22.4 | 17.8 | 22 | 21.6 | 18.5 | 22.6 | 17 | 21.3 | 19.8 | 20.5 | |
8 | 35.8 | 34.4 | 35.1 | 28.8 | 35.4 | 64.2 | 39.3 | 22.8 | 22.6 | 21.4 | 21.6 | 24.4 | 22.5 | 23.3 | 19.4 | 22.8 | 23.1 | 19.7 | |
9 | 90.3 | 40.4 | 50.9 | 39.9 | 90.7 | 33 | 34.5 | 35.4 | 21.6 | 40 | 36 | 43 | 36.5 | 38.9 | 28.6 | 43.5 | 44.9 | 42 | |
10 | 29.6 | 26.9 | 33.2 | 27.5 | 29.6 | 37.4 | 38.3 | 37.7 | 28.1 | 22.1 | 19.8 | 18.6 | 18.2 | 20.9 | 17.3 | 15.8 | 18.7 | 20 | |
11 | 53.4 | 35.3 | 47.1 | 34 | 50.4 | 31.2 | 33.2 | 31.8 | 53.4 | 35 | 53.5 | 49 | 56.3 | 47.8 | 35.6 | 42.4 | 43.1 | 37.8 | |
12 | 54.1 | 40.7 | 45.5 | 33.7 | 53.3 | 32.1 | 33.8 | 33.4 | 50 | 32 | 65.9 | 46.8 | 47.1 | 49.6 | 35.3 | 40.9 | 39.5 | 39.5 | |
13 | 58.3 | 37.2 | 49.5 | 35.3 | 61.5 | 30.9 | 32 | 32.1 | 61.9 | 27.5 | 60.5 | 59.8 | 49 | 44.9 | 34.9 | 46.3 | 41.9 | 37.9 | |
14 | 55.8 | 33.9 | 47 | 35.9 | 53 | 33 | 30.8 | 35.1 | 51.8 | 31.1 | 68.9 | 62.9 | 59.8 | 47.2 | 35.9 | 43 | 40.2 | 36.9 | |
15 | 50.4 | 37.2 | 46.3 | 33.1 | 49.2 | 30.6 | 31.7 | 33.4 | 51.2 | 35.6 | 61.2 | 65.9 | 56.2 | 62.9 | 50.7 | 40.3 | 42.4 | 34.5 | |
16 | 41.5 | 32.4 | 40.3 | 27.3 | 43.5 | 32.1 | 32.3 | 31.1 | 41.5 | 29.3 | 49 | 49.8 | 46.2 | 49.8 | 60.9 | 31 | 31.7 | 29.9 | |
17 | 58.3 | 40.2 | 52.3 | 38.3 | 59.3 | 31.5 | 32.9 | 32.5 | 60.7 | 26 | 52.5 | 52.4 | 58.3 | 51 | 54.1 | 39.5 | 50 | 38.8 | |
18 | 64.3 | 41.5 | 52.2 | 33.9 | 62.1 | 29.7 | 32.3 | 31.8 | 60.7 | 32.9 | 55.9 | 52.8 | 58 | 52.2 | 56.6 | 43.9 | 58.9 | 44.2 | |
19 | 56.6 | 42.5 | 51.6 | 37 | 57.5 | 29.1 | 33.8 | 32.1 | 54.3 | 32 | 50 | 48.4 | 53.9 | 47.4 | 49.6 | 40.7 | 51.6 | 58 |
实施例49:鉴定蛋白质中的AP2结构域
蛋白质家族、结构域和位点的集成资源(InterPro)数据库是针对基于文本及基于序列的搜索法的常用特征标识数据库的集成界面。InterPro数据库合并了这些数据库,所述数据库使用不同方法学及不同程度的有关充分表征的蛋白质的生物学信息以获得蛋白质特征标识。合作数据库包括SWISS-PROT、PROSITE、TrEMBL、PRINTS、ProDom和Pfam,Smart和TIGRFAMs。Interpro由英国欧洲生物信息学研究所维护。
如SEQ ID NO:336所代表的多肽序列的InterPro扫描结果呈现于表AA。
表AA:如SEQ ID NO:336所代表的多肽序列的InterPro扫描结果
数据库 | 登录号 | 命中的描述 | e值[结构域的氨基酸位置] |
InterPro | IPR001471 | 发病机理相关的转录因子和ERF | |
PRODOM | PD001423 | Q8LLV0_ORYSA_Q8LLV0; | 5e-15[61-95]T |
PRINTS | PR00367 | ETHRSPELEMNT | 6.9e-05[51-62]T6.9e-05[75-91]T |
GENE3D | G3DSA:3.30.730.10 | 无描述 | 7.7e-15[49-118]T |
PFAM | PF00847 | AP2 | 2.5e-21[48-120]T |
SMART | SM00380 | AP2 | 1.5e-13[50-121]T |
PROFILE | PS51032 | AP2_ERF | 19.664[50-115]T |
实施例50:基因克隆
使用稻籽苗cDNA文库(Invitrogen,Paisley,UK)作为模板通过PCR扩增稻DREB1A基因。在逆转录从籽苗提取的RNA后,将cDNA克隆至pCMV Sport 6.0内。该文库的插入物平均大小是1.5kb,并且原始克隆数是1.59x107cfu。6x1011cfu/ml的第一轮扩增后,测定原始滴度是9.6x105cfu/ml。在提取质粒后,将200ng模板用于50μl PCR混合物中。包含用于Gateway重组的AttB位点的引物prm07441(SEQ ID NO:337;有义:5’-ggggacaagtttgtacaaaaaagcaggcttaaacaatgtgcgggatcaagca-3’)和prm07442(SEQ ID NO:338;反义互补的:5’-ggggaccactttgtacaagaaagctgggtggcaaaattgtacagttgattg-3’)用于PCR扩增。使用Hifi Taq DNA聚合酶在标准条件开展PCR。也使用标准方法扩增并纯化预期大小的PCR片段。随后进行Gateway方法的第一步骤,即BP反应,在此期间该PCR片段在体内与pDONR201质粒重组以产生根据Gateway术语的“进入克隆”。质粒pDONR201从Invitrogen作为技术的一部分购买。
实施例51:载体构建
包含OsDREB基因编码序列的进入克隆随后与用于稻转化的目的载体一起用于LR反应中。该目的载体在T-DNA边界内包含植物选择标记;目视标记表达盒和Gateway盒作为功能性元件,其中所述的Gateway盒意图用于LR体内重组,从而来自所述进入克隆的目的序列以有义方向或反义方向整合。用于组成型表达的稻GOS2启动子(SEQ ID NO:339)位于这个Gateway盒上游。
在LR重组步骤后,将所得表达载体(图26)转化至农杆菌菌株LBA4404内并随后转化至稻植物内。使得转化的稻植物生长并随后检验如实施例48中所述的参数。
实施例52:用下调模式下的OsDREB1A转化的植物的评价方法,所述OsDREB1A处于稻GOS2启动子控制下
产生大约15-20个包含用于OSDREB1A的反向重复序列重组DNA的独立T0稻转化体。原代转化体从组织培养箱转移至温室以生长并收获T1种子。留下下述6个事件,其中所述事件的T1后代对所述转基因的存在/不存在以3∶1比例分离。对于这些事件中的每一个,通过监测目视标记表达而选出大约10株含有该转基因的T1籽苗(杂合子和纯合子)和大约10株缺少该转基因的T1籽苗(失效合子)。所选择的T1植物转移至温室。每株植物接受一个独有的条形码标记以将表型数据清楚无误地与相应的植物联系。所选择的T1植物在直径10cm花钵的土壤内,在以下环境设置中培育:光周期=11.5h,日照强度=30,000lux或更大,昼间温度=28℃或更高,夜间温度=22℃,相对湿度=60-70%。转基因植物和对应的失效合子于随机位置并排培育。植物从播种期至成熟期数次通过数字成像室。在每个时间点上,从至少6个不同角度拍摄每株植物的数字图像(2048x1536像素,1600万颜色)。
氮使用效率筛选
来自T2种子的稻植物在盆栽土壤中在正常条件下培育,除了营养液不是正常条件之外。花钵从移植至成熟一直用氮(N)含量降低、通常降低7-8倍的特定营养液浇灌。其余培育过程(植物成熟、种子收获)与不在非生物胁迫下培育的植物相同。生长和产量参数如对正常条件下生长所述那样记录。
盐胁迫筛选
植物在由椰子纤维和Argex(比率3∶1)组成的基质上培育。在移植小植物至温室后头2周期间使用正常的营养液。在头两周之后,向所述营养液添加25mM盐(NaCl),直至收获植物。随后测量种子相关参数。
植物地上部分面积(或叶生物量)通过计数来自植物地上部分的数字图像上区别于背景的像素总数而确定。该值对相同时间点上从不同角度拍摄的画面进行平均化并且转化成通过校正以平方mm表述的物理表面值。实验显示以这种方式测量的植物地上部分面积与植物地上部分的生物量相关。Areamax是在植物已经达到其最大叶生物量的时间点上的地上部分面积。
将成熟的原发花序收获、计数、装袋、加条形码标记并且随后在干燥箱内于37°干燥3日。随后将所述花序脱粒,并且收集和计数全部种子。充实粒使用吹气装置与空粒分开。在分离后,随后使用市售计数机计数两个种子批次。抛弃空粒。充实粒在分析天平上称重,并且使用数字成像术测量种子的横截面。该方法产生以下一组种子相关参数:
花/每花序是估计植物上每个花序的平均花数目的参数,由种子总数除以第一花序(first panicle)获得该参数。最高花序和垂直比对时与所述最高花序重叠的全部花序被视为第一花序并且手工计数。充实种子数通过计数所述分离步骤后存留的充实粒数目加以确定。种子总产量(种子总重量)通过称量从一株植物收获的全部充实粒而测量。每株植物的种子总数通过计数从一株植物收获的壳数目测量,并且对应于每株植物的小花数目。这些参数以自动方式使用图像分析软件从数字图像衍生并且进行统计分析。各个种子参数(包括宽度,长度,面积,重量)使用定制装置测量,所述的定制装置由组成两个主要组件构成:偶联至软件用于图像分析的称重和成像装置。
使用对非平衡设计校正的两因素ANOVA(变量分析)作为整体评价植物表型特征的统计模型。对于用所述基因转化的全部事件的全部植物的全部所测量参数实施F检验。实施F检验以检查该基因对全部转化事件的影响并验证该基因的整体作用(在本文中又称作“基因总体作用”)。若F检验的值显示该数据是显著的,则结论是存在“基因”作用,意指不仅该基因的存在,而且该基因的位置均引起所述作用。真实基因总体作用显著性的阈值对于F检验设置在5%概率水平上。
为检验一个事件内所述基因的作用,即品系特异性作用,使用来自转基因植物和相应无效植物的数据集合在每个事件内进行t-检验。“无效植物”或“无效分离子”或“失效合子”是按照与转基因植物相同的方式进行处理,但是从中转基因已经分离的植物。无效植物也可以描述为纯合阴性转化植物。用于t检验的显著性的阈值设在10%概率水平上。一些事件的结果可以高于或低于该阈值。这基于下述假设,即一个基因可能仅在基因组的某些位置内具有作用,并且这种位置依赖性作用的出现并非罕见。这种基因作用在本文中又称作“基因的品系作用”。p-值通过将t-值与t-分布比较或备选地通过将F-值与F-分布比较而获得。该p-值随后产生无效假设(即不存在转基因的作用)为正确的概率。
实施例53:测量反义构建体转化体的产量相关参数:
在如上所述分析种子后,本发明人发现与缺少OsDREB1A转基因的植物相比较,用反义OsDREB1A基因构建体转化的植物具有更高的种子产量,所述的种子产量表述为充实种子数、种子总重、种子总数、每株植物的花序数和每花序的花数。此外,与对照籽苗相比较,转基因籽苗显示提高的生长势。p-值显示这种提高是显著性的。
对T1世代植物所获得的结果在表BB中总结,所述结果代表对于全部测试品系的均值:
表BB:评价结果
性状 | 改善的百分数 |
籽苗生长势 | 11% |
种子总产量 | 13% |
充实种子数 | 14% |
每株植物的第一花序数 | 13% |
种子总数 | 14% |
收获指数 | 9% |
实施例54:其他植物物种的转化
谷物转化
玉米(Zea mays)的转化用Ishida等(1996.Nature Biotech 14(6):745-50)所述方法的改良方法进行。在谷物中,转化是基因型依赖的并且仅特定基因型对于转化和再生是服从的。杂交系A188(明尼苏达大学)或以A188作为亲本的杂交体是用于转化的供体材料的良好来源,不过其他基因型也可以成功地使用。谷穗在授粉后大约11日(DAP)从谷物植物收获,此时不成熟胚的长度是大约1-1.2mm。不成熟的胚与含有所述表达载体的根癌农杆菌共培育,并且转基因植物通过器官发生过程回收。切下的胚在愈伤组织诱导培养基上、随后在玉米再生培养基上生长,其中所述的培养基含有选择剂(例如咪唑啉酮,不过可以使用不同的选择标记)。培养板在25℃于光照下孵育2-3周,或直至苗发育。将源自每个胚的绿色苗转移至玉米生根培养基并在25℃孵育2-3周,直至根发育。将生根的苗移植至温室中的土壤内。从针对所述选择剂显示耐受性并且含有单拷贝T-DNA插入物的植物产生T1种子。
小麦转化
小麦的转化用Ishida等(1996)Nature Biotech 14(6):745-50描述的方法进行。栽培品种Bobwhite(可从墨西哥CIMMYT获得)通常在转化中使用。不成熟的胚与含有所述表达载体的根癌农杆菌共培育,并且转基因植物通过器官发生过程回收。与农杆菌孵育后,所述胚在愈伤组织诱导培养基上、随后在再生培养基上体外培育,其中所述的培养基含有选择剂(例如咪唑啉酮,不过可以使用多种选择标记)。培养板在25℃于光照下孵育2-3周,或直至苗发育。将源自每个胚的绿色苗转移至生根培养基并在25℃孵育2-3周,直至根发育。将生根的苗移植至温室中的土壤内。从针对所述选择剂显示耐受性并且含有单拷贝T-DNA插入物的植物产生T1种子。
大豆转化
大豆根据对Texas A&M美国专利5,164,310中所述方法的改良方法转化。几个商业大豆品种对于通过这种方法的转化是可操作的。栽培品种Jack(从Illinois种子基金会可获得)通常用于转化。对大豆种子消毒以便体外播种。下胚轴、胚根和一片子叶从7日龄年幼籽苗中切下。进一步培育上胚轴和剩余子叶以使辅助节发育。将这些辅助节切下并与含有所述表达载体的根癌农杆菌孵育。在共培育处理之后,洗涤外植体并转移至选择培养基。切下再生的苗并置于苗伸长培养基上。将长度不超过1cm的苗置于生根培养基上直至根发育。生根的苗移植至温室中的土壤内。从针对所述选择剂显示耐受性并且含有单拷贝T-DNA插入物的植物产生T1种子。
油菜籽/卡诺拉油菜转化
使用5-6日龄年幼籽苗的子叶柄和下胚轴作为用于组织培养的外植体并且根据Babic等(1998,Plant Cell Rep 17:183-188)进行转化。商业栽培品种Westar(Agriculture Canada)是用于转化的标准品种,不过其他品种也可以使用。对卡诺拉油菜种子进行表面消毒以体外播种。从所述体外籽苗切下附带子叶的子叶叶柄外植体,并且通过将此叶柄外植体的切口末端浸入细菌悬液以(含有所述表达载体的)农杆菌接种。该外植体随后在23℃,16小时光照下于含有3mg/lBAP、3%蔗糖、0.7%植物琼脂的MSBAP-3培养基上培养2日。与农杆菌共培育2日后,将所述叶柄外植体转移至含有3mg/l BAP、头孢噻肟、羧苄青霉素或特美汀(300mg/l)的MSBAP-3培养基上培养7日,并且随后在含有头孢噻肟、羧苄青霉素或特美汀和选择剂的MSBAP-3培养基上培养,直至苗再生。当苗长度是5-10mm时,切下这些苗并转移至苗伸长培养基(MSBAP-0.5,含有0.5mg/lBAP)。将长度大约2cm的苗转移至生根培养基(MS0)用于根诱导。生根的苗移植至温室中的土壤内。从针对所述选择剂显示耐受性并且含有单拷贝T-DNA插入物的植物产生T1种子。
苜蓿转化
使用(McKersie等,1999 Plant Physiol 119:839-847)的方法转化苜蓿的再生性克隆。苜蓿的再生和转化是基因型依赖性的并且因而需要再生性植物。已经描述了获得再生性植物的方法。例如,这些再生性植物可以选自栽培品种Rangelander(Agrieulture Canada)或如Brown DCW和AAtanassov(1985.Plant Cell Tissue Culture 4:111-112)所述的任何其他商业苜蓿品种。备选地,已经选择RA3品种(威斯康星大学)用于组织培养(Walker等,1978 Am J Bot 65:654-659)。叶柄外植体与含有所述表达载体的根癌农杆菌C58C1 pMP90(McKersie等,1999 Plant Physiol119:839-847)或LBA4404的过夜培养物共培育。所述外植体在黑暗中于含有288mg/L Pro、53mg/L硫代脯氨酸、4.35g/L K2S04和100μm乙酰丁香酮的SH诱导培养基上共培育3日。所述外植体在浓度减半的Murashige-Skoog培养基(Murashige和Skoog,1962)中洗涤并铺种在不含乙酰丁香酮而含有合适选择剂和抑止农杆菌生长的合适抗生素的相同SH诱导培养基上。几周后,将体细胞胚转移至不含生长调节剂、不含抗生素和含有50g/L蔗糖的BOi2Y发育培养基中。体细胞胚随后在浓度减半的Murashige-Skoog培养基上萌发。生根的籽苗移植至花钵内并且在温室中培育。从针对所述选择剂显示耐受性并且含有单拷贝T-DNA插入物的植物产生T1种子。
棉花转化
使用根癌农杆菌,根据US 5,159,135中所述的方法转化棉花。棉花种子在3%次氯酸钠溶液中持续20分钟进行表面消毒并且在含有500μg/ml头孢噻肟的蒸馏水中洗涤。随后将种子转移至含有50μg/ml苯菌灵的SH-培养基以萌发。将4-6日龄籽苗的下胚轴取出、切成0.5cm的小段并置于0.8%琼脂上。农杆菌悬液(约108个细胞/ml,从用目的基因和合适选择标记转化的过夜培养物稀释)用于接种所述下胚轴外植体。在室温和光照下3日后,将组织转移至含有Murashige和Skoog盐的固体培养基(1.6g/l脱乙酰吉兰糖胶),其中所述的Murashige和Skoog盐含有B5维生素(Gamborg等,Exp.Cell Res.50:151-158(1968))、0.1mg/l 2,4-D、0.1mg/l 6-糠氨基嘌呤和750μg/ml MgCL2并含有50-100μg/ml头孢噻肟和400-500μg/ml羧苄青霉素以杀死残余细菌。各个细胞系在2-3个月后分离(每隔4-6周传代培养)并且在用于组织扩增的选择性培养基上进一步培育(30℃,16小时光周期)。转化的组织随后在非选择性培养基上进一步培育2-3月以产生体细胞胚。将长度至少4mm的外观健康胚转移至细蛭石中的含有SH培养基的管内,其中所述的SH培养基补充有0.1mg/l吲哚乙酸、6-糠氨基嘌呤和赤霉酸。所述胚在30℃以16小时光周期培育,并且将2-3叶期的小植株转移至具有蛭石和营养物的花钵内。使植物硬化并随后移至温室以进一步培育。
序列表
<110>巴斯福植物科学有限公司
<120>具有增强的产量相关性状和/或提高的非生物胁迫抗性的植物和制备该植物的方法
<130>PF58787
<160>416
<170>PatentIn版本3.3
<210>1
<211>1075
<212>DNA
<213>拟南芥(Arabidopsis thaliana)
<400>1
gtgacggaac cacaagaaga gaagagacca aaaggaggag ccaaaatcct ctctttcttt 60
ggaattaggg tttcctcaaa ggaagtgaac tgaaaatggt cgcggacaag agcaagaagt 120
cgaaaattga agagaaaggc gaagaagaaa acttggagca aatcgacgca gagcttgttc 180
tctcaattga gaagcttcag gagattcaag acgacctcga gaagattaac gaaaaggcca 240
gtgacgaggt cttggaagta gagcagaaat ataacgtgat acggaaacct gtctatgaca 300
agcgcaatga agttatccaa tcgattcctg gcttttggat gactgctttt ttgagtcatc 360
ctgccttagg cgacctcttg actgaagaag accaaaagat ttttaagtac ttgaactctc 420
tggaagtgga ggatgccaaa gatgtgaaat ctggatactc tataactttt cacttcactt 480
caaacccgtt ctttgaggat gccaagctta ccaagacatt tactttcctt gaagaaggaa 540
caacaaaaat cactgcaact cctatcaaat ggaaggaggg caagggcttg ccaaatggag 600
tgaaccatga tgataagaaa ggaaataaac gtgcattgcc agaggagagt ttctttactt 660
ggtttactga tgctcaacat aaggaagatg ctggggatga gattcatgat gaggttgctg 720
atattatcaa ggaagatctc tggtccaacc ctctcaccta cttcaacaat gatgctgatg 780
aagaggattt tgatggagat gatgatggtg acgaagaggg agaagaagac gatgacgatg 840
aagaggagga agatggtgag gaatgatggg agcccaaaga taacacattg ctggcttgct 900
tctataacag atgtgtaaag tttgtgttat gaggttctca attttagcaa tgatgagact 960
aagctttctc ttttggaata tttagtttat ttactatcaa tagctacatt ctgtttgtac 1020
gaaccatgtc atcatccatg tcctaaatct tgccataact acatctgttt ttcgc 1075
<210>2
<211>256
<212>PRT
<213>拟南芥
<400>2
Met Val Ala Asp Lys Ser Lys Lys Ser Lys Ile Glu Glu Lys Gly Glu
1 5 10 15
Glu Glu Asn Leu Glu Gln Ile Asp Ala Glu Leu Val Leu Ser Ile Glu
20 25 30
Lys Leu Gln Glu Ile Gln Asp Asp Leu Glu Lys Ile Asn Glu Lys Ala
35 40 45
Ser Asp Glu Val Leu Glu Val Glu Gln Lys Tyr Asn Val Ile Arg Lys
50 55 60
Pro Val Tyr Asp Lys Arg Asn Glu Val Ile Gln Ser Ile Pro Gly Phe
65 70 75 80
Trp Met Thr Ala Phe Leu Ser His Pro Ala Leu Gly Asp Leu Leu Thr
85 90 95
Glu Glu Asp Gln Lys Ile Phe Lys Tyr Leu Asn Ser Leu Glu Val Glu
100 105 110
Asp Ala Lys Asp Val Lys Ser Gly Tyr Ser Ile Thr Phe His Phe Thr
115 120 125
Ser Asn Pro Phe Phe Glu Asp Ala Lys Leu Thr Lys Thr Phe Thr Phe
130 135 140
Leu Glu Glu Gly Thr Thr Lys Ile Thr Ala Thr Pro Ile Lys Trp Lys
145 150 155 160
Glu Gly Lys Gly Leu Pro Asn Gly Val Asn His Asp Asp Lys Lys Gly
165 170 175
Asn Lys Arg Ala Leu Pro Glu Glu Ser Phe Phe Thr Trp Phe Thr Asp
180 185 190
Ala Gln His Lys Glu Asp Ala Gly Asp Glu Ile His Asp Glu Val Ala
195 200 205
Asp Ile Ile Lys Glu Asp Leu Trp Ser Asn Pro Leu Thr Tyr Phe Asn
210 215 220
Asn Asp Ala Asp Glu Glu Asp Phe Asp Gly Asp Asp Asp Gly Asp Glu
225 230 235 240
Glu Gly Glu Glu Asp Asp Asp Asp Glu Glu Glu Glu Asp Gly Glu Glu
245 250 255
<210>3
<211>3561
<212>DNA
<213>人工序列
<220>
<223>表达盒
<400>3
aatccgaaaa gtttctgcac cgttttcacc ccctaactaa caatataggg aacgtgtgct 60
aaatataaaa tgagacctta tatatgtagc gctgataact agaactatgc aagaaaaact 120
catccaccta ctttagtggc aatcgggcta aataaaaaag agtcgctaca ctagtttcgt 180
tttccttagt aattaagtgg gaaaatgaaa tcattattgc ttagaatata cgttcacatc 240
tctgtcatga agttaaatta ttcgaggtag ccataattgt catcaaactc ttcttgaata 300
aaaaaatctt tctagctgaa ctcaatgggt aaagagagag atttttttta aaaaaataga 360
atgaagatat tctgaacgta ttggcaaaga tttaaacata taattatata attttatagt 420
ttgtgcattc gtcatatcgc acatcattaa ggacatgtct tactccatcc caatttttat 480
ttagtaatta aagacaattg acttattttt attatttatc ttttttcgat tagatgcaag 540
gtacttacgc acacactttg tgctcatgtg catgtgtgag tgcacctcct caatacacgt 600
tcaactagca acacatctct aatatcactc gcctatttaa tacatttagg tagcaatatc 660
tgaattcaag cactccacca tcaccagacc acttttaata atatctaaaa tacaaaaaat 720
aattttacag aatagcatga aaagtatgaa acgaactatt taggtttttc acatacaaaa 780
aaaaaaagaa ttttgctcgt gcgcgagcgc caatctccca tattgggcac acaggcaaca 840
acagagtggc tgcccacaga acaacccaca aaaaacgatg atctaacgga ggacagcaag 900
tccgcaacaa ccttttaaca gcaggctttg cggccaggag agaggaggag aggcaaagaa 960
aaccaagcat cctccttctc ccatctataa attcctcccc ccttttcccc tctctatata 1020
ggaggcatcc aagccaagaa gagggagagc accaaggaca cgcgactagc agaagccgag 1080
cgaccgcctt ctcgatccat atcttccggt cgagttcttg gtcgatctct tccctcctcc 1140
acctcctcct cacagggtat gtgcctccct tcggttgttc ttggatttat tgttctaggt 1200
tgtgtagtac gggcgttgat gttaggaaag gggatctgta tctgtgatga ttcctgttct 1260
tggatttggg atagaggggt tcttgatgtt gcatgttatc ggttcggttt gattagtagt 1320
atggttttca atcgtctgga gagctctatg gaaatgaaat ggtttaggga tcggaatctt 1380
gcgattttgt gagtaccttt tgtttgaggt aaaatcagag caccggtgat tttgcttggt 1440
gtaataaagt acggttgttt ggtcctcgat tctggtagtg atgcttctcg atttgacgaa 1500
gctatccttt gtttattccc tattgaacaa aaataatcca actttgaaga cggtcccgtt 1560
gatgagattg aatgattgat tcttaagcct gtccaaaatt tcgcagctgg cttgtttaga 1620
tacagtagtc cccatcacga aattcatgga aacagttata atcctcagga acaggggatt 1680
ccctgttctt ccgatttgct ttagtcccag aatttttttt cccaaatatc ttaaaaagtc 1740
actttctggt tcagttcaat gaattgattg ctacaaataa tgcttttata gcgttatcct 1800
agctgtagtt cagttaatag gtaatacccc tatagtttag tcaggagaag aacttatccg 1860
atttctgatc tccattttta attatatgaa atgaactgta gcataagcag tatteatttg 1920
gattattttt tttattagct ctcacccctt cattattctg agctgaaagt ctggcatgaa 1980
ctgtcctcaa ttttgttttc aaattcacat cgattatcta tgcattatcc tcttgtatct 2040
acctgtagaa gtttcttttt ggttattcct tgactgcttg attacagaaa gaaatttatg 2100
aagctgtaat cgggatagtt atactgcttg ttcttatgat tcatttcctt tgtgcagttc 2160
ttggtgtagc ttgccacttt caccagcaaa gttcatttaa atcaactagg gatatcacaa 2220
gtttgtacaa aaaagcaggc ttcacaatgg tcgcggacaa gagcaagaag tcgaaaattg 2280
aagagaaagg cgaagaagaa aacttggagc aaatcgacgc agagcttgtt ctctcaattg 2340
agaagcttca ggagattcaa gacgacctcg agaagattaa cgaaaaggcc agtgacgagg 2400
tcttggaagt agagcagaaa tataacgtga tacggaaacc tgtctatgac aagcgcaatg 2460
aagttatcca atcgattcct ggcttttgga tgactgcttt tttgagtcat cctgccttag 2520
gcgacctctt gactgaagaa gaccaaaaga tttttaagta cttgaactct ctggaagtgg 2580
aggatgccaa agatgtgaaa tctggatact ctataacttt tcacttcact tcaaacccgt 2640
tctttgagga tgccaagctt accaagacat ttactttcct tgaagaagga acaacaaaaa 2700
tcactgcaac tcctatcaaa tggaaggagg gcaagggctt gccaaatgga gtgaaccatg 2760
atgataagaa aggaaataaa cgtgcattgc cagaggagag tttctttact tggtttactg 2820
atgctcaaca taaggaagat gctggggatg agattcatga tgaggttgct gatattatca 2880
aggaagatct ctggtccaac cctctcacct acttcaacaa tgatgctgat gaagaggatt 2940
ttgatggaga tgatgatggt gacgaagagg gagaagaaga cgatgacgat gaagaggagg 3000
aagatggtga ggaatgatgg gacccagctt tcttgtacaa agtggtgata tcacaagccc 3060
gggcggtctt ctagggataa cagggtaatt atatccctct agatcacaag cccgggcggt 3120
cttctacgat gattgagtaa taatgtgtca cgcatcacca tgggtggcag tgtcagtgtg 3180
agcaatgacc tgaatgaaca attgaaatga aaagaaaaaa agtactccat ctgttccaaa 3240
ttaaaattca ttttaacctt ttaataggtt tatacaataa ttgatatatg ttttctgtat 3300
atgtctaatt tgttatcatc cgggcggtct tctagggata acagggtaat tatatccctc 3360
tagacaacac acaacaaata agagaaaaaa caaataatat taatttgaga atgaacaaaa 3420
ggaccatatc attcattaac tcttctccat ccatttccat ttcacagttc gatagcgaaa 3480
accgaataaa aaacacagta aattacaagc acaacaaatg gtacaagaaa aacagttttc 3540
ccaatgccat aatactcgaa c 3561
<210>4
<211>51
<212>DNA
<213>人工序列
<220>
<223>引物:prm1505
<400>4
ggggacaagt ttgtacaaaa aagcaggctt cacaatggtc gcggacaaga g 51
<210>5
<211>48
<212>DNA
<213>人工序列
<220>
<223>引物:prm1506
<400>5
ggggaccact ttgtacaaga aagctgggtc ccatcattcc tcaccatc 48
<210>6
<211>1101
<212>DNA
<213>烟草(Nicotiana tabacum)
<400>6
agcggctggt accggtccgg aattcccggg atatcgtcga cccacgcgtc cgaaagaaga 60
gaaaaagatg ggtgctgaca aagggaagaa gcaaaaagtg gaggaagaga acaacaccat 120
tgatggtgag ctcgtttttt ccattgaaaa attgcaagaa atacaagacg agctcgagaa 180
gatcaatgag gaagcaagtg ataaagtatt ggaagtggaa cagaagtaca atgagatccg 240
caagcctgtc tatgacaaac gaaacgacat cattaaagct atcccggact tctggttgac 300
tgcttttttg agtcatcctg tcctaggtga acttctaact gaagaagacc aaaagatctt 360
caagtttcta agttctattg aagttgaaga ctctaaagat gtgaagtcgg gctactcgat 420
aacctttaac ttcaatgcga atccttattt tgaaaataca aagctcacaa agacctatac 480
cttccttgaa gatggaccca caaagatttc tgctacaaca ataaaatgga aagaaggcat 540
gggcattcct aatggatttg cacatgagaa gaaaggaaac aagcgatctc atgctgagga 600
aagcttcttc acatggttca gtgaagtcaa tcaaaaagat gaggatgagg atgaggccct 660
agagattcag gatgaggtcg ctgacataat taaggatgac ttgtggccga accctctcac 720
ctattttaac aacgagcctg atgaagaaga ttttgatggt gacgagggaa aggacagtga 780
aggctctgaa gacgaagagg aagaagaaga ggaggatgag gatggtgatg aagaatgaag 840
gcagtaaact gttcaagacc cctattttgg gatctcgtct tcagcggttt taatcatcag 900
ggtttaatgt ctgtaaagag gctttgaatg ttgccaaaga acagaataac tgtggtgact 960
ataccttttc ttctcttgta tggttataac ttataagcaa aatatctaat tccggaggtt 1020
ccaaaatgtt ttcattaggc tagttcgatt aatgaagtgt ttgtctggca aaaactgata 1080
atgttaggtt attgagttat g 1101
<210>7
<211>256
<212>PRT
<213>烟草
<400>7
Met Gly Ala Asp Lys Gly Lys Lys Gln Lys Val Glu Glu Glu Asn Asn
1 5 10 15
Thr Ile Asp Gly Glu Leu Val Phe Ser Ile Glu Lys Leu Gln Glu Ile
20 25 30
Gln Asp Glu Leu Glu Lys Ile Asn Glu Glu Ala Ser Asp Lys Val Leu
35 40 45
Glu Val Glu Gln Lys Tyr Asn Glu Ile Arg Lys Pro Val Tyr Asp Lys
50 55 60
Arg Asn Asp Ile Ile Lys Ala Ile Pro Asp Phe Trp Leu Thr Ala Phe
65 70 75 80
Leu Ser His Pro Val Leu Gly Glu Leu Leu Thr Glu Glu Asp Gln Lys
85 90 95
Ile Phe Lys Phe Leu Ser Ser Ile Glu Val Glu Asp Ser Lys Asp Val
100 105 110
Lys Ser Gly Tyr Ser Ile Thr Phe Asn Phe Asn Ala Asn Pro Tyr Phe
115 120 125
Glu Asn Thr Lys Leu Thr Lys Thr Tyr Thr Phe Leu Glu Asp Gly Pro
130 135 140
Thr Lys Ile Ser Ala Thr Thr Ile Lys Trp Lys Glu Gly Met Gly Ile
145 150 155 160
Pro Asn Gly Phe Ala His Glu Lys Lys Gly Asn Lys Arg Ser His Ala
165 170 175
Glu Glu Ser Phe Phe Thr Trp Phe Ser Glu Val Asn Gln Lys Asp Glu
180 185 190
Asp Glu Asp Glu Ala Leu Glu Ile Gln Asp Glu Val Ala Asp Ile Ile
195 200 205
Lys Asp Asp Leu Trp Pro Asn Pro Leu Thr Tyr Phe Asn Asn Glu Pro
210 215 220
Asp Glu Glu Asp Phe Asp Gly Asp Glu Gly Lys Asp Ser Glu Gly Ser
225 230 235 240
Glu Asp Glu Glu Glu Glu Glu Glu Glu Asp Glu Asp Gly Asp Glu Glu
245 250 255
<210>8
<211>1061
<212>DNA
<213>烟草
<400>8
tttgtacaaa aaagcaggct ggtaccggtc cggaattccc gggatatcgt cgacccacgc 60
gtccgagaaa ttagcagtta gagacactga gaagcagcag ctctcttcct cagctgctgt 120
gtgcttaggc aaagaataaa atgggggcag acaaagggaa gaagcagaaa gtggatgagg 180
aaaacaacaa tgttattgat gaaaagctca ttttttccat tgaaaaattg caagagatac 240
aagacgagct cgagaagatc aatgaaaaag caagcgacga agtgttggaa gtagaacaga 300
agtacaacga gatccgcaag cctgtctacg ataagcgaaa tgatgtcatt agctctattt 360
ctgacttctg gttgactgct tttttgagtc atcctgttct tggtaacctt ctcactgaag 420
aggaccaaaa gattttcaaa tttgtaagtt ctattgaagt ggaagactca aaggatgtga 480
aatcgggtca ttcaatcacg tttaacttta agcccaatcc ttattttgaa aattcaaagc 540
tctcaaagac gtataccttc cttgaagatg gacctacaaa aattacagct acaacaataa 600
aatggaaaga aggcatgggc attcctaatg gagttgctga caagaagaaa ggaaacaagc 660
ggtcccacgc tgaagaaagt ttctttacat ggttcagtga agtcaatcaa aaaggtgatg 720
tggatgatga cgaaaatgag attctggaca ttcaggatga tgaggttgct gaaataatca 780
aggatgactt gtggcctaac cctctcaatt attttgacca tgagcctgat gaagaagata 840
ttgagggcga tgagggaaag gacagcggag gctctgaaga ggaagaagaa gaggaagatg 900
atgaagatga agaagacgaa tgaactgttg gtagaccttg tgtttgattt gagttctcat 960
cagtgtttca atcatcagag ttggtctctg taaagaggtt tcggatattg cagaaaaatt 1020
gaatgacata tagtggtgac tctaattttt agtttcagtg a 1061
<210>9
<211>260
<212>PRT
<213>烟草
<400>9
Met Gly Ala Asp Lys Gly Lys Lys Gln Lys Val Asp Glu Glu Asn Asn
1 5 10 15
Asn Val Ile Asp Glu Lys Leu Ile Phe Ser Ile Glu Lys Leu Gln Glu
20 25 30
Ile Gln Asp Glu Leu Glu Lys Ile Asn Glu Lys Ala Ser Asp Glu Val
35 40 45
Leu Glu Val Glu Gln Lys Tyr Asn Glu Ile Arg Lys Pro Val Tyr Asp
50 55 60
Lys Arg Asn Asp Val Ile Ser Ser Ile Ser Asp Phe Trp Leu Thr Ala
65 70 75 80
Phe Leu Ser His Pro Val Leu Gly Asn Leu Leu Thr Glu Glu Asp Gln
85 90 95
Lys Ile Phe Lys Phe Val Ser Ser Ile Glu Val Glu Asp Ser Lys Asp
100 105 110
Val Lys Ser Gly His Ser Ile Thr Phe Asn Phe Lys Pro Asn Pro Tyr
115 120 125
Phe Glu Asn Ser Lys Leu Ser Lys Thr Tyr Thr Phe Leu Glu Asp Gly
130 135 140
Pro Thr Lys Ile Thr Ala Thr Thr Ile Lys Trp Lys Glu Gly Met Gly
145 150 155 160
Ile Pro Asn Gly Val Ala Asp Lys Lys Lys Gly Asn Lys Arg Ser His
165 170 175
Ala Glu Glu Ser Phe Phe Thr Trp Phe Ser Glu Val Asn Gln Lys Gly
180 185 190
Asp Val Asp Asp Asp Glu Asn Glu Ile Leu Asp Ile Gln Asp Asp Glu
195 200 205
Val Ala Glu Ile Ile Lys Asp Asp Leu Trp Pro Asn Pro Leu Asn Tyr
210 215 220
Phe Asp His Glu Pro Asp Glu Glu Asp Ile Glu Gly Asp Glu Gly Lys
225 230 235 240
Asp Ser Gly Gly Ser Glu Glu Glu Glu Glu Glu Glu Asp Asp Glu Asp
245 250 255
Glu Glu Asp Glu
260
<210>10
<211>1210
<212>DNA
<213>苜蓿(Medicago sativa)
<220>
<221>misc_reature
<222>(1014)..(1014)
<223>n是a,c,g,或t
<400>10
ggcacgagca aaaccctaac acttccctca ttcacgctcg aagaaaagaa cacaaatctc 60
tccactgcgc tagggtttga aacccaacac cttctgtttc ttcaaccatg gtggccgaca 120
agtctaagaa gttgaaagtt tctgaaaagg gtgaaaacgc tgaagagatc gacggagaac 180
ttgttctctc cattgaaaag ttgcaggaaa ttcaagatga gattgaaaag atcaatgagg 240
aggctagcga taaagttctc gaaatagagc agaagtacaa tgaagtaagg aaaccggtgt 300
atgacaagcg caatgatgtg atcaagtcca ttcccgattt ctggctaact gcgtttttga 360
gccatcctgt tcttggtgat ctcttgaatg aagaagatca gaagatattt aagcatttaa 420
tctctcttga ggtggaagat cataaagatg ttaaatcagg ctattcaatc acatttaact 480
tcgactccaa tccctttttt gaggattcaa aacttgttaa gacttttacc ttccttgaag 540
aaggaaccac aaagcttacc gccacaccca taaaatggaa agagggcaag ggcattccca 600
atggagttat tcatgagaag aaagggaaca agcgagctgc ttctgatatc agtttcttta 660
cctggttttg tgacactgag cagaaagatg aaatgggtga cattcatgat gagattgctg 720
aaatgatcaa ggatgattta tggccgaatc cactcaatta tttcaacagt gaggaccctg 780
atgaagcaga ggaggaggat gatgaagctg gtgatgcggg aaaggatgat gatgactctg 840
aagatgatga tgatcaagag gatgacgacg atgacgagga agaagaatag tgtaaaatgc 900
tttaaaatag taatacttgg ttttaattta tttattttaa ggttattata ggagtatctt 960
agtggtcttt aggggatgat gaaagaccaa ggttggctat tggttttccc cctntgggcg 1020
taaaccttat ttattgtgct ttgaaggtga tttctggttt tatctttgtg cgcttctttc 1080
aagataccaa tgatacatcg gattttatct tagtcctata ttgaaaccat atagtagtta 1140
aaatgtagta tattcagtgt atagctgcgt aatcagtatc attttattgc tatcacaact 1200
ttacagtacc 1210
<210>11
<211>260
<212>PRT
<213>苜蓿
<400>11
Met Val Ala Asp Lys Ser Lys Lys Leu Lys Val Ser Glu Lys Gly Glu
1 5 10 15
Asn Ala Glu Glu Ile Asp Gly Glu Leu Val Leu Ser Ile Glu Lys Leu
20 25 30
Gln Glu Ile Gln Asp Glu Ile Glu Lys Ile Asn Glu Glu Ala Ser Asp
35 40 45
Lys Val Leu Glu Ile Glu Gln Lys Tyr Asn Glu Val Arg Lys Pro Val
50 55 60
Tyr Asp Lys Arg Asn Asp Val Ile Lys Ser Ile Pro Asp Phe Trp Leu
65 70 75 80
Thr Ala Phe Leu Ser His Pro Val Leu Gly Asp Leu Leu Asn Glu Glu
85 90 95
Asp Gln Lys Ile Phe Lys His Leu Ile Ser Leu Glu Val Glu Asp His
100 105 110
Lys Asp Val Lys Ser Gly Tyr Ser Ile Thr Phe Asn Phe Asp Ser Asn
115 120 125
Pro Phe Phe Glu Asp Ser Lys Leu Val Lys Thr Phe Thr Phe Leu Glu
130 135 140
Glu Gly Thr Thr Lys Leu Thr Ala Thr Pro Ile Lys Trp Lys Glu Gly
145 150 155 160
Lys Gly Ile Pro Asn Gly Val Ile His Glu Lys Lys Gly Asn Lys Arg
165 170 175
Ala Ala Ser Asp Ile Ser Phe Phe Thr Trp Phe Cys Asp Thr Glu Gln
180 185 190
Lys Asp Glu Met Gly Asp Ile His Asp Glu Ile Ala Glu Met Ile Lys
195 200 205
Asp Asp Leu Trp Pro Asn Pro Leu Asn Tyr Phe Asn Ser Glu Asp Pro
210 215 220
Asp Glu Ala Glu Glu Glu Asp Asp Glu Ala Gly Asp Ala Gly Lys Asp
225 230 235 240
Asp Asp Asp Ser Glu Asp Asp Asp Asp Gln Glu Asp Asp Asp Asp Asp
245 250 255
Glu Glu Glu Glu
260
<210>12
<211>907
<212>DNA
<213>玉米(Zea mays)
<400>12
gttcctacct tcttccctcc gtctcccagc tcgcgcaggc aggcgacaca gcgacgctaa 60
aaaccctaga gcgaggaggc gtgccaggcc agcggtttgc gatgacggca ccggcggaca 120
aggggaagaa ggccaagacc gatgccgacg gcggcgagga gaacgagcaa atcgacggcg 180
cccttgtctt ctccatcgag aagctccagg agattcagga cgagctcgag aaggttaatg 240
aggaagcaag tgacaaggtt atggaggtgg agcagaaata cagtgagatt cgcagacctg 300
tctatctcaa gaggggtgac attatcaaga ccatcccgga cttttggctc acagcgtttt 360
tgagccatcc tctactaagt gagcttctga ctgaagagga tcagaagata ttcaagtact 420
tggactccat tgatgtcgat gattctgatg ttaaggcagg atattccatt taccttaact 480
tctctgagaa cccgtacttt gaagacacaa agcttacaaa gacctattcc tttgttgatg 540
atggaacaac cacaataaaa gcttctcaaa ttaagtggaa ggatggaatg ggacctgcaa 600
atggaaatgg tattaacaag aagggaaaca agcggccatt agtagtggaa agttttttct 660
cctggtttag tgatacagag ctcaagagtc ttgctgatgg tgtgcaagat gaggtggcgg 720
agatcatcaa ggaagacttg tggcctaatc ctttgaagta cttcaacaat gaggttgaag 780
atgaatttga aggagatgaa gaagatgatg acgacgacga cgacgatgat aatttggatg 840
gtgatgacaa tgacgatgat ggggaccagg agaactgagc cctcgcgttt aggcggggaa 900
ttatgtg 907
<210>13
<211>258
<212>PRT
<213>玉米
<400>13
Met Thr Ala Pro Ala Asp Lys Gly Lys Lys Ala Lys Thr Asp Ala Asp
1 5 10 15
Gly Gly Glu Glu Asn Glu Gln Ile Asp Gly Ala Leu Val Phe Ser Ile
20 25 30
Glu Lys Leu Gln Glu Ile Gln Asp Glu Leu Glu Lys Val Asn Glu Glu
35 40 45
Ala Ser Asp Lys Val Met Glu Val Glu Gln Lys Tyr Ser Glu Ile Arg
50 55 60
Arg Pro Val Tyr Leu Lys Arg Gly Asp Ile Ile Lys Thr Ile Pro Asp
65 70 75 80
Phe Trp Leu Thr Ala Phe Leu Ser His Pro Leu Leu Ser Glu Leu Leu
85 90 95
Thr Glu Glu Asp Gln Lys Ile Phe Lys Tyr Leu Asp Ser Ile Asp Val
100 105 110
Asp Asp Ser Asp Val Lys Ala Gly Tyr Ser Ile Tyr Leu Asn Phe Ser
115 120 125
Glu Asn Pro Tyr Phe Glu Asp Thr Lys Leu Thr Lys Thr Tyr Ser Phe
130 135 140
Val Asp Asp Gly Thr Thr Thr Ile Lys Ala Ser Gln Ile Lys Trp Lys
145 150 155 160
Asp Gly Met Gly Pro Ala Asn Gly Asn Gly Ile Asn Lys Lys Gly Asn
165 170 175
Lys Arg Pro Leu Val Val Glu Ser Phe Phe Ser Trp Phe Ser Asp Thr
180 185 190
Glu Leu Lys Ser Leu Ala Asp Gly Val Gln Asp Glu Val Ala Glu Ile
195 200 205
Ile Lys Glu Asp Leu Trp Pro Asn Pro Leu Lys Tyr Phe Asn Asn Glu
210 215 220
Val Glu Asp Glu Phe Glu Gly Asp Glu Glu Asp Asp Asp Asp Asp Asp
225 230 235 240
Asp Asp Asp Asn Leu Asp Gly Asp Asp Asn Asp Asp Asp Gly Asp Gln
245 250 255
Glu Asn
<210>14
<211>780
<212>DNA
<213>稻(Oryza sativa)
<400>14
atggcggcgg cggagcagaa ggggaagaag ccgaggaccg acggcgcgga ggccgagccc 60
gtcgacgccg ccctgctgca gtccatcgag aagctccagg agatccagga cgagatcgag 120
aaggttaatg aggaagcatg tgataaagtt ctggagttgg aacagaaata caacgaggtt 180
cgcagaccag tttatgttcg acggaataaa attatcaagc aaattcctga cttctggctg 240
acagcgtttc ttagccatcc tatgcttggt gaactattaa ctgaagatga tcaaaagatt 300
ttcaaacact tggagtctat cgacgtggat gactcagaag atatcaaatc aggctactcc 360
attactctca cattctcccc caatccatat tttgaagata caaagcttac aaaaacatat 420
tcctttagtg acgatgaagc agtcaaagta aaggctacct ccatcaggtg gaagaaagga 480
atggatattg ccaatgatcg tgcgtacacg aagaaagggg acaagcgaat cttaattgat 540
gaaagtttct ttacttggtt caatagtgaa aagaacagaa gttttgctca tggagctatg 600
gatgaggtgg cagatgtcat caaggaagat ctgtggccta atcctttgaa gtacttcaac 660
aatgaatttg aagaagaatt agagctactg gatgacgatg acgaggtatc tgatgatgac 720
gatgaggagg aggatgatga agaccaaggt gaaggagagg aggatggaga ggagaactga 780
<210>15
<211>259
<212>PRT
<213>稻
<400>15
Met Ala Ala Ala Glu Gln Lys Gly Lys Lys Pro Arg Thr Asp Gly Ala
1 5 10 15
Glu Ala Glu Pro Val Asp Ala Ala Leu Leu Gln Ser Ile Glu Lys Leu
20 25 30
Gln Glu Ile Gln Asp Glu Ile Glu Lys Val Asn Glu Glu Ala Cys Asp
35 40 45
Lys Val Leu Glu Leu Glu Gln Lys Tyr Asn Glu Val Arg Arg Pro Val
50 55 60
Tyr Val Arg Arg Asn Lys Ile Ile Lys Gln Ile Pro Asp Phe Trp Leu
65 70 75 80
Thr Ala Phe Leu Ser His Pro Met Leu Gly Glu Leu Leu Thr Glu Asp
85 90 95
Asp Gln Lys Ile Phe Lys His Leu Glu Ser Ile Asp Val Asp Asp Ser
100 105 110
Glu Asp Ile Lys Ser Gly Tyr Ser Ile Thr Leu Thr Phe Ser Pro Asn
115 120 125
Pro Tyr Phe Glu Asp Thr Lys Leu Thr Lys Thr Tyr Ser Phe Ser Asp
130 135 140
Asp Glu Ala Val Lys Val Lys Ala Thr Ser Ile Arg Trp Lys Lys Gly
145 150 155 160
Met Asp Ile Ala Asn Asp Arg Ala Tyr Thr Lys Lys Gly Asp Lys Arg
165 170 175
Ile Leu Ile Asp Glu Ser Phe Phe Thr Trp Phe Asn Ser Glu Lys Asn
180 185 190
Arg Ser Phe Ala His Gly Ala Met Asp Glu Val Ala Asp Val Ile Lys
195 200 205
Glu Asp Leu Trp Pro Asn Pro Leu Lys Tyr Phe Asn Asn Glu Phe Glu
210 215 220
Glu Glu Leu Glu Leu Leu Asp Asp Asp Asp Glu Val Ser Asp Asp Asp
225 230 235 240
Asp Glu Glu Glu Asp Asp Glu Asp Gln Gly Glu Gly Glu Glu Asp Gly
245 250 255
Glu Glu Asn
<210>16
<211>1315
<212>DNA
<213>稻
<400>16
ctccgctctc ctccagctcc gcctccgacg cgcgcacgcc tctccctccc ctcctcctcc 60
gcctcgcctc gcagtgtgga agaaaggaag gaaggctaaa accctagcga gcgcgcgagc 120
gagcgagggc tctctgcttc cttgcgatga cggcgccggc ggacaagggg aagaaggcca 180
agaccgacgc cgacggcggc gccgccgagg agaacgagca gatcgacggc gccctcgtcc 240
tctccatcga gaagctccag gagatccagg acgagctcga gaaggtcaat gaggaagcta 300
gtgacaaggt tttggaggtc gagcagaaat acagtgagat tcgcagacct gtctatctcc 360
gaaggagtga cgttatccaa acaatccccg acttctggct gacagcgttt ctgagtcatc 420
ctctacttag tgagcttttg accgaagagg atcaaaagat gttcaagtac ctggagtctg 480
tcgacgtgga tgattctaaa gatgtcaagt caggctactc cataactctt accttctccg 540
agaacccgta ctttgaagac aaagagctca cgaagacata tgccttcgct gatgacggaa 600
caaccacaat aaatgctact agcattaagt ggaaagaagg aatggaaatt gcaaatggga 660
atgccaagaa gaaagggagc aagcgaccat tggttgagga aagtttcttc acctggttta 720
ctgatacaga gcacaagagt cttgctgatg gtgtgcaaga tgaggtggct gagatcatca 780
aggaagacct gtggcccaat ccattgaagt atttcaataa tgaggctgaa gagttaggag 840
aggatgacga cgaagagggg tctgatgctg atgagggtga agaggatgag gaggaggaga 900
actgagtcta ggatgtcaga ttgcgatggt gccgatcgtc tgcattttgt ggatgctgtc 960
actctgaagg gcgaagttgc gtgaccctcg gttgcttctt tcttttttct ttttgatgac 1020
ttagctggaa cccttaggaa ctgtttaatg ccttatggag tccgtcgtat tttcgactca 1080
aaggagacac ctctatatca taatctgcgt ataaccatgg aagacatttt aacctgctga 1140
tgtgtggttc attgcgctgc ctctggtgct gtagggtgtt cgttcctttg tgctctctgt 1200
cttttttttt tttttttgtg tgtgtgtggt cgcgctggca ttgttgccag tctgatgggc 1260
tgttatttct ccccctagaa agagtgaaaa acctggcttg tgatcattgt ttacg 1315
<210>17
<211>252
<212>PRT
<213>稻
<400>17
Met Thr Ala Pro Ala Asp Lys Gly Lys Lys Ala Lys Thr Asp Ala Asp
1 5 10 15
Gly Gly Ala Ala Glu Glu Asn Glu Gln Ile Asp Gly Ala Leu Val Leu
20 25 30
Ser Ile Glu Lys Leu Gln Glu Ile Gln Asp Glu Leu Glu Lys Val Asn
35 40 45
Glu Glu Ala Ser Asp Lys Val Leu Glu Val Glu Gln Lys Tyr Ser Glu
50 55 60
Ile Arg Arg Pro Val Tyr Leu Arg Arg Ser Asp Val Ile Gln Thr Ile
65 70 75 80
Pro Asp Phe Trp Leu Thr Ala Phe Leu Ser His Pro Leu Leu Ser Glu
85 90 95
Leu Leu Thr Glu Glu Asp Gln Lys Met Phe Lys Tyr Leu Glu Ser Val
100 105 110
Asp Val Asp Asp Ser Lys Asp Val Lys Ser Gly Tyr Ser Ile Thr Leu
115 120 125
Thr Phe Ser Glu Asn Pro Tyr Phe Glu Asp Lys Glu Leu Thr Lys Thr
130 135 140
Tyr Ala Phe Ala Asp Asp Gly Thr Thr Thr Ile Asn Ala Thr Ser Ile
145 150 155 160
Lys Trp Lys Glu Gly Met Glu Ile Ala Asn Gly Asn Ala Lys Lys Lys
165 170 175
Gly Ser Lys Arg Pro Leu Val Glu Glu Ser Phe Phe Thr Trp Phe Thr
180 185 190
Asp Thr Glu His Lys Ser Leu Ala Asp Gly Val Gln Asp Glu Val Ala
195 200 205
Glu Ile Ile Lys Glu Asp Leu Trp Pro Asn Pro Leu Lys Tyr Phe Asn
210 215 220
Asn Glu Ala Glu Glu Leu Gly Glu Asp Asp Asp Glu Glu Gly Ser Asp
225 230 235 240
Ala Asp Glu Gly Glu Glu Asp Glu Glu Glu Glu Asn
245 250
<210>18
<211>958
<212>DNA
<213>玉米
<400>18
ccaaaagggt cacagttccg cctccttttc ctgccttcct cctcactagt cgctcccccg 60
cggctcgcgc aggcgggcga cacaacgagg ctaaatccct atcgcgagga ggcgtgtgag 120
gccagcggct ttgcgatgac agcaccagcg gacaagggga agaaggccaa gactgatgcc 180
gacggcggcg aggagaacga acagatcgac ggcgtcctcg tcctctccat cgagaagctc 240
caggagatac aggacgagct cgagaaggta aatgaggaag caagtgacaa ggttatggag 300
gtggagcaga aatacagtga gatccgcaga cctgtctatc tcaagagggg tgacattatc 360
aagaccatcc cggacttttg gctcacagcg tttatgagcc atcctctatt aagtgagctt 420
ctgactgaag aggaccagaa gatattcaag tacttagact ccattgatgt ggatgattct 480
gatgttaagg caggatactc cattcatctt aacttctctg agaacccgta ctttgaggac 540
acaaagcttg caaagaccta tatctttgct gatgatggaa caaccacaat aaaagcttcc 600
gaaattaagt ggaaggaagg aatgggacct gcaaatggaa atggtattaa caagaagggg 660
agtaagcggc cattagtaga ggaaagtttt tttagctggt ttggtgatac agagctcaag 720
agtcttgctg atggtgtgca agatgaggtg gcggagatca taaaggaaga tttgtggcct 780
aatcctttga agtacttcaa caatgaggtt gacgatgaat ttgaaggaga tgaagatgat 840
gatgatttgg atggtgatga tgacgatgaa ggcgatgatt tggagaactg agcccttgcg 900
cttggttcag aatgttgtcc gtggatgatg tggctgggcg gaactgtgac ccttttgg 958
<210>19
<211>251
<212>PRT
<213>玉米
<400>19
Met Thr Ala Pro Ala Asp Lys Gly Lys Lys Ala Lys Thr Asp Ala Asp
1 5 10 15
Gly Gly Glu Glu Asn Glu Gln Ile Asp Gly Val Leu Val Leu Ser Ile
20 25 30
Glu Lys Leu Gln Glu Ile Gln Asp Glu Leu Glu Lys Val Asn Glu Glu
35 40 45
Ala Ser Asp Lys Val Met Glu Val Glu Gln Lys Tyr Ser Glu Ile Arg
50 55 60
Arg Pro Val Tyr Leu Lys Arg Gly Asp Ile Ile Lys Thr Ile Pro Asp
65 70 75 80
Phe Trp Leu Thr Ala Phe Met Ser His Pro Leu Leu Ser Glu Leu Leu
85 90 95
Thr Glu Glu Asp Gln Lys Ile Phe Lys Tyr Leu Asp Ser Ile Asp Val
100 105 110
Asp Asp Ser Asp Val Lys Ala Gly Tyr Ser Ile His Leu Asn Phe Ser
115 120 125
Glu Asn Pro Tyr Phe Glu Asp Thr Lys Leu Ala Lys Thr Tyr Ile Phe
130 135 140
Ala Asp Asp Gly Thr Thr Thr Ile Lys Ala Ser Glu Ile Lys Trp Lys
145 150 155 160
Glu Gly Met Gly Pro Ala Asn Gly Asn Gly Ile Asn Lys Lys Gly Ser
165 170 175
Lys Arg Pro Leu Val Glu Glu Ser Phe Phe Ser Trp Phe Gly Asp Thr
180 185 190
Glu Leu Lys Ser Leu Ala Asp Gly Val Gln Asp Glu Val Ala Glu Ile
195 200 205
Ile Lys Glu Asp Leu Trp Pro Asn Pro Leu Lys Tyr Phe Asn Asn Glu
210 215 220
Val Asp Asp Glu Phe Glu Gly Asp Glu Asp Asp Asp Asp Leu Asp Gly
225 230 235 240
Asp Asp Asp Asp Glu Gly Asp Asp Leu Glu Asn
245 250
<210>20
<211>1257
<212>DNA
<213>拟南芥
<400>20
agattcacgc atcacacaat cgagttttta gggttttagc ggttgctctc tcggaagcca 60
gagagaagag ggaagaggaa gtctaattcc tctgcgtttt ttgcaattag ggttttctca 120
attggaatcg aaaatggtga cagacaagag caagaaggcg aaaaccgaag aagaaaacgt 180
cgagcaaatc gatgcagagc ttgtcctctc aatcgaaaag cttcaagaga tccaagacga 240
cctcgagaag ataaatgaaa aggctagtga tgaagtgttg gaagtggagc agaaatataa 300
tgtgataagg aaacctgttt atgacaagcg taacgagatc atcaaaacca tccctgattt 360
ctggttaact gctttcttga gtcaccctgc tttaggtgaa cttttgactg aagaagacca 420
aaagattttc aaatatctta gctctcttga tgttgaggat gccaaagatg tgaaatctgg 480
atactctatc actttttcct tcaatcccaa tccatttttt gaagatggaa aactgacaaa 540
gacttttacc tttctcgaag aagggacaac caaaatcaca gccacgccta tcaaatggaa 600
agagggcaaa ggcctggcga atggagtgaa tcatgagaag aatggaaaca aacgtgcact 660
acctgaagag agcttcttta cctggtttag tgatgctcaa cacaaggagg atgttgagga 720
tgagatgcaa gacgagcagg ttgcagatat catcaaggaa gatttgtggc ccaaccctct 780
cacctacttc aacaatgacg ctgatgaaga ggactttgat ggagacgatg atggagatga 840
agaggagaaa gaaggtgact ctgatgaaga tgatgacgaa gaagacgaag ttggtgagga 900
atgatggcag ggatacccag aaaccacatt tgcttacatg tcttctctat aacagagtgt 960
gtaaagtttt gtgtgttgaa aggtttttaa ttttaagcaa aagtggatta tgacgacaac 1020
agacaagctt ttaattttat tttaccgtaa tagttatatc ttgttgtaag aaaccatttt 1080
cagccttttg ttggaaaatc ctgcttaaat ggtttttgag tcttacataa tagcttcttc 1140
atcttttgtc ttcttaaaga gaattatatt tgtaatttca tgtctgttgt gtttctttga 1200
ctttactgaa tagagaattt gtgtgtttat ggtgaaaata tagccgatct gcttgac 1257
<210>21
<211>256
<212>PRT
<213>拟南芥
<400>21
Met Val Thr Asp Lys Ser Lys Lys Ala Lys Thr Glu Glu Glu Asn Val
1 5 10 15
Glu Gln Ile Asp Ala Glu Leu Val Leu Ser Ile Glu Lys Leu Gln Glu
20 25 30
Ile Gln Asp Asp Leu Glu Lys Ile Asn Glu Lys Ala Ser Asp Glu Val
35 40 45
Leu Glu Val Glu Gln Lys Tyr Asn Val Ile Arg Lys Pro Val Tyr Asp
50 55 60
Lys Arg Asn Glu Ile Ile Lys Thr Ile Pro Asp Phe Trp Leu Thr Ala
65 70 75 80
Phe Leu Ser His Pro Ala Leu Gly Glu Leu Leu Thr Glu Glu Asp Gln
85 90 95
Lys Ile Phe Lys Tyr Leu Ser Ser Leu Asp Val Glu Asp Ala Lys Asp
100 105 110
Val Lys Ser Gly Tyr Ser Ile Thr Phe Ser Phe Asn Pro Asn Pro Phe
115 120 125
Phe Glu Asp Gly Lys Leu Thr Lys Thr Phe Thr Phe Leu Glu Glu Gly
130 135 140
Thr Thr Lys Ile Thr Ala Thr Pro Ile Lys Trp Lys Glu Gly Lys Gly
145 150 155 160
Leu Ala Asn Gly Val Asn His Glu Lys Asn Gly Asn Lys Arg Ala Leu
165 170 175
Pro Glu Glu Ser Phe Phe Thr Trp Phe Ser Asp Ala Gln His Lys Glu
180 185 190
Asp Val Glu Asp Glu Met Gln Asp Glu Gln Val Ala Asp Ile Ile Lys
195 200 205
Glu Asp Leu Trp Pro Asn Pro Leu Thr Tyr Phe Asn Asn Asp Ala Asp
210 215 220
Glu Glu Asp Phe Asp Gly Asp Asp Asp Gly Asp Glu Glu Glu Lys Glu
225 230 235 240
Gly Asp Ser Asp Glu Asp Asp Asp Glu Glu Asp Glu Val Gly Glu Glu
245 250 255
<210>22
<211>1003
<212>DNA
<213>番茄(Lycopersicon esculentum)
<400>22
gcgaaatcaa gaaaatcagt taagcagctc tgtaactcag gtgggaaaaa ggcaaaaaat 60
aatggtggtt gacaaaggga agaagcagaa agtggaagag gaaagctaca ttgatgaaaa 120
gctcattttt tccattgaaa aattgcaaga aatacaagac gaccttgaca agatcaatga 180
gaaagcaagt gaggaagtgt tggaaataga acagaagtac aacaagatcc gcaagcctgt 240
ttatgataag cggaatgata tcattaactc tatttctgac ttctggttga ctgctttttt 300
gagtcatcct gttcttggtg accttctaac tgaagaggac caaaagattt tcaaattctt 360
aagttctatt gaagtggaag actcgaaaga tgtgaaattt ggttactcaa tcacgtttaa 420
ctttaagccc aatcctttct ttgaaaattc aaagctctca aagacctata ccttccttga 480
agatggacct acaaaaatca cagctacacc aataaaatgg aaagaaggca aaggcattcc 540
taatggcgtt gctcaggaga agaaaggaaa caagcgatcc catgctgaag agagcttctt 600
cacctggttc agtgaagtca ataaaaaaga tgatagcgat gatgatgaaa atgaggttct 660
ggagattcag gatgaggttg ctgaaataat caaggatgac ttgtggccaa accctttaac 720
ttattttacc aatgaacctg atgaagaaga ttttgagggt gatgaaggtg gtgatgaggg 780
ggaggactct gaagatgaag gtgatgagga ggaagaggaa gacgacgaag atgaagatga 840
caaatgaact gttaatggac ctcatatttg atttgatttc tcttcttcaa tgtttcaatt 900
atcatagttg gtatctgtaa agaagcttaa tattgcagat aaaatcgaat tatatatagt 960
ggtgactgct ttttttctaa aaaaaaaaaa aaaaaaaaaa aaa 1003
<210>23
<211>261
<212>PRT
<213>番茄
<400>23
Met Val Val Asp Lys Gly Lys Lys Gln Lys Val Glu Glu Glu Ser Tyr
1 5 10 15
Ile Asp Glu Lys Leu Ile Phe Ser Ile Glu Lys Leu Gln Glu Ile Gln
20 25 30
Asp Asp Leu Asp Lys Ile Asn Glu Lys Ala Ser Glu Glu Val Leu Glu
35 40 45
Ile Glu Gln Lys Tyr Asn Lys Ile Arg Lys Pro Val Tyr Asp Lys Arg
50 55 60
Asn Asp Ile Ile Asn Ser Ile Ser Asp Phe Trp Leu Thr Ala Phe Leu
65 70 75 80
Ser His Pro Val Leu Gly Asp Leu Leu Thr Glu Glu Asp Gln Lys Ile
85 90 95
Phe Lys Phe Leu Ser Ser Ile Glu Val Glu Asp Ser Lys Asp Val Lys
100 105 110
Phe Gly Tyr Ser Ile Thr Phe Asn Phe Lys Pro Asn Pro Phe Phe Glu
115 120 125
Asn Ser Lys Leu Ser Lys Thr Tyr Thr Phe Leu Glu Asp Gly Pro Thr
130 135 140
Lys Ile Thr Ala Thr Pro Ile Lys Trp Lys Glu Gly Lys Gly Ile Pro
145 150 155 160
Asn Gly Val Ala Gln Glu Lys Lys Gly Asn Lys Arg Ser His Ala Glu
165 170 175
Glu Ser Phe Phe Thr Trp Phe Ser Glu Val Asn Lys Lys Asp Asp Ser
180 185 190
Asp Asp Asp Glu Asn Glu Val Leu Glu Ile Gln Asp Glu Val Ala Glu
195 200 205
Ile Ile Lys Asp Asp Leu Trp Pro Asn Pro Leu Thr Tyr Phe Thr Asn
210 215 220
Glu Pro Asp Glu Glu Asp Phe Glu Gly Asp Glu Gly Gly Asp Glu Gly
225 230 235 240
Glu Asp Ser Glu Asp Glu Gly Asp Glu Glu Glu Glu Glu Asp Asp Glu
245 250 255
Asp Glu Asp Asp Lys
260
<210>24
<211>1557
<212>DNA
<213>拟南芥
<400>24
gtccctagtc tcttctgctt cttcttcttc aaaatctctc tcttcaccaa atcctcagaa 60
gatgagcaac gacaaggata gcttcaacgt ctccgatctt actgctgctc ttaaggacga 120
ggatcgagct ggccttgtca atgctctaaa gaacaagctg cagaatctgg ctggtcagcg 180
ttctgatgtg ctcgagaatc tgactcccaa tgtgagaaag cgcgttgatg ccttgaggga 240
tatacagagc caacatgatg aactagaggc aaaattccgt gaggagagag ctattcttga 300
agccaagtat caaacgctgt atcagccttt gtatgtcaag cgttatgaga ttgtgaatgg 360
cactactgaa gttgaactgg ctccagagga tgataccaag gtggaccaag gagaggagaa 420
aactgcagaa gagaaaggag ttccaagttt ctggctgaca gctctgaaaa ataacgatgt 480
tatttccgag gaggtcacag agcgtgatga aggggctctc aaatatctta aagatattaa 540
gtggtgcaag attgaagagc ctaaaggatt caaacttgag tttttctttg acacgaatcc 600
gtattttaag aacactgtct tgacaaagtc ttatcatatg attgatgaag atgagccact 660
gcttgagaag gctatgggga cagaaattga ttggtatcct ggaaagtgtc taactcagaa 720
gattctcaag aagaagccta agaaaggttc aaagaatact aaaccaatca ccaaactcga 780
agattgtgaa agcttcttca acttctttag tcctccagaa gttccggatg aagatgaaga 840
tatcgacgag gaaagagctg aggatcttca aaacctgatg gaacaagatt atgacatcgg 900
atctactatt cgggaaaaga ttattcctcg tgctgtctca tggtttactg gtgaggctat 960
ggaagcagag gattttgaaa tagatgacga tgaggaagat gacattgatg aggatgaaga 1020
tgaggaagac gaagaggatg aggaggacga tgatgatgag gatgaagaag aaagcaagac 1080
caaaaagaag ccatcaatcg gcaacaagaa gggagggaga tctcagatag ttggtgaagg 1140
taaacaagat gagaggccac ccgaatgcaa gcaacagtaa tcttttacta cgctctacca 1200
gacataaaag gattgcgtga aaatataatt caggtcattc tctgttcatc aagaatgagg 1260
attgagaaaa ggttttggga tttttaaaag tgaaattcat cttgtaggag tttcgttcgt 1320
ttttctattg gtgtgtttat tttctctaaa gcactttaat aatatacctt ggtatttaat 1380
ttatgaatca agcatcatca tccctagtct ctgcattcac tacttcatcc cctacctaaa 1440
ctttgtcgac gaaagagatt ttaataacca tttagatagt aatgggtagt gggaatgatc 1500
attattcttt tgttcaccgt cctttgattt tcaatggtaa ccattttgtt gtgtaag 1557
<210>25
<211>372
<212>PRT
<213>拟南芥
<400>25
Met Ser Asn Asp Lys Asp Ser Phe Asn Val Ser Asp Leu Thr Ala Ala
1 5 10 15
Leu Lys Asp Glu Asp Arg Ala Gly Leu Val Asn Ala Leu Lys Asn Lys
20 25 30
Leu Gln Asn Leu Ala Gly Gln Arg Ser Asp Val Leu Glu Asn Leu Thr
35 40 45
Pro Asn Val Arg Lys Arg Val Asp Ala Leu Arg Asp Ile Gln Ser Gln
50 55 60
His Asp Glu Leu Glu Ala Lys Phe Arg Glu Glu Arg Ala Ile Leu Glu
65 70 75 80
Ala Lys Tyr Gln Thr Leu Tyr Gln Pro Leu Tyr Val Lys Arg Tyr Glu
85 90 95
Ile Val Asn Gly Thr Thr Glu Val Glu Leu Ala Pro Glu Asp Asp Thr
100 105 110
Lys Val Asp Gln Gly Glu Glu Lys Thr Ala Glu Glu Lys Gly Val Pro
115 120 125
Ser Phe Trp Leu Thr Ala Leu Lys Asn Asn Asp Val Ile Ser Glu Glu
130 135 140
Val Thr Glu Arg Asp Glu Gly Ala Leu Lys Tyr Leu Lys Asp Ile Lys
145 150 155 160
Trp Cys Lys Ile Glu Glu Pro Lys Gly Phe Lys Leu Glu Phe Phe Phe
165 170 175
Asp Thr Asn Pro Tyr Phe Lys Asn Thr Val Leu Thr Lys Ser Tyr His
180 185 190
Met Ile Asp Glu Asp Glu Pro Leu Leu Glu Lys Ala Met Gly Thr Glu
195 200 205
Ile Asp Trp Tyr Pro Gly Lys Cys Leu Thr Gln Lys Ile Leu Lys Lys
210 215 220
Lys Pro Lys Lys Gly Ser Lys Asn Thr Lys Pro Ile Thr Lys Leu Glu
225 230 235 240
Asp Cys Glu Ser Phe Phe Asn Phe Phe Ser Pro Pro Glu Val Pro Asp
245 250 255
Glu Asp Glu Asp Ile Asp Glu Glu Arg Ala Glu Asp Leu Gln Asn Leu
260 265 270
Met Glu Gln Asp Tyr Asp Ile Gly Ser Thr Ile Arg Glu Lys Ile Ile
275 280 285
Pro Arg Ala Val Ser Trp Phe Thr Gly Glu Ala Met Glu Ala Glu Asp
290 295 300
Phe Glu Ile Asp Asp Asp Glu Glu Asp Asp Ile Asp Glu Asp Glu Asp
305 310 315 320
Glu Glu Asp Glu Glu Asp Glu Glu Asp Asp Asp Asp Glu Asp Glu Glu
325 330 335
Glu Ser Lys Thr Lys Lys Lys Pro Ser Ile Gly Asn Lys Lys Gly Gly
340 345 350
Arg Ser Gln Ile Val Gly Glu Gly Lys Gln Asp Glu Arg Pro Pro Glu
355 360 365
Cys Lys Gln Gln
370
<210>26
<211>1575
<212>DNA
<213>拟南芥
<400>26
gtgtcttatt tcggtctggt cattttctca aagccctttt agttatttat atatatattc 60
tctgtctcgt atttgtcccc aaaaatctag ggttttaagg tttcttatcc ttcctcttcc 120
tccgccagat tcttttcttg cgaagatgag caacgacaag gacagcatga acatgtccga 180
tctctccacc gctcttaacg aggaggatcg tgccgggctt gttaatgctc ttaagaacaa 240
gttgcagaat ttggctggac aacactctga tgtccttgaa aacttgactc caccagtcag 300
gaagcgtgtc gagtttctaa gagagattca gaaccaatat gatgagatgg aagcaaaatt 360
ctttgaggag agagcagctc ttgaagctaa gtatcaaaag ttatatcagc ctttatatac 420
caagcgatat gagattgtga atggtgtggt cgaagttgaa ggtgcagctg aagaagtaaa 480
atccgaacaa ggagaagata aatcagctga agagaaagga gtaccagatt tctggcttat 540
tgcattgaag aacaatgaaa ttactgcgga agagataact gagcgagatg aaggggctct 600
caagtatctc aaagatatca agtggagtag ggttgaagaa ccaaaagggt tcaagcttga 660
gtttttcttt gatcagaatc cttacttcaa gaacactgtc ttgaccaaga catatcacat 720
gattgatgaa gatgagccta tccttgagaa ggccctcggg acggagattg agtggtatcc 780
tggaaagtgt ttgacacaga agattctaaa aaagaagcca aagaaaggat ccaaaaacac 840
aaagccgatc actaagactg aggactgtga gagtttcttc aactttttca gtccacctca 900
agttcctgac gatgatgagg atcttgatga tgacatggct gatgaactcc aaggacaaat 960
ggagcatgat tatgatatcg gttcaacaat caaagagaaa atcatctcgc atgctgtgtc 1020
atggttcact ggtgaagctg ttgaggcaga tgaccttgat attgaggacg acgatgatga 1080
gattgatgaa gatgatgatg aagaggacga ggaagatgat gaggatgacg aggaggagga 1140
tgatgaggat gatgacgagg aggaagaagc agatcaagga aagaagagca aaaagaagtc 1200
atcagctggg cacaagaagg ctggaagaag tcaacttgcg gaaggtcaag caggtgagag 1260
gccaccggaa tgtaagcagc agtgaagaag tgaagaatct tggcttagtt atgatgaaga 1320
agaagagtga agagtgtctt tgagccgagg ttgtgtttct ttaatttgca gagtcatggt 1380
ccggtttatt atatatcagt tttgggtgat tggtttgcta tttaaaaaaa aaaaatgggt 1440
tctttggttt ggtttgtgtc tcttgatttt tccttttgta atgatcttat gaatttgttt 1500
cgagttaatg tcgttctctg gtcagatttc gaattcaatt ctatttatcc tccctcgtta 1560
atgagagaat ttgtg 1575
<210>27
<211>379
<212>PRT
<213>拟南芥
<400>27
Met Ser Asn Asp Lys Asp Ser Met Asn Met Ser Asp Leu Ser Thr Ala
1 5 10 15
Leu Asn Glu Glu Asp Arg Ala Gly Leu Val Asn Ala Leu Lys Asn Lys
20 25 30
Leu Gln Asn Leu Ala Gly Gln His Ser Asp Val Leu Glu Asn Leu Thr
35 40 45
Pro Pro Val Arg Lys Arg Val Glu Phe Leu Arg Glu Ile Gln Asn Gln
50 55 60
Tyr Asp Glu Met Glu Ala Lys Phe Phe Glu Glu Arg Ala Ala Leu Glu
65 70 75 80
Ala Lys Tyr Gln Lys Leu Tyr Gln Pro Leu Tyr Thr Lys Arg Tyr Glu
85 90 95
Ile Val Asn Gly Val Val Glu Val Glu Gly Ala Ala Glu Glu Val Lys
100 105 110
Ser Glu Gln Gly Glu Asp Lys Ser Ala Glu Glu Lys Gly Val Pro Asp
115 120 125
Phe Trp Leu Ile Ala Leu Lys Asn Asn Glu Ile Thr Ala Glu Glu Ile
130 135 140
Thr Glu Arg Asp Glu Gly Ala Leu Lys Tyr Leu Lys Asp Ile Lys Trp
145 150 155 160
Ser Arg Val Glu Glu Pro Lys Gly Phe Lys Leu Glu Phe Phe Phe Asp
165 170 175
Gln Asn Pro Tyr Phe Lys Asn Thr Val Leu Thr Lys Thr Tyr His Met
180 185 190
Ile Asp Glu Asp Glu Pro Ile Leu Glu Lys Ala Leu Gly Thr Glu Ile
195 200 205
Glu Trp Tyr Pro Gly Lys Cys Leu Thr Gln Lys Ile Leu Lys Lys Lys
210 215 220
Pro Lys Lys Gly Ser Lys Asn Thr Lys Pro Ile Thr Lys Thr Glu Asp
225 230 235 240
Cys Glu Ser Phe Phe Asn Phe Phe Ser Pro Pro Gln Val Pro Asp Asp
245 250 255
Asp Glu Asp Leu Asp Asp Asp Met Ala Asp Glu Leu Gln Gly Gln Met
260 265 270
Glu His Asp Tyr Asp Ile Gly Ser Thr Ile Lys Glu Lys Ile Ile Ser
275 280 285
His Ala Val Ser Trp Phe Thr Gly Glu Ala Val Glu Ala Asp Asp Leu
290 295 300
Asp Ile Glu Asp Asp Asp Asp Glu Ile Asp Glu Asp Asp Asp Glu Glu
305 310 315 320
Asp Glu Glu Asp Asp Glu Asp Asp Glu Glu Glu Asp Asp Glu Asp Asp
325 330 335
Asp Glu Glu Glu Glu Ala Asp Gln Gly Lys Lys Ser Lys Lys Lys Ser
340 345 350
Ser Ala Gly His Lys Lys Ala Gly Arg Ser Gln Leu Ala Glu Gly Gln
355 360 365
Ala Gly Glu Arg Pro Pro Glu Cys Lys Gln Gln
370 375
<210>28
<211>1624
<212>DNA
<213>拟南芥
<400>28
gccacccaga aaaaaccctc aagtcttctt cttcttcctc aatctctcca cctcttttca 60
aaccttcttc acactctctc tcaatcaatc ctttttcttc tcaaatcttt cagttttgat 120
ctctaaattt ccagaaaatg agcaacgata aggacagttt caatgtcagc gatctcactt 180
ctgctcttaa agatgaggat cgagctggtc ttgtcaacgc tcttaagaac aagctccaga 240
atctagctgg acaacattct gatgtgctcg agaatctgac tcctaaaatt agaaggcgtg 300
ttgaggtttt gcgggagatt cagggcaaac atgatgaaat agagacaaaa ttccgcgagg 360
agagagctgc tcttgaagcc aagtatcaaa agttatatca gcctttgtat aacaagcgtt 420
atgagattgt gaatggagct actgaagttg aaggggctcc agaggatgct aagatggacc 480
aaggagacga gaaaactgca gaagagaaag gagtccctag tttctggctg actgctctga 540
aaaataatga tgttatatct gaagagatca cagagcgtga tgaaggagcc cttatatatc 600
ttaaagatat caagtggtgc aagattgaag aaccaaaggg attcaaactt gagtttttct 660
tcgaccagaa tccttacttc aaaaacaccc tattaacaaa ggcgtatcat atgattgatg 720
aagatgagcc tctgcttgag aaggctattg ggacagagat tgattggtat cctggaaaat 780
gcttaactca gaagattctt aagaagaagc ctaagaaagg tgcaaagaat gccaagccaa 840
ttaccaaaac tgaagattgt gaaagcttct tcaacttctt caatcctccc caagttcctg 900
atgatgatga agacattgac gaagaaagag ccgaggaact tcagaatctg atggaacaag 960
attatgacat tggttctaca atccgggaga agatcatacc tcatgctgtc tcatggttta 1020
ctggtgaggc tattgaggga gaggagtttg aaatagacaa tgacgatgaa gatgatatcg 1080
atgaggatga agatgaggat gaagaagatg aagacgaaga tgaggaagaa gacgacgaag 1140
atgaggagga agaagtaagc aagaccaaaa agaagccatc agtcttacac aagaaaggag 1200
ggagacctca ggttaccgat gatcaacaag gagagaggcc tcctgaatgc aaacaacagt 1260
aaacaaaatc gaaaagtcta aacgaaaacc agtaaaagaa aaacaaatgt tttgggtttt 1320
gagtgaagtt tcatggccta gttttttgct tccatgtaag gcaaaatgtt ttgaagactg 1380
ctcataggaa tgttgctgta ggcaaaagag tgagtttctc catgtggaga tacttgataa 1440
attatttttg gtgcatttgt tttttttttt tttaatcact aagttgaatt ttggtgtgtt 1500
cgtcaaaatt atatcttttt accacttgaa ttaagtctct tttggtttct ttaatttaaa 1560
aataaataaa tcttatcatt gttttttttg tgtggacata agtgtattat tcttattgta 1620
aacc 1624
<210>29
<211>374
<212>PRT
<213>拟南芥
<400>29
Met Ser Asn Asp Lys Asp Ser Phe Asn Val Ser Asp Leu Thr Ser Ala
1 5 10 15
Leu Lys Asp Glu Asp Arg Ala Gly Leu Val Asn Ala Leu Lys Asn Lys
20 25 30
Leu Gln Asn Leu Ala Gly Gln His Ser Asp Val Leu Glu Asn Leu Thr
35 40 45
Pro Lys Ile Arg Arg Arg Val Glu Val Leu Arg Glu Ile Gln Gly Lys
50 55 60
His Asp Glu Ile Glu Thr Lys Phe Arg Glu Glu Arg Ala Ala Leu Glu
65 70 75 80
Ala Lys Tyr Gln Lys Leu Tyr Gln Pro Leu Tyr Asn Lys Arg Tyr Glu
85 90 95
Ile Val Asn Gly Ala Thr Glu Val Glu Gly Ala Pro Glu Asp Ala Lys
100 105 110
Met Asp Gln Gly Asp Glu Lys Thr Ala Glu Glu Lys Gly Val Pro Ser
115 120 125
Phe Trp Leu Thr Ala Leu Lys Asn Asn Asp Val Ile Ser Glu Glu Ile
130 135 140
Thr Glu Arg Asp Glu Gly Ala Leu Ile Tyr Leu Lys Asp Ile Lys Trp
145 150 155 160
Cys Lys Ile Glu Glu Pro Lys Gly Phe Lys Leu Glu Phe Phe Phe Asp
165 170 175
Gln Asn Pro Tyr Phe Lys Asn Thr Leu Leu Thr Lys Ala Tyr His Met
180 185 190
Ile Asp Glu Asp Glu Pro Leu Leu Glu Lys Ala Ile Gly Thr Glu Ile
195 200 205
Asp Trp Tyr Pro Gly Lys Cys Leu Thr Gln Lys Ile Leu Lys Lys Lys
210 215 220
Pro Lys Lys Gly Ala Lys Asn Ala Lys Pro Ile Thr Lys Thr Glu Asp
225 230 235 240
Cys Glu Ser Phe Phe Asn Phe Phe Asn Pro Pro Gln Val Pro Asp Asp
245 250 255
Asp Glu Asp Ile Asp Glu Glu Arg Ala Glu Glu Leu Gln Asn Leu Met
260 265 270
Glu Gln Asp Tyr Asp Ile Gly Ser Thr Ile Arg Glu Lys Ile Ile Pro
275 280 285
His Ala Val Ser Trp Phe Thr Gly Glu Ala Ile Glu Gly Glu Glu Phe
290 295 300
Glu Ile Asp Asn Asp Asp Glu Asp Asp Ile Asp Glu Asp Glu Asp Glu
305 310 315 320
Asp Glu Glu Asp Glu Asp Glu Asp Glu Glu Glu Asp Asp Glu Asp Glu
325 330 335
Glu Glu Glu Val Ser Lys Thr Lys Lys Lys Pro Ser Val Leu His Lys
340 345 350
Lys Gly Gly Arg Pro Gln Val Thr Asp Asp Gln Gln Gly Glu Arg Pro
355 360 365
Pro Glu Cys Lys Gln Gln
370
<210>30
<211>990
<212>DNA
<213>拟南芥
<400>30
atgagcaacg aagaaaacat caaatctgat aataagagcg gcgattcctc tgatctccct 60
accattcccg ccttagatat tggggcagag gaatgtgatc ttcttgcaga gcttaaggca 120
agtcacttca aattgttgat aaaaattcac acaaacctaa ccttaaagcg accatttgat 180
gtgaaaaaac tctcacctaa agttaccaaa cgtgttctgt tcctcaaaga cattcaggtt 240
acacacgatg aactcgaaga gaagtttctt gctgagaaat ctgcattgga ggcaacatat 300
gataatctct acaagccgct ttttgctaag aggtatgaaa ttgtgaatgg tgtggtcgaa 360
gctgaagcag agaaagaagg agttcccaat ttctggttga ttgcaatgaa aaccaatgaa 420
atgctcgcaa atgagataac ggaaagagat gaggcagcat tgaagtatct taaggacatc 480
agatcttgca gagttgaaga cacttcaaga aatttcaagc tggagtttct ctttgattct 540
aatctttact tcaagaactc ggttctgtct aaaacttacc atgtgaacga tgaagatggt 600
cctgttcttg agaaagtgat tggaacggac atagaatggt ttccaggtaa atgtttgact 660
cataaggttg ttgtgaagaa gaaaacaaag aaagggccaa agaaggtcaa caacatcccc 720
atgaccaaaa cagaaaactg cgagagtttc ttcaatttct tcaagccacc tgagattcct 780
gagattgatg aagttgacga ttacgatgat tttgatacca ttatgacgga agaactacaa 840
aacctgatgg accaagacta tgacattgct gtgacaatcc gagataaact gatccctcat 900
gcagtttcat ggtttacggg agaggctctt gttgatgaag acgattctga tgataatgat 960
gatgatgata atgatgagaa gagtgactaa 990
<210>31
<211>329
<212>PRT
<213>拟南芥
<400>31
Met Ser Asn Glu Glu Asn Ile Lys Ser Asp Asn Lys Ser Gly Asp Ser
1 5 10 15
Ser Asp Leu Pro Thr Ile Pro Ala Leu Asp Ile Gly Ala Glu Glu Cys
20 25 30
Asp Leu Leu Ala Glu Leu Lys Ala Ser His Phe Lys Leu Leu Ile Lys
35 40 45
Ile His Thr Asn Leu Thr Leu Lys Arg Pro Phe Asp Val Lys Lys Leu
50 55 60
Ser Pro Lys Val Thr Lys Arg Val Leu Phe Leu Lys Asp Ile Gln Val
65 70 75 80
Thr His Asp Glu Leu Glu Glu Lys Phe Leu Ala Glu Lys Ser Ala Leu
85 90 95
Glu Ala Thr Tyr Asp Asn Leu Tyr Lys Pro Leu Phe Ala Lys Arg Tyr
100 105 110
Glu Ile Val Asn Gly Val Val Glu Ala Glu Ala Glu Lys Glu Gly Val
115 120 125
Pro Asn Phe Trp Leu Ile Ala Met Lys Thr Asn Glu Met Leu Ala Asn
130 135 140
Glu Ile Thr Glu Arg Asp Glu Ala Ala Leu Lys Tyr Leu Lys Asp Ile
145 150 155 160
Arg Ser Cys Arg Val Glu Asp Thr Ser Arg Asn Phe Lys Leu Glu Phe
165 170 175
Leu Phe Asp Ser Asn Leu Tyr Phe Lys Asn Ser Val Leu Ser Lys Thr
180 185 190
Tyr His Val Asn Asp Glu Asp Gly Pro Val Leu Glu Lys Val Ile Gly
195 200 205
Thr Asp Ile Glu Trp Phe Pro Gly Lys Cys Leu Thr His Lys Val Val
210 215 220
Val Lys Lys Lys Thr Lys Lys Gly Pro Lys Lys Val Asn Asn Ile Pro
225 230 235 240
Met Thr Lys Thr Glu Asn Cys Glu Ser Phe Phe Asn Phe Phe Lys Pro
245 250 255
Pro Glu Ile Pro Glu Ile Asp Glu Val Asp Asp Tyr Asp Asp Phe Asp
260 265 270
Thr Ile Met Thr Glu Glu Leu Gln Asn Leu Met Asp Gln Asp Tyr Asp
275 280 285
Ile Ala Val Thr Ile Arg Asp Lys Leu Ile Pro His Ala Val Ser Trp
290 295 300
Phe Thr Gly Glu Ala Leu Val Asp Glu Asp Asp Ser Asp Asp Asn Asp
305 310 315 320
Asp Asp Asp Asn Asp Glu Lys Ser Asp
325
<210>32
<211>199
<212>PRT
<213>人工序列
<220>
<223>SEQ ID N0:2的NAP结构域
<400>32
Ile Glu Lys Leu Gln Glu Ile Gln Asp Asp Leu Glu Lys Ile Asn Glu
1 5 10 15
Lys Ala Ser Asp Glu Val Leu Glu Val Glu Gln Lys Tyr Asn Val Ile
20 25 30
Arg Lys Pro Val Tyr Asp Lys Arg Asn Glu Val Ile Gln Ser Ile Pro
35 40 45
Gly Phe Trp Met Thr Ala Phe Leu Ser His Pro Ala Leu Gly Asp Leu
50 55 60
Leu Thr Glu Glu Asp Gln Lys Ile Phe Lys Tyr Leu Asn Ser Leu Glu
65 70 75 80
Val Glu Asp Ala Lys Asp Val Lys Ser Gly Tyr Ser Ile Thr Phe His
85 90 95
Phe Thr Ser Asn Pro Phe Phe Glu Asp Ala Lys Leu Thr Lys Thr Phe
100 105 110
Thr Phe Leu Glu Glu Gly Thr Thr Lys Ile Thr Ala Thr Pro Ile Lys
115 120 125
Trp Lys Glu Gly Lys Gly Leu Pro Asn Gly Val Asn His Asp Asp Lys
130 135 140
Lys Gly Asn Lys Arg Ala Leu Pro Glu Glu Ser Phe Phe Thr Trp Phe
145 150 155 160
Thr Asp Ala Gln His Lys Glu Asp Ala Gly Asp Glu Ile His Asp Glu
165 170 175
Val Ala Asp Ile Ile Lys Glu Asp Leu Trp Ser Asn Pro Leu Thr Tyr
180 185 190
Phe Asn Asn Asp Ala Asp Glu
195
<210>33
<211>6
<212>PRT
<213>人工序列
<220>
<223>特征标识
<220>
<221>变体
<222>(1)..(1)
<223>/替换=″Ser″
<220>
<221>变体
<222>(4)..(4)
<223>/替换=″Asn″/替换=″Ser″/替换=″Glu″/替换=″Asp″
<220>
<221>变体
<222>(5)..(5)
<223>/替换=″Phe″
<220>
<221>变体
<222>(6)..(6)
<223>/替换=″Phe″
<400>33
Thr Phe Phe Thr Trp Leu
1 5
<210>34
<211>10
<212>PRT
<213>人工序列
<220>
<223>人工序列
<400>34
Ser Ile Glu Lys Leu Gln Glu Ile Gln Asp
1 5 10
<210>35
<211>1597
<212>DNA
<213>豌豆(Pisum sativum)
<400>35
ggcacgagga ttagagagcc agttccagac agtacaatca atcaaaaccc tccccttctt 60
ccggctaggt tttgcttttt tgctgtcatc ttcttcttcc tccatttctc acttctcaat 120
gacgaacaac aaggaagctt tcaacatctc agatctcagt tccgctctca atgaagagga 180
tcgggctgac ctggtcaacg ctctcaagag taagatacag agtcttgctg ggcaacactc 240
tgatgttctg gagagtctgt ctcctgttgt caggaagcgt gtggaggttc tcagagagat 300
tcagggtgaa catgatgaat tggaggcaaa gtttttggaa gagagagctg ctcttgaagc 360
caaataccaa attttgtatc aaccattgta cactaagcgt tatgatattg tgaatggtgt 420
tgctgaagtg gtaggggtac gagttgaaac tgctgttgca gaagaggata aagagaaagg 480
agtgccttca ttttggctta atgctatgaa aaacaatgat gtcggaggtg aagaaattac 540
agagcgcgat gaaggcgctc tcaagtttct caaagatatc aagtggacaa ggatcgaaga 600
acctaaagga ttcaaacttg agtttttctt cgattccaat ccctattttt caaactcggt 660
gttgaccaaa atctatcata tggttgatga ggatgagcct atactggaga aggctattgg 720
gactgaaatt cagtggcttc caggaaaatg cctgacccaa aaggttttga agaaaaagcc 780
caagaagggt gcaaagaatg ctaaaccaat taccaaaact gaaacctgtg aaagtttctt 840
taactttttc aatccaccag aagtccctga agatgatgaa gacattgatg aagatatggc 900
tgaggaactt cagaatcaga tggaacaaga ctatgacatt gggtcaacaa taagagataa 960
gatcatcccc atgtcgtggt ttactgggga ggctgctcag ggagaggagt ttggagacct 1020
ggatgatgaa gatgaggatg aggacgatga tgctgaggag gatgatgaag aggaggatga 1080
ggacgaagat gatgatgatg aagaagagga agagactaag actaaaaaga agtcatctgc 1140
tagtaagaag aggatcggaa ttgcgcagct tggcgatggt cagcagggtg aaagaccacc 1200
agagtgcaag cagcagtagt ttatttattc agagtatgat gctactgaaa gttgctttgg 1260
ggtcctagcg cctgatgaaa aagagttctc aatttcatgt ggttttcatg gtccttaatt 1320
cattttcctc ccctagtttt attttagtct gaatttattg agtctcttgc ccctttttgt 1380
ccctctcctt ttggagagat ggtgttatat agtcagtggt ggtggtgtga tttattggta 1440
cttcaagttt aggtctcctt cctagatact taaagttgtg cttgattatt accaatattt 1500
ttggtatact ttgattagca aaacgttgct acaagttttc gcttgagaag aaatattgta 1560
atgatttttt cttctaaatg catgttacaa ttttatt 1597
<210>36
<211>366
<212>PRT
<213>豌豆
<400>36
Met Thr Asn Asn Lys Glu Ala Phe Asn Ile Ser Asp Leu Ser Ser Ala
1 5 10 15
Leu Asn Glu Glu Asp Arg Ala Asp Leu Val Asn Ala Leu Lys Ser Lys
20 25 30
Ile Gln Ser Leu Ala Gly Gln His Ser Asp Val Leu Glu Ser Leu Ser
35 40 45
Pro Val Val Arg Lys Arg Val Glu Val Leu Arg Glu Ile Gln Gly Glu
50 55 60
His Asp Glu Leu Glu Ala Lys Phe Leu Glu Glu Arg Ala Ala Leu Glu
65 70 75 80
Ala Lys Tyr Gln Ile Leu Tyr Gln Pro Leu Tyr Thr Lys Arg Tyr Asp
85 90 95
Ile Val Asn Gly Val Ala Glu Val Val Gly Val Arg Val Glu Thr Ala
100 105 110
Val Ala Glu Glu Asp Lys Glu Lys Gly Val Pro Ser Phe Trp Leu Asn
115 120 125
Ala Met Lys Asn Asn Asp Val Gly Gly Glu Glu Ile Thr Glu Arg Asp
130 135 140
Glu Gly Ala Leu Lys Phe Leu Lys Asp Ile Lys Trp Thr Arg Ile Glu
145 150 155 160
Glu Pro Lys Gly Phe Lys Leu Glu Phe Phe Phe Asp Ser Asn Pro Tyr
165 170 175
Phe Ser Asn Ser Val Leu Thr Lys Ile Tyr His Met Val Asp Glu Asp
180 185 190
Glu Pro Ile Leu Glu Lys Ala Ile Gly Thr Glu Ile Gln Trp Leu Pro
195 200 205
Gly Lys Cys Leu Thr Gln Lys Val Leu Lys Lys Lys Pro Lys Lys Gly
210 215 220
Ala Lys Asn Ala Lys Pro Ile Thr Lys Thr Glu Thr Cys Glu Ser Phe
225 230 235 240
Phe Asn Phe Phe Asn Pro Pro Glu Val Pro Glu Asp Asp Glu Asp Ile
245 250 255
Asp Glu Asp Met Ala Glu Glu Leu Gln Asn Gln Met Glu Gln Asp Tyr
260 265 270
Asp Ile Gly Ser Thr Ile Arg Asp Lys Ile Ile Pro Met Ser Trp Phe
275 280 285
Thr Gly Glu Ala Ala Gln Gly Glu Glu Phe Gly Asp Leu Asp Asp Glu
290 295 300
Asp Glu Asp Glu Asp Asp Asp Ala Glu Glu Asp Asp Glu Glu Glu Asp
305 310 315 320
Glu Asp Glu Asp Asp Asp Asp Glu Glu Glu Glu Glu Thr Lys Thr Lys
325 330 335
Lys Lys Ser Ser Ala Ser Lys Lys Arg Ile Gly Ile Ala Gln Leu Gly
340 345 350
Asp Gly Gln Gln Gly Glu Arg Pro Pro Glu Cys Lys Gln Gln
355 360 365
<210>37
<211>1442
<212>DNA
<213>大豆(Glycine max)
<400>37
cttctctcta gggttttagc actctctctc tctctcgttt tcgttcttcc tttctgcctc 60
tctcagtcac acaccttctc gatgaccaac gacaacatcg ccgtcacaga tctcacttct 120
gccctcaatg aagagaatcg cgccgaccta gtcaatgctc tcaagagcaa gattcagagt 180
ctggctgggg cgcattctga tgttctagag actctatccc cgaatgtcag gaagcgtgtt 240
gaatctctta gagaaattca gggtaaacat gatgaactag aggcagactt cttgaaggag 300
agagaagctc ttgaagcaaa gtaccaaaaa ctgtatcagc cattgtacac aaagcgctat 360
gaaattgtaa atggtgttac tgaagtggaa ggggcagcaa atgaatcaac agatgaatca 420
gaagagaata aagagaaagg agtgccttct ttttggctca atgcaatgga aaataatgat 480
gtgttagctg aagagatttc agagcgtgat gaaggtgctc tcaagtttct taaagatatc 540
aagtggagca ggatagaaaa tcctaaaggg ttcaagcttg atttcttctt tgataccaat 600
ccttactttt caaataccgt cttgacaaaa acatatcata tgattgatga ggatgaacct 660
atattggaga aagcaattgg gacggaaatt gaatggtacc cgggaaaatg cttgactcag 720
aaggttttga agaagaagcc taagaagggt tcaaagaatg ctaaaccaat taccaaaact 780
gaaagctgtg aaagcttctt caattttttc aaaccaccag aagtccctga agatgatgct 840
gacattgatg aagatttggc tgaagaactt cagaatcaga tggaacaaga ttatgacatt 900
gggtcaacat taagagataa aattatccct catgctgtat catggtttac tggggaggcc 960
gctcagggag atgagtttga agacctggag gatgatgagg acgaagagga agatgaggac 1020
gaagatgagg acgaagagga tgacgaggac gaagacgatg aagaggagga tgacac taag 1080
actaaaaaga agaagagtgg taaggcacag gctggtgatg gtgatggtga gcgacctcca 1140
gagtgcaagc agcagtaatt gtttgtttct tcggagtatc atgtggctga tgggtgtttt 1200
tgaggtccta tggtgcctga cgggaaagtg ggtttcaatt tcatgcaatt tttcatagtc 1260
cttgattcat tttcctccct agatccgata gtctgaattt attgagtcaa tttctccttt 1320
ttcccatatt ttgggagaat gtggttatat atttgtagtc agggatgctg tgatttgtta 1380
ctgttggaat ttgtacgtca ttccagacac ttcacatata ttataggttg tgctttgtta 1440
ct 1442
<210>38
<211>358
<212>PRT
<213>大豆
<400>38
Met Thr Asn Asp Asn Ile Ala Val Thr Asp Leu Thr Ser Ala Leu Asn
1 5 10 15
Glu Glu Asn Arg Ala Asp Leu Val Asn Ala Leu Lys Ser Lys Ile Gln
20 25 30
Ser Leu Ala Gly Ala His Ser Asp Val Leu Glu Thr Leu Ser Pro Asn
35 40 45
Val Arg Lys Arg Val Glu Ser Leu Arg Glu Ile Gln Gly Lys His Asp
50 55 60
Glu Leu Glu Ala Asp Phe Leu Lys Glu Arg Glu Ala Leu Glu Ala Lys
65 70 75 80
Tyr Gln Lys Leu Tyr Gln Pro Leu Tyr Thr Lys Arg Tyr Glu Ile Val
85 90 95
Asn Gly Val Thr Glu Val Glu Gly Ala Ala Asn Glu Ser Thr Asp Glu
100 105 110
Ser Glu Glu Asn Lys Glu Lys Gly Val Pro Ser Phe Trp Leu Asn Ala
115 120 125
Met Glu Asn Asn Asp Val Leu Ala Glu Glu Ile Ser Glu Arg Asp Glu
130 135 140
Gly Ala Leu Lys Phe Leu Lys Asp Ile Lys Trp Ser Arg Ile Glu Asn
145 150 155 160
Pro Lys Gly Phe Lys Leu Asp Phe Phe Phe Asp Thr Asn Pro Tyr Phe
165 170 175
Ser Asn Thr Val Leu Thr Lys Thr Tyr His Met Ile Asp Glu Asp Glu
180 185 190
Pro Ile Leu Glu Lys Ala Ile Gly Thr Glu Ile Glu Trp Tyr Pro Gly
195 200 205
Lys Cys Leu Thr Gln Lys Val Leu Lys Lys Lys Pro Lys Lys Gly Ser
210 215 220
Lys Asn Ala Lys Pro Ile Thr Lys Thr Glu Ser Cys Glu Ser Phe Phe
225 230 235 240
Asn Phe Phe Lys Pro Pro Glu Val Pro Glu Asp Asp Ala Asp Ile Asp
245 250 255
Glu Asp Leu Ala Glu Glu Leu Gln Asn Gln Met Glu Gln Asp Tyr Asp
260 265 270
Ile Gly Ser Thr Leu Arg Asp Lys Ile Ile Pro His Ala Val Ser Trp
275 280 285
Phe Thr Gly Glu Ala Ala Gln Gly Asp Glu Phe Glu Asp Leu Glu Asp
290 295 300
Asp Glu Asp Glu Glu Glu Asp Glu Asp Glu Asp Glu Asp Glu Glu Asp
305 310 315 320
Asp Glu Asp Glu Asp Asp Glu Glu Glu Asp Asp Thr Lys Thr Lys Lys
325 330 335
Lys Lys Ser Gly Lys Ala Gln Ala Gly Asp Gly Asp Gly Glu Arg Pro
340 345 350
Pro Glu Cys Lys Gln Gln
355
<210>39
<211>2194
<212>DNA
<213>稻
<400>39
aatccgaaaa gtttctgcac cgttttcacc ccctaactaa caatataggg aacgtgtgct 60
aaatataaaa tgagacctta tatatgtagc gctgataact agaactatgc aagaaaaact 120
catccaccta ctttagtggc aatcgggcta aataaaaaag agtcgctaca ctagtttcgt 180
tttccttagt aattaagtgg gaaaatgaaa tcattattgc ttagaatata cgttcacatc 240
tctgtcatga agttaaatta ttcgaggtag ccataattgt catcaaactc ttcttgaata 300
aaaaaatctt tctagctgaa ctcaatgggt aaagagagag atttttttta aaaaaataga 360
atgaagatat tctgaacgta ttggcaaaga tttaaacata taattatata attttatagt 420
ttgtgcattc gtcatatcgc acatcattaa ggacatgtct tactccatcc caatttttat 480
ttagtaatta aagacaattg acttattttt attatttatc ttttttcgat tagatgcaag 540
gtacttacgc acacactttg tgctcatgtg catgtgtgag tgcacctcct caatacacgt 600
tcaactagca acacatctct aatatcactc gcctatttaa tacatttagg tagcaatatc 660
tgaattcaag cactccacca tcaccagacc acttttaata atatctaaaa tacaaaaaat 720
aattttacag aatagcatga aaagtatgaa acgaactatt taggtttttc acatacaaaa 780
aaaaaaagaa ttttgctcgt gcgcgagcgc caatctccca tattgggcac acaggcaaca 840
acagagtggc tgcccacaga acaacccaca aaaaacgatg atctaacgga ggacagcaag 900
tccgcaacaa ccttttaaca gcaggctttg cggccaggag agaggaggag aggcaaagaa 960
aaccaagcat cctccttctc ccatctataa attcctcccc ccttttcccc tctctatata 1020
ggaggcatcc aagccaagaa gagggagagc accaaggaca cgcgactagc agaagccgag 1080
cgaccgcctt ctcgatccat atcttccggt cgagttcttg gtcgatctct tccctcctcc 1140
acctcctcct cacagggtat gtgcctccct tcggttgttc ttggatttat tgttctaggt 1200
tgtgtagtac gggcgttgat gttaggaaag gggatctgta tctgtgatga ttcctgttct 1260
tggatttggg atagaggggt tcttgatgtt gcatgttatc ggttcggttt gattagtagt 1320
atggttttca atcgtctgga gagctctatg gaaatgaaat ggtttaggga tcggaatctt 1380
gcgattttgt gagtaccttt tgtttgaggt aaaatcagag caccggtgat tttgcttggt 1440
gtaataaagt acggttgttt ggtcctcgat tctggtagtg atgcttctcg atttgacgaa 1500
gctatccttt gtttattccc tattgaacaa aaataatcca actttgaaga cggtcccgtt 1560
gatgagattg aatgattgat tcttaagcct gtccaaaatt tcgcagctgg cttgtttaga 1620
tacagtagtc cccatcacga aattcatgga aacagttata atcctcagga acaggggatt 1680
ccctgttctt ccgatttgct ttagtcccag aatttttttt cccaaatatc ttaaaaagtc 1740
actttctggt tcagttcaat gaattgattg ctacaaataa tgcttttata gcgttatcct 1800
agctgtagtt cagttaatag gtaatacccc tatagtttag tcaggagaag aacttatccg 1860
atttctgatc tccattttta attatatgaa atgaactgta gcataagcag tattcatttg 1920
gattattttt tttattagct ctcacccctt cattattctg agctgaaagt ctggcatgaa 1980
ctgtcctcaa ttttgttttc aaattcacat cgattatcta tgcattatcc tcttgtatct 2040
acctgtagaa gtttcttttt ggttattcct tgactgcttg attacagaaa gaaatttatg 2100
aagctgtaat cgggatagtt atactgcttg ttcttatgat tcatttcctt tgtgcagttc 2160
ttggtgtagc ttgccacttt caccagcaaa gttc 2194
<210>40
<211>739
<212>DNA
<213>拟南芥
<400>40
ccatagatct caagtctctc tctcttagtg aataaattag ggttcgttga ttctctgttc 60
ttaagctcag taatcgagga gaagaagaaa agggaagatc gggaattggg aaactgagaa 120
gtcaaaaagg caaatgcgag tggaggagat tgagttttag aattccaatg tcttgggctg 180
ctcctgatga tatcttcttc tccacttctc ttgctgctta cctagacaag aaacttcttg 240
tgttgcttcg tgatggtagg aaactgatgg gtctacttcg gtcctttgat caatttgcta 300
atgctgtttt agaagaagct tatgaaagag tcattgtggg tgatctctac tgtgatattc 360
ccttaggtct atacattatc cgtggagaaa atgttgtctt gattggtgaa ttggacgtgg 420
aaaaagaaga gcttccagct catatggttc aggttccaga agcagagata aaaagggctc 480
agaaagcaga gaaggaagaa atgcttttaa agggcacaat gcggaaaaga atggagttcc 540
ttgatctcga ttagggcatt ttcctatgtg ttgcagcatt gtagaaacta gaagatctca 600
agatggagga tacagaagat ccttaaacgt cataatgtta gttgatgtgt gtatgtgtgg 660
atgacattga tgaatcctca gaacttagtc gttgcagatc ctctgctctg tttatggaat 720
gaaattgttg agcctgttc 739
<210>41
<211>128
<212>PRT
<213>拟南芥
<400>41
Met Ser Trp Ala Ala Pro Asp Asp Ile Phe Phe Ser Thr Ser Leu Ala
1 5 10 15
Ala Tyr Leu Asp Lys Lys Leu Leu Val Leu Leu Arg Asp Gly Arg Lys
20 25 30
Leu Met Gly Leu Leu Arg Ser Phe Asp Gln Phe Ala Asn Ala Val Leu
35 40 45
Glu Glu Ala Tyr Glu Arg Val Ile Val Gly Asp Leu Tyr Cys Asp Ile
50 55 60
Pro Leu Gly Leu Tyr Ile Ile Arg Gly Glu Asn Val Val Leu Ile Gly
65 70 75 80
Glu Leu Asp Val Glu Lys Glu Glu Leu Pro Ala His Met Val Gln Val
85 90 95
Pro Glu Ala Glu Ile Lys Arg Ala Gln Lys Ala Glu Lys Glu Glu Met
100 105 110
Leu Leu Lys Gly Thr Met Arg Lys Arg Met Glu Phe Leu Asp Leu Asp
115 120 125
<210>42
<211>922
<212>DNA
<213>拟南芥
<400>42
gacggatttg ctcgctagtt ttctcttcga attttccaca aacaaatttt ctcagccaaa 60
gttcgatcgg atctgggttt tatatttttt tgaagaaccc gtgtccgtct tcgatcaggt 120
gtcgaaagtc tcaatctttt ttaatcactt tatcaattta aaccctttgg tcaaaaccct 180
aatttagatt tctctttccg tcttcacttt ttttttttcc tgtcaaagtt cgcgttcaat 240
agccaaatct tatctcttca gctggaatct gacgaacatt attatcatcg gtagtgttct 300
atagaaagac cgaaagtttt cttcaatttc aaagtcagtg gcgatgtcgt gggctggtcc 360
tgaagaaatt tatctttcaa catcactcgc tagttatctc gatagaaaac tacttgtgct 420
tcttagagat ggtagaaagc taatgggaac actccgttcc tttgatcaat tcgccaatgc 480
ggttctagaa ggtgcgtgtg agagggtaat tgttggtgaa caatactgtg acattccttt 540
aggcctctat gtaatccgtg gagagaatgt tgttttgatt ggtgagctgg acacggagag 600
agaagagctt cctccacata tgattcgcgt ctcagaggca gagattaaaa gggcacaaaa 660
ggtggagagg gaagcgagtg agctgagagg aacaatgagg aagagaatgg agtttcttga 720
ctttgattaa accagattgt atccccattc attattggct tgatgctctg ctttggctcg 780
caagttttat gatgagcctt tttggtgtgt tgacttaggg gatcgacgca attcttgtgt 840
ttcattttgg atgaatatga caataaatct gtgtactttt gtctttggat ctatttacct 900
ttttaagaaa aaaatgttaa gc 922
<210>43
<211>128
<212>PRT
<213>拟南芥
<400>43
Met Ser Trp Ala Gly Pro Glu Glu Ile Tyr Leu Ser Thr Ser Leu Ala
1 5 10 15
Ser Tyr Leu Asp Arg Lys Leu Leu Val Leu Leu Arg Asp Gly Arg Lys
20 25 30
Leu Met Gly Thr Leu Arg Ser Phe Asp Gln Phe Ala Asn Ala Val Leu
35 40 45
Glu Gly Ala Cys Glu Arg Val Ile Val Gly Glu Gln Tyr Cys Asp Ile
50 55 60
Pro Leu Gly Leu Tyr Val Ile Arg Gly Glu Asn Val Val Leu Ile Gly
65 70 75 80
Glu Leu Asp Thr Glu Arg Glu Glu Leu Pro Pro His Met Ile Arg Val
85 90 95
Ser Glu Ala Glu Ile Lys Arg Ala Gln Lys Val Glu Arg Glu Ala Ser
100 105 110
Glu Leu Arg Gly Thr Met Arg Lys Arg Met Glu Phe Leu Asp Phe Asp
115 120 125
<210>44
<211>282
<212>DNA
<213>拟南芥
<400>44
atgttgttct tttcttactt caaggatttg gttggacaag aagtgacggt tgagctgaag 60
aatgatttag ccataagagg aactcttcac tcagttgatc agtatctgaa tatcaagctc 120
gagaacacta gggttgttga ccaggacaag taccctcaca tgctttcagt gagaaactgt 180
ttcatcagag gatctgtggt aaggtacgtg cagttaccta aagatggagt cgatgttgat 240
ttgcttcacg acgcagctag aagagaagct aggggtggct ga 282
<210>45
<211>93
<212>PRT
<213>拟南芥
<400>45
Met Leu Phe Phe Ser Tyr Phe Lys Asp Leu Val Gly Gln Glu Val Thr
1 5 10 15
Val Glu Leu Lys Asn Asp Leu Ala Ile Arg Gly Thr Leu His Ser Val
20 25 30
Asp Gln Tyr Leu Asn Ile Lys Leu Glu Asn Thr Arg Val Val Asp Gln
35 40 45
Asp Lys Tyr Pro His Met Leu Ser Val Arg Asn Cys Phe Ile Arg Gly
50 55 60
Ser Val Val Arg Tyr Val Gln Leu Pro Lys Asp Gly Val Asp Val Asp
65 70 75 80
Leu Leu His Asp Ala Ala Arg Arg Glu Ala Arg Gly Gly
85 90
<210>46
<211>652
<212>DNA
<213>拟南芥
<400>46
cgagagcact acaatttcaa aaccctcgga gaagttataa tcagaaaatg tcagtcgagg 60
aagacgccac cgttagagag ccactcgatc tgattcggtt gagtatcgaa gagaggatct 120
atgtcaagct ccgatctgac cgtgaactcc gcggcaagct tcacgctttt gatcagcatt 180
tgaatatgat tctgggtgat gttgaagagg ttattacgac tatagaaatc gacgacgaga 240
catatgaaga gattgttcgg acaacgaagc gaacggtacc gtttctattc gtgagaggag 300
atggagtgat attggtgtca ccgcctttga ggacgaccta aatgttcttg tgtactggga 360
tcggagttaa caaatctggc gctgagtaaa agcacttttt tctgattact tggcttttga 420
atttgtaatt gtgtggtatg tttttctttg ttgtcaaaca ttgaaaccga atgtagcatt 480
cgaatcttgg taatgggtgc ctcgttatag tagaatcagt gtaacatact tcgtattgtg 540
actttcttac cgtttacgat cggatttagt ttcgttttct ggtttggtgt agttttctct 600
aaagatttgt atacttcctc aaactcattg atttcgagct ctattatgaa ta 652
<210>47
<211>97
<212>PRT
<213>拟南芥
<400>47
Met Ser Val Glu Glu Asp Ala Thr Val Arg Glu Pro Leu Asp Leu Ile
1 5 10 15
Arg Leu Ser Ile Glu Glu Arg Ile Tyr Val Lys Leu Arg Ser Asp Arg
20 25 30
Glu Leu Arg Gly Lys Leu His Ala Phe Asp Gln His Leu Asn Met Ile
35 40 45
Leu Gly Asp Val Glu Glu Val Ile Thr Thr Ile Glu Ile Asp Asp Glu
50 55 60
Thr Tyr Glu Glu Ile Val Arg Thr Thr Lys Arg Thr Val Pro Phe Leu
65 70 75 80
Phe Val Arg Gly Asp Gly Val Ile Leu Val Ser Pro Pro Leu Arg Thr
85 90 95
Thr
<210>48
<211>297
<212>DNA
<213>拟南芥
<400>48
atgtccggcg aggaagaagc caccgtgagg gagccactag atctgattag gctgagtctc 60
gacgagagaa tctatgtcaa gctccggtca gaccgcgaac ttcgcggcaa gcttcacgcg 120
tttgatcagc atttgaatat gattctgggt gatgttgaag aaactatcac tacagtagaa 180
atcgatgacg agacatatga agagattgtt cggactacaa agcggacgat tgagtttcta 240
ttcgtgagag gagatggagt gatattggtg tctccaccgc tgaggacagc agcctga 297
<210>49
<211>98
<212>PRT
<213>拟南芥
<400>49
Met Ser Gly Glu Glu Glu Ala Thr Val Arg Glu Pro Leu Asp Leu Ile
1 5 10 15
Arg Leu Ser Leu Asp Glu Arg Ile Tyr Val Lys Leu Arg Ser Asp Arg
20 25 30
Glu Leu Arg Gly Lys Leu His Ala Phe Asp Gln His Leu Asn Met Ile
35 40 45
Leu Gly Asp Val Glu Glu Thr Ile Thr Thr Val Glu Ile Asp Asp Glu
50 55 60
Thr Tyr Glu Glu Ile Val Arg Thr Thr Lys Arg Thr Ile Glu Phe Leu
65 70 75 80
Phe Val Arg Gly Asp Gly Val Ile Leu Val Ser Pro Pro Leu Arg Thr
85 90 95
Ala Ala
<210>50
<211>865
<212>DNA
<213>拟南芥
<400>50
aaaactaaaa gaccaccgat tcattagaaa tccatccctc tcactgtcaa aacccgagaa 60
gcagaaaaaa gcaaaaaaca gatttcgaag tttcgacgcc tctctattct tcgatctctt 120
tcatatttga atcgttcacc ttcttgccga tcttcggagt atattacaag gttcttaacg 180
gatctctaaa tcttctgatt taagaagatg cttcctctat cgctgcttaa aactgctcaa 240
gggcatccta tgctcgtgga gcttaagaat ggagagacat acaatgggca tttggtgaat 300
tgtgatactt ggatgaacat ccatctgcgt gaagtcatat gtacatcaaa ggacggagat 360
agattttgga ggatgccgga atgttatatc cgtggtaaca caatcaagta ccttcgagtt 420
ccggatgagg tgattgataa agtacaggag gagaagacac gcacagatag aaaaccacca 480
ggtgttggac gtggaagagg acgtggtgtg gatgatggag gagccagagg cagaggcaga 540
ggaacttcaa tggggaagat gggtggcaac agaggagcag gtcgcggccg tggttgatgc 600
aacaagtttt aaagactcgc tgccaaatct gctaacttcc cattgtggag aaaaccaaaa 660
gttacataag aagttggtct gttgttggtt ttctattaag tatgtaaggg atagggagtg 720
tgtttttcga ttctccttgt gatcttttcg aaaaatgaaa tttgtctttt gcctttttgt 780
ggtatatgtg aaattccaat tgttttcatt tgcgcttaaa aatgaatctt tcaggtcttg 840
aatttatata attgttagag aattt 865
<210>51
<211>129
<212>PRT
<213>拟南芥
<400>51
Met Leu Pro Leu Ser Leu Leu Lys Thr Ala Gln Gly His Pro Met Leu
1 5 10 15
Val Glu Leu Lys Asn Gly Glu Thr Tyr Asn Gly His Leu Val Asn Cys
20 25 30
Asp Thr Trp Met Asn Ile His Leu Arg Glu Val Ile Cys Thr Ser Lys
35 40 45
Asp Gly Asp Arg Phe Trp Arg Met Pro Glu Cys Tyr Ile Arg Gly Asn
50 55 60
Thr Ile Lys Tyr Leu Arg Val Pro Asp Glu Val Ile Asp Lys Val Gln
65 70 75 80
Glu Glu Lys Thr Arg Thr Asp Arg Lys Pro Pro Gly Val Gly Arg Gly
85 90 95
Arg Gly Arg Gly Val Asp Asp Gly Gly Ala Arg Gly Arg Gly Arg Gly
100 105 110
Thr Ser Met Gly Lys Met Gly Gly Asn Arg Gly Ala Gly Arg Gly Arg
115 120 125
Gly
<210>52
<211>267
<212>DNA
<213>拟南芥
<400>52
atggcgaaca atccttcaca gcttcttcct tcagagctaa tcgataggtg tatagggtct 60
aagatttggg tgataatgaa aggagataag gagctcgttg gtattctcaa aggattcgat 120
gtttatgtca acatggttct tgaagatgtc accgaatatg agattacggc agaaggaaga 180
cgggtcacaa agcttgatca gattctactc aatggcaaca acatcgccat tctggtgcca 240
ggtgggtctc ccgaagatgg agaatga 267
<210>53
<211>88
<212>PRT
<213>拟南芥
<400>53
Met Ala Asn Asn Pro Ser Gln Leu Leu Pro Ser Glu Leu Ile Asp Arg
1 5 10 15
Cys Ile Gly Ser Lys Ile Trp Val Ile Met Lys Gly Asp Lys Glu Leu
20 25 30
Val Gly Ile Leu Lys Gly Phe Asp Val Tyr Val Asn Met Val Leu Glu
35 40 45
Asp Val Thr Glu Tyr Glu Ile Thr Ala Glu Gly Arg Arg Val Thr Lys
50 55 60
Leu Asp Gln Ile Leu Leu Asn Gly Asn Asn Ile Ala Ile Leu Val Pro
65 70 75 80
Gly Gly Ser Pro Glu Asp Gly Glu
85
<210>54
<211>625
<212>DNA
<213>拟南芥
<400>54
aaataataaa agcccttagg accgattcgt tatttcttcg ctctctcttt ctctctgtgt 60
ctcgtactcg agtaggtctc agttacgtaa aggatcgagc ttaaaagatg agtggagttg 120
aagagaaagt ttctggaacg acaaagacac ctgcagattt cctcaaatcc atccgtggga 180
gacccgttgt tgtcaagctc aattctggtg ttgattatcg aggcactctt acttgtcttg 240
atggatatat gaacatagca atggagcaga cggaggagta tgtaaacggg cagctcaaga 300
acaaatatgg tgacgccttt atccgtggaa acaacgttct ttacatcagt acagtaaaca 360
tgactgtagc agacggagcc taggcccatc atgatcatca acaacaacaa cagtggtcat 420
gttatggctg ccatttttgt tgtcttcttc tacctcatat taaaagagta gtagacatgt 480
accaagattg tcatcctatg ttcttcagta gatttttggg atacagacat cacttttttc 540
ttagtaatat gatactcttc catgtgaccc cagataaaga agaaaaatta ttaatttatg 600
gcttgataca atcatacaag caaac 625
<210>55
<211>91
<212>PRT
<213>拟南芥
<400>55
Met Ser Gly Val Glu Glu Lys Val Ser Gly Thr Thr Lys Thr Pro Ala
1 5 10 15
Asp Phe Leu Lys Ser Ile Arg Gly Arg Pro Val Val Val Lys Leu Asn
20 25 30
Ser Gly Val Asp Tyr Arg Gly Thr Leu Thr Cys Leu Asp Gly Tyr Met
35 40 45
Asn Ile Ala Met Glu Gln Thr Glu Glu Tyr Val Asn Gly Gln Leu Lys
50 55 60
Asn Lys Tyr Gly Asp Ala Phe Ile Arg Gly Asn Asn Val Leu Tyr Ile
65 70 75 80
Ser Thr Val Asn Met Thr Val Ala Asp Gly Ala
85 90
<210>56
<211>781
<212>DNA
<213>拟南芥
<400>56
gctctgttcg gctgcttcat cgagcggaag tctctagcca attaccgttt gttcgtggac 60
tcgagatatt gtggtttctt agcaaagaag atgagtggag ttggagagaa agcttctgga 120
acaactaaga cacctgctga tttcttgaaa tctatccgtg gtaaaccagt tgttgtcaag 180
ctcaactctg gtgttgatta tcgaggcatt cttacttgtc ttgatggata tatgaacatc 240
gcaatggagc aaaccgaaga gtatgtaaat ggccagctga agaacacata tggcgacgct 300
tttgtccgtg gcaacaatgt tctttacatc agcacaacaa aggggacatt gtcagatgga 360
gcatagctct ctttcatcac catgaatgtt catcttcttc tctacctctg gcatatgaca 420
aatgtaggat ttgtagcaac cagagtttat caccactgca tgaattcgac atgtcttttt 480
cttccgcaac tcagtttgtg tctaaatcat ctccaaaatt ctgagatata gctagatttt 540
tatttgttat gaaatttttt ttaatcactg ttggtctttg gagcctaatt atcgtgtttt 600
gatgacgcaa tcactgcgtc acaatctgat gtcatcttaa caatcattaa tgtatttttt 660
ttttcttttc tcgtaatatt cttaattatt cttcgacagc aaaggtttaa aaactcctta 720
tttcaatcat taatgtattt atgatttgat cgaataacaa taatatagct tattttgttc 780
t 781
<210>57
<211>91
<212>PRT
<213>拟南芥
<400>57
Met Ser Gly Val Gly Glu Lys Ala Ser Gly Thr Thr Lys Thr Pro Ala
1 5 10 15
Asp Phe Leu Lys Ser Ile Arg Gly Lys Pro Val Val Val Lys Leu Asn
20 25 30
Ser Gly Val Asp Tyr Arg Gly Ile Leu Thr Cys Leu Asp Gly Tyr Met
35 40 45
Asn Ile Ala Met Glu Gln Thr Glu Glu Tyr Val Asn Gly Gln Leu Lys
50 55 60
Asn Thr Tyr Gly Asp Ala Phe Val Arg Gly Asn Asn Val Leu Tyr Ile
65 70 75 80
Ser Thr Thr Lys Gly Thr Leu Ser Asp Gly Ala
85 90
<210>58
<211>599
<212>DNA
<213>拟南芥
<400>58
gtcactagga agctgcgact atttgactga ctctgatttc acgcgactcc ttgtgagatt 60
ctccgattgc ttcgcctgag tttctgggtt aactctccac gccgtcactt tgatctttgc 120
ttttccgatc tttagggttt ttgtttaggg aattgtcgaa gactctgctc taacatgtct 180
ggaagaaaag aaacggtttt agatttggcc aagtttgtag ataagggtgt gcaagttaag 240
ctcactggtg gtagacaagt gactggaact cttaaaggct atgaccaatt gcttaatctt 300
gttcttgatg aagcagtcga gttcgttcga gatcatgatg atcctttgaa gactacggat 360
cagacaagac gccttggttt gattgtttgc cgtggaacag cggtgatgct tgtctcacca 420
accgatggca ccgaagaaat cgctaacccg ttcgttactg cagaggctgt ctaaagactt 480
tcttctcaaa gaatatgtct ctctattagt ttaacttggc gatttagaga gtatttcatc 540
taactctctg gtgtgatgtt ggaaacatat atgttcaatt taaacaattt ggaacatca 599
<210>59
<211>99
<212>PRT
<213>拟南芥
<400>59
Met Ser Gly Arg Lys Glu Thr Val Leu Asp Leu Ala Lys Phe Val Asp
1 5 10 15
Lys Gly Val Gln Val Lys Leu Thr Gly Gly Arg Gln Val Thr Gly Thr
20 25 30
Leu Lys Gly Tyr Asp Gln Leu Leu Asn Leu Val Leu Asp Glu Ala Val
35 40 45
Glu Phe Val Arg Asp His Asp Asp Pro Leu Lys Thr Thr Asp Gln Thr
50 55 60
Arg Arg Leu Gly Leu Ile Val Cys Arg Gly Thr Ala Val Met Lcu Val
65 70 75 80
Ser Pro Thr Asp Gly Thr Glu Glu Ile Ala Asn Pro Phe Val Thr Ala
85 90 95
Glu Ala Val
<210>60
<211>650
<212>DNA
<213>拟南芥
<400>60
aaaaacacac gccggagagt tttctaagaa caacagtgac gaaaaggttt ttagggtttc 60
tttaccaatc agaatctccg ccaagtaacg attttcagat tccgaagcag caaagttcaa 120
ataatttccg aactgtaaca tggcggcaac tactggactt gagactctcg tcgatcagat 180
tatttcggtg attacaaatg acggacgcaa cattgtggga gttcttaaag gttttgacca 240
ggctacaaat ataatccttg atgaatctca tgaacgtgtg ttttccacaa aggaaggagt 300
acaacaacat gtgttgggtt tgtacatcat cagaggggac aacataggtg ttatcgggga 360
gctggacgag gagcttgatg ctagtctgga tttttcgaag ctgagagccc atccgttgaa 420
acccgtagtg cattgattga atatagttat ggtgagaaaa tctaattctc tcattcaaag 480
cctaaaaaca aagagaagat ttgattgtaa acaatttgga tagtttgttt tgatgtctgg 540
agttgtctta tttgtgtatc ctaaggacaa aagctatatg atattttatg tcttaaacgt 600
tttggtcgga aacttaaatc atacaatctt ttggacggac ctaggtttgc 650
<210>61
<211>98
<212>PRT
<213>拟南芥
<400>61
Met Ala Ala Thr Thr Gly Leu Glu Thr Leu Val Asp Gln Ile Ile Ser
1 5 10 15
Val Ile Thr Asn Asp Gly Arg Asn Ile Val Gly Val Leu Lys Gly Phe
20 25 30
Asp Gln Ala Thr Asn Ile Ile Leu Asp Glu Ser His Glu Arg Val Phe
35 40 45
Ser Thr Lys Glu Gly Val Gln Gln His Val Leu Gly Leu Tyr Ile Ile
50 55 60
Arg Gly Asp Asn Ile Gly Val Ile Gly Glu Leu Asp Glu Glu Leu Asp
65 70 75 80
Ala Ser Leu Asp Phe Ser Lys Leu Arg Ala His Pro Leu Lys Pro Val
85 90 95
Val His
<210>62
<211>387
<212>DNA
<213>蒺藜苜蓿(Medicago truncatula)
<400>62
atgtcttggg ctgcacctga tgagctttta ctctctactt ctcttgctac atatcttgac 60
aaaaaacttc ttgtcctgtt gcgagatggg cggaaacttt tgggtttatt acgctcattt 120
gatcaatttg ctaatgtcgt tctagaaggt gcgtgtgaac gagtgattgt cggtgatctt 180
tattgtgatg tccctttagg cctttatgta attcgtgggg agaatgttgt cttaattgga 240
gagctggact tgggaaagga ggagcttcca ccacatatga catgtgtgtc agaggctgac 300
ataagaaagg ctcaaaaagc agaacgcgat gctagtgatc tgaagggaac tatgaggaaa 360
aggatggaat tccttgattt tgactaa 387
<210>63
<211>128
<212>PRT
<213>蒺藜苜蓿
<400>63
Met Ser Trp Ala Ala Pro Asp Glu Leu Leu Leu Ser Thr Ser Leu Ala
1 5 10 15
Thr Tyr Leu Asp Lys Lys Leu Leu Val Leu Leu Arg Asp Gly Arg Lys
20 25 30
Leu Leu Gly Leu Leu Arg Ser Phe Asp Gln Phe Ala Asn Val Val Leu
35 40 45
Glu Gly Ala Cys Glu Arg Val Ile Val Gly Asp Leu Tyr Cys Asp Val
50 55 60
Pro Leu Gly Leu Tyr Val Ile Arg Gly Glu Asn Val Val Leu Ile Gly
65 70 75 80
Glu Leu Asp Leu Gly Lys Glu Glu Leu Pro Pro His Met Thr Cys Val
85 90 95
Ser Glu Ala Asp Ile Arg Lys Ala Gln Lys Ala Glu Arg Asp Ala Ser
100 105 110
Asp Leu Lys Gly Thr Met Arg Lys Arg Met Glu Phe Leu Asp Phe Asp
115 120 125
<210>64
<211>387
<212>DNA
<213>毛果杨(Populus trichocarpa)
<400>64
atgtcttggg caggcccaga agatatctac ctctctactt ctcttgccaa ctatcttgat 60
aagaagcttc ttgtgctcct acgagatggc cgaaagctca tgggattact tcgttctttt 120
gatcaatttg ccaatgctgt ccttgaaggt gcatgtgaaa gagttattgt tggtgacctt 180
tattgcgaca tccacttggg tctatatgtg attcgtgggg agaatgttgt cttaattgga 240
gagctggatt tggagaggga ggagcttcca ccacatatga ctcgtgtttc agaagcagag 300
attagaaggg cgcagaaagc agaaagggag gcaacagatc taaaaggtac aatgaggaaa 360
agaatggagt tccttgattt ggactag 387
<210>65
<211>128
<212>PRT
<213>毛果杨
<400>65
Met Ser Trp Ala Gly Pro Glu Asp Ile Tyr Leu Ser Thr Ser Leu Ala
1 5 10 15
Asn Tyr Leu Asp Lys Lys Leu Leu Val Leu Leu Arg Asp Gly Arg Lys
20 25 30
Leu Met Gly Leu Leu Arg Ser Phe Asp Gln Phe Ala Asn Ala Val Leu
35 40 45
Glu Gly Ala Cys Glu Arg Val Ile Val Gly Asp Leu Tyr Cys Asp Ile
50 55 60
His Leu Gly Leu Tyr Val Ile Arg Gly Glu Asn Val Val Leu Ile Gly
65 70 75 80
Glu Leu Asp Leu Glu Arg Glu Glu Leu Pro Pro His Met Thr Arg Val
85 90 95
Ser Glu Ala Glu Ile Arg Arg Ala Gln Lys Ala Glu Arg Glu Ala Thr
100 105 110
Asp Leu Lys Gly Thr Met Arg Lys Arg Met Glu Phe Leu Asp Leu Asp
115 120 125
<210>66
<211>824
<212>DNA
<213>稻
<400>66
gcgtcaacct cacacttgac gatagttcct ttcatcaatc acccagcttt actcctcttc 60
tccccccgcc ccgcttcacc aatcaatcca aaccctagag caaatcccct ccctcccttg 120
ccggaatcgc tcgcaagctc caggcagccc ccacaccagt ccgcggcgga tcagggggcg 180
gggcgatctc tagcgccctc cgggatttga agggttccga gcgtcggcga tgtcgtcgtg 240
ggccgggccc gacgagatct tcctctccac gtccctggcc ggcttcttgg acaagaaact 300
tattgtccta ctacgagatg gacggaagct gcttggcaca ctctgctcat ttgatcagtt 360
tgcaaatgtt gttcttcagg gtgcttgtga acgagtaatt gtaggtgaac tatattgtga 420
tgttcctctt ggtctatatg tgatccgggg agagaatgtc gtattaatcg gagaattgga 480
tcgtgagaag gatgaactcc ctgctcacat gacttgtgtt tcagaggctg aaataagaaa 540
ggccgagaaa gcagaaaggg aagcgagaga tctgaaaggt tcaatgagga agaggatgga 600
gttcttagac tttgattaga atggatttga ccatcttgat agttgctgct cccactatgg 660
ccgcgagttt ttaatggcag cctctgctac atatgtgggc taatgaaagc cagatttcgt 720
tgtatctcat gctgcttgtt cagccagaat tcttcaggtt ggagatttca gtaaacatac 780
tcttttacag cggtaatgta cctgtgttct taaaatttct tcag 824
<210>67
<211>129
<212>PRT
<213>稻
<400>67
Met Ser Ser Trp Ala Gly Pro Asp Glu Ile Phe Leu Ser Thr Ser Leu
1 5 10 15
Ala Gly Phe Leu Asp Lys Lys Leu Ile Val Leu Leu Arg Asp Gly Arg
20 25 30
Lys Leu Leu Gly Thr Leu Cys Ser Phe Asp Gln Phe Ala Asn Val Val
35 40 45
Leu Gln Gly Ala Cys Glu Arg Val Ile Val Gly Glu Leu Tyr Cys Asp
50 55 60
Val Pro Leu Gly Leu Tyr Val Ile Arg Gly Glu Asn Val Val Leu Ile
65 70 75 80
Gly Glu Leu Asp Arg Glu Lys Asp Glu Leu Pro Ala His Met Thr Cys
85 90 95
Val Ser Glu Ala Glu Ile Arg Lys Ala Glu Lys Ala Glu Arg Glu Ala
100 105 110
Arg Asp Leu Lys Gly Ser Met Arg Lys Arg Met Glu Phe Leu Asp Phe
115 120 125
Asp
<210>68
<211>579
<212>DNA
<213>稻
<400>68
gggtaagcta gggtttaggt ctcggcgcgc ggcggagggg aggaggaggc gatggcggcg 60
gcggcggcgg cagcggcggc tgaggaggag atcgcggtga aggagccgct ggatctgatc 120
aggctcagcc tcgacgagcg catctacgtc aagctcaggt ccgaccgcga gctccgcggc 180
aagctccatg catacgatca acatttaaac atgattcttg gagatgttga ggagatcgtg 240
acaacagttg agattgacga tgagacatat gaagaaattg tgcgcaccac aaaacgcact 300
atccccttcc tttttgttcg aggtgatggt gtcattttgg tttctccacc cctccgaacg 360
gcatgaagta tgaaggaagc tcctgccgat tgtcaaccat gagtaatgtg tattttttaa 420
tcaatggcat gtgttatgtg ctgaagtgct actatttctg atggattcta gttttagcat 480
atgatacaat tgtgtaacaa tttctgatcg aggtgctagt ttctactgtc atgttgaatc 540
aaccttttgt taccagatta atcaactcaa tcccgaagc 579
<210>69
<211>104
<212>PRT
<213>稻
<400>69
Met Ala Ala Ala Ala Ala Ala Ala Ala Ala Glu Glu Glu Ile Ala Val
1 5 10 15
Lys Glu Pro Leu Asp Leu Ile Arg Leu Ser Leu Asp Glu Arg Ile Tyr
20 25 30
Val Lys Leu Arg Ser Asp Arg Glu Leu Arg Gly Lys Leu His Ala Tyr
35 40 45
Asp Gln His Leu Asn Met Ile Leu Gly Asp Val Glu Glu Ile Val Thr
50 55 60
Thr Val Glu Ile Asp Asp Glu Thr Tyr Glu Glu Ile Val Arg Thr Thr
65 70 75 80
Lys Arg Thr Ile Pro Phe Leu Phe Val Arg Gly Asp Gly Val Ile Leu
85 90 95
Val Ser Pro Pro Leu Arg Thr Ala
100
<210>70
<211>954
<212>DNA
<213>稻
<400>70
atttgggaca cgtgtacata actctttcgg tccgggaccc tctcttgttt ttcttcgttg 60
ctcgcgagct cttcccccct cgcctcgcct ccccacccaa caagcccgcg gcggcgacta 120
gggttttgac cccccggaat cccccctcct ctcgccgcct ccgcctccgc cgccgccgcc 180
ttcctccccg cgccggcgac gatctgctcc tcctcccccg ccggcatcgc tgtttccgga 240
tctagcgcaa gatgcttccg ctctcgctcc tcaagaccgc ccaggggcat cccatgctcg 300
tggagcttaa gaacggcgag acgtacaacg ggcacttggt gaactgcgac acgtggatga 360
acatccacct ccgggaggtt atttgcacct caaaggatgg tgataagttt tggaggatgc 420
cagaatgtta catccgtggg aacaccatca agtatcttcg ggttcctgat gaggtgattg 480
acaaggtcca ggaagagact tcaaagagca gatcagatag gaggccacca ggtgtaggcc 540
gcggaagagg aagaggtgat ataggtacta agcctggagg cagaggcatt gggcgtggcc 600
aggatgatgg tggcagcaaa ggcggtggtg gccgtggaag gggaggaatt ggaggtaaag 660
gtggcatcaa aggtgggggc cgcggacgtg ggtgagaggg aaggtcactt gtgggaatgc 720
cgctttttta aggctttgtg tcacatagat tgctttagga gggtgaagaa tggactggtg 780
gagtaagcat tgctttgctt tatcattttg tggtatgacc gaaaaatgtt tcatgggttc 840
agtagttacc agtgaagagg cagcggttgg cctgtctcga aacaatttgt ttgatgtctg 900
gaccctcgac tatattgaat attattgtgg ttattacttt gacctgttca tcgc 954
<210>71
<211>147
<212>PRT
<213>稻
<400>71
Met Leu Pro Leu Ser Leu Leu Lys Thr Ala Gln Gly His Pro Met Leu
1 5 10 15
Val Glu Leu Lys Asn Gly Glu Thr Tyr Asn Gly His Leu Val Asn Cys
20 25 30
Asp Thr Trp Met Asn Ile His Leu Arg Glu Val Ile Cys Thr Ser Lys
35 40 45
Asp Gly Asp Lys Phe Trp Arg Met Pro Glu Cys Tyr Ile Arg Gly Asn
50 55 60
Thr Ile Lys Tyr Leu Arg Val Pro Asp Glu Val Ile Asp Lys Val Gln
65 70 75 80
Glu Glu Thr Ser Lys Ser Arg Ser Asp Arg Arg Pro Pro Gly Val Gly
85 90 95
Arg Gly Arg Gly Arg Gly Asp Ile Gly Thr Lys Pro Gly Gly Arg Gly
100 105 110
Ile Gly Arg Gly Gln Asp Asp Gly Gly Ser Lys Gly Gly Gly Gly Arg
115 120 125
Gly Arg Gly Gly Ile Gly Gly Lys Gly Gly Ile Lys Gly Gly Gly Arg
130 135 140
Gly Arg Gly
145
<210>72
<211>681
<212>DNA
<213>稻
<400>72
acccaaagca gaagcctccg ccgccgcagc gccgctactc ttgcatcgcc tccgccgtag 60
ccgcgcgcgc ccttcccgtc gccgcttcca cctcgatctc cgccggagag ggcgtccgcc 120
gccatgtctc agaacaaccc ctcccagctc ctcccctcag agctgattga ccgctgcatc 180
gggtccaaga tttgggtgat tatgaagggt gacaaggagc tcgtcggcac tctctgtggg 240
ttcgatgtgt acgtcaacat ggtgctcgag gacgttactg agtatgaata cactgctgaa 300
ggccgtcgca taacaaagct tgatcagata ctcctaaacg gcaacaatat agctattttg 360
gttcctggtg gttctccccc agatgtggca taagcaagca cttccgtgat atacctgctt 420
gaggctgatg gaggcacaga ccggtgtttc cttacttcaa atgtatttct tccatttgtg 480
gctgtactga actttcttag ttaactgacc tgaagtagtg tacctgcaac agttgctcct 540
acatgatttg gcaatgctaa gtatgaggta cctcttgtag ctgtttatta ccattcttct 600
gcaacctgac tcagtaaaca ctaggtggtt gaagaaacct gataatggag agcatatcta 660
caattgttgt atttgtggtt c 681
<210>73
<211>89
<212>PRT
<213>稻
<400>73
Met Ser Gln Asn Asn Pro Ser Gln Leu Leu Pro Ser Glu Leu Ile Asp
1 5 10 15
Arg Cys Ile Gly Ser Lys Ile Trp Val Ile Met Lys Gly Asp Lys Glu
20 25 30
Leu Val Gly Thr Leu Cys Gly Phe Asp Val Tyr Val Asn Met Val Leu
35 40 45
Glu Asp Val Thr Glu Tyr Glu Tyr Thr Ala Glu Gly Arg Arg Ile Thr
50 55 60
Lys Leu Asp Gln Ile Leu Leu Asn Gly Asn Asn Ile Ala Ile Leu Val
65 70 75 80
Pro Gly Gly Ser Pro Pro Asp Val Ala
85
<210>74
<211>548
<212>DNA
<213>稻
<400>74
ctctctcttt ctcacccaac cccaactcta cacgcacgcg gcgacagcga gagagatgag 60
caccggcggc ggcgcggaca agtccggcgg cggcggcgga ggggcggtga agacgccctc 120
ggacttcctc aagtcgatca ggggacgccc cgtcgtcgtc aagctcaact ccggcgtcga 180
ctaccgaggt attttggctt gcctggatgg gtatatgaac attgcaatgg agcaaacgga 240
agagtatgtg aatggccaac tcaagaacaa gtatggtgat gccttcataa gaggcaacaa 300
tgttctatac atcagcactt cgaagaggac ccttacggat gacgcataga tcgagtggaa 360
cagagtcgac tctttttaac ttcaaaatcg ttaagctgat tggttgtgat ctctctctga 420
cccatgctcg tacctgctgt tttgaggtgg gaaaatgtat tgcatattgc tagacttatc 480
agaaacttct ttaatgtaac tgtatcagct ttgcaaagaa cttccggcca agatctccag 540
ttgcattt 548
<210>75
<211>97
<212>PRT
<213>稻
<400>75
Met Ser Thr Gly Gly Gly Ala Asp Lys Ser Gly Gly Gly Gly Gly Gly
1 5 10 15
Ala Val Lys Thr Pro Ser Asp Phe Leu Lys Ser Ile Arg Gly Arg Pro
20 25 30
Val Val Val Lys Leu Asn Ser Gly Val Asp Tyr Arg Gly Ile Leu Ala
35 40 45
Cys Leu Asp Gly Tyr Met Asn Ile Ala Met Glu Gln Thr Glu Glu Tyr
50 55 60
Val Asn Gly Gln Leu Lys Asn Lys Tyr Gly Asp Ala Phe Ile Arg Gly
65 70 75 80
Asn Asn Val Leu Tyr Ile Ser Thr Ser Lys Arg Thr Leu Thr Asp Asp
85 90 95
Ala
<210>76
<211>586
<212>DNA
<213>稻
<400>76
gaagaaaaaa aaagagaaaa acacaacacc atcaaccccc gcatccgcca ccgccgccac 60
caccccctaa ctccgatttg aagcgaccag aggccgcggc taaggtccgg gatgtcgggg 120
cgcaaggaga cggtgctgga cctggccaag ttcgtcgaca agggcgtcca ggtcaagctc 180
accggcggca ggcaagttac agggactttg aagggctatg accagcttct aaacttggtg 240
cttgatgaag cggttgaatt tgaaagagag caagatgatc cattgaaact atcagggaaa 300
accagacagc ttggtcttat tgtctgtagg ggtacagcgg tgatgcttgt atcgccaacc 360
gatggaacgg acgagattgc caaccccttc caatctgatg gtgcataaac ctgcaggagc 420
tgatggttct cctagtcaag atccatgctc tcccagtaga gaggcctttg tattaactca 480
tgtaatctgg tgccacagtc tcttatgact cgtgtctctt atgaacacca ggtggtggtc 540
tgttctgtac cactcgaaac tgatttctga agatccttgc tttgtg 586
<210>77
<211>98
<212>PRT
<213>稻
<400>77
Met Ser Gly Arg Lys Glu Thr Val Leu Asp Leu Ala Lys Phe Val Asp
1 5 10 15
Lys Gly Val Gln Val Lys Leu Thr Gly Gly Arg Gln Val Thr Gly Thr
20 25 30
Leu Lys Gly Tyr Asp Gln Leu Leu Asn Leu Val Leu Asp Glu Ala Val
35 40 45
Glu Phe Glu Arg Glu Gln Asp Asp Pro Leu Lys Leu Ser Gly Lys Thr
50 55 60
Arg Gln Leu Gly Leu Ile Val Cys Arg Gly Thr Ala Val Met Leu Val
65 70 75 80
Ser Pro Thr Asp Gly Thr Asp Glu Ile Ala Asn Pro Phe Gln Ser Asp
85 90 95
Gly Ala
<210>78
<211>718
<212>DNA
<213>稻
<400>78
ctctttcttc tctccaaaac acaaatcgtc gccgcatccc ctcaactccg gcgatcccct 60
tggcggcggc ggcggcttcc ccaatcaccc cactccacct gaactacagg atggcgtccg 120
ccggcccggg gctcgaatcg ctcgtcgacc agatcatatc cgtcatcaca aacgatggcc 180
gcaacattgt ggggacactc agaggattcg atcaagccac caacatcatc ctcgatgagt 240
cccatgagag ggtctattct accagggagg gagtgcaaca gcttgttctt gggttgtaca 300
tcataagggg cgacaacatc agcgtggtgg gggaggtgga tgaagaactg gatgcgaggc 360
tggatctatc gaatctgaga gcgcacccgc tgaagcccgt gatccactaa tggaaacgaa 420
tgaatgatgt actactacta gtagtaagct aaacctaaat gtagtgttgt cccagaagtt 480
gtgaagaagt gggtgctagt gttgccgatg agtgaacttc tttaacgtac gcgaggaagt 540
ccagcaagcg gatgagcgag catgaagaag aatgttatgg ttttatgtgg tggtggatgg 600
gtgatgcatg tttgttgaac acgaacacag acacagtgac tcagtgagtg aagatttggt 660
ttccattgta ttgtattgtt tgtgcagctg tatcaatgta catgaatgag gaaggcag 718
<210>79
<211>99
<212>PRT
<213>稻
<400>79
Met Ala Ser Ala Gly Pro Gly Leu Glu Ser Leu Val Asp Gln Ilc Ile
1 5 10 15
Ser Val Ile Thr Asn Asp Gly Arg Asn Ile Val Gly Thr Leu Arg Gly
20 25 30
Phe Asp Gln Ala Thr Asn Ile Ile Leu Asp Glu Ser His Glu Arg Val
35 40 45
Tyr Ser Thr Arg Glu Gly Val Gln Gln Leu Val Leu Gly Leu Tyr Ile
50 55 60
Ile Arg Gly Asp Asn Ile Ser Val Val Gly Glu Val Asp Glu Glu Leu
65 70 75 80
Asp Ala Arg Leu Asp Leu Ser Asn Leu Arg Ala His Pro Leu Lys Pro
85 90 95
Val Ile His
<210>80
<211>411
<212>DNA
<213>稻
<400>80
atgtcgtcgt gggccgggcc cgacgagatc ttcctctcca cgtccctggc cggcttcttg 60
gacaagaaac ttattgtcct actacgagat ggacggaagc tgcttggcac actctgctca 120
tttgatcagt ttgcaaatgt tgttcttcag ggtgcttgtg aacgagtaat tgtaggtgaa 180
ctatattgtg atgttcctct tggtctatat gtgatccggg gagagaatgt cgtattaatc 240
ggagaattgg tctggttttg gattgagcag gatcgtgaga aggatgaact ccctgctcac 300
atgacttgtg tttcagaggc tgaaataaga aaggctgaga aagcagaaag ggaagcgaga 360
gatctgaaag gttcaatgag gaagaggatg gagttcttag actttgatta g 411
<210>81
<211>136
<212>PRT
<213>稻
<400>81
Met Ser Ser Trp Ala Gly Pro Asp Glu Ile Phe Leu Ser Thr Ser Leu
1 5 10 15
Ala Gly Phe Leu Asp Lys Lys Leu Ile Val Leu Leu Arg Asp Gly Arg
20 25 30
Lys Leu Leu Gly Thr Leu Cys Ser Phe Asp Gln Phe Ala Asn Val Val
35 40 45
Leu Gln Gly Ala Cys Glu Arg Val Ile Val Gly Glu Leu Tyr Cys Asp
50 55 60
Val Pro Leu Gly Leu Tyr Val Ile Arg Gly Glu Asn Val Val Leu Ile
65 70 75 80
Gly Glu Leu Val Trp Phe Trp Ile Glu Gln Asp Arg Glu Lys Asp Glu
85 90 95
Leu Pro Ala His Met Thr Cys Val Ser Glu Ala Glu Ile Arg Lys Ala
100 105 110
Glu Lys Ala Glu Arg Glu Ala Arg Asp Leu Lys Gly Ser Met Arg Lys
115 120 125
Arg Met Glu Phe Leu Asp Phe Asp
130 135
<210>82
<211>297
<212>DNA
<213>亚麻(Linum usitatissimum)
<400>82
atggcttccg gtcttggact cgaatctctt gttgaccaaa ctatttctgt gatcacaaat 60
gatggccgca acatagtggg caacttgaaa ggcttcgatc aggccactaa tatcatcctc 120
gatgaatccc atgaacgtgt ttactccacc aaggaaggcg tgcaacaact ggttttgggc 180
ttgtacataa taaggggtga taatataagc gtgattgggg agcttgacga ggaacttgat 240
gcgcagcttg atatgtcgaa tctcagagca catcccctca aacctgtgat tcattga 297
<210>83
<211>98
<212>PRT
<213>亚麻
<400>83
Met Ala Ser Gly Leu Gly Leu Glu Ser Leu Val Asp Gln Thr Ile Ser
1 5 10 15
Val Ile Thr Asn Asp Gly Arg Asn Ile Val Gly Asn Leu Lys Gly Phe
20 25 30
Asp Gln Ala Thr Asn Ile Ile Leu Asp Glu Ser His Glu Arg Val Tyr
35 40 45
Ser Thr Lys Glu Gly Val Gln Gln Leu Val Leu Gly Leu Tyr Ile Ile
50 55 60
Arg Gly Asp Asn Ile Ser Val Ile Gly Glu Leu Asp Glu Glu Leu Asp
65 70 75 80
Ala Gln Leu Asp Met Ser Asn Leu Arg Ala His Pro Leu Lys Pro Val
85 90 95
Ile His
<210>84
<211>288
<212>DNA
<213>欧洲油菜(Brassica napus)
<400>84
atgggtctac ttcggtcatt tgatcaattt gcaaatgctg taatagaaga agcttatgaa 60
agagtcatcg tgggtgatct ctactgtgat attcccttgg gtctttacat aatccgtgga 120
gaaaatgttg tcttgattgg tgaactggac attgaaaagg aagagcttcc tgctcaaatg 180
gtccaagtct cagaggcaga gatcaaaagg gctcagaaag cagagaaaga agaaatgcta 240
ctgaagggtt tgatgcggaa aagaatggag ttccttgatc tcgattag 288
<210>85
<211>95
<212>PRT
<213>欧洲油菜
<400>85
Met Gly Leu Leu Arg Ser Phe Asp Gln Phe Ala Asn Ala Val Ile Glu
1 5 10 15
Glu Ala Tyr Glu Arg Val Ile Val Gly Asp Leu Tyr Cys Asp Ile Pro
20 25 30
Leu Gly Leu Tyr Ile Ile Arg Gly Glu Asn Val Val Leu Ile Gly Glu
35 40 45
Leu Asp Ile Glu Lys Glu Glu Leu Pro Ala Gln Met Val Gln Val Ser
50 55 60
Glu Ala Glu Ile Lys Arg Ala Gln Lys Ala Glu Lys Glu Glu Met Leu
65 70 75 80
Leu Lys Gly Leu Met Arg Lys Arg Met Glu Phe Leu Asp Leu Asp
85 90 95
<210>86
<211>387
<212>DNA
<213>欧洲油菜
<400>86
atgtcttggg ctggtcctga agatatttac ctttcaactt cactcgctag ttatctcgat 60
agaaagatac ttgtgctcct tagagatggt agaaagctaa tgggaacgct ccgttcattt 120
gatcaattcg ccaatgcggt tttagaaggt gcgtgcgaga gggtaattgt tggtgagcaa 180
tactgcgaca ttcctttagg cctctatgta atccgtggag agaatgttgt tctcattggt 240
gaccttgaca ctgagagaga ggagcttcct ccaaatatga ttcgcgtctc agagacagag 300
attaaaaggg cgcaaaaagt ggagagggaa gcgagtgagc tgagaggaac aatgaggaag 360
agaatggagt ttcttgactt cgattaa 387
<210>87
<211>128
<212>PRT
<213>欧洲油菜
<400>87
Met Ser Trp Ala Gly Pro Glu Asp Ile Tyr Leu Ser Thr Ser Leu Ala
1 5 10 15
Ser Tyr Leu Asp Arg Lys Ile Leu Val Leu Leu Arg Asp Gly Arg Lys
20 25 30
Leu Met Gly Thr Leu Arg Ser Phe Asp Gln Phe Ala Asn Ala Val Leu
35 40 45
Glu Gly Ala Cys Glu Arg Val Ile Val Gly Glu Gln Tyr Cys Asp Ile
50 55 60
Pro Leu Gly Leu Tyr Val Ile Arg Gly Glu Asn Val Val Leu Ile Gly
65 70 75 80
Asp Leu Asp Thr Glu Arg Glu Glu Leu Pro Pro Asn Met Ile Arg Val
85 90 95
Ser Glu Thr Glu Ile Lys Arg Ala Gln Lys Val Glu Arg Glu Ala Ser
100 105 110
Glu Leu Arg Gly Thr Met Arg Lys Arg Met Glu Phe Leu Asp Phe Asp
115 120 125
<210>88
<211>375
<212>DNA
<213>欧洲油菜
<400>88
tcttgggctg ctcctgatga tatcttcttc tccacttctc tcgccgccta cttagacaag 60
aagcttcttg tcttgcttcg tgatggtcgg aaactgatgg gtctacttcg gtcatttgat 120
caatttgcaa atgctgtaat agaagaagct tatgaaagag tcatcgtggg tgatctctac 180
tgtgatattc ccttaggtet ttacataatc cgtggagaaa atgttgtctt gattggtgaa 240
ctggacgttg aaaaggaaga gcttcctgct caaatggtcc aagtctcaga ggcagagatc 300
aaaagggctc agaaagcaga gaaagaagaa atgctactga agggtttgat gcggaaaaga 360
atggagttcc ttgat 375
<210>89
<211>128
<212>PRT
<213>欧洲油菜
<400>89
Met Ser Trp Ala Gly Pro Glu Asp Ile Tyr Leu Ser Thr Ser Leu Ala
1 5 10 15
Ser Tyr Leu Asp Arg Lys Ile Leu Val Leu Leu Arg Asp Gly Arg Lys
20 25 30
Leu Met Gly Thr Leu Arg Ser Phe Asp Gln Phe Ala Asn Ala Val Leu
35 40 45
Glu Gly Ala Cys Glu Arg Val Ile Val Gly Glu Gln Tyr Cys Asp Ile
50 55 60
Pro Leu Gly Leu Tyr Val Ile Arg Gly Glu Asn Val Val Leu Ile Gly
65 70 75 80
Asp Leu Asp Thr Glu Arg Glu Glu Leu Pro Pro Asn Met Ile Arg Val
85 90 95
Ser Glu Thr Glu Ile Lys Arg Ala Gln Lys Val Glu Arg Glu Ala Ser
100 105 110
Glu Leu Arg Gly Thr Met Arg Lys Arg Met Glu Phe Leu Asp Phe Asp
115 120 125
<210>90
<211>390
<212>DNA
<213>欧洲油菜
<400>90
atgcttcctc tttcgctact caagactgct caaggacatc ccatgcttgt ggagctcaag 60
aatggagaga catacaatgg gcatttagta aattgcgata cgtggatgaa catccatctg 120
cgtgaagtta tctgcacatc aaaggatgga gacaggtttt ggaggatgcc ggaatgttat 180
atccgtggta acactatcaa gtaccttcgt gttccagatg aggtgattga taaagtacag 240
gaggagaaga cccgcacaga taggaaacca ccaggggttg gacgtggaag aggacgtggt 300
atggatgatg gaggggccag aggacgaggc cgaggagctc caatggctaa gatgagtggc 360
aacagaggag cagggcgtgg gcgtggttga 390
<210>91
<211>129
<212>PRT
<213>欧洲油菜
<400>91
Met Leu Pro Leu Ser Leu Leu Lys Thr Ala Gln Gly His Pro Met Leu
1 5 10 15
Val Glu Leu Lys Asn Gly Glu Thr Tyr Asn Gly His Leu Val Asn Cys
20 25 30
Asp Thr Trp Met Asn Ile His Leu Arg Glu Val Ile Cys Thr Ser Lys
35 40 45
Asp Gly Asp Arg Phe Trp Arg Met Pro Glu Cys Tyr Ile Arg Gly Asn
50 55 60
Thr Ile Lys Tyr Leu Arg Val Pro Asp Glu Val Ile Asp Lys Val Gln
65 70 75 80
Glu Glu Lys Thr Arg Thr Asp Arg Lys Pro Pro Gly Val Gly Arg Gly
85 90 95
Arg Gly Arg Gly Met Asp Asp Gly Gly Ala Arg Gly Arg Gly Arg Gly
100 105 110
Ala Pro Met Ala Lys Met Ser Gly Asn Arg Gly Ala Gly Arg Gly Arg
115 120 125
Gly
<210>92
<211>390
<212>DNA
<213>欧洲油菜
<400>92
atgcttcctc tttcgctgct caagactgct caagggcatc ccatgcttgt ggagctcaag 60
aatggcgaga catacaatgg gcatttagtg aattgtgata cgtggatgaa cattcatctt 120
cgtgaagtca tctgcacatc aaaggacgga gacaggtttt ggaggatgcc ggagtgttac 180
atccgcggta acacgatcaa gtaccttcga gttccagatg aggtgattga taaagtacag 240
gaggagaaga cccgcacaga taggaaacca ccaggggttg gccgtgggag aggacgtggt 300
atggatgatg gaggggccag aggccgtggc cgaggagctc caatggcgaa gatgagtggc 360
aacagaggag caggtcgtgg gcgtggttga 390
<210>93
<211>129
<212>PRT
<213>欧洲油菜
<400>93
Met Leu Pro Leu Ser Leu Leu Lys Thr Ala Gln Gly His Pro Met Leu
1 5 10 15
Val Glu Leu Lys Asn Gly Glu Thr Tyr Asn Gly His Leu Val Asn Cys
20 25 30
Asp Thr Trp Met Asn Ile His Leu Arg Glu Val Ile Cys Thr Ser Lys
35 40 45
Asp Gly Asp Arg Phe Trp Arg Met Pro Glu Cys Tyr Ile Arg Gly Asn
50 55 60
Thr Ile Lys Tyr Leu Arg Val Pro Asp Glu Val Ile Asp Lys Val Gln
65 70 75 80
Glu Glu Lys Thr Arg Thr Asp Arg Lys Pro Pro Gly Val Gly Arg Gly
85 90 95
Arg Gly Arg Gly Met Asp Asp Gly Gly Ala Arg Gly Arg Gly Arg Gly
100 105 110
Ala Pro Met Ala Lys Met Ser Gly Asn Arg Gly Ala Gly Arg Gly Arg
115 120 125
Gly
<210>94
<211>390
<212>DNA
<213>欧洲油菜
<400>94
atgcttcctc tttcgctgct caagactgct caagggcatc ccatgcttgt ggagctcaag 60
aatggagaga cgtacaatgg gcatttagtg aattgtgata cgtggatgaa cattcatctg 120
cgtgaagtca tctgcacatc aaaggacgga gacaggtttt ggaggatgcc ggagtgttat 180
atccgcggta acactatcaa gtaccttcga gttccagatg aggtgattga taaagtacag 240
gaggagaaga cccgcacaga tagaaaacca ccaggggttg gacgtgggag aggacgtggt 300
gtggatgatg gaggggccag aggccgtggt cgaggagctc caatggcgaa gatgagtggc 360
aacagaggag caggtcgtgg ccgtggttga 390
<210>95
<211>129
<212>PRT
<213>欧洲油菜
<400>95
Met Leu Pro Leu Ser Leu Leu Lys Thr Ala Gln Gly His Pro Met Leu
1 5 10 15
Val Glu Leu Lys Asn Gly Glu Thr Tyr Asn Gly His Leu Val Asn Cys
20 25 30
Asp Thr Trp Met Asn Ile His Leu Arg Glu Val Ile Cys Thr Ser Lys
35 40 45
Asp Gly Asp Arg Phe Trp Arg Met Pro Glu Cys Tyr Ile Arg Gly Asn
50 55 60
Thr Ile Lys Tyr Leu Arg Val Pro Asp Glu Val Ile Asp Lys Val Gln
65 70 75 80
Glu Glu Lys Thr Arg Thr Asp Arg Lys Pro Pro Gly Val Gly Arg Gly
85 90 95
Arg Gly Arg Gly Val Asp Asp Gly Gly Ala Arg Gly Arg Gly Arg Gly
100 105 110
Ala Pro Met Ala Lys Met Ser Gly Asn Arg Gly Ala Gly Arg Gly Arg
115 120 125
Gly
<210>96
<211>450
<212>DNA
<213>大豆
<400>96
atgcttcccc tttcccttct caagactgcc caaggccacc ccatgctggt ggaactgaaa 60
aatggggaga cttataacgg gcacttggtt aattgtgata catggatgaa catccatctc 120
cgagaagtca tttgtacctc taaagatgga gatagatttt ggcgtatgcc tgagtgctac 180
attcgtggca ataccattaa gtaccttcgg gttcctgatg aggttattga caaagtccag 240
gaagaaacaa agagccgtac tgatcgcaaa ccccctggtg tgggacgtgg aaggggaaga 300
ggtagggatg atggtcctgg tggacgtcaa cctaaaggaa ttgggcgagg tattgatgag 360
ggtggagcta aaggacaagg aggacgaggc cggggtggtc caggtggaaa acccagtgga 420
aacagaggtg cagggcgagg tagaggttga 450
<210>97
<211>149
<212>PRT
<213>大豆
<400>97
Met Leu Pro Leu Ser Leu Leu Lys Thr Ala Gln Gly His Pro Met Leu
1 5 10 15
Val Glu Leu Lys Asn Gly Glu Thr Tyr Asn Gly His Leu Val Asn Cys
20 25 30
Asp Thr Trp Met Asn Ile His Leu Arg Glu Val Ile Cys Thr Ser Lys
35 40 45
Asp Gly Asp Arg Phe Trp Arg Met Pro Glu Cys Tyr Ile Arg Gly Asn
50 55 60
Thr Ile Lys Tyr Leu Arg Val Pro Asp Glu Val Ile Asp Lys Val Gln
65 70 75 80
Glu Glu Thr Lys Ser Arg Thr Asp Arg Lys Pro Pro Gly Val Gly Arg
85 90 95
Gly Arg Gly Arg Gly Arg Asp Asp Gly Pro Gly Gly Arg Gln Pro Lys
100 105 110
Gly Ile Gly Arg Gly Ile Asp Glu Gly Gly Ala Lys Gly Gln Gly Gly
115 120 125
Arg Gly Arg Gly Gly Pro Gly Gly Lys Pro Ser Gly Asn Arg Gly Ala
130 135 140
Gly Arg Gly Arg Gly
145
<210>98
<211>450
<212>DNA
<213>大豆
<400>98
atgctgcccc tttcccttct caagactgcc caaggccacc ctatgctagt ggaactgaaa 60
aatggggaga cttataacgg gcacttggtt aattgtgata catggatgaa cattcatctc 120
cgagaagtca tttgtacctc taaagatgga gatagatttt ggcgtatgcc cgagtgctac 180
attcgcggca ataccataaa gtaccttcgg gttcctgatg aggttattga caaagtccag 240
gaagaaacaa agagccgcac tgatcgcaaa ccccctggtg tgggacgtgg aagaggaaga 300
ggtagggagg atggtcctgg tggacgtcaa ccaaaaggaa ttgggcgtgg ccttgatgaa 360
ggtggaccta aaggacaagg aggacgaggt aggggtggtc ccggtggaaa gcctggtgga 420
aacagaggtg gagggcgagg tagaggttga 450
<210>99
<211>149
<212>PRT
<213>大豆
<400>99
Met Leu Pro Leu Ser Leu Leu Lys Thr Ala Gln Gly His Pro Met Leu
1 5 10 15
Val Glu Leu Lys Asn Gly Glu Thr Tyr Asn Gly His Leu Val Asn Cys
20 25 30
Asp Thr Trp Met Asn Ile His Leu Arg Glu Val Ile Cys Thr Ser Lys
35 40 45
Asp Gly Asp Arg Phe Trp Arg Met Pro Glu Cys Tyr Ile Arg Gly Asn
50 55 60
Thr Ile Lys Tyr Leu Arg Val Pro Asp Glu Val Ile Asp Lys Val Gln
65 70 75 80
Glu Glu Thr Lys Ser Arg Thr Asp Arg Lys Pro Pro Gly Val Gly Arg
85 90 95
Gly Arg Gly Arg Gly Arg Glu Asp Gly Pro Gly Gly Arg Gln Pro Lys
100 105 110
Gly Ile Gly Arg Gly Leu Asp Glu Gly Gly Pro Lys Gly Gln Gly Gly
115 120 125
Arg Gly Arg Gly Gly Pro Gly Gly Lys Pro Gly Gly Asn Arg Gly Gly
130 135 140
Gly Arg Gly Arg Gly
145
<210>100
<211>450
<212>DNA
<213>大豆
<400>100
atgcttcccc tttcccttct caagactgcc caaggccacc ccatgctggt ggaactgaaa 60
aatggggaga cttataacgg gcacttggtt aattgtgata catggatgaa catccatctc 120
cgagaagtca tttgtacctc taaagatgga gatagatttt ggcgtatgcc tgagtgctac 180
attcgtggca ataccattaa gtaccttcgg gttcctgatg aggttattga caaagtccag 240
gaagaaacaa agagccgtac tgatcgcaaa ccccctggtg tgggacgtgg aaggggaaga 300
ggtagggatg atggtcctgg tggacgtcaa cctaaaggaa ttgggcgagg tattgatgag 360
ggtggagcta aaggacaagg aggacgaggc cggggtggtc caggtggaaa acccagtgga 420
aacagaggtg cagggcgagg tagaggttga 450
<210>101
<211>149
<212>PRT
<213>大豆
<400>101
Met Leu Pro Leu Ser Leu Leu Lys Thr Ala Gln Gly His Pro Met Leu
1 5 10 15
Val Glu Leu Lys Asn Gly Glu Thr Tyr Asn Gly His Leu Val Asn Cys
20 25 30
Asp Thr Trp Mot Asn Ile His Leu Arg Glu Val Ile Cys Thr Ser Lys
35 40 45
Asp Gly Asp Arg Phe Trp Arg Met Pro Glu Cys Tyr Ile Arg Gly Asn
50 55 60
Thr Ile Lys Tyr Leu Arg Val Pro Asp Glu Val Ile Asp Lys Val Gln
65 70 75 80
Glu Glu Thr Lys Ser Arg Thr Asp Arg Lys Pro Pro Gly Val Gly Arg
85 90 95
Gly Arg Gly Arg Gly Arg Asp Asp Gly Pro Gly Gly Arg Gln Pro Lys
100 105 110
Gly Ile Gly Arg Gly Ile Asp Glu Gly Gly Ala Lys Gly Gln Gly Gly
115 120 125
Arg Gly Arg Gly Gly Pro Gly Gly Lys Pro Ser Gly Asn Arg Gly Ala
130 135 140
Gly Arg Gly Arg Gly
145
<210>102
<211>264
<212>DNA
<213>大豆
<400>102
atggccaaca atccgtcaca gcttctccca tcagagttga ttgaccggtg tataggttcg 60
aaaatttggg tgataatgaa gggtgacaag gagcttgttg gtactcttag aggctttgat 120
gtttatgtca acatggtcct tgaagatgtt actgaatatg agatcactgc tgaagggaga 180
cggataacca agcttgatca gattttactc aatggaaaca acattgccat tttggtccct 240
ggtggttctc ctgagtcaga atga 264
<210>103
<211>87
<212>PRT
<213>大豆
<400>103
Met Ala Asn Asn Pro Ser Gln Leu Leu Pro Ser Glu Leu Ile Asp Arg
1 5 10 15
Cys Ile Gly Ser Lys Ile Trp Val Ile Met Lys Gly Asp Lys Glu Leu
20 25 30
Val Gly Thr Leu Arg Gly Phe Asp Val Tyr Val Asn Met Val Leu Glu
35 40 45
Asp Val Thr Glu Tyr Glu Ile Thr Ala Glu Gly Arg Arg Ile Thr Lys
50 55 60
Leu Asp Gln Ile Leu Leu Asn Gly Asn Asn Ile Ala Ile Leu Val Pro
65 70 75 80
Gly Gly Ser Pro Glu Ser Glu
85
<210>104
<211>387
<212>DNA
<213>大麦(Hordeum vulgare)
<400>104
atgtcttggg ccgggcccga cgagatcctc ctctccacct ccctggccgg cttcttagat 60
aaaaaactga ttgtcctgct acgagatgga cgaaagctgc ttggcactct ctgctcattc 120
gatcagtttg caaatgttgt tcttcagggt gcttgtgaac gagtgattgt gggcgaatta 180
tattgtgatg ttcctcttgg tttatatgtg atccggggag agaatgttgt attaattgga 240
gaactggatc gtgagaagga cgaactccct agccacatga cttgtgtttc agaggctgaa 300
ataagaacgg ccgagaaagc cgaaaaggaa gcaagggatc tgaaaggcac aatgaggaag 360
aggatggagt tcctagactt cgattag 387
<210>105
<211>128
<212>PRT
<213>大麦
<400>105
Met Ser Trp Ala Gly Pro Asp Glu Ile Leu Leu Ser Thr Ser Leu Ala
1 5 10 15
Gly Phe Leu Asp Lys Lys Leu Ile Val Leu Leu Arg Asp Gly Arg Lys
20 25 30
Leu Leu Gly Thr Leu Cys Ser Phe Asp Gln Phe Ala Asn Val Val Leu
35 40 45
Gln Gly Ala Cys Glu Arg Val Ile Val Gly Glu Leu Tyr Cys Asp Val
50 55 60
Pro Leu Gly Leu Tyr Val Ile Arg Gly Glu Asn Val Val Leu Ile Gly
65 70 75 80
Glu Leu Asp Arg Glu Lys Asp Glu Leu Pro Ser His Met Thr Cys Val
85 90 95
Ser Glu Ala Glu Ile Arg Thr Ala Glu Lys Ala Glu Lys Glu Ala Arg
100 105 110
Asp Leu Lys Gly Thr Met Arg Lys Arg Met Glu Phe Leu Asp Phe Asp
115 120 125
<210>106
<211>432
<212>DNA
<213>大麦
<400>106
atgcttcccc tctcgctcct caagaccgcc caggggcatc ccatgctcgt ggagctcaag 60
aacggcgaga cctacaatgg gcacttggtc aactgcgaca cgtggatgaa catccacctc 120
cgggaggtta tttgcacctc taaggatggt gataagtttt ggaggatgcc ggagtgctat 180
attcgtggta acacaatcaa gtatcttcgg gttcctgatg aggtgattga caaggttcaa 240
gaggaaactt ctaagagtag atcagatagg aagccgccag gtgttggccg cggaagagga 300
agaggagata taggcactaa acctggaggc agaggcatcg ggcgtggcca agatgatggc 360
aaaggcggtg gccgtggaag gggcggaatt ggaagtaaag gtggcaacaa aggtggacgt 420
ggccgtgggt ga 432
<210>107
<211>143
<212>PRT
<213>大麦
<400>107
Met Leu Pro Leu Ser Leu Leu Lys Thr Ala Gln Gly His Pro Met Leu
1 5 10 15
Val Glu Leu Lys Asn Gly Glu Thr Tyr Asn Gly His Leu Val Asn Cys
20 25 30
Asp Thr Trp Met Asn Ile His Leu Arg Glu Val Ile Cys Thr Ser Lys
35 40 45
Asp Gly Asp Lys Phe Trp Arg Met Pro Glu Cys Tyr Ile Arg Gly Asn
50 55 60
Thr Ile Lys Tyr Leu Arg Val Pro Asp Glu Val Ile Asp Lys Val Gln
65 70 75 80
Glu Glu Thr Ser Lys Ser Arg Ser Asp Arg Lys Pro Pro Gly Val Gly
85 90 95
Arg Gly Arg Gly Arg Gly Asp Ile Gly Thr Lys Pro Gly Gly Arg Gly
100 105 110
Ile Gly Arg Gly Gln Asp Asp Gly Lys Gly Gly Gly Arg Gly Arg Gly
115 120 125
Gly Ile Gly Ser Lys Gly Gly Asn Lys Gly Gly Arg Gly Arg Gly
130 135 140
<210>108
<211>387
<212>DNA
<213>普通小麦(Triticum aestivum)
<400>108
atgtcttggg ccgggcccga cgagatcctc ctctccacct ccctggccgg cttcttggat 60
aaaaaactaa ttgtcctact acgagatgga cgaaagctgc ttggcaccct ctgctcattc 120
gatcagtttg caaatgttgt tcttcagggt gcttgtgaac gagtaattgt gggcgaatta 180
tattgtgatg ttcctcttgg tttatatgtg atccggggag agaatgttgt attaattgga 240
gaactggatc gtgagaagga cgaactccct agtcacatga cttgtgtttc agaggctgaa 300
ataagaacgg ccgagaaagc tgaaaaggaa gcaagggatc tgaaaggcac aatgaggaag 360
aggatggagt tcctagactt cgattag 387
<210>109
<211>128
<212>PRT
<213>普通小麦
<400>109
Met Ser Trp Ala Gly Pro Asp Glu Ile Leu Leu Ser Thr Ser Leu Ala
1 5 10 15
Gly Phe Leu Asp Lys Lys Leu Ile Val Leu Leu Arg Asp Gly Arg Lys
20 25 30
Leu Leu Gly Thr Leu Cys Ser Phe Asp Gln Phe Ala Asn Val Val Leu
35 40 45
Gln Gly Ala Cys Glu Arg Val Ile Val Gly Glu Leu Tyr Cys Asp Val
50 55 60
Pro Leu Gly Leu Tyr Val Ile Arg Gly Glu Asn Val Val Leu Ile Gly
65 70 75 80
Glu Leu Asp Arg Glu Lys Asp Glu Leu Pro Ser His Met Thr Cys Val
85 90 95
Ser Glu Ala Glu Ile Arg Thr Ala Glu Lys Ala Glu Lys Glu Ala Arg
100 105 110
Asp Leu Lys Gly Thr Met Arg Lys Arg Met Glu Phe Leu Asp Phe Asp
115 120 125
<210>110
<211>432
<212>DNA
<213>普通小麦
<400>110
atgcttcccc tctcgctcct caagaccgcc caggggcatc ccatgctcgt ggagctcaaa 60
aacggcgaga cctacaatgg gcacttggtg aactgcgaca cgtggatgaa catccacctc 120
cgggaggtta tttgcacctc caaggatggt gataagtttt ggaggatgcc ggagtgctat 180
attcgtggga acacaatcaa gtatcttcgg gttcctgatg aggtgattga caaggttcaa 240
gaggaaactt ctaagagtag atctgatagg aagccaccag gtgttggccg cggaagagga 300
agaggagata taggcactaa acctgggggc agaggcatcg gacgtggcca agatgatggc 360
aaaggcggtg gccgcggaag gggcggaatt ggaagtaaag gtggcaacaa aggcggacgt 420
ggtcgtgggt aa 432
<210>111
<211>143
<212>PRT
<213>普通小麦
<400>111
Met Leu Pro Leu Ser Leu Leu Lys Thr Ala Gln Gly His Pro Met Leu
1 5 10 15
Val Glu Leu Lys Asn Gly Glu Thr Tyr Asn Gly His Leu Val Asn Cys
20 25 30
Asp Thr Trp Met Asn Ile His Leu Arg Glu Val Ile Cys Thr Ser Lys
35 40 45
Asp Gly Asp Lys Phe Trp Arg Met Pro Glu Cys Tyr Ile Arg Gly Asn
50 55 60
Thr Ile Lys Tyr Leu Arg Val Pro Asp Glu Val Ile Asp Lys Val Gln
65 70 75 80
Glu Glu Thr Ser Lys Ser Arg Ser Asp Arg Lys Pro Pro Gly Val Gly
85 90 95
Arg Gly Arg Gly Arg Gly Asp Ile Gly Thr Lys Pro Gly Gly Arg Gly
100 105 110
Ile Gly Arg Gly Gln Asp Asp Gly Lys Gly Gly Gly Arg Gly Arg Gly
115 120 125
Gly Ile Gly Ser Lys Gly Gly Asn Lys Gly Gly Arg Gly Arg Gly
130 135 140
<210>112
<211>432
<212>DNA
<213>普通小麦
<400>112
atgcttcccc tctcgctcct caagaccgcc caggggcatc ccatgctcgt ggagctcaag 60
aacggcgaga cctacaatgg gcacttggtg aactgcgaca cgtggatgaa catccacctc 120
cgggaggtta tttgcacctc taaggatggt gataagtttt ggaggatgcc ggagtgctat 180
attcgtggta acacgatcaa gtatcttcgg gttcctgatg aggtgattga caaggttcaa 240
gaggaaactt ctaagagtag atcagatagg aagccaccag gtgttggtcg tggaagagga 300
agaggagata taggcactaa acctggaggc agaggcattg gtcgtggcca agatgatggc 360
aaaggcggtg gccgtggaag gggcggaatt ggaagtaaag gtggcaacaa aggcggacgt 420
ggtcgtgggt aa 432
<210>113
<211>143
<212>PRT
<213>普通小麦
<400>113
Met Leu Pro Leu Ser Leu Leu Lys Thr Ala Gln Gly His Pro Met Leu
1 5 10 15
Val Glu Leu Lys Asn Gly Glu Thr Tyr Asn Gly His Leu Val Asn Cys
20 25 30
Asp Thr Trp Met Asn Ile His Leu Arg Glu Val Ile Cys Thr Ser Lys
35 40 45
Asp Gly Asp Lys Phe Trp Arg Met Pro Glu Cys Tyr Ile Arg Gly Asn
50 55 60
Thr Ile Lys Tyr Leu Arg Val Pro Asp Glu Val Ile Asp Lys Val Gln
65 70 75 80
Glu Glu Thr Ser Lys Ser Arg Ser Asp Arg Lys Pro Pro Gly Val Gly
85 90 95
Arg Gly Arg Gly Arg Gly Asp Ile Gly Thr Lys Pro Gly Gly Arg Gly
100 105 110
Ile Gly Arg Gly Gln Asp Asp Gly Lys Gly Gly Gly Arg Gly Arg Gly
115 120 125
Gly Ile Gly Ser Lys Gly Gly Asn Lys Gly Gly Arg Gly Arg Gly
130 135 140
<210>114
<211>387
<212>DNA
<213>玉米
<400>114
atgtcttggt ccgcgcccga cgacatcctc ctctccacct cactcgcggg cttcctggac 60
aagaaactta ttgtcctgct aagagatgga cggaaacttc ttggcaccct ctgctcattt 120
gatcagtttg caaatgttgt tcttcagggt gcttgtgaac gagtgattgt agggggacaa 180
tattgtgatg ttcctcttgg tctgtatgtg atccggggag agaacgttgt tttaatcgga 240
gaattggatc acgaaaagga tgaactcccc gctcacatga catgtgtttt agaagcagaa 300
attagaaagg ctgagaaggc ggagcgggaa gcaagggatc tgaaaggcac gatgaggaaa 360
cggatggagt tcctagactt cgactga 387
<210>115
<211>128
<212>PRT
<213>玉米
<400>115
Met Ser Trp Ser Ala Pro Asp Asp Ile Leu Leu Ser Thr Ser Leu Ala
1 5 10 15
Gly Phe Leu Asp Lys Lys Leu Ile Val Leu Leu Arg Asp Gly Arg Lys
20 25 30
Leu Leu Gly Thr Leu Cys Ser Phe Asp Gln Phe Ala Asn Val Val Leu
35 40 45
Gln Gly Ala Cys Glu Arg Val Ile Val Gly Gly Gln Tyr Cys Asp Val
50 55 60
Pro Leu Gly Leu Tyr Val Ile Arg Gly Glu Asn Val Val Leu Ile Gly
65 70 75 80
Glu Leu Asp His Glu Lys Asp Glu Leu Pro Ala His Met Thr Cys Val
85 90 95
Leu Glu Ala Glu Ile Arg Lys Ala Glu Lys Ala Glu Arg Glu Ala Arg
100 105 110
Asp Leu Lys Gly Thr Met Arg Lys Arg Met Glu Phe Leu Asp Phe Asp
115 120 125
<210>116
<211>441
<212>DNA
<213>玉米
<400>116
atgcttcccc tctcgctcct caagaccgcc caggggcacc caatgctcgt ggagctgaag 60
aatggtgaga cgtacaacgg gcatctggtc aattgcgaca cgtggatgaa catccacctt 120
agggaggtta tttgcacctc aaaggatggt gacaagtttt ggaggatgcc agagtgttac 180
attcgtggga acaccattaa gtatcttcga gttcctgatg aggtgattga caaggttcag 240
gaggaaactt ccaaaagccg gtcagatagg aagccaccag gtgttggccg cggaagagga 300
aggggggacg ttggtgctaa acctggaggc agaggcatcg gacgtggcca agatgatgga 360
ggtagaggca gtggtggccg aggaaggggt ggagttggtg ccaaaggtgg taacaaaggt 420
gggggccgtg gccgtggcta a 441
<210>117
<211>146
<212>PRT
<213>玉米
<400>117
Met Leu Pro Leu Ser Leu Leu Lys Thr Ala Gln Gly His Pro Met Leu
1 5 10 15
Val Glu Leu Lys Asn Gly Glu Thr Tyr Asn Gly His Leu Val Asn Cys
20 25 30
Asp Thr Trp Met Asn Ile His Leu Arg Glu Val Ile Cys Thr Ser Lys
35 40 45
Asp Gly Asp Lys Phe Trp Arg Met Pro Glu Cys Tyr Ile Arg Gly Asn
50 55 60
Thr Ile Lys Tyr Leu Arg Val Pro Asp Glu Val Ile Asp Lys Val Gln
65 70 75 80
Glu Glu Thr Ser Lys Ser Arg Ser Asp Arg Lys Pro Pro Gly Val Gly
85 90 95
Arg Gly Arg Gly Arg Gly Asp Val Gly Ala Lys Pro Gly Gly Arg Gly
100 105 110
Ile Gly Arg Gly Gln Asp Asp Gly Gly Arg Gly Ser Gly Gly Arg Gly
115 120 125
Arg Gly Gly Val Gly Ala Lys Gly Gly Asn Lys Gly Gly Gly Arg Gly
130 135 140
Arg Gly
145
<210>118
<211>82
<212>PRT
<213>人工序列
<220>
<223>结构域
<220>
<221>未确定
<222>(4)..(4)
<223>Xaa可为任一天然存在的氨基酸
<220>
<221>未确定
<222>(10)..(10)
<223>Xaa可为任一天然存在的氨基酸
<220>
<221>未确定
<222>(13)..(14)
<223>Xaa可为任一天然存在的氨基酸
<220>
<221>未确定
<222>(18)..(18)
<223>Xaa可为任一天然存在的氨基酸
<220>
<221>未确定
<222>(21)..(21)
<223>Xaa可为任一天然存在的氨基酸
<220>
<221>未确定
<222>(24)..(24)
<223>Xaa可为任一天然存在的氨基酸
<220>
<221>未确定
<222>(26)..(26)
<223>Xaa可为任一天然存在的氨基酸
<220>
<221>未确定
<222>(28)..(28)
<223>Xaa可为任一天然存在的氨基酸
<220>
<221>未确定
<222>(30)..(31)
<223>Xaa可为任一天然存在的氨基酸
<220>
<221>未确定
<222>(41)..(41)
<223>Xaa可为任一天然存在的氨基酸
<220>
<221>未确定
<222>(44)..(44)
<223>Xaa可为任一天然存在的氨基酸
<220>
<221>未确定
<222>(46)..(46)
<223>Xaa可为任一天然存在的氨基酸
<220>
<221>未确定
<222>(48)..(49)
<223>Xaa可为任一天然存在的氨基酸
<220>
<221>未确定
<222>(52)..(62)
<223>Xaa可为任一天然存在的氨基酸
<220>
<221>未确定
<222>(64)..(64)
<223>Xaa可为任一天然存在的氨基酸
<220>
<221>未确定
<222>(66)..(67)
<223>Xaa可为任一天然存在的氨基酸
<220>
<221>未确定
<222>(72)..(73)
<223>Xaa可为任一天然存在的氨基酸
<220>
<221>未确定
<222>(76)..(76)
<223>Xaa可为任一天然存在的氨基酸
<220>
<221>未确定
<222>(79)..(81)
<223>Xaa可为任一天然存在的氨基酸
<400>118
Met Leu Pro Xaa Ser Leu Leu Lys Thr Xaa Leu Gly Xaa Xaa Met Leu
1 5 10 15
Val Xaa Leu Lys Xaa Gly Arg Xaa Leu Xaa Gly Xaa Leu Xaa Xaa Phe
20 25 30
Asp Gln Trp Met Asn Ile Val Leu Xaa Glu Val Xaa Glu Xaa Val Xaa
35 40 45
Xaa Gly Asp Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Leu Xaa
50 55 60
Glu Xaa Xaa Ile Arg Gly Asn Xaa Xaa Asn Ile Xaa Tyr Leu Xaa Xaa
65 70 75 80
Xaa Asp
<210>119
<211>92
<212>PRT
<213>人工序列
<220>
<223>结构域
<220>
<221>未确定
<222>(1)..(7)
<223>Xaa可为任一天然存在的氨基酸
<220>
<221>未确定
<222>(10)..(10)
<223>Xaa可为任一天然存在的氨基酸
<220>
<221>未确定
<222>(12)..(17)
<223>Xaa可为任一天然存在的氨基酸
<220>
<221>未确定
<222>(21)..(21)
<223>Xaa可为任一天然存在的氨基酸
<220>
<221>未确定
<222>(26)..(27)
<223>Xaa可为任一天然存在的氨基酸
<220>
<221>未确定
<222>(29)..(29)
<223>Xaa可为任一天然存在的氨基酸
<220>
<221>未确定
<222>(31)..(31)
<223>Xaa可为任一天然存在的氨基酸
<220>
<221>未确定
<222>(33)..(34)
<223>Xaa可为任一天然存在的氨基酸
<220>
<221>未确定
<222>(37)..(37)
<223>Xaa可为任一天然存在的氨基酸
<220>
<221>未确定
<222>(39)..(39)
<223>Xaa可为任一天然存在的氨基酸
<220>
<221>未确定
<222>(44)..(64)
<223>Xaa可为任一天然存在的氨基酸
<220>
<221>未确定
<222>(66)..(78)
<223>Xaa可为任一天然存在的氨基酸
<220>
<221>未确定
<222>(85)..(85)
<223>Xaa可为任一天然存在的氨基酸
<220>
<221>未确定
<222>(89)..(89)
<223>Xaa可为任一天然存在的氨基酸
<220>
<221>未确定
<222>(91)..(92)
<223>Xaa可为任一天然存在的氨基酸
<400>119
Xaa Xaa Xaa Xaa Xaa Xaa Xaa Leu Asn Xaa Ala Xaa Xaa Xaa Xaa Xaa
1 5 10 15
Xaa Val Thr Val Xaa Leu Lys Asn Gly Xaa Xaa Leu Xaa Gly Xaa Val
20 25 30
Xaa Xaa Phe Asp Xaa Phe Xaa Asn Leu Leu Leu Xaa Xaa Xaa Xaa Xaa
35 40 45
Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa
50 55 60
Lys Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Leu Val
65 70 75 80
Tyr Leu Arg Gly Xaa Ser Ile Ile Xaa Ile Xaa Xaa
85 90
<210>120
<211>83
<212>PRT
<213>人工序列
<220>
<223>结构域
<400>120
Met Ser Trp Ala Ala Pro Asp Asp Ile Phe Phe Ser Thr Ser Leu Ala
1 5 10 15
Ala Tyr Leu Asp Lys Lys Leu Leu Val Leu Leu Arg Asp Gly Arg Lys
20 25 30
Leu Met Gly Leu Leu Arg Ser Phe Asp Gln Phe Ala Asn Ala Val Leu
35 40 45
Glu Glu Ala Tyr Glu Arg Val Ile Val Gly Asp Leu Tyr Cys Asp Ile
50 55 60
Pro Leu Gly Leu Tyr Ile Ile Arg Gly Glu Asn Val Val Leu Ile Gly
65 70 75 80
Glu Leu Asp
<210>121
<211>83
<212>PRT
<213>人工序列
<220>
<223>结构域
<400>121
Met Ser Trp Ala Gly Pro Glu Glu Ile Tyr Leu Ser Thr Ser Leu Ala
1 5 10 15
Ser Tyr Leu Asp Arg Lys Leu Leu Val Leu Leu Arg Asp Gly Arg Lys
20 25 30
Leu Met Gly Thr Leu Arg Ser Phe Asp Gln Phe Ala Asn Ala Val Leu
35 40 45
Glu Gly Ala Cys Glu Arg Val Ile Val Gly Glu Gln Tyr Cys Asp Ile
50 55 60
Pro Leu Gly Leu Tyr Val Ile Arg Gly Glu Asn Val Val Leu Ile Gly
65 70 75 80
Glu Leu Asp
<210>122
<211>74
<212>PRT
<213>人工序列
<220>
<223>结构域
<400>122
Met Leu Phe Phe Ser Tyr Phe Lys Asp Leu Val Gly Gln Glu Val Thr
1 5 10 15
Val Glu Leu Lys Asn Asp Leu Ala Ile Arg Gly Thr Leu His Ser Val
20 25 30
Asp Gln Tyr Leu Asn Ile Lys Leu Glu Asn Thr Arg Val Val Asp Gln
35 40 45
Asp Lys Tyr Pro His Met Leu Ser Val Arg Asn Cys Phe Ile Arg Gly
50 55 60
Ser Val Val Arg Tyr Val Gln Leu Pro Lys
65 70
<210>123
<211>84
<212>PRT
<213>人工序列
<220>
<223>结构域
<400>123
Met Ser Val Glu Glu Asp Ala Thr Val Arg Glu Pro Leu Asp Leu Ile
1 5 10 15
Arg Leu Ser Ile Glu Glu Arg Ile Tyr Val Lys Leu Arg Ser Asp Arg
20 25 30
Glu Leu Arg Gly Lys Leu His Ala Phe Asp Gln His Leu Asn Met Ile
35 40 45
Leu Gly Asp Val Glu Glu Val Ile Thr Thr Ile Glu Ile Asp Asp Glu
50 55 60
Thr Tyr Glu Glu Ile Val Arg Thr Thr Lys Arg Thr Val Pro Phe Leu
65 70 75 80
Phe Val Arg Gly
<210>124
<211>84
<212>PRT
<213>人工序列
<220>
<223>结构域
<400>124
Met Ser Gly Glu Glu Glu Ala Thr Val Arg Glu Pro Leu Asp Leu Ile
1 5 10 15
Arg Leu Ser Leu Asp Glu Arg Ile Tyr Val Lys Leu Arg Ser Asp Arg
20 25 30
Glu Leu Arg Gly Lys Leu His Ala Phe Asp Gln His Leu Asn Met Ile
35 40 45
Leu Gly Asp Val Glu Glu Thr Ile Thr Thr Val Glu Ile Asp Asp Glu
50 55 60
Thr Tyr Glu Glu Ile Val Arg Thr Thr Lys Arg Thr Ile Glu Phe Leu
65 70 75 80
Phe Val Arg Gly
<210>125
<211>73
<212>PRT
<213>人工序列
<220>
<223>结构域
<400>125
Met Leu Pro Leu Ser Leu Leu Lys Thr Ala Gln Gly His Pro Met Leu
1 5 10 15
Val Glu Leu Lys Asn Gly Glu Thr Tyr Asn Gly His Leu Val Asn Cys
20 25 30
Asp Thr Trp Met Asn Ile His Leu Arg Glu Val Ile Cys Thr Ser Lys
35 40 45
Asp Gly Asp Arg Phe Trp Arg Met Pro Glu Cys Tyr Ile Arg Gly Asn
50 55 60
Thr Ile Lys Tyr Leu Arg Val Pro Asp
65 70
<210>126
<211>82
<212>PRT
<213>人工序列
<220>
<223>结构域
<400>126
Met Ala Asn Asn Pro Ser Gln Leu Leu Pro Ser Glu Leu Ile Asp Arg
1 5 10 15
Cys Ile Gly Ser Lys Ile Trp Val Ile Met Lys Gly Asp Lys Glu Leu
20 25 30
Val Gly Ile Leu Lys Gly Phe Asp Val Tyr Val Asn Met Val Leu Glu
35 40 45
Asp Val Thr Glu Tyr Glu Ile Thr Ala Glu Gly Arg Arg Val Thr Lys
50 55 60
Leu Asp Gln Ile Leu Leu Asn Gly Asn Asn Ile Ala Ile Leu Val Pro
65 70 75 80
Gly Gl y
<210>127
<211>84
<212>PRT
<213>人工序列
<220>
<223>结构域
<400>127
Met Ser Gly Val Glu Glu Lys Val Ser Gly Thr Thr Lys Thr Pro Ala
1 5 10 15
Asp Phe Leu Lys Ser Ile Arg Gly Arg Pro Val Val Val Lys Leu Asn
20 25 30
Ser Gly Val Asp Tyr Arg Gly Thr Leu Thr Cys Leu Asp Gly Tyr Met
35 40 45
Asn Ile Ala Met Glu Gln Thr Glu Glu Tyr Val Asn Gly Gln Leu Lys
50 55 60
Asn Lys Tyr Gly Asp Ala Phe Ile Arg Gly Asn Asn Val Leu Tyr Ile
65 70 75 80
Ser Thr Val Asn
<210>128
<211>84
<212>PRT
<213>人工序列
<220>
<223>结构域
<400>128
Met Ser Gly Val Gly Glu Lys Ala Ser Gly Thr Thr Lys Thr Pro Ala
1 5 10 15
Asp Phe Leu Lys Ser Ile Arg Gly Lys Pro Val Val Val Lys Leu Asn
20 25 30
Ser Gly Val Asp Tyr Arg Gly Ile Leu Thr Cys Leu Asp Gly Tyr Met
35 40 45
Asn Ile Ala Met Glu Gln Thr Glu Glu Tyr Val Asn Gly Gln Leu Lys
50 55 60
Asn Thr Tyr Gly Asp Ala Phe Val Arg Gly Asn Asn Val Leu Tyr Ile
65 70 75 80
Ser Thr Thr Lys
<210>129
<211>84
<212>PRT
<213>人工序列
<220>
<223>结构域
<400>129
Met Ser Gly Arg Lys Glu Thr Val Leu Asp Leu Ala Lys Phe Val Asp
1 5 10 15
Lys Gly Val Gln Val Lys Leu Thr Gly Gly Arg Gln Val Thr Gly Thr
20 25 30
Leu Lys Gly Tyr Asp Gln Leu Leu Asn Leu Val Leu Asp Glu Ala Val
35 40 45
Glu Phe Val Arg Asp His Asp Asp Pro Leu Lys Thr Thr Asp Gln Thr
50 55 60
Arg Arg Leu Gly Leu Ile Val Cys Arg Gly Thr Ala Val Met Leu Val
65 70 75 80
Ser Pro Thr Asp
<210>130
<211>76
<212>PRT
<213>人工序列
<220>
<223>结构域
<400>130
Met Ala Ala Thr Thr Gly Leu Glu Thr Leu Val Asp Gln Ile Ile Ser
1 5 10 15
Val Ile Thr Asn Asp Gly Arg Asn Ile Val Gly Val Leu Lys Gly Phe
20 25 30
Asp Gln Ala Thr Asn Ile Ile Leu Asp Glu Ser His Glu Arg Val Phe
35 40 45
Ser Thr Lys Glu Gly Val Gln Gln His Val Leu Gly Leu Tyr Ile Ile
50 55 60
Arg Gly Asp Asn Ile Gly Val Ile Gly Glu Leu Asp
65 70 75
<210>131
<211>44
<212>PRT
<213>人工序列
<220>
<223>结构域
<400>131
Ser Phe Asp Gln Phe Ala Asn Val Val Leu Glu Gly Ala Cys Glu Arg
1 5 10 15
Val Ile Val Gly Asp Leu Tyr Cys Asp Val Pro Leu Gly Leu Tyr Val
20 25 30
Ile Arg Gly Glu Asn Val Val Leu Ile Gly Glu Leu
35 40
<210>132
<211>51
<212>PRT
<213>人工序列
<220>
<223>结构域
<400>132
Leu Met Gly Leu Leu Arg Ser Phe Asp Gln Phe Ala Asn Ala Val Leu
1 5 10 15
Glu Gly Ala Cys Glu Arg Val Ile Val Gly Asp Leu Tyr Cys Asp Ile
20 25 30
His Leu Gly Leu Tyr Val Ile Arg Gly Glu Asn Val Val Leu Ile Gly
35 40 45
Glu Leu Asp
50
<210>133
<211>84
<212>PRT
<213>人工序列
<220>
<223>结构域
<400>133
Met Ser Ser Trp Ala Gly Pro Asp Glu Ile Phe Leu Ser Thr Ser Leu
1 5 10 15
Ala Gly Phe Leu Asp Lys Lys Leu Ile Val Leu Leu Arg Asp Gly Arg
20 25 30
Lys Leu Leu Gly Thr Leu Cys Ser Phe Asp Gln Phe Ala Asn Val Val
35 40 45
Leu Gln Gly Ala Cys Glu Arg Val Ile Val Gly Glu Leu Tyr Cys Asp
50 55 60
Val Pro Leu Gly Leu Tyr Val Ile Arg Gly Glu Asn Val Val Leu Ile
65 70 75 80
Gly Glu Leu Asp
<210>134
<211>91
<212>PRT
<213>人工序列
<220>
<223>结构域
<400>134
Met Ala Ala Ala Ala Ala Ala Ala Ala Ala Glu Glu Glu Ile Ala Val
1 5 10 15
Lys Glu Pro Leu Asp Leu Ile Arg Leu Ser Leu Asp Glu Arg Ile Tyr
20 25 30
Val Lys Leu Arg Ser Asp Arg Glu Leu Arg Gly Lys Leu His Ala Tyr
35 40 45
Asp Gln His Leu Asn Met Ile Leu Gly Asp Val Glu Glu Ile Val Thr
50 55 60
Thr Val Glu Ile Asp Asp Glu Thr Tyr Glu Glu Ile Val Arg Thr Thr
65 70 75 80
Lys Arg Thr Ile Pro Phe Leu Phe Val Arg Gly
85 90
<210>135
<211>84
<212>PRT
<213>人工序列
<220>
<223>结构域
<400>135
Met Ser Gly Arg Lys Glu Thr Val Leu Asp Leu Ala Lys Phe Val Asp
1 5 10 15
Lys Gly Val Gln Val Lys Leu Thr Gly Gly Arg Gln Val Thr Gly Thr
20 25 30
Leu Lys Gly Tyr Asp Gln Leu Leu Asn Leu Val Leu Asp Glu Ala Val
35 40 45
Glu Phe Glu Arg Glu Gln Asp Asp Pro Leu Lys Leu Ser Gly Lys Thr
50 55 60
Arg Gln Leu Gly Leu Ile Val Cys Arg Gly Thr Ala Val Met Leu Val
65 70 75 80
Ser Pro Thr Asp
<210>136
<211>73
<212>PRT
<213>人工序列
<220>
<223>结构域
<400>136
Met Leu Pro Leu Ser Leu Leu Lys Thr Ala Gln Gly His Pro Met Leu
1 5 10 15
Val Glu Leu Lys Asn Gly Glu Thr Tyr Asn Gly His Leu Val Asn Cys
20 25 30
Asp Thr Trp Met Asn Ile His Leu Arg Glu Val Ile Cys Thr Ser Lys
35 40 45
Asp Gly Asp Lys Phe Trp Arg Met Pro Glu Cys Tyr Ile Arg Gly Asn
50 55 60
Thr Ile Lys Tyr Leu Arg Val Pro Asp
65 70
<210>137
<211>83
<212>PRT
<213>人工序列
<220>
<223>结构域
<400>137
Met Ser Gln Asn Asn Pro Ser Gln Leu Leu Pro Ser Glu Leu Ile Asp
1 5 10 15
Arg Cys Ile Gly Ser Lys Ile Trp Val Ile Met Lys Gly Asp Lys Glu
20 25 30
Leu Val Gly Thr Leu Cys Gly Phe Asp Val Tyr Val Asn Met Val Leu
35 40 45
Glu Asp Val Thr Glu Tyr Glu Tyr Thr Ala Glu Gly Arg Arg Ile Thr
50 55 60
Lys Leu Asp Gln Ile Leu Leu Asn Gly Asn Asn Ile Ala Ile Leu Val
65 70 75 80
Pro Gly Gly
<210>138
<211>90
<212>PRT
<213>人工序列
<220>
<223>结构域
<400>138
Met Ser Thr Gly Gly Gly Ala Asp Lys Ser Gly Gly Gly Gly Gly Gly
1 5 10 15
Ala Val Lys Thr Pro Ser Asp Phe Leu Lys Ser Ile Arg Gly Arg Pro
20 25 30
Val Val Val Lys Leu Asn Ser Gly Val Asp Tyr Arg Gly Ile Leu Ala
35 40 45
Cys Leu Asp Gly Tyr Met Asn Ile Ala Met Glu Gln Thr Glu Glu Tyr
50 55 60
Val Asn Gly Gln Leu Lys Asn Lys Tyr Gly Asp Ala Phe Ile Arg Gly
65 70 75 80
Asn Asn Val Leu Tyr Ile Ser Thr Ser Lys
85 90
<210>139
<211>77
<212>PRT
<213>人工序列
<220>
<223>结构域
<400>139
Met Ala Ser Ala Gly Pro Gly Leu Glu Ser Leu Val Asp Gln Ile Ile
1 5 10 15
Ser Val Ile Thr Asn Asp Gly Arg Asn Ile Val Gly Thr Leu Arg Gly
20 25 30
Phe Asp Gln Ala Thr Asn Ile Ile Leu Asp Glu Ser His Glu Arg Val
35 40 45
Tyr Ser Thr Arg Glu Gly Val Gln Gln Leu Val Leu Gly Leu Tyr Ile
50 55 60
Ile Arg Gly Asp Asn Ile Ser Val Val Gly Glu Val Asp
65 70 75
<210>140
<211>74
<212>PRT
<213>人工序列
<220>
<223>结构域
<400>140
Ile Phe Leu Ser Thr Ser Leu Ala Gly Phe Leu Asp Lys Lys Leu Ile
1 5 10 15
Val Leu Leu Arg Asp Gly Arg Lys Leu Leu Gly Thr Leu Cys Ser Phe
20 25 30
Asp Gln Phe Ala Asn Val Val Leu Gln Gly Ala Cys Glu Arg Val Ile
35 40 45
Val Gly Glu Leu Tyr Cys Asp Val Pro Leu Gly Leu Tyr Val Ile Arg
50 55 60
Gly Glu Asn Val Val Leu Ile Gly Glu Leu
65 70
<210>141
<211>76
<212>PRT
<213>人工序列
<220>
<223>结构域
<400>141
Met Ala Ser Gly Leu Gly Leu Glu Ser Leu Val Asp Gln Thr Ile Ser
1 5 10 15
Val Ile Thr Asn Asp Gly Arg Asn Ile Val Gly Asn Leu Lys Gly Phe
20 25 30
Asp Gln Ala Thr Asn Ile Ile Leu Asp Glu Ser His Glu Arg Val Tyr
35 40 45
Ser Thr Lys Glu Gly Val Gln Gln Leu Val Leu Gly Leu Tyr Ile Ile
50 55 60
Arg Gly Asp Asn Ile Ser Val Ile Gly Glu Leu Asp
65 70 75
<210>142
<211>50
<212>PRT
<213>人工序列
<220>
<223>结构域
<400>142
Met Gly Leu Leu Arg Ser Phe Asp Gln Phe Ala Asn Ala Val Ile Glu
1 5 10 15
Glu Ala Tyr Glu Arg Val Ile Val Gly Asp Leu Tyr Cys Asp Ile Pro
20 25 30
Leu Gly Leu Tyr Ile Ile Arg Gly Glu Asn Val Val Leu Ile Gly Glu
35 40 45
Leu Asp
50
<210>143
<211>83
<212>PRT
<213>人工序列
<220>
<223>结构域
<400>143
Met Ser Trp Ala Gly Pro Glu Asp Ile Tyr Leu Ser Thr Ser Leu Ala
1 5 10 15
Ser Tyr Leu Asp Arg Lys Ile Leu Val Leu Leu Arg Asp Gly Arg Lys
20 25 30
Leu Met Gly Thr Leu Arg Ser Phe Asp Gln Phe Ala Asn Ala Val Leu
35 40 45
Glu Gly Ala Cys Glu Arg Val Ile Val Gly Glu Gln Tyr Cys Asp Ile
50 55 60
Pro Leu Gly Leu Tyr Val Ile Arg Gly Glu Asn Val Val Leu Ile Gly
65 70 75 80
Asp Leu Asp
<210>144
<211>83
<212>PRT
<213>人工序列
<220>
<223>结构域
<400>144
Met Ser Trp Ala Gly Pro Glu Asp Ile Tyr Leu Ser Thr Ser Leu Ala
1 5 10 15
Ser Tyr Leu Asp Arg Lys Ile Leu Val Leu Leu Arg Asp Gly Arg Lys
20 25 30
Leu Met Gly Thr Leu Arg Ser Phe Asp Gln Phe Ala Asn Ala Val Leu
35 40 45
Glu Gly Ala Cys Glu Arg Val Ile Val Gly Glu Gln Tyr Cys Asp Ile
50 55 60
Pro Leu Gly Leu Tyr Val Ile Arg Gly Glu Asn Val Val Leu Ile Gly
65 70 75 80
Asp Leu Asp
<210>145
<211>73
<212>PRT
<213>人工序列
<220>
<223>结构域
<400>145
Met Leu Pro Leu Ser Leu Leu Lys Thr Ala Gln Gly His Pro Met Leu
1 5 10 15
Val Glu Leu Lys Asn Gly Glu Thr Tyr Asn Gly His Leu Val Asn Cys
20 25 30
Asp Thr Trp Met Asn Ile His Leu Arg Glu Val Ile Cys Thr Ser Lys
35 40 45
Asp Gly Asp Arg Phe Trp Arg Met Pro Glu Cys Tyr Ile Arg Gly Asn
50 55 60
Thr Ile Lys Tyr Leu Arg Val Pro Asp
65 70
<210>146
<211>73
<212>PRT
<213>人工序列
<220>
<223>结构域
<400>146
Met Leu Pro Leu Ser Leu Leu Lys Thr Ala Gln Gly His Pro Met Leu
1 5 10 15
Val Glu Leu Lys Asn Gly Glu Thr Tyr Asn Gly His Leu Val Asn Cys
20 25 30
Asp Thr Trp Met Asn Ile His Leu Arg Glu Val Ile Cys Thr Ser Lys
35 40 45
Asp Gly Asp Arg Phe Trp Arg Met Pro Glu Cys Tyr Ile Arg Gly Asn
50 55 60
Thr Ile Lys Tyr Leu Arg Val Pro Asp
65 70
<210>147
<211>73
<212>PRT
<213>人工序列
<220>
<223>结构域
<400>147
Met Leu Pro Leu Ser Leu Leu Lys Thr Ala Gln Gly His Pro Met Leu
1 5 10 15
Val Glu Leu Lys Asn Gly Glu Thr Tyr Asn Gly His Leu Val Asn Cys
20 25 30
Asp Thr Trp Met Asn Ile His Leu Arg Glu Val Ile Cys Thr Ser Lys
35 40 45
Asp Gly Asp Arg Phe Trp Arg Met Pro Glu Cys Tyr Ile Arg Gly Asn
50 55 60
Thr Ile Lys Tyr Leu Arg Val Pro Asp
65 70
<210>148
<211>73
<212>PRT
<213>人工序列
<220>
<223>结构域
<400>148
Met Leu Pro Leu Ser Leu Leu Lys Thr Ala Gln Gly His Pro Met Leu
1 5 10 15
Val Glu Leu Lys Asn Gly Glu Thr Tyr Asn Gly His Leu Val Asn Cys
20 25 30
Asp Thr Trp Met Asn Ile His Leu Arg Glu Val Ile Cys Thr Ser Lys
35 40 45
Asp Gly Asp Arg Phe Trp Arg Met Pro Glu Cys Tyr Ile Arg Gly Asn
50 55 60
Thr Ile Lys Tyr Leu Arg Val Pro Asp
65 70
<210>149
<211>73
<212>PRT
<213>人工序列
<220>
<223>结构域
<400>149
Met Leu Pro Leu Ser Leu Leu Lys Thr Ala Gln Gly His Pro Met Leu
1 5 10 15
Val Glu Leu Lys Asn Gly Glu Thr Tyr Asn Gly His Leu Val Asn Cys
20 25 30
Asp Thr Trp Met Asn Ile His Leu Arg Glu Val Ile Cys Thr Ser Lys
35 40 45
Asp Gly Asp Arg Phe Trp Arg Met Pro Glu Cys Tyr Ile Arg Gly Asn
50 55 60
Thr Ile Lys Tyr Leu Arg Val Pro Asp
65 70
<210>150
<211>73
<212>PRT
<213>人工序列
<220>
<223>结构域
<400>150
Met Leu Pro Leu Ser Leu Leu Lys Thr Ala Gln Gly His Pro Met Leu
1 5 10 15
Val Glu Leu Lys Asn Gly Glu Thr Tyr Asn Gly His Leu Val Asn Cys
20 25 30
Asp Thr Trp Met Asn Ile His Leu Arg Glu Val Ile Cys Thr Ser Lys
35 40 45
Asp Gly Asp Arg Phe Trp Arg Met Pro Glu Cys Tyr Ile Arg Gly Asn
50 55 60
Thr Ile Lys Tyr Leu Arg Val Pro Asp
65 70
<210>151
<211>82
<212>PRT
<213>人工序列
<220>
<223>结构域
<400>151
Met Ala Asn Asn Pro Ser Gln Leu Leu Pro Ser Glu Leu Ile Asp Arg
1 5 10 15
Cys Ile Gly Ser Lys Ile Trp Val Ile Met Lys Gly Asp Lys Glu Leu
20 25 30
Val Gly Thr Leu Arg Gly Phe Asp Val Tyr Val Asn Met Val Leu Glu
35 40 45
Asp Val Thr Glu Tyr Glu Ile Thr Ala Glu Gly Arg Arg Ile Thr Lys
50 55 60
Leu Asp Gln Ile Leu Leu Asn Gly Asn Asn Ile Ala Ile Leu Val Pro
65 70 75 80
Gly Gly
<210>152
<211>83
<212>PRT
<213>人工序列
<220>
<223>结构域
<400>152
Met Ser Trp Ala Gly Pro Asp Glu Ile Leu Leu Ser Thr Ser Leu Ala
1 5 10 15
Gly Phe Leu Asp Lys Lys Leu Ile Val Leu Leu Arg Asp Gly Arg Lys
20 25 30
Leu Leu Gly Thr Leu Cys Ser Phe Asp Gln Phe Ala Asn Val Val Leu
35 40 45
Gln Gly Ala Cys Glu Arg Val Ile Val Gly Glu Leu Tyr Cys Asp Val
50 55 60
Pro Leu Gly Leu Tyr Val Ile Arg Gly Glu Asn Val Val Leu Ile Gly
65 70 75 80
Glu Leu Asp
<210>153
<211>73
<212>PRT
<213>人工序列
<220>
<223>结构域
<400>153
Met Leu Pro Leu Ser Leu Leu Lys Thr Ala Gln Gly His Pro Met Leu
1 5 10 15
Val Glu Leu Lys Asn Gly Glu Thr Tyr Asn Gly His Leu Val Asn Cys
20 25 30
Asp Thr Trp Met Asn Ile His Leu Arg Glu Val Ile Cys Thr Ser Lys
35 40 45
Asp Gly Asp Lys Phe Trp Arg Met Pro Glu Cys Tyr Ile Arg Gly Asn
50 55 60
Thr Ile Lys Tyr Leu Arg Val Pro Asp
65 70
<210>154
<211>83
<212>PRT
<213>人工序列
<220>
<223>结构域
<400>154
Met Ser Trp Ala Gly Pro Asp Glu Ile Leu Leu Ser Thr Ser Leu Ala
1 5 10 15
Gly Phe Leu Asp Lys Lys Leu Ile Val Leu Leu Arg Asp Gly Arg Lys
20 25 30
Leu Leu Gly Thr Leu Cys Ser Phe Asp Gln Phe Ala Asn Val Val Leu
35 40 45
Gln Gly Ala Cys Glu Arg Val Ile Val Gly Glu Leu Tyr Cys Asp Val
50 55 60
Pro Leu Gly Leu Tyr Val Ile Arg Gly Glu Asn Val Val Leu Ile Gly
65 70 75 80
Glu Leu Asp
<210>155
<211>73
<212>PRT
<213>人工序列
<220>
<223>结构域
<400>155
Met Leu Pro Leu Ser Leu Leu Lys Thr Ala Gln Gly His Pro Met Leu
1 5 10 15
Val Glu Leu Lys Asn Gly Glu Thr Tyr Asn Gly His Leu Val Asn Cys
20 25 30
Asp Thr Trp Met Asn Ile His Leu Arg Glu Val Ile Cys Thr Ser Lys
35 40 45
Asp Gly Asp Lys Phe Trp Arg Met Pro Glu Cys Tyr Ile Arg Gly Asn
50 55 60
Thr Ile Lys Tyr Leu Arg Val Pro Asp
65 70
<210>156
<211>73
<212>PRT
<213>人工序列
<220>
<223>结构域
<400>156
Met Leu Pro Leu Ser Leu Leu Lys Thr Ala Gln Gly His Pro Met Leu
1 5 10 15
Val Glu Leu Lys Asn Gly Glu Thr Tyr Asn Gly His Leu Val Asn Cys
20 25 30
Asp Thr Trp Met Asn Ile His Leu Arg Glu Val Ile Cys Thr Ser Lys
35 40 45
Asp Gly Asp Lys Phe Trp Arg Met Pro Glu Cys Tyr Ile Arg Gly Asn
50 55 60
Thr Ile Lys Tyr Leu Arg Val Pro Asp
65 70
<210>157
<211>83
<212>PRT
<213>人工序列
<220>
<223>结构域
<400>157
Met Ser Trp Ser Ala Pro Asp Asp Ile Leu Leu Ser Thr Ser Leu Ala
1 5 10 15
Gly Phe Leu Asp Lys Lys Leu Ile Val Leu Leu Arg Asp Gly Arg Lys
20 25 30
Leu Leu Gly Thr Leu Cys Ser Phe Asp Gln Phe Ala Asn Val Val Leu
35 40 45
Gln Gly Ala Cys Glu Arg Val Ile Val Gly Gly Gln Tyr Cys Asp Val
50 55 60
Pro Leu Gly Leu Tyr Val Ile Arg Gly Glu Asn Val Val Leu Ile Gly
65 70 75 80
Glu Leu Asp
<210>158
<211>73
<212>PRT
<213>人工序列
<220>
<223>结构域
<400>158
Met Leu Pro Leu Ser Leu Leu Lys Thr Ala Gln Gly His Pro Met Leu
1 5 10 15
Val Glu Leu Lys Asn Gly Glu Thr Tyr Asn Gly His Leu Val Asn Cys
20 25 30
Asp Thr Trp Met Asn Ile His Leu Arg Glu Val Ile Cys Thr Ser Lys
35 40 45
Asp Gly Asp Lys Phe Trp Arg Met Pro Glu Cys Tyr Ile Arg Gly Asn
50 55 60
Thr Ile Lys Tyr Leu Arg Val Pro Asp
65 70
<210>159
<211>46
<212>PRT
<213>人工序列
<220>
<223>基序1
<220>
<221>未确定
<222>(4)..(4)
<223>Xaa可为任一天然存在的氨基酸
<220>
<221>未确定
<222>(15)..(15)
<223>Xaa可为任一天然存在的氨基酸
<400>159
Gly Thr Leu Xaa Ser Phe Asp Gln Phe Ala Asn Val Val Leu Xaa Gly
1 5 10 15
Ala Cys Glu Arg Val Ile Val Gly Glu Leu Tyr Cys Asp Val Pro Leu
20 25 30
Gly Leu Tyr Val Ile Arg Gly Glu Asn Val Val Leu Ile Gly
35 40 45
<210>160
<211>23
<212>PRT
<213>人工序列
<220>
<223>基序2
<400>160
Lys Ala Glu Arg Glu Ala Arg Asp Leu Lys Gly Thr Met Arg Lys Arg
1 5 10 15
Met Glu Phe Leu Asp Phe Asp
20
<210>161
<211>1828
<212>DNA
<213>稻
<400>161
gcttgagtca tagggagaaa acaaatcgat catatttgac tcttttccct ccatctctct 60
taccggcaaa aaaagtagta ctggtttata tgtaaagtaa gattctttaa ttatgtgaga 120
tccggcttaa tgcttttctt ttgtcacata tactgcattg caacaattgc catatattca 180
cttctgccat cccattatat agcaactcaa gaatggattg atatatcccc tattactaat 240
ctagacatgt taaggctgag ttgggcagtc catcttccca acccaccacc ttcgtttttc 300
gcgcacatac ttttcaaact actaaatggt gtgtttttta aaaatatttt caatacaaaa 360
gttgctttaa aaaattatat tgatccattt ttttaaaaaa aatagctaat acttaattaa 420
tcacgtgtta aaagaccgct ccgttttgcg tgcaggaggg ataggttcac atcctgcatt 480
accgaacaca gcctaaatct tgttgtctag attcgtagta ctggatatat taaatcatgt 540
tctaagttac tatatactga gatgaataga ataagtaaaa ttagacccac cttaagtctt 600
gatgaagtta ctactagctg cgtttgggag gacttcccaa aaaaaaaagt attagccatt 660
agcacgtgat taattaagta ctagtttaaa aaacttaaaa aataaattaa tatgattctc 720
ttaagtaact ctcctataga aaacttttac aaaattacac cgtttaatag tttggaaaat 780
atgtcagtaa aaaataagag agtagaagtt atgaaagtta gaaaaagaat tgttttagta 840
gtatacagtt ataaactatt ccctctgtt ctaaaacataa gggattatgg atggattcga 900
catgtaccag taccatgaat cgaatccaga caagtttttt atgcatattt attctactat 960
aatatatcac atctgctcta aatatcttat atttcgaggt ggagactgtc gctatgtttt 1020
tctgcccgtt gctaagcaca cgccaccccc gatgcgggga cgcctctggc cttcttgcca 1080
cgataattga atggaacttc cacattcaga ttcgataggt gaccgtcgac tccaagtgct 1140
ttgcacaaaa caactccggc ctcccggcca ccagtcacac gactcacggc actaccaccc 1200
ctgactccct gaggcggacc tgccactgtt ctgcatgcga agctatctaa aattctgaag 1260
caaagaaagc acagcacatg ctccgggaca cgcgccaccc ggcggaaaag ggctcggtgt 1320
ggcgatctca cagccgcata tcgcatttca caagccgccc atctccaccg gcttcacgag 1380
gctcatcgcg gcacgaccgc gcacggaacg cacgcggccg acccgcgcgc ctcgatgcgc 1440
gagcccatcc gccgcgtcct ccctttgcct ttgccgctat cctctcggtc gtatcccgtt 1500
tctctgtctt ttgctccccg gcgcgcgcca gttcggagta ccagcgaaac ccggacacct 1560
ggtacacctc cgccggccac aacgcgtgtc ccccctacgt ggccgcgcag cacatgccca 1620
tgcgcgacac gtgcacctcc tcatccaaac tctcaagtct caacggtcct ataaatgcac 1680
ggatagcctc aagctgctcg tcacaaggca agaggcaaga ggcaagagca tccgtattaa 1740
ccagcctttt gagacttgag agtgtgtgtg actcgatcca gcgtagtttc agttcgtgtg 1800
ttggtgagtg attccagcca agtttgcg 1828
<210>162
<211>53
<212>DNA
<213>人工序列
<220>
<223>有义引物
<400>162
ggggacaagt ttgtacaaaa aagcaggctt aaacaatgtc ttgggctgct cct 53
<210>163
<211>50
<212>DNA
<213>人工序列
<220>
<223>反义引物
<400>163
ggggaccact ttgtacaaga aagctgggtt ttctacaatg ctgcaacaca 50
<210>164
<211>1827
<212>DNA
<213>稻
<400>164
gcttgagtca tagggagaaa acaaatcgat catatttgac tcttttccct ccatctctct 60
taccggcaaa aaaagtagta ctggtttata tgtaaagtaa gattctttaa ttatgtgaga 120
tccggcttaa tgcttttctt ttgtcacata tactgcattg caacaattgc catatattca 180
cttctgccat cccattatat agcaactcaa gaatggattg atatatcccc tattactaat 240
ctagacatgt taaggctgag ttgggcagtc catcttccca acccaccacc ttcgtttttc 300
gcgcacatac ttttcaaact actaaatggt gtgtttttta aaaatatttt caatacaaaa 360
gttgctttaa aaaattatat tgatccattt ttttaaaaaa aatagctaat acttaattaa 420
tcacgtgtta aaagaccgct ccgttttgcg tgcaggaggg ataggttcac atcctgcatt 480
accgaacaca gcctaaatct tgttgtctag attcgtagta ctggatatat taaatcatgt 540
tctaagttac tatatactga gatgaataga ataagtaaaa ttagacccac cttaagtctt 600
gatgaagtta ctactagctg cgtttgggag gacttcccaa aaaaaaaagt attagccatt 660
agcacgtgat taattaagta ctagtttaaa aaacttaaaa aataaattaa tatgattctc 720
ttaagtaact ctcctataga aaacttttac aaaattacac cgtttaatag tttggaaaat 780
atgtcagtaa aaaataagag agtagaagtt atgaaagtta gaaaaagaat tgttttagta 840
gtatacagtt ataaactatt ccctctgttc taaaacataa gggattatgg atggattcga 900
catgtaccag taccatgaat cgaatccaga caagtttttt atgcatattt attctactat 960
aatatatcac atctgctcta aatatcttat atttcgaggt ggagactgtc gctatgtttt 1020
tctgcccgtt gctaagcaca cgccaccccc gatgcgggga cgcctctggc cttcttgcca 1080
cgataattga atggaacttc cacattcaga ttcgataggt gaccgtcgac tccaagtgct 1140
ttgcacaaaa caactccggc ctcccggcca ccagtcacac gactcacggc actaccaccc 1200
ctgactccct gaggcggacc tgccactgtt ctgeatgcga agctatctaa aattctgaag 1260
caaagaaagc acagcacatg ctccgggaca cgcgccaccc ggcggaaaag ggctcggtgt 1320
ggcgatctca cagccgcata tcgcatttca caagccgccc atctccaccg gcttcacgag 1380
gctcatcgcg gcacgaccgc gcacggaacg cacgcggccg acccgcgcgc ctcgatgcgc 1440
gagcccatcc gccgcgtcct ccctttgcct ttgccgctat cctctcggtc gtatcccgtt 1500
tctctgtctt ttgctccccg gcgcgcgcca gttcggagta ccagcgaaac ccggacacct 1560
ggtacacctc cgccggccac aacgcgtgtc cccctacgtg gccgcgcagc acatgcccat 1620
gcgcgacacg tgcacctcct catccaaact ctcaagtctc aacggtccta taaatgcacg 1680
gatagcctca agctgctcgt cacaaggcaa gaggcaagag gcaagagcat ccgtattaac 1740
cagccttttg agacttgaga gtgtgtgtga ctcgatccag cgtagtttca gttcgtgtgt 1800
tggtgagtga ttccagccaa gtttgcg 1827
<210>165
<211>975
<212>DNA
<213>拟南芥
<400>165
atggcggatt ttcagacatc aacacaacgg gccaagtgga ttttcactcc ccagaaactg 60
gcagagagat ataaagctgc taaccagagg gcagtgcaaa tgctggagaa gtgtggaaca 120
actcaagttg aagtagatgc tagtggatca ctaacatatc ctaaagataa agttggttca 180
ggagatcaag ctgataagaa gcttaagcct ttgagtgctg atgaagaaag gttcatgaga 240
gcattttatg aggcaaaggt ccaagaagtg tgcagtgcct ttgcatttcc tcacaagatt 300
caggcaacag ccctccaata ctttaagaga ttttatctgc aatggtctgt tatgcaacat 360
catccaaaag agataatgtt aacctgtgtg tatgcagctt gtaaaataga ggagaatcat 420
gtatctgctg aggaaattgg gaaagggatt aaccaagatc accgaataat tctcaagtac 480
gagatggctg ttcttcagag tttggaattt gatctgattg tttatgcacc gtatcgtgca 540
atcgaaggtt ttgtcaacaa catggaggaa tttcttcaag ctagagatga tgaaatccaa 600
aaactagagt attctgcaga gtttgctcaa aggggcgaca gcagaagccg ataaagttat 660
gctcacagat gctccactcc tctttcctcc tggccagttg gcattggcgt cgttacgtat 720
tgcaaatggg gttcttggag tgattgactt tgataggtac ctagagaaca ttgtttctca 780
accgaactct gagcacacga cttcagagct tacaaagtta cttgataaca tcgaatattt 840
ggtaaagaac tacaagtgcc caagtgaaaa ggacatgaag catatcaacc ggaagctaaa 900
atcttgtcta ggacatagtt cttcacatga cgagagtaag aaacgggaga agagatcaaa 960
acacaagtcc catag 975
<210>166
<211>217
<212>PRT
<213>拟南芥
<400>166
Met Ala Asp Phe Gln Thr Ser Thr Gln Arg Ala Lys Trp Ile Phe Thr
1 5 10 15
Pro Gln Lys Leu Ala Glu Arg Tyr Lys Ala Ala Asn Gln Arg Ala Val
20 25 30
Gln Met Leu Glu Lys Cys Gly Thr Thr Gln Val Glu Val Asp Ala Ser
35 40 45
Gly Ser Leu Thr Tyr Pro Lys Asp Lys Val Gly Ser Gly Asp Gln Ala
50 55 60
Asp Lys Lys Leu Lys Pro Leu Ser Ala Asp Glu Glu Arg Phe Met Arg
65 70 75 80
Ala Phe Tyr Glu Ala Lys Val Gln Glu Val Cys Ser Ala Phe Ala Phe
85 90 95
Pro His Lys Ile Gln Ala Thr Ala Leu Gln Tyr Phe Lys Arg Phe Tyr
100 105 110
Leu Gln Trp Ser Val Met Gln His His Pro Lys Glu Ile Met Leu Thr
115 120 125
Cys Val Tyr Ala Ala Cys Lys Ile Glu Glu Asn His Val Ser Ala Glu
130 135 140
Glu Ile Gly Lys Gly Ile Asn Gln Asp His Arg Ile Ile Leu Lys Tyr
145 150 155 160
Glu Met Ala Val Leu Gln Ser Leu Glu Phe Asp Leu Ile Val Tyr Ala
165 170 175
Pro Tyr Arg Ala Ile Glu Gly Phe Val Asn Asn Met Glu Glu Phe Leu
180 185 190
Gln Ala Arg Asp Asp Glu Ile Gln Lys Leu Glu Tyr Ser Ala Glu Phe
195 200 205
Ala Gln Arg Gly Asp Ser Arg Ser Arg
210 215
<210>167
<211>54
<212>DNA
<213>人工序列
<220>
<223>引物:prm02688
<400>167
ggggacaagt ttgtacaaaa aagcaggctt cacaatggcg gattttcaga catc 54
<210>168
<211>49
<212>DNA
<213>人工序列
<220>
<223>引物:prm02689
<400>168
ggggaccact ttgtacaaga aagctgggta aactcaacct atgggtggc 49
<210>169
<211>8
<212>PRT
<213>人工序列
<220>
<223>保守基序
<220>
<221>变体
<222>(1)..(1)
<223>/替换=″Val″/替换=″Ile″
<220>
<221>变体
<222>(2)..(2)
<223>/替换=″Arg″
<220>
<221>变体
<222>(3)..(3)
<223>/替换=″Asp″
<220>
<221>未确定
<222>(6)..(6)
<400>169
Leu Gln Glu Val Cys Xaa Ala Phe
1 5
<210>170
<211>1236
<212>DNA
<213>稻
<400>170
ggtcagccaa tacattgatc cgttgccaat catgcaaagt attttggctg tggccgagtg 60
ccggaattga taattgtgtt ctgactaaat taaatgacca gaagtcgcta tcttccaatg 120
tatccgaaac ctggattaaa caatcctgtt ctgttctcta gcccctcctg catggccgga 180
ttgttttttt gacatgtttt cttgactgag gcctgtttgt tctaaacttt ttcttcaaac 240
ttttaacttt ttcatcacat cagaactttt ctacacatat aaacttttaa cttttccgtc 300
acatcgttcc aatttcaatc aaactttcaa ttttggcgtg aactaaacac accctgagtc 360
ttttattgct cctccgtacg ggttggctgg ttgagaatag gtattttcag agagaaaatc 420
tagatattgg gaggaacttg gcatgaatgg ccactatatt tagagcaatt ctacggtcct 480
tgaggaggta ccatgaggta ccaaaatttt agtgtaaatt ttagtatctc attataacta 540
ggtattatga ggtaccaaat ttacaataga aaaaatagta cttcatggta ctttcttaag 600
taccgtaaaa ttgctcctat atttaagggg atgtttatat ctatccatat ccataatttg 660
attttgataa gaaaaaatgt gagcacacca agcatgtcca tgaccttgca ctcttggctc 720
actcgtcaac tgtgaagaac ctcaaaaatg ctcaatatag ctacaggtgc ctgaaaaaat 780
aactttaaag ttttgaacat cgatttcact aaacaacaat tattatctcc ctctgaaaga 840
tgatagttta gaactctaga atcattgtcg gcggagaaag taaattattt tccccaaatt 900
tccagctatg aaaaaaccct caccaaacac catcaaacaa gagttcacca aaccgcccat 960
gcggccatgc tgtcacgcaa cgcaccgcat tgcctgatgg ccgctcgatg catgcatgct 1020
tccccgtgca catatccgac agacgcgccg tgtcagcgag ctcctcgacc gacctgtgta 1080
gcccatgcaa gcatccaccc ccgccacgta caccccctcc tcctccctac gtgtcaccgc 1140
tctctccacc tatatatgcc cacctggccc ctctcctccc atctccactt cacccgatcg 1200
cttcttcttc ttcttcgttg cattcatctt gctagc 1236
<210>171
<211>1828
<212>DNA
<213>稻
<400>171
gcttgagtca tagggagaaa acaaatcgat catatttgac tcttttccct ccatctctct 60
taccggcaaa aaaagtagta ctggtttata tgtaaagtaa gattctttaa ttatgtgaga 120
tccggcttaa tgcttttctt ttgtcacata tactgcattg caacaattgc catatattca 180
cttctgccat cccattatat agcaactcaa gaatggattg atatatcccc tattactaat 240
ctagacatgt taaggctgag ttgggcagtc catcttccca acccaccacc ttcgtttttc 300
gcgcacatac ttttcaaact actaaatggt gtgtttttta aaaatatttt caatacaaaa 360
gttgctttaa aaaattatat tgatccattt ttttaaaaaa aatagctaat acttaattaa 420
tcacgtgtta aaagaccgct ccgttttgcg tgcaggaggg ataggttcac atcctgcatt 480
accgaacaca gcctaaatct tgttgtctag attcgtagta ctggatatat taaatcatgt 540
tctaagttac tatatactga gatgaataga ataagtaaaa ttagacccac cttaagtctt 600
gatgaagtta ctactagctg cgtttgggag gacttcccaa aaaaaaaagt attagccatt 660
agcacgtgat taattaagta ctagtttaaa aaacttaaaa aataaattaa tatgattctc 720
ttaagtaact ctcctataga aaacttttac aaaattacac cgtttaatag tttggaaaat 780
atgtcagtaa aaaataagag agtagaagtt atgaaagtta gaaaaagaat tgttttagta 840
gtatacagtt ataaactatt ccctctgttc taaaacataa gggattatgg atggattcga 900
catgtaccag taccatgaat cgaatccaga caagtttttt atgcatattt attctactat 960
aatatatcac atctgctcta aatatcttat atttcgaggt ggagactgtc gctatgtttt 1020
tctgcccgtt gctaagcaca cgccaccccc gatgcgggga cgcctctggc cttcttgcca 1080
cgataattga atggaacttc cacattcaga ttcgataggt gaccgtcgac tccaagtgct 1140
ttgcacaaaa caactccggc ctcccggcca ccagtcacac gactcacggc actaccaccc 1200
ctgactccct gaggcggacc tgccactgtt ctgcatgcga agctatctaa aattctgaag 1260
caaagaaagc acagcacatg ctccgggaca cgcgccaccc ggcggaaaag ggctcggtgt 1320
ggcgatctca cagccgcata tcgcatttca caagccgccc atctccaccg gcttcacgag 1380
gctcatcgcg gcacgaccgc gcacggaacg cacgcggccg acccgcgcgc ctcgatgcgc 1440
gagcccatcc gccgcgtcctccctttgcct ttgccgctat cctctcggtc gtatcccgtt 1500
tctctgtctt ttgctccccg gcgcgcgcca gttcggagta ccagcgaaac ccggacacct 1560
ggtacacctc cgccggccac aacgcgtgtc ccccctacgt ggccgcgcag cacatgccca 1620
tgcgcgacac gtgcacctcc tcatccaaac tctcaagtct caacggtcct ataaatgcac 1680
ggatagcctc aagctgctcg tcacaaggca agaggcaaga ggcaagagca tccgtattaa 1740
ccagcctttt gagacttgag agtgtgtgtg actcgatcca gcgtagtttc agttcgtgtg 1800
ttggtgagtg attccagcca agtttgcg 1828
<210>172
<211>1011
<212>DNA
<213>拟南芥
<400>172
atggcggatt ttcagacatc aacacaacgg gccaagtgga ttttcactcc ccagaaactg 60
gcagagagat ataaagctgc taaccagagg gcagtgcaaa tgctggagaa gtgtggaaca 120
actcaagttg aagtagatgc tagtggatca ctaacatatc ctaaagataa agttggttca 180
ggagatcaag ctgataagaa gcttaagcct ttgagtgctg atgaagaaag gttcatgaga 240
gcattttatg aggcaaaggt ccaagaagtg tgcagtgcct ttgcatttcc tcacaagatt 300
caggcaacag ccctccaata ctttaagaga ttttatctgc aatggtctgt tatgcaacat 360
catccaaaag agataatgtt aacctgtgtg tatgcagctt gtaaaatagag gagaatcat 420
gtatctgctg aggaaattgg gaaagggatt aaccaagatc accgaataat tctcaagtac 480
gagatggctg ttcttcagag tttggaattt gatctgattg tttatgcacc gtatcgtgca 540
atcgaaggtt ttgtcaacaa catggaggaa tttcttcaag ctagagatga tgaaatccaa 600
aaactagaga gtttgctcaa aggggcgaca gcagaagccg ataaagttat gctcacagat 660
gctccactcc tctttcctcc tggccagttg gcattggcgt cgttacgtat tgcaaatggg 720
gttcttggag tgattgactt tgataggtac ctagagaaca ttgtttctca accgaactct 780
gagcacacga cttcagagct tacaaagtta cttgataaca tcgaatattt ggtaaagaac 840
tacaagtgcc caagtgaaaa ggacatgaag catatcaacc ggaagctaaa atcttgtcta 900
ggacatagtt cttcacatga cgagagtaag aaacgggaga agagatcaaa acacaagtcc 960
cataggagct ccaatgatac accaaacggg gcaccgccac ccataggttg a 1011
<210>173
<211>336
<212>PRT
<213>拟南芥
<400>173
Met Ala Asp Phe Gln Thr Ser Thr Gln Arg Ala Lys Trp Ile Phe Thr
1 5 10 15
Pro Gln Lys Leu Ala Glu Arg Tyr Lys Ala Ala Asn Gln Arg Ala Val
20 25 30
Gln Met Leu Glu Lys Cys Gly Thr Thr Gln Val Glu Val Asp Ala Ser
35 40 45
Gly Ser Leu Thr Tyr Pro Lys Asp Lys Val Gly Ser Gly Asp Gln Ala
50 55 60
Asp Lys Lys Leu Lys Pro Leu Ser Ala Asp Glu Glu Arg Phe Met Arg
65 70 75 80
Ala Phe Tyr Glu Ala Lys Val Gln Glu Val Cys Ser Ala Phe Ala Phe
85 90 95
Pro His Lys Ile Gln Ala Thr Ala Leu Gln Tyr Phe Lys Arg Phe Tyr
100 105 110
Leu Gln Trp Ser Val Met Gln His His Pro Lys Glu Ile Met Leu Thr
115 120 125
Cys Val Tyr Ala Ala Cys Lys Ile Glu Glu Asn His Val Ser Ala Glu
130 135 140
Glu Ile Gly Lys Gly Ile Asn Gln Asp His Arg Ile Ile Leu Lys Tyr
145 150 155 160
Glu Met Ala Val Leu Gln Ser Leu Glu Phe Asp Leu Ile Val Tyr Ala
165 170 175
Pro Tyr Arg Ala Ile Glu Gly Phe Val Asn Asn Met Glu Glu Phe Leu
180 185 190
Gln Ala Arg Asp Asp Glu Ile Gln Lys Leu Glu Ser Leu Leu Lys Gly
195 200 205
Ala Thr Ala Glu Ala Asp Lys Val Met Leu Thr Asp Ala Pro Leu Leu
210 215 220
Phe Pro Pro Gly Gln Leu Ala Leu Ala Ser Leu Arg Ile Ala Asn Gly
225 230 235 240
Val Leu Gly Val Ile Asp Phe Asp Arg Tyr Leu Glu Asn Ile Val Ser
245 250 255
Gln Pro Asn Ser Glu His Thr Thr Ser Glu Leu Thr Lys Leu Leu Asp
260 265 270
Asn Ile Glu Tyr Leu Val Lys Asn Tyr Lys Cys Pro Ser Glu Lys Asp
275 280 285
Met Lys His Ile Asn Arg Lys Leu Lys Ser Cys Leu Gly His Ser Ser
290 295 300
Ser His Asp Glu Ser Lys Lys Arg Glu Lys Arg Ser Lys His Lys Ser
305 310 315 320
His Arg Ser Ser Asn Asp Thr Pro Asn Gly Ala Pro Pro Pro Ile Gly
325 330 335
<210>174
<211>1204
<212>DNA
<213>欧美杂种山杨(Populus tremula x Populus tremuloides)
<400>174
aataattcga atataaattc tctctgatca aagaacaagt aacacaacac gctgatcact 60
gagatagggt taccgagtca cccatggccg atttccaatc ctcaagtcac aaagccaagt 120
ggatcttcac ccctcaacag ttggccgaga agtataaagc tactaataat agagcgaaac 180
aaatgttaga gaagtatgga acgacaagaa tgagagtaga tgttgatggg tcattgtcat 240
atccagaacc tcaagttaac atgacagaga atgctgataa gcattctcgt tcaaaaccaa 300
taagtgtcga ggaagaacaa tttatgcgag tatactatga gtataaactt cgagaagtgt 360
gtagtgcatt ctattttcct cataaaattc aggcaactgc actcctatac tttaaaaggt 420
tttatcttca atggtcagtc atggagcatg atccaaaaca tgtaatgtta acctgcatct 480
atgcagcatg caagatagaa gaaaatcatg tgtctgcgga ggagcttggt aaggggattt 540
cacaggatca tcaaatgatt ctcaattacg agatgatagt ttatcagagt ttggaatttg 600
atcttattgt ctatgcacca tatcgatctg ttgaaggttt tgttgctgat atagaggaat 660
tctgtcatcc aacagatgaa aatattgaaa agctgaagga aattgcagtg gcagaggttg 720
acaaaatcat gctcactgac gcacccgtta tgttccctcc tgggcagttg gcattggctg 780
ctctgcagag tgcaaatgag atgcatagag ttcttgattt tgagagatat ctcgagagtg 840
tcctctctcg tcagaattct gcacacatga tttcagagat cagtgaatct ctacatgctg 900
tcgagaaatg ggtgaggaaa tacagtttcc ctacggataa ggatatgaag cacataaatc 960
ggaagctgaa atcatgctgg ggtcataact cacacgatga caataagaaa agggagaaga 1020
aatcaaaaca caagtcccat aagagttcga atgaaatgca aaatggccca ggactgactt 1080
aattgtatgt tgctccttcg ttcacaagtg tttcctacct tatttaagcg atttacgaac 1140
ttggtttttg cttcccagat ttttgttgga gattatattt atgtaccaat ttggatgaaa 1200
aaaa 1204
<210>175
<211>332
<212>PRT
<213>欧美杂种山杨
<400>175
Met Ala Asp Phe Gln Ser Ser Ser His Lys Ala Lys Trp Ile Phe Thr
1 5 10 15
Pro Gln Gln Leu Ala Glu Lys Tyr Lys Ala Thr Asn Asn Arg Ala Lys
20 25 30
Gln Met Leu Glu Lys Tyr Gly Thr Thr Arg Met Arg Val Asp Val Asp
35 40 45
Gly Ser Leu Ser Tyr Pro Glu Pro Gln Val Asn Met Thr Glu Asn Ala
50 55 60
Asp Lys His Ser Arg Ser Lys Pro Ile Ser Val Glu Glu Glu Gln Phe
65 70 75 80
Met Arg Val Tyr Tyr Glu Tyr Lys Leu Arg Glu Val Cys Ser Ala Phe
85 90 95
Tyr Phe Pro His Lys Ile Gln Ala Thr Ala Leu Leu Tyr Phe Lys Arg
100 105 110
Phe Tyr Leu Gln Trp Ser Val Met Glu His Asp Pro Lys His Val Met
115 120 125
Leu Thr Cys Ile Tyr Ala Ala Cys Lys Ile Glu Glu Asn His Val Ser
130 135 140
Ala Glu Glu Leu Gly Lys Gly Ile Ser Gln Asp His Gln Met Ile Leu
145 150 155 160
Asn Tyr Glu Met Ile Val Tyr Gln Ser Leu Glu Phe Asp Leu Ile Val
165 170 175
Tyr Ala Pro Tyr Arg Ser Val Glu Gly Phe Val Ala Asp Ile Glu Glu
180 185 190
Phe Cys His Pro Thr Asp Glu Asn Ile Glu Lys Leu Lys Glu Ile Ala
195 200 205
Val Ala Glu Val Asp Lys Ile Met Leu Thr Asp Ala Pro Val Met Phe
210 215 220
Pro Pro Gly Gln Leu Ala Leu Ala Ala Leu Gln Ser Ala Asn Glu Met
225 230 235 240
His Arg Val Leu Asp Phe Glu Arg Tyr Leu Glu Ser Val Leu Ser Arg
245 250 255
Gln Asn Ser Ala His Met Ile Ser Glu Ile Ser Glu Ser Leu His Ala
260 265 270
Val Glu Lys Trp Val Arg Lys Tyr Ser Phe Pro Thr Asp Lys Asp Met
275 280 285
Lys His Ile Asn Arg Lys Leu Lys Ser Cys Trp Gly His Asn Ser His
290 295 300
Asp Asp Asn Lys Lys Arg Glu Lys Lys Ser Lys His Lys Ser His Lys
305 310 315 320
Ser Ser Asn Glu Met Gln Asn Gly Pro Gly Leu Thr
325 330
<210>176
<211>1593
<212>DNA
<213>稻
<400>176
cgacgacgcc tccctcgtac gccggcgctc tcgcagttgc cgccgccgcc gcgaacgccc 60
accgcccgcg ctctggtcgg tggatcgtga cgtgctgtgg tggtctctga tctgctctgg 120
gggtgggtgg gcgtctcgcg gagtcgccgt gttcgtcgag ggctcgatcg gctcggggag 180
agcgagtgag aagaggtgag ggttgggggg aggcacatcc gcggcggcgg agagatggcg 240
gatttccgga cctccacgca tcgggagagg tggatcttcc agacgaacga tctgatggat 300
agatgggggg cggcgaacca gcgggccacg gagacgctcg ttcagtatgg aacgacgcgg 360
ttgaaggtgg accctgttga tgggtcgctg tcatacccgg aacctgcgcc tgatcatgtt 420
gtagggagct caggtgtaaa gcctctgtct tgtgaagagg agcgattgat gcgggtattt 480
tatgagcaaa agattcaaga agtatgttca gcatttaagt tccctcacaa aatccaggct 540
accgcaataa tatatttcaa gagattttat ctgcaatggt ctgtaatgga acatcaccca 600
aagcatatta tgttaacttg tatttattct tcttgcaaag tggaagaaaa tcatgtttct 660
gctgaggaac ttggtaaagg aattcaacag gaccaccaga ttattctaaa taacgagatg 720
attgttctca aatctttaga ttttgatctg attgtttatg ctccgtatcg atctatcgaa 780
ggatttgttg atgacatgga ggatttctgc agagcaggta atggtgagca ccaacggttg 840
caggatttac gtcaaactgc gatatctcag gttgacaaaa tgatgttgac tgacgctcct 900
cttctctaca ctcctggaca gttggctctg gctgctttgc acaaatccaa tgatatgcac 960
aagatcctta attttgaaag gtacttggaa agtgtttttt caaggcaaca ttctgattgt 1020
ccaatcgaac aatttgttgg gtcaatcaat atgatcaatt atttggttga gcagcttaaa 1080
atacctactc ctaaggacat gaggcatatt gaccgcaagc ttaagcattg tttggatcca 1140
agctcacagg atgagcataa gaagaaagag aagaagtcga agcacaaatc aaaaagggca 1200
gctaatgaag cccaacttga cagctagaaa acatacggtt gggctgcacc gtgtaagaat 1260
cagttcttta gtttgttgtg gctccaattg atcaaaagag ctactttcct gagcaggtga 1320
ggttccgttt tagccgagga caaccaattt tgagatgaag cgagataata cccatgacct 1380
cgccttcttg taatcttgta tgcctggaag ccctagcaaa ctcctcgttg caatggctac 1440
tgtacttttt ttggggggta atttatccct tgtcaaatgg gaagaagcag catacatcgg 1500
atgattgcct ccatatacga aaatgacagc taactcagac ttttgtcggt tgcatttttc 1560
tgtttaaaaa aaaaaaaaaa aaaaaaaaaa aaa 1593
<210>177
<211>330
<212>PRT
<213>稻
<400>177
Met Ala Asp Phe Arg Thr Ser Thr His Arg Glu Arg Trp Ile Phe Gln
1 5 10 15
Thr Asn Asp Leu Met Asp Arg Trp Gly Ala Ala Asn Gln Arg Ala Thr
20 25 30
Glu Thr Leu Val Gln Tyr Gly Thr Thr Arg Leu Lys Val Asp Pro Val
35 40 45
Asp Gly Ser Leu Ser Tyr Pro Glu Pro Ala Pro Asp His Val Val Gly
50 55 60
Ser Ser Gly Val Lys Pro Leu Ser Cys Glu Glu Glu Arg Leu Met Arg
65 70 75 80
Val Phe Tyr Glu Gln Lys Ile Gln Glu Val Cys Ser Ala Phe Lys Phe
85 90 95
Pro His Lys Ile Gln Ala Thr Ala Ile Ile Tyr Phe Lys Arg Phe Tyr
100 105 110
Leu Gln Trp Ser Val Met Glu His His Pro Lys His Ile Met Leu Thr
115 120 125
Cys Ile Tyr Ser Ser Cys Lys Val Glu Glu Asn His Val Ser Ala Glu
130 135 140
Glu Leu Gly Lys Gly Ile Gln Gln Asp His Gln Ile Ile Leu Asn Asn
145 150 155 160
Glu Met Ile Val Leu Lys Ser Leu Asp Phe Asp Leu Ile Val Tyr Ala
165 170 175
Pro Tyr Arg Ser Ile Glu Gly Phe Val Asp Asp Met Glu Asp Phe Cys
180 185 190
Arg Ala Gly Asn Gly Glu His Gln Arg Leu Gln Asp Leu Arg Gln Thr
195 200 205
Ala Ile Ser Gln Val Asp Lys Met Met Leu Thr Asp Ala Pro Leu Leu
210 215 220
Tyr Thr Pro Gly Gln Leu Ala Leu Ala Ala Leu His Lys Ser Asn Asp
225 230 235 240
Met His Lys Ile Leu Asn Phe Glu Arg Tyr Leu Glu Ser Val Phe Ser
245 250 255
Arg Gln His Ser Asp Cys Pro Ile Glu Gln Phe Val Gly Ser Ile Asn
260 265 270
Met Ile Asn Tyr Leu Val Glu Gln Leu Lys Ile Pro Thr Pro Lys Asp
275 280 285
Met Arg His Ile Asp Arg Lys Leu Lys His Cys Leu Asp Pro Ser Ser
290 295 300
Gln Asp Glu His Lys Lys Lys Glu Lys Lys Ser Lys His Lys Ser Lys
305 310 315 320
Arg Ala Ala Asn Glu Ala Gln Leu Asp Ser
325 330
<210>178
<211>1434
<212>DNA
<213>番茄
<400>178
ggaaaatgcc agtttattgg aaagagaatt agaatcggca gataaaagat atggcggatt 60
tcatgacatc tactcataaa accaagtgga tttatactct ccaagatatt aaacataagt 120
acaaagttgc taatcaaagg gcgaaacaag cactagagat gtttggaaca actcgaatgg 180
aagttgatat tgatgggact ttctcgtatg ctgaaagtca aaatgacaca aaagataacg 240
ctgaaaagcg tcctaaacca ctcaaagttg aagaagaaca gcttctaagg gctttctacg 300
aattcaaaat tcaagacgtt tgtgatgcct ttaagttccc tcgtaagatt caggcaacag 360
ccctcattta ttttaagagg ttttatctgc tgtggtccgt gatggaacat caccccaaag 420
acattatgtt aacgtgcata tatgcagctt gcaaggcaga ggaaaatcat gtatcagctg 480
aggagcttgg taaggggatt ggacaggatc atcatgttat cctcaataat gagatgctgg 540
tttttcagag tctaggattt gatcttattg cttatgctcc atatcgtgca ctcgaaggtt 600
ttatcagtaa tttagaggag ttctgtggag ctcaagataa cgaccagctt ctggcactga 660
agggtgcact tgatactgct aggattgaag cagataagat tatgcgtagt gatggaccac 720
ttctattccc acctgggcag ttggcattga cagctctgca tagagctgat gcagcgcatg 780
gcatattcga ttttgagagg tacttgagaa gtgtcctatc acatcatgat cagccaggtc 840
atgccatttc agaacttact gattctataa acgttatcga ttctttggtt ggtaaacttt 900
tgactccgac ttccaaagac gtgaagcaca ttgatcggaa actcaaatca tgtcttgatc 960
cgggttcaca tgacaagagt aaaaaaagga agcatagatc caaagatagc tcaaatgagg 1020
ttacagacat ctcttgagct gctcttaact caagtttgta gcttcaagcg tatgttattt 1080
ggcaatagtt catcattgct gctcatcaca gtttccagat atagagcaaa aaatccagtc 1140
atactggaag acaccgtcta ctacatttgc attaggtttg agagaagaag cagacgcgga 1200
aatgggatca aagtttatga attgaactca ttgtattgtt taaattacgg gatttgatct 1260
tatatttgtt cagattttta gtagttatat cgaaagttat gattcagatg aacatgtagt 1320
caaagcccca acatcttgtc ccagagaaga tcacattgtt aaagatgtgt aagtaagaat 1380
ggacttattt gtctgtttta atataacttt tttggtttta aaaaaaaaaa aaaa 1434
<210>179
<211>328
<212>PRT
<213>番茄
<400>179
Met Ala Asp Phe Met Thr Ser Thr His Lys Thr Lys Trp Ile Tyr Thr
1 5 10 15
Leu Gln Asp Ile Lys His Lys Tyr Lys Val Ala Asn Gln Arg Ala Lys
20 25 30
Gln Ala Leu Glu Met Phe Gly Thr Thr Arg Met Glu Val Asp Ile Asp
35 40 45
Gly Thr Phe Ser Tyr Ala Glu Ser Gln Asn Asp Thr Lys Asp Asn Ala
50 55 60
Glu Lys Arg Pro Lys Pro Leu Lys Val Glu Glu Glu Gln Leu Leu Arg
65 70 75 80
Ala Phe Tyr Glu Phe Lys Ile Gln Asp Val Cys Asp Ala Phe Lys Phe
85 90 95
Pro Arg Lys Ile Gln Ala Thr Ala Leu Ile Tyr Phe Lys Arg Phe Tyr
100 105 110
Leu Leu Trp Ser Val Met Glu His His Pro Lys Asp Ile Met Leu Thr
115 120 125
Cys Ile Tyr Ala Ala Cys Lys Ala Glu Glu Asn His Val Ser Ala Glu
130 135 140
Glu Leu Gly Lys Gly Ile Gly Gln Asp His His Val Ile Leu Asn Asn
145 150 155 160
Glu Met Leu Val Phe Gln Ser Leu Gly Phe Asp Leu Ile Ala Tyr Ala
165 170 175
Pro Tyr Arg Ala Leu Glu Gly Phe Ile Ser Asn Leu Glu Glu Phe Cys
180 185 190
Gly Ala Gln Asp Asn Asp Gln Leu Leu Ala Leu Lys Gly Ala Leu Asp
195 200 205
Thr Ala Arg Ile Glu Ala Asp Lys Ile Met Arg Ser Asp Gly Pro Leu
210 215 220
Leu Phe Pro Pro Gly Gln Leu Ala Leu Thr Ala Leu His Arg Ala Asp
225 230 235 240
Ala Ala His Gly Ile Phe Asp Phe Glu Arg Tyr Leu Arg Ser Val Leu
245 250 255
Ser His His Asp Gln Pro Gly His Ala Ile Ser Glu Leu Thr Asp Ser
260 265 270
Ile Asn Val Ile Asp Ser Leu Val Gly Lys Leu Leu Thr Pro Thr Ser
275 280 285
Lys Asp Val Lys His Ile Asp Arg Lys Leu Lys Ser Cys Leu Asp Pro
290 295 300
Gly Ser His Asp Lys Ser Lys Lys Arg Lys His Arg Ser Lys Asp Ser
305 310 315 320
Ser Asn Glu Val Thr Asp Ile Ser
325
<210>180
<211>1600
<212>DNA
<213>玉米
<400>180
aaaaccatca ccgccttccc ggcgctcgcc gctgccaccc gtcgccgcgc gcctttccgc 60
cacccgccgc cgctgttggc gcccaaacat cgcatctgct gttgctttat cccttttatt 120
ccacagccgc tctaagtggt gggtgtccct ctatattcgc cgcttatagg aatcgagggt 180
tcgatcggct gtggtgcgtg gtgactgtga acgaggagga gcgcaaagat ggctgatttc 240
cggacctcca cccaacggga gaggtggatc ttccagtcgc acgatttgat ggagaggtgg 300
gcggcggcaa accagcgggc cgctcagacc cttgcgcagt atgggacgac ccggcttaat 360
gtggacctgc ttgatggctc ggtatcctac ccagagtcca tgccggatca tgttgagggt 420
agctcggttg taaagcctct ttcttacgaa gaggagcaat tgacaagggt attttacgag 480
cagaagattc aggaagtatg cgctgcattc aagttccctc acaaaatcca ggctacagca 540
ataatatatt tcaagagatt ctatctacaa tggtctgtaa tggagcatca accaaagcat 600
attatgttaa catgtgtata tgcttcttgc aaagtggaag aaaaccatgt ttctgctgag 660
gaacttggta aaggaattca gcaggaccac cagatcattc taaataatga gatgattctt 720
cttaaaactt tagattttga tctcattgtt tatgctccat atcgatcgat tgaaggattt 780
attgatgacc tagaggattt ctgcagggca ggtaatggtc cattccagcg tttgaaggag 840
ttgcgccagg ctgctatatc ccatgttgac aaaatgatgt tgactgatgc acctcttctc 900
tatacccctg ggcagttggc actggcggct cttcacaagt ctaatgatct tctcagggtc 960
gtcgattttg aaagatactt ggaaattatc ttctcaaggc aacattctga ttgtccaatc 1020
gaacagtttg ttcagtcgat caacgaaatc aattacttag tcgaccagct taatatacct 1080
actgtcaaag acatgagaca cgtggaccgc aagctgaaac attgctggga tccaagctca 1140
catgacgagc ataacaagaa gaaagaaaag aagtcaaagc acaaatcgaa aagaacatct 1200
accgatgccc aactatagga agcatatggt ccagcagtgg ctttgtgtaa gagtacaacg 1260
ggcctccaaa tgatcgaaac tgaactcagg catctaagca cagcagctct aagacagctt 1320
tctacaccag ctgaggcata cctgaggtca agcaattttg tgacgatgtg ggctatggaa 1380
cttcattgct ccaatgggag agttgcagca aagatacaaa ctaagagatg taacattgga 1440
tgcctaactc caaagtacgg agaacttcaa attttatatg gccgactttg tgtcagccac 1500
aattacttga gttccttttg ttacggatgt agcattgttt attaagttta aacgccgaat 1560
ccaagatgat ccacctgctg ttgtgaatcg ttttttaact 1600
<210>181
<211>329
<212>PRT
<213>玉米
<400>181
Met Ala Asp Phe Arg Thr Ser Thr Gln Arg Glu Arg Trp Ile Phe Gln
1 5 10 15
Ser His Asp Leu Met Glu Arg Trp Ala Ala Ala Asn Gln Arg Ala Ala
20 25 30
Gln Thr Leu Ala Gln Tyr Gly Thr Thr Arg Leu Asn Val Asp Leu Leu
35 40 45
Asp Gly Ser Val Ser Tyr Pro Glu Ser Met Pro Asp His Val Glu Gly
50 55 60
Ser Ser Val Val Lys Pro Leu Ser Tyr Glu Glu Glu Gln Leu Thr Arg
65 70 75 80
Val Phe Tyr Glu Gln Lys Ile Gln Glu Val Cys Ala Ala Phe Lys Phe
85 90 95
Pro His Lys Ile Gln Ala Thr Ala Ile Ile Tyr Phe Lys Arg Phe Tyr
100 105 110
Leu Gln Trp Ser Val Met Glu His Gln Pro Lys His Ile Met Leu Thr
115 120 125
Cys Val Tyr Ala Ser Cys Lys Val Glu Glu Asn His Val Ser Ala Glu
130 135 140
Glu Leu Gly Lys Gly Ile Gln Gln Asp His Gln Ile Ile Leu Asn Asn
145 150 155 160
Glu Met Ile Leu Leu Lys Thr Leu Asp Phe Asp Leu Ile Val Tyr Ala
165 170 175
Pro Tyr Arg Ser Ile Glu Gly Phe Ile Asp Asp Leu Glu Asp Phe Cys
180 185 190
Arg Ala Gly Asn Gly Pro Phe Gln Arg Leu Lys Glu Leu Arg Gln Ala
195 200 205
Ala Ile Ser His Val Asp Lys Met Met Leu Thr Asp Ala Pro Leu Leu
210 215 220
Tyr Thr Pro Gly Gln Leu Ala Leu Ala Ala Leu His Lys Ser Asn Asp
225 230 235 240
Leu Leu Arg Val Val Asp Phe Glu Arg Tyr Leu Glu Ile Ile Phe Ser
245 250 255
Arg Gln His Ser Asp Cys Pro Ile Glu Gln Phe Val Gln Ser Ile Asn
260 265 270
Glu Ile Asn Tyr Leu Val Asp Gln Leu Asn Ile Pro Thr Val Lys Asp
275 280 285
Met Arg His Val Asp Arg Lys Leu Lys His Cys Trp Asp Pro Ser Ser
290 295 300
His Asp Glu His Asn Lys Lys Lys Glu Lys Lys Ser Lys His Lys Ser
305 310 315 320
Lys Arg Thr Ser Thr Asp Ala Gln Leu
325
<210>182
<211>1578
<212>DNA
<213>普通小麦
<400>182
cgctgccgct gccgcccgtc gccgcgcccc tcctcggcgt cctccggaag acgccatagt 60
attgcggcat cccctccaca cccgcttcca tcaagcggtg ttcaccagca ggggggaggg 120
gggctcgatt cggctgctgg gagcggaggt aggagcggcc aagatgtcgg atttccagac 180
ctccacgcac cgggagcggt ggatcttcca gccgcaggac ctggtgaata agtggacgac 240
ggcgaaccgg cgttcagcgg agatcctcgc ccagtatggg acgacgagat tgaaggtgga 300
ccctgttgat ggctcgatat cgaacccaga acctctgcct gatcatgttg ttgggagctc 360
gagcgtgaag cctctatcct gcgaagagga gcaagtgatg cggatatttt acgagcaaaa 420
gattcaagaa gtgtgcagag cattcaaatt cccccacaaa attcaggcta cagcgataat 480
atatttcaag agattctatc tacagtggtc tgtaatggag caccacccaa agcatattat 540
gttaacttgt gtatatgctt cttgcaaagt ggaagaaaat catgtttctg ctgaggaact 600
tggcaaaggg attcagcagg accaccagat cattctaaat aatgagatga ttgttctgaa 660
atctttagat tttgatttga tcggtttatg ctccatatcg ttctatcgaa ggatttattg 720
atgacctgga tgatttatgt agggcacgta atggtgcaca ccaacggttg aaggatttgc 780
atcaaactgc gaattctgag gttgacacaa tgatgttgac tgatgcacct cttctctata 840
ctcctggaca gttggctttg gctgctctgt acaagtccaa cagtgcactc agtgtcctcg 900
attttgaaag atacttggaa agtgtttttt caaggcaaca ctttgattgt cctgtcgaac 960
aatttattca gataatcagt tcaatcaatc acctggttag ccagcttcaa ctacctggta 1020
cgaaagaaat gaggcatgct gatcgcaagc tgaagcattg tttggatcca agctcaagct 1080
ctcatgatga ccacaagaag aaagaaaaga agtcaaagca caaatcgaaa aggactgcca 1140
gtgatgccca gctcaacagc tagaaatcgt gcagttggac agctgtgctg tgtaagaaat 1200
cgtgcagttg gtggcaagga cttgtactgt gctaggcgcg ttagctgctt tatcatgcaa 1260
ccaagttcta ctcaagctct tcgattgatg cgatttcaat tccgacttta tccagccatc 1320
ggatcagtga tgctgagcgg atctcctcac cagcctaagt cttggctaag gacagacagt 1380
tttcggatga ggcgccttac tgtaaccttg cacgtcctgc gccagcgagt gctgtgcttt 1440
ttgtaactca ataattttat tattagggag gcttaaatct tgggcgcgag gggagagaaa 1500
ctttgaggtg taaaacatta ttactagagt aacttagggc ctgtttggtt tcaaataagt 1560
caccaacttt taggtcgc 1578
<210>183
<211>332
<212>PRT
<213>普通小麦
<400>183
Met Ser Asp Phe Gln Thr Ser Thr His Arg Glu Arg Trp Ile Phe Gln
1 5 10 15
Pro Gln Asp Leu Val Asn Lys Trp Thr Thr Ala Asn Arg Arg Ser Ala
20 25 30
Glu Ile Leu Ala Gln Tyr Gly Thr Thr Arg Leu Lys Val Asp Pro Val
35 40 45
Asp Gly Ser Ile Ser Asn Pro Glu Pro Val Pro Asp His Val Val Gly
50 55 60
Ser Ser Ser Val Lys Pro Leu Ser Cys Glu Glu Glu Gln Val Met Arg
65 70 75 80
Ile Phe Tyr Glu Gln Lys Ile Gln Glu Val Cys Arg Ala Phe Lys Phe
85 90 95
Pro His Lys Ile Gln Ala Thr Ala Ile Ile Tyr Phe Lys Arg Phe Tyr
100 105 110
Leu Gln Trp Ser Val Met Glu His His Pro Lys His Ile Met Leu Thr
115 120 125
Cys Val Tyr Ala Ser Cys Lys Val Glu Glu Asn His Val Ser Ala Glu
130 135 140
Glu Leu Gly Lys Gly Ile Gln Gln Asp His Gln Ile Ile Leu Asn Asn
145 150 155 160
Glu Met Ile Val Leu Lys Ser Leu Asp Phe Asp Leu Ile Val Tyr Ala
165 170 175
Pro Tyr Arg Ser Ile Glu Gly Phe Ile Asp Asp Met Asp Asp Phe Cys
180 185 190
Arg Ala Gly Asn Gly Ala His Gln Arg Leu Lys Asp Leu His Gln Thr
195 200 205
Ala Asn Ser Glu Val Asp Thr Met Met Leu Thr Asp Ala Pro Leu Leu
210 215 220
Tyr Thr Pro Gly Gln Leu Ala Leu Ala Ala Leu Tyr Lys Ser Asn Ser
225 230 235 240
Ala Leu Ser Val Leu Asp Phe Glu Arg Tyr Leu Glu Ser Val Phe Ser
245 250 255
Arg Gln His Phe Asp Cys Pro Val Glu Gln Phe Ile Gln Ile Ile Ser
260 265 270
Ser Ile Asn His Leu Val Ser Gln Leu Gln Leu Pro Gly Thr Lys Glu
275 280 285
Met Arg His Ala Asp Arg Lys Leu Lys His Cys Leu Asp Pro Ser Ser
290 295 300
Ser Ser His Asp Asp His Lys Lys Lys Glu Lys Lys Ser Lys His Lys
305 310 315 320
Ser Lys Arg Thr Ala Ser Asp Ala Gln Leu Asn Ser
325 330
<210>184
<211>1564
<212>DNA
<213>红花耧斗菜(Aquilegia rormosa)
<400>184
atccctgtca tggcgattct catcagctct ggaaataaaa ctatctaaaa ccctaacaat 60
ctccttctct ctctctctct ctctctctct ctctctctct ctctctctct ctctctctct 120
ctctctctct ctgaaatctc catggctgat ttccaaacat caacgcaccg agctaaatgg 180
attttcacac caaatgaact ggttgagaaa tacaaagttt ctaatcaaag agcaatcaaa 240
atgctgaagg agtatgggtc aacacgtata gaagtgagtg ctgatggttc attgtcttac 300
cctgaacctc aattggatgc aactaaagtt gaaaagcgct cccatacaaa gccacttagt 360
attgaagatg aacaacttat gcgggtgttc tatgaacaaa agattcaaga agtgtgtcta 420
gcctttggat ttccacagaa aattcagggt acagccatca tttatttcaa gaggttctat 480
ttgcaatggt ctgtaatgga gcatcatcca aaaaatataa tgttaacgtg catatatgct 540
tcatgtaaaa tagaagaaaa ccatgtatca gcagaggagc ttggtaaagg cattcaacag 600
gatcatcaag tgattctcaa caacgagatg ctagttcttc agagtctggg atttgatctt 660
attgtgtatg caccatatcg ctcaattgaa ggttttgtcg atgatataga ggatttctgc 720
caagcaaacg accagctcga aatgttgaag gacctgaaag aaactgcaaa gttggaagta 780
gatcgaattt tacttacaga tgcaccactt ctgttcccac ctgggcagtt ggcgttggct 840
gctttgcgta ggtcgaacga ggtacatgga gttcttgatt ttgagagata cttgggtagc 900
atcatctctc gtcaacagtc tatgcacact agttcagagc tgattgaatc tctgaatctg 960
atatattctc tgcttgtaaa actcaaaatg ccttcaagcg atgatatgaa gcccatagat 1020
aggaaactaa gatattgttt ggatceaagc ttgcaggatg ataagaaacg tgaaaagaga 1080
tcaaaacaca agtcgaagaa aagttcaagc gaaaagcatg gcttgccttc ttctacgcca 1140
tcttaatttc caagccatgt tgttattgtg cttcaggtgg aggagcctat atgttttata 1200
tacaaagcag ctgttcttca tgaacaagaa aatgcacctc gacccagtca gaatgttcac 1260
atgttttaga aagacagatt ggcaaacttt cttcgaggac ctctgttata cacacggtgt 1320
tcctctccat ccagttgcta atccattcac tgtatgggat atatggcagc aaatagagct 1380
ggacattatt gttgtaaaac caaaccctca gtttataacc aatgtcagac tggtggcatc 1440
agaagaggag catttttttg agttggtgat attattcttg ttgtgagcaa attttttttt 1500
tttttttgga tatatttctg agcatttcag agtatgtaca acgggtagtt gaaattttgt 1560
ttgt 1564
<210>185
<211>334
<212>PRT
<213>红花耧斗菜
<400>185
Met Ala Asp Phe Gln Thr Ser Thr His Arg Ala Lys Trp Ile Phe Thr
1 5 10 15
Pro Asn Glu Leu Val Glu Lys Tyr Lys Val Ser Asn Gln Arg Ala Ile
20 25 30
Lys Met Leu Lys Glu Tyr Gly Ser Thr Arg Ile Glu Val Ser Ala Asp
35 40 45
Gly Ser Leu Ser Tyr Pro Glu Pro Gln Leu Asp Ala Thr Lys Val Glu
50 55 60
Lys Arg Ser His Thr Lys Pro Leu Ser Ile Glu Asp Glu Gln Leu Met
65 70 75 80
Arg Val Phe Tyr Glu Gln Lys Ile Gln Glu Val Cys Leu Ala Phe Gly
85 90 95
Phe Pro Gln Lys Ile Gln Gly Thr Ala Ile Ile Tyr Phe Lys Arg Phe
100 105 110
Tyr Leu Gln Trp Ser Val Met Glu His His Pro Lys Asn Ile Met Leu
115 120 125
Thr Cys Ile Tyr Ala Ser Cys Lys Ile Glu Glu Asn His Val Ser Ala
130 135 140
Glu Glu Leu Gly Lys Gly Ile Gln Gln Asp His Gln Val Ile Leu Asn
145 150 155 160
Asn Glu MetLeu Val Leu Gln Ser Leu Gl y Phe Asp Leu Ile Val Tyr
165 170 175
Ala Pro Tyr Arg Ser Ile Glu Gly Phe Val Asp Asp Ile Glu Asp Phe
180 185 190
Cys Gln Ala Asn Asp Gln Leu Glu Met Leu Lys Asp Leu Lys Glu Thr
195 200 205
Ala Lys Leu Glu Val Asp Arg Ile Leu Leu Thr Asp Ala Pro Leu Leu
210 215 220
Phe Pro Pro Gly Gln Leu Ala Leu Ala Ala Leu Arg Arg Ser Asn Glu
225 230 235 240
Val His Gly Val Leu Asp Phe Glu Arg Tyr Leu Gly Ser Ile Ile Ser
245 250 255
Arg Gln Gln Ser Met His Thr Ser Ser Glu Leu Ile Glu Ser Leu Asn
260 265 270
Leu Ile Tyr Ser Leu Leu Val Lys Leu Lys Met Pro Ser Ser Asp Asp
275 280 285
Met Lys Pro Ile Asp Arg Lys Leu Arg Tyr Cys Leu Asp Pro Ser Leu
290 295 300
Gln Asp Asp Lys Lys Arg Glu Lys Arg Ser Lys His Lys Ser Lys Lys
305 310 315 320
Ser Ser Ser Glu Lys His Gly Leu Pro Ser Ser Thr Pro Ser
325 330
<210>186
<211>1225
<212>DNA
<213>马铃薯(Solanum tuberosum)
<400>186
ttcctccatc acaaagcctt aagcccttcc ggtatattaa cccgctgctg gtctctccgg 60
gcgatcgatt caccggcgaa aaatctgcga tcttctagag atgaaacgct gggccatggc 120
atagtttatt ggaagatcac atccaaacga aaattagaat tggcagagag aagacatggc 180
tgatttcgtg acatctactc ataaaaccaa gtggattttt actccccaag atattaaaca 240
taagtataaa gttgctaatc acagagcgaa acaagcacta gagaagtatg gaacaacgcg 300
aatggaagtt gatattgatg ggtcgttctc gtatgctgaa agtcaaaatg acgcaaaaga 360
tagtgctgaa aagcgtccta aaccactcaa ggttgaagaa gaacaacttc taagggcttt 420
ctacgagttc aaaattcaag acgtctgtga tgcctttaag ttcccacgta agattcaggc 480
gacagctctc atttatttta agaggtttta tctacaatgg tccgtgatgg aacatcaccc 540
taaagacatt atgttaacct gcatatatgc agcttgcaag gcagaggaaa accatgtatc 600
agctgaggag cttgggaagg gtattggaca ggatcatcat gtaatcctca acaatgagat 660
gctggttttc cagagtctag gatttgatct aattgtttat gctccatatc gggctcttga 720
aagttttatc agtgatttag aggaattctg tggagctaaa gatgaagacc agcttgtggc 780
actgaagggt tcacttgata ctgctaggat tgaagcagat aagattatgc gttctgatgg 840
accacttcta ttcccacctg ggcagttggc attgacagct ttgcatagag ctaacgcagc 900
gcatagcata tttgattttg agaggtacct aagaagtgtc ctatcacatt atgagccagc 960
tcatgccatt tcagaacttg ctggttctat aaatgccatt gattctttgg ttggcaaact 1020
tttgactccg acttccaaag atgtgaagca cgttgatcgg aaactcaaat catgtcttga 1080
tccggggttc acatgacaag agtaaaaaaa ggaagcatag atccaaagat agctcacatg 1140
aggcctacag acatatcttg aaac tgctctaactcagttt gtaacttcaa gcatatctta 1200
ttttgcccat ggaatatatt ctcat 1225
<210>187
<211>305
<212>PRT
<213>马铃薯
<400>187
Met Ala Asp Phe Val Thr Ser Thr His Lys Thr Lys Trp Ile Phe Thr
1 5 10 15
Pro Gln Asp Ile Lys His Lys Tyr Lys Val Ala Asn His Arg Ala Lys
20 25 30
Gln Ala Leu Glu Lys Tyr Gly Thr Thr Arg Met Glu Val Asp Ile Asp
35 40 45
Gly Ser Phe Ser Tyr Ala Glu Ser Gln Asn Asp Ala Lys Asp Ser Ala
50 55 60
Glu Lys Arg Pro Lys Pro Leu Lys Val Glu Glu Glu Gln Leu Leu Arg
65 70 75 80
Ala Phe Tyr Glu Phe Lys Ile Gln Asp Val Cys Asp Ala Phe Lys Phe
85 90 95
Pro Arg Lys Ile Gln Ala Thr Ala Leu Ile Tyr Phe Lys Arg Phe Tyr
100 105 110
Leu Gln Trp Ser Val Met Glu His His Pro Lys Asp Ile Met Leu Thr
115 120 125
Cys Ile Tyr Ala Ala Cys Lys Ala Glu Glu Asn His Val Ser Ala Glu
130 135 140
Glu Leu Gly Lys Gly Ile Gly Gln Asp His His Val Ile Leu Asn Asn
145 150 155 160
Glu Met Leu Val Phe Gln Ser Leu Gly Phe Asp Leu Ile Val Tyr Ala
165 170 175
Pro Tyr Arg Ala Leu Glu Ser Phe Ile Ser Asp Leu Glu Glu Phe Cys
180 185 190
Gly Ala Lys Asp Glu Asp Gln Leu Val Ala Leu Lys Gly Ser Leu Asp
195 200 205
Thr Ala Arg Ile Glu Ala Asp Lys Ile Met Arg Ser Asp Gly Pro Leu
210 215 220
Leu Phe Pro Pro Gly Gln Leu Ala Leu Thr Ala Leu His Arg Ala Asn
225 230 235 240
Ala Ala His Ser Ile Phe Asp Phe Glu Arg Tyr Leu Arg Ser Val Leu
245 250 255
Ser His Tyr Glu Pro Ala His Ala Ile Ser Glu Leu Ala Gly Ser Ile
260 265 270
Asn Ala Ile Asp Ser Leu Val Gly Lys Leu Leu Thr Pro Thr Ser Lys
275 280 285
Asp Val Lys His Val Asp Arg Lys Leu Lys Ser Cys Leu Asp Pro Gly
290 295 300
Phe
305
<210>188
<211>1187
<212>DNA
<213>甘蔗(Saccharum officinarum)
<400>188
ctccccggcg ctcgccgctg ccatccgtcg ccgcgcgcct ttccaccggt cgccgccgct 60
attcgcgccc aaacagcgca tcctgctgtt gtgtcattcc tttccacaga cacccgctct 120
aagtggtggg tgccccgcta tactcgccgc ttatcggaac cgagggttcg atcggctgtg 180
ggtgactgtg aaggaggagg agcgcaaaga tggctgattt ccggacctca acccaacggg 240
agaggtggat cttccagtcg cacgatctga tggagaggtg ggcggcggea aaccagcggg 300
ctgctcagac ccttgcgcag tatgggacga cgcggcttag tgtggacctg cttgatggct 360
cggtctccta cccagagccc gcaccggatc atgttgaggg tagctcgggt gtaaagcctc 420
tgtcttacga agaggagcaa ttgacacggg tattttatga gcagaagatt caggaagtat 480
gcgctgcatt caagttccct cacaaaatcc aggctacagc aataatatat ttcaagagat 540
tctatttaca gtggtctgta atggagcatc acccaaagca taatatgtta acatgtgtat 600
atgcttcttg caaagtggaa gaaaaccatg tttctgctga ggaacttggt aaaggaattc 660
agcaggacca ccagatcatt ctaaataatg agatgattct tcttaaaact ttagattttg 720
atctcattgt ttatgctcca tatcgatcga ttgaaggatt tattgatgac ctagaggatt 780
tctgcagggc aggtaatggt ccgttccagc gtttgaagga gttgcgccag gctgctatat 840
cccgtgttga caaaatgatg ttgactgatg cacctcttct ctatacccct gggcagttgg 900
cactggctgc tcttcacaag tccaatgatc ttctcagggt cgtcaatttt gaaagatact 960
tggaaactat cttctcaagg caacattctg attgtccggt cgaacagttt gttcagtcga 1020
tcaacacaat caattacttg gttgaccagc ttaatatacc tactgttaag gacatgaggc 1080
acgtcgaacg gaagctgaaa cattgttggg attcaagctc ccattatgag ccttagaaga 1140
aagagaagaa agtcaagccc aaatttaaaa agaacatttg gtggttc 1187
<210>189
<211>308
<212>PRT
<213>甘蔗
<400>189
Met Ala Asp Phe Arg Thr Ser Thr Gln Arg Glu Arg Trp Ilc Phe Gln
1 5 10 15
Ser His Asp Leu Met Glu Arg Trp Ala Ala Ala Asn Gln Arg Ala Ala
20 25 30
Gln Thr Leu Ala Gln Tyr Gly Thr Thr Arg Leu Ser Val Asp Leu Leu
35 40 45
Asp Gly Ser Val Ser Tyr Pro Glu Pro Ala Pro Asp His Val Glu Gly
50 55 60
Ser Ser Gly Val Lys Pro Leu Ser Tyr Glu Glu Glu Gln Leu Thr Arg
65 70 75 80
Val Phe Tyr Glu Gln Lys Ile Gln Glu Val Cys Ala Ala Phe Lys Phe
85 90 95
Pro His Lys Ile Gln Ala Thr Ala Ile Ile Tyr Phe Lys Arg Phe Tyr
100 105 110
Leu Gln Trp Ser Val Met Glu His His Pro Lys His Asn Met Leu Thr
115 120 125
Cys Val Tyr Ala Ser Cys Lys Val Glu Glu Asn His Val Ser Ala Glu
130 135 140
Glu Leu Gly Lys Gly Ile Gln Gln Asp His Gln Ile Ile Leu Asn Asn
145 150 155 160
Glu Met Ile Leu Leu Lys Thr Leu Asp Phe Asp Leu Ile Val Tyr Ala
165 170 175
Pro Tyr Arg Ser Ile Glu Gly Phe Ile Asp Asp Leu Glu Asp Phe Cys
180 185 190
Arg Ala Gly Asn Gly Pro Phe Gln Arg Leu Lys Glu Leu Arg Gln Ala
195 200 205
Ala Ile Ser Arg Val Asp Lys Met Met Leu Thr Asp Ala Pro Leu Leu
210 215 220
Tyr Thr Pro Gly Gln Leu Ala Leu Ala Ala Leu His Lys Ser Asn Asp
225 230 235 240
Leu Leu Arg Val Val Asn Phe Glu Arg Tyr Leu Glu Thr Ile Phe Ser
245 250 255
Arg Gln His Ser Asp Cys Pro Val Glu Gln Phe Val Gln Ser Ile Asn
260 265 270
Thr Ile Asn Tyr Leu Val Asp Gln Leu Asn Ile Pro Thr Val Lys Asp
275 280 285
Met Arg His Val Glu Arg Lys Leu Lys His Cys Trp Asp Ser Ser Ser
290 295 300
His Tyr Glu Pro
305
<210>190
<211>969
<212>DNA
<213>Ostreococcus tauri
<400>190
atgtgcgatt acgcctcatc gacgcagcgc gagcactggc tccatgaatc cgtcgcccag 60
gtcgacgcga gacgcgcgcg cgcgcgcgtg gagacgttcg agcgcgcgaa agcatcgagc 120
gagtcgtcaa cctcagccat ggaaaccgaa gcgctgacgc ccgaagagga gcgaacgatc 180
gtgaggtacc acgaggcgaa gatacaatcc gtctgcggcg cgtttgcgct gccgagaaag 240
gtgaagaaca cggcggtgat gctgttcaag cgcttcgcgg tggattgcgg gacgcacgcg 300
caatcgctga agatcatgat gctgacgagc gtgtacgtag cgtgtaaggt ggaggagagc 360
tacatctcgg cggaggagtt ctgtaagggc gtgagagagg acccgtcgcg agtgttagcg 420
gcggaggtga cgtttctatc tggattgaag tttcggttgg tgtgctacgg agcgacgcgg 480
ccgctggacg ggttcctgat ggacgtcgag gacggtgggt gcaagggagc gacgtcgaaa 540
cagctcatcg agtgcagaaa gaaagcgtta gatatcgtcg atcggttgat gctgacggac 600
gcgccgctga ttcgaccgcc ggggcagatc gcgctgtgcg cgcttcgtcg ggccgcgcgc 660
gaatgcgggg cgagtgaact cgaaaagtat tgcgaagacg tcggcgcgcg agggacgacc 720
aaggcgccgc gcggagcgaa actcaaggaa atcttagacg atatcgaatc gcacgtcgac 780
gagggcgttg aacccgacgc ggctgtcgtg aaggagattg acaaaaagct caaactctgg 840
cgtgccaaat atctggctaa gacgccggca gcggacgacg ctggcgatgc gcagaaagct 900
gcgaaacgtc gaaagagcga acaatctaga caagacatga tcgccgccga ggaggacgcg 960
ctcggataa 969
<210>191
<211>322
<212>PRT
<213>Ostreococcus tauri
<400>191
Met Cys Asp Tyr Ala Ser Ser Thr Gln Arg Glu His Trp Leu His Glu
1 5 10 15
Ser Val Ala Gln Val Asp Ala Arg Arg Ala Arg Ala Arg Val Glu Thr
20 25 30
Phe Glu Arg Ala Lys Ala Ser Ser Glu Ser Ser Thr Ser Ala Met Glu
35 40 45
Thr Glu Ala Leu Thr Pro Glu Glu Glu Arg Thr Ile Val Arg Tyr His
50 55 60
Glu Ala Lys Ile Gln Ser Val Cys Gly Ala Phe Ala Leu Pro Arg Lys
65 70 75 80
Val Lys Asn Thr Ala Val Met Leu Phe Lys Arg Phe Ala Val Asp Cys
85 90 95
Gly Thr His Ala Gln Ser Leu Lys Ile Met Met Leu Thr Ser Val Tyr
100 105 110
Val Ala Cys Lys Val Glu Glu Ser Tyr Ile Ser Ala Glu Glu Phe Cys
115 120 125
Lys Gly Val Arg Glu Asp Pro Ser Arg Val Leu Ala Ala Glu Val Thr
130 135 140
Phe Leu Ser Gly Leu Lys Phe Arg Leu Val Cys Tyr Gly Ala Thr Arg
145 150 155 160
Pro Leu Asp Gly Phe Leu Met Asp Val Glu Asp Gly Gly Cys Lys Gly
165 170 175
Ala Thr Ser Lys Gln Leu Ile Glu Cys Arg Lys Lys Ala Leu Asp Ile
180 185 190
Val Asp Arg Leu Met Leu Thr Asp Ala Pro Leu Ile Arg Pro Pro Gly
195 200 205
Gln Ile Ala Leu Cys Ala Leu Arg Arg Ala Ala Arg Glu Cys Gly Ala
210 215 220
Ser Glu Leu Glu Lys Tyr Cys Glu Asp Val Gly Ala Arg Gly Thr Thr
225 230 235 240
Lys Ala Pro Arg Gly Ala Lys Leu Lys Glu Ile Leu Asp Asp Ile Glu
245 250 255
Ser His Val Asp Glu Gly Val Glu Pro Asp Ala Ala Val Val Lys Glu
260 265 270
Ile Asp Lys Lys Leu Lys Leu Trp Arg Ala Lys Tyr Leu Ala Lys Thr
275 280 285
Pro Ala Ala Asp Asp Ala Gly Asp Ala Gln Lys Ala Ala Lys Arg Arg
290 295 300
Lys Ser Glu Gln Ser Arg Gln Asp Met Ile Ala Ala Glu Glu Asp Ala
305 310 315 320
Leu Gly
<210>192
<211>1244
<212>DNA
<213>黑腹果蝇(Drosophila melanogaster)
<400>192
cacgagctcg tgccgattcg gcacgagcgg cacgagctct ctctctctct ctctctctct 60
ctctctctct ctctcgcaag atgtatcctg tgagctcgca aaagaggtcc tggacattcg 120
ccaatgaggg ccagctcatg gagttccgcg tggagcagaa cagcaagtac atcgagtcgc 180
acgaggagga ggcgcagggt cgcgacctca atgagcactt tctcacgtcg gcggaggagc 240
gcctgttgct gaagcagtac gagatctacc tgttcgattt ctgccgccgc ttcgaaccga 300
cgatgcccaa gtgcgttgtg ggcacggcct tccactactt caagcggtte tatctgaaca 360
actcccccat ggactatcac cccaaggaga ttctagccac atgcgtgttc gttgcctgca 420
aagttgagga gttcaacgtg tccatcaacc agttcgtgaa caacatcaag ggcgacagga 480
acaaggccac cgacatagtg ttgtccaatg aattactgct gattggacag ctcaactact 540
acctcaccat acacaatccg ttcagaccca tcgagggttt cctgatagat ataaaaactc 600
gcagcaatat gcagaatcca gatcgtctgc ggccacatat tgatagtttc attgattcca 660
cgtactactc ggatgcctgt cttctgcata cgccttcgca aattgcattg gctgccgtcc 720
tccacgcggc cagcagagag caagagaatc tcgatagcta tgtgacggat cttctgtttg 780
tctccgccag ggagaagcta cccggactca tagatgccgt gcgaaaaatt cgcataatgg 840
tgaagcaata tcagcagccc gatcgggaga aggtcaaggc catcgagaaa aagttggaca 900
agtgccgaaa tcaagccaat aatcctgata gcgaactcta taaggagcgc ctacgccgat 960
tgtacaccga tgaggatgac atgcccgccg aagatgcctc attccacatt gcagatgtga 1020
gctcggacac atctgctatg aacatcagcc aatagactta agaatattta tttaaatgat 1080
gggatgatct actactgcgt ggatttcatc gatattaaag cattttgtaa tttaccattt 1140
cttgattgtt aaaatgtatg cgtttagtgt tagtttacta aacaaagttg gattaggtac 1200
ttcacttttc caatatataa aatattaaaa aaaaaaaaaa aaaa 1244
<210>193
<211>324
<212>PRT
<213>黑腹果蝇
<400>193
Met Tyr Pro Val Ser Ser Gln Lys Arg Ser Trp Thr Phe Ala Asn Glu
1 5 10 15
Gly Gln Leu Met Glu Phe Arg Val Glu Gln Asn Ser Lys Tyr Ile Glu
20 25 30
Ser His Glu Glu Glu Ala Gln Gly Arg Asp Leu Asn Glu His Phe Leu
35 40 45
Thr Ser Ala Glu Glu Arg Leu Leu Leu Lys Gln Tyr Glu Ile Tyr Leu
50 55 60
Phe Asp Phe Cys Arg Arg Phe Glu Pro Thr Met Pro Lys Cys Val Val
65 70 75 80
Gly Thr Ala Phe His Tyr Phe Lys Arg Phe Tyr Leu Asn Asn Ser Pro
85 90 95
Met Asp Tyr His Pro Lys Glu Ile Leu Ala Thr Cys Val Phe Val Ala
100 105 110
Cys Lys Val Glu Glu Phe Asn Val Ser Ile Asn Gln Phe Val Asn Asn
115 120 125
Ile Lys Gly Asp Arg Asn Lys Ala Thr Asp Ile Val Leu Ser Asn Glu
130 135 140
Leu Leu Leu Ile Gly Gln Leu Asn Tyr Tyr Leu Thr Ile His Asn Pro
145 150 155 160
Phe Arg Pro Ile Glu Gly Phe Leu Ile Asp Ile Lys Thr Arg Ser Asn
165 170 175
Met Gln Asn Pro Asp Arg Leu Arg Pro His Ile Asp Ser Phe Ile Asp
180 185 190
Ser Thr Tyr Tyr Ser Asp Ala Cys Leu Leu His Thr Pro Ser Gln Ile
195 200 205
Ala Leu Ala Ala Val Leu His Ala Ala Ser Arg Glu Gln Glu Asn Leu
210 215 220
Asp Ser Tyr Val Thr Asp Leu Leu Phe Val Ser Ala Arg Glu Lys Leu
225 230 235 240
Pro Gly Leu Ile Asp Ala Val Arg Lys Ile Arg Ile Met Val Lys Gln
245 250 255
Tyr Gln Gln Pro Asp Arg Glu Lys Val Lys Ala Ile Glu Lys Lys Leu
260 265 270
Asp Lys Cys Arg Asn Gln Ala Asn Asn Pro Asp Ser Glu Leu Tyr Lys
275 280 285
Glu Arg Leu Arg Arg Leu Tyr Thr Asp Glu Asp Asp Met Pro Ala Glu
290 295 300
Asp Ala Ser Phe His Ile Ala Asp Val Ser Ser Asp Thr Ser Ala Met
305 310 315 320
Asn Ile Ser Gln
<210>194
<211>1150
<212>DNA
<213>智人(Homo sapiens)
<400>194
cacgattcca taatgtacca caacagtagt cagaagcggc actggacctt ctccagcgag 60
gagcagctgg caagactgcg ggctgacgcc aaccgcaaat tcagatgcaa agccgtggcc 120
aacgggaagg ttcttccgaa tgatccagtc tttcttgagc ctcatgaaga aatgacactc 180
tgcaaatact atgagaaaag gttattggaa ttctgttcgg tgtttaagcc agcaatgcca 240
agatctgttg tgggtacggc ttgtatgtat ttcaaacgtt tttatcttaa taactcagta 300
atggaatatc accccaggat aataatgctc acttgtgcat ttttggcctg caaagtagat 360
gaattcaatg tatctagtcc tcagtttgtt ggaaacctcc gggagagtcc tcttggacag 420
gagaaggcac ttgaacagat actggaatat gaactacttc ttatacagca acttaatttc 480
caccttattg tccacaatcc ttacagacca tttgagggct tcctcatcga cttaaagacc 540
cgctatccca tattggagaa tccagagatt ttgaggaaaa cagctgatga ctttcttaat 600
agaattgcat tgacggatgc ttacctttta tacacacctt cccaaattgc cctgactgcc 660
attttatcta gtgcctccag ggctggaatt actatggaaa gttatttatc agagagtctg 720
atgctgaaag agaacagaac ttgcctgtca cagttactag atataatgaa aagcatgaga 780
aacttagtaa agaagtatga accacccaga tctgaagaag ttgctgttct gaaacagaag 840
ttggagcgat gtcattctgc tgagcttgca cttaacgtaa tcacgaagaa gaggaaaggc 900
tatgaagatg atgattacgt ctcaaagaaa tccaaacatg aggaggaaga atggactgat 960
gacgacctgg tagaatctct ctaaccattt gaagttgatt tctcaatgct aactaatcaa 1020
gagaagtagg aagcatatca aacgtttaac tttatttaaa aagtataatg tgaaaacata 1080
aaatatatta aaacttttct attgttttct ttccctttca cagtaacttt atgtaaaata 1140
aataaaccat 1150
<210>195
<211>323
<212>PRT
<213>智人
<400>195
Met Tyr His Asn Ser Ser Gln Lys Arg His Trp Thr Phe Ser Ser Glu
1 5 10 15
Glu Gln Leu Ala Arg Leu Arg Ala Asp Ala Asn Arg Lys Phe Arg Cys
20 25 30
Lys Ala Val Ala Asn Gly Lys Val Leu Pro Asn Asp Pro Val Phe Leu
35 40 45
Glu Pro His Glu Glu Met Thr Leu Cys Lys Tyr Tyr Glu Lys Arg Leu
50 55 60
Leu Glu Phe Cys Ser Val Phe Lys Pro Ala Met Pro Arg Ser Val Val
65 70 75 80
Gly Thr Ala Cys Met Tyr Phe Lys Arg Phe Tyr Leu Asn Asn Ser Val
85 90 95
Met Glu Tyr His Pro Arg Ile Ile Met Leu Thr Cys Ala Phe Leu Ala
100 105 110
Cys Lys Val Asp Glu Phe Asn Val Ser Ser Pro Gln Phe Val Gly Asn
115 120 125
Leu Arg Glu Ser Pro Leu Gly Gln Glu Lys Ala Leu Glu Gln Ile Leu
130 135 140
Glu Tyr Glu Leu Leu Leu Ile Gln Gln Leu Asn Phe His Leu Ile Val
145 150 155 160
His Asn Pro Tyr Arg Pro Phe Glu Gly Phe Leu Ile Asp Leu Lys Thr
165 170 175
Arg Tyr Pro Ile Leu Glu Asn Pro Glu Ile Leu Arg Lys Thr Ala Asp
180 185 190
Asp Phe Leu Asn Arg Ile Ala Leu Thr Asp Ala Tyr Leu Leu Tyr Thr
195 200 205
Pro Ser Gln Ile Ala Leu Thr Ala Ile Leu Ser Ser Ala Ser Arg Ala
210 215 220
Gly Ile Thr Met Glu Ser Tyr Leu Ser Glu Ser Leu Met Leu Lys Glu
225 230 235 240
Asn Arg Thr Cys Leu Ser Gln Leu Leu Asp Ile Met Lys Ser Met Arg
245 250 255
Asn Leu Val Lys Lys Tyr Glu Pro Pro Arg Ser Glu Glu Val Ala Val
260 265 270
Leu Lys Gln Lys Leu Glu Arg Cys His Ser Ala Glu Leu Ala Leu Asn
275 280 285
Val Ile Thr Lys Lys Arg Lys Gly Tyr Glu Asp Asp Asp Tyr Val Ser
290 295 300
Lys Lys Ser Lys His Glu Glu Glu Glu Trp Thr Asp Asp Asp Leu Val
305 310 315 320
Glu Ser Leu
<210>196
<211>1311
<212>DNA
<213>三角褐指藻(Phaeodactylum tricornutum)
<400>196
atggtagact acgacgacag cactcagctc aacaaatggc tcttccagtc aactgacgaa 60
ctcgagcttt gccgagcgcg ggcaaacaat gaagcgagga cttttctgac caactcgcca 120
ggggaagaac cgctgttgtt gtcgtccgag acagccgcaa ctccaaccga gactcaaccg 180
ctaccggtaa agcacttcgc gtatggtttt cgccaggatt tgcaaacaaa tcctgttgtc 240
tctgactcat atcgagaagg gccgttggag aatgatgacg ggcacgcttt cttgactcct 300
gtggaagaag ccacgctggt gtccttctac gcgtcgaaat tacccagtct gattggcccg 360
aacgctagcg tttctcgcct acgacgcgaa tccaaagtac cagctactgc cgcactcttg 420
taccgccgct tttttctgtc caattctgtg ttactgtacg accccaaggt catcatggtg 480
gcagccgcat ttctgggaag caaagtggaa gacgcaacgg ctgacgtccg gtatctcgag 540
gaaggtaccg ccctcatgaa cgctcctgta tcacaggccg aaataattcc agcggaactg 600
aatctgctat cagggactta ctttgacttg ctttgctttc atccctacaa gactgttctg 660
gccttgacgg aagatttgcg gacctatctg aagtccgaca agggacaagc gctggtatca 720
tggccgccga ccacggccgc tgacgacgac gacgtgaacg tcccagctcc ccttttgagc 780
ggacaggact tgaaacccat gtacgaggct gcccgggctt tggtagacga ctgtgttgta 840
tcggacatcc ctctactgta cacaccaggt caagtgggtc tagcagccct catggttgcg 900
caggccgagc tacttgttcg cagtcgaggc aacggcgcca gtaaccagaa gtcacgaata 960
ccccaaattg acctggaagg ctacgtccgg caacgttttg atacagacga aacacgcgaa 1020
atttccatgg acactttttt ggcaacgttg cgaacacttc aaacacagtt acaaggcttg 1080
cgagaaggcc aacttggatg ttacaacaat cccagcgtca ttgatatgca agctctcaag 1140
gctatacaca aaaaactgaa aaaggttcga gcctggggaa cgtcgggcag tggggggaaa 1200
agtgaaaaaa agaaaaagaa gcgcggctcg cctgcaggcg gcggtacggc caacgcggtc 1260
gatagtggcg aaccggagcg gaagaaaatg aaagcgtccg gagcccagtg a 1311
<210>197
<211>436
<212>PRT
<213>三角褐指藻
<400>197
Met Val Asp Tyr Asp Asp Ser Thr Gln Leu Asn Lys Trp Leu Phe Gln
1 5 10 15
Ser Thr Asp Glu Leu Glu Leu Cys Arg Ala Arg Ala Asn Asn Glu Ala
20 25 30
Arg Thr Phe Leu Thr Asn Ser Pro Gly Glu Glu Pro Leu Leu Leu Ser
35 40 45
Ser Glu Thr Ala Ala Thr Pro Thr Glu Thr Gln Pro Leu Pro Val Lys
50 55 60
His Phe Ala Tyr Gly Phe Arg Gln Asp Leu Gln Thr Asn Pro Val Val
65 70 75 80
Ser Asp Ser Tyr Arg Glu Gly Pro Leu Glu Asn Asp Asp Gly His Ala
85 90 95
Phe Leu Thr Pro Val Glu Glu Ala Thr Leu Val Ser Phe Tyr Ala Ser
100 105 110
Lys Leu Pro Ser Leu Ile Gly Pro Asn Ala Ser Val Ser Arg Leu Arg
115 120 125
Arg Glu Ser Lys Val Pro Ala Thr Ala Ala Leu Leu Tyr Arg Arg Phe
130 135 140
Phe Leu Ser Asn Ser Val Leu Leu Tyr Asp Pro Lys Val Ile Met Val
145 150 155 160
Ala Ala Ala Phe Leu Gly Ser Lys Val Glu Asp Ala Thr Ala Asp Val
165 170 175
Arg Tyr Leu Glu Glu Gly Thr Ala Leu Met Asn Ala Pro Val Ser Gln
180 185 190
Ala Glu Ile Ile Pro Ala Glu Leu Asn Leu Leu Ser Gly Thr Tyr Phe
195 200 205
Asp Leu Leu Cys Phe His Pro Tyr Lys Thr Val Leu Ala Leu Thr Glu
210 215 220
Asp Leu Arg Thr Tyr Leu Lys Ser Asp Lys Gly Gln Ala Leu Val Ser
225 230 235 240
Trp Pro Pro Thr Thr Ala Ala Asp Asp Asp Asp Val Asn Val Pro Ala
245 250 255
Pro Leu Leu Ser Gly Gln Asp Leu Lys Pro Met Tyr Glu Ala Ala Arg
260 265 270
Ala Leu Val Asp Asp Cys Val Val Ser Asp Ile Pro Leu Leu Tyr Thr
275 280 285
Pro Gly Gln Val Gly Leu Ala Ala Leu Met Val Ala Gln Ala Glu Leu
290 295 300
Leu Val Arg Ser Arg Gly Asn Gly Ala Ser Asn Gln Lys Ser Arg Ile
305 310 315 320
Pro Gln Ile Asp Leu Glu Gly Tyr Val Arg Gln Arg Phe Asp Thr Asp
325 330 335
Glu Thr Arg Glu Ile Ser Met Asp Thr Phe Leu Ala Thr Leu Arg Thr
340 345 350
Leu Gln Thr Gln Leu Gln Gly Leu Arg Glu Gly Gln Leu Gly Cys Tyr
355 360 365
Asn Asn Pro Ser Val Ile Asp Met Gln Ala Leu Lys Ala Ile His Lys
370 375 380
Lys Leu Lys Lys Val Arg Ala Trp Gly Thr Ser Gly Ser Gly Gly Lys
385 390 395 400
Ser Glu Lys Lys Lys Lys Lys Arg Gly Ser Pro Ala Gly Gly Gly Thr
405 410 415
Ala Asn Ala Val Asp Ser Gly Glu Pro Glu Arg Lys Lys Met Lys Ala
420 425 430
Ser Gly Ala Gln
435
<210>198
<211>1254
<212>DNA
<213>拟南芥
<400>198
gttacacgaa ttattaaaac ctaatcattg attatttatt cctgaccttg tttcttctcc 60
ttccatcacc taattataat cagacctaaa ctagctaatt acaacactcc actactacta 120
ctactacaac tcttctgatg ttgactttgt acggtcaaga aaggtcaccg gagaactcca 180
ccacaagtac gaccgatgct tccgatcgcc gggatgagac gccgtcgtcg gagatagtcg 240
tgagagatat tcacgcgatg acgacgacga cagagcttac tcggccacaa caaaggggat 300
caggaggagg atacttgtct ccgtcgaggt ctattgcttt tagcgacgga actacttctt 360
ccggtgagaa tttcaccacc gtgagcagag agttcaacgc tctagtcatc gccggatctt 420
ccatggacaa caacagtaac ggaactaacc aatcaggtgg tcatcgtgac gtcatacgtg 480
atgaaagaaa cgagctgact aggatcggcg aaaacgatga cgttggtgat catggtcagg 540
tgcctgagga ggattcaaat ccatgggcga ttgtaccgga cgattacaac aaccgggacg 600
gttcagagaa taatattgtg ttggcgtcat caggtggtca gaaccggatg gtgacgactg 660
cttcggtgca gagggtgaag agagaagagg tggaagcaaa gataacggcg tggcaaacgg 720
cgaaggtggc taagattaat aataggttta agagacaaga cgccgttatt aacggttggt 780
tgaatgagca ggttcataga gctaactctt ggatgaagaa aatcgagagg aaactggaag 840
ataggagagc gaaggcgatg gagaaaacac aaaacaaagt ggcaaaagct cagaggaagg 900
cggaggagag gagagccacg gcggaaggta aacgagggac ggaggttgcg agggttcttg 960
aagttgctaa tctcatgaga gccgttggac gacctccggc caaacgatca ttcttctctc 1020
tttcctagct aagctattac tagttttagt tacatccaaa tgtctcaata tatataggct 1080
accattttct gttgggaatc aatgtgtata taactatata tagaatgtaa gagttttaaa 1140
ggtactgata tattttgtaa ttgtatgctt ttttctttgt ctgcaccaca taaaaactaa 1200
taaaatgtta tttgtaagcc aagaaaattg tttacatgta ttgttttgtc attc 1254
<210>199
<211>296
<212>PRT
<213>拟南芥
<400>199
Met Leu Thr Leu Tyr Gly Gln Glu Arg Ser Pro Glu Asn Ser Thr Thr
1 5 10 15
Ser Thr Thr Asp Ala Ser Asp Arg Arg Asp Glu Thr Pro Ser Ser Glu
20 25 30
Ile Val Val Arg Asp Ile His Ala Met Thr Thr Thr Thr Glu Leu Thr
35 40 45
Arg Pro Gln Gln Arg Gly Ser Gly Gly Gly Tyr Leu Ser Pro Ser Arg
50 55 60
Ser Ile Ala Phe Ser Asp Gly Thr Thr Ser Ser Gly Glu Asn Phe Thr
65 70 75 80
Thr Val Ser Arg Glu Phe Asn Ala Leu Val Ile Ala Gly Ser Ser Met
85 90 95
Asp Asn Asn Ser Asn Gly Thr Asn Gln Ser Gly Gly His Arg Asp Val
100 105 110
Ile Arg Asp Glu Arg Asn Glu Leu Thr Arg Ile Gly Glu Asn Asp Asp
115 120 125
Val Gly Asp His Gly Gln Val Pro Glu Glu Asp Ser Asn Pro Trp Ala
130 135 140
Ile Val Pro Asp Asp Tyr Asn Asn Arg Asp Gly Ser Glu Asn Asn Ile
145 150 155 160
Val Leu Ala Ser Ser Gly Gly Gln Asn Arg Met Val Thr Thr Ala Ser
165 170 175
Val Gln Arg Val Lys Arg Glu Glu Val Glu Ala Lys Ile Thr Ala Trp
180 185 190
Gln Thr Ala Lys Val Ala Lys Ile Asn Asn Arg Phe Lys Arg Gln Asp
195 200 205
Ala Val Ile Asn Gly Trp Leu Asn Glu Gln Val His Arg Ala Asn Ser
210 215 220
Trp Met Lys Lys Ile Glu Arg Lys Leu Glu Asp Arg Arg Ala Lys Ala
225 230 235 240
Met Glu Lys Thr Gln Asn Lys Val Ala Lys Ala Gln Arg Lys Ala Glu
245 250 255
Glu Arg Arg Ala Thr Ala Glu Gly Lys Arg Gly Thr Glu Val Ala Arg
260 265 270
Val Leu Glu Val Ala Asn Leu Met Arg Ala Val Gly Arg Pro Pro Ala
275 280 285
Lys Arg Ser Phe Phe Ser Leu Ser
290 295
<210>200
<211>923
<212>DNA
<213>拟南芥
<400>200
aaaataaaaa cagttaatct ctctaaaaca attttttgtt ttctctctct cttaaataac 60
cagagagttc agaatcattt tgattctctt tgtaatcttt agttgttgta cctaacatca 120
tggctgaaga ggaaccgaag aaggtgacag agaccgtgtc ggaaccaact ccaacaccgg 180
aagttccggt ggagaaacct gctgctgctg cagatgttgc tcctcaggag aagcctgtgg 240
ctccacctcc cgttcttcca tctccggcac cggcagagga gaagcaagaa gactctaagg 300
ctattgttcc cgtcgtccct aaagaagtag aggaagagaa gaaagaagga tcagttaatc 360
gagatgctgt tctggctaga gttgagacag agaagaggat gtcacttatc aaagcttggg 420
aagaggctga gaaatgcaaa gtggagaaca aagctgagaa gaagctttct tcaattggat 480
catgggagaa caacaagaaa gcagctgtgg aagctgagct caagaaaatg gaggagcatt 540
tggagaagaa aaaagcagag tatgtggagc agatgaagaa caaaatagct caaattcaca 600
aggaagcaga agagaagaga gcaatgattg aagctaagcg tggagaagaa attctcaaag 660
cagaggaatt agcagccaag taccgtgcca ctggaaccgc tcccaaaaag cttttcggat 720
gcatgtgatc tctaatcatc tcgatgggga aacaaatgaa atatggtatt gatgtaatga 780
cgttctttag tttgcttaat gtgggtttaa tatggcaaca tagaaagtta taaggtcaac 840
atcttatatt gattggggtg cgtttgttaa ttatttaatt tgtatttgta catctttcca 900
ttgaaaggct ttctcttagc ttt 923
<210>201
<211>202
<212>PRT
<213>拟南芥
<400>201
Met Ala Glu Glu Glu Pro Lys Lys Val Thr Glu Thr Val Ser Glu Pro
1 5 10 15
Thr Pro Thr Pro Glu Val Pro Val Glu Lys Pro Ala Ala Ala Ala Asp
20 25 30
Val Ala Pro Gln Glu Lys Pro Val Ala Pro Pro Pro Val Leu Pro Ser
35 40 45
Pro Ala Pro Ala Glu Glu Lys Gln Glu Asp Ser Lys Ala Ile Val Pro
50 55 60
Val Val Pro Lys Glu Val Glu Glu Glu Lys Lys Glu Gly Ser Val Asn
65 70 75 80
Arg Asp Ala Val Leu Ala Arg Val Glu Thr Glu Lys Arg Met Ser Leu
85 90 95
Ile Lys Ala Trp Glu Glu Ala Glu Lys Cys Lys Val Glu Asn Lys Ala
100 105 110
Glu Lys Lys Leu Ser Ser Ile Gly Ser Trp Glu Asn Asn Lys Lys Ala
115 120 125
Ala Val Glu Ala Glu Leu Lys Lys Met Glu Glu His Leu Glu Lys Lys
130 135 140
Lys Ala Glu Tyr Val Glu Gln Met Lys Asn Lys Ile Ala Gln Ile His
145 150 155 160
Lys Glu Ala Glu Glu Lys Arg Ala Met Ile Glu Ala Lys Arg Gly Glu
165 170 175
Glu Ile Leu Lys Ala Glu Glu Leu Ala Ala Lys Tyr Arg Ala Thr Gly
180 185 190
Thr Ala Pro Lys Lys Leu Phe Gly Cys Met
195 200
<210>202
<211>878
<212>DNA
<213>拟南芥
<400>202
ggaaataata tcttcaattt ttcatatttc gtttttaatt tggttttctt ttttcctctc 60
tatttcttcg gctgagaggc ggcgactatg gcggaggaac agaagatagc gttagaatca 120
gaatctccgg cgaaggttac gactcctgct ccagcagata caccggctcc agctccggca 180
gagattccgg ctccagctcc agctccgact ccggctgatg tcacgaaaga cgttgcagag 240
gagaaaattc aaaacccacc tccggagcaa attttcgatg actccaaagc ccttactgtt 300
gttgagaaac ctgtagaaga gcctgcaccg gcgaaacctg cgtctgcatc gctcgataga 360
gatgttaagc tagctgattt gtcaaaggaa aagagattgt ctttcgtcag agcgtgggaa 420
gaaagcgaaa agagcaaagc agagaacaaa gctgagaaga agattgcaga tgttcatgct 480
tgggaaaaca gcaagaaagc agctgtcgaa gcgcaactca agaaaatcga ggagcaacta 540
gagaagaaga aagcagagta tgcagagagg atgaagaata aggttgcagc gattcacaag 600
gaagcagaag agagaagagc aatgattgaa gctaagcgtg gagaagacgt tcttaaagca 660
gaagaaacgg ctgctaaata cagagccact ggaattgttc caaaggcaac ttgtggatgt 720
ttctaatctt gaatttgcga atcaaagttt caagacttcg taactgtaaa gtgtaatcaa 780
atttctctgt tctctttaat ggcttgtaat gttgtttgta tattgatttt gtgtgtgaca 840
atcagagtga aaaatatgtt tcattgtttt ctttccgc 878
<210>203
<211>212
<212>PRT
<213>拟南芥
<400>203
Met Ala Glu Glu Gln Lys Ile Ala Leu Glu Ser Glu Ser Pro Ala Lys
1 5 10 15
Val Thr Thr Pro Ala Pro Ala Asp Thr Pro Ala Pro Ala Pro Ala Glu
20 25 30
Ile Pro Ala Pro Ala Pro Ala Pro Thr Pro Ala Asp Val Thr Lys Asp
35 40 45
Val Ala Glu Glu Lys Ile Gln Asn Pro Pro Pro Glu Gln Ile Phe Asp
50 55 60
Asp Ser Lys Ala Leu Thr Val Val Glu Lys Pro Val Glu Glu Pro Ala
65 70 75 80
Pro Ala Lys Pro Ala Ser Ala Ser Leu Asp Arg Asp Val Lys Leu Ala
85 90 95
Asp Leu Ser Lys Glu Lys Arg Leu Ser Phe Val Arg Ala Trp Glu Glu
100 105 110
Ser Glu Lys Ser Lys Ala Glu Asn Lys Ala Glu Lys Lys Ile Ala Asp
115 120 125
Val His Ala Trp Glu Asn Ser Lys Lys Ala Ala Val Glu Ala Gln Leu
130 135 140
Lys Lys Ile Glu Glu Gln Leu Glu Lys Lys Lys Ala Glu Tyr Ala Glu
145 150 155 160
Arg Met Lys Asn Lys Val Ala Ala Ile His Lys Glu Ala Glu Glu Arg
165 170 175
Arg Ala Met Ile Glu Ala Lys Arg Gly Glu Asp Val Leu Lys Ala Glu
180 185 190
Glu Thr Ala Ala Lys Tyr Arg Ala Thr Gly Ile Val Pro Lys Ala Thr
195 200 205
Cys Gly Cys Phe
210
<210>204
<211>2356
<212>DNA
<213>拟南芥
<400>204
cgagtgattg atattttatt atagatttaa tacacacccg acactctgtc aattctatag 60
gcatacgagc tcactccaaa tttagattca gttttttaat acgaactttt tagttaagcc 120
aagattagca ataatataga tcatttattt tcttgattgt agtttgattg ttgtttttct 180
cataataaaa aaatcccagc taaaatctga ttttcaattt taaaccaatt tatatggtaa 240
acaaaatttt agttcggtat aattggaaga attaagtttt gttgaatatc aggaaaaaag 300
aaggggagga caaattttct acagaggtga cgtggcatca ttgaaccact ttacttgtcg 360
gcagtgaggt gtgtttaatc acgtgtaacg catccaatgc gtatgagagc tttacagccg 420
cacgatcaca tgggtacaaa aatcaacggc gaagcaaaac aagagtctca cacttattaa 480
agccacgtag cactccaccg gtataagcta acggaggata taaaaactct ttaactcatt 540
attgtcctaa aatctcaatt ttatccattt tcacggaaaa aacataaaat ctgttcttct 600
tcttcggctg agagacaatg gcggaggagc aaaagacgag taaggttgac gtagaatctc 660
cggctgtttt agctccggcg aaggaaccga ctcctgctcc ggtggaagtc gcggatgaga 720
aaattcataa tccacctccc gtcgagtcca aagctcttgc cgttgtagaa agtaagcttt 780
ctatttacat acgtgtgtgt tttatatatg ttaatcttct acttaggagg attcattcat 840
gtttacgatg aattattata gtatgtaatt cagaattctt acgtttggaa ctaaggtttc 900
aatttacaat taacaaatgg attttcttaa gatgcctaag gtttttgtga gttcttttgc 960
atatgacttg gtctatactc tatttgttta ggtgaaatcc atcgctgtta gaatttacaa 1020
cttcatcatg gtattttcaa gagaattatg tttttcgagg atgatattat taaaatatga 1080
ttaatagtaa agcaatgttc cctgtaatta gtgttatcaa aaagtgtatg gaatcatgac 1140
aaattagttg tggacagcta tgaattaagg aaagtgggtt actttcttaa tattcctaca 1200
ttttttcctt cctttaaagt tgcttaactc ttggaaaata acgattaagt actaactttc 1260
cagcagtttt tataatcctt gaacattcat ttgttcatct ttatttacta tatgtaattc 1320
cttctgtgtg gagtttcgtt ttataaacta ctattttgat gaccttatta gccaattaga 1380
gcaacaaaat ttaacttagt taaaagtgag cttcttgcaa caaatatcca tgtgttatac 1440
ttataagtgt gcttcttgca gaacccatcg aggagcatac acctaagaaa gcttcatctg 1500
gttcggccga tagaggtcag ctgataacaa cactttgttt ctcatgtcca gtttcttagt 1560
tacttagttc agtaatttac ttcaaatgtg tgttgtgtgt gtttggtcag atgtgatact 1620
tgccgacttg gaaaaagaga agaaaacgtc attcatcaaa gcatgggaag agagtgagaa 1680
gtcaaaggct gagaacaggt aaactttcat catcttctca cccaaagatt actattgctt 1740
acagatctct gatgatcttg aaatgagcag ggcacaaaag aagatctctg atgtgcatgc 1800
ttgggaaaat agcaagaaag cagccgtaga agctcaactt aggaagatcg aggaaaaatt 1860
agagaagaaa aaagcgcagt acggtgagaa aatgaagaac aaagtagctg caatccacaa 1920
gttagcagaa gagaagagag caatggttga agctaaaaaa ggagaagagc ttctcgaagc 1980
tgaagaaatg ggtgctaagt atagagccac tggtgtagta ccaaaggcaa cgtgtggatg 2040
tttctaagcc tttattgaat ttgtatcttt gtaacaattc atctctgttt ctttcttctt 2100
cttttgtttt tgtgtgattc aacaactctt tttagttttt gttatttgtt tggtcgtttg 2160
tgtcttgttt acatattggg tgattgtgtg taaaagtgaa agattaatgg agtataattg 2220
tatgaagcat caaatcttgt tttgcctttt gtttcagttg tacgacttca catctgatct 2280
gtaactctta aaatgctaag acacttgact tgacacacac caactataat ccttaaacag 2340
ttcaggcaca ggtgga 2356
<210>205
<211>190
<212>PRT
<213>拟南芥
<400>205
Met Ala Glu Glu Gln Lys Thr Ser Lys Val Asp Val Glu Ser Pro Ala
1 5 10 15
Val Leu Ala Pro Ala Lys Glu Pro Thr Pro Ala Pro Val Glu Val Ala
20 25 30
Asp Glu Lys Ile His Asn Pro Pro Pro Val Glu Ser Lys Ala Leu Ala
35 40 45
Val Val Glu Lys Pro Ile Glu Glu His Thr Pro Lys Lys Ala Ser Ser
50 55 60
Gly Ser Ala Asp Arg Asp Val Ile Leu Ala Asp Leu Glu Lys Glu Lys
65 70 75 80
Lys Thr Ser Phe Ile Lys Ala Trp Glu Glu Ser Glu Lys Ser Lys Ala
85 90 95
Glu Asn Arg Ala Gln Lys Lys Ile Ser Asp Val His Ala Trp Glu Asn
100 105 110
Ser Lys Lys Ala Ala Val Glu Ala Gln Leu Arg Lys Ile Glu Glu Lys
115 120 125
Leu Glu Lys Lys Lys Ala Gln Tyr Gl y Glu Lys MetLys Asn Lys Val
130 135 140
Ala Ala Ile His Lys Leu Ala Glu Glu Lys Arg Ala Met Val Glu Ala
145 150 155 160
Lys Lys Gly Glu Glu Leu Leu Glu Ala Glu Glu Met Gly Ala Lys Tyr
165 170 175
Arg Ala Thr Gly Val Val Pro Lys Ala Thr Cys Gly Cys Phe
180 185 190
<210>206
<211>642
<212>DNA
<213>拟南芥
<400>206
atggctgaag aggaaccgaa gaaggtgaca gagaccgtgt cggaaccaac tccaacaccg 60
gaagttccgg tggagaaacc tgctgctgct gcagatgttg ctcctcagga gaagcctgtg 120
gctccacctc ccgttcttcc atctccggca ccggcagagg agaagcaaga agactctaag 180
gctattgttc ccgtcgtccc taaagaagta gaggaagaga agaaagaagg atcagttaat 240
cgagatgctg ttctggctag agttgagaca gagaagagga tgtcacttat caaagcttgg 300
gaagaggctg agaaatgcaa agtggagaac aaagctgaga agaagctttc ttcaattgga 360
tcatgggaga acaacaagaa agcagctgtg gaagctgagc tcaagaaaat ggaggagcaa 420
ttggagaaga agaaggcaga gtatgtggag cagatgaaga acaaaatagc tcaaattcac 480
aaggaagcag aagagaagag agcgatgatt gaagctaagc gtggagaaga aattctcaaa 540
gcagaggaat tagcagccaa gtaccgtgcc actggaaccg ctcccaaaaa gcttttcgga 600
tgcatgtgat ctctaatcat ctcgatgggg aaacaaatga aa 642
<210>207
<211>202
<212>PRT
<213>拟南芥
<400>207
Met Ala Glu Glu Glu Pro Lys Lys Val Thr Glu Thr Val Ser Glu Pro
1 5 10 15
Thr Pro Thr Pro Glu Val Pro Val Glu Lys Pro Ala Ala Ala Ala Asp
20 25 30
Val Ala Pro Gln Glu Lys Pro Val Ala Pro Pro Pro Val Leu Pro Ser
35 40 45
Pro Ala Pro Ala Glu Glu Lys Gln Glu Asp Ser Lys Ala Ile Val Pro
50 55 60
Val Val Pro Lys Glu Val Glu Glu Glu Lys Lys Glu Gly Ser Val Asn
65 70 75 80
Arg Asp Ala Val Leu Ala Arg Val Glu Thr Glu Lys Arg Met Ser Leu
85 90 95
Ile Lys Ala Trp Glu Glu Ala Glu Lys Cys Lys Val Glu Asn Lys Ala
100 105 110
Glu Lys Lys Leu Ser Ser Ile Gly Ser Trp Glu Asn Asn Lys Lys Ala
115 120 125
Ala Val Glu Ala Glu Leu Lys Lys Met Glu Glu Gln Leu Glu Lys Lys
130 135 140
Lys Ala Glu Tyr Val Glu Gln Met Lys Asn Lys Ile Ala Gln Ile His
145 150 155 160
Lys Glu Ala Glu Glu Lys Arg Ala Met Ile Glu Ala Lys Arg Gly Glu
165 170 175
Glu Ile Leu Lys Ala Glu Glu Leu Ala Ala Lys Tyr Arg Ala Thr Gly
180 185 190
Thr Ala Pro Lys Lys Leu Phe Gly Cys Met
195 200
<210>208
<211>969
<212>DNA
<213>拟南芥
<400>208
aacgagaaac agaacatcac taccaaacat ctccagctca gtttcttcaa ataaaaacag 60
ttaatctctc taaaacaatt ttttgtttct ctctctctta aataaccaga gagttcagaa 120
tcattttgat tctctttgta atctttagtt gttgtaccta acatcatggc tgaagaggaa 180
ccgaagaagg tgacagagac cgtgtcggaa ccaactccaa caccggaagt tccggtggag 240
aaacctgctg ctgctgcaga tgttgctcct caggagaagc ctgtggctcc acctcccgtt 300
cttccatctc cggcaccggc agaggagaag caagaagact ctaaggctat tgttcccgtc 360
gtccctaaag aagtagagga agagaagaaa gaaggatcag ttaatcgaga tgctgttctg 420
gctagagttg agacagagaa gaggatgtca cttatcaaag cttgggaaga ggctgagaaa 480
tgcaaagtgg agaacaaagc tgagaagaag ctttcttcaa ttggatcatg ggagaacaac 540
aagaaagcag ctgtggaagc tgagctcaag aaaatggagg agcaattgga gaagaagaag 600
gcagagtatg tggagcagat gaagaacaaa atagctcaaa ttcacaagga agcagaagag 660
aagagagcga tgattgaagc taagcgtgga gaagaaattc tcaaagcaga ggaattagca 720
gccaagtacc gtgccactgg aaccgctccc aaaaagcttt tcggatgcat gtgatctcta 780
atcatctcga tggggaaaca aatgaaatat ggtatttgat gtaatgacgt tctttagttt 840
gcttaatgtg ggtttaatat ggcaacatag aaagttataa ggtcaacatc ttatattgat 900
tgggctgcgt ttgttaattt gatttgtatt tgtacatctt ttcattgaaa ggctttctct 960
tagctttat 969
<210>209
<211>202
<212>PRT
<213>拟南芥
<400>209
Met Ala Glu Glu Glu Pro Lys Lys Val Thr Glu Thr Val Ser Glu Pro
1 5 10 15
Thr Pro Thr Pro Glu Val Pro Val Glu Lys Pro Ala Ala Ala Ala Asp
20 25 30
Val Ala Pro Gln Glu Lys Pro Val Ala Pro Pro Pro Val Leu Pro Ser
35 40 45
Pro Ala Pro Ala Glu Glu Lys Gln Glu Asp Ser Lys Ala Ile Val Pro
50 55 60
Val Val Pro Lys Glu Val Glu Glu Glu Lys Lys Glu Gly Ser Val Asn
65 70 75 80
Arg Asp Ala Val Leu Ala Arg Val Glu Thr Glu Lys Arg Met Ser Leu
85 90 95
Ile Lys Ala Trp Glu Glu Ala Glu Lys Cys Lys Val Glu Asn Lys Ala
100 105 110
Glu Lys Lys Leu Ser Ser Ile Gly Ser Trp Glu Asn Asn Lys Lys Ala
115 120 125
Ala Val Glu Ala Glu Leu Lys Lys Met Glu Glu Gln Leu Glu Lys Lys
130 135 140
Lys Ala Glu Tyr Val Glu Gln Met Lys Asn Lys Ile Ala Gln Ile His
145 150 155 160
Lys Glu Ala Glu Glu Lys Arg Ala Met Ile Glu Ala Lys Arg Gly Glu
165 170 175
Glu Ile Leu Lys Ala Glu Glu Leu Ala Ala Lys Tyr Arg Ala Thr Gly
180 185 190
Thr Ala Pro Lys Lys Leu Phe Gly Cys Met
195 200
<210>210
<211>959
<212>DNA
<213>拟南芥
<400>210
acagaacatc actaccaaac atctccagct cagtttcttc aaataaaaac agttaatctc 60
tctaaaacaa ttttttgttt tctctctctc ttaaataacc agagagttca gaatcatttt 120
gattctcttt gtaatcttta gttgttgtac ctaacatcat ggctgaagag gaaccgaaga 180
aggtgacaga gaccgtgtcg gaaccaactc caacaccgga agttccggtg gagaaacctg 240
ctgctgctgc agatgttgct cctcaggaga agcctgtggc tccacctccc gttcttccat 300
ctccggcacc ggcagaggag aagcaagaag actctaaggc tattgttccc gtcgtcccta 360
aagtagagga agagaagaaa gaaggatcag ttaatcgaga tgctgttctg gctagagttg 420
agacagagaa gaggatgtca cttatcaaag cttgggaaga ggctgagaaa tgcaaagtgg 480
agaacaaagc tgagaagaag ctttcttcaa ttggatcatg ggagaacaac aagaaagcag 540
ctgtggaagc tgagctcaag aaaatggagg agcaattgga gaagaagaag gcagagtatg 600
tggagcagat gaagaacaaa atagctcaaa ttcacaagga agcagaagag aagagagcga 660
tgattgaagc taagcgtgga gaagaaattc tcaaagcaga ggaattagca gccaagtacc 720
gtgccactgg aaccgctccc aaaaagcttt tcggatgcat gtgatctcta atcatctcga 780
tggggaaaca aatgaaatat ggtatttgat gtaatgacgt tctttagttt gcttaatgtg 840
ggtttaatat ggcaacatag aaagttataa ggtcaacatc ttatattgat tgggctgcgt 900
ttgttaattt gatttgtatt tgtacatctt ttcattgaaa ggctttctct tagctttat 959
<210>211
<211>201
<212>PRT
<213>拟南芥
<400>211
Met Ala Glu Glu Glu Pro Lys Lys Val Thr Glu Thr Val Ser Glu Pro
1 5 10 15
Thr Pro Thr Pro Glu Val Pro Val Glu Lys Pro Ala Ala Ala Ala Asp
20 25 30
Val Ala Pro Gln Glu Lys Pro Val Ala Pro Pro Pro Val Leu Pro Ser
35 40 45
Pro Ala Pro Ala Glu Glu Lys Gln Glu Asp Ser Lys Ala Ile Val Pro
50 55 60
Val Val Pro Lys Val Glu Glu Glu Lys Lys Glu Gly Ser Val Asn Arg
65 70 75 80
Asp Ala Val Leu Ala Arg ValGl u Thr Glu Lys Arg Met Ser Leu Ile
85 90 95
Lys Ala Trp Glu Glu Ala Glu Lys Cys Lys Val Glu Asn Lys Ala Glu
100 105 110
Lys Lys Leu Ser Ser Ile Gly Ser Trp Glu Asn Asn Lys Lys Ala Ala
115 120 125
Val Glu Ala Glu Leu Lys Lys Met Glu Glu Gln Leu Glu Lys Lys Lys
130 135 140
Ala Glu Tyr Val Glu Gln Met Lys Asn Lys Ile Ala Gln Ile His Lys
145 150 155 160
Glu Ala Glu Glu Lys Arg Ala Met Ile Glu Ala Lys Arg Gly Glu Glu
165 170 175
Ile Leu Lys Ala Glu Glu Leu Ala Ala Lys Tyr Arg Ala Thr Gly Thr
180 185 190
Ala Pro Lys Lys Leu Phe Gly Cys Met
195 200
<210>212
<211>609
<212>DNA
<213>拟南芥
<400>212
atggctgaag aggaaccgaa gaaggtgaca gagaccgtgtcggaaccaac tccaacaccg 60
gaagttccgg tggagaaacc tgctgctgct gcagatgttg ctcctcagga gaagcctgtg 120
gctccacctc ccgttcttcc atctccggca ccggcagagg agaagcaaga agactctaag 180
gctattgttc ccgtcgtccc taaagaagta gaggaagaga agaaagaagg atcagttaat 240
cgagatgctg ttctggctag agttgagaca gagaagagga tgtcacttat caaagcttgg 300
gaagaggctg agaaatgcaa agtggagaac aaagctgaga agaagctttc ttcaattgga 360
tcatgggaga acaacaagaa agcagctgtg gaagctgagc tcaagaaaat ggaggagcaa 420
ttggagaaga agaaggcaga gtatgtggag cagatgaaga acaaaatagc tcaaattcac 480
aaggaagcag aagagaagag agcgatgatt gaagctaagc gtggagaaga aattctcaaa 540
gcagaggaat tagcagccaa gtaccgtgcc actggaaccg ctcccaaaaa gcttttcgga 600
tgcatgtga 609
<210>213
<211>202
<212>PRT
<213>拟南芥
<400>213
Met Ala Glu Glu Glu Pro Lys Lys Val Thr Glu Thr Val Ser Glu Pro
1 5 10 15
Thr Pro Thr Pro Glu Val Pro Val Glu Lys Pro Ala Ala Ala Ala Asp
20 25 30
Val Ala Pro Gln Glu Lys Pro Val Ala Pro Pro Pro Val Leu Pro Ser
35 40 45
Pro Ala Pro Ala Glu Glu Lys Gln Glu Asp Ser Lys Ala Ile Val Pro
50 55 60
Val Val Pro Lys Glu Val Glu Glu Glu Lys Lys Glu Gly Ser Val Asn
65 70 75 80
Arg Asp Ala Val Leu Ala Arg Val Glu Thr Glu Lys Arg Met Ser Leu
85 90 95
Ile Lys Ala Trp Glu Glu Ala Glu Lys Cys Lys Val Glu Asn Lys Ala
100 105 110
Glu Lys Lys Leu Ser Ser Ile Gly Ser Trp Glu Asn Asn Lys Lys Ala
115 120 125
Ala Val Glu Ala Glu Leu Lys Lys Met Glu Glu Gln Leu Glu Lys Lys
130 135 140
Lys Ala Glu Tyr Val Glu Gln Met Lys Asn Lys Ile Ala Gln Ile His
145 150 155 160
Lys Glu Ala Glu Glu Lys Arg Ala Met Ile Glu Ala Lys Arg Gly Glu
165 170 175
Glu Ile Leu Lys Ala Glu Glu Leu Ala Ala Lys Tyr Arg Ala Thr Gly
180 185 190
Thr Ala Pro Lys Lys Leu Phe Gly Cys Met
195 200
<210>214
<211>528
<212>DNA
<213>拟南芥
<400>214
atgactttag aggagcagaa gaaagtcata atgcccgagg ccgtcgcatc ggagccatca 60
ccaccatcca aggaggagaa gtccgacgat tcgaaagcta ttgttctcgt cgtcgctgca 120
aaagaaccta cggaagacaa gaaagtaggt tcagttcacc gagatgctgt tttggttaga 180
ctcgagcaag ataagaggat atctctaatc aaagcttggg aagaggctga gaaatccaaa 240
gtggagaaca aagctcagaa gaagatttct tcagttggag cttgggaaaa cagcaagaaa 300
gcttctgtgg aagctgagct aaaaaagatc gaggagcaac taaataagaa gaaagcacac 360
tacacagagc aaatgaagaa caagatagct caaatccaca aggaagctga ggagaagaga 420
gcgatgaccg aagctaaacg cggagaagat gttctcaaag ccgaagaaat ggctgcaaag 480
taccgtgcca ccggaactgc tccaaccaag ctatttggat tcttctga 528
<210>215
<211>175
<212>PRT
<213>拟南芥
<400>215
Met Thr Leu Glu Glu Gln Lys Lys Val Ile Met Pro Glu Ala Val Ala
1 5 10 15
Ser Glu Pro Ser Pro Pro Ser Lys Glu Glu Lys Ser Asp Asp Ser Lys
20 25 30
Ala Ile Val Leu Val Val Ala Ala Lys Glu Pro Thr Glu Asp Lys Lys
35 40 45
Val Gly Ser Val His Arg Asp Ala Val Leu Val Arg Leu Glu Gln Asp
50 55 60
Lys Arg Ile Ser Leu Ile Lys Ala Trp Glu Glu Ala Glu Lys Ser Lys
65 70 75 80
Val Glu Asn Lys Ala Gln Lys Lys Ile Ser Ser Val Gly Ala Trp Glu
85 90 95
Asn Ser Lys Lys Ala Ser Val Glu Ala Glu Leu Lys Lys Ile Glu Glu
100 105 110
Gln Leu Asn Lys Lys Lys Ala His Tyr Thr Glu Gln Met Lys Asn Lys
115 120 125
Ile Ala Gln Ile His Lys Glu Ala Glu Glu Lys Arg Ala Met Thr Glu
130 135 140
Ala Lys Arg Gly Glu Asp Val Leu Lys Ala Glu Glu Met Ala Ala Lys
145 150 155 160
Tyr Arg Ala Thr Gly Thr Ala Pro Thr Lys Leu Phe Gly Phe Phe
165 170 175
<210>216
<211>847
<212>DNA
<213>拟南芥
<400>216
aactcattat tgtcctaaaa tctcaatttt atccattttc acggaaaaaa cataaaatct 60
gttcttcttc ttcggctgag agacaatggc ggaggagcaa aagacgagta aggttgacgt 120
agaatctccg gctgttttag ctccggcgaa ggaaccgact cctgctccgg tggaagtcgc 180
ggatgagaaa attcataatc cacctcccgt cgagtccaaa gctcttgccg ttgtagaaaa 240
acccatcgag gagcatacac ctaagaaagc ttcatctggt tcggccgata gagatgtgat 300
acttgccgac ttggaaaaag agaagaaaac gtcattcatc aaagcatggg aagagagtga 360
gaagtcaaag gctgagaaca gggcacaaaa gaagatctct gatgtgcatg cttgggaaaa 420
tagcaagaaa gcagccgtag aagctcaact taggaagatc gaggaaaaat tagagaagaa 480
aaaagcgcag tacggtgaga aaatgaagaa caaagtagct gcaatccaca agttagcaga 540
agagaagaga gcaatggttg aagctaaaaa aggagaagag cttctcaaag ctgaagaaat 600
gggtgctaag tatagagcca ctggtgtagt accaaaggca acgtgtggat gtttctaagc 660
ctttattgaa tttgtatctt tgtaacaatt catctctgtt tctttcttct tcttttgttt 720
ttgtgtgatt caacaactct ttttagtttt tgttatttgt ttggtcgttt gtgtcttgtt 780
tacatattgg gtgattgtgt gtaaaagtga aagattaatg gagtataatt gtatgaagca 840
tcaaatc 847
<210>217
<211>190
<212>PRT
<213>拟南芥
<400>217
Met Ala Glu Glu Gln Lys Thr Ser Lys Val Asp Val Glu Ser Pro Ala
1 5 10 15
Val Leu Ala Pro Ala Lys Glu Pro Thr Pro Ala Pro Val Glu Val Ala
20 25 30
Asp Glu Lys Ile His Asn Pro Pro Pro Val Glu Ser Lys Ala Leu Ala
35 40 45
Val Val Glu Lys Pro Ile Glu Glu His Thr Pro Lys Lys Ala Ser Ser
50 55 60
Gly Ser Ala Asp Arg Asp Val Ile Leu Ala Asp Leu Glu Lys Glu Lys
65 70 75 80
Lys Thr Ser Phe Ile Lys Ala Trp Glu Glu Ser Glu Lys Ser Lys Ala
85 90 95
Glu Asn Arg Ala Gln Lys Lys Ile Ser Asp Val His Ala Trp Glu Asn
100 105 110
Ser Lys Lys Ala Ala Val Glu Ala Gln Leu Arg Lys Ile Glu Glu Lys
115 120 125
Leu Glu Lys Lys Lys Ala Gln Tyr Gly Glu Lys Met Lys Asn Lys Val
130 135 140
Ala Ala Ile His Lys Leu Ala Glu Glu Lys Arg Ala Met Val Glu Ala
145 150 155 160
Lys Lys Gly Glu Glu Leu Leu Lys Ala Glu Glu Met Gly Ala Lys Tyr
165 170 175
Arg Ala Thr Gly Val Val Pro Lys Ala Thr Cys Gly Cys Phe
180 185 190
<210>218
<211>351
<212>DNA
<213>拟南芥
<400>218
atggagccaa atattccgat ccaaagaggt aactcatatc acagagtttt agtattgttt 60
agtttcatgt tgactcagaa gaagctacta gatatttcag gatgggagaa aaagaaaact 120
acaaagatcg aatctgaact cgctagaatt cagcggaaga tggacagtaa gaagatggag 180
aaatctgaga aactaaggaa cgaaaaagcg gcagttcatg caaaggcaca aaagaagaag 240
gcagatgttc aaaccagacg ggctcaagag atccttgatg cggaagaagc tgctgctagg 300
tttcaagccg caggaaagat acccaagaag tcatctttga gctgcttctg a 351
<210>219
<211>116
<212>PRT
<213>拟南芥
<400>219
Met Glu Pro Asn Ile Pro Ile Gln Arg Gly Asn Ser Tyr His Arg Val
1 5 10 15
Leu Val Leu Phe Ser Phe Met Leu Thr Gln Lys Lys Leu Leu Asp Ile
20 25 30
Ser Gly Trp Glu Lys Lys Lys Thr Thr Lys Ile Glu Ser Glu Leu Ala
35 40 45
Arg Ile Gln Arg Lys Met Asp Ser Lys Lys Met Glu Lys Ser Glu Lys
50 55 60
Leu Arg Asn Glu Lys Ala Ala Val His Ala Lys Ala Gln Lys Lys Lys
65 70 75 80
Ala Asp Val Gln Thr Arg Arg Ala Gln Glu Ile Leu Asp Ala Glu Glu
85 90 95
Ala Ala Ala Arg Phe Gln Ala Ala Gly Lys Ile Pro Lys Lys Ser Ser
100 105 110
Leu Ser Cys Phe
115
<210>220
<211>609
<212>DNA
<213>拟南芥
<400>220
atggctgaag aggaaccgaa gaaggtgaca gagaccgtgt cggaaccaac tccaacaccg 60
gaagttccgg tggagaaacc tgctgctgct gcagatgttg ctcctcagga gaagcctgtg 120
gctccacctc ccgttcttcc atctccggca ccggcagagg agaagcaaga agactctaag 180
gctattgttc ccgtcgtccc taaagaagta gaggaagaga agaaagaagg atcagttaat 240
cgagatgctg ttctggctag agttgagaca gagaagagga tgtcacttat caaagcttgg 300
gaagaggctg agaaatgcaa agtggagaac aaagctgaga agaagctttc ttcaattgga 360
tcatgggaga acaacaagaa agcagctgtg gaagctgagc tcaagaaaat ggaggagcaa 420
ttggagaaga agaaggcaga gtatgtggag cagatgaaga acaaaatagc tcaaattcac 480
aaggaagcag aagagaagag agcgatgatt gaagctaagc gtggagaaga aattctcaaa 540
gcagaggaat tagcagccaa gtaccgtgcc actggaaccg ctcccaaaaa gcttttcgga 600
tgcatgtga 609
<210>221
<211>202
<212>PRT
<213>拟南芥
<400>221
Met Ala Glu Glu Glu Pro Lys Lys Val Thr Glu Thr Val Ser Glu Pro
1 5 10 15
Thr Pro Thr Pro Glu Val Pro Val Glu Lys Pro Ala Ala Ala Ala Asp
20 25 30
Val Ala Pro Gln Glu Lys Pro Val Ala Pro Pro Pro Val Leu Pro Ser
35 40 45
Pro Ala Pro Ala Glu Glu Lys Gln Glu Asp Ser Lys Ala Ile Val Pro
50 55 60
Val Val Pro Lys Glu Val Glu Glu Glu Lys Lys Glu Gly Ser Val Asn
65 70 75 80
Arg Asp Ala Val Leu Ala Arg Val Glu Thr Glu Lys Arg Met Ser Leu
85 90 95
Ile Lys Ala Trp Glu Glu Ala Glu Lys Cys Lys Val Glu Asn Lys Ala
100 105 110
Glu Lys Lys Leu Ser Ser Ile Gly Ser Trp Glu Asn Asn Lys Lys Ala
115 120 125
Ala Val Glu Ala Glu Leu Lys Lys Met Glu Glu Gln Leu Glu Lys Lys
130 135 140
Lys Ala Glu Tyr Val Glu Gln Met Lys Asn Lys Ile Ala Gln Ile His
145 150 155 160
Lys Glu Ala Glu Glu Lys Arg Ala Met Ile Glu Ala Lys Arg Gly Glu
165 170 175
Glu Ile Leu Lys Ala Glu Glu Leu Ala Ala Lys Tyr Arg Ala Thr Gly
180 185 190
Thr Ala Pro Lys Lys Leu Phe Gly Cys Met
195 200
<210>222
<211>485
<212>DNA
<213>拟南芥
<400>222
tcattctcaa tcaaatggag ccaaatattc cgatccaaag aggagatgag cagtcaaaag 60
ttattaaggc atggaaggaa ctaaagataa caaaggtcaa taacaagact cagaagaagc 120
tactagatat ttcaggatgg gagaaaaaga aaactacaaa gatcgaatct gaactcgcta 180
gaattcagcg gaagatggac agtaagaaga tggagaaatc tgagaaacta aggaacgaaa 240
aagcggcagt tcatgcaaag gcacaaaaga agaaggcaga tgttcaaacc agacgggctc 300
aagagatcct tgatgcggaa gaagctgctg ctaggtttca agccgcagga aagataccca 360
agaagtcatc tttgagctgc ttctgagatc agcactaacc tgtgatacag attatcacct 420
atctccggta tcctatgttc atacttgtat cttttgtatg ttgtgtgttt tgcttgtgtt 480
gctca 485
<210>223
<211>123
<212>PRT
<213>拟南芥
<400>223
Met Glu Pro Asn Ile Pro Ile Gln Arg Gly Asp Glu Gln Ser Lys Val
1 5 10 15
Ile Lys Ala Trp Lys Glu Leu Lys Ile Thr Lys Val Asn Asn Lys Thr
20 25 30
Gln Lys Lys Leu Leu Asp Ile Ser Gly Trp Glu Lys Lys Lys Thr Thr
35 40 45
Lys Ile Glu Ser Glu Leu Ala Arg Ile Gln Arg Lys Met Asp Ser Lys
50 55 60
Lys Met Glu Lys Ser Glu Lys Leu Arg Asn Glu Lys Ala Ala Val His
65 70 75 80
Ala Lys Ala Gln Lys Lys Lys Ala Asp Val Gln Thr Arg Arg Ala Gln
85 90 95
Glu Ile Leu Asp Ala Glu Glu Ala Ala Ala Arg Phe Gln Ala Ala Gly
100 105 110
Lys Ile Pro Lys Lys Ser Ser Leu Ser Cys Phe
115 120
<210>224
<211>363
<212>DNA
<213>拟南芥
<400>224
atgaacgaat ccacagtgca acgagcgaaa cctgaacata tggcagctgt tgtggatcaa 60
tggaaggaaa cagagataag caaatcgaga aagaagtacg agaagctaag tgagaagatt 120
gtgtcatggg aagataagaa gaggaaaaag gcaaagagaa aacttcatag aacagagaga 180
agtgtagaga aaacaaagtt gaaggcgacc cagaggttca gggacgaaaa tgaacgtatt 240
gagattatcg ttgcaagtgc aagagcacat gcgtatgaga gtcgaataaa agaagagttg 300
aaggttaagg agaaagcaaa cctcatgaga acaactggta ggaaaccctc tacatgcctc 360
tga 363
<210>225
<211>120
<212>PRT
<213>拟南芥
<400>225
Met Asn Glu Ser Thr Val Gln Arg Ala Lys Pro Glu His Met Ala Ala
1 5 10 15
Val Val Asp Gln Trp Lys Glu Thr Glu Ile Ser Lys Ser Arg Lys Lys
20 25 30
Tyr Glu Lys Leu Ser Glu Lys Ile Val Scr Trp Glu Asp Lys Lys Arg
35 40 45
Lys Lys Ala Lys Arg Lys Leu His Arg Thr Glu Arg Ser Val Glu Lys
50 55 60
Thr Lys Leu Lys Ala Thr Gln Arg Phe Arg Asp Glu Asn Glu Arg Ile
65 70 75 80
Glu Ile Ile Val Ala Ser Ala Arg Ala His Ala Tyr Glu Ser Arg Ile
85 90 95
Lys Glu Glu Leu Lys Val Lys Glu Lys Ala Asn Leu Met Arg Thr Thr
100 105 110
Gly Arg Lys Pro Ser Thr Cys Leu
115 120
<210>226
<211>1299
<212>DNA
<213>拟南芥
<400>226
ttaatgtcac atttctgaaa tctctcaact tcatcatcaa gtgggttcct atgagagtga 60
cgactctttg attgcttcgc cacatctttt atttttatcc ttctaagtca tttctctatc 120
tatccatata gataaaaacc ttctaataga tctctgtgtc attttattcg taagaatgag 180
atctagtgta gaagataaca aaggatggat aggaccagcg acaccggaga tatcgaacgg 240
ttttgagttt cagaaaggtt cgaaccggac accaaaccat caccggtcta ctatggggaa 300
gccagcgccg tcaaaatggg acgatgctca gaaatggctt tctggtgtag ggtttgctcg 360
tggaggtggt ggaggtggtg acaagagtag tcatcactca agaagtaata agccgagaaa 420
ctcgaacgcg gatgatctta gacttatagc ttcagcttca cagagagaac gtgaaggaga 480
agatcagtac gttgagtatg atgatgaaga gatggcggcg ggaagaccgg aggttgagac 540
gaagaatgtt gattgtggtg aatctgtttg gaggaaagaa agtagtatta atccaacggc 600
tgtgattaga tccgtttgtg tgagagatat ggggactgag atgactccta ttggtagtca 660
agagccttct agaacagcta caccggtgcg agctactaca ccggttggga ggagtcctgt 720
gacttcaccg gtgagggctt cacaacgtgg tgaggcggtg ggggttgtga tggagacggt 780
gacggaggtt aggagggtag agagtaataa tagtgagaag gttaatggtt ttgtggagag 840
taagaaggct atgagtgcta tggaagctcg agccatggct tgggatgaag cagaacgtgc 900
taaattcatg gctaggtata agagagagga agtgaagata caagcttggg agaatcacga 960
gaagagaaag gctgagatgg agatgaagaa aatggaggta agatgcggag aggatgaaag 1020
caagggcaga ggagaagttg gccaacaagc tagctgcgac gaaaaggata gcggaagaga 1080
ggagggcgaa tgcggaggct aagttaaacg aaaaggcggt gaagacatcg gagaaagctg 1140
attatataag gaggagtggt cacttgcctt cttctttttc tttctccttt aagcttccct 1200
ctcgttgttg gtgtcaataa ttgtctattt tcattagaat gtaatcgtat ggatttagtg 1260
atattcaata actaacgcaa aaaaaaaaaa aaaagtttt 1299
<210>227
<211>308
<212>PRT
<213>拟南芥
<400>227
Met Arg Ser Ser Val Glu Asp Asn Lys Gly Trp Ile Gly Pro Ala Thr
1 5 10 15
Pro Glu Ile Ser Asn Gly Phe Glu Phe Gln Lys Gly Ser Asn Arg Thr
20 25 30
Pro Asn His His Arg Ser Thr Met Gly Lys Pro Ala Pro Ser Lys Trp
35 40 45
Asp Asp Ala Gln Lys Trp Leu Ser Gly Val Gly Phe Ala Arg Gly Gly
50 55 60
Gly Gly Gly Gly Asp Lys Ser Ser His His Ser Arg Ser Asn Lys Pro
65 70 75 80
Arg Asn Ser Asn Ala Asp Asp Leu Arg Leu Ile Ala Ser Ala Ser Gln
85 90 95
Arg Glu Arg Glu Gly Glu Asp Gln Tyr Val Glu Tyr Asp Asp Glu Glu
100 105 110
Met Ala Ala Gly Arg Pro Glu Val Glu Thr Lys Asn Val Asp Cys Gly
115 120 125
Glu Ser Val Trp Arg Lys Glu Ser Ser Ile Asn Pro Thr Ala Val Ile
130 135 140
Arg Ser Val Cys Val Arg Asp Met Gly Thr Glu Met Thr Pro Ile Gly
145 150 155 160
Ser Gln Glu Pro Ser Arg Thr Ala Thr Pro Val Arg Ala Thr Thr Pro
165 170 175
Val Gly Arg Ser Pro Val Thr Ser Pro Val Arg Ala Ser Gln Arg Gly
180 185 190
Glu Ala Val Gly Val Val Met Glu Thr Val Thr Glu Val Arg Arg Val
195 200 205
Glu Ser Asn Asn Ser Glu Lys Val Asn Gly Phe Val Glu Ser Lys Lys
210 215 220
Ala Met Ser Ala Met Glu Ala Arg Ala Met Ala Trp Asp Glu Ala Glu
225 230 235 240
Arg Ala Lys Phe Met Ala Arg Tyr Lys Arg Glu Glu Val Lys Ile Gln
245 250 255
Ala Trp Glu Asn His Glu Lys Arg Lys Ala Glu Met Glu Met Lys Lys
260 265 270
Met Glu Val Arg Cys Gly Glu Asp Glu Ser Lys Gly Arg Gly Glu Val
275 280 285
Gly Gln Gln Ala Ser Cys Asp Glu Lys Asp Ser Gly Arg Glu Glu Gly
290 295 300
Glu Cys Gly Gly
305
<210>228
<211>1298
<212>DNA
<213>拟南芥
<400>228
ttaatgtcac atttctgaaa tctctcaact tcatcatcaa gtgggttcct atgagagtga 60
cgactctttg attgcttcgc cacatctttt atttttatcc ttctaagtca tttctctatc 120
tatccatata gataaaaacc ttctaataga tctctgtgtc attttattcg taagaatgag 180
atctagtgta gaagataaca aaggatggat aggaccagcg acaccggaga tatcgaacgg 240
ttttgagttt cagaaaggtt cgaaccggac accaaaccat caccggtcta ctatggggaa 300
gccagcgccg tcaaaatggg acgatgctca gaaatggctt tctggtgtag ggtttgctcg 360
tggaggtggt ggaggtggtg acaagagtag tcatcactca agaagtaat aagccgagaaa 420
ctcgaacgcg gatgatctta gacttatagc ttcagcttca cagagagaac gtgaaggaga 480
agatcagtac gttgagtatg atgatgaaga gatggcggcg ggaagaccgg aggttgagac 540
gaagaatgtt gattgtggtg aatctgtttg gaggaaagaa agtagtatta atccaacggc 600
tgtgattaga tccgtttgtg tgagagatat ggggactgag atgactccta ttggtagtca 660
agagccttct agaacagcta caccggtgcg agctactaca ccggttggga ggagtcctgt 720
gacttcaccg gtgagggctt cacaacgtgg tgaggcggtg ggggttgtga tggagacggt 780
gacggaggtt aggagggtag agagtaataa tagtgagaag gttaatggtt ttgtggagag 840
taagaaggct atgagtgcta tggaagctcg agccatggct tgggatgaag cagaacgtgc 900
taaattcatg gctaggtata agagagagga agtgaagata caagcttggg agaatcacga 960
gaagagaaag gctgagatgg agatgaagaa aatggaggtg aaggcggaga ggatgaaagc 1020
aagggcagag gagaagttgg ccaacaagct agctgcgacg aaaaggatag cggaagagag 1080
gagggcgaat gcggaggcta agttaaacga aaaggcggtg aagacatcgg agaaagctga 1140
ttatataagg aggagtggtc acttgccttc ttctttttct ttctccttta agcttccctc 1200
tcgttgttgg tgtcaataat tgtctatttt cattagaatg taatcgtatg gatttagtga 1260
tattcaataa ctaacgcaaa aaaaaaaaaa aaagtttt 1298
<210>229
<211>347
<212>PRT
<213>拟南芥
<400>229
Met Arg Ser Ser Val Glu Asp Asn Lys Gly Trp Ile Gly Pro Ala Thr
1 5 10 15
Pro Glu Ile Ser Asn Gly Phe Glu Phe Gln Lys Gly Ser Asn Arg Thr
20 25 30
Pro Asn His His Arg Ser Thr Met Gly Lys Pro Ala Pro Ser Lys Trp
35 40 45
Asp Asp Ala Gln Lys Trp Leu Ser Gly Val Gly Phe Ala Arg Gly Gly
50 55 60
Gly Gly Gly Gly Asp Lys Ser Ser His His Ser Arg Ser Asn Lys Pro
65 70 75 80
Arg Asn Ser Asn Ala Asp Asp Leu Arg Leu Ile Ala Ser Ala Ser Gln
85 90 95
Arg Glu Arg Glu Gly Glu Asp Gln Tyr Val Glu Tyr Asp Asp Glu Glu
100 105 110
Met Ala Ala Gly Arg Pro Glu Val Glu Thr Lys Asn Val Asp Cys Gly
115 120 125
Glu Ser Val Trp Arg Lys Glu Ser Ser Ile Asn Pro Thr Ala Val Ile
130 135 140
Arg Ser Val Cys Val Arg Asp Met Gly Thr Glu Met Thr Pro Ile Gly
145 150 155 160
Ser Gln Glu Pro Ser Arg Thr Ala Thr Pro Val Arg Ala Thr Thr Pro
165 170 175
Val Gly Arg Ser Pro Val Thr Ser Pro Val Arg Ala Ser Gln Arg Gly
180 185 190
Glu Ala Val Gly Val Val Met Glu Thr Val Thr Glu Val Arg Arg Val
195 200 205
Glu Ser Asn Asn Ser Glu Lys Val Asn Gly Phe Val Glu Ser Lys Lys
210 215 220
Ala Met Ser Ala Met Glu Ala Arg Ala Met Ala Trp Asp Glu Ala Glu
225 230 235 240
Arg Ala Lys Phe Met Ala Arg Tyr Lys Arg Glu Glu Val Lys Ile Gln
245 250 255
Ala Trp Glu Asn His Glu Lys Arg Lys Ala Glu Met Glu Met Lys Lys
260 265 270
Met Glu Val Lys Ala Glu Arg Met Lys Ala Arg Ala Glu Glu Lys Leu
275 280 285
Ala Asn Lys Leu Ala Ala Thr Lys Arg Ile Ala Glu Glu Arg Arg Ala
290 295 300
Asn Ala Glu Ala Lys Leu Asn Glu Lys Ala Val Lys Thr Ser Glu Lys
305 310 315 320
Ala Asp Tyr Ile Arg Arg Ser Gly His Leu Pro Ser Ser Phe Ser Phe
325 330 335
Ser Phe Lys Leu Pro Ser Arg Cys Trp Cys Gln
340 345
<210>230
<211>792
<212>DNA
<213>拟南芥
<400>230
atggataatt tggttaagca aagaagaaga agggtctcaa tctctgagaa cataaaaacg 60
gatttgccaa tgctatcaga attggacata acagattacc cagcattaaa ctggctgaaa 120
aaccaatcat attggtacga gaaaaatgac tactacaacg agaaagagag tgaattggca 180
gtttctgttg cggttgctgc attcgtcatt agatcaatgg aagaagccga taaacaaaaa 240
tcgaaaagaa taagagaaga aatcaagagg tcaaggacca aaaaatccaa tctggttata 300
cctaataccc aagtaaagag gttaagcaaa tcatatacac aagaggtgaa aattggagag 360
gagagtttca gaaaaaaatt gttggagtat ccatcagaaa accgtcggcc acaagagatt 420
ggctcatcct ccggaacatc aggacttgct tcagcgtcaa gtaaagcaga ttcttgggaa 480
aaatctcaaa tcaagaaaat aagattaagg tatgagaaaa tgaaagctga tattgtgggt 540
tgggagaatg agagaaaatt agcagctaca ctgttaatgg agaaaagaaa gagtgaattg 600
gagaagagaa aagggattaa taatcagcat tataagtcaa aattagcaag gattcaacta 660
atagctgatg gagccaagaa acagcttgag gagaagagaa ggagcaaaga agctcaagtt 720
catggaaaag taaagaaaat gagtcgaaca gggaaagttc ctaataatta tttctgcttt 780
cggtgttact aa 792
<210>231
<211>263
<212>PRT
<213>拟南芥
<400>231
Met Asp Asn Leu Val Lys Gln Arg Arg Arg Arg Val Ser Ile Ser Glu
1 5 10 15
Asn Ile Lys Thr Asp Leu Pro Met Leu Ser Glu Leu Asp Ile Thr Asp
20 25 30
Tyr Pro Ala Leu Asn Trp Leu Lys Asn Gln Ser Tyr Trp Tyr Glu Lys
35 40 45
Asn Asp Tyr Tyr Asn Glu Lys Glu Ser Glu Leu Ala Val Ser Val Ala
50 55 60
Val Ala Ala Phe Val Ile Arg Ser Met Glu Glu Ala Asp Lys Gln Lys
65 70 75 80
Ser Lys Arg Ile Arg Glu Glu Ile Lys Arg Ser Arg Thr Lys Lys Ser
85 90 95
Asn Leu Val Ile Pro Asn Thr Gln Val Lys Arg Leu Ser Lys Ser Tyr
100 105 110
Thr Gln Glu Val Lys Ile Gly Glu Glu Ser Phe Arg Lys Lys Leu Leu
115 120 125
Glu Tyr Pro Ser Glu Asn Arg Arg Pro Gln Glu Ile Gly Ser Ser Ser
130 135 140
Gly Thr Ser Gly Leu Ala Ser Ala Ser Ser Lys Ala Asp Ser Trp Glu
145 150 155 160
Lys Ser Gln Ile Lys Lys Ile Arg Leu Arg Tyr Glu Lys Met Lys Ala
165 170 175
Asp Ile Val Gly Trp Glu Asn Glu Arg Lys Leu Ala Ala Thr Leu Leu
180 185 190
Met Glu Lys Arg Lys Ser Glu Leu Glu Lys Arg Lys Gly Ile Asn Asn
195 200 205
Gln His Tyr Lys Ser Lys Leu Ala Arg Ile Gln Leu Ile Ala Asp Gly
210 215 220
Ala Lys Lys Gln Leu Glu Glu Lys Arg Arg Ser Lys Glu Ala Gln Val
225 230 235 240
His Gly Lys Val Lys Lys Met Ser Arg Thr Gly Lys Vat Pro Asn Asn
245 250 255
Tyr Phe Cys Phe Arg Cys Tyr
260
<210>232
<211>1495
<212>DNA
<213>拟南芥
<400>232
gtctcgtttg ttttgctctt tagaaattac cgatttacgc tgaaaaaatg tgaaaaatac 60
aatcgatcgc attatcttta tccctagcta atcattcatg tacaagcatg tctccgaagg 120
ttaaaagcag tcgctattta ccggaccaac gtagttttct cgaagtggtg gtccgttgtc 180
atattttaaa tttatcacct tcttgagaat tccacatttt tatccttttt gtcatgtagt 240
gtatattttt tcctctaacc taattaaaat caaaacaaaa tcctttgacc caattagctt 300
cgcgatatat cagaagagat caaactactt tgatcagacc atgatcttct tcttcttctt 360
cttcttcttc ttcttctttt tagacgatca caattcctaa accctatttc tcagattatg 420
ctgactcttt accatcaaga aaggtcaccg gacgccacaa gtaatgatcg cgatgagacg 480
ccagagactg tggttagaga agtccacgcg ctaactccag cgccggagga taattcccgg 540
acgatgacgg cgacgctacc tccaccgcct gctttccgag gctatttttc tcctccaagg 600
tcagcgacga cgatgagcga aggagagaac ttcacaacta taagcagaga gttcaacgct 660
ctagtcatcg ccggatcctc catggagaac aacgaactaa tgactcgtga cgtcacgcag 720
cgtgaagatg agagacaaga cgagttgatg agaatccacg aggacacgga tcatgaagag 780
gaaacgaatc ctttagcaat cgtgccggat cagtatcctg gttcgggttt ggatcctgga 840
agtgataatg ggccgggtca gagtcgggtt gggtcgacgg tgcaaagagt taagagggaa 900
gaggtggaag cgaagataac ggcgtggcag acggcaaaac tggctaagat taataacagg 960
tttaagaggg aagacgccgt tattaacggt tggtttaatg aacaagttaa caaggccaac 1020
tcttggatga agaaaattga gaggaagcta gaggagagaa aagcaaaagc gatggagaaa 1080
acgcaaaaca atgtggcgaa agcgcagagg aaagcggagg agagaagagc gacggcagag 1140
gcaaagagag ggacagaggt tgcaaaagta gttgaagttg ctaatctcat gagagccctt 1200
ggacgtcctc ctgccaaacg ctccttcttc tctttctcct aatttttagt tatatcaaac 1260
cattaaatta aacagtactc gttatatatc tagttagtaa acaaaggggc agttttatag 1320
ctcatgtaca cataattgag agtgtagtac tgttgtgtca tgtgtggttt tgtacttttc 1380
ttagttacac acaccataca agaaaaaaag aagattataa ttcaacttaa ttttgatttt 1440
tgaataatgc gtttgtataa gaagtcaaat aaaaaattcg tttctacttt ctacc 1495
<210>233
<211>274
<212>PRT
<213>拟南芥
<400>233
Met teu Thr Leu Tyr His Gln Glu Arg Ser Pro Asp Ala Thr Ser Asn
1 5 10 15
Asp Arg Asp Glu Thr Pro Glu Thr Val Val Arg Glu Val His Ala Leu
20 25 30
Thr Pro Ala Pro Glu Asp Asn Ser Arg Thr Met Thr Ala Thr Leu Pro
35 40 45
Pro Pro Pro Ala Phe Arg Gly Tyr Phe Ser Pro Pro Arg Ser Ala Thr
50 55 60
Thr Met Ser Glu Gly Glu Asn Phe Thr Thr Ile Ser Arg Glu Phe Asn
65 70 75 80
Ala Leu Val Ile Ala Gly Ser Ser Met Glu Asn Asn Glu Leu Met Thr
85 90 95
Arg Asp Val Thr Gln Arg Glu Asp Glu Arg Gln Asp Glu Leu Met Arg
100 105 110
Ile His Glu Asp Thr Asp His Glu Glu Glu Thr Asn Pro Leu Ala Ile
115 120 125
Val Pro Asp Gln Tyr Pro Gly Ser Gly Leu Asp Pro Gly Ser Asp Asn
130 135 140
Gly Pro Gly Gln Ser Arg Val Gly Ser Thr Val Gln Arg Val Lys Arg
145 150 155 160
Glu Glu Val Glu Ala Lys Ile Thr Ala Trp Gln Thr Ala Lys Leu Ala
165 170 175
Lys Ile Asn Asn Arg Phe Lys Arg Glu Asp Ala Val Ile Asn Gly Trp
180 185 190
Phe Asn Glu Gln Val Asn Lys Ala Asn Ser Trp Met Lys Lys Ile Glu
195 200 205
Arg Lys Leu Glu Glu Arg Lys Ala Lys Ala Met Glu Lys Thr Gln Asn
210 215 220
Asn Val Ala Lys Ala Gln Arg Lys Ala Glu Glu Arg Arg Ala Thr Ala
225 230 235 240
Glu Ala Lys Arg Gly Thr Glu Val Ala Lys Val Val Glu Val Ala Asn
245 250 255
Leu Met Arg Ala Leu Gly Arg Pro Pro Ala Lys Arg Ser Phe Phe Ser
260 265 270
Phe Ser
<210>234
<211>1038
<212>DNA
<213>拟南芥
<400>234
atggatacct taatcaagca gacaaggagg aagcatccag cttcccagga aaaaattaga 60
gaggttggta gctcaactag agagaaaaaa gtgtcagcaa ggaagtctgt ttcattcaaa 120
gaagataaga agaagccttc aaactggtta cagaagcagt tctcgaggca aatgagtggc 180
caaagttatg atcccatcgg agaaatggat catgcagctg cagttgcagc cactgcctat 240
gccatagcca cttttgaaga aacttggcta gagaactatc atagtggcct tgaacttgga 300
ccttcttcgt caaggagcaa gagcagaagt gaagaactgt tgcctttaga ggaaccaaga 360
agcttatcaa gaagattctc agggcaactt tcgtttatag attcagagac gaaagatcat 420
aaacctccta cactaaagtc cccaatgaga aagtcatctt cggtaaaaaa gactttctcc 480
atgaacttga tgggagacca caccaaacag aatcaagatt cagaggagaa acatgaaaga 540
caaagaaaac cggtttctga accaccacgg atacaaccac cgcttaggac acgatcagaa 600
cctcgtgctc caccgccacc tcctcctcct cttctatcac cttcgcctct gcggcttcca 660
cctagggaaa ccaaaaggca gagttctgag catactagtc gaaaggatga ttctacagct 720
gatgcttggg aaaaagctga actatctaag atcaaagcaa ggtatgagaa gttaaacaga 780
aagatagatt tgtgggaagc gaagaaaagg gaaaaagctc gaaggaagct ggacatatct 840
gagcagagcg aactagaaca gaggagaaag agaggtttgc agagatttag agaagacaca 900
gaatacattg aacagattgc tgctggagcc agagctcagg cggagaaaga cagacagagc 960
aaagagttca aggtgaagga gaaggccggt gttatccgta gtaccggtaa actccctgga 1020
aatgcatgct gtttctga 1038
<210>235
<211>345
<212>PRT
<213>拟南芥
<400>235
Met Asp Thr Leu Ile Lys Gln Thr Arg Arg Lys His Pro Ala Ser Gln
1 5 10 15
Glu Lys Ile Arg Glu Val Gly Ser Ser Thr Arg Glu Lys Lys Val Ser
20 25 30
Ala Arg Lys Ser Val Ser Phe Lys Glu Asp Lys Lys Lys Pro Ser Asn
35 40 45
Trp Leu Gln Lys Gln Phe Ser Arg Gln Met Ser Gly Gln Ser Tyr Asp
50 55 60
Pro Ile Gly Glu Met Asp His Ala Ala Ala Val Ala Ala Thr Ala Tyr
65 70 75 80
Ala Ile Ala Thr Phe Glu Glu Thr Trp Leu Glu Asn Tyr His Ser Gly
85 90 95
Leu Glu Leu Gly Pro Ser Ser Ser Arg Ser Lys Ser Arg Ser Glu Glu
100 105 110
Leu Leu Pro Leu Glu Glu Pro Arg Ser Leu Ser Arg Arg Phe Ser Gly
115 120 125
Gln Leu Ser Phe Ile Asp Ser Glu Thr Lys Asp His Lys Pro Pro Thr
130 135 140
Leu Lys Ser Pro Met Arg Lys Ser Ser Ser Val Lys Lys Thr Phe Ser
145 150 155 160
Met Asn Leu Met Gly Asp His Thr Lys Gln Asn Gln Asp Ser Glu Glu
165 170 175
Lys His Glu Arg Gln Arg Lys Pro Val Ser Glu Pro Pro Arg Ile Gln
180 185 190
Pro Pro Leu Arg Thr Arg Ser Glu Pro Arg Ala Pro Pro Pro Pro Pro
195 200 205
Pro Pro Leu Leu Ser Pro Ser Pro Leu Arg Leu Pro Pro Arg Glu Thr
210 215 220
Lys Arg Gln Ser Ser Glu His Thr Ser Arg Lys Asp Asp Ser Thr Ala
225 230 235 240
Asp Ala Trp Glu Lys Ala Glu Leu Ser Lys Ile Lys Ala Arg Tyr Glu
245 250 255
Lys Leu Asn Arg Lys Ile Asp Leu Trp Glu Ala Lys Lys Arg Glu Lys
260 265 270
Ala Arg Arg Lys Leu Asp Ile Ser Glu Gln Ser Glu Leu Glu Gln Arg
275 280 285
Arg Lys Arg Gly Leu Gln Arg Phe Arg Glu Asp Thr Glu Tyr Ile Glu
290 295 300
Gln Ile Ala Ala Gly Ala Arg Ala Gln Ala Glu Lys Asp Arg Gln Ser
305 310 315 320
Lys Glu Phe Lys Val Lys Glu Lys Ala Gly Val Ile Arg Ser Thr Gly
325 330 335
Lys Leu Pro Gly Asn Ala Cys Cys Phe
340 345
<210>236
<211>1284
<212>DNA
<213>拟南芥
<400>236
atgagaaaga cttctgtttc atctaatagc tttggtgggt ttttaagtcc cggagctccg 60
agttacgctg acaacaaagg ttggagctcc gagagagttc ctcatccttc ctccactact 120
tcctcctctg caattaacgg tggtcgtcgt cacatcggct cttcttccgc tttaacgacg 180
ccgttttaca gcggcagagc aattccttcg aaatgggaag atgctgagcg gtggatttgt 240
agccctgtgt cgacttaccc acaaggtgtt tgtttaaatt cctcagtgag ttctgaacag 300
agaaggcaga aatctaaaag tggtccgatt gttcctccta cgttgcctca tccgcatcct 360
acgtcttctt cgtcggcgac tgggtgttat cactattctc cgaggatgat gatgcggtct 420
atggatgctc ctcctaaggg tttaatggtt gctggttctc cgttttctac tggagttttg 480
gaggcggata gggtttttag aggaagtgtc ggtggtggtg gttgtgatgg ctatggtcgt 540
ggacctggcc atggacatag ccggagctgg gttgatttga tgagtgaaga aacttcttca 600
cttagctcca aaactgatac agaggagaaa gcagagatga cgacggcgat gcaatctccg 660
gtggtatcaa gaagagatat ggctactcag atgagtccag aagagacgag tcctaataac 720
aataaccagt ctccaccatt ggttgtttct gtgattgagc cacctccttg tagaggtgaa 780
gtgagagaag tgaaaatgga taaaggagca agaatgatta agcgtccaaa gagacgagtc 840
atgtcttcta ggattattag gagagagcaa cctgaggttg aagacaattc tgaagcttct 900
gcttcttctt cttcttggga tatctcagaa ccagccatga ctctttctaa gttgcaaaga 960
gaggaagcga agattgcagc ttgggaaaat ctgcagaagg cgaaagcaga agccgctatt 1020
agaaaacttg aggtgaagct ggagaagaag aaatcagcat caatggataa gatcttgaac 1080
aagcttcaaa cagctaagat caaagcacaa gagatgagga gaagttcagt atccagtgaa 1140
catgaacaac aacaagggaa tcatcaaatc tccagaaact cggtgaagat cacgcatctt 1200
gttcgaagac atactttcat gactcctttc atgacttgct ttgctcctcg tgttgattgc 1260
agaaaatctt cttctgctct ctga 1284
<210>237
<211>427
<212>PRT
<213>拟南芥
<400>237
Met Arg Lys Thr Ser Val Ser Ser Asn Ser Phe Gly Gly Phe Leu Ser
1 5 10 15
Pro Gly Ala Pro Ser Tyr Ala Asp Asn Lys Gly Trp Ser Ser Glu Arg
20 25 30
Val Pro His Pro Ser Ser Thr Thr Ser Ser Ser Ala Ile Asn Gly Gly
35 40 45
Arg Arg His Ile Gly Ser Ser Ser Ala Leu Thr Thr Pro Phe Tyr Ser
50 55 60
Gly Arg Ala Ile Pro Ser Lys Trp Glu Asp Ala Glu Arg Trp Ile Cys
65 70 75 80
Ser Pro Val Ser Thr Tyr Pro Gln Gly Val Cys Leu Asn Ser Ser Val
85 90 95
Ser Ser Glu Gln Arg Arg Gln Lys Ser Lys Ser Gly Pro Ile Val Pro
100 105 110
Pro Thr Leu Pro His Pro His Pro Thr Ser Ser Ser Ser Ala Thr Gly
115 120 125
Cys Tyr His Tyr Ser Pro Arg Met Met Met Arg Ser Met Asp Ala Pro
130 135 140
Pro Lys Gly Leu Met Val Ala Gly Ser Pro Phe Ser Thr Gly Val Leu
145 150 155 160
Glu Ala Asp Arg Val Phe Arg Gly Ser Val Gly Gly Gly Gly Cys Asp
165 170 175
Gly Tyr Gly Arg Gly Pro Gly His Gly His Ser Arg Ser Trp Val Asp
180 185 190
Leu Met Ser Glu Glu Thr Ser Ser Leu Ser Ser Lys Thr Asp Thr Glu
195 200 205
Glu Lys Ala Glu Met Thr Thr Ala Met Gln Ser Pro Val Val Ser Arg
210 215 220
Arg Asp Met Ala Thr Gln Met Ser Pro Glu Glu Thr Ser Pro Asn Asn
225 230 235 240
Asn Asn Gln Ser Pro Pro Leu Val Val Ser Val Ile Glu Pro Pro Pro
245 250 255
Cys Arg Gly Glu Val Arg Glu Val Lys Met Asp Lys Gly Ala Arg Met
260 265 270
Ile Lys Arg Pro Lys Arg Arg Val Met Ser Ser Arg Ile Ile Arg Arg
275 280 285
Glu Gln Pro Glu Val Glu Asp Asn Ser Glu Ala Ser Ala Ser Ser Ser
290 295 300
Ser Trp Asp Ile Ser Glu Pro Ala Met Thr Leu Ser Lys Leu Gln Arg
305 310 315 320
Glu Glu Ala Lys Ile Ala Ala Trp Glu Asn Leu Gln Lys Ala Lys Ala
325 330 335
Glu Ala Ala Ile Arg Lys Leu Glu Val Lys Leu Glu Lys Lys Lys Ser
340 345 350
Ala Ser Met Asp Lys Ile Leu Asn Lys Leu Gln Thr Ala Lys Ile Lys
355 360 365
Ala Gln Glu Met Arg Arg Ser Ser Val Ser Ser Glu His Glu Gln Gln
370 375 380
Gln Gly Asn His Gln Ile Ser Arg Asn Ser Val Lys Ile Thr His Leu
385 390 395 400
Val Arg Arg His Thr Phe Met Thr Pro Phe Met Thr Cys Phe Ala Pro
405 410 415
Arg Val Asp Cys Arg Lys Ser Ser Ser Ala Leu
420 425
<210>238
<211>1421
<212>DNA
<213>拟南芥
<400>238
caacagtggt agaaacaaaa caaaagaaaa ctccatggac ttcacaagaa acagcaacac 60
caagctccat ccccaaactc agcttctgtt tccccctaat atggagaaaa actcaaatgt 120
tagcgccaac ccatttgcag aagactcact tacaagcaga atcaatctaa aggaaactac 180
agatttcatc aagtcacttc caatttcatc aaaccaaagc agtagtagca gcaatgagat 240
ggtaaacgag agaagaccaa gtttctcatc acaaaagagc attggagaag gaagaagcaa 300
tggacaaaga agattgatgt taatggagtc tccttgtact ccaggtagag gagtcttcag 360
tttcagtagc aatgtctctg gtagaagaag aaacttccct tctaaatgga ttgatgctga 420
gaaatgggtc acttcctctg gtcatgactc tccagcacat tctctcaaaa acaaccaatt 480
tgatgggttt aaacaccagg tggaagttgt atactcagag aaatctaggg ttacagaaga 540
atgtttccat ggatctgtct cattatctcc acaagatctt atccttaaag ataagttagc 600
aaacgaagtt cctcagattc ttccatcaac ggaagggttt atattcaaag attccgacaa 660
gtttctccgg tacgaggaag ctcaagttca acacagagac atgggaacag agatgacacc 720
aataggaagt gtaacgactt caagatgtca cacgccgttt aaaagttcct ctccagcgag 780
acacaacacg ccttctcaat tgtctggtcc gttaacggaa accaaaaacg ttatagatat 840
atccgagttc gaagacaagc ttagactcag tgggtcatca acgagtcagt attgttactc 900
ggtgacgagt cattggaact cgagagaaga agaagaagaa gagatatcga agagtttaag 960
acatttcgat atggagagtg agttaaggag aagtgtgtct gaatctaaag ctcctttatg 1020
ggatgatgaa gacgacaaga tcaagttttg tcaaaggtat caaagagaag aggccaaaat 1080
tcaagcatgg gttaatcttg aaaacgctaa agccgaagct caatctagaa agcttgaggt 1140
gaaaatacag aagatgagat caaatttaga ggagaaatta atgaagagaa tggatatggt 1200
gcaccggaga gcagaagatt ggagagctac ggcgaggcag caacatgttg agcagatgca 1260
gaaagcggcc gagacggcga ggaaattgac aaaccgccga ggctatttgg ttaccggccg 1320
tagctcatgt ggttgtctac cttgcaataa tacttgtcat taactcagtc aaagtaaaag 1380
agagtaaaat acacataaac aaacacaaga aattactgtt t 1421
<210>239
<211>442
<212>PRT
<213>拟南芥
<400>239
Met Asp Phe Thr Arg Asn Ser Asn Thr Lys Leu His Pro Gln Thr Gln
1 5 10 15
Leu Leu Phe Pro Pro Asn Met Glu Lys Asn Ser Asn Val Ser Ala Asn
20 25 30
Pro Phe Ala Glu Asp Ser Leu Thr Ser Arg Ile Asn Leu Lys Glu Thr
35 40 45
Thr Asp Phe Ile Lys Ser Leu Pro Ile Ser Ser Asn Gln Ser Ser Ser
50 55 60
Ser Ser Asn Glu Met Val Asn Glu Arg Arg Pro Ser Phe Ser Ser Gln
65 70 75 80
Lys Ser Ile Gly Glu Gly Arg Ser Asn Gly Gln Arg Arg Leu Met Leu
85 90 95
MetGl u Ser Pro Cys Thr Pro Gly Arg Gly Val Phe Ser Phe Ser Ser
100 105 110
Asn Val Ser Gly Arg Arg Arg Asn Phe Pro Ser Lys Trp Ile Asp Ala
115 120 125
Glu Lys Trp Val Thr Ser Ser Gly His Asp Ser Pro Ala His Ser Leu
130 135 140
Lys Asn Asn Gln Phe Asp Gly Phe Lys His Gln Val Glu Val Val Tyr
145 150 155 160
Ser Glu Lys Ser Arg Val Thr Glu Glu Cys Phe His Gly Ser Val Ser
165 170 175
Leu Ser Pro Gln Asp Leu Ile Leu Lys Asp Lys Leu Ala Asn Glu Val
180 185 190
Pro Gln Ile Leu Pro Ser Thr Glu Gly Phe Ile Phe Lys Asp Ser Asp
195 200 205
Lys Phe Leu Arg Tyr Glu Glu Ala Gln Val Gln His Arg Asp Met Gly
210 215 220
Thr Glu Met Thr Pro Ile Gly Ser Val Thr Thr Ser Arg Cys His Thr
225 230 235 240
Pro Phe Lys Ser Ser Ser Pro Ala Arg His Asn Thr Pro Ser Gln Leu
245 250 255
Ser Gly Pro Leu Thr Glu Thr Lys Asn Val Ile Asp Ile Ser Glu Phe
260 265 270
Glu Asp Lys Leu Arg Leu Ser Gly Ser Ser Thr Ser Gln Tyr Cys Tyr
275 280 285
Ser Val Thr Ser His Trp Asn Ser Arg Glu Glu Glu Glu Glu Glu Ile
290 295 300
Ser Lys Ser Leu Arg His Phe Asp Met Glu Ser Glu Leu Arg Arg Ser
305 310 315 320
Val Ser Glu Ser Lys Ala Pro Leu Trp Asp Asp Glu Asp Asp Lys Ile
325 330 335
Lys Phe Cys Gln Arg Tyr Gln Arg Glu Glu Ala Lys Ile Gln Ala Trp
340 345 350
Val Asn Leu Glu Asn Ala Lys Ala Glu Ala Gln Ser Arg Lys Leu Glu
355 360 365
Val Lys Ile Gln Lys Met Arg Ser Asn Leu Glu Glu Lys Leu Met Lys
370 375 380
Arg Met Asp Met Val His Arg Arg Ala Glu Asp Trp Arg Ala Thr Ala
385 390 395 400
Arg Gln Gln His Val Glu Gln Met Gln Lys Ala Ala Glu Thr Ala Arg
405 410 415
Lys Leu Thr Asn Arg Arg Gly Tyr Leu Val Thr Gly Arg Ser Ser Cys
420 425 430
Gly Cys Leu Pro Cys Asn Asn Thr Cys His
435 440
<210>240
<211>1734
<212>DNA
<213>拟南芥
<400>240
ccattttgtc tctcttcttc tttttcagag acagaggaat tagagaaagc aagctttgtg 60
tctgtaaata taaagagata gagaaaagat ttggcattgg caatggatta cgagaggata 120
cagaaagtgc agaagagtat aatctcgcca acgaagctga gaatgaagct aatgggtcca 180
ctcaataaca tgaagcgaga aggatccaag tccaacagta actcttcaag aacatctcct 240
tctcgtcttc agattccaga tgactccgag ttctccaaga acagcttgtt agcttctaac 300
tcttattcag acgacgatgt ggcagctaca actacggata tagaagtagc taagctgcca 360
aatgagccgg ttttgtatcc aaccgagaac gataatcaag gctcaaaaga tcggtgtgaa 420
ggtgttgttc caagggaaaa tgatcagcct agactgcagc aatttaggaa aggggacttg 480
aatatggctt ctcctcatat aatgagacct caagaagatg aaaaccttga ttatgacagt 540
aacgctagct cttcaagctt cgagtttcac cgagctcgtg gtgagcgttc gaatcagaat 600
catggctcaa gaggatatcc ttcaagacaa atgccatcta aatggaatga tgctgagaag 660
tggataatga gcagacagaa catggtgatg aggaagaacg gtcaagggaa ccgaatacct 720
gtgagaattg tgcctgataa tgcaggttac gagcataaca aatctaggat ggatctgtgc 780
caatcctcac aagttgatgg gtttgagaag ttccctaatg ttgttccctc ggcgccacat 840
cctattctaa ctcaagagta tggaggagac tcgttgattg accaatccac acaaagcaat 900
gatcttgcgg attcatcaca tgatcataca acaggtggtc ctgcgattcg ttcggtatgt 960
atgagagata tgggaaccga aatgacacct ataccgagtc aagaaccttc aagatctgtg 1020
acaccagttg gtgcaacaac tcctcttcgt agcccgactt catctctccc ttctactcct 1080
agaggtggcc aaccagagga atcttctatg tcgaaaaaca caagaagaga actatctgag 1140
gaggaagaga aagcgaagac gcgaagagag attgtagctc ttggagttca gctagggaag 1200
atgaacatcg ccgcttgggc aagtaaagaa gaagaggaga acaagaaaaa caatggagat 1260
gcagaggagg cacagaagat tgagtttgaa aaacgagcga ctgcatggga agaagcagag 1320
aaatccaaac ataatgcgag gtataagcgt gaggaaatca gaatccaagc ttgggaaagt 1380
caggagaaag ccaaactcga agcagaaatg cgacgtatag aggctaaagt tgagcagatg 1440
aaagctgaag ctgaagcaaa gataatgaag aaaattgcgt tggctaagca aaggtcagaa 1500
gagaaacggg ctttggcgga agctagaaaa acccgtgatg ctgagaaggc agtggctgaa 1560
gcccaatata ttcgggaaac tggtagaata ccggcatcaa gttacaagat atgttgtggt 1620
tggttctcat gaggcattgg attgagtttt tggtcttctg agtaaaccat gattggattc 1680
tcaaagcccc tttgtgtaat atagaaatgg aatgcatatt atgttgcata gact 1734
<210>241
<211>509
<212>PRT
<213>拟南芥
<400>241
Met Asp Tyr Glu Arg Ile Gln Lys Val Gln Lys Ser IIe Ile Ser Pro
1 5 10 15
Thr Lys Leu Arg Met Lys Leu Met Gly Pro Leu Asn Asn Met Lys Arg
20 25 30
Glu Gly Ser Lys Ser Asn Ser Asn Ser Ser Arg Thr Ser Pro Ser Arg
35 40 45
Leu Gln Ile Pro Asp Asp Ser Glu Phe Ser Lys Asn Ser Leu Leu Ala
50 55 60
Ser Asn Ser Tyr Ser Asp Asp Asp Val Ala Ala Thr Thr Thr Asp Ile
65 70 75 80
Glu Val Ala Lys Leu Pro Asn Glu Pro Val Leu Tyr Pro Thr Glu Asn
85 90 95
Asp Asn Gln Gly Ser Lys Asp Arg Cys Glu Gly Val Val Pro Arg Glu
100 105 110
Asn Asp Gln Pro Arg Leu Gln Gln Phe Arg Lys Gly Asp Leu Asn Met
115 120 125
Ala Ser Pro His Ile Met Arg Pro Gln Glu Asp Glu Asn Leu Asp Tyr
130 135 140
Asp Ser Asn Ala Ser Ser Ser Ser Phe Glu Phe His Arg Ala Arg Gly
145 150 155 160
Glu Arg Ser Asn Gln Asn His Gly Ser Arg Gly Tyr Pro Ser Arg Gln
165 170 175
Met Pro Ser Lys Trp Asn Asp Ala Glu Lys Trp Ile Met Ser Arg Gln
180 185 190
Asn Met Val Met Arg Lys Asn Gly Gln Gly Asn Arg Ile Pro Val Arg
195 200 205
Ile Val Pro Asp Asn Ala Gly Tyr Glu His Asn Lys Ser Arg Met Asp
210 215 220
Leu Cys Gln Ser Ser Gln Val Asp Gly Phe Glu Lys Phe Pro Asn Val
225 230 235 240
Val Pro Ser Ala Pro His Pro Ile Leu Thr Gln Glu Tyr Gly Gly Asp
245 250 255
Ser Leu Ile Asp Gln Ser Thr Gln Ser Asn Asp Leu Ala Asp Ser Ser
260 265 270
His Asp His Thr Thr Gly Gly Pro Ala Ile Arg Ser Val Cys Met Arg
275 280 285
Asp Met Gly Thr Glu Met Thr Pro Ile Pro Ser Gln Glu Pro Ser Arg
290 295 300
Ser Val Thr Pro Val Gly Ala Thr Thr Pro Leu Arg Ser Pro Thr Ser
305 310 315 320
Ser Leu Pro Ser Thr Pro Arg Gly Gly Gln Pro Glu Glu Ser Ser Met
325 330 335
Ser Lys Asn Thr Arg Arg Glu Leu Ser Glu Glu Glu Glu Lys Ala Lys
340 345 350
Thr Arg Arg Glu Ile Val Ala Leu Gly Val Gln Leu Gly Lys Met Asn
355 360 365
Ile Ala Ala Trp Ala Ser Lys Glu Glu Glu Glu Asn Lys Lys Asn Asn
370 375 380
Gly Asp Ala Glu Glu Ala Gln Lys Ile Glu Phe Glu Lys Arg Ala Thr
385 390 395 400
Ala Trp Glu Glu Ala Glu Lys Ser Lys His Asn Ala Arg Tyr Lys Arg
405 410 415
Glu Glu Ile Arg Ile Gln Ala Trp Glu Ser Gln Glu Lys Ala Lys Leu
420 425 430
Glu Ala Glu Met Arg Arg Ile Glu Ala Lys Val Glu Gln Met Lys Ala
435 440 445
Glu Ala Glu Ala Lys Ile Met Lys Lys Ile Ala Leu Ala Lys Gln Arg
450 455 460
Ser Glu Glu Lys Arg Ala Leu Ala Glu Ala Arg Lys Thr Arg Asp Ala
465 470 475 480
Glu Lys Ala Val Ala Glu Ala Gln Tyr Ile Arg Glu Thr Gly Arg Ile
485 490 495
Pro Ala Ser Ser Tyr Lys Ile Cys Cys Gly Trp Phe Ser
500 505
<210>242
<211>2020
<212>DNA
<213>拟南芥
<400>242
atgccgtcgg agtcatcgta caaagtccac cgtccggcga aatccggagg atctcgacga 60
gactcaagcc ccgactcaat aatcttcaca cctgaatcta atctcagtct cttctcctcc 120
gcttccgtca gcgtcgatcg ttgctcttcc acctccgacg ctcacgaccg ggacgactct 180
ctcatctccg gtccctctct ggagcgagat cagagggtaa gttcgagctg taaagatcta 240
gatctagaca agegtggtac agggtggaag aatagttgta actctagaaa atcaaataaa 300
gtaaaagcag cttggaaaga ggagtttgag gttaaaaaag atgatgaaag ccagaatctt 360
gattcagcta ggagttcttt ctctgtagct cttagagaat gtcaggaacg aagatctaga 420
tctgaagcgc tggcgaaaaa gttagattac caaaggactg tttcgttgga tcttagtaat 480
gtaacctcta cgtctccaag agtggtaaat gtgaagagag cttcagtttc aactaataaa 540
tcgagtgtgt ttcctagtcc tggtactccg acttatctac atagtatgca aaagggttgg 600
agttcagaga gagtaccttt acgttcaaac ggaggaagaa gtccgccaaa tgctgggttt 660
ttacctttgt atagtggtag aacggttcct tctaagtggg aagatgcgga gagatggata 720
gttagtcctc ttgctaagga aggagctgcc cgtacttcat ttggagcatc gcatgaaagg 780
cgacctaaag caaagagtgg tccattaggt cctccaggat ttgcatatta ttcgttgtat 840
tcccctgcag ttcctatggt tcatggtgga aacatgggag gcttaacagc aagctctccg 900
ttttcagctg gtgtgttgcc agaaactgtt tcttctaggg gttccactac agctgccttt 960
cctcagcgaa tcgatccatc catggcgaga tcagttagca ttcatggctg ctctgaaaca 1020
cttgcatctt catcccaaga tgacatccat gaaagtatga aggatgctgc taccgatgct 1080
caagctgtct caagaaggga tatggcaacc cagatgagtc ccgagggaag catccggttt 1140
tcccctgaga gacagtgttc gttctctccc tcctctccat caccactacc tatttcggaa 1200
ctactgaatg ctcattccaa ccgagcagaa gtcaaggact tacaggttga tgagaaggta 1260
accgtaactc gctggtcaaa gaagcacaga ggtctatacc atggaaatgg ctcaaaaatg 1320
cgagatcacg tacatggaaa agctactaac catgaagatt tgacatgtgc gacagaggaa 1380
gccagaatta tatcttggga aaatttgcag aaagctaagg ccgaggcagc aataagaaag 1440
ctagagaaat atttcccaca gatgaagctg gaaaagaaaa gatcatcgtc gatggaaaag 1500
attatgagaa aagtaaaatc agcagagaag agagcggagg agatgaggag gtcggtgtta 1560
gacaatagag tctcaaccgc atctcatggt aaggcttcat cattcaaaag aagtgggaag 1620
aagaagatcc cttcccttag tggttgcttc acctgccatg tattctagtt gccctttttc 1680
gaagaaaata cggtaaatgg agactcttca ctgatgcgta cgcgtaatat ttggctttct 1740
aattcctgct tgtaatacta ctttcgatag tcagtagctg ttaattgatt tcaatagatg 1800
cgcttagtac atttgtatgt tagttcctag ctgagtaaaa tccgagggat gagtccaccc 1860
atttccacct ttgttggtct cttcgggtgt ttagaggtga attgatccca agaggacaaa 1920
ctcttcttga taaaatgtat ttgtaattta tgatgccttg atactaacat tatgacataa 1980
ctttttttaa cattatgaca aacattgttg ttttacattc 2020
<210>243
<211>555
<212>PRT
<213>拟南芥
<400>243
Met Pro Ser Glu Ser Ser Tyr Lys Val His Arg Pro Ala Lys Ser Gly
1 5 10 15
Gly Ser Arg Arg Asp Ser Ser Pro Asp Ser Ile Ile Phe Thr Pro Glu
20 25 30
Ser Asn Leu Ser Leu Phe Ser Ser Ala Ser Val Ser Val Asp Arg Cys
35 40 45
Ser Ser Thr Ser Asp Ala His Asp Arg Asp Asp Ser Leu Ile Ser Gly
50 55 60
Pro Ser Leu Glu Arg Asp Gln Arg Val Ser Ser Ser Cys Lys Asp Leu
65 70 75 80
Asp Leu Asp Lys Arg Gly Thr Gly Trp Lys Asn Ser Cys Asn Ser Arg
85 90 95
Lys Ser Asn Lys Val Lys Ala Ala Trp Lys Glu Glu Phe Glu Val Lys
100 105 110
Lys Asp Asp Glu Ser Gln Asn Leu Asp Ser Ala Arg Ser Ser Phe Ser
115 120 125
Val Ala Leu Arg Glu Cys Gln Glu Arg Arg Ser Arg Ser Glu Ala Leu
130 135 140
Ala Lys Lys Leu Asp Tyr Gln Arg Thr Val Ser Leu Asp Leu Ser Asn
145 150 155 160
Val Thr Ser Thr Ser Pro Arg Val Val Asn Val Lys Arg Ala Ser Val
165 170 175
Ser Thr Asn Lys Ser Ser Val Phe Pro Ser Pro Gly Thr Pro Thr Tyr
180 185 190
Leu His Ser Met Gln Lys Gly Trp Ser Ser Glu Arg Val Pro Leu Arg
195 200 205
Ser Asn Gly Gly Arg Ser Pro Pro Asn Ala Gly Phe Leu Pro Leu Tyr
210 215 220
Ser Gly Arg Thr Val Pro Ser Lys Trp Glu Asp Ala Glu Arg Trp Ile
225 230 235 240
Val Ser Pro Leu Ala Lys Glu Gly Ala Ala Arg Thr Ser Phe Gly Ala
245 250 255
Ser His Glu Arg Arg Pro Lys Ala Lys Ser Gly Pro Leu Gly Pro Pro
260 265 270
Gly Phe Ala Tyr Tyr Ser Leu Tyr Ser Pro Ala Val Pro Met Val His
275 280 285
Gly Gly Asn Met Gly Gly Leu Thr Ala Ser Ser Pro Phe Ser Ala Gly
290 295 300
Val Leu Pro Glu Thr Val Ser Ser Arg Gly Ser Thr Thr Ala Ala Phe
305 310 315 320
Pro Gln Arg Ile Asp Pro Ser Met Ala Arg Ser Val Ser Ile His Gly
325 330 335
Cys Ser Glu Thr Leu Ala Ser Ser Ser Gln Asp Asp Ile His Glu Ser
340 345 350
Met Lys Asp Ala Ala Thr Asp Ala Gln Ala Val Ser Arg Arg Asp Met
355 360 365
Ala Thr Gln Met Ser Pro Glu Gly Ser Ile Arg Phe Ser Pro Glu Arg
370 375 380
Gln Cys Ser Phe Ser Pro Ser Ser Pro Ser Pro Leu Pro Ile Ser Glu
385 390 395 400
Leu Leu Asn Ala His Ser Asn Arg Ala Glu Val Lys Asp Leu Gln Val
405 410 415
Asp Glu Lys Val Thr Val Thr Arg Trp Ser Lys Lys His Arg Gly Leu
420 425 430
Tyr His Gly Asn Gly Ser Lys Met Arg Asp His Val His Gly Lys Ala
435 440 445
Thr Asn His Glu Asp Leu Thr Cys Ala Thr Glu Glu Ala Arg Ile Ile
450 455 460
Ser Trp Glu Asn Leu Gln Lys Ala Lys Ala Glu Ala Ala Ile Arg Lys
465 470 475 480
Leu Glu Lys Tyr Phe Pro Gln Met Lys Leu Glu Lys Lys Arg Ser Ser
485 490 495
Ser Met Glu Lys Ile Met Arg Lys Val Lys Ser Ala Glu Lys Arg Ala
500 505 510
Glu Glu Met Arg Arg Ser Val Leu Asp Asn Arg Val Ser Thr Ala Ser
515 520 525
His Gly Lys Ala Ser Ser Phe Lys Arg Ser Gly Lys Lys Lys Ile Pro
530 535 540
Ser Leu Ser Gly Cys Phe Thr Cys His Val Phe
545 550 555
<210>244
<211>1652
<212>DNA
<213>拟南芥
<400>244
ctgtactttc acaagcttcc aagctctctt atcattcact gatttttggt tctcgagaaa 60
aaagtgaaga tttttgagat tctctttcga tggattacga acgaatcgga aagacccagg 120
ttactagtag cggcggcgga ttttctccgg ggaagttaag gagtatgctt cttctaggtg 180
ttgatagaaa gaagaatgaa gaagaagaat caactcctac aatgagatct gggtctaatc 240
aaattgatga ccctagggtt tatgttgcta gtggattaga tgattgcaaa gatgttgatg 300
ttgtgagtga gattactgat tgttctactt cagggatagc tagatcgatt agtttgggtc 360
ttcaagagta ttctgattat gataatgtga atgagatcaa gagtgtttct gcatcatctg 420
tctttgagtt tcaaaagact gagaaggaaa aagttaatca aagaatgcct attagatcat 480
tctctaaacc agctccatct aaatgggatg atgctcagaa atggattgct agtcctacgg 540
ctaaccgacc gaagactgga caggttcagg ttccgggttc gaagaaaggg cctagctttg 600
gtcgtcagtc ttctatgaag attgttgaag ttgctgaaca tagagtggtt gaagagcctg 660
atacaaagag aatagatgta agccaagtga aaaaggatat gggaaacaag tttggtagct 720
gggaagttga ttcgtacact accgtggatt catatgtcaa accggttctt atggttgaga 780
actctattgt agaatcagca actgaagtta atctcagccg tcatgactcg tcagtcgcaa 840
ctgcgtttgc tcaaccgcct tcaacggcaa ggtctgtgtc aatgagagac atgggaactg 900
aaatgactcc tatagcgagc caagaacctt ctagaaacgg gacaccgatt agggcaacaa 960
cgccaatacg aagtcctata tcttctgaac cttcaagtcc aggcagacaa gcatcagctt 1020
ctcctatgag taacaaggaa ctgtcagaga aagagcttca aatgaaaact aggagagaga 1080
taatggtgtt gggtactcaa cttggtaaat ttaacattgc tgcttgggct agcaaggagg 1140
atgaagataa agacgcatcc acatcattaa agaccaaagc ttctctacaa acttctaaaa 1200
gtgtttctga agctcgtgct acagcgtggg aggaagcgga aaaagctaag cacatggcta 1260
ggttcagacg cgaagagatg aagattcaag catgggagaa tcatcagaag gcgaaatctg 1320
aagccgagat gaagaaaacc gaggttaaag ttgagaggat taagggacga gcacaagacc 1380
ggttgatgaa gaaactcgct acaatcgagc gcaaagcaga ggaaaagcga gcagcggctg 1440
aagcaaagaa ggatcatcag gcagctaaaa cagagaaaca agctgaacaa atccgaagaa 1500
caggcaaagt accttcattg ttgttctctt gctttagctt ttgttcttaa atccaatcct 1560
attgtgaatg tgatgttgtt aattctcaag aacacatctt tctatcatca tttgtataat 1620
aaaagctttg aaaaacttat ttcttgtgat ct 1652
<210>245
<211>486
<212>PRT
<213>拟南芥
<400>245
Met Asp Tyr Glu Arg Ile Gly Lys Thr Gln Val Thr Ser Ser Gly Gly
1 5 10 15
Gly Phe Ser Pro Gly Lys Leu Arg Ser Met Leu Leu Leu Gly Val Asp
20 25 30
Arg Lys Lys Asn Glu Glu Glu Glu Ser Thr Pro Thr Met Arg Ser Gly
35 40 45
Ser Asn Gln Ile Asp Asp Pro Arg Val Tyr Val Ala Ser Gly Leu Asp
50 55 60
Asp Cys Lys Asp Val Asp Val Val Ser Glu Ile Thr Asp Cys Ser Thr
65 70 75 80
Ser Gly Ile Ala Arg Ser Ile Ser Leu Gly Leu Gln Glu Tyr Ser Asp
85 90 95
Tyr Asp Asn Val Asn Glu Ile Lys Ser Val Ser Ala Ser Ser Val Phe
100 105 110
Glu Phe Gln Lys Thr Glu Lys Glu Lys Val Asn Gln Arg Met Pro Ile
115 120 125
Arg Ser Phe Ser Lys Pro Ala Pro Ser Lys Trp Asp Asp Ala Gln Lys
130 135 140
Trp Ile Ala Ser Pro Thr Ala Asn Arg Pro Lys Thr Gly Gln Val Gln
145 150 155 160
Val Pro Gly Ser Lys Lys Gly Pro Ser Phe Gly Arg Gln Ser Ser Met
165 170 175
Lys Ile Val Glu Val Ala Glu His Arg Val Val Glu Glu Pro Asp Thr
180 185 190
Lys Arg Ile Asp Val Ser Gln Val Lys Lys Asp Met Gly Asn Lys Phe
195 200 205
Gly Ser Trp Glu Val Asp Ser Tyr Thr Thr Val Asp Ser Tyr Val Lys
210 215 220
Pro Val Leu Met Val Glu Asn Ser Ile Val Glu Ser Ala Thr Glu Val
225 230 235 240
Asn Leu Ser Arg His Asp Ser Ser Val Ala Thr Ala Phe Ala Gln Pro
245 250 255
Pro Ser Thr Ala Arg Ser Val Ser Met Arg Asp Met Gly Thr Glu Met
260 265 270
Thr Pro Ile Ala Ser Gln Glu Pro Ser Arg Asn Gly Thr Pro Ile Arg
275 280 285
Ala Thr Thr Pro Ile Arg Ser Pro Ile Ser Ser Glu Pro Ser Ser Pro
290 295 300
Gly Arg Gln Ala Ser Ala Ser Pro Met Ser Asn Lys Glu Leu Ser Glu
305 310 315 320
Lys Glu Leu Gln Met Lys Thr Arg Arg Glu Ile Met Val Leu Gly Thr
325 330 335
Gln Leu Gly Lys Phe Asn Ile Ala Ala Trp Ala Ser Lys Glu Asp Glu
340 345 350
Asp Lys Asp Ala Ser Thr Ser Leu Lys Thr Lys Ala Ser Leu Gln Thr
355 360 365
Ser Lys Ser Val Ser Glu Ala Arg Ala Thr Ala Trp Glu Glu Ala Glu
370 375 380
Lys Ala Lys His Met Ala Arg Phe Arg Arg Glu Glu Met Lys Ile Gln
385 390 395 400
Ala Trp Glu Asn His Gln Lys Ala Lys Ser Glu Ala Glu Met Lys Lys
405 410 415
Thr Glu Val Lys Val Glu Arg Ile Lys Gly Arg Ala Gln Asp Arg Leu
420 425 430
Met Lys Lys Leu Ala Thr Ile Glu Arg Lys Ala Glu Glu Lys Arg Ala
435 440 445
Ala Ala Glu Ala Lys Lys Asp His Gln Ala Ala Lys Thr Glu Lys Gln
450 455 460
Ala Glu Gln Ile Arg Arg Thr Gly Lys Val Pro Ser Leu Leu Phe Ser
465 470 475 480
Cys Phe Ser Phe Cys Ser
485
<210>246
<211>351
<212>DNA
<213>拟南芥
<400>246
atggagccaa atattccgat ccaaagaggt aactcatatc acagagtttt agtattgttt 60
agtttcatgt tgactcagaa gaagctacta gatatttcag gatgggagaa aaagaaaact 120
acaaagatcg aatctgaact cgctagaatt cagcggaaga tggacagtaa gaagatggag 180
aaatctgaga aactaaggaa cgaaaaagcg gcagttcatg caaaggcaca aaagaagaag 240
gcagatgttc aaaccagacg ggctcaagag atccttgatg cggaagaagc tgctgctagg 300
tttcaagccg caggaaagat acccaagaag tcatctttga gctgcttctg a 351
<210>247
<211>116
<212>PRT
<213>拟南芥
<400>247
Met Glu Pro Asn Ile Pro Ile Gln Arg Gly Asn Ser Tyr His Arg Val
1 5 10 15
Leu Val Leu Phe Ser Phe Met Leu Thr Gln Lys Lys Leu Leu Asp Ile
20 25 30
Ser Gly Trp Glu Lys Lys Lys Thr Thr Lys Ile Glu Ser Glu Leu Ala
35 40 45
Arg Ile Gln Arg Lys Met Asp Ser Lys Lys Met Glu Lys Ser Glu Lys
50 55 60
Leu Arg Asn Glu Lys Ala Ala Val His Ala Lys Ala Gln Lys Lys Lys
65 70 75 80
Ala Asp Val Gln Thr Arg Arg Ala Gln Glu Ile Leu Asp Ala Glu Glu
85 90 95
Ala Ala Ala Arg Phe Gln Ala Ala Gly Lys Ile Pro Lys Lys Ser Ser
100 105 110
Leu Ser Cys Phe
115
<210>248
<211>636
<212>DNA
<213>拟南芥
<400>248
atgaagacta accggaaccg tccgatcaac atcctcatcg tcttcttcct tcttacgacc 60
gcaagagcag caacaagaaa ctggaccaac cgaactcacc gaaccgtccc taaggttcaa 120
cacgcgtact acgcatatcc tcaccgttca tgcgaatctt tctctcgtcc atacgcacgc 180
tctatgtgca ttgagctcga aagaatccac agaagcagtc gacaaccgct tttctctcct 240
ccgcctcctc cgacggagat tgatcaaagc gtcatgaacg aatccacagt gcaacgagcg 300
aaacctgaac atatggcagc tgttgtggat caatggaagg aaacagagat aagcaaatcg 360
agaaagaagt acgagaagct aagtgagaag attgtgtcat gggaagataa gaagaggaaa 420
aaggcaaaga gaaaacttca tagaacagag agaagtgtag agaaaacaaa gttgaaggcg 480
acccagaggt tcagggacga aaatgaacgt attgagatta tcgttgcaag tgcaagagca 540
catgcgtatg agagtcgaat aaaagaagag ttgaaggtta aggagaaagc aaacctcatg 600
agaacaactg gtaggaaacc ctctacatgc ctctga 636
<210>249
<211>211
<212>PRT
<213>拟南芥
<400>249
Met Lys Thr Asn Arg Asn Arg Pro Ile Asn Ile Leu Ile Val Phe Phe
1 5 10 15
Leu Leu Thr Thr Ala Arg Ala Ala Thr Arg Asn Trp Thr Asn Arg Thr
20 25 30
His Arg Thr Val Pro Lys Val Gln His Ala Tyr Tyr Ala Tyr Pro His
35 40 45
Arg Ser Cys Glu Ser Phe Ser Arg Pro Tyr Ala Arg Ser Met Cys Ile
50 55 60
Glu Leu Glu Arg Ile His Arg Ser Ser Arg Gln Pro Leu Phe Ser Pro
65 70 75 80
Pro Pro Pro Pro Thr Glu Ile Asp Gln Ser Val Met Asn Glu Ser Thr
85 90 95
Val Gln Arg Ala Lys Pro Glu His Met Ala Ala Val Val Asp Gln Trp
100 105 110
Lys Glu Thr Glu Ile Ser Lys Ser Arg Lys Lys Tyr Glu Lys Leu Ser
115 120 125
Glu Lys Ile Val Ser Trp Glu Asp Lys Lys Arg Lys Lys Ala Lys Arg
130 135 140
Lys Leu His Arg Thr Glu Arg Ser Val Glu Lys Thr Lys Leu Lys Ala
145 150 155 160
Thr Gln Arg Phe Arg Asp Glu Asn Glu Arg Ile Glu Ile Ile Val Ala
165 170 175
Ser Ala Arg Ala His Ala Tyr Glu Ser Arg Ile Lys Glu Glu Leu Lys
180 185 190
Val Lys Glu Lys Ala Asn Leu Met Arg Thr Thr Gly Arg Lys Pro Ser
195 200 205
Thr Cys Leu
210
<210>250
<211>537
<212>DNA
<213>拟南芥
<400>250
atgaagacta accggaaccg tccgatcaac atcctcatcg tcttcttcct tcttacgacc 60
gcaagagcag caacaagaaa ctggaccaac cgaactcacc gaaccgtccc taaggttcaa 120
cacgcgtact acgcatatcc tcaccgttca tgcgaatctt tctctcgtcc atacgcacgc 180
tctatgtgca ttgagctcga aagaatccac agaagcagtc gacaaccgct tttctctcct 240
ccgcctcctc cgacggagat tgatcaaagg tacgagaagc taagtgagaa gattgtgtca 300
tgggaagata agaagaggaa aaaggcaaag agaaaacttc atagaacaga gagaagtgta 360
gagaaaacaa agttgaaggc gacccagagg ttcagggacg aaaatgaacg tattgagatt 420
atcgttgcaa gtgcaagagc acatgcgtat gagagtcgaa taaaagaaga gttgaaggtt 480
aaggagaaag caaacctcat gagaacaact ggtaggaaac cctctacatg cctctga 537
<210>251
<211>178
<212>PRT
<213>拟南芥
<400>251
Met Lys Thr Asn Arg Asn Arg Pro Ile Asn Ile Leu Ile Val Phe Phe
1 5 10 15
Lou Leu Thr Thr Ala Arg Ala Ala Thr Arg Asn Trp Thr Asn Arg Thr
20 25 30
His Arg Thr Val Pro Lys Val Gln His Ala Tyr Tyr Ala Tyr Pro His
35 40 45
Arg Ser Cys Glu Ser Phe Ser Arg Pro Tyr Ala Arg Ser Met Cys Ile
50 55 60
Glu Leu Glu Arg Ile His Arg Ser Ser Arg Gln Pro Leu Phe Ser Pro
65 70 75 80
Pro Pro Pro Pro Thr Glu Ile Asp Gln Arg Tyr Glu Lys Leu Ser Glu
85 90 95
Lys Ile Val Ser Trp Glu Asp Lys Lys Arg Lys Lys Ala Lys Arg Lys
100 105 110
Leu His Arg Thr Glu Arg Ser Val Glu Lys Thr Lys Leu Lys Ala Thr
115 120 125
Gln Arg Phe Arg Asp Glu Asn Glu Arg Ile Glu Ile Ile Val Ala Ser
130 135 140
Ala Arg Ala His Ala Tyr Glu Ser Arg Ile Lys Glu Glu Leu Lys Val
145 150 155 160
Lys Glu Lys Ala Asn Leu Met Arg Thr Thr Gly Arg Lys Pro Ser Thr
165 170 175
Cys Leu
<210>252
<211>639
<212>DNA
<213>拟南芥
<400>252
atggcggagg aacagaagat agcgttagaa tcagaatctc cggcgaaggt tacgactcct 60
gctccagcag atacaccggc tccagctccg gcagagattc cggctccagc tccagctccg 120
actccggctg atgtcacgaa agacgttgca gaggagaaaa ttcaaaaccc acctccggag 180
caaattttcg atgactccaa agcccttact gttgttgaga aacctgtaga agagcctgca 240
ccggcgaaac ctgcgtctgc atcgctcgat agagatgtta agctagctga tttgtcaaag 300
gaaaagagat tgtctttcgt cagagcgtgg gaagaaagcg aaaagagcaa agcagagaac 360
aaagctgaga agaagattgc agatgttcat gcttgggaaa acagcaagaa agcagctgtc 420
gaagcgcaac tcaagaaaat cgaggagcaa ctagagaaga agaaagcaga gtatgcagag 480
aggatgaaga ataaggttgc agcgattcac aaggaagcag aagagagaag agcaatgatt 540
gaagctaagc gtggagaaga cgttcttaaa gcagaagaaa cggctgctaa atacagagcc 600
actggaattg ttccaaaggc aacttgtgga tgtttctaa 639
<210>253
<211>212
<212>PRT
<213>拟南芥
<400>253
Met Ala Glu Glu Gln Lys Ile Ala Leu Glu Ser Glu Ser Pro Ala Lys
1 5 10 15
Val Thr Thr Pro Ala Pro Ala Asp Thr Pro Ala Pro Ala Pro Ala Glu
20 25 30
Ile Pro Ala Pro Ala Pro Ala Pro Thr Pro Ala Asp Val Thr Lys Asp
35 40 45
Val Ala Glu Glu Lys Ile Gln Asn Pro Pro Pro Glu Gln Ile Phe Asp
50 55 60
Asp Ser Lys Ala LeuThr Val ValGl u Lys Pro ValGl u Gl u Pro Ala
65 70 75 80
Pro Ala Lys Pro Ala Ser Ala Ser Leu Asp Arg Asp Val Lys Leu Ala
85 90 95
Asp Leu Ser Lys Glu Lys Arg Leu Ser Phe Val Arg Ala Trp Glu Glu
100 105 110
Ser Glu Lys Ser Lys Ala Glu Asn Lys Ala Glu Lys Lys Ile Ala Asp
115 120 125
Val His Ala Trp Glu Asn Ser Lys Lys Ala Ala Val Glu Ala Gln Leu
130 135 140
Lys Lys Ile Glu Glu Gln Leu Glu Lys Lys Lys Ala Glu Tyr Ala Glu
145 150 155 160
Arg Met Lys Asn Lys Val Ala Ala Ile His Lys Glu Ala Glu Glu Arg
165 170 175
Arg Ala Met Ile Glu Ala Lys Arg Gly Glu Asp Val Leu Lys Ala Glu
180 185 190
Glu Thr Ala Ala Lys Tyr Arg Ala Thr Gly Ile Val Pro Lys Ala Thr
195 200 205
Cys Gly Cys Phe
210
<210>254
<211>528
<212>DNA
<213>拟南芥
<400>254
atgactttag aggagcagaa gaaagtcata atgcccgagg ccgtcgcatc ggagccatca 60
ccaccatcca aggaggagaa gtccgacgat tcgaaagcta ttgttctcgt cgtcgctgca 120
aaagaaccta cggaagacaa gaaagtaggt tcagttcacc gagatgctgt tttggttaga 180
ctcgagcaag ataagaggat atctctaatc aaagcttggg aagaggctga gaaatccaaa 240
gtggagaaca aagctcagaa gaagatttct tcagttggag cttgggaaaa cagcaagaaa 300
gcttctgtgg aagctgagct aaaaaagatc gaggagcaac taaataagaa gaaagcacac 360
tacacagagc aaatgaagaa caagatagct caaatccaca aggaagctga ggagaagaga 420
gcgatgaccg aagctaaacg cggagaagat gttctcaaag ccgaagaaat ggctgcaaag 480
taccgtgcca ccggaactgc tccaaccaag ctatttggat tcttctga 528
<210>255
<211>175
<212>PRT
<213>拟南芥
<400>255
Met Thr Leu Glu Glu Gln Lys Lys Val Ile Met Pro Glu Ala Val Ala
1 5 10 15
Ser Glu Pro Ser Pro Pro Ser Lys Glu Glu Lys Ser Asp Asp Ser Lys
20 25 30
Ala Ile Val Leu Val Val Ala Ala Lys Glu Pro Thr Glu Asp Lys Lys
35 40 45
Val Gly Ser Val His Arg Asp Ala Val Leu Val Arg Leu Glu Gln Asp
50 55 60
Lys Arg Ile Ser Leu IIe Lys Ala Trp Glu Glu Ala Glu Lys Ser Lys
65 70 75 80
Val Glu Asn Lys Ala Gln Lys Lys Ile Ser Ser Val Gly Ala Trp Glu
85 90 95
Asn Ser Lys Lys Ala Ser Val Glu Ala Glu Leu Lys Lys Ile Glu Glu
100 105 110
Gln Leu Asn Lys Lys Lys Ala His Tyr Thr Glu Gln Met Lys Asn Lys
115 120 125
Ile Ala Gln Ile His Lys Glu Ala Glu Glu Lys Arg Ala Met Thr Glu
130 135 140
Ala Lys Arg Gly Glu Asp Val Leu Lys Ala Glu Glu Met Ala Ala Lys
145 150 155 160
Tyr Arg Ala Thr Gly Thr Ala Pro Thr Lys Leu Phe Gly Phe Phe
165 170 175
<210>256
<211>771
<212>DNA
<213>拟南芥
<400>256
atgacgacga cgacagagct tactcggcca caacaaaggg gatcaggagg aggatacttg 60
tctccgtcga ggtctattgc ttttagcgac ggaactactt cttccggtga gaatttcacc 120
accgtgagca gagagttcaa cgctctagtc atcgccggat cttccatgga caacaacagt 180
aacggaacta accaatcagg tggtcatcgt gacgtcatac gtgatgaaag aaacgagctg 240
actaggatcg gcgaaaacga tgacgttggt gatcatggtc aggtgcctga ggaggattca 300
aatccatggg cgattgtacc ggacgattac aacaaccggg acggttcaga gaataatatt 360
gtgttggcgt catcaggtgg tcagaaccgg atggtgacga ctgcttcggt gcagagggtg 420
aagagagaag aggtggaagc aaagataacg gcgtggcaaa cggcgaaggt ggctaagatt 480
aataataggt ttaagagaca agacgccgtt attaacggtt ggttgaatga gcaggttcat 540
agagctaact cttggatgaa gaaaatcgag aggaaactgg aagataggag agcgaaggcg 600
atggagaaaa cacaaaacaa agtggcaaaa gctcagagga aggcggagga gaggagagcc 660
acggcggaag gtaaacgagg gacggaggtt gcgagggttc ttgaagttgc taatctcatg 720
agagccgttg gacgacctcc ggccaaacga tcattcttct ctctttccta g 771
<210>257
<211>256
<212>PRT
<213>拟南芥
<400>257
Met Thr Thr Thr Thr Glu Leu Thr Arg Pro Gln Gln Arg Gly Ser Gly
1 5 10 15
Gly Gly Tyr Leu Ser Pro Ser Arg Ser Ile Ala Phe Ser Asp Gly Thr
20 25 30
Thr Ser Ser Gly Glu Asn Phe Thr Thr Val Ser Arg Glu Phe Asn Ala
35 40 45
Leu Val Ile Ala Gly Ser Ser Met Asp Asn Asn Ser Asn Gly Thr Asn
50 55 60
Gln Ser Gly Gly His Arg Asp Val Ile Arg Asp Glu Arg Asn Glu Leu
65 70 75 80
Thr Arg Ile Gly Glu Asn Asp Asp Val Gly Asp His Gly Gln Val Pro
85 90 95
Glu Glu Asp Ser Asn Pro Trp Ala Ile Val Pro Asp Asp Tyr Asn Asn
100 105 110
Arg Asp Gly Ser Glu Asn Asn Ile Val Leu Ala Ser Ser Gly Gly Gln
115 120 125
Asn Arg Met Val Thr Thr Ala Ser Val Gln Arg Val Lys Arg Glu Glu
130 135 140
Val Glu Ala Lys Ile Thr Ala Trp Gln Thr Ala Lys Val Ala Lys Ile
145 150 155 160
Asn Asn Arg Phe Lys Arg Gln Asp Ala Val Ile Asn Gly Trp Leu Asn
165 170 175
Glu Gln Val His Arg Ala Asn Ser Trp Met Lys Lys Ile Glu Arg Lys
180 185 190
Leu Glu Asp Arg Arg Ala Lys Ala Met Glu Lys Thr Gln Asn Lys Val
195 200 205
Ala Lys Ala Gln Arg Lys Ala Glu Glu Arg Arg Ala Thr Ala Glu Gly
210 215 220
Lys Arg Gly Thr Glu Val Ala Arg Val Leu Glu Val Ala Asn Leu Met
225 230 235 240
Arg Ala Val Gly Arg Pro Pro Ala Lys Arg Ser Phe Phe Ser Leu Ser
245 250 255
<210>258
<211>1044
<212>DNA
<213>拟南芥
<400>258
atgagatcta gtgtagaaga taacaaagga tggataggac cagcgacacc ggagatatcg 60
aacggttttg agtttcagaa aggttcgaac cggacaccaa accatcaccg gtctactatg 120
gggaagccag cgccgtcaaa atgggacgat gctcagaaat ggctttctgg tgtagggttt 180
gctcgtggag gtggtggagg tggtgacaag agtagtcatc actcaagaag taataagccg 240
agaaactcga acgcggatga tcttagactt atagcttcag cttcacagag agaacgtgaa 300
ggagaagatc agtacgttga gtatgatgat gaagagatgg cggcgggaag accggaggtt 360
gagacgaaga atgttgattg tggtgaatct gtttggagga aagaaagtag tattaatcca 420
acggctgtga ttagatccgt ttgtgtgaga gatatgggga ctgagatgac tcctattggt 480
agtcaagagc cttctagaac agctacaccg gtgcgagcta ctacaccggt tgggaggagt 540
cctgtgactt caccggtgag ggcttcacaa cgtggtgagg cggtgggggt tgtgatggag 600
acggtgacgg aggttaggag ggtagagagt aataatagtg agaaggttaa tggttttgtg 660
gagagtaaga aggctatgag tgctatggaa gctcgagcca tggcttggga tgaagcagaa 720
cgtgctaaat tcatggctag gtataagaga gaggaagtga agatacaagc ttgggagaat 780
cacgagaaga gaaaggctga gatggagatg aagaaaatgg aggtgaaggc ggagaggatg 840
aaagcaaggg cagaggagaa gttggccaac aagctagctg cgacgaaaag gatagcggaa 900
gagaggaggg cgaatgcgga ggctaagtta aacgaaaagg cggtgaagac atcggagaaa 960
gctgattata taaggaggag tggtcacttg ccttcttctt tttctttctc ctttaagctt 1020
ccctctcgtt gttggtgtca ataa 1044
<210>259
<211>347
<212>PRT
<213>拟南芥
<400>259
Met Arg Ser Ser Val Glu Asp Asn Lys Gly Trp Ile Gly Pro Ala Thr
1 5 10 15
Pro Glu Ile Ser Asn Gly Phe Glu Phe Gln Lys Gly Ser Asn Arg Thr
20 25 30
Pro Asn His His Arg Ser Thr Met Gly Lys Pro Ala Pro Ser Lys Trp
35 40 45
Asp Asp Ala Gln Lys Trp Leu Ser Gly Val Gly Phe Ala Arg Gly Gly
50 55 60
Gly Gly Gly Gly Asp Lys Ser Ser His His Ser Arg Ser Asn Lys Pro
65 70 75 80
Arg Asn Ser Asn Ala Asp Asp Leu Arg Leu Ile Ala Ser Ala Ser Gln
85 90 95
Arg Glu Arg Glu Gly Glu Asp Gln Tyr Val Glu Tyr Asp Asp Glu Glu
100 105 110
Met Ala Ala Gly Arg Pro Glu Val Glu Thr Lys Asn Val Asp Cys Gly
115 120 125
Glu Ser Val Trp Arg Lys Glu Ser Ser Ile Asn Pro Thr Ala Val Ile
130 135 140
Arg Ser Val Cys Val Arg Asp Met Gly Thr Glu Met Thr Pro Ile Gly
145 150 155 160
Ser Gln Glu Pro Ser Arg Thr Ala Thr Pro Val Arg Ala Thr Thr Pro
165 170 175
Val Gly Arg Ser Pro Val Thr Ser Pro Val Arg Ala Ser Gln Arg Gly
180 185 190
Glu Ala Val Gly Val Val Met Glu Thr Val Thr Glu Val Arg Arg Val
195 200 205
Glu Ser Asn Asn Ser Glu Lys Val Asn Gly Phe Val Glu Ser Lys Lys
210 215 220
Ala Met Ser Ala Met Glu Ala Arg Ala Met Ala Trp Asp Glu Ala Glu
225 230 235 240
Arg Ala Lys Phe Met Ala Arg Tyr Lys Arg Glu Glu Val Lys Ile Gln
245 250 255
Ala Trp Glu Asn His Glu Lys Arg Lys Ala Glu Met Glu Met Lys Lys
260 265 270
Met Glu Val Lys Ala Glu Arg Met Lys Ala Arg Ala Glu Glu Lys Leu
275 280 285
Ala Asn Lys Leu Ala Ala Thr Lys Arg Ile Ala Glu Glu Arg Arg Ala
290 295 300
Asn Ala Glu Ala Lys Leu Asn Glu Lys Ala Val Lys Thr Ser Glu Lys
305 310 315 320
Ala Asp Tyr Ile Arg Arg Ser Gly His Leu Pro Ser Ser Phe Ser Phe
325 330 335
Ser Phe Lys Leu Pro Ser Arg Cys Trp Cys Gln
340 345
<210>260
<211>825
<212>DNA
<213>拟南芥
<400>260
atgctgactc tttaccatca agaaaggtca ccggacgcca caagtaatga tcgcgatgag 60
acgccagaga ctgtggttag agaagtccac gcgctaactc cagcgccgga ggataattcc 120
cggacgatga cggcgacgct acctccaccg cctgctttcc gaggctattt ttctcctcca 180
aggtcagcga cgacgatgag cgaaggagag aacttcacaa ctataagcag agagttcaac 240
gctctagtca tcgccggatc ctccatggag aacaacgaac taatgactcg tgacgtcacg 300
cagcgtgaag atgagagaca agacgagttg atgagaatcc acgaggacac ggatcatgaa 360
gaggaaacga atcctttagc aatcgtgccg gatcagtatc ctggttcggg tttggatcct 420
ggaagtgata atgggccggg tcagagtcgg gttgggtcga cggtgcaaag agttaagagg 480
gaagaggtgg aagcgaagat aacggcgtgg cagacggcaa aactggctaa gattaataac 540
aggtttaaga gggaagacgc cgttattaac ggttggttta atgaacaagt taacaaggcc 600
aactcttgga tgaagaaaat tgagaggaag ctagaggaga gaaaagcaaa agcgatggag 660
aaaacgcaaa acaatgtggc gaaagcgcag aggaaagcgg aggagagaag agcgacggca 720
gaggcaaaga gagggacaga ggttgcaaaa gtagttgaag ttgctaatct catgagagcc 780
cttggacgtc ctcctgccaa acgctccttc ttctctttct cctaa 825
<210>261
<211>274
<212>PRT
<213>拟南芥
<400>261
Met Leu Thr Leu Tyr His Gln Glu Arg Ser Pro Asp Ala Thr Ser Asn
1 5 10 15
Asp Arg Asp Glu Thr Pro Glu Thr Val Val Arg Glu Val His Ala Leu
20 25 30
Thr Pro Ala Pro Glu Asp Asn Ser Arg Thr Met Thr Ala Thr Leu Pro
35 40 45
Pro Pro Pro Ala Phe Arg Gly Tyr Phe Ser Pro Pro Arg Ser Ala Thr
50 55 60
Thr Met Ser Glu Gly Glu Asn Phe Thr Thr Ile Ser Arg Glu Phe Asn
65 70 75 80
Ala Leu Val Ile Ala Gly Ser Ser Met Glu Asn Asn Glu Leu Met Thr
85 90 95
Arg Asp Val Thr Gln Arg Glu Asp Glu Arg Gln Asp Glu Leu Met Arg
100 105 110
Ile His Glu Asp Thr Asp His Glu Glu Glu Thr Asn Pro Leu Ala Ile
115 120 125
Val Pro Asp Gln Tyr Pro Gly Ser Gly Leu Asp Pro Gly Ser Asp Asn
130 135 140
Gly Pro Gly Gln Ser Arg Val Gly Ser Thr Val Gln Arg Val Lys Arg
145 150 155 160
Glu Glu Val Glu Ala Lys Ile Thr Ala Trp Gln Thr Ala Lys Leu Ala
165 170 175
Lys Ile Asn Asn Arg Phe Lys Arg Glu Asp Ala Val Ile Asn Gly Trp
180 185 190
Phe Asn Glu Gln Val Asn Lys Ala Asn Ser Trp Met Lys Lys Ile Glu
195 200 205
Arg Lys Leu Glu Glu Arg Lys Ala Lys Ala Met Glu Lys Thr Gln Asn
210 215 220
Asn Val Ala Lys Ala Gln Arg Lys Ala Glu Glu Arg Arg Ala Thr Ala
225 230 235 240
Glu Ala Lys Arg Gly Thr Glu Val Ala Lys Val Val Glu Val Ala Asn
245 250 255
Leu Met Arg Ala Leu Gly Arg Pro Pro Ala Lys Arg Ser Phe Phe Ser
260 265 270
Phe Ser
<210>262
<211>1071
<212>DNA
<213>拟南芥
<400>262
atggatacct taatcaagca gacaaggagg aagcatccag cttcccagga aaaaattaga 60
gaggttggta gctcaactag agagaaaaaa gtgtcagcaa ggaagtctgt ttcattcaaa 120
gaagataaga agaagccttc aaactggtta cagaagcagt tctcgaggca aatgagtggc 180
caaagttatg atcccatcgg agaaatggat catgcagctg cagttgcagc cactgcctat 240
gccatagcca cttttgaaga aacttggcta gagaactatc atgtaacggt ttttaaaaac 300
agagtttttg ttagaagtgg ccttgaactt ggaccttctt cgtcaaggag caagagcaga 360
agtgaagaac tgttgccttt agaggaacca agaagcttat caagaagatt ctcagggcaa 420
ctttcgttta tagattcaga gacgaaagat cataaacctc ctacactaaa gtccccaatg 480
agaaagtcat cttcggtaaa aaagactttc tccatgaact tgatgggaga ccacaccaaa 540
cagaatcaag attcagagga gaaacatgaa agacaaagaa aaccggtttc tgaaccacca 600
cggatacaac caccgcttag gacacgatca gaacctcgtg ctccaccgcc acctcctcct 660
cctcttctat caccttcgcc tctgcggctt ccacctaggg aaaccaaaag gcagagttct 720
gagcatacta gtcgaaagga tgattctaca gctgatgctt gggaaaaagc tgaactatct 780
aagatcaaag caaggtatga gaagttaaac agaaagatag atttgtggga agcgaagaaa 840
agggaaaaag ctcgaaggaa gctggacata tctgagcaga gcgaactaga acagaggaga 900
aagagaggtt tgcagagatt tagagaagac acagaataca ttgaacagat tgctgctgga 960
gccagagctc aggcggagaa agacagacag agcaaagagt tcaaggtgaa ggagaaggcc 1020
ggtgttatcc gtagtaccgg taaactccct ggaaatgcat gctgtttctg a 1071
<210>263
<211>356
<212>PRT
<213>拟南芥
<400>263
Met Asp Thr Leu Ile Lys Gln Thr Arg Arg Lys His Pro Ala Ser Gln
1 5 10 15
Glu Lys Ile Arg Glu Val Gly Ser Ser Thr Arg Glu Lys Lys Val Ser
20 25 30
Ala Arg Lys Ser Val Ser Phe Lys Glu Asp Lys Lys Lys Pro Ser Asn
35 40 45
Trp Leu Gln Lys Gln Phe Ser Arg Gln Met Ser Gly Gln Ser Tyr Asp
50 55 60
Pro Ile Gly Glu Met Asp His Ala Ala Ala Val Ala Ala Thr Ala Tyr
65 70 75 80
Ala Ile Ala Thr Phe Glu Glu Thr Trp Leu Glu Asn Tyr His Val Thr
85 90 95
Val Phe Lys Asn Arg Val Phe Val Arg Ser Gly Leu Glu Leu Gly Pro
100 105 110
Ser Ser Ser Arg Ser Lys Ser Arg Ser Glu Glu Leu Leu Pro Leu Glu
115 120 125
Glu Pro Arg Ser Leu Ser Arg Arg Phe Ser Gly Gln Leu Ser Phe Ile
130 135 140
Asp Ser Glu Thr Lys Asp His Lys Pro Pro Thr Leu Lys Ser Pro Met
145 150 155 160
Arg Lys Ser Ser Ser Val Lys Lys Thr Phe Ser Met Asn Leu Met Gly
165 170 175
Asp His Thr Lys Gln Asn Gln Asp Ser Glu Glu Lys His Glu Arg Gln
180 185 190
Arg Lys Pro Val Ser Glu Pro Pro Arg Ile Gln Pro Pro Leu Arg Thr
195 200 205
Arg Ser Glu Pro Arg Ala Pro Pro Pro Pro Pro Pro Pro Leu Leu Ser
210 215 220
Pro Ser Pro Leu Arg Leu Pro Pro Arg Glu Thr Lys Arg Gln Ser Ser
225 230 235 240
Glu His Thr Ser Arg Lys Asp Asp Ser Thr Ala Asp Ala Trp Glu Lys
245 250 255
Ala Glu Leu Ser Lys Ile Lys Ala Arg Tyr Glu Lys Leu Asn Arg Lys
260 265 270
Ile Asp Leu Trp Glu Ala Lys Lys Arg Glu Lys Ala Arg Arg Lys Leu
275 280 285
Asp Ile Ser Glu Gln Ser Glu Leu Glu Gln Arg Arg Lys Arg Gly Leu
290 295 300
Gln Arg Phe Arg Glu Asp Thr Glu Tyr Ile Glu Gln Ile Ala Ala Gly
305 310 315 320
Ala Arg Ala Gln Ala Glu Lys Asp Arg Gln Ser Lys Glu Phe Lys Val
325 330 335
Lys Glu Lys Ala Gly Val Ile Arg Ser Thr Gly Lys Leu Pro Gly Asn
340 345 350
Ala Cys Cys Phe
355
<210>264
<211>540
<212>DNA
<213>稻
<400>264
atggagaccc aggaggcgaa gagagcagat gtggcggcgg cgccggcgac ggcgaccggc 60
ggtgaggccg tcaaaccggc cgccggcgat gctggcgcag taaccaagac gaatggacct 120
tcagcaccag caggcaaagc tgcaactcca acgggttcgg ttgacagaga cgccatactc 180
gcaaacgtgg agctggagag gaaactgtca atgatcaagg cgtgggagga gagcgagaag 240
agcaaagcgg agaacaaggc tcagaagaag atgtcatcca tactctcatg ggagaacacg 300
aggaaggcag ctatagaagc aaaactgcga acacaagagg agaagctgga gaggaagaag 360
gcggagtacg cggagaagat gaggaaccag gtagcggcga tccacaaggc ggcggaggag 420
aagagggcga cggtggaggc gacgcggcac gaggagataa tcaagtatga ggagatggcc 480
gccaagcaca ggtccaaggg gactacaccc accaaattcc tctcttgttt cggctcctag 540
<210>265
<211>179
<212>PRT
<213>稻
<400>265
Met Glu Thr Gln Glu Ala Lys Arg Ala Asp Val Ala Ala Ala Pro Ala
1 5 10 15
Thr Ala Thr Gly Gly Glu Ala Val Lys Pro Ala Ala Gly Asp Ala Gly
20 25 30
Ala Val Thr Lys Thr Asn Gly Pro Ser Ala Pro Ala Gly Lys Ala Ala
35 40 45
Thr Pro Thr Gly Ser Val Asp Arg Asp Ala Ile Leu Ala Asn Val Glu
50 55 60
Leu Glu Arg Lys Leu Ser Met Ile Lys Ala Trp Glu Glu Ser Glu Lys
65 70 75 80
Ser Lys Ala Glu Asn Lys Ala Gln Lys Lys Met Ser Ser Ile Leu Ser
85 90 95
Trp Glu Asn Thr Arg Lys Ala Ala Ile Glu Ala Lys Leu Arg Thr Gln
100 105 110
Glu Glu Lys Leu Glu Arg Lys Lys Ala Glu Tyr Ala Glu Lys Met Arg
115 120 125
Asn Gln Val Ala Ala Ile His Lys Ala Ala Glu Glu Lys Arg Ala Thr
130 135 140
Val Glu Ala Thr Arg His Glu Glu Ile Ile Lys Tyr Glu Glu Met Ala
145 150 155 160
Ala Lys His Arg Ser Lys Gly Thr Thr Pro Thr Lys Phe Leu Ser Cys
165 170 175
Phe Gly Ser
<210>266
<211>612
<212>DNA
<213>稻
<400>266
atggccgggg aggcattgaa ggaggcgggg gcgacgcccg ccgcagcgaa cgcgggggag 60
gagaaggccg tcatcccggc ggcttcgaca tcgccggtga tctccaagac cgatgatgac 120
acggagccgc cggccgatga ctccaaggct ctcgtcgtct tcgtcgagaa ggttgctgat 180
aaacctcatg ctgagaaggc aacagcaaca gcaacaccaa caaggacctc aaatgacaga 240
gatattgccc ttgcaaaggt ggagacagac aagcgagaat cgttgatcaa agcatgggag 300
gagaacgaaa aggcaaaagc ggagaacagg gcctctaaga agttattgga tattatttca 360
tgggagaaca caaagaaggc agtaataaaa actcaactga aaaagaagga agaagagttg 420
gaaaggaaga aggcagagta cgctgagaag gcgaagaaca aggaagcaat cgtccataag 480
gaagctgaag aaaagagagc aatggtgatg gcccggcgcg gtgaagaagt gatcaaggcc 540
gaggagatag cagctaagta ccgtgcaacc ggagtgacac cgaagaaaca tatcgggtgt 600
tttggggcat aa 612
<210>267
<211>203
<212>PRT
<213>稻
<400>267
Met Ala Gly Glu Ala Leu Lys Glu Ala Gly Ala Thr Pro Ala Ala Ala
1 5 10 15
Asn Ala Gly Glu Glu Lys Ala Val Ile Pro Ala Ala Ser Thr Ser Pro
20 25 30
Val Ile Ser Lys Thr Asp Asp Asp Thr Glu Pro Pro Ala Asp Asp Ser
35 40 45
Lys Ala Leu Val Val Phe Val Glu Lys Val Ala Asp Lys Pro His Ala
50 55 60
Glu Lys Ala Thr Ala Thr Ala Thr Pro Thr Arg Thr Ser Asn Asp Arg
65 70 75 80
Asp Ile Ala Leu Ala Lys Val Glu Thr Asp Lys Arg Glu Ser Leu Ile
85 90 95
Lys Ala Trp Glu Glu Asn Glu Lys Ala Lys Ala Glu Asn Arg Ala Ser
100 105 110
Lys Lys Leu Leu Asp Ile Ile Ser Trp Glu Asn Thr Lys Lys Ala Val
115 120 125
Ile Lys Thr Gln Leu Lys Lys Lys Glu Glu Glu Leu Glu Arg Lys Lys
130 135 140
Ala Glu Tyr Ala Glu Lys Ala Lys Asn Lys Glu Ala Ile Val His Lys
145 150 155 160
Glu Ala Glu Glu Lys Arg Ala Met Val Met Ala Arg Arg Gly Glu Glu
165 170 175
Val Ile Lys Ala Glu Glu Ile Ala Ala Lys Tyr Arg Ala Thr Gly Val
180 185 190
Thr Pro Lys Lys His Ile Gly Cys Phe Gly Ala
195 200
<210>268
<211>1013
<212>DNA
<213>稻
<400>268
acatcatccc tccgcgcaaa agcctatcaa cagctaagcc aaacagggtc aggagccgga 60
gccgtccggg agagggaaca ctcgagcgat ccgtccgtcc gcccgcccgt cgtcgtcgcg 120
cgccatggct gaggaggagg ccaagaaggt ggaggtggag gtcaccgagg cgccacccgc 180
cgctgccgct gccgcggaga cggagccggc tgccaaggac gtcgccgagg agaaggccgt 240
catccccgcc cccgcgccgc cggccgagga ggagaagcct cccgtcgacg actccaaggc 300
gctggccatc gtcgagaagg ttgcagatga acctcctgcc gagaaacctg ctcaaggggg 360
ctctaatgac agagatgttg ctcttgcaag ggtggaaact gagaagagga actcattgat 420
caaagcatgg gaggaaaatg agaagacaaa agctgagaac aaggcttcga agaagctatc 480
tgctattctt tcctgggaga acacaaagaa agcaaacata gaagctcaac tgaagaagat 540
tgaggagcaa ctggaaaaga agaaggctga atatgcagag aagatgaaga acaaagtcgc 600
gatcgtccac aaggaagctg aggagaagag agcaatggtc gaggcaaagc gcggcgagga 660
agtcctaaag gccgaggaga tggcagccaa gtaccgtgcc accggccatg ctcccaagaa 720
actcatcggg tgctttgggg cctaaagaaa ttttcgattc acaacgagca aacgtgaaag 780
tgttcatcag tggttgcttt gcttctttca ccctcccaag tgcgtagtgt gtttgttggt 840
gcaagaaagg tcgtgcctgg tgtgtaaagt ctggtgttgc tgtatataac atattactcc 900
caagacagat atgtttggtg ctgtacatgt ttgatgcttg acaggcaaca ttcttatgtg 960
tagttaagaa gccacattgt tattgttatt gacagtaagc tgtttgttct ttt 1013
<210>269
<211>206
<212>PRT
<213>稻
<400>269
Met Ala Glu Glu Glu Ala Lys Lys Val Glu Val Glu Val Thr Glu Ala
1 5 10 15
Pro Pro Ala Ala Ala Ala Ala Ala Glu Thr Glu Pro Ala Ala Lys Asp
20 25 30
Val Ala Glu Glu Lys Ala Val Ile Pro Ala Pro Ala Pro Pro Ala Glu
35 40 45
Glu Glu Lys Pro Pro Val Asp Asp Ser Lys Ala Leu Ala Ile Val Glu
50 55 60
Lys Val Ala Asp Glu Pro Pro Ala Glu Lys Pro Ala Gln Gly Gly Ser
65 70 75 80
Asn Asp Arg Asp Val Ala Leu Ala Arg Val Glu Thr Glu Lys Arg Asn
85 90 95
Ser Leu Ile Lys Ala Trp Glu Glu Asn Glu Lys Thr Lys Ala Glu Asn
100 105 110
Lys Ala Ser Lys Lys Leu Ser Ala Ile Leu Ser Trp Glu Asn Thr Lys
115 120 125
Lys Ala Asn Ile Glu Ala Gln Leu Lys Lys Ile Glu Glu Gln Leu Glu
130 135 140
Lys Lys Lys Ala Glu Tyr Ala Glu Lys Met Lys Asn Lys Val Ala Ile
145 150 155 160
Val His Lys Glu Ala Glu Glu Lys Arg Ala Met Val Glu Ala Lys Arg
165 170 175
Gly Glu Glu Val Leu Lys Ala Glu Glu Met Ala Ala Lys Tyr Arg Ala
180 185 190
Thr Gly His Ala Pro Lys Lys Leu Ile Gly Cys Phe Gly Ala
195 200 205
<210>270
<211>1021
<212>DNA
<213>稻
<400>270
agttcgtgtg cttctctcat ttgttccttg atatatttgc tacgtcgtca gagaactcgt 60
gcagatagct tctttggctg agttgttgga gatggcggag gtggcgccgc cggcgccggc 120
gccggagccg accaaggaca tcgccgagga gagggccgcc gtgccggcgc cggaggagtc 180
gaaggccatg accgtcgtcg atgatgctga gaaagctgca gcaacaggtg gctcacacga 240
aagagacgct ctcctgacga cggtcgccac ggagaagagg atatcgctga tcaaggcgtg 300
ggaggagaac gaaaaggcca aggccgacaa caaggcggcc aagaagttgg ccgacatcgc 360
ctcatgggag aactccaagg tggccgagat cgaggccgag attaagaagt accaagtaag 420
ttcagctcag ctaagttcat caacaagcag aacaaggaga gatcaattat gtgtgtgtga 480
atcattgagt tgatcgatcg gttcatatat atgcaggagt acctggagag gaagaaggcg 540
gagcaggtgg agaagttgat gaacggcgtg gcgaaggtgc acagggcggc ggaggagaag 600
cgagcggcga cggaggcgcg gcgaggggag gaggtggtga aggccgagga ggccgcagca 660
aagtaccgcg ccaagggaga gccgcccaag aagttgctct tcggttgaat ctcttctcgg 720
tcatctccat tgatcgtcgt cgtcgtcgtc gttgttgtaa atgtgtgtgc gacagtgtga 780
gtgtaccggt gtcaagttca gatagctagt ggttggatgt attttctcag ttgtttgttt 840
tcgtttaatt tcatgtacag ggcagctatt gcagtctcat gtgaaaaagg gaacatttat 900
tatgtacaga catgatgttt tggggtcttt attcggattc ggcggtgaaa ttgtaacatt 960
tttgtgcctg tggtacttgg ctagtactca tgtataagag gcttacccat ttgacattat 1020
t 1021
<210>271
<211>153
<212>PRT
<213>稻
<400>271
Tyr Ile Cys Tyr Val Val Arg Glu Leu Val Gln Ile Ala Ser Leu Ala
1 5 10 15
Glu Leu Leu Glu Met Ala Glu Val Ala Pro Pro Ala Pro Ala Pro Glu
20 25 30
Pro Thr Lys Asp Ile Ala Glu Glu Arg Ala Ala Val Pro Ala Pro Glu
35 40 45
Glu Ser Lys Ala Met Thr Val Val Asp Asp Ala Glu Lys Ala Ala Ala
50 55 60
Thr Gly Gly Ser His Glu Arg Asp Ala Leu Leu Thr Thr Val Ala Thr
65 70 75 80
Glu Lys Arg Ile Ser Leu Ile Lys Ala Trp Glu Glu Asn Glu Lys Ala
85 90 95
Lys Ala Asp Asn Lys Ala Ala Lys Lys Leu Ala Asp Ile Ala Ser Trp
100 105 110
Glu Asn Ser Lys Val Ala Glu Ile Glu Ala Glu Ile Lys Lys Tyr Gln
115 120 125
Val Ser Ser Ala Gln Leu Ser Ser Ser Thr Ser Arg Thr Arg Arg Asp
130 135 140
Gln Leu Cys Val Cys Glu Ser Leu Ser
145 150
<210>272
<211>981
<212>DNA
<213>稻
<400>272
gcttccactc ttctcctcca cctccaagaa ccccgcatcc atccatggcc accaccgccc 60
tctgatccga tcgatactga tcagccagta gctatgctgg gttcggacca gctcgagcac 120
cgcccggcgc cgtcggctcc ccgcgccgag ccggacgatg tcgccgacga cgtggaggtg 180
gaggcgttcc gggacatcca cccggagccg tcgcctccgc atctaccgcc gccgccgctc 240
aggcagccgt cgtgggacgc cgcgagccac cgctcgctgt cgtcctccgg cgcgggcggc 300
ggcggcgacg tcgagctgtt cgccaccatg agccgcgagt tcaccgccat ggtggcggcc 360
gggtcgtcgt ccgcgcccag ccccgacgtt cccggcgacg cccccgccgc cgccgacctg 420
aacctgctgc agctggcgcg catcggcgag aacgagccgg cggccgaggc gaacgcgctc 480
gccatcgtgc cggcggcggc gggcagcggc ccgccggcgc cggtggagca ggtgaagaag 540
gaggaggtgg aggcgaaggt ggcggcgtgg caggcggagg aggtggccaa gatcaacaac 600
aagttcaagc gcgaggaggt cgtcatcaat ggctgggaga gccagcaagt cgacaaggcc 660
accgcctggc tcgccaagat cgagaggaag ctggaggagg agcgggcgaa ggcgacggag 720
aaggctcgca acgaggcggc ggcggcgcgg cggaaggcgg aggagcggcg ggcgtcggcg 780
gaggcgcggc gcgggaggaa gacggcagag gt gctcgacc gtgccaacttctgcaaggcc 840
gccggcaggg tgccatccaa gcgctccttc ttctccttct aaagttctaa ccaaagctag 900
ctagccttgc tcaattatat catctctagc tagctaatta tgattattac ttgttttcta 960
cttaattgat caatcaattt c 981
<210>273
<211>262
<212>PRT
<213>稻
<400>273
Met Leu Gly Ser Asp Gln Leu Glu His Arg Pro Ala Pro Ser Ala Pro
1 5 10 15
Arg Ala Glu Pro Asp Asp Val Ala Asp Asp Val Glu Val Glu Ala Phe
20 25 30
Arg Asp Ile His Pro Glu Pro Ser Pro Pro His Leu Pro Pro Pro Pro
35 40 45
Leu Arg Gln Pro Ser Trp Asp Ala Ala Ser His Arg Ser Leu Ser Ser
50 55 60
Ser Gly Ala Gly Gly Gly Gly Asp Val Glu Leu Phe Ala Thr Met Ser
65 70 75 80
Arg Glu Phe Thr Ala Met Val Ala Ala Gly Ser Ser Ser Ala Pro Ser
85 90 95
Pro Asp Val Pro Gly Asp Ala Pro Ala Ala Ala Asp Leu Asn Leu Leu
100 105 110
Gln Leu Ala Arg Ile Gly Glu Asn Glu Pro Ala Ala Glu Ala Asn Ala
115 120 125
Leu Ala Ile Val Pro Ala Ala Ala Gly Ser Gly Pro Pro Ala Pro Val
130 135 140
Glu Gln Val Lys Lys Glu Glu Val Glu Ala Lys Val Ala Ala Trp Gln
145 150 155 160
Ala Glu Glu Val Ala Lys Ile Asn Asn Lys Phe Lys Arg Glu Glu Val
165 170 175
Val Ile Asn Gly Trp Glu Ser Gln Gln Val Asp Lys Ala Thr Ala Trp
180 185 190
Leu Ala Lys Ile Glu Arg Lys Leu Glu Glu Glu Arg Ala Lys Ala Thr
195 200 205
Glu Lys Ala Arg Asn Glu Ala Ala Ala Ala Arg Arg Lys Ala Glu Glu
210 215 220
Arg Arg Ala Ser Ala Glu Ala Arg Arg Gly Arg Lys Thr Ala Glu Val
225 230 235 240
Leu Asp Arg Ala Asn Phe Cys Lys Ala Ala Gly Arg Val Pro Ser Lys
245 250 255
Arg Ser Phe Phe Ser Phe
260
<210>274
<211>1031
<212>DNA
<213>稻
<400>274
cgttgtccat cacaattgct aattaactaa gacacccttc cttgattgtg acactagcac 60
gacgcacttt cctctatata catatacata tatcctcctt ctgtccagct aacggtttat 120
atgcttagct agctgtttgt tttggcgata ccatttgcat tgcttgccca gcatcgtcgt 180
cgtcgtcgtc gggagcaagg aggaggagag accatcgatc ttgattgatt tgaagctaga 240
tggcggagga ggcgaagaag gtggaggtga ccaaggacat cgccgaagag aaggcagtgg 300
tgccgctgcc gacgccgccg gccaccgagc acgacgactc caaggccatc gtcctcgtca 360
aggaagctga ggctacagga ggttcagctg aaagagatgc ttatctcgca aaaattgtgt 420
cggagaagag attggtactg atcaatgcct gggaggaaag cgagaaagct agagcagaga 480
acagggcggc caagaagctg tcatacatca cttcatggga gaatgcaaag aaagcagaga 540
tggaggctga gctgaaaagg atcgagcaag aactggagaa gaagaaggcg gcgtacgaag 600
agaagctgaa gaacaagctg gcattgctgc acaagacggc ggaggagaag agggcgctca 660
ccacggcgaa gcgtggcgag gagctgatca tggcggagga gatggccgcc aagtaccgtg 720
caaagggcga ggctccgacg aagctgttcg ggctcttgaa agcctgagag aaatcatgag 780
gagttcatca tacatatatg ctgggatttg gtgttgttga ttagtctgtg aacttacaga 840
aatttgtata tgtgcaatgc atggcatccg tgtttgcgtc gtgtgtatgt cgtctaattg 900
aagggccatt tggtttgtat tttgtcagtt gggtggtttg atttctggtg cgttttgtaa 960
aggaattgtg tatatgcata ggggagtgca ggcaggggat gatggattat gaatacgctt 1020
attctttcat g 1031
<210>275
<211>175
<212>PRT
<213>稻
<400>275
Met Ala Glu Glu Ala Lys Lys Val Glu Val Thr Lys Asp Ile Ala Glu
1 5 10 15
Glu Lys Ala Val Val Pro Leu Pro Thr Pro Pro Ala Thr Glu His Asp
20 25 30
Asp Ser Lys Ala Ile Val Leu Val Lys Glu Ala Glu Ala Thr Gly Gly
35 40 45
Ser Ala Glu Arg Asp Ala Tyr Leu Ala Lys Ile Val Ser Glu Lys Arg
50 55 60
Leu Val Leu Ile Asn Ala Trp Glu Glu Ser Glu Lys Ala Arg Ala Glu
65 70 75 80
Asn Arg Ala Ala Lys Lys Leu Ser Tyr Ile Thr Ser Trp Glu Asn Ala
85 90 95
Lys Lys Ala Glu Met Glu Ala Glu Leu Lys Arg Ile Glu Gln Glu Leu
100 105 110
Glu Lys Lys Lys Ala Ala Tyr Glu Glu Lys Leu Lys Asn Lys Leu Ala
115 120 125
Leu Leu His Lys Thr Ala Glu Glu Lys Arg Ala Leu Thr Thr Ala Lys
130 135 140
Arg Gly Glu Glu Leu Ile Met Ala Glu Glu Met Ala Ala Lys Tyr Arg
145 150 155 160
Ala Lys Gly Glu Ala Pro Thr Lys Leu Phe Gly Leu Leu Lys Ala
165 170 175
<210>276
<211>1526
<212>DNA
<213>稻
<400>276
accactcacc accacagctc agctcggaga agcgaagagg aggaagaaga gcaagacgcc 60
gatggttacg cgtgtgtgct agtggctgag cactagcggc ggcggcggcg gcgacggcga 120
cgacgacctc acccacggcg gcgacacatg ttgagtgaac aaacggcggc tagtggtagc 180
agcagcagca gccgcggcgc cgacgaccgg gagattgtca tcagcaccgg ccgggagatc 240
gtcgtcagaa gcagcggggg tgaggagagg gaggaggagg tggtggtgga ggaggagctc 300
gaggagccgg agttcaggga catccacgcg ctgagcccgc cgccgacgcc gacgccgagc 360
cagccgtcgt cgtcgtacca ccggcggagg agggagtcgt gggagtccgc ggcggggagc 420
aggcacacgt cgatccgctc cgtggggagc gacaccgccc caagtgagct cttccctact 480
atgagcaggg agttctcggc catggtcgcc gcagcagcca acgccaacgc cgccgccgcc 540
gcagccgcga acggcggcga ctccagccgc gccggggtgg acgacgcgct ggggaggatc 600
ggggaggatg agctcgagga gacgaacccg ctcgccatcg tcccggacag caaccccatc 660
ccgtcccctc gccgcgccca cctcgcgctc cccgcccccg gcgacgtgtc gtcggcgggc 720
ggcggccacg gcgacgaggt gtcggtgggg caggtgaaga aggaggaggt ggagtccaag 780
atcgccgcgt ggcagatcgc cgaggtcgcc aaggtcaaca accgcttcaa gcgcgaggag 840
gtcgtcatca atggctggga gggcgaccag gtcgagaagg ccaacgcctg gctcaagaag 900
tacgagagga agctggagga gaagagggcc aaggcgatgg agaaggcgca gaacgaggtg 960
gcgaaggcgc ggcggaaggc ggaggagaag cgggcgtcgg cggaggcgaa gaggggcacc 1020
aaggtggcgc gcgtgctgga gctcgccaac ttcatgaggg ccgtggggag ggcgccatcc 1080
aagcgctcct tcttctgagc gaccgcgcca ccctcttccc ctcctcctcc tcctctctgc 1140
tttgctcgcc gccgtcgccg tcgtcgtcgt cgccggcgcc ggcggctgat cgttcaccgc 1200
ttcgcttcac acgcagggat cagtgctgtg atgtggttgc tgtgtggaac tctcgtttta 1260
gtgttgtatc cacatgtatg atgtactgtc atcatatcct ctcttttttt tctttttttc 1320
ttgttctctt tactttcttg tgcttgataa gggtattgca aagttgggag ggacagacag 1380
aacaagtaaa tagcataagt tggatggtgc tctgcccctt atagcttatg gtgaggggga 1440
caagagctgc ctgtaatttg ttttttgtca tcatcaagga ttgtgtatgt caatatgaac 1500
aagatatgga gctacctgtt ttgtgt 1526
<210>277
<211>316
<212>PRT
<213>稻
<400>277
Met Leu Ser Glu Gln Thr Ala Ala Ser Gly Ser Ser Ser Ser Ser Arg
1 5 10 15
Gly Ala Asp Asp Arg Glu Ile Val Ile Ser Thr Gly Arg Glu Ile Val
20 25 30
Val Arg Ser Ser Gly Gly Glu Glu Arg Glu Glu Glu Val Val Val Glu
35 40 45
Glu Glu Leu Glu Glu Pro Glu Phe Arg Asp Ilc His Ala Leu Ser Pro
50 55 60
Pro Pro Thr Pro Thr Pro Ser Gln Pro Ser Ser Ser Tyr His Arg Arg
65 70 75 80
Arg Arg Glu Ser Trp Glu Ser Ala Ala Gly Ser Arg His Thr Ser Ile
85 90 95
Arg Ser Val Gly Ser Asp Thr Ala Pro Ser Glu Leu Phe Pro Thr Met
100 105 110
Ser Arg Glu Phe Ser Ala Met Val Ala Ala Ala Ala Asn Ala Asn Ala
115 120 125
Ala Ala Ala Ala Ala Ala Asn Gly Gly Asp Ser Ser Arg Ala Gly Val
130 135 140
Asp Asp Ala Leu Gly Arg Ile Gly Glu Asp Glu Leu Glu Glu Thr Asn
145 150 155 160
Pro Leu Ala Ile Val Pro Asp Ser Asn Pro Ile Pro Ser Pro Arg Arg
165 170 175
Ala His Leu Ala Leu Pro Ala Pro Gly Asp Val Ser Ser Ala Gly Gly
180 185 190
Gly His Gly Asp Glu Val Ser Val Gly Gln Val Lys Lys Glu Glu Val
195 200 205
Glu Ser Lys Ile Ala Ala Trp Gln Ile Ala Glu Val Ala Lys Val Asn
210 215 220
Asn Arg Phe Lys Arg Glu Glu Val Val Ile Asn Gly Trp Glu Gly Asp
225 230 235 240
Gln Val Glu Lys Ala Asn Ala Trp Leu Lys Lys Tyr Glu Arg Lys Leu
245 250 255
Glu Glu Lys Arg Ala Lys Ala Met Glu Lys Ala Gln Asn Glu Val Ala
260 265 270
Lys Ala Arg Arg Lys Ala Glu Glu Lys Arg Ala Ser Ala Glu Ala Lys
275 280 285
Arg Gly Thr Lys Val Ala Arg Val Leu Glu Leu Ala Asn Phe Met Arg
290 295 300
Ala Val Gly Arg Ala Pro Ser Lys Arg Ser Phe Phe
305 310 315
<210>278
<211>1234
<212>DNA
<213>稻
<400>278
gcaccacctc agctcgccag cagcaaccac ggcggcgctt cggatgcacg gcggcggagc 60
ctccacgacg accaccgcca tcgccgccgc gcgggtagca catgttgcat gagcagcacg 120
cgccgccgcc gcagccggag ccggaggttt cgctacagct gtcggcgccc gccaccgccg 180
ccgacgatgt cgctgcaggc gacgacgagg aggtcaccgt cgtcaccacg taccgcgaca 240
tccaccctct gacgccgccg tcgccgacga cgacgacgac gccacccacg cggctcgggt 300
ccgccgcgta ctcgtgggac acggccagca gccaccggtc cgtgtcgtcc gaggagcagt 360
tcatgacgat gagccgggag ttcacggcca tggtcgccgc cgggacgacc atgcagactg 420
gccccaacga cggcaacaac ggcggtgacc agctcaccag catcggcgag gacgagctgg 480
aggagaccaa cccgctggca attgtgccgg acagccaccc gatcgccacg ccggccagga 540
gcagggcgtc ccagctggag gttgtccccg cggcagggcc atcgccggcg ccgccggtgg 600
aggcgaggca ggtgaagaag gaggaggtgg agacgaaggt gtcggcgtgg cagacggcgg 660
aggtggccaa gatcaacaac cggttcaaga gggaggaggt tgtcatcaac gggtgggaga 720
ccgagcaggt cgagaaagca tccgcatggc tcaagaagat cgagagaaag ctggacgagc 780
agcgcgccaa ggcgctggag aggacgcaga acgacatcgc gaaggcgcgg cgcaaggcgg 840
aggagaagag ggcgtcggcg gaggcgaaga gaggcctcaa gctcgccaag gtgctcgagc 900
tcgccaactt catgaaggct gttgggaggg tgcctaccaa gcgatccttc ttctagcttc 960
ctgcagccag cctctgcaaa ccttcgatct tgatcgatct gctgctgctc tgtttctttc 1020
agtgcctttt gtgtgctgga ttaatctagc tgccgttctt cgtgtgatgt ttgcttagct 1080
gtgcgcatcc gagaacctaa ttgtaaaaaa gattttaaaa caagttgtat atttgctgtt 1140
gctgctgttg ccctctgctg cttgtgatca cagagtggcc cttgtttttc ccctggcttg 1200
tattatccat acggcataaa tggtttgttt gctc 1234
<210>279
<211>284
<212>PRT
<213>稻
<400>279
Met Leu His Glu Gln His Ala Pro Pro Pro Gln Pro Glu Pro Glu Val
1 5 10 15
Ser Leu Gln Leu Ser Ala Pro Ala Thr Ala Ala Asp Asp Val Ala Ala
20 25 30
Gly Asp Asp Glu Glu Val Thr Val Val Thr Thr Tyr Arg Asp Ile His
35 40 45
Pro Leu Thr Pro Pro Ser Pro Thr Thr Thr Thr Thr Pro Pro Thr Arg
50 55 60
Leu Gly Ser Ala Ala Tyr Ser Trp Asp Thr Ala Ser Ser His Arg Ser
65 70 75 80
Val Ser Ser Glu Glu Gln Phe Met Thr Met Ser Arg Glu Phe Thr Ala
85 90 95
Met Val Ala Ala Gly Thr Thr Met Gln Thr Gly Pro Asn Asp Gly Asn
100 105 110
Asn Gly Gly Asp Gln Leu Thr Ser Ile Gly Glu Asp Glu Leu Glu Glu
115 120 125
Thr Asn Pro Leu Ala Ile Val Pro Asp Ser His Pro Ile Ala Thr Pro
130 135 140
Ala Arg Ser Arg Ala Ser Gln Leu Glu Val Val Pro Ala Ala Gly Pro
145 150 155 160
Ser Pro Ala Pro Pro Val Glu Ala Arg Gln Val Lys Lys Glu Glu Val
165 170 175
Glu Thr Lys Val Ser Ala Trp Gln Thr Ala Glu Val Ala Lys Ile Asn
180 185 190
Asn Arg Phe Lys Arg Glu Glu Val Val Ile Asn Gly Trp Glu Thr Glu
195 200 205
Gln Val Glu Lys Ala Ser Ala Trp Leu Lys Lys Ile Glu Arg Lys Leu
210 215 220
Asp Glu Gln Arg Ala Lys Ala Leu Glu Arg Thr Gln Asn Asp Ile Ala
225 230 235 240
Lys Ala Arg Arg Lys Ala Glu Glu Lys Arg Ala Ser Ala Glu Ala Lys
245 250 255
Arg Gly Leu Lys Leu Ala Lys Val Leu Glu Leu Ala Asn Phe Met Lys
260 265 270
Ala Val Gly Arg Val Pro Thr Lys Arg Ser Phe Phe
275 280
<210>280
<211>717
<212>DNA
<213>稻
<400>280
atggacggcg acttgaagaa gctaagggtt cgatttcctg gattaggaaa gggaaacaaa 60
ggtggcagac aggctccaac aatactgcaa gaagaagaca catctcttca aagagccaat 120
gtatctgtaa ggaggccact taaaccagca caaagaaagc aagaggacat agcttcagat 180
cagaaggtgc cacccaagat ggttgattct tctctgagcg cgaagaaagg ttcgggttcc 240
tctagcaaat tgcaagacaa gaaagggagc aagaagtttg agcaagagca ggtgattcag 300
aagaccccat ccaccacaag gccagcaaca tcgtatcatt ctagacggaa tggagatggt 360
actgttggat taactgctgt tggcccagca gacaccaaaa ctaatgaatg ggagaaggcg 420
aagctcgcta gcattacgga agagtataag aacatgatgg ataccatagc tgaatgggag 480
aatgagaaga aggtgaaggc taagcgccaa aaagagcaaa aagagaaagt gttggaccaa 540
aagagagcaa aggcactaga agaatacagc caggaaataa caaggatcaa caaaattgct 600
ggaggagcaa ggacaatggc agaggaaagg aaatataacg atgagaaaaa gatcaaagaa 660
aaggcaaata aaagacggtt atcggaaaag gctccccgcg catgcgcttg cttttaa 717
<210>281
<211>238
<212>PRT
<213>稻
<400>281
Met Asp Gly Asp Leu Lys Lys Leu Arg Val Arg Phe Pro Gly Leu Gly
1 5 10 15
Lys Gly Asn Lys Gly Gly Arg Gln Ala Pro Thr Ile Leu Gln Glu Glu
20 25 30
Asp Thr Ser Leu Gln Arg Ala Asn Val Ser Val Arg Arg Pro Leu Lys
35 40 45
Pro Ala Gln Arg Lys Gln Glu Asp Ile Ala Ser Asp Gln Lys Val Pro
50 55 60
Pro Lys Met Val Asp Ser Ser Leu Ser Ala Lys Lys Gly Ser Gly Ser
65 70 75 80
Ser Ser Lys Leu Gln Asp Lys Lys Gly Ser Lys Lys Phe Glu Gln Glu
85 90 95
Gln Val Ile Gln Lys Thr Pro Ser Thr Thr Arg Pro Ala Thr Ser Tyr
100 105 110
His Ser Arg Arg Asn Gly Asp Gly Thr Val Gly Leu Thr Ala Val Gly
115 120 125
Pro Ala Asp Thr Lys Thr Asn Glu Trp Glu Lys Ala Lys Leu Ala Ser
130 135 140
Ile Thr Glu Glu Tyr Lys Asn Met Met Asp Thr Ile Ala Glu Trp Glu
145 150 155 160
Asn Glu Lys Lys Val Lys Ala Lys Arg Gln Lys Glu Gln Lys Glu Lys
165 170 175
Val Leu Asp Gln Lys Arg Ala Lys Ala Leu Glu Glu Tyr Ser Gln Glu
180 185 190
Ile Thr Arg Ile Asn Lys Ile Ala Gly Gly Ala Arg Thr Met Ala Glu
195 200 205
Glu Arg Lys Tyr Asn Asp Glu Lys Lys Ile Lys Glu Lys Ala Asn Lys
210 215 220
Arg Arg Leu Ser Glu Lys Ala Pro Arg Ala Cys Ala Cys Phe
225 230 235
<210>282
<211>1242
<212>DNA
<213>稻
<400>282
ggaggtggca gtagcagctg gcatcctcct cctctgatct cctcctcggt cacttcagtg 60
cttacttgcc ggtgatgagg aggtcttctc aggggaagag ctccagcggc ggcggcgttg 120
gcggcgtacg gaggtatgac gtgcacggtg gtggtaactt gctggcctgc tacgcgaagg 180
cggcgaggcc gaggccgtcc aagtgggacg acgcgcagaa gtggctctcc cgggcgggcg 240
acgacgactg cggcggcgaa gctacccggc ggaggagctc ctgcgccagc gccgacgacg 300
ggctgctgct gcctcctccg ccggcggcgc ggaagggggc cggcggctgg cgatcgtgga 360
gcaacgtgga atgggagggc gcgcccgcgg cgatggcgcc ggcgctgaag gccgcgcgcg 420
gcgacgaggg ggtggacacc aaggtggtgg acgccgtgca ggcgtacgtg ccgcagcggt 480
gcgtggtgtc gctgagggac gtcggcacgg agatgacgcc cggcgggagc aaggagccgt 540
cgagggcgaa cactccccgc gtcgtcgcgc cggcggcgac cgcccgtgtc gtcgcgcggg 600
gcacggcttc gcctgggcaa tgcgacggcg ggtcgcgtga cagcgccgtc gccggcggcg 660
tggtggatct ccgggcggct cgcaagcgcg ccgatcaggg gcacgacgaa gtcgcgggca 720
cgatcacggc cgtgtcgccc gcgacggcgt ggggcgacgc ggagcgcgcc aagtacatgg 780
ccaggtacag gcgcgaggag atgagaatcc aggcgtggga gaaccgggag cggcggaagg 840
cggagctgca gatgcggacg gcggaggaga aggccgagcg gatgaggctg cgcgcgcagg 900
cgaggacggc ggggaagctg gcgacggcgc aggcggaggc caaggcgcgg cgcgcgcgcg 960
ccgaggccga gctggcgctg ggccgcccgg gaggcggtgc caagggttgg ctgctcacgc 1020
ggagcgcgag ctggagcagc ggcagcggcc gctcgccctc ctctctctcg ctccggttgc 1080
cgctgctgtg ccgctgagaa aaatccactg ccacagtcaa aaggctcgtg atcgatctga 1140
gagtttccgc tgcttgttga aggcggtttc tgatgtacta ctagtaccag gcacagaaga 1200
attttatctt tgtaccatca atgaagaccc gtttagtttc cc 1242
<210>283
<211>340
<212>PRT
<213>稻
<400>283
Met Arg Arg Ser Ser Gln Gly Lys Ser Ser Ser Gly Gly Gly Val Gly
1 5 10 15
Gly Val Arg Arg Tyr Asp Val His Gly Gly Gly Asn Leu Leu Ala Cys
20 25 30
Tyr Ala Lys Ala Ala Arg Pro Arg Pro Ser Lys Trp Asp Asp Ala Gln
35 40 45
Lys Trp Leu Ser Arg Ala Gly Asp Asp Asp Cys Gly Gly Glu Ala Thr
50 55 60
Arg Arg Arg Ser Ser Cys Ala Ser Ala Asp Asp Gly Leu Leu Leu Pro
65 70 75 80
Pro Pro Pro Ala Ala Arg Lys Gly Ala Gly Gly Trp Arg Ser Trp Ser
85 90 95
Asn Val Glu Trp Glu Gly Ala Pro Ala Ala Met Ala Pro Ala Leu Lys
100 105 110
Ala Ala Arg Gly Asp Glu Gly Val Asp Thr Lys Val Val Asp Ala Val
115 120 125
Gln Ala Tyr Val Pro Gln Arg Cys Val Val Ser Leu Arg Asp Val Gly
130 135 140
Thr Glu Met Thr Pro Gly Gly Ser Lys Glu Pro Ser Arg Ala Asn Thr
145 150 155 160
Pro Arg Val Val Ala Pro Ala Ala Thr Ala Arg Val Val Ala Arg Gly
165 170 175
Thr Ala Ser Pro Gly Gln Cys Asp Gly Gly Ser Arg Asp Ser Ala Val
180 185 190
Ala Gly Gly Val Val Asp Leu Arg Ala Ala Arg Lys Arg Ala Asp Gln
195 200 205
Gly His Asp Glu Val Ala Gly Thr Ile Thr Ala Val Ser Pro Ala Thr
210 215 220
Ala Trp Gly Asp Ala Glu Arg Ala Lys Tyr Met Ala Arg Tyr Arg Arg
225 230 235 240
Glu Glu Met Arg Ile Gln Ala Trp Glu Asn Arg Glu Arg Arg Lys Ala
245 250 255
Glu Leu Gln Met Arg Thr Ala Glu Glu Lys Ala Glu Arg Met Arg Leu
260 265 270
Arg Ala Gln Ala Arg Thr Ala Gly Lys Leu Ala Thr Ala Gln Ala Glu
275 280 285
Ala Lys Ala Arg Arg Ala Arg Ala Glu Ala Glu Leu Ala Leu Gly Arg
290 295 300
Pro Gly Gly Gly Ala Lys Gly Trp Leu Leu Thr Arg Ser Ala Ser Trp
305 310 315 320
Ser Ser Gly Ser Gly Arg Ser Pro Ser Ser Leu Ser Leu Arg Leu Pro
325 330 335
Leu Leu Cys Arg
340
<210>284
<211>1653
<212>DNA
<213>稻
<400>284
aacgtttgct tcctctctag aaatcaaggg gagggcaccg ccaccggaag agggcaagaa 60
gaacggcgag aagatggcgg ccgccgccgc gatcccgatc ccgatcccct gcgtcgcgga 120
gcccaccgcg gcgtcccgcg tctcgccggg ctcgtccccc gcccgctccg acgcctccga 180
gggcgccgcg ttctacgccg ccgacaccga ggccgagccg gaggcgtccg tcgggaggag 240
cacgcagatg ctgctcgcga tggccgccat gggcggccgc ggggggccct acggccgccg 300
cccggcgtct tcctacggca gctgcgccgc gtggagcgcc gggtcgctca ccgaccaccg 360
ccccgcctcg ccgtccccaa tctgcagccc cgtgagcagc aatggagggg agggctgccg 420
cgacggtgat gacgcctcct cgttcgtcac gccacggctg gaagaagacc aagaaaggct 480
gccaaacaga ggagatttca taaatccgtc taccacacca cgacacatca gactgcaaac 540
gcccagacaa ccttcccttc tggataggag atttgagaga actaatccag tgccaccaag 600
attcatccac aaggccacgc cagctagatt gatgcgccga gctcgctcct cacataatta 660
ccgtaggcgt ttgggggcaa tggatgctat caatgaatgg agattgccca aagtcagtga 720
agaagaggat gaagcagtgg atcaaacgga ttggcaggct gatactctgt cttctcgtat 780
atcctcagct cgtgattgga actttgaggc tggtggtgcc tatgagggaa gtgatcataa 840
tggcggtgcg tttaaccatt cagatggcga aaatagccca gttgcagtgc aaagaatggg 900
gagatggccc cagggttctg cggtaaaaca taaggaaaat tttgtccacg ccaagttggt 960
tgcctggaag aatgcggaga ttgaaaagct catagacaag ctgagaagga aagaggccga 1020
tatcgatgaa tggcagatga atcaggttac acaggcaaag gagaagatga aaagaattga 1080
gatcaagttg gagaagaaga gagcgagagc agcagagaag atgcaaaagg caataaaaga 1140
tgcacaaaag aaagctgata agaagaaaat caaggagcat gcagcaaccg acaatcagat 1200
agctagtgtt gagagagcaa tggtgaagat gtctaggaca ggaaagctcc cctggtcact 1260
ggcttttctg taaacgagtt cttcacttgt ggtagatcca agcaagccga ttgttttgaa 1320
acctcttgcc gagatgccag cacggagaga ctaaaatgag cgcacatgct gtcagtactc 1380
agaagcagtg ccaactactg aaatcagaaa atttgttgta tataatagca gtggtttgtc 1440
gtccttagat gatagaagtt tcaggctgta tacctgattg gcatttgaac actgttctta 1500
aacatgacac gaacagtcag ggccaaatta tagtactttc ccttctgttg tggtttcaag 1560
tactgttctc aggcacaaca ttatttcccc agtaggattt ggatgtacat gtacagtggc 1620
aaactgacaa gtttcttgtt ttggtatgat ctg 1653
<210>285
<211>399
<212>PRT
<213>稻
<400>285
Met Ala Ala Ala Ala Ala Ile Pro Tle Pro Ile Pro Cys Val Ala Glu
1 5 10 15
Pro Thr Ala Ala Ser Arg Val Ser Pro Gly Ser Ser Pro Ala Arg Ser
20 25 30
Asp Ala Ser Glu Gly Ala Ala Phe Tyr Ala Ala Asp Thr Glu Ala Glu
35 40 45
Pro Glu Ala Ser Val Gly Arg Ser Thr Gln Met Leu Leu Ala Met Ala
50 55 60
Ala Met Gly Gly Arg Gly Gly Pro Tyr Gly Arg Arg Pro Ala Ser Ser
65 70 75 80
Tyr Gly Ser Cys Ala Ala Trp Ser Ala Gly Ser Leu Thr Asp His Arg
85 90 95
Pro Ala Ser Pro Ser Pro Ile Cys Ser Pro Val Ser Ser Asn Gly Gly
100 105 110
Glu Gly Cys Arg Asp Gly Asp Asp Ala Ser Ser Phe Val Thr Pro Arg
115 120 125
Leu Glu Glu Asp Gln Glu Arg Leu Pro Asn Arg Gly Asp Phe Ile Asn
130 135 140
Pro Ser Thr Thr Pro Arg His Ile Arg Leu Gln Thr Pro Arg Gln Pro
145 150 155 160
Ser Leu Leu Asp Arg Arg Phe Glu Arg Thr Asn Pro Val Pro Pro Arg
165 170 175
Phe Ile His Lys Ala Thr Pro Ala Arg Leu Met Arg Arg Ala Arg Ser
180 185 190
Ser His Asn Tyr Arg Arg Arg Leu Gly Ala Met Asp Ala Ile Asn Glu
195 200 205
Trp Arg Leu Pro Lys Val Ser Glu Glu Glu Asp Glu Ala Val Asp Gln
210 215 220
Thr Asp Trp Gln Ala Asp Thr Leu Ser Ser Arg Ile Ser Ser Ala Arg
225 230 235 240
Asp Trp Asn Phe Glu Ala Gly Gly Ala Tyr Glu Gly Ser Asp His Asn
245 250 255
Gly Gly Ala Phe Asn His Ser Asp Gly Glu Asn Ser Pro Val Ala Val
260 265 270
Gln Arg Met Gly Arg Trp Pro Gln Gly Ser Ala Val Lys His Lys Glu
275 280 285
Asn Phe Val His Ala Lys Leu Val Ala Trp Lys Asn Ala Glu Ile Glu
290 295 300
Lys Leu Ile Asp Lys Leu Arg Arg Lys Glu Ala Asp Ile Asp Glu Trp
305 310 315 320
Gln Met Asn Gln Val Thr Gln Ala Lys Glu Lys Met Lys Arg Ile Glu
325 330 335
Ile Lys Leu Glu Lys Lys Arg Ala Arg Ala Ala Glu Lys Met Gln Lys
340 345 350
Ala Ile Lys Asp Ala Gln Lys Lys Ala Asp Lys Lys Lys Ile Lys Glu
355 360 365
His Ala Ala Thr Asp Asn Gln Ile Ala Ser Val Glu Arg Ala Met Val
370 375 380
Lys Met Ser Arg Thr Gly Lys Leu Pro Trp Ser Leu Ala Phe Leu
385 390 395
<210>286
<211>1578
<212>DNA
<213>稻
<400>286
actaaccaca ctataatacg gtacaaatag atcatatata cactagcata gcacgaaatc 60
gcaaagtcca ctaacatccc actccccctt ccaagcttct tgtctcctct cctctcccca 120
actcccacgc catctcgcca ccaccaaccg attcaggccg cgcacgccat taatggagta 180
cgagcgcatc cacggccccc cgctccaacg tcagtcgggt ggattctccc cagctaagct 240
acgagcaatg cttctcggac tagagaaaaa tcagcacaac ggggaggaca catcgcctga 300
ggccaacgat tccggcgagc tggacgacca gaggagcatg gagtgctcca cctccaccga 360
aatgtcgagc aacagtggcc acagatcaag aaaccgagct caggacgacg acagcttcga 420
ctccgagagc agctcgtcgg gcccgccgac ggtgaagagg ccggcggcgg tgaccgcctt 480
gctgccaccg ttctctaggc cgacgccgtc gaagtgggat gatgcagaga agtggatttc 540
tagccccacg gcgaaccgcg gtggccgtgt ggggagtgca gctggggctg cgccgaagaa 600
atcggcgctg gcatttcctg aacatgtaag ccggcctcca gccgttgcta aggtggttgc 660
tgaggtcccc atcaacactg gaaccttggt gaagaattca gttgctctcg cacagcctat 720
ttcatttaat cctgcacaaa gtgcttcgat agttgatgaa ccagctcctg cagttaggtc 780
tgtttcgatg agagacatgg gcacagaaat gactcctatt gccagccagg agccctctcg 840
gactgggact cctattatag cttctagtcc aacctcctct cggacaccaa caccacaacg 900
taatgcagaa atcagtattg gtgaatttgg tccaaataag atggaaatgt ctgaggagga 960
actacaaatg aatacaagaa aggaaatcat ggatcttggc caacggctgg gaaagacaac 1020
tatagctgca tgggctagca aggaagagaa atctacaaca agtttcgcaa atgtcataac 1080
cgacaaggct gtagaaatcg acagagaggc tcgtgctgca gattgggagg aggcagagaa 1140
agcaaaatat cttgcaaggt ttcagaggga agaggtaaag attcaagctt gggaaaacca 1200
ccagaaagca aaaattgaag ctgaaatgaa gaggatggag gcaaagatag agatcaagag 1260
agctcgcgag caggacaggc tttcgagcaa gttggcagct gcaaggcaca aggcagaggc 1320
gaggagggag gccgctgagt ccaggaagaa ccaagaagca gcaagaactg aagagcaggc 1380
ggctcagatc cggaaaaccg ggcacatacc ttcctcaatc tcctgctggt gctggtgcct 1440
gtgattcttc actctgccat gatcatctgt tatttgggta gaagaaaaat acttgctcct 1500
tgcacgacca tgtaaaatat tcgctactgg ttggttcatc gttcagtgat caatgccaat 1560
gagtcgccat ttttgtcc 1578
<210>287
<211>423
<212>PRT
<213>稻
<400>287
Met Glu Tyr Glu Arg Ile His Gly Pro Pro Leu Gln Arg Gln Ser Gly
1 5 10 15
Gly Phe Ser Pro Ala Lys Leu Arg Ala Met Leu Leu Gly Leu Glu Lys
20 25 30
Asn Gln His Asn Gly Glu Asp Thr Ser Pro Glu Ala Asn Asp Ser Gly
35 40 45
Glu Leu Asp Asp Gln Arg Ser Met Glu Cys Ser Thr Ser Thr Glu Met
50 55 60
Ser Ser Asn Ser Gly His Arg Ser Arg Asn Arg Ala Gln Asp Asp Asp
65 70 75 80
Ser Phe Asp Ser Glu Ser Ser Ser Ser Gly Pro Pro Thr Val Lys Arg
85 90 95
Pro Ala Ala Val Thr Ala Leu Leu Pro Pro Phe Ser Arg Pro Thr Pro
100 105 110
Ser Lys Trp Asp Asp Ala Glu Lys Trp Ile Ser Ser Pro Thr Ala Asn
115 120 125
Arg Gly Gly Arg Val Gly Ser Ala Ala Gly Ala Ala Pro Lys Lys Ser
130 135 140
Ala Leu Ala Phe Pro Glu His Val Ser Arg Pro Pro Ala Val Ala Lys
145 150 155 160
Val Val Ala Glu Val Pro Ile Asn Thr Gly Thr Leu Val Lys Asn Ser
165 170 175
Val Ala Leu Ala Gln Pro Ile Ser Phe Asn Pro Ala Gln Ser Ala Ser
180 185 190
Ile Val Asp Glu Pro Ala Pro Ala Val Arg Ser Val Ser Met Arg Asp
195 200 205
Met Gly Thr Glu Met Thr Pro Ile Ala Ser Gln Glu Pro Ser Arg Thr
210 215 220
Gly Thr Pro Ile Ile Ala Ser Ser Pro Thr Ser Ser Arg Thr Pro Thr
225 230 235 240
Pro Gln Arg Asn Ala Glu Ile Ser Ile Gly Glu Phe Gly Pro Asn Lys
245 250 255
Met Glu Met Ser Glu Glu Glu Leu Gln Met Asn Thr Arg Lys Glu Ile
260 265 270
Met Asp Leu Gly Gln Arg Leu Gly Lys Thr Thr Ile Ala Ala Trp Ala
275 280 285
Ser Lys Glu Glu Lys Ser Thr Thr Ser Phe Ala Asn Val Ile Thr Asp
290 295 300
Lys Ala Val Glu Ile Asp Arg Glu Ala Arg Ala Ala Asp Trp Glu Glu
305 310 315 320
Ala Glu Lys Ala Lys Tyr Leu Ala Arg Phe Gln Arg Glu Glu Val Lys
325 330 335
Ile Gln Ala Trp Glu Asn His Gln Lys Ala Lys Ile Glu Ala Glu Met
340 345 350
Lys Arg Met Glu Ala Lys Ile Glu Ile Lys Arg Ala Arg Glu Gln Asp
355 360 365
Arg Leu Ser Ser Lys Leu Ala Ala Ala Arg His Lys Ala Glu Ala Arg
370 375 380
Arg Glu Ala Ala Glu Ser Arg Lys Asn Gln Glu Ala Ala Arg Thr Glu
385 390 395 400
Glu Gln Ala Ala Gln Ile Arg Lys Thr Gly His Ile Pro Ser Ser Ile
405 410 415
Ser Cys Trp Cys Trp Cys Leu
420
<210>288
<211>1873
<212>DNA
<213>稻
<400>288
agcttttaac tgctcgtctc atcactctcc acctctctcc ctctctctct cttcctcgcg 60
ctcccacgcc acgcagcagc cgcagatctc cacccgcctc cggcgagccc gccgccgccg 120
ccgccgccat ggagtacgag cgcatcgaga agccgttccc cacccagggc ggtgggttct 180
cgccgaagcg gctgcgcgcg atgttgctgg gggtggagaa gcggcggaag gggcaggagg 240
aggaggagga gggggacgcc ggggaggtgg acgacgagta cggcgcggtg cccaagtcct 300
ctgtcagatc cgacgccgac tccgatgcgc gcagaggagg tagcatgtgc gaagaataca 360
aggatgtaga tgtggtgagc accatctcag aatcttcatc ctcgttggag acagggagtg 420
ggcaccgatc gcgtgacacc cactccatgg gttcacgagt aagggtgcct gaggaggact 480
cctgtgactc tgagagtgtg gcttcaaact ttgagttcca taaggagcga ggggcctctg 540
ctcggtctgt gacggcggca atcgttcctc cattctcaaa gcctgcacca tcaaagtggg 600
acgatgccca gaaatggatc gccagcccga caacaaaccg tcctggtagg gctggtggag 660
tgccacagag gaagatggaa aaaactagct ttggtggcgg gaggctgccg gctacgaagg 720
ttgtgttgga ggccacagag gagatagata ctaagagggt tgatccaagc caagagaaaa 780
gggaaattgg gtggcaaaaa gcggtgaatt gggccccacc tgatccatat ccagaagttg 840
agacttgtgc aaagtctgca cttgctgaag aaattacagt agctgattca gctgttactt 900
ttagtcgcca tgattcatct gccacgcttc agagcgcgac aacatgcata cctcccccac 960
caacagtccg atcagtgtca atgagagaca tgggtacaga aatgacccct attgcgagcc 1020
aggagccatc ccgaacagga acaccggtga gagcaacgag tccagattgt tctcgcccaa 1080
ctactccacg aaaaacaata ggccccaatg caatcggtgc tgttattggc catggtgaat 1140
gtagcaacgt ggaattaagt gaacaagaat tgcaaatgaa gactaggagg gagataatgc 1200
tcctcggcac tcagcttggt aaaaccaaca ttgctgcatg ggcaagcaac aaggaagagg 1260
aaaaagatgc atcactttcg cttaaaggag tgcccatgga ccaatctaca cagaaggtaa 1320
cagaaattcg tgcagcagcg tgggaggagg cagagaaggc taaatattta gcaagattta 1380
aacgagaaga gattaagatc caagcatggg aagatcatca gagagcaaaa atcgaagctg 1440
aaatgagaaa aattgaggtc gacgtggaaa ggatgcgagc ccgtgcgcag gacaagctga 1500
tgagccagct cgcatcggcg agacacactg ccgacgagaa gcgggccgcg gcggagctga 1560
aacggagccg tgcggctgca aagacggcgg agcaggcaga ccacatcagg agaaccggca 1620
ggatgccgtc ctccattggc tgctggaact ggtgctcgta gtagcgtagc taagctcaag 1680
caactgaagc aagcaaaaag ctctcctcac tatgtctcgc aagacttgaa gcgccatcat 1740
ctgtttttac cgtgatcttg tagaatattg tcttttgatt ggtttcagta gatataagtc 1800
agaagaagac gagtcacttg taagtaacta tggagcagta tataagatgc aagcttcttg 1860
cctttttctg tgc 1873
<210>289
<211>510
<212>PRT
<213>稻
<400>289
Met Glu Tyr Glu Arg Ile Glu Lys Pro Phe Pro Thr Gln Gly Gly Gly
1 5 10 15
Phe Ser Pro Lys Arg Leu Arg Ala Met Leu Leu Gly Val Glu Lys Arg
20 25 30
Arg Lys Gly Gln Glu Glu Glu Glu Glu Gly Asp Ala Gly Glu Val Asp
35 40 45
Asp Glu Tyr Gly Ala Val Pro Lys Ser Ser Val Arg Ser Asp Ala Asp
50 55 60
Ser Asp Ala Arg Arg Gly Gly Ser Met Cys Glu Glu Tyr Lys Asp Val
65 70 75 80
Asp Val Val Ser Thr Ile Ser Glu Ser Ser Ser Ser Leu Glu Thr Gly
85 90 95
Ser Gly His Arg Ser Arg Asp Thr His Ser Met Gly Ser Arg Val Arg
100 105 110
Val Pro Glu Glu Asp Ser Cys Asp Ser Glu Ser Val Ala Ser Asn Phe
115 120 125
Glu Phe His Lys Glu Arg Gly Ala Ser Ala Arg Ser Val Thr Ala Ala
130 135 140
Ile Val Pro Pro Phe Ser Lys Pro Ala Pro Ser Lys Trp Asp Asp Ala
145 150 155 160
Gln Lys Trp Ile Ala Ser Pro Thr Thr Asn Arg Pro Gly Arg Ala Gly
165 170 175
Gly Val Pro Gln Arg Lys Met Glu Lys Thr Ser Phe Gly Gly Gly Arg
180 185 190
Leu Pro Ala Thr Lys Val Val Leu Glu Ala Thr Glu Glu Ile Asp Thr
195 200 205
Lys Arg Val Asp Pro Ser Gln Glu Lys Arg Glu Ile Gly Trp Gln Lys
210 215 220
Ala Val Asn Trp Ala Pro Pro Asp Pro Tyr Pro Glu Val Glu Thr Cys
225 230 235 240
Ala Lys Ser Ala Leu Ala Glu Glu Ile Thr Val Ala Asp Ser Ala Val
245 250 255
Thr Phe Ser Arg His Asp Ser Ser Ala Thr Leu Gln Ser Ala Thr Thr
260 265 270
Cys Ile Pro Pro Pro Pro Thr Val Arg Ser Val Ser Met Arg Asp Met
275 280 285
Gly Thr Glu Met Thr Pro Ile Ala Ser Gln Glu Pro Ser Arg Thr Gly
290 295 300
Thr Pro Val Arg Ala Thr Ser Pro Asp Cys Ser Arg Pro Thr Thr Pro
305 310 315 320
Arg Lys Thr Ile Gly Pro Asn Ala Ile Gly Ala Val Ile Gly His Gly
325 330 335
Glu Cys Ser Asn Val Glu Leu Ser Glu Gln Glu Leu Gln Met Lys Thr
340 345 350
Arg Arg Glu Ile Met Leu Leu Gly Thr Gln Leu Gly Lys Thr Asn Ile
355 360 365
Ala Ala Trp Ala Ser Asn Lys Glu Glu Glu Lys Asp Ala Ser Leu Ser
370 375 380
Leu Lys Gly Val Pro Met Asp Gln Ser Thr Gln Lys Val Thr Glu Ile
385 390 395 400
Arg Ala Ala Ala Trp Glu Glu Ala Glu Lys Ala Lys Tyr Leu Ala Arg
405 410 415
Phe Lys Arg Glu Glu Ile Lys Ile Gln Ala Trp Glu Asp His Gln Arg
420 425 430
Ala Lys Ile Glu Ala Glu Met Arg Lys Ile Glu Val Asp Val Glu Arg
435 440 445
Met Arg Ala Arg Ala Gln Asp Lys Leu Met Ser Gln Leu Ala Ser Ala
450 455 460
Arg His Thr Ala Asp Glu Lys Arg Ala Ala Ala Glu Leu Lys Arg Ser
465 470 475 480
Arg Ala Ala Ala Lys Thr Ala Glu Gln Ala Asp His Ile Arg Arg Thr
485 490 495
Gly Arg Met Pro Ser Ser Ile Gly Cys Trp Asn Trp Cys Ser
500 505 510
<210>290
<211>1108
<212>DNA
<213>稻
<400>290
aggcatgcag atgtctgtac agttaataat gctggtgtca cctcagagta tcaaacaaag 60
gcaaccgata acagttcatc aattgaaata aggccctaca aagatcccaa agctattcct 120
gcagttcatt cggtgtccgt gagagatgtg ggcacagaaa tgactcccat accgagtcag 180
gatccttcaa ggacaggaac tccacttgga tcaatgacac caactcgtag cccaaattgc 240
tctataccat caactcctgt aggaggacgg tcaacagcat caccaggaga tgacaacaca 300
gatgatggac catatttcaa cagaaaaggt ggcacaaatg aaatatcaga cgatgaaatg 360
agattgaaga caaggaaaga aattgccgcc ctgggtatac aactaggaaa gatgaacatt 420
gctacatggg ctagcaaaga ggagctagaa ctagtctctg catccccaag cattgctgat 480
ttggagcgga tgaagaaaga atatgcagct cgtgcagcag catatgaaga agcagaaaat 540
tttaagcata cagcaagatt caagaaggaa gagttgaaga ttgaagcatg ggagagcctt 600
caaaaagcaa aaatagaatc tgaaatgaag agaatagagg aacatgcaga gaaattgcga 660
agcgaagcca tggcgaagat ggctgaaaag ctagaaatga cacggcgttt agctgaagag 720
aaacgagcct cagccaatgc aaggatgaac caacaagcag caaaggcggt tcacaaggct 780
gagctgattc gccagacagg acgagttcca gggtcatgta tcctatgctg cagtggttgc 840
ttctgtcaac actagtgtat gcttgacaat tagggagtta aatatggtcg tgaaaaatct 900
aaaccccatg ttctataatc agcattcctt ggttttagta tggaaaggaa tgtctgatac 960
tttgattagg tattcagatg tacaaattct tgcttgtcat aaaagtcaat ccaatgctta 1020
catttgcttg gtcggctact cggttaaaga acacttggtt gttgctcaac gaattgaatc 1080
attggaaaat gacgagcatt tcttgact 1108
<210>291
<211>284
<212>PRT
<213>稻
<400>291
Arg His Ala Asp Val Cys Thr Val Asn Asn Ala Gly Val Thr Ser Glu
1 5 10 15
Tyr Gln Thr Lys Ala Thr Asp Asn Ser Ser Ser Ile Glu Ile Arg Pro
20 25 30
Tyr Lys Asp Pro Lys Ala Ile Pro Ala Val His Ser Val Ser Val Arg
35 40 45
Asp Val Gly Thr Glu Met Thr Pro Ile Pro Ser Gln Asp Pro Ser Arg
50 55 60
Thr Gly Thr Pro Leu Gly Ser Met Thr Pro Thr Arg Ser Pro Asn Cys
65 70 75 80
Ser Ile Pro Ser Thr Pro Val Gly Gly Arg Ser Thr Ala Ser Pro Gly
85 90 95
Asp Asp Asn Thr Asp Asp Gly Pro Tyr Phe Asn Arg Lys Gly Gly Thr
100 105 110
Asn Glu Ile Ser Asp Asp Glu Met Arg Leu Lys Thr Arg Lys Glu Ile
115 120 125
Ala Ala Leu Gly Ile Gln Leu Gly Lys Met Asn Ile Ala Thr Trp Ala
130 135 140
Ser Lys Glu Glu Leu Glu Leu Val Ser Ala Ser Pro Ser Ile Ala Asp
145 150 155 160
Leu Glu Arg Met Lys Lys Glu Tyr Ala Ala Arg Ala Ala Ala Tyr Glu
165 170 175
Glu Ala Glu Asn Phe Lys His Thr Ala Arg Phe Lys Lys Glu Glu Leu
180 185 190
Lys Ile Glu Ala Trp Glu Ser Leu Gln Lys Ala Lys Ile Glu Ser Glu
195 200 205
Met Lys Arg Ile Glu Glu His Ala Glu Lys Leu Arg Ser Glu Ala Met
210 215 220
Ala Lys Met Ala Glu Lys Leu Glu Met Thr Arg Arg Leu Ala Glu Glu
225 230 235 240
Lys Arg Ala Ser Ala Asn Ala Arg Met Asn Gln Gln Ala Ala Lys Ala
245 250 255
Val His Lys Ala Glu Leu Ile Arg Gln Thr Gly Arg Val Pro Gly Ser
260 265 270
Cys Ile Leu Cys Cys Ser Gly Cys Phe Cys Gln His
275 280
<210>292
<211>1452
<212>DNA
<213>稻
<400>292
aaagcacaac actcgcagcc attctgcttt gctttgctgc ttcttcctcc tccctccctg 60
cttctttgct ttcttgctaa tttgcaggta actagaggta gtacagttta gcaagctcaa 120
agctgagaga gagagagggg ttataatctg tcatggagta cgagaggata cacaaagttc 180
agatgggagt gatgtctcca accaagctga ggatgaagct gctgggatcc catggcggca 240
gcatcggcag ggttgacgag gcaaagaagt cgccgcgagc gtcgccggcg aggctcgacg 300
ccgacgagga cgacgacgac caccccaaga acagcctcct gccccaagaa ctcgacgaag 360
attatcccaa ggaccagtcg gattcttctc gctcgcgctc cgacgcgagc catgggagag 420
ctggcaatgg ctacgacagc ggcggcttcg agttctacag ggaggagagg ccgccgccac 480
cgccgccggc ggcggtggcg gtggtcggcg ggacgttctt caggcaggtg ccgtcaaagt 540
ggaacgacgc cgagaagtgg ctcgccggga gacacgtcgt gcactccaac ccaatcttct 600
ccaagaaggc cgccgccgca gcagcggccg tgtccggccg cgttgcgccg gaggcctcgg 660
cgtcgtcgtc gccgccgtcg gtggcgagca ggcagcgcca gcagaagagg ctccgcgtgt 720
cgtcggaggc ggcggcggtg tcgatgcggg acgtggggac ggagatgacg ccgatggcga 780
gcaaggagca gtcgcggagc ggcacgcccg ccggcgccgc cacgccgtcg ctgagtccgc 840
tctgctcggt gccgacgagc ccgaggggcg ccgcgtccgc gtcgtcggcg tcgtcggagc 900
gggagctcca gatcaggacg cgccgcgaga tcgccgcgct cgggctgcag ctgggcaaga 960
tgaacatcgc gtcgtgggcc agcaaggacg acgacgacga gctcccccgc gcctcgccgg 1020
agaagagacc gagaccgaga ccgagacctc actccggcga cggcggcggc gaggccaaga 1080
agagggagtt cgaggcgcgc gccatggcgt ggcaggagac gcacaagtgc aagctcgcgt 1140
tgaggtttca gaggaaggag gtgaagattc aggaatggga gagctgccag aaggccaaat 1200
tcgaagccaa gatgaggcac gcagaggtgc aggcagagca gatgaaggcg agggcgaagc 1260
agaagctgag caggaggctg tcggcgttga gccacaaggc ggaggggaag caggcgaggg 1320
tggaggctcg ccggagccgg caggcggcgc ggctggcccg ccaggtgcac cgcatccggg 1380
agaccggcgc cgcgccgtcg cgcctccgcc gctgctgcag ctggctgttc ctctgaacat 1440
ctgaagaaaa ac 1452
<210>293
<211>427
<212>PRT
<213>稻
<400>293
Met Glu Tyr Glu Arg Ile His Lys Val Gln Met Gly Val Met Ser Pro
1 5 10 15
Thr Lys Leu Arg Met Lys Leu Leu Gly Ser His Gly Gly Ser Ile Gly
20 25 30
Arg Val Asp Glu Ala Lys Lys Ser Pro Arg Ala Ser Pro Ala Arg Leu
35 40 45
Asp Ala Asp Glu Asp Asp Asp Asp His Pro Lys Asn Ser Leu Leu Pro
50 55 60
Gln Glu Leu Asp Glu Asp Tyr Pro Lys Asp Gln Ser Asp Ser Ser Arg
65 70 75 80
Ser Arg Ser Asp Ala Ser His Gly Arg Ala Gly Asn Gly Tyr Asp Ser
85 90 95
Gly Gly Phe Glu Phe Tyr Arg Glu Glu Arg Pro Pro Pro Pro Pro Pro
100 105 110
Ala Ala Val Ala Val Val Gly Gly Thr Phe Phe Arg Gln Val Pro Ser
115 120 125
Lys Trp Asn Asp Ala Glu Lys Trp Leu Ala Gly Arg His Val Val His
130 135 140
Ser Asn Pro Ile Phe Ser Lys Lys Ala Ala Ala Ala Ala Ala Ala Val
145 150 155 160
Ser Gly Arg Val Ala Pro Glu Ala Ser Ala Ser Ser Ser Pro Pro Ser
165 170 175
Val Ala Ser Arg Gln Arg Gln Gln Lys Arg Leu Arg Val Ser Ser Glu
180 185 190
Ala Ala Ala Val Ser Met Arg Asp Val Gly Thr Glu Met Thr Pro Met
195 200 205
Ala Ser Lys Glu Gln Ser Arg Ser Gly Thr Pro Ala Gly Ala Ala Thr
210 215 220
Pro Ser Leu Ser Pro Leu Cys Ser Val Pro Thr Ser Pro Arg Gly Ala
225 230 235 240
Ala Ser Ala Ser Ser Ala Ser Ser Glu Arg Glu Leu Gln Ile Arg Thr
245 250 255
Arg Arg Glu Ile Ala Ala Leu Gly Leu Gln Leu Gly Lys Met Asn Ile
260 265 270
Ala Ser Trp Ala Ser Lys Asp Asp Asp Asp Glu Leu Pro Arg Ala Ser
275 280 285
Pro Glu Lys Arg Pro Arg Pro Arg Pro Arg Pro His Ser Gly Asp Gly
290 295 300
Gly Gly Glu Ala Lys Lys Arg Glu Phe Glu Ala Arg Ala Met Ala Trp
305 310 315 320
Gln Glu Thr His Lys Cys Lys Leu Ala Leu Arg Phe Gln Arg Lys Glu
325 330 335
Val Lys Ile Gln Glu Trp Glu Ser Cys Gln Lys Ala Lys Phe Glu Ala
340 345 350
Lys Met Arg His Ala Glu Val Gln Ala Glu Gln Met Lys Ala Arg Ala
355 360 365
Lys Gln Lys Leu Ser Arg Arg Leu Ser Ala Leu Ser His Lys Ala Glu
370 375 380
Gly Lys Gln Ala Arg Val Glu Ala Arg Arg Ser Arg Gln Ala Ala Arg
385 390 395 400
Leu Ala Arg Gln Val His Arg Ile Arg Glu Thr Gly Ala Ala Pro Ser
405 410 415
Arg Leu Arg Arg Cys Cys Ser Trp Leu Phe Leu
420 425
<210>294
<211>1739
<212>DNA
<213>稻
<400>294
agttcattga acttcacata agctcaccaa gtaaccaaaa cacataagct cagcttcagc 60
tcagtctcct ccatggagcc caagtcttct tcttcctcac actatctgca gccatctgca 120
acattgccat caacaagaag aaactcattc caaggagtgg gagctgaagc tggaggagga 180
ggaggaggca tgaacccatt cgggcccaca ttcagtgacc cactctgcag cctcaacctc 240
aaggagacct cagagttcgt gaggtcatcc ttccccatgg ctaccatggc gaggagcaac 300
agcagcaacg gcgccaccgg caatggcggc catggctacc accgcgagac ctccacggcc 360
tcttcatcct cttcctcctc ggcctcagct cagaggaggc gagccgagca gcagcagcag 420
caggtgccag ctactccagg gcggccattg ctgttcttca attcctcgag ccctgcacat 480
caccagctcg tctccgcgag gaggtcggtg ccttccaagt gggaggatgc ggagaagtgg 540
gtgaggcagg cgtcgtccga ccaccatggc ggccatcacc accaccatgg caagggctcc 600
aagcttcagg aggagaagag ggcgtcggcg gtgaggaggt cggtggatgc tgacgtcact 660
gctcttgctc tctacactgc tcctgctgca gaagtgttcc tcaaagacaa gttcactgac 720
aatgtggagc cctccaagga gagcttcgtg ttccggagct cctactgcga gccaacaaag 780
aacacggcgg cgcaggcggt ggccgccggc aacggcatcg accaccggcg tgacatcggc 840
acggagatga ctccgctggg cagctccacc acctcgaggt gccacacgcc gatcaagagc 900
acctcgccgg cgaggcacaa cacgccggcg agccggtcgg gccccctggt gccgtacgcc 960
ggcggtggcg gcggcgccgg ccaggacatc tcggacctcg ccgactgcca cttcgccaag 1020
ctggacctcg gcgcgcagtt cgacgccatg ctcatcaact ggagctccaa ggaggaggag 1080
gaggaggagg tgtccaagag cttgaggcac ttcgaggcca gcgtcgccgc cgtcggcgag 1140
aagcgcggcg gcgccggcga ctgccggtgg gaggacgatg acagggccaa gagctgcata 1200
aggtatcaga gggaagaggc aaagattcaa gcttggatca acctggagag tgccaaggct 1260
gaagcacagt ccagaaagct agaggtgaag attcagaaga tgagatcaaa cctggaggag 1320
aagctgatga ggaggatgac gaccgtgcac cggcgcgccg aggagtggag agcgacggcg 1380
caggcgcagc acctccagca gctgaagcgc gccgccgagc aagtccggcg ggccaaggcc 1440
accagccacc atcaccacca ccaccacctc gccggcagca acgcctcctg cggctgcttc 1500
ccctgcaatg gcagcaacaa catcatcagt ggcaacctcc tgaactacta ttagatatga 1560
tcagctagcc gccatggaag aaggatcaag aatgccaatt tgttcgggag atcaacgggt 1620
tcttgttgat tgtagtggat gtttgggacg tgtgaagatg gagatgtggg agataatggt 1680
gtcatgtgta tcaaaaaact ctgatttttc aaggtgatat ataccagatt gctgaatgc 1739
<210>295
<211>493
<212>PRT
<213>稻
<400>295
Met Glu Pro Lys Ser Ser Ser Ser Ser His Tyr Leu Gln Pro Ser Ala
1 5 10 15
Thr Leu Pro Ser Thr Arg Arg Asn Ser Phe Gln Gly Val Gly Ala Glu
20 25 30
Ala Gly Gly Gly Gly Gly Gly Met Asn Pro Phe Gly Pro Thr Phe Ser
35 40 45
Asp Pro Leu Cys Ser Leu Asn Leu Lys Glu Thr Ser Glu Phe Val Arg
50 55 60
Ser Ser Phe Pro Met Ala Thr Met Ala Arg Ser Asn Ser Ser Asn Gly
65 70 75 80
Ala Thr Gly Asn Gly Gly His Gly Tyr His Arg Glu Thr Ser Thr Ala
85 90 95
Ser Ser Ser Ser Ser Ser Ser Ala Ser Ala Gln Arg Arg Arg Ala Glu
100 105 110
Gln Gln Gln Gln Gln Val Pro Ala Thr Pro Gly Arg Pro Leu Leu Phe
115 120 125
Phe Asn Ser Ser Ser Pro Ala His His Gln Leu Val Ser Ala Arg Arg
130 135 140
Ser Val Pro Ser Lys Trp Glu Asp Ala Glu Lys Trp Val Arg Gln Ala
145 150 155 160
Ser Ser Asp His His Gly Gly His His His His His Gly Lys Gly Ser
165 170 175
Lys Leu Gln Glu Glu Lys Arg Ala Ser Ala Val Arg Arg Ser Val Asp
180 185 190
Ala Asp Val Thr Ala Leu Ala Leu Tyr Thr Ala Pro Ala Ala Glu Val
195 200 205
Phe Leu Lys Asp Lys Phe Thr Asp Asn Val Glu Pro Ser Lys Glu Ser
210 215 220
Phe Val Phe Arg Ser Ser Tyr Cys Glu Pro Thr Lys Asn Thr Ala Ala
225 230 235 240
Gln Ala Val Ala Ala Gly Asn Gly Ile Asp His Arg Arg Asp Ile Gly
245 250 255
Thr Glu Met Thr Pro Leu Gly Ser Ser Thr Thr Ser Arg Cys His Thr
260 265 270
Pro Ile Lys Ser Thr Ser Pro Ala Arg His Asn Thr Pro Ala Ser Arg
275 280 285
Ser Gly Pro Leu Val Pro Tyr Ala Gly Gly Gly Gly Gly Ala Gly Gln
290 295 300
Asp Ile Ser Asp Leu Ala Asp Cys His Phe Ala Lys Leu Asp Leu Gly
305 310 315 320
Ala Gln Phe Asp Ala Met Leu Ile Asn Trp Ser Ser Lys Glu Glu Glu
325 330 335
Glu Glu Glu Val Ser Lys Ser Leu Arg His Phe Glu Ala Ser Val Ala
340 345 350
Ala Val Gly Glu Lys Arg Gly Gly Ala Gly Asp Cys Arg Trp Glu Asp
355 360 365
Asp Asp Arg Ala Lys Ser Cys Ile Arg Tyr Gln Arg Glu Glu Ala Lys
370 375 380
Ile Gln Ala Trp Ile Asn Leu Glu Ser Ala Lys Ala Glu Ala Gln Ser
385 390 395 400
Arg Lys Leu Glu Val Lys Ile Gln Lys Met Arg Ser Asn Leu Glu Glu
405 410 415
Lys Leu Met Arg Arg Met Thr Thr Val His Arg Arg Ala Glu Glu Trp
420 425 430
Arg Ala Thr Ala Gln Ala Gln His Leu Gln Gln Leu Lys Arg Ala Ala
435 440 445
Glu Gln Val Arg Arg Ala Lys Ala Thr Ser His His His His His His
450 455 460
His Leu Ala Gly Ser Asn Ala Ser Cys Gly Cys Phe Pro Cys Asn Gly
465 470 475 480
Ser Asn Asn Ile Ile Ser Gly Asn Leu Leu Asn Tyr Tyr
485 490
<210>296
<211>1261
<212>DNA
<213>稻
<400>296
ttaacttaca agttaatctt gaacgttgag tgccacaggc ccaggaataa gattgaaagg 60
tccgatttcc tggtacagga acaggaagat caaggtggta accagactat aagaatgcaa 120
cctcaacaag gtagattttt tggaagagag gaaatgagca atggagtaga atacgatgct 180
gcatatgcag ccacagtggc tgcggtagcg tatgctattg cagcaaaaga ggaggagaaa 240
caggcaacag aagagacccg tgtgaaaaag aagttaacat ctgaaaagaa gcctgtcgcg 300
aacgatgagc cttcgaccac accaactctc aaactaccac ccaacagaca aggaatcttg 360
aaaaggccta ggcaaaccga ggggagcaga atcacaaggc ggtttagtgg taaggagatt 420
gtacccgatg aagaagacga cggactagaa gctaatgtat cggtgaggag gccggtgaga 480
acggcacaaa agataccaga aggtggaatt tcaggtcaaa atatggtagg gaaggttctt 540
gattctgtcc caagcataag aaaggctccg agcttcgcca agcctttacc agaaaagaag 600
gggagcatga aatttgagca agagcaggca atcccaacgg tgccaccgaa tgttaggccg 660
acagctttat ttccccgaga gaagaaagag agcaagaaat ttgatcaaga ccaggcaatc 720
ccaagggtgc caccagatgt taggccaaca gcttcatttt cccgagagaa gaaagagagc 780
aagaagtttg agcaagacaa ggcaaatcaa atgccatctt tggcttccgc gccgacgagt 840
tcatattcta gtgaggctga agcaatggca gatacgtggg agaaggaaaa gatggcaaaa 900
atcaagaagc agtacaacat gacaatggat accatcgtcg aatgggaggc cgagaagaag 960
gccaaggcca aacgccagat ggagttgaaa gagggcgata attcagagcg gaagcgagag 1020
aaggcgctgg aggagtacaa cgacgagatt acaaggatca acaaggtggc cgcagcatca 1080
aggctgacgg cggaggagaa gcggaggagc gcagagagga aggtgaggga gaaggcagag 1140
aggattcggg tgacgggaaa gcttcccggc gcatgtggct gcttctgaaa accatcaatg 1200
tgtcaatgtg tagtggatgt ggctgtttca aatgaaattt atgtgaaatt gaaccaagca 1260
g 1261
<210>297
<211>357
<212>PRT
<213>稻
<400>297
Met Gln Pro Gln Gln Gly Arg Phe Phe Gly Arg Glu Glu Met Ser Asn
1 5 10 15
Gly Val Glu Tyr Asp Ala Ala Tyr Ala Ala Thr Val Ala Ala Val Ala
20 25 30
Tyr Ala Ile Ala Ala Lys Glu Glu Glu Lys Gln Ala Thr Glu Glu Thr
35 40 45
Arg Val Lys Lys Lys Leu Thr Ser Glu Lys Lys Pro Val Ala Asn Asp
50 55 60
Glu Pro Ser Thr Thr Pro Thr Leu Lys Leu Pro Pro Asn Arg Gln Gly
65 70 75 80
Ile Leu Lys Arg Pro Arg Gln Thr Glu Gly Ser Arg Ile Thr Arg Arg
85 90 95
Phe Ser Gly Lys Glu Ile Val Pro Asp Glu Glu Asp Asp Gly Leu Glu
100 105 110
Ala Asn Val Ser Val Arg Arg Pro Val Arg Thr Ala Gln Lys Ile Pro
115 120 125
Glu Gly Gly Ile Ser Gly Gln Asn Met Val Gly Lys Val Leu Asp Ser
130 135 140
Val Pro Ser Ile Arg Lys Ala Pro Ser Phe Ala Lys Pro Leu Pro Glu
145 150 155 160
Lys Lys Gly Ser Met Lys Phe Glu Gln Glu Gln Ala Ile Pro Thr Val
165 170 175
Pro Pro Asn Val Arg Pro Thr Ala Leu Phe Pro Arg Glu Lys Lys Glu
180 185 190
Ser Lys Lys Phe Asp Gln Asp Gln Ala Ile Pro Arg Val Pro Pro Asp
195 200 205
Val Arg Pro Thr Ala Ser Phe Ser Arg Glu Lys Lys Glu Ser Lys Lys
210 215 220
Phe Glu Gln Asp Lys Ala Asn Gln Met Pro Ser Leu Ala Ser Ala Pro
225 230 235 240
Thr Ser Ser Tyr Ser Ser Glu Ala Glu Ala Met Ala Asp Thr Trp Glu
245 250 255
Lys Glu Lys Met Ala Lys Ile Lys Lys Gln Tyr Asn Met Thr Met Asp
260 265 270
Thr Ile Val Glu Trp Glu Ala Glu Lys Lys Ala Lys Ala Lys Arg Gln
275 280 285
Met Glu Leu Lys Glu Gly Asp Asn Ser Glu Arg Lys Arg Glu Lys Ala
290 295 300
Leu Glu Glu Tyr Asn Asp Glu Ile Thr Arg Ile Asn Lys Val Ala Ala
305 310 315 320
Ala Ser Arg Leu Thr Ala Glu Glu Lys Arg Arg Ser Ala Glu Arg Lys
325 330 335
Val Arg Glu Lys Ala Glu Arg Ile Arg Val Thr Gly Lys Leu Pro Gly
340 345 350
Ala Cys Gly Cys Phe
355
<210>298
<211>2845
<212>DNA
<213>稻
<400>298
ggctcgcgtc agacagactc cctcctctcc tcgagatgct gtacttgcca tcggtccatc 60
acccttccat cccgccacgt tgcgatcccc tcggccactt ctattaaacg ccaacgtact 120
cctcatcacg cctccaaacc cgccgctttg attgtacttg tgctttgctg ttaaagagct 180
cgccggcgtg agtggtggcg ggtagaagtt atatggagag aatgcggtgt gttggtggtg 240
gtgacacccc gttggggttt cggggcgtcg tggaggagga gctagaggag gaggtggcgg 300
cggtgtcagc gtcggggagg ccaatgcagc ggcagcggcg gcggcggcgg cggtggggag 360
aggatgccga cgatggctac tcggcgagct cgactggcgg cggcgggagc agcggatgcg 420
gctccttcgg ctgtgactcg cctttggctg ggttcgtgcg tgctgatggc gacccggaca 480
cagatctgga gacagatggg gtggccactc catcctccaa tgcctctgca gcattcgccg 540
agccacacga cgaggaggag ggggacgagg tgttgtgtgg ggtggtggaa ggggactggg 600
cacagctgca agaaccaacc aagagtccgg cagaccgtac caccggagaa tgcctgtacc 660
agcggcgccg gtcagaagct gttcttttgc agggtaggaa ggggttgaag caacggccag 720
cctctctgga ctttggcagc ggcagccccg ggttcaatgg agcccctctt tctccgggct 780
ttgtggttgg gggtgtgggt ttgatgaaca agggtcttgt gtcatcatca ttcatcagat 840
cagacgtttt tcctagtccc aggacaccga actatcggcg gcatcgttca tcagtatttg 900
gttaccaaaa ggggtggagc tctgagagag taccgcttgc ttccaaaggt aacaggaggt 960
acccaggcag cagcatggca tttcccttca gcaatgggag gacattgccc tccaaatggg 1020
aggatgcaga gagatggatc ttcagtccga attcgagtga cgtgctcgag aagacttcat 1080
ttgctcctgc tcggcgacca aagtccaaaa gtggtccatt agggcctcct ggaaaatttg 1140
gtggacaata ctcatctgtg tcattgcttg acaatgggag agttggacat ttgacagcaa 1200
actcgccttt cttggctgga gtactgatac cagaacatta ttgtggagag aaagataaca 1260
ttgggaggta tatgagcaga acagctggtg aggaggccag cattggcatt ggaggcaagt 1320
cttgtctggc aaatggtggg tctcatgcta ctcaatataa cagagttcgt cgacgactgg 1380
atactgcgat tgagtcatca ccttcattgc ctagcaccca agcgtctgta caagatgaac 1440
aggttggaat cacagaagag tcagcctcca ttatcacccc tataattttg cggaaggatg 1500
cggcaactca aacaagccca aatctaagtc ggtcatcttc gcccagtgtc agtactccat 1560
ttatccattt gcttacgaca caccaagtca gagaaaagga gaattgtttc tctgatgtta 1620
tcagggatgt gcacatggac gatcgagtga ctcttaccag gtggtccaag aaacatgtta 1680
cacgagcatc tagcaagaac tcaacaaatg ttatagatgt gaagaaaaag acagtggagt 1740
ctaagtcttc ttcctgggaa ttaacagaag caaaatccat atcaaaggtt gagcgagagc 1800
aagaaaaaat tactgcttgg gaacacctcc aaaaagccaa ggctgaggca gcaatccaaa 1860
agttagtgat gaaaatcgag aaaaagagat catcttcact ggacaagatt tggaacaccc 1920
tcaggtctgc acaaagaaga gcacaggtaa tgcgtgaaac tgcagcagca aaccaggatg 1980
agcaatcttc cgggaaggct aaaaggacat cacaccttaa taagaacggc cagatcagct 2040
ctctgagtgg ctgcttcact tgccatgcct tctagtgtca tgtagtttaa gaaggaacag 2100
gacttaaagt aattcttcgt gttatcaaca cgctcgtgtt gacttagtga agttcagaga 2160
tttacagaat aaagatgatc cagcagatgg aaattatccc cccttgaatt ttgacaagat 2220
gctgctgcaa caatggggga ccatgcatta tcatgatata gatttctaca gttctgcttt 2280
gtgttagttt cgattctgcc atggggggac aagagaaaat ggtgccacga aggaaaggtg 2340
aaattcttct gcatacatcc catgtgcctg attgatatct tagcacaatg ataattgata 2400
aggtcctcct ctatcattca ttacccatta ccaacattct agatgctatg agtttgtgtg 2460
cgatgaaaac aaagcagata tgtatcattt gcaccacaat tccaacggat agataagaag 2520
ggaatgtttc agtcagaggg aatacagtgc cttactgtga ttcatgctgg aaaactctac 2580
tggattgtga aagggaacca ggtggaatgc aatagattta gctagcgtat gctacatttg 2640
catacacagt tacaatagca tgtgttggag aaaaatatag gaatacagga aaatagagat 2700
tctgtttgaa tttcatggca atttgacaag ctcttcgcag aacaactctc ccatttctgt 2760
aatgagctgt ttcttgtaat tcctattgca acacataggc gttactgaat gttgataaat 2820
gatattgcca tcgcaatttt ttttt 2845
<210>299
<211>620
<212>PRT
<213>稻
<400>299
Met Glu Arg Met Arg Cys Val Gly Gly Gly Asp Thr Pro Leu Gly Phe
1 5 10 15
Arg Gly Val Val Glu Glu Glu Leu Glu Glu Glu Val Ala Ala Val Ser
20 25 30
Ala Ser Gly Arg Pro Met Gln Arg Gln Arg Arg Arg Arg Arg Arg Trp
35 40 45
Gly Glu Asp Ala Asp Asp Gly Tyr Ser Ala Ser Ser Thr Gly Gly Gly
50 55 60
Gly Ser Ser Gly Cys Gly Ser Phe Gly Cys Asp Ser Pro Leu Ala Gly
65 70 75 80
Phe Val Arg Ala Asp Gly Asp Pro Asp Thr Asp Leu Glu Thr Asp Gly
85 90 95
Val Ala Thr Pro Ser Ser Asn Ala Ser Ala Ala Phe Ala Glu Pro His
100 105 110
Asp Glu Glu Glu Gly Asp Glu Val Leu Cys Gly Val Val Glu Gly Asp
115 120 125
Trp Ala Gln Leu Gln Glu Pro Thr Lys Ser Pro Ala Asp Arg Thr Thr
130 135 140
Gly Glu Cys Leu Tyr Gln Arg Arg Arg Ser Glu Ala Val Leu Leu Gln
145 150 155 160
Gly Arg Lys Gly Leu Lys Gln Arg Pro Ala Ser Leu Asp Phe Gly Ser
165 170 175
Gly Ser Pro Gly Phe Asn Gly Ala Pro Leu Ser Pro Gly Phe Val Val
180 185 190
Gly Gly Val Gly Leu Met Asn Lys Gly Leu Val Ser Ser Ser Phe Ile
195 200 205
Arg Ser Asp Val Phe Pro Ser Pro Arg Thr Pro Asn Tyr Arg Arg His
210 215 220
Arg Ser Ser Val Phe Gly Tyr Gln Lys Gly Trp Ser Ser Glu Arg Val
225 230 235 240
Pro Leu Ala Ser Lys Gly Asn Arg Arg Tyr Pro Gly Ser Ser Met Ala
245 250 255
Phe Pro Phe Ser Asn Gly Arg Thr Leu Pro Ser Lys Trp Glu Asp Ala
260 265 270
Glu Arg Trp Ile Phe Ser Pro Asn Ser Ser Asp Val Leu Glu Lys Thr
275 280 285
Ser Phe Ala Pro Ala Arg Arg Pro Lys Ser Lys Ser Gly Pro Leu Gly
290 295 300
Pro Pro Gly Lys Phe Gly Gly Gln Tyr Ser Ser Val Ser Leu Leu Asp
305 310 315 320
Asn Gly Arg Val Gly His Leu Thr Ala Asn Ser Pro Phe Leu Ala Gly
325 330 335
Val Leu Ile Pro Glu His Tyr Cys Gly Glu Lys Asp Asn Ile Gly Arg
340 345 350
Tyr Met Ser Arg Thr Ala Gly Glu Glu Ala Ser Ile Gly Ile Gly Gly
355 360 365
Lys Ser Cys Leu Ala Asn Gly Gly Ser His Ala Thr Gln Tyr Asn Arg
370 375 380
Val Arg Arg Arg Leu Asp Thr Ala Ile Glu Ser Ser Pro Ser Leu Pro
385 390 395 400
Ser Thr Gln Ala Ser Val Gln Asp Glu Gln Val Gly Ile Thr Glu Glu
405 410 415
Ser Ala Ser Ile Ile Thr Pro Ile Ile Leu Arg Lys Asp Ala Ala Thr
420 425 430
Gln Thr Ser Pro Asn Leu Ser Arg Ser Ser Ser Pro Ser Val Ser Thr
435 440 445
Pro Phe Ile His Leu Leu Thr Thr His Gln Val Arg Glu Lys Glu Asn
450 455 460
Cys Phe Ser Asp Val Ile Arg Asp Val His Met Asp Asp Arg Val Thr
465 470 475 480
Leu Thr Arg Trp Ser Lys Lys His Val Thr Arg Ala Ser Ser Lys Asn
485 490 495
Ser Thr Asn Val Ile Asp Val Lys Lys Lys Thr Val Glu Ser Lys Ser
500 505 510
Ser Ser Trp Glu Leu Thr Glu Ala Lys Ser Ile Ser Lys Val Glu Arg
515 520 525
Glu Gln Glu Lys Ile Thr Ala Trp Glu His Leu Gln Lys Ala Lys Ala
530 535 540
Glu Ala Ala Ile Gln Lys Leu Val Met Lys Ile Glu Lys Lys Arg Ser
545 550 555 560
Ser Ser Leu Asp Lys Ile Trp Asn Thr Leu Arg Ser Ala Gln Arg Arg
565 570 575
Ala Gln Val Met Arg Glu Thr Ala Ala Ala Asn Gln Asp Glu Gln Ser
580 585 590
Ser Gly Lys Ala Lys Arg Thr Ser His Leu Asn Lys Asn Gly Gln Ile
595 600 605
Ser Ser Leu Ser Gly Cys Phe Thr Cys His Ala Phe
610 615 620
<210>300
<211>2200
<212>DNA
<213>稻
<400>300
aaagctagtc gctgactgac gctgcccgcc gtgtggccgt gcattgctgt ccctgagctt 60
gctgctgctg gtggtggtga cgattctgct cggtagagga gatgcgagtt gggggtgagc 120
tccacagcgg cggcggagga ggagaggggg tgttggtggg gaggggatgg aggaaggagg 180
aggcggaggg aggcggcggc ggcggcggcg gcggcggcgg gtgctcggcg agctcgacga 240
gccggggatc gtctctctgc gactcgcctt tgcccagctt tgtgcgccat cgtggtggac 300
cggggtcaga tctagagctc gatgggttgc ccacttcctc ctccaatgct tcctcagggt 360
cacacgagga ggatcacggg ccattgcaag gggtgaaggg agaggggtgg atgcaagtgc 420
agggaccgat caagaactca gctgcccgtt ctaccggaga atgccaagac cagcggtacc 480
ggttggggtc tgttcttttc catggtaaga atgaacggaa gcagcgcccg gcttcagttg 540
attttggctg ccccagtgtt gacagatcct ccacgcattc tccgggtttc ttggtcaatg 600
gtaccggggc gatgaacaag ggattgagtg tatcatcgca aaataaacca ggtgcgccga 660
ctagcccagg aacaccaagc tacaatcgtc agggtgcaac agttgttggg tatcagcagg 720
gttggagctc tgaaagagtt gccctgtctt caaacggcca gagaaggcat tcaggcaaca 780
gcatggtgtt accacataat actgggagaa cattgccctc aaaatgggag gacgcagaga 840
ggtggatctt cagtccgaat cccagcaatg cacttggaag gacctcaatc ccgcagtcgc 900
ggcgacctaa ggccaaaagt ggacctcttg gacctcctgg cagatttagt gaaccatact 960
catcagtttc gtcatcgtca tatttgcttg acaccgggag agtaggaaac ctcacggcaa 1020
actcaccttt cctggctggg gtcttgctgc ctgagcatgt ttgtgtgtcc agtagccatg 1080
ctggaaggga tctaagtggt gcatctggtg aggataaaag caatggcatg ggaggcaggt 1140
ctggtgaagc aaatggtgca catcctgccg tgtggtctac cagagtttgc caacgaatgg 1200
atagcgcagt tcagtcgtct ccgtcattgc ctacttccca agaatcagtt caagcttgca 1260
cagatgaaca gatcgaaatc acaacagact tgaccaccag cagtaaacct gaaatttcga 1320
gaaaagatgt ggcaacacag actagccctg agcttagcag gtcatcttct cctagcggga 1380
ggccttcatt ttcccgctca ctatcagtac agcaagtcaa agagttggag agctgtttct 1440
ctaagcttga gataagggat gtgcagatgg atgatcgggt tactctgacc aggtggtcca 1500
agaaacatgt cacacgaggc tctgagaaga actcgacaaa cattatagag tggaagaaaa 1560
agacagtgga atctaaatct tctgcctggg aagtaacaga aactgcaaag tgtatatcaa 1620
agattgaggg agaggaagca aagatgactg catgggagaa tctgcaaaag gcaaaagcag 1680
aggcagcaat acaaaagctt gtgatgaaac ttgaaaagaa aagatcatac tcactggaga 1740
ggattttcaa taccctcagg tcagctcata ggaaaacaca tgtgatacgc agcacaacta 1800
ccacaaatct tgatcagcac atctccagga ctgtgaaaag gccatcacac cttagcaaga 1860
atggccaaat gagttcgctg agtgggtgct tcacttgcca tgccttctag tatggtatta 1920
tacagtcaag cggcactgtc actttcaaga tggaattgga ggggggaacc aaaaggcttg 1980
ctagtataga atacagataa gacctagcag gggaagccga ggctctcaat gatatccaat 2040
ggtctgtcat tacaagattt attctagaat ttcccttttt attctgctca ggaacaaaag 2100
gaagttgacg cagagggaag gagttgttac tacacacctt gtgaagtatt tgtaataata 2160
aaaatctctg cctatactct tcagggcgga gtggtatcat 2200
<210>301
<211>602
<212>PRT
<213>稻
<400>301
Met Arg Val Gly Gly Glu Leu His Ser Gly Gly Gly Gly Gly Glu Gly
1 5 10 15
Val Leu Val Gly Arg Gly Trp Arg Lys Glu Glu Ala Glu Gly Gly Gly
20 25 30
Gly Gly Gly Gly Gly Gly Gly Gly Cys Ser Ala Ser Ser Thr Ser Arg
35 40 45
Gly Ser Ser Leu Cys Asp Ser Pro Leu Pro Ser Phe Val Arg His Arg
50 55 60
Gly Gly Pro Gly Ser Asp Leu Glu Leu Asp Gly Leu Pro Thr Ser Ser
65 70 75 80
Ser Asn Ala Ser Ser Gly Ser His Glu Glu Asp His Gly Pro Leu Gln
85 90 95
Gly Val Lys Gly Glu Gly Trp Met Gln Val Gln Gly Pro Ile Lys Asn
100 105 110
Ser Ala Ala Arg Ser Thr Gly Glu Cys Gln Asp Gln Arg Tyr Arg Leu
115 120 125
Gly Ser Val Leu Phe His Gly Lys Asn Glu Arg Lys Gln Arg Pro Ala
130 135 140
Ser Val Asp Phe Gly Cys Pro Ser Val Asp Arg Ser Ser Thr His Ser
145 150 155 160
Pro Gly Phe Leu Val Asn Gly Thr Gly Ala Met Asn Lys Gly Leu Ser
165 170 175
Val Ser Ser Gln Asn Lys Pro Gly Ala Pro Thr Ser Pro Gly Thr Pro
180 185 190
Ser Tyr Asn Arg Gln Gly Ala Thr Val Val Gly Tyr Gln Gln Gly Trp
195 200 205
Ser Ser Glu Arg Val Ala Leu Ser Ser Asn Gly Gln Arg Arg His Ser
210 215 220
Gly Asn Ser Met Val Leu Pro His Asn Thr Gly Arg Thr Leu Pro Ser
225 230 235 240
Lys Trp Glu Asp Ala Glu Arg Trp Ile Phe Ser Pro Asn Pro Ser Asn
245 250 255
Ala Leu Gly Arg Thr Ser Ile Pro Gln Ser Arg Arg Pro Lys Ala Lys
260 265 270
Ser Gly Pro Leu Gly Pro Pro Gly Arg Phe Ser Glu Pro Tyr Ser Ser
275 280 285
Val Ser Ser Ser Ser Tyr Leu Leu Asp Thr Gly Arg Val Gly Asn Leu
290 295 300
Thr Ala Asn Ser Pro Phe Leu Ala Gly Val Leu Leu Pro Glu His Val
305 310 315 320
Cys Val Ser Ser Ser His Ala Gly Arg Asp Leu Ser Gly Ala Ser Gly
325 330 335
Glu Asp Lys Ser Asn Gly Met Gly Gly Arg Ser Gly Glu Ala Asn Gly
340 345 350
Ala His Pro Ala Val Trp Ser Thr Arg Val Cys Gln Arg Met Asp Ser
355 360 365
Ala Val Gln Ser Ser Pro Ser Leu Pro Thr Ser Gln Glu Ser Val Gln
370 375 380
Ala Cys Thr Asp Glu Gln Ile Glu Ile Thr Thr Asp Leu Thr Thr Ser
385 390 395 400
Ser Lys Pro Glu Ile Ser Arg Lys Asp Val Ala Thr Gln Thr Ser Pro
405 410 415
Glu Leu Ser Arg Ser Ser Ser Pro Ser Gly Arg Pro Ser Phe Ser Arg
420 425 430
Ser Leu Ser Val Gln Gln Val Lys Glu Leu Glu Ser Cys Phe Ser Lys
435 440 445
Leu Glu Ile Arg Asp Val Gln Met Asp Asp Arg Val Thr Leu Thr Arg
450 455 460
Trp Ser Lys Lys His Val Thr Arg Gly Ser Glu Lys Asn Ser Thr Asn
465 470 475 480
Ile Ile Glu Trp Lys Lys Lys Thr Val Glu Ser Lys Ser Ser Ala Trp
485 490 495
Glu Val Thr Glu Thr Ala Lys Cys Ile Ser Lys Ile Glu Gly Glu Glu
500 505 510
Ala Lys Met Thr Ala Trp Glu Asn Leu Gln Lys Ala Lys Ala Glu Ala
515 520 525
Ala Ile Gln Lys Leu Val Met Lys Leu Glu Lys Lys Arg Ser Tyr Ser
530 535 540
Leu Glu Arg Ile Phe Asn Thr Leu Arg Ser Ala His Arg Lys Thr His
545 550 555 560
Val Ile Arg Ser Thr Thr Thr Thr Asn Leu Asp Gln His Ile Ser Arg
565 570 575
Thr Val Lys Arg Pro Ser His Leu Ser Lys Asn Gly Gln Met Ser Ser
580 585 590
Leu Ser Gly Cys Phe Thr Cys His Ala Phe
595 600
<210>302
<211>1953
<212>DNA
<213>稻
<400>302
aggtgaggag gaagaggagg aggaggagtg gagaggcgac ggcgacgcgg gctcggagga 60
ggaggagggg gaagcggtca gtgactcctt ctcccactcg ctgagagagt gccagaagca 120
gcggaagctc agagcggagg gggctgcgtt gctgctttca ccggccaagc atgagctcac 180
cggcggaggt ggtgggagca tagaactgct ggtgctctcg ccgaggtgct tggttggggg 240
taatgttgga ggaatgagca agagctccac agcgtcatca cggagcagat caggcacatt 300
cccgagcccc ggtaccccaa actaccaccg gcattgcgct agcaccatgc agtaccctaa 360
gggatggagc tcagagcggg tgccacttgg aggtggtacc aataggaggt atgggggcag 420
tggggttgtt cttcctttca acaatgggag gaagctgcca tcaaaatggg aggatgcaga 480
gaagtggatc ctaagtccag tttcctgtga tgggattgga aggatgtcag ccccggcgcc 540
tcaccataga cggcccaagt caaagagtgg cccacttggc cacccaggcg gaataccggg 600
tgcttatgcg gctgcttcgc cgtttgtgcc ctgctttgat ggtgttctgg cagcggctaa 660
ttttgcagca cattctcctt tttctgctgg ggttctcatg ccagagcacg tgcgcaatgg 720
tgacttcagc agtggaagag gtagaagtgg ggatgatggc agtagccgat cttactctgc 780
agagaaggac ccatatatct tgagatcagc aagtatacat gcgtggacag agacacttat 840
ggaagcatcc gcctttgcta atatctcaga agaaactgca caagatgata aattgcaagg 900
cctgcgagga gaaactcctg ccatttccag tccaataata aagaaagatg ttgccacaca 960
aatgagtcct gatgacagta tatcgtcttc tccaaaagca agacattcat gttccagttt 1020
accatcagga catcctatta aagaaccaaa tagtaatgca cttaaacctg aagtccgaga 1080
tgtccaggta gatgatcaag taactgtgac ccggtggtcc aagcgacatg taacacgagg 1140
gtctgatagg cggtcaacaa atattgtcga gtggaggaag aaaacaattg agactcgagc 1200
tccatctttt gatgaaaaag aaagagaaag ctgcgtatca aagtgcaaga gggaggaagc 1260
gaagatcact gcttgggaaa atctgcagaa agcaaaagca gaggcagcaa ttcgaaagtt 1320
agagatgaag cttgaaaaga agaggtcatc atcgatggat agaatcttgg gcaaactacg 1380
cactgctcaa aagaaagcgc aagacatgcg tagtgcagtt tctgtgagtg aagatcaatg 1440
tggagtgaga gcaaccaaga aagcatcata cttgaggaga acgggcaaat cattcagttg 1500
ctgtttcacc tatcgtgctt gctagttgtg acatagttgg taccgtgggc gtagcaatgg 1560
atgtaccttt gtagaaactt tttggacgtt gcagctcatg tcagccaaca aatcagaatt 1620
aatcaggaag tcagattttt ccttgctgtg gcagctggag gtgacggggt tatttaaaga 1680
gaatttgcat ggtctgatcg atgaaatacc tgtagtgcca gtggagtggt ataaatcagt 1740
catcgagcaa aatctatatt gtagttaatt tcgtggatta ttgctcccgt tattctgtgc 1800
ctacaatcaa tctctgtaca cccaatagaa gctccttcga gttcgagagc tttatgctag 1860
tcaccaccag attggccagg ttcagtggtt ctcattctga ttgatatgta tctttccatg 1920
ggattctgta agcaaagcaa gccttggggc ttg 1953
<210>303
<211>423
<212>PRT
<213>稻
<400>303
Met Ser Lys Ser Ser Thr Ala Ser Ser Arg Ser Arg Ser Gly Thr Phe
1 5 10 15
Pro Ser Pro Gly Thr Pro Asn Tyr His Arg His Cys Ala Ser Thr Met
20 25 30
Gln Tyr Pro Lys Gly Trp Ser Ser Glu Arg Val Pro Leu Gly Gly Gly
35 40 45
Thr Asn Arg Arg Tyr Gly Gly Ser Gly Val Val Leu Pro Phe Asn Asn
50 55 60
Gly Arg Lys Leu Pro Ser Lys Trp Glu Asp Ala Glu Lys Trp Ile Leu
65 70 75 80
Ser Pro Val Ser Cys Asp Gly Ile Gly Arg Met Ser Ala Pro Ala Pro
85 90 95
His His Arg Arg Pro Lys Ser Lys Ser Gly Pro Leu Gly His Pro Gly
100 105 110
Gly Ile Pro Gly Ala Tyr Ala Ala Ala Ser Pro Phe Val Pro Cys Phe
115 120 125
Asp Gly Val Leu Ala Ala Ala Asn Phe Ala Ala His Ser Pro Phe Ser
130 135 140
Ala Gly Val Leu Met Pro Glu His Val Arg Asn Gly Asp Phe Ser Ser
145 150 155 160
Gly Arg Gly Arg Ser Gly Asp Asp Gly Ser Ser Arg Ser Tyr Ser Ala
165 170 175
Glu Lys Asp Pro Tyr Ile Leu Arg Ser Ala Ser Ile His Ala Trp Thr
180 185 190
Glu Thr Leu Met Glu Ala Ser Ala Phe Ala Asn Ile Ser Glu Glu Thr
195 200 205
Ala Gln Asp Asp Lys Leu Gln Gly Leu Arg Gly Glu Thr Pro Ala Ile
210 215 220
Ser Ser Pro Ile Ile Lys Lys Asp Val Ala Thr Gln Met Ser Pro Asp
225 230 235 240
Asp Ser Ile Ser Ser Ser Pro Lys Ala Arg His Ser Cys Ser Ser Leu
245 250 255
Pro Ser Gly His Pro Ile Lys Glu Pro Asn Ser Asn Ala Leu Lys Pro
260 265 270
Glu Val Arg Asp Val Gln Val Asp Asp Gln Val Thr Val Thr Arg Trp
275 280 285
Ser Lys Arg His Val Thr Arg Gly Ser Asp Arg Arg Ser Thr Asn Ile
290 295 300
Val Glu Trp Arg Lys Lys Thr Ile Glu Thr Arg Ala Pro Ser Phe Asp
305 310 315 320
Glu Lys Glu Arg Glu Ser Cys Val Ser Lys Cys Lys Arg Glu Glu Ala
325 330 335
Lys Ile Thr Ala Trp Glu Asn Leu Gln Lys Ala Lys Ala Glu Ala Ala
340 345 350
Ile Arg Lys Leu Glu Met Lys Leu Glu Lys Lys Arg Ser Ser Ser Met
355 360 365
Asp Arg Ile Leu Gly Lys Leu Arg Thr Ala Gln Lys Lys Ala Gln Asp
370 375 380
Met Arg Ser Ala Val Ser Val Ser Glu Asp Gln Cys Gly Val Arg Ala
385 390 395 400
Thr Lys Lys Ala Ser Tyr Leu Arg Arg Thr Gly Lys Ser Phe Ser Cys
405 410 415
Cys Phe Thr Tyr Arg Ala Cys
420
<210>304
<211>1824
<212>DNA
<213>玉米
<400>304
atggccacca ccctcgccag gagcatcagc aacagcaacg ggcacgaacg ccgccacgag 60
gcctccacca cctcgtcttc gtcgtcctcc tccacggcct cggctcagaa acgaaggggg 120
gagtcgcagc agcaggccgc cgtcgtcccg gcgacgccgg ggccgggtcc ggcgctgcag 180
ttcctcgcga gccccgccgc gcaccaccac cacccccaga cccagctcgt cgccccgagg 240
aggtcggtgc cgtccaagtg ggaggacgcg gagaagtggc tgcggcagtc gtcgtcgtcc 300
tcgggttccg accaccacct ccacggcaac gcgagggccg ccttctccag gcagcggagc 360
ggcgggctcg gacaccgagg cggcgccgga ggcgggggtg gggacgagaa gagcgcggcg 420
gtggcggtga ggaggtcggt ggacgcgctc cgggacgccc actcgctcgc gctgtacgcg 480
gcgccggcag cggaggtgct cctcaaagac aagttcaccg acaatgagga gccgtccaag 540
gagagcttcg tgttccggag ctcgtgctgc gaggctgctg aaccggcgaa gggcgccgac 600
gacgacgacg acggtcgctg ccagcggagg agggacgtcg gcacggagat gacgccgctg 660
ggcagctcgt gccacacgcc gctcaagagc gcgtccccgg cgcggcacaa cacgccggcg 720
agccggtcgt cgggcccgct ggtgccgtac accggcggcg gcggaacgga catctcggag 780
ctggcgggat tccgcctcgc caagctggac ctgggcgcgc ggttcggcgc ccacgccacg 840
ctcgtcggct ggagctccaa ggaggaggag gaggacgacg acgaggacgt gtccaagagc 900
ctcaggcact tcgaggccac cgtcggcggg acagcctgcg atagacgcgg cggcggcggc 960
gactgccgtt gggatgacga cgacagggcc aagagctgca tcaggtatca gagggaagag 1020
gcgaagatcc aggcctgggt taacctggag agcgccaagg ctgaagcgca gtcaagaaag 1080
ctggaggtga agatccagaa gatgcggtgc aacctagagg agaagctgat gcggcggatg 1140
acgacggtgc agcggcgcgc gggggagtgg cgcgccacgg cgcgggcgca gcacctccag 1200
cagctgcggc gcgcggccgc ccacggcgac ggcgacggac ggcggctcag ggccacggcc 1260
acgtccacgg cccaccacca ccaccgccac ctgccgggca gcagcgacgc gccctcctgc 1320
gcctgcttcc cctgcagcac cagcaccagc ggcggcggcg gcgtttttta cttgaagcgc 1380
gtcgcgacag agcacggcca tctatgccgc gcaggcgggg ggcccctgtc gtggagccgt 1440
gtgtccatgt cggggagcga gaagggggcg gctgaaccaa cgcgaggtga tggccaacca 1500
cgccgtggat gttactgcag cctgctgcta ctttcctcca ctgccgtgcc gcagcagcag 1560
caggcagagg ttggattgga ttggacggag aaagaagaag taccatcatg tcttgccttg 1620
accacgttcc ccgagtccca cgtcgacggc ggaggtcgag gtcgtcgtcg gccgtcgggg 1680
tcggggcacg acctcaccag gcctcctgct cctccatgga ctggggccac caacggtgat 1740
gggagtatta cgtgggcccg ccccgcctcc gagcgcaccg gccgtcttgg cacggccatc 1800
caggacggca aggccctgta ctag 1824
<210>305
<211>607
<212>PRT
<213>玉米
<400>305
Met Ala Thr Thr Leu Ala Arg Ser Ile Ser Asn Ser Asn Gly His Glu
1 5 10 15
Arg Arg His Glu Ala Ser Thr Thr Ser Ser Ser Ser Ser Ser Ser Thr
20 25 30
Ala Ser Ala Gln Lys Arg Arg Gly Glu Ser Gln Gln Gln Ala Ala Val
35 40 45
Val Pro Ala Thr Pro Gly Pro Gly Pro Ala Leu Gln Phe Leu Ala Ser
50 55 60
Pro Ala Ala His His His His Pro Gln Thr Gln Leu Val Ala Pro Arg
65 70 75 80
Arg Ser Val Pro Ser Lys Trp Glu Asp Ala Glu Lys Trp Leu Arg Gln
85 90 95
Ser Ser Ser Ser Ser Gly Ser Asp His His Leu His Gly Asn Ala Arg
100 105 110
Ala Ala Phe Ser Arg Gln Arg Ser Gly Gly Leu Gly His Arg Gly Gly
115 120 125
Ala Gly Gly Gly Gly Gly Asp Glu Lys Ser Ala Ala Val Ala Val Arg
130 135 140
Arg Ser Val Asp Ala Leu Arg Asp Ala His Ser Leu Ala Leu Tyr Ala
145 150 155 160
Ala Pro Ala Ala Glu Val Leu Leu Lys Asp Lys Phe Thr Asp Asn Glu
165 170 175
Glu Pro Ser Lys Glu Ser Phe Val Phe Arg Ser Ser Cys Cys Glu Ala
180 185 190
Ala Glu Pro Ala Lys Gly Ala Asp Asp Asp Asp Asp Gly Arg Cys Gln
195 200 205
Arg Arg Arg Asp Val Gly Thr Glu Met Thr Pro Leu Gly Ser Ser Cys
210 215 220
His Thr Pro Leu Lys Ser Ala Ser Pro Ala Arg His Asn Thr Pro Ala
225 230 235 240
Ser Arg Ser Ser Gly Pro Leu Val Pro Tyr Thr Gly Gly Gly Gly Thr
245 250 255
Asp Ile Ser Glu Leu Ala Gly Phe Arg Leu Ala Lys Leu Asp Leu Gly
260 265 270
Ala Arg Phe Gly Ala His Ala Thr Leu Val Gly Trp Ser Ser Lys Glu
275 280 285
Glu Glu Glu Asp Asp Asp Glu Asp Val Ser Lys Ser Leu Arg His Phe
290 295 300
Glu Ala Thr Val Gly Gly Thr Ala Cys Asp Arg Arg Gly Gly Gly Gly
305 310 315 320
Asp Cys Arg Trp Asp Asp Asp Asp Arg Ala Lys Ser Cys Ile Arg Tyr
325 330 335
Gln Arg Glu Glu Ala Lys Ile Gln Ala Trp Val Asn Leu Glu Ser Ala
340 345 350
Lys Ala Glu Ala Gln Ser Arg Lys Leu Glu Val Lys Ile Gln Lys Met
355 360 365
Arg Cys Asn Leu Glu Glu Lys Leu Met Arg Arg Met Thr Thr Val Gln
370 375 380
Arg Arg Ala Gly Glu Trp Arg Ala Thr Ala Arg Ala Gln His Leu Gln
385 390 395 400
Gln Leu Arg Arg Ala Ala Ala His Gly Asp Gly Asp Gly Arg Arg Leu
405 410 415
Arg Ala Thr Ala Thr Ser Thr Ala His His His His Arg His Leu Pro
420 425 430
Gly Ser Ser Asp Ala Pro Ser Cys Ala Cys Phe Pro Cys Ser Thr Ser
435 440 445
Thr Ser Gly Gly Gly Gly Val Phe Tyr Leu Lys Arg Val Ala Thr Glu
450 455 460
His Gly His Leu Cys Arg Ala Gly Gly Gly Pro Leu Ser Trp Ser Arg
465 470 475 480
Val Ser Met Ser Gly Ser Glu Lys Gly Ala Ala Glu Pro Thr Arg Gly
485 490 495
Asp Gly Gln Pro Arg Arg Gly Cys Tyr Cys Ser Leu Leu Leu Leu Ser
500 505 510
Ser Thr Ala Val Pro Gln Gln Gln Gln Ala Glu Val Gly Leu Asp Trp
515 520 525
Thr Glu Lys Glu Glu Val Pro Ser Cys Leu Ala Leu Thr Thr Phe Pro
530 535 540
Glu Ser His Val Asp Gly Gly Gly Arg Gly Arg Arg Arg Pro Ser Gly
545 550 555 560
Ser Gly His Asp Leu Thr Arg Pro Pro Ala Pro Pro Trp Thr Gly Ala
565 570 575
Thr Asn Gly Asp Gly Ser Ile Thr Trp Ala Arg Pro Ala Ser Glu Arg
580 585 590
Thr Gly Arg Leu Gly Thr Ala Ile Gln Asp Gly Lys Ala Leu Tyr
595 600 605
<210>306
<211>946
<212>DNA
<213>马铃薯
<400>306
ttaccttcct ccaactacta aatatcttct tctttgaaga attctctgtt ttcttgattc 60
tgtttgtagc catggcagaa ttggaagcta agaaagtaga aattgtggac cctgcacccc 120
ctgcgccagg acctgttgaa gctcctaaag aagtggtggc tgatgagaaa gccatagttg 180
caccagctct gcctcctcct gcagaagaaa aagaaaaacc cgatgactcg aaagcattag 240
ttgtcgttga aactaaagca ccagaacctg ctgatgagaa aaaagaggga tctattgaca 300
gagatgctgt gcttgctcgc gttgcaacag agaagagagt atcactcatc aaagcatggg 360
aggaaagtga gaaatcaaaa gccgaaaaca aagctcagaa gaaggtatct gcaattggtg 420
catgggagaa cagcaagaaa gctaacctag aggctgagct caaaaagatg gaggaacagt 480
tggagaaaaa gaaggccgaa tatactgaga aaatgaaaaa caaaattgct ctactccaca 540
aggaagcaga agaaaagaga gcgatgattg aagctaaacg tggagaagat cttctcaagg 600
cagaggagct tgcagcaaaa taccgtgcca ctggaactgc tccaaagaaa atccttggaa 660
tattttgaag cagcaagcac caggtctgca tcggtagtga ttgggagtta cattttgtaa 720
agtttgtgca attggaattt tgtttcttgt tagattacat ttgtgtgatt atgtatttta 780
gaaccattta ttgtttattg ttacgtgtgc atagtgatgt atttccagtg tatatagcac 840
ctggacaaat taactttgtg ggattgtatg aaaaaaaatg ttgaaggaaa tcttcatgtt 900
agtacacaac tcttgcagaa aaaaaaaaaa aaaaaaaaaa aaaaaa 946
<210>307
<211>198
<212>PRT
<213>马铃薯
<400>307
Met Ala Glu Leu Glu Ala Lys Lys Val Glu Ile Val Asp Pro Ala Pro
1 5 10 15
Pro Ala Pro Gly Pro Val Glu Ala Pro Lys Glu Val Val Ala Asp Glu
20 25 30
Lys Ala Ile Val Ala Pro Ala Leu Pro Pro Pro Ala Glu Glu Lys Glu
35 40 45
Lys Pro Asp Asp Ser Lys Ala Leu Val Val Val Glu Thr Lys Ala Pro
50 55 60
Glu Pro Ala Asp Glu Lys Lys Glu Gly Ser Ile Asp Arg Asp Ala Val
65 70 75 80
Leu Ala Arg Val Ala Thr Glu Lys Arg Val Ser Leu Ile Lys Ala Trp
85 90 95
Glu Glu Ser Glu Lys Ser Lys Ala Glu Asn Lys Ala Gln Lys Lys Val
100 105 110
Ser Ala Ile Gly Ala Trp Glu Asn Ser Lys Lys Ala Asn Leu Glu Ala
115 120 125
Glu Leu Lys Lys Met Glu Glu Gln Leu Glu Lys Lys Lys Ala Glu Tyr
130 135 140
Thr Glu Lys Met Lys Asn Lys Ile Ala Leu Leu His Lys Glu Ala Glu
145 150 155 160
Glu Lys Arg Ala Met Ile Glu Ala Lys Arg Gly Glu Asp Leu Leu Lys
165 170 175
Ala Glu Glu Leu Ala Ala Lys Tyr Arg Ala Thr Gly Thr Ala Pro Lys
180 185 190
Lys Ile Leu Gly Ile Phe
195
<210>308
<211>1581
<212>DNA
<213>大豆
<400>308
atggcggagg tagggtttca ggaacgaagc tcgtggagag tggggctgag agcgcgctat 60
agcagccccg actctgtggt tttcactctc gaatcgaact tgagcctctt ctcctatgcg 120
tccgcgagcg ttgatcgatg ctccttttca tctgattcac acgaccacga ctctttcgtc 180
tccgaaatct cactggatat gcggtggtgg tggcataata ataataataa tggaaaagat 240
tacaaacacg ccacgagggc ttttaatttc ggaaaaattg acgctgatat tcaagaaccc 300
gtggagttgg attctgccag aaactctttc tctttagccc tcaaagaggc tgcttctttg 360
gatctgaaca atgcctctgg ctctggatct ttgccgcgcc ttcaaacatt gaaaaagact 420
tccatttctt ctcgaaggtc tggtactgcc actttcccta gtcctggtac actcaattat 480
cgcgttgcaa tgcacaaggg atggagctcc gagcgagttc ccttgcatgc aggtgctacc 540
cggaagcacg ttttgccgtt caacaatggg aaaacattgc cgtcaaagtg ggaagatgct 600
gagaggtgga ttctcagccc tgtttcggca gatggcactg ggagggcctc gcttaatgca 660
ccccaaagga ggccaaagtc caagagcggt cctcttggac cccctggtgt tgcgtatcat 720
tctatgtact cgccggccgc gccggtgttt gaagtgggga atggggggag ttttatggaa 780
ggttctccgt ttacaggtga tgggttaata atctgcaccg gtggccatgg tggagctctt 840
tccgtgagaa cagaaccttg catggcacgc tcagcaagtg tccacggatg ctctaagata 900
cagagtcagt catcatcaat gcccctccaa gaggataagt ttggtgggtt caaagatgtg 960
ggcaccaatg tgtcccgtgc cacttcaagg agggacatgg cgacccagat gagcccacag 1020
ggtagctcac gctcctctcc taatctgagg ccttctttct ctgcctccac cccatcaacc 1080
ttgcctgtca cagaattgcg gactgttggt tcctctaaag tggatattag ggatgtgcag 1140
gtagatgaac acgttaccgt gaeaagatgg tccaagaaac atagggccct attcactggc 1200
agaggctcag aaaaagtcga aagctggaaa aaagaactaa gcactcaatc gtcaacttgg 1260
gacgtttctg aaacgtcaaa gcctgcctca aagacaagaa gtgaggaagc caaaatctct 1320
gcatgggaga acttgcaaaa ggcaaaagca gaagcagcaa tacggaaact agagatgaaa 1380
ttggaaaaaa ggcgagcatc ctctatggat aagattatga acaagcttag attggcccag 1440
aaaaaagctc aggaaatgag aagttcagtt ccacacaacc aaaccgatcg ggttgtaaga 1500
acttcacaca aggcttcatc atttcttaga accagccaga tgcgttcttt gagtggttgt 1560
ttcacttgcc atgtctttta a 1581
<210>309
<211>526
<212>PRT
<213>大豆
<400>309
Met Ala Glu Val Gly Phe Gln Glu Arg Ser Ser Trp Arg Val Gly Leu
1 5 10 15
Arg Ala Arg Tyr Ser Ser Pro Asp Ser Val Val Phe Thr Leu Glu Ser
20 25 30
Asn Leu Ser Leu Phe Ser Tyr Ala Ser Ala Ser Val Asp Arg Cys Ser
35 40 45
Phe Ser Ser Asp Ser His Asp His Asp Ser Phe Val Ser Glu Ile Ser
50 55 60
Leu Asp Met Arg Trp Trp Trp His Asn Asn Asn Asn Asn Gly Lys Asp
65 70 75 80
Tyr Lys His Ala Thr Arg Ala Phe Asn Phe Gly Lys Ile Asp Ala Asp
85 90 95
Ile Gln Glu Pro Val Glu Leu Asp Ser Ala Arg Asn Ser Phe Ser Leu
100 105 110
Ala Leu Lys Glu Ala Ala Ser Leu Asp Leu Asn Asn Ala Ser Gly Ser
115 120 125
Gly Ser Leu Pro Arg Leu Gln Thr Leu Lys Lys Thr Ser Ile Ser Ser
130 135 140
Arg Arg Ser Gly Thr Ala Thr Phe Pro Ser Pro Gly Thr Leu Asn Tyr
145 150 155 160
Arg Val Ala Met His Lys Gly Trp Ser Ser Glu Arg Val Pro Leu His
165 170 175
Ala Gly Ala Thr Arg Lys His Val Leu Pro Phe Asn Asn Gly Lys Thr
180 185 190
Leu Pro Ser Lys Trp Glu Asp Ala Glu Arg Trp Ile Leu Ser Pro Val
195 200 205
Ser Ala Asp Gly Thr Gly Arg Ala Ser Leu Asn Ala Pro Gln Arg Arg
210 215 220
Pro Lys Ser Lys Ser Gly Pro Leu Gly Pro Pro Gly Val Ala Tyr His
225 230 235 240
Ser Met Tyr Ser Pro Ala Ala Pro Val Phe Glu Val Gly Asn Gly Gly
245 250 255
Ser Phe Met Glu Gly Ser Pro Phe Thr Gly Asp Gly Leu Ile Ile Cys
260 265 270
Thr Gly Gly His Gly Gly Ala Leu Ser Val Arg Thr Glu Pro Cys Met
275 280 285
Ala Arg Ser Ala Ser Val His Gly Cys Ser Lys Ile Gln Ser Gln Ser
290 295 300
Ser Ser Met Pro Leu Gln Glu Asp Lys Phe Gly Gly Phe Lys Asp Val
305 310 315 320
Gly Thr Asn Val Ser Arg Ala Thr Ser Arg Arg Asp Met Ala Thr Gln
325 330 335
Met Ser Pro Gln Gly Ser Ser Arg Ser Ser Pro Asn Leu Arg Pro Ser
340 345 350
Phe Ser Ala Ser Thr Pro Ser Thr Leu Pro Val Thr Glu Leu Arg Thr
355 360 365
Val Gly Ser Ser Lys Val Asp Ile Arg Asp Val Gln Val Asp Glu His
370 375 380
Val Thr Val Thr Arg Trp Ser Lys Lys His Arg Ala Leu Phe Thr Gly
385 390 395 400
Arg Gly Ser Glu Lys Val Glu Ser Trp Lys Lys Glu Leu Ser Thr Gln
405 410 415
Ser Ser Thr Trp Asp Val Ser Glu Thr Ser Lys Pro Ala Ser Lys Thr
420 425 430
Arg Ser Glu Glu Ala Lys Ile Ser Ala Trp Glu Asn Leu Gln Lys Ala
435 440 445
Lys Ala Glu Ala Ala Ile Arg Lys Leu Glu Met Lys Leu Glu Lys Arg
450 455 460
Arg Ala Ser Ser Met Asp Lys Ile Met Asn Lys Leu Arg Leu Ala Gln
465 470 475 480
Lys Lys Ala Gln Glu Met Arg Ser Ser Val Pro His Asn Gln Thr Asp
485 490 495
Arg Val Val Arg Thr Ser His Lys Ala Ser Ser Phe Leu Arg Thr Ser
500 505 510
Gln Met Arg Ser Leu Ser Gly Cys Phe Thr Cys His Val Phe
515 520 525
<210>310
<211>840
<212>DNA
<213>蒺藜苜蓿
<400>310
atgttgaata ataatctaaa tacttccacc agccatatat cagaggaaaa ccaagaagat 60
gaacaaataa cagaaataag agaaatccat gccttaacac cacctcgtct tccacctcct 120
ccaccaccaa ccaaccgcgg cagccatagc caccgttcat catctctatc catggctagc 180
acagatagtg aaaacttcac aactataagc agagaattca atgctctagt tctagcagga 240
tcaactgttg accacaacaa cataagtcct catgaacatg aaacagctaa caacaacaat 300
aacaataaca gcaacaattt gaggaggatt agagaagatg atcatatgat ggaagaaacc 360
aatcctttgg cgattgtggt agataacagc ccttttgatc ctattccatc tcctactagc 420
agaagaaata tggctagtgg aagttcacgt gcaagtggtc aaggtggtag tgaagaacat 480
gtgtcggtgg atagggtgaa gaaggaggaa gttgatgcaa agatatcagc ttggcagaat 540
gctaaagttg ctaagattaa taacaggttc aagagagatg atgctgtcat caatggctgg 600
gagagtgaac aggttcagaa agctacttca tggatgaaaa aagttgagag gaagctggaa 660
gagaaaagag caagagcctt ggagaagacg caaaacaaaa tagcgaaagc tcgaagaaaa 720
gccgaagaga ggaaagcatc agcagaggca aaaagaggaa ctaaagtggc tagagttctt 780
gagattgcta atcttatgag agcagttgga agacctcctg ctaaaaaatc tttcttctaa 840
<210>311
<211>279
<212>PRT
<213>蒺藜苜蓿
<400>311
Met Leu Asn Asn Asn Leu Asn Thr Ser Thr Ser His Ile Ser Glu Glu
1 5 10 15
Asn Gln Glu Asp Glu Gln Ile Thr Glu Ile Arg Glu Ile His Ala Leu
20 25 30
Thr Pro Pro Arg Leu Pro Pro Pro Pro Pro Pro Thr Asn Arg Gly Ser
35 40 45
His Ser His Arg Ser Ser Ser Leu Ser Met Ala Ser Thr Asp Ser Glu
50 55 60
Asn Phe Thr Thr Ile Ser Arg Glu Phe Asn Ala Leu Val Leu Ala Gly
65 70 75 80
Ser Thr Val Asp His Asn Asn Ile Ser Pro His Glu His Glu Thr Ala
85 90 95
Asn Asn Asn Asn Asn Asn Asn Ser Asn Asn Leu Arg Arg Ile Arg Glu
100 105 110
Asp Asp His Met Met Glu Glu Thr Asn Pro Leu Ala Ile Val Val Asp
115 120 125
Asn Ser Pro Phe Asp Pro Ile Pro Ser Pro Thr Ser Arg Arg Asn Met
130 135 140
Ala Ser Gly Ser Ser Arg Ala Ser Gly Gln Gly Gly Ser Glu Glu His
145 150 155 160
Val Ser Val Asp Arg Val Lys Lys Glu Glu Val Asp Ala Lys Ile Ser
165 170 175
Ala Trp Gln Asn Ala Lys Val Ala Lys Ile Asn Asn Arg Phe Lys Arg
180 185 190
Asp Asp Ala Val Ile Asn Gly Trp Glu Ser Glu Gln Val Gln Lys Ala
195 200 205
Thr Ser Trp Met Lys Lys Val Glu Arg Lys Leu Glu Glu Lys Arg Ala
210 215 220
Arg Ala Leu Glu Lys Thr Gln Asn Lys Ile Ala Lys Ala Arg Arg Lys
225 230 235 240
Ala Glu Glu Arg Lys Ala Ser Ala Glu Ala Lys Arg Gly Thr Lys Val
245 250 255
Ala Arg Val Leu Glu Ile Ala Asn Leu Met Arg Ala Val Gly Arg Pro
260 265 270
Pro Ala Lys Lys Ser Phe Phe
275
<210>312
<211>1863
<212>DNA
<213>蒺藜苜蓿
<400>312
atgcgtgatt tagggtttca cgaacaacga cgctcgtgga ggcgtaacac cggttcaaga 60
acacgcaaca ccaccgccaa caccgtcacc ggcggcggcg atacaagtcc tgactccgtc 120
atcttcactc tcgaatctaa cttaagtctc ttctcctccg cttccgccag cgtcgatcgc 180
tgctccttcg cttccgatgc tcacgaccgc gactccttaa actccgaaat ctcactgcat 240
ttggcaggtc acggtggtga ttttgctccc agtgaaagct ggagtggtcc agatccggat 300
ccggatccga atcaaaatca taacagaaaa caacatgcag attcagattc agttcagaaa 360
aagaaacttg gcgaaactct tttctctgga aaagcagaaa aaacaaaagt tcaaaaggaa 420
gatagtgaca ttgattctaa agacggaaat caactttcgg aatttgattc tgcgagaaac 480
tctttctctc tagctctcaa agaatgtcaa gatcggagat cgagatgtga atctttattt 540
aaaaagcaag atcggcgaag acctgcttcg ttagatctga acaatgctaa tgcaactgga 600
actggttctt cgcctcgatt agttggagct gtgaagaaga gtatggttca gtctaggaaa 660
tcgggaacgg gtacagcgac ggggactggt acatttccga gtcctgggac tccgaattat 720
cgtcattgtc aaggcggtgt tgcaatgcaa aaaggttgga gttctgagag agttgcaagt 780
gggggccgca agcaagttgg taatggtgtg actgctttgt gtttaagtaa tgggagaacg 840
ttgccgtcga agtgggaaga tgctgagagg tggattttga gtcctgtttc agggggtgat 900
ggaactggaa gggtttcagt tccacagcca ttaaggaggc cgaagtcgaa gagtggtccg 960
cttggtccac ctggtgttgc gtattattcg ttgtattcgc ctgcaggtca cttttttgat 1020
ggagggaatt ttatgacggc tgcttcacct ttttctgctg ctgttaatgc ttcagctgat 1080
gggtttacaa atagttctgg tggcaatggt ggtggagggc ttcccacacg aacggatcct 1140
tgcatggctc gctcagttag tgtacatgga tgctctcaga tgcagggtca atcgtcgatt 1200
ccttcccgag aggagaagtt tgatgctttc aaggatgcgg gcaccaatgt atctcctgct 1260
gtttcaagaa gggacatggc aacccagatg agcccagagg gtagctcgtg ctcctctccc 1320
aatatgatga cttctttctc tgcttccatt ccacctaccc tgcccgtaac cgatttgcag 1380
agtatctctt tctctaaaat ggatatcagg gatgtgcagg tggatgaacg tgtaaccatg 1440
acaaggtggt ccaagaagca caaggcccta ttcactggta gaggttcaga aaatgttgac 1500
agctggaaaa agaaagaaac cagcactcga tcttcatctt gggaaatttc tgaacgctca 1560
aagactgttt cgaaggctaa aagggaggaa gccaaaatca ccgcatggga aaatttgcaa 1620
aaggcaaaag ctgaagcagc aatacagaaa ctagagatga agttggaaaa gaagcgagca 1680
tcttccatgg ataagattat gaacaaactg aaattcgctc agaaaaaggc tcaggaaatg 1740
aggagttcag tttcagtcga ccaggctcat caagttgcca gaacttctca caaggttatg 1800
tcatttcgga gagctggcca gatgggttct ttgagtggtt gtttcacctg tcatgccttt 1860
taa 1863
<210>313
<211>620
<212>PRT
<213>蒺藜苜蓿
<400>313
Met Arg Asp Leu Gly Phe His Glu Gln Arg Arg Ser Trp Arg Arg Asn
1 5 10 15
Thr Gly Ser Arg Thr Arg Asn Thr Thr Ala Asn Thr Val Thr Gly Gly
20 25 30
Gly Asp Thr Ser Pro Asp Ser Val Ile Phe Thr Leu Glu Ser Asn Leu
35 40 45
Ser Leu Phe Ser Ser Ala Ser Ala Ser Val Asp Arg Cys Ser Phe Ala
50 55 60
Ser Asp Ala His Asp Arg Asp Ser Leu Asn Ser Glu Ile Ser Leu His
65 70 75 80
Leu Ala Gly His Gly Gly Asp Phe Ala Pro Ser Glu Ser Trp Ser Gly
85 90 95
Pro Asp Pro Asp Pro Asp Pro Asn Gln Asn His Asn Arg Lys Gln His
100 105 110
Ala Asp Ser Asp Ser Val Gln Lys Lys Lys Leu Gly Glu Thr Leu Phe
115 120 125
Ser Gly Lys Ala Glu Lys Thr Lys Val Gln Lys Glu Asp Ser Asp Ile
130 135 140
Asp Ser Lys Asp Gly Asn Gln Leu Ser Glu Phe Asp Ser Ala Arg Asn
145 150 155 160
Ser Phe Ser Leu Ala Leu Lys Glu Cys Gln Asp Arg Arg Ser Arg Cys
165 170 175
Glu Ser Leu Phe Lys Lys Gln Asp Arg Arg Arg Pro Ala Ser Leu Asp
180 185 190
Leu Asn Asn Ala Asn Ala Thr Gly Thr Gly Ser Ser Pro Arg Leu Val
195 200 205
Gly Ala Val Lys Lys Ser Met Val Gln Ser Arg Lys Ser Gly Thr Gly
210 215 220
Thr Ala Thr Gly Thr Gly Thr Phe Pro Ser Pro Gly Thr Pro Asn Tyr
225 230 235 240
Arg His Cys Gln Gly Gly Val Ala Met Gln Lys Gly Trp Ser Ser Glu
245 250 255
Arg Val Ala Ser Gly Gly Arg Lys Gln Val Gly Asn Gly Val Thr Ala
260 265 270
Leu Cys Leu Ser Asn Gly Arg Thr Leu Pro Ser Lys Trp Glu Asp Ala
275 280 285
Glu Arg Trp Ile Leu Ser Pro Val Ser Gly Gly Asp Gly Thr Gly Arg
290 295 300
Val Ser Val Pro Gln Pro Leu Arg Arg Pro Lys Ser Lys Ser Gly Pro
305 310 315 320
Leu Gly Pro Pro Gly Val Ala Tyr Tyr Ser Leu Tyr Ser Pro Ala Gly
325 330 335
His Phe Phe Asp Gly Gly Asn Phe Met Thr Ala Ala Ser Pro Phe Ser
340 345 350
Ala Ala Val Asn Ala Ser Ala Asp Gly Phe Thr Asn Ser Ser Gly Gly
355 360 365
Asn Gly Gly Gly Gly Leu Pro Thr Arg Thr Asp Pro Cys Met Ala Arg
370 375 380
Ser Val Ser Val His Gly Cys Ser Gln Met Gln Gly Gln Ser Ser Ile
385 390 395 400
Pro Ser Arg Glu Glu Lys Phe Asp Ala Phe Lys Asp Ala Gly Thr Asn
405 410 415
Val Ser Pro Ala Val Ser Arg Arg Asp Met Ala Thr Gln Met Ser Pro
420 425 430
Glu Gly Ser Ser Cys Ser Ser Pro Asn Met Met Thr Ser Phe Ser Ala
435 440 445
Ser Ile Pro Pro Thr Leu Pro Val Thr Asp Leu Gln Ser Ile Ser Phe
450 455 460
Ser Lys Met Asp Ile Arg Asp Val Gln Val Asp Glu Arg Val Thr Met
465 470 475 480
Thr Arg Trp Ser Lys Lys His Lys Ala Leu Phe Thr Gly Arg Gly Ser
485 490 495
Glu Asn Val Asp Ser Trp Lys Lys Lys Glu Thr Ser Thr Arg Ser Ser
500 505 510
Ser Trp Glu Ile Ser Glu Arg Ser Lys Thr Val Ser Lys Ala Lys Arg
515 520 525
Glu Glu Ala Lys Ile Thr Ala Trp Glu Asn Leu Gln Lys Ala Lys Ala
530 535 540
Glu Ala Ala Ile Gln Lys Leu Glu Met Lys Leu Glu Lys Lys Arg Ala
545 550 555 560
Ser Ser Met Asp Lys Ile Met Asn Lys Leu Lys Phe Ala Gln Lys Lys
565 570 575
Ala Gln Glu Met Arg Ser Ser Val Ser Val Asp Gln Ala His Gln Val
580 585 590
Ala Arg Thr Ser His Lys Val Met Ser Phe Arg Arg Ala Gly Gln Met
595 600 605
Gly Ser Leu Ser Gly Cys Phe Thr Cys His Ala Phe
610 615 620
<210>314
<211>1392
<212>DNA
<213>蒺藜苜蓿
<400>314
atgaacatgt atagcaaaaa caaggactat tacaacaaca aaaacaaccc ttttgttgat 60
gatttcattg atccactttg caagctgaac ctaaaagaaa cctctgagtt tgtcaaatct 120
ttaccagttt caaacaccaa tgcagaaaac agaagactca gcaatgattc tgtaacacaa 180
atgagaaaac tagaagctcc ttctacacct ggtagaccac ttttcagctt cagttcttct 240
tcttcttcaa gcattgttgg tagaaacctt ccaagaaaga gttttccttc taaatgggat 300
gatgctgaaa aatggcttat aagcacttct tgtcatgact caccagctca taataacaac 360
actttgaaag gtgtttcatc tttagaatct ggaacaagac attgtgataa tggttttaag 420
cagaaaatgg aagaagggtt ttcagagaaa tcaagggtca tagaagaaaa agtgttgtca 480
aaaagtgtta ctaattttca aagttcttct tcaagtttgg accacaataa cagtgttgga 540
gctttcaatg gtatctcatg tccaccaaca gacatagtac taaaagataa gtacacagac 600
agcatagagc caattttacc aaaattccgg tattcagaac caacaaaaga aggattctta 660
ttcagaaatc aagcttgtga ggcaatgcat gaatcttaca cagaagtgat tcatgaagtt 720
aaacacaaag atgttggcac agaaatgact ccattaggaa gttccacaac ttcaagatgt 780
cacacaccat tcaagagttc atcgcctgcg cgccataaca ctcctgctag taggtcagga 840
ccattggcat tatctaacat tgacagcaat ggatgcagtg ttgatgctat tcagctagaa 900
gagtgtcatt tttctaaact gcaatttgga acgacaaagt atgatttggt tgcaccaaat 960
tggagctcaa gtgaagagga ggaaaaggaa atatcgaaaa gtttgagaca taatgctagt 1020
ttgaaagccg attctgattg tatagctgcc agttgggaag aagatgagaa gaacaagtgc 1080
tgtcttaggt atcagagaga agaagcaaaa atccaagcat ggataaacct ccaaaatgct 1140
aaagcagaag ccaggtcaaa aaagcttgag gtgaaaatcc aaaagatgag atcaaaccta 1200
gaagagaagt taatgaagag gatgtcagtg gttcacagga aagctgagga ttggagagaa 1260
acagctagac aacaacactt agagcaaatg gagaaatcaa ctcaacatgc taaaaagatt 1320
attcataggc ataactcaca attttctagg cacagttcat gtggatgctt tccttgcaat 1380
aaeaaccatt aa 1392
<210>315
<211>463
<212>PRT
<213>蒺藜苜蓿
<400>315
Met Asn Met Tyr Ser Lys Asn Lys Asp Tyr Tyr Asn Asn Lys Asn Asn
1 5 10 15
Pro Phe Val Asp Asp Phe Ile Asp Pro Leu Cys Lys Leu Asn Leu Lys
20 25 30
Glu Thr Ser Glu Phe Val Lys Ser Leu Pro Val Ser Asn Thr Asn Ala
35 40 45
Glu Asn Arg Arg Leu Ser Asn Asp Ser Val Thr Gln Met Arg Lys Leu
50 55 60
Glu Ala Pro Ser Thr Pro Gly Arg Pro Leu Phe Ser Phe Ser Ser Ser
65 70 75 80
Ser Ser Ser Ser Ile Val Gly Arg Asn Leu Pro Arg Lys Ser Phe Pro
85 90 95
Ser Lys Trp Asp Asp Ala Glu Lys Trp Leu Ile Ser Thr Ser Cys His
100 105 110
Asp Ser Pro Ala His Asn Asn Asn Thr Leu Lys Gly Val Ser Ser Leu
115 120 125
Glu Ser Gly Thr Arg His Cys Asp Asn Gly Phe Lys Gln Lys Met Glu
130 135 140
Glu Gly Phe Ser Glu Lys Ser Arg Val Ile Glu Glu Lys Val Leu Ser
145 150 155 160
Lys Ser Val Thr Asn Phe Gln Ser Ser Ser Ser Ser Leu Asp His Asn
165 170 175
Asn Ser Val Gly Ala Phe Asn Gly Ile Ser Cys Pro Pro Thr Asp Ile
180 185 190
Val Leu Lys Asp Lys Tyr Thr Asp Ser Ile Glu Pro Ile Leu Pro Lys
195 200 205
Phe Arg Tyr Ser Glu Pro Thr Lys Glu Gly Phe Leu Phe Arg Asn Gln
210 215 220
Ala Cys Glu Ala Met His Glu Ser Tyr Thr Glu Val Ile His Glu Val
225 230 235 240
Lys His Lys Asp Val Gly Thr Glu Met Thr Pro Leu Gly Ser Ser Thr
245 250 255
Thr Ser Arg Cys His Thr Pro Phe Lys Ser Ser Ser Pro Ala Arg His
260 265 270
Asn Thr Pro Ala Ser Arg Ser Gly Pro Leu Ala Leu Ser Asn Ile Asp
275 280 285
Ser Asn Gly Cys Ser Val Asp Ala Ile Gln Leu Glu Glu Cys His Phe
290 295 300
Ser Lys Leu Gln Phe Gly Thr Thr Lys Tyr Asp Leu Val Ala Pro Asn
305 310 315 320
Trp Ser Ser Ser Glu Glu Glu Glu Lys Glu Ile Ser Lys Ser Leu Arg
325 330 335
His Asn Ala Ser Leu Lys Ala Asp Ser Asp Cys Ile Ala Ala Ser Trp
340 345 350
Glu Glu Asp Glu Lys Asn Lys Cys Cys Leu Arg Tyr Gln Arg Glu Glu
355 360 365
Ala Lys Ile Gln Ala Trp Ile Asn Leu Gln Asn Ala Lys Ala Glu Ala
370 375 380
Arg Ser Lys Lys Leu Glu Val Lys Ile Gln Lys Met Arg Ser Asn Leu
385 390 395 400
Glu Glu Lys Leu Met Lys Arg Met Ser Val Val His Arg Lys Ala Glu
405 410 415
Asp Trp Arg Glu Thr Ala Arg Gln Gln His Leu Glu Gln Met Glu Lys
420 425 430
Ser Thr Gln His Ala Lys Lys Ile Ile His Arg His Asn Ser Gln Phe
435 440 445
Ser Arg His Ser Ser Cys Gly Cys Phe Pro Cys Asn Asn Asn His
450 455 460
<210>316
<211>594
<212>DNA
<213>番茄
<400>316
atggcagaat tggaagctaa gaaagtagaa attgtggacc ctgcccctgc acaagaacca 60
gttgaagctc ctaaagaagt ggtggctgat gagaaagcca tagttgaacc agctccgcct 120
cctcctgcag aagaaaaaga aaaacccgat gactcgaaag cactagttgt tgtcgaaaat 180
aaagcagaag aagctgctga tgagaaaaaa gagggatcta ttgatagaga tgctgtgctt 240
gcacgcgttg caactgagaa gaggctatca ctcatcaaag catgggaaga aagtgagaaa 300
tcaaaagccg aaaacaaagc tcagaagaag gtgtctgcaa ttggtgcatg ggagaacagc 360
aagaaagcaa acctagagtc tgagctcaaa aagatggagg aacagttgga gaaaaagaag 420
gcaatatata ctgagaaaat gaaaaacaaa attgctctac tccacaagga agcagaagaa 480
aagagagcga tgattgaagc taaacgtgga gaagatcttc tcaaggcaga ggagcttgca 540
gcaaaatacc gcgccactgg aactgctcca aagaaaatcc ttggaatatt ttga 594
<210>317
<211>197
<212>PRT
<213>番茄
<400>317
Met Ala Glu Leu Glu Ala Lys Lys Val Glu Ile Val Asp Pro Ala Pro
1 5 10 15
Ala Gln Glu Pro Val Glu Ala Pro Lys Glu Val Val Ala Asp Glu Lys
20 25 30
Ala Ile Val Glu Pro Ala Pro Pro Pro Pro Ala Glu Glu Lys Glu Lys
35 40 45
Pro Asp Asp Ser Lys Ala Leu Val Val Val Glu Asn Lys Ala Glu Glu
50 55 60
Ala Ala Asp Glu Lys Lys Glu Gly Ser Ile Asp Arg Asp Ala Val Leu
65 70 75 80
Ala Arg Val Ala Thr Glu Lys Arg Leu Ser Leu Ile Lys Ala Trp Glu
85 90 95
Glu Ser Glu Lys Ser Lys Ala Glu Asn Lys Ala Gln Lys Lys Val Ser
100 105 110
Ala Ile Gly Ala Trp Glu Asn Ser Lys Lys Ala Asn Leu Glu Ser Glu
115 120 125
Leu Lys Lys Met Glu Glu Gln Leu Glu Lys Lys Lys Ala Ile Tyr Thr
130 135 140
Glu Lys Met Lys Asn Lys Ile Ala Leu Leu His Lys Glu Ala Glu Glu
145 150 155 160
Lys Arg Ala Met Ile Glu Ala Lys Arg Gly Glu Asp Leu Leu Lys Ala
165 170 175
Glu Glu Leu Ala Ala Lys Tyr Arg Ala Thr Gly Thr Ala Pro Lys Lys
180 185 190
Ile Leu Gly Ile Phe
195
<210>318
<211>525
<212>DNA
<213>番茄
<400>318
atggcagaag ctactgcagt tgcagctcaa cctcaaccag aatcaacaac tcctcctccc 60
atggccaaat ctgatgactc taaagctatt gctactcttc ccccaacaaa gcctgactct 120
tcaacaaaga aaagttcaaa gggatccttc gacagagatg ttgctctcgc acaccttgaa 180
gaagagaaaa ggaattccta tatcaaggca tgggaagaaa gtgaaaaaag caaggtgaat 240
aacaaggccg agaagaagct ctcgtcagtt ggaacatggg agaacaccaa gaaagcaaat 300
attgaagcta aactgaagaa acttgaggaa caactagagc aaaagaaggc agaatatgca 360
gagaagatta aaaataaagt agctgcagtt cacatggagg cagaggaaaa gagagctatg 420
gttgaagcga gacgaggaga agaacttctt aaagcagagg agatagctgc caagtatcgt 480
gctacgggac aagcccctaa gaagattgga tgccttggat gttaa 525
<210>319
<211>174
<212>PRT
<213>番茄
<400>319
Met Ala Glu Ala Thr Ala Val Ala Ala Gln Pro Gln Pro Glu Ser Thr
1 5 10 15
Thr Pro Pro Pro Met Ala Lys Ser Asp Asp Ser Lys Ala Ile Ala Thr
20 25 30
Leu Pro Pro Thr Lys Pro Asp Ser Ser Thr Lys Lys Ser Ser Lys Gly
35 40 45
Ser Phe Asp Arg Asp Val Ala Leu Ala His Leu Glu Glu Glu Lys Arg
50 55 60
Asn Scr Tyr Ile Lys Ala Trp Glu Glu Ser Glu Lys Ser Lys Val Asn
65 70 75 80
Asn Lys Ala Glu Lys Lys Leu Ser Ser Val Gly Thr Trp Glu Asn Thr
85 90 95
Lys Lys Ala Asn Ile Glu Ala Lys Leu Lys Lys Leu Glu Glu Gln Leu
100 105 110
Glu Gln Lys Lys Ala Glu Tyr Ala Glu Lys Ile Lys Asn Lys Val Ala
115 120 125
Ala Val His Met Glu Ala Glu Glu Lys Arg Ala Met Val Glu Ala Arg
130 135 140
Arg Gly Glu Glu Leu Leu Lys Ala Glu Glu Ile Ala Ala Lys Tyr Arg
145 150 155 160
Ala Thr Gly Gln Ala Pro Lys Lys Ile Gly Cys Leu Gly Cys
165 170
<210>320
<211>402
<212>DNA
<213>蒺藜苜蓿
<400>320
atggcagaga cacaagtaaa atcagaatca tcatctgata ttgttctagc agaagtgacc 60
aaagagaaaa agctatgtta tgtgaaagca tgggaagaaa gtgaaaaaac caaagcagat 120
aacaaagctc acaagcacat ctcttccatt gctgcttggg aagacagcaa aaaggcagct 180
ctagaagctg agctcaaaaa aattgaggaa caactagaga gaaagaaagc aagatatggt 240
gaaataatga gaaacaagat agcattagtt cacaaggaag cagaggagaa gagggcaatg 300
attgaagcca aacgaggtga agaggttctt aaggtacagg aaatggctgc taaataccgt 360
gcaactggaa ccactccaaa aaagaccatt ggatgttttt ga 402
<210>321
<211>133
<212>PRT
<213>蒺藜苜蓿
<400>321
Met Ala Glu Thr Gln Val Lys Ser Glu Ser Ser Ser Asp Ile Val Leu
1 5 10 15
Ala Glu Val Thr Lys Glu Lys Lys Leu Cys Tyr Val Lys Ala Trp Glu
20 25 30
Glu Ser Glu Lys Thr Lys Ala Asp Asn Lys Ala His Lys His Ile Ser
35 40 45
Ser Ile Ala Ala Trp Glu Asp Ser Lys Lys Ala Ala Leu Glu Ala Glu
50 55 60
Leu Lys Lys Ile Glu Glu Gln Leu Glu Arg Lys Lys Ala Arg Tyr Gly
65 70 75 80
Glu Ile Met Arg Asn Lys Ile Ala Leu Val His Lys Glu Ala Glu Glu
85 90 95
Lys Arg Ala Met Ile Glu Ala Lys Arg Gly Glu Glu Val Leu Lys Val
100 105 110
Gln Glu Met Ala Ala Lys Tyr Arg Ala Thr Gly Thr Thr Pro Lys Lys
115 120 125
Thr Ile Gly Cys Phe
130
<210>322
<211>819
<212>DNA
<213>小果野蕉(Musa acuminata)
<400>322
atgttgaatg atcacaggca ccaccaccat cacgccgccg ccgctgctgg tgatgatgat 60
cacgacgaag gccccagcga cggcgccgag ttccgtgaca tccacgaatt agctccccat 120
tcccacccca gccaaggccg gcggagggag ctgtgggagg gcggcagcca ccgatcggcc 180
tccctctcca ccgggagcga cgccgccaac gacggcttca cgagcgtgag cagggagttc 240
agcgcgatgg tcgtcgccgg ctccgccatg cacaacggcg gcggcagcaa ccacgacaac 300
cacgccgacg acgggctcca gaaccagctc gcgcggatcg gggaggacga gctggaggag 360
acgaacccgc tggcgatcgt ccccgacaac aaccccatcc cctctccccg tcggccgctg 420
cctgctgggg actccggcgc cgccaaccct gccgacgagg tcccggtaca cctggtgaag 480
aaggaggagg tggagtcgaa gatatcggca tggcagacgg cggaggtctc caagatcaac 540
aaccgcttca agcgccagga ggtgaccatc aacgggtggg agaacgagaa ggtggagaaa 600
gccacggcct ggttgaagaa agtagagagg aaactggagg agcagcgggc gagggcgatg 660
gagaagatgc agaacgacgt ggcgaaggcg caccacaagg cagcggagaa gcgggcgtcg 720
gcggaggcca agaggggaac caaggttgcc aaggtgctgg aactggccaa cttcatgaga 780
gctgtgggga gagctccgtc caagcgctcc ttcttctag 819
<210>323
<211>272
<212>PRT
<213>小果野蕉
<400>323
Met Leu Asn Asp His Arg His His His His His Ala Ala Ala Ala Ala
1 5 10 15
Gly Asp Asp Asp His Asp Glu Gly Pro Ser Asp Gly Ala Glu Phe Arg
20 25 30
Asp Ile His Glu Leu Ala Pro His Ser His Pro Ser Gln Gly Arg Arg
35 40 45
Arg Glu Leu Trp Glu Gly Gly Ser His Arg Ser Ala Ser Leu Ser Thr
50 55 60
Gly Ser Asp Ala Ala Asn Asp Gly Phe Thr Ser Val Ser Arg Glu Phe
65 70 75 80
Ser Ala Met Val Val Ala Gly Ser Ala Met His Asn Gly Gly Gly Ser
85 90 95
Asn His Asp Asn His Ala Asp Asp Gly Leu Gln Asn Gln Leu Ala Arg
100 105 110
Ile Gly Glu Asp Glu Leu Glu Glu Thr Asn Pro Leu Ala Ile Val Pro
115 120 125
Asp Asn Asn Pro Ile Pro Ser Pro Arg Arg Pro Leu Pro Ala Gly Asp
130 135 140
Ser Gly Ala Ala Asn Pro Ala Asp Glu Val Pro Val His Leu Val Lys
145 150 155 160
Lys Glu Glu Val Glu Ser Lys Ile Ser Ala Trp Gln Thr Ala Glu Val
165 170 175
Ser Lys Ile Asn Asn Arg Phe Lys Arg Gln Glu Val Thr Ile Asn Gly
180 185 190
Trp Glu Asn Glu Lys Val Glu Lys Ala Thr Ala Trp Leu Lys Lys Val
195 200 205
Glu Arg Lys Leu Glu Glu Gln Arg Ala Arg Ala Met Glu Lys Met Gln
210 215 220
Asn Asp Val Ala Lys Ala His His Lys Ala Ala Glu Lys Arg Ala Ser
225 230 235 240
Ala Glu Ala Lys Arg Gly Thr Lys Val Ala Lys Val Leu Glu Leu Ala
245 250 255
Asn Phe Met Arg Ala Val Gly Arg Ala Pro Ser Lys Arg Ser Phe Phe
260 265 270
<210>324
<211>867
<212>DNA
<213>蒺藜苜蓿
<400>324
atgtcaaata attttctttc atcaaaccaa tcagattcat attcttgttc atcttcttgt 60
tgtttaacaa gaacattgaa aacaaagcgt ggaaataaaa ataagaagat gcatcgttct 120
ctcatcacag cattgcaaga atctccttct tctaattacc attctcttcc tgatcctccc 180
tcatgctcag acaatgcgac tcacttctcc actccaagaa accagagatt aggcatggcc 240
cacattgaaa acaattgctt ctctgatatt gatgaatggt tggaacatgc caataagttt 300
tgcaaatcct tcttcaatca tcatcacact gaggaaaatc ttgaagcaga aacaaggcaa 360
aatggaaatc cacaagactt gatgagaatg tcagcagtat gcaacaagga cctaacagct 420
caagagcatg aattttacaa catagtatta ccctcagtta gagaagaaag tccacttcct 480
cgtactatta cctcctgcat aaacagacat ggagggtgca gcagcaatcc caaacttgaa 540
gctgatcatg aagatgtacg taacaaagcc aagcatcttc aacttatgca caggttgaga 600
aagaaggaag aagctataaa tgattgggaa ttgcaccaaa ccaggaaagc catggataac 660
atggataaaa ttcagaataa gcttgaaagg aaacaagtaa tggcttcagc aagggctcaa 720
aagaaaatat actcagtaag ggaaaaggca gagaagcaaa agctgaactt aaggcgatca 780
actatgaaaa agttccaaca actacaaata catgagactc attcctcctc agatacttca 840
tgggactcac atttgccttt atgttaa 867
<210>325
<211>288
<212>PRT
<213>蒺藜苜蓿
<400>325
Met Ser Asn Asn Phe Leu Ser Ser Asn Gln Ser Asp Ser Tyr Ser Cys
1 5 10 15
Ser Ser Ser Cys Cys Leu Thr Arg Thr Leu Lys Thr Lys Arg Gly Asn
20 25 30
Lys Asn Lys Lys Met His Arg Ser Leu Ile Thr Ala Leu Gln Glu Ser
35 40 45
Pro Ser Ser Asn Tyr His Ser Leu Pro Asp Pro Pro Ser Cys Ser Asp
50 55 60
Asn Ala Thr His Phe Ser Thr Pro Arg Asn Gln Arg Leu Gly Met Ala
65 70 75 80
His Ile Glu Asn Asn Cys Phe Ser Asp Ile Asp Glu Trp Leu Glu His
85 90 95
Ala Asn Lys Phe Cys Lys Ser Phe Phe Asn His His His Thr Glu Glu
100 105 110
Asn Leu Glu Ala Glu Thr Arg Gln Asn Gly Asn Pro Gln Asp Leu Met
115 120 125
Arg Met Ser Ala Val Cys Asn Lys Asp Leu Thr Ala Gln Glu His Glu
130 135 140
Phe Tyr Asn Ile Val Leu Pro Ser Val Arg Glu Glu Ser Pro Leu Pro
145 150 155 160
Arg Thr Ile Thr Ser Cys Ile Asn Arg His Gly Gly Cys Ser Ser Asn
165 170 175
Pro Lys Leu Glu Ala Asp His Glu Asp Val Arg Asn Lys Ala Lys His
180 185 190
Leu Gln Leu Met His Arg Leu Arg Lys Lys Glu Glu Ala Ile Asn Asp
195 200 205
Trp Glu Leu His Gln Thr Arg Lys Ala Met Asp Asn Met Asp Lys Ile
210 215 220
Gln Asn Lys Leu Glu Arg Lys Gln Val Met Ala Ser Ala Arg Ala Gln
225 230 235 240
Lys Lys Ile Tyr Ser Val Arg Glu Lys Ala Glu Lys Gln Lys Leu Asn
245 250 255
Leu Arg Arg Ser Thr Met Lys Lys Phe Gln Gln Leu Gln Ile His Glu
260 265 270
Thr His Ser Ser Ser Asp Thr Ser Trp Asp Ser His Leu Pro Leu Cys
275 280 285
<210>326
<211>111
<212>PRT
<213>人工序列
<220>
<223>Remorin结构域comprised in SEQ ID NO:2
<400>326
Val Lys Arg Glu Glu Val Glu Ala Lys Ile Thr Ala Trp Gln Thr Ala
1 5 10 15
Lys Val Ala Lys Ile Asn Asn Arg Phe Lys Arg Gln Asp Ala Val Ile
20 25 30
Asn Gly Trp Leu Asn Glu Gln Val His Arg Ala Asn Ser Trp Met Lys
35 40 45
Lys Ile Glu Arg Lys Leu Glu Asp Arg Arg Ala Lys Ala Met Glu Lys
50 55 60
Thr Gln Asn Lys Val Ala Lys Ala Gln Arg Lys Ala Glu Glu Arg Arg
65 70 75 80
Ala Thr Ala Glu Gly Lys Arg Gly Thr Glu Val Ala Arg Val Leu Glu
85 90 95
Val Ala Asn Leu Met Arg Ala Val Gly Arg Pro Pro Ala Lys Arg
100 105 110
<210>327
<211>56
<212>DNA
<213>人工序列
<220>
<223>引物:prm09186
<400>327
ggggacaagt ttgtacaaaa aagcaggctt aaacaatgtt gactttgtac ggtcaa 56
<210>328
<211>51
<212>DNA
<213>人工序列
<220>
<223>引物:prm09187
<400>328
ggggaccact ttgtacaaga aagctgggta gcttagctag gaaagagaga a 51
<210>329
<211>2194
<212>DNA
<213>稻
<400>329
aatccgaaaa gtttctgcac cgttttcacc ccctaactaa caatataggg aacgtgtgct 60
aaatataaaa tgagacctta tatatgtagc gctgataact agaactatgc aagaaaaact 120
catccaccta ctttagtggc aatcgggcta aataaaaaag agtcgctaca ctagtttcgt 180
tttccttagt aattaagtgg gaaaatgaaa tcattattgc ttagaatata cgttcacatc 240
tctgtcatga agttaaatta ttcgaggtag ccataattgt catcaaactc ttcttgaata 300
aaaaaatctt tctagctgaa ctcaatgggt aaagagagag atttttttta aaaaaataga 360
atgaagatat tctgaacgta ttggcaaaga tttaaacata taattatata attttatagt 420
ttgtgcattc gtcatatcgc acatcattaa ggacatgtct tactccatcc caatttttat 480
ttagtaatta aagacaattg acttattttt attatttatc ttttttcgat tagatgcaag 540
gtacttacgc acacactttg tgctcatgtg catgtgtgag tgcacctcct caatacacgt 600
tcaactagca acacatctct aatatcactc gcctatttaa tacatttagg tagcaatatc 660
tgaattcaag cactccacca tcaccagacc acttttaata atatctaaaa tacaaaaaat 720
aattttacag aatagcatga aaagtatgaa acgaactatt taggtttttc acatacaaaa 780
aaaaaaagaa ttttgctcgt gcgcgagcgc caatctccca tattgggcac acaggcaaca 840
acagagtggc tgcccacaga acaacccaca aaaaacgatg atctaacgga ggacagcaag 900
tccgcaacaa ccttttaaca gcaggctttg cggccaggag agaggaggag aggcaaagaa 960
aaccaagcat cctccttctc ccatctataa attcctcccc ccttttcccc tctctatata 1020
ggaggcatcc aagccaagaa gagggagagc accaaggaca cgcgactagc agaagccgag 1080
cgaccgcctt ctcgatccat atcttccggt cgagttcttg gtcgatctct tccctcctcc 1140
acctcctcct cacagggtat gtgcctccct tcggttgttc ttggatttat tgttctaggt 1200
tgtgtagtac gggcgttgat gttaggaaag gggatctgta tctgtgatga ttcctgttct 1260
tggatttggg atagaggggt tcttgatgtt gcatgttatc ggttcggttt gattagtagt 1320
atggttttca atcgtctgga gagctctatg gaaatgaaat ggtttaggga tcggaatctt 1380
gcgattttgt gagtaccttt tgtttgaggt aaaatcagag caccggtgat tttgcttggt 1440
gtaataaagt acggttgttt ggtcctcgat tctggtagtg atgcttctcg atttgacgaa 1500
gctatccttt gtttattccc tattgaacaa aaataatcca actttgaaga cggtcccgtt 1560
gatgagattg aatgattgat tcttaagcct gtccaaaatt tcgcagctgg cttgtttaga 1620
tacagtagtc cccatcacga aattcatgga aacagttata atcctcagga acaggggatt 1680
ccctgttctt ccgatttgct ttagtcccag aatttttttt cccaaatatc ttaaaaagtc 1740
actttctggt tcagttcaat gaattgattg ctacaaataa tgcttttata gcgttatcct 1800
agctgtagtt cagttaatag gtaatacccc tatagtttag tcaggagaag aacttatccg 1860
atttctgatc tccattttta attatatgaa atgaactgta gcataagcag tattcatttg 1920
gattattttt tttattagct ctcacccctt cattattctg agctgaaagt ctggcatgaa 1980
ctgtcctcaa ttttgttttc aaattcacat cgattatcta tgcattatcc tcttgtatct 2040
acctgtagaa gtttcttttt ggttattcct tgactgcttg attacagaaa gaaatttatg 2100
aagctgtaat cgggatagtt atactgcttg ttcttatgat tcatttcctt tgtgcagttc 2160
ttggtgtagc ttgccacttt caccagcaaa gttc 2194
<210>330
<211>1130
<212>DNA
<213>稻
<400>330
catgcggcta atgtagatgc tcactgcgct agtagtaagg tactccagta cattatggaa 60
tatacaaagc tgtaatactc gtatcagcaa gagagaggca cacaagttgt agcagtagca 120
caggattaga aaaacgggac gacaaatagt aatggaaaaa caaaaaaaaa caaggaaaca 180
catggcaata taaatggaga aatcacaaga ggaacagaat ccgggcaata cgctgcgaaa 240
gtactcgtac gtaaaaaaaa gaggcgcatt catgtgtgga cagcgtgcag cagaagcagg 300
gatttgaaac cactcaaatc caccactgca aaccttcaaa cgaggccatg gtttgaagca 360
tagaaagcac aggtaagaag cacaacgccc tcgctctcca ccctcccacc caatcgcgac 420
gcacctcgcg gatcggtgac gtggcctcgc cccccaaaaa tatcccgcgg cgtgaagctg 480
acaccccggg cccacccacc tgtcacgttg gcacatgttg gttatggttc ccggccgcac 540
caaaatatca acgcggcgcg gcccaaaatt tccaaaatcc cgcccaagcc cctggcgcgt 600
gccgctcttc cacccaggtc cctctcgtaa tccataatgg cgtgtgtacc ctcggctggt 660
tgtacgtggg cgggttaccc tgggggtgtg ggtggatgac gggtgggccc ggaggaggtc 720
cggccccgcg cgtcatcgcg gggcggggtg tagcgggtgc gaaaaggagg cgatcggtac 780
gaaaattcaa attaggaggt ggggggcggg gcccttggag aataagcgga atcgcagata 840
tgcccctgac ttggcttggc tcctcttctt cttatccctt gtcctcgcaa ccccgcttcc 900
ttctctcctc tcctcttctc ttctcttctc tggtggtgtg ggtgtgtccc tgtctcccct 960
ctccttcctc ctctcctttc ccctcctctc ttcccccctc tcacaagaga gagagcgcca 1020
gactctcccc aggtgaggtg agaccagtct ttttgctcga ttcgacgcgc ctttcacgcc 1080
gcctcgcgcg gatctgaccg cttccctcgg ccttctcgca ggattcagcc 1130
<210>331
<211>1130
<212>DNA
<213>稻
<400>331
catgcggcta atgtagatgc tcactgcgct agtagtaagg tactccagta cattatggaa 60
tatacaaagc tgtaatactc gtatcagcaa gagagaggca cacaagttgt agcagtagca 120
caggattaga aaaacgggac gacaaatagt aatggaaaaa caaaaaaaaa caaggaaaca 180
catggcaata taaatggaga aatcacaaga ggaacagaat ccgggcaata cgctgcgaaa 240
gtactcgtac gtaaaaaaaa gaggcgcatt catgtgtgga cagcgtgcag cagaagcagg 300
gatttgaaac cactcaaatc caccactgca aaccttcaaa cgaggccatg gtttgaagca 360
tagaaagcac aggtaagaag cacaacgccc tcgctctcca ccctcccacc caatcgcgac 420
gcacctcgcg gatcggtgac gtggcctcgc cccccaaaaa tatcccgcgg cgtgaagctg 480
acaccccggg cccacccacc tgtcacgttg gcacatgttg gttatggttc ccggccgcac 540
caaaatatca acgcggcgcg gcccaaaatt tccaaaatcc cgcccaagcc cctggcgcgt 600
gccgctcttc cacccaggtc cctctcgtaa tccataatgg cgtgtgtacc ctcggctggt 660
tgtacgtggg cgggttaccc tgggggtgtg ggtggatgac gggtgggccc ggaggaggtc 720
cggccccgcg cgtcatcgcg gggcggggtg tagcgggtgc gaaaaggagg cgatcggtac 780
gaaaattcaa attaggaggt ggggggcggg gcccttggag aataagcgga atcgcagata 840
tgcccctgac ttggcttggc tcctcttctt cttatccctt gtcctcgcaa ccccgcttcc 900
ttctctcctc tcctcttctc ttctcttctc tggtggtgtg ggtgtgtccc tgtctcccct 960
ctccttcctc ctctcctttc ccctcctctc ttcccccctc tcacaagaga gagagcgcca 1020
gactctcccc aggtgaggtg agaccagtct ttttgctcga ttcgacgcgc ctttcacgcc 1080
gcctcgcgcg gatctgaccg cttccctcgg ccttctcgca ggattcagcc 1130
<210>332
<211>1242
<212>DNA
<213>玉米
<400>332
ggcacagacg ctactggcac gcacgcacgc accagcacca caccacacca catgcatggt 60
ggagcctagc acgggcagct agctcccggc cggcgacgtg acgaccacca ccaccacatg 120
ttgcatgagc agcaggcacc gccaccggca gtagcagcgc caccgccatc catcaacccc 180
gacgacgacg gcggccgcga tgtcgaggtc accacgttcc gcgacatcca ccctctgacg 240
cccgacgcgc cgccgcccgc ctccgcgtcc tgggacacgg ccagccaccg ctccttctcg 300
tcgtccgacg accagcagta catgacgatg agccgcgagt tcacggccat ggtcgccgcc 360
ggggcgacca tgcagaccgg cggctacgac ggcgccgccg accagctcac cagcatcggc 420
gaggacgagc tggaggagac caacccgctg gccatcgtcc ccgacagcca ccccatcgcc 480
acgccagcca ggtccagggc gtccgggctg gaggtcgtgc ccgcgggccc ggcgccggcg 540
ccgcagccgc ccgcgcacct ggaggccagc caggtcaaga aggaggaggt ggagaccaag 600
gtcacggcct ggcagacggc cgaggtcgcc aagatcaaca accgcttcaa gagggaggat 660
gtggtcatca acggctggga gaccgagcag gtggagaagg cctccgcgtg gctcaagaag 720
atcgagagga agctggacga gcagcgcgcc aaggcgctgg agaagacgca gaacgacatc 780
gccaaggcgc ggcgcaaggc ggaggagaag cgggcgtcgg cggaggccaa gcggggcctc 840
aagctggcca aggtgctgga gctcgccaac ttcatgaagg ccgtcggcag ggtgcccacc 900
aagcgctcct tcttctagcc agccgactac ccccgtctct ccctgcctgc gtgtgatcga 960
tgtacgctcg ctgctgcatc cgagaaccta actgtaaaga aaaaaaaact gtaagctgta 1020
tacgtactgc gcctgctggt tcccctgtga tgtctgtcag tgtcatccat cacagggtgc 1080
cagttgttct cttctctttc ttttcttttc tcttctcttg gcttgtatat cggatccata 1140
tatgctggtg gtgcttgaac gaactgttgt tgtttgctta accgtgcaaa catatacagt 1200
ggtatataca ctacattcag aacccaaaaa aaaaaaaaaa aa 1242
<210>333
<211>266
<212>PRT
<213>玉米
<400>333
Met Leu His Glu Gln Gln Ala Pro Pro Pro Ala Val Ala Ala Pro Pro
1 5 10 15
Pro Ser Ile Asn Pro Asp Asp Asp Gly Gly Arg Asp Val Glu Val Thr
20 25 30
Thr Phe Arg Asp Ile His Pro Leu Thr Pro Asp Ala Pro Pro Pro Ala
35 40 45
Ser Ala Ser Trp Asp Thr Ala Ser His Arg Ser Phe Ser Ser Ser Asp
50 55 60
Asp Gln Gln Tyr Met Thr Met Ser Arg Glu Phe Thr Ala Met Val Ala
65 70 75 80
Ala Gly Ala Thr Met Gln Thr Gly Gly Tyr Asp Gly Ala Ala Asp Gln
85 90 95
Leu Thr Ser Ile Gly Glu Asp Glu Leu Glu Glu Thr Asn Pro Leu Ala
100 105 110
Ile Val Pro Asp Ser His Pro Ile Ala Thr Pro Ala Arg Ser Arg Ala
115 120 125
Ser Gly Leu Glu Val Val Pro Ala Gly Pro Ala Pro Ala Pro Gln Pro
130 135 140
Pro Ala His Leu Glu Ala Ser Gln Val Lys Lys Glu Glu Val Glu Thr
145 150 155 160
Lys Val Thr Ala Trp Gln Thr Ala Glu Val Ala Lys Ile Asn Asn Arg
165 170 175
Phe Lys Arg Glu Asp Val Val Ile Asn Gly Trp Glu Thr Glu Gln Val
180 185 190
Glu Lys Ala Ser Ala Trp Leu Lys Lys Ile Glu Arg Lys Leu Asp Glu
195 200 205
Gln Arg Ala Lys Ala Leu Glu Lys Thr Gln Asn Asp Ile Ala Lys Ala
210 215 220
Arg Arg Lys Ala Glu Glu Lys Arg Ala Ser Ala Glu Ala Lys Arg Gly
225 230 235 240
Leu Lys Leu Ala Lys Val Leu Glu Leu Ala Asn Phe Met Lys Ala Val
245 250 255
Gly Arg Val Pro Thr Lys Arg Ser Phe Phe
260 265
<210>334
<211>111
<212>PRT
<213>人工序列
<220>
<223>SEQ ID NO:333的羧基端序列
<400>334
Val Lys Lys Glu Glu Val Glu Thr Lys Val Thr Ala Trp Gln Thr Ala
1 5 10 15
Glu Val Ala Lys Ile Asn Asn Arg Phe Lys Arg Glu Asp Val Val Ile
20 25 30
Asn Gly Trp Glu Thr Glu Gln Val Glu Lys Ala Ser Ala Trp Leu Lys
35 40 45
Lys Ile Glu Arg Lys Leu Asp Glu Gln Arg Ala Lys Ala Leu Glu Lys
50 55 60
Thr Gln Asn Asp Ile Ala Lys Ala Arg Arg Lys Ala Glu Glu Lys Arg
65 70 75 80
Ala Ser Ala Glu Ala Lys Arg Gly Leu Lys Leu Ala Lys Val Leu Glu
85 90 95
Leu Ala Asn Phe Met Lys Ala Val Gly Arg Val Pro Thr Lys Arg
100 105 110
<210>335
<211>920
<212>DNA
<213>稻
<400>335
atcgccatta ccacactcga gcagagcaaa tacagttcag gaatcaggag caagcagaaa 60
cacacacaca aatccgaaga tgtgcgggat caagcaggag atgagcggcg agtcgtcggg 120
gtcgccgtgc agctcggcgt cggcggagcg gcagcaccag acggtgtgga cggcgccgcc 180
gaagaggccg gcggggcgga ccaagttcag ggagacgagg cacccggtgt tccgcggcgt 240
gcggcggagg ggcaatgccg ggaggtgggt gtgcgaggtg cgggtgcccg ggcggcgcgg 300
ctgcaggctc tggctcggca cgttcgacac cgccgagggc gcggcgcgcg cgcacgacgc 360
cgccatgctc gccatcaacg ccggcggcgg cggcggcggg ggagcatgct gcctcaactt 420
cgccgactcc gcgtggctcc tcgccgtgcc gcgctcctac cgcaccctcg ccgacgtccg 480
ccacgccgtc gccgaggccg tcgaggactt cttccggcgc cgcctcgccg acgacgcgct 540
gtccgccacg tcgtcgtcct cgacgacgcc gtccacccca cgcaccgacg acgacgagga 600
gtccgccgcc accgacggcg acgagtcctc ctccccggcc agcgacctgg cgttcgaact 660
ggacgtcctg agtgacatgg gctgggacct gtactacgcg agcttggcgc aggggatgct 720
catggagcca ccatcggcgg cgctcggcga cgacggtgac gccatcctcg ccgacgtccc 780
actctggagc tactagagct caatcaactg tacaattttg cctctttttt ctctcttttc 840
tggcttccga tgccaaaatt ttggtactgt acggacacta ctttcggtaa tgtgatggaa 900
caagttgcaa aacacagagc 920
<210>336
<211>238
<212>PRT
<213>稻
<400>336
Met Cys Gly Ile Lys Gln Glu Met Ser Gly Glu Ser Ser Gly Ser Pro
1 5 10 15
Cys Ser Ser Ala Ser Ala Glu Arg Gln His Gln Thr Val Trp Thr Ala
20 25 30
Pro Pro Lys Arg Pro Ala Gly Arg Thr Lys Phe Arg Glu Thr Arg His
35 40 45
Pro Val Phe Arg Gly Val Arg Arg Arg Gly Asn Ala Gly Arg Trp Val
50 55 60
Cys Glu Val Arg Val Pro Gly Arg Arg Gly Cys Arg Leu Trp Leu Gly
65 70 75 80
Thr Phe Asp Thr Ala Glu Gly Ala Ala Arg Ala His Asp Ala Ala Met
85 90 95
Leu Ala Ile Asn Ala Gly Gly Gly Gly Gly Gly Gly Ala Cys Cys Leu
100 105 110
Asn Phe Ala Asp Ser Ala Trp Leu Leu Ala Val Pro Arg Ser Tyr Arg
115 120 125
Thr Leu Ala Asp Val Arg His Ala Val Ala Glu Ala Val Glu Asp Phe
130 135 140
Phe Arg Arg Arg Leu Ala Asp Asp Ala Leu Ser Ala Thr Ser Ser Ser
145 150 155 160
Ser Thr Thr Pro Ser Thr Pro Arg Thr Asp Asp Asp Glu Glu Ser Ala
165 170 175
Ala Thr Asp Gly Asp Glu Ser Ser Ser Pro Ala Ser Asp Leu Ala Phe
180 185 190
Glu Leu Asp Val Leu Ser Asp Met Gly Trp Asp Leu Tyr Tyr Ala Ser
195 200 205
Leu Ala Gln Gly Met Leu MeL Glu Pro Pro Ser Ala Ala Leu Gly Asp
210 215 220
Asp Gly Asp Ala Ile Leu Ala Asp Val Pro Leu Trp Ser Tyr
225 230 235
<210>337
<211>52
<212>DNA
<213>人工序列
<220>
<223>引物1
<400>337
ggggacaagt ttgtacaaaa aagcaggctt aaacaatgt gcgggatcaag ca 52
<210>338
<211>51
<212>DNA
<213>人工序列
<220>
<223>引物2
<400>338
ggggaccac tttgtacaaga aagctgggtg gcaaaattgt acagttgatt g 51
<210>339
<211>2194
<212>DNA
<213>稻
<400>339
aatccgaaaa gtttctgcac cgttttcacc ccctaactaa caatataggg aacgtgtgct 60
aaatataaaa tgagacctta tatatgtagc gctgataact agaactatgc aagaaaaact 120
catccaccta ctttagtggc aatcgggcta aataaaaaag agtcgctaca ctagtttcgt 180
tttccttagt aattaagtgg gaaaatgaaa tcattattgc ttagaatata cgttcacatc 240
tctgtcatga agttaaatta ttcgaggtag ccataattgt catcaaactc ttcttgaata 300
aaaaaatctt tctagctgaa ctcaatgggt aaagagagag atttttttta aaaaaataga 360
atgaagatat tctgaacgta ttggcaaaga tttaaacata taattatata attttatagt 420
ttgtgcattc gtcatatcgc acatcattaa ggacatgtct tactccatcc caatttttat 480
ttagtaatta aagacaattg acttattttt attatttatc ttttttcgat tagatgcaag 540
gtacttacgc acacactttg tgctcatgtg catgtgtgag tgcacctcct caatacacgt 600
tcaactagca acacatctct aatatcactc gcctatttaa tacatttagg tagcaatatc 660
tgaattcaag cactccacca tcaccagacc acttttaata atatctaaaa tacaaaaaat 720
aattttacag aatagcatga aaagtatgaa acgaactatt taggtttttc acatacaaaa 780
aaaaaaagaa ttttgctcgt gcgcgagcgc caatctccca tattgggcac acaggcaaca 840
acagagtggc tgcccacaga acaacccaca aaaaacgatg atctaacgga ggacagcaag 900
tccgcaacaa ccttttaaca gcaggctttg cggccaggag agaggaggag aggcaaagaa 960
aaccaagcat cctccttctc ccatctataa attcctcccc ccttttcccc tctctatata 1020
ggaggcatcc aagccaagaa gagggagagc accaaggaca cgcgactagc agaagccgag 1080
cgaccgcctt ctcgatccat atcttccggt cgagttcttg gtcgatctct tccctcctcc 1140
acctcctcct cacagggtat gtgcctccct tcggttgttc ttggatttat tgttctaggt 1200
tgtgtagtac gggcgttgat gttaggaaag gggatctgta tctgtgatga ttcctgttct 1260
tggatttggg atagaggggt tcttgatgtt gcatgttatc ggttcggttt gattagtagt 1320
atggttttca atcgtctgga gagctctatg gaaatgaaat ggtttaggga tcggaatctt 1380
gcgattttgt gagtaccttt tgtttgaggt aaaatcagag caccggtgat tttgcttggt 1440
gtaataaagt acggttgttt ggtcctcgat tctggtagtg atgcttctcg atttgacgaa 1500
gctatccttt gtttattccc tattgaacaa aaataatcca actttgaaga cggtcccgtt 1560
gatgagattg aatgattgat tcttaagcct gtccaaaatt tcgcagctgg cttgtttaga 1620
tacagtagtc cccatcacga aattcatgga aacagttata atcctcagga acaggggatt 1680
ccctgttctt ccgatttgct ttagtcccag aatttttttt cccaaatatc ttaaaaagtc 1740
actttctggt tcagttcaat gaattgattg ctacaaataa tgcttttata gcgttatcct 1800
agctgtagtt cagttaatag gtaatacccc tatagtttag tcaggagaag aacttatccg 1860
atttctgatc tccattttta attatatgaa atgaactgta gcataagcag tattcatttg 1920
gattattttt tttattagct ctcacccctt cattattctg agctgaaagt ctggcatgaa 1980
ctgtcctcaa ttttgttttc aaattcacat cgattatcta tgcattatcc tcttgtatct 2040
acctgtagaa gtttcttttt ggttattcct tgactgcttg attacagaaa gaaatttatg 2100
aagctgtaat cgggatagtt atactgcttg ttcttatgat tcatttcctt tgtgcagttc 2160
ttggtgtagc ttgccacttt caccagcaaa gttc 2194
<210>340
<211>74
<212>PRT
<213>人工序列
<220>
<223>AP2结构域的共有序列
<220>
<221>未确定
<222>(1)..(1)
<223>Xaa可为任一天然存在的氨基酸
<220>
<221>变体
<222>(2)..(2)
<223>/替换=″His″/替换=″Trp″/替换=″Tyr″
<220>
<221>变体
<222>(3)..(3)
<223>/替换=″Lys″/替换=″Arg″
<220>
<221>变体
<222>(6)..(6)
<223>/替换=″Asp″/替换=″Glu″/替换=″His″/替换=″Lys″/替换=″Lys″/替换=″Asn″Gln″/替换=″Arg″/替换=″Ser″/替换=″Thr″
<220>
<221>未确定
<222>(7)..(7)
<223>Xaa可为任一天然存在的氨基酸
<220>
<221>变体
<222>(8)..(8)
<223>/替换=″Lys″/替换=″Arg″
<220>
<221>未确定
<222>(9)..(9)
<223>Xaa可为任一天然存在的氨基酸
<220>
<221>变体
<222>(10)..(10)
<223>/替换=″Cys″/替换=″Phe″/替换=″Gly″/替换=″His″/替换=″Ile″/替换=″Lys″/替换=″Leu″/替换=″Met″/替换=″Arg″/替换=″Thr″/替换=″Val″/替换=″Trp″/替换=″Tyr″
<220>
<221>未确定
<222>(12)..(12)
<223>Xaa可为任一天然存在的氨基酸
<220>
<221>变体
<222>(13)..(13)
<223>/替换=″Lys″/替换=″Arg″
<220>
<221>未确定
<222>(15)..(15)
<223>Xaa可为任一天然存在的氨基酸
<220>
<221>变体
<222>(16)..(16)
<223>/替换=″Gly″/替换=″Ser″
<220>
<221>变体
<222>(17)..(17)
<223>/替换=″Glu″/替换=″His″/替换=″Lys″/替换=″Arg″
<220>
<221>变体
<222>(19)..(19)
<223>/替换=″Cys″/替换=″Asp″/替换=″Glu″/替换=″His″/替换=″Lys″/替换=″Asn″/替换=″Gln″/替换=″Arg″/替换=″Ser″/替换=″Thr″
<220>
<221>变体
<222>(20)..(20)
<223>/替换=″Glu″/替换=″His″/替换=″Lys″/替换=″Arg″
<220>
<221>变体
<222>(21)..(21)
<223>/替换=″Cys″/替换=″Asp″/替换=″Gly″/替换=″Asn″/替换=″Pro″/替换=″Ser″/替换=″Thr″/替换=″Val″
<220>
<221>变体
<222>(21)..(21)
<223>/替换=″Cys″/替换=″Asp″/替换=″Gly″/替换=″Asn″/替换=″Pro″/替换=″Ser″/替换=″Thr″/替换=″Val″
<220>
<221>未确定
<222>(22)..(31)
<223>Xaa可为任一天然存在的氨基酸
<220>
<221>变体
<222>(32)..(33)
<223>/替换=″Cys″/替换=″Asp″/替换=″Glu″/替换=″His″/替换=″Lys″/替换=″Asn″/替换=″Gln″/替换=″Arg″/替换=″Ser″/替换=″Thr″
<220>
<221>变体
<222>(34)..(34)
<223>/替换=″Glu″/替换=″His″/替换=″Lys″/替换=″Arg″
<220>
<221>变体
<222>(35)..(35)
<223>/替换=″Leu″/替换=″Val″
<220>
<221>变体
<222>(36)..(36)
<223>/替换=″His″/替换=″Trp″/替换=″Tyr″
<220>
<221>变体
<222>(39)..(39)
<223>/替换=″Thr″
<220>
<221>变体
<222>(42)..(42)
<223>/替换=″Thr″
<220>
<221>变体
<222>(43)..(43)
<223>/替换=″Cys″/替换=″Asp″/替换=″Glu″/替换=″His″/替换=″Lys″/替换=″Asn″/替换=″Gln″/替换=″Arg″/替换=″Ser″/替换=″Thr″
<220>
<221>变体
<222>(44)..(44)
<223>/替换=″Glu″
<220>
<221>变体
<222>(45)..(45)
<223>/替换=″Cys″/替换=″Asp″/替换=″Glu″/替换=″His″/替换=″Lys″/替换=″Asn″/替换=″Gln″/替换=″Arg″/替换=″Ser″/替换=″Thr″
<220>
<221>变体
<222>(48)..(48)
<223>/替换=″Cys″/替换=″Phe″/替换=″Gly″/替换=″His″/替换=″Ile″/替换=″Lys″/替换=″Leu″/替换=″Met″/替换=″Arg″/替换=″Thr″/替换=″Val″/替换=″Trp″/替换=″Tyr″
<220>
<221>未确定
<222>(52)..(52)
<223>Xaa可为任一天然存在的氨基酸
<220>
<221>变体
<222>(55)..(58)
<223>/替换=″Cys″/替换=″Phe″/替换=″Gly″/替换=″His″/替换=″Ile″/替换=″Lys″/替换=″Leu″/替换=″Met″/替换=″Arg″/替换=″Thr″/替换=″Val″/替换=″Trp″/替换=″Tyr″
<220>
<221>未确定
<222>(60)..(61)
<223>Xaa可为任一天然存在的氨基酸
<220>
<221>变体
<222>(63)..(63)
<223>/替换=″Asp″/替换=″Glu″/替换=″His″/替换=″Lys″/替换=″Lys″/替换=″Asn″Gln″/替换=″Arg″/替换=″Ser″/替换=″Thr″
<220>
<221>变体
<222>(64)..(65)
<223>/替换=″Cys″/替换=″Phe″/替换=″Gly″/替换=″His″/替换=″Ile″/替换=″Lys″/替换=″Leu″/替换=″Met″/替换=″Arg″/替换=″Thr″/替换=″Val″/替换=″Trp″/替换=″Tyr″
<220>
<221>变体
<222>(68)..(68)
<223>/替换=″Cys″/替换=″Asp″/替换=″Gly″/替换=″Asn″/替换=″Pro″/替换=″Ser″/替换=″Thr″/替换=″Val″
<220>
<221>未确定
<222>(69)..(72)
<223>Xaa可为任一天然存在的氨基酸
<220>
<221>变体
<222>(73)..(74)
<223>/替换=″Cys″/替换=″Asp″/替换=″Glu″/替换=″His″/替换=″Lys″/替换=″Asn″/替换=″Gln″/替换=″Arg″/替换=″Ser″/替换=″Thr″
<400>340
Xaa Phe His Gly Val Cys Xaa His Xaa Ala Gly Xaa His Trp Xaa Ala
1 5 10 15
Asp Ile Ala Asp Ala Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Ala
20 25 30
Ala Asp Leu Phe Leu Gly Ser Phe Ala Ser Ala Asp Ala Ala Ala Ala
35 40 45
Ala Tyr Asp Xaa Ala Ala Ala Ala Ala Ala Gly Xaa Xaa Cys Ala Ala
50 55 60
Ala Asn Phe Ala Xaa Xaa Xaa Xaa Ala Ala
65 70
<210>341
<211>72
<212>PRT
<213>人工序列
<220>
<223>SEQ ID NO:2的AP2结构域的共有序列
<400>341
Val Phe Arg Gly Val Arg Arg Arg Gly Asn Ala Gly Arg Trp Val Cys
1 5 10 15
Glu Val Arg Val Pro Gly Arg Arg Gly Cys Arg Leu Trp Leu Gly Thr
20 25 30
Phe Asp Thr Ala Glu Gly Ala Ala Arg Ala His Asp Ala Ala Met Leu
35 40 45
Ala Ile Asn Ala Gly Gly Gly Gly Gly Gly Gly Ala Cys Cys Leu Asn
50 55 60
Phe Ala Asp Ser Ala Trp Leu Leu
65 70
<210>342
<211>6
<212>DNA
<213>人工序列
<220>
<223>DRE元件
<220>
<221>变异
<222>(1)..(1)
<223>/替换=″a″
<220>
<221>变异
<222>(2)..(2)
<223>/替换=″t″
<400>342
gccgac 6
<210>343
<211>29
<212>PRT
<213>人工序列
<220>
<223>基序CMIII-1
<400>343
Pro Glu Leu Ala Trp Ser Leu Pro Arg Pro Glu Ser Thr Ser Pro Lys
1 5 10 15
Asp Ile Gln Ala Ala Ala Ala Glu Ala Ala Ala Met Phe
20 25
<210>344
<211>32
<212>PRT
<213>人工序列
<220>
<223>基序CMIII-2
<400>344
Gln Ser Cys Gly Ala Phe Phe Met Asp Glu Glu Ala Met Leu Gly Met
1 5 10 15
Pro Asn Leu Leu Ala Asn Met Ala Glu Gly Met Leu Leu Pro Pro Pro
20 25 30
<210>345
<211>21
<212>PRT
<213>人工序列
<220>
<223>基序CMIII-3
<400>345
Asp Tyr Asp Pro Thr Leu Ala Glu Ser Cys Pro Lys Lys Pro Ala Gly
1 5 10 15
Arg Lys Lys Phe Arg
20
<210>346
<211>26
<212>PRT
<213>人工序列
<220>
<223>基序CMIII-4
<220>
<221>未确定
<222>(18)..(18)
<223>Xaa可为任一天然存在的氨基酸
<220>
<221>未确定
<222>(21)..(21)
<223>Xaa可为任一天然存在的氨基酸
<400>346
Leu Trp Ser Tyr Ser Glu Gln Ile Asp Asn Pro Lys Lys Pro Ala Gly
1 5 10 15
Arg Xaa Lys Phe Xaa Glu Thr Arg His Pro
20 25
<210>347
<211>16
<212>PRT
<213>人工序列
<220>
<223>基序CMIII-3区I
<220>
<221>变体
<222>(3)..(3)
<223>/替换=″Arg″
<220>
<221>未确定
<222>(8)..(8)
<223>Xaa可为任一天然存在的氨基酸
<220>
<221>未确定
<222>(11)..(11)
<223>Xaa可为任一天然存在的氨基酸
<400>347
Pro Lys Lys Pro Ala Gly Arg Xaa Lys Phe Xaa Glu Thr Arg His Pro
1 5 10 15
<210>348
<211>5
<212>PRT
<213>人工序列
<220>
<223>基序CMIII-3区II
<400>348
Asp Ser Ala Trp Arg
1 5
<210>349
<211>8
<212>PRT
<213>人工序列
<220>
<223>基序CMIV-1
<220>
<221>变体
<222>(1)..(1)
<223>/替换=″Arg″
<220>
<221>变体
<222>(7)..(7)
<223>Xaa可为任一天然存在的氨基酸
<400>349
Lys Gly Lys Gly Gly Pro Xaa Asn
1 5
<210>350
<211>41
<212>PRT
<213>人工序列
<220>
<223>基序CMIV-2
<400>350
Lys Lys Arg Lys Arg Arg Gly Gly Arg Asp Val Ala Glu Ile Leu Lys
1 5 10 15
Lys Trp Lys Glu Tyr Asn Glu Gln Val Glu Ala Asp Ser Cys Ile Asp
20 25 30
Gly Gly Gly Pro Lys Lys Ile Arg Lys
35 40
<210>351
<211>756
<212>DNA
<213>稻
<400>351
atgtgtacga gcaaactaga ggagatcacc ggcgagtggc cgccgccggc attgcaggcc 60
gcctccacga cgtcgtcgtc ggagccgtgc cgccgcctct cgccgcccag cagcaagcgc 120
cccgcggggc gcaccaagtt ccacgagacc cgccacccgg tgttccgcgg cgtgcggcgc 180
cgcggccgcg cggggcggtg ggtgtgcgag gtccgcgtgc cgggccgccg cgggtgcagg 240
ctctggctcg gcacgttcga cgccgccgac gccgccgcgc gcgcccacga cgccgccatg 300
ctcgcgctcc gcggccgcgc cgccgcgtgc ctcaacttcg ccgactccgc ctggctgctc 360
gccgtgccgc ccccggccac cctccgctgc gccgccgacg tccagcgcgc cgtggcgcgg 420
gcgctggagg acttcgagca gcgggagtca tcatcgtccg tgttcccact cgccatcgac 480
gtcgtcgccg aggacgccat gtccgccacg tccgagccgt ccgccgcgag cgacgacgac 540
gccgtcacca gcagcagcag cacgaccgac gccgacgagg aggcatcacc gttcgagctg 600
gacgtggtga gcgacatggg ctggagcctg tactacgcga gcttagcgga gggcctcctc 660
atggagccgc cggcttccgg cgcatcgtcc gacgacgacg acgacgccat cgtcgactca 720
agcgacatcg ctgacgtgtc tctgtggagc tactag 756
<210>352
<211>251
<212>PRT
<213>稻
<400>352
Met Cys Thr Ser Lys Leu Glu Glu Ile Thr Gly Glu Trp Pro Pro Pro
1 5 10 15
Ala Leu Gln Ala Ala Ser Thr Thr Ser Ser Ser Glu Pro Cys Arg Arg
20 25 30
Leu Ser Pro Pro Ser Ser Lys Arg Pro Ala Gly Arg Thr Lys Phe His
35 40 45
Glu Thr Arg His Pro Val Phe Arg Gly Val Arg Arg Arg Gly Arg Ala
50 55 60
Gly Arg Trp Val Cys Glu Val Arg Val Pro Gly Arg Arg Gly Cys Arg
65 70 75 80
Leu Trp Leu Gly Thr Phe Asp Ala Ala Asp Ala Ala Ala Arg Ala His
85 90 95
Asp Ala Ala Met Leu Ala Leu Arg Gly Arg Ala Ala Ala Cys Leu Asn
100 105 110
Phe Ala Asp Ser Ala Trp Leu Leu Ala Val Pro Pro Pro Ala Thr Leu
115 120 125
Arg Cys Ala Ala Asp Val Gln Arg Ala Val Ala Arg Ala Leu Glu Asp
130 135 140
Phe Glu Gln Arg Glu Ser Ser Ser Ser Val Phe Pro Leu Ala Ile Asp
145 150 155 160
Val Val Ala Glu Asp Ala Met Ser Ala Thr Ser Glu Pro Ser Ala Ala
165 170 175
Ser Asp Asp Asp Ala Val Thr Ser Ser Ser Ser Thr Thr Asp Ala Asp
180 185 190
Glu Glu Ala Ser Pro Phe Glu Leu Asp Val Val Ser Asp Met Gly Trp
195 200 205
Ser Leu Tyr Tyr Ala Ser Leu Ala Glu Gly Leu Leu Met Glu Pro Pro
210 215 220
Ala Ser Gly Ala Ser Ser Asp Asp Asp Asp Asp Ala Ile Val Asp Ser
225 230 235 240
Ser Asp Ile Ala Asp Val Ser Leu Trp Ser Tyr
245 250
<210>353
<211>741
<212>DNA
<213>稻
<400>353
atggacatgg ccggccacga ggtgaactcc agctcgtcgt cgtcgggggc ggagtcgtcg 60
tcgtcctcgt cggggcggca gcagtacaag aagcggcccg cggggcgcac caagttcagg 120
gagacgcggc acccggtgta ccgcggcgtg cggcgccgcg gcggggcggg gcggtgggtg 180
tgcgaggtgc gcgtcccggg gaagcgcggc gcgcgcctgt ggctcggcac gtacgtcacc 240
gccgaggccg cggcgcgcgc gcacgacgcc gccatgatcg cgctccgcgg cggcgccggc 300
ggaggcggcg cggcgtgcct caacttccag gactccgcgt ggctgctcgc cgtcccgccc 360
gccgcgccgt ccgacctggc cggcgtccgc cgcgcggcca ccgaggccgt cgcgggcttc 420
ctccagcgca acaagaccac gaacggcgcc tccgtcgcgg aggccatgga cgaggccacc 480
tccggcgtgt ccgcgccgcc gccgctggcc aacaatgccg gctcgtcgga gacgcccgga 540
ccttcatcga tcgacggaac ggctgacacg gcggcggggg cggcgctgga catgttcgag 600
ctcgacttct tcggcgaaat ggactacgac acgtactacg cgagcctggc cgaggggctt 660
ctcatggagc cgccgccggc ggcgaccgca ctctgggaca acggcgacga aggcgctgac 720
atcgcgctct ggagctactg a 741
<210>354
<211>246
<212>PRT
<213>稻
<400>354
Met Asp Met Ala Gly His Glu Val Asn Ser Ser Ser Ser Ser Ser Gly
1 5 10 15
Ala Glu Ser Ser Ser Ser Ser Ser Gly Arg Gln Gln Tyr Lys Lys Arg
20 25 30
Pro Ala Gly Arg Thr Lys Phe Arg Glu Thr Arg His Pro Val Tyr Arg
35 40 45
Gly Val Arg Arg Arg Gly Gly Ala Gly Arg Trp Val Cys Glu Val Arg
50 55 60
Val Pro Gly Lys Arg Gly Ala Arg Leu Trp Leu Gly Thr Tyr Val Thr
65 70 75 80
Ala Glu Ala Ala Ala Arg Ala His Asp Ala Ala Met Ile Ala Leu Arg
85 90 95
Gly Gly Ala Gly Gly Gly Gly Ala Ala Cys Leu Asn Phe Gln Asp Ser
100 105 110
Ala Trp Leu Leu Ala Val Pro Pro Ala Ala Pro Ser Asp Leu Ala Gly
115 120 125
Val Arg Arg Ala Ala Thr Glu Ala Val Ala Gly Phe Leu Gln Arg Asn
130 135 140
Lys Thr Thr Asn Gly Ala Ser Val Ala Glu Ala Met Asp Glu Ala Thr
145 150 155 160
Ser Gly Val Ser Ala Pro Pro Pro Leu Ala Asn Asn Ala Gly Ser Ser
165 170 175
Glu Thr Pro Gly Pro Ser Ser Ile Asp Gly Thr Ala Asp Thr Ala Ala
180 185 190
Gly Ala Ala Leu Asp Met Phe Glu Leu Asp Phe Phe Gly Glu Met Asp
195 200 205
Tyr Asp Thr Tyr Tyr Ala Ser Leu Ala Glu Gly Leu Leu Met Glu Pro
210 215 220
Pro Pro Ala Ala Thr Ala Leu Trp Asp Asn Gly Asp Glu Gly Ala Asp
225 230 235 240
Ile Ala Leu Trp Ser Tyr
245
<210>355
<211>729
<212>DNA
<213>稻
<400>355
atggacgtcg cgcgcgacat ggagaagaac accaccgcca tggggcaatt gatgagctcc 60
tccgcgacga cggcggcgac ggcgacgggg ccggcgtcgc cgaagcggcc ggcggggcgg 120
accaagttcc aggagacgag gcacccggtg ttccgcgggg tgcggcggcg cgggcgcgcg 180
gggcggtggg tgtgcgaggt gcgcgtcccg ggcagccgcg gcgaccgcct gtgggtcggc 240
acgttcgaca ccgccgagga ggccgcgcgc gcgcacgacg ccgccatgct cgccctgtgc 300
ggggcctccg ccagcctcaa cttcgccgac tccgcctggc tgctccacgt cccccgcgcc 360
cccgtcgcct ccggccatga ccagctgccc gacgtgcagc gcgccgccag cgaggccgtc 420
gccgagttcc agcgccgggg aagtactgcc gccactgcca ccgccacctc cggcgacgcc 480
gcatccaccg ctcctccgtc gtcgtcgccc gttctgtcac ccaacgacga caatgcctcg 540
tcggcgtcca ctcctgcggt ggcggcggcg ttggaccacg gcgacatgtt cggtggcatg 600
cgcaccgatc tgtacttcgc gagcttggcg cagggtctgc tcatcgagcc gccgccgccg 660
ccgaccaccg ctgagggttt ctgcgacgac gaaggatgcg gcggcgctga aatggagctg 720
tggagctag 729
<210>356
<211>182
<212>PRT
<213>稻
<400>356
Met Asp Val Ala Arg Asp Met Lys Asn Thr Thr Ala Met Gly Met Ser
1 5 10 15
Ser Ser Ala Thr Thr Ala Ala Thr Ala Thr Gly Ala Ser Lys Arg Ala
20 25 30
Gly Arg Thr Lys Thr Arg His Val Arg Gly Val Arg Arg Arg Gly Arg
35 40 45
Ala Gly Arg Trp Val Cys Val Arg Val Gly Ser Arg Gly Asp Arg Trp
50 55 60
Val Gly Thr Asp Thr Ala Ala Ala Arg Ala His Asp Ala Ala Met Ala
65 70 75 80
Cys Gly Ala Ser Ala Ser Asn Ala Asp Ser Ala Trp His Val Arg Ala
85 90 95
Val Ala Ser Gly His Asp Asp Val Arg Ala Ala Ser Ala Val Ala Arg
100 105 110
Arg Gly Ser Thr Ala Ala Thr Ala Thr Ala Thr Ser Gly Asp Ala Ala
115 120 125
Ser Thr Ala Ser Ser Ser Val Ser Asn Asp Asp Asn Ala Ser Ser Ala
130 135 140
Ser Thr Ala Val Ala Ala Ala Asp His Gly Asp Met Gly Gly Met Arg
145 150 155 160
Thr Asp Tyr Ala Ser Ala Gly Thr Thr Ala Gly Cys Asp Asp Gly Cys
165 170 175
Gly Gly Ala Met Trp Ser
180
<210>357
<211>904
<212>DNA
<213>稻
<400>357
actgcttgag acgtcgcaca cgtcatggag aagaacaccg ccgccagcgg gcaattgatg 60
acctcctccg cggaggcgac gccgtcgtcg ccgaagcggc cggcggggcg aaccaagttc 120
caggagacga ggcacctagt gttccgtggg gtgcgatggc gtgggtgcgc ggggcggtgg 180
gtgtgcaagg tgcgtgtccc gggcagccgc ggtgaccgtt tctggatagg cacgtctgac 240
accgccgagg agaccgcgcg cacgcacgac gccgccatgc tcgccttgtg cggggcctcc 300
gccagcctca acttcgccga ctctgcctgg ctgctccacg tcccgcgcgc ccccgtcgtc 360
tccggactcc ggccaccagc tgcccgatgt gcaacgcgct gcctgcaagg ccatcgccga 420
gttccagcgc cgggccgggg gagcaccgcc actgccactg ccacctccgg cgatgctgca 480
tcgaccgctc ctccgtcggc acccgttctg tcagccaaac aatgcgaatt catctttctt 540
tcttcactag attgttggat gttaatgtca aagcttatca gcagtagcag agcaaaagga 600
tcgttgtgcc tgcgaaaaaa tcccatttca ttttgcatgg ttacaaattc ttacactgct 660
cttttgctcg aatacattat attgcagatg aattcaatga tcgttttaat ccacgaatta 720
tcaaaatatc aagtctttct gctactaacc atgataacac accacctttt tcaatggagg 780
aggtaggcgc ggacgccctc gccatcatcg tcgatgtcgc cactgatgac gaggtccgcg 840
ccgctcacca gctcgcacgc ctcgtcgtcg tccatgctcg ccacctcggt ccagcagctg 900
aacc 904
<210>358
<211>253
<212>PRT
<213>稻
<400>358
Met Glu Lys Asn Thr Ala Ala Ser Gly Gln Leu Met Thr Ser Ser Ala
1 5 10 15
Glu Ala Thr Pro Ser Ser Pro Lys Arg Pro Ala Gly Arg Thr Lys Phe
20 25 30
Gln Glu Thr Arg His Leu Val Phe Arg Gly Val Arg Trp Arg Gly Cys
35 40 45
Ala Gly Arg Trp Val Cys Lys Val Arg Val Pro Gly Ser Arg Gly Asp
50 55 60
Arg Phe Trp Ile Gly Thr Ser Asp Thr Ala Glu Glu Thr Ala Arg Thr
65 70 75 80
His Asp Ala Ala Met Leu Ala Leu Cys Gly Ala Ser Ala Ser Leu Asn
85 90 95
Phe Ala Asp Ser Ala Trp Leu Leu His Val Pro Arg Ala Pro Val Val
100 105 110
Ser Gly Leu Arg Pro Pro Ala Ala Arg Cys Ala Thr Arg Cys Leu Gln
115 120 125
Gly His Arg Arg Val Pro Ala Pro Gly Arg Gly Ser Thr Ala Thr Ala
130 135 140
Thr Ala Thr Ser Gly Asp Ala Ala Ser Thr Ala Pro Pro Ser Ala Pro
145 150 155 160
Val Leu Ser Ala Lys Gln Cys Glu Phe Ile Phe Leu Ser Ser Leu Asp
165 170 175
Cys Trp Met Leu Met Ser Lys Leu Ile Ser Ser Ser Arg Ala Lys Gly
180 185 190
Ser Leu Cys Leu Arg Lys Asn Pro Ile Ser Phe Cys Met Val Thr Asn
195 200 205
Ser Tyr Thr Ala Leu Leu Leu Glu Tyr Ile Ile Leu Gln Met Asn Ser
210 215 220
Met Ile Val Leu Ile His Glu Leu Ser Lys Tyr Gln Val Phe Leu Leu
225 230 235 240
Leu Thr Met Ile Thr His His Leu Phe Gln Trp Arg Arg
245 250
<210>359
<211>897
<212>DNA
<213>稻
<400>359
cagagagagt catccatgga ggtggaggag gcggcgtaca ggacggtgtg gtcggagccg 60
ccgaagaggc cggcgggaag gaccaagttc agggagacga ggcacccggt gtaccgcggc 120
gtgcggcggc gcggggggcg gccgggcgcg gcggggaggt gggtgtgcga ggtgcgggtg 180
cccggggcgc gcggctccag gctgtggctc ggcacgttcg ccaccgccga ggcggcggcg 240
cgcgcgcacg acgccgccgc gctggcgctc cgcggcaggg ccgcctgcct caacttcgcc 300
gactccgcgt ggcggatgcc gcccgtcccc gcgtccgccg cgctcgccgg cgcgaggggg 360
gtcagggacg ccgtcgccgt ggccgtcgag gcgttccagc gccagtcggc cgcgccgtcg 420
tctccggcgg agaccttcgc caacgatggc gacgaagaag aagacaacaa ggacgtgttg 480
ccggtggcgg cggcggaggt gttcgacgcg ggggcgttcg agctcgacga cgggttcagg 540
ttcggcggga tggacgccgg gtcgtactac gcgagcttgg cgcaggggct gctcgtcgag 600
ccgccggccg ccggagcgtg gtgggaggac ggcgagctcg ccggctccga catgccgctc 660
tggagctact aatcaaaatc tcgcactgaa aagtgtggac aaattttgat tctccagaaa 720
ttgggggaaa aaagagaaca gagtattggt gaatttagaa cagagtaggc aatgagactg 780
aggatgaatg gcaatttttg taattttgga atgtgccaga tttctccctc cttttgtgat 840
tccatctgat tttgaatgtg cagtcaatga attcctgtaa atttacttct cctctcc 897
<210>360
<211>218
<212>PRT
<213>稻
<400>360
Met Glu Val Glu Glu Ala Ala Tyr Arg Thr Val Trp Ser Glu Pro Pro
1 5 10 15
Lys Arg Pro Ala Gly Arg Thr Lys Phe Arg Glu Thr Arg His Pro Val
20 25 30
Tyr Arg Gly Val Arg Arg Arg Gly Gly Arg Pro Gly Ala Ala Gly Arg
35 40 45
Trp Val Cys Glu Val Arg Val Pro Gly Ala Arg Gly Ser Arg Leu Trp
50 55 60
Leu Gly Thr Phe Ala Thr Ala Glu Ala Ala Ala Arg Ala His Asp Ala
65 70 75 80
Ala Ala Leu Ala Leu Arg Gly Arg Ala Ala Cys Leu Asn Phe Ala Asp
85 90 95
Ser Ala Trp Arg Met Pro Pro Val Pro Ala Ser Ala Ala Leu Ala Gly
100 105 110
Ala Arg Gly Val Arg Asp Ala Val Ala Val Ala Val Glu Ala Phe Gln
115 120 125
Arg Gln Ser Ala Ala Pro Ser Ser Pro Ala Glu Thr Phe Ala Asn Asp
130 135 140
Gly Asp Glu Glu Glu Asp Asn Lys Asp Val Leu Pro Val Ala A1a Ala
145 150 155 160
Glu Val Phe Asp Ala Gly Ala Phe Glu Leu Asp Asp Gly Phe Arg Phe
165 170 175
Gly Gly Met Asp Ala Gly Ser Tyr Tyr Ala Ser Leu Ala Gln Gly Leu
180 185 190
Leu Val Glu Pro Pro Ala Ala Gly Ala Trp Trp Glu Asp Gly Glu Leu
195 200 205
Ala Gly Ser Asp Met Pro Leu Trp Ser Tyr
210 215
<210>361
<211>1272
<212>DNA
<213>稻
<400>361
agaattcaaa ccggatcaac ctcgctcgct tactcgtgtt taggcatgga cgtttctgct 60
gcgctcagca gcgactactc gtcggggacg ccgtcgccgg tggcggccga cgccgacgac 120
ggctcctccg cctacatgac ggtgtcgtcg gcgccgccca agcggcgagc ggggcggacc 180
aagttcaagg agacgcggca ccccgtgttc aagggcgtgc gccggaggaa ccccgggagg 240
tgggtgtgcg aggtgcgcga gccgcacggc aagcagcgga tatggctcgg gacgttcgag 300
acagcagaga tggcggcgcg cgcgcacgac gtcgccgcgc tcgcgctccg cggccgcgcc 360
gcctgcctca acttcgccga ctcgccgagg cgcctccgcg tcccgcccat cggcgcaagc 420
cacgacgaca tacggagggc ggcggctgag gcggccgagg cattccggcc gccaccagat 480
gagagcaatg cggccaccga ggtggcagcc gccgcatcgg gcgccactaa ttcgaacgcc 540
gaacagttcg cctcccaccc gtactacgag gtcatggacg atgggctgga cttggggatg 600
cagggctatc tcgacatggc gcaagggatg ctcattgacc cgcctccaat ggccggtgat 660
cctgccgtag gtagcggcga agacgacaac gatggcgagg tccagctatg gagctactga 720
tcctgcgcgt ttgaactcaa cttggtttgg cgcgaagaga tcgcatgtac agcttaaggg 780
agtcgagtac aagtacctca ggtgtactcc actcgttgcc cctttccctt ccctttcgtt 840
tttcttgagc ttatctgcag ggtaatgtta tgtattgctg ctcttctgat gaaatgtgat 900
cggaagaagc ggaaggccag atcgagctta tgggttctga agacggtgaa ggcttgtcga 960
gtgttgtgag catatattca gaaagtcagg cactgtgaaa gtatgaatca gatcagcctt 1020
gttacgaatg agagtgatcg accttgttca gtgtttataa ttgaaccact tgtgtgtaat 1080
aagcagcaaa gccatgttgc ttgcttgatc tgactcttgg gaatggtata tttctcaaag 1140
aatgcaggat tgactactca gaatttgaca ttttgcagtg aaatgatagg attgttaaat 1200
taacattgga ggagaggcat gtgtatatat gttaagaaac attagtaatg atgagcctat 1260
gatacttcga tc 1272
<210>362
<211>224
<212>PRT
<213>稻
<400>362
Met Asp Val Ser Ala Ala Leu Ser Ser Asp Tyr Ser Ser Gly Thr Pro
1 5 10 15
Ser Pro Val Ala Ala Asp Ala Asp Asp Gly Ser Ser Ala Tyr Met Thr
20 25 30
Val Ser Ser Ala Pro Pro Lys Arg Arg Ala Gly Arg Thr Lys Phe Lys
35 40 45
Glu Thr Arg His Pro Val Phe Lys Gly Val Arg Arg Arg Asn Pro Gly
50 55 60
Arg Trp Val Cys Glu Val Arg Glu Pro His Gly Lys Gln Arg Ile Trp
65 70 75 80
Leu Gly Thr Phe Glu Thr Ala Glu Met Ala Ala Arg Ala His Asp Val
85 90 95
Ala Ala Leu Ala Leu Arg Gly Arg Ala Ala Cys Leu Asn Phe Ala Asp
100 105 110
Ser Pro Arg Arg Leu Arg Val Pro Pro Ile Gly Ala Ser His Asp Asp
115 120 125
Ile Arg Arg Ala Ala Ala Glu Ala Ala Glu Ala Phe Arg Pro Pro Pro
130 135 140
Asp Glu Ser Asn Ala Ala Thr Glu Val Ala Ala Ala Ala Ser Gly Ala
145 150 155 160
Thr Asn Ser Asn Ala Glu Gln Phe Ala Ser His Pro Tyr Tyr Glu Val
165 170 175
Met Asp Asp Gly Leu Asp Leu Gly Met Gln Gly Tyr Leu Asp Met Ala
180 185 190
Gln Gly Met Leu Ile Asp Pro Pro Pro Met Ala Gly Asp Pro Ala Val
195 200 205
Gly Ser Gly Glu Asp Asp Asn Asp Gly Glu Val Gln Leu Trp Ser Tyr
210 215 220
<210>363
<211>764
<212>DNA
<213>稻
<400>363
ccagcagcag caacacacac tactgacatg gagtactacg agcaggagga gtacgcgacg 60
gtgacgtcgg cgccgccgaa gcggccggcg gggaggacca agttcaggga gacgaggcac 120
ccggtgtacc gcggcgtgcg gcggcggggg cccgcggggc ggtgggtgtg cgaggtcagg 180
gagcccaaca agaagtcccg catctggctc ggcaccttcg ccaccgccga ggccgccgcg 240
cgcgcccacg acgtcgccgc gctcgccctc cgcggccgcg gcgcgtgcct caacttcgcc 300
gactcggccc gcctcctccg cgtcgacccg gccaccctcg ccacccccga cgacatccgc 360
cgcgccgcca tcgagctcgc cgagtcatgc ccgcacgacg ccgccgccgc cgccgcctcc 420
agctccgccg ccgccgtcga ggcctccgcc gccgccgcgc ccgccatgat gatgcagtac 480
caggacgaca tggcggcgac gccgtccagc tacgactacg cgtactacgg caacatggac 540
ttcgaccagc cgtcctacta ctacgacggg atgggcggcg gcggcgagta ccagagctgg 600
cagatggacg gcgacgacga tggtggcgcc ggcggctacg gcggcggcga cgtcacactc 660
tggagctact gatgatcgcg agttggagct agcagttttg agctcaacca gctttgctcc 720
tcctatacag ctaaatactg taggagaaat taatggagat tttt 764
<210>364
<211>214
<212>PRT
<213>稻
<400>364
Met Glu Tyr Tyr Glu Gln Glu Glu Tyr Ala Thr Val Thr Ser Ala Pro
1 5 10 15
Pro Lys Arg Pro Ala Gly Arg Thr Lys Phe Arg Glu Thr Arg His Pro
20 25 30
Val Tyr Arg Gly Val Arg Arg Arg Gly Pro Ala Gly Arg Trp Val Cys
35 40 45
Glu Val Arg Glu Pro Asn Lys Lys Ser Arg Ile Trp Leu Gly Thr Phe
50 55 60
Ala Thr Ala Glu Ala Ala Ala Arg Ala His Asp Val Ala Ala Leu Ala
65 70 75 80
Leu Arg Gly Arg Gly Ala Cys Leu Asn Phe Ala Asp Ser Ala Arg Leu
85 90 95
Leu Arg Val Asp Pro Ala Thr Leu Ala Thr Pro Asp Asp Ile Arg Arg
100 105 110
Ala Ala Ile Glu Leu Ala Glu Ser Cys Pro His Asp Ala Ala Ala Ala
115 120 125
Ala Ala Ser Ser Ser Ala Ala Ala Val Glu Ala Ser Ala Ala Ala Ala
130 135 140
Pro Ala Met Met Met Gln Tyr Gln Asp Asp Met Ala Ala Thr Pro Ser
145 150 155 160
Ser Tyr Asp Tyr Ala Tyr Tyr Gly Asn Met Asp Phe Asp Gln Pro Ser
165 170 175
Tyr Tyr Tyr Asp Gly Met Gly Gly Gly Gly Glu Tyr Gln Ser Trp Gln
180 185 190
Met Asp Gly Asp Asp Asp Gly Gly Ala Gly Gly Tyr Gly Gly Gly Asp
195 200 205
Val Thr Leu Trp Ser Tyr
210
<210>365
<211>862
<212>DNA
<213>稻
<400>365
catccatgga ggtggaggag gcggcgtaca ggacggtgtg gtcggagccg ccgaagaggc 60
cggcgggaag gaccaagttc agggagacga ggcacccggt gtaccgcggc gtgcggcggc 120
gcggggggcg gccgggcgcg gcggggaggt gggtgtgcga ggtgcgggtg cccggggcgc 180
gcggctccag gctgtggctc ggcacgttcg ccaccgccga ggcggcggcg cgcgcgcacg 240
acgccgccgc gctggcgctc cgcggcaggg ccgcctgcct caacttcgcc gactccgcgt 300
ggcggatgcc gcccgtcccc gcgtccgccg cgctcgccgg cgcgaggggg gtcagggacg 360
ccgtcgccgt ggccgtcgag gcgttccagc gccagtcggc cgcgccgtcg tctccggcgg 420
agaccttcgc cgacgatggc gacgaagaag aagacaacaa ggacgtgttg ccggtggcgg 480
cggcggaggt gttcgacgcg ggggcgttcg agctcgacga cgggttcagg ttcggcggga 540
tggacgccgg gtcgtactac gcgagcttgg cgcaggggct gctcgtcgag ccgccggccg 600
ccggagcgtg gtgggaggac ggcgagctcg ccggctccga tatgccgctc tggagctact 660
aatcaaaatc tcgcactgaa aagtgtggac aaattttgat tctccagaaa ttgggggaaa 720
aaagagaaca gagtattggt gaatttagaa cagagtaggc aatgagactg aggatgaatg 780
gcatttttgt aattttggaa tgtgccagat ttctccctcc ttttgtgatt ccatctgatt 840
ttgaatgtgc agtcatgaat tc 862
<210>366
<211>218
<212>PRT
<213>稻
<400>366
Met Glu Val Glu Glu Ala Ala Tyr Arg Thr Val Trp Ser Glu Pro Pro
1 5 10 15
Lys Arg Pro Ala Gly Arg Thr Lys Phe Arg Glu Thr Arg His Pro Val
20 25 30
Tyr Arg Gly Val Arg Arg Arg Gly Gly Arg Pro Gly Ala Ala Gly Arg
35 40 45
Trp Val Cys Glu Val Arg Val Pro Gly Ala Arg Gly Ser Arg Leu Trp
50 55 60
Leu Gly Thr Phe Ala Thr Ala Glu Ala Ala Ala Arg Ala His Asp Ala
65 70 75 80
Ala Ala Leu Ala Leu Arg Gly Arg Ala Ala Cys Leu Asn Phe Ala Asp
85 90 95
Ser Ala Trp Arg Met Pro Pro Val Pro Ala Ser Ala Ala Leu Ala Gly
100 105 110
Ala Arg Gly Val Arg Asp Ala Val Ala Val Ala Val Glu Ala Phe Gln
115 120 125
Arg Gln Ser Ala Ala Pro Ser Ser Pro Ala Glu Thr Phe Ala Asp Asp
130 135 140
Gly Asp Glu Glu Glu Asp Asn Lys Asp Val Leu Pro Val Ala Ala Ala
145 150 155 160
Glu Val Phe Asp Ala Gly Ala Phe Glu Leu Asp Asp Gly Phe Arg Phe
165 170 175
Gly Gly Met Asp Ala Gly Ser Tyr Tyr Ala Ser Leu Ala Gln Gly Leu
180 185 190
Leu Val Glu Pro Pro Ala Ala Gly Ala Trp Trp Glu Asp Gly Glu Leu
195 200 205
Ala Gly Ser Asp Met Pro Leu Trp Ser Tyr
210 215
<210>367
<211>699
<212>DNA
<213>玉米
<400>367
atggagtacg ccgccgtcgg ctacggctac gggtacgggt acgacgagcg ccaggagccg 60
gcggagtccg cggacggcgg cggcggcggc gacgacgagt acgcgacggt gctgtcggcg 120
ccacccaagc ggccggcggg gcggaccaag ttccgggaga cgcggcaccc cgtgtaccgc 180
ggcgtgcggc ggcgcgggcc cgcggggcgc tgggtgtgcg aggtccgcga gcccaacaag 240
aagtcgcgca tctggctcgg caccttcgcc acccccgagg ccgccgcgcg cgcgcacgac 30o
gtggccgcgc tggccctgcg gggccgcgcc gcgtgcctca acttcgccga ctcggcgcgc 360
ctgctccagg tcgaccccgc cacgctcgcc acccccgacg acatccgccg cgccgccatc 420
cagctcgccg acgccgcctc gcagcaggat gagactgccg ccgttgccgc tgacgtggtc 480
gcgccctcgc aggcggacga cgtcgccgcc gccgccgccg ccgcggcggc gatgtacggc 540
ggcggcatgg agttcgacca ctcgtattgc tacgacgacg ggatggtgag cgggagcagc 600
gactgctggc aaagcggcgc cggcgccggt ggatggcata gcatcgtgga cggcgactac 660
gacgacggcg ccagcgacat gacgctctgg agctactga 699
<210>368
<211>232
<212>PRT
<213>玉米
<400>368
Met Glu Tyr Ala Ala Val Gly Tyr Gly Tyr Gly Tyr Gly Tyr Asp Glu
1 5 10 15
Arg Gln Glu Pro Ala Glu Ser Ala Asp Gly Gly Gly Gly Gly Asp Asp
20 25 30
Glu Tyr Ala Thr Val Leu Ser Ala Pro Pro Lys Arg Pro Ala Gly Arg
35 40 45
Thr Lys Phe Arg Glu Thr Arg His Pro Val Tyr Arg Gly Val Arg Arg
50 55 60
Arg Gly Pro Ala Gly Arg Trp Val Cys Glu Val Arg Glu Pro Asn Lys
65 70 75 80
Lys Ser Arg Ile Trp Leu Gly Thr Phe Ala Thr Pro Glu Ala Ala Ala
85 90 95
Arg Ala His Asp Val Ala Ala Leu Ala Leu Arg Gly Arg Ala Ala Cys
100 105 110
Leu Asn Phe Ala Asp Ser Ala Arg Leu Leu Gln Val Asp Pro Ala Thr
115 120 125
Leu Ala Thr Pro Asp Asp Ile Arg Arg Ala Ala Ile Gln Leu Ala Asp
130 135 140
Ala Ala Ser Gln Gln Asp Glu Thr Ala Ala Val Ala Ala Asp Val Val
145 150 155 160
Ala Pro Ser Gln Ala Asp Asp Val Ala Ala Ala Ala Ala Ala Ala Ala
165 170 175
Ala Met Tyr Gly Gly Gly Met Glu Phe Asp His Ser Tyr Cys Tyr Asp
180 185 190
Asp Gly Met Val Ser Gly Ser Ser Asp Cys Trp Gln Ser Gly Ala Gly
195 200 205
Ala Gly Gly Trp His Ser Ile Val Asp Gly Asp Tyr Asp Asp Gly Ala
210 215 220
Ser Asp Met Thr Leu Trp Ser Tyr
225 230
<210>369
<211>696
<212>DNA
<213>玉米
<400>369
atgtgcccaa ccaagaaggg gatgaccgga gagccgagct cgccatgcag ctcggcatca 60
gcctcgacct taccggagca ccaccagacg gtgtggacgt cgccgccgaa gcggccagcg 120
gggcggacca agttccggga gacgcggcac ccggtgttcc gcggcgtccg gcgccggggc 180
agcgccgggc ggtgggtgtg cgaggtgcgc gtgccgggga ggcgcggctg caggctctgg 240
ctcggcacct tcgacacggc cgaggcggcg gcccgcgcgc acgacgccgc catgctcgcc 300
ctcgccggcg cgggcgcctg ctgcctcaac ttcgccgact cggcctggct cctcgcggtc 360
ccggcctcgt gcgccagcct cgccgaggtc cgccacgcgg tcgcggacgc cgtggaggac 420
ttcctccgcc atcaggtggt cccggaggac gacgccctcg cggccacgcc gtcgtcgcct 480
tccagcgaag acggcagcac ctctgatggc ggggagtcct cctctgattc ctctccgccc 540
accggggcct cgccgttcga attggatgtg ttcaacgaca tgagctggga cctgcactac 600
gcgagcttgg cgcagggatt gctcgtggag ccaccgtccg cggtcacggc gctcatggac 660
gaaggcttcg ccgatgtgcc gctctggagc tactag 696
<210>370
<211>231
<212>PRT
<213>玉米
<400>370
Met Cys Pro Thr Lys Lys Gly Met Thr Gly Glu Pro Ser Ser Pro Cys
1 5 10 15
Ser Ser Ala Ser Ala Ser Thr Leu Pro Glu His His Gln Thr Val Trp
20 25 30
Thr Ser Pro Pro Lys Arg Pro Ala Gly Arg Thr Lys Phe Arg Glu Thr
35 40 45
Arg His Pro Val Phe Arg Gly Val Arg Arg Arg Gly Ser Ala Gly Arg
50 55 60
Trp Val Cys Glu Val Arg Val Pro Gly Arg Arg Gly Cys Arg Leu Trp
65 70 75 80
Leu Gly Thr Phe Asp Thr Ala Glu Ala Ala Ala Arg Ala His Asp Ala
85 90 95
Ala Met Leu Ala Leu Ala Gly Ala Gly Ala Cys Cys Leu Asn Phe Ala
100 105 110
Asp Ser Ala Trp Leu Leu Ala Val Pro Ala Ser Cys Ala Ser Leu Ala
115 120 125
Glu Val Arg His Ala Val Ala Asp Ala Val Glu Asp Phe Leu Arg His
130 135 140
Gln Val Val Pro Glu Asp Asp Ala Leu Ala Ala Thr Pro Ser Ser Pro
145 150 155 160
Ser Ser Glu Asp Gly Ser Thr Ser Asp Gly Gly Glu Ser Ser Ser Asp
165 170 175
Ser Ser Pro Pro Thr Gly Ala Ser Pro Phe Glu Leu Asp Val Phe Asn
180 185 190
Asp Met Ser Trp Asp Leu His Tyr Ala Ser Leu Ala Gln Gly Leu Leu
195 200 205
Val Glu Pro Pro Ser Ala Val Thr Ala Leu Met Asp Glu Gly Phe Ala
210 215 220
Asp Val Pro Leu Trp Ser Tyr
225 230
<210>371
<211>1085
<212>DNA
<213>玉米
<400>371
gctcaagctc gagacaagaa accagaacca gctcactcct cactccactt ccactcccaa 60
cagcaagctc aagcagtcag tcaccggcag gggtcagggt cacagtcaca gcagcagcca 120
tggacacggc cggcctcgtc cagcacgcga cctcctcgtc ttccacctcc acctcggcgt 180
cgtcgtcctc gtccgagcag cagagccgca aggcggcgtg gccgccgtcg accgcttcct 240
caccacagca gccgcccaag aagcgccccg cggggcgcac aaagttccgg gagacgcggc 300
acccggtgtt ccgcggcgtg cggcggcggg gcgccgcggg ccggtgggtg tgcgaggtgc 360
gcgtcccggg gaggcgcggc gcgcggctgt ggctcggcac ctacctcgcc gccgaggcgg 420
cggcgcgcgc gcacgacgcc gcgatactcg ccctgcaggg ccgcggcgcg gggcgcctca 480
acttcccgga ctccgcgcgg ctgctcgccg tgccgccccc gtccgcgctc ccgggcctgg 540
acgacgcccg ccgcgcggcg ctcgaggccg tcgcggagtt ccagcgccgc tctgggtccg 600
ggtccggggc cgccgacgaa gcgacctcgg gcgcgtctcc tccctcctcg tcgccgtcgc 660
tgccggacgt ttctgcggct ggctcgccgg cggcggcgct tgagcacgtg cctgtgaagg 720
ccgacgaagc agtggcgttg gacttggacg gcgacgtgtt cgggcccgac tggttcgggg 780
acatgggcct ggagttggat gcgtactacg ccagcctcgc ggaagggttg ctcgtggage 840
cgccgccgcc gccggcggcc tgggatcatg gagactgctg tgactccgga gctgcggacg 900
tcgcgctctg gagctactac tagcaaagtt aacaataata agcttgacag ccaaccccaa 960
aagcccccca actgattgta ttcacctctg taacaaaatt caaattgatt tcccagcaaa 1020
tgaacttcaa aagaagtctt tggttccgat ttaaaaaaaa aaaaaaaaaa aaaaaaaaaa 1080
aaaaa 1085
<210>372
<211>267
<212>PRT
<213>玉米
<400>372
Met Asp Thr Ala Gly Leu Val Gln His Ala Thr Ser Ser Ser Ser Thr
1 5 10 15
Ser Thr Ser Ala Ser Ser Ser Ser Ser Glu Gln Gln Ser Arg Lys Ala
20 25 30
Ala Trp Pro Pro Ser Thr Ala Ser Ser Pro Gln Gln Pro Pro Lys Lys
35 40 45
Arg Pro Ala Gly Arg Thr Lys Phe Arg Glu Thr Arg His Pro Val Phe
50 55 60
Arg Gly Val Arg Arg Arg Gly Ala Ala Gly Arg Trp Val Cys Glu Val
65 70 75 80
Arg Val Pro Gly Arg Arg Gly Ala Arg Leu Trp Leu Gly Thr Tyr Leu
85 90 95
Ala Ala Glu Ala Ala Ala Arg Ala His Asp Ala Ala Ile Leu Ala Leu
100 105 110
Gln Gly Arg Gly Ala Gly Arg Leu Asn Phe Pro Asp Ser Ala Arg Leu
115 120 125
Leu Ala Val Pro Pro Pro Ser Ala Leu Pro Gly Leu Asp Asp Ala Arg
130 135 140
Arg Ala Ala Leu Glu Ala Val Ala Glu Phe Gln Arg Arg Ser Gly Ser
145 150 155 160
Gly Ser Gly Ala Ala Asp Glu Ala Thr Ser Gly Ala Ser Pro Pro Ser
165 170 175
Ser Ser Pro Ser Leu Pro Asp Val Ser Ala Ala Gly Ser Pro Ala Ala
180 185 190
Ala Leu Glu His Val Pro Val Lys Ala Asp Glu Ala Val Ala Leu Asp
195 200 205
Leu Asp Gly Asp Val Phe Gly Pro Asp Trp Phe Gly Asp Met Gly Leu
210 215 220
Glu Leu Asp Ala Tyr Tyr Ala Ser Leu Ala Glu Gly Leu Leu Val Glu
225 230 235 240
Pro Pro Pro Pro Pro Ala Ala Trp Asp His Gly Asp Cys Cys Asp Ser
245 250 255
Gly Ala Ala Asp Val Ala Leu Trp Ser Tyr Tyr
260 265
<210>373
<211>846
<212>DNA
<213>玉米
<400>373
atggctcaag agctccacga aacgtcctct tgctctgcca ccaccacctc gtcgtgcacc 60
acatcctgct gctcgtccac tgtcacagac tcgtcctctt cgcccccgtc accggcggcg 120
gccaatgccg cgcccgcgac acggaagcgg caggcgttgg aggccgaggc cgaggccgag 180
gcgggcggtg aggaggagga ggaggaggag ggaagctgtg ctggtaataa agcggcgccg 240
gccaagaagc gaccgcgggg cagcgagggg aaacacccga cgttccgcgg cgtgcggatg 300
cgggcgtggg gcaagtgggt gtcggagatc cgcgagccgc gcaagaagtc gcgcatatgg 360
ctcggcacgt tccccaccgc cgagatggcc gcgcgcgccc acgacgtcgc ggcgctcgcc 420
atcaaaggcc gcgccgcgca cctcaacttc ccggacttcg ccggcgcgct cccgcgcgcc 480
gcgtccgcgg cgcccaagga cgtccaggca gccgccgcat tggccgctgc gttcacgtcg 540
ccgtcatcgg agcccggcgc cggcgcgcac gaggagcccg ctgccaagga cggcgccgcg 600
cccgaggagg cagccgccga cgcacaggca ccagtaccag tagcactacc accgccggcg 660
gcctctcggc cagggacgcc gtcgagcggc gtggaggacg agcggcagct gttcgacctg 720
ccggacctgc tcctcgacat ccgggacggg ttcgggcgct tcccgccgat gtgggccccg 780
ctcactgacg tggaggaggt ggtcaatgcg gagctgcgcc tcgaggagcc gctgctttgg 840
gagtag 846
<210>374
<211>281
<212>PRT
<213>玉米
<400>374
Met Ala Gln Glu Leu His Glu Thr Ser Ser Cys Ser Ala Thr Thr Thr
1 5 10 15
Ser Ser Cys Thr Thr Ser Cys Cys Ser Ser Thr Val Thr Asp Ser Ser
20 25 30
Ser Ser Pro Pro Ser Pro Ala Ala Ala Asn Ala Ala Pro Ala Thr Arg
35 40 45
Lys Arg Gln Ala Leu Glu Ala Glu Ala Glu Ala Glu Ala Gly Gly Glu
50 55 60
Glu Glu Glu Glu Glu Glu Gly Ser Cys Ala Gly Asn Lys Ala Ala Pro
65 70 75 80
Ala Lys Lys Arg Pro Arg Gly Ser Glu Gly Lys His Pro Thr Phe Arg
85 90 95
Gly Val Arg Met Arg Ala Trp Gly Lys Trp Val Ser Glu Ile Arg Glu
100 105 110
Pro Arg Lys Lys Ser Arg Ile Trp Leu Gly Thr Phe Pro Thr Ala Glu
115 120 125
Met Ala Ala Arg Ala His Asp Val Ala Ala Leu Ala Ile Lys Gly Arg
130 135 140
Ala Ala His Leu Asn Phe Pro Asp Phe Ala Gly Ala Leu Pro Arg Ala
145 150 155 160
Ala Ser Ala Ala Pro Lys Asp Val Gln Ala Ala Ala Ala Leu Ala Ala
165 170 175
Ala Phe Thr Ser Pro Ser Ser Glu Pro Gly Ala Gly Ala His Glu Glu
180 185 190
Pro Ala Ala Lys Asp Gly Ala Ala Pro Glu Glu Ala Ala Ala Asp Ala
195 200 205
Gln Ala Pro Val Pro Val Ala Leu Pro Pro Pro Ala Ala Ser Arg Pro
210 215 220
Gly Thr Pro Ser Ser Gly Val Glu Asp Glu Arg Gln Leu Phe Asp Leu
225 230 235 240
Pro Asp Leu Leu Leu Asp Ile Arg Asp Gly Phe Gly Arg Phe Pro Pro
245 250 255
Met Trp Ala Pro Leu Thr Asp Val Glu Glu Val Val Asn Ala Glu Leu
260 265 270
Arg Leu Glu Glu Pro Leu Leu Trp Glu
275 280
<210>375
<211>1455
<212>DNA
<213>玉米
<400>375
cactcagact cagctcaatc ccgagacaaa ggaacccacc tccactccca ccagcaagct 60
caagcaagca gccaccacca gcagcgatca gcggcagcca tggacatggg ccggcaccag 120
ctccagctcc agcacgcggc ctcctcgtcc tccacctcgg cgtcgtcctc gtccgagcag 180
gacaagccgc tctgctgctc tggtcccaag aagcgccccg cggggcgcac caagttccgg 240
gagacgcggc acccggtgtt ccgcggcgtg cggcggcggg gcgccgcggg gcggtgggtg 300
tgcgaggtgc gcgtccccgg gcggcgcggc gcgcggctgt ggctcggcac ctacctcggc 360
gccgaggcgg cggcgcgcgc gcacgacgcc gcgatgctcg ccctgggccg cggcgcggcc 420
tgcctcaact tccccgactc cgcgtggctg ctcgccgtgc cgcccccgcc cgcgctctcg 480
ggcggcctgg acggcgcccg ccgggccgcg ctcgaggccg tcgcggagtt ccagagacgc 540
cgcttcgggg cggcagccgc cgacgaagcg acctcgggca cgtctcctcc ctcctcctcc 600
tcctcggcga cgaagccggc gccggcgatt gagcgcgtgc ctgtggaggc cagtgagacg 660
gtggcgttgg acggcgccgt gttcgagccc gactggttcg gggacatgga cttggacttg 720
tactatgcca gcctcgcgga agggctgctc gtggagccgc cgcccccgcc cccgcccgcc 780
gcctgggatc atggtgactg ctgcgactcc ggagctgacg tcgcgctctg gagctactag 840
caagctatag cagcaataag ctccaccaac tcatctgtac tgtagtgtac ttgtaccttg 900
taccttgtac caaaatccaa attgatttgt agcgaattaa cttaccaatc ccccttggca 960
aaaaaaaacc gaggtcgatg atgaggatgg cggtagtgac gaggataacg acgacgacga 1020
gtaaatagta tttccgctgt tgtgaggtag caaatcgatt gttaggtccc caattagctc 1080
actggtttgc tatctttaat gttaagttgt ttggaacagg tgtttatgaa ggggatctat 1140
tagtttcgtg aggttgttag tttagtgcat tagcaaagaa aaagccgaat gctgctagct 1200
attatgttgc ttttcttttg ctaatcactt gtgtcacaac tttctgtacc tgtttcattg 1260
actaatctag tgactagtca gttatgggtt taatgtttgg ttttggtttt atatatttct 1320
ttgttgcatt ctgtgcggtc tacggaagtc atctgtgctg tatgaatgat gaatatctgc 1380
ttgtggctcg tttcagttta gtgagttttt gttttgtgac tcaggttaat ttacatgagt 1440
ttgtttgtga ctgtt 1455
<210>376
<211>246
<212>PRT
<213>玉米
<400>376
Met Asp Met Gly Arg His Gln Leu Gln Leu Gln His Ala Ala Ser Ser
1 5 10 15
Ser Ser Thr Ser Ala Ser Ser Ser Ser Glu Gln Asp Lys Pro Leu Cys
20 25 30
Cys Ser Gly Pro Lys Lys Arg Pro Ala Gly Arg Thr Lys Phe Arg Glu
35 40 45
Thr Arg His Pro Val Phe Arg Gly Val Arg Arg Arg Gly Ala Ala Gly
50 55 60
Arg Trp Val Cys Glu Val Arg Val Pro Gly Arg Arg Gly Ala Arg Leu
65 70 75 80
Trp Leu Gly Thr Tyr Leu Gly Ala Glu Ala Ala Ala Arg Ala His Asp
85 90 95
Ala Ala Met Leu Ala Leu Gly Arg Gly Ala Ala Cys Leu Asn Phe Pro
100 105 110
Asp Ser Ala Trp Leu Leu Ala Val Pro Pro Pro Pro Ala Leu Ser Gly
115 120 125
Gly Leu Asp Gly Ala Arg Arg Ala Ala Leu Glu Ala Val Ala Glu Phe
130 135 140
Gln Arg Arg Arg Phe Gly Ala Ala Ala Ala Asp Glu Ala Thr Ser Gly
145 150 155 160
Thr Ser Pro Pro Ser Ser Ser Ser Ser Ala Thr Lys Pro Ala Pro Ala
165 170 175
Ile Glu Arg Val Pro Val Glu Ala Ser Glu Thr Val Ala Leu Asp Gly
180 185 190
Ala Val Phe Glu Pro Asp Trp Phe Gly Asp Met Asp Leu Asp Leu Tyr
195 200 205
Tyr Ala Ser Leu Ala Glu Gly Leu Leu Val Glu Pro Pro Pro Pro Pro
210 215 220
Pro Pro Ala Ala Trp Asp His Gly Asp Cys Cys Asp Ser Gly Ala Asp
225 230 235 240
Val Ala Leu Trp Ser Tyr
245
<210>377
<211>800
<212>DNA
<213>普通小麦
<400>377
tttttgacgc tgcaactgat ggacaccgcc gctgccggct ccccgcgtga ggggcacagg 60
acggtgtgct cggagccgcc caagaggccg gcagggcgga ccaagttcag ggagacgcgc 120
cacccgctgt accgcggcgt gcggcgccgg ggccggctcg ggcagtgggt gtgcgaggtt 180
cgcgtgcgcg gcgcgcaagg gtacaggctc tggctcggca ccttcaccac tgccgagatg 240
gcggcgcgcg cgcacgactc cgccgtgctc gcgctcctcg accgcgccgc ctgcctcaac 300
ttcgccgact ccgcctggcg gatgctgccc gtcctcgcgg ctggctcgtc ccgcttcagc 360
agcgcgcggg agatcaagga cgccgtcgcc atcgccgtcc tggagttcca gcggcagegc 420
cccgtcgtgt caacgtcgga gatgcacgac ggcgaaaagg acgcccaagg ctcgccgacg 480
ccgagcgagc tgtccacgtc cagcgacttg ttggacgagc actggtttgg cggcatggac 540
gccggctcgt actacgcgag cttggcgcag gggatgctca tggagccgcc gtccgccaga 600
acgtggagcg aggatggcgg cgaatacagc gccgtctaca cgccgctttg gaactaatta 660
tccgactaat taagccatgt acagttttgg aaactactcc ctcggtaaac taatataaga 720
gcatttaaat cattaaaata gtgatctaaa cactcttata ttaagtttac ggagggagta 780
ggctactagt ggttgtgttg 800
<210>378
<211>212
<212>PRT
<213>普通小麦
<400>378
Met Asp Thr Ala Ala Ala Gly Ser Pro Arg Glu Gly His Arg Thr Val
1 5 10 15
Cys Ser Glu Pro Pro Lys Arg Pro Ala Gly Arg Thr Lys Phe Arg Glu
20 25 30
Thr Arg His Pro Leu Tyr Arg Gly Val Arg Arg Arg Gly Arg Leu Gly
35 40 45
Gln Trp Val Cys Glu Val Arg Val Arg Gly Ala Gln Gly Tyr Arg Leu
50 55 60
Trp Leu Gly Thr Phe Thr Thr Ala Glu Met Ala Ala Arg Ala His Asp
65 70 75 80
Ser Ala Val Leu Ala Leu Leu Asp Arg Ala Ala Cys Leu Asn Phe Ala
85 90 95
Asp Ser Ala Trp Arg Met Leu Pro Val Leu Ala Ala Gly Ser Ser Arg
100 105 110
Phe Ser Ser Ala Arg Glu Ile Lys Asp Ala Val Ala Ile Ala Val Leu
115 120 125
Glu Phe Gln Arg Gln Arg Pro Val Val Ser Thr Ser Glu Met His Asp
130 135 140
Gly Glu Lys Asp Ala Gln Gly Ser Pro Thr Pro Ser Glu Leu Ser Thr
145 150 155 160
Ser Ser Asp Leu Leu Asp Glu His Trp Phe Gly Gly Met Asp Ala Gly
165 170 175
Ser Tyr Tyr Ala Ser Leu Ala Gln Gly Met Leu Met Glu Pro Pro Ser
180 185 190
Ala Arg Thr Trp Ser Glu Asp Gly Gly Glu Tyr Ser Ala Val Tyr Thr
195 200 205
Pro Leu Trp Asn
210
<210>379
<211>945
<212>DNA
<213>普通小麦
<400>379
ccacctcgtt acaccacaaa ccactctcaa cgccagctgc gaccgatgga caccaacgcc 60
gcctggccgc agtttgacgg gcaagagtac aggacggtgt ggccggagga gcaggagtac 120
cggacggtgt ggtcggagcc gccgaagcgg cgggcggggc ggaacaagtt gcaggagaca 180
cgccacccag tgtaccgcgg cgtgcgccgc cgtggccggg aagggcagtg ggtgtgcgag 240
ctgcgcgtgc cggccggaag ccggagttac tccaggatct ggcttggcac cttcgccagt 300
gcccagatgg cggcgcgcgc gcacgactcg gccgcgctcg cgctctccgg ccgcgacgcg 360
tgcctcaact tcgccgactc cgcctggcgg atgatgcccg tccacgcagc cgggtcgttc 420
aagttggccg ccgcgcagga gatcaaggac gccgtcgccg tggccctcaa ggagttccag 480
gagcagcagc gccctgccga cgagtcaacg gcgccgtcgt ccacggccga ggagagcgcg 540
ctctccatca tccccagcga cctgtcgggg ctcgacaatg agcactggat cggcggcatg 600
gaggccgggt cgtactacgc gagcttggcg caggggatgc tcatggagcc gccggccgac 660
ggagcttggc aggaggaccg cgaacacgac gacggattcg acacgtcgct gtggagctac 720
tagtgtgatc aactgattaa gcaatgtaaa gatctagaga gtactgctag tgctagattg 780
tgtttcacca aatatgggaa gaagagagag taagcatcgg gggaaaggtt tccccccaat 840
gtgaaagcgc tcggtttcta ctcccggaag ggcacaaatg agcttctttc tttatttaat 900
aaataaatag agaaatgagc agcaaaaaaa aaaaaaaaaa aaaaa 945
<210>380
<211>225
<212>PRT
<213>普通小麦
<400>380
Met Asp Thr Asn Ala Ala Trp Pro Gln Phe Asp Gly Gln Glu Tyr Arg
1 5 10 15
Thr Val Trp Pro Glu Glu Gln Glu Tyr Arg Thr Val Trp Ser Glu Pro
20 25 30
Pro Lys Arg Arg Ala Gly Arg Asn Lys Leu Gln Glu Thr Arg His Pro
35 40 45
Val Tyr Arg Gly Val Arg Arg Arg Gly Arg Glu Gly Gln Trp Val Cys
50 55 60
Glu Leu Arg Val Pro Ala Gly Ser Arg Ser Tyr Ser Arg Ile Trp Leu
65 70 75 80
Gly Thr Phe Ala Ser Ala Gln Met Ala Ala Arg Ala His Asp Ser Ala
85 90 95
Ala Leu Ala Leu Ser Gly Arg Asp Ala Cys Leu Asn Phe Ala Asp Ser
100 105 110
Ala Trp Arg Met Met Pro Val His Ala Ala Gly Ser Phe Lys Leu Ala
115 120 125
Ala Ala Gln Glu Ile Lys Asp Ala Val Ala Val Ala Leu Lys Glu Phe
130 135 140
Gln Glu Gln Gln Arg Pro Ala Asp Glu Ser Thr Ala Pro Ser Ser Thr
145 150 155 160
Ala Glu Glu Ser Ala Leu Ser Ile Ile Pro Ser Asp Leu Ser Gly Leu
165 170 175
Asp Asn Glu His Trp Ile Gly Gly Met Glu Ala Gly Ser Tyr Tyr Ala
180 185 190
Ser Leu Ala Gln Gly Met Leu Met Glu Pro Pro Ala Asp Gly Ala Trp
195 200 205
Gln Glu Asp Arg Glu His Asp Asp Gly Phe Asp Thr Ser Leu Trp Ser
210 215 220
Tyr
225
<210>381
<211>1971
<212>DNA
<213>一粒小麦(Triticum monococcum)
<400>381
aagcttcaag aattagttat ttttacatat agaccgtgta ttgaagatgt tctaagtggt 60
gctcctttgt gccttccgtc cccctagtac tcggggaacc agacgacccc atgcagcagt 120
gactgctgcc ttctctttgc agccgaacag ccggcggacc aatcagtcaa ggcaatcacc 180
gctgcattaa gccagcacga agctgccttt ttttgcttaa cactgcgaag ccaaaagccc 240
ccacacgccc accaggagag aagtcacacg acgctatcac cccacagtcc ctttgtcacc 300
agctgtccgg acaccgcatc cctcccgccg tcccaagcgc gttcatacac ttgaacctcc 360
agcatcacgc atacctatat ataaggaagt atcccacact ctcgctcaag ctcaacaagc 420
tagctcacac tcctcagtcc tccgtaagct caagcagcaa gctcgactgc tcaagcagga 480
atccaccagc caatcaccca gcactcagcc ggcagccatg gacatgggcc ttgaggtctc 540
gagctcctcc ccgtcctcct cgtcggcgtc gtcctcgccc gagcacgcgg cggggcgggc 600
gtcgctggcc aagcgccccg cggggcgcac caagttccgg gagacgcggc acccggtgta 660
ccgcggcgtg cggcgccggg gcaacgccga gcggtgggtc tgcgaggtgc gcgtccccgg 720
caagcgcggc gcgaggctct ggctcgggac gtacgccacg gccgagatcg cggcgcgcgc 780
caacgacgcc gccatgctcg ccctgggcgg ccgctccgcc gcgtgcctca acttcgcgga 840
ctccgcgtgg ctgctcgccg tgccgcccgc actcgccgac ctcggcgacg tccggcgcgc 900
ggcggtcgag gccgtcgctg atttccagag acgagaggct gccaacggct ccctcacagt 960
caccgccacc gtcaccgaag aggcctcctg tggcgctcct gaagaatcgt cgtctgagtc 1020
tgacagtgtc ggttcgtcgg agacgtcgga accttctgcc gatggagagt tcgaggtgcc 1080
ggtcgcggtg gacaccgata tgttcaggct tgacttgttc ccggaactgg atctgtgctc 1140
gtactacgcg agcctcgcgg aggcgctgct cgtggacccg ccggcaccgg tgaccaccac 1200
ctacgcgtac tgggacaacg gcgacggcgg agctgatgtc gcgctctgga gctactagct 1260
agtacagtcg ataattcccc tcgcaaaaaa aaagtagtgc cgataattcc cagctctgta 1320
gctatttttc ccctgttaca aagttttccc cttgtgggaa aagactatgt acgtagtact 1380
cctaactaat aaggtgaagc tgctcctaat tcaatactcc ctctatccga aaatacttgt 1440
catcaaaata aataaataaa aatgtatcta aatgtatttt agttttaaat atattttttt 1500
tgttcatttt aatgacaagt attttcggac ggagagagta cttaactgtg aaacgggttt 1560
actcgtataa aatcttttgc cactgatagg tcactattcc cacgccggcc cttgactccc 1620
tgaaatgtac atacatgtag tttcaaacaa taaaaaggag cacaaaaacg gcaactcaca 1680
gcagatactt tgtttttttg acagaaaagt ttattttatt aatcaaagga tagcaacatc 1740
gtttgccaac aggtttacaa tgaaattgcg ggtcatcaac ccagcgagat ggattattag 1800
catgacccca acatgctaac tcatgagcta cattatttaa ctctctaata caatgctcaa 1860
tagttttttt aaaaaaggag gatgatcccc ggcctctgca tctgtgagat gcatacgacc 1920
actttattga ttattttcaa ggaccttata aagcgttaca acaataagct t 1971
<210>382
<211>246
<212>PRT
<213>粒小麦
<400>382
Met Asp Met Gly Leu Glu Val Ser Ser Ser Ser Pro Ser Ser Ser Ser
1 5 10 15
Ala Ser Ser Ser Pro Glu His Ala Ala Gly Arg Ala Ser Leu Ala Lys
20 25 30
Arg Pro Ala Gly Arg Thr Lys Phe Arg Glu Thr Arg His Pro Val Tyr
35 40 45
Arg Gly Val Arg Arg Arg Gly Asn Ala Glu Arg Trp Val Cys Glu Val
50 55 60
Arg Val Pro Gly Lys Arg Gly Ala Arg Leu Trp Leu Gly Thr Tyr Ala
65 70 75 80
Thr Ala Glu Ile Ala Ala Arg Ala Asn Asp Ala Ala Met Leu Ala Leu
85 90 95
Gly Gly Arg Ser Ala Ala Cys Leu Asn Phe Ala Asp Ser Ala Trp Leu
100 105 110
Leu Ala Val Pro Pro Ala Leu Ala Asp Leu Gly Asp Val Arg Arg Ala
115 120 125
Ala Val Glu Ala Val Ala Asp Phe Gln Arg Arg Glu Ala Ala Asn Gly
130 135 140
Ser Leu Thr Val Thr Ala Thr Val Thr Glu Glu Ala Ser Cys Gly Ala
145 150 155 160
Pro Glu Glu Ser Ser Ser Glu Ser Asp Ser Val Gly Ser Ser Glu Thr
165 170 175
Ser Glu Pro Ser Ala Asp Gly Glu Phe Glu Val Pro Val Ala Val Asp
180 185 190
Thr Asp Met Phe Arg Leu Asp Leu Phe Pro Glu Leu Asp Leu Cys Ser
195 200 205
Tyr Tyr Ala Ser Leu Ala Glu Ala Leu Leu Val Asp Pro Pro Ala Pro
210 215 220
Val Thr Thr Thr Tyr Ala Tyr Trp Asp Asn Gly Asp Gly Gly Ala Asp
225 230 235 240
Val Ala Leu Trp Ser Tyr
245
<210>383
<211>639
<212>DNA
<213>一粒小麦
<400>383
ttagctccac aacggcgtct gcgtctccgc cacgccgctg tgctcgctgt cctctcgcca 60
ggctccggcg tccggcggct ccacgagcat cccctgcgcc aagctctcgt agtacgaccc 120
ggcaaccatg ccgccaaacc actgctcgtc gtcgagctcc agcaagtcgc ctgacgacat 180
ggagaacagc gcgccgctcg gggcgacggc cggctccgct gccgggcacg cgactggaag 240
aacgatctgc tgccgctgga acgcgaggac ggcgacggcg acggcggtct tgatctcccg 300
cgcgctgccg aagccgaagg agccggccgc gagcacgggc agcatccgcc aggcggagtc 360
ggcgaagttg aggcaggctt tgcggccgga gagcgcgagc acggcggcgt cgtgggcgcg 420
cgccgccatc tcggcggtga cgaaggtgcc gagccagagc ctggatcccc tcatcccgag 480
cacgcgcacc tcgcagaccc accgcccggc gggcccccgc tggcgcacgc cgcggtacag 540
cgggtggcgc gtctcctgga acttggtccg ccccgcgggc cgcttcggcg gctccgacct 600
caccgtcctg tgccgctgct cc tcctgacc agacggcat 639
<210>384
<211>212
<212>PRT
<213>一粒小麦
<400>384
Met Pro Ser Gly Gln Glu Glu Gln Arg His Arg Thr Val Arg Ser Glu
1 5 10 15
Pro Pro Lys Arg Pro Ala Gly Arg Thr Lys Phe Gln Glu Thr Arg His
20 25 30
Pro Leu Tyr Arg Gly Val Arg Gln Arg Gly Pro Ala Gly Arg Trp Val
35 40 45
Cys Glu Val Arg Val Leu Gly Met Arg Gly Ser Arg Leu Trp Leu Gly
50 55 60
Thr Phe Val Thr Ala Glu Met Ala Ala Arg Ala His Asp Ala Ala Val
65 70 75 80
Leu Ala Leu Ser Gly Arg Lys Ala Cys Leu Asn Phe Ala Asp Ser Ala
85 90 95
Trp Arg Met Leu Pro Val Leu Ala Ala Gly Ser Phe Gly Phe Gly Ser
100 105 110
Ala Arg Glu Ile Lys Thr Ala Val Ala Val Ala Val Leu Ala Phe Gln
115 120 125
Arg Gln Gln Ile Val Leu Pro Val Ala Cys Pro Ala Ala Glu Pro Ala
130 135 140
Val Ala Pro Ser Gly Ala Leu Phe Ser Met Ser Ser Gly Asp Leu Leu
145 150 155 160
Glu Leu Asp Asp Glu Gln Trp Phe Gly Gly Met Val Ala Gly Ser Tyr
165 170 175
Tyr Glu Ser Leu Ala Gln Gly Met Leu Val Glu Pro Pro Asp Ala Gly
180 185 190
Ala Trp Arg Glu Asp Ser Glu His Ser Gly Val Ala Glu Thr Gln Thr
195 200 205
Pro Leu Trp Ser
210
<210>385
<211>2148
<212>DNA
<213>一粒小麦
<400>385
aagcttcagc atgaatggcg aaaatgcacg tgaagaagct ccgatcggta ggacgtaaca 60
gacgggcaca aatggacaaa gagtgctcga ccaacctata aacaaacaat aggcgaaaaa 120
accacgtatc tgtttgtgtc ggcgcgtcgg agtgctctaa cctctatgca acaaagagtc 180
gccgcgttaa ggcgggcggg cgggcggcag gcacatggcg tcccgcctcg gcacctcgtg 240
tcagcccggc agccccgcca cgtaccaaag agcacgcaaa agggcaaggt taacctgacg 300
tgcgccgcgc cacgccgggg atcgtcgtta tcgccgcccg gcgtgggcgc gcagacgcgc 360
agtcagttga caggccgaag caccgtccgt cccacgcagg cacgcagctg ctctgcggga 420
cagagtacca gtactaggat aataacggcg ggccgtggac gcgttcgggc gggcggcgcc 480
agggcacgag ccgccgccca tccgtccctg ccgcacgtgc tttcctcgag atccggagct 540
ctaccagtac accatagtct gacccactga cacagtacga tgccggccgg ccaagaccag 600
cagaaaatcc cgtctctgtc gccgtctcca cgtggcctct cccccttccg gtcgccttgc 660
ttccgatgca aagtgtgcaa ttccgaactc ttctagttgt agccttgtat actccgcgcg 720
aagctagccc gccacgccaa cgcagccggc ctccctccgc caccgtgtcc cgcgacgcgc 780
cgcccattcg gacccgccac gcgccccggc cgaatcctat atacacacgt cgctctcctc 840
gctccctccc tcccgatcat acaaacctcg atcacaagcc aacaccattg attcgctagc 900
tacagtgtct gcagataagc aaacgatcga tccgtgcaag atggacaact ccggcgtggt 960
cttctatggc ggcgcatacg cgacggtgat gtcggcgccg ccgaagcggc cggcggggcg 1020
gaccaagttc cgggagacgc gccacccggt gtaccgcggc gtgcgccggc gcggcgccgc 1080
ggggcgctgg gtgtgcgagg tgcgccagcc caacaacaag tcccgcatct ggctcggcac 1140
cttcgccagc cccgaggccg ccgcgcgcgc ccacgacgtc gccgcgetcg cgctccgggg 1200
ccgcgccgcc tgcctcaact tcgccgactc ggccgcgctg ctcgccgtcg acccggccac 1260
gctccgcacg ccccaggaca tcagagccgc cgcaatcacg ctcgcccaga cggcctgccc 1320
gcacgacgcg ccgaggtcct ctgtgtccgc ggcgtctgcg ccggcgcccg cgatggtgat 1380
cacgcaggag gccgcggctg cgccgtacga cagctacgcc atgtacggcg gcttggcgga 1440
cctggaacag cattcccact gctactacga cgggatgagc ggcagcggcg actggcagag 1500
catctcacac atgaacgtcg ccgacgaaga cggtggctac ggcgcaggag acgtcgcgct 1560
ctggagctac tgatcgagtg ggattgatct ggcagtttgt tgagcacgat tcgtttgctc 1620
ctgagtcctc cgaaatccac gatcgatagg ggagtggcgt atggacgcac accatattcg 1680
catgagctag tttcaagcac gcgtactctg ctttcccatg ttcttgaaaa ttggcgctaa 1740
aactacacac gtgagctagt tttggtaggg gtatagtgct aggaaatata tgcagccagt 1800
ttgctgagcg gttacagaca atttatacct cactcgagat ttttttttcc cttccatgta 1860
aatagctctg tcaaaagtaa tatactctac cttgtaaata ctgcagatcc ttaatttgat 1920
cttttttctc tttaaaatga tgagagcaat tataaagatt caccaaagca aagcacctca 1980
aacataataa aagatacatc gagatccatg aacaatcaaa ccaccgccgc cgccgtcaaa 2040
acaagccatt gaatccttta tttgatctga ggaatctgac acgaaatctc gtcgttgcgg 2100
gtgccctgac ctcgccgccc aagaagctgg cagaatatgc ccaagctt 2148
<210>386
<211>210
<212>PRT
<213>一粒小麦
<400>386
Met Asp Asn Ser Gly Val Val Phe Tyr Gly Gly Ala Tyr Ala Thr Val
1 5 10 15
Met Ser Ala Pro Pro Lys Arg Pro Ala Gly Arg Thr Lys Phe Arg Glu
20 25 30
Thr Arg His Pro Val Tyr Arg Gly Val Arg Arg Arg Gly Ala Ala Gly
35 40 45
Arg Trp Val Cys Glu Val Arg Gln Pro Asn Asn Lys Ser Arg Ile Trp
50 55 60
Leu Gly Thr Phe Ala Ser Pro Glu Ala Ala Ala Arg Ala His Asp Val
65 70 75 80
Ala Ala Leu Ala Leu Arg Gly Arg Ala Ala Cys Leu Asn Phe Ala Asp
85 90 95
Ser Ala Ala Leu Leu Ala Val Asp Pro Ala Thr Leu Arg Thr Pro Gln
100 105 110
Asp Ile Arg Ala Ala Ala Ile Thr Leu Ala Gln Thr Ala Cys Pro His
115 120 125
Asp Ala Pro Arg Ser Ser Val Ser Ala Ala Ser Ala Pro Ala Pro Ala
130 135 140
Met Val Ile Thr Gln Glu Ala Ala Ala Ala Pro Tyr Asp Ser Tyr Ala
145 150 155 160
Met Tyr Gly Gly Leu Ala Asp Leu Glu Gln His Ser His Cys Tyr Tyr
165 170 175
Asp Gly Met Ser Gly Ser Gly Asp Trp Gln Ser Ile Ser His Met Asn
180 185 190
Val Ala Asp Glu Asp Gly Gly Tyr Gly Ala Gly Asp Val Ala Leu Trp
195 200 205
Ser Tyr
210
<210>387
<211>912
<212>DNA
<213>陆地棉(Gossypium hirsutum)
<400>387
tctacctact acgcatacat acatgcacgc aaatgtagaa tcacagatat ggccaatttg 60
tcccccgaag tgaacccacc aacccctcaa atccccgact ctacgctcga tcttgtgcag 120
ttgccaaatc acagcaacct accttccatc ccgacgccaa accctgttca atatagctgg 180
cctggttccg gaaggcattc tagttatcgg ggaatacgaa gcaggagcgg caaatgggta 240
tctgaaatac gcgagccgcg taaaaccacg cgtatatggc tcggaacgta ccccactcct 300
gaaatggcag ccaccgcgta tgatgtggct gctattgctc taaaaggtcc cgacacggat 360
ttgaactttc cggatatgat tctttcgtat ccaaaagtgg cttctacatc cgcagccgat 420
attcgagcgg ctgctgctag tgctgccgct tccaggctac ccatgccaga tacggggtca 480
tcaaaacagg atcaaggcaa ccttcaaaat gagggtaccg cgtcgacgtt tagcacttgc 540
atggagtctg gttcaggtca ggaatatatt gacgaggaag agcttttaaa ctttcccaat 600
ttgatggtgg acatggcagg aggaatgctc gtaacccctc ccaggatcaa ctcactcgct 660
tcagatgatt caccagagat ttcagatata gaaagcctat ggacttatcc ttaaaggggc 720
tctaaattta ctgagatagc agaaagtaca aaataagaaa tgtgattgaa aaagtagatg 780
agatgatcac aaatgtgaag gtatttgtcc tttttgatct cttttgggct gtttctgtca 840
tgccctgtat ctgtatgcat tcctgagtat tgctagttaa agtttgcttg aggtaaacta 900
aaaaaaaaaa aa 912
<210>388
<211>221
<212>PRT
<213>陆地棉
<400>388
Met Ala Asn Leu Ser Pro Glu Val Asn Pro Pro Thr Pro Gln Ile Pro
1 5 10 15
Asp Ser Thr Leu Asp Leu Val Gln Leu Pro Asn His Ser Asn Leu Pro
20 25 30
Ser Ile Pro Thr Pro Asn Pro Val Gln Tyr Ser Trp Pro Gly Ser Gly
35 40 45
Arg His Ser Ser Tyr Arg Gly Ile Arg Ser Arg Ser Gly Lys Trp Val
50 55 60
Ser Glu Ile Arg Glu Pro Arg Lys Thr Thr Arg Ile Trp Leu Gly Thr
65 70 75 80
Tyr Pro Thr Pro Glu Met Ala Ala Thr Ala Tyr Asp Val Ala Ala Ile
85 90 95
Ala Leu Lys Gly Pro Asp Thr Asp Leu Asn Phe Pro Asp Met Ile Leu
100 105 110
Ser Tyr Pro Lys Val Ala Ser Thr Ser Ala Ala Asp Ile Arg Ala Ala
115 120 125
Ala Ala Ser Ala Ala Ala Ser Arg Leu Pro Met Pro Asp Thr Gly Ser
130 135 140
Ser Lys Gln Asp Gln Gly Asn Leu Gln Asn Glu Gly Thr Ala Ser Thr
145 150 155 160
Phe Ser Thr Cys Met Glu Ser Gly Ser Gly Gln Glu Tyr Ile Asp Glu
165 170 175
Glu Glu Leu Leu Asn Phe Pro Asn Leu Met Val Asp Met Ala Gly Gly
180 185 190
Met Leu Val Thr Pro Pro Arg Ile Asn Ser Leu Ala Ser Asp Asp Ser
195 200 205
Pro Glu Ile Ser Asp Ile Glu Ser Leu Trp Thr Tyr Pro
210 215 220
<210>389
<211>1064
<212>DNA
<213>陆地棉
<400>389
cattactcat gattcaaatt tctgccatat tacacacaaa caatggctga atctgatcct 60
tcttcaacca atgtgccccc gaaagaccag ccaccaccac caactgttcc aatccctgac 120
gctcctccgc aagagcagtc gccgaaacca tcatccactc cattggtctc atcgaaagaa 180
ggcgtaagtg ggaatcccac atcgagaaag ttgtcggcgg tttatcgggg agtaagaagc 240
aggagtggga aatgggtgtc ggaaatacgt gagccgcgta aaacgacgcg tatatggcta 300
gggacatacc ctacacctga aatggcagcc accgcgtatg acgtggctgc tcttgcccta 360
aaaggtcccg acgcggaact gaactttccg gatatggttc attcgtatcc gaaagtgggt 420
tctacatcgg caactgatat tcgtgccgcc gctgctagtg ccgccgcttc tagactacta 480
cccaagtctg ttaccaatac tgggtcctta tcaaaaaacg aggacaccac atcgactact 540
gctatggaga ttacctgttc aggtcaagaa tttatcgacg aggaagagct tttaaacttt 600
cccaatttgg tggtggatat ggcaggggga atgctagtta gccctccaaa ctggataaac 660
tcaccacctt ctgatgattc accagataat tcagatgtag atacactatg gacttacact 720
taaaatagaa aaattcactg taaaagtgat gaatgagaga gagtataaag tccaatgaaa 780
tgtagaagaa gaagcatggt ttgaaaacta gggtctagat gctactgatg attcagtaat 840
atgaaatgca gaaggtactg tcatttgtcc ttttttttcc ctctgtccct tctggttttt 900
atctctttta ggggttgttc cattgctgga aaaacatatg aacaaatcag aagccaatat 960
aagaagaatc tgagtggttt tacatatctg ttgcaatatt gatgctatta taaagcttgg 1020
gttttctttt gtttttttaa aaaaaaaaaa aaaaaaaaaa aaaa 1064
<210>390
<211>226
<212>PRT
<213>陆地棉
<400>390
Met Ala Glu Ser Asp Pro Ser Ser Thr Asn Val Pro Pro Lys Asp Gln
1 5 10 15
Pro Pro Pro Pro Thr Val Pro Ile Pro Asp Ala Pro Pro Gln Glu Gln
20 25 30
Ser Pro Lys Pro Ser Ser Thr Pro Leu Val Ser Ser Lys Glu Gly Val
35 40 45
Ser Gly Asn Pro Thr Ser Arg Lys Leu Ser Ala Val Tyr Arg Gly Val
50 55 60
Arg Ser Arg Ser Gly Lys Trp Val Ser Glu Ile Arg Glu Pro Arg Lys
65 70 75 80
Thr Thr Arg Ile Trp Leu Gly Thr Tyr Pro Thr Pro Glu Met Ala Ala
85 90 95
Thr Ala Tyr Asp Val Ala Ala Leu Ala Leu Lys Gly Pro Asp Ala Glu
100 105 110
Leu Asn Phe Pro Asp Met Val His Ser Tyr Pro Lys Val Gly Ser Thr
115 120 125
Ser Ala Thr Asp Ile Arg Ala Ala Ala Ala Ser Ala Ala Ala Ser Arg
130 135 140
Leu Leu Pro Lys Ser Val Thr Asn Thr Gly Ser Leu Ser Lys Asn Glu
145 150 155 160
Asp Thr Thr Ser Thr Thr Ala Met Glu Ile Thr Cys Ser Gly Gln Glu
165 170 175
Phe Ile Asp Glu Glu Glu Leu Leu Asn Phe Pro Asn Leu Val Val Asp
180 185 190
Met Ala Gly Gly Met Leu Val Ser Pro Pro Asn Trp Ile Asn Ser Pro
195 200 205
Pro Ser Asp Asp Ser Pro Asp Asn Ser Asp Val Asp Thr Leu Trp Thr
210 215 220
Tyr Thr
225
<210>391
<211>1102
<212>DNA
<213>陆地棉
<400>391
ggccattacg gccggggaga aaaagaaagc tcatttagtt aatattttcc cttgcatttc 60
caaattcgga agttcataca gcaagtgatt tcctaaaata cttggatcct aagtacgaat 120
atccttttct tgaaatatac tctttttaag tcaaaagctt tgtttaactg aaacttaaac 180
tgattactgt ttgggttttt tttttaaatg gattttgtag ttcaagatta tgatatggtt 240
gattctgggt cggtttctga aagtggaact gatcgtccgg tgaatttttc cgatgaatat 300
gtgatgttag cttcgagtta tccaaagagg cccgcgggaa ggaagaagtt ccgggagact 360
cgacacccgg tgtaccgtgg agttcgccgg aggaatcccg ggaagtgggt ttctgaagtg 420
agggagccta ataagaagtc gaggatttgg cttggaactt tcccgaaggc ggatatggcg 480
gcgcgtgctc acgacgtggc agctatagca ctgagaggga agtcagcttg tttgaacttc 540
gctgactcag cttggaagct tccggtcccg gcttcttccg acccaaagga tatccaaaag 600
acggtggcgg aggtggcgga gactttcaga acggctgagc attcgagcgg gaattctaga 660
aacgatgcaa agagaagtga aaacacggag atggagaaag ggttttactt ggacgaagaa 720
gcgttgtttg ggacacaaag attttgggca aatatggctg ccggtatgat gatgtcacct 780
cctcgttccg gtcatgacgg aggatgggag gaacatgaag tcgatgatta tgtaccttta 840
tggagttatt ctatttaaaa gtaaaatttt tcagacattt tcaagcattc attggaattt 900
ttagttcaca gaaatcgcca ccggcaattg ccctttatgt tttgtacgta caacgatttt 960
tttggattgt acgggtagtg ctgtaagtaa aaagattaat gtgtatatat acgatgtata 1020
tatacttcat agcttctcca aacaataaat ttatagcttc atatctattt taccatcaaa 1080
aaaaaaaaaa aaaaaaaaaa aa 1102
<210>392
<211>216
<212>PRT
<213>陆地棉
<400>392
Met Asp Phe Val Val Gln Asp Tyr Asp Met Val Asp Ser Gly Ser Val
1 5 10 15
Ser Glu Ser Gly Thr Asp Arg Pro Val Asn Phe Ser Asp Glu Tyr Val
20 25 30
Met Leu Ala Ser Ser Tyr Pro Lys Arg Pro Ala Gly Arg Lys Lys Phe
35 40 45
Arg Glu Thr Arg His Pro Val Tyr Arg Gly Val Arg Arg Arg Asn Pro
50 55 60
Gly Lys Trp Val Ser Glu Val Arg Glu Pro Asn Lys Lys Ser Arg Ile
65 70 75 80
Trp Leu Gly Thr Phe Pro Lys Ala Asp Met Ala Ala Arg Ala His Asp
85 90 95
Val Ala Ala Tle Ala Leu Arg Gly Lys Ser Ala Cys Leu Asn Phe Ala
100 105 110
Asp Ser Ala Trp Lys Leu Pro Val Pro Ala Ser Ser Asp Pro Lys Asp
115 120 125
Ile Gln Lys Thr Val Ala Glu Val Ala Glu Thr Phe Arg Thr Ala Glu
130 135 140
His Ser Ser Gly Asn Ser Arg Asn Asp Ala Lys Arg Ser Glu Asn Thr
145 150 155 160
Glu Met Glu Lys Gly Phe Tyr Leu Asp Glu Glu Ala Leu Phe Gly Thr
165 170 175
Gln Arg Phe Trp Ala Asn Met Ala Ala Gly Met Met Met Ser Pro Pro
180 185 190
Arg Ser Gly His Asp Gly Gly Trp Glu Glu His Glu Val Asp Asp Tyr
195 200 205
Val Pro Leu Trp Ser Tyr Ser Ile
210 215
<210>393
<211>888
<212>DNA
<213>陆地棉
<400>393
atggattttg tagttcaaga ttatgacatg gttgatttcg ggtcggtttc tgaaagtgga 60
actgatcgtc cggtgaattt ttccgatgac tatatgatgt tagcttcgag ttatccaaag 120
aggcgagctg ggaggaagaa gttccgggag actcgacacc cggtgtaccg tggagttcgc 180
cggaggaatc ccgggaagtg ggtttctgaa gtgagggagc ctaataagaa gtcgaggatt 240
tggcttggaa ctttcccgaa ggcggatatg gcggcgcgtg ctcacgacgt ggcagctata 300
gcactgagag ggaagtcagc ttgtttgaac ttcgctgact cagcttggaa gcttccggtc 360
ccggcttctt ccgacccaaa ggatatccaa aagacggtgg cggaggtggc ggagactttc 420
agaacggctg agcattcgag cgggaattct agaaacgatg caaagagaag tgaaaacacg 480
gagatgcaga aagggtttta cttggacgaa gaagcgttgt ttgggacaca aagattttgg 540
gcaaatatgg ctgccggtat gatgatgtca cctcctcgtt ccggtcatga cggaggatgg 600
gaagaacatg aagtcgatga ttatgtacct ttatggagtt attctattta aaagtaattt 660
tttcagacat tttcaagcat tcattggaat ttttagttcg tagaaatcgc caccggcaat 720
tgccctttat gttttgtacg tacaacggtt tttttggatt gtacgggtag tgttgtaagt 780
aaaaagatta atgtgtatat atacgatgta tatatacgtc ataacttctc caaacaataa 840
atttatagct tcatatccaa aaaaaaaaaa aaaaaaaaaa aaaaaaaa 888
<210>394
<211>216
<212>PRT
<213>陆地棉
<400>394
Met Asp Phe Val Val Gln Asp Tyr Asp Met Val Asp Phe Gly Ser Val
1 5 10 15
Ser Glu Ser Gly Thr Asp Arg Pro Val Asn Phe Ser Asp Asp Tyr Met
20 25 30
Met Leu Ala Ser Ser Tyr Pro Lys Arg Arg Ala Gly Arg Lys Lys Phe
35 40 45
Arg Glu Thr Arg His Pro Val Tyr Arg Gly Val Arg Arg Arg Asn Pro
50 55 60
Gly Lys Trp Val Ser Glu Val Arg Glu Pro Asn Lys Lys Ser Arg Ile
65 70 75 80
Trp Leu Gly Thr Phe Pro Lys Ala Asp Met Ala Ala Arg Ala His Asp
85 90 95
Val Ala Ala Ile Ala Leu Arg Gly Lys Ser Ala Cys Leu Asn Phe Ala
100 105 110
Asp Ser Ala Trp Lys Leu Pro Val Pro Ala Ser Ser Asp Pro Lys Asp
115 120 125
Ile Gln Lys Thr Val Ala Glu Val Ala Glu Thr Phe Arg Thr Ala Glu
130 135 140
His Ser Ser Gly Asn Ser Arg Asn Asp Ala Lys Arg Ser Glu Asn Thr
145 150 155 160
Glu Met Gln Lys Gly Phe Tyr Leu Asp Glu Glu Ala Leu Phe Gly Thr
165 170 175
Gln Arg Phe Trp Ala Asn Met Ala Ala Gly Met Met Met Ser Pro Pro
180 185 190
Arg Ser Gly His Asp Gly Gly Trp Glu Glu His Glu Val Asp Asp Tyr
195 200 205
Val Pro Leu Trp Ser Tyr Ser Ile
210 215
<210>395
<211>1049
<212>DNA
<213>陆地棉
<400>395
attttccctt gcatttccaa attcggaagt tcatacagca agcgatttcc taaaatactt 60
ggatactaag agcgaatatc cttttcttga aatatactct tttcaagtca aaagctttgt 120
ttaactggaa cttaaactga tttactgttt gggttttttt aaaatggatt ttttagttca 180
agattatgat atggttgatt ctgggtcggt ttctgaaagt ggaactgatc gtccggtgaa 240
tttttccgat ggctatgtga tgttagcttc gagttatcca aagaggcgag ctgggaggaa 300
gaagttccgg gagactcgac acccggtgta ccgtggagtt cgccggagga atcccgggaa 360
gtgggtttct gaagtgaggg agcctaataa gaagtcgagg atttggcttg gaactttccc 420
gaaggcggat atggcggcgc gtgctcacga cgtggcagct atagcactga gagggaagtc 480
agcttgtttg aacttcgctg actcagcttg gaagcttccg gtcccggctt cttccgaccc 540
aaaggatatc caaaagacgg tggcggaggt ggcggagact ttcagaacgg ctgagcattc 600
gagcgggaat tctagaaacg atgcaaagag aagtgaaaac acggagatgg agaaagggtt 660
ttacttggac gaagaagcgt tgtttgggac acaaagattt tgggcaaata tggctgccgg 720
tatgatgatg tcacctcctc gttccggtca tgacggagga tgggaagaac atgaagtcga 780
tgattatgta cctttatgga gttattctat ttaaaagtaa aatttttcag acattttcaa 840
gcattcattg gaatttttag ttcacagaaa tcgccaccgg caattgccct ttatgttttg 900
tacgtacaac gatttttttg gattgtacgg gtagtgctgt aagtaaaaag attaatgtgt 960
atatatacga tgtatatata cttcatagct tctccaaaca ataaatttat agcttcatat 1020
ctattttacc atcaaaaaaa aaaaaaaaa 1049
<210>396
<211>216
<212>PRT
<213>陆地棉
<400>396
Met Asp Phe Leu Val Gln Asp Tyr Asp Met Val Asp Ser Gly Ser Val
1 5 10 15
Ser Glu Ser Gly Thr Asp Arg Pro Val Asn Phe Ser Asp Gly Tyr Val
20 25 30
Met Leu Ala Ser Ser Tyr Pro Lys Arg Arg Ala Gly Arg Lys Lys Phe
35 40 45
Arg Glu Thr Arg His Pro Val Tyr Arg Gly Val Arg Arg Arg Asn Pro
50 55 60
Gly Lys Trp Val Ser Glu Val Arg Glu Pro Asn Lys Lys Ser Arg Ile
65 70 75 80
Trp Leu Gly Thr Phe Pro Lys Ala Asp Met Ala Ala Arg Ala His Asp
85 90 95
Val Ala Ala Ile Ala Leu Arg Gly Lys Ser Ala Cys Leu Asn Phe Ala
100 105 110
Asp Ser Ala Trp Lys Leu Pro Val Pro Ala Ser Ser Asp Pro Lys Asp
115 120 125
Ile Gln Lys Thr Val Ala Glu Val Ala Glu Thr Phe Arg Thr Ala Glu
130 135 140
His Ser Ser Gly Asn Ser Arg Asn Asp Ala Lys Arg Ser Glu Asn Thr
145 150 155 160
Glu Met Glu Lys Gly Phe Tyr Leu Asp Glu Glu Ala Leu Phe Gly Thr
165 170 175
Gln Arg Phe Trp Ala Asn Met Ala Ala Gly Met Met Met Ser Pro Pro
180 185 190
Arg Ser Gly His Asp Gly Gly Trp Glu Glu His Glu Val Asp Asp Tyr
195 200 205
Val Pro Leu Trp Ser Tyr Ser Ile
210 215
<210>397
<211>480
<212>DNA
<213>大豆
<400>397
atggaagaag cgggtttagg agattgttgt tcctctaata cgactattac gaggaaaagc 60
gagaagcgaa agcagcagca ccaacaacaa gagaagccat acagaggaat aaggatgagg 120
aagtggggca agtgggtggc ggagattaga gaacccaaca agaggtcgag gatctggttg 180
ggttcttacg ccacccccgt cgccgccgca cgcgcctacg acaccgccgt cttccacctc 240
cgaggccctt ccgctcgcct taacttcccc gaattgctgt cccaggacga cgacgtttcg 300
acccaacaac agggcaagat gtccgccgat tcaattcgcc aaaaagcgac ccaagtcggc 360
gccagagtcg acgcgctcca aaccgcgctt cagcaatcct cgtcgacaca ctccattagt 420
tccagccacg tcagctatga gaaaccagac ttgaacgagt atcccaaacc tgaagattag 480
<210>398
<211>159
<212>PRT
<213>大豆
<400>398
Met Glu Glu Ala Gly Leu Gly Asp Cys Cys Ser Ser Asn Thr Thr Ile
1 5 10 15
Thr Arg Lys Ser Glu Lys Arg Lys Gln Gln His Gln Gln Gln Glu Lys
20 25 30
Pro Tyr Arg Gly Ile Arg Met Arg Lys Trp Gly Lys Trp Val Ala Glu
35 40 45
Ile Arg Glu Pro Asn Lys Arg Ser Arg Ile Trp Leu Gly Ser Tyr Ala
50 55 60
Thr Pro Val Ala Ala Ala Arg Ala Tyr Asp Thr Ala Val Phe His Leu
65 70 75 80
Arg Gly Pro Ser Ala Arg Leu Asn Phe Pro Glu Leu Leu Ser Gln Asp
85 90 95
Asp Asp Val Ser Thr Gln Gln Gln Gly Lys Met Ser Ala Asp Ser Ile
100 105 110
Arg Gln Lys Ala Thr Gln Val Gly Ala Arg Val Asp Ala Leu Gln Thr
115 120 125
Ala Leu Gln Gln Ser Ser Ser Thr His Ser Ile Ser Ser Ser His Val
130 135 140
Ser Tyr Glu Lys Pro Asp Leu Asn Glu Tyr Pro Lys Pro Glu Asp
145 150 155
<210>399
<211>1026
<212>DNA
<213>大豆
<400>399
gcaaagtttc caaattgaat gcaaaaacag aaacttcttc ctcaaatgcc ttctgggtcg 60
ctcttctttc tatccagatt acgaagattt cggtcgccag ttgtgattca agtgctattt 120
tagcattttt tttttacctg gacggtaagg gtcaacttgc atgcacatgt tagtgaaaaa 180
ccacaataag ggggatggat ctaagtccct ggccgataca ctggcgaaat ggaaagaata 240
taatgcctgg ctggagtcta acaatgaagc tgagaagccg gttaggaagg tccctgccaa 300
gggatcaaag aagggatgta tgaaaggcaa aggaggacct gagaacttgc gctgtaatta 360
cagaggagtt aggcaaagga catggggaaa atgggttgct gaaatccgag agccaaacag 420
aggaagtagg ctctggttgg gtacttttcc tactgccatt agcgctgctc ttgcttatga 480
tgaagcagcg atggcaatgt atggtttctg tgcacgcctc aactttccca atgttcaagt 540
ttcaactttt tccgaggaac cgtctagaaa ttctccagct gctgcttacc agtcaagaaa 600
ttctccatct gctaaagaat ccggttctgc gttggtgata ttagagaggt ctgagtgcat 660
gatgttgtgg aacaattctg gtggagatgc agcagaggat gatggcatgg aagacctttc 720
cttatcctta agtgtgaaac atgaggaagg ggaggatgaa tcagggacca gttcttccta 780
tctttcattg tcttgatgta tggtttgcat actctgattt ggccgtggct ggaaatcata 840
gccttcatag aggtggatga ttagcttagg atgaacgaat cttgatatta gtacctggag 900
attagctgtt gtaaaattga cttggttgag aagtgttcca ttcttcagga attgacctaa 960
tgcaatctgg atatccagtc aagttgtaag atgtgaaatg tattttgcct tgcatgatag 1020
atgact 1026
<210>400
<211>211
<212>PRT
<213>大豆
<400>400
Met His Met Leu Val Lys Asn His Asn Lys Gly Asp Gly Ser Lys Ser
1 5 10 15
Leu Ala Asp Thr Leu Ala Lys Trp Lys Glu Tyr Asn Ala Trp Leu Glu
20 25 30
Ser Asn Asn Glu Ala Glu Lys Pro Val Arg Lys Val Pro Ala Lys Gly
35 40 45
Ser Lys Lys Gly Cys Met Lys Gly Lys Gly Gly Pro Glu Asn Leu Arg
50 55 60
Cys Asn Tyr Arg Gly Val Arg Gln Arg Thr Trp Gly Lys Trp Val Ala
65 70 75 80
Glu Ile Arg Glu Pro Asn Arg Gly Ser Arg Leu Trp Leu Gly Thr Phe
85 90 95
Pro Thr Ala Ile Ser Ala Ala Leu Ala Tyr Asp Glu Ala Ala Met Ala
100 105 110
Met Tyr Gly Phe Cys Ala Arg Leu Asn Phe Pro Asn Val Gln Val Ser
115 120 125
Thr Phe Ser Glu Glu Pro Ser Arg Asn Ser Pro Ala Ala Ala Tyr Gln
130 135 140
Ser Arg Asn Ser Pro Ser Ala Lys Glu Ser Gly Ser Ala Leu Val Ile
145 150 155 160
Leu Glu Arg Ser Glu Cys Met Met Leu Trp Asn Asn Ser Gly Gly Asp
165 170 175
Ala Ala Glu Asp Asp Gly Met Glu Asp Leu Ser Leu Ser Leu Ser Val
180 185 190
Lys His Glu Glu Gly Glu Asp Glu Ser Gly Thr Ser Ser Ser Tyr Leu
195 200 205
Ser Leu Ser
210
<210>401
<211>1077
<212>DNA
<213>大豆
<400>401
gttttggaat tgagacaggc tttatttata attttaaaaa cttgtttccc tccctccctt 60
atttttgggt tttctcaact tgttcttgtc atcttgtaaa acatgggaac tgctatagac 120
atgtacaaca gcagcaacat cgtagcggat ttcctagatc cgtatagtga agagctgatg 180
aaagcactta agccttttat gaaaagtgat tatttctctg cctcttcttc ttcttcactc 240
gaatcacagc cttgttcttt ttcatctaat tctctcccca cttcgtatcc ctcttccaac 300
caaatcaagc tcaaccaact caccccagac caaattgttc agattcaggc ccaaatccac 360
attcagcagc agcagcagca cgtggcccaa acccaaaccc acctgggccc aaaacgcgtc 420
cccatgaagc acgctggcac ggccgcgaaa cccacgaagc tctaccgcgg ggtgcggcaa 480
cggcattggg gcaagtgggt cgctgaaatc agactcccaa agaaccgcac gcgcctctgg 540
ctaggaacat tcgacaccgc agaggaagca gcattagcgt acgacaacgc agcgtttaag 600
ctcagaggcg agttcgcgcg tctcaatttt cctcatctaa gacaccacgg agccttcgtt 660
ttcggcgagt tcggagatta caagcctcta ccttcttccg tggattccaa actgcaagct 720
atttgcgaaa gcttagcgaa acaagaggaa aagccgtgtt gctccgtcga agacgtgaag 780
cccgtgatac acgctgctga gctggcagag gtcgagtctg acgtggcaaa atcgaacgct 840
gaatatgttt atcccgagtt cgaggatttt aaggtcgagc acgagaaccc aatgttttct 900
ggtgaatctt cttcgcctga atccagtgtt actttcttgg atttctcgga cttctcggat 960
tctaataatc agtgggatga aatggagaat tttgggttgg agaagttccc ttctgtggag 1020
attgattggg aagctatatg atgactcggt gaattttcgt tatgtcaaat ggttggt 1077
<210>402
<211>312
<212>PRT
<213>大豆
<400>402
Met Gly Thr Ala Ile Asp Met Tyr Asn Ser Ser Asn Ile Val Ala Asp
1 5 10 15
Phe Leu Asp Pro Tyr Ser Glu Glu Leu Met Lys Ala Leu Lys Pro Phe
20 25 30
Met Lys Ser Asp Tyr Phe Ser Ala Ser Ser Ser Ser Ser Leu Glu Ser
35 40 45
Gln Pro Cys Ser Phe Ser Ser Asn Ser Leu Pro Thr Ser Tyr Pro Ser
50 55 60
Ser Asn Gln Ile Lys Leu Asn Gln Leu Thr Pro Asp Gln Ile Val Gln
65 70 75 80
Ile Gln Ala Gln Ile His Ile Gln Gln Gln Gln Gln His Val Ala Gln
85 90 95
Thr Gln Thr His Leu Gly Pro Lys Arg Val Pro Met Lys His Ala Gly
100 105 110
Thr Ala Ala Lys Pro Thr Lys Leu Tyr Arg Gly Val Arg Gln Arg His
115 120 125
Trp Gly Lys Trp Val Ala Glu Ile Arg Leu Pro Lys Asn Arg Thr Arg
130 135 140
Leu Trp Leu Gly Thr Phe Asp Thr Ala Glu Glu Ala Ala Leu Ala Tyr
145 150 155 160
Asp Asn Ala Ala Phe Lys Leu Arg Gly Glu Phe Ala Arg Leu Asn Phe
165 170 175
Pro His Leu Arg His His Gly Ala Phe Val Phe Gly Glu Phe Gly Asp
180 185 190
Tyr Lys Pro Leu Pro Ser Ser Val Asp Ser Lys Leu Gln Ala Ile Cys
195 200 205
Glu Ser Leu Ala Lys Gln Glu Glu Lys Pro Cys Cys Ser Val Glu Asp
210 215 220
Val Lys Pro Val Ile His Ala Ala Glu Leu Ala Glu Val Glu Ser Asp
225 230 235 240
Val Ala Lys Ser Asn Ala Glu Tyr Val Tyr Pro Glu Phe Glu Asp Phe
245 250 255
Lys Val Glu His Glu Asn Pro Met Phe Ser Gly Glu Ser Ser Ser Pro
260 265 270
Glu Ser Ser Val Thr Phe Leu Asp Phe Ser Asp Phe Ser Asp Ser Asn
275 280 285
Asn Gln Trp Asp Glu Met Glu Asn Phe Gly Leu Glu Lys Phe Pro Ser
290 295 300
Val Glu Ile Asp Trp Glu Ala Ile
305 310
<210>403
<211>597
<212>DNA
<213>大豆
<400>403
atggcgaaac ccagcagcga aaagccagag gagcatagcg attccaagta ctacaaaggg 60
gtccgaaaga gaaaatgggg caaatgggta tccgaaataa gactacccaa cagccgtcag 120
aggatttggt tgggatccta cgacaccccc gagaaggccg cgcgtgcctt cgacgcggca 180
atgttctgct tacgtggccg caacgccaag tttaacttcc ccgacaaccc acccgacatc 240
gccggcggaa cgtccatgac gccgtcgcag attcagatcg ccgccgcaca attcgccaac 300
gcggggcccc acgagggaca ttcgggccga cccgaacatc ctcccatgga atctccatcg 360
ccttctgttt cggaagggac catccaaacg gacagtgacg tccccactct taacggttca 420
gtaacggatt tgttcacgcc cgttgggtcg agtggttacg catccgatta cgggattttc 480
ccgggctttg atgatttcag tggcgatttt tatgtgccgg aaatgccgaa cgttaattat 540
ggagaagaaa acggggaagg gttcatagtt gatgaatctt tcttgtggaa tttttga 597
<210>404
<211>198
<212>PRT
<213>大豆
<400>404
Met Ala Lys Pro Ser Ser Glu Lys Pro Glu Glu His Ser Asp Ser Lys
1 5 10 15
Tyr Tyr Lys Gly Val Arg Lys Arg Lys Trp Gly Lys Trp Val Ser Glu
20 25 30
Ile Arg Leu Pro Asn Ser Arg Gln Arg Ile Trp Leu Gly Ser Tyr Asp
35 40 45
Thr Pro Glu Lys Ala Ala Arg Ala Phe Asp Ala Ala Met Phe Cys Leu
50 55 60
Arg Gly Arg Asn Ala Lys Phe Asn Phe Pro Asp Asn Pro Pro Asp Ile
65 70 75 80
Ala Gly Gly Thr Ser Met Thr Pro Ser Gln Ile Gln Ile Ala Ala Ala
85 90 95
Gln Phe Ala Asn Ala Gly Pro His Glu Gly His Ser Gly Arg Pro Glu
100 105 110
His Pro Pro Met Glu Ser Pro Ser Pro Ser Val Ser Glu Gly Thr Ile
115 120 125
Gln Thr Asp Ser Asp Val Pro Thr Leu Asn Gly Ser Val Thr Asp Leu
130 135 140
Phe Thr Pro Val Gly Ser Ser Gly Tyr Ala Ser Asp Tyr Gly Ile Phe
145 150 155 160
Pro Gly Phe Asp Asp Phe Ser Gly Asp Phe Tyr Val Pro Glu Met Pro
165 170 175
Asn Val Asn Tyr Gly Glu Glu Asn Gly Glu Gly Phe Ile Val Asp Glu
180 185 190
Ser Phe Leu Trp Asn Phe
195
<210>405
<211>923
<212>DNA
<213>野大豆(Glycine soja)
<400>405
ggctttctca gttccctctt tccctatcaa aatcctttcc cacaacacta ctcactccag 60
tccaagaaac cctttttcaa tttggtttca acagcacaca cacacacaca catatatata 120
tatatatagc atgtttacct tgaatcattc ttctgatttg taccatgttt cccctgagct 180
ctcatcttcc ttggacacat cctcgccggc ttcggagggc tctcgtggcg tggcattttc 240
cgacgaggag gtgcggctgg cggtgaggca cccgaagaag cgggcaggtc ggaagaagtt 300
ccgggagacg cgccacccgg tgtaccgggg ggtgaggagg aggaactcgg ataagtgggt 360
gtgtgaggtg agggagccca acaagaagac caggatttgg ctggggactt tccccacgcc 420
ggagatggcg gctcgggcgc acgacgtggc ggcaatggcc ctgaggggcc ggtatgcctg 480
tctaaacttt gctgactcgg cctggcggtt acctgttccc gccacggccg aggcaaagga 540
tatacagaag gcagcagcag aagctgccca ggctttcaga ccagatcaaa ccttaaaaaa 600
tgctaataca aggcaggagt gtgtggaggc ggtggcggtg gcggtggcgg acacaacaac 660
ggccacggca caaggggtgt tttatatgga ggaagaagag caggtgttgg atatgcctga 720
gttgcttagg aatatggtgc tcatgtcccc aacacattgc ttagggtatg agtatgaaga 780
tgctgacttg gatgcccaag atgctgaggt gtcactatgg aatttctcaa tttaataatg 840
tgttttggtt tggtttttga tgttactttt ttggagtgaa cagtgtctgt actggttttt 900
tattactagt acggatacta gtt 923
<210>406
<211>234
<212>PRT
<213>野大豆
<400>406
Met Phe Thr Leu Asn His Ser Ser Asp Leu Tyr His Val Ser Pro Glu
1 5 10 15
Leu Ser Ser Ser Leu Asp Thr Ser Ser Pro Ala Ser Glu Gly Ser Arg
20 25 30
Gly Val Ala Phe Ser Asp Glu Glu Val Arg Leu Ala Val Arg His Pro
35 40 45
Lys Lys Arg Ala Gly Arg Lys Lys Phe Arg Glu Thr Arg His Pro Val
50 55 60
Tyr Arg Gly Val Arg Arg Arg Asn Ser Asp Lys Trp Val Cys Glu Val
65 70 75 80
Arg Glu Pro Asn Lys Lys Thr Arg Ile Trp Leu Gly Thr Phe Pro Thr
85 90 95
Pro Glu Met Ala Ala Arg Ala His Asp Val Ala Ala Met Ala Leu Arg
100 105 110
Gly Arg Tyr Ala Cys Leu Asn Phe Ala Asp Ser Ala Trp Arg Leu Pro
115 120 125
Val Pro Ala Thr Ala Glu Ala Lys Asp Ile Gln Lys Ala Ala Ala Glu
130 135 140
Ala Ala Gln Ala Phe Arg Pro Asp Gln Thr Leu Lys Asn Ala Asn Thr
145 150 155 160
Arg Gln Glu Cys Val Glu Ala Val Ala Val Ala Val Ala Asp Thr Thr
165 170 175
Thr Ala Thr Ala Gln Gly Val Phe Tyr Met Glu Glu Glu Glu Gln Val
180 185 190
Leu Asp Met Pro Glu Leu Leu Arg Asn Met Val Leu Met Ser Pro Thr
195 200 205
His Cys Leu Gly Tyr Glu Tyr Glu Asp Ala Asp Leu Asp Ala Gln Asp
210 215 220
Ala Glu Val Ser Leu Trp Asn Phe Ser Ile
225 230
<210>407
<211>1185
<212>DNA
<213>欧洲油菜
<400>407
tgctgcatga attcggcacg aggagagaaa taaatatctt atcaaaccag acagaacaga 60
gatcttgtta cttactatac tacactcagc cttatccagt ttttcaaaag aagttttcaa 120
cgatgaactc agtctctact ttttctgaac ttcttggctc cgagaacgag tctccggtag 180
gtagtgatta ctgtcccatg ttggcggcga gctgtccgaa gaagccggcg ggtaggaaga 240
agtttcggga gacacgccac cccatttaca gaggagttcg tcttagaaag tcaggtaagt 300
gggtgtgtga agtgagggaa ccaaacaaga aatctagaat ttggctcgga actttcaaaa 360
cagctgagat cgcagctcgt gctcacgacg tcgccgcctt agctctccgt ggaagaggcg 420
cctgcctcaa cttcgccgac tcggcttggc ggctccgtat cccggagaca acctgcgcca 480
aggatatcca gaaggctgct gctgaagccg cattggcttt tgaggccgag aagagtgata 540
ccacgacgaa tgatcatggc atgaacatgg cttctcaggt tgaggttaat gacacgacgg 600
atcatgacct ggacatggag gagacgatag tggaggctgt ttttagggag gaacagagag 660
aagggtttta catggcggag gagacgacgg ttgtgggtgt tgttccggag gaacagatga 720
gcaaagggtt ttacatggac gaggagtgga tgttcgggat gccgaccttg ttggctgata 780
tggcggcagg gatgctctta ccgctgccgt ccgtacaatg gggacataat gatgacttcg 840
aaggagttgc tgacataaac ctctggagtt attagtactc gtatttttct taaaattatt 900
tttggaatga taatatttta ttgaattcgg attctaccta ttttttttaa tggatatcct 960
ttttttctgg tagtgtgaga aacgattgtg aatgtttcca caaaagtgtt ggcaatgttg 1020
tcaaatgctg ggtattttgt gcagcatagt catcttggtt tccttatatg cagcaactaa 1080
attttagttt ttaagtaaaa acagaagagg aaagagaatg aatgttatta aataaagaaa 1140
gaaaaatcta aaggtgggtt tagtatgaaa aaaaaaaaaa aaaaa 1185
<210>408
<211>250
<212>PRT
<213>欧洲油菜
<400>408
Met Asn Ser Val Ser Thr Phe Ser Glu Leu Leu Gly Ser Glu Asn Glu
1 5 10 15
Ser Pro Val Gly Ser Asp Tyr Cys Pro Met Leu Ala Ala Ser Cys Pro
20 25 30
Lys Lys Pro Ala Gly Arg Lys Lys Phe Arg Glu Thr Arg His Pro Ile
35 40 45
Tyr Arg Gly Val Arg Leu Arg Lys Ser Gly Lys Trp Val Cys Glu Val
50 55 60
Arg Glu Pro Asn Lys Lys Ser Arg Ile Trp Leu Gly Thr Phe Lys Thr
65 70 75 80
Ala Glu Ile Ala Ala Arg Ala His Asp Val Ala Ala Leu Ala Leu Arg
85 90 95
Gly Arg Gly Ala Cys Leu Asn Phe Ala Asp Ser Ala Trp Arg Leu Arg
100 105 110
Ile Pro Glu Thr Thr Cys Ala Lys Asp Ile Gln Lys Ala Ala Ala Glu
115 120 125
Ala Ala Leu Ala Phe Glu Ala Glu Lys Ser Asp Thr Thr Thr Asn Asp
130 135 140
His Gly Met Asn Met Ala Ser Gln Val Glu Val Asn Asp Thr Thr Asp
145 150 155 160
His Asp Leu Asp Met Glu Glu Thr Ile Val Glu Ala Val Phe Arg Glu
165 170 175
Glu Gln Arg Glu Gly Phe Tyr Met Ala Glu Glu Thr Thr Val Val Gly
180 185 190
Val Val Pro Glu Glu Gln Met Ser Lys Gly Phe Tyr Met Asp Glu Glu
195 200 205
Trp Met Phe Gly Met Pro Thr Leu Leu Ala Asp Met Ala Ala Gly Met
210 215 220
Leu Leu Pro Leu Pro Ser Val Gln Trp Gly His Asn Asp Asp Phe Glu
225 230 235 240
Gly Val Ala Asp Ile Asn Leu Trp Ser Tyr
245 250
<210>409
<211>945
<212>DNA
<213>欧洲油菜
<400>409
aattcggcac gagctgagag ataaattaaa catttatcaa accaacgaaa catagatctt 60
tgtacttact atacttcacc ttatccagtt ttattttttt atttataaag agttttcaac 120
aatgacctca ttttctacct tttctgaact gttgggctcc gagcatgagt ctccggttac 180
attaggcgaa gagtattgtc cgaagctggc cgcaagctgt ccgaagaaac cagccggccg 240
gaagaagttt cgagagacgc gtcacccagt ttacagagga gttcgtctga gaaactcagg 300
taagtgggtg tgtgaagtga gggagccaaa caagaaatct aggatttggc tcggtacttt 360
cctaacagcc gagatcgcag cccgtgctca cgacgtcgcc gccatagccc tccgcggcaa 420
atcagcttgt ctcaattttg ccgactccgc ttggcggctc cgtatcccgg agacaacatg 480
ccccaaggag attcagaagg cggctgctga agccgcggtg gcttttaagg ctgagataaa 540
taatacgacg gcggatcatg gcattgacgt ggaggagacg atcgttgagg ctattttcac 600
ggaggaaaac aacgatggtt tttatatgga cgaggaggag tccatgttcg ggatgccggc 660
cttgttggct agtatkgctg aaggaatgct tttgccgcct ccgtccgtac aattcggaca 720
tacctatgac tttgacggag atgctgacgt gtccctttgg agttattagt acaaagattt 780
tttatttcca tttttggtat aatacttctt tttgattttc ggattctacc tttttatggg 840
tatcattttt tttttaggta acgtggaagc tgagtgtaaa tgtttgaaca attgtgttat 900
aaaatgctag tatttttgtg tgcaaaaaaa aaaaaaaaaa aaaaa 945
<210>410
<211>215
<212>PRT
<213>欧洲油菜
<220>
<221>未确定
<222>(185)..(185)
<223>Xaa可为任一天然存在的氨基酸
<400>410
Met Thr Ser Phe Ser Thr Phe Ser Glu Leu Leu Gly Ser Glu His Glu
1 5 10 15
Ser Pro Val Thr Leu Gly Glu Glu Tyr Cys Pro Lys Leu Ala Ala Ser
20 25 30
Cys Pro Lys Lys Pro Ala Gly Arg Lys Lys Phe Arg Glu Thr Arg His
35 40 45
Pro Val Tyr Arg Gly Val Arg Leu Arg Asn Ser Gly Lys Trp Val Cys
50 55 60
Glu Val Arg Glu Pro Asn Lys Lys Ser Arg Ile Trp Leu Gly Thr Phe
65 70 75 80
Leu Thr Ala Glu Ile Ala Ala Arg Ala His Asp Val Ala Ala Ile Ala
85 90 95
Leu Arg Gly Lys Ser Ala Cys Leu Asn Phe Ala Asp Ser Ala Trp Arg
100 105 110
Leu Arg Ile Pro Glu Thr Thr Cys Pro Lys Glu Ile Gln Lys Ala Ala
115 120 125
Ala Glu Ala Ala Val Ala Phe Lys Ala Glu Ile Asn Asn Thr Thr Ala
130 135 140
Asp His Gly Ile Asp Val Glu Glu Thr Ile Val Glu Ala Ile Phe Thr
145 150 155 160
Glu Glu Asn Asn Asp Gly Phe Tyr Met Asp Glu Glu Glu Ser Met Phe
165 170 175
Gly Met Pro Ala Leu Leu Ala Ser Xaa Ala Glu Gly Met Leu Leu Pro
180 185 190
Pro Pro Ser Val Gln Phe Gly His Thr Tyr Asp Phe Asp Gly Asp Ala
195 200 205
Asp Val Ser Leu Trp Ser Tyr
210 215
<210>411
<211>1061
<212>DNA
<213>欧洲油菜
<400>411
aaattataca aaaagagttc gagctcttga ttacttaatt aaaaacaaat tttacttctc 60
ttttttttat ggtcttttgt catgatctga aatacggtct ttgttgataa atcatatatg 120
ccgattttga tttttaatcc acctgagaga taaattaaac atttatcaaa ccaacgaaac 180
atagatcttt gtagttactt atccagttta ttttttaaaa aattataaag agatttcaac 240
aatgacctca ttttctacct tttctgaaat gttgggctcc gagtatgagt ctccggttac 300
gttaggcgga gagtattgtc cgaagctggc cgcgagctgt ccgaagaaac cagccggtcg 360
taagaagttt cgggagacgc gtcacccagt ttatagagga kttcgtctga gaaactcagg 420
taaatgggtg tgtgaagtga gggagccaaa caagaaatcc aggatttggc tcggtacttt 480
cttaaccgcc gagatcgcag ctcgtgctca cgacgtcgcc gccatagccc tccgcggcaa 540
atcagcttgt ctcaattttg ctgactcggc ttggcggctc cgtatcccgg agacaacatg 600
ccccaaggag attcagaagg cggctgctga agccgccttg gcttttcagg ctgagataaa 660
taatacgacg acggatcatg gcctggacat ggaggagacg atcgtggagg ctattttcac 720
ggaggaaaac aacgatgtgt tttatatgga cgaggagtcc atgttagaga tgccggcctt 780
gttggctagt atggcggaag gaatgctttt gccgccgccg tccgtacatt tcggacataa 840
ctatgacttt gacggagatg ctgacgtgtc cctttggagt tattagtgca aatttttttt 900
tcaatttttt cgtataatat tcttttggat tttcggattc tgccttttta tgggaatctt 960
tttttttttg gtaatgtgga agctgagtgt gaatgtttaa acaattgtgt tatcaaatgc 1020
tagtattttt ttgtgcagcc tcgtgccgaa tcctgcagcc c 1061
<210>412
<211>214
<212>PRT
<213>欧洲油菜
<220>
<221>未确定
<222>(54)..(54)
<223>Xaa可为任一天然存在的氨基酸
<400>412
Met Thr Ser Phe Ser Thr Phe Ser Glu Met Leu Gly Ser Glu Tyr Glu
1 5 10 15
Ser Pro Val Thr Leu Gly Gly Glu Tyr Cys Pro Lys Leu Ala Ala Ser
20 25 30
Cys Pro Lys Lys Pro Ala Gly Arg Lys Lys Phe Arg Glu Thr Arg His
35 40 45
Pro Val Tyr Arg Gly Xaa Arg Leu Arg Asn Ser Gly Lys Trp Val Cys
50 55 60
Glu Val Arg Glu Pro Asn Lys Lys Ser Arg Ile Trp Leu Gly Thr Phe
65 70 75 80
Leu Thr Ala Glu Ile Ala Ala Arg Ala His Asp Val Ala Ala Ile Ala
85 90 95
Leu Arg Gly Lys Ser Ala Cys Leu Asn Phe Ala Asp Ser Ala Trp Arg
100 105 110
Leu Arg Ile Pro Glu Thr Thr Cys Pro Lys Glu Ile Gln Lys Ala Ala
115 120 125
Ala Glu Ala Ala Leu Ala Phe Gln Ala Glu Ile Asn Asn Thr Thr Thr
130 135 140
Asp His Gly Leu Asp Met Glu Glu Thr Ile Val Glu Ala Ile Phe Thr
145 150 155 160
Glu Glu Asn Asn Asp Val Phe Tyr Met Asp Glu Glu Ser Met Leu Glu
165 170 175
Met Pro Ala Leu Leu Ala Ser Met Ala Glu Gly Met Leu Leu Pro Pro
180 185 190
Pro Ser Val His Phe Gly His Asn Tyr Asp Phe Asp Gly Asp Ala Asp
195 200 205
Val Ser Leu Trp Ser Tyr
210
<210>413
<211>879
<212>DNA
<213>欧洲油菜
<400>413
cccctcgagg tttgttcgcc tctagttcca gaggccagta taaaaaacac caactctcac 60
tcccaacttt tttatcgaac tacaaacttt agaatccacc tgaaagataa aataaacatt 120
tatcaaacca tcagaactga gatctttcta gtctcttact atacttaacc ttatccagtt 180
aacaatgacc tcattttctg ccttctctga aatgatgggc tccgagaacg agtctcctgc 240
attaagcggg gagtattgtc cgacgctggc cgcgagctgt ccgaagaaac ctgcgggtcg 300
gaagaagttt cgggagacgc gtcacccaat ttacagagga gttcgtcaga gacactcagg 360
taagtgggtg tgcgaggtga gagagccaaa caagaaatcc aggatttggc tcggkacttt 420
cctaaccgcc gagatcgcag ctcgtgctca cgacgtcgcc gccatagccc tccgtggcaa 480
atccgcctgc ctcaatttcg ccgactcggc ttggcggctc cgtatcccgg agacaacatg 540
ccccaaggat atccagaagg cggctgctga agccgcggtg gcttttcagg ctgagataaa 600
tgatacgacg acggatcatg gcctggacgt ggaggagacg atcgtggagg ctatttttac 660
ggaggaaaac aacgatgggt tttatatgga cgaggaggag tccatgttcg ggatgccgtc 720
cttgttggct agcatggcgg aagggatgct tttgccgcca ccgtcggtac gattcgaaca 780
taamtatgac tttgacggag atgccgamgt gtccctttgg agttattaat acagagattt 840
tttatttcca gtttttgtat aatacttttt ttttggatt 879
<210>414
<211>214
<212>PRT
<213>欧洲油菜
<220>
<221>未确定
<222>(200)..(200)
<223>Xaa可为任一天然存在的氨基酸
<220>
<221>未确定
<222>(208)..(208)
<223>Xaa可为任一天然存在的氨基酸
<400>414
Met Thr Ser Phe Ser Ala Phe Ser Glu Met Met Gly Ser Glu Asn Glu
1 5 10 15
Ser Pro Ala Leu Ser Gly Glu Tyr Cys Pro Thr Leu Ala Ala Ser Cys
20 25 30
Pro Lys Lys Pro Ala Gly Arg Lys Lys Phe Arg Glu Thr Arg His Pro
35 40 45
Ile Tyr Arg Gly Val Arg Gln Arg His Ser Gly Lys Trp Val Cys Glu
50 55 60
Val Arg Glu Pro Asn Lys Lys Ser Arg Ile Trp Leu Gly Thr Phe Leu
65 70 75 80
Thr Ala Glu Ile Ala Ala Arg Ala His Asp Val Ala Ala Ile Ala Leu
85 90 95
Arg Gly Lys Ser Ala Cys Leu Asn Phe Ala Asp Ser Ala Trp Arg Leu
100 105 110
Arg Ile Pro Glu Thr Thr Cys Pro Lys Asp Ile Gln Lys Ala Ala Ala
115 120 125
Glu Ala Ala Val Ala Phe Gln Ala Glu Ile Asn Asp Thr Thr Thr Asp
130 135 140
His Gly Leu Asp Val Glu Glu Thr Ile Val Glu Ala Ile Phe Thr Glu
145 150 155 160
Glu Asn Asn Asp Gly Phe Tyr Met Asp Glu Glu Glu Ser Met Phe Gly
165 170 175
Met Pro Ser Leu Leu Ala Ser Met Ala Glu Gly Met Leu Leu Pro Pro
180 185 190
Pro Ser Val Arg Phe Glu His Xaa Tyr Asp Phe Asp Gly Asp Ala Xaa
195 200 205
Val Ser Leu Trp Ser Tyr
210
<210>415
<211>753
<212>DNA
<213>甘蓝(Brassica oleracea)
<400>415
atgaactcag tctctacttt ttctgaactt cttggctctg agaacgagtc tccggtaggt 60
ggtgattact gtcccatgtt ggcggcgagc tgtccgaaga agccggcggg taggaagaag 120
tttcgggaga cacgtcaccc catttaccga ggagttcgcc ttagaaaatc aggtaagtgg 180
gtgtgtgaag tgagggaacc aaacaaaaaa tctaggattt ggctcggaac tttcaaaaca 240
gctgagatcg cagctcgtgc tcacgacgtc gccgccttag ctctccgtgg aagaggcgcc 300
tgcctcaact tcgccgactc ggcttggcgg ctccgtatcc cggagacaac ctgcgccaag 360
gatatccaga aggctgctgc tgaagccgca ttggcttttg aggccgagaa gagtgatacc 420
acgacgaatg atcatggcat gaacatggct tctcaggctg aggttaatga cacgacggat 480
catggcctgg acatggagga gacgatggtg gaggctgttt ttactgagga gcagagagac 540
gggttttaca tggcggagga gacgacggtg gagggtgttg ttccggagga acagatgagc 600
aaagggtttt acatggacga ggagtggatg ttcgggatgc cgaccttgtt ggctgatatg 660
gcggcaggga tgctcttacc gccgccgtcc gtacaatggg gacataatga tgacttcgaa 720
ggagatgctg acatgaacct ctggaattat tag 753
<210>416
<211>250
<212>PRT
<213>甘蓝
<400>416
Met Asn Ser Val Ser Thr Phe Ser Glu Leu Leu Gly Ser Glu Asn Glu
1 5 10 15
Ser Pro Val Gly Gly Asp Tyr Cys Pro Met Leu Ala Ala Ser Cys Pro
20 25 30
Lys Lys Pro Ala Gly Arg Lys Lys Phe Arg Glu Thr Arg His Pro Ile
35 40 45
Tyr Arg Gly Val Arg Leu Arg Lys Ser Gly Lys Trp Val Cys Glu Val
50 55 60
Arg Glu Pro Asn Lys Lys Ser Arg Ile Trp Leu Gly Thr Phe Lys Thr
65 70 75 80
Ala Glu Ile Ala Ala Arg Ala His Asp Val Ala Ala Leu Ala Leu Arg
85 90 95
Gly Arg Gly Ala Cys Leu Asn Phe Ala Asp Ser Ala Trp Arg Leu Arg
100 105 110
Ile Pro Glu Thr Thr Cys Ala Lys Asp Ile Gln Lys Ala Ala Ala Glu
115 120 125
Ala Ala Leu Ala Phe Glu Ala Glu Lys Ser Asp Thr Thr Thr Asn Asp
130 135 140
His Gly Met Asn Met Ala Ser Gln Ala Glu Val Asn Asp Thr Thr Asp
145 150 155 160
His Gly Leu Asp Met Glu Glu Thr Met Val Glu Ala Val Phe Thr Glu
165 170 175
Glu Gln Arg Asp Gly Phe Tyr Met Ala Glu Glu Thr Thr Val Glu Gly
180 185 190
Val Val Pro Glu Glu Gln Met Ser Lys Gly Phe Tyr Met Asp Glu Glu
195 200 205
Trp Met Phe Gly Met Pro Thr Leu Leu Ala Asp Met Ala Ala Gly Met
210 215 220
Leu Leu Pro Pro Pro Ser Val Gln Trp Gly His Asn Asp Asp Phe Glu
225 230 235 240
Gly Asp Ala Asp Met Asn Leu Trp Asn Tyr
245 250
Claims (111)
1.用于植物中相对于对照植物提高非生物胁迫抗性的方法,所述方法包括调节植物中编码NAP1样多肽的核酸表达,所述NAP1样多肽包含NAP结构域。
2.根据权利要求1的方法,其中所述的NAP1样多肽以增加的优选顺序与SEQ ID NO:2所代表的NAP1样多肽具有至少20%、25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%或更大的序列同一性。
3.根据权利要求1或2的方法,其中编码NAP1样多肽的所述核酸由表A中所给出核酸SEQ ID NO的任一核酸或其部分代表,或由能够与表A中所给出核酸SEQ ID NO的任一核酸杂交的序列代表。
4.根据权利要求1至3中任一项所述的方法,其中所述的核酸序列编码表A中给出的任一SEQ ID NO的直向同源物或旁系同源物。
5.根据任一前述权利要求所述的方法,其中所述提高的非生物胁迫抗性是相对于对照植物而言提高的营养摄取效率。
6.根据任一前述权利要求所述的方法,其中所述的营养摄取效率导致增加的生物量和/或提高的种子产量。
7.权利要求6的方法,其中所述提高的种子产量至少包含提高的种子总重量和/或提高的充实种子数。
8.根据任一前述权利要求所述的方法,其中所述受调节的表达通过在植物中导入并表达编码NAP1样多肽的核酸而实现。
9.根据权利要求8的方法,其中所述的核酸有效地连接至组成型启动子,优选地有效地连接至GOS2启动子。
10.根据任一前述权利要求所述的方法,其中所述的编码NAP1样多肽的核酸是植物来源的,优选地来自双子叶植物,进一步优选地来自十字花科(Brassicaceae),更优选地来自拟南芥属(Arabidopsis),最优选地来自拟南芥(Arabidopsis thaliana)。
11.构建体在用于制备非生物胁迫抗性提高的植物的方法中的用途,所述构建体包含
(a)编码权利要求1至4中任一项所定义的NAP1样多肽的核酸;
(b)能够驱动(a)的核酸序列表达的一个或多个调控序列;和任选地
(c)转录终止序列,
并且其中所述调控序列之一是组成型启动子,优选地是GOS2启动子。
12.编码NAP1样多肽的核酸的用途,用于在植物中相对于对照植物而言提高非生物胁迫抗性的方法中。
13.用于植物中相对于对照植物增强产量相关性状的方法,包括调节植物中编码Lsm(Sm样)蛋白的核酸表达。
14.根据权利要求的13方法,其中所述的Lsm蛋白包含具有这样的氨基酸序列的Lsm结构域,所述的氨基酸序列以增加的优选顺序与选自SEQ ID No 120、121、122、123、124、125、126、127、128、129和130的序列具有至少50%、60%、70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%的序列同一性。
15.根据权利要求13或权利要求14的方法,其中所述的Lsm蛋白包含以增加的优选顺序与选自SEQ ID No 41、43、45、47、49、51、53、55、57、59和61的序列具有至少50%、60%、70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%的序列同一性。
16.根据权利要求13至15中任一项所述的方法,其中所述的Lsm蛋白包含任意一个或多个以下基序:
(i)基序I:GTLXSFDQFANVVLXGACERVIVGELYCDVPLGLYVIRGENVVLIG或以增加的优选顺序与基序I的序列具有至少70%、80%或90%序列同一性的特征标识,其中允许任意的保守性变化并且其中取“X”为任意氨基酸;
(ii)基序II:KAEREARDLKGTMRKRMEFLDFD或以增加的优选顺序与基序II的序列具有至少70%、80%或90%序列同一性的基序,其中允许任意的保守性变化并且其中取“X”为任意氨基酸;
其中基序I和/或基序II可以按照优选顺序包含0、1、2、3、4、5、6或7个氨基酸的缺失和/或替换和/或插入。
17.根据权利要求13至16中任一项所述的方法,其中所述的Lsm蛋白是Lsm1类蛋白质。
18.根据权利要求13至17中任一项所述的方法,其中所述的Lsm蛋白优选地包含具有氨基酸序列的Lsm结构域,所述的氨基酸序列以增加的优选顺序与选自SEQ ID No.120、121、131、132、133、140、142、143、144、152、154和157的序列至少具有70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%的序列同一性。
19.根据权利要求13至18中任一项所述的方法,其中所述的Lsm蛋白优选地包含SEQ ID No 41、43、73、75、77、81、85、87、89、105、109和115中的任一序列。
20.根据权利要求13至19中任一项所述的方法,其中编码Lsm蛋白的所述核酸是表G中给出的核酸SEQ ID NO的任一核酸或其部分,或者是能够与表G中给出的核酸SEQ ID NO的任一核酸或与它们的互补序列的任一序列杂交的序列。
21.根据权利要求13至20中任一项所述的方法,其中所述的核酸序列编码表G中给出的任意蛋白质的直向同源物或旁系同源物。
22.根据权利要求13至21中任一项所述的方法,其中编码Lsm蛋白的所述核酸包含以下任意核酸:
(i)由SEQ ID NO:82、SEQ ID NO:84、SEQ ID NO:86、SEQ ID NO:88、SEQ ID NO:90、SEQ ID NO:92、SEQ ID NO:94、SEQ ID NO:96、SEQ ID NO:98、SEQ ID NO:100、SEQ ID NO:102、SEQ ID NO:104、SEQ ID NO:106、SEQ ID NO:108、SEQ ID NO:110、SEQ ID NO:112、SEQ ID NO:114或SEQ ID NO:116代表的核酸;
(ii)(i)中所给出SEQ ID NO的任一核酸的互补物;
(iii)编码Lsm蛋白的核酸,所述的Lsm蛋白以增加的优选顺序与SEQID NO:83、SEQ ID NO:85、SEQ ID NO:87、SEQ ID NO:89、SEQ ID NO:91、SEQ ID NO:93、SEQ ID NO:95、SEQ ID NO:97、SEQ ID NO:99、SEQ ID NO:101、SEQ ID NO:103、SEQ ID NO:105、SEQ ID NO:107、SEQ ID NO:109、SEQ ID NO:111、SEQ ID NO:113、SEQ ID NO:115、SEQ ID NO:117中给出的任一氨基酸序列具有至少80%、85%、90%、95%、96%、97%、98%、99%或100%的序列同一性;
(iv)能够在严格条件下与上述(i)、(ii)或(iii)中给出的任一核酸杂交的核酸。
23.根据权利要求13至22中任一项所述的方法,其中所述受调节的表达通过在植物中导入并表达Lsm核酸而实现。
24.根据权利要求13至23中任一项所述的方法,其中所述受调节的表达通过T-DNA活化标签技术、TILLING、位点定向诱变、定向进化或同源重组中的任意一种或多种方法实现。
25.根据权利要求13至24中任一项所述的方法,其中所述增强的产量相关性状是相对于对照植物的任一以下性状:提高的产量、优选地提高的种子产量、增加的充实种子数、提高的种子充实率或增加的生物量。
26.根据权利要求13至25中任一项所述的方法,其中所述的核酸有效地连接至在植物细胞中表达的启动子、优选地以增加的优选顺序有效地连接至种子特异性启动子如稻WSI18启动子。
27.根据权利要求13至26中任一项所述的方法,其中所述的启动子是ABA诱导型启动子。
28.根据权利要求13至27中任一项所述的方法,其中编码Lsm蛋白的所述核酸是植物来源的,优选地来自双子叶植物,进一步优选地来自十字花科、更优选地来自拟南芥属,最优选地来自拟南芥。
29.根据权利要求13至28中任一项所述的方法能够获得的植物或包括种子在内的其部分,其中所述的植物或其部分包含编码Lsm蛋白的重组核酸。
30.分离的核酸分子,选自:
(i)由SEQ ID NO:82、SEQ ID NO:84、SEQ ID NO:86、SEQ ID NO:88、SEQ ID NO:90、SEQ ID NO:92、SEQ ID NO:94、SEQ ID NO:96、SEQ ID NO:98、SEQ ID NO:100、SEQ ID NO:102、SEQ ID NO:104、SEQ ID NO:106、SEQ ID NO:108、SEQ ID NO:110、SEQ ID NO:112、SEQ ID NO:114或SEQ ID NO:116代表的核酸;
(ii)(i)中所给出SEQ ID NO的任一核酸的互补物;
(iii)编码Lsm蛋白的核酸,所述的Lsm蛋白以增加的优选顺序与SEQID NO:83、SEQ ID NO:85、SEQ ID NO:87、SEQ ID NO:89、SEQ ID NO:91、SEQ ID NO:93、SEQ ID NO:95、SEQ ID NO:97、SEQ ID NO:99、SEQ ID NO:101、SEQ ID NO:103、SEQ ID NO:105、SEQ ID NO:107、SEQ ID NO:109、SEQ ID NO:111、SEQ ID NO:113、SEQ ID NO:115、SEQ ID NO:117中给出的任一氨基酸序列具有至少70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%的序列同一性;
(iv)能够在严格条件下与上述(i)、(ii)或(iii)中给出的任一核酸杂交的核酸。
31.分离的多肽,选自:
(i)由任一SEQ ID NO:83、SEQ ID NO:85、SEQ ID NO:87、SEQ IDNO:89、SEQ ID NO:91、SEQ ID NO:93、SEQ ID NO:95、SEQ ID NO:97、SEQ ID NO:99、SEQ ID NO:101、SEQ ID NO:103、SEQ ID NO:105、SEQ ID NO:107、SEQ ID NO:109、SEQ ID NO:111、SEQ ID NO:113、SEQ ID NO:115、SEQ ID NO:117代表的氨基酸序列;
(ii)氨基酸序列,其以增加的优选顺序与SEQ ID NO:83、SEQ ID NO:85、SEQ ID NO:87、SEQ ID NO:89、SEQ ID NO:91、SEQ ID NO:93、SEQ ID NO:95、SEQ ID NO:97、SEQ ID NO:99、SEQ ID NO:101、SEQID NO:103、SEQ ID NO:105、SEQ ID NO:107、SEQ ID NO:109、SEQID NO:111、SEQ ID NO:113、SEQ ID NO:115、SEQ ID NO:117中给出的任一氨基酸序列具有至少70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%的序列同一性;
(iii)上述(i)或(ii)中给出的任一氨基酸序列的衍生物。
32.构建体,其包含:
(a)编码Lsm蛋白的核酸,其中所述Lsm蛋白的氨基酸序列包含具有下述氨基酸序列的Lsm结构域,所述氨基酸序列以增加的优选顺序与选自SEQ ID No 120、121、122、123、124、125、126、127、128、129和130的序列具有至少50%、60%、70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%的序列同一性;
(b)能够驱动(a)的核酸序列表达的一个或多个调控序列;和任选地
(c)转录终止序列。
33.根据权利要求32的构建体,其中编码Lsm蛋白的所述核酸是根据权利要求30的核酸。
34.根据权利要求32或权利要求33的构建体,其中所述的一个或多个调控序列至少是种子特异性启动子,优选地是稻的WSI18启动子。
35.根据权利要求32至34中任一项所述的构建体用于制备植物的用途,所述的植物相对于对照植物具有增强的产量相关性状,特别是提高的种子产量。
36.用根据权利要求32至34中任一项所述的构建体转化的植物、植物部分或植物细胞。
37.用于产生相对于对照植物具有增强的产量相关性状的转基因植物的方法,所述方法包括:
(a)在植物中导入并表达编码Lsm蛋白的核酸,其中所述的Lsm的氨基酸序列包含具有下述氨基酸序列的Lsm结构域,所述的氨基酸序列以增加的优选顺序与选自SEQ ID No 120、121、122、123、124、125、126、127、128、129和130的序列具有至少50%、60%、70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%的序列同一性;和
(b)在促进植物生长和发育的条件下培养植物细胞。
38.根据权利要求37的方法,其中所述(a)的核酸是根据权利要求30的核酸。
39.相对于对照植物具有提高的产量的转基因植物,所述提高的产量因编码Lsm蛋白的核酸表达增加而产生,其中所述Lsm的氨基酸序列包含具有下述氨基酸序列的Lsm结构域,所述的氨基酸序列以增加的优选顺序与选自SEQ ID No 120、121、122、123、124、125、126、127、128、129和130的序列具有至少50%、60%、70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%的序列同一性;或从所述转基因植物衍生的转基因植物细胞。
40.根据权利要求29、权利要求36或权利要求39中任一项所述的转基因植物,其中所述的植物是作物植物或单子叶植物或谷物植物,如稻、玉米、小麦、大麦、谷子、黑麦、高粱、二粒小麦、斯佩尔脱小麦、黑麦属、单粒小麦、埃塞尔比亚画眉草、买罗高粱和燕麦;或从所述转基因植物衍生的转基因植物细胞。
41.根据权利要求29、36、39或40中任一项所述的植物的可收获部分,其中所述的可收获部分优选地是种子。
42.产品,其衍生自根据权利要求40的植物和/或根据权利要求41的植物的可收获部分。
43.编码Lsm蛋白的核酸在植物中增强产量相关性状的用途,其中所述Lsm蛋白的氨基酸序列包含具有下述氨基酸序列的Lsm结构域,所述的氨基酸序列以增加的优选顺序与选自SEQ ID No 120、121、122、123、124、125、126、127、128、129和130的序列具有至少50%、60%、70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%的序列同一性。
44.根据权利要求43的用途,其中所述增强的产量相关性状是相对于对照植物提高的种子产量和/或增加的生物量。
45.用于在植物中相对于对照植物而言增强产量相关性状的方法,包括调节植物中编码截短的细胞周期蛋白H(CycHTr)多肽的核酸表达,所述的CycHTr多肽能够与CAK结合,但是不能激活CAK。
46.根据权利要求45的方法,其中所述的CycHTr多肽衍生自这样的细胞周期蛋白H,所述的细胞周期蛋白H以增加的优选顺序与SEQ ID NO:173所代表的CycH多肽或与表K中给出的任一氨基酸序列具有至少20%、25%、30%、35%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%或更大的序列同一性;或者其中所述的CycHTr多肽衍生自这样的细胞周期蛋白H,所述的细胞周期蛋白H是表K中给出的氨基酸序列的直向同源物或旁系同源物。
47.根据权利要求45或46的方法,其中编码CycHTr蛋白的所述核酸是表K中所给出核酸SEQ ID NO的任意核酸的一部分,或是能够与表K中所给出核酸SEQ ID NO的任一核酸杂交的序列。
48.根据权利要求45至47中任一项所述的方法,其中所述的CycHTr缺少Hc螺旋结构域、优选地也缺少H5′螺旋结构域,更优选地其中所述CycHTr缺少Hc、H5′和H4′螺旋结构域,最优选地其中所述CycHTr缺少Hc、H5′、H4′和H3′螺旋结构域。
49.根据权利要求45至48中任一项所述的方法,其中所述受调节的表达通过T-DNA活化标签技术、TILLING、位点定向诱变、定向进化或同源重组中的任意一种或多种方法实现。
50.根据权利要求45至48中任一项所述的方法,其中所述受调节的表达通过在植物中导入并表达编码CycHTr蛋白的核酸而实现。
51.根据权利要求45至50中任一项所述的方法,其中所述增强的产量相关性状是相对于对照植物而言提高的产量、优选地增加的生物量和/或提高的种子产量。
52.根据权利要求50或51的方法,其中所述导入的核酸与种子特异性启动子有效连接。
53.根据权利要求45至52中任一项所述的方法,其中编码CycHTr多肽的所述核酸是植物来源的,优选地来自双子叶植物,进一步优选地来自十字花科,更优选地来自拟南芥属,最优选地来自拟南芥。
54.通过根据权利要求45至53中任一项所述的方法能够获得的植物或包括种子在内的其部分,其中所述的植物或其部分包含编码CycHTr多肽的重组核酸。
55.构建体,其包含:
(a)编码权利要求45至48中任一项所定义的CycHTr多肽的核酸;
(b)能够驱动(a)的核酸序列表达的一个或多个调控序列;和任选地
(c)转录终止序列。
56.根据权利要求55的构建体,其中所述调控序列之一是种子特异性启动子。
57.根据权利要求55或56的构建体在用于制备植物的方法中的用途,所述的植物相对于对照植物具有提高的产量、特别地是增加的生物量和/或提高的种子产量。
58.用根据权利要求55或56构建体转化的植物、植物部分或植物细胞。
59.用于产生转基因植物的方法,所述的转基因植物相对于对照植物具有提高的产量,特别是增加的生物量和/或提高的种子产量,所述方法包括:
(i)在植物中导入并表达编码权利要求45至48中任一项所定义的CycHTr多肽的核酸;和
(ii)在促进植物生长和发育的条件下培养植物细胞。
60.转基因植物,其相对于对照植物而言,由于编码权利要求45至48中任一项所定义的CycHTr多肽的核酸表达增加而具有提高的产量、特别地具有增加的生物量和/或提高的种子产量;或者衍生自此种转基因植物的转基因植物细胞。
61.根据权利要求54、58或60的转基因植物,其中所述的植物是作物植物或单子叶植物或谷物植物,如稻、玉米、小麦、大麦、谷子、黑麦、高粱、二粒小麦、斯佩尔脱小麦、黑麦属、单粒小麦、埃塞尔比亚画眉草、买罗高粱和燕麦;或者衍生自此种转基因植物的转基因植物细胞。
62.根据权利要求61的植物的可收获部分,其中所述的可收获部分优选地是种子。
63.产品,其衍生自根据权利要求61的植物和/或根据权利要求62的植物的可收获部分。
64.编码权利要求45至48中任一项所定义的CycHTr多肽的核酸在植物中相对于对照植物提高产量、尤其增加生物量和/或种子产量的用途。
65.用于植物中相对于对照植物而言增强产量相关性状的方法,包括增加植物中编码Remorin多肽的核酸序列表达,所述的Remorin多肽包含(i)羧基端Remorin结构域(对应于Pfam家族登录号PF03763);和(ii)预测的羧基端卷曲螺旋结构域。
66.根据权利要求65的方法,其中所述的Remorin多肽额外地包含以下一项或两项:(i)富含带电荷的氨基酸的羧基端Remorin结构域;和(ii)在所述多肽羧基端处最后10个氨基酸残基内包含的至少一个Cys和/或一个Phe。
67.根据权利要求65或66的方法,其中所述的Remorin多肽包含羧基端Remorin结构域,该羧基端Remorin结构域以增加的优选顺序与SEQID NO:326所代表的羧基端Remorin结构域具有至少15%、20%、25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、98%、99%或更大的序列同一性。
68.根据权利要求65至67中任一项所述的方法,其中所述的Remorin多肽是以增加的优选顺序与SEQ ID NO:199所代表的Remorin多肽具有至少10%、15%、20%、25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、98%、99%或更大序列同一性的多肽。
69.根据权利要求65或66的方法,其中编码Remorin多肽的所述核酸序列由表A中列出的任一核酸序列代表,或是其部分,或是能够与表P中列出的任一核酸序列杂交的序列。
70.根据权利要求65或66的方法,其中所述的核酸序列编码在表P中列出的任一多肽的直向同源物或旁系同源物。
71.根据权利要求65至70中任一项所述的方法,其中所述增加的表达通过T-DNA活化标签技术、TILLING或同源重组中的任意一种或多种方法实现。
72.根据权利要求65至71中任一项所述的方法,其中所述增加的表达通过在植物中导入并表达编码Remorin多肽的核酸序列而实现。
73.根据权利要求65至72中任一项所述的方法,其中所述增强的产量相关性状是提高的产量,优选地是提高的种子产量,最优选地是以下一项或多项:(i)提高的种子充实率;(ii)提高的每株植物种子总产量;(iii)增加的充实种子数;(iv)增加的种子总数;(v)提高的千粒核重(TKW)或(vi)提高的收获指数。
74.根据权利要求72或73的方法,其中所述的核酸序列有效地与组成型启动子连接,优选与以下启动子之一:(i)GOS2启动子;或(ii)高速泳动族B(HMGB)启动子连接。
75.根据权利要求65至74中任一项所述的方法,其中编码Remorin多肽的所述核酸序列是植物来源的,优选地来自双子叶植物,更优选地来自十字花科,最优选地来自拟南芥。
76.根据权利要求65至75中任一项所述的方法,其中所述增强的产量相关性状用在营养限制性条件下生长的植物获得。
77.根据权利要求65至76中任一项所述的方法能够获得的植物或包括种子在内的其部分,其中所述的植物或其部分包含编码Remorin多肽的核酸转基因。
78.构建体,其包含:
(a)编码权利要求65至70中任一项所定义的Remorin多肽的核酸序列;
(b)能够驱动(a)的核酸序列表达的一个或多个调控序列;和任选地
(c)转录终止序列。
79.根据权利要求78的构建体,其中所述的调控序列之一是组成型启动子、优选地是以下启动子之一:(i)GOS2启动子;或(ii)高速泳动族B(HMGB)启动子。
80.根据权利要求78或79的构建体的用途,用于制备具有增强产量相关性状的植物的方法中,所述增强的产量相关性状优选地是相对于对照植物的以下一项或多项:(i)提高的种子充实率;(ii)提高的每株植物种子总产量;(iii)增加的充实种子数;(iv)增加的种子总数;(v)提高的千粒核重(TKW)或(vi)提高的收获指数。
81.用根据权利要求78或79的构建体转化的植物、植物部分或植物细胞。
82.用于产生相对于对照植物具有增强的产量相关性状的转基因植物的方法,包括:
(i)在植物、植物部分或植物细胞中导入并表达编码权利要求65至70中任一项所定义的Remorin多肽的核酸序列;和
(ii)在促进植物生长和发育的条件下培养植物细胞。
83.转基因植物,其相对于对照植物而言,由于编码权利要求65至70中任一项所定义的Remorin多肽的核酸序列表达增加而具有增强的产量相关性状;或者从所述转基因植物衍生的转基因植物细胞或植物部分。
84.根据权利要求77、81或83的转基因植物,其中所述的植物是作物植物或单子叶植物或谷物植物,如稻、玉米、小麦、大麦、谷子、黑麦、小黑麦属、高粱、二粒小麦、斯佩尔脱小麦、黑麦属、单粒小麦、埃塞尔比亚画眉草、买罗高粱和燕麦;或者从所述转基因植物衍生的转基因植物细胞或植物部分。
85.根据权利要求84的植物的可收获部分,其中所述的可收获部分优选地是种子。
86.产品,其从根据权利要求84的植物和/或从根据权利要求85的植物的可收获部分衍生。
87.编码权利要求65至70中任一项所定义的Remorin多肽的核酸序列的用途,用于相对于对照植物而言在植物中增强产量相关性状,优选提高以下一项或多项性状:(i)提高的种子充实率;(ii)提高的每株植物种子总产量;(iii)增加的充实种子数;(iv)增加的种子总数;(v)提高的千粒核重(TKW)或(vi)提高的收获指数。
88.分离的核酸分子,其选自:
(i)由SEQ ID NO:332代表的核酸;
(ii)由SEQ ID NO:332代表的核酸的互补物;
(iii)编码Remorin多肽的核酸,所述的Remorin多肽与由SEQ IDNO:333代表的氨基酸序列以增加的优选顺序具有至少50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或更大的序列同一性,和与SEQ ID NO:334以增加的优选顺序具有至少50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或更大的序列同一性。
89.分离的多肽,其选自:
(i)由SEQ ID NO:333代表的氨基酸序列;
(ii)氨基酸序列,其与由SEQ ID NO:333代表的氨基酸序列以增加的优选顺序具有至少50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或更大的序列同一性,和与SEQ ID NO:334以增加的优选顺序具有至少50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或更大的序列同一性;
(iii)上述(i)或(ii)中给出的任一氨基酸序列的衍生物。
90.用于相对于对照植物而言提高植物中产量的方法,包括在所述植物中降低或基本上消除内源性DREB基因表达和/或DREB蛋白的水平和/或活性。
91.根据权利要求90的方法,其中所述的降低或基本上消除通过RNA介导的基因表达下调实现。
92.根据权利要求91的方法,其中所述的RNA介导的下调通过共抑制实现。
93.根据权利要求91的方法,其中所述的RNA介导的下调通过利用反义DREB核酸序列实现。
94.根据权利要求90的方法,其中所述的降低或基本上消除通过使用DREB基因或其片段的反向重复序列实现。
95.根据权利要求90的方法,其中所述的降低或基本上消除通过使用微RNA实现。
96.根据权利要求90的方法,其中所述的表达降低或基本上消除通过插入诱变实现。
97.根据权利要求90至96中任一项所述的方法,包括将与DREB基因基本上同源的DREB核酸或其片段导入宿主植物。
98.根据权利要求90至97的方法,其中所述的降低或基本上消除以组成型方式优选地通过使用组成型启动子、更优选地通过使用GOS2启动子实现。
99.根据权利要求97的方法,其中所述导入的核酸来自与宿主植物相同的科,更优选地来自相同属,甚至更优选地来自相同物种。
100.根据权利要求97的方法,其中所述导入的DREB核酸序列包含SEQ ID NO:335或其直向同源物或旁系同源物的足够长度的基本上连续的核苷酸并且其中所述的宿主植物是谷类植物,优选地是稻。
101.根据权利要求100的方法,其中所述的核酸编码SEQ ID NO:352、SEQ ID NO:354、SEQ ID NO:356、SEQ ID NO:358、SEQ IDNO:360、SEQ ID NO:362、SEQ ID NO:364、SEQ ID NO:366、SEQID NO:368、SEQ ID NO:370、SEQ ID NO:372、SEQ ID NO:374、SEQ ID NO:376、SEQ ID NO:378、SEQ ID NO:380、SEQ ID NO:382、SEQ ID NO:384、SEQ ID NO:386、SEQ ID NO:388、SEQ IDNO:390、SEQ ID NO:392、SEQ ID NO:394、SEQ ID NO:396、SEQID NO:398、SEQ ID NO:400、SEQ ID NO:402、SEQ ID NO:404、SEQID NO:406、SEQ ID NO:408、SEQ ID NO:410、SEQ ID NO:412、SEQ ID NO:414和SEQ ID NO:416任一序列所代表的蛋白质。
102.根据权利要求100或101的方法,其中所述的核酸是任一SEQID NO:351、SEQ ID NO:353、SEQ ID NO:355、SEQ ID NO:357、SEQ ID NO:359、SEQ ID NO:361、SEQ ID NO:363、SEQ ID NO:365、SEQ ID NO:367、SEQ ID NO:369、SEQ ID NO:371、SEQ IDNO:373、SEQ ID NO:375、SEQ ID NO:377、SEQ ID NO:379、SEQID NO:381、SEQ ID NO:383、SEQ ID NO:385、SEQ ID NO:387、SEQ ID NO:389、SEQ ID NO:391、SEQ ID NO:393、SEQ ID NO:395、SEQ ID NO:397、SEQ ID NO:399、SEQ ID NO:401、SEQ IDNO:403、SEQ ID NO:405、SEQ ID NO:407、SEQ ID NO:409、SEQID NO:411、SEQ ID NO:413和SEQ ID NO:415所代表的核酸。
103.根据权利要求90至102中任一项所述的方法,其中所述提高的产量是提高的种子产量和/或每株植物增加的花序数和/或提高的早期籽苗生长势。
104.根据权利要求90至103中任一项所述的方法,其中所述提高的种子产量选自以下一项或多项:a)增加的种子生物量(种子重量);b)每株植物增加的花数目;和c)提高的(充实)种子数。
105.植物或其部分,其能够通过根据权利要求90至104中任一项所述的方法获得。
106.构建体,其包含:
(a)DREB基因或其片段的反向重复序列;
(b)能够驱动(a)的核酸序列表达的一个或多个调控序列;和任选地
(c)转录终止序列。
107.用于产生相对于对照植物具有提高的种子产量的转基因植物的方法,所述方法包括:
(i)在植物细胞中导入根据权利要求106的构建体;和
(ii)在促进植物生长和发育的条件下培育植物、植物部分或植物细胞。
108.DREB核酸用于降低或基本上消除植物中内源性DREB基因表达以相对于对照植物而言提高植物中产量的用途。
109.根据权利要求108的用途,其中所述提高的产量是提高的种子产量和/或增加的花序数和/或提高的早期籽苗生长势。
110.根据权利要求109的用途,其中所述提高的种子产量选自以下一项或多项:a)增加的种子生物量(种子重量);b)每株植物增加的花数目;和c)提高的(充实)种子数。
111.根据权利要求108至110中任一项所述的用途,其中所述的产量提高在轻度胁迫条件下发生。
Applications Claiming Priority (21)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EP07101533.3 | 2007-01-31 | ||
EP07101533 | 2007-01-31 | ||
US89127107P | 2007-02-23 | 2007-02-23 | |
US60/891,271 | 2007-02-23 | ||
EP07103194 | 2007-02-28 | ||
EP07103194.2 | 2007-02-28 | ||
EP07104172.7 | 2007-03-14 | ||
EP07104172 | 2007-03-14 | ||
EP07104194.1 | 2007-03-15 | ||
EP07104242.8 | 2007-03-15 | ||
EP07104242 | 2007-03-15 | ||
EP07104194 | 2007-03-15 | ||
US89605907P | 2007-03-21 | 2007-03-21 | |
US60/896,059 | 2007-03-21 | ||
US91087407P | 2007-04-10 | 2007-04-10 | |
US60/910,874 | 2007-04-10 | ||
US91108907P | 2007-04-11 | 2007-04-11 | |
US60/911,089 | 2007-04-11 | ||
US91128907P | 2007-04-12 | 2007-04-12 | |
US60/911,289 | 2007-04-12 | ||
PCT/EP2008/051225 WO2008092935A2 (en) | 2007-01-31 | 2008-01-31 | Plants having enhanced yield-related traits and/or increased abiotic stress resistance, and a method for making the same |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201310090605XA Division CN103233037A (zh) | 2007-01-31 | 2008-01-31 | 具有增强的产量相关性状和/或提高的非生物胁迫抗性的植物和制备该植物的方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN101605902A true CN101605902A (zh) | 2009-12-16 |
CN101605902B CN101605902B (zh) | 2013-04-17 |
Family
ID=38134617
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN2008800037051A Expired - Fee Related CN101605902B (zh) | 2007-01-31 | 2008-01-31 | 具有增强的产量相关性状和/或提高的非生物胁迫抗性的植物和制备该植物的方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN101605902B (zh) |
Cited By (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101984059A (zh) * | 2010-07-28 | 2011-03-09 | 曲延英 | 一种海岛棉dreb转录因子基因及其应用 |
CN103421801A (zh) * | 2012-05-22 | 2013-12-04 | 中国科学院上海生命科学研究院 | 一种调控稻类结实率的基因及其应用 |
CN103805612A (zh) * | 2014-02-08 | 2014-05-21 | 南京农业大学 | 一种水稻基因OsRem1及其应用 |
CN104031937A (zh) * | 2014-04-28 | 2014-09-10 | 中国农业大学 | 谷子SiREM6基因在提高植物抗盐性的应用 |
CN104178509A (zh) * | 2013-05-27 | 2014-12-03 | 中国科学院遗传与发育生物学研究所 | 蛋白质GmDREB2AL及其相关生物材料在调控种子植物油脂和千粒重中的应用 |
CN104379747A (zh) * | 2012-06-22 | 2015-02-25 | 巴斯夫植物科学有限公司 | 具有增强的产量相关性状的植物和用于制备该植物的方法 |
CN110066809A (zh) * | 2019-03-17 | 2019-07-30 | 长江大学 | Lr2基因调控水稻茎厚、抗折力及其在抗倒伏中的应用 |
CN113337531A (zh) * | 2021-05-26 | 2021-09-03 | 谢文军 | 一组稳定高效表达活性融合蛋白的Gateway真核表达系统 |
CN114276425A (zh) * | 2021-03-10 | 2022-04-05 | 中国农业科学院作物科学研究所 | OsDREB1C及其编码基因在提高水稻光合效率中的应用 |
CN114349835A (zh) * | 2022-01-07 | 2022-04-15 | 河北农业大学 | GhREM蛋白及其编码基因在调控棉花抗蚜性能中的应用 |
CN114656540A (zh) * | 2020-12-23 | 2022-06-24 | 中国农业大学 | 蛋白质cyca3-1在提高玉米抗盐碱性中的应用 |
CN115028717A (zh) * | 2022-06-24 | 2022-09-09 | 山东省农业科学院作物研究所 | 一种识别小麦内源性dreb4蛋白的多克隆抗体的制备方法 |
CN115725582A (zh) * | 2022-10-31 | 2023-03-03 | 湖南农业大学 | 一种启动子及其应用 |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2005094562A1 (en) * | 2004-04-02 | 2005-10-13 | Cropdesign N.V. | Plants having improved growth characteristics and method for making the same |
-
2008
- 2008-01-31 CN CN2008800037051A patent/CN101605902B/zh not_active Expired - Fee Related
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2005094562A1 (en) * | 2004-04-02 | 2005-10-13 | Cropdesign N.V. | Plants having improved growth characteristics and method for making the same |
Non-Patent Citations (3)
Title |
---|
AIWU DONG ET AL.: "Regulation of biosynthesis and intracellular localization of rice and tobacco homologues of nucleosome assembly protein 1", 《PLANTA》 * |
MICHAEL J DEEKS ET AL.: "Arabidopsis NAP1 Is Essential for Arp2/3-Dependent Trichome Morphogenesis", 《CURRENT BIOLOGY》 * |
STEPHANIE GLANZ ET AL.: "A nucleosome assembly protein-like polypeptide binds to chloroplast group II intron RNA in Chlamydomonas reinhardtii", 《NUCLEIC ACIDS RESEARCH》 * |
Cited By (19)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101984059A (zh) * | 2010-07-28 | 2011-03-09 | 曲延英 | 一种海岛棉dreb转录因子基因及其应用 |
CN103421801A (zh) * | 2012-05-22 | 2013-12-04 | 中国科学院上海生命科学研究院 | 一种调控稻类结实率的基因及其应用 |
CN103421801B (zh) * | 2012-05-22 | 2016-05-25 | 中国科学院上海生命科学研究院 | 一种调控稻类结实率的基因及其应用 |
CN104379747A (zh) * | 2012-06-22 | 2015-02-25 | 巴斯夫植物科学有限公司 | 具有增强的产量相关性状的植物和用于制备该植物的方法 |
CN104178509A (zh) * | 2013-05-27 | 2014-12-03 | 中国科学院遗传与发育生物学研究所 | 蛋白质GmDREB2AL及其相关生物材料在调控种子植物油脂和千粒重中的应用 |
CN104178509B (zh) * | 2013-05-27 | 2016-12-28 | 中国科学院遗传与发育生物学研究所 | 蛋白质GmDREB2AL及其相关生物材料在调控种子植物油脂和千粒重中的应用 |
CN103805612A (zh) * | 2014-02-08 | 2014-05-21 | 南京农业大学 | 一种水稻基因OsRem1及其应用 |
CN104031937A (zh) * | 2014-04-28 | 2014-09-10 | 中国农业大学 | 谷子SiREM6基因在提高植物抗盐性的应用 |
CN110066809A (zh) * | 2019-03-17 | 2019-07-30 | 长江大学 | Lr2基因调控水稻茎厚、抗折力及其在抗倒伏中的应用 |
CN110066809B (zh) * | 2019-03-17 | 2021-05-25 | 长江大学 | Lr2基因调控水稻茎厚、抗折力及其在抗倒伏中的应用 |
CN114656540A (zh) * | 2020-12-23 | 2022-06-24 | 中国农业大学 | 蛋白质cyca3-1在提高玉米抗盐碱性中的应用 |
CN114656540B (zh) * | 2020-12-23 | 2023-03-28 | 中国农业大学 | 蛋白质cyca3-1在提高玉米抗盐碱性中的应用 |
CN114276425A (zh) * | 2021-03-10 | 2022-04-05 | 中国农业科学院作物科学研究所 | OsDREB1C及其编码基因在提高水稻光合效率中的应用 |
CN114276425B (zh) * | 2021-03-10 | 2023-01-17 | 中国农业科学院作物科学研究所 | OsDREB1C及其编码基因在提高水稻光合效率中的应用 |
CN113337531A (zh) * | 2021-05-26 | 2021-09-03 | 谢文军 | 一组稳定高效表达活性融合蛋白的Gateway真核表达系统 |
CN114349835A (zh) * | 2022-01-07 | 2022-04-15 | 河北农业大学 | GhREM蛋白及其编码基因在调控棉花抗蚜性能中的应用 |
CN114349835B (zh) * | 2022-01-07 | 2023-10-10 | 河北农业大学 | GhREM蛋白及其编码基因在调控棉花抗蚜性能中的应用 |
CN115028717A (zh) * | 2022-06-24 | 2022-09-09 | 山东省农业科学院作物研究所 | 一种识别小麦内源性dreb4蛋白的多克隆抗体的制备方法 |
CN115725582A (zh) * | 2022-10-31 | 2023-03-03 | 湖南农业大学 | 一种启动子及其应用 |
Also Published As
Publication number | Publication date |
---|---|
CN101605902B (zh) | 2013-04-17 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN101495640B (zh) | 具有增强的产量相关性状的伸展蛋白受体样激酶受调节表达的植物和用于产生该植物的方法 | |
CN101365786B (zh) | 具有改良的生长特征的植物及其生产方法 | |
CN101842489B (zh) | 具有增强的产量相关性状的植物和用于制备该植物的方法 | |
KR101662483B1 (ko) | 향상된 수확량 관련 형질을 갖는 식물 및 이의 제조 방법 | |
KR101105330B1 (ko) | Nac 전사인자의 발현 조절로 향상된 수확량 관련 형질을갖는 식물 및 이의 제조 방법 | |
CN101415829B (zh) | 具有增强的产量相关性状的植物和用于产生该植物的方法 | |
CN101605902A (zh) | 具有增强的产量相关性状和/或提高的非生物胁迫抗性的植物和制备该植物的方法 | |
CN102027120A (zh) | 具有增强的产量相关性状的植物和用于制备该植物的方法 | |
KR101754083B1 (ko) | 향상된 수확량 관련 형질을 갖는 식물 및 이의 제조 방법 | |
CN101883783A (zh) | 具有增强的产量相关性状的植物及其制备方法 | |
CN101952441B (zh) | 具有增强的产量相关性状的植物及其制备方法 | |
KR20120126061A (ko) | 향상된 수확량 관련 형질을 갖는 식물 및 이의 제조 방법 | |
CN101583720A (zh) | 具有增强的产量相关性状的植物和用于产生该植物的方法 | |
CN101868544A (zh) | 具有提高的产量相关性状的植物和用于制备该植物的方法 | |
BRPI0718977A2 (pt) | Método para aumentar rendimento de sementes em plantas em relação às plantas de controle, construção, uso da mesma, planta, parte de planta ou célula de planta, método para a produção de uma planta transgênica tendo redimento aumentado de sementes em relação às plantas de controle, planta transgênica, partes colhíveis de uma planta, produtos, e, uso de um ácido nucleico | |
CN101688214A (zh) | 具有增强的产量相关性状的植物和用于产生该植物的方法 | |
CN101351556B (zh) | 具有改良生长特性的植物及其制备方法 | |
KR20120034588A (ko) | 향상된 수확량 관련 형질을 갖는 식물 및 이의 제조 방법 | |
CN103233037A (zh) | 具有增强的产量相关性状和/或提高的非生物胁迫抗性的植物和制备该植物的方法 | |
KR101429469B1 (ko) | 향상된 수확량 관련 형질을 갖는 식물 및 이의 제조 방법 | |
CN101563461A (zh) | 具有改良特征的植物及其制备方法 | |
CN101969759A (zh) | 具有增强的产量相关性状的植物及其制备方法 | |
CN101778942A (zh) | 产率相关性状增强的植物及制备其的方法 | |
CN101595222B (zh) | 具有改良的种子产量相关性状的植物及其制备方法 | |
CN101668859A (zh) | 具有增强的产量相关性状的植物及其制备方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20130417 Termination date: 20150131 |
|
EXPY | Termination of patent right or utility model |