CN1989249A

CN1989249A - 生产改变含油量的植物

Info

Publication number: CN1989249A
Application number: CNA2005800173245A
Authority: CN
Inventors: 约翰·戴维斯; 桑德拉·彼得斯; 海因·措恩格·额
Original assignee: Agrinomics LLC
Current assignee: Agrinomics LLC
Priority date: 2004-05-28
Filing date: 2005-05-26
Publication date: 2007-06-27
Also published as: WO2005118821A2; US7745695B2; WO2005118821A3; CA2568017C; US20090162526A1; MXPA06013906A; WO2005118821A9; AR049131A1; ZA200610792B; CA2568017A1; BRPI0511649A

Abstract

本发明涉及由于HIO1005核酸的改变的表达，而显示改变的含油量表型的植物。本发明更进一步涉及生产具有改变的含油量表型的植物的方法。

Description

生产改变含油量的植物

相关申请

本申请要求2004年5月28日提交的美国临时专利申请60/575,561的优先权，其内容全部引入作为参考。

发明背景

操纵农作物种子的组成，尤其是种子油类的含量和组成的能力在涉及加工食品油类以及动物饲养油类的农业工业中具有重要的应用价值。农作物的种子含有多种有价值的组分，包括油类，蛋白以及淀粉。工业生产过程可以分离若干或所有这些组分用于专门应用的单独销售。例如，几乎60％的美国大豆农作物通过大豆加工工业进行压榨。大豆加工产生高价销售的精炼油，而残余物主要作为低价值的饲料销售(US Soybean Board，2001 Soy Stats)。加拿大油菜(canola)种子被压榨产生油类以及副产品加拿大油菜粗粉(加拿大加拿大油菜协会)。几乎20％的1999/2000年的美国玉米农作物经过工业化精炼，主要用于产生淀粉，乙醇以及油类(玉米精炼业者协会)。因此，常常需要使种子的含油量最大化。例如，对于诸如大豆以及加拿大油菜的加工含油种子而言，提高种子的绝对含油量将提高这种谷物的价值。对于加工的玉米而言，可能需要根据其它主要组分的应用提高或者降低含油量。降低油类可以通过降低与油类氧化相关的不希望的味道改善分离的淀粉的质量。或者，在味道并不重要的乙醇产生中，提高含油量可以提高总的价值。在许多谷物饲料中，诸如玉米以及小麦，可能希望提高植物含油量，因为油类比诸如碳水化合物的其它种子组分具有较高的能含量。含油种子加工，就像大多数谷物加工业一样是资金密集型产业；因此产品从低值组分到高价值油类组分的产品分布的较小改变可能对于谷物加工者而言就具有显著的经济影响。

油类的生物技术处理可以提供组成的改变以及油产量的改进。组成的改变尤其包括高油酸的大豆以及玉米油(美国专利6,229,033以及6,248,939)，以及含有月桂酸酯的种子(美国专利5,639,790)等。组成改变的工作主要集中在加工的含油种子但是已经可以很容易地延伸至非-含油种子农作物包括玉米。虽然对提高含油量具有相当的兴趣，在这一领域目前唯一可行的生物技术是高油类玉米(HOC)技术(杜邦，美国专利5,704,160)。HOC利用通过标准的选择育种连同生产系统中称为顶交(TopCross)的优良品种(不孕雄性)杂交雌性得到的高油类授粉者。顶交高油类系统使玉米收获的谷物含油量从～3.5％提高到～7％，改善了谷物的能含量。

虽然HOC生产系统已经卓有成效，但是其仍然具有固有的局限性。首先，担负全部的土地的种子栽植的低授粉者百分比的系统含有固有风险，尤其是在旱年。第二，当前HOC领域含油量已经平稳在大约9％的油类。最后，高油类玉米主要不是生物化学变化，而是对于提高含油量产生间接结果的解剖学上的突变体(提高胚芽尺寸)。为此，可选择的高油类策略，尤其是来源于改变生化产量的高油类策略将是非常重要的。

操作油市场最明显的目标农作物是大豆以及油菜籽，并且大量商业工作(例如美国专利5,952,544；PCT申请WO9411516)证明拟南芥是这些农作物中油类代谢的优良模型。种子油组合物的生物化学筛选已经鉴定了拟南芥的许多关键生物合成酶基因并且导致农业上重要基因的直向同源物被鉴定出来。例如，利用化学诱变处理群的筛选已经鉴定了其种子显示脂肪酸成份改变的脂类突变体(Lemieux B等1990，James以及Dooner，1990)。检测脂肪酸成份改变的T-DNA诱变筛选(Feldmann等1989)鉴定了ω3脱氢酶(FAD3)以及δ-12脱氢酶(FAD2)基因(美国专利5952544；Yadav等，1993；Okuley等，1994)。集中在含油量而非油类质量的筛选分析化学上诱导的皱缩种子或籽粒密度改变的突变体，据此推断出改变的植物含油量(Focks以及Benning，1998)。用来鉴定参与非常长链脂肪酸产生的酶的另一种筛选鉴定了编码负责降低种子中三酰甘油聚集的甘油二酯酰基转移酶(DGAT)的基因的突变(Katavic V等，1995)。此外，还显示DGAT cDNA的种子特异性过表达与提高的植物含油量有关(Jako等，2001)。

植物中的激活标签法是一种通过插入包含调节序列(例如，增强子)的异源核酸构建体到植物基因组中而产生随机突变的方法。调节序列可起到增强一个或多个天然植物基因转录的作用；因此，激活标签法是一种用于产生功能获得(gain-of-function)，通常是显性突变体的有效方法(参见，例如，Hayashi等，1992；Weigel D等，2000)。插入的构建体提供了一种分子标签，其用于快速鉴定由于其错表达引起突变表型的天然植物。激活标签法同时可导致功能丧失的表型。插入可导致天然植物基因的破坏，在该情况中表型通常是隐性的。

激活标签法已经被用于多种物种，包括烟草和拟南芥，来鉴定各种突变表型和与这些表型相关的基因(Wilson，等，1996，Schaffer等，1998，Fridborg等，1999；Kardailsky等，1999；Christensen S等，1998)。

发明概述

本发明提供了具有高油类含量表型的转基因植物。转基因植物包括含有编码或互补于编码HIO1005多肽的核苷酸序列的转化载体。在优选的实施方案中，转基因植物选自油菜籽，大豆，玉米，向日葵，棉花，可可，红花，油棕，椰子，亚麻，蓖麻以及花生。本发明还提供了产生油类的方法，包括培育转基因植物以及从所述植物回收油类。

本发明还提供了具有高油表型的转基因植物细胞。所述转基因植物细胞包括含有编码或者互补于编码高油(下文称作“HIO1005”)多肽的序列的核苷酸序列的转化载体。在优选的实施方案中，该转基因植物细胞选自油菜籽，大豆，玉米，向日葵，棉花，可可，红花，油棕，椰子，亚麻，蓖麻以及花生。在其它实施方案中，所述植物细胞为种子，花粉，繁殖体或者胚芽细胞。本发明进一步提供了含有编码HIO1005多肽的核酸序列的饲料，粗粉，谷物，食品或者种子。

本发明的转基因植物通过包括向植物的祖细胞导入含有编码或互补于编码HIO1005多肽的序列的核苷酸序列的植物转化载体，以及培育转化的祖细胞产生转基因植物的方法产生，其中的HIO1005多核苷酸序列的表达产生高油类含量表型。

本发明还提供了超过约10,000，更优选约20,000，甚至优选约40,000粒种子的容器，其中超过约10％，更优选约25％，更优选约50％，甚至更优选约75％或者更优选约90％的种子为来源于本发明的植物的种子。本发明还提供了从所述转基因植物获得的植物细胞。

本发明还提供了超过约10kg，更优选约25kg，甚至更优选约50kg种子的容器，其中超过约10％，更优选约25％，更优选约50％，甚至更优选约75％或者更优选约90％的种子为来源于本发明的植物的种子。

本发明的任一植物或其部分可以被加工产生饲料，粗粉或者油制剂。用于该目的的尤其优选的植物部分为种子。在优选的实施方案中，饲料，粗粉或者油制剂被设计用于反刍动物。生产饲料，粗粉和油制剂的方法是本领域公知的。例如，参见美国专利4,957,748；5,100,679；5,219,596；5,936,069；6,005,076；6,146,669；以及6,156,227。本发明的粗粉可以与其他的粗粉混合。在优选的实施方案中，产自本发明的植物或者由本发明的方法产生的粗粉构成任一产品的粗粉组分的超过约0.5％，约1％，约5％，约10％，约25％，约50％，约75％或约90％体积或者重量。在另一实施方案中，可以混合粗粉制剂并可以构成混合物超过约10％，约25％，约35％，约50％或约75％的体积。

发明详述

定义

除非另有陈述，这里使用的全部技术以及科学术语具有与本领域技术人员知晓的相同的含义。专业人员尤其参考Sambrook等，1989，以及Ausubel FM等，1993的定义以及术语。应该理解本发明不限于所描述的特定方法，流程以及试剂，因为这些可以改变。

此处所述的术语“载体”是指设计用于在不同宿主细胞之间转移的核酸构建体。“表达载体”是指可以在异源细胞中整合并表达异源DNA片段的载体。许多原核以及真核生物表达载体是可以市售获得的。选择合适的表达载体是本领域述人员所熟知的。

“异源的”核酸构建体或序列具有一部分序列不是植物细胞的野生型序列但是在其中表达。异源的控制序列是指不天然调节目前正在调节的相同基因表达的控制序列(即启动子或增强子)。通常，异源核酸序列不是它们所存在于的细胞或者基因组的一部分所内源产生的，但是已经通过传染，转染，显微注射，电穿孔法等添加到细胞中。“异源的”核酸构建体可以含有控制序列/DNA编码序列组合，其与野生型植物中发现的控制序列/DNA编码序列组合相同或者不同。

此处所述的术语“基因”是指参与多肽链产生的DNA片段，其可能包括或者不包括编码区之前以及之后的区域，例如5′非翻译区(5′UTR)或者“前导”序列以及3′UTR或者“尾部”序列以及单独的编码片段(外显子)以及非-转录调节序列之间的内含子序列(内含子)。

这里使用的“重组体”包括已经通过导入异源的核酸序列进行修饰的细胞或者载体，或者所述细胞来源于如此修饰的细胞。因此，例如，重组细胞表达在天然(非-重组体)形式的细胞内没有发现相同形式的基因或者表达在人为干预下完全表达或者完全不表达的异常表达的天然基因。

此处所述的术语“基因表达”是指基于基因的核酸序列产生的多肽的过程。所述过程包括转录以及翻译；因此“表达”可以是针对多核苷酸或者多肽序列或者两者。有时，多核苷酸序列的表达不会引起蛋白翻译。“过表达”是指相对于其在野生型(或者其它的参考[例如，非-转基因])植物中的表达，多核苷酸和/或多肽序列表达增加并且可能涉及自然存在或者非-自然存在的序列。“异位表达”是指在未-改变或者野生型植物中不自然发生的，在某时，某地和/或提高水平的表达。“下调表达”是指多核苷酸和/或多肽序列，通常是内源性基因相对于其在野生型植物中表达的降低表达。术语“错误表达”以及“改变表达”包括过表达，下调表达以及异位表达。

在将核酸序列插入细胞的概念中，术语“引入的”是指“转染”，或者“转化”或者“转导”，并且包括核酸序列整合到真核或者原核细胞中，其中核酸序列可以整合入细胞的基因组(例如染色体，质粒，质体或者线粒体DNA)，转化为自主复制子，或者瞬间表达(例如，转染的mRNA)。

本文使用的“植物细胞”是指来源于植物的任意细胞，包括来自未分化的组织(例如愈伤组织)以及植物种子，花粉，繁殖体(progagules)以及胚的细胞。

此处所述的术语“天然的”以及“野生型”相对于给定植物性状或者表型是指具有在相同种类的植物本身发现的特征或者表型的形式。

此处所述的术语关于植物特性的“修饰”是指转基因植物相对于类似的非-转基因植物的表型的改变。对于转基因植物的“目的表型(性状)”，指通过T1和/或后代植物证明的可观察到的或可测量的表型，相应的非转基因植物不显示该表型(也即，在相似条件下培养或分析的基因型类似的植物)。目的表型可表示对植物的改良，或可提供一种在其他植物中产生改良的方法。“改良”是一种通过给植物提供独特的和/或新的品质，而增强植物物种或品种的实用性的特征。“改变含油量表型”指遗传修饰植物的可测量表型，其中与类似的，但是非修饰的植物相比，该植物显示统计上显著增加或减少的总体含油量(即，油类占种子质量的百分比)。高油表型指总体含油量增加。

本文使用的“突变体”多核苷酸序列或者基因与相应的野生型多核苷酸序列或者基因在序列或者表达上不同，其中的差异导致修饰的植物的表型或者性状。相对于植物或植物株系，术语“突变体”是指植物或者株系具有修饰的植物表型或性状，其中修饰的表型或性状与野生型多核苷酸序列或基因的修饰表达有关。

此处所述的术语“T1”是指来自T0植物的种子的植物子代。T1子代是可通过应用选择性试剂筛选的第一系列转化的植物，所述的选择性试剂为例如抗生素或除草剂，由此转基因植物含有相应的抗性基因。术语“T2”是指通过T1植物的花进行自体受精产生的植物子代，所述T1植物之前被筛选作为转基因植物。T3植物是由T2植物等产生的。这里所述的特定植物的“直系子代”来源于所述植物的种子(或者，有时来自其它的组织)且是紧随的子代；例如，对于特定的家系而言，T2植物是T1植物的直系子代。特定植物的“间接子代”来源于所述植物直系子代的种子(或其它组织)，或来自该家系随后子代的种子(或其它组织)；例如，T3植物是T1植物的间接子代。

此处所述的术语“植物部分”包括任意的植物器官或组织，包括，但不限于种子，胚，分生组织区域，愈伤组织，叶，根，芽，配子体，孢子体，花粉和小孢子。植物细胞可获自任意的植物器官或组织以及由其制备的培养物。可用于本发明方法的植物种类通常是广泛的，其可以是可用于转化技术的高等植物，包括单子叶的和双子叶的植物。

在这里所述的“转基因植物”包括在其基因组内含有异源多核苷酸的植物。异源的多核苷酸可以稳定地整合到基因组中，或可以被插入到染色体外。优选地，本发明的多核苷酸被稳定地整合到基因组中从而使多核苷酸被连续传代。植物细胞，组织，器官或已被导入异源多核苷酸的植物被认为是“转化的”，“转染的”或“转基因的”植物。也含有该异源多核苷酸的转化植物或植物细胞的直系和间接子代也被视为是转基因的。

可以利用将所需的编码所需蛋白的聚核苷酸序列导入植物细胞的多种方法，并且这些方法对本领域技术人员也是公知的，包括但不限于：(1)诸如微注射，电穿孔和微粒介导的递送(粒子枪(biolistic)或基因枪技术)；(2)病毒介导的递送技术；以及(3)农杆菌介导的转化方法。

最常使用的转化植物细胞的方法是农杆菌介导的DNA转化方法和粒子枪或微粒轰击介导的方法(即，基因枪)。通常，核转化是所希望的，但是当需要用于特异性转化质粒，诸如叶绿体或者造粉体时，可以利用微粒介导递送所需的多核苷酸转化植物质粒。

农杆菌介导的转化通过使用基因工程化的属于农杆菌属的土壤细菌实现。具有Ti或Ri质粒的根癌农杆菌(Agrobacterium tumefaciens)以及发根农杆菌(Agrobacterium Rhizogenes)的大量野生型以及卸甲(disarmed)株可用于向植物进行基因转化。通过将可被基因工程化携带任一所需DNA片段的称作“T-DNA”的特异性DNA转化到很多品种的植物内进行基因转化。

农杆菌介导的植物的遗传转化包括若干步骤。第一步，首先将毒性的农杆菌和植物细胞彼此接触，通常这一步称作“接种”。接种后，使农杆菌和植物细胞/组织在一起培养几小时到几天的时间或者更长时间，培养条件适于生长和T-DNA的转化。这一步称作“共培养”。共培养和T-DNA递送以后，用杀细菌或者制菌剂处理植物细胞灭杀与外植体接触或者保留在含有外植体分容器中的农杆菌。如果在缺乏任一选择剂促进转基因植物细胞相比非转基因植物细胞的优先生长的条件下进行，通常这一步称作“延迟”步骤。如果在存在选择性好压转基因植物细胞的条件下进行，这一步称作“选择”步骤。在使用“延迟”步骤时，通常紧接着一个或者多个“选择步骤”。

对于微粒轰击(美国专利5,550,318(Adams等)；美国专利5,538,880(Lundquist等)，美国专利5,610,042(Chang等)；以及PCT公开WO95/06128(Admas等)；每一个都在此处具体引入作为参考)而言，粒子涂覆有核酸并通过推进力递送到细胞中。示范性的粒子包括钨，铂，并优选金。

通过加速将DNA递送到植物细胞中的方法的示范性实施方案为粒子枪粒子递送系统(Biolistics Particle Delivery System)(BioRad，Hercule，CA)，该系统可被用于将通过筛子，诸如不锈钢或者Nytex筛子涂覆DNA或者细胞的粒子推进到用悬浮培养的单子叶植物细胞覆盖的过滤器表面上。

微粒轰击技术是广泛应用的技术，并且可几乎被用于转化任一的植物品种。已通过微粒轰击转化的植物品种的实例包括单子叶植物品种，诸如玉米(国际公开WO95/06128)(Adams等)，大麦，小麦(美国专利5,563,055(Townsend等)，在此处全文引入作为参考)，大米，燕麦，黑麦(rye)，甘蔗以及高粱；以及大量包括烟草，大豆的双子叶植物(美国专利5,322,783(Tomes等)，在此处全文引入作为参考)，向日葵，花生，棉花，番茄以及豆类(美国专利5,563,055(Townsend等)在此处全文引入作为参考)。

为了不考虑转化方法对转化的植物细胞进行选择或者记分，导入细胞中的DNA含有在可再生的植物组织中发挥产生对植物组织赋予对其他毒性化合物抗性的化合物的基因。用作可选择的，可筛选的或者可记分的标记的目的基因包括但不限于GUS，绿色荧光蛋白(GFP)，荧光酶(LUX)，抗生素或者除草剂耐受基因。抗生素抗性基因的实例包括青霉素，卡那霉素(以及新霉素，G418，博来霉素)；氨甲蝶呤(以及三甲氧苄二氨嘧啶)；氯霉素；卡那霉素以及四环素。编码参与除草剂耐受的蛋白的多核苷酸分子是本领域公知的，包括但不限于美国专利5,627,061(Barry等)，美国专利5,633,435(Barry等)，以及美国专利6,040,497(Spencer等)记载的编码5-烯醇丙酮基莽草酸盐-3-磷酸盐合成酶(EPSPS)以及美国专利5,094,945(Comai)描述的用于耐受glyphosate的aroA；描述于美国专利4,810,648(Duerrschnabel等)用于耐受溴苯腈(bromoxynil)的编码溴苯腈水解酶(Nitrilase)(Bxn)的多核苷酸分子；描述于Misawa et al，(1993)Plant J.4：833-840 and Misawaet al，(1994)Plant J.6：481-489用于耐受哒草伏(norflurazon)的编码八氢番茄红素脱氢酶(crtI)的多核苷酸分子；描述于Sathasiivan等，(1990)Nucl.Acids Res.18：2188-2193a用于耐受磺酰脲类除草剂的编码乙酰羟基酸合成酶(AHAS，aka ALS)的多核苷酸分子；以及描述于DeBlock，etal.(1987)EMBO J.6：2513-2519用于耐受草铵膦(Glufosinate)和双丙氨膦(bialaphos)的bar基因。

从多种转化的外植体再生，发育和培育植物是本领域公知的。这种再生和生长过程通常包括选择转化的细胞以及通过常规的胚芽发育到生根的小苗发育阶段培育这些单独的细胞的阶段。类似地再生转基因胚芽和种子。然后将所产生的转基因生根的小苗种植在合适的植物生长介质，诸如土壤中。暴露选择性试剂单存活下来的细胞，或者在筛选分析中记分为阳性的细胞可以培养在支持植物体再生的培养基中。将发育中的小苗转移到土壤较少的植物生长混合物中，并在转移到温室或者用于成熟的生长室之前使(幼苗)受冷而变得耐寒。

本发明可以与转化的细胞或者组织一起使用。本文中所使用的“可转化的”是指能够进一步繁殖产生植物体的细胞或者组织。本领域技术人员认识到大量插入外源DNA的植物细胞或者组织是可以转化的，并且在合适的培养条件下，该植物细胞或者组织可以形成分化的植物。

适于这些目的的组织可以包括但不限于未成熟的胚芽，小组织，悬浮细胞培养物，未成熟的花序，茎分生组织，结外植体，愈伤组织，下胚轴组织，子叶，根和叶。

可以使用任一合适的培养基。合适的培养基的实例包括但不限于基于MS-的培养基(Murashige and Skoog，Physiol.Plant，15：473-497，1962)或填充有包括但不限于植物激素，细胞分裂素，ABA和赤霉素的其他植物生长调节剂的基于N6-的培养基(Chu等，Scientia Sinica 18：659，1975)。本领域技术人员熟知多种组织培养基，其当进行适当补充时可以支持植物组织生长和发育并适于植物转化和再生。这些组织培养基可以作为市售制剂，或者用户制备以及改进的试剂出售。本领域技术人员可以认识到用于转化和再生的诸如营养剂和生长调节剂的培养基和培养基补充剂以及其他培养条件，诸如培养期间的光密度，pH，可被优化用于特定的多种目的的培养温度。

本领域技术人员将认识到将表达盒稳定整合到转基因植物并证实可以操作后，可以通过有性杂交导入其他的植物体内。取决于所杂交的品种，可以使用大量标准的繁殖技术。

具有改变的含油量表型的植物的鉴定

我们使用拟南芥激活标签筛选来鉴定我们已经鉴定并命名为“HIO1005”(At5g02290；GI#30679585，GI#30679589)分别编码蛋白激酶蛋白(GI#15241749，30679590)的基因与改变的含油量表型(具体地，高油表型)之间的关联。简要地，而且如实施例中进一步描述的，用pSKI015载体对许多拟南芥植物进行了突变，所述载体包含来自根癌农杆菌Ti质粒的T-DNA，病毒增强子元件和选择标记基因(Weigel等，2000)。当T-DNA插入到转化植物的基因组中时，增强子元件可导致附近基因的上调，通常在增强子的大约10千碱基(kb)内。为了特异性回收表达选择性标记并因此具有T-DNA插入序列的转化植物，把T1植物暴露于选择剂。从这些转化的T1植物收集大约15-20颗T2种子，并从全种子提取脂类。进行气相色谱(GC)分析，以测定种子样本的脂肪酸含量和组成。

对显示高油表型的拟南芥系进行了鉴定。通过分析所鉴定的品系中侧翼T-DNA插入片段基因组DNA序列发现了HIO1005基因与高油表型之间的关联。因此，HIO1005基因和/或多肽可用于开发具有修饰的含油量表型(“HIO1005表型”)的基因修饰的植物。HIO1005基因可用于产生含油种子作物，其从含油种子加工提供提高的产油量，以及用于生产能提供能量增加的饲料谷物作物用于动物饲养。HIO1005基因可进一步用于增加特种油料作物的含油量，以便增加所需稀有脂肪酸的产量。已经进行遗传修饰表达HIO1005的转基因植物可用于生产油，其中利用标准方法培养转基因植物，并从植物部分(例如，种子)获得油。

HIO1005核酶和多肽

拟南芥HIO1005核酸序列提供于SEQ ID NO：1以及Genbank登录号GI#30679585。对应的蛋白序列提供于SEQ ID NO：3以及GI#15241749中。还鉴定了一种假定的变体(SEQ ID NO：2)，其编码与SEQ ID NO：3具有100％同一性的蛋白(SEQ ID NO：4)。拟南芥HIO1005的直系同源物或旁系同源物的核酸和/或蛋白描述于下面的实施例4中。

如这里使用的术语“HIO1005多肽”指全长HIO1005蛋白或其“功能活性”的片段，衍生物(变体)或者直系同源物，指该蛋白片段，衍生物或者直系同源物显示与SEQ ID NO：2的多肽相关的一种或多种功能活性。在一个优选的实施方案中，功能活性HIO1005多肽，当在植物中错表达时，导致改变的含油量表型。在更进一步优选的实施方案中，HIO1005多肽在植物中的错表达导致高油表型。在另一个实施方案中，功能活性HIO1005多肽当在植物或植物细胞中表达时，能拯救缺陷的(包括缺失的)内源HIO1005活性；该拯救多肽可来自与具有缺陷活性的植物相同的或不同的物种。在另一个实施方案中，全长HIO1005多肽的功能活性片段(也即，具有SEQ ID NO：2的序列的天然多肽或其天然存在的直系同源物)保留与全长HIO1005多肽相关的一种或多种生物学特性，例如信号活性，结合活性，催化活性或细胞或者细胞外定位活性。HIO1005片段优选包括HIO1005结构域，例如C-或N-末端或者催化结构域，尤其，优选包括HIO1005蛋白的至少10个，优选至少20个，更优选至少25个，最优选至少50个的连续氨基酸。功能域可使用PFAM程序进行鉴定(Bateman A等，1999 Nucleic Acids Res 27：260-262)。优选HIO1005片段包括一种或者多种蛋白激酶结构域。

全长HIO1005多肽或其片段的功能活性变体包括具有氨基酸插入序列，缺失，或者置换，但保留与全长HIO1005多肽相关的一种或多种生物学特性的多肽。有时，产生的变体能改变HIO1005多肽的翻译后加工。例如，与天然多肽相比，变体可以具有改变的蛋白转运或者蛋白定位特性，或者改变的蛋白的半衰期。

这里使用的术语“HIO1005核酸”包含具有SEQ ID NO：1提供的序列，或者与SEQ ID NO：1提供的序列互补的序列的核酸，及其功能活性片段，衍生物或直系同源物。本发明的HIO1005核酸可以是来源于基因组DNA或者cDNA的DNA，或者RNA。

在一个实施方案中，功能活性的HIO1005核酸编码或者互补于编码功能活性的HIO1005多肽的核酸。基因组DNA包括在该定义内，其用作原始RNA转录本(也即，mRNA前体)的模板，其在编码功能活性HIO1005多肽之前需要加工，例如剪接。HIO1005核酸可包括其他的非编码序列，其可以转录或者不被转录；这种序列包括5’和3’UTRs，聚腺苷酸化信号和尤其是本领域已知的控制基因表达的调节序列。一些多肽需要加工事件，例如蛋白水解剪切，共价修饰，等等，以便完全活化。因此，功能活性核酸可编码成熟的或者预先加工的HIO1005多肽，或者中间体形式。HIO1005多核苷酸还可以包括异源编码序列，例如，编码包括的促进融合多肽纯化的标记或者转化标记的序列。

在另一个实施方案中，功能活性HIO1005核酸可用于例如，通过反义抑制，共抑制等产生功能丧失的HIO1005表型。

在一个优选的实施方案中，用于本发明方法的HIO1005核酸，包括编码或互补于编码HIO1005多肽的序列的核酸序列，该HIO1005多肽与SEQ ID NO：2提供的多肽序列具有至少50％，60％，70％，75％，80％，85％，90％，95％或以上的序列同一性。

在另一个实施方案中，本发明的HIO1005多肽包括与SEQ ID NO：2的HIO1005多肽序列具有至少50％或60％同一性的多肽序列，而且与SEQ ID NO：2的HIO1005多肽序列可具有至少70％，80％，85％，90％或95％或以上的序列同一性。在另一个实施方案中，HIO1005多肽包括与SEQ ID NO：2所示的多肽的功能活性片段具有至少50％，60％，70％，80％，85％，90％或95％或以上的序列同一性的多肽序列。在另一个实施方案中，HIO1005多肽包括与SEQ ID NO：2的多肽序列的全长具有至少50％，60％，70％，80％或90％的序列同一性的多肽序列并且包括一或者多个蛋白激酶结构域。

在另一个方面，HIO1005多核苷酸序列与SEQ ID NO：1所示的HIO1005核酸序列的全长或是与这种HIO1005序列互补的核酸序列具有至少50％到60％的同一性，而且可包含与SEQ ID NO：1所示的HIO1005序列或其功能活性片段，或互补序列具有至少70％，80％，85％，90％或95％或以上的序列同一性。

这里使用的，特定的目标序列或其特定部分的“百分比(％)序列同一性”被定义为如果需要获得最大的百分比序列同一性，如通过WU-BLAST-2.0a19程序(Altschul等，J.Mol.Biol.(1990)215：403-410)所产生的，其中搜索参数设为缺省值，在进行序列比对和引入缺口之后，候选的衍生序列中核苷酸或氨基酸与目标序列(或其特定部分)中核苷酸或氨基酸相同的百分比。HSP S和HSP S2参数是机动值，而且是通过程序本身取决于特定序列的组成和在其中对感兴趣的序列进行搜索的特定数据库的组成而确定的。“％同一性值”通过把匹配的相同核苷酸或氨基酸的数目除以报告的百分比同一性的序列的序列长度而确定。“百分比(％)氨基酸序列相似性”通过进行与确定百分比氨基酸序列同一性相同的计算而确定，但是在计算中除了相同的氨基酸之外还包括保守氨基酸取代。保守氨基酸取代，即其中氨基酸被具有相似特性的另一个氨基酸所取代，而对蛋白的折叠或活性没有显著的影响。可以互相取代的芳香族氨基酸为苯丙氨酸，色氨酸和酪氨酸；可互换的疏水氨基酸为亮氨酸，异亮氨酸，甲硫氨酸和缬氨酸；可互换的极性氨基酸为谷氨酰胺和天门冬酰胺；可互换的碱性氨基酸为精氨酸，赖氨酸和组氨酸；可互换的酸性氨基酸为天冬氨酸和谷氨酸；可互换的小氨基酸为丙氨酸，丝氨酸，苏氨酸，半胱氨酸和甘氨酸。

目标核酸分子的衍生核酸分子包括能选择性地与SEQ ID NO：1的核酸序列杂交的序列。杂交的严谨度可通过温度，离子强度，pH，以及杂交和洗涤期间变性剂诸如甲酰胺的存在来进行控制。通常使用的条件是大家所熟知的(参见，例如，Current Protocol in MolecularBiology，Vol.1，Chap.2.10，John Wiley & Sons，Publishers(1994)；Sambrook等，Molecular Cloning，Cold Spring Harbor(1989))。在一些实施方案子中，本发明的核酸分子能在如下的严谨杂交条件下与包含SEQ ID NO：1的核苷酸序列的核酸分子杂交：含有核酸的滤纸，在含有6X单倍浓度的柠檬酸盐(SSC)(1X SSC为0.15M NaCl，0.015M柠檬酸钠；pH7.0)，5X Denhardt溶液，0.05％焦磷酸钠和100μg/ml的鲱鱼精子DNA的溶液中，65℃预杂交8小时至过夜；在含有6X SSC，lXDenhardt溶液，100μg/ml酵母tRNA和0.05％焦磷酸钠的溶液中，65℃杂交18-20小时；在含有0.1X SSC和0.1％SDS(十二烷基硫酸钠)的溶液中，65℃洗涤滤纸1小时。在其他的实施方案中，使用如下的中等严谨杂交条件：包含核酸的滤纸，在含有35％甲酰胺，5X SSC，50mMTris-HCl(pH7.5)，5mM EDTA，0.1％PVP，1％Ficoll，1％BSA和500μg/ml变性鲑鱼精子DNA的溶液中，40℃预处理6小时；在含有35％甲酰胺，5X SSC，50mM Tris-HCl(pH7.5)，5mM EDTA，0.02％PVP，0.02％Ficoll，0.2％BSA，100μg/ml鲑鱼精子DNA和10％(wt/vol)葡聚糖硫酸酯的溶液中，40℃杂交18-20小时；接着，在含有2X SSC和0.1％SDS的溶液中，55℃洗涤两次1小时。或者，可使用如下的低严谨条件：在含有20％甲酰胺，5×SSC，50mM磷酸钠(pH7.6)，5XDenhardt溶液，10％葡聚糖硫酸酯和20μg/ml变性剪切鲑鱼精子DNA的溶液中，37℃孵育8小时到过夜；在相同的缓冲液中杂交18到20小时；在1×SSC中，大约37℃洗涤滤纸1小时。

由于遗传密码的简并性，可产生许多编码HIO1005多肽的多核苷酸序列。例如，根据特定宿主生物显示的最佳密码子使用，可选择密码子以增加多肽在特定的宿主物种中的表达(参见，例如，Nakamura等，1999)。这种序列变体可用于本发明的方法中。

本发明的方法可使用拟南芥HIO1005的直系同源物。鉴定其他植物品种中直系同源物的方法是本领域已知的。一般说来，不同物种中的直系同源物保持相同的功能，由于存在一个或多个蛋白基序和/或三维结构。在进化过程中，当物种形成后发生基因重复事件时，一个物种，例如拟南芥中的单个基因可能相应于另一个物种中的多个基因(旁系同源物)。这里使用的，术语“直系同源物”包括旁系同源物。当序列数据可用于特定的植物物种时，通常可通过序列同源性分析，例如BLAST分析，一般使用蛋白饵序列，来鉴定直系同源物。如果来自正向BLAST结果的最合适序列检索到了反向BLAST中原始的查询序列，该序列则为可能的直系同源物(Huynen MA和Bork P，Proc Natl AcadSci(1998)95：5849-5856；Huynen MA等，Genome Research(2000)10：1204-1210)。

用于多个序列比对的程序，例如CLUSTAL(Thompson JD等，1994，Nucleic Acids Res 22：4673-4680)，可用于突出直系同源蛋白的保守区域和/或残基，并产生系统树。在表示来自不同物种的多个同源序列(例如，通过BLAST分析检索到的)的系统树中，来自2个物种的直系同源序列，相对于来自2个物种的所有其他的序列，通常在系统树上显得最靠近。结构串线(threading)或蛋白折叠的其他分析(例如，使用ProCeryon，Biosciences，Salzburg，Austria的软件)也可鉴定可能的直系同源物。核酸杂交方法也可用于寻找直向同源基因，而且当不能获得序列数据是优选的。简并PCR和cDNA或基因组DNA文库筛选是寻找相关基因序列的常见方法，而且是本领域熟知的(参见，例如，Sambrook，1989；Dieffenbach and Dveksler，1995)。例如，Sambrook等中描述了用于从感兴趣的植物物种产生cDNA文库，和用部分同源基因探针探测文库的方法。拟南芥HIO1005编码序列的高度保守部分可用作探针。HIO1005直系同源核酸可在高度，中度或低度严谨条件下与SEQ ID NO：1的核酸杂交。扩增或分离假定的直系同源物的部分之后，可通过标准技术克隆该部分并进行测序，而且用作探针来分离完整的cDNA或基因组克隆。或者，可以启动EST方案来产生感兴趣的植物物种的序列信息数据库。在另一种方法中，能特异性结合已知的HIO1005多肽的抗体，用于直系同源物分离(参见，例如，Harlow andLane，1988，1999)。Western印迹分析可确定HIO1005直系同源物(也即，直系同源蛋白)存在于特定植物物种的粗提取物中。当观察反应性时，可通过筛选显示特定植物物种的表达文库，来分离编码候选直系同源物的序列。如Sambrook等1989中所述，可在各种商业可获得的载体中构建表达文库，包括λgt11。一旦通过任何这些方法鉴定到了候选的直系同源物，候选的直系同源序列可用作饵(“查询”)，用于从其中已经鉴定到HIO1005核酸和/或多肽序列的拟南芥或其他的物种中对序列进行反向BLAST。

可使用任何可用的方法来获得HIO1005核酸和多肽。例如，通过如前所述的筛选DNA文库或通过使用聚合酶链式反应(PCR)，分离感兴趣的cDNA或基因组DNA序列的技术是本领域熟知的。或者，可合成核酸序列。任何已知的方法，例如位点定向诱变(Kunkel TA等，1991)，可用于将所需的改变引入到克隆的核酸中。

通常，本发明的方法包括把所需形式的HIO1005核酸整合到用于转化植物细胞的植物表达载体中，并在宿主植物中表达HIO1005多肽。

分离的HIO1005核酸分子是不同于天然发现的形式或设置的核酸分子，而且从至少一个杂质核酸分子中鉴定和分离，该杂质核酸分子通常结合在HIO1005核酸的天然来源中。然而，分离的HIO1005核酸分子包括包含在通常表达HIO1005的细胞中的HIO1005核酸分子，例如，该核酸分子位于与天然细胞的核酸分子不同的染色体位置中。

产生具有改变的含油量表型的遗传修饰的植物

HIO1005核酸和多肽可用于产生具有修饰的含油量表型的遗传修饰的植物。这里使用的，“修饰的含油量表型”可指植物任何部分中修饰的含油量；经常在种子中观察到修饰的含油量。在一个优选的实施方案中，植物中HIO1005基因的改变表达可用于产生具有高油表型的植物。

这里所述的方法一般适用于所有植物。尽管在拟南芥中进行了激活标签法和基因鉴定，但是HIO1005基因(或其直系同源物，变体或片段)可在任何植物种类中表达。在一个优选的实施方案中，本发明涉及产油植物，其在特异性器官，主要是在种子中生产和储存三酰基甘油。这些物种包括大豆(Glycine max)，油菜籽和canola(包括甘蓝型油菜(Brassica napus)，B.campestris)，向日葵(Helianthus annus)，棉花(陆地棉)，玉米(Zea maya)，可可(Theobroma cacao)，红花(Carthamustinctorius)，油棕(Elaeis guineensis)，椰子(Cocos nucifera)，亚麻(Linumusitatissimum)，蓖麻(Ricinus communis)和花生(Arachis hypogaea)。本发明还涉及产生果实和蔬菜的植物，产生谷物的植物，产生坚果的植物，快速周期的芸苔品种，紫花苜蓿(Medicago sativa)，烟草(Nicotiana)，草坪草(Poaceae family)，其他的饲料作物，和可能是稀有脂肪酸来源的野生物种。

本领域技术人员应该了解本领域存在的各式各样的转化技术，而且新技术不断地变成可用的。适于靶宿主植物的任何技术可用于本发明的范围内。例如，可引入各种形式的构建体，包括但不限于DNA链，到质粒，或人工染色体中。可通过各种技术将构建体引入到靶植物细胞中，包括但不限于异源核酸的土壤农杆菌介导的转化，电穿孔法，显微注射，微粒轰击，磷酸钙-DNA共沉淀或脂质体介导的转化。植物转化优选是永久的，也即通过使导入的表达构建体整合到宿主植物基因组中，以便该导入的构建体传递给连续的植物世代。根据计划的用途，包含HIO1005多核苷酸的异源核酸构建体可编码完整的蛋白或其生物学活性部分。

在一个实施方案中，双元的基于Ti的载体系统可用于转移多核苷酸。标准的土壤农杆菌双元载体是本领域技术人员已知的，而且许多是可商业获得的(例如，pBI121 Clontech Laboratories，Palo Alto，CA)。构建体或者载体可以包括植物启动子来表达所选择的核酸分子。在优选的实施方案中，启动子为植物启动子。

用土壤农杆菌载体转化植物的最佳方法随待转化的植物种类而变化。用于土壤农杆菌介导的转化的示例性方法包括转化来源于无菌籽苗和/或小植株的胚轴，芽，茎或叶组织的外植体。这种转化的植物可有性繁殖，或通过细胞或组织培养繁殖。先前已经描述了土壤农杆菌转化用于许多不同类型的植物，而且可在科学文献中找到这种转化方法。其中特别相关的是转化商业上重要的作物，例如油菜籽(De Block等，1989)，向日葵(Everett等，1987)和大豆(Christou等，1989；Kline等，1987)的方法。

根据表达水平，发生表达的组织类型和/或表达的发育阶段，可调节HIO1005的表达(包括转录和翻译)。许多异源调节序列(例如，启动子和增强子)可用于控制HIO1005核酸的表达。这些包括组成型，诱导型和可调节的启动子，以及能以组织或瞬时特异性方式调控表达的启动子和增强因子。示例性的组成型启动子包括树莓E4启动子(美国专利5,783,393和5,783,394)，胭脂碱合成酶(NOS)启动子(Ebert等，Proc.Nat.Acad.Sci(U.S.A)84：5745-5749，1987)，章鱼碱合成酶(OCS)启动子(其由根癌农杆菌的诱导肿瘤的质粒携带)，诸如花椰菜花叶病毒(CaMV)19S启动子(Lawton等，Plant Mol.Biol，9：315-324，1987)以及CaMV35S启动子(Odell et al.，Nature 313：810-812，1985 and JonesJD et al，1992)的花椰菜病毒启动子，甜瓜肌动蛋白启动子(公开的PCT申请WO0056863)，玄参花叶病毒35S-启动子(美国专利5,378,619)，光诱导的来自1，5-二磷酸核酮糖羧化酶小亚基的启动子(ssRUBISCO)，Adh启动子(Walker等，Proc.Natl.Acad.Sci.(U.S.A.)84：6624-6628，1987)，蔗糖合成酶启动子(Yang等，Proc.Natl.Acad.Sci.(U.S.A.)87：4144-4148，1990)，R基因复合启动子(Chandler等，The Plant Cell1：1175-1183，1989)，叶绿素a/b结合蛋白基因启动子，CsVMV启动子(Verdaguer B等，1998)；这些启动子也被用于产生在植物中表达的DNA构建体，例如PCT公开WO84/02913。示例性的组织特异性启动子包括番茄E4和E8启动子(美国专利5,859,330)和番茄2AII基因启动子(Van Haaren MJJ等，1993)。

在一个优选的实施方案中，HIO1005表达在来自其表达与早期种子和/或胚胎发育相关的基因的调节序列的调控下。实际上，在优选的实施方案中，所使用的启动子为种子增强的启动子。这种启动子的实例包括来自诸如napin(Kridl等，Seed Sci.Res.1：209：219，1991)，球蛋白(Belanger and Kriz，Genet.，129：863-872，1991，GenBank AccessionNo.L22295)，γ玉米醇溶蛋白Z 27(Lopes等，Mol Gen Genet.，247：603-613，1995)，L3油质蛋白启动子(美国专利6,433,252)，菜豆蛋白(Bustos等，Plant Cell，1(9)：839-853，1989)，arcelin5(US 2003/0046727)，大豆7S启动子，7Sα启动子(US 2003/0093828)，大豆7Sα’β黄豆蛋白启动子，7Sα’启动子(Beachy等，EMBO J.，4：3047，1985；Schuler等，Nucleic Acid Res.，10(24)：8225-8244，1982)，大豆胰蛋白酶抑制剂(Riggs等，Plant Cell 1(6)：609-621，1989)，ACP(Baerson等，Plant Mol.Biol.，22(2)：255-267，1993)，硬脂酰-ACP脱氢酶(Slocombe等，PlantPhysiol.104(4)：167-176，1994)，β黄豆蛋白的大豆a′亚基(Chen等，Proc.Natl.Acad.Sci.83：8560-8564，1986)，蚕豆USP(P-Vf.Usp，SEQ ID NO：1，2，和3(US 2003/229918)以及玉米L3油质蛋白启动子(Hong等，PlantMol.Biol.，34(3)：549-555，1997)等基因的5’调节区域。还包括玉米醇溶蛋白，是在玉米胚乳中发现的一组贮藏蛋白。玉米醇溶蛋白基因的基因组克隆已被分离(Pedersen等，Cell 29：1015-1026，1982；以及Russell等，Transgenic Res.6(2)：157-168)并且来自这些克隆的启动子，包括15kD，16 kD，19 kD，22 kD，27 kD以及这些基因也可被利用。已知例如在玉米内发挥功能的其他启动子包括下列基因的启动子：waxy，Brittle，Shrunken 2，分支酶I和II，淀粉合成酶，去分支酶，油质蛋白，谷蛋白以及蔗糖合成酶。其启动子与早期种子和胚胎发育相关的豆科植物基因包括V.faba豆球蛋白(Baumlein等，1991，Mol Gen Genet225：121-8；Baumlein等，1992，Plant J 2：233-9)，V.faba usp(Fiedler等，1993，Plant Mol Biol 22：669-79)，豌豆convicilin(Bown等，1988，Biochem J 251：717-26)，豌豆凝集素(dePater等，1993，Plant Cell 5：877-86)，P.vulgaris β菜豆蛋白(Bustos等，1991，EMBO J 10：1469-79)，P.vulgaris DLEC2和PHS[β](Bobb等，1997，Nucleic Acids Res 25：641-7)和大豆β-conglycinin，7S贮藏蛋白(Chamberland等，1992，PlantMol Biol 19：937-49)。

其启动子与早期种子和胚胎发育相关的谷类基因包括水稻谷蛋白(″GluA-3，″Yoshihara and Takaiwa，1996，Plant Cell Physiol 37：107-11；″GluB-l，″Takaiwa等，1996，Plant Mol Biol 30：1207-21；Washida等，1999，Plant Mol Biol 40：1-12；″Gt3，″Leisy等，1990，Plant Mol Biol 14：41-50)，水稻醇溶谷蛋白(Zhou & Fan，1993，Transgenic Res 2：141-6)，小麦醇溶谷蛋白(Hammond-Kosack等，1993，EMBO J 12：545-54)，玉米醇溶蛋白(Z4，Matzke等，1990，Plant Mol Biol 14：323-32)和大麦B-hordein(Entwistle等，1991，Plant Mol Biol 17：1217-31)。

其他的其启动子与早期种子和胚胎发育相关的基因，包括油棕GL07A(7S球蛋白，Morcillo等，2001，Physiol Plant 112：233-243)，甘蓝型油菜napin，2S贮藏蛋白和napA基因(Josefsson等，1987，J BiolChem 262：12196-201；Stalberg等，1993，Plant Mol Biol 1993 23：671-83；Ellerstrom等，1996，Plant Mol Biol 32：1019-27)，甘蓝型油菜油质蛋白(Keddie等，1994，Plant Mol Biol 24：327-40)，拟南芥油质蛋白(Plant等，1994，Plant Mol Biol 25：193-205)，拟南芥FAEl(Rossak等，2001，Plant Mol Biol 46：717-25)，刀豆conA(Yamamoto等，1995，Plant Mol Biol 27：729-41)和长春花异胡豆苷合成酶(Str，Ouwerkerk andMemelink，1999，Mol Gen Genet 261：635-43)。在另一个优选的实施方案中，使用来自在油生物合成期间表达的基因的调节序列(参见，例如，美国专利5,952,544)。可选择的启动子来自于植物贮藏蛋白基因(Bevan等，1993，Philos Trans R Soc Lond B Biol Sci 342：209-15)。其他可使用的启动子例如描述于美国专利5,378,619；5,391,725；5,428,147；5,447,858；5,608,144；5,608,144；5,614,399；5,633,441；5,633,435和4,633,436。

在另一个方面，有时可能需要抑制宿主细胞中内源HIO1005的表达。用于实施本发明该方面的示例性方法包括，但不限于反义抑制(Smith等，1988；van der Krol等，1988)；共抑制(Napoli，等，1990)；核酶(PCT公开WO97/10328)；和正义与反义的组合(Waterhouse，等，1998)。抑制宿主细胞中内源序列的方法，一般使用待抑制序列的至少一部分的转录或转录和翻译。这种序列可以与内源序列的编码以及非编码区同源。反义抑制可使用完整的cDNA序列(Sheehy等，1988)，部分cDNA序列包括5’编码序列(Cannon等，1990)或3’非编码序列(Ch′ng等，1989)的片段。共抑制技术可使用完整的cDNA序列(Napoli等，1990；van der Krol等，1990)或部分cDNA序列(Smith等，1990)。

可进行标准的分子和遗传试验，以更进一步分析基因与观察到的表型之间的关联。示例性技术描述如下。

1. DNA/RNA分析

例如，通过原位杂交，可通过突变体与野生型系的对比确定阶段-与组织特异性基因表达模式。可进行基因，尤其是侧翼调节区甲基化状况的分析。其他的适用技术包括过表达，异位表达，在其他植物物种中的表达和基因敲除(反向遗传学，靶向敲除，病毒诱导的基因沉默[VIGS，参见Baulcombe D，1999])。

在优选的应用中，通过微阵列分析的表达分布被用于同时测量许多不同基因表达中的差异或诱导的改变。用于微阵列分析的技术是本领域熟知的(Schena M等，Science(1995)270：467-470；Baldwin D等，1999；Dangond F，Physiol Genomics(2000)2：53-58；van Hal NL等，JBiotechnol(2000)78：271-280；Richmond T and Somerville S，Curr OpinPlant Biol(2000)3：108-116)。可以进行单独标签的株系的表达分布分析。这种分析可鉴定由于感兴趣基因的过表达而协调调节的其它基因，其可有助于把未知基因置于特定的途径。

2. 基因产物的分析

基因产物分析可包括重组蛋白表达，抗血清产生，免疫定位，催化或其他的活性的生物化学分析，磷酸化状况分析和通过酵母双杂交分析进行与其他蛋白之间的相互作用分析。

3. 途径分析

途径分析可包括，基于它的错表达表型或通过与相关基因的序列同源性，把基因或基因产物置于特定的生物化学，新陈代谢或信号途径中。或者，分析可包括与野生型系和其它突变系的遗传交叉(产生双突变体)，以把基因指定于途径中，或确定在途径中突变对下游“报告”基因表达的作用。

产生具有改变含油量的表型的突变植物

本发明更进一步提供了鉴定在内源HIO1005或者其等位基因中具有能赋予这些植物及其后代HIO1005表型的突变的非转基因植物的方法。在一种称为“TILLING”的方法中(用于在基因组中靶向诱导的局部病变)，例如，使用EMS处理，在感兴趣植物的种子中诱导突变。培养得到的植物，并且自花受精，后代用于制备DNA样品。HIO1005-特异性PCR被用于鉴定突变的植物是否具有HIO1005突变。然后测试具有HIO1005突变的植物含油量的改变，或者，测试植物的含油量的改变，然后使用HIO1005-特异性PCR确定具有改变含油量的植物是否具有突变的HIO1005基因。TILLING可鉴定能改变特异性基因的表达或由这些基因编码的蛋白的活性的突变(参见Colbert等(2001)Plant Physiol126：480-484；McCallum等(2000)Nature Biotechnology 18：455-457)。

在另一种方法中，候选基因/数量性状基因座(QTL)方法可用于标记辅助的育种项目，以鉴定HIO1005基因或HIO1005直系同源物中能赋予含油量的改变的等位基因或突变(参见Bert等，Theor Appl Genet.2003 Jun；107(1)：181-9；以及Lionneton等，Genome.2002 Dec；45(6)：1203-15)。因此，在本发明更进一步的方面中，HIO1005核酸被用于鉴定具有改变的含油量的植物是否在内源HIO1005中具有突变，或是否具有能导致含油量改变的特定等位基因。

虽然参考特定的方法和实施方案已经描述了本发明，应当理解只要不背离本发明可以进行各种修饰和改变。这里引用的所有出版物都明确地在这里作为参考引入，用于描述和公开可与本发明一起使用的组合物和方法的目的。所有引用的专利，专利申请和参考的网站和公共数据库中的序列信息也引入作为参考。

实施例

实施例1

利用激活标签构建体进行转化产生具有HIO1005表型的植物

使用激活标签“ACTTAG”载体，pSKI015产生突变体(GI#6537289；Weigel D等，2000)。使用标准方法产生拟南芥转基因植物，基本上如公开的申请PCT WO0183697中所述。简要地，T0拟南芥(Col-0)植物用携带有pSKI015载体的土壤农杆菌进行转化，该载体包括来源于土壤农杆菌Ti质粒的T-DNA，除草剂抗性选择性标记基因和4X CaMV35S增强子元件。根据除草剂抗性，在T1世代选择转基因植物。

在收获时通过近红外光谱学(NIR)分析T3种子。利用Bruker 22 N/F捕获NIR红外光谱。利用NIR分析的数据和参考厂商说明通过Bruker软件估计总种子油的含量以及总种子蛋白含量。将我们的校准预测的油含量(ren油1473ld+sline.q2，预测己烷萃取油)，紧接美国石油化学家学会官方的方法以及推荐作法(Official and RecommendedPractices of American Oil Chemists Society)，第五版本，AOCS，Champaign，Ill的AOCS法AM1-92的一般方法，与38,090个个体ACTTAG系进行比较。种子组成分析之后，通过反向PCR以及测序确定各品系基因组中ACTTAG元件的位置。在这个分析中考虑38,090个具有回收的侧翼序列的品系。

由于种植了38,090个品系并且长满12个月，将种子油含量值校正到使环境差异的影响最小化，所述环境差异可以改变种子油含量。计算所种植的品系每天的平均种子油含量及其标准偏差。种子油含量表示为“相对标准偏差距离”(SD距离)，通过从各品系种子油含量减去种植日平均种子油含量并由那天标准偏差除差异进行计算。该标准化可以比较整年生长的种植种子中的种子油含量。

通过评价38,090个品系中所有受ACTTAG元件影响的基因鉴定过表达时引起高种子油表现型的基因。通过下列方法实现；首先，鉴定各品系中可能由ACTTAG元件激活的基因并将品系的种子油含量指定给这些基因；第二，当特定的基因过表达时通过获得各基因单独的种子油值的平均值确定种子油含量。由于评价了38,090个品系，并且各元件影响平均2.5个基因，各基因将具有4个种子油值的平均值。具有最高平均SD距离的基因被确定为过表达时引起高种子油的基因。

过表达At5g02290，HIO1005的植物具有种植日平均117％的油含量。过表达At5g02290，HIO1005的植物的油含量以及“相对标准偏差距离”显示在下表1中。

表1.

Tair	相对标准差距离	植物计数	描述	品系ID	种植日期	n (所种植的ACTTAG品系用NIR测定日的#)	种子油含量(％)	种植日期的平均油含量(％)	种植日期油含量的标准差
Tair	相对标准差距离	植物计数	描述	品系ID	种植日期	n (所种植的ACTTAG品系用NIR测定日的#)	种子油含量(％)	种植日期的平均油含量(％)	种植日期油含量的标准差	At5g02290	2.764666	1	预测的蛋白激酶	W000177287	7/31/02	1102	38.543	32.968	2.016

实施例2

显示改变的含油量表型的植物中T-DNA插入序列的表征

我们进行了基本上如专利申请PCT WO0183697中所示的标准分子分析，以确定与改变的含油量表型相关的T-DNA插入位点。简而言之，从显示改变的含油量表型的植物提取基因组DNA。使用pSKI015载体的特异性引物进行的PCR，确认了来自HIO1005油系的植物中存在35S增强子，Southern印迹分析证实了ACTTAG T-DNA的基因组整合，并且显示单独的T-DNA插入序列在转基因系中的存在。

反相PCR被用于回收T-DNA插入序列侧翼的基因组DNA，然后使用基础的BLASTN搜索和/或拟南芥信息源(TAIR)数据库(可以在公众可以进入的拟南芥信息资源网站获得)进行序列分析。

实施例3

HIO1005表型的复述

为了检验At5g02290的过表达是否引起高种子油表型，将从过表达该基因的转基因植物的种子中的油含量与来自非-转基因对照植物种子中的油含量。为了这么做，将At5g02290克隆到种子特异性CsVMV启动子后植物转化载体中并利用花浸渍法转化到拟南芥植物中。该植物转化载体含有由RE4启动子启动的nptII基因提供针对卡那霉素的抗性并用作选择性标记。将来自转化的植物的种子接种在含有卡那霉素的琼脂培养基上。7天后，转基因植物被鉴定为健康的绿色植物并移植到土壤上。非-转基因对照植物在琼脂培养基上萌芽，生长7天然后移植到土壤上。将22个转基因的幼苗和10个非转基因的对照植物转移到相同的32格平地的随机位置。植物生长至成熟并自花授精并结子。从每一植物收获种子，通过如下所述的方法由Near Infrared(NIR)波谱学评估种子的含油量。由NIR光谱学测定的从各植物收获的种子中的油百分比显示于表3中。通过用预测的油值除以对照种子(即没有转基因的植物的种子)中的平均油值确定相对的油值。

已经在2个实验中检验了At5g02290的过表达对种子油的影响。在2个实验中，过表达At5g02290的植物具有比生长在相同的平地的对照植物高的种子油含量。整个实验中，过表达At5g02290的植物的平均种子油含量比未转化的对照高3.9％。过表达At5g02290的植物的种子油含量显著高于非-转基因对照植物(双向方差分析；P＝0.0297)。

表2

实验	植物	转基因	油百分比	相对油
实验	植物	转基因	油百分比	相对油	1	DX07125001	CsVMV：At5g02290	25.28	96.36
1	DX07125002	CsVMV：At5g02290	27.75	105.76	1	DX07125001	CsVMV：At5g02290	25.28	96.36
1	DX07125002	CsVMV：At5g02290	27.75	105.76	1	DX07125003	CsVMV：At5g02290	27.65	105.41
1	DX07125004	CsVMV：At5g02290	29.35	111.88	1	DX07125003	CsVMV：At5g02290	27.65	105.41

1	DX07125005	CsVMV：At5g02290	26.19	99.83
1	DX07125005	CsVMV：At5g02290	26.19	99.83	1	DX07125006	CsVMV：At5g02290	30.18	115.03
1	DX07125007	CsVMV：At5g02290	24.03	91.59	1	DX07125006	CsVMV：At5g02290	30.18	115.03
1	DX07125007	CsVMV：At5g02290	24.03	91.59	1	DX07125008	CsVMV：At5g02290	25.46	97.02
1	DX07125010	CsVMV：At5g02290	25.28	96.34	1	DX07125008	CsVMV：At5g02290	25.46	97.02
1	DX07125010	CsVMV：At5g02290	25.28	96.34	1	DX07125011	CsVMV：At5g02290	28.39	108.21
1	DX07125012	CsVMV：At5g02290	27.26	103.92	1	DX07125011	CsVMV：At5g02290	28.39	108.21
1	DX07125012	CsVMV：At5g02290	27.26	103.92	1	DX07125013	CsVMV：At5g02290	25.44	96.98
1	DX07125014	CsVMV：At5g02290	27.07	103.18	1	DX07125013	CsVMV：At5g02290	25.44	96.98
1	DX07125014	CsVMV：At5g02290	27.07	103.18	1	DX07125015	CsVMV：At5g02290	32.84	125.17
1	DX07125016	CsVMV：At5g02290	30.62	116.71	1	DX07125015	CsVMV：At5g02290	32.84	125.17
1	DX07125016	CsVMV：At5g02290	30.62	116.71	1	DX07125017	CsVMV：At5g02290	25.98	99.03
1	DX07125018	CsVMV：At5g02290	27.99	106.69	1	DX07125017	CsVMV：At5g02290	25.98	99.03
1	DX07125018	CsVMV：At5g02290	27.99	106.69	1	DX07125019	CsVMV：At5g02290	26.33	100.37
1	DX07125020	CsVMV：At5g02290	26.35	100.44	1	DX07125019	CsVMV：At5g02290	26.33	100.37
1	DX07125020	CsVMV：At5g02290	26.35	100.44	1	DX07125021	CsVMV：At5g02290	27.21	103.7
1	DX07125022	CsVMV：At5g02290	25.46	97.04	1	DX07125021	CsVMV：At5g02290	27.21	103.7
1	DX07125022	CsVMV：At5g02290	25.46	97.04	1	DX07143001	无	28.38	108.16
1	DX07143002	无	26.94	102.68	1	DX07143001	无	28.38	108.16
1	DX07143002	无	26.94	102.68	1	DX07143003	无	25.27	96.33
1	DX07143004	无	25.14	95.81	1	DX07143003	无	25.27	96.33
1	DX07143004	无	25.14	95.81	1	DX07143005	无	26.6	101.39
1	DX07143006	无	27.45	104.63	1	DX07143005	无	26.6	101.39
1	DX07143006	无	27.45	104.63	1	DX07143007	无	24.31	92.66
1	DX07143008	无	27.15	103.48	1	DX07143007	无	24.31	92.66
1	DX07143008	无	27.15	103.48	1	DX07143009	无	25.13	95.8
1	DX07143010	无	25.99	99.07	1	DX07143009	无	25.13	95.8
1	DX07143010	无	25.99	99.07	2	DX07170001	CsVMV：At5g02290	33.73	111.06
2	DX07170002	CsVMV：At5g02290	32.28	106.3	2	DX07170001	CsVMV：At5g02290	33.73	111.06
2	DX07170002	CsVMV：At5g02290	32.28	106.3	2	DX07170003	CsVMV：At5g02290	30.78	101.35
2	DX07170004	CsVMV：At5g02290	33.9	111.63	2	DX07170003	CsVMV：At5g02290	30.78	101.35
2	DX07170004	CsVMV：At5g02290	33.9	111.63	2	DX07170005	CsVMV：At5g02290	32.84	108.15
2	DX07170006	CsVMV：At5g02290	29.64	97.59	2	DX07170005	CsVMV：At5g02290	32.84	108.15
2	DX07170006	CsVMV：At5g02290	29.64	97.59	2	DX07170007	CsVMV：At5g02290	32.29	106.33

2	DX07170008	CsVMV：At5g02290	31.41	103.43
2	DX07170008	CsVMV：At5g02290	31.41	103.43	2	DX07170009	CsVMV：At5g02290	30.56	100.62
2	DX07170010	CsVMV：At5g02290	35.85	118.04	2	DX07170009	CsVMV：At5g02290	30.56	100.62
2	DX07170010	CsVMV：At5g02290	35.85	118.04	2	DX07170011	CsVMV：At5g02290	28.19	92.82
2	DX07170012	CsVMV：At5g02290	31.78	104.65	2	DX07170011	CsVMV：At5g02290	28.19	92.82
2	DX07170012	CsVMV：At5g02290	31.78	104.65	2	DX07170013	CsVMV：At5g02290	33.64	110.78
2	DX07170014	CsVMV：At5g02290	28.66	94.36	2	DX07170013	CsVMV：At5g02290	33.64	110.78
2	DX07170014	CsVMV：At5g02290	28.66	94.36	2	DX07170015	CsVMV：At5g02290	33.56	110.51
2	DX07170016	CsVMV：At5g02290	31.2	102.74	2	DX07170015	CsVMV：At5g02290	33.56	110.51
2	DX07170016	CsVMV：At5g02290	31.2	102.74	2	DX07170017	CsVMV：At5g02290	30.75	101.24
2	DX07170019	CsVMV：At5g02290	30.86	101.61	2	DX07170017	CsVMV：At5g02290	30.75	101.24
2	DX07170019	CsVMV：At5g02290	30.86	101.61	2	DX07170020	CsVMV：At5g02290	30.42	100.18
2	DX07170021	CsVMV：At5g02290	29.68	97.74	2	DX07170020	CsVMV：At5g02290	30.42	100.18
2	DX07170021	CsVMV：At5g02290	29.68	97.74	2	DX07188001	无	30.1	99.12
2	DX07188002	无	29.25	96.3	2	DX07188001	无	30.1	99.12
2	DX07188002	无	29.25	96.3	2	DX07188003	无	30.44	100.22
2	DX07188004	无	31.06	102.27	2	DX07188003	无	30.44	100.22
2	DX07188004	无	31.06	102.27	2	DX07188005	无	30.1	99.12
2	DX07188006	无	31.03	102.17	2	DX07188005	无	30.1	99.12
2	DX07188006	无	31.03	102.17	2	DX07188007	无	29.68	97.72
2	DX07188008	无	29.12	95.89	2	DX07188007	无	29.68	97.72
2	DX07188008	无	29.12	95.89	2	DX07188010	无	32.55	107.19

实施例4

拟南芥HIO1005序列的分析

用BLAST(Altschul等，1990，J.Mol.Biol.215：403.410)，PFAM(Bateman等，1999，Nucleic Acids Res 27：260-262)，PSORT(Nakai K，和Horton P，1999，Trends Biochem Sci 24：34-6)，和/或CLUSTAL(Thompson JD等，1994，Nucleic Acids Res 22：4673-4680)进行序列分析。

TBLASTN对比ESTs：

候选基因At5g02290得到全长cDNA gi|42458510，gi|42458347，gi|42458159，gi|42457560 gi|42457287的支持。注意At5g02290的2个蛋白序列入口(＞gi|15241749和＞gi|30679590)100％同一，因此产生如下所述的完全相同的计算分析结果。

有许多来自显示与At5g02290具有相似性不同的植物品种的ESTs。尽可能制备各品种的ESTs重叠群。每一下列品种的最佳符合列于如下并且包括在以下的“直系同源物表2”中：小麦(Triticum aestivum)，大豆(Glycine max)，辣薄荷(Mentha×Piperita)，欧洲山杨(Populus tremula)，水稻(Oryza sativa)，番茄(Lycopersicon esculentum)，马铃薯(Solanumtuberosum)以及甜菜(Beta vulgaris)。

1.具有下列GenBank IDS的甜菜ESTs：

gi|34892113

2.具有下列GenBank IDS的马铃薯ESTs：

gi|9249744

gi|10446230

gi|12588854

gi|14642480

gi|17070644

gi|17070774

gi|17070788

gi|17075314

gi|19821257

gi|21922218

gi|21375853

3.具有下列GenBank IDS的番茄ESTs：

gi|4381266

gi|5602522

gi|5897320

gi|4381266

gi|5602522

gi|5897320

gi|14688536

4.具有下列GenBank IDS的水稻ESTs：

gi|2317369

gi|2317406

gi|5443728

5.具有下列GenBank IDS的白杨ESTs：

gi|23985034

gi|24060873

gi|28609471

gi|27421455

6.具有下列GenBank IDS的薄荷ESTs：

gi|7244808

7.具有下列GenBank IDS的大豆ESTs：

gi|7478486

gi|7638957

gi|7925466

gi|13790463

gi|15812567

gi|15815577

gi|16344047

gi|16344695

gi|19270028

gi|22525920

gi|22525985

gi|27446266

8.具有下列GenBank IDS的玉米ESTs：

gi|5915602

gi|6194459

gi|6826956

gi|6828040

gi|21210829

gi|18173600

gi|18650074

gi|22472730

gi|22473455

gi|22545925

gi|23199478

gi|26558828

gi|26558898

9.具有下列GenBank IDS的棉花ESTs：

gi|5050902

gi|5050715

gi|5046977

10.具有下列GenBank IDS的小麦ESTs：

gi|11543439

gi|20102206

gi|20106492

gi|20113019

gi|17145892

gi|21483048

gi|22212150

gi|22302945

gi|32556607

BLASTP比较氨基酸：

蛋白At5g02290与来自植物，真菌和动物的蛋白激酶具有同源性。来自植物的蛋白激酶的详细序列分析表明At5g02290是其中有51个成员的植物蛋白激酶的1.2.2家庭的成员(受体类细胞质丝氨酸/苏氨酸激酶VII)(PPC家族1.2.2)。这些蛋白很可能在植物中具有类似的功能。At5g02290最好10个BLAST结果列于如下并且被包含在下表2的直系同源物中。

1.At5g02290本身

＞ gi|15241749|ref|NP_195849.1|蛋白激酶，假定的[拟南芥]

＞ gi|30679590|ref|NP_850755.1|蛋白激酶，假定的[拟南芥]

＞ gi|21431784|sp|P43293|NAK_ARATH可能的丝氨酸/苏氨酸-蛋白激酶NAK

＞ gi|11376624|pir||T48250丝氨酸/苏氨酸-特异性蛋白激酶NAK(EC2.7.1.-)-拟南芥＞ gi|7406425|emb|CAB85534.1|丝氨酸/苏氨酸-特异性蛋白激酶NAK[拟南芥]＞ gi|21555255|gb|AAM63816.1|丝氨酸/苏氨酸-特异性蛋白激酶NAK[拟南芥]

长度＝389

记分＝2017(715.1比特)，期望值＝9.9e-208，P＝9.9e-208

同一性＝389/389(100％)，阳性值＝389/389(100％)

下列序列是At5g02290的另一冗余入口。然而，它与以上序列有几个核苷酸的不同。这很可能是测序错误的结果或是对活性具有很少或者没有影响的单核苷酸多态性的结果。

＞ gi|166809|gb|AAA18853.1|蛋白激酶

长度＝389

记分＝2008(711.9比特)，期望值＝8.9e-207，P＝8.9e-207

同一性＝388/389(99％)，阳性值＝388/389(99％)

2.来自水稻的假定的丝氨酸/苏氨酸-特异性蛋白激酶

＞ gi|34906046|ref|NP_914370.1|假定的丝氨酸/苏氨酸-特异性蛋白激酶[水稻(日本晴(japonica cultivar-group))]＞ gi|15290002|dbj|BAB63697.1|假定的丝氨酸/苏氨酸-特异性蛋白激酶[水稻(japonica cultivar-group)]＞ gi|20160935|dbj|BAB89871.1|假定的丝氨酸/苏氨酸-特异性蛋白激酶[水稻(japonica cultivar-group)]

长度＝467

记分＝1331(473.6比特)，期望值＝4.9e-135，P＝4.9e-135

同一性＝252/375(67％)，阳性值＝307/375(81％)

3.来自拟南芥的At1g07570

＞ gi|15222437|ref|NP_172237.1|蛋白激酶(APKla)[拟南芥]

＞ gi|42571375|ref|NP_973778.1|蛋白激酶(APKla)[拟南芥]

＞ gi|1168470|sp|Q06548|APKA_ARATH蛋白激酶APKlA＞ gi|282877|pir||S28615丝氨酸/苏氨酸/酪氨酸-特异性蛋白激酶APKl(EC2.7.1.-)[确认的]-拟南芥＞ gi|217829|dbj|BAA02092.1|蛋白酪氨酸-丝氨酸-苏氨酸激酶[拟南芥]＞ gi|28393320|gb|AAO42086.1|假定的蛋白激酶APKlA[拟南芥]＞ gi|28827602|gb|AAO50645.1|假定的蛋白激酶APKlA[拟南芥]

长度＝410

记分＝1330(473.2比特)，期望值＝6.3e-135，P＝6.3e-135

同一性＝253/359(70％)，阳性值＝303/359(84％)

下列序列是At1g07570的另一冗余入口。然而，它与以上序列有几个核苷酸的不同。这很可能是测序错误的结果或是对活性具有很少或者没有影响的单核苷酸多态性的结果。

＞ gi|8778537|gb|AAF79545.1|F22G5.5[拟南芥]

长度＝464

记分＝993(354.6比特)，期望值＝1.9e-133，Sum P(2)＝1.9e-133

同一性＝192/277(69％)，阳性值＝229/277(82％)

4.来自拟南芥的At2g28930

＞ gi|42569425|ref|NP_180459.2|蛋白激酶(APKlb)[拟南芥]

长度＝423

记分＝1314(467.6比特)，期望值＝3.1e-133，P＝3.1e-133

同一性＝252/373(67％)，阳性值＝301/373(80％)

下列序列是At2g28930的其它们冗余入口。然而，它们与以上序列有几个核苷酸的不同。这很可能是测序错误的结果或是对活性具有很少或者没有影响的单核苷酸多态性的结果。

＞ gi|12644274|sp|P46573|APKB_ARATH一蛋白激酶APKlB＞ gi|7434286|pir||T02725可能的丝氨酸/苏氨酸/酪氨酸-特异性蛋白激酶(EC2.7.1.-)T9I4.1-拟南芥＞ gi|3461835|gb|AAC33221.1|假定的蛋白激酶[拟南芥]＞ gi|20197437|gb|AAM15075.1|假定的蛋白激酶[拟南芥]

长度＝412

记分＝1327(472.2比特)，期望值＝1.3e-134，P＝1.3e-134

同一性＝258/388(66％)，阳性值＝309/388(79％)

5.假定来自水稻的蛋白激酶

＞ gi|14719339|gb|AAK73157.1|假定的蛋白激酶[水稻]

长度＝395

记分＝1310(466.2比特)，期望值＝8.2e-133，P＝8.2e-133

同一性＝249/370(67％)，阳性值＝302/370(81％)

6.假定来自水稻的蛋白激酶

＞ gi|34897424|ref|NP_910058.1|假定的蛋白激酶[水稻(japonicacultivar-group)]＞ gi|27545044|gb|AAO18450.1|假定的蛋白激酶[水稻(japonica cultivar-group)]

长度＝416

记分＝1284(457.0比特)，期望值＝4.7e-130，P＝4.7e-130

同一性＝254/402(63％)，阳性值＝321/402(79％)

7.来自拟南芥的At2g39660

＞ gi|15225520|ref|NP_181496.1|蛋白激酶，假定的[拟南芥]

＞ gi|7434287|pir||T00574可能的蛋白激酶[输入的]-拟南芥

＞ gi|2795805|gb|AAB97121.1|假定的蛋白激酶[拟南芥]

＞ gi|13272431|gb|AAK17154.1|假定的蛋白激酶[拟南芥]

＞ gi|17064834|gb|AAL32571.1|假定的蛋白激酶[拟南芥]

＞ gi|18086424|gb|AAL57667.1|At2g39660/F12L6.32[拟南芥]

＞ gi|20197111|gb|AAM14921.1|假定的蛋白激酶[拟南芥]

＞ gi|20259860|gb|AAM13277.1|假定的蛋白激酶[拟南芥]

＞ gi|20334794|gb|AAM16258.1|At2g39660/F12L6.32[拟南芥]

长度＝395

记分＝1272(452.8比特)，期望值＝8.8e-129，P＝8.8e-129

同一性＝241/368(65％)，阳性值＝300/368(81％)

8.来自加拿大油菜(canola)(Brassica)的蛋白激酶

＞ gi|45259527|dbj|BAD12263.1|蛋白激酶[Brassica rapa]

长度＝404

记分＝1252(445.8比特)，期望值＝1.2e-126，P＝1.2e-126

同一性＝244/398(61％)，阳性值＝301/398(75％)

9.来自拟南芥的At3g55450

＞ gi|30694253|ref|NP_191105.2|蛋白激酶，假定的[拟南芥]＞ gi|23306362|gb|AAN17408.1|丝氨酸/苏氨酸-特异性蛋白激酶-[拟南芥]

长度＝389

记分＝1179(420.1比特)，期望值＝6.3e-119，P＝6.3e-119

同一性＝226/354(63％)，阳性值＝283/354(79％)

10.假定来自水稻的蛋白酪氨酸-丝氨酸-苏氨酸

＞ gi|19071648|gb|AAL84315.1|假定的蛋白质酪氨酸-丝氨酸-苏氨酸激酶[水稻(japonica cultivar-group)]

长度＝422

记分＝1178(419.7比特)，期望值＝8.0e-119，P＝8.0e-119

同一性＝235/394(59％)，阳性值＝301/394(76％)

表3

直系同源基因名称

品种

GI#

与HIO1005的％ID

记分(BLAST，Clustal，等)

直系同源基因名称	品种	GI#	与HIO1005的％ID	记分(BLAST，Clustal，等)
直系同源基因名称	品种	GI#	与HIO1005的％ID	记分(BLAST，Clustal，等)	来自马铃薯的EST重叠群	Solanumtubersom	gi\|9249744gi\|10446230gi\|12588854gi\|14642480gi\|17070644gi\|17070774gi\|17070788gi\|17075314gi\|19821257gi\|21922218gi\|21375853consensus：SEQID NO：5	长度：2205同一性：0.673阳性值：0.822框：2	TBLASTN记分：1404概率：1.700000e-144
来自甜菜的一个EST重叠群	Betavulgaris	gi\|34892113	长度：674同一性：0.664阳性值：0.818框：2	TBLASTN记分：737概率：1.100000e-73	来自马铃薯的EST重叠群	Solanumtubersom		长度：2205同一性：0.673阳性值：0.822框：2	TBLASTN记分：1404概率：1.700000e-144

直系同源基因名称	品种	GI#	与HIO1005的％ID	记分(BLAST，Clustal，等)
直系同源基因名称	品种	GI#	与HIO1005的％ID	记分(BLAST，Clustal，等)	来自大豆的一个EST重叠群	Glycine max	gi\|7478486gi\|7638957gi\|7925466gi\|13790463gi\|15812567gi\|15815577gi\|16344047gi\|16344695gi\|19270028gi\|22525920gi\|22525985gi\|27446266consensus：SEQID NO：9	长度：1631同一性：0.669阳性值：0.817框：2	TBLASTN记分：1378概率：2.900000e-141
来自小麦的一个EST	Triticumaestivum	gi\|11543439gi\|20102206gi\|20106492gi\|20113019gi\|17145892gi\|21483048gi\|22212150gi\|22302945gi\|32556607consensus：SEQID NO：12	长度：1921同一性：0.613阳性值：0.768框：3	TBLASTN记分：1178概率：1.600000e-122	来自大豆的一个EST重叠群	Glycine max		长度：1631同一性：0.669阳性值：0.817框：2	TBLASTN记分：1378概率：2.900000e-141

直系同源基因名称	品种	GI#	与HIO1005的％ID	记分(BLAST，Clustal，等)
直系同源基因名称	品种	GI#	与HIO1005的％ID	记分(BLAST，Clustal，等)	来自番茄的一个EST重叠群	Lycopersiconesculentum	gi\|4381266gi\|5602522gi\|5897320gi\|4381266gi\|5602522gi\|5897320gi\|5897320gi\|14688536gi\|14688536共有序列：SEQID NO：6	长度：1601同一性：0.608阳性值：0.791框：2	TBLASTN记分：1270概率：6.300000e-130
米自水稻的一个EST重叠群	水稻	gi\|2317369gi\|2317406gi\|5443728共有序列SEQID NO：7	长度：965同一性：0.630阳性值：0.768框：3	TBLASTN记分：781概率：9.700000e-90	来自番茄的一个EST重叠群	Lycopersiconesculentum		长度：1601同一性：0.608阳性值：0.791框：2	TBLASTN记分：1270概率：6.300000e-130

直系同源基因名称	品种	GI#	与HIO1005的％ID	记分(BLAST，Clustal，等)
直系同源基因名称	品种	GI#	与HIO1005的％ID	记分(BLAST，Clustal，等)	来自玉米的一个EST重叠群	玉米	gi\|5915602gi\|6194459gi\|6826956gi\|6828040gi\|21210829gi\|18173600gi\|18650074gi\|22472730gi\|22473455gi\|22545925gi\|23199478gi\|26558828gi\|26558898共有序列：SEQID NO：10	长度：1620同一性：0.676阳性值：0.838框：-3	TBLASTN记分：1258概率：9.700000e-129
来自棉花的一个EST重叠群	Gossypiumhirsutum	gi\|5050902gi\|5050715gi\|5046977共有序列：SEQID NO：11	长度：632同一性：0.597阳性值：0.761框：3	TBLASTN记分：539概率：6.800000e-53	来自玉米的一个EST重叠群	玉米		长度：1620同一性：0.676阳性值：0.838框：-3	TBLASTN记分：1258概率：9.700000e-129

直系同源基因名称	品种	GI#	与HIO1005的％ID	记分(BLAST，Clustal，等)
直系同源基因名称	品种	GI#	与HIO1005的％ID	记分(BLAST，Clustal，等)	来自白杨的一个EST重叠群	Populustremula	gi\|23985034gi\|24060873gi\|28609471gi\|27421455共有序列：SEQID NO：8	长度：1240同一性：0.684阳性值：0.829框：3	TBLASTN记分：958概率：5.000000e-97
来自薄荷的一个EST重叠群	Menthapiperita	gi\|7244808	长度：646同一性：0.470阳性值：0.722框：1	TBLASTN记分：262概率：2.600000e-24	来自白杨的一个EST重叠群	Populustremula	gi\|23985034gi\|24060873gi\|28609471gi\|27421455共有序列：SEQID NO：8	长度：1240同一性：0.684阳性值：0.829框：3	TBLASTN记分：958概率：5.000000e-97

最接近的植物同系物：

At5g02290

拟南芥

gi|15241749gi|30679590gi|21431784gi|11376624gi|7406425gi|21555255

同一性＝389/389(100％)，阳性值＝389/389(100％)框：N

BLASTP记分：2017P＝9.9e-208

来自水稻的丝氨酸/苏氨酸-特异性蛋白激酶	水稻(japonicacultivar-group)	gi\|34906046gi\|15290002gi\|20160935	同一性＝252/375(67％)，阳性值＝307/375(81％)框：N	BLASTP记分：1331P＝4.9e-135
来自水稻的丝氨酸/苏氨酸-特异性蛋白激酶	水稻(japonicacultivar-group)	gi\|34906046gi\|15290002gi\|20160935	同一性＝252/375(67％)，阳性值＝307/375(81％)框：N	BLASTP记分：1331P＝4.9e-135	At1g07570	拟南芥	gi\|15222437gi\|42571375gi\|1168470gi\|282877gi\|217829gi\|28393320gi\|28827602	同一性＝253/359(70％)，阳性值＝303/359(84％)框：N	BLASTP记分：1330P＝6.3e-135
At2g28930	拟南芥	gi\|42569425	同一性＝252/373(67％)，阳性值＝301/373(80％)框：N	BLASTP记分：1314P＝3.1e-133	At1g07570	拟南芥		同一性＝253/359(70％)，阳性值＝303/359(84％)框：N	BLASTP记分：1330P＝6.3e-135
At2g28930	拟南芥	gi\|42569425	同一性＝252/373(67％)，阳性值＝301/373(80％)框：N	BLASTP记分：1314P＝3.1e-133	来自水稻的蛋白激酶	水稻	gi\|14719339	同一性＝249/370(67％)，阳性值＝302/370(81％)框：N	BLASTP记分：1310P＝8.2e-133
来自水稻的蛋白激酶	水稻(japonicacultivar-group)	gi\|34897424gi\|27545044	同一性＝254/402(63％)，阳性值＝321/402(79％)框：N	BLASTP记分：1284P＝4.7e-130	来自水稻的蛋白激酶	水稻	gi\|14719339	同一性＝249/370(67％)，阳性值＝302/370(81％)框：N	BLASTP记分：1310P＝8.2e-133

来自水稻的蛋白激酶	拟南芥	gi\|15225520gi\|7434287gi\|2795805gi\|13272431gi\|17064834gi\|18086424gi\|20197111gi\|20259860gi\|20334794	同一性＝241/368(65％)，阳性值＝300/368(81％)框：N	BLASTP记分：1272P＝8.8e-129
来自水稻的蛋白激酶	拟南芥		同一性＝241/368(65％)，阳性值＝300/368(81％)框：N	BLASTP记分：1272P＝8.8e-129	来自加拿大油菜的蛋白激酶	Brassica rapa	gi\|45259527	同一性＝244/398(61％)，阳性值＝301/398(75％)框：N	BLASTP记分：1252P＝1.2e-126
At3g55450	拟南芥	gi\|30694253gi\|23306362	同一性＝226/354(63％)，阳性值＝283/354(79％)框：N	BLASTP记分：1179P＝6.3e-119	来自加拿大油菜的蛋白激酶	Brassica rapa	gi\|45259527	同一性＝244/398(61％)，阳性值＝301/398(75％)框：N	BLASTP记分：1252P＝1.2e-126
At3g55450	拟南芥	gi\|30694253gi\|23306362	同一性＝226/354(63％)，阳性值＝283/354(79％)框：N	BLASTP记分：1179P＝6.3e-119	蛋白酪氨酸-丝氨酸-苏氨酸激酶	水稻(japonicacultivar-group)	gi\|19071648	同一性＝235/394(59％)，阳性值＝301/394(76％)框：N	BLASTP记分：1178P＝8.0e-119

At5g02290可以是叶绿体蛋白(由TargetP预测)。与此结果相一致，At5g02290缺乏信号肽并缺乏分别由SignalP和TMHMM预测的跨膜结构域。

Pfam分析显示At5g02290是丝氨酸/苏氨酸蛋白激酶家族的成员(COG0515，SM00220，PF00069)。

模型结构域 seq-f^* seq-t hmm-f hmm-t 记分 E-值

-------- --------- -------- ------- ----- -------

COG0515 1/1 68 388.. 1 536[] 88.3 3.1e-23

SM00220 1/1 68 348.. 1 231[] 140.7 5.2e-39

PF00069 1/1 68 350.. 1 278[] 182.0 2e-51

^*Seq-f是指“序列-来自”，seq-t是指“序列-进入。”seq-t数后的两个阶段显示匹配区域在序列内并且没有延伸到每一末端。两个括号显示匹配跨越图谱HMM的全长。hmm-f和hmm-t是指图谱HMM的匹配部分的开始和末端坐标。

真核生物的蛋白激酶是属于一个非常广泛的蛋白家族的酶，与丝氨酸/苏氨酸以及酪氨酸蛋白激酶共有保守的催化核心。在蛋白激酶的催化功能域中有大量保守区域。在该催化功能域的N-末端，在赖氨酸残基附近有一富含甘氨酸的残基延伸，所述赖氨酸残基已经被证明是参予ATP结合。在催化功能域的中心部分有一保守的天冬氨酸残基，对于酶的催化活性是非常重要的。虽然SMART特征SM00220鉴定了催化功能域，PROSITE特征，PS00108鉴定了活性位点。

来自植物的蛋白激酶的详细序列分析表明At5g02290是有51个成员的植物蛋白激酶1.2.2家庭的成员(受体类细胞质/苏氨酸激酶VII)(PPC家族1.2.2)。注意植物蛋白激酶的分类是基于利用BLAST进行的序列比较。该分类系统没有考虑蛋白的细胞定位。因此，尽管植物蛋白激酶的1.2.2家族被称作“受体类细胞质激酶VII”，并没有暗示其成员的细胞定位(例如细胞质，核，跨膜)。

总之，叶绿体蛋白激酶At5g02290可以调节其它可能对脂肪酸合成有影响的蛋白活性。

实施例5

通过根癌土壤杆菌介导的转化或微粒轰击获得油菜籽，大豆，玉米，向日葵，棉花，可可，红花，油椰，椰子，亚麻，蓖麻以及花生的转化的外植体。由转化的组织再生植物。然后分析温室生长的植物目的基因的表达水平以及油的水平。

实施例6

本实施例提供了测定转基因包谷植物的油以及蛋白含量，质量差，氨基酸组成，游离氨基酸水平以及微量元素含量的分析方法。

通过低分辩率¹H核磁共振(NMR)(Tiwari等，JAOCS，51：104-109(1974)；或Rubel，JAOCS，71：1057-1062(1994))确定第一代单个玉米粒以及解剖的胚芽以及胚乳的油水平(基于质量以及组织重量百分比)，由此测定单个粒样品的NMR张弛时间，并基于利用从根据加速溶剂萃取之后重量分析测定的具有改变的油水平的玉米粒分析产生的标准曲线的回归分析计算油水平。进行单向方差分析以及Student’s t-检验(JMP，版本4.04，SAS Institute Inc.，Cary，NC，USA)来通过转基因-特异性PCR鉴定转基因以及非-转基因粒之间的显著差别。

通过NIT光谱学确定第二代种子中油水平以及蛋白水平，由此测定由单株植物收获的接种样本品集的NIT谱，并基于利用由玉米粒分析产生的标准曲线的回归分析计算油以及蛋白水平，所述玉米粒具有分别由加速溶剂萃取或元素(％N)分析之后重量分析测定的改变的油或蛋白水平。进行单向方差分析以及Student’s t-检验来鉴定阳性标记以及阴性标记植物的种子之间油(％粒重)以及蛋白(％粒重)的显著差异。

利用下列方法分析来自每一转基因事件的游离氨基酸的水平。将每一转基因植物的种子逐一粉碎成细小的粉末并将约50mg所产生的粉末转入预称重的离心管。记录精确的样品重量并将1.0ml的5％三氯乙酸添加到各样品管中。在室温下通过涡旋混合样品然后在Eppendorf微量离心机(Model 5415C，Brinkmann Instrument，Westbury，NY)上在14,000rpm离心15分钟。取出等分样品的上清液并通过利用AgilentTechnical Publication“Amino Analysis Using the Zorbax Eclipse-AAAColumns and Agilent 1100 HPLC，”2000年3月17，所述的方法通过HPLC(Agilent 1100)进行分析。

通过下列方法对来自谷物的总氨基酸进行定量测定。研磨谷粒并利用6N HCl在100℃回流条件下24小时酸水解约60mg的产生的粗粉。干燥样品并在0.1N HCl中重构继之以用α-苯二醛(OPA)预柱衍生化作用用于HPLC分析。通过反相Zorbax Eclipse XDB-C18 HPLC柱在Agilent 1100 HPLC(Agilent，Palo Alto，CA)上分离氨基酸。通过荧光检测氨基酸。半胱氨酸，脯氨酸，天冬酰胺，谷氨酰胺以及色氨酸并未包括在该氨基酸筛选中(Henderson等，″Rapid，Accurate，Sensitive and Reproducible HPLC Analysis of Amino acids，Amino AcidAnalysis Using Zorbax Eclipse-AAA Columns and the Agilent 1100HPLC，″Agilent Publication(2000)；也参见″Measurement ofAcid-Stable Arnino Acids，″AACC Method 07-01(American Associationof Cereal Chemists，Approved Methods，9th版本(LCCC#_9575308))。利用(Approved Methods of the美国谷物化学家协会-10th版本，AACC编辑，(2000)07-20 Measurement of Tryptophan-AlaklineHydrolysis)所述的碱解方法测定玉米粒中总的色氨酸。

通过本领域已知的方法分析种子中生育酚以及生育三烯酚的水平。简而言之，将10mg的种子组织添加到已经添加了500μl 1％连苯三酚(pyrogallol)(Sigma Chemical Co.，St.Louis，MO)/乙醇的无菌微量离心管中的1g微株上(Biospec Product Inc，Barlesville，OK。微Beadbeater(Biospec)中“快”速振荡混合物3分钟，然后过滤通过0.2μm滤膜进入自动取样器管。利用带有荧光检测以及带通以及狭缝的Zorbax硅石HPLC柱(4.6mm×250mm)经HPLC分析过滤的提取物，荧光检测的激发波长290nm，发射波长336nm。溶剂成分以及工作条件如下所列，溶剂A为己烷，溶剂B为甲基-叔丁基醚。注射体积为20μl，流速为1.5ml/分钟并且运行时间为40℃12分钟。溶剂梯度为90％溶剂A，10％溶剂B10分钟；25％溶剂A，75％溶剂B11分钟；以及90％溶剂A，10％溶剂B12分钟。在1％连苯三酚/乙醇中进行生育酚标准的运行用于比较(α-生育酚，γ-生育酚，β-生育酚，δ-生育酚以及生育酚(母育酚))。利用Chemstation软件(Hewlett Packard)计算α，β，δ以及γ生育酚的标准曲线。在1％连苯三酚/乙醇中运行生育三烯酚标准用于比较(α-生育三烯酚，γ-生育三烯酚，β-生育三烯酚，δ-生育三烯酚。利用Chemstation软件(HewlettPackard)计算α-，β，δ-以及γ-生育三烯酚的标准曲线。

经标准的方案(Craft，Meth.Enzymol.，213：185-205(1992)确定转基因玉米粒内类胡萝卜素的水平。经标准的方案(Threlfall等，Methodsin Enzymology，XVIII，C部分，369-396(1971)；以及Ramadan等，Eur.Food Res.Technol.，214(6)：521-527(2002))确定plastiquinol以及叶绿醌。

参考文献

Altschul，S.F.et al.，J.Mol.Biol.215：403-410，1990.

Altschul，S.F.et al.，Nucleic Acids Res.25：3389-3402，1997.

Ausubel FM et al.，Current Protocols in Molecular Biology，JohnWiley & Sons，New York，N.Y.，1993.

Baldwin D et al.，Cur Opin Plant Biol.2(2)：96-103，1999.

Bateman et al.，1999，Nucleic Acids Res 27：260-262(website atpfam.wustl.edu).

Baulcombe D，Arch Virol Suppl 15：l89-20l，1999.

Cannon et al.， Plant Molec.Biol.(1990)15：39-47.

Ch′ng et al.，Proc.Natl.Acad.Sci.USA(1989)86：10006-10010

Christensen S et al.，9^th International Conference on ArabidopsisResearch.Univ.of Wisconsin-Madison，June 24-28，1998.Abstract 165.

Christou et al.，Proc.Natl.Acad.Sci USA(1989)86：7500-7504.

De Block et al.，Plant Physiol.(1989)91：694-701.

Dieffenbach C and Dveksler G(Eds.)PCR Primer：A LaboratoryManual，Cold Spring Harbor Laboratory Press，NY，1989.

Everett et al.，Bio/Technology(1987)5：1201

Feldmann et al.，Science 243：1351-1354，1989.

Focks N and Benning C，Plant Physiol 118：91-101，1998.

Fridborg I et al.，Plant Cell 11：1019-1032，1999.

Harlow E and Lane D，Antibodies：A Laboratory Manual，ColdSpring Harbor Laboratory Press，1988，New York.

Harlow E and Lane D，Using Antibodies：A Laboratory Manual，ColdSpring Harbor Laboratory Press，1999，New York

Hayashi H et al.，Science 258：1350-1353，1992.

Jako et al.，Plant Physiology 126(2)：861-74，2001.

James DW and Dooner HK(1990)Theor Appl Genet 80，241-245.

Jones JD et al.，Transgenic Res 1：285-297 1992.

Kardailsky I et al.，Science 286：1962-1965，1999.

Katavic V et al.，Plant Physiology 108(1)：399-409，1995.

Kline et al.，Nature(1987)327：70.

Kunkel TA et al.，Methods Enzymol.204：125-39，1991.

Lemieux B.，et al.，1990，Theor Appl Genet 80，234-240.

Nakamura Y et al.，1999，Nucleic Acids Res 27：292.

Napoli，et al.，Plant Cell 2：279-289，1990.

Okuley et al.，Plant Cell 6(1)：147-158，1994.

Sambrook et al.，Molecular Cloning：A Laboratory Manual(SecondEdition)，Cold Spring Harbor Press，Plainview，N.Y.，1989.

Schaffer R，et al.，Cell 93：1219-1229，1998.

Sheehy et al.，Proc.Natl.Acad.Sci.USA(1988)85：8805-8809.

Smith，et al.，Nature 334：724-726，1988.

Smith et al.，Mol.Gen.Genetics(1990)224：477-481.

Thompson JD et al.，Nucleic Acids Res 22：4673-4680，1994.

van der Krol et al.，Biotechniques(1988)6：958-976.

van der Krol et al.，The Plant Cell(1990)2：291-299.

Van Haaren MJJ et al.，Plant Mol Bio 21：625-640，1993.

Verdaguer B et al.，Plant Mol Biol 37：1055-1067，1998.

Waterhouse，et al.，Proc.Natl.Acad.Sci.USA 95：13959-13964，1998.

Weigel D，et al.，Plant Physiology，122：1003-1013，2000.

Wilson K et al.，Plant Cell 8：659-671，1996.

Yadav NS et al.，(1993)Plant Physiol 103，467-476.

序列表

<110>农业经济有限责任公司(Agrinomics，LLC)

<120>生产改变含油量的植物

(GENERATION OF PLANTS WITH ALTERED OIL CONTENT)

<130>SCT065700-66

<150>60/575，561

<151>2004-05-28

<160>12

<170>PatentIn version 3.3

<210>1

<211>1572

<212>DNA

<213>Arabidopsis thaliana

<400>1

attgattact agccagctca attttctttc tttctttctt tctttctctg ggagtttggg 60

attttcttaa gggtcttttt caattctcgc tccattttgt acgcatagaa ctgggtttgt 120

gtttacacac ataaagctct tatctttttt cttctttcaa tcgagaagat tatagagctg 180

agtgactgat tggtggtttc ttggagtttt aatgggaggt tgtttcagca atcggattaa 240

aacagatatt gcttccagta catggctaag ttcgaaattc ttgagtagag atgggagcaa 300

gggctcgtcg accgcttcct tctcttatat gcctcgaaca gaaggcgaga tcttgcaaaa 360

tgctaatctc aagaacttta gtctcagtga actgaaatct gcaactagga atttccggcc 420

tgatagtgtg gttggtgaag gtggatttgg ttgcgttttc aaaggctgga tcgatgagtc 480

ctctctcgct ccttctaaac cggggaccgg gattgtcatt gctgtgaaaa gacttaacca 540

agaagggttt caaggtcatc gagagtggct ggctgagatc aattatttag gccagctgga 600

tcatcctaac cttgtgaaac tgattggata ctgcttggaa gaggagcaca ggcttcttgt 660

ttacgagttt atgactcgtg gtagtcttga gaatcactta ttcagaagag gaacattcta 720

tcagccactt tcatggaaca cgcgggttcg tatggctctt ggtgcagcta gaggacttgc 780

ttttcttcac aatgctcaac cgcaagttat ataccgagac ttcaaagcat ctaacatctt 840

gctagattcg aactacaacg caaagctttc ggatttcggt ttggctagag atggtccaat 900

gggtgacaac agccatgttt ctaccagagt catgggaact cagggatacg ctgctccaga 960

atatctagct acaggtcatt tatcggtgaa gagcgatgta tacagttttg gggttgtgtt 1020

actggagttg ttatcaggaa gacgagcaat tgacaagaat caaccagtag gagaacacaa 1080

tctcgtggat tgggcaagac cctacttaac aaacaagaga agacttctgc gagtgatgga 1140

tcctcgtctc caaggtcaat actcactaac ccgagctttg aaaattgcag ttcttgcact 1200

cgattgcata tctatagatg ccaagagtag accgaccatg aacgaaatcg tcaagacaat 1260

ggaagaactt catatccaga aggaagcatc aaaagagcag cagaatcctc aaatcagcat 1320

tgacaacatc atcaacaaat ctccacaagc tgtgaattat cctaggcctt caattatgta 1380

acaatcctag gcgagctatt taccgggttt tagagatgta tagactcttt accttctgtc 1440

tgtttagata ttatgttgtt tggtagtaac aaaagagctg gcaatgtaag ggagagaagg 1500

aaacttacta gttgtaaact taggttctct tacaacgttc acatgttatc tcacatacaa 1560

aatgttatca gg 1572

<210>2

<211>1570

<212>DNA

<213>Arabidopsis thaliana

<400>2

acgatgaaca gaggaagatg aggaagaaga caaagtccaa tagggcgtac ccaaaactga 60

gagagaaaga gagaggaaag agctcaaaaa aaaacatctt ttcttttcat tttcaattag 120

tttcattatt atcacaaaag acttttcttc tccgagagaa caaaagatta tagagctgag 180

tgactgattg gtggtttctt ggagttttaa tgggaggttg tttcagcaat cggattaaaa 240

cagatattgc ttccagtaca tggctaagtt cgaaattctt gagtagagat gggagcaagg 300

gctcgtcgac cgcttccttc tcttatatgc ctcgaacaga aggcgagatc ttgcaaaatg 360

ctaatctcaa gaactttagt ctcagtgaac tgaaatctgc aactaggaat ttccggcctg 420

atagtgtggt tggtgaaggt ggatttggtt gcgttttcaa aggctggatc gatgagtcct 480

ctctcgctcc ttctaaaccg gggaccggga ttgtcattgc tgtgaaaaga cttaaccaag 540

aagggtttca aggtcatcga gagtggctgg ctgagatcaa ttatttaggc cagctggatc 600

atcctaacct tgtgaaactg attggatact gcttggaaga ggagcacagg cttcttgttt 660

acgagtttat gactcgtggt agtcttgaga atcacttatt cagaagagga acattctatc 720

agccactttc atggaacacg cgggttcgta tggctcttgg tgcagctaga ggacttgctt 780

ttcttcacaa tgctcaaccg caagttatat accgagactt caaagcatct aacatcttgc 840

tagattcgaa ctacaacgca aagctttcgg atttcggttt ggctagagat ggtccaatgg 900

gtgacaacag ccatgtttct accagagtca tgggaactca gggatacgct gctccagaat 960

atctagctac aggtcattta tcggtgaaga gcgatgtata cagttttggg gttgtgttac 1020

tggagttgtt atcaggaaga cgagcaattg acaagaatca accagtagga gaacacaatc 1080

tcgtggattg ggcaagaccc tacttaacaa acaagagaag acttctgcga gtgatggatc 1140

ctcgtctcca aggtcaatac tcactaaccc gagctttgaa aattgcagtt cttgcactcg 1200

attgcatatc tatagatgcc aagagtagac cgaccatgaa cgaaatcgtc aagacaatgg 1260

aagaacttca tatccagaag gaagcatcaa aagagcagca gaatcctcaa atcagcattg 1320

acaacatcat caacaaatct ccacaagctg tgaattatcc taggccttca attatgtaac 1380

aatcctaggc gagctattta ccgggtttta gagatgtata gactctttac cttctgtctg 1440

tttagatatt atgttgtttg gtagtaacaa aagagctggc aatgtaaggg agagaaggaa 1500

acttactagt tgtaaactta ggttctctta caacgttcac atgttatctc acatacaaaa 1560

tgttatcagg 1570

<210>3

<211>389

<212>PRT

<213>Arabidopsis thaliana

<400>3

Met Gly Gly Cys Phe Ser Asn Arg Ile Lys Thr Asp Ile Ala Ser Ser

1 5 10 15

Thr Trp Leu Ser Ser Lys Phe Leu Ser Arg Asp Gly Ser Lys Gly Ser

20 25 30

Ser Thr Ala Ser Phe Ser Tyr Met Pro Arg Thr Glu Gly Glu Ile Leu

35 40 45

Gln Asn Ala Asn Leu Lys Asn Phe Ser Leu Ser Glu Leu Lys Ser Ala

50 55 60

Thr Arg Asn Phe Arg Pro Asp Ser Val Val Gly Glu Gly Gly Phe Gly

65 70 75 80

Cys Val Phe Lys Gly Trp Ile Asp Glu Ser Ser Leu Ala Pro Ser Lys

85 90 95

Pro Gly Thr Gly Ile Val Ile Ala Val Lys Arg Leu Asn Gln Glu Gly

l00 105 110

Phe Gln Gly His Arg Glu Trp Leu Ala Glu Ile Asn Tyr Leu Gly Gln

115 120 125

Leu Asp His Pro Asn Leu Val Lys Leu Ile Gly Tyr Cys Leu Glu Glu

130 135 140

Glu His Arg Leu Leu Val Tyr Glu Phe Met Thr Arg Gly Ser Leu Glu

145 150 155 160

Asn His Leu Phe Arg Arg Gly Thr Phe Tyr Gln Pro Leu Ser Trp Asn

165 170 175

Thr Arg Val Arg Met Ala Leu Gly Ala Ala Arg Gly Leu Ala Phe Leu

180 185 190

His Asn Ala Gln Pro Gln Val Ile Tyr Arg Asp Phe Lys Ala Ser Asn

195 200 205

Ile Leu Leu Asp Ser Asn Tyr Asn Ala Lys Leu Ser Asp Phe Gly Leu

210 215 220

Ala Arg Asp Gly Pro Met Gly Asp Asn Ser His Val Ser Thr Arg Val

225 230 235 240

Met Gly Thr Gln Gly Tyr Ala Ala Pro Glu Tyr Leu Ala Thr Gly His

245 250 255

Leu Ser Val Lys Ser Asp Val Tyr Ser Phe Gly Val Val Leu Leu Glu

260 265 270

Leu Leu Ser Gly Arg Arg Ala Ile Asp Lys Asn Gln Pro Val Gly Glu

275 280 285

His Asn Leu Val Asp Trp Ala Arg Pro Tyr Leu Thr Asn Lys Arg Arg

290 295 300

Leu Leu Arg Val Met Asp Pro Arg Leu Gln Gly Gln Tyr Ser Leu Thr

305 310 315 320

Arg Ala Leu Lys Ile Ala Val Leu Ala Leu Asp Cys Ile Ser Ile Asp

325 330 335

Ala Lys Ser Arg Pro Thr Met Asn Glu Ile Val Lys Thr Met Glu Glu

340 345 350

Leu His Ile Gln Lys Glu Ala Ser Lys Glu Gln Gln Asn Pro Gln Ile

355 360 365

Ser Ile Asp Asn Ile Ile Asn Lys Ser Pro Gln Ala Val Asn Tyr Pro

370 375 380

Arg Pro Ser Ile Met

385

<210>4

<21l>389

<212>PRT

<213>Arabidopsis thaliana

<400>4

Met Gly Gly Cys Phe Ser Asn Arg Ile Lys Thr Asp Ile Ala Ser Ser

1 5 10 15

Thr Trp Leu Ser Ser Lys Phe Leu Ser Arg Asp Gly Ser Lys Gly Ser

20 25 30

Ser Thr Ala Ser Phe Ser Tyr Met Pro Arg Thr Glu Gly Glu Ile Leu

35 40 45

Gln Asn Ala Asn Leu Lys Asn Phe Ser Leu Ser Glu Leu Lys Ser Ala

50 55 60

Thr Arg Asn Phe Arg Pro Asp Ser Val Val Gly Glu Gly Gly Phe Gly

65 70 75 80

Cys Val Phe Lys Gly Trp Ile Asp Glu Ser Ser Leu Ala Pro Ser Lys

85 90 95

Pro Gly Thr Gly Ile Val Ile Ala Val Lys Arg Leu Asn Gln Glu Gly

100 105 110

Phe Gln Gly His Arg Glu Trp Leu Ala Glu Ile Asn Tyr Leu Gly Gln

115 120 125

Leu Asp His Pro Asn Leu Val Lys Leu Ile Gly Tyr Cys Leu Glu Glu

130 135 140

Glu His Arg Leu Leu Val Tyr Glu Phe Met Thr Arg Gly Ser Leu Glu

145 150 155 160

Asn His Leu Phe Arg Arg Gly Thr Phe Tyr Gln Pro Leu Ser Trp Asn

165 170 175

Thr Arg Val Arg Met Ala Leu Gly Ala Ala Arg Gly Leu Ala Phe Leu

180 185 190

His Asn Ala Gln Pro Gln Val Ile Tyr Arg Asp Phe Lys Ala Ser Asn

195 200 205

Ile Leu Leu Asp Ser Asn Tyr Asn Ala Lys Leu Ser Asp Phe Gly Leu

2l0 215 220

Ala Arg Asp Gly Pro Met Gly Asp Asn Ser His Val Ser Thr Arg Val

225 230 235 240

Met Gly Thr Gln Gly Tyr Ala Ala Pro Glu Tyr Leu Ala Thr Gly His

245 250 255

Leu Ser Val Lys Ser Asp Val Tyr Ser Phe Gly Val Val Leu Leu Glu

260 265 270

Leu Leu Ser Gly Arg Arg Ala Ile Asp Lys Asn Gln Pro Val Gly Glu

275 280 285

His Asn Leu Val Asp Trp Ala Arg Pro Tyr Leu Thr Asn Lys Arg Arg

290 295 300

Leu Leu Arg Val Met Asp Pro Arg Leu Gln Gly Gln Tyr Ser Leu Thr

305 310 315 320

Arg Ala Leu Lys Ile Ala Val Leu Ala Leu Asp Cys Ile Ser Ile Asp

325 330 335

Ala Lys Ser Arg Pro Thr Met Asn Glu Ile Val Lys Thr Met Glu Glu

340 345 350

Leu His Ile Gln Lys Glu Ala Ser Lys Glu Gln Gln Asn Pro Gln Ile

355 360 365

Ser Ile Asp Asn Ile Ile Asn Lys Ser Pro Gln Ala Val Asn Tyr Pro

370 375 380

Arg Pro Ser Ile Met

385

<210>5

<211>2205

<212>DNA

<213>Artificial sequence

<220>

<223>synthetic construct

<400>5

gtttatactt tatagaaact atggaaccaa gcaaaggcat ttgctttgaa ggccttaaac 60

tatattaaaa agccataatc atttcctaaa tatgccttgc ttaattagcg agaatctagc 120

aacacagaga caaaaatcca acagctaagc aacaacagat aaagttgaaa ctaagttaag 180

ccattaacaa tcttttgatt tgattaagta gttaatcccc agttaatttt tcagtctctt 240

ttggttgctt gtaatctgtg ctgctactag taaagacaga gaaccaacaa agcaagtcaa 300

ccaaccatct aatctatggc tttttcagtt ttcaccaaca aaaagtccaa aaaaaacttc 360

ataagtacca tagagaatca agaaaagcaa taaaacccct ttttcctctt gtccttttac 420

ttccaacttt cttgtcataa tttttttcat tcataggcaa gtggggttaa acaattacag 480

ccctggtcat cagaaagttt caatcttttt cttttatctc caaagttact gccatttcat 540

gatgtagagg aagattcttg ggttcacact agatctgggg ttcaatgaac ttttggggtt 600

tgtattgaag taacaactgg tgttaatctg tgcatataat gatgaaaact tgagttttgc 660

agtttgtctg gtggctagtg gagctaaaaa agattgaatt tttgggtttt tttttgctct 720

aatggggatt tgtctgagta accaaatcaa ggctgagaca acattttata ctgtttcagg 780

gttggattca agaaatgtca gtggaaatgg taccgatatt agtaattcga atagcaaaca 840

ctcatcagct tccgtacccc caactcctcg gagtgagggt gagatcttgc agtcatccaa 900

cttgaggagc ttcactttca gtgaactccg atctgcaact agaaatttcc gtcctgacag 960

tgtagtagga gaaggaggtt ttggctcggt tttcaaaggg tgggtcgacg agcatactct 1020

tgcagcatca aagcctggca cagggattgt gatagctgtg aaaaagttaa accaagaagg 1080

gtggcagggg cacagagaat ggctggctga gataaactat cttgggcaac tgcaccatcc 1140

aaatcttgta aatttgatcg gttattgctt agaggaagat cacaggctct tggcctatga 1200

gtttatgcct aagggtagca tggagaatca tctatttagg agaggttcat tctaccaacc 1260

actttcttgg agccttcgta tgaaagttgc acttggtgct gcaaggggcc ttgcgtttct 1320

tcataatgct gaaacaaaag ttatttacag ggacttcaag acttctaata ttctgctgga 1380

ctcggactac aatgccaagc tttctgattt tgggttggcc agagatggtc ccataggtga 1440

tcagagccac gtgtctactc gggttatggg aacttatggc tatgctgctc cagagtatct 1500

atccacaggc catcttactg ccaagagtga tgtatacagc ttcggagttg ttctcttgga 1560

aattctatca ggtaagaaag caatagacaa gaatcgacca acaggggagc acaatcttgt 1620

cgagtgctca agaccttact tgaccagtaa acgtagagtt ttccgtgttc tagattctcg 1680

acttgaagga caatactcac tcactcgtgc ccttaaggta gccaacgttg cacttcaatg 1740

cctagccatg gaccccaagt caagaccaac tatggatgag gtagtaacag ctctagagca 1800

gctacaagag tccaaggatc gcgtgaaaaa tgataaaaac aaggatcaac agttgaatcg 1860

acttagcagt caatcaagtg gcgagctcaa caagtcattc agaagcaatt cagaagagac 1920

tccgcgtgta gccaattatc ccagaccttc agcttccctt cgctctatct gaaaagacgg 1980

gaattcacat tcttggcgtg ccagttgtta acatccaatt ttaaggaact tctggcctgc 2040

aagtactact acaacacgaa taacatatcc agtgtagtcc cacaaaatgg gatatgtaag 2100

tgtaccaata taatcaacat gtatagtttt ctttttttga tgtttacttt gtctaataac 2160

tgttgaaatg aggattgatg agatgatgta taatggattg caagt 2205

<210>6

<211>1601

<212>DNA

<213>Artificial sequence

<220>

<223>synthetic construct

<400>6

ttttgataaa agttttcttt cttataaaga ttgaaacttt ggttcataaa ttttaatggg 60

ttcttgttta agtgttcgaa ttaaagcaga aagtcctctt catcatggag caagtgatgg 120

aagagagttg agtagtaggc attcatattc atcagctccg ttgactcctc gtagtcagag 180

tgaaatactt gaatcgtcga atctgaaaag ttttagtttc aatgaactcc gagtagccac 240

gaggaacttt cgtccagata gtgtgttggg agaaggtggt tttggttgtg tatttaaggg 300

ttggatagac gagaatacgt ttaaagctgc aaggccaggg actggattgg ttatagctgt 360

aaagagattg aaccaagaaa gctttcaagg tcacaaggaa tggctggcgg aaattactta 420

cctgagccag ctatctcatc ctaatctcgt gaagttgatt ggatattgct tagaagatga 480

acacaggctt ctggtgtacg aattcatgcc aagaggaagt ttggaaaatc atctattcag 540

aaggagtact tatttccaac cactatcatg gaatctccga atgaaggttg ctctcgaggc 600

agctaaggga ctgacatatc tccacagtcc agaagctaaa gttatatatc gggatttcaa 660

atcgtcgaac attttgcttg atgctaatta caatgcaaag ctttctgatt ttggattggc 720

gaaggatggg ccaatcgacg gtaaaagcca tgtctctact agagtaatgg gtacctttgg 780

ttatgctgct cccgagtata tggccacagg tcatataacc actagaagtg acgtatacag 840

tttcggggtt gttcttctag aaatgctgac aggccgtcga gtgatggaca aaaaccgacc 900

ccacggggaa cataatctga ttgaatgggc taaacctttc cttactagta aacgtaaagt 960

cctccatatt atggatcacc gtatagaagg tcagtactca gtggaaggag cactgagagc 1020

agcacttctt gcagtcaaat gcctggcatt agaacccaaa ttcaggccta aaatgcccga 1080

ggtagtaaag gcattggagc aacttcagaa cttgaatgaa tcaggaagtc tgaaacgcga 1140

aaccacacaa aggaagcatc acagaacctc aaccgatgaa gcttcaggaa gaaaaactac 1200

gtcttatccg aggccagctg cttctcccct tgttacatga atggagaatg aatggtaaca 1260

tctttaacca tatacacact acctgaaccg aaaggaaacg atgagacgac ttacttggtg 1320

aagatatatc tatatctgct gatagagcac gaagagtaat ttgatcaaat tcgcggacat 1380

tttatgagaa ggtatgctta tgatactaga ctgaatcttg gaatctagga actatgttgt 1440

aaatttgtat caattatgtt agcaatctac agttcttatt ttgatctagc tggaaattta 1500

acattgatgt tttcctcaca catctatgct aaattgactt ttgttgatca tcttttgaga 1560

gccaaagatg tgaaaaggac ttggtaactt atttgtactg c 1601

<210>7

<211>965

<212>DNA

<213>Artificial sequence

<220>

<223>synthetic construct

<400>7

caactgcggg aacgcgagag gagaatgccg tcgtcgcggc gcacgcccaa gttcagcagc 60

tccatttgtt acaacatcct gtcaagaatg ctgttgcaga gaggaagcat acccgcatct 120

catcagatat gagtgatcct tcaacaccta ggaaaattga agatgccaag aacatctcca 180

tatacaacga tgtgattgat ttcacattgt ttgaactcga gaccatcaca aagagcttcc 240

gtgctgacta cgttcttggt gaaggagggt ttgggactgt ttacaagggc tacatagatg 300

agaatgtcag ggttggtctg aagtcactac ctgttgcagt caaggtgctc aacaaagatg 360

gacatcaagg acacagagaa tggcttactg aggttaggtt ccttgggcag ctaagacatc 420

caaatttagt caagttgatt gggtattgct gcgaagatga ccacaggctg cttgtgtacg 480

agttcatgtt tcgaggaagt ctagaaaacc acttattccg aaggacagct actccactat 540

cctgggctac taggatgtcg attgcattag gggctgccaa agggttagct tgcctccaca 600

atgctgaaag gccaattatc tacagggatt tcaagacatc aaatattctg ctggactcag 660

attatactgc taaactctct gactttggtc tggcaaaagc tggcccagaa ggcgatcaaa 720

cccatgtatc aacacgggtg atgggaacat atggttatgc tgcccctgaa tacgtgatga 780

ctggtcactt gactgctaga agtgatgtct acagctttgg tgttgtcctt cttgaactct 840

tgaactgggc gtaagtccat cgacaagtca cggcccagta gggagcacag cttggttgac 900

tgggccctcc tgaaactgaa cgacaagagg aggcttctcc aaatcattga cccaaaactg 960

gaggg 965

<210>8

<211>1242

<212>DNA

<213>Artificial sequence

<220>

<223>synthetic construct

<220>

<221>misc_feature

<222>(1207)..(1207)

<223>nisa，c，g，or t

<220>

<221>misc_feature

<222>(1216)..(1216)

<223>nisa，c，g，or t

<400>8

gtccagacac agtcacgcac caagcaagca ccacggggag ggactctgtc ttctcttttc 60

tattctccct cctctcctct ccaccaacaa cgtcctttgt tttctattat taccacttcc 120

aagaactagt ataatataat ttcttgcttc tccatcggta ttctatcaaa atattatagt 180

gatattttct tttttgtatt tgtacttgac cgaacccaaa aataaacagc ctccaagtct 240

tcgtctttat ctattataat gtgacatggt ggtttcttct tgatttctct caccaagaca 300

ccagaagaag aatttaggat tccaatagcg gttgctttgc tttggtttac caaatgggca 360

actgcttaga ttcttctgct gctaaagtag attccactca gagttcatat actcctgcat 420

caggagcctc aagaatttcc agcagaacca gccgttcttc agttccttct agtctgacca 480

tcccatcata cagtgggaag agcagttctg aatgttttcc tacaccaagg agtgaaggtg 540

aaatattgtc atctccaaat ttaaaggcct tctcattcaa cgagctaaaa agtgccacca 600

gaaacttccg tcccgacagt cttctcggtg aaggtggctt tggttgtgtt ttcaaaggat 660

ggattgatga aaacacgttg actgcttcaa agcctggatc aggaatggtt gtggcagtca 720

agaagcttaa acctgaaggt ttccaaggcc acaaggagtg gttgacagaa gttaattatc 780

ttggccaact tcatcatcca aatctggtta aattgattgg gtactgcgtg gaaggtgaga 840

accgacttct ggtctatgag ttcatgccta aagggagctt ggagaatcat ctgttcagaa 900

gaggaccaca gccactttca tgggcagtaa gggtcaaagt ggctataggt gctgccagag 960

ggctctcttt tcttcatgat gcgaaatcac aagtcatata ccgtgacttc aaggcatcta 1020

atattctact agatgcggaa tttaatgcaa aactttctga ttttggtctg gccaaggcag 1080

gccctactgg tgataggacc cacgtgtcca ctcaagttat gggtactcat gggtatgcag 1140

cacctgaata cgttgctaca ggtcggttga cagccaaaag tgatgtatac agctttgggg 1200

ttgtgtngct tgaatnattg tctgggcgac gggctgtaga ta 1242

<210>9

<211>1631

<212>DNA

<213>Artificial sequence

<220>

<223>synthetic construct

<400>9

gatccttctc ctctcatcaa accccaaatg atagaaagct gaaaaaaggg tttctgaaat 60

atcagctaat gttactgagt gcgtaatcat tgagatctgc cttcatcttg gggtgatttt 120

gttgatgggt gcttgctgga gtaataggat taaggctgtg agtccttcca atacagggat 180

cacttctaga agtgtcagca ggagtggcca tgacatcagc tcaaatagca ggagctcatc 240

agcctccata cccgtcactt ctcggagtga gggtgagatc ttgcaatctt ccaacttgaa 300

aagcttcagc tatcatgagc taagagcagc cacaagaaat ttccgccccg atagtgtctt 360

gggagagggc gggtttggtt cagtttttaa gggctggatt gatgagcatt cacttgctgc 420

taccaaacca ggaataggca agattgttgc tgttaagaag cttaaccaag atgggctcca 480

gggtcacaga gagtggttgg ctgaaataaa ctatcttggc caactacagc atcctaacct 540

tgtcaagtta ataggatact gctttgagga tgaacatcgg cttctggttt atgaatttat 600

gcctaagggt agcatggaaa atcatctatt cagaagaggt tcttactttc agccattctc 660

ttggagtttg cgaatgaaaa tagcactagg ggctgcaaag ggtcttgctt ttcttcatag 720

tacagaacat aaagtcatat accgtgactt taaaacgtca aatatcctac tcgatacaaa 780

ctataatgcc aaactttctg attttgggtt ggccagagat ggtcctactg gtgataaaag 840

ccatgtctct actagggtca tgggaacccg tggatatgcg gcaccagagt atttagcgac 900

aggtcatctc actaccaaga gtgatgtgta tagttttgga gtagttcttc tggaaatgat 960

atcaggaaga cgagctattg acaagaacca gccaactgga gagcataacc ttgttgaatg 1020

ggccaagcct tatctatcta ataaacgaag agtcttccgt gtaatggatc cccgtctcga 1080

aggtcaatat tcacagaatc gagctcaagc agcagctgcg cttgctatgc aatgtttttc 1140

cgtagagcct aagtgcaggc cgaatatgga tgaggtggta aaagcattgg aggagcttca 1200

ggaatcaaag aacatgcaga gaaaaggcgc tgatcataaa cagcatcatg tacgcaattc 1260

cggccccggc cgtaccaatg gtggcgatgg tggttcagat gcccctagaa aggcttctgc 1320

ttatcctaga ccttctgctt ctctcctccg cggttgagag aattttgtga tgcggcaagt 1380

agtaaagcat ataacaaaat tcggaggttt aggtgtggct ggcatgaacc atgtttatgt 1440

aagcaatgta tagtttgctt tatttccatg ttacattttg tgctatatat aatttttttt 1500

tctcgttgtg gttttgattg ttagacattc aagggtttaa tgtgggtcct taaggtgttc 1560

attaattttg aaccctgtaa acaactgcaa cactacccat gtggttgatt ctctacattt 1620

ttatctttgc t 1631

<210>10

<211>1620

<212>DNA

<213>Artificial sequence

<220>

<223>synthetic construct

<400>10

tttttttttt ttttttgccg cggcgggtct tttaagaagc atttcttaca ctctcaagaa 60

cattcaaact ggaatcttgc ggtgaagtgg aacaaaagaa cttacccttt gaaccgctgg 120

tacatcgaag actaataaag tatgtaggta gagacccaag ttacaacgac gaagcaacta 180

gctgtacaca aagcaaggca atattatatt ctcttcacaa gccacttagc ccttcaaacc 240

ctcatccgtt ctctgttttt tactccccta aagtattaca ggaggatgct ccagactcca 300

cagaggtaga tggacatctt tttcagtgag cccttggcct ttgaagttgt tctaatgcag 360

tcacaacctg atccatgcca ggcctgcatc gtgcgtccat cgataagcat tgcagcgcca 420

gggttgccac cttctgagcc gcgggaaggg aatactggga acccagccgt gagtccagga 480

catgaatgac cctcctcttg ttggtgatgt aaggtctagc ccactccacc agattgtgct 540

gaccgggcgg gcggttcttg tccagagcgc gctgcccgga cagcagctcc agaagaacca 600

caccgtagct gtacacatcg ctcttcgctg tcaaatggcc tgtcgcaaga tattcagggg 660

cagcgtatcc ttgtgtcccc atgaccctag tagaaacatg gctcttatca ccgcttggac 720

cgtcctttgc caaaccgaaa tcagacagtt ttgcgttgta ctccgagtcg agaaggatat 780

tggaggtctt gaaatcgcgg tagataactt tggcctggtc gccgtgcagg aaagcaagac 840

ctctggcagc ctcgagagca accttcatgc gtaagttcca tgggagcggc tggaagttgg 900

agcccctcct gaagagatga tgctccaggc tccctctcgg catgtactcg tacacaagaa 960

gccgctgctc gtcctccaag cagtagccga tgagtttgac gagattaggg tgggataact 1020

gccccaggta attgacctcc gccagccatt cccggtgccc ttggaagctg tcgagcttga 1080

gcttcttgac ggcgacgatg atcccggcgc ccggcctgac gggcgcgagc gtgcgctcat 1140

ccatccaccc cttgaacacg gacccgaagc ccccctcccc gagcaggctg tccggcctga 1200

agttcctcgt ggagcctttg agctcgccga agctgaactt gcggacattc gacgactcca 1260

ggatctccgc ctccgtacga ggggttggcg gcaccgacga cgacgagccg gacgtcttgg 1320

tgccgaaggt gctggtgtcg gccgcgttct tgctgacgct cttagaaccg gcggtccctg 1380

aggaattggg ggcactgaag gaagggttga tctcggcgtt cccctccacg ccggcgcagt 1440

tccccatcag gaacgagctc tcgcggcagc gcgcaggcgg ggggggagag ggaggtagaa 1500

gcggctagct gaactacgtc tgggtttatt tgcctcgtgg tgtcatcctc tcgctgcgtg 1560

ggaaggaggt gatgagtaca atggctgctg cagtgcttgc ccggctggct ctggctctgg 1620

<210>11

<211>632

<212>DNA

<213>Artificial sequence

<220>

<223>synthetic construct

<400>11

gtgatttcaa agcttctaat attctactag atgcggaatt caatgcaaaa ctttctgatt 60

tcggattggc caaggcaggg cctactggcg atagaactca tgtatcgact caggttatgg 120

gaactcaagg ctatgcagca cctgaatatg tcgccacagg tcgattgacg gctaagagcg 180

atgtttacag ctttggagtt gttttgctcg aactactgtc tggacagcgt gctgttgata 240

aaacaaaagt tggcgtggag cggagtctag taaactgggc aaaaccatat ttgggtgaca 300

aaagaaaatt attccgaatc atggacacga agttgggtgg ccagtacccc cagaaaggtg 360

cttttacggc agctaccctt gctttacagt gcctaaatag tgaagctaaa ctcaggcctc 420

gaatgtcaga agttttggca gcactggagc agctagaagc ccccaaaact gcatcaaaac 480

acagtcaagc agaacagcat gctgttccac ttcctgttcg gagatcccca atgcgacacc 540

atcgatcacc tatgcatcta acacccagtg catctccatt gccatctcac agacaatccc 600

cgcgggtaca ttgagattcc atctgtaaat tc 632

<210>12

<211>1921

<212>DNA

<213>Artificial sequence

<220>

<223>synthetic construct

<400>12

attcggcacg agggatccca ccacccgccg ctctcattcg cagctccgtt cccacctgag 60

cccagccggt cggtggctgc cggcagcaac ctgctgctac ttccgttgct cctcctccct 120

cccctcccac tccctctcag ccccagctcg agcgagagag catctccctc ccgagcgacc 180

gcgtccgcct ccctcccctg ccccccgtgc ggttcttggt gacggcgcgg cggcttggct 240

ggccggcctc gcctccagtt gacccgactg actctccccc attcggtcag cccggaggag 300

gaggaggagg cggaggggat ttgcttgact ttttgaagct tctcgctcgt ttctctccta 360

gcgttgcggc tgccggccaa cggcctcgcg gatttttctc cagtctcacc ccctccttca 420

agtggcggcg gagatcagct ggatccaaaa gcctcgccag aaaccggctg ggactctagg 480

gttggctgct cagctcagtt gtcttcggcg gctgctcctc ctgatccctc ccgttgccgc 540

tggccagctc tctctggctt tgctgacttg acccgggacg ggggaaagag gagcagagtt 600

cgcctgtgga tcttcgggaa aggaagctca ttcatcctgt cagctgggag gtagaggaag 660

agatggggaa ctgcatgaag tccacggccc gggtggatca cagcatgaac actagtgccg 720

cctatccatc gaaagtgacc agcaaaacaa gcatgtcatc tgctacttct gcgagcaaga 780

ccaactcaac tcgttcaacg tttactctgc catctataag agatcgcagc gagccgcctc 840

ggacagaagg cgaaatcttg tcatcgtcga acttgaaggc cttcttgttc aatgatctta 900

aaaatgcgac caagaacttc cgcccggaca gtcttcttgg ggaaggaggg tttgggcatg 960

ttttcaaagg ttggattgat gaacacactc ttgctccttc gaaaccggga agcggtatgg 1020

ttgttgctgt caagaagctt aaaccagaag gtttccaagg gcacaaggaa tggctgacgg 1080

aggttaacta ccttggccaa cttcaccatg ccaatcttgt taagctcatt ggttattgct 1140

cagatggtga caacagactt ctggtgtatg agttcatgcc caagggaagt ttggagaatc 1200

atctgttcag aagaggtgct gatcctttat catggggaat aaggcttaag gttgctatcg 1260

gggctgctaa gggtttgtca tttttacatc atgctgaaaa ccaagttata taccgtgatt 1320

tcaaggcatc aaacattctt cttgactcgg aattcaacgc gaagctttca gattttggat 1380

tggcgaaagc tggtccaact ggggataaaa ctcatgtttc cacacaagtg atgggcaccc 1440

atggatatgc agctccagag tatatcgcaa caggtcgcct ctctgctaag gcagacgtct 1500

acagcttcgg ggtggtgttg cttgagttgc tgaccgggag acgagccctg gacaagtcaa 1560

agccaggcat agagcagaac ctagtggact gggccaaacc gcacctgcgc gacaagcgca 1620

ggctgtaccg tgtcatggac acgaagctgg gaggccagta tcctaagaaa ggcgcacacg 1680

ccgtcgcgaa cctcgccttg caatgcatct gcaacgacgc caagatgcgg ccgcagatct 1740

cagaggtctt agaagagctg gagcagctcc aagactccaa aagcaatata gtgtcgccgc 1800

aggttgacat ccggaggacc tccaacaccg tcccgaagtc gccaatgagg ggccaaccct 1860

cgccgcggcg ctctcttgga gcgatggcgc cccgtcaccg gcttttagga ccgcgcaagt 1920

g 1921

Claims

1.包括植物转化载体的转基因植物，该植物转化载体含有编码或互补于编码包括SEQ ID NO：3或4的氨基酸序列的HIO1005多肽或其直系同源物的序列的核苷酸序列，由此相对于对照植物，该转基因植物具有高油表型。

2.权利要求1的转基因植物，其选自油菜籽，大豆，玉米，向日葵，棉花，可可，红花，油棕，椰子，亚麻，蓖麻和花生。

3.从权利要求1的植物获得的植物部分。

4.权利要求3的植物部分，其是种子。

5.从权利要求4的种子生产的粗粉，饲料或者食品。

6.一种生产油的方法，其包括培育权利要求1的转基因植物，以及从所述植物回收油。

7.权利要求6的方法，其中的油回收自所述植物的种子。

8.产生高油表型植物的方法，所述方法包括：

a)把植物转化载体导入到植物的祖细胞中，该植物转化载体含有编码或互补于编码包括SEQ ID NO：3或4的氨基酸序列的HIO1005多肽或其直系同源物的序列的核苷酸序列，和

b)培育该转化的祖细胞以生产转基因植物，其中表达所述的多核苷酸序列，而且相对于对照植物，所述的转基因植物显示改变的含油量表型。

9.通过权利要求8的方法获得的植物。

10.权利要求9的植物，其选自油菜籽，大豆，玉米，向日葵，棉花，可可，红花，油棕，椰子，亚麻，蓖麻和花生。

11.产生具有高油表型植物的方法，包括鉴定具有HIO1005基因的等位基因的植物以及产生所述鉴定的植物的子代，所述HIO1005基因的等位基因引起与缺少该等位基因的植物相比含油量的增加，其中产生的子代遗传该等位基因并且为高油表型。

12.权利要求11的方法，其使用候选基因/QTL法。

13.权利要求11的方法，其使用TILLING法。

14.饲料，粗粉，谷粒，食物或者种子，包含由SEQ ID NO：1或2的核酸序列编码的多肽。

15.饲料，粗粉，谷粒，食物或者种子，包括含有SEQ ID NO：3或4的氨基酸序列或者其直向同源物的多肽。