CN1728941A

CN1728941A - 生产改变含油量的植物

Info

Publication number: CN1728941A
Application number: CN200380107110.8A
Authority: CN
Inventors: 斯特凡妮·K·克伦德宁; 乔纳森·莱特纳
Original assignee: Agrinomics LLC
Current assignee: Agrinomics LLC
Priority date: 2002-12-18
Filing date: 2003-12-18
Publication date: 2006-02-01
Anticipated expiration: 2023-12-18
Also published as: AU2003299827A8; CN100523191C; US20060168686A1; EP1571898B1; EP1571898A2; WO2004056969A2; EP1571898A4; AU2003299827A1; US7750205B2; DE60333666D1; ATE476098T1; ZA200505149B; MXPA05006759A; CA2509840C; WO2004056969A3; BR0316889A; CA2509840A1

Abstract

本发明涉及由于改变HIO102核酸表达显示改变含油量表现型的植物。本发明还涉及产生具有改变含油量表现型的植物的方法。

Description

生产改变含油量的植物

相关申请

本申请要求2002年12月18日提交的美国临时专利申请60/434,795的优先权，其内容全部引入作为参考。

发明背景

控制农作物种子的组合物，尤其是种子油类的含量和组合物的能力在涉及加工食品油类以及动物饲养油类的农业工业中具有重要的应用价值。农作物的种子含有多种有价值的组分包括油类，蛋白以及淀粉。工业生产过程可以分离若干或所有这些组分用于专门应用的单独销售。例如，几乎60％的美国大豆农作物通过大豆加工工业进行压榨。大豆加工产生高价销售的精炼油，而残余物主要作为低价值的饲料销售(US Soybean Board，2001 Soy Stats)。加拿大油菜(canola)种子被压榨产生油类以及副产品加拿大油菜粗粉(加拿大加拿大油菜协会)。几乎20％的1999/2000年的美国谷物农作物经过工业化精炼，主要用于产生淀粉，乙醇以及油类(谷物精炼业者协会)。因此，常常需要使种子的含油量最大化。例如，对于诸如大豆以及加拿大油菜的加工含油种子而言，提高种子的绝对含油量将提高这种谷物的价值。对于加工的谷物而言，可能需要根据其它主要组分的应用提高或者降低含油量。降低油类可以通过降低与油类氧化相关的不希望的味道改善分离淀粉的质量。或者，在味道不重要的乙醇产生中，提高含油量可以提高总的价值。在许多谷物饲料中，诸如谷物以及小麦，可能希望提高植物含油量，因为油类比诸如碳水化合物的其它种子组分具有较高的能含量。含油种子加工，就像大多数谷物加工业一样是资金密集产业；因此产品从低值组分到高价值油类组分的分布的较小改变可能对于谷物加工者而言就有显著的经济影响。

油类的生物技术处理可以提供组成的改变以及油产量的改进。组成的改变尤其包括高油酸的大豆以及玉米油(美国专利6,229,033以及6,248,939)，以及含有月桂酸酯的种子(美国专利5,639,790)等。组成改变的工作主要集中在加工的含油种子但是已经可以很容易地延伸至非-含油种子农作物包括谷物。虽然对提高含油量具有相当的兴趣，在这一领域目前唯一实践的生物技术是高油类谷物(HOC)技术(杜邦，美国专利5,704,160)。HOC利用通过标准的选择育种连同生产系统中称为顶交的优良品种(不孕雄性)杂交雌性得到的高油类授粉者。顶交高油类系统使玉米收获的谷物含油量从～3.5％提高到～7％，改善了谷物的能含量。

虽然HOC生产系统已经卓有成效，但是其仍然具有固有的局限性。首先，担负全部的土地的种子栽植的低授粉者百分比的系统含有固有风险，尤其是在早年。第二，当前HOC领域含油量已经平稳在大约9％的油类。最后，高油类谷物主要不是生物化学变化，而是对于提高含油量产生间接结果的解剖学上的突变体(提高胚芽芽尺寸)。为此，可选择的高油类策略，尤其是来源于改变生化产量的高油类策略将是非常重要的。

操作油市场最明显的目标农作物是大豆以及油菜籽，并且大量商业工作(例如美国专利5,952,544；PCT申请WO9411516)证明拟南芥是这些农作物油类代谢的优良模型。植物油组合物的生物化学筛选已经鉴定了许多关键生物合成酶的拟南芥基因并且导致农业上重要基因的直向同源物的鉴定。例如，利用化学诱变处理群的筛选已经鉴定了其种子显示脂肪酸成份改变的脂类突变体(Lemieux B等1990，TheorAppl Genet 80，234-240；James DW以及Dooner HK(1990)Theor ApplGenet 80，241-245)。检测脂肪酸成份改变的T-DNA诱变筛选(Feldmann等，Science 243：1351-1354，1989)鉴定了ω3脱氢酶(FAD3)以及δ-12脱氢酶(FAD2)基因(美国专利5952544；Yadav NS等(1993)Plant Physiol103，467 476；Okuley等，Plant Cell.1994 Jan；6(1)：147-58)。集中在含油量而非油类质量的筛选分析化学上诱导的皱缩种子或籽粒容量改变的突变体，据此推断出改变的植物含油量(Focks N以及Benning C，Plant Physiol 118：91-101，1998)。用来鉴定参与非常长链脂肪酸产生的酶的另一种筛选鉴定了编码负责降低种子中三酰甘油聚集的甘油二酯酰基转移酶(DGAT)的基因的突变(Katavic V等，Plant Physiol.1995May；108(1)：399-409)。此外，还显示DGAT cDNA的种子特异性过量表达与提高的植物含油量有关(Jako等，Plant Physiol.2001 Jun；126(2)：861-74)。

植物中激活标记是指通过在植物基因组中插入含有调节序列(例如增强子)的异源核酸构建体产生随机突变的方法。调节序列可以用来增强一种或多种天然植物基因的转录；因此，激活标记是产生增益功能，通常是显性突变体的卓有成效的方法(参见，例如，Hayashi等，Science(1992)258：1350-1353；Weigel等，Plant Physiology(2000)122：1003-1013)。插入的构建体提供了快速鉴定野生型植物错误表达产生突变表现型的分子标记表现型。激活标记可能同时引起功能表现型的丧失。插入可以引起野生型植物基因的断裂，而在这样情况下表现型通常是隐性的。

激活标记已被用于不同种中，包括烟草以及拟南芥，以鉴定许多不同种类的突变表现型以及与这些表现型相关的基因(Wilson等，PlantCell(1996)8：659-671，Schaffer等，Cell(1998)93：1219-1229；Fridborg等，Plant Cell(1999)11：1019-1032；Kardailsky等，Science(1999)286：1962-1965)；Christensen S等，9th International Conference onArabidopsis Research.Univ.of Wisconsin-Madison，June 24-28，1998.Abstract 165)。

发明概述

本发明提供了具有高油类含量表现型的转基因植物。转基因植物包括含有编码或互补于编码HIO102多肽的序列的核苷酸序列的转化载体。在优选的实施方案中，转基因植物选自油菜，大豆，谷物，向日葵，棉花，可可粉，红花，油棕，椰子，亚麻蓖麻以及花生。本发明还提供了产生油类的方法，包括培育转基因植物以及从所述植物回收油类。

本发明的转基因植物通过包括向植物的祖细胞引入含有编码或互补于编码HIO102多肽的序列的核苷酸序列的植物转化载体，以及培育转化的祖细胞产生转基因植物的方法产生，其中HIO102多核苷酸序列的表达产生高油类含量表现型。

发明详述

定义

除非另有陈述，这里使用的全部技术以及科学名词具有与本领域技术人员知晓的相同的含义。专业人员尤其是参考Sambrook等的分子克隆实验指南(第二版)，Cold Spring Harbor Press，Plainview，N.Y.，1989，以及Ausubel FM等的Current Protocols in MolecularBiology，John Wiley & Sons，New York，N.Y.，1993的定义以及术语。应该理解本发明不限于所描述的特定方法，流程以及试剂因为这些可以改变。

此处所述的术语“载体”是指设计用于在不同宿主细胞之间转移的核酸构建体。“表达载体”是指可以在异源细胞中整合并表达异源DNA片段的载体。许多原核以及真核生物表达载体是可以市售获得的。选择合适的表达载体是本领域述人员所熟知的。

“异源的”核酸构建体或序列具有一部分序列不是植物细胞的野生型序列但是在其中表达。异源的控制序列是指不天然调节目前正在调节的相同基因表达的控制序列(即启动子或增强子)。通常，异源核酸序列不是它们所存在于的细胞或者基因组的一部分所内源产生的，并且已经通过传染，转染，显微注射，电穿孔法等加入至细胞中。“异源的”核酸构建体可以含有控制序列/DNA编码序列组合，其与野生型植物中发现的控制序列/DNA编码序列组合相同或者不同。

此处所述的术语“基因”是指参与多肽链产生的DNA片段，其可能包括或者不包括编码区之前以及之后的区域，例如5′非翻译区(5′UTR)或者“前导”序列以及3′UTR或者“尾部”序列以及单独的编码片段(外显子)以及非-转录调节序列之间的内含子序列(内含子)。

这里使用的“重组体”包括已经通过引入异源的核酸序列进行修饰的细胞或者载体，或者所述细胞来源于如此修饰的细胞。因此，例如，重组细胞表达在天然(非-重组体)形式的细胞内没有发现相同形式的基因或者表达在人为干预下完全表达或者完全不表达的异常表达的天然基因。

此处所述的术语“基因表达”是指基于基因的核酸序列产生多肽的方法。所述方法包括转录以及翻译；因此“表达”可以是针对多核苷酸或者多肽序列或者两者。有时，多核苷酸序列的表达不会引起蛋白翻译。“过量表达”是指相对于其在野生型(或者其它的参考[例如，非-转基因])植物中的表达，多核苷酸和/或多肽序列表达增加并且可能涉及自然存在或者非-自然存在的序列。“异位表达”是指在非-改变或者野生型植物中不自然发生的，在某时，某地和/或提高水平的表达。“下调表达”是指多核苷酸和/或多肽序列，通常是内源性基因相对于其在野生型植物中表达的降低表达。术语“错误表达”以及“改变表达”包括过量表达，下调表达以及异位表达。

在将核酸序列插入细胞的概念中，术语“引入的”是指“转染”，或者“转化”或者“转导”，并且包括针对核酸序列整合到真核或者原核细胞，其中核酸序列可以整合入细胞的基因组(例如染色体，质粒，质体或者线粒体DNA)，转化为自主复制子，或者瞬间表达(例如，转染的mRNA)。

本文使用的“植物细胞”是指来源于植物的任意细胞，包括来自未分化的组织(例如愈伤组织)以及植物种子，花粉，繁殖体(progagules)并且胚芽的细胞。

此处所述的术语“天然的”以及“野生型”相对于给定植物特性或者表现型是指具有在相同种类的植物本身发现的特征或者表现型的形式。

此处所述的术语关于植物特性的“修饰的”是指转基因植物相对于类似的非-转基因植物的表现型的改变。“改变含油量的表现型”是指基因修饰植物的可测量的表现型，其中植物与类似的但是非-修饰的植物相比显示总含油量的统计上显著的增减(即，油类相对种子质量的百分比)。高油类表现型是指总含油量的增加。

本文使用的“突变体”多核苷酸序列或者基因与相应的野生型多核苷酸序列或者基因是在序列或者表达上不同，其中的差异导致修饰的植物的表现型或者特性。相对于植物或植物株系，术语“突变体”是指植物或者株系具有修饰的植物表现型或特性，其中修饰的表现型或特性与野生型多核苷酸序列或基因的修饰表达有关。

此处所述的术语“T1”是指来自T0植物的种子的植物子代。T1子代是可通过应用选择性试剂筛选的第一系列转化的植物，所述的选择性试剂为例如抗生素或除草剂，由此转基因植物含有相应的抗性基因。术语“T2”是指通过T1植物的花进行自体受精产生的植物子代，所述T1植物之前被筛选作为转基因植物。T3植物是由T2植物等产生的。这里所述的特定植物的“直系子代”来源于所述植物的种子(或者，有时来自其它的组织)且是直接紧接的子代；例如，对于特定的家系而言，T2植物是T1植物的直系子代。特定植物的“间接子代”来源于所述植物直系子代的种子(或其它组织)，或来自该家系随后子代的种子(或其它组织)；例如，T3植物是T1植物的间接子代。

此处所述的术语“植物的部分”包括任意的植物器官或组织，包括，但不限于种子，胚芽，分生组织区域，愈伤组织，叶，根，芽，配子体，孢子体，花粉，和小孢子。植物细胞可获自任意的植物器官或组织以及由其制备的培养物。可用于本发明方法的植物种类通常是广泛的，其可以是可用于转化技术的高等植物，包括单子叶的和双子叶的植物。

在这里所述的“转基因植物”包括在其基因组内含有异源多核苷酸的植物。异源的多核苷酸可以稳定地整合到基因组中，或可以被插入到染色体外。优选地，本发明的多核苷酸被稳定地整合到基因组中从而使多核苷酸被连续传代。植物细胞，组织，器官，或已被导入异源多核苷酸的植物被认为是“转化的”，“转染的”或“转基因的”植物。也含有该异源多核苷酸的转化植物或植物细胞的直系和间接子代也被视为是转基因的。

具有改变的含油量表现型的植物的鉴定

我们利用拟南芥活性标记筛选来鉴定我们命名为“HIO102”(At4g34250；GI#18418411：1-1482编码脂肪酸延长酶类蛋白(GI# 15235309)的基因和改变的含油量表现型(特定地，高的含油量表现型)之间的关联。简要地，以及如在实施例中进一步描述的，大量的拟南芥植物被用pSKI015载体突变，其中pSKI015载体含有来自Agrobacterium tumifaciens的Ti质粒的T-DNA，病毒增强子元件，以及一个选择性标记基因(Weigel等，同上)。当T-DNA插入到转化植物的基因组时，增强子元件可引起通常在插入物的约10kb内的邻近基因的上调。T1植物被暴露于选择剂来特异性地获取表达选择性标记以及停泊T-DNA插入物的转化植物。由转化的T1植物收集大约15-20个T2种子的样品，并从全种子中提取脂类。进行气相色谱(GC)分析来测定种子样品的脂肪酸含量和组成。

鉴定显示出高-油表现型的拟南芥品系，其中油类(即，脂肪酸)构成种子质量的大约35％。通过分析所鉴定的品系中侧接于T-DNA插入物的基因组DNA序列发现了HIO102基因与高油表现型之间的关联。因此，HIO102基因和/或多肽可用于开发具有修饰的含油量表现型(“HIO102表现型”)的遗传修饰的植物。HIO102基因可用于产生由含油种子加工提供增加的油产量的含油种子农作物以及可用于产生提供动物饲养增加能的谷物饲料作物。HIO102基因可进一步地被用于增加特定油料作物的含油量，以增加目的稀有脂肪酸的产量。已被遗传修饰表达HIO102的转基因植物可用于产生油类，其中转基因植物被培育，以及通过常规方法由植物部分(例如种子)获取油类。

HIO102核酸和多肽

拟南芥HIO102核酸(基因组DNA)序列提供于SEQ ID NO：1以及Genbank中，登录号为GI#18418411：1-1482。相应的蛋白序列提供于SEQ ID NO：2中，登录号为GI#15235309。作为拟南芥HIO102的直向同源物或横向同源物的核酸和/或蛋白质，描述在下面实施例3中。

此处所述的术语“HIO102多肽”是指全长的HIO102蛋白或其片段，衍生物(变体)，或其“功能活性的”的直向同源物，是指该蛋白片段，衍生物，或直向同源物显示出一或多种或与SEQ ID NO：2多肽有关的功能性活性。在一个优选的实施方案中，当功能活性的HIO102多肽在植物中错误表达时产生改变含油量的表现型。在另一个优选的实施方案中，HIO102多肽的错误表达产生高含油量表现型的植物。在另一个实施方案中，当功能性活性的HIO102多肽在植物或植物细胞中表达时能够拯救缺陷的(包括不足的)内源性HIO102活性；拯救多肽可以是来自与缺陷活性种类相同或来自不同的种类。在另一个实施方案中，全长HIO102多肽的功能活性片段(即，具有SEQ ID NO：2序列或其天然存在的直向同源物的天然多肽)保持一或多个与全长HIO102多肽相关的生物学特性，诸如信号活性，结合活性，催化活性，或胞内或胞外定位活性。HIO102片段优选含有HIO102结构域，诸如C-或N-末端或催化结构域，尤其优选地含有至少10个，优选地至少20个，更优选地至少25个，且最优选地至少50个连续的HIO102蛋白的氨基酸。功能域可利用PFAM程序来鉴定(Bateman A等，1999Nucleic Acids Res 27：260-262；网址为pfam.wustl.edu)。优选的HIO102片段含有苯丙烯酰苯和1-2-二苯乙烯合成酶，C-末端结构域(PF02797)。全长HIO102多肽或其片段的功能性活性变体包括具有氨基酸插入、缺失或取代的并保持一或多种与全长HIO102多肽有关的生物学特性的多肽。有时，产生改变HIO102多肽翻译后加工的变体。例如，变体与天然的多肽相比可能具有改变的蛋白质转运或蛋白质定位特性或改变的蛋白半衰期。

此处所述的术语“HIO102核酸”包括具有SEQ ID NO：1序列或与其互补的序列的核酸，及其功能活性片段，衍生物或直向同源物。本发明的HIO102核酸可以是DNA，来源于基因组DNA或cDNA，或RNA。

在一个实施方案中，功能活性的HIO102核酸编码功能活性HIO102多肽或与编码功能活性HIO102多肽的核酸互补。此定义所包括的为充当初级RNA转录模板的基因组DNA(即，mRNA前体)，其中所述的初级RNA转录需要编码功能活性HIO102多肽之前的加工，诸如剪接。HIO102核酸可包括其它的非编码序列，其可被或可不被转录；此种序列包括5′和3′UTRs，尤其是本领域已知的调控基因表达的多聚腺苷酸化信号和调节序列。某些多肽需要加工事件，诸如蛋白水解，共价修饰等，以使其具有完全的活性。因此，功能活性核酸可编码成熟或预加工的HIO102多肽，或中间体形式。HIO102多核苷酸也可包括异源的编码序列，例如，编码包括的促进融合多肽纯化的标记或转化标记的序列。

在另一个实施方案中，功能活性的HIO102核酸可用于产生HIO102功能缺失的表现型，例如，通过反义抑制，共-抑制等等。

在一个优选的实施方案中，本发明方法中使用的HIO102核酸含有编码HIO102多肽或互补于编码HIO102多肽的序列的核酸序列，所述编码HIO102多肽的序列与SEQ ID NO：2的多肽序列具有至少50％，60％，70％，75％，80％，85％，90％，95％或更多的序列同一性。

在另一个实施方案中，本发明的HIO102多肽含有与SEQ ID NO：2的多肽序列具有至少50％或60％序列同一性的多肽序列，且可与SEQID NO：2的HIO102多肽序列具有至少70％，80％，85％，90％或95％或更高的序列同一性。在另一个实施方案中，HIO102多肽含有与SEQID NO：2所示多肽的功能活性片段具有至少50％，60％，70％，80％，85％，90％或95％或更高序列同一性的多肽序列，诸如苯丙烯酰苯和1-2-二苯乙烯合成酶，C-末端结构域。在另一个实施方案中，HIO102多肽含有与SEQ ID NO：2所示多肽的全长具有至少50％，60％，70％，80％或90％序列同一性的多肽序列，且包括苯丙烯酰苯和1-2-二苯乙烯合成酶，C-末端区域。

在另一方面，HIO102多核苷酸序列与SEQ ID NO：1所示HIO102核酸序列的全长，或与此HIO102序列互补的核酸序列具有至少50％到60％的同一性，且可包括与SEQ ID NO：1所示HIO102序列或其功能性活性片段，或互补序列具有至少70％，80％，85％，90％或95％或更高的序列同一性。

这里所述的，相对于特定的受试序列或其特定部分的“百分(％)序列同一性”，被定义为侯选衍生物的核苷酸或氨基酸序列与受试序列中核苷酸或氨基酸序列(或其特定部分)的同一性的百分比，在比对序列和引入缺口之后，如有必要来获得最大的百分序列同一性，如通过程序WU-BLAST-2.0a19(Altschul等，产生的J.Mol.Biol.(1997)215：403-410；比较网址：wustl.edu/blast/README.html)，检索参数设置为默认值。HSP S和HSP S2参数是动态值且通过程序本身根据特定序列的组成以及用于目标序列正在其中进行检索的特定数据库的组成来建立。通过匹配的相同核苷酸或氨基酸的数目除以所报道的百分比同一性的序列长度测定“％同一性值”。“百分(％)氨基酸序列相似性”通过进行测定％氨基酸序列同一性的相同计算来测定，但是包括除了计算中的相同氨基酸之外的保守氨基酸的取代。保守的氨基酸取代是其中的一个氨基酸被另一个具有类似特性的氨基酸取代而对蛋白的折叠或活性没有显著地影响。可彼此取代的芳族氨基酸为苯丙氨酸，色氨酸，和酪氨酸；可互换的疏水氨基酸为亮氨酸，异亮氨酸，甲硫氨酸，和缬氨酸；可互换的极性氨基酸为谷氨酰胺和天冬酰胺；可互换的碱性氨基酸为精氨酸，赖氨酸和组氨酸；可互换的酸性氨基酸为天冬氨酸和谷氨酸；且可互换的小氨基酸为丙氨酸，丝氨酸，苏氨酸，半胱氨酸和甘氨酸。

受试核酸分子的衍生核酸分子包括与SEQ ID NO：1核酸序列选择性杂交的序列。可通过温度，离子强度，pH和杂交和冲洗过程中变性剂诸如甲酰胺的存在来控制杂交的严格性。通常使用的条件是公知的(参见，例如，Current Protocol in Molecular Biology，Vol.1，Chap.2.10，John Wiley & Sons，Publishers(1994)；Sambrook等，Molecular Cloning，Cold Spring Harbor(1989))。在一些实施方案中，本发明的核酸分子能够在严格条件下杂交于含有SEQ ID NO：1的核苷酸序列的核酸分子：含有核酸的滤膜预杂交8小时在65℃含有6X单一浓度柠檬酸盐(SSC)(1X SSC为0.15NaCl，0.015M柠檬酸钠；pH 7.0)，5X Denhardt溶液，0.05％焦磷酸钠和100μg/ml 鲱鱼精DNA的溶液中过夜；以及在65℃含有6X SSC，1X Denhardt溶液，100μg/ml酵母tRNA和0.05％焦磷酸钠的溶液中杂交18-20小时；并在65℃在含有0.1X SSC和0.1％SDS(十二烷基硫酸钠)的溶液中冲洗滤膜1小时。在其它的实施方案中，所使用的温和严格杂交条件为：含有核酸的滤膜在40℃在含有35％甲酰胺，5X SSC，50mM Tris-HCl(pH 7.5)，5mM EDTA，0.1％PVP，0.1％PVP，聚蔗糖，1％BSA，和500μg/ml变性鲑精DNA的溶液中预处理6小时；在40℃在含有35％甲酰胺，5X SSC，50mMTris-HCl(pH 7.5)，5mM EDTA，0.02％PVP，0.02％聚蔗糖，0.2％BSA，100μg/ml鲑精DNA和10％(wt/vol)葡聚糖硫酸酯的溶液中杂交18-20小时；然后在55℃在含有2XSSC和0.1％SDS的溶液中冲洗两次持续1小时。或者，可使用的低严格条件包括：在37℃在含有20％甲酰胺，5xSSC，50mM磷酸钠(pH 7.6)，Denhardt′s溶液，10％葡聚糖硫酸酯和20μg/ml变性剪切的鲑精DNA的溶液中温育8小时到过夜；在相同缓冲液中杂交18到20小时；并在1xSSC中大约37℃冲洗滤膜1小时。

由于遗传密码的简并性，可产生大量的编码HIO102多肽的多核苷酸序列。例如，按照由特定的宿主生物体赋予的最佳密码子选择，可选择密码子来增加在特定宿主种类中出现多肽表达的比率(参见，例如，Nakamura等，1999，Nucleic Acids Res 27：292)。这样的序列变体可用于本发明的方法中。

本发明的方法可利用拟南芥HIO102的直向同源物。在其它植物品种中鉴定直向同源物的方法是本领域公知的。通常，不同品种中的直向同源物保持相同的功能，取决于一或多个蛋白基序和/或3-三维结构的存在。在进化中，当物种形成后基因复制时，一个品种诸如拟南芥中的单一基因，可对应于另一种中的多个基因(横向同源物)。此处所述的术语“直向同源物”包括横向同源物。当序列数据可用于特定的植物品种时，直向同源物通常通过序列同源性分析，诸如BLAST分析，通常利用蛋白诱饵序列来进行鉴定。如果正向BLAST结果的最佳目标序列在反向BLAST中检索到最初查询序列，则序列被认为是可能的直向同源物(Huynen MA和Bork P，Proc Natl Acad Sci(1998)95：5849-5856；Huynen MA等，Genome Research(2000)10：1204-1210)。用于多重序列比对的程序，诸如CLUSTAL(Thompson JD等，1994，Nucleic Acids Res 22：4673-4680)可用于高亮显示保守的区域和/或直向同源蛋白质的残基以及来产生系统发生树。在表示来自不同品种的多重同源序列的系统树中(例如，通过BLAST分析检索的)，来自两个品种的直向同源序列通常相对于来自此两个品种的所有其它序列最靠近地出现在树上。蛋白质折叠的结构线程(Structural threading)或其它分析(例如，利用ProCeryon，Biosciences，Salzburg，Austria的软件)也可鉴定可能的直向同源物。核酸杂交方法也可用于发现直向同源基因且当不能获得序列数据是优选的。变性PCR和cDNA或基因组DNA文库的筛选是发现相关基因序列的常规方法且是本领域公知的(参见，例如，Sambrook，见上文；Dieffenbach C和Dveksler G(Eds.)PCR Primer：A Laboratory Manual，Cold Spring Harbor Laboratory Press，NY，1989)。例如，由目的植物品种产生cDNA文库以及用部分同源的基因探针探测文库的方法描述下述文献中：Sambrook等，同上。拟南芥HIO102编码序列的高度保守部分可用作探针。HIO102直向同源物核酸可在高度，中度，或低严格条件下与SEQ ID NO：1的核酸杂交。假定的直向同源物片段的扩增或分离之后，那些片段可通过常规技术来克隆和测序并用作探针来分离全长cDNA或基因组克隆。或者，可启动EST项目来产生目的植物品种的序列信息的数据库。在另一种方法中，特异性结合已知的HIO102多肽的抗体被用于直向同源物分离(参见，例如，Harlow E和Lane D，Using Antibodies：A Laboratory Manual，Cold Spring Harbor Laboratory Press，1999，New York)。Western印迹分析可确定HIO102直向同源物(即，直向同源的蛋白)存在于特定植物品种的粗提物中。当观察到反应时，编码侯选直向同源物的序列可通过筛选表示特定植物品种的表达文库来分离。表达文库可构建在各种市售的载体中，包括λgt11，如描述在Sambrook，等中，同上文。一旦通过任意的方式鉴定了候选的直向同源物，候选的直向同源序列被用作诱饵(“查询”)用于来自拟南芥或其中HIO102核酸和/或多肽序列已被鉴定的其它品种的序列对比的反向BLAST。

可利用任意有效的方法来获得HIO102核酸和多肽。例如，通过筛选DNA文库或通过利用聚合酶链式反应(PCR)分离目的cDNA或基因组DNA序列的技术，如先前描述的，是本领域公知的。或者，核酸序列可以是合成的。任意已知的方法，诸如位点定向诱变(Kunkel TA等，Methods Enzymol.204：125-39，1991)可被用于将目的变化导入到克隆的核酸中。

通常，本发明的方法涉及将HIO102核酸的目的形式整合入植物表达载体中用于转化植物细胞，且HIO102多肽在宿主植物中表达。

分离的HIO102核酸分子除了以其在自然中发现的形式或者组外的形式或者组且被鉴定和与最小的一种污染物核酸分子分离，所述的污染物核酸分子通常与HIO102核酸的天然来源关联。然而，分离的HIO102核酸分子包括通常表达HIO102的细胞中包含的HIO102核酸分子其中，例如核酸分子在不同于自然细胞中的染色体中。

具有改变的含油量表现型的基因改造植物的产生

HIO102核酸和多肽可被用于产生具有修饰的含油量表现型的基因改造植物。在这里所述的“修饰的含油量表现型”可指植物任意部分中修饰的含油量；修饰的含油量通常在种子中被观察到。在优选的实施方案中，植物中HIO102基因的改变表达被用于产生具有高含油量表现型的植物。

在这里描述的方法通常适用于所有的植物。尽管活性标记和基因鉴定在拟南芥中进行，HIO102基因(或其直向同源物，变体或片段)可在植物的任意类型中表达。在一个优选的实施方案中，本发明针对产油植物，其在特异性器官，主要在种子中产生和储藏三酰甘油。这样的品种包括大豆(毛豆)，油菜和加拿大油菜(包括芸苔，B.campestris)，向日葵(Helianthus annus)，棉花(Gossypium hirsutum)，玉米(Zea mays)，可可(Theobroma cacao)，红花(Carthamus tinctorius)，油棕(Elaeisguineensis)，椰子(Cocos nucifera)，亚麻(Linum usitatissimum)，蓖麻(Ricinus communis)和花生(Arachis hypogaea)。本发明的目的也在于提供水果-和蔬菜植物，产谷类-植物，产坚果-植物，短周期芸苔品种，苜蓿(紫苜蓿)，烟草(Nicotiana)，turfgrass(Poaceae家族)，其它的饲料作物，以及可作为独特的脂肪酸来源的野生品种。

技术人员可理解本领域已存在的各种转化技术以及新技术不断地适于应用。适于目标宿主植物的任意技术可在本发明的范围内实施。例如，构建体可以各种各样的形式包括但不限于如DNA的链被导入到质粒中，或人工染色体中。可通过各种各样的技术将构建体导入到目标植物细胞中，包括但不限于农杆菌-介导的转化，电穿孔法，显微注射，微粒轰击钙-磷酸盐-DNA共沉淀或脂质体-介导的异源核酸的转化。植物的转化优选地是稳定的，即，通过将导入的表达构建体整合到宿主植物基因组中，从而使得导入的构建体连续存在于植物子代中。取决于目的应用，含有HIO102多核苷酸的异源核酸构建体可编码全蛋白或其生物学活性部分。

在一个实施方案中，二元的基于Ti的载体系统可被用于转移多核苷酸。标准农杆菌二元载体是本领域技术人员公知的，且许多是市售的(例如，pBI121 Clontech Laboratories，Palo Alto，CA)。

用农杆菌载体转化植物的最佳方法将依据转化的植物的类型而变化。农杆菌介导的转化的示例性方法包括胚轴外植体，芽梢，来源于不育秧苗和/或幼苗干或叶组织的转化。这样的转化植物可以有性繁殖，或通过细胞或组织培养。先前描述的用于大量不同类型植物的农杆菌转化以及此种转化的方法可在科学文献中发现。特定相关的是转化商业上重要的作物的方法，诸如油菜籽(De Block等，Plant Physiol.(1989)91：694-701)，向日葵(Everett等，Bio/Technology(1987)5：1201)，以及大豆(Christou等，Proc.Natl.Acad.Sci USA(1989)86：7500-7504；Kline等，Nature(1987)327：70)。

HIO102的表达(包括转录和翻译)可相对于表达的水平，进行表达的组织类型和/或表达的发育阶段被调节。大量的异源调节序列(例如，启动子和增强子)可有效调节HIO102核酸的表达。这些调节序列包括组成性的，可诱导的和可调节的启动子，以及以组织-或时间特异性方式调节表达的启动子和增强子。示例性的组成性启动子包括树莓E4启动子(美国专利5,783,393和5,783,394)以及35S CaMV(Jones JD等，Transgenic Res 1：285-2971992)，CsVMV启动子(Verdaguer B等，PlantMol Biol 37：1055-1067，1998)以及甜瓜肌动蛋白启动子(公开的PCT申请WO0056863)。示例性的组织特异性启动子包括番茄E4以及E8启动子(US专利No.5,859,330)以及番茄2AII基因启动子(VanHaaren MJJ等，Plant Mol Bio 21：625-640，1993)。

在一个优选的实施方案中，HIO102表达在来自其表达与早期种子和/或胚发育有关的基因的调节序列的调节之下。其启动子与早期种子和胚发育有关的豆荚基因包括V.faba legumin(Baumlein等，1991，Mol Gen Genet 225：121-8；Baumlein等，1992，Plant J 2：233-9)，V.fabausp(Fiedler等，1993，Plant Mol Biol 22：669-79)，pea convicilin(Bown等，1988，Biochem J 251：717-26)，pea lectin(dePater等，1993，Plant Cell5：877-86)，P.vulgaris beta phaseolin(Bustos等，1991，EMBO J10：1469-79)，P.vulgaris DLEC2和PHS[beta](Bobb等，1997，NucleicAcids Res 25：641-7)和大豆β-Conglycinin，7S贮藏蛋白(Chamberland等，1992，Plant Mol Biol 19：937-49)。其启动子与早期的种子和胚发育有关的谷类基因包括稻米谷蛋白(″GluA-3，″Yoshihara和Takaiwa，1996，Plant Cell Physiol 37：107-11；″GluB-1，″Takaiwa等，1996，Plant Mol Biol 30：1207-21；Washida等，1999，Plant Mol Biol40：1-12；″Gt3，″Leisy等，1990，Plant Mol Biol 14：41-50)，大米醇溶蛋白(Zhou & Fan，1993，Transgenic Res 2：141-6)；小麦醇溶蛋白(Hammond-Kosack等，1993，EMBO J 12：545-54)，玉米玉米蛋白(Z4，Matzke等，1990，Plant Mol Biol 14：323-32)，和大麦 B-hordeins(Entwistle等，1991，Plant Mol Biol 17：1217-31)。其启动子与早期的种子和胚发育有关的其它基因包括油椰 GLO7A(7S globulin，Morcillo等，2001，Physiol Plant 112：233-243)，Brassica napus napin，2S贮藏蛋白和napA基因(Josefsson 等，1987，J Biol Chem 262：12196-201；Stalberg等，1993，Plant Mol Biol 1993 23：671-83；Ellerstrom等，1996，Plant Mol Biol 32：1019-27)，芸苔油质蛋白(Keddie等，1994，PlantMol Biol 24：327-40)，拟南芥油质蛋白(Plant等，1994，Plant Mol Biol25：193-205)，拟南芥 FAE1(Rossak等，2001，Plant Mol Biol 46：717-25)，Canavalia gladiata conA(Yamamoto等，1995，Plant Mol Biol27：729-41)，和长春花strictosidine合成酶(Str，Ouwerkerk和Memelink，1999，Mol Gen Genet 261：635-43)。在另一个优选的实施方案中，利用来自在油类生物合成过程中表达的基因的调节序列(参见，例如美国专利5,952，544)。可选择的启动子来自植物贮藏蛋白基因(Bevan等，1993，Philos Trans R Soc Lond B Biol Sci 342：209 15)。

在又一个方面，有时可能需要抑制内源性HIO102在宿主细胞中的表达。实施本发明此方面的示例性方法包括，但不限于反义抑制(Smith等，Nature 334：724-726，1988；van der Krol等，Biotechniques(1988)6：958-976)；共-抑制(Napoli，等，Plant Cell 2：279-289，1990)；核酶(PCT公开WO 97/10328)；以及反义和正义的组合(Waterhouse，等，Proc.Natl.Acad.Sci.USA 95：13959-13964，1998)。抑制宿主细胞内源性序列的方法典型地利用被抑制序列的至少一部分的转录或转录和翻译。这样的序列可能与内源性序列的编码和非编码区是同源的。反义抑制可利用全部的cDNA序列(Sheehy等，Proc.Natl.Acad.Sci.USA(1988)85：8805-8809)，部分cDNA序列包括5′编码序列的片段，(Cannon等，Plant Molec.Biol.(1990)15：39-47)，或3′非-编码序列(Ch′ng等，Proc.Natl.Acad.Sci.USA(1989)86：10006-10010)。共抑制技术可利用全部的cDNA序列(Napoli等，同上；van der Krol等，ThePlant Cell(1990)2：291-299)或部分的cDNA序列(Smith等，Mol.Gen.Genetics(1990)224：477-481)。

可进行标准的分子和遗传测试来进一步分析基因和所观察的表现型之间的关联。示例性的技术描述如下。

1. DNA/RNA分析

突变体比较野生型品系的阶段-和组织特异性的基因表达模式可通过例如，原位杂交来测定。可以进行基因尤其是侧翼调节区域甲基化状态的分析。其它合适的技术包括过量表达，异常表达，在其它植物品种中的表达以及基因敲除法(反向遗传，目标敲除，病毒诱导的基因沉默[VIGS，参见Baulcombe D，Arch Virol Suppl 15：189-201，1999])。

在优选的应用表达分布图中，通常通过微阵列分析，用于同时测定差异或许多不同基因表达中诱导的变化。微阵列分析技术是本领域公知的(Schena M等，Science(1995)270：467-470；Baldwin D等，CurOpin Plant Biol.2(2)：96-103，1999；Dangond F，Physiol Genomics(2000)2：53-58；van Hal NL等，J Biotechnol(2000)78：271-280；Richmond T和Somerville S，Curr Opin Plant Biol(2000)3：108-116)。可分析单独标记的品系的表达分布。这样的分析可鉴定由于目的基因的过量表达协调调节的其它基因，其可促进将未知的基因放置在特定通道中。

2. 基因产物分析

基因产物的分析可包括重组蛋白质表达，抗血清产生，免疫定位，催化或其它活性的生物化学分析，磷酸化状态的分析，以及通过酵母二-杂交分析进行的与其它蛋白质相互作用的分析。

3. 途径分析

途径分析可包括根据基因或置于特定的生物化学，新陈代谢或信号传导途径中。或者，分析可包括与野生型品系及其它突变品系的遗传杂交(产生双重突变型)来对途径中的基因进行排序，或测定突变对途径中下游“报道”基因表达的作用。

具有改变的含油量表现型的突变植物的产生

本发明进一步提供了鉴定在内源性HIO102中具有突变从而赋予了改变含油量的植物的方法，以及产生未遗传修饰的这些植物的改变含油量的子代的方法。在一个方法中，称为“TILLING”(用于靶向基因组中诱导的局部损害)，例如利用EMS处理在目的植物的种子中诱导突变。培育产生的植物并进行自体受精，且将子代用于制备DNA样品。利用HIO102-特异性PCR鉴定突变的植物是否具有HIO102突变。然后测定具有HIO102突变的植物的改变的含油量，或者，测定植物的改变的含油量，然后进行HIO102-特异性PCR测定具有改变含油量的植物是否具有突变的HIO102基因。TILLING可鉴定改变特异性基因的表达或由这些基因编码的蛋白质活性的突变(参见Colbert等(2001)Plant Physiol 126：480-484；McCallum 等(2000)NatureBiotechnology 18：455-457)。

在另一个方法中，候选基因/数量性状定位(QTLs)方法可被用于标记-辅助的育种计划来鉴定等位基因或可赋予改变的含油量的HIO102基因或HIO102直向同源物中的突变(参见Bert等，Theor ApplGenet.2003 Jun；107(1)：181-9；以及Lionneton等，Genome.2002Dec；45(6)：1203-15)。因此，在本发明另一个方面，HIO102核酸被用于鉴定具有含油量改变的植物在内源性HIO102中是否具有突变或具有引起含油量改变的特定的等位基因。

所有在这里引用的出版物被明确地引入作为参考来用于描述和公开可在本发明的相关方面使用的组合物和方法。所有引用的专利，专利申请，和参考网址和公众数据库中的序列信息也引入作为参考。

实施例

实施例1

通过用活性标记构建体转化产生具有HIO102表现型的植物

利用活性标记“ACTTAG”载体，pSKI015(GI#6537289；WeigelD等，同上)产生突变体。利用标准方法产生拟南芥转基因植物，且基本上如公开的申请PCT WO0183697中所描述的。简要地，用携带 pSKI015载体的农杆菌转化T0拟南芥(Col-0)植物，所述载体含有来自农杆菌Ti质粒的T-DNA，除草剂抗性选择性标记基因，和4X CaMV 35S增强子元件。根据除草剂抗性筛选T1子代的转基因植物。

通过近红外波谱(NIR)分析收获时的完整的T3种子库。利用Bruker22N/F捕获近红外线光谱。(参见实验细节描述)。利用NIR分析数据以及参考厂商说明通过Bruker软件估计总的植物油，总的种子蛋白，以及总的种子含水量。通过我们校准预测的含油量(JL Oil Calib 2，Predicts GC测定的油类)与15,720个单独的T3 ACTTAG种子库比较。平均的NIR预测的含油量是31.2％。平均的NIR预测蛋白是20.4％且NIR预测的含水量是6.4％。为鉴定具有正常蛋白质含量的高油品系，鉴定含油量＞34.5％以及具有正常蛋白质含量(＞20％)的品系。这些品系被用于评价同样具有正常或低水分含量(＜7％)的品系。测定满足这些标准的品系来鉴定具有成功的FST放置的品系。根据候选基因与脂肪酸生物合成或三酰甘油的生物合成可能有关进行邻近FST放置的候选基因的评价。品系IN023338具有高油，正常蛋白和低水分，以及邻近于在序列上与已知基因 FAE1(GI#18418411：1-1482；At4g34250)类似的基因的ACTTAG插入片段，所述基因FAE1对于拟南芥中C18脂肪酸延长为C20以及更长的脂肪酸是必须的。尽管FAE1与长链脂肪酸(其占拟南芥油中的脂肪酸的约20％)的产生直接有关，但是由酶催化产生任意长度的脂肪酸，而不仅仅是长链脂肪酸所需的缩合反应要。

通过标准的GC方法测定IN023338中的脂肪酸含量和质量。GC分析证实了IN0233338品系中的高含油量但在油质量中没有显著性差异。基于此，我们断定改变IN023338中FAE类基因的表达可赋予增加含油量的特性，而且此含油量增加的作用机制不同于由最初FAE1基因产物的改变表达产生的脂肪酸分布的变化，因为此品系中的含油量增加了，而种子油的长链脂肪酸组分没有显著的增加。可通过激活标记，或通过有目的地改变在合适启动子序列调控下的表达或通过本领域其它有效的方法改变FAE1-类基因的表达。

实施例2

显示出改变含油量表现型的植物中的T-DNA插入的鉴定

我们进行标准的分子分析，基本上如专利申请PCT WO0183697中所描述的，来确定与改变的含油量表现型有关的T-DNA的插入位点。简要地，由显示改变的含油量表现型的植物提取基因组DNA。利用pSKI015载体的特异性引物进行的PCR，证实品系IN0232577和IN022173的植物中35S增强子的存在，且Southern印迹分析证实ACTTAG T-DNA的基因组整合以及显示出每一转基因品系中单一T-DNA插入物的存在。

利用反向PCR回收侧接于T-DNA插入物的基因组DNA，然后利用基本BLASTN检索和/或拟南芥信息资源(TAIR)数据库的查询将其用于序列分析(可获自arabidopsis.org网址)。测得左侧边界接头位于染色体4(GI#7270366)的约核苷酸43,605处。预测的右侧边界的约3.2kb上游是在核苷酸40,446-41,927处的编码脂肪酸延长酶的基因At4g34250。

实施例3

拟南芥HIO102序列的分析

利用BLAST(Altschul等，1997，J.Mol.Biol.215：403-410)，PFAM(Bateman等，1999，Nucleic Acids Res 27：260-262)，PSORT(Nakai K，和Horton P，1999，Trends Biochem Sci 24：34-6)，和/或CLUSTAL(Thompson JD等，1994，Nucleic Acids Res 22：4673-4680)进行序列分析。

下列的八个拟南芥ESTs精确地匹配候选基因At4g34250：GINo.19876922，498541，9782785，9788661，9784101，9785025，9786448和506598。5个ESTs来自发育的种子(5到13DAF)且两个在5天龄的黄化秧苗中，表明At4g34250基本上是种子特异性的且在早和晚两个发育阶段过程中表达。一个EST来自“遮光培养”的组织，其可包括秧苗。

BLASTN同样鉴定了一组拟南芥基因&芸苔FAE1-类同源物。对这些序列进行ClustalW分析表明脂肪酸-延长酶-类基因的组形成三个进化枝，其中的两个含有功能性特定基因(仅仅At5g43760存在于组外)。通过对由这些基因推导的氨基酸序列的成簇分析支持了这些进化枝。

进化枝1包括候选基因At4g34250和At2g15090，另一个假定的脂肪酸延长酶。这两个基因在核苷酸水平有83％的同一性，且它们可被推断具有类似的功能。很显然，这两个拟南芥基因分别由FAE1和CUT1进化枝成簇。这似乎表明它们的活性可能类似于另一个组(脂肪酸合成)，但是也可能在重要的方面，诸如酶的底物特异性方面是不同的。

进化枝2包括拟南芥FAE1 & L.fendleri KCS3。两个基因产物在种子中延长18∶1到20∶1。五个芸苔KCS基因也属于此进化枝。

进化枝3包括CUT1(与蜡生物合成有关的表皮-特异性长链脂肪酸缩合酶)，At4g34510邻近于染色体4上FAE1的基因)和At2g16280(假定的β-酮脂酰-CoA合成酶)。

候选基因At4g34250与预测编码脂肪酸延长酶At2g15090(gi|18397720)的第2拟南芥基因具有83％的同一性。

另外，大豆和棉花ESTs被鉴定为紧接三个另外的推测的直向同源物编码基因，其列举在SEQ ID NOs：3-5中。具体而言，SEQ ID NO：3是具有GI#s 8825889，8825881，10253399和10235530的大豆ESTs的邻接片段；SEQ ID NO：4是具有GI#s 14258911，13790811，6455633，6847127，4313778和6847677的大豆EST的邻接片段；并且SEQ IDNO：5是具有 GI#s 21100924，21100866，12200119，21098784，21098552，21095047，21095036，21090830，13354045以及13350225的棉花EST的邻接片段。

BLASTP分析鉴定了下列推测的直向同源物：拟南芥推测的脂肪酸延长酶，gi|15226055(At2g15090)；以及脂肪酸延长酶1 GI|15236144(At4g34520)。

SEQ ID NO：2的残基175-279与NCBI保守区域数据库(CDD)中的基序；gnl|CDD|5947，pfam00195，Chal_stil_synt，苯丙烯酰苯和1-2-二苯乙烯合成酶，N-末端区域的同源性。苯丙烯酰苯合成酶的C-末端区域被报道在结构上类似于硫解酶和β-酮脂酰合成酶的区域。活性的差异被认为是由于该区域中的差异。

残基387到454类似于gnl|CDD|3304，pfam02797，Chal_stil_syntC，苯丙烯酰苯和1-2-二苯乙烯合成酶，C-末端区域。苯丙烯酰苯合成酶的此区域被报道在结构上类似于硫解酶和β-酮脂酰合成酶的区域。活性的差异被认为是由于N-末端区域中的差异。

这些蛋白质基序与用于脂肪酸延长酶的期望相一致。脂肪酸延长酶(诸如生物化学鉴定的FAE1)可能是胞质内(cytosolic)的且是膜定位的。它们被确信以4酶催化活性复合物的部分的形式存在，包括3-酮脂酰-CoA合成酶(延长酶)，3-酮脂酰-CoA还原酶，3-羟脂酰-CoA脱水酶以及烯酰基-CoA还原酶。延长酶可促进确定总反应的底物特异性。这种复合物的其余组分基本上尚未鉴定。

根据计算数据，候选基因产物被预测起脂肪酸缩合酶的作用。据预测其主要是在发育的种子中表达且其在突变体中表达的改变决定观察到的高植物油表现型。

序列表

<110>农业经济有限责任公司(Arinomics LLC)

<120>生产改变含油量的植物(ENERATION OF PLANTS WITH ALTERED OILCONTENT)

<130>AG03-082C-PC

<150>60/434,795

<151>2002-12-18

<160>5

<170>PatentIn version 3.2

<210>1

<211>1482

<212>DNA

<213>Arabidopsis thaliana

<400>1

atggattacc ccatgaagaa ggtaaaaatc tttttcaact acctcatggc gcatcgcttc 60

aagctctgct tcttaccatt aatggttgct atagccgtgg aggcgtctcg tctttccaca 120

caagatctcc aaaactttta cctctactta caaaacaacc acacatctct aaccatgttc 180

ttcctttacc tcgctctcgg gtcgactctt tacctcatga cccggcccaa acccgtttat 240

ctcgttgact ttagctgcta cctcccaccg tcgcatctca aagccagcac ccagaggatc 300

atgcaacacg taaggcttgt acgagaagca ggcgcgtgga agcaagagtc cgattacttg 360

atggacttct gcgagaagat tctagaacgt tccggtctag gccaagagac gtacgtaccc 420

gaaggtcttc aaactttgcc actacaacag aatttggctg tatcacgtat agagacggag 480

gaagttatta ttggtgcggt cgataatctg tttcgcaaca cgggaataag ccctagtgat 540

ataggtatat tggtggtgaa ttcaagcact tttaatccaa caccttcgct atcaagtatc 600

ttagtgaata agtttaaact tagggataat ataaagagct tgaatcttgg tgggatgggg 660

tgtagcgctg gagtcatcgc tatcgatgcg gctaagagct tgttacaagt tcatagaaac 720

acttatgctc ttgtggtgag cacggagaac atcactcaaa acttgtacat gggtaacaac 780

aaatcaatgt tggttacaaa ctgtttgttc cgtataggtg gggccgcgat tttgctttct 840

aaccggtcta tagatcgtaa acgcgcaaaa tacgagcttg ttcacaccgt gcgggtccat 900

accggagcag atgaccgatc ctatgaatgt gcaactcaag aagaggatga agatggcata 960

gttggggttt ccttgtcaaa gaatctacca atggtagctg caagaaccct aaagatcaat 1020

atcgcaactt tgggtccgct tgttcttccc ataagcgaga agtttcactt ctttgtgagg 1080

ttcgttaaaa agaagtttct caaccccaag ctaaagcatt acattccgga tttcaagctc 1140

gcattcgagc atttctgtat ccatgcgggt ggtagagcgc taattgatga gatggagaag 1200

aatcttcatc taactccact agacgttgag gcttcaagaa tgacattaca caggtttggt 1260

aatacctctt cgagctccat ttggtacgag ttggcttaca cagaagccaa aggaaggatg 1320

acgaaaggag ataggatttg gcagattgcg ttggggtcag gttttaagtg taatagttca 1380

gtttgggtgg ctcttcgtaa cgtcaagcct tctactaata atccttggga acagtgtcta 1440

cacaaatatc cagttgagat cgatatagat ttaaaagagt ga 1482

<210>2

<211>493

<212>PRT

<213>Arabidopsis thaliana

<400>2

Met Asp Tyr Pro Met Lys Lys Val Lys Ile Phe Phe Asn Tyr Leu Met

1 5 10 15

Ala His Arg Phe Lys Leu Cys Phe Leu Pro Leu Met Val Ala Ile Ala

20 25 30

Val Glu Ala Ser Arg Leu Ser Thr Gln Asp Leu Gln Asn Phe Tyr Leu

35 40 45

Tyr Leu Gln Asn Asn His Thr Ser Leu Thr Met Phe Phe Leu Tyr Leu

50 55 60

Ala Leu Gly Ser Thr Leu Tyr Leu Met Thr Arg Pro Lys Pro Val Tyr

65 70 75 80

Leu Val Asp Phe Ser Cys Tyr Leu Pro Pro Ser His Leu Lys Ala Ser

85 90 95

Thr Gln Arg Ile Met Gln His Val Arg Leu Val Arg Glu Ala Gly Ala

100 105 110

Trp Lys Gln Glu Ser Asp Tyr Leu Met Asp Phe Cys Glu Lys Ile Leu

115 120 125

Glu Arg Ser Gly Leu Gly Gln Glu Thr Tyr Val Pro Glu Gly Leu Gln

130 135 140

Thr Leu Pro Leu Gln Gln Asn Leu Ala Val Ser Arg Ile Glu Thr Glu

145 150 155 160

Glu Val Ile Ile Gly Ala Val Asp Asn Leu Phe Arg Asn Thr Gly Ile

165 170 175

Ser Pro Ser Asp Ile Gly Ile Leu Val Val Asn Ser Ser Thr Phe Asn

180 185 190

Pro Thr Pro Ser Leu Ser Ser Ile Leu Val Asn Lys Phe Lys Leu Arg

195 200 205

Asp Asn Ile Lys Ser Leu Asn Leu Gly Gly Met Gly Cys Ser Ala Gly

210 215 220

Val Ile Ala Ile Asp Ala Ala Lys Ser Leu Leu Gln Val His Arg Asn

225 230 235 240

Thr Tyr Ala Leu Val Val Ser Thr Glu Asn Ile Thr Gln Asn Leu Tyr

245 250 255

Met Gly Asn Asn Lys Ser Met Leu Val Thr Asn Cys Leu Phe Arg Ile

260 265 270

Gly Gly Ala Ala Ile Leu Leu Ser Asn Arg Ser Ile Asp Arg Lys Arg

275 280 285

Ala Lys Tyr Glu Leu Val His Thr Val Arg Val His Thr Gly Ala Asp

290 295 300

Asp Arg Ser Tyr Glu Cys Ala Thr Gln Glu Glu Asp Glu Asp Gly Ile

305 310 315 320

Val Gly Val Ser Leu Ser Lys Asn Leu Pro Met Val Ala Ala Arg Thr

325 330 335

Leu Lys Ile Asn Ile Ala Thr Leu Gly Pro Leu Val Leu Pro Ile Ser

340 345 350

Glu Lys Phe His Phe Phe Val Arg Phe Val Lys Lys Lys Phe Leu Asn

355 360 365

Pro Lys Leu Lys His Tyr Ile Pro Asp Phe Lys Leu Ala Phe Glu His

370 375 380

Phe Cys Ile His Ala Gly Gly Arg Ala Leu Ile Asp Glu Met Glu Lys

385 390 395 400

Asn Leu His Leu Thr Pro Leu Asp Val Glu Ala Ser Arg Met Thr Leu

405 410 415

His Arg Phe Gly Asn Thr Ser Ser Ser Ser Ile Trp Tyr Glu Leu Ala

420 425 430

Tyr Thr Glu Ala Lys Gly Arg Met Thr Lys Gly Asp Arg Ile Trp Gln

435 440 445

Ile Ala Leu Gly Ser Gly Phe Lys Cys Asn Ser Ser Val Trp Val Ala

450 455 460

Leu Arg Asn Val Lys Pro Ser Thr Asn Asn Pro Trp Glu Gln Cys Leu

465 470 475 480

His Lys Tyr Pro Val Glu Ile Asp Ile Asp Leu Lys Glu

485 490

<210>3

<211>657

<212>DNA

<213>Glycine max

<220>

<221>misc_feature

<222>(653)..(654)

<223>nisa，c，g，ort

<400>3

ggaattcggc acgaggcaag tcctacggct gtgtcttcca agaagaagat gagacaaaaa 60

gaattggtgt ggcactctca aaagacctaa tggctgtggc aggagaggcc ctaaagacca 120

acatcacaac actaggaccc ttggtcctcc ctatgtcaga acagcttctt ttctttgcca 180

cattggtggc taggaaagtg ttcaagatga agataaaacc atacatccca gatttcaagt 240

tggcctttga gcatttttgc attcatgctg gagggagggc agtgttggat gagttggaga 300

agaatcttga gctctctgat tggcacatgg agccctcaag gatgacacta aataggtttg 360

gtaacacttc tagcagttcc ttgtggtatg aattggccta cactgaagcc aaagggagga 420

tcaagaaagg tgacaggact tggcagattg catttgggtc agggtttaag tgcaacagtg 480

ctgtgtggag ggctttgagg accatcaatc ctgctaagga gaacaatcct tggatggatg 540

agattcatga ctttccagtt catgtgccta aagtggcacc aattgcttcc taaattaatc 600

aaacatcttt ttctcttttt agtatgattc taaaattaaa gaaacttgtt cannaac 657

<210>4

<211>1130

<212>DNA

<213>Glycine max

<400>4

aacattactc agaattggta ctttgggaac aagaaatcca tgctcattcc caattgccta 60

tttcgtgtgg gctgctctgc gctgcttctc tctaacaagc cggcagatcg aaggagggcc 120

aagtaccggc ttgtccacgt cgtgaggact catcgcgggg ccgacgacaa ggcgttccgg 180

tgtgtttacc aggagcagga tgatgctggg aaaactggtg tttccttgtc taaggatttg 240

atggcaattg ctggtggagc attgaagact aacatcacca cacttggtcc tctggtgctg 300

ccaattagtg agcagcttct gtttttcgtg actctgctga tgaacaagtt atttaaggct 360

ggtgtgaagc cttacatacc ggatttcaag cttgcatttg atcatttttg tatccatgct 420

ggtggcaggg ctgtgattga tgagttggag aagaacctgc agctgcttcc tgagcatgtg 480

gaggcttcta ggatgaccct tcatagattt gggaacactt cctcaagctc catttggtat 540

gagttggctt acattgaagc caaagggagg atcaagaagg gtaacaggat ttggcaaatt 600

gcgtttggaa gtggtttcaa gtgtaacagt gcggtttggc aggctctgag gaatgtgagg 660

ccttctccta atggaccatg ggaagattgc attcataagt atcctgtgga aatagtcaca 720

tagtgatcat agttcagttc agttctcagt cacatactct ggctgctaca acttaattca 780

gggtaccctt cattagtttc cagatccatt gtctctctct ctgttgtaga tttcattgtg 840

taattcactg cctcttttgt gtttgatgat tgtggatttt cattgggtta aattcatgta 900

tctggagtaa tatgatatgg ggaattcctg aatttttttt cttcctgctg atgcacttat 960

gaatttttat ttttttagtc ataaagttgc gcctgggtaa cgaggcgctt ataggccccg 1020

atgcgaaaat actcctttga catatgtagg ggtgacggta ccactgccca ataattctct 1080

cccatatttt tacgcaacga ggacccttta gcctcgcgga ccagagctgc 1130

<210>5

<211>960

<212>DNA

<213>Gossypium arboreum

<400>5

tggagaacat tactctcaac tgggacttcg gcaacgaccg atccatgcta gtctctaact 60

gcttgttccg tatgggcggt gccgcgatcc ttctatcaaa ccggtcatcc gatcgccgcc 120

gctccaagta ccaactcatc cacaccgtac gaacccacaa aggagccgac gacaaatgct 180

acaactgcgt cttccaacgt gaggacgaca ccaaacgaat aggcgtttcc ctctccaaag 240

acctcatggc ggtcgccggc gaagccctca aaaccaacat caccaccctc ggtccattag 300

tcctccccat gtccgaacaa ctcctctttt tcatcacttt agtagcccga aaagtcttca 360

aaatgaagat caggccatac atcccggatt tcaaactagc tttcgagcat ttttgcatcc 420

atgcaggtgg gagagccgtg ttagatgagc tagaaaagaa ccttgagctc tcagattggc 480

acatggaacc atcgaggatg acactttaca ggttcggtaa cacgtcgagc agctctttat 540

ggtacgaact agcttactcg gaagccaaag gaaggatccg aaaaggtgat cggacatggc 600

agattgcatt cgggtcaggg tttaaatgca acagtgctgt atggaaagca ttgaagacca 660

ttaatccagc aaaggagaag agtccatgga ttgatgaaat tgatgaatat cctgtttatg 720

tgcctaaggt ggccactgtt tcttcttctt cttcttccca aaaaaccata taattttcat 780

cattcaaagg aagagaatag agagaaagag aggacttaat cagtaattat tagaactatg 840

atttattttt tattttttta catgtttaat tgtgtgttga tttgaagatt aatttattcc 900

aagttgaaga tatatatata taattttctt ttcatttgca aaaaaaaaaa aagaaactcg 960

Claims

1.转基因植物，包括含有编码含有SEQ ID NO：2的氨基酸序列的HIO102多肽的核苷酸序列或其互补序列或其直向同源物的植物转化载体，由此，转基因植物相对于对照植物为高油表现型。

2.权利要求1的转基因植物，其选自油菜，大豆，谷物，向日葵，棉花，可可，红花，油棕，椰子，亚麻，蓖麻以及花生。

3.从权利要求1的植物获得的植物的部分。

4.权利要求3的植物的部分，其是种子。

5.产生油类的方法，包括培育权利要求1的转基因植物以及从所述植物回收油类。

6.产生高油表现型植物的方法，所述方法包括：

a)向植物的祖细胞引入包括编码含有SEQ ID NO：2的氨基酸序列的HIO102多肽的核苷酸序列或其互补序列或其直向同源物的植物转化载体，以及

b)培育转化的祖细胞产生转基因植物，所述多核苷酸序列在所述转基因植物中表达，并且所述转基因植物相对于对照植物表现改变的含油量表现型。

7.通过权利要求6的方法获得的植物。

8.权利要求7的转基因植物，其选自油菜，大豆，谷物，向日葵，棉花，可可，红花，油棕，椰子，亚麻，蓖麻以及花生。

9.产生具有高油表现型植物的方法，包括鉴定具有HIO102基因的等位基因的植物，所述HIO102基因的等位基因引起与缺少等位基因且产生所述鉴定的植物子代的植物相比含油量的增加，其中产生的子代遗传等位基因并且为高油表现型。

10.权利要求9的方法，利用候选基因/QTL法。

11.权利要求9的方法，利用TILLING法。