CN1989248A - 生产改变含油量的植物 - Google Patents

生产改变含油量的植物 Download PDF

Info

Publication number
CN1989248A
CN1989248A CNA2005800173230A CN200580017323A CN1989248A CN 1989248 A CN1989248 A CN 1989248A CN A2005800173230 A CNA2005800173230 A CN A2005800173230A CN 200580017323 A CN200580017323 A CN 200580017323A CN 1989248 A CN1989248 A CN 1989248A
Authority
CN
China
Prior art keywords
plant
sequence
hio1004
seed
gene
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CNA2005800173230A
Other languages
English (en)
Other versions
CN1989248B (zh
Inventor
约翰·戴维斯
桑德拉·彼得斯
海因·措恩格·额
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Agrinomics LLC
Original Assignee
Agrinomics LLC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Agrinomics LLC filed Critical Agrinomics LLC
Publication of CN1989248A publication Critical patent/CN1989248A/zh
Application granted granted Critical
Publication of CN1989248B publication Critical patent/CN1989248B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • AHUMAN NECESSITIES
    • A23FOODS OR FOODSTUFFS; TREATMENT THEREOF, NOT COVERED BY OTHER CLASSES
    • A23DEDIBLE OILS OR FATS, e.g. MARGARINES, SHORTENINGS, COOKING OILS
    • A23D9/00Other edible oils or fats, e.g. shortenings, cooking oils
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/415Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from plants
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8241Phenotypically and genetically modified plants via recombinant DNA technology
    • C12N15/8242Phenotypically and genetically modified plants via recombinant DNA technology with non-agronomic quality (output) traits, e.g. for industrial processing; Value added, non-agronomic traits
    • C12N15/8243Phenotypically and genetically modified plants via recombinant DNA technology with non-agronomic quality (output) traits, e.g. for industrial processing; Value added, non-agronomic traits involving biosynthetic or metabolic pathways, i.e. metabolic engineering, e.g. nicotine, caffeine
    • C12N15/8247Phenotypically and genetically modified plants via recombinant DNA technology with non-agronomic quality (output) traits, e.g. for industrial processing; Value added, non-agronomic traits involving biosynthetic or metabolic pathways, i.e. metabolic engineering, e.g. nicotine, caffeine involving modified lipid metabolism, e.g. seed oil composition
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/48Hydrolases (3) acting on peptide bonds (3.4)
    • C12N9/50Proteinases, e.g. Endopeptidases (3.4.21-3.4.25)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/48Hydrolases (3) acting on peptide bonds (3.4)
    • C12N9/50Proteinases, e.g. Endopeptidases (3.4.21-3.4.25)
    • C12N9/63Proteinases, e.g. Endopeptidases (3.4.21-3.4.25) derived from plants

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Engineering & Computer Science (AREA)
  • Organic Chemistry (AREA)
  • Zoology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Wood Science & Technology (AREA)
  • Biotechnology (AREA)
  • Molecular Biology (AREA)
  • Biomedical Technology (AREA)
  • Biochemistry (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Microbiology (AREA)
  • Medicinal Chemistry (AREA)
  • Botany (AREA)
  • Biophysics (AREA)
  • Oil, Petroleum & Natural Gas (AREA)
  • Polymers & Plastics (AREA)
  • Physics & Mathematics (AREA)
  • Plant Pathology (AREA)
  • Food Science & Technology (AREA)
  • Nutrition Science (AREA)
  • Cell Biology (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Breeding Of Plants And Reproduction By Means Of Culturing (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Fats And Perfumes (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

本发明涉及由于HIO1004核酸的改变的表达,而显示改变的含油量表型的植物。本发明更进一步涉及生产具有改变的含油量表型的植物的方法。

Description

生产改变含油量的植物
相关申请
本申请要求2004年5月28日提交的美国临时专利申请60/575,560的优先权,其内容全部引入作为参考。
发明背景
操纵农作物种子的组成,尤其是种子油类的含量和组成的能力在涉及加工食品油类以及动物饲养油类的农业工业中具有重要的应用价值。农作物的种子含有多种有价值的组分,包括油类,蛋白以及淀粉。工业生产过程可以分离若干或所有这些组分用于专门应用的单独销售。例如,几乎60%的美国大豆农作物通过大豆加工工业进行压榨。大豆加工产生高价销售的精炼油,而残余物主要作为低价值的饲料销售(US Soybean Board,2001 Soy Stats)。加拿大油菜(canola)种子被压榨产生油类以及副产品加拿大油菜粗粉(加拿大加拿大油菜协会)。几乎20%的1999/2000年的美国玉米农作物经过工业化精炼,主要用于产生淀粉,乙醇以及油类(玉米精炼业者协会)。因此,常常需要使种子的含油量最大化。例如,对于诸如大豆以及加拿大油菜的加工含油种子而言,提高种子的绝对含油量将提高这种谷物的价值。对于加工的玉米而言,可能需要根据其它主要组分的应用提高或者降低含油量。降低油类可以通过降低与油类氧化相关的不希望的味道改善分离的淀粉的质量。或者,在味道并不重要的乙醇产生中,提高含油量可以提高总的价值。在许多谷物饲料中,诸如玉米以及小麦,可能希望提高植物含油量,因为油类比诸如碳水化合物的其它种子组分具有较高的能含量。含油种子加工,就像大多数谷物加工业一样是资金密集型产业;因此产品从低值组分到高价值油类组分的产品分布的较小改变可能对于谷物加工者而言就具有显著的经济影响。
油类的生物技术处理可以提供组成的改变以及油产量的改进。组成的改变尤其包括高油酸的大豆以及玉米油(美国专利6,229,033以及6,248,939),以及含有月桂酸酯的种子(美国专利5,639,790)等。组成改变的工作主要集中在加工的含油种子但是已经可以很容易地延伸至非-含油种子农作物包括玉米。虽然对提高含油量具有相当的兴趣,在这一领域目前唯一可行的生物技术是高油类玉米(HOC)技术(杜邦,美国专利5,704,160)。HOC利用通过标准的选择育种连同生产系统中称为顶交(TopCross)的优良品种(不孕雄性)杂交雌性得到的高油类授粉者。顶交高油类系统使玉米收获的谷物含油量从~3.5%提高到~7%,改善了谷物的能含量。
虽然HOC生产系统已经卓有成效,但是其仍然具有固有的局限性。首先,担负全部的土地的种子栽植的低授粉者百分比的系统含有固有风险,尤其是在旱年。第二,当前HOC领域含油量已经平稳在大约9%的油类。最后,高油类玉米主要不是生物化学变化,而是对于提高含油量产生间接结果的解剖学上的突变体(提高胚芽尺寸)。为此,可选择的高油类策略,尤其是来源于改变生化产量的高油类策略将是非常重要的。
操作油市场最明显的目标农作物是大豆以及油菜籽,并且大量商业工作(例如美国专利5,952,544;PCT申请WO9411516)证明拟南芥是这些农作物中油类代谢的优良模型。种子油组合物的生物化学筛选已经鉴定了拟南芥的许多关键生物合成酶基因并且导致农业上重要基因的直向同源物被鉴定出来。例如,利用化学诱变处理群的筛选已经鉴定了其种子显示脂肪酸成份改变的脂类突变体(Lemieux B等1990,James以及Dooner,1990)。检测脂肪酸成份改变的T-DNA诱变筛选(Feldmann等1989)鉴定了ω3脱氢酶(FAD3)以及δ-12脱氢酶(FAD2)基因(美国专利5952544;Yadav等,1993;Okuley等,1994)。集中在含油量而非油类质量的筛选分析化学上诱导的皱缩种子或籽粒密度改变的突变体,据此推断出改变的植物含油量(Focks以及Benning,1998)。用来鉴定参与非常长链脂肪酸产生的酶的另一种筛选鉴定了编码负责降低种子中三酰甘油聚集的甘油二酯酰基转移酶(DGAT)的基因的突变(Katavic V等,1995)。此外,还显示DGAT cDNA的种子特异性过表达与提高的植物含油量有关(Jako等,2001)。
植物中的激活标签法是一种通过插入包含调节序列(例如,增强子)的异源核酸构建体到植物基因组中而产生随机突变的方法。调节序列可起到增强一个或多个天然植物基因转录的作用;因此,激活标签法是一种用于产生功能获得(gain-of-function),通常是显性突变体的有效方法(参见,例如,Hayashi等,1992;Weigel D等,2000)。插入的构建体提供了一种分子标签,其用于快速鉴定由于其错表达引起突变表型的天然植物。激活标签法同时可导致功能丧失的表型。插入可导致天然植物基因的破坏,在该情况中表型通常是隐性的。
激活标签法已经被用于多种物种,包括烟草和拟南芥,来鉴定各种突变表型和与这些表型相关的基因(Wilson,等,1996,Schaffer等,1998,Fridborg等,1999;Kardailsky等,1999;Christensen S等,1998)。
发明概述
本发明提供了具有高油类含量表型的转基因植物。转基因植物包括含有编码或互补于编码HIO1004多肽的核苷酸序列的转化载体。在优选的实施方案中,转基因植物选自油菜籽,大豆,玉米,向日葵,棉花,可可,红花,油棕,椰子,亚麻,蓖麻以及花生。本发明还提供了产生油类的方法,包括培育转基因植物以及从所述植物回收油类。
本发明还提供了具有高油表型的转基因植物细胞。所述转基因植物细胞包括含有编码或者互补于编码高油(下文称作“HIO1004”)多肽的序列的核苷酸序列的转化载体。在优选的实施方案中,该转基因植物细胞选自油菜籽,大豆,玉米,向日葵,棉花,可可,红花,油棕,椰子,亚麻,蓖麻以及花生。在其它实施方案中,所述植物细胞为种子,花粉,繁殖体或者胚芽细胞。本发明进一步提供了含有编码HIO1004多肽的核酸序列的饲料,粗粉,谷物,食品或者种子。
本发明的转基因植物通过包括向植物的祖细胞导入含有编码或互补于编码HIO1004多肽的序列的核苷酸序列的植物转化载体,以及培育转化的祖细胞产生转基因植物的方法产生,其中的HIO1004多核苷酸序列的表达产生高油类含量表型。本发明还提供了从所述转基因植物获得的植物细胞。
本发明还提供了超过约10,000,更优选约20,000,甚至优选约40,000粒种子的容器,其中超过约10%,更优选约25%,更优选约50%,甚至更优选约75%或者更优选约90%的种子为来源于本发明的植物的种子。
本发明还提供了超过约10kg,更优选约25kg,甚至更优选约50kg种子的容器,其中超过约10%,更优选约25%,更优选约50%,甚至更优选约75%或者更优选约90%的种子为来源于本发明的植物的种子。
本发明的任一植物或其部分可以被加工产生饲料,粗粉或者油制剂。用于该目的的尤其优选的植物部分为种子。在优选的实施方案中,饲料,粗粉或者油制剂被设计用于反刍动物。生产饲料,粗粉和油制剂的方法是本领域公知的。例如,参见美国专利4,957,748;5,100,679;5,219,596;5,936,069;6,005,076;6,146,669;以及6,156,227。本发明的粗粉可以与其他的粗粉混合。在优选的实施方案中,产自本发明的植物或者由本发明的方法产生的粗粉构成任一产品的粗粉组分的超过约0.5%,约1%,约5%,约10%,约25%,约50%,约75%或约90%体积或者重量。在另一实施方案中,可以混合粗粉制剂并可以构成混合物超过约10%,约25%,约35%,约50%或约75%的体积。
发明详述
定义
除非另有陈述,这里使用的全部技术以及科学术语具有与本领域技术人员知晓的相同的含义。专业人员尤其参考Sambrook等,1989,以及Ausubel FM等,1993的定义以及术语。应该理解本发明不限于所描述的特定方法,流程以及试剂,因为这些可以改变。
此处所述的术语“载体”是指设计用于在不同宿主细胞之间转移的核酸构建体。“表达载体”是指可以在异源细胞中整合并表达异源DNA片段的载体。许多原核以及真核生物表达载体是可以市售获得的。选择合适的表达载体是本领域述人员所熟知的。
“异源的”核酸构建体或序列具有一部分序列不是植物细胞的野生型序列但是在其中表达。异源的控制序列是指不天然调节目前正在调节的相同基因表达的控制序列(即启动子或增强子)。通常,异源核酸序列不是它们所存在于的细胞或者基因组的一部分所内源产生的,但是已经通过传染,转染,显微注射,电穿孔法等添加到细胞中。“异源的”核酸构建体可以含有控制序列/DNA编码序列组合,其与野生型植物中发现的控制序列/DNA编码序列组合相同或者不同。
此处所述的术语“基因”是指参与多肽链产生的DNA片段,其可能包括或者不包括编码区之前以及之后的区域,例如5′非翻译区(5′UTR)或者“前导”序列以及3′UTR或者“尾部”序列以及单独的编码片段(外显子)以及非-转录调节序列之间的内含子序列(内含子)。
这里使用的“重组体”包括已经通过导入异源的核酸序列进行修饰的细胞或者载体,或者所述细胞来源于如此修饰的细胞。因此,例如,重组细胞表达在天然(非-重组体)形式的细胞内没有发现相同形式的基因或者表达在人为干预下完全表达或者完全不表达的异常表达的天然基因。
此处所述的术语“基因表达”是指基于基因的核酸序列产生的多肽的过程。所述过程包括转录以及翻译;因此“表达”可以是针对多核苷酸或者多肽序列或者两者。有时,多核苷酸序列的表达不会引起蛋白翻译。“过表达”是指相对于其在野生型(或者其它的参考[例如,非-转基因])植物中的表达,多核苷酸和/或多肽序列表达增加并且可能涉及自然存在或者非-自然存在的序列。“异位表达”是指在未-改变或者野生型植物中不自然发生的,在某时,某地和/或提高水平的表达。“下调表达”是指多核苷酸和/或多肽序列,通常是内源性基因相对于其在野生型植物中表达的降低表达。术语“错误表达”以及“改变表达”包括过表达,下调表达以及异位表达。
在将核酸序列插入细胞的概念中,术语“引入的”是指“转染”,或者“转化”或者“转导”,并且包括核酸序列整合到真核或者原核细胞中,其中核酸序列可以整合入细胞的基因组(例如染色体,质粒,质体或者线粒体DNA),转化为自主复制子,或者瞬间表达(例如,转染的mRNA)。
本文使用的“植物细胞”是指来源于植物的任意细胞,包括来自未分化的组织(例如愈伤组织)以及植物种子,花粉,繁殖体(progagules)以及胚的细胞。
此处所述的术语“天然的”以及“野生型”相对于给定植物性状或者表型是指具有在相同种类的植物本身发现的特征或者表型的形式。
此处所述的术语关于植物特性的“修饰”是指转基因植物相对于类似的非-转基因植物的表型的改变。对于转基因植物的“目的表型(性状)”,指通过T1和/或后代植物证明的可观察到的或可测量的表型,相应的非转基因植物不显示该表型(也即,在相似条件下培养或分析的基因型类似的植物)。目的表型可表示对植物的改良,或可提供一种在其他植物中产生改良的方法。“改良”是一种通过给植物提供独特的和/或新的品质,而增强植物物种或品种的实用性的特征。“改变含油量表型”指遗传修饰植物的可测量表型,其中与类似的,但是非修饰的植物相比,该植物显示统计上显著增加或减少的总体含油量(即,油类占种子质量的百分比)。高油表型指总体含油量增加。
本文使用的“突变体”多核苷酸序列或者基因与相应的野生型多核苷酸序列或者基因在序列或者表达上不同,其中的差异导致修饰的植物的表型或者性状。相对于植物或植物株系,术语“突变体”是指植物或者株系具有修饰的植物表型或性状,其中修饰的表型或性状与野生型多核苷酸序列或基因的修饰表达有关。
此处所述的术语“T1”是指来自T0植物的种子的植物子代。T1子代是可通过应用选择性试剂筛选的第一系列转化的植物,所述的选择性试剂为例如抗生素或除草剂,由此转基因植物含有相应的抗性基因。术语“T2”是指通过T1植物的花进行自体受精产生的植物子代,所述T1植物之前被筛选作为转基因植物。T3植物是由T2植物等产生的。这里所述的特定植物的“直系子代”来源于所述植物的种子(或者,有时来自其它的组织)且是紧随的子代;例如,对于特定的家系而言,T2植物是T1植物的直系子代。特定植物的“间接子代”来源于所述植物直系子代的种子(或其它组织),或来自该家系随后子代的种子(或其它组织);例如,T3植物是T1植物的间接子代。
此处所述的术语“植物部分”包括任意的植物器官或组织,包括,但不限于种子,胚,分生组织区域,愈伤组织,叶,根,芽,配子体,孢子体,花粉和小孢子。植物细胞可获自任意的植物器官或组织以及由其制备的培养物。可用于本发明方法的植物种类通常是广泛的,其可以是可用于转化技术的高等植物,包括单子叶的和双子叶的植物。
在这里所述的“转基因植物”包括在其基因组内含有异源多核苷酸的植物。异源的多核苷酸可以稳定地整合到基因组中,或可以被插入到染色体外。优选地,本发明的多核苷酸被稳定地整合到基因组中从而使多核苷酸被连续传代。植物细胞,组织,器官或已被导入异源多核苷酸的植物被认为是“转化的”,“转染的”或“转基因的”植物。也含有该异源多核苷酸的转化植物或植物细胞的直系和间接子代也被视为是转基因的。
可以利用将所需的编码所需蛋白的聚核苷酸序列导入植物细胞的多种方法,并且这些方法对本领域技术人员也是公知的,包括但不限于:(1)诸如微注射,电穿孔和微粒介导的递送(粒子枪(biolistic)或基因枪技术);(2)病毒介导的递送技术;以及(3)农杆菌介导的转化方法。
最常使用的转化植物细胞的方法是农杆菌介导的DNA转化方法和粒子枪或微粒轰击介导的方法(即,基因枪)。通常,核转化是所希望的,但是当需要用于特异性转化质粒,诸如叶绿体或者造粉体时,可以利用微粒介导递送所需的多核苷酸转化植物质粒。
农杆菌介导的转化通过使用基因工程化的属于农杆菌属的土壤细菌实现。具有Ti或Ri质粒的根癌农杆菌(Agrobacterium tumefaciens)以及发根农杆菌(Agrobacterium Rhizogenes)的大量野生型以及卸甲(disarmed)株可用于向植物进行基因转化。通过将可被基因工程化携带任一所需DNA片段的称作“T-DNA”的特异性DNA转化到很多品种的植物内进行基因转化。
农杆菌介导的植物的遗传转化包括若干步骤。第一步,首先将毒性的农杆菌和植物细胞彼此接触,通常这一步称作“接种”。接种后,使农杆菌和植物细胞/组织在一起培养几小时到几天的时间或者更长时间,培养条件适于生长和T-DNA的转化。这一步称作“共培养”。共培养和T-DNA递送以后,用杀细菌或者制菌剂处理植物细胞灭杀与外植体接触或者保留在含有外植体分容器中的农杆菌。如果在缺乏任一选择剂促进转基因植物细胞相比非转基因植物细胞的优先生长的条件下进行,通常这一步称作“延迟”步骤。如果在存在选择性好压转基因植物细胞的条件下进行,这一步称作“选择”步骤。在使用“延迟”步骤时,通常紧接着一个或者多个“选择步骤”。
对于微粒轰击(美国专利5,550,318(Adams等);美国专利5,538,880(Lundquist等),美国专利5,610,042(Chang等);以及PCT公开WO95/06128(Admas等);每一个都在此处具体引入作为参考)而言,粒子涂覆有核酸并通过推进力递送到细胞中。示范性的粒子包括钨,铂,并优选金。
通过加速将DNA递送到植物细胞中的方法的示范性实施方案为粒子枪粒子递送系统(Biolistics Particle Delivery System)(BioRad,Hercule,CA),该系统可被用于将通过筛子,诸如不锈钢或者Nytex筛子涂覆DNA或者细胞的粒子推进到用悬浮培养的单子叶植物细胞覆盖的过滤器表面上。
微粒轰击技术是广泛应用的技术,并且可几乎被用于转化任一的植物品种。已通过微粒轰击转化的植物品种的实例包括单子叶植物品种,诸如玉米(国际公开WO95/06128)(Adams等),大麦,小麦(美国专利5,563,055(Townsend等),在此处全文引入作为参考),大米,燕麦,黑麦(rye),甘蔗以及高粱;以及大量包括烟草,大豆的双子叶植物(美国专利5,322,783(Tomes等),在此处全文引入作为参考),向日葵,花生,棉花,番茄以及豆类(美国专利5,563,055(Townsend等)在此处全文引入作为参考)。
为了不考虑转化方法对转化的植物细胞进行选择或者记分,导入细胞中的DNA含有在可再生的植物组织中发挥产生对植物组织赋予对其他毒性化合物抗性的化合物的基因。用作可选择的,可筛选的或者可记分的标记的目的基因包括但不限于GUS,绿色荧光蛋白(GFP),荧光酶(LUX),抗生素或者除草剂耐受基因。抗生素抗性基因的实例包括青霉素,卡那霉素(以及新霉素,G418,博来霉素);氨甲蝶呤(以及三甲氧苄二氨嘧啶);氯霉素;卡那霉素以及四环素。编码参与除草剂耐受的蛋白的多核苷酸分子是本领域公知的,包括但不限于美国专利5,627,061(Barry等),美国专利5,633,435(Barry等),以及美国专利6,040,497(Spencer等)记载的编码5-烯醇丙酮基莽草酸盐-3-磷酸盐合成酶(EPSPS)以及美国专利5,094,945(Comai)描述的用于耐受glyphosate的aroA;描述于美国专利4,810,648(Duerrschnabel等)用于耐受溴苯腈(bromoxynil)的编码溴苯腈水解酶(Nitrilase)(Bxn)的多核苷酸分子;描述于Misawa et al,(1993)Plant J.4:833-840 and Misawaet al,(1994)Plant J.6:481-489用于耐受哒草伏(norflurazon)的编码八氢番茄红素脱氢酶(crtI)的多核苷酸分子;描述于Sathasiivan等,(1990)Nucl.Acids Res.18:2188-2193a用于耐受磺酰脲类除草剂的编码乙酰羟基酸合成酶(AHAS,aka ALS)的多核苷酸分子;以及描述于DeBlock,etal.(1987)EMBO J.6:2513-2519用于耐受草铵膦(Glufosinate)和双丙氨膦(bialaphos)的bar基因。
从多种转化的外植体再生,发育和培育植物是本领域公知的。这种再生和生长过程通常包括选择转化的细胞以及通过常规的胚芽发育到生根的小苗发育阶段培育这些单独的细胞的阶段。类似地再生转基因胚芽和种子。然后将所产生的转基因生根的小苗种植在合适的植物生长介质,诸如土壤中。暴露选择性试剂单存活下来的细胞,或者在筛选分析中记分为阳性的细胞可以培养在支持植物体再生的培养基中。将发育中的小苗转移到土壤较少的植物生长混合物中,并在转移到温室或者用于成熟的生长室之前使(幼苗)受冷而变得耐寒。
本发明可以与转化的细胞或者组织一起使用。本文中所使用的“可转化的”是指能够进一步繁殖产生植物体的细胞或者组织。本领域技术人员认识到大量插入外源DNA的植物细胞或者组织是可以转化的,并且在合适的培养条件下,该植物细胞或者组织可以形成分化的植物。
适于这些目的的组织可以包括但不限于未成熟的胚芽,小组织,悬浮细胞培养物,未成熟的花序,茎分生组织,结外植体,愈伤组织,下胚轴组织,子叶,根和叶。
可以使用任一合适的培养基。合适的培养基的实例包括但不限于基于MS-的培养基(Murashige and Skoog,Physiol.Plant,15:473-497,1962)或填充有包括但不限于植物激素,细胞分裂素,ABA和赤霉素的其他植物生长调节剂的基于N6-的培养基(Chu等,Scientia Sinica 18:659,1975)。本领域技术人员熟知多种组织培养基,其当进行适当补充时可以支持植物组织生长和发育并适于植物转化和再生。这些组织培养基可以作为市售制剂,或者用户制备以及改进的试剂出售。本领域技术人员可以认识到用于转化和再生的诸如营养剂和生长调节剂的培养基和培养基补充剂以及其他培养条件,诸如培养期间的光密度,pH,可被优化用于特定的多种目的的培养温度。
本领域技术人员将认识到将表达盒稳定整合到转基因植物并证实可以操作后,可以通过有性杂交导入其他的植物体内。取决于所杂交的品种,可以使用大量标准的繁殖技术。
具有改变的含油量表型的植物的鉴定
我们使用拟南芥激活标签筛选来鉴定我们已经鉴定并命名为“HIO1004”(At4g10550;GI#30681486)编码subtilase家族蛋白(GI#18413353)的基因与改变的含油量表型(具体地,高油表型)之间的关联。简要地,而且如实施例中进一步描述的,用pSKI015载体对许多拟南芥植物进行了突变,所述载体包含来自根癌农杆菌Ti质粒的T-DNA,病毒增强子元件和选择标记基因(Weigel等,2000)。当T-DNA插入到转化植物的基因组中时,增强子元件可导致附近基因的上调,通常在增强子的大约10千碱基(kb)内。为了特异性回收表达选择性标记并因此具有T-DNA插入序列的转化植物,把T1植物暴露于选择剂。从这些转化的T1植物收集大约15-20颗T2种子,并从全种子提取脂类。进行气相色谱(GC)分析,以测定种子样本的脂肪酸含量和组成。
对显示高油表型的拟南芥系进行了鉴定。通过分析所鉴定的品系中侧翼T-DNA插入片段基因组DNA序列发现了HIO1004基因与高油表型之间的关联。因此,HIO1004基因和/或多肽可用于开发具有修饰的含油量表型(“HIO1004表型”)的基因修饰的植物。HIO1004基因可用于产生含油种子作物,其从含油种子加工提供提高的产油量,以及用于生产能提供能量增加的饲料谷物作物用于动物饲养。HIO1004基因可进一步用于增加特种油料作物的含油量,以便增加所需稀有脂肪酸的产量。已经进行遗传修饰表达HIO1004的转基因植物可用于生产油,其中利用标准方法培养转基因植物,并从植物部分(例如,种子)获得油。
HIO1004核酸和多肽
拟南芥HIO1004核酸序列提供于SEQ ID NO:1以及Genbank登录号GI#30681486。对应的蛋白序列提供于SEQ ID NO:2以及GI#18413353中。拟南芥HIO1004的直系同源物或旁系同源物的核酸和/或蛋白描述于下面的实施例4中。
如这里使用的术语“HIO1004多肽”指全长HIO1004蛋白或其“功能活性”的片段,衍生物(变体)或者直系同源物,指该蛋白片段,衍生物或者直系同源物显示与SEQ ID NO:2的多肽相关的一种或多种功能活性。在一个优选的实施方案中,功能活性HIO1004多肽,当在植物中错表达时,导致改变的含油量表型。在更进一步优选的实施方案中,HIO1004多肽在植物中的错表达导致高油表型。在另一个实施方案中,功能活性HIO1004多肽当在植物或植物细胞中表达时,能拯救缺陷的(包括缺失的)内源HIO1004活性;该拯救多肽可来自与具有缺陷活性的植物相同的或不同的物种。在另一个实施方案中,全长HIO1004多肽的功能活性片段(也即,具有SEQ ID NO:2的序列的天然多肽或其天然存在的直系同源物)保留与全长HIO1004多肽相关的一种或多种生物学特性,例如信号活性,结合活性,催化活性或细胞或者细胞外定位活性。HIO1004片段优选包括HIO1004结构域,例如C-或N-末端或者催化结构域,尤其,优选包括HIO1004蛋白的至少10个,优选至少20个,更优选至少25个,最优选至少50个的连续氨基酸。功能域可使用PFAM程序进行鉴定(Bateman A等,1999 Nucleic Acids Res 27:260-262)。优选HIO1004片段包括一种或者多种subtilase结构域。
全长HIO1004多肽或其片段的功能活性变体包括具有氨基酸插入序列,缺失,或者置换,但保留与全长HIO1004多肽相关的一种或多种生物学特性的多肽。有时,产生的变体能改变HIO1004多肽的翻译后加工。例如,与天然多肽相比,变体可以具有改变的蛋白转运或者蛋白定位特性,或者改变的蛋白的半衰期。
这里使用的术语“HIO1004核酸”包含具有SEQ ID NO:1提供的序列,或者与SEQ ID NO:1提供的序列互补的序列的核酸,及其功能活性片段,衍生物或直系同源物。本发明的HIO1004核酸可以是来源于基因组DNA或者cDNA的DNA,或者RNA。
在一个实施方案中,功能活性的HIO1004核酸编码或者互补于编码功能活性的HIO1004多肽的核酸。基因组DNA包括在该定义内,其用作原始RNA转录本(也即,mRNA前体)的模板,其在编码功能活性HIO1004多肽之前需要加工,例如剪接。HIO1004核酸可包括其他的非编码序列,其可以转录或者不被转录;这种序列包括5’和3’UTRs,聚腺苷酸化信号和尤其是本领域已知的控制基因表达的调节序列。一些多肽需要加工事件,例如蛋白水解剪切,共价修饰,等等,以便完全活化。因此,功能活性核酸可编码成熟的或者预先加工的HIO1004多肽,或者中间体形式。HIO1004多核苷酸还可以包括异源编码序列,例如,编码包括的促进融合多肽纯化的标记或者转化标记的序列。
在另一个实施方案中,功能活性HIO1004核酸可用于例如,通过反义抑制,共抑制等产生功能丧失的HIO1004表型。
在一个优选的实施方案中,用于本发明方法的HIO1004核酸,包括编码或互补于编码HIO1004多肽的序列的核酸序列,该HIO1004多肽与SEQ ID NO:2提供的多肽序列具有至少50%,60%,70%,75%,80%,85%,90%,95%或以上的序列同一性。
在另一个实施方案中,本发明的HIO1004多肽包括与SEQ ID NO:2的HIO1004多肽序列具有至少50%或60%同一性的多肽序列,而且与SEQ ID NO:2的HIO1004多肽序列可具有至少70%,80%,85%,90%或95%或以上的序列同一性。在另一个实施方案中,HIO1004多肽包括与SEQ ID NO:2所示的多肽的功能活性片段具有至少50%,60%,70%,80%,85%,90%或95%或以上的序列同一性的多肽序列,诸如一或者多个枯草杆菌蛋白酶或蛋白相关(PA)功能域。在另一个实施方案中,HIO1004多肽包括与SEQ ID NO:2的多肽序列的全长具有至少50%,60%,70%,80%或90%的序列同一性的多肽序列并且包括一或者多个枯草杆菌蛋白酶或蛋白相关(PA)功能域。
在另一个方面,HIO1004多核苷酸序列与SEQ ID NO:1所示的HIO1004核酸序列的全长或是与这种HIO1004序列互补的核酸序列具有至少50%到60%的同一性,而且可包含与SEQ ID NO:1所示的HIO1004序列或其功能活性片段,或互补序列具有至少70%,80%,85%,90%或95%或以上的序列同一性。
这里使用的,特定的目标序列或其特定部分的“百分比(%)序列同一性”被定义为如果需要获得最大的百分比序列同一性,如通过WU-BLAST-2.0a19程序(Altschul等,J.Mol.Biol.(1990)215:403-410)所产生的,其中搜索参数设为缺省值,在进行序列比对和引入缺口之后,候选的衍生序列中核苷酸或氨基酸与目标序列(或其特定部分)中核苷酸或氨基酸相同的百分比。HSP S和HSP S2参数是机动值,而且是通过程序本身取决于特定序列的组成和在其中对感兴趣的序列进行搜索的特定数据库的组成而确定的。“%同一性值”通过把匹配的相同核苷酸或氨基酸的数目除以报告的百分比同一性的序列的序列长度而确定。“百分比(%)氨基酸序列相似性”通过进行与确定百分比氨基酸序列同一性相同的计算而确定,但是在计算中除了相同的氨基酸之外还包括保守氨基酸取代。保守氨基酸取代,即其中氨基酸被具有相似特性的另一个氨基酸所取代,而对蛋白的折叠或活性没有显著的影响。可以互相取代的芳香族氨基酸为苯丙氨酸,色氨酸和酪氨酸;可互换的疏水氨基酸为亮氨酸,异亮氨酸,甲硫氨酸和缬氨酸;可互换的极性氨基酸为谷氨酰胺和天门冬酰胺;可互换的碱性氨基酸为精氨酸,赖氨酸和组氨酸;可互换的酸性氨基酸为天冬氨酸和谷氨酸;可互换的小氨基酸为丙氨酸,丝氨酸,苏氨酸,半胱氨酸和甘氨酸。
目标核酸分子的衍生核酸分子包括能选择性地与SEQ ID NO:1的核酸序列杂交的序列。杂交的严谨度可通过温度,离子强度,pH,以及杂交和洗涤期间变性剂诸如甲酰胺的存在来进行控制。通常使用的条件是大家所熟知的(参见,例如,Current Protocol in MolecularBiology,Vol.1,Chap.2.10,John Wiley & Sons,Publishers(1994);Sambrook等,Molecular Cloning,Cold Spring Harbor(1989))。在一些实施方案子中,本发明的核酸分子能在如下的严谨杂交条件下与包含SEQ ID NO:1的核苷酸序列的核酸分子杂交:含有核酸的滤纸,在含有6X单倍浓度的柠檬酸盐(SSC)(1X SSC为0.15M NaCl,0.015M柠檬酸钠;pH7.0),5X Denhardt溶液,0.05%焦磷酸钠和100μg/ml的鲱鱼精子DNA的溶液中,65℃预杂交8小时至过夜;在含有6X SSC,1XDenhardt溶液,100μg/ml酵母tRNA和0.05%焦磷酸钠的溶液中,65℃杂交18-20小时;在含有0.1X SSC和0.1%SDS(十二烷基硫酸钠)的溶液中,65℃洗涤滤纸1小时。在其他的实施方案中,使用如下的中等严谨杂交条件:包含核酸的滤纸,在含有35%甲酰胺,5X SSC,50mMTris-HCl(pH7.5),5mM EDTA,0.1%PVP,1%Ficoll,1%BSA和500μg/ml变性鲑鱼精子DNA的溶液中,40℃预处理6小时;在含有35%甲酰胺,5X SSC,50mM Tris-HCl(pH7.5),5mM EDTA,0.02%PVP,0.02%Ficoll,0.2%BSA,100μg/ml鲑鱼精子DNA和10%(wt/vol)葡聚糖硫酸酯的溶液中,40℃杂交18-20小时;接着,在含有2X SSC和0.1%SDS的溶液中,55℃洗涤两次1小时。或者,可使用如下的低严谨条件:在含有20%甲酰胺,5x SSC,50mM磷酸钠(pH7.6),5XDenhardt溶液,10%葡聚糖硫酸酯和20μg/ml变性剪切鲑鱼精子DNA的溶液中,37℃孵育8小时到过夜;在相同的缓冲液中杂交18到20小时;在1x SSC中,大约37℃洗涤滤纸1小时。
由于遗传密码的简并性,可产生许多编码HIO1004多肽的多核苷酸序列。例如,根据特定宿主生物显示的最佳密码子使用,可选择密码子以增加多肽在特定的宿主物种中的表达(参见,例如,Nakamura等,1999)。这种序列变体可用于本发明的方法中。
本发明的方法可使用拟南芥HIO1004的直系同源物。鉴定其他植物品种中直系同源物的方法是本领域已知的。一般说来,不同物种中的直系同源物保持相同的功能,由于存在一个或多个蛋白基序和/或三维结构。在进化过程中,当物种形成后发生基因重复事件时,一个物种,例如拟南芥中的单个基因可能相应于另一个物种中的多个基因(旁系同源物)。这里使用的,术语“直系同源物”包括旁系同源物。当序列数据可用于特定的植物物种时,通常可通过序列同源性分析,例如BLAST分析,一般使用蛋白饵序列,来鉴定直系同源物。如果来自正向BLAST结果的最合适序列检索到了反向BLAST中原始的查询序列,该序列则为可能的直系同源物(Huynen MA和Bork P,Proc Natl AcadSci(1998)95:5849-5856;Huynen MA等,Genome Research(2000)10:1204-1210)。
用于多个序列比对的程序,例如CLUSTAL(Thompson JD等,1994,Nucleic Acids Res 22:4673-4680),可用于突出直系同源蛋白的保守区域和/或残基,并产生系统树。在表示来自不同物种的多个同源序列(例如,通过BLAST分析检索到的)的系统树中,来自2个物种的直系同源序列,相对于来自2个物种的所有其他的序列,通常在系统树上显得最靠近。结构串线(threading)或蛋白折叠的其他分析(例如,使用ProCeryon,Biosciences,Salzburg,Austria的软件)也可鉴定可能的直系同源物。核酸杂交方法也可用于寻找直向同源基因,而且当不能获得序列数据是优选的。简并PCR和cDNA或基因组DNA文库筛选是寻找相关基因序列的常见方法,而且是本领域熟知的(参见,例如,Sambrook,1989;Dieffenbach and Dveksler,1995)。例如,Sambrook等中描述了用于从感兴趣的植物物种产生cDNA文库,和用部分同源基因探针探测文库的方法。拟南芥HIO1004编码序列的高度保守部分可用作探针。HIO1004直系同源核酸可在高度,中度或低度严谨条件下与SEQ ID NO:1的核酸杂交。扩增或分离假定的直系同源物的部分之后,可通过标准技术克隆该部分并进行测序,而且用作探针来分离完整的cDNA或基因组克隆。或者,可以启动EST方案来产生感兴趣的植物物种的序列信息数据库。在另一种方法中,能特异性结合已知的HIO1004多肽的抗体,用于直系同源物分离(参见,例如,Harlow andLane,1988,1999)。Western印迹分析可确定HIO1004直系同源物(也即,直系同源蛋白)存在于特定植物物种的粗提取物中。当观察反应性时,可通过筛选显示特定植物物种的表达文库,来分离编码候选直系同源物的序列。如Sambrook等1989中所述,可在各种商业可获得的载体中构建表达文库,包括λgt11。一旦通过任何这些方法鉴定到了候选的直系同源物,候选的直系同源序列可用作饵(“查询”),用于从其中已经鉴定到HIO1004核酸和/或多肽序列的拟南芥或其他的物种中对序列进行反向BLAST。
可使用任何可用的方法来获得HIO1004核酸和多肽。例如,通过如前所述的筛选DNA文库或通过使用聚合酶链式反应(PCR),分离感兴趣的cDNA或基因组DNA序列的技术是本领域熟知的。或者,可合成核酸序列。任何已知的方法,例如位点定向诱变(Kunkel TA等,1991),可用于将所需的改变引入到克隆的核酸中。
通常,本发明的方法包括把所需形式的HIO1004核酸整合到用于转化植物细胞的植物表达载体中,并在宿主植物中表达HIO1004多肽。
分离的HIO1004核酸分子是不同于天然发现的形式或设置的核酸分子,而且从至少一个杂质核酸分子中鉴定和分离,该杂质核酸分子通常结合在HIO1004核酸的天然来源中。然而,分离的HIO1004核酸分子包括包含在通常表达HIO1004的细胞中的HIO1004核酸分子,例如,该核酸分子位于与天然细胞的核酸分子不同的染色体位置中。
产生具有改变的含油量表型的遗传修饰的植物
HIO1004核酸和多肽可用于产生具有修饰的含油量表型的遗传修饰的植物。这里使用的,“修饰的含油量表型”可指植物任何部分中修饰的含油量;经常在种子中观察到修饰的含油量。在一个优选的实施方案中,植物中HIO1004基因的改变表达可用于产生具有高油表型的植物。
这里所述的方法一般适用于所有植物。尽管在拟南芥中进行了激活标签法和基因鉴定,但是HIO1004基因(或其直系同源物,变体或片段)可在任何植物种类中表达。在一个优选的实施方案中,本发明涉及产油植物,其在特异性器官,主要是在种子中生产和储存三酰基甘油。这些物种包括大豆(Glycine max),油菜籽和加拿大油菜(包括甘蓝型油菜(Brassica napus),B.campestris),向日葵(Helianthus annus),棉花(陆地棉),玉米(Zea maya),可可(Theobroma cacao),红花(Carthamustinctorius),油棕(Elaeis guineensis),椰子(Cocos nucifera),亚麻(Linumusitatissimum),蓖麻(Ricinus communis)和花生(Arachis hypogaea)。本发明还涉及产生果实和蔬菜的植物,产生谷物的植物,产生坚果的植物,快速周期的芸苔品种,紫花苜蓿(Medicago sativa),烟草(Nicotiana),草坪草(Poaceae family),其他的饲料作物,和可能是稀有脂肪酸来源的野生物种。
本领域技术人员应该了解本领域存在的各式各样的转化技术,而且新技术不断地变成可用的。适于靶宿主植物的任何技术可用于本发明的范围内。例如,可引入各种形式的构建体,包括但不限于DNA链,到质粒,或人工染色体中。可通过各种技术将构建体引入到靶植物细胞中,包括但不限于异源核酸的土壤农杆菌介导的转化,电穿孔法,显微注射,微粒轰击,磷酸钙-DNA共沉淀或脂质体介导的转化。植物转化优选是永久的,也即通过使导入的表达构建体整合到宿主植物基因组中,以便该导入的构建体传递给连续的植物世代。根据计划的用途,包含HIO1004多核苷酸的异源核酸构建体可编码完整的蛋白或其生物学活性部分。
在一个实施方案中,双元的基于Ti的载体系统可用于转移多核苷酸。标准的土壤农杆菌双元载体是本领域技术人员已知的,而且许多是可商业获得的(例如,pBI121 Clontech Laboratories,Palo Alto,CA)。构建体或者载体可以包括植物启动子来表达所选择的核酸分子。在优选的实施方案中,启动子为植物启动子。
用土壤农杆菌载体转化植物的最佳方法随待转化的植物种类而变化。用于土壤农杆菌介导的转化的示例性方法包括转化来源于无菌籽苗和/或小植株的胚轴,芽,茎或叶组织的外植体。这种转化的植物可有性繁殖,或通过细胞或组织培养繁殖。先前已经描述了土壤农杆菌转化用于许多不同类型的植物,而且可在科学文献中找到这种转化方法。其中特别相关的是转化商业上重要的作物,例如油菜籽(De Block等,1989),向日葵(Everett等,1987)和大豆(Christou等,1989;Kline等,1987)的方法。
根据表达水平,发生表达的组织类型和/或表达的发育阶段,可调节HIO1004的表达(包括转录和翻译)。许多异源调节序列(例如,启动子和增强子)可用于控制HIO1004核酸的表达。这些包括组成型,诱导型和可调节的启动子,以及能以组织或瞬时特异性方式调控表达的启动子和增强因子。示例性的组成型启动子包括树莓E4启动子(美国专利5,783,393和5,783,394),胭脂碱合成酶(NOS)启动子(Ebert等,Proc.Nat.Acad.Sci(U.S.A)84:5745-5749,1987),章鱼碱合成酶(OCS)启动子(其由根癌农杆菌的诱导肿瘤的质粒携带),诸如花椰菜花叶病毒(CaMV)19S启动子(Lawton等,Plant Mol.Biol,9:315-324,1987)以及CaMV35S启动子(Odell et al.,Nature 313:810-812,1985 and JonesJD et al,1992)的花椰菜病毒启动子,甜瓜肌动蛋白启动子(公开的PCT申请WO0056863),玄参花叶病毒35S-启动子(美国专利5,378,619),光诱导的来自1,5-二磷酸核酮糖羧化酶小亚基的启动子(ssRUBISCO),Adh启动子(Walker等,Proc.Natl.Acad.Sci.(U.S.A.)84:6624-6628,1987),蔗糖合成酶启动子(Yang等,Proc.Natl.Acad.Sci.(U.S.A.)87:4144-4148,1990),R基因复合启动子(Chandler等,The Plant Cell1:1175-1183,1989),叶绿素a/b结合蛋白基因启动子,CsVMV启动子(Verdaguer B等,1998);这些启动子也被用于产生在植物中表达的DNA构建体,例如PCT公开WO84/02913。示例性的组织特异性启动子包括番茄E4和E8启动子(美国专利5,859,330)和番茄2AII基因启动子(Van Haaren MJJ等,1993)。
在一个优选的实施方案中,HIO1004表达在来自其表达与早期种子和/或胚胎发育相关的基因的调节序列的调控下。实际上,在优选的实施方案中,所使用的启动子为种子增强的启动子。这种启动子的实例包括来自诸如napin(Kridl等,Seed Sci.Res.1:209:219,1991),球蛋白(Belanger and Kriz,Genet.,129:863-872,1991,GenBank AccessionNo.L22295),γ玉米醇溶蛋白Z 27(Lopes等,Mol Gen Genet.,247:603-613,1995),L3油质蛋白启动子(美国专利6,433,252),菜豆蛋白(Bustos等,Plant Cell,1(9):839-853,1989),arcelin5(US 2003/0046727),大豆7S启动子,7Sα启动子(US 2003/0093828),大豆7Sα’β黄豆蛋白启动子,7Sα’启动子(Beachy等,EMBO J.,4:3047,1985;Schuler等,Nucleic Acid Res.,10(24):8225-8244,1982),大豆胰蛋白酶抑制剂(Riggs等,Plant Cell 1(6):609-621,1989),ACP(Baerson等,Plant Mol.Biol.,22(2):255-267,1993),硬脂酰-ACP脱氢酶(Slocombe等,PlantPhysiol.104(4):167-176,1994),β黄豆蛋白的大豆a′亚基(Chen等,Proc.Natl.Acad.Sci.83:8560-8564,1986),蚕豆USP(P-Vf.Usp,SEQ ID NO:1,2,和3(US 2003/229918)以及玉米L3油质蛋白启动子(Hong等,PlantMol.Biol.,34(3):549-555,1997)等基因的5’调节区域。还包括玉米醇溶蛋白,是在玉米胚乳中发现的一组贮藏蛋白。玉米醇溶蛋白基因的基因组克隆已被分离(Pedersen等,Cell 29:1015-1026,1982;以及Russell等,Transgenic Res.6(2):157-168)并且来自这些克隆的启动子,包括15kD,16 kD,19 kD,22 kD,27 kD以及这些基因也可被利用。已知例如在玉米内发挥功能的其他启动子包括下列基因的启动子:waxy,Brittle,Shrunken 2,分支酶I和II,淀粉合成酶,去分支酶,油质蛋白,谷蛋白以及蔗糖合成酶。其启动子与早期种子和胚胎发育相关的豆科植物基因包括V.faba豆球蛋白(Baumlein等,1991,Mol Gen Genet225:121-8;Baumlein等,1992,Plant J 2:233-9),V.faba usp(Fiedler等,1993,Plant Mol Biol 22:669-79),豌豆convicilin(Bown等,1988,Biochem J 251:717-26),豌豆凝集素(dePater等,1993,Plant Cell 5:877-86),P.vulgaris β菜豆蛋白(Bustos等,1991,EMBO J 10:1469-79),P.vulgaris DLEC2和PHS[β](Bobb等,1997,Nucleic Acids Res 25:641-7)和大豆β-conglycinin,7S贮藏蛋白(Chamberland等,1992,PlantMol Biol 19:937-49)。
其启动子与早期种子和胚胎发育相关的谷类基因包括水稻谷蛋白(″GluA-3,″Yoshihara and Takaiwa,1996,Plant Cell Physiol 37:107-11;″GluB-1,″Takaiwa等,1996,Plant Mol Biol 30:1207-21;Washida等,1999,Plant Mol Biol 40:1-12;″Gt3,″Leisy等,1990,Plant Mol Biol 14:41-50),水稻醇溶谷蛋白(Zhou & Fan,1993,Transgenic Res 2:141-6),小麦醇溶谷蛋白(Hammond-Kosack等,1993,EMBO J 12:545-54),玉米醇溶蛋白(Z4,Matzke等,1990,Plant Mol Biol 14:323-32)和大麦B-hordein(Entwistle等,1991,Plant Mol Biol 17:1217-31)。
其他的其启动子与早期种子和胚胎发育相关的基因,包括油棕GL07A(7S球蛋白,Morcillo等,2001,Physiol Plant 112:233-243),甘蓝型油菜napin,2S贮藏蛋白和napA基因(Josefsson等,1987,J BiolChem 262:12196-201;Stalberg等,1993,Plant Mol Biol 1993 23:671-83;Ellerstrom等,1996,Plant Mol Biol 32:1019-27),甘蓝型油菜油质蛋白(Keddie等,1994,Plant Mol Biol 24:327-40),拟南芥油质蛋白(Plant等,1994,Plant Mol Biol 25:193-205),拟南芥FAEl(Rossak等,2001,Plant Mol Biol 46:717-25),刀豆conA(Yamamoto等,1995,Plant Mol Biol 27:729-41)和长春花异胡豆苷合成酶(Str,Ouwerkerk andMemelink,1999,Mol Gen Genet 261:635-43)。在另一个优选的实施方案中,使用来自在油生物合成期间表达的基因的调节序列(参见,例如,美国专利5,952,544)。可选择的启动子来自于植物贮藏蛋白基因(Bevan等,1993,Philos Trans R Soc Lond B Biol Sci 342:209-15)。其他可使用的启动子例如描述于美国专利5,378,619;5,391,725;5,428,147;5,447,858;5,608,144;5,608,144;5,614,399;5,633,441;5,633,435和4,633,436。
在另一个方面,有时可能需要抑制宿主细胞中内源HIO1004的表达。用于实施本发明该方面的示例性方法包括,但不限于反义抑制(Smith等,1988;van der Krol等,1988);共抑制(Napoli,等,1990);核酶(PCT公开WO97/10328);和正义与反义的组合(Waterhouse,等,1998)。抑制宿主细胞中内源序列的方法,一般使用待抑制序列的至少一部分的转录或转录和翻译。这种序列可以与内源序列的编码以及非编码区同源。反义抑制可使用完整的cDNA序列(Sheehy等,1988),部分cDNA序列包括5’编码序列(Cannon等,1990)或3’非编码序列(Ch′ng等,1989)的片段。共抑制技术可使用完整的cDNA序列(Napoli等,1990;van der Krol等,1990)或部分cDNA序列(Smith等,1990)。
可进行标准的分子和遗传试验,以更进一步分析基因与观察到的表型之间的关联。示例性技术描述如下。
1. DNA/RNA分析
例如,通过原位杂交,可通过突变体与野生型系的对比确定阶段-与组织特异性基因表达模式。可进行基因,尤其是侧翼调节区甲基化状况的分析。其他的适用技术包括过表达,异位表达,在其他植物物种中的表达和基因敲除(反向遗传学,靶向敲除,病毒诱导的基因沉默[VIGS,参见Baulcombe D,1999])。
在优选的应用中,通过微阵列分析的表达分布被用于同时测量许多不同基因表达中的差异或诱导的改变。用于微阵列分析的技术是本领域熟知的(Schena M等,Science(1995)270:467-470;Baldwin D等,1999;Dangond F,Physiol Genomics(2000)2:53-58;van Hal NL等,JBiotechnol(2000)78:271-280;Richmond T and Somerville S,Curr OpinPlant Biol(2000)3:108-116)。可以进行单独标签的株系的表达分布分析。这种分析可鉴定由于感兴趣基因的过表达而协调调节的其它基因,其可有助于把未知基因置于特定的途径。
2. 基因产物的分析
基因产物分析可包括重组蛋白表达,抗血清产生,免疫定位,催化或其他的活性的生物化学分析,磷酸化状况分析和通过酵母双杂交分析进行与其他蛋白之间的相互作用分析。
3. 途径分析
途径分析可包括,基于它的错表达表型或通过与相关基因的序列同源性,把基因或基因产物置于特定的生物化学,新陈代谢或信号途径中。或者,分析可包括与野生型系和其它突变系的遗传交叉(产生双突变体),以把基因指定于途径中,或确定在途径中突变对下游“报告”基因表达的作用。
产生具有改变含油量的表型的突变植物
本发明更进一步提供了鉴定在内源HIO1004或者其等位基因中具有能赋予这些植物及其后代HIO1004表型的突变的非转基因植物的方法。在一种称为“TILLING”的方法中(用于在基因组中靶向诱导的局部病变),例如,使用EMS处理,在感兴趣植物的种子中诱导突变。培养得到的植物,并且自花受精,后代用于制备DNA样品。HIO1004-特异性PCR被用于鉴定突变的植物是否具有HIO1004突变。然后测试具有HIO1004突变的植物含油量的改变,或者,测试植物的含油量的改变,然后使用HIO1004-特异性PCR确定具有改变含油量的植物是否具有突变的HIO1004基因。TILLING可鉴定能改变特异性基因的表达或由这些基因编码的蛋白的活性的突变(参见Colbert等(2001)Plant Physiol126:480-484;McCallum等(2000)Nature Biotechnology 18:455-457)。
在另一种方法中,候选基因/数量性状基因座(QTL)方法可用于标记辅助的育种项目,以鉴定HIO1004基因或HIO1004直系同源物中能赋予含油量的改变的等位基因或突变(参见Bert等,Theor Appl Genet.2003 Jun;107(1):181-9;以及Lionneton等,Genome.2002 Dec;45(6):1203-15)。因此,在本发明更进一步的方面中,HIO1004核酸被用于鉴定具有改变的含油量的植物是否在内源HIO1004中具有突变,或是否具有能导致含油量改变的特定等位基因。
虽然参考特定的方法和实施方案已经描述了本发明,应当理解只要不背离本发明可以进行各种修饰和改变。这里引用的所有出版物都明确地在这里作为参考引入,用于描述和公开可与本发明一起使用的组合物和方法的目的。所有引用的专利,专利申请和参考的网站和公共数据库中的序列信息也引入作为参考。
实施例
实施例1
利用激活标签构建体进行转化产生具有HIO1004表型的植物
使用激活标签“ACTTAG”载体,pSKI015产生突变体(GI#6537289;Weigel D等,2000)。使用标准方法产生拟南芥转基因植物,基本上如公开的申请PCT WO0183697中所述。简要地,T0拟南芥(Col-0)植物用携带有pSKI015载体的土壤农杆菌进行转化,该载体包括来源于土壤农杆菌Ti质粒的T-DNA,除草剂抗性选择性标记基因和4X CaMV35S增强子元件。根据除草剂抗性,在T1世代选择转基因植物。
在收获时通过近红外光谱学(NIR)分析T3种子。利用Bruker 22N/F捕获NIR红外光谱。利用NIR分析的数据和参考厂商说明通过Bruker软件估计总种子油的含量以及总种子蛋白含量。将我们的校准预测的油含量(ren油1473 ld+sline.q2,预测己烷萃取油),紧接美国石油化学家学会官方的方法以及推荐作法(Official and RecommendedPractices of American Oil Chemists Society),第五版本,AOCS,Champaign,Ill的AOCS法AM1-92的一般方法,与38,090个个体ACTTAG系进行比较。种子组成分析之后,通过反向PCR以及测序确定各品系基因组中ACTTAG元件的位置。在这个分析中考虑38,090个具有回收的侧翼序列的品系。
由于种植了38,090个品系并且长满12个月,将种子油含量值校正到使环境差异的影响最小化,所述环境差异可以改变种子油含量。计算所种植的品系每天的平均种子油含量及其标准偏差。种子油含量表示为“相对标准偏差距离”(SD距离),通过从各品系种子油含量减去种植日平均种子油含量并由那天标准偏差除差异进行计算。该标准化可以比较整年生长的种植种子中的种子油含量。
通过评价38,090个品系中所有受ACTTAG元件影响的基因鉴定过表达时引起高种子油表现型的基因。通过下列方法实现;首先,鉴定各品系中可能由ACTTAG元件激活的基因并将品系的种子油含量指定给这些基因;第二,当特定的基因过表达时通过获得各基因单独的种子油值的平均值确定种子油含量。由于评价了38,090个品系,并且各元件影响平均2.5个基因,各基因将具有4个种子油值的平均值。具有最高平均SD距离的基因被确定为过表达时引起高种子油的基因。
过表达At4g10550,HIO1004的植物的油含量以及“相对标准偏差距离”显示在下表1中。
表1.
Tair 相对标准差距离 植物计数 描述 品系ID 种植日期 n(所种植的ACTTAG品系用NIR测定日的#) 种子油含量(%) 种植日期的平均油含量(%) 种植日期油含量的标准差
At4g10550 2.851811 1 枯草杆菌蛋白酶-类丝氨酸蛋白酶 W000198284 9/25/02 1030 36.176 29.774 2.245
实施例2
显示改变的含油量表型的植物中T-DNA插入序列的表征
我们进行了基本上如专利申请PCT WO0183697中所示的标准分子分析,以确定与改变的含油量表型相关的T-DNA插入位点。简而言之,从显示改变的含油量表型的植物提取基因组DNA。使用pSKI015载体的特异性引物进行的PCR,确认了来自HIO1004油系的植物中存在35S增强子,Southern印迹分析证实了ACTTAG T-DNA的基因组整合,并且显示单独的T-DNA插入序列在转基因系中的存在。
反相PCR被用于回收T-DNA插入序列侧翼的基因组DNA,然后使用基础的BLASTN搜索和/或拟南芥信息源(TAIR)数据库(可以在公众可以进入的拟南芥信息资源网站获得)进行序列分析。
实施例3
HIO1004表型的复述
为了检验At4g10550的过表达是否引起高种子油表型,将从过表达该基因的转基因植物的种子中的油含量与来自非-转基因对照植物种子中的油含量。为了这么做,将At4g10550克隆到种子特异性CsVMV启动子后植物转化载体中并利用花浸渍法转化到拟南芥植物中。该植物转化载体含有由RE4启动子启动的nptII基因提供针对卡那霉素的抗性并用作选择性标记。将来自转化的植物的种子接种在含有卡那霉素的琼脂培养基上。7天后,转基因植物被鉴定为健康的绿色植物并移植到土壤上。非-转基因对照植物在琼脂培养基上萌芽,生长7天然后移植到土壤上。将22个转基因的幼苗和10个非转基因的对照植物转移到相同的32格平地的随机位置。植物生长至成熟并自花授精并结子。从每一植物收获种子,通过如下所述的方法由Near Infrared(NIR)波谱学评估种子的含油量。由NIR光谱学测定的从各植物收获的种子中的油百分比显示于表3中。通过用预测的油值除以对照种子(即没有转基因的植物的种子)中的平均油值确定相对的油值。
已经在2个实验中检验了At4g10550的过表达对种子油的影响。在2个实验中,过表达At4g10550的植物具有比生长在相同的平地的对照植物高的种子油含量。整个实验中,过表达At4g10550的植物的平均种子油含量比未转化的对照高5.0%。过表达At4g10550的植物的种子油含量显著高于非-转基因对照植物(双向方差分析;P=0.0134)。
表2
    实验     植物     转基因 油百分比     相对油
    1     DX07124001     CsVMV:At4g10550 35.45     112.41
    1     DX07124002     CsVMV:At4g10550 32.84     104.15
    1     DX07124003     CsVMV:At4g10550 35.8     113.53
    1     DX07124004     CsVMV:At4g10550 34.18     108.4
    1     DX07124005     CsVMV:At4g10550     36.75     116.55
    1     DX07124006     CsVMV:At4g10550     32.46     102.96
    1     DX07124007     CsVMV:At4g10550     32.69     103.68
    1     DX07124008     CsVMV:At4g10550     35.91     113.89
    1     DX07124009     CsVMV:At4g10550     35.51     112.62
    1     DX07124010     CsVMV:At4g10550     30.63     97.13
    1     DX07124011     CsVMV:At4g10550     27.88     88.41
    1     DX07124012     CsVMV:At4g10550     32.2     102.1
    1     DX07124013     CsVMV:At4g10550     33.98     107.76
    1     DX07124014     CsVMV:At4g10550     35.41     112.31
    1     DX07124015     CsVMV:At4g10550     33.04     104.8
    1     DX07124017     CsVMV:At4g10550     30.85     97.83
    1     DX07124018     CsVMV:At4g10550     26.81     85.03
    1     DX07124019     CsVMV:At4g10550     33.2     105.29
    1     DX07124020     CsVMV:At4g10550     29.61     93.92
    1     DX07124022     CsVMV:At4g10550     35.58     112.84
    1     DX07142001     无     31.45     99.73
    1     DX07142002     无     32.26     102.32
    1     DX07142003     无     29.89     94.8
    1     DX07142004     无     31.67     100.44
    1     DX07142005     无     32.41     102.77
    1     DX07142006     无     29.82     94.56
    1     DX07142007     无     30.37     96.3
    1     DX07142008     无     30.69     97.34
    1     DX07142009     无     33.26     105.5
    1     DX07142010     无     33.5     106.25
    2     DX07169001     CsVMV:At4g10550     32.31     112.36
    2     DX07169003     CsVMV:At4g10550     32.73     113.8
    2     DX07169004     CsVMV:At4g10550     27.65     96.15
    2     DX07169005     CsVMV:At4g10550     31.12     108.23
    2     DX07169006     CsVMV:At4g10550     30.32     105.43
    2     DX07169007     CsVMV:At4g10550     26.81     93.21
    2     DX07169008     CsVMV:At4g10550     30.22     105.07
    2     DX07169009     CsVMV:At4g10550     29.84     103.77
    2     DX07169010     CsVMV:At4g10550     30.51     106.08
    2     DX07169011     CsVMV:At4g10550     31.17     108.38
    2     DX07169013     CsVMV:At4g10550     33.02     114.81
    2     DX07169014     CsVMV:At4g10550     28.9     100.49
    2     DX07169015     CsVMV:At4g10550     29.19     101.48
    2     DX07187001     无     31.04     107.93
    2     DX07187002     无     29.29     101.83
    2     DX07187003     无     28.4     98.76
    2     DX07187004     无     30.6     106.4
    2     DX07187005     无     27     93.87
    2     DX07187006     无     28.22     98.14
    2     DX07187007     无     27.93     97.1
    2     DX07187008     无     28.7     99.79
    2     DX07187009     无     28.38     98.69
    2     DX07187010     无     28.04     97.5
实施例4
拟南芥HIO1004序列的分析
用BLAST(Altschul等,1990,J.Mol.Biol.215:403-410),PFAM(Bateman等,1999,Nucleic Acids Res 27:260-262),PSORT(Nakai K,和Horton P,1999,Trends Biochem Sci 24:34-6),和/或CLUSTAL(Thompson JD等,1994,Nucleic Acids Res 22:4673-4680)进行序列分析。
TBLASTN对比ESTs:
候选基因At4g10550得到全长cDNAgi:22136593的支持。有许多来自显示与At4g10550具有相似性不同的植物品种的ESTs。尽可能制备各品种的ESTs重叠群。每一下列品种的最佳符合列于如下并且包括在以下的“直系同源物表2”中:小麦(Triticum aestivum),大豆(Glycinemax),辣薄荷(Mentha×Piperita),欧洲山杨(Populus tremula),水稻(Oryza sativa),番茄(Lycopersicon esculentum),马铃薯(Solanumtuberosum)以及甜菜(Beta vulgaris)。
1.具有下列GenBank IDS的甜菜ESTs:
gi|10711340
2.具有下列GenBank IDS的马铃薯ESTs:
gi|10446020
gi|10446024
gi|13612262
gi|13613712
gi|14264360
gi|14267180
gi|15185273
3.具有下列GenBank IDS的番茄ESTs:
gi|6536422
gi|6536423
gi|6536424
gi|6536425
gi|1771159
gi|1771159
gi|1771160
4.具有下列GenBank IDS的水稻ESTs:
gi|453866
5.具有下列GenBank IDS的白杨ESTs:
gi|3852817
gi|3854402
gi|18012433
gi|23988298
gi|23991758
gi|24099801
gi|27419447
gi|27419568
gi|27419599
gi|27419823
gi|27420015
gi|27420028
gi|27420265
gi|33183186
gi|33183327
gi|33184237
gi|33185612
6.具有下列GenBank IDS的大豆ESTs:
gi|14150445
gi|13478114
gi|26057369
7.具有下列GenBank IDS的玉米ESTs:
gi|6827742
gi|21208160
gi|12045659
gi|18164698
gi|29130115
8.具有下列GenBank IDS的棉花ESTs:
gi|5049444
gi|5049221
gi|5048791
gi|5046192
gi|5046014
gi|5045524
9.具有下列GenBank IDS的小麦ESTs:
gi|14313023
gi|14313024
gi|14313383
gi|14313807
gi|14314440
gi|14314549
gi|14316759
gi|14316760
gi|14317648
gi|15315409
gi|15772265
gi|19956142
gi|20048856
gi|20086046
gi|25157476
gi|25218457
gi|25238573
gi|32559310
BLASTP对比氨基酸:
蛋白At4g10550与其他生物的枯草杆菌蛋白酶类丝氨酸蛋白酶具有同源性。来自拟南芥的蛋白酶的详细系统发生分析显示At4g10550是具有39个成员的S8-1丝氨酸蛋白酶的成员(Beers,E.,et al.,Phytochemistry 2004,65:43-58)。显示At4g10550与At4g10540,At4g10510,At1g32940,At1g32950和At1g32960密切相关。这些蛋白在植物(planta)中很可能发挥类似的功能。At4g10550最好的10个BLAST结果如下所示,并包括在下表2的直系同源物中。
1.来自拟南芥的At4g10550本身
gi|18413353|ref|NP_567362.1|subtilase家族蛋白[拟南芥]gi|22136594|gb|AAM91616.1|假定的枯草杆菌蛋白酶丝氨酸蛋白酶[拟南芥]
长度=778
记分=4003,P=0.000000e+00
同一性=98%,阳性值=98%
根据拟南芥信息源网址下列序列是At4g10550的其他冗余入口。然而,他们与以上序列表有几个核苷酸的不同。这很可能是测序错误的结果或是对活性具有很少或者没有影响的单核苷酸多态性的结果。
>gi|7435680|pir||T04190枯草杆菌蛋白酶-类蛋白酶同源物T4F9.10-拟南芥
>gi|4539433|emb|CAB40021.1|枯草杆菌蛋白酶-类蛋白酶-类蛋白[拟南芥]
>gi|7267752|emb|CAB78178.1|枯草杆菌蛋白酶-类蛋白酶-类蛋白[拟南芥]
长度=803
记分=3243(1146.7比特),期望值=0.,总和P(2)=0.
同一性=619/637(97%),阳性值=622/637(97%)
下列序列是At4g10550的另一冗余入口,因为其与拟南芥基因组中的At4g10550位点进行比对。然而,他们与以上序列有几个核苷酸的不同。这很可能是测序错误的结果或是对活性具有很少或者没有影响的单核苷酸多态性的结果。
gi|4115920|gb|AAD03431.1|类似于丝氨酸蛋白酶的subtilase家族(Pfam:PF00082,记分;45.8,E=1.1e-11,n=2)[拟南芥]
长度=751
记分=1902,P=0.000000e+00
同一性=95%,阳性值=95%
2.来自拟南芥的At4g10540
gi|18413351|ref|NP_567361.1|subtilase家族蛋白[拟南芥]
gi|7435678|pir||T04189枯草杆菌蛋白酶-类蛋白酶同源物F7L13.120-拟南芥
gi|4539414|emb|CAB40047.1|假定的枯草杆菌蛋白酶-类蛋白酶[拟南芥]
gi|7267751|emb|CAB78177.1|假定的枯草杆菌蛋白酶-类蛋白酶[拟南芥]
长度=775
记分=3342,P=0.000000e+00
同一性=81%,阳性值=88%
下列序列是At4g10540的另一冗余入口,因为其与拟南芥基因组中的At4g10550位点进行比对。然而,他们与以上序列有几个核苷酸的不同。这很可能是测序错误的结果或是对活性具有很少或者没有影响的单核苷酸多态性的结果。
>gi|4115919|gb|AAD03430.1|类似于丝氨酸蛋白酶的subtilase家族(Pfam:PF00082,记分;47.5,E=3.8e-12,n=2)[拟南芥]
长度=685
记分=1535(545.4比特),期望值=9.7e-295,总和P(3)=9.7e-295
同一性=291/380(76%),阳性值=324/380(85%)
3.来自拟南芥的At4g10510
gi|18413345|ref|NP_567358.1|subtilase家族蛋白[拟南芥]
gi|7435679|pir||T04186枯草杆菌蛋白酶-类蛋白酶同源物F7L13.90-拟南芥
gi|4539411|emb|CAB40044.1|假定的枯草杆菌蛋白酶-类蛋白酶[拟南芥]
gi|7267748|emb|CAB78174.1|假定的枯草杆菌蛋白酶-类蛋白酶[拟南芥]
长度=765
记分=3244,P=0.000000e+00
同一性=82%,阳性值=89%
下列序列是At4g10510的另一冗余入口。然而,他们与以上序列有几个核苷酸的不同。这很可能是测序错误的结果或是对活性具有很少或者没有影响的单核苷酸多态性的结果。
gi|4115927|gb|AAD03438.1|类似于丝氨酸蛋白酶的subtilase家族(Pfam:PF00082,记分=49.7,E=9.2e-13,n=3)[拟南芥]
长度=774
记分=3219,P=0.000000e+00
同一性=81%,阳性值=88%
4.来自拟南芥的At1g32950
gi|30692782|ref|NP_564413.2|subtilase家族蛋白[拟南芥]
长度=773
记分=3123,P=0.000000e+00
同一性=76%,阳性值=85%
下列序列是At1g32950的另一冗余入口。然而,他们与以上序列有几个核苷酸的不同。这很可能是测序错误的结果或是对活性具有很少或者没有影响的单核苷酸多态性的结果。
>gi|25289836|pir||B86454假设的蛋白F9L11.12-拟南芥
>gi|6910572|gb|AAF31277.1|4个相邻的假定的subtilase家族的第二个>[拟南芥]
长度=763
记分=3050(1078.7比特),期望值=2.7e-317,P=2.7e-317
同一性=588/779(75%),阳性值=659/779(84%)
5.来自拟南芥的At1g32940
gi|18398655|ref|NP_564412.1|subtilase家族蛋白[拟南芥]
gi|25289835|pir||A86454假设的蛋白F9L11.11-拟南芥
gi|6910573|gb|AAF31278.1|4个相邻假定的subtilase家族的第一个[拟南芥]
gi|18377745|gb|AAL67022.1|假定的枯草杆菌蛋白酶丝氨酸蛋白酶[拟南芥]
gi|29824343|gb|AAP04132.1|假定的枯草杆菌蛋白酶丝氨酸蛋白酶[拟南芥]
长度=774
记分=3100,P=0.000000e+00
同一性=75%,阳性值=85%
6.来自拟南芥的At1g32960
gi|30692785|ref|NP_564414.2|subtilase家族蛋白[拟南芥]
gi|25289832|pir||C86454假设的蛋白F9L11.13-拟南芥
gi|6910571|gb|AAF31276.1|4个相邻假定的subtilase家族的第三个[拟南芥]
gi|20466548|gb|AAM20591.1|subtilase,假定的[拟南芥]
gi|34098815|gb|AAQ56790.1|Atlg32960[拟南芥]
长度=777
记分=3053,P=2.700000e-317
同一性=74%,阳性值=84%
7.来自拟南芥的At1g32970
gi|15223351|ref|NP_174573.1|subtilase家族蛋白[拟南芥]
gi|25289833|pir||D86454 F9L11.14 F9L11.14-拟南芥
gi|6910574|gb|AAF31279.1|4个相邻假定的subtilase家族的第四个[拟南芥]
长度=734
记分=2021,P=3.600000e-237
同一性=67%,阳性值=80%
8.来自拟南芥的At4g21650
gi|30685518|ref|NP_567633.2|subtilase家族蛋白[拟南芥]
gi|27311663|gb|AAO00797.1|枯草杆菌蛋白酶蛋白酶-类[拟南芥]
长度=766
记分=2187,P=9.600000e-226
同一性=56%,阳性值=71%
9.At4g21640 from拟南芥
gi|42567017|ref|NP_193895.2|subtilase家族蛋白[拟南芥]
长度=733
记分=1094,P=7.100000e-219
同一性=57%,阳性值=72%
10.来自拟南芥的At1g66220
gi|18408462|ref|NP_564869.1|subtilase家族蛋白[拟南芥]
gi|25289828|pir||B96687枯草杆菌蛋白酶-类蛋白,10849-13974[输出的]-拟南芥
gi|12323571|gb|AAG51764.1|枯草杆菌蛋白酶-类蛋白;
10849-13974[拟南芥]
长度=753
记分=1080,P=2.400000e-218
同一性=52%,阳性值=68%
表3
直系同源基因名称 品种 GI#   与HIO1004的%ID 记分(BLAST,Clustal,等)
来自马铃薯的一个EST重叠群 Solanumtubersom gi|10446020gi|10446024gi|13612262gi|13613712gi|14264360gi|14267180gi|15185273共有序列:SEQ IDNO:3 长度:2156同一性:0.379阳性值:0.543框:1 TBLASTN记分:1055概率:1.700000e-107
来自甜菜的一个EST重叠群 Beta vulgaris gi|10711340 长度:618同一性:0.478阳性值:0.652框:3 TBLASTN记分:510概率:3.000000e-49
直系同源基因名称 品种   GI#   与HIO1004的%ID 记分(BLAST,Clustal,等)
来自大豆的一个EST重叠群 Glycine max gi|14150445gi|13478114gi|26057369共有序列:SEQ ID NO:6 长度:2401同一性:0.376阳性值:0.562框:1 TBLASTN记分:872概率:2.100000e-137
来自小麦的一个EST重叠群 Triticumaestivum   gi|14313023gi|14313024gi|14313383gi|14313807gi|14314440gi|14314549gi|14316759gi|14316760gi|14317648gi|15315409gi|15772265gi|19956142gi|20048856gi|20086046gi|25157476gi|25218457gi|25238573gi|32559310共有序列:SEQ ID NO:9 长度:2564同一性:0.481阳性值:0.652框:2 TBLASTN记分:892概率:1.100000e-151
直系同源基因名称 品种   GI#   与HIO1004的%ID 记分(BLAST,Clustal,等)
来自番茄的一个EST重叠群 Lycopersiconesculentum   gi|6536422gi|6536423gi|6536424gi|6536425gi|1771159gi|1771159gi|1771160共有序列:SEQ ID NO:4 长度:2689同一性:0.380阳性值:0.554框:2 TBLASTN记分:1231概率:5.100000e-126
来自水稻的一个EST重叠群 Oryza sativa gi|9453866   长度:3026同一性:0.348阳性值:0.496框:1 TBLASTN记分:912概率:1.700000e-92
来自玉米的一个EST重叠群 Zea mays   gi|6827742gi|21208160gi|12045659gi|18164698gi|29130115共有序列:SEQ ID NO:7 长度:1444同一性:0.404阳性值:0.574框:1 TBLASTN记分:544概率:5.000000e-53
直系同源基因名称   品种   GI#   与HIO1004的%ID 记分(BLAST,Clustal,等)
来自棉花的一个EST重叠群 Gossypiumhirsutum   gi|5049444gi|5049221gi|5048791gi|5046192gi|5046014gi|5045524共有序列:SEQ ID NO:8 长度:1279同一性:0.360阳性值:0.525框:1 TBLASTN记分:592概率:8.100000e-59
来自白杨的一个EST重叠群 Populustremula   gi|3852817gi|3854402gi|18012433gi|23988298gi|23991758gi|24099801gi|27419447gi|27419568gi|27419599gi|27419823gi|27420015gi|27420028gi|27420265gi|33183186gi|33183327gi|33184237gi|33185612共有序列:SEQ ID NO:5 长度:2451同一性:0.395阳性值:0.554框:3 TBLASTN记分:766概率:2.700000e-125
最接近的植物同系物:
At4g10550 拟南芥 gi|18413353gi|22136594 同一性=98%,阳性值=98%框:N     BLASTP记分:4003P=0.000000e+00
At4g10540 拟南芥 gi|18413351gi|7435678gi|4539414gi|7267751 同一性=81%,阳性值=88%框:N     BLASTP记分:3342P=0.000000e+00
At4g10510 拟南芥   gi|18413345gi|7435679gi|4539411gi|7267748 同一性=82%,阳性值=89%框:N     BLASTP记分:3244P=0.000000e+00
At1g32950 拟南芥 gi|30692782 同一性=76%,阳性值=85%框:N     BLASTP记分:3123P=0.000000e+00
At1g32940 拟南芥   gi|18398655gi|25289835gi|6910573gi|18377745gi|29824343 同一性=75%,阳性值=85%框:N BLASTP记分:3100P=0.000000e+00
At1g32960 拟南芥   gi|30692785gi|25289832gi|6910571gi|20466548gi|34098815 同一性=74%,阳性值=84%框:N BLASTP记分:3053P=2.700000e-317
At1g32970 拟南芥   gi|15223351gi|25289833gi|6910574 同一性=67%,阳性值=80%框:N BLASTP记分:2021P=3.600000e-237
At4g21650 拟南芥 gi|30685518gi|27311663 同一性=56%,阳性值=71%框:N     BLASTP记分:2187P=9.600000e-226
At4g21640 拟南芥 gi|42567017 同一性=57%,阳性值=72%框:N     BLASTP记分:1094P=7.100000e-219
At1g66220 拟南芥 gi|18408462gi|25289828gi|12323571 同一性=52%,阳性值=68%框:N     BLASTP记分:1080P=2.400000e-218
At4g10550具有N-末端信号肽(由SignalP确定的Max切割位点概率:0.232在pos.25和26之间)并缺乏跨膜结构域(由TMHMM预测-在N末端氨基酸残基7-26的预测的跨膜很可能是信号肽)。这个结论得到了Beers,等,参考,Phytochemistry 2004,65:43-58的支持。Pfam分析表明At4g10550是枯草杆菌蛋白酶丝氨酸蛋白酶家族(PF00082,COG1404)的成员。
模型         功能域     seq-f*  seq-t   hmm-f   hmm-t   记分   E-值
--------  ------- -----   ----- -----   -----      ----- -------
PF05922          1/1      33    113..   1       102     []    110.8   5.1e-30
PF00082          1/1      127   603..   1       349     []    63.4    9.9e-16
COG1404          1/1      135   682..   1       380     []    54.5    4.6e-13
PF02225          1/1         380        483..     1       111   []    82.3   2e-21
*Seq-f是指“序列-来自”,seq-t是指“序列-进入。”seq-t数后的两个阶段显示匹配区域在序列内并且没有延伸到每一末端。两个括号显示匹配跨越图谱HMM的全长。hmm-f和hmm-t是指图谱HMM的匹配部分的开始和末端坐标。
At4g10550也含有枯草杆菌蛋白酶N-末端Region(PF05922)以及PA (蛋白酶相关PF02225)功能域。枯草杆菌蛋白酶N-末端区域(PF05922,前肽,也称为抑制剂或激活肽)起到抑制其上所存在的蛋白酶活性的功能。由与第二肽酶相互作用或自动催化裂解激活无活性的肽酶(前酶或者酶原)除去N-末端抑制剂功能域。前肽剪短变成庇护底物结合位点的酶部分,由此促进酶的抑制。几个这种前肽共用类似的拓扑结构,尽管通常只具有较低的序列同一性。前肽区域具有开放-夹心反平行-α/反平行-β折叠,2个α-螺旋和4个β-链,具有(β/α/β)x2拓扑结构。这group of序列含有肽酶N末端的前肽功能域,属于MEROPS家族S8A,枯草杆菌蛋白酶(Rawlings ND,等,MEROPS:thepeptidase database.,Nucleic Acids Res.2004.32 Databaseissue:D160-164)。
发现PA(PF02225;相关蛋白酶)功能域为不同蛋白酶中的插入功能域,并且被认为是介导蛋白酶和底物之间的蛋白质相互作用(Mahon,等,Protein Sci.2000.10:1930 1934)。Subtilases(PF00082)are丝氨酸蛋白酶家族。它们独立并趋同进化出Asp/Ser/His催化三联体,与在胰蛋白酶丝氨酸蛋白酶中所发现的一样。肽酶被分成宗族和家族。宗族是有证据证明具有共同祖先的家族的组。家族由它们的催化型进行分组,表示催化型的第一字符S,丝氨酸;T,苏氨酸;C,半胱氨酸;A,天冬氨酸;M金属的和U,未知的。含有超过一个型的家族的宗族被描述为P型。丝氨酸,苏氨酸和半胱氨酸蛋白酶利用氨基酸的催化部分作为亲核试剂并形成酰基中间体-这些肽酶还可以很容易作为转移酶。就天冬氨酸和金属肽酶来说,亲核试剂是活化水分子。
催化活性中利用丝氨酸的蛋白水解酶是普遍存在的,发现在病毒,细菌和真核生物中(Rawlings N.D.,Barrett Families of Serine Peptidases.Meth.Enzymol.244:19-61(1994))。它们包括各种各样的肽酶活性,包括外肽酶,内肽酶,寡肽酶和ω-肽酶活性。已经鉴定出超过20个丝氨酸蛋白酶家族(表示为S1-S27),基于结构相似性及其它功能性的证据被分成6个宗族(SA,SB,SC,SE,SF和SG)(Rawlings N.D.,等,Meth.Enzymol.244:19-61(1994)。4个宗族的结构已知(SA,SB,SC和SE)他们似乎完全无关,表明至少4个丝氨酸肽酶的演化起源并且可能更多的演化起源(Id.)。
尽管它们具有不同的演化起源,几个肽酶的反应机理相似。糜蛋白酶,枯草杆菌蛋白酶和羧肽酶C宗族具有共同的丝氨酸,天冬氨酸和组氨酸催化三联体:丝氨酸作为亲核试剂,天冬氨酸作为亲电子试剂,并且组氨酸作为碱(Id.)。尽管蛋白折叠有差异,家族之间催化残基的几何取向是类似的。
催化残基的直线排列通常反映宗族关系。例如糜蛋白酶宗族(SA)中的催化三联体顺序为HDS,但是在枯草杆菌蛋白酶宗族(SB)中顺序为DHS,在羧肽酶宗族(SC)中顺序为SDH[Rawlings N.D.,等,Biochem.J.290:205-218(1993)]。这组丝氨酸蛋白酶属于MEROPS肽酶家族S8(亚族S8A(枯草杆菌蛋白酶)和S8B(kexin))以及S53(sedolisin),二者均为宗族SB的成员。
枯草杆菌蛋白酶家族是迄今为止鉴定的第二大丝氨酸蛋白酶家族。超过200种subtilises是目前已知的,其中超过170种完全氨基酸序列已知[Siezen R.J.,等,Protein Sci.6:501-523(1997).]。真细菌,古细菌,真核生物以及病毒中广泛存在(Rawlings N.D.,等,Meth.Enzymol.244:19-61(1994))。大多数家庭成员是内肽酶,尽管有外肽酶,三肽酶(Rawlings N.D.,等,Meth.Enzymol.244:1961(1994)以及Rawlings N.D.,等,Biochem.J.290:205-218(1993)。几个枯草杆菌蛋白酶家族的成员的结构已经确定它们利用与糜蛋白酶相同的催化三联体尽管残基顺序不同(糜蛋白酶中为HDS,枯草杆菌蛋白酶中为DHS),但是结构显示没有其他的相似性。一些枯草杆菌蛋白酶是嵌合蛋白,其他的含有与任一其它已知的蛋白没有显示序列相似性的N-以及C-末端延伸。基于序列同源性,已经提议将其再分成6个家族。
已经显示在拟南芥中有54个枯草杆菌蛋白酶类蛋白酶。来自拟南芥的蛋白酶的详细系统发生分析表明At4g10550是S81丝氨酸蛋白酶的成员,S81丝氨酸蛋白酶有39个成员(Eric P Beers,Alan M Jones,Allan W Dickerman.Phytochemistry 2004,65:43-58)。可以表明At4g10550与At4g10540,At4g10510,,At1g32950和At1g32960密切相关。
植物中,已经表明枯草杆菌蛋白酶类丝氨酸蛋白酶可以响应病原体攻击(Jorda L,Vera P.(2000)Plant Physiol 124,1049-1058),侧根发育(Neuteboom LW,等,(1999)DNA Res 1999 6,13-19),和豆类根瘤的发育(Ribeiro,等,(1995)Plant Cell 7,785-794)上调。已经有人提议这些酶不但参予胞外基质的降解,而且参予可能是细胞壁类基质的一部分的蛋白加工或参予另一种具有未知功能蛋白的加工(NeuteboomLW,等(1999)DNA Res 1999 6,13-19)和Ribeiro A,等,(1995)植物细胞7,785-794)。此外,已经表明由于泛素/26S蛋白酶体途径对于植物生物学的不同方面都很重要,蛋白酶可能在植物中发挥多种各种的(Beers,等,Phytochemistry2004,65:43-58)。已经表明一些预测的丝氨酸蛋白酶具有酰基转移酶而不是水解酶(Id.)。
实施例5
通过根癌土壤杆菌介导的转化或微粒轰击获得油菜籽,大豆,玉米,向日葵,棉花,可可,红花,油椰,椰子,亚麻,蓖麻以及花生的转化的外植体。由转化的组织再生植物。然后分析温室生长的植物目的基因的表达水平以及油的水平。
实施例6
本实施例提供了测定转基因包谷植物的油以及蛋白含量,质量差,氨基酸组成,游离氨基酸水平以及微量元素含量的分析方法。
通过低分辩率1H核磁共振(NMR)(Tiwari等,JAOCS,51:104-109(1974);或Rubel,JAOCS,71:1057-1062(1994))确定第一代单个玉米粒以及解剖的胚芽以及胚乳的油水平(基于质量以及组织重量百分比),由此测定单个粒样品的NMR张弛时间,并基于利用从根据加速溶剂萃取之后重量分析测定的具有改变的油水平的玉米粒分析产生的标准曲线的回归分析计算油水平。进行单向方差分析以及Student’s t-检验(JMP,版本4.04,SAS Institute Inc.,Cary,NC,USA)来通过转基因-特异性PCR鉴定转基因以及非-转基因粒之间的显著差别。
通过NIT光谱学确定第二代种子中油水平以及蛋白水平,由此测定由单株植物收获的接种样本品集的NIT谱,并基于利用由玉米粒分析产生的标准曲线的回归分析计算油以及蛋白水平,所述玉米粒具有分别由加速溶剂萃取或元素(%N)分析之后重量分析测定的改变的油或蛋白水平。进行单向方差分析以及Student’s t-检验来鉴定阳性标记以及阴性标记植物的种子之间油(%粒重)以及蛋白(%粒重)的显著差异。
利用下列方法分析来自每一转基因事件的游离氨基酸的水平。将每一转基因植物的种子逐一粉碎成细小的粉末并将约50mg所产生的粉末转入预称重的离心管。记录精确的样品重量并将1.0ml的5%三氯乙酸添加到各样品管中。在室温下通过涡旋混合样品然后在Eppendorf微量离心机(Model 5415C,Brinkmann Instrument,Westbury,NY)上在14,000rpm离心15分钟。取出等分样品的上清液并通过利用AgilentTechnical Publication“Amino Analysis Using the Zorbax Eclipse-AAAColumns and Agilent 1100 HPLC,”2000年3月17,所述的方法通过HPLC(Agilent 1100)进行分析。
通过下列方法对来自谷物的总氨基酸进行定量测定。研磨谷粒并利用6N HCl在100℃回流条件下24小时酸水解约60mg的所产生的粗粉。干燥样品并在0.1N HCl中重构继之以用α-苯二醛(OPA)预柱衍生化作用用于HPLC分析。通过反相Zorbax Eclipse XDB-C18 HPLC柱在Agilent 1100 HPLC(Agilent,Palo Alto,CA)上分离氨基酸。通过荧光检测氨基酸。半胱氨酸,脯氨酸,天冬酰胺,谷氨酰胺以及色氨酸并未包括在该氨基酸筛选中(Henderson等,″Rapid,Accurate,Sensitiveand Reproducible HPLC Analysis of Amino acids,Amino Acid AnalysisUsing Zorbax Eclipse-AAA Columns and the Agilent 1100 HPLC,″Agilent Publication(2000);也参见″Measurement of Acid-Stable AminoAcids,″AACC Method 07-01(American Association of Cereal Chemists,Approved Methods,9th版本(LCCC#_95 75308))。利用(ApprovedMethods of the美国谷物化学家协会-10th版本,AACC编辑,(2000)07-20 Measurement of Tryptophan-Alakline Hydrolysis)所述的碱解方法测定玉米粒中的总色氨酸。
通过本领域已知的方法分析种子中生育酚以及生育三烯酚的水平。简而言之,将10mg的种子组织添加到已经添加了500μl 1%连苯三酚(pyrogallol)(Sigma Chemical Co.,St.Louis,MO)/乙醇的无菌微量离心管中的1g微株上(Biospec Product Inc,Barlesville,OK。微Beadbeater(Biospec)中“快”速振荡混合物3分钟,然后过滤通过0.2μm滤膜进入自动取样器管。利用带有荧光检测以及带通以及狭缝的Zorbax硅石HPLC柱(4.6mm×250mm)经HPLC分析过滤的提取物,荧光检测的激发波长290nm,发射波长336nm。溶剂成分以及工作条件如下所列,溶剂A为己烷,溶剂B为甲基-叔丁基醚。注射体积为20μl,流速为1.5ml/分钟并且运行时间为40℃12分钟。溶剂梯度为90%溶剂A,10%溶剂B10分钟;25%溶剂A,75%溶剂B11分钟;以及90%溶剂A,10%溶剂B12分钟。在1%连苯三酚/乙醇中进行生育酚标准的运行用于比较(α-生育酚,γ-生育酚,β-生育酚,δ-生育酚以及生育酚(母育酚))。利用Chemstation软件(Hewlett Packard)计算α,β,δ以及γ生育酚的标准曲线。在1%连苯三酚/乙醇中运行生育三烯酚标准用于比较(α-生育三烯酚,γ-生育三烯酚,β-生育三烯酚,δ-生育三烯酚。利用Chemstation软件(HewlettPackard)计算α-,β,δ-以及γ-生育三烯酚的标准曲线。
经标准的方案(Craft,Meth.Enzymol.,213:185-205(1992)确定转基因玉米粒内类胡萝卜素的水平。经标准的方案(Threlfall等,Methodsin Enzymology,XVIII,C部分,369-396(1971);以及Ramadan等,Eur.Food Res.Technol.,214(6):521-527(2002))确定plastiquinol以及叶绿醌。
参考文献
Altschul,S.F.et al.,J.Mol.Biol.215:403-410,1990.
Altschul,S.F.et al.,Nucleic Acids Res.25:3389-3402,1997.
Ausubel FM et al.,Current Protocols in Molecular Biology,JohnWiley & Sons,NeW York,N.Y.,1993.
Baldwin D et al.,Cur Opin Plant Biol. 2(2):96-103,1999.
Bateman et al.,1999,Nucleic Acids Res 27:260-262(website atpfam.wustl.edu).
Baulcombe D,Arch Virol SuppI 15:189-201,1999.
Cannon et al.,Plant Molec.Biol.(1990)15:39-47.
Ch′ng et al.,Proc.Natl.Acad.Sci.USA(1989)86:10006-10010
Christensen S et al.,9th International Conference on ArabidopsisResearch.Univ.of Wisconsin-Madison,June 24-28,1998.Abstract 165.
Christou et al.,Proc.Natl.Acad.Sci USA(1989)86:7500-7504.
De Block et al.,Plant Physiol.(1989)91:694-701.
Dieffenbach C and Dveksler G(Eds.)PCR Primer:A LaboratoryManual,Cold Spring Harbor Laboratory Press,NY,1989.
Everett et al.,Bio/Technology(1987)5:1201
Feldmann et al.,Science 243:1351-1354,1989.
Focks N and Benning C,Plant Physiol 118:91-101,1998.
Fridborg I et al.,Plant Cell 11:1019-1032,1999.
Harlow E and Lane D,Antibodies:A Laboratory Manual,ColdSpring Harbor Laboratory Press,1988,New York.
Harlow E and Lane D,Using Antibodies:A Laboratory Manual,ColdSpring Harbor Laboratory Press,1999,New York
Hayashi H et al.,Science 258:1350-1353,1992.
Jako et al.,Plant Physiology 126(2):861-74,2001.
James DW and Dooner HK(1990)Theor Appl Genet 80,241-245.
Jones JD et al.,Transgenic Res 1:285-297 1992.
Kardailsky I et al.,Science 286:1962-1965,1999.
Katavic V et al.,Plant Physiology 108(1):399-409,1995.
Kline et al.,Nature(1987)327:70.
Kunkel TA et al.,Methods Enzymol.204:125-39,1991.
Lemieux B.,et al.,1990,Theor Appl Genet 80,234-240.
Nakamura Y et al.,1999,Nucleic Acids Res 27:292.
Napoli,et al.,Plant Cell 2:279-289,1990.
Okuley et al.,Plant Cell 6(1):147-158,1994.
Sambrook et al.,Molecular Cloning:A Laboratory Manual(SecondEdition),Cold Spring Harbor Press,Plainview,N.Y.,1989.
Schaffer R,et al.,Cell 93:1219-1229,1998.
Sheehy et al.,Proc.Natl.Acad.Sci.USA(1988)85:8805-8809.
Smith,et al.,Nature 334:724-726,1988.
Smith et al.,Mol.Gen.Genetics(1990)224:477-481.
Thompson JD et al.,Nucleic Acids Res 22:4673-4680,1994.
van der Krol et al.,Biotechniques(1988)6:958-976.
van der Krol et al.,The Plant Cell(1990)2:291-299.
Van Haaren MJJ et al.,Plant Mol Bio 21:625-640,1993.
Verdaguer B et al.,Plant Mol Biol 37:1055-1067,1998.
Waterhouse,et al.,Proc.Natl.Acad.Sci.USA 95:13959-13964,1998.
Weigel D,et al.,Plant Physiology,122:1003-1013,2000.
Wilson K et al.,Plant Cell 8:659-671,1996.
Yadav NS et al.,(1993)Plant Physiol 103,467-476.
Beers,et al.,Phytochemistry 2004,65:43-58.
Rawlings ND,et al.,Nucleic Acids Res.2004.32 Databaseissue:D160-164
Mahon P,Bateman A.Protein Sci.2000.10:1930-1934.
Rawlings N.D.,et al,Meth.Enzymol.244:19-61(1994)
Rawlings N.D.,et al,Biochem.J.290:205-218(1993)
Siezen R.J.,et al.,Protein Sci.6:501-523(1997).
Jorda L,et al.,Plant Physiol 124,1049-1058(2000).
Neuteboom LW,et al.,DNA Res 1999 6,13-19.
Ribeiro A,et al.,Plant Cell 7,785-794(1995).
序列表
<110>农业经济有限责任公司(Agrinomics,LLC)
<120>生产改变含油量的植物
     (GENERATION OF PLANTS WITH ALTERED OIL CONTENT)
<130>SCT065699-66
<150>60/575,560
<151>2004-05-28
<160>9
<170>PatentIn version 3.3
<210>1
<211>2368
<212>DNA
<213>Arabidopsis thaliana
<400>1
atgatgaatt acagaacatc catatatgtg gtactaagtt tggtaatatt tctcaatgtg      60
cagagaagtt ttgtggcaga atcaagtgct aagagaaagg ttcatatagt gtatttgggt     120
gagaagcaac atgatgatcc tgagtttgtt acggaatctc atcatcggat gttatggtca     180
cttcttggaa gtaaagagga tgccaatgat tcaatggtgt atagttaccg acatggcttc     240
tcaggttttg cggctaaact taccgagtcc caagccaaga agatagctga tttacctgat     300
gttgttcatg ttataccgga tagtttctat aagctggcaa caactcgaac ttgggattat     360
ctaggccttt ctgctgccaa tccaaagagt cttctacatg aaactaatat gggtgaacaa     420
attatcatcg gtgttataga cacaggagta tggcctgaat ctgaagtatt taatgacagt     480
gggtttgggc ctgtgccaag ccactggaaa ggaggttgtg aaacaggaga gaatttcaac     540
tcctctaact gcaataaaaa gctcatagga gccaagtatt tcatcaatgg ttttctagcg     600
gagaacgaaa gcttcaactc cacaaattca cttgatttca tttcccctag agaccttgat     660
ggtcatggca cacatgtttc caccattgcg ggtggttctt tcgtgcccaa tataagctac     720
aagggcttag ctggagggac tgtcagaggc ggggcacctc gtgctcatat agcaatgtac     780
aaggcttgtt ggtatctgga tgatgatgac acaacgactt gttcatctgc tgacatcttg     840
aaagctatgg acgaggctat gcatgatggt gttgatgttc tgtcaatctc tttaggctcc     900
agcgttcctc tatatggtga aactgatatt cgcgatggga taactactgg agcgttccat     960
gcagtcttaa agggtatcac tgttgtttgt tccggtggta actctggccc agattctctt    1020
accgtgacaa acacagctcc ttggatcatc acagtggctg caactactct ggaccggtcc    1080
tttgccacac ctcttacact tgggaataat aaagtgatat tgggtcaagc aatgtacaca    1140
ggtccaggac ttggcttcac tagcttggtt tatcctgaga atccagggaa tagcaacgaa    1200
agtttttctg gtacttgtga ggagctttta ttcaattcta atcgtacaat ggaggggaaa    1260
gttgtgttgt gtttcacaac atcaccttac ggcggtgctg tattaagcgc tgcgcgttat    1320
gtgaagagag caggtggtct tggcgtaatc atcgcaagac acccgggtta cgctatccag    1380
ccatgtctag atgatttccc ttgtgttgct gttgactggg agcttgggac tgatatactt    1440
ctctacacac ggtccagtgg atcgcctgtg gtgaagatac aaccttctaa aacacttgta    1500
ggacaaccag ttggtacaaa agtggcaacg ttctcatcaa gagggcctaa ttcgatcgcc    1560
cctgcgattc tcaaaccgga tatagcagca ccgggagtga gcatattggc agctacaacc    1620
aacaccactt tcagcgacca agggttcatt atgttgtctg gaacatcaat ggcagctcct    1680
gcaatttcag gagttgctgc acttctcaaa gctctgcacc gtgattggtc tcctgctgcc    1740
attagatcag ccattgtcac tacagcttgg aaaacagatc catttggaga gcagatattt    1800
gctgaagggt cacctccgaa gctagctgat ccgttcgact atggtggagg ccttgtaaat    1860
ccagagaaat ctgcaaatcc aggtcttgta tatgacatgg gcctcgaaga ctatgttctc    1920
tacatgtgct ctgttggtta caacgagaca tcaatctctc agcttatcgg taaaacaaca    1980
gtctgttcaa atccgaaacc atctgttctt gatttcaact tgccttccat cacaatccca    2040
aacctcaaag acgaagtgac tatcacaaga actgtcacta acgttggacc tctcaactca    2100
gtctatagag taacggtcga gccacctttg ggttttcaag tgactgtgac accggagacg    2160
ctagtattca actctacgac caaaaaagtc tattttaaag ttaaagtctc aaccacacac    2220
aaaaccaata caggttacta ctttggaagc ttgacatgga gtgactctct gcacaatgtc    2280
accattcctt tgtctgtgag gacgcaaatc ctgcagaact attatgatga aaattaaact    2340
tataaaaatg actaaccatt tgtgtgct                                       2368
<210>2
<211>778
<212>PRT
<213>Arabidopsis thaliana
<400>2
Met Met Asn Tyr Arg Thr Ser Ile Tyr Val Val Leu Ser Leu Val Ile
1               5                   10                  15
Phe Leu Asn Val Gln Arg Ser Phe Val Ala Glu Ser Ser Ala Lys Arg
            20                  25                  30
Lys Val His Ile Val Tyr Leu Gly Glu Lys Gln His Asp Asp Pro Glu
        35                  40                  45
Phe Val Thr Glu Ser His His Arg Met Leu Trp Ser Leu Leu Gly Ser
    50                  55                  60
Lys Glu Asp Ala Asn Asp Ser Met Val Tyr Ser Tyr Arg His Gly Phe
65                  70                  75                  80
Ser Gly Phe Ala Ala Lys Leu Thr Glu Ser Gln Ala Lys Lys Ile Ala
                85                  90                  95
Asp Leu Pro Asp Val Val His Val Ile Pro Asp Ser Phe Tyr Lys Leu
            100                 105                 110
Ala Thr Thr Arg Thr Trp Asp Tyr Leu Gly Leu Ser Ala Ala Asn Pro
        115                 120                 125
Lys Ser Leu Leu His Glu Thr Asn Met Gly Glu Gln Ile Ile Ile Gly
    130                 135                 140
Val Ile Asp Thr Gly Val Trp Pro Glu Ser Glu Val Phe Asn Asp Ser
145                 150                 155                 160
Gly Phe Gly Pro Val Pro Ser His Trp Lys Gly Gly Cys Glu Thr Gly
                165                 170                 175
Glu Asn Phe Asn Ser Ser Asn Cys Asn Lys Lys Leu Ile Gly Ala Lys
            180                 185                 190
Tyr Phe Ile Asn Gly Phe Leu Ala Glu Asn Glu Ser Phe Asn Ser Thr
        195                 200                 205
Asn Ser Leu Asp Phe Ile Ser Pro Arg Asp Leu Asp Gly His Gly Thr
    210                 215                 220
His Val Ser Thr Ile Ala Gly Gly Ser Phe Val Pro Asn Ile Ser Tyr
225                 230                 235                 240
Lys Gly Leu Ala Gly Gly Thr Val Arg Gly Gly Ala Pro Arg Ala His
                245                 250                 255
Ile Ala Met Tyr Lys Ala Cys Trp Tyr Leu Asp Asp Asp Asp Thr Thr
            260                 265                 270
Thr Cys Ser Ser Ala Asp Ile Leu Lys Ala Met Asp Glu Ala Met His
        275                 280                 285
Asp Gly Val Asp Val Leu Ser Ile Ser Leu Gly Ser Ser Val Pro Leu
    290                 295                 300
Tyr Gly Glu Thr Asp Ile Arg Asp Gly Ile Thr Thr Gly Ala Phe His
305                 310                 315                 320
Ala Val Leu Lys Gly Ile Thr Val Val Cys Ser Gly Gly Asn Ser Gly
                325                 330                 335
Pro Asp Ser Leu Thr Val Thr Asn Thr Ala Pro Trp Ile Ile Thr Val
            340                 345                 350
Ala Ala Thr Thr Leu Asp Arg Ser Phe Ala Thr Pro Leu Thr Leu Gly
        355                 360                 365
Asn Asn Lys Val Ile Leu Gly Gln Ala Met Tyr Thr Gly Pro Gly Leu
    370                 375                 380
Gly Phe Thr Ser Leu Val Tyr Pro Glu Asn Pro Gly Asn Ser Asn Glu
385                 390                 395                 400
Ser Phe Ser Gly Thr Cys Glu Glu Leu Leu Phe Asn Ser Asn Arg Thr
                405                 4l0                 415
Met Glu Gly Lys Val Val Leu Cys Phe Thr Thr Ser Pro Tyr Gly Gly
            420                 425                 430
Ala Val Leu Ser Ala Ala Arg Tyr Val Lys Arg Ala Gly Gly Leu Gly
        435                 440                 445
Val Ile Ile Ala Arg His Pro Gly Tyr Ala Ile Gln Pro Cys Leu Asp
    450                 455                 460
Asp Phe Pro Cys Val Ala Val Asp Trp Glu Leu Gly Thr Asp Ile Leu
465                 470                 475                 480
Leu Tyr Thr Arg Ser Ser Gly Ser Pro Val Val Lys Ile Gln Pro Ser
                485                 490                 495
Lys Thr Leu Val Gly Gln Pro Val Gly Thr Lys Val Ala Thr Phe Ser
            500                 505                 510
Ser Arg Gly Pro Asn Ser Ile Ala Pro Ala Ile Leu Lys Pro Asp Ile
        515                 520                 525
Ala Ala Pro Gly Val Ser Ile Leu Ala Ala Thr Thr Asn Thr Thr Phe
    530                 535                 540
Ser Asp Gln Gly Phe Ile Met Leu Ser Gly Thr Ser Met Ala Ala Pro
545                 550                 555                 560
Ala Ile Ser Gly Val Ala Ala Leu Leu Lys Ala Leu His Arg Asp Trp
                565                 570                 575
Ser Pro Ala Ala Ile Arg Ser Ala Ile Val Thr Thr Ala Trp Lys Thr
            580                 585                 590
Asp Pro Phe Gly Glu Gln Ile Phe Ala Glu Gly Ser Pro Pro Lys Leu
        595                 600                 605
Ala Asp Pro Phe Asp Tyr Gly Gly Gly Leu Val Asn Pro Glu Lys Ser
    610                 615                 620
Ala Asn Pro Gly Leu Val Tyr Asp Met Gly Leu Glu Asp Tyr Val Leu
625                 630                 635                 640
Tyr Met Cys Ser Val Gly Tyr Asn Glu Thr Ser Ile Ser Gln Leu Ile
                645                 650                 655
Gly Lys Thr Thr Val Cys Ser Asn Pro Lys Pro Ser Val Leu Asp Phe
            660                 665                 670
Asn Leu Pro Ser Ile Thr Ile Pro Asn Leu Lys Asp Glu Val Thr Ile
        675                 680                 685
Thr Arg Thr Val Thr Asn Val Gly Pro Leu Asn Ser Val Tyr Arg Val
    690                 695                 700
Thr Val Glu Pro Pro Leu Gly Phe Gln Val Thr Val Thr Pro Glu Thr
705                 710                 715                 720
Leu Val Phe Asn Ser Thr Thr Lys Lys Val Tyr Phe Lys Val Lys Val
                725                 730                 735
Ser Thr Thr His Lys Thr Asn Thr Gly Tyr Tyr Phe Gly Ser Leu Thr
            740                 745                 750
Trp Ser Asp Ser Leu His Asn Val Thr Ile Pro Leu Ser Val Arg Thr
        755                 760                 765
Gln Ile Leu Gln Asn Tyr Tyr Asp Glu Asn
    770                 775
<210>3
<21l>2156
<212>DNA
<213>Artificial sequence
<220>
<223>synthetic construct
<400>3
gaaaggactg aaaatgagcc aacaactatc tataacgtgg cacaataaag cccatcaaat      60
atctctctta tcttcccaga aactagtgtc tctttagcga tggcactttc ttcttcctct     120
ttctcccccc tagtcttcct ctttctcagc tcattggcaa tttcagtcaa atcggatggt     180
cctaaaactt tcatagtcca cgtgtccata tcccacaagc ctcatatttt cactactcac     240
catcattggt actcctctat tctccgatca gtctctcaac actctcccaa tatcttgtat     300
tcttatgatc gtgctgcccg tggcttctct gcccgcctta catccgggca ggctgaccag     360
ctcagccgcg ttcccggtgt ggtctccgtc atccctgatc gcgtacgcca acttcatacc     420
actcacacac ctaccttctt aggccttgaa gactcatttg ggatttggcc caattctgat     480
tatgctgata atgttattgg tggggtcctt gacacgggta tttggccaga aaggccgagc     540
ttttccgaca aggggctttc gccggtgcct tcaggttgga aagggaaatg cgagagtggc     600
ccggactttc ctgcaacttc atgtaatcgt aaaatcatag gtgctagatt gttttacaaa     660
ggatatgaag ctgatcgtgg aagtccaatg gatgaatcta aagaatccaa atcgccaaga     720
gatactgaag gccatggaac tcacactgct tcaactgcag ctggatctgt tgtagccaat     780
gcgagctttt accaatatgc aaaaggtgaa gctagaggta tggccgtaaa agctagaata     840
gcagcctata agatctgctg gaaaacaggg tgttttgatt ctgatatact ggctgcaatg     900
gatcaagctg ttgcggacgg ggttcacgtg atttctctct ctgttggcgc agatggttat     960
tctcctgagt atgacgttga ctccattgct attggagctt ttggtgccac agaacatggc    1020
gttgtcgtct cttgctctgc tggaaattcc ggtcctggtg cttctacggc ggtcaacgtt    1080
gccccatgga ttctcactgt tgctgcttca accatagatc gggagtttcc agcggatgtt    1140
atcttaggag acggtagaat atttggtggt gtatccttat ataccggaga tccccttggc    1200
aatgcaaaac tacagcttgt ttattccgcc gactgtggca gccaactctg ttatccagga    1260
aagctggacc cttcaaaagt tgctgggaaa attgtattat gtgatcgagg aggcaatgcc    1320
agagtagaga aaggaagtgc tgtgaaacaa gcgggcggtg caggtatggt cctagcaaac    1380
ttagctgact ctggagaaga actcgttgcc gatgcacatc tcctcccagc gaccatggtg    1440
ggtcaaaaag ctggcaataa aatcagggat tacatcaaat ctgttccatc accaacagcg    1500
acgatcactt tcaagggaac tgttatagga aaatcgccat ctgctccacg cattgctgcg    1560
ttctcaggcc gaggacccaa ttatgtgacc cctgagatcc ttaaaccgga cgttactgca    1620
ccgggagtca acatattagc tggatggacc ggagctgttg gtccaacaga cttggaaatc    1680
gacaaaagaa gagtggaatt caacattata tccgggacat ccatgtcttg tcctcatgta    1740
agtggattag ctgcgttact cagaaaggct tatcctaaat ggaccacagc agccataaaa    1800
tcagccctca tgacaacagc ttacaacgtt gacaactccg gcaaaacaat cacggatctt    1860
gccacaggtc aagaatcgag tcctttcgtt cgtgggtcgg gacatgtgga tccaaacaga    1920
gcactgcatc cgggtctggt ttacgacatt gagtcgagtg attacgtagg tttcctatgc    1980
gccattggtt atggcccctc cagaatctca ccattcacga aagatacttc ttcagtgaat    2040
tgcagtgaac atagtttggc tagtccaggg gatttgaatt atccatcatt ctcagttgtt    2100
ttcatgagtg agaatgttgt gaaatacaag cgtgtggtta aaaatgttgg gaggaa        2156
<210>4
<211>2689
<212>DNA
<213>Artificial sequence
<220>
<223>synthetic construct
<400>4
ctagcattac atatcatagt cagttagagc ctatcactca aaactccagc ccatctccac      60
cacaggagga aaaaaaaaaa agcttttctt ttcagtagag atttaacttt caccttcgac     120
actaagaact cacataaaga tggaaagact caggctcatg tttcttttaa tactaatggt     180
agtgttgttt catgtgtttg ttgatgcaag acagaaccag aagaagactt atataattca     240
catggacaag ttcaacatgc ctgctgattt tgatgatcat actcagtggt atgactcatc     300
attgaagtca gtatccaaga gcgccaacat gctttacacc tacaacagtg tcatccatgg     360
ctactcaaca cagctaacag ctgatgaagc caaagcactt gcacagcaac cgggaattct     420
cttggtccac gaggaagtga tatacgagct tcacaccact cgatccccta cgtttctggg     480
acttgaagga cgtgaaagta gatcattctt tcctcagact gaagcaagga gtgaggtcat     540
tattggtgtg ctggacacag gtgtttggcc tgaatcaaaa agttttgatg acactggact     600
aggtcaagtc cctgcgagct ggaagggtaa gtgtcaaact ggcaagaact tcgacgcatc     660
aagctgtaat cggaaactta ttggtgcgag gtttttctca caaggttatg aagcagcttt     720
tggggcaatc gatgagacca ttgaatccaa gtcaccaagg gacgatgaag gccatggcac     780
acacactgca actacagcag ctggctcggt tgtaaccgga gctagcctct tgggttatgc     840
aactggtaca gcacgtggga tggcttcaca cgcaagggtg gcagcgtaca aggtatgttg     900
gaccggagga tgttttagca gcgacatact ggcagggatg gaccaggctg tcatagatgg     960
tgtaaatgtg ctctcactgt cccttggtgg cacaatttct gattatcata gggacatagt    1020
tgcaatcgga gcattttctg cagcatctca agggatcttt gtctcatgct cagcggggaa    1080
tggtggtcca agctctggga cgctatccaa cgttgcacca tggataacta ctgtaggtgc    1140
tggaaccatg gaccgtgaat ttccagcata cattggcatt ggaaatggga aaaaactcaa    1200
tggagtatca ctttacagtg gaaaggcatt gcctagttct gtgatgccac tggtgtatgc    1260
tggaaatgtc agccaatcat ctaatggaaa tttatgcacc agtggtagtc taattccaga    1320
aaaagttgct ggaaaaattg tcgtctgtga ccgggggatg aatgcaaggg cacaaaaggg    1380
tttggttgtg aaggatgctg gtggaatagg gatgattctg gcaaacacag acacttacgg    1440
agatgagttg gttgctgatg cacacctcat acctacagct gcagttggtc aaactgcggg    1500
caacttgatc aagcagtaca tagcttctaa cagcaatcca actgccacaa ttgcatttgg    1560
aggaaccaag ttgggtgttc aaccatcgcc agttgttgca gcttttagtt ccagagggcc    1620
aaacccaatc acaccagatg tactcaaacc tgatttgata gcaccaggtg tcaatattct    1680
tgctggctgg acagggaaag ttggaccaac tggcttgcaa gaagacacca ggaatgtagg    1740
cttcaacatc atctctggaa cttccatgtc atgtccccat gtaagtgggc tagcagcact    1800
actcaaagct gcccatccag aatggagtcc agcagctata aggtcagcac tgatgactac    1860
aagttatagc acatacaaaa acggaaaaac aatcgaggat gttgcaacag gaatgtcatc    1920
tacaccattt gattatggtg ctggacatgt gaatccaaca gcagctgtca gtcctggttt    1980
agtgtatgat ctaacagttg atgactatat aaactttcta tgtgccttgg actacagccc    2040
gagtatgatc aaggtcattg caaaaagaga catctcctgt gacgaaaata aggagtatag    2100
agttgctgat cttaattacc catctttttc cattcctatg gaaacggcct ggggtgaaca    2160
tgcagatagt agtaccccca ccgtgaccag atacacaagg actctaacaa atgtgggaaa    2220
cccagctaca tacaaggcct cagtctcttc tgaaacacag gacgtgaaga ttctggttga    2280
gccacaaaca cttactttca gccgaaagaa cgaaaagaaa acctacactg tgacattcac    2340
tgctacttcc aagccatcag gcacaaccag cttcgctcga ctggagtggt cagatggaca    2400
acacgttgtt gcaagcccaa ttgctttcag ctggacatga ttctgctagt tctaagtcat    2460
tcaccacaaa tgtacaagtg ctaatagtcc tttttaaata attactagtg tgcagcagtt    2520
actcctctaa tatttcacca actgaacaag tatcctgacc tataattaag aagcctaggc    2580
aattctaggc aatgttggtt gatttgccca gcaaaaggct ggtgctgtat ttgccagata    2640
taattatgta ctgaaccaca caatacaggt ggatattatt tggcttttt                2689
<210>5
<211>2453
<212>DNA
<213>Artificial sequence
<220>
<223>synthetic construct
<220>
<221>misc_feature
<222>(729)..(729)
<223>nisa,c,g,or t
<220>
<22l>misc_feature
<222>(2397)..(2397)
<223>nisa,c,g,or t
<400>5
accgttgatc aaccctacaa aacctacatc attcgcattg actctcaatc caagccctcc     60
attttcccca ctcactacaa ctggtacacc actgaattca ctagcacccc acaaatcctc    120
cacacttacg acaccgtttt ccatggcttc tccgccatac taacaccaga ccgcgccgcc    180
actctcagcc aacacccatc agtcctcgcc gtgatcgaag atcaacggaa acaactccac    240
accactcggt ctcctcagtt tcttggactc agaaaccaac gtggtctctg gtcggattct    300
gattatggtt ctgatgttat cattggcgtt ctcgataccg ggatctggcc agaacgacgg    360
agcttctctg acgtcaatct tggagcgatt cctgctcggt ggaaaggaat ttgtgaagtc    420
ggtgaaagat tttcagcaag aaactgcaac aagaagttga ttggtgcccg gttttttatc    480
aaaggacatg aggcagcaag tgggagcacg ggaccgatta ctcctataaa tgaaactgtg    540
gagtttaagt ctccacgaga tgccgatggt catgggactc acacggcatc aaccgcggca    600
ggaaggcatg catttcgtgc tagcatggaa ggttttgcag cggggattgc gaaaggggta     660
gctccgaaag cacgtttggc tgtgtataaa gtttgctgga agaatgcagg atgttttgat     720
tctgatatnt tagctgcttt tgatgctgcg gttaaagatg gagttgatgt catttcgatt     780
tccattggtg gtggtgatgg gatttcggca ccttattatc ttgatccgat tgccatcggt     840
gcttatggtg cggcttctag aggggttttt gtctcgtctt cggctgggaa tgacgggcct     900
aatttaatgt cagtgacgaa tcttgctccg tggattgtta ctgttggtgc tggaacaatt     960
gacaggaatt tccccgcaga agttgttctt ggtaatggga agagattatc tggtgtttcg    1020
ctatatgctg gtttgccatt gagtggtaaa atgtatcctc tggtttatcc ggggaaatca    1080
ggggttttgt cttcgtcact gtgtatggaa agttcattgg atcctaatat ggtgaaggga    1140
aaaattgttg tttgcgatcg cggaagtagc gcaagagtgg caaaagggtt ggttgttaag    1200
aaagctggag gtgttggtat gattcttgct aatggaattt ctaatggtga aggtttagtt    1260
ggcgatgctc atttaattcc tacctgtgct cttggttctg atgagggtga tacagtcaag    1320
gcttatgttt cagccacttc gaatccggtt gctactattg ctttcaaagg tactgtgatc    1380
ggaatcaaac cagctcctgt tgtggcttcg ttttcgggta gggggccaaa tggattgacc    1440
ccggagattc tgaagccgga cttgatcgct cctggggtga acattcttgc tgcttggacg    1500
gatgctgttg gtccaactgg attggattca gatactcgaa aaactgaatt caacattctt    1560
tcaggcactt caatggcatg tcctcatgta agtggcgccg cagccttgct taaatctgcc    1620
cacccagatt ggagtccggc agcaattagg tctgcaatga tgaccactgc caatacattc    1680
aataatctaa accagtcaat gactgacgag gccactggaa acgtgtcgtc atcatacgat    1740
ttgggtgcag ggcatctcaa tcttgatcga gcaatggatc cagggttggt ttatgatatt    1800
accaacaacg attatgtgaa ctttttgtgt ggaattggat acgggcctag agtaattcag    1860
gtgatcacgc gatcaccagt gagttgtcta gagaagaaac cattgccaga gaacctcaat    1920
tacccttcaa tcgcagcatt gcttccgagc tcagcaaagg gagcaacaag caaggcattc    1980
atcagaacag tcaccaatgt gggtcaaccg gacgctgttt atcgtttcac aatccaagct    2040
ccaaaagggg tcacagtgac agtgaaacca ccacaattgg tgttcaccga ggccgtgaag    2100
aagcagagct tcattgtaac cataacggcc aacacccgga atctgatgct ggatgattcg    2160
ggtgctgtat tcgggtccac tttcgtggtc tgacgggaag catgtcgtta ggagtcccat    2220
tttggtgacc cagatagatc ccctgtaaac ttaatagttt cacttggatc atatcttatg    2280
accggtcagt tggctggcag tggttaagct agcgctgaag tagcaagaga gagtgtgagg    2340
tagcataggt gtagaattgc tacgtaccag tgtgtgttgc cacccttctt tctgttngct    2400
gccagttagg actaagccaa gaactgcttt cagggatggt tagtgtgagt tct           2453
<2l0>6
<2ll>240l
<212>DNA
<213>Artificial  sequence
<220>
<223>synthetic construct
<400>6
agtataaata acaacatgcg atggtgctgc aaagcacact gagtgcaaca aagtgttaac     60
atgaaaggca atgatacact tttgttgcat ttattctaca ctctcttgtt gtttcttgga    120
gtacgaagtt catcttcagc agggaatgga agtaacgatg tcactaaccg taaagaagtt    180
tatatcgtgt atatgggagc cgcagattca acagatgctt ccttccggaa tgaccatgct    240
caggttctca attcagtgct aagaaggaat gagaatgctc tagtacggaa ctacaaacat    300
ggtttctcag ggttcgcagc tcgtctatca aaaaaggagg caacctcaat tgctcagaaa    360
cctggtgtgg tgtctgtttt ccctggccca gttctgaaac tccacactac acggtcatgg    420
gatttcctca aataccaaac tcaagtcaaa attgacacca aaccaaatgc ggtctccaaa    480
tcttcttccg tcattggtat cttagacaca ggtatatggc cagaggcggc gagttttagc     540
gacaagggta tgggtcctgt tccatctcgt tggaaaggca cctgcatgaa atcacaagac     600
ttctattcct ccaattgtaa caggaagcta attggcgcaa ggtattatgc tgaccctaat     660
gactcggggg acaacacggc tagggattct aatgggcatg gaacccatgt ggcgggaacg     720
gcagctggtg ttatggtgac taacgcatct tactacggtg ttgcgacagg gtgtgcaaag     780
ggtgggtccc cagagtcaag attagcggtt tacagagtgt gttctaactt tgggtgtcgt     840
gggtcgagca ttcttgctgc gtttgacgat gccattgcgg acggagtgga tttgttgtcg     900
gtgtcactag gtgcatccac tgggtttcga cccgacttga cgtccgatcc gatttcgctt     960
ggagcattcc atgctatgga gcatggcatc ctcgtcgtct gctctgctgg gaacgatgga    1020
cccagctcct acacccttgt caacgatgca ccttggattt taactgttgc agcttccacc    1080
attgatcgaa attttctatc caacatcgtc ttaggtgata acaaaatcat caagggcaaa    l140
gctataaatc tatcccctct ttcaaattct cccaagtatc ccctgatata cggtgagtct    1200
gccaaggcga atagcaccag cttagttgaa gcaagacaat gccgcccaaa ttcattagat    1260
gggaataaag tcaaaggaaa gatcgtggtc tgtgatgaca aaaatgataa atattcaact    1320
agaaaaaaag ttgccacggt gaaagcggtg ggaggaattg gtctggttca tattactgac    1380
caaaatgaag caatagcatc aaattatggg gacttcccag caacagtcat aagttcaaaa    1440
gatggcgtca caatcctcca gtacatcaat tcaaccagca atccagtggc aactattcta    1500
gcaacaacat cagttcttga ttataagcct gctcccctgg tgccaaactt ctcatcaaga    1560
gggccttcat cgctttcaag caatattctc aagcctgata ttgcagctcc gggagttaac    1620
attctcgctg catggattgg aaatggcaca gaagtggttc ccaaaggaaa aaagccctca    1680
ctatacaaga taatctcagg gacttccatg gcttgcccgc atgtttcagg gcttgcaagc    1740
agtgtcaaaa cacgcaaccc cgcttggagt gcctcctcaa tcaaatctgc catcatgact    1800
tcagcaattc aaagcaacaa cttgaaggct cccataacaa cggaatcagg gtcggtagcc    1860
acaccttatg actatggagc aggggaaatg acaacatctg aaccattgca accggggcta    1920
gtttatgaaa ccagctccgt tgactacttg aacttcttgt gttacattgg attcaacgta    1980
accacggtta aagtcatctc caaaaccgtc cctcgtaatt tcaattgccc caaggatttg    2040
agctctgatc atatctctaa catcaactac ccttccatag caataaactt cagtggcaaa    2100
agagccgtga acttgagtag aactgttaca aacgttggcg aagatgatga aacagtgtac    2160
tcccccattg ttgatgctcc cagtggagtg catgtcacat taactccaaa taaacttcgg    2220
tttacgaaaa gtagtaaaaa actaagctac cgagttattt tttcatcaac tctgacctcc    2280
ttgaaggaag atctgtttgg atctattact tggagtaacg gtaagtatat ggttcgaagt    2340
ccttttgtgt taactaagtg aatttaaaag taacgatgaa taaatgcttc ttcatgcttt    2400
t                                                                    240l
<2l0>7
<211>1444
<212>DNA
<213>Artificial sequence
<220>
<223>synthetic construct
<400>7
cacctcgtgc cggcgactat ggtcgggcag aagttcggcg acaagatcag gtactacgtc     60
cagacggacc cgtcgccaac ggcgaccatc gtgttccgcg gcacagtcat cggcaagtcg    120
ccgtcggcgc ctcgagtggc ggcgttctcg agccgaggcc ccaactaccg cgcaccggag    180
atcctcaagc ccgacgtcat cgccccgggc gtcaacatac tcgcggcgtg gaccggcgcc    240
gcctccccca ccgacctgga catcgactcg aggcgcgtgg agttcaacat catctccggc    300
acgtccatgt cctgcccgca cgtgagcggc ctcgccgcgc tgctccgcca ggcgcacccg    360
gagtggagcc ccgcggcgat caagtcggcg ctcatgacca cggcgtacaa cctggacaac     420
tccggggaaa ccatcaagga cctcgcgacg ggcgtggagt cgacgccgtt cgtccgtggc     480
gccggtcacg tcgaccccaa cgccgccctc gacccagggc tggtgtacga cgccggctcc     540
gacgactatg tcgccttcct ctgcacgctc gggtactctc cgtcgttgat ctccatcttc     600
acgcaggacg catcggtcgc cgactgctcg acgaaattcg ctcgccccgg cgaccttaac     660
taccctgcct tcgccgccgt cttctcctcc taccaagact cggtcaccta ccgccgggtg     720
gtgcgcaacg tcggcagcaa ctccagcgcg gtgtaccagc cgacgatcgc cagcccgtac     780
ggcgtggatg tcacggtgac cccgagcaag ctcgcgttcg acgggaagca gcagagcctg     840
ggatacgaaa tcaccatcgc agtgtcaggc aacccggtga tcgtggattc cagctactcg     900
ttcggatcca tcacctggag cgacggcgcg cacgacgtca cgagccccat tgccgtgacc     960
tggccgtcca acggtggagc agcagccatg tagtagactg atgctgttgc tactgtctac    1020
cgctgtggga agaaggacag ggccatgagc ccatgagatc cgaaatctcc acgcctcctg    1080
cctgccatag gaataatttc ctcgactgaa ccacgcaata attcagctgc ccctatcgtg    1140
gttgtggtgg accaatggac catgcttgca gctctctctt ttcatttagg ggtaggttgg    1200
ttggagcagc gtatgtgatt ggctgcttgc aaggccgtga gggtgccatc cattatggct    1260
cattggcgat tggacgtgta tgaacaagtt tgtaatgact agaaataatc attgtaccat    1320
gttttttcta tgctggcgcg tttatagcac catgctttgt gtatgtcact tgtgtacgca    1380
tactaaagag aaaagcatgg atatggacca cctgagtgtt cctaaaaaaa aaaaaaaaaa    1440
aaaa                                                                 1444
<210>8
<211>1279
<212>DNA
<213>Artificial sequence
<220>
<223>synthetic construct
<400>8
ggagcttcat cttactctca cgacagtttg gcgatagcaa cttttggagc aatggagatg      60
ggtgtttttg tctcttgctc agctggcaat ggaggaccag atcctgtcag cctcactaat     120
gtatcaccat ggatcactac agtcggtgct agcaccatgg atagagattt tccaggtagt     180
gttaagctag ggagtgggag aaccatatct ggagtttcac tctacaaagg gcggaggtta     240
ctgcaggcaa acaagcaata ccctcttgtt tatatgggta gtaactcaag cagccctaat     300
ccaagttcat tatgcttaga gggaactttg gatccacatg ttgtttctgg gaaaatcgtg     360
atatgtgatc gaggaataaa tcctaaagtg caaaagggtc aagtagtgaa agatgctgga     420
ggagtaggga tgattttgac aaacactgca gcaaatgggg aggagcttgt tgcaaattgt     480
cacctacttc cagcagttgc agtgggagag atggaaggga aagcaatcaa acattatgcc     540
ttaacaaatg ggaaaccaac cgcaactcta gcctttttag gtaccagatt gggtgttagg     600
ccatcaccag tggtggcagc attttcatct agaggaccaa atttcctcac acttgaaatt     660
ctcaaacctg atgtggttgc gccaggggtg aacatccttg cagcctggac tggagaattg     720
ggtccgtcaa gtcttccaac agatcatagg agagtgagat tcaacatatt atcagggact     780
tcaatgtcat gccctcatgt tagtggaatt gctgccttga tcaaggccag acacccagat     840
tggagtgccg cagcagttaa atctgctcta atgacaaccg cttatgttca tgataacatc     900
cataatccac tccaagactc ttccactgca gcagcttcca ctccctatga tcatggagct     960
ggtcatatca accctttgaa agctctagac ccaggtttga tctatgacat ttcagcccag    1020
gattactttg tattcctctg cacacagaaa ttgactgcaa tacagctaaa agcttttagc    1080
aagcattcca atatgtcttg ccatcacaac acccttgcca ctccaggaga tttgaactac    1140
ccagcaatct cagttgtctt cccagaagat acagccattt caactttgac tctccataga    1200
acagtcacaa atgttggtcc tcctgcttca cattaccatg ttgtagtttc accatttaaa    1260
ggcgtcacca ttaaagttt                                                 1279
<210>9
<211>2566
<212>DNA
<213>Artificial sequence
<220>
<223>synthetic construct
<220>
<221>misc feature
<222>(1470)..(1470)
<223>nisa,c,g,or t
<220>
<221>misc_feature
<222>(1488)..(1488)
<223>nisa,c,g,or t
<400>9
gaattcggca cgagcagagc ttagagcgcc atgtctgcta ctccttgtgt ttcttctcta     60
ctcatctctg cgattgcagc tgtcgcaagg gctcaaacaa agacgggtat acatcgtcta    120
ccttggggag aggcaacatg aagatgtcag tctcgtcacc tctttgcacc atgacttgct    180
cacttccgtt ctcggaagca aggaggcggc tctcgaatcg attgtccaca gctacagata    240
tggtttctca ggcttttctg caatgcttac tgaatcacaa gcgagaaaga tccagacact    300
gcctggagtg gtgagtgtga aagagaacac aatggtacgc atgcatacta ctcggagctg    360
ggatttcctt gggctgtcca tgggcgtgga catcaagcag gagcagcagc caaatgagct    420
ccttgcagca gcaaaccatg gagatgggat gattatcggt gtcatcgact caggtgtttg    480
gcctgagtca cagagcttcg ctgatgatgg ctatggacct cctccttcaa aatggaaggg    540
aacttgccaa gcgggtgcca acttcagtgc ccacgattgc aatcgaaagc tcatcggtgc    600
gcggtggtat gctggccctg acatcgacag gagatttctc caaggtgact tcctgtctgc     660
cagggattct catggccacg gcacccacac agcctccaca gccggtggca acgtcgtcca     720
caacaccagc ttcttcggac tggctgctgg aacggctcgt ggtggcgcac ctcgcgcccg     780
gatagcagtg tacaaggctt gctggggtac ttgctctacc gcgagcgttc tgaaaggcat     840
cgatcatgct atccatgacg gtgttgacgt cctatcgctc tctctcggaa gcacgaacga     900
aatggcagca ctaggaacgc tgggtgcggt ggcaagaggc atcccggtta tcatggcagg     960
cggaaatgat ggacctacag aagaaacggt ggagaattct tcaccatggc tactcacggt    1020
tgctgcaacc atggttgatc gatcattcct cacggttatc accctcgggg ataaccgaca    1080
gtttgtggca caatccatgt atgtggcaga taaaggtgga gatgagttct ctgaacttct    1140
gtattacttt aaggataggt gtgacccgga ctacataaac agcactgaca tacacgggaa    1200
ggtggtattc tgctacacac caggaccggg tagtgtctct gcaccaccca agtatgcaga    1260
tattgcagcg acggtgcaga gaaatggagg gaatggattt atattctcac agaataatct    1320
ggactctctt gatctatatg caattaaagg accggccctt ccttgcgttc ctctcgactt    1380
caagactagg ctatcagatt gctgtgtact gcaatcgcat tggcatccca aaaataaaga    1440
tatcaacaac ccgaacaacc agcggaagtn aagttgttgc cccaaganta gcagctttct    1500
catcaagggg gcctagtcct atctatcatg gggttctcaa gcctgatatt gctgcacctg    1560
gggtgtacat tttagccgct gcagcacaaa ctggtgctta caaaagtcta ggtgtttcct    1620
atgtcttcga ttctggaaca tccatggcct gcccacatat atctgggata gtcgctctac    1680
tcaaatccgt gcatcctgac tggtcccctg ccgccctaaa atcagcacta atgacaaccg    1740
cacataccat ggacagtcat ggggttccaa tagaagcaaa tggaaatcgt gcaaagatcg    1800
ccgacccgtt tgattacgga gcagggtctg ttaatccaac caaggcagct gatccaggcc    1860
tgatatatga catcagtgcg tcagattacc tcgagttttt caactgtcca caaggatttg    1920
gttcaaataa caattgcaca ccacctgact tgaacctccc atcgattgcc attcctggcc    1980
tcaagacatc tgtgacggtt gtgcgcactg ttaccaatgt tggccagccg aatgcggtgt    2040
acaaggcatt cttggagcct ccacgtggcg tcaagatggc tgtggagcca gcagtgctgg    2100
tgttcagcaa tgcaaggagg gtgcagagtt tcaacgtgac tttcagggcg acccgaagga    2160
tccagggcag ctacaccttc ggtagcttgg catggcatga tggaggcgcc cacctggttc    2220
ggatcccgat tgcagttcgt gtggtgattg aagagctcta ctcagatgcc tcttaagtgg    2280
ggacgttaca tgcagttcga ctgtaaaata aaagacgact ggatctgtat ctgtgttttt    2340
ttttcggaac tcccactatg gctatggtga ttagtgtccg ttcctatggt acgtgaacat    2400
ttatgtcagt gtattgaaaa cttgacataa gtttgtatgg taccggcgga ataaggaaat    2460
ccacccgcaa ctagacaaga ttttctgcct tgctgctagc aatggtaact cccttgatgt    2520
tacaattctt cagactaagt gaatggaaag catcgcatac aacagc                   2566

Claims (15)

1.包括植物转化载体的转基因植物,该植物转化载体含有编码或互补于编码包括SEQ ID NO:2的氨基酸序列的HIO1004多肽或其直系同源物的序列的核苷酸序列,由此相对于对照植物,该转基因植物具有高油表型。
2.权利要求1的转基因植物,其选自油菜籽,大豆,玉米,向日葵,棉花,可可,红花,油棕,椰子,亚麻,蓖麻和花生。
3.从权利要求1的植物获得的植物部分。
4.权利要求3的植物部分,其是种子。
5.从权利要求4的种子生产的粗粉,饲料或者食品。
6.一种生产油的方法,其包括培育权利要求1的转基因植物,以及从所述植物回收油。
7.权利要求6的方法,其中的油回收自所述植物的种子。
8.产生高油表型植物的方法,所述方法包括:
a)把植物转化载体导入到植物的祖细胞中,该植物转化载体含有编码或互补于编码包括SEQ ID NO:2的氨基酸序列的HIO1004多肽或其直系同源物的序列的核苷酸序列,和
b)培育该转化的祖细胞以生产转基因植物,其中表达所述的多核苷酸序列,而且相对于对照植物,所述的转基因植物显示改变的含油量表型。
9.通过权利要求8的方法获得的植物。
10.权利要求9的植物,其选自油菜籽,大豆,玉米,向日葵,棉花,可可,红花,油棕,椰子,亚麻,蓖麻和花生。
11.产生具有高油表型植物的方法,包括鉴定具有HIO1004基因的等位基因的植物以及产生所述鉴定的植物的子代,所述HIO1004基因的等位基因引起与缺少该等位基因的植物相比含油量的增加,其中产生的子代遗传该等位基因并且为高油表型。
12.权利要求11的方法,其使用候选基因/QTL法。
13.权利要求11的方法,其使用TILLING法。
14.饲料,粗粉,谷粒,食物或者种子,包含由SEQ ID NO:1的核酸序列编码的多肽。
15.饲料,粗粉,谷粒,食物或者种子,包括含有SEQ ID NO:2的氨基酸序列或者其直向同源物的多肽。
CN2005800173230A 2004-05-28 2005-05-26 生产改变含油量的植物 Expired - Fee Related CN1989248B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US57556004P 2004-05-28 2004-05-28
US60/575,560 2004-05-28
PCT/US2005/018908 WO2005118819A1 (en) 2004-05-28 2005-05-26 Generation of plants with altered oil content

Publications (2)

Publication Number Publication Date
CN1989248A true CN1989248A (zh) 2007-06-27
CN1989248B CN1989248B (zh) 2012-07-04

Family

ID=34981642

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2005800173230A Expired - Fee Related CN1989248B (zh) 2004-05-28 2005-05-26 生产改变含油量的植物

Country Status (8)

Country Link
US (1) US7528296B2 (zh)
CN (1) CN1989248B (zh)
AR (1) AR049064A1 (zh)
BR (1) BRPI0510413A (zh)
CA (1) CA2568026C (zh)
MX (1) MXPA06013905A (zh)
WO (1) WO2005118819A1 (zh)
ZA (1) ZA200610787B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9057074B2 (en) 2008-03-25 2015-06-16 Biogemma Pedicel specific promoter

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5704160A (en) * 1990-11-16 1998-01-06 E. I. Du Pont De Nemours And Company Production method for high-oil corn grain
US5639790A (en) * 1991-05-21 1997-06-17 Calgene, Inc. Plant medium-chain thioesterases
ES2152395T3 (es) * 1994-02-15 2001-02-01 Du Pont Granos de maiz y productos con una composicion oleica mejorada.
US6229033B1 (en) * 1998-05-11 2001-05-08 E. I. Du Pont De Nemours And Company Fat products from high stearic soybean oil and a method for the production thereof
DE59913709D1 (de) * 1998-05-13 2006-09-07 Bayer Bioscience Gmbh Transgene pflanzen mit veränderter aktivität eines plastidären adp/atp - translokators
AU2001259266A1 (en) 2000-05-01 2001-11-12 Exelixis Plant Sciences, Inc. System for functional gene discovery in plants
AU2003224730B2 (en) 2002-03-20 2008-11-13 Agrigenetics, Inc. Generation of plants with altered oil content

Also Published As

Publication number Publication date
US7528296B2 (en) 2009-05-05
AR049064A1 (es) 2006-06-21
CA2568026C (en) 2016-09-13
BRPI0510413A (pt) 2007-10-23
US20070245433A1 (en) 2007-10-18
CA2568026A1 (en) 2005-12-15
WO2005118819A1 (en) 2005-12-15
MXPA06013905A (es) 2007-03-07
CN1989248B (zh) 2012-07-04
ZA200610787B (en) 2007-11-28

Similar Documents

Publication Publication Date Title
CN101084316B (zh) 生产改变含油量的植物
CN1780553B (zh) 生产改变含油量的植物的方法
CN101600340A (zh) 具有改变的油、蛋白或纤维含量的植物的生产
ZA200505146B (en) Generation of plants with altered oil content
CN1997744B (zh) 生产改变含油量的植物
CN1728939B (zh) 生产改变含油量的植物
CN100535120C (zh) 生产改变含油量的植物
CN1989248B (zh) 生产改变含油量的植物
CN101103116B (zh) 生产改变含油量的植物
CN1893819B (zh) 生产改变含油量的植物的方法
CN1993470B (zh) 生产改变含油量的植物
CN1989249A (zh) 生产改变含油量的植物
ZA200604965B (en) Generation of plants with altered oil content
CN100523191C (zh) 生产改变含油量的植物
WO2006047159A1 (en) Generation of plants with altered oil content
US20060174374A1 (en) Generation of plants with altered oil content

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20120704

Termination date: 20150526

EXPY Termination of patent right or utility model