CN101218346A - 来自咖啡的脱水蛋白基因和启动子 - Google Patents

来自咖啡的脱水蛋白基因和启动子 Download PDF

Info

Publication number
CN101218346A
CN101218346A CNA2006800247385A CN200680024738A CN101218346A CN 101218346 A CN101218346 A CN 101218346A CN A2006800247385 A CNA2006800247385 A CN A2006800247385A CN 200680024738 A CN200680024738 A CN 200680024738A CN 101218346 A CN101218346 A CN 101218346A
Authority
CN
China
Prior art keywords
gly
lys
glu
protein
gene
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CNA2006800247385A
Other languages
English (en)
Inventor
S·D·坦克斯雷
林晨炜
M·本阿莫尔
J·G·麦卡锡
V·帕蒂尔
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nestec SA
Cornell Research Foundation Inc
Original Assignee
Nestec SA
Cornell Research Foundation Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nestec SA, Cornell Research Foundation Inc filed Critical Nestec SA
Publication of CN101218346A publication Critical patent/CN101218346A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8216Methods for controlling, regulating or enhancing expression of transgenes in plant cells
    • C12N15/8222Developmentally regulated expression systems, tissue, organ specific, temporal or spatial regulation
    • C12N15/823Reproductive tissue-specific promoters
    • C12N15/8234Seed-specific, e.g. embryo, endosperm
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/415Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from plants
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8241Phenotypically and genetically modified plants via recombinant DNA technology
    • C12N15/8261Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield
    • C12N15/8271Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield for stress resistance, e.g. heavy metal resistance
    • C12N15/8273Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield for stress resistance, e.g. heavy metal resistance for drought, cold, salt resistance

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Engineering & Computer Science (AREA)
  • Chemical & Material Sciences (AREA)
  • Biomedical Technology (AREA)
  • Organic Chemistry (AREA)
  • Wood Science & Technology (AREA)
  • Biotechnology (AREA)
  • General Engineering & Computer Science (AREA)
  • Molecular Biology (AREA)
  • Zoology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Biophysics (AREA)
  • Cell Biology (AREA)
  • Microbiology (AREA)
  • Plant Pathology (AREA)
  • Physics & Mathematics (AREA)
  • Botany (AREA)
  • Pregnancy & Childbirth (AREA)
  • Developmental Biology & Embryology (AREA)
  • Reproductive Health (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Medicinal Chemistry (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Breeding Of Plants And Reproduction By Means Of Culturing (AREA)
  • Tea And Coffee (AREA)
  • Peptides Or Proteins (AREA)

Abstract

本发明公开了来自咖啡植物的编码脱水蛋白和胚胎发育后期富集(LEA)蛋白的多核苷酸。本发明也公开了来自咖啡脱水蛋白基因的启动子序列,以及使用这些核酸和启动子序列调节基因和操控咖啡豆的香味、香气、胁迫耐性和其他性质的方法。

Description

来自咖啡的脱水蛋白基因和启动子
发明领域
本发明涉及农业生物技术领域。特别地,本发明表征了来自咖啡植物的编码脱水蛋白的多核苷酸、来自咖啡脱水蛋白基因的启动子序列,以及使用这些多核苷酸和启动子基因调节和操控咖啡豆的香味、香气(aroma)和其他特征的方法。
发明背景
在说明书全文中引用了多种出版物,包括专利、公开的申请和学术论文。这些出版物中的每一份在此以其全文引用作为参考。说明书中未完全阐明的引用可见于说明书的结尾处。
咖啡的香气和香味是消费者对咖啡种类和品牌的偏爱的关键组成部分。咖啡的特征香气和香味来源于在豆的烘焙过程中发生的涉及香味前体的复杂的系列化学反应(美拉反应)。香味前体包括存在于绿咖啡豆中的化合物和生物分子。迄今为止,已鉴定了800多种促成咖啡的香味和香气的化学物质和生物分子。(Montavon等人,J.Agric.Food Chem.51:2328-34(2003))。
因为咖啡消费者变得越来越成熟,为了满足消费者的偏好希望产生具有改进的香气和香味的咖啡。可以通过化学方法人工地将香气和香味都赋予咖啡产品。参见,例如,美国专利号4,072,761(香气)和美国专利号3,962,321(香味)。然而,迄今为止,关于天然的咖啡种粒(coffe grain)组分例如多糖、蛋白质和脂类对咖啡香气和香味的影响的数据资料非常少。一个方法是从现有种质中选择具有更优的香味特征的品种。该方法的不利方面通常是质量最高的品种也具有明显不利的农艺性状,例如低产量和对疾病和环境胁迫的低抵抗力。也可能从育种试验中选择新品种,在所述育种试验中,将具有不同工业和农业性状的品种杂交并就高质量和良好的农业表现两个方面筛选其后代。然而,该后一种方法非常费时,一个杂交实验和超过3个生长季节的选择花费最少7-8年时间。因此,提高咖啡质量的备选方法将使用分子生物学的技术以增加负责在咖啡豆中天然发现的香味和香气的那些元件,以及添加在咖啡豆中非天然发生的香气和香味增强性元件。基因工程特别适合用于实现这些目的。例如,可交换来自不同咖啡物种的咖啡蛋白质。在可选择的方法中,可增加编码天然发生的对咖啡香味具有正贡献的咖啡蛋白质的基因表达。相反,可抑制编码天然发生的对咖啡香味具有负贡献的咖啡蛋白质的基因表达。现代技术的另一个应用是使用关于高质量与特定等位基因的相关性的分子信息,通过使用标记辅助育种就这类等位基因的存在或不存在筛选新品种。
当以相同的方式烘焙和加工绿种粒样品时,来自不同品种和来源的咖啡展示了显著的香味和香气质量变化。质量差异是种粒样品内的化学和物理变化的表现,所述化学和物理学变化主要由生长和加工条件的差异,也由于母本植物和种粒的遗传背景的差异引起。在化学组成的水平上,至少部分香味质量与小代谢物(例如糖类、酸类、酚类化合物和咖啡因)的水平变化相关,所述小代谢物与来自不同品种的种粒相关。已接受的是存在其他未得到良好表征的香味分子和香味前体分子。此外,可能种粒内的结构变异也可能促成咖啡质量的差异。发现咖啡种粒中与咖啡质量相关联的新成分的一个方法是研究在种粒样品的成熟期间,在具有不同质量特征的不同品种中差异性表达的基因和蛋白质。
已显示称为胚胎发育后期富集蛋白(LEA)的一类蛋白质在棉花种子发育后期以协作的方式累积(Dure,L,等人Biochemistry 20:4162-4178(1981))。脱水蛋白(DHN)是也已被称为“LEA D-11家族”或LEA 2型蛋白质的LEA蛋白质的亚类(Close,T,Physiol.Plant 97:795-803(1996);Ingram,J,Annu.Rev.Plant Physiology Plant Mol Biol 47:377-403(1996))。DHN蛋白质的表达与保护不同类型的植物细胞免受渗透胁迫相关,所述渗透胁迫例如为干燥、盐和低温导致的渗透胁迫(Skriver,K,等人.Plant Cell 2:503-512(1990);Allagulova,CR,等人.Biochemistry-Moscow 68:945-951(2003))。
近年来,直接的实验证据已将脱水蛋白增加的表达与免受渗透胁迫的保护作用联系起来。例如,发现当经改造而过量表达脱水蛋白融合蛋白的拟南芥植物暴露于低温时,具有提高的存活率(Puhakainen,T,等人.PlantMolecular Biology 54:743-753(2004))。类似地,已显示柑橘属脱水蛋白在转基因烟草中的表达产生了对低温增加的耐受性(Hara,M,等人.Planta 217:290-298(2003))。脱水蛋白和对低温诱导的胁迫的耐受性相关的其他支持证据是在图谱上冷冻耐受性和抗寒性的QTL基因座与脱水蛋白非常接近的观察(Close T,1996;Zhu,B,等人.Molecular and General Genetics 264:145-153(2000))。DHN基因也在接近成熟末期(该时期为当种子经历水含量随发育程序性减少的时期)的种子中强烈表达(Nylander,M,等人.PlantMolecular Biology 45:263-279(2001);Choi,DW,等人.Theoretical andApplied Genetics 100:1274-1278(2000))。据估计LEA/脱水蛋白包含高达4%的总种子蛋白质,并且被认为参与保护胚和/或其他种子组织免受与成熟种子的低水含量相关的渗透胁迫(RobertsJ,等人.Plant Cell 5:769-780(1993);Wise,M,等人Trends Plant Sci.9:13-17(2004))。
广泛地认识到脱水蛋白与其他LEA蛋白质一起通过帮助种子组织适应成熟种子中发现的更低水含量来参与在种子成熟后期中发生的脱水过程(Close,Tm 1996);Nylander M,2001)。此外,相信在种子休眠期间,在种子成熟期间合成的脱水蛋白也继续稳定相关的细胞结构。关于后一点,最近已提及脱水蛋白也可具有自由基清除能力(Hara,M,2003)和金属结合性质(Alsheikh,MK,等人.J.Biol.Chem.278:40882-40889(2003)),这都是在长期的种子贮藏期间可能有用的两个特征。
已分离和研究了相当量的脱水蛋白,并且这些蛋白质籍以在体内发挥保护细胞免受渗透胁迫的作用的精确生理化学和/或结构机制正在研究中。脱水蛋白是极亲水的蛋白质并且展示显著低水平的可识别结构(Close T,1996;Soulages,JL,等人.Plant Physiology 131:963-975(2003))。据认为脱水蛋白至关重要的元件为存在一个或多个称为“K基序”的富含赖氨酸的15个氨基酸的片段,经预测该片段形成A类两亲性α-螺旋(Close,T,1996;Close,TJ Physiol.Plant 100:291-296(1997))。脱水蛋白也可包含两个其他基序,N末端“Y区段”(共有序列V/TDE/QYGNP)和富含丝氨酸的“S区段”,其中后者可被磷酸化并且被认为参与细胞核定位(Close TJ,1997;GodoyJA,等人.Plant Mol.Biol.1921-1934(1994))。已提出,脱水蛋白多肽的短两亲性K区段功能性地与经历部分变性的蛋白质的暴露于溶剂的疏水小块相互作用,从而阻断蛋白质聚集体形成(Close T,1996)。两亲性K螺旋也可参与结合膜脂,从而可在保护脂蛋白、位于膜中的蛋白质和/或膜结构本身中起着更有效的作用(Close T,1996;Koag,MC,等人PlantPhysiology 131:309-316(2003))。关于脱水蛋白至少部分的保护效应的可选建议是这些非常稳定的但相对无结构的蛋白质紧密结合和组织水分子的能力(Soulages JL,2003)。后一效应可减少水从细胞的丢失,并且也可提高某些大分子的稳定性,这是通过产生在这些分子周围更紧密结合的“有序的”水的基于脱水蛋白的区域。
尽管脱水蛋白在植物中参与对渗透胁迫例如干旱和盐胁迫的抗性,以及脱水蛋白在种粒发育期间可能起着重要作用,但在咖啡中可获得的关于这些基因的信息极少。在咖啡中,关于脱水蛋白的数目、它们的蛋白质结构、它们在咖啡植物的不同组织中和咖啡物种间以及在咖啡种粒和果皮成熟期间的表达水平和分布、以及它们的表达在分子水平上的调节都知之甚少。因此,存在对鉴定、分离和表征咖啡脱水蛋白、基因和基因调节元件的需要。这类信息将使得咖啡脱水蛋白能够被遗传操作,目的在于提高咖啡的香气和香味,以及赋予与改善的渗透胁迫抗性相关的其他表型优势。
因为脱水蛋白在咖啡种粒中组织水分子,和在成熟脱水的种粒中稳定大分子和细胞器中所具有的潜在的重要作用,在种粒成熟末期相对高水平表达的脱水蛋白是非常引人注意的。据认为至少部分该保护效应是由于脱水蛋白和其他LEA蛋白质稳定不同的水/蛋白质/脂类界面的能力。因为水的水平可影响美拉反应中形成的产物谱(Turner,J,等人J.Agric.FoodChem 50:5400-5404(2002)),所以咖啡种粒中的水分子的可获得性和组织状态可影响在咖啡的烘焙过程中发生的产生香味的美拉反应。
发明概述
本文描述的本发明表征了来自咖啡植物的编码脱水蛋白的多核苷酸、它们编码的多肽、来自咖啡脱水蛋白基因的启动子序列,以及使用这些多核苷酸、多肽和启动子调节基因和操控咖啡豆的香味、香气和其他特性的方法。
本发明的一个方面表征了从咖啡属物种(Coffea spp.)分离的核酸分子,该核酸分子具有编码脱水蛋白或胚胎发育后期富集蛋白(LEA)的编码序列。在某些实施方案中,编码的脱水蛋白具有大约17kDa至26kDa的分子量。在某些实施方案中,编码的脱水蛋白或LEA蛋白质具有与SEQ IDNO:7-12中的任一个有46%或更高同一性的氨基酸序列。在一些实施方案中,编码序列与SEQ ID NO:1-6中所示的编码序列中的任一个具有45%或更高的同一性。
在某些实施方案中,核酸分子是具有包含编码序列的可读框的基因。可选地,其可包含通过该基因转录产生的mRNA分子,或通过该mRNA分子的反转录产生的cDNA分子。本发明也表征了长度为8至100个碱基的寡核苷酸,该寡核苷酸与上述核酸分子的区段互补。
本发明的另一个方面表征了包含上述编码脱水蛋白或LEA的核酸分子的载体。在某些实施方案中,载体是选自质粒、噬菌粒、粘粒、杆状病毒、杆状病毒穿梭载体、细菌、酵母和病毒载体的表达载体。在某些实施方案中,载体包含有效连接至组成型启动子的核酸分子的编码序列。在其他实施方案中,编码序列有效连接至诱导型启动子。在其他实施方案中,核酸分子的编码序列有效地连接至组织特异性启动子,例如种子特异性启动子,优选咖啡种子特异性启动子。在特定的实施方案中,种子特异性启动子是咖啡脱水蛋白基因启动子,例如SEQ ID NO:13中包含的启动子。
本发明的另一个方面提供了使用上述载体转化的宿主细胞。宿主细胞可以是植物、细菌、真菌、昆虫或哺乳动物细胞。在某些实施方案中,宿主细胞是选自咖啡、烟草、拟南芥、玉米、小麦、稻、大豆、大麦、黑麦、燕麦、高粱、苜蓿、三叶草、油菜、红花、向日葵、花生、可可、蕃茄、粘果酸浆(tomatillo)、马铃薯、胡椒、茄子、甜菜、胡萝卜、黄瓜、莴苣、豌豆、紫菀、秋海棠、菊花、飞燕草、百日草和草坪草中的任一种的植物细胞。本发明也表征了通过再生转化的植物细胞产生的能育转基因植物。在特定的实施方案中,能育转基因植物是咖啡属物种。
本发明的另一个方面表征了调节咖啡豆的香味或香气的方法。所述方法包括调节咖啡种子内的一种或多种脱水蛋白或LEA蛋白质的产量。在一些实施方案中,所述方法包括例如通过增加咖啡种子内的一种或多种编码内源性脱水蛋白或LEA蛋白质的基因的表达,或通过将编码脱水蛋白或LEA蛋白质的转基因引入植物来增加一种或多种脱水蛋白或LEA蛋白质的产量。在其他实施方案中,所述方法包括例如通过将抑制一种或多种编码脱水蛋白或LEA蛋白质的基因表达的核酸分子引入咖啡,来减少一种或多种脱水蛋白或LEA蛋白质的产量。
本发明的另一个方面表征了在植物中增加对渗透胁迫的抗性的方法。该方法包括例如通过将编码脱水蛋白或LEA蛋白质的转基因引入植物,来增加植物中一种或多种脱水蛋白或LEA蛋白质的产量。
本发明的另一个方面提供了从编码脱水蛋白的咖啡植物基因分离的启动子。在某些实施方案中,编码脱水蛋白的咖啡基因编码具有一种或多种上述特征的脱水蛋白。在某些实施方案中,所述启动子包含选自TATA盒、脱落酸应答元件、用于调节leguminin类型蛋白质表达的leguminin盒的RY重复(CATGCA(T/a)(A/g)、至少一种脱水应答元件/C重得顺式作用序列基序(G/ACCGAC)和至少一个E盒基序(CANNTG)的一个或多个调节序列。在特定的实施方案中,所述启动子包含SEQ ID NO:13。
本发明也表征了包含有效连接至一种或多种编码序列的编码咖啡脱水蛋白的基因的启动子的嵌合基因。本发明也提供了用于转化细胞、包含所述嵌合基因的载体和用该载体转化的细胞以及通过再生用该载体转化的植物细胞产生的能育转基因植物。
根据下列的附图、详细描述和实施例理解本发明的其他特征和有利方面。
附图概述
图1.中果咖啡(Coffea canephora)Y3SK2类型脱水蛋白与几种近缘植物同系物的最佳比对。使用MegAlign软件(DNASTAR)中的Clustal W程序产生该比对,然后通过手工进行进一步最优化。加框标示相同氨基酸。用实体条为Y区段划界,单一深色矩形为S区段划界,以及虚线矩形为K区段划界。黑色圆表示CcDH2a和CcDH2b之间不同的氨基酸。登录号:番茄(Lycopersicon esculentum)脱水蛋白TAS 14(AAC49618)(SEQ ID NO:14);Solanum commersonii脱水蛋白Dhnl(CAA75798)(SEQ ID NO:15);拟南芥(Arabidopsis thaliana)脱水蛋白RAB18(NP_201441)(SEQ ID NO:16)。
图2.中果咖啡SK3型脱水蛋白与几种近缘植物同系物的最佳比对。如图1中所述产生该比对。加框标示相同氨基酸。单一深色矩形为S区段划界,以及虚线矩形为K区段划界。登录号:烟草(Nicotiana tabacum)脱水蛋白(BAD13499)(SEQ ID NO:17);马铃薯(Solanum tuberosum)脱水蛋白同系物CI7(T07779)(SEQ ID NO:18);拟南芥脱水蛋白(CAA62449)(SEQ ID NO:19)。
图3.中果咖啡胚胎发育后期富集蛋白CcLEA1与几种近缘植物同系物的最佳比对。如图1中所述产生比对。加框标示相同氨基酸。用星号标示保守的半胱氨酸,用圆标示两个较不保守的半胱氨酸的位置。登录号:拟南芥胚胎发育后期富集相关蛋白(NP_200248)(SEQ ID NO:20)、白云杉(Picea glauca)胚胎发育后期富集蛋白EMB7(T09288)(SEQ ID NO:21)、玉米(Zea mays)根冠蛋白质2(BAA75477)(SEQ ID NO:22)。
图4.小果咖啡(Coffea arabica)和中果咖啡的不同器官中咖啡脱水蛋白和CcLEA1转录物的RT-PCR表达分析。100bp表示100bp的分子量标准参照梯;SG、LG、YG、RG分别表示表示种粒和果皮的小绿、大绿、黄绿色和红色;R、S、L、F表示根、茎、叶和花。
图5.中果咖啡和小果咖啡的不同器官中CcDH2的定量RT-PCR表达分析。GSG、GLG、GYG、GRG分别表示小绿种粒、大绿种粒、黄色种粒和红色种粒;PSG、PLG、PYG、PRG分别表示小绿果皮、大绿果皮、黄色果皮和红色果皮;R、S、L、F表示根、茎、叶和花。在各反应的图表中报导标准偏差。
图6.CcDH2脱水蛋白的Southern印迹分析。放射自显影图暴光3天。
图7.来自中果咖啡的CcDH2a启动子和转录序列的DNA序列。显示了pVC1插入片段的核酸序列和对应的氨基酸序列。用圆标示cDNA中的第一个碱基(C)。用下划线标示假定的TATA盒。用双下划线标示RY重复序列,用框标示ABA应答元件,并用粗线给DRE/CRT序列加框。
图8.所编码多肽的Kyte-Doolittle亲水性图。CcDH1a(173个氨基酸,SEQ ID NO:7);CcDH1b(176个氨基酸,SEQ ID NO:8);CcDH2a(163个氨基酸,SEQ ID NO:9);CcDH2b(163个氨基酸,SEQ ID NO:10);CcDH3(228个氨基酸,SEQ ID NO:11);CcLEA1(358个氨基酸,SEQ ID NO:12)。
图9.对照和干旱胁迫植物叶中CcDH1表达的实时定量RT-PCR表达分析。植物1-3是定期浇水的对照植物;从实验开始(“0”)在整个6周期间不给植物4-6提供水。
图10.对照和干旱胁迫植物叶中CcDH2表达的实时定量RT-PCR表达分析。植物1-3是定期浇水的对照植物;从实验开始(“0”)在整个6周中不给植物4-6提供水。
例示性实施方案的详述
定义:
与本发明的生物分子和其他方面相关的各种术语用于整篇说明书和权利要求。
“分离的”是指通过人工方法从天然状态改变。如果组合物或物质在自然界中存在,如果已将其从其原始的环境中改变或移开或两者都发生,则其已被“分离”。如术语在本文所使用,例如,天然存在于活植物或动物中的多核苷酸或多肽不是“分离的”,但从其天然状态的共存材料分离的相同多核苷酸或多肽是“分离的”。
“多核苷酸”,也称为“核酸分子”,通常指可以是未被修饰的RNA或DNA或修饰的RNA或DNA的任何多核苷酸或多脱氧核糖核苷酸。“多核苷酸”包括但不限于单链和双链DNA,为单链和双链区混合的DNA、单链和双链RNA以及为单链和双链区的混合物的RNA、包含DNA和RNA的、可以是单链或更常见地为双链或单链和双链区混合的杂种分子。此外,“多核苷酸”是指包含RNA或DNA或RNA和DNA的三链区。术语多核苷酸也包括包含一个或多个经修饰的碱基的DNA或RNA,和具有为了稳定或其他原因而修饰的主链的DNA或RNA。“经修饰的”碱基包括,例如,三苯甲基化的碱基(tritylated base)和稀有碱基例如肌苷。可对DNA和RNA进行许多种修饰;因此,“多核苷酸”包括多核苷酸的化学、酶促或代谢修饰的形式(如通常在自然界中发现的形式),以及病毒和细胞的DNA和RNA特征的化学形式。“多核苷酸”也包括通常称为寡核苷酸的相对短的多核苷酸。
“多肽”是指包含通过肽键或经修饰的肽键即肽电子等排体(peptideisostere)相互连接的两个或更多个氨基酸的任何肽或蛋白质。“多肽”是指通常称作肽、寡肽或寡聚物的短链和通常称作蛋白质的更长的链。多肽可包含除了20个基因编码的氨基酸外的氨基酸。“多肽”包含通过天然方法例如翻译后加工或通过本领域内熟知的化学修饰技术修饰的氨基酸序列。这些修饰在基础教科书中和在更详细的专题著作以及大量的研究文献中进行了很好的描述。修饰可发生在多肽的任何位置,包括肽主链、氨基酸侧链,以及氨基或羧基末端。要认识到,相同类型的修饰可以以相同或不同的程度存在于给定多肽的几个位置。同样,给定的多肽可以包含许多类型的修饰。作为泛素化的结果,多肽可以是分支的,它们可以是环状的,具有或不具有分支。环状、分支和分支的环状多肽可以是由于天然的翻译后加工产生的或可以通过合成的方法产生。修饰包括乙酰化、酰化、ADP-核糖基化、酰胺化、黄素的共价附着、血红素部分的共价附着、核苷酸或核苷酸衍生物的共价附着、脂类或脂类衍生物的共价附着、磷脂酰肌醇的共价附着、交联、环化、二硫键形成、脱甲基作用、共价交联的形成、胱氨酸的形成、焦谷氨酸盐的形成、甲酰化、γ-羧基化、糖基化、糖基磷脂酰肌醇锚的形成(GPI anchor formation)、羟基化、碘化作用、甲基化、肉豆蔻酰化、氧化、蛋白酶解加工、磷酸化、异戊烯化、外消旋作用、硒酰基化、硫酸盐化作用、转运RNA介导的氨基酸对蛋白质的添加例如精氨酰基化和泛素化。参见,例如,Proteins-Structure and Molecular Properties,第2版,T.E.Creighton,W. H.Freeman and Company,New York,1993和Wold,E.Posttranslational Protein Modifications:Perspectives andProspects,第1-12页,在Posttranslational Covalent Modification ofProteins中,B.C.Johnson,编著,Academic Press,New York,1983;Seifter等人,″Analysis for Protein Modifications and Nonprotein Cofactors″,Meth Enzymol(1990)182:626-646和Rattan等人,″Protein Synthesis:Posttranslational Modifications and Aging″,Ann NY Acad Sci(1992)663:48-62。
作为在本文使用的术语“变体”,是分别与参照多核苷酸或多肽不同但保持基本性质的多核苷酸或多肽。多核苷酸的典型变体在核苷酸序列中与另一种参照多核苷酸不同。变体的核苷酸序列中的变化可以或可以不改变由参照多核苷酸编码的多肽的氨基酸序列。核苷酸的改变可导致由参照序列编码的多肽中的氨基酸取代、添加、缺失、融合和截短,如下面所讨论的。多肽的典型变体在氨基酸序列上与另一种参照多肽不同。通常,差异是有限的从而参照多肽和变体的序列总体上非常相似,并且在许多区域是相同的。变体和参照多肽可以通过一个或多个取代、添加或缺失的任何组合在氨基酸序列上相异。取代或插入的氨基酸残基可以是或可以不是由遗传密码子编码的氨基酸。多核苷酸或多肽的变体可以是天然发生的,例如等位基因变体,或其可以是已知非天然发生的变体。可通过诱变技术或通过直接的合成产生多核苷酸和多肽的非天然发生的变体。
关于突变植物,术语“无效突变体”或“功能丧失突变体”用于表示具有突变的生物或基因组DNA序列,所述突变使基因产物无功能或大大丧失功能。此类突变可发生在基因的编码区和/或调节区,并且可以是单个残基的改变或核酸区域的插入或缺失。这些突变也可以发生在可调节或调控基因和/或所编码蛋白质的其他基因编码区和/或调节区,从而使蛋白无功能或大大丧失其功能。
术语“基本上相同的”是指核酸或氨基酸序列具有这样的序列变化,其实质上不影响蛋白质的性质(即蛋白质的结构、稳定性特征、底物特异性和/或生物活性)。特别地对于核酸序列,术语“基本上相同的”意指编码区和控制表达的保守序列,并且主要是指在所编码多肽中编码相同氨基酸的简并密码子或编码保守取代氨基酸的备选密码子。对于氨基酸序列,术语“基本上相同的”通常是指在结构或功能决定中不涉及的多肽区域中的保守取代和/或变异。
本文中术语“同一性百分比”和“相似性百分比”也用在氨基酸和核酸序列间的比较中。当涉及氨基酸序列时,“同一性”或“同一性百分比”是指通过序列分析程序,目的氨基酸序列中与被比较氨基酸序列中相同氨基酸相匹配的氨基酸的百分比。“相似性百分比”是指与相同或保守氨基酸匹配的目的氨基酸序列中的氨基酸的百分比。保守氨基酸是结构上不同但物理性质相似的氨基酸,这样彼此的交换将基本上不改变所得蛋白质的三级结构。在Taylor(1986,J.Theor.Biol.119:205)中定义了保守取代。当指核酸分子时,“同一性百分比”是指通过序列分析程序,目的核酸中与相同核苷酸匹配的核苷酸的百分比。
“同一性”和“相似性”可容易地通过已知的方法计算。可使用计算机程序比较核酸序列和氨基酸序列,所述程序比对了核酸或氨基酸的类似序列并且因此确定了差异。在优选方法中,使用本文所用的BLAST程序(NCBI)和参数,并且使用DNAstar系统(Madison,WI)比对基因组DNA序列的序列片段。但是,可通过使用任何标准比对软件获得等同的比对和相似性/同一性评估。例如,也可使用从Genetics Computer Group in Madison,Wisconsin获得的GCG Wisconsin Package版本9.1和该程序使用的默认参数(空位产生罚分=12,空位延伸罚分=4)比较序列同一性和相似性。
“抗体”,如本文使用的,包括多克隆抗体和单克隆抗体、嵌合抗体、单链和人源化抗体以及抗体片段(例如,Fab、Fab′、F(ab′)2和Fv),包括Fab或其他免疫球蛋白表达文库的产物。关于抗体,术语“免疫学特异性”或“特异性”是指结合目的蛋白质的一个或多个表位但基本上不识别和结合样品中其他分子的抗体,所述样品包含混合的抗原性生物分子群。确定抗体的结合特异性的筛选测定法在本领域是熟知的并且得到常规使用。关于该测定法的全面讨论,参见Harlow等人(编著),ANTIBODIES ALABORATORY MANUAL;Cold Spring Harbor Laboratory;Cold SpringHarbor,NY(1988),第6章。
术语“基本上纯的”是指包含按重量计算至少50-60%的目的化合物(例如,核酸、寡核苷酸、蛋白质等)的制品。更优选,制品包含按重量计算至少75%,和最优选按重量计算90-99%的目的化合物。通过适合用于目的化合物的方法(例如,色谱方法、琼脂糖或聚丙烯酰胺凝胶电泳法、HPLC分析法等)测量纯度。
关于单链核酸分子,术语“特异性杂交”是指两个足够互补序列的单链核酸分子之间的缔合,所述足够互补是允许在预先确定的、本领域中常用的条件下进行杂交(有时称为“基本上互补”)。特别地,所述术语是指将寡核苷酸与单链DNA或RNA分子中包含的基本上互补的序列杂交,基本上排除寡核苷酸与非互补序列的单链核酸的杂交。
“编码序列”或“编码区”是指核酸分子,所述核酸分子具有产生(当序列表达时)基因产物例如氨基酸或多肽所需的序列信息。编码序列可在翻译区内包含非翻译序列(例如,内含子或5′或3′非翻译区),或可缺少此类间插非翻译序列(例如,如在cDNA中)。
“内含子”是指核酸中不编码与蛋白质合成相关的编码信息的多核苷酸序列。这些序列被转录成mRNA,但在mRNA翻译成蛋白质之前被除去。
术语“有效连接的”或“有效插入的”是指在相对于编码序列的恰当位置将编码序列表达所必需的调节序列置于核酸分子中,以使编码序列能够表达。例如,当启动子能够调控编码序列的转录或表达时,启动子与该编码序列有效连接。可以以有义或反义方向将编码序列有效连接至启动子或调节序列。术语“有效连接”有时用于其他转录调节元件(例如,增强子)在表达载体中的排列。
转录和翻译调控序列在宿主细胞中提供编码序列表达的DNA调节序列例如启动子、增强子、多腺苷酸化信号、终止子等。
术语“启动子”、“启动子区域”或“启动子序列”通常是指可在编码区的5′或3′侧,或编码区的内部或内含子的内部发现的基因转录调节区。通常,启动子是能够在细胞中结合RNA聚合酶并且起始下游(3′方向)编码序列转录的DNA调节区。典型的5′启动子序列在其3′末端连接转录起始位点和向上游(5′方向)延伸以包含最小数目的碱基或元件,所述碱基或元件对于以高于背景的可检测水平起始转录是必需的。转录起始位点(通过使用核酸酶S1作图方便地确定)和负责RNA聚合酶结合的蛋白质结合结构域(共有序列)在启动子序列内。
“载体”是复制子,例如可有效连接另一种核酸区段从而引起该区段复制或表达的质粒、噬菌体、粘粒或病毒。
术语“核苷酸构建体”或“DNA构建体”有时用于指有效连接至适当调节序列并且被插入到用于转化细胞的载体中的编码序列。这一术语可与术语“转化DNA”或“转基因”互换使用。这样的核酸构建体可包含目的基因产物的编码序列和选择标记基因和/或报道基因。
“标记基因”或“选择标记基因”是其编码的基因产物赋予了这样的特征的基因,所述特征能够使包含该基因的细胞从不包含该基因的细胞中选择出来。用于遗传工程的载体通常包含一种或多种选择标记基因。选择标记基因的类型包括(1)抗生素抗性基因,(2)除草剂耐受性或抗性基因,和(3)使转化细胞能够合成必需成分的带型或营养缺陷型标记基因,所述必需成分通常为氨基酸,且为细胞本来不能产生的。
“报道基因”也是一类标记基因。其通常编码可通过标准实验室方法(例如,酶促活性、荧光)测定或检测的基因产物。
基因的“表达”、“表达的”或“表达”术语是指基因产物的生物合成。该过程包括将基因转录成mRNA,然后将mRNA翻译成一种或多种多肽,并且包括所有天然发生的翻译后修饰。
“内源性”是指可在特定的生物中天然发现的任何要素例如基因或核酸或多肽。
核酸构建体的“异源”区域是在更大的分子内核酸分子的可鉴定区段,所述区段在自然界中未发现与该更大的分子相关。因此,当异源区域包含基因时,所述基因通常位于DNA侧翼,所述DNA通常在来源生物基因组中不位于基因组DNA侧翼。在另一个实例中,异源区域是其中编码序列本身未在天然中被发现(例如,其中基因组编码序列包含内含子或具有与天然基因不同的密码子的合成序列的cDNA)的构建体。等位基因变体或天然发生的突变事件不产生本文定义的DNA的异源区。术语“DNA构建体”,如上面所定义的,也用于指异源区,特别是经构建用于细胞转化的异源区。
当外源性或异源性DNA被引入细胞内时,则该细胞被该DNA“转化”或“转染”。转化DNA可以被或可以不被整合(共价连接)入细胞的基因组。在例如原核细胞、酵母和哺乳动物细胞中,可将转化DNA保持在游离元件例如质粒上。关于真核细胞,稳定转化的细胞是其中转化DNA已整合入染色体内从而使其通过染色体复制由子细胞遗传的细胞。通过真核细胞建立细胞系或克隆的能力证明该稳定性,所述细胞系或克隆由包含转化DNA的子细胞群组成。“克隆”是通过有丝分裂从单个细胞或共同祖先产生的细胞群。“细胞系”是能够在体外稳定地生长许多代的原代细胞的克隆。
“种粒”、“种子”或“豆子”是指开花植物的生殖单位,其能够发育成另一此类植物。如本文所用的,特别是对于咖啡植物,所述术语可同义地使用和可互换使用。
如本文所用的,术语“植物”包括全植物、植物器官(例如,叶、茎、枝条、根)、种子、花粉、植物细胞、植物细胞的细胞器和其后代。要理解本发明范围内的转基因植物的部分包括例如来源于转基因植物或其后代的植物细胞、原生质体、组织、愈伤组织、胚胎以及花、茎、种子、花粉、果实、叶子或根。
术语“渗透胁迫”是指对植物的任何胁迫,其破坏植物细胞或完整植物中的正常水分、糖或电解质浓度。渗透胁迫可以是与环境相关的,例如长期低水分或干燥、低温、霜冻、结冰温度、土壤中的高盐含量等的条件。渗透胁迫也可天然发生,例如预计种子发育和成熟也会发生。
描述:
本发明的一个方面表征了来自咖啡的核酸分子,所述核酸分子编码多种脱水蛋白和一种其他的LEA(胚胎发育后期富集)蛋白。从来自几个中果咖啡(罗巴斯塔咖啡(robusta))cDNA文库的47,000多个表达序列标签(EST)的数据库鉴定编码脱水蛋白和LEA的核酸分子的代表性实例,所述cDNA文库是用RNA制备的,所述RNA是从嫩叶和从在发育不同阶段收获的浆果种粒和果皮组织分离的。鉴定重叠的EST并将其“串成”包含完全的编码序列的单基因(unigene,重叠群)。通过对NCBI(美国国家生物技术信息中心)无冗余蛋白质数据库进行各个序列的BLAST搜索来注释单基因序列。DNA序列分析显示代表3种不同脱水蛋白基因和一种LEA基因的5个独特的序列。这些cDNA本文称为CcDH1a(SEQ ID NO:1)、CcDH1b(SEQ ID NO:2)、CcDH2a(SEQ ID NO:3)、CcDH2b(SEQ IDNO:4)和CcDH3(SEQ ID NO:5)。发现CcDH1a和CcDH1b彼此是等位基因变体,而发现两个不同的单基因编码CcDH2的可读框。此外,从分离自受精后30周的咖啡种粒的RNA构建的cDNA文库分析显示了编码咖啡LEA蛋白质的全长cDNA克隆。该cDNA在此称为CcLEA1(SEQ IDNO:6)。
推导的CcDH1a-CcDH3的氨基酸序列在本文显示为SEQ ID NO:7-11。所述蛋白质具有大约17.8kDa(CcDH1a,SEQ ID NO:7)、18.1kDa(CcDH1b SEQ ID NO:8)、17.4kDa(CcDH2a和CcDH2b,SEQ ID NO:9和10)和21.5kDa(CcDH3,SEQ ID NO:11)的分子量。已发现这些蛋白质包含特征脱水蛋白氨基酸基序,并且根据这些基序对所述蛋白进行了分类。CcDH1a、CcDH1b、和CcDH2(a和b)具有结构Y3SK2,并且CcDH3具有结构SK3。CcDH1a和CcDH1b在所述三个基序的各基序中和两个K基序的各基序前的两个保守区中显示绝对的保守。相反地,CcDH2在所有Y、S和K基序(除了一个以外)中显示点差异(punctual difference),并且在这些脱水蛋白特异性基序之外显示更显著的差异。亲水性图显示本文鉴定的所有咖啡脱水蛋白各部分都非常亲水(参见图8)。
推导的由CcLEA1编码的氨基酸序列在本文显示为SEQ ID NO:12。该蛋白质具有大约39.5kDa的分子量。该蛋白质的亲水性图显示该蛋白质亲水性比脱水蛋白分子低,并且存在2个小的疏水区,其中一个位于其第一个30个N末端残基内。也发现CcLEA1的N末端包含显著的富含脯氨酸的区段。
本发明的另一个方面表征了调控脱水蛋白基因在咖啡中表达的启动子序列和相关元件。如在实施例中更详细描述的,通过PCR辅助引物步测法鉴定了来自CcDH2a的启动子序列(包含在SEQ ID NO:13中)。显示CcDH2启动子包含一些调节元件,所述调节元件类似于之前在其他种类中表征的在种子发育期间参与调节基因表达的那些调节元件。这些CcDH2调节元件显示于图7中和描述于实施例中。通过使用连接至GUS报道基因的该启动子,已确定该启动子对于种子、长角果、子叶、下胚轴和发育幼苗的第一真叶是特异性的。此外,如实施例中所述,也已显示CcDH1和CcDH2基因的表达受到干旱胁迫和其他胁迫条件诱导。
尽管本文描述和举例说明了来自中果咖啡的编码脱水蛋白和LEA蛋白质的多核苷酸,本发明旨在包括来自其他咖啡物种的核酸和所编码的蛋白质,所述核酸和编码的蛋白质与中果咖啡的多核苷酸和蛋白质充分相似从而可与其互换使用,以用于下文描述的目的。因此,当在本文使用术语“脱水蛋白”或“胚胎发育后期富集(LEA)蛋白”时,它们意在包括具有本文描述的一般物理、生物化学和功能特性的所有咖啡脱水蛋白或LEA蛋白质以及编码它们的多核苷酸。
考虑到其序列方面,本发明的编码脱水蛋白和胚胎发育后期富集蛋白的多核苷酸包括可能在不同中果咖啡品种中发现的SEQ ID NO:1-6的等位基因变体和天然突变体,和可能在不同的咖啡物种中发现的SEQ ID NO:1-6的同系物。因为预期这类变体和同系物在核苷酸和氨基酸序列方面具有某些差异,本发明提供了分离的编码脱水蛋白或LEA蛋白质的核酸分子,所述核酸分子编码与SEQ ID NO:7-12中的任一个具有至少大约40%、45%、50%或55%,优选至少大约60、65或70%,更优选至少大约71%、72%、73%、74%、75%、76%、77%.78%、79%或80%,甚至更优选81%、82%、83%、84%、85%、86%、87%、88%、89%和进一步更优选90%、91%、92%、93%、94%、95%,和最优选96%、97%、98%和99%或更高的同一性的各个多肽,并且包含具有与SEQ ID NO:1-6中的任一个具有相同范围同一性的核苷酸序列。因为天然序列变异可能存在于不同咖啡品种和物种的脱水蛋白和LEA蛋白质以及编码它们的基因中,因此本领域技术人员预期发现该水平的变异,同时仍然保持本发明的多肽和多核苷酸的独特性质。这样的预期部分由于遗传密码子的简并性以及由于已知的保守氨基酸序列变异的成功进化而导致的,所述变异基本上不改变编码的蛋白质的性质。因此,认为这些变体和同系物基本上彼此相同并且包含在本发明的范围内。
如所提到的,本发明人已证明某些脱水蛋白或LEA蛋白质基因的表达在咖啡中是种子、长角果和幼苗特异性的,并且可由干旱和其他形式的胁迫诱导。因此,与编码脱水蛋白和LEA蛋白质的基因相关的基因调节序列具有实际功用并且被认为在本发明的范围内。本文举例说明了中果咖啡DH2启动子。中果咖啡DH2基因组序列的上游区域在本文显示为SEQID NO:13,并且包含部分或全部本发明的示例性启动子,尽管如在上文中所示的“启动子”的定义中所解释的,可在基因中的其他位置发现启动子的其他部分。然而,可通过下面描述的方法获得来自任何咖啡物种的脱水蛋白和LEA蛋白质基因的启动子和其他基因调节序列,并且根据本发明使用所述序列。除其他功用以外,可有利地使用控制脱水蛋白和LEA蛋白质基因表达的组织特异性和时间特异性的启动子和调节元件,来改变或修饰多种咖啡物种的渗透胁迫耐受性。
下列部分阐明了涉及实践本发明的一般方法。对于所提及的具体材料来说,只是为了举例说明,而不希望限定本发明。除非另外明确说明,使用一般的生物化学和分子生物学方法,例如Sambrook等人,MolecularCloning,Cold Spring Harbor Laboratory(1989)或Ausubel等人(编著),Current Protocols in Molecular Biology,John Wiley & Sons(2005)中所示的方法。
核酸分子、蛋白质和抗体:
可通过两种常用方法制备本发明的核酸分子,所述方法是:(1)可从适当的核苷酸三磷酸合成它们,或(2)可从生物来源分离它们。两种方法都使用本领域内熟知的方案。
核苷酸序列信息,例如具有SEQ ID NO:1-6的cDNA或SEQ ID NO:13的调节序列的信息,使得能够通过寡核苷酸合成制备本发明分离的核酸分子。可通过在Applied Biosystems 38A DNA合成仪或类似的设备中使用的亚磷酰胺法制备合成的寡核苷酸。按照本领域内已知的方法例如高效液相色谱(HPLC)纯化所得的构建体。由于目前的寡核苷酸合成方法中固有的大小限制的原因,长双链多核苷酸例如本发明的DNA分子必须分阶段合成。因此,可以以几个更小的具有合适的互补性的区段合成长双链分子。可将所产生的互补区段退火,这样各个区段具有用于附着相邻区段的适当的粘性末端。可通过在DNA连接酶存在的情况下将粘性末端退火来连接相邻的片段,从而构建完整的长双链分子。然后可将如此构建的合成DNA分子克隆入合适的载体并在该载体中扩增。
根据本发明,可通过使用适当的严格性的杂交和洗涤条件来鉴定核酸,所述核酸与编码脱水蛋白或LEA蛋白质的多核苷酸的部分或所有编码和/或调节区有适当水平的序列同源性。本领域技术人员将认识到,当用于基因组序列时,上述方法除了使得能够分离编码脱水蛋白或LEA蛋白质的序列外,也使得能够分离与脱水蛋白或LEA蛋白质基因相关的启动子和其他基因调节序列,即使调节序列本身可以不共有足够的同源性来产生适当的杂交。此外,至少部分编码序列的注释使得本领域技术人员能够通过上游或下游基因组步测法确定其余编码序列,以及与目的脱水蛋白或LEA蛋白质相关的启动子或其他基因调节序列。本领域内建立了此类技术。(Mishra RN等人,2002;Rishi AS等人,2004)。
作为典型的举例说明,可按照Sambrook等人的方法,使用杂交溶液进行杂交,所述杂交溶液包含:5×SSC、5×Denhardt′s试剂、1.0%SDS、100μg/ml变性的、片段化的鲑精DNA、0.05%焦磷酸钠和多至50%的甲酰胺。在37-42℃下进行杂交至少6小时。杂交后,如下洗涤滤器:(1)在室温下在2×SSC和1%SDS中进行5分钟;(2)在室温下在2×SSC和0.1%SDS中进行15分钟;(3)在37℃下在2×SSC和0.1%SDS中进行30分钟到1小时;(4)在45-55℃下在2×SSC和0.1%SDS中进行2小时,每30分钟更换溶液。
用于计算实现具有特定的序列同源性的核酸分子之间的杂交所需要的严格性条件的一个通式(Sambrook等人,1989):
Tm=81.5+16.6Log[Na+]+0.41(%G+C)-0.63(%甲酰胺)-600/双链体形式的#bp
作为上式的示例,使用[Na+]=[0.368]和50%甲酰胺,42%的GC含量和200个碱基的平均探针大小,则Tm为57℃。同源性每减少1%,DNA双链体的Tm减少1-1.5℃。因此,通过使用42℃的杂交温度,可观察到具有超过大约75%的序列同一性的靶。使用上述杂交和洗涤溶液,在一个实施方案中,在37℃下进行杂交和在42℃下进行终洗涤。在另一个实施方案中,在42℃下进行杂交和在50℃下进行终洗涤;和在另一个实施方案中,在42℃下进行杂交和在65℃下进行终洗涤。高严格性的条件包括在上述杂交溶液中在42℃下进行的杂交并且在65℃下在0.1×SSC和0.1%SDS中进行10分钟的终洗涤。
可将本发明的核酸以DNA的形式保持在任何方便的克隆性载体中。在优选实施方案中,将克隆保持在质粒克隆/表达载体中,例如pGEM-T(Promega Biotech,Madison,WI)、pBluescript(Stratagene,La Jolla,CA)、ρCR4-TOPO(Invitrogen,Carlsbad,CA)或pET28a+(Novagen,Madison,WI),所有所述载体都可在合适的大肠杆菌(E.coli)宿主细胞中繁殖。
本发明的核酸分子包括可以是单链、双链或甚至三链的cDNA、基因组DNA、RNA和其片段。因此,本发明提供了具有能够与至少一个本发明核酸分子序列杂交的序列的寡核苷酸(DNA或RNA的有义或反义链)。此类寡核苷酸可用作探针,用于在植物组织的测试样品中通过例如PCR扩增来检测编码脱水蛋白或LEA蛋白质的基因或mRNA,或者用于检测在mRNA翻译成蛋白质时或之前编码脱水蛋白或LEA蛋白质的基因表达的正或负调节。其中可将编码脱水蛋白或LEA蛋白质的寡核苷酸或多核苷酸用作探针进行此类测定的方法包括但不限于:(1)原位杂交;(2)Southern杂交;(3)northern杂交;和(4)多种扩增反应例如聚合酶链式反应(PCR,包括RT-PCR)和连接酶链式反应(LCR)。
根据已知方法,可以以多种方式制备由本发明的核酸编码的多肽。如果是原位产生的,则多肽可从适当的来源例如,种子、果皮或其他植物部分纯化出来。
备选地,编码多肽的核酸分子的可获得性使得能够通过使用本领域内已知的体外表达方法产生蛋白质。例如,可将cDNA或基因克隆入适当的体外转录载体例如pSP64或pSP65以进行体外转录,然后在合适的无细胞翻译系统例如小麦胚芽或兔网织红细胞中进行无细胞翻译。体外转录和翻译系统可从例如Promega Biotech,Madison,WI、BRL,Rockville,MD或Invitrogen,Carlsbad,CA商购获得。
根据优选实施方案,可通过在合适的原核或真核系统中表达来产生更大量的脱水蛋白或LEA蛋白质多肽。例如,可将部分或所有DNA分子例如具有SEQ ID NO:1-6的cDNA插入适合用于在细菌细胞(例如大肠杆菌(E.coli)或酵母细胞(例如酿酒酵母(Saccharomyces cerevisiae))中表达的质粒载体或插入用于在昆虫细胞中表达的杆状病毒载体。此类载体包含在宿主细胞中表达DNA所必需的、以一定方式定位的调节元件,所述方式允许所述DNA在宿主细胞中表达。此类表达所需的调节元件包括启动子序列、转录起始序列和任选的增强子序列。
可按照本领域内已知的方法纯化在重组原核或真核系统中通过基因表达产生的脱水蛋白或LEA蛋白质。在优选实施方案中,可使用商购可获得的表达/分泌系统,通过该系统重组蛋白质表达并随后从宿主细胞分泌出来,从而可容易地将其从周围的培养基中纯化。如果不使用表达/分泌载体,备选方法包括通过亲和分离法纯化重组蛋白质,例如通过与特异性结合重组蛋白质抗体的免疫相互作用。这些方法通常为本领域技术人员使用。
可按照标准步骤,分析通过上述方法制备的本发明的脱水蛋白和LEA蛋白质。
可按照已知的方法,使用从咖啡纯化的或重组产生的脱水蛋白和LEA蛋白质,以生成本文定义的多克隆或单克隆抗体、抗体片段或衍生物。也涉及识别和结合本发明的脱水蛋白或LEA蛋白质的片段的抗体,只要所述抗体对于脱水蛋白或LEA蛋白质是特异性的。例如,如果蛋白质分析或Southern和克隆分析(参见下面)表明克隆的基因属于多基因家族,那么可产生制备用于针对合成多肽的成员特异性抗体,所述合成多肽对应于蛋白质的非保守区。
用于本文描述的任一目的的包含本发明抗体的试剂盒也包括在本发明的范围内。通常,此类试剂盒包括对照抗原,对于所述抗原该抗体是免疫特异性的。
脱水蛋白,可能还有LEA蛋白质,参与保护细胞成分免受渗透胁迫(干旱、低温/冷冻、盐)的伤害。因此,预期寻找本文描述的和举例说明的咖啡脱水蛋白和LEA蛋白质在许多种食品和化妆品方面的应用。例如,可使用脱水蛋白或LEA蛋白质改变冷冻食品中的冰核,或以使得能够在后期快速再水合的方式促进蛋白质的干燥。作为另一个例子,可将脱水蛋白或LEA蛋白质用于使皮肤膏状产品水合。此外,近年来发现的抗氧化和脱水蛋白的离子结合性质可证明其在食品和化妆品中具有优势。对于食品应用,值得注意的是,脱水蛋白是高度可溶、极度无结构的蛋白质并且已知它们不具有二硫键。因此,这些蛋白质可能展示非常低的抗原性且将可能被肠中的蛋白酶容易地降解。
可通过使用重组生物(例如,在酵母毕赤酵母(Picia pastoris)中或在食品可用的乳杆菌属(Lactobacilli)中或在植物细胞中),来开发本文描述的编码脱水蛋白和LEA蛋白质的多核苷酸的可用性以产生大量的纯蛋白质,来实现脱水蛋白或LEA蛋白质的一种或多种上述应用,然后在已建立的测定法中就冰的形成、对干燥的影响、再水合和抗氧化潜能检测蛋白质。如果发现特定的纯化的蛋白质是特别有用的,那么也可从确定富含这些特定的脱水蛋白或LEA蛋白质的咖啡种粒中分离这些蛋白质的天然形式。
载体、细胞、组织和植物
根据本发明也表征了用于产生转基因宿主细胞的载体和试剂盒,所述载体和试剂盒包含以有义或反义方向排列的编码脱水蛋白或LEA蛋白质的多核苷酸或寡核苷酸、或其同系物、类似物或其变体,或受到编码脱水蛋白或LEA蛋白质的基因的启动子和其他调节序列控制的报道基因和其他构建体。合适的宿主细胞包括但不限于,植物细胞、细菌细胞、酵母和其他真菌细胞、昆虫细胞和哺乳动物细胞。用于转化多种这些宿主细胞的载体是本领域技术人员熟知的。它们包括但不限于,质粒、噬菌粒、粘粒、杆状病毒、杆状病毒穿梭载体、细菌人工染色体(BAC)、酵母人工染色体(YAC)以及其他细菌、酵母和病毒载体。通常,用于产生转基因宿主细胞的试剂盒包含一种或多种合适的载体和使用该载体来产生转基因细胞的说明书。以下列为例,试剂盒还可包含一种或多种另外的成分,例如用于培养基细胞的培养基、用于进行细胞转化的试剂和用于就基因表达检测转基因细胞的试剂。
本发明包括包含一个或多个拷贝的编码脱水蛋白或LEA蛋白质的基因或抑制植物内源性脱水蛋白或LEA蛋白质产生或功能的核酸序列的转基因植物。这可通过用转基因转化植物细胞来实现,所述转基因包含由天然或重组的调节序列控制的部分编码脱水蛋白或LEA蛋白质的序列、或其突变体、反义序列或变体,包括RNA,如下文所述。转基因植物咖啡物种是优选的,包括但不限于C.abeokutae、小果咖啡、C.arnoldiana、C.aruwemiensis、C.bengalensis、中果咖啡、刚果咖啡(C.congensis)、高产咖啡(C.dewevrei)、埃塞尔萨咖啡(C.excelsa)、C.eugenioides和C.heterocalyx、C.kapakata、C.khasiana、大果咖啡(C.liberica)、C.moloundou、C.rasemosa、C.salvatrix、C.sessiflora、窄叶咖啡(C.stenophylla)、C.travencorensis、C.wightiana和C.zanguebariae。任何物种的植物也包含在本发明中;这些植物包括但不限于,烟草、拟南芥和其他“实验室有利的”物种、谷类作物例如玉米、小麦、稻、大豆、大麦、黑麦、燕麦、高粱、苜蓿、三叶草等,产油植物例如油菜、红花、向日葵、花生、可可等,蔬菜作物例如蕃茄、粘果酸浆(tomatillo)、马铃薯、胡椒、茄子、甜菜、胡萝卜、黄瓜、莴苣、豌豆等,园艺植物例如紫菀、秋海棠、菊花、飞燕草、矮牵牛、百日草、草坪(lawn)和草坪草等。
可使用本领域技术人员已知的标准植物转化方法产生转基因植物。这些方法包括但不限于,农杆菌载体、原生质体的聚乙二醇处理、基因枪DNA递送、UV激光微束、双生病毒群载体或其他植物病毒载体、原生质体的磷酸钙处理、分离的原生质体的电穿孔、在具有用转化DNA包被的微珠的溶液中搅拌细胞悬液、在具有转化DNA包被的硅纤维的溶液中搅拌细胞悬液、直接的DNA摄入、脂质体介导的DNA摄入等。这些方法已在本领域公开。参见,例如,Methods for Plant Molecular Biology(Weissbach和Weissbach,编著,1988);Methods in Plant Molecular Biology(Schuler和Zielinski,编著,1989);Plant Molecular Biology Manual(Gelvin,Schilperoort,Verma,编著,1993);和Methods in Plant Molecular Biology-A Laboratory Manual(Maliga,Klessig,Cashmore,Gruissem和Varner,编著,1994)。
转化方法取决于待转化的植物。通常使用农杆菌载体转化双子叶物种。农杆菌二元载体包括但不限于,BIN19和其衍生物、pBI载体系列和二元载体pGA482、pGA492、pLH7000(GenBank登录号AY234330)和pCAMBIA载体中的任何一种合适的载体(来源于由Hajdukiewicz,Svab &Maliga,(1994)Plant MoI Biol 25:989-994构建的pPZP载体,可从GAMBIA,GPO Box 3200,Canberra ACT 2601,Australia商购获得或可通过CAMBIA.org的国际互联网获得)。对于单子叶物种的转化,使用用转化DNA包被的颗粒和用转化DNA包被的硅纤维进行的生物射弹轰击通常用于核转化。备选地,已成功地将农杆菌“超级二元”载体(superbinaryvector)用于水稻、玉米和多种其他单子叶物种。
用于转化选择的植物的DNA构建体包含有效连接至合适的5′调节序列(例如,启动子和翻译调节序列)和3′调节序列(例如,终止子)的目的编码序列。在优选实施方案中,使用受到其天然5′和3′调节元件控制的脱水蛋白或LEA蛋白质编码序列。在其他实施方案中,为了例如香味、香气或其他特征的表型改良,交换编码脱水蛋白或LEA蛋白质的序列和调节序列(例如,CcLEA1编码序列有效连接至CcDH2启动子)以改变转化植物的种子的水含量或蛋白质含量。
在可选的实施方案中,将基因的编码区置于强组成型启动子例如花椰菜花叶病毒(CaMV)35S启动子或玄参花叶病毒(figwort mosaic virus)35S启动子之下。意图用于本发明的其他组成型启动子包括但不限于:T-DNA甘露碱合成酶、胭脂碱合酶和章鱼碱合酶启动子。在其他实施方案中,使用强单子叶植物启动子,例如玉米泛素启动子、稻肌动蛋白启动子或稻微管蛋白(Jeon等人,Plant Physiology.123:1005-14,2000)。
表达在诱导型启动子控制之下的编码脱水蛋白或LEA蛋白质的序列的转基因植物也意图在本发明的范围内。诱导型植物启动子包括例如四环素阻抑物/控制操纵子的启动子、热激基因启动子、胁迫(例如,创伤)诱导的启动子、防御反应基因启动子(例如苯丙氨酸氨裂合酶基因)、伤口诱导的基因启动子(例如,富含羟脯氨酸的细胞壁蛋白质基因)、化学诱导型基因启动子(例如,硝酸还原酶基因、葡聚糖酶基因、壳多糖酶基因等)和黑暗诱导型基因启动子(例如,天冬酰胺合成酶基因)。
除了本发明的种子特异性脱水蛋白或LEA蛋白质启动子外,组织特异性和发育特异性启动子也意图用于本发明。其他种子特异性启动子的非限定性实例包括Cim1(细胞分裂素诱导的信息(cytokinin-inducedmessage))、cZ19B1(玉米19kDa玉米醇溶蛋白)、milps(肌-肌醇-1-磷酸合酶)和celA(纤维素合酶)(美国申请系列号09/377,648)、豆β-菜豆蛋白、油菜籽蛋白、β-伴大豆球蛋白(β-conglycinin)、大豆凝集素、十字花科蛋白(cruciferin)、玉米15kDa玉米醇溶蛋白、22kDa玉米醇溶蛋白、27kDa玉米醇溶蛋白、g-玉米醇溶蛋白、蜡、shrunken 1、shrunken 2和球蛋白1、大豆11S豆球蛋白(
Figure A20068002473800301
等人,1992)和中果咖啡11S种子贮存蛋白质(Marraccini等人,1999,Plant Physiol.Biochem.37:273-282)。也参见WO00/12733,其中公开了来自end1和end2基因的种子优选的启动子。也可使用其他咖啡属种子特异性启动子,包括但不限于共同拥有的、共同未决PCT申请[仍无受让的(NOT YET ASSIGNED)]中描述的油质蛋白基因启动子。其他组织特异性启动子的实例包括但不限于:用于光合组织中表达的二磷酸核酮糖羧化酶(RuBisCo)小亚基基因启动子(例如,由Marracini等人,2003描述的咖啡小亚基启动子)或叶绿素a/b结合蛋白(CAB)基因启动子;以及当希望在根中表达时,根特异性谷氨酰胺合成酶基因启动子。
也将编码区有效连接至恰当的3′调节序列。在其中不使用天然3′调节序列的实施方案中,可使用胭脂碱合成酶多腺苷酸化区域。其他有用的3′调节区包括但不限于章鱼碱合酶多腺苷酸化区。
将在合适的调节元件控制下的选择的编码区有效连接至核抗药性标记(nuclear drug resistance marker),例如对卡那霉素的抗性。其他有用的选择标记系统包括能赋予对抗生素或除草剂抗性(例如对潮霉素、磺酰脲、草铵膦或草甘磷的抗性)的基因或赋予选择生长的基因(例如,磷酸甘露糖异构酶,其使植物细胞能够在甘露糖上生长)。选择标记基因包括但不限于,编码对抗生素抗性的基因,例如编码新霉素磷酸转移酶II(NEO)、二氢叶酸还原酶(DHFR)和潮霉素磷酸转移酶(HPT)的基因,以及赋予对除草剂化合物抗性的基因,例如,抗草甘磷EPSPS和/或草甘磷氧化还原酶(GOX)、提供对溴苯腈抗性的臭鼻杆菌腈水解酶(Bromoxynil nitrilase)(BXN)、提供对咪唑啉酮抗性的AHAS基因、磺酰脲抗性基因和2,4-二氯苯氧乙酸(2,4-D)抗性的基因。
在某些实施方案中,将本发明包括的启动子和其他表达调节序列有效连接至报道基因。意图用于本发明的报道基因包括但不限于,编码绿色荧光蛋白(GFP)、红色荧光蛋白(DsRed)、蓝绿色荧光蛋白(CFP)、黄色荧光蛋白(YFP)、角海葵属(Cerianthus)橙色荧光蛋白(cOFP)、碱性磷酸酶(AP)、β-内酰胺酶、氯霉素乙酰转移酶(CAT)、腺苷脱氨酶(ADA)、氨基糖苷磷酸转移酶(neor、G418r)、二氢叶酸还原酶(DHFR)、潮霉素-B-磷酸转移酶(HPH)、胸苷激酶(TK)、lacZ(编码α-半乳糖苷酶)和黄嘌呤鸟嘌呤磷酸核糖转移酶(XGPRT)、β-葡糖醛酸糖苷酶(gus)、胎盘碱性磷酸酶(PLAP)、分泌的胚胎碱性磷酸酶(SEAP),或萤火虫或细菌荧光素酶(LUC)的基因。使用许多与本发明实践相关的标准方法,本领域技术人员认识到可行使标记或报道基因的功能的额外序列。
在本领域内增强基因在细胞宿主中表达的额外序列修饰。这些修饰包括除去编码多余的多腺苷化信号、外显子-内含子剪接位点信号、转座子样重复序列和其对对基因表达不利的此类良好表征的序列。可选择地,根据需要,可将编码序列的G/C含量调整至给定的咖啡植物细胞宿主的平均水平,如通过参考在咖啡植物细胞中表达的已知基因所计算的。同样,当可能时,修饰编码序列以避免预测的发夹二级mRNA结构。增加基因表达的另一个备选是使用5′前导序列。翻译前导序列在本领域内是熟知的,包括烟草花叶病毒的5′前导序列(ω)的顺式作用衍生物(ω′)、来自雀麦草花叶病毒、苜蓿花叶病毒和羌菁黄花叶病毒的5′前导序列。
将植物转化,然后就一个或多个性质(包括转基因产物、转基因编码的mRNA的存在或与转基因的表达相关的改变的表型)筛选。应当认识到转化植物中的转基因的表达量以及组织和时间特异性表达模式可根据其插入核基因组的位置而变化。该位置效应在本领域内是熟知的。因此,应当再生几个核转化体并就转基因的表达对其进行检测。
方法:
可以在许多方法中的任一种方法中使用本发明的核酸和多肽,藉此在咖啡植物中表达蛋白质产物,以使所述蛋白质在植物的胁迫耐受中发挥作用,并且在增加最终从表达该蛋白质的咖啡植物咖啡豆生产的咖啡饮料或咖啡产品的香味和/或香气中发挥作用。
对于胁迫耐受性,现在已很好地确定脱水蛋白参与保护植物免受渗透或环境胁迫例如干旱和冷冻的伤害(Allagulova等人,2003)。例如,脱水蛋白在水的保持和渗透调节中起作用,从而保护植物特别是在干旱条件下免于水分丧失。此外,假定脱水蛋白表现出与阳离子相互作用的能力,那么脱水蛋白可在供水有限的时期中结合过量的盐,从而可起到螯合功能。脱水蛋白也在正在发育的种子的细胞干燥过程中在细胞核材料例如染色质的结构完整性上起作用,并且已发现其在冷冻温度下保护植物免受冰晶形成和淀粉降解的伤害中起作用。给定的脱水蛋白功能可与蛋白质在细胞内的定位相关。例如,位于细胞膜外部的脱水蛋白可用于稳定脂类和膜蛋白。(Allagulova等人,2003)。因此,在植物中操控脱水蛋白或LEA蛋白质产生乃至于使用本发明的多核苷酸和蛋白质监控此类基因表达的能力将使得能够在咖啡中研究和操控对干旱、冷冻或盐即渗透的耐受性。该操控可从幼苗萌发开始延续至植物生长和果实和种子发育,直至咖啡豆的收获后贮存稳定性。这一知识使得能够产生被修饰的咖啡植物,所述植物被更好的装配以用于在急性或长期渗透或环境胁迫(例如干燥期、干旱、霜冻或长期冷冻条件下遭遇的胁迫)的条件健康生长和产生作物。因此,本发明的一方面表征了通过调节脱水蛋白或LEA蛋白质在植物中的表达以增强对渗透胁迫的抗性来保护植物(优选咖啡植物)的方法。
对于烘焙的咖啡种粒的香味和香气,预期脱水蛋白和相关的LEA蛋白质对咖啡香味(通过在烘焙期间发生的美拉反应产生的)的生成起到一些影响。蛋白质特别是蛋白质降解产物(肽和氨基酸),代表了重要的香味前体组(Spanier等人,2004)。因此,可期望相对丰富的蛋白质例如脱水蛋白和LEA蛋白质,以对在咖啡烘焙期间发生的香味产生性反应作出了一些贡献。在本文中,这些相对无结构的和非常亲水的以及高度可溶的蛋白质,由于它们的异常结构和/或由于它们与水分子的异常相互作用,可能在美拉反应期间以不同于其他细胞蛋白质的方式反应。众所周知,烹饪反应(例如咖啡的烘焙步骤)期间存在的水的水平也可强烈地影响热诱导的化学反应的途径(Turner等人,2002)。由于脱水蛋白在种粒中对于水分子的组织有贡献,因此脱水蛋白的水平和分布上的多种具体差异可影响烘焙过程中香味的产生。按照本文描述的方法,通过本发明的多核苷酸提供监控(例如,通过标记辅助育种)或操控脱水蛋白和LEA蛋白质表达谱的能力。
因此,本发明的一个方面表征了在植物优选咖啡中改变脱水蛋白或LEA蛋白质谱的方法,其包括增加或减少植物中一种或多种脱水蛋白或LEA蛋白质的量或活性。例如,在本发明的一个实施方案中,使用受到其本身表达控制序列控制的编码脱水蛋白的基因转化植物,用于增加该脱水蛋白在植物中的产量的目的。可选地,将脱水蛋白或LEA蛋白质编码区有效连接至异源表达控制区例如组成型或诱导型启动子。
也可通过在植物中减少一种或多种脱水蛋白或LEA蛋白质的产量或通过筛选具有减少的脱水蛋白或LEA蛋白质表达的天然发生的变体来改变植物种粒中水分子的组织状态或稳定性,或大分子,或细胞器。例如,可产生或从目前可获得的植物突变体的群体选择功能缺失(无效)突变植物。本领域技术人员也认识到,也可通过使用本文描述的一种或多种方法,就过量表达特定脱水蛋白的突变体筛选突变植物群体。可通过化学诱变、辐射诱变和转座子或T-DNA插入或定向诱导基因组局部损伤(targetinginduced local lesions in genome)产生突变群体(TILLING,参见,例如,Henikoff等人.2004,Plant Physiol.135(2):630-636;Gilchrist和Haughn,2005,Curr.Opin.Plant Biol.8(2):211-215)。产生突变群体的方法是本领域内熟知的。
可使用本发明的核酸鉴定多种植物物种中的脱水蛋白或LEA蛋白质突变体。在物种例如玉米或拟南芥中,当可获得转座子插入品系时,可设计寡核苷酸引物以就脱水蛋白或LEA蛋白质基因中的插入筛选品系。通过育种,则可发育对于断裂基因是杂合的或纯合的植物品系。
也将植物改造为表现出与通过诱变技术产生的无效突变体中看到的表型相似的表型。可通过表达选择的脱水蛋白或LEA蛋白质以产生“显性负效应”来产生转基因无效突变体。尽管本发明不限于任何一种机制,但该突变蛋白质将与野生型蛋白质竞争与蛋白或其他细胞因子的相互作用。昆虫和脊椎动物系统的该类型的“显性负”效应的实例是熟知的(Radke等人,1997,Genetics 145:163-171;Kolch等人,1991,Nature 349:426-428)。
可通过“转录后基因沉默”抑制脱水蛋白或LEA蛋白质编码性mRNA的翻译来产生另一种类型的转基因无效突变体。可使用来自被靶向以进行下调的物种的编码脱水蛋白或LEA蛋白质的基因或其片段,来控制编码的蛋白质的产量。可使用全长反义分子用于该目的。可选地,可使用靶向于对翻译关键的mRNA特定区域的反义寡核苷酸。使用反义分子减少预先确定基因的表达水平的用途在本领域内是熟知的。可通过用DNA构建体转化植物细胞来原位提供反义分子,所述DNA构建体,当转录时产生反义RNA。可设计此类构建体以产生全长或部分反义序列。可通过转基因过量产生基因编码序列的有义和反义RNA来增加基因沉默效应,从而产生产生大量dsRNA(例如参见Waterhouse等人,1998,Proc.Natl.Acad.Sci.U.S.A.95:13959-13964)。在这方面,已发现包含对应于至少一个内含子的部分或全部的序列特别有效。在一个实施方案中,通过转基因表达部分或全部脱水蛋白或LEA蛋白质编码序列的反义链。在另一个实施方案中,通过转基因表达部分或全部脱水蛋白或LEA蛋白质编码序列的杂交有义和反义链。
在另一个实施方案中,可通过使用多种其他目前对于植物系统可用的转录后基因沉默(RNA沉默)技术来沉默脱水蛋白或LEA基因。RNA沉默包括通过基于RNA酶H的酶(“切酶”或“切酶样”)将双链RNA(dsRNA)加工成小的21-28个核苷酸片段。将作为siRNA(小干扰RNA)或miRNA(微小RNA)的切割产物整合入以序列特异性方式调节基因表达的蛋白质效应复合体中(关于植物中RNA沉默的综述,参见Horiguchi,2004,Differentiation 72:65-73;Baulcombe,2004,Nature431:356-363;Herr,2004,Biochem.Soc.Trans.32:946-951)。
可化学合成或体外转录和扩增小干扰RNA,然后将其递送至细胞。本领域技术人员将认识到,可通过显微注射(Tuschl T等人,2002)、化学转染(Agrawal N等人,2003)、电穿孔或阳离子脂质体介导的转染(Brummelkamp TR等人,2002;Elbashir SM等人,2002)或本领域可用的任何其他方法进行递送。可选择地,可通过将siRNA的DNA模板插入(例如通过质粒)目的细胞来在细胞内表达siRNA(Tuschl T等人,2002),和可将siRNA特异性靶向选择的细胞。已成功地将小干扰RNA引入植物。(Klahre U等人,2002)。
本发明中,优选RNA沉默方法是使用短发夹RNA(shRNA)。通过常规方法将载体递送入靶细胞,所述载体包含编码特定所需siRNA序列的DNA序列。一旦进入细胞中,所述DNA序列持续地转录成RNA分子,所述RNA分子本身形成环路并通过分子内碱基配对形成发夹结构。这些发夹结构当被细胞加工时,等同于siRNA分子,被细胞用于介导所需蛋白质的的RNA沉默。由Horiguchi,2004(同上)描述了在植物中用于RNA沉默的特定用途的多种构建体。通常,这样的构建体包含启动子、“有义”方向的待沉默靶基因序列、间隔区、靶基因序列的反义序列和终止子。
也可通过“共表达”技术(Vaucheret等人,1998,Plant J.16(6):651-659)产生另一种类型的合成无效突变体。用被靶向抑制的内源性基因拷贝转化植物细胞。在许多情况下,这导致天然基因以及转基因的完全抑制。在一个实施方案中,分离来自目的植物物种的编码脱水蛋白或LEA蛋白质的基因并将其用于转化该相同物种的细胞。
根据本发明也表征了通过任一上述方法产生的突变体或转基因植物。优选,植物能育,从而可用于育种目的。因此,表现出一种或多种上述所需表型的突变体或植物可用于植物育种或直接用于农业或园艺应用。它们也用作研究工具,用于进一步阐明脱水蛋白和LEA蛋白质对形成与水含量和组织相关的咖啡种子的香味、香气和其他特征的参与。为了产生具有改良或组合表型的植物,也可将包含一个转基因或特定突变的植物与包含互补转基因或基因型的植物杂交。
本发明也表征了用于以种子优选方式或种子特异性方式在植物中产生任何选择的异源基因产物的组合物和方法。将目的编码序列置于种子特异性咖啡脱水蛋白或LEA蛋白质启动子或其他种子特异性启动子和其他合适的调节序列的控制下,从而产生种子特异性嵌合基因。可通过本文描述的或本领域内已知的任何转化方法将嵌合基因引入植物细胞。这些嵌合基因和方法可用于在植物中产生许多种目的基因产物,包括但不限于:(1)可检测的基因产物例如GFP或GUS,如上面所例举的;(2)赋予农艺学或园艺学益处的基因产物,例如其酶活性导致微量营养素(例如,前体-维生素A,也称为β-胡萝卜素)或抗氧化剂(例如,抗坏血酸、ω脂肪酸、番茄红素、异戊二烯、萜)产生的基因产物;或(3)用于控制病原体或害虫的基因产物,例如由Mourgues等人,(1998),TibTech 16:203-210描述的基因产物或已知保护植物种子或对病原体有害的其他基因产物。
此外,某些脱水蛋白或LEA基因启动子可用于在种子和长角果中都产生重组蛋白。此外,假定也在干旱和其他胁迫条件下激活某些脱水蛋白基因,那么这些启动子应当显示为在其他组织受到渗透胁迫时,对于指导基因在所述组织(例如成熟的叶)中表达是有用的。后一特征表明使用这些启动子性表达重组蛋白是可行的,特别是在处于成熟的末期(当它们经历衰老和开始变干时)的植物(例如烟草)的叶中。
据认为脱水蛋白是植物抗脱水的防御措施的部分。因此CcDH1和CcDH2基因的诱导可用作存在于植物中的脱水胁迫的量度;即水胁迫的诱导时间和水胁迫水平的量度。因此,脱水蛋白表达可用于就它们的渗透胁迫应答能力筛选植物的群体。
提供下列实施例以更详细地描述本发明。实施例用于举例说明本发明而非限制本发明。
实施例1
用于RNA提取的植物材料
新收获的不同发育阶段的根、嫩叶、茎、花和果实收获自培养在温室条件(25℃,70RH)下的Coffea arabica L.cv.Caturra T-2308和中果咖啡BP409变种(Coffea canephora var.BP409)以及也收获自种植在East Java,Indonesia的田间的中果咖啡BP-409。如下定义发育阶段:小绿色果实(SG)、大绿色果实(LG)、黄色果实(Y)和红色果实(R)。将新鲜组织立即冷冻在液氮中,然后在-80℃下贮存直至用于RNA提取。
实施例2
用于总RNA提取、cDNA产生的方案,和PCR反应条件
将贮存在-80℃的组织样品研磨成粉末,然后使用以前描述的方法(Rogers等人,1999)从该粉末中提取总RNA。按照厂商说明书,使用试剂盒“Qiagen RNase-Free DNase”,用DNA酶处理样品以除去DNA污染。通过甲醛琼脂糖凝胶电泳和溴化乙锭染色后的核糖体RNA条带的目测观察来分析所有RNA样品。使用寡(dT20)作为引物,按照Superscript IIReverse Transcriptase试剂盒(Invitrogen,Carlsbad,CA)中的方案从大约4μg总RNA制备cDNA。为检测cDNA制品中污染性基因组DNA的存在,设计横跨特异性广泛表达的cDNA(查尔酮异构酶)的已知内含子的引物对。PCR反应中基因组片段的不存在表明不存在可检测的基因组DNA污染。使用如上所述制备的小果咖啡和中果咖啡cDNA进行PCR反应。基因特异性引物示于表1。
表1.用于RT-PCR和定量RT-PCR的引物列表
  寡聚物名称(SEQ IDNO.) 5′---->3′序列 寡聚物名称 5′---->3′序列
  Rpl39_正向(SEQ IDNO.23) |TGGCGAAGAAGCAGAGGCAGA   LEA1_正向(SEQ IDNO.31) |CCAATAACAGCTCAAGAATCA
  Rpl39_反向(SEQ IDNO.24) TTGAGGGGGAGGGTAAAAAG   LEA1_反向(SEQ IDNO.32) |TTCCCTTCCATCCCACTCT
  DH1_正向(SEQ IDNO.25) GAAGAAGGGGATGAAGGAG   rpl39-F1(SEQ IDNO.33) |GAACAGGCCCATCCCTTATTG
  DH1_反向(SEQ IDNO.26) TACGGACAAACACACTACAG   rpl39-R1(SEQ IDNO.34) CGGCGCTTGGCATTGTA
  DH2_正向(SEQ IDNO.27) CCTCCAACAACCACCACTG   rpl39-MGB(SEQ IDNO.35) |ATGCGCACTGACAACA
  DH2_反向(SEQ IDNO.28) |rCAAGCGCACAACAAGGTC   DH2a-F1(SEQ IDNO.36) |GGGAGGCACAAGGACAGAGA
  DH3_正向(SEQ IDNO.29) AGGTGGTGGTCAGAAGAAGAC   DH2a-R1(SEQ IDNO.37) |GCTGTGCGCGTGCTGAT
  DH3_反向(SEQ IDNO.30) |GACACACTGGAAAGCTGCTA   DH2a-MGB(SEQ IDNO.38) CAGGAGCACATCGAT
建立PCR反应物(50μL),其包含10μL 100倍稀释的cDNA(除了CcDH2使用10μl1000倍稀释的cDNA组外)、1μM各引物、5μL10×ThermoPol缓冲液(New England Biolabs Beverly,MA)、1μL DMSO、200μM dNTP和2个单位的Taq聚合酶(New England Biolabs Beverly,MA)。循环条件为在94℃下进行2分钟,35个循环(除了CcDH1使用40个循环外):在94℃下进行1分钟,在60℃下进行1分钟和在72℃下进行1.5分钟。最终的延伸步骤为在72℃下进行7分钟。将RT-PCR产物在2%(w/v)的琼脂凝胶上进行分离,然后用溴化乙锭染色。将编码组成型表达的咖啡L39蛋白质(60S核糖体大亚基蛋白质)的CcRL39基因用作半定量对照,以验证各RNA样品以相对相似的效率转录成cDNA。将RPL39基因的扩增用作反转录(使用表1中所示的引物)的阳性对照。
按照厂商(Applied Biosystems,Perkin-Elmer)的方案使用小果咖啡和中果咖啡cDNA以及表1中所示的TaqMan探针进行CcDH2和CcRPL139的定量TaqMan-PCR。25μL反应物包含12.5μLTaqMan
Figure A20068002473800391
Universal Master Mix 2X、20nM TaqMan
Figure A20068002473800392
-MGB探针、80nMTaqMan
Figure A20068002473800393
特异性引物和5μL 1000倍稀释的cDNA。循环条件是在50℃下进行2分钟,在95℃下进行10分钟,然后进行40个循环(94℃下进行15秒,和60℃下进行1分钟)。各反应重复3次。将各cDNA样品中的DH2基因的表达对相同样品中的RPL39基因的表达进行归一化。
实施例3
用于DH2启动子区分离的方案
按照厂商(BD Sciences-Clontech)说明书使用Genome Walker试剂盒分离CcDH2的启动子序列。如所描述的(Crouzillat等人,1996)从中果咖啡BP409变种分离基因组DNA。使用的CcDH2特异性正向基因组步测引物(Genome Walker primer)是:
DH2a引物1-5′TGTGCTCCTGATGCTCTCTGTCCTTGTGC3′(SEQ IDNO.39)。使用Hindlll消化的、连接至基因组步测衔接物序列(GenomeWalker adaptor sequence)的中果咖啡BP409变种基因组DNA分离大约2.1kb的片段。按照厂商的方案,使用Clontech Advantage 2PCR试剂盒,利用0.5μM终浓度的DH2a引物1和基因组步测AP1引物在50μl反应物中进行PCR扩增。使用下列条件进行PCR反应:在94℃下进行2秒和在72℃下进行3分钟(7个循环),在94℃下进行2秒和在67℃下进行3分钟(32个循环),然后在67℃下进行4分钟。然后将获得的主要PCR片段克隆入质粒pCR4-TOPO(Invitrogen)。
纯化包含合适的插入片段的质粒pJMc1并对其插入片段进行完全测序。为验证pJMcl中的插入片段和(pcccs30w8a4)来自相同的基因,使用引物DH2a geneup 5′ATAGTGACCTTAATAGCGATCTTGTTGC 3′(SEQ IDNO.40)和DH2a genelow 5′CCAAATCAAATCAAACCAAGCAAATC 3′(SEQID NO.41)从基因组DNA重新扩增这两个克隆的对应的重叠序列。使用中果咖啡BP409变种基因组DNA和使用Taq(New England Biolabs)及1uM特异性引物(DH2a geneup和DH2a genelow)进行PCR反应。使用下列条件进行PCR反应:94℃进行1分钟,然后进行35个循环(94℃下进行1分钟,58℃下进行1.5分钟,和72℃下进行3分钟),然后在72℃下进行7分钟。然后将产生的主要PCR产物克隆入pCR4-TOPO。纯化包含合适插入片段的质粒pVC1(图7)并对其插入片段进行完全测序。pJMc1和pVC1的基因组片段之间存在5个碱基改变。一个改变在启动子区域,两个改变在内含子,以及两个改变在蛋白质编码序列。在蛋白质编码序列的这些改变中,一个改变是无作用的,另一个改变则导致不同的氨基酸。
实施例4
Southern印迹方案
如前面所述(Crouzillat等人,1996)制备基因组DNA。按照厂商的推荐使用合适的酶(10U/μg)消化5微克来自中果咖啡BP 409DNA的基因组DNA过夜,然后将产物在0.8%的琼脂糖凝胶上进行分离。如前面所述(Crouzillat等人,1996)进行Southern印迹和杂交。使用引物T3+T7,通过第一PCR扩增CcDH2克隆的插入片段cccs30w8a4来产生探针。然后使用“rediprimeTM II random prime labeling system”试剂盒(Amersham)用[32P]dCTP标记该PCR产物。
实施例5
咖啡脱水蛋白cDNA的鉴定和表征
从几个用RNA产生的咖啡文库产生47,000多个EST序列,所述RNA是从嫩叶和从不同的发育阶段收获的浆果的种粒和果皮组织分离的RNA。随后将重叠的EST“串成”“单基因”(即,重叠群),然后通过对NCBI无冗余蛋白质数据库进行各个序列的BLAST搜索来注释单基因序列。使用多种方法就脱水蛋白序列筛选单基因,所述方法包括使用关键词“脱水蛋白”搜索单基因注释,以及通过在咖啡单基因组的tBlastn搜索中使用多种拟南芥和蕃茄脱水蛋白序列搜索单基因注释。多种搜索方法产生几个候选脱水蛋白单基因,并且从文库分离这些单基因中每个的潜在最长cDNA克隆,然后对其进行完全测序(表2)。
表2.编码脱水蛋白和LEA蛋白质的全长中果咖啡cDNA和针对各序列发现的EST的数目。在括号中给出了各质粒的单基因号和分子量:cccl26i7(单基因121870;17.8kDa);cccs30w27m8(单基因121870;18.1kDa);cccs30w8a4(单基因123406;17.4kDa);cccs46w30p1(单基因123405;17.4kDa);cccwc22w11a5(单基因123385;25.1kDa);DavI-59(单基因119994;39.5kDa)。
Figure A20068002473800411
所选择的全长cDNA克隆的DNA序列分析显示了4个代表3种不同的脱水蛋白基因的单一序列。对应的基因称为CcDH1、CcDH2和CcDH3。通过单基因#121870中的两个最长cDNA序列的测序来鉴定CcDH1基因的两个明显的等位基因序列。cDNA克隆CcDH1a和CcDH1b的长度分别为836和896bp。两个ORP序列显示出5个单个碱基改变,并且CcDH1b具有9个碱基的插入。这些差异翻译成6个氨基酸差异。CcDH1a和CcDH1b编码分别具有预测的大约17.8kDa和18.1kD的分子量的172个氨基酸和175个氨基酸的蛋白质。发现两个不同的单基因,#123406和#123405,其编码CcDH2的ORF。单基因#123405(CcDH2b)由2个EST组成并且与单基因序列#123406(CcDH2a)的不同在于内含子序列的存在。当对DH2b的cDNA(cccs46w30p1)的内含子/外显子边界进行更细致的检查时,观察到3′连接具有序列ttatgg/TCG,而通过基因组步测法(参见下面)获得的其他基因组序列具有序列ttatag/T(A)CGG。总之,cDNAcccs46w30p1的内含子序列和基因组DNA中的内含子序列几乎相同。因为在可获得的所有三个基因组内含子序列中没有出现单个碱基改变,所以CcDH2b的3′剪接位点序列的改变似乎可以是该cDNA的异常剪接的原因。756bp cDNA pcccs30w8a4(CcDH2a)编码具有预测为17.4kDa分子量的长为162个氨基酸的蛋白质。发现了CcDH3(#123385)的一个单基因。由CcDH3编码的蛋白质序列表明该833bp cDNA编码具有预测的大约25.1kDa的分子量的227个氨基酸的蛋白质。
将咖啡脱水蛋白的蛋白质序列与无冗余蛋白质数据库中发现的最同源的蛋白质序列比对,也就脱水蛋白特异性氨基酸基序Y、S和K的存在对其进行分析。图1和2显示3个脱水蛋白分成两类,CcCDH1a、CcDH1b和CcDH2a具有结构Y3SK2而CcDH3具有结构SK3。在具有Y3SK2结构的那些蛋白质序列中,CcDH1a和CcDH1b在三个基序的每一个基序中和两K基序的每一个基序之前的两个保守区域中显示绝对的保守性。该观察和存在的小序列差异发生在被比对序列的最少保守区中的事实与CcDH1a和CcDH1b是等位基因的想法一致。相反地,CcDH2a明显与CcDH1不同。尽管CcDH2a具有结构Y3SK2,但其也在几乎所有Y、S和K基序中表现出点差异,并且在这些脱水蛋白特异性基序外表现出更明显的差异。CcDH1和CcDH2编码具有经计算接近中性的pI的蛋白质,并且它们的亲水性图表明这些蛋白质全部都是非常亲水的。由CcDH3编码的蛋白质的经计算pI为微酸性(5.47),并且如图8中的Kyte-Doolittle亲水性图所示该蛋白质也是非常亲水的。
实施例6
编码咖啡LEA蛋白质的cDNA的特征
从来自受精后30周的咖啡种粒制备的RNA构建cDNA文库。从该文库分离编码LEA蛋白质的全长cDNA克隆(Dav1-59)并对其进行测序。将该cDNA克隆重新命名为CcLEA1。此外,就注释为LEA蛋白质的“单基因”搜寻EST数据库。该搜寻产生9个单基因序列,其中一个(单基因#119994)对应于前面分离的CcLEA1的序列(表3)。EST分析表明CcLEA1只在种粒发育的一个时期(开花后30周)强烈而唯一地表达。
表3.注释为LEA蛋白质的中果咖啡单基因序列
Figure A20068002473800431
由CcLEA1编码的蛋白质是358个氨基酸,其具有预测的39.5kDa的分子量。CcLEA1的经计算的pI为微碱性(8.17),并且亲水性图显示尽管该蛋白质不具有显著的疏水区,但其不如三个咖啡脱水蛋白亲水。CcLEA1的前30个N末端残基在此蛋白质中形成了的2个小疏水区之一。图3显示CcLEA1与无冗余蛋白质数据库中发现的3个最同源序列的比对。这些比对的序列的总同一性值只在34.7%(对于拟南芥序列)至47.9%(对于云杉(白云杉)序列)的范围内变化。然而,在这些蛋白质中存在短的、高度保守的区域。所有相关蛋白质序列具有与CcLEA1相对相似的亲水性特征谱,并且一般地,可在N末端的1-25个氨基酸中发现蛋白质最显著的疏水斑。也发现CcLEA1在N端区包含富含脯氨酸的区段,该区段在图3中的其他蛋白质中不存在。
实施例7
在不同的咖啡组织中和咖啡种粒发育期间CcDH1、CcDH2、CcDH3 和CcLEA-1基因的RT-PCR表达
因为EST文库未进行归一化,并将其进行深度取样,因此各单基因中发现的EST数目给出了各取样组织中该基因表达水平的粗略估量。表2(上面)显示了CcDH1和CcDH2在受精后30和46周在种粒中强烈表达,但在果皮文库中未被检测到,且在受精后22周在整个浆果(发育的种粒+果皮)中也未被检测到。CcDH1和CcDH2均在叶中表达,尽管CcDH1可在嫩叶中以高于CcDH2的水平表达。在受精后46周的种粒中,以及在嫩叶中检测到CcDH3的表达,尽管在22周在整个浆果样品中也观察到2个EST。
为了扩展表达数据,对3个咖啡脱水蛋白基因中的每一个基因进行RT-PCR分析。图4显示该分析的结果。CcDH1在小果咖啡种粒的所有检查阶段,以及罗巴斯塔咖啡的最后3个检查阶段中都显著表达,也可在其他受试组织中检测到CcDH1的表达,尽管对于小果咖啡在小绿色果皮和黄色果皮样品,或对于罗巴斯塔咖啡根或叶样品中没有检测到信号。在这些具有CcDH1表达的组织中,小果咖啡花样品似乎具有最高水平的转录物。
在小果咖啡的所有种粒发育阶段和罗巴斯塔咖啡种粒的最后三个阶段检测到相对高水平的CcDH2转录物(图4)。与CcDH1相反,通过RT-PCR在其他研究的组织中未检测到CcDH2转录物。通过TaqMan定量RT-PCR确认在除了种粒的组织中不存在显著水平的CcDH2转录物以及该基因在罗巴斯塔咖啡中的晚期诱导(图5)。将CcDH2的表达与CcRPL39基因(RPL39编码核糖体大亚基蛋白质#39)的组成型表达转录物比较。所述比较显示CcDH2的表达在罗巴斯塔咖啡中逐渐增加,从大绿色阶段直至成熟的红色阶段。相反地,小果咖啡的定量RT-PCR数据显示在大绿色阶段检测到最高水平的CcDH2转录物并且转录物水平随着成熟进程发展有所降低。
CcDH3基因表达的RT-PCR分析显示也在所有小果咖啡种粒样品中和罗巴斯塔咖啡种粒发育的最后3个阶段检测到这些转录物的显著水平(图4)。CcDH3转录物在一些其他组织例如红色果皮、茎和花中的水平和在种粒中的水平几乎一样高。原始数据的检查显示可在所有其他被检查的小果咖啡和罗巴斯塔咖啡的组织中检测到CcDH3转录物。然而,注意到罗巴斯塔咖啡和小果咖啡的前3个果皮阶段的转录物水平之间有显著差异。
也通过RT-PCR估量CcLEA1的表达。获得的数据验证了该基因具有非常独特的表达模式,转录物只在小果咖啡的小绿色阶段和罗巴斯塔咖啡种粒的大绿色阶段检测到(图4)。在任何其他取样的小果咖啡或罗巴斯塔咖啡的组织中未检测到表达。该数据与表3中看到的该基因的EST的分布模式一致,这表明该基因在30WAF的罗巴斯塔咖啡种粒中表达,而不在任何其他种粒、浆果或叶的EST文库中表达。
实施例8
CcDH2启动子的序列分析
CcDH2是适度表达的种粒特异性基因。进行Southern印迹法以确定表达水平是获自具有单/低拷贝数的基因还是获自多拷贝基因。如图6中所示,每次消化只产生一个条带,这表明CcDH2在中果咖啡基因组中可能由单基因编码。
使用引物步测技术分离整合了CcDH2启动子的基因组片段。使用从cDNA cccs30w8a4的中心设计的CcDH2特异性基因组步测引物(DH2a引物1)和Genome Walker试剂盒的AP1引物进行DNA的PCR扩增。产生和克隆位于cccs30w8a4 cDNA序列(中果咖啡)上游1.43kb处的2.1kb基因组片段。从包含基因组和cDNA序列的重叠质粒获得的复合序列的序列分析显示CcDH2基因包含位于ORF区内的单个内含子(231bp)(图7)。该基因启动子区域的进一步分析显示cDNA序列5′末端上游30bp处存在假定的TATA序列。
也在CcDH2基因的5′上游区域中鉴定了几个前面显示的在种子发育期间参与基因表达调节的潜在调节元件。例如,发现与拟南芥ABS应答元件RYACGTGGYR(SEQ ID NO:42)具有相似性的3个区域。发现与“豆球蛋白”盒中的核心区的RY重复(CATGCA(T/a)(A/g)共有显著相似性的两个元件,所述豆球蛋白盒参与调节豆球蛋白类型的贮存蛋白质的表达。也鉴定了两个脱水应答元件/C-重复(DRE/CRT)顺式作用序列基序(G/ACCGAC)的存在。以前已显示在拟南芥和稻中,DRE/CRT基序与DREB/CBF转录因子相互作用以控制所连接基因对脱水和其他胁迫的应答。(Dubouzet JG,Plant J.33:751-763(2003))。此外,在CcDH2的启动子区域鉴定了几个E盒基序(CANNTG),所述基序是贮存蛋白质例如2S蛋白质启动子中的良好确定的组件(Chatthai M,Plant Physiol Biochem 42:417-423(2004))。
实施例9
拟南芥中咖啡脱水蛋白启动子CcDH2的功能分析
检查在CcDH2启动子控制下的编码β-葡糖醛酸糖苷酶(GUS)的报道基因在拟南芥中的表达。
材料和方法
在提供商(Stratagene)描述的条件下使用聚合酶Pfu1和引物:TG-TG698 ttgaagcttGTGGACATGACGGAAGAGGT(SEQ ID NO,:43)和TG-TG743 gcagatctaccatggAGGACTCCTGTTATTAGAAAA(SEQ ID NO,:44)扩增来自pVC1的脱水蛋白DH2启动子序列。
然后用HindIII和BglII切割这样获得的PCR片段,然后将该片段克隆入植物转化载体pCAMBIA1301的HindIII/BglII位点。这将包含脱水蛋白启动子序列和完整的脱水蛋白cDNA 5′非翻译区(大约80bp)的大约1.3kb的片段置于GUS的2bp ATG(GUS的第一外显示子)内。通过测序验证启动子的正确定位。包含新脱水蛋白CcDH2启动子的载体称为pCAMBIA1301UCD2.4。
植物转化。然后使用标准方法将转化载体pCAMBIA1301UCD2.4转化入根瘤农杆菌(Agrobacterium tumefacien)株系EHA105中。由2×35S启动子驱动的潮霉素抗性基因是pCAMBIA1301中的植物选择性标记。使用花器浸蘸法(floral-dip method)(Clough和Bent,1998)进行根瘤农杆菌介导的拟南芥转化(使用质粒pCAMBIAl 301UCD2.4)。
通过将种子种植在包含1mM硝酸钠和50μg/ml潮霉素的0.8%琼脂上来鉴定转化的植物。在种植后7天当植物具有延长的初生根时鉴定转化的幼苗。将幼苗转移至包含0.5×M & S盐的0.8%琼脂中。此后当第二对叶发育时,将植物转移至土壤中,让其生长成熟并结种子(T1)。在一些情况下,萌发T1种子,然后让其生长并结种子(T2)。
GUS染色。GUS染色检测的幼苗和长角果来自T1或T2种子,并且处于不同的发育阶段。通过将5mg X-Gluc溶解在50μl二甲基甲酰胺中,然后将其加入50mM NaPO4 pH7.0(10ml)中来制备GUS染色溶液。使用精细镊,将幼苗从萌发板转移入装有1.0ml GUS染料的1.5ml微量离心管中。将该管转移至干燥器中并在真空下放置10分钟,然后在37℃(在黑暗中)下温育24或48小时。移去染料并用脱色液(70%乙醇)替代。通过将管置于37℃加速清洗。根据组织中色素的量,需要更换几次70%乙醇。在解剖显微镜下观察染色的幼苗和其他组织,并通过数字技术记录图像。在长角果的情况下,从植物中取出长角果,然后用解剖刀打开以允许染料渗入。改进方法中使用的GUS染料以包含0.5%Triton X100。在染色后,通过在乙醇∶醋酸(2∶1)中温育,然后在Hoyer′s Light培养基(60ml水中的100g水合氯醛)中温育来对长角果脱色。在乙醇∶醋酸溶液中预温育具有较幼嫩种子的长角果4小时,具有较老种子的长角果8小时。在Hoyer′sLight培养基中清洗长角果24小时至数天。
结果:
观察用pCam1301UCD2-4转化的拟南芥中GUS的表达。发现GUS表达在子叶中和一周龄的幼苗下胚轴中是丰富的。在两周龄的幼苗中,GUS染色在前两片子叶中仍然丰富,在第一片真叶中水平较低。在根中或在第二对发育的叶中未明显地检测到GUS活性。在成熟的叶中没有检测到表达。在长角果荚(wall)中和发育的种子中也检测到GUS表达。T1系种子的48小时GUS染色使得一些种子对于GUS活性为阳性而其他种子为阴性。
总之,本实施例中提供的数据验证了咖啡脱水蛋白启动子CcDH2驱动所连接基因(在该情况下为GUS)强烈地在种子、长角果和正在萌发的种子的第一子叶和下胚轴中表达。该结果证明本文描述的CcDH2启动子序列包含在植物中驱动种子特异性基因表达所需的所有功能性元件。获得的数据也表明CcDH2启动子可用于驱动基因在未成熟组织例如来源于幼苗的头两片子叶的胚中表达。此外,该数据表明CcDH2启动子在其他组织中被激活,所述其他组织注定将经历干燥,例如长角果。最后,假定拟南芥和咖啡之间进化距离相对很大,本文提供的数据显示咖啡CcDH2启动子在拟南芥中起作用,这暗示着该启动子应当在相对广泛的植物中发挥作用。
实施例10
编码咖啡脱水蛋白CcDH1和CcDH2的基因的渗透胁迫诱导的表达
已知脱水蛋白基因受到多种渗透胁迫形式的诱导。因此,进行评估以确定咖啡CcDH1和CcDH2基因是否由不同的渗透胁迫诱导。
材料和方法:
使用小克隆繁殖的、生长在温室中的小果咖啡catimor树进行脱水实验。所述树为大约3年树龄并且在土壤中生长。在实验前几周,将树全部栽培在温室(大约25℃的温度、大约70%的相对湿度)中,使用自动灌溉每天给树浇水。在实验开始时,3株树用作对照,并每天用水浇灌。另外3株不浇水,从而经历渐进脱水。每一周对每一株树进行2片嫩叶(大小5-8cm,采自植物顶端刚冒出的生长物)取样,然后直接将样品冷冻在液氮中。
RNA提取和cDNA合成。使用Qiagen GmbH(Hilden,德国)的RNEASY
Figure A20068002473800491
Plant mini试剂盒对经历多种胁迫处理和对照的组织样品进行提取。开始时使用液氮冷冻将组织样品在研钵和研杵中研磨以获得粉末。然后按照RNEASY
Figure A20068002473800492
Plant mini试剂盒的方案提取该冷冻粉末中的RNA。简而言之,将最大100mg的冷冻粉末与细胞裂解缓冲液和β巯基乙醇混合。对于显示显著坏死的组织,也加入2μM PMSF。为了消除低水平的污染性基因组DNA,使用(按照提供商所描述的)利用RNEASY
Figure A20068002473800493
Plant mini试剂盒中包含的不含RNA酶的DNA酶进行处理,即,室温下在柱子上进行15分钟处理。结束时,在50μL不含RNA酶的水中从柱子中洗脱RNA。通过在260nm处的分光光度计测量确定RNA的量,并且通过计算260nm/280nm的吸光度比值估计RNA的质量。也通过在1%的琼脂糖凝胶上电泳检验RNA的质量。如下进行这些RNA样品的反转录反应:将大约1μg总RNA和12.4μM寡聚-dT[2.3μl 70μM寡聚-dT(Proligo)]和不含RNA酶的水一起加至13lμL的终体积。在65℃下温育该混合物5分钟。然后,加入7μL 5×缓冲液(TRANSCRIPTOR
Figure A20068002473800494
RT反应缓冲液)、20U RNA酶抑制剂、1mM的四种dNTP(各250μm)和10U的TRANSCRIPTOR
Figure A20068002473800495
反转录酶(Roche,Nutley,NJ)的混合物。在55℃下温育该混合物40分钟。最后,然后向20μL混合物中加入0.5μL RNA酶H(Invitrogen,Carlsbad,CA),然后将反应物在37℃下进一步温育30分钟。按照厂商提供的方案,使用Invitrogen(Carlsbad,CA)的SNAPTM凝胶纯化试剂盒纯化产生的cDNA。
引物和MGB-探针的设计。使用PRIMER EXPRESSTM软件(AppliedBiosystems,Foster City,CA)设计引物和MGB探针组。引物杂交的温度为大约60℃,而MGB探针的杂交温度接近70℃。扩增子的大小为大约80bp。通过PROLIGO合成引物,并且按照厂商说明书(Applied Biosystems,Foster City,CA)合成MGB探针。上面的表1中已表明了CcDH2和Ccrp139的引物和探针的序列。CcDH1的引物是5′CACTGGCACTACTGGAGCCTATG 3′(SEQ ID NO.45)和5′GCTGGGTGGCGTATGCA 3′。CcDH1的MGB探针是5′CTGGAGCACATGGGA 3′(SEQ ID NO.46)。
实时定量RT-PCR。如上所述制备用于这些实验的cDNA。按照厂商(Applied Biosystems,Perkin-Elmer)所推荐的和上面所描述的进行TaqMan-PCR。简而言之,所有反应物为25μL体积,并且包含5μl cDNA、1×TaqMan缓冲液(Applied Biosystems)、5mM MgCl2、dATP、dCTP、dGTP和dUTP每种200μM和0.625个单位的AmpliTaq Gold DNA聚合酶。Applied Biosystems反应缓冲液包含AmpErase
Figure A20068002473800501
UNG(尿嘧啶-N-糖苷酶)和Passive参照染料(ROX TM)以及最优化缓冲组分。使用800nM的基因特异性引物(正向和反向的)和200nM TaqMan探针以及5μL的100倍稀释cDNA(其对应于大约0.01μg的总RNA)进行PCR反应。将反应物在50℃下温育2分钟,然后在95℃下温育10分钟,接着进行40个扩增循环(95℃下进行15秒/60℃下进行1分钟)。进行反应,并且使用GeneAmp 7500序列检测系统(Applied Biosystems)进行分析。对各样品进行3次反应,并且计算平均值。使用相对定量的方法进行定量,对于每个样品,使用核糖体蛋白质rp139组成型表达的mRNA作为内参。为了使用相对定量的方法,需要表明使用特别定义的引物和探针组对不同受试基因序列的扩增效率基本上与参照序列(rp139cDNA序列)的扩增效率相当。为了确定这一相对等量,将包含适当cDNA序列的质粒DNA稀释至1/1000、1/10,000、1/100,000和1/1,000,000倍,并且使用上述的Q-PCR条件,计算各质粒/引物/TaqMan探针组的曲线Ct=f(Log DNA的量)的斜率。提供斜率接近3.32的曲线(代表100%的效率)的质粒/引物/TaqMan探针组被认为是可接受的。使用的质粒/引物/TaqMan探针组都给出了Ct=f(Log DNA的量)的可接受的值。
通过测量GOS基因的基因组特异性引物/探针组的定量PCR扩增信号相对于GOS基因cDNA探针的信号的水平来确定cDNA制品中不存在任何显著水平的残留基因组DNA。
结果:
图9显示当停止浇水(干旱条件)时,温室中生长的小树的叶中CcDH1基因表达的诱导。两周后,DH1的表达在一株水胁迫植物中(植物#4)中被显著诱导。三周后,CcDH1的表达在所有3株水胁迫植物(植物#4-6)中被诱导。诱导是非常显著的,对于植物#4达到超过50的RQ。考虑对照基因rp139相对高的表达,50的RQ代表非常高水平的基因表达诱导,并且强烈地暗示CcDH1在咖啡叶的干旱应答中起着重要作用。图10显示相同组的样品中CcDH2基因表达的诱导。CcDH2的诱导显示与CcDH1应答的一些差异。第一个差异是CcDH2的明显诱导晚于CcDH1,显然最受胁迫的植物(植物#4)在第3周显示诱导,比CcDH1晚一周。当在第4周时,CcDH2已在所有三株水胁迫植物中被诱导。CcDH2对CcDH1的诱导之间的第二个差异是CcDH2诱导的水平显著低于对于CcDH1所观察到的水平。总之,这些结果表明CcDH1和CcDH2不以完全相同的方式被诱导,尽管信号可能重叠,即CcDH1的诱导所需要的信号是CcDH2所需要的,但CcDH2可能需要只有当水胁迫增加时才出现的额外信号。植物#5和#6中的(CcDH2)表达随着水胁迫恶化(随着时间而不浇水)而持续增加,这支持了接近极端失水的条件诱导CcDH2的论点。可选地,CcDH2的表达可能比图10中显示的更显著,但该诱导局限在特定组织中。重要的是,要注意到定期浇水的3株对照植物没有显示出CcDH1或CcDH2的诱导(图9、10;植物#1-3)。
上述结果表明与CcDH1和CcDH2关联的启动子可用于诱导和驱动基因在受到渗透胁迫的组织中表达。例如,这些启动子可用于驱动基因的表达,所述基因能够在精确的时期(当渗透胁迫发生时)提供一些保护以免受该渗透胁迫的伤害,但这在正常条件下并不在大多数组织中发生。根据上述工作也很明显的是,如果目标是在较低的水胁迫下诱导基因,那么可最佳地使用CcDH1的启动子,而对于在更高水胁迫下的基因诱导,当目的是只在相对高的水胁迫条件下诱导重组基因时,使用CcDH2更理想。
为进一步检查不同渗透胁迫条件的影响,我们检查低温和提高的NaCl水平对CcDH1和CcDH2表达的影响。我们也已检测了与渗透胁迫信号转导相关的激素(脱落酸-ABA)的效应。对于这些实验,我们使用生长在固体培养基(培养皿平板中的固体培养基B0.3)上的体外咖啡微体扦插(microcutting)。对于使用低温和ABA的实验,我们在B0.3板上生成罗巴斯塔咖啡品种ThB4的微体扦插(16小时光周期)。当这些微体扦插足够大时,将它们转移至新的培养基/平板并在24℃下再温育7天(16小时光周期)。在T=0时,将一组平板转移至5℃下进行7天(16小时的光周期)。将另一组这些微体扦插置于具有ABA的培养基(培养基B0.3+100μM ABA)上在24℃下进行7天(16小时的光周期)。将在T=0和T=7天(5℃和ABA)采集的样品在-80℃下冷冻,然后提取RNA用于上述QRT-PCR分析。起始材料的T=0样品获得的表达结果表明CcDH1具有RQ=1.17。其他实验已显示在微体扦插中,CcDH1的基线水平可从RQ0.05至大约RQ1之间变化。该相对广泛的分布表明更高水平代表检测到用于本实验的起始材料中检测到的轻微渗透胁迫(可能与材料固定到固体培养基上的好坏和/或影响相对湿度的平板密封的好坏相关,以及与起始材料的准确年龄相关)。然而,保持在5℃下7天的样品显示没有CcDH1的诱导,事实上,CcDH1的水平通常降低至RQ=0.16,这一水平与在无胁迫的微体扦插中更经常看到的表达水平更接近。
与上面所示的关于CcDH1的数据相反,在T=0未检测到CcDH2的表达。然而,在5℃下7天后,检测到CcDH2的RQ=0.022。后一观察显示冷冻条件可微量诱导CcDH2。要注意到,5℃对咖啡是非常低的温度,因此下述是可能的,即如果冷胁迫的温度稍微更高(8-15℃),那么CcDH2的诱导可更显著。最后,用100μm ABA处理7天的微体扦插显示CcDH1的表达显著增加(RQ,6.99)。后一结果表明ABA参与CcDH1诱导的信号转导。相反地,ABA不产生任何可检测的CcDH2表达,这表明单独的该激素不足以诱导CcDH2至任何可检测的程度。
为了检测盐的影响,我们将250mM NaCl加入固体培养基B0.3。在T=0时,将一组来自罗巴斯塔咖啡FRT35的微体扦插置于B0.3培养基或具有250mM NaCl的B0.3培养基上,并且置于24℃(16小时的光周期)。在T=0和在第4和第7天时,采集样品并将其在-80℃下冷冻以待之后的上述QRT-PCR分析。获得的结果显示,在对照中,CcDH1的水平在开始时相当低,并在整个实验中保持低水平(对照-T=0,RQ=0.2;T=4天,RQ=0.07;T=7天,RQ=0.38)。在受试处理中,CcDH1的水平在处理的第4天和第7天显著上升(250mM NaCl--T=4天,RQ=3.31;T=7天,RQ=4.46)。该实验显示提高盐浓度可诱导DH1表达至显著的水平,尽管不如在水胁迫下在植物的叶中看到的高。在250mM NaCl存在的情况下在,在T=4或T=7天的样品中都没有看到CcDH2表达的显著诱导。
参考文献:
Agrawal N,Dasaradhi PVN,Mohmmed A,Malhotra P,Bhatnagar RK,Mukherjee SK:RNA interference:Biology,mechanism,and applications.Microbiol.Mol Biol.Rev.67:657-685(2003).
Allagulova,CR,Gimalov,FR,Shakirova,FM,Vakhitov,VA:The plantdehydrins:Structure and putative functions.Biochemistry-Moscow 68:945-951(2003).
Alsheikh,MK,Heyen,BJ,Randall,SK:Ion  binding properties of thedehydrin ERD14 are dependent upon phosphorylation.J.Biol.Chem.278:40882-40889(2003).
Baumlein H,NIVRIDWU:Cis-analysis of a seed protein gene promoter:the conservative RY repeat CATGCATG within the legumin box isessential for  tissue-specific expression of a legumin gene.Plant J.2:233-239(1992).
Brummelkamp TR,Bernards R,Agami R:A system for stable expressionof short interfering RNAs in mammalian cells.Science 296:550-553(2002).
Chatthai M,FBYDSIOLOMMS:2S storage protein gene of Douglas-fir:characterization and activity of promoter in transgenic tobacco seeds.Plant Physiol Biochem 42:417-423(2004).
Choi,DW,Close,TJ:A newly identified barley gene,Dhn12 encoding aYSK2 DHN,is located on chromosome 6H and has embryo-specificexpression.Theoretical and Applied Genetics 100:1274-1278(2000).
Close,T:Dehydrins:emergence of a biochemical role of a family of plantdehydration proteins.Physiol.Plant 97:795-803(1996).
Close,TJ:Dehydrins:a commonality in the response of plants todehydration and low temperature.Physiol.Plant 100:291-296(1997).
Clough,SJ和Bent AF:Floral dip:a simplified method forAgrobacterium-mediated transformation of Arabidopsis thaliana.PlantJournal 16;735-743(1998).
Crouzillat,D,Lerceteau,E,Petiard,V,Morera,J,Rodriguez,H,Walker,D,Philips,WRR,Schnell,J,Osei,J,Fritz,P:Theobroma cacao L.a geneticlinkage map and quantitative trait loci analysis.Theor.Appl.Genet.93:205-214(1996).
Dubouzet JG,SYIYKMDEMSSMSKY-SK:OsDREB genes in rice,Oryzasativa L.encode transcription activators that function in drought-,high-salt-and cold-responsive gene expression.Plant J.33:751-763(2003).Dure,L,Greenway,S,Galau,G:Biochemistry 20:4162-4178(1981).
Dure,L:Structural motifs in LEA proteinsof higher plants.In:Close,T.J.Bray,E,和A.(编著),Response of Plants to Cellular Dehydration DuringEnvironmental Stress,第91-103页.American Society of PlantPhysiologists,Rockville,MD.(1993).
Elbashir SM,Harborth J,Weber K,Tuschl T:Analysis of gene function insomatic mammalian cells using small interfering RNAs.Methods26:199-213(2002).
Godoy,JA,Lunar,R,Torres-Schumann,S,Moreno,J,Rodrigo,M,Pintor-Toro,JA:Expression,tissue distribution and subcellular localizationof dehydrin TAS14 in salt-stressed tomato plants.Plant Mol.Biol.1921-1934(1994).
Hara,M,Terashima,S,Fukaya,T,Kuboi,T:Enhancement of cold toleranceand inhibition of lipid peroxidation by citrus dehydrin in transgenictobacco.Planta 217:290-298(2003).
Hara,M,Fujinaga,M,Kuboi,T:Radical scavenging activity and oxidativemodification of citrus dehydrin.Plant Physiology and Biochemistry 42:657-662(2004).
Iida,K,Seki,M,Sakurai,T,Satou,M,Akiyama,K,Toyoda,T,Konagaya,A,Sinozaki,K:Genome-wide analysis of alternative pre-mRNA splicing inArabidopsis thaliana based on full-length cDNA sequences.Nucleic AcidsResearch 32:5096-5103(2004).
Ingram,J,Bartels,D:The molecular basis of dehydration tolerance inplants.Annu.Rev.Plant Physiology Plant Mol Biol 47:377-403(1996).
Iwasaki,T,Yamaguchi-Shinozaki,K,Shinozaki,K:Identification of acis-regulatory region of a gene in Arabidopsis thaliana whose introductionby dehydration is mediated by abscisic acid and requires protein synthesis.Molecular and General Genetics 247:391-398(1995).
Klahre U,Crete P,Leuenberger AS,Iglesias VA,Meins F:High molecularweight RNAs and small interfering RNAs induce systemicpost-transcriptional gene silencing in plants.Proc.Natl.Acad.Sci.USA99:11981-11986(2002).
Koag,MC,Fenton,RD,Wilkens,S,Close,TJ:The binding of maize DHN1 tolipid vesicles.Gain of structure and lipid specificity.Plant Physiology 131:309-316(2003).
Marraccini P.Deshayes A.Pétiard V.and Rogers W.J.1999.Molecularcloning of the complete 11S seed storage protein gene of Coffea arabica andpromoter analysis in the transgenic tobacco plants.Plant Physiol.Biochem.37:273-282.
Marraccini P,Courjault C,Caillet V,Lausanne F,LePage B,Rogers W,Tessereau S和Deshayes A.2003.Rubisco small subunit of Coffea arabica:cDNA sequence,gene cloning and promoter analysis in transgenic tobaccoplants.Plant Physiol.Biochem.41:17-25.
Matsuyama,T,Yasumura,N,Funakoshi,M,Yamada,Y,Hashimoto,T:Maizegenes specifically expressed in the outermost cells of the root cap.PlantCell Physiol.40:469-476(1999).
Mishra RN,Singla-Pareek SL,Nair S,Sopory SK,Reddy MK:Directional genome walking using PCR.Biotechniques.33:830-834(2002).
Moore,R,McClelen,C:Ultrastructural aspects of cellular differentiation inthe root cap of Zea mays.Can.J.Bot.61:1566-1572(1983).
Nylander,M,Svensson,J,Palva,ET,Welin,BV:Stress-induced accumulationand tissue-specific localization of dehydrins in Arabidopsis thaliana.PlantMolecular Biology 45:263-279(2001).
Puhakainen,T,Hess,MW,Makela,P,Svensson,J,Heino,P,Palva,ET:Overexpression of multiple dehydrin genes enhances tolerance to freezingstress in Arabidopsis.Plant Molecular Biology 54:743-753(2004).
Rishi AS,Nelson ND,Goyal A:Genome walking of large fragments:animproved method.J.Biotechnol.111:9-15(2004).
Roberts,J,DeSimone,N,Lingle,W,Dure,L:Cellular concentrations andunifomity of cell-type accumulation of two LEA proteins in cotton embryos.Plant Cell 5:769-780(1993).
Rogers,WJ.Bézard,G.Deshayes,A.Meyer,I.Pétiard,V.Marraccini,P.(1999).Biochemical and molecular characterisation and expression of the11S-type storage protein from Coffea arabica endosperm.Plant Physiol.Biochem.37(4):261-272.
Shirsat A,WNCRBD:Sequences responsible for the tissue specificpromoter activity of a pea legumin gene in tobacco.Molecular and GeneralGenetics 215:326-331(1989).
Skriver,K,Mundy,J:Gene expression in response to abscisic acid andosmotic stress.Plant Cell 2:503-512(1990).
Soulages,JL,Kim,K,Arrese,EL,Walters,C,Cushman,JC:Conformation ofa group 2late embryogenesis abundant protein from soybean.Evidence ofpoly (L-proline)-type II structure.Plant Physiology 131:963-975(2003).Spanier,AM,Flores,M,Toldra,F,Aristoy,MC,Bett,KL,Bystricky,P,Bland,J:Meat flavor:contribution of proteins and peptides to the flavor ofbeef.Adv.Exp.Med.Biol.542:33-49(2004).
Turner,J,Linforth,R,Taylor,A:Real-time monitoring of thermal flavorgeneration in skim milk powder using atmospheric pressure chemicalionization mass spectrometry.J.Agric.Food Chem 50:5400-5404(2002).
Tuschl T,Borkhardt A:Small interfering RNAs:A revolutionary tool forthe analysis of gene function and gene therapy.Mol.Interventions.2:158-167(2002).
Wise,M,Tunnacliffe,A:POPP the question:what do LEA proeins do?Trends Plant Sci.9:13-17(2004).
Zhu,B,Choi,DW,Fenton,R,Close,T J:Expression of the barley dehydrinmultigene family and the development of freezing tolerance.Molecular andGeneral Genetics 264:145-153(2000).
所述核酸和多肽的序列
CcDH1a cDNA(见SEQ ID NO:1)和所编码的蛋白质(见SEQ IDNO:7)
Figure A20068002473800581
CcDH1b cDNA(见SEQ ID NO:2)和所编码的蛋白质(见SEQ ID NO:8)
Figure A20068002473800601
CcDH2a(见SEQ ID NO:3)和所编码的蛋白质(见SEQ ID NO:9)
Figure A20068002473800602
Figure A20068002473800611
CcDH2b cDNA(见SEQ ID NO:4)和所编码的蛋白质(见SEQ ID NO:10)
Figure A20068002473800612
CcDH3 cDNA(见SEQ ID NO:5)和所编码的蛋白质(见SEQ ID NO:11)
Figure A20068002473800631
CcLEA1 cDNA(见SEQ ID NO:6)和所编码的蛋白质(见SEQ ID NO:12)
Figure A20068002473800641
Figure A20068002473800651
CcDH2a全序列,其包括启动子(碱基1-1324,见SEQ ID NO:13),编码序列(见SEQ ID NO:3)和所编码的蛋白质(见SEQ ID NO:9),内含子I(1642)··(1866)
Figure A20068002473800652
Figure A20068002473800661
Figure A20068002473800671
本发明不限于以上描述和举例的实施方案,其变化和修改也包含在所附权利要求的范围内。
序列表
<110>康乃尔研究基金会
     雀巢技术公司
<120>来自咖啡的脱水蛋白基因和启动子
<130>NO 7972/WO
<150>U.S.60/696890
<151>2005-07-06
<160>46
<170>PatentIn版本3.3
<210>1
<211>880
<212>DNA
<213>中果咖啡(Coffea canephora)
<400>1
gtgggaagaa gtcctatcgg tctctgatct ttcacctttc gttaatttgt gttcgatatt     60
ctactcccgc tagtagttga aatttggcaa ttaagatggc gcaatacggg gctgaatatg    120
gcaaccaaaa gagccagtac gatgagtacg gaaacccagt tcgtcagaca gacgaatatg    180
gtaaccctgc ccgccatgga ggtaccatgg gtgattatgg aaccactggc actactggag    240
cctatggtgg cacaactgga gcacatggga cttatgcaac tggaaccacc ggcactaccg    300
gtaccggtgc atacgccacc cagcctggca ctgatgtggg gaaggagcac catggccttg    360
gtggcatgct tcatcgctct ggcagcggta gctctagctc gtccgaggat gatgggcaag    420
gcgggaggag gaagaagggg atgaaggaga agataaagga gaaactgcct ggcggtcaca    480
aggaggctca acctggacaa gaatattcga gtgctactgc agctcctgga tacggcgggg    540
aaggagtgca gcacgagaag aaaggaatta tggataaaat caaggagaaa ttaccagggg    600
gtcaccacaa ctgaagatct aattctaata aatattggtc cgattatgat attgtgtacc    660
cctgttttca atctcaatct cgttcgtgtc gcgtttgtgt tttctgagat ttgagtgtgt    720
ggacgtcttg agtttctgta attggaataa aagatgattc gtcttcgtct tcgtggactc    780
tgtagtgtgt ttgtccgtat attcggcgtc ttgtactcgg gtcatctggt catgtatgta    840
acatgttata tatcaaatac gtgaagtttt gcgttaaaaa                          880
<210>2
<211>901
<212>DNA
<213>中果咖啡
<400>2
gtgggaagaa gtcttatcgg tctctgatcc ttcacctttc gttaatctgt gttctatatt     60
ctacttccgc tagtagttga aatttggcaa ttaagatggc gcaatacggg gctgaatatg    120
gcaaccaaaa gagccagtac gatgagtacg gaaacccagt tcgtcagaca gacgaatatg    180
gtaaccctgc ccgccatgga ggtaccatgg gtgattatgg aaccactggc actactggag    240
cctatggtgg cacaactggg acagctggag cacatgggac ttatgcaact ggaaccaccg    300
gcactaccgg taccggtgca tatgccaccc agcctggcac tgatgtgggg aaggagcgcc    360
atggccttgg tggcatgctt catcgctctg gtagcggtag ctctagctcg tccgaggatg    420
atgggcaagg cgggaggagg aagaagggga tgaaggagaa gataaaggag aaactgcctg    480
gcggtcacaa ggaggctcaa cctggacaag aatattcgag tgctactgca gctcctggat    540
acggcgggga aggagagcag cacgagaaga aaggaattat ggataaaatc aaggagaaat    600
taccaggggg tcaccgcaac tgaagatcta attctaataa atattggatc caattatgat    660
atcgtgtacc cctgttttca atctcaatct cgttcgtgtc gcgtttgtgt cttctgagat    720
ttgagtgtgt gggcgtcttg agtttctgta atcggaataa agatgattcg tcttcgtctt    780
cgtcttcgtc ttcgtggact ctgtagtgtg tttgtccgta tattcggcgt cttgtactcg    840
ggtcatctgg tcatgtatgt aacatgttat atatcaaata cgtgaagttt tgcgttaaaa    900
a                                                                    901
<210>3
<211>761
<212>DNA
<213>中果咖啡
<400>3
ctaaaattcg tcaaccccaa gtctcaggct accttaattt cagtgccctt tttctttatt     60
tttttctaat aacaggagtc ctggaaaatg gctgacttgc gtgatgaata tggaaatcct    120
atgcagttga ccgaccagta tggcaacccg gttcagctca aggacgagta tggcaaccca    180
atgcagctta gcggtgtagc tatcaccgcc gggacggcta gtgctgtcca ttctactgga    240
accggaccaa ctgctgccac tggaacccag caacatcagg agcagcttca tcggtctagc    300
agctcaagct ctggctcgtc ggaggatgat ggacaaggag gaagaagaaa gaaaaaaggg    360
ttgaaagaaa agataaagga gaaactaacg ggcgggaggc acaaggacag agacgatcag    420
gagcacatcg atgatcagca cgcgcacagc gcctctcctc caacaaccac cactggcagc    480
gggacgtcta ctacagtcgg gggtcagcag catgaaaaga agagcatggt ggagaagatt    540
atggaaaagc tccctggcca tcacgacacc cgctagttac ctaccacaac atactgtgat    600
catcgtgtaa aatctctcct gatgcctagg aaatctagat tatgttaggc attttgtttg    660
gtatgtatgt gtgattaaga ccttgttgtg cgcttgaatc ttgaacgtgc atgggatttg    720
cttggtttga tttgatttgg tgaaataagt tgtactaaaa a                        761
<210>4
<211>959
<212>DNA
<213>中果咖啡
<400>4
ctaaaattcg tcaaccccaa gtctcaggct accttaattt cagtgccctt tttctttatt     60
tttttctaat aacaggagtc ctggaaaatg gctgacttgc gtgatgaata tggaaatcct    120
atgcagttga ccgaccagta tggcaacccg gttcagctca aggacgagta tggcaaccca    180
atgcagctta gcggtgtagc tatcaccgcc gggacggcta gtgctgtcca ttctactgga    240
accggaccaa ctgctgccac tggaacccag caacttcagg agcagcttca tcggtctagc    300
agctcaagct ctggctcggt gagatacttg ccaagttaca atgtgtgtgt ctgtgtgtgt    360
ataatgcgcc atcataattg tttgcttgac agatcctgtt aataatgaac cgtaatttga    420
cgtaaagtgt acacgttttg tttttctggg acttacataa tatcgaatca ggctcctgtt    480
gaatttgaat gttgttagct aaaagaaaat tttggtggct gagttgttga atttggttta    540
tggtcggagg atgatggaca aggaggaaga agaaagaaaa aagggttgaa agaaaagata    600
aaggagaaac taacgggcgg gaggcacaag gacagagacg atcaggagca catcgatgat    660
cagcacgcgc acagcgcctc tcctccaaca accaccactg gcagcgggac gtctactaca    720
gtcgggggtc agcagcatga aaagaagagc atggtggaga agattatgga aaagctccct    780
ggccatcacg acacccgcta gttacctacc acaacatact gtgatcatcg tgtaaaatct    840
ctcctgatgc ctaggaaatc tagattatgt taggcatttt gtttggtatg tatgtgtgat    900
taagaccttg ttgtgcgctt gaatcttgaa cgtgcatggg atttgcttgg tttgaaaaa     959
<210>5
<211>835
<212>DNA
<213>中果咖啡
<400>5
attttttgct gtttcctgtt acattctgct ttacgtacat ccatcagcaa aatggccgag     60
tatgatcaga gtaacatcaa ggttgaggag ggatcagctg tcgaggccac ggatcgcgga    120
ctcttcaact tgggcaagaa agaggaagtg aagaagtgtg atcaaggcca ggccatctct    180
gcggagtttg atgagaaagt gcgtgtttct gaaccagaca aggaggaggg aaagaagcat    240
ggtggtcttc tcgagaagct ccaccgatct ggtagcagct ccagcagctc aagtgaggaa    300
gaagtagaag agggtggtga gaagaagaag aaaaagaagg aaaagaaggg tttgaaggac    360
aagatcaagg agaagatatc gggtgataag aaggacgaag aaaaggttga aaaatgtgag    420
gaagacacgt ctatcccagt tgagaaatat gccgaaccgg cccatgcaga tgctgctcat    480
gaaccagagg agaaaaaggg cttcttagat aagatcaagg agaaactacc aggtggtggt    540
cagaagaaga ctgaggaagt cgcagcagca gcaccgcctc ctcctccggc agagtgcacc    600
gccactgaag gtgaggccaa ggataagaag ggattcttgg acaagatcaa ggagaagctc    660
cctggctacc atcccaagac tgaagaagag aaggaaaagg agaaggaaaa agaaaaggag    720
gctggatgcc attaataaaa gagcaaagca aattaatagc agctttccag tgtgtcataa    780
ttttgcattt ggattaatac attttggagt ggcaatgatc tttttatttt aaaaa         835
<210>6
<211>1232
<212>DNA
<213>中果咖啡
<400>6
acgaacatca tcggtaccag tttcctattc atacatcatc ttactagcac tgatgcaaaa     60
aatgactcct ctgagatgca tcaatttcat ttttctggcc ttttgggttc ctgctgtcct    120
cgcggtgatg gccgaaaaac ccctagttcc tacataccta atccccaaac cccctccacc    180
gccatcgcca gtgaaaccat cagtacccgt gatacctgtc aaaccccgaa tcgtgagatg    240
ccgctccaca ttgtttcctc tctgcttcaa tatccccttc gtttgcccct tagactgtct    300
taccaactgt ttagtggact gtgtcacctg caaggcttac tgcagttgca actttcccgg    360
cgctgtttgt caggatccac gattcgttgg gggcgatggc aacacatttt acttccatgg    420
ccgcaaggat caggacttct gcctggtttc ggataccaat cttcatgtaa atggtcattt    480
cattggcaaa agaaaaccta atttgcgcag agacttcact tgggtgcagg ccattggaat    540
aatgttcgac gaccacagaa tcctcgtggc cgcaaaaagg acttcaacgt gggacgacaa    600
tgtggatcga ctcgctatat ccattgatgg aaatccgatt tccctcccca ctgaagaagg    660
atccaaatgg caacttccgg ccccgtccaa tgtcagtatc atgagaacaa gcaacaataa    720
cggacttgtg gttgaagccg tgaacaattt caggatcacc gccaatgtgg ttccaataac    780
agctcaagaa tcaaaagttc atggttatga cattactgat gaggattgct ttacccattt    840
ggagcttggg ttcaaattct tcaacatcac cgattcaact gatggagttc tgggacaaac    900
ctataggagc gattacgtga acaaaatgaa ggtgaatgcg gtaatgccag tcatgggcgg    960
tgaccgtaag tacttgactt cgggactttt tagtgccgat tgtgctgttt ctcgctttgg   1020
tgggaaggtt cttgagaaag ccaattctgc ttctcctgtg catgagtatc cagccttgaa   1080
ctgcaagagt gggatggaag ggaatggctt ggtttgcaaa aaataattaa gttgctacag   1140
agcatgttgt atgctgaatg atgagctata aataattgag tttcagaaaa gtcttattag   1200
aaatgaagtg atcatagctt tacatgcaaa aa                                 1232
<210>7
<211>2288
<212>DNA
<213>中果咖啡
<220>
<221>启动子
<222>(1)..(1324)
<223>CcDH2a的启动子
<220>
<221>外显子
<222>(1414)..(1641)
<223>CcDH2a的外显子I
<220>
<221>内含子
<222>(1642)..(1866)
<220>
<221>外显子
<222>(1867)..(2121)
<223>CcDH2a的外显子II
<400>7
atagtgacct taatagcgat cttgttgctt ttgatcgtca gaaaagtagt ggacatgacg     60
gaagaggtcc taagatgagt tccagttcca gcatgaaggg ctctttggcg aagcctttct    120
tgaggcgtca cttttctttt ggatctaaag gcagtagatc aatgtcagag aatcattctt    180
cctggaagag gggattcttc tgggcaaaat cgagaaagga ttaagttctg tctagagtta    240
caaaggtgag caacagtcac ggttttttat tagggaatgg aaggattgga tcccttttca    300
cgtagtgaac aacatatatt ttgcatggtt ggtcttagta cctataacac gaaaatgttc    360
ttcatccgtt ctattaatca ttaggcttta gtcatttaaa ttttttacat cccgcatttc    420
tcctcttgat tcttgttgat ttctgcagat tccacagttg ttcttcagat gggctacgaa    480
atgcatgcag ggagcaggca atcagccata aattcaaccc tgtcaaggaa gctggcattg    540
tctcgtgcaa atgtaggtta gcttttgaag atacactgca aagggaagac catacagatg    600
gggaaatgaa ttcattataa tataggaaaa aggaaagatg ataggggtca gggcgtccgt    660
gcatcatgaa actagttctc tttcattttg tacgatggct gtttactgtt taatttcatg    720
aaattagttt ggatatatgc gtagcgtttt accatcgcat ttctaaatcg atattctatg    780
ggccgaatta cgcgttggag acatcattgg gttgctcctc tcaatcccat ctctatctat    840
tgacggatcc ggatcatgat gttgaacctt tcaacttttg acttagatgg gatttgtgtt    900
cgcgtgttgt taacttgtta ctgaccgact cagaagacag cggattctga cttcaccacg    960
tgtctcttta gtgaaaattt aaaaggcatt tttcttctgt tcatagttta aaatgtaatg   1020
tgattattaa aagatcgttt ggtattattt caaggatgga tggattggat ggaagggata   1080
tctgatatat atcataccct tccaaaattc aggaccatga cgtatttaat atcccccagc   1140
ggaagacacg tgccttgatg tcttataggt ggcaatacac ttcagcttcc tctgctaata   1200
cgtgtgagga tcttcggtac catgcagaaa agaccgcggt gctccttcca ccgtcctcat   1260
ccctctcttg gcttttttaa gtctcctgcg atatccaaaa tccaaacaaa gccgttatcg   1320
cagctaaaat tcgtcaaccc caagtctcag gctaccttaa tttcagtgcc ctttttcttt   1380
atttttttct aataacagga gtcctggaaa atg gct gac ttg cgt gat gaa tat    1434
                                     Ala Asp Leu Arg Asp Glu Tyr
                                     1               5
gga aat cct atg cag ttg acc gac cag tat ggc aac ccg gtt cag ctc     1482
Gly Asn Pro Met Gln Leu Thr Asp Gln Tyr Gly Asn Pro Val Gln Leu
        10                  15                  20
aag gac gag tat ggc aac cca atg cag ctt agc ggt gta gct atc acc     1530
Lys Asp Glu Tyr Gly Asn Pro Met Gln Leu Ser Gly Val Ala Ile Thr
    25                  30                  35
gcc ggg acg gct agt act gtc cat tct act gga acc gga cca act gct     1578
Ala Gly Thr Ala Ser Thr Val His Ser Thr Gly Thr Gly Pro Thr Ala
40                  45                  50                  55
gcc act gga acc cag caa cat cag gag cag ctt cat cgg tct agc agc     1626
Ala Thr Gly Thr Gln Gln His Gln Glu Gln Leu His Arg Ser Ser Ser
                60                  65                  70
tca agc tct ggc tcg gtgagatact tgccaagtta caatgtgtgt gtctgtgtgt     1681
Ser Ser Ser Gly Ser
            75
gtataatgcg ccatcataat tgtttgcttg acagatcctg ttaataatga accgtaattt   1741
gacgtaaagt gtacacgttt tgtttttctg ggactaacat aatatcgaat caggctcctg   1801
ttgaatttga atgttgttag ctaaaagaaa attttggtgg ctgagttgtt gaatttggtt   1861
tatag acg gag gat gat gga caa gga gga aga aga aag aaa aaa ggg ttg   1911
      Thr Glu Asp Asp Gly Gln Gly Gly Arg Arg Lys Lys Lys Gly Leu
                  80                  85                  90
aaa gaa aag ata aag gag aaa cta acg ggc ggt agg cac aag gac aga     1959
Lys Glu Lys Ile Lys Glu Lys Leu Thr Gly Gly Arg His Lys Asp Arg
            95                  100                 105
gac gat cag gag cac atc gat gat cag cac gcg cac agc gcc tct cct     2007
Asp Asp Gln Glu His Ile Asp Asp Gln His Ala His Ser Ala Ser Pro
        110                 115                 120
cca aca acc acc act ggc agc ggg acg tct act aca gtc ggg ggt cag     2055
Pro Thr Thr Thr Thr Gly Ser Gly Thr Ser Thr Thr Val Gly Gly Gln
    125                 130                 135
cag cat gaa aag aag agc atg gtg gag aag att atg gaa aag ctc cct     2103
Gln His Glu Lys Lys Ser Met Val Glu Lys Ile Met Glu Lys Leu Pro
140                 145                 150                 155
ggc cat cac gac acc cgc tagttaccta ccacaacata ctgtgatcat            2151
Gly His His Asp Thr Arg
                160
cgtgtaaaat ctctcctgat gcctaggaaa tctagattat gttaggcatt ttgtttggta   2211
tgtatgtgtg attaagacct tgttgtgcgc ttgaatcttg aacgtgcatg ggatttgctt   2271
ggtttgattt gatttgg                                                  2288
<210>8
<211>172
<212>PRT
<213>中果咖啡
<400>8
Met Ala Gln Tyr Gly Ala Glu Tyr Gly Asn Gln Lys Ser Gln Tyr Asp
1               5                   10                  15
Glu Tyr Gly Asn Pro Val Arg Gln Thr Asp Glu Tyr Gly Asn Pro Ala
            20                  25                  30
Arg His Gly Gly Thr Met Gly Asp Tyr Gly Thr Thr Gly Thr Thr Gly
        35                  40                  45
Ala Tyr Gly Gly Thr Thr Gly Ala His Gly Thr Tyr Ala Thr Gly Thr
    50                  55                  60
Thr Gly Thr Thr Gly Thr Gly Ala Tyr Ala Thr Gln Pro Gly Thr Asp
65                  70                  75                  80
Val Gly Lys Glu His His Gly Leu Gly G1y Met Leu His Arg Ser Gly
                85                  90                  95
Ser Gly Ser Ser Ser Ser Ser Glu Asp Asp Gly Gln Gly Gly Arg Arg
            100                 105                 110
Lys Lys Gly Met Lys Glu Lys Ile Lys Glu Lys Leu Pro Gly Gly His
        115                 120                 125
Lys Glu Ala Gln Pro Gly Gln Glu Tyr Ser Ser Ala Thr Ala Ala Pro
    130                 135                 140
Gly Tyr Gly Gly Glu Gly Val Gln His Glu Lys Lys Gly Ile Met Asp
145                 150                 155                 160
Lys Ile Lys Glu Lys Leu Pro Gly Gly His His Asn
                165                 170
<210>9
<211>175
<212>PRT
<213>中果咖啡
<400>9
Met Ala Gln Tyr Gly Ala Glu Tyr Gly Asn Gln Lys Ser Gln Tyr Asp
1               5                   10                  15
Glu Tyr Gly Asn Pro Val Arg Gln Thr Asp Glu Tyr Gly Asn Pro Ala
            20                  25                  30
Arg His Gly Gly Thr Met Gly Asp Tyr Gly Thr Thr Gly Thr Thr Gly
        35                  40                  45
Ala Tyr Gly Gly Thr Thr Gly Thr Ala Gly Ala His Gly Thr Tyr Ala
    50                  55                  60
Thr Gly Thr Thr Gly Thr Thr Gly Thr Gly Ala Tyr Ala Thr Gln Pro
65                  70                  75                  80
Gly Thr Asp Val Gly Lys Glu Arg His Gly Leu Gly Gly Met Leu His
                85                  90                  95
Arg Ser Gly Ser Gly Ser Ser Ser Ser Ser Glu Asp Asp Gly Gln Gly
            100                 105                 110
Gly Arg Arg Lys Lys Gly Met Lys Glu Lys Ile Lys Glu Lys Leu Pro
        115                 120                 125
Gly Gly His Lys Glu Ala Gln Pro Gly Gln Glu Tyr Ser Ser Ala Thr
    130                 135                 140
Ala Ala Pro Gly Tyr Gly Gly Glu Gly Glu Gln His Glu Lys Lys Gly
145                 150                 155                 160
Ile Met Asp Lys Ile Lys Glu Lys Leu Pro Gly Gly His Arg Asn
                165                 170                 175
<210>10
<211>162
<212>PRT
<213>中果咖啡
<400>10
Met Ala Asp Leu Arg Asp Glu Tyr Gly Asn Pro Met Gln Leu Thr Asp
1               5                   10                  15
Gln Tyr Gly Asn Pro Val Gln Leu Lys Asp Glu Tyr Gly Asn Pro Met
            20                  25                  30
Gln Leu Ser Gly Val Ala Ile Thr Ala Gly Thr Ala Ser Ala Val His
        35                  40                  45
Ser Thr Gly Thr Gly Pro Thr Ala Ala Thr Gly Thr Gln Gln His Gln
    50                  55                  60
Glu Gln Leu His Arg Ser Ser Ser Ser Ser Ser Gly Ser Ser Glu Asp
65                  70                  75                  80
Asp Gly Gln Gly Gly Arg Arg Lys Lys Lys Gly Leu Lys Glu Lys Ile
                85                  90                  95
Lys Glu Lys Leu Thr Gly Gly Arg His Lys Asp Arg Asp Asp Gln Glu
            100                 105                 110
His Ile Asp Asp Gln His Ala His Ser Ala Ser Pro Pro Thr Thr Thr
        115                 120                 125
Thr Gly Ser Gly Thr Ser Thr Thr Val Gly Gly Gln Gln His Glu Lys
    130                 135                 140
Lys Ser Met Val Glu Lys Ile Met Glu Lys Leu Pro Gly His His Asp
145                 150                 155                 160
Thr Arg
<210>11
<211>162
<212>PRT
<213>中果咖啡
<400>11
Met Ala Asp Leu Arg Asp Glu Tyr Gly Asn Pro Met Gln Leu Thr Asp
1               5                   10                  15
Gln Tyr Gly Asn Pro Val Gln Leu Lys Asp Glu Tyr Gly Asn Pro Met
            20                  25                  30
Gln Leu Ser Gly Val Ala Ile Thr Ala Gly Thr Ala Ser Ala Val His
        35                  40                  45
Ser Thr Gly Thr Gly Pro Thr Ala Ala Thr Gly Thr Gln Gln Leu Gln
    50                  55                  60
Glu Gln Leu His Arg Ser Ser Ser Ser Ser Ser Gly Ser Ser Glu Asp
65                  70                  75                  80
Asp Gly Gln Gly Gly Arg Arg Lys Lys Lys Gly Leu Lys Glu Lys Ile
                85                  90                  95
Lys Glu Lys Leu Thr Gly Gly Arg His Lys Asp Arg Asp Asp Gln Glu
            100                 105                 110
His Ile Asp Asp Gln His Ala His Ser Ala Ser Pro Pro Thr Thr Thr
        115                 120                 125
Thr Gly Ser Gly Thr Ser Thr Thr Val Gly Gly Gln Gln His Glu Lys
    130                 135                 140
Lys Ser Met Val Glu Lys Ile Met Glu Lys Leu Pro Gly His His Asp
145                 150                 155                 160
Thr Arg
<210>12
<211>227
<212>PRT
<213>中果咖啡
<400>12
Met Ala Glu Tyr Asp Gln Ser Asn Ile Lys Val Glu Glu Gly Ser Ala
1               5                   10                  15
Val Glu Ala Thr Asp Arg Gly Leu Phe Asn Leu Gly Lys Lys Glu Glu
             20                  25                  30
Val Lys Lys Cys Asp Gln Gly Gln Ala Ile Ser Ala Glu Phe Asp Glu
        35                  40                  45
Lys Val Arg Val Ser Glu Pro Asp Lys Glu Glu Gly Lys Lys His Gly
    50                  55                  60
Gly Leu Leu Glu Lys Leu His Arg Ser Gly Ser Ser Ser Ser Ser Ser
65                  70                  75                  80
Ser Glu Glu Glu Val Glu Glu Gly Gly Glu Lys Lys Lys Lys Lys Lys
                85                  90                  95
Glu Lys Lys Gly Leu Lys Asp Lys Ile Lys Glu Lys Ile Ser Gly Asp
            100                 105                 110
Lys Lys Asp Glu Glu Lys Val Glu Lys Cys Glu Glu Asp Thr Ser Ile
        115                 120                 125
Pro Val Glu Lys Tyr Ala Glu Pro Ala His Ala Asp Ala Ala His Glu
    130                 135                 140
Pro Glu Glu Lys Lys Gly Phe Leu Asp Lys Ile Lys Glu Lys Leu Pro
145                 150                 155                 160
Gly Gly Gly Gln Lys Lys Thr Glu Glu Val Ala Ala Ala Ala Pro Pro
                165                 170                 175
Pro Pro Pro Ala Glu Cys Thr Ala Thr Glu Gly Glu Ala Lys Asp Lys
            180                 185                 190
Lys Gly Phe Leu Asp Lys Ile Lys Glu Lys Leu Pro Gly Tyr His Pro
        195                 200                 205
Lys Thr Glu Glu Glu Lys Glu Lys Glu Lys Glu Lys Glu Lys Glu Ala
    210                 215                 220
Gly Cys His
225
<210>13
<211>357
<212>PRT
<213>中果咖啡
<400>13
Met Gln Lys Met Thr Pro Leu Arg Cys Ile Asn Phe Ile Phe Leu Ala
1               5                   10                  15
Phe Trp Val Pro Ala Val Leu Ala Val Met Ala Glu Lys Pro Leu Val
            20                  25                  30
Pro Thr Tyr Leu Ile Pro Lys Pro Pro Pro Pro Pro Ser Pro Val Lys
        35                  40                  45
Pro Ser Val Pro Val Ile Pro Val Lys Pro Arg Ile Val Arg Cys Arg
    50                  55                  60
Ser Thr Leu Phe Pro Leu Cys Phe Asn Ile Pro Phe Val Cys Pro Leu
65                  70                  75                  80
Asp Cys Leu Thr Asn Cys Leu Val Asp Cys Val Thr Cys Lys Ala Tyr
                85                  90                  95
Cys Ser Cys Asn Phe Pro Gly Ala Val Cys Gln Asp Pro Arg Phe Val
            100                 105                 110
Gly Gly Asp Gly Asn Thr Phe Tyr Phe His Gly Arg Lys Asp Gln Asp
        115                 120                 125
Phe Cys Leu Val Ser Asp Thr Asn Leu His Val Asn Gly His Phe Ile
    130                 135                 140
Gly Lys Arg Lys Pro Asn Leu Arg Arg Asp Phe Thr Trp Val Gln Ala
145                 150                 155                 160
Ile Gly Ile Met Phe Asp Asp His Arg Ile Leu Val Ala Ala Lys Arg
                165                 170                 175
Thr Ser Thr Trp Asp Asp Asn Val Asp Arg Leu Ala Ile Ser Ile Asp
            180                 185                 190
Gly Asn Pro Ile Ser Leu Pro Thr Glu Glu Gly Ser Lys Trp Gln Leu
        195                 200                 205
Pro Ala Pro Ser Asn Val Ser Ile Met Arg Thr Ser Asn Asn Asn Gly
    210                 215                 220
Leu Val Val Glu Ala Val Asn Asn Phe Arg Ile Thr Ala Asn Val Val
225                 230                 235                 240
Pro Ile Thr Ala Gln Glu Ser Lys Val His Gly Tyr Asp Ile Thr Asp
                245                 250                 255
Glu Asp Cys Phe Thr His Leu Glu Leu Gly Phe Lys Phe Phe Asn Ile
            260                 265                 270
Thr Asp Ser Thr Asp Gly Val Leu Gly Gln Thr Tyr Arg Ser Asp Tyr
        275                 280                 285
Val Asn Lys Met Lys Val Asn Ala Val Met Pro Val Met Gly Gly Asp
    290                 295                 300
Arg Lys Tyr Leu Thr Ser Gly Leu Phe Ser Ala Asp Cys Ala Val Ser
305                 310                 315                 320
Arg Phe Gly Gly Lys Val Leu Glu Lys Ala Asn Ser Ala Ser Pro Val
                325                 330                 335
His Glu Tyr Pro Ala Leu Asn Cys Lys Ser Gly Met Glu Gly Asn Gly
            340                 345                 350
Leu Val Cys Lys Lys
        355
<210>14
<211>130
<212>PRT
<213>番茄(Lycopersicon esculentum)
<400>14
Met Ala Gln Tyr Gly Asn Gln Asp Gln Met Arg Lys Thr Asp Glu Tyr
1               5                   10                  15
Gly Asn His Val Gln Glu Thr Gly Val Tyr Gln Gly Thr Gly Thr Gly
            20                  25                  30
Gly Met Met Gly Gly Thr Gly Thr Gly Gly Met Met Gly Gly Thr Gly
        35                  40                  45
Gly Glu Tyr Gly Thr Gln Gly Met Gly Thr Gly Thr His His His Glu
    50                  55                  60
Gly Gln Gln Gln Leu Arg Arg Ser Asp Ser Ser Ser Ser Ser Glu Asp
65                  70                  75                  80
Asp Gly Glu Gly Gly Arg Arg Lys Lys Gly Leu Lys Glu Lys Ile Met
                85                  90                  95
Glu Lys Met Pro Gly Gln His Glu Gly Glu Tyr Gly Gln Thr Thr Gly
            100                 105                 110
Glu Glu Lys Lys Gly Met Met Asp Lys Ile Lys Asp Lys Ile Pro Gly
        115                 120                 125
Met His
    130
<210>15
<211>157
<212>PRT
<213>Solanum commersonii
<400>15
Met Ala His Tyr Glu Asn Gln Tyr Ser Ala Gly Gln Ala Leu Gln Lys
1               5                   10                  15
Asp Glu Tyr Gly Asn Pro Val Arg Gln Thr Asp Glu Tyr Gly Asn Pro
            20                  25                  30
Ile Gln Gln Thr Gly Gly Thr Met Gly Glu Tyr Gly Thr Thr Gly Thr
        35                  40                  45
Gly Tyr Gly Thr Gln Ala Gly His Thr Thr Gly Val Leu Gly Gly Asp
    50                  55                  60
Gln Arg Gln His Gly Thr Leu Gly Gly Met Leu His Arg Ser Gly Ser
65                  70                  75                  80
Ser Ser Ser Ser Ser Ser Ser Glu Asp Asp Gly His Gly Gly Arg Arg
                85                  90                  95
Lys Lys Lys Gly Ile Lys Asp Lys Val Lys Glu Lys Leu Pro Gly Gly
            100                 105                 110
His Arg Asp Asp Leu Ala His Ser Thr Ala Thr Thr Thr Thr Thr Gly
        115                 120                 125
Tyr Gly Met Asp Gly Thr His Glu Lys Lys Gly Ile Met Glu Lys Ile
    130                 135                 140
Lys Glu Lys Leu Pro Gly His His Gly Pro Gly His His
145                 150                 155
<210>16
<211>186
<212>PRT
<213>拟南芥(Arabidopsis thaliana)
<400>16
Met Ala Ser Tyr Gln Asn Arg Pro Gly Gly Gln Ala Thr Asp Glu Tyr
1               5                   10                  15
Gly Asn Pro Ile Gln Gln Gln Tyr Asp Glu Tyr Gly Asn Pro Met Gly
            20                  25                  30
Gly Gly Gly Tyr Gly Thr Gly Gly Gly Gly Gly Ala Thr Gly Gly Gln
        35                  40                  45
Gly Tyr Gly Thr Gly Gly Gln Gly Tyr Gly Ser Gly Gly Gln Gly Tyr
    50                  55                  60
Gly Thr Gly Gly Gln Gly Tyr Gly Thr Gly Thr Gly Thr Glu Gly Phe
65                  70                  75                  80
Gly Thr Gly Gly Gly Ala Arg His His Gly Gln Glu Gln Leu His Lys
                85                  90                  95
Glu Ser Gly Gly Gly Leu Gly Gly Met Leu His Arg Ser Gly Ser Gly
            100                 105                 110
Ser Ser Ser Ser Ser Glu Asp Asp Gly Gln Gly Gly Arg Arg Lys Lys
        115                 120                 125
Gly Ile Thr Gln Lys Ile Lys Glu Lys Leu Pro Gly His His Asp Gln
    130                 135                 140
Ser Gly Gln Ala Gln Ala Met Gly Gly Met Gly Ser Gly Tyr Asp Ala
145                 150                 155                 160
Gly Gly Tyr Gly Gly Glu His His Glu Lys Lys Gly Met Met Asp Lys
                165                 170                 175
Ile Lys Glu Lys Leu Pro Gly Gly Gly Arg
            180                 185
<210>17
<211>208
<212>PRT
<213>烟草(Nicotiana tabacum)
<400>17
Met Ala Asp Gln Tyr Glu Lys Lys Val Glu Glu Gly Ser Ala Asn Val
1               5                   10                  15
Glu Ala Thr Asp Arg Gly Leu Phe Asp Phe Leu Gly Lys Lys Glu Glu
            20                  25                  30
Glu Lys Pro Thr His Ala Gln Glu Glu His Ala Ile Ser Ser Glu Phe
        35                  40                  45
Val Glu Lys Val Lys Val Ser Glu Glu Val Ala Glu Tyr Lys Glu Glu
    50                  55                  60
Glu Lys Lys Glu Glu His Asn Lys Glu Glu Lys Lys Leu His Arg Ser
65                  70                  75                  80
Ser Ser Ser Ser Ser Ser Ser Ser Asp Glu Glu Glu Glu Ile Gly Glu
                85                  90                  95
Asp Gly Gln Lys Ile Lys Lys Lys Lys Lys Lys Gly Leu Lys Asp Lys
            100                 105                 110
Ile Lys Asp Lys Ile Ser Gly Glu His Lys Glu Glu Glu Lys Ala Gly
        115                 120                 125
Glu Asp Thr Ala Val Pro Val Glu Lys Tyr Glu Glu Thr Glu Glu Lys
    130                 135                 140
Lys Gly Phe Leu Asp Lys Ile Lys Glu Lys Leu Pro Gly Gly Gly Gln
145                 150                 155                 160
Lys Lys Thr Glu Glu Val Ala Pro Pro Pro Pro Pro Ala Ala Glu His
                165                 170                 175
Glu Ala Glu Gly Lys Glu Lys Lys Gly Phe Leu Asp Lys Ile Lys Glu
            180                 185                 190
Lys Leu Pro Gly Tyr His Ser Lys Thr Glu Glu Lys Lys Lys Lys Lys
        195                 200                 205
<210>18
<211>209
<212>PRT
<213>马铃薯(Solanum tuberosum)
<400>18
Met Ala Asp Gln Tyr Glu Gln Asn Lys Pro Ser Val Glu Glu Thr Val
1               5                   10                  15
Gly Ala Asn Val Glu Ala Thr Asp Arg Gly Leu Phe Asp Phe Ile Gly
            20                  25                  30
Lys Lys Lys Glu Glu Lys Pro Ser His Ala His Glu Glu Glu Ala Ile
        35                  40                  45
Ser Ser Glu Phe Cys Glu Lys Val Lys Val Ser Glu Glu Glu His Lys
    50                  55                  60
Glu Glu Glu Lys Lys Glu Glu Lys Lys Leu His Arg Ser Ser Ser Ser
65                  70                  75                  80
Ser Ser Ser Ser Ser Asp Glu Glu Glu Glu Ile Gly Glu Asp Gly Gln
                85                  90                  95
Ile Ile Lys Lys Lys Lys Lys Lys Gly Leu Lys Glu Lys Ile Lys Glu
            100                 105                 110
Lys Ile Ser Gly Asp His Lys Glu Glu Val Lys Thr Glu Asp Thr Ser
        115                 120                 125
Val Pro Val Glu Lys Tyr Glu Glu Thr Glu Glu Lys Lys Gly Phe Leu
    130                 135                 140
Asp Lys Ile Lys Glu Lys Leu Pro Gly Gly Gly His Lys Lys Thr Glu
145                 150                 155                 160
Glu Val Ala Ala Pro Pro Pro Pro Pro Pro Ala Ala Val Glu His Glu
                165                 170                 175
Ala Glu Gly Lys Glu Lys Lys Gly Phe Leu Asp Lys Ile Lys Glu Lys
            180                 185                 190
Leu Pro Gly Tyr His Ser Lys Thr Glu Glu Glu Lys Glu Lys Glu Lys
        195                 200                 205
Asn
<210>19
<211>265
<212>PRT
<213>拟南芥
<400>19
Met Ala Glu Glu Tyr Lys Asn Asn Val Lys Glu His Glu Thr Pro Thr
1               5                   10                  15
Val Ala Thr Glu Glu Ser Pro Ala Thr Thr Thr Glu Val Thr Asp Arg
            20                  25                  30
Gly Leu Phe Asp Phe Leu Gly Lys Lys Glu Glu Glu Val Lys Pro Gln
        35                  40                  45
Glu Thr Thr Thr Leu Glu Ser Glu Phe Asp His Lys Ala Gln Ile Ser
    50                  55                  60
Glu Pro Glu Leu Ala Ala Glu His Glu Glu Val Lys Glu Asn Lys Ile
65                  70                  75                  80
Thr Leu Leu Glu Glu Leu Gln Glu Lys Thr Glu Glu Asp Glu Glu Asn
                85                  90                  95
Lys Pro Ser Val Ile Glu Lys Leu His Arg Ser Asn Ser Ser Ser Ser
            100                 105                 110
Ser Ser Ser Asp Glu Glu Gly Glu Glu Lys Lys Glu Lys Lys Lys Lys
        115                 120                 125
Ile Val Glu Gly Glu Glu Asp Lys Lys Gly Leu Val Glu Lys Ile Lys
    130                 135                 140
Glu Lys Leu Pro Gly His His Asp Lys Thr Ala Glu Asp Asp Val Pro
145                 150                 155                 160
Val Ser Thr Thr Ile Pro Val Pro Val Ser Glu Ser Val Val Glu His
                165                 170                 175
Asp His Pro Glu Glu Glu Lys Lys Gly Leu Val Glu Lys Ile Lys Glu
            180                 185                 190
Lys Leu Pro Gly His His Asp Glu Lys Ala Glu Asp Ser Pro Ala Val
        195                 200                 205
Thr Ser Thr Pro Leu Val Val Thr Glu His Pro Val Glu Pro Thr Thr
    210                 215                 220
Glu Leu Pro Val Glu His Pro Glu Glu Lys Lys Gly Ile Leu Glu Lys
225                 230                 235                 240
Ile Lys Glu Lys Leu Pro Gly Tyr His Ala Lys Thr Thr Glu Glu Glu
                245                 250                 255
ValLys Lys Glu Lys Glu Ser Asp Asp
           260                 265
<210>20
<211>337
<212>PRT
<213>拟南芥
<400>20
Met Glu Ile Ser Lys Thr Leu Leu Leu Val Ile Ser Leu Val Ala Ala
1               5                   10                  15
Thr Cys Phe Leu Gln Ala Lys Ala Ala Gly Val Tyr Cys Ser Asn Pro
            20                  25                  30
Tyr Thr Arg Cys Tyr Arg Lys Tyr Ile Arg Cys Pro Glu Glu Cys Pro
        35                  40                  45
Ser Lys Thr Ala Met Asn Ser Lys Asn Lys Val Cys Tyr Ala Asp Cys
    50                  55                  60
Asp Arg Pro Thr Cys Lys Ser Gln Cys Arg Met Arg Lys Pro Asn Cys
65                  70                  75                  80
Asn Arg Pro Gly Ser Ala Cys Tyr Asp Pro Arg Phe Ile Gly Gly Asp
                85                  90                  95
Gly Ile Val Phe Tyr Phe His Gly Lys Ser Asn Glu Glu Phe Ser Leu
            100                 105                 110
Val Ser Asp Ser Asp Leu Gln Ile Asn Gly Arg Phe Ile Gly His Arg
        115                 120                 125
Pro Ala Gly Arg Ala Arg Asp Phe Thr Trp Ile Gln Ala Leu Gly Phe
    130                 135                 140
Leu Phe Asn Ser Asn Lys Phe Ser Leu Glu Ala Ala Lys Thr Ala Ser
145                 150                 155                 160
Trp Asp Asn Glu Ile Asp His Leu Lys Phe Ser Tyr Asp Gly Gln Asp
                165                 170                 175
Leu Ser Val Pro Glu Glu Thr Leu Ser Thr Trp Tyr Ser Pro Asn Lys
            180                 185                 190
Asp Ile Lys Ile Glu Arg Val Ser Met Arg Asn Ser Val Ile Val Thr
        195                 200                 205
Ile Lys Asp Lys Ala Glu Ile Met Ile Asn Val Val Pro Val Thr Lys
    210                 215                 220
Glu Asp Asp Arg Ile His Ser Tyr Lys Val Pro Ser Asp Asp Cys Phe
225                 230                 235                 240
Ala His Leu Glu Val Gln Phe Arg Phe Phe Asn Leu Ser Pro Lys Val
                245                 250                 255
Asp Gly Ile Leu Gly Arg Thr Tyr Arg Pro Asp Phe Gln Asn Pro Ala
            260                 265                 270
Lys Pro Gly Val Ala Met Pro Val Val Gly Gly Glu Asp Ser Phe Lys
        275                 280                 285
Thr Ser Ser Leu Leu Ser Asn Asp Cys Lys Thr Cys Ile Phe Ser Glu
    290                 295                 300
Ser Gln Ala Glu Ile Asp Ser Val Lys Ser Glu Ile Glu Tyr Ala Thr
305                 310                 315                 320
Leu Asp Cys Thr Arg Gly Ala Ser Ser Gly Tyr Gly Ile Val Cys Arg
                325                 330                 335
Lys
<210>21
<211>320
<212>PRT
<213>白云杉(Picea glauca)
<400>21
Met Ala Ala Asn Lys Leu Met Asn Val Val Ala Val Ala Val Cys Val
1               5                   10                  15
Met Val Met Val Asn Ala Ala Ser Ala Val Gly Lys Ala Lys Cys Thr
            20                  25                  30
Asp Lys Trp Tyr Pro Arg Cys Tyr Gly Tyr Gln Tyr Asp Cys Pro Ala
        35                  40                  45
Asn Cys Pro Tyr Asn Cys Asp Met Asp Cys Lys Thr Cys Lys Thr Val
    50                  55                  60
Cys Pro Cys Asp Lys Pro Gly Gly Val Cys Gln Asp Pro Arg Phe Ile
65                  70                  75                  80
Gly Gly Asp Gly Ile Met Phe Tyr Phe His Gly Lys Arg Asp Gln Asp
                85                  90                  95
Phe Cys Leu Ile Ser Asp Ser Asn Leu His Ile Asn Ala His Phe Ile
            100                 105                 110
Gly Lys Arg Gly Gln Gly Met Gly Arg Asp Phe Thr Trp Val Gln Ser
        115                 120                 125
Ile Gly Val Leu Leu Glu Asp Gly Arg Gln Phe Tyr Leu Gly Ala Lys
    130                 135                 140
Lys Val Ser Thr Trp Asp Asn Ser Val Asp Gln Leu Thr Met Ala Leu
145                 150                 155                 160
Asn Gly Gln Thr Leu Thr Leu Pro Pro Gly Glu Gly Ala Thr Trp Ala
                165                 170                 175
Thr Ala Ser Gly Leu Asn Val Thr Arg Ser Asp Arg Ala Asn Glu Val
            180                 185                 190
Val Val Gln Val Glu Asp Lys Leu Lys Ile Ser Ala Arg Val Val Pro
        195                 200                 205
Ile Ser Glu Glu Glu Ser Arg Val His Asn Tyr Gly Ile Ile Ala Gly
    210                 215                 220
Glu Asp Cys Phe Ala His Leu Glu Leu Ser Phe Lys Phe Tyr Ser Leu
225                 230                 235                 240
Ser Pro Asn Val Ser Gly Val Leu Gly Gln Thr Tyr Gly Ala Glu Tyr
                245                 250                 255
Arg Ser Pro Val Lys Met Gly Val Ala Met Pro Ile Met Gly Gly Glu
            260                 265                 270
Ser Asn Tyr Val Thr Ser Asn Leu Phe Ala Ala Asp Cys Lys Val Ala
        275                 280                 285
Arg Phe Ala Ser Ser Ser Asp Asp Glu Tyr Ala Ile Thr Ser Ala Leu
    290                 295                 300
Asp Cys Asn Ser Gly Arg Gly Ser Gly His Gly Ile Val Ser Arg Arg
305                 310                 315                 320
<210>22
<211>349
<212>PRT
<213>玉米(Zea mays)
<400>22
Met Ala Arg Leu Gly Ala Leu Ile Pro Leu Ala Ile Val Leu Leu Ala
1               5                   10                  15
Ala Val Ala Ala Thr Ala Ala Pro Ser Asp Arg Pro Pro Lys Ala Gln
            20                  25                  30
Gly Pro Lys Pro His Lys Glu Lys Glu Lys Glu Lys Pro Lys Pro Met
        35                  40                  45
Lys Val Lys Cys Arg Pro Arg Lys Leu Tyr Pro Tyr Cys Pro Gly Lys
    50                  55                  60
Pro Met Glu Cys Pro Ala Glu Cys Ser Gln Ser Cys Tyr Ala Asp Cys
65                  70                  75                  80
Ser Ser Cys Lys Pro Val Cys Val Cys Ser Val Pro Gly Ala Cys Gly
                85                  90                  95
Asp Pro Arg Phe Ile Gly Gly Asp Gly Asn Ala Phe Tyr Phe His Gly
            100                 105                 110
Arg Arg Asp Ala Asp Phe Cys Val Leu Ser Asp Arg Asp Leu His Ile
        115                 120                 125
Asn Ala His Phe Ile Gly Lys His Gly Ala Asp Gly Met Ser Arg Asp
    130                 135                 140
Phe Thr Trp Ile Gln Ala Ile Ala Val Leu Phe Asp Gly His Glu Leu
145                 150                 155                 160
Tyr Val Gly Ala Arg Lys Thr Ala Ala Trp Asp Asp Asp Val Asp Arg
                165                 170                 175
Met Glu Leu Thr Leu Asp Gly Glu Pro Val Arg Leu Leu Pro Gly Thr
            180                 185                 190
Asp Ala Ala Trp Thr Ser Gly Ala Val Pro Ala Leu Ser Val Thr Arg
        195                 200                 205
Thr Ser Ala Ala Asn Gly Val Leu Val Ser Leu Asp Gly Arg Phe Thr
    210                 215                 220
Ile Arg Ala Asn Ala Val Pro Ile Thr Glu Glu Glu Ser Arg Val His
225                 230                 235                 240
Arg Tyr Gly Val Thr Ala Asp Asp Cys Leu Ala His Leu Asp Leu Ala
                245                 250                 255
Phe Lys Phe Gly Ala Leu Thr Ala Asp Val His Gly Val Val Gly Gln
            260                 265                 270
Thr Tyr Arg Ser Asp Tyr Val Asn Arg Phe Asp Val Lys Ala Ser Met
        275                 280                 285
Pro Thr Met Gly Gly Asp Ser Asn Tyr Thr Thr Ser Ser Leu Phe Ala
    290                 295                 300
Ala Asp Cys Ala Val Ala Arg Tyr Ala Pro Ser Gly Gly Ser Arg Asp
305                 310                 315                 320
Arg Asp Asp Gly Val Ala Met Val Ser Glu Ile Ala Gly Ile Thr Cys
                325                 330                 335
Ser Ser Gly Met Gly Gly Gln Gly Val Val Cys Lys Lys
            340                 345
<210>23
<211>21
<212>DNA
<213>人工的
<220>
<223>RPL39正向引物
<400>23
tggcgaagaa gcagaggcag a                                                         21
<210>24
<211>20
<212>DNA
<213>人工的
<220>
<223>RPL39反向引物
<400>24
ttgaggggga gggtaaaaag                                                           20
<210>25
<211>19
<212>DNA
<213>人工的
<220>
<223>DH1正向引物
<400>25
gaagaagggg atgaaggag                                                            19
<210>26
<211>20
<212>DNA
<213>人工的
<220>
<223>DH1反向引物
<400>26
tacggacaaa cacactacag                                                           20
<210>27
<211>19
<212>DNA
<213>人工的
<220>
<223>DH2正向引物
<400>27
cctccaacaa ccaccactg                                                            19
<210>28
<211>19
<212>DNA
<213>人工的
<220>
<223>DH2反向引物
<400>28
tcaagcgcac aacaaggtc                                                            19
<210>29
<211>21
<212>DNA
<213>人工的
<220>
<223>DH3正向引物
<400>29
aggtggtggt cagaagaaga c                                                         21
<210>30
<211>20
<212>DNA
<213>人工的
<220>
<223>DH3反向引物
<400>30
gacacactgg aaagctgcta                                                           20
<210>31
<211>21
<212>DNA
<213>人工的
<220>
<223>LEA1正向引物
<400>31
ccaataacag ctcaagaatc a                                                         21
<210>32
<211>19
<212>DNA
<213>人工的
<220>
<223>LEA1反向引物
<400>32
ttcccttcca tcccactct                                                            19
<210>33
<211>21
<212>DNA
<213>人工的
<220>
<223>rp139-F1
<400>33
gaacaggccc atcccttatt g                                                         21
<210>34
<211>17
<212>DNA
<213>人工的
<220>
<223>rp139-R1
<400>34
cggcgcttgg cattgta                                                              17
<210>35
<211>16
<212>DNA
<213>人工的
<220>
<223>rp139-MPG
<400>35
atgcgcactg acaaca                                                               16
<210>36
<211>19
<212>DNA
<213>人工的
<220>
<223>DH2a-F1
<400>36
ggaggcacaa ggacagaga                                                            19
<210>37
<211>17
<212>DNA
<213>人工的
<220>
<223>DH2a-R1
<400>37
gctgtgcgcg tgctgat                                                              17
<210>38
<211>15
<212>DNA
<213>人工的
<220>
<223>DH2a-MGB
<400>38
caggagcaca tcgat                                                                15
<210>39
<211>29
<212>DNA
<213>人工的
<220>
<223>DH2a引物1
<400>39
tgtgctcctg atgctctctg tccttgtgc                                                 29
<210>40
<211>28
<212>DNA
<213>人工的
<220>
<223>DH2a geneup
<400>40
atagtgacct taatagcgat cttgttgc                                                  28
<210>41
<211>26
<212>DNA
<213>人工的
<220>
<223>DH2a genelow
<400>41
ccaaatcaaa tcaaaccaag caaatc                                                    26
<210>42
<211>10
<212>DNA
<213>拟南芥
<400>42
ryacgtggyr                                                                      10
<210>43
<211>29
<212>DNA
<213>人工的
<220>
<223>TG-TG698
<400>43
ttgaagcttg tggacatgac ggaagaggt                                                 29
<210>44
<211>36
<212>DNA
<213>人工的
<220>
<223>TG-TG743
<400>44
gcagatctac catggacgac tcctgttatt agaaaa                                         36
<210>45
<211>23
<212>DNA
<213>人工的
<220>
<223>CcDH1引物1
<400>45
cactggcact actggagcct atg                                                       23
<210>46
<211>15
<212>DNA
<213>人工的
<220>
<223>CcDH1引物2
<400>46
ctggagcaca tggga                                                                15

Claims (47)

1.从咖啡(咖啡属物种)分离的核酸分子,其具有编码脱水蛋白或胚胎发育后期富集(LEA)蛋白的编码序列。
2.权利要求1的核酸分子,其中编码序列编码具有大约17kDa到大约26kDa之间的分子量的脱水蛋白。
3.权利要求2的核酸分子,其中脱水蛋白或LEA蛋白质具有氨基酸序列,所述氨基酸序列与SEQ ID NO:7-12中的任一个有46%或更高的同一性。
4.权利要求3的核酸分子,其中脱水蛋白或LEA蛋白质具有SEQ IDNO:7-12中任一个的氨基酸序列。
5.权利要求1的核酸分子,其中编码序列与SEQ ID NO:1-6中所示编码序列中的任一序列具有50%或更高的同一性。
6.权利要求5的核酸分子,其中编码序列包含SEQ ID NO:1-6中的任一个。
7.权利要求1的核酸分子,其是具有包含编码序列的可读框的基因。
8.由权利要求7的基因转录产生的mRNA分子。
9.由权利要求8的mRNA分子反转录产生的cDNA分子。
10.长度在8和100个碱基之间的寡核苷酸,其与权利要求1的核酸分子的区段互补。
11.包含权利要求1的核酸分子的载体。
12.权利要求11的载体,其是选自质粒、噬菌粒、粘粒、杆状病毒、杆状病毒穿梭载体、细菌、酵母和病毒载体的表达载体。
13.权利要求11的载体,其中核酸分子的编码序列有效连接至组成型启动子。
14.权利要求11的载体,其中核酸分子的编码序列有效连接至诱导型启动子。
15.权利要求11的载体,其中核酸分子的编码序列有效连接至组织特异性启动子。
16.权利要求15的载体,其中组织特异性启动子是种子特异性启动子。
17.权利要求16的载体,其中种子特异性启动子是咖啡种子特异性启动子。
18.权利要求17的载体,其中咖啡种子特异性启动子是脱水蛋白基因启动子。
19.权利要求18的载体,其中脱水蛋白基因启动子包含SEQ IDNO:13。
20.用权利要求11的载体转化的宿主细胞。
21.权利要求20的宿主细胞,其选自植物细胞、细菌细胞、真菌细胞、昆虫细胞和哺乳动物细胞。
22.权利要求21的宿主细胞,其是选自咖啡、烟草、拟南芥、玉米、小麦、稻、大豆、大麦、黑麦、燕麦、高粱、苜蓿、三叶草、油菜、红花、向日葵、花生、可可、蕃茄、粘果酸浆、马铃薯、胡椒、茄子、甜菜、胡萝卜、黄瓜、莴苣、豌豆、紫菀、秋海棠、菊花、飞燕草、百日草和草坪草的植物细胞。
23.再生权利要求22的宿主细胞产生的能育转基因植物。
24.权利要求23的能育转基因植物,其是咖啡属物种。
25.调节咖啡豆的香味或香气的方法,其包括调节咖啡种子内一种或多种脱水蛋白或LEA蛋白质的产量。
26.权利要求25的方法,其包括增加一种或多种脱水蛋白或LEA蛋白质的产量。
27.权利要求26的方法,其包括增加咖啡种子内一种或多种内源编码脱水蛋白或LEA蛋白质的基因的表达。
28.权利要求27的方法,其包括将编码脱水蛋白或LEA蛋白质的转基因引入植物。
29.权利要求25的方法,其包括减少一种或多种脱水蛋白或LEA蛋白质的产量。
30.权利要求29的方法,其包括将核酸分子引入咖啡,所述核酸分子抑制一种或多种编码脱水蛋白或LEA蛋白质的基因的表达。
31.在植物中增加对渗透胁迫的抗性的方法,其包括增加植物中一种或多种脱水蛋白或LEA蛋白质的产量。
32.权利要求31的方法,其包括将编码脱水蛋白或LEA蛋白质的转基因引入植物。
33.启动子,其分离自编码脱水蛋白的咖啡植物基因。
34.权利要求33的启动子,其中基因编码具有大约17kDa和大约26kDa之间的分子量的脱水蛋白。
35.权利要求34的启动子,其中基因编码具有氨基酸序列的脱水蛋白,所述氨基酸序列与SEQ ID NO:7-11中的任一个有50%或更高的同一性。
36.权利要求35的启动子,其中基因编码具有SEQ ID NO:7-11中任一个氨基酸序列的脱水蛋白。
37.权利要求33的启动子,其中基因包含可读框,所述可读框与SEQID NO:1-5中所示序列中的任一序列具有50%或更高的同一性。
38.权利要求37的启动子,其中基因包含具有SEQ ID NO:1-5中任一个的可读框。
39.权利要求33的启动子,其包含一个或多个选自TATA盒、脱落酸应答元件、用于调节leguminin型蛋白质表达的leguminin盒的RY重复(CATGCA(T/a)(A/g)、至少一个脱水蛋白应答元件/C重复顺式作用序列基序(G/ACCGAC)和至少一个E盒基序(CANNTG)的调节序列。
40.权利要求39的启动子,其包含SEQ ID NO:13。
41.包含权利要求33的启动子的嵌合基因,其有效连接至一个或多个编码序列。
42.用于转化细胞的载体,其包含权利要求41的嵌合基因。
43.用权利要求42的载体转化的细胞。
44.权利要求43的转化的细胞,其是植物细胞。
45.权利要求44的转化的植物细胞,其是咖啡属物种的细胞。
46.再生权利要求44的转化的植物细胞产生的能育转基因植物。
47.权利要求46的能育转基因植物,其是咖啡属物种。
CNA2006800247385A 2005-07-06 2006-07-05 来自咖啡的脱水蛋白基因和启动子 Pending CN101218346A (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US69689005P 2005-07-06 2005-07-06
US60/696,890 2005-07-06

Publications (1)

Publication Number Publication Date
CN101218346A true CN101218346A (zh) 2008-07-09

Family

ID=37605204

Family Applications (1)

Application Number Title Priority Date Filing Date
CNA2006800247385A Pending CN101218346A (zh) 2005-07-06 2006-07-05 来自咖啡的脱水蛋白基因和启动子

Country Status (14)

Country Link
US (1) US8513491B2 (zh)
EP (1) EP1904639B1 (zh)
CN (1) CN101218346A (zh)
AP (1) AP2007004263A0 (zh)
AT (1) ATE466946T1 (zh)
AU (1) AU2006265027A1 (zh)
BR (1) BRPI0612762A2 (zh)
CA (1) CA2614066A1 (zh)
DE (1) DE602006014155D1 (zh)
EC (1) ECSP078036A (zh)
ES (1) ES2345785T3 (zh)
MX (1) MX2007016436A (zh)
WO (1) WO2007005980A2 (zh)
ZA (1) ZA200801239B (zh)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106967724A (zh) * 2017-03-24 2017-07-21 上海交通大学 百子莲sk3型脱水素蛋白及其编码基因和探针
CN107236732A (zh) * 2017-06-13 2017-10-10 青岛百慧智业生物科技有限公司 一种新型酵母诱导型启动子及其应用
CN107937590A (zh) * 2017-12-12 2018-04-20 山东省花生研究所 克隆花生胚胎发育晚期丰富蛋白基因的引物对及其应用
CN108913694A (zh) * 2012-04-09 2018-11-30 巴西农业研究公司-恩布拉帕 修饰目的基因表达的组合物和方法
CN112424364A (zh) * 2018-05-01 2021-02-26 热带生物科学英国有限公司 减少咖啡豆中咖啡因含量的组合物及方法
CN115820670A (zh) * 2022-12-13 2023-03-21 中国烟草中南农业试验站 NtTAS14-like1基因在调控烟草耐旱性中的应用
CN117604088A (zh) * 2024-01-24 2024-02-27 云南省烟草公司昆明市公司 脱落酸与环境胁迫诱导蛋白tas14在快速检测镉污染中的应用

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA2711428A1 (en) * 2008-01-09 2009-07-16 Serge Laberge Method and constructs for increasing recombinant protein production in plants during dehydration stress
EP2363408A3 (en) 2008-06-23 2012-07-11 Nestec S.A. Genes for modulating coffee maturation and methods for their use
CN102822334A (zh) 2010-03-09 2012-12-12 雀巢产品技术援助有限公司 咖啡中半乳甘露聚糖含量的调节
WO2015042750A1 (zh) * 2013-09-27 2015-04-02 创世纪转基因技术有限公司 一种小盐芥脱水素蛋白dh6及其编码基因与应用
WO2015042747A1 (zh) * 2013-09-27 2015-04-02 创世纪转基因技术有限公司 一种小盐芥脱水素蛋白dh4及其编码基因与应用
BR102014020352A2 (pt) * 2014-08-18 2016-08-09 Embrapa Empresa Brasileira De Pesquisa Agropecuária peptídeos opioides
WO2016175132A1 (ja) * 2015-04-30 2016-11-03 国立大学法人 奈良先端科学技術大学院大学 植物において組み換えタンパク質の高発現を可能にする5'utrをコードするdna分子
GB201721351D0 (en) * 2017-12-19 2018-01-31 Univ Pretoria Transgenic plants with enhanced resistence to abiotic stress conditions

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US3962321A (en) * 1972-04-11 1976-06-08 General Foods Corporation Enhancement of coffee flavor
US4072761A (en) * 1975-11-24 1978-02-07 Societe D'assistance Technique Pour Produits Nestle S.A. Aromatization of coffee products
US5731419A (en) * 1993-08-16 1998-03-24 Universite Du Quebec A Montreal Freezing tolerance proteins Wcs19 and Wcor410 from gramineae
CA2234168A1 (en) * 1995-10-12 1997-04-17 Cornell Research Foundation, Inc. Production of water stress or salt stress tolerant transgenic cereal plants
WO2001077384A2 (de) * 2000-04-07 2001-10-18 Epigenomics Ag DETEKTION VON SNPs UND CYTOSIN-METHYLIERUNGEN
AU2002337695A1 (en) * 2001-09-26 2003-04-07 Syngenta Biotechnology, Inc. High-protein-phenotype-associated plant genes
WO2005122697A2 (en) * 2004-06-21 2005-12-29 Carmel-Haifa University Economic Corp. Ltd Transgenic plants containing a dehydrin gene

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108913694A (zh) * 2012-04-09 2018-11-30 巴西农业研究公司-恩布拉帕 修饰目的基因表达的组合物和方法
CN106967724A (zh) * 2017-03-24 2017-07-21 上海交通大学 百子莲sk3型脱水素蛋白及其编码基因和探针
CN107236732A (zh) * 2017-06-13 2017-10-10 青岛百慧智业生物科技有限公司 一种新型酵母诱导型启动子及其应用
CN107937590A (zh) * 2017-12-12 2018-04-20 山东省花生研究所 克隆花生胚胎发育晚期丰富蛋白基因的引物对及其应用
CN112424364A (zh) * 2018-05-01 2021-02-26 热带生物科学英国有限公司 减少咖啡豆中咖啡因含量的组合物及方法
CN115820670A (zh) * 2022-12-13 2023-03-21 中国烟草中南农业试验站 NtTAS14-like1基因在调控烟草耐旱性中的应用
CN117604088A (zh) * 2024-01-24 2024-02-27 云南省烟草公司昆明市公司 脱落酸与环境胁迫诱导蛋白tas14在快速检测镉污染中的应用
CN117604088B (zh) * 2024-01-24 2024-04-23 云南省烟草公司昆明市公司 脱落酸与环境胁迫诱导蛋白tas14在快速检测镉污染中的应用

Also Published As

Publication number Publication date
AU2006265027A1 (en) 2007-01-11
ES2345785T3 (es) 2010-10-01
ECSP078036A (es) 2008-03-26
US20100154073A1 (en) 2010-06-17
WO2007005980A2 (en) 2007-01-11
DE602006014155D1 (de) 2010-06-17
BRPI0612762A2 (pt) 2010-11-30
AP2007004263A0 (en) 2007-12-31
CA2614066A1 (en) 2007-01-11
ATE466946T1 (de) 2010-05-15
EP1904639A2 (en) 2008-04-02
MX2007016436A (es) 2008-03-04
ZA200801239B (en) 2009-10-28
US8513491B2 (en) 2013-08-20
EP1904639B1 (en) 2010-05-05
WO2007005980A3 (en) 2007-08-16

Similar Documents

Publication Publication Date Title
CN101218346A (zh) 来自咖啡的脱水蛋白基因和启动子
US7910718B2 (en) Oleosin genes and promoters from coffee
EP2954059B1 (en) Transgenic plants
RU2458132C2 (ru) Регулирующий высоту растений ген и его применения
Bucher* et al. Two genes encoding extensin-like proteins are predominantly expressed in tomato root hair cells
CN104995304B (zh) 转基因植物
O'Brien et al. Characterization of a fertilization-induced and developmentally regulated plasma-membrane aquaporin expressed in reproductive tissues, in the wild potato Solanum chacoense Bitt.
US20140059716A1 (en) Plants having altered agronomic characteristics under nitrogen limiting conditions and related constructs and methods involving genes encoding lnt2 polypeptides and homologs thereof
KR100685520B1 (ko) 종자 특이적 프로모터, 이의 증폭용 프라이머, 이를포함하는 발현벡터 및 형질전환세포
WO2014037735A1 (en) Atsp1, an e3 ubiquitin ligase, and its use
CN110241130B (zh) 控制植物粒数和粒重的gsn1基因、编码蛋白及其应用
KR102000465B1 (ko) 식물의 키다리병 저항성을 증진시키는 방법
WO2015150412A1 (en) Transgenic plants with increased number of fruits and seeds and method for obtaining thereof
CN115820662B (zh) 大豆GmHDL56基因及其编码蛋白在盐胁迫中的应用
KR101825219B1 (ko) 담배 유래의 탈메틸화 관련 NtROS2a 유전자 및 이의 용도
US20140259224A1 (en) Transgenic plants with enhanced traits and methods of producing thereof
Martínez Fernández et al. Transgenic plants with increased number of fruits and seeds and method for obtaining thereof
LT et al. 1800 Vevey (CH)
US20140150138A1 (en) Novel Proteinase Inhibitor Promotes Resistance to Insects
MX2007015995A (en) Oleosin genes and promoters from coffee
OA18781A (en) Root-preferential and stress inducible promoter and uses thereof.

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C02 Deemed withdrawal of patent application after publication (patent law 2001)
WD01 Invention patent application deemed withdrawn after publication

Open date: 20080709