CN100451117C - 开裂基因和调节开裂作用的方法 - Google Patents

开裂基因和调节开裂作用的方法 Download PDF

Info

Publication number
CN100451117C
CN100451117C CNB018048579A CN01804857A CN100451117C CN 100451117 C CN100451117 C CN 100451117C CN B018048579 A CNB018048579 A CN B018048579A CN 01804857 A CN01804857 A CN 01804857A CN 100451117 C CN100451117 C CN 100451117C
Authority
CN
China
Prior art keywords
ser
leu
ala
glu
gene
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CNB018048579A
Other languages
English (en)
Other versions
CN1401002A (zh
Inventor
文卡特桑·孙达雷桑
萨罗贾姆·拉亚尼
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Temasek Life Sciences Laboratory Ltd
Original Assignee
Temasek Life Sciences Laboratory Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Temasek Life Sciences Laboratory Ltd filed Critical Temasek Life Sciences Laboratory Ltd
Publication of CN1401002A publication Critical patent/CN1401002A/zh
Application granted granted Critical
Publication of CN100451117C publication Critical patent/CN100451117C/zh
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/415Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from plants
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8241Phenotypically and genetically modified plants via recombinant DNA technology
    • C12N15/8242Phenotypically and genetically modified plants via recombinant DNA technology with non-agronomic quality (output) traits, e.g. for industrial processing; Value added, non-agronomic traits
    • C12N15/8243Phenotypically and genetically modified plants via recombinant DNA technology with non-agronomic quality (output) traits, e.g. for industrial processing; Value added, non-agronomic traits involving biosynthetic or metabolic pathways, i.e. metabolic engineering, e.g. nicotine, caffeine
    • C12N15/8249Phenotypically and genetically modified plants via recombinant DNA technology with non-agronomic quality (output) traits, e.g. for industrial processing; Value added, non-agronomic traits involving biosynthetic or metabolic pathways, i.e. metabolic engineering, e.g. nicotine, caffeine involving ethylene biosynthesis, senescence or fruit development, e.g. modified tomato ripening, cut flower shelf-life
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8241Phenotypically and genetically modified plants via recombinant DNA technology
    • C12N15/8261Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield
    • C12N15/8262Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield involving plant development
    • C12N15/8266Abscission; Dehiscence; Senescence

Landscapes

  • Health & Medical Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Chemical & Material Sciences (AREA)
  • Organic Chemistry (AREA)
  • Molecular Biology (AREA)
  • Biotechnology (AREA)
  • Biomedical Technology (AREA)
  • General Engineering & Computer Science (AREA)
  • Zoology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Wood Science & Technology (AREA)
  • General Health & Medical Sciences (AREA)
  • Biochemistry (AREA)
  • Biophysics (AREA)
  • Microbiology (AREA)
  • Plant Pathology (AREA)
  • Physics & Mathematics (AREA)
  • Cell Biology (AREA)
  • Nutrition Science (AREA)
  • Botany (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Medicinal Chemistry (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Peptides Or Proteins (AREA)
  • Breeding Of Plants And Reproduction By Means Of Culturing (AREA)

Abstract

本发明涉及防止种子通过开裂过程(种荚散开)而扩散从而导致收获作物时种子大量损失的方法。我们已鉴别和鉴定了拟南芥(Arabidopsis thaliana)中的SGT10166基因以及防止成熟果实的开裂的该基因的突变。发现所述基因编码的蛋白质与碱性螺旋—环—螺旋类转录因子类似。该基因的表达模式和突变植物的表型揭示其在使长角果开裂中的可能作用。

Description

开裂基因和调节开裂作用的方法
发明背景
本发明涉及拟南芥(Aarabidopsis thaliana)中的一种突变,其防止成熟果实开裂(种荚散开)。分离的基因鉴别为SGT10166,其编码一种发现与碱性螺旋-环-螺旋类转录因子相似的蛋白质。此基因的表达模式和突变植物的表型显示了其在长角果开裂中的作用。
本文所用的例证本发明背景或关于具体应用所提供的附加细节分别见于所附参考文献表。
果实是一种特异性植物器官,其与种子的成熟和扩散有关。种子的扩散是通过开裂过程发生的,例如种荚打开,从中脱出种子。开裂在农作物如Brassica sp.中具有农学重要性,其在收获期间导致明显的种子损失。
Arabidopsis的果实已知是长角果,其是由受精的雌蕊群发育而成的。雌蕊群由顶端柱头,花柱和基部子房组成。子房由两个心皮组成,形成一个称为隔膜的融合组织。心皮壁已知是瓣,其与胎座框相连。胎座框是隔膜的外缘(Sessions,1999)。在受精后,雌蕊群趋于形成一个延长的长角果。种子的扩散是在开裂过程发生的,在此过程中长角果打开脱落种子。Arabidopsis中的开裂要求开裂区沿着胎座框-瓣结合处发育,使瓣与胎座框分离,脱出种子(Gu等,1998)。
因此,需要研究参与通过开裂过程而进行的种子扩散的基因,由此防止农作物开裂以在收获期间使种子的损失减少到最小程度。
还需要鉴别参与开裂的植物基因,以产生启动子和/或增强子和/或内含子序列,以用于制备转基因植物,或干扰转基因植物中的正常开裂以产生不裂植物。
发明概述
本发明涉及一种参与开裂的基因,该基因的防止开裂的突变,及抑制这种基因产物活性的构建体。本发明还涉及防止由于开裂过程(种荚脱粒)引起种子扩散,导致在收获农作物期间种子明显损失。根据本发明,我们在拟南芥中鉴别了一种基因,其参与开裂,而其突变可以防止成熟果实(长角果)开裂。此基因编码一种蛋白质,发现这种蛋白质与碱性螺旋-环-螺旋类的转录因子相似。
一方面,本发明涉及鉴别和定性拟南芥中的SGT10166基因。
第二方面,本发明涉及拟南芥和其它植物中防止成熟果实开裂的突变。
第三方面,本发明提供了包含SGT10166核酸的至少一部分的构建体,以改变成熟果实的开裂。这种构建体一般包含一个异源启动子,即一个与SGT10166基因非天然相关的,可操纵地连于SGT10166核酸的启动子。针对启动子,SGT10166可以是有义或反义方向的。本发明还提供了含有所述构建体的载体,以用于转化植物细胞。根据本发明可以转化任何植物细胞。优选的植物细胞是产生果实例如长角果的植物细胞,其产自能育的雌蕊群,在种荚中产生种子。
第五方面,本发明提供了产生具有改变的开裂作用的植物的方法。这种方法包括以下步骤:用包含至少一部分SGT10166核酸的载体转化植物细胞,从一或多个转化的植物细胞中再生植物,并选择出现开裂作用改变的至少一种植物。
第六方面,本发明提供了Arabidopsis SGT10166基因的一种启动子,增强子和/或内含子。
第七方面,本发明提供了包含SGT10166基因的启动子和/或增强子和/或内含子,和一种异源基因的基因构建体。还提供了含有这些构建体的载体。本发明还提供了具有至少一种含有这些构建体的细胞的植物。
附图简述
图1示出野生型雌蕊群的结构。Sg-柱头;St-花柱;O-子房;R-胎座框;V-瓣。
图2示出在依次逐渐成熟的发育的长角果中(从左至右),SGT10166的GUS表达模式。
图3示出SGT10166的不裂表型,其中(a)是成熟的野生型长角果,(b)是成熟的SGT10166长角果。
图4(a)示出SGT10166的cDNA序列(SEQ ID NO:1)和推导的氨基酸序列(SEQ ID NO:2)。图4(b)示出SGT10166与一些植物myc蛋白(SEQ ID NO:3-6)的序列对比。
图5示出在Ds插入位点两侧的基因组序列和足迹分析。(1)在DsG插入之前的野生型ALC基因座的区域(SEQ ID NO:8)。(2)在DsG插入之后ALC基因座的序列变化。黑体的核苷酸表示在插入Ds期间加入的碱基(SEQ ID NO:9和10)。(3)和(4)示出在切除Ds之后观测到的9个碱基对和10个碱基对足迹(黑体)(SEQ ID NO:11和12)。
序列简述
SEQ ID NO:1是SGT10166的cDNA的核苷酸序列。
SEQ ID NO:2是SGT10166多肽的氨基酸序列。
SEQ ID NO:3是SGT10166的基因组DNA的核苷酸序列。
SEQ ID NO:4是rd22BPI多肽的氨基酸序列。
SEQ ID NO:5是PG1多肽的氨基酸序列。
SEQ ID NO:6是Lc多肽的氨基酸序列。
SEQ ID NO:7是B-Peru多肽的氨基酸序列。
SEQ ID NO:8是DsG插入之前的野生型ALC基因座区域。
SEQ ID NO:9是Ds插入之后的ALC基因座区域。
SEQ ID NO:10是Ds插入序列之后的ALC基因座区域。
SEQ ID NO:11是在切除Ds之后回复体的ALC基因座区域。
SEQ ID NO:12是在切除Ds之后的ALC基因座(alc10)区域。
SEQ ID NO:13是从SEQ ID NO:1中缺失的DNA片段,其编码一个碱性肽结构域,并由一个编码SEQ ID NO:14的酸性结构域的序列置换。
SEQ ID NO:15是显性阴性DNA构建体,是通过缺失SGT10166碱性结构域编码部分(SEQ ID NO:13),和插入SEQ ID NO:14而产生的。
SEQ ID NO:16是由SEQ ID NO:14编码的蛋白质。
发明详述
本发明涉及一种参与开裂的基因,及这种基因的防止成熟果实开裂(种荚脱粒)的突变。SGT10166基因编码一种类似于碱性螺旋-环-螺旋类转录因子。这种基因的表达模式和突变植物的表型表明其在使长角果开裂中的作用。
根据本发明,提供了一种参与开裂的基因。这种基因是通过鉴别含有防止开裂的突变的Arabidopsis品系而揭示的。更特别地,这种分离的基因编码一种蛋白质,这种蛋白质与碱性螺旋-环-螺旋类转录因子类似。这种蛋白质产物在雌蕊群中发现,如实施例2的充分论述。编码野生型基因的cDNA是基于突变基因揭示的,详见实施例3所述。这一Arabidopsis基因可以用于筛选具有种荚的植物的基因组DNA,以鉴别同源基因,这提供了另外的核酸以用于抑制开裂。根据本发明鉴别的基因称为SGT10166基因。
通常称为种荚脱粒的开裂过程,是农作物如油料种子油菜(Brassica napus)的农学重要过程,这使种子损失导致产量减少。在不利的条件下这种损失可以高达50%(Coupe等,1994)。突变品系的SGT10166表现为不裂表型,从而长角果不打开,而且蛋白质类似bHLH家族的蛋白质。因此,SGT10166基因及同源基因可用于产生具有不裂表型的植物。不裂表型可以使用反义或显性阴性方法达到。就反义方法而言(Gray等,1992),必需首先从所需的农作物中通过与SGT10166基因的DNA同源性克隆相应的基因。显性阴性调节物可以通过缺失或突变蛋白质的DNA结合结构域而产生(Krylov等,1997)。通过螯合bHLH蛋白以形成失活的蛋白质二聚体,这种HLH蛋白可以作为显性阴性调节物。在这种方法中,可以直接使用这一Arabidopsis基因。
在转基因植物中干扰基因功能的方法包括导入一个合成基因,以有义或反义抑制靶基因(Taylor和Jorgensen,1992)。这种抑制方法要求靶基因和抑制基因实质上相似,核苷酸相同性要高于80%(Mol等,1994)。
如本文的进一步详述,SGT10166基因可以用于防止植物成熟果实的正常开裂。简而言之,为此使用SGT10166基因的两种方法是反义或有义抑制,以降低内源SGT10166基因的表达水平。第三种方法是使用SGT10166的调节序列指导致死基因产物在果实组织中的特异性表达(遗传消融)。
定义
本发明关于SGT10166引用了以下术语。
“改变的开裂作用”或“修饰的开裂表型”是指与亲代植物相比,对植物长角果组织的结构的物理修饰,从中可以获得表型经修饰的植物。肉眼可见的变化可以包括大小,形状,果实器官的数目或位置等方面的变化。精微的变化可包括产生果实结构的细胞类型或形状变化。这样修饰的果实表型在全部植物可以是一致的,而且典型发生在当植物中的每种细胞均含有用包含至少一部分SGT10166核酸的载体转化的细胞时。这种植物有时称为转基因植物。在特定植物中产生的表型依赖于设计用于产生其的载体。因此,载体可以设计为转录一种编码至少一部分SGT10166蛋白的核酸。在这种情况中,这样产生的SGT10166蛋白能基于细胞内存在该蛋白质而授与特殊表型。或者,可以构建载体,这样转录导致一种能与内源SGT10166或同源基因的RNA转录物杂交的转录物形成。这种方法利用本领域熟知的反义方法,并调制内源SGT10166基因的表型作用。对内源SGT10166基因的这种调制,也可以通过使用SGT10166基因的有义链以有义抑制内源SGT10166等位基因以及导入载体中的SGT10166基因而获得。基于如PCT出版物WO90/12084所述在Petunia hybrida中观测到的有义抑制,产生含有这种表型的植物也包括在本发明中。载体可以包含调节编码干扰细胞生长的蛋白质的基因转录的SGT10166启动子。在这种情况中,展示的改变的开裂作用可以是严重的萎缩或丧失果实结构。
“多核苷酸扩增”利用如聚合酶链反应(PCR),连接扩增(或连接酶链反应,LCR)及基于使用Q-β复制酶的扩增方法。也可以使用链置换扩增(SDA),嗜热SDA,和基于核酸序列的扩增(3SR或NASBA)。这些方法是本领域熟知的,并广泛用于本领域当中。见例如美国专利4683195和4683202,及Innis等(1990)(针对PCR);Wu和Wallace(1989)(针对LCR);美国专利5270184和5455166及Walker等(1992)(针对SDA);Spargo等(1996)(针对嗜热SDA)及美国专利5409818,Fahy等(1991)和Compton(1991)(针对3SR和NASBA)所述。进行PCR的试剂和硬件是可商购的。用于扩增来自SGT10166区域的序列的引物,优选互补于并特异性杂交该SGT10166区域或在靶区域两侧的区域中的序列。通过扩增产生的SGT10166序列可以直接进行测序。或者,但非必需地,扩增的序列可以在序列分析之前克隆。对酶促扩增的基因组节段进行直接克隆和序列分析的方法见Scharf等(1986)所述。
“分析物多核苷酸”和“分析物链”是指怀疑含有靶序列的单链或双链的多核苷酸,其可以存在于各种类型的样品中,包括生物学样品中。
“结合配偶体”是指能高度特异性结合配体分子的分子,例如互补的多核苷酸链或酶及其抑制剂。通常地,特异性结合配偶体必需以足够的亲和性结合,以在分离的条件下固定分析物拷贝/互补链双链体(在多核苷酸杂交的情况中)。在互补多核苷酸结合配偶体的情况中,此配偶体一般长度为至少大约15个碱基,并可以是至少40个碱基。本领域技术人员充分意识到也可以使用长度为少于15个碱基(例如8个碱基),15-40个碱基,及40个碱基以上的配偶体。多核苷酸可以由DNA,RNA或合成的核苷酸类似物组成。其它的结合配偶体可以使用例如所述双杂交酵母筛选分析鉴别。
“生物学样品”是指来自植物的怀疑含有分析物多核苷酸或多肽的组织或体液样品,包括但非限于例如花粉,胚珠,细胞,器官,组织和体外细胞培养成分样品。
“编码”:如果在其天然状态或当通过本领域熟知的方法操作时,多核苷酸可以被转录和/或翻译以产生多肽或其片段的mRNA时,则称此多核苷酸“编码”多肽。反义链是这种核酸的互补序列,而且可以从中推导编码序列。
“分离的”或“实质上纯化的”:一种“分离的”或“实质上纯化的”核酸(例如RNA,DNA或混合的聚合物),是一种从自然伴随天然植物序列或蛋白的其它细胞成分中实质上分离出的核酸,例如从核糖体,聚合酶,其它一些植物基因组序列和蛋白中分离出。这个术语包含一种核酸序列或蛋白质,其已经从其天然发生的环境中分离,并包括重组的或克隆的DNA分离物和化学合成的类似物或通过异源系统生物合成的类似物。
“SGT10166等位基因”是指SGT10166基因座的正常等位基因,以及分离自植物或根据本发明产生的发生变化的SGT10166等位基因。
“SGT10166基因座”,“SGT10166基因”,“SGT10166核酸”或“SGT10166多核苷酸”均指多核苷酸,所有这些均在SGT10166区域中,可以在正常组织中表达及参与开裂。SGT10166基因座包括编码序列,间插序列和控制转录和/或翻译的调节元件(例如启动子和增强子)。SGT10166基因座包括DNA序列的所有等位基因变体。
这些术语当用于核酸时,是指编码植物SGT10166多肽,其片段,同源物或变体的核酸,所述变体包括例如蛋白质融合体或缺失体。本发明的核酸将具有这样的序列,其衍生自或者实质上类似于天然的编码SGT10166的基因,或与天然的编码SGT10166的基因或其一部分具有较大同源性。术语SGT10166核酸有时统指SGT10166基因的有义和反义链。
SGT10166基因或核酸包括SGT10166基因的正常等位基因,包括对SGT10166多肽的氨基酸序列没有作用的沉默等位基因,以及使SGT10166多肽的氨基酸序列发生变化但不影响其功能的等位基因。这些术语还包括具有负面影响SGT10166多肽功能的一或多个突变的等位基因。突变可以是SGT10166核酸序列中的变化,其使SGT10166多肽的氨基酸序列产生缺失变化,导致SGT10166功能的部分或完全丧失,或可以是核酸序列中的变化,导致丧失有效的SGT10166表达或产生异常形式的SGT10166多肽。
SGT10166核酸可以是如SEQ ID NO:1所示,或可以是上述等位基因,或变体或衍生物,所述变体或衍生物通过所示序列的一或多个核苷酸的添加,插入,缺失和取代中的一或多种变化而与所示序列不同。核苷酸序列的变化可以导致或不导致在蛋白质水平氨基酸变化,如通过遗传密码所测定的。
因此,本发明的核酸可以包括一种序列,其不同于SEQ ID NO:1所示序列,但也编码具有与SEQ ID NO:2所示相同氨基酸序列的多肽。即本发明的核酸包括由于遗传密码简并并产生的序列。另一方面,编码的多肽可以包含一种氨基酸序列,其有一或多个氨基酸残基与SEQ ID NO:2所示氨基酸序列不同。本发明还提供了一种编码多肽的核酸,所述多肽是SEQ ID NO:2所示氨基酸序列的氨基酸序列变体,衍生物或等位物。
SGT10166基因也指(a)任何DNA序列,其(i)在高严格杂交条件下(Ausubel等,1992)与编码SEQ ID NO:2所示氨基酸序列的DNA序列的互补序列杂交,和(ii)编码一种与SGT10166功能相等的基因产物,或(b)任何DNA序列,其(i)在较低严格杂交条件下如中等严格条件下(Ausubel等,1992)与编码SEQ ID NO:2所示氨基酸序列的DNA序列的互补序列杂交,和(ii)编码一种与SGT10166功能相等的基因产物。本发明还包括与所述序列互补的核酸分子。
本领域技术人员易于意识到本发明的多核苷酸组合物包括有义链和反义链的RNA,cDNA,基因组DNA,合成形式,和混合的聚合物,并可以是化学或生物学修饰的,或可以含有非天然的或衍生的核苷酸碱基。这种修饰例如包括标记,甲基化,用类似物取代一或多个天然发生的核苷酸,核苷酸内修饰如非荷电的键(例如甲基膦酸酯,磷酸三酯,亚磷酰胺,氨基甲酸酯等),荷电键(例如硫代磷酸酯,二硫代磷酸酯等),悬垂组分(例如多肽),嵌入剂(例如吖啶,补骨酯素等),鳌合剂,烷化剂,和修饰的键(例如α端基异构核酸等)。还包括模拟多肽的通过氢键和其它化学相互作用结合指定序列的能力的合成分子。本领域已知这种分子,包括例如在分子骨架中用肽键取代磷酸键的那些分子。
本发明提供了包含所有或部分SGT10166区域的重组的核酸。此重组的构建体能在宿主细胞中自动复制。或者,此重组构建体可以整合入宿主细胞的染色体DNA中。这种重组的多核苷酸包含一种基因组的,cDNA的,半合成的,或合成的多核苷酸,通过其起源或操作,其1)与在天然状态相关的所有或部分多核苷酸不相关;2)与除了天然连接的多核苷酸之外的多核苷酸连接;或3)在天然状态不发生。当本发明的核酸包括RNA时,对所示序列的引述应被理解为引述RNA等价物,用U取代T。
因此,本发明提供了包含其它非天然发生的序列的重组核酸。尽管可以应用野生型序列,但也可以对其进行改变,例如通过缺失,取代或插入进行改变。可以筛选各种类型的cDNA或基因组文库,作为本发明核酸的天然原料,或者这种核酸可以通过扩增基因组DNA或其它天然原料中的序列而提供,例如通过PCR扩增。cDNA文库的选择通常是富含所需蛋白质的mRNA的组织原料。噬菌体文库通常是优选的,但也可以使用其它类型的文库。将文库的克隆涂布于平板上,移至底物中以进行筛选,变性并探查所需序列的存在与否。
本发明中使用的DNA序列通常包含至少5个密码子(15个核苷酸),更通常地包含大约7-15个密码子,最优选地包含大约35个密码子。也可以存在一或多个内含子。这个核苷酸数目通常是成功的探针所需的最短长度,所述探针特异性杂交编码SGT10166的序列。在本文中,少如8个核苷酸的寡聚物,更通常地8-17个核苷酸的寡聚物,可以用作探针,尤其在使用芯片方法时。
关于核酸操作方法通常见于例如Sambrook等(1989)或Ausubel等(1992)所述。用于这种方法中的试剂如限制酶等,是本领域熟知的,并可商购自如New England BioLabs,Boehringer Mannheim,Amersham,Promega,U.S.Biochemicals,New England和一些其它来源。用于产生本发明融合蛋白的重组核酸序列可以衍生自天然或合成序列。一些天然基因序列可使用适当探针得自各种cDNA或得自基因组文库。见GeneBank,国立健康研究所。
本文所用的SGT10166基因座或区域或等位基因的“一部分”是指具有最低至少大约8个核苷酸,或优选大约15个核苷酸,或更优选至少大约25个核苷酸,并可以具有最低至少大约40个核苷酸。这一定义包括8-40个核苷酸以及40个以上核苷酸范围内的所有规格。因此,这一定义包括8,12,15,20,25,40,60,80,100,200,300,400,500个核苷酸的核酸,或具有这些数值范围内任何数目核苷酸的核酸(例如9,10,11,16,23,30,38,50,72,121等个核苷酸),或具有500个以上核苷酸的核酸。本发明包括所有新的核酸,其具有至少8个衍生自SEQ ID NO:1,其互补序列或功能等价物核酸序列的核苷酸。本发明不包括现有技术领域存在的核酸。即本发明包括具有至少8个衍生自SEQ ID NO:1的核苷酸的所有核酸,条件是不包括现有技术领域存在的分离的核酸。
“SGT10166蛋白”或“SGT10166多肽”是指由SGT10166基因座或其变体或片段编码的一种蛋白质或多肽。术语“多肽”是指一种氨基酸聚合物及其等价物,不是指特殊长度的产物;因此,肽,寡肽和蛋白质均包括在多肽所限定的范围内。这个术语也不是指或排除修饰的多肽,例如经过糖基化,乙酰化,磷酸化等修饰。包括在限定范围内的是例如含有一或多个氨基酸类似物的多肽(包括例如非天然的氨基酸等),具有取代键的多肽以及本领域已知的其它修饰,包括天然和非天然发生的。通常地,这种多肽至少大约50%与天然的SGT10166序列同源,优选具有大约90%以上,更优选大约95%以上同源性。还包括由在高或低严格杂交条件下与编码SGT10166的核酸杂交的DNA编码的蛋白质,及密切相关的多肽或通过SGT10166蛋白的抗血清获得的蛋白质。
SGT10166多肽可以是如SEQ ID NO:2所示,其可以是分离的和/或纯化形式,没有或实质上没有天然与之伴随的物质。如果多肽是通过在原核细胞中表达产生的或合成产生的,多肽可以不进行翻译后加工,如糖基化。或者,本发明还涉及是SGT10166多肽的序列变体,等位物或衍生物的多肽。这种多肽通过添加,取代,缺失或插入一或多个氨基酸,可以具有不同于SEQ ID NO:2所示的氨基酸序列。在一个实施方案中,这些变体多肽的功能与SGT10166相似,这样可以将它们用于恢复能育性,或用于置换同源基因。在另一个实施方案中,这些变体肽不保留SGT10166功能,这样可以将它们用作显性阴性突变体。
取代变体典型地在蛋白质内的一或多个位点将一个氨基酸用另一个氨基酸置换,并可以设计为调节多肽的一或多种性质,如抗蛋白酶解的稳定性,但不丧失其它功能或性质。氨基酸取代可以基于包含的残基的极性,电荷,溶解性,亲水性,疏水性,和/或两亲性进行。优选的取代是保守取代,即将一个氨基酸用相似形状和电荷的氨基酸置换。保守取代是本领域所熟知的,并典型地包括下述组内的取代:甘氨酸,丙氨酸;缬氨酸,异亮氨酸,亮氨酸;天冬氨酸,谷氨酸;天冬酰胺,谷氨酰胺;丝氨酸,苏氨酸;赖氨酸,精氨酸;及酪氨酸,苯丙氨酸。
蛋白质结构中的一些氨基酸可以用其它氨基酸取代,而不丧失与结构的相互结合能力,所述结构例如抗体的抗原结合区或底物分子上的结合位点,或与SGT10166多肽相互作用的蛋白质上的结合位点。由于蛋白质的相互作用能力和性质确定蛋白质的生物功能活性,所以一些氨基酸取代可以在蛋白质序列及其DNA编码序列中进行,而且仍然获得具有相似性质的蛋白质。在进行这种变化中,可以考虑氨基酸的亲水指数。本领域已知疏水性氨基酸指数在授与蛋白质的相互作用生物功能中的重要性(Kyte和Doolittle,1982)。或者,类似的氨基酸取代可以基于亲水性而有效进行。本领域已知亲水性在授与蛋白质相互作用生物功能方面的重要性(美国专利4554101)。疏水指数或亲水性在设计多肽中的应用见于美国专利5691198的进一步论述。
用于同源性比较的多肽序列的长度一般为至少大约16个氨基酸,通常为大约20个残基,更通常为大约24个残基,典型地至少大约28个残基,优选大约35个以上残基。
“可操纵地连接”是指一种并列关系,其中所述成分以其固有方式起作用。例如,启动子影响编码序列的转录或表达,则称启动子可操纵地连于编码序列。
“探针”:SGT10166等位基因的探针可以衍生自SGT10166区域,其cDNA,功能等价物序列或其互补序列的序列。探针可以是任何适当长度的,其跨越SGT10166区域的全部或部分,并与此区域特异性杂交。如果靶序列含有与探针相同的序列,探针可以是短的,例如在大约8-30个碱基对范围内,这样杂交体在严格杂交条件下相对稳定。如果预期与探针有一些错配,即如果怀疑探针是否与变体区域杂交,可以应用较长的探针,其与靶序列以必需的特异性杂交。
探针包括一种附着于标记或报道分子的分离的多核苷酸,并可通过标准方法用于分离具有序列相似性的其它多核苷酸序列。关于制备和标记探针的方法见例如Sambrook等(1989)或Ausubel等(1992)所述。其它相似的多核苷酸可以使用同源的多核苷酸选择。或者,编码这些或相似多肽的多核苷酸可以是合成的,或通过使用遗传密码的丰余性选择的。可以进行各种密码子取代,例如通过沉默改变(从而产生各种限制位点)或使特定系统的表达最佳化。可以进行突变以修饰多肽的性质,或许可以改变多肽的降解或转换率。
包含本发明的合成寡核苷酸或其它多核苷酸的探针,可以衍生自天然发生的或重组的单链或双链多核苷酸,或可以是化学合成的。探针还可以通过切口平移,Klenow补平反应或本领域已知的其它方法而标记。
优选作为探针的是多核苷酸序列的一部分,所述序列具有来自编码SGT10166的多核苷酸序列的至少大约8个核苷酸,通常至少大约15个核苷酸,及少于大约9kb,通常少于大约1.0kb。这一定义因此包括8个核苷酸至9000个核苷酸大小的探针。因此,这一定义包括具有8,12,15,20,25,40,60,80,100,200,300,400或500个核苷酸的探针,或具有在这些数值范围内任何数目核苷酸(例如9,10,11,16,23,30,38,50,72,121等个核苷酸)的探针,或具有500个以上核苷酸的探针。探针还可以用于测定编码SGT10166的mRNA是否存在于细胞或组织中。本发明包括所有新探针,所述探针具有衍生自SEQ ID NO:1或SEQ ID NO:3,其互补序列或功能等价物核酸序列的至少8个核苷酸。本发明不包括现有技术领域中存在的探针。即本发明包括具有至少8个衍生自SEQ IDNO:1的核苷酸的所有探针,条件是不包括现有技术领域存在的探针。
类似考虑及核苷酸长度也适用于用于扩增所有或部分SGT10166基因的引物。因此,对引物所作的限定包括8,12,15,20,25,40,60,80,100,200,300,400,500个核苷酸的引物,或具有这些数值范围内任何数目核苷酸的引物(例如9,10,11,16,23,30,38,50,72,121等个核苷酸),或具有500个以上,或500-9000之间任何数目的核苷酸的引物。引物还可以用于确定编码SGT10166的mRNA是否存在于细胞或组织中。本发明包括所有具有衍生自SGT10166基因座的至少8个核苷酸的新引物,用于扩增SGT10166基因,其互补序列或功能等价物核酸序列。本发明不包括现有技术领域存在的引物。即本发明包括具有至少8个核苷酸的所有引物,条件是不包括现有技术领域存在的引物。
“蛋白质纯化”是指从其它生物学材料中分离SGT10166多肽的各种方法,如从用编码SGT10166的重组核酸转化的细胞中分离,这些方法是本领域所熟知的。例如,这种多肽可以采用通过常规方法对抗SGT10166而制备的抗体通过免疫亲和层析纯化。本领域熟知各种纯化蛋白质的方法,而且包括Deutscher(1990)和Scopes(1982)所述的那些方法。
术语“分离的”,“实质上纯化的”和“实质上均质的”是阐述一种蛋白质或多肽,其已经从在天然状态中与之伴随的成分中分离出。当样品的至少大约60%-75%呈现单一的多肽序列时,称此单体蛋白质是实质上纯化的。实质上纯化的蛋白质典型地包含大约60-90%w/w纯化的蛋白质样品,通常大约95%,优选是大约99%以上纯化的。蛋白质的纯度或均质性可以用本领域熟知的许多方式表示,如对蛋白质样品进行聚丙烯酰胺凝胶电泳,随后基于将凝胶染色观测单一的多肽条带。针对一些特定目的,通过使用HPLC或本领域熟知的用于纯化的其它方法可提供较高的分辨率。
当将SGT10166蛋白从在天然状态中与之伴随的天然沾染物中分离出时,SGT10166蛋白实质上没有天然伴随的成分。因此,化学合成的或在不同于其天然起源的细胞的细胞系统中合成的多肽,实质上没有天然伴随的成分。使用本领域熟知的蛋白质纯化方法分离,也可以使蛋白质实质上没有天然伴随的成分。
如本文所用,即使是在同源的细胞中表达的,作为一种分离的和操作的遗传序列的表达产物而产生的多肽,是一种“分离的多肽”。合成产生的形式或异源细胞表达的分子本来就是分离的分子。
“重组的核酸”是指一种核酸,其不是天然发生的,或其是通过人工组合两种另外分离的序列节段而产生的。这种人工组合通常通过化学合成方法,或通过人工操作分离的核酸节段而完成,例如通过遗传过程技术进行。这种方法通常是将所需功能的核酸节段结合在一起,以产生所需的功能组合。或者,是将一个密码子用一个相同编码的丰余密码子,或一个保守的氨基酸置换,同时典型地导入或除去一个序列识别位点。
“调节序列”是指通常距离基因座的100kb编码区之内的那些序列,但它们也可以是更远离编码区的序列,或者它们可以位于基因的内含子内,影响基因的表达(包括基因的转录,和翻译,剪接,稳定性或类似信使RNA的功能)。
“实质上的同源性,相似性或相同性”:如果当与其它的核酸(或其互补链)进行最佳排列时(具有适当的核苷酸插入或缺失),核苷酸序列中有至少60%的核苷酸碱基,通常至少大约70%,更通常大约80%,优选至少大约90%,更优选大约95-98%的核苷酸碱基是相同的,则称一种核酸或其片段与另一种核酸“实质上同源”(或“实质上相似”)。
相同性意味着两个多肽或两个多核苷酸序列之间的相关程度,这是通过这两个序列匹配的相同性测定的。相同性可以容易地计算的。有许多测定两个多核苷酸或多肽序列之间相同性的方法,术语“相同性”是本领域技术人员熟知的(计算分子生物学,Lesk AM编辑,牛津大学出版社,纽约,1988;Biocomputing:Informatics andGenome Projects,Smith DW编辑,学术出版社,纽约,1993;ComputerAnalysis of Sequence Data,Part I,Griffin AM和Griffin HG编辑,Humana出版社,新泽西,1994;分子生物学中序列分析,Heinje G,学术出版社,1987;序列分析引物,Gribskov M和Devereux J编辑,M Stockton出版社,纽约,1991)。通常用于测定两个序列之间相同性的方法包括但非限于Guide to Huge Computers,Martin J.Bishop.编辑,学术出版社,San Diego,1994,和Carillo和Lipman(1988)所述。测定相同性的优选方法是设计为在测试的两个序列之间提供最大程度的对比。这种方法编成了计算机程序。测定两个序列之间相同性的优选计算机程序包括但非限于GCG程序包(Devereux等(1984),BLASTP,BLASTN,FASTA(Altschul等(1990);Altschul等(1997))。
或者,当一种核酸或其片段在选择的杂交条件下与另一种核酸(或其互补链),链或其互补序列杂交时,存在实质上的同源性(或相似性或相同性)。当发生实质上比缺失全部特异性更具选择性的杂交时,存在杂交选择性。典型地,当大约14核苷酸的一段序列上有至少大约55%同源性,优选至少大约65%,更优选大约75%,最优选大约90%同源性时,选择性杂交发生。见Kanehisa(1984)所述。进行同源对比的序列长度可以是更长的一段序列,而且在一些实施方案中通常是至少大约9个核苷酸,经常是至少大约20个核苷酸,更通常是至少大约24个核苷酸,典型地是至少大约28个核苷酸,更特别地是至少大约32个核苷酸,优选是至少大约36个或更多个核苷酸。
除了碱基组成,互补链的长度,和杂交核酸之间的核苷酸碱基错配数目之外,核酸杂交将受这样的条件影响,如盐浓度,温度,或有机溶剂,这些将易于为本领域技术人员所意识到。严格的温度条件一般包括30℃以上,典型地37℃以上,优选45℃以上。严格盐浓度一般为1000mM以下,典型地为500mM以下,优选200mM以下。然而,参数的组合比测定任何单一参数更重要。严格条件依赖于核酸的长度和核酸的碱基组成,并可以通过本领域熟知的方法测定。见例如Wetmur和Davidson(1968)。
探针序列在一定条件下也可以特异性杂交双螺旋DNA,形成三螺旋的DNA或其它更高状态的DNA复合物。本领域熟知这种探针的制备和适当的杂交条件。
术语“实质上的同源性”或“实质上的相同性”,当指多肽时,是表示所述多肽或蛋白质与完整的天然发生的蛋白质或其一部分呈现至少大约30%相同性,通常为至少大约70%相同性,更通常为至少大约80%相同性,优选至少大约90%相同性,更优选至少大约95相同性。
就多肽而言,同源性是使用序列分析软件测定的。见例如遗传学计算机小组的序列分析软件包,Wisconsin大学生物技术中心,大学道910号,Madison,Wisconsin 53705,以及上述关于核酸同源性的软件。蛋白质分析软件使用测定由各种取代,缺失及其它修饰指定的同源性对比相似序列。保守取代典型包括以下各组内的取代:甘氨酸,丙氨酸;缬氨酸,异亮氨酸,亮氨酸;天冬氨酸,谷氨酸;天冬酰胺,谷氨酰胺;丝氨酸,苏氨酸;赖氨酸,精氨酸;苯丙氨酸,酪氨酸。
“实质上相似的功能”是指与野生型SGT10166核酸或野生型SGT10166多肽相比,一种修饰的核酸或修饰的蛋白质的功能。修饰的多肽实质上同源于野生型SGT10166多肽,并具有实质上相同的功能。修饰的多肽可以具有变化的氨基酸序列和/或可以含有修饰的氨基酸。除了功能相似之外,修饰的多肽可以具有其它有益的性质,如半衰期较长。修饰的多肽的功能(活性)相似性可以是实质上与野生型SGT10166多肽的活性相同。或者,修饰的多肽的功能(活性)相似性可以是高于野生型SGT10166多肽活性。修饰的多肽是用常规方法合成的,或是由修饰的核酸编码及用常规方法产生的。修饰的核酸是通过常规方法制备的。功能与野生型SGT10166基因功能实质上相似的核酸产生上述修饰的蛋白质。
多肽的“片段”,“一部分”,或“节段”是一段氨基酸残基序列,具有至少大约5-7个连续氨基酸,通常至少大约7-9个连续氨基酸,典型地具有至少大约9-13个连续氨基酸,最优选地具有至少大约20-30或更多个连续氨基酸。
本发明的多肽如果是可溶的,可以偶联于固相支持物,例如硝基纤维素,尼龙,层析柱包装物(例如琼脂糖珠),磁珠,玻璃棉,塑料,金属,高分子凝胶,细胞或其它底物。这种支持物可以采取例如珠,孔,dipsticks或膜形式。
“靶区域”是指进行扩增和/或检测的核酸的区域。术语“靶序列”是指一种序列,从中探针,引物或反义物在所需条件下将形成一种稳定的杂合体。
除非特别说明,本发明应用的是常规的化学,分子生物学,微生物学,重组DNA和遗传学方法。见例如Maniatis等(1982);Sambrook等(1989);Ausubel等(1992);Glover(1985);Anand(1992);Guthrie和Fink(1991);Weissbach和Weissbach(1986);Zaitlin等(1985)和Gelvin等(1990)。
使用方法:制备重组或化学合成的核酸;载体,转化,宿主细胞
通过在适当的宿主细胞中复制可以产生大量的本发明的多核苷酸。可以将编码所需片段的天然或合成的多核苷酸片段掺入重组多核苷酸构建体中,通常是DNA构建体,所述构建体能掺入原核或真核细胞中并在其中复制。通常此多核苷酸构建体适于在单细胞宿主中复制,如酵母或细菌,但也可以导入(在基因组内整合或不整合)培养的哺乳动物或植物或其它真核细胞系中。通过本发明方法产生的核酸的纯化方法见例如Sambrook等(1989)或Ausubel等(1992)所述。
本发明的多核苷酸也可以是通过化学合成产生的,例如通过Beaucage和Caruthers(1981)所述的亚磷酰胺方法,或Matteucci和Caruthers(1981)所述的三酯方法,也可以在商购的自动寡核苷酸合成仪上进行。双链的片段可以得自化学合成的单链产物,通过合成其互补链并在适当条件下将此链一起退火获得,或通过使用DNA聚合酶用适当的引物序列添加互补链获得。
所制备的导入原核或真核宿主的多核苷酸构建体,可以包含一个由宿主识别的复制系统,包括编码所需多肽的多核苷酸片段,并优选还包括可操纵地连于多肽编码节段的转录和翻译起始调节序列。表达载体可以包括例如复制或自动复制序列(ARS)的起点,和表达控制序列,启动子,增强子和必需的加工信息位点,如核糖体结合位点,RNA剪接位点,聚腺苷酸化位点,转录终止序列,和mRNA稳定序列。这种载体可以通过本领域熟知的标准重组方法制备,并例如Sambrook等(1989)或Ausubel等(1992)所述。
选择适当的启动子和其它必需载体序列以在宿主中起作用,而且如果合适可以包括那些与SGT10166基因天然伴随的。可使用的细胞系和表达载体组合例如Sambrook等(1989)或Ausubel等(1992)所述;也见于例如Metzger等(1988)所述。本领域已知许多有效的载体,并可以得自如Stratagene,New England Biolabs,PromegaBiotech等公司。启动子如trp,lac和噬菌体启动子,tRNA启动子和糖酵解酶启动子可以用于原核宿主。有效的酵母启动子包括金属硫蛋白,3-磷酸甘油酸激酶,或其它糖酵解酶如烯醇化酶或甘油醛-3-磷酸脱氢酶,参与麦芽糖和半乳糖利用的酶等的启动子区域。适用于酵母表达中的载体和启动子另外见于Hitzeman等,EP73675A。适当的非天然的哺乳动物启动子可包括SV40的早期和晚期启动子(Fiers等,1978)或衍生自Molony鼠白血病病毒,小鼠肿瘤病毒,禽肉瘤病毒,腺病毒II,牛乳头瘤病毒或多瘤病毒的启动子。昆虫启动子可以衍生自杆状病毒。另外,所述构建体可以与可扩增的基因(例如DHFR)结合,以便可以产生基因的多个拷贝。关于适当的增强子和其它表达控制序列,也见于增强子和真核 基因表达,冷泉港实验室出版社,冷泉港,纽约(1983)所述。也见于例如美国专利NO.5691198;5735500;5747469;和5436146所述。植物控制序列见例如美国专利No.5106739;5322938;5710267;5268526和5290294所述。
这种表达载体可以自动复制,也可以通过本领域熟知的方法插入宿主细胞的基因组中而复制。
表达和克隆载体可以含有一个选择标记,一个编码用载体转化的宿主细胞存活或生长所必需的蛋白质的基因。这个基因的存在保证了只是表达插入序列的那些宿主细胞生长。典型的选择基因编码蛋白质,其(a)授与对抗生素或其它毒性物质的抗性,例如氨苄青霉素,新霉素,氨甲喋呤等,(b)互补营养缺陷型缺陷,或(c)供给从复合培养基中不能获得的关键营养素,例如编码Bacilli的D-丙氨酸消旋酶的基因。根据宿主细胞选择正确的选择标记,而且本领域熟知不同宿主的适当标记。
含有相应核酸的载体可以在体外转录,所得RNA可以通过熟知方法导入宿主细胞中,例如通过注射(见Kubo等,1988),或可以通过本领域熟知的方法将载体直接导入宿主细胞中,这根据细胞宿主的类型加以变化,所述方法包括电穿孔;用氯化钙,氯化铷,磷酸钙,DEAE-葡聚糖或其它物质转染,微粒轰击;脂染;感染(载体是感染因子,如病毒基因组);及其它方法。一般见于Sambrook等,(1989)和Ausubel等(1992)所述。将多核苷酸通过上述本领域熟知方法导入宿主细胞参见“转化”章节。其中已经导入上述核酸的细胞也包括这些细胞的子代。
大量的本发明核酸和多肽,可以在与原核或真核宿主细胞中相容的载体或其它表达运载体中,通过表达SGT10166核酸或其一部分而制备。最常用的原核宿主是大肠杆菌,也可以使用其它原核生物如枯草芽胞杆菌,或假单胞菌。
哺乳动物或其它真核宿主细胞如酵母,丝状真菌,植物,昆虫,或两栖类或禽类等,也可以用于产生本发明的蛋白质。在培养物中增殖哺乳动物细胞是熟知的。见Jakoby和Pastan编辑(1979)。常使用的哺乳动物细胞系例如是VERO和HeLa细胞,中国仓鼠卵巢(CHO)细胞,和WI38,BHK和COS细胞系,本领域技术人员意识到其它细胞系也可以是适当的,例如提供较高的表达,所需的糖基化模式或其它特征。常使用的昆虫细胞系例如是SF9。
通过使用依赖于载体构建模式的标记选择克隆。所述标记可以是在相同或不同DNA分子上,优选在相同DNA分子上。在原核宿主中,转化体例如可以通过对氨苄青霉素,四环素或其它抗生素的抗性加以选择。基于温度敏感性产生特殊产物也可以作为适当标记。
用本发明的多核苷酸转化的原核或真核细胞,不仅对产生本发明的核酸和多肽有用,而且对例如研究SGT10166多肽的特性也有用。
基于所揭示的SGT10166基因序列的探针和引物,用于在其它物种中鉴别与SGT10166同源的基因序列和蛋白质。这些基因序列和蛋白质用于进行诊断/预测,如推测转基因植物中生殖表型,及用于对从中将它们分离出的物种的遗传工程方法中。
使用方法:控制生殖开裂
用于转化植物细胞的载体包含SGT10166核酸或其同源核酸或其一部分,其能杂交与Arabidopsis的SGT10166基因同源的内源性基因。为进行阐述,本发明针对SGT10166基因和SGT10166蛋白进行阐述。应理解的是这种阐述也包括同源基因和蛋白。因此,这种核酸包括编码所有或部分蛋白质的SGT10166或同源基因的正链,及反义链。在任一种情况下,SGT10166或同源核酸或其转录物能与限定的内源基因或其转录物杂交。发生这种杂交的条件包括在植物细胞内发现的生理学或相等条件,包括在核及胞质中发现的条件,以及技术人员测定两个核酸之间序列同源性所用的标准体外条件。这种体外条件范围是从中等(大约5×SSC,在52℃)至高度(大约0.1×SSC,在65℃)严格条件。
SGT10166或其同源基因用于构建有义或反义载体以转化植物细胞。通过使用二元载体可以便于构建这种载体,所述二元载体在植物和常规克隆宿主如原核生物中均能操作和选择。因此,这种二元载体可以包括卡那霉素或除草剂抗性基因以在植物细胞中进行选择,及放线菌素抗性基因以在细菌宿主中进行选择。这种载体当然还含有一个适于所用原核宿主的复制起点,及优选至少一个独特的限制位点或含有独特限制位点的多接头,以便于构建载体。
在一个实施方案中,一个组成型启动子用于驱动SGT10166核酸在受体植物的至少一部分生殖组织内表达。特别优选的启动子是花椰菜花叶病毒35S转录启动子(Guilley等,1982;Odell等,1985;和Saunders等,1987)。然而,也可以使用其它组成型启动子,如α-1和β-1微管蛋白启动子(Silflow等,1987)和组蛋白启动子(Chaubet等,1987)。也可以使用组织特异性启动子。例如,SGT10166基因的“内源性”启动子可以用于驱动反义或显性阴性转基因在野生型基因表达的区域中表达。
在本发明的另一个实施方案中,构建用于转化植物细胞以产生开裂表型改变的植物的载体,以定向于将SGT10166或同源核酸插入植物细胞的内源性启动子中。可用于定向于将SGT10166或同源核酸整合入内源性启动子中的一类载体,包含一个类似于Monsour等(1988)所述的阳性-阴性选择载体,Monsour等阐述了将内源性DNA定向于哺乳动物ES细胞中预定的内源性基因座。利用在植物细胞中阳性和阴性选择标记的功能的相似构建体,基于鉴别内源性植物启动子和其周围的序列可易于设计(Kempin等,1997)。当使用这种方法时,优选使用置换型载体使回复为野生型表型的可能性最小。
这样设计本发明的载体,使包含于载体中的启动子序列或植物细胞基因组中定向的启动子序列可操纵地连于编码SGT10166或同源基因的核酸。当SGT10166基因或同源基因的正链用于表达所有或部分SGT10166蛋白时,术语“可操纵地连接”是指启动子序列是相对于无性核酸编码序列而定位的,这样RNA聚合酶能启动SGT10166核酸序列从启动子序列中转录。在这种实施方案中,还优选的是提供适当的核糖体结合位点,转录起始和终止序列,翻译起始和终止序列及聚腺苷酸化序列,以产生功能性RNA转录物,其可以翻译为SGT10166蛋白。当使用反义方向的SGT10166核酸时,要求启动子是可操纵地连接的,以转录SGT10166反义链。因此,在这种实施方案中,只需要转录起始和终止序列以提供一种能杂交来自内源性SGT10166基因的mRNA或其它RNA转录物的RNA转录物。除了启动子之外,其它表达调节序列如增强子,可以加入载体中以便于SGT10166核酸在体内表达。
一旦构建了载体,可根据植物分子生物学领域已知的任何各种转化方法对植物进行转化。这些方法通常见于Wu和Grossman(1987)等所述。如本文所使用的,术语“转化”是指通过导入核酸序列改变植物细胞的基因型。转化植物细胞的特殊方法包括使用微量移液器直接将核酸微注射入植物细胞中。或者,使用聚乙二醇将核酸移至植物细胞中(Paszkowski等,1984)。其它转化方法包括原生质体的电穿孔(Fromm等,1985);用植物特异性病毒感染,例如花椰菜花叶病毒(Hohn等,1982),或使用来自植物特异性细菌如根瘤农杆菌的转化序列,例如基于根瘤农杆菌感染将Ti质粒导入植物细胞中(Horsch等,1984;Fraley等,1983)。或者,可以将包含于基质内的核酸或位于小珠或颗粒表面的核酸,通过高速弹道穿透导入植物细胞中,从而转化植物细胞(Klein等,1987)。用弹道导入的核酸可以是一种嵌合的寡核苷酸,设计为将少量突变的碱基定向于内源性SGT10166基因或同源基因的一个选择的节段(Beetham等,1999)。少量的突变碱基也可以使用同源重组方法导入内源性SGT10166基因的一个选择的节段中(Kempin等,1997)。
在将载体导入植物细胞之后,在再生植物之前进行选择成功的转化。这种选择转化不是必需的,但通过降低野生型背景便于选择具有所需表型的再生植物。这种选择一般是基于可以掺入转化载体中的抗生素抗性和/或除草剂抗性基因。
实际上,所有植物均可以从培养的细胞或组织中再生。如本文使用的,术语“再生”是指从一个植物细胞,一组植物细胞或植物的一部分中生长一个完整植物。本领域技术人员熟知再生植物的方法。例如,从培养的原生质体中再生如Evans等(1983);和H.Binding(1985)所述。当转化是器官部分时,可以从植物愈伤组织,外植体,器官或部分中再生。这种再生方法也为本领域技术人员熟知。见例如Wu和Grossman(1987);Weissbach和Weissbach(1986);和Klee等(1987)所述。
一旦已经再生了植物,基于开裂表型的变化选择一或多个植物。这5种选择可以是目测果实结构中总形态学变化,例如种荚不再打开,通过观测花序变化或通过观测显微镜下果实结构变化,例如通过电子显微镜观测等。
在那些显性表型是基于用含有SGT10166核酸的载体转化授与的时候,开裂作用的改变可能导致不育的植物。在这种情况中,可以通过插枝或组织培养技术产生多个相同植物而将植物无性繁殖。或者,当需要时,开裂作用的改变可以被消融,如本文的进一步阐述。
当转化的植物是以隐性表型为特征时,例如当使用反义构建体时,所述反义构建体不足以授与所需表型或授与不产生呈现不裂植物的中间表型,这种转化的植物可以内交至纯合以获得所需的表型。然后可以将这种植物无性繁殖或如本文进一步所述当需要时,开裂作用改变可以被消融。
使用SGT10166核酸的反义或共抑制机制可以导致开裂作用改变。具有这种修饰的开裂表型的植物可以用作模型系统以进一步研究植物中果实组织的形成和分化。
使用方法:植物转化的调节序列
本发明的另一方面提供了一种DNA分子,其包含可操纵地连于一或多个基因或反义DNA的SGT10166基因的调节序列。已经克隆并测定了Arabidopsis的全部基因组序列。基于所揭示的SGT10166的基因组序列,启动子和/或增强子和/或终止序列可易于通过检测基因库中的基因组序列而确定。调节序列可以是SGT10166启动子,内含子序列或终止序列。SGT10166启动子起自SEQ ID NO:3中外显子1的起始处,并向上游延伸大约2kb序列。在内含子1中至少发现1个调节序列。基因或反义DNA为转化的植物提供了一种农学有用的性状或选择标记。在一个实施方案中,DNA分子包括SGT10166启动子和影响基因表达的一个另外的核苷酸序列。影响异源基因调节的核苷酸序列例如包括增强子或活化区,如衍生自CaMV35S,冠瘿氨基酸合酶基因或其它植物基因(美国专利No.5106739;5322938;5710267;5268526;5290294)。在另一个实施方案中,一个启动子如CaMV 35S启动子与调节序列如SGT10166的内含子序列或终止序列一起使用。在第三个实施方案中,将SGT10166的内含子插入用于转化植物的DNA分子中,作为一种在存在转化细菌的情况下易于选择或鉴别转化的组织的方式。在第四个实施方案中,DNA分子是表达载体的一部分。在第五个实施方案中,DNA分子是转化载体的一部分。
本发明的另一方面提供了转化的植物细胞和组织,转化的植物和转化的植物的种子。基因或反义DNA的表达是由SGT10166调节序列和另外的调节序列调节的,如果存在另外的调节序列。
通过本发明的方法,农学基因和选择标记基因可以可操纵地连于SGT10166调节序列,并在转化的植物中表达。更特别地,可以对植物进行遗传工程化以表达各种农学相应的表型。这种基因包括但非限于本文所述的那些基因。
1.授与对害虫或疾病抗性或耐受性的基因
(A)植物疾病抗性基因:植物防御性通常是通过植物中疾病抗性(R)基因的产物与病原体中相应的无毒(Avr)基因的产物之间的特异性相互作用激活的。对各种植物可以用克隆的抗性基因转化,以对特异性病原株有抗性的植物进行遗传工程化。这种基因例如包括对Cladosporium fulvum有抗性的番茄Cf-9基因(Jones等,1994),番茄Pto基因,其编码一种蛋白质激酶,对Pseudomonas syringaepv.tomato有抗性(Martin等,1993),和对Pseudomonas syringae有抗性的Arabidopsis RSSP2基因(Mindrinos等,1994)。
(B)一种Bacillus thuringiensis蛋白,其衍生物或模仿其合成的多肽,如Btδ-外毒素基因的核苷酸序列(Geiser等,1986)。另外,编码δ-外毒素基因的DNA分子可以购自美国典型培养物保藏中心(Rockville,MD),ATCC保藏号为40098,67136,31995和31998。
(C)一种凝集素,如一些Clivia miniata甘露糖结合凝集素基因序列(Van Damme等,1994)。
(D)一种维生素结合蛋白,如亲和素和亲和素同源物,用作抗害虫的杀幼虫剂。见美国专利No.5659026。
(E)一种酶抑制剂,例如蛋白酶抑制剂或淀粉酶抑制剂。这种基因例如包括水稻半胱氨酸蛋白酶抑制剂(Abe等,1987),烟草蛋白酶抑制剂I(Huub等,1993),和α-淀粉酶抑制剂(Sumitani等,1993)。
(F)一种昆虫特异性肽或神经肽,在其表达的基础上可破坏所感染害虫的生理学特点。这种基因例如包括昆虫利尿激素受体(Reagan,1994),在Diploptera puntata中鉴别的allostatin(Pratt,1989),昆虫特异性瘫痪的神经毒素(美国专利No.5266361)。
(G)一种在自然界中由蛇,黄蜂等产生的昆虫特异性毒液,如蝎昆虫毒素肽(Pang,1992)。
(H)一种与单萜,倍半萜,类固醇,氧肟酸,phenylpropanoid衍生物或具有杀虫作用的其它非蛋白分子的过度积聚相关的酶。
(I)一种参与修饰包括翻译后修饰生物活性分子的酶;例如糖基化酶,蛋白酶,脂解酶,核酸酶,环化酶,转氨酶,酯酶,水解酶,磷酸酶,激酶,磷酸化酶,聚合酶,弹性蛋白酶,壳多糖酶和葡聚糖酶,无论是天然的还是合成的。这种基因例如包括马蹄莲基因(PCT出版物WO93/02197),壳多糖酶编码序列(其可以得自例如ATCC,保藏号3999637和67152),烟草钩虫(hookworm)壳多糖酶(Kramer等,1993)和欧芹ubi-2多遍在蛋白基因(Kawalleck等,1993)。
(J)一种刺激信号转导的分子。这种分子例如包括绿豆钙调蛋白cDNA克隆的核苷酸序列(Botella等,1994),玉米钙调蛋白cDNA克隆的核苷酸序列(Griess等,1994)。
(K)一种疏水性瞬间肽。见美国专利No.5659026和5607914,后者揭示了授与疾病抗性的合成的抗微生物肽。
(L)一种膜通透酶,一种通道形成因子或通道封阻因子,如杀菌肽-β-裂解肽类似物(Jaynes等,1993),其使转基因烟草植物对Psedomonas solanacearum有抗性。
(M)一种病毒蛋白或衍生自其中的多肽复合物。例如,在转化的植物细胞中积聚病毒外被蛋白提供了对病毒感染和/或疾病的抗性,所述疾病是感染外被蛋白衍生自其中的病毒以及相关的病毒而产生的。转化的植物已经授与了外被蛋白介导的对苜蓿花叶病毒,黄瓜花叶病毒,烟草线条病毒,马铃薯病毒X,马铃薯病毒Y,烟草蚀刻病毒,烟草脆裂病毒和烟草花叶病毒的抗性。见例如Beachy等(1990)所述。
(N)一种昆虫特异性抗体或衍生自其中的免疫毒素。因此,定向于昆虫内脏临界代谢功能的抗体,灭活一种受影响的酶,杀死昆虫。例如,Taylor等(1994)揭示了通过产生单链的抗体片段在转基因烟草中的酶促灭活。
(O)一种病毒特异性抗体。见例如Tavladoraki等(1993),其揭示了表达重组抗体基因的转基因植物可以免于病毒侵袭。
(P)一种在自然界中由病原体或寄生虫产生的发育抑制性蛋白。因此,真菌endo-α-1,4-D多聚半乳糖醛酸酶,通过溶解植物细胞壁homo-α-1,4-D半乳糖醛酸酶,促进真菌定居和植物营养素释放(Lamb等,1992)。编码大豆内多聚半乳糖醛酸酶抑制蛋白的基因的克隆和特征由Toubart等(1992)阐述。
(Q)一种在自然界中由植物产生的发育抑制性蛋白,如大麦核糖体灭活基因,对真菌性疾病的抗性提高(Longemann等,1992)。
2.授与对除草剂抗性或耐受性的基因
(A)一种抑制生长点或分生组织的除草剂,如imidazalinone或磺脲。这类基因编码突变体ALS(Lee等,1988)和ALHAS酶(Miki等,1990)。
(B)草甘膦(由突变体EPSP合酶和aroA基因授与抗性)和其它膦酸化合物如glufosinate(PAT和bar基因),及pyridinoxy或苯氧丙酸和cyclohexones(ACCase抑制剂编码基因)。见例如美国专利No.4940835所述,其揭示了EPSP合酶形式的核苷酸序列,其可以授与草甘膦抗性。编码突变体aroA基因的DNA分子可以得自ATCC,保藏号为39256,此突变体基因的核苷酸序列由美国专利No.4769061揭示。欧洲专利申请No.0333033和美国专利No.4975374揭示了谷氨酰胺合酶基因的核苷酸序列,其授与对除草剂的抗性如L-膦丝菌素的抗性。膦丝菌素乙酰转移酶基因的核苷酸序列是由欧洲专利申请No.0242246提供的。De Greef等(1989)阐述了表达嵌合的bar基因的转基因植物,所述基因编码膦丝菌素乙酰转移酶活性。授与对苯氧基丙酸和cyclohexones抗性的基因,例如sethoxydim和haloxyfop,是由Marshall等(1992)所阐述的Acc1-S1,Acc1-S2和Acc1-S3基因。
(C)一种抑制光合作用的除草剂,如三嗪(psbA和GST基因)和氰苯(腈水解酶基因)。Przibilla等(1991)阐述了使用编码突变体psbA基因的质粒转化衣滴虫。腈水解酶的核苷酸序列是由美国专利4810648揭示的,含有这些基因的DNA分子可得自ATCC,保藏号53435,67441和67442。编码GST(谷胱甘肽S-转移酶)的DNA的克隆和表达由Hayes等(1992)揭示。
3.授与对环境应激有抗性或耐受性的基因
(A)寒冷,冰冻或霜冻。这包括编码防冰冻的蛋白质的基因,和编码合成防冷冻溶质的酶的基因。这种基因例如是ArabidopsisCOR15a(Artus等,1996)和菠菜CAP160(Kaye等,1998)。这类基因还包括控制其它耐寒基因活性的调节基因(PCT国际出版物WO98/09521)。
(B)干旱或水应激。Kasuga等(1999)报道了在转基因植物中怎样应激可诱导的DREB1A的表达,以提高其对干旱的耐受性。Pilon-Smits等(1998)报道了在转基因烟草中表达合成海藻糖的细菌基因,产生对水应激的耐受性。
(C)盐度或盐应激。编码在高盐情况下最小吸收钠盐或使植物在液泡中隔绝钠盐的蛋白质的基因,可以使植物耐受土壤中高水平的盐分。由Rubio等(1999)所述的小麦HKT1钾转运蛋白是前者的一个实例。Apse等(1999)阐述了Arabidopsis Na+/H+反向转运蛋白怎样以后一方式起作用。
(D)金属。防金属如铝和镉的毒性作用可以通过转基因表达一种基因而达到,所述基因阻止金属的吸收,或编码结合金属离子的鳌合剂,以免于金属离子的毒性作用。这种基因例如是ArabidopsisALR104和ALR108(Larsen等,1998)及编码参与植物鳌合肽合成的酶的基因(Schafer等,1998)。
4.授与或提供附加值性状的基因
(A)修饰脂肪酸代谢,例如通过用反义基因或硬脂酰-ACP脱饱和酶转化玉米或芸苔,以提高植物的硬脂酸含量(Knutzon等,1992)。
(B)降低肌醇六磷酸含量
(1)导入肌醇六磷酸酶编码基因可以增强肌醇六磷酸的破坏,在转化的植物增加更多游离的磷酸盐,如Aspergillus niger肌醇六磷酸酶基因(Van Hartingsveldt等,1993)。
(2)导入一种基因以降低肌醇六磷酸含量。例如在玉米中,这可以通过将一种DNA克隆然后再导入而达到,所述DNA与应答特征在于低水平植酸的玉米突变体的一个等位基因相关联(Raboy等,1990)。
(C)修饰碳水化合物组分,例如通过用编码改变淀粉分支模式的酶的基因转化植物。这种酶例如包括Streptococcus mucus果糖转移酶基因(Shiroza等,1988),Bacillus subtilis果聚糖蔗糖酶基因(Steinmetz等,1985),Bacillus licheniformisα-淀粉酶(Pen等,1992),番茄转化酶(Elliot等,1993),大麦淀粉酶基因(Sφgaard等,1993),和玉米胚乳淀粉分支酶II(Fisher等,1993)。
(D)修饰木质素含量。木质素的数量或组分可以通过提高或降低phenylpropanoid木质素前体的生物合成酶的表达而改变,如苯丙烯盐醇脱氢酶(CAD),4-香豆酸(coumarate):CoA连接酶(4CL),和O-甲基转移酶(OMT)。参与木质素形成的这些和其它基因见于美国专利5850020所述。
5.选择标记基因
(A)可获得各种选择标记基因以用于转化植物,包括但非限于新霉素磷酸转移酶II,潮霉素磷酸转移酶,EPSP合酶和二氢叶酸合酶。见Miki等(1993)所述。
合成适用于本发明的基因可以通过互利引发长的寡核苷酸而进行。见例如Ausubel等(1990)和Wosnick等(1987)所述。另外,目前使用聚合酶链反应可以合成长度为6kb或更长的基因。见Adang等(1993)和Bambot等(1993)所述。另外,通过常规的自动方法可以便利地合成基因。
实施例
本发明参考以下实施例得以进一步阐述,但以下实施例无任何限制本发明之意。实施例中使用的是本领域熟知的标准方法或其它特别阐述的方法。
实施例1:分离和突变表型
使用转座子介导的基因阱诱变方法,我们分离了一种阻断长角果开裂过程的突变(Sundaresan等,1995)。
SGT10166突变分离自使用基因阱Ds转座因子产生的独立插入品系。双因子转座子系统利用一个玉米Ac-Ds转座子和报道基因GUS(Sundaresan等,1995)。在基因阱插入品系SGT10166中,SGT10166突变体是在基因阱品系的F3子代中鉴别的,其中长角果呈现不裂表型(图2)。从胎座框中不能分离出瓣,而且只有在手工打开果实时才能收获种子。除了不裂表型,植物的其它方面是正常的。
实施例2:GUS表达模式
插入Ds基因阱元件使GUS报道基因表达,这样可以通过对GUS活性进行组织化学染色分析基因的内源性表达模式(见Sundaresan等,1995)。在雌蕊柱顶部的幼芽中开始GUS表达。稍后,随着发育,表达延伸至柱头毛中和雌蕊的末梢部分。在成熟的花中,在全部雌蕊株中表达。在受精后,在长角果中,表达限于瓣胎座框分界处,比在瓣的远端和近端部分更强(图3)。
实施例3:基因分析
为了解产生不裂表型的缺陷的性质,对基因进行进一步定性。通过Tail PCR扩增在Ds因子侧翼的基因组DNA的片段(Parinov等,1999)。对拟南芥基因组数据库进行的研究表明侧翼序列与来自染色体5的基因组序列相同,所述序列包含于BAC克隆内,登记号为AB020742。设计基因特异性引物以扩增来自拟南芥花cDNA文库的cDNA序列的一部分(cDNA克隆分离自从生态型Landsbergerecta中制备的拟南芥花cDNA文库。此cDNA文库得自Ohio State大学的Arabidopsis Stock中心ABRC,而且已经使用Stratagene Uni-ZAP XR载体系统构建(Weigel等,1992)。根据生产者的指导筛选此文库)。然后将PCR片段用作探针以筛选相同的文库。由这种筛选分离的cDNA的长度为931bp,并推测其编码一个210个氨基酸的蛋白质。对此cDNA序列进行的分析表明在SGT10166和属于碱性螺旋环螺旋(bHLH)类转录因子的蛋白质之间有明显的相似性。bHLH家族蛋白质的成员在动物,植物和真菌中的转录调节中起重要作用。这些蛋白质通常与HLH区域作为二聚体参与同源/异源二聚体化过程,而且碱性结构域结合DNA。在植物中,已经鉴别了许多bHLH结构域蛋白而且具有不同的功能(Murre等,1989)。例如,bHLH蛋白在玉米中调节花青素的生物合成(B-Peru和R/Lc基因)(Radicella等,1991;Ludwig等,1989),应答Arabidopsis中脱落酸和脱水(rd22 BPI)(Abe等,1997),及Phaseolus(PG1)中种子贮存蛋白的表达(Kawagoe和Murai,1996)。
SGT10166的具有外显子和内含子的基因组序列示于SEQ IDNO:3。SEQ ID NO:3的序列示于表1。
表1:SGT10166基因的外显子和内含子
  外显子/内含子   5’核苷酸   3’核苷酸
  外显子1   1007(起始密码子)   1243
  内含子1   1244   1355
  外显子2   1356   1427
  内含子2   1428   1517
  外显子3   1518   1583
  内含子3   1584   1661
  外显子4   1662   1727
  内含子4   1728   1821
  外显子5   1822   2013(终止密码子)
实施例4:回复分析
为证实在SGT10166中所观测到的表型是由插入Ds元件引起的,进行回复分析(Yang等,1999)。对Ds插入位点进行的DNA序列分析表明插入Ds未产生一个典型的8bp靶位点重复。在Ds插入位点所存在的碱基对变化示于图5。图5所示野生型ALC序列(SEQID NO:8)相当于SEQ ID NO:1的第331-352位碱基。标记位点示于SEQ ID NO:9和10,其由插入序列间隔。将Ds通过与携带Ac转座酶基因的植物杂交而再迁移(Sundfaresan等,1995),并用回复的野生型部分观测8个突变的植物,回复的野生型即具有开裂的长角果。种植来自这些回复体长角果的种子,对制备的DNA和期望得自Ds切除的序列变化进行分析。所有测序的回复体基因均含有一个切除的Ds因子,这由没有Ds序列而显示出来的,和在相同位点的一个9bp足迹。此足迹回复读框并在原始蛋白质上添加了3个额外的氨基酸(图5,SEQ ID NO:11的黑体的9个碱基示出回复体)。这个结果证实突变是由在SGT10166基因座插入Ds所引起的。例外还分离了不回复读框的具有10bp足迹的一个稳定的等位基因,并称之为alc10(图5;SEQ ID NO:12)。这种alc10植物是所期望的不裂的。
实施例5:互补研究
为证实SGT10166的分离的cDNA序列足以提供开裂作用,我们通过农杆菌介导的转化方法(Clough和Bent,1998),将推定的在CaMV 35S启动子控制下的SGT10166的全长cDNA克隆导入突变的植物中。获得15个独立的转化体,在2个突变植物中完整回复了开裂作用。这些结果示出分离的序列是果实开裂所必需的而且是足够的。
实施例6:显性阴性研究
由于SGT10166基因编码一种myc-相关的bHLH结构域蛋白,因此可以产生对抗其的显性阴性调节物,以改变开裂过程。我们通过缺失SGT10166基因的碱性结构域,并用酸性序列置换,产生了这样一种显性阴性构建体(Krylov等,1997)。这种蛋白质应作为显性阴性调节物,通过螯合内源性SGT10166 bHLH蛋白以形成失活的二聚体。这个构建体是通过缺失SEQ ID NO:1的第290-340位碱基而产生的(示作SEQ ID NO:13),并用SEQ ID NO:14置换以产生编码SEQ ID NO:16的SEQ ID NO:15。将此构建体通过农杆菌介导的转化方法(Clough和Bent,1998)转化入野生型Arabidopsis植物中。在所得35个独立的转化体中的2个转化体中,我们能将开裂作用延迟接近2周。这个结果也可以解释为共抑制机制的结果而不是所述显性阴性的作用。但是无论如何,我们确定SGT10166基因可以用于转基因植物中以延迟开裂。类似地,应该也可以使用反义方法通过降低这个基因的活性而遗传工程化不裂或开裂延迟的植物(Gray等,1992)。
本发明通过参考优选的实施方案已经加以详细论述,应意识到所揭示的内容只是举例说明了本发明而无限制之意,本领域技术人员在本发明的精神和所附权利要求的范围内,可对本发明加以修改。
参考文献列表
Abe等人(1987).生物化学杂志262:16793.
Abe,H.et al.,(1997),植物细胞9:1859.
Adang等人(1993).植物分子生物学21:1131.
Anand,R.(1992).复杂基因组的分析技术(学术出版社).
Altschul,S.F.等人(1990).分子生物学杂志215:403.
Altschul,S.F.等人(1997).核酸研究25:3389-3402.
Apse,MP等人(1999).科学285:1256-1258.
Ausubel,F.M.等人(1992).分子生物学当前方案(John Wiley&Sons,New York,NY).
Bambot等人(1993).PCR方法和应用2:266.
Beachy等人(1990).Ann.Rev.Phytopathol.28:451.
Beaucage,SL and Caruthers,MH(1981).Tetra.Letts.22:1859-1862.
Beetham PR.(1999).美国科学院院刊96:8774-8778.
生物计算:信息学和基因组计划,Smith,D.W.编辑,学术出版社,NY(1993).
Bloksberg,LN等人(1998).US专利号5,850,020.
Botellaetal.(1994).植物分子生物学24:757.
Carillo,H.and Lipman,D.(1988).SIAM J.Applied Math.48:1073.
Chaubet等人(1987).发育遗传学8:461-473.
Compton,J(1991).自然350:91-92.
计算分子生物学,Lesk,A.M.,编辑,Oxford Univ.Press,NY(1988).
序列数据的计算机分析,第I部分,Griffin,A.M.,and Griffin,H.G.,eds.,Humana Press,NJ(1994).
Coupe,S.A.et al.,(1994).植物分子生物学24:223.
DeGreef等人(1989).Bio/Technology 7:61.
Deutscher,M(1990).酶学方法182:83-89(学术出版社,SanDiego,CA).
Elliot等人(1993).植物分子生物学21:515.
增强子及真核基因表达,冷泉港实验室,Cold Spring Harbor,NY(1983).
Evans等人(1983).原生质体分离和培养,植物细胞培养手册1:124-176(MacMillan Publishing Co.,NY).
Fahy,E等人(1991).PCR方法及应用1:25-33.
Fiers,Wet al.(1978).自然273:113-120.
Fisher等人(1993).植物生理学102:1045.
Fraley等人(1983).美国科学院院刊80:4803.
Fromm等人(1985).美国科学院院刊82:5824.
Geiser等人(1986).基因48:109.
Gelvin,S.等人(eds)(1990).植物分子生物学手册,Kluwer学术出版社,Dordrecht,Netherlands
Glover,D(1985).DNA克隆,I和II(Oxford Press).
Gray,J.et al.,(1992).植物分子生物学19(1):69-87
Griess EA等人(1994).植物生理学104:1467-1468.
Gu Q等人(1998),发育125:1509.
巨型计算机指南,Martin J.Bishop,ed.,学术出版社,San Diego,CA(1994).
Guilley等人(1982).细胞30:763-773(1982).
Guthrie,G and Fink,GR(1991).酵母遗传学和分子生物学指南(学术出版社).
Hayes等人(1992).Biochem.J.285:173.
Hohn等人(1982).植物肿瘤的分子生物学(学术出版社,NY),pp.549-560.
Horsch等人(1984).科学233:496-498.
Huub等人(1993).植物分子生物学21:985.
Innis,MA等人(1990).PCR方案:方法和应用指南(学术出版社,San Diego,CA).
Jakoby,WB and Pastan,IH(eds.)(1979).细胞培养.酶学方法Vol.58(学术出版社,Harcourt Brace Jovanovich(NY)).
Jaynes等人(1993).植物科学89:43.
Jones等人(1994).科学266:789.
Kanehisa,M(1984).核酸研究12:203-213.
Kasuga M.等人(1999).自然生物技术.17:287-291.
Kawagoe,Y.and Murai,N.(1996),植物科学116:47
Kawalleck等人(1993).植物分子生物学21:673.
Kaye,C等人(1998).植物生理学116:1367-1377.
Kempin,SA等人(1997).自然389:802-803.
Klee等人(1987).Ann.Review of Plant Physiology 38:467-486.
Klein等人(1987).自然327:70-73.
Knultzon等人(1992).美国科学院院刊89:2624.
Kramer等人(1993).Insect Molec.Biol.23:691.
Krylov D等人(1997)美国科学院院刊94:12274-12279.
Kubo,T等人(1988).FEBS Lett.241:119.
Kyte,J and Doolittle,RF(1982).J Mol.Biol.157:105-132.
Lamb等人(1992).Bio/Technology 10:1436.
Larsen,PB等人(1998).植物生理学117:9-18.
Longemann等人(1992).Bio/Technology 10:3305.
Ludwig,S.et al.,(1989).美国科学院院刊86:7092-7096.
Maniatis,T等人(1982).分子克隆实验手册(冷泉港实验室,ColdSpring Harbor,NY).
Marshall等人(1992).Theor.Appl.Genet.83:435.
Martin等人(1993).科学262:1432.
Matteucci,MD and Caruthers,MH(1981).J.Am.Chem.Soc.103:3185.
Metzger,D等人(1988).自然334:31-36.
Miki等人(1990).Theor.Appl.Genet.80:449.
Miki等人(1993).″将外源DNA导入植物的程序,″,见植物分子生物学和生物工程方法,Glick等人(eds.),CRC Press,pp.67-88.
Mindrinos等人(1994).细胞78:1089.
Mol,J.M.N.等人(1994).基因表达的转录后抑制:有义和反义基因.In:J.Paszkowski(Ed.).植物中的同源重组和基因沉默.KluwerAcademic Publishers.Dordrecht,Netherlands.pp.309-334.
Monsour等人(1988).自然336:348-352.
Murre,C.et al.,(1989).细胞56:777-783.
Odell等人(1985).自然313:810-812.
Pang等人(1992).基因116:165.
Parinov,S.et al.,(1999).植物细胞11:2263-2270.
Pen等人(1992).Bio/Technology 10:292.
Pilon-Smits EAH等人(1998).植物生理学杂志152:525-532.
Przibilla等人(1991).植物细胞3:169.
Radicella,J.P.等人(1991).植物分子生物学17:127.
Raboy等人(1990).Maydica 35:383.
Regan(1994).生物化学杂志269:9.
Sambrook,J.等人(1989).分子克隆实验手册,2nd Ed.(冷泉港实验室,Cold Spring Harbor,NY).
Schafer,HE等人(1998).植物分子生物学37:87-97.
Scharf,SJ等人(1986).科学233:1076-1078.
Scopes,R(1982).蛋白质纯化原理和实践,(Springer-Verlag,NY).
分子生物学中的序列分析,von Heinje,G.,学术出版社(1987).
序列分析引物,Gribskov,M.and Devereux,J.,eds.,M StocktonPress,NY(1991)
威斯康星大学生物工程中心遗传学计算机小组序列分析软件包,Madison,WI.
Sessions,A.,(1999).植物科学趋势,Vol.4.
Shiroza等人(1988).J.Bacteriol.170:810.
Silflow等人(1987).发育遗传学8:435-460.
Sgaard等人(1993).生物化学杂志268:22480.
Spargo,CA等人(1996).Mol.Cell.Probes 10:247-256.
Steinmetz等人(1985).Mol.Gen.Genet.200:220.
Sumitani等人(1993).Biosci.Biotech.Biochem.57:1243.
Sundaresan,V.et aL,(1995).基因Dev.9:1797.
Tavladoraki等人(1993).自然266:469.
Taylor,L.P.and Jorgensen,R.A.(1992).J.Hered.83:11-17.
Taylor等人(1994).Abstract#497,Seventh Int′l.Symposium onMolecular Plant Microbe Interactions.
Toubart等人(1992).植物杂志2:367.
Van Damme等人(1994).植物分子生物学24:825.
Van Hartingsveldt等人(1993).基因127:87.
Walker,GT等人(1992).核酸研究20:1691-1696.
Weissbach,A.and Weissbach,H.(eds)1986.酶学方法,Volume118,学术出版社,Orlando,FL.
Wetmur,JG and Davidson,N(1968).分子生物学杂志31:349-370.
Weigel D.等人(1992)细胞69:843-859
Wosnick等人(1987).基因60:115-127.
Wu,DY and Wallace,RB(1989).Genomics 4:560-569.
Wu and Grossman(1987).酶学方法Vol.153,″Recombinant DNAPart D″.学术出版社,NY.
Yang WC等人(1999)基因和发育13:2108-2117
Zaitlin,M.等人(eds)(1985).植物科学生物工程,学术出版社,Orlando,FL.
专利和专利申请
Hitzeman et al.,EP 73,675A.
欧洲专利申请0 242 246
欧洲专利申请0 333 033
PCT公开WO 90/12084
PCT公开WO93/02197
PCT公开WO98/09521
U.S.专利号4,554,101.
U.S.专利号4,683,195.
U.S.专利号4,683,202.
U.S.专利号4,769,061
U.S.专利号4,810,648
U.S.专利号4,940,835
U.S.专利号4,975,374
U.S.专利号5,106,739.
U.S.专利号5,266,361.
U.S.专利号5,268,526.
U.S.专利号5,270,184.
U.S.专利号5,290,294.
U.S.专利号.5,322,938.
U.S.专利号5,409,818.
U.S.专利号5,436,146.
U.S.专利号5,455,166.
U.S.专利号5,607,914
U.S.专利号5,633,441.
U.S.专利号5,659,026
U.S.专利号5,691,198.
U.S.专利号5,710,267.
U.S.专利号5,735,500.
U.S.专利号5,747,469
U.S.专利号5,850,020
SEQUENCE LISTING
<110>分子农业生物学院
<120>开裂基因和调节开裂作用的方法
<130>GM/MC/R33-102
<140>PCT/SG01/00017
<141>2001-02-01
<150>PCT/SG00/00022
<151>2000-02-11
<160>16
<170>PatentIn version 3.0
<210>1
<211>931
<212>DNA
<213>Arabidopsis thaliana
<220>
<221>CDS
<222>(23)..(652)
<400>1
agagagagag agagagagag ag atg ggt gat tct gac gtc ggt gat cgt ctt   52
                         Met Gly Asp Ser Asp Val Gly Asp Arg Leu
                         1               5                   10
ccc cct cca tct tct tcc gac gaa ctc tcg agc ttt ctc cga cag att    100
Pro Pro Pro Ser Ser Ser Asp Glu Leu Ser Ser Phe Leu Arg Gln Ile
                15                  20                  25
ctt tcc cgt act cct aca gct caa cct tct tca cca ccg aag agt act    148
Leu Ser Arg Thr Pro Thr Ala Gln Pro Ser Ser Pro Pro Lys Ser Thr
            30                  35                  40
aat gtt tcc tcc gct gag acc ttc ttc cct tcc gtt tcc ggc gga gct    196
Asn Val Ser Ser Ala Glu Thr Phe Phe Pro Ser Val Ser Gly Gly Ala
        45                  50                  55
gtt tct tcc gtc ggt tat gga gtc tct gaa act ggc caa gac aaa tat    244
Val Ser Ser Val Gly Tyr Gly Val Ser Glu Thr Gly Gln Asp Lys Tyr
    60                  65                  70
gct ttc gaa cac aag aga agt gga gct aaa cag aga aat tcg ttg aag    292
ALa Phe Glu His Lys Arg Ser Gly Ala Lys Gln Arg Asn Ser Leu Lys
75                  80                  85                  90
aga aac att gat gct caa ttc cac aac ttg tct gaa aag aag agg agg    340
Arg Asn Ile Asp Ala Gln Phe His Asn Leu Ser Glu Lys Lys Arg Arg
                95                  100                 105
agc aag atc aac gag aaa atg aaa gct ttg cag aaa ctc att ccc aat    388
Ser Lys Ile Asn Glu Lys Met Lys Ala Leu Gln Lys Leu Ile Pro Asn
            110                 115                 120
tcc aac aag act gat aaa gcc tca atg ctt gat gaa gct ata gaa tat    436
Ser Asn Lys Thr Asp Lys Ala Ser Met Leu Asp Glu Ala Ile Glu Tyr
        125                 130                 135
ctg aag cag ctt caa ctt caa gtc cag act tta gcc gtt atg aat ggt    484
Leu Lys Gln Leu Gln Leu Gln Val Gln Thr Leu Ala Val Met Asn Gly
    140                 145                 150
tta ggc tta aac cct atg cga tta cca cag gtt cca cct cca act cat    532
Leu Gly Leu Asn Pro Met Arg Leu Pro Gln Val Pro Pro Pro Thr His
155                 160                 165                 170
aca agg atc aat gag acc tta gag caa gac ctg aac cta gag act ctt    580
Thr Arg Ile Asn Glu Thr Leu Glu Gln Asp Leu Asn Leu Glu Thr Leu
                175                 180                 185
ctc gct gct cct cac tcg ctg gaa cca gct aaa aca agt caa gga atg    628
Leu Ala Ala Pro His Ser Leu Glu Pro Ala Lys Thr Ser Gln Gly Met
            190                 195                 200
tgc ttt tcc aca gcc act ctg ctt tgaagataac attcagacaa tgatgatgat   682
Cys Phe Ser Thr Ala Thr Leu Leu
        205                 210
cggaattcct ctagtacctg ccagacagga gtgaacaatg ttttgagttt tagcattggc  742
cagatttcta tgttcagtta tagttatgct aataagcttt aggagtgaac aaaatctgag  802
tagtttgatt ataatgatgt ctgaagcaga ttatatataa aagactaatt tacttacata  862
tgagatgatt attacaacta tcaaatgact atgtctgtga gttgcatcca aaaaaaaaaa  922
aaaaaaaaa                                                          931
<210>2
<211>210
<212>PRT
<213>Arabidopsis thaliana
<400>2
Met Gly Asp Ser Asp Val Gly Asp Arg Leu Pro Pro Pro Ser Ser Ser
1               5                   10                  15
Asp Glu Leu Ser Ser Phe Leu Arg Gln Ile Leu Ser Arg Thr Pro Thr
            20                  25                  30
Ala Gln Pro Ser Ser Pro Pro Lys Ser Thr Asn Val Ser Ser Ala Glu
        35                  40                  45
Thr Phe Phe Pro Ser Val Ser Gly Gly Ala Val Ser Ser Val Gly Tyr
    50                  55                  60
Gly Val Ser Glu Thr Gly Gln Asp Lys Tyr Ala Phe Glu His Lys Arg
65                  70                  75                  80
Ser Gly Ala Lys Gln Arg Asn Ser Leu Lys Arg Asn Ile Asp Ala Gln
                85                  90                  95
Phe His Asn Leu Ser Glu Lys Lys Arg Arg Ser Lys Ile Asn Glu Lys
            100                 105                 110
Met Lys Ala Leu Gln Lys Leu Ile Pro Asn Ser Asn Lys Thr Asp Lys
        115                 120                 125
Ala Ser Met Leu Asp Glu Ala Ile Glu Tyr Leu Lys Gln Leu Gln Leu
    130                 135                 140
Gln Val Gln Thr Leu Ala Val Met Asn Gly Leu Gly Leu Asn Pro Met
145                 150                 155                 160
Arg Leu Pro Gln Val Pro Pro Pro Thr His Thr Arg Ile Asn Glu Thr
                165                 170                 175
Leu Glu Gln Asp Leu Asn Leu Glu Thr Leu Leu Ala Ala Pro His Ser
            180                 185                 190
Leu Glu Pro Ala Lys Thr Ser Gln Gly Met Cys Phe Ser Thr Ala Thr
        195                 200                 205
Leu Leu
    210
<210>3
<211>2640
<212>DNA
<213>Arabidopsis thaliana
<220>
<221>外显子
<222>(1007)..(1243)
<223>外显子1不包括翻译起点之前的序列.
<220>
<221>内含子
<222>(1244)..(1355)
<223>内含子1.
<220>
<221>外显子
<222>(1356)..(1427)
<223>外显子2.
<220>
<221>内含子
<222>(1428)..(1517)
<223>内含子2.
<220>
<221>外显子
<222>(1518)..(1583)
<223>外显子3.
<220>
<221>内含子
<222>(1584)..(1661)
<223>内含子3.
<220>
<221>外显子
<222>(1662)..(1727)
<223>外显子4.
<220>
<221>内含子
<222>(1728)..(1821)
<223>内含子4.
<220>
<221>外显子
<222>(1822)..(2013)
<223>外显子5通过终止密码子.外显子5继续超过该密码子.
<400>3
aattacaaaa tatttagaca ataattcata aacatatcat aaataagatc acattcataa    60
aataaatgag tttttttaga ggacgggttg gcgggacggg tttggcagga cgttacttaa    120
taacaattgt aaactataca ataaaaatat tttatagata gatacaattt acaaactttt    180
atatatatta atttaaaaaa taaattgttt tcgcggtata ccgcgggtta aaatctagtt    240
attcttattt ttgctatgaa ccataattat tttaattact atattatata tatttccctt    300
tggatgcatt aaaaaaaggc taatgatcaa ggacatgtta tcgtctttgt attgaccatt    360
ataatatctg aattttattt tgtgttaaat aatctctcga ataaataatc tttcgaaatg    420
catgcagttt tattcacact ttatctgtgg acaacaacaa caacaaaaaa gaaggaaaaa    480
atagattttt gtaatttgtc aaaaatggtg aaactgttgc gagaccttac ttttcaagta    540
attgtccatt ttcatgttta gtcataataa taattaaata gtctatcaat gctctatctt    600
atcaatactc ttattttttc aaccgtttca tttactgatt ttcataattt catcccctcc    660
tctcaattta acttatcaca ttgaaaaaaa caataaaaat gtatgttttt tatttacttg    720
gtggtccaaa aatgcttttt tccttttttt tattaggtaa aaaatataat attattaaat    780
aaaattgcta caaaaggaaa ctgttcacac acagagtgat gtgagacacc agattctgtc    840
tatagggatt cgacacgcca ctcgcctctt ttagaacctc cacgcgcttc tctgaagaac    900
gtgatctcac gcgtcctacc tcccccgcct ataagcttta ctacgaaaaa gccacagtga    960
taatttttac acacagagta gagcagagag agagagagag agagag atg ggt gat       1015
                                                   Met Gly Asp
                                                   1
tct gac gtc ggt gat cgt ctt ccc cct cca tct tct tcc gac gaa ctc      1063
Ser Asp Val Gly Asp Arg Leu Pro Pro Pro Ser Ser Ser Asp Glu Leu
    5                   10                  15
tcg agc ttt ctc cga cag att ctt tcc cgt act cct aca gct caa cct    1111
Ser Ser Phe Leu Arg Gln Ile Leu Ser Arg Thr Pro Thr Ala Gln Pro
20                  25                  30                  35
tct tca cca ccg aag agt act aat gtt tcc tcc gct gag acc ttc ttc    1159
Ser Ser Pro Pro Lys Ser Thr Asn Val Ser Ser Ala Glu Thr Phe Phe
                40                  45                  50
cct tcc gtt tcc ggc gga gct gtt tct tcc gtc ggt tat gga gtc tct    1207
Pro Ser Val Ser Gly Gly Ala Val Ser Ser Val Gly Tyr Gly Val Ser
            55                  60                  65
gaa act ggc caa gac aaa tat gct ttc gaa cac aag gtataaactt         1253
Glu Thr Gly Gln Asp Lys Tyr Ala Phe Glu His Lys
        70                  75
aactattctt agctgcagag atgcttcact tggctttcct tgtaaaagaa aacaaaaacc  1313
aaaattagtc tcttttcttt ttggaatggc taaacactaa ag aga agt gga gct     1367
                                               Arg Ser Gly Ala
                                               80
aaa cag aga aat tcg ttg aag aga aac att gat gct caa ttc cac aac    1415
Lys Gln Arg Asn Ser Leu Lys Arg Asn Ile Asp Ala Gln Phe His Asn
    85                  90                  95
ttg tct gaa aag gttttctctt ttatcttcct tttaagattc ttaatttaga        1467
Leu Ser Glu Lys
100
aagaagaaga accttgagat tgtagttgat tagaatctga gtgttagcag aag agg     1523
                                                       Lys Arg
                                                       105
agg agc aag atc aac gag aaa atg aaa gct ttg cag aaa ctc att ccc    1571
Arg Ser Lys Ile Asn Glu Lys Met Lys Ala Leu Gln Lys Leu Ile Pro
                110                 115                 120
aat tcc aac aag gttaatcaat ctttgttcga atcagagata gtgagaaaca        1623
Asn Ser Asn Lys
            125
ttgttctgat tgatccgtta tcttttgttt gtttatag act gat aaa gcc tca atg  1679
                                          Thr Asp Lys Ala Ser Met
                                                          130
ctt gat gaa gct ata gaa tat ctg aag cag ctt caa ctt caa gtc cag    1727
Leu Asp Glu Ala Ile Glu Tyr Leu Lys Gln Leu Gln Leu Gln Val Gln
            135                 140                 145
gtttttttcc tacttactat gattatatac gttcaaagtc tgatttgtaa attacatcac  1787
tcagatcatt aacttgattt actgcatgat gcag act tta gcc gtt atg aat ggt  1842
                                      Thr Leu Ala Val Met Asn Gly
                                              150
tta ggc tta aac cct atg cga tta cca cag gtt cca cct cca act cat    1890
Leu Gly Leu Asn Pro Met Arg Leu Pro Gln Val Pro Pro Pro Thr His
155                 160                 165                 170
aca agg atc aat gag acc tta gag caa gac ctg aac cta gag act ctt    1938
Thr Arg Ile Asn Glu Thr Leu Glu Gln Asp Leu Asn Leu Glu Thr Leu
                175                 180                 185
ctc gct gct cct cac tcg ctg gaa cca gct aaa aca agt caa gga atg    1986
Leu Ala Ala Pro His Ser Leu Glu Pro Ala Lys Thr Ser Gln Gly Met
            190                 195                 200
tgc ttt tcc aca gcc act ctg ctt tga agataacatt cagacaatga          2033
Cys Phe Ser Thr Ala Thr Leu Leu
        205                 210
tgatgatcgg aattcctcta gtacctgcca gacaggagtg aacaatgttt tgagttttag  2093
cattggccag atttctatgt tcagttatag ttatgctaat aagctttagg agtgaacaaa  2153
atctgagtag tttgattata atgatgtctg aagcagatta tatataaaag actaatttac  2213
ttacatatga gatgattatt acaactatca aatgactatg tctgtgagtt gcatccatcc  2273
ataagcacac cggtctctac tacttcgagt gattgctgct gctgacttaa ccgcaggtct  2333
tatcttcgtc attgctttct ctacttgaat tctcacgcca acatccatct gttatttcaa  2393
atggtaccga taactttagg gatatagaca agacaaattg atattaataa tataacaagg  2453
ttgtaaagta gaaacctttt ctaaagagca ttgtgtgtct aagatgtggc agaagtatga  2513
cagttgcttg tacaagtctg cttcagtgta ctgtaaagtc aagagttagt ctgtgaagca  2573
atagagagat aggagttata aggttgatga tggtatatac ctttcgtaag agggttccgt  2633
tacagtt                                                            2640
<210>4
<211>623
<212>PRT
<213>Arabidopsis thaliana
<400>4
Met Thr Asp Tyr Arg Leu Gln Pro Thr Met Asn Leu Trp Thr Thr Asp
1               5                   10                  15
Asp Asn Ala Ser Met Met Glu Ala Phe Met Ser Ser Ser Asp Ile Ser
            20                  25                  30
Thr Leu Trp Pro Pro Ala Ser Thr Thr Thr Thr Thr Ala Thr Thr Glu
        35                  40                  45
Thr Thr Pro Thr Pro Ala Met Glu Ile Pro Ala Gln Ala Gly Phe Asn
    50                  55                  60
Gln Glu Thr Leu Gln Gln Arg Leu Gln Ala Leu Ile Glu Gly Thr His
65                  70                  75                  80
Glu Gly Trp Thr Tyr Ala Ile Phe Trp Gln Pro Ser Tyr Asp Phe Ser
                85                  90                  95
Gly Ala Ser Val Leu Gly Trp Gly Asp Gly Tyr Tyr Lys Gly Glu Glu
            100                 105                 110
Asp Lys Ala Asn Pro Arg Arg Arg Ser Ser Ser Pro Pro Phe Ser Thr
        115                 120                 125
Pro Ala Asp Gln Glu Tyr Arg Lys Lys Val Leu Arg Glu Leu Asn Ser
    130                 135                 140
Leu Ile Ser Gly Gly Val Ala Pro Ser Asp Asp Ala Val Asp Glu Glu
145                 150                 155                 160
Val Thr Asp Thr Glu Trp Phe Phe Leu Val Ser Met Thr Gln Ser Phe
                165                 170                 175
Ala Cys Gly Ala Gly Leu Ala Gly Lys Ala Phe Ala Thr Gly Asn Ala
            180                 185                 190
Val Trp Val Ser Gly Ser Asp Gln Leu Ser Gly Ser Gly Cys Glu Arg
        195                 200                 205
Ala Lys Gln Gly Gly Val Phe Gly Met His Thr Ile Ala Cys Ile Pro
    210                 215                 220
Ser Ala Asn Gly Val Val Glu Val Gly Ser Thr Glu Pro Ile Arg Gln
225                 230                 235                 240
Ser Ser Asp Leu Ile Asn Lys Val Arg Ile Leu Phe Asn Phe Asp Gly
                245                 250                 255
Gly Asp Gly Asp Leu Ser Gly Leu Asn Trp Asn Leu Asp Pro Asp Gln
            260                 265                 270
Gly Glu Asn Asp Pro Ser Met Trp Ile Asn Asp Pro Ile Gly Thr Pro
        275                 280                 285
Gly Ser Asn Glu Pro Gly Asn Gly Ala Pro Ser Ser Ser Ser Gln Leu
    290                 295                 300
Phe Ser Lys Ser Ile Gln Phe Glu Asn Gly Ser Ser Ser Thr Ile Thr
305                 310                 315                 320
Glu Asn Pro Asn Leu Asp Pro Thr Pro Ser Pro Val His Ser Gln Thr
                325                 330                 335
Gln Asn Pro Lys Phe Asn Asn Thr Phe Ser Arg Glu Leu Asn Phe Ser
            340                 345                 350
Asp Val Lys Phe Tyr Phe Ser Glu Pro Arg Ser Gly Glu Ile Leu Asn
        355                 360                 365
Phe Gly Asp Glu Gly Lys Arg Ser Ser Gly Asn Pro Asp Pro Ser Ser
    370                 375                 380
Tyr Ser Gly Gln Thr Gln Phe Glu Asn Lys Arg Lys Arg Ser Met Val
385                 390                 395                 400
Leu Asn Glu Asp Lys Val Leu Ser Phe Gly Asp Lys Thr Ala Gly Glu
                405                 410                 415
Ser Asp His Ser Asp Leu Glu Ala Ser Val Val Lys Glu Val Ala Val
            420                 425                 430
Glu Lys Arg Pro Lys Lys Arg Gly Arg Lys Pro Ala Asn Gly Arg Glu
        435                 440                 445
Glu Pro Leu Asn His Val Glu Ala Glu Arg Gln Arg Arg Glu Lys Leu
    450                 455                 460
Asn Gln Arg Phe Tyr Ala Leu Arg Ala Val Val Pro Asn Val Ser Lys
465                 470                 475                 480
Met Asp Lys Ala Ser Leu Leu Gly Asp Ala Ile Ala Tyr Ile Asn Glu
                485                 490                 495
Leu Lys Ser Lys Val Val Lys Thr Glu Ser Glu Lys Leu Gln Ile Lys
            500                 505                 510
Asn Gln Leu Glu Glu Val Lys Leu Glu Leu Ala Gly Arg Lys Ala Ser
        515                 520                 525
Pro Ser Gly Gly Asp Met Ser Ser Ser Cys Ser Ser Ile Lys Pro Val
    530                 535                 540
Gly Met Glu Ile Glu Val Lys Ile Ile Gly Trp Asp Ala Met Ile Arg
545                 550                 555                 560
Val Glu Ser Ser Lys Arg Asn His Pro Ala Ala Arg Leu Met Ser Ala
                565                 570                 575
Leu Met Asp Leu Glu Leu Glu Val Asn His Ala Ser Met Ser Val Val
            580                 585                 590
Asn Asp Leu Met Ile Gln Gln Ala Thr Val Lys Met Gly Phe Arg Ile
        595                 600                 605
Tyr Thr Gln Asp Gln Leu Arg Ala Ser Leu Ile Ser Lys Ile Gly
    610                 615                 620
<210>5
<211>642
<212>PRT
<213>Phaseolus Vulgaris
<400>5
Met Thr Glu Tyr Arg Ser Pro Pro Thr Met Asn Leu Trp Thr Asp Asp
1               5                   10                  15
Asn Ala Ser Val Met Glu Ala Phe Met Ser Ser Ser Asp Phe Ser Ser
            20                  25                  30
Leu Trp Leu Pro Thr Pro Gln Ser Ala Ala Ser Thr Thr Thr Pro Gly
        35                  40                  45
Ala Asp Thr Ala Arg Ala Leu Pro Pro Pro Pro Pro Ser Gln Ser Gln
    50                  55                  60
Ser Leu Phe Asn Gln Glu Thr Leu Gln Gln Arg Leu Gln Thr Leu Ile
65                  70                  75                  80
Glu Gly Ala Glu Glu Ser Trp Thr Tyr Ala Ile Phe Trp Gln Ser Ser
                85                  90                  95
Tyr Asp Tyr Ser Ser Ser Thr Ser Leu Leu Gly Trp Gly Asp Gly Tyr
            100                 105                 110
Tyr Lys Gly Glu Glu Asp Lys Gly Lys Gly Lys Ala Pro Lys Glu Met
        115                 120                 125
Ser Ser Ala Glu Gln Asp His Arg Lys Lys Val Leu Arg Glu Leu Asn
    130                 135                 140
Ser Leu Ile Ser Gly Pro Phe Arg Ser Ala Asp Asp Val Asp Glu Glu
145                 150                 155                 160
Val Ser Asp Thr Glu Trp Phe Phe Leu Val Ser Met Thr Gln Ser Phe
                165                 170                 175
Leu Ser Gly Ser Gly Leu Pro Gly Gln Ala Phe Leu Asn Ser Ser Pro
            180                 185                 190
Val Trp Val Ala Gly Ala Asp Arg Leu Ser Asp Ser Thr Ser Glu Arg
        195                 200                 205
Ala Arg Gln Gly Gln Val Phe Gly Val Gln Thr Leu Val Cys Ile Pro
    210                 215                 220
Ser Ala Asn Gly Val Val Glu Leu Ala Ser Thr Glu Val Ile Phe Gln
225                 230                 235                 240
Asn Ser Asp Leu Met Lys Lys Val Arg Asp Leu Phe Asn Phe Asn Asn
                245                 250                 255
Pro Asp Ala Gly Phe Trp Pro Leu Asn Gln Gly Glu Asn Asp Pro Ser
            260                 265                 270
Ser Leu Trp Leu Asn Pro Ser Ser Ser Ile Glu Ile Lys Asp Thr Ser
        275                 280                 285
Asn Ala Val Ala Leu Val Ser Ala Asn Ala Ser Leu Ser Lys Thr Met
    290                 295                 300
Pro Phe Glu Thr Pro Gly Ser Ser Thr Leu Thr Glu Thr Pro Ser Ala
305                 310                 315                 320
Ala Ala Ala Ala His Val Pro Asn Pro Lys Asn Gln Gly Phe Phe Pro
                325                 330                 335
Arg Glu Leu Asn Phe Ser Asn Ser Leu Lys Pro Glu Ser Gly Glu Ile
            340                 345                 350
Leu Ser Phe Gly Glu Ser Lys Lys Ser Ser Tyr Asn Gly Ser Tyr Phe
        355                 360                 365
Pro Gly Val Ala Ala Glu Glu Thr Asn Lys Lys Arg Arg Ser Pro Ala
    370                 375                 380
Ser Arg Ser Ser Ile Asp Asp Gly Met Leu Ser Phe Thr Ser Gly Val
385                 390                 395                 400
Ile Ile Pro Ala Ser Asn Ile Lys Ser Gly Ala Val Ala Gly Gly Gly
                405                 410                 415
Ala Ser Gly Gly Asp Ser Glu Asn Ser Asp Leu Glu Ala Ser Val Val
            420                 425                 430
Lys Glu Ala Asp Ser Arg Val Val Glu Pro Glu Lys Arg Pro Arg Lys
        435                 440                 445
Arg Gly Arg Lys Pro Gly Asn Gly Arg Glu Glu Pro Leu Asn His Val
    450                 455                 460
Glu Ala Glu Arg Gln Arg Arg Glu Lys Leu Asn Gln Arg Phe Tyr Ala
465                 470                 475                 480
Leu Arg Ala Val Val Pro Asn Val Ser Lys Met Asp Lys Ala Ser Leu
                485                 490                 495
Leu Gly Asp Ala Ile Ser Tyr Ile Asn Glu Leu Lys Ser Lys Leu Ser
            500                 505                 510
Glu Leu Glu Ser Glu Lys Gly Glu Leu Glu Lys Gln Leu Glu Leu Val
        515                 520                 525
Lys Lys Glu Leu Glu Leu Ala Thr Lys Ser Pro Ser Pro Pro Pro Gly
    530                 535                 540
Pro Pro Pro Ser Asn Lys Glu Ala Lys Glu Thr Thr Ser Lys Leu Ile
545                 550                 555                 560
Asp Leu Glu Leu Glu Val Lys Ile Ile Gly Trp Asp Ala Met Ile Arg
                565                 570                 575
Ile Gln Cys Ser Lys Lys Asn His Pro Ala Ala Arg Leu Met Ala Ala
            580                 585                 590
Leu Lys Glu Leu Asp Leu Asp Val Asn His Ala Ser Val Ser Val Val
        595                 600                 605
Asn Asp Leu Met Ile Gln Gln Ala Thr Val Asn Met Gly Asn Arg Phe
    610                 615                 620
Tyr Thr Gln Glu Gln Leu Arg Ser Ala Arg Ser Ser Lys Ile Gly Asn
625                 630                 635                 640
Ala Leu
<210>6
<211>610
<212>PRT
<213>Zea mays
<400>6
Met Ala Leu Ser Ala Ser Arg Val Gln Gln Ala Glu Glu Leu Leu Gln
1               5                   10                  15
Arg Pro Ala Glu Arg Gln Leu Met Arg Ser Gln Leu Ala Ala Ala Ala
            20                  25                  30
Arg Ser Ile Asn Trp Ser Tyr Ala Leu Phe Trp Ser Ile Ser Asp Thr
        35                  40                  45
Gln Pro Gly Val Leu Thr Trp Thr Asp Gly Phe Tyr Asn Gly Glu Val
    50                  55                  60
Lys Thr Arg Lys Ile Ser Asn Ser Val Glu Leu Thr Ser Asp Gln Leu
65                  70                  75                  80
Val Met Gln Arg Ser Asp Gln Leu Arg Glu Leu Tyr Glu Ala Leu Leu
                85                  90                  95
Ser Gly Glu Gly Asp Arg Arg Ala Ala Pro Ala Arg Pro Ala Gly Ser
            100                 105                 110
Leu Ser Pro Glu Asp Leu Gly Asp Thr Glu Trp Tyr Tyr Val Val Ser
        115                 120                 125
Met Thr Tyr Ala Phe Arg Pro Gly Gln Gly Leu Pro Gly Arg Ser Phe
    130                 135                 140
Ala Ser Asp Glu His Val Trp Leu Cys Asn Ala His Leu Ala Gly Ser
145                 150                 155                 160
Lys Ala Phe Pro Arg Ala Leu Leu Ala Lys Ser Ala Ser Ile Gln Ser
                165                 170                 175
Ile Leu Cys Ile Pro Val Met Gly Gly Val Leu Glu Leu Gly Thr Thr
            180                 185                 190
Asp Thr Val Pro Glu Ala Pro Asp Leu Val Ser Arg Ala Thr Ala Ala
        195                 200                 205
Phe Trp Glu Pro Gln Cys Pro Ser Ser Ser Pro Ser Gly Arg Ala Asn
    210                 215                 220
Glu Thr Gly Glu Ala Ala Ala Asp Asp Gly Thr Phe Ala Phe Glu Glu
225                 230                 235                 240
Leu Asp His Asn Asn Gly Met Asp Asp Ile Glu Ala Met Thr Ala Ala
                245                 250                 255
Gly Gly His Gly Gln Glu Glu Glu Leu Arg Leu Arg Glu Ala Glu Ala
            260                 265                 270
Leu Ser Asp Asp Ala Ser Leu Glu His Ile Thr Lys Glu Ile Glu Glu
        275                 280                 285
Phe Tyr Ser Leu Cys Asp Glu Met Asp Leu Gln Ala Leu Pro Leu Pro
    290                 295                 300
Leu Glu Asp Gly Trp Thr Val Asp Ala Ser Asn Phe Glu Val Pro Cys
305                 310                 315                 320
Ser Ser Pro Gln Pro Ala Pro Pro Pro Val Asp Arg Ala Thr Ala Asn
                325                 330                 335
Val Ala Ala Asp Ala Ser Arg Ala Pro Val Tyr Gly Ser Arg Ala Thr
            340                 345                 350
Ser Phe Met Ala Trp Thr Arg Ser Ser Gln Gln Ser Ser Cys Ser Asp
        355                 360                 365
Asp Ala Ala Pro Ala Ala Val Val Pro Ala Ile Glu Glu Pro Gln Arg
    370                 375                 380
Leu Leu Lys Lys Val Val Ala Gly Gly Gly Ala Trp Glu Ser Cys Gly
385                 390                 395                 400
Gly Ala Thr Gly Ala Ala Gln Glu Met Ser Gly Thr Gly Thr Lys Asn
                405                 410                 415
His Val Met Ser Glu Arg Lys Arg Arg Glu Lys Leu Asn Glu Met Phe
            420                 425                 430
Leu Val Leu Lys Ser Leu Leu Pro Ser Ile His Arg Val Asn Lys Ala
        435                 440                 445
Ser Ile Leu Ala Glu Thr Ile Ala Tyr Leu Lys Glu Leu Gln Arg Arg
    450                 455                 460
Val Gln Glu Leu Glu Ser Ser Arg Glu Pro Ala Ser Arg Pro Ser Glu
465                 470                 475                 480
Thr Thr Thr Arg Leu Ile Thr Arg Pro Ser Arg Gly Asn Asn Glu Ser
                485                 490                 495
Val Arg Lys Glu Val Cys Ala Gly Ser Lys Arg Lys Ser Pro Glu Leu
            500                 505                 510
Gly Arg Asp Asp Val Glu Arg Pro Pro Val Leu Thr Met Asp Ala Gly
        515                 520                 525
Thr Ser Asn Val Thr Val Thr Val Ser Asp Lys Asp Val Leu Leu Glu
    530                 535                 540
Val Gln Cys Arg Trp Glu Glu Leu Leu Met Thr Arg Val Phe Asp Ala
545                 550                 555                 560
Ile Lys Ser Leu His Leu Asp Val Leu Ser Val Gln Ala Ser Ala Pro
                565                 570                 575
Asp Gly Phe Met Gly Leu Lys Ile Arg Ala Gln Phe Ala Gly Ser Gly
            580                 585                 590
Ala Val Val Pro Trp Met Ile Ser Glu Ala Leu Arg Lys Ala Ile Gly
        595                 600                 605
Lys Arg
    610
<210>7
<211>562
<212>PRT
<213>Zea mays
<400>7
Met Ala Leu Ser Ala Ser Pro Ala Gln Glu Glu Leu Leu Gln Pro Ala
1               5                   10                  15
Gly Arg Pro Leu Arg Lys Gln Leu Ala Ala Ala Ala Arg Ser Ile Asn
            20                  25                  30
Trp Ser Tyr Ala Leu Phe Trp Ser Ile Ser Ser Thr Gln Arg Pro Arg
        35                  40                  45
Val Leu Thr Trp Thr Asp Gly Phe Tyr Asn Gly Glu Val Lys Thr Arg
    50                  55                  60
Lys Ile Ser His Ser Val Glu Leu Thr Ala Asp Gln Leu Leu Met Gln
65                  70                  75                  80
Arg Ser Glu Gln Leu Arg Glu Leu Tyr Glu Ala Leu Arg Ser Gly Glu
                85                  90                  95
Cys Asp Arg Arg Gly Ala Arg Pro Val Gly Ser Leu Ser Pro Glu Asp
            100                 105                 110
Leu Gly Asp Thr Glu Trp Tyr Tyr Val Ile Cys Met Thr Tyr Ala Phe
        115                 120                 125
Leu Pro Gly Gln Gly Leu Pro Gly Arg Ser Ser Ala Ser Asn Glu His
    130                 135                 140
Val Trp Leu Cys Asn Ala His Leu Ala Gly Ser Lys Asp Phe Pro Arg
145                 150                 155                 160
Ala Leu Leu Ala Lys Ser Ala Ser Ile Gln Thr Ile Val Cys Ile Pro
                165                 170                 175
Leu Met Gly Gly Val Leu Glu Leu Gly Thr Thr Asp Lys Val Pro Glu
            180                 185                 190
Asp Pro Asp Leu Val Ser Arg Ala Thr Val Ala Phe Trp Glu Pro Gln
        195                 200                 205
Cys Pro Thr Tyr Ser Lys Glu Pro Ser Ser Asn Pro Ser Ala Tyr Glu
    210                 215                 220
Thr Gly Glu Ala Ala Tyr Ile Val Val Leu Glu Asp Leu Asp His Asn
225                 230                 235                 240
Ala Met Asp Met Glu Thr Val Thr Ala Ala Ala Gly Arg His Gly Thr
                245                 250                 255
Gly Gln Glu Leu Gly Glu Val Glu Ser Pro Ser Asn Ala Ser Leu Glu
            260                 265                 270
His Ile Thr Lys Gly Ile Asp Glu Phe Tyr Ser Leu Cys Glu Glu Met
        275                 280                 285
Asp Val Gln Pro Leu Glu Asp Ala Trp Ile Met Asp Gly Ser Asn Phe
    290                 295                 300
Glu Val Pro Ser Ser Ala Leu Pro Val Asp Gly Ser Ser Ala Pro Ala
305                 310                 315                 320
Asp Gly Ser Arg Ala Thr Ser Phe Val Val Trp Thr Arg Ser Ser His
                325                 330                 335
Ser Cys Ser Gly Glu Ala Ala Val Pro Val Ile Glu Glu Pro Gln Lys
            340                 345                 350
Leu Leu Lys Lys Ala Leu Ala Gly Gly Gly Ala Trp Ala Asn Thr Asn
        355                 360                 365
Cys Gly Gly Gly Gly Thr Thr Val Thr Ala Gln Glu Asn Gly Ala Lys
    370                 375                 380
Asn His Val Met Ser Glu Arg Lys Arg Arg Glu Lys Leu Asn Glu Met
385                 390                 395                 400
Phe Leu Val Leu Lys Ser Leu Val Pro Ser Ile His Lys Val Asp Lys
                405                 410                 415
Ala Ser Ile Leu Ala Glu Thr Ile Ala Tyr Leu Lys Glu Leu Gln Arg
            420                 425                 430
Arg Val Gln Glu Leu Glu Ser Arg Arg Gln Gly Gly Ser Gly Cys Val
        435                 440                 445
Ser Lys Lys Val Cys Val Gly Ser Asn Ser Lys Arg Lys Ser Pro Glu
    450                 455                 460
Phe Ala Gly Gly Ala Lys Glu His Pro Trp Val Leu Pro Met Asp Gly
465                 470                 475                 480
Thr Ser Asn Val Thr Val Thr Val Ser Asp Thr Asn Val Leu Leu Glu
                485                 490                 495
Val Gln Cys Arg Trp Glu Lys Leu Leu Met Thr Arg Val Phe Asp Ala
            500                 505                 510
Ile Lys Ser Leu His Leu Asp Ala Leu Ser Val Gln Ala Ser Ala Pro
        515                 520                 525
Asp Gly Phe Met Arg Leu Lys Ile Gly Ala Gln Phe Ala Gly Ser Gly
    530                 535                 540
Ala Val Val Pro Gly Met Ile Ser Gln Ser Leu Arg Lys Ala Ile Gly
545                 550                 555                 560
Lys Arg
<210>8
<211>22
<212>DNA
<213>Arabidopsis thaliana
<400>8
gaagaggagg agcaagatca ac                     22
<210>9
<211>14
<212>DNA
<213>Arabidopsis thaliana
<400>9
gaagaggagg acct                              14
<210>10
<211>17
<212>DNA
<213>Arabidopsis thaliana
<400>10
agaggagcaa gatcaac                                          17
<210>11
<211>31
<212>DNA
<213>Arabidopsis thaliana
<400>11
gaagaggagg accttaagga gcaagatcaa c                          31
<210>12
<211>32
<212>DNA
<213>Arabidopsis thaliana
<400>12
gaggaggagg acctctgagg agcaagatca ac                         32
<210>13
<211>51
<212>DNA
<213>Arabidopsis thaliana
<400>13
aagagaaaca ttgatgctca attccacaac ttgtctgaaa agaagaggag g    51
<210>14
<211>24
<212>DNA
<213>Arabidopsis thaliana
<400>14
gaagaggaag acgatgaaga ggat                                  24
<210>15
<211>904
<212>DNA
<213>Arabidopsis thaliana
<220>
<221>CDS
<222>(23)..(625)
<400>15
agagagagag agagagagag ag atg ggt gat tct gac gtc ggt gat cgt ctt   52
                         Met Gly Asp Ser Asp Val Gly Asp Arg Leu
                         1               5                   10
ccc cct cca tct tct tcc gac gaa ctc tcg agc ttt ctc cga cag att    100
Pro Pro Pro Ser Ser Ser Asp Glu Leu Ser Ser Phe Leu Arg Gln Ile
                15                  20                  25
ctt tcc cgt act cct aca gct caa cct tct tca cca ccg aag agt act    148
Leu Ser Arg Thr Pro Thr Ala Gln Pro Ser Ser Pro Pro Lys Ser Thr
            30                  35                  40
aat gtt tcc tcc gct gag acc ttc ttc cct tcc gtt tcc ggc gga gct    196
Asn Val Ser Ser Ala Glu Thr Phe Phe Pro Ser Val Ser Gly Gly Ala
        45                  50                  55
gtt tct tcc gtc ggt tat gga gtc tct gaa act ggc caa gac aaa tat    244
Val Ser Ser Val Gly Tyr Gly Val Ser Glu Thr Gly G1n Asp Lys Tyr
    60                  65                  70
gct ttc gaa cac aag aga agt gga gct aaa cag aga aat tcg ttg gaa    292
Ala Phe Glu His Lys Arg Ser Gly Ala Lys Gln Arg Asn Ser Leu Glu
75                  80                  85                  90
gag gaa gac gat gaa gag gat agc aag atc aac gag aaa atg aaa gct    340
Glu Glu Asp Asp Glu Glu Asp Ser Lys Ile Asn Glu Lys Met Lys Ala
                95                  100                 105
ttg cag aaa ctc att ccc aat tcc aac aag act gat aaa gcc tca atg    388
Leu Gln Lys Leu Ile Pro Asn Ser Asn Lys Thr Asp Lys Ala Ser Met
            110                 115                 120
ctt gat gaa gct ata gaa tat ctg aag cag ctt caa ctt caa gtc cag    436
Leu Asp Glu Ala Ile Glu Tyr Leu Lys Gln Leu Gln Leu Gln Val Gln
        125                 130                 135
act tta gcc gtt atg aat ggt tta ggc tta aac cct atg cga tta cca    484
Thr Leu Ala Val Met Asn Gly Leu Gly Leu Asn Pro Met Arg Leu Pro
    140                 145                 150
cag gtt cca cct cca act cat aca agg atc aat gag acc tta gag caa    532
Gln Val Pro Pro Pro Thr His Thr Arg Ile Asn Glu Thr Leu Glu Gln
155                 160                 165                 170
gac ctg aac cta gag act ctt ctc gct gct cct cac tcg ctg gaa cca    580
Asp Leu Asn Leu Glu Thr Leu Leu Ala Ala Pro His Ser Leu Glu Pro
                175                 180                 185
gct aaa aca agt caa gga atg tgc ttt tcc aca gcc act ctg ctt        625
Ala Lys Thr Ser Gln Gly Met Cys Phe Ser Thr Ala Thr Leu Leu
            190                 195                 200
tgaagataac attcagacaa tgatgatgat cggaattcct ctagtacctg ccagacagga  685
gtgaacaatg ttttgagttt tagcattggc cagatttcta tgttcagtta tagttatgct    745
aataagcttt aggagtgaac aaaatctgag tagtttgatt ataatgatgt ctgaagcaga    805
ttatatataa aagactaatt tacttacata tgagatgatt attacaacta tcaaatgact    865
atgtctgtga gttgcatcca aaaaaaaaaa aaaaaaaaa                           904
<210>16
<211>201
<212>PRT
<213>Arabidopsis thaliana
<400>16
Met Gly Asp Ser Asp Val Gly Asp Arg Leu Pro Pro Pro Ser Ser Ser
1               5                   10                  15
Asp Glu Leu Ser Ser Phe Leu Arg Gln Ile Leu Ser Arg Thr Pro Thr
            20                  25                  30
Ala Gln Pro Ser Ser Pro Pro Lys Ser Thr Asn Val Ser Ser Ala Glu
        35                  40                  45
Thr Phe Phe Pro Ser Val Ser Gly Gly Ala Val Ser Ser Val Gly Tyr
    50                  55                  60
Gly Val Ser Glu Thr Gly Gln Asp Lys Tyr Ala Phe Glu His Lys Arg
65                  70                  75                  80
Ser Gly Ala Lys Gln Arg Asn Ser Leu Glu Glu Glu Asp Asp Glu Glu
                85                  90                  95
Asp Ser Lys Ile Asn Glu Lys Met Lys Ala Leu Gln Lys Leu Ile Pro
            100                 105                 110
Asn Ser Asn Lys Thr Asp Lys Ala Ser Met Leu Asp Glu Ala Ile Glu
        115                 120                 125
Tyr Leu Lys Gln Leu Gln Leu Gln Val Gln Thr Leu Ala Val Met Asn
    130                 135                 140
Gly Leu Gly Leu Asn Pro Met Arg Leu Pro Gln Val Pro Pro Pro Thr
145                 150                 155                 160
His Thr Arg Ile Asn Glu Thr Leu Glu Gln Asp Leu Asn Leu Glu Thr
                165                 170                 175
Leu Leu Ala Ala Pro His Ser Leu Glu Pro Ala Lys Thr Ser Gln Gly
            180                 185                 190
Met Cys Phe Ser Thr Ala Thr Leu Leu
        195                 200

Claims (7)

1.分离的DNA分子或其互补序列,所述DNA分子编码SEQ IDNO:16的蛋白。
2.权利要求1的分离的DNA分子,由SEQ ID NO:15的核苷酸序列组成。
3.权利要求1或2的分离的DNA分子或其互补序列,所述DNA分子还包含可操纵相连的异源启动子,所述异源启动子不与编码SEQID NO:16的蛋白的DNA分子天然相连。
4.权利要求3的分离的DNA分子,其中所述异源启动子是诱导型启动子。
5.一种转化的植物细胞,其包含权利要求1-4任一项的分离的DNA分子。
6.一种制备具有改变的成熟果实的开裂的转化植物的方法,包括用权利要求1-4任一项的分离的DNA分子转化所述植物的细胞,其中所述植物是其中成熟果实是长角果的植物。
7.权利要求6的方法,还包括选择含有所述DNA分子的转化的植物细胞,并从转化的植物细胞再生转基因植物。
CNB018048579A 2000-02-11 2001-02-01 开裂基因和调节开裂作用的方法 Expired - Fee Related CN100451117C (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
WOPCT/SG00/00022 2000-02-11
SGPCT/SG00/00022 2000-02-11
PCT/SG2000/000022 WO2001059121A1 (en) 2000-02-11 2000-02-11 Dehiscence gene and methods for regulating dehiscence

Publications (2)

Publication Number Publication Date
CN1401002A CN1401002A (zh) 2003-03-05
CN100451117C true CN100451117C (zh) 2009-01-14

Family

ID=20428788

Family Applications (1)

Application Number Title Priority Date Filing Date
CNB018048579A Expired - Fee Related CN100451117C (zh) 2000-02-11 2001-02-01 开裂基因和调节开裂作用的方法

Country Status (10)

Country Link
US (1) US7109395B2 (zh)
EP (1) EP1255838B1 (zh)
CN (1) CN100451117C (zh)
AR (1) AR027401A1 (zh)
AT (1) ATE377078T1 (zh)
AU (3) AU2841500A (zh)
CA (1) CA2399900C (zh)
DE (1) DE60131143D1 (zh)
ES (1) ES2293975T3 (zh)
WO (2) WO2001059121A1 (zh)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN100584952C (zh) 2003-06-23 2010-01-27 拜尔生物科学公司 延迟植物中种子落粒的方法和手段
US7528294B2 (en) 2004-06-18 2009-05-05 The Regents Of The University Of California Brassica INDEHISCENT1 sequences
SG184723A1 (en) * 2004-09-24 2012-10-30 Monsanto Technology Llc Promoter molecules isolated from brassica napus for use in plants
PL2220239T3 (pl) 2007-11-28 2015-10-30 Bayer Cropscience Nv Roślina Brassica zawierająca zmutowane allele typu indehiscent
CN102839150B (zh) 2008-07-17 2016-03-16 拜尔作物科学公司 包括一个突变体indehiscent等位基因的芸薹属植物
CA2822720C (en) 2010-12-24 2020-05-12 Bayer Cropscience Nv Brassica plant comprising a mutant alcatraz allele
CN102649959A (zh) * 2012-05-24 2012-08-29 上海大学 用于分离和鉴定Ac/Ds转座子侧翼序列的特异性引物

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO1990000502A1 (en) * 1988-07-07 1990-01-25 Nelson Thomas E Appliance construction, sealing device therefor, and method

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB9306726D0 (en) * 1993-03-31 1993-05-26 Neckerson Biocem Limited Plant molecular biology
US6198024B1 (en) * 1997-06-27 2001-03-06 The Regents Of The University Of California Seed plants characterized by delayed seed dispersal
EP1033405A3 (en) 1999-02-25 2001-08-01 Ceres Incorporated Sequence-determined DNA fragments and corresponding polypeptides encoded thereby

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO1990000502A1 (en) * 1988-07-07 1990-01-25 Nelson Thomas E Appliance construction, sealing device therefor, and method

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
WO,A1,9900502 1999.01.07

Also Published As

Publication number Publication date
AU2841500A (en) 2001-08-20
AU3433301A (en) 2001-08-20
ES2293975T3 (es) 2008-04-01
CA2399900A1 (en) 2001-08-16
EP1255838A1 (en) 2002-11-13
AR027401A1 (es) 2003-03-26
WO2001059121A1 (en) 2001-08-16
EP1255838B1 (en) 2007-10-31
DE60131143D1 (de) 2007-12-13
US20030208787A1 (en) 2003-11-06
CA2399900C (en) 2009-06-16
ATE377078T1 (de) 2007-11-15
AU2001234333B2 (en) 2006-11-30
CN1401002A (zh) 2003-03-05
US7109395B2 (en) 2006-09-19
WO2001059122A1 (en) 2001-08-16

Similar Documents

Publication Publication Date Title
US5792627A (en) Cyanobacterial and plant acetyl-CoA carboxylase
CN111763682B (zh) ZmSBP12基因在调控玉米抗旱性、株高及穗位高中的用途
US8686218B2 (en) Strategies for the transgenic manipulation of filamentous fungi
CN101048507B (zh) 一种增大种子大小的方法
US6680429B1 (en) Starchless variety of pisum sativum having elevated levels of sucrose
CA2401504A1 (en) Transgenic plants with increased seed yield, biomass and harvest index
NZ272266A (en) Transcriptional activator protein aft1 from crucifer, dna therefor and transgenic plants
CN100451117C (zh) 开裂基因和调节开裂作用的方法
CA2452183C (en) Methods and compositions for highly effective transformation of filamentous fungi
CA2258571A1 (en) Plant sterol reductases and uses thereof
CN115466747B (zh) 糖基转移酶ZmKOB1基因及其在调控玉米雌穗结实性状或发育上的应用
AU2001234333A1 (en) Dehiscence gene and methods for regulating dehiscence
US6444877B1 (en) Liquidambar styraciflua AGAMOUS (LSAG) gene
CN115697043A (zh) 通过靶向诱变获得突变植物的方法
EP1029924A1 (en) Nucleic acids having promoter activity and transgenic plants containing the same
JPH07143887A (ja) 植物のアセチルCoAカルボキシラーゼ遺伝子
CN114174518A (zh) 非生物胁迫耐受性植物及方法
CN116096230A (zh) 控制分生组织大小以改良作物的方法
JP2001258564A (ja) 穀類でんぷんの構造、糊化特性を制御するでんぷん合成酵素遺伝子
MXPA01004419A (en) Glufosinate tolerant rice

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
ASS Succession or assignment of patent right

Owner name: TEMASEK LIFE SCIENCES LAB LTD

Free format text: FORMER OWNER: INST. OF MOLECULAR AGROBIOLOGY

Effective date: 20070608

C41 Transfer of patent application or patent right or utility model
TA01 Transfer of patent application right

Effective date of registration: 20070608

Address after: Singapore City

Applicant after: Temasek Life Sciences LAB

Address before: Singapore Singapore

Applicant before: Institute of Molecular Agrobiology

C14 Grant of patent or utility model
GR01 Patent grant
C17 Cessation of patent right
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20090114

Termination date: 20130201