CN101883572A - 高粱铝耐受基因SbMATE - Google Patents

高粱铝耐受基因SbMATE Download PDF

Info

Publication number
CN101883572A
CN101883572A CN2008800250029A CN200880025002A CN101883572A CN 101883572 A CN101883572 A CN 101883572A CN 2008800250029 A CN2008800250029 A CN 2008800250029A CN 200880025002 A CN200880025002 A CN 200880025002A CN 101883572 A CN101883572 A CN 101883572A
Authority
CN
China
Prior art keywords
plant
sequence
polypeptide
sbmate
nucleic acid
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN2008800250029A
Other languages
English (en)
Other versions
CN101883572B (zh
Inventor
L·科奇安
J·刘
J·V·德马加尔黑斯
C·T·吉马雷斯
R·E·沙弗特
V·M·C·阿尔夫斯
P·克莱因
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
EMBRAPA-EMPRESA BRUSILEIRA DE PESQUISA AGROPECUARIA
Texas A&M University System
US Government
Original Assignee
EMBRAPA-EMPRESA BRUSILEIRA DE PESQUISA AGROPECUARIA
Texas A&M University System
US Government
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by EMBRAPA-EMPRESA BRUSILEIRA DE PESQUISA AGROPECUARIA, Texas A&M University System, US Government filed Critical EMBRAPA-EMPRESA BRUSILEIRA DE PESQUISA AGROPECUARIA
Publication of CN101883572A publication Critical patent/CN101883572A/zh
Application granted granted Critical
Publication of CN101883572B publication Critical patent/CN101883572B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/415Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from plants
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8216Methods for controlling, regulating or enhancing expression of transgenes in plant cells
    • C12N15/8222Developmentally regulated expression systems, tissue, organ specific, temporal or spatial regulation
    • C12N15/8223Vegetative tissue-specific promoters
    • C12N15/8227Root-specific
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8216Methods for controlling, regulating or enhancing expression of transgenes in plant cells
    • C12N15/8237Externally regulated expression systems
    • C12N15/8238Externally regulated expression systems chemically inducible, e.g. tetracycline
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8241Phenotypically and genetically modified plants via recombinant DNA technology
    • C12N15/8261Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield
    • C12N15/8271Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield for stress resistance, e.g. heavy metal resistance

Landscapes

  • Health & Medical Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Chemical & Material Sciences (AREA)
  • Organic Chemistry (AREA)
  • Biomedical Technology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Wood Science & Technology (AREA)
  • Biotechnology (AREA)
  • General Engineering & Computer Science (AREA)
  • Zoology (AREA)
  • Molecular Biology (AREA)
  • Biophysics (AREA)
  • General Health & Medical Sciences (AREA)
  • Biochemistry (AREA)
  • Plant Pathology (AREA)
  • Microbiology (AREA)
  • Cell Biology (AREA)
  • Physics & Mathematics (AREA)
  • General Chemical & Material Sciences (AREA)
  • Botany (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Medicinal Chemistry (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Breeding Of Plants And Reproduction By Means Of Culturing (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

主要的铝耐受基因SbMATE编码根部柠檬酸外排转运蛋白,该转运蛋白在基因转录水平上受Al诱导,并且还在蛋白功能水平上受Al激活。在根中发现SbMATE基因和该蛋白的高水平表达。在包括水稻在内的其它高等植物中发现具有高度序列同源性的SbMATE直向同源物。成功转化拟南芥提供以下论点的强力证据:SbMATE可在跨物种间发挥作用以提高在其中Al3+阳离子存在于酸性土壤中并对植物有毒的世界各地生长的其它重要农作物对Al的耐受性。

Description

高粱铝耐受基因SbMATE
发明背景
发明领域
本发明涉及:主要的铝耐受基因SbMATE(Sorghum bicolormember of the multidrug abd toxic compound extrusion transporterfamily,多种药物和毒性化合物外排转运蛋白家族的高粱成员),该基因对应于AltSB基因座(aluminum tolerance in Sorghum bicolor,高粱中的铝耐受),连同其天然启动子和调控区一起克隆自高粱;含有所述基因和组成型启动子的构建体;含有所述构建体的载体;用所述构建体和载体转化植物的方法;和用具有高耐受铝毒性的基因构建体转化的植物,包括主要农作物植物。
相关技术说明
热带和亚热带是极为重要的粮食生产区,尤其是对于很多发展中国家而言。然而,以这些地区普遍存在的酸性土壤为基础的农业受到由干旱、矿质营养缺乏(例如磷缺乏)尤其是铝毒性引起的限制植物产量的严重挑战。铝(Al)在土壤中普遍存在,在pH值低于5.0时以高植物毒性的Al3+种类溶解到土壤溶液中,Al3+抑制根生长并损伤根系统(Kochian,L.V.1995.Annu.Rey.Plant Biol.46:237-260)。因此,在很多发展中国家铝毒性是农作物生产的主要限制,其中包括38%的东南亚耕地、31%的拉丁美洲耕地和20%的东亚及撒哈拉以南非洲的耕地(Wood等,2000.In Pilot Analysis of Global Ecosystems:Agroecosystems,International Food Policy Research Institute and theWorld Resources Institute(全球生态系统试验分析:农业生态系统、国际食品政策研究学会和世界资源研究学会),Washington,D.C),因此降低了世界上最贫乏的地方的粮食安全性。
业已基于铝激活从根端释放有机酸确定植物中的主要铝耐受机理,根端是铝植物毒性的作用部位(Ryan等,1993.J.Exp.Bot.44:437-446)。根据植物种类的不同,因响应铝的接触而从根释放苹果酸、柠檬酸或草酸等有机酸,这些有机酸与Al3+阳离子形成稳定的无毒络合物(Ma等,2001.Trends Plant Sci.6:273-278)。文献中有大量的支持该机理的生理学证据(参见Kochian等,2004.Annu.Rev.Plant Biol.55:459-493及其中的参考文献),关于这种Al耐受机理现在得到普遍公认的是,铝激活细胞膜有机酸转运蛋白,该转运蛋白在铝耐受中起主要作用(Delhaize和Ryan.1995.Plant Physiol.107:315-321;Ryan等,2001.Annu.Rev.Plant Physiol.Plant Mol.Biol.52:527-560;Kochian等,2004,见上述)。
最近,分离了第一个铝(Al)耐受基因ALMT1(Alactivatedmalate transporter,Al激活的苹果酸转运蛋白),并显示其编码Al激活的苹果酸转运蛋白(Sasaki等,2004.Plant J.37:645-653)。发现ALMT1是新的膜蛋白家族成员,并且根据ALMT1基因的遗传作图,显示其很可能对应于AltBH:小麦和其它麦类(Triticeae)成员中主要的Al耐受基因座(Sasaki等,见上述;Raman等,2005.Genome 48:781-791)。随后,显示ALMT1同源物也在拟南芥中赋予经由Al激活根分泌苹果酸的Al耐受性(Hoekenga等.2006.Proc.Natl.Acad.Sci.USA 103:9738-9743)。
酸性土壤的第二个限制是缺乏磷(P),这由磷与酸性土壤中粘土矿物表面的氧化铝或氧化铁固化引起。因此,P的可利用性是酸性土壤中农作物生产的第二个重要的限制因素(Sanchez等.1997.载于:Replenishing Soil Fertility in Africa(在非洲补充土壤肥力),R Buresh,PSanchez,F Calhoun编辑,第1-46页)。由于该必需矿质营养素P的可利用率低,因而植物进化出了多种适应机制以从土壤获得P。一种主要的所述适应机制是从根释放有机酸,主要是柠檬酸和苹果酸(Neumann G.和Martinoia,E.2002.Trends Plant Sci.7:162-167)。这些释放的有机酸可使P从矿物表面解吸,使其从经由金属络合与Al、Fe和Ca的氧化物及氢氧化物的结合中溶出。因此,能促进柠檬酸从根流出的转运蛋白例如SbMATE,可显著提高农作物植物从P利用率低的酸性土壤获得P的能力。
发展中国家和发达国家都确实需要更好地了解Al耐受机理和相关基因及其对农作物植物的作用。需要鉴定出给农作物植物提供提高的Al激活的有机酸(柠檬酸、苹果酸或草酸)释放的基因,并评估其提高在全世界酸性土壤中生长的大量植物品种的Al耐受性的作用。利用有助于植物耐受酸性土壤中存在的Al的基因,产生了具有用于在可溶性Al3+存在的酸性土壤中获得高产的机理的转基因植物。因此,这样的基因和构建体可确保在酸性土壤中生长的植物的产量稳定性,换言之,耐受Al的植物使得可利用贫瘠土地来生产农业上和商业上重要的主要作物。
发明简述
我们在拟南芥(Arabidopsis)中表达了从高粱分离的SbMATE基因,并证实其表达导致在转化的植物中诱导铝耐受性。
根据该发现,本发明目标是提供分离的核酸构建体,所述构建体含有编码在植物中参与铝耐受性调节的SbMATE蛋白的DNA序列。
本发明另一目标是提供重组核酸分子构建体,所述构建体包含重组AbMATE cDNA上游的核酸分子。该上游核酸序列以遗传上位于AltSB侧翼的7bp插入/缺失多态性(在图1中的7bp插入/缺失(indel))为末端。该区域包含多态小反向重复元件(polymorphicminiature inverted repeated element,MITE)插入和组织特异性的Al诱导的启动子,其可操作地连接以使启动子增强SbMATE编码序列在宿主细胞中的转录。在SbMATE下游直到遗传上位于AltSB的3’端侧翼的SNP G/A(图1中的SNP G/A)的另外的序列也可能参与AltSB编码区的表达。
本发明又一目标是提供包含能够表达SbMATE基因的构建体的载体。
本发明另一目标是提供包含能够表达SbMATE基因的载体的宿主细胞或所述宿主细胞的后代。
本发明又一目标是提供含有所述核酸构建体并具有改进的铝耐受性的转基因植物细胞和植物。
本发明另一目标是提供通过用分离的核苷酸分子稳定转化植物来操控植物中的铝耐受性的方法,所述核苷酸分子能够调节铝的耐受性,并与能够在植物细胞中驱动基因表达的启动子可操作地连接。
本发明另一目标是提供通过用分离的核苷酸分子稳定转化植物来促进柠檬酸从植物根流出,从而提高农作物植物从酸性土壤获得磷的能力的方法,所述核苷酸分子能够调节铝的耐受性,其与能够在植物细胞中驱动基因表达的启动子可操作地连接。
本发明另一目标是提供根特异性的Al诱导的启动子来驱动SbMATE在植物细胞中表达。
本发明又一目标是提供提高植物Al耐受的方法,所述方法包括通过导入载体将SbMATE基因转化到植物中,其中所述载体包含有效量的核酸构建体,该构建体为能够将SbMATE基因转化到植物中的DNA序列。
本发明再一目标是提供已经被含有SbMATE基因的本发明构建体转化的植物、植物细胞和植物部分,当与尚未转化的相同植物品种比较时,它们的铝耐受性提高。
以下说明将使本发明其它目标和优点显而易见。
附图简述
本专利或申请文件含有至少一份彩色附图。经过申请并支付必要的费用后,美国专利和商标局将提供带彩图的本专利或专利申请出版物副本。
图1a-1d描述AltSB的位置克隆。图1a显示在第3号染色体上的AltSB区的遗传图谱和物理图谱。标记T755对应于BAC 55D12的最左端。虚线指出在高粱BAC重叠群中的遗传标记的大约物理位置。图1b描述BAC 181g10上的AltSB高分辨图谱(粗线)。宽的水平箭头指出ORF(1到16)位置及其预测的转录方向。在181g10下面的向下箭头之间的数字表示由高分辨作图谱检测的27个单独的重组事件的分布。含有ORF 7、8和9(AltSB的候选)的24.6Kb的靶区沿着侧翼的标记(7bp插入/缺失和G/A SNP)作标记。图1c描述响应{27}μMAl3+的存在(+)或不存在(-)在Al耐受型(T)和敏感型(S)NIL的根和芽中ORF 8和9的半定量RT-PCR。图1d显示来自Al耐受型(SC283)和敏感型(BR007)亲本的24.6Kb的靶区,其具有虚线菱形内所示的多态性。基因组AltSB(ORF 7)长2407bp,含有5个外显子(灰色方框)和4个内含子(黑色粗线)。
图2a-c显示高粱SbMATE和来自拟南芥[At1g51340,氨基酸同一性百分比(I)=51%;预期值(expected value)(E)=1.1e-121]和水稻(Os01g69010,I=63%;E=1.1e-152)的同源物的氨基酸序列比对(图2a),显示预测的跨膜结构域的SbMATE蛋白结构和连接特定跨膜结构域的亲水环(图2b),以及SbMATE基因的内含子-外显子结构(图2c)。
图3a-d描述SbMATE的表达和定位。图3a显示SbMATE在Al耐受型(T)和Al敏感型(S)NIL的不同的根区中表达的空间分析,所述NIL在含(+,实心柱)或不含(-,空心柱){27}μM Al3+的溶液培养的营养液中生长3天。用定量实时PCR测定SbMATE相对表达值,该值为3次重复实验的平均值±标准偏差。图3b显示Al耐受型(T)和敏感型(S)NIL在+/-{27}μMAl3+中1、3和6天的每日根生长率(左图)和Al激活的根部柠檬酸分泌(右图)。图3c描述用定量实时PCR所测的在与+/-{27}μMAl3+接触1、3和6天的耐受型(T)和敏感型(S)NIL的根端的SbMATE表达。图3a和3c中的数据为3个重复实验的平均值±标准偏差,对于图3b中的有机酸测定为4个重复,根生长测量为8个重复。图3d描述SbMATE蛋白在洋葱表皮细胞中的膜定位。上图显示SbMATE::GFP(i,ii)和细胞质GFP(iii,iv)的GFP荧光图。靠下面的一组图(v-viii)显示相同样品的明视野表层(overlay)和GFP荧光图象。图象是在细胞质壁分离(与1M蔗糖接触的洋葱表皮条)之前(第一和第三栏)和之后(第二和第四栏)获得。与SbMATE关联的荧光定位在细胞膜(i,v);在细胞质壁分离后SbMATE荧光信号与收缩的细胞膜关联(ii,vi)。比例尺=50μm,图象代表三个独立的重复实验。PM:细胞膜;CW:细胞壁。
图4a-e显示在与营养液中的{27}μM Al3+接触的10个高粱品系(BR012、BR007、IS8577、SC549、3DX、SC175、9DX、CMS225、SC283、SC566;Caniato等.2007.Theor.Appl.Genet.114:863-76)中SbMATE表达、根分泌柠檬酸和Al耐受性之间的相关性,10个高粱品系包含AltSB的等位基因系列。图4a显示相对于肌动蛋白基因表达的SbMATE表达(由半定量RT-PCR评估)对Al耐受性(相对净根生长,Relatvie Net Root Growth,RNRG)作图;图4b显示SbMATE相对表达对根部柠檬酸分泌作图;图4c描述根部柠檬酸分泌对Al耐受性作图,图4d为Al耐受对包含MITE插入的推定的SbMATE启动子(bp,碱基对)内的区域大小作图。显示了相关系数(r)和概率(P)值。图4e显示4个高粱品系中MITE插入区的结构和大小,它们是图4d中所示的4个大小类别中的每一个的代表。
图5显示图4中所示作为含MITE区的四个大小类别的代表的4个高粱品种SbMATE启动子中含MITE区的核苷酸序列。如图4所示,含MITE区含有3个重复元件:用黄色突出显示的100-bp元件,并在图4中标记为(a);用蓝色突出显示的243-bp MITE插入,并在图4中标记为(b);和位于MITE插入之后的用粉色突出显示的21-bp元件,并在图4中标记为(c)。每一含MITE区的末端都有含有8-bp缺失(用灰色突出显示)或12-bp缺失(用绿色突出显示)的不完整(a)元件。注意到随着含MITE区大小的增加,a-b-c重复次数从TX430的1分别增加到BR007的3、BR012的4和SC283的5。
图6a-d描述SbMATE在转基因拟南芥植物中的表达。图6a描述对照和用CaMV 35S启动子表达SbMATE的T3纯合拟南芥品系的Al耐受(根在营养液+1.5μM Al3+活性中生长)。SbMATE在Columbia生态型(Col:非转基因;Col-TG:表达SbMATE的转基因品系)和在对Al极为敏感的AtALMT敲除品系(KO:非转基因敲除品系;KO-TG:表达SbMATE的转基因敲除品系)中表达。比例尺1cm。图6b描述在8个独立的KO-TG品系中由相对净根生长%(%RNRG)测量的Al耐受性。数据为平均值±标准偏差(n=20)。图6c显示在对照和所挑选的T3转基因品系中SbMATE表达水平和Al耐受(%RNRG)之间的关系。图6d描述对照和挑选的T3转基因植物在+/-Al条件下根分泌苹果酸和柠檬酸。对于图6c和6d,数据为平均值±标准偏差(n=20)。
图7描述由相对根生长%(%RRG)测量的Al耐受性。对于Al敏感型小麦栽培种Bobwhite和在组成型玉米泛素启动子下表达SbMATE的四个T1转基因Bobwhite家族,%RRG值由在+Al溶液中经24小时测量的根生长除以在对照(-Al)溶液中经24小时测量的根生长x 100来计算。小麦植物在含或不含5μM AlCl3(pH 4.5)的0.2mMCaCl2溶液中生长。数据为平均值±标准偏差(n=如下数值:对于Bobwhite为19;对于6001A为11;对于6001D为11;对于6001F为8;和对于6053为9)。
图8a-b显示ZmASL-49968为高粱SbMATE的同源物,并为候选玉米Al耐受基因。图8a描述了显示外显子、内含子和从用于关联遗传分析的玉米多样性组的300个成员中的每一个测序的区域的基因图谱。图8b描述在ZmASL-49968中检测的多态性的连锁不平衡分析,显示ZmASL-49968与玉米Al耐受性关联。
图9描述在B73X CML247F2群中的连锁分析,并确证了ZmASL-49968的关联分析。用于ZmASL-49968的ANOVA:F=8.44,p=0.004。如关联分析所预测,玉米亲本B73包含ZmASL-49968优等等位基因(superior allele),CML247包含次等等位基因(inferior)。对于优等B73等位基因而言为纯合或杂合的来自B73x CML247杂交的F2后代比次等CML247等位基因纯合的F2后代更显著地耐受Al。这一结论的观察依据是,包含优等等位基因的F2在39uM Al3+中的净根生长(NRG)为70mm,而包含次等等位基因的F2的NRG仅为61mm。
图10描述代表由Al处理上调的MATE样基因的阵列特征的表达概况(在20%FDR下)。在(·)Al耐受型C100-6和(。)Al-敏感型L53基因型中,基因表达水平由其估测的最小二乘方平均值来表示。注意Y-轴(表达)标尺在不同的图之间是不同的。
图11描述玉米、水稻和小麦QTL与第二个玉米SbMATE同源物(也为候选的玉米Al耐受基因)的比较性图谱。玉米第1号染色体区含有MATE克隆,其为SbMATE同源物,源自EST NP667103。Embrapa重组近交系作图群体中的QTL也位于玉米第1号染色体的该区,说明了13.7%的Al耐受性变化。可将RFLP探针bcd1230和cdo1395用作玉米、水稻和小麦基因组之间的锚定标记,表明了在玉米、水稻和麦类之间的包含Al耐受基因或QTL的推定的直向同源区。
图12描述NP667103的表达分析。用总RNA测定NP667103和肌动蛋白(加样对照)的基于半定量RT-PCR的表达分析,所述总RNA从用0或39μM Al3+处理24小时的AI237(Embrapa RIL群体的Al耐受型亲本)、C100-6(第二个Al耐受型玉米品系,用于微阵列实验中)和L53(用于微阵列实验的Al敏感型玉米品系,和Embrapa RIL群体的Al敏感型亲本)的根提取。
发明详述
本发明涉及SbMATE基因(构成(underlie)高粱AltSB基因座的主要Al耐受基因)的分离,涉及高粱中的SbMATE基因的克隆和功能分析,并涉及用编码SbMATE蛋白的核酸转化拟南芥和高粱的Al敏感型品系及其它亲缘相近的谷类品种(包括小麦、大麦、水稻和玉米)。用本发明组合物和方法来遗传改造植物细胞,导致在植物细胞和组织中产生对铝的耐受。可利用本发明核酸分子、构建体和载体及使用它们的方法来增加重要粮食作物的铝耐受性。SbMATE基因是膜转运蛋白MATE(Multidrug and Toxin Efflux,多种药物和毒素外排)家族的成员,并编码由Al激活的新型的柠檬酸外排转运蛋白。
在从两个高度耐受Al的高粱栽培种中开发的两个不同作图群体中,确定单个基因座AltSB控制Al耐受性。在来源于高粱Al耐受标准株SC283的群中对高粱中的主要Al耐受基因座AltSB作图到第3号染色体的末端区域(Magalhaes等.2004.Genetics 167:1905-1914)。基于比较性作图,显示AltSB很可能与小麦中的Al耐受基因座明显不同,因此应该由新的Al耐受基因来表示。在我们的AltSB比较性基因组初步分析中,在我们的原始作图群体中与AltSB紧密连锁的标记位于水稻第1号染色体的物理/遗传图谱上接近173cM的位置(Magalhaes等,见上述;Jaiswal等.2006.Nucl.Acids Res.34:D717)。在该结果的基础上,从水稻中开发了序列标签位点(sequence-tagged site,STS)标记,并用于评估BR007(敏感)X SC283(耐受)重组近交(Rl)群(n=354)。由位于高粱第3号染色体的有关区域内的高粱基因组概览序列开发了新的STS标记(Klein等,2003.Plant J.34:605-)。包括这些STS标记中的分别位于0.8cM处和完全与AltSB连锁的两个标记CTG29和M181在内的AltSB的RIL图谱示于图1A中。我们对AltSB区域进行遗传作图的最后步骤涉及从F2群筛选4170个配子,并从CTG29-M181的间隔中选出27个重组个体(参见实施例2)。从我们对BAC 181g10进行的序列分析开发了另外的标记,并用于进一步划定含AltSB的间隔的界限。这些标记中的两个各自识别单独的重组事件,因而接近AltSB侧翼。因此,跨该区域的约513Kb/em的平均重组比使得我们可以限定含有三个预测ORF(ORF 7、8和9)的24.6Kb区,这些ORF之一应该是AltSB(参见图1b)。
ORF 8和9的序列注释显示分别与假定蛋白(hypotheticalprotein)和蔗糖磷酸合酶基因高度相似。图1c显示与Al耐受型形成对照,两个基因在近等基因系(NIL)的芽中都高度表达,但在根中不表达,根为Al耐受机理应当发挥功能的部位。
相反地,用ORF 7进行TBLASTX搜索在拟南芥(At1g51340)和水稻(Os01g69010)中确定了高度相似的序列(图2a),这些序列代表多种药物和毒性化合物外排(MATE)转运蛋白家族的成员(Brown等.1999.Mol.Biol.31:393-395)。MATE蛋白参与小有机分子流出(Morita等,1998.Antimicrob.Agents Chemother.42:1778-1782;Diener等,2001.Plant Cell 13:1625-1638;Li等,2002.J.Biol.Chem.277:5360-5368),这与基于Al激活的根分泌柠檬酸的高粱Al耐受性生理机理一致(Magalhaes等,见上述)。因此,认为分离自高粱(Sorghum bicolor)的MATE同源物(本文指定为SbMATE)是AltSB基因座的最佳候选,并对其作进一步的研究。
高粱中的基因组SbMATE长2407bp。确定来自Al耐受亲本(SC283)的SbMATE基因组序列为SEQ ID NO:1,来自对Al敏感亲本(BR007)的SbMATE基因组序列为SEQ ID NO:2。全长cDNA(SEQID NO:3)含有分布在1803bp中的5个外显子(图1d),它们编码分子量为约62kD的600个氨基酸的多肽(SEQ ID NO:4)。与小麦Al耐受基因ALMT1的序列比较,显示高粱SbMATE与ALMT膜蛋白家族无关,因此为新型的耐受基因。拓扑学程序HMMTOP(Tusnady和Simon.1998.J.Mol.Biol.283:489-506)预测SbMATE蛋白含有12个跨膜结构域(图2b),并提示位于细胞膜上(PSORT;Nakai和Kanehisa.1992.Genomics 14:897-911)。SC283(Al耐受)和BR007(Al敏感)之间的SbMATE等位基因以及由高分辨作图确定的整个24.6Kb区的比较,显示SbMATE编码区在亲本等位基因之间等同,且仅在所述内含子之一内存在多态性(图1d)。在整个24.6Kb区内仅发现有4组多态性,最大的分歧(divergent)是在SbMATE启动子区中大的728bp插入/缺失,其在预测的TATA盒的约1.4Kb上游处。
为了验证高粱MATE基因确实是SbMATE,定量测定了其在高粱耐受型与敏感型近等基因系(NIL)根尖(Al耐受和毒性位点)中的表达(参见实施例4)。定量RT-PCR分析显示SbMATE仅在Al耐受型NIL的根中表达,并且根尖表达是Al诱导的(图3a);在敏感型NIL根尖中的表达检测不到。高粱的Al耐受性亦为随时间由Al诱导的(图3b,左图)。随着根与Al接触时间增加,在耐受型NIL中Al诱导的根生长抑制显著降低,且根生长抑制从在Al存在下的第1天和第2天观察到的初始抑制40-50%降低到在第5天和第6天不抑制根生长。这一反应与在与Al的接触时间内Al激活的根尖分泌柠檬酸的增加(图3b;右图)和Al诱导的SbMATE表达(图3c)紧密相关。在Al中1天后与Al接触使SbMATE表达增加了20%;在Al中3天后Al诱导增加到40%,6天增加到120%。总而言之,SbMATE表达、Al耐受和根释放柠檬酸之间的并行行为支持我们的论点,即所述转运蛋白为Al耐受基因座AltSB
经由在洋葱表皮细胞中瞬时表达SbMATE::GFP翻译融合蛋白来测定SbMATE的亚细胞定位(参见实施例7)。SbMATE蛋白似乎定位在细胞膜上(图3d),这与对其提出的从根细胞中外排柠檬酸的作用一致。因此,这些发现表明我们的AHSB基因座的候选MATE基因编码根部柠檬酸外排转运蛋白,该转运蛋白在基因转录水平由Al诱导,并且还在蛋白功能水平由Al激活。
在来自不同地理来源的高粱多样性组(panel)的12个成员中检查了SbMATE表达,所述成员包括Al敏感型亲本BR007和Al耐受亲本SC283。由该组表现出的广泛的Al耐受性和Al敏感性是由AltSB基因座的等位基因系列引起的(Caniato等,见上述)。SbMATE表达的差异解释了在该组中大部分即96%的Al耐受表型变化(r2=0.96,图4a)。这些结果提供了SbMATE构成AltSB的进一步的证据,并强烈表明基因表达差异构成了AltSB处等位基因变化的基础。在SbMATE表达与Al激活的根尖释放柠檬酸之间(图4b)和柠檬酸释放与Al耐受之间(图4c)相似地发现了显著相关性,表明基因表达差异以主要通过调节根分泌柠檬酸的Al耐受表型为条件。
经由PCR在扩大的高粱组中扩增SbMATE起始密码子上游的大多态区(参见图1d),发现该多态区的大小变化与Al耐受性呈显著正相关(图4d)。测定了代表该可变的四类大小基因型的该区域的序列(图4d),序列数据分析表明该区域高度结构化和重复。如图4e所示,该区域由以下序列组成:起始100bp的高粱序列(图4e中的单元a),接着是较大的243bp序列(单元b),即Tourist样小反向重复转座元件即MITE(miniature inverted repeat transposable element)(Bureau和Wessler.1992.Plant Cell 4:1283-1294;Wessler等.1995.Curr.Opin.Genet.Dev.5:814-821)。MITE插入后面跟着21bp的高粱序列(单元c)。这种a-b-c结构是最小的Al耐受程度最低的实例(Tx430)的单现基因,并在来自另外的三个大小类别的代表中重复3、4和5次不等。对图4e中出示的四个高粱品种(accession)的含MITE区(作为该区域四种大小类别代表)进行了序列测定(图5)。来自Al耐受程度最小的实例(Tx430)的含MITE区的序列确定为SEQ ID NO:5。随着含MITE区大小增加,a-b-c重复数次(图4e)从TX430中的1分别增加到BR007中的3、BR012中的4和SC283中的5。来自BR007、BR012和SC283的该含MITE区的序列分别确定为SEQ ID NO:6、SEQ ID NO:7和SEQID NO:8。因此,来自SbMATE上游的该区域很可能参与Al耐受。位于该区的内源性启动子是受Al诱导的和根特异性的,其导致AltSB在根端表达。
在拟南芥(Arabidopsis thaliana)生态型Columbia(WT Col)和在Al高度敏感的T-DNA敲除突变体AtALMTl-KO(其中小麦ALMTl基因的拟南芥同源物在第一个外显子处受到破坏)中进行了遗传互补测验。我们筛选了10个T-DNA拟南芥插入品系,其中与SbMATE同源物最接近的6个拟南芥基因受到破坏,与Col-0WT比较未观察到Al耐受性降低。这表明功能性MATE等位基因在拟南芥中几乎不存在,或在Columbia生态型中不存在。相反地,AtALMTl的破坏导致Al耐受性相对于WT剧烈降低(图6a),这是因为缺乏AtALMTl功能,该功能的缺乏导致几乎完全失去Al激活的根部苹果酸流出(Hoekenga等,见上述)。因此,我们推断对Al极度敏感的AtALMTl-KO对于在拟南芥中进行的Al耐受性互补测验是非常适合的遗传背景。由CaMV 35S启动子驱动SbMATE表达的纯合T3品系在两个背景中都比对照幼苗显著更耐受Al(图6a)。在Al耐受方面,以WT为背景(TG-WT)的四个转基因品系明显比WT Columbia优越,且与WT品系的65±5%的RNRG相比平均RNRG为88±4%。在对Al高度敏感的AtALMTl背景中SbMATE的表达增加了互补测验的灵敏度,因为以KO为背景(TG-KO)的8个转基因品系与亲本品系相比表现出Al耐受性显著增加(图6b)。在单独的实验中,我们在两个背景中挑选表现最好的以及表现普通的转基因品系,并发现Al耐受性与SbMATE表达水平成比例地增加(图6c)。在Col-TG4和KO-TG8这两个背景中最耐受的转基因品系表现出最大的SbMATE表达及最大的Al激活的根释放柠檬酸,但未观察到苹果酸分泌增加(图6d)。我们在Al敏感型栽培种Bobwhite中培育了转基因小麦品系,在这些品系中SbMATE由玉米泛素启动子驱动而稳定表达。在图7中,用T1转基因小麦品系进行的实验的结果显示我们鉴定了四个转基因品系,它们与非转基因Bobwhite相比基本上提高了Al耐受性。这些用拟南芥和小麦的结果对以下论点提供实验支持:来自高梁SbMATE的MATE家族成员为Al激活的柠檬酸外排转运蛋白,该转运蛋白提供AltSB基因座的Al耐受性。
因此,来自高粱SbMATE的多种药物和毒性化合物外排′MATE′家族成员构成主要的Al耐受基因座AltSB,并通过基于Al激活高粱根端释放柠檬酸的外排机理提供Al耐受性。基因表达的差异是造成在AltSB处等位基因作用的原因,该差异以Al耐受性差异和Al激活柠檬酸释放二者为条件。复合体MATE家族成员存在在于所有三个生命域中(Hvorup等,2003.Eur.J.Biochem.270:799-813),并且似乎编码不同的表型,这些表型与它们作为能量依赖的小有机分子载体的功能密切相关(Morita等,1998.,见上述;Morita等.2000.J.Bacteriol.182:6694-6697;He等.2004.J.Bacteriol.186,262-265)。搜索TIGR数据库显示SbMATE与水稻和拟南芥MATE成员之间的密切相似性;用美国国家生物技术信息中心(National Center for BiotechnologyInformation,NCBI)数据库进行BLASTP搜索显示SbMATE、Medicagotruncatula多抗微生物剂外排蛋白(MatE,ABE84357.1,1=53%,E=2e-143)、拟南芥铁还原酶缺陷型3(FRD3,NP187461.1,1=55%,E=6e-138)和白羽扇豆(Lupinus Albus)LaMATE(AAW30372.1,1=51%,E=3e-125)之间密切相似。发现MATE家族位标(landmark)、NorM1(Morita等.1998.,见上述)、来自嗜盐性的海洋性细菌副溶血弧菌(Vibrio parahaemolyticus)的Na+-驱动的Na+/多种药物反向转运蛋白(Morita等.2000.,见上述)、增强的疾病易感性5(EDS5)蛋白有含较低E值的另外的击中(hit),且对于DNA损伤诱导的F样蛋白(DinF)发现多个击中。已经提出编码介导铁螯合剂(可能是柠檬酸)流向木质部(从而促进将铁以可用的方式递送到芽)的系统的FRD3的作用(Green等.2004.Plant Physiol.136(1):2523-2531)。在白羽扇豆根的类蛋白(或簇)中,柠檬酸的合成和分泌的增加被认为是使固定在土壤粘土部分的磷流通的适应性反应(Newman等.1998.Planta 208:373-382),从而提高低P土壤中磷(P)的利用率。最近,发现在P缺乏情况下MATE家族成员LaMATE在白羽扇豆根中高度表达,猜测其参与转运小有机分子来作为对营养胁迫的反应(Uhde-Stone等.2005.Plant J. 44:840-853)。尽管没有实验证据显示支持FRD3或LaMATE涉及作为柠檬酸载体,但用超过70个转运蛋白家族进行的广泛系统发生分析显示底物特异性是通常与系统发生相关的十分保守的性状,虽然也发现了例外情况(Hvorup等的综述,见上述)。因此,SbMATE在通过Al诱导柠檬酸释放提供Al耐受性方面的作用提示FRD3或LaMATE的底物类似地为柠檬酸。考虑到Al毒性和P缺乏都是酸性土壤中两个最重要的农业限制,MATE家族似乎是适应这些地区的关键。然而,诸如在种皮内皮中类黄酮的液泡螯合作用(由TRANSPARENT TESTA12编码,Debeaujon等,见上述)和用于抵抗疾病的水杨酸依赖的信号传导(由EDS5编码,Nawrath等.2002.Plant Cell 14:275-286)等众多表型由其它家族成员来控制。将这与MATE家族发生于原核细胞域及某些家族成员被遗传到真核细胞的假说(Hvorup等,见上述)结合起来,提示Al耐受性很可能起源于先前存在的和可能的功能性MATE家族成员的突变,这种突变提供导致Al耐受的独特的特性。
遗传上不同的高粱品种的这些数据表明基因表达变化是这些突变的主要结果,并且在基因的调控区内而不是在编码区内的多态性是对AltSB的Al耐受的等位作用的基础。另外,SbMATE表达中的这些变化涉及对在高粱根端特异性表达起驱动作用的因子,根端是需要受保护免受Al毒性的位点。候选基因(candidate)的调控多态性位于由高分辨作图限定的24.6Kb区域内,并可由顺式作用调控序列组成,所述调控序列可介导与影响基因表达的染色质复合体起作用的位点(Guo和Moose.2003.Plant Cell 15:1143-1158),或用作反式作用元件(例如转录因子)的结合位点。或者,靶区域内构成原因的多态性还可编码与顺式作用元件起作用的反式作用因子。因为在该区的两个其它基因ORF 8和9不在高粱根中表达,所以这一假说不太可能。在来自SC283和BR007的参考等位基因之间的序列比对显示可变大小的转座子(MITE)插入是SbMATE翻译起始位点上游的唯一的多态区,该区的大小变化与扩大的高粱组中的Al耐受正相关。业已确定MITE在正常基因的非编码区,并具有提供改变基因表达的调控序列的能力(Bureau和Wessler.1994.Plant Cell 6:907-916;Wessler等,见上述;Yang等.2005.Plant Cell 17:1559-1568)。还已经显示来自玉米Mu转座子的末端反向重复含有植物细胞周期增强子基序和花粉或配子特异性增强子序列(Raizada等.2001.Plant J.25:79-91),已经确定玉米b基因座中的转座子插入是提供在b处产生表型变体的表达特异性的机制(Selinger和Chandler.1999.Proc.Natl.Acad. Sci.USA 96:15007-15012)。常规{abc}1-5{a}结构(导致在不同的高粱品种中靠近SbMATE的MITE插入的大小变化)增加了重复区内的顺式作用元件起倍增式的作用以增强SbMATE在根端的特异性表达的可能性。已知在我们的参考等位基因中SbMATE编码区有单态性质,转座子插入可最终构成AltSB。提供的顺式作用序列的作用实例是驯化(domestication)teosite branchedl(tbl)基因座,这是控制玉米的顶端优势的转录调节子(Doebley等.1997.Nature 386:485-488)。最近业已发现远离tbl的顺式作用元件通过调节tbl表达构成QTL的基础(Clark等.2006.Nat.Genet.38:594-597)。然而,在我们的高粱小组中,与异型杂交物种相比,在自花传粉物种例如高粱中可能是广泛的连锁不平衡(Hamblin等,2004.Genetics 167:471-483;Hamblin等.2005.Genetics 171:1247-1256),能引起MITE插入,以与SbMA TE内含子之一中存在的多态性或与基因终止密码子下游多态性联合(associate)。基因表达差异可以以内含子多态性为条件(参见一个这样的实例,Jeon等,2000.PlantPhysiol 22:561-570),以另外的基因终止密码子下游多态性为条件或以它们之间的相互作用为条件。现在用高度多样的大的高粱组在AltSB靶区内进行广泛的关联作图,以辅助界定影响SbMATE表达的构成原因的多态性性质。
我们先前的比较性作图研究表明,主要的Al耐受基因座(高粱中的AltSB和小麦中的AltBH)位于非保守位置,并很可能截然不同,然而我们推测在水稻第1号染色体上业已重复检测到的主要的Al耐受型QTL与AltSB直向同源(Magalhaes等,见上述)。在包含SbMATE的高粱BAC 181g10与水稻BAC AP003437之间进行的比较性序列分析显示,它们在基因顺序和含量方面都高度保守,因此水稻BACAP003437很可能是181g10的水稻同源物。用SbMATE作为查询在NCBI数据库中发现最佳的BLASTP击中是BAD87624(I=76%,E=0.0),因此它很可能是位于AP003437上的SbMATE的水稻直向同源物。在第1号染色体上的主要的水稻Al耐受型QTL与小麦基因组RFLP Xwg110连锁(Nguyen等,2001.Theor.Appl.Genet.102:1002-1010),通过序列相似性分析发现它与水稻第1号染色体上的约158cM位置的水稻BAC AP003433/AP003451位置邻接(I=78%,E=6.2e-14)。由比较基因组法(我们已将其用于在高粱中位置克隆SbMATE)确定的靶标水稻BAC即AP003437与159cM位置处的AP003451邻接。这些结果为我们的比较性作图假设提供进一步的基于序列的支持,所述比较性作图假设为:在长期进化连续群中Al耐受基因在禾本科植物内的稻族(水稻)和蜀黍族(玉米和高粱)之间保守(Magalhaes等,见上述)。
用递归搜索(recursive search)鉴定了玉米中可能的高粱SbMATE同源物。用TBLASTN在Gramene中使用高粱SbMATE查询水稻基因组,鉴定了7个推定的SbMATE同源物。然后用高粱SbMATE并且还用来自7个水稻SbMATE样基因的序列来查询玉米MAGI GSS数据库。指定为ZmASL49968(为玉蜀黍(Zea mays)AltSB样基因)的与高粱MATE具有最接近的序列相似性的玉米MATE被挑选用于进一步分析。该基因与高粱SbMATE基因在氨基酸水平上具有64%的同一性和73%的相似性。用调查的两个品系来鉴定对Al耐受重要的基因和过程。首先,用关联分析这种遗传统计学方法来使特定核苷酸多态性与各近交系之间的Al耐受显著差异相关联。在该分析之后,在所选择的F2群体中进行连锁分析,以进一步验证所发现的与Al耐受的关联性。需要三组数据来进行关联分析(association analysis):1)性状数据;2)基因型数据;和3)来自研究群基因组之间的充分的标记数据,以评估是真阳性还是假阳性结果(由于群体结构或亲缘关系的结果)。用我们的在+/-Al条件下用于定量测定根生长的标准溶液培养方法,我们使由USDA-ARS,Cornell University的Ed Buckler博士收集的288个玉米近交系关联组显现表型。在5个重复实验的基础上,净种子根生长(在2天胁迫处理期间出现的根生长量)遗传力评估为0.65。我们使用混合模型ANOVA的最新形式;该模型由Ed Buckler博士开发,最近在Nature Genetics(2006.38:203-208)上发表。我们采用来自跨玉米基因组的一套500SNP来经验性地计算Al耐受的显著性阀值(significance threshold)。
然后我们在玉米关联组中的所有288个近交系测定图8a中所描绘的ZmASL-49968区的序列。统计学分析表明该基因中的多态性与玉米Al耐受性显著相关,这强烈表明该基因为候选Al耐受基因。对于该基因的关联分析的细节描述于图8b中。然后用连锁群来验证该基因在玉米Al耐受中的显著性,这用在已知ZMASL-49968等位基因检测中不同的亲本(B73x CML247)间进行F2杂交来进行。如图9所示,B73品种所携带的ZmASL-49968优等等位基因相对于CML247所携带的敏感性等位基因是完全显性的。
用微阵列分析来检查Al耐受和敏感型玉米基因型的玉米根尖中全局基因表达谱(global gene expression profiling)。我们确定了作为高粱SbMATE同源物的第二个候选玉米Al耐受基因。如图10中所示,我们在玉米根尖中发现了三个基因,这三个基因仅在耐受型玉米品系根尖由Al强烈诱导表达,并且还在耐受型品系中显示出较高的组成型(-Al)表达。所述基因之一(即图10中的MZ000025698)来源于EST NP667103,其在玉米的3个受Al诱导的MATE基因中在序列上与高粱SbMATE最接近(氨基酸水平同一性为53%),并被挑选用于进一步研究。衍生了用于该基因区的标记,并在源自Al耐受x敏感亲本之间杂交的Embrapa重组近交系群上作图。如图11所示,用所述群将该基因作图到先前由Embrapa Maize and Sorghum确定的主要的Al耐受型QTL。最后,我们用RT-PCR分析该基因在两个Al耐受型玉米品系AI237和Cat100-6及Al敏感型品系L53的根尖中的表达,证实了微阵列的结果。AI237和L53是Embrapa RIL作图群体的亲本。如图12所示,在缺乏和存在Al两种情况下,基因在2个耐受型品系的根尖中都更加强烈地表达。
由Sasaki和其合作者克隆的ALMTl基因(Sasaki等,见上述)是Al激活的苹果酸转运蛋白,该转运蛋白不属于任何已存在的已知功能的蛋白家族。小麦ALMTl和高粱SbMATE之间的直接序列比对证实这些基因是不同的。然而,令人感兴趣的是,SbMATE和ALMTl这两个非直向同源基因独立进化以编码类似但不相同的基于有机酸释放的从根端排除Al的生理学机理。可设计育种策略以利用由非直向同源Al耐受基因(控制Al耐受的趋同生理机理)提供的附加的作用。
在本发明优选的实施方案中,编码Al耐受基因的核酸选自:(a)分离的DNA,其编码Al诱导的柠檬酸外排转运蛋白;(b)分离的DNA,其与上述(a)的分离的DNA杂交并编码Al诱导的柠檬酸外排转运蛋白蛋白或编码具有Al诱导的柠檬酸外排转运蛋白生物学活性的肽;和(c)分离的DNA,其由于遗传密码的简并性而在核苷酸序列上不同于上述(a)和(b)的分离的DNA,并编码Al诱导的柠檬酸外排转运蛋白蛋白或编码具有Al诱导的柠檬酸外排转运蛋白生物学活性的肽。“与分离的DNA杂交的DNA”是指可在DNA杂交实验中于本领域已知的严格条件下被鉴定的DNA序列(参见例如Sambrook等.1989.Molecular Cloning:A Laboratory Manual(分子克隆:实验手册),第二版,Cold Spring Harbo Laboratory Press,Cold Spring Harbor,NY)。这包括显示与高粱Al耐受基因至多80%序列同一性的来自其它物种的同源物。
在本发明最特别优选的实施方案中,编码Al诱导的柠檬酸外排转运蛋白基因的核酸为具有由SEQ ID NO:3确定的序列或其具有Al诱导的柠檬酸外排转运蛋白生物学活性的部分的SbMATE基因。
在本发明另一实施方案中,所述DNA为重组嵌合基因构建体,所述构建体包含可在植物细胞中有效的启动子和编码上述Al诱导的柠檬酸外排转运蛋白的DNA。所述启动子可为根特异性的Al诱导的启动子。在另一实施方案中,嵌合基因构建体另外编码至少一个可选择的标记和/或进一步包含异源编码序列,其中异源编码序列为分离的DNA,该DNA编码具有对植物有利并且不同于Al诱导的柠檬酸外排转运蛋白的性质的多肽序列。编码具有对植物有利的性质的多肽和抗植物病原体的多肽的基因在本领域众所周知。实例包括编码保护植物免受病原体、除草剂、杀真菌剂、杀虫剂或不利环境影响的蛋白的基因,其中不利环境影响包括热、冷、风、不适宜的土壤条件、湿气和干燥。
在本发明进一步优选的实施方案中,所述重组嵌合基因构建体进一步包含编码含有翻译增强子的5′非翻译区的DNA和编码含有功能性聚腺苷酸化信号的3′非翻译区的DNA,存在于SbMATE翻译起始密码子的5′端直到7bp插入/缺失遗传标记,或SbMATE翻译终止密码子的3′端直到SNP G/A遗传标记的其它调控序列,或这些调控元件的部分。
在本发明另一优选的实施方案中,编码具有Al诱导的柠檬酸外排转运蛋白活性的蛋白或肽的DNA序列或包含异源编码序列的DNA序列,来源于哺乳动物基因、植物基因或微生物基因,或为合成基因。
在本发明优选的实施方案中,所述DNA包含在载体中,在启动子控制下使得所述DNA可在所述转基因植物中表达。本发明进一步实施方案包括由这些载体转化的植物细胞、含有嵌合基因的植物部分和植物及其后代。
在本发明优选的实施方案中,含有本发明DNA的宿主细胞为细菌细胞,尤其是根癌农杆菌(Agrobacterium tumefaciens)细胞。
在本发明优选的实施方案中,由所述DNA序列编码的蛋白为Al诱导的柠檬酸外排转运蛋白。在本发明尤其优选的实施方案中,所述转运蛋白为来自高粱的Al诱导的柠檬酸外排转运蛋白SbMATE,其确定为SEQ ID NO:4。
本发明又一实施方案是制备重组耐受Al植物的方法,所述方法包括:提供能够再生的植物细胞;用编码Al诱导的柠檬酸外排转运蛋白的DNA片段转化所述植物细胞,其中所述DNA区段选自:(a)编码Al诱导的柠檬酸外排转运蛋白的分离的DNA;(b)与上述(a)的分离的DNA杂交并编码Al诱导的柠檬酸外排转运蛋白蛋白或编码具有Al诱导的柠檬酸外排转运蛋白生物学活性的肽的分离的DNA;和(c)由于简并遗传密码在核苷酸序列上不同于上述(a)和(b)的分离的DNA并编码Al诱导的柠檬酸外排转运蛋白蛋白质或编码具有Al诱导的柠檬酸外排转运蛋白生物学活性的肽的分离的DNA;和然后从所述转化的植物细胞再生重组耐受Al的植物。
本发明再一实施方案为制备重组耐受Al植物的方法,所述方法包括:提供能够再生的植物细胞;用嵌合基因构建体转化所述植物细胞,所述构建体包含可在所述植物细胞中操作的启动子和编码Al诱导的柠檬酸外排转运蛋白的DNA片段,其中所述DNA片段选自:(a)编码Al诱导的柠檬酸外排转运蛋白的分离的DNA;(b)与上述(a)的分离的DNA杂交并编码Al诱导的柠檬酸外排转运蛋白蛋白或编码具有Al诱导的柠檬酸外排转运蛋白生物学活性的肽的分离的DNA;和(c)由于遗传密码简并性在核苷酸序列上不同于上述(a)和(b)的分离的DNA,但编码Al诱导的柠檬酸外排转运蛋白蛋白或编码具有Al-诱导的柠檬酸外排转运蛋白生物学活性的肽的分离的DNA;和然后从所述转化的植物细胞再生出重组耐受Al的植物。
本发明再一实施方案为用于产生表现铝耐受性的转基因植物的方法,所述方法包括将编码至少一个具有Al诱导的柠檬酸外排转运蛋白活性的肽的遗传工程改造的DNA序列导入到合适植物的遗传物质中。术语“遗传物质”是指植物细胞的核基因组、植物细胞的细胞器基因组或染色体外的形式。术语“导入”是指能够将所述遗传工程改造的DNA序列引入到植物细胞的所述遗传物质中的方法。所述方法优选的实例为农杆菌介导的转移、植物病毒介导的转移、微注射、微粒轰击、电穿孔、PEG介导的转化和用基于病毒的稳定载体的植物原生质体转化,所有方法在本领域都众所周知并熟练运用。在本发明另一优选的实施方案中,所述导入通过用农杆菌系统转染来进行。
本发明再一实施方案提供用于为了在转基因植物中表达Al诱导的柠檬酸外排转运蛋白基因序列而操控该基因的方法,所述转基因植物既包括单子叶植物又包括双子叶植物。在本发明优选的实施方案中,转基因植物为棉花、玉米、花生、向日葵、烟草、水稻、小麦、黑麦、大麦、苜蓿、西红柿、黄瓜、大豆、甘薯、葡萄、油菜籽、甜菜、茶、草莓、玫瑰、菊花、白杨、茄子、甜椒、胡桃、阿月浑子、芒果、香蕉或马铃薯。在本发明尤其优选的实施方案中,SbMATE在高粱中表达。所改造的转基因植物由此提高了铝耐受性。
本发明Al诱导的柠檬酸外排转运蛋白基因在转基因植物中表达,由此导致在转基因植物中生物合成Al诱导的柠檬酸外排转运蛋白。以该方式产生铝耐受性提高的转基因植物。为了使其在转基因植物中最佳地表达,可能需要修饰Al诱导的柠檬酸外排转运蛋白基因及邻近序列并使其最优化。
优选的Al诱导的柠檬酸外排转运蛋白生物合成基因可以为未修饰的基因,这些基因应该在靶标转基因植物物种中以高水平表达,或作为选择可以是通过以下方式来修饰的基因:通过去掉不稳定及不合适的聚腺苷酸化基序和不合理的剪接位点来修饰,并进一步通过掺入植物优选的密码子来修饰,进一步用优选用于在植物中表达的GC含量。尽管优选的基因序列可在单子叶植物和双子叶植物两种物种中适当地表达,但可对序列进行修饰以考虑单子叶植物或双子叶植物的特定的密码子偏爱和GC含量偏爱。
可在缺乏外源提供的启动子下用编码Al诱导的柠檬酸外排转运蛋白的DNA区段转化转基因植物。然而,当将包含在所述植物细胞中有效的启动子和编码Al诱导的柠檬酸外排转运蛋白的DNA区段的嵌合基因构建体用于转化时,可得到Al诱导的柠檬酸外排转运蛋白的最佳表达的结果。在启动子在植物中显示具有功能之后,Al诱导的柠檬酸外排转运蛋白基因在转基因植物中表达。对启动子的选择根据表达的时间和空间需要以及靶组织或物种来变化。Al诱导的柠檬酸外排转运蛋白基因在转基因植物中的表达可受组成型启动子或被调控的启动子的调控。这些启动子在本领域众所周知,阐述于例如美国专利第5,589,625号中;实例有:花椰菜花叶病毒35S启动子、水稻肌动蛋白启动子、来自不同物种的rbc S启动子、农杆菌TR2’启动子、菜豆蛋白基因启动子或NOS启动子。组成型表达的优选启动子包括CaMV 35S、花椰菜花叶病毒35S启动子和19S启动子和来自编码肌动蛋白或泛素的基因的启动子。优选Al诱导的柠檬酸外排转运蛋白SbMATE在花椰菜花叶病毒35S启动子或泛素启动子的控制下组成型表达。
也可对本发明SbMATE基因的表达进行控制,即在被调控的启动子的调控下表达。因此,可将该转化方法开发为在农作物植物生活周期内的特定时间或在植物的特定部分为特定农作物提供Al耐受,例如用本发明内源性启动子所观察到的一样,发现该启动子在SbMATE上游并为根特异性的和受Al诱导的。嵌合基因构建体受控表达的优点是SbMATE仅在合适时间表达,和/或表达到合适程度,和/或仅在植物的特定部分表达。进一步的优点在于常规保护措施难以达到的植物部分通过用该方法可得到保护,这通过核酸在所有组织中的组成型表达或通过由组织或阶段特异性启动子控制的核酸的组织特异性表达来实现。另外,可使控制铝耐受的该转化方法和这些转基因植物进一步发展到在特定情况下(例如创伤、干旱和化学诱导)发生基因表达的程度。
除了选择合适的启动子外,用于在植物中表达SbMATE的构建体还需要连接到异源SbMATE基因下游的合适的转录终止子。若干这样的终止子是可利用的并为本领域所知(例如来自CaMV的tml、来自rbcS的E9)。任何已知在植物中发挥作用的有效终止子可用于本发明内容中。
可将众多其它序列掺入到SbMATE基因表达盒中。所述其它序列包括业已显示增强表达的序列,例如内含子序列(例如来自Adhl和bronzel的内含子)和病毒前导序列(例如来自TMV、MCMV和AMV的前导序列)。
对于农杆菌介导的转化而言,二元载体或携带至少一个T-DNA边界序列的载体是合适的,但对于直接基因转移而言,任何载体都合适,可优选仅含有目标构建体的线性DNA。在直接基因转移的情况下,可使用单个DNA种类转化或共转化(Schocher等.1986.Biotechnology 4:1093-1096)。对于直接基因转移和农杆菌介导的转移二者而言,通常(但并非必须)用选择性标记转化,所述标记可提供对抗生素(卡那霉素(kanamycin)、潮霉素(hygromycin)或甲氨蝶呤(methatrexate))或除草剂(磺酰脲(sulfonylurea)、咪唑啉酮(imidazolinone)或basta)的耐受性。然而,选择性标记的挑选对于本发明并非至关重要。
本发明另外的实施方案涉及具有Al诱导的柠檬酸外排转运蛋白活性的肽,该肽可用于产生抗体。所述抗体可用于在生物学样品中检测具有Al诱导的柠檬酸外排转运蛋白生物学活性的肽的存在情况。
本文所用术语“核酸分子”、“核酸序列”、“多核苷酸”、“多核苷酸序列”、“核酸片段”、“分离的核酸片段”在本文中可互换使用。这些术语包含核苷酸序列等等。多核苷酸可为单链或双链并且任选含有合成的、非天然的或改变的核苷酸碱基的RNA或DNA聚合体。呈DNA聚合体形式的多核苷酸可由一个或多个cDNA区段、基因组DNA、合成DNA或其混合物组成。
术语“分离的”多核苷酸是指基本上无其它核酸序列(例如其它染色体DNA及RNA和染色体外的DNA及RNA)的多核苷酸,这些DNA及RNA通常在所述多核苷酸的天然存在环境中伴随着所述多核苷酸或与其相互作用。然而,分离的多核苷酸可含有可能最初作为染色体外的DNA存在但在分离的多核苷酸内作为核苷酸插入存在的多核苷酸序列。分离的多核苷酸可从它们在其中天然存在的宿主细胞中纯化。可以使用技术人员已知的常规核酸纯化方法来获得分离的多核苷酸。该术语还包含重组的多核苷酸和化学合成的多核苷酸。
本文所用“重组体”指通过用限制性酶、连接酶和类似的遗传工程技术对遗传物质进行操作而获得的核酸分子,这些技术阐述于例如Sambrook等.1989.Molecular Cloning:A Laboratory Manual (分子克隆:实验室手册),第二版,Cold Spring Harbor Laboratory Press,ColdSpring Harbor,NY,或DNA Cloning:A Practical Approach(DNA克隆:实用方法),第1和第2卷(D.N.Glover编辑),IRL Press,Oxford,1985。本文所用“重组体”不指天然存在的遗传重组。
本文所用术语“嵌合”是指源自不同来源、株系或物种的在自然条件下不会重组的两个或多个DNA分子,或以在天然基因组中不存在的方式连接的来自同一物种的两个或多个DNA分子。“构建体”或“嵌合基因构建体”是指可操作地连接到启动子和/或其它调控序列的编码蛋白质(本文为SbMATE蛋白)的核酸序列。
本文所用术语“表达(express或expression)”定义为仅是指转录。调控元件可操作地连接到SbMATE基因的编码序列,以便调控元件能够控制SbMATE基因的表达。“改变的水平”或“改变的表达”是指在转基因生物体中以不同于正常生物体或非转化的生物体的量或比例来生产一种或多种基因产物。
本文所用术语“编码(encoding、coding或encoded)”当在特定核酸的情况中使用时意指该核酸包含指导核苷酸序列翻译为特定蛋白质的必需信息。通过利用密码子来指定被编码的蛋白质的信息。编码蛋白质的核酸可包含在核酸翻译区内的非翻译序列(例如内含子),或可缺少所述插入的非翻译序列(例如在cDNA中)。
术语“可操作地连接”指两个或多个核酸片段联合在单个核酸片段上,以至于一个的功能受到另一个的影响。例如,当启动子能够影响编码序列表达时(即编码序列在启动子的转录控制下),该启动子为可操作地连接编码序列。编码序列可按有义或反义方向可操作地连接调控序列。
“调控序列”是指位于编码序列上游(5’非编码序列)、之中或下游(3’非编码序列)的核苷酸序列,其影响相关的编码序列的转录、RNA加工或稳定性或翻译。调控序列可包含启动子、翻译前导序列、内含子和聚腺苷酸化识别序列。
“启动子”是指能够控制编码序列或功能性RNA表达的核苷酸序列。一般而言,编码序列位于启动子序列的3’端。启动子序列由近端和较远端的上游元件组成,后一元件通常称为增强子。因此,“增强子”为可刺激启动子活性的核苷酸序列,其可为启动子的固有元件或插入以提高启动子的水平或组织特异性的异源元件。启动子可以以其整体从天然基因中获得(例如本文所公开的特异性诱导SbMATE基因在根端表达的启动子)_,或由来源于在自然界中发现的不同启动子的不同元件组成,或甚至包含合成的核苷酸区段。本领域技术人员应该理解,不同的启动子可指导基因在不同的组织或细胞类型中表达,或在不同发育阶段表达,或响应不同的环境条件表达。例如,启动子的组织特异性通过特异性诱导SbMATE基因在根尖中表达的启动子序列(上述)来例述。导致核酸片段在大部分细胞类型中于大部分时间表达的启动子一般称为“组成型启动子”。经常发现用于植物细胞的各种类型的新的启动子;在Okamuro和Goldberg汇编的文献(1989,Biochemistry of Plants 15:1-82)中可发现众多实例。另外公认的是,因为在大部分情况下调控序列的确切边界尚未完全确定,所以不同长度的核酸片段可具有同样的启动子活性。
“翻译前导序列”是指位于基因启动子序列和编码序列之间的核苷酸序列。翻译前导序列存在于翻译起始序列的完全加工的mRNA上游。翻译前导序列可影响初级转录物加工成mRNA、mRNA稳定性或翻译效率。
“3′非编码序列”是指位于编码序列下游的核苷酸序列,其包括聚腺苷酸化识别序列和编码能够影响mRNA加工或基因表达的调控信号的其它序列。通常聚腺苷酸化信号特征在于影响将多腺苷酸段加到mRNA前体的3′端。
“RNA转录物”是指因RNA聚合酶催化DNA序列转录而得到的产物。当RNA转录物为DNA序列的完全互补拷贝时,其被称为初级转录物,或者RNA转录物可为来源于初级转录物的转录后加工的RNA序列,其被称为成熟RNA。“信使RNA(mRNA)”是指没有内含子并可通过细胞翻译为多肽的RNA。“cDNA”是指与mRNA模板互补并来源于mRNA模板的DNA。cDNA可为单链,或用例如DNA聚合酶I的Klenow片段转化为双链形式。“有义”RNA指包括mRNA的RNA转录物,因此可通过细胞翻译为多肽。“反义”当用于特定核苷酸序列的情况下时,是指提及的转录产物的互补链。“反义RNA”是指与靶初级转录物或mRNA的全部或部分互补并阻碍靶基因表达的RNA转录物。反义RNA的互补可以是与特定核苷酸序列的任何部分互补,即可在5′非编码序列、3′非编码序列、内含子或编码序列处互补。“功能性RNA”是指有义RNA、反义RNA、核酶RNA或不能被翻译但对细胞过程仍具有影响的其它RNA。
“转化”是指将核酸片段转移到宿主生物体基因组中,其导致在遗传上稳定遗传。含有转化的核酸片段的宿主生物体被称为“转基因”生物体。植物转化方法的实例包括农杆菌介导的转化(De Blaere等.1987.Meth.Enzymol.143:277)和加速粒子或“基因枪”转化技术(Klein等.1987.Nature(London)327:70-73;美国专利第4,945,050号,其在此引作参考)。以下公开了另外的转化方法。因此,可将本发明分离的多核苷酸掺入到重组构建体中,所述构建体通常为能够导入到宿主细胞并在其中复制的DNA构建体。所述构建体可为包含复制系统和能够在既定宿主细胞中转录和翻译多肽编码序列的序列的载体。在以下文献中已经阐述适用于稳定转染植物细胞或用于建立转基因植物的多种载体:例如Pouwels等.1985.Supp.1987.Cloning Vectors:ALaboratoryManual(克隆载体:实验室手册);Weissbach和Weissbach.1989.Methods for Plant Molecular Biology(植物分子生物学方法),Academic Press,New York;和Flevin等.1990.Plant Molecular BiologyManual(植物分子生物学手册),Kluwer Academic Publishers,Boston。植物表达载体通常包括例如一个或多个在5′和3′调控序列的转录控制下的克隆的植物基因和显性选择性标记。所述植物表达载体还可含有启动子调控区(例如控制诱导型或组成型表达、环境或发育调控的表达或细胞或组织特异性表达的调控区)、转录开始起始位点、核糖体结合位点、RNA加工信号、转录终止位点和/或聚腺苷酸化信号。
“蛋白质”或“多肽”为以由编码多肽的多核苷酸中的编码序列决定的特定顺序排列的氨基酸链。每种蛋白质或多肽具有独特的功能。
本文所用术语“基本上纯的”是指以下SbMATE多肽:所述多肽基本上没有与其天然缔合的其它蛋白质、脂类、糖类或其它物质。本领域技术人员可用蛋白质纯化的标准技术来纯化SbMATE。SbMATE多肽纯度也可由氨基末端氨基酸序列分析来测定。
本发明包括功能性SbMATE多肽和其功能性片段以及具有相同生物学功能或活性的突变体和变体。本文所用术语“功能性片段”、“突变体”和“变体”是指具有通过限定性功能测定法(defined functionalassay)确定的生物学功能或活性并与细胞中特定的生物学、形态学或表型变化相关的多肽。术语“SbMATE多肽的功能性片段”是指保留了铝耐受途径中的SbMATE活性及功能的所有SbMATE片段。功能性片段例如可在大小上变化,小至能够结合抗体分子的表位的多肽片段,大至能够参与细胞内表型变化的特性诱导或程序化的大的多肽。此外,在生物检测中可利用SbMATE在铝耐受途径中的功能或活性以鉴定SbMATE多肽或相关多肽的功能性片段。因此,在Al耐受型玉米品系中发现了在氨基酸水平与高粱SbMATE基因具有53%-64%同一性和73%-75%相似性的两个玉米SbMATE直向同源物,以及编码这些多肽的基因以Al诱导的方式优先在耐受Al的植物根尖中表达,表明这些包含SbMATE多肽部分的直向同源物确实具有SbMATE生物学活性。
对SbMATE一级氨基酸序列的修饰可进一步导致产生活性与本文所述SbMATE多肽基本上相同的突变体或变体蛋白。所述修饰可以是经过考虑的,如通过定点诱变,或可通过氨基酸序列中的自发变化而发生,其中这些变化产生具有与SbMATE多肽基本上等同的活性的经修饰多肽。通过对SbMATE一级氨基酸序列的微小修饰产生的任何多肽只要具有SbMATE生物学活性(例如在导致植物中的铝耐受途径中起作用)则就包括在本文中。
异源编码序列是指编码与上文提供的SbMATE多肽没有亲缘关系或与其不同的肽或蛋白并且不是在嵌合基因构建体中提供的位置中固有地存在的编码序列。
可用多种本发明的技术克隆编码SbMATE蛋白的基因。克隆SbMATE基因的最简单的方法需要克隆来自确定为产生SbMATE蛋白的生物体的基因组DNA,并将合适的质粒或载体上的克隆的DNA转移到不产生SbMATE蛋白的宿主生物体中,接着鉴定转化的宿主是否已经被赋予产生SbMATE蛋白的能力。可将转化的赋予SbMATE的DNA切割为较小的片段,可进一步表征保留了赋予SbMATE能力的最小的片段。适用于由同源物来克隆的技术包括通过DNA杂交的标准文库筛选或用来源于保守序列的引物进行聚合酶链式反应(PCR)扩增。如本文所定义,当用诸如CLUSTRAL或PILEUP等算法在限定长度序列中有至少80%(优选至少85%和最优选90%)的核苷酸匹配时,两个DNA序列基本上同源。在DNA杂交实验中在严格条件下可鉴定基本上同源的序列,这为本领域所知。参见例如Sambrook等,见上述。Sambrook等将高度严格的条件阐述为低于完全配对的靶标和探针的Tm 5-10℃的杂交温度;因此,“基本上同源”的序列将在所述条件下杂交。
本文所用“基本上相似”是指以下核酸片段:其中在一个或多个核苷酸碱基中的变化导致一个或多个氨基酸取代但不影响由该核苷酸序列编码的多肽的功能特性。“基本上相似”也指本发明核酸片段的修饰,例如基本上不影响所得到的转录物的功能特性的核苷酸缺失或插入。因此,应该理解,本发明不仅包括具体的例示性核苷酸或氨基酸序,还包括其功能等同物。导致在既定位点产生化学上等同的氨基酸但不影响所编码的多肽的功能特性的核酸片段改变,在本领域众所周知。因此,用于丙氨酸这种疏水氨基酸的氨基酸密码子可被编码另一疏水性较小的残基(例如甘氨酸)或疏水性较大的残基(例如缬氨酸、亮氨酸或异亮氨酸)的密码子取代。类似地,也可期需导致一个带负电荷的残基取代另一个带负电荷的残基(例如天冬氨酸取代谷氨酸),或一个带正电荷的残基取代另一个带正电荷的残基(例如赖氨酸取代精氨酸)的变化,以产生功能上等同的产物。还期需导致多肽分子N-末端和C-末端部分改变的核苷酸变化,以改变多肽活性。提出的每种修饰都完全属于本领域常规技术,其决定编码产物的生物学活性的保留。选定影响多肽在病毒或宿主细胞(真核细胞,例如植物、酵母、真菌或藻类;原核细胞,例如细菌)中表达水平的分离的多核苷酸的方法可包括以下步骤:构建本发明分离的多核苷酸或本发明分离的嵌合基因;将该分离的多核苷酸或分离的嵌合基因导入到宿主细胞中;在含有分离的多核苷酸的宿主细胞中测量多肽水平;让含有分离的多核苷酸的宿主细胞的多肽水平与不含分离的多核苷酸的宿主细胞的多肽水平进行比较。
此外,基本上相似的核酸片段还可由其杂交能力来表征。由在严格条件下DNA之间或DNA与RNA之间的杂交提供的所述同源物的估测为本领域技术人员所完全理解(1985.Nucleic AcidHybrdization(核酸杂交),Hames和Higgins编辑,IRL Press,Oxford,U.K.)。为了筛选适度相似片段(例如来自亲缘很远的生物体的同源序列)到高度相似片段(例如复制来自亲缘很近的生物体的功能酶的基因),可调整严格条件
因此,编码SbMATE多肽的分离的序列及在严格条件下与本文公开的SbMATE序列或其片段杂交的分离的序列包括在本发明中。
本发明基本上相似的核酸片段还可通过它们编码的氨基酸序列与本文公开的氨基酸序列的百分比同一性来表征,这由本领域技术人员常用算法来测定。
用于比较的序列比对方法在本领域众所周知。因此,在任何两个序列之间的同一性百分比的测定可用数学算法来完成。这样的数学算法的非限制性实例有:Myers和Miller算法(1988.CABIOS4:11-17);Smith等的局部同源物算法(1981.Adv.Appl.Math,2:482);Needleman和Wunsch的同源物比对算法(1970.J. Mol.Biol.48:443-453);Pearson和Lipman的搜索相似性方法(1988.Proc.Natl.Acad.Sci 85:2444-2448);Karlin和Altschul的算法(1990.Proc.Natl.Acad.Sci USA 87:2264),该算法在Karlin和Altschul(1993.Proc.Natl.Acad. Sci USA 90:5873-5877)中作了改进。
可将这些数学算法的计算机执行程序用于比较序列以测定序列同一性。所述执行程序包括但不限于:在PC/Gene程序中的CLUSTAL(可从Intelligenetics,Mountain View,Calif.得到);ALIGN程序(2.0版本)和在Wisconsin Genetics软件包第8版(可从GeneticsComputer Group(GCG),575Science Drive,Madison,Wis.,USA得到)中的GAP、BESTFIT、BLAST、FASTA和TFASTA。用缺省参数可实施使用这些程序的比对。
除非另外指出,否则用LASERGENE生物信息计算机处理程序组的Megalign程序(DNASTAR Inc.,Madison,Wis.)或任何等同程序来进行序列比对和百分比同一性计算。用缺省参数(空位罚分=10,空位长度罚分=1.0)的Clustal W比对方法(Higgins和Sharp(1989.CABIOS 5:151-153)进行多个序列比对,同时除非另外指出,否则用Clustal W方法的配对比对的缺省参数为空位罚分=10,空位长度罚分=1.0,慢-精确模式。
在两个核酸或多肽序列情况中,本文所用“序列同一性”或“同一性”是指当在特定比较窗口内比对最大对应性(correspondence)时在两个序列中相同的残基。当将序列同一性百分比用于提及蛋白质时,公认的是,不相同的残基位置往往因保守氨基酸取代而不同,其中氨基酸残基被其它具有相似化学性质(例如电荷或疏水性)的氨基酸残基取代,因此不改变该分子的功能特性。
本文所用“序列同一性百分比”意即通过在比较窗口内比较两个最佳比对的序列确定的值,其中为了实现两个序列的最佳比对,与参考序列(其不包含添加或缺失)相比,在比较窗口内的多核苷酸序列部分可包含添加或缺失(即空位)。所述百分比按如下计算:测定在两个序列中都出现的相同的核酸碱基或氨基酸残基位置数以产生匹配的位置数,用匹配的位置数除以比对窗口中的总位置数,其结果再乘以100得到序列同一性百分比。
本文所用“参考序列”是用作序列比对基础的限定序列。参考序列可以是特定序列的子集或全部;例如为全长cDNA或基因序列的区段或完整的cDNA或基因序列。
术语多核苷酸序列“基本同一性”意即多核苷酸包含如下序列:用所述比对程序之一用标准参数与参考序列相比具有至少80%序列同一性、优选至少85%、更优选至少90%、最优选至少95%序列同一性的序列。本领域技术人员将认识到,可通过考虑密码子简并性、氨基酸相似性、可读框位置等等将这些值适当地调整,以确定由两个核苷酸序列编码的蛋白的相应的同一性。为了这些目的的氨基酸序列的基本同一性通常意指至少80%、优选至少85%、更优选至少90%和最优选至少95%的序列同一性。优选用Needleman等的同源物比对算法(1970.J. Mol.Biol.48:443)进行最佳比对。
核苷酸序列基本上同一的另一指标是两个分子是否能在严格条件下彼此杂交。通常,严格条件选定为在确定的离子强度和pH下低于特定序列的热熔点(Tm)约5℃。然而,严格条件包括约1℃-约20℃的温度范围,视本文中另外限定的所需严格性程度而定。
氨基酸或核苷酸序列的“基本部分”包含足以提供对所述氨基酸或核苷酸序列所包含的蛋白或基因的推定性鉴定的氨基酸或核苷酸序列。可通过本领域技术人员手动或通过用采用诸如BLAST等算法的基于计算机的序列比对和鉴定工具来评估氨基酸和核苷酸序列。一般而言,为了推定性鉴定多肽或核酸序列与已知蛋白质或基因同源性,需要10个或更多个邻接的氨基酸或30个或更多个邻接的核苷酸序列。此外,对于核苷酸序列,包含30个或更多个邻接核苷酸的基因特异性寡核苷酸探针可用于基因鉴定和分离的序列依赖性方法。另外,12个或更多个核苷酸的短寡核苷酸可用作PCR扩增引物,以获得包含引物的特定核酸片段。因此,核苷酸序列的“基本部分”包含将为包含所述序列的核酸片段提供具体的鉴定和/或分离的核苷酸序列。本说明书教导编码包含特定的植物蛋白的多肽的氨基酸和核苷酸序列。受益于本文报道的序列的技术人员现在可使用所公开的序列的全部或基本部分用于本领域技术人员已知的目的。因此,所述部分代表“基本部分”,并可用于确定“基本同一性”,即与高粱参考序列相比至少80%的序列同一性。因此,本发明包含在所附序列表中报道的全部序列以及如上所定义的那些序列的基本部分。
本发明还包括所公开的核苷酸序列的片段及变体和由此编码的蛋白质。“片段”意指部分核苷酸序列或部分氨基酸序列和由其编码的蛋白。核苷酸序列的片段可编码保留天然蛋白的生物学活性并因此具有类似SbMATE的活性的蛋白片段。或者,用作杂交探针的核苷酸序列的片段可不编码保留生物学活性的片段蛋白。
“变体”意指基本上相似的序列。对于核苷酸序列,保守变体包括那些因遗传密码简并性而编码本发明SbMATE多肽之一的氨基酸序列的序列。天然存在的例如这些等位基因变体可用众所周知的分子生物学技术鉴定,这些技术例如用于扩增特定DNA区段的聚合酶链式反应(PCR)。根据通过本文其他地方所述的序列比对程序所测定,本发明特定核苷酸序列的变体与所述特定核苷酸序列相比,通常具有至少约90%、优选至少约95%和更优选至少约98%的序列同一性。
“变体蛋白”意指通过以下修饰由天然蛋白获得的蛋白:在天然蛋白的N-末端和/或C-末端缺失(所谓截短)或添加一个或多个氨基酸;在天然蛋白的一个或多个位点缺失或添加1个或多个氨基酸;或在天然蛋白的一个或多个位点取代1个或多个氨基酸。本发明包含的变体蛋白为生物学活性的蛋白,即它们也具有所需的天然蛋白的生物学活性,也就是本文所述类似SbMATE的活性。所述变体可起因于例如遗传多态性或人工操作。根据通过本文其他地方所述的序列比对程序所测定,本发明天然SbMATE蛋白的生物学活性变体与天然蛋白的氨基酸序列相比,将具有至少约90%、优选至少约95%和更优选至少约98%的序列同一性。本发明蛋白的生物学活性变体可在少至1-15个氨基酸残基或甚至1个氨基酸残基处不同于所述蛋白。
可以以多种方式改变本发明多肽,包括氨基酸取代、缺失、截短和插入。可通过联合本发明蛋白以及其它蛋白的元件和片段,来产生具有感兴趣的性质的新蛋白。用于这样的操作的方法通常为本领域所知。因此,本发明基因和核苷酸序列同时包括天然存在的序列和突变体形式两者。同样地,本发明蛋白包括天然存在的蛋白以及其变型和修饰形式。这样的变体也具有所需的SbMATE活性。很显然,在编码变体的DNA中所进行的突变不应该发生在可读框之外的序列,优选不产生能够形成二级mRNA结构的互补区。
不希望本文包含的蛋白序列的缺失、插入和取代致使所述蛋白特性发生根本改变。然而,当在取代、缺失或插入之前很难预测这样做的准确效果时,本领域技术人员应了解,由常规筛选测定法(其中可观察SbMATE蛋白的作用)来评估该效果。
“密码子简并性”是指允许核苷酸序列变化而不影响所编码的多肽的氨基酸序列的遗传密码的差异。因此,本发明涉及包含编码本文所提出的氨基酸序列的全部或基本部分的核苷酸序列的任何核酸片段。
应该理解,本文所用术语“转基因”包括因存在异源核酸其基因型已经被改变的任何细胞、细胞系、愈伤组织、组织、植物部分或植物,包括最初就有如此改变的那些转基因以及通过有性杂交或无性繁殖由最初的转基因产生的转基因。本文所用术语“转基因”不包括通过常规植物育种方法或通过天然存在的事件改变基因组(染色体或染色体外基因座),例如不包括随机异花受精、非重组病毒感染、非重组细菌转化、非重组转座或自发突变。
本文所用术语“植物”包括提及整株植物、植物器官(例如叶、茎、根等)、种子、植物细胞和植物的后代。转基因植物的部分在本发明范围内应该理解为包括:例如来源于转基因植物的植物细胞、原生质体、组织、愈伤组织、胚胎以及花、茎、果实、叶、根,或者先前用本发明DNA分子转化因此至少由部分转基因细胞组成的它们的后代也是本发明目标。
本文所用术语“植物细胞”包括但不限于种子悬浮培养物、胚胎、分生组织区域、愈伤组织、叶、根、芽、配子体、孢子体、花粉和小孢子。可用于本发明方法的植物类别通常延伸至适用于转化技术的高等植物类别,包括单子叶植物和双子叶植物二者。
SbMATE的成功克隆是我们理解作为植物铝耐受基础的调控机理的主要步骤。对该基因通过所述机理发挥作用从而导致在高水平铝存在下根生长的解释,将有助于设计新的策略和/或控制点用于改进农作物中铝的耐受。
实施例
现在已经概括性地阐述了本发明,参考某些具体实施例将能更好地理解本发明,本文中包括这些实施例仅为了进一步阐明本发明,并非意欲限制由权利要求界定的本发明范围。实施例1高粱Al耐受性的表型分析
按照Caniato等(见上述)所详述的方法评估基于由{27}μMAl3+(括号表示游离Al3+活性)引发的根生长抑制的高粱Al耐受性。简言之,用0.5%(W/v)NaOCl对高粱种子进行15分钟表面消毒,用超纯水漂洗,使其于26℃下在湿滤纸上发芽,为期3天。然后将幼苗移植到含有pH 4.0的缺乏Al的完全营养液的8L盆中(Magnavaca等.1987.载于:Genetic Aspects of Plant Mineral Nutrition(植物矿质营养素的遗传方面),Gabelman和Loughman(编辑)Martinus-NijhoffPublications,Dordrecht,Netherlands)。24小时后将溶液换为对照营养液(-Al)或含有{27}μM Al3+的营养液,以测量根生长。采用两个作图群体:首先是354个BR007XSC283重组近交系(RIL)的组,然后是来自BR007XSC283杂交的2035个F2个体,用于高分辨作谱。在每个BR007XSC283重组自交系群体家族的14个个体中,或对于用于高分辨作图群体的单独的F2植物,根据相对根生长(RRG)值和通过Al引起的可观察到的根损伤评分,将单独的RIL和F2个体分为耐受类别和敏感类别(Magalhaes等,见上述)。相对根生长值如下测定。在4天的萌芽期后,让幼苗在缺乏Al的对照营养液中适应24小时,在此时测量对照溶液中的各幼苗根的初始长度(ilc)。24小时后记录在对照溶液中的最后长度(flc),接着用同样组成但含有Al的溶液替换对照营养液。与Al接触5天后获得在Al处理下的最后根长度(flAl)。相对于对照根生长由经过5天接触Al引起的根生长抑制程度计算为RRG(%相对根生长)=[(flAl-flc)5d/(flc-ilc)1d X 5]X 100。
通过在两个单独实验的每一个中对每个F2:3来源家族的21个个体的后代检测,指定了由高分辨作图鉴定的27个F2重组体的SbMATE基因型。高粱品系BR012、BR007、IS8577、SC549、3DX、SC175、9DX、CMS225、SC283、SC566的相对净根生长(RNRG)平均值(其用于SbMATE、表达、柠檬酸释放和MITE插入区大小的相关性分析)如本文表1中所示,并载于Caniato等(见上述)中。RNRG值基于来自各F2:3来源家族的个体在对照(-Al)营养液或相同营养液加Al中的生长来测定。在+/-Al溶液中根生长5天后,测定经过5天时间的根生长,RNRG计算为(在Al中的根生长)/(对照根生长)X 100,因此以对照根生长的百分比来表示。表1.接受营养液中的{27}μMAl3+、{37}μMAl3+和{58}μMAl3+的高粱品种的相对净根生长(RNRG)平均值和平均值标准误差的百分比。
Figure G2008800250029D00381
Figure G2008800250029D00391
对于{27}μMAl3+的Al活性,数值为3个重复的平均值,对于其它的Al活性,为2个重复的平均值。在所有的Al处理中每个重复用7株植物。在3种Al活性中的每一种中RNRG平均值后标有相同小写字母的品种构成了由Scott-Knott检验(P<0.05)确定的同型(homogeneous)RNRG组。(Caniato等,见上述)。实施例2DNA分离和标记分析
用Saghai-Maroof等(1984.Proc.Natl.Acad.Sci USA81:8014-8018)所述方案从大约500mg来自近交系和每个分离群体的F2个体的叶组织分离基因组DNA。作为定位克隆工作以分离SbM4TE基因的一部分,对位于Al耐受基因侧翼的两个序列标签位点(STS)标记进行的基因型分型如Caniato等(见上述)所述来进行,所述STS标记命名为CTG29(CTG29F:5′-HEX-STGCAGTATCTGCAGTATCATTT;SEQ ID NO:9和CTG29R:AATCCGTCAGGTCAGCAATC;SEQ ID NO:10)和M181((M181F:5′-6FAM-AAGGCAACAACTGAGGCACT;SEQ ID NO:11,M181R:TCGCTAGAGTGGTGCAAGAA;SEQ ID NO:12),它们在。用Kosambi函数(Kosambi,见上述)且LOD=3和θ=0.4的最大重组频率由重组频率测定RIL群体中的遗传距离。
图1a显示AltSB的RIL图谱,其包括两个STS标记CTG29和M181,分别位于0.8cM处并与AltSB完全连锁。我们对AltSB区的遗传作图的最后阶段涉及筛选来自F2群体的4170个配子,并选出来自CTG29-M181间隔的27个重组个体。在F2:3来源家族的后代检测时,6个个体显示在AltSB和M181之间的重组事件,表明CTG29和M181在AltSB基因座的侧翼。在所有重组体中高粱BAC 55D12最左端的STS标记T755与AltSB完全连锁;因此,选择跨过T755的BAC181g10用于鸟枪测序。因为只有M181位于181g10上,而CTG29位于与图1a中所示的重叠群非物理连锁的高粱BAC上,所以将与181g10内的可读框(ORF)2邻近的G/A SNP(图1b)置于高分辨图谱中以确证181g10含有AltSB。在最初在更远的CTG29和AltSB之间进行检测的21个单个重组体内,仅在4个重组体中鉴定出G/A SNP,表明ORF 2比CTG29与AltSB显著更近,并确证了我们所选的跨过AltSB基因座的BAC。从我们对BAC 181g10的序列分析开发了另外的标记,并用于进一步划定含AltSB间隔的界限。这些标记中的两个各自确定单个重组事件,因此近距离地位于AltSB侧翼。因此,在该区的约513Kb/cm的平均重组比使得我们可以界定含有3个预测的ORF(ORF 7、8和9)的24.6Kb区,其中之一应该就是AltSB(图1b)。实施例3SbMATE全长cDNA的分离和结构
用GineRacer试剂盒(Invitrogen)按照厂商说明通过5′/3′-快速扩增cDNA(RACE)鉴定了SbMATE转录物的5′和3′端序列。用GeneRacer寡脱氧胸苷酸引物(5′-GCTGTCAACGATACGCTACGTAACGGCATGACAGTG(T)24-3′;SEQ ID NO:13),从来自Al耐受型NIL(ATF10B)的根的1μg总RNA逆转录第一链cDNA。用GeneRacer试剂盒进行5′-CDNA端的PCR,该PCR还使用了对连接到cDNA端的接头特异的5′引物(5′-CGACTGGAGCACGAGGACACTGA-3′;SEQ ID NO:14)和JL56(5′-ATACCGAGGAAGCGCCGGAAT-3′;SEQ ID NO:15),JL56是对应于SbMATE cDNA的基因特异性引物(GSP)。用GeneRacer 5′嵌套引物(5′-GGACACTGACATGGACTGAAGGAGGTA-3′;SEQ ID NO:16)和JL54(5′-CCTTGAACCCACGGAAGACT-3′;SEQ ID NO:17)(嵌套GSP)进行嵌套PCR。用GeneRacer试剂盒进行3′-cDNA端的PCR,该PCR还使用了对连接到3′-cDNA端的寡脱氧胸苷酸引物特异的3′引物(5′-GCTGTCAACGATACGCTACGTAACG-3′;SEQ ID NO:18)和JL55(5′-GCCCGCGCTGCGCTACCTGA-3′;SEQ ID NO:19)这种GSP。用GeneRacer 3′嵌套引物(5′-CGCTACGTAACGGCATGACAGTG-3′;SEQ ID NO:20)和JL48(5′-ACGCTGATAATGCTGAGCAAGCTG-3′;SEQ ID NO:21)这种嵌套GSP进行嵌套PCR。在该3′/5′-RACE方案中所用的循环参数为94℃30秒、58℃40秒和72℃1分钟的34个循环。将PCR产物亚克隆到pCR4-TOPO载体(Invitrogen,Carlsbad,CA),并用DNA测序仪进行序列测定。按照5′-和3′-端序列,用PCR引物JL96(5′-GTACGATCGACACGAGAACTGTACGTA-3′;SEQ ID NO:22)和JL97(5′-TGCTTGCAAGGTTTGTAGCTAGGCCGA-3′;SEQ ID NO:23)扩增SbMATE的全长cDNA。将PCR产物亚克隆到pCR4-TOPO载体并测序。
ORF 8和9的序列注释显示分别与假定蛋白和蔗糖磷酸合酶基因高度相似。图1c显示,两个基因都在近等基因系(NIL)(与Al耐受系形成对比)的芽中高度表达但在根中不表达,根为Al耐受机理应当发挥作用的部位。相反地,用ORF 7进行TBLASTX搜索在拟南芥(Atlg51340;SEQ ID NO:24)和水稻(Os01g69010;SEQ ID NO:25)中确定了高度相似的序列(图2a),这些序列代表多种药物和毒性化合物外排(MATE)转运蛋白家族的成员(Brown等.1999.Mol.Biol.31:393-395)。MATE蛋白参与小有机分子流出(Morita等,1998.Antimicrob.Agents Chemother.42:1778-1782;Diener等,2001.Plant Cell 13:1625-1638;Li等,2002.J.Biol.Chem.277:5360-5368),这与基于Al激活的根分泌柠檬酸的高粱Al耐受生理机理一致(Magalhaes等,见上述)。因此,认为分离自高粱的MATE同源物(本文指定为SbMATE)是AltSB基因座的最佳候选,并作进一步研究。
高粱中的基因组SbMATE长2407bp。确定来自Al耐受型亲本(SC283)的SbMATE基因组序列为SEQ ID NO:1,来自对Al敏感型亲本(BR007)的SbMATE基因组序列为SEQ ID NO:2。全长cDNA(SEQ ID NO:3)含有分布在1803bp中的5个外显子(图2c),它们编码分子量为约62kD的600个氨基酸的多肽(SEQ ID NO:4)。与小麦Al耐受基因ALMTl的序列比较显示高粱SbMATE与ALMT膜蛋白家族无关,因此为新型的耐受基因。拓扑学程序HMMTOP(Tusnady和Simon.1998.J. Mol.Biol.283:489-506)预测SbMATE蛋白含有12个跨膜结构域(图2b),并提示位于细胞膜上(PSORT;Nakai和Kanehisa.1992.Genomics 14:897-911)。SC283(Al耐受)和BR007(Al敏感)之间的SbMATE等位基因以及由高分辨作图确定的整个24.6Kb区的比较,显示SbMATE编码区在亲本等位基因之间等同,且仅在所述内含子之一内存在多态性(图1d)。在整个24.6Kb区内仅发现有4组多态性,最大的分歧(divergent)是在SbMATE启动子区中大的728bp插入/缺失,其在预测的TATA盒的约1.4Kb上游处。实施例4经由半定量逆转录PCR测定基因表达
如上文和在Caniato等(见上述)中所述让高粱幼苗在含{27}μM Al3+或不含Al(对照营养液)营养液中生长3天。每一实验单元由10个根端(1cm)组成,每次处理进行3个重复。收集根端,冷冻在液氮中,用RNeasy Plant Mini试剂盒(Qiagen,Valencia,CA)提取总RNA。用300ng经DNA酶I处理的RNA、500ng锚定的寡脱氧胸苷酸12-18聚体和100微摩尔各种dNTP在12μL总体积中合成第一链cDNA。让样品在65℃下加热5分钟,转移到冰上。随后将4μL的5X反应缓冲液(Invitrogen,Carlsbad,CA)、2μL DTT 0.1M和1μL DEPC水加到该混合物中。让混合物在42℃下孵育2分钟,接着加入1μL的Superscript II RT(Invitrogen),最后在42℃下孵育90分钟,然后让第一链cDNA样品在70℃下15分钟,并储存在-20℃中。用引物JL57(5′-GTGCTGGATCCGATCCTGAT-3′;SEQ ID  NO:26)和JL58(5′-CACTGCCGAAGAAACTTCCA-3′;SEQ ID NO:27)从该第一链cDNA样品扩增跨过SbMATE转录物的第3到第5个外显子的800bp的cDNA片段。将用引物ActF(5′-TGATGAAGATTCTCACTGAG-3′;SEQ ID NO:28)和ActR(5′-GATCCACAATCTGTTGGAACG-3′;SEQID NO:29)扩增的肌动蛋白基因的约500bp片段用作内部对照。用2μL的cDNA混合物、20mM Tris-HCl(pH 8.4)、50mM KCl、2mM MgCl2、0.125mM dNTP、10皮摩尔的各种引物和0.5U的Taq DNA聚合酶(Invitrogen)在20μL反应体积中运行PCR反应。用在94℃下1分钟的初始变性步骤,接着94℃30秒、60℃40秒和72℃90秒的30个循环,且最后步骤为72℃5分钟来进行PCR反应。发现SbMATE和肌动蛋白基因的PCR在30个PCR循环时处于线性期,30个PCR循环是选择用于半定量RT-PCR检测的循环数。
定量RT-PCR分析显示SbMATE仅在Al耐受型NIL的根中表达(图3a),并且根尖表达为Al诱导的(图3c);在敏感型NIL的根尖中的表达检测不到。高粱Al耐受亦为随时间由Al诱导的(图3b,左图)。
在来自不同地理来源的高粱多样性组的12个成员中检查了SbMATE表达,成员包括Al敏感型亲本BR007和Al耐受型亲本SC283。由该组表现出的广泛的Al耐受性和Al敏感性是由AltSB基因座的等位基因系列引起的(Caniato等,见上述)。SbMATE表达的差异解释了在该组中大部分即96%的Al耐受表型变化(r2=0.96,图4a)。这些结果提供了SbMATE构成AltSB的进一步的证据,并强烈表明基因表达差异构成了AltSB处等位基因变化的基础。在SbMATE表达与Al激活的根尖释放柠檬酸之间(图4b)和柠檬酸释放与Al耐受之间(图4c)相似地发现了显著相关性,表明基因表达差异以主要通过调节根分泌柠檬酸的Al耐受表型为条件。
经由PCR在扩大的高粱组中扩增SbMATE起始密码子上游的大多态区(参见图1d),发现该多态区的大小变化与Al耐受性呈显著正相关(图4d)。测定了代表该可变区的四类大小基因型的该区域序列(图4d),序列数据分析表明该区域高度结构化和重复。如图4e所示,该区域由以下序列组成:起始100bp的高粱序列(图4e中的单元a),接着是较大的243bp序列(单元b),即Tourist样小反向重复转座元件即MITE(Bureau和Wessler.1992.Plant Cell 4:1283-1294;Wessler等.1995.Curr.Opin.Genet.Dev.5:814-821)。MITE插入后面跟着21 bp的高粱序列(单元c)。这种a-b-c结构是最小的Al耐受程度最低的实例(Tx430)的单现基因,并在来自另外的三个大小类别的代表中重复3、4和5次不等。对4个大小类别的代表性高粱品系中的该区域的DNA序列出示于图5中。实施例5经由定量实时逆转录PCR测定基因表达
如上文和在Caniato等(见上述)中所述让高粱幼苗在含{27}μM Al3+或不含Al(对照营养液)的营养液中生长。在+/-Al处理后的1、3和6天采集根和芽组织。每一处理采用3个重复。
用RNeasy Plant Mini试剂盒(Qiagen,Valencia,CA)从单个组织样品中提取总RNA。用7.5μg的总RNA用High-Capacity Archive试剂盒(Applied Biosystem)合成第一链cDNA。
用ABI Prism 7900序列检测系统(Applied Biosystems)定量测定SbMATE转录物。将cDNA系列稀释液用于制备SbMATE转录物和用作内参的18S RNA二者的标准曲线。然后,将用于特定cDNA样品的经选择的稀释液(对于SbMATE转录物为100ng,对于18S RNA为1ng)用作实时PCR模板,用厂商推荐的条件定量测定转录物相对水平。正向引物和反向引物以及SbMATE特异性探针分别为ORF7-F(5′-CAGCCATTGCCCATGTTCTTT-3′;SEQ  ID NO:30)、ORF7-R(5′-ACCAGCTTGCTCAGCATTATCA-3′;SEQ  ID NO:31)和探针(6FAM-CCCAGTACCTGATAACGC-TRMRA;SEQ ID NO:32)。用Taqman核糖体RNA对照试剂(Applied Biosystems)测定内源性18SRNA的水平。重蒸水或不含逆转录酶的室温反应产物用作阴性对照。将SbMATE转录物水平对内源18S RNA归一化。每组实验重复3次。
如图3b左图所示,高粱的Al耐受性还是随时间由Al诱导的。随着根与Al接触时间增加,在耐受型NIL中Al诱导的根生长抑制显著降低,且根生长抑制从在Al存在下的第1天和第2天观察到的初始抑制40-50%降低到在第5天和第6天不抑制根生长。这一反应与在与Al的接触时间内Al激活的根尖分泌柠檬酸的增加(图3b;右图)和Al诱导的SbMATE表达(图3c)紧密相关。在Al中1天后与Al接触使SbMATE表达增加了20%;在Al中3天后Al诱导增加到40%,6天增加到120%。总而言之,SbMATE表达、Al耐受和根释放柠檬酸之间的并行行为支持我们的论点,即所述转运蛋白为Al耐受基因座AltSB。实施例6通过表型互补WT Col和AtALMTl-KO确证SbMATE基因的身份
在拟南芥生态型Columbia(WT Col)和对Al高度敏感的T-DNA敲除突变体AtALMTl-KO(其中小麦ALMTl基因的拟南芥同源物在第一个外显子处受到破坏)中进行了遗传互补测验。我们筛选了10个T-DNA拟南芥插入品系,其中与SbMATE同源物最接近的6个拟南芥基因受到破坏,与Col-0WT比较未观察到Al耐受性降低。这表明功能性MATE等位基因在拟南芥中几乎不存在,或在Columbia生态型中不存在。相反地,AtALMTl的破坏导致Al耐受性相对于WT剧烈降低(图6a),这是因为缺乏AtALMTl功能,该功能的缺乏导致几乎完全失去Al激活的根部苹果酸流出(Hoekenga等,见上述)。因此,我们推断对Al极度敏感的AtALMTl-KO对于在拟南芥中进行的Al耐受性互补测验是非常适合的遗传背景。由CaMV 35S启动子驱动SbMATE表达的纯合T3品系在两个背景中都比对照幼苗显著更耐受Al(图6a)。在Al耐受方面,以WT为背景(TG-WT)的四个转基因品系明显比WT Columbia优越,且与WT品系的65±5%的RNRG相比平均RNRG为88±4%。在对Al高度敏感的AtALMTl背景中SbMATE的表达增加了互补测验的灵敏度,因为以KO为背景(TG-KO)的8个转基因品系与亲本品系相比表现出Al耐受性显著增加(图6b)。在单独的实验中,我们在两个背景中挑选表现最好的以及表现普通的转基因品系,并发现Al耐受性与SbMATE表达水平成比例地增加(图6c)。在Col-TG4和KO-TG8这两个背景中最耐受的转基因品系表现出最大的SbMATE表达及最大的Al激活的根释放柠檬酸,但未观察到苹果酸分泌增加(图6d)。我们在Al敏感型栽培种Bobwhite中培育了转基因小麦品系,在这些品系中SbMATE由玉米泛素启动子驱动而稳定表达。在图7中,用T1转基因小麦品系进行的实验的结果显示我们鉴定了四个转基因品系,它们与非转基因Bobwhite相比基本上提高了Al耐受性。这些用拟南芥和小麦的结果对以下论点提供实验支持:来自高粱SbMATE的MATE家族成员为Al激活的柠檬酸外排转运蛋白,该转运蛋白提供AltSB基因座的Al耐受性。实施例7SbMATE的亚细胞定位
通过检查用GFP标记(tag)的SbMATE编码区在洋葱(Alliumcepa)表皮细胞中的瞬时表达情况来确定SbMATE的膜定位。通过用连接引物(adaptor primer)扩增SbMATE编码区来产生35S::AltsB:GFP构建体,所述引物将用于亚克隆的Spel限制酶位点接头掺入到植物转化载体pCAMBIA 1302中。载体pCAMBIA 1302含有驱动mGFP5基因表达的CaMV 35S启动子。在打开的pCAMBIA载体的CaMV 35S启动子与GFP编码区之间的SbMATE插入产生由CaMV 35S启动子驱动的SbMATE::GFP嵌合体的翻译框内融合体。对得到的构建体进行全序列测定,并核对序列正确性。通过对洋葱表皮细胞实施颗粒轰击来完成SbMATE::GFP嵌合体的瞬时表达。简言之,用含1微克SbMATE::GFP(或作为阴性对照的空pCAMBIA 1302载体)质粒DNA的2.5M CaCl2和1M亚精胺(Sigma,USA)涂覆M10钨颗粒(1.1μm)。在27MPa的氦压力下用涂覆DNA的粒子轰击剥下的洋葱表皮(epidermal onion peel)(破裂膜(rupture disk)1300p.s.i.;BiolisticPDS-2000/He BioRad Laboratories,Hercules,CA),让组织在室温下于黑暗中在浸入自来水的滤纸上孵育24小时。用共焦显微镜(Leica TCSSP2system,Leica,Germany)进行GFP荧光成象。
经由在洋葱表皮细胞中瞬时表达SbMATE::GFP翻译融合蛋白来测定SbMATE的亚细胞定位(参见实施例7)。观察到SbMATE蛋白定位在细胞膜上(图3d),这与对其提出的在根细胞中外排柠檬酸的作用一致。因此,这些发现表明我们的AltSB基因座的候选MATE基因编码根柠檬酸外排转运蛋白,该转运蛋白在基因转录水平上由Al诱导,并且还在蛋白功能水平由Al激活。实施例8高粱近等基因系中测定Al激活的根柠檬酸分泌
用0.5(w/v)NaOCl将Al耐受型(ATF 10B)和Al敏感型(ATF8B)的近等基因系(NIL)种子表面消毒15分钟,用超纯水漂洗,使其在26℃下发芽,为期3天。然后将幼苗移植到含有pH 4.0的缺乏Al的完全营养液(Magnavaca等,见上述)的8L盆中。24小时后将溶液换为对照营养液(-Al)或含有{27}μM Al3+的营养液,在用{0}或{27}μM Al3+处理后的1、3和6天收集根分泌物。在根分泌物的各种有机酸测定中使用6株幼苗;通过将6株幼苗转移到50ml含有4.3mMCaCl2-6H2O(pH 4.5)的塑料离心管中开始收集根分泌物,离心管含或不含作为AlCl3-6H2O加入的Al,作为AlCl3-6H2O加入的Al具有与当幼苗在收集根分泌物之前在Magnavaca营养液中生长所用的{27}μMAl3+(pH 4.5)相同的游离Al3+活性。每种根分泌物测定重复4次。收集6小时的根分泌物,然后让根分泌液通过阴离子及阳离子色谱柱以去除Al和干扰有机酸测定的无机阴离子。随后,将1ml子样品冷冻并重新悬浮于0.2mL的超纯水中。用如Pineros等(2002.PlantPhysiol.129:1194-1206)所述的毛细管电泳系统实施根分泌物的有机酸分析。实施例9在不同植物品种中的SbMATE直向同源物
用递归搜索(recursive search)鉴定了玉米中可能的高粱SbMATE同源物。用TBLASTN在Gramene中使用高粱SbMATE查询水稻基因组,鉴定了7个推定的SbMATE同源物。然后用高粱SbMATE并且还用来自7个水稻SbMATE样基因的序列来查询玉米MAGI GSS数据库。指定为ZmASL49968(为玉蜀黍(Zea mays)AltSB样基因)的与高粱MATE具有最接近的序列相似性的玉米MATE被挑选用于进一步分析。该基因与高粱SbMATE基因在氨基酸水平上具有64%的同一性和73%的相似性。用调查的两个品系来鉴定对Al耐受重要的基因和过程。首先,用关联分析这种遗传统计学方法来使特定核苷酸多态性与各近交系之间的Al耐受显著差异相关联。在该分析之后,在所选择的F2群体中进行连锁分析,以进一步验证所发现的与Al耐受的关联性。需要三组数据来进行关联分析:1)性状数据;2)基因型数据;和3)来自研究群基因组之间的充分的标记数据,以评估是真阳性还是假阳性结果(由于群体结构或亲缘关系的结果)。用我们的在+/-Al条件下用于定量测定根生长的标准溶液培养方法,我们使由USDA-ARS,Cornell University的Ed Buckler博士收集的288个近交系关联组显现表型。在5个重复实验的基础上,净种子根生长(在2天胁迫处理期间出现的根生长量)遗传力评估为0.65。我们使用混合模型ANOVA的最新形式;该模型由Ed Buckler博士开发,最近在Nature Genetics(2006.38:203-208)上发表。我们采用来自跨玉米基因组的一套500SNP来经验性地计算Al耐受的显著性阀值。
然后我们在玉米关联组中的所有288个近交系测定图8a中所描绘的ZmASL-49968区的序列。统计学分析表明该基因中的多态性与玉米Al耐受性显著相关,这强烈表明该基因为候选Al耐受基因。对于该基因的关联分析的细节描述于图8b中。然后用连锁群来验证该基因在玉米Al耐受中的显著性,这用在已知ZMASL-49968等位基因检测中不同的亲本(B73 x CML247)间进行F2杂交来进行。如图9所示,B73品种所携带的ZmASL-49968优等等位基因相对于CML247所携带的敏感性等位基因是完全显性的。
用微阵列分析来检查Al耐受和敏感型玉米基因型的玉米根尖中的全局基因表达谱。我们确定了作为高粱SbMATE同源物的第二个候选玉米Al耐受基因。如图10中所示,我们在玉米根尖中发现了三个基因,这三个基因仅在耐受型玉米品系根尖由Al强烈诱导表达,并且还在耐受型品系中显示出较高的组成型(-Al)表达。所述基因之一(即图10中的MZ000025698)来源于EST NP667103,其在玉米的3个受Al诱导的MATE基因中在序列上与高粱SbMATE最接近(氨基酸水平同一性为53%),并被挑选用于进一步研究。衍生了用于该基因区的标记,并在源自Al耐受x敏感亲本之间杂交的Embrapa重组近交系群上作图。如图11所示,用所述群将该基因作图到先前由EmbrapaMaize and Sorghum确定的主要的Al耐受型QTL。最后,我们用RT-PCR分析该基因在两个Al耐受型玉米品系AI237和Cat100-6及Al敏感型品系L53的根尖中的表达,证实了微阵列的结果。AI237和L53是Embrapa RIL作图群体的亲本。如图12所示,在缺乏和存在Al两种情况下,基因在2个耐受型品系的根尖中都更加强烈地表达。
上面所论述的拟南芥和小麦结果对以下论点提供了实验支持:来自高粱的MATE家族成员SbMATE为受Al激活的柠檬酸外排转运蛋白,所述转运蛋白提供AltSB基因座的Al耐受性。
另外,在包括拟南芥和水稻在内的其它植物中发现具有高度序列同一性的直向同源物(图2)。实施例10高粱SbMATE在转基因拟南芥幼苗中的表达和拟南芥Al耐受和根有机酸分泌的分析
通过用引物JL115(5′-AATATCTAGACGATCGACACGAGACTGTACGT-3′;SEO IDNO:33;下划线碱基表示XbaI位点)和JL116(5′-AATACCCGGGAAGGTTTGTAGCTAGGCCGA-3′;SEQ IDNO:34;下划线碱基表示XmaI位点)从Al耐受型NIL(即ATF10B)通过PCR扩增了跨过AltSB的起始密码子到终止密码子的SbMATE cDNA片段。将经过限制性消化的PCR产物在对应的限制性位点之间克隆到pBAR2载体中,所述位点位于CaMV 35S启动子之后。
将空载体和加有SbMATE的载体二者单独地电穿孔到根癌农杆菌菌株GV3101(Invitrogen)中,并用于拟南芥转化(以Columbia-0和AtALMT敲除作为背景)。通过转基因植物的Basta除草剂抗性并通过PCR确认T-DNA插入来确证转基因的存在。
如Hoekenga等(见上述)所述测定转化有35S::SbMATE构建体的约60个独立的T2品系在溶液培养中的根生长情况。还包括了3个以野生型(Col-0)和AtALMT敲除之一为背景的用空载体转化的T2品系作为用于根生长实验的对照。
让在Al存在下根生长率提高(表明与相应的对照相比Al耐受增加)的单独的T2品系进行自交,分析分离的T3后代以鉴定转基因和非转基因的纯合T3后代,这由后代检测来确证。然后将相应的转基因和非转基因的合T3品系配对,并用于如Hoekenga等(见上述)中所述的对Al耐受(根生长)的测定。
为了测定根有机酸分泌,让各个拟南芥转基因和非转基因品系的约2-3mg经表面消毒和沙藏(stratified)的种子在含有无菌培养生长液的Magenta盒中发芽,为期6天(参见Hoekenga等,详细内容见上述)。随后,将单个转基因品系的幼苗转移到含20mL过滤除菌的分泌液(pH 4.2)的无菌Petri培养皿中2天,其中含或不含13.6μMAlCl3的总Al浓度(1.5μM Al3+活性)。在处理第二天结束时收集分泌液,然后使其通过阴离子及阳离子色谱柱以去除Al3+和干扰有机酸测定的无机阴离子。随后,用如Pineros等(见上述)所述的毛细管电泳系统对1ml子样品进行根分泌物中的有机酸分析。
由CaMV35S启动子驱动SbMATE表达的纯合T3品系在两个背景中都比对照幼苗显著更耐受Al(图6a)。在Al耐受方面,以WT为背景(TG-WT)的四个转基因品系明显比WT Columbia优越,且与WT品系的65±5%的RNRG相比平均RNRG为88±4%。在对Al高度敏感的AtALMTl背景中SbMATE的表达增加了互补测验的灵敏度,因为以KO为背景(TG-KO)的8个转基因品系与亲本品系相比表现出Al耐受性显著增加(图6b)。在单独的实验中,我们在两个背景中挑选表现最好的以及表现普通的转基因品系,并发现Al耐受性与SbMATE表达水平成比例地增加(图6c)。在Col-TG4和KO-TG8这两个背景中最耐受的转基因品系表现出最大的SbMATE表达及最大的Al激活的根释放柠檬酸,但未观察到苹果酸分泌增加(图6d)。在拟南芥突变体中成功的表型互补提供了有力的证据表明SbMATE可在不同物种中起到增强Al耐受性的作用。
本说明书中所提及的所有出版物和专利在此引作参考,其引用的程度如同每一单独出版物或专利被明确和个别地指出引作参考一样。
为阐明和说明本发明目的提出前述说明和某些代表性实施方案和本发明详细资料。所公开的准确形式并非详尽无遗,或并非意欲限制本发明为所公开的准确形式。本领域技术实行者显然明白,在其中可进行不偏离本发明范围的修改和变化。
序列表
<110>L.科奇安
J.刘
J.V.德马加尔黑斯
C.T.吉马雷斯
R.E.沙弗特
V.M.C.阿尔夫斯
P.克莱因
 
<120>高粱铝耐受基因SbMATE
 
<130>800-291WO
 
<150>US 11/804,164
 
<151>2007-05-17
 
<160>34
 
<170>PatentIn version 3.4
 
<210>1
<211>10690
<212>DNA
<213>高粱(Sorghum bicolor)
 
<400>1
acatctcatg aagagcaacc cggaattgaa gtttgacact gaatttggca cccaccatga  60
tttagatccc tgcatgagag acaagagaga atctttctgg ttaccacaca gttttgttaa  120
gattgtattc ttcattgatt attgatagag aaagaagaga tagatgatga gtgtaccctt  180
gaagtggctg cacatgctgc tgtaatatca gttatccttt ggtatgaata aatataagtt  240
ccgtacccaa aacatactga cataataata actgcactaa caaggaaatc tatgagtgtc  300
ctcattattt gtgcatgcct cgtgtcctgc atctgagtct tgaatttctc cgtttggaag  360
gaagctttct gaaatcccaa ggataactta atcttgtcta acatgtgcga gtaggagtta  420
agttctagtt gagactgttt aagttgcaac tttctcatgc taaggcttat ctcaaattcc  480
ttgagctcat ttgaccgagt ttgttctttc aaagatcttt caaatgcatt aaggatccgc  540
cgattagctt caggagaaga tatgctatga gtacgacgag tcagctgctg attgccacca  600
gcatacagaa caagctgact ttccactgaa tttgaaaggt cctgcttgat ttcttgcgtt   660
ggattttgtg gaccatcagt gctcaacttg cttgcagcat cagagtcttc atgcttagaa   720
gaacattgag gaactggacc ttgtccatag acaggcatct cattaacaag atgaagcgtt   780
gttaatgtgc tgctgaatga tttctcaaag tttctcataa aactgtctaa cttgttacca   840
tatatctaca atgatgagtg aaagatatat taggaataat attaacaact gagctgtggg   900
atgataaagg gaactaggct tacatttctc aatgattcct tcactgccga tgtacagatc   960
tgcatccaaa gtccagactc agtttcaaac tacaaacagt ttcgtggttt tgtagagttt   1020
attagtcaaa ttgtggtaca ataaccttgg aaagaagtgc aggctgtatt ctttcgcctg   1080
aaggattctt cgtattcaca acctgcaatc agcaaatgca actcattgcc ctgaacagaa   1140
acttaggtgc acaaaaaaca tggcatgtga tgatgctaac atgaagttgc atgttggtga   1200
aatataggat tgtctactgg tgttctcatg tgaatgatga tgcctctgga tacacactga   1260
ggtgtgggca gacaatcata tgaaatgtaa tctcatgctt aatttcggaa tggatagcaa   1320
tgtgcaatac aagatgaaca aaactcttgt acgcccccac agaaatggaa taaagtgaca   1380
atttccctcc cccccaaagg gtactcctca cttgtatggc tctatcacca cttctctgac   1440
cccaagctgc cacatttgac atgtgatgca cgattgctcg gaataattgc aatttgcaac   1500
gacaaacgaa acgaaaatga tccagggcgg cggtatttag cattgcgcgc ccgcctccta   1560
tcctatctgt ggactagcaa ccaaggctac agacttacgt acaattcggt agaacggtga   1620
agggtgaaat gcggacatca acaccggtcg gcccgtcgtt accaacccgc gccagaaatg   1680
ggggaagcta cagagaaagg ccgagggagt ggcagtgggt acacgcacct gcgcgaggac   1740
ggccgcgaac gacatcccga gaggcagcgc gaggtcgtcc tgcacctgcg cgccggcgcc   1800
accctgaccc tcgctcccgc ccgcgggcgt agcggcgggc cccggctcct gccgccttcg   1860
ccgcagccgc agccggagcc ggacacccct gctgcgccga gcggaggagg accgggaggc   1920
agaggcggat gctgagccgc atgccgagga ggcgtctccc gacgcctccg acgaggaggg   1980
gtcggcgggt gcgggtgggt ggaggcagcc cgtgtccatc tcggcggggc cggcggggca   2040
ggggacaggg cgaccgttct gggctctggg gtgttccttt cttcaggcca gggccaggga   2100
cctagggctg cgctgtctgt gtgtgatttg gttccgtttt gacttcgctt tggaaggaga   2160
gggacggacg gggacgccgt cggaacgggt gggcggagtg tcccagtcga agcgcccgtg   2220
ggaacgcgag aaatgaagtt attattacag gaggcgggat tagccgtttg aagtgaaaat   2280
cctgggaaag ttattaattc cataatttgt ttcggaaaat tcgatttttt attaaaaaat   2340
gagtttaggg agccgacagc cgaggtcgga gactctggtc cggagcggcg caacggcacg   2400
tctgattgcc gacgtggggc ccagcggccc agcaaaggcc ggtccgggcc gtactatttt   2460
gaagtccaaa tataagaagg cttgggctgt cagcccagga cagaacgtac ttttccgaag   2520
cccaagatat aagaaggatt gagctgtcat gtaaagaacg acttacaaaa aaaattacaa   2580
tatcattttc taaaaaaaat tacaatatca tagggtagga aatatggata ggacatagga   2640
ggtgtgggta tcgcgttccc atgtacctct cgcaagctaa gcgaaaatgt gcttgtgcta   2700
acagctacat atatatagct gaatttccca caaaaaaaaa gctatatata gctgaaacag   2760
cagtttgtta tgacatattt tggagcacac agtcgtggag caatttattt tttcaacctt   2820
ttatagctat atactatttt aaaataacat gtaagaatag aactagcctt ttggttgtgt   2880
cagactgcca tgcatagaaa aaattataat gtcatatgca ttgggcacaa ctgcacaaag   2940
gcatggtatg ctaaagctct acccctcaat caaaaaataa taaaattcta gcacagtacc   3000
tagtatctgg attttgaata gctatatata taaaaacact aatatttatt atatcaaata   3060
cttcctccat cccaaaagca ttcaaagttt atcataaaat tgttatcatt cttactttcc   3120
aatgcatatt tattttttca taatacaccc tttttttcaa tacatctcta tcttttattt   3180
ctctctatct ctcttctttt ttgtgcatta taacttttca ttgtttctta atttccatat   3240
ttatatgctt ttgtaatgga gggagcaagt gttatcatta gatttattta tgaattatat   3300
ttgtacggta tatctatttg gtgttagacg ttgttatcgt atctatgtat ttagtcaaat   3360
tttagatatt tcaactatag atgcacctat aatcttgttt ttcagaacac acctagaatt   3420
ataatttttt ttaggacaga catactccct ttgtcccaaa ataaacgtat gcctcacgtt   3480
tcgagaagtt atttttttta aagtcttact agttatataa aagatcatat taatatttgt   3540
attttgaaat aagcttgcta tgaaaatata ttatatgacc aatgtagtga tgcttattat   3600
tacacactat agatatcagt acttttgtat atatatttgg ttaaacataa aaaaaagctt   3660
aactctttga taaacgataa aagttgtgtg tattttgggg ccgacgatga agtaatatat   3720
ttttatttca tgctgccggc gcgtattttg cacaccgcct tttcagtttt tacgcatttt   3780
ctctgtagta gtatatgaca acaattccta ggatccagtg agctaccggt gaaggtgctc   3840
gttatgcgtt taaacattgt tccgtccggc ggcatctagc taggagtact cctacagact   3900
attaaagttg ggccttgttt agttccaaat aattttgcaa aataggaata gtagcatttt   3960
cgtttgtatt tgacaaatat tgtccaatca tgaactaatt agactcaaaa gattcgtctc   4020
gttaatttcg accaaactgt gaaattagtt tttattttcg tctatattta atacttcatg   4080
catgcgtcta aagatttgat gtgacggaga atctaaaaaa ttttgcaaaa ctttttggga   4140
actaaacaag gccttggttg gtgcgatgat gttggatcca gtgagctacc ggtgaaggtg   4200
ctcgttatgc gtttaaacat tgttccgtcc ggcggcatct agctaggagt actcctacag   4260
actattaaag ttgggccttg tttagttcca aataattttg caaaatagga atagtagcat   4320
tttcgtttgt atttgacaaa tattgtccaa tcatgaacta attagactca aaagattcgt   4380
ctcgttaatt tcgaccaaac tgtgaaatta gtttttattt tcgtctatat ttaatacttc   4440
atgcatgcgt ctaaagattt gatgtgacgg agaatctaaa aaattttgca aaactttttg   4500
ggaactaaac aaggccttgg ttggtgcgat gatgttggat ccagtgagct accggtgaag   4560
gtgctcgtta tgcgtttaaa cattgttccg tccggcggca tctagctagg agtactccta   4620
cagactatta aagttgggcc ttgtttagtt ccaaataatt ttgcaaaata ggaatagtag   4680
cattttcgtt tgtatttgac aaatattgtc caatcatgaa ctaattagac tcaaaagatt   4740
cgtctcgtta atttcgacca aactgtgaaa ttagttttta ttttcgtcta tatttaatac   4800
ttcatgcatg cgtctaaaga tttgatgtga cggagaatct aaaaaatttt gcaaaacttt   4860
ttgggaacta aacaaggcct tggttggtgc gatgatgttg gatccagtga gctaccggtg   4920
aaggtgctcg ttatgcgttt aaacattgtt ccgtccggcg gcatctagct aggagtactc   4980
ctacagacta ttaaagttgg gccttgttta gttccaaata attttgcaaa ataggaatag   5040
tagcattttc gtttgtattt gacaaatatt gtccaatcat gaactaatta gactcaaaag   5100
attcgtctcg ttaatttcga ccaaactgtg aaattagttt ttattttcgt ctatatttaa   5160
tacttcatgc atgcgtctaa agatttgatg tgacggagaa tctaaaaaat tttgcaaaac   5220
tttttgggaa ctaaacaagg ccttggttgg tgcgatgatg ttggatccag tgagctaccg   5280
gtgaaggtgc tcgttatgcg tttaaacatt gttccgtccg gcggcatcta gctaggagta   5340
ctcctacaga ctattaaagt tgggccttgt ttagttccaa ataattttgc aaaataggaa   5400
tagtagcatt ttcgtttgta tttgacaaat attgtccaat catgaactaa ttagactcaa   5460
aagattcgtc tcgttaattt cgaccaaact gtgaaattag tttttatttt cgtctatatt   5520
taatacttca tgcatgcgtc taaagatttg atgtgacgga gaatctaaaa aattttgcaa   5580
aactttttgg gaactaaaca aggccttggt tggtgcgatg atgttggatc cagtgagcta   5640
ccggtgaagg tgctcgttat gcgtttaaac attgttccgt ccggcggcat ctatactcct   5700
acagactatt aaagttggtt ggcgtttgct gctttattaa tgcatgcatc aagcatgggg   5760
ccatcaacgg cagtgtcact tgactcaatg accaaacacc aaagcatgcc tggttaattt   5820
cagttaataa gagggccttc aaaggcagtc tcactcagga cagtgttttt atgtcactgt   5880
tttcggatta gctaaaaagt atttgtactg agataaaaat attgtagaat gactgataaa   5940
tttggctgga tgcatatgca taaacacgtg tcacgaatcc atattggatg cacatggtta   6000
ctccatagag tggcctttgt taacgcgcgg ctgttgtgtc acagatttat aagctagcta   6060
tagtatttta attcttctat ggtattattg taagcaaata tgtcgtatga agttgttaac   6120
taggaaactg aggcccgcct taagttccag tgttcattca cgaataatga attaatatct   6180
tgagcaaaaa gataataaca atgttaggcc aaagtgttgg gtgaaactaa aatcgaacta   6240
gcataatact gtacagtaat tcagttgttt ccttttaaat ataaataaaa tcaagcctga   6300
gtgccacaac tctatggagc actccatctg ttcttttata tttgtcgtca cgtcgaccaa   6360
actttctcat ttttaactaa gtttatataa aagattaaca atatttgtat ctctaaataa   6420
atttacataa aaatagattc agtgatctct aattatatat actaattacg tgtcacaaat   6480
attaatattt tttatatatt taatcaaagt taattacgtc aaatgaaatg atcagtgccc   6540
ggcagttcca taccacactt tcacggcacc acttcctccg aacaaaacgt atcctaaaaa   6600
aagaaaaaat cctttggatt ctgtctctct tagcttaaat atcctcgact tgacagtgtt   6660
tgcattttct tgttttttct ctaagatttg atgatgttgt tattttagta gtataagcga   6720
catgcccttt gacaatgagg cgtccatggt agatttctat caatttcaaa atttgttgga   6780
ctctagctca atgttttcga aatgctcgta gaggtaaagt gtttatatgt atgttcacgt   6840
gagcctgcat ctttaacgtg atttgaaaga agaaaaaacc ttcgtcatgt ggctcatcat   6900
cagggttcaa gtactacctt gctttagttt tgattgttgt ggaggttaat gactaattta   6960
gaggtgttaa catgtctttc taaaaacttg caaagttaga aatgttaatt tagtagcaag   7020
cacacacccc aaactcttcc ctctccatgt ggctagctgg gctggaggct gcctgcctgc   7080
ctatataagg atgggttgct cggccacttg tcacacccac tccatcacca gttcaccact   7140
cgtccgcttc accaacctat agagtttatg ccccgtcttg ctcttcagct ctggttagtc   7200
attaagagtc tgtttagatc tcaaattttt acatctcaaa acttttggct ctaaagttta   7260
catttcaaat aggtgttttg atgctttcca aatttttctg gtctgcaaca cacaagacac   7320
ggccccctaa gcaagtttac acagtttgag ggctccaagg tccaaaattc caaatcttta   7380
caacctaagt gttacaggcc ctctttagat ccattcttct aaaaagtgcc catttttcca   7440
aaagttttgg ctgtttagct gcatctggcg taattatcct gttattttat tcctctatga   7500
tgatgtagga gcatatatta ctgcacaagt ccttgttaat taatttgaga cagtcaggta   7560
ttagagggta gtagtagaac aacaagtggc caagtgggtg atcataagtc agttgttttt   7620
ttcttgaaaa tgctgttgtt atcactgatc gaatggttaa tgtgccgtat tgtagtgctt   7680
gcaaggtttg tagctaggcc gacatggagg aacaccggtc accagctcac gccaagcccg   7740
aggccgagca gccaccgcag cagcaggtgc cggcggcgat ggcggtggca gtggcagtgg   7800
acgtcgctgc tccagcagcg ctacagaata gtactgcggc tcctgctgag aacggggacg   7860
tcgctgctgc gggcgcggca gagaatggta ctgcggcttc cgctgcgaac ggggacggcg   7920
gcggctcgga gctgctcggc ggtccacgct ggacggggct gcaccttttc gtgatgaaca   7980
tccggagcgt gttcaagctg gacgagctcg gcgcggaggt gctgggcatc gcggtgccgg   8040
cgtcgctggc gctgacggcc gacccgctcg cctcgctgat cgacacggcc ttcatcggcc   8100
ggctggggtc cgtggagatc gcggccgtgg gcgtcgccat cgcggtgttc aaccaggtca   8160
tgaaggtgtg catctacccg ctcgtcagcg tcaccacgtc gttcgtcgcg gaggaggacg   8220
ccgtgctcag caaaggcggc gccaaggtca tcgacaacgg agaagaagaa gaagaattag   8280
aagcgggaca agttggcccg gagaagcaca ctgccgctgc cggcgcggac ccggagaagc   8340
agcagcagcc agctgatgaa gaagccgcca agaacggcgg cgagggatgc gcccctgccg   8400
tcgtcgccgg ccggagtagc ggcaagaaat cagggaacag gaggttcgtg ccgtccgtga   8460
cgtcggcact gatcgtgggc gcgctcctgg ggctgttcca gaccgtcttc ctcgtcgccg   8520
ccgggaagcc gctgctgcgc ctcatgggcg tcaagccggt aagttactgt gcctgtgcgt   8580
gcccgcaccg catgcaacgg tgaactagat tcgtcggtgc aacgacgaac aattgcttat   8640
acaatttact ggtgatattc gaatgatttc ccagggttcg cccatggtga tgcccgcgct   8700
gcgctacctg acgctgcgcg cgcttggcgc cccggccgtg ctgctgtctc tcgccatgca   8760
aggagtcttc cgtgggttca aggacgccaa gacgccctta tacgccatcg gtaaccaata   8820
atgctccata catgatacat acaatgcggc catatatgtc aaccaggcaa accagcatgg   8880
ttttttcggt aaagtttatt ttgcccttga ggacatgtgt ccttactctc tcatccattg   8940
gattcgcttt aagaaatgtg caaacacaca tctcaaagcg aaactacttt gatatgtatg   9000
tttgcacact tctcaaaacg aatctaatgg gtgggagagt gagagtatat gcccttaacg   9060
gaaaaaaaaa cacccacgca cgtttgatct gagctgtgtt acgaatgaat gcatgcagtg   9120
gccggcgacg cggcgaacat tgtgctggat ccgatcctga tatttggctg ccgcctgggc   9180
gtgatcggcg cagccattgc ccatgttctt tcccagtata agaccatgac cacccatctc   9240
cttcttgtca gcaattcagc attggccgca acaactgaca atggcgaaat taaaccgcac   9300
gtacgcaggt acctgataac gctgataatg ctgagcaagc tggtgaggaa ggtcgatgtc   9360
gtcccgccca gcctgaaatg cctcaaattc cggcgcttcc tcggatgcgg tcagtagtcg   9420
atcagtagga tttggatcca ttaacaagac gagatgatga cgaggttata atattgaccc   9480
tgtatatgtg tgtataggat tccttctgct ggcacgggtg gtggccgtga cgttctgcgt   9540
gacgctggcg gcgtcgctgg ctgctcgcca cgggccgacc gccatggccg ccttccagat   9600
ctgcacccag gtctggctgg ccacgtccct cctcgccgac gggctcgccg tcgccggcca   9660
ggccatgatc gcgagcgcct tcgccaagga ggaccgctac aaggtggccg ccaccgccgc   9720
gcgcgtcctg cagctcggcg tcgtcctggg cgccgccctc acggcgctcc tcggactcgg   9780
gctgcagttc ggagccggcg tcttcaccag cgacgccgcc gtcatcaaga ccatccggaa   9840
gggcgttccg ttcgtcgccg gcacgcagac gctcaacacg ctagccttcg tcttcgacgg   9900
catcaacttc ggcgcgtcgg actacgcctt ctctgcctac tccatgatcg gcgtggcggc   9960
tgtcagcatc ccgtcgctca tcttcctctc gtcgcacggc ggcttcgtcg gcatctgggt   10020
agccctcacc atctacatgg gcgtcagggc ccttgccagc acctggagga tggcagcagc   10080
ccaggggcca tggaagtttc ttcggcagtg agcatatacg tacagtctcg tgtcgatcgt   10140
actttacctt gattttagtt ttatttctta tttgtaaccg aaggatactg gctacttgca   10200
aagcctaaat gttctaatgt aactagaaac aaatagtcat gatgaaaaca atatggttag   10260
catttctagc aacgctattt acacgagtca tcttgtttga ttttttttaa taaataattt   10320
taagaaagaa gtgagtatat gagttacaca ataacacgca caacccaaac gaccctagta   10380
cgtagagatt ggaatgaatc caagaataga cttacacaca agaccagctg gtgccgtcac   10440
atgcgtctga tcgaaaacaa gattaatcaa aagaaagaaa aaacaccgaa gccagcaatg   10500
caacacaagc acagatcaag aaagaaacag gggactttga cagccacgcg gcagcaacta   10560
atacgccgat cgagctccgg ccgacgttgt cccacggtcg tcgtcgtcgt cgatcgcatg   10620
tagatatagt agtacggtaa cgctgcgtgg tgagaggcga ggcatgtggc cggcaggcag   10680
gcatgggttg                                                          10690
 
<210>2
<211>9979
<212>DNA
<213>高粱(Sorghum bicolor)
 
<400>2
acatctcatg aagagcaacc cggaattgaa gtttgacact gaatttggca cccaccatga  60
tttagatccc tgcatgagag acaagagaga atctttctgg ttaccacaca gttttgttaa  120
gattgtattc ttcattgatt attgatagag aaagaagaga tagatgatga gtgtaccctt  180
gaagtggctg cacatgctgc tgtaatatca gttatccttt ggtatgaata aatataagtt  240
ccgtacccaa aacatactga cataataata actgcactaa caaggaaatc tatgagtgtc  300
ctcattattt gtgcatgcct cgtgtcctgc atctgagtct tgaatttctc cgtttggaag  360
gaagctttct gaaatcccaa ggataactta atcttgtcta acatgtgcga gtaggagtta  420
agttctagtt gagactgttt aagttgcaac tttctcatgc taaggcttat ctcaaattcc  480
ttgagctcat ttgaccgagt ttgttctttc aaagatcttt caaatgcatt aaggatccgc  540
cgattagctt caggagaaga tatgctatga gtacgacgag tcagctgctg attgccacca  600
gcatacagaa caagctgact ttccactgaa tttgaaaggt cctgcttgat ttcttgcgtt  660
ggattttgtg gaccatcagt gctcaacttg cttgcagcat cagagtcttc atgcttagaa  720
gaacattgag gaactggacc ttgtccatag acaggcatct cattaacaag atgaagcgtt  780
gttaatgtgc tgctgaatga tttctcaaag tttctcataa aactgtctaa cttgttacca  840
tatatctaca atgatgagtg aaagatatat taggaataat attaacaact gagctgtggg  900
atgataaagg gaactaggct tacatttctc aatgattcct tcactgccga tgtacagatc  960
tgcatccaaa gtccagactc agtttcaaac tacaaacagt ttcgtggttt tgtagagttt  1020
attagtcaaa ttgtggtaca ataaccttgg aaagaagtgc aggctgtatt ctttcgcctg  1080
aaggattctt cgtattcaca acctgcaatc agcaaatgca actcattgcc ctgaacagaa  1140
acttaggtgc acaaaaaaca tggcatgtga tgatgctaac atgaagttgc atgttggtga  1200
aatataggat tgtctactgg tgttctcatg tgaatgatga tgcctctgga tacacactga  1260
ggtgtgggca gacaatcata tgaaatgtaa tctcatgctt aatttcggaa tggatagcaa  1320
tgtgcaatac aagatgaaca aaactcttgt acgcccccac agaaatggaa taaagtgaca  1380
atttccctcc cccccaaagg gtactcctca cttgtatggc tctatcacca cttctctgac    1440
cccaagctgc cacatttgac atgtgatgca cgattgctcg gaataattgc aatttgcaac    1500
gacaaacgaa acgaaaatga tccagggcgg cggtatttag cattgcgcgc ccgcctccta    1560
tcctatctgt ggactagcaa ccaaggctac agacttacgt acaattcggt agaacggtga    1620
agggtgaaat gcggacatca acaccggtcg gcccgtcgtt accaacccgc gccagaaatg    1680
ggggaagcta cagagaaagg ccgagggagt ggcagtgggt acacgcacct gcgcgaggac    1740
ggccgcgaac gacatcccga gaggcagcgc gaggtcgtcc tgcacctgcg cgccggcgcc    1800
accctgaccc tcgctcccgc ccgcgggcgt agcggcgggc cccggctcct gccgccttcg    1860
ccgcagccgc agccggagcc ggacacccct gctgcgccga gcggaggagg accgggaggc    1920
agaggcggat gctgagccgc atgccgagga ggcgtctccc gacgcctccg acgaggaggg    1980
gtcggcgggt gcgggtgggt ggaggcagcc cgtgtccatc tcggcggggc cggcggggca    2040
ggggacaggg cgaccgttct ggggtgttcc tttcttcagg ccagggccag ggacccaggg    2100
ctgcgctgtc tgtgtgtgat ttggttccgt tttgacttcg ctttggaagg agagggacgg    2160
acggggacgc cgtcggaacg ggtgggcgga gtgtcccagt cgaagcgccc gtgggaacgc    2220
gagaaatgaa gttattatta caggaggcgg gattagccgt ttgaagtgaa aatcctggga    2280
aagttattaa ttccataatt tgtttcggaa aattcgattt tttattaaaa aatgagttta    2340
gggagccgac agccgaggtc ggagactctg gtccggagcg gcgcaacggc acgtctgatt    2400
gccgacgtgg ggcccagcgg cccagcaaag gccggtccgg gccgtactat tttgaagtcc    2460
aaatataaga aggcttgggc tgtcagccca ggacagaacg tacttttccg aagcccaaga    2520
tataagaagg attgagctgt catgtaaaga acgacttaca aaaaaaatta caatatcatt    2580
ttctaaaaaa aattacaata tcatagggta ggaaatatgg ataggacata ggaggtgtgg    2640
gtatcgcgtt cccatgtacc tctcgcaagc taagcgaaaa tgtgcttgtg ctaacagcta    2700
catatatata gctgaatttc ccacaaaaaa aaagctatat atagctgaaa cagcagtttg    2760
ttatgacata ttttggagca cacagtcgtg gagcaattta ttttttcaac cttttatagc    2820
tatatactat tttaaaataa catgtaagaa tagaactagc cttttggttg tgtcagactg    2880
ccatgcatag aaaaaattat aatgtcatat gcattgggca caactgcaca aaggcatggt    2940
atgctaaagc tctacccctc aatcaaaaaa taataaaatt ctagcacagt acctagtatc    3000
tggattttga atagctatat atataaaaac actaatattt attatatcaa atacttcctc    3060
catcccaaaa gcattcaaag tttatcataa aattgttatc attcttactt tccaatgcat    3120
atttattttt tcataataca cccttttttt caatacatct ctatctttta tttctctcta    3180
tctctcttct tttttgtgca ttataacttt tcattgtttc ttaatttcca tatttatatg    3240
cttttgtaat ggagggagca agtgttatca ttagatttat ttatgaatta tatttgtacg    3300
gtatatctat ttggtgttag acgttgttat cgtatctatg tatttagtca aattttagat    3360
atttcaacta tagatgcacc tataatcttg tttttcagaa cacacctaga attataattt    3420
tttttaggac agacatactc cctttgtccc aaaataaacg tatgcctcac gtttcgagaa    3480
gttatttttt ttaaagtctt actagttata taaaagatca tattaatatt tgtattttga    3540
aataagcttg ctatgaaaat atattatatg accaatgtag tgatgcttat tattacacac    3600
tatagatatc agtacttttg tatatatatt tggttaaaca taaaaaaaag cttaactctt    3660
tgataaacga taaaagttgt gtgtattttg gggccgacga tgaagtaata tatttttatt    3720
tcatgctgcc ggcgcgtatt ttgcacaccg ccttttcagt ttttacgcat tttctctgta    3780
gtagtatatg acaacaattc ctaggatcca gtgagctacc ggtgaaggtg ctcgttatgc    3840
gtttaaacat tgttccgtcc ggcggcatct agctaggagt actcctacag actattaaag    3900
ttgggccttg tttagttcca aataattttg caaaatagga atagtagcat tttcgtttgt    3960
atttgacaaa tattgtccaa tcatgaacta attagactca aaagattcgt ctcgttaatt    4020
tcgaccaaac tgtgaaatta gtttttattt tcgtctatat ttaatacttc atgcatgcgt    4080
ctaaagattt gatgtgacgg agaatctaaa aaattttgca aaactttttg ggaactaaac    4140
aaggccttgg ttggtgcgat gatgttggat ccagtgagct accggtgaag gtgctcgtta    4200
tgcgtttaaa cattgttccg tccggcggca tctagctagg agtactccta cagactatta    4260
aagttgggcc ttgtttagtt ccaaataatt ttgcaaaata ggaatagtag cattttcgtt    4320
tgtatttgac aaatattgtc caatcatgaa ctaattagac tcaaaagatt cgtctcgtta    4380
atttcgacca aactgtgaaa ttagttttta ttttcgtcta tatttaatac ttcatgcatg    4440
cgtctaaaga tttgatgtga cggagaatct aaaaaatttt gcaaaacttt ttgggaacta    4500
aacaaggcct tggttggtgc gatgatgttg gatccagtga gctaccggtg aaggtgctcg    4560
ttatgcgttt aaacattgtt ccgtccggcg gcatctagct aggagtactc ctacagacta    4620
ttaaagttgg gccttgttta gttccaaata attttgcaaa ataggaatag tagcattttc    4680
gtttgtattt gacaaatatt gtccaatcat gaactaatta gactcaaaag attcgtctcg    4740
ttaatttcga ccaaactgtg aaattagttt ttattttcgt ctatatttaa tacttcatgc    4800
atgcgtctaa agatttgatg tgacggagaa tctaaaaaat tttgcaaaac tttttgggaa    4860
ctaaacaagg ccttggttgg tgcgatgatg ttggatccag tgagctaccg gtgaaggtgc    4920
tcgttatgcg tttaaacatt gttccgtccg gcggcatcta tactcctaca gactattaaa    4980
gttggttggc gtttgctgct ttattaatgc atgcatcaag catggggcca tcaacggtag    5040
tgtcacttga ctcaatgacc aaacaccaaa gcatgcctgg ttaatttcag ttaataagag    5100
ggccttcaaa ggcagtctca ctcaggacag tgtttttatg tcactgtttt cggattagct    5160
aaaaagttat gactaaaagt attattcgct atttgtactg agataaaaat attgtagaat    5220
gactgataaa tttggctgga tgcatatgca taaacacgtg tcacgaatcc atattggatg    5280
cacatggtta ctccatagag tggcctttgt taacgcgcgg ctgttgtgtc acagatttat    5340
aagctagcta tagtatttta attcttctat ggtattattg taagcaaata tgtcgtatga    5400
agttgttaac taggaaactg aggcccgcct taagttccag tgttcattca cgaataatga    5460
attaatatct tgagcaaaaa gataataaca atgttaggcc aaagtgttgg gtgaaactaa    5520
aatcgaacta gcataatact gtacagtaat tcagttgttt ccttttaaat ataaataaaa    5580
tcaagcctga gtgccacaac tctatggagc actccatctg ttcttttata tttgtcgtca    5640
cgtcgaccaa actttctcat ttttaactaa gtttatataa aagattaaca atatttgtat    5700
ctctaaataa atttacataa aaatagattc agtgatctct aattatatat actaattacg    5760
tgtcacaaat attaatattt tttatatatt taatcaaagt taattacgtc aaatgaaatg    5820
atcagtgccc ggcagttcca taccacactt tcacggcacc acttcctccg aacaaaacgt    5880
atcctaaaaa aagaaaaaat cctttggatt ctgtctctct tagcttaaat atcctcgact    5940
tgacagtgtt tgcattttct tgttttttct ctaagatttg atgatgttgt tattttagta    6000
gtataagcga catgcccttt gacaatgagg cgtccatggt agatttctat caatttcaaa    6060
atttgttgga ctctagctca atgttttcga aatgctcgta gaggtaaagt gtttatatgt    6120
atgttcacgt gagcctgcat ctttaacgtg atttgaaaga agaaaaaacc ttcgtcatgt    6180
ggctcatcat cagggttcaa gtactacctt gctttagttt tgattgttgt ggaggttaat    6240
gactaattta gaggtgttaa catgtctttc taaaaacttg caaagttaga aatgttaatt    6300
tagtagcaag cacacacccc aaactcttcc ctctccatgt ggctagctgg gctggaggct    6360
gcctgcctgc ctatataagg atgggttgct cggccacttg tcacacccac tccatcacca    6420
gttcaccact cgtccgcttc accaacctat agagtttatg ccccgtcttg ctcttcagct    6480
ctggttagtc attaagagtc tgtttagatc tcaaattttt acatctcaaa acttttggct    6540
ctaaagttta catttcaaat aggtgttttg atgctttcca aatttttctg gtctgcaaca    6600
cacaagacac ggccccctaa gcaagtttac acagtttgag ggctccaagg tccaaaattc    6660
caaatcttta caacctaagt gttacaggcc ctctttagat ccattcttct aaaaagtgcc    6720
catttttcca aaagttttgg ctgtttagct gcatctggcg taattatcct gttattttat    6780
tcctctatga tgatgtagga gcatatatta ctgcacaagt ccttgttaat taatttgaga    6840
cagtcaggta ttagagggta gtagtagaac aacaagtggc caagtgggtg atcataagtc    6900
agttgttttt ttcttgaaaa tgctgttgtt atcactgatc gaatggttaa tgtgccgtat    6960
tgtagtgctt gcaaggtttg tagctaggcc gacatggagg aacaccggtc accagctcac    7020
gccaagcccg aggccgagca gccaccgcag cagcaggtgc cggcggcgat ggcggtggca    7080
gtggcagtgg acgtcgctgc tccagcagcg ctacagaata gtactgcggc tcctgctgag    7140
aacggggacg tcgctgctgc gggcgcggca gagaatggta ctgcggcttc cgctgcgaac    7200
ggggacggcg gcggctcgga gctgctcggc ggtccacgct ggacggggct gcaccttttc    7260
gtgatgaaca tccggagcgt gttcaagctg gacgagctcg gcgcggaggt gctgggcatc    7320
gcggtgccgg cgtcgctggc gctgacggcc gacccgctcg cctcgctgat cgacacggcc    7380
ttcatcggcc ggctggggtc cgtggagatc gcggccgtgg gcgtcgccat cgcggtgttc    7440
aaccaggtca tgaaggtgtg catctacccg ctcgtcagcg tcaccacgtc gttcgtcgcg    7500
gaggaggacg ccgtgctcag caaaggcggc gccaaggtca tcgacaacgg agaagaagaa    7560
gaagaattag aagcgggaca agttggcccg gagaagcaca ctgccgctgc cggcgcggac    7620
ccggagaagc agcagcagcc agctgatgaa gaagccgcca agaacggcgg cgagggatgc    7680
gcccctgccg tcgtcgccgg ccggagtagc ggcaagaaat cagggaacag gaggttcgtg    7740
ccgtccgtga cgtcggcact gatcgtgggc gcgctcctgg ggctgttcca gaccgtcttc    7800
ctcgtcgccg ccgggaagcc gctgctgcgc ctcatgggcg tcaagccggt aagttactgt    7860
gcctgtgcgt gcccgcaccg catgcaacgg tgaactagat tcgtcggtgc aacgacgaac    7920
aattgcttat acaatttact ggtgatattc gaatgatttc ccagggttcg cccatggtga    7980
tgcccgcgct gcgctacctg acgctgcgcg cgcttggcgc cccggccgtg ctgctgtctc    8040
tcgccatgca aggagtcttc cgtgggttca aggacgccaa gacgccctta tacgccatcg    8100
gtaaccaata atgctccata catgatacat acaatgcggc catatatgtc aaccaggcaa    8160
accagcatgg ttttttcggt aaagtttatt ttgcccttga gggcatgtgt ccttactctc    8220
tcatccattg gattcgcttt gagaaatgtg caaacacaca tctcaaagcg aaactacttt    8280
gatatgtatg tttgcacact tctcaaaacg aatctaatgg gtgggagagc gagagtatct    8340
gcccttaagg gaaaaaaaac acccacgcac gtttgatctg agctgtgtta cgaatgaatg    8400
catgcagtgg ccggcgacgc ggcgaacatt gtgctggatc cgatcctgat atttggctgc    8460
cgcctgggcg tgatcggcgc agccattgcc catgttcttt cccagtataa gaccatgacc    8520
acccatctcc ttcttgtcag caattcagca ttggccgcaa caactgacaa tggcgaaatt    8580
aaaccgcacg tacgcaggta cctgataacg ctgataatgc tgagcaagct ggtgaggaag    8640
gtcgatgtcg tcccgcccag cctgaaatgc ctcaaattcc ggcgcttcct cggatgcggt    8700
cagtagtcga tcagtaggat ttggatccat taacaagacg agatgatgac gaggttataa    8760
tattgaccct gtatatgtgt gtataggatt ccttctgctg gcacgggtgg tggccgtgac  8820
gttctgcgtg acgctggcgg cgtcgctggc tgctcgccac gggccgaccg ccatggccgc  8880
cttccagatc tgcacccagg tctggctggc cacgtccctc ctcgccgacg ggctcgccgt  8940
cgccggccag gccatgatcg cgagcgcctt cgccaaggag gaccgctaca aggtggccgc  9000
caccgccgcg cgcgtcctgc agctcggcgt cgtcctgggc gccgccctca cggcgctcct  9060
cggactcggg ctgcagttcg gagccggcgt cttcaccagc gacgccgccg tcatcaagac  9120
catccggaag ggcgttccgt tcgtcgccgg cacgcagacg ctcaacacgc tagccttcgt  9180
cttcgacggc atcaacttcg gcgcgtcgga ctacgccttc tctgcctact ccatgatcgg  9240
cgtggcggct gtcagcatcc cgtcgctcat cttcctctcg tcgcacggcg gcttcgtcgg  9300
catctgggta gccctcacca tctacatggg cgtcagggcc cttgccagca cctggaggat  9360
ggcagcagcc caggggccat ggaagtttct tcggcagtga gcatatacgt acagtctcgt  9420
gtcgatcgta ctttaccttg attttagttt tatttcttat ttgtaaccga aggatactgg  9480
ctacttgcaa agcctaaatg ttctaatgta actagaaaca aatagtcatg atgaaaacaa  9540
tatggttagc atttctagca acgctattta cacgagtcat cttgtttgat tttttttaat  9600
aaataatttt aagaaagaag tgagtatatg agttacacaa taacacgcac aacccaaacg  9660
accctagtac gtagagattg gaatgaatcc aagaatagac ttacacacaa gaccagctgg  9720
tgccgtcaca tgcgtctgat cgaaaacaag attaatcaaa agaaagaaaa aacaccgaag  9780
ccagcaatgc aacacaagca cagatcaaga aagaaacagg ggactttgac agccacgcgg  9840
cagcaactaa tacgccgatc gagctccggc cgacgttgtc ccacggtcgt cgtcgtcgtc  9900
gatcgcatgt agatatagta gtacggtaac gctgcgtggt gagaggcgag gcatgtggcc  9960
ggcaggcagg catgggttg                                               9979
 
<210>3
<211>1803
<212>DNA
<213>高粱(Sorghum bicolor)
<400>3
atggaggaac accggtcacc agctcacgcc aagcccgagg ccgagcagcc accgcagcag    60
caggtgccgg cggcgatggc ggtggcagtg gcagtggacg tcgctgctcc agcagcgcta    120
cagaatagta ctgcggctcc tgctgagaac ggggacgtcg ctgctgcggg cgcggcagag    180
aatggtactg cggcttccgc tgcgaacggg gacggcggcg gctcggagct gctcggcggt    240
ccacgctgga cggggctgca ccttttcgtg atgaacatcc ggagcgtgtt caagctggac    300
gagctcggcg cggaggtgct gggcatcgcg gtgccggcgt cgctggcgct gacggccgac    360
ccgctcgcct cgctgatcga cacggccttc atcggccggc tggggtccgt ggagatcgcg    420
gccgtgggcg tcgccatcgc ggtgttcaac caggtcatga aggtgtgcat ctacccgctc    480
gtcagcgtca ccacgtcgtt cgtcgcggag gaggacgccg tgctcagcaa aggcggcgcc    540
aaggtcatcg acaacggaga agaagaagaa gaattagaag cgggacaagt tggcccggag    600
aagcacactg ccgctgccgg cgcggacccg gagaagcagc agcagccagc tgatgaagaa    660
gccgccaaga acggcggcga gggatgcgcc cctgccgtcg tcgccggccg gagtagcggc    720
aagaaatcag ggaacaggag gttcgtgccg tccgtgacgt cggcactgat cgtgggcgcg    780
ctcctggggc tgttccagac cgtcttcctc gtcgccgccg ggaagccgct gctgcgcctc    840
atgggcgtca agccgggttc gcccatggtg atgcccgcgc tgcgctacct gacgctgcgc    900
gcgcttggcg ccccggccgt gctgctgtct ctcgccatgc aaggagtctt ccgtgggttc    960
aaggacgcca agacgccctt atacgccatc gtggccggcg acgcggcgaa cattgtgctg    1020
gatccgatcc tgatatttgg ctgccgcctg ggcgtgatcg gcgcagccat tgcccatgtt    1080
ctttcccagt acctgataac gctgataatg ctgagcaagc tggtgaggaa ggtcgatgtc    1140
gtcccgccca gcctgaaatg cctcaaattc cggcgcttcc tcggatgcgg attccttctg    1200
ctggcacggg tggtggccgt gacgttctgc gtgacgctgg cggcgtcgct ggctgctcgc    1260
cacgggccga ccgccatggc cgccttccag atctgcaccc aggtctggct ggccacgtcc    1320
ctcctcgccg acgggctcgc cgtcgccggc caggccatga tcgcgagcgc cttcgccaag    1380
gaggaccgct acaaggtggc cgccaccgcc gcgcgcgtcc tgcagctcgg cgtcgtcctg    1440
ggcgccgccc tcacggcgct cctcggactc gggctgcagt tcggagccgg cgtcttcacc  1500
agcgacgccg ccgtcatcaa gaccatccgg aagggcgttc cgttcgtcgc cggcacgcag  1560
acgctcaaca cgctagcctt cgtcttcgac ggcatcaact tcggcgcgtc ggactacgcc  1620
ttctctgcct actccatgat cggcgtggcg gctgtcagca tcccgtcgct catcttcctc  1680
tcgtcgcacg gcggcttcgt cggcatctgg gtagccctca ccatctacat gggcgtcagg  1740
gcccttgcca gcacctggag gatggcagca gcccaggggc catggaagtt tcttcggcag  1800
tga                                                                1803
 
<210>4
<211>322
<212>PRT
<213>高粱(Sorghum bicolor)
 
<400>4
 
Met Glu Glu His Arg Ser Pro Ala His Ala Lys Pro Glu Ala Glu Gln
1               5                   10                  15
Pro Pro Gln Gln Gln Val Pro Ala Ala Met Ala Val Ala Val Ala Val
            20                  25                  30
Asp Val Ala Ala Pro Ala Ala Leu Gln Asn Ser Thr Ala Ala Pro Ala
        35                  40                  45
Glu Asn Gly Asp Val Ala Ala Ala Gly Ala Ala Glu Asn Gly Thr Ala
    50                  55                  60
Ala Ser Ala Ala Asn Gly Asp Gly Gly Gly Ser Glu Leu Leu Gly Gly
65                  70                  75                  80
Pro Arg Trp Thr Gly Leu His Leu Phe Val Met Asn Ile Arg Set Val
                85                  90                  95
Phe Lys Leu Asp Glu Leu Gly Ala Glu Val Leu Gly Ile Ala Val Pro
            100                 105                 110
Ala Ser Leu Ala Leu Thr Ala Asp Pro Leu Ala Ser Leu Ile Asp Thr
        115                 120                 125
Ala Phe Ile Gly Arg Leu Gly Ser Val Glu Ile Ala Ala Val Gly Val
    130                 135                 140
Ala Ile Ala Val Phe Asn Gln Val Met Lys Val Cys Ile Tyr Pro Leu
145                 150                 155                 160
Val Ser Val Thr Thr Ser Phe Val Ala Glu Glu Asp Ala Val Leu Ser
                165                 170                 175
Lys Gly Gly Ala Lys Val Ile Asp Asn Gly Glu Glu Glu Glu Glu Leu
            180                 185                 190
Glu Ala Gly Gln Val Gly Pro Glu Lys His Thr Ala Ala Ala Gly Ala
        195                 200                 205
Asp Pro Glu Lys Gln Gln Gln Pro Ala Asp Glu Glu Ala Ala Lys Asn
    210                 215                 220
Gly Gly Glu Gly Cys Ala Pro Ala Val Val Ala Gly Arg Ser Ser Gly
225                 230                 235                 240
Lys Lys Ser Gly Asn Arg Arg Phe Val Pro Ser Val Thr Ser Ala Leu
                245                 250                 255
Ile Val Gly Ala Leu Leu Gly Leu Phe Gln Thr Val Phe Leu Val Ala
            260                 265                 270
Ala Gly Lys Pro Leu Leu Arg Leu Met Gly Val Lys Pro Gly Ser Pro
        275                 280                 285
Met Val Met Pro Ala Leu Arg Tyr Leu Thr Leu Arg Ala Leu Gly Ala
    290                 295                 300
Pro Ala Val Leu Leu Ser Leu Ala Met Gln Gly Val Phe Arg Gly Phe
305                 310                 315                 320
Lys Asp
 
<210>5
<211>455
<212>DNA
<213>高粱(Sorghum bicolor)
 
<400>5
ggatccagtg agctaccggt gaaggtgctc gttatgcgtt taaacattgt tccgtccggc  60
ggcatctagc taggagtact cctacagact attaaagttg ggccttgttt agttccaaat  120
aattttgcaa aataggaata gtagcatttt cgtttgtatt tgacaaatat tgtccaatca  180
tgaactaatt agactcaaaa gattcgtctc gttaatttcg accaaactgt gaaattagtt  240
tttattttcg tctatattta atacttcatg catgcgtcta aagatttgat gtgacggaga  300
atctaaaaaa ttttgcaaaa ctttttggga actaaacaag gccttggttg gtgcgatgat  360
gttggatcca gtgagctacc ggtgaaggtg ctcgttatgc gtttaaacat tgttccgtcc  420
ggcggcatct atactcctac agactattaa agttg                             455
 
<210>6
<211>1181
<212>DNA
<213>高粱(Sorghum bicolor)
 
<400>6
ggatccagtg agctaccggt gaaggtgctc gttatgcgtt taaacattgt tccgtccggc  60
ggcatctagc taggagtact cctacagact attaaagttg ggccttgttt agttccaaat  120
aattttgcaa aataggaata gtagcatttt cgtttgtatt tgacaaatat tgtccaatca  180
tgaactaatt agactcaaaa gattcgtctc gttaatttcg accaaactgt gaaattagtt  240
tttattttcg tctatattta atacttcatg catgcgtcta aagatttgat gtgacggaga  300
atctaaaaaa ttttgcaaaa ctttttggga actaaacaag gccttggttg gtgcgatgat  360
gttggatcca gtgagctacc ggtgaaggtg ctcgttatgc gtttaaacat tgttccgtcc  420
ggcggcatct agctaggagt actcctacag actattaaag ttgggccttg tttagttcca  480
aataattttg caaaatagga atagtagcat tttcgtttgt atttgacaaa tattgtccaa  540
tcatgaacta attagactca aaagattcgt ctcgttaatt tcgaccaaac tgtgaaatta  600
gtttttattt tcgtctatat ttaatacttc atgcatgcgt ctaaagattt gatgtgacgg  660
agaatctaaa aaattttgca aaactttttg ggaactaaac aaggccttgg ttggtgcgat  720
gatgttggat ccagtgagct accggtgaag gtgctcgtta tgcgtttaaa cattgttccg  780
tccggcggca tctagctagg agtactccta cagactatta aagttgggcc ttgtttagtt  840
ccaaataatt ttgcaaaata ggaatagtag cattttcgtt tgtatttgac aaatattgtc  900
caatcatgaa ctaattagac tcaaaagatt cgtctcgtta atttcgacca aactgtgaaa  960
ttagttttta ttttcgtcta tatttaatac ttcatgcatg cgtctaaaga tttgatgtga  1020
cggagaatct aaaaaatttt gcaaaacttt ttgggaacta aacaaggcct tggttggtgc  1080
gatgatgttg gatccagtga gctaccggtg aaggtgctcg ttatgcgttt aaacattgtt  1140
ccgtccggcg gcatctatac tcctacagac tattaaagtt g                      1181
 
<210>7
<211>1540
<212>DNA
<213>高粱(Sorghum bicolor)
 
<400>7
ggatccagtg agctaccggt gaaggtgctc gttatgcgtt taaacattgt tccgtccggc  60
ggcatctagc taggagtact cctacagact attaaagttg ggccttgttt agttccaaat  120
aattttgcaa aataggaata gtagcatttt cgtttgtatt tgacaaatat tgtccaatca  180
tgaactaatt agactcaaaa gattcgtctc gttaatttcg accaaactgt gaaattagtt  240
tttattttcg tctatattta atacttcatg catgcgtcta aagatttgat gtgacggaga  300
atctaaaaaa ttttgcaaaa ctttttggga actaaacaag gccttggttg gtgcgatgat  360
gttggatcca gtgagctacc ggtgaaggtg ctcgttatgc gtttaaacat tgttccgtcc  420
ggcggcatct agctaggagt actcctacag actattaaag ttgggccttg tttagttcca  480
aataattttg caaaatagga atagtagcat tttcgtttgt atttgacaaa tattgtccaa  540
tcatgaacta attagactca aaagattcgt ctcgttaatt tcgaccaaac tgtgaaatta  600
gtttttattt tcgtctatat ttaatacttc atgcatgcgt ctaaagattt gatgtgacgg  660
agaatctaaa aaattttgca aaactttttg ggaactaaac aaggccttgg ttggtgcgat  720
gatgttggat ccagtgagct accggtgaag gtgctcgtta tgcgtttaaa cattgttccg  780
tccggcggca tctagctagg agtactccta cagactatta aagttgggcc ttgtttagtt  840
ccaaataatt ttgcaaaata ggaatagtag cattttcgtt tgtatttgac aaatattgtc  900
caatcatgaa ctaattagac tcaaaagatt cgtctcgtta atttcgacca aactgtgaaa  960
ttagttttta ttttcgtcta tatttaatac ttcatgcatg cgtctaaaga tttgatgtga  1020
cggagaatct aaaaaatttt gcaaaacttt ttgggaacta aacaaggcct tggttggtgc  1080
gatgatgttg gatccagtga gctaccggtg aaggtgctcg ttatgcgttt aaacattgtt  1140
ccgtccggcg gcatctagct aggagtactc ctacagacta ttaaagttgg gccttgttta  1200
gttccaaata attttgcaaa ataggaatag tagcattttc gtttgtattt gacaaatatt  1260
gtccaatcat gaactaatta gactcaaaag attcgtctcg ttaatttcga ccaaactgtg  1320
aaattagttt ttattttcgt ctatatttaa tacttcatgc atgcgtctaa agatttgatg  1380
tgacggagaa tctaaaaaat tttgcaaaac tttttgggaa ctaaacaagg ccttggttgg  1440
tgcgatgatg ttggatccag tgagctaccg gtgaaggtgt tatgcgttt aaacattgttc  1500
cgtccggcgg catctatact cctacagact attaaagttg                        1540
 
<210>8
<211>1907
<212>DNA
<213>高粱(Sorghum bicolor)
 
<400>8
ggatccagtg agctaccggt gaaggtgctc gttatgcgtt taaacattgt tccgtccggc  60
ggcatctagc taggagtact cctacagact attaaagttg ggccttgttt agttccaaat  120
aattttgcaa aataggaata gtagcatttt cgtttgtatt tgacaaatat tgtccaatca    180
tgaactaatt agactcaaaa gattcgtctc gttaatttcg accaaactgt gaaattagtt    240
tttattttcg tctatattta atacttcatg catgcgtcta aagatttgat gtgacggaga    300
atctaaaaaa ttttgcaaaa ctttttggga actaaacaag gccttggttg gtgcgatgat    360
gttggatcca gtgagctacc ggtgaaggtg ctcgttatgc gtttaaacat tgttccgtcc    420
ggcggcatct agctaggagt actcctacag actattaaag ttgggccttg tttagttcca    480
aataattttg caaaatagga atagtagcat tttcgtttgt atttgacaaa tattgtccaa    540
tcatgaacta attagactca aaagattcgt ctcgttaatt tcgaccaaac tgtgaaatta    600
gtttttattt tcgtctatat ttaatacttc atgcatgcgt ctaaagattt gatgtgacgg    660
agaatctaaa aaattttgca aaactttttg ggaactaaac aaggccttgg ttggtgcgat    720
gatgttggat ccagtgagct accggtgaag gtgctcgtta tgcgtttaaa cattgttccg    780
tccggcggca tctagctagg agtactccta cagactatta aagttgggcc ttgtttagtt    840
ccaaataatt ttgcaaaata ggaatagtag cattttcgtt tgtatttgac aaatattgtc    900
caatcatgaa ctaattagac tcaaaagatt cgtctcgtta atttcgacca aactgtgaaa    960
ttagttttta ttttcgtcta tatttaatac ttcatgcatg cgtctaaaga tttgatgtga    1020
cggagaatct aaaaaatttt gcaaaacttt ttgggaacta aacaaggcct tggttggtgc    1080
gatgatgttg gatccagtga gctaccggtg aaggtgctcg ttatgcgttt aaacattgtt    1140
ccgtccggcg gcatctagct aggagtactc ctacagacta ttaaagttgg gccttgttta    1200
gttccaaata attttgcaaa ataggaatag tagcattttc gtttgtattt gacaaatatt    1260
gtccaatcat gaactaatta gactcaaaag attcgtctcg ttaatttcga ccaaactgtg    1320
aaattagttt ttattttcgt ctatatttaa tacttcatgc atgcgtctaa agatttgatg    1380
tgacggagaa tctaaaaaat tttgcaaaac tttttgggaa ctaaacaagg ccttggttgg    1440
tgcgatgatg ttggatccag tgagctaccg gtgaaggtgc tcgttatgcg tttaaacatt    1500
gttccgtccg gcggcatcta gctaggagta ctcctacaga ctattaaagt tgggccttgt    1560
ttagttccaa ataattttgc aaaataggaa tagtagcatt ttcgtttgta tttgacaaat    1620
attgtccaat catgaactaa ttagactcaa aagattcgtc tcgttaattt cgaccaaact  1680
gtgaaattag tttttatttt cgtctatatt taatacttca tgcatgcgtc taaagatttg  1740
atgtgacgga gaatctaaaa aattttgcaa aactttttgg gaactaaaca aggccttggt  1800
tggtgcgatg atgttggatc cagtgagcta ccggtgaagg tgctcgttat gcgtttaaac  1860
attgttccgt ccggcggcat ctatactcct acagactatt aaagttg                1907
 
<210>9
<211>23
<212>DNA
<213>人工序列
 
<220>
<223>化学合成
 
<400>9
stgcagtatc tgcagtatca ttt                                           23
 
<210>10
<211>20
<212>DNA
<213>人工序列
 
<220>
<223>化学合成
 
<400>10
aatccgtcag gtcagcaatc                                               20
 
<210>11
<211>20
<212>DNA
<213>人工序列
 
<220>
<223>化学合成
 
<400>11
aaggcaacaa ctgaggcact                                               20
<210>12
<211>20
<212>DNA
<213>人工序列
 
<220>
<223>化学合成
 
<400>12
tcgctagagt ggtgcaagaa                                      20
 
<210>13
<211>36
<212>DNA
<213>人工序列
 
<220>
<223>化学合成
 
<400>13
gctgtcaacg atacgctacg taacggcatg acagtg                     36
 
<210>14
<211>23
<212>DNA
<213>人工序列
 
<220>
<223>化学合成
 
<400>14
cgactggagc acgaggacac tga                                    23
 
<210>15
<211>21
<212>DNA
<213>人工序列
 
<220>
<223>化学合成
 
<400>15
ataccgagga agcgccggaa t                          21
 
<210>16
<211>27
<212>DNA
<213>人工序列
 
<220>
<223>化学合成
 
<400>16
ggacactgac atggactgaa ggaggta                     27
 
<210>17
<211>20
<212>DNA    
<213>人工序列
 
<220>
<223>化学合成
 
<400>17
ccttgaaccc acggaagact                             20
 
<210>18
<211>25
<212>DNA
<213>人工序列
 
<220>
<223>化学合成
 
<400>18
gctgtcaacg atacgctacg taacg                       25
 
<210>19
<211>20
<212>DNA
<213>人工序列
 
<220>
<223>化学合成
 
<400>19
gcccgcgctg cgctacctga                         20
 
<210>20
<211>23
<212>DNA
<213>人工序列
 
<220>
<223>化学合成
 
<400>20
cgctacgtaa cggcatgaca gtg                     23
 
<210>21
<211>24
<212>DNA
<213>人工序列
 
<220>
<223>化学合成
 
<400>21
acgctgataa tgctgagcaa gctg                     24
 
<210>22
<211>27
<212>DNA
<213>人工序列
 
<220>
<223>化学合成
 
<400>22
gtacgatcga cacgagaact gtacgta                  27
 
<210>23
<211>27
<212>DNA
<213>人工序列
 
<220>
<223>化学合成
 
<400>23
tgcttgcaag gtttgtagct aggccga                   27
<210>24
<211>296
<212>PRT
<213>拟南芥(Arabidopsis sp.)
 
<400>24
 
Arg Asn Ile Pro Ser Ala Ser Ser Ala Leu Ile Ile Gly Gly Val Leu
1               5                   10                  15
Gly Leu Phe Gln Ala Val Phe Leu Ile Ser Ala Ala Lys Pro Leu Leu
            20                  25                  30
Ser Phe Met Gly Val Lys His Asp Ser Pro Met Met Arg Pro Ser Gln
        35                  40                  45
Arg Tyr Leu Ser Leu Arg Ser Leu Gly Ala Pro Ala Val Leu Leu Ser
    50                  55                  60
Leu Ala Ala Gln Gly Val Phe Arg Gly Phe Lys Asp Thr Thr Thr Pro
65                  70                  75                  80
Leu Phe Ala Thr Val Ile Gly Asp Val Thr Asn Ile Ile Leu Asp Pro
                85                  90                  95
Ile Phe Ile Phe Val Phe Arg Leu Gly Val Thr Gly Ala Ala Thr Ala
            100                 105                 110
His Val Ile Ser Gln Tyr Leu Met Cys Gly Ile Leu Leu Trp Lys Leu
        115                 120                 125
Met Gly Gln Val Asp Ile Phe Asn Met Ser Thr Lys His Leu Gln Phe
    130                 135                 140
Cys Arg Phe Met Lys Asn Gly Phe Leu Leu Leu Met Arg Val Ile Ala
145                 150                 155                 160
Val Thr Phe Cys Val Thr Leu Ser Ala Ser Leu Ala Ala Arg Glu Gly
                165                 170                 175
Ser Thr Ser Met Ala Ala Phe Gln Val Cys Leu Gln Val Trp Leu Ala
            180                 185                 190
Thr Ser Leu Leu Ala Asp Gly Tyr Ala Val Ala Gly Gln Ala Ile Leu
        195                 200                 205
Ala Ser Ala Phe Ala Lys Lys Asp Tyr Lys Arg Ala Ala Ala Thr Ala
    210                 215                 220
Ser Arg Val Leu Gln Leu Gly Leu Val Leu Gly Phe Val Leu Ala Val
225                 230                 235                 240
Ile Leu Gly Ala Gly Leu His Phe Gly Ala Arg Val Phe Thr Lys Asp
                245                 250                 255
Asp Lys Val Leu His Leu Ile Ser Ile Gly Leu Pro Phe Val Ala Gly
            260                 265                 270
Thr Gln Pro Ile Asn Ala Leu Ala Phe Val Phe Asp Gly Val Asn Phe
        275                 280                 285
Gly Ala Ser Asp Phe Gly Tyr Ala
    290                 295
 
<210>25
<211>296
<212>PRT
<213>水稻(Oryza sp.)
 
<400>25
 
Arg Phe Val Pro Ser Val Thr Ser Ala Leu Ile Val Gly Ala Phe Ile
1               5                   10                  15
Gly Leu Leu Gln Ala Val Phe Leu Val Ala Ala Gly Lys Pro Leu Leu
            20                  25                  30
Arg Ile Met Gly Val Lys Pro Gly Ser Pro Met Met Ile Pro Ala Leu
        35                  40                  45
Arg Tyr Leu Val Val Arg Ser Leu Gly Ala Pro Ala Val Leu Leu Ser
    50                  55                  60
Leu Ala Met Gln Gly Val Phe Arg Gly Phe Lys Asp Thr Lys Thr Pro
65                  70                  75                  80
Leu Tyr Ala Thr Val Thr Gly Asp Leu Ala Asn Ile Ala Leu Asp Pro
                85                  90                  95
Ile Leu Ile Phe Thr Cys Arg Phe Gly Val Val Gly Ala Ala Ile Ala
            100                 105                 110
His Val Ile Ser Gln Tyr Leu Ile Thr Leu Ile Met Leu Cys Lys Leu
        115                 120                 125
Val Arg Lys Val Asp Val Ile Pro Ser Ser Leu Lys Ser Leu Lys Phe
    130                 135                 140
Arg Arg Phe Leu Gly Cys Gly Phe Leu Leu Leu Ala Arg Val Val Ala
145                 150                 155                 160
Val Thr Phe Cys Val Thr Leu Ala Ala Ser Leu Ala Ala Arg His Gly
                165                 170                 175
Ala Thr Ala Met Ala Ala Phe Gln Ile Cys Ala Gln Val Trp Leu Ala
            180                 185                 190
Ser Ser Leu Leu Ala Asp Gly Leu Ala Val Ala Gly Gln Ala Leu Leu
        195                 200                 205
Ala Ser Ala Phe Ala Lys Lys Asp His Tyr Lys Val Ala Val Thr Thr
    210                 215                 220
Ala Arg Val Leu Gln Leu Ala Val Val Leu Gly Val Gly Leu Thr Ala
225                 230                 235                 240
Phe Leu Ala Ala Gly Met Trp Phe Gly Ala Gly Val Phe Thr Ser Asp
                245                 250                 255
Ala Ala Val Ile Ser Thr Ile His Arg Gly Val Pro Phe Val Ala Gly
        260                 265                 270
Thr Gln Thr Ile Asn Thr Leu Ala Phe Val Phe Asp Gly Val Asn Phe
    275                 280                 285
Gly Ala Ser Asp Tyr Ala Phe Ala
290                 295
 
<210>26
<211>20
<212>DNA
<213>人工序列
 
<220>
<223>化学合成
 
<400>26
gtgctggatc cgatcctgat                                                      20
 
<210>27
<211>20
<212>DNA
<213>人工序列
 
<220>
<223>化学合成
 
<400>27
cactgccgaa gaaacttcca                                                      20
 
<210>28
<211>20
<212>DNA
<213>人工序列
 
<220>
<223>化学合成
 
<400>28
tgatgaagat tctcactgag                       20
 
<210>29
<211>21
<212>DNA
<213>人工序列
 
<220>
<223>化学合成
 
<400>29
gatccacaat ctgttggaac g                     21
 
<210>30
<211>21
<212>DNA
<213>人工序列
 
<220>
<223>化学合成
 
<400>30
cagccattgc ccatgttctt t                     21
 
<210>31
<211>22
<212>DNA
<213>人工序列
 
<220>
<223>化学合成
 
<400>31
accagcttgc tcagcattat ca                    22
 
<210>32
<211>18
<212>DNA
<213>人工序列
<220>
<223>化学合成
 
<400>32
cccagtacct gataacgc                     18
 
<210>33
<211>32
<212>DNA
<213>人工序列
 
<220>
<223>化学合成
 
<400>33
aatatctaga cgatcgacac gagactgtac gt    32
 
<210>34
<211>30
<212>DNA
<213>人工序列
 
<220>
<223>化学合成
 
<400>34
aatacccggg aaggtttgta gctaggccga      30

Claims (49)

1.分离或重组的DNA分子,所述DNA分子包含编码具有SEQID NO:4所示的氨基酸序列的多肽的核苷酸序列或其互补序列。
2.权利要求1的分离或重组的DNA分子,所述DNA分子进一步包含编码调控元件的第二核苷酸序列,其中所述元件为组成型启动子,所述启动子是可操作地连接的,以便响应铝Al3+的存在而提高编码具有SEQ ID NO:4所示的氨基酸序列的多肽的核酸序列在根组织中转录。
3.权利要求1的分离或重组的DNA分子,所述DNA分子进一步包含编码调控元件的第二核苷酸序列,其中所述元件为组织特异性的铝诱导的启动子,所述启动子是可操作地连接的,以便响应铝Al3+的存在而提高编码具有SEQ ID NO:4所示的氨基酸序列的多肽的核酸序列在根组织中转录。
4.权利要求1的分离的DNA分子,所述DNA分子进一步包含多态小反向重复元件(MITE)插入,其中所述插入区域的大小变化与所述核酸序列表达的增加以及对Al3+的耐受水平的增加呈正相关,所述核酸序列编码具有SEQ ID NO:4所示的氨基酸序列的多肽,所述对Al3+的耐受水平的增加由根生长率的增加来测量。
5.权利要求1-4中任一项的分离或重组的DNA分子,其中所述核苷酸序列为SEQ ID NO:1所示的基因组核苷酸序列。
6.权利要求1-4中任一项的分离或重组的DNA分子,其中所述核苷酸序列为cDNA。
7.权利要求1的分离或重组的DNA分子,其中所述核苷酸序列为具有SEQ ID NO:3所示的序列的cDNA。
8.分离或重组的核酸分子,所述核酸分子包含选自以下的核苷酸序列:
(a)与编码SEQ ID NO:4的核酸序列具有至少95%序列同一性的核苷酸序列,其中所述核苷酸序列编码具有导致在植物细胞中耐受Al3+的铝诱导的柠檬酸外排转运蛋白活性的多肽;和
(b)包含(a)的互补序列的核苷酸序列。
9.分离或重组的核酸分子,所述核酸分子包含选自以下的核苷酸序列:
(a)与编码SEQ ID NO:4的核酸序列具有至少90%序列同一性的核苷酸序列,其中所述核苷酸序列编码具有导致在植物细胞中耐受Al3+的铝诱导的柠檬酸外排转运蛋白活性的多肽;和
(b)包含(a)的互补序列的核苷酸序列。
10.分离或重组的核酸分子,所述核酸分子包含选自以下的核苷酸序列:
(a)与编码SEQ ID NO:4的核酸序列具有至少85%序列同一性的核苷酸序列,其中所述核苷酸序列编码具有导致在植物细胞中耐受Al3+的铝诱导的柠檬酸外排转运蛋白活性的多肽;和
(b)包含(a)的互补序列的核苷酸序列。
11.分离或重组的核酸分子,所述核酸分子包含选自以下的核苷酸序列:
(a)与编码SEQ ID NO:4的核酸序列具有至少80%序列同一性的核苷酸序列,其中所述核苷酸序列编码具有导致在植物细胞中耐受Al3+的铝诱导的柠檬酸外排转运蛋白活性的多肽;和
(b)包含(a)的互补序列的核苷酸序列。
12.包含编码多肽的序列的分离的核酸,所述多肽的氨基酸序列与具有SEQ ID NO:4所示序列的多肽具有至少53%的全序列同一性,所述被编码的多肽在Al存在下实施Al诱导的根生长,而编码所述被编码的多肽的所述核酸在Al耐受型植物的根尖中表达。
13.包含编码多肽的序列的分离的核酸,所述多肽的氨基酸序列与具有SEQ ID NO:4所示序列的多肽具有至少64%的全序列同一性,所述被编码的多肽在Al存在下实施Al诱导的根生长,而编码所述被编码的多肽的所述核酸在Al耐受型植物的根尖中表达。
14.包含权利要求1的DNA分子的重组构建体,其中所述DNA为cDNA及一个或多个与所述核苷酸序列可操作地连接的调控元件,其中铝诱导的所述cDNA的表达导致铝诱导的柠檬酸外排转运蛋白多肽SbMATE的产生,所述多肽导致植物细胞中对Al3+的耐受。
15.权利要求14的重组构建体,其中所述调控元件为与所述核苷酸序列可操作地连接的组成型启动子、诱导型启动子或组织特异性启动子。
16.权利要求14的重组构建体,其中所述调控元件为CaMV 35S启动子。
17.包含权利要求3的DNA分子的重组构建体,其中所述DNA为cDNA,其中铝诱导的所述cDNA的表达是在根中特异性表达,并导致在植物根细胞中生产铝诱导的柠檬酸外排转运蛋白多肽SbMATE,所述多肽导致所述植物根细胞中对Al3+的耐受。
18.包含权利要求4的DNA分子的重组构建体,其中所述DNA为cDNA,其中铝诱导的所述cDNA的表达是在根中特异性表达,并导致在植物根细胞中生产铝诱导的柠檬酸外排转运蛋白多肽SbMATE,所述多肽导致所述植物根细胞中对Al3+的耐受,并且其中所述MITE区域的大小变化与所述多肽表达的增加以及对Al3+的耐受水平的增加正相关,所述对Al3+的耐受水平的增加由根生长率的增加来测量。
19.包含权利要求1的核酸的载体。
20.包含权利要求19的载体的宿主细胞。
21.权利要求20的宿主细胞,其中所述宿主细胞为可将本发明构建体导入其中的单细胞生物体或低等或高等多细胞生物体。
22.权利要求20的宿主细胞,其中所述宿主细胞为植物细胞。
23.权利要求20的宿主细胞,其中所述植物细胞来自选自以下的植物:拟南芥、小麦、玉米、高粱或水稻。
24.导入了权利要求14的cDNA的转基因植物,导入了所述cDNA的所述植物的后代,其中SbMATE在所述植物或所述植物后代中的表达,导致在植物细胞中产生铝诱导的柠檬酸外排转运蛋白多肽SbMATE以及Al诱导的对Al3+的耐受。
25.权利要求24的转基因植物,其中SbMATE在所述植物或所述植物后代中的表达导致调节柠檬酸分泌,从而提高所述植物从酸性土壤获得磷的能力。
26.权利要求24的植物的植物细胞、植物部分或植物组织。
27.权利要求24的转基因植物,其中所述SbMATE蛋白确定为SEQ ID NO:4。
28.来自权利要求24的转基因植物的植物部分,其中所述植物部分含有编码SbMATE蛋白的cDNA。
29.权利要求28的植物部分,其中所述植物部分为根。
30.权利要求24的转基因植物的转基因种子。
31.包含含有重组构建体的植物细胞的转基因植物,所述构建体包含权利要求18的cDNA,该cDNA包含位于SEQ ID NO:3所示的所述cDNA的上游的序列,其中所述序列包含所述调控元件,藉此所述调控元件驱动所述cDNA以根特异性的方式表达,从而导致在植物根细胞中产生铝诱导的柠檬酸外排转运蛋白多肽SbMATE,以及在所述植物根细胞中产生对Al3+的耐受性。
32.来自权利要求31的转基因植物的植物部分,其中所述植物部分含有重组构建体。
33.权利要求32的转基因植物的转基因种子。
34.权利要求33的种子,其中所述种子与野生型种子品种相比为铝耐受性提高的纯种。
35.在植物中调节Al3+耐受性的方法,所述方法包括将权利要求1的核酸序列导入到植物或植物细胞中,然后使所述核酸序列在所述植物或植物细胞中表达。
36.权利要求35的方法,其中所述植物为单子叶植物。
37.权利要求35的方法,其中所述植物为双子叶植物。
38.在植物或植物细胞中操控对Al3+耐受的方法,所述方法包括将至少一个重组构建体导入植物,所述构建体包含与驱动在植物细胞中表达的调控元件可操作地连接的cDNA,其中所述cDNA选自:
(a)包含编码多肽的序列的分离的核酸,所述多肽的氨基酸序列具有与具有SEQ ID NO:4所示的序列的多肽至少95%的全序列同一性;和
(b)分离的核酸,所述核酸包含编码具有SEQ ID NO:4所示的序列的多肽的序列。
39.在植物或植物细胞中操控对Al3+耐受的方法,所述方法包括将至少一个重组构建体导入植物,所述构建体包含与驱动在植物细胞中表达的调控元件可操作地连接的cDNA,其中所述cDNA为分离的核酸,所述核酸包含编码多肽的序列,所述多肽的氨基酸序列具有与具有SEQ ID NO:4所示序列的多肽至少53%的全序列同一性,所述被编码的多肽在Al存在下实施Al诱导的根生长,并且编码所述被编码的多肽的所述核酸在Al耐受型植物的根尖中表达。
40.在植物或植物细胞中操控对Al3+耐受的方法,所述方法包括将至少一个重组构建体导入植物,所述构建体包含与驱动在植物细胞中表达的调控元件可操作地连接的cDNA,其中所述cDNA为分离的核酸,所述核酸包含编码多肽的序列,所述多肽的氨基酸序列具有与具有SEQ ID NO:4所示序列的多肽至少64%的全序列同一性,所述被编码的多肽在Al存在下实施Al诱导的根生长,并且编码所述被编码的多肽的所述核酸在Al耐受型植物的根尖中表达。
41.在植物细胞中表达SbMATE蛋白的方法,其中所述植物细胞为拟南芥、小麦、玉米、高梁或水稻的细胞。
42.产生植物的方法,所述植物与野生型植物品种相比具有提高的铝耐受性,所述方法包括:提供能够再生的植物细胞;用编码SbMATE蛋白的DNA分子转化所述植物细胞;在植物细胞生长条件下培养所述植物细胞;从所述植物细胞再生植物;和观察所述DNA分子在所述植物中的表达,藉此所述DNA分子以足以产生铝耐受型植物的水平表达。
43.权利要求42的方法,其中所述编码SbMATE蛋白的DNA区段具有与SEQ ID NO:4至少95%的序列同一性。
44.产生植物的方法,所述植物与野生型植物品种相比具有提高的铝耐受性,所述方法包括:提供能够再生的植物细胞;用重组构建体转化所述植物细胞,所述构建体包含在所述植物细胞中可操作的调控元件,所述调控元件与编码SbMATE蛋白的DNA分子可操作地连接;在植物细胞生长条件下培养所述植物细胞;从所述植物细胞再生植物;和观察所述DNA分子在所述植物中的表达,藉此所述DNA分子以足以产生铝耐受型植物的水平表达。
45.权利要求44的方法,其中所述编码SbMATE蛋白的DNA区段具有与SEQ ID NO:4至少95%的序列同一性。
46.权利要求44的方法,其中所述编码SbMATE蛋白的DNA区段为分离的核酸,所述核酸包含编码多肽的序列,所述多肽的氨基酸序列具有与具有SEQ ID NO:4所示序列的多肽至少53%的全序列同一性,所述被编码的多肽在Al存在下实施Al诱导的根生长,并且编码所述被编码的多肽的所述核酸在Al耐受型植物的根尖中表达。
47.权利要求44的方法,其中所述编码SbMATE蛋白的DNA区段为分离的核酸,所述核酸包含编码多肽的序列,所述多肽的氨基酸序列具有与具有SEQ ID NO:4所示序列的多肽至少64%的全序列同一性,所述被编码的多肽在Al存在下实施Al诱导的根生长,并且编码所述被编码的多肽的所述核酸在Al耐受型植物的根尖中表达。
48.产生遗传转化的植物的方法,其中所述方法包括以下步骤:
(a)克隆或合成编码Al诱导的柠檬酸外排转运蛋白多肽的核酸分子,其中所述核酸分子选自:(i)SEQ ID NO:1中所示的核酸分子或其互补序列;(ii)编码SEQ ID NO:4的核酸分子;和(iii)编码具有与SEQID NO:4所示的氨基酸序列至少95%同一性的氨基酸序列的核酸分子,其中所述核酸分子编码能够为植物提供铝耐受性的多肽;
(b)将所述核酸分子插入到载体中,以使所述核酸分子可操作地连接启动子;
(c)将所述载体插入到植物细胞或植物种子中;
(d)从所述植物细胞或植物种子再生植物,其中与野生型植物相比所述植物中铝耐受性提高。
49.权利要求48的方法所产生的转基因植物。
CN200880025002.9A 2007-05-17 2008-05-09 高粱铝耐受基因SbMATE Active CN101883572B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US11/804,164 2007-05-17
US11/804,164 US7582809B2 (en) 2007-05-17 2007-05-17 Sorghum aluminum tolerance gene, SbMATE
PCT/US2008/063216 WO2008144257A2 (en) 2007-05-17 2008-05-09 The sorghum aluminum tolerance gene, sbmate

Publications (2)

Publication Number Publication Date
CN101883572A true CN101883572A (zh) 2010-11-10
CN101883572B CN101883572B (zh) 2015-05-06

Family

ID=40028875

Family Applications (1)

Application Number Title Priority Date Filing Date
CN200880025002.9A Active CN101883572B (zh) 2007-05-17 2008-05-09 高粱铝耐受基因SbMATE

Country Status (6)

Country Link
US (1) US7582809B2 (zh)
EP (1) EP2155219B1 (zh)
CN (1) CN101883572B (zh)
AU (1) AU2008254261A1 (zh)
HK (1) HK1140952A1 (zh)
WO (1) WO2008144257A2 (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108728449A (zh) * 2018-06-05 2018-11-02 中国农业科学院棉花研究所 棉花基因GhDTX27在植物耐盐、干旱和冷胁迫方面的应用
CN116716311A (zh) * 2023-05-12 2023-09-08 中国热带农业科学院热带作物品种资源研究所 狗牙根铝响应基因及其引物和克隆方法

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9938536B2 (en) 2011-11-02 2018-04-10 Ceres, Inc. Transgenic plants having increased tolerance to aluminum
CN108410880B (zh) * 2018-01-26 2021-10-22 昆明理工大学 一种丹波黑大豆柠檬酸转运蛋白基因及其应用

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1179630C (zh) * 2002-01-15 2004-12-15 湖北大学 用生物工程培育适应含铝酸性红壤生长的油菜品系的方法

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108728449A (zh) * 2018-06-05 2018-11-02 中国农业科学院棉花研究所 棉花基因GhDTX27在植物耐盐、干旱和冷胁迫方面的应用
CN116716311A (zh) * 2023-05-12 2023-09-08 中国热带农业科学院热带作物品种资源研究所 狗牙根铝响应基因及其引物和克隆方法

Also Published As

Publication number Publication date
EP2155219A2 (en) 2010-02-24
AU2008254261A1 (en) 2008-11-27
WO2008144257A2 (en) 2008-11-27
HK1140952A1 (zh) 2010-10-29
EP2155219B1 (en) 2014-02-19
US7582809B2 (en) 2009-09-01
US20080289062A1 (en) 2008-11-20
EP2155219A4 (en) 2010-07-21
CN101883572B (zh) 2015-05-06
WO2008144257A3 (en) 2009-04-02

Similar Documents

Publication Publication Date Title
US11130958B2 (en) Plants having increased tolerance to heat stress
CN101855355B (zh) 具有提高的产量相关性状的植物和用于制备该植物的方法
CN102656270B (zh) 具有增强的产量相关性状的植物和用于产生该植物的方法
CN102803291B (zh) 具有增强的产量相关性状和/或增强的非生物胁迫耐受性的植物和制备其的方法
CN107602681B (zh) 水稻粒宽基因gw5l及其应用
CN105087634A (zh) 具有增强的产量相关性状的nac转录因子受调节表达的植物和用于产生该植物的方法
CN105112441A (zh) 具有增强的产量相关性状的植物和用于产生该植物的方法
CN101365786A (zh) 具有改良的生长特征的植物及其生产方法
CN104869808A (zh) 控制玉蜀黍和高粱的光周期敏感性的基因以及所述基因的用途
CN104093842A (zh) 改善植物耐旱性、氮利用效率和产量
MX2013001225A (es) Metodo para incrementar resistencia contra roya de soya en plantas transgenicas por gen adr-1.
CN103451228B (zh) 一种调控水稻籽粒大小和粒重的方法
CN105063063A (zh) 具有增强的产量相关性状的植物和用于制备该植物的方法
CN101484465A (zh) 控制植物生长和器官大小的玉米基因及其在改良作物植物中的应用
CN104903444A (zh) 对植物赋予高产性的核酸、制备产量增加的转基因植物的方法、使植物的产量增大的方法
CN101589147A (zh) 改善农作物的植物生长、蒸腾效率和耐旱性的玉米erecta基因
CN101981051A (zh) 参与非生物胁迫耐受的转录激活因子
CN103172715B (zh) 植物表皮毛调控基因及其用途
CN101874116B (zh) 具有增强的产量相关性状的植物及其生产方法
CN101413006B (zh) 一种干旱诱导的水稻花特异性启动子及其应用
CN101883572A (zh) 高粱铝耐受基因SbMATE
US20130152231A1 (en) Functional expression of yeast nitrate transporter (ynt1) in maize to improve nitrate uptake
CN101784656B (zh) 来自紫菜属的硝酸还原酶,组成及其使用方法
CN102471779A (zh) 使用二聚化结构域组分堆叠以调节植株构造
CN101142318B (zh) 细胞数目多核苷酸和多肽以及使用其的方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant