CN101784656A - 来自紫菜属的硝酸还原酶,组成及其使用方法 - Google Patents

来自紫菜属的硝酸还原酶,组成及其使用方法 Download PDF

Info

Publication number
CN101784656A
CN101784656A CN200880103062A CN200880103062A CN101784656A CN 101784656 A CN101784656 A CN 101784656A CN 200880103062 A CN200880103062 A CN 200880103062A CN 200880103062 A CN200880103062 A CN 200880103062A CN 101784656 A CN101784656 A CN 101784656A
Authority
CN
China
Prior art keywords
plant
polynucleotide
sequence
polypeptide
gene
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN200880103062A
Other languages
English (en)
Other versions
CN101784656B (zh
Inventor
D·F·卢塞尔特
D·奥奈尔
C·R·西蒙斯
H·王
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Pioneer Hi Bred International Inc
Original Assignee
Pioneer Hi Bred International Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Pioneer Hi Bred International Inc filed Critical Pioneer Hi Bred International Inc
Publication of CN101784656A publication Critical patent/CN101784656A/zh
Application granted granted Critical
Publication of CN101784656B publication Critical patent/CN101784656B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8241Phenotypically and genetically modified plants via recombinant DNA technology
    • C12N15/8261Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8241Phenotypically and genetically modified plants via recombinant DNA technology
    • C12N15/8242Phenotypically and genetically modified plants via recombinant DNA technology with non-agronomic quality (output) traits, e.g. for industrial processing; Value added, non-agronomic traits
    • C12N15/8243Phenotypically and genetically modified plants via recombinant DNA technology with non-agronomic quality (output) traits, e.g. for industrial processing; Value added, non-agronomic traits involving biosynthetic or metabolic pathways, i.e. metabolic engineering, e.g. nicotine, caffeine
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/0004Oxidoreductases (1.)
    • C12N9/0012Oxidoreductases (1.) acting on nitrogen containing compounds as donors (1.4, 1.5, 1.6, 1.7)
    • C12N9/0036Oxidoreductases (1.) acting on nitrogen containing compounds as donors (1.4, 1.5, 1.6, 1.7) acting on NADH or NADPH (1.6)
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A40/00Adaptation technologies in agriculture, forestry, livestock or agroalimentary production
    • Y02A40/10Adaptation technologies in agriculture, forestry, livestock or agroalimentary production in agriculture
    • Y02A40/146Genetically Modified [GMO] plants, e.g. transgenic plants

Landscapes

  • Health & Medical Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Chemical & Material Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Organic Chemistry (AREA)
  • Biotechnology (AREA)
  • Wood Science & Technology (AREA)
  • Zoology (AREA)
  • Molecular Biology (AREA)
  • Biomedical Technology (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Biochemistry (AREA)
  • Microbiology (AREA)
  • Plant Pathology (AREA)
  • Cell Biology (AREA)
  • Physics & Mathematics (AREA)
  • Biophysics (AREA)
  • Medicinal Chemistry (AREA)
  • Nutrition Science (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Breeding Of Plants And Reproduction By Means Of Culturing (AREA)
  • Enzymes And Modification Thereof (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)

Abstract

本文描述的NR酶发现于红藻Porphyra perforata(PpNR)和条斑紫菜(Porphyra yezoensis(PyNR))。本发明提供了涉及改变植物中的NR活性,氮利用和/或摄取的方法和组成。本发明涉及用于在低氮肥力的条件下具有保持的或增加的产量的植物生产方法。本发明提供了分离的硝酸还原酶(NR)核酸和它们编码的蛋白质。本发明进一步提供了重组表达盒、宿主细胞、和转基因植物。用编码NR酶的核苷酸序列转化的植物显示了改善的特性,例如增加的产量和生长。

Description

来自紫菜属的硝酸还原酶,组成及其使用方法
背景技术
许多植物的驯化与产量的极大提高相关。负责驯化的植物中产量的极大差异的特定基因的鉴定已经成为农业研究的重要焦点。
影响产量的基因的一个群是硝酸还原酶基因。这些基因用于提高作物植物,尤其是玉蜀黍中的氮的利用。所述基因可以用于改变植物的遗传组成,使得它们以目前的施肥标准可以更多产,或者以显著减少的肥料输入维持它们的生产率。提高的氮应用效率可以起因于氮肥的增强的摄取和同化和/或积聚的氮储备的后来的再流通和再利用。因此包含这些基因的植物可以用于提高产量。在氮肥的获得受限的发展中国家中和在氮利用的水平维持较高的发达国家中,提高玉米中的氮利用效率将提高每个单位的输入氮肥的玉米可收获的产量。氮利用的提高还允许降低农场上的输入成本(on-farm input costs)、降低对氮肥生产所需的不可再生能源的利用和依赖、以及降低氮肥制造和农业应用对环境的影响。
近来已经付出了很多努力来通过植物中硝酸还原酶(NR)的过表达改善作物植物的氮效率。有一组研究人员已经应用了白花丹叶烟草(Nicotiana plumbaginifolia)&拟南芥菜(Arabidopsis thaliana)NR cDNA或基因在不同启动子例如35S CaMV(白花丹叶烟草)控制之下的表达。Ferrario,et al.,(1995)“Efiects of constitutive expressionof nitrate reductase in transgenic Nicotiana plumbaginifolia L.inresponse to varying nitrogen supply”Planta 196:288-294;andLhcb1*3::Nia1*2(Arabidopsis thaliana)Nejidat,et al.,(1997)“Increased protein content in transgenic Arabidopsis Thalinaover-expressing nitrate reductase activity”Plant Science 130:41-49。(参考文献)。尽管利用白花丹叶烟草植物中的35S CaMV::Nia-2基因检测到NR表达水平增加最多2-5倍((Foyer,et al.,(1994)“Adaptations of photosynthetic electron transport,carbon assimilationand carbon partionng in transgenic Nicotiana plumbaginifolia plants tochanges in nitrate reductase activity”Plant Physiol.104:171-178),但没有观察到改善的氮效率。所有这些过表达这种酶的努力都没有导致在较低氮肥力(nitrogen fertility)下改善的生长。
因此,尽管存在一些改善NR效率的努力,仍然没有提供导致生长,生产率和/或农业作物植物产量的改善的令人满意的组合物或方法。由于这些和其它原因,存在对于本发明的需要。
发明简述
本发明提供了当前NR序列的多核苷酸、相关多肽和所有保守修饰的变体。本发明提供了NR基因的序列。
本发明提出了改变作物植物,尤其是玉蜀黍的遗传组成的方法,以便这样的作物可以以目前的施肥更多产和/或以显著减少的肥料输入同样多产。因而本发明的这类应用不仅产量提高,而且肥料成本降低,相应的对环境的影响减小。
因此,在一个方面,本发明涉及包含编码NR基因的分离的多核苷酸序列的分离的核酸。本发明的一个实施方式是包含选自由以下构成的组的核苷酸序列的分离的多核苷酸:(a)包含SEQ ID NO:1、2、3、4、5或6的核苷酸序列;;以及(c)包含与SEQ ID NO:1、2、3、4、5或6具有至少70%的序列同一性的核苷酸序列,其中所述多核苷酸编码具有增加的NR活性的多肽。
本发明的组成包括包含选自由下列组成的组的氨基酸序列的分离的多肽:(a)包含SEQ ID NO:7、8、9、10、11或12的氨基酸序列以及(b)包含与SEQ ID NO:7、8、9、10、11或12具有至少70%的序列同一性的氨基酸序列,其中所述多肽具有增加的NR活性。
在另一方面,本发明涉及包含所述的核酸的重组表达盒。另外,本发明涉及包含所述重组表达盒的载体。此外,包含所述重组表达盒的所述载体可以促进宿主细胞中所述核酸的转录和翻译。本发明还涉及能够表达本发明的多核苷酸的宿主细胞。可以使用许多宿主细胞,例如但不限于,微生物、哺乳动物、植物、或昆虫。
在另一实施方式中,本发明针对转基因植物或植物细胞,包含本发明的核酸。包含本发明的多核苷酸的优选的植物包括而不限于:玉蜀黍(maize)、大豆、向日葵、高粱、油菜(canola)、小麦、苜蓿、棉花、稻、大麦、番茄、及黍(millet)。在另一实施方式中,所述转基因植物是玉蜀黍植物或植物细胞。另一实施方式是来自可操作地连接到驱动在植物中的表达的启动子的本发明的转基因NR多肽的转基因种子。本发明的植物可以具有与对照植物相比改变的NR。在一些植物中,NR在营养组织、再生组织、或者营养组织和再生组织中是改变的。本发明的植物可以具有下列表型的至少一个,所述表型包括而不限于:提高的根质量、提高的根长度、提高的叶子大小、提高的穗(ear)大小、提高的种子大小、提高的胚乳大小、和提高的生物量。
本发明的另一实施方式将是在基因组基因座处被遗传修饰的植物,其中所述基因组基因座编码本发明的NR多肽。
提供了用于提高植物中NR多肽的活性的方法。所述方法可以包括将本发明的NR多核苷酸引入植物中。
提供了用于减少或消除植物中NR多肽的水平的方法。所述多肽的水平或活性还可以在特定组织中被减少或消除,造成植物生长,生长速率或氮利用效率(NUE)的改变。减少NR多肽的水平和/或活性可以导致植物的较小的高度(stature)或较慢的生长。
附图简述
本发明可从下列详细描述和构成本申请一部分的所附附图和序列表被更充分地理解。
图1.Porphyra perforata(PpNR SEQ ID NO:5)和条斑紫菜(P.yezoensis)(PyNR SEQ ID NO:10)之间的肽序列比较。PpNR和PyNR具有大约94%同一性。相同的氨基酸残基为粗体形式,类似的氨基酸为下划线形式。
图2.从Pichia angusta中基于已公开的序列(GenBank登录号Z69783)克隆的酵母硝酸转运蛋白YNT1。来自巴斯德毕赤酵母(P.pastoris)的组成性启动子甘油醛-3-磷酸脱氢酶(GAP)驱动的具有组氨酸营养缺陷型选择标记物的YNT1(p3.5GAP-YNT1)利用毕赤酵母EasyComp转化试剂盒(Invitrogen)被整合入巴斯德毕赤酵母菌株KM71(Invitrogen)的His4基因座。通过PCR,重组菌株被确认为携带YNT1表达盒。包含YNT1的KM71系被利用被GAP启动子驱动的具有zeocin选择标记物的来自Porphyra perforate的硝酸还原酶基因PPNR(pAOXGAP-PPNR)重转化,所述基因整合入巴斯德毕赤酵母基因组的AOX1基因座。体内测定硝酸还原酶活性。30℃下在丰富培养基(YPD)中培养四种转化体和KM71野生型过夜。收集酵母细胞并且用水洗涤两次,然后重悬浮在含有5mM NaNO3的20uM MOPS,pH6.5和1%葡萄糖中。30℃温育1小时之后,收集上清液用于亚硝酸盐测定,所述亚硝酸盐测定利用1%磺胺,0.01%N-(1-萘基)亚乙基-二胺二盐酸盐和15%(v/v)H3PO4进行。与KM71野生型菌株相比,在携带PPNR的转化体中检测到强的NR活性。
图3.利用被GAP启动子驱动的具有Zeocin选择标记物的来自条斑紫菜的硝酸还原酶基因PYNR(pAOXGAP-PYNR)重转化包含YNT1的KM71系(见图2),所述基因整合入巴斯德毕赤酵母基因组的AOX1基因座。在本例子中,如前体内测定来自两种转化体和KM71野生型的硝酸还原酶活性。检测来自携带PYNR的转化体的NR活性,与KM71野生型菌株比较。然而,PYNR活性比巴斯德毕赤酵母中的PPNR弱得多。
图4.从Pichia angusta基于已公开的序列(GenBank登录号Z49110)克隆酵母硝酸还原酶YNR1。利用被GAP启动子驱动的具有Zeocin选择标记物的硝酸还原酶基因YNR1(pAOXGAP-YNR1)重转化包含YNT1的KM71系,所述基因整合入巴斯德毕赤酵母基因组的AOX1基因座。具有最佳Vmax的转化体被用于动力学研究。
基于已公开的基因组序列(GenBank登录号AF153448)从玉蜀黍B73(从两种截短的EST组装)克隆玉蜀黍硝酸还原酶ZmNR。克隆的ZmNR相对于AF153448具有三个不同的氨基酸残基。利用被GAP启动子驱动的具有Zeocin选择标记物的硝酸还原酶基因ZMNR(pAOXGAP-ZMNR)重转化包含YNT1的KM71系,所述基因整合入巴斯德毕赤酵母基因组的AOX1基因座。具有最佳Vmax的转化体被用于动力学研究。
携带YNT1/YNR1,YNT1/ZMNR,或YNT1/PPNR的转化体和KM71野生型在丰富培养基(YPD)中在30℃下培养过夜。收集酵母细胞并且用水洗涤两次,然后重悬浮在包含从0直至30mM的24种不同浓度的NaNO3(0,0.02,0.04,0.06,0.08,0.1,0.12,0.14,0.16,0.18,0.2,0.3,0.4,0.6,0.8,1,2,4,8,10,15,20,25和30mM)的具有1%葡萄糖的20μM MOPS,pH6.5,或20μM MES,pH5.5,或20μM Tris,pH7.5中。如上所述测定还原的亚硝酸盐。评价1/2Vmax时的底物浓度为Km。YNR1,ZMNR,和PPNR的Km和优选的PH(具有最佳Vmax)总结在表中。请注意尽管该图表显示了YNR1为该表中最低的系,但仅仅只有十分之一体积的YNR1材料用于本实验,因此YNR1具有本实验中最佳的Vmax。
图5.建立了由UBI启动子和/或玉蜀黍硝酸还原酶ZMNR启动子驱动的PPNR和PYNR构建体。产生的构建体PHP27800,PHP27801,PHP28335,和PHP28334被用于玉蜀黍转化。对于UBI:Porphyraperforata NR 1∶1分离的转基因玉蜀黍在维持1mM KNO3作为唯一氮源的水栽培养基中生长至开花。在生长过程中鉴定包含转基因的植物。所有植物在开花不久之后收获。分离穗和其余植物,在鼓风箱中在70℃干燥72hr并且称重。每一事件的转基因植物的平均穗干重与对应无效物(null)的穗干重进行比较。对于转基因平均植物干重与对应的事件无效物进行类似的比较。用*标记的比较是统计学显著的(p>t=0.1)。该图是实施例10描述的数据的图示。
序列简述
本申请提供了如下表1所示的NR序列的细节。
表1
  SEQ IDNO:   多核苷酸(pnt)或多肽(ppt)   长度   鉴定
  1   pnt   2865   PpNR.
  2   pnt   2865   编码PpNR S561Ala的密码子优化的多核苷酸序列
  3   pnt   2865   编码PpNR S561Asp的密码子优化的多核苷酸序列
  4   pnt   2871   PyNR
  5   pnt   2871   编码PyNR S563Ala的密码子优化的多核苷酸序列
  6   pnt   2871   编码PyNR S563Asp的密码子优化的多核苷酸序列
  7   ppt   954   PpNR.
  8   ppt   954   PpNR S561Ala-被密码子优化的多核苷酸编码
  9   ppt   954   PpNR S561Asp-被密码子优化的多核苷酸编码
  10   ppt   954   PyNR
  11   ppt   956   PyNR S563Ala-被密码子优化的多核苷酸编码
  12   ppt   956   PyNR S563Asp-被密码子优化的多核苷酸编码
 SEQ ID NO:  多核苷酸(pnt)或多肽(ppt)   长度   鉴定
  13   pnt   26   PYNR有义引物
  14   pnt   20   PYNR反义引物
  15   pnt   20   PpNR步移引物
  16   pnt   20   PpNR步移引物
  SEQ IDNO:   多核苷酸(pnt)或多肽(ppt)   长度   鉴定
  17   pnt   20   PpNR步移引物
  18   pnt   25   PpNR步移引物
  19   pnt   24   PpNR步移引物
  20   pnt   25   PpNR步移引物
  21   pnt   21   ORF PpNR有义引物
  22   pnt   21   ORF PpNR反义引物
  23   pnt   19   ORF PyNR有义引物
  24   pnt   22   ORF PyNR反义引物
优选实施方式的详细描述
除非另外定义,本文所用的所有技术和科学术语具有本发明所属领域的普通技术人员通常理解的相同的含义。除非另外提及,本文所用的或预期的技术是本领域普通技术人员熟知的标准方法。材料、方法和实施例仅是示意性的而非限制性的。下文以示意的方式呈现而不试图限制本发明的范围。
本发明现在将参照附图在下文中更充分的描述,其中示出了本发明的一些,但不是全部的实施方式。实际上,这些发明可以以许多不同的形式体现并且不应当解释为限于本文陈述的实施方式;更确切地,提供了这些实施方式以便这个披露将满足可应用的法律要求。全文相同的数字指的是相同的元件。
利用前面描述和相关附图的教导,这些发明所属领域的技术人员将想到本文陈述的本发明的许多修改和其他实施方式。因此,可以理解本发明不限于披露的具体实施方式并且修改和其他实施方式意图包括在所附权利要求的范围内。虽然本文采用特定的术语,但是它们仅以一般和描述性的意义使用,并不为了限制。
综述
硝酸盐是高等植物的最重要的氮源。硝酸盐被根吸收,转运到植物的多种组织并且然后以两个步骤还原为氨水。第一步骤需要酶硝酸还原酶(NR),其在胞质中催化硝酸盐还原为亚硝酸盐。在第二步骤中,亚硝酸盐然后在叶绿体中被亚硝酸还原酶还原。硝酸盐的还原被认为是植物中硝酸盐代谢的限制性步骤。
植物硝酸盐还原酶在转录和翻译后水平被调节。若干种环境因素例如光或硝酸盐在转录水平调节NR基因表达。NR活性也被光在翻译后水平调节。NR响应于黑暗/光明通过在推定的Ser残基的磷酸化/去磷酸化成为无活性的/活性的。无活性形式的NR在黑暗中结合14-3-3蛋白。推定的调节位点包括N-末端区域(Plant Cell(1995)7:611-621),铰链1(Plant J.(2003)35:566-573)和其它区域。
本发明涉及来自红藻(红藻(Rhodophyta)门)Porphyra perforate(PpNR)和条斑紫菜(Porphyra yezoensis(PyNR))的新的NR的发现。如本文所述,发明人已经鉴定了红藻中两种新的NR cDNA,其相互共享大约94%的氨基酸共有序列,但是与来自B73的NR玉蜀黍同系物(Genbank Acc NoAF153448)仅仅具有52%的氨基酸同一性。本发明的藻NR多核苷酸长度是2865bp(PpNR)和2871bp(PyNR)个核苷酸,编码计算分子量为104.9KDa(PpNR)和105.2KDa(PyNR)的多肽。还预期的是这些序列的变体。例如,突变在推定的磷酸化基序R/K-S/T-X-pS-X-P(J of Experimental Botany(2004)55:1275-1282)中位点561的丝氨酸残基为PpNR的丙氨酸或天冬氨酸,或者PyNR序列的位点563的丙氨酸或天冬氨酸,被认为在转基因植物中增加和保持了高水平的活性形式的硝酸还原酶以促进硝酸盐同化。
红藻(红藻门)Porphyra perforate(PpNR)和条斑紫菜(Porphyrayezoensis(PyNR))在植物能够生长的硝酸盐浓度的大约一百分之一的硝酸盐浓度下生长。这些红藻具有比高等植物硝酸还原酶在更低的底物浓度下饱和的更有效的硝酸还原酶。特别是,Porphyra perforate和条斑紫菜已经在文献中被报道具有对于硝酸盐具有低Km(30-65μM)的NR酶。这与对于硝酸还原酶具有300μM的Km的来自B73的玉蜀黍NR形成对比。在巴斯德毕赤酵母中表达的PpNR和PyNR的体内动力学测量显示该酶对于硝酸盐具有30-50μM的Km,与玉蜀黍硝酸还原酶Km为200μM形成对比。不希望被理论限制,据信表达比高等植物NR酶在更低底物浓度下饱和的更有效的NR将在氮还原中更有效。本发明的NR的调节将提供操控植物的氮利用效率(NUE)的机制。相应地,本发明提供了用于生产在有限的氮供应下具有改善的或保持的产量的植物的方法,多核苷酸和多肽。在一个方面,本方法包括向植物细胞,植物组织或植物导入一种或更多种编码具有硝酸还原酶酶活性的NR多肽的多核苷酸。这可通过将被组成性启动子或叶肉细胞优选的启动子驱动的硝酸还原酶多核苷酸导入植物核基因组而完成。
有利地,表达本发明NR的植物将通过降低投入费用和/或在显著降低应用的氮肥的情况下增加产量而提供用户增加的收入。而且,甚至在不良的生长条件下,例如氮被有限供应时,表达本发明NR的植物中产量可保持或增加。
除非另外表明,本发明的实施将采用植物学、微生物学、组织培养、分子生物学、化学、生物化学和重组DNA技术的常规技术,其在本领域的技术范围内。这样的技术在文献中被充分地解释。参见,例如,Langenheim and Thimann,(1982)Botany:Plant Biology and ItsRelation to Human Affairs,John Wiley;Cell Culture and Somatic CellGenetics of Plants,vol.1,Vasil,ed.(1984);Stanier,et al.,(1986)TheMicrobial World,5th ed.,Prentice-Hall;Dhringra and Sinclair,(1985)Basic Plant Pathology Methods,CRC Press;Maniatis,et al.,(1982)Molecular Cloning:A Laboratory Manual;DNA Cloning,vols.I and II,Glover,ed.(1985);Oligonucleotide Synthesis,Gait,ed.(1984);NucleicAcid Hybridization,Hames and Higgins,eds.(1984);及the seriesMethods in Enzymology,Colowick and Kaplan,eds,Academic Press,Inc.,San Diego,CA。
单位、前缀、和符号可以以它们的SI认可的形式表示。除非另外说明,分别地,核酸从左到右以5’到3’方向书写;氨基酸序列从左到右以氨基到羧基方向书写。数字范围包括限定范围的数字。氨基酸可以以它们通常已知的三字母符号或由IUPAC-IUB BiochemicalNomenclature Commission推荐的一-字母符号在本文中提及。同样地,核苷酸可以以它们通常认可的单字母密码提及。下面定义的术语参照说明书作为整体更充分地定义。
定义.
在描述本发明中,下面的术语将被采用,并意图如下所示被定义。
“微生物体(microbe)”是指任何微生物(包括真核和原核微生物),如真菌、酵母、细菌、放线菌、藻类和原生动物、以及其它单细胞结构。
“扩增”指的是核酸序列的多个拷贝或互补于所述核酸序列的多个拷贝的构建,其利用所述核酸序列的至少一个作为模板。扩增系统包括聚合酶链反应(PCR)系统、连接酶链反应(LCR)系统、基于核酸序列的扩增(NASBA,Cangene,Mississauga,Ontario)、Q-Beta复制酶系统、基于转录的扩增系统(TAS)、以及链置换扩增(SDA)。参见,例如,Diagnostic Molecular Microbiology:Principles and Applications,Persing,et al.,eds.,American Society for Microbiology,Washington,DC(1993)。扩增产物被称为扩增子。
术语“保守修饰的变体”应用于氨基酸和核酸序列。关于特定的核酸序列,保守修饰的变体指的是编码相同或保守修饰的变体的氨基酸序列的那些核酸。因为遗传密码的简并性,许多功能相同的核酸编码任何给定蛋白质。例如,密码子GCA、GCC、GCG和GCU均编码氨基酸丙氨酸。因此,在丙氨酸由密码子表示的每一位置,所述密码子可以被改变为所述相应密码子的任何一个,而不改变编码的多肽。这样的核酸变异为“沉默变异”,并代表一种保守修饰的变异。本文编码多肽的每个核酸序列也描述了所述核酸的每个可能的沉默变异。普通技术人员将认识到核酸中的每个密码子(除了AUG,其通常是甲硫氨酸的唯一密码子;一个例外是红色微球菌(Micrococcusrubens),对于其GTG是甲硫氨酸密码子(Ishizuka,et al.,(1993)J.Gen.Microbiol.139:425-32))可以被修饰以产生功能相同的分子。因此,核酸的每个沉默变异,其编码本发明的多肽,在每个描述的多肽序列中是隐含的,并且以引用方式并入本文。
至于氨基酸序列,技术人员将认识到改变、添加或缺失编码的序列中的单一氨基酸或小百分比的氨基酸的核酸、肽、多肽、或蛋白质序列的单独的替换、缺失或添加在改变导致氨基酸被化学相似的氨基酸替换时是“保守修饰的变体”。因此,选自由1到15组成的整数的组的任何数量的氨基酸残基可以被这样改变。因此,例如,可以进行1、2、3、4、5、7或10个改变。保守修饰的变体通常提供与它们来源的未修饰的多肽序列相似的生物学活性。例如,底物特异性、酶活性、或配体/受体结合通常为天然蛋白质对其天然底物的至少30%、40%、50%、60%、70%、80%或90%,优选60-90%。提供功能相似的氨基酸的保守替换表在本领域是熟知的。
下面的六个组,每个包含对于另一个是保守的替换的氨基酸:
1)丙氨酸(A)、丝氨酸(S)、苏氨酸(T);
2)天冬氨酸(D)、谷氨酸(E);
3)天冬酰胺(N)、谷氨酰胺(Q);
4)精氨酸(R)、赖氨酸(K);
5)异亮氨酸(I)、亮氨酸(L)、甲硫氨酸(M)、缬氨酸(V);以及
6)苯丙氨酸(F)、酪氨酸(Y)、色氨酸(W)。
还参见,Creighton,Proteins,W.H.Freeman and Co.(1984)。
如本文所用的,“基本上由...组成”指的是包括除了目标多核苷酸的另外的序列,其中所述另外的序列在严格的杂交条件下不选择性地杂交到与所述多核苷酸相同的cDNA,并且其中所述杂交条件包括在65℃在0.1XSSC和0.1%十二烷基硫酸钠中的冲洗步骤。
关于指定核酸的“编码”或“编码的”指的是包含用于翻译成指定蛋白质的信息。编码蛋白质的核酸可以包含核酸的翻译区内的非翻译序列(例如,内含子),或者可以缺乏这样的插入非翻译序列(例如,如在cDNA中)。蛋白质被编码的信息通过利用密码子表示。通常,利用“通用”遗传密码由核酸编码氨基酸序列。然而,通用密码的变体,如在一些植物、动物、及真菌线粒体、细菌山羊支原体(Mycoplasma capricolum)(Yamao,et al.,(1985)Proc.Natl.Acad.Sci.USA 82:2306-9)、或者纤毛虫Macronucleus中存在的,在核酸利用这些有机体被表达时,可以使用。
当核酸被合成地制备或改变时,可以利用核酸要被表达的预定宿主的已知密码子偏好。例如,虽然本发明的核酸序列可以在单子叶植物和双子叶植物物种中表达,序列可以被修饰以说明单子叶植物或双子叶植物的特殊密码子偏好和GC含量偏好,因为这些偏好已经显示出不同(Murray,et al.,(1989)Nucleic Acids Res.17:477-98,以引用方式并入本文中)。因此,用于特定氨基酸的玉蜀黍偏好的密码子可以源自来自玉蜀黍的已知基因序列。来自玉蜀黍植物的28个基因的玉蜀黍密码子选择在上面Murray,et al.的表4中列出。
如本文所用的,关于核酸的“异源的”是起源于外来物种的核酸,或者如果起源于相同的物种,是通过故意的人类干预在组成和/或基因组基因座上从其天然形式实质性地(substantially)被修饰的核酸。例如,可操作地连接到异源结构基因的启动子是来自与结构基因来源的物种不同的物种,或者,如果来自相同的物种,一个或两个均实质上从它们的起源形式被修饰。异源蛋白质可以起源于外来物种,或者,如果来自相同物种,通过故意的人类干预从其起源形式实质性地被修饰。
“宿主细胞”是指这样的细胞,其包括本发明的异源核酸序列,其包含载体并支持所述表达载体的复制和/或表达。宿主细胞可以为原核细胞,如大肠杆菌(E.coli),或者真核细胞,如酵母、昆虫、植物、两栖动物、或哺乳动物细胞。优选地,宿主细胞为单子叶或双子叶植物细胞,包括而不限于玉蜀黍、高粱、向日葵、大豆、小麦、苜蓿、稻、棉花、油菜、大麦、黍、及番茄。特别优选的单子叶宿主细胞是玉蜀黍宿主细胞。
术语“杂交复合物”包括涉及由选择性相互杂交的两条单链核酸序列形成的双链核酸结构。
在将核酸插入细胞内的上下文中术语“引入”指的是“转染”或“转化”或“转导”并且包括涉及核酸并入真核或原核细胞,其中所述核酸可以被并入细胞的基因组中(例如,染色体、质粒、质体或线粒体DNA),转换入自主复制子,或者被瞬时表达(例如,转染的mRNA)。
术语“分离的”涉及材料,如核酸或蛋白质,其实质上或基本上不含有在其天然存在的环境中发现时通常伴随其的成分或者与其相互作用的成分。分离的材料可选地包含在其天然环境中没有伴随所述材料发现的材料。核酸,其是“分离的”,如本文所定义的,还被称为“异源”核酸。除非另外陈述,术语“NR核酸”指的是包含编码全长或部分长度的NR多肽的多核苷酸(“NR多核苷酸”)的核酸。
如本文所用的,“核酸”包括涉及单链或双链形式的脱氧核糖核苷酸或核糖核苷酸聚合物,并且除非另外限制,包括具有天然核苷酸的基本性质的已知类似物,因为它们以类似于天然存在的核苷酸的方式杂交到单链核酸(例如,肽核酸)。
“核酸文库”指的是分离的DNA或RNA分子的集合,其包括并基本上代表指定的有机体的基因组的整个转录的部分。示例性核酸文库的构建,如基因组和cDNA文库,在标准分子生物学参考文献中教导,如Berger and Kimmel,(1987)Guide To Molecular CloningTechniques,from the series Methods in Enzymology,vol.152,AcademicPress,Inc.,San Diego,CA;Sambrook,et al.,(1989)Molecular Cloning:A Laboratory Manual,2nd ed.,vols.1-3;及Current Protocols inMolecular Biology,Ausubel,et al.,eds,Current Protocols,a joint venturebetween Greene Publishing Associates,Inc.and John Wiley & Sons,Inc.(1994 Supplement)。
如本文所用的,“可操作地连接的”包括涉及第一序列(如启动子)和第二序列之间的功能性连接,其中所述启动子序列起始并介导相应于第二序列的DNA的转录。通常,可操作地连接的指的是被连接的核酸序列是邻近的,必要时将两个蛋白质编码区连接为邻近的,并且在相同的阅读框中。
如本文所用的,术语“植物”包括涉及全植物、植物器官(例如,叶子、茎、根等)、种子及植物细胞及其子代。植物细胞,如本文所用的,包括而不限于,种子、悬浮培养物、胚胎、分生组织区、愈伤组织(callus tissue)、叶子、根、枝条、配子体、孢子体、花粉、及小孢子。植物的类别,其可以用在本发明的方法中,通常与服从转化技术的高等植物的类别一样广泛,包括单子叶和双子叶植物,包括来自以下属的物种:南瓜属(Cucurbita)、蔷薇属(Rosa)、葡萄属(Vitis)、核桃属(Juglans)、草莓属(Fragaria)、百脉根属(Lotus)、苜蓿属(Medicago)、驴食豆属(Onobrychis)、车轴草属(Trifolium)、胡卢巴属(Trigonella)、豇豆属(Vigna)、柑桔属(Citrus)、亚麻属(Linum)、老鹳草属(Geranium)、木薯属(Manihot)、胡萝卜属(Daucus)、拟南芥属(Arabidopsis)、芸苔属(Brassica)、萝卜属(Raphanus)、白芥属(Sinapis)、颠茄属(Atropa)、辣椒属(Capsicum)、曼陀罗属(Datura)、天仙子属(Hyoscyamus)、番茄属(Lycopersicon)、烟草属(Nicotiana)、茄属(Solanum)、碧冬茄属(Petunia)、毛地黄属(Digitalis)、Majorana、Ciahorium、向日葵属(Helianthus)、莴苣属(Lactuca)、雀麦属(Bromus)、天门冬属(Asparagus)、金鱼草属(Antirrhinum)、Heterocallis、Nemesis、天竺葵属(Pelargonium)、Panieum、狼尾草属(Pennisetum)、毛茛属(Ranunculus)、千里光属(Senecio)、Salpiglossis、黄瓜属(Cucumis)、Browaalia、大豆属(Glycine)、豌豆属(Pisum)、菜豆属(Phaseolus)、黑麦草属(Lolium)、稻属(Oryza)、燕麦属(Avena)、大麦属(Hordeum)、黑麦属(Secale)、葱属(Allium)、及小麦属(Triticum)。特别优选的植物是玉蜀黍(Zea mays)。
如本文所用的,“产量”可以包括涉及收获的谷类作物的每英亩的蒲式耳,其对于谷粒湿度(例如,对于玉蜀黍,通常15%),以及产生的生物量的体积(用于饲料作物,如苜蓿,以及用于复种作物的植物根大小)调整过。谷粒湿度在收获的谷粒中被测量。谷粒的调整的测试重量被确定为每蒲式耳的磅重,对于收获的谷粒湿度水平是调整过的。生物量被测量为产生的可收获的植物材料的重量。
如本文所用的,“多核苷酸”包括涉及脱氧核糖多核苷酸、核糖多核苷酸、或其类似物,其具有天然核糖核苷酸的基本性质,因为它们在严格的杂交条件下杂交到与天然存在的核苷酸基本上相同的核苷酸序列和/或允许翻译为与天然存在的核苷酸相同的氨基酸。多核苷酸可以为天然或异源的结构基因或调节基因的全长或亚序列(subsequence)。除非另外指明,所述术语包括涉及指定的序列以及其互补序列。因此,具有为了稳定性或为了其它原因修饰的主链的DNA或RNA是那个术语在本文中意指的“多核苷酸”。此外,包含稀有碱基,如肌苷,或修饰的碱基,如三苯甲基化(tritylated)的碱基(仅指出两个实例)的DNA或RNA,是本文所用术语的多核苷酸。将认识到已经对DNA和RNA进行了大量修饰,其满足本领域技术人员已知的许多有用目的。本文所用的术语多核苷酸包括多核苷酸的这样的化学、酶、或代谢修饰的形式,以及病毒和细胞(包括尤其是,简单和复杂细胞)的DNA和RNA特征的化学形式。
术语“多肽”、“肽”、及“蛋白质”在本文中可交换地使用,指的是氨基酸残基的聚合物。所述术语应用于其中一个或更多个氨基酸残基为相应的天然存在的氨基酸的人工化学类似物的氨基酸聚合物、以及天然存在的氨基酸聚合物。
本文所用的“启动子”包括涉及从转录的起始的DNA上游区,并且涉及RNA聚合酶和其它蛋白质的识别和结合以引起转录。“植物启动子”是能够引起植物细胞中的转录的启动子。示例性的植物启动子包括,而不限于,那些从植物、植物病毒、及细菌(其包括在植物细胞中表达的基因,如土壤杆菌属(Agrobacterium)或根瘤菌属(Rhizobium)获得的启动子。实例是优先引起在一些组织,如叶子、根、种子、纤维(fibre)、木质部导管(xylem vessels)、管胞、或者厚壁组织中的转录的启动子。这样的启动子被称为“组织优先的”。“细胞类型”特异性启动子主要驱动在一个或更多个器官中的一些细胞类型中的表达,例如,在根或叶子中的维管细胞。“可诱导的”或“可调节的”启动子是在环境控制下的启动子。可以影响通过可诱导的启动子的转录的环境条件的实例包括厌氧条件或光的存在。另一类型的启动子是发育调节的启动子,例如,驱动在花粉发育期间的表达的启动子。组织优先的、细胞类型特异性的、发育调节的、以及可诱导的启动子组成“非组成性”启动子的类别。“组成性”启动子是在大多数环境条件下有活性的启动子,例如,泛素基因启动子UBI(GenBank登录号S94464)。
如本文所用的,术语硝酸还原酶(NR)包括但不限于本文公开的序列,例如NR,它们的保守修饰变体,不管来源,和保持NR生物学特性,例如本文所述的NR活性的任何其它变体。术语“NR多肽”指的是一个或更多个氨基酸序列。所述术语还包括其片段、变体、同系物、等位基因或前体(例如,前原蛋白(preproproteins)或蛋白原(proproteins))。“NR蛋白”包括NR多肽。除非另外说明,术语“NR核酸”意味着包含编码NR多肽的多核苷酸(“NR多核苷酸”)的核酸。
如本文可互换所用的,“NR活性”,“NR的生物学活性”或“NR的功能活性”指NR蛋白,多肽或其部分施加的根据标准技术体内或体外测定的活性。在一个方面,NR活性是硝酸盐还原为亚硝酸盐。在一个方面,NR活性包括但不限于相对于感兴趣作物植物的内源NR的NR活性,增加的硝酸盐还原速率和/或对硝酸盐的特异性,例如,对硝酸盐和NADH降低的Km,硝酸盐还原的增加的速率(Vmax)等等。在另一方面,NR活性包括但不限于相对于对照植物,增加NUE和/或植物生产率/产量。NUE可如本文实施例11所述从从土壤或培养基摄取氮的量和速率推断出。
NR多肽的表达水平可直接测量,例如通过利用Western测量植物中NR多肽的水平,或间接测量,例如通过测量植物中NR多肽的NR活性。测量NR活性的方法可利用标准技术例如Hageman,et al.,Methods Enzymol.(1971)23:491-503,Tucker,et al.,(2004).“Control ofnitrate reductase by circadium and diurnal rhythms in tomato”Planta219:277-285.and Scheible,et al.,(1997)“Accumulation of nitrate in theshoot acts as a signal to regulate shoot:root allocation in tobacco”Plant J.11:671-691,包括评价各种表达系统中的活性,例如爪蟾卵(Xenopusoocytes)(参见,Miller,et al.,(2000)“Xenopus Oocytes as anExpression System for Plant Transporters”,Biochimica et BiophysicaActa 1465:343-358.)或酵母例如巴斯德毕赤酵母(Pichia pastoris)(美国临时专利申请系列号60/944,223,2007年6月15日提交),来确定,NR活性还可包括表型改变的评价,例如在硝酸盐限制性条件例如更低的氮肥力的情况下生长的植物的增加或保持的产量或NUE。表型改变的实例包括但不限于增加的玉蜀黍中穗大小,增加的穗生长速率,增加的生物量,更高的谷物产量,同步开花使得花粉散落(shed)与抽丝(silking)几乎同时,增强的根生长,增加的种子大小,增加的种子重量,胚大小增加的种子,增加的叶大小,增加的幼苗活力,增强的吐丝(silk emergence),和更大的叶绿素含量(更绿)。
可通过本发明的NR获得保持或增加的产量。因此,植物细胞中本发明NR的NR活性的调节提供了用于保持或增加在有限的氮供应或更低的氮肥力的情况下生长的植物的产量或NUE的新的策略。
相应地,本发明进一步提供了当在有限的氮肥力下生长时具有增加的产量或保持的产量的植物。在一些实施方式中,所述当在有限的氮肥力下生长时具有增加或保持的产量的植物具有本发明的NR多肽的经调节的水平/活性。
“受试植物或植物细胞”是其中已经对感兴趣的基因进行了遗传改变例如转化的植物或植物细胞,或从那样改变的植物或细胞遗传下来并且包含所述改变的植物或植物细胞。“对照”或“对照植物”或“对照植物细胞”提供了用于测量受试植物或植物细胞的表型改变的参考点。
对照植物或植物细胞可包括,例如:(a)野生型植物或细胞,即,具有与产生受试植物或细胞的用于遗传改变的起始材料相同的基因型;(b)具有与起始材料相同基因型的植物或植物细胞但已经转化了无效构建体(即,对于感兴趣的性状没有已知效果的构建体,例如包含标记物基因的构建体)的植物或植物细胞;(c)为受试植物或植物细胞的子代之间的非转化的分离子的植物或植物细胞;(d)与受试植物或植物细胞遗传上相同但是没有暴露于诱导感兴趣基因表达的条件或刺激的植物或植物细胞;或(e)在感兴趣基因不表达的条件下的受试植物或植物细胞自身。
本文所用的“重组体”包括涉及细胞或载体,其已经通过引入异源核酸而被修饰或者所述细胞源自这样修饰的细胞。因此,例如,重组细胞表达在细胞的天然(非重组体)形式内未发现以相同形式存在的基因或者由于故意的人类干预而表达否则异常地表达、低表达(under expressed)或全然未表达的天然基因;或者可以具有天然基因的减少的或消除的表达。本文所用的术语“重组体”不包括通过天然存在的事件(例如,自发突变、天然转化/转导/转座)的细胞或载体的改变,如没有故意的人类干预的存在的那些。
如本文所用的,“重组表达盒”是核酸构建体,重组地或合成地产生,具有一系列指定的核酸元件,其允许特定的核酸在靶细胞内的转录。所述重组表达盒可以被并入质粒、染色体、线粒体DNA、质体DNA、病毒、或核酸片段中。典型地,表达载体的重组表达盒部分包括,在其它序列中,要被转录的核酸、及启动子。
术语“残基”或“氨基酸残基”或“氨基酸”在本文中被可交换地用于指被并入蛋白质、多肽、或肽(统称为“蛋白质”)中的氨基酸。所述氨基酸可以为天然存在的核酸并且,除非另外限制,可以包括可以以与天然存在的氨基酸类似的方式起作用的天然氨基酸的已知类似物。
术语“选择性地杂交”包括涉及在严格的杂交条件下核酸序列杂交到指定的核酸靶序列到比其杂交到非靶核酸序列和基本上排除非靶核酸的可检测地更大程度(例如,至少为背景的2倍)。选择性施杂交序列通常具有互相约至少40%的序列同一性、优选60-90%的序列同一性、及最优选100%的序列同一性(即,互补的)。
术语“严格的条件”或“严格的杂交条件”包括涉及这样的条件,在这样的条件下探针将以比其它序列更大的可检测地程度杂交到其靶序列(例如,至少2倍于背景)。严格的条件是序列依赖性的并且在不同的情况下将是不同的。通过控制杂交和/或冲洗条件的严格性,可以一直到100%互补于所述探针的靶序列可以被鉴定(同源探测)。可替换地,可以调整严格性条件以允许序列中的一些错配,以便检测较低程度的相似性(异源探测)。可选地,探针为约500个核苷酸的长度,但是长度可以极大地变化,从少于500个核苷酸到等于靶序列的整个长度。
典型地,严格的条件将是那些条件,其中盐浓度少于约1.5M Na离子,通常约0.01-1.0M Na离子浓度(或其它盐类),pH为7.0-8.3,对于短探针(例如,10到50个核苷酸),温度为至少约30℃,对于长探针(例如,大于50个核苷酸),温度为至少约60℃。严格地条件还可以通过加入去稳定剂如甲酰胺或Denhardt’s来实现。示例性的低严格性条件包括用30-35%的甲酰胺、1M NaCl、1% SDS(十二烷基硫酸钠)的缓冲溶液在37℃杂交,以及在50-55℃的1X-2X SSC(20XSSC=3.0M NaCl/0.3M柠檬酸三钠)中冲洗。示例性的中等严格性条件包括在40-45%甲酰胺、1M NaCl、1% SDS中在37℃杂交,并且在55-60℃的0.5X-1XSSC中冲洗。示例性的高度严格性条件包括在50%甲酰胺、1M NaCl、1% SDS中在37℃杂交,并且在60-65℃在0.1XSSC中冲洗。特异性通常为杂交后冲洗的函数,关键因素为最终冲洗溶液的离子强度和温度。对于DNA-DNA杂交体,Tm可以从Meinkoth and Wahl(1984)Anal.Biochem.138:267-84的等式:Tm=81.5℃+16.6(log M)+0.41(%GC)-0.61(%甲酰胺)-500/L估计;其中M为单价阳离子的摩尔浓度,%GC为DNA中鸟苷和胞嘧啶核苷酸的百分比,%甲酰胺为杂交溶液中甲酰胺的百分比,以及L为碱基对中杂交体的长度。Tm为(在限定的离子强度和pH下)50%的互补靶序列杂交到完全匹配的探针的温度。对于每个1%的错配,Tm降低约1℃;因此,可以调整Tm、杂交和/或冲洗条件以杂交到希望的同一性的序列。例如,如果寻求具有≥90%同一性的序列,Tm可以降低10℃。通常,在限定的离子强度和pH时,对于特定序列及其互补体,选择的严格的条件比热熔点(Tm)低约5℃。然而,极其严格的条件可以利用比热熔点(Tm)低1、2、3或4℃的杂交和/或冲洗;中等严格的条件可以利用比热熔点(Tm)低6、7、8、9或10℃的杂交和/或冲洗;低严格性条件可以利用比热熔点(Tm)低11、12、13、14、15或20℃的杂交和/或冲洗。利用所述等式、杂交和冲洗组分、及希望的Tm,普通技术人员将理解杂交和/或冲洗溶液的严格性中的变化被内在的描述。如果希望的错配程度导致Tm低于45℃(水溶液)或32℃(甲酰胺溶液),最优选是提高SSC浓度以便可以利用更高的温度。对于核酸的杂交的广泛的指导存在于Tijssen,LaboratoryTechniques in Biochemistry and Molecular Biology-Hybridization withNucleic Acid Probes,part I,chapter 2,“Overview of principles ofhybridization and the strategy of nucleic acid probe assays,”Elsevier,New York(1993);及Current Protocols in Molecular Biology,chapter 2,Ausubel,et al.,eds,Greene Publishing and Wiley-Interscience,New York(1995)。除非另外说明,在本申请中,高度严格性被限定为在4X SSC、5X Denhardt’s(500ml的水中5g Ficoll、5g聚乙烯吡咯烷酮、5g牛血清白蛋白)、0.1mg/ml煮沸的鲑鱼精子DNA、及25mM磷酸钠中在65℃杂交,以及在0.1X SSC、0.1%SDS中在65℃冲洗。
如本文所用的,“转基因植物”包括涉及植物,其包括在其基因组中的异源多核苷酸。通常,所述异源多核苷酸被稳定的整合入基因组内以便所述多核苷酸被传递到连续世代。所述异源多核苷酸可以单独地被整合入基因组中或者作为重组表达盒的一部分被整合。“转基因”在本文中被用于包括任何细胞、细胞系、愈伤组织、组织、植物部分或植物,其基因型已经通过异源核酸的存在而被改变,包括起始如此改变的那些转基因以及通过有性杂交(sexual crosses)或无性繁殖从起始转基因形成的那些。本文所用的术语“转基因”不包括通过常规植物育种方法或通过天然发生的事件(如随机异花受精、非重组病毒感染、非重组细菌转化、非重组转座、或自发突变)的基因组(染色体或染色体外)的改变。
如本文所用的,“载体”包括涉及在宿主细胞的转染中所用的核酸,多核苷酸可以被插入其中。载体通常为复制子。表达载体允许被插入其中的核酸的转录。
下面的术语用于描述两个或更多个核酸或多核苷酸或多肽之间的序列关系:(a)“参考序列”,(b)“比较窗”,(c)“序列同一性”,(d)“序列同一性的百分比”,以及(e)“实质的(substantial)同一性”。
如本文所用的,“参考序列”是用作序列比较的基础的限定的序列。参考序列可以为特定的序列的亚组或全部;例如,作为全长cDNA或基因序列的节段,或者完整的cDNA或基因序列。
如本文所用的,“比较窗”指的是包括涉及多核苷酸序列的相邻和指定节段,其中所述多核苷酸序列可以与参考序列比较并且其中所述比较窗中的多核苷酸的部分可以包括相较于参考序列(其不包括添加或缺失)的添加或缺失(即,间隙),用于所述两个序列的最佳比对。通常,比较窗为至少20个相邻核苷酸的长度,可选地可以为30、40、50、100个的长度或更长。本领域的技术人员理解为了避免由于多核苷酸序列中包含间隙导致与参考序列的高度相似性,通常引入间隙罚分并且从匹配的数量被减去。
用于比较的核苷酸和氨基酸序列的比对方法在本领域是熟知的。Smith and Waterman,(1981)Adv.Appl.Math 2:482的局部同源性算法(BESTFIT)可以进行用于比较的序列的最佳比对;通过Needleman andWunsch,(1970)J.Mol.Biol.48:443-53的同源性比对算法(GAP);通过Pearson and Lipman,(1988)Proc.Natl.Acad.Sci.USA 85:2444的检索相似性方法(Tfasta and Fasta);通过这些算法的计算机化的实施,包括,而不限于:Wisconsin Genetics Software Package,Version 8中通过Intelligenetics,Mountain View,California,GAP,BESTFIT,BLAST,FASTA,和TFASTA的PC/Gene程序中的CLUSTAL(可以从GeneticsComputer Group(GCG
Figure GPA00001026284600201
程序(Accelrys,Inc.,San Diego,CA)获得)。CLUSTAL程序由Higgins and Sharp,(1988)Gene 73:237-44;Higginsand Sharp,(1989)CABIOS 5:151-3;Corpet,et al.,(1988)Nucleic AcidsRes.16:10881-90;Huang,et al.,(1992)Computer Applications in theBiosciences 8:155-65,及Pearson,et al.,(1994)Meth.Mol.Biol.24:307-31充分描述。用于多个序列的最佳全局比对的优选程序为PileUp(Feng and Doolittle,(1987)J.Mol.Evol.,25:351-60,其类似于Higgins and Sharp,(1989)CABIOS 5:151-53描述的方法,以引用方式并入本文中)。可以用于数据库相似性检索的程序的BLAST家族包括:用于针对核苷酸数据库序列的核苷酸查询序列的BLASTN;用于针对蛋白质数据库序列的核苷酸查询序列的BLASTX;用于针对蛋白质数据库序列的蛋白质查询序列的BLASTP;用于针对核苷酸数据库序列的蛋白质查询序列的TBLASTN;以及用于针对核苷酸数据库序列的核苷酸查询序列的TBLASTX。参见,Current Protocols in MolecularBiology,Chapter 19,Ausubel et al.,eds.,Greene Publishing andWiley-Interscience,New York(1995)。
GAP利用上文Needleman and Wunsch的算法,以发现最大化匹配的数量和最小化间隙的数量的两个完整序列的比对。GAP考虑所有可能的比对和间隙位置并形成具有最大数量的匹配碱基和最少的间隙的比对。它允许规定匹配的碱基的单位中的间隙形成罚分和间隙扩展罚分。GAP必须利用对于它插入的每个间隙的匹配的间隙形成罚分数量。如果所选的间隙扩展罚分大于零,那么GAP必须,另外,对于插入的每个间隙利用间隙长度乘以间隙扩展罚分。Wisconsin GeneticsSoftware Package的Version 10中缺省间隙形成罚分值和间隙扩展罚分值分别为8和2。间隙形成和间隙扩展罚分可以被表达为选自由从0到100组成的整数的组的整数。因此,例如,间隙形成和间隙扩展罚分可以为0、1、2、3、4、5、6、7、8、9、10、15、20、30、40、50或更大。
GAP表示最佳比对的家族的一个成员。可以存在这个家族的许多成员,但是没有其他成员具有更好的质量。GAP显示四个用于比对的品质因数:质量、比率、同一性、及相似性。质量是为了比对序列最大化的量度。比率是质量除以较短节段中的碱基数量。百分比同一性是实际上匹配的符号的百分比。百分比相似性是相似的符号的百分比。从间隙穿过的符号被忽略。当对于成对符号的计分矩阵值大于或等于0.50(相似性阈值)时,相似性被计分。Wisconsin Genetics SoftwarePackage的Version 10中所用的计分矩阵是BLOSUM62(参见,Henikoff and Henikoff,(1989)Proc.Natl.Acad.Sci.USA 89:10915)。
除非另外说明,本文所提供的序列同一性/相似性值指的是利用程序的BLAST 2.0组利用缺省参数获得的值(Altschul,et al.,(1997)Nucleic Acids Res.25:3389-402)。
如本领域的那些普通技术人员将理解的,BLAST检索假定蛋白质可以被模型化为随机序列。然而,许多真实的蛋白质包括非随机序列区,其可以为均聚物段(tract)、短周期重复、或一个或更多个氨基酸富集的区。这样的低复杂性区可以在不相关的蛋白质之间比对(aligned),即使所述蛋白质的其他区是完全不相似的。大量低复杂性过滤程序可以用于减少这样的低复杂性比对。例如,SEG(Wootenand Federhen,(1993)Comput.Chem.17:149-63)和XNU(Claverie andStates,(1993)Comput.Chem.17:191-201)低复杂性过滤可以单独或结合使用。
如本文所用的,在两个核酸或多肽序列的上下文中的“序列同一性”或“同一性”包括涉及两个序列中的残基,其当在指定的比较窗上比对用于最大的相应性时是相同的。当使用的序列同一性的百分比涉及蛋白质时,认识到不相同的残基位置通常通过保守的氨基酸替换而不同,其中氨基酸残基被另外的具有类似化学性质(例如,电荷或疏水性)的氨基酸残基替换,并因此不改变所述分子的功能性质。当序列在保守的替换方面不同时,百分比序列同一性可以被向上调整以校正替换的保守性质。通过这样的保守替换而不同的序列被称为具有“序列相似性”或“相似性”。用于进行这样的调整的方式对于本领域的技术人员是熟知的。典型地,这涉及将保守替换作为部分而不是全部错配计分,由此提高百分比序列同一性。因此。例如,当相同的氨基酸被给予1的得分时,非保守的替换被给予0的得分,保守的替换被给予0和1之间的得分。例如在程序PC/GENE(Intelligenetics,Mountain View,California,USA)中实施时,例如根据Meyers and Miller,(1988)Computer Applic.Biol.Sci.4:11-17的算法,计算保守替换的计分。
如本文所用的,“序列同一性的百分比”指的是通过在比较窗上比较两个最佳比对的序列确定的值,其中比较窗内多核苷酸序列的部分与参考序列相比(其不包括添加或缺失)可以包括添加或缺失(即,间隙),用于两个序列的最佳比对。百分比通过如下计算:确定两个序列中存在的相同核酸碱基或氨基酸残基的位置的数量以产生匹配的位置的数量、匹配的位置的数量除以比较窗中位置的总数、结果乘以100,以产生序列同一性的百分比。
术语多核苷酸序列的“实质的同一性”意味着多核苷酸包含这样的序列,其利用所述的比对程序之一,利用标准参数,与参考序列相比,具有50-100%之间的序列同一性,优选至少50%的序列同一性,优选至少60%的序列同一性,优选至少70%、更优选至少80%、更优选至少90%、最优选至少95%。技术人员将认识到这些值可以通过考虑密码子简并性、氨基酸相似性、阅读框定位等被适当地调整以确定由两个核苷酸序列编码的蛋白质的相应的同一性。用于这些目的的氨基酸序列的实质的同一性通常意味着55-100%之间的序列同一性,优选至少55%,优选至少60%,更优选至少70%、80%、90%,最优选至少95%。
核苷酸序列是实质地同一的另一指征是两个分子在严格的条件下是否相互杂交。遗传密码的简并性允许导致编码相同的氨基酸的核苷酸序列中的多样性的许多氨基酸的替换,因此DNA序列可以编码相同的多肽但是在严格的条件下不会相互杂交是可能的。例如,在核酸的拷贝是利用由遗传密码允许的最大密码子简并性形成时,这可以发生。两个核酸序列是实质地同一的一个指征是第一核酸编码的多肽是与由第二核酸编码的多肽免疫学交叉反应的。
在肽的上下文中的术语“实质的同一性”表明肽包含这样的序列,其在指定的比较窗上与参考序列具有55-100%之间的序列同一性,优选与参考序列至少55%的序列同一性,优选60%,优选70%、更优选80%、最优选至少90%或95%的序列同一性。优选的,最佳比对利用上文Needleman and Wunsch的同源性比对算法进行。两个肽序列是实质地同一的指征是一个肽与针对第二肽产生的抗体是免疫反应性的。因此,肽是与第二肽实质地同一的,例如,在两个肽仅由于保守的替换而不同时。此外,肽可以与第二肽在它们因非保守变化而不同时,如果抗体识别的表位是实质地同一的,那么它们是实质地同一的。“实质上相似的”肽分享如上所述的序列,除了不同的残基位置可以因保守的氨基酸变化而不同。
核酸
本发明提供了,尤其是,RNA、DNA、及其类似物和/或嵌合体的分离的核酸,包括NR多核苷酸。
本发明还包括用于在不同的有机体中表达的最优化的多核苷酸。例如,为了多核苷酸在玉蜀黍植物中的表达,所述序列可以被改变以解释特定的密码子偏好并根据Murray,et al上文改变GC含量。用于来自玉蜀黍植物的28个基因的玉蜀黍密码子选择在Murray,et al.上文的表4中列出。
本发明的NR核酸包括分离的NR多核苷酸,其包括:
(a)编码NR多肽和其保守修饰的和多形的变体的多核苷酸;
(b)与(a)的多核苷酸具有至少70%的序列同一性的多核苷酸;
(c)(a)或(b)的多核苷酸的互补序列。
核酸的构建
本发明的分离的核酸可以利用(a)标准重组方法,(b)合成技术,或其组合制备。在一些实施方式中,本发明的多核苷酸可以从真菌或细菌克隆、扩增、或以其他方式构建。
所述核酸可以方便地包含除了本发明的多核苷酸之外的序列。例如,包含一个或更多个内切核酸酶限制性位点的多个-克隆位点可以被插入所述核酸以帮助分离多核苷酸。并且,可翻译的序列可以被插入以帮助本发明的翻译的多核苷酸的分离。例如,六-组氨酸标记物序列提供了方便的方式以纯化本发明的蛋白质。本发明的核酸-排除所述多核苷酸序列,可选地为用于本发明的多核苷酸的克隆和/或表达的载体、适配子(adapter)、或连接子。另外的序列可以被加入到这样的克隆和/或表达序列以最优化它们在克隆和/或表达中的功能、帮助多核苷酸的分离、或者提高所述多核苷酸导入细胞。典型地,本发明的核酸的长度少于本发明的其多核苷酸的长度,是少于20千碱基对,通常少于15kb,常常少于10kb。克隆载体、表达载体、适配子、及连接子的应用在本领域是熟知的。示例性的核酸包括这样的载体如:M13、lambda ZAP Express、lambda ZAP II、lambda gt10、lambdagt11、pBK-CMV、pBK-RSV、pBluescript II、lambda DASH II、lambda EMBL 3、lambda EMBL 4、pWE15、SuperCos1、SurfZap、Uni-ZAP、pBC、pBS+/-、pSG5、pBK、pCR-Script、pET、pSPUTK、p3’SS、pGEM、pSK+/-、pGEX、pSPORTI和II、pOPRSVI CAT、pOPI3 CAT、pXT1、pSG5、pPbac、pMbac、pMClneo、pOG44、pOG45、pFRTβGAL、pNEOβGAL、pRS403、pRS404、pRS405、pRS406、pRS413、pRS414、pRS415、pRS416、lambda MOSSlox、及lambda MOSElox。用于本发明的最佳载体包括而不限于lambda ZAP II,和pGEX。多种核酸的描述参见例如Stratagene Cloning Systems,Catalogs 1995,1996,1997(La Jolla,CA);以及,Amersham Life Sciences,Inc,Catalog’97(Arlington Heights,IL)。
用于构建核酸的合成方法
本发明的分离的核酸还可以通过以下方法通过直接化学合成制备,所述方法例如:Narang,et al.,(1979)Meth.Enzymol.68:90-9的磷酸三酯方法;Brown,et al.,(1979)Meth.Enzymol.68:109-51的磷酸二酯方法;Beaucage,et al.,(1981)Tetra.Letts.22(20):1859-62的二乙基亚磷酰胺(diethylphosphoramidite)方法;Beaucage,et al.上文描述的固相亚磷酰胺三酯(phosphoramidite triester)方法,例如,利用自动合成仪,例如Needham-VanDevanter,et al.,(1984)Nucleic AcidsRes.12:6159-68中描述的;以及美国专利No.4,458,066的固相支持(solid support)方法。化学合成通常产生单链寡核苷酸。通过与互补序列的杂交或通过利用单链作为模板借助DNA聚合酶的聚合,这可以被转变为双链DNA。技术人员将认识到虽然DNA的化学合成限于约100个碱基的序列,但是较长的序列可以通过较短序列的连接获得。
UTR和密码子偏好
通常,翻译效率已经发现由RNA的5’非编码或非翻译区(5’UTR)中的特定序列元件调节。正性序列基序包括翻译起始共有序列(Kozak,(1987)Nucleic Acids Res.15:8125)和5<G>7甲基GpppGRNA帽结构(Drummond,et al.,(1985)Nucleic Acids Res.13:7375)。负性元件包括稳定的分子内5’UTR茎-环结构(Muesing,et al.,(1987)Cell 48:691)和5’UTR中的AUG序列或前面有合适的AUG的短开放阅读框(Kozak,上文,Rao,et al.,(1988)Mol.and Cell.Biol.8:284)。因此,本发明提供了用于调节异源编码序列的翻译的5’和/或3’UTR区。
此外,本发明的多核苷酸的多肽编码节段可以被修饰以改变密码子选择。改变的密码子选择可以用于改变翻译效率和/或最优化用于在希望的宿主中表达的编码序列或最优化用于在玉蜀黍中表达的异源序列中的密码子选择。本发明的多核苷酸的编码区中的密码子选择可以利用商业上可获得的软件包,如可以从University of WisconsinGenetics Computer Group获得的“Codon Preference″统计分析。参见,Devereaux,et al.,(1984)Nucleic Acids Res.12:387-395);或MacVector4.1(Eastman Kodak Co.,New Haven,Conn.)。因此,本发明提供了本发明的多核苷酸的至少一个的编码区的密码子选择频率特征。可以用于确定密码子选择频率的多核苷酸的数量(每个氨基酸3个核苷酸)可以为从3到本文所提供的本发明的多核苷酸的数量的任何整数。可选地,所述多核苷酸将为全长序列。用于统计分析的序列的示例性数目可以为至少1、5、10、20、50或100。
序列改组(Sequence Shuffling)
本发明提供了利用本发明的多核苷酸的用于序列改组的方法,以及由此获得的组分。序列改组在PCT公开No.96/19256中描述。还参见,Zhang,et al.,(1997)Proc.Natl.Acad.Sci.USA 94:4504-9;和Zhao,et al.,(1998)Nature Biotech 16:258-61。通常,序列改组提供了用于产生具有希望的特征的多核苷酸的文库的方式,其可以被选择或筛选。重组多核苷酸的文库从相关序列多核苷酸群产生,其包括序列区,其具有实质的序列同一性并可以在体外或体内同源重组。序列重组的多核苷酸群包括具有希望的或有利的特征并且可以通过合适的选择或筛选方法选择的多核苷酸的亚群。所述特征可以为能够在筛选系统中被选择或检测的任何性质或属性,并且可以包括以下的性质:编码的蛋白质、转录元件、调控基因或转基因的转录、RNA加工、RNA稳定性、染色质构象、翻译、或其它表达性质的序列、复制元件、蛋白质结合元件、或类似物、如赋予可选择的或可检测的性质的任何特征。在一些实施方式中,所选择的特征可以为如本文提供的超过野生型蛋白质的改变的Km和/或Kcat。在另一些实施方式中,从序列改组产生的蛋白质或多核苷酸将具有大于非改组的野生型多核苷酸的配体结合亲和力。在另一些实施方式中,从序列改组产生的蛋白质或多核苷酸将具有与非改组的野生型多核苷酸相比的改变的pH最佳值。这样的性质的提高可以为野生型值的至少110%、120%、130%、140%或大于150%。
重组表达盒
本发明进一步提供了包含本发明的核酸的重组表达盒。编码本发明的希望的多核苷酸的核酸序列,例如编码足够长的多肽以编码本发明的活性蛋白质的cDNA或基因组序列,可以用于构建可以被引入希望的宿主细胞的重组表达盒。重组表达盒将通常包括可操作地连接到引导多核苷酸在预期的宿主细胞(如转化的植物的组织)中的转录的转录起始调节序列的本发明的多核苷酸。
例如,植物表达载体可以包括(1)在5’和3’调节序列的转录调控下的克隆的植物基因和(2)显性可选择的标记物。这样的植物表达载体还可以包含,如果希望,启动子调节区(例如,提供可诱导的或组成性的、环境或发育调节的、或细胞或组织特异性/选择性表达的调节区)、转录引发起始位点、核糖体结合位点、RNA加工信号、转录终止位点、和/或多聚腺苷化(polyadenylation)信号。
许多启动子可用于本发明的实施,包括感兴趣作物植物的内源NR多核苷酸序列的天然启动子。可以基于期望的结果选择启动子。核酸可与用于植物表达的组成性,组织优选,诱导型,或其它启动子组合。
可以使用植物启动子或启动子片段,其可以引导本发明的多核苷酸在再生植物的所有组织中的表达。这样的启动子在本文中被称为“组成性”启动子并在大多数环境条件和发育或细胞分化的状态下是活性的。组成性启动子的实例包括源自根癌土壤杆菌(Agrobacteriumtumefaciens)的T-DNA的1’-或2’-启动子、Smas启动子、肉桂醇脱氢酶启动子(美国专利No.5,683,439)、Nos启动子、rubisco启动子、GRP1-8启动子、来自花椰菜花叶病毒(cauliflower mosaic virus(CaMV))的35S启动子,其在Odell,et al.,(1985)Nature 313:810-2中描述;稻肌动蛋白(McElroy,et al.,(1990)Plant Cell 163-171);泛素(ubiquitin)(Christensen,et al.,(1992)Plant Mol.Biol.12:619-632和Christensen,et al.,(1992)Plant Mol.Biol.18:675-89);pEMU(Last,etal.,(1991)Theor.Appl.Genet.81:581-8);MAS(Velten,et al.,(1984)EMBO J.3:2723-30);及玉蜀黍H3组蛋白(Lepetit,et al.,(1992)Mol.Gen.Genet.231:276-85;和Atanassvoa,et al.,(1992)Plant Journal2(3):291-300);ALS启动子,如PCT申请No.WO 96/30530中描述的;以及技术人员已知的来自各种植物基因的其它转录起始区。对于本发明,泛素是用于在单子叶植物中表达的优选的启动子。
可利用组织优选启动子以获得在特定植物组织中增强的A型RR表达。“组织优选”意图表示表达在特定组织中是主导的,尽管不必要排他地在该组织中。组织优选的启动子包括Yamamoto,et al.,(1997)Plant J.12(2):255-265;Kawamata,et al.,(1997)Plant Cell Physiol.38(7):792-803;Hansen,et al.,(1997)Mol.Gen Genet.255(3):337-353;Russell,et al.,(1997)Transgenic Res.6(2):157-168;Rinehart,et al.,(1996)Plant Physiol.112(3):1331-1351;Van Camp,et al.,(1996)PlantPhysiol.112(2):525-535;Canevascini,et al.,(1996)Plant Physiol.112(2):513-525;Yamamoto,et al.,(1995)Plant Cell Physiol.35(5):773-778;Lam(1995)Results Probl.Cell Differ.20:181-196;Orozco,et al.,(1993)Plant Mol Biol.23(6):1129-1138;Matsuoka,et al.,(1993)Proc Natl.Acad.Sci.USA 90(20):9586-9590;and Guevara-Garcia,et al.,(1993)Plant J.5(3):595-505。如果必要,为了达到弱表达,所述启动子可被修饰。参见例如,美国专利申请号2003/0074698,通过援引并入本文。
叶肉细胞优选启动子包括但不限于启动子,例如已知的磷酸烯醇丙酮酸脱羧酶(PEPC)启动子或来自许多物种,例如玉蜀黍(Zeamays),稻(Oryza sativa),拟南芥菜(Arabidopsis thaliana),大豆(Glycine max)或两色蜀黍(Sorghum bicolor)的推定的PEPC启动子。实例包括GeneBank登录号gi:116268332_HTG AC190686,(SEQID NO:25)和gCAT GSS复合序列(SEQ ID NO:30)的玉蜀黍PEPC;GenBank登录号gi|20804452|dbj|AP003052.3|(SEQ ID NO:26)的稻PEPC;GenBank登录号gi|5541653|dbj|AP000370.1|AP000370(SEQ IDNO:27);gi:7769847(SEQ ID NO:28);或gi|20198070|gb|AC007087.7(SEQ ID NO:29)的拟南芥菜PEPC;大豆(GSS毗连群(contigs))(SEQ ID NOS:31-32);或两色蜀黍(JGI组件主链832,89230bp.,JGI组件主链1632,SEQ ID NOS:33-34)(1997)Plant J.12(2):255-265;Kwon,et al.,(1995)Plant Physiol.105:357-67;Yamamoto,et al.,(1995)Plant Cell Physiol.35(5):773-778;Gotor,et al.,(1993)Plant J.3:509-18;Orozco,et al.,(1993)Plant Mol.Biol.23(6):1129-1138;Baszczynski,etal.,(1988)Nucl.Acid Res.16:5732;Mitra,et al.,(1995)Plant MolecularBiology 26:35-93;Kayaya,et al.,(1995)Molecular and General Genetics258:668-675;and Matsuoka,et al.,(1993)Proc.Natl.Acad.Sci.USA90(20):9586-9590。衰老调节启动子也是有用的,例如SAM22(Crowell,et al.,(1992)Plant Mol.Biol.18:559-566).还参见,US专利号5,589,052,通过援引并入本文。
枝条优选的启动子包括但不限于,枝条分生组织优选的启动子,例如公开于下列的启动子:Weigal,et al.,(1992)Cell 69:853-859;登录号AJ131822;登录号Z71981;登录号AF059870,ZAP启动子(美国专利申请号10/387,937),玉蜀黍tb1启动子(Wang,et al.,(1999)Nature398:236-239),和公开于McAvoy,et al.,(2003)Acta Hort.(ISHS)625:379-385的枝条优选的启动子。
根优选的启动子是已知的,并且可从许多可获自文献的启动子中选择,或从多种兼容的物种中从头分离。参见例如,Hire,et al.,(1992)Plant Mol.Biol.20(2):207-218(大豆根特异谷氨酰胺合成酶基因);Keller and Baumgartner(1991)Plant Cell 3(10):1051-1061(菜豆(Frenchbean)的GRP1.8基因中的根特异控制元件);Sanger,et al.,(1990)PlantMol.Biol.15(3):533-553(根癌土壤杆菌(Agrobacterium tumefaciens)的甘露碱合酶(MAS)基因的根特异启动子);和Miao,et al.,(1991)Plant Cell 3(1):11-22(编码细胞溶质谷氨酰胺合成酶(GS)的全长cDNA克隆,其在大豆的根和根节中表达)。也参见Bogusz,et al.,(1990)Plant Cell 2(7):633-651,其中描述了分离自来自固氮非豆科植物Parasponia andersonii和相关的非固氮非豆科植物Trema tomentosa的血红蛋白基因的两种根特异启动子。这些基因的启动子与β-葡糖醛酸糖苷酶报道基因连接,并且导入非豆科植物烟草(Nicotiana tabacum)和豆科植物百脉根(Lotus corniculatus),并且在两种情况下都保持了根特异启动子活性。Leach and Aoyagi(1991)描述了对发根土壤杆菌(Agrobacterium rhizogenes)的高表达的rolC和rolD根诱导基因的启动子的分析(参见,Plant Science(Limerick)79(1):69-76)。他们得出结论在那些启动子中增强子和组织优选DNA决定子是分离的。Teeri,etal.,(1989)利用与LacZ的基因融合体显示了编码章鱼肉碱合酶的土壤杆菌T-DNA基因在根尖的表皮中是特别有活性的,并且TR2′基因在完整植物中是根部特异的,并且在叶组织被创伤刺激,一种用于杀昆虫或杀幼虫基因的特别期望的特征组合(参见,EMBO J.8(2):353-350)。与nptII(新霉素磷酸转移酶II)融合的TR1′基因显示了类似的特征。另外的根优选启动子包括VfENOD-GRP3基因启动子(Kuster,et al.,(1995)Plant Mol.Biol.29(5):759-772);rolB启动子(Capana,et al.,(1995)Plant Mol.Biol.25(5):681-691;和具有ADH第一内含子的CRWAQ81根优选启动子(美国临时申请号60/509,878,2003年10月9日申请,通过援引并入本文)。还参见,美国专利号5,837,876;5,750,386;5,633,363;5,559,252;5,501,836;5,110,732;和5,023,179。
可替换地,植物启动子可以引导本发明的多核苷酸在特定组织中的表达或者可以另外的在更精确的环境或发育控制下。这样的启动子这里被称为“可诱导的”启动子。可以通过可诱导的启动子影响转录的环境条件包括病原体攻击、厌氧条件、或者光的存在。可诱导的启动子的实例为Adh1启动子,其可由缺氧或冷应激诱导,Hsp70启动子,其可以由热应激诱导,及PPDK启动子,其可以由光诱导。
在发育调控下的启动子的实例包括仅,或优先地,在一些组织中,如叶子、根、果实、种子、或花中引发转录的启动子。启动子的操作还可以依赖其在基因组中的位置而变化。因此,可诱导的启动子可以在一些位置中变得完全或部分组成性。
如果多肽表达是希望的,通常希望包括多核苷酸编码区的3’-端的多聚腺苷化区。多聚腺苷化区可以源自多种植物基因,或源自T-DNA。要添加的3’端序列可以源自,例如,胭脂碱合酶(nopaline synthase)或章鱼碱合酶(octopine synthase)基因,或可选地源自另一植物基因,或较少优选地源自任何其它真核基因。这样的调节性元件的实例包括,而不限于,3’终止和/或多聚腺苷化区,如根癌土壤杆菌胭脂碱合酶(nos)基因的那些(Bevan,et al.,(1983)Nucleic Acids Res.12:369-85);马铃薯蛋白酶抑制剂II(PINII)基因(Keil,et al.,(1986)Nucleic Acids Res.14:5641-50;及An,et al.,(1989)Plant Cell1:115-22);以及CaMV 19S基因(Mogen,et al.,(1990)Plant Cell2:1261-72)。
内含子序列可以被加入到部分编码序列的5’非翻译区或编码序列以提高聚集在胞质溶胶中的成熟信息的数量。植物和动物表达构建体中的转录单位中包含可剪接的内含子已经显示在mRNA和蛋白质水平提高基因表达一直到1000倍(Buchman and Berg,(1988)Mol.CellBiol.8:4395-4405;Callis,et al.,(1987)Genes Dev.1:1183-200)。这样的内含子的基因表达提高通常在位于转录单位的5’端附近时最大。玉蜀黍内含子Adh1-S内含子1、2和6,Bronze-1内含子的应用在本领域是已知的。一般地参见,The Maize Handbook,Chapter 116,Freeling andWalbot,eds.,Springer,New York(1994)。
植物信号序列,包括,而不限于,靶向蛋白质到植物细胞的细胞外基质的编码信号肽的DNA/RNA序列(Dratewka-Kos,et al.,(1989)J.Biol.Chem.264:4896-900),如白花丹叶烟草(Nicotianaplumbaginifolia)扩张基因(DeLoose,et al.,(1991)Gene 99:95-100);靶向蛋白质到液泡的信号肽,如甘薯储藏蛋白(sporamin)基因(Matsuka,et al.,(1991)Proc.Natl.Acad.Sci.USA 88:834)及大麦凝集素基因(Wilkins,et al.,(1990)Plant Cell,2:301-13);造成蛋白质被分泌的信号肽,如PRIb(Lind,et al.,(1992)Plant Mol.Biol.18:47-53)或大麦α淀粉酶(BAA)(Rahmatullah,et al.,(1989)Plant Mol.Biol.12:119,并由此以引用方式并入)的那些,或将蛋白质靶向到质体的信号肽,如油菜籽脂烯酰基Acp还原酶的信号肽(Verwaert,et al.,(1994)PlantMol.Biol.26:189-202),在本发明中是有用的。
包含来自本发明的多核苷酸的序列的载体将通常包含标记物基因,其赋予植物细胞可选择的表型。通常,可选择的标记物基因将编码抗生素抗性、合适的基因包括:编码对抗生素壮观霉素的抗性的基因(例如,aada基因)、编码链霉素抗性的链霉素磷酸转移酶(SPT)基因、编码卡那霉素或遗传霉素(geneticin)抗性的新霉素磷酸转移酶(NPTII)基因、编码潮霉素抗性的潮霉素磷酸转移酶(HPT)基因、编码对除草剂的抗性的基因,其起作用以抑制乙酰乳酸合酶(acetolactatesynthase)(ALS)的作用,尤其是磺酰脲类(sulfonylurea-type)除草剂(例如,包含导致这样的抗性的突变,尤其是S4和/或Hra突变的乙酰乳酸合酶(ALS)基因)、编码对起作用以抑制谷氨酰胺合酶的作用的除草剂(如膦丝菌素(phosphinothricin)或basta)抗性的基因(例如,bar基因),或者本领域已知的其它这样的基因。bar基因编码对除草剂basta的抗性,ALS基因编码对除草剂氯磺隆(chlorsulfuron)的抗性。
用于基因在高等植物中的表达的典型的载体在本领域是熟知的,并且包括源自Rogers,et al.(1987),Meth.Enzymol.153:253-77描述的根癌土壤杆菌的肿瘤诱导(Ti)质粒的载体。这些载体是植物整合载体,因为在转化上,所述载体将载体DNA的部分整合入宿主植物的基因组中。本文所用的示例性根癌土壤杆菌载体是Schardl,et al.,(1987)Gene 61:1-11,和Berger,et al.,(1989)Proc.Natl.Acad.Sci.USA,86:8402-6的质粒pKYLX6和pKYLX7。本文另一有用的载体是可以从CLONTECH Laboratories,Inc.(Palo Alto,CA)获得的质粒pBI101.2。
蛋白质在宿主细胞中的表达
利用本发明的核酸,人们可以在重组工程化的细胞,如细菌、酵母、昆虫、哺乳动物、或优选地植物细胞中表达本发明的蛋白质。所述细胞在非天然的条件中(例如,量、组成、位置、和/或时间)产生蛋白质,因为它们已经通过人类干预而遗传改变以这样进行。
预期本领域的技术人员在用于表达编码本发明的蛋白质的核酸的可获得的众多表达系统方面是博学的。没有进行尝试来详细地描述已知用于蛋白质在原核生物或真核生物中的表达的多种已知方法。
简而言之,编码本发明的蛋白质的分离的核酸的表达将通常通过可操作地连接,例如,DNA或cDNA到启动子(其是组成性或可诱导的),随后并入表达载体而实现。所述载体可以适于在原核生物或真核生物中复制和整合。典型的表达载体包含转录和翻译终止子、起始序列、及用于调节编码本发明的蛋白质的DNA的表达的启动子。为获得克隆的基因的高水平表达,希望构建最少包含强启动子,如泛素,以引导转录,用于翻译起始的核糖体结合位点、以及转录/翻译终止子的表达载体。组成性启动子被分类为提供一定范围内的组成性表达。因此,一些为弱的组成性启动子,另一些为强的组成性启动子。通常,“弱启动子”意图指驱动编码序列在低水平表达的启动子。“低水平”意图指在约1/10,000转录物到约1/100,000转录物到约1/500,000转录物的水平。相反地,“强启动子”驱动编码序列在“高水平”,或约1/10转录物到约1/100转录物到约1/1,000转录物的表达。
技术人员将认识到可以对本发明的蛋白质进行修饰而不降低其生物活性。一些修饰可以被进行以促进靶向分子的克隆、表达、或并入融合蛋白内。这样的修饰对于本领域技术人员是熟知的,并且包括,例如在氨基末端添加的甲硫氨酸以提供起始位点,或位于任一末端的另外的氨基酸(例如,poly His)以形成方便位置的限制性位点或终止密码子或纯化序列。
在原核生物中的表达
原核细胞可以用作用于表达的宿主。最常见的原核生物以大肠杆菌的各种菌株为代表;然而,也可以使用其它微生物菌株。本文中限定以包括用于转录起始的启动子、可选地具有操纵基因、以及核糖体结合位点序列的通常使用的原核调控序列包括这样的通常使用的启动子如β内酰胺酶(青霉素酶)和乳糖(lac)启动子系统(Chang,et al.,(1977)Nature 198:1056)、色氨酸(trp)启动子系统(Goeddel,et al.,(1980)Nucleic Acids Res.8:4057)和lambda来源的PL启动子和N-基因核糖体结合位点(Shimatake,et al.,(1981)Nature 292:128)。在大肠杆菌中转染的DNA载体中包含选择标记物也是有用的。这样的标记物的实例包括指定对氨苄青霉素、四环素、或氯霉素的抗性的基因。
选择载体以允许感兴趣的基因导入合适的宿主细胞。细菌载体通常是质粒或噬菌体起源。合适的细菌细胞被噬菌体载体颗粒感染或被裸噬菌体载体DNA转染。如果使用质粒载体,细菌细胞被质粒载体DNA转染。用于表达本发明的蛋白质的表达系统可利用芽孢杆菌属物种(Bacillus sp.)和沙门氏菌属(Salmonella)(Palva,et al.,(1983)Gene22:229-35;Mosbach,et al.,(1983)Nature 302:543-5)获得。来自Pharmacia的pGEX-4T-1质粒载体是用于本发明的优选的大肠杆菌表达载体。
在真核生物中的表达
多种真核表达系统如酵母、昆虫细胞系、植物和哺乳动物细胞,是本领域技术人员已知的。如下面简要解释的,本发明可以在这些真核系统中被表达。在一些实施方式中,转化的/转染的植物细胞,如下文讨论的,被用作用于产生本发明的蛋白质的表达系统。
酵母中异源蛋白质的合成是熟知的。Sherman,et al.,(1982)Methods in Yeast Genetics,Cold Spring Harbor Laboratory是描述可以用来在酵母中产生蛋白质的各种方法的充分认可的著作。用于真核蛋白质生产的两个广泛利用的酵母是酿酒酵母(Saccharomycescerevisiae)和巴斯德毕赤酵母(Pichia pastoris)。用于在酵母属(Saccharomyces)和毕赤酵母属(Pichia)中表达的载体、菌株、和方案在本领域是已知的并且可以从商业供应者获得(例如,Invitrogen)。合适的载体通常具有表达调控序列,如启动子,期望时包括3-磷酸甘油酸激酶或醇氧化酶,及复制起点、终止序列等。
本发明的蛋白质,一旦表达,可以通过裂解细胞并将标准蛋白分离技术应用于裂解液或沉淀物(pellet)来从酵母分离。可以利用Western blot技术或其他标准免疫测定技术的放射免疫测定完成纯化过程的监测。
编码本发明的蛋白质的序列还可连接到各种表达载体,用在转染例如哺乳动物、昆虫、或植物起源的细胞培养物中。哺乳动物细胞系统通常将为细胞的单层形式,虽然还可以使用哺乳动物细胞悬浮液。在本领域已经开发了大量能够表达完整的蛋白质的合适的宿主细胞系,包括HEK293、BHK21、和CHO细胞系。用于这些细胞的表达载体可以包括表达调控序列,如复制起点、启动子(例如,CMV启动子、HSV tk启动子或pgk(磷酸甘油酸激酶)启动子),增强子(Queen,et al.,(1986)Immunol.Rev.89:49)、以及必要的加工信息位点,如核糖体结合位点、RNA剪接位点、多聚腺苷化位点(例如,SV40大T Ag poly A添加位点)、及转录终止序列。用于产生本发明的蛋白质的其它动物细胞是可获得的,例如,从美国典型培养物保藏中心细胞系和杂交瘤目录(American Type Culture Collection Catalogue of CellLines and Hybridomas)(7th ed.,1992)获得。
用于在昆虫细胞中表达本发明的蛋白质的合适的载体通常源自SF9杆状病毒。合适的昆虫细胞系包括蚊幼体、蚕、粘虫、蛾、及果蝇(Drosophila)细胞系,如Schneider细胞系(参见,例如,Schneider,(1987)J.Embryol.Exp.Morphol.27:353-65)。
至于酵母,当采用高等动物或植物宿主细胞时,多聚腺苷化或转录终止序列通常被并入载体中。终止序列的实例是来自牛生长素基因的多聚腺苷化序列。用于实施本发明的其它有用终止子包括但不限于,pinII(参见,An,et al.,(1989)Plant Cell 1(1):115-122),glb1(参见,Genbank登录号L22345),gz(参见,gzw64a终止子,Genbank登录号S78780),和来自土壤杆菌的nos终止子。
还可以包括用于转录物的精确剪接的序列。剪接序列的实例是来自SV40的VP1内含子(Sprague et al.,(1983)J.Virol.45:773-81)。此外,调控宿主细胞中复制的基因序列可以被并入载体中,如在牛乳头瘤病毒型-载体中发现的那些序列(Saveria-Campo,“Bovine Papilloma VirusDNA a Eukaryotic Cloning Vector,”in DNA Cloning:A PracticalApproach,vol.II,Glover,ed.,IRL Press,Arlington,VA,pp.213-38(1985))。
此外,位于合适的植物表达载体中的NR基因可以用于转化植物细胞。所述多肽可以随后从植物愈伤组织分离或者转化的细胞可以用于再生转基因植物。可以收获这样的转基因植物,可以对合适的组织(种子或叶子,例如)进行大规模蛋白质提取和纯化技术。
植物转化方法
用于将外源基因引入植物的众多方法是已知的并且可以用于将NR多核苷酸插入植物宿主,包括生物和物理植物转化方案。参见,例如,Miki et al.,(1993)“Procedure for Introducing Foreign DNA intoPlants,”in Methods in Plant Molecular Biology and Biotechnology,Glickand Thompson,eds.,CRC Press,Inc.,Boca Raton,pp.67-88。所选的方法随着宿主植物而变化,包括化学转染方法,如磷酸钙、微生物-介导的基因转移,如土壤杆菌(Agrobacterium)(Horsch et al.,(1985)Science227:1229-31)、电穿孔、显微注射、及生物射弹(biolistic)轰击。
用于植物细胞或组织转化和植物的再生的表达盒和载体及体外培养方法是已知的和可获得的。参见,例如,Gruber et al.,“Vectors forPlant Transformation,”in Methods in Plant Molecular Biology andBiotechnology,上文,pp.89-119。
分离的多核苷酸或多肽可以通过通常用于直接递送入细胞的一种或更多种技术被引入植物中。这样的方案可以依赖于有机体、细胞、植物或植物细胞的类型而变化,即,单子叶植物或双子叶植物,靶向用于基因修饰。合适的转化植物细胞的方法包括显微注射(Crossway,et al.,(1986)Biotechniques 4:320-334;及美国专利号6,300,543)、电穿孔(Riggs,et al.,(1986)Proc.Natl.Acad.Sci.USA 83:5602-5606,直接基因转移(Paszkowski et al.,(1984)EMBO J.3:2717-2722)、及弹道粒子加速(参见,例如Sanford,et al.,美国专利号4,945,050;WO91/10725;及McCabe,et al.,(1988)Biotechnology 6:923-926)。还参见,Tomes,et al.,“Direct DNA Transfer into Intact Plant Cells ViaMicroproj ectile Bombardment”.pp.197-213 in Plant Cell,Tissue andOrgan Culture,Fundamental Methods.eds.Gamborg  和Phillips.Springer-Verlag Berlin Heidelberg New York,1995;美国专利号5,736,369(分生组织);Weissinger,et al.,(1988)Ann.ReV.Genet.22:421-477;Sanford,et al.,(1987)Particulate Science and Technology5:27-37(洋葱);Christou,et al.,(1988)Plant Physiol.87:671-674(大豆);Datta,et al.,(1990)Biotechnology 8:736-740(稻);Klein,et al.,(1988)Proc.Natl.Acad.Sci.USA 85:4305-4309(玉蜀黍);Klein,et al.,(1988)Biotechnology 6:559-563(玉蜀黍);WO 91/10725(玉蜀黍);Klein,et al.,(1988)Plant Physiol.91:440-444(玉蜀黍);Fromm,et al.,(1990)Biotechnology 8:833-839;及Gordon-Kamm,et al.,(1990)Plant Cell2:603-618(玉蜀黍);Hooydaas-Van Slogteren和Hooykaas(1984)Nature(London)311:763-764;Bytebierm,et al.,(1987)Proc.Natl.Acad.Sci.USA 84:5345-5349(百合科(Liliaceae));De Wet,et al.,(1985)In TheExperimental Manipulation of Ovule Tissues,ed.G.P.Chapman,et al.,pp.197-209.Longman,NY(花粉);Kaeppler,et al.,(1990)Plant CellReports 9:415-418;及Kaeppler,et al.,(1992)Theor.Appl.Genet.84:560-566(颈须(whisker)-介导的转化);美国专利号5,693,512(超声处理法);D’Halluin,et al.,(1992)Plant Cell 4:1495-1505(电穿孔);Li,et al.,(1993)Plant Cell Reports 12:250-255;及Christou and Ford,(1995)Annals of Botany 75:407-413(稻);Osjoda,et al.,(1996)Nature Biotech.14:745-750;土壤杆菌介导的玉蜀黍转化(美国专利号5,981,840);碳化硅颈须(silicon carbide whisker)方法(Frame,et al.,(1994)Plant J.6:941-948);激光法(Guo,et al.,(1995)Physiologia Plantarum93:19-24);超声处理法(Bao,et al.,(1997)Ultrasound in Medicine &Biology 23:953-959;Finer and Finer,(2000)Lett Appl Microbiol.30:406-10;Amoah,et al.,(2001)J Exp Bot 52:1135-42);聚乙二醇方法(Krens,et al.,(1982)Nature 296:72-77);单子叶植物和双子叶植物细胞的原生质体可以利用电穿孔(Fromm,et al.,(1985)Proc.Natl.Acad.Sci.USA 82:5824-5828)和显微注射(Crossway,et al.,(1986)Mol.Gen.Genet.202:179-185)转化;其全部以引用方式并入本文中。
土壤杆菌-介导的转化
用于将表达载体引入植物的最广泛使用的方法是基于土壤杆菌的天然转化系统。根癌土壤杆菌和发根土壤杆菌是植物致病土壤细菌,其遗传转化植物细胞。根癌土壤杆菌和发根土壤杆菌的Ti和Ri质粒分别携带负责植物的遗传转化的基因。参见,例如,Kado,(1991)Crit.Rev.Plant Sci.10:1。用于土壤杆菌-介导的基因转移的土壤杆菌载体系统和方法的描述提供在Gruber,et al.,上文;Miki,et al.,上文;和Moloney,et al.,(1989)Plant Cell Reports 8:238中。
类似地,基因可以被插入分别源自根癌土壤杆菌或发根土壤杆菌的Ti或Ri质粒的T-DNA区。因此,表达盒可以利用这些质粒如上构建。许多调控序列是已知的,其在连结到异源编码序列并转化入宿主有机体时在基因表达中表现出关于最初的编码序列的组织/器官特异性的保真度(fidelity)。参见,例如,Benfey and Chua,(1989)Science 244:174-81。用在这些质粒中的特别合适的调控序列是用于多种靶植物中的基因的组成性叶子-特异性表达的启动子。其它有用的调控序列包括来自胭脂碱合酶基因(NOS)的启动子和终止子。NOS启动子和终止子存在于质粒pARC2中,可以从美国典型培养物保藏中心获得,指定为ATCC 67238。如果这样的系统被使用,来自Ti或Ri质粒的毒性(vir)基因也必需存在,或者与T-DNA部分一起,或者经由二元系统,其中vir基因存在于分开的载体上。这样的系统、用于其中的载体、及转化植物细胞的方法描述在以下中:美国专利号4,658,082;美国专利申请号913,914,1986年10月1日提交,其在美国专利号5,262,306中引用,于1993年11月16日公布(issued);及Simpson,et al.,(1986)Plant Mol.Biol.6:403-15(还在‘306专利中引用);全部以其全部内容以引用方式并入。
一旦构建,这些质粒可以被置入发根土壤杆菌或根癌土壤杆菌中,这些载体用于转化植物物种的细胞,其通常对镰孢菌属(Fusarium)或链格孢属(Alternaria)感染易感。几种其它转基因植物也由本发明预期,包括而不限于:大豆、玉米、高粱、苜蓿、稻、三叶草、甘蓝、香蕉、咖啡、芹菜、烟草、豇豆、棉花、甜瓜和胡椒。根癌土壤杆菌或发根土壤杆菌的选择将依赖于由此被转化的植物。通常,根癌土壤杆菌是用于转化的优选的有机体。大多数双子叶植物、一些裸子植物、少数单子叶植物(例如,Liliales和Arales的一些成员)对于借助根癌土壤杆菌的感染是易感的。发根土壤杆菌也具有广泛的宿主范围,包括大多数双子叶植物和一些裸子植物,其包括豆科(Leguminosae)、菊科(Compositae)、和藜科(Chenopodiaceae)的成员。现在单子叶植物可以有些成功的转化。欧洲专利申请号604662A1披露了利用土壤杆菌转化单子叶植物的方法。欧洲申请号672752A1披露了利用不成熟胚胎的盾片借助土壤杆菌转化单子叶植物的方法。Ishida,et al.论述了通过将不成熟胚胎暴露于根癌土壤杆菌转化玉蜀黍的方法(Nature Biotechnology 14:745-50(1996))。
一旦转化,这些细胞可以被用于再生转基因植物。例如,全植物可以通过弄伤(wound)所述植物并随后将载体引入受伤部位来被这些载体感染。所述植物的任何部分可以被弄伤,包括叶子、茎和根。可替换地,外植体形式的植物组织,如子叶组织或叶盘(leaf disks),可以被这些载体植入(inoculated),在促进植物再生的条件下培养。通过用包含编码烟曲霉毒素(fumonisin)降解酶的基因的发根土壤杆菌或根癌土壤杆菌植入植物组织转化的根或枝条可以用作经由体细胞胚胎发生或器官发生再生烟曲霉毒素抗性的转基因植物的植物组织的来源。用于再生植物组织的这样的方法的实例披露在以下中:Shahin,(1985)Theor.Appl.Genet.69:235-40;美国专利号4,658,082;Simpson,et al.,上文;及美国专利申请号913,913和913,914,均于1986年10月1日提交,其被引用在美国专利号5,262,306中,于1993年11月16日公布,其中披露的完整内容以引用方式并入本文中。
直接基因转移
尽管事实是土壤杆菌-介导的转化的宿主范围是广泛的,一些主要的谷类作物物种和裸子植物通常对于这种基因转移模式是抵抗的,即使最近已经在稻中实现了一些成功(Hiei,et al.,(1994)The PlantJournal 6:271-82)。植物转化的几种方法,共同地被称为直接基因转移,已经作为土壤杆菌-介导的转化的可选方法而被开发。
植物转化的通常可用的方法是微粒(microprojectile)-介导的转化,其中DNA被携带在测量约1到4μm的微粒的表面上。表达载体借助将微粒加速到足以穿透植物细胞壁和膜的300到600m/s的速度的生物射弹装置被引入植物组织中(Sanford,et al.,(1987)Part.Sci.Technol.5:27;Sanford,(1988)Trends Biotech 6:299;Sanford,(1990)Physiol.Plant 79:206;及Klein,et al.,(1992)Biotechnology 10:268)。
用于DNA物理递送到植物的另一方法是靶细胞的超声处理法(sonication),描述在Zang,et al.,(1991)BioTechnology 9:996中。可替换地,脂质体或球状质体融合体(spheroplast fusions)已经用于将表达载体引入植物中。参见,例如,Deshayes,et al.,(1985)EMBO J.4:2731;和Christou,et al.,(1987)Proc.Natl.Acad.Sci.USA 84:3962。也已经报道了利用CaCl2沉淀、聚乙烯醇、或聚-L-鸟氨酸将DNA直接摄取入原生质体。参见,例如,Hain,et al.,(1985)Mol.Gen.Genet.199:161;及Draper,et al.,(1982)Plant Cell Physiol.23:451。
已经描述了原生质体和全细胞和组织的电穿孔。参见,例如,Donn,et al.,(1990)Abstracts of the VIIth Int’l.Congress on Plant Cell andTissue Culture IAPTC,A2-38,p.53;D’Halluin,et al.,(1992)Plant Cell4:1495-505;及Spencer,et al.,(1994)Plant Mol.Biol.24:51-61。
提高NR多肽的活性和/或水平
提供了提高本发明的NR多肽的活性和/或水平的方法。本发明的NR多肽的水平和/或活性的提高可以通过向植物提供NR多肽来实现。NR多肽可以通过以下提供:将编码NR多肽的氨基酸序列引入植物中、将编码NR多肽的核苷酸序列引入植物中或可替换地通过修饰编码本发明的NR多肽的基因组基因座。
如本文其他地方论述的,用于为植物提供多肽的许多方法在本领域是已知的,包括而不限于,直接将多肽引入植物中、将编码具有提高的氮利用活性的多肽的多核苷酸构建体引入植物中(瞬时或稳定地)。还认识到本发明的方法可以采用不能在转化的植物中引导蛋白质或RNA的表达的多核苷酸。因此,NR多肽的水平和/或活性可以通过改变编码NR多肽的基因或其启动子来提高。参见,例如,Kmiec,美国专利号5,565,350;Zarling,et al.,PCT/US93/03868。因此提供了携带NR基因中的突变的诱变的植物,其中所述突变提高了NR基因的表达或者提高了编码的NR多肽的NR活性。
降低NR多肽的活性和/或水平
提供了通过用表达抑制NR多肽的表达的多核苷酸的表达盒转化植物细胞来降低或消除本发明的NR多肽的活性的方法。所述多核苷酸可以通过防止NR信使RNA的转录或翻译直接抑制NR多肽的表达,或者通过编码抑制编码NR多肽的NR基因的转录或翻译的多肽间接抑制NR多肽的表达。抑制或消除基因在植物中的表达的方法在本领域是熟知的,并且任何这样的方法可以用在本发明中以抑制NR多肽的表达。
按照本发明,如果NR多肽的蛋白质水平少于没有被遗传修饰或诱变以抑制NR多肽的表达的植物中相同的NR多肽的蛋白质水平的70%,那么NR多肽的表达被抑制。在本发明的特别实施方式中,根据本发明的修饰的植物中的NR多肽的蛋白质水平少于不是突变体或者没有被遗传修饰以抑制NR多肽的表达的植物中相同的NR多肽的蛋白质水平的60%、少于50%、少于40%、少于30%、少于20%、少于10%、少于5%、或少于2%。NR多肽的表达水平可以被直接测量,例如通过分析植物细胞或植物中表达的NR多肽的水平,或者间接地测量,例如,通过测量植物细胞或植物中NR多肽的氮摄取活性,或者通过测量植物中的表型变化。用于进行这样的分析的方法在本文其他地方描述。
在本发明的另外的实施方式中,NR多肽的活性通过用包含编码抑制NR多肽的活性的多肽的多核苷酸的表达盒转化植物细胞而被降低或消除。如果NR多肽的NR活性少于没有被修饰以抑制NR多肽的NR活性的植物中相同的NR多肽的NR活性的70%,那么根据本发明NR多肽的提高的氮利用活性被抑制。在本发明的特别实施方式中,根据本发明的修饰的植物中NR多肽的NR活性少于未被修饰以抑制NR多肽的表达的植物中的相同的NR多肽的NR活性的60%、少于50%、少于40%、少于30%、少于20%、少于10%、或少于5%。NR多肽的NR活性在其通过本文其他地方描述的分析方法不能检测到时根据本发明被“消除”。确定NR多肽的氮利用活性的改变的方法在本文其他地方描述。
在另外的实施方式中,NR多肽的活性可以通过破坏(disrupt)编码NR多肽的基因而被降低或消除。本发明包括携带NR基因中的突变的诱变的植物,其中所述突变减少NR基因的表达或抑制编码的NR多肽的氮利用活性。
因此,许多方法可以用于降低或消除NR多肽的活性。此外,超过一种方法可以用于降低单一的NR多肽的活性。
1.基于多核苷酸的方法:
在本发明的一些实施方式中,植物被能够表达抑制本发明的NR多肽的表达的多核苷酸的表达盒转化。这里所用的术语“表达”指的是基因产物的生物合成,包括所述基因产物的转录和/或翻译。例如,为了本发明的目的,能够表达抑制至少一个NR多肽的表达的多核苷酸的表达盒是能够产生抑制本发明的至少一个NR多肽的转录和/或翻译的RNA分子的表达盒。来自DNA分子的蛋白质或多肽的“表达”或“产生”指的是产生所述蛋白质或多肽的编码序列的转录和翻译,而来自RNA分子的蛋白质或多肽的“表达”或“产生”指的是RNA编码序列的翻译以产生所述蛋白质或多肽。
抑制NR多肽的表达的多核苷酸的实例在下面给出。
i.有义抑制/共抑制
在本发明的一些实施方式中,NR多肽的表达的抑制(inhibition)可以通过有义抑制(sense suppression)或共抑制(cosuppression)获得。对于共抑制,设计表达盒以表达相应于“有义”方向上编码NR多肽的信使RNA的全部或部分的RNA分子。RNA分子的过度表达可以导致天然基因的表达降低。因此,筛查被共抑制表达盒转化的多个植物系以鉴定那些表现出NR多肽表达的最大抑制的植物系。
用于共抑制的多核苷酸可以相应于编码NR多肽的序列的全部或部分、NR多肽转录物的5′和/或3′非翻译区的全部或部分、或编码NR多肽的转录物的编码序列和非翻译区的全部或部分。在一些实施方式中,其中所述多核苷酸包括NR多肽的编码区的全部或部分,所述表达盒被设计为消除所述多核苷酸的起始密码子以便将没有蛋白质产物被翻译。
共抑制可以用于抑制植物基因的表达以产生具有由这些基因编码的蛋白质的不可检测的蛋白质水平的植物。参见,例如,Broin,et al.,(2002)Plant Cell 14:1417-1432。共抑制还可以用于抑制相同的植物中多个蛋白质的表达。参见,例如,美国专利号5,942,657。用于利用共抑制以抑制植物中内源基因的表达的方法描述在以下中:Flavell,etal.,(1994)Proc.Natl.Acad.Sci.USA 91:3490-3496;Jorgensen,et al.,(1996)Plant Mol.Biol.31:957-973;Johansen and Carrington,(2001)Plant Physiol.126:930-938;Broin,et al.,(2002)Plant Cell 14:1417-1432;Stoutjesdijk,et al.,(2002)Plant Physiol.129:1723-1731;Yu,et al.,(2003)Phytochemistry 63:753-763;及美国专利号5,034,323、5,283,184、和5,942,657;其每一个以引用方式并入本文中。共抑制的效率可以通过包含有义序列的3′位置的表达盒中的聚-dT区和5′的多聚腺苷化信号而提高。参见,美国专利公开号20020048814,以引用方式并入本文中。典型地,这样的核苷酸序列具有与内源基因的转录物的序列的实质的序列同一性,最佳地大于约65%的序列同一性、更最佳地大于约85%的序列同一性,最最佳地大于约95%的序列同一性。参见美国专利号5,283,184和5,034,323;以引用方式并入本文中。
ii.反义抑制
在本发明的一些实施方式中,NR多肽的表达的抑制可以通过反义抑制获得。对于反义抑制,表达盒被设计以表达与编码NR多肽的信使RNA的全部或部分互补的RNA分子。反义RNA分子的过度表达可以导致天然基因的表达降低。因此,筛选被反义抑制表达盒转化的多个植物系以鉴定那些表现出NR多肽表达的最大抑制的植物系。
用于反义抑制中的多核苷酸可以相应于编码NR多肽的序列的互补体的全部或部分、NR转录物的5′和/或3′非翻译区的互补体的全部或部分、或者编码NR多肽的转录物的编码序列和非翻译区的互补体的全部或部分。此外,反义多核苷酸可以完全互补于(即,100%相同于靶序列的互补体)或部分互补于(即,小于100%相同于靶序列的互补体)靶序列。反义抑制可以用于抑制相同的植物中多个蛋白质的表达。参见,例如,美国专利号5,942,657。此外,反义核苷酸的部分可以用于破坏靶基因的表达。通常,可以使用至少50个核苷酸、100个核苷酸、200个核苷酸、300、400、450、500、550或更多个核苷酸的序列。用于利用反义抑制以抑制植物中内源基因的表达的方法描述在,例如,Liu,et al.,(2002)Plant Physiol.129:1732-1743及美国专利号5,759,829和5,942,657中,其每一个以引用方式并入本文中。反义抑制的效率可以通过包含反义序列的3′位置的表达盒中的聚-dT区和5′的多聚腺苷化信号而提高。参见,美国专利公开号20020048814,以引用方式并入本文中。
iii.双链RNA干扰
在本发明的一些实施方式中,NR多肽的表达的抑制可以通过双链RNA(dsRNA)干扰来获得。对于dsRNA干扰,象上述那样用于共抑制的有义RNA分子和完全或部分互补于有义RNA分子的反义RNA分子在相同的细胞中表达,导致相应内源信使RNA的表达的抑制。
有义和反义分子的表达可以通过设计表达盒以包括有义序列和反义序列而实现。可替换地,分开的表达盒可以用于有义和反义序列。随后筛查用单个dsRNA干扰表达盒或复数个表达盒转化的多个植物系以鉴定表现出最大的NR多肽表达抑制的植物系。用于利用dsRNA干扰以抑制内源植物基因的表达的方法描述在以下中:Waterhouse,etal.,(1998)Proc.Natl.Acad.Sci.USA 95:13959-13964,Liu,et al.,(2002)Plant Physiol.129:1732-1743,及WO 99/49029、WO 99/53050、WO99/61631、和WO 00/49035;其每一个以引用方式并入本文中。
iv.发卡RNA干扰和包含内含子的发卡RNA干扰
在本发明的一些实施方式中,NR多肽的表达的抑制可以通过发卡RNA(hpRNA)干扰或包含内含子的发卡RNA(ihpRNA)干扰获得。这些方法在抑制内源基因的表达中是高度有效的。参见,Waterhouse and Helliwell,(2003)Nat.Rev.Genet.4:29-38及其中引用的参考文献。
对于hpRNA干扰,表达盒被设计以表达与其本身杂交的RNA分子以形成包括单链环区和碱基配对的茎的发卡结构。碱基配对的茎区包括相应于编码其表达要被抑制的基因的内源信使RNA的全部或部分的有义序列,以及完全或部分互补于所述有义序列的反义序列。可替换地,碱基配对的茎区可以相应于调控要被抑制的基因的表达的启动子序列的部分。因此,所述分子的碱基配对的茎区通常决定RNA干扰的特异性。hpRNA分子在抑制内源基因的表达时是高度有效的,它们诱导的RNA干扰被植物的随后的世代遗传。参见,例如,Chuangand Meyerowitz,(2000)Proc.Natl.Acad.Sci.USA 97:4985-4990;Stoutjesdijk,et al.,(2002)Plant Physiol.129:1723-1731;及Waterhouseand Helliwell,(2003)Nat.Rev.Genet.4:29-38。用于利用hpRNA干扰以抑制或沉默基因表达的方法描述在,例如Chuang and Meyerowitz,(2000)Proc.Natl.Acad.Sci.USA 97:4985-4990;Stoutjesdijk,et al.,(2002)Plant Physiol.129:1723-1731;Waterhouse and Helliwell,(2003)Nat.Rev.Genet.4:29-38;Pandolfini et al.,BMC Biotechnology 3:7,及美国专利公开号2003/0175965中;其每一个以引用方式并入本文中。用于hpRNA构建体在体内沉默基因表达的效率的瞬时分析(transientassay)由Panstruga,et al.,(2003)Mol.Biol.Rep.30:135-140描述,以引用方式并入本文中。
对于ihpRNA,干扰分子具有与hpRNA相同的一般结构,但是RNA分子另外包括能够在其中iphRNA被表达的细胞中被剪接的内含子。内含子的应用最小化剪接后发卡RNA分子的环的大小,这提高了干扰的效率。参见,例如,Smith,et al.,(2000)Nature 407:319-320。实际上,Smith,et al.表明利用ihpRNA-介导的干扰100%抑制内源基因表达。用于利用ihpRNA干扰以抑制内源植物基因的表达的方法描述在以下中,例如,Smith,et al.,(2000)Nature 407:319-320;Wesley,et al.,(2001)Plant J.27:581-590;Wang and Waterhouse,(2001)Curr.Opin.Plant Biol.5:146-150;Waterhouse and Helliwell,(2003)Nat.Rev.Genet.4:29-38;Helliwell and Waterhouse,(2003)Methods 30:289-295,及美国专利公开号2003/0180945,其每一个以引用方式并入本文中。
用于hpRNA干扰的表达盒还可以被设计以便有义序列和反义序列不相应于内源RNA。在这个实施方式中,有义和反义序列在环序列的侧翼,所述环序列包括相应于靶基因的内源信使RNA的全部或部分的核苷酸序列。因此,环区决定RNA干扰的特异性。参见,例如,WO 02/00904;Mette,et al.,(2000)EMBO J 19:5194-5201;Matzke,et al.,(2001)Curr.Opin.Genet.Devel.11:221-227;Scheid,et al.,(2002)Proc.Natl.Acad.Sci.,USA 99:13659-13662;Aufsaftz,et al.,(2002)Proc.Nat’l.Acad.Sci.99(4):16499-16506;Sijen,et al.,Curr.Biol.(2001)11:436-440),以引用方式并入本文中。
v.扩增子-介导的干扰
扩增子表达盒包括植物病毒-来源的序列,其包含靶基因的全部或部分,但是通常不是天然病毒的基因的全部。表达盒的转录产物中存在的病毒序列允许转录产物引导其自身的复制。由扩增子产生的转录物可相对于靶序列(即,NR多肽的信使RNA)是有义或反义的。利用扩增子以抑制内源植物基因的表达的方法描述在,例如Angell andBaulcombe,(1997)EMBO J.16:3675-3684,Angell and Baulcombe,(1999)Plant J.20:357-362,及美国专利号6,646,805中,其每一个以引用方式并入本文中。
vi.核酶
在一些实施方式中,由本发明的表达盒表达的多核苷酸是催化RNA或具有对于NR多肽的信使RNA的特异性的核酶活性。因此,所述多核苷酸造成内源信使RNA的降解,导致NR多肽的表达减少。这个方法描述在,例如,美国专利号4,987,071中,以引用方式并入本文中。
vii.小干扰RNA或微RNA
在本发明的一些实施方式中,NR多肽的表达的抑制可以通过编码微RNA(miRNA)的基因的表达通过RNA干扰获得。miRNA是由约22个核糖核苷酸组成的调节剂。miRNA在抑制内源基因的表达中是高度有效的。参见,例如,Javier,et al.,(2003)Nature 425:257-263,以引用方式并入本文中。
对于miRNA干扰,表达盒被设计以表达在内源miRNA基因上被模式化(modeled)的RNA分子。miRNA基因编码形成包含互补于另外的内源基因(靶序列)的22-核苷酸序列的发卡结构的RNA。为了NR表达的抑制,22-核苷酸序列从NR转录物序列被选择并包含有义方向上的所述NR序列的22个核苷酸和互补于有义序列的相应的反义序列的21个核苷酸。miRNA分子在抑制内源基因的表达中是高度有效的,并且它们诱导的RNA干扰被植物的随后的世代遗传。
2.基于多肽的基因表达抑制
在一个实施方式中,所述多核苷酸编码结合于编码NR多肽的基因的锌指蛋白,导致所述基因的表达降低。在特别的实施方式中,所述锌指蛋白结合于NR基因的调节区。在另外的实施方式中,所述锌指蛋白结合于编码NR多肽的信使RNA并防止其翻译。选择用于锌指蛋白的靶向的位点的方法描述在,例如,美国专利号6,453,242中,用于利用锌指蛋白以抑制植物中基因的表达的方法描述在,例如,美国专利申请公开号2003/0037355中;其每一个以引用方式并入本文中。
3.基于多肽的蛋白质活性抑制
在本发明的一些实施方式中,所述多核苷酸编码结合于至少一个NR多肽的抗体,降低NR多肽的提高的氮利用活性。在另一实施方式中,所述抗体的结合导致通过细胞质量控制机制的抗体-NR复合体的提高的周转。抗体在植物细胞中的表达以及通过抗体的表达和结合于植物细胞中的蛋白质的分子途径的抑制在本领域是熟知的。参见,例如,Conrad and Sonnewald,(2003)Nature Biotech.21:35-36,以引用方式并入本文中。
4.基因破坏(disruption)
在本发明的一些实施方式中,NR多肽的活性通过破坏编码NR多肽的基因而被降低或消除。编码NR多肽的基因可以通过本领域已知的任何方法被破坏。例如,在一个实施方式中,所述基因通过转座子标记(tagging)被破坏。在另一实施方式中,所述基因通过利用随机或靶向的诱变来诱变植物,选择具有降低的氮利用活性的植物而被破坏。
i.转座子标记
在本发明的一个实施方式中,转座子标记被用于降低或消除一个或更多个NR多肽的NR活性。转座子标记包括在内源NR基因中插入转座子以降低或消除NR多肽的表达。“NR基因”意图指编码根据本发明的NR多肽的基因。
在这个实施方式中,一个或更多个NR多肽的表达通过在编码NR多肽的基因的调节区或编码区插入转座子而降低或消除。NR基因的外显子、内含子、5′或3′非翻译序列、启动子、或任何其它调节序列内的转座子可以被用于降低或消除编码的NR多肽的表达和/或活性。
用于植物中特异性基因的转座子标记的方法在本领域是熟知的。参见,例如,Maes,et al.,(1999)Trends Plant Sci.4:90-96;Dharmapuriand Sonti,(1999)FEMS Microbiol.Lett.179:53-59;Meissner,et al.,(2000)Plant J.22:265-274;Phogat,et al.,(2000)J.Biosci.25:57-63;Walbot,(2000)Curr.Opin.Plant Biol.2:103-107;Gai,et al.,(2000)Nucleic Acids Res.28:94-96;Fitzmaurice,et al.,(1999)Genetics153:1919-1928)。此外,用于在被选的基因中选择Mu插入的TUSC过程已经描述在Bensen,et al.,(1995)Plant Cell 7:75-84;Mena,et al.,(1996)Science 274:1537-1540;及美国专利号5,962,764中;其每一个以引用方式并入本文中。
ii.具有降低的活性的突变植物
用于减少或消除植物中内源基因的表达的另外的方法在本领域也是已知的,可以类似地应用于本发明。这些方法包括其他形式的诱变,例如甲烷磺酸乙酯(ethyl methanesulfonate)-诱导的诱变、缺失诱变、及在反求遗传学意义中使用的快中子缺失诱变(借助PCR)以鉴定其中内源基因已经缺失的植物系。这些方法的实例参见Ohshima,et al.,(1998)Virology 243:472-481;Okubara,et al.,(1994)Genetics137:867-874;及Quesada,et al.,(2000)Genetics 154:421-436,其每一个以引用方式并入本文中。此外,用于筛查化学诱导的突变的快速和可自动化的方法,TILLING(靶向基因组中诱导的局部损害(TargetingInduced Local Lesions In Genomes)),利用变性HPLC或所选的PCR产物的选择性内切核酸酶消化,也可以应用于本发明。参见,McCallum,et al.,(2000)Nat.Biotechnol.18:455-457,以引用方式并入本文中。
影响基因表达或干扰编码的蛋白质的功能(提高的氮利用活性)的突变在本领域是熟知的。基因外显子中插入的突变通常导致无效-突变体(null-mutant)。保守的残基中的突变在抑制编码的蛋白质的活性方面特别有效。已经描述了适于目的是消除NR活性的诱变的植物NR多肽的保守的残基。这样的突变体可以根据熟知的程序分离,不同NR基因座的突变可以通过遗传杂交(genetic crossing)堆叠(stack)。参见,例如,Gruis,et al.,(2002)Plant Cell 14:2863-2882。
在本发明的另一实施方式中,优势突变体由于基因倒位和双链的(duplicated)基因的基因座的重组而用于触发RNA沉默。参见,例如,Kusaba,et al.,(2003)Plant Cell 15:1455-1467。
本发明包括另外的用于降低或消除一个或更多个NR多肽的活性的方法。用于改变或突变植物中基因组核苷酸序列的其他方法的实例是本领域已知的,包括而不限于:RNA:DNA载体、RNA:DNA突变的载体、RNA:DNA修复载体、混合的双链寡核苷酸、自身互补的RNA:DNA寡核苷酸、及重组剂(recombinogenic)寡核酸碱基(oligonucleobases)的应用。这样的载体和应用方法在本领域是已知的。参见,例如,美国专利号5,565,350;5,731,181;5,756,325;5,760,012;5,795,972;和5,871,984;其每一个以引用方式并入本文中。还参见,WO 98/49350,WO 99/07865,WO 99/25821,和Beetham,et al.,(1999)Proc.Natl.Acad.Sci.USA 96:8774-8778;其每一个以引用方式并入本文中。
iii.调节氮利用活性
在特定的方法中,植物中NR调节剂的水平和/活性通过提高植物中NR多肽的水平或活性而降低。负性调节分子的提高的表达可以降低负责提高的NR表型的下游一个或更多个基因的表达水平。
用于提高植物中NR多肽的水平和/或活性的方法在本文其它地方论述。简短地,这样的方法包括将本发明的NR多肽提供给植物并由此提高NR多肽的水平和/或活性。在另外的实施方式中,编码NR多肽的NR核苷酸序列可以通过将包含本发明的NR核苷酸序列的多核苷酸引入植物中来提供,表达NR序列、提高NR多肽的活性、并由此降低植物或植物部分中组织细胞的数量。在另外的实施方式中,引入植物中的NR核苷酸构建体被稳定地并入植物的基因组中。
在另外的方法中,植物组织的生长通过降低植物中NR多肽的水平和/或活性而提高。这样的方法详细披露于本文的其他地方。在一个这样的方法中,NR核苷酸序列被引入植物中并且所述NR核苷酸序列的表达降低了NR多肽的活性,并由此提高了植物或植物部分中的组织生长。在另外的实施方式中,被引入植物中的NR核苷酸构建体被稳定的并入植物的基因组中。
如上所述,技术人员将认识到用于调节植物中NR的水平/活性的合适的启动子。用于这个实施方式的示例性的启动子已经在本文其他地方披露。
在另外的实施方式中,这样的植物已经稳定地将包含可操作地连接于驱动在植物细胞中的表达的启动子的本发明的NR核苷酸序列的核酸分子并入它们的基因组中。
iv.调节根发育
提供了用于调节植物中的根发育的方法。“调节根发育”意图指与对照植物比较时植物根的发育中的任何改变。根发育中这样的改变包括,而不限于,初生根的生长速率、新鲜根重、侧根和不定根形成的程度、维管系统(vasculature system)、分生组织发育、或径向扩张的改变。
提供了用于调节植物中根发育的方法。所述方法包括调节植物中的NR多肽的水平和/或活性。在一个方法中,本发明的NR序列被提供给植物。在另一方法中,通过将包含本发明的NR核苷酸序列的多核苷酸引入植物中提供NR核苷酸序列,表达NR序列,并且由此改变根发育。在又一方法中,被引入植物中的NR核苷酸构建体被稳定地并入植物的基因组中。
在另外的方法中,通过改变植物中NR多肽的水平或活性调节根发育。NR活性的变化可以导致至少一个或更多个根发育的下面的改变,包括而不限于,根生物量和长度的改变。
如本文所用的,“根生长”包括单子叶植物和双子叶植物中根系统发育的不同阶段组成根系统的不同部分的生长的全部方面。还将理解提高的根生长可以起因于包括初生根、侧根、不定根等的其部分的一个或更多个的提高的生长。
测量根系统中这样的发育改变的方法在本领域是已知的。参见,例如,美国专利申请公开号2003/0074698和Werner,et al.,(2001)PNAS 18:10487-10492,这两者均以引用方式并入本文中。
如上所述,技术人员将认识到用于调节植物中的根发育的合适的启动子。用于这个实施方式的示例性的启动子包括组成性启动子和根-优先(root-preferred)的启动子。示例性的根-优先的启动子已经在本文其它地方披露。
通过降低NR多肽的活性和/或水平刺激根生长和提高根质量(mass)还发现在提高植物的站立能力(standability)方面的应用。术语“对倒伏的抗性”或“站立能力”指的是植物将其本身固定于土壤的能力。对于具有直立或半直立生长习性的植物,这个术语还指的是在不利(环境)条件下维持垂直位置的能力。这个性状涉及根系统的大小、深度和形态。此外,通过改变NR多肽的水平和/或活性刺激根生长并提高根质量还发现在促进外植体的体外繁殖中的应用。
此外,由于NR活性的更高根生物量产生对产量具有直接作用,并且对由根细胞或转基因根细胞或所述转基因根细胞的细胞培养物产生的化合物的产生具有间接作用。根培养物中产生的感兴趣的化合物的一个实例是紫草宁,其产量可以通过所述方法有利地提高。
因此,本发明进一步提供了当与对照植物的根发育相比时具有调节的根发育的植物。在一些实施方式中,本发明的植物具有本发明的NR多肽的提高的水平/活性,并且具有提高的根生长和/或根生物量。在其它实施方式中,这样的植物已经将包含可操作地连接到驱动在植物细胞中的表达的启动子的本发明的NR核苷酸序列的核酸分子稳定地并入它们的基因组中。
v.调节枝条和叶子发育
还提供了用于调节植物中枝条和叶子发育的方法。“调节枝条和/或叶子发育”意指植物枝条和/或叶子的发育中的任何改变。枝条和/或叶子发育中的这样的改变包括,而不限于,枝条分生组织发育、叶子数量、叶子大小、叶子和茎维管系统、节间长度、和叶子衰老中的改变。如本文所用的,“叶子发育”和“枝条发育”包括单子叶植物和双子叶植物中,在它们发育的不同阶段,分别形成叶子系统和枝条系统的不同部分的生长的所有方面。用于测量枝条和叶子系统中这样的发育改变的方法在本领域中是已知的。参见,例如,Werner,et al.,(2001)PNAS 98:10487-10492和美国专利申请公开号2003/0074698,其每一个以引用方式并入本文中。
调节植物中枝条和/或叶子发育的方法包括调节本发明的NR多肽的活性和/或水平。在一个实施方式中,提供了本发明的NR序列。在另外的实施方式中,NR核苷酸序列可以通过将包含本发明的NR核苷酸序列的多核苷酸引入植物中而提供,表达NR序列,并由此改变枝条和/或叶子发育。在另外的实施方式中,引入植物中的NR核苷酸构建体被稳定地并入植物的基因组中。
在特定的实施方式中,通过改变植物中NR多肽的水平和/或活性调节枝条或叶子发育。NR活性的改变可以导致枝条和/或叶子发育中与对照植物相比的至少一个或更多个下面的改变,包括,而不限于,叶子数量的变化、改变的叶子表面、改变的维管系统、节间和植物生长、及叶子衰老中的改变。
如上所述,技术人员将认识到用于调节植物的枝条和叶子发育的合适的启动子。用于这个实施方式的示例性的启动子包括组成性启动子、枝条-优先的启动子、枝条分生组织-优先的启动子、及叶子-优先的启动子。示例性的启动子已经在本文其他地方披露。
提高植物中NR活性和/或水平导致改变的节间和生长。因此,本发明的方法发现在产生改变的植物中的应用。此外,如上所述,植物中的NR活性调节根和枝条生长。因此,本发明进一步提供了用于改变根/枝条比例的方法。枝条或叶子发育可以进一步通过改变植物中NR多肽的水平和/或活性而被调节。
因此,本发明进一步提供了与对照植物相比时具有调节的枝条和/或叶子发育的植物。在一些实施方式中,本发明的植物具有本发明的NR多肽的提高的水平/活性。在另外的实施方式中,本发明的植物具有降低的本发明的NR多肽的水平/活性。
vi.调节生殖组织发育
提供了用于调节生殖组织(reproductive tissue)发育的方法。在一个实施方式中,提供了调节植物中花(floral)发育的方法。“调节花发育”意指与其中NR多肽的活性或水平没有被调节的对照植物相比时植物的生殖组织的结构中的任何改变。“调节花发育”进一步包括与其中NR多肽的活性或水平没有被调节的对照植物相比时植物的生殖组织的发育的时间安排(timing)中的任何改变(即,花发育的延迟或加速的时间安排)。宏观改变可以包括以下的变化:生殖器官的大小、形状、数量、或位置、这些结构形成的发育时期、或者环境应激时维持或进行开花过程的能力。微观改变可以包括形成生殖器官的细胞的类型或形状的变化。
用于调节植物中花发育的方法包括调节植物中的NR活性。在一个方法中,提供了本发明的NR序列。NR核苷酸序列可以通过将包含本发明的NR核苷酸序列的多核苷酸引入植物中而提供,表达NR序列,并由此改变花发育。在另外的实施方式中,引入植物中的NR核苷酸构建体被稳定地并入植物的基因组中。
在特别的方法中,通过提高植物中NR多肽的水平或活性调节花发育。NR活性的变化可以导致与对照植物相比时花发育中下面的改变的至少一个或更多个,包括而不限于,改变的开花、变化的花的数量、改变的雄性不育、及改变的种子组(seed set)。诱导延迟的开花或抑制开花可以用于提高饲料作物如苜蓿的产量。用于测量花发育中这样的发育改变的方法在本领域是已知的。参见,例如,Mouradov,et al.,(2002)The Plant Cell S111-S130,以引用方式并入本文中。
如上所述,技术人员将认识到用于调节植物的花发育的合适的启动子。用于这个实施方式的示例性的启动子包括组成性启动子、可诱导的启动子、枝条-优先的启动子、及花序-优先的启动子。
在另外的方法中,通过改变本发明的NR序列的水平和/或活性调节花发育。这样的方法可以包括将NR核苷酸序列引入植物中并改变NR多肽的活性。在另外的方法中,引入植物中的NR核苷酸构建体被稳定的并入植物的基因组中。改变本发明的NR序列的表达可以调节应激期间花发育。这样的方法描述在本文的其他地方。因此,本发明进一步提供了在与对照植物的花发育相比时具有调节的花发育的植物。组成包括具有改变的本发明的NR多肽的水平/活性并具有改变的花发育的植物。组成还包括具有本发明的NR多肽的改变的水平/活性的植物,其中所述植物在应激时维持或进行开花过程。
还提供了用于利用本发明的NR序列以提高种子大小和/或重量的方法。所述方法包括提高植物或植物部分,如种子中的NR序列的活性。种子大小和/或重量的提高包括种子大小或重量的提高和/或一个或更多个种子部分(包括,例如胚胎(embryo),胚乳、种皮、糊粉、或子叶)的大小或重量的提高。
如上所述,技术人员将认识到用于提高种子大小和/或种子重量的合适的启动子。这个实施方式的示例性的启动子包括组成性启动子、可诱导的启动子、种子-优先的启动子、胚胎-优先的启动子、及胚乳-优先的启动子。
用于改变植物中种子大小和/或种子重量的方法包括提高植物中的NR活性。在一个实施方式中,NR核苷酸序列可以通过将包含本发明的NR核苷酸序列的多核苷酸引入植物来提供,表达NR序列,并由此降低种子重量和/或大小。在另外的实施方式中,引入植物中的NR核苷酸构建体被稳定地并入植物的基因组中。
进一步认识到提高种子大小和/或重量还可以伴随有幼苗的生长速度的提高或早期活力(early vigor)的提高。如本文所用的,术语“早期活力”指的是植物在早期发育中快速生长的能力,并且涉及充分发育的根系统和充分发育的光合器官(apparatus)在萌发后的成功建立。此外,种子大小和/或重量的提高还可以导致与对照相比时植物产量的提高。
因此,本发明进一步提供了与对照植物相比时具有提高的种子重量和/或种子大小的植物。在另外的实施方式中,提供了具有提高的活力和植物产量的植物。在一些实施方式中,本发明的植物具有本发明的NR多肽的改变的水平/活性并具有提高的种子重量和/或种子大小。在另外的实施方式中,这样的植物已经将包含可操作地连接到驱动在植物细胞中的表达的启动子的本发明的NR核苷酸序列的核酸分子稳定地并入它们的基因组中。
vii.NR多核苷酸、表达盒、及另外的多核苷酸的应用方法
本文披露的核苷酸、表达盒和方法可用于调节宿主植物中任何异源核苷酸序列的表达以便改变植物的表型。表型的各种变化是感兴趣的,包括改变植物中脂肪酸的组成、改变植物的氨基酸含量、改变植物的病原体防御机制等。这些结果可以通过提供植物中异源产物的表达或提高的内源产物的表达来实现。可替换地,所述结果可以通过提供植物中一个或更多个内源产物,尤其是酶或辅因子的表达的减少来实现。这些变化导致转化的植物的表型变化。
感兴趣的基因反映作物开发中涉及的那些的商业市场和兴趣。感兴趣的作物和市场改变,并且随着发展中国家打开国际市场,也将出现新的作物和技术。此外,随着我们对农艺学性状和特征(如产量和杂种优势)的理解提高,用于转化的基因的选择将因此改变。感兴趣的基因的一般种类包括,例如信息中涉及的那些基因,如锌指,传达(communication)中涉及的那些,如激酶,和管家(housekeeping)中涉及的那些,如热休克蛋白。转基因的更特别的种类,例如,包括编码农业经济学的重要性状、昆虫抗性、疾病抗性、除草剂抗性、不育性、谷粒特征、及商业产品的基因。感兴趣的基因通常包括油、淀粉、碳水化合物、或营养物代谢中涉及的那些以及影响仁(kernel)大小、蔗糖负载等的那些。
本发明的多核苷酸可以与任何基因或基因的组合堆叠以产生具有多种希望的性状组合的植物,包括而不限于对于动物饲料希望的性状,如高油基因(例如,美国专利号6,232,529);平衡的氨基酸(例如,hordothionins(美国专利号5,990,389;5,885,801;5,885,802;及5,703,409);大麦高赖氨酸(Williamson,et al.,(1987)Eur.J.Biochem.165:99-106;和WO 98/20122);及高甲硫氨酸蛋白(Pedersen,et al.,(1986)J.Biol.Chem.261:6279;Kirihara,et al.,(1988)Gene 71:359;及Musumura,et al.,(1989)Plant Mol.Biol.12:123));提高的消化性(例如,修饰的储备蛋白(美国专利申请系列号10/053,410,于2001年11月7日提交);和硫氧还蛋白(美国专利申请系列号10/005,429,于2001年12月3日提交)),其披露的内容以引用方式并入本文。本发明的多核苷酸还可以与昆虫、疾病或除草剂抗性希望的性状(例如,苏云金芽孢杆菌(Bacillus thuringiensis)毒性蛋白(美国专利号5,366,892;5,747,450;5,737,514;5723,756;5,593,881;Geiser,et al.,(1986)Gene48:109);凝集素(Van Damme,et al.,(1994)Plant Mol.Biol.24:825);烟曲霉毒素解毒基因(美国专利号5,792,931);无毒和疾病抗性基因(Jones,et al.,(1994)Science 266:789;Martin,et al.,(1993)Science262:1432;Mindrinos,et al.,(1994)Cell 78:1089);导致除草剂抗性的乙酰乳酸合酶(ALS)突变体如S4和/或Hra突变;谷氨酰胺合酶的抑制剂如膦丝菌素或basta(例如,bar基因);和草甘膦(glyphosate)抗性(EPSPS基因));以及加工或加工产品希望的性状如高油(例如,美国专利号6,232,529);修饰的油(例如,脂肪酸去饱和酶基因(美国专利No.5,952,544;WO 94/11516));改性淀粉(例如,ADPG焦磷酸化酶(AGPase),淀粉合酶(SS),淀粉分支酶(SBE)和淀粉脱支酶(SDBE));及聚合物或bioplastics(例如,美国专利号5.602,321;β-酮硫解酶(beta-ketothiolase),聚羟基丁酸合酶(polyhydroxybutyrate synthase),和乙酰乙酰-CoA还原酶(Schubert,et al.,(1988)J.Bacteriol.170:5837-5847)促进聚羟基链烷酸酯(polyhydroxyalkanoates)(PHAs)的表达),堆叠,其披露的内容以引用方式并入本文。人们还可以将本发明的多核苷酸与影响农艺学性状的多核苷酸组合,所述农艺学性状如雄性不育(例如,参见美国专利号5.583,210)、茎杆(stalk)强度、开花时间、或转化技术性状,如细胞周期调节或基因靶向(例如,WO 99/61619;WO 00/17364;WO 99/25821),其披露的内容以引用方式并入本文中。
在一个实施方式中,感兴趣的序列提高了植物生长和/或作物产量。例如,感兴趣的序列包括导致提高的初生根或侧根系统的农艺学上重要的基因。这样的基因包括,而不限于,营养素/水运输物和生长诱导物。这样的基因的实例,包括而不限于,玉蜀黍质膜H+-ATPase(MHA2)(Frias,et al.,(1996)Plant Cell 8:1533-44);AKT1,拟南芥中钾摄取器官的成分(Spalding,et al.,(1999)J Gen Physiol 113:909-18);RML基因,其激活根顶端细胞中的细胞分裂周期(Cheng,et al.,(1995)Plant Physiol 108:881);玉蜀黍谷氨酰胺合成酶基因(Sukanya,et al.,(1994)Plant Mol Biol 26:1935-46)和血红蛋白(Duff,et al.,(1997)J.Biol.Chem 27:16749-16752,Arredondo-Peter,et al.,(1997)PlantPhysiol.115:1259-1266;Arredondo-Peter,et al.,(1997)Plant Physiol114:493-500及其中引用的参考文献)。感兴趣的序列在表达负性影响根发育的基因的反义核苷酸序列中也是有用的。
此外,除了利用传统的育种方法,农艺学上重要的性状如油、淀粉、及蛋白含量可以被遗传改变。变更包括提高油酸、饱和和不饱和的油的含量、提高赖氨酸和硫的水平、提供必需氨基酸、及淀粉的修饰。Hordothionin蛋白修饰描述在美国专利号5,703,049,5,885,801,5,885,802,和5,990,389中,以引用方式并入本文中。另一实例是由大豆2S白蛋白编码的赖氨酸和/或硫丰富的种子蛋白,描述在美国专利号5,850,016中,和来自大麦的糜蛋白酶抑制剂,描述在Williamson,et al.,(1987)Eur.J.Biochem.165:99-106中,其披露的内容以引用方式并入本文中。
编码序列的衍生物可以通过定点诱变制备以提高编码的多肽中预选的氨基酸的水平。例如,编码大麦高赖氨酸多肽(BHL)的基因源自大麦糜蛋白酶抑制剂,美国专利申请系列号08/740,682,于1996年11月1日提交,以及WO 98/20133,其披露的内容以引用方式并入本文中。其它蛋白质包括甲硫氨酸丰富的植物蛋白质,如来自向日葵种子(Lilley,et al.,(1989)Proceedings of the World Congress onVegetable Protein Utilization in Human Foods and Animal Feedstuffs,ed.Applewhite(American Oil Chemists Society,Champaign,Illinois),pp.497-502;以引用方式并入本文中);玉米(Pedersen,et al.,(1986)J.Biol.Chem.261:6279;Kirihara,et al.,(1988)Gene 71:359;两者以引用方式并入本文中);以及稻(Musumura,et al.,(1989)Plant Mol.Biol.12:123,以引用方式并入本文中)。其它农艺学上重要的基因编码胶乳、Floury2、生长因子、种子储藏因子、及转录因子。
昆虫抗性基因可以编码对具有较大产量制约的害虫的抗性,如食虫、切根虫、欧洲玉米螟(European Corn Borer)等。这样的基因包括,例如,苏云金芽孢杆菌毒性蛋白基因(美国专利号5,366,892;5,747,450;5,736,514;5,723,756;5,593,881;及Geiser,et al.,(1986)Gene 48:109);等等。
编码疾病抗性性状的基因包括解毒基因、如针对fumonosin(美国专利号5,792,931);无毒(avr)和疾病抗性(R)基因(Jones,et al.,(1994)Science 266:789;Martin,et al.,(1993)Science 262:1432;及Mindrinos,et al.,(1994)Cell 78:1089);等等。
除草剂抗性性状可以包括编码对除草剂抗性的基因,其起作用以抑制乙酰乳酸合酶(ALS)的作用,尤其是磺酰脲类除草剂(例如,包含导致这样的抗性的突变的乙酰乳酸合酶(ALS)基因,尤其是S4和/或Hra突变)、编码对作用以抑制谷氨酰胺合酶的作用的除草剂的抗性的基因,如膦丝菌素或basta(例如,bar基因),或本领域已知的其它这样的基因。bar基因编码对除草剂basta的抗性,nptII基因编码对抗生素卡那霉素和遗传霉素的抗性、ALS-基因突变体编码对除草剂氯磺隆的抗性。
不育基因也可以在表达盒中编码并且提供物理去雄(physicaldetasseling)的替代。以这样的方式使用的基因的实例包括雄性组织优先的基因和具有雄性不育表型的基因,如QM,描述在美国专利号5,583,210中。其它基因包括激酶和那些编码对雄性或雌性配子体发育有毒的化合物的基因。
谷粒的质量反映在如下性状中,如饱和和不饱和的油的水平和类型、必需氨基酸的质量和量、纤维素的水平。在玉米中,修饰的hordothionin蛋白描述在美国专利号5,703,049,5,885,801,5,885,802,和5,990,389中。
商业性状也可以编码在单个基因或复数个基因上,其可以提高,例如,用于乙醇生产的淀粉,或提供蛋白的表达。转化的植物的另一重要的商业应用是聚合物和bioplastics的产生,如美国专利号5,602,321中描述的。基因如β-酮硫解酶、PHBase(聚羟基丁酸合酶)、和乙酰乙酰-CoA还原酶(参见,Schubert,et al.,(1988)J.Bacteriol.170:5837-5847)促进聚羟基链烷酸酯(PHAs)的表达。
外源产物包括植物酶和产物以及来自包括原核生物和其它真核生物的其他来源的那些。这样的产物包括酶、辅因子、激素等。蛋白质的水平,尤其是具有提高的氨基酸分布以提高植物的营养价值的修饰的蛋白质的水平,可以被提高。这通过具有提高的氨基酸含量的这样的蛋白质的表达实现。
参照下面的非限制性实施例可以更好地理解这个发明。本领域技术人员将认识到可以实践本发明的其它实施方式而不偏离本文披露和要求的本发明的精神和范围。
实施例
实施例1.NR序列的分离
在Genebank中鉴定了20,778种条斑紫菜EST然后下载。将数据集转化为fasta,格式化用于BLAST算法检索,并且利用玉蜀黍硝酸还原酶作为查询对象(query)进行检索。
可能编码硝酸还原酶基因片段的多种ESTs被鉴定,并且建立EST毗连群(contigs),补充了该基因转录区的5’-和3’-方向的EST步移(walking)和最终毗连群组合。在该毗连群组合之前,该基因和它的编码区作为仅仅代表该基因片段的短EST序列存在于公共数据库中。所得的条斑紫菜的硝酸还原酶转录物毗连群代表了5’UTR,N-末端,和除了该肽最后(C-末端)167个密码子之外的所有。
假定紫菜属的两株是紧密相关的生物,从组合的条斑紫菜硝酸还原酶基因中设计了寡核苷酸引物,有义:attgtggtgcacaacaaggtgtatga(SEQ ID NO:13)和反义引物:tcggcttccacatgttcctg(SEQ ID NO:14)。这些引物用于利用Porphyra perforata基因组DNA扩增该基因的448bp内部区域。然后利用来自Bio S&T(Montreal,Quebec,Canada)的基因组步移(walking)试剂盒确定该基因的两端,从内部片段步移出。(使用根据来自Bio S&T的提供的SOP的用于巢式PCR,连接和消化的标准条件)。对于Porphyra perforata基因发现,设计了下列步移引物-ccgtgtacctccgcaactct(SEQ ID NO:15),gctgcactttgtgcgcaacc(SEQ IDNO:16),gcatgggacgagggcaacaa(SEQ ID NO:17),gcttgcccgtcggcttccacatgtt(SEQ ID NO:18),catcgaaggctccatggtcatgcg(SEQ ID NO:19)和ctacacgccaacgtcgtctgacgca(SEQ ID NO:20)。
还假定紫菜属是紧密相关的生物,用于全长硝酸还原酶的Porphyra perforata引物用于扩增来自紧密相关的条斑紫菜红藻的基因,但在起始PCR设置中利用更低的退火温度52℃,进行40个循环。区域是确证为正确的序列,然后利用来自Bio S&T的相同基因组步移试剂盒确定连同相关非翻译区的条斑紫菜的模糊区和剩余末端。
来自两种物种的硝酸还原酶基因的全部ORF被利用高保真Taq聚合酶作为大PCR产物进行克隆,并且最少至少三个独立的克隆被用于确认正确的内部序列。利用下列引物扩增Porphyra perforata硝酸还原酶基因的ORF:有义引物:catggaggctgcttctggtgc(SEQ ID NO:21)和反义引物:tcaacgagctgcttgtgggca(SEQ ID NO:22)。利用下列引物扩增条斑紫菜硝酸还原酶基因的ORF:有义引物:cccatcaccgcacagccga(SEQ ID NO:23)和反义引物:agagaggcgccccttgcatgtt(SEQ ID NO:24)。对于该基因的大部分区域,使用更多的克隆来验证全长序列。蛋白质和核苷酸比对确认了两种基因是紧密相关的并且当与其它硝酸还原酶比较时具有许多保守的蛋白质残基。每种硝酸还原酶编码DNA序列都没有内含子。
实施例2.巴斯德毕赤酵母表达载体和酵母转化:
巴斯德毕赤酵母是非硝酸盐同化酵母并且需要功能性的硝酸转运蛋白和硝酸还原酶来摄取硝酸盐(Unkles,et al.,(2004)J.Biol.Chem.279:28182-28186)。巴斯德毕赤酵母已被用作用于鉴定和表征硝酸还原酶和/或植物硝酸转运蛋白的模型系统。当硝酸转运蛋白基因被共表达时,可体内或体外确定硝酸还原酶活性。被酵母组成性启动子(GAP启动子,甘油醛-3-磷酸脱氢酶)驱动的来自Porphyra performa(PpNR)和条斑紫菜(Porphyra yezoensis(PyNR)的野生型硝酸还原酶基因整合入携带酵母硝酸转运蛋白基因(YNT1)的巴斯德毕赤酵母菌株KM71的AOX1基因座。
细节:被GAP启动子驱动的YNT1(来自Pichia angusta的硝酸转运蛋白)(载体:p3.5GAP-YNT1)整合入巴斯德毕赤酵母菌株KM71基因组的His4基因座以产生包含YNT1的系。在通过PCR确认包含YNT1的系之后,GAP启动子驱动的PpNR或PyNR整合入基因组的AOX1基因座(载体:pAOXGAP-PPNR和PAOXGAP-PYNR)。(毕赤酵母转化试剂盒来自Invitrogen。两种表达载体主链都基于来自Invitrogen的形式进行修饰)。
在巴斯德毕赤酵母中的功能表达:筛选用p3.5GAP-YNT1和/或pAOXGAP-PPNR,pAOXGAP-PYNR转化的重组KM71的NR活性。在30℃下在丰富培养基(YPD)中培养转化体过夜。收集酵母细胞并且用水洗涤两次,然后重悬浮在含1mM NaNO3的20uM MOPS,pH6.5和1%葡萄糖中。在30℃温育2小时之后,收集上清液以2%和2%用于亚硝酸盐测定。PpNR的Vmax是Py-NR的70-80x。在巴斯德毕赤酵母中,包含PpNR的转化体显示了比PyNR强得多的体内硝酸还原酶活性。
巴斯德毕赤酵母中的动力学:体内测定用0-30mM不同硝酸盐浓度在三个PH pH5.5,6.5,和7.5温育的包含YNT1和PpNR的巴斯德毕赤酵母KM71系的亚硝酸盐浓度。PpNR在PH6.5时具有较好的Vmax。Km是大约30-40μM。该数据匹配预测的结果(公布的Km为64μM的PyNR)。同时,玉蜀黍NR,ZM-NR和来自P.angusta的酵母NR,YNR1在类似条件下测定。ZM-NR的Km为大约300uM,并且YNR1具有大约200-400μM的Km。它们也在PH6.5时具有较好的Vmax。PPNR是有效的NR,其Km是其它的十分之一。
实施例3.PpNR和PyNR突变体
为在转基因植物中维持高水平的活性形式的PPNR,位点561的推定的磷酸化基序R/K-S/T-X-pS-X-P(J.of Experimental Botany(2004)55:1275-1282)中的丝氨酸残基将被突变为丙氨酸(S561A突变体,提供的序列)或天冬氨酸(S561D突变体)。突变的PPNRs将在巴斯德毕赤酵母中产生,并且如前所述在携带YNT1的系中测试NR活性。功能性S561A或S561D将在转基因植物中表达,被组成性启动子或叶肉优选的启动子驱动。在光明/黑暗转变过程中将测试NR活性。其它推定的翻译后区域例如PPNR的N-末端区域可被修饰或缺失以在翻译后水平上由光进行去调节(de-regulate)。
实施例4.转基因植物的转化和再生
用包含可操作地连接到干旱-可诱导的启动子RAB17启动子(Vilardell,et al.,(1990)Plant Mol Biol 14:423-432)和提供对除草剂双丙氨磷(Bialaphos)的抗性的可选择的标记物基因PAT的NR序列的质粒轰击来自温室供体植物的不成熟的玉蜀黍胚胎。(Miller,et al.,(2000)Biochimica et Biophysica Acta 1465:343-358)。可替换地,可选择的标记物基因在分开的质粒上提供。转化如下进行。介质配方如下。
靶组织的制备:
穗被脱壳并在30%Clorox漂白剂加0.5%微洗涤剂(Microdetergent)中表面灭菌20分钟,用无菌水漂洗两次。不成熟的胚胎被切下并且放置在560Y培养基上4小时,胚轴侧向下(盾片侧向上),每个盘25个胚胎,随后排列在2.5-cm靶区域内准备轰击。
DNA的制备:
制备包含可操作地连接于泛素启动子的NR序列的质粒载体。这个质粒DNA加上包含PAT可选择的标记物的质粒DNA,利用如下的CaCl2沉淀程序被沉淀到1.1μm(平均直径)的钨粒上:
水中100μl制备的钨粒
Tris EDTA缓冲剂中10μl(1μg)DNA(1μg总DNA)
100μl 2.5M CaCl2
10μl 0.1M亚精胺
每个试剂被顺序地加入钨粒悬浮液,同时维持在多管涡旋机(vortexer)上。最后的混合物被简单地超声并且允许在恒定的涡旋下孵育10分钟。在沉淀期后,所述管被简单地离心,去除液体,用500ml 100%乙醇冲洗,并离心30秒。再次去除液体,将105μl 100%乙醇加到最终的钨粒沉淀物。对于基因枪(粒子枪)轰击,钨/DNA粒子被简单地超声并且10μl点到每个大运载体(macrocarrier)的中心上,并且允许在轰击前干燥约2分钟。
基因枪处理:
在基因枪中在水平#4轰击样品盘。所有的样品接受在650PSI的单击,总共10个等分试样取自制备的粒子/DNA的每个管。
随后的处理:
轰击后,胚胎被保持在560Y培养基上2天,随后转移到包含3mg/L的双丙氨磷的560R选择培养基,并每2周传代培养。在约10周的选择后,选择抵抗的愈伤组织克隆被转移到288J培养基以开始植物再生。在体细胞胚成熟后(2-4周),充分发育的体细胞胚被转移到用于萌发的培养基并转移到光亮的培养室。约7-10天后,发育中的小植物被转移到管中272V无激素培养基达7-10天直到小植物被充分地建立。随后将植物转移到包含盆栽土的平面中的插入口(insert)(相当于2.5″罐)并在生长室中生长1周,随后在温室中生长另外的1-2周,随后转移到经典的600罐(1.6加仑)并生长至成熟。对植物监测并对提高的干旱耐性计分。测量提高的干旱耐性的分析在本领域是常规的并包括,例如,在与相同的环境条件下的对照玉蜀黍植物相比时在干旱条件下提高的仁-穗容量(kernel-earring capacity)产量。可替换地,转化的植物可以被监测在分生组织发育中的调节(即,穗上小穗形成的减少)。参见,例如Bruce,et al.,(2002)Journal ofExperimental Botany 53:1-13。
轰击和培养介质:
轰击培养基(560Y)包含4.0g/l N6基础盐(basal salts)(SIGMAC-1416)、1.0ml/l Eriksson’s Vitamin Mix(1000X SIGMA-1511)、0.5mg/l硫胺素HCl、120.0g/l蔗糖、1.0mg/l 2,4-D、及2.88g/l L-脯氨酸(在用KOH调节到pH 5.8之后用D-I H2O加到体积(brought tovolume));2.0g/l Gelrite(在用D-I H2O加到体积后加入);及8.5mg/l硝酸银(在将培养基灭菌并冷却到室温后加入)。选择培养基(560R)包含4.0g/l N6基础盐(SIGMA C-1416)、1.0ml/l Eriksson’s Vitamin Mix(1000X SIGMA-1511)、0.5mg/l硫胺素HCl、30.0g/l蔗糖、及2.0mg/l 2,4-D(在用KOH调节到pH 5.8之后用D-I H2O加到体积);3.0g/l Gelrite(在用D-I H2O加到体积后加入);及0.85mg/l硝酸银和3.0mg/l双丙氨磷(bialaphos)(均在将培养基灭菌并冷却到室温后加入)。
植物再生培养基(288J)包含4.3g/l MS盐(GIBCO 11117-074)、5.0ml/l MS维生素类储备溶液(0.100g烟酸、0.02g/l硫胺素HCL、0.10g/l吡哆醇HCL、及0.40g/l甘氨酸,用精制的(polished)D-I H2O加至体积)(Murashige and Skoog(1962)Physiol.Plant.15:473)、100mg/l肌醇、0.5mg/l玉米素、60g/l蔗糖、及1.0ml/l的0.1mM脱落酸(在调整到pH5.6后用精制的D-I H2O加到体积);3.0g/l Gelrite(在用D-I H2O加到体积后加入);及1.0mg/l吲哚乙酸和3.0mg/l双丙氨磷(在将培养基灭菌并冷却到60℃后加入)。无激素培养基(272V)包含4.3g/l MS盐(GIBCO 11117-074)、5.0ml/l MS维生素类储备溶液(0.100g/l烟酸、0.02g/l硫胺素HCL、0.10g/l吡哆醇HCL、及0.40g/l甘氨酸,用精制的D-I H2O加到体积)、0.1g/l肌醇、及40.0g/l蔗糖(在调整pH到5.6后用精制的D-I H2O加到体积);及6g/l细菌培养用琼脂(bacto-agar)(在用精制的D-I H2O加到体积后加入),灭菌并冷却到60℃。
实施例5.土壤杆菌介导的转化
为了用本发明的NR序列的反义序列的土壤杆菌介导的玉蜀黍转化,优选采用Zhao的方法(美国专利号5,981,840,及PCT专利申请公开WO98/32326;其内容以引用方式并入本文中)。简短地,从玉蜀黍分离不成熟的胚胎并且将胚胎与土壤杆菌的悬浮液接触,其中细菌能够将反义NR序列转移到不成熟胚胎的至少一个的至少一个细胞(步骤1:感染步骤)。在这个步骤中不成熟的胚胎被优选地浸入土壤杆菌悬浮液用于接种的起始。胚胎与土壤杆菌共培养一段时间(步骤2:共培养步骤)。优选地,不成熟的胚胎在感染步骤后在固体培养基上培养。在这个共培养期后,预期进行可选的“静止”步骤。在这个静止步骤中,在已知抑制土壤杆菌的生长的至少一个抗生素的存在下孵育胚胎,而没有添加用于植物转化体的选择性试剂(步骤3:静止步骤)。优选地,不成熟的胚胎在具有抗生素而没有选择性试剂的固体培养基上培养,用于消除土壤杆菌并且用于感染的细胞的静止期。随后,接种的胚胎在包含选择性试剂的培养基上培养并且生长的转化的愈伤组织被回收(步骤4:选择步骤)。优选地,不成熟的胚胎在具有导致转化的细胞的选择性生长的选择性试剂的固体培养基上培养。愈伤组织随后再生为植物(步骤5:再生步骤),优选地在选择性培养基上生长的愈伤组织在固体培养基上培养以再生植物。植物被监测并对在分生组织发育中的调节计分(例如,大小的改变和枝条和花分生组织的出现和/或提高的叶子、花朵、和/或果实的产量)。
实施例6.大豆胚胎转化
如下用包含可操作地连接到泛素启动子的反义NR序列的质粒轰击大豆胚胎。为了诱导体细胞胚,从大豆栽培种A2872的表面灭菌的、不成熟的种子切下的长度为3-5mm的子叶在合适的琼脂培养基上在26℃的光亮或黑暗中培养六到十周。产生二级胚胎(secondary embryo)的体细胞胚随后被切下并置入合适的液体培养基中。在重复地选择繁殖为早期、球形期胚胎的体细胞胚的集簇后,悬浮液被如下维持。
大豆胚发生悬浮培养物可以被维持在旋转振荡器上的35ml液体介质中,150rpm,26℃,16:8小时日/夜时间表的荧光。每两周通过将约35mg的组织接种入35ml的液体培养基来传代培养培养物。
随后通过基因枪轰击的方法转化大豆胚发生悬浮培养物(Klein,etal.,(1987)Nature(London)327:70-73,美国专利号4,945,050)。DuPont Biolistic PDS1000/HE仪器(helium retrofit)可以用于这些转化。
可以用于促进大豆转化的可选择的标记物基因是由来自花椰菜花叶病毒(Cauliflower Mosaic Virus)的35S启动子(Odell,et al.,(1985)Nature 313:810-812)、来自质粒pJR225的潮霉素磷酸转移酶基因(来自大肠杆菌;Gritz,et al.,(1983)Gene 25:179-188)、及来自根癌土壤杆菌的Ti质粒的T-DNA的胭脂碱合酶基因的3′区组成的转基因。包含可操作地连接到泛素启动子的反义NR序列的表达盒可以被作为限制性片段分离。这个片段可以随后被插入携带标记物基因的载体的独特的限制性位点。
向50μl的60mg/ml 1μm金粒悬浮液中加入(按次序):5μl DNA(1μg/μl)、20μl亚精胺(0.1M)、及50μl CaCl2(2.5M)。粒子制备物随后被搅拌三分钟、在微量离心机(microfuge)中旋转(spun)10秒、去除上清液。DNA-包覆的粒子随后在400μl 70%乙醇中冲洗一次,重新悬浮在40μl的无水乙醇中。DNA/粒子悬浮液可以被超声处理三次,每次一秒。5μl的DNA-包覆的金粒子随后被加载在每个大运载盘上。
将约300-400mg的两周大的悬浮培养物置于空的60x15mm培养皿中并用吸管从组织去除残余的液体。对于每个转化实验,组织的约5-10个盘通常被轰击。膜破裂压设定在1100psi,所述室被抽空为28英寸水银的真空。所述组织被放置在离阻滞筛约3.5英寸远并被轰击三次。在轰击后,所述组织可以被分成两半,放置回液体中,并如上所述培养。
轰击后5-7天,液体介质可以用新鲜介质交换,轰击后11-12天用包含50mg/ml的潮霉素的新鲜介质交换。这个选择性介质可以每周更新。轰击后7-8周,绿色、转化的组织可以被观察到从未转化的、坏死的胚胎发生集簇生长。分离的绿色组织被去除并接种入单独的烧瓶以产生新的、克隆繁殖的、转化的胚胎发生悬浮培养物。每个新的系可以作为独立的转化事件对待。这些悬浮物可以随后被传代培养并维持为不成熟的胚胎的集簇或通过单独的体细胞胚的成熟和萌发再生为全植物。
实施例7.向日葵分生组织转化
如下用包含可操作地连接到泛素启动子的反义NR序列的表达盒转化向日葵分生组织(还参见,欧洲专利No.EP 0 486233,以引用方式并入本文中,及Malone-Schoneberg,et al.,(1994)Plant Science103:199-207)。利用单小麦头脱粒机将成熟向日葵种子(Helianthusannuus L.)去壳。种子在每50ml溶液中添加有两滴吐温20的20%Clorox漂白剂溶液中表面灭菌30分钟。所述种子用无菌蒸馏水漂洗两次。
通过Schrammeijer,et al.(Schrammeijer,et al.,(1990)Plant CellRep.9:55-60)描述的过程的改良制备分裂的(split)胚轴外植体。在表面灭菌程序后种子被吸入蒸馏水达60分钟。每个种子的子叶随后被破裂,在胚轴的面上产生清楚的裂口。在切除根尖后,外植体在初叶之间纵向对切。两半切割面朝上被放置在GBA培养基上,所述GBA培养基由Murashige和Skoog矿质元素(Murashige,et al.,(1962)Physiol.Plant.,15:473-497)、Shepard′s维生素添加剂(Shepard,(1980)in Emergent Techniques for the Genetic Improvement of Crops(University of Minnesota Press,St.Paul,Minnesota)、40mg/l硫酸腺嘌呤、30g/l蔗糖、0.5mg/l 6-苯甲基-氨基嘌呤(BAP)、0.25mg/l吲哚-3-乙酸(IAA)、0.1mg/l赤霉酸(GA3),pH 5.6,及8g/l Phytagar组成。
在土壤杆菌处理前对外植体进行微粒轰击(Bidney,et al.,(1992)Plant Mol.Biol.18:301-313)。30-40个外植体被置于为这个处理的60X20mm盘的中心的圆圈中。约4.7mg的1.8mm钨微粒被重新悬浮在25ml的无菌TE缓冲剂(10mM Tris HCl,1mM EDTA,pH 8.0)中,每个轰击使用1.5ml等分试样。每个盘通过PDS 1000
Figure GPA00001026284600651
粒子加速装置中位于样品上2cm处的150mm nytex screen被轰击两次。
去除武装的(disarmed)根癌土壤杆菌菌株EHA105被用在所有的转化实验中。包括包含可操作地连接到泛素启动子的NR基因的表达盒的二元质粒载体经由冻融引入土壤杆菌菌株EHA105,如Holsters,et al.,(1978)Mol.Gen.Genet.163:181-187所述。这个质粒进一步包含卡那霉素可选择的标记物基因(即,nptII)。用于植物转化实验的细菌在具有细菌菌株和二元质粒维持所需的合适的抗生素的液体YEP培养基(10gm/l酵母提取物,10gm/l细菌用蛋白胨(Bactopeptone),和5gm/l NaCl,pH 7.0)中过夜生长(28℃和100RPM持续搅拌)。悬浮液在达到约0.4-0.8的OD600时被使用。土壤杆菌细胞被沉淀(pelleted)并以0.5的最终OD600被重新悬浮在包含12.5mM MES pH 5.7、1gm/l NH4Cl、和0.3gm/l MgSO4的接种培养基中。
新鲜轰击的外植体被置于土壤杆菌悬浮液中,混合、不受打扰地留置30分钟。外植体随后被转移到GBA培养基并共培养、切割面朝下,26℃,每天18小时(18-hour days)。在三天的共培养后,外植体被转移到补充有250mg/l头孢噻肟(cefotaxime)和50mg/l硫酸卡那霉素的374B(GBA培养基,缺乏生长调节剂,及1%的减少的蔗糖水平)。外植体在选择上被培养2-5周,随后被转移到缺乏卡那霉素的新鲜374B培养基,用于持续的发育1-2周。没有产生适于切除的枝条的具有分化中的、抗生素抗性的生长区域的外植体被转移到包含250mg/l头孢噻肟的GBA培养基,用于第二个3天的植物激素处理。来自绿色、卡那霉素抗性的枝条的叶子样品通过ELISA被分析NPTII的存在并且通过分析在分生组织发育中的调节(即,枝条和花分生组织的大小和外观的改变)分析转基因表达的存在。
NPTII-阳性的枝条被嫁接到体外生长的向日葵幼苗根茎中的Pioneer
Figure GPA00001026284600661
杂种6440。表面灭菌的种子在48-0培养基(半强度Murashige和Skoog盐,0.5%蔗糖,0.3% gelrite,pH 5.6)中发芽并在外植体培养所描述的条件下生长。去除幼苗的上部,1cm垂直薄片在下胚轴中制备,转化的枝条被插入切口。完整的区域用石蜡封口膜(parafilm)包绕以固定枝条。嫁接的植物在体外培养的一周后被转移到土壤。土壤中的嫁接物维持在高湿度条件下,随后缓慢适应温室环境。温室中成熟的T0植物(亲代)的转化的区段通过NPTII ELISA和/或通过叶子提取物的NR活性分析鉴定,而从NPTII-阳性T0植物收获的转基因种子通过干种子子叶的小部分的NR活性分析鉴定。
可替换的向日葵转化方案允许回收转基因子代而不使用化学选择压力。种子被脱壳并在每100ml溶液添加有2-3滴吐温20的20%Clorox漂白剂溶液中表面灭菌20分钟,随后用蒸馏水漂洗3次。灭菌的种子在用水弄湿的滤纸上在黑暗中26℃吸收20小时。子叶和rootradical被去除,分生组织外植体在黑暗下在374E(GBA培养基,由MS盐,Shepard维生素,40mg/l硫酸腺嘌呤,3%蔗糖,0.5mg/l 6-BAP,0.25mg/l IAA,0.1mg/l GA,和0.8% Phytagar组成,pH 5.6)上培养24小时。去除初生叶以暴露顶端分生组织,约40个外植体被放置在374M(GBA培养基,具有1.2%Phytagar)的中心的2cm圆圈内,顶端顶面向上,随后在黑暗中在所述培养基上培养24小时。
约18.8mg的1.8μm钨粒被重新悬浮在150μl纯乙醇中。在超声后,8μl的它被滴在大运载体的表面的中心上。每个盘用650psi破裂盘(rupture discs)在26mm的Hg氦枪真空时在第一架中轰击两次。
感兴趣的质粒经由先前所述的冻融被引入根癌土壤杆菌菌株EHA105。在50μg/l的卡那霉素的存在下在液体YEP培养基(10g/l酵母提取物、10g/l细菌用蛋白胨(Bactopeptone)、及5g/l NaCl,pH7.0)中在28℃过夜生长的细菌的沉淀(pellet)被重新悬浮在接种培养基(12.5mM 2-mM 2-(N-吗啉代)乙基磺酸(ethanesulfonic acid),MES,1g/l NH4Cl和0.3g/l MgSO4,pH 5.7)中以达到在OD600的4.0的终浓度。粒子-轰击的外植体被转移到GBA培养基(374E),细菌悬浮液的小滴被直接置于分生组织的顶部上。外植体在培养基上共同培养4天,其后外植体被转移到374C培养基(GBA,具有1%蔗糖,没有BAP,IAA,GA3,补充有250μg/ml头孢噻肟)。小植物在所述培养基上在每天16小时和26℃孵育条件下培养约2周。
来自在374C培养基中培养两周的外植体(约2cm长)被筛查在分生组织发育中的调节(即,枝条和花分生组织的大小和外观的改变)。在鉴定了阳性外植体后,没有展现出改变的NR活性的那些枝条被丢弃,每个阳性外植体被再分成结节(nodal)外植体。一个结节外植体包含至少一个潜在的结节。结节节段在GBA培养基上培养三到四天以促进从每个结节的辅助芽的形成。随后它们被转移到374C培养基并允许发育另外的四周。发育中的芽被分离并在374C培养基上培养另外的4周。从每个新回收的枝条汇集的(pooled)叶子样品通过合适的蛋白活性分析再次筛查。此时,从单一的结节回收的阳性枝条将通常富集在结节培养前在最初的分析中检测的转基因节段。
对于改变的NR表达阳性的回收的枝条被嫁接到在体外生长的向日葵幼苗根茎中的Pioneer杂种6440。根茎以下面的方式制备。种子被脱壳并在每100ml溶液中添加有2到3滴吐温20的20%Clorox漂白剂溶液中表面灭菌20分钟,并用蒸馏水漂洗3次。灭菌的种子在用水润湿的滤器上发芽3天,随后它们被转移入48培养基(半强度MS盐,0.5%蔗糖,0.3%Gelrite pH 5.0)并在黑暗下在26℃生长3天,随后在每天16小时培养条件下孵育。去除选择的幼苗的上部,在每个下胚轴中制备垂直的薄片,转化的枝条被插入V-切口。切口区用石蜡封口膜包裹。在培养基上培养1周后,嫁接的植物被转移到土壤。在最初的两周内,它们被维持在高湿度条件下以适应温室环境。
实施例8.稻组织转化
NR基因的遗传确认
本领域技术人员可获得的用于将DNA转化入高等植物的细胞内的一个方法是利用包覆有感兴趣的核酸构建体的金属粒子的高速弹道轰击(参见,Klein,et al.,Nature(1987)(London)327:70-73,以及参见美国专利号4,945,050)。Biolistic PDS-1000/He(BioRADLaboratories,Hercules,CA)用于这些互补实验。粒子轰击技术用于用DNA片段转化NR突变体和野生型稻。
来自吸水链霉菌(Streptomyces hygroscopicus)提供对抗生素的抗性的细菌潮霉素B磷酸转移酶(Hpt II)基因用作稻转化的可选择的标记物。在载体中,pML18,Hpt II基因用来自花椰菜花叶病毒(Cauliflower Mosaic Virus)的35S启动子和来自根癌土壤杆菌的章鱼碱合酶基因的终止和多聚腺苷化信号工程化。pML18在WO97/47731中描述,WO 97/47731于1997年12月18日公开,其披露的内容以引用方式并入本文中。
源自发芽稻种子的盾片的胚发生愈伤组织培养物被用作转化实验的原料。这个材料通过在愈伤组织起始介质(MS盐,Nitsch和Nitsch维生素,1.0mg/l 2,4-D和10μM AgNO3)上在黑暗中在27-28℃使无菌稻种子发芽来产生。从胚胎的盾片增殖的胚发生愈伤组织被转移到CM介质(N6盐,Nitsch和Nitsch维生素,1mg/l 2,4-D,Chu,et al.,1985,Sci.Sinica 18:659-668)。愈伤组织培养物通过两周间隔的常规传代培养被维持在CM上并用于在起始的10周内的转化。
通过传代培养置于CM介质上放置的Whatman #541纸的圆圈的中心中,直径为约4cm的圆形区域中排列的间隔为约1mm的0.5-1.0mm薄片制备用于转化的愈伤组织。所述具有愈伤组织的盘在黑暗中、27-28℃孵育3-5天。在轰击前,具有愈伤组织的滤器被转移到补充有0.25M甘露醇和0.25M山梨糖醇的CM,在黑暗中达3小时。随后培养皿的盖在无菌罩中微开20-45分钟,以允许组织上的湿气消散。
每个基因组DNA片段与包含用于稻转化的可选择的标记物的pML18共沉淀到金粒的表面上。为了完成这个,以2∶1比例的性状:可选择的标记物DNA的总共10μg的DNA被加入到已经以60mgml-1的浓度被重新悬浮的金粒的50μl等分试样。氯化钙(50μl的2.5M溶液)和亚精胺(20μl的0.1M溶液)随后随着管子被涡旋3分钟被加入到金-DNA悬浮液。金粒在微量离心机中被离心1秒,去除上清液。金粒随后用1ml纯乙醇冲洗2次,随后重新悬浮在50μl的纯乙醇中并超声(bath sonicator)1秒以分散金粒。金悬浮液在-70℃被孵育5分钟并且被超声(bath sonicator)(如果需要分散粒子)。6μl的DNA-包覆的金粒子随后被加载到mylar大运载体盘上,乙醇被允许蒸发。
在干燥期末,包含组织的培养皿被置于PDS-1000/He的室中。室中的空气随后被抽空到28-29英寸Hg的真空。大运载体被用氦冲击波利用防爆膜(rupture membrane)加速,所述防爆膜在冲击管中的He压力达到1080-1100psi时破裂。组织的位置距离停止筛约8cm,愈伤组织被轰击2次。组织的2到4个盘以这种方式用DNA-包覆的金粒轰击。在轰击后,愈伤组织被转移到没有补充山梨糖醇或甘露醇的CM介质。
在轰击后3-5天内,愈伤组织被转移到SM介质(包含50mg/l潮霉素的CM培养基)。为完成这个,愈伤组织从盘转移到无菌50ml圆锥管并称重。40℃的熔化顶层-琼脂(Molten top-agar)利用2.5ml的顶层琼脂/100mg的愈伤组织被加入。愈伤组织块通过重复的通过10ml吸管的分散被碎裂成小于2mm直径的片段。3ml的愈伤组织悬浮液的等分试样被平铺在新鲜SM介质上,所述盘在黑暗中在27-28℃被孵育4周。4周后,转基因愈伤组织事件被鉴定,转移到新鲜的SM盘并在黑暗中在27-28℃生长另外的2周。
生长的愈伤组织被转移到RMl介质(MS盐,Nitsch和Nitsch维生素,2%蔗糖,3%山梨糖醇,0.4% Gelrite+50ppm hyg B)在黑暗中在25℃达2周。2周后,愈伤组织被转移到RM2介质(MS盐,Nitsch和Nitsch维生素,3%蔗糖,0.4% Gelrite+50ppm hyg B)并在冷白光下(~40μEm-2s-1),光周期为12小时,在25℃和30-40%湿度下放置。在光中2-4周后,愈伤组织开始有机化(organize),并形成枝条。枝条从周围的愈伤组织/介质去除,并温和地转移到phytatrays(SigmaChemical Co.,St.Louis,MO)中RM3介质(1/2xMS盐,Nitsch和Nitsch维生素,1%蔗糖+50ppm潮霉素B),利用先前步骤所述的相同的条件继续孵育。
在2-3周后,植物从RM3转移到包含Metro混合物350的4”罐,此时充分的根和枝条生长已经存在。从转基因植物获得的种子被检查NR突变与包含NR基因的野生型基因组DNA的遗传互补。
实施例9.NR序列的变体
A.不改变编码的氨基酸序列的NR的变体核苷酸序列
NR核苷酸序列被用于产生与相应的SEQ ID NO的起始未改变的ORF核苷酸序列相比时具有约70%、75%、80%、85%、90%、和95%的核苷酸序列同一性的开放阅读框的核苷酸序列的变体核苷酸序列。这些功能性变体利用标准密码子表产生。虽然变体的核苷酸序列被改变,但是由开放阅读框编码的氨基酸序列不变。
B.NR多肽的变体氨基酸序列
产生NR多肽的变体氨基酸序列。在这个实施例中,一个氨基酸被改变。特别地,检查开放阅读框以确定合适的氨基酸改变。改变的氨基酸的选择通过参考蛋白质比对(与来自多种物种的其它直系同源物(orthologs)和其它基因家族成员)进行。选择认为不在高选择压力下(不是高度保守的)并且相当容易由具有相似的化学性质(即,相似的功能侧链)的氨基酸替换的氨基酸。利用所述蛋白质比对,合适的氨基酸可以被改变。一旦鉴定了靶向的氨基酸,进行下面的C部分列出的程序。利用这个方法产生具有约70%、75%、80%、85%、90%、和95%的核酸序列同一性的变体。
C.NR多肽的另外的变体氨基酸序列
在这个实施例中,形成相对于参考蛋白质序列具有80%、85%、90%、和95%的同一性的人工蛋白质序列。这个后面的努力需要从比对鉴定保守和可变区,随后明智地应用氨基酸替换表。这些部分将在下面更详细的论述。
主要地,基于NR蛋白质中或其它NR多肽中的保守区进行哪些氨基酸序列被改变的确定。基于序列比对,可以可能地被改变的NR多肽的多种区以小写字母示出,而保守区以大写字母示出。认识到保守的替换可以在下面的保守区内进行而不该变功能。此外,技术人员将理解本发明的NR序列的功能变体可以具有保守的结构域中的较小的非保守的氨基酸改变。
人工蛋白质序列可以随后形成,其以80-85%、85-90%、90-95%和95-100%的区间的同一性不同于原始序列。这些间隔的中点被靶向,例如,具有加或减1%的自由活动范围。氨基酸替换将被customPerl script影响。替换表在下面的表2中提供。
表2.替换表
  氨基酸   强烈相似和最佳的替换   改变的次序等级   注释
  I   L,V   1   50:50替换
  L   I,V   2   50:50替换
  V   I,L   3   50:50替换
  氨基酸   强烈相似和最佳的替换   改变的次序等级   注释
  A   G   4
  G   A   5
  D   E   6
  E   D   7
  W   Y   8
  Y   W   9
  S   T   10
  T   S   11
  K   R   12
  R   K   13
  N   Q   14
  Q   N   15
  F   Y   16
M L 17   第一个甲硫氨酸不能改变
  H   Na   没有好的替换
  C   Na   没有好的替换
  P   Na   没有好的替换
首先,蛋白中不应该被改变的任何保守的氨基酸被鉴定并“区分”用于与替换隔离。起始甲硫氨酸将当然被自动地加到这个列表中。其次,进行改变。
在任何情况下H、C、和P不被改变。改变将首先用异亮氨酸发生,从N-末端扫到C-末端。随后亮氨酸,等等沿列表向下直到它达到希望的靶标。可以进行临时数量的替换以便不造成改变的反转。所述列表被排序1-17,因此在亮氨酸前以如所需的一样多的异亮氨酸改变开始,等等向下到甲硫氨酸。清楚地,以这种方式,许多氨基酸将不需要被改变。L、I和V将涉及两个可选的最佳替换的50:50替换。
变体氨基酸序列作为输出写出。Perl script被用于计算百分比同一性。利用这个过程,NR多肽的变体产生与SEQ ID NO:1,2,3,4,5或6的起始的ORF核苷酸序列具有约80%、85%、90%、和95%的氨基酸同一性。
实施例10.转基因玉蜀黍植物
产生包含在启动子控制下的NR构建体的T0转基因玉蜀黍植物。为改善硝酸盐同化,被组成性启动子(ZM-UBI)和组织特异启动子(ZM-NR)驱动的PPNR和PYNR(4种构建体)通过土壤杆菌被转化到转基因玉蜀黍植物中。
这些植物在温室条件中在FASTCORN系统下生长,详见美国专利申请公开号2003/0221212,美国专利申请号10/367,417。
每个植物以下面的方式被分析一个或更多个下面的特征的可测量的改变:
分析被发现对于转基因事件以1∶1分离的源自异花授精每个T0植物的T1子代在低(1mM)KNO3下的提高的生长速率,所述T0植物包含每个NR构建体的单一拷贝。在积累性植物生长时生长被监测到开花,对于转基因阳性的,转基因无效的,和非转化的对照事件,确定生长速率和穗重量。单独的植物的表型的分布与对照组的分布和所有其余的处理的分布比较。转基因平均值与总平均值,转基因位于的区段的平均值,和对应的转基因无效平均值比较,并且利用Students’t-检验检验统计学显著性。计算每个组的方差,并且调整了每个比较的平均值中的观察数之后用作Student’s t-检验的分母(denominator),即:Student’s t检验=(转基因平均值-转基因无效平均值)/Sqr(方差*(1/转基因平均值观察数+1/转基因无效平均值观察数))。随机获得计算的Student’s t-检验的概率基于Student’s t-检验的大小(magnitude)和与方差相关的自由度数量而计算。0.1(10次中一次机会随机获得结果)或更低的概率用于表明对KNO3肥力的显著响应。
实施例11.来自试验田(field plot)的转基因事件分析
在试验田中评估转基因事件,其中产量通过减少施肥30%或更多限制。转基因玉蜀黍水栽生长。这些减少的氮肥土地中转基因和非转基因植物之间产量、产量成分、或其它农艺学性状的提高用于评估由转基因事件的表达贡献的氮利用的提高。
从水栽培养基的硝酸盐去除速率,植物中硝酸盐,和总氮水平可利用常规技术确定。生长培养基中硝酸盐水平将被监测,并且与转基因无效物的生长培养基中的硝酸盐水平比较。从该培养基的硝酸盐损失速率表明硝酸盐利用效率。植物样品将被干燥,磨碎并且硝酸盐被提取和定量。通过micro-Kjeldahl确定组织中的总N(Yasuhura andNokihara(2001)“High-Throughput Analysis of Total Nitrogen Contentthat Replaces Classic Kjeldahl Method”J Agric Food Chem49:4581-4583)。在补充有建议的氮肥比率的土地中进行比较。有效的转基因事件是那些在氮-限制的和正常氮实验中实现类似的产量的事件。
实施例12.玉蜀黍回交分析
与Gaspe-3的分离的T4的回交体在包含1或2mM KNO3作为唯一氮源的营养溶液中生长直至开花。确定叶色(SPAD),茎直径,植物(vegetative)和穗干重,并且与对应的分离无效植物比较。所有处理一式9份。来自包含PpNR转基因的植物的结果显示了与非转基因对照植物相比在穗干重中(1和2mM KNO3浓度)统计学显著的(0.001水平)改善。在2mM KNO3,与非转基因对照植物相比,也注意到SPAD,穗干重和总干重中存在统计学显著的改善。这证明在5轮回交之后该基因是稳定的。
这个说明书中的所有出版物和专利申请表明这个发明所属的领域的普通技术人员的水平。所有的出版物和专利申请以与好像每个单独的出版物或专利申请以引用方式被具体和逐一的表明的相同的程度以引用方式并入本文。
已经参照各种具体和优选的实施方式和技术描述了本发明。然而,应当理解,可以进行许多改变和变更同时保持在本发明的精神和范围内。
序列表
<110>Pioneer Hi-Bred International,Inc.
 
<120>来自红藻的硝酸还原酶,组成及其使用方法
 
<130>2547
 
<150>60/944,343
<151>2007-06-15
 
<160>34
 
<170>FastSEQ for Windows Version 4.0
 
<210>1
<211>2865
<212>DNA
<213>Porphyra perforata
 
<400>1
atggaggctg cttctggtgc cctcagtgag ctccggttgg agaagggggt taagggctgg 60
gacccggtca aggtgcccgg ccggagctcc ctcaagagca cgcctatcgc caccccagag 120
ggctccctcc gcggtggctc cctctacacg gcccggtcgc agcacgcggc tggcgccaac 180
gacgtcatgg cggccaatgg ggtgtcggcg tcgagcaccg cgtcggggtt gagctttgct 240
ccttcggacg gcagtggcag tggcagtggc cgcgtcgggt ggacggagct gaacgatgct 300
ctgaacgcca agctcgcgtc caagtcgacg atgttggaca agcagcacgt tgcggacgag 360
gtggatgacc gggacgtcaa gacgccagac aactggatcc cccgccaccc ggccttgatc 420
cgtctgacgg gcaagcaccc gttcaactgt gaggcgccgc tgtcgatgct ggtggatcag 480
ggttttatca cccccccatc tctgcacttt gtgcgcaacc acggggctgc accgcagctg 540
tcttttgacg accaccggct ggaggtgacc ggcctcgtcg acactccttt gacgttgtcc 600
atggctgaca tcttggccat gccgagcgtc accatcccgg tcacgctgac gtgcgcggga 660
aaccggcgga aggagcagaa catgacaaag cagacgattg gcttctcgtg gggcgccgcc 720
gccaccagct gcaacttttg gactggcgtg cgcgtacggg atgtgcttca aaaggcgggc 780
atccagatgg acaaggcgcg ccatgtttgc tttgtgggct gtgacaacct gccggggggc 840
aagtacggca cgtcggttga cctggcgacg gccatggacc agttcgggga ggtgatgctt 900
gcgtacgagc agaacggcat ccgcctcacg cccgaccacg gcgcgcccct gcgggtggta 960
attcctgggt ggattggcgg ccgcatggtg aagtgggtga ccggcctgtc ggtaacgtcg 1020
gaagagtcgc aggagcacta tcactttttt gataaccgca tcctgccacc acacgtggac 1080
gcggagctgg ccaagtctga gggctggtgg tacaagcgcg agtacctgtt caaccagctc 1140
aatatcaact ctgccatcag ctctcctgcc aatggcgaac tgatgtccct gtcgggcgcg 1200
ggggtgtaca ccctcaaggg ttacgcctac tctggcggcg gccgcaaggt cacccgtgtg 1260
gaggtgtcgg tggacggcgg caagacttgg ctgctggcca cgttggacca ccccgaggag 1320
cggcactcgc acgctccgtc gtatggtcgc tattactgct ggtgcttctg ggagtacacc 1380
attgataagt ttgcgctgct caacgcggcg actagttcgg gcgagttgct ggtgcgtgcg 1440
tgggatgagg gcaacaatac ccagcccgcc aagctgacct ggaacttgat gggtatgggc 1500
aacaactgct acttccgcgt gacggtggcg cccaagcagt cgtcgggtga atttgcgctc 1560
gagtttctcc acccgacggt ggcgggcccc gcggagggtg gctggatgcc gccaccgcag 1620
gagtcggtag ttgcggctgc cgccgcggcg gcagtagcag agacactgaa gcggaccaaa 1680
tcggcgccgc agatgaacaa gatggaccag caggactcca agacgattac catggaggag 1740
gtggccaagc acgacacgga agaggactcg tggattgtgg tgcacaacaa ggtgtatgac 1800
tgtacgcctt tccttaagga ccaccccggt ggtggcgcca gcattgtgat gaacgcgggt 1860
gcggactgca cggaggagtt tgatgcgatc cactcaacca aggccaagtc catgctggac 1920
gactactata ttggcgaact ggccgttgag gacattgagg acgagccgga gcaaccagcc 1980
ctgcacctgt ccaagtcgtc ggtgcagctg atgaaggatg acttcaaaga gcagagcgtg 2040
cgtaaggctg tggagggtgt ggacgaggag gtcgtgacgc cggtggcact taaccccaag 2100
aagtggattc actttccgct catccagaag gaggagttga gccatgacac gcggcgcttc 2160
cgctttgggc tccccactcc tggccaccgg ttgggcctgc ctgtgggctt ccacatgttc 2220
ttgatggcca ccattgacgg tgcaatggtc atgcgggcat acacaccgac gtcgtcggac 2280
gcagagctgg gctacttcga cctggtcatc aaggtgtact ttgcaaacgt gcaccccagg 2340
ttccctgacg gtggtaagct cacccagtac atggaggaga tgtcgctggg cgacgagatt 2400
cgcgtcaagg gcccgcttgg ccacattgag taccgtagcc gcggcgagat gaccattgac 2460
ggcaagccgc ggacggtaag tgccctgacg ggcctgatgg cgggcagtgg catcacgccc 2520
ttttaccaga ttctccaggc tgtcatggcc gacccggagg acaagaccga gctgtacctc 2580
atctatgcca accagacacc ggaggatgtg ctgctgcggt cagagctgga caagatggcg 2640
gcagagcgcg acaacatcca tgtctggtac acatgcgacc gcgcgccgga ggactggaag 2700
tatgacattg gcttcatgac ggtagacatg atcaaggagc atggggcgcc ggcaggcccc 2760
gatgtgttgg gcctgtcgtg cggaccgccg ccatttatca agtttgcggc gaccccgagc 2820
ttgaccaaga acggctatgc ggaggagaac cagttcttgt tttag                 2865
 
<210>2
<211>2865
 
<212>DNA
<213>Porphyra perforata
 
<400>2
atggaagctg ccagcggcgc tctttcggaa ctgcgcttgg agaagggtgt taagggctgg 60
gacccggtta aggttcctgg caggtcaagc ttgaagagca cgcccatcgc tactcccgag 120
ggctcactcc gcggtggctc tctgtacaca gcgaggtcac aacatgctgc gggcgctaat 180
gacgttatgg ctgccaatgg tgtctctgcg tcttctacgg ccagcgggct gtctttcgct 240
ccttccgatg gttccggtag cggtagcggt cgcgtgggtt ggaccgaact caatgatgcg 300
ctcaacgcta agctggcctc caagtccacc atgctcgata agcagcacgt ggcggacgag 360
gttgatgacc gggacgtgaa gactccggac aactggattc cgcgccatcc tgccctcatc 420
cgcctgaccg ggaagcatcc tttcaactgc gaggctccgc tgtccatgct ggtggatcaa 480
gggttcatca cgccgccgag cctccacttc gttaggaatc acggcgctgc tccgcagttg 540
tccttcgacg accaccgctt ggaggtgact ggccttgtgg acactccgct gactttgagc 600
atggccgata tccttgcgat gccgagcgtc actattcccg tgactcttac ctgcgctggc 660
aaccggcgga aggagcagaa catgaccaag cagacgatcg gcttctcgtg gggtgccgct 720
gcgacctctt gcaacttctg gactggcgtg agggtgcggg atgttcttca gaaggctggc 780
atccagatgg ataaggcccg ccacgtctgc ttcgttggct gtgacaatct cccgggtggc 840
aagtatggga cgtcggtgga cctggctacc gctatggacc agttcggcga ggtgatgctg 900
gcgtacgagc agaatggcat tcgcctcacg ccagaccacg gtgcccctct tcgcgttgtt 960
atccctgggt ggattggcgg caggatggtt aagtgggtca caggcctcag cgtcactagc 1020
gaggagtccc aggagcacta ccacttcttc gacaaccgca tcttgccgcc tcacgtcgat 1080
gctgaacttg ccaagtccga aggctggtgg tacaagcgcg agtacctctt caaccagctc 1140
aacatcaaca gcgccatctc gagccctgcg aacggcgagc tcatgtcact ctcaggcgct 1200
ggcgtgtaca cccttaaggg ctacgcgtac tcaggtggcg ggaggaaggt tacgagggtt 1260
gaggtcagcg ttgacggcgg taagacttgg cttctggcca ccctcgatca tccggaagag 1320
aggcactctc atgctccttc ctatggccgc tactactgct ggtgcttctg ggagtacacc 1380
attgacaagt tcgccctcct caacgcggcc acgtcctctg gcgaactctt ggttcgcgct 1440
tgggacgaag ggaacaatac ccaacccgcg aagctcacct ggaacctgat gggcatgggc 1500
aacaactgct acttccgggt cacggtggcc ccgaagcagt cttccggcga gtttgcgctt 1560
gagtttcttc atcccaccgt tgctggccct gcagaaggcg ggtggatgcc tcctcctcaa 1620
gagtctgtgg ttgctgccgc tgctgctgcg gctgtggctg aaaccctgaa gcgcactaag 1680
gccgcgccgc agatgaacaa gatggaccag caggactcca agacgatcac gatggaggag 1740
gtcgctaagc atgacaccga ggaggactcc tggatcgtgg tgcacaacaa ggtctacgac 1800
tgcactccgt ttctcaagga ccaccctggc ggcggtgcca gcatcgtcat gaatgctggt 1860
gccgactgca cggaggaatt cgacgctatc cacagcacga aggccaagtc gatgctcgac 1920
gactactaca tcggcgagct ggccgttgag gacatagagg atgagcctga gcagccggct 1980
ctccacctct ccaagtcctc tgtgcagctc atgaaggacg acttcaagga gcagtccgtg 2040
cgcaaggctg ttgaaggcgt ggacgaagag gtcgtgactc ctgtggccct gaaccctaag 2100
aagtggattc acttcccgct catccagaag gaggaactgt cccacgatac gaggcgcttc 2160
cggtttggcc tccctacacc tggtcatcgc cttgggctcc cggtgggctt ccatatgttc 2220
ctgatggcga ccatagacgg tgctatggtg atgagggcct acacgccgac ctcctctgat 2280
gcggagctgg gctacttcga tctcgtgatc aaggtctact tcgccaatgt ccacccgcgc 2340
ttcccggacg gcggtaagtt gacgcagtac atggaggaga tgtcgctggg cgacgagatc 2400
agggttaagg gtccgcttgg ccacatcgag taccgctccc gcggcgagat gaccattgat 2460
ggcaagccaa ggaccgtctc tgctctcact ggtctcatgg ccgggtcagg catcactccc 2520
ttctaccaga tcctccaagc cgtcatggct gacccagagg acaagaccga gctctacctg 2580
atctacgcca atcagacgcc cgaggacgtg ctcctgaggt cagagctgga caagatggcc 2640
gccgagcgcg ataacatcca cgtgtggtac acttgtgaca gggcgcctga ggactggaag 2700
tacgacatcg gcttcatgac ggtggacatg atcaaggagc atggtgctcc ggctggccca 2760
gatgttcttg gcctgtcttg cggtccacca cccttcatca agttcgccgc cactccaagc 2820
ctcaccaaga acggctacgc ggaggagaac cagttcctgt tctag                 2865
 
<210>3
<211>2865
<212>DNA
<213>Porphyra perforata
 
<400>3
atggaagctg ccagcggcgc tctttcggaa ctgcgcttgg agaagggtgt taagggctgg 60
gacccggtta aggttcctgg caggtcaagc ttgaagagca cgcccatcgc tactcccgag 120
ggctcactcc gcggtggctc tctgtacaca gcgaggtcac aacatgctgc gggcgctaat 180
gacgttatgg ctgccaatgg tgtctctgcg tcttctacgg ccagcgggct gtctttcgct 240
ccttccgatg gttccggtag cggtagcggt cgcgtgggtt ggaccgaact caatgatgcg 300
ctcaacgcta agctggcctc caagtccacc atgctcgata agcagcacgt ggcggacgag 360
gttgatgacc gggacgtgaa gactccggac aactggattc cgcgccatcc tgccctcatc 420
cgcctgaccg ggaagcatcc tttcaactgc gaggctccgc tgtccatgct ggtggatcaa 480
gggttcatca cgccgccgag cctccacttc gttaggaatc acggcgctgc tccgcagttg 540
tccttcgacg accaccgctt ggaggtgact ggccttgtgg acactccgct gactttgagc 600
atggccgata tccttgcgat gccgagcgtc actattcccg tgactcttac ctgcgctggc 660
aaccggcgga aggagcagaa catgaccaag cagacgatcg gcttctcgtg gggtgccgct 720
gcgacctctt gcaacttctg gactggcgtg agggtgcggg atgttcttca gaaggctggc 780
atccagatgg ataaggcccg ccacgtctgc ttcgttggct gtgacaatct cccgggtggc 840
aagtatggga cgtcggtgga cctggctacc gctatggacc agttcggcga ggtgatgctg 900
gcgtacgagc agaatggcat tcgcctcacg ccagaccacg gtgcccctct tcgcgttgtt 960
atccctgggt ggattggcgg caggatggtt aagtgggtca caggcctcag cgtcactagc 1020
gaggagtccc aggagcacta ccacttcttc gacaaccgca tcttgccgcc tcacgtcgat 1080
gctgaacttg ccaagtccga aggctggtgg tacaagcgcg agtacctctt caaccagctc 1140
aacatcaaca gcgccatctc gagccctgcg aacggcgagc tcatgtcact ctcaggcgct 1200
ggcgtgtaca cccttaaggg ctacgcgtac tcaggtggcg ggaggaaggt tacgagggtt 1260
gaggtcagcg ttgacggcgg taagacttgg cttctggcca ccctcgatca tccggaagag 1320
aggcactctc atgctccttc ctatggccgc tactactgct ggtgcttctg ggagtacacc 1380
attgacaagt tcgccctcct caacgcggcc acgtcctctg gcgaactctt ggttcgcgct 1440
tgggacgaag ggaacaatac ccaacccgcg aagctcacct ggaacctgat gggcatgggc 1500
aacaactgct acttccgggt cacggtggcc ccgaagcagt cttccggcga gtttgcgctt 1560
gagtttcttc atcccaccgt tgctggccct gcagaaggcg ggtggatgcc tcctcctcaa 1620
gagtctgtgg ttgctgccgc tgctgctgcg gctgtggctg aaaccctgaa gcgcactaag 1680
gacgcgccgc agatgaacaa gatggaccag caggactcca agacgatcac gatggaggag 1740
gtcgctaagc atgacaccga ggaggactcc tggatcgtgg tgcacaacaa ggtctacgac 1800
tgcactccgt ttctcaagga ccaccctggc ggcggtgcca gcatcgtcat gaatgctggt 1860
gccgactgca cggaggaatt cgacgctatc cacagcacga aggccaagtc gatgctcgac 1920
gactactaca tcggcgagct ggccgttgag gacatagagg atgagcctga gcagccggct 1980
ctccacctct ccaagtcctc tgtgcagctc atgaaggacg acttcaagga gcagtccgtg 2040
cgcaaggctg ttgaaggcgt ggacgaagag gtcgtgactc ctgtggccct gaaccctaag 2100
aagtggattc acttcccgct catccagaag gaggaactgt cccacgatac gaggcgcttc 2160
cggtttggcc tccctacacc tggtcatcgc cttgggctcc cggtgggctt ccatatgttc 2220
ctgatggcga ccatagacgg tgctatggtg atgagggcct acacgccgac ctcctctgat 2280
gcggagctgg gctacttcga tctcgtgatc aaggtctact tcgccaatgt ccacccgcgc 2340
ttcccggacg gcggtaagtt gacgcagtac atggaggaga tgtcgctggg cgacgagatc 2400
agggttaagg gtccgcttgg ccacatcgag taccgctccc gcggcgagat gaccattgat 2460
ggcaagccaa ggaccgtctc tgctctcact ggtctcatgg ccgggtcagg catcactccc 2520
ttctaccaga tcctccaagc cgtcatggct gacccagagg acaagaccga gctctacctg 2580
atctacgcca atcagacgcc cgaggacgtg ctcctgaggt cagagctgga caagatggcc 2640
gccgagcgcg ataacatcca cgtgtggtac acttgtgaca gggcgcctga ggactggaag 2700
tacgacatcg gcttcatgac ggtggacatg atcaaggagc atggtgctcc ggctggccca 2760
gatgttcttg gcctgtcttg cggtccacca cccttcatca agttcgccgc cactccaagc 2820
ctcaccaaga acggctacgc ggaggagaac cagttcctgt tctag                 2865
 
<210>4
<211>2871
<212>DNA
<213>条斑紫菜
 
<400>4
atggaggccg cctcgggcgc cctcagcgag ctccggctgg agaagggggt caagggctgg 60
gaccccgtca aggtgcccag ccggagctcc ctcaagagca ccccaattgc cacccccgag 120
ggctccctcc gcggcggctc tctgtatacg acccgcgcgg cagacggcgg ggcggcgggc 180
gccaacggcg gcatggcggc caatggggtg tccacgtcgt ccacttcgtc gggactgagc 240
tttgccccgt cgggcggcag cggcagcggc agcggccgcg ttgggtggac ggagctgaac 300
aacgcgctca acgccaagct cctgtccaag tcgacgatgc tggacaagca gcacgttgcg 360
gaggaggtgg acgaccggga cgtgaagacg ccagacaact ggatcccccg ccacccggat 420
ttggtccggc tgacgggcaa gcacccgttc aactgtgagg cgccgctgtc catgctagta 480
gaccagggct tcatcacccc cccgtcgctg cactttgtac gcaaccatgg ggcggcgccg 540
cagttgtcgt ttgacgacca ccggctggag gtgagcggcc tcgtcgacac ccccctgact 600
ctttccatgg aagacatttt ggccatgcca agcgtcacca tcccagtgac gctgacgtgc 660
gcaggcaacc ggcggaagga gcagaatatg acaaagcaga ccattggttt ctcgtggggc 720
gccgcggcta ctagctgcaa cttttggacg ggcgtgcgcc tgcgggatgt gctcgagaag 780
gcgggcatcc agatggacaa ggcccgtcat gtgtgctttg tgggctgtga cgacctgcct 840
ggtggcaagt acggcacatc gattgacctg gcgacggcca tggatcagtt tggggaggtg 900
atgctcgcgt acgagcagaa tggcatccgc ctgacgcccg accatggcgc gcccctgcgg 960
gtggtgattc cagggtggat tggcggccgg atggtcaagt ggctgacggg cgtgtcggtg 1020
acagctgagg agtcacagga gcactaccac ttctttgaca accgtatcat gccgcctcac 1080
gttgacgcgg agctggccaa gtcggagggc tggtggtaca agcgggagta cctgttcaac 1140
cagctgaaca ttaactctgc catcagctcc cctgccaatg gggagctgat gtccctgtcg 1200
ggcgcggggg tgtacaccct gaagggctac gcctactctg gcggtggccg taaggtgacc 1260
cgcgtggagg tgtcggtgga cggcggtaag acgtggttgc tggccacctt ggaccaccct 1320
gaggagcgtc actctcacgc tccctcgtat ggccgctatt actgctggtg cttctgggag 1380
tacaccattg acaagtttgc cctgctaaac gcggcaacca gctcgggcga gctgctagtg 1440
cgcgcatggg acgagggcaa caacacccag cccgccaagc tgacctggaa cctgatgggc 1500
atgggcaaca actgctactt ccgtgtgacg gtggcaccta agcagtcgtc gggtgaattc 1560
gtgcttgaat ttctgcaccc gacggtgccc ggccccgcgg agggtggctg gatgccccca 1620
ccacaggagt cggtggtggc ggccgccgct gcggcagtgg tggcggagac gcttaagcgg 1680
gcgaagtcgg cgccgcagat caacaagatg gaccaggagg acaccaagac ttacaccatg 1740
gaggaggtgg ccaagcacga cacggaggag gactcttgga ttgtggtgca caacaaggtg 1800
tatgattgca cacccttcct caaggaccac cctggtggcg gcgccagtat tgtgatgaac 1860
gcgggtgccg actgcacaga ggagttcgac gcgattcact caaccaaggc caagggcatg 1920
ctggacgact attacattgg tgagctggcc atcgaggaca ttgaggacga gccggagcag 1980
ccagctctgc acatgtccaa atcgtctgtg cagctgatga aggatgactt caaggagcag 2040
agcgtccgca aggccgtgga cgatgaggaa gcagcacccg tggcgcctgt ggctctcaac 2100
cccaagaagt gggttcactt cccgctcatc cagaaggagg agctgagcca cgacacccgg 2160
cgcttccgct ttgggctccc tacagagggt caccggctgg gcttgcccgt cggcttccac 2220
atgttcctgg ccgctaccat cgaaggctcc atggtcatgc gggcctacac gccaacgtcg 2280
tcggacgcac agctggggta ctttgacctg gtcatcaagg tgtactttgc caacgtgcac 2340
cccaagttcc ctggcggtgg caagctcacc cagtacatgg aggagatgtc tcttggcgac 2400
gagattcgcg tgaaggaccc gctcggccac attgagtacc gcggccgcgg tgagatgacg 2460
attgacggca agccgcgcac ggtcagcgcc ctgacaggcc tgatggcggg gagcggcatc 2520
accccctttt accagatcct gcaggctgtc atggcggacc cagaggataa gaccgagctg 2580
tacctcatct atgccaacca gacaccggag gacgtgctgc tgcggtcaga gctggataag 2640
atggcagcgg agcgcgacaa catccacgtt tggtacacgt gcgaccgcgc accagaggac 2700
tggcagtttg acattggctt catgaccgag aagatgatca aggagcatgg ggcgccggcg 2760
ggccccgacg tgctgggcct gtcgtgcgga ccaccgccat ttatcaagtt tgcggcgacc 2820
ccaagcctga ccaagaatgg ctacgcggag gaggaccagt tcctgttcta a          2871
 
<210>5
<211>2871
<212>DNA
<213>条斑紫菜
 
<400>5
atggaggccg cttctggcgc tctcagcgag ctccgcctcg agaagggtgt gaagggctgg 60
gaccctgtga aggtgccgag ccgcagcagc ctcaagagca ctccgatcgc cacaccggag 120
ggtagcctca gaggcggcag cctctatacc actcgcgctg ccgacggtgg tgccgctggc 180
gctaatggcg gtatggctgc caacggcgtg agcaccagca gcactagcag cggcttgagc 240
ttcgccccta gcggcggttc tggtagcggt agcggtagag tgggctggac cgagctcaac 300
aacgccctca acgccaagct cctcagcaag agcaccatgc tcgacaagca gcacgtggcc 360
gaggaggtgg acgaccgcga cgttaagacc ccggacaact ggattcctcg gcatccggac 420
cttgtgcgcc tcacaggcaa gcacccgttc aactgcgagg ctccgctcag catgctcgtg 480
gaccagggct tcatcacacc gccgagcctc catttcgttc gcaaccacgg cgccgctcct 540
cagctcagct tcgacgacca ccggctcgag gtgagcggtc tcgtggacac tccgctcacc 600
ctcagcatgg aggacatcct cgccatgccg agcgtgacca ttcccgtgac cctcacttgc 660
gccggcaacc gccgcaagga gcagaacatg accaagcaga ccatcggctt cagctggggc 720
gctgccgcta ccagctgcaa cttctggaca ggtgtgcgct tgcgcgacgt tctcgagaag 780
gctggcattc agatggacaa ggcccgccac gtgtgcttcg tgggctgcga cgaccttccg 840
ggcggcaagt acggcaccag catcgacctc gccactgcta tggaccagtt cggcgaggtg 900
atgctcgcct acgagcagaa cggcatccgc cttactcctg atcacggcgc tccgcttcgc 960
gtggttatcc ctggttggat tggcggccgc atggtgaagt ggctcaccgg cgtgagcgtg 1020
accgccgagg agagccagga gcactaccac ttcttcgaca accggatcat gccgccgcac 1080
gtggatgccg agctcgccaa gtctgagggc tggtggtaca agcgcgagta cctcttcaac 1140
cagctcaaca tcaacagcgc catcagcagc ccggccaatg gcgagctcat gagcctcagc 1200
ggtgccggcg tgtacaccct caagggctat gcttacagcg gtggcggcag aaaggtgacg 1260
cgcgttgagg tgagcgtgga cggcggtaag acttggctcc tcgctaccct cgatcacccg 1320
gaggagcgcc acagccacgc tccaagctac ggccgctact actgctggtg cttctgggag 1380
tacaccatcg acaagttcgc cctcctcaac gccgccacat ctagcggcga gctcctcgtt 1440
cgggcctggg atgagggtaa caacacccag ccggccaagc tcacctggaa cttgatgggc 1500
atgggcaaca actgctactt ccgcgtgacc gtggctccaa agcagagcag cggcgagttc 1560
gtgcttgagt tcctccaccc gactgtgccg ggtcctgcag agggtggttg gatgcctccg 1620
ccgcaggaga gcgttgtggc cgctgctgct gccgctgttg tggccgagac cttgaagcgg 1680
gccaaggccg ccccgcagat caacaagatg gaccaggagg acaccaagac ctacactatg 1740
gaggaggtgg ctaagcacga caccgaggag gacagctgga tcgtggtgca caacaaggtg 1800
tacgactgca ccccgttcct caaggaccac ccgggtggcg gcgcctctat tgtgatgaac 1860
gccggcgctg actgcactga ggagttcgac gccatccaca gcaccaaggc caagggcatg 1920
ctcgacgact actacatcgg cgagctcgcc atcgaggaca tcgaggacga gccggagcag 1980
ccggccctcc acatgtctaa gagcagcgtg cagctcatga aggacgactt caaggagcag 2040
agcgtgcgca aggccgtgga cgatgaggag gctgccccag tggctccggt ggccttgaat 2100
ccgaagaagt gggtgcactt cccgctcatc cagaaggagg agctcagcca cgacacacgc 2160
cgctttcggt ttggtctccc aaccgagggc caccgccttg gcctcccggt tggctttcat 2220
atgttcctcg ccgccaccat cgagggcagc atggtgatgc gcgcctacac accgaccagc 2280
agcgatgccc agctcggcta cttcgacctc gtgatcaagg tgtacttcgc caacgtgcac 2340
cctaagttcc ctggtggcgg caagctcacc cagtacatgg aggagatgag cctcggcgac 2400
gagatccgcg tgaaggaccc actcggccat atcgagtatc gcggtcgcgg cgagatgacc 2460
attgatggca agccgcgcac tgtgagcgcc ctcaccggcc tcatggctgg tagcggcatc 2520
accccgttct accagatcct ccaggcggtg atggccgacc cggaggacaa gaccgagctc 2580
tacctcatct acgccaacca gaccccggag gacgtgctcc ttcgcagcga gctcgacaag 2640
atggccgccg agcgcgacaa cattcacgtg tggtacacct gcgaccgcgc tcctgaggac 2700
tggcagttcg acatcggctt catgaccgag aagatgatca aggagcacgg cgctcctgcc 2760
ggcccagatg tgcttggtct cagctgcggc cctccgcctt tcatcaagtt cgccgccact 2820
ccgagcctca ccaagaacgg ctacgccgag gaggaccagt tcctcttcta g          2871
 
<210>6
<211>2871
<212>DNA
<213>条斑紫菜
 
<400>6
atggaggccg cttctggcgc tctcagcgag ctccgcctcg agaagggtgt gaagggctgg 60
gaccctgtga aggtgccgag ccgcagcagc ctcaagagca ctccgatcgc cacaccggag 120
ggtagcctca gaggcggcag cctctatacc actcgcgctg ccgacggtgg tgccgctggc 180
gctaatggcg gtatggctgc caacggcgtg agcaccagca gcactagcag cggcttgagc 240
ttcgccccta gcggcggttc tggtagcggt agcggtagag tgggctggac cgagctcaac 300
aacgccctca acgccaagct cctcagcaag agcaccatgc tcgacaagca gcacgtggcc 360
gaggaggtgg acgaccgcga cgttaagacc ccggacaact ggattcctcg gcatccggac 420
cttgtgcgcc tcacaggcaa gcacccgttc aactgcgagg ctccgctcag catgctcgtg 480
gaccagggct tcatcacacc gccgagcctc catttcgttc gcaaccacgg cgccgctcct 540
cagctcagct tcgacgacca ccggctcgag gtgagcggtc tcgtggacac tccgctcacc 600
ctcagcatgg aggacatcct cgccatgccg agcgtgacca ttcccgtgac cctcacttgc 660
gccggcaacc gccgcaagga gcagaacatg accaagcaga ccatcggctt cagctggggc 720
gctgccgcta ccagctgcaa cttctggaca ggtgtgcgct tgcgcgacgt tctcgagaag 780
gctggcattc agatggacaa ggcccgccac gtgtgcttcg tgggctgcga cgaccttccg 840
ggcggcaagt acggcaccag catcgacctc gccactgcta tggaccagtt cggcgaggtg 900
atgctcgcct acgagcagaa cggcatccgc cttactcctg atcacggcgc tccgcttcgc 960
gtggttatcc ctggttggat tggcggccgc atggtgaagt ggctcaccgg cgtgagcgtg 1020
accgccgagg agagccagga gcactaccac ttcttcgaca accggatcat gccgccgcac 1080
gtggatgccg agctcgccaa gtctgagggc tggtggtaca agcgcgagta cctcttcaac 1140
cagctcaaca tcaacagcgc catcagcagc ccggccaatg gcgagctcat gagcctcagc 1200
ggtgccggcg tgtacaccct caagggctat gcttacagcg gtggcggcag aaaggtgacg 1260
cgcgttgagg tgagcgtgga cggcggtaag acttggctcc tcgctaccct cgatcacccg 1320
gaggagcgcc acagccacgc tccaagctac ggccgctact actgctggtg cttctgggag 1380
tacaccatcg acaagttcgc cctcctcaac gccgccacat ctagcggcga gctcctcgtt 1440
cgggcctggg atgagggtaa caacacccag ccggccaagc tcacctggaa cttgatgggc 1500
atgggcaaca actgctactt ccgcgtgacc gtggctccaa agcagagcag cggcgagttc 1560
gtgcttgagt tcctccaccc gactgtgccg ggtcctgcag agggtggttg gatgcctccg 1620
ccgcaggaga gcgttgtggc cgctgctgct gccgctgttg tggccgagac cttgaagcgg 1680
gccaaggacg ccccgcagat caacaagatg gaccaggagg acaccaagac ctacactatg 1740
gaggaggtgg ctaagcacga caccgaggag gacagctgga tcgtggtgca caacaaggtg 1800
tacgactgca ccccgttcct caaggaccac ccgggtggcg gcgcctctat tgtgatgaac 1860
gccggcgctg actgcactga ggagttcgac gccatccaca gcaccaaggc caagggcatg 1920
ctcgacgact actacatcgg cgagctcgcc atcgaggaca tcgaggacga gccggagcag 1980
ccggccctcc acatgtctaa gagcagcgtg cagctcatga aggacgactt caaggagcag 2040
agcgtgcgca aggccgtgga cgatgaggag gctgccccag tggctccggt ggccttgaat 2100
ccgaagaagt gggtgcactt cccgctcatc cagaaggagg agctcagcca cgacacacgc 2160
cgctttcggt ttggtctccc aaccgagggc caccgccttg gcctcccggt tggctttcat 2220
atgttcctcg ccgccaccat cgagggcagc atggtgatgc gcgcctacac accgaccagc 2280
agcgatgccc agctcggcta cttcgacctc gtgatcaagg tgtacttcgc caacgtgcac 2340
cctaagttcc ctggtggcgg caagctcacc cagtacatgg aggagatgag cctcggcgac 2400
gagatccgcg tgaaggaccc actcggccat atcgagtatc gcggtcgcgg cgagatgacc 2460
attgatggca agccgcgcac tgtgagcgcc ctcaccggcc tcatggctgg tagcggcatc 2520
accccgttct accagatcct ccaggcggtg atggccgacc cggaggacaa gaccgagctc 2580
tacctcatct acgccaacca gaccccggag gacgtgctcc ttcgcagcga gctcgacaag 2640
atggccgccg agcgcgacaa cattcacgtg tggtacacct gcgaccgcgc tcctgaggac 2700
tggcagttcg acatcggctt catgaccgag aagatgatca aggagcacgg cgctcctgcc 2760
ggcccagatg tgcttggtct cagctgcggc cctccgcctt tcatcaagtt cgccgccact 2820
ccgagcctca ccaagaacgg ctacgccgag gaggaccagt tcctcttcta g          2871
 
<210>7
<211>954
<212>PRT
<213>Porpyhra perforata
 
<400>7
Met Glu Ala Ala Ser Gly Ala Leu Ser Glu Leu Arg Leu Glu Lys Gly
 1               5                  10                  15
Val Lys Gly Trp Asp Pro Val Lys Val Pro Gly Arg Ser Ser Leu Lys
            20                  25                  30
Ser Thr Pro Ile Ala Thr Pro Glu Gly Ser Leu Arg Gly Gly Ser Leu
        35                  40                  45
Tyr Thr Ala Arg Ser Gln His Ala Ala Gly Ala Asn Asp Val Met Ala
    50                  55                  60
Ala Asn Gly Val Ser Ala Ser Ser Thr Ala Ser Gly Leu Ser Phe Ala
65                  70                  75                  80
Pro Ser Asp Gly Ser Gly Ser Gly Ser Gly Arg Val Gly Trp Thr Glu
                85                  90                  95
Leu Asn Asp Ala Leu Asn Ala Lys Leu Ala Ser Lys Ser Thr Met Leu
            100                 105                 110
Asp Lys Gln His Val Ala Asp Glu Val Asp Asp Arg Asp Val Lys Thr
        115                 120                 125
Pro Asp Asn Trp Ile Pro Arg His Pro Ala Leu Ile Arg Leu Thr Gly
    130                 135                 140
Lys His Pro Phe Asn Cys Glu Ala Pro Leu Ser Met Leu Val Asp Gln
145                 150                 155                 160
Gly Phe Ile Thr Pro Pro Ser Leu His Phe Val Arg Asn His Gly Ala
                165                 170                 175
Ala Pro Gln Leu Ser Phe Asp Asp His Arg Leu Glu Val Thr Gly Leu
            180                 185                 190
Val Asp Thr Pro Leu Thr Leu Ser Met Ala Asp Ile Leu Ala Met Pro
        195                 200                 205
Ser Val Thr Ile Pro Val Thr Leu Thr Cys Ala Gly Asn Arg Arg Lys
    210                 215                 220
Glu Gln Asn Met Thr Lys Gln Thr Ile Gly Phe Ser Trp Gly Ala Ala
225                 230                 235                 240
Ala Thr Ser Cys Asn Phe Trp Thr Gly Val Arg Val Arg Asp Val Leu
                245                 250                 255
Gln Lys Ala Gly Ile Gln Met Asp Lys Ala Arg His Val Cys Phe Val
            260                 265                 270
Gly Cys Asp Asn Leu Pro Gly Gly Lys Tyr Gly Thr Ser Val Asp Leu
        275                 280                 285
Ala Thr Ala Met Asp Gln Phe Gly Glu Val Met Leu Ala Tyr Glu Gln
    290                 295                 300
Asn Gly Ile Arg Leu Thr Pro Asp His Gly Ala Pro Leu Arg Val Val
305                 310                 315                 320
Ile Pro Gly Trp Ile Gly Gly Arg Met Val Lys Trp Val Thr Gly Leu
                325                 330                 335
Ser Val Thr Ser Glu Glu Ser Gln Glu His Tyr His Phe Phe Asp Asn
            340                 345                 350
Arg Ile Leu Pro Pro His Val Asp Ala Glu Leu Ala Lys Ser Glu Gly
        355                 360                 365
Trp Trp Tyr Lys Arg Glu Tyr Leu Phe Asn Gln Leu Asn Ile Asn Ser
    370                 375                 380
Ala Ile Ser Ser Pro Ala Asn Gly Glu Leu Met Ser Leu Ser Gly Ala
385                 390                 395                 400
Gly Val Tyr Thr Leu Lys Gly Tyr Ala Tyr Ser Gly Gly Gly Arg Lys
                405                 410                 415
Val Thr Arg Val Glu Val Ser Val Asp Gly Gly Lys Thr Trp Leu Leu
            420                 425                 430
Ala Thr Leu Asp His Pro Glu Glu Arg His Ser His Ala Pro Ser Tyr
        435                 440                 445
Gly Arg Tyr Tyr Cys Trp Cys Phe Trp Glu Tyr Thr Ile Asp Lys Phe
    450                 455                 460
Ala Leu Leu Asn Ala Ala Thr Ser Ser Gly Glu Leu Leu Val Arg Ala
465                 470                 475                 480
Trp Asp Glu Gly Asn Asn Thr Gln Pro Ala Lys Leu Thr Trp Asn Leu
                485                 490                 495
Met Gly Met Gly Asn Asn Cys Tyr Phe Arg Val Thr Val Ala Pro Lys
            500                 505                 510
Gln Ser Ser Gly Glu Phe Ala Leu Glu Phe Leu His Pro Thr Val Ala
        515                 520                 525
Gly Pro Ala Glu Gly Gly Trp Met Pro Pro Pro Gln Glu Ser Val Val
    530                 535                 540
Ala Ala Ala Ala Ala Ala Ala Val Ala Glu Thr Leu Lys Arg Thr Lys
545                 550                 555                 560
Ser Ala Pro Gln Met Asn Lys Met Asp Gln Gln Asp Ser Lys Thr Ile
                565                 570                 575
Thr Met Glu Glu Val Ala Lys His Asp Thr Glu Glu Asp Ser Trp Ile
            580                 585                 590
Val Val His Asn Lys Val Tyr Asp Cys Thr Pro Phe Leu Lys Asp His
        595                 600                 605
Pro Gly Gly Gly Ala Ser Ile Val Met Asn Ala Gly Ala Asp Cys Thr
    610                 615                 620
Glu Glu Phe Asp Ala Ile His Ser Thr Lys Ala Lys Ser Met Leu Asp
625                 630                 635                 640
Asp Tyr Tyr Ile Gly Glu Leu Ala Val Glu Asp Ile Glu Asp Glu Pro
                645                 650                 655
Glu Gln Pro Ala Leu His Leu Ser Lys Ser Ser Val Gln Leu Met Lys
            660                 665                 670
Asp Asp Phe Lys Glu Gln Ser Val Arg Lys Ala Val Glu Gly Val Asp
        675                 680                 685
Glu Glu Val Val Thr Pro Val Ala Leu Asn Pro Lys Lys Trp Ile His
    690                 695                 700
Phe Pro Leu Ile Gln Lys Glu Glu Leu Ser His Asp Thr Arg Arg Phe
705                 710                 715                 720
Arg Phe Gly Leu Pro Thr Pro Gly His Arg Leu Gly Leu Pro Val Gly
                725                 730                 735
Phe His Met Phe Leu Met Ala Thr Ile Asp Gly Ala Met Val Met Arg
            740                 745                 750
Ala Tyr Thr Pro Thr Ser Ser Asp Ala Glu Leu Gly Tyr Phe Asp Leu
        755                 760                 765
Val Ile Lys Val Tyr Phe Ala Asn Val His Pro Arg Phe Pro Asp Gly
    770                 775                 780
Gly Lys Leu Thr Gln Tyr Met Glu Glu Met Ser Leu Gly Asp Glu Ile
785                 790                 795                 800
Arg Val Lys Gly Pro Leu Gly His Ile Glu Tyr Arg Ser Arg Gly Glu
                805                 810                 815
Met Thr Ile Asp Gly Lys Pro Arg Thr Val Ser Ala Leu Thr Gly Leu
            820                 825                 830
Met Ala Gly Ser Gly Ile Thr Pro Phe Tyr Gln Ile Leu Gln Ala Val
        835                 840                 845
Met Ala Asp Pro Glu Asp Lys Thr Glu Leu Tyr Leu Ile Tyr Ala Asn
    850                 855                 860
Gln Thr Pro Glu Asp Val Leu Leu Arg Ser Glu Leu Asp Lys Met Ala
865                 870                 875                 880
Ala Glu Arg Asp Asn Ile His Val Trp Tyr Thr Cys Asp Arg Ala Pro
                885                 890                 895
Glu Asp Trp Lys Tyr Asp Ile Gly Phe Met Thr Val Asp Met Ile Lys
            900                 905                 910
Glu His Gly Ala Pro Ala Gly Pro Asp Val Leu Gly Leu Ser Cys Gly
        915                 920                 925
Pro Pro Pro Phe Ile Lys Phe Ala Ala Thr Pro Ser Leu Thr Lys Asn
    930                 935                 940
Gly Tyr Ala Glu Glu Asn Gln Phe Leu Phe
945                 950
 
<210>8
<211>954
<212>PRT
<213>Porphyra perforata
 
<400>8
Met Glu Ala Ala Ser Gly Ala Leu Ser Glu Leu Arg Leu Glu Lys Gly
 1               5                  10                  15
Val Lys Gly Trp Asp Pro Val Lys Val Pro Gly Arg Ser Ser Leu Lys
            20                  25                  30
Ser Thr Pro Ile Ala Thr Pro Glu Gly Ser Leu Arg Gly Gly Ser Leu
        35                  40                  45
Tyr Thr Ala Arg Ser Gln His Ala Ala Gly Ala Asn Asp Val Met Ala
    50                  55                  60
Ala Asn Gly Val Ser Ala Ser Ser Thr Ala Ser Gly Leu Ser Phe Ala
65                  70                  75                  80
Pro Ser Asp Gly Ser Gly Ser Gly Ser Gly Arg Val Gly Trp Thr Glu
                85                  90                  95
Leu Asn Asp Ala Leu Asn Ala Lys Leu Ala Ser Lys Ser Thr Met Leu
            100                 105                 110
Asp Lys Gln His Val Ala Asp Glu Val Asp Asp Arg Asp Val Lys Thr
        115                 120                 125
Pro Asp Asn Trp Ile Pro Arg His Pro Ala Leu Ile Arg Leu Thr Gly
    130                 135                 140
Lys His Pro Phe Asn Cys Glu Ala Pro Leu Ser Met Leu Val Asp Gln
145                 150                 155                 160
Gly Phe Ile Thr Pro Pro Ser Leu His Phe Val Arg Asn His Gly Ala
                165                 170                 175
Ala Pro Gln Leu Ser Phe Asp Asp His Arg Leu Glu Val Thr Gly Leu
            180                 185                 190
Val Asp Thr Pro Leu Thr Leu Ser Met Ala Asp Ile Leu Ala Met Pro
        195                 200                 205
Ser Val Thr Ile Pro Val Thr Leu Thr Cys Ala Gly Asn Arg Arg Lys
    210                 215                 220
Glu Gln Asn Met Thr Lys Gln Thr Ile Gly Phe Ser Trp Gly Ala Ala
225                 230                 235                 240
Ala Thr Ser Cys Asn Phe Trp Thr Gly Val Arg Val Arg Asp Val Leu
                245                 250                 255
Gln Lys Ala Gly Ile Gln Met Asp Lys Ala Arg His Val Cys Phe Val
            260                 265                 270
Gly Cys Asp Asn Leu Pro Gly Gly Lys Tyr Gly Thr Ser Val Asp Leu
        275                 280                 285
Ala Thr Ala Met Asp Gln Phe Gly Glu Val Met Leu Ala Tyr Glu Gln
    290                 295                 300
Asn Gly Ile Arg Leu Thr Pro Asp His Gly Ala Pro Leu Arg Val Val
305                 310                 315                 320
Ile Pro Gly Trp Ile Gly Gly Arg Met Val Lys Trp Val Thr Gly Leu
                325                 330                 335
Ser Val Thr Ser Glu Glu Ser Gln Glu His Tyr His Phe Phe Asp Asn
            340                 345                 350
Arg Ile Leu Pro Pro His Val Asp Ala Glu Leu Ala Lys Ser Glu Gly
        355                 360                 365
Trp Trp Tyr Lys Arg Glu Tyr Leu Phe Asn Gln Leu Asn Ile Asn Ser
    370                 375                 380
Ala Ile Ser Ser Pro Ala Asn Gly Glu Leu Met Ser Leu Ser Gly Ala
385                 390                 395                 400
Gly Val Tyr Thr Leu Lys Gly Tyr Ala Tyr Ser Gly Gly Gly Arg Lys
                405                 410                 415
Val Thr Arg Val Glu Val Ser Val Asp Gly Gly Lys Thr Trp Leu Leu
            420                 425                 430
Ala Thr Leu Asp His Pro Glu Glu Arg His Ser His Ala Pro Ser Tyr
        435                 440                 445
Gly Arg Tyr Tyr Cys Trp Cys Phe Trp Glu Tyr Thr Ile Asp Lys Phe
    450                 455                 460
Ala Leu Leu Asn Ala Ala Thr Ser Ser Gly Glu Leu Leu Val Arg Ala
465                 470                 475                 480
Trp Asp Glu Gly Asn Asn Thr Gln Pro Ala Lys Leu Thr Trp Asn Leu
                485                 490                 495
Met Gly Met Gly Asn Asn Cys Tyr Phe Arg Val Thr Val Ala Pro Lys
            500                 505                 510
Gln Ser Ser Gly Glu Phe Ala Leu Glu Phe Leu His Pro Thr Val Ala
        515                 520                 525
Gly Pro Ala Glu Gly Gly Trp Met Pro Pro Pro Gln Glu Ser Val Val
    530                 535                 540
Ala Ala Ala Ala Ala Ala Ala Val Ala Glu Thr Leu Lys Arg Thr Lys
545                 550                 555                 560
Ala Ala Pro Gln Met Asn Lys Met Asp Gln Gln Asp Ser Lys Thr Ile
                565                 570                 575
Thr Met Glu Glu Val Ala Lys His Asp Thr Glu Glu Asp Ser Trp Ile
            580                 585                 590
Val Val His Asn Lys Val Tyr Asp Cys Thr Pro Phe Leu Lys Asp His
        595                 600                 605
Pro Gly Gly Gly Ala Ser Ile Val Met Asn Ala Gly Ala Asp Cys Thr
    610                 615                 620
Glu Glu Phe Asp Ala Ile His Ser Thr Lys Ala Lys Ser Met Leu Asp
625                 630                 635                 640
Asp Tyr Tyr Ile Gly Glu Leu Ala Val Glu Asp Ile Glu Asp Glu Pro
                645                 650                 655
Glu Gln Pro Ala Leu His Leu Ser Lys Ser Ser Val Gln Leu Met Lys
            660                 665                 670
Asp Asp Phe Lys Glu Gln Ser Val Arg Lys Ala Val Glu Gly Val Asp
        675                 680                 685
Glu Glu Val Val Thr Pro Val Ala Leu Asn Pro Lys Lys Trp Ile His
    690                 695                 700
Phe Pro Leu Ile Gln Lys Glu Glu Leu Ser His Asp Thr Arg Arg Phe
705                 710                 715                 720
Arg Phe Gly Leu Pro Thr Pro Gly His Arg Leu Gly Leu Pro Val Gly
                725                 730                 735
Phe His Met Phe Leu Met Ala Thr Ile Asp Gly Ala Met Val Met Arg
            740                 745                 750
Ala Tyr Thr Pro Thr Ser Ser Asp Ala Glu Leu Gly Tyr Phe Asp Leu
        755                 760                 765
Val Ile Lys Val Tyr Phe Ala Asn Val His Pro Arg Phe Pro Asp Gly
    770                 775                 780
Gly Lys Leu Thr Gln Tyr Met Glu Glu Met Ser Leu Gly Asp Glu Ile
785                 790                 795                 800
Arg Val Lys Gly Pro Leu Gly His Ile Glu Tyr Arg Ser Arg Gly Glu
                805                 810                 815
Met Thr Ile Asp Gly Lys Pro Arg Thr Val Ser Ala Leu Thr Gly Leu
            820                 825                 830
Met Ala Gly Ser Gly Ile Thr Pro Phe Tyr Gln Ile Leu Gln Ala Val
        835                 840                 845
Met Ala Asp Pro Glu Asp Lys Thr Glu Leu Tyr Leu Ile Tyr Ala Asn
    850                 855                 860
Gln Thr Pro Glu Asp Val Leu Leu Arg Ser Glu Leu Asp Lys Met Ala
865                 870                 875                 880
Ala Glu Arg Asp Asn Ile His Val Trp Tyr Thr Cys Asp Arg Ala Pro
                885                 890                 895
Glu Asp Trp Lys Tyr Asp Ile Gly Phe Met Thr Val Asp Met Ile Lys
            900                 905                 910
Glu His Gly Ala Pro Ala Gly Pro Asp Val Leu Gly Leu Ser Cys Gly
        915                 920                 925
Pro Pro Pro Phe Ile Lys Phe Ala Ala Thr Pro Ser Leu Thr Lys Asn
    930                 935                 940
Gly Tyr Ala Glu Glu Asn Gln Phe Leu Phe
945                 950
 
<210>9
<211>954
<212>PRT
<213>Porphyra perforata
 
<400>9
Met Glu Ala Ala Ser Gly Ala Leu Ser Glu Leu Arg Leu Glu Lys Gly
 1               5                  10                  15
Val Lys Gly Trp Asp Pro Val Lys Val Pro Gly Arg Ser Ser Leu Lys
            20                  25                  30
Ser Thr Pro Ile Ala Thr Pro Glu Gly Ser Leu Arg Gly Gly Ser Leu
        35                  40                  45
Tyr Thr Ala Arg Ser Gln His Ala Ala Gly Ala Asn Asp Val Met Ala
    50                  55                  60
Ala Asn Gly Val Ser Ala Ser Ser Thr Ala Ser Gly Leu Ser Phe Ala
65                  70                  75                  80
Pro Ser Asp Gly Ser Gly Ser Gly Ser Gly Arg Val Gly Trp Thr Glu
                85                  90                  95
Leu Asn Asp Ala Leu Asn Ala Lys Leu Ala Ser Lys Ser Thr Met Leu
            100                 105                 110
Asp Lys Gln His Val Ala Asp Glu Val Asp Asp Arg Asp Val Lys Thr
        115                 120                 125
Pro Asp Asn Trp Ile Pro Arg His Pro Ala Leu Ile Arg Leu Thr Gly
    130                 135                 140
Lys His Pro Phe Asn Cys Glu Ala Pro Leu Ser Met Leu Val Asp Gln
145                 150                 155                 160
Gly Phe Ile Thr Pro Pro Ser Leu His Phe Val Arg Asn His Gly Ala
                165                 170                 175
Ala Pro Gln Leu Ser Phe Asp Asp His Arg Leu Glu Val Thr Gly Leu
            180                 185                 190
Val Asp Thr Pro Leu Thr Leu Ser Met Ala Asp Ile Leu Ala Met Pro
        195                 200                 205
Ser Val Thr Ile Pro Val Thr Leu Thr Cys Ala Gly Asn Arg Arg Lys
    210                 215                 220
Glu Gln Asn Met Thr Lys Gln Thr Ile Gly Phe Ser Trp Gly Ala Ala
225                 230                 235                 240
Ala Thr Ser Cys Asn Phe Trp Thr Gly Val Arg Val Arg Asp Val Leu
                245                 250                 255
Gln Lys Ala Gly Ile Gln Met Asp Lys Ala Arg His Val Cys Phe Val
            260                 265                 270
Gly Cys Asp Asn Leu Pro Gly Gly Lys Tyr Gly Thr Ser Val Asp Leu
        275                 280                 285
Ala Thr Ala Met Asp Gln Phe Gly Glu Val Met Leu Ala Tyr Glu Gln
    290                 295                 300
Asn Gly Ile Arg Leu Thr Pro Asp His Gly Ala Pro Leu Arg Val Val
305                 310                 315                 320
Ile Pro Gly Trp Ile Gly Gly Arg Met Val Lys Trp Val Thr Gly Leu
                325                 330                 335
Ser Val Thr Ser Glu Glu Ser Gln Glu His Tyr His Phe Phe Asp Asn
            340                 345                 350
Arg Ile Leu Pro Pro His Val Asp Ala Glu Leu Ala Lys Ser Glu Gly
        355                 360                 365
Trp Trp Tyr Lys Arg Glu Tyr Leu Phe Asn Gln Leu Asn Ile Asn Ser
    370                 375                 380
Ala Ile Ser Ser Pro Ala Asn Gly Glu Leu Met Ser Leu Ser Gly Ala
385                 390                 395                 400
Gly Val Tyr Thr Leu Lys Gly Tyr Ala Tyr Ser Gly Gly Gly Arg Lys
                405                 410                 415
Val Thr Arg Val Glu Val Ser Val Asp Gly Gly Lys Thr Trp Leu Leu
            420                 425                 430
Ala Thr Leu Asp His Pro Glu Glu Arg His Ser His Ala Pro Ser Tyr
        435                 440                 445
Gly Arg Tyr Tyr Cys Trp Cys Phe Trp Glu Tyr Thr Ile Asp Lys Phe
    450                 455                 460
Ala Leu Leu Asn Ala Ala Thr Ser Ser Gly Glu Leu Leu Val Arg Ala
465                 470                 475                 480
Trp Asp Glu Gly Asn Asn Thr Gln Pro Ala Lys Leu Thr Trp Asn Leu
                485                 490                 495
Met Gly Met Gly Asn Asn Cys Tyr Phe Arg Val Thr Val Ala Pro Lys
            500                 505                 510
Gln Ser Ser Gly Glu Phe Ala Leu Glu Phe Leu His Pro Thr Val Ala
        515                 520                 525
Gly Pro Ala Glu Gly Gly Trp Met Pro Pro Pro Gln Glu Ser Val Val
    530                 535                 540
Ala Ala Ala Ala Ala Ala Ala Val Ala Glu Thr Leu Lys Arg Thr Lys
545                 550                 555                 560
Asp Ala Pro Gln Met Asn Lys Met Asp Gln Gln Asp Ser Lys Thr Ile
                565                 570                 575
Thr Met Glu Glu Val Ala Lys His Asp Thr Glu Glu Asp Ser Trp Ile
            580                 585                 590
Val Val His Asn Lys Val Tyr Asp Cys Thr Pro Phe Leu Lys Asp His
        595                 600                 605
Pro Gly Gly Gly Ala Ser Ile Val Met Asn Ala Gly Ala Asp Cys Thr
    610                 615                 620
Glu Glu Phe Asp Ala Ile His Ser Thr Lys Ala Lys Ser Met Leu Asp
625                 630                 635                 640
Asp Tyr Tyr Ile Gly Glu Leu Ala Val Glu Asp Ile Glu Asp Glu Pro
                645                 650                 655
Glu Gln Pro Ala Leu His Leu Ser Lys Ser Ser Val Gln Leu Met Lys
            660                 665                 670
Asp Asp Phe Lys Glu Gln Ser Val Arg Lys Ala Val Glu Gly Val Asp
        675                 680                 685
Glu Glu Val Val Thr Pro Val Ala Leu Asn Pro Lys Lys Trp Ile His
    690                 695                 700
Phe Pro Leu Ile Gln Lys Glu Glu Leu Ser His Asp Thr Arg Arg Phe
705                 710                 715                 720
Arg Phe Gly Leu Pro Thr Pro Gly His Arg Leu Gly Leu Pro Val Gly
                725                 730                 735
Phe His Met Phe Leu Met Ala Thr Ile Asp Gly Ala Met Val Met Arg
            740                 745                 750
Ala Tyr Thr Pro Thr Ser Ser Asp Ala Glu Leu Gly Tyr Phe Asp Leu
        755                 760                 765
Val Ile Lys Val Tyr Phe Ala Asn Val His Pro Arg Phe Pro Asp Gly
    770                 775                 780
Gly Lys Leu Thr Gln Tyr Met Glu Glu Met Ser Leu Gly Asp Glu Ile
785                 790                 795                 800
Arg Val Lys Gly Pro Leu Gly His Ile Glu Tyr Arg Ser Arg Gly Glu
                805                 810                 815
Met Thr Ile Asp Gly Lys Pro Arg Thr Val Ser Ala Leu Thr Gly Leu
            820                 825                 830
Met Ala Gly Ser Gly Ile Thr Pro Phe Tyr Gln Ile Leu Gln Ala Val
        835                 840                 845
Met Ala Asp Pro Glu Asp Lys Thr Glu Leu Tyr Leu Ile Tyr Ala Asn
    850                 855                 860
Gln Thr Pro Glu Asp Val Leu Leu Arg Ser Glu Leu Asp Lys Met Ala
865                 870                 875                 880
Ala Glu Arg Asp Asn Ile His Val Trp Tyr Thr Cys Asp Arg Ala Pro
                885                 890                 895
Glu Asp Trp Lys Tyr Asp Ile Gly Phe Met Thr Val Asp Met Ile Lys
            900                 905                 910
Glu His Gly Ala Pro Ala Gly Pro Asp Val Leu Gly Leu Ser Cys Gly
        915                 920                 925
Pro Pro Pro Phe Ile Lys Phe Ala Ala Thr Pro Ser Leu Thr Lys Asn
    930                 935                 940
Gly Tyr Ala Glu Glu Asn Gln Phe Leu Phe
945                 950
 
<210>10
<211>956
<212>PRT
<213>条斑紫菜
 
<400>10
Met Glu Ala Ala Ser Gly Ala Leu Ser Glu Leu Arg Leu Glu Lys Gly
 1               5                  10                  15
Val Lys Gly Trp Asp Pro Val Lys Val Pro Ser Arg Ser Ser Leu Lys
            20                  25                  30
Ser Thr Pro Ile Ala Thr Pro Glu Gly Ser Leu Arg Gly Gly Ser Leu
        35                  40                  45
Tyr Thr Thr Arg Ala Ala Asp Gly Gly Ala Ala Gly Ala Asn Gly Gly
    50                  55                  60
Met Ala Ala Asn Gly Val Ser Thr Ser Ser Thr Ser Ser Gly Leu Ser
65                  70                  75                  80
Phe Ala Pro Ser Gly Gly Ser Gly Ser Gly Ser Gly Arg Val Gly Trp
                85                  90                  95
Thr Glu Leu Asn Asn Ala Leu Asn Ala Lys Leu Leu Ser Lys Ser Thr
            100                 105                 110
Met Leu Asp Lys Gln His Val Ala Glu Glu Val Asp Asp Arg Asp Val
        115                 120                 125
Lys Thr Pro Asp Asn Trp Ile Pro Arg His Pro Asp Leu Val Arg Leu
    130                 135                 140
Thr Gly Lys His Pro Phe Asn Cys Glu Ala Pro Leu Ser Met Leu Val
145                 150                 155                 160
Asp Gln Gly Phe Ile Thr Pro Pro Ser Leu His Phe Val Arg Asn His
                165                 170                 175
Gly Ala Ala Pro Gln Leu Ser Phe Asp Asp His Arg Leu Glu Val Ser
            180                 185                 190
Gly Leu Val Asp Thr Pro Leu Thr Leu Ser Met Glu Asp Ile Leu Ala
        195                 200                 205
Met Pro Ser Val Thr Ile Pro Val Thr Leu Thr Cys Ala Gly Asn Arg
    210                 215                 220
Arg Lys Glu Gln Asn Met Thr Lys Gln Thr Ile Gly Phe Ser Trp Gly
225                 230                 235                 240
Ala Ala Ala Thr Ser Cys Asn Phe Trp Thr Gly Val Arg Leu Arg Asp
                245                 250                 255
Val Leu Glu Lys Ala Gly Ile Gln Met Asp Lys Ala Arg His Val Cys
            260                 265                 270
Phe Val Gly Cys Asp Asp Leu Pro Gly Gly Lys Tyr Gly Thr Ser Ile
        275                 280                 285
Asp Leu Ala Thr Ala Met Asp Gln Phe Gly Glu Val Met Leu Ala Tyr
    290                 295                 300
Glu Gln Asn Gly Ile Arg Leu Thr Pro Asp His Gly Ala Pro Leu Arg
305                 310                 315                 320
Val Val Ile Pro Gly Trp Ile Gly Gly Arg Met Val Lys Trp Leu Thr
                325                 330                 335
Gly Val Ser Val Thr Ala Glu Glu Ser Gln Glu His Tyr His Phe Phe
            340                 345                 350
Asp Asn Arg Ile Met Pro Pro His Val Asp Ala Glu Leu Ala Lys Ser
        355                 360                 365
Glu Gly Trp Trp Tyr Lys Arg Glu Tyr Leu Phe Asn Gln Leu Asn Ile
    370                 375                 380
Asn Ser Ala Ile Ser Ser Pro Ala Asn Gly Glu Leu Met Ser Leu Ser
385                 390                 395                 400
Gly Ala Gly Val Tyr Thr Leu Lys Gly Tyr Ala Tyr Ser Gly Gly Gly
                405                 410                 415
Arg Lys Val Thr Arg Val Glu Val Ser Val Asp Gly Gly Lys Thr Trp
            420                 425                 430
Leu Leu Ala Thr Leu Asp His Pro Glu Glu Arg His Ser His Ala Pro
        435                 440                 445
Ser Tyr Gly Arg Tyr Tyr Cys Trp Cys Phe Trp Glu Tyr Thr Ile Asp
    450                 455                 460
Lys Phe Ala Leu Leu Asn Ala Ala Thr Ser Ser Gly Glu Leu Leu Val
465                 470                 475                 480
Arg Ala Trp Asp Glu Gly Asn Asn Thr Gln Pro Ala Lys Leu Thr Trp
                485                 490                 495
Asn Leu Met Gly Met Gly Asn Asn Cys Tyr Phe Arg Val Thr Val Ala
            500                 505                 510
Pro Lys Gln Ser Ser Gly Glu Phe Val Leu Glu Phe Leu His Pro Thr
        515                 520                 525
Val Pro Gly Pro Ala Glu Gly Gly Trp Met Pro Pro Pro Gln Glu Ser
    530                 535                 540
Val Val Ala Ala Ala Ala Ala Ala Val Val Ala Glu Thr Leu Lys Arg
545                 550                 555                 560
Ala Lys Ser Ala Pro Gln Ile Asn Lys Met Asp Gln Glu Asp Thr Lys
                565                 570                 575
Thr Tyr Thr Met Glu Glu Val Ala Lys His Asp Thr Glu Glu Asp Ser
            580                 585                 590
Trp Ile Val Val His Asn Lys Val Tyr Asp Cys Thr Pro Phe Leu Lys
        595                 600                 605
Asp His Pro Gly Gly Gly Ala Ser Ile Val Met Asn Ala Gly Ala Asp
    610                 615                 620
Cys Thr Glu Glu Phe Asp Ala Ile His Ser Thr Lys Ala Lys Gly Met
625                 630                 635                 640
Leu Asp Asp Tyr Tyr Ile Gly Glu Leu Ala Ile Glu Asp Ile Glu Asp
                645                 650                 655
Glu Pro Glu Gln Pro Ala Leu His Met Ser Lys Ser Ser Val Gln Leu
            660                 665                 670
Met Lys Asp Asp Phe Lys Glu Gln Ser Val Arg Lys Ala Val Asp Asp
        675                 680                 685
Glu Glu Ala Ala Pro Val Ala Pro Val Ala Leu Asn Pro Lys Lys Trp
    690                 695                 700
Val His Phe Pro Leu Ile Gln Lys Glu Glu Leu Ser His Asp Thr Arg
705                 710                 715                 720
Arg Phe Arg Phe Gly Leu Pro Thr Glu Gly His Arg Leu Gly Leu Pro
                725                 730                 735
Val Gly Phe His Met Phe Leu Ala Ala Thr Ile Glu Gly Ser Met Val
            740                 745                 750
Met Arg Ala Tyr Thr Pro Thr Ser Ser Asp Ala Gln Leu Gly Tyr Phe
        755                 760                 765
Asp Leu Val Ile Lys Val Tyr Phe Ala Asn Val His Pro Lys Phe Pro
    770                 775                 780
Gly Gly Gly Lys Leu Thr Gln Tyr Met Glu Glu Met Ser Leu Gly Asp
785                 790                 795                 800
Glu Ile Arg Val Lys Asp Pro Leu Gly His Ile Glu Tyr Arg Gly Arg
                805                 810                 815
Gly Glu Met Thr Ile Asp Gly Lys Pro Arg Thr Val Ser Ala Leu Thr
            820                 825                 830
Gly Leu Met Ala Gly Ser Gly Ile Thr Pro Phe Tyr Gln Ile Leu Gln
        835                 840                 845
Ala Val Met Ala Asp Pro Glu Asp Lys Thr Glu Leu Tyr Leu Ile Tyr
    850                 855                 860
Ala Asn Gln Thr Pro Glu Asp Val Leu Leu Arg Ser Glu Leu Asp Lys
865                 870                 875                 880
Met Ala Ala Glu Arg Asp Ash Ile His Val Trp Tyr Thr Cys Asp Arg
                885                 890                 895
Ala Pro Glu Asp Trp Gln Phe Asp Ile Gly Phe Met Thr Glu Lys Met
            900                 905                 910
Ile Lys Glu His Gly Ala Pro Ala Gly Pro Asp Val Leu Gly Leu Ser
        915                 920                 925
Cys Gly Pro Pro Pro Phe Ile Lys Phe Ala Ala Thr Pro Ser Leu Thr
    930                 935                 940
Lys Asn Gly Tyr Ala Glu Glu Asp Gln Phe Leu Phe
945                 950                 955
 
<210>11
<211>956
<212>PRT
<213>条斑紫菜
 
<400>11
Met Glu Ala Ala Ser Gly Ala Leu Ser Glu Leu Arg Leu Glu Lys Gly
 1               5                  10                  15
Val Lys Gly Trp Asp Pro Val Lys Val Pro Ser Arg Ser Ser Leu Lys
            20                  25                  30
Ser Thr Pro Ile Ala Thr Pro Glu Gly Ser Leu Arg Gly Gly Ser Leu
        35                  40                  45
Tyr Thr Thr Arg Ala Ala Asp Gly Gly Ala Ala Gly Ala Asn Gly Gly
    50                  55                  60
Met Ala Ala Asn Gly Val Ser Thr Ser Ser Thr Ser Ser Gly Leu Ser
65                  70                  75                  80
Phe Ala Pro Ser Gly Gly Ser Gly Ser Gly Ser Gly Arg Val Gly Trp
                85                  90                  95
Thr Glu Leu Asn Asn Ala Leu Asn Ala Lys Leu Leu Ser Lys Ser Thr
            100                 105                 110
Met Leu Asp Lys Gln His Val Ala Glu Glu Val Asp Asp Arg Asp Val
        115                 120                 125
Lys Thr Pro Asp Asn Trp Ile Pro Arg His Pro Asp Leu Val Arg Leu
    130                 135                 140
Thr Gly Lys His Pro Phe Asn Cys Glu Ala Pro Leu Ser Met Leu Val
145                 150                 155                 160
Asp Gln Gly Phe Ile Thr Pro Pro Ser Leu His Phe Val Arg Asn His
                165                 170                 175
Gly Ala Ala Pro Gln Leu Ser Phe Asp Asp His Arg Leu Glu Val Ser
            180                 185                 190
Gly Leu Val Asp Thr Pro Leu Thr Leu Ser Met Glu Asp Ile Leu Ala
        195                 200                 205
Met Pro Ser Val Thr Ile Pro Val Thr Leu Thr Cys Ala Gly Asn Arg
    210                 215                 220
Arg Lys Glu Gln Asn Met Thr Lys Gln Thr Ile Gly Phe Ser Trp Gly
225                 230                 235                 240
Ala Ala Ala Thr Ser Cys Asn Phe Trp Thr Gly Val Arg Leu Arg Asp
                245                 250                 255
Val Leu Glu Lys Ala Gly Ile Gln Met Asp Lys Ala Arg His Val Cys
            260                 265                 270
Phe Val Gly Cys Asp Asp Leu Pro Gly Gly Lys Tyr Gly Thr Ser Ile
        275                 280                 285
Asp Leu Ala Thr Ala Met Asp Gln Phe Gly Glu Val Met Leu Ala Tyr
    290                 295                 300
Glu Gln Asn Gly Ile Arg Leu Thr Pro Asp His Gly Ala Pro Leu Arg
305                 310                 315                 320
Val Val Ile Pro Gly Trp Ile Gly Gly Arg Met Val Lys Trp Leu Thr
                325                 330                 335
Gly Val Ser Val Thr Ala Glu Glu Ser Gln Glu His Tyr His Phe Phe
            340                 345                 350
Asp Asn Arg Ile Met Pro Pro His Val Asp Ala Glu Leu Ala Lys Ser
        355                 360                 365
Glu Gly Trp Trp Tyr Lys Arg Glu Tyr Leu Phe Asn Gln Leu Asn Ile
    370                 375                 380
Asn Ser Ala Ile Ser Ser Pro Ala Asn Gly Glu Leu Met Ser Leu Ser
385                 390                 395                 400
Gly Ala Gly Val Tyr Thr Leu Lys Gly Tyr Ala Tyr Ser Gly Gly Gly
                405                 410                 415
Arg Lys Val Thr Arg Val Glu Val Ser Val Asp Gly Gly Lys Thr Trp
            420                 425                 430
Leu Leu Ala Thr Leu Asp His Pro Glu Glu Arg His Ser His Ala Pro
        435                 440                 445
Ser Tyr Gly Arg Tyr Tyr Cys Trp Cys Phe Trp Glu Tyr Thr Ile Asp
    450                 455                 460
Lys Phe Ala Leu Leu Asn Ala Ala Thr Ser Ser Gly Glu Leu Leu Val
465                 470                 475                 480
Arg Ala Trp Asp Glu Gly Asn Asn Thr Gln Pro Ala Lys Leu Thr Trp
                485                 490                 495
Asn Leu Met Gly Met Gly Asn Asn Cys Tyr Phe Arg Val Thr Val Ala
            500                 505                 510
Pro Lys Gln Ser Ser Gly Glu Phe Val Leu Glu Phe Leu His Pro Thr
        515                 520                 525
Val Pro Gly Pro Ala Glu Gly Gly Trp Met Pro Pro Pro Gln Glu Ser
    530                 535                 540
Val Val Ala Ala Ala Ala Ala Ala Val Val Ala Glu Thr Leu Lys Arg
545                 550                 555                 560
Ala Lys Ala Ala Pro Gln Ile Asn Lys Met Asp Gln Glu Asp Thr Lys
                565                 570                 575
Thr Tyr Thr Met Glu Glu Val Ala Lys His Asp Thr Glu Glu Asp Ser
            580                 585                 590
Trp Ile Val Val His Asn Lys Val Tyr Asp Cys Thr Pro Phe Leu Lys
        595                 600                 605
Asp His Pro Gly Gly Gly Ala Ser Ile Val Met Asn Ala Gly Ala Asp
    610                 615                 620
Cys Thr Glu Glu Phe Asp Ala Ile His Ser Thr Lys Ala Lys Gly Met
625                 630                 635                 640
Leu Asp Asp Tyr Tyr Ile Gly Glu Leu Ala Ile Glu Asp Ile Glu Asp
                645                 650                 655
Glu Pro Glu Gln Pro Ala Leu His Met Ser Lys Ser Ser Val Gln Leu
            660                 665                 670
Met Lys Asp Asp Phe Lys Glu Gln Ser Val Arg Lys Ala Val Asp Asp
        675                 680                 685
Glu Glu Ala Ala Pro Val Ala Pro Val Ala Leu Asn Pro Lys Lys Trp
    690                 695                 700
Val His Phe Pro Leu Ile Gln Lys Glu Glu Leu Ser His Asp Thr Arg
705                 710                 715                 720
Arg Phe Arg Phe Gly Leu Pro Thr Glu Gly His Arg Leu Gly Leu Pro
                725                 730                 735
Val Gly Phe His Met Phe Leu Ala Ala Thr Ile Glu Gly Ser Met Val
            740                 745                 750
Met Arg Ala Tyr Thr Pro Thr Ser Ser Asp Ala Gln Leu Gly Tyr Phe
        755                 760                 765
Asp Leu Val Ile Lys Val Tyr Phe Ala Asn Val His Pro Lys Phe Pro
    770                 775                 780
Gly Gly Gly Lys Leu Thr Gln Tyr Met Glu Glu Met Ser Leu Gly Asp
785                 790                 795                 800
Glu Ile Arg Val Lys Asp Pro Leu Gly His Ile Glu Tyr Arg Gly Arg
                805                 810                 815
Gly Glu Met Thr Ile Asp Gly Lys Pro Arg Thr Val Ser Ala Leu Thr
            820                 825                 830
Gly Leu Met Ala Gly Ser Gly Ile Thr Pro Phe Tyr Gln Ile Leu Gln
        835                 840                 845
Ala Val Met Ala Asp Pro Glu Asp Lys Thr Glu Leu Tyr Leu Ile Tyr
    850                 855                 860
Ala Asn Gln Thr Pro Glu Asp Val Leu Leu Arg Ser Glu Leu Asp Lys
865                 870                 875                 880
Met Ala Ala Glu Arg Asp Asn Ile His Val Trp Tyr Thr Cys Asp Arg
                885                 890                 895
Ala Pro Glu Asp Trp Gln Phe Asp Ile Gly Phe Met Thr Glu Lys Met
            900                 905                 910
Ile Lys Glu His Gly Ala Pro Ala Gly Pro Asp Val Leu Gly Leu Ser
        915                 920                 925
Cys Gly Pro Pro Pro Phe Ile Lys Phe Ala Ala Thr Pro Ser Leu Thr
    930                 935                 940
Lys Asn Gly Tyr Ala Glu Glu Asp Gln Phe Leu Phe
945                 950                 955
 
<210>12
<211>956
<212>PRT
<213>条斑紫菜
 
<400>12
Met Glu Ala Ala Ser Gly Ala Leu Ser Glu Leu Arg Leu Glu Lys Gly
 1               5                  10                  15
Val Lys Gly Trp Asp Pro Val Lys Val Pro Ser Arg Ser Ser Leu Lys
            20                  25                  30
Ser Thr Pro Ile Ala Thr Pro Glu Gly Ser Leu Arg Gly Gly Ser Leu
        35                  40                  45
Tyr Thr Thr Arg Ala Ala Asp Gly Gly Ala Ala Gly Ala Asn Gly Gly
    50                  55                  60
Met Ala Ala Asn Gly Val Ser Thr Ser Ser Thr Ser Ser Gly Leu Ser
65                  70                  75                  80
Phe Ala Pro Ser Gly Gly Ser Gly Ser Gly Ser Gly Arg Val Gly Trp
                85                  90                  95
Thr Glu Leu Asn Asn Ala Leu Asn Ala Lys Leu Leu Ser Lys Ser Thr
            100                 105                 110
Met Leu Asp Lys Gln His Val Ala Glu Glu Val Asp Asp Arg Asp Val
        115                 120                 125
Lys Thr Pro Asp Asn Trp Ile Pro Arg His Pro Asp Leu Val Arg Leu
    130                 135                 140
Thr Gly Lys His Pro Phe Asn Cys Glu Ala Pro Leu Ser Met Leu Val
145                 150                 155                 160
Asp Gln Gly Phe Ile Thr Pro Pro Ser Leu His Phe Val Arg Asn His
                165                 170                 175
Gly Ala Ala Pro Gln Leu Ser Phe Asp Asp His Arg Leu Glu Val Ser
            180                 185                 190
Gly Leu Val Asp Thr Pro Leu Thr Leu Ser Met Glu Asp Ile Leu Ala
        195                 200                 205
Met Pro Ser Val Thr Ile Pro Val Thr Leu Thr Cys Ala Gly Asn Arg
    210                 215                 220
Arg Lys Glu Gln Asn Met Thr Lys Gln Thr Ile Gly Phe Ser Trp Gly
225                 230                 235                 240
Ala Ala Ala Thr Ser Cys Asn Phe Trp Thr Gly Val Arg Leu Arg Asp
                245                 250                 255
Val Leu Glu Lys Ala Gly Ile Gln Met Asp Lys Ala Arg His Val Cys
            260                 265                 270
Phe Val Gly Cys Asp Asp Leu Pro Gly Gly Lys Tyr Gly Thr Ser Ile
        275                 280                 285
Asp Leu Ala Thr Ala Met Asp Gln Phe Gly Glu Val Met Leu Ala Tyr
    290                 295                 300
Glu Gln Asn Gly Ile Arg Leu Thr Pro Asp His Gly Ala Pro Leu Arg
305                 310                 315                 320
Val Val Ile Pro Gly Trp Ile Gly Gly Arg Met Val Lys Trp Leu Thr
                325                 330                 335
Gly Val Ser Val Thr Ala Glu Glu Ser Gln Glu His Tyr His Phe Phe
            340                 345                 350
Asp Asn Arg Ile Met Pro Pro His Val Asp Ala Glu Leu Ala Lys Ser
        355                 360                 365
Glu Gly Trp Trp Tyr Lys Arg Glu Tyr Leu Phe Asn Gln Leu Asn Ile
    370                 375                 380
Asn Ser Ala Ile Ser Ser Pro Ala Asn Gly Glu Leu Met Ser Leu Ser
385                 390                 395                 400
Gly Ala Gly Val Tyr Thr Leu Lys Gly Tyr Ala Tyr Ser Gly Gly Gly
                405                 410                 415
Arg Lys Val Thr Arg Val Glu Val Ser Val Asp Gly Gly Lys Thr Trp
            420                 425                 430
Leu Leu Ala Thr Leu Asp His Pro Glu Glu Arg His Ser His Ala Pro
        435                 440                 445
Ser Tyr Gly Arg Tyr Tyr Cys Trp Cys Phe Trp Glu Tyr Thr Ile Asp
    450                 455                 460
Lys Phe Ala Leu Leu Asn Ala Ala Thr Ser Ser Gly Glu Leu Leu Val
465                 470                 475                 480
Arg Ala Trp Asp Glu Gly Asn Asn Thr Gln Pro Ala Lys Leu Thr Trp
                485                 490                 495
Asn Leu Met Gly Met Gly Asn Asn Cys Tyr Phe Arg Val Thr Val Ala
            500                 505                 510
Pro Lys Gln Ser Ser Gly Glu Phe Val Leu Glu Phe Leu His Pro Thr
        515                 520                 525
Val Pro Gly Pro Ala Glu Gly Gly Trp Met Pro Pro Pro Gln Glu Ser
    530                 535                 540
Val Val Ala Ala Ala Ala Ala Ala Val Val Ala Glu Thr Leu Lys Arg
545                 550                 555                 560
Ala Lys Asp Ala Pro Gln Ile Asn Lys Met Asp Gln Glu Asp Thr Lys
                565                 570                 575
Thr Tyr Thr Met Glu Glu Val Ala Lys His Asp Thr Glu Glu Asp Ser
            580                 585                 590
Trp Ile Val Val His Asn Lys Val Tyr Asp Cys Thr Pro Phe Leu Lys
        595                 600                 605
Asp His Pro Gly Gly Gly Ala Ser Ile Val Met Asn Ala Gly Ala Asp
    610                 615                 620
Cys Thr Glu Glu Phe Asp Ala Ile His Ser Thr Lys Ala Lys Gly Met
625                 630                 635                 640
Leu Asp Asp Tyr Tyr Ile Gly Glu Leu Ala Ile Glu Asp Ile Glu Asp
                645                 650                 655
Glu Pro Glu Gln Pro Ala Leu His Met Ser Lys Ser Ser Val Gln Leu
            660                 665                 670
Met Lys Asp Asp Phe Lys Glu Gln Ser Val Arg Lys Ala Val Asp Asp
        675                 680                 685
Glu Glu Ala Ala Pro Val Ala Pro Val Ala Leu Asn Pro Lys Lys Trp
    690                 695                 700
Val His Phe Pro Leu Ile Gln Lys Glu Glu Leu Ser His Asp Thr Arg
705                 710                 715                 720
Arg Phe Arg Phe Gly Leu Pro Thr Glu Gly His Arg Leu Gly Leu Pro
                725                 730                 735
Val Gly Phe His Met Phe Leu Ala Ala Thr Ile Glu Gly Ser Met Val
            740                 745                 750
Met Arg Ala Tyr Thr Pro Thr Ser Ser Asp Ala Gln Leu Gly Tyr Phe
        755                 760                 765
Asp Leu Val Ile Lys Val Tyr Phe Ala Asn Val His Pro Lys Phe Pro
    770                 775                 780
Gly Gly Gly Lys Leu Thr Gln Tyr Met Glu Glu Met Ser Leu Gly Asp
785                 790                 795                 800
Glu Ile Arg Val Lys Asp Pro Leu Gly His Ile Glu Tyr Arg Gly Arg
                805                 810                 815
Gly Glu Met Thr Ile Asp Gly Lys Pro Arg Thr Val Ser Ala Leu Thr
            820                 825                 830
Gly Leu Met Ala Gly Ser Gly Ile Thr Pro Phe Tyr Gln Ile Leu Gln
        835                 840                 845
Ala Val Met Ala Asp Pro Glu Asp Lys Thr Glu Leu Tyr Leu Ile Tyr
    850                 855                 860
Ala Asn Gln Thr Pro Glu Asp Val Leu Leu Arg Ser Glu Leu Asp Lys
865                 870                 875                 880
Met Ala Ala Glu Arg Asp Asn Ile His Val Trp Tyr Thr Cys Asp Arg
                885                 890                 895
Ala Pro Glu Asp Trp Gln Phe Asp Ile Gly Phe Met Thr Glu Lys Met
            900                 905                 910
Ile Lys Glu His Gly Ala Pro Ala Gly Pro Asp Val Leu Gly Leu Ser
        915                 920                 925
Cys Gly Pro Pro Pro Phe Ile Lys Phe Ala Ala Thr Pro Ser Leu Thr
    930                 935                 940
Lys Asn Gly Tyr Ala Glu Glu Asp Gln Phe Leu Phe
945                 950                 955
 
<210>13
<211>26
<212>DNA
<213>条斑紫菜
 
<400>13
attgtggtgc acaacaaggt gtatga                                     26
 
<210>14
<211>20
<212>DNA
<213>条斑紫菜
 
<400>14
tcggcttcca catgttcctg                                            20
 
<210>15
<211>20
<212>DNA
<213>Porphyra perforata
 
<400>15
ccgtgtacct ccgcaactct                                            20
<210>16
<211>20
<212>DNA
<213>Porphyra perforata
 
<400>16
gctgcacttt gtgcgcaacc                                            20
 
<210>17
<211>20
<212>DNA
<213>Porphyra perforata
 
<400>17
gcatgggacg agggcaacaa                                            20
 
<210>18
<211>25
<212>DNA
<213>Porphyra perforata
 
<400>18
gcttgcccgt cggcttccac atgtt                                      25
 
<210>19
<211>24
<212>DNA
<213>Porphyra perforata
 
<400>19
catcgaaggc tccatggtca tgcg                                       24
 
<210>20
<211>25
<212>DNA
<213>Porphyra perforata
 
<400>20
ctacacgcca acgtcgtctg acgca                                      25
 
<210>21
<211>21
<212>DNA
<213>Porphyra perforata
 
<400>21
catggaggct gcttctggtg c                                          21
 
<210>22
<211>21
<212>DNA
<213>Porphyra perforata
 
<400>22
tcaacgagct gcttgtgggc a                                          21
 
<210>23
<211>19
<212>DNA
<213>条斑紫菜
 
<400>23
cccatcaccg cacagccga                                             19
 
<210>24
<211>22
<212>DNA
<213>条斑紫菜
 
<400>24
agagaggcgc cccttgcatg tt                                         22
 
<210>25
<211>2164
<212>DNA
<213>玉蜀黍
 
<400>25
ttcgttacca actgggttgc ataggatttc atgattaaga gtgtgtttgg tttagctgtg 60
agttttctcc tatgaaaaaa ctgttgtgag aaaaaatagt tggaagtcgt ttagttcaaa 120
ctgttgtgag ttatccactg taaacaaatt gtatattgtt tatatacact ctgtttaaat 180
atatctctta atcagtatat ataattaaaa aactaatttc acatttgtgt tcctaatatt 240
ttttacaaat aaatcattgt ttaattccat ttgtaataag tttttattaa aattgctttt 300
atttcattta ttataaacat ttaattgttt taatcctatt ttagttttaa tttattgtat 360
ctatttatta atataacgaa cttcgataag aaacaaaagc aaggtcaagg tgttttttca 420
aagtagttgt ggaaaagctg aacccctttt attcaacttt tagaagcagg aaaacagaac 480
caaacagacc ctaaaaatgt gtgaattttt agcaggttaa ttattcgcat ctctttggtc 540
atgtttaaga ggctggaata gatcaactgc aagaacacat agcagagtgg ataggggggg 600
ggggggggag ggtcgtcgtc tccctatctg acctctcttc tgcattggat tgcctttttc 660
ggtactctat ttaaaactta aaagtacaaa tgaggtgccg gattgatgga gtgatatata 720
agtttgatgt gtttttcaca taagtgacaa gtattattga aagagaacat ttgcattgct 780
actgtttgca tatgggaaaa ttgagaattg tatcatgcca tggccgatca gttctttact 840
tagctcgatg taatgcacaa tgttgatagt atgtcgagga tctagcgatg taatggtgtt 900
aggacacgtg gttagctact aatataaatg taaggtcatt cgatggtttt tctattttca 960
attacctagc attatctcat ttctaattgt gataacaaat gcattagacc ataattctgt 1020
aaatatgtac atttaagcac acagtctata ttttaaaatt cttctttttg tgtggatatc 1080
ccaacccaaa tccacctctc tcttcaatcc gtgcatgttc accgctgcca agtgccaaca 1140
acacatcgca tcgtgcatat ctttgttggc ttgtgcacgg tcggcgccaa tggaggagac 1200
acctgtacgg tgcccttggt agaacaacat ccttatccct atatgtatgg tgcccttcgt 1260
agaatgacac cccttatccc tacaatagcc atgtatgcat accaagaatt aaatatactt 1320
tttcttgaac cacaataatt tattatagcg gcacttcttg ttcaggttga acacttattt 1380
ggaacaataa aatgccgagt tcctaaccac aggttcactt ttttttttcc ttatcctcct 1440
aggaaactaa attttaaaat cataaattta atttaaatgt taatggaaac aaaaaattat 1500
ctacaaagac gactcttagc cacagccgcc tcactgcacc ctcaaccaca tcctgcaaac 1560
agacaccctc gccacatccc tccagattct tcactccgat gcagcctact tgctaacaga 1620
cgccctctcc acatcctgca aagcattcct ccaaattctt gcgatccccc gaatccagca 1680
ttaactgcta agggacgccc tctccacatc ctgctaccca attagccaac ggaataacac 1740
aagaaggcag gtgagcagtg acaaagcacg tcaacagcac cgagccaagc caaaaaggag 1800
caaggaggag caagcccaag ccgcagccgc agctctccag gtccccttgc gattgccgcc 1860
agcagtagca gacacccctc tccacatccc ctccggccgc taacagcagc aagccaagcc 1920
aaaaaggagc ctcagccgca gccggttccg ttgcggttac cgccgatcac atgcccaagg 1980
ccgcgccttt ccgaacgccg agggccgccc gttcccgtgc acagccacac acacacccgc 2040
ccgccaacga ctccccatcc ctatttgaac ccacccgcgc actgcattga tcaccaatcg 2100
catcgcagca gcacgagcag cacgccgtgc cgctccaacc atctcgcttc cgtgcttagc 2160
ttcc                                                              2164
 
<210>26
<211>3906
<212>DNA
<213>稻
 
<400>26
agaatctgaa gacagtgctg aaaatggtgc tgaaatgttc tctaaaactg acatgactgg 60
aaggaataac atgaatcagg tgtctgcatc aagcttttca agcattgcac aaagatttct 120
tgctaataca cttcagcgaa gaactcccaa atacactgat cttcctatgt catctgttat 180
agttaacact gatgcaaacg ggactgatga atctacccaa atatcttctc tagcccccaa 240
tgaaacaaca ttcgaggcat ctcaatttga gaagaaaaca gaaaatgaca caaatggact 300
gcccaaatcg tcactcttct ctagtagcca ttactctgag aaatcatctc cgccgcttga 360
gtacatgaaa atatctttcc accctatgag tgcatttgaa atgtcaaaat tggacctaga 420
tttctctgat gaaaatcttc atgagaatgc cgatgatatg atgttaccaa cgtttcagtt 480
acttccaggg tcttccgttc cacagcttgg tagtggttct gaatcggaag atgatacttt 540
tggcagatct tatagttatt cttcgtatga tgatctaagt ccacggttat attcaaactc 600
tgagttgtgg gatcaagaag acgcaaatgg attggaggat catgatatgc ataacaatcc 660
aaatcagata ggatccttcg gagcaccaat ctctagcttt gtggaatttg agcagatgga 720
cttatctggt gcgaagtcca ctgtatcact tacagatctt ggggatgata atggacttgg 780
cacgttagat tctcatcctg ctggagaact tcctaacttc gatactttga tggctcatca 840
aaatgaggcc ttcattccgc acaatccagt aagtttatca ccagatgaag gtcagttgcc 900
tccacctcct cctcttcccc caatgcaatg gaggacaatg agacaagtag cttctgtaga 960
agaaggaaga ggttctgcag ctaaagaaga tatgcttgag agtacctcag atctaccacc 1020
agtacacact cctgttcagg aagaacatct tctgcccatc gcaccaccag atcaacaaaa 1080
tcttctgccc atcgcaccac cagatcaaca agggcatgcg aaggaggtag tatgtctcat 1140
ctttaattga ctctattttg aataattctg tatcaataat cactgtcttt tattaatgat 1200
tcattaactt gacttatgca gaatgacaga aaagttgatg gggtaaaaga gataagcaat 1260
cctctcgaca ttgagatcag agcaagcttg cttcagcaaa tcagggataa ggtttgcttc 1320
attctttctt aaaaaaaaaa tctgttgttc tctattgttt catagttttg ttactctttt 1380
gtgttgaaac ctgagcaatt ttagaatttt tagttacgaa cagatagcac cagagtatca 1440
tgtgacaata tatcatggag gctctgtgcc ttcttctttt gccaatacaa atattttttt 1500
ttctgatggt tgttatttga ttcttgaact tgaaagctag ttagcaaatt tttggcattc 1560
aatactgata tttttgttca ttttaataac ttgcagtcag gtcagcagaa gctgaatgga 1620
catgaaaagt caaaagcagt aggcaatgat actaaaaact tggatgaaag ggaggagttg 1680
cttcaacaaa tcaggagcaa ggtatttcca ttatctgccc tattgtactt gtgtagtata 1740
atgctacctg acaggtcttt atgttaagtt ttcttgatcc atgcctagtc gacagacttg 1800
cagttgaaac acgatacact agaacaccca cattgagggc ccatctctct caaccaaacc 1860
ataaacacac aataagaagg ctaaataact acttagtttg ttactatgct cgtatgatgc 1920
atacagtcat ctcagaaaat aactgtagct agtttgctaa tatgttcaca tgatgcagac 1980
attcaattta agacgaacaa atgcatctaa gacaaacacc tcatcaccaa ccactgccaa 2040
ctccagcgtt gtagcaatct tggaaaaggc aaatgcaatc cgccaggttt gtattgattc 2100
tttttttccc cttgatgtta gtttatgcgc tactttcctt acgttttccc tgattgtttc 2160
catgctatca ggctgtggcc agtgatgagg gaggtgatga tgatagttgg agtgatatat 2220
gaatactcaa ctggaacgcg tatgaaactc tttttctgta tattcagcta gtacaagatg 2280
aagtgaaaaa atgtgaataa catccttttc ttcattgtaa ttagattttc caggtctgtt 2340
ttgtacctct ttttagttca cattagtgta ttctctcata ggcccatgcg gttgtggaaa 2400
tggttagatc attttcacat tatgtaaatt aactttatta tttatttttg atagtgaaat 2460
taactggtaa aataagcatg ttaaactgtt ttttctagca atgtattgaa ataatatctc 2520
tttgcattca taataatatg ggggtgtatc tgtgcaacag atttattttt tcttcccccc 2580
ccctaccctt ttgaagtatg ctgttgacct attgtccttc ccctcaacaa aggcaataat 2640
tctgaattgc aaatcattca cattactcta tcagctttgt ttggttaaca gcattatctg 2700
tgctatttac ttcatttgtt atgttggacc tacggaaaaa tctggtagat acatacttag 2760
ttgtgcaaac ttactgcgta cctggtgtta tttgttaagt taaaaatgct gctaatcagt 2820
ttaagtctag gttcttaagc tttgcttcca acttggtata atactattta tgtttgtccc 2880
ttcctgttct tattacaaac aagaaaggca gagtatggta tgctttttta tcctttgcat 2940
gagttgcaca acctgatcct agacaagcga cttctcatct tgatcctgtg gtctcttact 3000
actactgttt tgaacatggg cagactatgc tacagttata tcacttgtcc atagtaaact 3060
gctaagtgtt ttccttcttt tattagatgt atagcatgca ataataatta gttcagtcac 3120
caatttgtta cctcttagga tgcttctaat gccttttatt tttaacatga gttgtgcttt 3180
ctattttata tcattggatg ttcttaaatc tattactgtt tgtaaacaag ctcttctacg 3240
gcaatgcatt tttttatgcc acatatggta tctatctgtc atcagattga cgtggtacac 3300
aattcttgtg gtttgtggga actgggaaat ggtcatttgc aattgttact aaagcaagtg 3360
gccctatttg caatattttg tttctcacgt tgcaaactgg gctagttgaa tataatttcc 3420
ttctgcattt ttccaatgtg aattcctgaa gcaaattgtc ttcctctcct attcgtttgt 3480
tcccagtttt taacagattg ttcctcttac agtgccatgg tctcatgggc aagattttgc 3540
agccaggcct ctctatcggt ccaatgttct accagctaca gaaaacgaaa gtctcagaat 3600
cccagccatg aacccgttgt gcagctcttc agccctccta agcgccagtt cctgaaagaa 3660
aacaaaacaa aagagccacc tggaacgtaa aatacttcca gggatgcaaa ggctgacttc 3720
tcacaaatcc tcacagaaaa atgaaaagac agacaaaaca acacgcataa gtctcgcaaa 3780
ctgggataat tttcggcttc tcgccgtgcc acgggcgagc cgacgagcag cgtgcgtcac 3840
caccgtacgg cgagaattgt atggcacgca cgggagggtt agccacagcg gagatgagac 3900
atcagc                                                            3906
 
<210>27
<211>3510
<212>DNA
<213>拟南芥菜
 
<400>27
cgccagatca tacatgctgt aaagaaaaga tgtccagata cgccgatagt tttctacatc 60
aatggaaatg gtggccttct tgagcgaatg aaaggaactg gagctgatgt tattggactt 120
gactggactg tagatatggc tgatggaagg aggcgattgg gaagcgaggt aagtgtgcag 180
ggaaatgttg atccagctta cctattctct ccgcttcctg ctttgaccga agaaattgaa 240
aggtaggtca ctttgttcag ctgaataaaa aagtagtgct tataattcaa attaagaaac 300
tgaaagaaat gtatgttttg tgtcagagtt gtgaagtgtg ctggaccaaa agggcatatt 360
ctcaatctag gacacggtgt cttggtaggg acaccagagg aagccgtggc tcatttcttt 420
gaaaccgcta gaaacttgga ttaccaaaca cttttccaaa atcatgttcc tgcagaaaaa 480
gctgaacctg aattggttgt ctgagaaatg gtgactagac aagtgcctac gccgaagaat 540
ttgctgttta agttttgtga acatatgtct gaatctctta aacttggtgc aggaatgaga 600
gaaaaagttc catgtctgac ccttaatcga tgctagagtt ggtaacttgc tatgagatat 660
atgcgaagct gtccagtttt tgtttggctt gcttgaggat ttccaatctt ctggaccaag 720
ctctgcttaa cgtttaacaa tgtattgagt tgctcctagg cttcaaatgt tgctgcttct 780
tttggagata tgactctggt taaagtttaa ccaaacattc atttatctgg ttaatctcaa 840
acctttgcta tgtttgttat cccacttttt tcatatggtt ctttctagat ctctgtatct 900
ggtgtgtctt ctctcgtgat ctcaacattc gatgtgaaac caggtagatt gtaatattgt 960
atcatagact gcaaaagata acgcaaaaga gaagtctctg atctcaacct gaatcagact 1020
tgttaggagt ccctcttgtt tggtttaatt caattttccg gttcggattt ctggattata 1080
aaccgaatta actacaaacg gaaaaacgta ccgcgttatt gcggtaacca gcaactttaa 1140
ttggcctata gtagaatcaa atgaaaagaa aagagcaatt tttttttttt ttttttggtt 1200
ttttggttaa agaagaaaag agcaaattgg aaaaacaaat agataagata atttatatga 1260
tttaaaagtc aaatgtaatc acaacatata aattttaact tataaaatat agtcacacca 1320
ttgcctcatc gtatttgctt tcatgaatca tcccaccact tgtaagcttt attttattaa 1380
gaatgaaaac ggagaaatat aaattgaaca ctatatacta ttgtcgtcac cctccccgaa 1440
tgtttctgat aaataatgtt aactatcatc taatacgtca accggattat caccgacact 1500
gaccccacac ctaaccactg atgcacaagt ttatattagt gtaggtatca tccacaatat 1560
attatccaat aattgaacct tgttaatgtc tttggttcat aaagcgatct ataatcaatt 1620
cagcattatt gctaaaattc aaattaagaa gacggcatga tttgttaaaa ccataaagaa 1680
atacaaaagg gtcaatgata aaactgttta aacgaatcag tctacccaag agccgtctct 1740
cgaatactag ttttaaattc ataagcgtat agagtttagt gattccagaa cactttacag 1800
gccaaaatct aatatttcga tattttgaaa cgacattttt agtcctataa ttaaatttgc 1860
aacgtattag attactttta aaatgtgata ctgcgaagaa aatgaatcaa aagattgaat 1920
cgaatattcg aacagacgga caagaaccca cgaagcgata cagatcagaa actctgcttc 1980
tttttttaac aagagatcac aaacttggtt gacttgagtt catattataa tgacgtactc 2040
agtgattcga atattccata aatagtcgta agaataaaga ccttaatgta tacattgttc 2100
atttcgtatg ccacattgac gaagatcact gatataaatt tcaattatat aaatgtaaaa 2160
taacaaaaca aaaagttaca tgttatcaaa tagtgtcatt agctaaataa catgttactt 2220
ggccaccaca tcacttttgt tgagaaattt ctaaaatttg gctatttagt gcatataccc 2280
tttaaaactt gttgtaaaag caaggaagag gaaaaaagat tgaacctata gcaaaggaaa 2340
aagaaaagag agtacatatt cttaagtctt gattacaata ttttgttctt caacatattc 2400
tcttagagtt gagataacat aaattataat atagatgctc tattgggtag cagtagatag 2460
aagaacatat gctgaaaatc atttttatag atctagcaaa tcacctttat aaaggatcca 2520
gatttttttt tttttaactt tttgaaagtc aacttgatca tatgtgaaag ttagagtcag 2580
agatttatgc atcttcgtgc atagacaaaa tgcatgcacg agctcacacg atcctgtttt 2640
tttttcttaa tgaggtaatt ttcttgctgt catttttttt tctaaagtta agattcatat 2700
aaaaaccata tcaggtaatt ccttaatttt gtgtaataat taagaaatca ggatcattag 2760
atctttgacc accaaaactc aaatttgttc ccaaatacac tcagttaaag tactatcttt 2820
aatcatttca tattcgttac tttgtaaatt agtacaaagt aagtaacaaa ttttagttta 2880
cccaatgaaa tggaatgaag ttaatgaaaa tattcgttct tttagaatat tcttctgctc 2940
ttgacagtgt ttaattattt aattttctta cttgaaaaaa taaaattgac caacaattat 3000
ttttcttacc tcatgtagat aacttacaaa ataaaacata tatatatgta tatatatatt 3060
tattttcaac tcagaaataa ataattctaa cgaaaaaata tgaaataata aaaaaatctg 3120
acttaaaaag cgcgcatcgc tcatgccaac acactccctc gtctataaat acttcactct 3180
gctttcctca atcacatcca tctctgaatc tgattccaca tcttaaaccc ttattcccta 3240
aacatcgaat ttggttcctt ctcccacaat ccgcagagat ttcttctttt caggtttgtc 3300
aattcatttt ttttttcagt ttgagttttg ttttgttttt tcgtgatttt cggtcagtct 3360
accaaatccc ctgtttttcc ggcgattcag ttgtcaacag attttgcttt tctttttccc 3420
tttttgtgta aaaaaactca tttccttttt gatctgatga ttacagaaga agtaagaggg 3480
tggcgaagaa gatttgattg atcggcgata                                  3510
 
<210>28
<211>2997
<212>DNA
<213>拟南芥菜
 
<400>28
taagtatacc catgtggttt tcttttattt ttgaatagaa tttgggactt cacattcctt 60
caaagtagga cttcaatggt tttttggaaa catgacttat ttgcaaaata tatacaaaaa 120
caatgaatag caagactttt ttctttttgt cagcaatgaa tagcaagact taagtaacat 180
atttttaatt tttggcttat acacaagaaa aaagtcgcat atttttggtt tggaacttga 240
gccggttcga tgtctgacaa gtcgatttga aaaacttctt tataattttt tacttttcgg 300
ttttatattc ttttgtattt tacaactgga tcttgtttat atatatcaat atatgtgaaa 360
tgagcgtact agtactatta ttggtgtgga atactttcgc atgccctagt cttaactctt 420
aaggataagt aagggcaggt ttctctttgt tttccaaatt tatcgttcaa tatttcttaa 480
attaggatat aatgtacaat taatcgttca tttcttttaa ttagaaccgt agtttgtaca 540
catcactaca tagccacact atagtaatta agtgaagcct catcagaaaa ggaaaacgat 600
ctatagatga aaaagttaaa tacccaagag aagtgatttt cagttaaaag tatagttttt 660
gctaaaaata tttataacgg cattaatcac gatactcgcg taagtagtat actctaccat 720
atactatctt ttagtgagtc ggaaatatgt cataagccat tacgcgacca tgcaatattg 780
cttccgtaag catccgcact agtaaagtgt ccaaatggat gccgtcaaaa caacaaaagt 840
gttttaaaaa agaaccgaaa caagttttca cacttggtcc ttagcttctc aaactcttct 900
tcgtcctgat aatggacttt aattatcatg ttatacgtca accaagttat cagctaacca 960
tcatcacttt attaagtata tgcagccttg tgctcataat attcattata ttatactaaa 1020
agtctaatca tatgaagaaa ggaaaaaaaa aaaaagaggc ttgtttatga aattaaggag 1080
tgcacgtaag gccatattta taattctatt tcagaaaatg taaattcaaa cacggcaaat 1140
atgttagttt catggtgcat gcatgatgca tttccaactg tttctttttt tggggatgaa 1200
aatgtatttc caccggttaa ttaacgaagc ttctatttca tgtttccgtt ttcttttact 1260
tttttttttt gtttttactt catatatatc atttgacaaa gttaaggctt taaaatggca 1320
gtagtttctt aatttgtttt tagattttgg atttatggtg tttagttctt agtttttttt 1380
tgcagtaaat ttttagtttt atataaatgt atgtacccaa tacatatcac tatatatttt 1440
atagtccaaa agaattttat gtgatggtga aaagaaaaaa atgtgtgatc attcgctgaa 1500
attaataaat tttgcagtat attaaagaaa actagaaaag tgagtaccta atattccaac 1560
aattagactg tatcactcat gcctgtcgtc tgtcgactgt tgacttgtgt tataataaag 1620
acatttcaaa ttatccgaat attccattag cacatatgaa gatatccaat ttttgaataa 1680
ttggagtcga ccaatgtaaa atattcataa cgtgacatca catcacatac atgtacgact 1740
ttgtcactta ccaaaaatga tctagttatg ataataacat catcacatga gtaagaatga 1800
taaggcatga tctaatcagc atcatatacc gctactttat ttactatcac attttcgttc 1860
acaagagtaa tattatattt gattttatat atgtctaaaa atttatcgta gactgccgat 1920
tttagatttt gggaggttag aagaactaat aaaaccgaaa gaaatagatg atggtcggtt 1980
aaatacttaa gtcctttata agaaagaaaa attaaaagtc aactttatcg ctgaaagtga 2040
aagttaggtt gaaagttcag agatttattc atcaacttcc gtgcattgac acatgctctt 2100
ctctacattc gctcacgtga attttagaac aacaaattat tttacaaaca ctataatctt 2160
ccggtaattt aaccacaata aagagataaa taatctttat attaaatcga tcgaattcta 2220
attctgtagg tactgtgagt caaacatgaa agtgtaaatt ttcaaaatat gattggtgtt 2280
aacttaggtg aatcaatttt tgatgttttt ttgttgatta tataaatcaa aattacggaa 2340
gaatgcatgt tgtttacata agtgatataa ttaatttttt actgatatat taaaaataaa 2400
aatattttat gttattgttt tggttatttt tttgttccac aaaaattaat taatcataat 2460
atttctttct tgactatcac tagattcaat gaaaatctct cttttataca taaataaaaa 2520
tcttctcaat gcattaataa atatatataa attgaggaaa aaaagagata gaaatcatgg 2580
aaaaaaaggt taaaaattcc aactataagc gagcatcaca tatagaaata gaataatgta 2640
taggaatcca tcatgatctc actctctata tataggtaag ccaagtatct tatttttggt 2700
tatgtatctc tgaaatctga atctgactga cttcaaagga cacagctttt acttctataa 2760
ctggttagct tctccacaca cacacacact tgttagattt acttttcctc cgcactatca 2820
gcagattttt ctcatctggg tctgtttgtt tctgttgact caaagtttcc gactttctta 2880
ttttctgtct ccgatttcat cgccgaaatc tcagtcaatt ttgtctttag atctttaatt 2940
tttggatccc tttaattatt ttgtttggtc ttacttcaga gcgaagcagg tgaaaaa    2997
 
<210>29
<211>3367
<212>DNA
<213>拟南芥菜
 
<400>29
aaactaaaag aatttaaaac tgatgtcaat atcttatctg ccatattcgg accttactta 60
catccgatcc cactgattta ctaacccaaa tcagattttg atattgggct gtgattgcgt 120
cacatttata tgggctaata tgatatgagc ccaggactat ctcgctcagg atttattgtg 180
tttgactttt caagttctcg tattcgaccc ccttccccca ccttaaaacg ctccgtttca 240
ctttcagttt cattttctat gactatttat ttattgaaat atattatgat ctctgcatag 300
acatatatag acctcgacgt atctctctct ctctctcggt aacttggacc actcgaaatt 360
gagttttgaa gcacggataa cgtttggttt gaccttttgg gtttgtcata ggtcgtttta 420
tttggtcggt acactcgtaa tctctaaaca aaaatatatc actttagtca caccttttta 480
tttggggtca ttgtgcatgt gtgtaataat aagtgaatac tgaatcatca ttctagtctc 540
taatacatca tatacaacta cataatagtt aactaaatgc taactcgtgt gcgtaaatta 600
ctgtattact atagtgttac tgttatgcat ttttgtctga gacgatgcaa atcttgatca 660
tatactatat acagggtaat tttagcatgc acaagtttat atttgcatat aaatatccga 720
agaatatccg tagaacagtt agaatatatt cccactagcc accactatct caaatttcat 780
tttcagatct aaagttatgc ttttattgtt tcttttctat ataactcaat catataccat 840
taatatcaaa catcacccat cacataagtt acgaatgtcc atttccgcac cggacttaac 900
ttgtttggag aaaatgtaat atcactcatg gcaataatca accatgtatg cacattgatt 960
aaaatgtgtt ttcccgatgg agagcaaata tatcttattc gagtgatcaa gttcataaag 1020
agctcgaatt agttatgctt ttattcaaag tagagcaatt tcataaaact ataatatatc 1080
ttaactgtaa taacagatca gctggctaaa tactatgatg ctactactga agatgagatt 1140
gcaaaacata aaacttgtgg cttgatgagt tcatatagaa gatataataa ttatgcaaac 1200
caaaatatgt atacgtacga atcttctttt accatacgga tcgtcgtcgg atactgcttg 1260
tctttttctc tgtttttttc tcctaaatat cacatatata ttcaatgtga gaaagtatga 1320
gaaacaggac aaaatataga tattggttcg taaagttttt agtggctaga gttaaataag 1380
gaattaaatg agagcaaatc tctttgatat acacctcata tcaatgaaaa aacttaatat 1440
tggtgtattt gtttctttcg tccgactctt gaagaattaa aaggttatat acaaaaaaaa 1500
atttgccctt tcacattttc taaagatcat atcatctttg atataatcgt ttgatgcatg 1560
tttactcatt cataaacatt ttataaaatc ttctatatta ttttgattcg aaatttcaca 1620
ctcaaaacat aaaatttcca aggataacca atgaaatgaa tacacaagat ataatataag 1680
ttatcaccat aaattacata atcagtatag ataaagaaaa tgttctgaat accaatttag 1740
tttataaatt tatttttttc gtttatgatt tatcaatggt tcagttgagt ggtttttaat 1800
taaaaaaata atattttgtt caacaaaaat tcagaacgat ggttggaaaa aataaattaa 1860
aacaatgcgt atattggatt aaaaataaat catattatat gattctattt gtccgggatt 1920
tataaattga tatgatacga taaggtcagt gataaaataa attgataaga taaggacttt 1980
atatgattct atttccaccc gttggaatct ttggttggct atttattctt agattcgaga 2040
atcaattagc gaaaacaaat actagtttaa aaaagaaaaa aactatatga taagagaccg 2100
taatagacgt ggtacgtttt aagtcaaagg tcaaaaagcc gaattatata tttctggctc 2160
cttccacaac ttttggaaaa tttccttcgt agttttcact tgaacccatt ttttaacaac 2220
aattcttcta cttggattga taattcaaaa ggaaactaac tctcccatag ttaaaactga 2280
atcactgtta aaaaaaaaaa aaagtaaagt aaatatacta aatcaatgtt tttttctctg 2340
gaagtaaata tacaagttta aaattaaagg agaagagaag ctatatattg ctttgcctca 2400
ccatttagga gataattcat atgaagcaaa gaaagcatat cctttggcat attcgataat 2460
atatggcatc taatcatctg tataagcttt tcatattttt gttagatgct ttttcgtaca 2520
aatgcattaa gataaaatta aacaaaaaaa caagatatga tattcagttt cgtgaaatat 2580
taaaagaagt caaaaaaagg gaaaaatgaa aagtcgaatt ggtggacagt ggactcattg 2640
gtccacttaa aagtcatcag aaccgtacac atgcaagctt ggtccatttt cgtatgacga 2700
cgtacaagtt acaacattca aaaaacttcc taatttacaa gtttttgctt atgtttatgg 2760
gaaatatttt tctgcaacga aaaatcatta agactatatt tttctgttgg caaagacttg 2820
actcagtccc tttttactgc ccattagtaa tctttggagt gaaaatacga atttaactaa 2880
ttttctaaaa tttgattaaa gtctaagaga gaaaaaaaga tttcggctat aaataagtta 2940
caactacaca tcgaatggac tagaaaattt tcgcttctta tattttttta aaaagaaaaa 3000
ccaaaaaatc ctttgaaact tttttagcct gtcgcttctc tttccatcgt cttcctcgtg 3060
aacgaaactt ctcgatcttc ttttcttttt tttcacctgt ttttcggtat cacgagaata 3120
ctacacttcc cactccagta atacgccact ccttcttttt ttttttgtct cgtttaaatt 3180
tttataaact ccataatttt atcttaaagt gaatcttttt tgtttttttt gttccagctt 3240
tatcggatat atttccttga ttttctccga ttgtggtcaa tctggaaaat tattgagaat 3300
ctctccctca cttaaccaaa agcgttttta atcagataga gagagaggaa aaagcatcaa 3360
ccaaacc                                                           3367
 
<210>30
<211>1353
<212>DNA
<213>玉蜀黍
 
<220>
<221>misc_feature
<222>585
<223>n=A,T,C或G
 
<221>misc_feature
<222>585
<223>n=A,T,C或G
 
<400>30
gtgccttatg cctgtgtatg cttttgatcc agatatgaga aaagcattat cacaagatgt 60
tgagaagaag tccatcatac cactcaagag gccaattacg cctgatgaac ttgaatatga 120
ttgatgttag ctacctggtg cttacgttgg atgctccggt ggggaatttg acaggctttg 180
aaaatctggt agtgagtgta ttgttgtcgt ttttacgcct gctaggggac aggttttgat 240
ggtgaattct gcagtttttg tatttgagaa tagcaagaac tatgacttgg catggaatca 300
aattgctttg ttgtgatgtc gtatttatcc gtcgctgttt gctctgtagt gtgtttttat 360
acagcttgca taatatataa gttatattcg acccgtgcta agcggtgata ggtagaattt 420
aacctactgg caattcagtg cctgagatca tgaatggcac cgtgagcttg tcaatcaaat 480
gataagtgac catcactcat gactcatcgc ccttccacat gttgtgggcg cgcatagggt 540
aatagatcgt gatttaaatg gttcttcata aaatgtcaag gtccnaaata aattatagtt 600
caaaaatgat tagaaataga gtctaattct aatccaattc gatccttaaa tattatagtg 660
taaaatttat agcccattat tagccctagg cgcgcatgca agtgacctca ttccgaaaaa 720
cattactctg cacaatggtg gtaaagtaga agggtgaggc agaggagacc aaacagggaa 780
aatgaggtga aaatcaacac tgattcaagc agcaatacac ggtgcaacag gtcatgtgct 840
tgatatgctg gttctcaggt gcgggaaggc tgccggtgcc agagttaaat gtatgttaag 900
gtcttaggaa ttttcaaaaa aaaaaaaaaa gttggaccgg cgaggttaat gtgcagactt 960
aggtcattga aacaatgaat agtttcagta cattgtttct aaggttgtca aacagaaggc 1020
tatttatata aaactctcat atctctcctc tgtcaccccg tttgcttagg tgatatgtca 1080
tttaataaaa atgaaactcc cactatgaat ggccttagga gttaggacat caaaaggttc 1140
attcagaatt aaaaatgtcg gggtatcgga tgcttcaact tatttggata cttgaatttc 1200
aaacaaattc aaaaattcag agcattcggt gtttcttttg cttcaaaatt cttgcccatt 1260
tttggtctgt caagtttttg aaatgagatg tttagattag ttggccagta aaaataacaa 1320
atgcaaaagg cattttatgg agagatgcag cta                              1353
 
<210>31
<211>795
 
<212>DNA
<213>大豆
 
<400>31
ggtgatcact ggtccgtaca tttcgatttt ttcacttttg tactgtaaaa tcagtctaaa 60
gtgacgagga ttcgaaatga aacaagttgg agaaaatata aaaagcgaaa tgcaggaaaa 120
caaaaaatga tagccattaa ttttaaaata agttaatctc acgatttaaa tgtttacttt 180
tgtaccattt caaattttgt cactttagta tcttaaaatg ggtctaaagt gacgatggtc 240
ggaaatgaaa gaaggttttg tagtaggact ttacttctac tcttttttca caactttctc 300
tctctttatt tttttcttta atttattgga tacgtgtctc ctttttttcc tatataatga 360
cactctctgc agtgctttgg atctgtgact ctagtacttc tctctctctc tgtcattggt 420
ttttctctgg ttgacatcat cgtcatctac tacttcttcc tcttatccaa ttggccccca 480
acactggtac tacattagat ccttatgatt gatccatcat ggttttgtca taaaaaagtt 540
acaattgttt tccctttaat tctatacatg ctgtgtttat aggcactttg ttgttttgcc 600
ttctctactt tgtgtcttcc aaccatacag ttttcattgt caatgtctcc attgtagatg 660
atgttgtttt gattttccta tgttcaagtt ttgtttttct ttttttgttt ttttatgtgg 720
gttttggttg ttttcggatc ttttggtgtg accctttcga tgttggcagg ttttggggta 780
ctttgaaaag ttgca                                                  795
<210>32
<211>761
<212>DNA
<213>大豆
 
<400>32
ccttgtctaa gttccttaac taattaatgg gtaggagctg atgactagtg ttttcgggtt 60
caatcgacat gtggtcgggc tttgatcagt caagtgtgag ggatgtttta ggaatttaga 120
cactggagaa tagtgatata ctacaaactt gaaaagaata tttaggtgat ccatgtatgg 180
aaatagaatg atattgttaa cctgatgtga gagatctatg ttggtaatgc aaattattca 240
atataactat taggagcgtt gttaagtgat ttagactctc tcactcgagg gatcgtgagt 300
agagtaggtt agtaaacgtg gataataatc atgtttatgt taaaaagaaa aaaratctat 360
tataattaca ttaagagtta gttttgacaa gcggagctta acacgtttca taattcattt 420
atttttttat tccttcaagt ttcttgtctt gtagttaatt tacattaatt tatattaatt 480
aataaaccag agatttaagt tagatatata taactctaaa tataaataaa gttggtagac 540
tccatacttt tttagtttta ttattactta ttggtaggtt tgcgaaagag ttaaggatta 600
tcaacctcat tttttttttt acactctgcc tcactcaccc tctataaatt gaatgtctga 660
caagtccttt ttttcttcac atgacatctc tctttctttc cattctccgt gatctcaggc 720
gctagctagt tatcagttat tattgttgtc gttgaaggtt g                     761
 
<210>33
<211>2008
<212>DNA
<213>两色蜀黍
 
<400>33
atagtctttt cctttaatct catccttttg tttttgagat gtctaattga tggagtgaca 60
gattagtttg ctgctttgct catacgtgac aacgaactac tgttagaata gaacattttg 120
cagtgctaat atttgcatat gggaattaat taatttggga attatgtctt gccatggctg 180
atccagatct cgacacctgc tcgatctaat gcacacatgc gtgttgatag ggatgtagag 240
atataaggcg ttaggagatg tggtgtggta gtatatgcaa ggtcaaaatt cgatgctttt 300
tccatgtttc tttgaaaacg caatgccgca tttttcttta aagtaagaat tgaggggtcc 360
catgtttctt tttgcacttt ttcacatcga tgtataactg aaaatctcat gaaacatcat 420
tacctcttta tatgcgtcat catcttttca acaaaactca ctgatagcat tgatgcactt 480
acactcatac gtgacaacta ctgctattga aagtggacat ttgcagtgct actttttgca 540
tatatgggaa attgggaatt ctatattgcc atggttgatc cagatctcga cctactcgac 600
taatacatgt tgacagcaag ctgaggatcg ggacatgtaa taaggagtta ggagatgtgg 660
tgtggtacta aatgcaaggt caaaattcga tgctttttcc gtgctcaact attaactagt 720
actcattatt acctaatttt cacttgtgat gacaattaat gcatcgatcc acaattcagt 780
aaatactttc atttaagcat atgtatagta ttatacattt ccaattcttc ttttttgtgt 840
ggagatccac gacgatgcaa gttgctcctc ccaacccaaa tccacctctc tcttaaatcc 900
gcatatcttc accaccacca gctgctacac atcgtattgt ccaaatctgt gtcggcttga 960
cccagtgatg tgcgcgctag atttggcagc gcctgaatgc tgtgcagcca cctgtatggt 1020
gcccttggta gagtaacaac acccttatcc ctacggcagc catgtatgac ccttatccct 1080
acggcagcca tgtataccaa tacctttctt tgaaccacaa aattatagtc catatcctta 1140
accacaagtt cattttttgt ttcccggtct cctaaggaaa ttaagttctg tttccacaat 1200
ttacatggat ataggacatc tatgttccta acattaacat tactggataa caggcaccct 1260
ctcctccaca ccctgcaaag ccttcctcca gcgccatgca tcctccgttg ctaacagaca 1320
cctctctcca catcgcgtgc aagcaaacct ccaaattcta ccgatcccca gaatccggcc 1380
ttgactgcaa acagacaccc ctctccccat cctgcaaacc catcagccaa ccgaataaca 1440
caagaaggca ggtgagcagt gacaaagcac gtcaacagca gcaaagccaa gccaaaaacg 1500
atccaggagc aaggtgcggc cgcagctctc ccggtcccct ttgcggttac cactagctaa 1560
gaatgaagat ggtactctaa atggatactt gcgcggtttt tctctagtct aacttaataa 1620
actaaataaa caatttcttt cttatttttt taatttagtt cgtttagtta gactagagaa 1680
gaaccacgag gagttatttg aagcgtcgtc cccatcctta ccactagcta gcactagcag 1740
acacccctct ccacgtcctg caaacaggca attagccagc ggaataacac aagcaggcaa 1800
gtgcgcagtg acaaagtacg tccacagcag cgatcccagc caaaagcagc gtagccacag 1860
ccgcgcgcag ctctcggcta cccttaccgc cgatcacatg catgcctttc caatcccgcg 1920
tgcacacgcc gaccacacac tcgccaactc cccatcccta tttgaagcca ccggccggcg 1980
ccctgcattg atcaatcaac tcgcagca                                    2008
 
<210>34
<211>3188
<212>DNA
<213>两色蜀黍
 
<400>34
cctccgcatt agtggattct aaaacctctt tttttttcat gaaattctat cacggcctag 60
tactagtagt cccctcctct tgagaatacc gagagtataa gcattggttg gggttcaatt 120
tgtttagttc gaatgattga tgagaagctt tatttattta tttactggag atgacaacca 180
aatgttgggg caggatacag aaaagaaaaa caacactctc tttggacggt gccagcttca 240
acggccgacc aaaataatac tactacactt ctagtgcgtg ctgactttga tgaggtgtcc 300
caaatagagt acgtagatga ataggagtat ttgtttcttt ggggggttcc ttttcagaaa 360
gccttttctt attcgtccat gtcacggaga ccaaataaaa ttgggtgggc gtgacaattg 420
gcgtcagctt gacacgatag tccaccagag gcggcaatca gaggccgtgc caaaaagaaa 480
tttcatcatc aaggaaattc aagtttctcg ttccaccaca ttccacgcag tgcaagactc 540
cattaatcca aactactgta gctactagct attcgtccca tcatcttttc ttagatattt 600
atttatttac tttttctata agcaaagttt cttagacaaa atcagtccca acttgactaa 660
cgtaggaata taattcgtaa ggtcggagca aaataattct gctcgatgta atcataccta 720
cacgtacatg tggcggcaat cgttgcttga gaaaaaacaa atacctaact gttttgcaat 780
agcagcaatc atttaggttc aaaaaggaaa tgataataca acggttacat taccccatag 840
acaaaatttt ccttatagtt gttgcaaatt acgatgcgtg agcctctgat taaaaggtaa 900
agtattgata acaaattcat gggtgggagt tagcgcatac gtacaacacc actagtcaag 960
cactaatttg tactactaac tcctcaaatt ttaaagcaga taaaacttat gaaaatcaag 1020
agaagtgaaa tgaaaattga cgaattataa ccccatgacc atttttctct acgtcatcat 1080
caaatgacat ttgcatgact ttatcttgat ttacgatgtg aacaaaccag gaaaatgaga 1140
aagaagaaat tgaccaagca tgtcataata ttcatttttt tctataattt ttcaacagag 1200
tctgactttt gcatggcttt ccttgaagtt gcataaagag atgatcatgc aaaagttgga 1260
ctgttgttat tggccaagcc ttttttttcc tttgctttga ccatcaagaa tagataatcc 1320
ctttcctatt acctttggtc tacagtaatg atccataaca cactatgaac aaaacacaag 1380
caagtactga ttttcaagaa attgaaaaat gattagatga ccttccagag ccctattgaa 1440
aaataagcaa gttggaaagg gagtgggact gagaatatta caatagctac attcttggca 1500
gtctcgatag acaagtgtca catagcattt tattccaaga ctatgtacaa gtatgttgta 1560
gaacaaaggg actattgttt aagatagcat atttcataaa tatttgtttt gaatagaatg 1620
ttttcaaaga tatgattcat cgaagtggca tattggaggt cttatctatt ttcttgtcga 1680
ttaataaggg tgcatttagt agggtccttt ctattttctt gttcacttta caataaatca 1740
accaacagta atttcaacca tgattttagc cagcagtgtt tttcttccca tgtgattaat 1800
caaaactcct ttgtaatatc atttgattag tagactgaat tttggtccac atgaagatat 1860
atatatatat atattaaaag tcatataaat aaaaatatgc ttaaaaatta taaacctttt 1920
gtgggtgaag aataatttaa atacaaccca ttttagtttg ttgtaataaa aaaggattac 1980
aaatgaaaaa aaaattaaaa ttggtagctt gcaagtgcat caaagaatcc agatcagttt 2040
tgtgtggaac gaacgtgtcc taatttctaa ctttgctgaa gaaaacgcag aactgaaacg 2100
ttttggatct agacagaacg acgtttagag ccatttttct agtgattcat gtgagaaatg 2160
aacctgattc tcacacatcc aaacggccca caagtatact gcttcgactt ttttttttca 2220
tgagaatgag atgcacgaca atgcacacat cacgcctcac gcggcactct gatgtcccaa 2280
cattcctaat taaagtattc cggtgatgca atggatggaa gtaaactgaa aaactagatt 2340
ggtgtctaat aataatatac tcctactaaa gactagagat atattcatag atttaaatcc 2400
cttacttaca aagggtcgca caacttgtgt ttagttgaag gagttctcta aaatttgtat 2460
ggacaatagg tacacaaatt tttattatct tagaccttgt ttagttcaaa aaaattttca 2520
aggttctctc acgtcaaatc tttggacgca tgcatgaagc attaaataca gataaaaaat 2580
aactaattgc atagtttatc tctaatttgc aagacaaatc ttttaggctt aattagtcta 2640
tggttggaca ataattgtca atactccctc cgtataggat ttagaatttg tttaggacag 2700
cgacacggtc tccaaaatac aactttaacc tcttattttt tataaaaata tttagaaaaa 2760
tgatatatgt atacttttat aaaagtattt ttcaagacaa atctattcat gtaactttta 2820
tatttacaaa ctcaataatt taagagttat taatgattta tattccaata tttgacacaa 2880
actttgtcca aaacgacttc taaatcctat acgaaaagtg tacaatagtc aaattttaaa 2940
aaaaattcag gaactaacaa agcctccaaa actactagta caacttcaaa taatccccaa 3000
gttcacgggg atcaatctgc aaaagtagga gtacttgtac ttggcatgat gagtcatggg 3060
catgagggag acccacggtt gagcaacata aaattctcca aacgggcccc accaccacac 3120
acgatcacca tcacccccgg gctccccgtc cccccgtaca aataggcacg gcacactccc 3180
aactcccc                                                          3188

Claims (40)

1.一种分离的硝酸还原酶(NR)多核苷酸,其包含选自由下列组成的组的成员:
(a).编码SEQ ID NO:7,8,9,10,11或12的多肽的多核苷酸;
(b).包含SEQ ID NO:1,2,3,4,5或6所示序列的多核苷酸;和
(c).包含长度至少30个核苷酸的多核苷酸,其在严格条件下与(a)或(b)的多核苷酸杂交,其中所述条件包括在37℃在40到45%甲酰胺,1M NaCl,1%SDS中杂交并且在55到60℃,在0.5X到1XSSC中洗涤;和
(d).与SEQ ID NO:1,2,3,4,5或6具有至少70%序列同一性的多核苷酸,其中序列同一性百分比是基于全部编码区并且通过BLAST2.0在缺省参数下确定的,其中所述多核苷酸编码具有硝酸还原酶(NR)活性的多肽;和
(e).作为遗传密码的结果来自(a)到(e)的任一的分离的多核苷酸简并物;
(f).与(a)到(e)的任一的多核苷酸互补的多核苷酸。
2.根据权利要求1的分离的多核苷酸,其编码NR多肽,所述NR多肽赋予在低肥力下增加的产量或氮利用效率。
3.一种载体,其包含至少一种权利要求1的多核苷酸。
4.一种表达盒,其包含与启动子可操作连接的至少一种权利要求1的多核苷酸,其中所述多核苷酸是有义方向的。
5.一种宿主细胞,其被导入了至少一种权利要求4的表达盒。
6.权利要求5的宿主细胞,其为植物细胞。
7.包含至少一种权利要求4的表达盒的转基因植物。
8.权利要求7的转基因植物,其中所述植物选自由下列组成的组:玉米、大豆、向日葵、高粱、油菜、小麦、苜蓿、棉花、稻、大麦和黍。
9.来自权利要求7的转基因植物的种子。
10.权利要求9的种子,其中所述种子是玉米、大豆、向日葵、高粱、油菜、小麦、苜蓿、棉花、稻、大麦或黍。
11.分离的多肽,其选自由下列组成的组:
a)分离的多肽,其包含SEQ ID NOS:7,8,9,10,11或12中的任一,所述多肽具有NR活性;
b)多肽,其与SEQ ID NOS:7,8,9,10,11或12的任一的氨基酸序列具有至少70%同一性,所述多肽具有NR活性;
c)多肽,其被包含核苷酸序列的核酸分子编码,所述核苷酸序列与SEQ ID NOS:1,2,3,4,5或6的任一或其互补序列具有至少70%同一性,所述多肽具有NR活性;
d)多肽,其被核酸分子编码,至少一次在0.2XSSC中55℃洗涤20分钟之后,所述核酸分子与核酸探针杂交,所述核酸探针由SEQID NOS:1,2或3的任一或其互补序列的核苷酸序列组成,所述多肽具有NR活性;
e)片段,其包含SEQ ID NOS:7,8,9,10,11,或12的任一的至少200个连续氨基酸,所述多肽具有NR活性。
12.重组表达盒,其包含与启动子可操作连接的多核苷酸,其中所述多核苷酸编码权利要求11的多肽。
13.转化的宿主细胞,其包含权利要求11的分离的多肽。
14.权利要求13的宿主细胞,其中所述宿主细胞是转化的植物细胞。
15.权利要求14的植物细胞,其中所述植物细胞选自由下列组成的组:高粱、玉蜀黍、稻、小麦、大豆、向日葵、油菜、苜蓿、大麦和黍。
16.从权利要求14的植物细胞再生的转化的植物。
17.权利要求16的植物,其中所述植物是高粱、玉蜀黍、稻、小麦、大豆、向日葵、油菜、苜蓿、大麦或黍。
18.权利要求16的植物的转化的种子。
19.分离的多肽,其由SEQ ID NO:1,2,3,4,5或6的多核苷酸编码。
20.权利要求11的分离的多肽,其中NR在植物中的表达导致与对照植物相比该植物产量增加,其中所述对照植物不包含编码NR的所述多核苷酸。
21.调节植物细胞中硝酸还原酶(NR)蛋白的水平的方法,其包括:
(a)用与启动子可操作连接的NR多核苷酸转化植物细胞,其中所述多核苷酸是有义方向的;和
(b)表达所述多核苷酸充分的时间以调节所述植物细胞中的NR蛋白。
22.权利要求21的方法,其中所述植物是玉米,大豆,向日葵、高粱、油菜、小麦、苜蓿、棉花、稻、大麦或黍。
23.权利要求21的方法,其中NR蛋白被增加。
24.权利要求21的方法,其中NR蛋白被降低。
25.调节植物中硝酸还原酶(NR)蛋白的水平的方法,其包括:
(a)用与启动子可操作连接的NR多核苷酸稳定转化植物细胞,其中所述多核苷酸是有义方向的;和
(b)将所述转化的植物细胞再生为转化的植物,所述转化的植物表达足以调节该植物中NR蛋白水平的量的NR多核苷酸。
26.权利要求25的方法,其中所述植物是玉米,大豆,向日葵、高粱、油菜、小麦、苜蓿、棉花、稻、大麦或黍。
27.权利要求25的方法,其中与对照植物相比NR蛋白被增加,其中所述对照植物不包含编码NR的所述多核苷酸。
28.权利要求25的方法,其中与对照植物相比NR蛋白被降低,其中所述对照植物不包含编码NR的所述多核苷酸。
29.增加植物产量的方法,所述方法包括步骤:
(a)将包含编码硝酸还原酶(NR)的多核苷酸的构建体导入植物细胞,其中所述NR多核苷酸与在植物细胞中有功能的启动子可操作地连接以产生转化的植物细胞,并且其中编码NR蛋白的所述NR选自由下列组成的组:
(1).编码SEQ ID NO:7,8,9,10,11或12的多肽的多核苷酸;
(2).包含SEQ ID NO:7,8,9,10,11或12编码区中所示序列的多核苷酸;和
(3).包含长度至少30个核苷酸的多核苷酸,其在中等严格条件下与(a)或(b)的多核苷酸杂交,其中所述条件包括在37℃在40到45%甲酰胺,1M NaCl,1%SDS中杂交并且在55到60℃,在0.5X到1X SSC中洗涤;和
(4).与SEQ ID NO:1,2,3,4,5或6具有至少70%序列同一性的多核苷酸,其中序列同一性百分比是基于全部编码区并且通过BLAST2.0在缺省参数下确定的;和
(5).作为遗传密码的结果来自(1)到(4)的任一的分离的多核苷酸简并物;
(6).与(1)到(5)的任一的多核苷酸互补的多核苷酸;
(b)从所述转化的植物细胞再生转基因植物,其中所述NR在所述转基因植物的细胞中以足以保持或增加所述转基因植物产量的水平表达。
30.权利要求29的方法,其中增加的产量包括增强的根生长,增加的种子大小,增加的种子重量,所述植物具有胚大小增加的种子,增加的叶大小,增加的幼苗活力,增强的吐丝,增加的穗大小或叶绿素含量。
31.权利要求29的方法,其中所述植物在有限的氮肥力下生长。
32.权利要求31的方法,其中所述植物的氮利用效率增加。
33.权利要求31的方法,其中与所述植物的内源NR活性相比所述NR多核苷酸的NR活性增加。
34.权利要求29的方法,其中所述NR多核苷酸的表达被磷酸烯醇丙酮酸脱羧酶(PEPC)启动子驱动。
35.权利要求29的方法,其中编码NR的所述多核苷酸是组成性表达的。
36.权利要求29的方法,其中编码NR的所述多核苷酸是诱导型表达的。
37.权利要求29的方法,其中编码NR的所述多核苷酸以细胞特异,组织特异,或器官特异方式表达。
38.权利要求29的方法,其中所述植物是双子叶植物。
39.权利要求29的方法,其中所述植物是单子叶植物。
40.权利要求29的方法,其中所述植物的产量与对照植物相当,其中所述对照植物不包含编码NR的所述多核苷酸。
CN2008801030628A 2007-06-15 2008-06-13 来自紫菜属的硝酸还原酶,组成及其使用方法 Expired - Fee Related CN101784656B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US94434307P 2007-06-15 2007-06-15
US60/944,343 2007-06-15
PCT/US2008/066952 WO2008157375A1 (en) 2007-06-15 2008-06-13 Nitrate reductases from porphyra, compositions and methods of use thereof

Publications (2)

Publication Number Publication Date
CN101784656A true CN101784656A (zh) 2010-07-21
CN101784656B CN101784656B (zh) 2013-08-28

Family

ID=39731751

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2008801030628A Expired - Fee Related CN101784656B (zh) 2007-06-15 2008-06-13 来自紫菜属的硝酸还原酶,组成及其使用方法

Country Status (9)

Country Link
US (3) US7834245B2 (zh)
EP (1) EP2167652A1 (zh)
CN (1) CN101784656B (zh)
AR (1) AR067014A1 (zh)
BR (1) BRPI0812992A2 (zh)
CA (1) CA2690797A1 (zh)
CL (1) CL2008001762A1 (zh)
MX (1) MX2009013559A (zh)
WO (1) WO2008157375A1 (zh)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
UA108071C2 (uk) * 2009-04-14 2015-03-25 Піонер Хай-Бред Інтернешнл, Інк. Спосіб поліпшення витривалості до нестачі азоту у рослини
CA2770854A1 (en) 2009-08-20 2011-02-24 Pioneer Hi-Bred International, Inc. Functional expression of shuffled yeast nitrate transporter (ynt1) in maize to improve nitrate uptake under low nitrate environment
EP2467472A2 (en) * 2009-08-20 2012-06-27 Pioneer Hi-Bred International Inc. Functional expression of yeast nitrate transporter (ynt1) in maize to improve nitrate uptake
KR101155994B1 (ko) 2010-07-22 2012-06-27 대한민국 김에서 유래된 고온내성 단백질 및 그의 유전자 ηtr2

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7390937B2 (en) * 1996-02-14 2008-06-24 The Governors Of The University Of Alberta Plants with enhanced levels of nitrogen utilization proteins in their root epidermis and uses thereof
WO2000062601A1 (en) * 1999-04-15 2000-10-26 Northeastern University Agrobacterium-mediated genetic transformation of multicellular marine algae, resultant strains and their products
RU2257711C2 (ru) * 2003-10-06 2005-08-10 Всероссийский научно-исследовательский институт защиты растений Композиция на основе хитозана, снижающая содержание нитратов в растениеводческой продукции

Also Published As

Publication number Publication date
US7834245B2 (en) 2010-11-16
CA2690797A1 (en) 2008-12-24
CL2008001762A1 (es) 2008-12-19
US20080313775A1 (en) 2008-12-18
BRPI0812992A2 (pt) 2015-07-21
US20130091605A1 (en) 2013-04-11
US20110041216A1 (en) 2011-02-17
EP2167652A1 (en) 2010-03-31
WO2008157375A1 (en) 2008-12-24
AR067014A1 (es) 2009-09-30
MX2009013559A (es) 2010-01-26
US8269066B2 (en) 2012-09-18
CN101784656B (zh) 2013-08-28

Similar Documents

Publication Publication Date Title
US20200113147A1 (en) Manipulation of glutamine synthetases (gs) to improve nitrogen use efficiency and grain yield in higher plants
US7994398B2 (en) Secondary wall forming genes from maize and uses thereof
CN101421295A (zh) 用于提高作物植物中的氮利用效率的基因
US9347068B2 (en) Manipulation of ammonium transporters (AMTs) to improve NUE in higher plants
US7834240B2 (en) Zea maize auxin response related genes for controlling plant growth and organ size and their use in improving crop plants
CN101589147A (zh) 改善农作物的植物生长、蒸腾效率和耐旱性的玉米erecta基因
CN101784656B (zh) 来自紫菜属的硝酸还原酶,组成及其使用方法
US8975474B2 (en) Functional expression of yeast nitrate transporter (YNT1)and a nitrate reductase in maize
CN102471779A (zh) 使用二聚化结构域组分堆叠以调节植株构造
CN101142318B (zh) 细胞数目多核苷酸和多肽以及使用其的方法
MX2011004216A (es) Gen at1g67330 novedoso en la eficiencia de captacion de nitrato alterada.
CN102186980A (zh) 植物中氮应答的改进
MX2008010196A (en) Genes for enhancing nitrogen utilization efficiency in crop plants

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20130828

Termination date: 20150613

EXPY Termination of patent right or utility model