CN1688697A - 尿黑酸异戊二烯基转移酶(“hpt”)核酸和多肽以及它们的用途 - Google Patents

尿黑酸异戊二烯基转移酶(“hpt”)核酸和多肽以及它们的用途 Download PDF

Info

Publication number
CN1688697A
CN1688697A CN03811448.8A CN03811448A CN1688697A CN 1688697 A CN1688697 A CN 1688697A CN 03811448 A CN03811448 A CN 03811448A CN 1688697 A CN1688697 A CN 1688697A
Authority
CN
China
Prior art keywords
nucleic acid
plant
acid molecule
leu
seq
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN03811448.8A
Other languages
English (en)
Other versions
CN1688697B (zh
Inventor
亨利·E·瓦伦丁
泰亚马冈德鲁·V·文卡蒂什
巴拉萨洛吉尼·卡鲁纳南达
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Monsanto Co
Original Assignee
Monsanto Co
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Monsanto Co filed Critical Monsanto Co
Priority claimed from US10/391,363 external-priority patent/US7112717B2/en
Publication of CN1688697A publication Critical patent/CN1688697A/zh
Application granted granted Critical
Publication of CN1688697B publication Critical patent/CN1688697B/zh
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Images

Landscapes

  • Breeding Of Plants And Reproduction By Means Of Culturing (AREA)
  • Enzymes And Modification Thereof (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)

Abstract

本发明属于植物遗传学和生物化学领域。更特别地,本发明涉及与生育酚生物合成路径相关的基因和多肽,也就是编码尿黑酸异戊二烯基转移酶活性的那些,以及它们的用途。

Description

尿黑酸异戊二烯基转移酶(“HPT”)核酸 和多肽以及它们的用途
本申请要求享有2002年3月19日申请的US60/365,202的优先权,该申请的公开在此全部引入作为参考。
本发明属于植物遗传学和生物化学领域。更特别地,本发明涉及与生育酚生物合成路径相关的基因和多肽,也就是那些编码尿黑酸异戊二烯基转移酶活性的,以及它们的用途。
类异戊二烯是存在于所有活性生物体中的遍在化合物。植物合成超过22,000种的大量不同类异戊二烯(Connolly和Hill,Dictionary of Terpenoids,Chapman and Hall,New York,NY(1992))。在植物中,类异戊二烯在特定细胞功能如促进真核细胞膜构建的固醇的生成中起重要作用,以及在生成泛醌和质体醌的侧链上的无环聚异戊烯醇(acyclic polyprenoids)、生长调节剂样脱落酸、赤霉素、油菜素类固醇或光合色素叶绿素和类胡萝卜素中。虽然其他植物类异戊二烯的生理学作用不是明显的,如同大量次级代谢产物,一些类异戊二烯在调整对不同环境刺激的适应性反应中起关键作用。尽管结构和功能的显著差异,所有类异戊二烯来自单一的代谢前体,二磷酸异戊烯(IPP)(Wright,(1961)Annu.Rev.Biochem.,20:525-548,和Spurgeon andPorter,In:Biosynthesis of Isoprenoid Compounds,Porter and Spurgeon(eds.)John Wiley,NY,Vol.1,pp.1-46(1981))。
大量独特的和相互关联的生物化学路径存在于高等植物的叶绿体中,起源于类异戊二烯路径,这些路径产生次级代谢产物,包括生育酚。生育酚不仅在植物中起重要作用,而且对于哺乳动物营养特性也是重要的。在质体中,生育酚达到总醌沉积的40%。生育酚是哺乳动物食物中的重要成分。流行病学证据表明添加生育酚能够降低患心血管疾病和癌症的危险,能够增强免疫功能,并且与防止和延缓大量人的衰老性疾病的进程相关。(Traber and Sies,Annu Rev.Nutr.,16:321-347(1996))。生育酚部分地通过稳定生物膜的脂质双分子层(Skrypin and Kagan,Biochim.Biophys.Acta,815:209(1995);Kagan,N.Y.Acad.Sci.,p.121(1989);Gomez-Fernandez et al.,Ann.N.Y.Acad.Sci.,p.109(1989)),降低通过脂氧化产生的多聚不饱和脂肪酸(PUFA)自由基(Fukuzawa et al.,Lipids,17:511-513(1982))和清除氧自由基、脂肪过氧化基和单线态氧种类(Diplock et al.,Ann.N Y Acad.Sci.,570:72(1989);Fryer,Plant Cell Environ.,15(4):381-392(1992))来起作用。
化合物α-生育酚通常称作为维生素E,属于一类脂溶性抗氧化剂,包括α、β、γ和δ生育酚和α、β、γ和δ三烯生育酚。虽然有时α、β、γ和δ生育酚和α、β、γ和δ三烯生育酚都称作为“维生素E”,在化学上维生素E定义为α-生育酚是更恰当的。维生素E或α-生育酚对于人的健康是十分重要的,部分地由于其容易被机体吸收和保留,因此具有比其他生育酚种类更高的生物学活性(Traber and Sies,Annu.Rev.Nutr.,16:321-347(1996))。但是,其他生育酚如β、γ和δ生育酚也具有极高的健康和营养价值。
生育酚主要仅由植物和某些其他光合作用生物体合成,包括蓝细菌。结果,哺乳动物食物中的生育酚几乎毫无例外地来自这些来源。植物组织中α-生育酚的总生育酚含量和生育酚组成差异显著,α-生育酚是存在于绿色光合作用植物组织中的主要生育酚种类。每克鲜新的叶片组织中含有10-50μg总生育酚,但是全世界主要种植的农作物(如稻、玉米、小麦、马铃薯)生成少量到极低水平的总生育酚,其中仅极小比例为α-生育酚(Hess,Vitamin E,α-tocopherol,In:Antioxidants in Higher Plants,R.Alscher andJ.Hess,(eds.),CRC Press,Boca Raton.,pp.111-134(1993))。油料种子作物通常含有更高含量的总生育酚,但是在油料种子中,α-生育酚仅作为小成分存在(Taylor and Barmes,Chemy Ind.,Oct:722-726(1981))。
从普通的美国人的食物中实现推荐的每日食物摄取15-30mg维生素E是相当困难的。例如,将食用750克以上α-生育酚占总生育酚的60%的菠菜叶,或者200-400克大豆油来满足这种推荐的每日维生素E的摄取。但是,可能在食物中增加添加剂,这些添加剂中大部分主要含有合成的维生素E,具有8种立体异构体,而天然的维生素E主要由一种单一的异构体组成。而且,添加剂趋向于相对昂贵,并且普通人不愿意经常性地食用维生素添加剂。因此,本领域需要提高总生育酚产量或提高植物生成的α-生育酚的相对比例的组合物和方法。
除了生育酚的健康价值,提高作物中的α-生育酚水平与增强稳定性和延长植物产品的存放时间相关(Peterson,Cereal-Chem.,72(1):21-24(1995);Ball,Fat-soluble vitamin assays in food analysis.A comprehensive review,London,Elsevier Science Publishers Ltd.(1988))。此外,已经证明在猪、牛、和家禽饲料中添加生育酚,显著提高肉品质和通过延迟加工后的脂肪氧化来延长肉产品加工后的存放时间,脂肪氧化会产生令人不快的气味成分(Sante and Lacourt,J.Sci.Food Agric.,65(4):503-507(1994);Buckley etal.,J.ofAnimal Science,73:3122-3130(1995))。
生育酚的生物合成
高等植物的质体具有相互连接的生物化学路径,其产生次级代谢产物,包括生育酚。高等植物中的生育酚生物合成路径包括缩合尿黑酸和叶绿基焦磷酸(phytylpyrophosphate)来形成2-甲基叶绿基质体醌醇(Fiedler et al.,Planta,155:511-515(1982);Soll et al.,Arch.Biochem.Biophys.,204:544-550(1980);Marshall et al.,Phytochem.,24:1705-1711(1985))。这种植物生育酚路径可被分成四个部分:1)尿黑酸合成(HGA),其构成生育酚的芳香环;2)叶绿基焦磷酸合成,其构成生育酚的侧链;3)通过尿黑酸异戊二烯基转移酶连接HGA和叶绿基焦磷酸,随后进行环化;和4)芳香环的S-腺苷甲硫氨酸依赖的甲基化,其影响各种生育酚种类的相对丰度。参见附图1。
参与生育酚生物合成的各种基因及其编码的蛋白质包括列举在下表中的那些。
基因ID 酶名称
tyrA 双功能预苯酸(prephenate)脱氢酶
slr1736 集胞蓝细菌属(Synechocystis)的尿黑酸异戊二烯基转移酶
ATPT2 拟南芥(Arabidopsis thaliana)的尿黑酸异戊二烯基转移酶
DXS 1-脱氧木酮糖-5-磷酸合成酶
DXR 1-脱氧木酮糖-5-磷酸还原异构酶
GGPPS 香叶基香叶基焦磷酸合成酶
HPPD 羟基苯基丙酮酸双加氧酶
AANT1 腺苷酸转运蛋白
slr737 生育酚环化酶
IDI 异戊烯基二磷酸异构酶
GGH 香叶基香叶基二磷酸还原酶
GMT γ甲基转移酶
tMT2 生育酚甲基转移酶2
MT1 甲基转移酶1
gcpE (E)-4-羟基-3-甲基丁基-2-enyl二磷酸合成酶
上表中给出的“基因ID”确定与所列酶相关的基因。本发明公开中任何列举在此表中的基因ID是指编码在表中与基因ID相关的酶的基因。
如本文所用,HPT、HPT2、PPT、slr1736和ATPT2分别是指蛋白质或编码具有相同活性的蛋白质的基因。
尿黑酸的合成
尿黑酸是生育酚和质体醌的常见前体。至少在一些细菌中,尿黑酸的合成被报道是通过转化分支酸为预苯酸,然后通过双功能预苯酸脱氢酶转化为p-羟基苯基丙酮酸发生。双功能细菌预苯酸脱氢酶的例子包括由草生欧文氏杆菌(Erwinia herbicola)和大肠杆菌tyrA基因编码的蛋白质。tyrA基因产物催化由分支酸生成预苯酸,随后预苯酸脱氢形成尿黑酸的直接前体p-羟基苯基丙酮酸(p-HPP)。然后p-HPP通过羟基苯基丙酮酸双加氧酶(HPPD)转化为尿黑酸。相反,一般认为植物缺乏预苯酸脱氢酶活性,并且一般认为通过合成和转化中间体arogenate来由分支酸合成尿黑酸。由于参与尿黑酸合成的路径还负责酪氨酸生成,这些路径中的任何改变还会导致酪氨酸合成和其他芳香氨基酸合成的变化。
叶绿基焦磷酸的合成
生育酚是称作类异戊二烯的化合物种类中的成员。其他类异戊二烯包括类胡萝卜素、赤霉素、萜烯、叶绿素和脱落酸。生成类异戊二烯中的主要中间体是异戊烯基二磷酸(IPP)。生成IPP的胞质和质体路径已经被报道。胞质路径包括酶乙酰乙酰辅酶A硫解酶、HMGCoA合成酶、HMGCoA还原酶、甲羟戊酸激酶、磷酸甲羟戊酸激酶和甲羟戊酸焦磷酸脱羧酶。
最近,从Rohmer和Arigoni研究小组的试验中得到存在可选择的质体、类异戊二烯生物合成路径的证据(Eisenreich etal.,Chem.Bio.,5:R221-R233(1998);Rohmer,Prog.Drug.Res.,50:135-154(1998);Rohmer,Comprehensive Natural Products Chemistry,Vol.2,pp.45-68,Bartonand Nakanishi(eds.),Pergamon Press,Oxford,England(1999)),他们发现在对一些真细菌(eubacterial)的和植物萜类化合物的研究中观察到的同位素标记模式的不能通过甲羟戊酸路径来解释。接着Arigoni和coworkers表明1-脱氧木酮糖或其衍生物作为新路径的中间体,该路径现在称作为MEP路径(Rohmer et al.,Biochem.J.,295:517-524(1993);Schwarz,Ph.D.thesis,Eidgenssiche Technische Hochschule,Zurich,Switzerland(1994))。最近的研究表明从一分子的各种甘油醛3-磷酸(Rohmer,Comprehensive NaturalProducts Chemistry,Vol.2,pp.45-68,Barton and Nakanishi(eds.),Pergamon Press,Oxford,England(1999))和丙酮酸(Eisenreich etal.,Chem.Biol.,5:R223-R233(1998);Schwarz supra;Rohmer etal.,J.Am.Chem.Soc.,118:2564-2566(1996);和Sprenger et al.,Proc.Natl.Acad.Sci.(U.S.A.),94:12857-12862(1997))通过由dxs基因编码的酶(Lois et al.,Proc.Natl.Acad.Sci.(U.S.A.),95:2105-2110(1997);and Lange et al.,Proc.Natl.Acad.Sci.(U.S.A.),95:2100-2104(1998))形成1-脱氧木糖酮5-磷酸(Broers,Ph.D.thesis,Eidgenssiche Technische Hochschule,Zurich,Switzerland(1994))。1-脱氧木酮糖5-磷酸可以被进一步通过由dxr基因编码的还原异构酶(Bouvier et al.,Plant Physiol,117:1421-1431(1998);和Rohdich et al.,Proc.Natl.Acad.Sci.(U.S.A.),96:11758-11763(1999))转化为2-C-甲基赤藓糖醇4-磷酸(Arigoni et al.,Proc.Natl.Acad.Sci.(U.S.A.),94:10600-10605(1997))。
报道存在于MEP路径的基因还包括催化2-C-甲基赤藓糖醇4-磷酸转化为各自的胞嘧啶焦磷酸衍生物的ygbP和催化4-磷酸胞嘧啶-2-C-甲基-D-赤藻糖醇转化为2-C-甲基-D-赤藻糖醇,3,4-环磷酸的ygbB。这些基因在大肠杆菌基因组中紧密连接(Herz et al.,Proc.Natl.Acad.Sci.(U.S.A.),97(6):2485-2490(2000))。
一旦IPP通过MEP路径形成,其通过GGPDP合成酶转化为GGDP然后转化为叶绿基焦磷酸,其是生育酚侧链的关键组成。
结合与环化
尿黑酸通过尿黑酸异戊二烯基转移酶(HPT)与叶绿基焦磷酸或茄基(solanyl)-焦磷酸结合,分别形成2-甲基叶绿基质体醌醇或2-甲基茄基(solanyl)质体醌醇。2-甲基茄基(solanyl)质体醌醇是生物合成质体醌的前体,而2-甲基叶绿基质体醌醇最终转化为生育酚。
芳香环的甲基化
各种生育酚亚型的主要结构差别是环绕苯环的甲基基团的位置。2-甲基叶绿基质体醌醇和2-甲基茄基(solanyl)质体醌醇都作为植物酶2-甲基叶绿基质体醌醇/2-甲基茄基(solanyl)质体醌醇甲基转移酶(生育酚甲基转移酶2;甲基转移酶2;MT2;tMT2)的底物,其能够使生育酚前体甲基化。接着由γ-生育酚甲基转移酶(GMT)在γ-生育酚的位置5的甲基化产生生物活性的α-生育酚。
一些植物如大豆在其种子中生成大量δ-生育酚,随后为β-生育酚。可以通过过度表达tMT2来阻止δ-生育酚和β-生育酚的形成,导致δ-生育酚前体2-甲基叶绿基质体醌甲基化形成2,3-二甲基-5-叶绿基质体醌,接着被生育酚环化酶环化形成γ-生育酚,接着被GMT甲基化形成α-生育酚。在另一个可能的路径中,β-生育酚通过tMT2甲基化3位置直接转化为α-生育酚(参见,如Biochemical Society Transactions,11:504-510(1983);Introduction to PlantBiochemistry,2nd edition,Chapter 11 (1983);Vitamin Hormone,29:153-200(1971);Biochemical Journal,109:577(1968);and,Biochemical andBiophysical Research Communication,28(3):295(1967))。由于生成α-生育酚的所有可能机制都包括由tMT2催化,缺乏这种活性的植物沉积δ-生育酚和β-生育酚。tmT2活性升高的植物倾向于蓄积γ-生育酚和α-生育酚。由于在许多植物种子中,GMT活性受限,这些植物倾向于蓄积γ-生育酚。
在本领域需要编码参与生育酚生物合成的酶以及相关酶和在植物增强或改变生育酚生产的抗体的核酸分子。还需要表达这些参与生育酚生物合成的核酸分子的转基因生物,能够在营养学上增加食物和饲料来源。
发明概述
本发明包括和提供基本上纯的核酸分子,其编码的氨基酸序列选自SEQ ID NO:5、9-11、57-58或90。
本发明包括和提供基本上纯的多肽分子,包括选自SEQ ID NO:5、9-11、57-58或90的氨基酸序列。
本发明包括和提供能够特异结合多肽的抗体,多肽包括选自SEQ IDNO:5、9-11、57-58或90的氨基酸序列。
本发明包括和提供基本上纯的核酸分子,其编码的多肽具有尿黑酸异戊二烯基转移酶活性,包括选自SEQ ID NO:43或44的氨基酸序列。
本发明包括和提供基本上纯的多肽,其具有尿黑酸异戊二烯基转移酶活性,包括选自SEQ ID NO:43或44的氨基酸序列。
本发明包括和提供被转化的植物,包含被导入的核酸分子,其编码包括选自SEQ ID NO:5、9-11、43-44、57-58或90的氨基酸序列的多肽或其互互补体。
本发明包括和提供被转化的植物,其包括被导入的编码包括选自SEQID NO:5、9-11、43-44、57-58或90的氨基酸序列的多肽或其互补体的第一个核酸分子,和被导入的编码选自tyrA、预苯酸(prephenate)脱氢酶、生育酚环化酶、dxs、dxr、GMT、MT1、tMT2、GCPE、GGPPS、HPPD、AANT1、IDI、GGH的酶及其互补体的第二个核酸分子。
本发明包括和提供被转化的植物,包括包含导入的启动子区的核酸分子,启动子区在植物细胞中的作用导致mRNA分子生成,其中所述被导入的启动子区被连接到被转录的核酸分子上,核酸分子具有转录链和非转录链,其中所述转录链与编码多肽的核酸分子互补,该多肽选自SEQ ID NO:5、9-11、43-44、57-58或90,其中所述被转录的核酸分子被连接到3’非翻译序列上,非翻译序列在植物细胞中起导致转录终止和添加聚腺苷酸化核苷酸到mRNA序列的3’末端的作用。
本发明包括和提供制备种子中生育酚水平提高的植物的方法,包括(A)用导入的核酸分子转化所述植物,该核酸分子编码包括选自SEQ ID NO:5、9-11、43-44、57-58或90的氨基酸序列的多肽;和(B)种植所述转化的植物。
本发明包括和提供制备种子中生育酚水平提高的植物的方法,包括(A)用导入的第一核酸分子和第二核酸分子转化所述植物,第一核酸分子编码具有选自SEQ ID NO:5、9-11、43-44、57-58和90的氨基酸序列的多肽,第二核酸分子编码选自tyrA、预苯酸脱氢酶、生育酚环化酶、dxs、dxr、GMT、MT1、tMT2、GGPPS、GCPE、HPPD、AANT1、IDI、GGH的酶或其互补体;和(B)种植所述转化的植物。
本发明包括和提供来自被转化的植物的种子,其包括导入的编码包含选自SEQ ID NO:5、9-11、43-44、57-58或90的氨基酸序列的多肽的核酸分子。
本发明包括和提供来自被转化的植物的种子,其包括导入的编码包括选自SEQ ID NO:5、9-11、43-44、57-58或90的氨基酸序列的多肽的第一核酸分子,和导入的编码选自tyrA、预苯酸脱氢酶、生育酚环化酶、dxs、dxr、GMT、MT1、GCPE、tMT2、GGPPS、HPPD、AANT1、IDI、GGH的酶及其互补体导入的第二核酸分子。
本发明包括和提供基本上纯的多肽,包括选自SEQ ID NO:39-42、46-49或92-95的氨基酸序列,其中所述氨基酸序列不是来自衍生自点型念珠蓝细菌(Nostoc Punctiforme)、鱼腥蓝细菌属(Anabaena)、集胞蓝细菌属(Synechocystis)、玉蜀黍(Zeamays),大豆(Glycine max)、拟南芥(Arabidopsisthaliana)、稻(Oryza sativa)、红海束毛蓝细菌(Trichodesmium erythraeum)、橙色绿屈挠菌(Chloroflexus aurantiacus)、小麦、韭、菜籽(Canola)、棉花或西红柿的核酸分子。本发明包括和提供所述基本上纯的多肽,其中一种以上的氨基酸序列选自SEQ ID NO:39-42、46-49或92-95。
本发明包括和提供基本上纯的编码多肽的核酸分子,多肽包括选自SEQ ID NO:39-42、46-49或92-95的氨基酸序列,其中所述核酸分子不是来自点型念珠蓝细菌、鱼腥蓝细菌属、集胞蓝细菌属、玉米、大豆、拟南芥、稻、红海束毛蓝细菌、橙色绿屈挠菌、小麦、韭、菜籽、棉花或西红柿。本发明提供和包括所述核酸分子,其中多肽还包括一种以上选自SEQ IDNO:39-42、46-49或92-95的氨基酸序列。
本发明包括和提供基本上纯的编码多肽的核酸分子,多肽包括选自SEQ ID NO:39-42、46-49或92-95的氨基酸序列,其中所述核酸分子不是来自点型念珠蓝细菌、鱼腥蓝细菌属、集胞蓝细菌属、玉米、大豆、拟南芥、稻、硫化叶菌属(Sulfolobus)、Aeropyum、红海束毛蓝细菌、橙色绿屈挠菌、高梁、小麦、西红柿或韭。本发明提供和包括所述核酸分子,其中多肽还包括一种以上选自SEQ ID NO:39-42、46-49或92-95的氨基酸序列。
本发明包括和提供用核酸分子转化的植物,该核酸分子编码包含选自的SEQ ID NO:39-42、46-49或92-95的氨基酸序列的多肽,其中所述核酸分子不是来自点型念珠蓝细菌、鱼腥蓝细菌属、集胞蓝细菌属、玉米、大豆、拟南芥、稻、硫化叶菌、Aeropyum、红海束毛蓝细菌、橙色绿屈挠菌、高梁、小麦、西红柿或韭。本发明包括和提供所述核酸分子,其中多肽还包括一种以上选自SEQ ID NO:39-42、46-49或92-95的氨基酸序列。
本发明包括和提供基本上纯的多肽,其包含选自SEQ ID NO:39-42、46-49和92-95的氨基酸序列,其中所述多肽不包含任何示于WO00/68393;WO00/63391;WO01/62781或WO02/33060(这些序列在此引入作为参考)的序列表中的氨基酸序列(这些序列在此引入作为参考),和不包含本申请的SEQ ID NO:1-11、43-45、57-58、61-62或90。
本发明包括和提供基本上纯的多肽,其包含一种以上选自SEQ IDNO:39-42、46-49或92-95的氨基酸序列。
本发明包括和提供基本上纯的核酸分子,其编码包含选自SEQ IDNO:39-42、46-49或92-95的氨基酸序列的多肽,其中所述核酸分子不包含任何示于WO00/68393;WO00/63391;WO01/62781或WO02/33060的序列表中的核酸序列,和不包含本发明的SEQ ID NO:27-36、59-60、88-89和91或Genebank登录号为AI897027或AW563431的基因。本发明包括和提供所述核酸分子,其中该多肽还包括一种以上选自SEQ ID NO:39-42、46-49和92-95的氨基酸序列。
本发明包括和提供用核酸分子转化的植物,该核酸分子编码包含选自SEQ ID NO:39-42、46-49和92-95的氨基酸序列的多肽,其中所述核酸分子不包含任何示于WO00/68393;WO00/63391;WO01/62781或WO02/33060的序列表中的核酸序列,和不包含本发明的SEQ ID NO:27-36、59-60、88-89和91或Genebank登录号为AI897027或AW563431的基因。本发明包括和提供所述核酸分子,其中该多肽还包括一种以上选自SEQ ID NO:39-42、46-49或92-95的氨基酸序列。
本发明包括和提供基本上纯的核酸分子,包含选自SEQ ID NO:31、34-36、59-60或91的核酸分子。
本发明包括和提供尿黑酸异戊二烯基转移酶,其用附图2a-2c、3a-3c、24a-24b、25a-25b、33a-33c、34a-34b、35a-35b和36的一种或多种比对发现。
                   核酸和氨基酸序列描述
SEQ ID NO:1表示点型念珠蓝细菌尿黑酸异戊二烯基转移酶多肽。
SEQ ID NO:2表示鱼腥蓝细菌属尿黑酸异戊二烯基转移酶多肽。
SEQ ID NO:3表示集胞蓝细菌属尿黑酸异戊二烯基转移酶多肽。
SEQ ID NO:4表示玉米尿黑酸异戊二烯基转移酶多肽(HPT1)。
SEQ ID NO:5表示大豆尿黑酸异戊二烯基转移酶多肽(HPT1-2)。
SEQ ID NO:6表示大豆尿黑酸异戊二烯基转移酶多肽(HPT1-1)。
SEQ ID NO:7表示拟南芥尿黑酸异戊二烯基转移酶多肽(HPT1)。
SEQ ID NO:8表示部分萼距花(Cuphea pulcherrima)尿黑酸异戊二烯基转移酶多肽。
SEQ ID NO:9表示韭的尿黑酸异戊二烯基转移酶多肽(HPT1)。
SEQ ID NO:10表示小麦尿黑酸异戊二烯基转移酶多肽(HPT1)。
SEQ ID NO:11表示萼距花尿黑酸异戊二烯基转移酶多肽(HPT1)。
SEQ ID NO:12-15表示SEQ ID NO:1-8的结构域。
SEQ ID NO:16-26表示引物序列。
SEQ ID NO:27表示编码点型念珠蓝细菌尿黑酸异戊二烯基转移酶多肽的核酸分子。
SEQ ID NO:28表示编码鱼腥蓝细菌属尿黑酸异戊二烯基转移酶多肽的核酸分子。
SEQ ID NO:29表示编码集胞蓝细菌属尿黑酸异戊二烯基转移酶多肽的核酸分子。
SEQ ID NO:30表示编码玉米尿黑酸异戊二烯基转移酶多肽(HPT1)的核酸分子。
SEQ ID NO:31表示编码大豆尿黑酸异戊二烯基转移酶多肽(HPT1-2)的核酸分子。
SEQ ID NO:32表示编码大豆尿黑酸异戊二烯基转移酶多肽(HPT1-1)的核酸分子。
SEQ ID NO:33表示编码拟南芥尿黑酸异戊二烯基转移酶多肽(HPT1)的核酸分子。
SEQ ID NO:34表示编码萼距花尿黑酸异戊二烯基转移酶多肽(HPT1)的核酸分子。
SEQ ID NO:35表示编码韭的尿黑酸异戊二烯基转移酶多肽(HPT1)的核酸分子。
SEQ ID NO:36表示编码小麦尿黑酸异戊二烯基转移酶多肽(HPT1)的核酸分子。
SEQ ID NO:37-38表示引物序列。
SEQ ID NO:39-42表示SEQ ID NO:1-7和9-11的结构域。
SEQ ID NO:43表示来自红海束毛蓝细菌的尿黑酸异戊二烯基转移酶多肽。
SEQ ID NO:44表示来自橙色绿屈挠菌的尿黑酸异戊二烯基转移酶多肽。
SEQ ID NO:45表示拟南芥尿黑酸异戊二烯基转移酶多肽(HPT2)的推定序列。
SEQ ID NO:46-49表示SEQ ID NO:1-4、6-7、9-11、57-58和91的结构域。
SEQ ID NO:50-56表示引物序列。
SEQ ID NO:57表示拟南芥尿黑酸异戊二烯基转移酶多肽(HPT2)。
SEQ ID NO:58表示稻尿黑酸异戊二烯基转移酶多肽(HPT2)。
SEQ ID NO:59表示编码拟南芥尿黑酸异戊二烯基转移酶多肽(HPT2)的核酸分子。
SEQ ID NO:60表示编码稻尿黑酸异戊二烯基转移酶多肽(HPT2)的核酸分子。
SEQ ID NO:61表示推定的拟南芥尿黑酸异戊二烯基转移酶多肽(HPT2)。
SEQ ID NO:62表示推定的拟南芥尿黑酸异戊二烯基转移酶多肽(HPT2)。
SEQ ID NO:63表示来自拟南芥的EST。
SEQ ID NO:64表示来自蒺藜苜蓿(Medicago truncatula)的EST。
SEQ ID NO:65表示来自蒺藜苜蓿发育(developing)的茎的EST。
SEQ ID NO:66表示来自蒺藜苜蓿发育的茎的EST。
SEQ ID NO:67表示来自蒺藜苜蓿发育的茎的EST。
SEQ ID NO:68表示来自混合的马铃薯组织的EST。
SEQ ID NO:69表示来自拟南芥,哥伦比亚生态型的花芽的EST。
SEQ ID NO:70表示来自拟南芥的EST。
SEQ ID NO:71表示来自蒺藜苜蓿的EST。
SEQ ID NO:72表示来自大豆的EST。
SEQ ID NO:73-83和84-87表示引物序列。
SEQ ID NO:88表示编码来自蓝绿藻红海束毛蓝细菌的尿黑酸异戊二烯基转移酶多肽的核酸分子。
SEQ ID NO:89表示编码来自发光细菌橙色绿屈挠菌尿黑酸异戊二烯基转移酶多肽的核酸分子。
SEQ ID NO:90表示大豆尿黑酸异戊二烯基转移酶多肽(HPT2)。
SEQ ID NO:91表示编码来自大豆的尿黑酸异戊二烯基转移酶多肽(HPT2)的核酸分子。
SEQ ID NO:92-95表示来自SEQ ID NO:1-4、6-7、9-11、43-44、57-58和90的结构域。
注释:蓝细菌和发光细菌具有一个HPT。植物具有HPT1和HPT2。在大豆中,有两种HPT1变种,HPT1-1和HPT1-2,以及HPT2。
附图简介
附图1是生育酚生物合成路径的示意图。
附图2a-2c描述几种尿黑酸异戊二烯基转移酶多肽的序列比对(SEQ IDNO:1-8)。
附图3a-3c描述几种尿黑酸异戊二烯基转移酶多肽的序列比对(SEQ IDNO:1-7和9-11)。
附图4提供表达构建体pCGN10800的示意图。
附图5提供表达构建体pCGN10801的示意图。
附图6提供表达构建体pCGN10803的示意图
附图7提供表达构建体pCGN10822的示意图
附图8提供从含有pCGN10822的转基因拟南芥属的种子提取物获得的数据的柱形图,其提供从napin启动子的有义方向表达ATPT2序列(SEQ IDNO:33)。提供的是α、γ、δ-生育酚,以及22种被转化的系的总生育酚,以及非转化(野生型)的对照的曲线图。
附图9提供HPLC分析pCGN10803转基因的拟南芥属植物(品系1387到1624,增强35S-ATPT2,以反义方向)、未转化(wt)的对照和空载体转化的对照的种子提取物的柱形图。
附图10提供表达构建体pMON36581的示意图。
附图11提供表达构建体pMON69933的示意图。
附图12提供表达构建体pMON69924的示意图。
附图13提供表达构建体pMON69943的示意图。
附图14提供重组大豆品系中总生育酚水平的柱形图。
附图15描述pMON 69960。
附图16描述pMON 36525。
附图17描述pMON 69963。
附图18描述pMON 69965。
附图19描述pMON 10098。
附图20描述pMON 69964。
附图21描述pMON 69966。
附图22描述种子总生育酚分析的结果。
附图23描述种子总生育酚分析的结果。
附图24描述SEQ ID NO:1-4、6-7、9-11、57和90的比较。
附图25描述基序V到VIII,SEQ ID NO:46-49。
附图26描述来自多种示于SEQ ID NO:1-7、9-11、43、44、57-58和90的比对的序列树。
附图27描述pMON81028。
附图28描述pMON81023。
附图29描述pMON36596。
附图30描述pET30a(+)载体。
附图31描述pMON69993。
附图32描述pMON69992。
附图33a-33c描述几种尿黑酸异戊二烯基转移酶多肽SEQ ID NO:1-4、6-7、9-11、43-44、57-58和90的序列比较。
附图34描述基序IX-XII,SEQ ID NO:92-95。
附图35描述基序I-IV,SEQ ID NO:39-42。
附图36描述基序A-D。
发明详述
本发明提供许多制剂,例如与生育酚合成相关的核酸分子和多肽,并提供这些制剂的用途。
制剂
本发明的制剂优选具有“生物活性”,在结构特征方面,如核酸与其他核酸分子杂交的能力,或一种蛋白质被抗体结合的能力(或与其他分子竞争这种结合)。或者,这种特征是催化的,因而包括该制剂介导化学反应或应答的能力。
这种制剂优选是“基本上被纯化的”。在此所用的术语“基本上被纯化”是指一种分子从在天然环境条件下通常与其结合的所有其他分子中基本上分开。更加优选的是基本上被纯化的分子是存在于制备物中的主要种类。基本上被纯化的分子去除了超过约60%,优选约75%,更加优选约90%,和最优选约95%的存在于天然混合物中的其他分子(不包括溶剂)。术语“基本上被纯化的”不是包括存在其天然环境条件下的分子。
本发明的制剂也可以是重组的。如在此所用的术语重组是指任何制剂(如DNA,肽等),也就是说,但是间接地来自人为加工核酸分子的结果。
应当理解,本发明的制剂可以用便于检测制剂的试剂标记(如,荧光标记Prober et al.,Science,238:336-340(1987);Albarella et al.,EP144914;chemical labels,Sheldon et al.,US4,582,789;Albarella et al.,US4,563,417;modified bases,Miyoshi et al.,EP119448)。
核酸分子
本发明的制剂包括核酸分子。在本发明的优选方面,核酸分子包括编码尿黑酸异戊二烯基转移酶的核酸序列。在此所用的,尿黑酸异戊二烯基转移酶是能够特异性地催化由异戊二烯基DP(GGDP)和尿黑酸形成2-甲基-6-叶绿基苯喹啉(2-甲基-6-香叶基香叶基苯喹啉)的任何植物蛋白。
更加优选的尿黑酸异戊二烯基转移酶的例子是具有选自SEQ ID NO:5、9-11、43-44、55、58和90的氨基酸序列的多肽。在更加优选的实施方案中,尿黑酸异戊二烯基转移酶是由任何编码选自SEQ ID NO:5、9-11、43-44、55、58或90的氨基酸序列的核酸分子编码。
在本发明的另一个优选方面,本发明的核酸分子包括编码选自SEQ IDNO:5、9-11、43-44、55、58或90的多肽的核酸序列,及其互互补体(complement)和片段。
在本发明的另一个优选方面,本发明的核酸分子包括选自SEQ ID NO:31、34-36、59-60或91的核酸序列。
在另一个实施方案中,本发明包括编码具有示于任何附图2a-2c、3a-3c、24a-24b、25a-25b、33a-33c、34a-34b、35a-b和36中的保守氨基酸序列区域的多肽的核酸分子,以及这些核酸分子的互补体。在优选实施方案中,本发明包括编码包含选自SEQ ID NO:39-42、46-49或92-95的序列的多肽的核酸分子,以及这些核酸分子的互补体。本发明包括和提供所述核酸分子,其中多肽还包括一种以上选自SEQ ID NO:39-42、46-49或92-95的氨基酸序列。
在另一个优选实施方案中,本发明包括编码包括选自SEQ ID NO:39-42、46-49或92-95的两条或更多、三条或更多或四条序列的多肽的核酸分子,以及这些核酸分子的互互补体。在另一个实施方案中,本发明包括编码具有尿黑酸异戊二烯基转移酶活性和示于任何附图2a-2c、3a-3c、24a-24b、25a-25b、33a-33c、34a-34b、35a-b和36中的保守氨基酸区域的多肽的核酸分子,以及这些核酸分子的互补体。在一个优选实施方案中,本发明包括编码具有尿黑酸异戊二烯基转移酶活性和包含选自SEQ IDNO:39-42、46-49或92-95的序列的多肽的核酸分子,以及这些核酸分子的互补体。本发明包括和提供所述核酸分子,其中多肽还包括一种以上选自SEQ ID NO:39-42、46-49或92-95的氨基酸序列。
在另一个优选实施方案中,本发明包括编码具有尿黑酸异戊二烯基转移酶活性和包括选自SEQ ID NO:39-42、46-49或92-95的两条或更多、三条或更多或四条序列的多肽的核酸分子,以及这些核酸分子的互补体。在另一个实施方案中,本发明包括编码具有示于任何附图2a-2c、3a-3c、24a-24b、25a-25b、33a-33c、34a-34b、35a-b和36中的保守氨基酸序列区域的多肽的核酸分子,以及这些核酸分子的互补体,不包括衍生自点型念珠蓝细菌、鱼腥蓝细菌属、集胞蓝细菌属、玉米、大豆、拟南芥、稻、红海束毛蓝细菌、橙色绿屈挠菌、小麦、韭、菜籽、棉花或西红柿的核酸分子。在优选实施方案中,本发明包括编码包括选自SEQ ID NO:39-42、46-49和92-95的序列的多肽的核酸分子,以及这些核酸分子的互补体,不包括衍生自点型念珠蓝细菌、鱼腥蓝细菌属、集胞蓝细菌属、玉米、大豆、拟南芥、稻、红海束毛蓝细菌、橙色绿屈挠菌、小麦、韭、菜籽、棉花或西红柿的核酸分子。本发明包括和提供所述核酸分子,其中多肽还包括一种以上选自SEQ ID NO:39-42、46-49或92-95的氨基酸序列。
在另一个优选实施方案中,本发明包括选自SEQ ID NO:39-42、46-49和92-95的两条或更多、三条或更多或四条序列的多肽的核酸分子,不包括衍生自点型念珠蓝细菌、鱼腥蓝细菌属、集胞蓝细菌属、玉米、大豆、拟南芥、稻、红海束毛蓝细菌、橙色绿屈挠菌、小麦、韭、菜籽、棉花或西红柿的核酸分子。
在另一个实施方案中,本发明包括编码具有尿黑酸异戊二烯基转移酶活性和示于任何附图2a-2c、3a-3c、24a-24b、25a-25b、33a-33c、34a-34b、35a-b和36中的保守氨基酸区域的核酸分子,以及这些核酸分子的互补体,不包括衍生自点型念珠蓝细菌、鱼腥蓝细菌属、集胞蓝细菌属、玉米、大豆、拟南芥、稻、红海束毛蓝细菌、橙色绿屈挠菌、小麦、韭、菜籽、棉花、硫化叶菌、Aeropyum、高梁或西红柿的核酸分子。在优选的实施方案中,本发明包括编码具有尿黑酸异戊二烯基转移酶活性和包括选自SEQ IDNO:39-42、46-49和92-95的序列的多肽的核酸分子,不包括衍生自点型念珠蓝细菌、鱼腥蓝细菌属、集胞蓝细菌属、玉米、大豆、拟南芥、稻、红海束毛蓝细菌、橙色绿屈挠菌、小麦、韭、菜籽、棉花或西红柿的核酸分子。本发明包括和提供所述核酸分子,其中多肽还包括一种以上选自SEQID NO:39-42、46-49或92-95的氨基酸序列。
在另一个优选实施方案中,本发明包括编码具有尿黑酸异戊二烯基转移酶活性和包括选自SEQ ID NO:39-42、46-49或92-95的两条或更多、三条或更多或四条序列的多肽的核酸分子,不包括衍生自点型念珠蓝细菌、鱼腥蓝细菌属、集胞蓝细菌属、玉米、大豆、拟南芥、稻、红海束毛蓝细菌、橙色绿屈挠菌、小麦、韭、菜籽、棉花或西红柿的核酸分子。
在本发明的方法实施方案中,本发明的任何核酸序列或多肽序列或其片段,可以被用于检索相关序列。在优选实施方案中,选自SEQ ID NO:5、9-11、43-44、57-58或90的序列被用于检索相关序列。在优选实施方案中,选自SEQ ID NO:31、34-36、59-60、88-89或91的序列被用于检索相关序列。在另一个实施方案中,任何示于附图2a-2c、3a-3c、24a-24b、25a-25b、33a-33c、34a-34b、35a-b和36的基序或保守序列区域被用于检索相关序列。在一个优选实施方案中,选自SEQ ID NO:39-42或46-49的序列被用于检索相关序列。在一个实施方案中,SEQ ID NO:39-42、46-49或92-95中的一种或多种被用于检索相关序列。如在此所用“检索相关序列”是指确定两条序列之间相关程度的任何方法,包括但不限于比较序列同源性的检索:例如,PBLAST检索数据库来确定与单氨基酸序列的相关程度。其他检索可以采用基于模型的方法(profile based methods)进行,例如HMM(Hidden Markovmodel)META-MEME ( http://metameme.sdsc.edu/mhmm-links.html)、PSI-BLAST( http://www.ncbi.nlm.nih.gov/BLAST/)。本发明包括和提供通过附图2a-2c、3a-3c、24a-24b、25a-25b、33a-33c、34a-34b、35a-b和36一种或多种对比发现的尿黑酸异戊二烯基转移酶。
在此所用,当核酸分子序列来自特定生物体、种类、生态型等,则核酸分子被认为是“衍生自”该生物体、种类、生态型等。因此,“衍生自”包括通过如PCR获得的核酸分子的拷贝,以及具有与原始生物体、种类、生态型等相同的核酸序列的合成的核酸分子。同样地,当核酸分子被用于编码多肽,该多肽被认为是“衍生自”核酸分子,无论该多肽是从核酸分子酶催化生成或根据核酸分子的内在序列信息合成的。
本发明包括上述保守序列及其片段在转基因植物、其他生物体中的用途和其他用途,包括但不限于下面描述的。
在本发明的另一个优选方面,核酸分子包括编码质体运输肽的核苷酸序列,其被可操作地融合到编码本发明的蛋白质或其片段的核酸分子上。
在本发明的另一个优选实施方案中,本发明的核酸分子编码突变的生育酚尿黑酸异戊二烯基转移酶。如在此所用,突变的酶是任何含有不同于相同类型的野生型酶的相同位置上的氨基酸的氨基酸的酶。
应当理解,在本发明的核酸序列的另一个方面,核酸能够编码一种不同于任何这些蛋白质的蛋白质,其中一个或多个氨基酸被删除、取代或添加,而不改变功能。例如,应当理解,能够编码这种保守型氨基酸取代的密码子在本领域是已知的。
在本发明的一个方面,本发明的核酸被认为是被导入的核酸分子。如果核酸分子由于人工操作被插入到细胞或生物体中,无论多么间接,则该核酸分子被认为是“被导入的”。被导入的核酸分子的例子包括但不限于通过转化、转染、注射和发射(Projection)被导入到细胞中的核酸,以及通过接合、胞吞、吞噬等导入生物体的那些核酸。
本发明的核酸分子的亚型是片段核酸分子。片段核酸分子可以由本发明的核酸分子的重要部分或绝大部分组成,如特别公开的那些。或者,片段可以包括较小的寡核苷酸(具有从约15到约400的核苷酸残基和更加优选的,约15到约30个核苷酸残基,或约50到约100个核苷酸残基,或约100到约200个核苷酸残基,或约200到约400个核苷酸残基,或约275到约350个核苷酸残基)。
本发明的一种或多种核酸分子的片段可以是探针,特别是PCR探针。PCR探针是能够在另一个核酸的双链结构中起动聚合酶活性的核酸分子。确定PCR探针结构的各种方法和PCR技术存在于本领域。采用程序如Primer3(www-genome.wi.mit.edu/cgi-bin/primer/primer3.cgi)、STSPipeline(www-genome.wi.mit.edu/cgi-bin/www-STS_Pipeline)或GeneUp(Pesole etal.,BioTechniques,25:112-123(1998))的计算机产生的检索,如可以用于确定可能的PCR引物。
在某些条件下,本发明的核酸分子或其片段能够特异地杂交到其他核酸分子上。本发明的核酸分子包括那些特异地杂交到那些在此公开的核酸分子上,如编码SEQ ID NO:5、9-11、43-44、57-58和90任何之一的核酸,及其互补体。本发明的核酸分子包括那些特异地杂交到包括选自SEQ IDNO:31、34-36、59-60或91的之一的核酸分子上的核酸分子,及其互补体。
如在此所用,如果两个核酸分子能够形成反平行、双链核酸结构,那么这两个分子被认为能够特异地相互杂交。
核酸分子被认为是另一个核酸分子的“互补体”,如果它们具有完全互补性。在此所用,当分子之一的每个核苷酸与其他分子的核苷酸互补,核酸被认为具有“完全互补性”。如果两个分子能够相互杂交以足够的稳定性来使得至少在常规的“低严谨”条件下保持相互退火,这两个分子被认为具有“最低限度的互补性”。类似地,如果能够相互杂交,以足够的稳定性来使得至少在常规的“高严谨”条件下保持相互退火,分子被认为具有“互补性”。常规的严谨条件被描述在Sambrook et al.,Molecular Cloning,A LaboratoryManual,2nd Ed.,Cold Sprisag Harbor Press,Cold Spring Harbor,NY(1989),和Haymes et al.,Nucleic Acid Hybridization,A Practical Approach,IRL Press,Washington,DC(1985)。因此,脱离完全互补性是允许的,只要这种脱离不会完全妨碍分子形成双链结构的能力。因此,为了使核酸分子作为引物或探针,其序列仅需要足够互补性使得在所用的特定溶剂和盐浓度条件下能够形成稳定的双链结构。
促进DNA杂交的适当严谨条件为如6.0 X氯化钠/柠檬酸钠(SSC)约45℃,接着用20-25℃的2.0 X SSC洗脱,是本领域技术人员知晓的,可见于Current Protocols in Molecular Biology,John Wiley & Sons,NY(1989),6.3.1-6.3.6。例如,洗涤步骤中的盐浓度可以从低严谨的约2.0 X SSC 50℃到高严谨约0.2 X SSC 65℃进行选择。此外,洗涤步骤的温度可以从低严谨条件的室温下约22℃升高到高严谨条件的约65℃。温度和盐可以被改变,或者温度或盐浓度可以保持不变,而其他变量被改变。
在一个优选实施方案中,在适度严谨条件下,如约2.0 X SSC和约65℃,本发明的核酸将特异地杂交到在此描述的一种或多种核酸分子及其互补体上,如那些编码SEQ ID NO:5、9-11、43-44、57-58和90任何之一的核酸。
在特别优选的实施方案中,在高严谨条件下如约0.2 X SSC和约65℃,本发明的核酸将包括那些特异地杂交到一种或多种编码SEQ ID NO:5、9-11、43-44、57-58和90任何之一的核酸分子,及其互补体上。
在本发明的一个方面,本发明的核酸分子具有一种或多种编码SEQ IDNO:5、9-11、43-44、57-58和90的核酸序列,或其互补体。在本发明的另一个方面,本发明的核酸分子的一种或多种与编码SEQ ID NO:5、9-11、43-44、57-58和90的核酸序列的一种或多种,及其互补体和片段具有约100%和约90%序列同一性。在本发明的另一个方面,本发明的核酸分子的一种或多种与编码SEQ ID NO:5、9-11、43-44、57-58和90的核酸序列的一种或多种,及其互补体和片段具有约100%和约95%序列同一性。在本发明的更加优选方面,本发明的核酸分子的一种或多种与编码SEQ ID NO:5、9-11、43-44、57-58和90的核酸序列的一种或多种,及其互补体和片段具有约100%和约98%序列同一性。在本发明的更加优选方面,本发明的核酸分子的一种或多种与编码SEQ ID NO:5、9-11、43-44、57-58和90的核酸序列的一种或多种,及其互补体和片段具有约100%和约99%序列同一性。
在一个优选实施方案中,百分同一性计算采用BLASTN或BLASTP(默认值、参数、版本2.0.8,Altschul et al.,Nucleic Acids Res.,25:3389-3402(1997))进行。
本发明的核酸分子还编码同系物多肽。如在此所用,同系物多肽分子或其片段是第二种品种的相对应的蛋白质分子或其片段(如玉米核酮糖二磷酸羧化酶-加氧酶小亚基是拟南芥属核酮糖二磷酸羧化酶-加氧酶小亚基的同系物)。同系物还可以通过分子进化或DNA改组技术来生成,使得该分子至少保留起始多肽的一种功能或结构特征(参见,如US5,811,238)。
在另一个实施方案中,同系物选自紫苜蓿、拟南芥属(Arabidopsis)、大麦、芸苔(Brassica campestris)、欧洲油菜(Brassica napus)、甘蓝型油菜(oilseedrape)、嫩茎花椰菜、甘蓝(Cabbage)、菜籽(Canola)、柑桔(Citrus)、棉花、大蒜、燕麦、葱属(Allium)、亚麻(flax)、观赏性植物、花生、胡椒、马铃薯、油菜籽(rapeseed)、稻、黑麦、高梁、草莓、甘蔗、甜菜(Sugarbeet)、西红柿、小麦、白杨(Poplar)、松树、冷杉(fir)、桉树(eucalyptus)、苹果树(apple)、莴苣、豆科(lentils)、葡萄(grape)、香蕉、茶、草坪草、向日葵、大豆、玉米、菜豆属(phaseolus)、海甘蓝(crambe)、芥菜(mustard)、蓖麻子(castor bean)、芝麻(sesame)、棉籽(cottonseed)、亚麻子(linseed)、红花(safflower)和油棕榈(oil palm)。更加特别地,优选的同系物选自菜籽、玉米、芸苔、欧洲油菜(Brassica napus)、甘蓝型油菜(oilseed rape)、大豆、海甘蓝、芥菜、蓖麻子、花生、芝麻、棉籽、亚麻子、红花、油菜籽、红花、油棕榈、亚麻和向日葵。在更加优选的实施方案中,同系物选自菜籽、油菜籽、玉米、芸苔、欧洲油菜(Brassica napus)、甘蓝型油菜(oilseed rape)、大豆、向日葵、红花、油棕榈和花生。在特别优选的实施方案中,同系物是大豆。在一个特别优选的实施方案中,同系物是菜籽。在特别优选的实施方案中,同系物是甘蓝型油菜(oilseed rape)。
在一个优选的实施方案中,编码SEQ ID NO:5、9-11、43-44、57-58和90的核酸分子及其互互补体和其片段;或者优选编码SEQ ID NO:5、9-11、43-44、57-58和90的核酸分子及其互互补体被用于获得这种同系物。
在本发明的还有另一个方面,由于多肽可以具有一种或多种保守性氨基酸变化,从而编码多肽的核酸序列具有序列差异,本发明的核酸分子可以包括不同于编码多肽或其片段的序列。应当理解,能够编码这种保守性氨基酸取代的密码子在本领域是已知的。
本领域熟知天然序列中的一个或多个氨基酸可以用其他氨基酸取代,取代的氨基酸的电荷和极性与天然氨基酸的相似,即保守性氨基酸取代。天然多肽序列中氨基酸的保守取代可以从氨基酸所属类别的其他成员中选择。氨基酸可以被分成如下四组:(1)酸性氨基酸;(2)碱性氨基酸(3)中性极性氨基酸;和(4)中性非极性氨基酸。在这些不同组中的代表性氨基酸包括但不限于(1)酸性(负电荷)氨基酸如天冬氨酸和谷氨酸;(2)碱性(正电荷)氨基酸,如精氨酸、组氨酸和赖氨酸;(3)中性极性氨基酸如甘氨酸、丝氨酸、苏氨酸、半胱氨酸、胱氨酸、酪氨酸、天冬酰胺和谷氨酰胺;和(4)中性非极性(疏水性)氨基酸如丙氨酸、亮氨酸、异亮氨酸、缬氨酸、脯氨酸、苯丙氨酸、色氨酸和甲硫氨酸。
可以通过用来自这些组之一中的另一种氨基酸替代相同组的一种氨基酸,来进行天然多肽序列中的保守性氨基酸取代。在优选方面,本发明的蛋白质或其片段的生物学功能等价物可以具有十个或更少的保守性氨基酸变化,更优选地7个或更少的保守性氨基酸变化,和最优选为5个或更少的保守性氨基酸变化。因此,这些编码核苷酸序列将具有相应的碱基取代,使得其编码本发明的多肽的生物学功能性等价物形式。
应当理解,在蛋白质结构中一些氨基酸用其他氨基酸取代,而不使该结构的相互结合能力产生可检测的丢失,例如,抗体的抗原结合区或底物分子的结合位点。由于蛋白质的相互作用能力和性质决定蛋白质的生物学功能活性,在蛋白质序列中可以进行氨基酸序列取代,并且其潜在的DNA编码序列,但是还可以得到具有类似性质的蛋白质。因此,本发明包括对本发明的蛋白质肽序列或其片段,或者编码所述肽的相应DNA序列进行的各种改变,而没有可检测地丢失其生物学利用或活性。应当理解,能够编码这种氨基酸改变的密码子在本领域是已知的。
在进行这种改变时,考虑氨基酸的亲水指数。本领域通晓亲水氨基酸指数在赋予蛋白质相互作用的生物学功能中的重要性(Kyte and Doolittle,J.Mol.Biol.,157:105-132(1982))。一般认为,氨基酸的相关亲水特性导致得到的多肽的二级结构,二级结构随后限定蛋白质与其他分子的相互作用,如酶、底物、受体、DNA、抗体、抗原等。
根据疏水性和电荷特征,各种氨基酸具有确定的亲水指数,(Kyte andDoolittle,J.Mol.Biol.,157:105-132(1982));这些氨基酸为异亮氨酸(+4.5)、缬氨酸(+4.2)、亮氨酸(+3.8)、苯丙氨酸(+2.8)、半胱氨酸/胱氨酸(+2.5)、甲硫氨酸(+1.9)、丙氨酸(+1.8)、甘氨酸(-0.4)、苏氨酸(-0.7)、丝氨酸(-0.8)、色氨酸(-0.9)、酪氨酸(-1.3)、脯氨酸(-1.6)、组氨酸(-3.2)、谷氨酸(-3.5)、谷氨酰胺(-3.5)、天冬氨酸(-3.5)、天冬酰胺(-3.5)、赖氨酸(-3.9)和精氨酸(-4.5)。
在进行这种改变时,亲水指数在±2之内的氨基酸的取代是优选的,亲水指数在±1之内的那些是特别优选的,亲水指数在±0.5之内的是更加特别优选的。
还应当理解,在本领域中,根据亲水性可以有效地进行相似氨基酸的取代。US4,554,101提出蛋白质的最大局部平均亲水性受其邻近的氨基酸的亲水性的控制,与蛋白质的生物学特性相关。
如US4,554,101中提出,如下亲水性值被赋予氨基酸残基:精氨酸(+3.0)、赖氨酸(+3.0)、天冬氨酸(+3.0±1)、谷氨酸(+3.0±1)、丝氨酸(+0.3)、天冬酰胺(+0.2)、谷氨酰胺(+0.2)、甘氨酸(0)、苏氨酸(-0.4)、脯氨酸(-0.5±1)、丙氨酸(-0.5)、组氨酸(-0.5)、半胱氨酸(-1.0)、甲硫氨酸(-1.3)、,缬氨酸(-1.5)、亮氨酸(-1.8)、异亮氨酸(-1.8)、酪氨酸(-2.3)、苯丙氨酸(-2.5)和色氨酸(-3.4)。
在进行这种变化时,亲水性值在±2之内的氨基酸的取代是优选的,亲水性值在±1之内的氨基酸的取代是特别优选的,亲水性值在±0.5之内的氨基酸的取代是更加特别优选的。
在本发明的还有一个方面,由于一个或多个密码子用编码原先所编码的氨基酸的保守取代的密码子替代,一种或多种本发明的核酸分子在核酸序列上不同于那些在此提供了特定序列的核酸。
本发明的制剂包括核酸分子,其至少编码本发明的多肽的约连续10个氨基酸的区域,更加优选至少本发明的多肽的约连续的25、40、50、100或125个氨基酸区域。
在优选实施方案中,本发明的任何核酸分子可以被可操作地连接到启动子区域,启动子在植物细胞中起作用来促使mRNA分子生成,其中被连接到启动子的核酸分子与该启动子是异源。在此所用“异源”是指不是天然在一起的。
非植物基因的编码序列的性质使得它们与植物基因以及许多其他在植物中表达的异源基因区分开。例如,细菌的平均A+T含量比植物中的高。任何生物体的基因组(和基因)的A+T含量是生物体的特征,反映其进化史。虽然在任何一种生物体中,基因具有类似A+T含量,生物体之间的A+T含量变化极大。例如,一些芽孢杆菌属的种(Bacillus)具有A+T最丰富的基因组,而一些链霉菌属(Steptomyces)的种属于A+T最少的基因组(约30-35%A+T)。
由于遗传密码的简并性,任何氨基酸的密码子选择的有限个数,例如一些芽孢杆菌属种类的结构性编码序列的“过度”A+T的大部分存在于密码子的第三个位置上。也就是说,一些芽孢杆菌属种类的基因在许多密码子上以A或T作为第三个核苷酸。因此,A+T含量部分地决定了密码子选择的偏向。此外,显然基因在它们所进行进化的生物体中进化以得到最大功能。这表明存在于来自一种生物体的基因的特定核苷酸序列在生物体中除了编码特定长度的氨基酸外不具有其他作用,可能在其他生物体(如转录启动子或终止子、polyA添加位点、内含子剪接位点或特定mRNA降解信号)中作为基因控制元件。可能令人惊奇的是,这种错读信号不是异源基因表达的更加常见的特征,但是这可以部分地解释为许多生物体中相对一致的A+T含量(约50%)。该A+T含量加上遗传密码子的性质显然限制任何特定寡核苷酸序列发生的可能性。因此,相对于苏云金芽孢杆菌(B.thuringiensis)的基因,具有50%A+T含量的大肠杆菌基因含有任何富含A+T的特定片段的可能性更小。例如,在细菌基因和植物基因之间的情况也是如此。
任何本发明的核酸分子可以通过本领域已知方法改变,来使核酸分子中的密码子更适合于核酸分子所在的生物体。也就是说,本发明包括修饰在此公开的任何核酸分子来在宿主生物体中改进密码子选择。
优选地,包含任何保守性A+T碱基或G+C碱基的区域被破坏,由于这些区域自互补被预期极其可能形成发卡结构。因此,插入异源碱基对将降低自互补的二级结构形成的可能性,自互补的二级结构已知会在一些生物体中抑制转录/或翻译。在大多数情况下,可以通过采用不含超过5个连续A+T或G+C的序列来最小化不利影响。
蛋白质和肽分子
一类制剂包括一种或多种由本发明的核酸制剂编码的多肽分子。特定的优选类的蛋白质是具有选自SEQ ID NO:5、9-11、43-44、57-58或90的氨基酸序列及其片段。
在另一个实施方案中,本发明包括具有示于附图2a-2c、3a-3c、24a-24b、25a-25b、33a-33c、34a-34b、35a-35b和36任何之一中的保守氨基酸序列区的多肽。在一种实施方案中,本发明包括包含选自SEQ ID NO:39-42、46-49或92-95的序列的多肽。本发明包括和提供所述的基本上纯的多肽,其中一种以上氨基酸序列选自SEQ ID NO:39-42、46-49或92-95。在另一个更加优选的实施方案中,本发明包括包含选自SEQ ID NO:39-42、46-49或92-95的两条或更多、三条或更多、或四条序列的多肽
在另一个实施方案中,本发明包括具有尿黑酸异戊二烯基转移酶活性和示于附图2a-2c、3a-3c、25a-25c、33a-33c、34a-34b、35a-35b和36任何之一中的保守氨基酸序列的区域的多肽。在一个实施方案中,本发明包括具有尿黑酸异戊二烯基转移酶活性和选自SEQ ID NO:39-42、46-49或92-95的序列的多肽。本发明包括和提供所述基本上纯的多肽,其中一种以上的氨基酸序列选自SEQ ID NO:39-42、46-49或92-95。
在另一个优选的实施方案中,本发明包括具有尿黑酸异戊二烯基转移酶活性和包含选自SEQ ID NO:39-42、46-49或92-95的两条或更多、三条或更多、或四条序列的多肽。
在另一个实施方案中,本发明包括具有示于附图2a-2c、3a-3c、25a-25c、33a-33c、34a-34b、35a-35b和36任何之一中的保守氨基酸序列区域的多肽,不包括衍生自来源于点型念珠蓝细菌、鱼腥蓝细菌属、集胞蓝细菌属、玉米、大豆、拟南芥、稻、红海束毛蓝细菌、橙色绿屈挠菌、小麦、韭、菜籽、棉花、硫化叶菌、Aeropyum、高梁或西红柿的核酸分子的多肽。在一种优选实施方案中,本发明包括包含选自SEQ ID NO:39-42、46-49或92-95的序列的多肽,不包括衍生自来源于点型念珠蓝细菌、鱼腥蓝细菌属、集胞蓝细菌属、玉米、大豆、拟南芥、稻、红海束毛蓝细菌、橙色绿屈挠菌、小麦、韭、菜籽、棉花或西红柿的核酸分子的多肽。本发明包括和提供所述基本上纯的多肽,其中一种以上的氨基酸序列选自SEQ ID NO:39-42、46-49和92-95。
在另一个优选实施方案中,本发明包括包含选自SEQ ID NO:39-42、46-49或92-95的两条或多条、三条或多条,或四条序列的多肽,不包括衍生自来源于点型念珠蓝细菌、鱼腥蓝细菌属、集胞蓝细菌属、玉米、大豆、拟南芥、稻、红海束毛蓝细菌、橙色绿屈挠菌、小麦、韭、菜籽、棉花或西红柿的核酸分子的多肽。
在另一个实施方案中,本发明包括具有尿黑酸异戊二烯基转移酶活性和示于附图2a-2c、3a-3c、25a-25c、33a-33c、34a-34b、35a-35b和36任何之一中的保守氨基酸序列的区域的多肽,不包括衍生自来源于点型念珠蓝细菌、鱼腥蓝细菌属、集胞蓝细菌属、玉米、大豆、拟南芥、稻、红海束毛蓝细菌、橙色绿屈挠菌、小麦、韭、菜籽、棉花或西红柿的核酸分子的多肽。在一个优选实施方案中,本发明包括具有尿黑酸异戊二烯基转移酶活性和包含选自SEQ ID NO:39-42、46-49或92-95的序列的多肽,不包括衍生自来源于点型念珠蓝细菌、鱼腥蓝细菌属、集胞蓝细菌属、玉米、大豆、拟南芥、稻、红海束毛蓝细菌、橙色绿屈挠菌、小麦、韭、菜籽、棉花或西红柿的核酸分子的多肽。本发明包括和提供基本上纯的多肽,其中一条以上的氨基酸序列选自SEQ ID NO:39-42、46-49或92-95。
在另一个优选实施方案中,本发明包括具有尿黑酸异戊二烯基转移酶活性和包含选自SEQ ID NO:39-42、46-49或92-95的两条或多条、三条或多条,或四条序列的多肽,不包括衍生自来源于点型念珠蓝细菌、鱼腥蓝细菌属、集胞蓝细菌属、玉米、大豆、拟南芥、稻、红海束毛蓝细菌、橙色绿屈挠菌、小麦、韭、菜籽、棉花或西红柿的核酸分子的多肽。
多肽制剂可能具有C-末端或N-末端氨基酸序列延伸。一种类型的N-末端延伸在优选实施方案中被采用,是质体转运肽。当质体转运肽被采用时,可以被可操作地连接到N-末端序列上,从而使制剂多肽定位到质体上。在本发明的实施方案中,可以采用任何合适的质体导向(targeting)序列。如果合适,质体导向序列可以被用于替代天然的质体导向序列,例如,替代天然存在于生育酚尿黑酸异戊二烯基转移酶中的CTP。在另一个实施方案中,可以采用与在此描述的与任何尿黑酸异戊二烯基转移酶蛋白质或其片段异源的质体导向序列。在另一个实施方案中,可以采用任何合适的被修饰的质体导向序列。在另一个实施方案中,质体导向序列是CTP1序列(参见WO00/61771)。
在优选方面,本发明的蛋白质被靶向于质体,采用天然转运肽序列或异源的转运肽序列。当为对应于非高等植物如蓝绿藻的核酸序列的核酸序列时,这种核酸序列可以被改进来将蛋白质的编码序列结合到质体转运肽核酸序列上。
如在此所用,术语“蛋白质”、“肽分子”或“多肽”包括任何包含5个或更多氨基酸的分子。在本领域已知,蛋白质、肽或多肽分子可以被修饰,包括翻译后修饰,如但不限于二硫键形成、糖基化、磷酸化或寡聚化。因此,如在此所用,术语“蛋白质”、“肽分子”或“多肽”包括通过任何生物的或非生物的方法改进的任何蛋白质。术语“氨基酸”是指所用天然的L-氨基酸。这种定义是指包括正亮氨酸、正缬氨酸、鸟氨酸、高半胱氨酸和高丝氨酸。
制备一种或多种蛋白质或其片段、肽分子或多肽分子可以通过化学合成、或更加优选通过在合适的细菌或真核宿主中表达。用于表达的合适方法被描述在Sambrook et al.,In:Molecular Cloning,A Laboratory Manual,2ndEdition,Cold Spring Harbor Press,Cold Spring Harbor,NY(1989)或类似文章中。
 “蛋白质片段”是肽或多肽分子,其氨基酸序列包括该蛋白质的氨基酸序列的集合。包含一种或多种非来源于该蛋白质的附加肽区域的蛋白质或其片段是一种“融合”蛋白。这种分子被衍生来含有糖或其他成分(例如匙孔血蓝蛋白)。本发明的融合蛋白或肽分子优选通过重组方法制备。
另一种制剂包括蛋白质、肽分子或多肽分子,或其片段或融合,包含SEQ ID NO:5、9-11、43-44、57-58和90或其片段,其中保守的、非必要的或非相关的氨基酸残基已经被添加、取代或删除。用于设计蛋白质结构的改进的计算化方法在本领域是已知的(Dahiyat and Mayo,Science,278:82-87(1997))。
本发明的蛋白质、肽或多肽还可以是同系物蛋白质、肽或多肽。如在此所用,同系物蛋白质、肽或多肽或其片段是其在第二种种类中对应的蛋白质、肽或多肽或其片段。同系物还可以通过分子进化或DNA改组技术来生成,使得该分子保留至少一种原始的功能或结构特征(参见如US5,811,238)。
在另一个实施方案中,同系物是选自紫苜蓿、拟南芥属、大麦、嫩茎花椰菜(broccoli)、甘蓝、菜籽、柑桔、棉花、大蒜、燕麦、葱属、亚麻、观赏性植物、花生、胡椒(pepper)、马铃薯、油菜籽、稻、黑麦、高梁、草莓、甘蔗、甜菜、西红柿、小麦、白杨、松树、冷杉(fir)、桉树(eucalyptus)、苹果、莴苣、豆科、葡萄、香蕉、茶、草坪草、向日葵、大豆、玉米和菜豆属。更加特别地,优选的同系物选自菜籽、油菜籽、玉米、芸苔、欧洲油菜(Brassica napus)、甘蓝型油菜(oilseed rape)、大豆、海甘蓝、芥菜(mustard)、蓖麻子、花生、芝麻、棉籽、亚麻子、红花、油棕榈、亚麻和向日葵。在甚至更加优选的实施方案中,同系物选自菜籽、油菜籽、玉米、芸苔、Brassicanapus、甘蓝型油菜(oilseed rape)、大豆、向日葵、红花、油棕榈和花生。在优选实施方案中,同系物是大豆。在优选实施方案中,同系物是菜籽。在优选实施方案中,同系物是甘蓝型油菜(oilseed rape)。
在优选实施方案中,本发明的核酸分子或其互补体和片段可以被用于获得这种同系物。
本发明的制剂包括蛋白质和其片段,其包括本发明的蛋白质的至少约连续的10个氨基酸区域,优选包括至少约连续20个氨基酸区域,甚至优选包括至少约连续25、35、50、75或100氨基酸区域。在另一个实施方案中,本发明的蛋白质包括在约10个和约25个连续氨基酸之间的区域、更加优选地在约20个和约50个连续氨基酸之间的区域和甚至更加优选在约40个和约80个连续氨基酸之间的区域。
植物构建体和植物转化体
一种或多种本发明的核酸分子可被用于植物转化或转染。外源遗传物质被转化到植物细胞中,植物细胞再生到完整的、具有繁殖能力或不育的植物中。外源遗传物质是能够被插入到任何生物体中的任何遗传物质,无论是天然的或其他任何来源的。
在本发明的优选方面,外源遗传物质包含本发明的核酸序列,更优选地是编码尿黑酸异戊二烯基转移酶的核酸。在本发明的另一个优选方面,本发明的外源遗传物质包含编码选自SEQ ID NO:5、9-11、43-44、57-58或90的氨基酸序列或其互补体和片段的核酸序列。在本发明的另一个方面,外源遗传物质包含编码选自SEQ ID NO:5、9-11、43-44、57-58或90氨基酸序列的核酸序列,或选自SEQ ID NO:5、9-11、43-44、57-58或90的片段。
在本发明的实施方案中,编码尿黑酸异戊二烯基转移酶或其片段的外源遗传物质被插入到具有一种或多种其他额外基因的植物中。在一个实施方案中,优选的基因组合包括本发明的核酸分子与一种或多种如下基因:tyrA(如WO02/089561和Xia et al.,J.Gen.Microbiol.,138:1309-1316(1992))、生育酚环化酶(如WO01/79472)、预苯酸脱氢酶、dxs(如Lois et al.,Proc.Natl.Acad.Sci.(U.S.A.),95(5):2105-2110(1998))、dxr(如US2002/0108814A和Takahashi et al.,Proc.Natl.Acad.Sci.(U.S.A.),95(17),9879-9884(1998))、GGPPS(如Bartley and Scolnik,Plant Physiol.,104:1469-1470(1994))、HPPD(如Norris et al.,Plant Physiol.,117:1317-1323(1998))、GMT(如US10/219,810,2002年8月16日申请)、tMT2(如US10/279,029,2002年10月24日申请)、AANTI(如WO02/090506)、IDI(E.C.:5.3.3.2;Blanc et al.,In:PlantGene Register,PRG96-036;和Sato et al.,DNA Res.,4:215-230(1997)),GGH(Graβes et al.,Planta.213-620(2001)),或尿黑酸双加氧酶的植物定向进化同源基因(ortholog)和反义构建体(Kridl et al.,Seed Sci.Res.,1:209:219(1991);Keegstra,Cell,56(2):247-53(1989);Nawrath,etal.,Proc.Natl.Acad.Sci.(U.S.A.),91:12760-12764(1994);Cyanobase,www.kazusa.orjp/cyanobase;Smith et al,Plant J.,11:83-92(1997);WO00/32757;ExPASy Molecular Biology Server,http://us.expasy.org/enzyme;MT1WO00/10380;gcpE,WO02/12478;Saint Guily et al.,PlantPhysiol.,100(2):1069-1071(1992);Sato et al.,J.DNA Res.,7(1):31-63(2000))。在这种组合中,在一些农作物植物,如菜籽,优选启动子是napin启动子,优选的质体导向序列是CTP1序列。优选基因产物被靶向到质体上。
在优选组合中,编码尿黑酸异戊二烯基转移酶多肽的核酸分子和编码任何如下酶的核酸分子:tyrA、预苯酸脱氢酶、生育酚环化酶、dxs、dxr、GGPPS、HPPD、tMT2、MT1、GCPE、AANT1、IDI、GGH、GMT或尿黑酸双加氧酶的植物定向进化同源基因和反义构建体被导入到植物中。
对于上述任何组合,编码尿黑酸异戊二烯基转移酶多肽的核酸分子编码包含选自SEQ ID NO:5、9-11、43-44、57-58或90的序列的多肽。在另一个优选实施方案中,编码尿黑酸异戊二烯基转移酶多肽的核酸分子编码SEQ ID NO:39-42、46-49和92-95的一种或多种。在优选实施方案中,尿黑酸异戊二烯基转移酶多肽不具有来自衍生自点型念珠蓝细菌、鱼腥蓝细菌属、集胞蓝细菌属、玉米、大豆、拟南芥、稻、小麦、韭、菜籽、棉花或马铃薯的核酸的氨基酸序列。
这种遗传物质被转移到单子叶植物或双子叶植物中,包括但不限于菜籽、谷物(corn)、大豆、拟南芥型菜豆(Arabidopsis phaseolus)、花生、紫苜蓿、小麦、稻、燕麦、高梁、油菜籽、黑麦、tritordeum、黍类、羊茅(fescue)、多年生黑麦草(ryegrass)、甘蔗、酸果(cranberry)、番木瓜(papaya)、香蕉、红花、油棕榈、亚麻、香瓜(muskmelon)、苹果、黄瓜、石斛(dendrobium)、剑兰(gladiolus)、菊花(chrysanthemum)、百合(lilialea)、棉花、桉树、向日葵、芸苔、欧洲油菜(Brassica napus)、甘蓝型油菜(oilseed rape)、草坪草、sugarbeet、咖啡树(coffee)和薯蓣属(dioscorea)(Christou,In:Particle Bomzbardment forGenetic Engineering of Plants,Biotechnology Intelligence Unit.AcademicPress,San Diego,CA(1996)),菜籽、玉米、芸苔、欧洲油菜(Brassica napus)、甘蓝型油菜(oilseed rape)、油菜籽、大豆、海甘蓝、芥菜、蓖麻子、花生、芝麻、棉籽、亚麻子、红花、油棕榈、亚麻和向日葵是优选的。canola,油菜籽,棉花,玉米(corn),芸苔(Brassica campestris),欧洲油菜,甘蓝型油菜(oilseed rape),大豆,向日葵,红花,油棕榈,花生是优选的。在更加优选实施方案中,遗传物质被转移到甘蓝型油菜(oilseed rape)中。在另一个特别优选实施方案中,遗传物质被转移到大豆中。
编码蛋白质的核酸分子的转化导致多肽在被转化的细胞或转基因植物中表达或过表达。由本发明的核酸分子编码的一种或多种蛋白质或其片段在被转化的细胞或被转化植物中被过表达。这种表达或过表达可能是外源遗传物质的瞬时或稳定转移的结果。
在优选实施方案中,本发明的多肽在植物中表达或过表达在该植物中产生相对高于具有相似遗传背景的未转化植物的生育酚水平。
在优选实施方案中,本发明的多肽在植物中表达或过表达在该植物中产生相对高于具有相似遗传背景的未转化植物的α-生育酚水平。
在优选实施方案中,本发明的多肽在植物中表达或过表达在该植物中产生相对高于具有相似遗传背景的未转化植物的γ-生育酚水平。
在优选实施方案中,本发明的多肽在植物中表达或过表达在该植物中产生相对高于具有相似遗传背景的未转化植物的δ-生育酚水平。
在优选实施方案中,本发明的多肽在植物中表达或过表达在该植物中产生相对高于具有相似遗传背景的未转化植物的β-生育酚水平。
在优选实施方案中,本发明的多肽在植物中表达或过表达在该植物中产生相对高于具有相似遗传背景的未转化植物的生育三烯酸(tocotrienols)水平。
在优选实施方案中,本发明的多肽在植物中表达或过表达在该植物中产生相对高于具有相似遗传背景的未转化植物的α-生育三烯酸水平。
在优选实施方案中,本发明的多肽在植物中表达或过表达在该植物中产生相对高于具有相似遗传背景的未转化植物的γ-生育三烯酸(tocotrienols)水平。
在优选实施方案中,本发明的多肽在植物中表达或过表达在该植物中产生相对高于具有相似遗传背景的未转化植物的δ-生育三烯酸水平。
在优选实施方案中,本发明的多肽在植物中表达或过表达在该植物中产生相对高于具有相似遗传背景的未转化植物的β-生育三烯酸水平。
在优选实施方案中,本发明的多肽在植物中表达或过表达在该植物中产生相对高于具有相似遗传背景的未转化植物的质体醌醇(plastoquinols)水平。
在任何在此描述的实施方案中,γ-生育酚、α-生育酚或两者的升高导致β-生育酚、δ-生育酚或两者的相对比例下降。类似地,γ-三烯生育酚(tocotrienol)、α-三烯生育酚或两者的升高导致β-三烯生育酚、δ-三烯生育酚或两者的相对比例下降。
在另一个实施方案中,本发明的多肽在植物中表达和过度表达,在该植物或该植物的组织中产生相对高于具有相似遗传背景的未转化植物或植物组织的尿黑酸异戊二烯基转移酶蛋白或其片段水平。
在一些实施方案中,生育酚生物合成路径的一种或多种产物的水平上升超过约10%、或更加优选超过约25%、35%、50%、75%、80%、90%、100%、150%、200%、1,000%、2,000%或2,500%,包括任何一种或多种生育酚,α-生育酚、γ-生育酚、δ-生育酚、β-生育酚、三烯生育酚、α-三烯生育酚、γ-三烯生育酚、δ-三烯生育酚、β-三烯生育酚(tocotrienols)。产物水平上升是在整个生物体中如植物中或限制在生物体的一个或多个特定器官或组织中。例如,产物水平可能在植物的一个或多个组织和器官中,包括但不限于:根、块茎、茎、叶、柄、果实、浆果、坚果(nut)、树皮、荚、种子和花。优选器官是种子。
在一些实施方案中,一种或多种生育酚生物合成路径的产物,包括任何一种或多种生育酚,α-生育酚、γ-生育酚、δ-生育酚、β-生育酚、三烯生育酚、α-三烯生育酚、γ-三烯生育酚、δ-三烯生育酚、β-三烯生育酚升高,使得它们构成生物体或组织总生育酚含量的约10%、20%、25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%或99%以上。产物水平上升是在整个生物体中如植物中或限制在生物体的一个或多个特定器官或组织中。例如,产物水平可能在植物的一个或多个组织和器官中,包括但不限于:根、块茎、茎、叶、柄、果实、浆果、坚果、树皮、荚、种子和花。优选器官是种子。
在优选实施方案中,参与生育酚、三烯生育酚或质体醌醇生物合成的酶在种子中表达将会导致γ-生育酚水平升高,这是由于这些组织中缺乏高水平的GMT活性。在另一个优选实施方案中,参与生育酚、三烯生育酚或质体醌醇合成的酶在光合组织中表达将会导致α-生育酚升高,这是由于这些组织中的GMT活性水平相对高于种子组织中的同一活性。
在另一个优选实施方案中,参与生育酚、三烯生育酚或质体醌醇生物合成的酶在种子中表达将会导致植物中的总生育酚、三烯生育酚或质体醌醇水平升高。
在一些实施方案中,生育酚水平或种类如α-生育酚被改变。在一些实施方案中,三烯生育酚水平被改变。这种改变可以与具有类似背景的植物比较。
在另一方实施方案中,可以通过导入编码尿黑酸异戊二烯基转移酶的基因来提高天然生产高水平α-生育酚水平、α-三烯生育酚水平或两者的植物(如向日葵)中的α-生育酚水平、α-三烯生育酚水平或两者。
在一个优选方面,类似的遗传背景是被比较的生物体共有约50%或更高核遗传物质的背景。在更加优选的方面,类似的遗传背景是被比较的生物体共有约75%或更高,甚至更加优选约90%或更高的核遗传物质的背景。在另一个甚至更加优选方面,类似遗传背景是其中被比较的生物体是植物的背景,除了采用植物转化技术最先导入的任何遗传物质,该植物是等基因的。
在另一个优选实施方案中,在转化的植物中表达或过表达本发明的多肽可能产生对各种应激的耐受,如对氧气或臭氧的氧化应激耐受、UV耐受、耐寒(cold)、耐受真菌/微生物病原体。
如在此所用,在优选方面,对应激的耐受或抵抗通过植物的能力来确定,当通过应激如寒冷攻击来制备产量高而不具有这种对应激耐受或抵抗的植物的植物。在本发明的特别优选方面,对应激(stress)的耐受或抗性的测定是通过相对于与该耐受或抗性的植物(除了该植物降低表达的之外),具有类似遗传背景的植物表达或过度表达本发明的蛋白质或其片段而进行的。
外源遗传物质被转移到宿主细胞中,通过使用设计用于该目的的DNA载体或构建体。这种载体的设计一般属于本领域的技术(参见PlantMolecular Biology:A Laboratory Manual,Clark(ed.),Springer,NY(1997))。
构建体或载体可能包括表达所选多肽的植物启动子。在优选实施方案中,在此描述的任何核酸分子可以被可操作地连接到启动子区域,启动子在植物细胞中导致mRNA分子生成。例如,可以采用任何在植物细胞中导致mRNA分子生成的启动子,如在此描述的那些启动子,但不限于此。在优选实施方案中,启动子是植物启动子。
许多在植物细胞中具有活性的启动子在文献中描述。这些启动子包括胭脂碱合成酶(NOS)启动子(Ebert et al.,Proc.Natl.Acad.Sci.(U.S.A.),84:5745-5749(1987))、章鱼碱合成酶(OCS)启动子(其携带在肿瘤诱导的农杆菌(Agrobacteriam tamefaciens)质粒上)、花叶病毒启动子如花椰菜花叶病毒(CaMV)19S启动子(Lawton et al.,PlantMol.Biol.,9:315-324(1987))和CaMV35S启动子(Odell et al.,Nature,313:810-812(1985))、玄参花叶病毒35S-启动子、核酮糖-1,5-二磷酸羧酸酶小亚基的光诱导启动子(ssRUBISCO)、Adh启动子(Walker et al.,Proc.Natl.Acad.Sci.(U.S.A.),84:6624-6628(1987))、蔗糖合成酶启动子(Yang etal.,Proc.Natl.Acad.Sci.(U.S.A.),87:4144-4148(1990))、R基因复合启动子(Chandler et al.,The Plant Cell,1:1175-1183(1989))和叶绿素a/b结合蛋白基因启动子等。这些启动子已经被用于建立已经在植物中被表达的DNA构建体;参见如,WO84/02913。CaMV 35S启动子优选用于植物中。已知的或被发现引起DNA在植物细胞中转录的启动子可被用于本发明。
为了在植物的起始(source)组织,如叶、种子、根或茎中表达,优选所用的启动子在这些特定组织中具有相对高的表达。本发明的蛋白质的组织特异性表达是特别优选的实施方案。为了该目的,可以从大量组织或细胞特异性或增强表达基因的启动子中选择。文献中报道的这种启动子的例子包括豌豆的叶绿体谷氨酸合成酶GS2启动子(Edwards et al.,Proc.Natl.Acad.Sci.(U.S.A.),87:3459-3463(1990))、小麦的叶绿体果糖-1,6-二磷酸酶(FBPase)启动子(Lloyd et al.,Mol.Gen.Genet.,225:209-216(1991))、马铃薯核光合ST-LS1启动子(Stockhaus et al.,EMBO J.,8:2445-2451(1989))、拟南芥的丝氨酸/苏氨酸激酶(PAL)启动子和葡糖淀粉酶(CHS)启动子。此外,被报道在光合活性组织中具有活性的是美洲落叶松(Larix laricina的核酮糖-1,5-二磷酸羧酸酶(RbcS)启动子、松树cab基因cab6的启动子(Yamamoto et al.,PlantCell Physio.,35:773-778(1994))、小麦Cab-l基因启动子(Fejes et al.,PlantMol.Biol.,15:921-932(1990))、菠菜的CAB-1基因启动子(Lubberstedt et al.,Plant Physiol.,104:997-1006(1994))稻的cablR基因启动子(Luan et al.,PlantCell.,4:971-981(1992))、玉米的丙酮酸,正磷酸二激酶(PPDK)启动子(Matsuoka etal.,Proc.Natl.Acad.Sci.(U.S.A.),90:9586-9590(1993))、烟草Lhcb1*2基因启动子(Cerdan et al.,Plant Mol.Biol.,33:245-255(1997))、拟南芥SUC2蔗糖-H+同向转运子启动子(Truernit et al.,Planta.,196:564-570(1995))和菠菜类囊体膜蛋白质启动子(psaD、psaF、psaE、PC、FNR、atpC、atpD、cab、rbcS)。叶绿素a/b结合蛋白的其他启动子也可以被用于本发明,例如白色芥菜的LhcB基因和PsbP基因启动子(Sinapis alba;Kretsch etal.,Plant Mol.Biol.,28:219-229(1995))。
为了在植物的sink组织中表达,例如马铃薯植物的块茎、西红柿果实,或者玉米、稻和大麦种子,优选在本发明中采用的启动子在这些特异性组织中具有相对高的表达。具有块茎特异性或块茎增强表达的基因的大量启动子是已知的,包括I类patatin启动子(Bevan et al.,EMBO J.,8:1899-1906(1986);Jefferson et al.,Plant Mol.Biol.,14:995-1006(1990))、马铃薯块茎ADPGPP基因启动子,大小亚基,蔗糖合成酶启动子(Salanoubat and Belliard,Gene,60:47-56(1987),Salanoubat and Belliard,Gene,84:181-185(1989)、主要块茎蛋白包括22kd的蛋白质复合体和蛋白酶抑制剂的启动子(Hannapel,Plant Physiol.,101:703-704(1993))、颗粒结合淀粉合成酶基因启动子(GBSS)(Visser et al.,Plant Mol.Biol.,17:691-699(1991)和其他的I和II类patatin启动子(Koster-Topfer et al.,Mol.Gen.Genet.,219:390-396(1989);Mignery etal.,Gene.,62:27-44(1988)。
其他启动子可以被用于在特定组织中表达多肽,如种子或果实。事实上,在优选实施方案中,所用的启动子是种子特异性启动子。这种启动子的例子包括来自这种基因的5’调控区如napin(Kridl et al.,Seed Sci.Res.,1:209:219(1991))、菜豆蛋白(phasedin)(Bustos et al.,Plant Cell,1(9):839-853(1989))、大豆胰岛素抑制剂(Riggs et al.,Plant Cell,1(6):609-621(1989))、ACP(Baerson et al.,Plant Mol.Biol.,22(2):255-267(1993))、硬酯酰-ACP脱氢酶(Slocombe et al.,Plant Physiol.,104(4):167-176(1994)、大豆β-conglycinin的α’亚基(soy7s,(Chen et al,Pro.Natl.Acad.Sci.,83:8560-8564(1986))),和oleosin(参见,如Hong et al.,Plant Mol.Biol.,34(3):549-555(1997))。其他例子包括β-conglycinin启动子(Chen et al.,Dev.Genet.,10:112-122(1989))。还包括玉米蛋白,其是一组存在于玉米胚乳中的存储蛋白。玉米蛋白基因的基因组克隆已经被分离(Pedersrn et al,Cell,29:1015-1026(1982),和Russell etal.,Transgenic Res.,6(2):157-168)和来自这些克隆的启动子也被使用,包括15kD、16kD、19kD、22kD和27kD和基因。其他启动子如已知在玉米中起作用,包括如下基因的启动子:wary、Brittle、Shrunken 2、分支酶I和II、淀粉合成酶、脱支酶、oleosin、谷蛋白和蔗糖合成酶。用于玉米胚乳表达的特别优选启动子是稻谷蛋白的启动子,更特别是Osgt-1启动子(Zheng etal.,Mol.Cell Biol.,13:5829-5842(1993))。适合于在小麦中表达的启动子的例子包括ADP葡萄糖焦合成酶(pyrosynthase)(ADPGPP)亚基,颗粒结合和其他淀粉合成酶、分支和脱支酶、胚发生丰富蛋白、麦醇溶蛋白和麦谷蛋白的启动子。稻中的这种启动子的例子包括ADPGPP亚基、颗粒结合和其他淀粉合成酶、分支酶、脱支酶、蔗糖合成酶和谷蛋白的那些启动子。特别优选启动子是稻谷蛋白、Osgt-1的启动子。大麦的这种启动子的例子包括ADPGPP亚基、颗粒结合和其他淀粉合成酶、分支酶、脱支酶、蔗糖合成酶、大麦醇溶蛋白、胚球蛋白和糊粉特异性蛋白的启动子。在种子中表达的优选启动子是napin启动子。其他用于表达的优选启动子是Arcelin 5启动子。
还可以采用根特异性启动子。这种启动子的例子是酸性几丁质酶基因启动子(Samac et al.,Plant Mol.Biol.,25:587-596(1994))。还可以通过采用已经被确定的CaMV35S启动子的根特异性亚结构域实现在根组织中表达(Lamet al.,Proc.Natl.Acad.Sci.(U.S.A.),86:7890-7894(1989))。其他根特异性启动子包括由Conkling et al.,Plant Physiol.,93:1203-1211(1990)报道的启动子。
其他优选启动子包括7Sα′(Beachy et al.,EMBO J.,4:3047(1985);Schuleret al.,Nucleic Acid Res.,10(24):8225-8244(1982));USP88和增强的USP88(美国专利申请US60/377,236,2002年5月3日申请,在此引入作为参考);和7Sα,(美国专利申请US10/235,618)。
其他可以被使用的启动子被描述在,如美国专利US5,378,619;US5,391,725;US5,428,147;US5,447,858;US5,608,144;US5,608,144;US5,614,399;US5,633,441;US5,633,435;和US4,633,436中。此外,可以使用组织特异性增强子(Fromm et al.,The Plant Cell,1:977-984(1989))。
具有目标编码区的构建体或载体还包括核酸序列,其完全地或部分地起作用来终止该区域的转录。大量这种序列被分离,包括Tr7 3′序列和NOS3′序列(Ingelbrecht et al.,The Plant Cell,1:671-680(1989);Bevan et al.,NucleicAcids Res.,11:369-385(1983))。在本发明植物表达构建体中还提供调控转录终止区。转录终止区可以通过编码目标基因的DNA序列提供或者来自于不同基因来源的便利的转录终止区,例如,转录终止区天然地与转录起始区相关。本领域技术人员能够意识到在本发明的构建体中可以采用在植物细胞中终止转录的任何便利转录终止区。
载体或构建体还包括调控元件。这种元件的例子包括Adh内含子1(Callis et al.,Genes and Develop.,1:1183-1200(1987))、蔗糖合成酶内含子(Vasil et al.,Plant Physiol.,91:1575-1579(1989))和TMV ω元件(Gallie etal.,The Plant Cell,1:301-311(1989))。适当时可以包括这些或其他的调控元件。
载体或构建体还包括可选择的标记。可选择标记还可以被用于选择含有外源遗传物质的植物或植物细胞。这些标记的例子包括但不限于:neo基因(Potrykus et al.,Mol.Gen.Genet.,199:183-188(1985)),其编码卡那霉素抗性,可以被选择来使用卡那霉素、RptII、G418、hpt等;bar基因编码bialaphos抗性;突变的EPSP合成酶基因(Hinchee et al.,Bio/Technology,6:915-922(1988);Reynaerts et al.,Selectable and Screenable Markers.In:Gelvinand Schilperoort,Plant Molecular Biology Manual,Kluwer,Dordrecht(1988);Reynaerts et al.,Selectable and Screenable Markers.In:Gelvin and Schilperoort,Plant Molecular Biology Manual,Kluwer,Dordrecht(1988)),aadA(Jones et al.,Mol.Gen.Genet.(1987)),其编码草甘膦抗性;腈水解酶基因赋予bromoxynil抗性(Stalker et al.,J.Biol.Chem.,263:6310-6314(1988));突变的乙酰乳酸(acetolactate)合成酶基因(ALS)赋予imidazolinone或磺脲抗性(EP0154204(1985年9月11日))、ALS(D′Halluin et al.,Bio/Technology,10:309-314(1992)),和氨甲蝶呤抗性 DHFR基因(Thillet etal.,J.Biol.Chem.,263:12500-12508(1988))。
载体或构建体还可以包括转运肽。还可以采用合适的叶绿体转运肽的组合(EP 0218571)。转录增强子还可以被包含作为载体DNA的一部分。DNA构建体可以含有一种或多种5′非翻译前导序列,其起增强从生成的mRNA转录物表达基因产物的作用。这种序列可以来自于被选择来表达基因的启动子,可以被特异性地改进来增强mRNA的翻译。这种区域还可以从病毒RNA、合适的真核基因或合成的基因序列中获得。对于优化转基因的表达的综述参见Koziel et al.,Plant Mol.Biol.,32:393-405(1996)。优选的转运肽是CTP1。
载体或构建体还可以包括可筛选的标记。可筛选的标记可被用于监控表达。示例性的筛选标记包括:β-葡糖苷酶或uidA基因(GUS)是已知的,它们编码各种已知化学显色底物的酶(Jefferson,PlantMol.Biol,Rep.,5:387-405(1987);Jefferson et al.,EMBO J.,6:3901-3907(1987));R-座位基因,其编码在植物中调控花色素苷色素生成的产物(红色)(Dellaporta et al.,Stadler syntposium,11:263-282(1988));β-内酰胺酶基因(Sutcliffe et al.,Proc.Natl.Acad.Sci.(U.S.A.),75:3737-3741(1978))、编码各种显色底物的酶的基因是已知的(如PADAC,发色头孢菌素);荧光素酶基因(Owet al.,Science,234:856-859(1986));xylE基因(Zukowsky etal.,Proc.Natl.Acad.Sci.(U.S.A.),80:1101-1105(1983)),其编码转化显色儿茶酚的儿茶酚双加氧酶;α-淀粉酶基因(Iatu et al.,Bio/Technol.,8:241-242(1990));酪氨酸酶基因(Katz et al.,J.Gen.Microbiol.,129:2703-2714(1983)),其编码能够氧化酪氨酸为DOPA和多巴醌(dopaquinone)的酶,多巴醌随后浓缩为黑色素;α-半乳糖苷酶将会转化为显色的α-半乳糖底物。
术语“可选择或可筛选的标记基因”中所包括的还有编码可选择标记的基因,可选择标记的分泌可以被检测为确定或筛选转化细胞的方法。例子包括编码可分泌的抗原的标记,抗原可以通过抗体作用被确定,或甚至可分泌的酶,其可以通过酶促测定。可分泌的蛋白质分为多种类型,包括可检测的小的扩散蛋白(如通过ELISA检测)、在细胞外溶液中可检测的小的活性酶(如α-淀粉酶、β-内酰胺酶、膦丝菌素转移酶),或被插入或捕获在细胞壁上的蛋白质(例如包括前导序列的蛋白质,如存在于延伸表达单位或烟草PR-S中的)。其他可能的可选择和/或可筛选的标记基因对于本领域技术人员来说是显然的。
有许多方法可以将转化的核酸分子导入植物细胞中。一般认为合适方法实际上包括将核酸分子导入细胞的任何方法,如通过农杆菌感染或直接传递核酸分子,如通过PEG-介导的转化,通过电穿孔或通过加速DNA包被的粒子等(Potrykus,Ann.Rev.Plant Physiol.Plant Mol.Biol.,42:205-225(1991);Vasil,Plant Mol.Biol.,25:925-937(1994))。例如,电穿孔被用于转化玉米原生质体(Fromm et al.,Nature,312:791-793(1986))。
适合于将转化DNA导入宿主植物细胞的其他载体系统包括但不限于双元人工染色体(BIBAC)载体(Hamilton et al.,Gene,200:107-116(1997));和用RNA病毒载体转染(Della-Cioppa et al.,Ann.N.Y.Acad.Sci.(1996),792(Engineering Plants for Commercial Products and Applications,57-61)。其他载体系统还包括植物可选择YAC载体,如那些在Mullen et al.,MolecularBreeding,4:449-457(1988)中描述的。
将DNA导入细胞的技术在本领域是技术人员熟知的。已经描述了四种将基因传递到细胞中的常规方法:(1)化学方法(Graham and van der Eb,Virology,54:536-539(1973));(2)物理方法例如微注射(Capecchi,Cell,22:479-488(1980))、电穿孔(Wong and Neumann,Biochem.Biophys.Res.Commun.,107:584-587(1982);Fromm et al.,Proc.Natl.Acad.Sci.(U.S.A.),82:5824-5828(1985);US5,384,253);基因枪(Johnston and Tang,Methods Cell Biol.,43:353-365(1994));和真空渗入(Bechtold et al.,C.R.Acad.Sci.Paris,Life Sci.,316:1194-1199(1993));(3)病毒载体(Clapp,Clin.Perinatol.,20:155-168(1993);Lu et al.,J.Exp.Med.,178:2089-2096(1993);Eglitis and Anderson,Biotechniques,6:608-614(1988));和(4)受体介导机制(Curiel et al.,Hum.Gen.Ther.,3:147-154(1992),Wagner etal.,Proc.Natl.Acad.Sci.(U.S.A.),89:6099-6103(1992))。
可以使用的加速方法包括,如微粒轰击等。一种将转化核酸分子导入植物细胞的方法是微粒轰击。这种方法在Yang and Christou(eds.),ParticleBombardment Technology for Gene Transfer,Oxford Press,Oxford,England(1994)中评述。非生物微粒(微粒)可以用核酸包被,并通过推进力呈递到细胞中。示例的粒子包括那些由钨、金、铂等组成的。
除了作为可重复转化单子叶植物的有效方法外,微粒轰击的特别优势在于既不使原生质体分离(Cristou et al.,Plant Physiol.,87:671-674(1988)),也不要求对农杆菌感染的易感性。通过加速将DNA传递到玉米细胞中的方法的示例性实施方案是biolisticsα-粒子呈递系统,其可以被用于推进用DNA包被的粒子穿过网筛,例如不锈钢或Nytex网筛到覆盖了培养在悬浮液中的玉米细胞的滤器表面上。Gordon-Kamm et al.,描述了用DNA包被钨粒子的基本程序(Gordon-Kamm et al.,Plant Cell,2:603-618(1990))。网筛(screen)分散钨核酸粒子,使得它们不会以大聚集体形式被传递给受体细胞。适合用于本发明的粒子传递系统是氦加速PDS-1000/氦枪,其可以从Bio-RadLaboratories(Bio-Rad,Hercules,CA)购买(Sanford et al.,Technique,3:3-16(1991))。
对于轰击,悬浮液中的细胞在滤器上浓缩。被轰击的含有细胞的滤器位于粒子停止平板下的适当位置上。如果需要,在枪和被轰击的细胞之间还放置一个或多个网筛。
可选择地,未成熟的胚或其他靶细胞被排布在固体培养基上。被轰击的细胞定位在微粒停止平板下的合适位置上。如果需要,在加速装置和被轰击的细胞之间还放置一个或多个网筛。通过采用在此列举的技术,可以获得瞬时表达标记基因的1000或更多基因座的细胞。在轰击后48h,表达外源基因产物的中心中的细胞数量通常范围在1-10个,平均1-3个。
在轰击转化中,可以优化轰击前的培养条件和参数来获得最大数量的稳定转化体。轰击的物理和生物学参数在这种方法中是重要的。物理因素是那些涉及加工DNA/微粒沉淀物或那些影响大颗粒或微粒的飞行和速度的因素。生物学因素包括涉及在轰击前和轰击后的对细胞操作的所有步骤,调节靶细胞的渗透性有助于降低与轰击相关的损伤,以及转化的DNA的性质,如线性化DNA或完整超螺旋质粒。一般认为,轰击前的操作对于未成熟胚的成功转化是重要的。
在另一种可选择的实施方案中,质粒被稳定地转化。公开的在高等植物中质粒转化的方法包括粒子枪传递含有可选择标记的DNA,通过同源重组将DNA导向质粒基因组(Svab et al.,Proc.Natl.Acad.Sci.(U.S.A.),87:8526-8530(1990);Svab and Maliga,Proc.Natl.Acad.Sci.(U.S.A.),90:913-917(1993);Staub and Maliga,EMBO J.,12:601-606(1993);美国专利US5,451,513和US5,545,818)。
因此,包括在小规模研究中调节轰击参数的各个方面来全面优化调节。特别期望调节物理参数如间隔距离、飞行距离、组织距离和氦气压。还可以通过改进影响受体细胞的生理状态来最小化损伤降低因素,从而影响转化和综合效率。例如,调整渗透细胞的渗透状态、组织水合和次培养阶段或细胞周期来优化转化。根据本公开,本领域技术人员知晓进行其他常规调整。
农杆菌(Agrobalfeyium)介导的转化是一种广泛用于将基因导入植物细胞中的系统,DNA可以被导入到整个植物组织中,从而实现从原生质体再生完整植物的需要。采用农杆菌介导的植物整合载体来将DNA导入植物细胞中在本领域是已知的。参见,如在Fraley et al.,Bio/Thechnology,3:629-635(1985)和Rogers et al.,Methods Enzymol.,153:253-277(1987)中描述的方法。此外,Ti-DNA的整合是产生极少重排的相对精确的方法。被转化的DNA区域由边界序列限定,并且干扰DNA通常如所描述的被插入植物基因组(Spielmann et al.,Mol.Gen.Genet.,205:34(1986))。
现代农杆菌转化载体能够在大肠杆菌以及农杆菌中复制,以方便如所述操作(Klee et al.,In:Plant DNA Infectious Agents,Hohn and Schell(eds.),Springer-Verlag,NY,pp.179-203(1985))。而且,用于农杆菌介导的基因转化的载体的技术进步已经提高载体中的基因和限制性位点的排列以方便构建能够表达各种多肽编码基因的载体。被描述的载体具有便于多重连接区域,侧接为用于直接表达插入的多肽编码基因的启动子和聚腺苷酸化位点,适合用于本发明目的(Rogers et al.,Methods Enzyrnol.,153:253-277(1987))。此外,含有加臂(armed)的和去臂(disarmed)的Ti基因的农杆菌可以被用于转化。在这些农杆菌介导的转化有效的植物品种中,这是可选的方法,这是由于基因转化的易行性和确定的特性。
采用农杆菌转化方法形成的转基因植物通常在一个染色体上含有单基因。这种转基因植物被称作为与被加入的基因杂合。更加优选的是与被加入结构基因是同型结合(homozygous)的转基因植物;即转基因植物含有两种添加的基因,在染色体对的各个染色体上的相同基因座位点上的一个基因。纯合子转基因植物可以通过下述获得,有性杂交(自交)自由分离子,含有单一加入基因的转基因植物,使一些生成的种子发芽,并分析生成的植物中的目标基因。
还应当理解,两种不同转基因植物还可以杂交产生含有两种自由分离的外源基因的子代。适当子代子交能够生成对于加入基因和编码目标多肽的外源基因来说是纯化子的植物。还包括与父本植物回交和与非转基因植物异型杂交,这是无性繁殖。
进行转化植物原生质体可以采用磷酸钙沉淀、聚乙二醇处理、电穿孔和这些处理的组合的方法(参见,如Potrykus et al.,Mol.Gen.Genet.,205:193-200(1986);Lorz et al.,Mol.Gen.Genet.,199:178(1985);Fromm et al.,Nature,319:791(1986);Uchimiya et al.,Mol.Gen.Genet.,204:204(1986);Marcotte et al.,Nature,335:454-457(1988))。
将这些系统应用于不同植物品系取决于从原生质体再生那些特定植物品种的能力。从原生质体再生谷类植物的示例方法被描述(Fujimura et al.,Plant Tissue Culture Letters,2:74(1985);Toriyama et al.,Theor.Appl.Genet.,205:34(1986);Yamada et al.,Plant Cell Rep.,4:85(1986);Abdullah et al.,Biotechnology,4:1087(1986))。
为了转化不能成功地从原生质体中再生的植物品系,可采用将DNA导入完整细胞或组织中的方法。例如,从未成熟的胚或外植体再生谷类植物的方法是有效的,如(Vasil,Biotechnology,6:397(1988))描述。此外,“粒子枪”或高速微粒技术可以被采用(Vasil et al.,BiolTechnology,10:667(1992))。
采用后一种技术,DNA在小金属颗粒的表面上被携带过细胞壁,并进入细胞质中,如(Klein et al.,Nature,328:70(1987);Klein et al.,Proc.Natl.Acad.Sci.(U.S.A.),85:8502-8505(1988);McCabe etal.,BiolTechnology,6:923(1988))所描述。金属颗粒穿透多层细胞,以在组织外植体中转化细胞。
还可以采用其他细胞转化方法,包括但不限于直接DNA转移到花粉中来将DNA导入植物(Hess et al.,Intern Rev.Cytol.,107:367(1987);Luo et al.,Plant Mol Biol.Reporter,6:165(1988)),通过将DNA直接注射到植物繁殖器官中(Pena et al.,Nature,325:274(1987)),或者通过将DNA直接注射到未成熟的胚的细胞中,接着再水合干的胚(Neuhaus etal.,Theor.Appl.Genet.,75:30(1987))。
从单一植物原生质体转化株或各种转化的外植体再生、发育和培养植物,在本领域是已知的(Weissbach and Weissbach,In:Methods for PlantMolecular Biology,Academic Press,San Diego,CA,(1988))。这种再生和培养方法通常包括选择被转化细胞、培养这些赋予个性细胞通过胚发育的常规阶段,通过生根苗(plantlet)阶段的步骤。类似地再生转基因胚和种子。生成的转基因生根苗随后被种植在适当的植物生长制剂中如土壤中。
含有编码目标蛋白的外源基因的植物的发育或再生在本领域是熟知的。优选地,再生植物自花授粉来产生纯合的转基因植物。此外,从再生植物获得的花粉与农业上重要品系的种子生长的植物杂交。相反地,来自这些重要品系的植物的花粉用于对再生的植物进行授粉。本发明的含有期望多肽的转基因植物采用本领域技术人员熟知的方法种植。
有各种方法用于从植物组织中再生植物。特定的再生方法将依赖于起始植物组织和被再生的特定植物种类。
转化双子叶植物的方法,主要是采用根癌农杆菌(Agrobacteriumtumefaciens)和获得转基因植物的方法已经被公布用于棉花(美国专利US5,004,863;US5,159,135;和US5,518,908);大豆(美国专利US5,569,834和US5,416,011;McCabe et al.,Biotechnology,6:923(1988);Christou et al.,PlantPhysiol.,87:67l-674(1988));芸苔(Brassica)(美国专利US5,463,174);花生(Cheng et al.,Plant Cell Rep.,15:653-657(1996),McKently et al.,Plant CellRep.,14:699-703(1995));番木瓜(papaya);豌豆(Grant et al.,Plant Cell Rep.,15:254-258(1995));和拟南芥(Bechtold et al.,C.R.Acad.Sci.Paris,LifeSci.,316:1194-1199(1993))。后一种用于转化拟南芥的方法通常称作″蘸(dipping)″或真空渗入或种质转化。
采用电穿孔、粒子轰击和农杆菌转化单子叶植物也已经被报道。转化和植物再生已经在天门冬(asparagus)(Bytebier etal.,Proc.Natl.Acad.Sci.(U.S.A.),84:5354(1987));大麦(Wanand Lemaux,PlantPhysiol,104:37(1994));玉米(corn)(Rhodes et al.,Science,240:204(1988);Gordon-Kamm et al.,Plat Cell,2:603-618(1990);Fromm etal.,Bio/Technology,8:833(1990);Koziel et al.,BiolTechnology,11:194(1993);Armstrong et al.,Crop Science,35:550-557(1995));燕麦(Somers et al.,BiolTechnology,10:1589(1992));果园草(Horn et al.,Plant CellRep.,7:469(1988));稻(Toriyama et al.,Theor Appl.Genet.,205:34(1986);Partet al.,Plant Mol.Biol.,32:1135-1148(1996);Abedinia et al.,Aust.J.PlantPhysiol.,24:133-141(1997);Zhang and Wu,Theor.Appl.Genet.,76:835(1988);Zhang et al.,Plant Cell Rep.,7:379(1988);Battraw and Hall,PlantSci.,86:191-202(1992);Christou et al.,Bio/Technology,9:957(1991));黑麦(rye)(De la Pena et al.,Nature,325:274(1987));甘蔗(Bower and Birch,PlantJ.,2:409(1992));苇状羊茅(tall feseue)(Wang et al.,BiolTeclanology,10:691(1992));和小麦(Vasil et al.,Bo/Technology,10:667(1992);美国专利US5,631,152)中获得。
已经开发了基于瞬时表达克隆的核酸构建体的基因表达分析,通过聚乙二醇处理、电穿孔或粒子攻击将核酸分子导入植物细胞中(Marcotte et al.,Nature,335:454-457(1988);Marcotte et al.,Plant Cell,1:523-532(1989);McCarty et al.,Cell,66:895-905(1991);Hattori et al.,GenesDev.,6:609-618(1992);Goff et al.,EMBO J.,9:2517-2522(1990))。瞬时表达系统被用于功能性地分裂基因构建体(通常常见Mailga et al.,Methods in PlantMolecular Biology,Cold Spring Harbor Press,NY(1995))。
任何本发明的核酸分子与其他遗传元件一起以永久或暂时的方式被导入植物细胞中,这些遗传元件如载体、启动子、增强子等。此外,任何本发明的核酸分子以能够表达或过度表达由核酸分子编码的蛋白质或其片段的方式被导入到植物细胞中。
特定的内源基因或基因家族的共抑制在表达水平、通常在RNA水平被同源有义构建体的表达降低,该构建体能够转录与内源基因转录本相同的链的mRNA(Napoli et al.,Plant Cell,2:279-289(1990);van der Krol et al.,Plant Cell,2:291-299(1990))。共抑制可以从用单拷贝的与存在于细胞的核酸序列同源核酸分子(Prolls and Meyer,Plant J.,2:465-475(1992)),或者用多拷贝的与存在于细胞的核酸序列同源核酸分子(Mittlesten et al.,Mol.Gen.Genet.,244:325-330(1994))稳定转化产生。被连接到启动子的基因虽然不同,但是产生对连接基因的共抑制(Vaucheret,C.R.Acad.Sci.III,316:1471-1483(1993);Flavell,Proc.Natl.Acad.Sci.(U.S.A.),91:3490-3496(1994));van Bloldand et al.,Plant J.,6:861-877(1994);Jorgensen,Trends Biotechnol.,8:340-344(1990);Meins and Kunz,In:Genelnactivation and Homologous Recombination in Plants,Paszkowski(ed.),pp.335-348,Kluwer Academic,Netherlands(1994))。
应当理解,一种或多种的本发明的核酸可以被导入到植物细胞,采用具有这种转录的合适启动子转录,产生对内源蛋白的共抑制。
反义方法是通过靶向遗传物质来阻止或降低基因功能的途经(Mol etal.,FEBS Lett.,268:427-430(1990))。反义方法的目标是使用与靶基因互补的序列来阻断基因表达,并建立突变细胞系或生物体,其中单个被选择的蛋白质水平被选择性地降低或消除。相对于“反向遗传(reverse genetic)”方法,反义技术具有一些优势。失活的位点及其可能(developmental)的作用可通过选择反义基因的启动子来加工,或者通过计时(timing)外部应用或微注射。通过选择目标基因的独特区域或者与其他相关基因同源的区域来加工反义序列的特异性(Hiatt et al.,In:Genetic Engineering,Setlow(ed.),Vol.11,NewYork:Plenum 49-63(1989))。
反义RNA技术包括将与目标mRNA互补的RNA导入细胞,产生通过反义底物与目标mRNA的碱基配对形成的特异RNA:RNA双链体(Green etal.,Annu.Rev.Biochem.,55:569-597(1986))。在一个实施方案中,该方法包括反义基因序列的导入和表达。这种序列中,正常基因序列的部分或全部位于启动子的相反方向使得“错误”或互补链被转录为非编码反义RNA,其与靶mRNA杂交并干扰其表达(Takayama and Inouye,Crit.Rev.Biochem.Mol.Biol.,25:155-184(1990))。反义载体通过常规方法构建,并通过转化、转染、电穿孔、微注射、感染等导入细胞中。转化的类型和载体选择将决定表达是瞬时的或稳定的。用于反义基因的启动子可能影响反义抑制的水平、计时(timming)、组织、特异性或可诱导性。
应当理解,通过培养被转化的植物细胞来降低或抑制植物细胞中蛋白质活性,该植物细胞含有非转录链编码蛋白质或其片段的核酸分子。活性通过任何方法降低或抑制的优选蛋白质是尿黑酸异戊二烯基转移酶。
转录后基因沉默(PTGS)会在植物中导致病毒免疫性或基因沉默。PTGS被dsRNA诱导,受RNA依赖的RNA聚合酶介导,聚合酶存在于细胞质中,需要模板。dsRNA通过互补的转基因mRNA或相同转录本的互补区的杂交形成。采用来自共同存在于植物基因组的一条有义基因和一条反义基因的转录本、自互补的单一转录本、来自杂交结合的基因的有义和反义转录本来形成双链体。dsRNA依赖RNA聚合酶使来自转基因mRNA的互补链与RNAse分子结合到该互补链(cRNA)上。这些cRNA-RNase分子杂交到内源mRNA上,并裂解邻近杂合体的单链RNA。被裂解的单链RNA进一步通过其他宿主RNase降解,是由于一条缺乏带帽的5′端,而另一条缺乏poly(A)尾(Waterhouse et al.,PNAS,95:13959-13964(1998))。
应当理解,一种或多种本发明的核酸可以被导入植物细胞中,使用这种转录的合适启动子转录,导致内源转录本的转录后基因沉默。
已经在植物中表达了抗体(Hiatt et al.,Nature,342:76-78(1989);Conradand Fielder,Plant Mol.Biol.,26:1023-1030(1994))。胞质表达scFv(单链Fv抗体)已经被报道用于延缓菊芋斑驳皱缩病毒(artichoke mottled crinkle virus)的感染。表达抗内源蛋白的抗体的转基因植物具有生理学作用(Philips etal.,EMBO J.,16:4489-4496(1997);Marion Poll,Trends in PlantScience,2:447-448(1997))。例如抗脱落酸的抗体已经被报道会产生对种子发育的全面干扰(Philips et al.,EMBO J.,16:4489-4496(1997))。
具有催化功能的抗体也可以在植物中被表达(抗体酶)。抗体酶的原理是由于抗体产生来抵抗许多分子,这种识别能力被定向于产生结合过渡态(bind transition state)来推进化学反应的抗体(Persidas,NatureBiotechnology,15:1313-1315(1997);Baca et al.,Ann.Rev.Biophys.Biomol.Struct.,26:461-493(1997))。抗体酶的催化能力可以通过定点突变来提高。抗体酶的例子为,例如,列举在美国专利US5,658,753;US5,632,990;US5,631,137;US5,602,015;US5,559,538;US5,576,174;US5,500,358;US5,318,897;US5,298,409;US5,258,289;和US5,194,585中。
应当理解,任何本发明的抗体可以在植物中被表达,并且这种表达能够产生生理作用。还应当理解,任何被表达的抗体具有催化活性。
本发明还提供本发明的植物的部分,特别是繁殖或储存部分。植物部分不限于包括种子、胚乳、胚珠和花粉。在本发明的特别优选的实施方案中,植物部分是种子。在一个实施方案中,种子为动物饲料的组分。
在另一个实施方案中,植物部分是果实,更加优选是存放期被延长的果实。在另一个优选实施方案中,果实的生育酚水平被提高。在另一个优选实施方案中,果实的三烯生育酚水平被提高。
本发明还包括超过约10,000种子,更加优选约20,000和甚至更加优选约40,000种子的容器(container),其中超过约10%,更优选约25%,更优选约50%和甚至更优选75%或90%种子是来自本发明的植物的种子。
本发明还提供超过约10kg,更加优选约25kg和甚至更加优选约50kg种子的容器,其中超过约10%,更优选约25%,更优选约50%和甚至更优选75%或90%种子是来自本发明的植物的种子。
任何本发明的植物或其部分可以被加工来生产饲料、食物(meal)、蛋白质或油制品,包括总生育酚含量高的油制备物,和任何一种或多种各种在此所列的生育酚成分高的油制备物。用于该目的的特别优选的植物部分是种子。在优选实施方案中,饲料、食物、蛋白质或油制备物被设计给家畜或人或两者。制备饲料、食物、蛋白质和油制备物的方法在本领域是已知的。参见,如美国专利US4,957,748;US5,100,679;US5,219,596;US 5,936 069;US6,005,076;US6,146,669;和US6,156,227。在优选实施方案中,蛋白质制备物是高蛋白制备物。这种高蛋白制备物优选具有超过约5%w/v,更加优选10%w/v和甚至更加优选15%w/v的蛋白质含量。在优选油制备物中,油制备物是具有来自本发明的植物或其部分的油含量超过约5%w/v,更加优选10%w/v和甚至更加优选15%w/v的高含量油制备物。在优选实施方案中,油制备物是液体的,具有超过约1、5、10或50L的体积。本发明提供从本发明的植物中制备的油或者通过本发明方法的生产的油。这种油可能具有高的氧化稳定性。此外,这种油可以是任何生成的产物的次要(minor)或主要的成分。而且,这种油可以与其他油混合。在优选实施方案中,从本发明植物制备的油或通过本发明的方法生产的油在体积或重量上构成任何产品的油成分的约0.5%、1%、5%、10%、25%、50%、75%或90%以上。在另一个实施方案中,油制备物可以被混合,并在体积上构成了混合物的10%、25%、35%、50%或75%以上。来自本发明植物的油制备物可以与一种或多种有机溶剂或石油蒸馏物(petroleum distillates)混合。
本发明的植物是繁育程序的一部分或从繁育程序中产生。繁育方法的选择取决于植物繁殖的模式、被改进的特性的遗传力和商业上采用的栽培种的类型(如,F1杂合栽培种、纯系栽培种等)。所选择的非限制性方法用于繁育本发明的植物列举在下面。可以采用任何杂交后代的标记辅助选择来增强繁育程序。还应当理解,任何商业的和非商业的栽培种可以被用于繁育程序。因素如应激力(emergence vigor)、营养势(vegetative vigor)、应激耐受(stress tolerance)、抗病性、分支(branching)、开花、结实(seed set)、种子大小、种子密度、群从性(standability)和脱粒能力(threshability)等通常决定该选择。
对于高度遗传性的特性,选择在某一区域评价的较好的个别植物是有效的,但是对于低遗传力的特征,应当根据从重复评价相关植物家族获得的平均值来选择。通用的选择方法通常包括谱系选择、改进的谱系选择、混合选择和轮回选择。在一个优选实施方案中,进行回交或轮回程序。
遗传的复杂性影响繁育方法的选择。回交繁育可以被用于将一种或一些高遗传特性的有利目标基因转化到期望的栽培种中。这种方法已经被广泛用于繁育抗病栽培种。各种轮回选择技术被用于改进受许多基因控制的数量遗传特性。在自花授粉的农作物中采用轮回选择取决于授粉的容易性、从每次授粉成功杂合的频率和每次成功杂交得到杂合后代的数量。
繁殖系可以被检测,并在商业目标区域的代表性环境下与合适的标准物比较两代或两代以上。最好的品系是新的商业栽培种的候选;那些仍然缺乏特性的品系被用作亲本来制备用于进一步选择的新种群。
确定较好的植物的一种方法是观察其相对于其他试验植物和广泛种植的标准栽培种的性能。如果单一观察不能作出决定,重复观察可以提供对其遗传价值的较好估计。育种人员可以选择和杂交两种或多种亲本品系,接着通过重复自交和选择,制备许多新的遗传组合。
开发新的栽培种需要开发和选择品种、杂交这些品种和选择较好的杂合杂交。杂种种子可以通过被选择的雄性可育亲本之间的人为杂交来制备,或者通过雄性不育体系制备。杂合体被选择用于特定的单一基因性状,如荚颜色、花的颜色、种子产量、成熟(pubescene)颜色或除草剂抗性,这表明种子的确是杂合体。其他关于亲本品系,以及杂合体表型的的数据影响育种人员是否继续特异杂交的决定。
谱系繁育和轮回选择繁育方法可以被用于从繁育种群中开发栽培种。繁育程序将来自两种或多种栽培种或者各种广泛来源的特性结合到繁殖集合中,从中通过自交和选择期望表型来开发栽培种。新的栽培种可以被评价来决定是否具有商业潜质。
谱系繁育通常被用于改进自花授粉的作物。两种具有期望、互补特性的亲本被杂交来制备F1。通过自交一个或多个F1来制备F2群体。从最好的家族中选择最好的个体。可以在F4代开始重复检测家族来改进低遗传力的特性的选择效率。近交的高级阶段(即F6和F7),最好的系或表型类似的系被检测来确定可能分离作为新的栽培种。
回交繁育已经被用于将简单遗传和高度可遗传的特性的基因转移到期望的纯合栽培种或近交系中,作为轮回的亲本。被转移的特性的来源称作供体亲本。生成的植物被期望具有轮回亲本(如栽培种)的特征和从供体亲本转移的期望特征。在最初杂交后,具有供体亲本表型的个体被选择和与轮回亲本重复杂交(回交)。生成的亲本期望具有轮回亲本(如栽培种)的特征和从供体亲本转移的期望特征。
单一种子传代操作,严格意义上是指培植分离种群,收获各个植物的一种种子样本,用一种种子(one-seed)样本培育下一代。当该种群已经从F2进化到具有期望近交水平时,来自该品系的植物将各自追溯到不同F2个体。该种群中的植物的数量在各代中下降,其由于一些种子不能萌发或一些植物不能产生至少一粒种子。结果当世代进化完成,并非所有最初从种群采样的F2植物都在子代中体现。
在多种子操作中,育种人员通常从种群中的各种植物中收获一种或多种荚果,一起脱粒形成批量。批量的部分被用于种植下一代,一部分被保存。这种方法被称作为改进的单一种子传代方法或荚-批量技术(pod-bulktechnique)
多种子操作已经被用于在收割时节约劳动力。用机器脱粒荚果显著地快于单一种子操作的通过手工从各个荚果中取出种子。多种子操作还可能在各个近交世代中种植相同数量种群的种子。
对于其他通常用于不同特征和作物的育种方法的描述可参见一些参考书(如Fehr,Principles of Cultivar Development,Vol.1,pp.2-3(1987))。
还可以用无融合生殖繁殖本发明的转基因植物。无融合生殖是一种遗传控制植物繁殖的方法,其中胚形成不需要卵与精子结合。有三种基本类型的无融合生殖繁殖:1)无孢子生殖,其中来源于核的胚囊中染色体未减数的卵发育得到胚;2)倍数孢子形成,其中来源于大孢子母细胞胚囊中不减数的卵发育得到胚;和3)不定胚生殖(adventitious embryony),其中胚直接从体细胞发育得到。在绝大多数类型的无融合生殖,假受精或极体核受精来制备胚乳对于种子活力是必须的。在无孢子生殖中,保育(nurse)栽培种被用作花粉来源来在种子中形成胚乳。由于栽培种的不减数卵孤雌地发育,但是可能形成胚乳,保育栽培种不影响无孢子的无融合生殖栽培种的遗传学。无融合生殖具有重要经济意义,特别是在转基因植物中,由于无论如何杂合,其生成正确繁育的任何基因型。
因此,通过无融合生殖繁殖,杂合的转基因植物能够在重复生活周期中保持其遗传忠实性。制备无融合生殖植物的方法在本领域是已知的。参见美国专利US5,811,636。
其他生物体
本发明的核酸可以被导入任何细胞或生物体中,如哺乳动物细胞、哺乳动物、鱼细胞、鱼、鸟细胞、鸟、藻类细胞、藻类、真菌细胞、真菌和细菌细胞。本发明的蛋白质在合适的细胞或生物体中制备。优选宿主和转化株包括:真菌细胞,如曲霉属菌种、酵母、哺乳动物,特别是牛和猪、昆虫、细菌和藻类。特别优选细菌是根癌农杆菌(Agrobacteruim tumefaciens)和E.coli。
转化这种细胞或生物体的方法在本领域是已知的(EP0238 023;Yelton etal.,Proc.Natl.Acad.Sci.(U.S.A.),81:1470-1474(1984);Malardier et al.,Gene,78:147-156(1989);Becker and Guarente,In:Abelson and Simon(eds.),Guideto Yeast Genetics and Molecular Biology,MethodEnzymol.,Vol.194,pp.182-187,Academic Press,Inc.,NY;Ito et al.,J.Bacteriology,153:163(1983);Hinnen et al.,Proc.Natl.Acad.Sci.(U.S.A.),75:1920(1978);Bennett and LaSure(eds.),More Gene Manipualtionins in fungi,Academic Press,CA(1991))。制备本发明的蛋白质的方法也是已知的(Kudlaet al.,EMBO,9:1355-1364(1990);Jarai and Buxton,CurrentGenetics,26:2238-2244(1994);Verdier,Yeast,6:271-297(1990);MacKenzie et al.,Jourenal of Gen.Microbiol.,139:2295-2307(1993);Hartl at al.,TIBS,19:20-25(1994);Bergenron et al.,TIBS,19:124-128(1994);Demolder et al.,J.Biotechnology,32:179-189(1994);Craig,Science,260:1902-1903(1993);Gething and Sambrook,Nature,355:33-45(1992);Puig and Gilbert,J.,Biol.Chem.,269:7764-7771(1994);Wang and Tsou,FASEBJournal,7:1515-1517(1993);Robinson et al.,Bio/Technology,1:381-384(1994);Enderlin and Ogrydziak,Yeast,10:67-79(1994);Fuller et al.,Proc.Natl.Acad.Sci.(U.S.A.),86:1434-1438(1989);Julius et al.,Cell,37:1075-1089(1984);Julius et al.,Cell,32:839-852(1983))。
在优选实施方案中,在细胞或生物体中过度表达本发明的蛋白质或其片段,在该细胞或生物体中产生高于具有相似遗传背景的未转化细胞或生物体的生育酚水平。
在优选实施方案中,在细胞或生物体中过度表达本发明的蛋白质或其片段,在该细胞或生物体中产生高于具有相似遗传背景的未转化细胞或生物体的α-生育酚水平。
优选实施方案中,在细胞或生物体中过度表达本发明的蛋白质或其片段,在该细胞或生物体中产生高于具有相似遗传背景的未转化细胞或生物体的α-生育酚水平。
在另一个优选实施方案中,在细胞或生物体中过度表达本发明的蛋白质或其片段,在该细胞或生物体中产生高于具有相似遗传背景的未转化细胞或生物体的α-三烯生育酚水平。
在另一个优选实施方案中,在细胞或生物体中过度表达本发明的蛋白质或其片段,在该细胞或生物体中产生高于具有相似遗传背景的未转化细胞或生物体的γ-三烯生育酚水平。
抗体
本发明的一个方面涉及抗体、单链抗原结合分子或其他特异地结合一种或多种本发明的蛋白质或肽分子的其他蛋白质及其同系物、融合蛋白或片段。在特别优选的实施方案中,抗体特异地结合到具有示于SEQ ID NO:5、9-11、43-44、57-58和90的氨基酸序列的蛋白质或其片段上。本发明的抗体被用于定量或定性地检测本发明的蛋白质或肽分子,或者检测蛋白质的翻译后修饰。如在此所用,如果这种结合不被非相关分子的存在竞争性地抑制,抗体或肽被认为是“特异地结合”本发明的蛋白质或肽分子。
编码本发明的蛋白质的全部或部分的核酸分子可以通过重组方法被表达来获得蛋白质或肽,蛋白质或肽随后被用于生产能够结合被表达的蛋白质或肽的抗体。这种抗体被用于免疫测定这种蛋白质。这种蛋白质编码分子或其片段可以是“融合”分子(即较大的核酸分子的一部分),使得表达生成融合蛋白。应当理解,任何本发明的核酸分子通过重组方法被表达来获得由这些核酸分子编码的蛋白质或肽。
特异地结合本发明的蛋白质和蛋白质片段的抗体可以是单克隆或多克隆抗体,可以包含完整免疫球蛋白或免疫球蛋白片段的抗原结合部分(例如(F(ab′)、F(ab′)2))或者可制备的单链免疫球蛋白,例如通过重组方法制备。应当理解,本领域实际操作人员熟悉描述抗体的构建、加工和分离的特定条件和操作的标准资料来源(参见,如Harlow and Lane,In:Antibodies:ALaboratory Manual,Cold Spring Harbor Press,Cold Spring Harbor,NY(1988))。
如下文描述,这种抗体分子或其片段可以被用于诊断目的。当抗体被用于诊断目的时,期望被配体基团(如生物素)或可检测的标记基团(如荧光基团、放射性同位素或酶)衍生。
制备结合本发明的蛋白质或肽分子的抗体的能力使得可以鉴定衍生自这些分子的模拟化合物。这些模拟化合物可能含有蛋白质或肽的片段,或者仅仅是结构相似区,但是能够与抗这种化合物的抗体特异地结合。
示例性用途
本发明的核酸分子及其片段被用于从相同品种中获得其他核酸分子(来自玉米的核酸分子可以被用于获得来自玉米的其他核酸分子)。这种核酸分子包括编码蛋白质的完整编码序列核酸分子、启动子和该分子的侧翼序列。此外,这种核酸分子包括编码其他同工酶的核酸分子或基因家族成员。这种分子容易通过采用上述核酸分子或其片段筛选cDNA或基因组文库。构建这种文库的方法在本领域是熟知的。
本发明的核酸分子及其片段也可以被用于获得核酸同系物。这种同系物包括植物或其他生物体的核酸分子,包括细菌和真菌,包括完整地或部分地编码其他植物种类或其他生物体的蛋白质同系物的核酸分子,遗传元件序列,如启动子和转录调控元件。采用上述核酸分子或其片段筛选从这些植物品种获得的DNA或基因组文库来容易获得这种分子。构建该文库的方法在本领域是已知的。这种同系物分子在核苷酸序列上可以区别于那些编码一种或多种SEQ ID NO:5、9-11、43-44、57-5和90的核酸分子及其互补体,由于稳定杂交不需要完全互补性。因此,本发明的核酸分子还包括虽然能够特异性地杂交核酸分子但缺乏“完整互补性”的核酸。
任何各种方法可以用于获得一种或多种上述核酸分子(Zamechik et al.,Proc.Natl.Acad.Sci.(U.S.A.),83:4143-4146(1986);Goodchild et al.,Proc.Natl.Acad.Sci.(U.S.A.),85:5507-5511(1988);Wickstrom et al.,Proc.Natl.Acad.Sci.(U.S.A.),85:1028-1032(1988);Holt et al.,Molec.Cell.Biol.,8:963-973(1988);Gerwirtz etal.,Science,242:1303-1306(1988);Anfossi et al.,Proc.Natl.Acad.Sci.(U.S.A.),86:3379-3383(1989);Becker et al.,EMBO J.,8:3685-3691(1989))。核酸自动合成仪可以被用于该目的。除了这种合成,公开的核酸分子可以被用于确定引物对,其与聚合酶链式反应一起(Mullis etal.,Cold Spring Harbor symp.Quant.Biol.,51:263-273(1986);Erlich et al.,EP50424;EP84796;EP258017;EP237362;Mullis,EP201184;Mullis et al.,US4,683,202;Erlich,US4,582,788;and Saiki et al.,US4,683,194)来扩增和获得任何期望的核酸分子或片段。
启动子序列和其他遗传元件,包括但不限于与一种或多种公开的核酸序列相关的转录调控侧翼序列,也可以采用在此提供的核酸序列来获得。在一个实施方案中,这种序列通过将本发明的核酸分子与基因组文库成员一起温育,收获杂交到这种核酸分子的克隆。在第二个实施方案中,“染色体步查(walking)”的方法或者反向PCR可以被用于获得这种序列(Frohman etal.,Proc.Natl.Acad Sci.(U.S.A.),85:8998-9002(1988);Ohara et al.,Proc.Natl.Acad.Sci.(U.S.A.),86:5673-5677(1989);Pang et al.,Biotechniques,22:1046-1048(1977);Huang et al.,Methods Mol.Biol.,69:89-96(1997);Huanget al.,Method Mol.Biol.,67:287-294(1997);Benkel et al.,Genet.Anal.,13:123-127(1996);Hartl et al.,Methods Mol.Biol.,58:293-301(1996))。术语“染色体步查”是指通过连续杂交步骤延伸遗传图谱的方法。
本发明的核酸分子可以被用于分离细胞增强、细胞特异、组织增强、组织特异、发育地或环境调控表达模式的启动子。例如,采用基因组筛选方法和PCR技术分离和功能测定来自基因组文库的基因的5’侧翼启动子序列,实现分离有用的启动子和转录调控元件。这些方法对于本领域技术人员是已知的,已经被描述(参见,如Birren et al.,Genome Analysis:AnalyzingDNA,1,(1997),Cold Spring Harbor Laboratory Press,Cold Spring Harbor,NY)。采用本发明的核酸分子获得的启动子还可以被改进来影响它们的控制特征。这种改进的例子包括但不限于增强子序列。这种遗传元件可以被用于增强基因表达改进作物的新的和已有特征。
本发明的核酸分子的其他集合包括作为标记的核酸分子。标记可以大量常规方式被用于分子遗传领域。这种标记包括作为标记的编码SEQ IDNO:5、9-11、43-44、57-58和90的核酸分子及其互补体和片段,和作为标记的本发明的其他核酸分子。
本发明的遗传标记包括“显性”或“共显性”标记。“共显性标记”表明一个位点上存在两个或多个等位基因(每个双倍体个体两个)。“显性标记”表明每个位点上仅存在单一等位基因。存在共显性标记表型(如DNA条带)表明一种等位基因存在纯合或杂合条件下。缺乏显性标记的表型(如缺乏DNA条带)仅仅表明存在“一些其他”不确定的等位基因。当种群中个体主要是纯合的并且位点是二态的时,显性和共显性标记是等价的。当种群变得更加杂合和多重等位基因,共显性标记一般比显性标记具有更多表型信息。标记分子可以如能够检测多态性,如单核苷酸的多态性(SNPs)
动物和植物的基因组在其连续进化过程中自然地进行自发突变(Gusella,Ann.Rev.Biochem.,55:831-854(1986))。“多态性”是基因序列或其侧翼区域的变化或差异,这些侧翼区域存在于该品种的一些个体中。变异序列和“原始”序列共同存在于品种种群中。在某些情况下,这种共存处于稳定或准稳定的平衡中。
因此,多态性被认为是“等位基因的”,其中由于存在多态性种群中的一些成员可能具有原始序列(即原始“等位基因”),而其他成员具有变异序列(即变异的“等位基因”)。在最简单的情况下,仅存在一种变异序列,而多态性被认为是双等位基因的。在其他情况下,品种的种群可能含有多种等位基因,多态性被称作三等位基因的等。单基因可以具有多种不同的无关多态性。例如,可能在一个位点上具有双等位基因多态性,而在另一个位点上具有多个等位基因多态性。
说明多态性的变化可能从单一核苷酸变化到在基因中插入或删除延伸的区域。在某些情况下,DNA序列的变化在基因组的区域中,其特征在于短串联重复(STRs),包括核苷酸的串联的二个或三个核苷酸的重复基序。特征为这种串联重复的多态性称作为“可变数量串联重复”(″VNTR″)的多态性。VNTR已经被用于鉴定分析(Weber,US5,075,217;Armour et al.,FEBSLett.,307:113-115(1992);Jones et al.,Eur.J.Haematol.,39:144-147(1987);Horn et al.,PCT申请WO91/14003;Jeffreys,EP370 719;Jeffreys,US5,175,082;Jeffreys et al.,Amer.J.Hum.Genet.,39:11-24(1986);Jeffreys et al.,Nature,316:76-79(1985);Gray et al.,Proc.R.Acad.Soc.Lond.,243:241-253(1991);Mooreet al.,Genomics,10:654-660(1991);Jeffreys et al.,Anim.Genet.,18:1-15(1987);Hillel et al.,Anim.Genet.,20:145-155(1989);Hillel et al.,Genet,124:783-789(1990))。
采用核酸扩增方法以方便在DNA样本中检测多态性位点。这种方法特异地提高跨越多态性位点或者包括该位点和位于远侧或邻近的序列的多核苷酸的浓度。这种被扩增的分子可以容易通过电泳或其他方法检测。
在另一个实施方案中,这种多态性可以通过采用标记核酸分子来检测,这种标记核酸分子被物理地连接到这种多态性上。为了该目的,采用标记核酸分子,其包含位于多态性的1mb内,和更优选位于多态性的100kb内和最优选位于多态性的10kb内的多核苷酸的核苷酸序列。
可以通过各种方式确定对多态性的鉴定。通过将植物中存在或缺失多态性与表型的存在或缺少相关联,可能预测该植物的表型。如果多态性建立或破坏限制性内切酶裂解位点,或者如果其导致DNA的缺失或插入(如VNTR多态性),其将改变用限制性内切酶消化得到的DNA片段的大小或模式。因此,具有变异序列的生物体可以通过限制性片段分析区别于具有那些原始序列的生物体。可以通过这种方式确定的多态性称作为“限制性片段长度多态性”(RFLPs)(Glassberg,英国专利申请2135774;Skolnick etal.,Cytogen.Cell Genet.,32:58-67(1982);Botstein et al.,Ann.J.Hum.Genet.,32:314-331(1980);Fischer et al.,PCT申请WO90/13668;Uhlen,PCT申请WO90/11369)。
多态性还可以通过单链构象多态性(SSCP)分析来确定(Elles,Methods inMolecular Medicine:Molecular Diagnosis of Genetic Diseases,Humana Press(1996));Orita et al.,Genomics,5:874-879(1989))。已经描述了多种用于SSCP的方案,包括但不限于Lee et al.,Anal.Biochem.,205:289-293(1992);Suzuki et al.,Anal.Biochem.,192:82-84(1991);Lo et al.,Nucleic AcidsResearch,20:1005-1009(1992);Sarkar et al.,Genomics,13:441-443(1992)。应当理解,一种或多种本发明的核酸可以被用作标记或探针,通过SSCP分析来检测多态性。
还可以采用称作扩增片段长度多态性(AFLP)的DNA指纹分析技术来确定多态性,AFLP是基于选择性PCR扩增来自总消化基因组DNA的限制性片段来确定该DNA的模式(Vos et al.,Nucleic AcidsRes.,23:4407-4414(1995))。这种方法可以特异性地共扩增大量限制性片段,不需要知晓核酸序列通过PCR可视化该片段。应当理解,一种或多种本发明的核酸可以被用作标记或探针来通过AFLP分析检测多态性,或者用于指纹分析RNA。
多态性还可以采用随机扩增多态性DNA(RAPD)(Williams et al.,Nucl.Acids Res.,18:6531-6535(1990))和可裂解的扩增多态性序列(CAPS)(Lyamichev et al.,Science,260:778-783(1993))来确定。应当理解,一种或多种本发明的核酸分子可以被用作标记或探针来通过RAPD或CAPS分析检测多态性。
单核苷酸多态性(SNP)通常以大于其他多态性标记的频率发生,并且以比被报道的多态性形式大的一致性在基因组中被隔离。SNP较大的频率和一致性是指这种多态性被发现接近或存在于目标遗传位点的概率大于其他的多态性。SNP位于蛋白质编码区和基因组的非编码区。一些这种SNP可能导致蛋白质表达的缺陷型或变异(如,由于突变或缺陷型剪接)。特征性的SNP分析(基因型)仅需要加/减分析,而不需要长度(length)测定,便于自动操作。
SNP可以采用任何各种方法来表征。这种方法包括位点的直接或间接测序,采用限制性酶(Botstein et al.,Am.J.Hum.Genet.,32:314-331(1980);Konieczny and Ausubel,Plant J.,4:403-410(1993)),酶促和化学的错配分析(Myers et al.,Nature,313:495-498(1985)),等位基因特异性PCR(Newton etal.,Nucl.Acids Res.,17:2503-2516(1989);Wu et al.,Proc.Natl.Acad.Sci.(U.S.A.),86:2757-2760(1989)),连接酶链式反应(Barany,Proc.Natl.Acad.Sci.(U.S.A.),88:189-193(1991)),单链构象多态性分析(Labruneet al.,Am.J.Hum.Genet.,48:1115-1120(1991)),单碱基引物扩增(Kuppuswamy et al.,Proc.Natl.Acad.Sci.(U.S.A.),88:1143-1147(1991),Goelet,US6,004,744;Goelet,US5,888,819),基于固相ELISA寡核苷酸连接分析(Nikiforov et al.,Nucl.Acids Res.,22:4167-4175(1994)),双脱氧指纹分析(Sarkar et al.,Genomics,13:441-443(1992)),寡核苷酸荧光淬灭分析(Livak et al.,PCR Methods Appl.,4:357-362(1995a)),5′-核酸酶等位基因特异杂交TaqMan分析(Livak et al.,Nature Genet.,9:341-342(1995)),模板指引的染色终止子结合(TDI)分析(Chen and Kwok,Nucl.Acids Res.,25:347-353(1997)),等位基因特异性分子束分析(Tyagi et al.,Nature Biotech.,16:49-53(1998)),针点分析(PinPoint assay)(Haff and Smirnov,Genome Res.,7:378-388(1997)),dCAPS分析(Neff et al.,Plant J.,14:387-392(1998)),热测序(pyrosequencing)(Ronaghiet al.,Analytical Biochemistry,267:65-71(1999);Ronaghi et al.,WO98/13523;Nyren et al.,WO98/28440; www.pyrosequencing.com),采用质谱分析,如MasscodeTM系统(Howbert et al.,WO99/05319;Howbert et al.,WO97/27331;www.rapigene.com;Becker et al.,WO98/26095;Becker et al.,WO98/12355;Becker et al.,WO97/33000;Monforte et al.,US5,965,363),侵入性裂解寡核苷酸探针(Lyamichev et al.,Nature Biotechnology,17:292-296;www.twt.com),采用高密度寡核苷酸阵列(Hacia et al.,Nature Genetics,22:164-167;www.affymetrix.com)。
还可以采用等位基因特异性寡核苷酸(ASO)检测多态性,ASO可以用于如与杂交技术结合,包括Southern,Northern和斑点印迹杂交、反向斑点印迹杂交和在微阵列上进行的杂交,以及相关技术。
用于多态性检测的杂交严谨性极大地依赖于各种因素,包括等位基因特异性寡核苷酸长度、序列组成、互补性大小(即存在或缺少碱基错配),盐浓度和其他因素如甲酰胺和温度。这些因素在杂交和随后洗涤来去除未特异地杂交的目标多核苷酸的过程中是重要的。实际上,最后的最严谨的洗脱条件是最关键的。此外,能够杂交到等位基因特异性的寡核苷酸上的目标多核苷酸的含量也受这些因素控制,如ASO和目标多核苷酸的浓度,“束缚(tie up)”水分子的因素的存在和浓度,以及杂交过程和洗涤步骤期间,无论核酸被固定或在溶液中,以用于有效地浓缩试剂(例如PEG、葡聚糖、硫酸葡聚糖等)。
杂交优选在低于ASO的解链温度(Tm)下进行。杂交和/或洗涤步骤越接近Tm,严谨性越高。寡核苷酸的Tm可以被估计,例如按照如下公式:Tm=81.5+16.6x(log10[Na+])+0.41x(%G+C)-675/n;其中[Na+]是Na+或者其他合适的阳离子摩尔盐浓度,而n=寡核苷酸的碱基数量。还可以获得其他用于估计Tm的公式,这在本领域是普通技术人员已知的。
严谨性优选被调整来使给定的ASO被差别地杂交到正确的等位基因的目标多核苷酸和错误的等位基因的目标多核苷酸上。优选地,由ASO杂交到正确的等位基因的目标多核苷酸上产生的信号水平和由ASO杂交错误的等位基因的目标多核苷酸上(例如特异于突变等位基因的ASO交叉结合到野生型等位基因上)产生的信号之间至少差异两倍。在本发明的更加优选的实施方案中,存在至少5倍信号差异。在本发明的高度优选实施方案中,在ASO杂交到正确的等位基因的目标多核苷酸和由ASO交叉结合到错误的等位基因的目标多核苷酸上产生的信号水平之间存在至少一个数量级信号差异。
虽然在此描述了一些用于检测多态性的方法,其他检测方法也可以使用。例如,其他方法是已知的,并列举在Birren et al.,Genorne Analysis,4:135-186;A Laboratory Manual.Mapping Genomes,Cold Spring HarborLaboratory Press,Cold Spring Harbor,NY(1999);Maliga et al.,Methods in PlantMolecular Biology.A Laboratory Course Manual,Cold Spring HarborLaboratory Press,Cold Spring Harbor,NY(1995);Paterson,BiotechnologyIntelligence Unit:Genome Mapping in Plants,R.G.Landes Co.,Georgetown,TX,and Academic Press,San Diego,CA(1996);The Corn Handbook,Freelingand Walbot,(eds.),Springe-Verlag,New York,NY(1994);Methods in MolecularMedicine:Molecular Diagnosis of Genetic Diseases,Elles,(ed.),Humana Press,Totowa,NJ(1996);Clark,(ed.),Plant Molecular Biology:A Laboratory Manual,Springer-Verlag,Berlin,Germany(1997)。
在植物繁育程序中影响标记辅助选择的因素为:(1)标记应当共分离或被与期望性状紧密连锁;(2)用于在大种群中筛选分子标记的有效方法应当是可得到的;和(3)筛选技术在实验室中应当具有高重复性,优选使用是经济的和容易掌握的。
建立标记分子的遗传连锁可通过基因作图模式,例如而不限于由Lander and Botstein,Genetics,121:185-199(1989)报道的侧翼标记模式和Lander and Botstein,Genetics,121:185-199(1989)描述的基于最大似然(maximum likelihood)方法的区间作图(interval mapping),并且在软件包MAPMAKER/QTL(Lincoln and Lander,Mapping Genes ControllingQuantitatve Traits Using MAPMAKERlQTL,Whitehead Institute forBiomedical Research,MA(1990)中操作。其他软件包括Qgene,版本2.23(1996),Department of Plant Breeding and Biometry,266 Emerson Hall,Cornell University,Ithaca,NY。采用Qgene软件是特别优选的方法。
计算标记存在的最大似然估计(MLE),并用MLE估计非QTL作用来避免假阳性。然后用LOD=log10(存在QTL的MLE/无被连接的QTL的MLE)计算让步比(odd ratio)的log10值(LOD)。
LOD值基本上表明这些数据假定存在QTL比其假定缺乏QTL的可能性高多少。避免假阳性的LOD阈值具有特定的置信度,比如95%,该阈值取决于标记的数量和基因组的长度。图表说明LOD阈值列举在Lander andBotstein,Genetics,121:185-199(1989)中,还在Arus and Moreno-Gonzlez,PlantBreeding,Hayward et al.,(eds.)Chapman & Hall,London,pp.314-331(1993)中描述。
在本发明的优选实施方案中,核酸标记的目标特征或表型具有大于2.0、更加优选2.5、甚至更加优选大于3.0或4.0的LOD值。在优选实施方案中,目标特征是被改变的生育酚水平或组成或者被改变的三烯生育酚的水平或组成(composition)。
可以采用其他模式。许多对区间作图的改进和变化的方法已经被报道,包括采用非参数方法(Kruglyak and Lander,Genetics 139:1421-1428(1995))。多重回归方法或模型也被采用,其中特征在大量标记中被回归(Jansen,Biometrics in Plant Breeding,van Oijen and Jansen(eds.),Proceedings of theNinth Meeting of the Eucarpia Section Biometrics in Plant Breeding,TheNetherlands,pp.116-124(1994);Weber and Wricke,Advancesin Plant Breeding,Blackwell,Berlin,16(1994))。结合区间作图和回归分析的方法已经被Jansenand Stam,Genetics,136:1447-1455(1994);和 Zeng,Genetics,136:1457-1468(1994)报道,其中表型在特定标记区间中被回归到单一的假定QTL,同时回归到作为“辅助因子”的大量标记上。一般地,采用辅助因子减少被估计的QTL位置的偏离和取样误差(Utz and Melchinger,Biometrics inPlant Breeding,van Oijen and Jansen(eds.),Proceedings of the Ninth Meeting ofthe Eucarpia Section Biometrics in Plant Breeding,TheNetherlands,pp.195-204(1994),从而提高了QTL作图的精确度和效率(Zeng,Genetics,136:1457-1468(1994))。这种模式可以被扩展到多环境试验来分析基因型-环境互作(Jansen et al.,Theo.Appl.Genet.,91:33-37(1995))。
应当理解,一种或多种本发明的核酸分子可以被用作分子标记。还应当理解,一种或多种本发明的蛋白质分子可以被用作分子标记。
在优选实施方案中,多态性被呈递并在绘制群体中被筛选,例如能够与如多态性标记的标记一起使用来绘制特征的遗传位置的植物的集合。选择适当的作图群体通常依赖于所用的标记体系的类型(Tanksley et al.,J.P.Gustafson and R.Appels(eds.).Plenum Press,NY,pp.157-173(1988))。应当考虑用于作图群体中的亲本来源(适应的与外来的)。在远源杂交(适应的与外来的)中,染色体配对和重组比例被严重打乱(抑制),并且一般导致连锁距离极大降低。与狭隘(narrow)杂交(适应的x适应的(adAPted))的后代相比,远源杂交通常将产生具有相对大量的多态性的分离种群。
在生成杂合种子后,F2群体是自交(自花传粉)的第一代。通常,单一的F1自花授粉来生产孟德尔模式(1∶2∶1)中的所有基因的分离群体。最大遗传信息从完全分离的F2群体中获得,采用共显性标记系统(Mather,Measurementof Linkage in Heredity:Methuen and Co.,(1938))。当采用共显性标记时,需要进行后代测验(如F3,BCF2)来确定杂合子,以对群体分类。但是,这种方法通常由于后代测验的费用和时间的原因受到限制。F2个体的后代测验通常被用于绘制其中表型不能一致地反映基因型(如,抗病性),或者其中特征的表达受QTL控制的构建体。从后代测验群体(如F3或BCF2)得到的分离数据可以被用于左图构建体。标记辅助选择可以被用于杂交标记-特征作图结合的后代(F2,F3),其中连锁群体未通过重组事件完全被分离(即最大平衡不稳定)。
重组近交系(RIL)(遗传相关系;通常是超过F5,从连续自交F2系发育到纯合子)可以被用作作图群体。从共显性标记获得的信息可以通过采用RIL最大化,因为所有基因座是纯合的或者接近纯合。在紧密连锁的条件下(即约<10%的重组),与回交群体的任何标记类型相比,在RIL群体中被评价的显性和共显性标记在每个个体上提供更多信息(Reiter et al.,Proc.Natl.Acad.Sci.(U.S.A.),89:1477-1481(1992))。但是,由于标记之间的距离变大(即基因座变得更加独立),RIL群体中的信息相对于共显性标记显著减少。
回交群体,如从成功品种(轮回亲本)和携带不存在于前述品种中的特征的其他品种(供体亲本)的杂交中产生,可以被用作作图群体。与轮回亲本进行一系列回交来恢复期望的特性。因此,由几乎近似于轮回亲本但是携带各种含量或嵌合形式的来自供体亲本的基因组区域的个体组成的群体被建立。如果轮回亲本中的所有基因座是纯合的,并且供体和轮回亲本具有差异显著的多态性标记等位基因(Reiter etal.,Proc.Natl.Acad.Sci.(U.S.A.),89:1477-1481(1992)),回交群体可以被用于绘制显性标记。采用共显性或显性标记从回交群体中获得的信息比从F2群体中获得的信息少,这是由于每个植物中仅一个而不是两个重组配子被采样。但是,当与RIL比较时,由于RIL群体中的连锁基因座间的距离增加(即约0.15%重组),回交群体具有更多信息(低标记饱和)。重组升高对于解除紧密连锁是有利的,但是不期望出现在低标记饱和的作图构建中。
近等基因系(NIL)(通过多次回交建立来制备除了被研究的特性或基因组区域外遗传组成几乎相同的个体的集合)可以被用作作图群体。在用NIL作图时,仅部分多态性基因座被绘制到被选择的区域。
集团分离分析(BSA)是一种开发来快速确定标记与目标特性之间的连锁的方法(Michelmore et al.,Proc.Natl.Acad.Sci.(U.S.A.),88:9828-9832(1991))。在BSA中,从来源于单一杂交的分离群体中取出两个集团的DNA样本。这些集团含有针对特定特征(抵抗或易感特定疾病)相同或者基因组区域相同、但未连锁区域是任意的(杂合的)个体。在BSA中,未连锁到目标区域的区域在许多个体的集团样本之间没有差异。
在本发明的一个方面,一种或多种本发明的核酸分子被用于检测植物(优选canola、玉米、白菜、甘蓝型油菜、油菜籽、大豆、海甘蓝、芥菜、蓖麻子、花生、芝麻、棉籽、亚麻子、红花、油棕榈、亚麻或向日葵)中,部分地或完全地由本发明的核酸分子编码的蛋白质的表达的水平(即,样本中的mRNA浓度等)或模式(即,表达动力学、分解率、稳定性模式)(统称细胞或组织的“表达反应”)。
如在此所用,如果通过细胞或组织表现的表达反应区别于不具有这种表型的植物的细胞或组织的表达反应,其被认为是“被改变的”。为了确定表达反应(Expression Response)是否被改变,通过具有该表型的植物的细胞或组织表现的表达反应与不具有该表型的植物的类似细胞或组织的表达反应比较。可以预期,不需要每次进行这种比较时都重新确定不具有这种表型的植物的细胞或组织的表达反应;相反,特定植物的表达反应可以先前获得的正常植物的值比较。如在此所用,生物体的表型是生物体的任何一种或多种特征(如抗病性、耐虫害、环境耐受性如对非生物应激的耐受、雄性不育、品质改进或产量等)。基因型或表型的变化可能是暂时或永久的。如在此所用,组织样本是包含一个细胞以上的任何样本。在优选方面,组织样本包含具有共同特征的细胞(如来自根、种子、花、叶子、茎或花粉等)。
在本发明的一个方面,进行评价来确定是否存在特定mRNA分子。一种或多种本发明的核酸分子被用于检测mRNA种类的存在或数量。然后将这种分子与植物的细胞或组织提取物在足以使核酸杂交的条件下温育。检测到双链的探针-mRNA杂合分子指示存在mRNA;这种形成的杂合体的含量与mRNA含量成比例。因此,这种探针可以被用于确定植物细胞或组织中这种mRNA生成的水平和程度。这种核酸杂交可以在定量条件下进行(从而提供存在的mRNA的含量的数值)。可选择地,这种分析可以作为定性分析进行,指示存在mRNA或者其水平超过用户设定的预定值。
许多方法可以被用于在两个或多个细胞或组织样本中比较表达反应。这些方法包括杂交分析,如northern、RNA酶保护分析和原位杂交。可选择地,这些方法包括PCR类型的分析。在优选方法中,通过将来自两种或多种样本的核酸与核酸阵列杂交来比较表达反应。该阵列含有大量已知或怀疑存在于样本的细胞或组织中的被质疑的序列。
原位杂交相对于更加常规的方法用于检测核酸的优点在于,其可以确定精确的空间群体(Angerer et al.,Dev.Biol.,101:477-484(1984);Angerer et al.,Dev.Biol.,112:157-166(1985);Dixon et al.,EMBO J.,10:1317-1324(1991))。原位杂交可以被用于测定稳定状态水平的RNA蓄积(Hardin et al.,J.Mol.Biol.,202:417-431(1989))。大量操作可以被设计来进行原位杂交,各种方法包括组织制备、杂交和洗涤条件(Meyerowitz,Plant Mol.Biol.Rep.,5:242-250(1987);Cox and Goldberg,In:Plant Molecular Biology:APractical Approach,Shaw(ed.),pp.1-35,IRL Press,Oxford(1988);Raikhel etal.,In situ RNA hybridization in plant tissues,In:Plant Molecular BiologyManual,Vol.B9:1-32,Kluwer Academic Publisher,Dordrecht,Belgium(1989))。
原位杂交还可以用于在组织或细胞中定位蛋白质(Wilkinson,In SituHybridization,Oxford University Press,Oxford(1992);Langdale,In SituHybridization In:The Corn Handbook,Freeling and Walbot(eds.),pp.165-179,Springer-Verlag,NY(1994))。应当理解,一种或多种本发明的核酸分子或其片段或者一种或多种本发明的抗体可以被用于通过原位杂交来检测蛋白质或其mRNA的水平或模式。
荧光原位杂交可以在染色体上定位特定的DNA序列,在其他应用中,用于基因作图杂种系中的染色体,或者检测具有易位、颠换或缺失的染色体。原位杂交已经被用于在一些植物品种中确定染色体(Griffor et al.,PlantMol.Biol.,17:101-109(1991);Gustafson et al.,Proc. Natl.Acad.Sci.(U.S.A.),87:1899-1902(1990);Mukai and Gill,Génome,34:448-452(1991);Schwarzacher and Heslop-Harrison,Genome,34:317-323(1991);Wanget al.,Jpn.J.Genet.,66:313-316(1991);Parra and Windle,Nature Genetics,5:17-21(1993))。应当理解,本发明的核酸分子可以被用作探针或标记来将序列定位在染色体上。
其他定位分子表达的方法是组织印迹(tissue printing)。组织印迹提供一种筛选途经,同时在同一膜上有许多来自不同植物或不同发育阶段的组织片(Yomo and Taylor,Planta,112:35-43(1973);Harris and Chrispeels,PlantPhysiol.,56:292-299(1975);Cassab and Varner,J.Cell.Biol.,105:2581-2588(1987);Spruce et al.,Phytochemistry,26:2901-2903(1987);Barres.et al.,Neuron,5:527-544(1990);Reid and Pont-Lezica,Tissue Printing:Tools for theStudy of Anatomy,Histochemistry and Gene Expression,Academic Press,NewYork,NY(1992);Reid et al.,Plant Physio.,93:160-165(1990);Ye et al.,PlantJ.,1:175-183(1991))。
本领域技术人员可以参考一般的文献来获得在此讨论的已知技术或等价技术的详细描述。这些文献包括Current Protocols in Molecular Biology,Ausubel et al.,(eds.),John Wiley & Sons,NY(1989),以及9月的增刊(1998),Molecular Cloning,A Laboratory Manual,Sambrook et al.,2nd Ed.,Cold SpringHarbor Press,Cold Spring Harbor,NY(1989),Genome Analys:A LaboratoryManual1:Analyzing DNA,Birren et al.,Cold Spring Harbor Press,Cold SpringHarbor,NY(1997);Genome Analysis:A Laboratory Manual 2:Detecting Genes,Birren et al.,Cold Spring Harbor Press,Cold Spring Harbor,NY(1998);GenomeAnalysis:A Laboratory Manual 3:Cloning Systems,Birren et al.,Cold SpringHarbor Press,Cold Spring Harbor,NY(1999);Genome Analysis:A LaboratoryManual 4:Mapping Genomes,Birren et al.,Cold Spring Harbor Press,ColdSpring Harbor,NY(1999);Plant Molecular Biology:A Laboratory Manual,Clark,Springer-Verlag,Berlin,(1997);Methods in Plant Molecular Biology,Maliga et al.,Cold Spring Harbor Press,Cold Spring Harbor,NY(1995)。当然,这些文献可以被参考来构成或使用本发明的一个方面。应当理解,任何本发明的制剂可以是基本上纯的和/或生物学活性的和/或重组的。
已经大体上描述了本发明,通过参考如下实施例更加容易理解相同内容,除非特别指出,这些实施例被提供用于说明,而不是限定本发明。
实施例1:确定尿黑酸异戊二烯基转移酶序列
本实施例列举用于分析来自各种来源的尿黑酸异戊二烯基转移酶序列的方法,来确定尿黑酸异戊二烯基转移酶中含有的共同基序。
来自大豆、拟南芥、玉米和萼距花(部分地)尿黑酸异戊二烯基转移酶序列被克隆,并从EST数据库中的EST序列中测序。集胞蓝细菌属、点型念珠蓝细菌和鱼腥蓝细菌属序列得自Genbank。然后用多重比较软件ClustalX相互比较这些序列(表示为SEQ ID NO:1-8),这被描述在Thompson et al.,Nucleic Acids Research,24:4876-4882(1997)。蛋白质的多重比较采用Genedoc可视化和编辑,这被描述在Nicholas et al.,EMBNEW.NEWS,4:14(1997)。
采用前面提及的多重比较工具,四个基序(A-D)被确定,示于附图2a-2c中,其中基序A-D被列举。这些基序被表示为SEQ ID NO:12-15。萼距花的序列从基序D中被去除,因为该序列朝向3’端具有多个错误,会产生明显的移框误差。
采用Hidden Markov模型(HMM)来证明这些基序的特异性,该模型采用HMMER(版本2.2g)软件包(Eddy,Bioinformatics,14:755-763(1998))建立。HMM检索在含有来自不同植物品种的全长插入序列的cDNA序列数据库中进行。除了几个部分的尿黑酸异戊二烯基转移酶序列,这种检索确定两种新的尿黑酸异戊二烯基转移酶序列(SEQ ID NO:9-10)。所确定的这两条新的尿黑酸异戊二烯基转移酶序列来自韭和小麦。该检索还正确地确定完整的萼距花序列(SEQ ID NO:11)。采用前面提及的多重比较工具来产生第二种比较,如附图3a-3c所示。该比较包括了韭、小麦和全长的萼距花序列。基序I-IV(SEQ ID NO:39-42)被显示。
还采用各种基序序列检索从NCBI的Genbank下载的非冗余(non-redundant)的氨基酸数据库来检测特异性。全部四种基序确定三种存在于前述的非冗余的氨基酸数据库的尿黑酸异戊二烯基转移酶,如下:点型念珠蓝细菌、集胞蓝细菌属、拟南芥(Arabidopsis),基序II和IV也确定了未表征的拟南芥蛋白质的一些基因组变体。基序I和III在0.001或更小的E值下,仅确定已知的尿黑酸异戊二烯基转移酶。
实施例2:制备表达构建体
含有来自pCGN3223的napin表达盒的质粒(在美国专利US5,639,790描述,其全文在此被引入作为参考)被改进,使其更适合用于克隆含有多个限制性位点的大DNA片段,以可以将多个napin融合基因克隆到植物双元转化载体中。一个由自退火的寡核苷酸序列CGCGATTTAAATGGCGCGCCCTGCAGGCGGCCGCCTGCAGGGCGCGCCATTTAAA T(SEQ ID NO:16)组成的连接物(adapter)在用限制性核酸内切酶BssHII消化后,被连接到克隆载体pBC SK+(Stratagene)上来构建载体pCGN7765。质粒pCGN3223和pCGN7765用Not1消化并连接到一起。生成的载体pCGN7770含有具有来自pCGN3223的napin种子特异性表达盒的pCGN7765主链。
克隆表达盒pCGN7787基本包含与pCGN7770相同的调控元件,除了双CAMV35S启动子和多聚腺苷酸和转录终止区域替代pCGN7770的napin调控区域。
植物转化的双元载体pCGN5139从pCGN1558构建得到(McBride andSummerfelt,Plant Molecular Biology,14:269-276(1990))。pCGN1558的多接头替换为具有含有独特的限制性核酸内切酶位点AscI、PacI、XbaI、SwaI、BamHI和NotI的多接头的HindIII/Asp718片段。Asp718和HindIII限制性核酸内切酶位点被保留在pCGN5139中。
一系列双元载体被构建,使得可以快速将DNA序列克隆到含有转录起始区域(启动子)和转录终止区域的双元载体上。
通过将寡核苷酸5′-TCGAGGATCCGCGGCCGCAAGCTTCCTGCAGG-3′(SEQ ID NO:17)和5′-TCGACCTGCAGGAAGCTTGCGGCCGCGGATCC-3′(SEQ ID NO:18)连接到用SalIl/XhoI消化的pCGN7770上来构建质粒pCGN8618。用Asp718I消化,从pCGN8618切除含有napin启动子、接头和napin 3′区的片段;通过用Klenow片段添补5′突出端来使片段平头末端,然后连接到pCGN5139中,pCGN5139已经用Asp718I和HindIII消化并用Klenow片段添补5′突出端来使片段平头末端。质粒具有定向插入,使得napin启动子与平头的pCGN5139的Asp718I位点最近,而napin 3′与平头HindIII位点最接近,质粒进行序列分析来确定克隆连接的插入方向和完整性。生成的质粒命名为pCGN8622。
通过将寡核苷酸5′-TCGACCTGCAGGAAGCTTGCGGCCGCGGATCC-3′(SEQ ID NO:19)和5′-TCGAGGATCCGCGGCCGCAAGCTTCCTGCAGG-3′(SEQ ID NO:20)连接到用SalIl/XhoI消化的pCGN7770)上来构建质粒pCGN8619。用Asp7181消化,从pCGN8619切除含有napin启动子、接头和napin 3′区的片段;通过用Klenow片段添补5′突出端来使片段平头末端,然后连接到pCGN5139中,pCGN5139已经用Asp718I和HindIII消化并用Klenow片段添补5′突出端来使片段平头末端。质粒具有定向插入,使得napin启动子与平头的pCGN5139的Asp718I位点最近,而napin 3′与平头HindIII位点最接近,质粒进行序列分析来确定克隆连接的插入方向和完整性。生成的质粒命名为pCGN8623。
通过将寡核苷酸5′-TCGAGGATCCGCGGCCGCAAGCTTCCTGCAGGAGCT-3′(SEQ ID NO:21)和5′-CCTGCAGGAAGCTTGCGGCCGCGGATCC-3′(SEQ ID NO:22)连接到用SalI/SacI消化的pCGN7787上来构建质粒pCGNS620。用Asp718I完全消化和用NotI部分消化,从pCGN8620去除含有d35S启动子、接头和试验性3′区的片段;通过用Klenow片段添补5′突出端来使片段平头末端,然后连接到pCGN5139中,pCGN5139已经用Asp718I和HindIII消化并用Klenow片段添补5′突出端来使片段平头末端。质粒具有定向插入,使得d35S启动子与平头的pCGN5139的Asp718I位点最近,而tml3′与平头的HindIII位点最接近,质粒进行序列分析来确定克隆连接的插入方向和完整性。生成的质粒命名为pCGN8624。
通过将寡核苷酸5′-TCGACCTGCAGGAAGCTTGCGGCCGCGGATCCAGCT-3′(SEQ BD NO:23)和5′-GGATCCGCGGCCGCAAGCTTCCTGCAGG-3′(SEQ ID NO:24)连接到用SalI/SacI消化的pCGN7787上来构建质粒pCGNS620。用Asp718I完全消化和用NotI部分消化,从pCGN8620去除含有d35S启动子、接头和试验性3′区的片段.
通过用Klenow片段添补5′突出端来使片段平头末端,然后连接到pCGN5139中,pCGN5139已经用Asp718I和HindIII消化并用Klenow片段添补5′突出端来使片段平头末端。质粒具有定向插入,使得d35S启动子与平头的pCGN5139的Asp718I位点最近,而tml3′与平头的HindIII位点最接近,质粒进行序列分析来确定克隆连接的插入方向和完整性。生成的质粒命名为pCGN8625。
质粒构建体pCGN8640是对上述pCGN8624的改进。938bp的PstI片段从转座子Tn7分离得到,Tn7编码细菌壮观霉素和链霉素抗性(Fling et al.,Nucleic Acids Research,13(19):7095-7106(1985)),是大肠杆菌和农杆菌选择的决定区,用Pfu聚合酶来平头化末端。平头末端的片段被连接到pCGN8624,其已经用SpeI消化并用Pfu聚合酶平头末端。含有PstI片段的区域被测序来确定克隆连接的插入方向和完整性。
壮观霉素抗性标记如下被导入pCGN8622和pCGN8623中。如上所述,来自pCGN8640的7.7Kbp的片段被连接到来自pCGN8623或pCGN8622的10.9Kbp的AvrII-SnaBI片段上。得到的质粒分别是pCGN8641和pCGN8643。
通过将寡核苷酸5′-GATCACCTGCAGGAAGCTTGCGGCCGCGGATCCAATGCA-3′(SEQ ID NO:25)和5′TTGGATCCGCGGCCGCAAGCTTCCTGCAGGT-3′(SEQID NO:26)连接到BamHI-PstI消化的pCGN8640上来构建质粒pCGN8644。
合成的寡核苷酸被消化,用于聚合酶链式反应(PCR)来扩增各种核苷酸的编码序列以制备表达构建体,这些核酸编码SEQ ID NO:1-7、9-11、43-44、57-58和90的多肽。
各种编码SEQ ID NO:1-7、9-11、43-44、57-58和90的多肽的核酸的表编码序列都被扩增并克隆到TopoTA载体(Invitrogen)中。含有各种尿黑酸异戊二烯基转移酶序列的构建体用NotI和Sse8387I消化,并如上所述被克隆到turbobinary载体上。
合成的寡核苷酸被消化,用于聚合酶链式反应(PCR)来扩增SEQ ID NO:33,以制备表达构建体,寡核苷酸被提供在下表中
限制性位点 序列 SEQ ID NO:
5′NotI GGATCCGCGGCCGCACAATGGAGTCTCTGCTCTCTAGTTCT 37
3′SseI GGATCCTGCAGGTCACTTCAAAAAAGGTAACAGCAAGT 38
SEQ ID NO:33用示于上表的各种PCR引物扩增,并被克隆到TopoTA载体(Invitrogen)中。含有各种尿黑酸异戊二烯基转移酶序列的构建体用NotI和Sse8387I消化,并如上所述被克隆到turbobinary载体上.
SEQ ID NO:33以有义方向被克隆到pCGN8640中来制备植物转化构建体pCGN10800(附图4)。SEQ ID NO:33受增强的35S启动子调控。
SEQ ID NO:33还以反义方向被克隆到构建pCGN8641中来建立pCGN10801(附图5)。这种构建体提供来自napin启动子的SEQ ID NO:33的反义表达。
SEQ ID NO:33还以有义方向被克隆到载体pCGN8643来建立植物转化构建体pCGN10822(附图7)。这种构建体提供来自napin启动子的SEQ IDNO:33的有义表达。
SEQ ID NO:33还以反义方向被克隆到载体pCGN8644中来建立植物转化构建体pCGN10803(附图6)。这种构建体提供来自增强的35S启动子的SEQ ID NO:33的反义表达。
实施例3:植物转化
转基因的芸苔属植物可以通过如Radke et al.,Theor.Appl.Genet.,75:685-694(1988);Plant Cell Reports,11:499-505(1992)中描述农杆菌介导的转化来获得。转基因的拟南芥植物可以通过农杆菌介导的转化来获得,如被描述在Valverkens et al.,Proc.Nat.Acad.Sci.,85:5536-5540(1988),或被描述在Bent et al.,Science,265:1856-1860(1994),或 Bechtold et al.,C.R.Acad.Sci.Life Sciences,316:1194-1199(1993)。其他植物种类可以采用相关技术被类似地转化。
可选择地,如被描述在Klein et al.,Bio/Technology,10:286-291中的微粒轰击方法也可以被用于获得核酸转化的植物。
实施例4:确定其他尿黑酸异戊二烯基转移酶
为了确定其他尿黑酸异戊二烯基转移酶,通过序列同源性确定的基序被用于检索含有全长插入序列的cDNA序列数据库。首先将cDNA数据库翻译为6个部分(frame),然后采用根据基序建立的HMM模型进行HMN检索。所有HMM选中(hit)的序列通过针对非冗余的氨基酸数据库中进行blast检索来评注。所有基序都是灵敏的,并鉴定存在于数据库中的尿黑酸异戊二烯基转移酶。由此,发现了新的尿黑酸异戊二烯基转移酶。
实施例5:转基因植物分析
用构建体转化有义或反义表达尿黑酸异戊二烯基转移酶的拟南芥植物,通过高效液相层析(HPLC)来分析总生育酚和三烯生育酚水平的变化,以及特定的生育酚和三烯生育酚水平的变化(如,α、β、γ和δ-生育酚/三烯生育酚)。
如下制备叶子和种子提取物用于HPLC。对于种子提取物,10mg种子被加到无菌microfuge管中的1g微珠(Biospec)中,往管中加入500ul1%邻苯三酚(Sigma Chem)/乙醇。在小型Beadbeater(Biospec)“高”速摇晃混合物3min。提取物用0.2um滤器过滤到autosampler管中。然后过滤后的提取物被用于下文描述的HPLC分析。
叶子提取物通过混合30-50mg叶组织与1g微珠,在液氮中冷冻直到提取。对于提取,500ul溶于乙醇的1%邻苯三酚被加入到叶子/珠混合物中,在Beadbeater(Biospec)“高”速摇晃混合物1min。得到的混合物以14,000rpm离心4min,在进行HPLC分析前如上述被过滤。
在Zorbax硅HPLC柱(4.6mm×250mm)上进行HPLC,激发和发射光谱分别设定在290nm和336nm。溶剂A为己烷,溶剂B为甲基-t-丁基醚。注入体积为20ul,流速为1.5ml/min,跑柱时间为12min(40℃),使用下表:
时间 溶剂A 溶剂B
0min 90% 10%
10min 90% 10%
11min 25% 75%
12min 90% 10%
1%邻苯三酚/乙醇中的生育酚标准物也跑柱来用于比较(α-生育酚、γ-生育酚、β-生育酚、δ-生育酚和生育酚(母育酚)(都来自Matreya,State College,PA,或Calbiochem,La Jolla,CA.))。
采用Chemstation软件来计算α、β、δ、γ生育酚的标准曲线。成分x的吸收量为:x的吸收量=反应xxRFxx稀释倍数,其中反应x是峰值x的面积,RFx是成分x的反应因子(总量x/反应x),而稀释因子为500ul。ng/mg组织是通过:总ng成分/mg植物组织建立。
转基因拟南芥品种的种子提取物的HPLC分析结果提供在附图8中,该品种含有用于从napin启动子表达SEQ ID NO:33的pMON10822。
从napin启动子表达SEQ ID NO:33的拟南芥种子组织(pMON10822)的HPLC分析结果证明,种子中生育酚的水平升高了。总生育酚水平比未转化(野生型)拟南芥植物的总生育酚水平提高了50-60%(附图8)。
转基因拟南芥品系1387-1624的种子提取物的HPLC分析结果被提供在附图9中,这些品系含有用于从增强35S启动子反义表达SEQ ID NO:33的pMON10803。两个品系1393和1401表现为总体生育酚水平基本下降,证明HPT是参与生育酚合成的尿黑酸异戊二烯基转移酶。
获得了含有用于表达SEQ ID NO:5、9-11、43-44、57-58和90的构建体转基因拟南芥品系的种子提取物的HPLC分析结果。
获得了含有用于从增强的35S启动子表达SEQ ID NO:5、9-11、43-44、57-58和90的构建体转基因拟南芥品系的种子提取物的HPLC分析结果。
实施例6:尿黑酸异戊二烯基转移酶作为单一基因与HPPD及tyrA在大豆中表达
拟南芥尿黑酸异戊二烯基转移酶(ATPT2)(SEQ ID NO:33)被克隆到具有Arcelin 5表达盒的大豆双元载体上。该表达盒由Arcelin 5-启动子、多克隆位点、Arcelin 5 3′-非翻译序列按所描述的顺序组成。用于该构建体的载体构建和如下的构建采用标准的克隆技术,这些技术已经在本领域彻底建立并被描述在实验室手册中如(Sambrook et al.2001)。生成的用于大豆种子特异表达ATPT2的双元载体被命名为pMON36581(附图10)。类似地,Synechocystis尿黑酸异戊二烯基转移酶(slrl 736)(SEQ ID NO:29)与叶绿体目标肽(CTP1)融合,被克隆到Arcelin 5大豆种子特异表达盒中。生成的双元质粒被命名为pMON69933(附图11)。通过将HPPDAt基因和tyrAEh基因分别融合到叶绿体靶肽CTP2和CTP1上来,来构建用于种子特异性共表达拟南芥p-羟基苯基丙酮酸双加氧酶(HPPDAt)和草生欧文氏菌(Erwiniaherbicola)的双功能预苯酸脱氢酶(tyrAEh)(参见WO02/089561)的其他双元质粒。这些融合基因接着被克隆到由7Sα′-启动子、多克隆位点和E9 3′-非翻译区组成的大豆种子特异性表达盒的多克隆位点上。HPPDAt表达盒被克隆到tyrAEh表达盒的下游的双元载体中,形成了pMON69924(附图12)。
第四种质粒通过克隆slr1736的Arcelin 5表达盒(SEQ ID NO:29)、HPPDAt的下游、tyrAEh表达盒来构建,构成了pMON69943(附图13)。
各种这些双元载体被转化到大豆中。从含有这些构建体的植物收集的R1种子被用于分析生育酚含量和组成。对于构建体pMON36581和pMON69933,随机选择用于分析的种子。来自用pMON69924和pMON69943转化的植物的种子具有分离的黑色表型。这种表型与由于转基因HPPD和tyrA的表达尿黑酸含量升高相关。未显黑色的种子确实具有野生型的生育酚水平,不是转基因的。因此,显黑色的种子被选择用于分析用pMON69924或pMON69943转化的植物。为了研究HPT表达对在单基因载体或在多基因载体中的总生育酚沉积的影向,来自未转化的大豆的种子或者用pMON69924转化的种子分别作为对照。附图14总结了从这些试验中获得的生育酚数据。虽然ATPT2或slrl736的表达适度地提高了大豆中的总生育酚和三烯生育酚的水平,多基因载体中HPT表达的影响是更加明显的。附图14表明与pMON69924系相比,pMON69943中生育酚和三烯生育酚的沉积水平显著升高。这些数据表明HPT与tyrA,以及HPPD的组合能够真正地提高大豆中的生育酚生物合成。
采用目标基因(GOI)蛋白质特异性抗体进行Western分析,检测具有目标基因(GOI)表达盒的组织中的转基因表达。采用GOI序列特异性放射性标记探针进行Northern分析,检测转基因的mRNA水平。
实施例7:确定其他尿黑酸异戊二烯基转移酶序列
在对非冗余的氨基酸数据库的分析中,除了HPT序列还确定了基序II和IV(SEQ ID NO:40和42),两条与HPT相关的拟南芥序列基因组变体(SEQID NOs:61-62)。这些序列通过基因预测算法从基因组序列中insillico预测得到。进一步的生物信息学分析表明这些序列编码其他与HPT相关的尿黑酸异戊二烯基转移酶。两条序列(SEQ ID NOs:61-62)都被用于检索非冗余氨基酸数据库。BLAST检索结果表明这些序列与蓝细菌属(SEQ ID NOs:1-3)和拟南芥(SEQ ID NO:7)的HPT序列十分相关。
比较gi15229898(970aa)(SEQ ID NO:61)与gil0998133(441 aa)(SEQID NO:62),表明:
gi15229898(SEQ ID NO:61)的C末端的那一半与gi10998133(SEQ IDNO:62)重叠;
这两种蛋白质的C末端部分的最后40-50aa不一致;和
gi15229898的N末端也不与HPT(SEQ ID NO:1-7和9-11)序列对比。这些结果表明,Genbank中报道的编码序列的预测是矛盾的。
为了证实被预测的序列,从Genbank下载对应于该区域的拟南芥基因组的BAC序列(gi|124087421|gb|AC016795.6|ATAC016795,100835bp)。从该BAC克隆中预测编码序列,采用FGENESH(Solovyev V.V.(2001)Statisticalapproaches in Eukaryotic gene prediction:in Handbook of Statistical genetics(eds.Balding D.etal.),John Wiley & Sons,Ltd.,p.83-127)基因预测程序。FGENESH从该BAC克隆中预测出28种蛋白质。为了验证这28种FGENESH预测的蛋白质中的新尿黑酸异戊二烯基转移酶,所有28种被预测的蛋白质在非冗余的氨基酸数据库中进行blast检索。FGENESH预测的蛋白质No.25(402aa)(SEQ ID NO:45)与gi10998133(441aa)(SEQ ID NO:62)、gi15229898(970aa)(SEQ ID NO:61)和HPT(SEQ ID NO:1-7、9-11)C末端的那一半最相似。
为了提供功能性和转录证据和确认该基因的编码序列,对包含专有和公共序列的植物EST序列数据库进行检索。发现一些EST(SEQ ID NO:63-72)与该基因的N末端和C末端部分匹配。该新基因命名为拟南芥HPT2(SEQ IDNO:59)。HPT2(SEQ ID NO:57)序列明显区别于HPT1(SEQ ID NO:7)。
拟南芥HPT2(SEQ ID NO:57)也称作为生育酚合成酶(TS)。当前的数据表明TS过度表达导致总生育酚含量类似HPT1(SEQ ID NO:33)的相对于野生型的升高。但是,该酶具有不同的生物化学特征,由于TS的过度表达导致的δ生育酚的产量低于HPT1(SEQ ID NO:33)的过度表达。
在拟南芥HPT2序列(SEQ ID NO:45和57)中存在叶绿体转运蛋白,这采用ChloroP程序(Olof Emanuelssonl,Henrik Nielsenl,2,and Gunnar vonHeijnel ChloroP,a neural network-based method for predicting chloroplasttransit peptides and their cleavage sites.Protein Science:8:978-984,1999)证明。
除了SEQ ID NO:1、7和9-11(HPT),SEQ ID NO:57-58和90(HPT2)也被用于比较,参见附图24-25以及被分析的所得基序。基序V(SEQ ID NO:46)、VII(SEQ ID NO:48)和VIII(SEQ ID NO:49特异于HPT和HPT2序列。采用这些基序对非冗余氨基酸数据库进行AHMM检索,仅确定蓝绿藻(SEQ IDNO:1-3和43)、光合细菌(SEQ ID NO:44)和植物HPT(SEQ ID NO:7和61-62)。除了尿黑酸异戊二烯基转移酶,基序VII(SEQ ID NO:48)从细菌确定了远源相关ubiA异戊二烯基转移酶。但是基序VII对尿黑酸异戊二烯基转移酶的灵敏度更高。尿黑酸异戊二烯基转移酶具有较低的e-值,和较高的比较值(大于30)。HPT2序列区别于HPT和cyanobacterial HPT,这由附图26中的序列dendogram证明。
增加SEQ ID NO:43-44,用于与SEQ ID NO:1-4、6-7、9-11、57-58和91比较,参见附图33-34,得到的基序(SEQ ID NO:92-95,基序IV-VII)被分析。这些基序对尿黑酸异戊二烯基转移酶的特异性通过HMM检索证实。采用根据附图34所示基序IX-XII比较建立的HMM模型,对含有超过1.34M序列的非冗余数据库进行检索。限制检索的E值被设定为1.0。所有四种基序从cyanobacterial、光合细菌和拟南芥中仅确定到尿黑酸异戊二烯基转移酶。限定基序IX、X、XI和XII的上限E值分别为0.9、11E10-11、0.03、8E10-8。在基序IX和XI中,较小的基序产生较高的E值。
实施例8:野生型拟南芥HPT2基因以相对于种子特异性的和组成型启动子的有义和反义方向在拟南芥中转化和表达
用SalI和NotI酶从EST克隆CPR230005(pMON69960-附图15)上切取HPT2全长cDNA(SEQ ID NO:59),平头末端并以相对于pMON36525(图16)中的napin启动子以有义和反义方向克隆到napin启动子和napin 3′末端的平头末端的SalI位点上,分别生成重组双元载体pMON69963(附图17)和pMON69965(附图18)。采用标准的测序方法,用napin 5′-有义(5′-GTGGCTCGGCTTCACTTTTTAC-3′)(SEQ ID NO:50)和napin 3′-反义(5′-CCACACTCATATCACCGTGG-3′)(SEQ ID NO:51)引物测序来确定HPT2cDNA。用于产生pMON69963和pMON69965的HPT2cDNA还以相对于增强35S启动子的有义和反义方向,被克隆到pMON10098的增强35S启动子和E9-3′末端之间的平头末端的BglII和BamHI的位点上(附图19)来分别制备pMON69964(附图20)和pMON69966(附图21)。被合成来完整测序整条HPT2 cDNA的其他HPT2内在引物被列举在下表中:
用于确定HPT2 cDNA序列的引物的列表
引物 描述 序列
BXK169 HPT2/CPR23005/有义 5′-CAGTGCTGGATAGAATTGCCCGGTTCC-3′(SEQ ID NO:52)
BXK170 HPT2/CPR23005/有义 5-GAGATCTATCAGTGCAGTCTGCTTGG-3′(SEQ ID NO:53)
BXK171 BPT2/CPR23005/反义 5′-GGGACAAGCATTTTTATTGCAAG-3′(SEQ ID NO:54)
BXK72 BPT2/CPR23005/反义 5′-GCCAAGATCACATGTGCAGGAATC-3′(SEQ ID NO:55)
BXK173 HPT2/CPR23005/有义 5′-GTGGAGTGCACCTGTGGCGTTCATC-3′(SEQ ID NO:56)
植物双元载体pMON69963和pMON69965被用于拟南芥植物转化中来引导在胚中有义或反义表达。双元载体pMON69964和pMON69966被用于拟南芥植物转化中来在整个植物中有义或反义表达HPT2。双元载体通过电穿孔被转化到ABI系的农杆菌细胞中(Bio-Rad Electroprotocol Manual,Dower et al.,Nucleic Acids Res.,16:6127-6145(1988))。通过农杆菌介导的转化来获得转基因拟南芥植物,如Valverkens et al.,Proc.Nat.Acad.Sci.,85:5536-5540(1988),Bent et al.,Science,265:1856-1860(1994)和Bechtold etal.,CR.Acad.Sci.,Life Sciences,316:1194-1199(1993)中所描述。将被转化的T1种子撒到选择性平板上来筛选转基因植物,平板含有MS基础(basal)盐(4.3g/L)、Gamborg′a B-5,500X(2.0g/L)、蔗糖(10g/L)、MES(0.5g/L)、phytagar(8g/L)羧卡青霉素(250mg/L)、头孢噻肟(100mg/L)、植物保护液(2ml/L)和卡那霉素(60mg/L),然后在4℃下黑暗中春化2-4天。种子被转移到23℃下,进行16/8小时光照/黑暗循环5-10天,直到生成秧苗。一旦在卡那霉素抗性的秧苗上长出一组真叶,将秧苗移植到土壤中,并种植到成熟。通过卡那霉素选择获得的转基因系种植在两种不同光照条件下。一组转基因系种植在16h光照和8h黑暗中,而另一组种植在24h光照条件下,来研究不同光照对种子生育酚水平的影响。从转化体中收获的T2种子用于分析生育酚含量。来自种植在正常光照和强光照条件下的品系的种子总生育酚分析的结果显示在附图22和23中。在正常光照和强光照条件下HPT2的种子特异性过度表达导致总生育酚水平显著升高1.6和1.5倍(α=0.05;Tukey-KramerHSD)(SAS institute,2002,JPM version 5.0)。
在两种光照条件下,与对照相比,采用组成型启动子e35S表达HPT2导致种子总生育酚水平上升约20%。在具有增强的35S::HPT2反义构建体中生育酚水平下降最大,为20%。在具有受napin启动子起始的HPT2的拟南芥中,种子总生育酚水平显著升高,表明HPT2在生育酚生物合成中起重要作用。
采用GOI蛋白特异性抗体进行Western分析,检测具有目标基因(GOI)表达盒的组织中的转基因表达。采用GOI序列特异放射性标记探针进行Northern分析,检测转基因表达的mRNA水平。
实施例9:制备用于表达拟南芥HPT2和生育酚路径基因的植物双元载体
为了研究HPT2与路径中的其他关键酶的组合效果,制备含有种子特异性表达的羟基苯基丙酮酸双加氧酶(HPPD)、双功能预苯酸脱氢酶tyrA和HPT2的植物双元载体(pMON81028-附图27)。通过用Bsp120I和NotI酶从pMON81023(附图28)上切取pNapin::HPT2::Napin 3′表达盒,并连接到pMON36596(附图29)的NotI位点上来制备pMON81028。pMON36596含有pNapin::CTP2::HPPD::Napin 3′和pNapin::CTP1::TyrA::Napin 3′表达盒。采用实施例8中描述的方法将pMON81028转化到拟南芥植物中。
实施例10:制备细菌性表达拟南芥HPT2的构建体
含有HPT2全长cDNA的EST克隆CPR23005被用作模板来PCR扩增编码成熟形式的HPT2蛋白质的HPT2 cDNA片段。两组PCR产物生成,克隆在pET30a(+)载体(Novagen,Inc.)上(附图30)来制备HPT2蛋白,含有或不含his标记。引物组BXK174(5′-CACATATGGCATGTTCTCAGGTTGGTGCTGC-3′)(SEQ ID NO:84)和BXK176(5′-GCGTCGACCTAGAGGAAGGGGAATAACAG-3′)(SEQ ID NO:85)被用于将HPT2克隆到T7启动子后的pET30a(+)的NdeI和SalI位点上,生成无his标记的成熟HPT2。生成的重组载体命名为pMON69993(附图31)。引物组BXK175(5′-CAACCATGGCATGTTCTCAGGTTGGTGCTGC-3′)(SEQ ID NO:86)和BXK176(5′-GCGTCGACCTAGAGGAAGGGGAATAACAG-3′)(SEQ IDNO:87)被用于生成克隆在pET30a(+)的Ncol和SalI位点上的HPT2 PCR产物,来制备具有his标签的成熟HPT2。重组载体被命名为pMON69992(附图32)。pMON69993和pMON69992被用于制备细菌表达的HPT2,进行酶分析来确定其尿黑酸异戊二烯基转移酶活性和对香叶基香叶基焦磷酸、叶绿基焦磷酸和茄基焦磷酸底物的特异性。
                                  序列表
<110>孟山都技术公司(Monsanto Technology LLC)
     Valentin,Henry E
     Venkatesh,Tyamagondlu V
     Karunanandaa,Balasulojini
<120>尿黑酸异戊二烯基转移酶(″HPT″)核酸和多肽,以及它们的用途
<130>REN-02-052 MON-52933
<150>60/365,202
<151>2002-03-19
<160>95
<170>PatentIn version 3.1
<210>1
<211>322
<212>PRT
<213>点型念珠蓝细菌(Nostoc punctiforme)
<400>1
Met Ser Gln Ser Ser Gln Asn Ser Pro Leu Pro Arg Lys Pro Val Gln
1               5                   10                  15
Ser Tyr Phe His Trp Leu Tyr Ala Phe Trp Lys Phe Ser Arg Pro His
            20                  25                  30
Thr Ile Ile Gly Thr Ser Leu Ser Val Leu Ser Leu Tyr Leu Ile Ala
        35                  40                  45
Ile Ala Ile Ser Asn Asn Thr Ala Ser Leu Phe Thr Thr Pro Gly Ser
    50                  55                  60
Leu Ser Pro Leu Phe Gly Ala Trp Ile Ala Cys Leu Cys Gly Asn Val
65                  70                  75                  80
Tyr Ile Val Gly Leu Asn Gln Leu Glu Asp Val Asp Ile Asp Lys Ile
                85                  90                  95
Asn Lys Pro His Leu Pro Leu Ala Ser Gly Glu Phe Ser Gln Gln Thr
            100                 105                 110
Gly Gln Leu Ile Val Ala Ser Thr Gly Ile Leu Ala Leu Val Met Ala
        115                 120                 125
Trp Leu Thr Gly Pro Phe Leu Phe Gly Met Val Thr Ile Ser Leu Ala
    130                 135                 140
Ile Gly Thr Ala Tyr Ser Leu Pro Pro Ile Arg Leu Lys Gln Phe Pro
145                 150                  155                 160
Phe Trp Ala Ala Leu Cys Ile Phe Ser Val Arg Gly Thr Ile Val Asn
                165                  170                 175
Leu Gly Leu Tyr Leu His Tyr Ser Trp Ala Leu Lys Gln Ser Gln Thr
            180                 185                 190
Ile Pro Pro Val Val Trp Val Leu Thr Leu Phe Ile Leu Val Phe Thr
        195                 200                 205
Phe Ala Ile Ala Ile Phe Lys Asp Ile Pro Asp Ile Glu Gly Asp Arg
    210                 215                 220
Leu Tyr Asn Ile Thr Thr Phe Thr Ile Lys Leu Gly Ser Gln Ala Val
225                 230                 235                 240
Phe Asn Leu Ala Leu Trp Val Ile Thr Val Cys Tyr Leu Gly Ile Ile
                245                 250                 255
Leu Val Gly Val Leu Arg Ile Ala Ser Val Asn Pro Ile Phe Leu Ile
            260                 265                 270
Thr Ala His Leu Ala Leu Leu Val Trp Met Trp Trp Arg Ser Leu Ala
        275                 280                 285
Val Asp Leu Gln Asp Lys Ser Ala Ile Ala Gln Phe Tyr Gln Phe Ile
    290                 295                 300
Trp Lys Leu Phe Phe Ile Glu Tyr Leu Ile Phe Pro Ile Ala Cys Phe
305                 310                 315                 320
Leu Ala
<210>2
<211>318
<212>PRT
<213>鱼腥蓝细菌属(Anabaena sp.)
<400>2
Met Asn Gln Ser Ser Gln Asp Arg Pro Leu Arg Pro Lys Pro Leu Gln
1               5                   10                  15
Ser Ser Phe Gln Trp Leu Tyr Ala Phe Trp Lys Phe Ser Arg Pro His
            20                  25                  30
Thr Ile Ile Gly Thr Ser Leu Ser Val Leu Gly Leu Tyr Leu Ile Ser
        35                  40                  45
Ile Ala Val Ser Ser Thr Gly Phe Ala Leu Thr Gln Ile Asn Ser Val
    50                  55                  60
Leu Gly Ala Trp Leu Ala Cys Leu Cys Gly Asn Val Tyr Ile Val Gly
65                  70                  75                  80
Leu Asn Gln Leu Glu Asp Ile Glu Ile Asp Lys Val Asn Lys Pro His
                85                  90                  95
Leu Pro Leu Ala Ser Gly Glu Phe Ser Arg Lys Gln Gly Arg Ile Ile
            100                 105                 110
Val Ile Leu Thr Gly Ile Thr Ala Ile Val Leu Ala Trp Leu Asn Gly
        115                 120                 125
Pro Tyr Leu Phe Gly Met Val Ala Val Ser Leu Ala Ile Gly Thr Ala
    130                 135                 140
Tyr Ser Leu Pro Pro Ile Arg Leu Lys Gln Phe Pro Phe Trp Ala Ala
145                 150                 155                 160
Leu Cys Ile Phe Ser Val Arg Gly Thr Ile Val Asn Leu Gly Leu Tyr
                165                 170                 175
Leu His Phe Ser Trp Leu Leu Gln Asn Lys Gln Ser Ile Pro Leu Pro
            180                 185                 190
Val Trp Ile Leu Thr Val Phe Ile Leu Ile Phe Thr Phe Ala Ile Ala
        195                 200                 205
Ile Phe Lys Asp Ile Pro Asp Met Glu Gly Asp Arg Leu Tyr Asn Ile
    210                 215                 220
Thr Thr Leu Thr Ile Gln Leu Gly Pro Gln Ala Val Phe Asn Leu Ala
225                 230                 235                 240
Met Trp Val Leu Thr Val Cys Tyr Leu Gly Met Val Ile Ile Gly Val
                245                 250                 255
Leu Arg Leu Gly Thr Ile Asn Ser Val Phe Leu Val Val Thr His Leu
            260                 265                 270
Val Ile Leu Cys Trp Met Trp Met Gln Ser Leu Ala Val Asp Ile His
        275                 280                 285
Asp Lys Thr Ala Ile Ala Gln Phe Tyr Gln Phe Ile Trp Lys Leu Phe
    290                 295                 300
Phe Leu Glu Tyr Leu Met Phe Pro Ile Ala Cys Leu Leu Ala
305                 310                 315
<210>3
<211>308
<212>PRT
<213>集胞蓝细菌属(Synechocystis sp.)
<400>3
Met Ala Thr Ile Gln Ala Phe Trp Arg Phe Ser Arg Pro His Thr Ile
1               5                   10                  15
lle Gly Thr Thr Leu Ser Val Trp Ala Val Tyr Leu Leu Thr Ile Leu
            20                  25                  30
Gly Asp Gly Asn Ser Val Asn Ser Pro Ala Ser Leu Asp Leu Val Phe
        35                  40                  45
Gly Ala Trp Leu Ala Cys Leu Leu Gly Asn Val Tyr Ile Val Gly Leu
    50                  55                  60
Asn Gln Leu Trp Asp Val Asp Ile Asp Arg Ile Asn Lys Pro Asn Leu
65                  70                  75                  80
Pro Leu Ala Asn Gly Asp Phe Ser Ile Ala Gln Gly Arg Trp Ile Val
                85                  90                  95
Gly Leu Cys Gly Val Ala Ser Leu Ala Ile Ala Trp Gly Leu Gly Leu
            100                 105                 110
Trp Leu Gly Leu Thr Val Gly Ile Ser Leu Ile Ile Gly Thr Ala Tyr
        115                 120                 125
Ser Val Pro Pro Val Arg Leu Lys Arg Phe Ser Leu Leu Ala Ala Leu
    130                 135                 140
Cys Ile Leu Thr Val Arg Gly Ile Val Val Asn Leu Gly Leu Phe Leu
145                 150                 155                 160
Phe Phe Arg Ile Gly Leu Gly Tyr Pro Pro Thr Leu Ile Thr Pro Ile
                165                 170                 175
Trp Val Leu Thr Leu Phe Ile Leu Val Phe Thr Val Ala Ile Ala Ile
            180                 185                 190
Phe Lys Asp Val Pro Asp Met Glu Gly Asp Arg Gln Phe Lys Ile Gln
        195                 200                 205
Thr Leu Thr Leu Gln Ile Gly Lys Gln Asn Val Phe Arg Gly Thr Leu
    210                 215                 220
Ile Leu Leu Thr Gly Cys Tyr Leu Ala Met Ala Ile Trp Gly Leu Trp
225                 230                 235                 240
Ala Ala Met Pro Leu Asn Thr Ala Phe Leu Ile Val Ser His Leu Cys
                245                 250                 255
Leu Leu Ala Leu Leu Trp Trp Arg Ser Arg Asp Val His Leu Glu Ser
            260                 265                 270
Lys Thr Glu Ile Ala Ser Phe Tyr Gln Phe Ile Trp Lys Leu Phe Phe
        275                 280                 285
Leu Glu Tyr Leu Leu Tyr Pro Leu Ala Leu Trp Leu Pro Asn Phe Ser
    290                 295                 300
Asn Thr Ile Phe
305
<210>4
<211>399
<212>PRT
<213>玉米(Zea mays)
<400>4
Met Asp Ala Leu Arg Leu Arg Pro Ser Leu Leu Pro Val Arg Pro Gly
1               5                   10                  15
Ala Ala Arg Pro Arg Asp His Phe Leu Pro Pro Cys Cys Ser Ile Gln
            20                  25                  30
Arg Asn Gly Glu Gly Arg Ile Cys Phe Ser Ser Gln Arg Thr Gln Gly
        35                  40                  45
Pro Thr Leu His His His Gln Lys Phe Phe Glu Trp Lys Ser Ser Tyr
    50                  55                  60
Cys Arg Ile Ser His Arg Ser Leu Asn Thr Ser Val Asn Ala Ser Gly
65                  70                  75                  80
Gln Gln Leu Gln Ser Glu Pro Glu Thr His Asp Ser Thr Thr Ile Trp
                85                  90                  95
Arg Ala Ile Ser Ser Ser Leu Asp Ala Phe Tyr Arg Phe Ser Arg Pro
            100                 105                 110
His Thr Val Ile Gly Thr Ala Leu Ser Ile Val Ser Val Ser Leu Leu
        115                 120                 125
Ala Val Gln Ser Leu Ser Asp Ile Ser Pro Leu Phe Leu Thr Gly Leu
    130                 135                 140
Leu Glu Ala Val Val Ala Ala Leu Phe Met Asn Ile Tyr Ile Val Gly
145                 150                 155                 160
Leu Asn Gln Leu Phe Asp Ile Glu Ile Asp Lys Val Asn Lys Pro Thr
                165                 170                 175
Leu Pro Leu Ala Ser Gly Glu Tyr Thr Leu Ala Thr Gly Val Ala Ile
            180                 185                 190
Val Ser Val Phe Ala Ala Met Ser Phe Gly Leu Gly Trp Ala Val Gly
        195                 200                 205
Ser Gln Pro Leu Phe Trp Ala Leu Phe Ile Ser Phe Val Leu Gly Thr
    210                 215                 220
Ala Tyr Ser Ile Asn Leu Pro Tyr Leu Arg Trp Lys Arg Phe Ala Val
225                 230                 235                 240
Val Ala Ala Leu Cys Ile Leu Ala Val Arg Ala Val Ile Val Gln Leu
                245                 250                 255
Ala Phe Phe Leu His Ile Gln Thr Phe Val Phe Arg Arg Pro Ala Val
            260                 265                 270
Phe Ser Arg Pro Leu Leu Phe Ala Thr Gly Phe Met Thr Phe Phe Ser
        275                 280                 285
Val Val Ile Ala Leu Phe Lys Asp Ile Pro Asp Ile Glu Gly Asp Arg
    290                 295                 300
Ile Phe Gly Ile Arg Ser Phe Ser Val Arg Leu Gly Gln Lys Lys Val
305                 310                 315                 320
Phe Trp Ile Cys Val Gly Leu Leu Glu Met Ala Tyr Ser Val Ala Ile
                325                 330                 335
Leu Met Gly Ala Thr Ser Ser Cys Leu Trp Ser Lys Thr Ala Thr Ile
            340                 345                 350
Ala Gly His Ser Ile Leu Ala Ala Ile Leu Trp Ser Cys Ala Arg Ser
        355                 360                 365
Val Asp Leu Thr Ser Lys Ala Ala Ile Thr Ser Phe Tyr Met Phe Ile
    370                 375                 380
Trp Lys Leu Phe Tyr Ala Glu Tyr Leu Leu Ile Pro Leu Val Arg
385                 390                 395
<210>5
<211>411
<212>PRT
<213>大豆(ppt2)
<400>5
Met Asp Ser Leu Leu Leu Arg Ser Phe Pro Asn Ile Asn Asn Ala Ser
1               5                   10                  15
Ser Leu Thr Thr Thr Gly Ala Asn Phe Ser Arg Thr Lys Ser Phe Ala
            20                  25                  30
Asn Ile Tyr His Ala Ser Set Tyr Val Pro Asn Ala Ser Trp His hsn
        35                  40                  45
Arg Lys Ile Gln Lys Glu Tyr Asn Phe Leu Arg Phe Arg Trp Pro Ser
    50                  55                  60
Leu Asn His His Tyr Lys Gly Ile Glu Gly Ala Cys Thr Cys Lys Lys
65                  70                  75                  80
Cys Asn Ile Lys Phe Val Val Lys Ala Thr Ser Glu Lys Ser Leu Glu
                85                  90                  95
Ser Glu Pro Gln Ala Phe Asp Pro Lys Ser Ile Leu Asp Ser Val Lys
            100                 105                 110
Asn Ser Leu Asp Ala Phe Tyr Arg Phe Ser Arg Pro His Thr Val Ile
        115                 120                 125
Gly Thr Ala Leu Ser Ile Ile Ser Val Ser Leu Leu Ala Val Glu Lys
    130                 135                 140
Ile Ser Asp Ile Ser Pro Leu Phe Phe Thr Gly Val Leu Glu Ala Val
145                 150                 155                 160
Val Ala Ala Leu Phe Met Asn Ile Tyr Ile Val Gly Leu Asn Gln Leu
                165                 170                 175
Ser Asp Val Glu Ile Asp Lys Ile Asn Lys Pro Tyr Leu Pro Leu Ala
            180                 185                 190
Ser Gly Glu Tyr Ser Phe Glu Thr Gly Val Thr Ile Val Ala Ser Phe
        195                 200                 205
Ser Ile Leu Ser Phe Trp Leu Gly Trp Val Val Gly Ser Trp Pro Leu
    210                 215                 220
Phe Trp Ala Leu Phe Val Ser Phe Val Leu Gly Thr Ala Tyr Ser Ile
225                 230                 235                 240
Asn Val Pro Leu Leu Arg Trp Lys Arg Phe Ala Val Leu Ala Ala Met
                245                 250                 255
Cys Ile Leu Ala Val Arg Ala Val Ile Val Gln Leu Ala Phe Phe Leu
            260                 265                 270
His Met Gln Thr His Val Tyr Lys Arg Pro Pro Val Phe Ser Arg Pro
        275                 280                 285
Leu Ile Phe Ala Thr Ala Phe Met Ser Phe Phe Ser Val Val Ile Ala
    290                 295                 300
Leu Phe Lys Asp Ile Pro Asp Ile Glu Gly Asp Lys Val Phe Gly Ile
305                 310                 315                 320
Gln Ser Phe Ser Val Arg Leu Gly Gln Lys Pro Val Phe Trp Thr Cys
                325                 330                 335
Val Thr Leu Leu Glu Ile Ala Tyr Gly Val Ala Leu Leu Val Gly Ala
            340                 345                 350
Ala Ser Pro Cys Leu Trp Ser Lys Ile Phe Thr Gly Leu Gly His Ala
        355                 360                 365
Val Leu Ala Ser Ile Leu Trp Phe His Ala Lys Ser Val Asp Leu Lys
    370                 375                 380
Ser Lys Ala Ser Ile Thr Ser Phe Tyr Met Phe Ile Trp Lys Leu Phe
385                 390                 395                 400
Tyr Ala Glu Tyr Leu Leu Ile Pro Phe Val Arg
                405                 410
<210>6
<211>395
<212>PRT
<213>大豆(ppt1)
<400>6
Met Asp Ser Met Leu Leu Arg Ser Phe Pro Asn Ile Asn Asn Ala Ser
1               5                   10                  15
Ser Leu Ala Thr Thr Gly Ser Tyr Leu Pro Asn Ala Ser Trp His Asn
            20                  25                  30
Arg Lys Ile Gln Lys Glu Tyr Asn Phe Leu Arg Phe Arg Trp Pro Ser
        35                  40                  45
Leu Asn His His Tyr Lys Ser Ile Glu Gly Gly Cys Thr Cys Lys Lys
    50                  55                  60
Cys Asn Ile Lys Phe Val Val Lys Ala Thr Ser Glu Lys Ser Phe Glu
65                  70                  75                  80
Ser Glu Pro Gln Ala Phe Asp Pro Lys Ser Ile Leu Asp Ser Val Lys
                85                  90                  95
Asn Ser Leu Asp Ala Phe Tyr Arg Phe Ser Arg Pro His Thr Val Ile
            100                 105                 110
Gly Thr Ala Leu Ser Ile Ile Ser Val Ser Leu Leu Ala Val Glu Lys
        115                 120                 125
Ile Ser Asp Ile Ser Pro Leu Phe Phe Thr Gly Val Leu Glu Ala Val
    130                 135                 140
Val Ala Ala Leu Phe Met Asn Ile Tyr Ile Val Gly Leu Asn Gln Leu
145                 150                 155                 160
Ser Asp Val Glu Ile Asp Lys Ile Asn Lys Pro Tyr Leu Pro Leu Ala
                165                 170                 175
Ser Gly Glu Tyr Ser Phe Glu Thr Gly Val Thr Ile Val Ala Ser Phe
            180                 185                 190
Ser Ile Leu Ser Phe Trp Leu Gly Trp Val Val Gly Ser Trp Pro Leu
        195                 200                 205
Phe Trp Ala Leu Phe Val Ser Phe Val Leu Gly Thr Ala Tyr Ser Ile
    210                 215                 220
Asn Val Pro Leu Leu Arg Trp Lys Arg Phe Ala Val Leu Ala Ala Met
225                 230                 235                 240
Cys Ile Leu Ala Val Arg Ala Val Ile Val Gln Leu Ala Phe Phe Leu
                245                 250                 255
His Ile Gln Thr His Val Tyr Lys Arg Pro Pro Val Phe Ser Arg Ser
            260                 265                 270
Leu Ile Phe Ala Thr Ala Phe Met Ser Phe Phe Ser Val Val Ile Ala
        275                 280                 285
Leu Phe Lys Asp Ile Pro Asp Ile Glu Gly Asp Lys Val Phe Gly Ile
    290                 295                 300
Gln Ser Phe Ser Val Arg Leu Gly Gln Lys Pro Val Phe Trp Thr Cys
305                 310                 315                 320
Val Ile Leu Leu Glu Ile Ala Tyr Gly Val Ala Leu Leu Val Gly Ala
                325                 330                 335
Ala Ser Pro Cys Leu Trp Ser Lys Ile Val Thr Gly Leu Gly His Ala
            340                 345                 350
Val Leu Ala Ser Ile Leu Trp Phe His Ala Lys Ser Val Asp Leu Lys
        355                 360                 365
Ser Lys Ala Ser Ile Thr Ser Phe Tyr Met Phe Ile Trp Lys Leu Phe
    370                 375                 380
Tyr Ala Glu Tyr Leu Leu Ile Pro Phe Val Arg
385                 390                 395
<210>7
<211>393
<212>PRT
<213>拟南芥(Arabidopsis thaliana)
<400>7
Met Glu Ser Leu Leu Ser Ser Ser Ser Leu Val Ser Ala Ala Gly Gly
1                5                  10                  15
Phe Cys Trp Lys Lys Gln Asn Leu Lys Leu His Ser Leu Ser Glu Ile
            20                  25                  30
Arg Val Leu Arg Cys Asp Ser Ser Lys Val Val Ala Lys Pro Lys Phe
        35                  40                  45
Arg Asn Asn Leu Val Arg Pro Asp Gly Gln Gly Ser Ser Leu Leu Leu
    50                  55                  60
Tyr Pro Lys His Lys Ser Arg Phe Arg Val Asn Ala Thr Ala Gly Gln
65                  70                  75                  80
Pro Glu Ala Phe Asp Ser Asn Ser Lys Gln Lys Ser Phe Arg Asp Ser
                85                  90                  95
Leu Asp Ala Phe Tyr Arg Phe Ser Arg Pro His Thr Val Ile Gly Thr
            100                 105                 110
Val Leu Ser Ile Leu Ser Val Ser Phe Leu Ala Val Glu Lys Val Ser
        115                 120                 125
Asp Ile Ser Pro Leu Leu Phe Thr Gly Ile Leu Glu Ala Val Val Ala
    130                 135                 140
Ala Leu Met Met Asn Ile Tyr Ile Val Gly Leu Asn Gln Leu Ser Asp
145                 150                 155                 160
Val Glu Ile Asp Lys Val Asn Lys Pro Tyr Leu Pro Leu Ala Ser Gly
                165                 170                 175
Glu Tyr Ser Val Asn Thr Gly Ile Ala Ile Val Ala Ser Phe Ser Ile
            180                 185                 190
Met Ser Phe Trp Leu Gly Trp Ile Val Gly Ser Trp Pro Leu Phe Trp
        195                 200                 205
Ala Leu Phe Val Ser Phe Met Leu Gly Thr Ala Tyr Ser Ile Asn Leu
    210                 215                  220
Pro Leu Leu Arg Trp Lys Arg Phe Ala Leu Val Ala Ala Met Cys Ile
225                 230                 235                 240
Leu Ala Val Arg Ala Ile Ile Val Gln Ile Ala Phe Tyr Leu His Ile
                245                 250                 255
Gln Thr His Val Phe Gly Arg Pro Ile Leu Phe Thr Arg Pro Leu Ile
            260                 265                 270
Phe Ala Thr Ala Phe Met Ser Phe Phe Ser Val Val Ile Ala Leu Phe
        275                 280                 285
Lys Asp Ile Pro Asp Ile Glu Gly Asp Lys Ile Phe Gly Ile Arg Ser
    290                 295                 300
Phe Ser Val Thr Leu Gly Gln Lys Arg Val Phe Trp Thr Cys Val Thr
305                 310                 315                 320
Leu Leu Gln Met Ala Tyr Ala Val Ala Ile Leu Val Gly Ala Thr Ser
                325                 330                 335
Pro Phe Ile Trp Ser Lys Val Ile Ser Val Val Gly His Val Ile Leu
            340                 345                 350
Ala Thr Thr Leu Trp Ala Arg Ala Lys Ser Val Asp Leu Ser Ser Lys
        355                 360                 365
Thr Glu Ile Thr Ser Cys Tyr Met Phe Ile Trp Lys Leu Phe Tyr Ala
    370                 375                 380
Glu Tyr Leu Leu Leu Pro Phe Leu Lys
385                 390
<210>8
<211>361
<212>PRT
<213>萼距花(Cuphea pulcherrima)
<400>8
Met Arg Met Glu Ser Leu Leu Leu Asn Ser Phe Ser Pro Ser Pro Ala
1               5                   10                  15
Gly Gly Lys Ile Cys Arg Ala Asp Thr Tyr Lys Lys Ala Tyr Phe Ala
            20                  25                  30
Thr Ala Arg Cys Asn Thr Leu Asn Ser Leu Asn Lys Asn Thr Gly Glu
        35                  40                  45
Tyr His Leu Ser Arg Thr Arg Gln Arg Phe Thr Phe His Gln Asn Gly
    50                  55                  60
His Arg Thr Tyr Leu Val Lys Ala Val Ser Gly Gln Ser Leu Glu Ser
65                  70                  75                  80
Glu Pro Glu Ser Tyr Pro Asn Asn Arg Trp Asp Tyr Val Lys Ser Ala
                85                  90                  95
Ala Asp Ala Phe Tyr Arg Phe Ser Arg Pro His Thr Ile Ile Gly Thr
            100                 105                  110
Ala Leu Ser Ile Val Ser Val Ser Leu Leu Ala Val Glu Lys Leu Pro
        115                 120                 125
Glu Leu Asn Ser Met Phe Phe Thr Gly Leu Leu Glu Val Ile Leu Ala
    130                 135                 140
Ala Leu Phe Met Asn Ile Tyr Ile Val Gly Leu Asn Gln Leu Ser Asp
145                 150                 155                 160
Ile Asp Ile Asp Lys Val Asn Lys Pro Tyr Leu Pro Leu Ala Ser Gly
                165                 170                 175
Glu Phe Ser Val Gly Thr Gly Val Thr Ile Val Thr Ser Phe Leu Ile
            180                 185                 190
Met Ser Phe Trp Leu Gly Trp Val Val Gly Ser Trp Pro Leu Phe Trp
        195                 200                 205
Ala Leu Phe Ile Ser Phe Val Leu Gly Thr Ala Tyr Ser Ile Asp Met
    210                 215                 220
Pro Met Leu Arg Trp Lys Arg Ser Ala Val Val Ala Ala Leu Cys Ile
225                 230                 235                 240
Leu Ala Val Arg Ala Val Ile Val Gln Ile Ala Phe Phe Leu His Met
                245                 250                 255
Gln Met His Val Tyr Gly Arg Ala Ala Ala Leu Ser Arg Pro Val Ile
            260                 265                 270
Phe Ala Thr Gly Phe Met Ser Phe Phe Ser Ile Val Ile Ala Leu Phe
        275                 280                 285
Lys Asp Ile Pro Asp Ile Glu Gly Asp Lys Ile Phe Gly Ile Arg Ser
    290                 295                 300
Phe Thr Val Arg Leu Gly Gln Glu Arg Val Phe Trp Ile Cys Ile Ser
305                 310                 315                 320
Leu Leu Glu Met Ala Tyr Ala Val Ala Leu Trp Val Leu Arg Ala Arg
                325                 330                 335
Gly Arg Lys Lys His Ala Asp Gly Val Ser Ala Ser Glu Phe Phe Leu
            340                 345                 350
Ser Ile Ser Gly Gly Arg Lys Asn Leu
        355                 360
<210>9
<211>395
<212>PRT
<213>韭葱(Allium porrum)
<400>9
Met Leu Ser Met Asp Ser Leu Leu Thr Lys Pro Val Val Ile Pro Leu
1               5                   10                  15
Pro Ser Pro Val Cys Ser Leu Pro Ile Leu Arg Gly Ser Ser Ala Pro
            20                  25                  30
Gly Gln Tyr Ser Cys Arg Asn Tyr Asn Pro Ile Arg Ile Gln Arg Cys
        35                  40                  45
Leu Val Asn Tyr Glu His Val Lys Pro Arg Phe Thr Thr Cys Ser Arg
    50                  55                  60
Ser Gln Lys Leu Gly His Val Lys Ala Thr Ser Glu His Ser Leu Glu
65                  70                  75                  80
Ser Gly Ser Glu Gly Tyr Thr Pro Arg Ser Ile Trp Glu Ala Val Leu
                85                  90                  95
Ala Ser Leu Asn Val Leu Tyr Lys Phe Ser Arg Pro His Thr Ile Ile
            100                 105                 110
Gly Thr Ala Met Gly Ile Met Ser Val Ser Leu Leu Val Val Glu Ser
        115                 120                 125
Leu Ser Asp Ile Ser Pro Leu Phe Phe Val Gly Leu Leu Glu Ala Val
    130                 135                 140
Val Ala Ala Leu Phe Met Asn Val Tyr Ile Val Gly Leu Asn Gln Leu
145                 150                 155                 160
Phe Asp Ile Glu Ile Asp Lys Val Asn Lys Pro Asp Leu Pro Leu Ala
                165                 170                 175
Ser Gly Glu Tyr Ser Pro Arg Ala Gly Thr Ala Ile Val Ile Ala Ser
            180                 185                 190
Ala Ile Met Ser Phe Gly Ile Gly Trp Leu Val Gly Ser Trp Pro Leu
        195                 200                 205
Phe Trp Ala Leu Phe Ile Ser Phe Val Leu Gly Thr Ala Tyr Ser Ile
    210                 215                 220
Asn Leu Pro Phe Leu Arg Trp Lys Arg Ser Ala Val Val Ala Ala Ile
225                 230                 235                 240
Cys Ile Leu Ala Val Arg Ala Val Ile Val Gln Leu Ala Phe Phe Leu
                245                 250                 255
His Ile Gln Ser Phe Val Phe Lys Arg Pro Ala Ser Phe Thr Arg Pro
            260                 265                 270
Leu Ile Phe Ala Thr Ala Phe Met Ser Phe Phe Ser Val Val Ile Ala
        275                 280                 285
Leu Phe Lys Asp Ile Pro Asp Ile Asp Gly Asp Lys Ile Phe Gly Ile
     290                 295                 300
His Ser Phe Ser Val Arg Leu Gly Gln Glu Arg Val Phe Trp Ile Cys
 305                 310                 315                 320
Ile Tyr Leu Leu Glu Met Ala Tyr Thr Val Val Met Val Val Gly Ala
                325                 330                 335
Thr Ser Ser Cys Leu Trp Ser Lys Cys Leu Thr Val Ile Gly His Ala
            340                 345                 350
Ile Leu Gly Ser Leu Leu Trp Asn Arg Ala Arg Ser His Gly Pro Met
        355                 360                 365
Thr Lys Thr Thr Ile Thr Ser Phe Tyr Met Phe Val Trp Lys Leu Phe
    370                 375                 380
Tyr Ala Glu Tyr Leu Leu Ile Pro Phe Val Arg
385                 390                 395
<210>10
<211>400
<212>PRT
<213>小麦(Triticum sp.)
<400>10
Met Asp Ser Leu Arg Leu Arg Pro Ser Ser Leu Arg Ser Ala Pro Gly
1               5                   10                  15
Ala Ala Ala Ala Arg Arg Arg Asp His Ile Leu Pro Ser Phe Cys Ser
            20                  25                  30
Ile Gln Arg Asn Gly Lys Gly Arg Val Thr Leu Ser Ile Gln Ala Ser
        35                  40                  45
Lys Gly Pro Thr Ile Asn His Cys Lys Lys Phe Leu Asp Trp Lys Tyr
    50                  55                  60
Ser Asn His Arg Ile Ser His Gln Ser Ile Asn Thr Ser Ala Lys Ala
65                  70                  75                  80
Gly Gln Ser Leu Gln Pro Glu Thr Glu Ala His Asp Pro Ala Ser Phe
                85                  90                  95
Trp Lys Pro Ile Ser Ser Ser Leu Asp Ala Phe Tyr Arg Phe Ser Arg
            100                 105                 110
Pro His Thr Ile Ile Gly Thr Ala Leu Ser Ile Val Ser Val Ser Leu
        115                 120                 125
Leu Ala Val Glu Ser Leu Ser Asp Ile Ser Pro Leu Phe Leu Thr Gly
    130                 135                 140
Leu Leu Glu Ala Val Val Ala Ala Leu Phe Met Asn Ile Tyr Ile Val
145                 150                 155                 160
Gly Leu Asn Gln Leu Phe Asp Ile Glu Ile Asp Lys Val Asn Lys Pro
                165                 170                 175
Thr Leu Pro Leu Ala Ser Gly Glu Tyr Ser Pro Ala Thr Gly Val Ala
            180                 185                 190
Ile Val Ser Val Phe Ala Ala Met Ser Phe Gly Leu Gly Trp Val Val
        195                 200                 205
Gly Ser Pro Pro Leu Phe Trp Ala Leu Phe Ile Ser Phe Val Leu Gly
    210                 215                 220
Thr Ala Tyr Ser Val Asn Leu Pro Tyr Phe Arg Trp Lys Arg Ser Ala
225                 230                 235                 240
Val Val Ala Ala Leu Cys Ile Leu Ala Val Arg Ala Val Ile Val Gln
                245                 250                 255
Leu Ala Phe Phe Leu His Ile Gln Thr Phe Val Phe Arg Arg Pro Ala
            260                 265                 270
Val Phe Ser Lys Pro Leu Ile Phe Ala Thr Ala Phe Met Thr Phe Phe
        275                 280                 285
Ser Val Val Ile Ala Leu Phe Lys Asp Ile Pro Asp Ile Glu Gly Asp
    290                 295                 300
Arg Ile Phe Gly Ile Gln Ser Phe Ser Val Arg Leu Gly Gln Ser Lys
305                 310                 315                 320
Val Phe Trp Thr Cys Val Gly Leu Leu Glu Val Ala Tyr Gly Val Ala
                325                 330                 335
Ile Leu Met Gly Val Thr Ser Ser Ser Leu Trp Ser Lys Ser Leu Thr
            340                 345                 350
Val Val Gly His Ala Ile Leu Ala Ser Ile Leu Trp Ser Ser Ala Arg
        355                 360                 365
Ser Ile Asp Leu Thr Ser Lys Ala Ala Ile Thr Ser Phe Tyr Met Leu
    370                 375                 380
Ile Trp Arg Leu Phe Tyr Ala Glu Tyr Leu Leu Ile Pro Leu Val Arg
385                 390                 395                 400
<210>11
<211>393
<212>PRT
<213>萼距花(Cuphea pulcherrima)
<400>11
Met Arg Met Glu Ser Leu Leu Leu Asn Ser Phe Ser Pro Ser Pro Ala
1               5                   10                  15
Gly Gly Lys Ile Cys Arg Ala Asp Thr Tyr Lys Lys Ala Tyr Phe Ala
            20                  25                  30
Thr Ala Arg Cys Asn Thr Leu Asn Ser Leu Asn Lys Asn Thr Gly Glu
        35                  40                  45
Tyr His Leu Ser Arg Thr Arg Gln Arg Phe Thr Phe His Gln Asn Gly
    50                  55                  60
His Arg Thr Tyr Leu Val Lys Ala Val Ser Gly Gln Ser Leu Glu Ser
65                  70                  75                  80
Glu Pro Glu Ser Tyr Pro Asn Asn Arg Trp Asp Tyr Val Lys Ser Ala
                85                  90                  95
Ala Asp Ala Phe Tyr Arg Phe Ser Arg Pro His Thr Ile Ile Gly Thr
            100                 105                 110
Ala Leu Ser Ile Val Ser Val Ser Leu Leu Ala Val Glu Lys Leu Pro
        115                 120                 125
Glu Leu Asn Ser Met Phe Phe Thr Gly Leu Leu Glu Val Ile Leu Ala
    130                 135                 140
Ala Leu Phe Met Asn Ile Tyr Ile Val Gly Leu Asn Gln Leu Ser Asp
145                 150                 155                 160
Ile Asp Ile Asp Lys Val Asn Lys Pro Tyr Leu Pro Leu Ala Ser Gly
                165                 170                 175
Glu Phe Ser Val Gly Thr Gly Val Thr Ile Val Thr Ser Phe Leu Ile
            180                 185                 190
Met Ser Phe Trp Leu Gly Trp Val Val Gly Ser Trp Pro Leu Phe Trp
        195                 200                 205
Ala Leu Phe Ile Ser Phe Val Leu Gly Thr Ala Tyr Ser Ile Asp Met
    210                 215                 220
Pro Met Leu Arg Trp Lys Arg Ser Ala Val Val Ala Ala Leu Cys Ile
225                 230                 235                 240
Leu Ala Val Arg Ala Val Ile Val Gln Ile Ala Phe Phe Leu His Met
                245                 250                 255
Gln Met His Val Tyr Gly Arg Ala Ala Ala Leu Ser Arg Pro Val Ile
            260                 265                 270
Phe Ala Thr Gly Phe Met Ser Phe Phe Ser Ile Val Ile Ala Leu Phe
        275                 280                 285
Lys Asp Ile Pro Asp Ile Glu Gly Asp Lys Ile Phe Gly Ile Arg Ser
    290                 295                 300
Phe Thr Val Arg Leu Gly Gln Glu Arg Val Phe Trp Ile Cys Ile Ser
305                 310                 315                 320
Leu Leu Glu Met Ala Tyr Ala Val Ala Ile Leu Val Gly Ser Thr Ser
                325                 330                 335
Pro Tyr Leu Trp Ser Lys Val Ile Thr Val Ser Gly His Val Val Leu
            340                 345                 350
Ala Ser Ile Leu Trp Gly Arg Ala Lys Ser Ile Asp Phe Lys Ser Lys
        355                 360                 365
Ala Ala Leu Thr Ser Phe Tyr Met Phe Ile Trp Lys Leu Phe Tyr Ala
    370                 375                 380
Glu Tyr Leu Leu Ile Pro Leu Val Arg
385                 390
<210>12
<211>14
<212>PRT
<213>人工序列
<220>
<223>保守基序
<220>
<221>MISC_FEATURE
<222>(3)..(3)
<223>x=w或y
<220>
<221>MISC_FEATURE
<222>(4)..(4)
<223>x=k或r
<220>
<221>MISC_FEATURE
<222>(11)..(11)
<223>x=i或v
<400>12
Ala Phe Xaa Xaa Phe Ser Arg Pro His Thr Xaa Ile Gly Thr
1               5                   10
<210>13
<211>26
<212>PRT
<213>人工序列
<220>
<223>保守基序
<220>
<221>MISC_FEATURE
<222>(2)..(2)
<223>x=v或i
<220>
<221>MISC_FEATURE
<222>(11)..(11)
<223>x=e,w,f,或s
<220>
<221>MISC_FEATURE
<222>(13)..(13)
<223>x=v或i
<220>
<221>MISC_FEATURE
<222>(14)..(14)
<223>x=d或e
<220>
<221>MISC_FEATURE
<222>(17)..(17)
<223>x=k或r
<220>
<221>MISC_FEATURE
<222>(18)..(18)
<223>x=i或v
<220>
<221>MISC_FEATURE
<222>(22)..(22)
<223>x=h,n,t或y
<400>13
Asn Xaa Tyr Ile Val Gly Leu Asn Gln Leu Xaa Asp Xaa Xaa Ile Asp
1               5                   10                  15
Xaa Xaa Asn Lys Pro Xaa Leu Pro Leu Ala
            20                  25
<210>14
<211>16
<212>PRT
<213>人工序列
<220>
<223>保守基序
<220>
<221>MISC_FEATURE
<222>(3)..(3)
<223>x=i或l
<220>
<221>MISC_FEATURE
<222>(7)..(7)
<223>x=i或v
<220>
<221>MISC_FEATURE
<222>(10)..(10)
<223>x=i或m
<220>
<221>MISC_FEATURE
<222>(14)..(14)
<223>x=r或k
<220>
<221>MISC_FEATURE
<222>(15)..(15)
<223>x=l,q,i,或v
<220>
<221>MISC_FEATURE
<222>(16)..(16)
<223>x=y或f
<400>14
Ile Ala Xaa Phe Lys Asp Xaa Pro Asp Xaa Glu Gly Asp Xaa Xaa Xaa
1               5                   10                  15
<210>15
<211>17
<212>PRT
<213>人工序列
<220>
<223>保守基序
<220>
<221>MISC_FEATURE
<222>(1)..(1)
<223>x=f或c
<220>
<221>MISC_FEATURE
<222>(3)..(3)
<223>x=q或m
<220>
<221>MISC_FEATURE
<222>(10)..(10)
<223>x=f或y
<220>
<221>MISC_FEATURE
<222>(11)..(11)
<223>x=i,l,或a
<220>
<221>MISC_FEATURE
<222>(15)..(15)
<223>x=i,m,或l
<220>
<221>MISC_FEATURE
<222>(16)..(16)
<223>x=f,y,i,或l
<400>15
Xaa Tyr Xaa Phe Ile Trp Lys Leu Phe Xaa Xaa Glu Tyr Leu Xaa Xaa
1               5                   10                  15
Pro
<210>16
<211>56
<212>DNA
<213>人工序列
<220>
<223>合成的引物序列
<400>16
cgcgatttaa atggcgcgcc ctgcaggcgg ccgcctgcag ggcgcgccat ttaaat          56
<210>17
<211>32
<212>DNA
<213>人工序列
<220>
<223>合成的引物序列
<400>17
tcgaggatcc gcggccgcaa gcttcctgca gg                                    32
<210>18
<211>32
<212>DNA
<213>人工序列
<220>
<223>合成的引物序列
<400>18
tcgacctgca ggaagcttgc ggccgcggat cc                                    32
<210>19
<211>32
<212>DNA
<213>人工序列
<220>
<223>合成的引物序列
<400>19
tcgacctgca ggaagcttgc ggccgcggat cc                                    32
<210>20
<211>32
<212>DNA
<213>人工序列
<220>
<223>合成的引物序列
<400>20
tcgaggatcc gcggccgcaa gcttcctgca gg                                    32
<210>21
<211>36
<212>DNA
<213>人工序列
<220>
<223>合成的引物序列
<400>21
tcgaggatcc gcggccgcaa gcttcctgca ggagct                                36
<210>22
<211>28
<212>DNA
<213>人工序列
<220>
<223>合成的引物序列
<400>22
cctgcaggaa gcttgcggcc gcggatcc                                         28
<210>23
<211>36
<212>DNA
<213>人工序列
<220>
<223>合成的引物序列
<400>23
tcgacctgca ggaagcttgc ggccgcggat ccagct                                36
<210>24
<211>28
<212>DNA
<213>人工序列
<220>
<223>合成的引物序列
<400>24
ggatccgcgg ccgcaagctt cctgcagg                                         28
<210>25
<211>39
<212>DNA
<213>人工序列
<220>
<223>合成的引物序列
<400>25
gatcacctgc aggaagcttg cggccgcgga tccaatgca                             39
<210>26
<211>31
<212>DNA
<213>人工序列
<220>
<223>合成的引物序列
<400>26
ttggatccgc ggccgcaagc ttcctgcagg t                                     31
<210>27
<211>969
<212>DNA
<213>点型念珠蓝细菌(Nostoc punctiforme)
<400>27
atgagccaga gttctcaaaa cagccctttg ccacgcaaac ctgttcaatc atatttccat      60
tggttatacg ctttctggaa attctctcgc cctcacacga ttattggtac aagtctgagt     120
gtgttgagtt tgtatttaat tgctattgcc attagtaata ataccgcttc tttattcact     180
actcccggct ccctaagccc tctcttcggc gcatggattg cttgtctatg tggcaatgtt     240
tacattgtag ggctgaatca attagaagat gttgatattg acaagattaa taaacctcat     300
ttaccgttgg catcaggtga gttttctcaa cagacgggac aattaattgt tgcatctact     360
gggattttgg cactagttat ggcgtggcta actgggccat tcttgtttgg catggtaaca     420
attagtttgg ccattggtac tgcttattct ttaccgccaa ttcgcttaaa acagtttccc     480
ttttgggcag cgctgtgtat tttttcggta cgcggcacga ttgttaattt aggattgtat     540
ttgcactata gttgggcgct gaaacaaagc caaacaattc cgcctgtggt gtgggtgctg     600
acattgttta ttttggtgtt tacctttgcg atcgcaatct ttaaagatat cccagatata     660
gaaggcgatc gcctctacaa tattactact ttcacgatta aactagggtc ccaagctgtg     720
tttaatctag ctctttgggt gataactgtc tgttatctag ggataattct ggtaggagtg     780
ctacgcatcg cttcagttaa ccccattttt ctgataactg ctcatttggc gctgttggtt     840
tggatgtggt ggcggagttt ggcggtagac ttacaagata aaagtgcgat cgctcaattc     900
taccaattta tctggaaact cttttttata gaatatctaa tttttcctat cgcctgcttt     960
ttggcttag                                                             969
<210>28
<211>957
<212>DNA
<213>鱼腥蓝细菌属(Anabaena sp.)
<400>28
atgaaccaaa gttcccaaga cagaccgttg cgacctaaac cattgcaatc atcttttcag      60
tggctttatg ctttttggaa attttcccgc ccacacacaa ttattggcac aagtctcagt     120
gttttgggct tatatttaat ttctatcgcc gtcagttcca ccggttttgc cctgacgcag     180
ataaactccg ttttaggagc atggctggcc tgtctctgtg gcaatgttta tattgtgggg     240
ttaaatcaat tagaagatat tgaaattgat aaagttaata aacctcattt acctctagct     300
tcgggagaat ttagccgcaa acaaggacgg ataattgtaa ttctcacggg aattaccgcc     360
atagtattag cttggttaaa tggcccttat ttatttggta tggtggcggt gagtttagcc     420
attggtactg cctattcttt accaccaatt cgtttaaaac agtttccctt ttgggcggcc     480
ttgtgtattt tttcagtaag gggaacgatt gttaatttag gattatatct gcacttcagt     540
tggctactac agaataaaca gtcaattcct ctacctgtat ggatattaac ggtatttatt     600
ttaatattta cctttgcgat cgccatcttt aaagatatcc ctgatatgga aggcgatcgc     660
ctctacaata ttaccactct caccatccaa ctagggccac aagctgtctt taatttggca     720
atgtgggtat taacggtttg ctacttgggt atggtgataa ttggtgtgct gcggctaggt     780
acaattaact cagtgtttct ggtcgtgact catttagtaa ttctctgttg gatgtggatg     840
cagagtttag ccgtagacat acatgacaaa acggcgatcg ctcaattcta tcaatttatt     900
tggaagctct ttttcctaga atatttaatg tttcccattg cctgtctttt agcttaa        957
<210>29
<211>927
<212>DNA
<213>集胞蓝细菌属(Synechocystis sp.)
<400>29
atggcaacta tccaagcttt ttggcgcttc tcccgccccc ataccatcat tggtacaact      60
ctgagcgtct gggctgtgta tctgttaact attctcgggg atggaaactc agttaactcc     120
cctgcttccc tggatttagt gttcggcgct tggctggcct gcctgttggg taatgtgtac     180
attgtcggcc tcaaccaatt gtgggatgtg gacattgacc gcatcaataa gccgaatttg     240
cccctagcta acggagattt ttctatcgcc cagggccgtt ggattgtggg actttgtggc     300
gttgcttcct tggcgatcgc ctggggatta gggctatggc tggggctaac ggtgggcatt     360
agtttgatta ttggcacggc ctattcggtg ccgccagtga ggttaaagcg cttttccctg     420
ctggcggccc tgtgtattct gacggtgcgg ggaattgtgg ttaacttggg cttattttta     480
ttttttagaa ttggtttagg ttatcccccc actttaataa cccccatctg ggttttgact     540
ttatttatct tagttttcac cgtggcgatc gccattttta aagatgtgcc agatatggaa     600
ggcgatcggc aatttaagat tcaaacttta actttgcaaa tcggcaaaca aaacgttttt     660
cggggaacct taattttact cactggttgt tatttagcca tggcaatctg gggcttatgg     720
gcggctatgc ctttaaatac tgctttcttg attgtttccc atttgtgctt attagcctta     780
ctctggtggc ggagtcgaga tgtacactta gaaagcaaaa ccgaaattgc tagtttttat     840
cagtttattt ggaagctatt tttcttagag tacttgctgt atcccttggc tctgtggtta     900
cctaattttt ctaatactat tttttag                                         927
<210>30
<211>1569
<212>DNA
<213>玉米(Zea mays)
<400>30
ccacgcgtcc gcccggccaa gggatggacg cgcttcgcct acggccgtcc ctcctctccg      60
tgcggcccgg cgcggcccgc ccgcgagatc attttctacc accatgttgt tccatacaac     120
gaaatggtga aggacgaatt tgcttttcta gccaaaggac ccaaggtcct accttgcatc     180
accatcagaa attcttcgaa tggaaatcct cctattgtag gatatcacat cgatcattaa     240
atacttctgt taatgcttcg gggcaacagc tgcagtctga acctgaaaca catgattcta     300
caaccatctg gagggcaata tcatcttctc tagatgcatt ttacagattt tcccggccac     360
atactgtcat aggaacagca ttaagcatag tctcagtttc ccttctagct gtccagagct     420
tgtctgatat atcacctttg ttcctcactg gtttgctgga ggcagtggta gctgcccttt     480
tcatgaatat ctatattgtt ggactgaacc agttattcga cattgagata gacaaggtta     540
acaagccaac tcttccattg gcatctgggg aatacacccc tgcaactggg gttgcaatag     600
tttcggtctt tgccgctatg agctttggcc ttggatgggc tgttggatca caacctctgt     660
tttgggctct tttcataagc tttgttcttg ggactgcata ttcaatcaat ctgccgtacc     720
ttcgatggaa gagatttgct gttgttgcag cactgtgcat attagcagtc cgtgcagtga     780
ttgttcagct ggcctttttt ctccacattc agacttttgt tttcaggaga ccggcagtgt     840
tttctaggcc attattattt gcaactggat ttatgacgtt cttctctgtt gtaatagcac     900
tattcaagga tatacctgac atcgaaggag accgcatatt cgggatccga tccttcagcg     960
tccggttagg gcaaaagaag gtcttttgga tctgcgttgg cttgcttgag atggcctaca    1020
gcgttgcgat actgatggga gctacctctt cctgtttgtg gagcaaaaca gcaaccatcg    1080
ctggccattc catacttgcc gcgatcctat ggagctgcgc gcgatcggtg gacctgacga    1140
gcaaagccgc aataacgtcc ttctacatgt tcatctggaa gctgttctac gcggagtacc    1200
tgctcatccc tctggtgcgg tgagcgcgag gcgaggtggt ggcagacgga tcggcgtcgg    1260
cggggcggca aacaactcca cgggagaact tgagtgccgg aagtaaactc ccgtttgaaa    1320
gttgaagcgt gcaccaccgg caccgggcag agagagacac ggtggctgga tggatacgga    1380
tggccccccc aataaattcc cccgtgcatg gtaccccacg ctgcttgatg atatcccatg    1440
tgtccgggtg atcgtctcta gagagattgg ttgcacaacg tccaacatag cccgtaggta    1500
ttgctaccac tgctagtatg atactccttc ctagtccttg ccaaaaaaaa aaaaaaaaaa    1560
aaaaaaaag                                                            1569
<210>31
<211>1236
<212>DNA
<213>大豆(ppt2)
<400>31
atggattcac tgcttcttcg atctttccct aatattaata acgcctcttc tctcaccacc      60
actggtgcaa atttctccag gactaaatct ttcgccaaca tttaccatgc aagttcttat     120
gtgccaaatg cttcatggca caataggaaa atccaaaaag aatataattt tttgaggttt     180
cggtggccaa gtttgaacca tcattacaaa ggcattgagg gagcgtgtac atgtaaaaaa     240
tgtaatataa aatttgttgt gaaagcgacc tctgaaaaat ctcttgagtc tgaacctcaa     300
gcttttgatc caaaaagcat tttggactct gtcaagaatt ccttggatgc tttctacagg     360
ttttccaggc ctcacacagt tattggcaca gcattaagca taatttctgt gtctcttctt     420
gctgttgaga aaatatcaga tatatctcca ttatttttta ctggtgtgtt ggaggctgtg     480
gttgctgccc tgtttatgaa tatttatatt gttggtttga atcaattgtc tgatgttgaa     540
atagacaaga taaacaagcc gtatcttcca ttagcatctg gggaatattc ctttgaaact     600
ggtgtcacta ttgttgcatc tttttcaatt ctgagttttt ggcttggctg ggttgtaggt     660
tcatggccat tattttgggc cctttttgta agctttgtgc taggaactgc ttattcaatc     720
aatgtgcctc tgttgagatg gaagaggttt gcagtgcttg cagcgatgtg cattctagct     780
gttcgggcag taatagttca acttgcactt ttccttcaca tgcagactca tgtgtacaag     840
aggccacctg tcttttcaag accattgatt tttgctactg cattcatgag cttcttctct     900
gtagttatag cactgtttaa ggatatacct gacattgaag gagataaagt atttggcatc     960
caatcttttt cagtgcgttt aggtcagaag ccggtgttct ggacttgtgt tacccttctt    1020
gaaatagctt atggagtcgc cctcctggt gggagctgcat ctccttgtct ttggagcaaa    1080
attttcacgg gtctgggaca cgctgtgctg gcttcaattc tctggtttca tgccaaatct    1140
gtagatttga aaagcaaagc ttcgataaca tccttctata tgtttatttg gaagctattt    1200
tatgcagaat acttactcat tccttttgtt agatga                              1236
<210>32
<211>1188
<212>DNA
<213>大豆(ppt1)
<400>32
atggattcga tgcttcttcg atcttttcct aatattaaca acgcttcttc tctcgccacc      60
actggttctt atttgccaaa tgcttcatgg cacaatagga aaatccaaaa agaatataat     120
tttttgaggt ttcggtggcc aagtttgaac caccattaca aaagcattga aggagggtgt     180
acatgtaaaa aatgtaatat aaaatttgtt gtgaaagcga cctctgaaaa atcttttgag     240
tctgaacccc aagcttttga tccaaaaagc attttggact ctgtcaagaa ttccttggat     300
gctttctaca ggttttccag acctcacaca gttattggca cagcattaag cataatttct     360
gtgtccctcc ttgctgttga gaaaatatca gatatatctc cattattttt tactggtgtg     420
ttggaggctg tggttgctgc cctgtttatg aatatttata ttgttggttt gaatcaattg     480
tctgatgttg aaatagacaa gataaacaag ccgtatcttc cattagcatc tggggaatat     540
tcctttgaaa ctggtgtcac tattgttgca tctttttcaa ttctgagttt ttggcttggc     600
tgggttgtag gttcatggcc attattttgg gccctttttg taagctttgt gctaggaact     660
gcttattcaa tcaatgtgcc tctgttgaga tggaagaggt ttgcagtgct tgcagcgatg     720
tgcattctag ctgttcgggc agtaatagtt caacttgcat ttttccttca catccagact     780
catgtataca agaggccacc tgtcttttca agatcattga tttttgctac tgcattcatg     840
agcttcttct ctgtagttat agcactgttt aaggatatac ctgacattga aggagataaa     900
gtatttggca tccaatcttt ttcagtgcgt ttaggtcaga agccggtatt ctggacttgt     960
gttatccttc ttgaaatagc ttatggagtc gccctcctgg tgggagctgc atctccttgt    1020
ctttggagca aaattgtcac gggtctggga cacgctgttc tggcttcaat tctctggttt    1080
catgccaaat ctgtagattt gaaaagcaaa gcttcgataa catccttcta tatgtttatt    1140
tggaagctat tttatgcaga atacttactc attccttttg ttagatga                 1188
<210>33
<211>1182
<212>DNA
<213>拟南芥(Arabidopsis thaliana)
<400>33
atggagtctc tgctctctag ttcttctctt gtttccgctg ctggtgggtt ttgttggaag      60
aagcagaatc taaagctcca ctctttatca gaaatccgag ttctgcgttg tgattcgagt     120
aaagttgtcg caaaaccgaa gtttaggaac aatcttgtta ggcctgatgg tcaaggatct     180
tcattgttgt tgtatccaaa acataagtcg agatttcggg ttaatgccac tgcgggtcag     240
cctgaggctt tcgactcgaa tagcaaacag aagtctttta gagactcgtt agatgcgttt     300
tacaggtttt ctaggcctca tacagttatt ggcacagtgc ttagcatttt atctgtatct     360
ttcttagcag tagagaaggt ttctgatata tctcctttac ttttcactgg catcttggag     420
gctgttgttg cagctctcat gatgaacatt tacatagttg ggctaaatca gttgtctgat     480
gttgaaatag ataaggttaa caagccctat cttccattgg catcaggaga atattctgtt     540
aacaccggca ttgcaatagt agcttccttc tccatcatga gtttctggct tgggtggatt     600
gttggttcat ggccattgtt ctgggctctt tttgtgagtt tcatgctcgg tactgcatac     660
tctatcaatt tgccactttt acggtggaaa agatttgcat tggttgcagc aatgtgtatc     720
ctcgctgtcc gagctattat tgttcaaatc gccttttatc tacatattca gacacatgtg     780
tttggaagac caatcttgtt cactaggcct cttattttcg ccactgcgtt tatgagcttt     840
ttctctgtcg ttattgcatt gtttaaggat atacctgata tcgaagggga taagatattc     900
ggaatccgat cattctctgt aactctgggt cagaaacggg tgttttggac atgtgttaca     960
ctacttcaaa tggcttacgc tgttgcaatt ctagttggag ccacatctcc attcatatgg    1020
agcaaagtca tctcggttgt gggtcatgtt atactcgcaa caactttgtg ggctcgagct    1080
aagtccgttg atctgagtag caaaaccgaa ataacttcat gttatatgtt catatggaag    1140
ctcttttatg cagagtactt gctgttacct tttttgaagt ga                       1182
<210>34
<211>1374
<212>DNA
<213>萼距花(Cuphea pulcherrima)
<400>34
ccacgcgtcc ggctggtttg tgggttttgc gagcacgagg aaggaaaaaa catgcggatg      60
gagtctctgc ttctgaattc tttctctcca tctccggcgg gaggaaaaat ttgtagggcc     120
gatacttaca agaaggccta cttcgcaact gcgaggtgca acacattgaa cagcctcaac     180
aagaatacag gtgaatatca tctcagcaga acccgacaac ggttcacatt tcaccaaaat     240
ggtcacagaa cttacctagt caaggcagtg tccgggcagt ccctggagtc tgagcccgaa     300
agttacccta acaataggtg ggattatgtc aaaagtgctg ctgatgcctt ctaccggttt     360
tctcgtcccc acacaattat aggcactgcg ttgagcatag tatcggtttc gcttcttgct     420
gtagagaagt tgcctgaatt gaattcaatg tttttcactg gcttattgga ggtgattttg     480
gctgccctct tcatgaatat atatattgtc ggtttgaatc agttgtctga tatagacatt     540
gacaaggtaa acaagccgta tcttcccctg gcatcaggag aattctcggt tggaactggg     600
gttaccattg taacatcctt cttgattatg agcttttggc tggggtgggt tgtcggttca     660
tggcccttgt tttgggccct tttcatcagt tttgtgcttg gaacagcata ctcaatcgat     720
atgccaatgc tcagatggaa gagatctgca gttgtggctg cactgtgcat tctagctgtt     780
cgggccgtga ttgttcagat agcgtttttt ttgcacatgc agatgcatgt gtatggaaga     840
gcagctgcac tttctcggcc tgtaatattt gccacaggct ttatgagctt cttttctatt     900
gttattgcgt tgtttaagga cattcctgac atagaaggtg ataaaatatt tgggatccgg     960
tcattcactg ttcgtctggg ccaagaacgg gttttctgga tatgcatatc acttctcgaa    1020
atggcttatg ctgttgcgat tcttgttggg tcgacgtctc cctatctttg gagcaaagtc    1080
atcacggttt cgggtcatgt tgtgttggcc tccatactat ggggacgagc caagtctatc    1140
gactttaaga gcaaagcagc actaacctcc ttctacatgt ttatttggaa gctattttac    1200
gcagaatact tgcttatacc gcttgtacga tgagctttcg ggatcagaac attacattat    1260
cgtaaactga acaatttaga attgcatatt gttcagatga cagctccatc ttggcaataa    1320
aatttgatat gaatgtctct gatccaaaaa aaaaaaaaaa aaaaaaaaaa aaag          1374
<210>35
<211>1486
<212>DNA
<213>韭葱(Allium porrum)
<400>35
gcacgagttt tgaagaatgt taagcatgga ctccctcctt accaagccag ttgtaatacc      60
tctgccttct ccagtttgtt cactaccaat cttgcgaggc agttctgcac cagggcagta     120
ttcatgtaga aactacaatc caataagaat tcaaaggtgc ctcgtaaatt atgaacatgt     180
gaaaccaagg tttacaacat gtagtaggtc tcaaaaactt ggtcatgtaa aagccacatc     240
cgagcattct ttagaatctg gatccgaagg atacactcct agaagcatat gggaagccgt     300
actagcttca ctgaatgttc tatacaaatt ttcacgacct cacacaataa taggaacagc     360
aatgggcata atgtcagttt ctttgcttgt tgtcgagagc ctatccgata tttctcctct     420
gttttttgtg ggattattag aggctgtggt tgctgcattg tttatgaatg tttacattgt     480
aggtctgaat caattatttg acatagaaat agacaaggtc aataaacctg atcttcctct     540
tgcatctgga gaatactcac caagagctgg tactgctatt gtcattgctt cagccatcat     600
gagctttggc attggatggt tagttggctc ttggccatta ttctgggcgc tttttattag     660
tttcgttctt ggcactgcat attcaatcaa tctaccattt ctaagatgga agagatccgc     720
cgttgttgca gcaatatgta tccttgctgt acgagcagtt atagtccagc tcgccttttt     780
cttacacata cagagttttg ttttcaaaag accagcaagt ttcacaaggc cattgatatt     840
tgcaactgcc ttcatgagct tcttctcagt tgttattgct ctatttaagg atatacctga     900
tatagacgga gacaaaatat ttggcatcca ttctttcagc gtgcgccttg gccaggagag     960
ggtgttttgg atatgtatat atctccttga gatggcctac actgttgtca tggttgttgg    1020
agctacttcc tcatgcctat ggagcaaatg cttaacagtg ataggtcatg caattcttgg    1080
gtcgttactt tggaatcgtg ctagatctca tggaccaatg accaaaacca ctattacatc    1140
tttttatatg ttcgtgtgga agctcttcta tgctgagtac ttgctcattc cttttgtaag    1200
atgagggttt atgacctaca tggaaaagaa tcgcaagaga agatgagtag ataatggagg    1260
cagaaatggc tggaattaac aacgctttaa ttgtcatctt aaaaacggag agttctttca    1320
acaattgcag atcatttctc cttaattata ttcatgttgt atgttgtgtt aaagattatc    1380
attgaatgac aatagcctat gttgaattta ggatatccag tggttttctt tgttcttttt    1440
taagaattta ttcacagaaa aatgaagtaa aaaaaaaaaa aaaaaa                   1486
<210>36
<211>1670
<212>DNA
<213>小麦属(Triticum sp.)
<400>36
ccacgcgtcc ggtcccactg cccgcccccc acccgcgcgc cgccgcggcg atggactcgc      60
tccgcctccg gccgtcctcg ctccgctccg cgcccggcgc cgccgccgcc cgccggcgag     120
atcatattct accatcattt tgttcgatcc aacgaaatgg taaagggcga gttactttgt     180
ccatccaagc atccaaaggc cctaccatta atcactgtaa aaagttcttg gattggaaat     240
attccaacca taggatatca catcaatcaa taaatacttc tgcaaaagct gggcaatcgc     300
tacagcctga aactgaagca cacgatcctg caagcttctg gaagccaata tcatcttctc     360
tggacgcgtt ctacaggttt tctcggccac ataccatcat aggaacagca ctaagcatag     420
tctcagtttc ccttctagct gtcgagagct tatctgatat ttcgcccttg ttcctcactg     480
gtttgctgga ggcagtggtg gctgctcttt ttatgaacat ctatattgtt ggattgaatc     540
agttgttcga cattgaaatt gacaaggtta acaagccaac tcttccacta gcatctgggg     600
aatactctcc tgcaactgga gttgcaatag tgtcagtatt tgcagccatg agctttggcc     660
ttggatgggt tgttggatca ccacctctgt tttgggctct ttttattagc tttgttcttg     720
gaactgctta ttcagtcaat ctgccgtact ttcgatggaa gagatctgct gttgttgcag     780
cactctgcat attagcagtg cgtgcggtga ttgttcaact ggcatttttt ctccacattc     840
agacatttgt tttcagaagg ccggcagtct tttcaaagcc attgatattt gcaactgcct     900
tcatgacatt cttctcagtt gtaatagcat tattcaagga tatacccgat attgaagggg     960
accgcatctt tggaattcaa tcttttagtg ttagattagg tcaaagcaag gttttctgga    1020
cttgtgttgg tctacttgag gttgcctacg gtgttgcgat actgatgggg gtaacttctt    1080
ccagtttgtg gagcaaatct ctaactgttg tgggccatgc aatcctcgcc agcatcttgt    1140
ggagcagcgc acggtccatc gacttgacaa gcaaagctgc gataacatcc ttctacatgc    1200
tcatctggag gctgttctac gcggagtacc tgctcatccc tctggtgaga tgaggaccga    1260
caagcagccc acggaagaac ttcagtgccg gagtacagct gtgcgaatcc atttgaattt    1320
cggatggtca cggaccgcgc ccaataaaac tcccagagcc ttgccccggt acatcgttga    1380
ttttccagcc atgaatggtg agatcaccac ctaaagatgg ataacctccc catgtaccca    1440
agctgggcca ggtgagctgt agtttagttg atgctagcga gcaacaactc ctgcagcagg    1500
cacgcggctg cctggaaaat aaggctcccc actcccaatt acattctgtt gtacggtttt    1560
agtacttgtg aattttgctc tggtccgttg ttgtctagga tgtttggaac attgcgcaga    1620
ctttcttata tcttaccggg aggggtgaat tggcaaaaaa aaaaaaaaag               1670
<210>37
<211>41
<212>DNA
<213>人工序列
<220>
<223>引物序列
<400>37
ggatccgcgg ccgcacaatg gagtctctgc tctctagttc t                          41
<210>38
<211>38
<212>DNA
<213>人工序列
<220>
<223>引物序列
<400>38
ggatcctgca ggtcacttca aaaaaggtaa cagcaagt                              38
<210>39
<211>14
<212>PRT
<213>人工序列
<220>
<223>保守基序
<220>
<221>MISC_FEATURE
<222>(1)..(1)
<223>x=a或v
<220>
<221>MISC_FEATURE
<222>(2)..(2)
<223>x=f或l
<220>
<221>MISC_FEATURE
<222>(3)..(3)
<223>x=w或y
<220>
<221>MISC_FEATURE
<222>(4)..(4)
<223>x=k或r
<220>
<221>MISC_FEATURE
<222>(11)..(11)
<223>x=i或v
<400>39
Xaa Xaa Xaa Xaa Phe Ser Arg Pro His Thr Xaa Ile Gly Thr
1               5                   10
<210>40
<211>26
<212>PRT
<213>人工序列
<220>
<223>保守基序
<220>
<221>MISC_FEATURE
<222>(2)..(2)
<223>x=i或l
<220>
<221>MISC_FEATURE
<222>(11)..(11)
<223>x=w,e,s,或f
<220>
<221>MISC_FEATURE
<222>(13)..(13)
<223>x=v或i
<220>
<221>MISC_FEATURE
<222>(14)..(14)
<223>x=d或e
<220>
<221>MISC_FEATURE
<222>(17)..(17)
<223>x=r或k
<220>
<221>MISC_FEATURE
<222>(18)..(18)
<223>x=i或v
<220>
<221>MISC_FEATURE
<222>(23)..(23)
<223>x=n,h,y,t,或d
<400>40
Asn Xaa Tyr Ile Val Gly Leu Asn Gln Leu Xaa Asp Xaa Xaa Ile Asp
1               5                   10                  15
Xaa Xaa Asn Lys Pro Xaa Leu Pro Leu Ala
            20                  25
<210>41
<211>16
<212>PRT
<213>人工序列
<220>
<223>保守基序
<220>
<221>MISC_FEATURE
<222>(3)..(3)
<223>x=i或l
<220>
<221>MISC_FEATURE
<222>(7)..(7)
<223>x=v或i
<220>
<221>MISC_FEATURE
<222>(10)..(10)
<223>x=m或i
<220>
<221>MISC_FEATURE
<222>(11)..(11)
<223>x=e或d
<220>
<221>MISC_FEATURE
<222>(14)..(14)
<223>x=r或k
<220>
<221>MISC_FEATURE
<222>(15)..(15)
<223>x=i,v,l,或q
<220>
<221>MISC_FEATURE
<222>(16)..(16)
<223>x=y或f
<400>41
Ile Ala Xaa Phe Lys Asp Xaa Pro Asp Xaa Xaa Gly Asp Xaa Xaa Xaa
1               5                   10                  15
<210>42
<211>17
<212>PRT
<213>人工序列
<220>
<223>保守基序
<220>
<221>MISC_FEATURE
<222>(1)..(1)
<223>x=f或c
<220>
<221>MISC_FEATURE
<222>(3)..(3)
<223>x=m或q
<220>
<221>MISC_FEATURE
<222>(4)..(4)
<223>x=f或l
<220>
<221>MISC_FEATURE
<222>(5)..(5)
<223>x=i或v
<220>
<221>MISC_FEATURE
<222>(7)..(7)
<223>x=k或r
<220>
<221>MISC_FEATURE
<222>(10)..(10)
<223>x=f或y
<220>
<221>MISC_FEATURE
<222>(11)..(11)
<223>x=l,i或a
<220>
<221>MISC_FEATURE
<222>(15)..(15)
<223>x=l,m,或i
<220>
<221>MISC_FEATURE
<222>(16)..(16)
<223>x=f,y,l,或i
<400>42
Xaa Tyr Xaa Xaa Xaa Trp Xaa Leu Phe Xaa Xaa Glu Tyr Leu Xaa Xaa
1               5                   10                  15
Pro
<210>43
<211>349
<212>PRT
<213>红海束毛蓝细菌(Trichodesmium erythraeum)
<400>43
Met Gly Lys Ile Ala Gly Ser Gln Gln Gly Lys Ile Thr Thr Asn Trp
1               5                   10                  15
Leu Gln Lys Tyr Val Pro Trp Leu Tyr Ser Phe Trp Lys Phe Ala Arg
            20                  25                  30
Pro His Thr Ile Ile Gly Thr Ser Leu Ser Val Leu Ala Leu Tyr Ile
        35                  40                  45
Ile Ala Met Gly Asp Arg Ser Asn Phe Phe Asp Lys Tyr Phe Phe Leu
    50                  55                  60
Tyr Ser Leu Ile Leu Leu Leu Ile Thr Trp Ile Ser Cys Leu Cys Gly
65                  70                  75                  80
Asn Ile Tyr Ile Val Gly Leu Asn Gln Leu Glu Asp Ile Glu Ile Asp
                85                  90                  95
Arg Ile Asn Lys Pro His Leu Pro Ile Ala Ala Gly Glu Phe Ser Arg
            100                 105                 110
Phe Ser Gly Gln Ile Ile Val Val Ile Thr Gly Ile Leu Ala Leu Ser
        115                 120                 125
Phe Ala Gly Leu Gly Gly Pro Phe Leu Leu Gly Thr Val Gly Ile Ser
    130                 135                 140
Leu Ala Ile Gly Thr Ala Tyr Ser Leu Pro Pro Ile Arg Leu Lys Arg
145                 150                 155                 160
Phe Pro Val Leu Ala Ala Leu Cys Ile Phe Thr Val Arg Gly Val Ile
                165                 170                 175
Val Asn Leu Gly Ile Phe Leu Ser Phe Val Trp Gly Phe Glu Lys Val
            180                 185                 190
Glu Glu Val Ser Gly Gly Leu Ile Lys Trp Met Gly Glu Leu Gly Glu
        195                 200                 205
Val Val Leu Leu Gln Lys Ser Leu Met Val Pro Glu Ile Pro Leu Thr
    210                 215                 220
Val Trp Ala Leu Thr Leu Phe Val Ile Val Phe Thr Phe Ala Ile Ala
225                 230                 235                 240
Ile Phe Lys Asp Ile Pro Asp Ile Glu Gly Asp Arg Gln Tyr Asn Ile
                245                 250                 255
Asn Thr Phe Thr Ile Lys Leu Gly Ala Phe Ala Val Phe Asn Leu Ala
            260                 265                 270
Arg Trp Val Leu Thr Phe Cys Tyr Leu Gly Met Val Met Val Gly Val
        275                 280                 285
Val Trp Leu Ala Ser Val Asn Leu Phe Phe Leu Val Ile Ser His Leu
    290                 295                 300
Leu Ala Leu Gly Ile Met Trp Trp Phe Ser Gln Arg Val Asp Leu His
305                 310                 315                 320
Asp Lys Lys Ala Ile Ala Asp Phe Tyr Gln Phe Ile Trp Lys Leu Phe
                325                 330                 335
Phe Leu Glu Tyr Leu Ile Phe Pro Met Ala Cys Phe Phe
            340                 345
<210>44
<211>300
<212>PRT
<213>橙色绿屈挠菌(Chloroflexus aurantiacus)
<400>44
Met Arg Lys Gln Leu Arg Leu Leu Ile Glu Phe Ala Arg Pro His Thr
1               5                   10                  15
Val Ile Ala Thr Ser Val Gln Val Leu Thr Met Leu Ile Ile Val Ile
            20                  25                  30
Gly Trp His Pro Pro Thr Leu Glu Leu Val Gly Leu Val Gly Val Thr
        35                  40                  45
Leu Val Val Cys Leu Ala Leu Asn Leu Tyr Val Val Gly Val Asn Gln
    50                  55                  60
Leu Thr Asp Val Ala Ile Asp Arg Ile Asn Lys Pro Trp Leu Pro Val
65                  70                  75                  80
Ala Ala Gly Gln Leu Ser Ser Asp Ala Ala Gln Arg Ile Val Ile Ser
                85                  90                  95
Ala Leu Phe Ile Ala Leu Thr Gly Ala Ala Met Leu Gly Pro Pro Leu
            100                 105                 110
Trp Trp Thr Val Ser Ile Ile Ala Leu Ile Gly Ser Leu Tyr Ser Leu
        115                 120                 125
Pro Pro Leu Arg Leu Lys Arg His Pro Leu Ala Ala Ala Leu Ser Ile
    130                 135                 140
Ala Gly Ala Arg Gly Val Ile Ala Asn Leu Gly Leu Ala Phe His Tyr
145                 150                 155                 160
Gln Tyr Trp Leu Asp Ser Glu Leu Pro Ile Thr Thr Leu Ile Leu Val
               165                  170                 175
Ala Thr Phe Phe Phe Gly Phe Ala Met Val Ile Ala Leu Tyr Lys Asp
            180                 185                 190
Leu Pro Asp Asp Arg Gly Asp Arg Leu Tyr Gln lle Glu Thr Leu Thr
        195                 200                 205
Thr Arg Leu Gly Pro Gln Arg Val Leu His Leu Gly Arg Ile Leu Leu
    210                 215                 220
Thr Ala Cys Tyr Leu Leu Pro Ile Ala Val Gly Leu Trp Ser Leu Pro
225                 230                 235                 240
Thr Phe Ala Ala Ala Phe Leu Ala Leu Ser His Val yal Val Ile Ser
                245                 250                 255
Val Phe Trp Leu Val Ser Met Arg Val Asp Leu Gln Arg Arg Gln Ser
            260                 265                 270
Ile Ala Ser Phe Tyr Met Phe Leu Trp Gly Ile Phe Tyr Thr Glu Phe
        275                 280                 285
Ala Leu Leu Ser Ile Tyr Arg Leu Thr Tyr Thr Leu
    290                 295                 300
<210>45
<211>402
<212>PRT
<213>拟南芥(Arabidopsis thaliana)
<400>45
Met Glu Leu Ser Ile Ser Gln Ser Pro Arg Val Arg Phe Ser Ser Leu
1               5                   10                  15
Ala Pro Arg Phe Leu Ala Ala Ser His His His Arg Pro Ser Val His
            20                  25                  30
Leu Ala Gly Lys Phe Ile Ser Leu Pro Arg Asp Val Arg Phe Thr Ser
        35                  40                  45
Leu Ser Thr Ser Arg Met Arg Ser Lys Phe Val Ser Thr Asn Tyr Arg
    50                  55                  60
Lys Ile Ser Ile Arg Ser Val Cys Ala Phe Cys Asn Gly Thr His Lys
65                  70                  75                  80
Ser Arg Tyr Tyr Gln Ala Cys Ser Gln Val Gly Ala Ala Glu Ser Asp
                85                  90                  95
Asp Pro Val Leu Asp Arg Ile Ala Arg Phe Gln Asn Ala Cys Trp Arg
            100                 105                 110
Phe Leu Arg Pro His Thr Ile Arg Gly Thr Ala Leu Gly Ser Thr Ala
        115                 120                 125
Leu Val Thr Arg Ala Leu Ile Glu Asn Thr His Leu Ile Lys Trp Ser
    130                 135                 140
Leu Val Leu Lys Ala Leu Ser Gly Leu Leu Ala Leu Ile Cys Gly Asn
145                 150                 155                 160
Gly Tyr Ile Val Gly Ile Asn Gln Ile Tyr Asp Ile Gly Ile Asp Lys
                165                 170                 175
Val Asn Lys Pro Tyr Leu Pro Ile Ala Ala Gly Asp Leu Ser Val Gln
            180                 185                 190
Ser Ala Trp Leu Leu Val Ile Phe Phe Ala Ile Ala Gly Leu Leu Val
        195                 200                 205
Val Gly Phe Asn Phe Gly Pro Phe Ile Thr Ser Leu Tyr Ser Leu Gly
    210                 215                 220
Leu Phe Leu Gly Thr Ile Tyr Ser Val Pro Pro Leu Arg Met Lys Arg
225                 230                 235                 240
Phe Pro Val Ala Ala Phe Leu Ile Ile Ala Thr Val Arg Gly Phe Leu
                245                 250                 255
Leu Asn Phe Gly Val Tyr His Ala Thr Arg Ala Ala Leu Gly Leu Pro
            260                 265                 270
Phe Gln Trp Ser Ala Pro Val Ala Phe Ile Thr Ser Phe Val Thr Leu
        275                 280                 285
Phe Ala Leu Val Ile Ala Ile Thr Lys Asp Leu Pro Asp Val Glu Gly
    290                 295                 300
Asp Arg Lys Phe Gln Ile Ser Thr Leu Ala Thr Lys Leu Gly Val Arg
305                 310                 315                 320
Asn Ile Ala Phe Leu Gly Ser Gly Leu Leu Leu Val Asn Tyr Val Ser
                325                 330                 335
Ala Ile Ser Leu Ala Phe Tyr Met Pro Gln Val Phe Arg Gly Ser Leu
            340                 345                 350
Met Ile Pro Ala His Val Ile Leu Ala Ser Gly Leu Ile Phe Gln Thr
        355                 360                 365
Trp Val Leu Glu Lys Ala Asn Tyr Thr Lys Glu Ala Ile Ser Gly Tyr
    370                 375                 380
Tyr Arg Phe Ile Trp Asn Leu Phe Tyr Ala Glu Tyr Leu Leu Phe Pro
385                 390                 395                 400
Phe Leu
<210>46
<211>12
<212>PRT
<213>人工的
<220>
<223>保守基序
<220>
<221>MISC_FEATURE
<222>(1)..(1)
<223>x=w或y
<220>
<221>MISC_FEATURE
<222>(2)..(2)
<223>x=r或k
<220>
<221>MISC_FEATURE
<222>(4)..(4)
<223>x=1或s
<220>
<221>MISC_FEATURE
<222>(9)..(9)
<223>x=i或v
<220>
<221>MISC_FEATURE
<222>(10)..(10)
<223>x=i或r
<400>46
Xaa Xaa Phe Xaa Arg Pro His Thr Xaa Xaa Gly Thr
1               5                   10
<210>47
<211>26
<212>PRT
<213>人工的
<220>
<223>保守基序
<220>
<221>MISC_FEATURE
<222>(2)..(2)
<223>x=v,i,或g
<220>
<221>MISC_FEATURE
<222>(7)..(7)
<223>x=i或l
<220>
<221>MISC_FEATURE
<222>(10)..(10)
<223>x=i或l
<220>
<221>MISC_FEATURE
<222>(11)..(11)
<223>x=s,f,y,或e
<220>
<221>MISC_FEATURE
<222>(13)..(13)
<223>x=v或i
<220>
<221>MISC_FEATURE
<222>(14)..(14)
<223>x=r,s,g,e,或d
<220>
<221>MISC_FEATURE
<222>(17)..(17)
<223>x=k或r
<220>
<221>MISC_FEATURE
<222>(18)..(18)
<223>x=v或i
<220>
<221>MISC_FEATURE
<222>(22)..(22)
<223>x=y,d,t,n,或h
<220>
<221>MISC_FEATURE
<222>(25)..(25)
<223>x=i或l
<400>47
Asn Xaa Tyr Ile Val Gly Xaa Asn G1n Xaa Xaa Asp Xaa Xaa Ile Asp
1               5                   10                  15
Xaa Xaa Asn Lys Pro Xaa Leu Pro Xaa Ala
            20                  25
<210>48
<211>14
<212>PRT
<213>拟南芥(Arabidopsis thaliana)
<220>
<221>MISC_FEATURE
<222>(3)..(3)
<223>x=l或i
<220>
<221>MISC_FEATURE
<222>(4)..(4)
<223>x=f或t
<220>
<221>MISC_FEATURE
<222>(7)..(7)
<223>x=l,i,或v
<220>
<221>MISC_FEATURE
<222>(10)..(10)
<223>x=i,v,或m
<220>
<221>MISC_FEATURE
<222>(11)..(11)
<223>x=e或d
<400>48
Ile Ala Xaa Xaa Lys Asp Xaa Pro Asp Xaa Xaa Gly Asp Arg
1               5                   10
<210>49
<211>23
<212>PRT
<213>人工的
<220>
<223>保守基序
<220>
<221>MISC_FEATURE
<222>(2)..(2)
<223>x=d,e,t,a,或s
<220>
<221>MISC_FEATURE
<222>(3)..(3)
<223>x=a,e,s,或t
<220>
<221>MISC_FEATURE
<222>(4)..(4)
<223>x=i或l
<220>
<221>MISC_FEATURE
<222>(5)..(5)
<223>x=s,t,或a
<220>
<221>MISC_FEATURE
<222>(6)..(6)
<223>x=q,g,或s
<220>
<221>MISC_FEATURE
<222>(7)..(7)
<223>x=f,y,或c
<220>
<221>MISC_FEATURE
<222>(9)..(9)
<223>x=q,m,或r
<220>
<221>MISC_FEATURE
<222>(10)..(10)
<223>x=f或l
<220>
<221>MISC_FEATURE
<222>(11)..(11)
<223>x=i或v
<220>
<221>MISC_FEATURE
<222>(13)..(13)
<223>x=n或k
<220>
<221>MISC_FEATURE
<222>(16)..(16)
<223>x=y或f
<220>
<221>MISC_FEATURE
<222>(17)..(17)
<223>x=a,1,或i
<220>
<221>MISC_FEATURE
<222>(21)..(21)
<223>x=f,i,l,或m
<220>
<221>MISC_FEATURE
<222>(22)..(22)
<223>x=f,l,i,或y
<220>
<221>MISC_FEATURE
<222>(20)..(20)
<223>x=a,i,或l
<400>49
Lys Xaa Xaa Xaa Xaa Xaa Xaa Tyr Xaa Xaa Xaa Trp Xaa Leu Phe Xaa
1               5                   10                  15
Xaa Glu Tyr Xaa Xaa Xaa Pro
            20
<210>50
<211>22
<212>DNA
<213>人工的
<220>
<223>引物
<400>50
gtggctcggc ttcacttttt ac                                               22
<210>51
<211>20
<212>DNA
<213>人工的
<220>
<223>引物
<400>51
ccacactcat atcaccgtgg                                                  20
<210>52
<211>27
<212>DNA
<213>人工的
<220>
<223>引物
<400>52
cagtgctgga tagaattgcc cggttcc                                          27
<210>53
<211>26
<212>DNA
<213>人工的
<220>
<223>引物
<400>53
gagatctatc agtgcagtct gcttgg                                           26
<210>54
<211>23
<212>DNA
<213>人工的
<220>
<223>引物
<400>54
gggacaagca tttttattgc aag                                              23
<210>55
<211>24
<212>DNA
<213>人工的
<220>
<223>引物
<400>55
gccaagatca catgtgcagg aatc                                             24
<210>56
<211>24
<212>DNA
<213>人工的
<220>
<223>引物
<400>56
gccaagatca catgtgcagg aatc                                             24
<210>57
<211>386
<212>PRT
<213>拟南芥(Arabidopsis thaliana)
<400>57
Met Glu Leu Ser Ile Ser Gln Ser Pro Arg Val Arg Phe Ser Ser Leu
1               5                   10                  15
Ala Pro Arg Phe Leu Ala Ala Ser His His His Arg Pro Ser Val His
            20                  25                  30
Leu Ala Gly Lys Phe Ile Ser Leu Pro Arg Asp Val Arg Phe Thr Ser
        35                  40                  45
Leu Ser Thr Ser Arg Met Arg Ser Lys Phe Val Ser Thr Asn Tyr Arg
    50                  55                  60
Lys Ile Ser Ile Arg Ala Cys Ser Gln Val Gly Ala Ala Glu Ser Asp
65                  70                  75                  80
Asp Pro Val Leu Asp Arg Ile Ala Arg Phe Gln Asn Ala Cys Trp Arg
                85                  90                  95
Phe Leu Arg Pro His Thr Ile Arg Gly Thr Ala Leu Gly Ser Thr Ala
            100                 105                 110
Leu Val Thr Arg Ala Leu Ile Glu Asn Thr His Leu Ile Lys Trp Ser
        115                 120                 125
Leu Val Leu Lys Ala Leu Ser Gly Leu Leu Ala Leu Ile Cys Gly Asn
    130                 135                 140
Gly Tyr Ile Val Gly Ile Asn Gln Ile Tyr Asp Ile Gly Ile Asp Lys
145                 150                 155                 160
Val Asn Lys Pro Tyr Leu Pro Ile Ala Ala Gly Asp Leu Ser Val Gln
                165                 170                 175
Ser Ala Trp Leu Leu Val Ile Phe Phe Ala Ile Ala Gly Leu Leu Val
            180                 185                 190
Val Gly Phe Asn Phe Gly Pro Phe Ile Thr Ser Leu Tyr Ser Leu Gly
        195                 200                 205
Leu Phe Leu Gly Thr Ile Tyr Ser Val Pro Pro Leu Arg Met Lys Arg
    210                 215                 220
Phe Pro Val Ala Ala Phe Leu Ile Ile Ala Thr Val Arg Gly Phe Leu
225                 230                 235                 240
Leu Asn Phe Gly Val Tyr His Ala Thr Arg Ala Ala Leu Gly Leu Pro
                245                 250                 255
Phe Gln Trp Ser Ala Pro Val Ala Phe Ile Thr Ser Phe Val Thr Leu
            260                 265                 270
Phe Ala Leu Val Ile Ala Ile Thr Lys Asp Leu Pro Asp Val Glu Gly
        275                 280                 285
Asp Arg Lys Phe Gln Ile Ser Thr Leu Ala Thr Lys Leu Gly Val Arg
    290                 295                 300
Asn Ile Ala Phe Leu Gly Ser Gly Leu Leu Leu Val Asn Tyr Val Ser
305                 310                 315                 320
Ala Ile Ser Leu Ala Phe Tyr Met Pro Gln Val Phe Arg Gly Ser Leu
                325                 330                 335
Met Ile Pro Ala His Val Ile Leu Ala Ser Gly Leu Ile Phe Gln Thr
            340                 345                350
Trp Val Leu Glu Lys Ala Asn Tyr Thr Lys Glu Ala Ile Ser Gly Tyr
        355                 360                 365
Tyr Arg Phe Ile Trp Asn Leu Phe Tyr Ala Glu Tyr Leu Leu Phe Pro
    370                 375                 380
Phe Leu
385
<210>58
<211>379
<212>PRT
<213>稻(Oryza sativa)
<400>58
Met Ala Ser Leu Ala Ser Pro Pro Leu Pro Cys Arg Ala Ala Ala Thr
1               5                   10                  15
Ala Ser Arg Ser Gly Arg Pro Ala Pro Arg Leu Leu Gly Pro Pro Pro
            20                  25                  30
Pro Pro Ala Ser Pro Leu Leu Ser Ser Ala Ser Ala Arg Phe Pro Arg
        35                  40                  45
Ala Pro Cys Asn Ala Ala Arg Trp Ser Arg Arg Asp Ala Val Arg Val
    50                  55                  60
Cys Ser Gln Ala Gly Ala Ala Gly Pro Ala Pro Leu Ser Lys Thr Leu
65                  70                  75                  80
Ser Asp Leu Lys Asp Ser Cys Trp Arg Phe Leu Arg Pro His Thr Ile
                85                  90                  95
Arg Gly Thr Ala Leu Gly Ser Ile Ala Leu Val Ala Arg Ala Leu Ile
            100                 105                 110
Glu Asn Pro Gln Leu lle Asn Trp Trp Leu Val Phe Lys Ala Phe Tyr
        115                 120                 125
Gly Leu Val Al a Leu Ile Cys Gly Asn Gly Tyr Ile Val Gly Ile Asn
    130                  135                 140
Gln Ile Tyr Asp Ile Arg Ile Asp Lys Val Asn Lys Pro Tyr Leu Pro
145                 150                 155                 160
Ile Ala Ala Gly Asp Leu Ser Val Gln Thr Ala Trp Leu Leu Val Val
                165                 170                 175
Leu Phe Ala Ala Ala Gly Phe Ser Ile Val Val Thr Asn Phe Ile Leu
            180                 185                 190
Phe Ile Thr Ser Leu Tyr Cys Leu Ala Leu Phe Leu Gly Thr Ile Tyr
        195                 200                 205
Ser Val Pro Pro phe Arg Leu Lys Arg Tyr Arg Ala Pro Ala Cys Leu
    210                 215                 220
Ile Ile Ala Thr Val Arg Gly Phe Leu Arg Asn Leu Gly Val Tyr Tyr
225                 230                 235                 240
Ala Thr Arg Ala Ala Leu Gly Leu Thr Phe Gln Trp Ser Ser Pro Val
                245                 250                 255
Ala Phe Ile Thr Cys Phe Val Thr Leu Phe Ala Leu Val Ile Ala Ile
            260                 265                 270
Thr Lys Asp Leu Pro Asp Val Glu Gly Asp Arg Lys Tyr Gln Ile Ser
        275                 280                 285
Thr Leu Ala Thr Lys Leu Gly Val Arg Asn Ile Ala Phe Leu Gly Ser
    290                 295                 300
Gly Leu Leu Ile Ala Asn Tyr Val Ala Ala Ile Ala Val Ala Phe Leu
305                 310                 315                 320
Met Pro Gln Ala Phe Arg Arg Thr Val Met Val Pro Val His Ala Ala
                325                 330                 335
Leu Ala Val Gly Ile Ile Phe Gln Thr Trp Val Leu Glu Gln Ala Lys
            340                 345                 350
Tyr Thr Lys Asp Ala Ile Ser Gln Tyr Tyr Arg Phe Ile Trp Asn Leu
        355                 360                 365
Phe Tyr Ala Glu Tyr Ile Phe Phe Pro Leu Ile
    370                 375
<210>59
<211>1423
<212>DNA
<213>拟南芥(Arabidopsis thaliana)
<400>59
ctctcactac agaacataca caagtataat tcgtcgatcg acccacgcgt ccggcagagc      60
aaagagtttt tgtgtggcta gtggcatcaa tggagctctc gatctcacaa tcaccgcgtg     120
ttcggttctc gtctctggcg cctcgtttct tagcagcttc tcatcatcat cgtccttctg     180
tgcatttagc tgggaagttt ataagcctcc ctcgagatgt tcgcttcacg agcttatcaa     240
cttcaagaat gcggtccaaa tttgtttcaa ccaattatag aaaaatctca atccgggcat     300
gttctcaggt tggtgctgct gagtctgatg atccagtgct ggatagaatt gcccggttcc     360
aaaatgcttg ctggagattt cttagacccc atacaatccg cggaacagct ttaggatcca     420
ctgccttggt gacaagagct ttgatagaga acactcattt gatcaaatgg agtcttgtac     480
taaaggcact ttcaggtctt cttgctctta tttgtgggaa tggttatata gtcggcatca     540
atcagatcta cgacattgga atcgacaaag tgaacaaacc atacttgcca atagcagcag     600
gagatctatc agtgcagtct gcttggttgt tagtgatatt ttttgcgata gcagggcttt     660
tagttgtcgg atttaacttt ggtccattca ttacaagcct atactctctt ggcctttttc     720
tgggaaccat ctattctgtt ccacccctca gaatgaaaag attcccagtt gcagcatttc     780
ttattattgc cacggtacga ggtttccttc ttaactttgg tgtgtaccat gctacaagag     840
ctgctcttgg acttccattt cagtggagtg cacctgtggc gttcatcaca tcttttgtga     900
cactgtttgc actggtcatt gctattacaa aggaccttcc tgatgttgaa ggagatcgaa     960
agttccaaat atcaaccctg gcaacaaaac ttggagtgag aaacattgca ttcctcggtt    1020
ctggacttct gctagtaaat tatgtttcag ccatatcact agctttctac atgcctcagg    1080
tttttagagg tagcttgatg attcctgcac atgtgatctt ggcttcaggc ttaattttcc    1140
agacatgggt actagaaaaa gcaaactaca ccaaggaagc tatctcagga tattatcggt    1200
ttatatggaa tctcttctac gcagagtatc tgttattccc cttcctctag ctttcaattt    1260
catggtgagg atatgcagtt ttctttgtat atcattcttc ttcttctttg tagcttggag    1320
tcaaaatcgg ttccttcatg tacatacatc aaggatatgt ccttctgaat ttttatatct    1380
tgcaataaaa atgcttgtcc caaaaaaaaa aaaaaaaaaa aaa                      1423
<210>60
<211>1841
<212>DNA
<213>稻(Oryza sativa)
<400>60
ctcaccgaca ccatccgtag gtcttccagg agctccttcc tgccacgtca tcaatggcga      60
tgatgggtgg ctgacagtca aacgctcccc acgcctcctc cccttccccc ctctctccct     120
ccatggcttc cctcgcctcc cctcctctcc cctgccgcgc cgccgccacc gccagccgca     180
gcgggcgtcc tgctccgcgc ctcctcggcc ctccgccgcc gcccgcttcc cctctcctct     240
cctccgcttc ggcgcgcttc ccgcgtgccc cctgcaacgc cgcacgctgg agccggcgcg     300
acgccgtgcg ggtttgctct caagctggtg cagctggacc agccccatta tcgaagacat     360
tgtcagacct caaggattcc tgctggagat ttttacggcc acatacaatt cgaggaactg     420
ccttgggatc catagcatta gttgctagag ctttgataga gaacccccaa ctgataaatt     480
ggtggttggt attcaaagcg ttctatgggc tcgtggcgtt aatctgtggc aatggttaca     540
tcgttgggat caatcagatc tatgacatta gaatcgataa ggtaaacaag ccatatttac     600
caattgctgc cggtgatctc tcagttcaga cagcatggtt attggtggta ttatttgcag     660
ctgcgggatt ttcaattgtt gtgacaaact ttatactttt cattacctct ctatactgcc     720
ttgctctatt tcttggcacc atatactctg ttcctccatt cagacttaag agatatcgtg     780
cgcctgcatg ccttatcatt gcaacggtcc gcggttttct ccgcaacttg ggtgtgtact     840
atgctactag agcagcactg ggtcttacat tccaatggag ctcgcctgtt gctttcatta     900
catgcttcgt gactttattt gctttggtca ttgctataac caaagatctc ccagatgttg     960
aaggggatcg gaagtatcaa atatcaactt tggcgacaaa gctcggtgtc agaaacattg    1020
catttcttgg ctctggttta ttgatagcaa attatgttgc tgctattgct gtagcttttc    1080
tcatgcctca ggctttcagg cgcactgtaa tggtgcctgt gcatgctgcc cttgccgttg    1140
gtataatttt ccagacatgg gttctggagc aagcaaaata tactaaggat gctatttcac    1200
agtactaccg gttcatttgg aatctcttct atgctgaata catcttcttc ccgttgatat    1260
agagaccaag caatctgata tggtctgcat gttgagtgcg gcaaaaacta gaagcccata    1320
tgaacagtgg gagtaaggga acgaacatgc catccatggg aagactctga taactctctc    1380
tcgcccgggc tgtaaagggt aagcactgtt gtgcatatat atgaaaggaa ggtgataaag    1440
cagggatgct aaattgctac tgggatcctc aaaggcttat agtggtcatc agtggaatgt    1500
gccttaataa tttggttacc tagcagagca agtttttgca ggttattagg taatatcttt    1560
gagggaatga acttagattt cattgtttta aggtctggtc acacaacggg tagtagtgct    1620
ggagcggcaa aagacgacct tgttttacac taccaaggga ggttaactct agttttcatg    1680
tgaccactta ccttgagagt tgagaccatg gaatcacttg tcgactcctc ggcttgtata    1740
tttctagtgt cagcatttgc attctcctcc acacttgtac ttgaagagtt gaagacaact    1800
tttttgtttg tgtatttctg gagtgtcagc atttgcattc c                        1841
<210>61
<211>970
<212>PRT
<213>拟南芥(Arabidopsis thaliana)
<400>61
Met Asp Pro Pro Val Ser Asp Leu Glu Ser Ile Glu Asp Gln Lys Glu
1               5                   10                  15
Gly Gly Pro Ser Phe His Cys Asp Leu Tyr Asp Thr Gln Val Val His
            20                  25                  30
Lys Ile Ala Gln Val Phe Leu Pro Gly Leu Ala Thr Ala Cys Val Asp
        35                  40                  45
Asn Thr Thr Gly Asp Ile Phe Arg Ser Pro Gly Ser Val Ala Ala Asp
    50                  55                  60
Ile Arg Lys Glu Met Ile Glu Tyr Leu Thr Arg Arg Ser Glu Thr Phe
65                  70                  75                  80
Val Ala Glu His Ile Val Leu Gln Gly Gly Ser Glu Ile Glu Ala Ser
                85                  90                  95
His Asp Pro Phe Asp Ile Ile Ser Asp Phe Ile Asp Asp Phe Ala Thr
            100                 105                 110
Ser Lys Arg Asn Leu Phe Ser Arg Val Ser Gly Trp Met Leu Ser Glu
        115                 120                 125
Arg Arg Glu Asp Asn IIe Asp Asp Phe Ala Gln Glu Met Glu Ile Ser
    130                 135                 140
Gly Phe Trp Leu Thr Asp His Arg Glu Gly Ile Ala Gln Thr Leu Leu
145                 150                 155                 160
Lys Asn Val Asp Phe Lys Ser Ser Ala His Cys Glu Met Lys Phe Gln
                165                 170                 175
Thr Glu Gly Glu Leu Ala Glu His Ala Met Asn Cys Gly Tyr Arg Thr
            180                 185                 190
Met Asn Cys Glu Asn Glu Gly Cys Thr Ala Val Phe Cys Ala Asn Gln
        195                 200                 205
Met Glu Asn His Asp Ser Val Cys Pro Phe Lys Ile Ile Pro Cys Glu
    210                 215                 220
Gln Asn Cys Ser Glu Ser Ile Met Arg Arg Asp Met Asp Arg His Cys
225                 230                 235                 240
Ile Thr Val Cys Pro Met Lys Leu Val Asn Cys Pro Phe His Ser Val
                245                 250                 255
Gly Cys Leu Ser Asp Val His Gln Cys Glu Val Gln Gln His His Leu
            260                 265                 270
Asp Asn Val Ser Ser His Leu Met Tyr Ile Leu Arg Ser Ile Tyr Lys
        275                 280                 285
Glu Ala Ser Leu Asp Asp Leu Lys Pro Arg Ala Glu Gln Ile Gln Gln
    290                 295                 300
Leu Ser Thr Arg Leu Ser Glu Ala Arg Asn Ala Arg Ser Leu Thr Asn
305                 310                 315                 320
Leu Val Lys Glu Ile Asp Gly Lys Leu Gly Pro Leu Glu Ile Lys Pro
                325                 330                 335
Lys Ile Val Thr Asp Ser Glu Ser Asp Lys Pro Glu Asn Thr Glu Lys
            340                 345                 350
Lys Ala Leu Glu Glu Ala Glu Ile Lys Glu Lys Pro Glu Thr Ser Asn
        355                 360                 365
Leu Lys Ala Val Thr Leu Glu Gln Thr Ala Arg Glu Ala Pro Glu Asp
    370                 375                 380
Lys Leu Val Ser Lys Glu Val Asp Ala Ala Met Val Lys Glu Ala Ala
385                 390                 395                 400
Lys Lys Val Ser Glu Ala Glu Ile Ala Asp Asn Val Asn Glu Glu Gly
                405                 410                 415
Glu Leu Lys Ala Gln Lys Leu Leu Glu Ile Gly Glu Phe Ile Lys Glu
            420                 425                 430
Gly Asp Asn Asn Ser Ala Asp Asp Leu Ser Glu Arg Thr Glu Thr Lys
        435                 440                 445
Ala Pro Glu Val Val Val Met Asp Glu Ala Arg Glu Glu Glu Asp Ser
    450                 455                 460
Val Glu Thr Lys Asp Thr Arg Thr Tyr Glu Thr Ile Arg Gly Leu Glu
465                 470                 475                 480
Ile Glu Ala Asn Glu Met Ile Asp Glu Glu Thr Lys Lys Ser Thr Glu
                485                 490                 495
Thr Lys Thr Glu Ala Pro Ser Arg Ile Val Met Asp Lys Glu Gly Asp
            500                 505                 510
Glu Glu Thr Lys Lys Ser Thr Glu Thr Glu Thr Glu Ala Pro Ser Arg
        515                 520                 525
Ile Val Met Glu Thr Glu Lys Asp Glu Glu Thr Met Asn Ser Arg Ala
    530                 535                 540
Arg Ala Ser Asp Glu Ala Glu Ala Leu Ser Lys Ser Ser Gln Val Ala
545                 550                 555                 560
Ser Met Glu Leu Ser Ile Ser Gln Ser Pro Arg Val Arg Phe Ser Ser
                565                 570                 575
Leu Ala Pro Arg Phe Leu Ala Ala Ser His His His Arg Pro Ser Val
            580                 585                 590
His Leu Ala Gly Lys Phe Ile Ser Leu Pro Arg Asp Val Arg Phe Thr
        595                 600                 605
Ser Leu Ser Thr Ser Arg Met Arg Ile Leu Ala Val Ala Leu Thr Phe
    610                 615                 620
Lys Ser Arg Cys Val Tyr Val Asn Tyr Glu Ile Pro Lys Asp Gln Ile
625                 630                 635                 640
Leu Val Gly Ala Ala Glu Ser Asp Asp Pro Val Leu Asp Arg Ile Ala
                645                 650                 655
Arg Phe Gln Asn Ala Cys Trp Arg Phe Leu Arg Pro His Thr Ile Arg
            660                 665                 670
Gly Thr Ala Leu Gly Ser Thr Ala Leu Val Thr Arg Ala Leu Ile Glu
        675                 680                 685
Asn Thr His Leu Ile Lys Trp Ser Leu Val Leu Lys Ala Leu Ser Gly
    690                 695                 700
Leu Leu Ala Leu Ile Cys Gly Asn Gly Tyr Ile Val Gly Ile Asn Gln
705                 710                 715                 720
Ile Tyr Asp Ile Gly Ile Asp Lys Val Asn Lys Pro Tyr Leu Pro Ile
                725                 730                  735
Ala Ala Gly Asp Leu Ser Val Gln Ser Ala Trp Leu Leu Val Ile Phe
            740                 745                 750
Phe Ala Ile Ala Gly Leu Leu Val Val Gly Phe Asn Phe Gly Pro Phe
        755                 760                 765
Ile Thr Ser Leu Tyr Ser Leu Gly Leu Phe Leu Gly Thr Ile Tyr Ser
    770                 775                 780
Val Pro Pro Leu Arg Met Lys Arg Phe Pro Val Ala Ala Phe Leu Ile
785                 790                 795                 800
Ile Ala Thr Val Arg Gly Phe Leu Leu Asn Phe Gly Val Tyr His Ala
                805                 810                 815
Thr Arg Ala Ala Leu Gly Leu Pro Phe Gln Trp Ser Ala Pro Val Ala
            820                 825                 830
Phe Ile Thr Ser Phe Val Thr Leu Phe Ala Leu Val Ile Ala Ile Thr
        835                 840                 845
Lys Asp Leu Pro Asp Val Glu Gly Asp Arg Lys Phe Gln Ile Ser Thr
    850                 855                 860
Leu Ala Thr Lys Leu Gly Val Arg Asn Ile Ala Phe Leu Gly Ser Gly
865                 870                 875                 880
Leu Leu Leu Val Asn Tyr Val Ser Ala Ile Ser Leu Ala Phe Tyr Met
                885                 890                 895
 Pro Gln Tyr Ala Ala Leu Lys Arg Pro Thr Leu Leu Ser Phe Asn Asn
             900                 905                 910
Glu Gln Val Phe Arg Gly Ser Leu Met Ile Pro Ala His Val Ile Leu
        915                 920                 925
 Ala Ser Gly Leu Ile Phe Gln Thr Trp Val Leu Glu Lys Ala Asn Tyr
     930                 935                 940
 Thr Lys Glu Ala Ile Ser Gly Tyr Tyr Arg Phe Ile Trp Asn Leu Phe
 945                 950                 955                 960
 Tyr Ala Glu Tyr Leu Leu Phe Pro Phe Leu
                 965                 970
<210>62
<211>441
<212>PRT
<213>拟南芥(Arabidopsis thaliana)
<400>62
Met Glu Leu Ser Ile Ser Gln Ser Pro Arg Val Arg Phe Ser Ser Leu
1               5                   10                  15
Ala Pro Arg Phe Leu Ala Ala Ser His His His Arg Pro Ser Val His
            20                  25                  30
Leu Ala Gly Lys Phe Ile Ser Leu Pro Arg Asp Val Arg Phe Thr Ser
        35                  40                  45
Leu Ser Thr Ser Arg Met Arg Ser Lys Phe Val Ser Thr Asn Tyr Arg
    50                  55                  60
Lys Ile Ser Ile Arg Ser Val Cys Ala Phe Cys Asn Gly Thr His Lys
65                  70                  75                  80
Ser Arg Tyr Tyr Gln Ala Cys Ser Gln Val Gly Ala Ala Glu Ser Asp
                85                  90                  95
Asp Pro Val Leu Asp Arg Ile Ala Arg Phe Gln Asn Ala Cys Trp Arg
            100                 105                 110
Phe Leu Arg Pro His Thr Ile Arg Gly Thr Ala Leu Gly Ser Thr Ala
        115                 120                 125
Leu Val Thr Arg Ala Leu Ile Glu Asn Thr His Leu Ile Lys Trp Ser
    130                 135                 140
Leu Val Leu Lys Ala Leu Ser Gly Leu Leu Ala Leu Ile Cys Gly Asn
145                 150                 155                 160
Gly Tyr Ile Val Gly Ile Asn Gln Ile Tyr Asp Ile Gly Ile Asp Lys
                165                 170                 175
Val Asn Lys Pro Tyr Leu Pro Ile Ala Ala Gly Asp Leu Ser Val Gln
            180                 185                 190
Ser Ala Trp Leu Leu Val Ile Phe Phe Ala Ile Ala Gly Leu Leu Val
        195                 200                 205
Val Gly Phe Asn Phe Gly Pro Phe Ile Thr Ser Leu Tyr Ser Leu Gly
    210                 215                 220
Leu Phe Leu Gly Thr Ile Tyr Ser Val Pro Pro Leu Arg Met Lys Arg
225                 230                 235                 240
Phe Pro Val Ala Ala Phe Leu Ile Ile Ala Thr Val Arg Gly Phe Leu
                245                 250                 255
Leu Asn Phe Gly Val Tyr His Ala Thr Arg Ala Ala Leu Gly Leu Pro
            260                 265                 270
Phe Gln Trp Ser Ala Pro Val Ala Phe Ile Thr Ser Phe Val Thr Leu
        275                 280                 285
Phe Ala Leu Val Ile Ala Ile Thr Lys Asp Leu Pro Asp Val Glu Gly
    290                 295                 300
Asp Arg Lys Phe Gln Ile Ser Thr Leu Ala Thr Lys Leu Gly Val Arg
305                 310                 315                 320
Asn Ile Ala Phe Leu Gly Ser Gly Leu Leu Leu Val Asn Tyr Val Ser
                325                 330                 335
Ala Ile Ser Leu Ala Phe Tyr Met Pro Gln Tyr Ala Ala Leu Lys Arg
            340                 345                 350
Pro Thr Leu Leu Ser Phe Ash Ash Glu Gln Val Phe Arg Gly Ser Leu
        355                 360                 365
Met Ile Pro Ala His Val Ile Leu Ala Ser Gly Leu Ile Phe Gln Thr
    370                 375                 380
Trp Val Leu Glu Lys Ala Asn Tyr Thr Lys Ser Ile Cys Tyr Ser Pro
385                 390                 395                 400
Ser Ser Ser Phe Gln Phe His Gly Glu Asp Met Gln Phe Ser Leu Tyr
                405                 410                 415
Ile Ile Leu Leu Leu Leu Cys Ser Leu Glu Ser Lys Ser Val Pro Ser
            420                 425                 430
Cys Thr Tyr Ile Lys Asp Met Ser Phe
        435                 440
<210>63
<211>155
<212>DNA
<213>拟南芥(Arabidopsis thaliana)
<400>63
gtgtggctag tggcatcaat ggagctctcg atctcacaat caccgcgtgt tcggttctcg      60
tctctggcgc ctcgtttctt agcagcttct catcatcatc gtccttctgt gcatttagct     120
gggaagttta taagcctccc tcgagatgtt cgctt                                155
<210>64
<211>626
<212>DNA
<213>蒺藜苜蓿(Medicago truncatula)
<400>64
gctccttatg gagctctcta cttcttcatc atcttctctt cattcacatt ccataattcc      60
cacatggaat tccaaaaact actactcttt caaaccaccc atttcagcta agtccacaac     120
cccaaaatct tccaaacggt ttggttcaat tgggctgcac catcatcatc acacaagttt     180
ctctgctcat gtttcaaaac cgaagagaca gtgtaaaccc atttccatca gggcctgcag     240
tgaagttgga gctgctggat ctgatcgtcc atttgctgac aaagttttag attttaaaga     300
tgcattctgg agatttttaa ggccacatac tatccgtggg acagcattag gctcttttgc     360
tttggtgtca agagcgttga ttgagaactc aaatctgata aagtggtctc ttttgttgaa     420
agcactctct ggactttttg ctctgatttg tgggaatggt tatatagttg gcatcaatca     480
aatatatgat atcggcattg acaaggtaaa caaaccttat ttacctatag ctgcaggaga     540
tctttctgtc caatctgcat ggtacttggt tatattcttt gcagcagctg gccttttgac     600
tgtaggattg aactttggat ctttta                                          626
<210>65
<211>651
<212>DNA
<213>蒺藜苜蓿(Medicago truncatula)
<400>65
cttcagctcc ttatggagct ctctacttct tcatcatctt ctcttcattc acattccata      60
attcccacat ggaattccaa aaactactac tctttcaaac cacccatttc agctaagtcc     120
acaaccccaa aatcttccaa acggtttggt tcaattgggc tgcaccatca tcatcacaca     180
agtttctctg ctcatgtttc aaaaccgaag agacagtgta aacccatttc catcagggcc     240
tgcagtgaag ttggagctgc tggatctgat cgtccatttg ctgacaaagt tttagatttt     300
aaagatgcat tctggagatt tttaaggcca catactatcc gtgggacagc attaggctct     360
tttgctttgg tgtcaagagc gttgattgag aactcaaatc tgataaagtg gtctcttttg     420
ttgaaagcac tctctggact ttttgctctg atttgtggga atggttatat agttggcatc     480
aatcaaatat atgatatcgg cattgacaag gtaaacaaac cttatttacc tatagctgca     540
ggagatcttt ctgtccaatc tgcatggtac ttggttatat tctttgcagc agctggcctt     600
ttgactgtag gattgaactt tggatcttta ttttttctct ttactccttc g              651
<210>66
<211>651
<212>DNA
<213>蒺藜苜蓿(Medicago truncatula)
<400>66
cttcagctcc ttatggagct ctctacttct tcatcatctt ctcttcattc acattccata      60
attcccacat ggaattccaa aaactactac tctttcaaac cacccatttc agctaagtcc     120
acaaccccaa aatcttccaa acggtttggt tcaattgggc tgcaccatca tcatcacaca     180
agtttctctg ctcatgtttc aaaaccgaag agacagtgta aacccatttc catcagggcc     240
tgcagtgaag ttggagctgc tggatctgat cgtccatttg ctgacaaagt tttagatttt     300
aaagatgcat tctggagatt tttaaggcca catactatcc gtgggacagc attaggctct     360
tttgctttgg tgtcaagagc gttgattgag aactcaaatc tgataaagtg gtctcttttg     420
ttgaaagcac tctctggact ttttgctctg atttgtggga atggttatat agttggcatc     480
aatcaaatat atgatatcgg cattgacaag gtaaacaaac cttatttacc tatagctgca     540
ggagatcttt ctgtccaatc tgcatggtac ttggttatat tctttgcagc agctggcctt     600
ttgactgtag gattgaactt tggatcttta ttttttctct ttactccttc g              651
<210>67
<211>614
<212>DNA
<213>蒺藜苜蓿(Medicago truncatula)
<400>67
gttgagtgtt gcttcagctc cttatggagc tctctacttc ttcatcatct tctcttcatt      60
cacattccat aattcccaca tggaattcca aaaactacta ctctttcaaa ccacccattt     120
cagctaagtc cacaacccca aaatcttcca aacggtttgg ttcaattggg ctgcaccatc     180
atcatcacac aagtttctct gctcatgttt caaaaccgaa gagacagtgt aaacccattt     240
ccatcagggc ctgcagtgaa gttggagctg ctggatctga tcgtccattt gctgacaaag     300
ttttagattt taaagatgca ttctggagat ttttaaggcc acatactatc cgtgggacag     360
cattaggctc ttttgctttg gtgtcaagag cgttgattga gaactcaaat ctgataaagt     420
ggtctctttt gttgaaagca ctctctggac tttttgctct gatttgtggg aatggttata     480
tagttggcat caatcaaata tatgatatcg gcattgacaa ggtaaacaaa ccttatttac     540
ctatagctgc aggagatctt tctgtaccaa tctgcatggt acttggttat attctttgca     600
acagctggcc tttt                                                       614
<210>68
<211>560
<212>DNA
<213>马铃薯(Solanum tuberosum)
<400>68
gacccttttc ccatatattt atccacttac caccttatcc tcttgaggtt gaacaaattc      60
attcttcctt tggtatggag atacagggtg ttacaataga caaaattgac tcacacaaga     120
aacattccat ctcctaagga tagattgatg aatttcctaa gaatatacaa caacaggata     180
aataaattct ccatcccccc catctctata gacaattttc ctttgcaaac cagaaagaaa     240
acttgcattt cttcgaggtc catcgaacaa aaacctttat caagtagatt ttagatgaaa     300
ggaaagatga tgtactccgc atagaaaaga ttccatataa atctatagta tgctgagatt     360
gcttccttgg tgtaatttgc tctttccaac aaccatgcct ggaaaactaa acacgatgct     420
aagatgacat gtacaggtat catcaagcta cacctgaatg cttggggcat gtatattgct     480
gcaactacag caccaatgta atttgttaat aatagaccag aaccaaggaa tgctatgttt     540
ctcacaccaa gctttgttgc                                                 560
<210>69
<211>371
<212>DNA
<213>拟南芥(Arabidopsis thaliana)
<400>69
caattggtac aagcattttt attgcaagat ataaaaattc agaaggacat atccttgatg      60
tatgtacatg aaggaaccga ttttgactcc aagctacaaa gaagaagaag aatgatatac     120
aaagaaaact gcatatcctc accatgaaat tgaaagctag aggaagggga ataacagata     180
ctctgcgtag aagagattcc atataaaccg ataatatcct gagatagctt ccttggtgta     240
gtttgctttt tctagtaccc atgtctggaa aattaagcct gaagccaaga tcacatgtgc     300
aggaatcatc aagctacctc taaaaacctg aggcatgtag aaagctagtg atatggctga     360
aacataattt a                                                          371
<210>70
<211>357
<212>DNA
<213>拟南芥(Arabidopsis thaliana)
<400>70
ggtacaagca tttttattgc aagatataaa aattcagaag gacatatcct tgatgtatgt      60
acatgaagga accgattttg actccaagct acaaagaaga agaagaatga tatacaaaga     120
aaactgcata tcctcaccat gaaattgaaa gctagaggaa ggggaataac agatactctg     180
cgtagaagag attccatata aaccgataat atcctgagat agcttccttg gtgtagtttg     240
ctttttctag tacccatgtc tggaaaatta agcctgaagc caagatcaca ctggttgcag     300
gaactcatca agctaccctc taaaaaaacc gtgaggcaac tgctaggaaa acaggcc        357
<210>71
<211>560
<212>DNA
<213>蒺藜苜蓿(Medicago truncatula)
<220>
<221>misc_feature
<222>(537)..(537)
<223>未知的
<400>71
tgccacaggc tttcaggaga tggttactga taccagctca tgcaatattt gcttcaagct      60
taatttacca ggtgcagata ttagaaaaag caaattatac aaaggaagca atatcaggat     120
tctatcgatt catatggaat ctgttctatg ccgagtatgc attatttcct ttcatctagc     180
aaactgtgct acatttttac ttggaaaaat tgcacacatg catccaaaaa tgcagcggtt     240
gcttgaccaa agccggtcaa taagacaaag ccgttcaata agaaaaatct tagttatatc     300
gagtatctat tcttaaagta ttaacaattt tttttaatgg tttgagtaaa tttttgtata     360
tagtatagtg cttcctttta atgagatgta ttgccatgag aattgtatac aacggccaga     420
tttcatttgt gttggaacaa attccactgg tgaatgtgat aatatactca tgtgaactct     480
acccaaaaat aaaataaaat aaaaaaaaaa aaaaaaaaaa aaaaataaaa aaaaaanaaa     540
aataaaaaaa cgtcgagggg                                                 560
<210>72
<211>713
<212>DNA
<213>大豆
<220>
<221>misc_feature
<222>(13)..(13)
<223>未知的
<220>
<221>misc_feature
<222>(679)..(679)
<223>未知的
<220>
<221>misc_feature
<222>(681)..(683)
<223>未知的
<220>
<221>misc_feature
<222>(686)..(693)
<223>未知的
<220>
<221>misc_feature
<222>(28)..(29)
<223>未知的
<220>
<221>misc_feature
<222>(634)..(635)
<223>未知的
<220>
<221>misc_feature
<222>(637)..(637)
<223>未知的
<220>
<221>misc_feature
<222>(643)..(643)
<223>未知的
<220>
<221>misc_feature
<222>(658)..(660)
<223>未知的
<220>
<221>misc_feature
<222>(664)..(664)
<223>未知的
<220>
<221>misc_feature
<222>(669)..(670)
<223>未知的
<220>
<221>misc_feature
<222>(672)..(674)
<223>未知的
<400>72
aaatgcgatg ganagccgat gacgcctnna tatacaaaaa tactcattaa aaaaatagct      60
agtttactaa ttgatacttg agacaacaaa gaagatctct ctaactatgc acgtatgcac     120
cttttcccaa gaaaaatgta gcaaggcttg ctatatgaaa ggaaatattg catactcagc     180
atagaacaga ttccatatga atcgatagaa tcctgatatt gcatccttgg tataatttgc     240
ttgttctaat atccatgcct ggtaaatcaa gcttattgca aaaatcgtat gagccggtat     300
gagtaaccaa cgcctgaaag cctgaggcat ataaattgct gccaaaacag aaacaatata     360
gttcaccaac aaaattccag aaccaaggaa agcaatgttc cgaactccta attttgtggc     420
aaaggttgat atctgatact tgcgatctcc ttcaacatca ggaagatctt ttgttatagc     480
aattaccagt gcgaaaaatg ttacaaatgt tgtgataaaa accacaggag agctccattc     540
aaatgcaagc ccaagggcag ctctagtggc atagtacaca ccaaagttaa agagaaaacc     600
ccgaaccgtg gcaattataa gaaatgctgc aacnngnaag cgnttcattc taaatggnnn     660
aacngaatnn annntaccna nnnaannnnn nnntgtgtaa agagaaaaaa tga            713
<210>73
<211>56
<212>DNA
<213>人工的
<220>
<223>引物
<400>73
cgcgatttaa atggcgcgcc ctgcaggcgg ccgcctgcag ggcgcgccat ttaaat          56
<210>74
<211>32
<212>DNA
<213>人工的
<220>
<223>引物
<400>74
tcgaggatcc gcggccgcaa gcttcctgca gg                                    32
<210>75
<211>32
<212>DNA
<213>人工的
<220>
<223>引物
<400>75
tcgacctgca ggaagcttgc ggccgcggat cc                                    32
<210>76
<211>32
<212>DNA
<213>人工的
<220>
<223>引物
<400>76
tcgacctgca ggaagcttgc ggccgcggat cc                                    32
<210>77
<211>32
<212>DNA
<213>人工的
<220>
<223>引物
<400>77
tcgaggatcc gcggccgcaa gcttcctgca gg                                    32
<210>78
<211>36
<212>DNA
<213>人工的
<220>
<223>引物
<400>78
tcgaggatcc gcggccgcaa gcttcctgca ggagct                                36
<210>79
<211>28
<212>DNA
<213>人工的
<220>
<223>引物
<400>79
cctgcaggaa gcttgcggcc gcggatcc                                         28
<210>80
<211>36
<212>DNA
<213>人工的
<220>
<223>引物
<400>80
tcgacctgca ggaagcttgc ggccgcggat ccagct                                36
<210>81
<211>28
<212>DNA
<213>人工的
<220>
<223>引物
<400>81
ggatccgcgg ccgcaagctt cctgcagg                                         28
<210>82
<211>39
<212>DNA
<213>人工的
<220>
<223>引物
<400>82
gatcacctgc aggaagcttg cggccgcgga tccaatgca                             39
<210>83
<211>31
<212>DNA
<213>人工的
<220>
<223>引物
<400>83
ttggatccgc ggccgcaagc ttcctgcagg t                                     31
<210>84
<211>31
<212>DNA
<213>人工的
<220>
<223>引物
<400>84
cacatatggc atgttctcag gttggtgctg c                                     31
<210>85
<211>29
<212>DNA
<213>人工的
<220>
<223>引物
<400>85
gcgtcgacct agaggaaggg gaataacag                                        29
<210>86
<211>31
<212>DNA
<213>人工的
<220>
<223>引物
<400>86
caaccatggc atgttctcag gttggtgctg c                                     31
<210>87
<211>29
<212>DNA
<213>人工的
<220>
<223>引物
<400>87
gcgtcgacct agaggaaggg gaataacag                                        29
<210>88
<211>1290
<212>DNA
<213>红海束毛蓝细菌(Trichodesmium erythraeum)
<400>88
atgggaaaaa ttgctggttc tcaacaggga aaaattacaa cgaattggct acaaaaatat      60
gtgccatggc tttatagttt ttggaagttt gctcgcccac atacgattat tggtacatcg     120
ttaagtgtgc tggctttata tataattgcc atgggcgatc gctctaattt ttttgacaaa     180
tatttttttt tatacagctt aattctgtta ttgataactt ggattagttg tttatgtgga     240
atgggaaaaa ttgctggttc tcaacaggga aaaattacaa cgaattggct acaaaaatat     300
gtgccatggc tttatagttt ttggaagttt gctcgcccac atacgattat tggtacatcg     360
ttaagtgtgc tggctttata tataattgcc atgggcgatc gctctaattt ttttgacaaa     420
tatttttttt tatacagctt aattctgtta ttgataactt ggattagttg tttatgtgga     480
aatatttata tagtaggatt aaatcaatta gaggatatag aaatagatag gattaataag     540
cctcatctcc ctatagctgc tggtgagttt tctcgttttt ctggtcaaat aattgtggta     600
ataacgggta ttttggcttt gagttttgcc gggttggggg gacctttttt gttgggtaca     660
gtggggataa gtttggcaat tggtacggct tattctttac ctcctattcg attaaaaaga     720
tttcctgttt tggccgcatt atgtattttt actgtgcggg gagttattgt taatttgggt     780
atatttttaa gctttgtttg ggggtttgaa aaggttgagg aggtttcagg aggtttaatt     840
aaatggatgg gtgagttggg tgaggttgtt ctacttcaaa aaagcttgat ggttccagaa     900
attcctctga cggtatgggc tttaactttg tttgtgatag tatttacttt tgctattgct     960
atttttaagg atattccaga tattgagggt gaccgtcaat ataatattaa tacgtttacg    1020
attaagttgg gagcatttgc tgtttttaat ttggcaaggt gggtattgac tttttgctat    1080
ctgggtatgg tgatggtggg tgtagtttgg ttggcgagtg ttaatttatt ttttttggtg    1140
attagtcatt tattggcttt gggtataatg tggtggttta gtcaaagggt agatctgcat    1200
gataaaaagg cgatcgctga tttttatcaa tttatttgga aattattttt cctggaatat    1260
ctaatttttc ctatggcttg ttttttttaa                                     1290
<210>89
<211>903
<212>DNA
<213>橙色绿屈挠菌(Chloroflexus aurantiacus)
<400>89
atgcgcaaac agctacgcct gctcattgaa tttgcccgtc cccacaccgt cattgctacc      60
agcgtccagg ttctgaccat gctgatcatc gtgatcggct ggcacccacc aacgctcgaa     120
ctggtgggac tggtcggggt gacgctcgtt gtctgtctgg cgctcaatct ctacgtagtc     180
ggcgtgaatc aactgaccga tgtggcgatt gatcggatca acaagccatg gctaccggtt     240
gctgccggtc agctttcatc ggatgctgcg caacgtattg ttatcagtgc cctgtttatt     300
gccctgaccg gtgcggctat gctcggccca ccgctctggt ggacggtgag tatcatcgcg     360
ctgatcggtt cactctactc gctccccccg ctgcgcttga agcgtcatcc cctcgctgcg     420
gccctcagta ttgccggtgc ccgcggggtg attgccaatc tcggcctggc cttccactat     480
cagtactggt tagatagcga attgccgatc acgaccctga tcctggtggc aaccttcttt     540
ttcggtttcg ctatggtgat cgcgctctat aaagacttgc ccgatgatcg cggtgatcgg     600
ttgtatcaga tcgagaccct gaccacgcgc ctcggcccgc agcgagtgct gcacctgggc     660
agaatcttgc tcaccgcctg ttatctgctt ccgattgccg tcggtctctg gtcgctgccg     720
acttttgccg ccgcgttcct ggccctcagc catgtggtcg ttatcagtgt tttctggctg     780
gtcagtatgc gcgttgatct gcaacgccgg caatcgattg ccagttttta tatgtttctg     840
tgggggattt tttataccga atttgccctg cttagcattt atcgtctgac gtataccctc     900
tga                                                                   903
<210>90
<211>389
<212>PRT
<213>大豆
<400>90
Met Glu Leu Ser Leu Ser Pro Thr Ser His Arg Val Pro Ser Thr Ile
1               5                   10                  15
Pro Thr Leu Asn Ser Ala Lys Leu Ser Ser Thr Lys Ala Thr Lys Ser
            20                  25                  30
Gln Gln Pro Leu Phe Leu Gly Phe Ser Lys His Phe Asn Ser Ile Gly
        35                  40                  45
Leu His His His Ser Tyr Arg Cys Cys Ser Asn Ala Val Pro Glu Arg
    50                  55                  60
Pro Gln Arg Pro Ser Ser Ile Arg Ala Cys Thr Gly Val Gly Ala Ser
65                  70                  75                  80
Gly Ser Asp Arg Pro Leu Ala Glu Arg Leu Leu Asp Leu Lys Asp Ala
                85                  90                  95
Cys TTp Arg Phe Leu Arg Pro His Thr Ile Arg Gly Thr Ala Leu Gly
             100                 105                 110
 Ser Phe Ala Leu Val Ala Arg Ala Leu Ile Glu Asn Thr Asn Leu Ile
         115                 120                 125
 Lys Trp Ser Leu Phe Phe Lys Ala Phe Cys Gly Leu Phe Ala Leu Ile
     130                 135                 140
Cys Gly Asn Gly Tyr Ile Val Gly Ile Asn Gln Ile Tyr Asp Ile Ser
145                 150                 155                 160
Ile Asp Lys Val Asn Lys Pro Tyr Leu Pro Ile Ala Ala Gly Asp Leu
                165                 170                 175
Ser Val Gln Ser Ala Trp Phe Leu Val Ile Phe Phe Ala Ala Ala Gly
            180                 185                 190
Leu Ser Ile Ala Gly Leu Asn Phe Gly Pro Phe Ile Phe Ser Leu Tyr
        195                 200                 205
Thr Leu Gly Leu Phe Leu Gly Thr Ile Tyr Ser Val Pro Pro Leu Arg
    210                 215                 220
Met Lys Arg Phe Pro Val Ala Ala Phe Leu Ile Ile Ala Thr Val Arg
225                 230                 235                 240
Gly Phe Leu Leu Asn Phe Gly Val Tyr Tyr Ala Thr Arg Ala Ser Leu
                245                 250                 255
Gly Leu Ala Phe Glu Trp Ser Ser Pro Val Val Phe Ile Thr Thr Phe
            260                 265                 270
Val Thr Phe Phe Ala Leu Val Ile Ala Ile Thr Lys Asp Leu Pro Asp
        275                 280                 285
Val Glu Gly Asp Arg Lys Tyr Gln Ile Ser Thr Phe Ala Thr Lys Leu
    290                 295                 300
Gly Val Arg Asn Ile Ala Phe Leu Gly Ser Gly Ile Leu Leu Val Asn
305                 310                 315                 320
Tyr Ile Val Ser Val Leu Ala Ala Ile Tyr Met Pro Gln Ala Phe Arg
                325                 330                 335
Arg Trp Leu Leu Ile Pro Ala His Thr Ile Phe Ala Ile Ser Leu Ile
            340                 345                 350
Tyr Gln Ala Arg Ile Leu Glu Gln Ala Asn Tyr Thr Lys Asp Ala Ile
        355                 360                 365
Ser Gly Phe Tyr Arg Phe Ile Trp Asn Leu Phe Tyr Ala Glu Tyr Ala
    370                 375                 380
Ile Phe Pro Phe Ile
385
<210>91
<211>1427
<212>DNA
<213>大豆
<400>91
ttgcaatgta acattatgaa atatgttaat ggcattacgt caaagtaaaa ggaaatagta      60
tcacatttat atacaacaat actcatttta aaaaaataat gatagctagt ttaccaattg     120
acacttgata aacaaagatc tctctaacta tgcacgtatg caccttttcc caagaaaaaa     180
gtagcaaggt ttgctatatg aaaggaaata ttgcatactc agcatagaac agattccata     240
tgaatcgata gaatcctgat attgcatcct tggtataatt tgcttgttct aatattcgtg     300
cctggtaaat caagcttatt gcaaaaattg tatgagctgg tatgagtaac caacgcctga     360
aagcctgagg catataaatt gctgccaaaa cagaaacaat ataattcacc agcaaaattc     420
cagaaccaag gaaagcaatg ttccgaactc ctaattttgt agcaaaggtt gatatctgat     480
acttgcgatc accttcaaca tcaggaagat cttttgttat agcaattacc agtgcgaaaa     540
atgttacaaa tgttgtgata aaaaccacag gagagctcca ttcaaatgca agcccaaggg     600
aagctctagt ggcatagtac acaccaaagt taaggagaaa accacgtacc gtggcaatta     660
taagaaatgc tgcaacagga aagcgtttca tcctcaatgg aggaacagaa tagatggttc     720
ccaagaaaag gccaagtgtg taaagagaaa aaatgaaagg cccaaagttc aaccctgcaa     780
tcgacaggcc agctgctgca aaaaatataa ccaagaacca tgcagattgg acagaaagat     840
ctccagcagc tataggtaaa taaggtttgt ttaccttgtc aatgctaatg tcatagattt     900
gattgatgcc aactatataa ccattcccac aaatcagggc aaaaagacca cagaaagctt     960
tgaaaaaaag agaccacttt atcaaattcg tgttctcaat caatgctctt gccaccaaag    1020
caaatgaacc tagtgctgta ccacgtatag tatgtggcct taaaaatctc caacaagcat    1080
ctttcaaatc taaaagtctt tcagctaatg gacgatcaga tccagaagct ccaactccag    1140
tgcaagccct tatggaactg ggtctttggg gtctctcggg aacagcattt gagcagcatc    1200
tgtaactgtg atggtgcaac ccaattgagt tgaagtgttt ggaaaatcct aagaacaaag    1260
gttgttgtga cttggtggcc ttagtggatg atagtttagc ggaattcaaa gtgggaattg    1320
tggaaggaac acgatgtgaa gttggagaga gtgagagctc cataaggagc tgagcacagc    1380
aaacgagaaa acactccaaa tttcagacgc aacgcaaggc aaaaacc                  1427
<210>92
<211>12
<212>PRT
<213>人工的
<220>
<223>保守基序
<220>
<221>MISC_FEATURE
<222>(1)..(1)
<223>x=w,i,或y
<220>
<221>MISC_FEATURE
<222>(2)..(2)
<223>x=r,e,或k
<220>
<221>MISC_FEATURE
<222>(4)..(4)
<223>x=l,a,或s
<220>
<221>MISC_FEATURE
<222>(4)..(4)
<223>x=l,a,或s
<220>
<221>MISC_FEATURE
<222>(9)..(9)
<223>x=i或v
<220>
<221>MISC_FEATURE
<222>(10)..(10)
<223>x=i或r
<220>
<221>MISC_FEATURE
<222>(11)..(11)
<223>x=g或a
<400>92
Xaa Xaa Phe Xaa Arg Pro His Thr Xaa Xaa Xaa Thr
1               5                   10
<210>93
<211>26
<212>PRT
<213>人工的
<220>
<223>保守基序
<220>
<221>MISC_FEATURE
<222>(2)..(2)
<223>x=v,i,l,或g
<220>
<221>MISC_FEATURE
<222>(7)..(7)
<223>x=i,l,或v
<220>
<221>MISC_FEATURE
<222>(10)..(10)
<223>x=i或1
<220>
<221>MISC_FEATURE
<222>(11)..(11)
<223>x=s,f,y,e,w,或t
<220>
<221>MISC_FEATURE
<222>(13)..(13)
<223>x=v或i
<220>
<221>MISC_FEATURE
<222>(14)..(14)
<223>x=r,s,g,e,d,或a
<220>
<221>MISC_FEATURE
<222>(17)..(17)
<223>x=k或r
<220>
<221>MISC_FEATURE
<222>(18)..(18)
<223>x=v或i
<220>
<221>MISC_FEATURE
<222>(22)..(22)
<223>x=y,d,t,w,n,或h
<220>
<221>MISC_FEATURE
<222>(25)..(25)
<223>x=i,v,或l
<400>93
Asn Xaa Tyr Ile Val Gly Xaa Asn Gln Xaa Xaa Asp Xaa Xaa Ile Asp
1               5                   10                  15
Xaa Xaa Asn Lys Pro Xaa Leu Pro Xaa Ala
            20                  25
<210>94
<211>14
<212>PRT
<213>人工的
<220>
<223>保守基序
<220>
<221>MISC_FEATURE
<222>(3)..(3)
<223>x=l或i
<220>
<221>MISC_FEATURE
<222>(4)..(4)
<223>x=f,t,或y
<220>
<221>MISC_FEATURE
<222>(7)..(7)
<223>x=l,i,或v
<220>
<221>MISC_FEATURE
<222>(10)..(10)
<223>x=i,v,m,或d
<220>
<221>MISC_FEATURE
<222>(11)..(11)
<223>x=e,d,或r
<220>
<221>MISC_FEATURE
<222>(14)..(14)
<223>x=r或k
<400>94
Ile Ala Xaa Xaa Lys Asp Xaa Pro Asp Xaa Xaa Gly Asp Xaa
1               5                   10
<210>95
<211>23
<212>PRT
<213>人工的
<220>
<223>保守基序
<220>
<221>MISC_FEATURE
<222>(1)..(1)
<223>x=k或r
<220>
<221>MISC_FEATURE
<222>(2)..(2)
<223>x=d,e,q,t,a,k,或s
<220>
<221>MISC_FEATURE
<222>(3)..(3)
<223>x=a,e,s,或t
<220>
<221>MISC_FEATURE
<222>(4)..(4)
<223>x=i或l
<220>
<221>MISC_FEATURE
<222>(5)..(5)
<223>x=s,t,或a
<220>
<221>MISC_FEATURE
<222>(6)..(6)
<223>x=q,g,d,或s
<220>
<221>MISC_FEATURE
<222>(7)..(7)
<223>x=f,y,或c
<220>
<221>MISC_FEATURE
<222>(9)..(9)
<223>x=q,m,或r
<220>
<221>MISC_FEATURE
<222>(10)..(10)
<223>x=f或l
<220>
<221>MISC_FEATURE
<222>(11)..(11)
<223>i,v,或1
<220>
<221>MISC_FEATURE
<222>(13)..(13)
<223>x=n,k,或g
<220>
<221>MISC_FEATURE
<222>(14)..(14)
<223>x=l或i
<220>
<221>MISC_FEATURE
<222>(16)..(16)
<223>x=y或f
<220>
<221>MISC_FEATURE
<222>(17)..(17)
<223>x=a,l,i,或t
<220>
<221>MISC_FEATURE
<222>(19)..(19)
<223>x=y或f
<220>
<221>MISC_FEATURE
<222>(20)..(20)
<223>x=a,i,或l
<220>
<221>MISC_FEATURE
<222>(21)..(21)
<223>x=f,i,l,或m
<220>
<221>MISC_FEATURE
<222>(22)..(22)
<223>x=f,l,i,或y
<220>
<221>MISC_FEATURE
<222>(23)..(23)
<223>x=p或s
<400>95
Xaa Xaa Xaa Xaa Xaa Xaa Xaa Tyr Xaa Xaa Xaa Trp Xaa Xaa Phe Xaa
1               5                   10                  15
Xaa Glu Xaa Xaa Xaa Xaa Xaa
            20

Claims (53)

1.一种基本上纯的核酸分子,其编码选自SEQ ID NO:5、9-11、57-58或90的氨基酸序列。
2.一种包含选自SEQ ID NO:5、9-11、57-58或90的氨基酸序列的基本上纯的多肽分子。
3.一种能够特异结合包含选自SEQ ID NO:5、9-11、57-58或90的氨基酸序列的多肽的抗体。
4.一种包含被导入的核酸分子的转化植物,该核酸分子编码包含选自SEQ ID NO:5、9-11、43-44、57-58或90的氨基酸序列的多肽。
5.权利要求4的转化植物,其中所述植物选自紫苜蓿、拟南芥、大麦、欧洲油菜、芸苔、甘蓝型油菜、嫩茎花椰菜、甘蓝、柑桔、canola、棉花、大蒜、燕麦、葱属、亚麻、观赏植物、花生、胡椒、马铃薯、油菜籽、稻、黑麦、高梁、草莓、甘蔗、甜菜、西红柿、小麦、白杨、松树、冷杉、桉树、苹果树、莴苣、豆科、葡萄、香蕉、茶、草坪草、向日葵、大豆、chickpeas、玉米、菜豆属、海甘蓝、芥菜、蓖麻子、芝麻、棉籽、亚麻子、红花或油棕榈。
6.权利要求4的转化植物,其中所述植物选自甘蓝型油菜、大豆或canola。
7.权利要求4的转化植物,其中所述转化植物包含具有至少相对于缺乏所述导入核酸分子的具有类似遗传背景的植物其总生育酚水平和三烯生育酚水平之一升高的组织。
8.权利要求4的被转化植物,其中所述转化植物产生具有至少相对于缺乏所述导入核酸分子的具有类似遗传背景的植物其总生育酚水平和总三烯生育酚水平之一升高的种子。
9.权利要求4的转化植物,其中所述核酸分子被可操作地连接到启动子上。
10.权利要求9的转化植物,其中所述启动子是种子特异性启动子。
11.权利要求10的转化植物,其中所述启动子选自:napin,7Sα、7Sα′、USP88、增强的USP88、Arcelin 5或Oleosin。
12.一种转化植物,其包括被导入的编码包括选自SEQ ID NO:5、9-11、43-44、57-58或90的氨基酸序列的多肽的第一核酸分子,及其互补体,和被导入的编码选自tyrA、预苯酸脱氢酶、生育酚环化酶、dxs、dxr、GGPPS、HPPD、AANT1、IDI、GGH、GMT、tMT2、MT1、GCPE的酶的第二核酸分子,及其互补体。
13.权利要求12的转化植物,其中所述植物选自紫苜蓿、拟南芥、大麦、欧洲油菜、芸苔、甘蓝型油菜、嫩茎花椰菜、甘蓝、柑桔、canola、棉花、大蒜、燕麦、葱属、亚麻、观赏植物、花生、胡椒、马铃薯、油菜籽、稻、黑麦、高梁、草莓、甘蔗、甜菜、西红柿、小麦、白杨、松树、冷杉、桉树、苹果树、莴苣、豆科、葡萄、香蕉、茶、草坪草、向日葵、大豆、chick peas、玉米、菜豆属、海甘蓝、芥菜、蓖麻子、芝麻、棉籽、亚麻子、红花或油棕榈。
14.权利要求12的转化植物,其中所述植物选自canola、甘蓝型油菜或大豆。
15.权利要求12的转化植物,其中所述转化植物包括具有相对于缺乏所述导入核酸分子的具有类似遗传背景的植物其α-生育酚水平升高的组织。
16.权利要求12的转化植物,其中所述转化植物产生具有至少相对于缺乏所述导入核酸分子的具有类似遗传背景的植物其总生育酚水平和三烯生育酚水平之一升高的种子。
17.权利要求12的转化植物,其中至少所述第一和第二核酸分子之一被可操作地连接到启动子上。
18.权利要求17的转化植物,其中所述启动子是种子特异性启动子。
19.权利要求18的转化植物,其中所述启动子选自:napin,7Sα、7Sα′、USP88、增强的USP88、Arcelin 5或Oleosin。
20.一种转化植物,其包括含导入的启动子区的核酸分子,启动子区在植物细胞中的作用导致mRNA分子生成,其中所述被导入的启动子区被连接到被转录的核酸分子上,该核酸分子具有转录链和非转录链,其中所述转录链与编码多肽的核酸分子互补,该多肽选自SEQ ID NO:5、9-11、43-44、57-58或90,其中所述被转录的核酸分子被连接到3’非翻译序列上,该非翻译序列在植物细胞中的作用导致转录终止和添加聚腺苷酸化核苷酸到mRNA序列的3’末端。
21.权利要求20的转化植物,其中尿黑酸异戊二烯基转移酶的表达相对于缺乏所述导入核酸分子的具有类似遗传背景的植物下降。
22.一种制备种子中总生育酚水平提高的植物的方法,包括(A)用导入的核酸分子转化所述植物,该核酸分子编码包括选自SEQ ID NO:5、9-11、43-44、57-58或90的氨基酸序列的多肽;和(B)培育所述转化的植物。
23.权利要求22的制备植物的方法,其中所述植物选自紫苜蓿、拟南芥、大麦、欧洲油菜、芸苔、甘蓝型油菜、嫩茎花椰菜、甘蓝、柑桔、canola、棉花、大蒜、燕麦、葱属、亚麻、观赏植物、花生、胡椒、马铃薯、油菜籽、稻、黑麦、高梁、草莓、甘蔗、甜菜、西红柿、小麦、白杨、松树、冷杉、桉树、苹果树、莴苣、豆科、葡萄、香蕉、茶、草坪草、向日葵、大豆、玉米、菜豆属、海甘蓝、芥菜、蓖麻子、芝麻、棉籽、亚麻子、红花或油棕榈。
24.权利要求22的方法,其中所述植物选自canola、甘蓝型油菜(oilseedrape)和大豆。
25.权利要求22的方法,其中植物用编码选自tyrA、预苯酸脱氢酶、生育酚环化酶、dxs、dxr、GGPPS、HPPD、AANT1、IDI、GGH、tMT2、GMT、MT1、GCPE的酶,和他们的互补体的导入第二核酸分子转化。
26.一种来自转化植物的种子,其包含被导入的编码包含选自SEQ IDNO:5、9-11、43-44、57-58或90的氨基酸的多肽的核酸分子。
27.权利要求26的种子,其中所述种子至少总生育酚水平和三烯生育酚水平之一相对于来自缺乏所述导入核酸分子的具有类似遗传背景的植物的种子升高。
28.一种来自转化植物的种子,该植物包括编码被导入的包括选自SEQID NO:5、9-11、43-44、57-58或90的氨基酸序列的多肽的导入的第一核酸分子,和被导入的编码选自tyrA、预苯酸脱氢酶、生育酚环化酶、dxs、dxr、GGPPS、HPPD、AANT1、IDI、GGH、tMT2、MT1、GCPE、GMT的酶的第二核酸分子,及其互补体。
29.权利要求28的种子,其中所述种子至少总生育酚水平和三烯生育酚水平之一相对于来自缺乏所述导入核酸分子的具有类似遗传背景的植物的种子升高。
30.一种基本上纯的多肽,其包含选自SEQ ID NO:39-42、46-49或92-95的氨基酸序列,其中所述氨基酸序列不是来自衍生自点型念珠蓝细菌、鱼腥蓝细菌属、集胞蓝细菌属、玉米、大豆、拟南芥、稻、红海束毛蓝细菌、橙色绿屈挠菌、小麦、韭、canola、棉花或西红柿的核酸分子。
31.权利要求30的多肽,其中一种以上的氨基酸序列选自SEQ ID NO:39-42、46-49或92-95。
32.权利要求31的多肽,其中所述氨基酸不是来自衍生自Sulfolobus、Aeropyrum或高粱的核酸。
33.一种基本上纯的核酸分子,其编码包含选自SEQ ID NO:39-42、46-49或92-95的氨基酸序列的多肽,其中所述核酸分子不是来自衍生自点型念珠蓝细菌、鱼腥蓝细菌属、集胞蓝细菌属、玉米、大豆、拟南芥、稻、红海束毛蓝细菌、橙色绿屈挠菌、小麦、韭、canola、棉花或西红柿的核酸分子。
34.权利要求33的核酸分子,其中该多肽包含一种以上选自SEQ IDNO:39-42、46-49或92-95的氨基酸序列。
35.权利要求34的多肽,其中所述核酸分子不是来自衍生自Sulfolobus、Aeropyrum或高粱的核酸。
36.一种用核酸分子转化的植物,该核酸分子编码包含选自SEQ ID NO:39-42、46-49或92-95的氨基酸序列的多肽,其中所述核酸分子不是来自衍生自点型念珠蓝细菌、鱼腥蓝细菌属、集胞蓝细菌属、玉米、大豆、拟南芥、稻、红海束毛蓝细菌、橙色绿屈挠菌、小麦、韭、canola、棉花或西红柿的核酸分子。
37.权利要求36的转化植物,其中所述核酸分子不来自衍生自Sulfolobus、Aeropyrum或高粱的核酸。
38.一种基本上纯的核酸分子,其包含选自SEQ ID NO:31、34-36、59-60或91的核酸序列。
39.一种基本上纯的多肽,其包含选自SEQ ID NO:39-42、46-49或92-95的氨基酸序列,其中所述氨基酸序列不包括任何示于WO00/68393;WO00/63391;WO01/62781或WO02/33060序列表中所示的氨基酸,和不包含本申请的SEQ ID NO:1-11、43-45、57-58、61-62或90。
40.权利要求39的多肽,其中一种以上的氨基酸序列选自SEQ ID NO:39-42、46-49或92-95。
41.一种基本上纯的核酸分子,其编码包含选自SEQ ID NO:39-42、46-49或92-95的氨基酸序列的多肽,其中所述核酸分子不包含任何示于WO00/68393;WO00/63391;WO01/62781或WO02/33060的序列表中的核酸序列,和不包含Genebank登录号为AI897027或AW563431的核酸序列,和不包含本发明的SEQ ID NO:27-36、59-60、88-89和91。
42.权利要求44的核酸分子,其中多肽还包括一种以上选自SEQ IDNO:39-42、46-49或92-95的氨基酸序列。
43.一种用核酸分子转化的植物,该核酸分子编码包含选自SEQ IDNO:39-42、46-49或92-95的氨基酸序列的多肽,其中所述核酸分子不包含任何示于WO00/68393;WO00/63391;WO01/62781或WO02/33060的序列表中的核酸序列,不包含具有Genebank登录号为AI897027或AW563431的核酸序列,和不包含本发明的SEQ ID NO:27-36、59-60、88-89和91。
44.权利要求43的核酸分子,其中该多肽包括一种以上选自SEQ IDNO:39-42、46-49或92-95的氨基酸序列。
45.一种基本上纯的具有尿黑酸异戊二烯基转移酶活性的多肽,其包含选自SEQ ID NO:43-44的氨基酸序列。
46.一种基本上纯的核酸分子,其编码具有尿黑酸异戊二烯基转移酶活性的多肽并包含选自SEQ ID NO:43-44的氨基酸序列。
47.权利要求28的种子,其中被导入的第二核酸是GMT。
48.权利要求47的种子,其中所述种子至少总生育酚水平和总三烯生育酚水平之一相对于具有类似遗传背景但是缺乏所述导入核酸分子的种子升高,并且至少约90%的总生育酚是α-生育酚。
49.权利要求48的基本上纯的核酸分子,其中该核酸分子包含选自SEQ ID NO:88-89的序列。
50.用任何以模式模型示于附图2a-2c、3a-3c、24a-24b、25a-25b、33a-33c、34a-34b、和35a-35b中的比对所鉴定的尿黑酸异戊二烯基转移酶序列,不包括示于WO00/68393;WO00/63391;WO01/62781或WO02/33060的序列表中的氨基酸序列,和不包含本发明的SEQ ID NO:1-11、43-45、57-58、61-62和91。
51.用任何以模式模型示于附图2a-2c、3a-3c、24a-24b、25a-25b、33a-33c、34a-34b、和35a-35b中的比对所鉴定的尿黑酸异戊二烯基转移酶序列,其中所述氨基酸序列不是来自衍生自点型念珠蓝细菌、鱼腥蓝细菌属、集胞蓝细菌属、玉米、大豆、拟南芥、稻、小麦、韭、canola、棉花或西红柿的核酸分子。
52.权利要求50或51的尿黑酸异戊二烯基转移酶,其中基于模式模型是HMM模型。
53.权利要求52的尿黑酸异戊二烯基转移酶,其中基于序列检索方法的模式是采用HMMER包2.2g版本以默认参数产生的HMM模型。
CN03811448.8A 2002-03-19 2003-03-18 尿黑酸异戊二烯基转移酶("hpt")核酸和多肽以及它们的用途 Expired - Lifetime CN1688697B (zh)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US36520202P 2002-03-19 2002-03-19
US60/365,202 2002-03-19
US10/391,363 US7112717B2 (en) 2002-03-19 2003-03-18 Homogentisate prenyl transferase gene (HPT2) from arabidopsis and uses thereof
US10/391,363 2003-03-18
PCT/US2003/008468 WO2003080647A2 (en) 2002-03-19 2003-03-18 Homogentisate prenyl transferase ('hpt') nucleic acids and polypeptides, and uses thereof

Publications (2)

Publication Number Publication Date
CN1688697A true CN1688697A (zh) 2005-10-26
CN1688697B CN1688697B (zh) 2013-04-24

Family

ID=35306330

Family Applications (1)

Application Number Title Priority Date Filing Date
CN03811448.8A Expired - Lifetime CN1688697B (zh) 2002-03-19 2003-03-18 尿黑酸异戊二烯基转移酶("hpt")核酸和多肽以及它们的用途

Country Status (2)

Country Link
CN (1) CN1688697B (zh)
AR (1) AR039007A1 (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101265295B (zh) * 2008-05-13 2010-10-06 中国农业科学院生物技术研究所 生育酚合成相关蛋白及其编码基因与应用
CN101586110B (zh) * 2008-11-27 2011-01-12 上海交通大学 生菜hpt蛋白编码序列
CN110831958A (zh) * 2017-07-24 2020-02-21 奥利通公司 酪氨酸酶反义寡核苷酸
CN113957085A (zh) * 2021-10-13 2022-01-21 浙江理工大学 圆锥铁线莲异戊烯基转移酶pt1基因的应用及其过表达拟南芥株系和构建方法
CN116602208A (zh) * 2023-04-24 2023-08-18 玉林师范学院 一种墨兰根状茎植株再生方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
AU2001253543B2 (en) * 2000-04-14 2005-09-22 Monsanto Company Nucleic acid sequences to proteins involved in tocopherol synthesis

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101265295B (zh) * 2008-05-13 2010-10-06 中国农业科学院生物技术研究所 生育酚合成相关蛋白及其编码基因与应用
CN101586110B (zh) * 2008-11-27 2011-01-12 上海交通大学 生菜hpt蛋白编码序列
CN110831958A (zh) * 2017-07-24 2020-02-21 奥利通公司 酪氨酸酶反义寡核苷酸
CN110831958B (zh) * 2017-07-24 2023-07-04 奥利通公司 酪氨酸酶反义寡核苷酸
CN113957085A (zh) * 2021-10-13 2022-01-21 浙江理工大学 圆锥铁线莲异戊烯基转移酶pt1基因的应用及其过表达拟南芥株系和构建方法
CN113957085B (zh) * 2021-10-13 2024-02-23 浙江理工大学 圆锥铁线莲异戊烯基转移酶pt1基因的应用及其过表达拟南芥株系和构建方法
CN116602208A (zh) * 2023-04-24 2023-08-18 玉林师范学院 一种墨兰根状茎植株再生方法

Also Published As

Publication number Publication date
CN1688697B (zh) 2013-04-24
AR039007A1 (es) 2005-02-02

Similar Documents

Publication Publication Date Title
CN1578835A (zh) 芳族甲基转移酶及其应用
US7605244B2 (en) Gamma tocopherol methyltransferase coding sequence from Brassica and uses thereof
CN1568141A (zh) Tyra基因及其应用
US20070079395A1 (en) Homogentisate prenyl transferase (&#34;HPT&#34;) nucleic acids and polypeptides, and uses thereof
CN1681928A (zh) 生育酚生物合成相关基因及其用途
CN1886042A (zh) 用转基因构建体进行多于一个基因的基因表达的协同减少和增加
AU2002342114A1 (en) Aromatic methyltransferases and uses thereof
CN1810977B (zh) 增强植物和真菌中的2-乙酰基-1-吡咯的合成的核酸
CN1617880A (zh) 植物环丙烷脂肪酸合酶基因、蛋白质及其用途
CN101076587A (zh) 肌醇多磷酸2-激酶基因及其用途
CN1688697A (zh) 尿黑酸异戊二烯基转移酶(“hpt”)核酸和多肽以及它们的用途
AU2003225879C1 (en) Homogentisate prenyl transferase (&#34;HPT&#34;) nucleic acids and polypeptides, and uses thereof
CN1852982A (zh) 用于调节玉米中细胞周期蛋白依赖性激酶抑制剂样多肽的物质和方法
EP1897952A2 (en) Methyltransferasegenes and uses thereof

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CX01 Expiry of patent term
CX01 Expiry of patent term

Granted publication date: 20130424